PT2445928T - Particulas quiméricas semelhantes a virus da gripe compreendendo hemaglutinina - Google Patents

Particulas quiméricas semelhantes a virus da gripe compreendendo hemaglutinina Download PDF

Info

Publication number
PT2445928T
PT2445928T PT107911190T PT10791119T PT2445928T PT 2445928 T PT2445928 T PT 2445928T PT 107911190 T PT107911190 T PT 107911190T PT 10791119 T PT10791119 T PT 10791119T PT 2445928 T PT2445928 T PT 2445928T
Authority
PT
Portugal
Prior art keywords
seq
influenza
chimeric
plant
polypeptide
Prior art date
Application number
PT107911190T
Other languages
English (en)
Inventor
Lavoie Pierre-Olivier
Couture Manon
Dargis Michèle
D'aoust Marc-Andre
Vezina Louis-Philippe
Original Assignee
Medicago Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Medicago Inc filed Critical Medicago Inc
Publication of PT2445928T publication Critical patent/PT2445928T/pt

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/145Orthomyxoviridae, e.g. influenza virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/16Antivirals for RNA viruses for influenza or rhinoviruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5258Virus-like particles
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16111Influenzavirus A, i.e. influenza A virus
    • C12N2760/16122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16111Influenzavirus A, i.e. influenza A virus
    • C12N2760/16123Virus like particles [VLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16111Influenzavirus A, i.e. influenza A virus
    • C12N2760/16134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16211Influenzavirus B, i.e. influenza B virus
    • C12N2760/16222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16211Influenzavirus B, i.e. influenza B virus
    • C12N2760/16223Virus like particles [VLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16211Influenzavirus B, i.e. influenza B virus
    • C12N2760/16234Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Description

DESCRIÇÃO
PARTÍCULAS QUIMÉRICAS SEMELHANTES A VÍRUS DA GRIPE COMPREENDENDO
HEMAGLUTININA
CAMPO DE INVENÇÃO A presente invenção refere-se a partículas semelhantes a vírus. Mais especificamente, a presente invenção refere-se a partículas semelhantes a vírus compreendendo hemaglutinina da gripe quimérica e a métodos de produção de partículas quiméricas semelhantes a vírus da gripe.
ANTECEDENTES DA INVENÇÃO A gripe é a principal causa de morte em humanos devido a um vírus respiratório e, durante a "temporada de gripe", estima-se que 10 a 20% da população mundial possa estar infetada, levando a 250 a 500 mil mortes por ano. 0 método atual de combate à gripe em humanos é por vacinação anual. A vacina é geralmente uma combinação de várias estirpes que se prevê serem as estirpes dominantes para a próxima temporada de gripe, no entanto, o número de doses de vacina produzidas anualmente não é suficiente para vacinar a população mundial. Por exemplo, Canadá e Estados Unidos obtêm doses de vacina suficientes para imunizar cerca de um terço de sua população, e na Europa, apenas cerca de 17% podem ser vacinados, dada a produção atual - em face de uma pandemia mundial de gripe, esta produção seria insuficiente. Mesmo que a produção anual necessária pudesse de alguma forma ser atendida em um determinado ano, as variedades dominantes mudam de ano para ano, portanto, o armazenamento a baixos tempos de necessidade no ano não é prático. A produção económica e em grande escala de uma vacina eficaz contra a gripe é de interesse significativo para o governo e para a indústria privada. A glicoproteína de superfície da hemaglutinina (HA) da gripe é tanto uma proteína de ligação ao recetor como uma de fusão de membrana. É um trímero de subunidades idênticas, cada uma contendo dois polipéptidos ligados por dissulfeto, HAl e HA2, que são derivados por clivagem proteolítica de um precursor, HAO, que tem uma sequência peptídica sinal no seu terminal N e uma sequência âncora da membrana no seu terminal C. A clivagem para formar HAl e HA2 gera o terminal N do polipéptido menor, HA2, que tem a sequência âncora da membrana no seu terminal C. A clivagem é necessária para a atividade de fusão de membrana, mas não para imunogenicidade. A sequência N-terminal de HA2 é chamada de "peptídeo de fusão" porque a clivagem em sequências hidrofóbicas similares é também necessária para a atividade de outras proteínas de fusão de vírus, in vitro.
Geralmente, a superfície da "cabeça" globular compreende várias alças flexíveis com regiões antigénicas bem caracterizadas e variáveis designadas como locais A, B, C, D e E (revisto em Wiley et al., 1987. Annu. Rev Biochem 56: 365-394). Inserção ou substituição de sequências peptídicas curtas em alguns locais (por exemplo, B e E) para estudos de imunidade foram descritas (Garcia-Sastré et al. 1995. Biologicals 23: 171-178). Fator de crescimento epidérmico (EGF), anticorpo de cadeia única (scFV) e o domínio Fc de IgG, variando em tamanho de 53 a 246 aminoácidos, foram inseridos na extremidade N-terminal de um H7 e as quimeras foram expressas com sucesso (Hatziioannou et al., 1999. Human Gene Therapy 10: 1533-1544). Mais recentemente, 90 e 140 domínios de aminoácidos do antígeno protetor de Bacillus anthracis foram fundidos ao terminal amino de um H3 (Li et al., 2005. J. Virol 79: 10003-1002). Copeland (Copeland et al·., 2005. J. Virol 79: 6459-6471) descreve a expressão da glicoproteína de superfície do HIV gpl20 Env numa haste H3, em que o domínio gpl20 substituiu toda a cabeça globular de HA. Vários produtos recombinantes foram desenvolvidos como candidatos vacinais contra a gripe recombinantes. Estas abordagens centraram-se na expressão, produção e purificação de proteínas HA e NA de gripe tipo A, incluindo a expressão destas proteínas utilizando células de inseto infetadas com baculovírus (Crawford et al, 1999 Vaccine 17: 2265-74; Johansson, 1999 Vaccine 17: 2073-80), vetores virais e construções de vacina de ADN (Olsen et al., Vaccine 15: 1149-56, 1997). A produção de uma estirpe de virus da gripe não infeciosa para fins de vacina é uma forma de evitar a infeção inadvertida. Em alternativa, partículas semelhantes a vírus (VLPs) como substitutos do vírus cultivado foram investigadas. As VLPs imitam a estrutura do capsídeo virai, mas não possuem um genoma e, portanto, não podem replicar ou fornecer um meio para uma infeção secundária. As tecnologias atuais de produção de VLP influenciam a coexpressão de múltiplas proteínas virais, e essa dependência representa uma desvantagem dessas tecnologias, já que no caso de uma epidemia pandémica e anual, o tempo de resposta é crucial para a vacinação. Um sistema de produção de VLP mais simples, por exemplo, aquele que se baseia na expressão de apenas uma ou algumas proteínas virais sem requerer a expressão de proteínas virais não estruturais é desejável para acelerar o desenvolvimento de vacinas. Vírus envelopados podem obter seu envelope lipídico quando 'brotando' para fora da célula infetada e obter a membrana da membrana plasmática, ou a de um organelo interno. Em sistemas celulares de mamíferos ou baculovírus, por exemplo, brotos de gripe da membrana plasmática (Quan et al 2007 J. Virol 81: 3514-3524). Apenas alguns vírus envelopados são conhecidos por infetar plantas (por exemplo, membros dos Tospovirus e Rhabdoviruses). Dos vírus envelopados em plantas conhecidos, são caracterizados por brotamento das membranas internas da célula hospedeira, e não da membrana plasmática. Embora tenha sido produzido um pequeno número de VLPs recombinantes em hospedeiros vegetais, nenhum foi derivado da membrana plasmática, levantando a questão de se as VLPs derivadas da membrana plasmática, incluindo as VLPs da gripe, podem ser produzidas nas plantas. A formação de VLPs, em qualquer sistema, coloca demandas consideráveis na estrutura das proteínas - alterar trechos curtos de sequência que correspondem a alças de superfície selecionadas de uma estrutura globular pode não ter muito efeito na expressão do próprio polipeptídeo, no entanto estudos estruturais faltam demonstrar o efeito de tais alterações na formação de VLPs. A cooperação das várias regiões e estruturas de HA (por exemplo, as sequências de âncora de membrana, as regiões de caule ou tronco do trímero que separa a cabeça globular das membranas) evoluiu com o vírus e pode não ser passível de alterações similares sem perda de Integridade do trímero de HA e formação de VLP. A produção de VLPs HA de gripe foi previamente descrita pelos inventores em WO 2009/009876.
SUMÁRIO DA INVENÇÃO A presente invenção refere-se a partículas semelhantes a vírus. Mais especificamente, a presente invenção refere-se a partículas semelhantes a vírus compreendendo hemaglutinina de gripe quimérica e a métodos de produção de partículas semelhantes a vírus de hemaglutinina da gripe quiméricas. É um objetivo da invenção proporcionar uma partícula semelhante a vírus da gripe quimérica (VLP) melhorada. A presente invenção proporciona um polipéptido que pode ser expresso num hospedeiro vegetal, compreendendo um HA de gripe quimérico compreendendo um domínio do domínio da haste (SDC), um domínio do domínio principal (HDC) e um domínio do domínio transmembranar (TDC) em que: o SDC compreende um Subdomínio F'l, F'2 e F; o HDC compreende um subdomínio RB, El e E2; o TDC compreende um subdomínio TmD e Ctail; em que o subdomínio RB é de um primeiro polipéptido HA de fripe e os subdomínios SDC e EI e E2 são de um segundo polipéptido HA de gripe e, em que o primeiro polipéptido HA de gripe é de gripe Hl ou H5 e o segundo polipéptido HA de gripe é Gripe HI ou H5, e o segundo polipeptídeo de gripe HA é derivado de uma estirpe de gripe diferente do primeiro polipeptídeo de gripe HA. Além disso, o polipéptido pode compreender um péptido sinal. A presente invenção também proporciona um ácido nucleico que codifica o polipéptido compreendendo uma HA de gripe quimérica compreendendo um agregado de domínio de haste (SDC), um agregado de domínio de cabeça (HDC) e um agregado de domínio transmembranar (TDC) em que: a SDC compreende um F'l, Subdomínio F'2 e F; o HDC compreende um subdomínio RB, El e E2; o TDC compreende um subdomínio TmD e Ctail; em que o subdomínio RB é de um primeiro polipéptido HA de gripe e os subdomínios SDC e EI e E2 são de um segundo polipéptido HA de gripe e, em que o primeiro polipéptido HA de gripe é de gripe HI ou H5 e o segundo polipéptido HA de gripe é Gripe HI ou H5, e o segundo polipeptídeo de gripe HA é derivado de uma estirpe de gripe diferente do primeiro polipeptídeo de gripe HA. 0 ácido nucleico pode também codificar o polipéptido que compreende um péptido sinal como definido na reivindicação 2 em adição à SDC, HDC e TDC.
Também proporcionado um modo para produzir partículas semelhantes a vírus da gripe quiméricas (VLPs) numa planta, compreendendo o modo: a) introdução de um ácido nucleico que codifica um HA da gripe quimérico compreendendo um peptídeo de sinal, um cluster de domínio de tronco (SDC), um cluster de domínio de cabeça (HDC) e um cluster de domínio transmembrana (TDC) em que: o SDC compreende um F'l, F Subdomínio 2 e F; o HDC compreende um subdomínio RB, El e E2; o TDC compreende um subdomínio TmD e Ctail; em que o subdomínio RB é de um primeiro polipéptido HA de gripe e os subdomínios SDC e EI e E2 são de um segundo polipéptido HA de gripe e, em que o primeiro polipéptido HA de gripe é de gripe HI ou H5 e o segundo polipéptido HA de gripe é o gripe Hl ou H5, e o segundo polipéptido de HA de gripe é derivado de uma estirpe de gripe diferente do primeiro polipéptido de HA de gripe, na planta, ou porção deste, e b) incubar a planta, ou sua porção, sob condições que permitam a expressão do ácido nucleico, produzindo assim as VLPs. A presente invenção inclui o método descrito acima em que no passo de introdução (passo a), o ácido nucleico é introduzido na planta de um modo transitório. Alternativamente, no passo de introdução (passo a), o ácido nucleico é introduzido na planta e é integrado de forma estável. 0 método pode ainda compreender um passo de: c) colher o hospedeiro e purificar as VLPs. A presente invenção proporciona uma planta, ou porção da mesma, compreendendo uma HA de gripe quimérica, ou uma sequência de nucleótidos que codifica a gripe HA quimérica, a HA de gripe quimérica compreendendo um domínio de domínio tronco (SDC), um domínio de domínio principal (HDC) e uma membrana transmembranar. cluster de domínio (TDC) em que: o SDC compreende um subdominio F'l, F'2 e F; o HDC compreende um subdominio RB, El e E2; o TDC compreende um subdominio TmD e Ctail;em que o subdominio RB é de um primeiro polipéptido HA de gripe e os subdomínios SDC e EI e E2 são de um segundo polipéptido HA de gripe e, em que o primeiro polipéptido HA de gripe é de gripe HI ou H5 e o segundo polipéptido HA de gripe é o gripe Hl ou H5, e o segundo polipéptido de HA de gripe é derivado de uma estirpe de gripe diferente do que o primeiro polipéptido de HA de gripe. A planta, ou porção desta, pode ainda compreender um ácido nucleico compreendendo uma sequência nucleotídica codificando uma ou mais de uma proteína acompanhante operativamente ligada a uma região reguladora ativa numa planta. A uma ou mais de uma proteína de acompanhante pode ser selecionada do grupo compreendendo Hsp40 e Hsp70. A presente invenção refere-se a uma partícula semelhante a vírus (VLP) compreendendo uma HA de gripe quimérica, a HA de gripe quimérica compreendendo um domínio de domínio tronco (SDC), um domínio de domínio principal (HDC) e um domínio de domínio transmembranar (TDC) em que: compreende um subdominio F'l, F'2 e F; o HDC compreende um subdominio RB, El e E2; o TDC compreende um subdominio TmD e Ctail; em que o subdominio RB é de um primeiro polipéptido HA de gripe e os subdomínios SDC e EI e E2 sâo de um segundo polipéptido HA de gripe e, em que o primeiro polipéptido HA de gripe é de gripe HI ou H5 e o segundo polipéptido HA de gripe é Gripe HI ou H5, e o segundo polipeptídeo de gripe HA é derivado de uma estirpe de gripe diferente do primeiro polipeptideo de gripe HA. A VLP pode ainda compreender N-glicanos específicos de plantas, ou N-glicanos modificados.
Uma composição compreendendo uma dose eficaz da VLP como acabado de descrever e um transportador farmaceuticamente aceitável também é proporcionada.
Num aspeto alternativo da presente invenção é proporcionado um método para induzir imunidade a uma infeção por vírus da gripe num indivíduo, compreendendo a administração da VLP ao sujeito. A VLP pode ser administrada a um indivíduo por via oral, intradérmica, intranasal, intramuscular, intraperitoneal, intravenosa ou subcutânea.
As regiões reguladoras que podem ser operativamente ligadas a uma sequência que codifica uma proteína HA quimérica incluem aquelas que são operativas numa célula vegetal, numa célula de inseto ou numa célula de levedura. Tais regiões reguladoras podem incluir uma região reguladora de plastocianina, uma região reguladora de Ribulose 1,5-bisfosfato carboxilase/oxigenase (RuBisCO), proteína de ligao clorofina a/b (CAB) ou ST-LS 1. Outras regiões reguladoras incluem um 5'UTR, 3'UTR ou sequências de terminação. A região reguladora da plastocianina pode ser uma região reguladora da plastocianina de alfafa; as sequências 5'UTR, 3’UTR ou terminator também podem ser sequências de alfafa. A presente divulgação proporciona um polipeptídeo HA de gripe quimérico compreendendo uma primeira gripe e uma segunda gripe, a primeira gripe e a segunda gripe podem ser independentemente selecionadas do grupo compreendendo Hl e H5 ; com a condição de que a primeira gripe e a segunda gripe não sejam do mesmo tipo de gripe, subtipo ou da mesma origem.
De acordo com alguns aspetos da divulgação, o polipéptido HA de gripe quimérico compreende uma sequência peptidica de sinal, a sequência peptidica sinal pode ser selecionada do grupo compreendendo uma sequência peptidica sinal nativa, uma sequência peptidica sinal de PDI de alfafa, uma sequência peptidica sinal H5 de gripe e uma sequência peptidica de sinal Hl da gripe A presente divulgação proporciona um modo para produzir uma VLP contendo hemaglutinina de gripe quimérica (HA) num hospedeiro capaz de produzir uma VLP, incluindo uma planta, inseto ou levedura compreendendo a introdução de um ácido nucleico que codifica uma gripe HA quimérica compreendendo um domínio de domínio (SDC), um cluster de domínio de cabeça (HDC) e um aglomerado de domínios transmembrana (TDC) em que: o SDC compreende um subdomínio F'l, F'2 e F; o HDC compreende um subdomínio RB, El e E2; o TDC compreende um subdomínio TmD e Ctail;em que o subdomínio RB é de um primeiro polipéptido HA de gripe e os subdomlnios SDC e EI e E2 são de um segundo polipéptido HA de gripe e, em que o primeiro polipéptido HA de gripe é de gripe Hl ou H5 e o segundo polipéptido HA de gripe é o influenza HI ou H5, e o segundo polipéptido HA de gripe é derivado de uma estirpe de gripe diferente do primeiro polipéptido HA de gripe , no hospedeiro e incubação do hospedeiro sob condições que permitem a expressão do ácido nucleico, produzindo assim as VLPs. A produção de VLPs em plantas apresenta várias vantagens sobre a produção dessas partículas na cultura de células de insetos. Os lípidos vegetais podem estimular células imunitárias específicas e aumentar a resposta imunitária induzida. As membranas vegetais são feitas de lipídios, fosfatidilcolina (PC) e fosfatidiletanolamina (PE), e também contêm glicoesfingolipídeos que são únicos para as plantas e algumas bactérias e protozoários. Os esfingolípidos são invulgares porque não são ésteres de glicerol como PC ou PE, mas consistem de um amino álcool de cadeia longa que forma uma ligação amida a uma cadeia de ácido gordo contendo mais de 18 carbonos. PC e PE, bem como glicoesfingolipídeos podem se ligar a moléculas CDl expressas por células imunes de mamíferos, tais como células apresentadoras de antígenos (APCs), como células dendríticas e macrófagos e outras células, incluindo linfócitos B e T no timo e fígado. Além disso, para além do potencial efeito adjuvante da presença de lipidos vegetais, a capacidade dos N-glicanos vegetais para facilitar a captura de antigénios de glicoproteína por células apresentadoras de antigénio, pode ser vantajosa da produção de VLPs quiméricas em plantas. Sem querer estar limitado pela teoria, prevê-se que as VLPs quiméricas produzam uma reação imune mais forte do que as VLPs quiméricas produzidas em outros sistemas de fabricação e que a reação imune induzida por essas VLPs quiméricas é mais forte quando comparada à imunológica reação induzida por vacinas vivas inteiras ou atenuadas.
Contrariamente às vacinas feitas de vírus completos, as VLP quiméricas proporcionam a vantagem, uma vez que não são infeciosas, pelo que a contenção biológica restritiva não é um problema tão significativo como seria trabalhar com um vírus infecioso completo e não é necessário para produção. As VLPs quiméricas de plantas proporcionam uma vantagem adicional novamente permitindo que o sistema de expressão seja cultivado em uma estufa ou campo, sendo assim significativamente mais económico e adequado para o aumento de escala.
Adicionalmente, as plantas não compreendem as enzimas envolvidas na sintetização e adição de resíduos de ácido siálico às proteínas. As VLPs podem ser produzidas na ausência de neuraminidase (NA), e não há necessidade de co-expressar NA, ou tratar as células produtoras ou extrair com sialidase (neuraminidase), para garantir a produção de VLP nas plantas.
BREVE DESCRIÇÃO DOS DESENHOS
Estas e outras características da invenção tornar-se-ão mais evidentes a partir da seguinte descrição, na qual é feita referência aos desenhos anexos, em que: A Figura IA mostra um diagrama esquemático dos subdominios de HA. SP: péptido sinal, F'l, F'2 e F: subdominios de fusão; RB: subdominio de ligação ao recetor, El e E2: subdominios de esterase, DTM/CT: subdominios da cauda transmembrana e citoplasmática. A Figura 1B mostra representações esquemáticas de cassetes de expressão à base de plastocianina (números de construção: 774, 540, 660, 690, 691, 696) para a expressão de hemaglutinina HI A/ Brisbane/59/2007 (Hl/Bri), hemaglutinina Hl A/Nova Caledónia/20/99 (Hl/NC) e hemaglutinina H5 A/Indonésia/5/05 (H5/Indo) em formas nativas e quiméricas. Plasto pro: promotor de plastocianina de alfafa, Plasto ter: terminador de plastocianina de alfafa, SP: peptídeo sinal, RB: subdominio de ligação a recetor, E1-RB-E2: subdominios de esterase e de ligação a recetor, TMD/CT: subdominios de cauda transmembrana e citoplasmática: dissulfeto isomerase de proteína de alfafa. A Figura 2 mostra a sequência de aminoácidos dos subdominios indicados de HA quimérico expresso com painel superior, construções 690, 734 (SEQ ID NO: 11), 696 (SEQ ID NO: 112) e painel inferior, 691 (SEQ ID NO: 113. Os aminoácidos 1-92 da SEQ ID NO: 111 é o domínio F'l + EI do H5/Indo; os aminoácidos 93-2 63 são um domínio da cabeça do RB de Hl/ Brisbane e os aminoácidos 2 64-552 são um E2 + Domínio F'2 de H5/Indo. Aminoácidos 1-92 da SEQ ID NO: 112 é o domínio F'l + EI de H5/NC, aminoácidos 93-301 é um domínio de cabeça RB de H5/Indo e amino os ácidos 302-586 são um domínio E2 + F'2 de Hl/NC os aminoácidos 1-42 da SEQ ID NO: 113 são o domínio F'l de H5/Indo; os aminoácidos 43-273 são um El-RB- 0 domínio de cabeça E2 de Hl/Brisbane e os aminoácidos 274-552 é um domínio F'2 de H5/Indo. A Figura 3 mostra a sequência de aminoácidos da região codificadora das construções 690 e 734 (SEQ ID NO: 80) compreendendo um subdominio RB de Hl/Bri, um péptido sinal H5/Indo e um domínio complexo de tronco (SDC) compreendendo subdominios H5/Indo F'l, El, E2, F'2 e F. A Figura 4 mostra a sequência de aminoácidos da região de codificação da construção 691 (SEQ ID NO: 81) compreendendo o complexo do domínio da cabeça Hl/Bri (HDC) que contém El, RB, E2, um péptido sinal H5/Indo e H5/Indo Complexo do domínio tronco (SDC) compreendendo subdomínios H5/Indo F’l, F’2 e F. A Figura 5 mostra a sequência de aminoácidos da região de codificação da construção 696 (SEQ ID NO: 82) compreendendo um subdomínio RB de H5/Indo, um péptido de sinalização PDI e complexo de domínio de haste Hl/NC compreendendo F’l, El, E2 e F'2. A Figura 6 mostra uma análise de imunotransferência da expressão de Hl/Bri na forma nativa, construção 774 (compreendendo Hl/Bri), construção 692 (compreendendo o complexo de domínio de cabeça (HDC) de Hl/Bri) e construção 690 (compreendendo o subgrupo RB domínio de Hl/Bri fundido com o complexo H5/Indo do domínio de tronco (SDC) em plantas. Para cada construção, foram analisados extratos proteicos totais de 3 plantas separadas. Vinte microgramas de proteína foram carregados para cada planta analisada. Anticorpos monoclonais anti-HA (anti-Hl-Brisbane; FII 10-150) A construção 774 expressa Hl/Bri com o péptido de sinal nativo de Hl/Bri: as construções 690, 691 expressam o HA com o péptido de sinal nativo de H5/Indo. A Figura 7 mostra uma análise de imunotransferência da expressão de H5/Indo na forma nativa, construção 660 (compreendendo H5/Indo, ou construção 696 (compreendendo subdomínio Hl/Indo RB fundido com subdomínios Hl/NC SDC, El e E2), foram analisados extratos proteicos totais de 3 plantas separadas, 20 microgramas de proteínas foram carregados para cada planta analisada e o Western blot foi revelado com anticorpos policlonais anti-H5 da Indonésia (ITC IT-003-005V). A construção 660 expressa H5/Indo como seu péptido sinal nativo, a construção 696 expressa o HA quimérico com um péptido sinal de PDI. A Figura 8 mostra uma representação esquemática de cassetes de expressão baseadas em 35SCPMV/HT para a expressão de Hl/ Bri nas formas nativa (construção 732) e quimérica (construções 733 e 734) . Construção 733, compreendendo o péptido de sinal PDI e complexo HDC, SDC e domínio transmembranar (TDC) de Hl/Bri, e construção 734 compreendendo um péptido de sinal H5/Indo, F'l, El, E2, F'2, F, e um RB de Hl/Bri. Promotor 35S pro: CaMV 35S, NOSter: terminador da nopalina sintase, SP: peptídeo sinal, RB: subdomínio de ligação ao recetor, E1-RB-E2: subdomínios de esterase e de ligação ao recetor, TMD/CT: subdomínios da cauda transmembrana e citoplasmática, PDI: dissulfeto isomerase de proteína de alfafa; CPMV-HT: elementos 5' e 3' do sistema de expressão do vírus hipercritível do mosaico do caupi. A Figura 9 mostra a anise de imunotransfercia da expressão de Hl/Bri na forma nativa, construção 732 (compreendendo Hl/ Bri sob o controlo da cassete de expressão baseada em 35SCPMV/HT), construção 733 (compreendendo um péptido de sinal PDI fundido com Hl/Bri; sob o controlo da cassete de expressão com base em 35SCPMV/HT), ou construção 734 compreendendo um subdomínio Hl/Bri RB fundido com um subdomínio H5/Indo SDC, El e E2; sob o controlo da cassete de expressão com base em 35SCPMV/HT). Para cada construção, foram analisados extratos proteicos totais de 3 plantas separadas. Cinco microgramas de proteína foram carregados para cada planta analisada. 0 Western blot foi revelado com anticorpos monoclonais anti-HA (FII 10-150). A Figura 10 mostra a representação esquemática de cassetes de expressão baseadas em 35SCPMV/HT para a expressão de hemaglutininas H3A/Brisbane / 10/2007 HA (H3/Bri) e B/ Flórida/4/2006 HA (B/Flo). A construção 736 compreende H3/ Bri fundido a um péptido sinal da PDI. A construção 737 compreende o H3/Bri fundido com um péptido sinal PDI e um H5/Indo TMD/CT. A construção 739 compreende B/Flo fundida a um péptido sinal PDI. A construção 745 compreende o B/Flo fundido com um péptido sinal PDI e um H5/Indo TMD/ CT. Promotor 35S pro: CaMV 35S, NOSter: terminador da nopalina sintase, SP: peptídeo sinal, RB: subdomínio de ligação ao recetor, E1-RB-E2: subdomínios de esterase e de ligação ao recetor, TMD/CT: subdomínios da cauda transmembrana e citoplasmática, PDI: dissulfeto isomerase de proteína de alfafa; CPMV-HT: elementos 5 'e 3' do sistema de expressão do vírus hipercritível do mosaico do caupi. A Figura 11 mostra a borda de fusão nas construções número 745 e 737. A origem da sequência de HA é indicada por setas com ponta de bala. Os aminoácidos do dominio transmembrana são QILSIYSTVA e são precedidos por aminoácidos que fazem parte do ectodominio. A Figura 12 mostra a sequência de aminoácidos da hemaglutinina H5/H3 quimérica (SEQ ID NO: 83; estrutura 737) compreendendo um peptideo sinal PDI, um ectodominio de H3 A/ Brisbane/10/2007 e um TMD/CT de H5 A/Indonésia/5/2005. A Figura 13 mostra a sequência de aminoácidos da hemaglutinina H5/B quimérica (SEQ ID NO: 84) compreendendo um ectodominio de B/Florida/4/2006 e uma DTM/CT de H5 A/ Indonésia/5/2005 codificada por o quadro de leitura aberto no número de construção 745. A Figura 14 mostra a análise de imunotransferência da expressão de B/Flo na forma nativa, a construção 739 (compreendendo PDI-B/Flo), ou com a construção 745 (compreendendo B/Flo HDC e SDC fundida com um H5/Indo TDC). Para cada construção, foram analisados extratos proteicos totais de 3 plantas separadas. Vinte microgramas de proteína foram carregados para cada planta analisada. 0 Western blot foi revelado com anticorpos policlonais anti-HA B/Florida (NIBSC 07/356). A Figura 15 mostra a análise de imunotransferência da expressão de H3/Bri na forma nativa, construção 736 (compreendendo PDI sp-H3/Bri) ou com a construção 737 (H3/ Bri HDC e SCD fundidos com um H5/Indo TDC). Para cada construção, foram analisados extratos proteicos totais de 3 plantas separadas. Vinte microgramas de proteína foram carregados para cada planta analisada. O Western blot foi revelado com anticorpos policlonais anti-H3 Brisbane (NIBSC 08/124) . A Figura 16 mostra a cromatografia por exclusão de tamanho de extratos proteicos de folhas de plantas infiltradas com o número de construção 745. O teor relativo de proteína das frações de eluição é apresentado para cada fração. A imunodeteção (Western Blot) de hemaglutinina utilizando anticorpos policlonais anti-HAB/Florida (NIBSC 07/356) nas frações 7 a 15 é apresentada sob o gráfico. 0 pico de eluição do Dextrano Azul 2000 é indicado pela seta (fração 8). A Figura 17 mostra a sequência de ácido nucleico (SEQ ID NO: 52) do fragmento sintetizado compreendendo a região codificante H5 completa (A/Indonésia/5/05 (H5N1)) (incluindo o péptido sinal e o codão stop) flanqueada, em 5' por um sitio HindIII e, em 3', por um sitio Saci. A Figura 18 mostra a sequência de ácido nucleico (SEQ ID NO: 53) da construção 660, uma cassete de expressão HA compreendendo um promotor de plastocianina de alfafa e 5'UTR, sequência de codificação de hemaglutinina de H5 forma A/ Indonésia/5/05 (H5N1), alfafa plastocianina 3'UTR e sequências terminadoras. A Figura 19 mostra a sequência de ácido nucleico (SEQ ID NO: 54) da sequência codificadora de Hl do tipo selvagem (A/ New Caledonia/20/99 (HlNl) (GenBank AY289929) sem TmD e Ctail. A Figura 20 mostra a sequência de ácido nucleico (SEQ ID NO: 55) de um fragmento sintetizado compreendendo Hl (A/Nova Caledónia/20/99 (HlNl) sequência codificante sem TmD e Ctail. Na região 5', os últimos nucleótidos são originários de PDI SP e incluem um sítio de restrição BglII e em 3', um local duplo Saci/StuI é encontrado imediatamente a jusante do codão de terminação. A Figura 21 mostra a sequência de ácido nucleico (SEQ ID NO: 56) do fragmento sintetizado compreendendo a sequência de codificação C-ter Hl (A/Nova Caledónia/20/99 (HlNl) incluindo o TmD e Ctail do local Kpnl até ao codão de terminação (flanqueado em 3'por um local duplo Saci/StuI). A Figura 22 mostra a sequência de nucleótidos para ARNm de Medicago sativa para dissulfureto isomerase de proteína. GenBank Z11499 (SEQ ID NO: 57). Os nucleótidos 32-103 codificam o péptido sinal da PDI. A Figura 23 mostra a sequência de nucleótidos para o plasmideo PromPlasto-PDISP-Plasto 3'UTR. A Figura 23A mostra a sequência de nucleótidos para PromPlasto-PDISP (SEQ ID NO: 58). A Figura 23B mostra a sequência nucleotidica de Plasto 3'UTR (SEQ ID NO: 85). 0 péptido sinal da isomerase de dissulfureto de proteína (PDI) está sublinhado. Os locais de restrição BglII (AGATCT) e Saci (GAGCTC) utilizados para clonagem são mostrados em negrito. A Figura 24 mostra a sequência de ácido nucleico (SEQ ID NO: 59; construção 540) da cassete de expressão HA compreendendo promotor de plastocianina de alfafa e 5'UTR, sequência codificadora do péptido sinal da PDI e da forma Hl A/New Caledonia/20/99 (H1N1), plastocianina de alfafa 3'UTR e sequências de terminação. Hl da sequência de codificação A/ Nova Caledónia/20/1999 está sublinhada. A Figura 25 mostra a sequência de ácido nucleico (SEQ ID NO: 60) do fragmento sintetizado compreendendo a região codificante Hl completa (A/Brisbane/59/07 (HlNl)) (incluindo o péptido de sinal e o codão stop) flanqueada, em 5'por sequências de genes de plastocianina de alfafa correspondentes aos primeiros 84 nucleótidos a montante do ATG inicial, começando com um local Drain e, em 3', por um local Saci. A Figura 26 mostra a sequência de ácido nucleico (SEQ ID NO: 61; construção 774) da cassete de expressão HA compreendendo promotor de plastocianina de alfafa e 5'UTR, sequência de codificação de hemaglutinina de Hl forma A/Brisbane/59/07 (HlNl), alfafa, plastocianina 3'UTR e sequências terminadoras. A Figura 27 mostra a sequência de ácido nucleico da cassete de expressão número 828 (SEQ ID NO: 62) , de Pad (a montante do promotor) a Asei (imediatamente a jusante do terminador NOS). negrito. Local de restrição Apal sublinhado e itálico. A Figura 28 mostra a sequência de ácido nucleico (SEQ ID NO: 63; construção 690) de uma cassete de expressão quimérica H5/H1 compreendendo promotor de plastocianina de alfafa e 5'UTR, sequência de codificação de hemaglutinina quimérica, plastocianina de alfafa 3' UTR e sequências de terminação. A sequência de codificação de HA quimérica está sublinhada. A Figura 2 9 mostra a sequência de ácido nucleico (SEQ ID NO: 64; construção 691) de uma cassete de expressão quimérica H5/H1 compreendendo promotor de plastocianina de alfafa e 5'UTR, sequência de codificação de hemaglutinina quimérica, plastocianina de alfafa 3' UTR e sequências de terminação. A sequência de codificação de HA quimérica está sublinhada. A Figura 30 mostra a sequência de ácido nucleico (SEQ ID NO: 65; construção 696) de uma cassete de expressão H1/H5 quimérica compreendendo promotor de plastocianina de alfafa e 5'UTR, sequência de codificação de hemaglutinina quimérica, UTR de plastocianina de alfafa e sequências terminadoras. A sequência de codificação de HA quimérica está sublinhada. A Figura 31 mostra a sequência de ácido nucleico (SEQ ID NO: 66; construção 732) da cassete de expressão HA compreendendo o promotor CaMV 35S, CPMV-HT 5'UTR, sequência de codificação da hemaglutinina de Hl forma A/Brisbane/59/07 (H1N1), CPMV-HT 3'UTR e sequências de terminação NOS. A sequência de codificação de Hl/Bri está sublinhada. A Figura 32 mostra a sequência de ácido nucleico (SEQ ID NO: 67) da sequência de codificação, de ATG para parar, do número de construção intermédio 787. A Figura 33 mostra a sequência de ácido nucleico (SEQ ID NO: 68; construção 733) da cassete de expressão SpPDI Hl/Bri compreendendo o promotor 35M de CaMV, CPMV-HT 5'UTR, sequência codificadora do péptido de sinal da PDI, sequência de codificação de hemaglutinina de sequências A/Brisbane/ 59/07 (H1N1), CPMV-HT 3'UTR e terminação NOS. A sequência de codificação do SpPDI Hl/Bri está sublinhada. A Figura 34 mostra a sequência de ácido nucleico (SEQ ID NO: 69; construção 734) de uma cassete de expressão quimérica H5/H1 compreendendo o promotor CaMV 35S, CPMV-HT 5'UTR, sequência de codificação de hemaglutinina quimérica, CPMV-HT 3' UTR e sequências do terminador NOS. A sequência de codificação do HA quimérico está sublinhada. A Figura 35 mostra a sequência de ácido nucleico (SEQ ID NO: 70) do fragmento sintetizado compreendendo a região codificante H3 completa (A/Brisbane/10/07 (H3N2)) (incluindo o péptido de sinal e o codão stop) flanqueada, em 5'por sequências de genes de plastocianina de alfafa correspondentes aos primeiros 84 nucleótidos a montante do ATG inicial, começando com um local Drain e, em 3', por um local Saci. A Figura 36 mostra a sequência de ácido nucleico (SEQ ID NO: 71; construção 736) da cassete de expressão HA compreendendo o promotor 35M de CaMV, CPMV-HT 5 'UTR, sequência codificadora do péptido sinal da PDI, sequência de codificação de hemaglutinina H3 forma A/Brisbane/10/07 (H2N3), CPMV-HT 3'UTR e sequências de terminação NOS. A sequência de codificação de Sp PDI H3/Bris está sublinhada. A Figura 37 mostra a sequência de ácido nucleico (SEQ ID NO: 72; construção 737) de uma cassete de expressão quimérica H5/H3 compreendendo o promotor 35M de CaMV, CPMV-HT 5'UTR, sequência de codificação de hemaglutinina quimérica, CPMV-HT3'. Sequências terminator UTR e NOS. A sequência de codificação do HA quimérico está sublinhada. A Figura 38 mostra a sequência de ácido nucleico (SEQ ID NO: 73) do fragmento sintetizado compreendendo a região codificante completa de HA (B/Florida/4/06) (incluindo o péptido de sinal e o codão stop) flanqueada, em 5'por alfafa, sequências do gene da plastocianina correspondentes aos primeiros 84 nucleótidos a montante do ATG inicial, começando com um local Drain e, em 3', por um sitio Saci. A Figura 39 mostra a sequência de ácido nucleico (SEQ ID NO: 74; construção 739) da cassete de expressão HA compreendendo o promotor CaMV 35S, CPMV-HT 5'UTR, sequência codificadora do péptido sinal da PDI, sequência de codificação da hemaglutinina de HA forma B/Florida/4/06, CPMV-HT 3'UTR e sequências terminadoras NOS. A sequência de codificação de Sp PDI B/Flo está sublinhada. A Figura 40 mostra a sequência de ácido nucleico (SEQ ID NO: 75; construção 745) de uma cassete de expressão quimérica H5/B compreendendo o promotor CaMV 35S, CPMV-HT 5'UTR, sequência de codificação de hemaglutinina quimérica, CPMV-HT 3' UTR e sequências do terminador NOS. A sequência de codificação do HA quimérico está sublinhada. A Figura 41 mostra a sequência de ácido nucleico que codifica Msjl (SEQ ID NO: 76). A Figura 42 mostra a sequência de ácido nucleico (SEQ ID NO: 77) de uma porção do número de construção R850, de HindIII (no local de clonagem múltipla, a montante do promotor) para EcoRI (imediatamente a jusante do terminador NOS). A sequência de codificação da HSP40 está sublinhada. A Figura 43 mostra a sequência de ácido nucleico (SEQ ID NO: 78) de uma porção do número de construção R860, de HindIII (no local de clonagem múltipla, a montante do promotor) para EcoRI (imediatamente a jusante do terminador NOS). A sequência de codificação da HSP70 está sublinhada. A Figura 44 mostra a sequência de ácido nucleico (SEQ ID NO: 79) de uma porção do número de construção R870, de HindIII (no local de clonagem múltipla, 5 a montante do promotor) para EcoRI (imediatamente a jusante do terminador NOS). A sequência de codificação da HSP40 está em sublinhado em itálico e a sequência de codificação da HSP70 está sublinhada. A) nucleótidos 1-4946; B) nucleótidos 4947-9493. A figura 45 mostra uma representação esquemática do número de construção R472. A Figura 46 mostra o padrão da ponte dissulfureto do tipo A da gripe. 1) Cys4HAl-Cys 137HA2, 2) Cys60HAl-Cys72HAl, 3) Cys94HAl-Cysl43HAl, 4) Cys292HAl-Cys318HAl 5) Cysl44HA2-Cysl48HA2 e 6) Cys52HAl-Cys277HAl. As pontes dissulfureto que diferem entre os subtipos A e B (Figura 47) são indicadas por setas. A numeração da proteína H3 madura foi usada. A Figura 47 mostra o padrão da ponte dissulfureto do tipo HA da gripe. Numeração de ponte: 1) Cys4HAl-Cysl37HA2, 2) Cys60HAl-Cys72HAl, 3) Cys94HAl-Cys 143HA1, 4) Cys292HAl-Cys318HAl 5) Cysl44HA2-Cysl48HA2, 6) Cys52HAl-Cys277HAl, 7) Cys54HAl-Cys57HAl e 8) Cysl78HAl-Cys272HAl As pontes dissulfureto que diferem entre os subtipos A (Figura 46) e B são indicadas por setas. A numeração da proteína H3 madura foi usada. A Figura 48 mostra um diagrama esquemático de junções de fusão de troca de domínio. A Figura 4BA mostra a fusão do subdomínio RB de Hl/Bri, H3/Bri e B/Flo com H5/Indo SDC, e o subdomínio RB de H5/Indo com o domínio de tronco Hl/NC. A Figura 48B mostra a fusão dos subdomínios E1-RB-E2 (HDC) de Hl/Bri, H3/Bri ou B/Flo com H5/Indo SDC, e de H5/Indo HDC sem Hl/NC SDC. A Figura 49A mostra a sequência nucleotídica SEQ ID NO: 86) de Hl A/Califórnia/04/09. A sequência de codificação do péptido de sinal da isomerase de dissulfureto de proteína de alfafa é sublinhada e a sequência de codificação de Hl madura é destacada a negrito. A Figura 4 9B mostra a sequência de aminoácidos (SEQ ID NO: 87) do Hl A / Califórnia / 04/09. 0 péptido sinal isomerase de dissulfureto de proteína de alfafa está sublinhado. A Figura 50 mostra uma análise de imunotransferência da expressão de hemaglutinina H5/B quimérica (número de construção 747; compreendendo B/Flo HDC e SDC fundido com um H5/Indo TDC) após infiltração de AGLl/747 não diluido, co-infiltrado com AGLl/443 (vetor vazio) e co-infiltrado com AGL1/R870 (HSP40/HSP70). Para cada construção, foram analisados extratos proteicos totais de 3 plantas separadas. Vinte microgramas de proteínas foram carregados para cada planta analisada. O Western blot foi revelado com anticorpos policlonais anti-B Florida (NIBSC). A Figura 51A mostra a sequência nucleotídica para a sequência promotora 2X35S (SEQ ID NO: 88). A Figura 51B mostra a sequência de nucleótidos para a construção 747 (SEQ ID NO: 93) de Pad (promotor 35S a montante) para Asei (terminador NOS imediatamente a jusante). A sequência de codificação do HA quimérico está sublinhada. A sequência do promotor 2X35S é indicada em itálico.
DESCRIÇÃO DETALHADA A presente invenção refere-se a partículas semelhantes a vírus. Mais especificamente, a presente invenção refere-se a partículas semelhantes a vírus compreendendo hemaglutinina da gripe quimérica e a métodos de produção de partículas quiméricas semelhantes a vírus da gripe. A descrição que se segue é de uma forma de realização preferida. A presente invenção proporciona um ácido nucleico compreendendo uma sequência nucleotídica que codifica uma hemaglutinina da gripe quimérica (HA) operativamente ligada a uma região reguladora ativa numa planta.
Além disso, a presente invenção fornece um método de produção de partículas semelhantes a vírus (VLPs) em uma planta. 0 método envolve a introdução de um ácido nucleico que codifica um HA gripe quimérico operativamente ligado a uma região reguladora ativa na planta, na planta, ou porção da planta, e incubando a planta ou uma porção da planta sob condições que permitam a expressão de o ácido nucleico, produzindo assim as VLPs. A presente invenção proporciona ainda uma VLP compreendendo uma gripe HA quimérica. A VLP pode ser produzida pelo método como proporcionado pela presente invenção.
Por "proteina quimérica" ou "polipéptido quimérico" entende-se uma proteína ou polipéptido que compreende sequências de aminoácidos de duas ou mais do que duas fontes, por exemplo, mas não limitadas a dois ou mais tipos ou subtipos de gripe, ou gripe de umas diferentes origens, que são fundidas como um único polipeptídeo. A proteína ou polipéptido quimérico pode incluir um péptido sinal que é o mesmo, ou heterólogo, com o restante do polipéptido ou proteína. A proteína quimérica ou polipéptido quimérico pode ser produzida como um transcrito de uma sequência nucleotídica quimérica, e a proteína quimérica ou polipéptido quimérico clivado após a síntese e, como requerido, associado para formar uma proteína multimérica. Assim sendo, uma proteína quimérica ou um polipí^tido quimí^ico tambí^ inclui uma proteica ou polipéptido compreendendo subunidades que estão associadas através de pontes de dissulfureto (isto é, uma proteína multimérica). Por exemplo, um polipéptido quimérico compreendendo sequências de aminoácidos de duas ou mais do que duas fontes podem ser processadas em subunidades, e as subunidades associadas via pontes de dissulfureto para produzir uma proteína quimérica ou polipéptido quimérico (ver Figuras 46 e 47). 0 polipéptido pode ser hemaglutinina (HA), e cada uma das duas ou mais do que duas sequências de aminoácidos que formam o polipéptido podem ser obtidas a partir de HA diferentes para produzir um HA quimérico, ou HA gripe quimérico. Um HA quimérico também pode incluir uma sequência de aminoácidos compreendendo péptido de sinal heterólogo (uma proteína quimérica de HA) que clivado após ou durante a sínttese proteica. Preferencialmente, o polipéptido quimérico, ou o HA de gripe quimérico não ocorre naturalmente. Um ácido nucleico que codifica um polipéptido quimérico pode ser descrito como um "ácido nucleico quimérico", ou uma "sequência nucleotídica quimérica". Uma partícula semelhante a vírus compreendida por HA quimérico pode ser descrita como uma "VLP quimérica". A HA de gripe quimérica de acordo com várias formas de realização da presente invenção pode compreender um complexo de domínio de tronco (SDC) um complexo de domínio de cabeça (HDC) e um complexo de domínio bruusmemfe^ , -|ijgcçi|;;ιde :um adbdt^iiidi:'í|e'; 'IPS* HSÍlÍits......: TDC é de um primeiro tipo de HA de gripe, subtipo ou de uma origem, e um ou maís de um subdomínio de SDC, HDC ou TDC é de um segundo tipo de KA de gripe, subtipo ou de uma segunda origem ou diferente. Como aqui descrito, o "SDC” compreende uri subdomínio F'l, F'2 e F, o "HDC" compreende um subdomínio RB, El e E2, o "TDC" compreende um subdomínio ti® é: cdlllll||Il|ll|lll||l|| -Μ:· O termo "partícula semelhante a um vírus" (VLP) ou "partículas semelhantes a vírus" ou VLPs refere-se a estruturas que se automontam e compreendem proteínas estruturais, tais como proteína HA de gripe ou proteína HA de gripe quimérica. VLPs e VLPs quiméricas são geralmente morfológicas e antigenicamente semelhantes aos viriões produzidos em uma infeção. mas faltam informações genéticas suficientes para replicar e, portanto, não-infeciosas. As VLPs e as VLPs quiméricas podem ser produzidas em células hospedeiras adequadas, incluindo células hospedeiras vegetais. Após a extração da célula hospedeira e após isolamento e purificação adicional sob condições adequadas, as VLP e as VLPs quiméricas podem ser purificadas como estruturas intactas. VLPs quiméricas, ou VLPs, produzidas a partir de proteínas derivadas de gripe, de acordo com a presente invenção, não compreendem proteína Ml. Sabe-se que a proteína Ml se liga ao ARN (Wakefield e Brownlee, 1989} que é um contaminante da preparação de VLP. A presença de ARN índesejado quando se obtém a aprovação reguladora para o produto VLP quimérico, pelo que uma preparação de VLP quimérica sem ARM pode ser vantajosa.
As VLPs quiméricas da presente invenção podem ser produzidas numa célula hospedeira que é caracterizada por não possuir a capacidade de sialilar proteínas, por exemplo, uma célula vegetal. Ver, por exemplo, Gupta et al., 1999. Nucleic Acids Research 27:370-372; Toukach et al.. 2007 . Nucleic Acids :;Késèátéíi 35:D280-D286; Nakahara et al., 2008. Nucleic Acids Research 3 6:D368-D371. As VLPs quiméricas produzidas como aqui descrito não eompreendem tipicamente; neuraminidase (NA). No entanto, a NA pode ser co-expressa com HA se as VLPs compreendendo HA e NA forem desejadas:;),; A invenção também proporciona VLP eompreêndendo HA quimérico que obtêm um envelope: lipidico da membrana plasmática da célula na qual a HA quimérica é expressa. Por exemplo:, se o HA quimérico é expresso num sistema à base de plantas, a VLP resultante pode obter um envelope lipidico a partir da membrana plasmática da célula vegetal.
Geralmente, o termo "lipido" refere-se a moléculas naturalmente solúveis em gordura {lipofiiieasl. Uma VLP quimérica produzida numa planta de acorde com alguns aspetos da invenção pode sor complexada com lidos derivados de plantas. Os lípidos derivados de plantas podem estar na forma de uma bicamada lipídíca e podem ainda compreender um envelope envolvendo a VLP. Os lipidos derivados de plantas podem compreender componentes lipidicos da membrana plasmática da planta onde é produzida a VLP, incluindo fosfolipidos, tri-, di- e monoglicéridos, bem como esteroi solúvel em gordura ou metabolrtos compreendendo ésféráis. Exemplos incluem fosfatidilcolina (PC), fosfatidiletandlámihá |iE), fosfatidilinositoX, fòSfatidilserina, giicoesfingolipideos, fitoéstéréis: ou uma combinação destes. Um lipido derivado de plantas pode alternativamente ser referido como um "lipido vegetal:".:· Exemplos de f itoesteróis incluem: campestero 1, estigmastecai;,: ergosterol, brass iea sterol, del ta—7 - e s ti gmast er o 1, delta-7-avenasterol, daunosterol, sitosterol, 24-metilcolesterol, colesterol ou beta-sitosterol - ver, por exemplo, ||qngpund: ef al., 2004. Como um perito na arte entenderia, a composição lipidica da membrana pllSItiática de uma. célula pode variar com as condições de cultura ou crescimento da célula ou organismo, ou espécie,: -M partir dás quais W célula é obtida. Geralmente, o beta-sitosterol é o fifcéstéroi mais abundante. a composição lipidica da membrana plásíftStXPS de uma célula pode variar com a cultura ou condições de crescimento da célula ou organismo, ou espécie, a partir das quais a célula é obtida. Geralmente, o beta-sitosterol é o fitoesterol mais abundante, a composição lipidica da membrana plasmática de uma célula pode variar com a cultura ou condições de crescimento da célula ou organismo, ou espécie, a partir das quais a célula é obtida. Geralmente, o beta-sitosterol é o fitoesterol mais abundante.
As membranas celulares compreendem geralmente bicamadas lipídicas, bem como proteínas para várias funções. Concentrações localizadas de lipídios particulares podem ser encontradas na bicamada lipidica, conhecida como 'lipid rafts’. Estes microdomínios de jangada lipidica podem ser enriquecidos em esfingolipídeos e esteróis. Sem querer estar limitado pela teoria, jangadas lipídicas podem ter papéis significantes em endo e exocitose, entrada ou saída de vírus ou outros agentes infeciosos, transdução de sinal intercelular, interação com outros componentes estruturais da célula ou organismo, tais como intracelular e matrizes extracelulares. A divulgação inclui VLPs compreendendo HA quimérico, dos quais os subdomínios podem ser obtidos de qualquer tipo, subtipo de vírus gripe que pode infetar humanos, incluindo, por exemplo, tipos ou subtipos Hl e H5. Exemplos não limitantes de tipos ou subtipos Hl ou H5 incluem o subtipo A/Nova Caledónia/20/99 (HlNl) ("Hl/NC"; SEQ ID NO: 56), o subtipo Hl A/Califórnia 04/09 (HlNl). ("Hl/Cal"; SEQ ID NO: 86), e o subtipo A/Indonésia/5/05 (H5N1) ("H5/Indo"), bem como A/Brisbane/59/2007 ("Hl/Bri"). Além disso, o HA quimérico pode compreender um ou mais subdomínios de uma hemaglutinina que é isolada de um ou mais vírus da gripe emergentes ou recentemente identificados. A presente divulgação também diz respeito a virus gripe que infetam outros mamíferos ou animais hospedeiros, por exemplo humanos, primatas, cavalos, porcos, aves, aves aquosas aviárias, aves migratórias, codornízes, patos, gansos, aves, galinhas, camelos, caninos, outros felinos, gatos, tigres, leopardos, civetas, martas, martas de pedra, furões, animais domésticos, gado, ratinhos, ratos, focas, baleias e similares. Alguns virus da gripe podem infetar mais de um animal hospedeiro.
Com referência ao vírus da gripe, o termo "hemaglutinina" ou "HA", tal como aqui utilizado, refere-se a uma glicoproteína estrutural de partículas virais da gripe. A estrutura da hemaglutinina da gripe é bem estudada e demonstra um alto grau de conservação na estrutura secundária, terciária e quaternária. Esta conservação estrutural é observada mesmo que a sequência de aminoácidos possa variar (ver, por exemplo, Skehel e Wiley, 2000 Ann Rev Biochem 69: 531-69; Vaccaro et al 2005; que é aqui incorporado por referência) . As sequências de nucleótidos que codificam para HA são bem conhecidas e estão disponíveis, por exemplo, na Base de Dados de BioDefesa e Saúde Pública (por exemplo, em URL: biohealthbase.org/GSearch/home.do?decorator=Influenza) ou nas bases de dados mantidas pelo National Center for Biotechnology Information (NCBI; por exemplo, na URL: ncbi.nlm.nih. gov/sites/entrez?db=nuccore&cmd=search&term=influenza), ambas aqui incorporadas por referência. O monómero de HA pode ser subdividido em três domínios funcionais -um domínio tronco, ou domínio do domínio tronco (SDC) , um domínio da cabeça globular ou domínio do domínio principal (HDC) e um domínio do domínio transmembranar (TDC). A SDC compreende quatro subdomínios, um péptido de fusão F, F'l e F'2 (este subdomínio pode ser geralmente referido como uma 'espinha dorsal')· O CDT compreende dois subdomínios, a transmembrana (TmD) e uma cauda terminal C (CT). O HDC compreende três subdomínios, domínios esterase vestigial El ' e E2 e um domínio de ligação ao recetor RB. A SDC e a HDC podem ser coletivamente referidas como 'ectodomínio' . Uma publicação de Ha et al. 2002 (EMBO J. 21: 865-875; que é aqui incorporado por referência) ilustra a orientação relativa dos vários subdomínios da SDC e HDC em vários subtipos de gripe, com base em estruturas cristalográficas de raios X. Um diagrama esquemático dos subdomínios relativos aos terminais N e C dos polipéptidos HA1 e HA2 é mostrado na Figura IA. Um alinhamento estrutural anotado de vários subtipos de gripe é fornecido na Figura 1C. A variação de aminoácidos é tolerada em hemaglutininas do virus gripe. Essa variação fornece novas estirpes continuamente identificadas. A infectividade entre as novas estirpes pode variar. Contudo, a formação de trímeros de hemaglutinina, que subsequentemente formam VLPs é mantida. A presente invenção, por conseguinte, proporciona uma sequência de aminoácidos de hemaglutinina compreendendo HA quimérico ou um ácido nucleico que codifica uma sequência de aminoácidos de hemaglutinina quimérica, que forma VLPs numa planta e inclui sequências conhecidas e sequências de HA variantes que podem desenvolver-se. A presente invenção também se refere à utilização de um polipéptido de HA quimérico compreendendo um TDC, SDC e HDC. Por exemplo, a proteína quimérica HA pode ser HAO, ou um HA quimérico clivado compreendendo subdomínios de HA1 e HA2 de dois ou mais tipos de gripe. 0 HAO pode ser expresso e dobrado para formar um trímero, que pode posteriormente ser montado em VLPs. A clivagem de HAO produz polipéptidos HAl e HA2 ligados por uma ponte dissulfureto (ver Figuras 1C, 46 e 47 para ilustração dos padrões da ponte dissulfureto). Para uma partícula de vírus infeciosa, é necessária a clivagem do precursor HAO para desencadear a alteração conformacional de HA2 que liberta o péptido de fusão (no terminal N do polipéptido HA2) e disponibilizá-lo para a fusão das membranas celular e viral. No entanto, as VLPs não são infeciosas e a clivagem do HA em HAl e HA2 não é necessária, por exemplo, para a produção de vacinas. 0 precursor HAO não-clivado também se reúne em trímeros e brota a partir da membrana plasmática para formar nanopartícuias de VLP. 0 polipéptido HAO compreende vários domínios. 0 subdomínio RB do HDC compreende vários laços em regiões antigénicas designadas como sítio AE. Anticorpos que podem neutralizar o vírus da gripe infeciosa são frequentemente direcionados para um ou mais desses locais. Os subdomínios da esterase vestigial (El e E2) podem ter um papel na fusão e podem se ligar ao Ca ++. Os domínios F, F'l e F'2 interagem e cooperam para formar uma haste, elevando a cabeça do trimero HA acima da membrana. Um TmD e CT podem estar envolvidos na ancoragem do HA dobrado a uma membrana. 0 TmD pode ter um papel na afinidade do HA para jangadas lipidicas, enquanto o CT pode ter um papel na secreção de HA, enquanto alguns dos resíduos de cisteína encontrados no subdomínio do CT podem ser palmitoilados. Um péptido sinal (SP) também pode ser encontrado no terminal N do polipéptido HAO. A Figura 2 e as Tabelas 4 e 5 fornecem exemplos das sequências de aminoácidos dos domínios SP, F'l, F'2, El, RB, E2 e F de alguns subtipos do vírus da gripe. 0 processamento de uma sequência de péptido sinal N-terminal (SP) durante a expressão e/ou secreção de hemaglutininas de gripe pode ter um papel no enrolamento do HA. 0 termo "péptido sinal" refere-se geralmente a uma sequência curta (cerca de 5-30 aminoácidos) de aminoácidos, encontrada geralmente no terminal N de um polipéptido de hemaglutinina que pode dirigir a translocação do polipéptido recentemente traduzido para um organelo particular, ou auxiliar no posicionamento de domínios específicos da cadeia polipeptídica em relação a outros. O péptido sinal das hemaglutininas visa a translocação da proteína para o retículo endoplasmático e foi proposto para ajudar no posicionamento do domínio proximal do terminal N em relação a um domínio âncora da membrana do polipéptido hemaglutinina nascente para ajudar na clivagem e dobragem do hemaglutinina madura. A inserção de HA dentro da membrana do retículo endoplasmático (ER) da célula hospedeira, a clivagem do peptídeo sinal e a glicosilação da proteína são eventos co-translacionais. O correto enrolamento de HA requer glicosilação da proteína e formação de, pelo menos, 6 ligações dissulfureto intra-cadeia (ver Figuras 46 e 47) . Na Figura 46, o HA do subtipo A mostra ter 6 pontes dissulfureto conservadas por monómero. Por comparação, o monômero de B HA (Figura 47) tem sete pontes dissulfeto, e cinco dessas pontes dissulfeto têm uma contraparte em A (revisado em Skehel e Wiley, 2000. Ann Rev
Biochem. 69: 531-569; exemplos de estruturas ilustrando pontes dissulfureto intra e intermoleculares e outros aminoácidos conservados e suas posições relativas são descritos, por exemplo, em Gamblin et al 2004, Science 303: 1838-1842; ambos os quais são aqui incorporados por referência). Como um perito na arte perceberia, é importante assegurar que um arranjo semelhante de pontes dissulfureto seja obtido quando se preparam HAs quiméricos.
Um péptido de sinal pode ser nativo para a hemaglutinina, ou um péptido de sinal pode ser heterólogo em relação de sequência primária da hemaglutinina a ser expressa. Um HA quimérico pode compreender um péptido de sinal de um primeiro tipo, subtipo ou estirpe de gripe com o equilíbrio do HA de um ou mais do que um tipo, subtipo ou estirpe de gripe diferente. Por exemplo, as SP nativas dos subtipos HA Hl, H2, H3, H5, H6, H7, H9 ou gripe tipo B podem ser utilizadas para expressar o HA num sistema vegetal. Em algumas formas de realização da invenção, o SP pode ser de um tipo de gripe B, Hl, H3 ou H5; ou do subtipo Hl/Bri, Hl/NC, H5/Indo, H3/ Bri ou B/Flo.
Um SP pode também ser não nativo, por exemplo, de uma proteína estrutural ou hemaglutinina de um vírus que não seja a gripe, ou de um polipéptido vegetal, animal ou bacteriano. Um exemplo não limitativo de um péptido de sinal que pode ser utilizado é o da isomerase de dissulfureto de proteína de alfafa (PDI SP; nucleótidos 32-103 do número de acesso Z11499; SEQ ID NO: 34; Figura 17) possuindo a sequência de aminoácidos: MAKNVAIFGLLFSLLLLVPSQIFAEE (nucleótidos 32-103; SEQ ID NO: 34) A presente invenção proporciona, por conseguinte, uma hemaglutinina de gripe quimérica compreendendo um péptido de sinal nativo, ou não nativo, e ácidos nucleicos que codificam tais hemaglutininas quiméricas. O correto dobramento das hemaglutininas pode ser importante para a estabilidade da proteína, formação de multimeros, formação de VLPs e função do AH (capacidade de hemaglutinato), entre outras caracteristicas das hemaglutininas da gripe. 0 dobramento de uma proteína pode ser influenciado por um ou mais fatores, incluindo, mas não limitado a sequência da proteína, a abundância relativa da proteína, o grau de aglomeração intracelular, a disponibilidade de cofatores que podem se ligar ou ser transitoriamente associados com a proteína dobrada, parcialmente dobrada ou desdobrada, a presença de uma ou mais proteínas acompanhantes ou semelhantes.
As proteínas de choque térmico (Hsp) ou proteínas de stress são exemplos de proteínas acompanhantes, que podem participar em vários processos celulares, incluindo síntese de proteínas, tração intracelular, prevenção de dobragem incorreta, prevenção da agregação de proteínas, montagem e desmontagem de complexos proteicos, dobragem de proteínas e proteína de desagregação. Exemplos de tais proteínas chaperonas incluem, mas não se limitam a, Hsp60, Hsp65, Hsp70, Hsp90, HsplOO, Hsp20-30, HsplO, Hspl00-200, HsplOO, Hsp90, Lon, TF55, FKBPs, ciclofilinas, ClpP, GrpE, ubiquitina, calnexina e isomerases de dissulfureto de protea (ver, por exemplo, Macario, AJL, Cold Spring Harbor Laboratory Res. 25: 59-70, 1995; Parsell, DA e Lindquist, S. Ann. Rev. Genet. 27: 437-496 (1993); Patente US 5232833). Como aqui descrito, as proteínas acompanhantes, por exemplo, mas não limitadas a Hsp40 e Hsp70 podem ser utilizadas para assegurar a dobragem de um HA quimérico.
Exemplos de Hsp70 incluem Hsp72 e Hsc73 de células de mamífero, ADNK de bactérias, particularmente micobactérias tais como Mycobacterium leprae, Mycobacterium tuberculosis e Mycobacterium bovis (tais como Bacille-Calmette Guerin: aqui referidas como Hsp71). ADNK de Escherichia coli, levedura e outros procariontes, e BiP e Grp78 de eucariotas, como A. thaliana (Lin et al. 2001 (Cell Stress and Chaperones 6: 201-208). Urn exemplo particular de uma Hsp70 é a A. thaliana Hsp70 (codificada pelo Genbank ref: AY120747.1). A Hsp70 é capaz de ligar especificamente ATP, bem como polipéptidos e péptidos desdobrados, participando assim no enrolamento e desdobramento de proteínas, bem como na montagem e desmontagem de complexos proteicos.
Exemplos de Hsp40 incluem ADNJ de procariontes como E. coli e micobactérias e HSJ1, HDJ1 e Hsp40 de eucariotas, como a alfafa (Frugis et al., 1999. Plant Molecular Biology 40: 397-408). Um exemplo particular de uma Hsp40 é M. sativa MsJl (AJ000995.1 ou SEQ ID NO: 76). A Hsp40 desempenha um papel como chaperona molecular no dobramento de proteínas, termotolerância e replicação de ADN, entre outras atividades celulares. A Figura 41 mostra a sequência de ácido nucleico que codifica Msj 1 (SEQ ID NO: 76).
Entre as Hsp, a Hsp70 e sua co-chaperona, Hsp40, estão envolvidas na estabilização de polipeptídeos tradutores e recém-sintetizados antes que a síntese esteja completa. Sem querer estar limitado pela teoria, a Hsp40 liga-se às manchas hidrofóbicas de polipéptidos desdobrados (nascentes ou recentemente transferidos), facilitando assim a interação do complexo Hsp70-ATP com o polipéptido. A hidrólise de ATP leva à formação de um complexo estável entre o polipeptídeo, Hsp70 e ADP, e a liberação de Hsp40. A associação do complexo Hsp70-ADP com os fragmentos hidrofóbicos do polipeptídeo impede sua interação com outros fragmentos hidrofóbicos, impedindo o enrolamento incorreto e a formação de agregados com outras proteínas (revisado em Hartl, FU. 1996. Nature 381: 571-579).
Proteínas chaperonas nativas podem ser capazes de facilitar o dobramento correto de baixos níveis de proteína recombinante, mas à medida que os níveis de expressão aumentam, a abundância de chaperonas nativas pode se tornar um fator limitante. Altos níveis de expressão de hemaglutinina nas folhas agroinfiltradas podem levar ao acúmulo de polipeptídeos de hemaglutinina no citosol, e a coexpressão de uma ou mais de uma proteína chaperona, como Hsp70, Hsp40 ou ambas Hsp70 e Hsp40, pode reduzir o nível de desdobramento ou polipii^tidos de hemaglutinina agregados e aumentar o número de polipéptidos que exibem características estruturais terciárias e quaternárias que permitem a hemaglutinação e/ou formação de partículas semelhantes a vírus. SEQ ID NO: 77 é lama sequência de ácido nucleico de uma porção do número de construção R850, de HindIII (no local de clonagem múltipla, a montante do promotor) para EcoRI (imediatamente a jusante do terminador NOS), codificando HSP40 (sublinhado). SEQ ID NO: 78 é uma sequência de ácido nucleico de uma porção do número de construção R860, de HindIII (no local de clonagem múltipla, a montante do promotor) para EcoRI (imediatamente a jusante do terminador NOS) , codificando HSP70 (sublinhado) . SEQ ID NO: 79 é uma sequência de ácido nucleico de uma porção do número de construção R870, de HindIII (no local de clonagem múltipla, 5 a montante do promotor) para EcoRI (imediatamente a jusante do terminador NOS) que codifica HSP40 (sublinhado itálico) e HSP70 (sublinhado). a montante do promotor) para EcoRI (imediatamente a jusante do terminador NOS), codificando HSP70 (sublinhado) . SEQ ID NO: 79 é uma sequência de ácido nucleico de uma porção do número de construção R870, de HindIII (no local de clonagem múltipla, 5 a montante do promotor) para EcoRI (imediatamente a jusante do terminador NOS) que codifica HSP40 (sublinhado itálico) e HSP70 (sublinhado). a montante do promotor) para EcoRI (imediatamente a jusante do terminador NOS), codificando HSP70 (sublinhado). SEQ ID NO: 79 é uma sequência de ácido nucleico de uma porção do número de construção R870, de HindIII (no local de clonagem múltipla, 5 a montante do promotor) para EcoRI (imediatamente a jusante do terminador NOS) que codifica HSP40 (sublinhado itálico) e HSP70 (sublinhado).
Por conseguinte, a presente invenção também proporciona um método para produzir VLPs de gripe quiméricas numa planta, em que um primeiro ácido nucleico codificando um HA de gripe quimérico é co-expresso com um segundo ácido nucleico que codifica um acompanhante. 0 primeiro e segundo ácidos nucleicos podem ser introduzidos na planta no mesmo passo, ou podem ser introduzidos na planta sequencialmente.
As VLPs podem ser avaliadas quanto a estrutura e tamanho, por exemplo, por ensaio de hemaglutinação, microscopia eletrónica ou por cromatografia por exclusão de tamanho.
Para cromatografia por exclusão de tamanho, as proteínas solúveis totais podem ser extraídas do tecido vegetal por homogeneização (Polytron) da amostra de material vegetal triturado congelado em tampão de extração e o material insolúvel removido por centrifugação. Precipitação com PEG também pode ser benéfica. A proteína solúvel é quantificada e o extrato passa através de uma coluna Sephacryl™. 0 Blue Dextrano 2000 pode ser usado como padrão de calibração. Após cromatografia, as frações podem ser analisadas adicionalmente por imunotransferência para determinar o complemento de proteína da fração. A presente invenção também proporciona uma planta compreendendo um ácido nucleico que codifica uma ou mais de uma hemaglutinina da gripe quimérica e um ácido nucleico que codifica uma ou mais de uma das chaperonas. A presente divulgação inclui sequências nucleotidicas: SEQ ID NO: 63 (construção 690; uma cassete de expressão H5/ Hl quimérica compreendendo promotor de plastocianina de alfafa e 5'UTR, sequência de codificação de hemaglutinina quimérica, 3' UTR e sequências terminadoras de plastocianina de alfafa) e a porção sublinhada de SEQ ID NO: 63 codificando SP, F'l, EI de H5/Indo-RB de Hl/Bri-E2, F'2, F, TMD/CT de H5/Indo; SEQ ID NO: 64 (construção 691; uma cassete de expressão quimérica H5/H1 compreendendo promotor de plastocianina de alfafa e 5'UTR, sequência de codificação de hemaglutinina quimérica, UTR de plastocianina de alfafa 3' e sequências de terminador) e a poro sublinhada de SEQ ID NO: 64, codificando SP, F'l, de H5/Indo-El, RB.E2 de Hl/Bri-F’2, F, TMD/CT de H5/Indo; SEQ ID NO: 65 (construção 696; tuna cassete de expressão quimérica H1/H5 compreendendo promotor de plastocianina de alfafa e 5'UTR, sequência de codificação de hemaglutinina quimérica, sequências 3' UTR e terminadora de plastocianina de alfafa) e a poro sublinhada de SEQ ID NO: 65 codificando PDI SP-F'l, El de Hl/NC-RB de H5/lndo-E2, F'2, F, TMD/CT de Hl/NC; SEQ ID NO: 68 (construção 733; a cassete de expressão SpPDI Hl/Bri compreendendo o promotor CaMV 35S, CPMV-HT 5'UTR, sequência codificadora do péptido de sinal da PDI, sequência codificadora da hemaglutinina da forma Hl A/Brisbane/59/07 (HlNl), CPMV-HT 3'UTR e sequências de terminação NOS), e a porção sublinhada de SEQ ID NO: 68, codificando PDI SP-F'l, El, RB, E2, F’2, F, TMD/CT de Hl/BRI; SEQ ID NO: 69 (construção 734; uma cassete de expressão quimérica H5/H1 compreendendo o promotor CaMV 35S, CPMV-HT 5'UTR, sequência codificadora de hemaglutinina quimérica, CPMV-HT 3' UTR e sequências terminadoras NOS). A sequência de codificação de HA quimérico está sublinhada, codificando o mesmo HA quimérico como SEQ ID NO: 63; SEQ ID NO: 71 (construção 736; uma cassete de expressão de HA compreendendo o promotor 35M de CaMV, CPMV-HT 5 'UTR, sequência codificadora do péptido de sinal de PDI, sequência codificadora de hemaglutinina de H3 forma A/Brisbane/10/07 (H2N3), as sequências terminadoras UTR e NOS CPMV-HT), e a porção sublinhada de SEQ ID NO: 71 codificando PDI SP-F'1, El, RB, E2, F’2, F, TMD/CT de H3/Bri; SEQ ID NO: 72 (construção 737; uma cassete de expressão quimérica H5/H3 compreendendo o promotor CaMV 35S, CPMV-HT 5'UTR, sequência de codificação da hemaglutinina quimérica, CPMV-HT 3' UTR e sequências de terminador NOS) e o poro sublinhada da SEQ ID NO: 72 que codifica PDI SP-F'1, El, RB, E2, F'2, F, TMD/CT de H5/Indo; SEQ ID NO: 74 (construção 739; uma cassete de expressão HA compreendendo o promotor CaMV 35S, CPMV-HT 5 'UTR, sequência codificadora do péptido de sinal da PDI, sequência codificadora da hemaglutinina da forma HA B/Florida/4/06, CPMV-HT sequências terminadoras 3'UTR e NOS) e a porção sublinhada da SEQ ID NO: 74 codificando PDI SP-F’l, El, RB, E2, F'2, F, TMD/CT de B/Flo; SEQ ID NO: 75 (construção 734; uma cassete de expressão quimérica H5/B compreendendo o promotor CaMV 35S, CPMV-HT 5'UTR, sequência de codificação hemaglutinina quimérica, CPMV-HT 3' UTR e sequências terminadoras NOS) e o poro sublinhada de SEQ ID NO: 75 que codifica PDI SP-F'1, El, RB, E2, F’2, F de B/Flo-TND/CT de H5/Indo. A presente divulgação também inclui uma sequência nucleotidica que hibrida sob condições de hibridação rigorosas com as pores sublinhadas de qualquer uma das SEQ ID NOs: 63-65, 68, 69 e 71-75. A presente divulgação também inclui uma sequência de nucleótidos que hibrida sob condições de hibridação rigorosas com um complemento das pores sublinhadas de qualquer uma das SEQ ID Nos: 63-65, 68, 69 e 71-75. Estas sequências nucleotídicas que hibridam com as pores sublinhadas de SEQ ID NOs: 63-65, 68, 69 e 71-75, ou um complemento das pores sublinhadas de SEQ ID NOs: 63-65, 68, 69 e 71- 75, codificam uma proteína hemaglutinina quimérica que, quando expressa forma uma VLP quimérica, e a VLP quimérica induz a produção de um anticorpo quando administrada a um indivíduo. Por exemplo, a expressão da sequência nucleotidica dentro de uma célula vegetal forma uma VLP quimérica, e a VLP quimérica pode ser utilizada para produzir um anticorpo que capaz de se ligar a HA, incluindo HA maduro, HAO, HAl ou HA2 de um ou mais tipos ou subtipos de gripe. A VLP quimérica, quando administrada a um sujeito, induz uma resposta imunitária. A hibridação sob condições de hibridação rigorosas conhecida na técnica (ver por exemplo Current Protocols in Molecular Biology, Ausubel et ai., Eds. 1995 e suplementos; Maniatis et al., Em Molecular Cloning (A Laboratory Manual), Cold Spring Harbor Laboratory, 1982; Sambrook e Russell, em Molecular Cloning: A Laboratory Manual, 3a edição, 2001; cada um dos quais é aqui incorporado por referência). Um exemplo de uma dessas condições de hibridação rigorosas pode ser cerca de 16-20 horas de hibridação em 4 X SSC a 65, seguido por lavagem em 0,1 X SSC a 65 durante uma hora, ou 2 lavagens em 0,1 X SSC a 65? C por 20 ou 30 minutos. Em alternativa, uma condição exemplar de hibridação rigorosa pode ser durante a noite (16-20 horas) em formamida a 50%, 4X SSC a 42°C, seguida por lavagem em 0,1 X SSC a 65°C durante uma hora, ou 2 lavagens em 0,1 X SSC a 65°C cada tampão fosfato aquoso para 20 ou 30 minutos, ou durante a noite (16-20 horas), ou hibridação in Church (7% de SDS; 0,5 M NaPOi tampão pH 7,2; EDTA a 10 mM) a 65° C, com 2 lavagens a 50 em 0,1 X SSC, 0,1% de SDS durante 20 ou 30 minutos cada, ou 2 lavagens a 65 em 2 X SSC, 0,1% de SDS durante 20 ou 30 minutos cada.
Adicionalmente, a presente divulgação inclui sequências nucleotídicas que são caracterizadas como tendo cerca de 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% ou qualquer quantidade entre elas, identidade de sequência, ou semelhança de sequência, com a sequência nucleotidica que codifica HA quimérica de acordo com as porções sublinhadas de qualquer uma de SEQ ID N°: 63 SEQ ID N°: 64, SEQ ID N°: 65, SEQ ID N°: 68, SEQ ID N°: 69, SEQ ID NO: 71, em que a sequência nucleotidica codifica uma proteína de hemaglutinina que quando expressa forma uma VLP quimérica e que a VLP quimérica induz a produção de um anticorpo. Por exemplo, a expressão da sequência nucleotidica numa célula vegetal forma uma VLP quimérica e a VLP quimérica pode ser utilizada para produzir um anticorpo que capaz de se ligar a HA, incluindo HA madura, HA0, HAl ou HA2. A VLP, quando administrada a um sujeito, induz uma resposta imune.
Uma "resposta imune" geralmente se refere a uma resposta do sistema imune adaptativo. O sistema imune adaptativo geralmente compreende uma resposta humoral e uma resposta mediada por células. A resposta humoral é o aspeto da imunidade que é mediada por anticorpos segregados, produzidos nas células da linhagem de linfócitos B (célula B). Anticorpos segregados se ligam a antígenos na superfície de micróbios invasores (como vírus ou bactérias), que os sinalizam para serem destruídos. A imunidade humoral é geralmente utilizada para referir a produção de anticorpos e os processos que a acompanham, bem como as funções efectoras de anticorpos, incluindo a ativação de células Th2 e produção de citoquinas, geração de células de memória, promoção de fagocitose de opsonina, eliminação de patogénios e semelhantes. Os termos "modular" ou "modulação" ou semelhantes referem-se a um aumento ou diminuição de uma resposta ou parâmetro particular, conforme determinado por qualquer um dos vários ensaios geralmente conhecidos ou utilizados, alguns dos quais são aqui exemplificados.
Uma resposta mediada por células é uma resposta imune que não envolve anticorpos, mas envolve a ativação de macrófagos, células natural killer (NK), linfócitos T citotóxicos específicos de antígeno e a liberação de várias citoquinas em resposta a um antígeno. A imunidade mediada por células é geralmente utilizada para referir alguma ativação de células Th, ativação de células Tc e respostas mediadas por células T. A imunidade mediada por células é de particular importância na resposta a infeções virais.
Por exemplo, a indução de linfócitos T CD8 positivos específicos de antigénio pode ser medida utilizando um ensaio ELISPOT; A estimulação de linfócitos T CD4+ positivos pode ser medida utilizando um ensaio de proliferação. Os títulos de anticorpos anti-gripe podem ser quantificados utilizando um ensaio ELISA; Os isotipos de anticorpos específicos de antígeno ou reativos cruzados também podem ser medidos usando anticorpos anti-isotipo (por exemplo, anti-IgG, IgA, IgE ou IgM) . Os métodos e técnicas para realizar tais ensaios são bem conhecidos na técnica.
Um ensaio de inibição de hemaglutinao (HI ou HAI) também pode ser utilizado para demonstrar a eficácia de anticorpos induzidos por uma vacina, ou composição de vacina compreendendo HA quimérico ou VLP quimérica pode inibir a aglutinação de glóbulos vermelhos (RBC) por HA recombinante. Os títulos de anticorpos inibidores de hemaglutinação de amostras de soro podem ser avaliados por HAI de microtitulação (Aymard et al. 1973). Os eritrócitos de qualquer uma das várias espécies pode ser usada - por exemplo, cavalo, peru, galinha ou semelhantes. Este ensaio fornece informação indireta sobre a montagem do trímero HA na superfície da VLP, confirmando a apresentação adequada de sítios antigênicos em HAs.
Os títulos de reação cruzada de HAI também podem ser usados para demonstrar a eficácia de uma resposta imune a outras estirpes de vírus relacionadas ao subtipo de vacina. Por exemplo, soro de um sujeito imunizado com uma composição de vacina compreendendo uma hemaglutinina quimica compreendendo um HDC de um primeiro tipo ou subtipo de gripe pode ser utilizado num ensaio de HAI com uma segunda estirpe de vírus inteiro ou partículas de vírus e o título de HAI determinado.
Sem querer estar limitado pela teoria, a capacidade de HA de se ligar a RBC de diferentes animais é impulsionada pela afinidade de HA por ácidos siálicos ligados a ligações a2,3 ou oí2,6 e a presença destes ácidos siálicos na superfície de RBC. EH de equinos e aves dos vírus da gripe aglutinam os eritrócitos de todas as várias espécies, incluindo perus, galinhas, patos, porquinhos-da-índia, humanos, ovelhas, cavalos e vacas; considerando que os AH humanos se ligam aos eritrócitos de perus, galinhas, patos, cobaias, seres humanos e ovelhas (Ito T. et al, 1997, Virology, 227; 493-499; Medeiros R et al, 2001. Virology 289: 74-85). A presença ou níveis de citoquinas também podem ser quantificados. Por exemplo, uma resposta de células T auxiliares (Thl/Th2) será caracterizada pela medição de células secretoras de IFN-γ e IL-4 utilizando por ELISA (por exemplo, kits BD Biosciences OptEIA). Podem ser cultivadas células mononucleares do sangue periférico (PBMC) ou esplenócitos obtidos a partir de um sujeito, e o sobrenadante analisado. Os linfócitos T podem também ser quantificados por separação celular ativada por fluorescência (FACS), utilizando marcadores fluorescentes específicos para marcadores e métodos como são conhecidos na técnica.
Um ensaio de microneutralização pode também ser conduzido para caracterizar uma resposta imunitária num indivíduo, ver por exemplo os métodos de Rowe et al., 1973. Os títulos de neutralização de vírus podem ser obtidos de várias maneiras, incluindo: 1) enumeração de placas de lise (ensaio de placa) após fixação de cristal violeta / coloração de células; 2) observação microscópica da lise celular em cultura; 3) ELISA e deteção espectrofotométrica da proteina do vírus NP (correlacionada com a infeção virai das células do hospedeiro) Δ identidade de sequência ou similaridade de sequência pode ser determinada utilizando um programa de comparação de sequências, tal como o fornecido no ADNSIS (por exemplo, utilizando, mas não limitado aos seguintes parâmetros: penalidade GAP 5, #de diagonais superiores 5, penalidade fixa GAP 10, k-tuple 2, gap flutuante 10 e tamanho da janela 5) . No entanto, outros métodos de alinhamento de sequências para comparação são bem conhecidos na arte, por exemplo, os algoritmos de Smith & Waterman (1981, Adv. Appl. Math. 2: 482) Needleman & Wunsch (J. Mol. Biol. 48: 443, 1970) Pearson e Lipman (1988, Proc. Natl. Acad. Sei. USA 85: 2444), e por implementações computadorizadas desses algoritmos (por exemplo, GAP, BESTFIT, FASTA e BLAST (Altschul et al., 1990. J. Mol Biol 215: 403-410), ou por alinhamento manual e inspeção visual. As sequências de ácidos nucleicos ou de aminoácidos podem ser comparadas ou alinhadas e as sequências de consenso podem ser determinadas utilizando qualquer um dos vários pacotes de software conhecidos na técnica, por exemplo MULTALIN (Corpet F., 1988, Nucl. Acids Res., 16 (22), 10881-10890), BLAST, CLUSTAL ou similares; em alternativa as sequências podem ser alinhadas manualmente e semelhanças e diferenças entre as sequências determinadas.
Um fragmento ou porção de uma proteína, proteína de fusão ou polipéptido inclui um péptido ou polipéptido compreendendo um subconjunto do complemento de aminoácidos de uma proteína ou polipéptido particular, desde que o fragmento possa formar uma VLP quimérica quando expressa. O fragmento pode, por exemplo, compreender uma região antigénica, uma região indutora da resposta ao stress ou uma região compreendendo um domínio funcional da proteína ou polipéptido. O fragmento pode também compreender uma região ou domínio comum a proteínas da mesma família geral, ou o fragmento pode incluir sequência de aminoácidos suficiente para identificar especificamente a proteína de comprimento total a partir da qual é derivada.
Por exemplo, um fragmento ou porção pode compreender desde cerca de 60% até cerca de 100%, do comprimento do comprimento total da proteina, ou qualquer quantidade entre eles, desde que o fragmento possa formar uma VLP quimérica quando expressa. Por exemplo, de cerca de 60% a cerca de 100%, de cerca de 70% a cerca de 100%, de cerca de 80% a cerca de 100%, de cerca de 90% a cerca de 100%, de cerca de 95% a cerca de 100% comprimento do comprimento total da proteína, ou qualquer quantidade entre elas. Alternativamente, um fragmento ou porção pode ser de cerca de 150 a cerca de 500 aminoácidos, ou qualquer quantidade entre eles, dependendo do HA quimérico, e desde que o fragmento possa formar uma VLP quimérica quando expressa. Por exemplo, um fragmento pode ser de 150 a cerca de 500 aminoácidos, ou qualquer quantidade entre eles, de cerca de 200 a cerca de 500 aminoácidos, ou qualquer quantidade entre eles, de cerca de 250 a cerca de 500 aminoácidos, ou qualquer quantidade entre, de cerca de 300 a cerca de 500 ou qualquer quantidade entre eles, de cerca de 350 a cerca de 500 aminoácidos, ou qualquer quantidade entre eles, de cerca de 400 a cerca de 500 ou qualquer quantidade entre eles, de cerca de 450 a cerca de 500 ou qualquer quantidade entre elas, dependendo do HA quimérico, e desde que o fragmento possa formar uma VLP quimérica quando expressa. Por exemplo, cerca de 5, 10, 20, 30, 40 ou 50 aminoácidos, ou qualquer quantidade entre os mesmos, podem ser removidos do terminal C, do terminal N ou de ambos os terminais N e C de uma proteína HA quimérica, desde que o fragmento pode formar uma VLP quimérica quando expressa, de cerca de 400 a cerca de 500 ou qualquer quantidade entre elas, de cerca de 450 a cerca de 500 ou qualquer quantidade entre elas, dependendo do HA quimérico, e desde que o fragmento possa formar uma VLP quimérica quando expresso. Por exemplo, cerca de 5, 10, 20, 30, 40 ou 50 aminoácidos, ou qualquer quantidade entre os mesmos, podem ser removidos do terminal C, do terminal N ou de ambos os terminais N e C de uma proteína HA quimérica, desde que o fragmento pode formar uma VLP quimérica quando expressa, de cerca de 400 a cerca de 500 ou qualquer quantidade entre elas, de cerca de 450 a cerca de 500 ou qualquer quantidade entre elas, dependendo do HA quimérico, e desde que o fragmento possa formar uma VLP quimérica quando expresso. Por exemplo, cerca de 5, 10, 20, 30, 40 ou 50 aminoácidos, ou qualquer quantidade entre os mesmos, podem ser removidos do terminal C, do terminal N ou de ambos os terminais N e C de uma proteina HA quimérica, desde que o fragmento pode formar uma VLP quimérica quando expressa. A numeração de aminoácidos em qualquer sequência dada é relativa à sequência particular, no entanto, um especialista pode facilmente determinar a equivalência de um aminoácido particular numa sequência baseada na estrutura e/ou sequência. Por exemplo, se 6 aminoácidos do terminal N fossem removidos, isto mudaria a identidade numérica especifica do aminoácido (por exemplo, em relação ao comprimento total da proteina), mas não alteraria a posição relativa do aminoácido na estrutura. A presente divulgação descreve, mas não está limitada a expressão de um ácido nucleico que codifica um HA quimérico num poro de planta de uma planta, ou uma célula vegetal, e a produção de VLPs de gripe quiméricas da planta, adequadas para produção de vacinas. Exemplos de tais ácidos nucleicos incluem, por exemplo, mas não estão limitados a SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 68, SEQ ID NO: 69. A presente divulgação proporciona ainda a expressão de um ácido nucleico que codifica um HA quimérico, por exemplo mas não limitado a SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 68, SEQ ID NO: 69 , em uma planta, uma porção de uma planta, ou uma célula vegetal, e produção de candidatos ou reagentes da vacina contra gripe composta de proteínas estruturais recombinantes da gripe que se auto-agrupam em estruturas proteicas macromoleculares homotípicas funcionais e imunogénicas, incluindo partículas de gripe subvirais e gripe quimérica VLP, em células vegetais transformadas.
Por conseguinte, a divulgação proporciona VLPs quiméricas e um modo para a produção de VLPs quiméricas num sistema de expressão de plantas, a partir da expressão de uma única proteína de envelope quimérica. 0 ácido nucleico que codifica o HA quimérico de subtipos de gripe, por exemplo, SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 68, SEQ ID NO: 69, pode ser sintetizado por transcrição reversa e reação em cadeia da polimerase (PCR) usando ARN HA. Como exemplo, o ARN pode ser isolado de Hl/ NC, Hl/Bri ou H5/Indo, ou de células infetadas com estes ou outros tipos ou subtipos de vírus gripe. Para a transcrição reversa e PCR, podem ser utilizados iniciadores oligonucleotídicos específicos para o ARN HA. Adicionalmente, um ácido nucleico codificando uma HA quimérica pode ser sintetizado quimicamente utilizando métodos como seria conhecido de um especialista na técnica. A presente invenção é ainda dirigida a uma construção genética compreendendo um ácido nucleico que codifica uma HA quimérica, como descrito acima, operativamente ligado a um elemento regulador que é operativo numa planta. Exemplos de elementos reguladores operacionais numa célula vegetal e que podem ser utilizados de acordo com a presente invenção incluem, mas não estão limitados a uma região reguladora de plastocianina (US 7125978), ou uma região reguladora da Ribulose 1,5-bisfosfato carboxilase/oxigenase (RuBisCO; US 4962028), proteína de ligação à clorofila a/b (CAB; Leutwiler et al., 1986), ST-LS1 (associada ao complexo do fotossistema II que envolve o oxigénio e descrita por Stockhaus et al.1987, 1989). A construção genética da presente invenção pode também compreender um promotor constitutivo que dirige a expressão de um gene que está operativamente ligado ao promotor ao longo das várias partes de uma planta e continuamente ao longo do desenvolvimento da planta. Um exemplo não limitativo de um promotor constitutivo é aquele associado ao transcrito CaMV 35SOdell et al·., 1985, Nature, 313: 810-81.).
Um exemplo de uma sequência compreendendo uma região reguladora da plastocianina é a sequi^cia 5'para a sequenciada sublinhada que codifica um péptido de sinal da PDI da SEQ ID NO: 58. Um elemento regulador ou região reguladora pode melhorar a tradução de uma sequência nucleotídica à qual está ligada de forma operacional, onde a sequência nucleotídica pode codificar uma proteína ou polipéptido. Outro exemplo de uma região reguladora, o derivado das regiões não traduzidas do vírus do mosaico do caupi (CPMV), que pode ser utilizado para traduzir preferencialmente a sequência de nucleótidos a que está ligada operativamente. Esta região reguladora do CPMV é explorada em um sistema CMPV hiper-traduzível (CPMV-HT; ver, por exemplo, Sainsbury et al, 2008, Plant Physiology 148: 1212-1218; Sainsbury et al., 2008 Plant Biotechnology Journal 6: 82-92).
Por conseguinte, um aspeto da invenção proporciona um ácido nucleico compreendendo uma região reguladora operativamente ligada a uma sequência que codifica uma HA quimérica de gripe. A região reguladora pode ser um elemento regulador de plastocianina, e a gripe HA quimérico pode compreender subdomínios tipos de gripe de H5/Indo, Hl/Bri, Hl/NC, subtipos ou estirpes. As sequências de ácido nucleico compreendendo um elemento regulador de plastocianina e um HA de gripe quimérico são aqui exemplificadas pelas SEQ ID NOs: 63 e 64. As sequências de ácido nucleico compreendendo um elemento regulador 35S e um HA de gripe quimérico s aqui exemplificadas pelas SEQ ID NOs: 68, 69 e 71-75.
Noutro aspeto, a invenção proporciona um ácido nucleico compreendendo uma região reguladora de CPMV e uma HA de gripe quimérica, compreendendo subdomínios dos tipos, subtipos ou estirpes de gripe H5/Indo, Hl/Bri, Hl/NC. As sequências de ácido nucleico compreendendo um elemento regulador de CPMP e um HA quimérico s aqui exemplificadas pelas SEQ ID NOs: 66-69 e 71-75. VLPs de gripe quiméricas produzidas em plantas brotam a partir da membrana plasmática e a composição lipídica das VLPs quiméricas reflete aquela do tipo de tecido celular ou planta da planta do qual elas são produzidas. As VLPs produzidas de acordo com a presente invenção compreendem HA quimérico de dois tipos ou subtipos de gripe, complexados com lípidos derivados de plantas. Os lípidos vegetais podem estimular células imunitárias especificas e aumentar a resposta imunitária induzida. Lípidos de plantas tais como PC (fosfatidilcolina) e PE {fosfatidil etanolamina), bem como glicoesfingolipidos podem ligar-se a moléculas CDl expressas por células imunes de mamíferos tais como células apresentadoras de antígenos (APCs) como células dendríticas e macrófagos e outras células incluindo B e Linfócitos T no timo e fígado (revisto em Tsuji M,. 2006 Cell Mol Life Sci 63: 1889-98). As moléculas de CDl são estruturalmente semelhantes às moléculas do complexo de histocompatibilidade principal (MHC) da classe I e seu papel é apresentar antígenos glicolipídicos às células NKT (células T Natural Killer). Após a ativação, as células NKT ativam as células imunes inatas, como as células NK e as células dendríticas, e também ativam as células imunes adaptativas, como as células B e as células T produtoras de anticorpos.
Os fitosteróis presentes numa VLP de gripe complexada com uma bicamada lipídica, tal como um envelope derivado da membrana plasmática, podem proporcionar uma composição de vacina vantajosa. Sem querer estar limitado pela teoria, as VLPs feitas de plantas, incluindo aquelas compreendendo HA quimérico, complexadas com uma bicamada lipídica, tal como um envelope derivado da membrana plasmática, podem induzir uma reação imune mais forte do que as VLPs feitas em outros sistemas de expressão, ser semelhante à reação imune induzida por vacinas de vírus inteiros vivos ou atenuados.
Por conseguinte, em algumas formas de realização, a invenção proporciona uma VLP compreendendo uma HA quimérica, complexada com uma bicamada lipídica derivada de plantas. Em algumas formas de realização, a bicamada lipídica derivada de plantas pode compreender o envelope da VLP. A VLP produzida dentro de uma planta pode incluir um HA quimérico compreendendo N-glicanos específicos de plantas. Portanto, esta invenção também proporciona uma VLP compreendendo uma HA quimérica tendo N-glicanos específicos da planta.
Além disso, a modificação do N-glicano nas plantas é conhecida (ver, por exemplo, WO 2008/151 440) e HA quimérico tendo N-glicanos modificados pode ser produzido. Pode ser obtido um HA quimérico compreendendo um padrão de glicosilação modificado, por exemplo com N-glicanos fucosilados, xilosilados ou ambos fucosilados e xilosilados, ou pode ser obtido HA quimérico possuindo um padrão de glicosilação modificado, em que a proteina não tem fucosilação, xilosilação ou ambos e compreende galatosilação aumentada. Além disso, a modulação de modificações pós-tradução, por exemplo, a adição de galactose terminal pode resultar numa redução da fucosilação e xilosilação do HA quimérico expresso quando comparado com uma planta de tipo selvagem que expressa HA quimérico.
Por exemplo, o que não deve ser considerado limitante, a síntese de HA quimérico tendo um padrão de glicosilação modificado pode ser conseguido co-expressando a proteina de interesse juntamente com uma sequência nucleotídica codificando beta-1,4galactosiltransferase (GalT), por exemplo, mas não se limitando a GalT de mamífero, ou GalT humano, no entanto, também pode ser utilizado GalT de outras fontes. O domínio catalítico de GalT também pode ser fundido a um domínio CTS (ou seja, cauda citoplasmática, domínio transmembrana, região tronco) da N-acetilglucosaminil transferase (GNTl), para produzir uma enzima híbrida GNTl-GalT, e a enzima híbrida pode ser co-expressa com HA. 0 HA pode também ser co-expresso juntamente com uma sequência nucleotídica codificando N-acetilglucosaminiltransferase III (GnT-III), por exemplo mas não limitada a GnT-III de mamífero ou GnT-III humana, A GnT-III de outras fontes também pode ser usada. Adicionalmente, também pode ser utilizada uma enzima híbrida GNTl-GnT-III, compreendendo o CTS de GNTl fundido com GnT-III.
Portanto, a presente invenção também inclui VLP compreendendo HA quimérico tendo N-glicanos modificados.
Sem querer estar limitado pela teoria, a presença de N-glicanos vegetais num HA quimérico pode estimular a resposta imunitária promovendo a ligação de HA por células apresentadoras de antigénio. A estimulação da resposta imune utilizando a planta N glicano tem sido proposta por Saint-Jore-Dupas et al. (Trends Biotechnol 25: 317-23, 2007) . Além disso, a conformação da VLP pode ser vantajosa para a apresentação do antigénio e aumentar o efeito adjuvante da VLP quando complexada com uma camada lipidica derivada da planta.
Por "região reguladora", "elemento regulador" ou "promotor" entende-se uma porção de ácido nucleico tipicamente, mas nem sempre, a montante da região codificadora de proteína de um gene, que pode ser constituo por ADN ou ARN, ou ambos ADN e ARN. Quando uma região reguladora está ativa, e em associação operativa, ou operativamente ligada, com um gene de interesse, isto pode resultar na expressão do gene de interesse. Um elemento regulador pode ser capaz de mediar a especificidade de órgãos ou controlar a ativação de genes temporais ou de desenvolvimento. Uma "região reguladora" inclui elementos promotores, elementos promotores centrais exibindo uma atividade promotora basal, elementos que são indutiveis em resposta a um estimulo externo, elementos que medeiam a atividade promotora, tais como elementos reguladores negativos ou estimuladores da transcrição. "Região reguladora", como aqui utilizada, tambmém inclui elementos que são ativos após transcrição, por exemplo, elementos reguladores que modulam a expresso génica, tais como intensificadores de tradução e transcrição, repressores de tradução e transcrição, sequências de ativação a montante e determinantes da instabilidade de ARNm. Vários destes últimos elementos podem estar localizados próximo da região de codificação.
No contexto desta divulgação, o termo "elemento regulador" ou "região reguladora" refere-se tipicamente a uma sequência de ADN, normalmente, mas nem sempre, a montante (5') da sequência de codificação de um gene estrutural, que controla a expressão da região codificadora, proporcionando o reconhecimento da polimerase de ARN e/ou outros fatores necessários para a transcrição iniciar num local particular. No entanto, é para ser entendido que outras sequências nucleotidicas, localizadas dentro dos intrões, ou 3'da sequência podem também contribuir para a regulação da expressão de uma região codificadora de interesse. Um exemplo de um elemento regulador que proporciona o reconhecimento da ARN polimerase ou de outros fatores transcricionais para assegurar a iniciação em um local especifico é um elemento promotor. A maioria, mas não todas Os elementos promotores eucarióticos contêm uma caixa TATA, uma sequência de ácidos nucleicos conservada composta por pares de bases de nucleótidos de adenosina e timidina situados habitualmente aproximadamente 25 pares de bases a montante de um local de inicio da transcrição. Um elemento promotor compreende um elemento promotor basal, responsável pela iniciação da transcrição, bem como outros elementos reguladores (como listado acima) que modificam a expressão génica.
Existem vários tipos de regiões reguladoras, incluindo aquelas que são reguladas pelo desenvolvimento, indutíveis ou constitutivas. Uma região reguladora que é regulada pelo desenvolvimento, ou controla a expressão diferencial de um gene sob seu controle, é ativada dentro de certos órgãos ou tecidos de um órgão em momentos específicos durante o desenvolvimento desse órgão ou tecido. No entanto, algumas regiões reguladoras que são reguladas pelo desenvolvimento podem ser preferencialmente ativas dentro de certos órgãos ou tecidos em estágios específicos de desenvolvimento, elas também podem ser ativas de maneira regulada pelo desenvolvimento, ou em nível basal em outros órgãos ou tecidos dentro da planta também. Exemplos de regiões reguladoras específicas do tecido, por exemplo, uma região reguladora específica da vista, incluem o promotor da napina e o promotor da cruciferina (Rask et al.f 1998, J. Plant Physiol. 152: 595-599; Bilodeau et al., 1994, Plant Cell 14: 125-130). Um exemplo de um promotor especifico de folhas inclui o promotor de plastocianina (ver, por exemplo, a SEQ ID NO: 58); US 7125978, que é aqui incorporado por referência).
Uma região reguladora indutível é aquela que é capaz de direta ou indiretamente ativar a transcrição de uma ou mais sequências de ADN ou genes em resposta a um indutor. Na ausência de um indutor, as sequências de ADN ou genes não serão transcritos. Tipicamente, o fator de proteína que se liga especificamente a uma região reguladora indutível para ativar a transcrição pode estar presente em uma forma inativa, que é então direta ou indiretamente convertida para a forma ativa pelo indutor. No entanto, o fator de proteína também pode estar ausente. 0 indutor pode ser um agente químico como uma proteína, metabólito, regulador de crescimento, herbicida ou composto fenólico ou um estresse fisiológico imposto diretamente por calor, frio, sal ou elementos tóxicos ou indiretamente pela ação de um patógeno ou agente causador de doenças, como um virus. Uma célula de planta contendo uma região reguladora indutível pode ser exposta a um indutor aplicando externamente o indutor à célula ou planta tal como por pulverização, rega, aquecimento ou métodos semelhantes. Elementos reguladores indutíveis podem ser derivados de genes vegetais ou não-vegetais (por Gatz, C. e Lenk, IRP, 1998, Trends Plant Sci. 3, 352-358; que é incorporado por referência). Exemplos de potenciais promotores indutíveis incluem, mas não limitados a promotor indutível por tetraciclina (Gatz, C., 1997, Ann. Rev. Plant Physiol. Plant Mol. Biol. 48, 89-108; que é incorporado por referência), promotor induzido por esteroides (Aoyama, T. e Chua, NH, 1997, Plant J. 2, 397-404; que é incorporado por referência) e promotor indutível por etanol (Salter, MG, et al·., 1998, Plant Journal 16, 127-132; Caddick, MX, et al·., 1998, Nature Biotech. 16, 177-180, que são incorporados por referência) genes IB6 e CKIl indutíveis pela citoquinina (Brandstatter, I. e Kieber, JJ, 1998, Plant Cell 10, 1009-1019; Kakimoto, T., 1996, Science 274, 982-985; incorporados por referência) e o elemento indutível de auxina, DR5 (Ulmasov, T., et al·., 1997, Plant Cell 9, 1963-1971; que é incorporado por referência).
Uma região reguladora constitutiva dirige a expressão de um gene ao longo das várias partes de uma planta e continuamente durante o desenvolvimento da planta. Exemplos de elementos reguladores constitutivos conhecidos incluem promotores associados com o transcrito CaMV 35S. (Odell et al·., 1985, Nature, 313: 810-812), a actina 1 do arroz (Zhang et al, 1991, Plant Cell, 3: 1155-1165), actina 2 (An et al., 1996, Plant J., 10: 107-121.) ou tms 2 (US 5428147, que é aqui incorporado por referência), e genes do triosefosfato isomerase 1 (Xu et. al., 1994, Plant Physiol. 106: 459-467), o gene da ubiquitina 1 do milho (Cornejo et al, 1993, Plant Mol. Biol. 29: 637-646), os genes da Arabidopsis ubiquitina 1 e 6 (Holtorf et al, 1995, Plant Mol. Biol. 29: 637-646) e o gene do fator de iniciação translacional do tabaco 4A (Mandei et al, 1995 Plant Mol. Biol. 29: 995-1004). O termo "constitutivo", como aqui utilizado, não indica necessariamente que um gene sob o controlo da região reguladora constitutiva é expresso ao mesmo nível em todos os tipos de células, mas que o gene é expresso numa vasta gama de tipos de células, embora a variação abundância é frequentemente observada. Os elementos reguladores constitutivos podem ser acoplados a outras sequências para aumentar ainda mais a transcrição e/ou tradução da sequência nucleotídica à qual estão operativamente ligados. Por exemplo, o sistema CPMV-HT é derivado das regiões não traduzidas do vírus do mosaico de Cowpea (CPMV) e demonstra Lima tradução melhorada da sequência de codificação associada.
Por "nativo" significa-se que o ácido nucleico ou sequência de aminoácidos ocorre naturalmente ou "tipo selvagem".
Por "operacionalmente ligado" entende-se que as sequências particulares, por exemplo, um elemento regulador e uma região codificadora de interesse, interagem direta ou indiretamente para realizar uma função pretendida, tal como mediação ou modulação da expressão gênica. A interação de sequências operativamente ligadas pode, por exemplo, ser mediada por proteínas que interagem com as sequências ligadas operativamente. A sequência nucleotídica da presente invenção pode ser expressa em qualquer hospedeiro vegetal adequado que seja transformado pela sequência nucleotídica ou construções ou vetores da presente invenção. Exemplos de hospedeiros adequados incluem, mas não estão limitados a culturas agrícolas incluindo alfafa, canola, Brassica spp., Milho, Nicotiana spp., Alfafa, batata, ginseng, ervilha, aveia, arroz, soja, trigo, cevada, girassol, algodão, e similar. A construção genética quimérica da presente invenção pode ainda compreender uma região 3 'não traduzida. Uma região 3 'não traduzida refere-se à porção de um gene compreendendo um segmento de ADN que contém um sinal de poliadenilação e quaisquer outros sinais reguladores capazes de efectuar o processamento de ARNm ou a expressão génica. 0 sinal de poliadenilação é normalmente caracterizado por efetuar a adição de pistas de ácido poliadenilico à extremidade 3'do precursor de ARNm. Sinais de poliadenilação são comumente reconhecidos pela presença de homologia com a forma canónica 5 'AATAAA-3', embora variações não sejam incomuns.
Exemplos não limitantes de regiões 3 'adequadas são as regiões não traduzidas transcritas em 3' contendo um sinal de poliadenilação de genes de plasmídeos indutores de tumor (Ti) de Agrobacterium , tais como o gene da nopalina sintase (NOS), genes de plantas tais como a proteina de armazenamento de genes de soja, a pequena subunidade do gene da ribulose-1, 5-bisfosfato carboxilase (ssRUBISCO; US 4962028; que é aqui incorporado por referência), o promotor usado na regulação da expressão de plastocianina, descrito em US 7125978 (que é aqui incorporado por referência).
Uma ou mais das construções genéticas quiméricas da presente invenção também podem incluir outros intensificadores, sejam tradutores ou intensificadores de transcrição, conforme possa ser requerido. Os realçadores podem estar localizados 5' ou 3' para a sequência que está sendo transcrita. As regiões potenciadoras são bem conhecidas dos peritos na arte e podem incluir um codão de iniciação ATG, sequências adjacentes ou semelhantes. O codão de iniciação, se presente, pode estar em fase com o quadro de leitura ("no enquadramento") da sequência de codificação para proporcionar a tradução correta da sequência transcrita.
Para auxiliar na identificação de células vegetais transformadas, as construções desta invenção podem ser ainda manipuladas para incluir marcadores selecionáveis de plantas. Marcadores selecionáveis úteis incluem enzimas que proporcionam resistência a químicos tais como um antibiótico, por exemplo, gentamicina, higromicina, canamicina ou herbicidas tais como fosfinotricina, glifosato, clorossulfurão e semelhantes. De modo semelhante, podem ser utilizadas enzimas que proporcionam a produção de um composto identificável por alteração de cor, tal como GUS (beta-glucuronidase) , ou luminescência, tal como luciferase ou GFP.
Também são considerados parte desta invenção plantas transgénicas, células vegetais ou sementes contendo a construção de genes quiméricos da presente invenção. Métodos de regeneração de plantas inteiras a partir de células vegetais são também conhecidos na técnica. Em geral, as células vegetais transformadas são cultivadas num meio apropriado, o qual pode conter agentes seletivos tais como antibióticos, onde marcadores selecionáveis são utilizados para facilitar a identificação de células vegetais transformadas. Uma vez formadas pelos calos, a formação de rebentos pode ser encorajada empregando as hormonas vegetais apropriadas de acordo com métodos conhecidos e os rebentos transferidos para o meio de enraizamento para regeneração de plantas. As plantas podem então ser usadas para estabelecer gerações repetitivas, a partir de sementes ou usando técnicas de propagação vegetativa. Plantas transgénicas também podem ser geradas sem o uso de culturas de tecidos.
Também consideradas parte desta invenção são plantas transgénicas e árvores contendo a construção génica quimérica compreendendo um ácido nucleico codificando HA ou HAO quimérico recombinante para produção de VLP, de acordo com a presente invenção.
Os elementos reguladores da presente divulgação também podem ser combinados com a região codificante de interesse para expressão dentro de uma gama de organismos hospedeiros que são susceptiveis a transformação ou expressão transiente. Tais organismos incluem, mas não estão limitados a plantas, monocotiledóneas e dicotiledóneas, por exemplo mas não limitadas a milho, plantas de cereais, trigo, cevada, aveia, Nicotiana spp, Brassica spp, soja, feijão, ervilha, alfafa, batata, tomate, ginseng e Arabidopsis. Métodos para transformação estável e regeneração destes organismos são estabelecidos na arte e conhecidos de um especialista na técnica. 0 método de obtenção de plantas transformadas e regeneradas não é critico para a presente invenção.
Por "transformação" entende-se a transferência interespecífica de informação genética (sequência nucleotidica) que se manifesta genotipicamente, fenotipicamente ou ambas. A transferência interespecífica de informação genética de uma construção quimérica para um hospedeiro pode ser hereditária e a transferência de informação genética considerada estável, ou a transferência pode ser transitória e a transferência de informação genética não é hereditária.
Pelo termo "matéria vegetal", entende-se qualquer material derivado de uma planta. A matéria vegetal pode compreender uma planta inteira, tecido, células ou qualquer fração dela. Além disso, a matéria vegetal pode compreender componentes de plantas intracelulares, componentes de plantas extracelulares, extratos líquidos ou sólidos de plantas ou uma combinação destes. Além disso, a matéria vegetal pode compreender plantas, células vegetais, tecido, um extrato líquido ou uma sua combinação, a partir de folhas de plantas, caules, frutos, raízes ou uma sua combinação. A matéria vegetal pode compreender uma planta ou parte dela que não tenha sido submetida a quaisquer etapas de processamento. Uma parte de uma planta pode compreender matéria vegetal. No entanto, também é contemplado que o material vegetal pode ser submetido a etapas de processamento mínimas, conforme definido abaixo, ou a um processamento mais rigoroso, incluindo purificação de proteína parcial ou substancial utilizando técnicas vulgarmente conhecidas na técnica incluindo, mas não se limitando a cromatografia, eletroforese e semelhantes.
Pelo termo "processamento minímo" entende-se a matéria vegetal, por exemplo, uma planta ou sua porção compreendendo uma proteína de interesse que é parcialmente purificada para produzir um extrato vegetal, homogeneizado, fração de homogenato de planta ou semelhantes (isto é, minimamente processados). A purificação parcial pode compreender, mas não está limitada a rutura de estruturas celulares vegetais, criando assim uma composição compreendendo componentes vegetais soleis e componentes vegetais insoleis que podem ser separados, por exemplo, mas não limitados a centrifugação, filtração ou uma sua combinação. A este respeito, as proteínas segregadas no espaço extracelular da folha ou outros tecidos podem ser prontamente obtidas usando vácuo ou extração centrífuga, ou os tecidos podem ser extraídos sob pressão por passagem através de rolos ou trituração ou semelhantes para espremer ou libertar a proteína livre de dentro do espaço extracelular. 0 processamento mínimo também poderia envolver a preparação de extratos brutos de proteínas solúveis, uma vez que essas preparações teriam contaminação desprezível de produtos vegetais secundários. Além disso, o processamento mínimo pode envolver a extração aquosa da proteína solúvel das folhas, seguida de precipitação com qualquer sal adequado. Outros métodos podem incluir maceração em grande escala e extração de suco, a fim de permitir o uso direto do extrato. A matéria vegetal, na forma de material vegetal ou tecido, pode ser administrada oralmente a um sujeito. A matéria vegetal pode ser administrada como parte de um suplemento dietético, junto com outros alimentos, ou encapsulada. A matéria vegetal ou tecido também pode ser concentrado para melhorar ou aumentar a palatabilidade, ou fornecido juntamente com outros materiais, ingredientes ou excipientes farmacêuticos, conforme necessário.
Exemplos de um sujeito ou organismo alvo que as VLPs da presente invenção podem ser administradas para incluir, mas não estão limitados a humanos, primatas, aves, aves aquáticas, aves migratórias, codornas, patos, gansos, aves domésticas, galinhas, suínos, ovelhas, equino, cavalo, camelo, canino, cães, felino, gatos, tigre, leopardo, civeta, marta, marta de pedra, furões, casa de animais de estimação, gado, coelhos, ratos, cobaias ou outros roedores, selo, baleia e o gosto. Tais organismos alvo são exemplares e não devem ser considerados limitantes às aplicações e utilizações da presente invenção. É contemplado que uma planta compreendendo a HA quimérica de acordo com algumas formas de realização da invenção, ou expressando a VLP compreendendo a HA quimérica de acordo com algumas formas de realização da invenção, pode ser administrada a um sujeito ou organismo alvo, numa variedade de maneiras dependendo sobre a necessidade e a situação. Por exemplo, o HA quimérico obtido a partir da planta pode ser extraído antes da sua utilização quer numa forma bruta, parcialmente purificada, quer purificada. Se o HA quimérico deve ser pelo menos parcialmente purificado, então pode ser produzido em plantas comestíveis ou não comestíveis. Além disso, se o HA quimérico for administrado oralmente, o tecido da planta pode ser colhido e ser alimentado diretamente ao indivíduo, ou o tecido colhido pode ser seco antes da alimentação, ou um animal pode ser permitido pastar na planta sem colheita prévia. Lugar, colocar. É também considerado dentro do âmbito desta invenção que os tecidos vegetais colhidos sejam fornecidos como um suplemento alimentar na alimentação animal. Se o tecido vegetal estiver a ser alimentado a um animal com pouco ou nenhum processamento adicional, é preferível que o tecido vegetal a ser administrado seja comestível.
0 silenciamento génico pós-transcricional (PTGS) pode estar envolvido na limitação da expressão de transgenes em plantas, e a coexpressão de um supressor de silenciamento do vírus da batata Y (HcPro) pode ser usada para neutralizar a degradação específica de mARNs transgénicos (Brigneti et al., 1998). Supressores alternativos de silenciamento são bem conhecidos na técnica e podem ser usados como descrito aqui (Chiba et al., 2006, Virology 346: 7-14; que é aqui incorporado por referência), por exemplo mas não se limitando a, TEV-pl / HC-Pro (Vírus etch de tabaco-pl/HC-Pro), BYV-p21, pl9 de Tomato stab virus (TBSV ρ19), cápside proteína do Tomato plinkle virus (TCV-PC), 2b do vírus do mosaico do pepino; CMV-2b), p25 do Potato virus X (PVX-p25), pll do Potato virus M (PVM-pll), pll do Potato virus S (PVS-pll), pl6 do Blueberry scorch virus, (BScV-pl6), p23 do virus Citrus tristeza (CTV-p23), p24 do virus associado a Leafroll Grapevine-2, (GLRaV-2 p24), plO do virus Grapevine A, (GVA-plO), pl4 do virus Grapevine B (GVB-pl4), plO do vírus latente Heracleum (HLV-plO) , ou pl6 do virus latente comum Garlic (GCLV-pl6). Portanto, um supressor de silenciamento, por exemplo, mas não limitado a HcPro, TEV-pl/HC-Pro, BYV-p21, TBSV pl9, TCV-CP, CMV-2b, PVX-p25, PVM-pll, PVS- pll, BScV-pl6, CTV-p23, GLRaV-2 p24, GBV-pl4, HLV-plO, GCLV-pl6 ou GVA-plO, podem ser co-expressos juntamente com a sequência de ácido nucleico que codifica a proteina de interesse para assegurar ainda mais elevados niveis de produção de proteina dentro de uma planta.
Além disso, as VLP produzidas como aqui descrito não compreendem neuraminidase (NA) . No entanto, a NA pode ser co-expressa com HA se as VLPs compreendendo HA e NA forem desejadas.
Por conseguinte, a presente divulgação inclui ainda um vetor adequado compreendendo a sequência de HA quimérica adequada para utilização com sistemas de expressão estável ou transitória. A informação genética pode também ser fornecida dentro de um ou mais de uma construção. Por exemplo, uma sequência nucleotídica que codifica uma proteina de interesse pode ser introduzida numa construção e uma segunda sequência nucleotídica que codifica uma proteína que modifica a glicosilação da proteína de interesse pode ser introduzida utilizando uma construção separada. Estas sequências nucleotídicas podem então ser co-expressas dentro de uma planta. No entanto, uma construo compreendendo uma sequência nucleotídica que codifica a proteína de interesse e a proteína que modifica o perfil de glicosilação da proteína de interesse pode também ser utilizada.
Por "co-expresso" entende-se que duas ou mais do que duas sequências de nucleótidos são expressas aproximadamente ao mesmo tempo dentro da planta e dentro do mesmo tecido da planta. No entanto, as sequências de nucleotídeos não precisam ser expressas exatamente ao mesmo tempo. Pelo contrário, as duas ou mais sequências de nucleótidos são expressas de Lima maneira tal que os produtos codificados têm uma pQssibllldãdê de líibêragir·. :P©r exemplO::r ã proteína que modified á giieosilaçã©: da proteina de interesse pode ser expressa antes ou duranfe q; period©;: pmque a .proteína: de interesse;· φ expressa:*: ide ®dde que a ;m©difí cação: da: gliepsiiaçãQ; das duas Οή paid de duas·· sequénçiSS:' nucleotídicas podem ser co-expressas utilizando um sistema de expressão transiente, onde as duas ou mais sequências são introduzidas denito dã, planta sproximadamente ao pespo tempo .sob eondiçbes em que aíÉSaS as! sequências são expressas. Alternativamente, uma plstóa de pjatãfofla compreendendo uma das sequências nucleotídicas, por exemplo, a sequência que codifica: jpOtsihS tpê modifica o peitil· de glicosilaçâo da proteína de interesse, pode ser transformada, transitoriamentê ©u de um Podo estilei,. cbP uma sequência SdidiOial que codifica a proteína ,de interesse*: iMMÍte eas©:, a: sequência que codifica: a proteína que modifica o perfil de glicosilação ;da proteína de interesse: pode. ser: expressa dentro: de um tecido; desejado, durante um ssfidip de desenvolvimento desejado* ou a sua expressão ;pode ser induzida utilizando um promotor indutível e a sequência adicional codificando a proteína de interesse pode ser expressa em condições semelhantes e no mesmo tecido, para assegurar que as sequências nucleotídicas sejam co-expressas.
As construções da presente invenção podem ser introduzidas em células vegetais utilizando plasmídeos Ti, plasmídeos Ri, vetores de vírus de plantas, transformação direta de ADN, microinjeção, electroporação, infiltração e semelhantes. Para revisões de tais técnicas ver por exemplo, Weissbach e Weissbach, Methods for Plant Molecular Biology, Academia Press, New York VIII, pp. 421-463 (1988); Geierson e Corey, Plant Molecular Biology, 2d Ed. (1988); e Miki e Iyer, Fundamentals of Gene Transfer in Plants. In Plant Metabolism, 2d Ed. DT. Dennis, DH Turpin, DD Lefebrve, DB Layzell (eds), Addison-Wesley, Langmans Ltd. London, pp. :561-51:9 |1997) , ©atros: métodos incluem a absorção direta de ADN, a utilização de ilpossomas, alecÊfòpofâÇiO:, por exemplo, utilizando protoplastos^ microinjeção,; mi cr ©projéteis; ou ''whiskers” ψ infiltração s vicu©* Veja,, por exemplo:*: Sllanp st al. (Gene lOtt: 247-250 (1991) ) ÍOlieid qt:: al« (Mol. Gen. Genet. 228: 104-112, 1991) Guerche et al. (Plant Science 52: 111-116, 1987) Neuhause et al. (Theor. Appl Genet. 75: 30-36, 1987) Klein et al.. Nature 327: 70-73 (1987); Howell et al. (Ciência 208: 1265, 1980) Horsch et al. (Science 227: 1229-1231, 1985) DeBlock et al., Plant Physiology 91: 694-701, 1989), Liu e Lomonossoff (J. Virol Meth, 105: 343-348, 2002,), Patentes US 4945050; 5036006; 5100792; 6403865; 5625136, (todos os quais são aqui incorporados por referência).
Os métodos de expressão transiente podem ser usados para expressar as construções da presente invenção (ver Liu e Lomonossoff, 2002, Journal of Virological Methods, 105: 343-348; que é aqui incorporado por referência). Em alternativa, um método de expressão transiente baseado em vácuo, como descrito por Kapila et al. 1997 Plant Science 122: 101-108(aqui incorporado por referência) pode ser usado. Estes métodos podem incluir, por exemplo, mas não estão limitados a um método de Agro-inoculação ou de Agro-infiltração, no entanto, outros métodos transitórios podem também ser utilizados como mencionado acima. Com Agro-inoculação ou Agro-infiltração, uma mistura de Agrobacteria compreendendo o ácido nucleico desejado entra nos espaços intercelulares de um tecido, por exemplo, as folhas, porção aérea da planta (incluindo caule, folhas e flor), outra porção da planta (caule, raiz, flor) , ou a planta inteira. Depois de atravessar a epiderme, o Agrobacterium infecta e transfere cópias de t-ADN para as células. O t-ADN é epissalograficamente transcrito e o mARN é traduzido, levando à produção da proteína de interesse em células infetadas, no entanto, a passagem do t-ADN dentro do núcleo é transitória.
As VLP compreendendo HA quimérico proporcionado pela presente invenção podem ser utilizadas em conjunto com uma vacina de gripe existente, para suplementar a vacina, torná-la mais eficaz ou para reduzir as dosagens de administração necessárias. Tal como seria do conhecimento de um perito na arte, a vacina pode ser dirigida contra um ou mais do que um vírus da gripe. Exemplos de vacinas adequadas incluem, mas não estão limitados a, aqueles comercialmente disponíveis da Sanofi-
Pasteur, ID Biomedical, Merial, Sinovac, Quiron, Roche, Medlmmune, GlaxoSmithKline, Novartis, Sanofi-Aventis, Serono, Shire Pharmaceuticals e semelhantes.
Se desejado, as VLPs da presente invenção podem ser misturadas com um adjuvante adequado, como seria do conhecimento de um especialista na técnica. Além disso, a VLP pode ser utilizada numa composição de vacina compreendendo uma dose eficaz da VLP para o tratamento de um organismo alvo, como definido acima. AI disso, a VLP produzida de acordo com a presente invenção pode ser combinada com VLPs obtidas utilizando diferentes proteínas de gripe, por exemplo, neuraminidase (NA) .
Por conseguinte, a presente invenção proporciona um método para induzir imunidade à infeção por vírus da gripe num organismo animal ou alvo compreendendo a administração de uma dose eficaz de uma vacina compreendendo uma ou mais de uma VLP. A vacina pode ser administrada oralmente, intradermicamente, intranasalmente, intramuscularmente, intraperitonealmente, intravenosamente ou subcutaneamente.
As composições de acordo com a presente divulgação podem compreender VLPs de duas ou mais estirpes ou subtipos de gripe. "Dois ou mais" refere-se a duas, três, quatro, cinco, seis, sete, oito, nove, 10 ou mais estirpes ou subtipos. As estirpes ou subtipos representados podem ser de um único subtipo (por exemplo, todo o HlNl ou todo ο H5N1) ou podem ser uma combinação de subtipos. Exemplos de subtipos e estirpes incluem H5/Indo, Hl/Bri, Hl/NC. A escolha da combinação de estirpes e subtipos pode depender da área geográfica dos sujeitos suscetíveis de serem expostos à gripe, proximidade de espécies animais a uma população humana a ser imunizada (por exemplo, espécies de aves aquáticas, animais agrícolas como porcos, etc.) e as estirpes que eles carregam, estão expostos ou provavelmente serão expostos a predições de deriva antigênica dentro de subtipos ou estirpes, ou combinações desses fatores.
As duas ou mais VLPs podem ser expressas individualmente, e as VLPs purificadas ou semi-purificadas subsequentemente combinadas. Alternativamente, as VLPs podem ser co-expressas no mesmo hospedeiro, por exemplo, uma planta, protão de planta ou célula vegetal. As VLPs podem ser combinadas ou produzidas numa proporção desejada, por exemplo, em rácios equivalentes, ou podem ser combinadas de tal maneira que um subtipo ou estirpe compreende a maioria das VLPs na composição.
Por conseguinte, a divulgação proporciona composições compreendendo VLPs de duas ou mais estirpes ou subtipos.
Também proporcionado um artigo de fabrico, compreendendo material de embalagem e uma composição compreendendo uma VLP compreendendo uma HA quimérica. A composição inclui um excipiente fisiologicamente ou farmaceuticamente aceitável, e o material de embalagem pode incluir uma etiqueta que indica os ingredientes ativos da composição (por exemplo, a VLP).
Um kit compreendendo uma composição compreendendo um ácido nucleico codificando um HA quimérico como aqui proporcionado, juntamente com instruções para utilização do áido nucleico para produção de HA quimérico, ou VLPs compreendendo o HA quimérico também proporcionado. 0 kit pode ser útil para a produção de VLPs compreendendo o HA quimérico e as instruções podem incluir, por exemplo, informação na expressão do ácido nucleico numa planta ou numa célula vegetal, instruções para colheita e obtenção das VLPs da planta ou tecido da planta.
Noutra forma de realização, é proporcionado um kit para a preparação de um medicamento, compreendendo uma VLP compreendendo uma HA quimérica, juntamente com instruções para a sua utilização. As instruções podem compreender uma série de passos para a preparação do medicamento, sendo o medicamento útil para induzir uma resposta imunitária terapêutica ou profilática num sujeito a quem é administrado. 0 kit pode ainda compreender instruções que abordam concentrações de dose, intervalos de dose, métodos de administração preferidos ou semelhantes.
A presente invenção será ainda ilustrada nos exemplos seguintes. As sequências aqui descritas estão resumidas abaixo. Métodos e Materiais 1. Montagem de cassetes de expressão de HA. A- pCAMBIAPlasto
Todas as manipulações foram realizadas utilizando os protocolos gerais de biologia molecular de Sambrook e Russell (2001, que é aqui incorporado por referência) . A Tabela 1 apresenta iniciadores oligonucleoticos utilizados para montagem de cassetes de expressão. O primeiro passo de clonagem consistiu na montagem de um plasmideo recetor contendo elementos reguladores a montante e a jusante do gene da plastocianina de alfafa. O promotor de plastocianina e as sequências 5'UTR foram amplificados a partir do ADN genómico de alfafa utilizando os iniciadores oligonucleotidicos Xmal-pPlas.c (SEQ ID NO: 1) e SacI-ATG-pPlas. r (SEQ ID NO: 2). O produto de amplificçãao resultante foi digerido com Xmal e Saci e ligado a pCAMBIA2300 (Cambia, Canberra, Áustria), previamente digerido com as mesmas enzimas, para criar pCAMBIApromoPlasto. Similarmente, as sequências de 3'UTR e o terminador do gene da plastocianina foram amplificados a partir do ADN genómico de alfafa utilizando os seguintes iniciadores: Sacl-PlasTer.c (SEQ ID NO: 3) e EcoRI-PlasTer.r (SEQ ID NO: 4), e o produto foi digerido com Saci e EcoRI antes de ser inserido nos mesmos locais de pCAMBIApromoPlasto para criar pCAMBIAPlasto.B-
Plasto-Nativo SP-H5 A/ Indonásia/5/05 (número de construção 660)
Um fragmento que codifica hemaglutinina da estirpe de gripe A / Indonesia / 5/05 (H5N1; Acc. No. LANL ISDN125873) foi sintetizado por Epoch Biolabs (Sugar Land, TX, EUA). O fragmento produzido, contendo a região codificadora H5 completa incluindo o péptido sinal nativo flanqueado por um sitio HindIII imediatamente a montante do ATG inicial, e um local Saci imediatamente a jusante do codão stop (TAA), é apresentado em (SEQ ID NO: 52 Figura 17). A região codificadora de H5 foi clonada numa cassete de expressão baseada em plastocianina pelo modo de ligação baseado em PCR apresentado em Darveau et al. (1995). Resumidamente, foi obtida uma primeira amplificação por PCR utilizando os iniciadores Plasto-443c (SEQ ID NO: 5;) e SpHA (Ind) -Plasto.r (SEQ ID NO: 6) e pCAMBIApromoPlasto como modelo. Em paralelo, foi realizada uma segunda amplificação com os iniciadores Plasto-SpHA (SEQ ID NO: 7) e HA (Ind) -Sac. r (SEQ ID NO: 8) com fragmento codificador de H5 (SEQ ID NO: 52; Figura 17) como modelo. A amplificação obtida de ambas as reações foi misturada e a mistura serviu como molde para uma terceira reação (reação de montagem) utilizando Plasto-443c (SEQ ID NO: 5) e HA (Ind) -Sac.r (SEQ ID NO: 8) como iniciadores. 0 fragmento resultante foi digerido com BamHI (no promotor de plastocianina) e Saci (na extremidade 3 'do fragmento) e clonado em pCAMBIAPlasto previamente digerido com as mesmas enzimas. 0 plasmideo resultante, denominado 660, apresentado na Figura 18 (SEQ ID NO: 53). O fragmento resultante foi digerido com BamHI (no promotor de plastocianina) e Saci (na extremidade 3'do fragmento) e clonado em pCAMBIAPlasto previamente digerido com as mesmas enzimas. O plasmideo resultante, denominado 660, apresentado na Figura 18 (SEQ ID NO: 53). O fragmento resultante foi digerido com BamHI (no promotor de plastocianina) e Saci (na extremidade 3 'do fragmento) e clonado em pCAMBIAPlasto previamente digerido com as mesmas enzimas. O plasmideo resultante, denominado 660, apresentado na Figura 18 (SEQ ID NO: 53). C-Plasto-PDI SP-H1 A/Nova Caledónia/20/99 (número de construção 540) O quadro de leitura aberto do gene Hl da estirpe A / New Caledonia / 20/99 (HlNl) foi sintetizado em dois fragmentos (Plant Biotechnology Institute, National Research Council, Saskatoon, Canadá). Um primeiro fragmento sintetizado corresponde à sequência de codificação Hl de tipo selvagem (n° de acesso GenBank AY289929; SEQ ID N°: 54; Figura 19) sem a sequência codificadora do peptídeo sinal na extremidade 5 'e a sequência codificadora do domínio transmembrana na extremidade 3'. A extremidade 5'do fragmento é composta pelos últimos nucleótidos que codificam PDISP (incluindo um local de restrição BglII) e foi adicionado um local duplo Saci / StuI imediatamente a jusante do codão de terminação na extremidade terminal 3' do fragmento, para produzir SEQ. ID No: 55 (Figura 20). O primeiro fragmento Hl foi digerido com BglII e Saci e clonado nos mesmos locais de um vetor binário (pCAMBIAPlasto) contendo o promotor da plastocianina e 5'UTR fundido ao peptídeo sinal do gene da dissulfeto isomerase da proteína da alfafa (PDI) (nucleotideos 32-103; Acesso No. Z11499; SEQ ID No: 57; Figura 22) resultando num gene quimérico PDI-Hl a jusante dos elementos reguladores da plastocianina. A sequência da cassete base de plastocianina, contendo o promotor e o péptido de sinalização PDI até ao local de restrição BglII e o terminador de plastocianina a jusante de um local Saci, apresentada na SEQ ID NO. 58 (Figura 23). A adição da extremidade C-terminal da região de codificação Hl (codificando o dominio transmembranar e a cauda citoplasmática) foi obtida inserindo o fragmento sintetizado (SEQ ID NO. 56; Figura 21) previamente digerida com Kpnl e Saci, no plasmídeo de expressão Hl. A construção resultante, denominada 540, é apresentada na SEQ ID NO. 59 (Figura 24) . D-Plasto-nativo SP-Hl A/Briabane/59/07 (número de construção 774) A cassete de expressão número 774, conduzindo a expressão de Hl de A / Brisbane / 59/07, foi montada como se segue. Foi sintetizado um fragmento sintético compreendendo a sequência completa de codificação de hemaglutinina (de ATG para parar) flanqueada em 3 'por sequências de genes de plastocianina de alfafa correspondendo aos primeiros 84 nucleótidos a montante da plastocianina ATG começando com um local de restrição Drain. Os fragmentos sintéticos também compreendiam um sitio Saci imediatamente a jusante do codão de terminação. O fragmento sintético foi sintetizado pela Top Gene Technologies (Montreal, QC, Canadá). 0 fragmento sintetizado é apresentado na SEQ ID NO. 60 (Figura 25) . Para a montagem da cassete de expressão completa, o fragmento sintético foi digerido com Drain e Saci e clonado em pCAMBIAPlasto previamente digerido com as mesmas enzimas para dar a construção 774 (SEQ ID NO. 61; Figura 26). E-CPMV HT-LC C51 (número de construção 828)
As cassetes de expressão CPMV-HT utilizam o promotor 35S para controlar a expressão de um mARN compreendendo uma sequência codificadora de interesse flanqueada, em 5 ', pelos nucleotideos 1-512 do RNA2 do virus do mosaico do feijão-caupi (CPMV) com ATG mutado nas posições 115 e 161 e em 3 pelos nucleótidos 3330-3481 do CPMV RNA2 (correspondendo ao 3' UTR) seguido pelo terminador NOS. Plasmídeo pBD-C5-lLC, (Sainsbury et al. 2008; Plant Biotechnology Journal 6: 82-92 e Publicação PCT WO 2007/135480) , foi usado para a montagem de cassetes de expressão de hemaglutinina baseados em CPMV-ΗΤ. A mutação dos ATGs na posição 115 e 161 do CPMV RNA2 foi feita usando um método de ligação baseado em PCR Darveau et al. (Methods in Neuroscience 26: 77-85 (1995))). Dois PCRs separados foram realizados usando pBD-C5-lLC como modelo. Os iniciadores para a primeira amplificação foram pBinPlus.2613c (SEQ ID NO: 9) e Mut- ATG115.r (SEQ ID NO: 10) . Os iniciadores para a segunda amplificação foram Mut-ATG161.C (SEQ ID NO: 11) e LC-C5-1.110r (SEQ ID NO: 12). Os dois fragmentos obtidos foram misturados e utilizados como molde para uma terceira amplificação utilizando pBinPlus.2613c (SEQ ID NO: 9) e LC-C5-1.110r (SEQ ID NO: 12) como iniciadores. O fragmento resultante foi digerido com Pad e Apal e clonado em pBD-C5-lLC digerido com as mesmas enzimas. A construção gerada, denominado 828, é apresentado na Figura 27 (SEQ ID NO: 62).
Domínio de ligação ao recetor F-Hl A/Brlsbane/59/07 (RB) na estrutura H5 A/lndonésia/5/05 (número de construção 690)
Um HA quimérico foi feito substituindo o domínio RB no H5 A / Indonésia / 5/05 pelo de Hl A / Brisbane / 59/07 usando o método de ligação baseado em PCR apresentado em Darveau et al. (Methods in Neuroscience 26: 77-85 (1995))). Numa primeira ronda de PCR, um segmento do promotor de plastocianina fundido com o péptido sinal natural, os domínios F'l e El do H5 A / Indonésia / 5/05 foram amplificados utilizando os iniciadores Plasto-443c (SEQ ID NO: 5) e E1H1B-E1H5I.r (SEQ ID NO: 13) com o número de construção 660 (SEQ ID NO: 53, Figura 18) como modelo. Um segundo fragmento, compreendendo a sequência de codificação do domínio Rl HlA / Brisbane / 59/07, foi amplificado com os iniciadores El H5N-E1H1B.c (SEQ ID NO: 14) e E2H5I-RB HIB.r (SEQ ID NO: 15) utilizando o número de construção 774 (SEQ ID NO: 61; Figura 26) como modelo. Um terceiro fragmento compreendendo os domínios E2, F'2, F, transmembranar e citoplasmático de H5 A /
Indonésia/ 5/05 foi amplificado utilizando os iniciadores RB HlB-E2H5I.C (SEQ ID NO: 16) e HA (Ind) -Sacl.r (SEQ ID NO: 8) com o número de construção 660 (SEQ ID NO: 53; Figura 18) como modelo. Os produtos de amplificação foram então misturados e utilizados como molde para um segundo ciclo de amplificação (reação de montagem) com os iniciadores Plasto-443c (SEQ ID NO: 5) e HA (Ind) -Sacl.r (SEQ ID NO: 8) . O fragmento resultante foi digerido com BamHI (no promotor de plastocianina) e Saci (após o codão de terminação) e clonado no número de construção 660 (SEQ ID NO: 53; Figura 18) , previamente digerido com as mesmas enzimas de restrição para originar o número 690 (SEQ ID NO: 63) . A construção é apresentada na Figura 28. previamente digerido com as mesmas enzimas de restrição para dar o número 690 (SEQ ID NO: 63). A construção é apresentada na Figura 28. previamente digerido com as mesmas enzimas de restrição para dar o número 690 (SEQ ID NO: 63). A construção é apresentada na Figura 28.
Domínios G-Hl A / Brisbane / 59/07 esterase e de ligação ao recetor (E1-RB-E2) na estrutura H5 A / Indonésia / 5/05 (número de construção 691)
Um HA quimérico foi montado substituindo os domínios E1-RB-E2 em H5 A / Indonésia / 5/05 por aqueles de Hl A / Brisbane / 59/07 usando o método de ligação baseado em PCR apresentado em Darveau et al. (Methods in Neuroscience 26: 77-85 (1995}}}. Numa primeira ronda de PCR, um segmento do promotor de plastocianina fundido com o péptido sinal natural e o domínio F ' 1 de H5 A / Indonésia / 5/05 foi amplificado utilizando os iniciadores Plasto-443c (SEQ ID NO: 5) e El HlB-F'l H5I.r (SEQ ID NO: 17) com o número de construção 660 (SEQ ID NO: 53; Figura 18) como modelo. Em paralelo, dois outros fragmentos foram amplificados. O segundo fragmento, contendo a sequência de codificação dos domínios E1-RB-E2 de HlA / Brisbane / 59/07, foi amplificado com os iniciadores F'1H5N-E1H1B.c (SEQ ID NO: 18) e F’2H5I-E2. HIB.r (SEQ ID NO: 19) utilizando o número de construção 774 (SEQ ID NO: 61; Figura 26) como modelo. Para o terceiro fragmento, os domínios F'2, F, transmembrana e citoplasmático de H5 A / Indonesia / 5/05 foram amplificados usando os iniciadores E2 HIB-F'2H5l.c (SEQ ID NO: 20) e HA (Ind) - Saci.r (SEQ ID NO: 8) com o número de construção 660 (SEQ ID NO: 53; Figura 18) como modelo. Os produtos de amplificação foram então misturados e utilizados como molde para um segundo ciclo de amplificação (reação de montagem) com os iniciadores Plasto-443c (SEQ ID NO: 5) e HA (Ind) -Sacl.r (SEQ ID NO: 8). O fragmento resultante foi digerido com BamHI (no promotor de plastocianina) e Saci (após o codão de terminação) e clonado no número de construção 660 (SEQ ID NO: 53; Figura 18) , previamente digerido com as mesmas enzimas de restrição para originar o número 691 (SEQ ID NO: 64). A construção é apresentada na Figura 29.
Domínio de ligação ao recetor H-H5 A / Indonésia / 5/05 (BB) na estrutura Hl A / Nova Caledónia / 20/99 (número de construção 696)
Um HA quimérico foi feito substituindo o domínio RB no Hl A / Nova Caledónia / 20/99 pelo de H5 A / Indonésia / 5/05, usando o método de ligação baseado em PCR apresentado em Darveau et al. (Methods in Neuroscience 26: 77-85 (1995))). Num primeiro ciclo de PCR, um segmento do promotor de plastocianina fundido ao péptido sinal da dissulfureto isomerase da proteina de alfafa (PDISP; N° de Acesso Z11499; nucleótidos 32-103 da SEQ ID NO: 57; Figura 22), o F'l e os domios El de H1A / New Caledonia / 20/99 foram amplificados utilizando os iniciadores Plasto-443c (SEQ ID NO: 5) e E1H5I-E1H1NC.r (SEQ ID NO: 21) com o nero de construo 540 (SEQ ID NO: 59; Figura 24) como modelo. Um segundo fragmento, compreendendo a sequência de codificação do domínio H5 A / Indonésia / 5/05 RB, foi amplificado com os iniciadores E1H1NC-E1H5I.c (SEQ ID NO: 22) e E2H1NC-RBH5I.r (SEQ ID NO: 23) utilizando o número de construção 660 (SEQ ID NO: 53; Figura 18) como modelo. O fragmento Athird compreendendo os domios E2, F'2, F, transmembranar e citoplasmico de Hl A / New Caledonia / 20/99 foi amplificado utilizando os iniciadores RB H5I-E2 HINC.c (SEQ ID NO: 24) e HA-SacI. r (SEQ ID NO: 25) com o número de construção 540 (SEQ ID NO: 59; Figura 24) como modelo. Os produtos de amplificação foram então misturados e utilizados como molde para um segundo ciclo de amplificação (reação de montagem) com os iniciadores Plasto-443c (SEQ ID NO: 5) e HA-Sacl.r (SEQ ID NO: 25). O fragmento resultante foi digerido com BglII e Saci e clonado no nero de construo 540 (SEQ ID N59; Figura 24) previamente digerido com as mesmas enzimas de restrição para dar o número de construção 696 (SEQ ID NO: 65) . A construção é apresentada na Figura 30. I- Montagem de Hl A / Brisbane / 59/2007 na cassete de expressão CPMV-HT (número de construção 732). A sequência de codificação de HA de Hl A / Brisbane / 59/2007 foi clonada em CPMV-HT como se segue. Os sítios de restrição Apal (imediatamente a montante de ATG) e StuI (imediatamente a jusante do codão stop) foram adicionados à sequência de codificação da hemaglutinina através da realização de uma amplificação por PCR com os iniciadores Apal-HIB.c (SEQ ID NO: 26) e StuI-HIB. r (SEQ ID NO: 27) utilizando o número de construção 774 (SEQ ID NO: 61; Figura 26) como modelo. O fragmento resultante foi digerido com as enzimas de restrição Apal e StuI e clonado no número de construção 828 (SEQ ID NO: 62; Figura 27) digerido com as mesmas enzimas. A cassete resultante foi denominada número de construção 732 (SEQ ID NO: 66; Figura 31). J- Montagem dm SpPDI-Hl A / Brisbane / 59/2007 na cassete de expressão CPMV-ΗΓ (número de construção 733).
Uma sequência que codifica o péptido de sinal da dissulfureto isomerase da proteína alfafa (PDISP; nucleótidos 32-103 da SEQ ID NO: 57 Figura 22; Acesso N Z11499) foi fundida com a sequência de codificação HAO de Hl de A / Brisbane / 59/2007, e o fragmento
resultante foi clonado em CPMV-ífrdo seguinte modo. A sequência de codificação Hl foi amplificada com os iniciadores SpPDI-HlB.c (SEQ ID NO: 28) e SacI-HlB.r (SEQ ID NO: 29) utilizando a construção 774 (SEQ ID NO: 61; Figura 26) como modelo. 0 fragmento resultante consistia na sequência de codificação Hl flanqueada, em 5', pelos últimos nucleótidos que codificam PDISP (incluindo um local de restrição BglII) e, em 3', por um sítio de restrição Saci. 0 fragmento foi digerido com BglII e Saci e clonado no número de construção 540 (SEQ ID NO: 59; Figura 24) previamente digerido com as mesmas enzimas de restrição. A sequência de codificação da cassete intermédia, denominado número de construção 787 (SEQ ID NO: 67), é apresentada na Figura 32. Os sítios de restrição Apal (imediatamente a montante ATG) e StuI (imediatamente a jusante do codão de paragem) foram adicionados à sequência de codificação da hemaglutinina através da realização de uma amplificação por PCR com os iniciadores Apal-SpPDI.c (SEQ ID NO: 30) e StuI-HlB.r (SEQ ID N27) utilizando o nero de construo 787 (SEQ ID N 67; Figura 32) como modelo. O fragmento resultante foi digerido com as enzimas de restrição Apal e StuI e clonado no número de construção 828 (SEQ ID NO: 62; Figura 27) digerido com as mesmas enzimas. A cassete resultante foi denominada número de construção 733 (SEQ ID NO: 68; Figura 33). K- Montagem do domínio de ligação ao recetor HlA / Brisbane / 59/07 (BB) no esqueleto de H5A / Indonésia / 5/05 na cassete de expressão de CPMV-HT (número de construção 734). A sequência de codificação de HA quimérico consistindo no domínio RB de HlA / Brisbane / 59/07 em estrutura H5A / Indonésia / 5/05 foi clonada em CPMV-HT como se segue. Os locais de restrição Apal (imediatamente a montante de ATG) e StuI (imediatamente a jusante do codão de terminação) foram adicionados sequência de codificação da hemaglutinina quimérica através da realização de uma amplificação por PCR com os iniciadores Apal-H5 (A-Indo) .lc (SEQ ID NO: 31) e H5 (A-Indo) -StuI.1707r (SEQ ID NO: 32) utilizando o número de construção 690 (SEQ ID NO: 63; Figura 28) como modelo. O fragmento resultante foi digerido com as enzimas de restrição Apal e StuI e clonado no número de construção 828 (SEQ ID NO: 62; Figura 27) digerido com as mesmas enzimas. A cassete resultante foi denominada número de construção 734 (SEQ ID NO: 69; Figura 34). L-Montagem de SpPDX-H3 A / Brisbane / 10/2007 em cassete de expressão CPMV- HT (número de construção 736).
Uma sequência codificando o péptido sinal de alfalfa PDI fundido a HAO a partir de H3A / Brisbane / 10/2007 foi clonada em CPMV- HT como se segue. Primeiro, sintetizou-se um fragmento sintético compreendendo a sequência codificadora da hemaglutinina completa (de ATG para parar) flanqueada em 3 'pela sequência do gene da plastocianina de alfafa correspondente aos primeiros 84 nucleótidos (começando com um local de restrição Drain) a montante da plastocianina ATG. O fragmento sintético também continha um local Saci imediatamente após o códon de parada. Fragmento sintético foi sintetizado pela Top Gene Technologies (Montreal, QC, Canadá). O fragmento sintetizado é apresentado na SEQ ID NO: 70 (Figura 35) e foi utilizado como molde para posterior ligação baseada em PCR.
Em segundo lugar, o péptido sinal da dissulfureto isomerase da proteína de alfafa (PDISP) (nucleótidos 32-103; N.° de acesso Z11499; SEQ ID NO: 57; Figura 22) foi ligado à sequência de codificação HAO de H3 de A / Brisbane / 10/2007 ao longo com o sítio de restrição Apal imediatamente a montante do local de restrição ATG e StuI a jusante do codão de paragem como se segue. A PDISP foi ligada à sequência de codificação H3 pelo método de ligação baseado em PCRDarveau et al. (Methods in Neuroscience 26: 77-85 (1995))). Num primeiro ciclo de PCR, amplificou-se o péptido sinal PDISP utilizando os iniciadores Apal-SpPDI.c (SEQ ID NO: 30) e H3B-SpPDI.r (SEQ ID NO: 33) com o número de construção 540 (SEQ ID NO: 59; Figura 24) como modelo. Paralelamente, outro fragmento contendo uma porção da sequência de codificação de H3A / Brisbane / 10/2007 (do codão 17 ao codão de paragem) foi amplificado com os iniciadores SpPDI-H3B.c (SEQ ID NO: 34) e StuI-H3B.r (SEQ ID NO: 35) utilizando fragmentos previamente sintetizados (SEQ ID NO: 70; Figura 35) como modelo. Os produtos de amplificação foram então misturados e utilizados como molde para um segundo ciclo de amplificação (reação de montagem) com os iniciadores Apal-SpPDI.c (SEQ ID NO: 30) e StuI-H3B.r (SEQ ID NO: 35). O fragmento resultante foi digerido com as enzimas de restrição Apal e StuI e clonado no número de construção 828 (SEQ ID NO: 62; Figura 27) digerida com as mesmas enzimas. A cassete resultante foi denominada número de construção 736 (SEQ ID NO: 71; Figura 36). M-Montagem de SpPDI-H3 A / Brisbane / 10/2007 quimérico (ectodomínio) + H5 A / Indonésia / 5/2005 (TmD + cauda Cyto) na cassete de expressão CPMV-HT (número de construção 737).
Uma sequência codificando o péptido sinal de alfalfa PDI fundido ao ectodomínio de H3A / Brisbane / 10/2007 e aos domínios transmembranar e citoplasmático de H5A / Indonesia / 5/2005 foi clonada em CPMV-HT como se segue. A sequência codificadora da PDISP-H3 foi fundida ao domínio transmembranar H5 pelo método de ligação baseado em PCR apresentado em Darveau et al. (Methods in Neuroscience 26: 77-85 (1995))). Num primeiro ciclo de PCR, um fragmento compreendendo péptido sinal PDISP e ectodomínio de H3 Brisbane foi gerado por amplificação (com local de restrição Apal a montante do ATG inicial PDISP) utilizando os iniciadores Apal-SpPDI.c (SEQ ID NO: 30) e TmD H5I-H3B.r (SEQ ID NO: 36) com o número de construção 736 (SEQ ID NO: 71; Figura 36) como modelo. Paralelamente, outro fragmento contendo os domínios transmembranar e citoplasmático de H5 da Indonésia foi amplificado com os iniciadores H3B-TmD H5I.c (SEQ ID NO: 37) e H5 (A-Indo)-StuI.1707r (SEQ ID NO: 32) utilizando construo número 660 (SEQ ID NO. 53; Figura 18) como modelo. Os produtos de amplificação foram então misturados e utilizados como molde para um segundo ciclo de amplificação (reação de montagem) com os iniciadores Apal-SpPDI.c (SEQ ID NO: 30) e H5 (A-Indo)-StuI. 1707r (SEQ ID NO: 32). O fragmento resultante foi digerido com enzimas de restrição Apal e StuI e clonado no número de construção 828 (SEQ ID NO: 62; Figura 27) digerido com as mesmas enzimas. A cassete resultante foi denominada número de construção 737 (SEQ ID NO: 72; Figura 37). tf-Montagem de SpPDI-HA B / Florida / 4/2006 na cassete de expressão CPMV- HT (número de construção 739).
Uma sequência codificando o péptido sinal de alfalfa PDI fundido a HA0 de HA B / Florida / 4/2006 foi clonada em CPMV- HT como se segue. Primeiro, sintetizou-se um fragmento sintético compreendendo a sequência codificadora da hemaglutinina completa (de ATG para parar) flanqueada em 3'pela sequência do gene da plastocianina de alfafa correspondente aos primeiros 84 nucleótidos (começando com um local de restrição Drain) a montante da plastocianina ATG. 0 fragmento sintético também continha um local de restrição Saci imediatamente após o códon de terminação. 0 fragmento sintético foi sintetizado pela Epoch Biolabs (Sugar Land, Texas, EUA). 0 fragmento sintetizado é apresentado na SEQ ID NO: 7 3 (Figura 38) e foi utilizado como molde para posterior ligação baseada em PCR.
Segundo, o peptideo sinal da dissulfeto isomerase da proteína da alfafa (PDISP) (nucleotídeos 32-103 da SEQ ID NO: 57; Figura 22; Acesso No. Z11499) foi ligado à sequência de codificação HA de HA de B / Florida / 4/2006 juntamente com o sítio de restrição Apal imediatamente a montante de ATG e o sítio de restrição a jusante de sítio de restrição StuI como se segue. A PDISP foi ligada à sequência de codificação de HA pelo método de ligação baseado em PCR apresentado em Darveau et al. (Methods in Neuroscience 26: 77-85 (1995)). Num primeiro ciclo de PCR, amplificou-se o péptido sinal PDISP utilizando os iniciadores Apal-SpPDI.c (SEQ ID NO: 30) e HBF-SpPDI.r (SEQ ID NO: 38) com o número de construção 540 (SEQ ID NO: 59; Figura 24) como modelo. Paralelamente, outro fragmento contendo uma porção da sequência de codificação de HA de B / Florida / 4/2006 (do códon 16 ao códon de parada) foi amplificado com os iniciadors SpPDI-HBF.c (SEQ ID NO: 39) e StuI- HBF.r (SEQ ID NO: 40) utilizando fragmentos previamente sintetizados (SEQ ID NO: 73; Figura 38) como modelo. Os produtos de amplificação foram então misturados e utilizados como molde para um segundo ciclo de amplificação (reação de montagem) com os iniciadores Apal-SpPDI.c (SEQ ID NO: 30) e StuI-HBF.r (SEQ ID NO: 40). O fragmento resultante foi digerido com as enzimas de restrição Apal e StuI e clonado no nero de construo 828 (SEQ ID NO: 62; Figura 27) digerida com as mesmas enzimas. A cassete resultante foi denominada número de construção 739 (SEQ ID NO: 74; Figura 39). O-Montagem de SpPDI-HA quimérico B / Florida / 4/2006 (ectodominio) + H5 A / Indonésia / 5/2005 (TmD + cauda Cyto) na cassete de expressão CPMV- ST (número de construção 745).
Uma sequência que codifica o péptido de sinal PDI de alfafa fundido com o ectodominio de HA B / Florida / 4/2006 e aos domínios transmembranar e citoplasmático de H5 A / Indonésia/ 5/2005 foi clonada em CPMV- ET como se segue. A sequência codificadora do ectodominio PDISP-B / Florida / 4/2006 foi fundida aos domínios transmembrana e citoplasmática H5 pelo método de ligação baseado em PCR Darveau et al. (Methods in Neuroscience 26: 77-85 (1995))). Num primeiro ciclo de PCR, um fragmento compreendendo péptido sinal PDISP fundido com o ectodominio de HA B / Florida / 4/2006 foi gerado por amplificação utilizando os iniciadores Apal-SpPDI.c (SEQ ID NO: 30) e TmD H5I-B Flo.r (SEQ ID NO: 41) com o número de construção 739 (SEQ ID NO: 74; Figura 39) como modelo. Paralelamente, outro fragmento contendo os domínios transmembranar e citoplasmático H5 da Indonésia foi amplificado com os iniciadores B Flo-TmD H5I.c (SEQ ID NO: 42) e H5 (A-Indo)-StuI.1707r (SEQ ID NO: 32) utilizando construo número 660 (SEQ ID NO. 53; Figura 18) como modelo. Os produtos de amplificação foram então misturados e utilizados como molde para um segundo ciclo de amplificação (reação de montagem) com os iniciadores Apal-SpPDI.c (SEQ ID NO: 30) e H5 (A-Indo)-StuI.1707r (SEQ ID NO: 32). O fragmento resultante foi digerido com as enzimas de restrição Apal e StuI e clonado no número de construção 828 (SEQ ID NO: 62; Figura 27) digerido com as mesmas enzimas. A cassete resultante foi denominada número de construção 745 (SEQ ID NO: 75; Figura 40).
Montagem em P de SpPDI-HA quimérico B / Florida / 4/2006 + H5 A / Indonia / 5/2005 (TmD + cauda Cyto) na cassete de expressão 2X35S-CPMV- ST (número de construo 747) .
Uma sequência codificando o péptido sinal de alfalfa PDI fundido com HA0 de HA B / Florida / 4/2006 e ao domínio transmembranar e citoplasmático de H5 A / Indonésia/ 5/2005 foi clonada em 2X35S-CPMV- HT como se segue. A troca do promotor foi realizada utilizando o método de ligação baseado em PCR Darveau et al. (Methods in
Neuroscience 26: 77-85 (1995))). Um primeiro fragmento contendo o promotor 2X35S (SEQ ID NO: 88; Figura 50A) foi amplificado por PCR com os iniciadores Pad - MCS -2X35S.C (SEQ ID NO: 89) e CPMV 5’UTR- 2X35S.r (SEQ ID NO: 90):
Pad - MCS -2X35S.C (ID SEQ NO: 89)
ATAGTA TTAATTAA GTCGACAAGCTTGCATGCCTGCAGG TCAAC CPMV 5'UTR- 2X35S .r (SEQ ID NO: 90)
T CAAAACCTAT TAAGAT T T TAATA CCTCTCCAAATGAAATGAACTTCC utilizando um plasmideo contendo o promotor 2X35S como modelo. Paralelamente, foi realizada uma segunda PCR utilizando os iniciadores 2X35S- CPMV 5'UTR.c (SEQ ID NO: 91) e Apal- M prot.r (SEQ ID NO: 92): 2X35S-CPMV 5'UTR.c (ID SEQ NO: 91)
TTGGAGAGG TATTAAAATCTTAATAGGTTTTGATAAAAGCGAACGTGGG
Apal-M prot.r (ID SEQ NO: 92)
TCTCCAT GGGCCC GACAAATTTGGGCAGAATATACAGAAGCTTA utilizando a construção 745 (SEQ ID NO 75; Figura 40) como modelo. Os dois fragmentos obtidos foram então misturados e utilizados como molde para um segundo ciclo de PCR (reação de montagem) com Pad - MCS- 2X35S.C (SEQ ID NO: 8 9 e Apal -M prot.r (SEQ ID NO: 92) como iniciadores. O fragmento resultante foi digerido com Pad e Apal e clonado na construção 745 (SEQ ID NO: 75; Figura 40) digerido com as mesmas enzimas de restrição da sequência da cassete de expressão, denominada construção 747 (SEQ ID NO: 93), é apresentado na Figura 50B. 2. Montagem de cassetes de expressão acompanhantes
Duas cassetes de expressão de proteína de choque térmico (Hsp) foram montadas. Em uma primeira cassete, a expressão da HSP70 citosólica de Arabidopsis thaliana (ecótipo Columbia) (Athsp70-1 emLin et al. (2001) Cell Stress and Chaperones 6: 201-208) é controlado por um promotor quimérico que combina elementos dos promotores de Plastocianina de Nitrito Redutase (Nir) e alfafa (Nir/Plasto). Uma segunda cassete que compreende a região de codificação da HSP40 citosólica da alfafa (MsJl; Frugis et al. (1999) Plant Molecular Biology 40: 397-408) sob o controlo do promotor quimérico Nir/Plasto foi também montado.
Um plasmideo aceitador contendo o promotor da redutase de nitrato de alfafa (Nir), o gene repórter GUS e o terminador NOS no vetor binário da planta foi primeiro montado. Plasmideo pNir3K51 (descrito anteriormente em Patente US 6420548) foi digerido com HindIII e EcoRI. O fragmento resultante foi clonado em pCAMBIA2300 (Cambia, Canberra, Austrália) digerido pela mesma enzima de restrição para dar pCAMBIA-Nir3K51.
As sequências de codificação para Hsp70 e Hsp40 foram clonadas separadamente no plasmideo aceitador pCAMBIANir3K51 pelo método de ligação baseado em PCR apresentado em Darveau et al. (Methods in Neuroscience 26: 77-85 (1995))).
Para Hsp40, a sequência de codificação Msjl (SEQ ID NO: 7 6; Figura 41) foi amplificada por RT-PCR a partir de ARN total de folhas de alfafa (ecotipo Rangelander) utilizando os iniciadores Hsp40Luz.lc (SEQ ID NO: 43) e Hsp40Luz-SacI. 1272r (SEQ ID NO: 44). Uma segunda amplificação foi realizada com os iniciadores Plasto-443c (SEQ ID NO: 5) e Hsp40Luz-Plasto.r (SEQ ID NO: 45) com a construção 660 (SEQ ID NO: 53; Figura 18) como modelo. Os produtos de PCR foram então misturados e utilizados como molde para uma terceira amplificação (reação de montagem) com os iniciadores Plasto-443c (SEQ ID NO: 5) e Hsp40Luz-SacI.1272r (SEQ ID NO: 44). O fragmento resultante foi digerido com Hpal (no promotor de plastocianina) e clonado em pCAMBIANir3K51, previamente digerido com Hpal (no promotor de Nir) e Saci e arquivado com ADN-polimerase de T4 para gerar extremidades cegas. Os clones obtidos foram triados para orientação correta e sequenciados para integridade da sequência. O plasmideo resultante, denominado R850, é apresentado na Figura 42 (SEQ ID NO: 77). A região codificadora do Athsp70-1 foi amplificada por RT-PCR a partir do ARN da folha de Arabidopsis utilizando os iniciadores Hsp70Ara.lc (SEQ ID NO: 46) e Hsp70Ara-SacI. 1956r (SEQ ID NO: 47). Uma segunda amplificação foi realizada com os iniciadores Plato-443c (SEQ ID NO: 5) e Hsp70Ara-Plasto.r (SEQ ID NO: 48) com a construção 660 (SEQ ID NO: 53; Figura 18) como modelo. Os produtos de PCR foram então misturados e utilizados como molde para uma terceira amplificação (reação de montagem) com os iniciadores Plasto-443c (SEQ ID NO: 5) e Hsp70ARA-SacI.1956r (SEQ ID NO: 47). O fragmento resultante foi digerido com Hpal (no promotor de plastocianina) e clonado em pCAMBIANir3K51 digerido com Hpal (no promotor de Nir) e Saci e depositado com ADN-polimerase de T4 para gerar extremidades cegas. Os clones obtidos foram triados para orientação correta e sequenciados para integridade da sequência. O plasmídeo resultante, denominado R860, é apresentado na Figura 43 (SEQ ID NO: 78).
Um plasmídeo de expressão Hsp duplo foi montado como se segue. A R860 (SEQ ID NO: 78; Figura 43) foi digerida com BsrBI (a jusante do terminador NOS), tratada com polimerase de ADN T4 para gerar uma extremidade romba e digerida com Sbfl (a montante do promotor NIR / Plasto quimérico). 0 fragmento resultante (promotor quimérico Nir / Plasto-sequência de codificação de HSP70-terminador Nos) foi clonado em R850 (SEQ ID NO: 77; Figura 42) previamente digerido com Sbfl e Smal (ambos localizados no sitio de clonagem múltipla a montante Nir / Plasto quimérico promotor). 0 plasmídeo resultante, denominado R870, é apresentado na Figura 44 (SEQ ID NO: 79). 3. Montagem de outras cassetes de expressão Cassete de expressão HoPro
Uma construção HcPro (35HcPro) foi preparada como descrito em Hamilton et al. (2002) . Todos os clones foram sequenciados para confirmar a integridade das construções. Os plasmídeos foram utilizados para transformar Agrobacteium tumefaciens (AGLl; ATCC, Manassas, VA 20108, EUA) por electroporação (Mattanovich et al., 1989). A integridade de todas as estirpes de A. tumefaciens foi confirmada pelo mapeamento de restrição.
Cassete de expressão P19 A sequência codificadora da proteína pl9 do vírus do tomateiro de tomateiro (TBSV) foi ligada à cassete de expressão de plastocianina de alfafa pelo método de ligação baseado em PCR apresentado em Darveau et al. (Methods in Neuroscience 26: 77-85 (1995))). Numa primeira ronda de PCR, um segmento do promotor de plastocianina foi amplificado utilizando os iniciadores Plasto-443c (SEQ ID NO: 5) e supPl9-plasto.r (SEQ ID NO: 49) com a construi^^ío 660 (SEQ ID NO: 53) como modelo. Paralelamente, um outro fragmento contendo a sequência de codificação de pl9 foi amplificado com os iniciadores supPl9-lc (SEQ ID NO: 50) e SupP19-SacI.r (SEQ ID NO: 51) utilizando a construção 35S: pl9 como descrito em Voinnet et al. (The Plant Journal 33: 949-956 (2003) ) ) como modelo. Os produtos de amplificação foram então misturados e utilizados como molde para um segundo ciclo de amplificação (reação de montagem) com os iniciadores Plasto-443c (SEQ ID NO: 5) e SupPl9-SacI.r (SEQ ID NO: 51). O fragmento resultante foi digerido com BamHI (no promotor de plastocianina) e Saci (no final da sequência de codificação de pl9) e clonado no número de construção 660 (SEQ ID NO: 53; Figura 18), previamente digerido com as mesmas enzimas de restrição para dar o número de construção R472. 0 plasmídeo R472 é apresentado na Figura 45. Número de construção 443 O número de construção 443 corresponde a pCAMBIA2300 (vetor vazio).
Tabela 1: iniciadores oligonucleotides para montagem de cassetes de expressão
Tabela 2: Estirpes de Agrobacterium usadas para expressão de hemaglutininas de gripe com peptideos sinalizadores nativos ou PDI
4. Preparação da bxomassa vegetal, inoculo, agro-infiltração e colheita
Plantas de Nicotiana benthamiana foram cultivadas a partir de sementes em apartamentos preenchidos com substrato comercial de turfa. As plantas foram deixadas crescer na estufa sob um fotoperiodo de 16/8 e um regime de temperatura de 25°C dia/20°C noite. Três semanas após a sementeira, as plântulas individuais foram colhidas, transplantadas em vasos e deixadas a crescer na estufa durante mais três semanas sob as mesmas condições ambientais. Antes da transformação, os botões apicais e axilares foram removidos em vários momentos, conforme indicado abaixo, seja comprimindo os botões da planta, ou tratando quimicamente a planta.
As agrobacterias transfectadas com cada construção foram cultivadas num meio YEB suplementado com ácido 2- [N-morfolino] etanossulfónico (MES) , acetoseringona 20, 50 / ml de canamicina e 25 / ml de carbenicilina pH5,6 até atingirem um Οϋβοο entre 0,6 e 1,6. As suspensões de Agrobacterium foram centrifugadas antes da utilização e ressuspenderam-se em meio de infiltração (10 mM de MgCl2 e MES 10 mM pH 5,6). A infiltração com seringa foi realizada como descrito por Liu e Lomonossoff (2002, Journal of Virological Methods, 105: 343-348) . Para a infiltração por vácuo, as suspensões de A. tumefaciens foram centrifugadas, ressuspensas no meio de infiltração e armazenadas durante a noite a 4°C. No dia da infiltração, os lotes de cultura foram diluídos em 2,5 volumes de cultura e deixados a aquecer antes da utilização. Plantas inteiras de N. benthamiana ou N. tabacumforam colocados de cabeça para baixo na suspensão bacteriana em um tanque de aço inoxidável hermético sob um vácuo de 20-40 Torr por 2 min. Após a seringa ou infiltração a vácuo, as plantas foram devolvidas à estufa durante um período de incubação de 4-5 dias até à colheita. Salvo especificação em contrário, todas as infiltrações foram realizadas como co-infiltração com AGLl / 35S-HcPro numa proporção de 1: 1, exceto para as estirpes contendo cassetes CPMV-HT que foram co-infiltradas com a estirpe AGLl / R472 numa proporção de 1:1. 5. Amostragem de folhas e extração total de proteínas
Após a incubação, a parte aérea das plantas foi colhida, congelada a -80°C, esmagada em pedaços. As proteínas solúveis totais foram extraídas por homogeneização (Polytron) de cada amostra de material vegetal triturado congelado em 3 volumes de Tris 50 mM, pH 8, NaCl 0,15 M, metabissulfito de sódio 0,04% e fluoreto de fenilmetanossulfonilo 1 mM. Após a homogeneização, as suspensões foram centrifugadas a 20.000 g por 20 min a 4°C e esses extratos brutos clarificados (sobrenadante) foram mantidos para análise. O teor de proteína total dos extratos brutos clarificados foi determinado pelo ensaio de Bradford (Bio-Rad, Hercules, CA) utilizando albumina de soro bovino como padrão de referência. 6. Análise de Proteína e Imunoblotting
As concentrações de proteína foram determinadas pelo ensaio de proteína BCA (Pierce Biochemicals, Rockport IL) . As proteínas foram separadas por SDS-PAGE sob condições redutoras e coradas com Azul de Coomassie. Os géis corados foram digitalizados e a análise densitométrica realizada usando o ImageJ Software (NIH).
Proteínas da fração de eluição de SEC foram precipitadas com acetona (Bollag et al., 1996), ressuspensas em 1/5 do volume em equilíbrio/tampão de eluição e separadas por SDS-PAGE sob condições redutoras e eletrotransferidas em membranas de polivinil difluoreto (PVDF) (Roche Diagnostics Corporation, Indianapolis, IN) para imunodeteção. Antes da imunotransferência, as membranas foram bloqueadas com leite desnatado a 5% e Tween-20 a 0,1% em solução salina tamponada com Tris (TBS-T) durante 16-18 h a 4°C. A imunotransferência foi realizada por incubação com um anticorpo adequado (Tabela 6) , em 2 pg/ml em leite desnatado a 2% em TBS-Tween 20 a 0,1%. Os anticorpos secundários utilizados para deteção de quimiluminescência foram os indicados na Tabela 4, diluições como indicadas em leite desnatado a 2% em TBS-Tween 20 a 0,1%. Complexos imunorreativos foram detetados por quimiluminescência usando luminol como substrato (Roche Diagnostics Corporation). A conjugação de peroxidase de rábano-enzima do anticorpo IgG humano foi realizada utilizando o kit de conjugação de peroxidase ativada EZ-Link Plus® (Pierce, Rockford, IL) . Virus inativados inteiros (WIV), utilizados como controlos de deteção para os subtipos Hl, H3 e B, foram adquiridos ao Instituto Nacional de Normas Biológicas e Controlo (NIBSC).
Tabela 3: Condições de eletroforese, anticorpos e diluições para imunotransferência de proteínas expressas.
7. Esclarecimento e concentração antes da SEC
Para melhorar a resolução e aumentar o sinal nas frações de eluição, os extratos a serem carregados na cromatografia por exclusão de tamanho, os extratos de proteína bruta foram clarificados e concentrados utilizando o método seguinte. Os extratos foram centrifugados a 70 000 g, 4 durante 20 min e o sedimento foi lavado duas vezes por ressuspensos em 1 volume (comparado com o volume inicial do extrato) de tampão de extração (50 mM Tris pH 8, 0,15 M NaCl) e centrifugação a 70 000 g, 4 durante 20 min. O sedimento resultante foi ressuspenso em 1/3 do volume (comparado com o volume inicial do extrato) e as proteínas (incluindo VLPs) foram precipitadas pela adição de 20% (p/v) de PEG 3350 seguido por incubação em gelo durante 1 h. As proteínas precipitadas foram recuperadas por centrifugação a 10 000 g, 4°C, 20 min e ressuspensas em 1/15 do volume (comparado com o volume inicial de extrato) do tampão de extração. 8. Cromatografia de exclusão de tamanho do extrato proteico
Colunas de cromatografia de exclusão por tamanhos (SEC) de 32 ml de esferas de alta resolução Sephacryl“ S-500 (S-500 HR: GE Healthcare, Uppsala, Suíça, Cat. No. 17-0613-10) foram empacotadas e equilibradas com tampão de equilíbrio/eluição (Tris pH 8 mM, NaCl 150 mM) . Um mililitro e meio de extrato de proteína bruta foi carregado na coluna seguido de um passo de eluição com 45 mL de tampão de equilíbrio/eluição. A eluição foi recolhida em frações de 1,5 mL. O conteúdo proteico relativo das frações eluídas foi monitorizado misturando 10 μΐ da fração com 200 μΐ de reagente corante de proteína de diluição Bio-Rad (Bio-Rad, Hercules, CA. A coluna foi lavada com 2 colunas volumes de NaOH 0,2 N seguidos de 10 volumes de coluna de Tris 50 mM pH 8, NaCl 150 mM, 20% de etanol. Cada separação foi seguida por uma calibração da coluna com Blue Dextran 2000 (GE Healthcare Bio-
Science Corp., Piscataway, NJ, EUA). Os perfis de eluição de Blue Dextran 2000 e as proteínas solúveis do hospedeiro foram comparados entre cada separação para assegurar a uniformidade dos perfis de eluição entre as colunas utilizadas.
Exemplo 1: Estratégia de troca de domínio para domínios BB e/ou Esterase em hastes do subtipo de gripe. O subdomínio RB de H5 / Indo pode ser substituído por um subdomínio RB de HI, H3 ou B HA. O HA quimérico resultante proporciona um SDC H5 / Indo para formar VLPs e apresenta o subdomínio RB compreendendo sítios imunogénicos de Hl, H3 ou B. 0 subdomínio H5 / Indo RB pode ser inserido numa haste Hl (Hl/NC). As Figuras 15A e 15B ilustram as sequências de aminoácidos nas fusões dos subdomínios indicados, e as sequências de aminoácidos dos respetivos subdomínios são fornecidas na Figura 2 (construções 690, 734, 696 e 691) e na Tabela 4 (construções 900 e 745) e 5 (construções 910, 920 e 930) . As sequências de aminoácidos ilustradas na Figura 2 e as Tabelas 4 e 5 não incluem sequências peptídicas de sinal.
Tabula 4 Subdominios a Gripa HA quimérica. Gripe HA quimérica compreendendo suhdominio BB heterólogo.
Os aminoácidos 1-92 da SEQ ID NO: 105 são um domínio F'l + El de H5 / Indo; os aminoácidos 93-259 são o domínio da cabeça RB de H3 / Brisbane; os aminoácidos 260-548 são o domínio E2 + F'2 do H5 / Indo.
Os aminoácidos 1-92 da SEQ ID NO: 106 são um domínio F'l + El de H5 / Indo; os aminoácidos 93-27 6 s o domínio principal RB de B / Florida; os aminoácidos 277-565 são o domínio E2 + F'2 de H5 / Indo.
Tabela 5 Subdomiaioe @ Gripe EH quimérica, Gripe EH quimérica ccsspreeudeudo subdominio KB beteróiogo
Os aminoácidos 1-42 da SEQ ID NO: 107 são um domínio F '1 do terminal N de H5 / Indo; os aminoácidos 43-228 são o domínio principal El-RB-E2 de H3 / Brisbane; os aminoácidos 229-507 são o domínio F'2 do H5 / Indo.
Os aminoácidos 1-42 da SEQ ID NO: 108 são um domínio F 11 do terminal N de H5 / Indo; os aminoácidos 43-281 são o domínio principal El-RB-E2 de B / Florida; os aminoácidos 282-556 são o domínio F'2 do H5 / Indo.
Os aminoácidos 1-42 da SEQ ID NO: 109 são um domínio F'l no terminal N de Hl / NC; os aminoácidos 43-273 são o domínio da cabeça E1-RB-E2 de H5 / Indo; os aminoácidos 274-548 s o domínio F'2 de Hl / NC.
Os pontos de fusão para as várias quimeras foram selecionados de modo a estarem tão próximos (mas não necessariamente diretamente) dos terminais N e C dos vários subdomínios - sem querer ficarem limitados pela teoria, essas fusões foram selecionadas de forma a maximizar a estabilidade do HA quimérico. Por exemplo, a conservação de estrutura e sequência é observada no terminal N do subdomínio RB (Ha et al. 2002, EMBO J. 21: 865-875). Uma região menos variável na sequência primária é encontrada na tríade CF / YP localizada em aproximadamente 15 aminoácidos antes, no subdomínio El. Esta cisteína está envolvida na ponte dissulfureto # 3, que conservada entre as HAs (ver Figuras 46 e 47) . Uma junção nesta Cys pode proporcionar uma estabilidade adequada ou superior à HA quimérica em relação à sequência nativa. A extremidade do terminal C do RB fornece recursos conservados: por exemplo, um resíduo Ser conservado na posição -1 e o subdomínio E2 começa com uma folha beta observada em todo o HA no alinhamento (Ha et al. 2002, EMBO J. 21: 865-875). Portanto, o terminal C deste RB pode ser fundido ao aminoácido de iniciação desta estrutura de folha beta do subdomínio E2. Além disso, o padrão de ponte dissulfureto não é alterado, ou não é alterado substancialmente, para as quimeras compreendendo subdomínios RB de Hl / NC, HIBri, H3 / Bri ou B / Fio em um H5 / Indo SDC e para H5 / Indo RB subdomínio em Hl SDC (total de 6), mas uma ponte dissulfeto será adicionada (ponte n° 8) no híbrido HA de BBR na haste H5. Esta adição de ponte dissulfureto não deve interferir com o enrolamento do HA (porque está localizado dentro do domínio RB e o Cys é adjacente na sequência), e pode produzir um híbrido HA ainda mais estável.
Os subdomínios E1-RB-E2 de um primeiro tipo de gripe foram substituídos por subdomínios E1-RB-E2 de um segundo tipo de gripe. Tal disposição pode apresentar um maior número de aminoácidos do segundo tipo na superfície do H5-VLP. Neste exemplo, o HDC de Hl, H3 ou B foi colocado num H5 / Indo SDC, e um HDC de H5 / Indo num Hl / NC SDC (Tabela 5). A junção do HDC foi definida com um resíduo de cisteína conservada (compreendendo a ponte dissulfureto # 6 de HA tipo A e # 7 em HA tipo B). A junção da HDC no terminal C do subdomínio E2 foi definida com outro resíduo de cisteína conservada compreendendo a ponte dissulfureto # 6 (o segundo aminoácido do subdomínio F'2) do tipo Hl ou H3 de gripe num SDC de H5 / Indo ou para gripe tipo H5 em um SDC de Hl. Para a quimera gripe B, a junção foi estabelecida a conexão na primeira cisteína compreendendo a ponte dissulfeto # 4 (localizada a 4 aminoácidos do subdomínio F'2 e conservada entre os HAs). As quimeras resultantes não exibem qualquer alteração nos padrõess de ponte dissulfureto - os HAs Hl / H3 / H5 híbridos contêm 6 pontes de dissulfido e o híbrido B tem 7 deles.
Exemplo 2: Substituição dos subdomínios de ligação ao recetor (BB) ou de ligação ao recetor e esterase (E1-RB-E2) de H5 A / Indonésia / 5/05 pela de Hl A / Brisbane / 59/2007: Comparação da expressão para quimérico e formas nativas.
Para combinar o alto nível de acumulação de VLPs de H5 A / Indonésia / 5/05 com as características de antigenicidade de Hl A / Brisbane / 59/2007, hemaglutininas quiméricas foram projetadas compreendendo domínios de Hl A / Brisbane / 59/2007 fundidos a um H5 A / Indonesia / 5/05 cluster de domínio de tronco. As cassetes de expressão para a expressão das fusões de hemaglutinina H5 / Hl estão representadas na Figura 1 e as sequências de aminoácidos das proteínas de fusão maduras produzidas ilustradas na Figura 2.
Comparar o nível de acumulação de hemaglutininas quiméricas H5 / Hl com as suas formas nativas, Nicotiana benthamianaplantas foram infiltradas com AGL1 / 774, AGL1 / 691 e AGL1 / 690, e as folhas foram colhidas após um período de incubação de seis dias. Para determinar o nível de acumulação de cada forma de HA nas folhas agro-infiltradas, as proteínas foram extraídas do tecido foliar infiltrado e analisadas por Western blotting utilizando anticorpos monoclonais anti-HA. Uma banda única de aproximadamente 75 kDa (Figura 3), correspondendo em tamanho à forma HAO não-clivada de hemaglutinina da gripe, foi detetada em extratos de folhas infiltradas com AGLl / 690 mas não em AGL1 / 774 ou AGLl / 691, indicando que a hemaglutinina quimérica compreendendo a região de ligação ao recetor de Hl A / Brisbane / 59/2007 fusionada à estrutura H5 A / Indonésia / 5/05 acumulou um nível mais elevado do que a forma nativa de Hl A / Brisbane / 59/2007 (AGLl / 774) e a hemaglutinina quimérica combinando as regiões de ligação esterase e recetor de Hl A / Brisbane / 59/2007 com a estrutura H5 A / Indonesia / 5/05. O vírus inteiro inativado (WIV) (HI A / Brisbane / 59/2007) usado como controle positivo foi detetado como múltiplas bandas com uma banda principal a aproximadamente 80 kDa, correspondendo ao peso molecular do precursor HAO de Hl A / Brisbane. / 59/2007. Estes resultados demonstraram que a substituição da região de ligação ao recetor de H5 A / Indonésia / 5/05 pela de Hl A / Brisbane / 59/2007 gerou uma hemaglutinina quimérica que apresentou a região antigênica de Hl e que se acumulou em um nível mais alto que o nativo Hl A / Brisbane / 59/2007 em plantas. No entanto, a hemaglutinina quimérica em que as regiões de ligação da esterase e do recetor de H5 A / Indonésia / 5/05 foram substituídas pelas de Hl A / Brisbane / 59/2007 não se acumulou a um nível detetável nas plantas. A fusão da região de ligação ao recetor de Hl A / Brisbane / 59/2007 à estrutura H5 A / Indonésia / 5/05 como um método para aumentar a acumulação de VLP apresentadoras de antigénio Hl em plantas foi reavaliada sob o controlo de uma cassete de expressão forte baseada em CPMV-HT. Esta estratégia de fusão também foi comparada com a substituição do peptideo sinal como meio de aumentar o nível de acumulação. As cassetes de expressão para a expressão das fusões de hemaglutinina H5 / Hl sob CPMV-HT estão representadas na Figura 8 e a sequência de aminoácidos da proteína de fusão madura produzida é apresentada na Figura 2.
As plantas de Nicotiana benthamiana foram infiltradas com AGLl / 732, AGLl / 733 ou AGLl / 734, e as folhas foram colhidas após um período de incubação de seis dias. Para determinar o nível de acumulação de cada forma de HA nas folhas agro-infiltradas, as proteínas foram primeiro extraídas do tecido foliar infiltrado e analisadas por Western blotting utilizando anticorpos policlonais anti-Hl (Brisbane). Uma banda única de aproximadamente 75 kDa (Figura 6) , correspondendo em tamanho à forma HAO não clivada de hemaglutinina de gripe, foi detetada em extratos de folhas infiltradas com AGLl / 732, AGLl / 733 e AGLl / 734. Entretanto, embora a hemaglutinina tenha sido detetada em todos os extratos analisados, diferenças importantes no acúmulo puderam ser notadas. Enquanto a expressão de H1A / Brisbane / 59/2007 foi dificilmente detetável sob estas condições quando se utiliza o seu peptideo sinal natural (732), a substituição do peptideo sinal pelo de PDI resultou em maior acúmulo de Hl A maduro / Brisbane / 59/2007 (733), e a hemaglutinina H5 / Hl quimérica (734) acumulou-se no nível mais alto. Em conjunto, estes resultados mostram que a fusão do domínio de ligação ao recetor de Hl em uma estrutura H5 leva a um alto acúmulo de hemaglutinina apresentadora de antígenos Hl e que o nível de acumulação obtido para essa fusão em plantas é maior do que o obtido com o nativo, forma com ou sem substituição do péptido sinal.
Exemplo 3: Substituição do eubdominio de ligaç&o ao recetor (BB) de Hl A / Nova Caledónia / 20/99 com o de H5 A / Indonésia / 5/05. Comparação de expressão para formas quiméricas e nativas. 0 uso de uma estrutura Hl (de A / New Caledonia / 20/99) para a apresentação da região antigênica de H5 também foi avaliado. As cassetes de expressão para a expressão da fusão de hemaglutinina Hl / H5 estão representadas na Figura 1 e a sequência de aminoácidos da proteína de fusão madura produzida apresentada na Figura 2.
Para comparar o nível de acumulação de hemaglutinina Hl / H5 quimérica com a sua forma nativa, plantas de Nicotians benthamiana foram infiltradas com AGLl / 660 e AGLl / 696, e as folhas foram colhidas após um período de incubação de seis dias. Para determinar o nível de acumulação de cada forma de HA nas folhas agro-infiltradas, as proteínas foram extraídas do tecido foliar infiltrado e analisadas por Western blotting utilizando anticorpos policlonais anti-H5 (Indica). Uma faixa única de aproximadamente 75 kDa (Figura 7), correspondendo em tamanho à forma HAO não-clivada de hemaglutinina da gripe, foi detetada em extratos de folhas infiltradas com AGLl / 660 e AGLl / 696, indicando que tanto ο H5 A nativo / Indonésia / 5/05 e a hemaglutinina quimérica Hl / H5 se acumulam em alto nível nas plantas.
Exemplo 4: Substituição do ectodaminio de H5 λ / Indonésia / 5/05 com o de H3 ou B. Comparação da expressão para formas quiméricas e nativas. A fusão da ectodamaina de H3 A / Brisbane / 10/2007 ou B Florida / 4/2006 aos subdomínios transmembrana e citoplasmática de H5 A / Indonésia / 5/05 foi avaliada como uma estratégia para apresentar regiões antigênicas de hemaglutinina de H3 e B estirpes, aumentando o seu nível de acumulação nas plantas. As cassetes de expressão para a expressão das fusões de hemaglutinina H5 / H3 e H5 / B estão representadas na Figura 10 e os aminoácidos na margem das fusões são apresentados na Figura 11. O nível de acumulação de hemaglutinina H5 / B quimérica (745) foi comparado com o de HA B nativa (739) em plantas de Nicotiana benthamiana. As plantas foram infiltradas com AGLl / 739 e AGLl / 745, e as folhas foram colhidas após um period© de incubação de seis dias. Para determinar o nível de acumulaçãoo de cada forma de HA nas folhas agro-infiltradas, as proteínas foram primeiro extraídas do tecido foliar infiltrado e analisadas por Western blotting utilizando anticorpos policlonais anti-B (Florida). Uma faixa única de aproximadamente 75 kDa (Figura 14), correspondendo em tamanho à forma HAO não-clivada de hemaglutinina da gripe, foi detetada em extratos de folhas de uma planta infiltrada com AGLl / 739 enquanto as 3 plantas infiltradas com AGLl / 745 mostraram sinal positivo correspondendo à hemaglutinina, indicando que a forma quimérica H5 / B da hemaglutinina se acumulou mais regularmente em níveis elevados do que a forma nativa da hemaglutinina B.
Similarmente, o nível de acumulação de hemaglutinina H5 / H3 quimérica (737) foi comparado com o de sua forma nativa (736) em plantas de Nicotiana benthamiana. As plantas foram infiltradas com AGLl / 736 e AGLl / 737 e as folhas foram colhidas após um período de incubação de seis dias. Para determinar o nível de acumulação de cada forma de HA nas folhas agro-infiltradas, as proteínas foram extraídas do tecido foliar infiltrado e analisadas por Western blotting utilizando anticorpos policlonais anti-H3 (Brisbane). Uma banda única de aproximadamente 75 kDa (Figura 15), correspondendo em tamanho à forma HAO não-clivada da hemaglutinina da gripe, foi detetada em extratos de folhas infiltradas com AGLl / 736 e AGL 1/737. Este resultado indica que a fusão de subdomínios transmembrana e citoplasmática de H5 A / Indonésia / 5/05 ao ectodomínio de H3 A / Brisbane / 10/2007 cria uma hemaglutinina quimérica que se acumula a um nível semelhante ao H3A nativo / Brisbane / 10/2007 A produção de VLPs a partir da expressão da hemaglutinina quimérica H5 / B (construção n° 745) foi avaliada utilizando cromatografia de exclusão por tamanhos. Extratos de proteína concentrada de plantas infiltradas com AGLl / 745 (1,5 mL) foram fracionados por cromatografia de exclusão por tamanho (SEC) em colunas SephacrylTM S- 500 HR (GE Healthcare Bio-Science Corp., Piscataway, NJ, EUA) . Como mostrado na Figura 16, a eluição de Dextran Azul (2 MDa) atingiu um pico na fração 8. Quando as proteínas de 200 μΐ de cada fração de eluição SEC foram concentradas (5 vezes) por precipitação com acetona e analisadas por Western blotting usando anti-B Flórida), anticorpos policlonais (Figura 16), a hemaglutinina quimérica foi encontrada principalmente na fração 7, indicando a incorporação de HA em estruturas de alto peso molecular. Sem querer ser limitado pela teoria, isso sugere que a proteína HA quimérica foi montada em uma superestrutura grande ou que foi fixada a uma estrutura de alto peso molecular. Os resultados obtidos indicam que o HA quimérico que consiste no ectodomínio de HA B / Florida / 4/2006 fundido aos subdominios transmembrana e citosólico de H5 A / Indonesia / 5/05 se agrupa em partículas de alto peso molecular e que o perfil de eluição destas partículas de alto peso molecular é indistinguíveis àquelas das VLPs da gripe.
Exemplo 5: Co-expressão de hemaglutinina quimérica H5 / B (número de construção 747; compreendendo B / Flo HDC e SDC fundida com um TDC H5 / Indo) com Hsp70 e Hsp40 em combinação com modificação do péptido sinal. A expressão de Hsp40 e Hsp70 em plantas e a co-expressão com hemaglutininas de gripe são descritas no pedido co-pendente PCT / CA2009 / 000032. A Hsp70 citosólica e a Hsp40 (número de construção R870) de origem vegetal podem também ser co-expressas com hemaglutininas quiméricas, para aumentar o seu nível de acumulação nas plantas. A co-expressão pode ser realizada por agro-filtração de plantas de N. benthamiana com uma suspensão bacteriana contendo uma mistura (proporção de 1:1:1) de AGLl contendo a cassete para a expressão do HA quimérico desejado com AGLl / R870 e AGLl / 35SHcPro. O nível de acumulação de hemaglutinina H5 / B quimérica (B / Fio HDC e SDC fundida com um H5 / Indo TDC) foi avaliado em co-expressão com HSP40 e HSP70 em plantas de Nicotiana benthamiana. As plantas foram infiltradas com AGLl / 747, AGLl / 747 + AGLl / 443 (vetor vazio) ou AGL1 / 747 + AGL1 / R870 (HSP40 / HSP70), e as folhas foram colhidas após um período de incubação de seis dias. Para determinar o nível de acumulação de HA quimérico H5 / B nas folhas agro-infiltradas, as proteínas foram primeiro extraídas do tecido foliar infiltrado e analisadas por Western blotting utilizando anticorpos policlonais anti-B (Florida). Uma banda única de aproximadamente 75 kDa (Figura 50), correspondente em tamanho à forma HAO não-clivada da hemaglutinina da gripe, foi detectada em extratos de folhas de 3 plantas infiltradas com AGL1 / 747 + AGL1 / R870 enquanto as 3 plantas infiltradas com AGL1 / 747 + vetor de controle (443) não mostraram sinal (sob a condição de exposição usada) indicando que ο H5 / B quimérico forma de hemaglutinina acumulada em alto nível quando co-expressa com as HSP40 e HSP 70 chaperones.
Na descrição, vários termos são usados extensivamente e são fornecidas definições para facilitar a compreensão de vários aspetos da invenção. Os intervalos numéricos incluem os números que definem o intervalo. Na descrição, a palavra "compreendendo" é usada como um termo aberto, substancialmente equivalente à frase "incluindo, mas não limitado a", e a palavra "compreende" tem um significado correspondente.
LISTAGEM DE SEQUÊNCIAS
<110> Medicago Inc. COUTURE, MANON DARGIS, MICHELE LAVOIE, PIERRE-OLIVIER VEZINA, LOUIS- PHILIPPE DAOUST, MARC-ANDRE <120> Chimeric Influenza Virus-Like Particles Comprising Hemagglutinin
45 <130> V82197WO <140> not assigned <141 > not assigned so <150> 61/220,161 <151 >2009-06-24 <160> 113 55 <170> Patentln version 3.4 <210> 1 <211> 32 <212> D ΝΑ <213> Artificial sequence <220> <223> Synthesized Xmal-pPlas.c <400> 1 agttccccgg gctggtatat ttatatgttg tc 32 <210>2
<211 >46 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Sacl-ATG-pPlas.r <400>2 aatagagctc cattttctct caagatgatt aattaattaa ttagtc 46
<210> 3 <211 >46 <212> DNA <213> Artificial sequence <220> <223> Synthesized Sacl-PlasTer.c <400> 3 aatagagctc gttaaaatgc ttcttcgtct cctatttata atatgg 46
<210> 4 <211 >48 <212> DNA <213> Artificial sequence <220> <223> Synthesized EcoRI-PlasTer.r <400>4 ttacgaattc tccttcctaa ttggtgtact atcatttatc aaagggga 48
<210> 5 <211 >25 <212> DNA <213> Artificial sequence <220> <223> Synthesized Plasto-443C <400> 5 gtattagtaa ttagaatttg gtgtc 25 <210> 6 <211> 44
<212> DNA <213> Artificial Sequence <220> <223> SpHa(lnd)-Plasto-r <400>6 gcaagaagaa gcactatttt ctccattttc tctcaagatg atta 44
<210>7 <211 >45 <212> DNA <213> Artificial sequence <220> <223> Plasto-SpHa.c <400>7 ttaatcatct tgagagaaaa tggagaaaat agtgcttctt cttgc 45
<210> 8 <211> 38 <212> DNA <213> Artificial sequence <220> <223> HA(lnd)-Sac.r <400>8 actttgagct cttaaatgcaaattctgcat tgtaacga 38 <210> 9 <211> 24
<212> DNA <213> Artificial sequence <220> <223> Synthesized pBinPlus.2613c <400>9 aggaagggaa gaaagcgaaa ggag 24 <210> 10
<211> 56 <212> DNA <213> Artificial sequence <220> <223> Synthesized Mut-ATG115.r <400> 10 gtgccgaagc acgatctgac aacgttgaag atcgctcacg caagaaagac aagaga 56
<210> 11 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Mut-ATG161.c gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc ga 52
<210> 12 <211 >25 <212> DNA <213> Artificial sequence <220> <223> Synthesized LC-C5-1.110r <400> 12 tctcctggag tcacagacag ggtgg 25
<210> 13 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthesized E1 H1B-E1 H51.r <400> 13 tcatagtcag cgaaatgccc tgggtaacag aggtcattgg ttggattggc ct 52
<210> 14 <211 >48 <212> DNA <213> Artificial Sequence <220> <223> Synthesized E1 H5N-E1 H1B.C <400> 14 atgacctctg ttacccaggg catttcgctg actatgagga actgaggg 48
<210> 15 <211 >48 <212> DNA <213> Artificial Sequence <220> <223> Synthesized E2 H5I-RB H1B.r <400> 15 ccaattcact tttcataatt cctgatccaa agcctctact cagtgcga 48
<210> 16 <211>51 <212> DNA <213> Artificial Sequence <220> <223> Synthesized RB H1B-E2 H51.C <400> 16 ggctttggat caggaattat gaaaagtgaa ttggaatatg gtaactgcaa c 51 <211 >48 <212> D ΝΑ <213> Artificial Sequence <220> <223> Synthesized E1 H1B-F(prime)1 H51.r <400> 17 ggctattcct tttaataggc agagcttccc gttgtgtgtc ttttccag 48
<210> 18 <211 >48 <212> DNA <213> Artificial Sequence <220> <223> Synthesized F’1 H5N-E1 H1B.C <400> 18 aacgggaagc tctgcctatt aaaaggaata gccccactac aattgggt 48
<210> 19 <211 >48 <212> DNA <213> Artificial Sequence <220> <223> Synthesized F(prime)2 H5I-E2 H1 B.r <400> 19 ggagtttgac acttggtgtt gcatttatcc attggtgcat ttgagttg 48
<210> 20 <211 >48 <212> DNA <213> Artificial Sequence <220> <223> Synthesized E2 FI1B-F(prime)2 FI51.C <400> 20 aatgcaccaa tggataaatg caacaccaag tgtcaaactc caatgggg 48
<210>21 <211 >48 <212> DNA <213> Artificial Sequence <220> <223> Synthesized E1 H5I-E1 FUNC.r <400> 21 tcttcatagt cgttgaaact ccctgggtaa catgttccat tctcagga 48
<210> 22 <211 >48 <212> DNA <220> <223> Synthesized E1 H1NC-E1 H51.C <400> 22 ctgagaatgg aacatgttac ccagggagtt tcaacgacta tgaagaac 48 <210> 23 <211>51
<212> DNA <213> Artificial Sequence <220> <223> Synthesized E2 H1NC-RB H51.r <400> 23 atttgaggtg atgattgctg agtccccttt cttgacaatt ttgtatgcat a 51 <210> 24
<211 >48 <212> DNA <213> Artificial Sequence <220> <223> Synthesized RB H5I-E2 H1NC.C <400> 24 gtcaagaaag gggactcagc aatcatcacc tcaaatgcac caatggat 48
<210> 25 <211 >43 <212> DNA <213> Artificial Sequence <220> <223> Synthesized HA-Sacl.r <400> 25 ttaacttaga gctcttagat gcatattcta cactgcaaag ace 43
<210> 26 <211 >45 <212> DNA <213> Artificial sequence <220> <223> Synthesized Apal-H1B.c <400> 26 tgtcgggccc atgaaagtaa aactactggt cctgttatgc acatt 45
<210> 27 <211 >46 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Stul-H1B.r <400> 27 aaataggcct ttagatgcat attctacact gtaaagaccc attgga 46
<210> 28 <211 >49 <212> DNA <213> Artificial Sequence <220> <223> Synthesized SpPDI-H18.c <400> 28 ttctcagatc ttcgctgaca caatatgtat aggctaccat gctaacaac 49
<210> 29 <211>47 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Sacl-H1B.r <400> 29 cttagagctc ttagatgcat attctacact gtaaagaccc attggaa 47
<210> 30 <211 >45 <212> DNA <213> Artificial sequence <220> <223> Synthesized Apal-SpPDI.c <400> 30 ttgtcgggcc catggcgaaa aacgttgcga ttttcggctt attgt 45 <210> 31 <211> 39
<212> DNA <213> Artificial Sequence <220> <223> Synthesized Apal-H5 (A-lndo).lc <400> 31 tgtcgggccc atggagaaaa tagtgcttct tcttgcaat 39 <210> 32
<211>37 <212> DNA <213> Artificial Sequence <220> <223> Synthesized H5 (A-lndo)-Stul.1707r <400> 32 aaataggcct ttaaatgcaa attctgcatt gtaacga 37
<210> 33 <211 >45 <212> DNA <213> Artificial Sequence <220> <223> Synthesized H3B-SpPDI.r <400> 33 tgtcatttcc gggaagtttt tgagcgaaga tctgagaagg aacca 45
<210> 34 <211 >45 <212> DNA <213> Artificial Sequence <220> <223> Synthesized SpPDI-H3B.c <400> 34 tctcagatct tcgctcaaaa acttcccgga aatgacaaca gcacg 45
<210> 35 <211 >44 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Stul-H3B.r <400> 35 aaaataggcc ttcaaatgca aatgttgcac ctaatgttgc cttt 44
<210> 36 <211 >45 <212> DNA <213> Artificial Sequence <220> <223> Synthesized TmD H5l-H3B.r <400> 36 atttggtaag ttcctattga cttcagctca acgcccttga tctgg 45
<210> 37 <211 >48 <212> DNA <213> Artificial Sequence <220> <223> Synthesized H3B-TmD H51.C <400> 37 tgagctgaag tcaataggaa cttaccaaat actgtcaatt tattcaac 48 <210> 38 <211> 50 <212> D ΝΑ <213> Artificial sequence <220> <223> Synthesized HBF-SpPDI.r <400> 38 gttattccag tgcagattcg atcagcgaag atctgagaag gaaccaacac 50
<210> 39 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthesized SpPDI-HBF.c <400> 39 cagatcttcg ctgatcgaat ctgcactgga ataacatctt caaactcacc 50
<210> 40 <211 >46 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Stul-FIBF.r <400> 40 aaaataggcc tttatagaca gatggagcat gaaacgttgt ctctgg 46
<210> 41 <211 >45 <212> DNA <213> Artificial sequence <220> <223> Synthesized TmD H5I-B Flo.r <400> 41 tgacagtatt tggtagttat ccaatccatc atcatttaaa gatgc 45
<210> 42 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthesized B Flo-TmD FI51.C <400> 42 ggattggata actaccaaat actgtcaatt tattcaacag tggcgagttc 50
<210> 43 <211 >20 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Hsp-40Luz.1c <400> 43 atgtttgggc gcggaccaac 20
<210> 44 <211>31 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Hsp40Luz-Sacl.1272r <400> 44 agctgagctc ctactgttga gcgcattgca c 31
<210> 45 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Hsp40Luz-Plasto.r <400> 45 gttggtccgc gcccaaacat tttctctcaa gatgat 36
<210> 46 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Hsp70Ara.1c <400> 46 atgtcgggta aaggagaagg a 21
<210>47 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Hsp70Ara-Sacl.1956r <400> 47 agctgagctc ttagtcgacc tcctcgatct tag 33
<210> 48 <211>37 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Hsp70Ara-Plasto.r <400> 48 tccttctcct ttacccgaca ttttctctca agatgat 37
<210> 49 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Synthesized supP19-plasto.r <400> 49 ccttgtatag ctcgttccat tttctctcaa gatg 34 <210> 50
<211 >20 <212> DNA <213> Artificial Sequence <220> <223> Synthesized supP19-1c <400> 50 atggaacgag ctatacaagg 20
<210> 51 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthesized SupP19-Sacl.r <400> 51 agtcgagctc ttactcgctt tctttttcga ag 32
<210> 52 <211 > 1719 <212> DNA <213> Artificial Sequence <220> <223> Synthesized B-Plasto-Native SP-H5 A/lndonesia/5/05 <400> 52 aagcttatgg agaaaatagt gcttcttctt gcaatagtca gtcttgttaa aagtgatcag 60 atttgcattg gttaccatgc aaacaattca acagagcagg ttgacacaat catggaaaag 120 aacgttactg ttacacatgc ccaagacata ctggaaaaga cacacaacgg gaagctctgc 180 gatctagatg gagtgaagcc tctaatttta agagattgta gtgtagctgg atggctcctc 240 gggaacccaa tgtgtgacga attcatcaat gtaccggaat ggtcttacat agtggagaag 300 gccaatccaa ccaatgacct ctgttaccca gggagtttca acgactatga agaactgaaa 360 cacctattga gcagaataaa ccattttgag aaaattcaaa tcatccccaa aagttcttgg 420 tccgatcatg aagcctcatc aggagttagc tcagcatgtc catacctggg aagtccctcc 480 ttttttagaa atgtggtatg gcttatcaaa aagaacagta catacccaac aataaagaaa 540 agctacaata ataccaacca agaggatctt ttggtactgt ggggaattca ccatcctaat 600 gatgcggcag agcagacaag gctatatcaa aacccaacca cctatatttc cattgggaca 660 tcaacactaa accagagatt ggtaccaaaa atagctacta gatccaaagt aaacgggcaa 720 agtggaagga tggagttctt ctggacaatt ttaaaaccta atgatgcaat caacttcgag 780 agtaatggaa atttcattgc tccagaatat gcatacaaaa ttgtcaagaa aggggactca 840 gcaattatga aaagtgaatt ggaatatggt aactgcaaca ccaagtgtca aactccaatg 900 ggggcgataa actctagtat gccattccac aacatacacc ctctcaccat cggggaatgc 960 cccaaatatg tgaaatcaaa cagattagtc cttgcaacag ggctcagaaa tagccctcaa 1020 agagagagca gaagaaaaaa gagaggacta tttggagcta tagcaggttt tatagaggga 1080 ggatggcagg gaatggtaga tggttggtat gggtaccacc atagcaatga gcaggggagt 1140 gggtacgctg cagacaaaga atccactcaa aaggcaatag atggagtcac caataaggtc 1200 aactcaatca ttgacaaaat gaacactcag tttgaggccg ttggaaggga atttaataac 1260 ttagaaagga gaatagagaa tttaaacaag aagatggaag acgggtttct agatgtctgg 1320 acttataatg ccgaacttct ggttctcatg gaaaatgaga gaactctaga ctttcatgac 1380 tcaaatgtta agaacctcta cgacaaggtc cgactacagc ttagggataa tgcaaaggag 1440 ctgggtaacg gttgtttcga gttctatcac aaatgtgata atgaatgtat ggaaagtata 1500 agaaacggaa cgtacaacta tccgcagtat tcagaagaag caagattaaa aagagaggaa 1560 ataagtgggg taaaattgga atcaatagga acttaccaaa tactgtcaat ttattcaaca 1620 gtggcgagtt ccctagcact ggcaatcatg atggctggtc tatctttatg gatgtgctcc 1680 aatggatcgt tacaatgcag aatttgcatt taagagctc 1719 <210> 53
<211> 3194 <212> DNA <213> Artificial Sequence <220> <223> Synthesized 6G0 expression cassette from Hindill to Eco-Rl <400> 53 aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60 tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120 tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180 taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240 catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300 aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360 accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420 aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480 caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540 dacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600 aatttggtgt caaatttaat ttqacatttg atcttttcct atatattgcc ccatagagtc 660 agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720 ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 7 80 tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840 ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900 tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960 tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020 ttaatcatct tgagagaaaa tggagaaaat agtgcttctt cttgcaatag tcagtcttgt 1080 taaaagtgat cagatttgca ttggttacca tgcaaacaat tcaacagagc aggttgacac 1140 aatcatggaa aagaacgtta ctgttacaca tgcccaagac atactggaaa agacacacaa 1200 cgggaagctc tgcgatctag atggagtgaa gcctctaatt ttaagagatt gtagtgtagc 1260 tggatggctc ctcgggaacc caatgtgtga cgaattcatc aatgtaccgg aatggtctta 1320 catagtggag aaggccaatc caaccaatga cctctgttac ccagggagtt tcaacgacta 1380 tgaagaactg aaacacctat tgagcagaat aaaccatttt gagaaaattc aaatcatccc 1440 caaaagttct tggtccgatc atgaagcctc atcaggagtt agctcagcat gtccatacct 1500 gggaagtccc tccttttt:ta gaaatgtggt atggcttatc aaaaagaaca gtacataccc 1560 aacaataaag aaaagctaca ataataccaa ccaagaggat cttttggtac tgtggggaat 1620 tcaccatcct aatgatgcgg cagagcagac aaggctatat caaaacccaa ccacctatat 1680 ttccattggg acatcaacac taaaccagag attggtacca aaaatagcta ctagatccaa 1740 agtaaacggg caaagtggaa ggatggagtt cttctggaca attttaaaac ctaatgatgc 1800 aatcaacttc gagagtaatg gaaatttcat tgctccagaa tatgcataca aaattgtcaa 1860 gaaaggggac tcagcaatta tgaaaagtga attggaatat ggtaactgca acaccaagtg 1920 tcaaactcca atgggggcga taaactctag tatgccattc cacaacatac accctctcac 1980 catcggggaa tgccccaaat atgtgaaatc aaacagatta gtccttgcaa cagggctcag 2040 aaatagccct caaagagaga gcagaagaaa aaagagagga ctatttggag ctatagcagg 2100 ttttatagag ggaggatggc agggaatggt agatggttgg tatgggtacc accatagcaa 2160 tgagcagggg agtgggtacg ctgcagacaa agaatccact caaaaggcaa tagatggagt 2220 caccaataag gtcaactcaa tcattgacaa aatgaacact cagtttgagg ccgttggaag 2280 gaatttaaac aagaagatgg aagacgggtt 2340 ggaatttaat aacttagaaa ggagaataga tctagatgtc tggacttata atgccgaact tctggttctc atggaaaatg agagaactct 2400 agactttcat gactcaaatg ttaagaacct ctacgacaag gtccgactac agcttaggga 2460 taatgcaaag gagctgggta acggttgttt cgagttctat cacaaatgtg ataatgaatg 2520 tatggaaagt ataagaaacg gaacgtacaa ctatccgcag tattcagaag aagcaagatt 2580 aaaaagagag gaaataagtg gggtaaaatt ggaatcaata ggaacttacc aaatactgtc 2640 aatttattca acagtggcga gttccctagc actggcaatc atgatggctg gtctatcttt 2700 atggatgtgc tccaatggat cgttacaatg cagaatttgc atttaagagc tctaagttaa 2760 aatgcttctt cgtctcctat ttataatatg gtttgttatt gttaattttg ttcttgtaga 2820 agagcttaat taatcgttgt tgttatgaaa tactatttgt atgagatgaa ctggtgtaat 2880 gtaattcatt tacataagtg gagtcagaat cagaatgttt cctccataac taactagaca 2940 tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac taaaattgaa catcttttgc 3000 cacaacttta taagtggtta atatagctca aatatatggt caagttcaat agattaataa 3060 tggaaatatc agttatcgaa attcattaac aatcaactta acgttattaa ctactaattt 3120 tatatcatcc cctttgataa atgatagtac accaattagg aaggagcatg ctcgaggcct 3180 ggctggccga attc 3194
<210> 54 <211>1711 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Wld-type Hl/NC coding sequence lacking Tm D and Ctail <400> 54 atgaaagcaa aactactggt cctgttatgt acatttacag ctacatatgc agacacaata 60 tgtataggct accatgccaa caactcaacc gacactgttg acacagtact tgagaagaat 120 gtgacagtga cacactctgt caacctactt gaggacagtc acaatggaaa actatgtcta 180 ctaaaaggaa tagccccact acaattgggt aattgcagcg ttgccggatg gatcttagga 240 aacccagaat gcgaattact gatttccaag gaatcatggt cctacattgt agaaacacca 300 aatcctgaga atggaacatg ttacccaggg tatttcgccg actatgagga actgagggag 360 caattgagtt cagtatcttc atttgagaga ttcgaaatat tccccaaaga aagctcatgg 420 cccaaccaca ccgtaaccgg agtatcagca tcatgctccc ataatgggaa aagcagtttt 480 tacagaaatt tgctatggct gacggggaag aatggtttgt acccaaacct gagcaagtcc 540 tatgtaaaca acaaagagaa agaagtcctt gtactatggg gtgttcatca cccgcctaac 600 atagggaacc aaagggccct ctatcataca gaaaatgctt atgtctctgt agtgtcttca 660 cattatagca gaagattcac cccagaaata gccaaaagac ccaaagtaag agatcaggaa 720 ggaagaatca actactactg gactctgctg gaacctgggg atacaataat atttgaggca 780 aatggaaatc taatagcgcc atggtatgct tttgcactga gtagaggctt tggatcagga 840 atcatcacct caaatgcacc aatggatgaa tgtgatgcga agtgtcaaac acctcaggga 900 gctataaaca gcagtcttcc tttccagaat gtacacccag tcacaatagg agagtgtcca 960 aagtatgtca ggagtgcaaa attaaggatg gttacaggac taaggaacat cccatccatt 1020 caatccagag gtttgtttgg agccattgcc ggtttcattg aaggggggtg gactggaatg 1080 gtagatgggt ggtatggtta tcatcatcag aatgagcaag gatctggcta tgctgcagat 1140 caaaaaagta cacaaaatgc cattaacggg attacaaaca aggtgaattc tgtaattgag 1200 aaaatgaaca ctcaattcac agctgtgggc aaagaattca acaaattgga aagaaggatg 1260 gaaaacttaa ataaaaaagt tgatgatggg tttctagaca tttggacata taatgcagaa 1320 ttgttggttc tactggaaaa tgaaaggact ttggatttcc atgactccaa tgtgaagaat 1380 ctgtatgaga aagtaaaaag ccaattaaag aataatgcca aagaaatagg aaacgggtgt 1440 tttgaattct atcacaagtg taacaatgaa tgcatggaga gtgtgaaaaa tggaacttat 1500 gactatccaa aatattccga agaatcaaag ttaaacaggg agaaaattga tggagtgaaa 1560 ttggaatcaa tgggagtcta tcagattctg gcgatctact caactgtcgc cagttccctg 1620 gttcttttgg tctccctggg ggcaatcagc ttctggatgt gttccaatgg gtctttgcag 1680 tgtagaatat gcatctgaga ccagaatttc a 1711
<210> 55 <211> 1556 <Z1Z> DNA <Z13> Artificial Sequence <2Z0> <ZZ3> Synthesized Bglll-Hl A/NewCaledonla/20/99-Sacl/Stul. <400>55 agatcttcgc tgacacaata tgtataggct accatgccaa caactcaacc gacactgttg 60 acacagtact tgagaagaat gtgacagtga cacactctgt caacctactt gaggacagtc 120 acaatggaaa actatgtcta ctaaaaggaa tagccccact acaattgggt aattgcagcg 180 ttgccggatg gatcttagga aacccagaat gcgaattact gatttccaag gaatcatggt 240 cctacattgt agaaacacca aatcctgaga atggaacatg ttacccaggg tatttcgccg 300 actatgagga actgagggag caattgagtt cagtatcttc atttgagaga ttcgaaatat 360 tccccaaaga aagctcatgg cccaaccaca ccgtaaccgg agtatcagca tcatgctccc 420 ataatgggaa aagcagtttt tacagaaatt tgctatggct gacggggaag aatggtttgt 480 acccaaacct gagcaagtcc tatgtaaaca acaaagagaa agaagtcctt gtactatggg 540 gtgttcatca cccgcctaac atagggaacc aaagggcact ctatcataca gaaaatgctt 600 atgtctctgt agtgtcttca cattatagca gaagattcac cccagaaata gccaaaagac 660 ccaaagtaag agatcaggaa ggaagaatca actactactg gactctgctg gaacctgggg 720 atacaataat atttgaggca aatggaaatc taatagcgcc atggtatgct tttgcactga 780 gtagaggctt tggatcagga atcatcacct caaatgcacc aatggatgaa tgtgatgcga 840 agtgtcaaac acctcaggga gctataaaca gcagtcttcc tttccagaat gtacacccag 900 tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa attaaggatg gttacaggac 960 taaggaacat cccatccatt caatccagag gtttgtttgg agccattgcc ggtttcattg 1020 aaggggggtg gactggaatg gtagatgggt ggtatggtta tcatcatcag aatgagcaag 1080 gatctggcta tgctgcagat caaaaaagta cacaaaatgc cattaacggg attacaaaca 1140 aggtcaattc tgtaattgag aaaatgaaca ctcaattcac agctgtgggc aaagagttca 1200 acaaattgga aagaaggatg gaaaacttaa ataaaaaagt tgatgatggg tttctagaca 1260 tttggacata taatgcagaa ttgttggttc tactggaaaa tgaaaggact ttggatttcc 1320 atgactccaa tgtgaagaat ctgtatgaga aagtaaaaag ccaattaaag aataatgcca 1380 aagaaatagg aaacgggtgt tttgagttct atcacaagtg taacaatgaa tgcatggaga 1440 gtgtgaaaaa tggtacctat gactatccaa aatattccga agaatcaaag ttaaacaggg 1500 agaaaattga tggagtgaaa ttggaatcaa tgggagtata ctaagagctc aggcct 1556
<210» 56 <211>219 <212> DNA <213> Artificial Sequence <220» <223> Synthesized Kpnl-Hl A/NewCaledonia/20/99 TmD+Ctail-Sad/Stul. <400» 56 ggtacctatg actatccaaa atattccgaa gaatcaaagt taaacaggga gaaaattgat 60 ggagtgaaat tggaatcaat gggagtatac cagattctgg cgatctactc aactgtcgcc 120 agttccctgg ttcttttggt ctccctgggg gcaatcagct tctggatgtg ttccaatggg 180 tctttgcagt gtagaatatg catctaagag ctcaggcct 219
<210> 57 <211>1781 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Signal peptide of alfalfa protein disulfide isomerase (POI) gene <400> 57 ccaaatcctt aacattcttt caacaccaac aatggcgaaa aacgttgcga ttttcggttt 60 attgttttct cttcttctgt tggttccttc tcagatcttc gctgaggaat catcaactga 120 cgctaaggaa tttgttctta cattggataa cactaatttc catgacactg ttaagaagca 180 cgatttcatc gtcgttgaat tctacgcacc ttggtgtgga cactgtaaga agctagcccc 240 agagtatgag aaggctgctt ctatcttgag cactcacgag ccaccagttg ttttggctaa 300 agttgatgcc aatgaggagc acaacaaaga cctcgcatcg gaaaatgatg ttaagggatt 360 cccaaccatt aagattttta ggaatggtgg aaagaacatt caagaataca aaggtccccg 420 tgaagctgaa ggtattgttg agtatttgaa aaaacaaagt ggccctgcat ccacagaaat 480 taaatctgct gatgatgcga ccgcttttgt tggtgacaac aaagttgtta ttgtcggagt 540 tttccctaaa ttttctggtg aggagtacga taacttcatt gcattagcag agaagttgcg 600 ttctgactat gactttgctc acactttgaa tgccaaacac cttccaaagg gagactcatc 660 agtgtctggg cctgtggtta ggttatttaa gccatttgac gagctctttg ttgactcaaa 720 ggatttcaat gtagaagctc tagagaaatt cattgaagaa tccagtaccc caattgtgac 780 tgtcttcaac aatgagccta gcaatcaccc ttttgttgtc aaattcttta actctcccaa 840 cgcaaaggct atgttgttca tcaactttac taccgaaggt gctgaatctt tcaaaacaaa 900 ataccatgaa gtggctgagc aatacaaaca acagggagtt agctttcttg ttggagatgt 960 tgagtctagt caaggtgcct tccagtattt tggactgaag gaagaacaag tacctctaat 1020 tattattcag cataatgatg gcaagaagtt tttcaaaccc aatttggaac ttgatcaact 1080 cccaacttgg ttgaaggcat acaaggatgg caaggttgaa ccatttgtca agtctgaacc 1140 tattcctgaa actaacaacg agcctgttaa agtggtggtt gggcaaactc ttgaggacgt 1200 tgttttcaag tctgggaaga atgttttgat agagttttat gctccttggt gtggtcactg 1260 caagcagttg gctccaatct tggatgaagt tgctgtctca ttccaaagcg atgctgatgt 1320 tgttattgca aaactggatg caactgccaa cgatatccca accgacacct ttgatgtcca 1380 aggctatcca accttgtact tcaggtcagc aagtggaaaa ctatcacaat acgacggtgg 1440 taggacaaag gaagacatca tagaattcat tgaaaagaac aaggataaaa ctggtgctgc 1500 tcatcaagaa gtagaacaac caaaagctgc tgctcagcca gaagcagaac aaccaaaaga 1560 tgagctttga aaagttccgc ttggaggata tcggcacaca gtcatctgcg ggctttacaa 1620 ctcttttgta tctcagaatc agaagttagg aaatcttagt gccaatctat ctatttttgc 1680 gtttcatttt atctttttgg tttactctaa tgtattactg aataatgtga gttttggcgg 1740 agtttagtac tggaactttt gtttctgtaa aaaaaaaaaa a 1781
<210> 58 <211> 1457 <212> DNA <213> Artificial Sequence <220> <223> Synthesized PromPlasto-PDISP-Plasto 3(prime)UTR plasmid sequence <400> 58 ctggtatatt tatatgttgt caaataactc aaaaaccata aaagtttaag ttagcaagtg 60 tgtacatttt tacttgaaca aaaatattca cctactactg ttataaatca ttattaaaca 120 ttagagtaaa gaaatatgga tgataagaac aagagtagtg atattttgac aacaattttg 180 ttgcaacatt tgagaaaatt ttgttgttct ctcttttcat tggtcaaaaa caatagagag 240 agaaaaagga agagggagaa taaaaacata atgtgagtat gagagagaaa gttgtacaaa 300 agttgtacca aaatagttgt acaaatatca ttgaggaatt tgacaaaagc tacacaaata 360 agggttaatt gctgtaaata aataaggatg acgcattaga gagatgtacc attagagaat 420 ttttggcaag tcattaaaaa gaaagaataa attattttta aaattaaaag ttgagtcatt 480 tgattaaaca tgtgattatt taatgaattg atgaaagagt tggattaaag ttgtattagt 540 aattagaatt tggtgtcaaa tttaatttga catttgatct tttcctatat attgccccat 600 agagtcagtt aactcatttt tatatttcat agatcaaata agagaaataa cggtatatta 660 atccctccaa aaaaaaaaaa cggtatattt actaaaaaat ctaagccacg taggaggata 720 acaggatccc cgtaggagga taacatccaa tccaaccaat cacaacaatc ctgatgagat 780 aacccacttt aagcccacgc atctgtggca catctacatt atctaaatca cacattcttc 840 cacacatctg agccacacaa aaaccaatcc acatctttat cacccattct ataaaaaatc 900 acactttgtg agtctacact ttgattccct tcaaacacat acaaagagaa gagactaatt 960 aattaattaa tcatcttgag agaaaatggc gaaaaacgtt gcgattttcg gcttattgtt 1020 ttctcttctt gtgttggttc cttctcagat ctgagctcta agttaaaatg cttcttcgtc 1080 tcctatttat aatatggttt gttattgtta attttgttct tgtagaagag cttaattaat 1140 cgttgttgtt atgaaatact atttgtatga gatgaactgg tgtaatgtaa ttcatttaca 1200 taagtggagt cagaatcaga atgtttcctc cataactaac tagacatgaa gacctgccgc 1260 gtacaattgt cttatatttg aacaactaaa attgaacatc ttttgccaca actttataag 1320 tggttaatat agctcaaata tatggtcaag ttcaatagat taataatgga aatatcagtt 1380 atcgaaattc attaacaatc aacttaacgt tattaactac taattttata tcatcccctt 1440 tgataaatga tagtaca 1457
<Z10> 59 <211>3206 <212> DNA <213> Artificial Saquanca <Z20>
<2Z3> Synthesized 540 expression cassette from Hindi II <400> 59 aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60 tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120 tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180 taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240 catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300 aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360 accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420 aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480 caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540 aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600 aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660 agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720 ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780 tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840 ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900 tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960 tgtgagtcta cactttgatt cccttcaaao acatacaaag agaagagact aattaattaa 1020 ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1080 tcttgtgttg gttccttctc agatcttcgc tgacacaata tgtataggct accatgccaa 1140 caactcaacc gacactgttg acacagtact tgagaagaat gtgacagtga cacactctgt 1200 caacctactt gaggacagtc acaatggaaa actatgtcta ctaaaaggaa tagccccact 1260 acaattgggt aattgcagcg ttgccggatg gatcttagga aacccagaat gcgaattact 1320 gatttccaag gaatcatggt cctacattgt agaaacacca aatcctgaga atggaacatg 1380 ttacccaggg tatttcgccg actatgagga actgagggag caattgagtt cagtatcttc 1440 atttgagaga ttcgaaatat tcacaaaaga aagctcatgg cccaaccaca ccgtaaccgg 1500 agtatcagca tcatgctccc ataatgggaa aagcagtttt tacagaaatt tgctatggct 1560 gacggggaag aatggtttgt acccaaacct gagcaagtcc tatgtaaaca acaaagagaa 1620 agaagtcctt gtactatggg gtgttcatca cccgcctaac atagggaacc aaagggcact 1680 ctatcataca gaaaatgctt atgtctctgt agtgtcttca cattatagca gaagattcac 1740 cccagaaata gccaaaaqac ccaaagtaag agatcaggaa ggaagaatca actactactg 1800 gactctgctg gaacctgggg atacaataat atttgaggca aatggaaatc taatagcgcc 1860 atggtatgct tttgcactga gtagaggctt tggatcagga atcatcacct caaatgcacc 1920 aatgqatgaa tgtgatgcga agtgtcaaac acctcaggga gctataaaca gcagtcttcc 1980 tttccagaat gtacacccag tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa 2040 attaaggatg gttacaggac taaggaacat cccatccatt caatccagag gtttgtttgg 2100 agccattgcc ggtttcattq aaggggggtg gactggaatq gtagatgggt ggtatggtta 2160 tcatcatcag aatgagcaag gatctggcta tgctgcagat caaaaaagta cacaaaatgc 2220 cattaacggg attacaaaca aggtcaattc tgtaattgag aaaatgaaca ctcaattcac 2280 agctgtgggc aaagagttca acaaattgga aagaaggatg gaaaacttaa ataaaaaagt 2340 tgatgatggg tttctagaca tttggacata taatgcagaa ttgttggttc tactggaaaa 2400 tgaaaggact ttggatttcc atgactccaa tgtgaagaat ctgtatgaga aagtaaaaag 2460 ccaattaaag aataatgcca aagaaatagg aaacgggtgt tttgagttct atcacaagtg 2520 taacaatgaa tgcatggaga gtgtgaaaaa tggtacctat gactatccaa aatattccga 2580 agaatcaaag ttaaacaggg agaaaattga tggagtgaaa ttggaatcaa tgggagtata 2640 ccagattctg gcgatcta::::t caactgtcgc cagttccctg gttcttttgg tctccctggg 2700 ggcaatcagc ttctggatgt gttccaatgg gtctttgcag tgtagaatat gcatctaaga 2760 gctctaagtt aaaatgcttc ttcgtctcct atttataata tggtttgtta ttgttaattt 2820 tgttcttgta gaagagctta attaatcgtt gttgttatga aatactattt gtatgagatg 2880 aactggtgta atgtaattca tttacataag tggagtcaga atcagaatgt ttcctccata 2940 actaactag2 catgaagacc tgccgcgtac aattgtctta tatttgaaca actaaaattg 3000 aacatctttt gccacaactt tataagtggt taatatagct caaatatatg gtcaagttca 3060 atagattaat aatggaaata tcagttatcg aaattcatta acaatcaact taacgttatt 3120 aactactaat tttatatcat cccctttgat aaatgatagt acaccaatta ggaaggagca 3180 tgctcgaggc ctggctggcc gaattc 3206
<210> 60 <211>1788 <212> DNA <213> Artificial Sequence <220> <223> Synthesized fragment Oralll-Plasto(-84+ 1 )-H 1 A/Brisbane/59/07-Sacl. <400> 60 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatgaaa gtaaaactac tggtcctgtt atgcacattt 120 aatatgtata ggctaccatg ctaacaactc gaccgacact 180 acagctacat atgcagacac gttgacacag tacttgaaaa gaatgtgaca gtgacacact ctgtcaacct gcttgagaac 240 agtcacaatg gaaaactatg tctattaaaa ggaatagccc cactacaatt gggtaattgc 300 agcgttgccg ggtggatctt aggaaaccca gaatgcgaat tactgatttc caaggagtca 360 tggtcctaca ttgtagaaaa accaaatcct gagaatggaa catgttaccc agggcatttc 420 gctgactatg aggaactgag ggagcaattg agttcagtat cttcatttga gaggttcgaa 480 atattcccca aagaaagctc atggcccaac cacaccgtaa ccggagtgtc agcatcatgc 540 tcccataatg gggaaagcag tttttacaga aatttgctat ggctgacggg gaagaatggt 600 ttgtacccaa acctgagcaa gtcctatgca aacaacaaag aaaaagaagt ccttgtacta 660 tggggtgttc atcacccgcc aaacataggt gaccaaaagg ccctctatca tacagaaaat 720 gcttatgtct ctgtagtgtc ttcacattat agcagaaaat tcaccccaga aatagccaaa 780 agacccaaag taagagatca agaaggaaga atcaattact actggactct gcttgaaccc 840 ggggatacaa taatatttga ggcaaatgga aatctaatag cgccaagata tgctttcgca 900 ctgagtagag gctttggatc aggaatcatc aactcaaatg caccaatgga taaatgtgat 960 gcgaagtgcc aaacacctca gggagctata aacagcagtc ttcctttcca gaacgtacac 1020 ccagtcacaa taggagagtg tccaaagtat gtcaggagtg caaaattaag gatggttaca 1080 ggactaagga acatcccatc cattcaatcc agaggtttgt ttggagccat tgccggtttc 1140 attgaagggg ggtggactgg aatggtagat ggttggtatg gttatcatca tcagaatgag 1200 caaggatctg gctatgctgc agatcaaaaa agcacacaaa atgccattaa tgggattaca 1260 aacaaggtca attctgtaat tgagaaaatg aacactcaat tcacagcagt gggcaaagag 1320 ttcaacaaat tggaaagaag gatggaaaac ttgaataaaa aagttgatga tgggtttata 1380 gacatttgga catataatgc agaactgttg gttctactgg aaaatgaaag gactttggat 1440 ttccatgact ccaatgtgaa gaatctgtat gagaaagtaa aaagccagtt aaagaataat 1500 gctaaagaaa taggaaatgg gtgttttgag ttctatcaca agtgtaacga tgaatgcatg 1560 agagtgtaa agaatggaac ttatgactat ccaaaatatt ccgaagaatc aaagttaaac 1620 agggagaaaa ttgatggagt gaaattggaa tcaatgggag tctatcagat tctggcgatc 1680 tactcaacag tcgccagttc tctggttctt ttggtctccc tgggggcaat cagcttctgg 1740 atgtgttcca atgggtcttt acagtgtaga atatgcatct aagagctc 1788
<210>61 <211> 3185 <212> DMA <213> Artificial Sequence <220> <223> Synthesized 774 expression cassette from Hindi II <400> 61 aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60 tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120 tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180 taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240 catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300 aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360 accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420 aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480 caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540 aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600 aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660 agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720 ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780 tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840 ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900 tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960 tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020 ttaatcatct tgagagaaaa tgaaagtaaa actactggtc ctgttatgca catttacagc 1080 tacatatgca gacacaatat gtataggcta ccatgctaac aactcgaccg acactgttga 1140 cacagtactt gaaaagaatg tgacagtgac acactctgtc aacctgcttg agaacagtca 1200 caatggaaaa ctatgtctat taaaaggaat agccccacta caattgggta attgcagcgt 1260 tgccgggtgg atcttaggaa acccagaatg cgaattactg atttccaagg agtcatggtc 1320 ctacattgta gaaaaaccaa atcctgagaa tggaacatgt tacccagggc atttcgctga 1380 ctatgaggaa ctgagggagc aattgagttc agtatcttca tttgagaggt tcgaaatatt 1440 ccccaaagaa agctcatggc ccaaccacac cgtaaccgga gtgtcagcat catgetceca 1500 taatggggaa agcagttttt acagaaattt gctatggctg acggggaaga atggtttgta 1560 cccaaacctg agcaagtcct atgcaaacaa caaagaaaaa gaagtccttg tactatgggg 1620 tgttcatcac ccgccaaaca taggtgacca aaaggccctc tatcatacag aaaatgctta 1680 tgtctctgta gtgtcttcac attatagcag aaaattcacc ccagaaatag ccaaaagacc 1740 caaagtaaga gatcaagaag gaagaatcaa ttactactgg actctgcttg aacccgggga 1800 tacaataata tttgaggcaa atggaaatct aatagcgcca agatatgctt tcgcactgag 1860 tagaggcttt ggatcaggaa tcatcaactc aaatgcacca atggataaat gtgatgcgaa 1920 gtgccaaaca cctcagggag ctataaacag cagtcttcct ttccagaacg tacacccagt 1980 cacaatagga gagtgtccaa agtatgtcag gagtgcaaaa ttaaggatgg ttacaggact 2040 aaggaacatc ccatccattc aatccagagg tttgtttgga gccattgccg gtttcattga 2100 aggggggtgg actggaatgg tagatggttg gtatggttat catcatcaga atgagcaagg 2160 atctggctat gctgcagatc aaaaaagcac acaaaatgcc attaatggga ttacaaacaa 2220 ggtcaattct gtaattgaga aaatgaacac tcaattcaca gcagtgggca aagagttcaa 2280 caaattggaa agaaggatgg aaaacttgaa taaaaaagtt gatgatgggt ttatagacat 2340 ttggacatat aatgcagaac tgttggttct actggaaaat gaaaggactt tggatttcca 2400 tgactccaat gtgaagaatc tgtatgagaa agtaaaaagc cagttaaaga ataatgctaa 2460 agaaatagga aatgggtgtt ttgagttcta tcacaagtgt aacgatgaat gcatggagag 2520 tgtaaagaat ggaacttatg actatccaaa atattccgaa gaatcaaagt taaacaggga 2580 gaaaattgat ggagtgaaat tggaatcaat gggagtctat cagattctgg cgatctactc 2640 aacagtcgcc agttctctgg ttcttttggt ctccctgggg gcaatcagct tctggatgtg 2700 ttccaatggg tctttacagt gtagaatatg catctaagag ctctaagtta aaatgcttct 2760 tcqtctccta tttataatat ggtttqttat tgttaatttt gttcttgtag aagagcttaa 2820 ttaatcgttg ttgttatgaa atactatttg tatgagatga actggtgtaa tgtaattcat 2880 ttacataagt ggagtcagaa tcagaatgtt tcctccataa ctaactagac atgaagacct 2940 gccgcgtaca attgtcttat atttgaacaa ctaaaattga acatcttttg ccacaacttt 3000 ataagtggtt aatatagctc aaatatatgg tcaagttcaa tagattaata atggaaatat 3060 cagttatcqa aattcattaa caatcaactt aacgttatta actactaatt ttatatcatc 3120 ccctttgata aatgatagta caccaattag gaaggagcat gctcgaggcc tggctggccg aattc 55
<210> 62 <211> 2065 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Expression cassette number 828, from Pad to Asel <400> 62 3180 3185 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 ataaaggaaa cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat ggttttcaca cctcagatac ttggacttat gcttttttgg 900 atttcagcct ccagaggtga tattgtgcta actcagtctc cagccaccct gtctgtgact 960 ccaggagata gtgtcagtct ttcctgcagg gccagccaaa gtattagcaa caacctacac 1020 tggtttcaac aaaaatcgca tgagtctcca aggcttctca tcaagtatgc ttcccagtcc 1080 atatctggga tcccctccag gttcagtggc agtggatctg ggacagattt cactctcagt 1140 atcaacagtg tgaagactga agattttgga atgtttttct gtcaacagag taacagctgg 1200 cctctcacgt tcggtgatgg gacaaagctg gagctgaaac gggctgatgc tgcaccaact 1260 gtatccatct tcccaccatc cagtgagcag ttaacatctg gaggtgcctc agtcgtgtgc 1320 ttcttgaaca acttctaccc caaagacatc aatgtcaagt ggaagattga tggcagtgaa 1380 cgacaaaatg gcgtcctgaa cagttggact gatcaggaca gcaaagacag cacctacagc 1440 atgagcagca ccctcacgtt gaccaaggac gagtatgaac gacataacag ctatacctgt 1500 gaggccactc acaagacatc aacttcaccc attgtcaaga gcttcaacag gaatgagtgt 1560 tagaggccta ttttctttag tttgaattta ctgttattcg gtgtgcattt ctatgtttgg 1620 tgagcggttt tctgtgctca gagtgtgttt attttatgta atttaatttc tttgtgagct 1680 cctgtttagc aggtcgtccc ttcagcaagg acacaaaaag attttaattt tattaaaaaa 1740 aaaaaaaaaa aagaccggga attcgatatc aagcttatcg acctgcagat cgttcaaaca 1800 tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg attatcatat 1860 aatttctgtt gaattacgtt aagcatgtaa taattaacat gtaatgcatg acgttattta 1920 tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg atagaaaaca 1980 aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg ttactagatt 2040 ctagagtctc aagcttcggc gcgcc 2065
<210> 63 <211>3194 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct number 690, from Hindi·· to EcoRI <400> 63 aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60 tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120 tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180 taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240 catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300 aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360 accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420 aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480 caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540 aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600 aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660 agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720 ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780 tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840 ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900 tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960 tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020 ttaatcatct tgagagaaaa tggagaaaat agtgcttctt cttgcaatag tcagtcttgt 1080 taaaagtgat cagatttgca ttggttacca tgcaaacaat tcaacagagc aggttgacac 1140 aatcatggaa aagaacgtta ctgttacaca tgcccaagac atactggaaa agacacacaa 1200 cgggaagctc tgcgatctag atggagtgaa gcctctaatt ttaagagatt gtagtgtagc 1260 tggatggctc ctcgggaacc caatgtgtga cgaattcatc aatgtaccgg aatggtctta 1320 catagtggag aaggccaatc caaccaatga cctctgttac ccagggcatt tcgctgacta 1380 tgaggaactg agggagcaat tgagttcagt atctt:cattt gagaggttcg aaatattccc 1440 caaagaaagc tcatggccca accacaccgt aaccggagtg tcagcatcat gctcccataa 1500 tggggaaagc agtttttaca gaaatttgct atggctgacg gggaagaatg gtttgtaccc 1560 aaacctgagc aagtcctatg caaacaacaa agaaaaagaa gtccttgtac tatggggtgt 1620 tcatcacccg ccaaacatag gtgaccaaaa ggccctctat catacagaaa atgcttatgt 1680 ctctgtagtg tcttcacatt atagcagaaa attcacccca gaaatagcca aaagacccaa 1740 agtaagagat caagaaggaa gaatcaatta ctactggact ctgcttgaac ccggggatac 1800 aataatattt gaggcaaatg gaaatctaat agcgccaaga tatgctttcg cactgagtag 1860 aggctttgga tcaggaatta tgaaaagtga attggaatat ggtaactgca acaccaagtg 1920 tcaaactcca atgggggcga taaactctag tatgccattc cacaacatac accctctcac 1980 catcggggaa tgccccaaat atgtgaaatc aaacagatta gtccttgcaa cagggctcag 2040 aaatagccct caaagagaga gcagaagaaa aaagagagga ctatttggag ctatagcagg 2100 ttttatagag ggaggatggc agggaatggt agatggttgg tatgggtacc accatagcaa 2160 tgagcagggg agtgggtacg ctgcagacaa agaatccact caaaaggcaa tagatggagt 2220 caccaataag gtcaactcaa tcattgacaa aatgaacact cagtttgagg ccgttggaag 2280 ggaatttaat aacttagaaa ggagaataga gaatttaaac aagaagatgg aagacgggtt 2340 tctagatgtc tggacttata atgecgaact tctggttcte atggaaaatg agagaactct 2400 agactttcat gactcaaatg ttaagaacct ctacgacaag gtccgactac agcttaggga 2460 taatgcaaag gagctgggta acggttgttt cgagttctat cacaaatgtg ataatgaatg 2520 tatggaaagt a.taagaaacg gaacgtacaa ctatccgcag tattcagaag aagcaagatt 2590 aaaaa.gagag gaaataagtg gggtaaaatt ggaatcaata ggaacttacc aaatactgtc 2640 aatttattca acagtggcga gttccctagc actggcaatc atgatggctg gtctatcttt 2700 atggatgtgc tccaatggat cgttacaatg cagaatttgc atttaagagc tctaagttaa 2760 aatgcttctt cgtctcctat ttataatatg gtttgttatt gttaattttg ttcttgtaga 2820 agagcttaat taatcgttgt tgttatgaaa tactatttgt atgagatgaa ctggtgtaat 2880 gtaattcatt tacataagtg gagtcagaat cagaatgttt cctccataac taactagaca 2940 tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac taaaattgaa catcttttgc 3000 cacaacttta taagtggtta atatagctca aatatatggt caagttcaat agattaataa 3060 tggaaatatc agttatcgaa attcattaac aatcaactta acgttattaa ctactaattt 3120 tatatcatcc cctttgataa atgatagtac accaattagg aaggagcatg ctcgaggcct 3180 ggctggccga attc 3194
<210> 64 <211>3194 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct number 691, from Hindlll to EcoRI <400> 64 aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60 tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120 tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180 taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240 catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300 aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360 accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420 aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480 caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540 aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600 aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660 agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720 ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780 tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840 ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900 tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960 tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020 ttaatcatct tgagagaaaa tggagaaaat agtgcttctt cttgcaatag tcagtcttgt 1080 taaaagtgat cagatttgca ttggttacca tgcaaacaat tcaacagagc aggttgacac 1140 aatcatggaa aagaacgtta ctgttacaca tgcccaagac atactggaaa agacacacaa 1200 cgggaagci:c tgcctattaa aaggaatagc cccactacaa ttgggtaatt gcagcgttgc 1260 cgggtggatc ttaggaaacc cagaatgcga attactgatt tccaaggagt catggtccta 1320 cattgtagaa aaaccaaatc ctgagaatgg aacatgttac ccagggcatt tcgctgacta 1380 tgaggaactg agggagcaat tgagttcagt atcttcattt gagaggttcg aaatattccc 1440 caaagaaagc tcatggccca accacaccgt aaccggagtg tcagcatcat gctcccataa 1500 tggggaaagc agtttttaca gaaatttgct atggctgacg gggaagaatg gtttgtaccc 1560 aaacctgagc aagtcctatg caaacaacaa agaaaaagaagtccttgtac tatggggtgt 1620 tcatcacccg ccaaacatag gtgaccaaaa ggccctctat catacagaaa atgcttatgt 1680 ctctgtagtg tcttcacatt atagcagaaa attcacccca gaaatagcca aaagacccaa 1740 agtaagagat caagaaggaa gaatcaatta ctactggact ctgcttgaac ccggggatac 1800 aataatattt gaggcaaatg gaaatctaat agcgccaaga tatgctttcg cactgagtag 1860 aggctttgga tcaggaatca tcaactcaaa tgcaccaatg gataaatgca acaccaagtg 1920 tcaaactcca atgggggcga taaactctag tatgccattc cacaacatac accctctcac 1980 cu.tcggggaa tgccccaaat atgtgaaatc aaacagatta gtccttgcaa cagggctcag 2040 aaatagccct caaagagaga gcagaagaaa aaagagagga ctatttggag ctatagcagg 2100 ttttatagag ggaggatggc agggaatggt agatggttgg tatgggtacc accatagcaa 2160 tgagcagggg agtgggtacg ctgcagacaa agaatccact caaaaggcaa tagatggagt 2220 caccaataag gtcaactcaa tcattgacaa aatgaacact cagtttgagg ccgttggaag 2280 ggaatttaat aacttagaaa ggagaataga gaatttaaac aagaagatgg aagacgggtt 2340 tctagatgtc tggacttata atgccgaact tctggttctc atggaaaatg agagaactct 2400 agactttcat gactcaaatg ttaagaacct ctacgacaag gtccgactac agcttaggga 2460 taatgcaaag gagctgggta acggttgttt cgagttctat cacaaatgtg ataatgaatg 2520 tatggaaagt ataagaaacg gaacgtacaa ctatccgcag tattcagaag aagcaagatt 2580 aaaaagagag gaaataagtg gggtaaaatt ggaatcaata ggaacttacc aaatactgtc 2640 aatttattca acagtggcga gttccctagc actggcaatcatgatggctg gtctatcttt 2700 atggatgtgc tccaatggat cgttacaatg cagaatttgc atttaagagc tctaagttaa 2760 aatgcttctt cgtctcctat ttataatatg gtttgttatt gttaattttg ttcttgtaga 282 0 agagcttaat taatcgttgt tgttatgaaa tactatttgt atgaqatgaa ctggtgtaat 2880 gtaattcatt tacataagtg gagtcagaat cagaatgttt cctccataac taactagaca 2940 tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac taaaattgaa catcttttgc 3000 cacaacttta taagtggtta atatagctca aatatatggt caagttcaat agattaataa 3060 tggaaatatc agttatcgaa attcattaac aatcaactta acgttattaa ctactaattt 3120 tatatcatcc cctttgataa atgatagtac accaattagg aaggagcatg ctcgaggcct 3180 ggctggccga attc 3194
<21065 <211>3206 <212> DNA <213> Artificial Sequence <220 <223> Synthesized Construct number 696, from Hlndlll to EcoRI <400 65 aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60 tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120 tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180 taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240 catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300 aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360 accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420 aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480 caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540 aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600 aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660 agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720 ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780 tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840 ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900 tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960 tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020 ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1080 tcttgtgttg gttccttctc agatcttcgc tgacacaata tgtataggct accatgccaa 1140 caactcaacc gacactgttg acacagtact tgagaagaat gtgacagtga cacactctgt 1200 caacctactt gaggacagtc acaatggaaa actatgtcta ctaaaaggaa tagccccact 1260 acaattgggt aattgcagcg ttgccggatg gatcttagga aacccagaat gcgaattact 1320 gatttccaag gaatcatggt cctacattgt agaaacacca aatcctgaga atggaacatg 1380 ttacccaggg agtttcaacg actatgaaga actgaaacac ctattgagca gaataaacca 1440 ttttgagaaa attcaaatca tccccaaaag ttcttggtcc gatcatgaag cctcatcagg 1500 agttagctca gcatgtccat acctgggaag tccctccttt tttagaaatg tggtatggct 1560 tatcaaaaag aacagtacat acccaacaat aaagaaaagc tacaataata ccaaccaaga 1620 ggatcttttg gtactgtgqg gaattcacca tcctaatgat gcggcaqagc agacaaggct 1680 atatcaaaac ccaaccacct atatttccat tgggacatca acactaaacc agagattggt 1740 accaaaaata gctactagat ccaaagtaaa cgggcaaagt ggaaggatgg agttcttctg 1800 gacaatttta aaacctaatg atgcaatcaa cttcgagagt aatggaaatt tcattgctcc 1860 agaatatgca tacaaaattg tcaagaaagg ggactcagca atcatcacct caaatgcacc 1920 aatggatgaa tgtgatgcga agtgtcaaac acctcaggga gctataaaca gcagtcttcc 1980 tttccagaat gtacacccag tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa 2040 attaaggatg gttacaggac taaggaacat cccatccatt caatccagag gtttgtttgg 2100 agccattgcc ggtttcattg aaggggggtg gactggaatg gtagatgggt ggtatggtta 2160 tcatcatcag aatgagcaag gatctggcta tgctgcagat caaaaaagta cacaaaatgc 2220 cattaacggg attacaaaca aggtcaattc tgtaattgag aaaatgaaca ctcaattcac 2280 agctgtgggc aaagagttca acaaattgga aagaaggatg gaaaacttaa ataaaaaagt 2340 tgatgatggg tttctagaca tttggacata taatgcagaa ttgttggttc tactggaaaa 2400 tgaaaggact ttggatttcc atqactccaa tgtgaagaat ctgtatgaga aagtaaaaag 2460 ccaattaaag aataatgcca aagaaatagg aaacgggtgt tttgagttct atcacaagtg 2520 taacaatgaa tgcatggaga gtgtgaaaaa tggtacctat gactatccaa aatattccga 2580 agaatcaaag ttaaacaggg agaaaattga tggagtgaaa ttggaatcaa tgggagtata 2640 ccagattctg gcgatctact caactgtcgc cagttccctg gttcttttgg tctccctggg 2700 ggcaatcagc ttctggatgt gttccaatgg gtctttgcag tgtagaatat gcatctaaga 2760 gctctaagtt aaaatgcttc ttcgtctcct atttataata tggtttgtta ttgttaattt 2820 tgttcttgta gaagagctta attaatcgtt gttgttatga aatactattt gtatgagatg 2880 aactggtgta atgtaattca tttacataag tggagtcaga atcagaatgt ttcctccata 2940 actaactaga catgaagacc tgccgcgtac aattgtctta tatttgaaca actaaaattg 3000 aacatctttt gccacaactt tataagtggt taatatagct caaatatatg gtcaagttca 3060 atagattaat aatggaaata tcagttatcg aaattcatta acaatcaact taacgttatt 3120 aactactaat tttatatcat cccctttgat aaatgatagt acaccaatta ggaaggagca 3180 OO/li tgctcgaggc ctggctggcc gaattc
<210> 66 <211>3058 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct 732, from Paci to Asel <400> 66 aattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttacaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat gaaagtaaaa ctactggtcc tgttatgcac atttacagct 900 acatatgcag acacaatatg tataggctac catgctaaca actcgaccga cactgttgac 960 acagtacttg aaaagaatgt gacagtgaca cactctgtca acctgcttga gaacagtcac 1020 aatggaaaac tatgtctatt aaaaggaata gccccactac aattgggtaa ttgcagcgtt 1080 gccgggtgga tcttaggaaa cccagaatgc gaattactga tttccaagga gtcatggtcc 1140 tacattgtag aaaaaccaaa tcctgagaat ggaacatgtt acccagggca tttcgctgac 1200 tatgaggaac tgagggagca attgagttca gtatcttcat ttgagaggtt cgaaatattc 1260 cccaaagaaa gctcatggcc caaccacacc gtaaccggag tgtcagcatc atgctcccat 1320 aatggggaaa gcagttttta cagaaatttg ctatggctga cggggaagaa tggtttgtac 1380 ccaaacctga gcaagtccta tgcaaacaac aaagaaaaag aagtccttgt actatggggt 1440 gttcatcacc cgccaaacat aggtgaccaa aaggccctct atcatacaga aaatgcttat 1500 gtctctgtag tgtcttcaca ttatagcaga aaattcaccc cagaaatagc caaaagaccc 1560 aaagtaagag atcaagaagg aagaatcaat tactactgga ctctgcttga acccggggat 1620 acaataatat ttgaggcaaa tggaaatcta atagcgccaa gatatgcttt cgcactgagt 1680 agaggctttg gatcaggaat catcaactca aatgcaccaa tggataaatg tgatgcgaag 1740 tgccaaacac ctcagggagc tataaacagc agtcttcctt tccagaacgt acacccagtc 1800 acaataggag agtgtccaaa gtatgtcagg agtgcaaaat taaggatggt tacaggacta 1860 aggaacatcc catccattca atccagaggt ttgtttggag ccattgccgg tttcattgaa 1920 ggggçfÇftgga ctggaatggt agatggttgg tatggttatc atcatcagaa tgagcaagga 1980 tctggctatg ctgcagatca aaaaagcaca caaaatgcca ttaatgggat tacaaacaag 2040 gtcaattctg taattgagaa aatgaacact caattcacag cagtgggcaa agagttcaac 2100 aaattggaaa gaaggatgga aaacttgaat aaaaaagttg atgatgggtt tatagacatt 2160 tggacatata atgcagaact gttggttcta ctggaaaatg aaaggacttt ggatttccat 2220 gactccaatg tgaagaatct gtatgagaaa gtaaaaagcc agttaaagaa taatgctaaa 2280 gaaataggaa atgggtgttt tgagttctat cacaagtgta acgatgaatg catggagagt 2340 gtaaagaatg gaacttatga ctatccaaaa tattccgaag aatcaaagtt aaacagggag 2400 aaaattgatg gagtgaaatt ggaatcaatg ggagtctatc agattctggc gatctactca 2460 acagtcgcca gttctctggt tcttttggtc tccctggggg caatcagctt ctggatgtgt 2520 tccaatgggt ctttacagtg tagaatatgc atctaaaggc ctattttctt tagtttgaat 2580 ttactgttat tcggtgtgca tttctatgtt tggtgagcgg ttttctgtgc tcagagtgtg 2640 tttattttat gtaatttaat ttctttgtga gctcctgttt agcaggtegt cccttcagca 2700 aggacacaaa aagattttaa ttttattaaa aaaaaaaaaa aaaaagaccg ggaattcgat 2760 atcaagctta tcgacctgca gatcgttcaa acatttggca ataaagtttc ttaagattga 2820 atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg 2880 taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc 2940 cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat 3000 tatcgcgcgc ggtgtcatct atgttactag attctagagt ctcaagcttc ggcgcgcc 3058
<210» S7 <211> 1719 <212> DNA <213> Artificial Sequence <220> <223> Synthesized construct number 787 <400> 67 atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60 cagatcttcg ctgacacaat atgtataggc taccatgcta acaactcgac cgacactgtt 120 gacacagtac ttgaaaagaa tgtgacagtg acacactctg tcaacctgct tgagaacagt 180 cacaatggaa aactatgtct attaaaagga atagccccac tacaattggg taattgcagc 240 gttgccgggt ggatcttagg aaacccagaa tgcgaattac tgatttccaa ggagtcatgg 300 tcctacattg tagaaaaacc aaatcctgag aatggaacat gttacccagg gcatttcgct 360 gactatgagg aactgaggga gcaattgagt tcagtatctt catttgagag gttcgaaata 420 ttccccaaag aaagctcatg gcccaaccac accgtaaccg gagtgtcagc atcatgctcc 480 cataatgggg aaagcagttt ttacagaaat ttgctatggc tgacggggaa gaatggtttg 540 tacccaaacc tgagcaagtc ctatgcaaac aacaaagaaa aagaagtcct tgtactatgg 600 ggtgttcatc acccgccaaa cataggtgac caaaaggccc tctatcatac agaaaatgct 660 tatgtctctg tagtgtcttc acattatagc agaaaattca ccccagaaat agccaaaaga 720 cccaaagtaa gagatcaaga aggaagaatc aattactact ggactctgct tgaacccggg 780 gatacaataa tatttgaggc aaatggaaat ctaatagcgc caagatatgc tttcgcactg 840 agtagaggct ttggatcagg aatcatcaac tcaaatgcac caatggataa atgtgatgcg 900 aagtgccaaa cacctcaggg agctataaac agcagtcttc ctttccagaa cgtacaccca 960 gtcacaatag gagagtgtcc aaagtatgtc aggagtgcaa aattaaggat ggttacagga 1020 ctaaggaaca tcccatccat tcaatccaga ggtttgtttg gagccattgc cggtttcatt 1080 gaaggggggt ggactggaat ggtagatggt tggtatggtt atcatcatca gaatgagcaa 1140 ggatctggct atgctgcaga tcaaaaaagc acacaaaatg ccattaatgg gattacaaac 1200 aaggtcaatt ctgtaattga gaaaatgaac actcaattca cagcagtggg caaagagttc 1260 aacaaattgg aaagaaggat ggaaaacttg aataaaaaag ttgatgatgg gtttatagac 1320 atttggacat ataatgcaga actgttggtt ctactggaaa atgaaaggac tttggatttc 1380 catgactcca atgtgaagaa tctgtatgag aaagtaaaaa gccagttaaa gaataatgct 1440 aaagaaatag gaaatgggtg ttttgagttc tatcacaagt gtaacgatga atgcatggag 1500 agtgtaaaga atggaactta tgactatcca aaatattccg aagaatcaaa gttaaacagg 1560 gagaaaattg atggagtgaa attggaatca atgggagtct atcagattct ggcgatctac 1620 tcaacagtcg ccagttctct ggttcttttg gtctccctgg gggcaatcag cttctggatg 1680 tgttccaatg ggtctttaca gtgtagaata tgcatctaa 1719
<210> 68 <211> 3079 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct number 73% from Pad to Asel <400> 68 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900 cttgtgttgg ttccttctca gatcttcgct gacacaatat gtataggcta ccatgctaac 960 aactcgaccg acactgttga cacagtactt gaaaagaatg tgacagtgac acactctgtc 1020 aacctgcttg agaacagtca caatggaaaa ctatgtctat taaaaggaat agccccacta 1080 caattgggta attgcagcgt tgccgggtgg atcttaggaa acccagaatg cgaattactg 1140 atttccaagg agtcatggtc ctacattgta gaaaaaccaa atcctgagaa tggaacatgt 1200 tacccagggc atttcgctga ctatgaggaa ctgagggagc aattgagttc agtatcttca 1260 tttgagaggt tcgaaatatt ccccaaagaa agctcatggc ccaaccacac cgtaaccgga 1320 gtgtcagcat catgetceca taatggggaa agcagttttt acagaaattt gctatggctg 13Θ0 acggggaaga atggtttgta cccaaacctg agcaagtcct atgcaaacaa caaagaaaaa 1440 gaagtccttg tactatgggg tgttcatcac ccgccaaaca taggtgacca aaaggccctc 1500 164 tatcatacag aaaatgctta tgtctctgta gtgtcttcac attatagcag aaaattcacc 1560 ccagaaatag ccaaaagacc caaagtaaga gatcaagaag gaagaatcaa ttactactgg 1620 tttgaggcaa atggaaatct aatagcgcca 1680 actctgcttg aacccgggga tacaataata agatatgctt tcgcactgag tagaggcttt ggatcaggaa tcatcaactc aaatgcacca 1740 atggataaat gtgatgcgaa gtgccaaaca cctcagggag ctataaacag cagtcttcct 1800 ttccagaacg tacacccagt cacaatagga gagtgtccaa agtatgtcag gagtgcaaaa 1860 ttaaggatgg ttacaggact aaggaacatc ccatccattc aatccagagg tttgtttgga 1920 gccattgccg gtttcattga aggggggtgg actggaatgg tagatggttg gtatggttat 1980 catcatcaga atgagcaagg atctggctat gctgcagatc aaaaaagcac acaaaatgcc 2040 attaatggga ttacaaacaa ggtcaattct gtaattgaga aaatgaacac tcaattcaca 2100 gcagtgggca aagagttcaa caaattggaa agaaggatgg aaaacttgaa taaaaaagtt 2160 gatgatgggt ttatagacat ttggacatat aatgcagaac tgttggttct actggaaaat 2220 gaaaggactt tggatttcca tgactccaat gtgaagaatc tgtatgagaa agtaaaaagc 2280 cagttaaaga ataatgctaa agaaatagga aatgggtgtt ttgagttcta tcacaagtgt 2340 aacgatgaat gcatggagag tgtaaagaat ggaacttatg actatccaaa atattccgaa 2400 gaatcaaagt taaacaggga gaaaattgat ggagtgaaat tggaatcaat gggagtctat 2460 cagattctgg cgatctactc aacagtcgcc agttctctgg ttcttttggt ctccctgggg 2520 gcaatcagct tctggatgtg ttccaatggg tctttacagt gtagaatatg catctaaagg 2580 cctattttct ttagtttgaa tttactgtta ttcggtgtgc atttctatgt ttggtgagcg 2640 gttttctgtg ctcagagtgt gtttatttta tgtaatttaa tttctttgtg agctcctgtt 2700 tagcaggtcg tcccttcagc aaggacacaa aaagatttta attttattaa aaaaaaaaaa 2760 aaaaaagacc gggaattcga tatcaagctt atcgacctgc agatcgttca aacatttggc 2820 aataaagttt cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc 2880 tgttgaatta cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat 2940 gggtttttat gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat 3000 agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gattctagag 3060 tctcaagctt cggcgcgcc 3079
<210> 69 <211>3067 <212> DNA <21S> Artificial Sequence 166 <220> <223> Synthesized Construct 734, from Paci to Asel <400> 69 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat ggagaaaata gtgcttcttc ttgcaatagt cagtcttgtt 900 aaaagtgatc agatttgcat tggttaccat gcaaacaatt caacagagca ggttgacaca 960 atcatggaaa agaacgttac tgttacacat gcccaagaca tactggaaaa gacacacaac 1020 gggaagctct gcgatctaga tggagtgaag cctctaattt taagagattg tagtgtagct 1080 ggatggctcc tcgggaaccc aatgtgtgac gaattcatca atgtaccgga atggtcttac 1140 atagtggaga aggccaatcc aaccaatgac ctctgttacc cagggcattt cgctgactat 1200 gaggaactga gggagcaatt gagttcagta tcttcatttg agaggttcga aatattcccc 1260 aaagaaagct catggcccaa ccacaccgta accggagtgt cagcatcatg ctcccataat 1320 ggggaaagca gtttttacag aaatttgcta tggctgacgg ggaagaatgg tttgtaccca 1380 aacctgagca agtcctatgc aaacaacaaa gaaaaagaag tccttgtact atggggtgtt 1440 catcacccgc caaacatagg tgaccaaaag gccctctatc atacagaaaa tgcttatgtc 1500 tctgtagtgt cttcacatta tagcagaaaa ttcaccccag aaatagccaa aagacccaaa 1560 gtaagaqatc aagaaggaag aatcaattac tactggactc tgcttgaacc cggggataca 1620 ataatatttg aggcaaatgg aaatctaata gcgccaagat atgctttcgc actgagtaga 1680 ggctttggat caggaattat gaaaagtgaa ttggaatatg gtaactgcaa caccaagtgt 1740 caaactccaa tgggggcgat aaactctagt atgccattcc acaacataca ccctctcacc 1800 atcggggaat gccccaaata tgtgaaatca aacagattag tccttgcaac agggctcaga 1860 aatagccctc aaagagagag cagaagaaaa aagagaggac tatttggagc tatagcaggt 1920 tttatagagg gaggatggca gggaatggta gatggttggt atgggtacca ccatagcaat 1980 gagcagggga gtgggtacgc tgcagacaaa gaatccactc aaaaggcaat agatggagtc 2040 accaataagg tcaactcaat cattgacaaa atgaacactc agtttgaggc cgttggaagg 2100 gaatttaata acttagaaag gagaatagag aatttaaaca agaagatgga agacgggttt 2160 ctagatgtct ggacttataa tgccgaactt ctggttctca tggaaaatga gagaactcta 2220 gactttcatg actcaaatgt taagaacctc tacgacaagg tccgactaca gcttagggat 2280 aatgcaaagg agctgggtaa cggttgtttc gagttctatc acaaatgtga taatgaatgt 2340 atggaaagta taagaaacgg aacgtacaac tatccgcagt attcagaaga agcaagatta 2400 aaaagagagg aaataagtgg ggtaaaattg gaatcaatag gaacttacca aatactgtca 2460 atttattcaa cagtggcgag ttccctagca ctggcaatca tgatggctgg tctatcttta 2520 tggatgtgct ccaatggatc gttacaatgc agaatttgca tttaaaggcc tattttcttt 2580 agtttgaatt tactgttatt cggtgtgcat ttctatgttt ggtgagcggt tttctgtgct 2640 cagagtgtgt ttattttatg taatttaatt tctttgtgag ctcctgttta gcaggtcgtc 2700 ccttcagcaa ggacacaaaa agattttaat tttattaaaa aaaaaaaaaa aaaagaccgg 2760 gaattcgata tcaagcttat cgacctgcag atcgttcaaa catttggcaa taaagtttct 2820 taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 2880 ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 2940 ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 3000 aggataaatt atcgcgcgcg gtgtcatcta tgttactaga ttctagagtc tcaagcttcg 3060 gcgcgcc 3067
<210> 70 <211> 1791 <212> DNA <213> Artificial Sequence <220> <223> Synthesized fragment Oral ll-Plasto(-84+ l)-H3A/Brisbane/10/07-Sacl <400>70 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatgaag actatcattg ctttgagcta cattctatgt 120 ctggttttca ctcaaaaact tcccggaaat gacaacagca cggcaacgct gtgccttggg 180 171 caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt 240 actaatgcta ctgagctggt tcagagttcc tcaacaggtg aaatatgcga cagtcctcat 300 cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 360 gatggcttcc aaaataagaa atgggacctt tttgttgaac gcagcaaagc ctacagcaac 420 tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 480 acactggagt ttaacaatga aagtttcaat tggactggag tcactcaaaa cggaacaagc 540 tctgcttgca taaggagatc taataacagt ttctttagta gattgaattg gttgacccac 600 ttaaaattca aatacccagc attgaacgtg actatgccaa acaatgaaaa atttgacaaa 660 ttgtacattt ggggggttca ccacccgggt acggacaatg accaaatctt cctgtatgct 720 caagcatcag gaagaatcac agtctctacc aaaagaagcc aacaaactgt aatcccgaat 780 atcggatcta gacccagagt aaggaatatc cccagcagaa taagcatcta ttggacaata 840 gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 900 tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 960 tgcaattctg aatgcatcac tccaaacgga agcattccca atgacaaacc attccaaaat 1020 gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg 1080 gcaacaggga tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatcgcg 1140 ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtatggttt caggcatcaa 1200 aattctgagg gaataggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1260 atcaatggga agctgaatag gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1320 aaagagttct cagaagtcga agggagaatc caggaccttg agaaatatgt tgaggacacc 1380 aaaatagatc tctggtcata caacgcggag cttcttgttg cectggagaa ccaacataca 1440 attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1500 gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1560 tgcataggat caatcagaaa tggaacttat gaccacgatg tatacagaga tgaagcatta 1620 aacaaccggt tccagatcaa gggcgttgag ctgaagtcag gatacaaaga ttggatacta 1680 tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1740 tgggcctgcc aaaaaggcaa cattaggtgc aacatttgca tttgagagct c 1791
<210> 71 <211> 3085 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct 736, from Paci to Asel <400> 71
I
I
I
I ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900 cttgtgttgg ttccttctca gatcttcgct caaaaacttc ccggaaatga caacagcacg 960 gcaacgctgt gccttgggca ccatgcagta ccaaacggaa cgatagtgaa aacaatcacg 1020 aatgaccaaa ttgaagttac taatgctact gagctggttc agagttcctc aacaggtgaa 1080 atatgcgaca gtcctcatca gatccttgat ggagaaaact gcacactaat agatgctcta 1140 ttgggagacc ctcagtgtga tggcttccaa aataagaaat gggacctttt tgttgaacgc 1200 agcaaagcct acagcaactg ttacccttat gatgtgccgg attatgcctc ccttaggtca 1260 ctagttgcct catccggcac actggagttt aacaatgaaa gtttcaattg gactggagtc 1320 actcaaaacg gaacaagctc tgcttgcata aggagatcta ataacagttt ctttagtaga 13.80 ttgaattggt tgacccactt aaaattcaaa tacccagcat tgaacgtgac tatgccaaac 1440 aatgaaaaat ttgacaaatt gtacatttgg ggggttcacc acccgggtac ggacaatgac 1500 caaatcttcc tgtatgctca agcatcagga agaatcacag tctctaccaa aagaagccaa 1560 caaactgtaa tcccgaatat cggatctaga cccagagtaa ggaatatccc cagcagaata 1620 agcatctatt ggacaatagt aaaaccggga gacatacttt tgattaacag cacagggaat 1680 ctaattgctc ctaggggtta cttcaaaata cgaagtgggaaaagctcaat aatgagatca 1740 gatgcaccca ttggcaaatg caattctgaa tgcatcactc caaacggaag cattcccaat 1800 gacaaaccat tccaaaatgt aaacaggatc acatacgggg cctgtcccag atatgttaag 1860 caaaacactc tgaaattggc aacagggatg cgaaatgtac cagagaaaca aactagaggc 1920 1980 atatttggcg caatcgcggg tttcatagaa aatggttggg agggaatggt ggatggttgg tatggtttca ggcatcaaaa ttctgaggga ataggacaag cagcagatct caaaagcact 2040 caagcagcaa tcgatcaaat caatgggaag ctgaataggt tgatcgggaa aaccaacgag 2100 aaattccatc agattgaaaa agagttctca gaagtcgaag ggagaatcca ggaccttgag 2160 aaatatgttg aggacaccaa aatagatctc tggtcataca acgcggagct tcttgttgcc 2220 ctggagaacc aacatacaat tgatctaact gactcagaaa tgaacaaact gtttgaaaaa 2280 acaaagaagc aactgaggga aaatgctgag gatatgggca atggttgttt caaaatatac 2340 cacaaatgtg acaatgcctg cataggatca atcagaaatg gaacttatga ccacgatgta 2400 tacagagatg aagcattaaa caaccggttc cagatcaagg gcgttgagct gaagtcagga 2460 tacaaagatt ggatactatg gatttccttt gccatatcat gttttttgct ttgtgttgct 2520 ttgttggggt tcatcatgtg ggcctgccaa aaaggcaaca ttaggtgcaa catttgcatt 2580 tgaaggccta ttttctttag tttgaattta ctgttattcg gtgtgcattt ctatgtttgg 2640 tgagcggttt tctgtgctca gagtgtgttt attttatgta atttaatttc tttgtgagct 2700 cctgtttagc aggtcgtccc ttcagcaagg acacaaaaag attttaattt tattaaaaaa 2760 aaaaaaaaaa aagaccggga attcgatatc aagcttatcg acctgcagat cgttcaaaca 2820 tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg attatcatat 2880 aatttctgtt gaattacgtt aagcatgtaa taattaacat gtaatgcatg acgttattta 2940 tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg atagaaaaca 3000 aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg ttactagatt 3060 ctagagtctc aagcttcggc gcgcc 3085 <210> 72 <211> 3088
<212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct 737, from Pad to Asel <400> 72 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900 cttgtgttgg ttccttctca gatcttcgct caaaaacttc ccggaaatga caacagcacg 960 gcaacgctgt gccttgggca ccatgcagta ccaaacggaa cgatagtgaa aacaatcacg 1020 aatgaccaaa ttgaagttac taatgctact gagctggttc agagttcctc aacaggtgaa 1080 atatgcgaca gtcctcatca gatccttgat ggagaaaact gcacactaat agatgctcta 1140 ttgggagacc ctcagtgtga tggcttccaa aataagaaat gggacctttt tgttgaacgc 1200 agcaaagcct acagcaactg ttacccttat gatgtgccgg attatgcctc ccttaggtca 1260 ctagttgcct catccggcac actggagttt aacaatgaaa gtttcaattg gactggagtc 1320 actcaaaacg gaacaagctc tgcttgcata aggagatcta ataacagttt ctttagtaga 1380 ttgaattggt tgacccactt aaaattcaaa tacccagcat tgaacgtgac tatgccaaac 1440 aatgaaaaat ttgacaaatt gtacatttgg ggggttcacc acccgggtac ggacaatgac 1500 caaatcttcc tgtatgctca agcatcagga agaatcacag tctctaccaa aagaagccaa 1560 caaactgtaa tcccgaatat cggatctaga cccagagtaa ggaatatccc cagcagaata 1620 agcatctatt ggacaatagt aaaaccggga gacatacttt tgattaacag cacagggaat 1680 ctaattgctc ctaggggtta cttcaaaata cgaagtggga aaagctcaat aatgagatca 1740 gatgcaccca ttggcaaatg caattctgaa tgcatcactc caaacggaag cattcccaat 1800 gacaaaccat tccaaaatgt aaacaggatc acatacgggg cctgtcccag atatgttaag 1860 caaaacactc tgaaattggc aacagggatg cgaaatgtac cagagaaaca aactagagqc 1920 atatttggcg caatcgcggg tttcatagaa aatggttggg agggaatggt ggatggttgg 1980 tatggtttca ggcatcaaaa ttctgaggga ataggacaag cagcagatct caaaagcact 2040 caagcagcaa tcgatcaaat caatgggaag ctgaataggt tgatcgggaa aaccaacgag 2100 aaattccatc agattgaaaa agagttctca gaagtcgaag ggagaatcca ggaccttgag 2160 aaatatgttg aggacaccaa aatagatctc tggtcataca acgcggagct tcttgttgcc 2220 ctggagaacc aacatacaat tgatctaact gactcagaaa tgaacaaact gtttgaaaaa 2280 acaaagaagc aactgaggga aaatgctgag gatatgggca atggttgttt caaaatatac 2340 cacaaatgtg acaatgcctg cataggatca atcagaaatg gaacttatga ccacgatgta 2400 tacagagatg aagcattaaa caaccggttc cagatcaagg gcgttgagct gaagtcaata 2460 ggaacttacc aaatactgtc aatttattca acagtggcga gttccctagc actggcaatc 2520 atgatggctg gtctatcttt atggatgtgc tccaatggat cgttacaatg cagaatttgc 2580 atttaaaggc ctattttctt tagtttgaat ttactgttat tcggtgtgca tttctatgtt 2640 tggtgagcgg ttttctgtgc tcagagtgtg tttattttat gtaatttaat ttctttgtga 2700 gctcctgttt agcaggtcgt cccttcagca aggacacaaa aagattttaa ttttattaaa 2760 aaaaaaaaaa aaaaagaccg ggaattcgat atcaagctta tcgacctgca gatcgttcaa 2820 acatttggca ataaagtttc ttaagattga atcctgttgc cggtcttgcg atgattatca 2880 tataatttct gttgaattac gttaagcatg taataattaa catgtaatgc atgacgttat 2940 ttatgagatg ggtttttatg attagagtcc cgcaattata catttaatac gcgatagaaa 3000 acaaaatata gcgcgcaaac taggataaat tatcgcgcgc ggtgtcatct atgttactag 3060 attctagagt ctcaagcttc ggcgcgcc 3088
<210> 73 <211> 1845 <212> DNA <213> Artificial Sequence <220> <223> Synthesized fragment Oral ll-P1asto{-84+ 1}-HA B/Florlda/4/06-Sad <400» 73 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatgaag gcaataattg tactactcat ggtagtaaca 120 tccaatgcag atcgaatctg cactggaata acatcttcaa actcacctca tgtggtcaaa 180 acagccactc aaggggaggt caatgtgact ggtgtgatac cactaacaac aacaccaaca 240 aaatcttatt ttgcaaatct caaaggaaca aggaccagag ggaaactatg cccagactgt 300 ctcaactgca cagatctgga tgtggctttg ggcagaccaa tgtgtgtggg gaccacacct 360 tcggcgaagg cttcaatact ccacgaagtc aaacctgtta catccgggtg ctttcctata 420 atgcacgaca gaacaaaaat caggcaacta cccaatcttc tcagaggata tgaaaatatc 480 aggctatcaa cccaaaacgt catcgatgcg gaaaaggcac caggaggacc ctacagactt 540 ggaacctcag gatcttgccc taacgctacc agtaagagcg gatttttcgc aacaatggct 600 tgggctgtcc caaaggacaa caacaaaaat gcaacgaacc cactaacagt agaagtacca 660 tacatttgta cagaagggga agaccaaatc actgtttggg ggttccattc agataacaaa 720 acccaaatga agaacctcta tggagactca aatcctcaaa agttcacctc atctgctaat 780 ggagtaacca cacactatgt ttctcagatt ggcagcttcc cagatcaaac agaagacgga 840 ggactaccac aaagcggcag gattgttgtt gattacatga tgcaaaaacc tgggaaaaca 900 ggaacaattg tctaccaaag aggtgttttg ttgcctcaaa aggtgtggtg cgcgagtggc 960 aggagcaaag taataaaagg gtccttgcct ttaattggtg aagcagattg ccttcatgaa 1020 aaatacggtg gattaaacaa aagcaagcct tactacacag gagaacatgc aaaagccata 1080 ggaaattgcc caatatgggt gaaaacacct ttgaagctcg ccaatggaac caaatataga 1140 cctcctgcaa aactattaaa ggaaaggggt ttcttcggag ctattgctgg tttcctagaa 1200 ggaggatggg aaggaatgat tgcaggctgg cacggataca catctcacgg agcacatgga 1260 gtggcagtgg cggcggacct taagagtacg caagaagcta taaacaagat aacaaaaaat 1320 ctcaattctt tgagtgagct agaagtaaag aatcttcaaa gactaagtgg tgccatggat 1380 gaactccaca acgaaatact cgagctggat gagaaagtgg atgatctcag agctgacact 1440 ataagctcgc aaatagaact tgcagtcttg ctttccaacg aaggaataat aaacagtgaa 1500 gatgagcatc tattggcact tgagagaaaa ctaaagaaaa tgctgggtcc ctctgctgta 1560 gagataggaa atggatgctt cgaaaccaaa cacaagtgca accagacctg cttagacagg 1620 atagctgctg gcacctttaa tgcaggagaa ttttctctcc ccacttttga ttcactgaac 1680 attactgctg catctttaaa tgatgatgga ttggataacc atactatact gctctattac 1740 tcaactgctg cttctagttt ggctgtaaca ttgatgctag ctatttttat tgtttatatg 1800 gtctccagag acaacgtttc atgctccatc tgtctataag agctc 1845
<210> 74 <211>3142 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct 739, from Pad to Asel <400> 74 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgc:g gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg gg2aacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg tt2agcttct gtatattctg 840 cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900 cttgtgttgg ttccttctca gatcttcgct gatcgaatct gcactggaat aacatcttca 960 aactcacctc atgtggtcaa aacagccact caaggggagg tcaatgtgac tggtgtgata 1020 ccactaacaa caacaccaac aaaatcttat tttgcaaatc tcaaaggaac aaggaccaga 1080 gggaaactat gcccagactg tctcaactgc acagatctgg atgtggcttt gggcagacca 1140 atgtgtgtgg ggaccacacc ttcggcgaag gcttcaatac tccacgaagt caaacctgtt 1200 acatccgggt gctttcctat aatgcacgac agaacaaaaa tcaggcaact acccaatctt 1260 ctcagaggat atgaaaatat caggctatca acccaaaacg tcatcgatgc ggaaaaggca 1320 ccaggaggac cctacagact tggaacctca ggatcttgcc ctaacgctac cag-::aagagc 1380 ggatttttcg caacaatggc ttgggctgtc ccaaaggaca acaacaaaaa tgcaacgaac 1440 ccactaacag tagaagtacc atacatttgt acagaagggg aagaccaaat cactgtttgg 1500 gggttccatt cagataacaa aacccaaatg aagaaectct atggagactc aaatcctcaa 1560 aagttcacct catctgctaa tggagtaacc acacactatg tttctcagat tggcagcttc 1620 ccagatcaaa cagaagacgg aggactacca caaagcggca ggattgttgt tgattacatg 1680 atgcaaaaac ctgggaaaac aggaacaatt gtctaccaaa gaggtgtttt gttgcctcaa 1740 aaggtgtggt gcgcgagtgg caggagcaaa gtaataaaag ggtccttgcc tttaattggt 1800 gaagcagatt gccttcatga aaaatacggt ggattaaaca aaagcaagcc ttactacaca 1860 ggagaacatg caaaagccat aggaaattgc ccaatatggg tgaaaacacc tttgaagctc 1920 qccaatgqaa ccaaatatag acctcctgca aaactattaa aggaaagggg tttcttcgga 1980 gctattgctg gtttcc-::aga aggaggatgg gaaggaatga ttgcaggctg gcacggatac 2040 acatctcacg gagcacatgg agtggcagtg gcggcggacc ttaagagtac gcaagaagct 2100 ataaacaaga taacaaaaaa tctcaattct ttgagtgagc tagaagtaaa gaatcttcaa 2160 agactaagtg gtgccatgga tgaactccac aacgaaatac tcgagctgga tgagaaagtg 2220 gatgatctca gagctgacac tataagctcg caaatagaac ttgcagtctt gctttccaac 2280 gaaggaataa taaacagtga agatgagcat ctattggcac ttgagagaaa actaaagaaa 2340 atgctgggtc cctctgctgt agagatagga aatggatgct tcgaaaccaa acacaagtgc 2400 aaccagacct gcttagacag gatagctgct ggcaccttta atgcaggaga attttctctc 2460 cccacttttg attcactgaa cattactgct gcatctttaa atgatgatgg attggataac 2520 catactatac tgctctatta ctcaactgct gcttctagtt tggctgtaac attgatgcta 2580 gctattttta ttgtttatat ggtctccaga gacaacgttt catgctccat ctgtctataa 2640 aggcctattt tctttagttt gaatttactg ttattcggtg tgcatttcta tgtttggtga 2700 gcggttttct gtgctcagag tgtgtttatt ttatgtaatt taatttcttt gtgagctcct 2760 gtttagcagg tcgtcccttc agcaaggaca caaaaagatt ttaattttat taaaaaaaaa 2820 aaaaaaaaag accgggaatt cgatatcaag cttatcgacc tgcagatcgt tcaaacattt 2880 ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt atcatataat 2940 ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg ttatttatga 3000 gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata gaaaacaaaa 3060 tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta ctagattcta 3120 gagtctcaag cttcggcgcg cc 3142
<210> 75 <211>3142 <212> DNA <213> Artificial Sequence <220> <223> Construct 745, from Peel to Asel <400> 75 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 84 0 cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900 cttgtgttgg ttccttctca gatcttcgct gatcgaatct gcactggaat aacatcttca 960 aactcacctc atgtggtcaa aacagccact caaggggagg tcaatgtgac tggtgtgata 1020 ccactaacaa caacaccaac aaaatcttat tttgcaaatc tcaaaggaac aaggaccaga 1080 gggaaactat gcccagactg tctcaactgc acagatctgg atgtggcttt gggcagacca 1140 atgtgtgtgg ggaccacacc ttcggcgaag gcttcaatac tccacgaagt caaacctgtt 1200 acatccgggt gctttcctat aatgcacgac agaacaaaaa tcaggcaact acccaatctt 1260 ctcagaggat atgaaaatat caggctatca acccaaaacg tcatcgatgc ggaaaaggca 1320 ccaggaggac cctacagact tggaacctca ggatcttgcc ctaacgctac cagtaagagc 1380 ggatttttcg caacaatggc ttgggctgtc ccaaaggaca acaacaaaaa tgcaacgaac 1440 ccactaacag tagaagtacc atacatttgt acagaagggg aagaccaaat cactgtttgg 1500 gggttccatt cagataacaa aacccaaatg aagaacctct atggagactc aaatcctcaa 1560 aagttcacct catctgctaa tggagtaacc acacactatg tttctcagat tggcagcttc 1620 ccagatcaaa cagaagacgg aggactacca caaagcggca ggattgttgt tgattacatg 1680 atgcaaaaac ctgggaaaac aggaacaatt gtctaccaaa gaggtgtttt gttgcctcaa 1740 aaggtgtggt gcgcgagtgg caggagcaaa gtaataaaag ggtccttgcc tttaattggt 1800 gaagcagatt gccttcatga aaaatacggt ggattaaaca aaagcaagcc ttactacaca 1860 ggagaacatg caaaagccat aggaaattgc ccaatatggg tgaaaacacc tttgaagctc 1920 gccaatggaa ccaaatatag acctcctgca aaactattaa aggaaagggg tttcttcgga 1980 gctattgctg gtttcctaga aggaggatgg gaaggaatga ttgcaggctg gcacggatac 2040 acatctcacg gagcacatgg agtggcagtg gcggcggacc ttaagagtac gcaagaagct 2100 ataaacaaga taacaaaaaa tctcaattct ttgagtgagc tagaagtaaa gaatcttcaa 2160 aqactaaqtq qtgccatqqa tqaactccac aacgaaatac tcgagctgga tgagaaagtg 2220 gatgatctca gagctgacac tataagctcg caaatagaac ttgcagtctt gctttccaac 2280 gaaggaataa taaacagtga agatgagcat ctattggcac ttgagagaaa actaaagaaa 2340 atgctgggtc cctctgctgt agagatagga aatggatgct tcgaaaccaa acacaagtgc 2400 aaccagacct gcttagacag gatagctgct ggcaccttta atgcaggaga attttctctc 2460 cccacttttg attcactgaa cattactgct gcatctttaa atgatgatgg attggataac 2520 taccaaatac tgtcaattta ttcaacagtg gcgagttccc tagcactggc aatcatgatg 2580 gctggtctat ctttatggat gtgctccaat ggatcgttac aatgcagaat ttgcatttaa 2640 aggcctattt tctttagttt gaatttactg ttattcggtg tgcatttcta tgtttggtga 2700 gcggttttct gtgctcagag tgtgtttatt ttatgtaatt taatttcttt gtgagctcct 2760 gtttagcagg tcgtcccttc agcaaggaca caaaaagatt ttaattttat taaaaaaaaa 2820 aaaaaaaaag accgggaatt cgatatcaag cttatcgacc tgcagatcgt tcaaacattt 2880 ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt atcatataat 2940 ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg ttatttatga 3000 gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata gaaaacaaaa 3060 tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta ctagattcta 3120 gagtctcaag cttcggcgcg cc 3142
<210> 76 <211>1272 <212> DNA <213> Artificial Sequence <220> <223> Synthesized MsJI coding sequence <400> 76 atgtttgggc gcggaccaac aaggaagagt gataacacca aatattacga tattcttggt 60 gtttcaaaaa gtgctagtga agatgaaatc aagaaagcct atagaaaggc agcgatgaag 120 aaccatccag ataagggtgg ggatcctgag aagttcaagg agttgggcca agcatatgaa 180 gtgttgagcg atcctgaaaa gaaagaactg tatgatcaat atggtgaaga tgcccttaaa 240 gaaggaatgg ggggaggcgc aggaagctca tttcataatc cgtttgatat tttcgaatca 300 ttttttggtg caggctttgg tggtggtggt ccttcacgcg caagaagaca gaagcaagga 360 gaagatgtgg tgcattctat aaaggtttcc ttggaggatg tgtataacgg cactacaaag 420 aagctatcac tttctaggaa tgcactgtgc tcaaaatgta aagggaaagg ttcaaaaagt 480 ggaactgctg gaaggtgttt tggatgccag ggcacaggta tgaagattac cagaaggcaa 540 attggactgg gcatgattca acaaatgcaa cacgtctgtc ctgactgcaa aggaacaggc 600 gaggtcatta gtgagagaga tagatgccct caatgcaagg gaaacaagat tactcaagaa 660 aagaaggtgc tggaggtgca tgtggaaaag gggatgcagc agggtcacaa gattgtattc 720 gaaggacaag ctgatgaagc tcctgataca atcacaggag acatagtttt tgtcttgcaa 780 gtaaagggac atccgaagtt tcggagggag cgtgatgacc tccacattga acacaatttg 840 agcttaactg aggctctctg tggcttccag tttaatgtca cacatcttga tggaaggcaa 900 ctattggtca aatcgaaccc cggcgaagtc atcaagccag gtcaacataa agctataaat 960 gatgagggaa tgccacaaca tggtaggccg ttcatgaagg gacgcctata catcaagttt 1020 agtgttgatt tcccggattc gggttttctt tccccaagcc aaagcctgga attagaaaag 1080 atattacctc aaaagacaag caagaacttg tcccaaaagg aggtagatga ttgtgaggag 1140 accaccctgc atgatgtcaa tattgcagag gagatgagtc gaaagaagca acaataccgt 1200 gaggcatatg atgacgatga tgatgaagat gatgagcact cgcagcctcg ggtgcaatgc 1260 gctcaacagt ag 1272
<210> 77 <211> 4402 <212> DNA <213» Artificial Sequence <220> <223> Synthesized Construct number RS50, from Hlndlll <400> 77 aagcttgcat gcctgcaggt cgactctaga ggatccccgg gctggtctgt acattcatct 60 tgccgccttt gcattcactt ggccacaaag agtagagaga aggaagagaa gagcccagac 120 ttcaagaagc gaccttgcaa gtgcactcga gggtcagaaa ctgtatatca tatctatgtg 180 agagaaaggg gaacatttga gatggagtcc atttacttga ggtatactta ttattttgat 240 caataaattt gtatacttct tatttagatc aataaatttg tcattaagct ataatccaaa 300 ataaattacg atcaaatatg caaatgttag ccagtacttg tgttaaactt gatggcatct 360 cttggtttct ttggcaatca catgcctaag aaataaatag tatcatatga ttgtgtttgg 420 tcagacttca gagtcagatg actctgtttg gataaacagc ttaattaagc gcttatagaa 480 tatcatatga ttgtgtttgg tcagacttca gagcatctct tggtttctct ggcaatcata 540 tgcctaagaa ataaatagta tcatatgatt gtgtttggtc agacttcaga gtcagatgac 600 cctgtttggg taaacagctt aattaagtgc ttatagaata agcgcttatc atataagtgc 660 ttttgtacag ttatttctat gaaagtagaa gaaatagtca tattgtttta atataagcta 720 tcctggagag cttgtggaaa taaccagaaa agaacttatg gacacgtcat gagctgttta 780 cataagatct ccctaacagt ctcaaaagtg tttatgccag tagataaatt caaataagtc 840 aatctaaaca gaccctaaat ccattatggt acctatcatt ttagcttatt ccatctttat 900 taagaatgtc atgagataac ataatgataa cacattattt tgacacaaat gggcagatct 960 agcaatttaa ctctggagtc cttcaagact gctgttctta cgaagttcac gtccctgaat 1020 catgttcctg tatggaagcc tgaaagacct caaattctaa aaggtggcga taaattgaag 1080 gtttacaaaa tataccctgc gggcttgaca cagaggcaag ctctttatac cttccagttc 1140 aacggggatg ttgatttcag aagtcacttg gagagcaatc cttgtgccaa gtttgaagta 1200 atttttgtgt agcatatgtt gagctaccta caatttacat gatcacctag cattagctct 1260 ttcacttaac tgagagaatg aagttttagg aatgagtatg accatggagt cggcatggct 1320 ttgtaatgcc taccctactt tggccaactc atcggggatt tacattcaga aaatatacat 1380 gacttcaacc atacttaaac ccctttttgt aagataactg aatgttcata tttaatgttg 1440 ggttgtagtg tttttacttg attatatcca gacagttaca agttggacaa caagattgtg 1500 ggtctgtact gttatttatt tatttttttt ttagcagaaa caccttatct tttgtttcgt 1560 ttgaatgtag aatgaaaata aaagaaagaa aatataacat catcggccgc gcttgtctaa 1620 tttcgggcag ttaggatcct ctccggtcac cggaaagttt cagtagaaga aacaaaacac 1680 cgtgactaaa atgatactat tattttattt attgtgtttt tcttttttct accggaactt 1740 tttagaacgg atcccaactc gttccggggc cgctacaact gaaacaaaag aagatatttt 1800 ctctctcttc agaaatgtaa gttttccttt acagataccc attcaccatt tgattcagat 1860 gtggtgacta gagataaagc atactaattt gactcttgga aacccataaa gtttatgtta 1920 tccgtgttct ggaccaatcc acttgggggc ataacctgtg tctatgtgtg gtttggtttc 1980 ::::attctgatt tatg::: :ggcga cttgtaattt aaaatctagg aggggcagac attgaacaat 2040 cccaatattt taataactta tgcaagattt tttttattaa tgagatgatg tgtttgtgac 2100 tgagattgag tcatacattt cactaagaaa tggttccaag taccaaacta tcatgaccca 2160 gttgcaaaca tgacgttcgg gagtggtcac tttgatagtt caatttcatc ttggcttctt 2220 attcctttta taattctaat tcttcttgtg taaactattt catgtattat ttttctttaa 2280 aatttacatg tcatttattt tgcctcacta actcaatttt gcatataaca atgataagtg 2340 atattttgac tcacaaaatt tacatcaaat ttcgacatcg tttattatgt tcattggatg 2400 attaacaaat ataacaaact ttgcaactaa ttaaccacca actgaatata attaactata 2460 actgtgaaag tagttaactc atttttatat ttcatagatc aaataagaga aataacggta 2520 tattaatccc tccaaaaaaa aaaaacggta tatttactaa aaaatctaag ccacgtagga 2580 ggataacagg atccccgtag gaggataaca tccaatccaa ccaatcacaa caatcctgat 2640 gagataaccc actttaagcc cacgcatctg tggcacatct acattatcta aatcacacat 2700 tcttccacac atctgagcca cacaaaaacc aatccacatc tttatcaccc attctataaa 2760 aaatcacact ttgtgagtct acactttgat tcccttcaaa cacatacaaa gagaagagac 2820 taattaatta attaatcatc ttgagagaaa atgtttgggc gcggaccaac aaggaagagt 2880 gataacacca aatattacga tattcttggt gtttcaaaaa gtgctagtga agatgaaatc 2940 aagaaagcct atagaaaggc agcgatgaag aaccatccag ataagggtgg ggatcctgag 3000 aagttcaagg agttgggcca agcatatgaa gtgttgagcg atcctgaaaa gaaagaactg 3060 tatgatcaat atggtgaaga tgcccttaaa gaaggaatgg ggggaggcgc aggaagctca 3120 tttcataatc cgtttgatat tttcgaatca ttttttggtg caggctttgg tggtggtggt 3180 ccttcacgcg caagaagaca gaagcaagga gaagatgtgg tgcattctat aaaggtttcc 3240 ttggaggatg tgtataacgg cactacaaag aagctatcac tttctaggaa tgcactgtgc 3300 tcaaaatgta aagggaaagg ttcaaaaagt ggaactgctg gaaggtgttt tggatgccag 3360 ggcacaggta tgaagattac cagaaggcaa attggactgg gcatgattca acaaatgcaa 3420 cacgtctgtc ctgactgcaa aggaacaggc gaggtcatta gtgagagaga tagatgccct 3480 caatgcaagg gaaacaagat tactcaagaa aagaaggtgc tggaggtgca tgtggaaaag 3540 gggatgcagc agggtcacaa gattgtattc gaaggacaag ctgatgaagc tcctgataca 3600 atcacaggag acatagtttt tgtcttgcaa gtaaagggac atccgaagtt tcggagggag 3660 cgtgatgacc tccacattga acacaatttg agcttaactg aggctctctg tggcttccag 3720 tttaatgtca cacatcttga tggaaggcaa ctattggtca aatcgaaccc cggcgaagtc 3780 atcaagccag gtcaacataa agctataaat gatgagggaa tgccacaaca tggtaggccg 3840 ttcatgaagg gacgcctata catcaagttt agtgttgatt tcccggattc gggttttctt 3900 tccccaagcc aaagcctgga attagaaaag atattacctc aaaagacaag caagaacttg 3960 tcccaaaagg aggtagatga ttgtgaggag accaccctgc atgatgtcaa tattgcagag 4020 gagatgagtc gaaagaagca acaataccgt gaggcatatg atgacgatga tgatgaagat 4080 gatgagcact cgcagcctcg ggtgcaatgc gctcaacagt aggagctcag ctcgaatttc 4140 cccgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 4200 gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 4260 tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 4320 tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 4380 tctatgttac tagatcgaat tc 4402 <210> 78
<211> 5086 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct number R860, from Hindlll to EcoRI <400> 78 aagcttgcat gcctgcaggt cgactctaga ggatccccgg gctggtctgt acattcatct 60 tgccgccttt gcattcactt ggccacaaag agtagagaga aggaagagaa gagcccagac 120 ttcaagaagc gaccttgcaa gtgcactcga gggtcagaaa ctgtatatca tatctatgtg 180 agagaaaggg gaacatttga gatggagtcc atttacttga ggtatactta ttattttgat 240 caataaattt gtatacttct tatttagatc aataaatttg tcattaagct ataatccaaa 300 ataaattacg atcaaatatg caaatgttag ccagtacttg tgttaaactt gatggcatct 360 cttggtttct ttggcaatca catgcctaag aaataaatag tatcatatga ttgtgtttgg 420 tcagacttca gagtcagatg actctgtttg gataaacagc ttaattaagc gcttatagaa 480 tatcatatga ttgtgtttgg tcagacttca gagcatctct tggtttctct ggcaatcata 540 tgcctaagaa ataaatagta tcatatgatt gtgtttggtc agacttcaga gtcagatgac 600 cctgtttggg taaacagctt aattaagtgc ttatagaata agcgcttatc atataagtgc 660 ttttgtacag ttatttctat gaaagtagaa gaaatagtca tattgtttta atataagcta 720 tcctggagag cttgtggaaa taaccagaaa agaacttatg gacacgtcat gagctgttta 780 cataagatct ccctaacagt ctcaaaagtg tttatgccag tagataaatt caaataagtc 840 aatctaaaca gaccctaaat ccattatggt acctatcatt ttagcttatt ccatctttat 900 taagaatgtc atgagataac ataatgataa cacattattt tgacacaaat gggcagatct 960 agcaatttaa ctctggagtc cttcaagact gctgttctta cgaagttcac gtccctgaat 1020 catgttcctg tatggaagcc tgaaagacct caaattctaa aaggtggcga taaattgaag 1080 gtttacaaaa tataccctgc gggcttgaca cagaggcaag ctctttatac cttccagttc 1140 aacggggatg ttgatttcag aagtcacttg gagagcaatc cttgtgccaa gtttgaagta 1200 atttttgtgt agcatatgtt gagctaccta caatttacat gatcacctag cattagctct 1260 ttcacttaac tgagagaatg aagttttagg aatgagtatg accatggagt cggcatggct 1320 ttgtaatgcc taccctactt tggccaactc atcggggatt tacattcaga aaatatacat 1380 gacttcaacc atacttaaac ccctttttgt aagataactg aatgttcata tttaatgttg 1440 ggttgtagtg tttttacttg attatatcca gacagttaca agttggacaa caagattgtg 1500 ggtctgtact gttatttatt tatttttttt ttagcagaaa caccttatct tttgtttcgt 1560 ttgaatgtag aatgaaaata aaagaaagaa aatataacat catcggccgc gcttgtctaa 1620 tttcgggcag ttaggatcct ctccggtcac cggaaagttt cagtagaaga aacaaaacac 1680 cgtgactaaa atgatactat tattttattt attgtgtttt tcttttttct accggaactt 1740 tttagaacgg atcccaactc gttccggggc cgctacaact gaaacaaaag aagatatttt 1800 ctctctcttc agaaatgtaa gttttccttt acagataccc attcaccatt tgattcagat 1860 gtggtgacta gagataaagc atactaattt gactcttgga aacccataaa gtttatgtta 1920 tccgtgttct ggaccaatcc acttgggggc ataacctgtg tctatgtgtg gtttggtttc 1980 cattctgatt tatgcggcga cttgtaattt aaaatctagg aggggcagac attgaacaat 2040 cccaatattt taataactta tgcaagattt tttttattaa tgagatgatg tgtttgtgac 2100 tgagattgag tcatacattt cactaagaaa tggttccaag taccaaacta tcatgaccca 2160 gttgcaaaca tgacgttcgg gagtggtcac tttgatagtt caatttcatc ttggcttctt 2220 attcctttta taattctaat tcttcttgtg taaactattt catgtattat ttttctttaa 2280 aatttacatg tcatttattt tgcctcacta actcaatttt gcatataaca atgataagtg 2340 atattttgac tcacaaaatt tacatcaaat ttcgacatcg tttattatgt tcattggatg 2400 attaacaaat ataacaaact ttgcaactaa ttaaccacca actgaatata attaactata 2460 actgtgaaag tagttaactc atttttatat ttcatagatc aaataagaga aataacggta 2520 tattaatccc tccaaaaaaa aaaaacggta tatttactaa aaaatctaag ccacgtagga 2580 ggataacagg atccccgtag gaggataaca tccaatccaa ccaatcacaa caatcctgat 2640 gagataaccc actttaagcc cacgcatctg tggcacatct acattatcta aatcacacat 2ΊΟΟ tcttccacac atctgagcca cacaaaaacc aatccacatc tttatcaccc attctataaa 2760 aaatcacact ttgtgagtct acactttgat tcccttcaaa cacatacaaa gagaagagac 2820 taattaatta attaatcatc ttgagagaaa atgtcgggta aaggagaagg accagctatc 2880 ggtatcgatc ttggtaccac ttactcttgc gtcggagtat ggcaacacga ccgtgttgag 2940 atcattgcta atgatcaagg aaacagaacc acgccatctt acgttgcttt caccgactcc 3000 gagaggttga teggtgacgc agctaagaat eaggtcgcca tgaaccccgt taacaccgtt 3060 ttcgacgcta agaggttgat cggtcgtcgt ttctctgaca getctgttca gagtgaeatg 3120 aaattgtggc cattcaagat tcaagccgga cctgccgata agccaatgat ctacgtcgaa 3180 tacaagggtg aagagaaaga gttegcagct gagge.gattt ctteeatggt tcttattaag 3240 atgcgtgaga ttgctgaggc ttaccttggt gtcacaatca agaacgccgt tgttaccgtt 3300 ccagcttact tcaacgactc tcagcgtcag gctacaaagg atgctggtgt catcgctggt 3360 ttgaacgtta tgcgaatcat caacgagcct acagccgccg ctattgccta cggtcttgac 3420 aaaaaggcta ccagcgttgg agagaagaat gttcttatct tcgatcttgg tggtggcact 3480 ΟΩΔ. tttgatgtct ctcttcttac cattgaagag ggtatctttg aggtgaaggc aactgctggt 3540 gacacccatc ttggtgggga agattttgac aacagaatgg ttaaccactt tgtccaagag 3600 ttcaagagga agagtaagaa ggatatcacc ggtaacccaa gagctcttag gaggttgaga 3660 acttcctgtg agagagcgaa gaggactctt tcttccactg ctcagaccac catcgagatt 3720 gactctctat acgagggtat cgacttctac tccaccatca cccgtgctag atttgaggag 3780 ctcaacatgg atctcttcag gaagtgtatg gagccagttg agaagtgtct tcgtgatgct 3840 aagatggaca agagcactgt tcatgatgtt gtccttgttg gtggttctac ccgtatccct 3900 aaggttcagc aattgctcca ggacttcttc aacggcaaag agctttgcaa gtctattaac 3960 cctgatgagg ctgttgccta cggtgctgct gtccagggag ctattctcag cggtgaagga 4020 aacgagaagg ttcaagatct tctattgctc gatgtcactc ctctctccct tggtttggaa 4080 actgccggtg gtgtcatgac cactttgatc ccaaggaaca caaccatccc aaccaagaag 4140 gaacaagtct tctccaccta ctcagacaac caacccggtg tgttgatcca ggtgtacgaa 4200 ggagagagag ccagaaccaa ggacaacaac cttcttggta aatttgagct ctccggaatt 4260 cctccagctc ctcgtggtgt cccccagatc acagtctgct ttgacattga tgccaatggt 4320 atcctcaatg tctctgctga ggacaagacc accggacaga agaacaagat caccatcacc 4380 aatgacaagg gtcgtctctc caaggatgag attgagaaga tggttcaaga ggctgagaag 4440 tacaagtccg aagacgagga gcacaagaag aaggttgaag ccaagaacgc tctcgagaac 4500 tacgcttaca acatgaggaa caccatccaa gacgagaaga ttggtgagaa gctcccggct 4560 gcagacaaga agaagatcga ggattctatt gagcaggcga ttcaatggct cgagggtaac 4620 cagttggctg aggctgatga gttcgaagac aagatgaagg aattggagag catctgcaac 4680 ccaatcattg ccaagatgta ccaaggagct ggtggtgaag ccggtggtcc aggtgcctct 4740 ggtatggacg atgatgctcc ccctgcttca ggcggtgctg gacctaagat cgaggaggtc 4800 gactaagagc tcagctcgaa tttccccgat cgttcaaaca tttggcaata aagtttctta 4860 agattgaatc ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt 4920 aagcatgtaa taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt 4980 agagtcccgc aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag 5040 gataaattat cgcgcgcggt gtcatctatg ttactagatc gaattc 5086
<210> 79 <211> 9493 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct number R870, from Hindlll to EcoRI <400> 79 aagcttgcat gcctgcaggt cgactctaga ggatccccgg gctggtctgt acattcatct 60 tgccgccttt gcattcactt ggccacaaag agtagagaga aggaagagaa gagcccagac 120 ttcaagaagc gaccttgcaa gtgcactcga gggtcagaaa ctgtatatca tatctatgtg 180 agagaaaggg gaacatttga gatggagtcc atttacttga ggtatactta ttattttgat 240 caataaattt gtatacttct tatttagatc aataaatttg tcattaagct ataatccaaa 300 ataaattacg atcaaatatg caaatgttag ccagtacttg tgttaaactt gatggcatct 360 cttggtttct ttggcaatca catgcctaag aaataaatag tatcatatga ttgtgtttgg 420 tcagacttca gagtcagatg actctgtttg gataaacagc ttaattaagc gcttatagaa 480 tatcatatga ttgtgtttgg tcagacttca gagcatctct tggtttctct ggcaatcata 540 tgcctaagaa ataaatagta tcatatgatt gtgtttggtc agacttcaga gtcagatgac 600 cctgtttggg taaacagctt aattaagtgc ttatagaata agcgcttatc atataagtgc 660 ttttgtacag ttatttctat gaaagtagaa gaaatagtca tattgtttta atataagcta 720 tcctggagag cttgtggaaa taaccagaaa agaacttatg gacacgtcat gagctgttta 780 cataagatct ccctaacagt ctcaaaagtg tttatgccag tagataaatt caaataagtc 840 aatctaaaca gaccctaaat ccattatggt acctatcatt ttagcttatt ccatctttat 900 taagaatgtc atgagataac ataatgataa cacattattt tgacacaaat gggcagatct 960 agcaatttaa ctctggagtc cttcaagact gctgttctta cgaagttcac gtccctgaat 1020 catgttcctg tatggaagcc tgaaagacct caaattctaa aaggtggcga taaattgaag 1080 gtttacaaaa tataccctgc gggcttgaca cagaggcaag ctctttatac cttccagttc 1140 aacggggatg ttgatttcag aagtcacttg gagagcaatc cttgtgccaa gtttgaagta 1200 atttttgtgt agcatatgtt gagctaccta caatttacat gatcacctag cattagctct 1260 ttcacttaac tgagagaatg aagttttagg aatgagtatg accatggagt cggcatggct 1320 ttgtaatgcc taccctactt tggccaactc atcggggatt tacattcaga aaatatacat 1380 gacttcaacc atacttaaac ccctttttgt aagataactg aatgttcata tttaatgttg 1440 ggttgtagtg tttttacttg attatatcca gacagttaca agttggacaa caagattgtg 1500 ggtctgtact gttatttatt tatttttttt ttagcagaaa caccttatct tttgtttcgt 1560 ttgaatgtag aatgaaaata aaagaaagaa aatataacat catcggccgc gcttgtctaa 1620 tttcgggcag ttaggatcct ctccggtcac cggaaagttt cagtagaaga aacaaaacac 1680 cgtgactaaa atgatactat tattttattt attgtgtttt tcttttttct accggaactt 1740 tttaqaacgg atcccaactc gttccggggc cgctacaact gaaacaaaag aagatatttt 1800 ctctctcttc agaaatgtaa gttttccttt acagataccc attcaccatt tgattcagat 1860 gtggtgacta gagataaagc atactaattt gactcttgga aacccataaa gtttatgtta 1920 tccgtgttct ggaccaatcc acttgggggc ataacctgtg tctatgtgtg gtttggtttc 1980 cattctgatt tatgcggcga cttgtaattt aaaatctagg aggggcagac attgaacaat 2040 cccaatattt taataactta tgcaagattt tttttattaa tgagatgatg tgtttgtgac 2100 tgagattgag tcatacattt cactaagaaa tggttccaag taccaaacta tcatgaccca 2160 gttgcaaaca tgacgttcgg gagtggtcac tttgatagtt caatttcatc ttggcttctt 2220 attcctttta taattctaat tcttcttgtg taaactattt catgtattat ttttctttaa 2280 aatttacatg tcatttattt tgcctcacta actcaatttt gcatataaca atgataagtg 2340 atattttgac tcacaaaatt tacatcaaat ttcgacatcg tttattatgt tcattggatg 2400 attaacaaat ataacaaact ttgcaactaa ttaaccacca actgaatata attaactata 2460 actgtgaaag tagttaactc atttttatat ttcatagatc aaataagaga aataacggta 2520 tattaatccc tccaaaaaaa aaaaacggta tatttactaa aaaatctaag ccacgtagga 2580 ggataacagg atccccgtag gaggataaca tccaatccaa ccaatcacaa caatcctgat 2640 gagataaccc actttaagcc cacgcatctg tggcacatct acattatcta aatcacacat 2700 tcttccacac atctgagcca cacaaaaacc aatccacatc tttatcaccc attctataaa 2760 aaatcacact ttgtgagtct aeactttgat tcccttcaaa cacatacaaa gagaagagac 2820 taattaatta attaatcatc ttgagagaaa atgtcgggta aaggagaagg accagctatc 2880 ggtatcgatc ttggtaccac ttactcttgc gtcggagtat ggcaacacga ccgtgttgag 2940 atcattgcta atgatcaagg aaacagaacc acgccatctt acgttgcttt caccgactcc 3000 gagaggttga tcggtgacgc agctaagaat caggtcgcca tgaaccccgt taacaccgtt 3060 ttcgacgcta agaggttgat cggtcgtcgt ttctctgaca gctctgttca gagtgacatg 3120 aaattgtggc eattcaagat tcaagcegga cctgccgata agccaatgat ctacgtcgaa 3180 tacaagggtg aagagaaaga gttegeagct gaggagattt cttccatggt tcttattaag 3240 atgcgtgaga ttgctgaggc ttaccttggt gtcacaatca agaacgccgt tgttaccgtt 3300 ccagcttact tcaacgactc tcagcgtcag gctacaaagg atgctggtgt catcgctggt 3360 ttgaacgtta tgcgaatcat caacgagcct acagccgccg ctattgccta cggtcttgac 3420 aaaaaggcta ccagcgttgg agagaagaat gttcttatct tcgatcttgg tggtggcact 3480 tttgatgtct ctcttcttac cattgaagag ggtatctttg aggtgaaggc aactgctggt 3540 gacacccatc ttggtgggga agattttgac aacagaatgg ttaaccactt tgtccaagag 3600 >11 ttcaagagga agagtaagaa ggatatcacc ggtaacccaa gagctcttag gaggttgaga 3660 acttcctgtg agagagcgaa gaggactctt tcttccactg ctcagaccac catcgagatt 3720 gactctctat acgagggtat cgacttctac tccaccatca cccgtgctag atttgaggag 3780 ctcaacatgg atctcttcag gaagtgtatg gagccaqttg agaagtgtct tcgtgatgct 3840 aagatggaca agagcactgt tcatgatgtt gtccttgttg gtggttctac ccgtatccct 3900 aaggttcagc aattgctcca ggacttcttc aacggcaaag agctttgcaa gtctattaac 3960 cctgatgagg ctgttgccta cggtgctgct gtccagggag ctattctcag cggtgaagga 4020 aacgagaagg ttcaagatct tctattgctc gatgtcactc ctctctccct tggtttggaa 4080 actgccggtg gtgtcatgac cactttgatc ccaaggaaca caaccatccc aaccaagaag 4140 gaacaagtct tctccaccta ctcagacaac caacccggtg tgttgatcca ggtgtacgaa 4200 ggagagagag ccagaaccaa ggacaacaac cttcttggta aatttgagct ctccggaatt 4260 cctccagctc ctcgtggtgt cccccagatc acagtctgct ttgacattga tgccaatggt 4320 atcctcaatg tctctgctga ggacaagacc accggacaga agaacaagat caccatcacc 4380 aatgacaagg gtcgtctctc caaggatgag attgagaaga tggttcaaga ggctgagaag 4440 tacaagtccg aagacgagga gcacaagaag aaggttgaag ccaagaacgc tctcgagaac 4500 tacgcttaca acatgaggaa caccatccaa gacgagaaga ttggtgagaa gctcccggct 4560 gcagacaaga agaagatcga ggattctatt gagcaggcga ttcaatggct cgagggtaac 4620 cagttggctg aggctgatga gttcgaagac aagatgaagg aattggagag catctgcaac 4680 ccaatcattg ccaagatgta ccaaggagct ggtggtgaag ccggtggtcc aggtgcctct 4740 ggtatggacg atgatgctcc ccctgcttca ggcggtgctg gacctaagat cgaggaggtc 4800 gactaagagc tcagctcgaa tttccccgat cgttcaaaca tttggcaata aagtttctta 4860 agattgaatc ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt 4920 aagcatgtaa taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt 4980 agagtcccgc aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag 504 0 gataaattat cgcgcgcggt gtcatctatg ttactagatc gaattcgtaa tcatggtcat 5100 agctgtttcc tgtgtgaaat tgttatccgg ggctggtctg tacattcatc ttgccgcctt 5160 tgcattcact tggccacaaa gagtagagag aaggaagaga agagcccaga cttcaagaag 5220 cgaccttgca agtgcactcg agggtcagaa actgtatatc atatctatgt gagagaaagg 5280 ggaacatttg agatggagtc catttacttg aggtatactt attattttga tcaataaatt 5340 tgtatacttc ttatttagat caataaattt gtcattaagc tataatccaa aataaattac 5400 gatcaaatat gcaaatgtta gccagtactt gtgttaaact tgatggcatc tcttggtttc 5460 tttggcaatc acatgcctaa gaaataaata gtatcatatg attgtgtttg gtcagacttc 5520 agagtcagat gactctgttt ggataaacag cttaattaag cgcttataga atatcatatg 5580 attgtgtttg gtcagacttc agagcatctc ttggtttctc tggcaatcat atgcctaaga 5640 aataaatagt atcatatgat tgtgtttggt cagacttcag agtcagatga ccctgtttgg 5700 gtaaacagct taattaagtg cttatagaat aagcgcttat catataagtg cttttgtaca 5760 gttatttcta tgaaagtaga agaaatagtc atattgtttt aatataagct atcctggaga 5820 gcttgtggaa ataaccagaa aagaacttat ggacacgtca tgagctgttt acataagatc 5380 tccctaacag tctcaaaagt gtttatgcca gtagataaat tcaaataagt caatctaaac 5940 agaccctaaa tccattatgg tacctatcat tttagcttat tccatcttta ttaagaatgt 6000 catgagataa cataatgata acacattatt ttgacacaaa tgggcagatc tagcaattta 6060 actctg9agt ccttcaagac t9ctgttctt acgaagttca cgtccctgaa tcatgttcct 6120 gtatggaagc ctgaaagacc tcaaattcta aaaggtggcg ataaattgaa ggtttacaaa 6180 atataccct9 cgggcttgac acagaggcaa gctctttata ccttccagtt caacgg9gat 6240 gttgatttca gaagtcactt ggagagcaat ccttgtgcca agtttgaagt aatttttgtg 6300 tagcatatgt tgagctacct acaatttaca tgatcaccta gcattagctc tttcacttaa 6360 ctgagagaat gaagttttag gaatgagtat gaccatggag tcggcatggc tttgtaatgc 6420 ctaccctact ttggccaact catcggggat ttacattcag aaaatataca tgacttcaac 6480 catacttaaa cccctttttg taagataact gaatgttcat atttaatgtt gggttgtagt 6540 gtttttactt gattatatcc agacagttac aagttggaca acaagattgt gggtctgtac 6600 tgttatttat ttattttttt tttagcagaa acaccttatc ttttgtttcg tttgaatgta 6660 gaatgaaaat aaaagaaaga aaatataaca tcatcggccg cgcttgtcta atttcgggca 6720 gttaggatcc tctccggtca ccggaaagtt tcagtagaag aaacaaaaca ccgtgactaa 6780 aatgatacta ttattttatt tattgtgttt ttcttttttc taccggaact ttttagaacg 6840 ratcccaact cgttccgggg ccgctacaac tgaaacaaaa gaagatattt tctctctctt 6900 cagaaatgta agttttcctt tacagatacc cattcaccat ttgattcaga tgtggtgact 6960 agagataaag catactaatt tgactcttgg aaacccataa agtttatgtt atccgtgttc 7020 tggaccaatc cacttggggg cataacctgt gtctatgtgt ggtttggttt ccattctgat 7080 ttatgcggcg acttgtaatt taaaatctag gaggggcaga cattgaacaa tcccaatatt 7140 ttaataactt atgcaagatt ttttttatta atgagatgat gtgtttgtga ctgagattga 7200 gtcat=tcatt tcactaagaa atggttccaa gtaccaaact atcatgaccc agttgcaaac 7260 atgacgttcg ggagtggtca ctttgatagt tcaatttcat cttggcttct tattcctttt 7320 ataattctaa ttcttcttgt gtaaactatt tcatgtatta tttttcttta aaatttacat 7380 gtcatttatt ttgcctcact aactcaattt tgcatataac aatgataagt gatattttga 7440 ctcacaaaat ttacatcaaa tttcgacatc gtttattatg ttcattggat gattaacaaa 7500 tataacaaac tttgcaacta attaaccacc aactgaatat aattaactat aactgtgaaa 7560 gtagttaact catttttata tttcatagat caaataagag aaataacggt atattaatcc 7620 ctccaaaaaa aaaaaacggt atatttacta aaaaatctaa gccacgtagg aggataacag 7680 gatccccgta ggaggataac atccaatcca accaatcaca acaatcctga tgagataacc 7740 cactttaagc ccacgcatct gtggcacatc tacattatct aaatcacaca ttcttccaca 7800 catctgagcc acacaaaaac caatccacat ctttatcacc cattctataa aaaatcacac 7860 tttgtgagtc tacactttga ttcccttcaa acacatacaa agagaagaga ctaattaatt 7920 aattaatcat cttgagagaa aatgtttggg cgcggaccaa caaggaagag tgataacacc 7980 aaatattacg atattcttgg tgtttcaaaa agtgctagtg aagatgaaat caagaaagcc 804 0 tatagaaagg cagcgatgaa gaaccatcca gataagggtg gggatcctga gaagttcaag 8100 gagttgggcc aagcatatga agtgttgagc gatcctgaaa agaaagaact gtatgatcaa 8160 tatggtgaag atgcccttaa agaaggaatg gggggaggcg caggaagctc atttcataat 8220 ccgtttgata ttttcgaatc attttttggt gcaggctttg gtggtggtgg tccttcacgc 8280 gcaagaagac agaagcaagg agaagatgtg gtgcattcta taaaggtttc cttggaggat 8340 gtgtataacg gcactacaaa gaagctatca ctttctagga atgcactgtg ctcaaaatgt 8400 aaagggaaag gttcaaaaag tggaactgct ggaaggtgtt ttggatgcca gggcacaggt 84 60 atgaagatta ccagaaggca aattggactg ggcatgattc aacaaatgca acacgtctgt 8520 cctgactgca aaggaacagg cgaggtcatt agtgagagag atagatgccc tcaatgcaag 8580 ggaaacaaga ttactcaaga aaagaaggtg ctggaggtgc atgtggaaaa ggggatgcag 8 64 0 cagggtcaca agattgtatt cgaaggacaa gctgatgaag ctcctgatac aatcacagga 8700 gacataqttt ttgtcttgca agtaaaggga catccgaagt ttcggaggga gcgtgatgac 8760 ctccacattg aacacaattt gagcttaact gaggctctct gtggcttcca gtttaatgtc 8820 acacatcttg atggaaggca actattggtc aaatcgaacc ccggcgaagt catcaagcca 8880 ggtcaacata aagctataaa tgatgaggga atgccacaac atggtaggcc gttcatgaag 8 94 0 ggacgcctat acatcaagtt tagtgttgat ttcccggatt cgggttttct ttccccaagc 9000 caaagcctgg aattagaaaa gatattacct caaaagacaa gcaagaactt gtcccaaaag 9060 917 gaggtagatg attgtgagga gaccaccctg catgatgtca atattgcaga ggagatgagt 9120 cgaaagaagc aacaataccg tgaggcatat gatgacgatg atgatgaaga tgatgagcac 9180 tcgcagcctc gggtgcaatg cgctcaacag taggagctca gctcgaattt ccccgatcgt 9240 tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt 9300 atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg 9360 ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata 9420 gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta 9480 ctagatcgaa ttc 9493
<210> 80 <211> 568 <212> PUT <213> Artificial Sequence <220> <223> Synthesized amino add translation of coding sequence In construct 690 expression cassette <400> 80
Met Glu Lys lie Val Leu Leu Leu Ala lie Val Ser Leu Val Lys Ser 15 10 15
Asp Gin lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Glu Gin Val 20 25 30
Asp Thr lie Met Glu Lys Asn Val Thr Val Thr His Ala Gin Asp lie 35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys 50 55 60
Pro Leu He Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn 65 70 75 80
Pro Met Cys Asp Glu Phe lie Asn Val Pro Glu Trp Ser Tyr lie Val 85 90 95
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly His Phe Ala 100 105 110
Asp Tyr Glu Glu Leu Arg Glu Gin Leu Ser Ser Val Ser Ser Phe Glu 115 120 125
Arg Phe Glu lie Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr Val 130 135 140
Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser ser Phe Tyr 145 150 155 160
Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn Leu 165 170 175
Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu Trp 180 185 190
Gly Val His His Pro Pro Asn lie Gly Asp Gin Lys Ala Leu Tyr His 195 200 205
Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg Lys 210 215 220
Phe Thr Pro Glu lie Ala Lys Arg Pro Lys Val Arg Asp Gin Glu Gly 225 230 235 240
Arg lie Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr lie lie 245 250 255
Phe Glu Ala Asn Gly Asn Leu lie Ala Pro Arg Tyr Ala Phe Ala Leu 260 265 270
Ser Arg Gly Phe Gly Ser Gly lie Met Lys Ser Glu Leu Glu Tyr Gly 275 280 285
Asn Cys Asn Thr Lys Cys Gin Thr Pro Met Gly Ala lie Asn Ser Ser 290 295 300
Met Pro Phe His Asn lie His Pro Leu Thr lie Gly Glu Cys Pro Lys 305 310 315 320
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser 325 330 335
Pro Gin Arg Glu Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala lie 340 345 350
Ala Gly Phe lie Glu Gly Gly Trp Gin Gly Met Val Asp Gly Trp Tyr 355 360 365
Gly Tyr His His Ser Asn Glu Gin Gly Ser Gly Tyr Ala Ala Asp Lys 370 375 380
Glu Ser Thr Gin Lys Ala lie Asp Gly Val Thr Asn Lys Val Asn Ser 385 390 395 400
He He Asp Lys Met Asn Thr Gin Phe Glu Ala val Gly Arg Glu Phe 405 410 415
Asn Asn Leu Glu Arg Arg lie Glu Asn Leu Asn Lys Lys Met Glu Asp 420 425 430
Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met 435 440 445
Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu 450 455 460
Tyr Asp Lys Val Arg Leu Gin Leu Arg Asp Asn Ala Lys Glu Leu Gly 465 470 475 480
Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu 485 490 495
Ser lie Arg Asn Gly Thr Tyr Asn Tyr Pro Gin Tyr Ser Glu Glu Ala 500 505 510 991
Arg Leu Lys Arg Glu Glu lie Ser Gly Val Lys Leu Glu Ser lie Gly 515 520 525
Thr Tyr Gin lie Leu Ser lie Tyr Ser Thr Val Ala Ser Ser Leu Ala 530 535 540
Leu Ala lie Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly 545 550 555 560
Ser Leu Gin Cys Arg lie Cys lie 565
<210> 81 <211> 568 <212> PRT <213> Artificial Sequence <22Q> <223> Synthesized Amino acid translation of coding sequence hi construct 691 expression cassette <400> 81
Met Glu Lys lie Val Leu Leu Leu Ala lie Val Ser Leu Val Lys Ser 15 10 15
Asp Gin lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Glu Gin Val 20 25 30
Asp Thr lie Met Glu Lys Asn Val Thr Val Thr His Ala Gin Asp lie 35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Leu Leu Lys Gly lie Ala 50 55 60
Pro Leu Gin Leu Gly Asn Cys Ser Val Ala Gly Trp lie Leu Gly Asn 65 70 75 80
Pro Glu Cys Glu Leu Leu lie Ser Lys Glu Ser Trp Ser Tyr lie Val 85 90 95
Glu Lys Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly His Phe Ala 100 105 110
Asp Tyr Glu Glu Leu Arg Glu Gin Leu Ser Ser Val Ser Ser Phe Glu 115 120 125
Arg Phe Glu lie Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr Val 130 135 140
Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser Ser Phe Tyr 145 150 155 160
Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn Leu 165 170 175
Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu Trp 180 185 190
Gly Val His His Pro Pro Asn lie Gly Asp Gin Lys Ala Leu Tyr His 195 200 205
Thr Glu Asn Ala Tyr Vai Ser Vai Vai Ser Ser His Tyr Ser Arg Lys 210 215 220
Phe Thr Pro Glu lie Ala Lys Arg Pro Lys Vai Arg Asp Gin Glu Gly 225 230 235 240
Arg lie Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr lie Ile 245 250 255
Phe Glu Ala Asn Gly Asn Leu lie Ala Pro Arg Tyr Ala Phe Ala Leu 260 265 270
Ser Arg Gly Phe Gly Ser Gly Ile Ile Asn Ser Asn Ala Pro Met Asp 275 280 285
Lys Cys Asn Thr Lys Cys Gin Thr Pro Met Gly Ala Ile Asn Ser Ser 290 295 3JO
Met Pro Phe His Asn lie His Pro Leu Thr lie Gly Glu Cys Pro Lys 305 310 315 320
Tyr Vai Lys Ser Asn Arg Leu Vai Leu Ala Thr Gly Leu Arg Asn Ser 325 330 335
Pro Gin Arg Glu Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile 340 345 350
Ala Gly Phe lie Glu Gly Gly Trp Gin Gly Met Vai Asp Gly Trp Tyr 355 360 365
Gly Tyr His His Ser Asn Glu Gin Gly Ser Gly Tyr Ala Ala Asp Lys 370 375 380
Glu Ser Thr Gin Lys Ala Ile Asp Gly Vai Thr Asn Lys Vai Asn Ser 385 390 395 400 lie lie Asp Lys Met Asn Thr Gin Phe Glu Ala Vai Gly Arg Glu Phe 405 410 415
Asn Asn Leu Glu Arg Arg lie Glu Asn Leu Asn Lys Lys Met Glu Asp 420 425 430
Gly Phe Leu Asp Vai Trp Thr Tyr Asn Ala Glu Leu Leu Vai Leu Met 435 440 445
Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Vai Lys Asn Leu 450 455 460
Tyr Asp Lys Vai Arg Leu Gin Leu Arg Asp Asn Ala Lys Glu Leu Gly 465 470 475 480
Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu 485 490 495
Ser lie Arg A:sn Gly Thr Tyr A:sn Tyr Pro Gin Tyr Ser Glu Glu Ala 500 505 510
Arg Leu Lys Arg Glu Glu Ile Ser Gly Vai Lys Leu Glu Ser Ile Gly 515 520 525
Thr Tyr Gin lie Leu Ser lie Tyr Ser Thr Val Ala Ser Ser Leu Ala 530 535 540
Leu Ala lie Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly 545 550 555 560
Ser Leu Gin Cys Arg lie Cys lie 565
<210>82 <211> 572 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Amino acid translation of coding sequence in construct 696 expression cassette <400> 82
Met Ala Lys Asn Val Ala lie Phe Gly Leu Leu Phe Ser Leu Leu Val 15 10 15
Leu Val Pro Ser Gin lie Phe Ala Asp Thr lie Cys lie Gly Tyr His 20 25 30
Ala Asn Asn Ser Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val 35 40 45
Thr Val Thr His Ser Val Asn Leu Leu Glu Asp Ser His Asn Gly Lys 50 55 60
Leu Cys Leu Leu Lys Gly lie Ala Pro Leu Gin Leu Gly Asn Cys Ser 65 70 75 80
Val Ala Gly Trp lie Leu Gly Asn Pro Glu Cys Glu Leu Leu lie Ser 85 90 95
Lys Glu Ser Trp Ser Tyr lie Val Glu Thr Pro Asn Pro Glu Asn Gly 100 105 110
Thr Cys Tyr Pro Gly Ser Phe Asn Asp Tyr Glu Glu Leu Lys His Leu 115 120 125
Leu Ser Arg lie Asn His Phe Glu Lys lie Gin lie lie Pro Lys Ser 130 135 140
Ser Trp Ser Asp His Glu Ala Ser Ser Gly Val Ser Ser Ala Cys Pro
Tyr Leu Gly Ser Pro Ser Phe Phe Arg Asn Val Val Trp Leu lie Lys 165 170 175
Lys Asn Ser Thr Tyr Pro Thr lie Lys Lys Ser Tyr Asn Asn Thr Asn 180 185 190
Gin Glu Asp Leu Leu Val Leu Trp Gly lie His His Pro Asn Asp Ala 195 200 205
Ala Glu Gin Thr Arg Leu Tyr Gin Asn Pro Thr Thr Tyr He Ser lie 210 215 220
Gly Thr Ser Thr Leu Asn Gin Arg Leu Val Pro Lys lie Ala Thr Arg 225 230 235 240
Ser Lys Val Asn Gly Gin Ser Gly Arg Met Glu Phe Phe Trp Thr lie 245 250 255
Leu Lys Pro Asn Asp Ala lie Asn Phe Glu Ser Asn Gly Asn Phe lie 260 265 270
Ala Pro Glu Tyr Ala Tyr Lys lie Val Lys Lys Gly Asp Ser Ala lie 275 280 285 lie Thr Ser Asn Ala Pro Met Asp Glu Cys Asp Ala Lys Cys Gin Thr 290 295 300
Pro Gin Gly Ala lie Asn Ser Ser Leu Pro Phe Gin Asn Val His Pro 305 310 315 320
Val Thr lie Gly Glu Cys Pro Lys Tyr Val Arg Ser Ala Lys Leu Arg 325 330 335
Met Val Thr Gly Leu Arg Asn lie Pro Ser lie Gin Ser Arg Gly Leu 340 345 350
Phe Gly Ala lie Ala Gly Phe lie Glu Gly Gly Trp Thr Gly Met Val 355 360 365
Asp Gly Trp Tyr Gly Tyr His His Gin Asn Glu Gin Gly Ser Gly Tyr 370 375 380
Ala Ala Asp Gin Lys Ser Thr Gin Asn Ala lie Asn Gly lie Thr Asn 385 390 395 400
Lys Val Asn Ser Val lie Glu Lys Met Asn Thr Gin Phe Thr Ala Val 405 410 415
Gly Lys Glu Phe Asn Lys Leu Glu Arg Arg JY:et Glu Asn Leu Asn Lys 420 425 430
Lys Val Asp Asp Gly Phe Leu Asp lie Trp Thr Tyr Asn Ala Glu Leu 435 440 445
Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn 450 455 460
Val Lys Asn Leu Tyr Glu Lys Val Lys Ser Gin Leu Lys Asn Asn Ala 465 470 475 480
Lys Glu lie Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asn Asn 485 490 495
Glu Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr 500 505 510
Ser Glu Glu Ser Lys Leu Asn Arg Glu Lys lie Asp Gly Val Lys Leu 515 520 525
Glu Ser Met Gly Vai Tyr Gin lie Leu Ala Ile Tyr Ser Thr Vai Ala __535_5AQ_
Ser Ser Leu Vai Leu Leu Vai Ser Leu Gly Ala Ile Ser Phe Trp Met 545 550 555 560
Cys Ser Asn Gly Ser Leu Gin Cys Arg Ile Cys Ile 565 570
<210> S3 <211>575 <212> PRT <213> Artificial Sequence <220> <223> Synthesbed amino add translation of coding sequence In construct 737 expression cassette <400> 83
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val 15 10 15
Leu Val Pro Ser Gin He Phe Ala Gin Lys Leu Pro Gly Asn Asp Asn 20 25 30
Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr 35 40 45
Ile Val Lys Thr Ile Thr Asn Asp Gin Ile Glu Val Thr Asn Ala Thr 50 55 60
Glu Leu Val Gin Ser Ser Ser Thr Gly Glu Ile Cys Asp Ser Pro His 65 70 75 80
Gin Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly 85 90 95
Asp Pro Gin Cys Asp Gly Phe Gin Asn Lys Lys Trp Asp Leu Phe Val 100 105 110
Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp 115 120 125
Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe 130 135 140
Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gin Asn Gly Thr Ser 145 150 155 160
Ser Ala Cys Ile Arg Arg Ser Asn Asn Ser Phe Phe Ser Arg Leu Asn 165 170 175
Trp Leu Thr His Leu Lys Phe Lys Tyr Pro Ala Leu Asn Val Thr Met 180 185 190
Pro Asn Asn Glu Lys Phe Asp Lys Leu Tyr lie Trp Gly Val His His 195 200 205
Pro Gly Thr Asp Asn Asp Gin lie Phe Leu Tyr Ala Gin Ala Ser Gly 210 215 220
Arg lie Thr Val Ser Thr Lys Arg Ser Gin Gin Thr Val lie Pro Asn 225 230 235 240
He Gly Ser Arg Pro Arg Val Arg Asn lie Pro Ser Arg lie Ser He 245 250 255
Tyr Trp Thr lie Val Lys Pro Gly Asp He Leu Leu He Asn Ser Thr 260 265 270
Gly Asn Leu He Ala Pro Arg Gly Tyr Phe Lys He Arg Ser Gly Lys 275 280 285
Ser Ser He Met Arg Ser Asp Ala Pro He Gly Lys Cys Asn Ser Glu 290 295 300
Cys He Thr Pro Asn Gly Ser He Pro Asn Asp Lys Pro Phe Gin Asn 305 310 315 320
Val Asn Arg He Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gin Asn 325 330 335
Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gin Thr 340 345 350
Arg Gly He Phe Gly Ala He Ala Gly Phe He Glu Asn Gly Trp Glu 355 360 365
Gly Met Val Asp Cly Trp Tyr Gly Phe Arg His Gin Asn Ser Glu Gly 370 375 380
He Gly Gin Ala Ala Asp Leu Lys Ser Thr Gin Ala Ala He Asp Gin 385 390 395 400
He Asn Gly Lys Leu Asn Arg Leu He Gly Lys Thr Asn Glu Lys Phe 405 410 415
His Gin He Glu Lys Glu Phe Ser Glu Val Glu Gly Arg He Gin Asp 420 425 430
Leu Glu Lys Tyr Val Glu Asp Thr Lys He Asp Leu Trp Ser Tyr Asn 435 440 445
Ala Glu Leu Leu Val Ala Leu Glu Asn Gin His Thr He Asp Leu Thr 450 455 460
Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gin Leu Arg 465 470 475 480
Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys He Tyr His Lys 485 490 495
Cys Asp Asn Ala Cys He Gly Ser He Arg Asn Gly Thr Tyr Asp His 500 505 510
Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gin He Lys Gly 515 520 525
Val Glu Leu Lys Ser He Gly Thr Tyr Gin He Leu Ser He Tyr Ser 530 535 540
Thr Vai Ala Ser Ser Leu Ala Leu Ala lie Met Met Ala Gly Leu Ser 545 550 555 560
Leu Trp Met Cys Ser Asn Gly Ser Leu Gin Cys Arg lie Cys lie 565 570 575
<210> 84 <211 > 593 <212> PRT <213> Artificial Sequence <220> <223> Synthesized amino acid translation of coding sequence in construct 745 expression cassette <400> 84
Met Ala Lys Asn Val Ala He Phe Gly Leu Leu Phe Ser Leu Leu Val 15 10 15
Leu Val Pro Ser Gin lie Phe Ala Asp Arg He Cys Thr Gly lie Thr 5 20 25 30
Ser Ser Asn Ser Pro His Val Val Lys Thr Ala Thr Gin Gly Glu Val 35 40 45
Asn Val Thr Gly Val He Pro Leu Thr Thr Thr Pro Thr Lys Ser Tyr 50 55 60
Phe Ala Asn Leu Lys Gly Thr Arg Thr Arg Gly Lys Leu Cys Pro Asp 65 70 75 80 15
Cys Leu Asn Cys Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Met Cys 85 90 95
Val Gly Thr Thr Pro Ser Ala Lys Ala Ser He Leu His Glu Val Lys 20 1 00 1 05 110
Pro Val Thr Ser Gly Cys Phe Pro He Met His Asp Arg Thr Lys He 115 120 125 25 Arg Gin Leu Pro Asn Leu Leu Arg Gly Tyr Glu Asn He Arg Leu Ser 130 135 140
Thr Gin Asn Val He Asp Ala Glu Lys Ala Pro Gly Gly Pro Tyr Arg 145 150 155 160 30
Leu Gly Thr Ser Gly Ser Cys Pro Asn Ala Thr Ser Lys Ser Gly Phe 165 170 175
Phe Ala Thr Met Ala Trp Ala Val Pro Lys Asp Asn Asn Lys Asn Ala 180 185 190 35
Thr Asn Pro Leu Thr Val Glu Val Pro Tyr He Cys Thr Glu Gly Glu 195 200 205
Asp Gin He Thr Val Trp Gly Phe His Ser Asp Asn Lys Thr Gin Met 40 210 215 220
Lys Asn Leu Tyr Gly Asp Ser Asn Pro Gin Lys Phe Thr Ser Ser Ala 225 230 235 240 45 Asn Gly Val Thr Thr His Tyr Val Ser Gin lie Gly Ser Phe Pro Asp
JO 55 245 250 255
Gin Thr Glu Asp Gly Gly Leu Pro Gin Ser Gly Arg lie Val Val Asp 260 265 270 s
Tyr Met Met Gin Lys Pro Gly Lys Thr Gly Thr lie Val Tyr Gin Arg 275 280 285
Gly Val Leu Leu Pro Gin Lys Val Trp Cys Ala Ser Gly Arg Ser Lys „ 290 295 300
Val lie Lys Gly Ser Leu Pro Leu lie Gly Glu Ala Asp Cys Leu His 305 310 315 320
Glu Lys Tyr Gly Gly Leu Asn Lys Ser Lys Pro Tyr Tyr Thr Gly Glu H 325 330 335
His Ala Lys Ala lie Gly Asn Cys Pro lie Trp Val Lys Thr Pro Leu 340 345 350 20 Lys Leu Ala Asn Gly Thr Lys Tyr Arg Pro Pro Ala Lys Leu Leu Lys 355 360 365
Glu Arg Gly Phe Phe Gly Ala He Ala Gly Phe Leu Glu Gly Gly Trp 370 375 380 25 Glu Gly Met lie Ala Gly Trp His Gly Tyr Thr Ser His Gly Ala His 385 390 395 400
Gly Val Ala Val Ala Ala Asp Leu Lys Ser Thr Gin Glu Ala He Asn 405 410 415 30
Lys He Thr Lys Asn Leu Asn Ser Leu Ser Glu Leu Glu Val Lys Asn 420 425 430
Leu Gin Arg Leu Ser Gly Ala Met Asp Glu Leu His Asn Glu lie Leu 435 440 445 35
Glu Leu Asp Glu Lys Val Asp Asp Leu Arg Ala Asp Thr He Ser Ser 450 455 460
Gin lie Glu Leu Ala Val Leu Leu Ser Asn Glu Gly lie lie Asn Ser 40 4 6 5 4 7 0 4 7 5 4 8 0
Glu Asp Glu His Leu Leu Ala Leu Glu Arg Lys Leu Lys Lys Met Leu 485 490 495 45 Gly Pro Ser Ala Val Glu He Gly Asn Gly Cys Phe Glu Thr Lys His 500 505 510
Lys Cys Asn Gin Thr Cys Leu Asp Arg He Ala Ala Gly Thr Phe Asn 515 520 525 30 Ala Gly Glu Phe Ser Leu Pro Thr Phe Asp Ser Leu Asn He Thr Ala 530 535 540
Ala Ser Leu Asn Asp Asp Gly Leu Asp Asn Tyr Gin lie Leu Ser lie 545 550 555 560 55
Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu Ala lie Met Met Ala Gly 565 570 575
Leu Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gin Cys Arg lie Cys 580 585 590 lie 5
<210>85 <211>405 <212> DNA <213> ArtHielal Sequence 10 <220» <223> Synthesized Sacl-Plasto 3(prime)UTR sequence <400>85 is 60 gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat 120 tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga 180 20 tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca 240 taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt 300 25 360 caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta 405 ttaactacta attttatatc atcccctttg ataaatgata gtaca 30 <210> 86
<211> 1718 <212> DNA <213> Artificial Sequence 35 <220> <22J> Synthesized POI sp - A/CalHbmia/W/09 <40086 40 atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttcctctc 60 agatcttcgc tgacacatta tgtataggtt atcatgcgaa caattcaaca gacactgtag 120 5 acacagtact agaaaagaat gtaacagtaa cacactctgt taaccttcta gaagacaagc 180 ataacgggaa actatgcaaa ctaagagggg tagccccatt gcatttgggt aaatgtaaca 240 ttgctggctg gatcctggga aatccagagt gtgaatcact ctccacagca agctcatggt 300 10 cctacattgt ggaaacacct agttcagaca atggaacgtg ttacccagga gatttcatcg 360 attatgagga gctaagagag caattaagct cagtgtcatc atttgaaagg tttgagatat 420 *5 tccccaagac aagttcatgg cccaatcatg actcgaacaa aggtgtaacg gcagcatgtc 480 ctcatgctgg agcaaaaagc ttctacaaaa atttaatatg gctagttaaa aaaggaaatt 540 catacccaaa gctcagcaaa tcctacatta atgataaagg gaaagaagtc ctcgtgctat 600 20 ggggcattca ccatccatct actagtgctg accaacaaag tctctatcag aatgcagata 660 catatgtttt tgtggggtca tcaagataca gcaagaagtt caagccggaa atagcaataa 720 25 gacccaaagt gagggatcaa gaagggagaa tgaactatta ctggacacta gtagagccgg 780 gagacaaaat aacattcgaa gcaactggaa atctagtggt accgagatat gcattcgcaa 840 tggaaagaaa tgctggatct ggtattatca tttcagatac accagtccac gattgcaata 900 caacttgtca aacacccaag ggtgctataa acaccagcct cccatttcag aatatacatc 960 cgatcacaat tggaaaatgt ccaaaatatg taaaaagcac aaaattgaga ctggccacag 1020 35 gattgaggaa tatcccgtct attcaatcta gaggactatt tggggccatt gccggtttca 1080 ttgaaggggg gtggacaggg atggtagatg gatggtacgg ttatcaccat caaaatgagc 1140 aggggtcagg atatgcagcc gacctgaaga gcacacagaa tgccattgac gagattacta 1200 acaaagtaaa ttctgttatt gaaaagatga atacacagtt cacagcagta ggtaaagagt 1260 tcaaccacct ggaaaaaaga atagagaatt taaataaaaa agttgatgat ggtttcctgg 1320 *s acatttggac ttacaatgcc gaactgttgg ttctattgga aaatgaaaga actttggact 1380 accacgattc aaatgtgaag aacttatatg aaaaggtaag aagccagcta aaaaacaatg 1440 ccaaggaaat tggaaacggc tgctttgaat tttaccacaa atgcgataac acgtgcatgg 1500 50 aaagtgtcaa aaatgggact tatgactacc caaaatactc agaggaagca aaattaaaca 1560 gagaagaaat agatggggta aagctggaat caacaaggat ttaccagatt ttggcgatct 1620 ss attcaactgt cgccagttca ttggtactgg tagtctccct gggggcaatc agtttctgga 1680 tgtgctctaa tgggtctcta cagtgtagaa tatgtatt 1718
<210> 87 <211> 573 <212> PRT <213> Artificial Sequence <220> <223> Synthesized POI sp- A/CalHbmia 04/09 <400> 87
Met Ala Lys Asn Val Ala lie Phe Gly Leu Leu Phe Ser Leu Leu Val 15 10 15
Leu Val Pro Ser Gin lie Phe Ala Asp Thr Leu Cys lie Gly Tyr His 20 25 30
Ala Asn Asn Ser Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val 35 40 45
Thr Val Thr His Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys 50 55 60
Leu Cys Lys Leu Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn 65 70 75 80 lie Ala Gly Trp lie Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr 85 90 95
Ala Ser Ser Trp Ser Tyr lie Val Glu Thr Pro Ser Ser Asp Asn Gly 100 105 110
Thr Cys Tyr Pro Gly Asp Phe lie Asp Tyr Glu Glu Leu Arg Glu Gin 115 120 125
Leu Ser Ser Val Ser Ser Phe Glu Arg Phe Glu lie Phe Pro Lys Thr 130 135 140
Ser Ser Trp Pro Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys 145 150 155 160
Pro His Ala Gly Ala Lys Ser Phe Tyr Lys Asn Leu lie Trp Leu Val 165 170 175
Lys Lys Gly Asn Ser Tyr Pro Lys Leu Ser Lys Ser Tyr lie Asn Asp 180 185 190
Lys Gly Lys Glu Val Leu Val Leu Trp Gly lie His His Pro Ser Thr 195 200 205
Ser Ala Asp Gin Gin Ser Leu Tyr Gin Asn Ala Asp Thr Tyr ValPt.e 210 215 220
Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys Pro Glu lie Ala lie 225 230 235 240
Arg Pro Lys Val Arg Asp Gin Glu Gly Arg Met Asn Tyr Tyr Trp Thr 245 250 255
Leu Val Glu Pro Gly Asp Lys lie Thr Phe Glu Ala Thr Gly Asn Leu 260 265 270
Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly 275 280 285 lie lie lie Ser Asp Thr Pro val His Asp Cys Asn Thr Thr Cys Gin 290 295 300
Thr Pro Lys Gly Ala lie Asn Thr Ser Leu Pro Phe Gin Asn lie His 305 310 315 320
Pro He Thr lie Gly Lys Cys Pro Lys Tyr val Lys Ser Thr Lys Leu 325 330 335
Arg Leu Ala Thr Gly Leu Arg Asn lie Pro Ser lie Gin Ser Arg Gly 340 345 350
Leu Phe Gly Ala lie Ala Gly Phe lie Glu Gly Gly Trp Thr Gly Met 355 360 365
Val Asp Gly Trp Tyr Gly Tyr His His Gin Asn Glu Gin Gly Ser Gly 370 375 380
Tyr Ala Ala Asp Leu Lys Ser Thr Gin Asn Ala lie Asp Glu lie Thr 385 390 395 400
Asn Lys Val Asn Ser Val lie Glu Lys Met Asn Thr Gin Phe Thr Ala 405 410 415
Vai Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn 420 425 430
Lys Lys Vai Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu 435 440 445
Leu Leu Vai Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr Hls Asp Ser 450 455 460
Asn Vai Lys Asn Leu Tyr Glu Lys Vai Arg Ser Gin Leu Lys Asn Asn 465 470 475 480
Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp 485 490 495
Asn Thr Cys Met Glu Ser Vai Lys Asn Gly Thr Tyr Asp Tyr Pro Lys 500 505 510
Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Vai Lys 515 520 525
Leu Glu Ser Thr Arg lie Tyr Gin Ile Leu Ala Ile Tyr Ser Thr Vai 530 535 540
Ala Ser Ser Leu Vai Leu Vai Vai Ser Leu Gly Ala Ile Ser Phe Trp 545 550 555 560
Met Cys Ser Asn Gly Ser Leu Gin Cys Arg lie Cys Ile 565 570
<210>tt <211> 747 <212> D NA <213> Artificial Sequence <220» <223> Synthesized 2X35S promoter sequence <400>88 gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60 gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120 ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180 tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240 ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300 acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360 tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420 agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480 aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540 atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600 atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660 tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720 taaggaagtt catttcattt ggagagg 747
<210> 89 <211>43 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Pad-MCS-2X35S.c <400>89 aattgttaat taagtcgaca agcttgcatg cctgcaggtc aac 43
<210> 90 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthesized CPMV 5{prtme)l/TR-2X35S.r <400> 90 tcaaaaccta ttaagatttt aatacctctc caaatgaaat gaacttcc 48
<210> 91 <211> 49 <212> DNA <2U> Artificial Sequence <220> <223> Synthesized 2X35S-CPMV 5(prlme)UTR.c <400> 91 ttggagaggt attaaaatct taataggttt tgataaaagc gaacgtggg 49
<210> 92 <211 >44 <212> DNA <213> Artificial Sequence <220> <223> Synthesized Apal-M prot.r <400> 92 tctccatggg cccgacaaat ttgggcagaa tatacagaag ctta 44 <210> 93 <211>3580
<212> DNA <213> Artificial Sequence <220> <223> Synthesized Construct 747, from Pad to Asel <400> 93 ttaattaagt cgacaagctt gcatgcctgc aggtcaacat ggtggagcac gacacacttg 60 tctactccaa aaatatcaaa gatacagtct cagaagacca aagggcaatt gagacttttc 120 aacaaagggt aatatccgga aacctcctcg gattccattg cccagctatc tgtcacttta 180 ttgtgaagat agtggaaaag gaaggtggct cctacaaatg ccatcattgc gataaaggaa 240 aggccatcgt tgaagatgcc tctgccgaca gtggtcccaa agatggaccc ccacccacga 300 ggagcatcgt ggaaaaagaa gacgttccaa ccacgtcttc aaagcaagtg gattgatgtg 360 ataacatggt ggagcacgac acacttgtct actccaaaaa tatcaaagat acagtctcag 420 aagaccaaag ggcaattgag acttttcaac aaagggtaat atccggaaac ctcctcggat 480 tccattgccc agctatctgt cactttattg tgaagatagt ggaaaaggaa ggtgqctcct 540 acaaatgcca tcattgcgat aaaggaaagg ccatcgttga agatgcctct gccgacagtg 600 gtcccaaaga tggaccccca cccacgagga gcatcgtgga aaaagaagac gttccaacca 660 cgtcttcaaa gcaagtggat tgatgtgata tctccactga cgtaagggat gacgcacaat 720 cccactatcc ttcgcaagac ccttcctcta tataaggaag ttcatttcat ttggagaggt 780 attaaaatct taataggttt tgataaaagc gaacgtgggg aaacccgaac caaaccttct 840 tctaaactct ctctcatctc tcttaaagca aacttctctc ttgtctttct tgcgtgagcg 900 atcttcaacg ttgtcagatc gtgcttcgqc accagtacaa cgttttcttt cactgaagcg 960 aaatcaaaga tctctttgtg gacacgtagt gcggcgccat taaataacgt gtacttgtcc 1020 tattcttgtc ggtgtggtct tgggaaaaga aagcttgctg gaggctgctg ttcagcccca 1080 tacattactt gttacgattc tgctgacttt cggcgggtgc aatatctcta cttctgcttg 1140 acgaggtatt gttgcctgta cttctttctt cttcttcttg ctgattggtt ctataagaaa 1200 tctagtattt tctttgaaac agagttttcc cgtggttttc gaacttggag aaagattgtt 1260 aagcttctgt atattctgcc caaatttgtc gggcccatgg cgaaaaacgt tgcgattttc 1320 ggcttattgt tttctcttct tgtgttggtt ccttctcaga tcttcgctga tcgaatctgc 1380 actggaataa catcttcaaa ctcacctcat gtggtcaaaa cagccactca aggggaggtc 1440 aatgtgactg gtgtgatacc actaacaaca acaccaacaa aatcttattt tgcaaatctc 1500 aaaggaacaa ggaccagagg gaaacbatgc ccagacfcgfcc tcaactgcac agatctggat 1560 gtggctttgg gcagaccaat gtgtgtgggg aecaeaectt cggcgaaggc ttcaatactc 1620 cacgaagtca aacctgttac atccgggtgc tttcctataa tgcacgacag aacaaaaalc 1680 aggcaactac ccaatcttct cagaggatat gaaaatatca ggctatcaac ccaaaacgtc 1740 atcqatgcgg aaaaggcacc aggaggaccc tacagacttg gaacctcagg atcttgccct 1800 aacgctacca gtaagagcgg atttttcgca acaatggctt gggctgtccc aaaggacaac 1860 aacaaaaatg caacgaaccc actaacagta gaagtaccat acatttgtac agaaggggaa 1920 gaccaaatca ctgtttgggg gttccattca gataacaaaa cccaaatgaa gaacctctat 1980 ggagactcaa atcctcaaaa gttcacctca tctgctaatg gagtaaccac acactatgtt 2040 tctcagattg gcagcttccc agatcaaaca gaagacggag gactaccaca aagcggcagg 2100 attgttgttg attacatgat gcaaaaacct gggaaaacag gaacaattgt ctaccaaaga 2160 ggtgttttgt tgcctcaaaa ggtgtggtgc gcgagtggca ggagcaaagt aataaaaggg 2220 tccttgcctt taattggtga agcagattgc cttcatgaaa aatacggtgg attaaacaaa 2280 agcaagcctt actacacagg agaacatgca aaagccatag gaaattgccc aatatgggtg 2340 aaaacacctt tgaagctcgc caatggaacc aaatatagac ctcctgcaaa actattaaag 2400 gaaaggggtt tcttcggagc tattgctggt ttcctagaag gaggatggga aggaatgatt 2460 gcaggctggc acggatacac atctcacgga gcacatggag tggcagtggc ggcggacctt 2520 aagagtacgc aagaagctat aaacaagata acaaaaaatc tcaattcttt gagtgagcta 2580 gaagtaaaga atcttcaaag actaagtggt gccatggatg aactccacaa cgaaatactc 2640 gagctggatg agaaagtgga tgatctcaga gctgacacta taagctcgca aatagaactt 2700 gcagtcttgc tttccaacga aggaataata aacagtgaag atgagcatct attggcactt 2760 gagagaaaac taaagaaaat gctgggtccc tctgctgtag agataggaaa tggatgcttc 2820 gaaaccaaac acaagtgcaa ccagacctgc ttagacagga tagctgctgg cacctttaat 2880 gcaggagaat tttctctccc cacttttgat tcactgaaca ttactgctgc atctttaaat 2940 gatgatggat tggataacta ccaaatactg tcaatttatt caacagtggc gagttcccta 3000 gcactggcaa tcatgatggc tggtctatct ttatggatgt gctccaatgg atcgttacaa 3060 tgcagaattt gcatttaaag gcctattttc tttagtttga atttactgtt attcggtgtg 3120 catttctatg tttggtgagc ggttttctgt gctcagagtg tgtttatttt atgtaattta 3180 atttctttgt gagctcctgt ttagcaggtc gtcccttcag caaggacaca aaaagatttt 3240 aattttatta aaaaaaaaaa aaaaaaagac cgggaattcg atatcaagct tatcgacctg 3300 cagatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg 3360 cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat 3420 gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat 3480 acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat 3540 ctatgttact agattctaga gtctcaagct tcggcgcgcc 3580
<210> 94 <211> S69 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Influenza B virus B/Florida/4/2006 <400> 94
Asp Arg lie Cys Thr Gly lie Thr Ser Ser Asn Ser Pro His Val Val 15 10 15
Lys Thr Ala Thr Gin Gly Glu Val Asn Val Thr Gly Val lie Pro Leu 20 25 30
Thr Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg 35 40 45
Thr Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp 50 55 60
Val Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys 65 70 75 80
Ala Ser lie Leu His Glu Val Lys Pro Val Thr Ser Gly Cys Phe Pro 85 90 95 lie Met His Asp Arg Thr Lys lie Arg Gin Leu Pro Asn Leu Leu Arg 100 105 110
Gly Tyr Glu Asn lie Arg Leu Ser Thr Gin Asn Val lie Asp Ala Glu 115 120 125
Lys Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro 130 135 140
Asn Ala Thr Ser Lys Ser Gly Phe Phe Ala Thr Met Ala Trp Ala Val 145 150 155 160
Pro Lys Asp Asn Asn Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val 165 170 175
Pro Tyr lie Cys Thr Glu Gly Glu Asp Gin lie Thr Val Trp Gly Phe 180 185 190
His Ser Asp Asp Lys Thr Gin Met Lys Asn Leu Tyr Gly Asp Ser Asn 195 200 205
Pro Gin Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val 210 215 220
Ser Gin lie Gly Ser Phe Pro Asp Gin Thr Glu Asp Gly Gly Leu Pro 225 230 235 240
Gin Ser Gly Arg lie Val Val Asp Tyr Met Met Gin Lys Pro Gly Lys 245 250 255
Thr Gly Thr lie Val Tyr Gin Arg Gly Val Leu Leu Pro Gin Lys Val 260 265 270
Trp Cys Ala Ser Gly Arg Ser Lys Val lie Lys Gly Ser Leu Pro Leu 275 280 285 lie Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys 290 295 300
Ser Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala lie Gly Asn Cys 305 310 315 320
Pro lie Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr 325 330 335
Arg Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala lie 340 345 350
Ala Gly Phe Leu Glu Gly Gly Trp Glu Gly Met lie Ala Gly Trp His 355 360 365
Gly Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu 370 375 380
Lys Ser Thr Gin Glu Ala lie Asn Lys lie Thr Lys Asn Leu Asn Ser 385 390 395 400
Leu Ser Glu Leu Glu Val Lys Asn Leu Gin Arg Leu Ser Gly Ala Met 405 410 415
Asp Glu Leu His Asn Glu lie Leu Glu Leu Asp Glu Lys Val Asp Asp 420 425 430
Leu Arg Ala Asp Thr lie Ser Ser Gin lie Glu Leu Ala Val Leu Leu 435 440 445
Ser Asn Glu Gly lie lie Asn Ser Glu Asp Glu His Leu Leu Ala Leu 450 455 460
Glu Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu lie Gly 465 470 475 480
Asn Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gin Thr Cys Leu Asp 485 490 495
Arg lie Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr 500 505 510
Phe Asp Ser Leu Asn lie Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu 515 520 525
Asp Asn His Thr lie Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu 530 535 540
Ala Val Thr Leu Met Leu Ala lie Phe lie Val Tyr Met Val Ser Arg 545 550 555 560
Asp Asn Val Ser Cys Ser lie Cys Leu 565 <210> 95
<211> 570 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Influenza B virus B/Malaysia/2506/2004 <400> 95
Asp Arg lie Cys Thr Gly lie Thr Ser Ser Asn Ser Pro His Val Val 15 10 15
Lys Thr Ala Thr Gin Gly Glu Val Asn Val Thr Gly Val lie Pro Leu 20 25 30
Thr Thr Thr Pro Thr Lys Ser His Phe Ala Asn Leu Lys Gly Thr Glu 35 40 45
Thr Arg Gly Lys Leu Cys Pro Lys Cys Leu Asn Cys Thr Asp Leu Asp 50 55 60
Val Ala Leu Gly Arg Pro Lys Cys Thr Gly Asn lie Pro Ser Ala Arg 65 70 75 80
Val Ser lie Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro 85 90 95 lie Met His Asp Arg Thr Lys lie Arg Gin Leu Pro Lys Leu Leu Arg 100 105 110
Gly Tyr Glu His lie Arg Leu Ser Thr His Asn Val lie Asn Ala Glu 115 120 125
Asn Ala Pro Gly Gly Pro Tyr Lys lie Gly Thr Ser Gly Ser Cys Pro 130 135 140
Asn Val Thr Asn Gly Asn Gly Phe Phe Ala Thr Met Ala Trp Ala Val 145 150 155 160
Pro Lys Asn Asp Asn Asn Lys Thr Ala Thr Asn Ser Leu Thr lie Glu 165 170 175
Val Pro Tyr lie Cys Thr Glu Gly Glu Asp Gin lie Thr Val Trp Gly 180 185 190
Phe His Ser Asp Asn Glu Thr Gin Met Ala Lys Leu Tyr Gly Asp Ser 195 200 205
Lys Pro Gin Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr 210 215 220
Vai Ser Gin lie Gly Gly Phe Pro Asn Gin Thr Glu Asp Gly Gly Leu 225 230 235 240
Pro Gin Ser Gly Arg lie Vai Vai Asp Tyr Met Vai Gin Lys Ser Gly 245 250 255
Lys Thr Gly Thr lie Thr Tyr Gin Arg Gly lie Leu Leu Pro Gin Lys 260 265 270
Vai Trp Cys Ala Ser Gly Arg Ser Lys Vai Ile Lys Gly Ser Leu Pro 275 280 285
Leu Ile Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn 290 295 300
Lys Ser Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn 305 310 315 320
Cys Pro lie Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys 325 330 335
Tyr Arg Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala 340 345 350 lie Ala Gly Phe Leu Glu Gly Gly Trp Glu Gly Met lie Ala Gly Trp 355 360 365
His Gly Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp 370 375 380
Leu Lys Ser Thr Gin Glu Ala lie Asn Lys lie Thr Lys Asn Leu Asn 385 390 395 400
Ser Leu Ser Glu Leu Glu Val Lys Asn Leu Gin Arg Leu Ser Gly Ala 405 410 415
Met Asp Glu Leu His Asn Glu lie Leu Glu Leu Asp Glu Lys Val Asp 420 425 430
Asp Leu Arg Ala Asp Thr lie Ser Ser Gin lie Glu Leu Ala Val Leu 435 440 445
Leu Ser Asn Glu Gly lie lie Asn Ser Glu Asp Glu His Leu Leu Ala 450 455 460
Leu Glu Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu lie 465 470 475 480
Gly Asn Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gin Thr Cys Leu 485 490 495
Asp Arg lie Ala Ala Gly Thr Phe Asp Ala Gly Glu Phe Ser Leu Pro 500 505 510
Thr Phe Asp Ser Leu Asn lie Thr Ala Ala Ser Leu Asn Asp Asp Gly 515 520 525
Leu Asp Asn His Thr lie Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser 530 535 540
Leu Ala Val Thr Leu Met lie Ala lie Phe Val Val Tyr Met Val Ser 545 550 555 560
Arg Asp Asn Val Ser Cys Ser lie Cys Leu 565 570
<210> 96 <211> 548 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Influenza A virus A/Brisbane/59/2007(HlNl) <400> 96
Asp Thr lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Asp Thr Val 15 10 15
Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn Leu 20 25 30
Leu Glu Asn Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly lie Ala 35 40 45
Pro Leu Gin Leu Gly Asn Cys Ser Val Ala Gly Trp lie Leu Gly Asn 50 55 60
Pro Glu Cys Glu Leu Leu lie Ser Lys Glu Ser Trp Ser Tyr lie Val 65 70 75 80
Glu Lys Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly His Phe Ala 85 90 95
Asp Tyr Glu Glu Leu Arg Glu Gin Leu Ser Ser Val Ser Ser Phe Glu 100 105 110
Arg Phe Glu lie Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr Val 115 120 125
Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser Ser Phe Tyr 130 135 140
Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn Leu 145 150 155 160
Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu Trp 165 170 175
Gly Val His His Pro Pro Asn lie Gly Asn Gin Lys Ala Leu Tyr His 180 185 190
Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg Lys 195 200 205
Phe Thr Pro Glu lie Ala Lys Arg Pro Lys Val Arg Asp Gin Glu Gly 210 215 220
Arg lie Jl.sn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr lie lie 225 230 235 240
Phe Glu Ala Asn Gly Asn Leu lie Ala Pro Arg Tyr Ala Phe Ala Leu 245 250 255
Ser Arg Gly Phe Gly Ser Gly lie lie Asn Ser Asn Ala Pro Met Asp 260 265 270
Lys Cys Asp Ala Lys Cys Gin Thr Pro Gin Gly Ala lie Asn Ser Ser 275 280 285
Leu Pro Phe Gin Asn Val His Pro Val Thr lie Gly Glu Cys Pro Lys 290 295 300
Tyr Vai Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn lie 305 310 315 320
Pro Ser lie Gin Ser Arg Gly Leu Phe Gly Ala lie Ala Gly Phe lie 325 330 335
Glu Gly Gly Trp Thr Gly Met Vai Asp Gly Trp Tyr Gly Tyr His His 340 345 350
Gin Asn Glu Gin Gly Ser Gly Tyr Ala Ala Asp Gin Lys Ser Thr Gin 355 360 365
Asn Ala lie Asn Gly Ile Thr Asn Lys Vai Asn Ser Vai Ile Glu Lys 370 375 380
Met Asn Thr Gin Phe Thr Ala Vai Gly Lys Glu Phe Asn Lys Leu Glu 385 390 395 400
Arg Arg Met Glu Asn Leu Asn Lys Lys Vai Asp Asp Gly Phe Ile Asp 405 410 415
Ile Trp Thr Tyr Asn Ala Glu Leu Leu Vai Leu Leu Glu Asn Glu Arg 420 425 430
Thr Leu Asp Phe His Asp Ser Asn Vai Lys Asn Leu Tyr Glu Lys Vai 435 440 445
Lys Ser Gin Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe 450 455 460
Glu Phe Tyr His Lys Cys Asn Asp Glu Cys Met Glu Ser Vai Lys Asn 465 470 475 480
Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn Arg 485 490 495
Glu Lys Ile Asp Gly Vai Lys Leu Glu Ser Met Gly Vai Tyr Gin Ile 500 505 510
Leu Ala Ile Tyr Ser Thr Vai Ala Ser Ser Leu Vai Leu Leu Vai Ser 515 520 525
Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gin Cys 530 535 540
Arg lie Cys Ile 545
<210> 97 <211> 548 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Influenza A vírus A/Solomon lslands/3/2006(HlNl) <400> 97
Asp Thr lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Asp Thr Val 15 10 15
Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn Leu 20 25 30
Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly lie Ala 35 40 45
Pro Leu Gin Leu Gly Asn Cys Ser Val Ala Gly Trp lie Leu Gly Asn 50 55 60
Pro Glu Cys Glu Leu Leu lie Ser Arg Glu Ser Trp Ser Tyr lie Val 65 70 75 80
Glu Lys Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly His Phe Ala 85 90 95
Asp Tyr Glu Glu Leu Arg Glu Gin Leu Ser Ser Val Ser Ser Phe Glu 100 105 110
Arg Phe Glu lie Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr Thr 115 120 125
Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser Ser Phe Tyr 130 135 140
Lys Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn Leu 145 150 155 160
Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu Trp 165 170 175
Gly Val His His Pro Pro Asn lie Gly Asp Gin Arg Ala Leu Tyr His 180 185 190
Lys Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arq Lys 195 200 205
Phe Thr Pro Glu lie Ala Lys Arg Pro Lys Val Arg Asp Gin Glu Gly 210 215 220
Arg lie Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr lie lie 225 230 235 240
Phe Glu Ala Asn Gly Asn Leu lie Ala Pro Arg Tyr Ala Phe Ala Leu 245 250 255
Ser Arg Gly Phe Gly Ser Gly lie lie Asn ser Asn Ala Pro Met Asp 260 265 270
Glu Cys Asp Ala Lys Cys Gin Thr Pro Gin Gly Ala lie Asn Ser Ser 275 280 285
Leu Pro Phe Gin Asn Val His Pro Val Thr lie Gly Glu Cys Pro Lys 290 295 300
Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn lie 305 310 315 320
Pro Ser lie Gin Ser Arg Gly Leu Phe Gly Ala lie Ala Gly Phe lie 325 330 335
Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His 340 345 350
Gin Asn Glu Gin Gly Ser Gly Tyr Ala Ala Asp Gin Lys Ser Thr Gin 355 360 365
Asn Ala lie Asn Gly Ile Thr Asn Lys Vai Asn Ser Vai Ile Glu Lys 370 375 380
Met Asn Thr Gin Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu Glu 385 390 395 400
Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe lie Asp 405 410 415 lie Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg 420 425 430
Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val 435 440 445
Lys Ser Gin Leu Lys Asn Asn Ala Lys Glu lie Gly Asn Gly Cys Phe 450 455 460
Glu Phe Tyr His Lys Cys Asn Asp Glu Cys Met Glu Ser Val Lys Asn 465 470 475 480
Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn Arg 485 490 495
Glu Lys lie Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gin lie 500 505 510
Leu Ala lie Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser 515 520 525
Leu Gly Ala lie Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gin Cys 530 535 540
Arg lie Cys lie 545
<210> 98 <211> 548 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Influenza A virus A/New Caledonla/20/1999(H1N1) <400> 98
Asp Thr lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Asp Thr Val 15 10 15
Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn Leu 20 25 30
Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly lie Ala 35 40 45
Pro Leu Gin Leu Gly Asn Cys Ser Val Ala Gly Trp lie Leu Gly Asn 50 55 60
Pro Glu Cys Glu Leu Leu lie Ser Lys Glu Ser Trp Ser Tyr lie Val 65 70 75 80
Glu Thr Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Tyr Phe Ala 85 90 95
Asp Tyr Glu Glu Leu Arg Glu Gin Leu Ser Ser Val Ser Ser Phe Glu 100 105 110
Arg Phe Glu lie Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr Val 115 120 125
Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Lys Ser Ser Phe Tyr 130 135 140
Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn Leu 145 150 155 160
Ser Lys Ser Tyr Val Asn Asn Lys Glu Lys Glu Val Leu Val Leu Trp 165 170 175
Gly Val His His Pro Pro Asn lie Gly Asn Gin Arg Ala Leu Tyr His 180 185 190
Thr Glu Asn Ala Tyr val Ser Val Val Ser Ser His Tyr Ser Arg Arg 195 200 205
Phe Thr Pro Glu lie Ala Lys Arg Pro Lys Val Arg Asp Gin Glu Gly 210 215 220
Arg lie Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr lie lie 225 230 235 240
Phe Glu Ala Asn Gly Asn Leu lie Ala Pro Trp Tyr Ala Phe Ala Leu 245 230 255
Ser Arg Gly Phe Gly Ser Gly lie lie Thr Ser Asn Ala Pro Met Asp 260 265 270
Glu Cys Asp Ala Lys Cys Gin Thr Pro Gin Gly Ala lie Asn Ser Ser 275 280 285
Leu Pro Phe Gin Asn Val His Pro Val Thr lie Gly Glu Cys Pro Lys 290 295 300
Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn lie 305 310 315 320
Pro Ser lie Gin Ser Arg Gly Leu Phe Gly Ala He Ala Gly Phe lie 325 330 335
Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His 340 345 350
Gin Asn Glu Gin Gly Ser Gly Tyr Ala Ala Asp Gin Lys Ser Thr Gin 355 360 365
Asn Ala He Asn Gly He Thr Asn Lys Val Asn Ser Val He Glu Lys 370 375 380
Met Asn Thr Gin Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu Glu 385 390 395 400
Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp 405 410 415 lie Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg 420 425 430
Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val 435 440 445
Lys Ser Gin Leu Lys Asn Asn Ala Lys Glu lie Gly Asn Gly Cys Phe 450 455 460
Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys Asn 465 470 475 480
Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn Arg 485 490 495
Glu Lys lie Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gin lie 500 505 510
Leu Ala lie Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser 515 520 525
Leu Gly Ala lie Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gin Cys 530 535 540
Arg lie Cys lie 545
<210> 99 <211> 547 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Influenza A virus A/Slngapore/l/1957(H2N2) <400» 99
Asp Gin lie Cys He Gly Tyr His Ala Asn Asn Ser Thr Glu Lys Val 15 10 15
Asp Thr lie Leu Glu Arg Asn Val Thr Val Thr His Ala Lys Asp lie 20 25 30
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Lys Leu Asn Gly He Pro 35 40 45
Pro Leu Glu Leu Gly Asp Cys Ser lie Ala Gly Trp Leu Leu Gly Asn 50 55 60
Pro Glu Cys Asp Arg Leu Leu Ser Val Pro Glu Trp Ser Tyr He Met 65 70 75 80
Glu Lys Glu Asn Pro Arg Asp Gly Leu Cys Tyr Pro Gly Ser Phe Asn 85 90 95
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Ser Val Lys His Phe Glu 100 105 110
Lys Val Lys He Leu Pro Lys Asp Arg Trp Thr Gin His Thr Thr Thr 115 120 125
Gly Gly Ser Arg Ala Cys Ala Val Ser Gly Asn Pro Ser Phe Phe Arg 130 135 140
Asn Met Val Trp Leu Thr Lys Lys Glu Ser Asn Tyr Pro Val Ala Lys 145 150 155 160
Gly Ser Tyr Asn Asn Thr Ser Gly Glu Gin Met Leu lie lie Trp Gly 165 170 175
Val His His Pro Asn Asp Glu Thr Glu Gin Arg Thr Leu Tyr Gin Asn 180 185 190
Val Gly Thr Tyr Val Ser Val Gly Thr Ser Thr Leu Asn Lys Arg Ser 195 200 205
Thr Pro Asp lie Ala Thr Arg Pro Lys Val Asn Gly Leu Gly Ser Arg 210 215 220
Met Glu Phe Ser Trp Thr Leu Leu Asp Met Trp Asp Thr lie Asn Phe 225 230 235 240
Glu Ser Thr Gly Asn Leu lie Ala Pro Glu Tyr Gly Phe Lys lie Ser 245 250 255
Lys Arg Gly Ser Ser Gly lie Met Lys Thr Glu Gly Thr Leu Glu Asn 260 265 270
Cys Glu Thr Lys Cys Gin Thr Pro Leu Gly Ala lie Asn Thr Thr Leu 275 280 285
Pro Phe His Asn Val His Pro Leu Thr lie Gly Glu Cys Pro Lys Tyr 290 295 300
Val Lys Ser Glu Lys Leu Val Leu Ala Thr Gly Leu Arg Asn Val Pro 305 310 315 320
Gin lie Glu Ser Arg Gly Leu Phe Gly Ala lie Ala Gly Phe lie Glu 325 330 335
Gly Gly Trp Gin Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser 340 345 350
Asn Asp Gin Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gin Lys 355 360 365
Ala Phe Asp Gly lie Thr Asn Lys Val Asn Ser Val lie Glu Lys Met 370 375 380
Asn Thr Gin Phe Glu Ala Val Gly Lys Glu Phe Ser Asn Leu Glu Arg 385 390 395 400
Arrr Τ.Α1Ί fll π ZLcn T.ail 71 ο·η Taíc T.we Mat Tiers ίϊΐ w UVsta T.an &amp;ev\ TTa 1 405 410 415
Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr 420 425 430
Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg 435 440 445
Met Gin Leu Arg Asp Asn Val Lys Glu Leu Gly Asn Gly Cys Phe Glu 450 455 460
Phe Tyr His Lys Cys Asp Asp Glu Cys Met Asn Ser Val Lys Asn Gly 465 470 475 480
Thr Tyr Asp Tyr Pro Lys Tyr Glu Glu Glu Ser Lys Leu Asn Arg Asn 485 490 495
Glu lie Lys Gly Val Lys Leu Ser Ser Met Gly Val Tyr Gin lie Leu 500 505 510
Ala lie Tyr Ala Thr Val Ala Gly Ser Leu Ser Leu Ala lie Met Met 515 520 525
Ala Gly lie Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gin Cys Arg 530 535 540 lie Cys lie 545
<210> 100 <211>541 <212> PRT <213> Artificial Sequence <220> <223> Synthesized [Influenza A virus A/Brisbane/10/2007(H3N2) <400> 100
Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr lie 15 10 15
Val Lys Thr lie Thr Asn Asp Gin lie Glu Val Thr Asn Ala Thr Glu 20 25 30
Leu Val Gin Ser Ser Ser Thr Gly Glu lie Cys Asp Ser Pro His Gin 35 40 45 lie Leu Asp Gly Glu Asn Cys Thr Leu lie Asp Ala Leu Leu Gly Asp 50 55 60
Pro Gin Cys Asp Gly Phe Gin Asn Lys Lys Trp Asp Leu Phe Val Glu 65 70 75 80
Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp Tyr 85 90 95
Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe Asn 100 105 110
Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gin Asn Gly Thr Ser Ser 115 120 125
Ala Cys lie Arg Arg Ser Asn Asn Ser Phe Phe Ser Arg Leu Asn Trp 130 135 140
Leu Thr His Leu Lys Phe Lys Tyr Pro Ala Leu Asn Val Thr Met Pro 145 150 155 160
Asn Asn Glu Lys Phe Asp Lys Leu Tyr lie Trp Gly Vai His His Pro 165 170 175
Gly Thr Asp Asn Asp Gin Ile Phe Leu Tyr Ala Gin Ala Ser Gly Arg 180 185 190
Ile Thr Vai Ser Thr Lys Arg Ser Gin Gin Thr Vai lie Pro Asn Ile 195 200 205
Gly Ser Arg ?ro Arg Vai Arg Asn lie Pro Ser Arg Ile Ser Ile Tyr 210 215 220
Trp Thr lie Vai Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr Gly 225 230 235 240
Asn Leu lie Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys Ser 245 250 255
Ser lie Met Arg Ser Asp Ala Pro lie Gly Lys Cys Asn Ser Glu Cys 260 265 270 lie Thr Pro Asn Gly Ser lie Pro Asn Asp Lys Pro Phe Gin Asn Vai 275 280 285
Asn Arg lie Thr Tyr Gly Ala Cys Pro Arg Tyr Vai Lys Gin Asn Thr 290 295 300
Leu Lys Leu Ala Thr Gly Met Arg Asn Vai Pro Glu Lys Gin Thr Arg 305 310 315 320
Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu Gly 325 330 335
Met Vai Asp Gly Trp Tyr Gly Phe Arg His Gin Asn Ser Glu Gly Ile 340 345 350
Gly Gin Ala Ala Asp Leu Lys Ser Thr Gin Ala Ala Ile Asp Gin Ile 355 360 365
Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe His 370 375 380
Gin Ile Glu Lys Glu Phe Ser Glu Vai Glu Gly Arg Ile Gin Asp Leu 385 390 395 400
Glu Lys Tyr Vai Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn Ala 405 410 415
Glu Leu Leu Vai Ala Leu Glu Asn Gin His Thr Ile Asp Leu Thr Asp 420 425 430
Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gin Leu Arg Glu 435 440 445
Asn Ala Glu Asp Met Gly J:..snGly Cys Phe Lys lie Tyr His Lys Cys 450 455 460
Asp Asn Ala Cys He Gly Ser lie Arg Asn Gly Thr Tyr Asp His Asp 465 470 475 480
Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gin lie Lys Gly Val 485 490 495
Glu Leu Lys Ser Gly Tyr Lys Asp Trp lie Leu Trp Ile Ser Phe Ala 500 505 510
Ile Ser Cys Phe Leu Leu Cys Vai Ala Leu Leu Gly Phe lie Met Trp 515 520 525
Ala Cys Gin Lys Gly Asn lie Arg Cys Asn lie Cys Ile 530 535 540
<210> 101 <211> 541 <212> PRT <213> Artificial Sequence <220> <223> Synthesized A/Wisconsin/67e5/2005(H3) <400> 101
Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr lie 15 10 15
Val Lys Thr lie Thr Asn Asp Gin lie Glu Val Thr Asn Ala Thr Glu 20 25 30
Leu Val Gin Ser Ser Ser Thr Gly Gly lie Cys Asp Ser Pro His Gin 35 40 45 lie Leu Asp Gly Glu Asn Cys Thr Leu lie Asp Ala Leu Leu Gly Asp 50 55 60
Pro Gin Cys Asp Gly Phe Gin Asn Lys Lys Trp Asp Leu Phe Val Glu 65 70 75 80
Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp Tyr 85 90 95
Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe Asn 100 105 110
Asp Glu Ser Phe Asn Trp Thr Gly Val Thr Gin Asn Gly Thr Ser Ser 115 120 125
Ala Cys Lys Arg Arg Ser Asn Asn Ser Phe Phe Ser Arg Leu Asn Trp 130 135 140
Leu Thr His Leu Lys Phe Lys Tyr Pro Ala Leu Asn Val Thr Met Pro 145 150 155 160
Asn Asn Glu Lys Phe Asp Lys Leu Tyr lie Trp Gly Val His His Pro 165 170 175
Gly Thr Asp Asn Asp Gin lie Phe Leu His Ala Gin Ala Ser Gly Arg 180 185 190 lie Thr Val Ser Thr Lys Arg Ser Gin Gin Thr Val lie Pro Asn lie 195 200 205
Gly Ser Arg Pro Arg lie Arg Asn lie Pro Ser Arg lie Ser lie Tyr 210 215 220
Trp Thr lie Val Lys Pro Gly Asp lie Leu Leu lie Asn Ser Thr Gly 225 230 235 240
Asn Leu He Ala Pro Arg Gly Tyr Phe Lys lie Arg Ser Gly Lys Ser 245 250 255
Ser He Met Arg Ser Asp Ala Pro He Gly Lys Cys Asn Ser Glu Cys 260 265 270
He Thr Pro Asn Gly Ser He Pro Asn Asp Lys Pro Phe Gin Asn Val 275 280 285
Asn Arg He Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gin Asn Thr 290 295 300
Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gin Thr Arg 305 310 315 320
Gly He Phe Gly Ala He Ala Gly Phe He Glu Asn Gly Trp Glu Gly 325 330 335
Met Val Asp Gly Trp Tyr Gly Phe Arg His Gin Asn Ser Glu Gly He 340 345 350
Gly Gin Ala Ala Asp Leu Lys Ser Thr Gin Ala Ala He Asn Gin lie 355 360 365
Asn Gly Lys Leu Asn Arg Leu He Gly Lys Thr Asn Glu Lys Phe His 370 375 380
Gin He Glu Lys Glu Phe Ser Glu Val Glu Gly Arg lie Gin Asp Leu 385 390 395 400
Glu Lys Tyr Val Glu Asp Thr Lys He Asp Leu Trp Ser Tyr Asn Ala 405 410 415
Glu Leu Leu Val Ala Leu Glu Asn Gin His Thr lie Asp Leu Thr Asp 420 425 430
Ser Glu Met Asn Lys Leu Phe Glu Arg Thr Lys Lys Gin Leu Arg Glu 435 440 445
Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys He Tyr His Lys Cys 450 455 460
Asp Asn Ala Cys He Gly Ser He Arg Asn Gly Thr Tyr Asp His Asp 465 470 475 480
Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gin He Lys Gly Val 485 490 495
Glu Leu Lys Ser Gly Tyr Lys Asp Trp He Leu Trp He Ser Phe Ala 500 505 510 lie Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe lie Met Trp 515 520 525
Ala Cys Gin Lys Gly Asn lie Arg Cys Asn lie Cys lie 530 535 540
-IOC
<210> 102 <211> 551 <212> PRT <213> Artificial Sequence <220> <223> Synthesized Influenza A virus A/Anhui/1/2005(H5N1) <400102
Asp Gin lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Glu Gin Val 15 10 15
Asp Thr lie Met Glu Lys Asn Val Thr Val Thr His Ala Gin Asp lie 20 25 30
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys 35 40 45
Pro Leu lie Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn 50 55 60
Pro Met Cys Asp Glu Phe lie Asn Val Pro Glu Trp Ser Tyr lie Val 65 70 75 80
Glu Lys Ala Asn Pro Ala Asn Asp Leu Cys Tyr Pro Gly Asn Phe Asn 85 90 95
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg lie Asn His Phe Glu 100 105 110
Lys lie Gin lie lie Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser 115 120 125
Ser Gly Val Ser Ser Ala Cys Pro Tyr Gin Gly Thr Pro Ser Phe Phe 130 135 140
Arg Asn Val Val Trp Leu lie Lys Lys Asn Asn Thr Tyr Pro Thr lie 145 150 155 160
Lys Arg Ser Tyr Asn Asn Thr Asn Gin Glu Asp Leu Leu lie Leu Trp 165 170 175
Gly lie His His Ser Asn Asp Ala Ala Glu Gin Thr Lys Leu Tyr Gin 180 185 190
Asn Pro Thr Thr Tyr He Ser Val Gly Thr Ser Thr Leu Asn Gin Arg 195 200 205
Leu Val Pro Lys lie Ala Thr Arg Ser Lys Val Asn Gly Gin Ser Gly 210 215 220
Arg Met Asp Phe Phe Trp Thr He Leu Lys Pro Asn Asp Ala He Asn 225 230 235 240
Phe Glu Ser Asn Gly Asn Phe He Ala Pro Glu Tyr Ala Tyr Lys lie 245 250 255
Val Lys Lys Gly Asp Ser Ala He Val Lys Ser Glu Val Glu Tyr Gly 260 265 270
Asn Cys Asn Thr Lys Cys Gin Thr Pro lie Gly Ala lie Asn Ser Ser 275 280 285
Met Pro Phe His Asn lie His Pro Leu Thr lie Gly Glu Cys Pro Lys 290 295 300
Tyr Val Lys Ser Asn Lys Leu Val Leu Ala Thr Gly Leu Arg Asn Ser 305 310 315 320
Pro Leu Arg Glu Arg Arg Arg Lys Arg Gly Leu Phe Gly Ala lie Ala 325 330 335
Gly Phe He Glu Gly Gly Trp Gin Gly Met Val Asp Gly Trp Tyr Gly 340 345 350
Tyr His His Ser Asn Glu Gin Gly Ser Gly Tyr Ala Ala Asp Lys Glu 355 360 365
Ser Thr Gin Lys Ala lie Asp Gly Val Thr Asn Lys Val Asn Ser He 370 375 380
He Asp Lys Met Asn Thr Gin Phe Glu Ala Val Gly Arg Glu Phe Asn 385 390 395 400
Asn Leu Glu Arg Arg lie Glu Asn Leu Asn Lys Lys Met Glu Asp Gly 405 410 415
Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu 420 425 430
Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr 435 440 445
Asp Lys Val Arg Leu Gin Leu Arg Asp Asn Ala Lys Glu Leu Gly Asn 450 455 460
Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser 465 470 475 480
Val Arg Asn Gly Thr Tyr Asp Tyr Pro Gin Tyr Ser Glu Glu Ala Arg 485 490 495
Leu Lys Arg Glu Glu lie Ser Gly Val Lys Leu Glu Ser lie Gly Thr 500 505 510
Tyr Gin He Leu Ser He Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu 515 520 525
Ala lie Met Val Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly Ser 530 535 540
Leu Gin Cys Arg He Cys He 545 550
<210> 103 <211> 552 <212> PRT <213> Artificial Sequence <220 <223> Synthesized [Influenza A virus ANietnam/1194/2004(H5Nl) <400103
Asp Gin lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Glu Gin Val 15 10 15
Asp Thr lie Met Glu Lys Asn Val Thr Val Thr His Ala Gin Asp lie 20 25 30
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys 35 40 45
Pro Leu lie Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn 50 55 60
Pro Met Cys Asp Glu Phe lie Asn Val Pro Glu Trp Ser Tyr lie Val 65 70 75 80
Glu Lys Ala Asn Pro val Asn Asp Leu Cys Tyr Pro Gly Asp Phe Asn 85 90 95
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg lie Asn His Phe Glu 100 105 110
Lys lie Gin lie lie Pro Lys Ser Ser Trp Ser Ser His Glu Ala Ser 115 120 125
Leu Gly Val Ser Ser Ala Cys Pro Tyr Gin Gly Lys Ser Ser Phe Phe 130 135 140
Arg Asn Val Val Trp Leu lie Lys Lys Asn Ser Thr Tyr Pro Thr lie 145 150 155 160
Lys Arg Ser Tyr Asn Asn Thr Asn Gin Glu Asp Leu Leu Val Leu Trp 165 170 175
Gly lie His His Pro Lys Asp Ala Ala Glu Gin Thr Lys Leu Tyr Gin 1B0 185 190
Asn Pro Thr Thr Tyr lie Ser Val Gly Thr Ser Thr Leu Asn Gin Arg 195 200 205
Leu Val Pro Arg lie Ala Thr Arg Ser Lys Val Asn Gly Gin Ser Gly 210 215 220
Arg Met Glu Phe Phe Trp Thr He Leu Lys Pro Asn Asp Ala lie Asn 225 230 235 240
Phe Glu Ser Asn Gly Asn Phe He Ala Pro Glu Tyr Ala Tyr Lys He 245 250 255
Val Lys Lys Gly Asp Ser Thr lie Met Lys Ser Glu Leu Glu Tyr Gly 260 265 270
Asn Cys Asn Thr Lys Cys Gin Thr Pro Met Gly Ala lie Asn Ser Ser 275 280 285
Met Pro Phe His Asn He His Pro Leu Thr lie Gly Glu Cys Pro Lys 290 295 300
Tyr Vai Lys Ser Asn Arg Leu Vai Leu Ala Thr Gly Leu Arg Asn Ser 305 310 315 320
Pro Gin Arg Glu Arg Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile 325 330 335
Ala Gly Phe lie Glu Gly Gly Trp Gin Gly Met Vai Asp Gly Trp Tyr 340 345 350
Gly Tyr His His Ser Asn Glu Gin Gly Ser Gly Tyr Ala Ala Asp Lys 355 360 365
Glu Ser Thr Gin Lys Ala Ile Asp Gly Vai Thr Asn Lys Vai Asn Ser 370 375 380 lie lie Asp Lys Met Asn Thr Gin Phe Glu Ala Vai Gly Arg Glu Phe 385 390 395 400
Asn Asn Leu Glu Arg Arg lie Glu Asn Leu Asn Lys Lys Met Glu Asp 405 410 415
Gly Phe Leu Asp Vai Trp Thr Tyr Asn Ala Glu Leu Leu Vai Leu Met 420 425 430
Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Vai Lys Asn Leu 435 440 445
Tyr Asp Lys Vai Arg Leu Gin Leu Arg Asp Asn Ala Lys Glu Leu Gly 450 455 460
Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu 465 470 475 480
Ser Vai Arg Asn Gly Thr Tyr Asp Tyr Pro Gin Tyr Ser Glu Glu Ala 485 490 495
Arg Leu Lys Arg Glu Glu Ile Ser Gly Vai Lys Leu Glu Ser Ile Gly 500 505 510
Ile Tyr Gin Ile Leu Ser Ile Tyr Ser Thr Vai Ala Ser Ser Leu Ala 515 520 525
Leu Ala lie Met Val Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly 530 535 540
Ser Leu Gin Cys Arg lie Cys lie 545 550
<210> 104 <211> 553 <212> PRT <213> Artificial sequence <220> <223> Synthesized A/lndonesia/5/2005(H5Nl) <400> 104
Asp Gin lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Glu Gin Val 15 10 15
Asp Thr lie Met Glu Lys Asn Val Thr Val Thr His Ala Gin Asp lie 20 25 30
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys 35 40 45
Pro Leu lie Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn 50 55 60
Pro Met Cys Asp Glu Phe lie Asn Val Pro Glu Trp Ser Tyr lie Val 65 70 75 80
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly Ser Phe Asn 85 90 95
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg lie Asn His Phe Glu 100 105 110
Lys lie Gin lie He Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser 115 120 125
Ser Gly Val Ser Ser Ala Cys Pro Tyr Leu Gly Ser Pro Ser Phe Phe 130 135 140
Arg Asn Val Val Trp Leu lie Lys Lys Asn Ser Thr Tyr Pro Thr lie 145 150 155 160
Lys Lys Ser Tyr Asn Asn Thr Asn Gin Glu Asp Leu Leu Val Leu Trp 165 170 175
Gly He His His Pro Asn Asp Ala Ala Glu Gin Thr Arg Leu Tyr Gin 180 185 190
Asn Pro T r Thr Tyr He Ser lie Gly Thr Ser Thr Leu Asn Gin Arg 195 200 205
Leu Val Pro Lys He Ala Thr Arg Ser Lys Val Asn Gly Gin Ser Gly 210 215 220
Arg Met Glu Phe Phe Trp Thr He Leu Lys Pro Asn Asp Ala lie Asn 225 230 235 240
Phe Glu Ser Asn Gly Asn Phe He Ala Pro Glu Tyr Ala Tyr Lys He 245 250 255
Val Lys Lys Gly Asp Ser Ala He Met Lys Ser Glu Leu Glu Tyr Gly 260 265 270
Asn Cys Asn Thr Lys Cys Gin Thr Pro Met Gly Ala He Asn Ser Ser 275 280 285
Met Pro Phe His Asn He His Pro Leu Thr He Gly Glu Cys Pro Lys 290 295 300
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser 305 310 315 320
Pro Gin Arg Glu Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala lie 325 330 335
Ala Gly Phe lie Glu Gly Gly Trp Gin Gly Met Val Asp Gly Trp Tyr 340 345 350
Gly Tyr His His Ser Asn Glu Gin Gly Ser Gly Tyr Ala Ala Asp Lys 355 360 365
Glu Ser Thr Gin Lys Ala lie Asp Gly Val Thr Asn Lys Val Asn Ser 370 375 380 lie lie Asp Lys Met Asn Thr Gin Phe Glu Ala Val Gly Arg Glu Phe 385 390 395 400
Asn Asn Leu Glu Arg Arg lie Glu Asn Leu Asn Lys Lys Met Glu Asp 405 410 415
Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met 420 425 430
Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu 435 440 445
Tyr Asp Lys Val Arg Leu Gin Leu Arg Asp Asn Ala Lys Glu Leu Gly 450 455 460
Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu 465 470 475 480
Ser lie Arg Asn Gly Thr Tyr Asn Tyr Pro Gin Tyr Ser Glu Glu Ala 485 490 495
Arg Leu Lys Arg Glu Glu lie Ser Gly Val Lys Leu Glu Ser lie Gly 500 505 510
Thr Tyr Gin lie Leu Ser lie Tyr Ser Thr Val Ala Ser Ser Leu Ala 515 520 525
Leu Ala lie Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly 530 535 540
Ser Leu Gin Cys Arg lie Cys lie Lys 545 550 <210> 105
<211> 548 <212> PRT <213> Artificial Sequence <220> <223> Construct 900 <400> 105
Asp Gin lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Glu Gin Val 15 10 15
Asp Thr lie Met Glu Lys Asn Val Thr Val Thr His Ala Gin Asp He 20 25 30
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys 35 40 45
Pro Leu lie Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn 50 55 60
Pro Met Cys Asp Glu Phe He Asn Val Pro Glu Trp Ser Tyr lie Val 65 70 75 80
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Tyr Asp Val Pro 85 90 95
Asp Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu 100 105 110
Phe Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gin Asn Gly Thr 115 120 125
Ser Ser Ala Cys lie Arg Arg Ser Asn Asn Ser Phe Phe Ser Arg Leu 130 135 140
Asn Trp Leu Thr His Leu Lys Phe Lys Tyr Pro Ala Leu Asn Val Thr 145 150 155 160
Met Pro Asn Asn Glu Lys Phe Asp Lys Leu Tyr He Trp Gly Val His 165 170 175
His Pro Gly Thr Asp Asn Asp Gin lie Phe Leu Tyr Ala Gin Ala Ser 180 185 190
Gly Arg He Thr Val Ser Thr Lys Arg Ser Gin Gin Thr Val lie Pro 195 200 205
Asn He Gly Ser Arg Pro Arg Val Arg Asn He Pro Ser Arg He Ser 210 215 220
He Tyr Trp Thr He Val Lys Pro Gly Asp He Leu Leu He Asn Ser 225 230 235 240
Thr Gly Asn Leu He Ala Pro Arg Cly Tyr Phe Lys He Arg Ser Gly 245 250 255
Lys Ser Ser He Met Lys Ser Glu Leu Glu Tyr Gly Asn Cys Asn Thr 260 265 270
Lys Cys Gin Thr Pro Met Gly Ala He Asn Ser Ser Met Pro Phe His 275 280 285
Asn He His Pro Leu Thr lie Cly Glu Cys Pro Lys Tyr Val Lys Ser 290 295 300
Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser Pro Gin Arg Glu 305 310 315 320
Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala He Ala Gly Phe He 325 330 335
Glu Gly Gly Trp Gin Gly Met Val Asp Gly Trp Tyr Cly Tyr His His 340 345 350
Ser Asn Glu Gin Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gin 355 360 365
Lys Ala He Asp Gly Val Thr Asn Lys Val Asn Ser He He Asp Lys 370 375 380
Met Asn Thr Gin Phe Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu 385 390 395 400
Arg Arg lie Glu Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp 405 410 415
Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg 420 425 430
Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val 435 440 445
Arg Leu Gin Leu Arg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe 450 455 460
Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser lie Arg Asn 465 470 475 480
Gly Thr Tyr Asn Tyr Pro Gin Tyr Ser Glu Glu Ala Arg Leu Lys Arg 485 490 495
Glu Glu lie Ser Gly Val Lys Leu Glu Ser lie Gly Thr Tyr Gin lie 500 505 510
Leu Ser lie Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu Ala lie Met 515 520 525
Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gin Cys 530 535 540
Arg lie Cys lie 545
<210> 106 <211> 565 <212> PRT <213> Artificial Sequence <220> <223> Construct 745 <400> 106
Asp Gin lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Glu Gin Val 15 10 15
Asp Thr lie Met Glu Lys Asn Val Thr Val Thr His Ala Gin Asp lie 20 25 30
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys 35 40 45
Pro Leu lie Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn 50 55 60
Pro Met Cys Asp Glu Phe lie Asn Val Pro Glu Trp Ser Tyr lie Val 65 70 75 80
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro lie Met His Asp 85 90 95
Arg Thr Lys He Arg Gin Leu Pro Asn Leu Leu Arg Gly Tyr Glu Asn 100 105 110 lie Arg Leu Ser Thr Gin Asn Val He Asp Ala Glu Lys Ala Pro Gly 115 120 125
Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn Ala Thr Ser 130 135 140
Lys Ser Gly Phe Phe Ala Thr Met Ala Trp Ala val Pro Lys Asp Asn 145 150 155 160
Asn Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro Tyr He Cys 165 170 175
Thr Glu Gly Glu Asp Gin He Thr Val Trp Gly Phe His Ser Asp Asn 180 185 190
Lys Thr Gin Met Lys Asn Leu Tyr Gly Asp Ser Asn Pro Gin Lys Phe 195 200 205
Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser Gin lie Gly 210 215 220
Ser Phe Pro Asp Gin Thr Glu Asp Gly Gly Leu Pro Gin Ser Gly Arg 225 230 235 240
He Val Val Asp Tyr Met Met Gin Lys Pro Gly Lys Thr Gly Thr He 245 250 255
Val Tyr Gin Arg Gly Val Leu Leu Pro Gin Lys Val Trp Cys Ala Ser 260 265 270
Gly Arg Ser Lys He Met Lys Ser Glu Leu Glu Tyr Gly Asn Cys Asn 275 280 285
Thr Lys Cys Gin Thr Pro Met Gly Ala lie Asn Ser Ser Met Pro Phe 290 295 300
His Asn He His Pro Leu Thr He Gly Glu Cys Pro Lys Tyr Val Lys 305 310 315 320
Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser Pro Gin Arg 325 330 335
Glu Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe 340 345 350 lie Glu Gly Gly Trp Gin Gly Met Vai Asp Gly Trp Tyr Gly Tyr His 355 360 365
His Ser Asn Glu Gin Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr 370 375 380
Gin Lys Ala Ile Asp Gly Vai Thr Asn Lys Vai Asn Ser lie Ile Asp 385 390 395 400
Lys Met Asn Thr Gin Phe Glu Ala Vai Gly Arg Glu Phe Asn Asn Leu _405_410_415
Glu Arg Arg lie Glu Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu 420 425 430
Asp Vai Trp Thr Tyr Asn Ala Glu Leu Leu Vai Leu Met Glu Asn Glu 435 440 445
Arg Thr Leu Asp Phe His Asp Ser Asn Vai Lys Asn Leu Tyr Asp Lys 450 455 460
Vai Arg Leu Gin Leu Arg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys 465 470 475 480
Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg 485 490 495
Asn Gly Thr Tyr Asn Tyr Pro Gin Tyr Ser Glu Glu Ala Arg Leu Lys 500 505 510
Arg Glu Glu Ile Ser Gly Vai Lys Leu Glu Ser Ile Gly Thr Tyr Gin 515 520 525
Ile Leu Ser Ile Tyr Ser Thr Vai Ala Ser Ser Leu Ala Leu Ala Ile 530 535 540
Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gin 545 550 555 560
Cys Arg Ile Cys Ile 565
<210> 107 <211> 545 <212> PRT <213> Artificial Sequence <22Q> <223> Construct 910 <400> 107
Asp Gin lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Glu Gin Val 15 10 15
Asp Thr lie Met Glu Lys Asn Val Thr Val Thr His Ala Gin Asp lie 20 25 30
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Ser Pro His Gin lie 35 40 45
Leu Asp Gly Glu Asn Cys Thr Leu lie Asp Ala Leu Leu Gly Asp Pro 50 55 60
Gin Cys Asp Gly Phe Gin Asn Lys Lys Trp Asp Leu Phe Val Glu Arg 65 70 75 80
Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 85 90 95
Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn 100 105 110
Glu Ser Phe Asn Trp Thr Gly Vai Thr Gin Asn Gly Thr Ser Ser Ala 115 120 125
Cys Ile Arg Arg Ser Asn Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu 130 135 140
Thr His Leu Lys Phe Lys Tyr Pro Ala Leu Asn Vai Thr Met Pro Asn 145 150 155 160
Asn Glu Lys Phe Asp Lys Leu Tyr lie Trp Gly Vai His His Pro Gly 165 170 175
Thr Asp Asn Asp Gin Ile Phe Leu Tyr Ala Gin Ala Ser Gly Arg Ile 180 185 190
Thr Vai Ser Thr Lys Arg Ser Gin Gin Thr Vai lie Pro Asn Ile Gly 195 200 205
Ser Arg Pro Arg Vai Arg Asn lie Pro Ser Arg Ile Ser Ile Tyr Trp 210 215 220
Thr He Vai Lys Pro Gly Asp He Leu Leu lie Asn ser Thr Gly Asn 225 230 235 240
Leu lie Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser 245 250 255 lie Met Arg Ser Asp Ala Pro lie Gly Lys Cys Asn Thr Lys Cys Gin 260 265 270
Thr Pro Met Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn lie His 275 280 285
Pro Leu Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu 290 295 300
Val Leu Ala Thr Gly Leu Arg Asn Ser Pro Gin Arg Glu Ser Arg Arg 305 310 315 320
Lys Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly 325 330 335
Trp Gin Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu 340 345 350
Gin Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gin Lys Ala He 355 360 365
Asp Gly Val Thr Asn Lys Val Asn Ser Ile lie Asp Lys Met Asn Thr 370 375 380
Gin Phe Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile 385 390 395 400
Glu Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr 405 410 415
Tyr Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp 420 425 430
Phe His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gin 435 440 445
Leu Arg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr 450 455 460
His Lys Cys Asp Asn Glu Cys Met Glu Ser lie Arg Asn Gly Thr Tyr 465 470 475 480
Asn Tyr Pro Gin Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu lie 485 490 495
Ser Gly Val Lys Leu Glu Ser lie Gly Thr Tyr Gin lie Leu Ser lie 500 505 510
Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu Ala lie Met Met Ala Gly 515 520 525
Leu Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gin Cys Arg lie Cys 530 535 540
He 545
<210> 108 <211> 556 <212> PRT <213> Artificial Sequence <220 <223> Construct 920 <400108
Asp Gin lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Glu Gin Val 15 10 15
Asp Thr lie Met Glu Lys Asn Val Thr Val Thr His Ala Gin Asp lie 20 25 30
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys 35 40 45
Thr Asp Leu Asp Val Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr 50 55 60
Pro Ser Ala Lys Ala Ser lie Leu His Glu Val Lys Pro Val Thr Ser 65 70 75 80
Gly Cys Phe Pro lie Met His Asp Arg Thr Lys lie Arg Gin Leu Pro 85 90 95
Asn Leu Leu Arg Gly Tyr Glu Asn lie Arg Leu Ser Thr Gin Asn Val 100 105 110 lie Asp Ala Glu Lys Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser 115 120 125
Gly Ser Cys Pro Asn Ala Thr Ser Lys Ser Gly Phe Phe Ala Thr Met 130 135 140
Ala Trp Ala Val Pro Lys Asp Asn Asn Lys Asn Ala Thr Asn Pro Leu 145 150 155 160
Thr Vai Glu Vai Pro Tyr lie Cys Thr Glu Gly Glu Asp Gin lie Thr 165 170 175
Val Trp Gly Phe His Ser Asp Asn Lys Thr Gin Met Lys Asn Leu Tyr 180 185 190
Gly Asp Ser Asn Pro Gin Lys Phe Thr Ser Ser Ala Asn Gly Val Thr 195 200 205
Thr His Tyr Val Ser Gin lie Gly Ser Phe Pro Asp Gin Thr Glu Asp 210 215 220
Gly Gly Leu Pro Gin Ser Gly Arg lie Val Val Asp Tyr Met Met Gin 225 230 235 240
Lys Pro Gly Lys Thr Gly Thr lie Val Tyr Gin Arg Gly Val Leu Leu 245 250 255
Pro Gin Lys Val Trp Cys Ala Ser Gly Arg Ser Lys Val lie Lys Gly 260 265 270
Ser Leu Pro Leu lie Gly Glu Ala Asp Cys Gin Thr Pro Met Gly Ala 275 280 285 lie Asn Ser Ser Met Pro Phe His Asn lie His Pro Leu Thr lie Gly 290 295 300
Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly 305 310 315 320
Leu Arg Asn Ser Pro Gin Arg Glu Ser Arg Arg Lys Lys Arg Gly Leu 325 330 335
Phe Gly Ala lie Ala Gly Phe lie Glu Gly Gly Trp Gin Gly Met Val 340 345 350
Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gin Gly Ser Gly Tyr 355 360 365
Ala Ala Asp Lys Glu Ser Thr Gin Lys Ala lie Asp Gly Val Thr Asn 370 375 380
Lys Val Asn Ser lie lie Asp Lys Met Asn Thr Gin Phe Glu Ala Val 385 390 395 400
Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg lie Glu Asn Leu Asn Lys 405 410 415
Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu 420 425 430
Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn 435 440 445
Vai Lys Asn Leu Tyr Asp Lys Vai Arg Leu Gin Leu Arg Asp Asn Ala 450 455 460
Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn 465 470 475 480
Glu Cys Met Glu Ser lie Arg Asn Gly Thr Tyr Asn Tyr Pro Gin Tyr 485 490 495
Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser Gly Vai Lys Leu 500 505 510
Glu Ser Ile Gly Thr Tyr Gin Ile Leu Ser Ile Tyr Ser Thr Vai Ala 515 520 525
Ser Ser Leu Ala Leu Ala lie Met Met Ala Gly Leu Ser Leu Trp Met 530 535 540
Cys Ser Asn Gly Ser Leu Gin Cys Arg Ile Cys Ile 545 550 555
<210> 109 <211> 548 <212> PRT <213> Artificial Sequence <220> <223> Construct 930 <400> 109
Asp Thr lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Asp Thr Val 15 10 15
Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn Leu 20 25 30
Leu Glu Asp Ser His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys 35 40 45
Pro Leu lie Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn 50 55 60
Pro Met Cys Asp Glu Phe lie Asn Val Pro Glu Trp Ser Tyr lie Val 65 70 75 80
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly Ser Phe Asn 85 90 95
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg lie Asn His Phe Glu 100 105 110
Lys lie Gin lie lie Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser 115 120 125
Ser Gly Val Ser Ser Ala Cys Pro Tyr Leu Gly Ser Pro Ser Phe Phe 130 135 140
Arg Asn Val Val Trp Leu lie Lys Lys Asn Ser Thr Tyr Pro Thr lie 145 150 155 160
Lys Lys Ser Tyr Asn Asn Thr Asn Gin Glu Asp Leu Leu Val Leu Trp 165 170 175
Gly lie His His Pro Asn Asp Ala Ala Glu Gin Thr Arg Leu Tyr Gin 180 185 190
Asn Pro Thr Thr Tyr lie Ser lie Gly Thr Ser Thr Leu Asn Gin Arg 195 200 205
Leu Val Pro Lys lie Ala Thr Arg Ser Lys Val Asn Gly Gin Ser G:'..y 210 215 220
Arg Met Glu Phe Phe Trp Thr lie Leu Lys Pro Asn Asp Ala lie Asn 225 230 235 240
Phe Glu Ser Asn Gly Asn Phe lie Ala Fro Glu Tyr Ala Tyr Lys lie 245 250 255
Val Lys Lys Gly Asp Ser Ala lie Met Lys Ser Glu Leu Glu Tyr Gly 260 265 270
Asn Cys Asp Ala Lys Cys Gin Thr Pro Gin Gly Ala lie Asn Ser Ser 275 280 285
Leu Pro Phe Gin Asn Val His Pro Val Thr lie Gly Glu Cys Pro Lys 290 295 300
Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn lie 305 310 315 320
Pro Ser lie Gin Ser Arg Gly Leu Phe Gly Ala lie Ala Gly Phe lie 325 330 335
Glu Gly Sly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His 340 345 350
Gin Asn Slu Gin Gly Ser Gly Tyr Ala Ala Asp Gin Lys Ser Thr Gin 355 360 365
Asn Ala lie Asn Gly lie Thr Asn Lys Val Asn Ser Val lie Glu Lys 370 375 380
Met Asn Thr Gin Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu Glu 385 390 395 400
Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp 405 410 415 lie Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg 420 425 430
Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val 435 440 445
Lys Ser Gin Leu Lys Asn Asn Ala Lys Glu lie Gly Asn Gly Cys Phe 450 455 460
Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys Asn 465 470 475 480
Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn Arg 485 490 495
Glu Lys lie Asp Sly Val Lys Leu Glu Ser Met Gly Val Tyr Gin lie 500 505 510
Leu Ala lie Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser 515 520 525
Leu Gly Ala lie Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gin Cys 530 535 540
Arg lie Cys lie 545 <210> 110 <400> 110 000
<210> 111 <211> 552 <212> PRT <2U> Artificial Sequence <220> <223> Construct 690 and 734 <400> 111
Asp Gin lie Cys Ι1θ Gly Tyr His Ala Asn Asn Ser Thr Glu Gin Val 15 10 15
Asp Thr lie Met Glu Lys Asn Val Thr Val Thr His Ala Gin Asp lie 20 25 30
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys 35 40 45
Pro Leu lie Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn 50 55 60
Pro Met Cys Asp Glu Phe lie Asn Val Pro Glu Trp Ser Tyr lie Val 65 70 75 80
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly His Phe Ala 85 90 95
Asp Tyr Glu Glu Leu Arg Glu Gin Leu Ser Ser Val Ser Ser Phe Glu 100 105 110
Arg Phe Glu lie Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr Val 115 120 125
Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser Ser Phe Tyr 130 135 140
Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn Leu 145 150 155 160
Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu Trp 165 170 175
Gly Val His His Pro Pro Asn lie Gly Asp Gin Lys Ala Leu Tyr His 180 185 190
Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg Lys 195 200 205
Phe Thr Pro Glu lie Ala Lys Arg Pro Lys Val Arg Asp Gin Glu Gly 210 215 220
Arg lie Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr lie lie 225 230 235 240
Phe Glu Ala Asn Gly Asn Leu lie Ala Pro Arg Tyr Ala Phe Ala Leu 245 250 255
Ser Arg Gly Phe Gly Ser Gly lie Met Lys Ser Glu Leu Glu Tyr Gly 260 265 270
Asn Cys Asn Thr Lys Cys Gin Thr Pro Met Gly Ala lie Asn Ser Ser 275 280 285
Met Pro Phe His Asn lie His Pro Leu Thr lie Gly Glu Cys Pro Lys 290 295 300
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser 305 310 315 320
Pro Gin Arg Glu Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala lie 325 330 335
Ala Gly Phe lie Glu Gly Gly Trp Gin Gly Met Val Asp Gly Trp Tyr 340 345 350
Gly Tyr His His Ser Asn Glu Gin Gly Ser Gly Tyr Ala Ala Asp Lys 355 360 365
Glu Ser Thr Gin Lys Ala lie Asp Gly Val Thr Asn Lys Val Asn Ser 370 375 380 lie He Asp Lys Met Asn Thr Gin Phe Glu Ala Val Cly Arg Glu Phe 385 390 395 400
Asn Asn Leu Glu Arg Arg lie Glu Asn Leu Asn Lys Lys V:et Glu Asp 405 410 415
Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met 420 425 430
Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu 435 440 445
Tyr Asp Lys Val Arg Leu Gin Leu Arg Asp Asn Ala Lys Glu Leu Gly 450 455 460
Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu 465 470 475 480
Ser lie Arg ll.snGly Thr Tyr Asn Tyr Pro Gin Tyr Ser Glu Glu Ala 4B5 490 495
Arg Leu Lys Arg Glu Glu lie Ser Gly Val Lys Leu Glu Ser lie Gly 500 505 510
Thr Tyr Gin lie Leu Ser lie Tyr Ser Thr Val Ala Ser Ser Leu Ala 515 520 525
Leu Ala lie Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly 530 535 540
Ser Leu Gin Cys Arg lie Cys lie 545 550
<210> 112 <211> 548 <212> PRT <213> Artificial Sequence <220> <223> Construct 696 <400> 112
Asp Thr lie Cys lie Gly Tyr His Ala Asn Asn Ser Thr Asp Thr Val 15 10 15
Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn Leu 20 25 30
Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly lie Ala 35 40 45
Pro Leu Gin Leu Gly Asn Cys Ser Val Ala Gly Trp lie Leu Gly Asn 50 55 60
Pro Glu Cys Glu Leu Leu lie Ser Lys Glu Ser Trp Ser Tyr lie Val 65 70 75 80
Glu Thr Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Ser Phe Asn 85 90 95
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg lie Asn His Phe Glu 100 105 110
Lys lie Gin lie lie Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser 115 120 125
Ser Gly Val Ser Ser Ala Cys Pro Tyr Leu Gly Ser Pro Ser Phe Phe 130 135 140
Arg Asn Val Val Trp Leu lie Lys Lys Asn Ser Thr Tyr Pro Thr lie 145 150 155 160
Lys Lys Ser Tyr Asn Asn Thr Asn Gin Glu Asp Leu Leu Val Leu Trp 165 170 175
Gly lie His His Pro Asn Asp Ala Ala Glu Gin Thr Arg Leu Tyr Gin 180 185 190
Asn Pro Thr Thr Tyr lie Ser lie Gly Thr Ser Thr Leu Asn Gin Arg 195 200 205
Leu Val Pro Lys lie Ala Thr Arg Ser Lys Val Asn Gly Gin Ser Gly 210 215 220
Arg Met Glu Phe Phe Trp Thr lie Leu Lys Pro Asn Asp Ala lie Asn 225 230 235 240
Phe Glu Ser Asn Gly Asn Phe lie Ala Pro Glu Tyr Ala Tyr Lys Ile 245 250 255
Vai Lys Lys Gly Asp Ser Ala He ile Thr ser Asn Ala Pro Met Asp 260 265 270
Glu Cys Asp Ala Lys Cys Gin Thr Pro Gin Gly Ala Ile Asn Ser Ser 275 280 285
Leu Pro Phe Gin Asn Val His Pro Val Thr Ile Gly Glu Cys Pro Lys 290 295 300
Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn Ile 305 310 315 320
Pro Ser Ile Gin Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile 325 330 335
Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His 340 345 350
Gin Asn Glu Gin Gly Ser Gly r,yr Ala Ala Asp Gin Lys Ser Thr Gin 355 360 365
Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys 370 375 380
Met Asn T r Gin Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu Glu 385 390 395 400
Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp 405 410 415
Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg 420 425 430
Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val 435 440 445
Lys Ser Gin Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe 450 455 460
Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys Asn 465 470 475 480
Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn Arg 485 490 495
Glu Lys lie Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gin lie 500 505 510
Leu Ala lie Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser 515 520 525
Leu Gly Ala lie Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gin Cys 530 535 540
Arg lie Cys lie 545
<210> 113 <211> 552 <212> PRT <213> Artificial Sequence <220 c223> Construct 691 <400113
Asp Gin lie Cys lie Gly Tyr His A_:_a Asn Asn Ser Thr Glu Gin Val 15 10 15
Asp Thr lie Met Glu Lys Asn Val Thr Val Thr His Ala Gin Asp lie 20 25 30
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Leu Leu Lys Gly lie Ala 35 40 45
Pro Leu Gin Leu Gly Asn Cys Ser Val Ala Gly Trp lie Leu Gly Asn 50 55 60
Pro Glu Cys Glu Leu Leu lie Ser Lys Glu Ser Trp Ser Tyr lie Val 65 70 75 80
Glu Lys Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly His Phe Ala 85 90 95
Asp Tyr Glu Glu Leu Arg Glu Gin Leu Ser Ser Val Ser Ser Phe Glu 100 105 110
Arg Phe Glu lie Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr Val 115 120 125
Thr Gly Val Ser Ala Ser Cys Ser H:_s Asn Gly Glu Ser Ser Phe Tyr 130 135 140
Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn Leu 145 150 155 160
Ser Lys Ser Tyr Ala Asn Asn Lys G_:_u Lys Glu Val Leu Val Leu Trp 165 170 175
Gly Val His His Pro Pro Asn He g -y Asp Gin Lys Ala Leu Tyr His 180 lfl5 190
Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg Lys 195 200 205
Phe Thr Pro Glu lie Ala Lys Arg Pro Lys Val Arg Asp Gin Glu Gly 210 215 220
Arg He Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr He He 225 230 235 240
Phe Glu Ala Asn Gly Asn Leu lie Ala Pro Arg Tyr Ala Phe Ala Leu 245 250 255
Ser Arg Gly Phe Gly Ser Gly lie lie Asn Ser Asn Ala Pro Met Asp 260 265 270
Lys Cys Asn Thr Lys Cys Gin Thr Pro Met Gly Ala lie
Asn Ser Ser 275 280 285
Met Pro Phe His Asn lie His Pro Leu Thr lie Gly Glu
Cys Pro Lys 290 295 300
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu
Arg Asn Ser 305 310 315 320
Pro Gin Arg Glu Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala He 325 330 335
Ala Gly Phe lie Glu Gly Gly Trp Gin Gly Met Val Asp
Gly Trp Tyr 340 345 350
Gly Tyr His His Ser Asn Glu Gin Gly Ser Gly Tyr Ala Ala Asp Lys 355 360 365
Glu Ser Thr Gin Lys Ala He Asp Gly Val Thr Asn Lys Val Asn Ser 370 375 380 lie lie Asp Lys Met Asn Thr Gin Phe Glu Ala Val Gly Arg Glu Phe 385 390 395 400
Asn Asn Leu Glu Arg Arg lie Glu Asn Leu Asn Lys Lys Met Glu 405 410 415
Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu
Val Leu Met 420 425 430
Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu 435 440 445
Tyr Asp Lys Val Arg Leu Gin Leu Arg Asp Asn Ala Lys Glu Leu Gly 450 455 460
Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu 465 470 475 480
Ser He Arg Asn Gly Thr Tyr Asn Tyr Pro Gin Tyr Ser Glu Glu Ala 485 490 495
Arg Leu Lys Arg Glu Glu He Ser Gly Val Lys Leu Glu
Ser lie Gly 500 505 510
Thr Tyr Gin lie Leu Ser lie Tyr Ser Thr Val Ala Ser Ser Leu Ala 515 520 525
Leu Ala lie Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly 530 535 540
Ser Leu Gin Cys Arg lie Cys lie 545 550

Claims (1)

  1. REIVINDICAÇÕES Ácido nucleico que pode ser expresso numa planta hospedeira compreendendo uma ou mais regiões reguladoras operando numa planta, e operacionalmente ligado a uma sequência codificando um polipéptido de hemaglutinina (HA) de gripe quimérico compreendendo um agregado de domínio de haste (SDC), uma cabeça de agrupamento de domínio (HDC) e um grupo de domínios transmembranares (TDC), uma ou mais regiões reguladoras compreendendo um promotor e um 5'UTR, 3'UTR ou 5'UTR e 3'UTR, e em que a) o SDC compreende um subdomínio F'l, F'2 e F; b) o HDC compreende um subdomínio de ligação ao recetor (RB) , El e E2; c) o CDT compreende um subdomínio transmembrana (TmD) e terminal C (CT); e i) em que o subdomínio RB é de um primeiro polipéptido de HA de gripe e os subdomínios de SDC e El e E2 são de um segundo polipéptido de HA de gripe e, ii) em que o primeiro polipéptido de HA de gripe é de gripe Hl ou H5 e o segundo polipéptido de HA de gripe é de gripe Hl ou H5 e o segundo polipéptido de HA de gripe é derivado de uma estirpe de gripe diferente do primeiro polipéptido de HA de gripe. Ácido nucleico da reivindicação 1, em que: i) a sequência que codifica o polipéptido de HA de gripe quimérico compreende ainda uma sequência peptídica de sinal selecionada do grupo de uma sequência peptídica de sinal nativa de HA e uma sequência peptídica de sinal de PDI de alfafa e/ou ii) ii) em que o 5'UTR, 3'UTR ou 5'UTR e 3'UTR são obtidos a partir de uma UTR de plastocianina ou UTR e/ou iii) em que o promotor é obtido a partir de uma região reguladora de plastocianina, uma 1,5-bisfosfato de ribulose região reguladora carboxilase / oxigenase (RuBisCO), uma região reguladora da proteína de ligação clorofila a / b (CAB), uma região reguladora CaMV 35S, uma região reguladora da actina, uma região reguladora da ubiquitina, uma região reguladora da triosofosfato isomerase 1, um fator de iniciação translacional 4A região reguladora e uma região reguladora ST-LSl. . Método de produzir partículas semelhantes a vírus da gripe quiméricas (VLPs) numa planta compreendendo: a) introduzir o ácido nucleico da reivindicação 1 ou 2 na planta, ou sua porção, e b) incubar a planta, ou porção da mesma, sob condições que permitem a expressão do ácido nucleico, produzindo assim as VLPs, e c) opcionalmente colheita da planta e purificação das VLPs. Método de acordo com a reivindicação 3, em que no passo de introdução (passo a) , i) o ácido nucleico é introduzido na planta de um modo transitório ou ii) o ácido nucleico é introduzido na planta de modo a ser integrado de forma estável em um genoma. Polipéptido codificado pelo ácido nucleico da reivindicação 1. Partícula semelhante a vírus (VLP) compreendendo o polipéptido da reivindicação 5. VLP da reivindicação 6 compreendendo ainda N-glicanos específicos de plantas, ou N-glicanos modificados. Composição compreendendo uma dose eficaz da VLP da reivindicação 6 ou 7 e um veículo farmaceuticamente aceitável. Partícula semelhante a vírus, de acordo com a reivindicação 6 ou 7, ou composição de acordo com a reivindicação 8, para uso na indução de imunidade a uma infeção por vírus gripe em um indivíduo. Partícula semelhante a vírus ou a composição para uso de acordo com a reivindicação 9, que é adequada para administração oral, intradérmica, intranasal, intramuscular, intraperitoneal, intravenosa ou subcutânea a um sujeito. Planta, ou sua porção, compreendendo um polipéptido codificado pelo ácido nucleico da reivindicação 1.
PT107911190T 2009-06-24 2010-06-25 Particulas quiméricas semelhantes a virus da gripe compreendendo hemaglutinina PT2445928T (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US22016109P 2009-06-24 2009-06-24

Publications (1)

Publication Number Publication Date
PT2445928T true PT2445928T (pt) 2018-06-07

Family

ID=43385835

Family Applications (1)

Application Number Title Priority Date Filing Date
PT107911190T PT2445928T (pt) 2009-06-24 2010-06-25 Particulas quiméricas semelhantes a virus da gripe compreendendo hemaglutinina

Country Status (25)

Country Link
US (1) US10272148B2 (pt)
EP (2) EP3228627A1 (pt)
JP (2) JP5871796B2 (pt)
KR (1) KR101377725B1 (pt)
CN (1) CN102482328B (pt)
AU (1) AU2010265766B2 (pt)
BR (1) BRPI1015053A2 (pt)
CA (1) CA2762042C (pt)
DK (1) DK2445928T3 (pt)
ES (1) ES2669303T3 (pt)
HK (2) HK1170250A1 (pt)
HR (1) HRP20180706T1 (pt)
HU (1) HUE039100T2 (pt)
IL (1) IL216937A (pt)
IN (1) IN2012DN00650A (pt)
MX (1) MX349924B (pt)
MY (1) MY182643A (pt)
NO (1) NO2445928T3 (pt)
NZ (1) NZ597401A (pt)
PL (1) PL2445928T3 (pt)
PT (1) PT2445928T (pt)
SG (1) SG176820A1 (pt)
SI (1) SI2445928T1 (pt)
WO (1) WO2010148511A1 (pt)
ZA (1) ZA201200481B (pt)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2615372A1 (en) * 2007-07-13 2009-01-13 Marc-Andre D'aoust Influenza virus-like particles (vlps) comprising hemagglutinin
US20100310604A1 (en) * 2007-11-27 2010-12-09 Medicago Inc. Recombinant influenza virus-like particles (vlps) produced in transgenic plants expressing hemagglutinin
ES2545607T3 (es) * 2008-07-08 2015-09-14 Medicago Inc. Antígenos de la gripe recombinantes solubles
AU2010234849B2 (en) 2009-03-30 2017-06-22 Mount Sinai School Of Medicine Influenza virus vaccines and uses thereof
AU2010254136B2 (en) 2009-05-26 2016-09-29 Mount Sinai School Of Medicine Monoclonal antibodies against influenza virus generated by cyclical administration and uses thereof
NZ597401A (en) 2009-06-24 2013-09-27 Medicago Inc Chimeric influenza virus-like particles comprising hemagglutinin
KR20120093223A (ko) 2009-09-22 2012-08-22 메디카고 인코포레이티드 식물-유래 단백질의 제조방법
US9701723B2 (en) 2010-02-18 2017-07-11 Icahn School Of Medicine At Mount Sinai Vaccines for use in the prophylaxis and treatment of influenza virus disease
WO2011123495A1 (en) 2010-03-30 2011-10-06 Mount Sinai School Of Medicine Influenza virus vaccines and uses thereof
TWI526539B (zh) 2010-12-22 2016-03-21 苜蓿股份有限公司 植物中生產類病毒顆粒(vlp)的方法及以該方法生產之vlp
CN103562389B (zh) * 2011-02-08 2020-06-23 淡马锡生命科学研究院有限公司 用于有效表面展示抗原蛋白的新颖表达盒
TWI620816B (zh) 2011-03-23 2018-04-11 苜蓿股份有限公司 植物衍生蛋白回收方法
HUE044089T2 (hu) 2011-07-18 2019-09-30 Inst Res Biomedicine Neutralizáló anti-influenza A antitestek és alkalmazásaik
EP4241785A3 (en) * 2011-09-20 2023-09-27 Icahn School of Medicine at Mount Sinai Influenza virus vaccines and uses thereof
JP6248040B2 (ja) 2011-09-30 2017-12-13 メディカゴ インコーポレイテッド 植物における増加するウイルス様粒子収量
US11390878B2 (en) 2011-09-30 2022-07-19 Medicago Inc. Increasing protein yield in plants
CN104797594A (zh) * 2012-11-27 2015-07-22 高等教育联邦系统-匹兹堡大学 计算优化的广泛反应性h1n1流感抗原
ES2929942T3 (es) * 2012-12-18 2022-12-05 Icahn School Med Mount Sinai Vacunas contra el virus de la gripe y sus usos
US9908930B2 (en) 2013-03-14 2018-03-06 Icahn School Of Medicine At Mount Sinai Antibodies against influenza virus hemagglutinin and uses thereof
EP2978848B1 (en) * 2013-03-28 2020-05-06 Medicago Inc. Influenza virus-like particle production in plants
EP3004332A2 (en) 2013-06-06 2016-04-13 Novartis AG Influenza virus reassortment
ES2864081T3 (es) * 2014-01-10 2021-10-13 Medicago Inc Elementos potenciadores de CPMV
AU2015234595B2 (en) 2014-03-27 2021-03-25 Medicago Inc. Modified CPMV enhancer elements
CN105233302B (zh) * 2014-07-10 2018-10-19 中国人民解放军军事医学科学院生物工程研究所 一种流感血凝素糖蛋白多聚物纳米颗粒的制备方法
EP3247389A4 (en) 2015-01-23 2019-10-30 Icahn School of Medicine at Mount Sinai INFLUENZAVIRUSSCHUTZIMPFPLÄNE
ES2857741T3 (es) 2015-07-02 2021-09-29 Medicago Inc Activador de la vía del ácido jasmónico
KR101755114B1 (ko) * 2015-09-08 2017-07-06 건국대학교 산학협력단 여러 클레이드의 고병원성 조류인플루엔자 h5 바이러스에 대한 넓은 항체 반응을 유도하는 키메릭 바이러스 유사입자 백신
WO2017087492A1 (en) * 2015-11-16 2017-05-26 Kansas State University Research Foundation Influenza virus vaccine and vaccine platform
CA3012703A1 (en) * 2016-02-03 2017-08-10 Cg Discovery, Inc. Compositions of influenza hemagglutinin with heterologous epitopes and/or altered maturation cleavage sites
MX2018015755A (es) 2016-06-15 2019-08-29 Icahn School Med Mount Sinai Proteinas de hemaglutinina de virus de influenza y usos de las mismas.
US11254733B2 (en) 2017-04-07 2022-02-22 Icahn School Of Medicine At Mount Sinai Anti-influenza B virus neuraminidase antibodies and uses thereof
JP6622825B2 (ja) * 2018-01-25 2019-12-18 インスティテュート・フォー・リサーチ・イン・バイオメディシンInstitute For Research In Biomedicine A型インフルエンザウイルス中和抗体及びその使用法
US20220154195A1 (en) 2019-03-14 2022-05-19 Mitsubishi Tanabe Pharma Corporation Endogenous plant expression enhancer
US20220267382A1 (en) * 2019-09-20 2022-08-25 Academia Sinica Chimeric hemagglutinin protein and a vaccine composition comprising the same
JP2020048568A (ja) * 2019-11-22 2020-04-02 インスティテュート・フォー・リサーチ・イン・バイオメディシンInstitute For Research In Biomedicine A型インフルエンザウイルス中和抗体及びその使用法
AU2021268212A1 (en) * 2020-05-08 2022-12-08 Academia Sinica Chimeric influenza vaccines

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5428147A (en) 1983-04-15 1995-06-27 Mycogen Plant Science, Inc. Octopine T-DNA promoters
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5036006A (en) 1984-11-13 1991-07-30 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5100792A (en) 1984-11-13 1992-03-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues
JPS62501263A (ja) 1984-11-29 1987-05-21 スクリツプス クリニツク アンド リサ−チ フアウンデ−シヨン 脱グリコシル化ウイルス糖タンパク質に関連するポリペプチド類および抗体
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5232833A (en) 1988-09-14 1993-08-03 Stressgen Biotechnologies Corporation Accumulation of heat shock proteins for evaluating biological damage due to chronic exposure of an organism to sublethal levels of pollutants
US6403865B1 (en) 1990-08-24 2002-06-11 Syngenta Investment Corp. Method of producing transgenic maize using direct transformation of commercially important genotypes
DE69213804T2 (de) 1991-03-28 1997-03-27 Rooperol Na Nv Zusammensetzungen von Phytosterolen mit Phytosterolinen als Immunmodulatoren
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
US6326470B1 (en) 1997-04-15 2001-12-04 The Penn State Research Foundation Enhancement of accessibility of cellulose by expansins
US5762939A (en) 1993-09-13 1998-06-09 Mg-Pmc, Llc Method for producing influenza hemagglutinin multivalent vaccines using baculovirus
GB9414118D0 (en) 1994-07-13 1994-08-31 Axis Genetics Ltd Modified plant viruses as vectors of heterologous peptides
WO1997004122A1 (en) 1995-07-20 1997-02-06 Washington State University Research Foundation Production of secreted foreign polypeptides in plant cell culture
US6042832A (en) 1996-08-28 2000-03-28 Thomas Jefferson University Polypeptides fused with alfalfa mosaic virus or ilarvirus capsid proteins
US20010006950A1 (en) 1998-02-11 2001-07-05 Juha Punnonen Genetic vaccine vector engineering
US6489537B1 (en) 1998-08-07 2002-12-03 The Trustees Of The University Of Pennsylvania Phytochelatin synthases and uses therefor
MXPA01001445A (es) 1998-08-11 2002-11-29 Large Scale Biology Corp Metodo para recuperar proteinas a partir del fluido intersticial de tejidos de plantas.
US6392121B1 (en) 1998-10-07 2002-05-21 Boyce Thompson Institute For Plant Research Gemini virus vectors for gene expression in plants
US6287570B1 (en) 1998-11-23 2001-09-11 Patricia L. Foley Vaccine against swine influenza virus
FR2791358B1 (fr) 1999-03-22 2003-05-16 Meristem Therapeutics Promoteurs chimeriques d'expression, cassettes d'expression, plasmides, vecteurs, plantes et semences transgeniques les contenant et leurs methodes d'obtention
HUP0300187A3 (en) * 1999-04-29 2004-11-29 Syngenta Ltd Haslemere Herbicide resistant plants
US7125978B1 (en) 1999-10-04 2006-10-24 Medicago Inc. Promoter for regulating expression of foreign genes
KR100797667B1 (ko) 1999-10-04 2008-01-23 메디카고 인코포레이티드 외래 유전자의 전사를 조절하는 방법
DE60232577D1 (de) 2001-01-18 2009-07-23 Vlaams Interuniv Inst Biotech Oligomerische komplexe von chimären proteinen mit verbessertem immunogenen potential
CN1997734A (zh) * 2002-02-13 2007-07-11 威斯康星旧生研究基金会 包装流感病毒载体的信号
CN103540614B (zh) 2002-02-13 2018-02-02 威斯康星旧生研究基金会 包装流感病毒载体的信号
US20040063188A1 (en) 2002-02-14 2004-04-01 Novavax, Inc. Kit for treating gastrointestinal tract
NZ546945A (en) 2002-03-19 2008-04-30 Plant Res Int Bv A plant host cell system for the expression of human GnTIII
ES2224792B1 (es) 2002-06-28 2007-02-16 Era Plantech, S.L. Produccion de peptidos y proteinas por acumulacion de cuerpos proteicos derivados de reticulos endoplasmico en plantas.
CA2524293A1 (en) 2003-05-05 2004-11-18 Boyce Thompson Institute For Plant Research Vectors and cells for preparing immunoprotective compositions derived from transgenic plants
CA2524799A1 (en) 2003-05-05 2004-11-18 Dow Agrosciences Llc Stable immunoprophylactic and therapeutic compositions derived from transgenic plant cells and methods for production
WO2005018539A2 (en) 2003-06-16 2005-03-03 Medimmune Vaccines, Inc. Influenza hemagglutinin and neuraminidase variants
US8592197B2 (en) 2003-07-11 2013-11-26 Novavax, Inc. Functional influenza virus-like particles (VLPs)
US7226781B1 (en) 2003-07-24 2007-06-05 Belyaev Alexander S Chaperone expression genomes
CN103031310B (zh) 2005-04-29 2018-09-14 开普敦大学 在植物中表达蛋白质
JP2009502789A (ja) 2005-07-19 2009-01-29 ダウ グローバル テクノロジーズ インコーポレイティド 組み換えインフルエンザワクチン
US7871626B2 (en) 2005-08-04 2011-01-18 St. Jude Children's Research Hospital Modified influenza virus for monitoring and improving vaccine efficiency
EP1945250A4 (en) 2005-08-16 2010-05-19 Hawaii Biotech Inc RECOMBINANT SUBUNIT VACCINE FOR INFLUENZA VIRUS
BRPI0617486A2 (pt) 2005-10-18 2011-07-26 Novavax Inc vacina que compreende partÍculas similares a vÍrus da gripe funcionais (vlp) e uso de uma vlp de gripe
KR20080106433A (ko) 2006-02-13 2008-12-05 프라운호퍼 유에스에이, 인코포레이티드 인플루엔자 항원, 백신 조성물 및 관련 방법
CN101578111A (zh) 2006-04-21 2009-11-11 美国陶氏益农公司 禽流感疫苗和使用方法
WO2007130327A2 (en) 2006-05-01 2007-11-15 Technovax, Inc. Influenza virus-like particle (vlp) compositions
WO2008054540A2 (en) 2006-05-18 2008-05-08 Pharmexa Inc. Inducing immune responses to influenza virus using polypeptide and nucleic acid compositions
WO2007135480A1 (en) 2006-05-22 2007-11-29 Plant Bioscience Limited Bipartite system, method and composition for the constitutive and inducible expression of high levels of foreign proteins in plants
US20070286873A1 (en) 2006-05-23 2007-12-13 Williams John V Recombinant Influenza H5 Hemagluttinin Protein And Nucleic Acid Coding Therefor
US20100143406A1 (en) 2006-06-30 2010-06-10 Gale Smith Methods of enhancing protein incorporation into virus like particles
EP2089515A4 (en) 2006-11-16 2011-02-23 Novavax Inc VIRUSUAL PARTICLES OF RESPIRATORY SYNZYTIAL VIRUS
US7730950B2 (en) 2007-01-19 2010-06-08 Halliburton Energy Services, Inc. Methods for treating intervals of a subterranean formation having variable permeability
US8697088B2 (en) 2007-05-25 2014-04-15 Novavax, Inc. VLPs derived from cells that do not express a viral matrix or core protein
WO2008151440A1 (en) 2007-06-15 2008-12-18 Medicago Inc. Modifying glycoprotein production in plants
KR100964462B1 (ko) 2007-07-10 2010-06-16 성균관대학교산학협력단 형질전환 식물 유래의 조류독감 바이러스 백신 및 그 제조방법
CA2615372A1 (en) 2007-07-13 2009-01-13 Marc-Andre D'aoust Influenza virus-like particles (vlps) comprising hemagglutinin
CN101820903A (zh) 2007-08-20 2010-09-01 美国弗劳恩霍夫股份有限公司 预防性和治疗性流感疫苗、抗原、组合物和方法
US20100310604A1 (en) * 2007-11-27 2010-12-09 Medicago Inc. Recombinant influenza virus-like particles (vlps) produced in transgenic plants expressing hemagglutinin
GB0800272D0 (en) 2008-01-08 2008-02-13 Plant Bioscience Ltd Protein expression systems
KR101956910B1 (ko) 2008-01-21 2019-03-12 메디카고 인코포레이티드 헤마글루티닌을 발현하는 트랜스제닉 식물에서 생산된 재조합 인플루엔자 바이러스-유사 입자(VLPs)
ES2545607T3 (es) 2008-07-08 2015-09-14 Medicago Inc. Antígenos de la gripe recombinantes solubles
SG192503A1 (en) 2008-07-18 2013-08-30 Medicago Inc New influenza virus immunizing epitope
CA2736796A1 (en) 2008-08-27 2010-03-04 Arizona Board Of Regents For And On Behalf Of Arizona State University A dna replicon system for high-level rapid production of vaccines and monoclonal antibody therapeutics in plants
US20100167376A1 (en) 2008-10-06 2010-07-01 Genvault Corporation Methods for providing cellular lysates from cell wall-containing samples
WO2010077712A1 (en) 2008-12-09 2010-07-08 Novavax, Inc. Bovine respiratory syncytial virus virus-like particle (vlps)
NZ597401A (en) 2009-06-24 2013-09-27 Medicago Inc Chimeric influenza virus-like particles comprising hemagglutinin
KR20120093223A (ko) 2009-09-22 2012-08-22 메디카고 인코포레이티드 식물-유래 단백질의 제조방법

Also Published As

Publication number Publication date
EP2445928A1 (en) 2012-05-02
HRP20180706T1 (hr) 2018-06-01
HUE039100T2 (hu) 2018-12-28
CA2762042C (en) 2012-11-20
KR20120133371A (ko) 2012-12-10
EP3228627A1 (en) 2017-10-11
JP6141228B2 (ja) 2017-06-07
HK1170250A1 (en) 2013-02-22
AU2010265766A1 (en) 2012-02-02
SI2445928T1 (en) 2018-05-31
JP2014158483A (ja) 2014-09-04
RU2569195C2 (ru) 2015-11-20
CA2762042A1 (en) 2010-12-29
EP2445928B1 (en) 2018-03-28
BRPI1015053A2 (pt) 2019-07-09
MY182643A (en) 2021-01-27
JP2012530499A (ja) 2012-12-06
WO2010148511A1 (en) 2010-12-29
HK1245294A1 (zh) 2018-08-24
CN102482328B (zh) 2014-11-26
DK2445928T3 (en) 2018-05-28
MX349924B (es) 2017-08-21
AU2010265766B2 (en) 2015-03-19
SG176820A1 (en) 2012-01-30
EP2445928A4 (en) 2013-11-06
US20120189658A1 (en) 2012-07-26
ZA201200481B (en) 2013-05-29
MX2011013517A (es) 2012-05-23
IL216937A (en) 2017-01-31
NO2445928T3 (pt) 2018-08-25
JP5871796B2 (ja) 2016-03-01
KR101377725B1 (ko) 2014-03-27
CN102482328A (zh) 2012-05-30
PL2445928T3 (pl) 2018-07-31
RU2012101946A (ru) 2013-07-27
US10272148B2 (en) 2019-04-30
ES2669303T3 (es) 2018-05-24
WO2010148511A8 (en) 2011-03-10
IN2012DN00650A (pt) 2015-06-12
NZ597401A (en) 2013-09-27
IL216937A0 (en) 2012-02-29

Similar Documents

Publication Publication Date Title
KR101956910B1 (ko) 헤마글루티닌을 발현하는 트랜스제닉 식물에서 생산된 재조합 인플루엔자 바이러스-유사 입자(VLPs)
PT2445928T (pt) Particulas quiméricas semelhantes a virus da gripe compreendendo hemaglutinina
DK2610345T3 (en) RECOMBINANT INFLUENZA VIRUS SIMULAR PARTICULARS (VLPS) MADE IN TRANSGENE PLANTS THAT EXPRESS HEMAGGLUTININ
KR101974017B1 (ko) 식물에서 바이러스-유사 입자 수득율을 증가시키는 방법
JP6297488B2 (ja) 植物中での狂犬病ウイルス様粒子の生成
PT2173886E (pt) Partículas semelhantes ao vírus da gripe (vlps) compreendendo hemaglutinina produzida numa planta
PT2318530T (pt) Novo epítopo de imunização contra o vírus da gripe
RU2569195C9 (ru) Химерные вирусоподобные частицы, содержащие гемагглютинин, сходные с частицами вируса гриппа