KR20110034650A - 헤마글루티닌을 포함하는 인플루엔자 바이러스-유사 입자(vlps) - Google Patents
헤마글루티닌을 포함하는 인플루엔자 바이러스-유사 입자(vlps) Download PDFInfo
- Publication number
- KR20110034650A KR20110034650A KR1020117001798A KR20117001798A KR20110034650A KR 20110034650 A KR20110034650 A KR 20110034650A KR 1020117001798 A KR1020117001798 A KR 1020117001798A KR 20117001798 A KR20117001798 A KR 20117001798A KR 20110034650 A KR20110034650 A KR 20110034650A
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- plant
- influenza
- protein
- virus
- Prior art date
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H5/00—Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/12—Viral antigens
- A61K39/145—Orthomyxoviridae, e.g. influenza virus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
- A61P31/16—Antivirals for RNA viruses for influenza or rhinoviruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/04—Immunostimulants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8257—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
- C12N15/8258—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon for the production of oral vaccines (antigens) or immunoglobulins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y503/00—Intramolecular oxidoreductases (5.3)
- C12Y503/04—Intramolecular oxidoreductases (5.3) transposing S-S bonds (5.3.4)
- C12Y503/04001—Protein disulfide-isomerase (5.3.4.1), i.e. disufide bond-forming enzyme
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/51—Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
- A61K2039/525—Virus
- A61K2039/5258—Virus-like particles
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/54—Medicinal preparations containing antigens or antibodies characterised by the route of administration
- A61K2039/541—Mucosal route
- A61K2039/543—Mucosal route intranasal
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55505—Inorganic adjuvants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55511—Organic adjuvants
- A61K2039/55583—Polysaccharides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/555—Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
- A61K2039/55588—Adjuvants of undefined constitution
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/58—Medicinal preparations containing antigens or antibodies raising an immune response against a target which is not the antigen used for immunisation
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/03—Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16022—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16122—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16123—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16133—Use of viral protein as therapeutic agent other than vaccine, e.g. apoptosis inducing or anti-inflammatory
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16134—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16151—Methods of production or purification of viral material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16111—Influenzavirus A, i.e. influenza A virus
- C12N2760/16171—Demonstrated in vivo effect
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16211—Influenzavirus B, i.e. influenza B virus
- C12N2760/16222—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16211—Influenzavirus B, i.e. influenza B virus
- C12N2760/16223—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2760/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
- C12N2760/00011—Details
- C12N2760/16011—Orthomyxoviridae
- C12N2760/16211—Influenzavirus B, i.e. influenza B virus
- C12N2760/16234—Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/65—Vector systems having a special element relevant for transcription from plants
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/508—Monitor
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Virology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Biophysics (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Pulmonology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Gastroenterology & Hepatology (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Environmental Sciences (AREA)
- General Physics & Mathematics (AREA)
- Developmental Biology & Embryology (AREA)
Abstract
식물 또는 식물의 일부에서 인플루엔자 바이러스-유사 입자(VLP)를 합성하는 방법이 제공된다. 상기 방법은 식물에서 타입 A/California/04/09의 인플루엔자 HA의 발현과 크기 배제 크로마토그래피에 의한 정제를 포함한다. 또한, 본 발명은 타입 A/California/04/09의 인플루엔자 HA 단백질과 식물 지질을 포함하는 VLP에 관한 것이다. 또한, 본 발명은 타입 A/California/04/09의 인플루엔자 HA를 암호화하는 핵산 및 벡터에 관한 것이다. VLP는 인플루엔자 백신을 제조하는데 사용될 수 있거나, 또는 기존 백신을 부화시키는데 사용될 수 있다.
Description
본 출원은 2008년 1월 21일 제출된 캐나다 출원 No. 2,615,327; 2008년 1월 22일 제출된 미국 출원 No. 61/022.775; 2007년 7월 13일 제출된 미국 출원 No. 61/959.414; 2007년 11월 27일 제출된 미국 출원 No. 60/990,603; 및 2007년 12월 12일 제출된 미국 출원 No. 61/013,272로부터 우선권을 주장하는 2008년 7월 11일 제출된 PCT 출원 No. PCT/CA2008/001281의 일부 계속 출원이며 그로부터 우선권을 주장하는 2009년 1월 12일 제출된 PCT 출원 No. PCT/CA2009/000032의 일부 계속 출원이다.
기술분야
본 발명은 바이러스-유사 입자의 제조에 관한 것이다. 보다 구체적으로, 본 발명은 인플루엔자 항원을 포함하는 바이러스-유사 입자의 제조에 관한 것이다.
인플루엔자는 호흡기 바이러스로 인한 인간의 사망에 있어서 제일의 원인이다. 일반적인 증상은 특히 발열, 인후통, 숨가쁨 및 근육통을 포함한다. 독감 시즌에 인플루엔자 바이러스는 세계 인구의 10-20%를 감염시키고 사망자는 연간 250-500,000명에 이른다.
인플루엔자 바이러스는 감염된 포유류 및 조류 세포의 원형질막으로부터 발아하는 외피보유 바이러스이다. 이들은 존재하는 핵단백질 및 바탕질 단백질 항원에 기초하여 A, B 또는 C 타입으로 분류된다. 인플루엔자 A 타입 바이러스는 출현한 헤마글루티닌(HA)과 뉴라미니다제(NA) 표면 당단백질의 조합에 따라서 서브타입들로 더 세분될 수 있다. HA는 숙주 세포에 결합하여 세포로 침투하는 바이러스의 능력을 좌우한다. NA는 숙주 세포 및 바이러스 표면 단백질 상의 글리칸 사슬로부터 말단 시알산 잔기를 제거하여 바이러스 응집을 방지하고 바이러스 이동을 촉진한다. 현재 16개의 HA(H1-H16)와 9개의 NA(N1-N9) 서브타입이 인정된다. 각 A 타입 인플루엔자 바이러스는 HA 중 1개 타입과 NA 당단백질 중 1개 타입을 제시한다. 일반적으로 각 서브타입은 종 특이성을 나타내는데, 예를 들어 모든 HA 및 NA 서브타입은 조류를 감염시킬 수 있는 것으로 알려져 있지만, 인간은 서브타입 H1, H2, H3, H5, H7, H9, H10, N1, N2, N3 및 N7 만이 감염시킬 수 있는 것으로 나타났다 (Horimoto 2006; Suzuki 2005). H5, H7 및 H9를 포함하는 인플루엔자 바이러스는 인플루엔자 A 바이러스의 가장 고도한 병원성 형태라고 생각되며, 앞으로 대유행을 일으킬 가능성이 크다.
인플루엔자의 대유행은 일반적으로 전염성과 바이러스성이 높은 인플루엔자 바이러스에 의해 일어나며, 전세계에서 질병 및 사망의 수준을 상승시킬 수 있다. 새로운 인플루엔자 A 서브타입의 출현은 20세기에 4번의 주요한 대유행을 초래하였다. 1918-1919년에 H1N1 바이러스에 의해 일어난 스페인 독감은 1917년과 1920년 사이에 전세계에서 5,000만 명 이상의 사망자를 냈다. 새로운 서브타입 출현에 대한 위험이나 동물에 특유한 서브타입이 사람에게 전염되는 것의 위험이 현재 항상 존재하고 있다. 특히 우려되는 것은 바이러스성이 매우 높은 형태의 조류 인플루엔자("조류독감"이라고도 한다)로서, 이것은 출현은 세계 각지에서 몇 세기 전부터 보고되었다. 많은 경우 이 조류독감은 48시간 내에 100%에 근접하는 사망률을 초래할 수 있다. 조류 인플루엔자 바이러스(H5N1)는 1997년에 홍콩에서 최초로 확인된 후, 야생 조류의 이주 패턴과 연계되어 다른 아시아 국가들과 유럽으로 전파되었다.
현재 인간이 인플루엔자와 싸우는 방법은 연례적인 예방접종이다. 일반적으로 백신은 다가오는 "독감 시즌"에서 유력한 균주일 것으로 예상되는 몇 가지 균주들의 조합이다. 이런 예상은 세계보건기구에 의해 조정된다. 일반적으로 매년 많은 백신 용량이 생산되지만 전세계 인구에 예방접종하기에는 충분하지 않다. 예를 들어, 캐나다와 미국은 인구의 약 1/3을 면역화할 수 있는 충분한 백신 용량을 획득하지만, 유럽연합에서는 인구의 단지 17%에만 예방접종할 수 있다. 현재 인플루엔자 백신의 세계적 생산은 전 세계적인 독감 대유행에 직면해서는 불충분함에 틀림없다. 해당하는 해에는 필요한 연간 생산량이 다소 충족될 수 있다 해도, 유력한 균주는 매년 변화하므로 당해에 필요성이 적을 때 비축하는 것은 비실용적이다. 효과적인 인플루엔자 백신의 경제적인 대규모 생산은 정부와 민간 사업자에게 똑같이 중요한 관심거리이다.
백신에 사용되는 바이러스 스톡은 수정된 난에서 생산된다. 바이러스 입자를 수거하여, 비활성화 바이러스 백신을 위해 세정제로 파괴하여 비활성화시킨다. 감독된 생백신은 저온 성장에 적합하게 된 인플루엔자 바이러스로 제조되는데, 이것은 정상 체온에서는 백신이 감독된다는 것을 의미한다. 5-49세의 개체에 사용하기 위한 이러한 백신은 미국에서 라이센스를 갖고 있다. 비활성화 전 바이러스 백신은 화학 제제를 사용한 비활성화에 의해서 무해하게 되며, 이들은 배아기 난이나 포유류 세포 배양물에서 생산된다. 이런 모든 타입의 백신은 어떤 특정한 이점과 단점을 나타낸다. 전 바이러스로부터 유래하는 백신의 한 이점은 이러한 백신에 의해서 유도되는 면역성의 타입이다. 일반적으로 분할 백신은 강한 항체 반응을 유도하는데 비해, 전 바이러스로 만든 백신은 항체(체액성) 반응과 세포성 반응을 모두 유도한다. 백신에 의해 유도되는 방어력과 서로 관련되는 기능적 항체 반응이 라이센스를 얻기 위한 기준이지만, 인플루엔자 면역성에서 T-세포 반응 역시 중요하다는 증거가 점점 증가하고 있으며, 이것은 또한 노인층에서 더 나은 방어력을 제공할 수 있다.
세포성 면역반응을 유도하기 위해서 전 바이러스로 만든 백신이 개발되었다. 인플루엔자 균주(예를 들어, H5N1)의 높은 병원성으로 인해 이들 백신은 BL3+ 시설에서 생산된다. H5N1과 같은 병원성이 높은 인플루엔자 균주에 대해, 일부 제조자들은 인플루엔자 균주의 병원성이 감소하여 독성이 없어지고, 배아기 난이나 포유류 세포 배양물에서 더 쉽게 생산될 수 있도록 헤마글루티닌 유전자 서열을 변형하였다. 또한, 헤마글루티닌과 뉴라미니다제 단백질의 유전자 서열을 고-수율 저 병원성 인플루엔자 도너 균주(A/PR/8/34; Quan F-S et al, 2007)에서 클로닝한 재배열 인플루엔자 균주를 사용하는 제조자들도 있다. 이런 방법들은 유용한 백신을 생산할 수는 있지만, 정상적인 해의 전 세계적 필요를 충족하는데 필요한 규모로서 백신의 고-용적, 저-비용 및 신속 생산에 대한 필요성의 해결책을 제공하지는 못하며, 대유행에 직면해서는 불충분하다는 것이 거의 확실하다.
이러한 역 유전자 기술을 사용하여 HA 단백질의 유전자 서열을 돌연변이시켜 독성을 없애는 것이 필요할 수도 있다. 병원성이 높은 인플루엔자 균주에 대한 전 바이러스 백신의 생산은 구속 과정을 요하거나, 또는 얻어진 백신이 순환 바이러스의 유전자 서열과 정확하게 일치하지 않기도 한다. 감독된 생백신의 경우에는 투여된 백신이 숙주의 인플루엔자 바이러스와 재조합되어 새로운 인플루엔자 바이러스를 유도할 수 있는 위험이 여전히 존재한다.
이 방법은 항원 에피토프 및 번역-후 변형을 유지하지만, 전 바이러스의 사용으로 인한 오염의 위험과 바이러스 균주에 따른 수율의 가변성을 비롯한 많은 단점이 있다. 바이러스를 난에 도입함으로 인한 바이러스에서의 유전자 이종성으로 인해 방어력이 최적 수준을 약간 밑돌 수 있다. 다른 단점은 난을 획득하기 위한 광범한 계획, 정제에 사용되는 화학물질에 의한 오염 위험, 및 긴 생산 시간을 포함한다. 또한, 난 단백질에 과민성인 사람은 백신을 맞기 위한 적격한 후보가 될 수 없다.
대유행의 경우, 분할 백신 제품은 난에서 성장하도록 균주를 개조해야 할 필요성과 달성되는 생산 수율이 가변적이라는 것 때문에 한계가 있다. 계절 백신의 제조를 위해 수년 동안 이 기술이 사용되었지만, 대유행에 시의적절하게 대응하는 것은 어려울 수 있으며, 전 세계적인 제조 용량도 제한적이다.
난의 사용을 피하기 위해서 인플루엔자 바이러스는 또한 포유류 세포 배양물, 예를 들어 MDCK 또는 PERC.6 세포 등에서 생산되었다. 또 다른 접근법은 바이러스 유전자를 사용한 세포 형질전환에 의해 바이러스를 생산하는 역 유전학이다. 그러나, 이런 방법들은 역시 전 바이러스의 사용을 요할 뿐만 아니라, 정교한 방법과 특수한 배양 환경이 필요하다.
재조합 인플루엔자 백신 후보로서 몇 가지 재조합 산물이 개발되었다. 이런 접근법은 인플루엔자 A 타입 HA 및 NA 단백질의 발현, 생산, 및 정제에 초점을 맞추고 있으며, 바쿨로바이러스 감염된 곤충 세포(Crawford et al, 1999; Johansson, 1999), 바이러스 벡터, 및 DNA 백신 구성물(Olsen et al., 1997)을 사용한 이들 단백질의 발현을 포함한다.
최근의 관심은 "돼지 독감"(균주 A/California/04/09)의 출현이다. 이 바이러스 균주는 멕시코에서 처음 출현한 후 수일 만에 전 세계의 시선을 끌게 되었으며, 전 세계 여러 국가들에서 발견되었는데, 이것은 인플루엔자가 어느 정도로 빨리 전염될 수 있느냐에 대한 증거가 될 뿐만 아니라, 검역 시험, 항바이러스제 생산, 감염 통제 그리고 궁극적으로는 백신 제조와 관련된다.
인플루엔자 바이러스 감염의 상세한 내용은 잘 알려져 있다. 간단히 말하자면, 시알산-함유 세포 수용체(당단백질 및 당지질)에 비리온 표면 HA 단백질이 부착됨으로써 감염 사이클이 개시된다. NA 단백질이 시알산 수용체의 프로세싱을 매개하며, 세포로의 바이러스 침투는 HA-의존성 수용체-매개 세포내이입에 좌우된다. 인플루엔자 비리온을 함유하는 내재화된 엔도솜의 산성 경계에서 HA 단백질이 입체형태적으로 변화되어 바이러스와 세포막이 융합되고, 뉴클레오캡시드-회합된 리보뉴클레오단백질(RNP)로부터 바이러스로 코팅되지 않은 MI 단백질이 M2-매개 방출되며, 이것이 세포핵으로 이동하여 바이러스 RNA가 합성된다. HA 단백질에 대한 항체는 바이러스 감염성을 중화함으로써 바이러스 감염을 방어하는 반면, NA 단백질에 대한 항체는 바이러스 복제의 초기 단계에서 이들의 효과를 매개한다.
Crawford 등(1999)은 바쿨로바이러스 감염된 곤충 세포에서 인플루엔자 HA의 발현을 개시한다. 발현된 단백질은 조류 H5 및 H7 인플루엔자 서브타입에 의해 야기되는 치명적인 인플루엔자 질환을 예방할 수 있는 것으로 설명된다. Johansson 등(1999)은 바쿨로바이러스-발현된 인플루엔자 HA 및 NA 단백질이 동물에서 종래의 백신에 의해 유도된 것보다 우수한 면역반응을 유도한다고 교시한다. 말 인플루엔자 바이러스의 바쿨로바이러스-발현된 헤마글루티닌의 면역원성 및 효능이 동종성 DNA 백신 후보와 비교되었다(Olsen et al., 1997). 종합적으로 이들 데이터는 다양한 실험 접근법을 사용했을 때 상이한 동물 모델에서 재조합 HA 또는 NA 단백질에 의해 인플루엔자 바이러스 시험감염에 대한 높은 정도의 방어력이 유도될 수 있음을 증명한다.
표면 인플루엔자 당단백질 HA 및 NA가 인플루엔자 바이러스에 대한 방어 면역성을 유도하는데 있어서 일차 표적이며, M1이 인플루엔자에 대한 세포 면역성의 보존된 표적을 제공한다는 것이 이전 연구에서 밝혀졌기 때문에, 새로운 백신 후보는 단백질 거대분자 입자, 예를 들어 바이러스-유사 입자(VLP)로서 이들 바이러스 항원을 포함할 수 있다. 백신 제품으로서 VLP는 체액성 면역반응과 세포성 면역반응을 모두 자극할 수 있으며, 서브유닛이나 재조합 항원보다 더 면역원성이라는 이점을 제공한다(Grgacic and Anderson, 2006). 더욱이, 이들 인플루엔자 항원을 가진 입자는 다수의 인플루엔자 바이러스 균주에 대한 중화 항체들을 도출하는 입체형태적 에피토프를 나타낼 수 있다.
백신 목적을 위해 비-감염성 인플루엔자 바이러스 균주를 생산하는 것이 우연한 감염을 피하기 위한 한 방식이 된다. 대안으로서, 배양된 바이러스의 대용물로서 바이러스-유사 입자(VLP)가 조사되었다. VLP는 바이러스 캡시드의 구조를 모방하지만, 게놈을 결여하기 때문에 복제할 수 없거나 또는 이차 감염 수단을 제공할 수 없다.
재조합 인플루엔자 단백질이 포유류 발현 플라스미드 또는 바쿨로바이러스 백터를 사용한 세포 배양물에서 VLP로 자체 회합된다는 것이 몇몇 연구에서 증명되었다(Gomez-Puertas et al., 1999; Neumann et al., 2000; Latham and Galarza, 2001). Gomez-Puertas 등(1999)은 인플루엔자 VLP의 효과적인 형성이 몇 가지 바이러스 단백질의 발현 수준에 좌우된다는 것을 개시한다. Neumann 등(2000)은 클로닝된 cDNA로부터 전체적으로 감염성 인플루엔자 바이러스-유사 입자를 생성하기 위한 포유류 발현 플라스미드-기반 시스템을 확립하였다. Latham and Galarza (2001)는 HA, NA, M1 및 M2 유전자를 공-발현하는 재조합 바쿨로바이러스로 감염된 곤충 세포에서 인플루엔자 VLP의 형성을 보고했다. 이들 연구는 인플루엔자 비리온 단백질들이 진핵 세포에서 공-발현될 때 자체 회합될 수 있음을 증명하였다.
Gomez-Puertas 등(2000)은 헤마글루티닌(HA)에 더하여 인플루엔자 바이러스의 바탕질 단백질(M1)이 곤충 세포로부터 VLP가 발아되는데 필수적임을 교시한다. 그러나, Chen 등(2007)은 VLP 형성에 M1이 필요하지 않을 수도 있다고 교시하며, M1과 VLP의 효과적인 방출에는 HA 및 NA에 의해 제공된 시알리다제 활성의 존재가 필요했다는 것을 관찰했다. NA는 VLP를 생산하는 세포의 표면에서 당단백질의 시알산을 절단하여 VLP를 배지로 방출한다.
Quan 등(2007)은 바쿨로바이러스 발현 시스템(곤충 세포)에서 생산된 VLP 백신이 일부 인플루엔자 바이러스 균주(A/PR8/34(H1N1)에 대한 방어 면역성을 유도한다는 것을 교시한다. Quan에 의해 연구된 VLP는 원형질막으로부터 발아하는 것으로 관찰되었고, 포유류 시스템(MDCK 세포)에서 얻어진 것들과 유사한 정확한 크기와 형태를 가진다고 생각되었다.
PCT 공개 WO 2004/098530 및 WO 2004/098533은 배양물 중의 형질전환된 NT-1(담배) 세포에서 뉴캐슬병 바이러스 HN 또는 조류 인플루엔자 A/turkey/Wisconsin /68(H5N9)의 발현을 교시한다. 식물 세포 배양물-발현된 폴리펩티드를 포함하는 조성물은 토끼와 닭에게서 다양한 면역반응을 도출한다.
외피보유 바이러스는 감염된 세포로부터 "발아할" 때 지질 외피를 획득할 수 있으며, 원형질막으로부터, 또는 내부 소기관의 원형질막으로부터 막을 획득할 수 있다. 인플루엔자 바이러스 입자 및 VLP는 숙주 세포의 원형질막으로부터 발아한다. 포유류 또는 바쿨로바이러스 세포 시스템에서, 예를 들어 인플루엔자는 원형질막으로부터 발아한다(Quan et al., 2007). 단지 소수의 외피보유 바이러스만이 식물을 감염시킬 수 있다고 알려져 있다(예를 들어, 토포바이러스 및 랍도바이러스 류). 공지된 식물 외피보유 바이러스 중에서도 이들은 숙주 세포의 내부 막으로부터 발아하고, 원형질막으로부터는 발아하지 않는 것을 특징으로 한다. 소수의 재조합 VLP가 식물 숙주에서 생산되었지만, 어느 것도 원형질막으로부터 유래하지는 않았는데, 이것은 인플루엔자 VLP를 비롯한 원형질막-유래 VLP가 식물에서 생산될 수 있는지의 문제를 야기한다.
현재 인플루엔자 VLP 제조 기술은 다수 바이러스 단백질의 공-발현에 의존하는데, 대유행 및 연례적인 유행 시기에는 백신접종에 있어서 대응시간이 중요하므로 이러한 의존성은 이들 기술의 단점으로 나타난다. 더 간단한 VLP 제조 시스템, 예를 들어 비-구조 바이러스 단백질 발현의 필요 없이 단지 하나나 소수의 바이러스 단백질의 발현에 의존하는 시스템이 백신 개발을 가속하는데 바람직할 수 있다.
인플루엔자로부터 전세계 인구를 보호하고 앞으로의 대유행을 저지하기 위하여 백신 제조자들은 백신 용량을 생산하는 효과적이고 신속한 방법을 개발할 필요가 있을 것이다. 현재 백신 제조에 수정된 난을 사용하는 것으로는 불충분하며 긴 과정을 수반한다.
본 발명은 개선된 인플루엔자 바이러스-유사 입자(VLP)를 제공하는 것을 목적으로 한다.
본 발명에 따라서, 식물에서 활성인 조절 영역에 작동 가능하게 연결된 외피보유 바이러스로부터의 항원을 암호화(encoding)하는 뉴클레오티드 서열을 포함하는 핵산이 제공되며, 상기 항원은 인플루엔자 헤마글루티닌(HA)이다. 바람직하게, 항원은 인플루엔자 A/California/04/09로부터의 HA이다.
HA는 자생, 또는 비-자생 신호 펩티드를 포함할 수 있고, 비-자생 신호 펩티드는 단백질 이황화물 이소머라제 신호 펩티드일 수 있다.
핵산에 의해 암호화된 HA는 타입 A 인플루엔자, 타입 B 인플루엔자일 수 있거나, 또는 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 및 H16을 포함하는 군으로부터 선택된, 타입 A 인플루엔자의 서브타입이다. 본 발명의 어떤 양태에서, 핵산에 의해 암호화된 HA는 타입 A 인플루엔자에서 유래하는 것일 수 있으며, H1, H2, H3, H5, H6, H7 및 H9를 포함하는 군으로부터 선택된다. 바람직하게, 인플루엔자 HA는 균주 A/California/04/09로부터 유래한다.
또한, 본 발명은 식물에서 인플루엔자 바이러스-유사 입자(VLP)를 생산하는 방법을 제공하며, 상기 방법은
a) 식물에서 활성인 조절 영역에 작동 가능하게 연결된, 외피보유 바이러스로부터의 항원, 예를 들어 균주 A/California/04/09 유래의 인플루엔자 헤마글루티닌(HA)을 암호화하는 핵산을 식물 또는 식물의 일부에 도입하는 단계, 및
b) 핵산의 발현을 허용하는 조건하에서 식물 또는 식물의 일부를 인큐베이션하여 VLP를 생산하는 단계
를 포함한다.
상기 방법은 식물을 수거하는 단계, 및 식물 조직으로부터 VLP를 정제 또는 분리하는 단계를 더 포함할 수 있다.
상기 방법은 도입 단계(단계 a)에서 하나 이상의 샤프롱(chaperone) 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 더 포함할 수 있다.
하나 이상의 샤프롱 단백질은 Hsp40 및 Hsp70을 포함하는 군으로부터 선택될 수 있다.
본 발명은 상기 방법에 있어서, 도입 단계(단계 a)에서 핵산이 식물에서 일시적으로 발현되거나, 또는 식물에서 안정하게 발현될 수 있는 것을 포함한다. 더욱이, VLP는 크기 배제 크로마토그래피를 이용하여 정제될 수 있다.
본 발명의 또 다른 양태에 따라서, 식물에서 인플루엔자 바이러스-유사 입자(VLP)를 생산하는 방법이 제공되며, 상기 방법은 식물에서 활성인 조절 영역에 작동 가능하게 연결된 인플루엔자 A/California/04/09 유래의 HA를 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 포함하는 식물 또는 식물의 일부를 제공하는 단계, 및 핵산의 발현을 허용하는 조건하에서 식물 또는 식물의 일부를 인큐베이션하여 VLP를 생산하는 단계를 포함한다.
상기 방법은 식물을 수거하는 단계, 및 식물 조직으로부터 VLP를 정제 또는 분리하는 단계를 더 포함할 수 있다.
본 발명은 제공 단계 후에, 식물에서 활성인 조절 영역에 작동 가능하게 연결된 하나 이상의 샤프롱 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 도입하고, 핵산의 발현을 허용하는 조건하에서 식물 또는 식물의 일부를 인큐베이션하여 VLP를 생산하는 상기 방법을 포함한다.
하나 이상의 샤프롱 단백질은 Hsp40 및 Hsp70을 포함하는 군으로부터 선택될 수 있다.
본 발명은 도입 단계(단계 a)에서 인플루엔자 A/California/04/09 유래의 HA를 암호화하는 핵산이 식물에서 안정하게 발현되는 상기 방법을 포함한다. 또한, VLP는 크기 배제 크로마토그래피를 이용하여 정제될 수 있다.
또한, 본 발명은 균주 A/California/04/09로부터의 인플루엔자 바이러스 HA 단백질 및 식물에서 유래된 하나 이상의 지질을 포함하는 바이러스-유사 입자(VLP)를 제공한다.
VLP의 HA 단백질은 타입 A 인플루엔자, 타입 B 인플루엔자의 것일 수 있거나, 또는 H1, H2, H3, H4, H5, H6, H7, H8, H9, H1O, H11, H12, H13, H14, H15 및 H16으로 구성되는 군으로부터 선택된 타입 A 인플루엔자 HA의 서브타입이다. 본 발명의 어떤 양태에서, HA는 H1, H2, H3, H5, H6, H7 및 H9를 포함하는 군으로부터 선택되는 타입 A 인플루엔자에서 유래하는 것이다.
또한, 인플루엔자 바이러스 HA 단백질, 하나 이상의 식물 지질 및 제약학적으로 허용되는 담체를 포함하는 VLP의 유효 용량을 포함하는 조성물이 본 발명에 포함된다.
또한, 본 발명은 식물에서 VLP를 형성하는 HA 단백질의 단편 또는 일부분을 고찰한다.
또한, 본 발명은 식물-특이적 N-글리칸, 또는 변형된 N-글리칸을 지닌 인플루엔자 바이러스 HA를 포함하는 VLP에 관한 것이다. VLP의 HA 단백질은 타입 A 인플루엔자, 타입 B 인플루엔자의 것일 수 있거나, 또는 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 및 H16으로 구성되는 군으로부터 선택된 타입 A 인플루엔자 HA의 서브타입이다. 본 발명의 어떤 양태에서, HA는 H1, H2, H3, H5, H6, H7 및 H9를 포함하는 군으로부터 선택된 타입 A 인플루엔자로부터 유래하는 것이다.
VLP는 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 또는 H16을 포함하는 하나 이상의 서브타입의 HA 단백질, 또는 이들의 단편 또는 일부분을 포함할 수 있다. 이러한 HA 단백질을 포함하는 서브타입의 예는 A/New Caledonia/20/99(H1N1), A/Indonesia/5/2006(H5N1), A/chicken/New York/1995, A/ herring gull/DE/677/88(H2N8), A/Texas/32/2003, A/mallard/MN/33/00, A/northern pintail/TX/828189/02, A/duck/Shanghai/1/2000, A/Turkey/Ontario/6118/68(H8N4), A/shoveler/Iran/G54/03, A/chicken/Germany/N/1949(H10N7), A/duck/England/56(H 11N6), A/duck/Alberta/60/76(H12N5), A/Gull/Maryland/704/77(H13N6), A/Mallard/ Gurjev/263/82, A/duck/Australia/341/83(H15N8), A/black-headed gull/Sweden/5/ 99(H16N3), B/Lee/40, C/Johannesburg/66, A/PuertoRico/8/34(H1N1), A/Brisbane/ 59/2007(H1N1), A/Solomon Islands 3/2006(H1N1), A/Brisbane 10/2007(H3N2), A/ Wisconsin/67/2005(H3N2), B/Malaysia/2506/2004, B/Florida/4/2006, A/Singapore/ 1/57(H2N2), A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong/ W312/97(H6N1), A/Equine/Prague/56(H7N7), A/HongKong/1073/99(H9N2), A/California/04/09(H1N1)를 포함한다.
본 발명의 한 양태에서, HA 단백질은 H1, H2, H3, H5, H6, H7 또는 H9 서브타입일 수 있다. 다른 양태에서, H1 단백질은 A/New Caledonia/20/99(H1N1), A/ PuertoRico/8/34(H1N1), A/Brisbane/59/2007(H1N1), A/Solomon Islands 3/2006(H1 N1) 또는 A/California/04/09(H1N1) 균주로부터 유래할 수 있다. 또한, H3 단백질은 A/Brisbane10/2007(H3N2) 또는 A/Wisconsin/67/2005(H3N2) 균주로부터 유래할 수 있다. 본 발명의 또 다른 양태에서, H2 단백질은 A/Singapore/1/57(H2N2) 균주로부터 유래할 수 있다. H5 단백질은 A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004 (H5N1) 또는 A/Indonesia/5/2005 균주로부터 유래할 수 있다. 본 발명의 한 양태에서, H6 단백질은 A/Teal/HongKong/W312/97(H6N1) 균주로부터 유래할 수 있다. H7 단백질은 A/Equine/Prague/56(H7N7) 균주로부터 유래할 수 있다. 본 발명의 한 양태에서, H9 단백질은 A/HongKong/1073/99(H9N2) 균주로부터 유래할 수 있다. 본 발명의 추가의 양태에서, HA 단백질은 B/Malaysia/2506/2004 또는 B/Florida/4/ 2006를 포함하는 B 타입 바이러스일 수 있는 인플루엔자 바이러스로부터 유래할 수 있다. H1, H2, H3, H5, H6, H7, H9 또는 B 서브타입으로부터의 HA 단백질의 아미노산 서열의 예는 SEQ ID NO: 48-59 및 128을 포함한다.
인플루엔자 바이러스 HA 단백질은 균주 A/Indonesia/05/05(H5N1) 유래의 H5 또는 A/Califonia/04/09(H1N1) 유래의 H1일 수 있다.
또한, 본 발명은 HA 단백질을 암호화하는 서열을 포함하는 핵산 분자를 제공한다. 핵산 분자는 HA 단백질을 암호화하는 서열에 작동 가능하게 연결된 하나 이상의 조절 영역을 더 포함할 수 있다. 핵산 분자는 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16, B 또는 C를 암호화하는 서열을 포함할 수 있다. 본 발명의 또 다른 양태에서, 핵산 분자에 의해서 암호화된 HA 단백질은 H1, H2, H3, H5, H6, H7, H9, 또는 B 서브타입일 수 있다. 핵산 분자에 의해 암호화된 H1 단백질은 A/New Caledonia/20/99(H1N1), A/PuertoRico/8/34(H1N1), A/Brisbane/59/2007(H1N1), A/Solomon Islands 3/2006(H1N1) 또는 A/Califonia/04/ 09(H1N1) 균주로부터 유래한다. 본 발명의 한 양태에서, 핵산 분자에 의해 암호화된 H3 단백질은 A/Brisbane 10/2007(H3N2) 또는 A/Wisconsin/67/2005(H3N2) 균주로부터 유래할 수 있다. 본 발명의 또 다른 양태에서, 핵산 분자에 의해 암호화된 H2 단백질은 A/Singapore/1/57(H2N2) 균주로부터 유래할 수 있다. 핵산 분자에 의해 암호화된 H5 단백질은 A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1) 또는 A/Indonesia/5/2005 균주로부터 유래할 수 있다. 본 발명의 한 양태에서, 핵산 분자에 의해 암호화된 H6 단백질은 A/Teal/HongKong/W312/97(H6N1) 균주로부터 유래할 수 있다. 또한, 핵산 분자에 의해 암호화된 H7 단백질은 A/Equine/Prague/56 (H7N7) 균주로부터 유래할 수 있다. 이에 더하여, 핵산 분자에 의해 암호화된 H9 단백질은 A/HongKong/1073/99(H9N2) 균주로부터 유래할 수 있다. 핵산에 의해 암호화된 B 서브타입 유래의 HA 단백질은 B/Florida/4/2006, 또는 B/Malaysia/2506/ 2004 균주로부터 유래할 수 있다. H1, H2, H3, H5, H6, H7, H9 또는 B 서브타입으로부터의 이러한 HA 단백질을 암호화하는 핵산 분자의 서열의 예는 SEQ ID NO: 36-47 및 60-73 및 127을 포함한다.
핵산 서열은 균주 A/Indonesia/05/05(H5N1) 또는 균주 A/Califonia/04/09(H1 N1) 유래의 인플루엔자 바이러스 HA 단백질을 암호화할 수 있다.
HA 단백질을 암호화하는 서열에 작동 가능하게 연결될 수 있는 조절 영역은 식물 세포, 곤충 세포 또는 효모 세포에서 작동하는 것들을 포함한다. 이러한 조절 영역은 플라스토시아닌 조절 영역, 리불로오스 1,5-비스포스페이트 카르복실라제/옥시게나제(RuBisCO)의 조절 영역, 클로로필 a/b 결합 단백질(CAB), ST-LS1, 폴리헤드린 조절 영역 또는 gp64 조절 영역을 포함할 수 있다. 다른 조절 영역은 5' UTR, 3' UTR 또는 터미네이터 서열을 포함한다. 플라스토시아닌 조절 영역은 자주개자리 플라스토시아닌 조절 영역일 수 있다. 또한, 5' UTR, 3' UTR 또는 터미네이터 서열도 자주개자리 서열일 수 있다.
또한, 피험체에서 인플루엔자 바이러스 감염에 대한 면역성을 유도하는 방법이 제공되며, 상기 방법은 인플루엔자 바이러스 HA 단백질, 하나 이상의 식물 지질 및 제약학적으로 허용되는 담체를 포함하는 바이러스-유사 입자를 투여하는 단계를 포함한다. 바이러스-유사 입자는 피험체에게 경구, 피내, 비내, 근육내, 복강내, 정맥내, 또는 피하 경로로 투여될 수 있다.
또한, 본 발명은 인플루엔자, 홍역, 에볼라, 마르부르크 및 HIV로 구성되는 군으로부터 선택된 바이러스로부터 유래된 하나 이상의 단백질, 및 비-시알릴화 숙주 생산 세포로부터 유래된 하나 이상의 지질을 포함하는 바이러스-유사 입자(VLP)에 관한 것이다. HIV 단백질은 p24, gp120 또는 gp41일 수 있다. 에볼라 바이러스 단백질은 VP30 또는 VP35일 수 있다. 마르부르크 바이러스 단백질은 Gp/SGP일 수 있다. 홍역 바이러스 단백질은 H-단백질 또는 F-단백질일 수 있다.
이에 더하여, 본 발명은 인플루엔자 바이러스 HA 단백질 및 하나 이상의 숙주 지질을 포함하는 바이러스-유사 입자(VLP)에 관한 것이다. 예를 들어, 숙주가 곤충인 경우, 바이러스-유사 입자(VLP)는 인플루엔자 바이러스 HA 단백질 및 하나 이상의 곤충 지질을 포함할 수 있고, 또는 숙주가 효모인 경우, 바이러스-유사 입자(VLP)는 인플루엔자 바이러스 HA 단백질 및 하나 이상의 효모 지질을 포함할 수 있다.
또한, 본 발명은 인플루엔자의 둘 이상의 균주 또는 서브타입의 VLP를 포함하는 조성물에 관한 것이다. 둘 이상의 서브타입 또는 균주는 A/New Caledonia/20 /99(H1N1), A/Indonesia/5/2006(H5N1), A/chicken/New York/1995, A/herring gull/ DE/677/88(H2N8), A/Texas/32/2003, A/mallard/MN/33/00, A/duck/Shanghai/1/2000, A/northern pintail/TX/828189/02, A/Turkey/Ontario/6118/68(H8N4), A/shoveler/ Iran/G54/03, A/chicken/Germany/N/1949(H10N7), A/duck/England/56(H11N6), A/ duck/Alberta/60/76(H12N5), A/Gull/Maryland/704/77(H13N6), A/Mallard/Gurjev/ 263/82, A/duck/Australia/341/83(H15N8), A/black-headed gull/Sweden/5/99(H16 N3), B/Lee/40, C/Johannesburg/66, A/PuertoRico/8/34(H1N1), A/Brisbane/59/2007 (H1N1), A/Solomon Islands 3/2006(H1N1), A/Brisbane 10/2007(H3N2), A/Wisconsin /67/2005(H3N2), B/Malaysia/2506/2004, B/Florida/4/2006, A/Singapore/1/57(H2 N2), A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong/W312/97 (H6N1), A/Equine/Prague/56(H7N7), A/HongKong/1073/99(H9N2) 또는 A/Califonia/ 04/09(H1N1)를 포함하는 군으로부터 선택될 수 있다. VLP의 둘 이상의 서브타입 또는 균주는 대략 등량으로 존재할 수 있다. 또는 달리, 서브타입 또는 균주 중 하나 이상이 제시된 균주 또는 서브타입의 대부분일 수 있다.
본 발명은 동물 또는 표적 생물에서 인플루엔자 바이러스 감염에 대한 면역성을 유도하는 방법에 관한 것이며, 상기 방법은 비-시알릴화 숙주, 예를 들어 식물 숙주, 곤충 숙주 또는 효모 숙주를 사용하여 생산된 하나 이상의 VLP를 포함하는 백신의 유효 용량을 투여하는 단계를 포함한다. 백신은 경구, 피내, 비내, 근육내, 복강내, 정맥내, 또는 피하 경로로 투여될 수 있다. 표적 생물은 인간, 영장류, 말, 돼지, 새(조류), 물새, 철새, 매추라기, 오리, 거위, 가금류, 닭, 낙타, 개과, 개, 고양이과, 고양이, 호랑이, 표범, 사향고양이, 밍크, 흰가슴담비, 흰족제비, 애완동물, 가축, 생쥐, 래트, 바다표범, 고래 등을 포함하는 군으로부터 선택될 수 있다.
본 발명은 VLP를 생산할 수 있는 적합한 숙주, 예를 들어 식물, 곤충 또는 효모에서 상이한 인플루엔자 균주로부터의 헤마글루티닌(HA)을 함유하는 VLP를 생산하는 방법을 제공한다. 식물에서 생산된 VLP는 식물 기원의 지질을 함유하고, 곤충 세포에서 생산된 VLP는 곤충 세포의 원형질막으로부터의 지질(일반적으로 "곤충 지질"이라고 한다)을 포함하며, 효모에서 생산된 VLP는 효모 세포의 원형질막으로부터의 지질(일반적으로 "효모 지질"이라고 한다)을 포함한다.
또한, 본 발명은 식물에서 활성인 조절 영역에 작동 가능하게 연결된 외피보유 바이러스로부터의 항원을 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 포함하는 식물, 식물 조직 또는 식물 세포에 관한 것이다. 항원은 인플루엔자 헤마글루티닌(HA)일 수 있다. 바람직하게, 항원은 인플루엔자 A/Califonia/04/09 유래의 HA이다.
식물은 식물에서 활성인 조절 영역에 작동 가능하게 연결된 하나 이상의 샤프롱 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 더 포함할 수 있다. 하나 이상의 샤프롱 단백질은 Hsp40 및 Hsp70을 포함하는 군으로부터 선택될 수 있다.
식물에서 VLP의 생산은 곤충 세포 배양물에서 이들 입자를 생산하는 것에 비해 몇 가지 이점을 나타낸다. 식물 지질은 특정 면역세포를 자극하여 유도된 면역반응을 증진시킬 수 있다. 식물 막은 지질, 포스파티딜콜린(PC) 및 포스파티딜에탄올아민(PE)으로 이루어지며, 또한 식물 및 일부 박테리아와 원생동물에 특유한 글리코스핑고지질을 함유한다. 스핑고지질은 PC나 PE처럼 글리세롤의 에스테르가 아니라, 18개를 초과하는 탄소를 함유하는 지방산 사슬과 아미드 결합을 형성하는 장쇄 아미노 알코올로 구성된다는 점에서 일반적이지 않다. PC 및 PE뿐만 아니라 글리코스핑고지질도 수지상세포 및 대식세포와 같은 항원-제시 세포(APC) 및 흉선과 간의 B 및 T 림프구를 포함하는 다른 세포들과 마찬가지로 포유류 면역세포에 의해서 발현된 CD1 분자와 결합할 수 있다(Tsuji M., 2006). 더욱이, 식물 지질 존재의 잠재적 애쥬번트 효과에 더하여, 항원-제시 세포에 의한 당단백질 항원의 포착을 촉진하는 식물 N-글리칸의 능력(Saint-Jore-Dupas, 2007)이 식물에서 VLP를 생산하는 것의 이점일 수 있다.
이론과 결부시키고 싶지는 않지만, 다른 제조 시스템에서 제조된 VLP보다 식물-제조 VLP가 더 강한 면역반응을 유도할 것이며, 이들 식물-제조 VLP에 의해 유도된 면역반응은 생백신 또는 감독된 전 바이러스 백신에 의해 유도된 면역반응에 비하여 더 강할 것이라고 예상된다.
전 바이러스로 만든 백신과는 반대로, VLP는 비-감염성이라는 이점을 제공하며, 따라서 구속적인 생물학적 봉쇄가 감염성인 전 바이러스를 사용하여 작업하는 경우처럼 중요한 문제는 아니며 생산에 필요하지도 않다. 식물-제조 VLP는 발현 시스템을 온실이나 야외에서 성장시킬 수 있다는 것을 또 다른 이점으로 제공하며, 따라서 상당히 더 경제적이고 대규모화에 적합하다.
이에 더하여, 식물은 시알산 잔기를 합성하거나 단백질에 시알산 잔기를 부가하는데 연루되는 효소를 포함하지 않는다. VLP는 뉴라미니다제(NA) 없이 생산될 수 있으며, NA의 공-발현이나, 또는 생산된 세포 또는 추출물을 시알리다제(뉴라미니다제)로 처리하는 것 없이도 식물에서 VLP 생산이 보장된다.
본 발명에 따라서 생산된 VLP는 RNA와 결합한다고 알려진 M1 단백질을 포함하지 않는다. RNA는 VLP 제제에서 오염물질이며, VLP 제품에 대해 규제당국의 승인을 얻는데 있어서 바람직하지 않다.
본 발명의 개요가 반드시 본 발명의 모든 특징을 설명하지는 않는다.
본 발명의 이들 및 다른 특징들이 첨부된 도면을 참조하여 다음의 설명으로부터 더 명백해질 것이다.
도 1a는 본 발명의 구체예에 따라서 균주 A/New Caledonia/20/99(H1N1) 유래의 H1의 발현에 사용된 자주개자리 플라스토시아닌-기반 발현 카세트의 서열을 도시한다(SEQ ID NO: 8). 단백질 이황화 이소머라제(PDI) 신호 펩티드에 밑줄이 쳐있다. 클로닝에 사용된 BglII(AGATCT) 및 SacI(GAGCTC) 제한 부위는 볼드체로 나타낸다. 도 1b는 인플루엔자 헤마글루티닌의 기능 도메인의 도식적 다이아그램을 도시한다. HA0의 절단 후, HA1과 HA2 단편이 이황화 다리에 의해 함께 결합되어 남는다.
도 2a는 균주 A/New Caledonia/20/99(H1N1) 유래의 HA 서브타입 H1의 발현을 위해 조립된 플라스미드 540을 도시한다. 도 2b는 균주 A/Indonesia/5/2005(H5N1) 유래의 HA 서브타입 H5의 발현을 위해 조립된 플라스미드 660을 도시한다.
도 3은 헤마글루티닌 H1 또는 H5를 생산하는 잎으로부터의 단백질 추출물의 크기 배제 크로마토그래피를 도시한다. 도 3a는 블루 덱스트란 2000(삼각형) 및 단백질(다이아몬드)의 용출 프로파일을 도시한다. 도 3b는 크기 배제 크로마토그래피(S500HR 비드) 후에 H1(A/New Caledonia/20/99(H1N1)) 용출 분획의 면역검출(웨스턴 블롯; 항 H1)을 도시한다. 도 3c는 H5의 용출 프로파일을 도시한다; 블루 덱스트란 2000(삼각형) 및 단백질(다이아몬드). 도 3d는 크기 배제 크로마토그래피(S500HR 비드) 후에 H5(A/Indonesia/5/2005(H5N1)) 용출 분획의 면역검출(웨스턴 블롯; 항 H5)을 도시한다.
도 4a는 H1(A/New Caledonia/20/99(H1N1))의 N-말단 단편을 암호화하는 서열을 도시한다(SEQ ID NO: 1). 도 4b는 H1(A/New Caledonia/20/99(H1N1))의 C-말단 단편을 암호화하는 서열을 도시한다(SEQ ID NO: 2).
도 5는 H1(A/New Caledonia/20/99(H1N1))의 HA0을 암호화하는 완전한 서열을 도시한다(SEQ ID NO: 28).
도 6은 초기 ATG의 바로 상류의 HindIII 부위와 중단(TAA) 코돈의 바로 하류의 SacI 부위가 측면에 위치한 H5(A/Indonesia/5/2005(H5N1))를 암호화하는 서열을 도시한다(SEQ ID NO: 3).
도 7a는 프라이머 Plasto-443c의 서열을 도시한다(SEQ ID NO: 4). 도 7b는 프라이머 SpHA(Ind)-Plasto.r의 서열을 도시한다(SEQ ID NO: 5). 도 7c는 프라이머 SpHA(Ind)-Plasto.r의 서열을 도시한다(SEQ ID NO: 6). 도 7d는 프라이머 HA(Ind)-Sac.r의 서열을 도시한다(SEQ ID NO: 7).
도 8a는 H1(A/New Caledonia/20/99(H1N1))의 아미노산 서열을 도시한다(SEQ ID NO: 9). 도 8b는 H5(A/Indonesia/5/2005(H5N1))의 아미노산 서열을 도시한다(SEQ ID NO: 10). 자생 신호 펩티드를 볼드체로 나타낸다.
도 9는 인플루엔자 A 서브타입 H7의 HA의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 11).
도 10a는 인플루엔자 A HA 서브타입 H2의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 12). 도 10b는 인플루엔자 A HA 서브타입 H3의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 13). 도 10c는 인플루엔자 A HA 서브타입 H4의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 14). 도 10d는 인플루엔자 A HA 서브타입 H5의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 15). 도 10e는 인플루엔자 A HA 서브타입 H6의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 16). 도 10f는 인플루엔자 A HA 서브타입 H8의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 17). 도 10g는 인플루엔자 A HA 서브타입 H9의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 18). 도 10h는 인플루엔자 A HA 서브타입 H10의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 19). 도 10i는 인플루엔자 A HA 서브타입 H11의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 20). 도 10j는 인플루엔자 A HA 서브타입 H12의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 21). 도 10k는 인플루엔자 A HA 서브타입 H13의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 22). 도 10l은 인플루엔자 A HA 서브타입 H14의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 23). 도 10m은 인플루엔자 A HA 서브타입 H15의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 24). 도 10n은 인플루엔자 A HA 서브타입 H16의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 25). 도 10o는 인플루엔자 B HA의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 26). 도 10p는 인플루엔자 C HA의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 27). 도 10q는 프라이머 XmaI-pPlas.c의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 29). 도 10r은 프라이머 SacI-ATG-pPlas.r의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 30). 도 10s는 프라이머 SacI-PlasTer. c의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 31). 도 10t는 프라이머 EcoRI-PlasTer.r의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 32).
도 11은 본원에서 사용된 몇몇 구성물을 도식화하여 나타낸 것이다. 구성물 660은 플라스토시아닌 프로모터(Plasto)와 터미네이터(Pter)에 작동 가능하게 연결된 HA 서브타입 H5(A/Indonesia/5/2005(H5N1))를 암호화할 수 있는 뉴클레오티드 서열을 포함한다; 구성물 540은 자주개자리 단백질 이황화 이소머라제 신호 펩티드(SP PDI)와 조합하여 HA 서브타입 H1(A/New Caledonia/20/99(H1N1))을 암호화할 수 있는 뉴클레오티드 서열을 포함하며, 플라스토시아닌 프로모터(Plasto)와 터미네이터(Pter)에 작동 가능하게 연결된다; H1을 암호화하는 뉴클레오티드 서열인 HA 서브타입 H1의 발현을 위해 조립된 구성물 544는 자주개자리 단백질 이황화 이소머라제 신호 펩티드(SP PDI) 및 GCN4pII 로이신 지퍼(HI의 막통과 도메인 및 세포질 꼬리를 대신)와 조합되고, 플라스토시아닌 프로모터(Plasto)와 터미네이터(Pter)에 작동 가능하게 연결된다; 인플루엔자 A/PR/8/34로부터의 M1 코딩 영역의 발현을 위한 구성물 750은 담배 식각 바이러스(TEV) 5' UTR과 조합되고, 이중 35S 프로모터와 Nos 터미네이터에 작동 가능하게 연결된다.
도 12는 구성물 660으로 형질전환된 N. benthamiana 잎으로부터의 단백질 추출물에서 항-H5(Vietnam) 항체를 사용한 H5(A/Indonesia/5/2005(H5N1))의 면역검출을 도시한다(레인 3). 검출시 인플루엔자 A/Vietnam/1203/2004로부터의 시판되는 H5를 양성 대조군으로 사용했고(레인 1), 빈 벡터로 형질전환된 잎으로부터의 단백질 추출물을 음성 대조군으로 사용했다(레인 2).
도 13은 크기 배제 크로마토그래피에 의한 헤마글루티닌 구조의 특성화를 도시한다. H5(A/Indonesia/5/2005(H5N1)), H1(A/New Caledonia/20/99(H1N1)), 가용성 H1 또는 H1과 M1를 생산하는 별도의 바이오매스로부터의 단백질 추출물을 S-500 HR에서 겔 여과하여 분리했다. 또, 로제트 형태의 시판되는 H1(A/New Caledonia /20/99(H1N1))을 분별했다(H1 로제트). 도 13a는 상대 단백질 함량에 대해 분석된 용출 분획을 도시한다(상대 단백질 수준 - 바이오매스 분별의 표준 단백질 용출 프로파일이 도시된다). 블루 덱스트란 2000(2MDa 기준 표준물질)의 용출 피크가 표시된다. 도 13b는 항-H5(Vietnam) 항체(H5에 대한)를 사용한 면역블롯팅에 의해서 헤마글루티닌의 존재에 대해 분석된 용출 분획을 도시한다. 도 13c는 H1에 대한 항-인플루엔자 A 항체에 대해 분석된 용출 분획을 도시한다. 도 13d는 가용성 H1에 대한 항-인플루엔자 A 항체에 대해 분석된 용출 분획을 도시한다. 도 13e는 H1 로제트에 대한 항-인플루엔자 A 항체에 대해 분석된 용출 분획을 도시한다. 도 13f는 H1+M1에 대한 항-인플루엔자 A 항체에 대해 분석된 용출 분획을 도시한다.
도 14는 농도차 수크로오스 원심분리에 의한 인플루엔자 H5(A/Indonesia/5/ 2005(H5N1)) 구조의 농도 및 헤마글루티닌-농축 분획의 전자현미경 검사를 도시한다. 도 14a는 수크로오스 밀도 구배 원심분리에 따른 분획의 특징을 도시한다. 각 분획은 항-H5(Vietnam) 항체를 사용한 면역블롯팅에 의해서 H5의 존재에 대해(위쪽 패널), 그리고 상대 단백질 함량 및 혈구응집 능력(그래프)에 대해 분석되었다. 도 14b는 수크로오스 구배 원심분리로부터의 분획 17, 18 및 19를 모은 것의 음성 염색 투과 전자현미경 검사를 도시한다. 바는 100nm이다.
도 15는 인플루엔자 H5 VLP의 정제를 도시한다. 도 15a는 정화 단계에서 단백질 함량의 코마시 블루 염색된 SDS-PAGE 분석을 도시한다 - 레인 1, 조 추출물; 레인 2, pH 6-조정된 추출물; 레인 3, 열처리된 추출물; 레인 4, DE-여과된 추출물; 페투인 친화성 정제 단계: 레인 5, 로딩; 레인 6, 통과; 레인 7, 용출(10x 농축). 도 15b는 정제된 H5 VLP 샘플의 음성 염색 투과 전자현미경 검사를 도시한다. 바는 100nm이다. 도 15c는 분리된 H5 VLP를 확대한 것으로서 구조를 상세히 볼 수 있다. 도 15d는 균주 A/Vietnam/1203/2004(H5N1)로부터의 HA에 대해 생긴 토끼 다클론성 항체를 사용한 코마시-염색된 환원 SDS-PAGE(레인 A) 및 웨스턴 블롯(레인 B) 상의 H5 VLP 산물을 도시한다.
도 16은 인플루엔자 A 바이러스(A/New Caledonia/20/99(H1N1)) 헤마글루티닌 (HA) 유전자, 완성형 cds의 뉴클레오티드 서열을 도시한다. GenBank Accession No. AY289929(SEQ ID NO: 33).
도 17은 단백질 이황화 이소머라제에 대한 Medicago sativa mRNA에 대한 뉴클레오티드 서열을 도시한다. GenBank Accession No. Z11499(SEQ ID NO: 34).
도 18은 인플루엔자 A 바이러스(A/Puerto Rico/8/34(H1N1)) 세그먼트 7의 뉴클레오티드 서열, 완성형 서열을 도시한다. GenBank Accession No. NC_002016.1 (SEQ ID NO: 35).
도 19는 H5 생산 조직의 양성 염색 투과 전자현미경 관찰에 의한 VLP 축적의 국부화를 도시한다. CW: 세포벽, ch: 엽록체, pm: 원형질막, VLP: 바이러스-유사 입자. 바는 100nm이다.
도 20은 식물-제조 인플루엔자 H5 VLP(A/Indonesia/5/2005(H5N1)) 또는 재조합 가용성 H5(A/Indonesia/5/2005(H5N1))로 백신접종한 Balb/c 마우스에 추가접종한 후 제14일의 혈청 항체 반응의 유도를 도시한다. 도 20a는 근육내 주사를 통해 면역화된 마우스의 항체 반응이다. 도 20b는 비내 투여를 통해 면역화된 마우의 항체 반응이다. 항체 반응은 불활성화된 전체 H5N1 바이러스(A/Indonesia/5/05)에 대해 측정하였다. GMT: 기하 평균 역가. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 바는 평균 편차를 나타낸다. 재조합 가용성 H5와 비교하여 * p<0.05.
도 21은 식물-제조 인플루엔자 H5 VLP(A/Indonesia/5/2005(H5N1)) 또는 재조합 가용성 H5(A/Indonesia/5/2005(H5N1))로 백신접종한 Balb/c 마우스에 추가접종한 후 제14일의 혈구응집 억제 항체 반응(HAI)을 도시한다. 도 21a는 근육내 주사를 통해 면역화된 마우스의 항체 반응이다. 도 21b는 비내 투여를 통해 면역화된 마우스의 항체 반응이다. HAI 항체 반응은 불활성화된 전체 H5N1 바이러스(A/ Indonesia/5/05)를 사용하여 측정하였다. GMT: 기하 평균 역가. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 바는 평균 편차를 나타낸다. 재조합 가용성 H5와 비교하여 * p<0.05 및 ** p<0.01.
도 22는 Balb/c 마우스에서 VLP의 면역원성에 대한 애쥬번트의 효과를 도시한다. 도 22a는 근육내 주사를 통해 면역화된 마우스에 대한 명반의 효과이다. 도 22b는 비내 투여를 통해 면역화된 마우스에 대한 키토산의 효과이다. HAI 항체 반응은 불활성화된 전체 H5N1 바이러스(A/Indonesia/5/05)를 사용하여 측정하였다. GMT: 기하 평균 역가. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 바는 평균 편차를 나타낸다. 재조합 가용성 H5와 비교하여 * p<0.05.
도 23은 H5 VLP(A/Indonesia/5/2005(H5N1)) 투여에 대한 항체 반응을 도시한다. 도 23a는 추가접종 후 제30일에 근육내 투여에 의해 백신접종한 마우스에서의 항-Indonesia/5/05 면역글로불린 이소타입이다. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(log2)이다. 불활성화된 전 H5N1(A/Indonesia/5/2005) 바이러스를 코팅제로서 사용하여 ELISA를 수행하였다. 바는 평균 편차를 나타낸다. 상응하는 재조합 가용성 H5(A/Indonesia/5/2005(H5N1))와 비교하여 * p<0.05, ** p<0.001. 도 23b는 불활성화된 전 바이러스(A/Indonesia/5/2005(H5N1) 및 A/Vietnam/1194/04(H5N1))에 대한 항체 역가이다. 모든 그룹은 음성 대조군과 통계적으로 상이하다.
도 24는 H5 VLP(A/Indonesia/5/2005(H5N1))로 면역화된 Balb/c 마우스로부터 1차 용량 후 제14일(2주), 추가접종 후 제14일(5주) 또는 추가접종 후 제30일(7주)의 동종성 불활성화된 전 바이러스(A/Indonesia/5/05)에 대한 항체 역가를 도시한다. GMT: 기하 평균 역가. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 재조합 가용성 H5와 비교하여 * p<0.05.
도 25는 추가 접종 후 제30일에 H5 VLP(A/Indonesia/5/2005(H5N1))로 면역화된 Balb/c 마우스로부터 혈청 항체의 시험관내 교차-반응성을 도시한다. 도 25a는 불활성화된 전 바이러스에 대한 항체 역가이다. 도 25b는 다양한 불활성화된 전 바이러스에 대한 혈구응집 억제 역가이다. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 바는 평균 편차를 나타낸다. 모든 그룹은 음성 대조군과 통계적으로 상이하다. 상응하는 재조합 가용성 H5와 비교하여 * p<0.05. 10 미만의 모든 값은 임의의 값 5fh 주어지며(ln으로는 1.6), 음성으로 간주된다.
도 26은 식물에서 제조된 H5 VLP(A/Indonesia/5/2005(H5N1))의 효능을 도시한다. 도 26a는 인플루엔자 균주 A/Turkey/582/06(H5N1)의 1000 LD50(4.09 x 106 CCID50)으로 시험감염한 후 마우스의 생존율이다. 도 26b는 시험감염 후 면역화된 마우스의 체중이다. 값들은 생존한 마우스의 평균 체중이다.
도 27은 식물-유래 인플루엔자 VLP의 기원을 도시한다. 도 27a는 정제된 인플루엔자 VLP의 극성 지질 조성이다. 40μg 단백질의 등량에 함유된 지질을 설명된 대로 VLP로부터 추출하고 HP-TLC에 의해서 분리하여 고도로 정제된 담배 원형질막(PM)으로부터 분리된 지질의 이동 프로파일과 비교했다. 지질들의 약자는 다음과 같다: DGDG, 디갈락토실디아실글리세롤; gluCER, 글루코실세라마이드; PA, 포스파트산; PC, 포스파티딜콜린; PE, 포스파티딜에탄올아민; PG, 포스파티딜글리세롤; PI, 포스파티딜이노시톨; PS, 포스파티딜세린; SG, 스테릴글리코시드. 도 27b는 정제된 인플루엔자 VLP의 중성 지질 조성이다. 20μg 단백질의 등량에 함유된 지질을 설명된 대로 VLP로부터 추출하고 HP-TLC에 의해서 분리하여 시토스테롤의 이동과 비교했다. 도 27c는 정제된 VLP와 담배 잎(PML) 및 BY2 담배 세포(PMBY2)로부터의 고도로 정제된 PM 중 원형질막 마커 프로톤 펌프 ATPase(PMA)의 면역검출이다. 18μg의 단백질을 각 레인에 로딩했다.
도 28은 클론 774의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Brisbane/59/2007(H1N1)의 뉴클레오티드 서열(SEQ ID NO: 36). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 29는 클론 775의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Solomon Islans 3/2006(H1N1)의 뉴클레오티드 서열(SEQ ID NO: 37). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 30은 클론 776의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Brisbane 10/2007(H3N2)의 뉴클레오티드 서열(SEQ ID NO: 38). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 31은 클론 777의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Wisconsin/67/2005(H3N2)의 뉴클레오티드 서열(SEQ ID NO: 39). 코딩 서열 측면에플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 32는 클론 778의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Malaysia/2506/2004의 뉴클레오티드 서열(SEQ ID NO: 40). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 33은 클론 779의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Florida/4/2006의 뉴클레오티드 서열(SEQ ID NO: 41). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 34는 클론 780의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Singapore/1/57(H2N2)의 뉴클레오티드 서열(SEQ ID NO: 42). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 35는 클론 781의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Anhui/1/2005(H5N1)의 뉴클레오티드 서열(SEQ ID NO: 43). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 36은 클론 782의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Vietnam/1194/2004(H5N1)의 뉴클레오티드 서열(SEQ ID NO: 44). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 37은 클론 783의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ /Teal/HongKong/W312/97(H6N1)의 뉴클레오티드 서열(SEQ ID NO: 45). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 38은 클론 784의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Equine/Prague/56(H7N7)의 뉴클레오티드 서열(SEQ ID NO: 46). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 39는 클론 785의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ HongKong/1073/99(H9N2)의 뉴클레오티드 서열(SEQ ID NO: 47). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 40a는 클론 774(A/Brisbane/59/2007(H1N1))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 48)을 도시한다. 클론 774의 오픈 리딩 프레임은 도 28에 나타낸 ATG에서 시작한다. 도 40b는 클론 775(A/Solomon Islands 3/2006(H1N1))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 49)을 도시한다. 클론 775의 오픈 리딩 프레임은 도 29에 나타낸 ATG에서 시작한다.
도 41a는 클론 776(A/Brisbane/10/2007(H3N2))으로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 50)을 도시한다. 클론 776의 오픈 리딩 프레임은 도 30에 나타낸 ATG에서 시작한다. 도 41b는 클론 777(A/Wisconsin/67/2005(H3N2))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 51)을 도시한다. 클론 777의 오픈 리딩 프레임은 도 31에 나타낸 ATG에서 시작한다.
도 42a는 클론 778(B/Malaysia/2506/2004)로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 52)을 도시한다. 클론 778의 오픈 리딩 프레임은 도 32에 나타낸 ATG에서 시작한다. 도 42b는 클론 779(B/Florida/4/2006)로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 53)을 도시한다. 클론 779의 오픈 리딩 프레임은 도 33에 나타낸 ATG에서 시작한다.
도 43a는 클론 780(A/Singapore/1/57(H2N2))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 54)을 도시한다. 클론 780의 오픈 리딩 프레임은 도 34에 나타낸 ATG에서 시작한다. 도 43b는 클론 781(A/Anhui/1/2005(H5N1))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 55)을 도시한다. 클론 781의 오픈 리딩 프레임은 도 35에 나타낸 ATG에서 시작한다.
도 44a는 클론 782(A/Vietnam/1194/2004(H5N1))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 56)을 도시한다. 클론 782의 오픈 리딩 프레임은 도 36에 나타낸 ATG에서 시작한다. 도 44b는 클론 783(A/Teal/HongKong/W312/97(H6N1))으로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 57)을 도시한다. 클론 783의 오픈 리딩 프레임은 도 37에 나타낸 ATG에서 시작한다.
도 45a는 클론 784(A/Equine/Prague/56(H7N7))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 58)을 도시한다. 클론 784의 오픈 리딩 프레임은 도 38에 나타낸 ATG에서 시작한다. 도 45b는 클론 785(A/HongKong/1073/99(H9N2))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 59)을 도시한다. 클론 785의 오픈 리딩 프레임은 도 39에 나타낸 ATG에서 시작한다.
도 46은 크기 배제 크로마토그래피 후 식물에서 생산된 VLP의 용출 분획 7-17의 면역검출(웨스턴 블롯)을 도시한다. 블루 덱스트란의 용출 피크(분획 10)를 화살표로 나타낸다. 헤마글루티닌 서브타입 H1, H2, H3, H5, H6 및 H9가 도시된다. 헤마글루티닌이 분획 7-14에서 검출되며, 이것은 VLP의 용출에 해당한다.
도 47은 연례적인 유행성 균주로부터 일련의 H1 헤마글루티닌의 발현에 대한 면역블롯 분석을 도시한다. 다양한 인플루엔자 균주(면역블롯 위에 나타냄) 유래의 HA를 발현하는 식물에 대해서 10μg 및 20μg의 잎 단백질 추출물을 각각 레인 1 및 2에 로딩했다.
도 48a는 잠재적인 대유행 균주로부터 일련의 H5 헤마글루티닌의 발현에 대한 면역블롯 분석을 도시한다. 10μg 및 20μg의 단백질 추출물을 각각 레인 1 및 2에 로딩했다. 도 48b는 선택된 인플루엔자 균주로부터의 H2, H7 및 H9 헤마글루티닌의 발현에 대한 면역블롯 분석을 도시한다. 10μg 및 20μg의 단백질 추출물을 각각 레인 1 및 2에 로딩했다.
도 49는 AGL1/660으로 아그로-침윤시킨 Nicotiana tabacum 잎으로부터의 단백질 추출물 중의 A/Indonesia/5/2005 균주로부터의 H5에 대한 면역블롯을 도시한다. 2개 식물(식물 1 및 식물 2)을 침윤시켰고, 각 식물로부터 추출된 가용성 단백질 10μg 및 20μg을 각각 레인 1 및 2에 로딩했다.
도 50은 혈청 항체의 시험관내 교차-반응성을 도시한다. 흰족제비 혈청에서 혈구응집-억제(HI) 역가, 1차 면역화 후 제14일(도 50a) 및 식물-제조 인플루엔자 H5 VLP(A/Indonesia/5/2005(H5N1))로 2차 추가접종(도 50b). 다음의 불활성화된 전체 H5N1 바이러스를 사용하여 HAI 항체 반응을 측정했다: A/turkey/Turkey/1/05, A/Vietnam/1194/04, A/Anhui /5/05 및 동종성 균주 A/Indonesia/5/05. 값들은 그룹 당 5마리 흰족제비의 상호 종점 역가의 GMT(log2)이다. 사선 - A/Indonesia/ 6/06(clade 2.1.3); 체크 - A/ turkey/Turkey/1/05(clade 2.2); 흰색 바 - A/ Vietnam/1194/04(clade 1); 흑색 바 - A/Anhui/5/05. 반응자를 표시한다. 바는 평균 편차를 나타낸다.
도 51은 자주개자리 플라스토시아닌 프로모터 및 5'UTR, A/Indonesia/5/2005로부터의 H5(구성물 # 660)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 60)을 도시한다.
도 52는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/New Caledonia/ 20/1999로부터의 H1(구성물 # 540)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 61)을 도시한다.
도 53은 자주개자리 플라스토시아닌 프로모터 및 5'UTR, A/Brisbane/59/2007로부터의 H1(구성물 # 774)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 62)을 도시한다.
도 54는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Solomon Islands /3/2006(H1N1)로부터의 H1(구성물 # 775)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 63)을 도시한다.
도 55는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Singapore/1/57 (H2N2)로부터의 H2(구성물 # 780)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 64)을 도시한다.
도 56은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Anhui/1/2005 (H5N1)로부터의 H5(구성물 # 781)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 65)을 도시한다.
도 57은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Vietnam/1194/ 2004(H5N1)로부터의 H5(구성물 # 782)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열 (SEQ ID NO: 66)을 도시한다.
도 58은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Teal/Hong Kong/ W312/97(H6N1)로부터의 H6(구성물 # 783)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 67)을 도시한다.
도 59는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Hong Kong/ 1073/99(H9N2)로부터의 H9(구성물 # 785)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 68)을 도시한다.
도 60은 자주개자리 플라스토시아닌 프로모터 및 5'UTR, A/Brisbane/10/2007 (H3N2)로부터의 H3의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 69)을 도시한다.
도 61은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Wisconsin/67/ 2005(H3N2)로부터의 H3의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 70)을 도시한다.
도 62는 자주개자리 플라스토시아닌 프로모터 및 5'UTR, A/Equine/Prague/56 (H7N7)로부터의 H7의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 71)을 도시한다.
도 63은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, B/Malaysia/2506/ 2004로부터의 HA의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 72)을 도시한다.
도 64는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, B/Florida/4/2006로부터의 HA의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 73)을 도시한다.
도 65는 A/New Caledonia/20/99(H1N1)(SEQ ID NO: 33에 의해서 암호화된다), A/Brisbane/59/2007(H1N1)(SEQ ID NO:48), A/Solomon Islands/3/2006(H1N1)(SEQ ID NO: 49) 및 SEQ ID NO: 9의 HA의 컨센서스 아미노산 서열(SEQ ID NO: 74)을 도시한다. X1(위치 3)은 A 또는 V; X2(위치 52)는 D 또는 N; X3(위치 90)은 K 또는 R; X4(위치 99)는 K 또는 T; X5(위치 111)는 Y 또는 H; X6(위치 145)은 V 또는 T; X7 (위치 154)은 E 또는 K; X8(위치 161)은 R 또는 K; X9(위치 181)는 V 또는 A; X1O (위치 203)은 D 또는 N; X11(위치 205)는 R 또는 K; X12(위치 210)는 T 또는 K; X13(위치 225)은 R 또는 K; X14(위치 268)는 W 또는 R; X15(위치 283)는 T 또는 N; X16(위치 290)은 E 또는 K; X17(위치 432)은 I 또는 L; X18(위치 489)은 N 또는 D이다.
도 66은 SEQ ID NO: 33에 의해서 암호화된 H1 New Caledonia(AAP34324.1)의 아미노산 서열(SEQ ID NO: 75)을 도시한다.
도 67은 SEQ ID NO: 35에 의해서 암호화된 H1 Puerto Rico(NC_0409878.1)의 아미노산 서열(SEQ ID NO: 76)을 도시한다.
도 68은 PacI(프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 발현 카세트 번호 828의 일부분의 핵산 서열을 도시한다. CPMV HT 5'UTR 서열에 밑줄이 쳐있고, 돌연변이된 ATG가 있다. ApaI 제한 부위(발현될 단백질 코딩 서열, 이 경우에는 C5-1 kappa 경쇄의 ATG의 바로 상류).
도 69는 HindIII(다중 클로닝 부위 내, 플라스토시아닌 프로모터 상류)에서 EcoRI(플라스토시아닌 터미네이터 바로 하류)까지, 구성물 번호 663의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 H5(A/Indonesia/5/2005 유래) 코딩 서열에 밑줄이 쳐있다.
도 70은 HindIII(다중 클로닝 부위 내, 플라스토시아닌 프로모터 상류)에서 EcoRI(플라스토시아닌 터미네이터 바로 하류)까지, 구성물 번호 787의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 H1(A/Brisbane/59/2007 유래) 코딩 서열에 밑줄이 쳐있다.
도 71은 HindIII(다중 클로닝 부위 내, 플라스토시아닌 프로모터 상류)에서 EcoRI(플라스토시아닌 터미네이터 바로 하류)까지, 구성물 번호 790의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 H3(A/Brisbane/10/2007 유래) 코딩 서열에 밑줄이 쳐있다.
도 72는 HindIII(다중 클로닝 부위 내, 플라스토시아닌 프로모터 상류)에서 EcoRI(플라스토시아닌 터미네이터 바로 하류)까지, 구성물 번호 798의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 HA(B/Florida/4/2006 유래) 코딩 서열에 밑줄이 쳐있다.
도 73은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 580의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 H1(A /New Caledonia/20/1999 유래)의 코딩 서열에 밑줄이 쳐있다.
도 74는 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 685의 일부분의 핵산 서열을 도시한다. A/Indonesia/5/2005 유래의 H5의 코딩 서열에 밑줄이 쳐있다.
도 75는 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 686의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 A/ Indonesia/5/2005 유래의 H5의 코딩 서열에 밑줄이 쳐있다.
도 76은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 732의 일부분의 핵산 서열을 도시한다. A/Brisbane/59/2007 유래의 H1의 코딩 서열에 밑줄이 쳐있다.
도 77은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 733의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 A/ Brisbane/59/2007 유래의 H1의 코딩 서열에 밑줄이 쳐있다.
도 78은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 735의 일부분의 핵산 서열을 도시한다. A/Brisbane/10/2007 유래의 H3의 코딩 서열에 밑줄이 쳐있다.
도 79는 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 736의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 A/ Brisbane/10/2007 유래의 H3의 코딩 서열에 밑줄이 쳐있다.
도 80은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 738의 일부분의 핵산 서열을 도시한다. B/Florida/4/2006 유래의 HA의 코딩 서열에 밑줄이 쳐있다.
도 81은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 739의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 B/ Florida/4/2006 유래의 HA의 코딩 서열에 밑줄이 쳐있다.
도 82는 Msj1을 암호화하는 핵산 서열을 도시한다(SEQ ID NO: 114).
도 83은 HindIII(다중 클로닝 부위 내, 프로모터 상류)에서 EcoRI(NOS 터미네이터 바로 하류)까지, 구성물 번호 R850의 일부분의 핵산 서열을 도시한다. HSP40 코딩 서열에 밑줄이 쳐있다.
도 84는 HindIII(다중 클로닝 부위 내, 프로모터 상류)에서 EcoRI(NOS 터미네이터 바로 하류)까지, 구성물 번호 R860의 일부분의 핵산 서열을 도시한다. HSP70 코딩 서열에 밑줄이 쳐있다.
도 85는 HindIII(다중 클로닝 부위 내, 프로모터 상류)에서 EcoRI(NOS 터미네이터 바로 하류)까지, 구성물 번호 R870의 일부분의 핵산 서열을 도시한다. HSP40 코딩 서열은 이탤릭체로 나타내며 밑줄이 쳐있고, HSP70 코딩 서열은 밑줄이 쳐있다. a) 뉴클레오티드 1-5003; b) 뉴클레오티드 5004-9493.
도 86은 구성물 R472의 도식적 도면을 도시한다.
도 87은 자주개자리 단백질 이황화물 이소머라제로부터의 신호 펩티드를 사용한 HA의 발현에 대한 면역블롯 분석을 도시한다. 별도의 3개 식물로부터 얻어진 잎 단백질 추출물 20㎍을 SDS-PAGE에 로딩했고, H1(A/New Caledonia/20/99(H1N1))에 대해서만 5㎍을 사용했다. 표시된 대조군(동종성 균주의 불활성화된 전 바이러스(WIV))을 Mock-침윤된 식물 5㎍ 또는 20㎍에 스파이크했다. a) A/New Caledonia /20/99 유래 H1의 발현, b) A/Brisbane/59/2007 유래 H1의 발현, c) A/Brisbane/ 10/2007 유래 H3의 발현, d) A/Indonesia/5/2005 유래 H5의 발현, e) B/Florida /4/2006의 HA의 발현. 화살표는 HA0에 해당하는 면역밴드를 표시한다. SP WT: 자생 신호 펩티드, PS PDI: 자주개자리 PDI 신호 펩티드.
도 88은 잎 단백질 추출물의 면역블롯 분석에 의한 HA 발현 전략의 비교를 도시한다. HA는 플라스토시아닌- 또는 CPMV-HT-기반 카세트를 사용하여 생산했다. CPMV-HT에 대해서는 야생형 HA 신호 펩티드와 자주개자리 PDI로부터의 신호 펩티드를 또한 비교했다. 단백질 추출물 20㎍을 분석된 HA 서브타입에 따라 SDS-PAGE에 로딩했고, H1 New Caledonia만 단백질 5㎍을 로딩했다. a) A/New Caledonia/20/ 1999 유래 H1의 발현, b) A/Brisbane/59/2007 유래 H1의 발현, c) A/Brisbane/10/ 2007 유래 H3의 발현, d) A/Indonesia/5/2005 유래 H5의 발현, 및 e) B/Florida/4/ 2006 유래 B의 발현. 화살표는 HA0에 해당하는 면역밴드를 표시한다; HA 발현에 사용된 특정 벡터를 포함하는 특이적 아그로박테리움 균주가 레인의 윗부분에 표시된다.
도 89는 Hsp40과 Hsp70으로 공-발현되었을 때 HA 축적의 면역블롯을 도시한다. H1 New Caledonia(AGL1/540)와 H3 Brisbane(AGL1/790)가 단독으로 발현되었거나, 또는 AGL1/R870와 공-발현되었다. HA 축적 수준을 침윤된 잎으로부터의 단백질 추출물의 면역블롯 분석에 의해서 평가했다. 균주 A/New Caledonia/20/99 또는 Brisbane/10/2007의 불활성화된 전 바이러스(WIV)를 대조군으로 사용했다.
도 90은 A/California/04/09 유래의 H1에 대한 CPMV-HT 기반 발현 카세트를 도시한다(구성물 # 560).
도 91은 침윤 2일 후 아그로 침윤된 식물의 단백질 추출물에서 A/California /04/09 유래의 H1에 대한 웨스턴 블롯 분석을 도시한다. 각 레인에서 전개된 샘플을 표 20에 나타낸다.
도 92a는 A/California/04/09 유래의 H1에 대한 CPMV-HT 기반 발현 카세트(구성물 # 560)의 뉴클레오티드 서열(SEQ ID NO: 127)을 도시한다. 자주개자리 단백질 이황화물 이소머라제 신호 펩티드 코딩 서열에 밑줄이 쳐있고, 성숙한 H1 코팅 서열을 볼드체로 강조한다. 도 92b는 A/California/04/09 유래의 H1의 아미노산 서열(SEQ ID NO: 128)을 도시한다(SEQ ID NO: 127에 의해 암호화된). 자주개자리 단백질 이황화물 이소머라제 신호 펩티드에 밑줄이 쳐있다.
도 93은 2X35S 프로모터의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 129).
도 94는 PacI(프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지 중간 발현 카세트 번호 972의 뉴클레오티드 서열(SEQ ID NO: 134)을 도시한다. 2X35S 프로모터 서열에 밑줄이 쳐있다. 돌연변이된 ATG는 상자로 표시된다. ApaI 제한 부위(발현될 단백질 코딩 서열, 이 경우에는 H5 A/Indonesia의 HA0의 ATG 바로 하류)는 음영으로 표시된다.
도 95는 자생 H1 A/California/4/2009 서열의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 135). 자생 H1 A/California/4/2009 신호 펩티드에 밑줄이 쳐있다. SacI 및 StuI 제한 부위는 상자로 표시된다.
도 96은 H1 A/California/4/2009 서열을 함유하는 합성된 최종 서열의 뉴클레오티드 서열(SEQ ID NO: 136)을 도시한다. DraIII에서 ApaI 제한 부위까지 M 단백질 부분에 밑줄이 쳐있다. PDISP는 볼드체로 표시된다. 돌연변이된 SacI 및 StuI 제한 부위는 상자로 표시된다.
도 97은 PCR-기반 라이게이션을 사용하여 H1 A/California/4/2009 서열을 합성하는데 사용된 단편 1(SEQ ID NO: 137), 2(SEQ ID NO: 138) 및 3(SEQ ID NO: 139)의 뉴클레오티드 서열을 도시한다.
도 98은 PacI(프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지 발현 카세트 번호 560의 뉴클레오티드 서열(SEQ ID NO: 146)을 도시한다. PDISP-HAO H1 A/California/4/2009 서열에 밑줄이 쳐있다.
도 1a는 본 발명의 구체예에 따라서 균주 A/New Caledonia/20/99(H1N1) 유래의 H1의 발현에 사용된 자주개자리 플라스토시아닌-기반 발현 카세트의 서열을 도시한다(SEQ ID NO: 8). 단백질 이황화 이소머라제(PDI) 신호 펩티드에 밑줄이 쳐있다. 클로닝에 사용된 BglII(AGATCT) 및 SacI(GAGCTC) 제한 부위는 볼드체로 나타낸다. 도 1b는 인플루엔자 헤마글루티닌의 기능 도메인의 도식적 다이아그램을 도시한다. HA0의 절단 후, HA1과 HA2 단편이 이황화 다리에 의해 함께 결합되어 남는다.
도 2a는 균주 A/New Caledonia/20/99(H1N1) 유래의 HA 서브타입 H1의 발현을 위해 조립된 플라스미드 540을 도시한다. 도 2b는 균주 A/Indonesia/5/2005(H5N1) 유래의 HA 서브타입 H5의 발현을 위해 조립된 플라스미드 660을 도시한다.
도 3은 헤마글루티닌 H1 또는 H5를 생산하는 잎으로부터의 단백질 추출물의 크기 배제 크로마토그래피를 도시한다. 도 3a는 블루 덱스트란 2000(삼각형) 및 단백질(다이아몬드)의 용출 프로파일을 도시한다. 도 3b는 크기 배제 크로마토그래피(S500HR 비드) 후에 H1(A/New Caledonia/20/99(H1N1)) 용출 분획의 면역검출(웨스턴 블롯; 항 H1)을 도시한다. 도 3c는 H5의 용출 프로파일을 도시한다; 블루 덱스트란 2000(삼각형) 및 단백질(다이아몬드). 도 3d는 크기 배제 크로마토그래피(S500HR 비드) 후에 H5(A/Indonesia/5/2005(H5N1)) 용출 분획의 면역검출(웨스턴 블롯; 항 H5)을 도시한다.
도 4a는 H1(A/New Caledonia/20/99(H1N1))의 N-말단 단편을 암호화하는 서열을 도시한다(SEQ ID NO: 1). 도 4b는 H1(A/New Caledonia/20/99(H1N1))의 C-말단 단편을 암호화하는 서열을 도시한다(SEQ ID NO: 2).
도 5는 H1(A/New Caledonia/20/99(H1N1))의 HA0을 암호화하는 완전한 서열을 도시한다(SEQ ID NO: 28).
도 6은 초기 ATG의 바로 상류의 HindIII 부위와 중단(TAA) 코돈의 바로 하류의 SacI 부위가 측면에 위치한 H5(A/Indonesia/5/2005(H5N1))를 암호화하는 서열을 도시한다(SEQ ID NO: 3).
도 7a는 프라이머 Plasto-443c의 서열을 도시한다(SEQ ID NO: 4). 도 7b는 프라이머 SpHA(Ind)-Plasto.r의 서열을 도시한다(SEQ ID NO: 5). 도 7c는 프라이머 SpHA(Ind)-Plasto.r의 서열을 도시한다(SEQ ID NO: 6). 도 7d는 프라이머 HA(Ind)-Sac.r의 서열을 도시한다(SEQ ID NO: 7).
도 8a는 H1(A/New Caledonia/20/99(H1N1))의 아미노산 서열을 도시한다(SEQ ID NO: 9). 도 8b는 H5(A/Indonesia/5/2005(H5N1))의 아미노산 서열을 도시한다(SEQ ID NO: 10). 자생 신호 펩티드를 볼드체로 나타낸다.
도 9는 인플루엔자 A 서브타입 H7의 HA의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 11).
도 10a는 인플루엔자 A HA 서브타입 H2의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 12). 도 10b는 인플루엔자 A HA 서브타입 H3의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 13). 도 10c는 인플루엔자 A HA 서브타입 H4의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 14). 도 10d는 인플루엔자 A HA 서브타입 H5의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 15). 도 10e는 인플루엔자 A HA 서브타입 H6의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 16). 도 10f는 인플루엔자 A HA 서브타입 H8의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 17). 도 10g는 인플루엔자 A HA 서브타입 H9의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 18). 도 10h는 인플루엔자 A HA 서브타입 H10의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 19). 도 10i는 인플루엔자 A HA 서브타입 H11의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 20). 도 10j는 인플루엔자 A HA 서브타입 H12의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 21). 도 10k는 인플루엔자 A HA 서브타입 H13의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 22). 도 10l은 인플루엔자 A HA 서브타입 H14의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 23). 도 10m은 인플루엔자 A HA 서브타입 H15의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 24). 도 10n은 인플루엔자 A HA 서브타입 H16의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 25). 도 10o는 인플루엔자 B HA의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 26). 도 10p는 인플루엔자 C HA의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 27). 도 10q는 프라이머 XmaI-pPlas.c의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 29). 도 10r은 프라이머 SacI-ATG-pPlas.r의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 30). 도 10s는 프라이머 SacI-PlasTer. c의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 31). 도 10t는 프라이머 EcoRI-PlasTer.r의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 32).
도 11은 본원에서 사용된 몇몇 구성물을 도식화하여 나타낸 것이다. 구성물 660은 플라스토시아닌 프로모터(Plasto)와 터미네이터(Pter)에 작동 가능하게 연결된 HA 서브타입 H5(A/Indonesia/5/2005(H5N1))를 암호화할 수 있는 뉴클레오티드 서열을 포함한다; 구성물 540은 자주개자리 단백질 이황화 이소머라제 신호 펩티드(SP PDI)와 조합하여 HA 서브타입 H1(A/New Caledonia/20/99(H1N1))을 암호화할 수 있는 뉴클레오티드 서열을 포함하며, 플라스토시아닌 프로모터(Plasto)와 터미네이터(Pter)에 작동 가능하게 연결된다; H1을 암호화하는 뉴클레오티드 서열인 HA 서브타입 H1의 발현을 위해 조립된 구성물 544는 자주개자리 단백질 이황화 이소머라제 신호 펩티드(SP PDI) 및 GCN4pII 로이신 지퍼(HI의 막통과 도메인 및 세포질 꼬리를 대신)와 조합되고, 플라스토시아닌 프로모터(Plasto)와 터미네이터(Pter)에 작동 가능하게 연결된다; 인플루엔자 A/PR/8/34로부터의 M1 코딩 영역의 발현을 위한 구성물 750은 담배 식각 바이러스(TEV) 5' UTR과 조합되고, 이중 35S 프로모터와 Nos 터미네이터에 작동 가능하게 연결된다.
도 12는 구성물 660으로 형질전환된 N. benthamiana 잎으로부터의 단백질 추출물에서 항-H5(Vietnam) 항체를 사용한 H5(A/Indonesia/5/2005(H5N1))의 면역검출을 도시한다(레인 3). 검출시 인플루엔자 A/Vietnam/1203/2004로부터의 시판되는 H5를 양성 대조군으로 사용했고(레인 1), 빈 벡터로 형질전환된 잎으로부터의 단백질 추출물을 음성 대조군으로 사용했다(레인 2).
도 13은 크기 배제 크로마토그래피에 의한 헤마글루티닌 구조의 특성화를 도시한다. H5(A/Indonesia/5/2005(H5N1)), H1(A/New Caledonia/20/99(H1N1)), 가용성 H1 또는 H1과 M1를 생산하는 별도의 바이오매스로부터의 단백질 추출물을 S-500 HR에서 겔 여과하여 분리했다. 또, 로제트 형태의 시판되는 H1(A/New Caledonia /20/99(H1N1))을 분별했다(H1 로제트). 도 13a는 상대 단백질 함량에 대해 분석된 용출 분획을 도시한다(상대 단백질 수준 - 바이오매스 분별의 표준 단백질 용출 프로파일이 도시된다). 블루 덱스트란 2000(2MDa 기준 표준물질)의 용출 피크가 표시된다. 도 13b는 항-H5(Vietnam) 항체(H5에 대한)를 사용한 면역블롯팅에 의해서 헤마글루티닌의 존재에 대해 분석된 용출 분획을 도시한다. 도 13c는 H1에 대한 항-인플루엔자 A 항체에 대해 분석된 용출 분획을 도시한다. 도 13d는 가용성 H1에 대한 항-인플루엔자 A 항체에 대해 분석된 용출 분획을 도시한다. 도 13e는 H1 로제트에 대한 항-인플루엔자 A 항체에 대해 분석된 용출 분획을 도시한다. 도 13f는 H1+M1에 대한 항-인플루엔자 A 항체에 대해 분석된 용출 분획을 도시한다.
도 14는 농도차 수크로오스 원심분리에 의한 인플루엔자 H5(A/Indonesia/5/ 2005(H5N1)) 구조의 농도 및 헤마글루티닌-농축 분획의 전자현미경 검사를 도시한다. 도 14a는 수크로오스 밀도 구배 원심분리에 따른 분획의 특징을 도시한다. 각 분획은 항-H5(Vietnam) 항체를 사용한 면역블롯팅에 의해서 H5의 존재에 대해(위쪽 패널), 그리고 상대 단백질 함량 및 혈구응집 능력(그래프)에 대해 분석되었다. 도 14b는 수크로오스 구배 원심분리로부터의 분획 17, 18 및 19를 모은 것의 음성 염색 투과 전자현미경 검사를 도시한다. 바는 100nm이다.
도 15는 인플루엔자 H5 VLP의 정제를 도시한다. 도 15a는 정화 단계에서 단백질 함량의 코마시 블루 염색된 SDS-PAGE 분석을 도시한다 - 레인 1, 조 추출물; 레인 2, pH 6-조정된 추출물; 레인 3, 열처리된 추출물; 레인 4, DE-여과된 추출물; 페투인 친화성 정제 단계: 레인 5, 로딩; 레인 6, 통과; 레인 7, 용출(10x 농축). 도 15b는 정제된 H5 VLP 샘플의 음성 염색 투과 전자현미경 검사를 도시한다. 바는 100nm이다. 도 15c는 분리된 H5 VLP를 확대한 것으로서 구조를 상세히 볼 수 있다. 도 15d는 균주 A/Vietnam/1203/2004(H5N1)로부터의 HA에 대해 생긴 토끼 다클론성 항체를 사용한 코마시-염색된 환원 SDS-PAGE(레인 A) 및 웨스턴 블롯(레인 B) 상의 H5 VLP 산물을 도시한다.
도 16은 인플루엔자 A 바이러스(A/New Caledonia/20/99(H1N1)) 헤마글루티닌 (HA) 유전자, 완성형 cds의 뉴클레오티드 서열을 도시한다. GenBank Accession No. AY289929(SEQ ID NO: 33).
도 17은 단백질 이황화 이소머라제에 대한 Medicago sativa mRNA에 대한 뉴클레오티드 서열을 도시한다. GenBank Accession No. Z11499(SEQ ID NO: 34).
도 18은 인플루엔자 A 바이러스(A/Puerto Rico/8/34(H1N1)) 세그먼트 7의 뉴클레오티드 서열, 완성형 서열을 도시한다. GenBank Accession No. NC_002016.1 (SEQ ID NO: 35).
도 19는 H5 생산 조직의 양성 염색 투과 전자현미경 관찰에 의한 VLP 축적의 국부화를 도시한다. CW: 세포벽, ch: 엽록체, pm: 원형질막, VLP: 바이러스-유사 입자. 바는 100nm이다.
도 20은 식물-제조 인플루엔자 H5 VLP(A/Indonesia/5/2005(H5N1)) 또는 재조합 가용성 H5(A/Indonesia/5/2005(H5N1))로 백신접종한 Balb/c 마우스에 추가접종한 후 제14일의 혈청 항체 반응의 유도를 도시한다. 도 20a는 근육내 주사를 통해 면역화된 마우스의 항체 반응이다. 도 20b는 비내 투여를 통해 면역화된 마우의 항체 반응이다. 항체 반응은 불활성화된 전체 H5N1 바이러스(A/Indonesia/5/05)에 대해 측정하였다. GMT: 기하 평균 역가. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 바는 평균 편차를 나타낸다. 재조합 가용성 H5와 비교하여 * p<0.05.
도 21은 식물-제조 인플루엔자 H5 VLP(A/Indonesia/5/2005(H5N1)) 또는 재조합 가용성 H5(A/Indonesia/5/2005(H5N1))로 백신접종한 Balb/c 마우스에 추가접종한 후 제14일의 혈구응집 억제 항체 반응(HAI)을 도시한다. 도 21a는 근육내 주사를 통해 면역화된 마우스의 항체 반응이다. 도 21b는 비내 투여를 통해 면역화된 마우스의 항체 반응이다. HAI 항체 반응은 불활성화된 전체 H5N1 바이러스(A/ Indonesia/5/05)를 사용하여 측정하였다. GMT: 기하 평균 역가. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 바는 평균 편차를 나타낸다. 재조합 가용성 H5와 비교하여 * p<0.05 및 ** p<0.01.
도 22는 Balb/c 마우스에서 VLP의 면역원성에 대한 애쥬번트의 효과를 도시한다. 도 22a는 근육내 주사를 통해 면역화된 마우스에 대한 명반의 효과이다. 도 22b는 비내 투여를 통해 면역화된 마우스에 대한 키토산의 효과이다. HAI 항체 반응은 불활성화된 전체 H5N1 바이러스(A/Indonesia/5/05)를 사용하여 측정하였다. GMT: 기하 평균 역가. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 바는 평균 편차를 나타낸다. 재조합 가용성 H5와 비교하여 * p<0.05.
도 23은 H5 VLP(A/Indonesia/5/2005(H5N1)) 투여에 대한 항체 반응을 도시한다. 도 23a는 추가접종 후 제30일에 근육내 투여에 의해 백신접종한 마우스에서의 항-Indonesia/5/05 면역글로불린 이소타입이다. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(log2)이다. 불활성화된 전 H5N1(A/Indonesia/5/2005) 바이러스를 코팅제로서 사용하여 ELISA를 수행하였다. 바는 평균 편차를 나타낸다. 상응하는 재조합 가용성 H5(A/Indonesia/5/2005(H5N1))와 비교하여 * p<0.05, ** p<0.001. 도 23b는 불활성화된 전 바이러스(A/Indonesia/5/2005(H5N1) 및 A/Vietnam/1194/04(H5N1))에 대한 항체 역가이다. 모든 그룹은 음성 대조군과 통계적으로 상이하다.
도 24는 H5 VLP(A/Indonesia/5/2005(H5N1))로 면역화된 Balb/c 마우스로부터 1차 용량 후 제14일(2주), 추가접종 후 제14일(5주) 또는 추가접종 후 제30일(7주)의 동종성 불활성화된 전 바이러스(A/Indonesia/5/05)에 대한 항체 역가를 도시한다. GMT: 기하 평균 역가. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 재조합 가용성 H5와 비교하여 * p<0.05.
도 25는 추가 접종 후 제30일에 H5 VLP(A/Indonesia/5/2005(H5N1))로 면역화된 Balb/c 마우스로부터 혈청 항체의 시험관내 교차-반응성을 도시한다. 도 25a는 불활성화된 전 바이러스에 대한 항체 역가이다. 도 25b는 다양한 불활성화된 전 바이러스에 대한 혈구응집 억제 역가이다. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 바는 평균 편차를 나타낸다. 모든 그룹은 음성 대조군과 통계적으로 상이하다. 상응하는 재조합 가용성 H5와 비교하여 * p<0.05. 10 미만의 모든 값은 임의의 값 5fh 주어지며(ln으로는 1.6), 음성으로 간주된다.
도 26은 식물에서 제조된 H5 VLP(A/Indonesia/5/2005(H5N1))의 효능을 도시한다. 도 26a는 인플루엔자 균주 A/Turkey/582/06(H5N1)의 1000 LD50(4.09 x 106 CCID50)으로 시험감염한 후 마우스의 생존율이다. 도 26b는 시험감염 후 면역화된 마우스의 체중이다. 값들은 생존한 마우스의 평균 체중이다.
도 27은 식물-유래 인플루엔자 VLP의 기원을 도시한다. 도 27a는 정제된 인플루엔자 VLP의 극성 지질 조성이다. 40μg 단백질의 등량에 함유된 지질을 설명된 대로 VLP로부터 추출하고 HP-TLC에 의해서 분리하여 고도로 정제된 담배 원형질막(PM)으로부터 분리된 지질의 이동 프로파일과 비교했다. 지질들의 약자는 다음과 같다: DGDG, 디갈락토실디아실글리세롤; gluCER, 글루코실세라마이드; PA, 포스파트산; PC, 포스파티딜콜린; PE, 포스파티딜에탄올아민; PG, 포스파티딜글리세롤; PI, 포스파티딜이노시톨; PS, 포스파티딜세린; SG, 스테릴글리코시드. 도 27b는 정제된 인플루엔자 VLP의 중성 지질 조성이다. 20μg 단백질의 등량에 함유된 지질을 설명된 대로 VLP로부터 추출하고 HP-TLC에 의해서 분리하여 시토스테롤의 이동과 비교했다. 도 27c는 정제된 VLP와 담배 잎(PML) 및 BY2 담배 세포(PMBY2)로부터의 고도로 정제된 PM 중 원형질막 마커 프로톤 펌프 ATPase(PMA)의 면역검출이다. 18μg의 단백질을 각 레인에 로딩했다.
도 28은 클론 774의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Brisbane/59/2007(H1N1)의 뉴클레오티드 서열(SEQ ID NO: 36). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 29는 클론 775의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Solomon Islans 3/2006(H1N1)의 뉴클레오티드 서열(SEQ ID NO: 37). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 30은 클론 776의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Brisbane 10/2007(H3N2)의 뉴클레오티드 서열(SEQ ID NO: 38). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 31은 클론 777의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Wisconsin/67/2005(H3N2)의 뉴클레오티드 서열(SEQ ID NO: 39). 코딩 서열 측면에플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 32는 클론 778의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Malaysia/2506/2004의 뉴클레오티드 서열(SEQ ID NO: 40). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 33은 클론 779의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Florida/4/2006의 뉴클레오티드 서열(SEQ ID NO: 41). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 34는 클론 780의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Singapore/1/57(H2N2)의 뉴클레오티드 서열(SEQ ID NO: 42). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 35는 클론 781의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Anhui/1/2005(H5N1)의 뉴클레오티드 서열(SEQ ID NO: 43). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 36은 클론 782의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Vietnam/1194/2004(H5N1)의 뉴클레오티드 서열(SEQ ID NO: 44). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 37은 클론 783의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ /Teal/HongKong/W312/97(H6N1)의 뉴클레오티드 서열(SEQ ID NO: 45). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 38은 클론 784의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Equine/Prague/56(H7N7)의 뉴클레오티드 서열(SEQ ID NO: 46). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 39는 클론 785의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ HongKong/1073/99(H9N2)의 뉴클레오티드 서열(SEQ ID NO: 47). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 40a는 클론 774(A/Brisbane/59/2007(H1N1))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 48)을 도시한다. 클론 774의 오픈 리딩 프레임은 도 28에 나타낸 ATG에서 시작한다. 도 40b는 클론 775(A/Solomon Islands 3/2006(H1N1))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 49)을 도시한다. 클론 775의 오픈 리딩 프레임은 도 29에 나타낸 ATG에서 시작한다.
도 41a는 클론 776(A/Brisbane/10/2007(H3N2))으로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 50)을 도시한다. 클론 776의 오픈 리딩 프레임은 도 30에 나타낸 ATG에서 시작한다. 도 41b는 클론 777(A/Wisconsin/67/2005(H3N2))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 51)을 도시한다. 클론 777의 오픈 리딩 프레임은 도 31에 나타낸 ATG에서 시작한다.
도 42a는 클론 778(B/Malaysia/2506/2004)로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 52)을 도시한다. 클론 778의 오픈 리딩 프레임은 도 32에 나타낸 ATG에서 시작한다. 도 42b는 클론 779(B/Florida/4/2006)로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 53)을 도시한다. 클론 779의 오픈 리딩 프레임은 도 33에 나타낸 ATG에서 시작한다.
도 43a는 클론 780(A/Singapore/1/57(H2N2))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 54)을 도시한다. 클론 780의 오픈 리딩 프레임은 도 34에 나타낸 ATG에서 시작한다. 도 43b는 클론 781(A/Anhui/1/2005(H5N1))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 55)을 도시한다. 클론 781의 오픈 리딩 프레임은 도 35에 나타낸 ATG에서 시작한다.
도 44a는 클론 782(A/Vietnam/1194/2004(H5N1))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 56)을 도시한다. 클론 782의 오픈 리딩 프레임은 도 36에 나타낸 ATG에서 시작한다. 도 44b는 클론 783(A/Teal/HongKong/W312/97(H6N1))으로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 57)을 도시한다. 클론 783의 오픈 리딩 프레임은 도 37에 나타낸 ATG에서 시작한다.
도 45a는 클론 784(A/Equine/Prague/56(H7N7))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 58)을 도시한다. 클론 784의 오픈 리딩 프레임은 도 38에 나타낸 ATG에서 시작한다. 도 45b는 클론 785(A/HongKong/1073/99(H9N2))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 59)을 도시한다. 클론 785의 오픈 리딩 프레임은 도 39에 나타낸 ATG에서 시작한다.
도 46은 크기 배제 크로마토그래피 후 식물에서 생산된 VLP의 용출 분획 7-17의 면역검출(웨스턴 블롯)을 도시한다. 블루 덱스트란의 용출 피크(분획 10)를 화살표로 나타낸다. 헤마글루티닌 서브타입 H1, H2, H3, H5, H6 및 H9가 도시된다. 헤마글루티닌이 분획 7-14에서 검출되며, 이것은 VLP의 용출에 해당한다.
도 47은 연례적인 유행성 균주로부터 일련의 H1 헤마글루티닌의 발현에 대한 면역블롯 분석을 도시한다. 다양한 인플루엔자 균주(면역블롯 위에 나타냄) 유래의 HA를 발현하는 식물에 대해서 10μg 및 20μg의 잎 단백질 추출물을 각각 레인 1 및 2에 로딩했다.
도 48a는 잠재적인 대유행 균주로부터 일련의 H5 헤마글루티닌의 발현에 대한 면역블롯 분석을 도시한다. 10μg 및 20μg의 단백질 추출물을 각각 레인 1 및 2에 로딩했다. 도 48b는 선택된 인플루엔자 균주로부터의 H2, H7 및 H9 헤마글루티닌의 발현에 대한 면역블롯 분석을 도시한다. 10μg 및 20μg의 단백질 추출물을 각각 레인 1 및 2에 로딩했다.
도 49는 AGL1/660으로 아그로-침윤시킨 Nicotiana tabacum 잎으로부터의 단백질 추출물 중의 A/Indonesia/5/2005 균주로부터의 H5에 대한 면역블롯을 도시한다. 2개 식물(식물 1 및 식물 2)을 침윤시켰고, 각 식물로부터 추출된 가용성 단백질 10μg 및 20μg을 각각 레인 1 및 2에 로딩했다.
도 50은 혈청 항체의 시험관내 교차-반응성을 도시한다. 흰족제비 혈청에서 혈구응집-억제(HI) 역가, 1차 면역화 후 제14일(도 50a) 및 식물-제조 인플루엔자 H5 VLP(A/Indonesia/5/2005(H5N1))로 2차 추가접종(도 50b). 다음의 불활성화된 전체 H5N1 바이러스를 사용하여 HAI 항체 반응을 측정했다: A/turkey/Turkey/1/05, A/Vietnam/1194/04, A/Anhui /5/05 및 동종성 균주 A/Indonesia/5/05. 값들은 그룹 당 5마리 흰족제비의 상호 종점 역가의 GMT(log2)이다. 사선 - A/Indonesia/ 6/06(clade 2.1.3); 체크 - A/ turkey/Turkey/1/05(clade 2.2); 흰색 바 - A/ Vietnam/1194/04(clade 1); 흑색 바 - A/Anhui/5/05. 반응자를 표시한다. 바는 평균 편차를 나타낸다.
도 51은 자주개자리 플라스토시아닌 프로모터 및 5'UTR, A/Indonesia/5/2005로부터의 H5(구성물 # 660)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 60)을 도시한다.
도 52는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/New Caledonia/ 20/1999로부터의 H1(구성물 # 540)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 61)을 도시한다.
도 53은 자주개자리 플라스토시아닌 프로모터 및 5'UTR, A/Brisbane/59/2007로부터의 H1(구성물 # 774)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 62)을 도시한다.
도 54는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Solomon Islands /3/2006(H1N1)로부터의 H1(구성물 # 775)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 63)을 도시한다.
도 55는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Singapore/1/57 (H2N2)로부터의 H2(구성물 # 780)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 64)을 도시한다.
도 56은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Anhui/1/2005 (H5N1)로부터의 H5(구성물 # 781)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 65)을 도시한다.
도 57은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Vietnam/1194/ 2004(H5N1)로부터의 H5(구성물 # 782)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열 (SEQ ID NO: 66)을 도시한다.
도 58은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Teal/Hong Kong/ W312/97(H6N1)로부터의 H6(구성물 # 783)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 67)을 도시한다.
도 59는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Hong Kong/ 1073/99(H9N2)로부터의 H9(구성물 # 785)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 68)을 도시한다.
도 60은 자주개자리 플라스토시아닌 프로모터 및 5'UTR, A/Brisbane/10/2007 (H3N2)로부터의 H3의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 69)을 도시한다.
도 61은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Wisconsin/67/ 2005(H3N2)로부터의 H3의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 70)을 도시한다.
도 62는 자주개자리 플라스토시아닌 프로모터 및 5'UTR, A/Equine/Prague/56 (H7N7)로부터의 H7의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 71)을 도시한다.
도 63은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, B/Malaysia/2506/ 2004로부터의 HA의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 72)을 도시한다.
도 64는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, B/Florida/4/2006로부터의 HA의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 73)을 도시한다.
도 65는 A/New Caledonia/20/99(H1N1)(SEQ ID NO: 33에 의해서 암호화된다), A/Brisbane/59/2007(H1N1)(SEQ ID NO:48), A/Solomon Islands/3/2006(H1N1)(SEQ ID NO: 49) 및 SEQ ID NO: 9의 HA의 컨센서스 아미노산 서열(SEQ ID NO: 74)을 도시한다. X1(위치 3)은 A 또는 V; X2(위치 52)는 D 또는 N; X3(위치 90)은 K 또는 R; X4(위치 99)는 K 또는 T; X5(위치 111)는 Y 또는 H; X6(위치 145)은 V 또는 T; X7 (위치 154)은 E 또는 K; X8(위치 161)은 R 또는 K; X9(위치 181)는 V 또는 A; X1O (위치 203)은 D 또는 N; X11(위치 205)는 R 또는 K; X12(위치 210)는 T 또는 K; X13(위치 225)은 R 또는 K; X14(위치 268)는 W 또는 R; X15(위치 283)는 T 또는 N; X16(위치 290)은 E 또는 K; X17(위치 432)은 I 또는 L; X18(위치 489)은 N 또는 D이다.
도 66은 SEQ ID NO: 33에 의해서 암호화된 H1 New Caledonia(AAP34324.1)의 아미노산 서열(SEQ ID NO: 75)을 도시한다.
도 67은 SEQ ID NO: 35에 의해서 암호화된 H1 Puerto Rico(NC_0409878.1)의 아미노산 서열(SEQ ID NO: 76)을 도시한다.
도 68은 PacI(프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 발현 카세트 번호 828의 일부분의 핵산 서열을 도시한다. CPMV HT 5'UTR 서열에 밑줄이 쳐있고, 돌연변이된 ATG가 있다. ApaI 제한 부위(발현될 단백질 코딩 서열, 이 경우에는 C5-1 kappa 경쇄의 ATG의 바로 상류).
도 69는 HindIII(다중 클로닝 부위 내, 플라스토시아닌 프로모터 상류)에서 EcoRI(플라스토시아닌 터미네이터 바로 하류)까지, 구성물 번호 663의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 H5(A/Indonesia/5/2005 유래) 코딩 서열에 밑줄이 쳐있다.
도 70은 HindIII(다중 클로닝 부위 내, 플라스토시아닌 프로모터 상류)에서 EcoRI(플라스토시아닌 터미네이터 바로 하류)까지, 구성물 번호 787의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 H1(A/Brisbane/59/2007 유래) 코딩 서열에 밑줄이 쳐있다.
도 71은 HindIII(다중 클로닝 부위 내, 플라스토시아닌 프로모터 상류)에서 EcoRI(플라스토시아닌 터미네이터 바로 하류)까지, 구성물 번호 790의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 H3(A/Brisbane/10/2007 유래) 코딩 서열에 밑줄이 쳐있다.
도 72는 HindIII(다중 클로닝 부위 내, 플라스토시아닌 프로모터 상류)에서 EcoRI(플라스토시아닌 터미네이터 바로 하류)까지, 구성물 번호 798의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 HA(B/Florida/4/2006 유래) 코딩 서열에 밑줄이 쳐있다.
도 73은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 580의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 H1(A /New Caledonia/20/1999 유래)의 코딩 서열에 밑줄이 쳐있다.
도 74는 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 685의 일부분의 핵산 서열을 도시한다. A/Indonesia/5/2005 유래의 H5의 코딩 서열에 밑줄이 쳐있다.
도 75는 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 686의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 A/ Indonesia/5/2005 유래의 H5의 코딩 서열에 밑줄이 쳐있다.
도 76은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 732의 일부분의 핵산 서열을 도시한다. A/Brisbane/59/2007 유래의 H1의 코딩 서열에 밑줄이 쳐있다.
도 77은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 733의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 A/ Brisbane/59/2007 유래의 H1의 코딩 서열에 밑줄이 쳐있다.
도 78은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 735의 일부분의 핵산 서열을 도시한다. A/Brisbane/10/2007 유래의 H3의 코딩 서열에 밑줄이 쳐있다.
도 79는 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 736의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 A/ Brisbane/10/2007 유래의 H3의 코딩 서열에 밑줄이 쳐있다.
도 80은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 738의 일부분의 핵산 서열을 도시한다. B/Florida/4/2006 유래의 HA의 코딩 서열에 밑줄이 쳐있다.
도 81은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 739의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 B/ Florida/4/2006 유래의 HA의 코딩 서열에 밑줄이 쳐있다.
도 82는 Msj1을 암호화하는 핵산 서열을 도시한다(SEQ ID NO: 114).
도 83은 HindIII(다중 클로닝 부위 내, 프로모터 상류)에서 EcoRI(NOS 터미네이터 바로 하류)까지, 구성물 번호 R850의 일부분의 핵산 서열을 도시한다. HSP40 코딩 서열에 밑줄이 쳐있다.
도 84는 HindIII(다중 클로닝 부위 내, 프로모터 상류)에서 EcoRI(NOS 터미네이터 바로 하류)까지, 구성물 번호 R860의 일부분의 핵산 서열을 도시한다. HSP70 코딩 서열에 밑줄이 쳐있다.
도 85는 HindIII(다중 클로닝 부위 내, 프로모터 상류)에서 EcoRI(NOS 터미네이터 바로 하류)까지, 구성물 번호 R870의 일부분의 핵산 서열을 도시한다. HSP40 코딩 서열은 이탤릭체로 나타내며 밑줄이 쳐있고, HSP70 코딩 서열은 밑줄이 쳐있다. a) 뉴클레오티드 1-5003; b) 뉴클레오티드 5004-9493.
도 86은 구성물 R472의 도식적 도면을 도시한다.
도 87은 자주개자리 단백질 이황화물 이소머라제로부터의 신호 펩티드를 사용한 HA의 발현에 대한 면역블롯 분석을 도시한다. 별도의 3개 식물로부터 얻어진 잎 단백질 추출물 20㎍을 SDS-PAGE에 로딩했고, H1(A/New Caledonia/20/99(H1N1))에 대해서만 5㎍을 사용했다. 표시된 대조군(동종성 균주의 불활성화된 전 바이러스(WIV))을 Mock-침윤된 식물 5㎍ 또는 20㎍에 스파이크했다. a) A/New Caledonia /20/99 유래 H1의 발현, b) A/Brisbane/59/2007 유래 H1의 발현, c) A/Brisbane/ 10/2007 유래 H3의 발현, d) A/Indonesia/5/2005 유래 H5의 발현, e) B/Florida /4/2006의 HA의 발현. 화살표는 HA0에 해당하는 면역밴드를 표시한다. SP WT: 자생 신호 펩티드, PS PDI: 자주개자리 PDI 신호 펩티드.
도 88은 잎 단백질 추출물의 면역블롯 분석에 의한 HA 발현 전략의 비교를 도시한다. HA는 플라스토시아닌- 또는 CPMV-HT-기반 카세트를 사용하여 생산했다. CPMV-HT에 대해서는 야생형 HA 신호 펩티드와 자주개자리 PDI로부터의 신호 펩티드를 또한 비교했다. 단백질 추출물 20㎍을 분석된 HA 서브타입에 따라 SDS-PAGE에 로딩했고, H1 New Caledonia만 단백질 5㎍을 로딩했다. a) A/New Caledonia/20/ 1999 유래 H1의 발현, b) A/Brisbane/59/2007 유래 H1의 발현, c) A/Brisbane/10/ 2007 유래 H3의 발현, d) A/Indonesia/5/2005 유래 H5의 발현, 및 e) B/Florida/4/ 2006 유래 B의 발현. 화살표는 HA0에 해당하는 면역밴드를 표시한다; HA 발현에 사용된 특정 벡터를 포함하는 특이적 아그로박테리움 균주가 레인의 윗부분에 표시된다.
도 89는 Hsp40과 Hsp70으로 공-발현되었을 때 HA 축적의 면역블롯을 도시한다. H1 New Caledonia(AGL1/540)와 H3 Brisbane(AGL1/790)가 단독으로 발현되었거나, 또는 AGL1/R870와 공-발현되었다. HA 축적 수준을 침윤된 잎으로부터의 단백질 추출물의 면역블롯 분석에 의해서 평가했다. 균주 A/New Caledonia/20/99 또는 Brisbane/10/2007의 불활성화된 전 바이러스(WIV)를 대조군으로 사용했다.
도 90은 A/California/04/09 유래의 H1에 대한 CPMV-HT 기반 발현 카세트를 도시한다(구성물 # 560).
도 91은 침윤 2일 후 아그로 침윤된 식물의 단백질 추출물에서 A/California /04/09 유래의 H1에 대한 웨스턴 블롯 분석을 도시한다. 각 레인에서 전개된 샘플을 표 20에 나타낸다.
도 92a는 A/California/04/09 유래의 H1에 대한 CPMV-HT 기반 발현 카세트(구성물 # 560)의 뉴클레오티드 서열(SEQ ID NO: 127)을 도시한다. 자주개자리 단백질 이황화물 이소머라제 신호 펩티드 코딩 서열에 밑줄이 쳐있고, 성숙한 H1 코팅 서열을 볼드체로 강조한다. 도 92b는 A/California/04/09 유래의 H1의 아미노산 서열(SEQ ID NO: 128)을 도시한다(SEQ ID NO: 127에 의해 암호화된). 자주개자리 단백질 이황화물 이소머라제 신호 펩티드에 밑줄이 쳐있다.
도 93은 2X35S 프로모터의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 129).
도 94는 PacI(프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지 중간 발현 카세트 번호 972의 뉴클레오티드 서열(SEQ ID NO: 134)을 도시한다. 2X35S 프로모터 서열에 밑줄이 쳐있다. 돌연변이된 ATG는 상자로 표시된다. ApaI 제한 부위(발현될 단백질 코딩 서열, 이 경우에는 H5 A/Indonesia의 HA0의 ATG 바로 하류)는 음영으로 표시된다.
도 95는 자생 H1 A/California/4/2009 서열의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 135). 자생 H1 A/California/4/2009 신호 펩티드에 밑줄이 쳐있다. SacI 및 StuI 제한 부위는 상자로 표시된다.
도 96은 H1 A/California/4/2009 서열을 함유하는 합성된 최종 서열의 뉴클레오티드 서열(SEQ ID NO: 136)을 도시한다. DraIII에서 ApaI 제한 부위까지 M 단백질 부분에 밑줄이 쳐있다. PDISP는 볼드체로 표시된다. 돌연변이된 SacI 및 StuI 제한 부위는 상자로 표시된다.
도 97은 PCR-기반 라이게이션을 사용하여 H1 A/California/4/2009 서열을 합성하는데 사용된 단편 1(SEQ ID NO: 137), 2(SEQ ID NO: 138) 및 3(SEQ ID NO: 139)의 뉴클레오티드 서열을 도시한다.
도 98은 PacI(프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지 발현 카세트 번호 560의 뉴클레오티드 서열(SEQ ID NO: 146)을 도시한다. PDISP-HAO H1 A/California/4/2009 서열에 밑줄이 쳐있다.
본 발명은 바이러스-유사 입자의 생산에 관한 것이다. 더욱 구체적으로, 본 발명은 인플루엔자 항원을 포함하는 바이러스-유사 입자의 생산에 관한 것이다.
이후 바람직한 구체예를 설명한다.
본 발명은 식물에서 활성인 조절 영역에 작동 가능하게 연결된, 외피보유 바이러스로부터의 항원, 예를 들어 인플루엔자 헤마글루티닌(HA)을 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.
더욱이, 본 발명은 식물에서 바이러스-유사 입자(VLP)를 생산하는 방법을 제공한다. 상기 방법은 식물에서 활성인 조절 영역에 작동 가능하게 연결된 항원을 암호화하는 핵산을 식물 또는 식물의 일부에 도입하는 단계, 및 핵산의 발현을 허용하는 조건하에서 식물 또는 식물의 일부를 인큐베이션하여 VLP를 생산하는 단계를 포함한다.
VLP는 인플루엔자 바이러스로부터 생산될 수 있으며, 제한되는 것은 아니지만, 홍역, 에볼라, 마르부르크 및 HIV를 포함하는 다른 원형질막에서 유래하는 바이러스로부터 생산될 수도 있다.
본 발명은 인간을 감염시킬 수 있는 모든 타입의 인플루엔자 바이러스의 VLP를 포함하며, 제한되는 것은 아니지만, 예를 들어 대단히 유행성인 A(H1N1) 서브타입(예를 들어, A/New Caledonia/20/99(H1N1)), A/Indonesia/5/05 서브타입(H5N1) (SEQ ID NO:60) 및 덜 흔한 B 타입(예를 들어, SEQ ID NO:26, 도 10o) 및 C 타입 (SEQ ID NO:27, 도 10p), 그리고 다른 인플루엔자 서브타입으로부터 획득된 HA들을 포함한다. 또한, 다른 인플루엔자 서브타입의 VLP도 본 발명에 포함되는데, 예를 들어 A/Brisbane/59/2007(H1N1; SEQ ID NO:48), A/Solomon Islands/3/2006(H1N1; SEQ ID NO:49), A/Singapore/1/57(H2N2; SEQ ID NO:54), A/Anhui/1/2005(H5N1; SEQ ID NO:55), A/Vietnam/1194/2004(H5N1; SEQ ID NO:56), A/Teal/Hong Kong/W312/97 (H6N1; SEQ ID NO:57), A/Hong Kong/1073/99(H9N2; SEQ ID NO:59), A/Brisbane/10/ 2007(H3N2; SEQ ID NO:50), A/Wisconsin/67/2005(H3N2; SEQ ID NO:51), A/Equine/ Prague/56(H7N7; SEQ ID NO:58), B/Malaysia/2506/2004(SEQ ID NO:52), B/Florida/ 4/2006(SEQ ID NO:53) 또는 A/California/04/09(H1N1)(SEQ ID NO: 127)이 있다.
또한, 본 발명은, 예를 들어 인간, 영장류, 말, 돼지, 새, 조류, 물새, 철새, 메추라기, 오리, 거위, 가금류, 닭, 낙타, 개과, 개, 고양이과, 고양이, 호랑이, 표범, 사향고양이, 밍크, 흰가슴담비, 흰족제비, 애완동물, 가축, 생쥐, 래트, 바다표범, 고래 등의 다른 포유류 또는 숙주 동물을 감염시키는 인플루엔자 바이러스에 관한 것이다.
원형질막 유래 바이러스에서 발현될 수 있는 다른 항원의 비제한적 예는 HIV의 캡시드 단백질 - p24; gp120, gp41 - 외피 단백질, 구조 단백질 VP30 및 VP35; 필로바이러스, 예를 들어 에볼라 또는 마르부르크의 Gp/SGP(글리코실화된 통합 막 단백질), 또는 파라믹소바이러스, 예를 들어 홍역의 H 단백질 및 F 단백질을 포함한다.
또한, 제한되는 것은 아니지만, 본 발명은 VLP 단백질이 발현되는 세포의 원형질막으로부터 지질 외피를 획득하는 인플루엔자 유래 VLP를 포함한다. 예를 들어, VLP가 식물-기반 시스템에서 발현된다면, VLP는 세포의 원형질막으로부터 지질 외피를 획득할 수 있다.
일반적으로 용어 "지질"은 지용성(친지질성) 자연 발생 분자를 말한다. 또한, 이 용어는 더 구체적으로 지방산과 그 유도체들(트리-, 디- 및 모노글리세리드 및 인지질)을 말할 뿐만 아니라, 다른 지용성 스테롤-함유 대사산물 또는 스테롤을 말하는데도 사용된다. 인지질은 당지질, 스테롤 및 단백질과 함께 모든 생물학적 막의 주요 성분이다. 인지질의 예는 포스파티딜에탄올아민, 포스파티딜콜린, 포스파티딜이노시톨, 포스파티딜세린, 포스파티딜글리세롤 등을 포함한다. 스테롤의 예는 주스테롤(예를 들어, 콜레스테롤) 및 피토스테롤(예를 들어, 시토스테롤) 및 스테릴-글리코시드를 포함한다. 다양한 식물 종에서 200개 이상의 피토스테롤이 확인되었으며, 가장 흔한 것은 캄페스테롤, 스티그마스테롤, 에르고스테롤, 브라시카스테롤, 델타-7-스티그마스테롤, 델타-7-아베나스테롤, 다우노스테롤, 시토스테롤, 24-메틸콜레스테롤, 콜레스테롤 또는 베타-시토스테롤이다. 당업자는 세포의 원형질막의 지질 조성이 세포 또는 세포가 얻어진 유기물의 배양 또는 성장 조건에 따라서 변할 수 있다는 것을 이해할 것이다.
세포막은 일반적으로 지질 이중층뿐만 아니라 다양한 기능의 단백질을 포함한다. 특정한 지질이 국부적으로 농축되어 있는 것이 지질 이중층에서 발견될 수 있는데, 이것을 '지질 라프트'라고 한다. 이론과 결부시키고 싶지는 않지만, 지질 라프트는 세포내이입 및 세포외유출, 바이러스 또는 다른 감염성 인자의 진입 또는 유출, 세포간 신호 변환, 세포내 및 세포외 바탕질과 같은 세포 또는 유기물의 다른 구조 성분과의 상호작용에 있어서 중요한 역할을 할 수 있다.
인플루엔자 바이러스에 관해서, 용어 "헤마글루티닌" 또는 "HA"는 본원에서 사용될 때 인플루엔자 바이러스 입자의 바깥쪽에서 발견된 당단백질을 말한다. HA는 동종삼량체 막 타입 I 당단백질로서, 일반적으로 신호 펩티드, HA1 도메인, 및 C-말단에 막-연결 고정 부위 및 작은 세포질 꼬리를 포함하는 HA2 도메인을 포함한다(도 1b). HA를 암호화하는 뉴클레오티드 서열은 잘 공지되어 있어서 이용할 수 있다 - 예를 들어, BioDefence Public Health base(Influenza Virus; URL: bioheal thbase.org) 또는 National Center for Biotechnology Information(URL: ncbi.nlm. nih.gov)를 참조하며, 이들은 모두 본원에 참고자료로 포함된다.
용어 "동종삼량체" 또는 "동종삼량체의"는 3개의 HA 단백질 분자에 의해 형성된 올리고머를 말한다. 이론과 결부시키고 싶지는 않지만, HA 단백질은 약 75 kDa의 단량체 전구물질 단백질(HA0)로서 합성되고, 이것이 표면에서 삼량체 단백질로 길게 회합된다. 삼량체화가 일어나기 전에 전구물질 단백질이 보존성 활성화 절단 부위(융합 펩티드라고도 한다)에서 2개의 폴리펩티드 사슬 HA1 및 HA2(막통과 영역을 포함한다)로 절단되며, 이들은 이황화 결합에 의해 연결된다. HA1 세그먼트는 328개 아미노산 길이일 수 있고, HA2 세그먼트는 221개 아미노산 길이일 수 있다. 이 절단은 바이러스 감염성에는 중요할 수 있지만 단백질의 삼량체화에 필수적인 것은 아니다. 숙주 세포의 세포질세망(ER) 막 안으로 HA의 삽입, 신호 펩티드 절단 및 단백질 글리코실화가 동시 번역되는 사건이다. HA의 정확한 리폴딩에는 단백질의 글리코실화와 6개의 사슬내 이황화 결합의 형성이 필요하다. HA 삼량체는 시스- 및 트랜스-Golgi 복합체 내에서 회합되며, 막통과 도메인이 삼량체화 과정에서 어떤 역할을 한다. 막통과 도메인이 상실된 브로멜라인-처리된 HA 단백질의 결정 구조는 인플루엔자 균주들 중에서도 가장 보존성 구조를 나타냈다. 또한, HA는 감염 과정 동안 중요한 입체형태적 변화를 겪는다는 것이 입증되었으며, 이것에는 전구물질 HA0가 2개의 폴리펩티드 사슬 HA1 및 HA2로 절단되는 것이 필요하다. HA 단백질은 가공될 수도 있고(즉, HA1 및 HA2 도메인을 포함한다) 가공되지 않을 수도 있다(즉, HA0 도메인을 포함한다).
본 발명은 막통과 도메인을 포함하는 HA 단백질의 사용에 관한 것이며, HA1 및 HA2 도메인을 포함하는데, 예를 들어 HA 단백질은 HA0이거나, 또는 HA1 및 HA2를 포함하는 가공된 HA일 수 있다. HA 단백질은 식물, 또는 식물 세포 발현 시스템을 사용하여 VLP를 생산 또는 형성하는데 사용될 수 있다.
본 발명의 HA는 어떤 서브타입으로부터도 획득될 수 있다. 예를 들어, HA는 서브타입 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16, 또는 인플루엔자 타입 B의 것일 수 있다. 또한, 본 발명의 재조합 HA는 본 분야에 공지된 모든 헤마글루티닌 서열에 기초한 아미노산 서열을 포함할 수 있다 - BioDefence Public Health base(Influenza Virus; URL: biohealthbase.org) 또는 National Center for Biotechnology Information(URL: ncbi.nlm.nih.gov) 참조. 더욱이, HA는 하나 이상의 출현해 있는 또는 새로 확인된 인플루엔자 바이러스로부터 분리된 헤마글루티닌의 서열에 기초할 수 있다.
또한, 본 발명은 하나 이상의 인플루엔자 서브타입으로부터 획득된 HA를 포함하는 VLP를 포함한다. 예를 들어, VLP는 서브타입 H1(SEQ ID NO:28에 의해서 암호화), H2(SEQ ID NO:12에 의해서 암호화), H3(SEQ ID NO:13에 의해서 암호화), H4 (SEQ ID NO:14에 의해서 암호화), H5(SEQ ID NO:15에 의해서 암호화), H6(SEQ ID NO:16에 의해서 암호화), H7(SEQ ID NO:11에 의해서 암호화), H8(SEQ ID NO:17에 의해서 암호화), H9(SEQ ID NO:18에 의해서 암호화), H10(SEQ ID NO:19에 의해서 암호화), H11(SEQ ID NO:20에 의해서 암호화), H12(SEQ ID NO:21에 의해서 암호화), H13(SEQ ID NO:27에 의해서 암호화), H14(SEQ ID NO:23에 의해서 암호화), H15 (SEQ ID NO:24에 의해서 암호화), H16(SEQ ID NO:25에 의해서 암호화), 또는 인플루엔자 타입 B(SEQ ID NO:26에 의해서 암호화), 또는 이들의 조합으로부터 하나 이상의 HA를 포함할 수 있다. 하나 이상의 인플루엔자 서브타입으로부터의 하나 이상의 HA는 식물 또는 곤충 세포에서 공-발현될 수 있으며, 이로써 하나 이상의 HA가 합성된 결과로서 하나 이상의 인플루엔자 서브타입으로부터 획득된 HA들의 조합을 포함하는 VLP의 형성이 보장된다. HA의 조합의 선택은 VLP로부터 제조된 백신의 의도된 용도에 의해 결정될 수 있다. 예를 들어, 새 접종용 백신은 HA 서브타입의 어떤 조합이라도 포함할 수 있고, 인간을 접종하는데 유용한 VLP는 서브타입 H1, H2, H3, H5, H7, H9, H10, N1, N2, N3 및 N7 중 하나 이상의 서브타입을 포함할 수 있다. 그러나, 접종물의 용도에 따라서 다른 HA 서브타입 조합도 제조될 수 있다.
따라서, 본 발명은 하나 또는 하나 이상의 HA 서브타입, 예를 들어 2개, 3개, 4개, 5개, 6개, 또는 그 이상의 HA 서브타입을 포함하는 VLP에 관한 것이다.
또한, 본 발명은 식물에서 발현되었을 때 VLP를 형성하는 헤마글루티닌을 암호화하는 핵산을 제공한다.
전형적인 핵산은 인플루엔자 서브타입의 선택된 균주 유래의 헤마글루티닌의 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, A/New Caledonia/20/99(H1N1) (SEQ ID NO: 33)과 같은 A (H1N1) 서브타입, A/Indonesia/5/05 서브타입(H5N1)(구성물 # 660을 포함함; SEQ ID NO: 60) 및 덜 흔하지만 B 타입(예를 들어, SEQ ID NO: 26, 도 10o), 및 C 타입(SEQ ID NO: 27, 도 10p), 및 다른 인플루엔자 서브타입으로부터 얻어진 HA들이다. 또한, 다른 인플루엔자 서브타입의 VLP도 본 발명에 포함되며, 예를 들어 A/Brisbane/59/2007(H1N1; SEQ ID NO:36), A/Solomon Islands /3/2006(H1N1; SEQ ID NO: 37), A/Singapore/1/57(H2N2; SEQ ID NO: 42), A/Anhui/ 1/2005(H5N1; SEQ ID NO: 43), A/Vietnam/1194/2004(H5N1; SEQ ID NO: 44), A/Teal /Hong Kong/W312/97(H6N1; SEQ ID NO: 45), A/Hong Kong/1073/99(H9N2; SEQ ID NO: 47), A/Brisbane/10/2007(H3N2; SEQ ID NO: 38), A/Wisconsin/67/2005(H3N2; SEQ ID NO: 39), A/Equine/Prague/56(H7N7; SEQ ID NO: 46), B/Malaysia/2506/2004(SEQ ID NO: 40), B/Florida/4/2006(SEQ ID NO: 41) 또는 A/California/04/09(H1N1)(SEQ ID NO: 127)이다.
헤마글루티닌의 정확한 폴딩은 인플루엔자 헤마글루티닌의 여러 특징들 중에서도 단백질의 안정성, 멀티머의 형성, VLP의 형성 및 HA의 기능(적혈구 응집 능력)에 중요할 수 있다. 단백질의 폴딩은, 제한되지는 않지만, 단백질의 서열, 단백질의 상대적 풍부성, 세포내 군집화 정도, 폴딩된, 부분적으로 폴딩된 또는 언폴딩된 단백질과 결합하거나 일시적으로 회합될 수 있는 보조인자들의 활용성, 하나 이상의 샤프롱 단백질의 존재 등을 포함하는 하나 이상의 요인들에 의해 영향을 받을 수 있다.
열충격 단백질(Hsp) 또는 스트레스 단백질이 단백질 합성, 세포내 이동, 미스폴딩 방지, 단백질 응집 방지, 단백질 복합체의 조립 및 해체, 단백질 폴딩, 및 단백질 응집장애를 포함하는 다양한 세포 과정에 참여할 수 있는 샤프롱 단백질의 예이다. 이러한 샤프롱 단백질의 예는, 제한되지는 않지만, Hsp60, Hsp65, Hsp70, Hsp90, Hsp100, Hsp20-30, Hsp10, Hsp100-200, Hsp100, Hsp90, Lon, TF55, FKBPs, 시클로필린, ClpP, GrpE, 유비퀴틴, 칼넥신, 및 단백질 이황화물 이소머라제를 포함한다. 예를 들어, Macario, A. J. L., Cold Spring Harbor Laboratory Res. 25:59-70. 1995; Parsell, D.A. & Lindquist, S. Ann. Rev. Genet. 27:437-496 (1993); 미국특허 No. 5,232,833를 참조한다. 일부 예에서, 샤프롱 단백질의 특정 그룹은 Hsp40 및 Hsp70을 포함한다.
Hsp70의 예는 포유류 세포 유래의 Hsp72 및 Hsc73, 박테리아, 특히 미코박테리아, 예를 들어 Mycobacterium leprae , Mycobacterium bovis , 및 Mycobacterium tuberculosis 유래의 DnaK(Bacille-Calmette Guerin 등: 본원에서는 Hsp71라고도 한다), Escherichia coli, 효모, 및 다른 원핵생물 유래의 DnaK, 및 진핵생물, 예를 들어 A. thaliana 유래의 BiP 및 Grp78을 포함한다(Cell Stress and Chaperones 6:201-208). Hsp70의 특정 예는 A. thaliana Hsp70(SEQ ID NO:122, 또는 SEQ ID NO:123에 의해 암호화)이다. Hsp70은 ATP뿐만 아니라 언폴딩 폴리펩티드 및 펩티드와 특이적으로 결합할 수 있으며, 이로써 단백질 폴딩 및 언폴딩에 참여하고, 단백질 복합체의 조립 및 해체에도 참여한다.
Hsp40의 예는 원핵생물, 예를 들어 E. coli 및 미코박테리아 유래의 DnaJ 및 진핵생물, 예를 들어 자주개자리 유래의 HSJ1, HDJ1 및 Hsp40을 포함한다(Frugis et al., 1999. Plant Molecular Biology 40:397-408). Hsp40의 특정 예는 M. sativa MsJ1(SEQ ID NO:121, 123 또는 114에 의해 암호화)이다. Hsp40은 여러 세포 활성 중에서도 단백질 폴딩, 열내성 및 DNA 복제에서 분자 샤프롱으로서의 역할을 한다.
Hsp 중에서도 Hsp70과 그것의 보조-샤프롱인 Hsp40은 합성이 완료되기 전에 번역중인 새로 합성되는 폴리펩티드의 안정화에 관련된다. 이론과 결부시키고 싶지는 않지만, Hsp40은 언폴딩(발생중이거나 새로 전달된) 폴리펩티드의 소수성 패치에 결합하여 Hsp70-ATP 복합체와 폴리펩티드의 상호작용을 촉진한다. ATP 가수분해는 폴리펩티드, Hsp70 및 ADP 사이의 안정한 복합체의 형성과 Hsp40의 방출을 유도한다. Hsp70-ADP 복합체와 폴리펩티드의 소수성 패치의 회합은 다른 소수성 패치와의 상호작용을 방지하고, 이로써 부정확한 폴딩 및 다른 단백질과의 응집물 형성이 방지된다(Hartl, FU. 1996. Nature 381:571-579 참조).
다시, 이론과 결부시키고 싶지는 않지만, 재조합 단백질 발현 시스템에서 단백질 생산이 증가함에 따라서, 재조합 단백질 발현에 대한 군집화의 영향은 미스폴딩 폴리펩티드의 분해로 인한 재조합 단백질의 응집 및/또는 감소된 축적을 초래할 수 있다. 자생 샤프롱 단백질은 낮은 수준의 재조합 단백질에서는 정확한 폴딩을 촉진할 수 있지만, 발현 수준이 증가함에 따라, 자생 샤프롱은 제한 요인이 될 수 있다. 아그로-침윤된 잎에서 헤마글루티닌의 높은 수준의 발현은 시토졸에 헤마글루티닌 폴리펩티드의 축적을 유도할 수 있고, 하나 이상의 샤프롱 단백질, 예를 들어 Hsp70, Hsp40, 또는 Hsp70와 Hsp40 모두의 공-발현이 폴리펩티드를 발현하는 세포의 시토졸에서 안정성을 증가시킬 수 있으며, 이로써 미스폴딩 또는 응집된 헤마글루티닌 폴리펩티드의 수준이 감소하고, 안정한 헤마글루티닌으로서 축적되는 폴리펩티드의 수가 증가하여, 혈구응집 및/또는 바이러스-유사 입자의 형성을 허용하는 3차 및 4차 구조적 특징을 나타내게 된다.
따라서, 본 발명은 또한 식물에서 인플루엔자 VLP를 생산하는 방법을 제공하며, 여기서는 인플루엔자 HA를 암호화하는 제 1 핵산이 샤프롱을 암호화하는 제 2 핵산과 공-발현된다. 제 1 및 제 2 핵산은 같은 단계에서 식물에 도입될 수도 있고, 또는 순차적으로 식물에 도입될 수도 있다. 또한, 본 발명은 식물에서 인플루엔자 VLP를 생산하는 방법을 제공하며, 이 경우에는 식물이 제 1 핵산을 포함하고, 제 2 핵산은 순차적으로 도입된다.
또한, 본 발명은 하나 이상의 인플루엔자 헤마글루티닌을 암호화하는 핵산과 하나 이상의 샤프롱을 암호화하는 핵산을 포함하는 식물을 제공한다.
인플루엔자 헤마글루티닌의 발현 및/또는 분비 동안 N-말단 신호 펩티드(SP) 서열의 가공이 폴딩 과정에서 어떤 역할을 한다고 제안되었다. 일반적으로 용어 "신호 펩티드"는 새로 번역되는 폴리펩티드의 특정 소기관으로의 전위를 지시하거나, 또는 폴리펩티드의 특정 도메인의 배치를 보조할 수 있는 헤마글루티닌 폴리펩티드의 N-말단에서 일반적으로 발견되는 짧은 아미노산 서열(약 5-30개 아미노산)을 말한다. 헤마글루티닌의 신호 펩티드는 단백질의 세포질세망으로의 전위를 표적으로 하며, 발생중인 헤마글루티닌 폴리펩티드의 막-고정 도메인에 대하여 N-말단에 가까운 도메인의 배치를 보조함으로써 성숙한 헤마글루티닌의 절단 및 폴딩을 보조한다고 제안되었다. 성숙한 헤마글루티닌을 제공하기 위한 신호 펩티드의 제거(예를 들어, 신호 펩티다제에 의한)는 신호 펩티드의 정확한 절단 및 제거를 필요로 할 수 있다. 이런 정확한 절단은 신호 펩티드의 일부 또는 전부, 절단 부위 측면의 아미노산 서열, 신호 펩티드의 길이, 또는 이들의 조합을 포함하는 몇 가지 요인들 중 어느 것에 의존할 수 있으며, 이들 요인이 전부 어떤 주어진 서열에 적용되는 것은 아닐 수도 있다.
신호 펩티드는 발현될 헤마글루티닌에 자생할 수 있거나, 또는 재조합 헤마글루티닌은 제 2 인플루엔자 타입, 서브타입 또는 균주 유래의 헤마글루티닌과 균형을 이루어 제 1 인플루엔자 타입, 서브타입 또는 균주 유래의 신호 펩티드를 포함할 수 있다. 예를 들어, HA 서브타입 H1, H2, H3, H5, H6, H7, H9 또는 인플루엔자 타입 B의 자생 SP를 사용하여 식물 시스템에서 HA를 발현할 수 있다.
또한, 신호 펩티드는, 예를 들어 인플루엔자 이외의 다른 바이러스의 구조 단백질 또는 헤마글루티닌 유래의, 또는 식물, 동물 또는 박테리아 폴리펩티드 유래의 비-자생 신호 펩티드일 수도 있다. 전형적인 신호 펩티드의 예는 자주개자리 단백질 이황화물 이소머라제(PDISP)(Accession No. Z11499의 뉴클레오티드 32-103; SEQ ID NO: 34; 도 17; 아미노산 서열 MAKNVAIFGLLFSLLLLVPSQIFAEE)의 신호 펩티드이다.
또한, 본 발명은 자생, 또는 비-자생 신호 펩티드, 및 헤마글루티닌을 암호화하는 핵산을 포함하는 인플루엔자 헤마글루티닌을 제공한다.
인플루엔자 HA 단백질들은 분자량, 등전점, 크기, 글리칸 보체 등과 관련하여 일련의 유사성 및 차이를 나타낸다. 다양한 헤마글루티닌의 물리화학적 특성이 식물, 곤충 세포 또는 효모 시스템에서 발현된 HA들의 구별을 가능하게 하는데 유용할 수 있으며, 단일 시스템에서 1개를 초과하는 HA가 공-발현되는 경우에 특별히 사용될 수 있다. 이러한 물리화학적 특성의 예가 표 1에 제공된다.
또한, 본 발명은 H1, H5 또는 H7로부터의 HA를 각각 암호화하는 뉴클레오티드 서열 SEQ ID NO:28; SEQ ID NO:3; SEQ ID NO:11을 포함한다. 또한, 본 발명은 긴축 혼성화 조건에서 SEQ ID NO:28; SEQ ID NO:3; SEQ ID NO:11과 혼성화하는 뉴클레오티드 서열을 포함한다. 또한, 본 발명은 긴축 혼성화 조건에서 SEQ ID NO: 28; SEQ ID NO:3; SEQ ID NO:1의 보체와 혼성화하는 뉴클레오티드 서열을 포함한다. SEQ ID 또는 SEQ ID의 보체와 혼성화하는 이들 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하고, 상기 VLP는 피험체에게 투여되었을 때 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하고, 이 VLP를 사용하여 하나 이상의 인플루엔자 타입 또는 서브타입의 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. 피험체에게 투여되었을 때 VLP는 면역반응을 유도한다.
또한, 본 발명은 뉴클레오티드 서열 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47을 포함한다. 또한, 본 발명은 긴축 혼성화 조건에서 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO: 18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:33, SEQ ID NO: 35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO: 46, SEQ ID NO: 127 또는 SEQ ID NO:47과 혼성화하는 뉴클레오티드 서열을 포함한다. 또한, 본 발명은 긴축 혼성화 조건에서 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47의 보체와 혼성화하는 뉴클레오티드 서열을 포함한다. SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47, 또는 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47의 보체와 혼성화하는 이들 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하고, 상기 VLP는 피험체에 투여되었을 때 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하고, 이 VLP를 사용하여 하나 이상의 인플루엔자 타입 또는 서브타입의 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. VLP는 피험체에 투여되었을 때 면역반응을 유도한다.
어떤 구체예에서, 본 발명은 또한 인플루엔자 A의 H1, H2, H3, H5, H7 또는 H9 서브타입 유래의 HA, 또는 타입 B 인플루엔자 유래의 HA를 암호화하는 뉴클레오티드 서열 SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO: 38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47을 포함한다. 또한, 본 발명은 긴축 혼성화 조건에서 SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47과 혼성화하는 뉴클레오티드 서열을 포함한다. 또한, 본 발명은 긴축 혼성화 조건에서 SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47의 보체와 혼성화하는 뉴클레오티드 서열을 포함한다. SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47, 또는 SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47의 보체와 혼성화하는 이들 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하고, 상기 VLP는 피험체에 투여되었을 때 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하고, 이 VLP를 사용하여 하나 이상의 인플루엔자 타입 또는 서브타입의 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. VLP는 피험체에 투여되었을 때 면역반응을 유도한다.
긴축 혼성화 조건에서의 혼성화는 본 분야에 공지되어 있다(예를 들어, 본원에 참고자료로 포함되는 Current Protocols in Molecular Biology, Ausubel et al, eds. 1995 and supplements; Maniatis et al., Molecular Cloning(A Laboratory Manual), Cold Spring Harbor Laboratory, 1982; Sambrook and Russell, Molecular Cloning: A Laboratory Manual, 3rd edition 2001 참조). 한 이러한 긴축 혼성화 조건의 예는 65℃에서 4x SSC에서 약 16-20시간 혼성화한 후, 65℃에서 0.1x SSC에서 1시간 세척, 또는 65℃에서 0.1x SSC에서 각각 20분 또는 30분씩 2번 세척하는 것일 수 있다. 대안으로서, 전형적인 긴축 혼성화 조건은 42℃에서 50% 포름아미드, 4x SSC에서 하룻밤(16-20시간) 혼성화하고, 65℃에서 0.1x SSC에서 1시간, 또는 65℃에서 0.1x SSC에서 각각 20분 또는 30분씩 2번 세척하는 것, 또는 65℃에서 Church 수성 포스페이트 버퍼(7% SDS; 0.5M NaPO4 버퍼 pH 7.2; 10mM EDTA)에서 하룻밤(16-20시간) 혼성화하고, 50℃에서 0.1x SSC, 0.1% SDS에서 각각 20분 또는 30분씩 2번 세척하거나, 또는 65℃에서 2x SSC, 0.1% SDS에서 각각 20분 또는 30분씩 2번 세척하는 것일 수 있다.
추가하여, 본 발명은 H1(SEQ ID NO:28 또는 SEQ ID NO: 127), H5(SEQ ID NO:3) 또는 H7(SEQ ID NO:11)로부터의 HA를 암호화하는 뉴클레오티드 서열과 약 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% 또는 이 사이의 임의의 값의 서열 동일성 또는 서열 유사성을 갖는 것을 특징으로 하는 뉴클레오티드 서열을 포함하며, 상기 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하며, 상기 VLP는 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하고, 이 VLP를 사용하여 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. VLP는 피험체에게 투여되었을 때 면역반응을 유도한다.
추가하여, 본 발명은 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO: 26, SEQ ID NO:27, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO: 43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47의 뉴클레오티드 서열과 약 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% 또는 그 사이의 임의의 값의 서열 동일성 또는 서열 유사성을 갖는 것을 특징으로 하는 뉴클레오티드 서열을 포함하며, 상기 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하고, 상기 VLP는 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하고, 이 VLP를 사용하여 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. VLP는 피험체에 투여되었을 때 면역반응을 유도한다.
추가하여, 본 발명은 SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:127 또는 SEQ ID NO:47의 뉴클레오티드 서열과 약 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% 또는 그 사이의 임의의 값의 서열 동일성 또는 서열 유사성을 갖는 것을 특징으로 하는 뉴클레오티드 서열을 포함하며, 상기 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하고, 상기 VLP는 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하고, 이 VLP를 사용하여 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. VLP는 피험체에 투여되었을 때 면역반응을 유도한다.
유사하게, 본 발명은 다음의 서브타입 H1(SEQ ID NO:28 또는 SEQ ID NO:127에 의해서 암호화), H2(SEQ ID NO:12에 의해서 암호화), H3(SEQ ID NO:13에 의해서 암호화), H4(SEQ ID NO:14에 의해서 암호화), H5(SEQ ID NO:15에 의해서 암호화), H6(SEQ ID NO:16에 의해서 암호화), H7(SEQ ID NO:11에 의해서 암호화), H8(SEQ ID NO:17에 의해서 암호화), H9(SEQ ID NO:18에 의해서 암호화), H10(SEQ ID NO:19에 의해서 암호화), H11(SEQ ID NO:20에 의해서 암호화), H12(SEQ ID NO:21에 의해서 암호화), H13(SEQ ID NO:27에 의해서 암호화), H14(SEQ ID NO:23에 의해서 암호화), H15 (SEQ ID NO:24에 의해서 암호화), H16(SEQ ID NO:25에 의해서 암호화), 또는 인플루엔자 타입 B(SEQ ID NO:26에 의해서 암호화)(도 10a 내지 10o 참조)과 관련된 HA, 및 H1(SEQ ID NO:28 또는 SEQ ID NO:127), H2(SEQ ID NO:12), H3(SEQ ID NO:13), H4(SEQ ID NO:14), H5(SEQ ID NO:15), H6(SEQ ID NO:16), H7(SEQ ID NO:11), H8(SEQ ID NO:17), H9(SEQ ID NO:18), H10(SEQ ID NO:19), H11(SEQ ID NO:20), H12(SEQ ID NO:21), H13(SEQ ID NO:27), H14(SEQ ID NO:23), H15(SEQ ID NO:24), H16(SEQ ID NO:25)과 약 70 내지 100% 또는 그 사이의 임의의 값, 80 내지 100% 또는 그 사이의 임의의 값, 90 내지 100% 또는 그 사이의 임의의 값, 또는 95 내지 100% 또는 그 사이의 임의의 값의 서열 동일성을 갖는 것을 특징으로 하는 뉴클레오티드 서열을 포함하며, 이때 상기 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하고, 상기 VLP는 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하며, 이 VLP를 사용하여 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. VLP는 피험체에게 투여되었을 때 면역반응을 유도한다.
"면역반응"은 일반적으로 후천적 면역 시스템의 반응을 말한다. 후천적 면역 시스템은 일반적으로 체액성 반응 및 세포-매개 반응을 포함한다. 체액성 반응은 B 림프구 계통의 세포(B 세포)에서 생산되어 분비된 항체에 의해 매개되는 면역성의 양태이다. 분비된 항체는 침입한 세균(바이러스 또는 박테리아 같은)의 표면에 존재하는 항원과 결합하여 이들을 파괴하라는 신호를 보낸다. 체액성 면역성은 일반적으로 항체 생산 및 항체 생산을 수반하는 과정을 말할 때 사용될 뿐만 아니라, Th2 세포 활성화 및 사이토카인 생산, 기억 세포 생성, 포식작용의 옵소닌 촉진, 병원체 제거 등을 포함하는 항체의 이펙터 기능을 말할 때도 사용된다. 용어 "조정하다" 또는 "조정" 등은 일반적으로 사용되거나 알려진, 일부는 본원에 예시되기도 한 몇 가지 분석법 중에서 임의의 것으로 측정했을 때 특정한 반응 또는 변수가 증가하거나 또는 감소하는 것을 말한다.
세포-매개 반응은 항체가 수반되는 것이 아니라, 자연살상세포(NK), 대식세포, 항원-특이적 세포독성 T-림프구의 활성화, 및 항원에 대한 반응으로 다양한 사이토카인의 방출을 수반하는 면역반응이다. 세포-매개 면역성은 일반적으로 어떤 Th 세포 활성화, Tc 세포 활성화 및 T-세포 매개 반응을 말할 때 사용된다. 세포-매개 면역성은 바이러스 감염에 대한 반응에서 특히 중요하다.
예를 들어, 항원 특이적 CD8 양성 T 림프구의 유도는 ELISPOT 분석을 사용하여 측정될 수 있고, CD4 양성 T-림프구의 자극은 증식 분석을 사용하여 측정될 수 있다. 항-인플루엔자 항체 역가는 ELISA 분석을 사용하여 정량될 수 있고, 항원-특이적 또는 교차-반응성 항체의 이소타입은 항-이소타입 항체(예를 들어, 항-IgG, IgA, IgE 또는 IgM)을 사용하여 측정될 수 있다. 이러한 분석을 수행하기 위한 방법 및 기술은 본 분야에 잘 공지되어 있다.
또한, 혈구응집 억제(HI 또는 HAI) 분석을 사용하여 백신에 의해 유도된 항체의 효능을 증명할 수 있거나, 또는 백신 조성물은 재조합 HA에 의한 적혈구(RBC)의 응집을 억제할 수 있다. 혈청 샘플의 혈구응집 억제 항체 역가는 마이크로타이터 HAI에 의해 평가될 수 있다(Aymard et al., 1973). 몇 가지 종들 중에서 어느 것으로부터 적혈구가 사용될 수 있다 - 예를 들어, 말, 칠면조, 닭 등. 이 분석은 VLP의 표면에서 HA 삼량체의 회합에 대한 간접적인 정보를 제공하며, HA 상에 항원 부위가 적절히 제시되는지 확인된다.
또한, 교차-반응성 HAI 역가를 사용하여 백신 서브타입과 관련된 다른 바이러스 균주들에 대한 면역반응의 효능을 증명할 수 있다. 예를 들어, 제 1 균주의 백신 조성물(예를 들어, A/Indonesia 5/05의 VLP)로 면역화한 피험체의 혈청이 전 바이러스 또는 바이러스 입자의 제 2 균주(예를 들어, A/Vietnam/1194/2004)와 함께 HAI 분석에 사용될 수 있으며, HAI 역가가 결정된다.
또한, 사이토카인의 존재 또는 수준이 정량될 수 있다. 예를 들어, T-헬퍼 세포 반응(Th1/Th2)은 ELISA(예를 들어, BD Biosciences OptEIA 키트)를 사용하여 IFN-γ 및 IL-4 분비 세포를 측정하는 것에 의해서 특정될 것이다. 피험체로부터 획득한 말초혈액 단핵세포(PBMC) 또는 비장세포를 배양하여 상청액을 분석할 수 있다. 또한, 마커 특이적 형광물질 표지와 본 분야에 공지된 방법을 사용한 형광-활성화 세포 정렬(FACS)에 의해 T 림프구가 정량될 수 있다.
또한, 피험체에서의 면역반응을 특정하기 위해서 마이크로중화 분석이 수행될 수 있는데, 예를 들어 Rowe 등(1973)의 방법을 참조한다. 바이러스 중화 역가가 몇 가지 방식으로 획득될 수 있으며, 이것은 1) 세포의 크리스탈 바이올렛 고정/착색 후 세포용해 플라크의 나열(플라크 분석); 2) 배양물에서 세포 용해의 현미경 관찰; 3) NP 바이러스 단백질의 ELISA 및 분광광도기 검출(숙주 세포의 바이러스 감염과 상호관련)을 포함한다.
서열 동일성 또는 서열 유사성은 뉴클레오티드 서열 비교 프로그램을 사용하여 결정될 수 있으며, 예를 들어 DNASIS(제한되는 것은 아니지만, 예를 들어 파라미터로서 GAP 패널티 5, 상부 대각선의 수 5, 고정 GAP 패널티 10, k-tuple 2, 플로팅 갭 10, 및 창 크기 5를 사용한다)가 있다. 그러나, 비교를 위한 서열 정렬의 다른 방법들도 본 분야에 잘 공지되어 있으며, 예를 들어 Smith & Waterman 알고리즘(1981, Adv. Appl. Math. 2:482), Needleman & Wunsch 알고리즘(J. Mol. Biol. 48:443, 1970), Pearson & Lipman 알고리즘(1988, Proc. Nat'l. Acad. Sci. USA 85:2444), 및 이들 알고리즘의 컴퓨터 실행(예를 들어, GAP, BESTFIT, FASTA, 및 BLAST), 또는 수동 정렬 및 육안 검사가 있다.
용어 "헤마글루티닌 도메인"은 HA0 도메인, 또는 HA1과 HA2 도메인(또는 HA1 및 HA2 단편이라고도 한다)을 포함하는 펩티드를 말한다. HA0는 HA1 및 HA2 단편의 전구체이다. HA 단량체는 일반적으로 2개의 기능 도메인, 즉 스템 도메인과 구상 헤드, 또는 헤드 도메인으로 세분될 수 있다. 스템 도메인은 산성 pH에 노출되었을 때 겪을 수 있는 입체구조적 변화를 통해서 바이러스의 감염성 및 병원성에 관련된다. 스템 도메인은 4개의 서브도메인 또는 단편, 즉 융합 서브도메인 또는 펩티드(산성 pH 입체구조 상태에서 숙주 막과 융합되어 관련되는 아미노산의 소수성 스트레치), 스템 서브도메인(2 이상의 입체구조를 수용할 수 있음), 막통과 도메인 또는 서브도메인(TmD)(지질 판에 대한 HA의 친화성에 관련됨), 및 세포질 꼬리(세포질 꼬리 서브도메인)(Ctail)(HA의 분비에 관련됨)으로 더 세분될 수 있다. 구상 헤드는 2개의 서브도메인, 즉 RB 서브도메인과 퇴화된 에스테라제 도메인(E)으로 나눠진다. E 서브도메인은 부분적으로 또는 완전히 매장되어 있을 수 있고, 구상 헤드의 표면에는 노출되지 않으므로, HA에 대해 발생된 일부 항체는 RB 서브도메인과 결합한다.
용어 "바이러스-유사 입자"(VLP) 또는 "바이러스-유사 입자들" 또는 "VLPs"는 자체 회합하며 인플루엔자 HA 단백질과 같은 구조 단백질을 포함하는 구조를 말한다. 일반적으로 VLP는 감염시 생산되는 비리온과 형태적으로도 항원적으로도 유사하지만, 복제에 필요한 유전자 정보가 충분하지 않기 때문에 비감염성이다. 일부 예에서, VLP는 단일 단백질 종을 포함하거나, 또는 1개를 초과하는 단백질 종을 포함할 수 있다. 1개를 초과하는 단백질 종을 포함하는 VLP에 대해서, 단백질 종은 동일한 바이러스 종으로부터 유래할 수도 있고, 상이한 종, 속, 아과 또는 과의 바이러스(ICTV 명명법에 의해 지정된다)로부터 유래하는 단백질을 포함할 수도 있다. 다른 예에서, VLP를 포함하는 단백질 종들 중 하나 이상은 자연 발생 서열로부터 변형될 수 있다. VLP는 식물 및 곤충 숙주 세포를 포함하는 적합한 숙주 세포에서 생산될 수 있다. 숙주 세포로부터 추출하여 분리하고 적합한 조건에서 더 정제한 후, VLP는 무손상 구조로서 정제될 수 있다.
본 발명에 따라서 인플루엔자 유래 단백질로부터 생산된 VLP는 M1 단백질을 포함하지 않는다. M1 단백질은 VLP 제제의 오염물질인 RNA와 결합하는 것으로 알려져 있다(Wakefield and Brownlee, 1989). RNA의 존재는 VLP 제품에 대해 규제당국의 승인을 얻을 때 바람직하지 않으며, 따라서 RNA가 없는 VLP 제제가 유리할 수 있다.
본 발명의 VLP는 단백질을 시알릴화하는 능력을 결여한 것을 특징으로 하는, 예를 들어 시알리다제가 없는 숙주 세포, 예를 들어 식물 세포, 곤충 세포, 진균, 및 해면, 강장동물문, 환형동물문, 절지동물문, 연체동물문, 선형동물문, 트로켈민테스, 편충동물문, 모악동물문, 유촉수강, 클라미디아, 스피로헤타, 그람-양성 박테리아, 시아노박테리아, 고세균 등에서 생산될 수 있다. 예를 들어, 글리코포럼 (URL: glycofomm.gr.jp/science/word/evolution/ES-A03E.html) 또는 Gupta et al., 1999. Nucleic Acids Research 27:370-372; 또는 Toukach et al., 2007. Nucleic Acids Research 35: D280-D286; 또는 URL: glycostructures.jp(Nakahara et al., 2008. Nucleic Acids Research 36:D368-D371; 2007년 10월 11일 온라인 공개 doi: 10.1093/NAR/gkm833)를 참조한다. 본원에 설명된 대로 생산된 VLP는 전형적으로 뉴라미니다제(NA)를 포함하지 않는다. 그러나, HA와 NA를 포함하는 VLP가 바람직하다면 NA가 HA와 함께 공-발현될 수 있다.
본 발명의 어떤 양태에 따라서 식물에서 생산된 VLP는 식물-유래 지질과 복합체를 이룰 수 있다. VLP는 HA0, HA1 또는 HA2 펩티드를 포함할 수 있다. 식물-유래 지질은 지질 이중층의 형태일 수 있으며, VLP를 둘러싼 외피를 더 포함할 수 있다. 식물-유래 지질은 VLP가 생산되는 식물의 원형질막의 지질 성분을 포함할 수 있으며, 제한되는 것은 아니지만, 이들은 포스파티딜콜린(PC), 포스파티딜에탄올아민(PE), 글리코스핑고지질, 피토스테롤 또는 이들의 조합을 포함한다. 식물-유래 지질은 "식물 지질"이라고도 할 수 있다. 피토스테롤의 예는 본 분야에 공지되어 있으며, 예를 들어 스티그마스테롤, 시토스테롤, 24-메틸콜레스테롤 및 콜레스테롤을 포함한다 - 예를 들어, Mongrand et al., 2004 참조.
VLP는, 예를 들어 혈구응집 분석, 전자현미경, 또는 크기 배제 크로마토그래피에 의해서 구조와 크기에 대해 평가될 수 있다.
크기 배제 크로마토그래피에서는, 동결 분쇄한 식물 구성물질의 샘플을 추출 버퍼 중에서 균질화하고(Polytron), 원심분리에 의해 불용성 물질을 제거함으로써 식물 조직으로부터 총 가용성 단백질이 추출될 수 있다. 또한, PEG를 사용한 침전도 유리할 수 있다. 가용성 단백질을 정량하고 추출물을 Sephacryl™ 칼럼을 통과시킨다. 블루 덱스트란 2000이 캘리브레이션 표준물질로서 사용될 수 있다. 크로마토그래피 후 면역블롯에 의해 분획들을 더 분석하여 분획의 단백질 보체를 결정할 수 있다.
이론과 결부시키고 싶지는 않지만, 상이한 동물로부터의 RBC와 결합하는 HA의 능력은 시알산 α2,3 또는 α2,3에 대한 HA의 친화성, 및 RBC의 표면에 있는 이들 시알산의 존재에 의해 유도된다. 인플루엔자 바이러스로부터의 말 및 조류 HA는 칠면조, 닭, 오리, 기니아피그, 인간, 양, 말 및 소를 포함하는 몇몇 종들 전부에서 적혈구를 교착시키는 반면에, 인간 HA는 칠면조, 닭, 오리, 기니아피그, 인간 및 양의 적혈구와 결합할 것이다(Ito T. et al, 1997, Virology, vol 227, p493-499; 및 Medeiros R et al., 2001, Virology, vol. 289 p.74-85 참조). 상이한 인플루엔자 균주의 HA의 종 반응성의 예를 표 2A 및 2B에 나타낸다.
단백질, 융합 단백질 또는 폴리펩티드의 단편 또는 일부분은 특정한 단백질 또는 폴리펩티드의 아미노산 보체의 하위단위를 포함하는 펩티드 또는 폴리펩티드를 포함하며, 단 상기 단편은 발현되었을 때 VLP를 형성할 수 있어야 한다. 단편은, 예를 들어 항원성 영역, 스트레스-반응-유도 영역, 또는 단백질 또는 폴리펩티드의 기능 도메인을 포함하는 영역을 포함할 수 있다. 또한, 단편은 동일한 속에 속하는 일족의 단백질에 공통적인 영역 또는 도메인을 포함하거나, 또는 단편은 단편이 유래된 전장 단백질을 구체적으로 확인할 수 있는 충분한 아미노산 서열을 포함할 수 있다.
예를 들어, 단편 또는 일부분은 단백질의 전장 길이의 약 60% 내지 약 100%, 또는 그 사이의 임의의 값을 포함할 수 있으며, 단 상기 단편은 발현되었을 때 VLP를 형성할 수 있어야 한다. 예를 들어, 단편 또는 일부분은 단백질의 전장 길이의 약 60% 내지 약 100%, 약 70% 내지 약 100%, 약 80% 내지 약 100%, 약 90% 내지 약 100%, 약 95% 내지 약 100%, 또는 그 사이의 임의의 값을 포함할 수 있다. 대안으로서, 단편 또는 일부분은 HA에 따라서 약 150개 내지 약 500개 아미노산 또는 그 사이의 임의의 값일 수 있으며, 단 상기 단편은 발현되었을 때 VLP를 형성할 수 있어야 한다. 예를 들어, 단편은 HA에 따라서 약 150개 내지 약 500개 아미노산 또는 그 사이의 임의의 값, 약 200개 내지 약 500개 아미노산 또는 그 사이의 임의의 값, 약 250개 내지 약 500개 아미노산 또는 그 사이의 임의의 값, 약 300개 내지 약 500개 아미노산 또는 그 사이의 임의의 값, 약 350개 내지 약 500개 아미노산 또는 그 사이의 임의의 값, 약 400개 내지 약 500개 아미노산 또는 그 사이의 임의의 값, 약 450개 내지 약 500개 아미노산 또는 그 사이의 임의의 값일 수 있으며, 단 상기 단편은 발현되었을 때 VLP를 형성할 수 있어야 한다. 예를 들어, 약 5, 10, 20, 30, 40 또는 50개 아미노산, 또는 그 사이의 어떤 임의의 값이 HA 단백질의 C-말단, N-말단 또는 N-말단과 C-말단 양쪽으로부터 제거될 수 있으며, 단 상기 단편은 발현되었을 때 VLP를 형성할 수 있어야 한다.
어떤 주어진 서열에서 아미노산의 넘버링은 특정 서열에 따라 상대적이지만, 당업자는 구조 및/또는 순서에 기초하여 서열에 있는 특정 아미노산의 "등가성"을 쉽게 결정할 수 있다. 예를 들어, 결정학용 클론을 구성하면서 6개의 N-말단 아미노산을 제거한 경우, 이것은 아미노산의 구체적인 번호 동일성을 변경할 수는 있지만(예를 들어, 전장 단백질에 상대적으로), 구조 내에서 아미노산의 상대적 위치를 변경하지는 않을 것이다.
서열 또는 서열들의 비교는 BLAST 알고리즘(Altschul et al., 1990. J. Mol. Biol. 215:403-410)을 사용하여 수행할 수 있다. BLAST 탐색은 쿼리 서열과 특정 서열 또는 서열 그룹의 비교, 또는 쿼리 서열과 더 큰 서열 라이브러리 또는 데이터베이스(예를 들어, GenBank 또는 GenPept)의 비교를 허용하며, 100% 동일성을 나타내는 서열뿐만 아니라 동일성의 정도가 더 적은 서열들도 확인한다. BLAST 알고리즘을 사용하여 핵산 또는 아미노산 서열을 비교할 수 있다. 또한, 2 이상의 서열 간의 동일성은 서열들을 함께 정렬하고 서열 간의 동일성 %를 결정함으로써 결정될 수 있다. 정렬은 BLAST 알고리즘(예를 들어, GenBank를 통해 입수가능; URL: ncbi.nlm.nih.gov/cgi-bin/BLAST/ 디폴트 파라미터 사용: 프로그램: blastn; 데이터베이스: nr; 익스펙트 10; 필터: 디폴트; 얼라인먼트: 페어와이즈; 쿼리 유전자 코드: 표준(1)), 또는 BLAST2(EMBL를 통해 입수가능; URL: embl-heidelberg.de/ Services/index.html 디폴트 파라미터 사용: 매트릭스 BLOSUM62; 필터: 디폴트, 에코필터: on, 익스펙트: 10, 컷오프: 디폴트; 스트랜드: 양쪽; 디스크립션: 50, 얼라인먼트: 50); 또는 FASTA(디폴트 파라미터 사용)을 사용하여, 또는 서열을 수동 비교하고 동일성 %를 계산함으로써 수행될 수 있다.
제한되는 것은 아니지만, 본 발명은 식물 발현 벡터로의 HA를 암호화하는 핵산의 클로닝, 및 식물로부터 백신 생산에 적합한 인플루엔자 VLP의 생산을 설명한다. 이러한 핵산의 예는, 제한되는 것은 아니지만, 예를 들어 인플루엔자 A/New Caledonia/20/99(H1N1) 바이러스 HA(예를 들어, SEQ ID NO:61), A/California/04/ 09 유래의 HA(SEQ ID NO:127), A/Indonesia/5/05 서브타입(H5N1)(예를 들어, SEQ ID NO:60), A/Brisbane/59/2007(H1N1)(예를 들어, SEQ ID NO:36,48,62), A/Solomon Islands/3/2006(H1N1)(예를 들어, SEQ ID NO: 37,49,63), A/Singapore/1/57(H2N2) (예를 들어, SEQ ID NO:42,54,64), A/Anhui/1/2005(H5N1)(예를 들어, SEQ ID NO: 43,55,65), A/Vietnam/1194/2004(H5N1)(예를 들어, SEQ ID NO:44,56,66), A/Teal/ Hong Kong/W312/97(H6N1)(예를 들어, SEQ ID NO:45,57,67), A/Hong Kong/1073/99 (H9N2)(예를 들어, SEQ ID NO:47,59,68), A/Brisbane/10/2007(H3N2)(예를 들어, SEQ ID NO:38,50,69), A/Wisconsin/67/2005(H3N2)(예를 들어, SEQ ID NO:39, 51, 70), A/Equine/Prague/56(H7N7)(예를 들어, SEQ ID NO:46,58,71), B/Malaysia/2506 /2004(예를 들어, SEQ ID NO:40,52,72), B/Florida/4/2006(예를 들어, SEQ ID NO: 41,53,73)로부터의 HA를 포함한다. 이들 균주에 대한 상응하는 클론 또는 구성물 번호가 표 1에 제공된다. 도 28 내지 39에 예시된 대로, SEQ ID NO:36-47에 해당하는 핵산 서열은 플라스토시아닌 상류를 포함하며, 각 타입 또는 서브타입에 맞는 HA의 코딩 서열에 작동 가능하게 연결된다. 도 51 내지 64에 예시된 대로, SEQ ID NO:60-73에 해당하는 핵산 서열은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, HA의 헤마글루티닌 코딩 서열, 자주개자리 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트를 포함한다.
또한, VLP를 사용하여, 형질전환된 숙주 세포, 예를 들어 식물 세포 또는 곤충 세포에서 서브바이러스 인플루엔자 입자 및 인플루엔자 VLP를 포함하여, 기능성이며 면역원성인 동종타입 거대분자 단백질 구조로 자체 회합하는 재조합 인플루엔자 구조 단백질들로 이루어진 시약을 제조할 수 있다.
따라서, 본 발명은 단일 외피 단백질의 발현으로 인한, VLP, 및 식물 발현 시스템에서 바이러스 VLP를 생산하는 방법을 제공한다. VLP는 인플루엔자 VLP, 또는 제한되는 것은 아니지만, 홍역, 에볼라, 마르부르크 및 HIV를 포함하는 다른 원형질막-유래 바이러스로부터 생산된 VLP일 수 있다.
다른 외피보유 바이러스로부터의 단백질, 제한되는 것은 아니지만, 예를 들어 필로비리다에(예를 들어, 에볼라 바이러스, 마르부르크 바이러스 등), 파라믹소비리다에(예를 들어, 홍역 바이러스, 유행성 이하선염 바이러스, 호흡기 세포융합 바이러스, 뉴모바이러스 등), 레트로비리다에(예를 들어, 인간 면역결핍 바이러스-1, 인간 면역결핍 바이러스-2, 인간 T-세포 백혈병 바이러스-1 등), 플라비비리다에(예를 들어, 웨스트나일 뇌염, 댕기 바이러스, C형 간염 바이러스, 황열병 바이러스 등), 분야비리다에(예를 들어, 한타바이러스 등), 코로나비리다에(예를 들어, 코로나바이러스, SARS 등)로부터의 단백질들도 당업자에게 알려진 대로 사용될 수 있다. 원형질막 유래 바이러스에서 발현될 수 있는 항원의 비제한적 예는 HIV의 캡시드 단백질 - p24; HIV 당단백질 gp120 또는 gp41, 에볼라 바이러스의 VP30 또는 VP35 또는 마르부르크 바이러스의 Gp/SGP를 포함하는 필로바이러스 단백질 또는 홍역 파라믹소바이러스의 H 단백질 또는 F 단백질을 포함한다. 예를 들어, HIV의 P24(예를 들어, GenBank 레퍼런스 gi:19172948)는 HIV 바이러스 게놈(예를 들어, GenBank 레퍼런스 gi:9629357)의 gag 서열의 번역과 절단에 의해서 얻어진 단백질이고; HIV의 gp120 및 gp41은 HIV 바이러스 게놈의 env에 의해 암호화된 gp160 단백질(예를 들어, GenBank 레퍼런스 gi:9629363)의 번역과 절단에 의해서 얻어진 당단백질이다. 에볼라 바이러스의 VP30(GenPept 레퍼런스 gi:55770813)은 에볼라 바이러스 게놈(예를 들어, GenBank 레퍼런스 gi:55770807)의 vp30 서열의 번역에 의해서 얻어진 단백질이고, 에볼라 바이러스의 VP35(GenPept 레퍼런스 gi:55770809)는 에볼라 바이러스 게놈의 vp35 서열의 번역에 의해서 얻어진 단백질이다. 마르부르크 바이러스의 Gp/SGP(GenPept 레퍼런스 gi:296965)는 마르부르크 바이러스 게놈(GenBank 레퍼런스 gi:158539108)의 (서열)의 번역에 의해서 얻어진 단백질이다. H 단백질(GenPept 레퍼런스 gi:9626951)은 홍역 바이러스 게놈(GenBank 레퍼런스 gi:9626945)의 H 서열의 단백질이고, F 단백질(GenPept 레퍼런스 gi:9626950)은 홍역 바이러스 게놈의 F 서열의 단백질이다.
그러나, 당업자에게 알려진 대로 본 발명의 방법에서는 다른 외피보유 단백질도 사용될 수 있다.
따라서, 본 발명은 HIV-p24, HIV-gp120, HIV-gp41, 에볼라 바이러스-VP30, 에볼라 바이러스-VP35, 마르부르크 바이러스 Gp/SGP, 홍역 바이러스-H 단백질 또는 -F 단백질을 암호화하는 서열을 포함하는 핵산 분자를 제공한다. 이 핵산 분자는 곤충, 효모 또는 식물 세포, 또는 특히 식물 조직에서 활성인 조절 영역에 작동 가능하게 연결될 수 있다.
더욱이, 본 발명은 HA, 제한되는 것은 아니지만, 예를 들어 인간 인플루엔자 A/Indonesia/5/05 바이러스 HA(H5N1) 또는 인플루엔자 균주 A/California/04/09 유래의 HA를 암호화하는 핵산을 식물 또는 곤충 발현 벡터(예를 들어, 바쿨로바이러스 발현 벡터)에서 클로닝하는 것, 및 형질전환된 식물 세포 또는 형질전환된 곤충 세포에서, 서브바이러스 인플루엔자 입자 및 인플루엔자 VLP를 포함하여, 기능적이며 면역원성인 동종타입 거대분자 단백질 구조로 자체 회합하는 재조합 인플루엔자 구조 단백질들로 이루어진 인플루엔자 백신 후보 또는 시약을 생산하는 것을 제공한다.
인플루엔자 서브타입, 제한되지는 않지만, 예를 들어 A/New Caledonia/20/99 (H1N1), A/California/04/09(H1N1), A/Indonesia/5/05 서브타입(H5N1), A/Brisbane /59/2007(H1N1), A/Solomon Islands/3/2006(H1N1), A/Singapore/1/57(H2N2), A/ Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong/W312/97(H6N1), A/HongKong/1073/99(H9N2), A/Brisbane/10/2007(H3N2), A/Wisconsin/67/2005(H3 N2), A/Equine/Prague/56(H7N7), B/Malaysia/2506/2004, B/Florida/4/2006의 HA를 암호화하는 핵산이, 예를 들어 바쿨로바이러스 발현 시스템을 사용하여 적합한 셀라인에서, 예를 들어 Spodoptera frugiperda 세포(예를 들어, Sf-9 셀라인; ATCC PTA-4047)에서 발현될 수 있다. 또한, 다른 곤충 셀라인도 사용될 수 있다.
대안으로서, HA를 암호화하는 핵산은 식물 세포 또는 식물에서 발현될 수 있다. HA를 암호화하는 핵산은 HA RNA를 사용한 역전사와 폴리머라제 연쇄반응(PCR)에 의해 합성될 수 있다. 예로서, 인간 인플루엔자 A/New Caledonia/20/99(H1N1) 바이러스 또는 인간 인플루엔자 A/Indonesia/5/05(H5N1) 바이러스, 또는 다른 인플루엔자 바이러스, 예컨대 A/California/04/09(H1N1), A/Brisbane/59/2007(H1N1), A/Solomon Islands/3/2006(H1N1), A/Singapore/1/57(H2N2), A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong/W312/97(H6N1), A/Hong Kong/1073/99 (H9N2), A/Brisbane/10/2007(H3N2), A/Wisconsin/67/2005(H3N2), A/Equine/Prague/ 56(H7N7), B/Malaysia/2506/2004, B/Florida/4/2006로부터, 또는 인플루엔자 바이러스로 감염된 세포로부터 RNA가 분리될 수 있다. 역전사와 PCR에서 HA RNA, 제한되는 것은 아니지만, 예를 들어 인간 인플루엔자 A/New Caledonia/20/99(H1N1) 바이러스 HA 서열 또는 인간 인플루엔자 A/Indonesia/5/05 (H5N1) 바이러스 HA0 서열, 또는 인플루엔자 서브타입 A/California/04/09(H1N1), A/Brisbane/59/2007 (H1N1), A/Solomon Islands/3/2006(H1N1), A/Singapore/1/57(H2N2), A/Anhui/1/ 2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong/W312/97(H6N1), A/Hong Kong/1073/99(H9N2), A/Brisbane/10/2007(H3N2), A/Wisconsin/67/2005(H3N2), A/ Equine/Prague/56(H7N7), B/Malaysia/2506/2004, B/Florida/4/2006로부터의 HA 서열에 특이적인 올리고뉴클레오티드 프라이머가 사용될 수 있다. 추가하여, HA를 암호화하는 핵산은 당업자에게 알려진 방법을 사용하여 화학적으로 합성될 수 있다.
이들 유전자의 얻어진 cDNA 카피들은 숙주 발현 시스템에 필요하다면 적합한 발현 벡터에서 클로닝될 수 있다. 식물에서 적합한 발현 벡터의 예가 아래 설명되며, 대안으로서 바쿨로바이러스 발현 벡터, 예를 들어 pFastBacl(InVitrogen)를 사용하여 공지된 방법 및 제조자의 설명서에 제공된 정보에 따라서 pFastBacl-기반 플라스미드를 얻을 수 있다.
또한, 본 발명은 식물에서 작동가능한 조절 요소에 작동 가능하게 연결된 상기 설명된 HA를 암호화하는 핵산을 포함하는 유전자 구성물에 관한 것이다. 식물 세포에서 작동 가능하고 본 발명에 따라서 사용될 수 있는 조절 요소의 예는, 제한되는 것은 아니지만, 플라스토시아닌 조절 영역(US 7,125,978; 본원에 참고자료로 포함된다), 또는 리불로오스 1,5-비스포스페이트 카르복실라제/옥시게나제의 조절 영역(RuBisCO; US 4,962,028; 본원에 참고자료로 포함된다), 클로로필 a/b 결합 단백질(CAB; Leutwiler et al., 1986; 본원에 참고자료로 포함된다), ST-LS1(광계 II의 산소-방출 복합체와 결합된다, Stockhaus et al., 1987, 1989; 본원에 참고자료로 포함된다)를 포함한다. 플라스토시아닌 조절 영역의 예는 SEQ ID NO:36의 뉴클레오티드 10-85를 포함하는 서열, 또는 SEQ ID NO:37-47 중 어느 하나의 유사한 영역을 포함한다. 조절 요소 또는 조절 영역은 그것이 작동 가능하게 연결된 뉴클레오티드 서열의 번역을 증진시킬 수 있고, 뉴클레오티드 서열은 단백질 또는 폴리펩티드를 암호화할 수 있다. 조절 영역의 또 다른 예는 동부 모자이크병 바이러스 (CPMV)의 미번역 영역으로부터 유래된 것이며, 이것을 사용하여 작동 가능하게 연결된 뉴클레오티드 서열을 우선적으로 번역할 수 있다. 이 CPMV 조절 영역은 CMPV-HT 시스템을 포함한다. 예를 들어, Sainsbury et al, 2008, Plant Physiology 148:1212-1218를 참조한다.
만일 구성물이 곤충 세포에서 발현되는 경우, 곤충 세포에서 작동가능한 조절 요소의 예는, 제한되는 것은 아니지만, 폴리헤드린 프로모터(Possee and Howard 1987. Nucleic Acids Research 15:10233-10248), gp64 프로모터(Kogan et al., 1995. J. Virology 69:1452-1461) 등을 포함한다.
따라서, 본 발명의 한 양태는 조절 영역 및 인플루엔자 HA를 암호화하는 서열을 포함하는 핵산을 제공한다. 조절 영역은 플라스토시아닌 조절 요소일 수 있고, 인플루엔자 HA는 A/California/04/09(H1N1), A/New Caledonia/20/99(H1N1), A/Indonesia/5/05 서브타입(H5N1), A/Brisbane/59/2007(H1N1), A/Solomon Islands/ 3/2006(H1N1), A/Singapore/1/57(H2N2), A/Anhui/1/2005(H5N1), A/Vietnam/1194/ 2004(H5N1), A/Teal/Hong Kong/W312/97(H6N1), A/Brisbane/10/2007(H3N2), A/Wisconsin/67/2005(H3N2), A/Equine/Prague/56(H7N7), B/Malaysia/2506/2004, B/Florida/4/2006, A/Hong Kong/1073/99(H9N2)를 포함하는 인플루엔자 균주 또는 서브타입의 군으로부터 선택될 수 있다. 플라스토시아닌 조절 요소와 인플루엔자 HA를 포함하는 핵산 서열은 SEQ ID NO:36-47로 본원에 예시된다.
인플루엔자 바이러스가 난, 또는 포유류 세포(예를 들어, MDCK 세포)에서 배양되었을 때, 또는 감염된 피험체로부터 분리되었을 때, 인플루엔자 헤마글루티닌 아미노산 서열들, 또는 이들을 암호화하는 핵산들의 서열에는 서열 차이가 있을 수 있다는 것이 알려져 있다. 이러한 차이의 비제한적 예가 실시예 18을 포함하여 본원에 예시된다. 더욱이, 당업자가 이해하고 있는 대로, 새로운 균주로부터 얻어진 인플루엔자 헤마글루티닌에서는 추가 돌연변이가 계속해서 발생할 수 있기 때문에 추가의 변이도 관찰될 수 있다. 상이한 인플루엔자 헤마글루티닌들 간의 공지된 서열 변동성으로 인해, 본 발명은 본원에 설명된 대로 숙주에서 발현되었을 때 인플루엔자 헤마글루틴이 VLP를 형성하기만 한다면 어떤 인플루엔자 헤마글루틴을 사용해서도 제조될 수 있는 VLP를 포함한다.
서열 정렬 및 컨센서스 서열은 본 분야에 공지된 몇몇 소프트웨어 패키지 중 어느 것을 사용하여, 예를 들어 MULTALIN(F. CORPET, 1988, Nucl. Acids Res., 16 (22), 10881-10890)를 사용하여 결정될 수 있거나, 또는 서열들이 수동으로 정렬되고 서열들 간의 유사성 및 차이가 결정될 수 있다.
헤마글루티닌의 구조는 잘 연구되고 있으며, 그 구조는 매우 보존성인 것으로 알려져 있다. 헤마글루티닌 구조가 중첩된 경우, 높은 정도의 구조 보존이 관찰된다(rmsd <2A). 이 구조 보존은 일부 위치에서 아미노산 서열이 변경될 수 있을 때도 관찰된다(예를 들어, Skehel and Wiley, 2000 Ann. Rev. Biochem. 69:531-69; Vaccaro et al., 2005). 또한, 다음과 같이 헤마글루티닌의 영역들도 잘 보존된다.
● 구조 도메인: HA0 폴리단백질이 절단되어 성숙한 HA가 제공된다. HA는 동종삼량체이며, 각 단량체는 1개의 이황화 결합에 의해서 연결된 수용체 결합 도메인(HA1)과 막-고정 도메인(HA2)을 포함한다. 또한, HA2 서브유닛의 N-말단 20개 잔기는 HA 융합 도메인 또는 서열로서 언급될 수 있다. '꼬리' 영역(막 외피의 내부)도 존재한다. 각 헤마글루티닌은 이들 영역 또는 도메인을 포함한다. 개별 영역 또는 도메인은 전형적으로 길이가 보존된다.
● 모든 헤마글루티닌은 동일한 수의 분자간 및 분자내 이황화물 다리를 동일한 위치에 함유한다. 이황화물 다리 망구조에 참여하는 시스테인의 아미노산 서열에서의 양 및 위치는 HA들에서 보존된다. 특징적인 분자내 및 분자간 이황화물 다리 그리고 다른 보존된 아미노산 및 이들의 상대 위치를 예시하는 구조의 예가, 예를 들어 Gamblin 등(2004, Science 303:1838-1842)에 설명된다. 전형적인 구조 및 서열은 1RVZ, 1RVX, 1RVT, 1RV0, 1RUY, 1RU7을 포함하며, Protein Data Bank (Berman et al. 2003. Nature Structural Biology 10:980; URL: www.rcsb.org)로부터 입수가능하다.
● 세포질 꼬리 - 대부분의 헤마글루티닌은 보존된 위치에 3개의 시스테인을 포함한다. 이들 시스테인 중 하나 이상이 번역-후 변형으로서 팔미토일화될 수 있다.
인플루엔자 바이러스의 헤마글루티닌에서는 아미노산 변이가 허용된다. 이런 변이가 계속해서 확인되는 새로운 균주를 제공한다. 새로운 균주들의 감염성은 다양할 수 있다. 그러나, 헤마글루티닌 삼량체의 형성과 그에 이어지는 VLP의 형성은 유지된다. 따라서, 본 발명은 공지된 서열 및 발생할 수 있는 변이체 서열을 포함하며, 식물에서 VLP를 형성하는 헤마글루티닌 아미노산 서열, 또는 헤마글루티닌 아미노산 서열을 암호화하는 핵산을 제공한다.
도 65는 이러한 공지된 변이의 예를 예시한다. 이 도면은 다음 H1N1 균주의 HA에 대한 컨센서스 아미노산 서열(SEQ ID NO:74)을 도시한다: A/New Caledonia/20 /99(H1N1)(SEQ ID NO:33에 의해 암호화), A/Brisbane/59/2007(H1N)(SEQ ID NO:48), A/Solomon Islands/3/2006(H1N1)(SEQ ID NO:49) 및 SEQ ID NO:9. X1(위치 3)은 A 또는 V; X2(위치 52)는 D 또는 N; X3(위치 90)은 K 또는 R; X4(위치 99)는 K 또는 T; X5(위치 111)는 Y 또는 H; X6(위치 145)은 V 또는 T; X7(위치 154)은 E 또는 K; X8(위치 161)은 R 또는 K; X9(위치 181)는 V 또는 A; X1O(위치 203)은 D 또는 N; X11(위치 205)은 R 또는 K; X12(위치 210)는 T 또는 K; X13(위치 225)은 R 또는 K; X14(위치 268)는 W 또는 R; X15(위치 283)는 T 또는 N; X16(위치 290)은 E 또는 K; X17(위치 432)은 I 또는 L; X18(위치 489)은 N 또는 D이다.
이러한 변이의 또 다른 예로서, A/New Caledonia/20/99(H1N)(SEQ ID NO:33에 의해 암호화), A/Brisbane/59/2007(H1N1)(SEQ ID NO:48), A/Solomon Islands/3/ 2006(H1N1)(SEQ ID NO:49), A/ PuertoRico/8/34(H1N1) 및 SEQ ID NO:9의 HA에 대한 서열 정렬 및 컨센서스 서열이 아래 표 3에 제시된다.
컨센서스 서열에서 대문자는 지정된 위치에 있는 모든 서열에 공통된 아미노산을 나타내고, 소문자는 적어도 절반의 서열 또는 대부분의 서열에 공통된 아미노산을 나타낸다. 기호 !는 I 또는 V 중 어느 하나이고, 기호 $는 L 또는 M 중 어느 하나이고, 기호 %는 F 또는 Y 중 어느 하나이고, 기호 #는 N, D, Q, E, B 또는 Z 중 어느 하나이고, 기호 "."는 아미노산이 없는 것이다(예를 들어, 결실). 위치 3의 X는 A 또는 V 중 어느 하나이고, 위치 52의 X는 E 또는 N 중 어느 하나이고, 위치 90의 X는 K 또는 R이고, 위치 99의 X는 T 또는 K이고, 위치 111의 X는 Y 또는 H 중 어느 하나이고, 위치 145의 X는 V 또는 T 중 어느 하나이고, 위치 157의 X는 K 또는 E이고, 위치 162의 X는 R 또는 K이고, 위치 182의 X는 V 또는 A이고, 위치 203의 X는 N 또는 D이고, 위치 205의 X는 R 또는 K이고, 위치 210의 X는 T 또는 K이고, 위치 225의 X는 K 또는 Y이고, 위치 333의 X는 H 또는 결실이고, 위치 433의 X는 I 또는 L이고, 위치 49)의 X는 N 또는 D이다.
이러한 변이의 또 다른 예로서, A/Anhui/1/2005(H5N1)(SEQ ID NO:55), A/ Vietnam/1194/2004(H5N1) 및 A/Indonesia/5/2006(H5N1)(SEQ ID NO:10)의 HA에 대한 서열 정렬 및 컨센서스 서열이 아래 표 4에 제시된다.
컨센서스 서열에서 대문자는 지정된 위치에 있는 모든 서열에 공통된 아미노산을 나타내고, 소문자는 적어도 절반의 서열 또는 대부분의 서열에 공통된 아미노산을 나타낸다. 기호 !는 I 또는 V 중 어느 하나이고, 기호 $는 L 또는 M 중 어느 하나이고, 기호 %는 F 또는 Y 중 어느 하나이고, 기호 #는 N, D, Q, E, B 또는 Z 중 어느 하나이다. 위치 102의 X는 T, V 또는 A 중 어느 것이고, 위치 110의 X는 S, D 또는 N 중 어느 것이고, 위치 156의 X는 S, K 또는 T 중 어느 것이다.
상기 예시되고 설명된 정렬 및 컨센서스 서열은 식물에서 VLP의 생산을 위해 본 발명의 다양한 구체예에서 사용될 수 있는 헤마글루티닌 아미노산 서열에 존재하는 변이들의 비제한적 예들이다.
아미노산 서열을 암호화하는 핵산은 각 아미노산에 대한 코돈이 본 분야에 알려져 있으므로 쉽게 결정될 수 있다. 따라서, 아미노산 서열이 제공되면 그것을 암호화하는 축퇴 핵산 서열을 알 수 있다. 따라서, 본 발명은 본원에 개시된 인플루엔자 균주 및 서브타입(예를 들어, A/California/04/09(H1N1), A/New Caledonia /20/99(H1N1), A/Indonesia/5/2006(H5N1), A/chicken/New York/1995, A/herring gull/DE/677/88(H2N8), A/Texas/32/2003, A/mallard/MN/33/00, A/duck/Shanghai/1/ 2000, A/northem pintail/TX/828189/02, A/Turkey/Ontario/6118/68(H8N4), A/ shoveler/Iran/G54/03, A/chicken/Germany/N/1949(H10N7), A/duck/England/56(H11 N6), A/duck/Alberta/60/76(H12N5), A/Gull/Maryland/704/77(H13N6), A/Mallard/ Gurjev/263/82, A/duck/Australia/341/83(H15N8), A/black-headed gull/Sweden/5/ 99(H16N3), C/Johannesburg/66, B/Lee/40, A/PuertoRico/8/34(H1N1), A/Brisbane/ 59/2007(H1N1), A/Solomon Islands 3/2006(H1N1), A/Brisbane10/2007(H3N2), A/ Wisconsin/67/2005(H3N2), B/Malaysia/2506/2004, B/Florida/4/2006, A/Singapore /1/57(H2N2), A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong /W312/97(H6N1), A/Equine/Prague/56(H7N7), A/HongKong/1073/99(H9N2))의 헤마글루티닌을 암호화하는 핵산 서열과 상기 헤마글루티닌을 암호화하는 축퇴 서열을 제공한다.
핵산에 의해 암호화된 아미노산 서열도 각 아미노산에 대한 코돈 또는 코돈들이 알려져 있으므로 쉽게 결정될 수 있다. 따라서, 핵산이 제공되면 그것에 의해 암호화된 아미노산 서열을 알 수 있다. 따라서, 본 발명은 본원에 개시된 인플루엔자 균주 및 서브타입의 헤마글루티닌의 아미노산 서열을 제공한다(예를 들어, A/California/04/09(H1N1), A/New Caledonia/20/99(H1N1), A/Indonesia/5/2006(H5 N1), A/chicken/New York/1995, A/herring gull/DE/677/88(H2N8), A/Texas/32/ 2003, A/mallard/MN/33/00, A/duck/Shanghai/1/2000, A/northern pintail/TX/ 828189/02, A/Turkey/Ontario/6118/68(H8N4), A/shoveler/Iran/G54/03, A/chicken/ Germany/N/1949(H10N7), A/duck/England/56(H11N6), A/duck/Alberta/60/76(H12N5), A/Gull/Maryland/7O4/77(H13N6), A/Mallard/Gurjev/263/82, A/duck/Australia/341/ 83(H15N8), A/black-headed gull/Sweden/5/99(H16N3), B/Lee/40, C/Johannesburg /66, A/PuertoRico/8/34(H1N1), A/Brisbane/59/2007(H1N1), A/Solomon Islands 3/2006(H1N1), A/Brisbane 10/2007(H3N2), A/Wisconsin/67/2005(H3N2), B/Malaysia /2506/2004, B/Florida/4/2006, A/Singapore/1/57(H2N2), A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong/W312/97(H6N1), A/Equine/Prague/56 (H7N7), A/Hong Kong/1073/99(H9N2)).
식물에서 인플루엔자 VLP는 원형질막(실시예 5 및 도 19 참조)으로부터 발아하며, 따라서 VLP의 지질 조성은 그것의 기원을 반영한다. 본 발명에 따라서 생산된 VLP는 식물 유래 지질과 복합체를 이룬 하나 이상의 인플루엔자 타입 또는 서브타입의 HA를 포함한다. 식물 지질은 특정 면역세포를 자극하여 유도된 면역반응을 증진시킬 수 있다. 식물의 막은 지질, 포스파티딜콜린(PC) 및 포스파티딜에탄올아민(PE)로 이루어지며, 또한 글리코스핑고지질, 사포닌 및 피토스테롤을 함유한다. 추가로, 식물 원형질막에서는 지질 라프트가 또한 발견된다 - 이러한 미세 도메인은 스핑고지질 및 스테롤이 풍부하다. 식물에서는 여러 가지의 피토스테롤이 발생한다고 알려져 있으며, 이것은 스티그마스테롤, 시토스테롤, 24-메틸콜레스테롤 및 콜레스테롤을 포함한다(Mongrand et al., 2004).
PC 및 PE뿐만 아니라 글리코스핑고지질도 수지상세포 및 대식세포와 같은 항원-제시 세포(APC) 및 흉선과 간에 존재하는 B 및 T 림프구를 포함하는 다른 세포들과 마찬가지로 포유류 면역세포에 의해서 발현되는 CD1 분자와 결합할 수 있다 (Tsuji M., 2006). CD1 분자는 제I류에 속하는 주요 조직적합성 복합체(MHC) 분자와 구조적으로 유사하며, 이들의 역할은 NKT 세포(자연살상 T 세포)에 대한 당지질 항원을 제시하는 것이다. 활성화되면 NKT 세포는 NK 세포 및 수지상세포와 같은 선천적 면역세포를 활성화하며, 또 항체-생산 B 세포 및 T 세포 같은 후천적 면역세포도 활성화한다.
여러 가지 피토스테롤이 원형질막에서 발견될 수 있다 - 특정 보체는 몇 가지 요인으로 말하자면 종, 성장 조건, 영양물 기원 또는 병원성 상태에 따라서 다양할 수 있다. 일반적으로 베타-시토스테롤이 가장 풍부한 피토스테롤이다.
원형질막 유래 외피와 같은 지질 이중층과 복합체를 이룬 인플루엔자 VLP에 존재하는 피토스테롤은 유리한 백신 조성물을 제공할 수 있다. 이론과 결부시키고 싶지는 않지만, 원형질막 유래 외피와 같은 지질 이중층과 복합체를 이룬 식물-제조 VLP는 다른 발현 시스템에서 제조된 VLP보다 더 강한 면역반응을 유도할 수 있으며, 생 바이러스 백신 또는 감독된 전 바이러스 백신에 의해 유도되는 면역반응과 유사할 수 있다.
따라서, 어떤 구체예에서, 본 발명은 식물-유래 지질 이중층과 복합체를 이룬 VLP를 제공한다. 어떤 구체예에서, 식물-유래 지질 이중층은 VLP의 외피를 포함할 수 있다.
식물에서 생산된 VLP는 식물-특이적 N-글리칸을 포함하는 HA를 포함할 수 있다. 따라서, 본 발명은 또한 식물-특이적 N-글리칸을 갖는 HA를 포함하는 VLP를 제공한다.
더욱이, 식물에서의 N-글리칸의 변형이 공지되어 있으며(예를 들어, 본원에 참고자료로 포함되는 U.S. 60/944,344 참조), 변형된 N-글리칸을 갖는 HA도 생산될 수 있다. 글리코실화 패턴이 변형된, 예를 들어 푸코실화가 감소되거나, 자일로실화가 감소되거나, 또는 푸코실화와 자일로실화가 모두 감소된 N-글리칸을 포함하는 HA가 얻어지거나, 또는 단백질이 푸코실화, 자일로실화 또는 둘 다를 결여하고 증가된 갈락토실화를 포함하도록 글리코실화 패턴이 변형된 HA가 얻어질 수 있다. 더욱이, 번역-후 변형의 조정, 예를 들어 말단 갈락토오스의 부가에 의해 HA를 발현하는 야생형 식물과 비교하여 발현된 HA의 푸코실화 및 자일로실화가 감소할 수 있다.
제한되는 것은 아니지만, 예를 들어 글리코실화 패턴이 변형된 HA의 합성은 베타-1,4-갈락토실트랜스페라제(GalT), 제한되는 것은 아니지만, 예를 들어 포유류 GalT, 또는 인간 GalT를 암호화하는 뉴클레오티드 서열과 함께 관심의 단백질을 공-발현시킴으로써 달성될 수 있으며, 다른 출처로부터의 GalT도 사용될 수 있다. 또한, GalT의 촉매 도메인을 N-아세틸글루코사미닐트랜스페라제(GNT1)의 CTS 도메인(즉, 세포질 꼬리, 막통과 도메인, 줄기 영역)과 융합시켜 GNT1-GalT 하이브리드 효소를 생산할 수 있으며, 이 하이브리드 효소가 HA와 공-발현될 수 있다. 또한, HA는 N-아세틸글루코사미닐트랜스페라제 III(GnT-III), 제한되는 것은 아니지만, 예를 들어 포유류 GnT-III 또는 인간 GnT-III를 암호화하는 뉴클레오티드 서열과 함께 공-발현될 수 있으며, 다른 출처로부터의 GnT-III도 사용될 수 있다. 추가하여, GnT-III과 융합된 GNT1의 CTS를 포함하는 GNT1-GnT-III 하이브리드 효소가 또한 사용될 수 있다.
따라서, 본 발명은 또한 변형된 N-글리칸을 갖는 HA를 포함하는 VLP를 포함한다.
이론과 결부시키고 싶지는 않지만, HA 상에 식물 N-글리칸의 존재는 항원-제시 세포에 의한 HA의 결합을 촉진함으로써 면역반응을 자극할 수 있다. 식물 N-글리칸을 사용한 면역반응의 자극은 Saint-jore-Dupas 등(2007)에 의해 제안되었다. 더욱이, VLP의 입체형태가 항원의 제시에 유리할 수 있으며, 식물 유래 지질 층과 복합체를 이루었을 때 VLP의 애쥬번트 효과가 증진될 수 있다.
"조절 영역", "조절 요소" 또는 "프로모터"는 항상 그런 것은 아니지만 전형적으로 유전자의 단백질 코딩 영역의 상류에 있는 핵산의 일부분을 의미하며, 이것은 DNA 또는 RNA, 또는 DNA와 RNA로 이루질 수 있다. 조절 영역이 활성이고, 관심의 유전자와 작동 가능하게 결합되거나, 또는 작동 가능하게 연결된 경우, 이것은 관심의 유전자의 발현을 가져올 수 있다. 조절 요소는 기관 특이성을 매개하거나, 또는 발생적 또는 시간적 유전자 활성화를 제어할 수 있다. "조절 영역"은 프로모터 요소, 기본적 프로모터 활성을 나타내는 코어 프로모터 요소, 외부 자극에 대한 반응으로서 유도될 수 있는 요소, 음성 조절 요소와 같은 프로모터 활성을 매개하는 요소 또는 전사 인핸서를 포함한다. 또한, "조절 영역"은 본원에서 사용되었을 때 전사 후 활성인 요소, 예를 들어 번역 및 전사 인핸서, 번역 및 전사 리프레서, 상류 활성화 서열, 및 mRNA 불안정성 결정소와 같은 유전자 발현을 조정하는 조절 요소를 포함한다. 이러한 후자의 요소들 중 몇 개는 코딩 영역 근처에 위치될 수 있다.
본 명세서의 맥락에서, 전형적으로 용어 "조절 요소" 또는 "조절 영역"은 항상 그런 것은 아니지만 일반적으로 구조 유전자의 코딩 서열에 대해 상류(5')에 있는 DNA의 서열을 말하며, 이것은 RNA 폴리머라제 및/또는 특정 부위에서 전사가 시작되는데 필요한 다른 인자들에 대한 인식을 제공함으로써 코딩 영역의 발현을 제어한다. 그러나, 서열의 인트론 내에, 또는 서열의 3'에 위치한 다른 뉴클레오티드 서열도 관심의 코딩 영역의 발현의 조절에 기여할 수 있다. RNA 폴리머라제 또는 다른 전사 인자들에 대한 인식을 제공함으로써 특정 부위에서의 개시를 보장하는 조절 요소의 예는 프로모터 요소이다. 전부 그런 것은 아니지만 대부분의 진핵 프로모터 요소는 일반적으로 전사 시작 부위에서 대략 25개 염기쌍 상류에 위치한 아데노신과 티미딘 뉴클레오티드 염기쌍으로 이루어진 보존성 핵산 서열인 TATA 상자를 함유한다. 프로모터 요소는 전사의 개시를 책임진 기본적 프로모터 요소뿐만 아니라, 유전자 발현을 변형하는 다른 조절 요소들(상기 열거된)도 포함한다.
발생적으로 조절되는, 유도성 또는 구성성인 것들을 포함하여, 몇 가지 타입의 조절 영역이 있다. 발생적으로 조절되거나, 또는 조절 영역의 제어하에 유전자의 차등 발현을 제어하는 조절 영역은 해당 기관 또는 조직의 발생 도중의 특정 시기에 어떤 기관 또는 기관의 조직에서 활성화된다. 그러나, 발생적으로 조절되는 일부 조절 영역은 특정 발생 단계에서 어떤 기관 또는 조직에서 우선적으로 활성화될 수 있으며, 이들 역시 발생학적으로 조절되는 방식으로 활성화되거나, 또는 식물의 다른 기관 또는 조직에서도 기본적 수준으로는 활성화될 수 있다. 조직-특이적 조절 영역, 예를 들어 종자-특이적 조절 영역의 예는 나핀 프로모터, 및 크루시페린 프로모터를 포함한다(Rask et al., 1998, J. Plant Physiol. 152: 595-599; Bilodeau et al., 1994, Plant Cell 14: 125-130). 잎-특이적 프로모터의 예는 플라스토시아닌 프로모터를 포함한다(도 1b; US 7,125,978, 본원에 참고자료로 포함된다).
유도성 조절 영역은 유도제에 반응하여 하나 이상의 DNA 서열 또는 유전자의 전사를 직접 또는 간접적으로 활성화할 수 있는 것이다. 유도제가 없으면 DNA 서열 또는 유전자는 전사되지 않을 것이다. 전형적으로 유도성 조절 영역과 특이적으로 결합하여 전사를 활성화하는 단백질 인자는 비활성화 형태로 존재할 수 있으며, 이것이 이후 유도제에 의해 활성 형태로 직접 또는 간접적으로 전환된다. 그러나, 단백질 인자는 없을 수도 있다. 유도체는 단백질, 대사산물, 성장 조절제, 제초제 또는 페놀계 화합물과 같은 화학제제 또는 가열, 냉각, 염, 또는 독성 원소에 의해 직접적으로, 또는 바이러스와 같은 병원체 또는 질환 인자의 작용을 통해 간접적으로 부여되는 생리학적 스트레스일 수 있다. 유도성 조절 영역을 함유하는 식물 세포는 분무, 물주기, 가열 또는 유사한 방법에 의해 세포 또는 식물에 유도체를 외부적으로 적용함으로써 유도제에 노출될 수 있다. 유도성 조절 요소는 식물 또는 비-식물 유전자로부터 유래될 수 있다(예를 들어, 본원에 참고자료로 포함되는 Gatz, C. and Lenk, I.R.P., 1998, Trends Plant Sci. 3, 352-358 참조). 잠재적인 유도성 프로모터의 예는, 제한되는 것은 아니지만, 테트라시클린-유도성 프로모터(Gatz, C., 1997, Ann. Rev. Plant Physiol. Plant Mol. Biol. 48, 89-108; 본원에 참고자료로 포함된다), 스테로이드 유도성 프로모터(Aoyama, T. and Chua, N.H., 1997, Plant J. 2, 397-404; 본원에 참고자료로 포함된다) 및 에탄올-유도성 프로모터(Salter, M.G., et al, 1998, Plant Journal 16, 127-132; Caddick, M.X., et al, 1998, Nature Biotech. 16, 177-180, 본원에 참고자료로 포함된다), 사이토키닌 유도성 IB6 및 CKI1 유전자(Brandstatter, I. and Kieber, J.J., 1998, Plant Cell 10, 1009-1019; Kakimoto, T., 1996, Science 274, 982-985; 본원에 참고자료로 포함된다) 및 아우신 유도성 요소 DR5(Ulmasov, T., et al., 1997, Plant Cell 9, 1963-1971; 본원에 참고자료로 포함된다)를 포함한다.
구성성 조절 영역은 식물의 발생 도중에 계속해서 식물의 여러 부분을 아울러서 유전자의 발현을 지시한다. 공지된 구성성 조절 요소의 예는 CaMV 35S 전사체(Odell et al., 1985, Nature, 313:810-812), 쌀 액틴 1(Zhang et al., 1991, Plant Cell, 3:1155-1165), 액틴 2(An et al., 1996, Plant J., 10:107-121), 또는 tms 2(본원에 참고자료로 포함된 U.S. 5,428,147), 및 트리오스포스페이트 이소머라제 1(Xu et al., 1994, Plant Physiol. 106:459-467) 유전자, 옥수수 유비퀴틴 1 유전자(Cornejo et al., 1993, Plant Mol. Biol. 29:637-646), Arabidopsis 유비퀴틴 1 및 6 유전자(Holtorf et al., 1995, Plant Mol. Biol. 29:637-646), 및 담배 번역 개시 인자 4A 유전자(Mandel et al., 1995, Plant Mol. Biol. 29:995-1004)와 관련된 프로모터를 포함한다. 용어 "구성성"은 본원에서 사용되었을 때 구성성 조절 영역의 제어하에 유전자가 모든 세포 타입에서 동일한 수준으로 발현된다는 것을 반드시 의미하지는 않으며, 유전자는 광범한 세포 타입에서 발현되기는 하지만 대체로 변이도 풍부하게 관찰된다. 구성성 조절 요소는 이들이 작동 가능하게 연결되는 뉴클레오티드 서열의 전사 및/또는 번역을 더욱 증진시키기 위해서 다른 서열과 결합될 수 있다. 예를 들어, CMPV-HT 시스템(Sainsbury et al, 2008, Plant Physiology 148:1212-1218)이 동부 모자이크병 바이러스(COMV)의 미번역 영역으로부터 유래되며, 관련된 코딩 서열의 번역을 증진시켰다는 것이 증명되었다.
"자생"은 핵산 또는 아미노산 서열이 자연 발생, 또는 " 야생형"임을 의미한다.
"작동 가능하게 연결된"은 특정 서열, 예를 들어 조절 요소 및 관심의 코딩 영역이 직접 또는 간접적으로 상호작용하여 유전자 발현의 매개 또는 조정과 같은 의도된 기능을 수행한다는 것을 의미한다. 작동 가능하게 연결된 서열들의 상호작용은, 예를 들어 작동 가능하게 연결된 서열들과 상호작용하는 단백질에 의해 매개될 수 있다.
본 발명의 하나 이상의 뉴클레오티드 서열은 본 발명의 뉴클레오티드 서열, 또는 구성물, 또는 벡터에 의해 형질전환된 어떤 적합한 식물 숙주에서 발현될 수 있다. 적합한 숙주의 예는, 제한되는 것은 아니지만, 자주개자리, 캐놀라, 옥수수, Brassica 종, Nicotiana 종, 자주개자리, 감자, 인삼, 완두콩, 귀리, 쌀, 대두, 밀, 보리, 해바라기, 목화 등을 포함하는 농작물을 포함한다.
본 발명의 하나 이상의 키메라 유전자 구성물은 3' 미번역 영역을 더 포함할 수 있다. 3' 미번역 영역은 폴리아데닐화 신호 및 mRNA 프로세싱 또는 유전자 발현을 행할 수 있는 어떤 다른 조절 신호를 함유하는 DNA 세그먼트를 포함하는 유전자의 일부분을 말한다. 폴리아데닐화 신호는 일반적으로 mRNA 전구물질의 3' 단부에 폴리아데닐산 트랙의 부가를 행하는 것을 특징으로 한다. 폴리아데닐화 신호는 통상 정규 형태인 5'-AATAAA-3'에 대한 상동체의 존재에 의해 인식되며, 변이도 드물지는 않다. 또한, 본 발명의 키메라 유전자 구성물 중 하나 이상은 필요에 따라서 번역 인핸서든 전사 인핸서든 인핸서를 더 포함할 수 있다. 이러한 인핸서 영역은 당업자에게 잘 알려져 있으며, ATG 개시 코돈과 인접 서열을 포함할 수 있다. 개시 코돈은 코딩 서열의 리딩 프레임과 동일 위상이어야 하며, 그래야 전체 서열의 번역이 보장된다.
적합한 3' 영역의 비제한적 예는 아그로박테리움 종양 유도(Ti) 플라스미드 유전자, 예를 들어 노팔린 신타제(Nos 유전자) 및 식물 유전자, 예를 들어 대두 저장 단백질 유전자, 리불로오스-1,5-비스포스페이트 카르복실라제(ssRUBISCO; US 4,962,028; 본원에 참고자료로 포함된다) 유전자의 작은 서브유닛, 플라스토시아닌 발현을 조절하는데 사용되는 프로모터(Pwee and Gray 1993; 본원에 참고자료로 포함된다)의 폴리아데닐화 신호를 함유하는 3'-전사된 미번역 영역이다. 플라스토시아닌 프로모터의 예는 US 7,125,978(본원에 참고자료로 포함된다)에 설명된다.
본원에 설명된 대로, 잎 발현에서 효능이 증명된 인핸서 서열을 포함하는 프로모터가 일시 발현에 효과적인 것으로 판명되었다. 이론과 결부시키고 싶지는 않지만, 핵 바탕질에의 부착에 의한 광합성 유전자의 상류 조절 요소의 부착이 강한 발현을 매개할 수 있다. 예를 들어, 완두콩 플라스토시아닌 유전자의 번역 시작 부위로부터 -784까지를 사용하여 강한 리포터 유전자 발현을 매개할 수 있다.
형질전환된 식물 세포의 확인을 돕기 위해서 본 발명의 구성물은 식물 선택성 마커를 포함하도록 더 조작될 수 있다. 유용한 선택성 마커는 항생제, 예를 들어 젠타마이신, 히그로마이신, 카나마이신, 또는 제초제, 예를 들어 포스피노트리신, 글리포세이트, 클로로술푸론 등과 같은 화학물질에 대한 내성을 제공하는 효소를 포함한다. 유사하게, GUS(베타-글루쿠로니다제), 또는 루시페라제나 GFP 등의 발광물질과 같은 색 변화에 의해 확인가능한 화합물의 생산을 제공하는 효소가 사용될 수 있다.
또, 본 발명의 키메라 유전자 구성물을 함유하는 트랜스제닉 식물, 식물 세포 또는 종자가 본 발명의 일부로서 고려된다. 또한, 식물 세포로부터 전체 식물을 재생하는 방법도 본 분야에 공지되어 있다. 일반적으로 형질전환된 식물 세포를 항생제와 같은 선택제를 함유할 수 있는 적합한 배지에서 배양하며, 이 경우 선택성 마커를 사용하여 형질전환된 식물 세포의 확인을 용이하게 한다. 일단 유합조직이 형성되면, 공지된 방법에 따라서 적합한 식물 호르몬을 사용하여 신초 형성을 촉진한 다음, 신초를 식물 재생용 발근 배지로 옮긴다. 다음에, 이 식물을 사용하여 종자로부터나 아니면 식물 증식기술을 사용해서 반복하여 세대를 확립할 수 있다. 또한, 트랜스제닉 식물은 조직 배양을 사용하지 않고도 생성될 수 있다.
또한, 본 발명에 따라서, VLP 생산을 위한 재조합 HA0를 암호화하는 핵산을 포함하는 키메라 유전자 구성물을 함유하는 트랜스제닉 식물, 나무, 효모, 박테리아, 진균, 곤충 및 동물 세포가 본 발명의 일부분으로 고려된다.
또한, 본 발명의 조절 요소는 형질전환, 또는 일시 발현을 행할 수 있는 일련의 숙주 생물에서의 발현에 알맞은 관심의 코딩 영역과 조합될 수 있다. 이러한 생물은, 제한되는 것은 아니지만, 외떡잎식물과 쌍떡잎식물을 모두 포함하며, 제한되는 것은 아니지만, 예를 들어 옥수수, 곡식, 밀, 보리, 귀리, Nicotiana 종, Brassica 종, Arabidopsis, 대두, 콩, 완두콩, 자주개자리, 감자, 토마토, 및 인삼을 포함한다.
이들 유기물의 안정한 형질전환, 및 재생 방법은 본 분야에 정립되어 있으며 당업자에게 잘 알려져 있다. 형질전환되고 재생된 식물을 획득하는 방법은 본 발명에서 중요하지 않다.
"형질전환"은 유전형적으로, 표현형적으로 또는 양쪽 모두의 분명한 유전자 정보(뉴클레오티드 서열)의 안정한 종간 전달을 의미한다. 키메라 구성물로부터의 유전자 정보가 숙주로 종간 전달되는 것은 유전일 수 있고, 유전자 정보의 전달은 안정하다고 간주되며, 또는 전달은 일시적일 수 있고, 유전자 정보의 전달은 유전이 아니다.
용어 "식물 물질"은 식물로부터 유래된 어떤 재료를 의미한다. 식물 물질은 전체 식물, 조직, 세포, 또는 이들의 어떤 단편을 포함할 수 있다. 또한, 식물 물질은 세포내 식물 성분, 세포외 식물 성분, 식물의 액체 또는 고체 추출물 또는 이들의 조합을 포함할 수 있다. 또한, 식물 물질은 식물 잎, 줄기, 열매, 뿌리 또는 이들의 조합으로부터의 식물, 식물 세포, 조직, 액체 추출물 또는 이들의 조합을 포함할 수 있다. 식물 물질은 어떤 가공 단계를 거치지 않는 식물 또는 식물의 일부분을 포함할 수 있다. 식물의 일부가 식물 물질을 포함할 수 있다. 그러나, 식물 구성물질은 아래 정의된 최소한의 가공 단계, 또는 더 엄격한 가공을 거칠 수도 있다는 것이 또한 고려되며, 이것은 제한되는 것은 아니지만, 크로마토그래피, 전기영동 등을 포함하는 본 분야에 일반적으로 알려진 기술을 사용한 부분적 또는 실질적 단백질 정제를 포함한다.
용어 "최소 가공"은 식물 물질, 예를 들어 관심의 단백질을 포함하는 식물 또는 식물의 일부를 부분적으로 정제하여 식물 추출물, 균질물, 식물 균질물의 단편 등을 수득하는 것을 의미한다(즉, 최소한으로 가공). 부분적 정제는, 제한되는 것은 아니지만, 식물 세포의 구조를 파괴함으로써 가용성 식물 성분, 및 불용성 식물 성분을 포함하는 조성물을 만드는 것을 포함할 수 있으며, 불용성 식물 성분은, 제한되는 것은 아니지만, 예를 들어 원심분리, 여과 또는 이들의 조합에 의해 분리될 수 있다. 이와 관련하여, 잎이나 다른 조직의 세포외 공간 내에 분비된 단백질이 진공 또는 원심분리 추출을 사용하여 쉽게 획득될 수 있거나, 또는 롤러를 통해 통과시키거나 분쇄함으로써 가압하에 조직을 추출하여 세포외 공간 내로부터 자유 단백질을 압착하거나 유리시킬 수 있다. 또, 최소 가공은 가용성 단백질의 조 추출물의 제조를 수반할 수 있는데, 이들 제조에서 부수적인 식물 산물로부터의 오염은 무시할 만하다. 더욱이, 최소 가공은 잎으로부터 가용성 단백질을 수성 추출한 후 어떤 적합한 염으로 침전시키는 것을 포함할 수 있다. 다른 방법은 대규모 침출과 즙 추출을 포함할 수 있으며, 이 추출물은 직접 사용할 수 있다.
식물 구성물질 또는 조직 형태의 식물 물질은 피험체에게 경구 송달될 수 있다. 식물 물질은 다른 음식과 함께 식이보충제의 일부로서, 또는 캡슐화되어 투여될 수 있다. 또한, 식물 물질 또는 조직은 식감을 개선하거나 증가시키기 위해 농축되거나, 또는 필요에 따라 다른 재료, 성분 또는 제약학적 부형제와 함께 제공될 수 있다.
본 발명의 VLP가 투여될 수 있는 피험체나 표적 생물의 예는, 제한되는 것은 아니지만, 인간, 영장류, 새, 물새, 철새, 메추라기, 오리, 거위, 가금류, 닭, 돼지, 양, 말과, 말, 낙타, 개과, 개, 고양이과, 고양이, 호랑이, 표범, 사향고양이, 밍크, 흰가슴담비, 흰족제비, 애완동물, 가축, 토끼, 생쥐, 래트, 기니아피그 또는 다른 설치류, 바다표범, 고래 등을 포함한다. 이러한 표적 생물은 예시이며 본 발명의 적용 및 용도를 제한하는 것으로 간주되지 않는다.
관심의 단백질을 포함하거나, 또는 관심의 단백질을 포함하는 VLP를 발현하는 식물은 필요와 상황에 따라서 다양한 방식으로 피험체 또는 표적 생물에 투여될 수 있다. 예를 들어, 식물로부터 획득된 관심의 단백질은 사용하기 전에 조 형태, 부분 정제된 형태, 또는 정제된 형태로 추출될 수 있다. 단백질이 정제된다면, 그것은 식용이나 비식용 식물에서 생산될 수 있다. 또한, 단백질이 경구 투여될 경우, 식물 조직을 수거하여 피험체에게 직접 공급하거나, 또는 공급 전에 수거된 조직을 건조하거나, 또는 수거하지 않고 동물로 하여금 식물을 뜯어먹도록 할 수 있다. 또한, 수거된 식물 조직을 동물 사료의 식품보충제로서 제공하는 것이 본 발명의 범위로 고려된다. 거의 또는 전혀 더 가공하지 않고 식물 조직을 동물에 공급하는 경우, 투여되는 식물 조직은 식용인 것이 바람직하다.
전사-후 유전자 침묵화(PTGS)가 식물에서 트랜스젠의 발현을 제한하는데 관련될 수 있으며, 감자 바이러스 Y(HcPro)로부터 침묵화 억제인자를 공-발현시킴으로써 트랜스젠 mRNA의 특이적 변성을 상쇄할 수 있다(Brigneti et al., 1998). 다른 침묵화 억제인자들도 본 분야에 잘 공지되어 있고, 본원에 설명된 대로 사용될 수 있으며(Chiba et al., 2006, Virology 346:7-14; 본원에 참고자료로 포함된다), 제한되는 것은 아니지만, 예를 들어 TEV-p1/HC-Pro(담배식각 바이러스-p1/HC-Pro), BYV-p21, 토마토 덤불위축 바이러스 p19(TBSV p19), 토마토 축엽 바이러스 캡시드 단백질(TCV-CP), 오이 모자이크 바이러스 2b(CMV-2b), 감자 바이러스 X p25(PVX-p25), 감자 바이러스 M p11(PVM-p11), 감자 바이러스 S p11(PVS-p11), 블루베리 스코치 바이러스 p16(BScV-p16), 감귤 트리스테자 바이러스 p23(CTV-p23), 포도나무 잎말림-관련 바이러스-2 p24(GLRaV-2 p24), 포도나무 바이러스 A p10(GVA-p1O), 포도나무 바이러스 B p14(GVB-p14), 어수리 잠복 바이러스 p10(HLV-p1O), 또는 마늘 공통 잠복 바이러스 p16(GCLV-p16)을 포함한다. 따라서, 침묵화 억제인자, 제한되는 것은 아니지만, 예를 들어 HcPro, TEV-p1/HC-Pro, BYV-p21, TBSV p29, TCV-CP, CMV-2b, PVX-p25, PVM-p11, PVS-p11, BScV-p16, CTV-p23, GLRaV-2 p24, GBV-p14, HLV-p1O, GCLV-p16 또는 GVA-p1O이 관심의 단백질을 암호화하는 핵산 서열과 함께 공발현될 수 있으며, 이로써 식물에서 높은 수준의 단백질 생산이 보장된다.
더욱이, HA 서브타입의 조합을 포함하는 VLP가 생산될 수 있다. 예를 들어, VLP는 서브타입 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16, 타입 B 또는 이들의 조합으로부터 하나 이상의 HA를 포함할 수 있다. HA의 조합의 선택은 VLP로부터 제조된 백신의 의도된 용도에 의해 결정될 수 있다. 예를 들어, 새에 접종하기 위한 백신은 HA 서브타입의 어떤 조합이라도 포함할 수 있지만, 사람을 접종하는데 유용한 VLP는 서브타입 H1, H2, H3, H5, H6, H7, H9 또는 B 중 하나 이상의 서브타입을 포함할 수 있다. 그러나, VLP의 용도에 따라서 다른 HA 서브타입 조합도 제조될 수 있다. HA 서브타입의 조합을 포함하는 VLP를 생산하기 위해서 원하는 HA 서브타입이 동일한 세포, 예를 들어 식물 세포에서 공-발현될 수 있다.
더욱이, 본원에 설명된 대로 생산된 VLP는 뉴라미니다제(NA)를 포함하지 않는다. 그러나, HA와 NA를 포함하는 VLP가 바람직하다면 NA가 HA와 함께 공-발현될 수 있다.
따라서, 본 발명은 안정한 또는 일시적 발현 시스템과 함께 사용하기 적합한 키메라 구성물을 포함하는 적합한 벡터를 더 포함한다. 또한, 하나 이상의 구성물에는 유전자 정보가 제공될 수 있다. 예를 들어, 관심의 단백질을 암호화하는 뉴클레오티드 서열이 한 구성물에 도입될 수 있고, 관심의 단백질의 글리코실화를 변형하는 단백질을 암호화하는 제 2 뉴클레오티드 서열이 별도의 구성물을 사용하여 도입될 수 있다. 다음에, 이들 뉴클레오티드 서열이 식물에서 공-발현될 수 있다. 그러나, 관심의 단백질과 관심의 단백질의 글리코실화 프로파일을 변형하는 단백질을 둘 다 암호화하는 뉴클레오티드 서열을 포함하는 구성물도 사용될 수 있다. 이 경우, 뉴클레오티드 서열은 프로모터 또는 조절 영역에 작동 가능하게 연결된 관심의 단백질을 암호화하는 제 1 핵산 서열을 포함하는 제 1 서열, 및 프로모터 또는 조절 영역에 작동 가능하게 연결된 관심의 단백질의 글리코실화 프로파일을 변형하는 단백질을 암호화하는 제 2 핵산 서열을 포함하는 제 2 서열을 포함할 것이다.
"공-발현"은 2 이상의 뉴클레오티드 서열이 식물, 및 식물의 동일한 조직에서 대략 동시에 발현되는 것을 의미한다. 그러나, 뉴클레오티드 서열들이 정확히 동시에 발현될 필요는 없다. 오히려 2 이상의 뉴클레오티드 서열은 암호화된 산물들이 상호작용할 기회를 가질 수 있는 방식으로 발현된다. 예를 들어, 관심의 단백질이 발현되는 시기 전에 또는 도중에 관심의 단백질의 글리코실화를 변형하는 단백질을 발현시킴으로써 관심의 단백질의 글리코실화의 변형이 일어날 수 있다. 2 이상의 뉴클레오티드 서열은 일시 발현 시스템을 사용하여 공-발현될 수 있고, 이 경우 2 이상의 서열은 두 서열이 모두 발현되는 조건하에 대략 동시에 식물에 도입된다. 대안으로서, 뉴클레오티드 서열 중 하나, 예를 들어 관심의 단백질의 글리코실화 프로파일을 변형하는 단백질을 암호화하는 서열을 포함하는 플랫폼 식물이 관심의 단백질을 암호화하는 추가 서열과 함께 일시적으로 또는 안정한 방식으로 형질전환될 수 있다. 이 경우, 관심의 단백질의 글리코실화 프로파일을 변형하는 단백질을 암호화하는 서열은 원하는 발생 단계 동안 원하는 조직에서 발현될 수 있거나, 또는 그것의 발현은 유도성 프로모터를 사용하여 유도될 수 있고, 관심의 단백질을 암호화하는 추가 서열은 유사한 조건하에 동일한 조직에서 발현될 수 있으며, 이로써 뉴클레오티드 서열의 공-발현이 보장된다.
본 발명의 구성물은 Ti 플라스미드, Ri 플라스미드, 식물 바이러스 벡터, 직접 DNA 형질전환, 마이크로인젝션, 전기천공, 침윤 등을 사용하여 식물 세포에 도입될 수 있다. 이러한 기술에 관한 리뷰는, 예를 들어 Weissbach and Weissbach, Methods for Plant Molecular Biology, Academy Press, New York VIII, pp. 421-463(1988); Geierson and Corey, Plant Molecular Biology, 2d Ed. (1988); 및 Miki and Iyer, Fundamentals of Gene Transfer in Plants. In Plant Metabolism, 2d Ed. DT. Dennis, DH Turpin, DD Lefebrve, DB Layzell (eds), Addison Wesly, Langmans Ltd. London, pp. 561-579(1997)를 참조한다. 다른 방법은 직접 DNA 흡수, 리포솜의 사용, 원형질체를 사용하는 등의 전기천공, 마이크로인젝션, 마이크로프로젝타일 또는 휘스커, 및 진공 침윤을 포함한다. 예를 들어, Bilang, et al.(Gene 100: 247-250(1991), Scheid et al.(Mol. Gen. Genet. 228:104-112, 1991), Guerche et al.(Plant Science 52:111-116, 1987), Neuhause et al.(Theor. Appl Genet. 75:30 -36, 1987), Klein et al., Nature 327:70-73(1987); Howell et al.(Science 208: 1265, 1980), Horsch et al.(Science 227:1229-1231, 1985), DeBlock et al, Plant Physiology 91:694-701, 1989), Methods for Plant Molecular Biology(Weissbach and Weissbach, eds., Academic Press Inc., 1988), Methods in Plant Molecular Biology(Schuler and Zielinski, eds., Academic Press Inc., 1989), Liu and Lomonossoff(J. Virol Meth, 105:343-348, 2002), U.S. Pat. Nos. 4,945,050; 5,036,006; 5,100,792; 6,403,865; 5,625,136을 참조한다(모두 본원에 참고자료로 포함된다).
일시 발현 방법을 사용하여 본 발명의 구성물을 발현할 수 있다(본원에 참고자료로 포함되는 Liu and Lomonossoff, 2002, Journal of Virological Methods, 105:343-348 참조). 대안으로서, Kapila 등(1997, 본원에 참고자료로 포함된다)에 의해 설명된 진공-기반 일시 발현 방법이 사용될 수 있다. 이들 방법은, 제한되는 것은 아니지만, 예를 들어 아그로-접종 또는 아그로-침윤의 방법을 포함할 수 있으며, 다른 일시 방법도 상기 주지된 대로 사용될 수 있다. 아그로-접종 또는 아그로-침윤에서는 원하는 핵산을 포함하는 아그로박테리아의 혼합물을 조직, 예를 들어 잎, 식물의 기생부(줄기, 잎 및 꽃을 포함), 다른 식물 부분(줄기, 뿌리, 꽃), 또는 전체 식물의 세포간 공간에 도입한다. 표피의 교차 후 아그로박테리움이 세포를 감염시켜 세포로 t-DNA 카피를 전달한다. t-DNA가 에피솜 전사되고 mRNA 번역되어 감염된 세포에서 관심의 단백질이 생산되며, t-DNA의 핵 내부 통과는 일시적이다.
관심의 뉴클레오티드 서열이 식물에 간접 또는 직접적으로 독성인 산물을 암호화하는 경우, 본 발명의 방법을 사용해서 원하는 조직에서 또는 원하는 식물 발생 단계에서 관심의 뉴클레오티드 서열을 선택적으로 발현시킴으로써 이러한 독성을 식물 전체에서 감소시킬 수 있다. 이에 더하여, 일시 발현으로 인한 한정된 발현 기간은 식물에서 독성 산물이 생산될 때의 영향을 감소시킬 수 있다. 유도성 프로모터, 조직-특이적 프로모터 또는 세포-특이적 프로모터를 사용하여 관심의 서열을 선택적으로 직접 발현할 수 있다.
본 발명의 재조합 HA VLP는 기존 인플루엔자 백신과 함께 사용될 수 있으며, 이로써 백신을 보충하고, 백신을 더 효과적으로 만들고, 필요한 투여량을 줄일 수 있다. 당업자에게 알려진 대로, 백신은 하나 이상의 인플루엔자 바이러스에 대해 작용할 수 있다. 적합한 백신의 예는, 제한되는 것은 아니지만, Sanofi-Pasteur, ID Biomedical, Merial, Sinovac, Chiron, Roche, Medlmmune, GlaxoSmithKline, Novartis, Sanofi-Aventis, Serono, Shire Pharmaceuticals 등으로부터 상업적으로 입수가능한 것들을 포함한다.
원한다면, 본 발명의 VLP는 당업자에게 알려진 적합한 애쥬번트와 함께 혼합될 수 있다. 더욱이, VLP는 상기 정의된 표적 생물의 치료를 위한 VLP의 유효 용량을 포함하는 백신 조성물에 사용될 수 있다. 더욱이, 본 발명에 따라서 생산된 VLP는 상이한 인플루엔자 단백질, 예를 들어 뉴라미니다제(NA)를 사용하여 얻어진 VLP와 조합될 수 있다.
따라서, 본 발명은 하나 이상의 VLP를 포함하는 백신의 유효 용량을 투여하는 것을 포함하는 동물 또는 표적 생물에서 인플루엔자 바이러스 감염에 대한 면역성을 유도하는 방법을 제공한다. 백신은 경구, 피내, 비내, 근육내, 복강내, 정맥내, 또는 피하 경로로 투여될 수 있다.
본 발명에 따라서 생산된 VLP의 투여는 실시예 6에 설명된다. 식물-제조 H5 VLP 투여는 가용성 HA의 투여와 비교하여 상당히 더 높은 반응을 가져왔다(도 21a 및 21b 참조).
도 26a 및 26b에 도시된 대로, A/Indonesia/5/05 H5 VLP를 투여한 피험체에는 인플루엔자 A/Turkey/582/06(H5N1; "Turkey H5N1")로의 시험감염에 대해 교차-방어가 제공된다. 시험감염 전에 Indonesia H5 VLP의 투여는 어떤 체중 손실도 가져오지 않았다. 그러나, H5 VLP를 투여하지 않은 피험체에서는 Turkey H5N1로 시험감염시키자 상당한 체중 손실을 나타냈고 몇몇 피험체는 죽었다.
따라서, 이들 데이터는 H5 헤마글루티닌 바이러스 단백질을 포함하는 식물-제조 인플루엔자 VLP가 병원성 인플루엔자 균주에 특이적인 면역반응을 유도하며, 바이러스-유사 입자는 식물 원형질막으로부터 발아할 수 있다는 것을 증명한다.
따라서, 본 발명은 인플루엔자 바이러스 HA 단백질, 하나 이상의 식물 지질, 및 제약학적으로 허용되는 담체를 포함하는 VLP의 유효 용량을 포함하는 조성물을 제공한다. 인플루엔자 바이러스 HA 단백질은 H5 Indonesia/5/2006, A/Brisbane/50 /2007, A/Sololmon Islands 3/2006, A/Brisbane/10/2007, A/Wisconsin/67/2005, B/Malaysia/2506/2005, B/Florida/4/2006, A/Singapore/1/57, A/Anhui/1/2005, A/Vietnam/1194/2004, A/Teal/HongKong/W312/97, A/Equine/Prague/56, A/California/04/09(H1N1) 또는 A/Hong Kong/1073/99일 수 있다. 또한, 피험체에서 인플루엔자 바이러스 감염에 대한 면역성을 유도하는 방법이 제공된다. 상기 방법은 인플루엔자 바이러스 HA 단백질, 하나 이상의 식물 지질 및 제약학적으로 허용되는 담체를 포함하는 바이러스-유사 입자의 투여를 포함한다. 바이러스-유사 입자는 경구, 피내, 비내, 근육내, 복강내, 정맥내, 또는 피하 경로에 의해 피험체에게 투여될 수 있다.
본 발명의 다양한 구체예에 따른 조성물은 2 이상의 인플루엔자 균주 또는 서브타입의 VLP를 포함할 수 있다. "2 이상"은 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 균주 또는 서브타입을 말한다. 제시된 균주 또는 서브타입들은 단일 서브타입(예를 들어, 모두 H1N1 또는 모두 H5N1)이거나, 또는 서브타입의 조합일 수 있다. 예시적인 서브타입 및 균주는, 제한되는 것은 아니지만 본원에 개시된 것들을 포함한다(예를 들어, A/New Caledonia/20/99(H1N1), A/Indonesia/5/2006(H5N1), A/chicken/New York/1995, A/herring gull/DE/677/88(H2N8), A/Texas/32/2003, A/ mallard/MN/33/00, A/duck/Shanghai/1/2000, A/northern pintail/TX/828189/02, A/ Turkey/Ontario/6118/68(H8N4), A/shoveler/Iran/G54/03, A/chicken/Germany/N/ 1949(H10N7), A/duck/England/56(H11N6), A/duck/Alberta/60/76(H12N5), A/Gull/ Maryland/704/77(H13N6), A/Mallard/Gurjev/263/82, A/duck/Australia/341/83(H15N 8), A/black-headed gull/Sweden/5/99(H16N3), B/Lee/40, C/Johannesburg/66, A/ PuertoRico/8/34(H1N1), A/Brisbane/59/2007(H1N1), A/Solomon Islands 3/2006(H1N 1), A/Brisbane10/2007(H3N2), A/Wisconsin/67/2005(H3N2), B/Malaysia/2506/2004, B/Florida/4/2006, A/Singapore/1/57(H2N2), A/Anhui/1/2005(H5N1), A/Vietnam/ 1194/2004(H5N1), A/Teal/Hong Kong/W312/97(H6N1), A/Equine/Prague/56(H7N7), A/California/04/09(H1N1) 또는 A/Hong Kong/1073/99(H9N2)).
균주 및 서브타입의 조합의 선택은 인플루엔자에 노출될 가능성이 있는 피험체의 지리적 위치, 면역화될 인간 집단에 가까이 있는 동물 종들(예를 들어, 물새, 돼지 등의 농사 동물) 및 노출되었거나 노출될 가능성이 있는 이들이 지닌 균주, 서브타입 또는 균주 내에서 항원 표류의 소인, 또는 이들 요인들의 조합에 의존할 수 있다. 과거에 사용된 조합의 예를 이용할 수 있다(URL: who.int/csr/dieease/ influenza/vaccine recommendations 1/en 참조). 백신 조성물의 제조에서 이들 균주의 일부 또는 전부를 나타낸 조합으로, 또는 다른 조합으로 사용할 수 있다.
더 구체적으로, 예시적인 조합은 A/California/04/09(H1N1), A/Brisbane/59/ 2007(H1N1), A/Brisbane/59/2007(H1N1)-유사 바이러스, A/Brisbane/10/2007(H3N2), A/Brisbane/10/2007(H3N2)-유사 바이러스, B/Florida/4/2006 또는 B/Florida/4/ 2006-유사 바이러스를 포함하는 군에서 선택된 2 이상의 균주 또는 서브타입으로부터의 VLP를 포함할 수 있다.
다른 예시적인 조합은 A/Indonesia/5/2005, A/Indonesia/5/2005-유사 바이러스, A/Vietnam/1194/2004, A/Vietnam/1194/2004-유사 바이러스, A/Anhui/1/05, A/ Anhui/1/05-유사 바이러스, A/goose/Guiyang/337/2006, A/goose/Guiyang/337/2006-유사 바이러스, A/chicken/Shanxi/2/2006, 또는 A/chicken/Shanxi/2/2006-유사 바이러스, A/California/04/09(H1N1) 또는 A/California/04/09(H1N1)-유사 바이러스를 포함하는 군에서 선택된 2 이상의 균주 또는 서브타입으로부터의 VLP를 포함할 수 있다.
다른 예시적인 조합은 A/Chicken/Italy/13474/99(H7 타입) 또는 A/Chicken/ British Columbia/04(H7N3) 인플루엔자 균주의 VLP를 포함할 수 있다.
다른 예시적인 조합은 A/Chicken/HongKong/G9/97 또는 A/HongKong/1073/99의 VLP를 포함할 수 있다. 다른 예시적인 조합은 A/Solomon Islands/3/2006의 VLP를 포함할 수 있다. 다른 예시적인 조합은 A/Brisbane/10/2007의 VLP를 포함할 수 있다. 다른 예시적인 조합은 A/Wisconsin/67/2005의 VLP를 포함할 수 있다. 다른 예시적인 조합은 B/Malaysia/2506/2004, B/Florida/4/2006 또는 B/Brisbane/3/2007 균주 또는 서브타입의 VLP를 포함할 수 있다.
2 이상의 VLP는 개별적으로 발현된 다음, 정제 또는 반-정제된 VLP가 조합될 수 있다. 대안으로서, VLP는 동일한 숙주, 예를 들어 식물에서 공-발현될 수 있다. VLP는 원하는 비율로, 예를 들어 대략 등가의 비율로 조합되거나 생산될 수도 있고, 또는 한 서브타입 또는 균주가 조성물의 VLP의 대부분을 이루는 방식으로 조합될 수도 있다.
따라서, 본 발명은 2 이상의 균주 또는 서브타입의 VLP를 포함하는 조성물을 제공한다.
외피보유 바이러스의 VLP는 일반적으로 이들이 발아한 막으로부터 이들의 외피를 획득한다. 식물 원형질막은 면역자극 효과를 가질 수 있는 피토스테롤 보체를 가진다. 이 가능성을 조사하기 위해 식물-제조 H5 VLP를 애쥬번트의 존재 또는 부재하에 동물에 투여하고 HAI(혈구응집 억제 항체반응)을 측정했다(도 22a, 22b). 애쥬번트를 첨가하지 않은 경우, 식물-제조 H5 VLP는 상당한 HAI를 나타내는데, 이것은 항원의 투여에 대한 전신적 면역반응의 징표이다. 더욱이, 애쥬번트의 존재 또는 부재하에 투여된 VLP의 항체 이소타입 프로파일은 유사하다(도 23a).
표 5는 본 발명의 다양한 구체예에서 제공된 서열들의 리스트이다.
이제 본 발명을 다음의 비제한적 예를 참조하여 상세히 설명한다.
방법 및 재료
1. 자생
HA
를 위한
플라스토시아닌
-기반 발현 카세트의 조립
모든 조작은 Sambrook and Russell(2001; 본원에 참고자료로 포함된다)의 일반 분자생물학 프로토콜에 따라서 수행하였다. 첫 번째 클로닝 단계는 자주개자리 플라스토시아닌 유전자의 상류 및 하류 조절 요소를 함유하는 수용체 플라스미드를 조립하는 것이었다. 플라스토시아닌 프로모터와 5' UTR 서열을 올리고뉴클레오티드 프라이머 XmaI-pPlas.c(SEQ ID NO: 29; 도 10q)와 SacI-ATG-pPlas.r(SEQ ID NO: 30; 도 10r)을 사용하여 자주개자리 게놈 DNA로부터 증폭시켰다. 얻어진 증폭 산물을 XmaI와 ScaI로 절단하고, 동일한 효소로 미리 절단해 둔 pCAMBIA2300(Cambia, 호주 캔버라)에 라이게이션하여 pCAMBIApromoPlasto를 만들었다. 유사하게, 플라스토시아닌 유전자의 3' UTR 서열과 터미네이터를 프라이머 SacI-PlasTer.c(SEQ ID NO: 31; 도 10s)와 EcoRI-PlasTer.r(SEQ ID NO: 32; 도 10t)을 사용하여 자주개자리 게놈 DNA로부터 증폭시키고, 산물을 ScaI와 EcoRI로 절단한 다음, pCAMBIApromo Plasto의 동일 부위에 삽입하여 pCAMBIAPlasto를 만들었다.
인플루엔자 균주 A/Indonesia/5/05(H5N1; Ace. No. LANL ISDN125873) 유래의 헤마글루티닌을 암호화하는 단편을 Epoch Biolabs(Sugar Land, TX, USA)에 의해 합성했다. 생산된 단편은 초기 ATG의 바로 상류에 HindIII 부위가 측면 위치되고 중단(TAA) 코돈의 바로 하류에 SacI 부위가 위치된 자생 신호 펩티드를 포함하는 완전한 H5 코딩 영역을 함유하며, 이것을 SEQ ID NO:3(도 6)에 도시한다. H5 코딩 영역을 Darveau 등(1995)에 제시된 PCR-기반 라이게이션 방법에 의해 플라스토시아닌-기반 발현 카세트에서 클로닝했다. 간단히 말해서, 1차 PCR 증폭에서는 프라이머로서 Plato-443c(SEQ ID NO:4; 도 7a)와 SpHA(Ind)-Plasto.r(SEQ ID NO:5; 도 7b), 주형으로서 pCAMBIApromoPlasto를 사용했다. 병행하여, 2차 증폭은 프라이머로서 Plasto-SpHA(Ind).c(SEQ ID NO:6; 도 7c)와 HA(Ind)-Sac.r(SEQ ID NO:7; 도 7d), 주형으로서 H5 코딩 단편을 사용하여 수행했다. 두 반응으로부터 얻어진 증폭 산물을 혼합하고, 혼합물을 3차 반응(조립 반응)의 주형으로서 사용했으며, 이때 프라이머는 Plato-443c(SEQ ID NO:4; 도 7a)와 HA(Ind)-Sac.r(SEQ ID NO:7; 도 7d)를 사용했다. 얻어진 단편을 BamHI(플라스토시아닌 프로모터 내)와 SacI(단편의 3' 단부)로 절단하고, 동일한 효소로 미리 절단해 둔 pCAMBIAPlasto에서 클로닝했다. 얻어진 플라스미드를 660으로 명명하며, 도 2b에 도시한다(도 11도 참조).
헤마글루티닌 발현 카세트 번호 774-785가 다음과 같이 조립되었다. 플라스토시아닌 ATG의 상류의 처음 84개 뉴클레오티드에 상응하고 DraIII 제한 부위에서 끝나는 자주개자리 플라스토시아닌 유전자 서열이 3' 측면에 위치된 완전한 헤마글루티닌 코딩 서열(ATG에서 중단 코돈까지)을 포함하는 합성 단편을 합성했다. 이 합성 단편은 또한 중단 코돈 바로 뒤에 SacI 부위를 포함했다.
합성 헤마글루티닌 단편들은 Top Gene 기술(Montreal, QC, 캐나다) 및 Epoch Biolabs(Sugar Land, TX, USA)에 의해 합성되었다. 합성된 단편을 도 28-39에 나타내며, 이들은 SEQ ID NO:36 내지 SEQ ID NO:47에 해당한다. 완전한 발현 카세트의 조립을 위하여, 합성 단편을 DraIII와 SacI로 절단하고, 동일한 효소로 미리 절단해 둔 pCAMBIAPlasto에서 클로닝했다. 표 6에 상응하는 HA와 본문의 다른 참조내용들에 따라서 생성된 카세트들을 나타낸다.
플라스토시아닌
-기반
PDISP
/
HA
-융합 발현 카세트의 조립
H1
A/
New
Caledonia
/20/99 (구성물 번호 540)
인플루엔자 균주 A/New Caledonia/20/99(H1N1)의 H1 유전자 유래의 오픈 리딩 프레임을 2개의 단편으로 합성하였다(Plant Biotechnology Institute, National Research Council, Saskatoon, Canada). 합성된 제 1 단편은 5' 단부에서 신호 펩티드 코딩 서열과 3' 단부에서 막통과 도메인 코딩 서열을 결여한 야생형 H1 코딩 서열(GenBank ace. No. AY289929; SEQ ID NO:33; 도 16)에 상응한다. 이 단편의 코딩 서열의 5' 단부에 BglII 제한 부위를 부가하고, 3' 말단 단부에는 중단 코돈의 바로 하류에 이중 SacI/StuI 부위를 부가하여 SEQ ID NO:1(도 5a)를 얻었다. 또, SacI 및 StuI 제한 부위가 3' 단부 측면에 위치된, KpnI 부위에서 중단 코돈까지 H1 단백질(막통과 도메인 및 세포질 꼬리를 포함함)의 C-말단 단부를 암호화하는 제 2 단편을 합성했다(SEQ ID NO:2; 도 5b).
제 1 H1 단편을 BalII 및 SacI로 절단하고, 자주개자리 단백질 이황화물 이소머라제(PDI) 유전자의 신호 펩티드(뉴클레오티드 32-103; Accession No. Z11499; SEQ ID NO:34; 도 17)에 융합된 플라스토시아닌 프로모터 및 5' UTR을 함유하는 바이너리 벡터(pCAMBIAPlasto)의 동일한 부위에서 클로닝하여, 플라스토시아닌 조절 요소의 하류에서 PDI-H1 키메라 유전자를 만들었다. PDI 신호 펩티드를 함유하는 플라스토시아닌-기반 카세트의 서열을 도 1에 나타낸다(SEQ ID NO:8). 얻어진 플라스미드는 PDI 신호 펩티드와 융합되고 플라스토시아닌 조절 요소가 측면에 위치된 H1 코딩 영역을 함유했다. KpnI 및 SacI로 미리 절단해 둔 합성된 단편(SEQ ID NO:2; 도 5b)을 H1 발현 플라스미드에 삽입함으로써 C-말단 단부 코딩 영역(막통과 도메인 및 세포질 꼬리를 암호화)을 부가했다. 얻어진 플라스미드를 540으로 명명하며, 도 11에 나타낸다(도 2a도 참조).
H5
A/
Indonesia
/5/2005 (구성물 번호 663)
자주개자리 단백질 이황화물 이소머라제의 신호 펩티드(PDISP)(뉴클레오티드 32-103; Accession No. Z11499; SEQ ID NO:34; 도 17)를 A/Indonesia/5/2005 유래의 H5의 HA0 코딩 서열에 다음과 같이 연결했다. H5 코딩 서열을 주형으로서 구성물 번호 660(SEQ ID NO:60; 도 51)을 사용하고, 프라이머 SpPDI-HA(Ind).c(SEQ ID NO:82) 및 HA(Ind)-SacI.r(SEQ ID NO:7; 도 7d)를 사용하여 증폭시켰다. 얻어진 단편은 5' 측면에 PDISP를 암호화하는 마지막 뉴클레오티드(BalII 제한 부위 포함)가 위치되고, 3' 측면에 SacI 제한 부위가 위치된 H5 코딩 서열을 포함했다. 이 단편을 BalII 및 SacI로 절단하고, 동일한 제한 효소로 미리 절단해 둔 구성물 번호 540(SEQ ID NO:61; 도 52)에서 클로닝했다. 최종 카세트를 구성물 번호 663 (SEQ ID NO:83)으로 명명하며, 도 69에 나타낸다.
H1
A/
Brisbane
/59/2007 (구성물 787)
자주개자리 단백질 이황화물 이소머라제의 신호 펩티드(PDISP)(뉴클레오티드 32-103; Accession No. Z11499; SEQ ID NO:34; 도 17)를 A/Brisbane/59/2007 유래의 H1의 HA0 코딩 서열에 다음과 같이 연결했다. H1 코딩 서열을 주형으로서 구성물 774(SEQ ID NO:62; 도 53)을 사용하고, 프라이머 SpPDI-H1B.c(SEQ ID NO:84) 및 SacI-H1B.r(SEQ ID NO:85)를 사용하여 증폭시켰다. 얻어진 단편은 5' 측면에 PDISP를 암호화하는 마지막 뉴클레오티드(BalII 제한 부위 포함)가 위치되고, 3' 측면에 SacI 제한 부위가 위치된 H1 코딩 서열을 포함했다. 이 단편을 BalII 및 SacI로 절단하고, 동일한 제한 효소로 미리 절단해 둔 구성물 번호 540(SEQ ID NO:61; 도 52)에서 클로닝했다. 최종 카세트를 구성물 번호 787(SEQ ID NO:86)로 명명하며, 도 70에 나타낸다.
H3
A/
Brisbane
/10/2007 (구성물 번호 790)
자주개자리 단백질 이황화물 이소머라제의 신호 펩티드(PDISP)(뉴클레오티드 32-103; Accession No. Z11499; SEQ ID NO:34; 도 17)를 A/Brisbane/10/2007 유래의 H3의 HA0 코딩 서열에 다음과 같이 연결했다. PDISP는 Darveau 등(Methods in Neuroscience 26:77-85(1995))에 제시된 PCR-기반 라이게이션 방법에 의해 H3 코딩 서열에 연결되었다. 1차 PCR 라운드에서, PDISP에 융합된 플라스토시아닌 프로모터의 세그먼트를 주형으로서 구성물 540(SEQ ID NO:61; 도 52)을 사용하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 H3B-SpPDI.r(SEQ ID NO:87)을 사용하여 증폭시켰다. 병행하여, H3 A/Brisbane/10/2007의 코딩 서열의 일부분을 함유하는 또 다른 단편(코돈 17에서 SpeI 제한 부위까지)을 주형으로서 구성물 776(SEQ ID NO: 69; 도 60)을 사용하고, 프라이머 SpPDI-H3B.c(SEQ ID NO:88) 및 H3(A-Bri).982r (SEQ ID NO:89)를 사용하여 증폭시켰다. 다음에, 증폭 산물을 혼합하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 H3(A-Bri).982r(SEQ ID NO:89)와 함께 2차 증폭 라운드(조립 반응)의 주형으로서 사용했다. 얻어진 단편을 BamHI(플라스토시아닌 프로모터 내) 및 SpeI(H3 코딩 서열 내)로 절단하고, 동일한 제한 효소로 미리 절단해 둔 구성물 번호 776(SEQ ID NO:69; 도 60)에서 클로닝하여, 구성물 번호 790(SEQ ID NO:90)을 얻었다. 이 구성물을 도 71에 나타낸다.
HA
B/
Florida
/4/2006 (구성물 번호 798)
자주개자리 단백질 이황화물 이소머라제의 신호 펩티드(PDISP)(뉴클레오티드 32-103; Accession No. Z11499; SEQ ID NO:34; 도 17)를 HA B/Florida/4/2006 유래의 HA의 HA0 코딩 서열에 Darveau 등(Methods in Neuroscience 26:77-85(1995))에 제시된 PCR-기반 라이게이션 방법에 의해 연결했다. 1차 증폭 라운드에서, PDISP에 융합된 플라스토시아닌 프로모터의 일부분을 주형으로서 구성물 540(SEQ ID NO: 61; 도 52)을 사용하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 HBF-Sp PDI.r(SEQ ID NO:91)을 사용하여 증폭시켰다. 병행하여, 플라스토시아닌 터미네이터에 융합된 HB B/Flo의 코딩 서열의 일부분을 함유하는 또 다른 단편을 주형으로서 구성물 779(SEQ ID NO:73; 도 64)을 사용하고, SpPDI-HBF.c(SEQ ID NO:92) 및 Plaster80r(SEQ ID NO:93)을 사용하여 증폭시켰다. 다음에, PCR 산물을 혼합하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 Plaster80r(SEQ ID NO:93)과 함께 2차 증폭 라운드(조립 반응)의 주형으로서 사용했다. 얻어진 단편을 BamHI(플라스토시아닌 프로모터 내) 및 AflII(HA B/Florida/4/2006 코딩 서열 내)로 절단하고, 동일한 제한 효소로 미리 절단해 둔 구성물 번호 779(SEQ ID NO:73; 도 64)에서 클로닝하여, 구성물 번호 798(SEQ ID NO:94)을 얻었다. 얻어진 발현 카세트를 도 72에 나타낸다.
CPMV
-
HT
-기반 발현 카세트의 조립
CPMV-HT 발현 카세트는 위치 115와 161에 돌연변이 ATG가 있는 동부 모자이크병 바이러스(CPMV) RNA2의 뉴클레오티드 1-512가 5' 측면에 위치되고, CPMV RNA2의 뉴클레오티드 3330-3481(3' UTR에 해당)과 그 뒤로 NOS 터미네이터가 3' 측면에 위치된 관심의 코딩 서열을 포함하는 mRNA의 발현을 제어하기 위해 35S 프로모터를 사용한다. CPMV-HT-기반 헤마글루티닌 발현 카세트의 조립에는 플라스미드 pBD-C5-1LC(Sainsbury et al. 2008; Plant Biotechnology Journal 6:82-92 및 PCT 공보 WO 2007/135480)를 사용했다. CPMV RNA2의 위치 115와 161에서 ATG의 돌연변이는 Darveau 등(Methods in Neuroscience 26:77-85 (1995))에 제시된 PCR-기반 라이게이션 방법을 이용하여 수행했다. 2회의 별도의 PCR을 주형으로서 pBD-C5-1LC를 사용하여 수행했다. 1차 증폭의 프라이머는 pBinPlus.2613c(SEQ ID NO:77) 및 Mut-ATG115.r(SEQ ID NO:78)이다. 2차 증폭의 프라이머는 Mut-ATG161.c(SEQ ID NO:79) 및 LC-C5-1.110r(SEQ ID NO:80)이다. 다음에, 얻어진 2개의 단편을 혼합하고, 프라이머로서 pBinPlus.2613c(SEQ ID NO:77) 및 LC-C5-1.110r(SEQ ID NO:80)를 사용하는 3차 증폭의 주형으로서 사용한다. 얻어진 단편을 PacI 및 ApaI로 절단하고, 동일한 효소로 절단된 pBD-C5-1LC에서 클로닝했다. 생성된 발현 카세트의 서열을 828로 명명하며, 도 68(SEQ ID NO:81)에 나타낸다.
CPMV - HT 발현 카세트에서 SpPDI - H1 A/ New Caledonia /20/99의 조립 (구성물 번호 580)
H1 A/New Caledonia/20/99 유래의 HA0에 융합된 자주개자리 PDI 신호 펩티드를 암호화하는 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-Sp PDI.c(SEQ ID NO:95) 및 StuI-H1(A-NC).r(SEQ ID NO:96)을 사용하고, 구성물 번호 540(SEQ ID NO:61; 도 52)를 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 580(SEQ ID NO:97)으로 명명했다.
2
X35S
/
CPMV
-
HT
발현 카세트(구성물 # 560)로부터
SpPDI
-
H1
A/
California
/ 4/2009의 조립
H1 A/California/4/2009로부터의 HA0에 융합된 자주개자리 PDI 신호 펩티드를 암호화하는 단편을 다음과 같이 2X35S-CPMV-HT에서 클로닝했다.
이전에 사용된 35S 프로모터 대신 CPMV-HT 발현 카세트에 2X35S 프로모터를 함유하는 중간 벡터를 먼저 만들었다. 프로모터의 변경은 Darveau 등(Methods in Neuroscience 26:77-85(1995))에서 제시된 PCR-기반 리게이션 방법을 사용하여 수행했다. 2X35S 프로모터 SEQ ID NO: 129(도 93)을 함유하는 제 1 단편을 주형으로서 2X35S 프로모터를 함유하는 플라스미드와 아래 프라이머를 사용하여 증폭했다:
PacI-MCS-2X35S.c(SEQ ID NO: 130):
AATTGTTAATTAA GTCGACAAGCTTGCATGCCTGCAGGTCAAC
및 CPMV 5'UTR-2 X35S.r(SEQ ID NO: 131):
TCAAAACCTATTAAGATTTTAATA CCTCTCCAAATGAAATGAACTTCC
병행하여, 제 2 PCR을 주형으로서 구성물 685(SEQ ID NO: 100; 도 74)와 아래 프라이머를 사용하여 수행했다:
2 X35S -CPMV 5'UTR.c(SEQ ID NO: 132):
TTGGAGAGG TATTAAAATCTTAATAGGTTTTGATAAAAGCGAACGTGGG
및 ApaI -M prot.r(SEQ ID NO: 133):
TCTCCAT GGGCCC GACAAATTTGGGCAGAATATACAGAAGCTTA
다음에, 얻어진 두 단편을 혼합하고, 이것을 프라이머 PacI-MCS-2X35S.c(SEQ ID NO:130)와 ApaI-M prot.r(SEQ ID NO: 133)를 사용하는 2차 라운드 PCR(조립 반응)의 주형으로서 사용했다. 다음에, 결과의 단편을 PacI와 ApaI로 절단하고, 동일한 제한 효소로 절단된 구성물 685(SEQ ID NO: 100; 도 74)에서 클로닝했다. 972(SEQ ID NO: 134)로 명명된 중간 벡터의 서열을 도 94에 나타낸다.
GISAID 데이터베이스로부터 자생 H1 A/California/4/2009 서열을 얻었고(수탁 번호 EPI176470), 이것을 도 95(SEQ ID NO: 135)에 나타낸다. 자주개자리 단백질 이황화물 이소머라제(PDISP)(뉴클레오티드 32-103; 수탁 번호 Z21499; SEQ ID NO: 34; 도 17)과 함께 DraIII에서 ApaI 제한 부위까지의 CPMV M 단백질(CPMV-HT 발현 카세트에서)의 일부와 돌연변이 ScaI와 StuI 제한 부위를 가진 A/California /4/2009 헤마글루티닌의 HA0를 포함하는 뉴클레오티드 서열을 도 96(SEQ ID NO: 136)에 나타낸다. 이 서열은 3개의 상이한 단편에서 DNA2.0(Menlo Park, CA, USA)에 의해 합성되었다. 단편 1(SEQ ID NO: 137; 도 97), 2(SEQ ID NO: 138; 도 97) 및 3(SEQ ID NO: 139; 도 97)을 Darveau 등(Methods in Neuroscience 26:77-85(1995))에 제시된 PCR-기반 리게이션 방법을 사용하여 조립했다. 1차 증폭 라운드에서는 주형으로서 단편 1을 함유하는 pJ201 벡터(DNA2.0 독점 벡터)(SEQ ID NO: 139)와 아래 프라이머를 사용하여 증폭했다:
DraIII -MProt#2.c(SEQ ID NO: 140)
ATGCTAATAT CACGTAGTG CGGCGCCATTAAATAACGTGTACTTGTCC
및 H1 Cal.390r(SEQ ID NO: 141)
GCTTAATTGCTCTCTTAGCTCCTCATAATCGATGAAATCTCC
제 2 단편은 주형으로서 단편 2를 함유하는 pJ201 벡터(DNA2.0 독점 벡터 (SEQ ID NO:138)와 아래 프라이머를 사용하여 증폭했다:
H1 Cal.310c(SEQ ID NO: 142)
TGGAAACACCTAGTTCAGACAATGGAACGTGTTACCCAGGAG
및 H1 Cal.1159r(SEQ ID NO: 143)
CTGCATATCCTGACCCCTGCTCATTTTGATGGTGATAACCGT
마지막으로 마지막 단편을 주형으로서 단편 3을 함유하는 pJ201 벡터(DNA2.0 독점 벡터)(SEQ ID NO: 139)와 아래 프라이머를 사용하여 증폭했다:
H1 Cal.1081c(SEQ ID NO: 144)
TTGAAGGGGGGTGGACAGGGATGGTAGATGGATGGTACGGTT
및 StuI -H1 Cal.r(SEQ ID NO: 145)
TATT AGGCCT TTAAATACATATTCTACACTGTAGAGACCCATTAG
2차 PCR 라운드(조립 반응)에서 3개의 증폭 단편을 혼합하고, 이것을 프라이머 DraIII-MProt#2.c(SEQ ID NO: 140) 및 StuI-H1 Cal.r(SEQ ID NO: 145)와 함께 주형으로서 사용했다. 결과의 단편을 DraIII와 StuI로 절단하고, 동일한 제한 효소로 절단된 구성물 972(SEQ ID NO: 134)에 삽입했다. 결과의 구성물의 뉴클레오티드 서열을 560(SEQ ID NO: 146; 도 98)으로 명명했다.
CPMV
-
HT
발현 카세트에서
H5
A/
Indonesia
/5/2005의 조립 (구성물 번호 685)
A/Indonesia/5/2005 유래의 H5의 코딩 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-H5(A-Indo).1c(SEQ ID NO:98) 및 H5(A-Indo)-StuI.1707r (SEQ ID NO:99)을 사용하고, 구성물 번호 660(SEQ ID NO:60; 도 51)을 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO: 81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 685(SEQ ID NO:100)로 명명했다.
CPMV - HT 발현 카세트에서 SpPDI - H5 A/ Indonesia /5/2005의 조립 (구성물 번호 686)
H5 A/Indonesia/5/2005 유래의 HA0에 융합된 자주개자리 PDI 신호 펩티드를 암호화하는 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-SpPDI.c (SEQ ID NO:95) 및 H5(A-Indo)-StuI.1707r(SEQ ID NO:99)을 사용하고, 구성물 번호 663(SEQ ID NO:83)을 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 686(SEQ ID NO:101)으로 명명했다.
CPMV
-
HT
발현 카세트에서
H1
A/
Brisbane
/59/2007의 조립 (구성물 번호 732)
H1 A/brisbane/59/2007 유래의 HA의 코딩 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-H1B.c(SEQ ID NO:102) 및 StuI-H1B.r(SEQ ID NO:103)을 사용하고, 구성물 번호 774(SEQ ID NO:62; 도 53)를 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 732(SEQ ID NO:104)로 명명했다.
CPMV - HT 발현 카세트에서 SpPDI - H1 A/ Brisbane /59/2007의 조립 (구성물 번호 733)
H1 A/Brisbane/59/2007 유래의 HA0에 융합된 자주개자리 PDI 신호 펩티드를 암호화하는 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-SpPDI.c (SEQ ID NO:95) 및 StuI-H1B.r(SEQ ID NO:103)을 사용하고, 구성물 번호 787(SEQ ID NO:86)을 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 733 (SEQ ID NO:105)으로 명명했다.
CPMV
-
HT
발현 카세트에서
H3
A/
Brisbane
/10/2007의 조립 (구성물 번호 735)
H3 A/brisbane/10/2007 유래의 HA의 코딩 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-H3B.c(SEQ ID NO:106) 및 StuI-H3B.r(SEQ ID NO:107)을 사용하고, 구성물 번호 776(SEQ ID NO:69)을 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 735(SEQ ID NO:108)로 명명했다.
CPMV - HT 발현 카세트에서 SpPDI - H3 A/ Brisbane /10/2007의 조립 (구성물 번호736)
H3 A/Brisbane/10/2007 유래의 HA0에 융합된 자주개자리 PDI 신호 펩티드를 암호화하는 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-SpPDI.c (SEQ ID NO:95) 및 StuI-H3B.r(SEQ ID NO:107)을 사용하고, 구성물 번호 790(SEQ ID NO:90)을 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 736 (SEQ ID NO:109)으로 명명했다.
CPMV
-
HT
발현 카세트에서
HA
B/
Florida
/4/2006의 조립 (구성물 번호 738)
B/Florida/4/2006 유래의 HA의 코딩 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-HBF.c(SEQ ID NO:110) 및 StuI-HBF.r(SEQ ID NO:111)을 사용하고, 구성물 번호 779(SEQ ID NO:73; 도 64)를 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 738(SEQ ID NO:112)로 명명했다.
CPMV - HT 발현 카세트에서 SpPDI - HA B/ Florida /4/2006의 조립 (구성물 번호 739)
B/Florida/4/2006 유래의 HA0에 융합된 자주개자리 PDI 신호 펩티드를 암호화하는 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-SpPDI.c(SEQ ID NO:95) 및 StuI-HBF.r(SEQ ID NO:111)을 사용하고, 구성물 번호 798(SEQ ID NO: 94)을 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 739(SEQ ID NO:113)로 명명했다.
샤프롱
발현 카세트의 조립
2개의 열충격 단백질(Hsp) 발현 카세트가 조립되었다. 제 1 카세트에서는, 자주개자리 아질산염 환원효소(Nir)와 자주개자리 플라스토시아닌 프로모터의 요소들을 조합한 키메라 프로모터(Nir/Plasto)에 의해서 Arabidopsis thaliana(생태형 Columbia) 시토졸 HSP70(Athsp70-1, Lin et al, 2001, Cell Stress and Chaperones 6:201-208)의 발현이 제어된다. 키메라 Nir/Plasto 프로모터의 제어하에 자주개자리 시토졸 HSP40(MsJ1; Frugis et al, 1999, Plant Molecular Biology 40:397-408)의 코딩 영역을 포함하는 제 2 카세트가 또한 조립되었다.
식물 바이너리 벡터에서 자주개자리 아질산염 환원효소 프로모터(Nir), GUS 리포터 유전자 및 NOS 터미네이터를 함유하는 어셉터 플라스미드가 먼저 조립되었다. 플라스미드 pNir3K51(미국특허 No. 6,420,548에 설명됨)를 HindIII 및 EcoRI로 절단했다. 얻어진 단편을 동일한 제한 효소로 절단된 pCAMBIA2300(Cambia, 호주 캔버라)에서 클로닝하여 pCAMBIA-Nir3K51를 얻었다.
Darveau 등(Methods in Neuroscience 26:77-85 (1995))에 제시된 PCR-기반 라이게이션 방법에 의해 Hsp70 및 Hsp40의 코딩 서열을 개별적으로 어셉터 플라스미드 pCAMBIANir3K51에서 클로닝했다.
Hsp40에 대해, Msj1 코딩 서열(SEQ ID NO:114)을 프라이머 Hsp40Luz.1c(SEQ ID NO:115) 및 Hsp40Luz-SacI.1272r(SEQ ID NO:116)을 사용하여 자주개자리(생태형 Rangelander) 잎 전체 RNA로부터 RT-PCR에 의해서 증폭시켰다. 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 Hsp40Luz-Plasto.r(SEQ ID NO:117)를 사용하고, 구성물 660(SEQ ID NO:60; 도 51)을 주형으로서 사용하여 2차 증폭을 수행했다. 다음에, PCR 산물을 혼합하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 Hsp40Luz -SacI.1272r(SEQ ID NO:116)를 사용하는 3차 증폭(조립 반응)의 주형으로서 사용했다. 얻어진 단편을 HpaI(플라스토시아닌 프로모터 내)로 절단하고, HpaI(Nir 프로모터 내) 및 SacI로 미리 절단해 둔 pCAMBIANir3K51에서 클로닝하고, T4 DNA 폴리머라제로 파일링하여 블런트 단부를 만들었다. 얻어진 클론들을 정확한 배향에 대해 스크리닝하고, 서열 완전성에 대해 서열화했다. 결과의 플라스미드를 R850으로 명명하며, 도 83(SEQ ID NO:121)에 나타낸다. 프라이머 Hsp70Ara.1c(SEQ ID NO: 118) 및 Hsp70Ara-SacI.1956r(SEQ ID NO:119)를 사용하여 Arabidopsis 잎 RNA로부터 RT-PCR에 의해 Athsp70-1의 코딩 영역을 증폭시켰다. 프라이머 Plato-443c(SEQ ID NO:4; 도 7a) 및 Hsp70Ara-Plasto.r(SEQ ID NO:120)를 사용하고, 구성물 660 (SEQ ID NO: 60; 도 51)을 주형으로서 사용하여 2차 증폭을 수행했다. 다음에, PCR 산물을 혼합하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 Hsp70ARA-SacI.1956r(SEQ ID NO:119)를 사용하는 3차 증폭(조립 반응)의 주형으로서 사용했다. 얻어진 단편을 HpaI(플라스토시아닌 프로모터 내)로 절단하고, HpaI(Nir 프로모터 내) 및 SacI로 절단된 pCAMBIANir3K51에서 클로닝하고, T4 DNA 폴리머라제로 파일링하여 블런트 단부를 만들었다. 얻어진 클론들을 정확한 배향에 대해 스크리닝하고, 서열 완전성에 대해 서열화했다. 결과의 플라스미드를 R860로 명명하며, 도 84(SEQ ID NO:122)에 나타낸다.
이중 Hsp 발현 플라스미드가 다음과 같이 조립되었다. R860을 BsrBI(NOS 터미네이터 하류)로 절단하고, T4 DNA 폴리머라제로 처리하여 블런트 단부를 만들고, SbfI(키메라 NIR/Plasto 프로모터 상류)로 절단했다. 얻어진 단편(키메라 Nir/ Plasto 프로모터-HSP70 코딩 서열-Nos 터미네이터)을 SbfI 및 SmaI(모두 키메라 Nir/Plasto 프로모터 상류의 다중 클로닝 부위에 위치함)로 미리 절단해 둔 R850에서 클로닝했다. 얻어진 플라스미드를 R870으로 명명하며, 도 85(SEQ ID NO:123)에 나타낸다.
다른 발현 카세트들의 조립
가용성
H1
발현 카세트
540에서 막통과 도메인 및 세포질 꼬리의 코딩 영역을 류신 지퍼 GCN4 pII 변이체를 암호화하는 단편으로 치환함으로써 H1의 가용성 형태를 암호화하는 카세트를 제조하였다(Harbury et al, 1993, Science 1993; 262:1401-1407). 이 단편은 클로닝을 촉진하는 측면 KpnI 및 SacI 부위와 함께 합성되었다. 이 치환으로부터 얻어진 플라스미드를 544로 명명하며, 이 발현 카세트가 도 11에 도시된다.
M1
A/
Puerto
Rico
/8/34 발현 카세트
담베 식각 바이러스(TEV) 5' UTR과 인플루엔자 A/PR/8/34 M1 유전자(Ace. # NC 002016)의 오픈 리딩 프레임의 융합체가 중단 코돈의 하류에 부가된 측면 SacI 부위와 함께 합성되었다. 이 단편을 SwaI(TEV 5' UTR 내) 및 SacI로 분해하고, pCAMBIA 바이너리 플라스미드에서 2X35S/TEV-기반 발현 카세트에서 클로닝했다. 얻어진 플라스미드는 2X35S/TEV 프로모터 및 5' UTR 및 NOS 터미네이터의 제어하에 M1 코딩 영역을 지녔다(구성물 750; 도 11).
HcPro
발현 카세트
HcPro 구성물(35HcPro)이 Hamilton 등(2002)에 설명된 대로 제조되었다. 모든 클론을 서열화하여 구성물의 완전성을 확인했다. 이 플라스미드를 사용하여 전기천공(Mattanovich et al., 1989)에 의해 Agrobacteium tumefaciens(AGL1; ATCC, Manassas, VA 20108, USA)를 형질전환했다. 제한 맵핑으로 모든 A. tumefaciens 균주의 완전성을 확인했다.
P19
발현 카세트
Darveau 등(Methods in Neuroscience 26: 77-85(1995))에 제시된 PCR-기반 라이게이션 방법에 의해 자주개자리 플라스토시아닌 발현 카세트에 토마토 덤불위축 바이러스(TBSV)의 p19 단백질의 코딩 서열을 연결했다. 1차 PCR 라운드에서, 플라스토시아닌 프로모터의 세그먼트를 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 supP19-plasto.r(SEQ ID NO:124)를 사용하고, 주형으로서 구성물 660(SEQ ID NO:60; 도 51)을 사용하여 증폭시켰다. 병행하여, p19의 코딩 서열을 함유하는 또 다른 단편을 프라이머 supP19-1c(SEQ ID NO:125) 및 SupP19-SacI.r(SEQ ID NO:126)를 사용하고, 주형으로서 Voinnet 등(The Plant Journal 33:949-956 (2003))에 설명된 구성물 35S:p19를 사용하여 증폭시켰다. 다음에, 증폭 산물을 혼합하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 SupP19-SacI.r(SEQ ID NO:126)를 사용하는 2차 증폭 라운드(조립 반응)의 주형으로서 사용했다. 얻어진 단편을 BamHI(플라스토시아닌 프로모터 내) 및 SacI(p19 코딩 서열의 단부)로 절단하고, 동일한 제한 효소로 미리 절단해 둔 구성물 번호 660(SEQ ID NO:60; 도 51)에서 클로닝하여 구성물 번호 R472를 얻었다. 플라스미드 R472를 도 86에 나타낸다.
3. 식물
바이오매스의
제조,
접종물
,
아그로
-침윤, 및 수거
시판 피트모스 용토로 채운 플랫에서 Nicotiana benthamiana 또는 Nicotiana tabacum 식물을 종자로부터 성장시켰다. 식물은 16/8 광주기 및 25℃ 주/20℃ 야의 온도 체제의 온실에서 성장시켰다. 파종 3주 후에 각 묘목을 선별하여 화분에 옮겨 심고 온실에서 동일한 환경 조건하에 3주 더 성장시켰다. 형질전환 전에 하기 나타낸 여러 시점에서 식물로부터 싹을 잘라내거나 식물을 화학적으로 처리하여 정아와 액아를 제거하였다.
각 구성물로 트랜스펙션한 Agrobacteria를 10mM 2-[N-모르폴리노]에탄올술폰(MES), 20μM 아세토시링곤, 50μg/ml 카나마이신 및 25μg/ml 카르베니실린 pH 5.6으로 보충한 YEB 배지에서 OD600이 0.6 내지 1.6에 도달할 때까지 성장시켰다. 사용하기 전에 Agrobacterium 현탁액을 원심분리한 다음, 침윤 배지(10mM MgCl2 및 10mM MES pH 5.6)에 다시 현탁시켰다. 주사기-침윤을 Liu and Lomonossoff(2002, Journal of Virological Methods, 105:343-348)에 의해 설명된 대로 수행했다. 진공-침윤시에는 A. tumefaciens 현탁액을 원심분리하고 침윤 배지에 다시 현탁시킨 다음, 4℃에서 하룻밤 보관했다. 침윤일에 배양물 배치를 2.5 배양물 부피로 희석하고 가온하여 사용하였다. N. benthamiana 또는 N. tabacumw 전체 식물을 20-40 Torr의 진공 기밀 스테인리스 스틸 탱크 안의 박테리아 현탁액 중에 2분간 거꾸로 두었다. 주사기 또는 진공 침윤 후 식물을 온실로 다시 보내서 2-6일간 인큐베이션한 다음 수거하였다. 달리 명시되지 않는다면, 모든 침윤은 AGL1/35S-HcPro와 1:1 비율로 공-침윤으로서 수행하였고, 예외적으로 CPMV-HT 카세트-보유 균주만 균주 AGL1/R472와 1:1 비율로 공-침윤되었다.
4. 잎 표본채취 및 총 단백질 추출
인큐베이션 후, 식물의 기생부를 수거하고 -80℃에서 냉동시켜 조각으로 분쇄했다. 차가운 50mM Tris pH 7.4, 0.15M NaCl 및 1mM 불화 페닐메탄술포닐 3 부피 중에서 냉동-분쇄된 식물 구성물질의 각 샘플을 균질화(Polytron)하여 총 가용성 단백질을 추출했다. 균질화 후, 슬러리를 4℃에서 20분간 20,000g로 원심분리하고, 맑은 조 추출물(상청액)을 분석용으로 간수했다. 맑은 조 추출물의 총 단백질 함량을 소 혈청 알부민 기준물질을 사용하여 Bradford 분석(Bio-Rad, Hercules, CA)에 의해 측정했다.
5. 단백질 추출물의 크기 배제 크로마토그래피
32mL Sephacryl™ S-500 고 분해 비드(S-500 HR: GE Healthcare, 스웨덴 웁살라, Cat. No.17-0613-10)의 크기 배제 크로마토그래피(SEC) 칼럼을 충전하고, 평형화/용출 버퍼(50mM Tris pH 8, 150mM NaCl)를 사용하여 평형으로 만들었다. 조 단백질 추출물 1.5mL를 컬럼에 로딩하고, 45mL 평형화/용출 버퍼를 사용하여 용출 단계를 시작했다. 용출물을 1.5ml 분획씩 수집하고, 분획 10μL와 희석된 Bio-Rad 단백질 염료 시약(Bio-Rad, Hercules, CA) 200μL를 혼합하여 용출된 분획의 상대 단백질 함량을 모니터했다. 2 칼럼 부피의 0.2N NaOH와 10 칼럼 부피의 50mM Tris pH 8, 150mM NaCl, 20% 에탄올로 차례로 칼럼을 세척했다. 분리 후에는 매번 블루 덱스트란 2000(GE Healthcare Bio-Science Corp., Piscataway, NJ, USA)으로 칼럼을 캘리브레이션했다. 매 분리 사이에 블루 덱스트란 2000과 숙주 가용성 단백질의 용출 프로파일을 비교하여 사용된 칼럼들 간의 용출 프로파일의 균일성을 확보했다.
6. 단백질 분석 및
면역블롯팅
BCA 단백질 분석(Pierce Biochemicals, Rockport, IL)에 의해 단백질 농도를 측정했다. 단백질을 환원 조건하에 SDS-PAGE로 분리하고 코마시 블루로 염색했다. 염색된 겔을 스캔하고, ImageJ Software(NIH)를 사용하여 농도계 분석을 수행했다.
SEC 용출 분획으로부터의 단백질을 아세톤을 사용하여 침전시키고(Bollag et al, 1996), 평형화/용출 버퍼 1/5 부피에 다시 현탁시켜 환원 조건하에 SDS-PAGE로 분리한 다음, 이불화 폴리비닐렌(PVDF) 멤브레인(Roche Diagnostics Corporation, Indianapolis, IN) 위에 전기전달하여 면역검출하였다. 면역블로팅 전에 멤브레인을 4℃에서 5% 탈지유 및 Tris-완충 식염수 중의 0.5% Tween-20(TBS-T)으로 16-18시간 차단시켰다
TBS-Tween 20 0.1% 중의 2% 탈지유 중에 2μg/mL로 하여 적합한 항체(표 6)와 함께 인큐베이션하여 면역블롯팅을 수행했다. 화학발광 검출에 사용된 2차 항체는 표 4에 제시된 것들과 같으며, TBS-Tween 20 0.1% 중의 2% 탈지유 중에서 제시된 대로 희석하였다. 기질로서 루미놀(Roche Diagnostics Corporation)을 사용한 화학발광에 의해 면역반응성 복합체가 검출되었다. EZ-Link Plus® 활성화 퍼옥시다제 콘쥬게이션 키트(Pierce, Rockford, IL)를 사용하여 인간 IgG 항체의 양고추냉이 퍼옥시다제-효소 콘쥬게이션을 수행했다. H1, H3 및 B 서브타입의 검출에 대한 대조군으로서 사용된 불활성화된 전 바이러스(WIV)는 National Institute for Biological Standards and Control(NIBSC)로부터 구입했다.
H5에 대한 혈구응집 분석은 Nayak. and Reichl(2004)의 방법을 기초로 하였다. 간단히 말해서, 100μL PBS를 함유하는 V-바닥 96-웰 마이크로타이터 플레이트에서 웰 당 희석된 샘플이 100μL 남도록 시험 샘플(100μL)의 연속 2배 희석물을 제조했다. 0.25% 칠면조 적혈구 현탁액(Bio Link Inc., Syracuse, NY) 100μL를 각 웰에 가하고, 플레이트를 실온에서 2시간 인큐베이션했다. 완전한 혈구응집을 보인 최고 희석값의 역수를 HA 활성으로 기록했다. 병행해서 재조합 HA 표준물질을 PBS에 희석하여 각 플레이트에서 대조군으로 사용했다.
7. 수크로오스
구배
초원심분리
H5-함유 바이오매스 겔 여과 크로마토그래피로부터 용출된 분획 9, 10 및 11을 1mL씩 모아서 20-60%(w/v) 불연속 수크로오스 밀도 구배 위에 로딩하고, 17.5시간 125,000g로 원심분리했다(4℃). 이 구배에 의해 맨 위에서 시작하여 3mL씩 19개 분획으로 분별되었고, 면역학적 분석 및 혈구응집 분석 전에 투석하여 수크로오스를 제거하였다.
8. 전자현미경
Airfuge 초원심분리 관(Beckman Instruments, Palo Alto, CA, USA)에 시험할 샘플 100μL를 넣었다. 관 바닥에 그리드를 배치한 다음 120,000g로 5분간 원심분리했다. 그리드를 꺼내고 살짝 말린 다음, pH 6의 3% 텅스토인산 1 방울 위에 놓아 염색했다. 그리드를 Hitachi 7100 투과 전자현미경(TEM)에서 검사하였다(도 14b, 15b 및 15c의 이미지).
도 19는 약 1㎣의 잎 블록을 2.5% 글루타르알데히드를 함유하는 PBS 중에서 고정시키고, 3% 수크로오스를 함유하는 PBS로 세척한 다음, 1.33% 사산화오스뮴 중에서 고정-후 단계를 수행한 것의 이미지이다. 고정된 샘플을 Spurr 수지에 매립하고, 초박형 층을 그리드 위에 놓았다. 5% 우라닐 아세테이트와 0.2% 시트르산납을 사용하여 샘플을 양성 염색한 후 관찰하였다. 그리드를 Hitachi 7100 투과 전자현미경(TEM)에서 검사하였다.
9. 원형질막 지질 분석
원형질막(PM)을 담배 잎으로부터 얻어서, Mongrand 등에 따라서 폴리에틸렌글리콜 3350/덱스트란 T-500(각 6.6%)를 가진 수성 고분자 2-상 시스템 중에서 나누어 세포 분별한 후 BY2 세포를 배양했다. 모든 단계는 4℃에서 수행했다.
Bligh 및 Dyer에 따라서 상이한 분획들로부터 지질을 추출한 후에 정제했다. Lefebvre 등에 설명된 용매 시스템을 사용하는 일차원 HP-TLC에 의해 극성 지질과 중성 지질을 분리했다. Macala 등에 의해 설명된 대로 아세트산구리로 염색한 후 PM 분획의 지질을 검출했다. 지질의 이동 시간을 표준물질과 비교하여 지질을 확인했다(모든 표준물질은 Sigma-Aldrich(St-Louis, MO, USA)로부터 입수했고, SG만 Matreya, Pleasant Gap(PA, USA)에서 입수했다).
10.
H5
VLP
(A/
Indonesia
/5/2005) 정제
N. benthamiana의 660-침윤된 냉동 잎을 시판 블렌더를 사용하여 50mM Tris pH 8, NaCl 150mM 및 0.04% 나트륨 메타-바이술파이트 1.5 부피 중에서 균질화하였다. 얻어진 추출물을 1mM PMSF로 보충하고 1M 아세트산으로 pH 6으로 조정한 다음, 42℃에서 5분간 가열했다. 열처리된 추출물에 규조토(DE)를 가하여 pH 이동과 열처리로 인해 침전된 오염물질을 흡착시키고, 슬러리를 Whatman 종이 필터로 여과했다. 얻어진 맑은 추출물을 실온에서 10분간 10,000g로 원심분리하여 잔류 DE를 제거하고, 0.8/0.2μm Acropack 20 필터를 통과시키고, 페투인-아가로오스 친화성 칼럼(Sigma-Aldrich, St-Louis, MO, USA)에 로딩했다. 400mM NaCl, 25mM Tris pH 6에서 세척한 후, 결합된 단백질을 1.5M NaCl, 50mM MES pH 6을 사용하여 용출시켰다. 용출된 VLP를 최종 농도 0.0005%(v/v)로 Tween-80으로 보충했다. VLP를 100 kDa MWCO Amicon 멤브레인 상에서 농축하고 4℃에서 30분간 10,000g로 원심분리한 다음, 0.01% Tween-80 및 0.01% 티메로살을 함유한 PBS pH 7.4에 다시 현탁시켰다. 사용하기 전에 현탁된 VLP를 여과 멸균했다.
11. 동물 연구
마우스
6-8주 된 암컷 BALB/c 마우스(Charles River Laboratories)를 사용하여 인플루엔자 VLP 투여에 따른 면역반응에 관한 연구를 수행했다. 70마리의 마우스를 5마리씩 14개 그룹으로 무작위로 나누었다. 8개 그룹은 근육내 면역화에 사용했고, 6개 그룹은 비내 투여 경로를 시험하는데 사용했다. 모든 그룹은 2회-용량 섭생으로 면역화했고, 추가 면역화는 1차 면역화 후 제3주에 수행했다.
뒷다리에 근육내 투여하는 것에 있어서, 마취하지 않은 마우스를 식물-제조 H5 VLP(A/Indonesia/5/2005(H5N1)) 백신(0.1, 1, 5 또는 12μg), 또는 대조군 헤마글루티닌(H5) 항원으로 면역화했다. 대조군 H5는 균주 A/Indonesia/5/05 H5N1에 기초하여 생산되고 293 세포 배양물(Immune Technology Corp., New York, USA)로부터 정제된 재조합 가용성 헤마글루티닌을 포함했다(달리 지시되지 않는다면 주사 당 5μg 사용). 버퍼 대조군은 PBS였다. 이 항원은 HA 단백질의 아미노산 18-530으로 구성되며, His-택과 변형된 절단 부위를 가진다. 전자현미경으로 이 시판 제품은 VLP의 형태가 아니라는 것을 확인했다.
애쥬번트의 효과를 측정하기 위해서 5μg 식물-제조 VLP H5 백신과 1 부피의 Alhydrogel 2%(명반, Accurate Chemical & Scientific Corporation, Westbury, NY, US) 또는 293 세포 배양물로부터 정제된 5μg 재조합 헤마글루티닌과 1 부피의 명반으로 두 그룹의 동물을 면역화했다. 70마리의 마우스를 5마리씩 14개 그룹으로 무작위로 나누었다. 8개 그룹은 근육내 면역화에 사용했고, 6개 그룹은 비내 투여 경로를 시험하는데 사용했다. 모든 그룹은 초회-추가 섭생에 따라서 면역화했고, 추가 면역화는 최초 면역화 후 제3주에 수행했다.
뒷다리에 근육내 투여하는 것에 있어서, 마취하지 않은 마우스를 식물-제조 H5 VLP(0.1, 1, 5 또는 12μg), 또는 대조군 헤마글루티닌(HA) 항원(5μg) 또는 PBS로 면역화했다. 모든 항원 제제는 면역화 전에 1:1의 부피비로 Alhydrogel 1% (명반, Accurate Chemical & Scientific Corporation, Westbury, NY, US)과 혼합했다. 애쥬번트의 효과를 측정하기 위해서 두 그룹의 동물을 5μg 식물-제조 VLP H5 백신 또는 5μg 대조군 HA 항원으로 어떤 애쥬번트도 없이 면역화했다.
비내 투여에 있어서, 자동 유도 챔버를 사용하여 이소플루란을 흡입시켜 마우스를 간단히 마취시켰다. 다음에, 식물-제조 VLP 백신(0.1 또는 1μg) 또는 대조군 HA 항원(1μg), 또는 PBS를 콧구멍 당 4μl 방울을 가하여 마우스를 면역화했다. 모든 항원 제제는 면역화 전에 키토산 글루타메이트 1%(Protosan, Novamatrix /FMC BioPolymer, 노르웨이)와 혼합했다. 다음에, 마우스를 용액 중에서 호흡시켰다. 비내 투여 경로에 있어서 애쥬번트의 효과를 확인하기 위하여 두 그룹의 동물을 1μg 식물-제조 VLP H5 백신 또는 1μg 대조군 HA 항원으로 면역화했다.
흰족제비
5마리씩 10개 그룹(수컷, 18-24주령, 질량 약 1kg)을 사용했다. 각 그룹에 대한 치료는 표 7에 설명한 대로이다. Alhydrogel(명반)(Superfos Biosector, 덴마크) 2%(최종 = 1%)를 애쥬번트로 사용하였다. 백신 조성물은 설명된 대로 생산된 막-관련 A/Indonesia/5/05(H5N1) VLP였다. 백신 대조군(양성 대조군)은 Immune Technology Corporation(ITC)에 의해 293 세포 배양물 중에서 아데노바이러스를 사용하여 생산된 Indonesia 균주로부터의 완전히 글리코실화된 막-결합 재조합 H5였다.
전반적인 건강 및 상태(체중, 직장 온도, 자세, 털, 운동 패턴, 호흡, 배설물)에 대해 연구하는 동안 규칙적으로 흰족제비를 평가했다. 제0일, 제14일 및 제28일에 사두근에 근육내 주사(총 부피 0.5-1.0)하여 동물을 면역화했다. 애쥬번트를 포함하는 프로토콜에 있어서는 면역화 직전에 1:1의 부피비로 Alhydrogel와 백신 조성물을 혼합했다. 면역화 전 제0일, 제21일 및 제35일에 혈청 샘플을 획득했다. 제40-45일에 동물을 죽이고(방혈/심장천공), 비장을 수거하여 검시를 수행했다.
동종성 또는 이종성 불활성화 H5N1 바이러스를 사용하는 ELISA 분석에 의해 항-인플루엔자 항체 역가를 정량할 수 있다.
혈청 샘플(면역화-전, 제21일 및 제35일)의 혈구응집 억제 항체 역가를 설명된 대로 마이크로타이터 HAI에 의해 평가했다(Aymard et al., 1973). 간단히 말해서, 혈청을 수용체-파괴 효소로 전처리하고 열 불활성화시킨 다음, 적혈구(세척된 적혈구-RBC) 현탁액과 혼합했다. Lampire로부터의 말의 세척된 RBC(10%)가 권장되며, RBC(말-의존성)의 출처에 따라서 분석법은 다양할 수 있다고 생각되는데, 10마리의 말로부터 세척된 RBC를 시험하여 가장 민감한 배치를 선택했다. 대안으로서, 칠면조 RBC가 사용될 수 있다. 항체 역가는 혈구응집을 완전히 억제한 최고 희석값의 역수로서 표시하였다.
교차-반응성 HAI 역가: A/Indonesia/5/05(clade 2.1)에 대한 백신으로 면역화된 흰족제비의 HAI 역가를 클레이드 1 Vietnam 균주 A/Vietnam/1203/2004 및 A/ Vietnam/1194/2004 또는 A/Anhui/01/2005(subclade 2.3) 또는 A/turkey/Turkey/1/ 05(subclade 2.2) 등의 다른 서브클레이드 또는 클레이드로부터의 불활성화된 H5N1 인플루엔자 균주를 사용하여 측정했다. 모든 분석은 개별 샘플에 대해 수행했다.
데이터 분석: 그룹 간 차이가 통계적으로 유의한지를 입증하기 위하여 모든 데이터에 대해 통계적 분석(ANOVA)이 수행되었다.
치사적
시험감염에 대한 실험 디자인(마우스)
128마리의 마우스를 8마리씩 16개 그룹으로 무작위로 나누었고, 1개 그룹은 면역화하지 않고 시험감염시키지 않았다(음성 대조군). 모든 그룹을 2-용량 섭생으로 근육내 투여에 의해 면역화했고, 2차 면역화는 1차 면역화 후 제2주에 수행했다.
뒷다리에 근육내 투여하는 것에 있어서, 마취하지 않은 마우스를 식물-제조 H5 VLP(1, 5 또는 15μg), 또는 15μg 대조군 HA 항원 또는 PBS로 면역화했다. 모든 항원 제제는 면역화 전에 1 부피의 Alhydrogel 1%(명반, Accurate Chemical & Scientific Corporation, Westbury, NY, US)와 혼합했다.
면역화 기간 동안 주 1회 마우스의 체중을 재고, 주사 부위에서 국소 반응을 관찰하여 모니터하였다.
인플루엔자 A/Turkey/582/06 바이러스(Dr. Bruno Lina(Lyon University, 프랑스 리용)에 의해 제공)의 4.09 x 106 50% 세포 배양물 감염 용량(CCID50)을 사용하여 2차 면역화 후 제22일에 BL4 봉쇄 연구실(P4-Jean Merieux-INSERM, 프랑스 리용)에서 마취된 마우스를 비내 경로(i.n.)로 시험감염시켰다. 시험감염 후 14일에 걸쳐서 마우스의 질병 임상 증상 및 체중을 매일 관찰했다. 중증 감염 증상과 25% 이상의 체중 손실을 나타낸 마우스를 마취한 후 안락사시켰다.
혈액 채취, 폐 및 코 세척 및 비장 수거
1차 면역화 후 제14일과 2차 면역화 후 제14일에 마취하지 않은 동물에서 외측 복재 정맥혈을 채취했다. 10분간 8,000g으로 원심분리하여 혈청을 수집했다.
2차 면역화 후 제4주에 마우스를 이산화탄소 가스로 마취하고, 종결 즉시 심장을 천공하여 혈액을 채취했다.
마지막 방혈 후, 카테테르를 폐 쪽으로 기관으로 삽입하고, 차가운 PBS-프로테아제 억제제 칵테일 용액 1mL를 카테테르에 부착된 얼음 주사기에 넣어 폐에 주사한 다음 분석을 위해 인출했다. 이 세척 과정을 2번 수행했다. 폐 세척액을 원심분리하여 세포 파편을 제거했다. 코 세척을 위해서는 카테테르를 코 부분 쪽으로 삽입하고, PBS-프로테아제 억제제 칵테일 용액 0.5mL를 카테테르를 통해 비강에 집어넣은 다음 수집했다. 코 세척액을 원심분리하여 세포 파편을 제거했다. 애쥬번트 첨가 식물-제조 백신 5μg 또는 애쥬번트 첨가 재조합 H5 항원 5μg으로 근육내 면역화한 마우스와 애쥬번트 첨가 식물-제조 백신 1μg 또는 애쥬번트 첨가 재조합 H5 항원 1μg으로 비내 면역화한 마우스에서 비장을 수거했다. 수거한 비장을 젠타마이신 보충된 RPMI에 두고, 50mL 원뿔형 시험관에서 10mL 주사기의 플런저로 짓이겼다. 짓이긴 비장을 2번 헹구고 5분간 2,000rpm으로 원심분리한 다음, 실온에서 5분간 ACK 세포용해 버퍼에 다시 현탁시켰다. 비장세포를 PBS-젠타마이신으로 세척하고 5% RPMI에 다시 현탁시킨 다음 계수했다. 비장세포를 증식 분석에 사용했다.
항체
역가
혈청의 항-인플루엔자 항체 역가를 1차 면역화 후 제14일과 2차 면역화 후 제14일 및 제28일에 측정했다. 불활성화 바이러스 A/Indonesia/5/05를 코팅 항원으로서 사용하여 효소-결합 면역흡착 분석(ELISA)에 의해 역가를 결정했다. 종말점 역가는 음성 대조군 샘플보다 적어도 0.1 더 높은 OD 값에 도달했던 최고 희석값의 역수로서 표시하였다.
항체 부류 결정(IgG1, IgG2a, IgG2b, IgG3, IgM)을 위해서 앞서 설명된 대로 ELISA에 의해 역가를 평가했다.
혈구응집 억제(
HI
)
역가
앞서 설명된 대로 2차 면역화 후 제14일 및 제28일에 혈청의 혈구응집 억제(HI) 역가를 측정했다(WHO 2002; Kendal 1982). 균주 A/Indonesia/5/05 또는 A/ Vietnam/1203/2004로부터의 불활성화된 바이러스 제제를 사용하여 마우스 혈청 샘플을 HI 활성에 대해서 시험했다. Vibrio cholerae로부터 제조된 수용체-파괴 효소 II(RDE II)(Denka Seiken Co., 일본 도쿄)로 혈청을 전처리했다((Kendal 1982). 0.5% 칠면조 적혈구를 사용하여 HI 분석을 수행했다. HI 항체 역가는 완전한 응집 억제를 야기한 최고 희석값의 역수로서 정의하였다.
실시예
실시예 1: N. benthamiana 식물에서 아그로 -침윤에 의한 인플루엔자 바이러스 A/Indonesia/5/05(H5N1) 헤마글루티닌의 일시 발현
균주 A/Indonesia/5/05(H5N1)로부터의 H5 서브타입의 발현을 통해 인플루엔자 헤마글루티닌을 생산하는 일시 발현 시스템을 능력을 측정했다. 도 11에 나타낸 대로, 먼저 자생 신호 펩티드와 막통과 도메인을 갖는 헤마글루티닌 유전자 코딩 서열(GenBank Accession No. EF541394)을 플라스토시아닌 발현 카세트 - 자주개자리 플라스토시아닌 유전자로부터의 프로모터, 5' UTR, 3' UTR 및 전사 종결 서열 - 에서 조립하고, 조립된 카세트(660)를 pCAMBIA 바이너리 플라스미드에 삽입했다. 다음에, 이 플라스미드를 Agrobacterium(AGL1)에서 트랜스펙션하여 재조합 균주 AGL1/660을 만들어 일시 발현에 사용했다.
N. benthamiana 식물을 AGL1/660로 침윤시키고, 잎을 수거하여 6일간 인큐베이션했다. 아그로-침윤된 잎에 H5가 축적되었는지 결정하기 위해, 먼저 침윤된 잎 조직으로부터 단백질을 추출한 다음, 항-H5(Vietnam) 다클론성 항체를 사용하여 웨스턴 블롯팅에 의해 분석했다. 추출물에서는 약 72kDa에서 독특한 밴드가 검출되었는데(도 12), 이것은 인플루엔자 헤마글루티닌의 미절단 HA0 형태의 크기에 해당한다. 양성 대조군으로서 사용된 시판 H5(A/Vietnam/1203/2004; Protein Science Corp., Meriden, CT, USA)는 약 48kDa와 28kDa에 2개의 밴드로서 검출되었으며, 이것은 각각 HA1과 HA2의 분자량에 해당한다. 이로써 침윤된 잎에서 H5의 발현이 절단되지 않은 번역 산물의 축적을 가져온다는 것이 증명되었다.
AGL1/660-형질전환된 잎으로부터의 조 단백질 추출물이 칠면조 적혈구를 응집시키는 능력에 의해 활성 HA 삼량체의 형성이 증명되었다(데이터 나타내지 않음).
실시예 2: 크기 배제 크로마토그래피를 사용한 식물 추출물 중의 헤마글루티닌-함유 구조의 특성화
식물에서 생산된 인플루엔자 헤마글루티닌의 고 분자량 구조로의 회합을 겔 여과에 의해 평가했다. AGL1/660-침윤된 식물로부터의 조 단백질 추출물(1.5mL)을 Sephacryl™ S-500 HR 칼럼(GE Healthcare Bio-Science Corp., Piscataway, NJ, USA)에서 크기 배제 크로마토그래피(SEC)에 의해 분별했다. 항-HA 항체를 사용한 면역검출에 의해서 총 단백질 함량과 HA 양에 대해 용출 분획을 평가했다(도 13a). 도 13a에 도시된 대로, 블루 덱스트란(2MDa) 용출은 분획 10에서 이른 피크를 나타냈지만, 숙주 단백질의 벌크는 칼럼에 보유되었다가 분획 14 내지 22에서 용출되었다. 각 SEC 용출 분획 200μL로부터 단백질을 아세톤 침전에 의해 농축(5배)하여 웨스턴 블롯팅에 의해서 분석했을 때(도 15a, H5), 헤마글루티닌(H5)은 주로 분획 9 내지 14에서 발견되었다(도 13b). 이론과 결부시키고 싶지는 않지만, 이것은 HA 단백질이 커다란 수퍼구조로 회합되었거나, 또는 고 분자량 구조에 부착된 것을 시사한다.
A/New Caledonia/20/99(H1N1)(SEQ ID NO: 33; 도 16; GenBank Accession No. AY289929)로부터의 H1 핵산 서열을 사용하여 두 번째 발현 카세트를 조립하여 구성물 540(도 11)을 만들었다. 식물 단백질 이황화물 이소머라제 유전자로부터 기원하는 신호 펩티드, 및 H1의 막통과 도메인을 삼량체로 자체 조립하는 것으로 밝혀진 펩티드인 GCN4 로이신 지퍼의 pII로 치환하여 H1의 가용성 삼량체 형태를 생산하도록 키메라 유전자 구성물을 디자인했다(카세트 544, 도 11). 막통과 도메인을 결여하기는 하지만 이 가용성 삼량체 형태도 혈구응집을 할 수 있었다(데이터 나타내지 않음).
AGL1/540 또는 AGL1/544로 침윤된 식물로부터의 단백질 추출물을 SEC에 의해 분별하고, 항-인플루엔자 항체를 사용하여 웨스턴 블롯팅에 의해 H1 용출된 분획의 존재를 시험했다(Fitzgerald, Concord, MA, USA). AGL1/540-침윤된 잎에서는 H1이 상당한 고 분자량 구조로서 주로 축적되었고, 피크는 더 작은 크기의 구조 쪽에서 비대칭으로 나타난다(H1; 도 13c). AGL1/544-침윤된 잎에서는 H1의 가용성 구조가 분리된 삼량체로서 축적되었는데, 이것은 숙주 단백질 용출 프로파일과 평행인 겔 여과로부터의 용출 패턴에 의해 증명된다(가용성 H1; 도 13d). 비교하면 H1 로제트(Protein Science Corp., Meriden, CT, USA)는 H1의 가용성 형태(도 13d)보다는 이르고 자생 H1(도 13c)보다는 늦게 분획 12 내지 16(도 13e)에서 용출된 헤마글루티닌의 5-6개 삼량체의 미셀에 존재한다.
헤마글루티닌의 구조체 회합에 대한 M1 공-발현의 영향을 평가하기 위해, A/ PR/8/34(H1N1) M1(SEQ ID NO: 35; 도 18; GenBank Accession No. NC_002016)의 코딩 서열에 해당하는 핵산을 사용하여 M1 발현 카세트를 조립했다. 이 구성물은 750으로 명명했고 도 11에 나타낸다. M1과 H1의 공-발현을 위해 침윤 전에 AGL1/540과 AGL1/750의 현탁액을 동 부피로 혼합했다. 다수 Agrobacterium 현탁액의 공-침윤은 다수 트랜스젠의 공-발현을 허용한다. SEC 용출 분획의 웨스턴 블롯 분석은 M1의 공-발현이 H1 구조의 용출 프로파일을 바꾸지는 않았지만, 아그로-침윤된 잎에서 H1의 축적을 감소시켰음을 나타낸다(도 13f 참조).
실시예 3: 농도차 수크로오스 중 원심분리에 의한 H5 구조의 분리 및 전자현미경 관찰
전자현미경(EM)에서 헤마글루티닌의 구조를 관찰하려면 잎 단백질 조 추출물에 대한 SEC로부터 획득된 것보다 높은 농도 및 순도 수준이 필요하다. H5 구조의 EM 관찰을 가능하게 하기 위해서 잎 단백질 조 추출물을 먼저 PEG 침전(20% PEG)에 의해 농축한 다음, 1/10 부피의 추출 버퍼에 다시 현탁시켰다. 농축된 단백질 추출물을 S-500 HR 겔 여과에 의해 분별하고, 용출 분획 9, 10 및 11(빈 칼럼 부피에 해당)을 모은 다음, 20-60% 수크로오스 밀도 구배로 초원심분리하여 해당 단백질로부터 더 분리했다. 농도차 수크로오스를 맨 위부터 시작하여 분별한 다음, 분획을 투석하고, 100 NMWL 원심분리 필터 유닛에서 농축하여 분석했다. 웨스턴 블롯 및 혈구응집 결과(도 14a)에서 나타난 대로, H5는 약 60% 수크로오스를 함유했던 분획 16 내지 19에 주로 축적되었고, 숙주 단백질은 대부분 분획 13에서 피크를 나타냈다. 분획 17, 18 및 19를 모아서 음성 염색하고 EM으로 관찰했다. 이 샘플의 시험은 인플루엔자 VLP의 형태학적 특징과 일치하는 80 내지 300nm 크기 범위의 스파이크된 구형 구조의 존재를 분명히 증명했다(도 14b).
실시예
4: 식물
바이오매스로부터
인플루엔자
H5
VLP
의 정제
가용성 단백질의 풍부한 함량에 더하여, 식물 잎 추출물은 가용성 당, 핵산 및 지질의 복잡한 혼합물을 함유한다. pH를 이동시키고 열처리한 다음, 규조토로 여과하여 조 추출물을 정화하였다(정화 방법의 상세한 설명은 재료 및 방법 섹션을 참조한다). 도 15a(레인 1-4)는 여러 정화 단계에서의 단백질 함량을 비교한 코마시 블루 염색된 겔을 나타낸다. 조 추출물(레인 1)과 정화된 추출물(레인 4) 중의 단백질 함량의 비교는 전반적인 단백질 함량을 감소시키고 잎 조 추출물에서 50kDa에서 보이는 주 오염물질을 대부분 제거하는 정화 단계의 능력을 드러낸다. 50kDa 밴드는 큰 RuBisCO 서브유닛에 해당하며, 총 잎 단백질의 30%까지 나타난다.
이들 정화된 추출물로부터 인플루엔자 H5 VLP를 페투인 칼럼에서 친화성 크로마토그래피에 의해 정제했다. 통과하면서 로딩된 분획(도 15a, 레인 5)과 용출된 VLP(도 15a, 레인 7)의 비교는 정화된 식물 추출물에서 인플루엔자 H5 VLP에 대한 페투인 친화성 칼럼의 특이성을 증명한다.
정제 과정은 H5에서 75%를 넘는 순도를 가져왔으며, 이것은 코마시 블루 염색된 SDS-PAGE 겔 상에서 밀도계에 의해 측정된다(도 15a, 레인 7). 정제된 산물의 구조적 특질을 평가하기 위해, 정제된 H5를 100 NMWL(공칭 분자량 한계) 원심분리 필터 유닛에서 농축하고 음성 염색하여 EM에서 검사하였다. 도 15b는 VLP의 존재가 풍부하게 보이는 대표적인 섹터를 도시한다. 근접 검사에 의해 VLP 상의 스파이크의 존재가 확인되었다(도 15c).
도 15d에 도시된 대로, 코마시 블루 염색된 H5 헤마글루티닌의 밀도 및 BCA 방법에 의한 총 단백질 결정에 기초하여, 페투인 칼럼에서 친화성 크로마토그래피에 의해 정화된 잎 추출물로부터 H5 VLP를 약 89% 순도까지 정제했다.
칠면조 적혈구를 응집시키는 능력에 의해 HA VLP의 생물활성을 확인하였다(데이터 나타내지 않음).
또한, 도 15d에서는 항-H5 다클론성 혈청(A/Vietnam/1203/2004)을 사용한 웨스턴 블롯팅 및 면역검출에 의해서 시각화된 정제된 VLP의 정체가 확인된다. 대략 72kDa에서 독특한 밴드가 검출되며, 이것은 인플루엔자 헤마글루티닌의 미절단 HA0 형태의 크기에 해당한다. 도 15c는 헤마글루티닌 스파이크가 구조를 덮고 있는 백신의 VLP 구조를 도시한다.
VLP를 0.22μm 필터를 통해 여과하여 마우스의 면역화에 알맞게 제형화하고, 내독소 LAL(리물루스 유주세포 용해물) 검출 키트(Lonza, Walkserville, MS, USA)를 사용하여 내독소 함량을 측정하였다. 여과된 백신은 105.8±11.6% EU/mL(내독소 유닛/mL)를 함유했다.
실시예
5: 식물에서 인플루엔자
VLP
의
국부화
VLP를 국부화하고 이들의 원형질막 기원을 확인하기 위해, H5-생산 식물의 얇은 잎 절편을 고정한 다음, 양성 염색하여 TEM으로 검사했다. 잎 세포의 관찰에서 원형질막의 함입에 의해 형성된 세포외 공동 내에 VLP가 존재하는 것으로 나타났다(도 19). 관찰된 VLP의 모양 및 위치에 의해 세포벽 상에 이들의 원형질막이 나란히 놓임에도 식물 세포가 이들의 원형질막으로부터 유래하는 인플루엔자 VLP를 생산하여 이들을 아포플라스트 공간에 축적하는데 필요한 형성성을 가진다는 것이 증명되었다.
실시예
6: 원형질막 지질 분석
지질 함량의 분석으로부터 식물 인플루엔자 VLP의 조성 및 기원을 추가로 확인하였다. 정제된 VLP로부터 지질을 추출하고, 이들의 조성을 고성능 박층 크로마토그래피(HP-TLC)에 의해 고도 정제된 담배 원형질막의 조성과 비교했다. VLP 및 대조군 원형질막의 극성 지질과 중성 지질의 이동 패턴은 유사했다. 정제된 VLP는 원형질막에서 발견되는 주요 인지질(포스파티딜콜린 및 포스파티딜에탄올아민)과 스핑고지질(글루코실-세라마이드)를 함유했으며(도 27a), 양쪽 다 유일한 중성 지질로서 자유 스테롤을 함유했다(도 27b). 그러나, 정제된 VLP 추출물에서 원형질막 단백질 마커(ATPase)의 면역검출은 VLP 지질 이중층이 식물 원형질막과 관련된 주요 단백질 중 하나를 함유하지 않는다는 것을 나타냈으며, 이것은 숙주 단백질이 VLP가 식물 세포로부터 발아하는 과정 동안 원형질막으로부터 배제되지 않았을 가능성을 시사한다(도 27c).
실시예
7:
H5
VLP
의 면역원성 및 투여 경로의 영향
식물에서 제조된 H5 VLP를 근육내 주사 또는 비내 경로(흡입)에 의해 마우스에 투여했다. 설명된 방법에 따라서 애쥬번트로서 명반과 함께 VLP 0.1 내지 12ug을 근육내 주사했다. 5ug 재조합 가용성 헤마글루티닌(H5)와 유사한 크기로 최저 항원 양에서 최고 항체 역가가 관찰되었다(도 20a).
0.1 내지 1ug의 식물에서 제조된 H5 VLP를 키토산 애쥬번트와 함께 비내 투여했는데, 이것은 명반 애쥬번트를 함께 투여한 재조합 가용성 H5보다 큰 항체 반응을 제공했다(도 20b).
두 투여 경로 모두에서 일련의 항원 양에 걸쳐서 시험된 모든 마우스에서 혈청 전환이 관찰되었다. 재조합 H5 가용성 항원은 낮은(< 1/40) 또는 무시할만한(1 < 1/10, 애쥬번트 없는 재조합 H5) HI 역가를 부여했다.
실시예
8: 혈구응집 억제 항체
역가
(
HAI
)
H5
VLP
도 21a 및 21b는 식물-제조 H5 VLP, 또는 재조합 가용성 H5로 "추가접종"한 후 제14일의 혈구응집 억제(HAI) 항체 반응을 예시한다. 근육내 투여했을 때 최저 항원 용량(0.1ug)은 재조합 가용성 H5의 10배 양의 투여(5ug)에 비해서 우수한 HAI 반응을 야기했다. H5 VLP의 용량 증가는 최저 용량에 비해 HAI의 그다지 많지 않은 증가를 제공했다.
비내 투여 후 HAI 반응은 1ug 재조합 가용성 H5를 투여한 마우스와 비교하여 식물-제조 H5 VLP(1.0 또는 0.1ug)를 투여한 마우스에서 상당히 증가했으며, 재조합 가용성 HA는 음성 대조군과 유사했다. H5 VLP(0.1에서 12μg)의 근육내 주사에 의해서 면역화된 모든 마우스는 대조군 H5 항원으로 면역화된 마우스보다 더 높은 HAI 역가를 가졌다(도 21a). 동일한 5μg 용량에서 VLP는 대조군 H5 항원의 상응하는 용량보다 20배 더 높은 HAI 역가를 유도했다. 또한, VLP는 비내 경로를 통해 송달되었을 때도 대조군 HA 항원보다 상당히 더 높은 HAI 역가를 유도했다(도 21b). 주어진 H5 VLP 용량에서 HAI 역가의 수준은 근육내 면역화된 마우스보다 비내 면역화된 마우스에서 더 낮았는데, 1μg VLP가 근육내 투여되었을 때 210의 평균 HAI 역가를 유도했지만, 동일한 용량이 비내 투여되었을 때는 34의 평균 HAI 역가를 유도했다.
근육내 투여되었을 때 모든 VLP 용량은 동종성의 불활성화된 전체 바이러스와 결합할 수 있는 항체를 높은 수준으로 유도했다(도 20a 및 24). 식물-제조 VLP 백신과 대조군 H5 항원 사이에 유의한 차이는 발견되지 않았으며(추가접종 제14일 후 12μg VLP 그룹을 제외하고), 두 항원 제제 모두 동종성 균주에 대해 높은 결합 항체 역가를 유도한다. 그러나, 비내 투여되었을 때는 대조군 H5 항원보다 VLP가 더 높은 결합 항체 역가를 유도했다(도 20b). 키토산과 혼합되었을 때 1μg VLP를 사용한 면역화는 5,500의 상호 평균 Ab 역가를 유도했으며, 이것은 대조군 HA 항원 1μg로 면역화된 마우스에서 발견된 수준(920의 상호 평균 Ab 역가)보다 8.6배 더 높은 것이었다.
다음에, 식물-유래 인플루엔자 VLP의 면역원성을 마우스에서 용량-범위 연구를 통해 조사했다. 5마리씩의 BALB/c 마우스의 그룹을 명반 중에서 조제된(1:1의 비율) 인플루엔자 A/Indonesia/5/05(H5N1)로부터의 HA를 함유한 VLP를 0.1μg 내지 12μg 을 사용하여 3주 간격으로 2번 근육내 면역화했다. 불활성화된 전 바이러스 항원(A/Indonesia/5/05(H5N1))을 사용하여 2차 면역화 후 제14일에 수집된 혈청에 대해 혈구응집 억제 역가(HI 또는 HAI)를 측정했다. 0.1μg 정도의 sjw은 VLP 용량을 사용한 면역화가 항체 생산을 유도했으며, 이것은 높은 희석값에서 바이러스가 적혈구를 응집하는 것을 억제했다(도 21a). 병행하여 5μg의 비-VLP 명반-애쥬번트 대조군 H5 항원(역시 A/Indonesia/5/05 유래)으로 마우스를 면역화한 것은 최저 VLP 용량에서 달성된 것보다 2-3 log 더 낮은 HI 반응을 유도한다.
두 투여 경로 모두에서 일련의 항원 양에 걸쳐서 HAI 반응은 VLP 투여한 마우스에서 우수하다.
실시예
9
H5
VLP
의 면역원성에 대한
애쥬번트의
효과
식물-제조 H5 VLP는 원형질막 기원을 가진다(도 19, 실시예 5). 이론과 결부시키고 싶지는 않지만, 외피보유 바이러스 또는 외피보유 바이러스의 VLP는 일반적으로 그들이 발아한 막으로부터 외피를 획득한다. 식물 원형질막은 동물 세포에서도 드물게 발견되는 피토스테롤 성분을 가지며, 이들 스테롤 중 몇 가지는 면역자극 효과를 나타내는 것으로 증명되었다.
식물-제조 H5 VLP를 애쥬번트의 존재 또는 부재하에 근육내(도 22a) 또는 비내(도 22b) 경로에 의해 마우스에 투여하고 HAI(혈구응집 억제 항체 반응)를 측정했다. 첨가된 애쥬번트(명반 또는 키토산, 실시예에서와 같이)의 존재 또는 부재하에 VLP는 양쪽 투여 시스템에서 재조합 가용성 H5보다 상당히 더 큰 HAI 헤마글루티닌 억제를 나타냈다. 애쥬번트(즉, 명반 또는 키토산)를 첨가하지 않았을 때도 식물-제조 H5 VLP는 상당한 HAI를 나타내는데, 이것은 항원 투여에 대한 전신적 면역반응의 징표이다.
명반은 HAI 역가의 평균 수준을 VLP의 근육내 투여(도 22a)에서 5배까지, 대조군 H5 항원에 대해서는 3.7배까지 증진시켰다. 근육내 투여되었을 때 5μg VLP는 상응하는 용량의 대조군 H5 항원보다 12배 더 높은 평균 HAI 역가를 유도했다. 키토산은 대조군 H5 항원(도 22b)의 평균 HAI 수준은 증가시키지 않았지만, VLP를 1μg 비내 투여하여 면역화한 마우스의 평균 HAI 수준을 5배까지 증가시켰다.
실시예
10: 항체
이소타입
첨가된 애쥬번트로서 명반의 존재 또는 부재하에 식물-제조 H5 VLP 또는 재조합 가용성 H5를 투여한 마우스는 여러 가지 면역글로불린 이소타입을 나타낸다(도 23a).
애쥬번트를 첨가했을 때는 VLP 및 재조합 H5의 항체 이소타입 프로파일이 유사하며, IgG1이 우세한 이소타입이다. VLP 또는 재조합 H5를 애쥬번트를 첨가하지 않고 투여했을 때는 IgG1 반응이 감소하기는 하지만 VLP에 대해서 여전히 우세한 이소타입 반응이며, IgM, IgG2a, IgG2B 및 IgG3는 애쥬번트를 첨가했을 때와 유사한 역가를 유지한다. IgG1, IgG2a 및 IgG2b 역가는 애쥬번트를 첨가하지 않고 재조합 H5를 투여했을 때 현저히 감소한다(도 23a).
따라서, 이들 데이터는 식물-제조 VLP에서는 숙주에서 항체반응을 도출하기 위해 애쥬번트를 첨가할 필요가 없다는 것을 증명한다.
첨가된 항원의 존재하에 식물-제조 VLP 또는 가용성 재조합 HA를 근육내 투여한 마우스에서 불활성화된 전체 인플루엔자 바이러스 균주(A/Indonesia/5/05; A/ Vietnam/1203/04)에 대한 항체 역가를 도 23b에 예시한다. 1ug 또는 5ug VLP 또는 5ug 가용성 HA를 투여한 마우스에서 이들 인플루엔자 균주에 대한 항체 역가에 있어서 유의한 차이는 관찰되지 않는다.
실시예
11:
H5
VLP
백신에 의해 유도된 혈청 항체의 교차-반응성
상이한 균주의 불활성화된 전체 인플루엔자 바이러스에 대해 H5 VLP에 의해 유도된 혈청 항체의 교차-반응성을 평가했다. 모든 VLP 용량(0.1 내지 12μg)과 5μg의 대조군 HA 항원이 클레이드 1 균주(A/Vietnam/1194/04), 클레이드 2.1의 동종성 균주 A/Indonesia/5/05, 및 클레이드 2.2 균주 A/turkey/Turkey/1/05에 대해서 높은 결합 항체 역가를 유도했다(도 25a).
그러나, A/turkey/Turkey/1/05 균주에 대해서는 식물-제조 VLP만이 HAI 역가를 유도했다(도 25b). A/Indonesia/5/05에 대한 HAI 역가는 VLP에서 높았다.
실시예
12: 식물-제조
H5
VLP
를 사용한 면역화에 의해 부여된 교차-방어
설명된 2-용량 섭생에 따라서 A/Indonesia/5/05 H5 VLP를 미리 투여한 마우스를 이어서 인플루엔자 A/Turkey/582/06(H5N1)("Turkey H5N1") 감염성 바이러스로 비내 경로에 의해 시험감염시키고 관찰했다. 동물 당 투여된 용량은 10 LD50(4.09 X 105 CCID50)이었다.
시험감염 후 제7일까지 PBS 백신 대조군을 투여한 마우스의 단지 37.5%만이 Turkey H5N1에 노출된 후에 생존했다(도 26a). 대조군 항원(HA), 또는 1, 5 또는 15ug의 Indonesia H5 VLP를 투여한 동물의 100%가 실험 종료일인 시험감염 후 제17일까지 생존했다.
또한, 실험하는 동안 마우스의 체중을 모니터하고, 생존한 마우스의 평균 체중을 그래프화했다(도 26b). 시험감염 전에 1, 5 또는 15ug의 Indonesia H5 VLP를 투여한 마우스는 실험 과정 도중에 알아챌 만한 체중 손실이 없었으며, 특히 5ug의 VLP를 투여한 마우스는 체중이 상당히 증가한 것으로 나타난다. 음성 대조군 마우스(Turkey H5N1 시험감염 무)도 알아챌 만한 체중의 증가나 손실이 없었다. 양성 대조군 마우스(VLP를 투여하지 않고 Turkey H5N1로 시험감염)는 시험 과정 동안 상당한 체중 손실을 나타냈으며 이들 중 3마리는 죽었다. 체중은 코호트 내 전체 마우스의 평균이므로, "가장 위중한" 마우스(죽은 3마리)의 제거는 겉보기에 체중의 전체적인 증가를 가져올 수 있지만, 양성 대조군 코호트의 평균 체중은 음성 또는 VLP-처리 코호트보다 상당히 아래라는 점을 유의한다.
따라서, 이들 데이터는 H5 헤마글루티닌 바이러스 단백질을 포함하는 식물-제조 인플루엔자 VLP가 병원성 인플루엔자 균주에 특이적인 면역반응을 유도하며, 바이러스-유사 입자가 식물 원형질막으로부터 발아할 수 있다는 것을 증명한다.
따라서, 이들 데이터는 식물이 인플루엔자 바이러스-유사 입자를 생산할 수 있으며, 또한 바이러스-유사 입자가 식물 원형질막으로부터 발아할 수 있다는 것을 최초로 증명한다.
또한, 현재의 일시 발현 기술을 사용하여 표적 HA의 서열이 획득된 후 단지 16일 만에 최초의 항원 로트가 생산되었다. H5 VLP에 대한 현재의 수율에서 전형적인 용량을 피험체 당 5μg이라 하면 침윤된 잎의 매 kg 당 약 20,000의 백신 용량을 생산할 수 있다. 플랫폼의 간단함, 상승한 용량 및 강력한 면역원성의 이런 독특한 조합은 다른 구체예들 중에서도 특히 대유행에 관련한 새로운 대응 방법을 제공한다.
실시예
13: 크기 배제 크로마토그래피에 의한 식물 추출물 중의
헤마글루티
닌-함유 (
H1
,
H2
,
H3
,
H5
,
H6
및
H9
) 구조의 특성화
겔 여과에 의해서 식물에서 생산된 상이한 서브타입의 인플루엔자 헤마글루티닌의 고 분자량 구조로의 회합을 평가했다. AGL1/660-, AGL1/540-, AGL1/783-, AGL1/780-, AGL1/785- 및 AGL1/790-침윤된 식물로부터의 조 단백질 또는 농축 단백질 추출물(1.5mL)을 Sephacryl™ S-500 HR 칼럼(GE Healthcare Bio-Science Corp., Piscataway, NJ, USA)에서 크기 배제 크로마토그래피(SEC)에 의해 분별했다. 도 46에 도시된 대로, 블루 덱스트란(2MDa) 용출은 분획 10에서 이른 피크를 나타냈다. 각 SEC 용출 분획 200μL로부터 단백질을 아세톤-침전에 의해 농축(5배)하여 웨스턴 블롯팅에 의해서 분석했을 때(도 46), 헤마글루티닌은 주로 분획 7 내지 14에서 발견되었으며, 이것은 HA가 VLP로 편입된 것을 나타낸다. 이론과 결부시키고 싶지는 않지만, 이것은 HA 단백질이 생산된 서브타입과는 무관하게 커다란 수퍼구조로 회합되었거나, 또는 고 분자량 구조에 부착된 것을 시사한다. 도 46에서, 균주 A/New Caledonia/20/1999 유래의 H1 및 균주 A/Brisbane/10/2007 유래의 H3이 PDI 신호 펩티드-함유 카세트를 사용하여 생산되었다. 얻어진 결과는 자주개자리 PDI의 신호 펩티드에 의한 자생 신호 펩티드의 치환이 입자로 조립되는 HA의 능력에 영향을 미치지 않은 것을 나타낸다.
실시예
14: 야생형 뉴클레오티드 서열을 사용한
N.
benthamiana
식물에서
아그로
-침윤에 의한 계절 인플루엔자 바이러스
헤마글루티닌의
일시 발현
균주 A/Brisbane/59/2007(H1N1)(플라스미드 #774), A/New Caledonia/20/1999 (H1N1)(플라스미드 #540) 및 A/Solomon Islands/3/2006(H1N1)(플라스미드 #775)으로부터 H1 서브타입, 균주 A/Brisbane/10/2007(플라스미드 #776) 및 A/Wisconsin/ 67/2005(플라스미드 #777)로부터 H3 서브타입, 그리고 균주 B/Malaysia/2506/2004 (Victoria 계통)(플라스미드 #778) 및 B/Florida/4/2006(Yamagata 계통)(플라스미드 #779)로부터 B 타입의 발현을 통해 계절 인플루엔자 헤마글루티닌을 생산하는 일시 발현 시스템의 능력을 측정했다. 먼저 플라스토시아닌 발현 카세트 - 자주개자리 플라스토시아닌 유전자로부터의 프로모터, 5'UTR, 3'UTR 및 전사 종결 서열 - 에서 헤마글루티닌 유전자 코딩 서열을 조립하고, 조립된 카세트를 pCAMBIA 바이너리 플라스미드에 삽입했다. 다음에, 이 플라스미드들을 Agrobacterium(AGL1)에서 트랜스펙션하여, Agrobacterium 균주인 AGL1/774, AGL1/540, AGL1/775, AGL1/776, AGL1/777, AGL1/778 및 AGL1/779를 각각 만들었다.
N. benthamiana 식물을 AGL1/774, AGL1/540, AGL1/775, AGL1/776, AGL1/777, AGL1/778 및 AGL1/779로 침윤시키고, 잎을 수거하여 6일간 인큐베이션했다. 아그로-침윤된 잎에 H1이 축적되었는지 결정하기 위해, 먼저 침윤된 잎 조직으로부터 단백질을 추출한 다음, 항-H1 항체를 사용하여 웨스턴 블롯팅에 의해 분석했다(각 HA 서브타입의 검출에서 사용된 항체 및 조건에 대해서는 표 6을 참조한다). H1 균주 유래의 HA에 대해서, 약 72kDa에서 독특한 밴드가 추출물에서 검출되었는데(도 47), 이것은 인플루엔자 헤마글루티닌의 미절단 HA0 형태의 크기에 해당한다. 이로써 침윤된 잎에서 상이한 연례적인 유행성 균주의 헤마글루티닌의 발현이 미절단 번역 산물의 축적을 가져온다는 것이 증명되었다. 이들 발현 및 면역검출 전략을 이용해서는 H3 서브타입 또는 B 타입 유래의 인플루엔자 HA의 발현은 조 단백질 추출물에서 검출되지 않았다(도 47).
실시예 15: 야생형 뉴클레오티드 서열을 사용한 N. benthamiana 식물에서 아그로-침윤에 의한 잠재적 대유행 인플루엔자 바이러스 헤마글루티닌의 일시 발현
균주 A/Anhui/1/2005(H5N1)(플라스미드 #781), A/Indonesia/5/2005(H5N1)(플라스미드 #660) 및 A/Vietnam/1194/2004(H5N1)(플라스미드 #782)에서 H5 서브타입, 균주 A/Singapore/1/1975(H2N2)(플라스미드 #780)에서 H2 서브타입, 균주 A/Teal/ Hong Kong/W312/1997(H6N1)(플라스미드 #783)에서 H6, 균주 A/Equipe/Prague/1956 (H7N7)(플라스미드 #784)에서 H7, 그리고 마지막으로 균주 A/Hong Kong/1073/1999 (H9N2)(플라스미드 #785)에서 H9의 발현을 통해 잠재적 인플루엔자 헤마글루니틴을 생산하는 일시 발현 시스템의 능력을 측정했다. 먼저 플라스토시아닌 발현 카세트 - 자주개자리 플라스토시아닌 유전자로부터의 프로모터, 5'UTR, 3'UTR 및 전사 종결 서열 - 에서 헤마글루티닌 유전자 코딩 서열을 조립하고, pCMABIA 바이너리 플라스미드에 조립된 카세트를 삽입했다. 다음에, 이 플라스미드들을 Agrobacterium (AGL1)에서 트랜스펙션하여, Agrobacterium 균주인 AGL1/781, AGL1/660, AGL1/782, AGL1/780, AGL1/783, AGL1/784 및 AGL1/785를 각각 만들었다.
N. benthamiana 식물을 AGL1/781, AGL1/660, AGL1/782, AGL1/780, AGL1/783, AGL1/784 및 AGL1/785로 침윤시키고, 잎을 수거하여 6일간 인큐베이션했다. 아그로-침윤된 잎에 H5가 축적되었는지 결정하기 위해, 먼저 침윤된 잎 조직으로부터 단백질을 추출한 다음, 적합한 항-H5 항체를 사용하여 웨스턴 블롯팅에 의해 분석했다(각 HA 서브타입의 검출에서 사용된 항체 및 조건에 대해서는 표 6을 참조한다). H5 및 H2 발현 구성물로 형질전환된 식물의 추출물에서는 약 72kDa에서 독특한 밴드가 검출되었는데(도 48a 및 b), 이것은 인플루엔자 헤마글루티닌의 미절단 HA0 형태의 크기에 해당한다. 이로써 침윤된 잎에서 상이한 잠재적 대유행 균주의 헤마글루티닌의 발현이 미절단 번역 산물의 축적을 가져온다는 것이 증명되었다. 이들 발현 및 면역검출 전략을 이용해서는 H7 및 H9 유래의 인플루엔자 HA의 발현은 조 단백질 추출물에서 검출되지 않았다(도 48b).
실시예
16:
N.
tabacum
식물에서
아그로
-침윤에 의한
H5
의 일시 발현
균주 A/Indonesia/5/2005(H5N1)(플라스미드 #660)으로부터 H5 서브타입의 발현을 통해 Nicotiana tabacum의 잎에서 인플루엔자 헤마글루티닌을 생산하는 일시 발현 시스템의 능력을 분석했다. 먼저 플라스토시아닌 발현 카세트 - 자주개자리 플라스토시아닌 유전자로부터의 프로모터, 5'UTR, 3'UTR 및 전사 종결 서열 - 에서 헤마글루티닌 유전자 코딩 서열을 조립하고, 조립된 카세트를 pCMABIA 바이너리 플라스미드에 삽입했다. 다음에, 이 플라스미드를 Agrobacterium(AGL1)에서 트랜스펙션하여 균주 AGL1/660을 만들었다.
N. tabacum 식물을 AGL1/660으로 침윤시키고, 잎을 수거하여 6일간 인큐베이션했다. 아그로-침윤된 잎에 H5가 축적되었는지 결정하기 위해, 먼저 침윤된 잎으로부터 단백질을 추출한 다음, 항-H5 항체를 사용하여 웨스턴 블롯팅에 의해 분석했다. 추출물에서는 약 72kDa에서 독특한 밴드가 검출되었는데(도 49), 이것은 인플루엔자 헤마글루티닌의 미절단 HA0 형태의 크기에 해당한다. 이로써 침윤된 N. tabacum 잎에서 헤마글루티닌의 발현이 미절단 HA0 전구체의 축적을 가져온다는 것이 증명되었다.
실시예
17:
흰족제비에서
A/
Indonesia
/5/05(
H5N1
)로부터 식물-제조
H5N1
VLP
백신의 면역원성
흰족제비에서 용량의 단계적 확대 연구를 수행하여 식물 유래 VLP의 면역원성을 평가했다. 1차 백신 용량 후 제14일(도 50a), 그리고 2차 용량 후 제14일(도 50b)에 채집한 혈청을 사용하여 세 가지 다른 H5N1 균주 - A/turkey/Turkey/1/05 (clade 2.2), A/Vietnam/1194/04(clade 1) 및 A/Anhui/5/05(모두 불활성화된 전체 바이러스)의 혈구응집 억제에 의하여 3개 용량(1, 5 및 15ug)의 H5 VLP 백신에 의해 유도된 혈청 항체의 시험관내 교차-반응성을 평가했다. 3개 용량 농도 모두에서 교차-반응성이 관찰된다.
실시예
18:
CHMP
기준에 따른 면역원성 결과의 분석
인체용 의약품에 대한 EMEA 위원회(CHMP)(http://www.emea.europa.eu/htms/ general/contacts/CHMP/CHMP.html)는 백신 효능에 대해 세 가지 기준(2차 용량 후 적용됨)을 설정하고 있다: 1 - 혈청전환의 수 또는 HI 역가의 상당한 증가(4배) > 40%; 2 - 적어도 2.5의 평균 기하 증가; 3 - 1/40의 HI 역가를 달성한 피험체의 비율이 적어도 70%여야 한다. 흰족제비 모델에서 이들 기준을 분석한 것을 표 8-11에 나타낸다. (*)는 CHMP 기준을 충족하거나 초과한 것을 표시한다. 라이센스를 위한 CHMP 기준과 관련된 교차-면역원성 분석에 대한 요약은 표 12에 나타낸다.
동물의 체중, 체온 및 전반적인 상태를 매일 평가했다. 연구하는 동안 질병이나 불편함의 징후는 기록되지 않았다. 연구 동안 체중 및 체온은 정상 범위 내였다. 백신은 안전하고 동물에 의해 허용되었다.
실시예
19:
헤마글루티닌
뉴클레오티드 서열의 선택
HA의 뉴클레오티드 서열을 인플루엔자 서열 데이터베이스(URL: flu.lanl.gov 참조), 또는 NCBI 인플루엔자 바이러스 리소스(Bao et al., 2008, J. Virology 82 (2): 596-601; URL: ncbi.n.m.hih.gov/genomes/FLU /FLU.html 참조)에서 검색했다. HA 핵산 서열 중 몇 개에 대하여 복수 엔트리가 데이터베이스에 나열된다(표 13). 일부 변이는 배양 시스템과 주로 관련된다(기원 - MDCK, 난, 불명, 바이러스 RNA/임상 분리물); 예를 들어, HA의 위치 194(성숙 단백질 넘버링)에 글리코실화 부위가 부재한다면, 난의 요막액에서 B 타입 인플루엔자 바이러스가 발현된다(Chen et al., 2008 참조). 일부 서열에는 도메인이 부재할 수 있다(예를 들어, 불완전 클론, 인공산물 서열화 등). 인플루엔자 헤마글루티닌의 도메인 및 서브도메인은 설명 단락에서 일반적으로 논의된다. 제 1 서열의 도메인 또는 서브도메인은 제 2의 기존 서열의 도메인과 조합될 수 있는데, 예를 들어 제 1 균주 서열의 신호 펩티드가 제 2 균주로부터의 헤마글루티닌 코딩 서열의 나머지와 조합되어 완전한 코딩 서열을 제공할 수 있다.
균주: A/
Solomon
Islands
/3/2006로부터의
H1
8개 아미노산 서열을 비교하여 변이를 확인했다(표 14). 일부 서열에서 위치 171에 글리신(G) 또는 아르기닌(R)의 변이가 나타났다.
균주: A/
Brisbane
/59/2007로부터의
H1
위치 203에서 아스파르트산(D), 이소로이신(I) 또는 아스파라긴(N)의 변이가 나타났다.
균주: A/
Brisbane
/10/2007로부터의
H3
5개 위치에서 서열 변이가 관찰되었다(표 15). 2개의 샘플링한 서열에서 위치 215에 결실이 관찰된다.
균주: A/
Wisconsin
/67/2005로부터의
H3
이 균주에서는 4개 위치에서 서열 변이가 관찰되었다(표 16).
균주: B/
Malaysia
/2506/2004로부터의 B
2개 위치에서 변이가 관찰된다(표 17). 위치 120이 글리코실화 부위가 아니고, 위치 210이 글리코실화에 연루된다. 이 글리코실화는 난에서의 배양 후 없어진다.
균주: B/
Florida
/4/2006으로부터의
헤마글루티닌
;
ISDN261649
관찰된 변이는 배양 시스템에 따라서 위치 211에 아미노산 서열 변이를 포함한다. MDCK 세포로부터 분리된 서열에서는 아스파라긴(N)이 발견되고, 난으로부터 분리된 서열에서는 글루탐산(D)이 발견된다. 위치 211이 글리코실화 부이이며, 이것은 난에서의 배양 후 없어진다.
균주: A/
Singapore
/1/1957로부터의
H2
6개 위치에서 서열 변이가 관찰되었다(표 18).
균주: A/
Vietnam
/1194/2004로부터의
H5
및 A/
Anhui
/1/2005로부터의
H5
이들 H5 균주 모두 1차 서열의 정렬시 아미노산 서열에 변이가 관찰되지 않았다.
균주: A/
Teal
/
Hong
Kong
/
W312
/1997로부터의
H6
균주에 대해 단지 하나의 엔트리를 이용할 수 있었다(AF250179).
균주: A/
Equine
/
Prague
/56로부터의
H7
데이터베이스에서 총 2개의 서열 엔트리를 찾았다. 연구실 재조합이 필요하므로 엔트리 AB298877은 제외했다.
균주: A/
Hong
Kong
/1073/1999로부터의
H9
;
AJ404626
데이터베이스에서 총 2개의 서열 엔트리를 찾았다. 단지 1개만 완전했다.
실시예 20: 식물 분비 단백질 유래의 신호 펩티드에 융합된 인플루엔자 바이러스 헤마글루티닌의 일시 발현
또한, 자주개자리 단백질 이황화물 이소머라제(PDI; Accession No. Z11499; SEQ ID NO:34; 도 17)의 신호 펩티드(SP; 뉴클레오티드 32-103)에 융합된 균주 A/ Brisbane/59/2007(H1N1)(플라스미드 #787), A/New Caledonia/20/1999(H1N1)(플라스미드 #540), 균주 A/Brisbane/10/2007(H3N2)(플라스미드 #790) 및 A/Indonesia/5/ 2005(H5N1)(플라스미드 #663)로부터 A 서브타입 HA, 그리고 균주 B/Florida/4/2006 (plasmid #798)로부터 B 타입의 발현을 통해 다른 헤마글루티닌의 HA 축적 수준에 대한 신호 펩티드 변경 효과를 조사했다. 플라스토시아닌 발현 카세트 - 자주개자리 플라스토시아닌 유전자로부터의 프로모터, 5'UTR, 3'UTR 및 전사 종결 서열 - 에서 PDI SP-헤마글루티닌 유전자 융합체를 조립하고, pCMABIA 바이너리 플라스미드에 조립된 카세트를 삽입했다. 다음에, 이 플라스미드들을 Agrobacterium(AGL1)에서 트랜스펙션하여, Agrobacterium 균주인 AGL1/787, AGL1/540, AGL1/790, AGL1/ 663 및 AGL1/798를 각각 만들었다.
AGL1/787, AGL1/540, AGL1/790, AGL1/663 및 AGL1/798로 N. benthamiana 식물을 침윤시켰다. 병행하여, 비교를 위해 일련의 식물을 AGL1/774, AGL776, AGL1/ 660 및 AGL1/779로 침윤시켰다. 6일의 인큐베이션 기간 후에 잎을 수거하고, 침윤된 잎으로부터 단백질을 추출하여, 적합한 항-HA 항체를 사용하여 웨스턴 블롯에 의해 분석했다. 자생 신호 펩티드를 가진 동일한 HA에서 관찰된 발현과 비교하여 PDI로부터의 SP를 사용해서는 H1/Brisbane 및 H3/Brisbane으로부터 HA의 발현이 상당히 개선되었다(각각 도 87b 및 c). 서브타입 H1(균주 A/New Caledonia/20/1999)로부터 세 번째 HA의 발현이 이 SP 치환 전략을 이용하여 확인되었다(도 87a). 신호 펩티드의 변경은 H5(A/Indonesia/5/2005)에 대해서는 HA 축적의 실질적인 증가를 유도하지 않았으며(도 87d), 발현에 사용된 신호 펩티드와 상관없이 균주 B/ Florida/4/2006로부터의 HA에 대해서는 어떤 신호도 검출되지 않았다(도 87e). HA의 발현이 검출된 모든 조건에서, 약 72kDa의 분자량에서 독특한 면역반응 밴드가 관찰되었는데(도 87a 내지 d), 이것은 미절단 HA0 전구체의 크기에 해당한다.
실시예
21:
CPMV
-
HY
발현 카세트 제어하의
HA
발현
동부 모자이크병 바이러스(CPMV) RNA2로부터의 미번역 서열을 포함하는 발현 카세트 CPMV-HT(Sainsbury et al. 2008 Plant Physiology 148:1212-1218; 또한 WO 2007/135480 참조)를 트랜스제닉 식물에서 어떤 헤마글루티닌의 발현에 사용했다. A/New Caledonia/20/1999(H1), A/Brisbane/59/2007(H1), A/Brisbane/10/2007(H3), A/Indonesia/5/2005(H5) 및 B/Florida/4/2006(B)로부터의 HA를 설명된 대로 아그로-침윤된 N. benthamiana 식물에서 CPMV-HT의 제어하에 발현시켰다. 인큐베이션 후 잎을 수거하고 추출하여, 단백질 추출물 중의 HA 함량을 웨스턴 블롯에 의해 비교했다. 도 88에 나타낸 대로, CPMV-HT 발현 카세트는 사용된 신호 펩티드와 상관없이 플라스토시아닌 카세트보다 더욱 높은 HA 발현 수준을 유도했다. 또한, 균주 B/Florida/4/2006로부터의 B에 대해서는, CPMV-HT 발현 카세트의 사용이 플라스토시아닌 카세트에서 발현되었을 때는 이들 면역검출 조건에서 검출되지 않은 채로 있었던 HA 축적의 검출을 허용했다.
실시예
22: 신호 펩티드 변경과 조합된
Hsp70
및
Hsp40
과의 공-발현
식물 기원의 시토졸 Hsp70 및 Hsp40(구성물 번호 R870)을 둘 다 식물 기원의 신호 펩티드(자주개자리 PDI 신호 펩티드)를 보유한 H1 New Caledonia(구성물 번호 540) 또는 H3 Brisbane(구성물 번호 790)과 함께 공-발현시켰다. AGL1/540, AGL1/ R870, AGL1/35SHcPro(H1에 대해) 또는 AGL1/790, AGL1/R870 및 AGL1/35SHcPro(H3에 대해)의 혼합물(1:1:1 비율)을 함유하는 박테리아 현탁액으로 N. benthamiana 식물을 아그로-침윤시켜 공-발현을 수행하였다. 대조군 식물은 AGL1/540, AGL1/35SHc Pro(H1에 대해) 또는 AGL1/790, AGL1/35SHcPro(H3에 대해)의 혼합물(1:2 비율)로 아그로-침윤시켰다. 인큐베이션 후 잎을 수거하고 추출하여, 단백질 추출물 중의 HA 함량을 웨스턴 블롯에 의해 비교했다(도 89). 시험된 조건에서 얻어진 결과는 Hsp70 및 Hsp40의 공-발현이 H1 New Caledonia에서 헤마글루티닌 축적 수준을 증가시키지 않았다는 것을 나타낸다. 그러나, H3 Brisbane에 대해서는, 시토졸 Hsp70 및 Hsp40의 공-발현이 헤마글루티닌 축적 수준에 상당한 증가를 가져왔음이 웨스턴 블롯에 의해 분명히 나타났다.
실시예
23
2
X35S
/
CPMV
-
HT
발현 카세트의 제어하에
H1
A/
California
/04/09의 발현
CPMV-HT 발현 카세트를 사용하여 설명된 대로 아그로 침윤된 N. benthamiana 식물에서 H1 A/California/04/09(구성물 # 560, 도 90, 98)를 또한 발현시켰다. 2일간 인큐베이션한 후, 잎들을 수거하고 추출한 다음, 단백질 추출물 중의 HA 함량을 웨스턴 블롯에 의해 비교했다. 도 91에 나타낸 대로, CPMV-HT 발현 카세트는 침윤 2일째에 상당한 HA 발현을 유도했다. 식물에서 HA 발현으로부터 생산된 VLP는 적혈구의 응집을 증명한다.
모든 인용문헌은 본원에 참고자료로 포함된다.
본 발명은 하나 이상의 구체예에 관하여 설명되었다. 그러나, 청구항에 한정 본 발명의 범위로부터 벗어나지 않고 다수의 변화 및 변형이 만들어질 수 있다는 것이 당업자에게 분명할 것이다.
참고자료
SEQUENCE LISTING
<110> Medicago Inc.
D'AOUST, Marc-Andre;
COUTURE, Manon
ORS, Frederic
TREPANIER, Sonia
LAVOIE, Pierre-Olivier
DARGIS, Michele
VEZINA, Louis-Philippe
LANDRY, Nathalie
<120> Influenza Virus-Like Particles (VLPS) Comprising Hemagglutinin
<130> V81270WO2
<140> PCT/CA2009/000926
<141> 2009-07-02
<150> PCT/CA2008/001281
<151> 2008-07-11
<150> PCT/CA2008/000032
<151> 2009-01-12
<160> 146
<170> PatentIn version 3.4
<210> 1
<211> 1556
<212> DNA
<213> Influenza virus
<400> 1
agatcttcgc tgacacaata tgtataggct accatgccaa caactcaacc gacactgttg 60
acacagtact tgagaagaat gtgacagtga cacactctgt caacctactt gaggacagtc 120
acaatggaaa actatgtcta ctaaaaggaa tagccccact acaattgggt aattgcagcg 180
ttgccggatg gatcttagga aacccagaat gcgaattact gatttccaag gaatcatggt 240
cctacattgt agaaacacca aatcctgaga atggaacatg ttacccaggg tatttcgccg 300
actatgagga actgagggag caattgagtt cagtatcttc atttgagaga ttcgaaatat 360
tccccaaaga aagctcatgg cccaaccaca ccgtaaccgg agtatcagca tcatgctccc 420
ataatgggaa aagcagtttt tacagaaatt tgctatggct gacggggaag aatggtttgt 480
acccaaacct gagcaagtcc tatgtaaaca acaaagagaa agaagtcctt gtactatggg 540
gtgttcatca cccgcctaac atagggaacc aaagggcact ctatcataca gaaaatgctt 600
atgtctctgt agtgtcttca cattatagca gaagattcac cccagaaata gccaaaagac 660
ccaaagtaag agatcaggaa ggaagaatca actactactg gactctgctg gaacctgggg 720
atacaataat atttgaggca aatggaaatc taatagcgcc atggtatgct tttgcactga 780
gtagaggctt tggatcagga atcatcacct caaatgcacc aatggatgaa tgtgatgcga 840
agtgtcaaac acctcaggga gctataaaca gcagtcttcc tttccagaat gtacacccag 900
tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa attaaggatg gttacaggac 960
taaggaacat cccatccatt caatccagag gtttgtttgg agccattgcc ggtttcattg 1020
aaggggggtg gactggaatg gtagatgggt ggtatggtta tcatcatcag aatgagcaag 1080
gatctggcta tgctgcagat caaaaaagta cacaaaatgc cattaacggg attacaaaca 1140
aggtcaattc tgtaattgag aaaatgaaca ctcaattcac agctgtgggc aaagagttca 1200
acaaattgga aagaaggatg gaaaacttaa ataaaaaagt tgatgatggg tttctagaca 1260
tttggacata taatgcagaa ttgttggttc tactggaaaa tgaaaggact ttggatttcc 1320
atgactccaa tgtgaagaat ctgtatgaga aagtaaaaag ccaattaaag aataatgcca 1380
aagaaatagg aaacgggtgt tttgagttct atcacaagtg taacaatgaa tgcatggaga 1440
gtgtgaaaaa tggtacctat gactatccaa aatattccga agaatcaaag ttaaacaggg 1500
agaaaattga tggagtgaaa ttggaatcaa tgggagtata ctaagagctc aggcct 1556
<210> 2
<211> 219
<212> DNA
<213> Influenza virus
<400> 2
ggtacctatg actatccaaa atattccgaa gaatcaaagt taaacaggga gaaaattgat 60
ggagtgaaat tggaatcaat gggagtatac cagattctgg cgatctactc aactgtcgcc 120
agttccctgg ttcttttggt ctccctgggg gcaatcagct tctggatgtg ttccaatggg 180
tctttgcagt gtagaatatg catctaagag ctcaggcct 219
<210> 3
<211> 1719
<212> DNA
<213> Influenza virus
<400> 3
aagcttatgg agaaaatagt gcttcttctt gcaatagtca gtcttgttaa aagtgatcag 60
atttgcattg gttaccatgc aaacaattca acagagcagg ttgacacaat catggaaaag 120
aacgttactg ttacacatgc ccaagacata ctggaaaaga cacacaacgg gaagctctgc 180
gatctagatg gagtgaagcc tctaatttta agagattgta gtgtagctgg atggctcctc 240
gggaacccaa tgtgtgacga attcatcaat gtaccggaat ggtcttacat agtggagaag 300
gccaatccaa ccaatgacct ctgttaccca gggagtttca acgactatga agaactgaaa 360
cacctattga gcagaataaa ccattttgag aaaattcaaa tcatccccaa aagttcttgg 420
tccgatcatg aagcctcatc aggagttagc tcagcatgtc catacctggg aagtccctcc 480
ttttttagaa atgtggtatg gcttatcaaa aagaacagta catacccaac aataaagaaa 540
agctacaata ataccaacca agaggatctt ttggtactgt ggggaattca ccatcctaat 600
gatgcggcag agcagacaag gctatatcaa aacccaacca cctatatttc cattgggaca 660
tcaacactaa accagagatt ggtaccaaaa atagctacta gatccaaagt aaacgggcaa 720
agtggaagga tggagttctt ctggacaatt ttaaaaccta atgatgcaat caacttcgag 780
agtaatggaa atttcattgc tccagaatat gcatacaaaa ttgtcaagaa aggggactca 840
gcaattatga aaagtgaatt ggaatatggt aactgcaaca ccaagtgtca aactccaatg 900
ggggcgataa actctagtat gccattccac aacatacacc ctctcaccat cggggaatgc 960
cccaaatatg tgaaatcaaa cagattagtc cttgcaacag ggctcagaaa tagccctcaa 1020
agagagagca gaagaaaaaa gagaggacta tttggagcta tagcaggttt tatagaggga 1080
ggatggcagg gaatggtaga tggttggtat gggtaccacc atagcaatga gcaggggagt 1140
gggtacgctg cagacaaaga atccactcaa aaggcaatag atggagtcac caataaggtc 1200
aactcaatca ttgacaaaat gaacactcag tttgaggccg ttggaaggga atttaataac 1260
ttagaaagga gaatagagaa tttaaacaag aagatggaag acgggtttct agatgtctgg 1320
acttataatg ccgaacttct ggttctcatg gaaaatgaga gaactctaga ctttcatgac 1380
tcaaatgtta agaacctcta cgacaaggtc cgactacagc ttagggataa tgcaaaggag 1440
ctgggtaacg gttgtttcga gttctatcac aaatgtgata atgaatgtat ggaaagtata 1500
agaaacggaa cgtacaacta tccgcagtat tcagaagaag caagattaaa aagagaggaa 1560
ataagtgggg taaaattgga atcaatagga acttaccaaa tactgtcaat ttattcaaca 1620
gtggcgagtt ccctagcact ggcaatcatg atggctggtc tatctttatg gatgtgctcc 1680
aatggatcgt tacaatgcag aatttgcatt taagagctc 1719
<210> 4
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> primer Plasto-443c
<400> 4
gtattagtaa ttagaatttg gtgtc 25
<210> 5
<211> 44
<212> DNA
<213> Artificial sequence
<220>
<223> primer SpHA(Ind)-Plasto.r
<400> 5
gcaagaagaa gcactatttt ctccattttc tctcaagatg atta 44
<210> 6
<211> 45
<212> DNA
<213> Artificial sequence
<220>
<223> primer SpHA(Ind)-Plasto.r
<400> 6
ttaatcatct tgagagaaaa tggagaaaat agtgcttctt cttgc 45
<210> 7
<211> 38
<212> DNA
<213> Artificial sequence
<220>
<223> primer HA(Ind)-Sac.r
<400> 7
actttgagct cttaaatgca aattctgcat tgtaacga 38
<210> 8
<211> 1471
<212> DNA
<213> Artificial sequence
<220>
<223> alfalfa plastocyanin-based expression cassette
<400> 8
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt 1020
ttcggcttat tgttttctct tcttgtgttg gttccttctc agatctgagc tctaagttaa 1080
aatgcttctt cgtctcctat ttataatatg gtttgttatt gttaattttg ttcttgtaga 1140
agagcttaat taatcgttgt tgttatgaaa tactatttgt atgagatgaa ctggtgtaat 1200
gtaattcatt tacataagtg gagtcagaat cagaatgttt cctccataac taactagaca 1260
tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac taaaattgaa catcttttgc 1320
cacaacttta taagtggtta atatagctca aatatatggt caagttcaat agattaataa 1380
tggaaatatc agttatcgaa attcattaac aatcaactta acgttattaa ctactaattt 1440
tatatcatcc cctttgataa atgatagtac a 1471
<210> 9
<211> 565
<212> PRT
<213> Influenza virus
<400> 9
Met Lys Ala Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr
1 5 10 15
Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr
20 25 30
Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn
35 40 45
Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile
50 55 60
Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly
65 70 75 80
Asn Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile
85 90 95
Val Glu Thr Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Tyr Phe
100 105 110
Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe
115 120 125
Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr
130 135 140
Val Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Lys Ser Ser Phe
145 150 155 160
Tyr Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn
165 170 175
Leu Ser Lys Ser Tyr Val Asn Asn Lys Glu Lys Glu Val Leu Val Leu
180 185 190
Trp Gly Val His His Pro Pro Asn Ile Gly Asn Gln Arg Ala Leu Tyr
195 200 205
His Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg
210 215 220
Arg Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu
225 230 235 240
Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile
245 250 255
Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Phe Ala
260 265 270
Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Thr Ser Asn Ala Pro Met
275 280 285
Asp Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser
290 295 300
Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro
305 310 315 320
Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn
325 330 335
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
340 345 350
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
355 360 365
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr
370 375 380
Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu
385 390 395 400
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu
405 410 415
Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu
420 425 430
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
435 440 445
Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
450 455 460
Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
465 470 475 480
Phe Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys
485 490 495
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn
500 505 510
Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln
515 520 525
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val
530 535 540
Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln
545 550 555 560
Cys Arg Ile Cys Ile
565
<210> 10
<211> 568
<212> PRT
<213> Influenza virus
<400> 10
Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser
1 5 10 15
Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val
20 25 30
Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile
35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys
50 55 60
Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn
65 70 75 80
Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val
85 90 95
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly Ser Phe Asn
100 105 110
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu
115 120 125
Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser
130 135 140
Ser Gly Val Ser Ser Ala Cys Pro Tyr Leu Gly Ser Pro Ser Phe Phe
145 150 155 160
Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile
165 170 175
Lys Lys Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp
180 185 190
Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Arg Leu Tyr Gln
195 200 205
Asn Pro Thr Thr Tyr Ile Ser Ile Gly Thr Ser Thr Leu Asn Gln Arg
210 215 220
Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly
225 230 235 240
Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn
245 250 255
Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile
260 265 270
Val Lys Lys Gly Asp Ser Ala Ile Met Lys Ser Glu Leu Glu Tyr Gly
275 280 285
Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser
290 295 300
Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys
305 310 315 320
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser
325 330 335
Pro Gln Arg Glu Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile
340 345 350
Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr
355 360 365
Gly Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys
370 375 380
Glu Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser
385 390 395 400
Ile Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe
405 410 415
Asn Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp
420 425 430
Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met
435 440 445
Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu
450 455 460
Tyr Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly
465 470 475 480
Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu
485 490 495
Ser Ile Arg Asn Gly Thr Tyr Asn Tyr Pro Gln Tyr Ser Glu Glu Ala
500 505 510
Arg Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly
515 520 525
Thr Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala
530 535 540
Leu Ala Ile Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly
545 550 555 560
Ser Leu Gln Cys Arg Ile Cys Ile
565
<210> 11
<211> 1629
<212> DNA
<213> Influenza virus
<400> 11
gacaaaatat gtcttgggca ccatgctgtg gcaaatggaa caaaagtgaa cacattaaca 60
gagaggggga ttgaagtagt gaacgccaca gagacggtgg aaactgcgaa tatcaagaaa 120
atatgtattc aagggaaaag gccaacagat ctgggacaat gtggacttct aggaacccta 180
ataggacctc cccaatgtga tcaattcctg gagttttact ctgatttgat aattgagcga 240
agagaaggaa ccgatgtgtg ctatcccggt aaattcacaa atgaagaatc actgaggcag 300
atccttcgag ggtcaggagg aattgataag gagtcaatgg gtttcaccta tagtggaata 360
agaaccaatg gagcgacaag tgcctgcaaa agatcaggtt cttctttcta tgcagagatg 420
aagtggttgc tgtcgaattc agacaatgcg gcattccctc aaatgacaaa gtcgtataga 480
aatcccagaa acaaaccagc tctgataatt tggggagttc atcactctgg atcggttagc 540
gagcagacca aactctatgg aagtggaaac aagttgataa cagtaggaag ctcaaaatac 600
cagcaatcat tcaccccaag tccgggagca cggccacaag tgaatggaca atcagggaga 660
atcgattttc actggctact ccttgatccc aatgacacag tgaccttcac tttcaatggg 720
gcattcatag cccctgacag ggcaagtttc tttagaggag aatcactagg agtccagagt 780
gatgttcctc tggattctag ttgtggaggg gattgctttc acagtggggg tacgatagtc 840
agttccctgc cattccaaaa catcaaccct agaactgtgg ggagatgccc tcggtatgtc 900
aaacagacaa gcctcctttt ggctacagga atgagaaatg ttccagagaa tccaaagccc 960
agaggccttt ttggagcaat tgctggattc atagagaatg gatgggaggg tctcatcgat 1020
ggatggtatg gtttcagaca tcaaaatgca caaggggaag gaactgcagc tgactacaaa 1080
agcacccaat ctgcaataga tcagatcaca ggcaaattga atcgtctgat tgacaaaaca 1140
aatcagcagt ttgagctgat agacaatgag ttcaatgaga tagaacaaca aataggaaat 1200
gtcattaatt ggacacgaga cgcaatgact gaggtatggt cgtataatgc tgagctgttg 1260
gtggcaatgg aaaatcagca tacaatagat cttgcggact cagaaatgaa caaactttat 1320
gagcgtgtca gaaaacaact aagggagaat gctgaagaag atggaactgg atgttttgag 1380
atattccata agtgtgatga tcagtgcatg gagagcataa ggaacaacac ttatgaccat 1440
actcaataca gaacagagtc attgcagaat agaatacaga tagacccagt gaaattgagt 1500
agtggataca aagacataat cttatggttt agcttcgggg catcatgttt tcttcttcta 1560
gccgttgtaa tgggattggt tttcatttgc ataaagaatg gaaacatgcg gtgcaccatt 1620
tgtatataa 1629
<210> 12
<211> 1773
<212> DNA
<213> Influenza virus
<400> 12
agcaaaagca ggggttatac catagacaac caaaggcaag acaatggcca tcatttatct 60
aattcttctg ttcacagcag tgagagggga ccaaatatgc attggatacc attccaacaa 120
ttccacagaa aaggttgaca caatcctaga gagaaatgtc actgtgactc acgctgagga 180
cattcttgag aagactcaca atgggaagtt atgcaaacta aatggaatcc ctccacttga 240
attaagggat tgcagcattg ccggatggct ccttgggaat ccagaatgtg atatacttct 300
aactgtgcca gaatggtcat acataataga aaaagaaaat ccaaggaacg gcttgtgcta 360
cccaggcagt ttcaatgatt atgaagaatt gaagcatctt atcagcagcg tgacacattt 420
tgagaaagta aagattctgc ccagaaatga atggacacag catacaacaa ctggaggttc 480
acaggcttgc gcagactatg gtggtccgtc attcttccgg aacatggtct ggttgacaaa 540
gaaagggtcg aattatccaa ttgccaaaag atcttacaac aatacaagtg gggaacaaat 600
gctgatcatt tgggggatac atcaccccaa tgatgaaagt gaacaaagag cattgtatca 660
gaatgtgggg acctatgtgt cagtaggaac atcaacactg aacaaaagat catccccaga 720
aatagcaaca agacctaaag tgaatggaca aggaggcaga atggaattct cgtggactat 780
cttagatata tgggacacaa taaattttga gagtactggc aatctaattg caccagaata 840
tggtttcaaa atatccaaac gaggtagttc agggatcatg aaaacagaag gaaaacttga 900
aaactgcgag accaagtgcc aaactccttt gggagcaata aatacaacat taccctttca 960
caatatccac ccactgacca ttggtgagtg ccccaaatat gtaaaatcgg aaagattagt 1020
cttagcaaca ggactaagaa acgtccctca gattgagtca aggggattgt ttggggcaat 1080
agctggtttt atagagggtg gatggcaagg aatggttgat ggttggtatg ggtatcatca 1140
cagcaatgac cagggatctg ggtatgcagc agacaaagaa tccactcaaa aggcaattga 1200
tggaatcacc aacaaggtaa attctgtgat cgaaaagatg aacacccaat tcggagctgt 1260
tggaaaagaa ttcagtaact tggagagaag actggagaac ttgaataaaa agatggagga 1320
cggatttcta gatgtgtgga catacaatgc cgagctccta gttctaatgg aaaatgagag 1380
gacacttgac tttcatgatt ctaatgtcaa gaatctatat gataaagtca gaatgcaact 1440
gagagacaat gcaaaagaac tagggaatgg atgttttgaa ttttatcaca aatgtgatga 1500
tgaatgcatg aacagtgtga agaatgggac atatgattat tccaagtatg aagaggagtc 1560
taaactaaac aggactgaaa tcaaaggggt taaattgagc aatatggggg tttatcaaat 1620
ccttgccatc tatgctacag tagcaggttc cctgtcactg gcaatcatga tagctgggat 1680
ttctatatgg atgtgctcca acgggtctct gcaatgcaga atctgcatat gatcatcagt 1740
cattttgtaa ttaaaaacac ccttgtttct act 1773
<210> 13
<211> 1086
<212> DNA
<213> Influenza virus
<400> 13
caaaaacttc ccggaaatga caacagcacg gcaacgctgt gccttgggca ccatgcagta 60
ccaaacggaa cgatagtgaa aacaatcacg aatgaccaaa ttgaagttac taatgctact 120
gagctggtac agagttcctc aacaggtgga atatgcgaca gtcctcatca gatccttgat 180
ggagaaaact gcacactaat agatgctcta ttgggagacc ctcagtgtga tggcttccaa 240
aataagaaat gggacctttt tgttgaacgc agcaaagcct acagcaactg ttacccttat 300
gatgtgccgg attatgcctc ccttaggtca ctagttgcct catccggcac actggagttt 360
aacaatgaaa gcttcgattg gactggagtc actcagaatg gaacaagctc tgcttgcaaa 420
aggagatcta ataaaagttt ctttagtaga ttgaattggt tgacccactt aaaatacaaa 480
tacccagcat tgaacgtgac tatgccaaac aatgaaaaat ttgacaaatt gtacatttgg 540
ggggttcacc acccgggtac ggacagtgac caaatcagcc tatatgctca agcatcagga 600
agaatcacag tctctaccaa aagaagccaa caaactgtaa tcccgaatat cggatctaga 660
cccagggtaa gggatgtctc cagccgaata agcatctatt ggacaatagt aaaaccggga 720
gacatacttt tgattaacag cacagggaat ctaattgctc ctcggggtta cttcaaaata 780
cgaagtggga aaagctcaat aatgagatca gatgcaccca ttggcaaatg caattccgaa 840
tgcatcactc caaatggaag cattcccaat gacaaaccat ttcaaaatgt aaacaggatc 900
acatatgggg cctgtcccag atatgttaag caaaacactc tgaaattggc aacagggatg 960
cgaaatgtac cagagaaaca aactagaggc atatttggcg caatcgcggg tttcatagaa 1020
aatggttggg agggaatggt ggacggttgg tacggtttca ggcatcaaaa ttctgagggc 1080
acagga 1086
<210> 14
<211> 1048
<212> DNA
<213> Influenza virus
<400> 14
atgctatcaa tcacgattct gtttctgctc atagcagagg gttcctctca gaattacaca 60
gggaatcccg tgatatgcct gggacatcat gccgtatcca atgggacaat ggtgaaaacc 120
ctgactgatg accaagtaga agttgtcact gcccaagaat tagtggaatc gcaacatcta 180
ccggagttgt gtcctagccc tttaagatta gtagatggac aaacttgtga catcgtcaat 240
ggtgccttgg ggagtccagg ctgtgatcac ttgaatggtg cagaatggga tgtcttcata 300
gaacgaccca ctgctgtgga cacttgttat ccatttgatg tgccggatta ccagagccta 360
cggagtatcc tagcaaacaa tgggaaattt gagttcattg ctgaggaatt ccaatggaac 420
acagtcaaac aaaatgggaa atccggagca tgcaaaagag caaatgtgaa tgactttttc 480
aacagattga actggctgac caaatctgat gggaatgcat acccacttca aaacctgaca 540
aaggttaaca acggggacta tgcaagactt tacatatggg gagttcatca tccttcaact 600
gacacagaac aaaccaactt gtataagaac aaccctggga gagtaactgt ttccaccaaa 660
accagtcaaa caagtgtggt accaaacatt ggcagtagac catgggtaag aggccaaagc 720
ggcaggatta gcttctattg gacaattgtg gagccaggag acctcatagt cttcaacacc 780
atagggaatt taattgctcc gagaggtcat tacaagctta acagtcaaaa gaagagcaca 840
attctgaata ctgcaattcc cataggatct tgtgttagta aatgtcacac agataggggt 900
tcaatctcta caaccaaacc ctttcagaac atctcaagaa tatcaattgg ggactgtccc 960
aagtatgtca aacagggatc cttgaaacta gctacaggaa tgaggaatat ccctgagaaa 1020
gcaaccagag gcctgtttgg tgcaattg 1048
<210> 15
<211> 1707
<212> DNA
<213> Influenza virus
<400> 15
atggagaaaa tagtgcttct tcttgcaata gtcagtcttg ttaaaagtga tcagatttgc 60
attggttacc atgcaaacaa ctcgacagag caggttgaca caataatgga aaagaacgtt 120
actgttacac atgcccaaga catactggaa aagacacaca acgggaaact ctgcgatcta 180
gatggagtga agcctctaat tttgagagat tgtagtgtag ctggatggct cctcggaaac 240
cctatgtgtg acgaattcat caatgtgccg gaatggtctt acatagtgga gaaggccagt 300
ccagccaatg acctctgtta cccaggggat ttcaacgact atgaagaact gaaacaccta 360
ttgagcagaa taaaccactt tgagaaaatt cagatcatcc ccaaaagttc ttggtccaat 420
catgaagcct catcaggggt gagcgcagca tgtccatacc atgggaagcc ctcctttttc 480
agaaatgtgg tatggcttat caaaaagaac agtgcatacc caacaataaa gaggagctac 540
aataatacca accaagaaga tcttttggta ctgtggggga ttcaccatcc taatgatgcg 600
gcagagcaga caaagctcta tcaaaaccca accacctata tttccgttgg aacatcaaca 660
ctaaaccaga gattggtccc aaaaatagct actagatcca aagtaaacgg gcaaagtgga 720
agaatggagt tcttctggac aattttaaag ccgaatgatg ccataaattt cgagagtaat 780
ggaaatttca ttgctccaga atatgcatac aaaattgtca agaaagggga ctcagcaatt 840
atgaaaagtg aattggaata tggtaactgc aacaccaagt gtcaaactcc aatgggggcg 900
ataaactcta gtatgccatt ccacaacata caccctctca caatcgggga atgccccaaa 960
tatgtgaaat caaacagatt agtccttgcg actggactca gaaatacccc tcaaagagat 1020
agaagaagaa aaaagagagg actatttgga gctatagcag gttttataga gggaggatgg 1080
caaggaatgg tagatggttg gtatgggtac caccatagca atgagcaggg gagtggatac 1140
gctgcagaca aagaatccac tcaaaaggca atagatggag tcaccaataa ggtcaactcg 1200
atcattgaca aaatgaacac tcagtttgag gccgttggaa gggaatttaa taacttagaa 1260
aggaggatag aaaatttaaa caagaagatg gaagacggat tcctagatgt ctggacttat 1320
aatgctgaac ttctggttct catggaaaat gagagaactc tagactttca tgattcaaat 1380
gtcaagaacc tttacaacaa ggtccgacta cagcttaggg ataatgcaaa ggagctgggt 1440
aatggttgtt tcgagttcta tcacaaatgt gataatgaat gtatggaaag tgtaaaaaac 1500
gggacgtatg actacccgca gtattcagaa gaagcaagac taaacagaga ggaaataagt 1560
ggagtaaaat tggaatcaat gggaacttac caaatactgt caatttattc aacagtggcg 1620
agttccctag cactggcaat catggtagct ggtctatctt tatggatgtg ctccaatggg 1680
tcgttacaat gcagaatttg catttaa 1707
<210> 16
<211> 1050
<212> DNA
<213> Influenza virus
<400> 16
atgattgcaa tcattgtaat agcgatactg gcagcagccg gaaagtcaga caagatctgc 60
attgggtatc atgccaacaa ttcaacaaca caggtggata cgatacttga gaagaatgta 120
accgtcacac actcagttga attgctggag aatcagaagg aagaaagatt ctgcaagatc 180
ttgaacaagg cccctctcga cctaaaggga tgcaccatag agggttggat cttggggaat 240
ccccaatgcg atctgttgct tggtgaccaa agctggtcat atatagtgga aagacctact 300
gcccaaaatg ggatatgcta cccaggagct ttgaatgagg tagaagaact gaaagcattt 360
atcggatcag gagaaagggt agagagattt gagatgtttc ccaaaagcac atgggcaggg 420
gtagacacca gcagtggggt aacaaaagct tgtccttata atagtggttc atctttctac 480
agaaacctcc tatggataat aaagaccaag tcagcagcgt atccagtaat taagggaact 540
tacagcaaca ctggaaacca gccaatcctc tatttctggg gtgtgcacca tcctcctgac 600
accaatgagc aaaatactct gtatggctct ggcgatcggt atgttaggat gggaactgag 660
agcatgaatt ttgccaagag cccagaaatt gcggcaagac ccgctgtgaa tggccaaaga 720
ggtcgaattg attattactg gtctgtttta aaaccaggag aaaccttgaa tgtggaatct 780
aatggaaatc taatcgctcc ttggtatgca tacaaatttg tcaacacaaa taataaggga 840
gccgtcttca agtcaaattt accaatcgag aattgcgatg ccacatgcca gactattgca 900
ggagtcctaa ggaccaataa aacatttcag aatgtgagcc ctctgtggat aggagaatgc 960
cccaagtatg tgaaaagtga aagtctaagg cttgctactg gactaagaaa tgttccacag 1020
attgaaacca gagggctttt cggagctatc 1050
<210> 17
<211> 1698
<212> DNA
<213> Influenza virus
<400> 17
atggaaaaat tcatcgcaat agcaaccttg gcgagcacaa atgcatacga taggatatgc 60
attgggtacc aatcaaacaa ctccacagac acagtgaaca ctctcataga acagaatgta 120
ccagtcaccc aaacaatgga gctcgtggaa acagagaaac atcccgctta ttgtaacact 180
gatttaggtg ccccattgga actgcgagac tgcaagattg aggcagtaat ctatgggaac 240
cccaagtgtg acatccatct gaaggatcaa ggttggtcat acatagtgga gaggcccagc 300
gcaccagaag ggatgtgtta ccctggatct gtggaaaatc tagaagaact gaggtttgtc 360
ttctccagtg ctgcatctta caagagaata agactatttg actattccag gtggaatgtg 420
actagatctg gaacgagtaa agcatgcaat gcatcaacag gtggccaatc cttctatagg 480
agcatcaatt ggttgaccaa aaaggaacca gacacttatg acttcaatga aggagcttat 540
gttaataatg aagatggaga catcattttc ttatggggga tccatcatcc gccggacaca 600
aaagagcaga caacactata taaaaatgca aacactttga gtagtgttac tactaacact 660
ataaacagaa gctttcaacc aaatattggt cccagaccat tagtaagagg acagcaaggg 720
aggatggatt actattgggg cattctgaaa agaggggaga ctctgaagat caggaccaac 780
ggaaatttaa tcgcacctga atttggctat ctgctcaaag gtgaaagcta cggcagaata 840
attcaaaatg aggatatacc catcgggaac tgtaacacaa aatgtcaaac atatgcggga 900
gcaatcaata gcagcaaacc ctttcagaat gcaagtaggc attacatggg agaatgtccc 960
aaatatgtga agaaggcaag cttgcgactt gcagttgggc ttaggaatac gccttctgtt 1020
gaacccagag gactgtttgg agccattgct ggtttcattg aaggaggatg gtctggaatg 1080
attgatgggt ggtatggatt tcatcacagc aattcagagg gaacaggaat ggcagctgac 1140
cagaaatcaa cacaagaagc catcgataag atcaccaata aagtcaacaa tatagttgac 1200
aagatgaaca gggagtttga agttgtgaat catgagttct ctgaagttga aaaaagaata 1260
aacatgataa acgataaaat agatgaccaa attgaagatc tttgggctta caatgcagag 1320
ctccttgtgc tcttagagaa ccagaaaacg ctagacgaac atgattccaa tgtcaaaaac 1380
ctttttgatg aagtgaaaag gagactgtca gccaatgcaa tagatgctgg gaacggttgc 1440
tttgacatac ttcacaaatg cgacaatgag tgtatggaaa ctataaagaa cggaacttac 1500
gatcataagg aatatgaaga ggaggctaaa ctagaaagga gcaagataaa tggagtaaaa 1560
ctagaagaga acaccactta caaaattctt agcatttaca gtacagtggc ggccagtctt 1620
tgcttggcaa tcctgattgc tggaggttta atcctgggca tgcaaaatgg atcttgtaga 1680
tgcatgttct gtatttga 1698
<210> 18
<211> 1363
<212> DNA
<213> Influenza virus
<400> 18
atggaaacag tatcactaat gactatacta ctagtagcaa cagcaagcaa tgcagacaaa 60
atctgcatcg gccaccagtc aacaaactcc acagaaactg tggacacgct aacagaaacc 120
aatgttcctg tgacacatgc caaagaattg ctccacacag agcacaatgg aatgctgtgt 180
gcaacaaatc tgggacatcc cctaatctta gacacgtgca ctattgaagg actgatctat 240
ggtaaccctt cttgtgactt gctgttggga ggaagagaat ggtcctacat cgtcgaaagg 300
tcatcagctg taaatggaac gtgttaccct gggaatgtag agaacctaga ggaactcagg 360
acacttttta gttccgctag ttcctaccga agaatccaaa tcttcccaga cacaatctgg 420
aatgtgactt acactggaac aagcaaagca tgttcagatt cattctacag gagtatgaga 480
tggctgactc aaaaaagcgg gtcttaccct gttcaagacg ctcaatacac aaataatatg 540
ggaaagagca ttcttttcgt gtggggcata catcacccac ccactgaagc tgcacagaca 600
aatttgtaca caagaaccga cacaacaaca agcgtgacaa cagaagactt aaataggatc 660
ttcaaaccga tggtagggcc aaggcccctt gtcaatggtc tgcagggaag aattaattat 720
tattggtcgg tactaaaacc aggccagaca ctgcgagtaa gatccaatgg gaatctaatt 780
gctccatggt atggacacat tctttcggga gggagccatg gaagaatcct gaagactgat 840
ttaaaaagta gtaattgcgt agtgcaatgt cagactgaaa aaggcggctt aaacagtaca 900
ttgccgttcc acaatatcag taaatatgca tttggaaact gtcccaaata tgttagagtt 960
aaaagtctca aactggcagt agggttgagg aacgtgcctg ctagatcaag tagaggacta 1020
ttcggagcca tagctggatt catagaagga ggttggccag gactagtcgc tggttggtat 1080
ggtttccagc attcaaatga tcaaggggtt ggtattgcgg cagataggga ttcaactcaa 1140
aaggcaattg atagaataac aaccaaggtg aataatatag tcgacaaaat gaacaaacaa 1200
tatgaaataa ttgatcatga attcagtgag gttgaaacta ggctcaacat gatcaataat 1260
aagattgatg accaaataca agacatatgg gcatataatg cagagttgct agtactactt 1320
gaaaaccaga aaacactcga tgagcatgac gcaaatgtga aga 1363
<210> 19
<211> 1727
<212> DNA
<213> Influenza virus
<400> 19
agcaaaagca ggggtcacaa tgtacaaagt agtagtaata attgcgctcc ttggagcagt 60
gaaaggtctt gacagaatct gcctaggaca ccatgcggtt gccaatggaa ccattgtgaa 120
gacccttaca aatgaacaag aggaagtgac caatgctact gagacggtag agagcacaaa 180
tttgaataaa ttgtgtatga aaggaagaag ctacaaggac ttgggcaatt gtcacccggt 240
aggaatgttg ataggaacac ctgtttgtga tccgcacttg accgggacct gggacactct 300
cattgagcga gagaatgcca ttgcccactg ttatccaggg gcaaccataa atgaagaagc 360
attgaggcag aaaataatgg aaagtggagg aatcagcaag atgagcactg gcttcactta 420
tgggtcttcc atcacctcag ctgggaccac taaggcatgc atgagaaatg gaggagatag 480
tttctatgca gagctcaaat ggctagtgtc aaagacaaag ggacaaaatt tccctcagac 540
aacaaacacc tatcggaata cggacacagc agaacatctc ataatatggg gaattcatca 600
cccttccagc acacaggaaa agaatgactt atacggaact cagtcactat ctatatcagt 660
tgagagttct acatatcaga acaactttgt tccagttgtt ggggcaagac ctcaggtcaa 720
tggacaaagt gggcgaattg actttcactg gacactagta cagccgggtg acaacataac 780
cttctcagac aatggaggtc taatagcacc aagtcgagtt agcaaattaa ctggaaggga 840
tttgggaatc caatcagaag cgttgataga caacagttgt gaatccaaat gcttttggag 900
agggggttct ataaatacaa agctcccttt tcaaaatctg tcacccagaa cagtaggtca 960
atgccccaaa tacgtaaatc agaggagttt actgcttgca acagggatga ggaatgtgcc 1020
agaagtggtg cagggaaggg gtctgtttgg tgcaatagca gggttcatag aaaacggatg 1080
ggaaggaatg gtagacggct ggtatggttt cagacaccaa aatgcccagg gcacaggcca 1140
agctgctgat tacaagagta ctcaagcagc tattgaccaa atcacaggga aactgaacag 1200
gttgattgag aagaccaaca ctgagtttga gtcaatagaa tctgaattca gtgagactga 1260
gcatcaaatt ggtaacgtca ttaattggac caaagattca ataaccgaca tttggactta 1320
caacgcagag ctattagtgg caatggagaa tcagcacaca attgacatgg ctgattcaga 1380
gatgctaaat ctgtatgaaa gggtaagaaa gcaactcaga cagaatgcag aagaagacgg 1440
aaagggatgt tttgagatat atcatacttg tgatgattcg tgcatggaga gtataaggaa 1500
caatacttat gaccattcac aatacagaga ggaggctctt ctgaatagac tgaacatcaa 1560
cccagtgaaa ctttcttcgg ggtacaaaga catcatactt tggtttagct tcggggaatc 1620
atgctttgtt cttctagccg ttgttatggg tcttgttttc ttctgcctga aaaatggaaa 1680
catgcgatgc acaatctgta tttagttaaa aacaccttgt ttctact 1727
<210> 20
<211> 1698
<212> DNA
<213> Influenza virus
<400> 20
atggagaaaa cactgctatt tgcagctatt ttcctttgtg tgaaagcaga tgagatctgt 60
atcgggtatt taagcaacaa ctcgacagac aaagttgaca caataattga gaacaatgtc 120
acggtcacta gctcagtgga actggttgag acagaacaca ctggatcatt ctgttcaatc 180
aatggaaaac aaccaataag ccttggagat tgttcatttg ctggatggat attaggaaac 240
cctatgtgtg atgaactaat tggaaagact tcatggtctt acattgtgga aaaacccaat 300
ccaacaaatg gaatctgtta cccaggaact ttagagagtg aagaagaact aagactgaaa 360
ttcagtggag ttttagaatt taacaaattc gaagtattca catcaaatgg atggggtgct 420
gtaaattcag gagtaggagt aaccgctgca tgcaaattcg ggggttctaa ttctttcttt 480
cgaaacatgg tatggctgat acaccaatca ggaacatatc ctgtaataaa gagaaccttt 540
aacaacacca aagggagaga tgtactgatt gtttggggaa ttcatcatcc tgctacactg 600
acagaacatc aagatctgta taaaaaggac agctcctatg tagcagtggg ttcagagacc 660
tacaacagaa gattcactcc agaaatcaac actaggccca gagtcaatgg acaggccgga 720
cggatgacat tctactggaa gatagtcaaa ccaggagaat caataacatt cgaatctaat 780
ggggcgttcc tagctcctag atatgctttt gagattgtct ctgttggaaa tgggaaactg 840
ttcaggagcg aactgaacat tgaatcatgc tctaccaaat gtcaaacaga aataggagga 900
attaatacga acaaaagctt ccacaatgtt cacagaaaca ctatcgggga ttgccccaag 960
tatgtgaatg tcaaatcctt aaagcttgca acaggaccta gaaatgtccc agcaatagca 1020
tcgagaggct tgtttggagc aatagctgga ttcatagaag ggggatggcc tggactgatc 1080
aatggatggt atgggttcca acacagggac gaagaaggaa caggcattgc agcagacaag 1140
gagtcaactc aaaaggcaat agaccagata acatccaagg taaataacat cgttgacagg 1200
atgaatacaa actttgagtc tgtgcaacac gaattcagtg aaatagagga aagaataaat 1260
caattatcaa aacacgtaga tgattctgtg gttgacatct ggtcatataa tgcacagctt 1320
ctcgttttac ttgaaaatga gaagacactg gacctccatg actcaaatgt caggaacctc 1380
catgagaaag tcagaagaat gctaaaggac aatgccaaag atgaggggaa cggatgcttc 1440
accttttacc ataagtgtga caataaatgc attgaacgag ttagaaacgg aacatatgat 1500
cataaagaat tcgaggagga atcaaaaatc aatcgccagg agattgaagg ggtgaaacta 1560
gattctagtg ggaatgtgta taaaatactg tcaatttaca gctgcattgc aagcagtctt 1620
gtattggcag cactcatcat ggggttcatg ttttgggcat gcagtaatgg atcatgtaga 1680
tgtaccattt gcatttag 1698
<210> 21
<211> 1695
<212> DNA
<213> Influenza virus
<400> 21
atggaaaaat tcatcatttt gagtactgtc ttggcagcaa gctttgcata tgacaaaatt 60
tgcattggat accaaacaaa caactcgact gaaacggtaa acacactaag tgaacaaaac 120
gttccggtga cgcaggtgga agaacttgta catcgtggga ttgatccgat cctgtgtgga 180
acggaactag gatcaccact agtgcttgat gactgttcat tagagggtct aatcctaggc 240
aatcccaaat gtgatcttta tttgaatggc agggaatggt catacatagt agagaggccc 300
aaagagatgg aaggagtttg ctatccaggg tcaattgaaa accaggaaga gctaagatct 360
ctgttttctt ccatcaaaaa atatgaaaga gtgaagatgt ttgatttcac caaatggaat 420
gtcacataca ctgggaccag caaggcctgc aataatacat caaaccaagg ctcattctat 480
aggagcatga gatggttgac cttaaaatca ggacaatttc cagtccaaac agatgagtac 540
aagaacacca gagattcaga cattgtattc acctgggcca ttcaccaccc accaacatct 600
gatgaacaag taaaattata caaaaatcct gatactctct cttcagtcac caccgtagaa 660
atcaatagga gcttcaagcc taatataggg ccaagaccac tcgtgagagg acaacaaggg 720
agaatggatt actactgggc tgttcttaaa cctggacaaa cagtcaaaat acaaaccaat 780
ggtaatctta ttgcacctga atatggtcac ttaatcacag ggaaatcaca tggcaggata 840
ctcaagaata atttgcccat gggacagtgt gtgactgaat gtcaattgaa cgagggtgta 900
atgaacacaa gcaaaccttt ccagaacact agtaagcact atattgggaa atgccccaaa 960
tacataccat cagggagttt aaaattggca atagggctca ggaatgtccc acaagttcaa 1020
gatcgggggc tctttggagc aattgcaggt ttcatagaag gcggatggcc agggctagtg 1080
gctggttggt acggatttca gcatcaaaat gcggagggga caggcatagc tgcagacaga 1140
gacagcaccc aaagggcaat agacaatatg caaaacaaac tcaacaatgt catcgacaaa 1200
atgaataaac aatttgaagt ggtgaatcat gagttttcag aagtggaaag cagaataaac 1260
atgattaatt ccaaaattga tgatcagata actgacatat gggcatacaa tgctgaattg 1320
cttgtcctat tggaaaatca gaagacatta gatgagcatg acgctaatgt aaggaatcta 1380
catgatcggg tcagaagagt cctgagggaa aatgcaattg acacaggaga cggctgcttt 1440
gagattttac ataaatgtga caacaattgt atggacacga ttagaaacgg gacatacaat 1500
cacaaagagt atgaggaaga aagcaaaatc gaacgacaga aagtcaatgg tgtgaaactt 1560
gaggagaatt ctacatataa aattctgagc atctacagca gtgttgcctc aagcttagtt 1620
ctactgctca tgattattgg gggtttcatt ttcgggtgtc aaaatggaaa tgttcgttgt 1680
actttctgta tttaa 1695
<210> 22
<211> 1701
<212> DNA
<213> Influenza virus
<400> 22
atggctctaa atgtcattgc aactttgaca cttataagtg tatgtgtaca tgcagacaga 60
atatgcgtgg ggtatctgag caccaattca tcagaaaggg tcgacacgct ccttgaaaat 120
ggggtcccag tcaccagctc cattgatctg attgagacaa accacacagg aacatactgt 180
tctctaaatg gagtcagtcc agtgcatttg ggagattgca gctttgaagg atggattgta 240
ggaaacccag cctgcaccag caactttggg atcagagagt ggtcatacct gattgaggac 300
cccgcggccc ctcatgggct ttgctaccct ggagaattaa acaacaatgg tgaactcaga 360
cacttgttca gtggaatcag gtcattcagt agaacggaat tgatcccacc tacctcctgg 420
ggggaagtac ttgacggtac aacatctgct tgcagagata acacgggaac caacagcttc 480
tatcgaaatt tagtttggtt tataaagaag aatactagat atccagttat cagtaagacc 540
tacaacaata caacgggaag ggatgtttta gttttatggg gaatacatca cccagtgtct 600
gtggatgaga caaagactct gtatgtcaat agtgatccat acacactggt ttccaccaag 660
tcttggagcg agaaatataa actagaaacg ggagtccgac ctggctataa tggacagagg 720
agctggatga aaatttattg gtctttgata catccagggg agatgattac tttcgagagt 780
aatggtggat ttttagcccc aagatatggg tacataattg aagaatatgg aaaaggaagg 840
attttccaga gtcgcatcag aatgtctagg tgcaacacca agtgccagac ttcggttgga 900
gggataaaca caaacagaac gttccaaaac atcgataaga atgctcttgg tgactgtccc 960
aaatacataa agtctggcca actcaagcta gccactggac tcagaaatgt gccagctata 1020
tcgaatagag gattgttcgg agcaattgca gggttcatag aaggaggctg gccaggttta 1080
atcaatggtt ggtacggttt tcagcatcaa aatgaacagg gaacaggaat agctgcagac 1140
aaagaatcaa cacagaaagc tatagaccag ataacaacca aaataaataa cattattgat 1200
aaaatgaatg ggaactatga ttcaattagg ggtgaattca atcaagttga gaagcgtata 1260
aacatgcttg cagacagaat agatgatgcc gtgacggaca tttggtcata caatgccaaa 1320
cttcttgtat tgctggaaaa tgataaaact ttagatatgc atgatgctaa tgtaaagaat 1380
ttacatgagc aagtacgaag agaattgaag gacaatgcaa ttgacgaagg aaatggctgt 1440
tttgaactcc ttcataaatg caatgactcc tgcatggaaa ctataagaaa tggaacgtat 1500
gaccacactg agtatgcaga ggagtcaaag ttaaagaggc aagaaatcga tgggatcaaa 1560
ctcaaatcag aagacaacgt ttacaaagca ttatcaatat acagttgcat tgcaagtagt 1620
gttgtactag taggactcat actctctttc atcatgtggg cctgtagtag tgggaattgc 1680
cgattcaatg tttgtatata a 1701
<210> 23
<211> 1749
<212> DNA
<213> Influenza virus
<400> 23
agcaaaagca ggggaaaatg attgcactca tattggttgc actggctctg agccacactg 60
cttattctca gatcacaaat gggacaacag gaaaccccat tatatgcttg gggcatcatg 120
cagtggaaaa cggcacatct gttaaaacac taacagacaa tcacgtagaa gttgtgtcag 180
ctaaagaatt agttgagacg aaccacactg atgaactgtg cccaagcccc ttgaagcttg 240
tcgacgggca agactgccac ctcatcaatg gtgcattggg gagtccaggc tgtgaccgtt 300
tgcaggacac cacttgggat gtcttcattg aaaggcccac tgcagtagac acatgttatc 360
cattcgacgt cccagattac cagagtctca gaagcatcct agcaagcagt gggagtttgg 420
agttcatcgc cgaacaattc acctggaatg gtgtcaaagt tgacggatca agcagtgctt 480
gtttgagggg cggtcgcaac agcttcttct cccgactaaa ctggctaacc aaagcaacaa 540
atggaaacta tggacctatt aacgtcacta aagaaaatac gggctcttat gtcaggctct 600
atctctgggg agtgcatcac ccatcaagcg ataatgagca aacggatctc tacaaggtgg 660
caacagggag agtaacagta tctacccgct cggaccaaat cagtattgtt cccaatatag 720
gaagtagacc gagggtaagg aatcagagcg gcaggataag catctactgg accctagtaa 780
acccagggga ctccatcatt ttcaacagta ttgggaattt gattgcacca agaggccact 840
acaaaataag caaatctact aagagcacag tgcttaaaag tgacaaaagg attgggtcat 900
gcacaagccc ttgcttaact gataaaggtt cgatccaaag tgacaaacct tttcagaatg 960
tatcaaggat tgctatagga aactgcccga aatatgtaaa gcaagggtcc ctgatgttag 1020
caactggaat gcgcaacatc cctggcaaac aggcaaaggg cttatttggg gcaattgctg 1080
gattcattga aaatggttgg caaggcctga ttgatgggtg gtatggattc aggcaccaaa 1140
atgctgaagg aacaggaact gctgcagacc tgaagtcaac tcaggcagcc attgatcaga 1200
taaatggcaa gctgaacaga ttgatagaga agacaaatga aaaatatcac caaatagaaa 1260
aggaattcga acaggtggaa ggaagaatac aagaccttga gaagtacgtt gaggacacta 1320
agattgattt gtggtcatac aatgctgaat tgctagtagc actagagaat cagcacacaa 1380
tagatgtcac agactccgaa atgaacaagc tttttgaaag agtaagaagg caattaagag 1440
agaatgcaga agatcaaggc aacggttgtt tcgagatatt ccatcagtgt gacaacaatt 1500
gtatagaaag cattagaaac ggaacttatg accacaacat ctacagggat gaagccatca 1560
acaatcgaat caaaataaat cctgtcactt tgacgatggg gtacaaggac ataatcctgt 1620
ggatttcttt ctccatgtca tgctttgtct tcgtggcact gattctggga tttgttctat 1680
gggcttgtca aaacgggaat atccgatgcc aaatctgtat ataaagaaaa aacacccttg 1740
tttctactc 1749
<210> 24
<211> 1762
<212> DNA
<213> Influenza virus
<400> 24
agcaaaagca ggggatacaa aatgaacact caaatcatcg tcattctagt cctcggactg 60
tcgatggtga gatctgacaa gatttgtctc gggcaccatg ccgtagcaaa tgggacaaaa 120
gtcaacacac taactgagaa aggagtggaa gtggtcaatg ccacggagac agtggagatt 180
acaggaataa ataaagtgtg cacaaaaggg aagaaagcgg tggacttggg atcttgtgga 240
atactgggaa ctatcattgg gcctccacaa tgtgactctc atcttaaatt caaagctgat 300
ctgataatag aaagaagaaa ttcaagtgac atctgttacc cagggaaatt cactaatgag 360
gaagcactga gacaaataat cagagaatct ggtggaattg acaaagagcc aatgggattt 420
agatattcag gaataaaaac agacggggca accagtgcgt gtaagagaac agtgtcctct 480
ttctactcag aaatgaaatg gcttttatcc agcaaggcta accaggtgtt cccacaactg 540
aatcagacat acaggaacaa cagaaaagaa ccagccctaa ttgtttgggg agtacatcat 600
tcaagttcct tggatgagca aaataagcta tatggagctg ggaacaagct gataacagta 660
ggaagctcaa aataccaaca atcgttttca ccaagtccag gggacaggcc caaagtgaat 720
ggtcaggccg ggaggatcga ctttcattgg atgctattgg acccagggga tacagtcact 780
tttaccttca atggtgcatt catagcccca gatagagcca cctttctccg ctctaatgcc 840
ccatcgggag ttgagtacaa tgggaagtca ctgggaatac agagtgatgc acaaattgat 900
gaatcatgtg aaggggaatg cttctacagt ggagggacaa taaacagccc tttgccattt 960
caaaacatcg atagttgggc tgtcggaagg tgccccagat atgtaaagca atcaagcctg 1020
ccgctggcct taggaatgaa aaatgtacca gagaaaatac atactagggg actgttcggt 1080
gcaattgcag gattcatcga gaatggatgg gaaggactca ttgatggatg gtatggattt 1140
aggcatcaaa atgcacaggg gcagggaaca gctgctgact acaagagtac tcaggctgca 1200
attgaccaga taacagggaa acttaataga ttaattgaaa aaaccaacac acagtttgaa 1260
ctcatagaca atgagttcac tgaagtggag cagcagatag gcaatgtaat aaactggaca 1320
agggactcct tgactgagat ctggtcatac aatgctgaac ttctagtagc aatggaaaat 1380
cagcatacaa ttgaccttgc agattctgaa atgaacaaac tctatgagag agtgagaaga 1440
cagctaaggg agaatgccga ggaggatgga actggatgtt ttgagatttt ccaccgatgt 1500
gacgatcaat gtatggagag catacgaaat aatacttaca atcacactga atatcgacag 1560
gaagccttac agaataggat aatgatcaat ccggtaaagc ttagtggtgg gtacaaagat 1620
gtgatactat ggtttagctt cggggcatca tgtgtaatgc ttctagccat tgctatgggt 1680
cttattttca tgtgtgtgaa aaacgggaat ctgcggtgca ctatctgtat ataattattt 1740
gaaaaacacc cttgtttcta ct 1762
<210> 25
<211> 1760
<212> DNA
<213> Influenza virus
<400> 25
agcaaaagca ggggatattg tcaaaacaac agaatggtga tcaaagtgct ctactttctc 60
atcgtattgt taagtaggta ttcgaaagca gacaaaatat gcataggata tctaagcaac 120
aacgccacag acacagtaga cacactgaca gagaacggag ttccagtgac cagctcagtt 180
gatctcgttg aaacaaacca cacaggaaca tactgctcac tgaatggaat cagcccaatt 240
catcttggtg actgcagctt tgagggatgg atcgtaggaa acccttcctg tgccaccaac 300
atcaacatca gagagtggtc gtatctaatt gaggacccca atgcccccaa caaactctgc 360
ttcccaggag agttagataa taatggagaa ttacgacatc tcttcagcgg agtgaactct 420
tttagcagaa cagaattaat aagtcccaac aaatggggag acattctgga tggagtcacc 480
gcttcttgcc gcgataatgg ggcaagcagt ttttacagaa atttggtctg gatagtgaag 540
aataaaaatg gaaaataccc tgtcataaag ggggattaca ataacacaac aggcagagat 600
gttctagtac tctggggcat tcaccatccg gatacagaaa caacagccat aaacttgtac 660
gcaagcaaaa acccctacac attagtatca acaaaggaat ggagcaaaag atatgaacta 720
gaaattggca ccagaatagg tgatggacag agaagttgga tgaaactata ttggcacctc 780
atgcgccctg gagagaggat aatgtttgaa agcaacgggg gccttatagc gcccagatac 840
ggatacatca ttgagaagta cggtacagga cgaattttcc aaagtggagt gagaatggcc 900
aaatgcaaca caaagtgtca aacatcatta ggtgggataa acaccaacaa aactttccaa 960
aacatagaga gaaatgctct tggagattgc ccaaagtaca taaagtctgg acagctgaag 1020
cttgcaactg ggctgagaaa tgtcccatcc gttggtgaaa gaggtttgtt tggtgcaatt 1080
gcaggcttca tagaaggagg gtggcctggg ctaattaatg gatggtatgg tttccagcat 1140
cagaatgaac aggggactgg cattgctgca gacaaagcct ccactcagaa agcgatagat 1200
gaaataacaa caaaaattaa caatataata gagaagatga acggaaacta tgattcaata 1260
agaggggaat tcaatcaagt agaaaagagg atcaacatgc tcgctgatcg agttgatgat 1320
gcagtaactg acatatggtc gtacaatgct aaacttcttg tactgcttga aaatgggaga 1380
acattggact tacacgacgc aaatgtcagg aacttacacg atcaggtcaa gagaatattg 1440
aaaagtaatg ctattgatga aggagatggt tgcttcaatc ttcttcacaa atgtaatgac 1500
tcatgcatgg aaactattag aaatgggacc tacaatcatg aagattacag ggaagaatca 1560
caactgaaaa ggcaggaaat tgagggaata aaattgaagt ctgaagacaa tgtgtataaa 1620
gtactgtcga tttatagctg cattgcaagc agtattgtgc tggtaggtct catacttgcg 1680
ttcataatgt gggcatgcag caatggaaat tgccggttta atgtttgtat atagtcggaa 1740
aaaataccct tgtttctact 1760
<210> 26
<211> 1882
<212> DNA
<213> Influenza virus
<400> 26
agcagaagcg ttgcattttc taatatccac aaaatgaagg caataattgt actactcatg 60
gtagtaacat ccaatgcaga tcgaatctgc actgggataa catcgtcaaa ctcacctcat 120
gtggttaaaa ctgccactca aggggaagtc aatgtgactg gtgtgatacc actaacaaca 180
acacctacca aatctcattt tgcaaatctc aaaggaacac agaccagagg aaaactatgc 240
ccaaactgtt ttaactgcac agatctggac gtggccctag gcagaccaaa atgcatgggg 300
aacacaccct ccgcaaaagt ctcaatactc catgaagtca aacctgctac atctggatgc 360
tttcctataa tgcacgacag aacaaaaatc agacaactac ctaatcttct cagaggatat 420
gaaaacatca ggttatcaac cagtaatgtt atcaatacag agacggcacc aggaggaccc 480
tacaaggtgg ggacctcagg atcttgccct aacgttgcta atgggaacgg cttcttcaac 540
acaatggctt gggttatccc aaaagacaac aacaagacag caataaatcc agtaacagta 600
gaagtaccat acatttgttc agaaggggaa gaccaaatta ctgtttgggg gttccactct 660
gatgacaaaa cccaaatgga aagactctat ggagactcaa atcctcaaaa gttcacctca 720
tctgccaatg gagtaaccac acattatgtt tctcagattg gtggcttccc aaatcaaaca 780
gaagacgaag ggctaaaaca aagcggcaga attgttgttg attacatggt acaaaaacct 840
ggaaaaacag gaacaattgt ttatcaaaga ggcattttat tgcctcaaaa agtgtggtgc 900
gcaagtggca ggagcaaggt aataaaaggg tccttgcctt taattggtga agcagattgc 960
ctccacgaaa agtacggtgg attaaataaa agcaagcctt actacacagg agagcatgca 1020
aaggccatag gaaattgccc aatatgggtg aaaacaccct tgaagctggc caatggaacc 1080
aaatatagac cgcctgcaaa actattaaag gaaagaggtt tcttcggagc tattgctggt 1140
ttcttggaag gaggatggga aggaatgatt gcaggttggc acggatacac atctcatgga 1200
gcacatggag tggcagtggc agcagacctt aagagtacac aagaagctat aaacaagata 1260
acaaaaaatc tcaactattt aagtgagcta gaagtaaaaa accttcaaag actaagcgga 1320
gcaatgaatg agcttcacga cgaaatactc gagctagacg aaaaagtgga tgatctaaga 1380
gctgatacaa taagctcaca aatagagctt gcagtcttgc tttccaacga agggataata 1440
aacagtgaag atgagcatct cttggcactt gaaagaaaac tgaagaaaat gcttggcccc 1500
tctgctgtag aaatagggaa tgggtgcttt gaaaccaaac acaaatgcaa ccagacttgc 1560
ctagacagga tagctgctgg cacctttaat gcaggagatt tttctcttcc cacttttgat 1620
tcattaaaca ttactgctgc atctttaaat gatgatggct tggataatca tactatactg 1680
ctctactact caactgctgc ttctagcttg gctgtaacat taatgatagc tatcttcatt 1740
gtctacatgg tctccagaga caatgtttct tgttccatct gtctgtgagg gagattaagc 1800
cctgtgtttt cctttactgt agtgctcatt tgcttgtcac cattacaaag aaacgttatt 1860
gaaaaatgct cttgttacta ct 1882
<210> 27
<211> 2073
<212> DNA
<213> Influenza virus
<400> 27
agcagaagca gggggttaat aatgtttttc tcattactct tggtgttggg cctcacagag 60
gctgaaaaaa taaagatatg ccttcaaaag caagtgaaca gtagcttcag cctacacaat 120
ggcttcggag gaaatttgta tgccacagaa gaaaaaagaa tgtttgagct tgttaagccc 180
aaagctggag cctctgtctt gaatcaaagt acatggattg gctttggaga ttcaaggact 240
gacaaaagca attcagcttt tcctaggtct gctgatgttt cagcaaaaac tgctgataag 300
tttcgttttt tgtctggtgg atccttaatg ttgagtatgt ttggcccacc tgggaaggta 360
gactaccttt accaaggatg tggaaaacat aaagtttttt atgaaggagt taactggagt 420
ccacatgctg ctataaattg ttacagaaaa aattggactg atatcaaact gaatttccag 480
aaaaacattt atgaattggc ttcacaatca cattgcatga gcttggtgaa tgccttggac 540
aaaactattc ctttacaagt gactgctggg actgcaggaa attgcaacaa cagcttctta 600
aaaaatccag cattgtacac acaagaagtc aagccttcag aaaacaaatg tgggaaagaa 660
aatcttgctt tcttcacact tccaacccaa tttggaacct atgagtgcaa actgcatctt 720
gtggcttctt gctatttcat ctatgatagt aaagaagtgt acaataaaag aggatgtgac 780
aactactttc aagtgatcta tgattcattt ggaaaagtcg ttggaggact agataacagg 840
gtatcacctt acacagggaa ttctggagac accccaacaa tgcaatgtga catgctccag 900
ctgaaacctg gaagatattc agtaagaagc tctccaagat tccttttaat gcctgaaaga 960
agttattgct ttgacatgaa agaaaaagga ccagtcactg ctgtccaatc catttgggga 1020
aaaggcagag aatctgacta tgcagtggat caagcttgct tgagcactcc agggtgcatg 1080
ttgatccaaa agcaaaagcc atacattgga gaagctgatg atcaccatgg agatcaagaa 1140
atgagggagt tgctgtcagg actggactat gaagctagat gcatatcaca atcagggtgg 1200
gtgaatgaaa ccagtccttt tacggagaaa tacctccttc ctcccaaatt tggaagatgc 1260
cctttggctg caaaggaaga atccattcca aaaatcccag atggccttct aattcccacc 1320
agtggaaccg ataccactgt aaccaaacct aagagcagaa tttttggaat cgatgacctc 1380
attattggtg tgctctttgt tgcaatcgtt gaaacaggaa ttggaggcta tctgcttgga 1440
agtagaaaag aatcaggagg aggtgtgaca aaagaatcag ctgaaaaagg gtttgagaaa 1500
attggaaatg acatacaaat tttaaaatct tctataaata tcgcaataga aaaactaaat 1560
gacagaattt ctcatgatga gcaagccatc agagatctaa ctttagaaat tgaaaatgca 1620
agatctgaag ctttattggg agaattggga ataataagag ccttattggt aggaaatata 1680
agcataggat tacaggaatc tttatgggaa ctagcttcag aaataacaaa tagagcagga 1740
gatctagcag ttgaagtctc cccaggttgc tggataattg acaataacat ttgtgatcaa 1800
agctgtcaaa attttatttt caagttcaac gaaactgcac ctgttccaac cattccccct 1860
cttgacacaa aaattgatct gcaatcagat cctttttact ggggaagcag cttgggctta 1920
gcaataactg ctactatttc attggcagct ttggtgatct ctgggatcgc catctgcaga 1980
actaaatgat tgagacaatt ttgaaaaatg gataatgtgt tggtcaatat tttgtacagt 2040
tttataaaaa acaaaaatcc ccttgctact gct 2073
<210> 28
<211> 1670
<212> DNA
<213> Artificial sequence
<220>
<223> sequence encoding HA0 of H1 (A/New Caledonia/20/99 (H1N1)
<400> 28
agatcttcgc tgacacaata tgtataggct accatgccaa caactcaacc gacactgttg 60
acacagtact tgagaagaat gtgacagtga cacactctgt caacctactt gaggacagtc 120
acaatggaaa actatgtcta ctaaaaggaa tagccccact acaattgggt aattgcagcg 180
ttgccggatg gatcttagga aacccagaat gcgaattact gatttccaag gaatcatggt 240
cctacattgt agaaacacca aatcctgaga atggaacatg ttacccaggg tatttcgccg 300
actatgagga actgagggag caattgagtt cagtatcttc atttgagaga ttcgaaatat 360
tccccaaaga aagctcatgg cccaaccaca ccgtaaccgg agtatcagca tcatgctccc 420
ataatgggaa aagcagtttt tacagaaatt tgctatggct gacggggaag aatggtttgt 480
acccaaacct gagcaagtcc tatgtaaaca acaaagagaa agaagtcctt gtactatggg 540
gtgttcatca cccgcctaac atagggaacc aaagggcact ctatcataca gaaaatgctt 600
atgtctctgt agtgtcttca cattatagca gaagattcac cccagaaata gccaaaagac 660
ccaaagtaag agatcaggaa ggaagaatca actactactg gactctgctg gaacctgggg 720
atacaataat atttgaggca aatggaaatc taatagcgcc atggtatgct tttgcactga 780
gtagaggctt tggatcagga atcatcacct caaatgcacc aatggatgaa tgtgatgcga 840
agtgtcaaac acctcaggga gctataaaca gcagtcttcc tttccagaat gtacacccag 900
tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa attaaggatg gttacaggac 960
taaggaacat cccatccatt caatccagag gtttgtttgg agccattgcc ggtttcattg 1020
aaggggggtg gactggaatg gtagatgggt ggtatggtta tcatcatcag aatgagcaag 1080
gatctggcta tgctgcagat caaaaaagta cacaaaatgc cattaacggg attacaaaca 1140
aggtcaattc tgtaattgag aaaatgaaca ctcaattcac agctgtgggc aaagagttca 1200
acaaattgga aagaaggatg gaaaacttaa ataaaaaagt tgatgatggg tttctagaca 1260
tttggacata taatgcagaa ttgttggttc tactggaaaa tgaaaggact ttggatttcc 1320
atgactccaa tgtgaagaat ctgtatgaga aagtaaaaag ccaattaaag aataatgcca 1380
aagaaatagg aaacgggtgt tttgagttct atcacaagtg taacaatgaa tgcatggaga 1440
gtgtgaaaaa tggtacctat gactatccaa aatattccga agaatcaaag ttaaacaggg 1500
agaaaattga tggagtgaaa ttggaatcaa tgggagtata ccagattctg gcgatctact 1560
caactgtcgc cagttccctg gttcttttgg tctccctggg ggcaatcagc ttctggatgt 1620
gttccaatgg gtctttgcag tgtagaatat gcatctaaga gctcaggcct 1670
<210> 29
<211> 32
<212> DNA
<213> Artificial sequence
<220>
<223> primer XmaI-pPlas.c
<400> 29
agttccccgg gctggtatat ttatatgttg tc 32
<210> 30
<211> 46
<212> DNA
<213> Artificial sequence
<220>
<223> primer SacI-ATG-pPlas.r
<400> 30
aatagagctc cattttctct caagatgatt aattaattaa ttagtc 46
<210> 31
<211> 46
<212> DNA
<213> Artificial sequence
<220>
<223> primer SacI-PlasTer.c
<400> 31
aatagagctc gttaaaatgc ttcttcgtct cctatttata atatgg 46
<210> 32
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> primer EcoRI-PlasTer.r
<400> 32
ttacgaattc tccttcctaa ttggtgtact atcatttatc aaagggga 48
<210> 33
<211> 1711
<212> DNA
<213> Influenza virus
<400> 33
atgaaagcaa aactactggt cctgttatgt acatttacag ctacatatgc agacacaata 60
tgtataggct accatgccaa caactcaacc gacactgttg acacagtact tgagaagaat 120
gtgacagtga cacactctgt caacctactt gaggacagtc acaatggaaa actatgtcta 180
ctaaaaggaa tagccccact acaattgggt aattgcagcg ttgccggatg gatcttagga 240
aacccagaat gcgaattact gatttccaag gaatcatggt cctacattgt agaaacacca 300
aatcctgaga atggaacatg ttacccaggg tatttcgccg actatgagga actgagggag 360
caattgagtt cagtatcttc atttgagaga ttcgaaatat tccccaaaga aagctcatgg 420
cccaaccaca ccgtaaccgg agtatcagca tcatgctccc ataatgggaa aagcagtttt 480
tacagaaatt tgctatggct gacggggaag aatggtttgt acccaaacct gagcaagtcc 540
tatgtaaaca acaaagagaa agaagtcctt gtactatggg gtgttcatca cccgcctaac 600
atagggaacc aaagggccct ctatcataca gaaaatgctt atgtctctgt agtgtcttca 660
cattatagca gaagattcac cccagaaata gccaaaagac ccaaagtaag agatcaggaa 720
ggaagaatca actactactg gactctgctg gaacctgggg atacaataat atttgaggca 780
aatggaaatc taatagcgcc atggtatgct tttgcactga gtagaggctt tggatcagga 840
atcatcacct caaatgcacc aatggatgaa tgtgatgcga agtgtcaaac acctcaggga 900
gctataaaca gcagtcttcc tttccagaat gtacacccag tcacaatagg agagtgtcca 960
aagtatgtca ggagtgcaaa attaaggatg gttacaggac taaggaacat cccatccatt 1020
caatccagag gtttgtttgg agccattgcc ggtttcattg aaggggggtg gactggaatg 1080
gtagatgggt ggtatggtta tcatcatcag aatgagcaag gatctggcta tgctgcagat 1140
caaaaaagta cacaaaatgc cattaacggg attacaaaca aggtgaattc tgtaattgag 1200
aaaatgaaca ctcaattcac agctgtgggc aaagaattca acaaattgga aagaaggatg 1260
gaaaacttaa ataaaaaagt tgatgatggg tttctagaca tttggacata taatgcagaa 1320
ttgttggttc tactggaaaa tgaaaggact ttggatttcc atgactccaa tgtgaagaat 1380
ctgtatgaga aagtaaaaag ccaattaaag aataatgcca aagaaatagg aaacgggtgt 1440
tttgaattct atcacaagtg taacaatgaa tgcatggaga gtgtgaaaaa tggaacttat 1500
gactatccaa aatattccga agaatcaaag ttaaacaggg agaaaattga tggagtgaaa 1560
ttggaatcaa tgggagtcta tcagattctg gcgatctact caactgtcgc cagttccctg 1620
gttcttttgg tctccctggg ggcaatcagc ttctggatgt gttccaatgg gtctttgcag 1680
tgtagaatat gcatctgaga ccagaatttc a 1711
<210> 34
<211> 1781
<212> DNA
<213> Medicago sativa
<400> 34
ccaaatcctt aacattcttt caacaccaac aatggcgaaa aacgttgcga ttttcggttt 60
attgttttct cttcttctgt tggttccttc tcagatcttc gctgaggaat catcaactga 120
cgctaaggaa tttgttctta cattggataa cactaatttc catgacactg ttaagaagca 180
cgatttcatc gtcgttgaat tctacgcacc ttggtgtgga cactgtaaga agctagcccc 240
agagtatgag aaggctgctt ctatcttgag cactcacgag ccaccagttg ttttggctaa 300
agttgatgcc aatgaggagc acaacaaaga cctcgcatcg gaaaatgatg ttaagggatt 360
cccaaccatt aagattttta ggaatggtgg aaagaacatt caagaataca aaggtccccg 420
tgaagctgaa ggtattgttg agtatttgaa aaaacaaagt ggccctgcat ccacagaaat 480
taaatctgct gatgatgcga ccgcttttgt tggtgacaac aaagttgtta ttgtcggagt 540
tttccctaaa ttttctggtg aggagtacga taacttcatt gcattagcag agaagttgcg 600
ttctgactat gactttgctc acactttgaa tgccaaacac cttccaaagg gagactcatc 660
agtgtctggg cctgtggtta ggttatttaa gccatttgac gagctctttg ttgactcaaa 720
ggatttcaat gtagaagctc tagagaaatt cattgaagaa tccagtaccc caattgtgac 780
tgtcttcaac aatgagccta gcaatcaccc ttttgttgtc aaattcttta actctcccaa 840
cgcaaaggct atgttgttca tcaactttac taccgaaggt gctgaatctt tcaaaacaaa 900
ataccatgaa gtggctgagc aatacaaaca acagggagtt agctttcttg ttggagatgt 960
tgagtctagt caaggtgcct tccagtattt tggactgaag gaagaacaag tacctctaat 1020
tattattcag cataatgatg gcaagaagtt tttcaaaccc aatttggaac ttgatcaact 1080
cccaacttgg ttgaaggcat acaaggatgg caaggttgaa ccatttgtca agtctgaacc 1140
tattcctgaa actaacaacg agcctgttaa agtggtggtt gggcaaactc ttgaggacgt 1200
tgttttcaag tctgggaaga atgttttgat agagttttat gctccttggt gtggtcactg 1260
caagcagttg gctccaatct tggatgaagt tgctgtctca ttccaaagcg atgctgatgt 1320
tgttattgca aaactggatg caactgccaa cgatatccca accgacacct ttgatgtcca 1380
aggctatcca accttgtact tcaggtcagc aagtggaaaa ctatcacaat acgacggtgg 1440
taggacaaag gaagacatca tagaattcat tgaaaagaac aaggataaaa ctggtgctgc 1500
tcatcaagaa gtagaacaac caaaagctgc tgctcagcca gaagcagaac aaccaaaaga 1560
tgagctttga aaagttccgc ttggaggata tcggcacaca gtcatctgcg ggctttacaa 1620
ctcttttgta tctcagaatc agaagttagg aaatcttagt gccaatctat ctatttttgc 1680
gtttcatttt atctttttgg tttactctaa tgtattactg aataatgtga gttttggcgg 1740
agtttagtac tggaactttt gtttctgtaa aaaaaaaaaa a 1781
<210> 35
<211> 1027
<212> DNA
<213> Influenza virus
<400> 35
agcgaaagca ggtagatatt gaaagatgag tcttctaacc gaggtcgaaa cgtacgttct 60
ctctatcatc ccgtcaggcc ccctcaaagc cgagatcgca cagagacttg aagatgtctt 120
tgcagggaag aacaccgatc ttgaggttct catggaatgg ctaaagacaa gaccaatcct 180
gtcacctctg actaagggga ttttaggatt tgtgttcacg ctcaccgtgc ccagtgagcg 240
aggactgcag cgtagacgct ttgtccaaaa tgcccttaat gggaacgggg atccaaataa 300
catggacaaa gcagttaaac tgtataggaa gctcaagagg gagataacat tccatggggc 360
caaagaaatc tcactcagtt attctgctgg tgcacttgcc agttgtatgg gcctcatata 420
caacaggatg ggggctgtga ccactgaagt ggcatttggc ctggtatgtg caacctgtga 480
acagattgct gactcccagc atcggtctca taggcaaatg gtgacaacaa ccaacccact 540
aatcagacat gagaacagaa tggttttagc cagcactaca gctaaggcta tggagcaaat 600
ggctggatcg agtgagcaag cagcagaggc catggaggtt gctagtcagg ctaggcaaat 660
ggtgcaagcg atgagaacca ttgggactca tcctagctcc agtgctggtc tgaaaaatga 720
tcttcttgaa aatttgcagg cctatcagaa acgaatgggg gtgcagatgc aacggttcaa 780
gtgatcctct cgctattgcc gcaaatatca ttgggatctt gcacttgata ttgtggattc 840
ttgatcgtct ttttttcaaa tgcatttacc gtcgctttaa atacggactg aaaggagggc 900
cttctacgga aggagtgcca aagtctatga gggaagaata tcgaaaggaa cagcagagtg 960
ctgtggatgc tgacgatggt cattttgtca gcatagagct ggagtaaaaa actaccttgt 1020
ttctact 1027
<210> 36
<211> 1788
<212> DNA
<213> Artificial sequence
<220>
<223> clone 774 - nucleotide sequence of A/Brisbane/59/2007 (H1N1)
<400> 36
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaaa gtaaaactac tggtcctgtt atgcacattt 120
acagctacat atgcagacac aatatgtata ggctaccatg ctaacaactc gaccgacact 180
gttgacacag tacttgaaaa gaatgtgaca gtgacacact ctgtcaacct gcttgagaac 240
agtcacaatg gaaaactatg tctattaaaa ggaatagccc cactacaatt gggtaattgc 300
agcgttgccg ggtggatctt aggaaaccca gaatgcgaat tactgatttc caaggagtca 360
tggtcctaca ttgtagaaaa accaaatcct gagaatggaa catgttaccc agggcatttc 420
gctgactatg aggaactgag ggagcaattg agttcagtat cttcatttga gaggttcgaa 480
atattcccca aagaaagctc atggcccaac cacaccgtaa ccggagtgtc agcatcatgc 540
tcccataatg gggaaagcag tttttacaga aatttgctat ggctgacggg gaagaatggt 600
ttgtacccaa acctgagcaa gtcctatgca aacaacaaag aaaaagaagt ccttgtacta 660
tggggtgttc atcacccgcc aaacataggt gaccaaaagg ccctctatca tacagaaaat 720
gcttatgtct ctgtagtgtc ttcacattat agcagaaaat tcaccccaga aatagccaaa 780
agacccaaag taagagatca agaaggaaga atcaattact actggactct gcttgaaccc 840
ggggatacaa taatatttga ggcaaatgga aatctaatag cgccaagata tgctttcgca 900
ctgagtagag gctttggatc aggaatcatc aactcaaatg caccaatgga taaatgtgat 960
gcgaagtgcc aaacacctca gggagctata aacagcagtc ttcctttcca gaacgtacac 1020
ccagtcacaa taggagagtg tccaaagtat gtcaggagtg caaaattaag gatggttaca 1080
ggactaagga acatcccatc cattcaatcc agaggtttgt ttggagccat tgccggtttc 1140
attgaagggg ggtggactgg aatggtagat ggttggtatg gttatcatca tcagaatgag 1200
caaggatctg gctatgctgc agatcaaaaa agcacacaaa atgccattaa tgggattaca 1260
aacaaggtca attctgtaat tgagaaaatg aacactcaat tcacagcagt gggcaaagag 1320
ttcaacaaat tggaaagaag gatggaaaac ttgaataaaa aagttgatga tgggtttata 1380
gacatttgga catataatgc agaactgttg gttctactgg aaaatgaaag gactttggat 1440
ttccatgact ccaatgtgaa gaatctgtat gagaaagtaa aaagccagtt aaagaataat 1500
gctaaagaaa taggaaatgg gtgttttgag ttctatcaca agtgtaacga tgaatgcatg 1560
gagagtgtaa agaatggaac ttatgactat ccaaaatatt ccgaagaatc aaagttaaac 1620
agggagaaaa ttgatggagt gaaattggaa tcaatgggag tctatcagat tctggcgatc 1680
tactcaacag tcgccagttc tctggttctt ttggtctccc tgggggcaat cagcttctgg 1740
atgtgttcca atgggtcttt acagtgtaga atatgcatct aagagctc 1788
<210> 37
<211> 1788
<212> DNA
<213> Artificial sequence
<220>
<223> clone 775 - nucleotide sequence of A/Solomon Islands 3/2006
(H1N1)
<400> 37
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaaa gtaaaactac tggtcctgtt atgcacattt 120
acagctacat atgcagacac aatatgtata ggctaccatg ccaacaactc aaccgacact 180
gttgacacag tacttgagaa gaatgtgaca gtgacacact ctgtcaacct gcttgaggac 240
agtcacaatg gaaaattatg tctattaaaa ggaatagccc cactacaatt gggtaattgc 300
agcgttgccg gatggatctt aggaaaccca gaatgcgaat tactgatttc cagggaatca 360
tggtcctaca ttgtagaaaa accaaatcct gagaatggaa catgttaccc agggcatttc 420
gccgactatg aggaactgag ggagcaattg agttcagtat cttcatttga gagattcgaa 480
atattcccca aagaaagctc atggcccaac cacaccacaa ccggagtatc agcatcatgc 540
tcccataatg gggaaagcag tttttacaaa aatttgctat ggctgacggg gaagaatggt 600
ttgtacccaa acctgagcaa gtcctatgca aacaacaaag agaaagaagt ccttgtacta 660
tggggtgttc atcacccgcc taacataggt gaccaaaggg ctctctatca taaagaaaat 720
gcttatgtct ctgtagtgtc ttcacattat agcagaaaat tcaccccaga aatagccaaa 780
agacccaaag taagagatca agaaggaaga atcaactact actggactct acttgaaccc 840
ggggatacaa taatatttga ggcaaatgga aatctaatag cgccaagata tgctttcgca 900
ctgagtagag gctttggatc aggaatcatc aactcaaatg caccaatgga tgaatgtgat 960
gcgaagtgcc aaacacctca gggagctata aacagcagtc ttcctttcca gaatgtacac 1020
cctgtcacaa taggagagtg tccaaagtat gtcaggagtg caaaattaag gatggttaca 1080
ggactaagga acatcccatc cattcaatcc agaggtttgt ttggagccat tgccggtttc 1140
attgaagggg ggtggactgg aatggtagat ggttggtatg gttatcatca tcagaatgag 1200
caaggatctg gctatgctgc agatcaaaaa agcacacaaa atgccattaa tgggattaca 1260
aacaaggtca attctgtaat tgagaaaatg aacactcaat tcacagctgt gggcaaagag 1320
ttcaacaaat tggaaagaag gatggaaaac ttaaataaaa aagttgatga tgggtttata 1380
gacatttgga catataatgc agaattgttg gttctactgg aaaatgaaag gactttggat 1440
ttccatgact ccaatgtgaa gaatctgtat gagaaagtaa aaagccaatt aaagaataat 1500
gccaaagaaa taggaaatgg gtgttttgag ttctatcata agtgtaacga tgaatgcatg 1560
gagagtgtaa aaaatggaac ttatgactat ccaaaatatt ccgaagaatc aaagttaaac 1620
agggagaaaa ttgatggagt gaaattggaa tcaatgggag tctatcagat tctggcgatc 1680
tactcaacag tcgccagttc tctggttctt ttggtctccc tgggggcaat cagcttctgg 1740
atgtgttcca atgggtcttt gcagtgtaga atatgcatct gagagctc 1788
<210> 38
<211> 1791
<212> DNA
<213> Artificial sequence
<220>
<223> clone 776 - nucleotide sequence of A/Brisbane 10/2007 (H3N2)
<400> 38
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaag actatcattg ctttgagcta cattctatgt 120
ctggttttca ctcaaaaact tcccggaaat gacaacagca cggcaacgct gtgccttggg 180
caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt 240
actaatgcta ctgagctggt tcagagttcc tcaacaggtg aaatatgcga cagtcctcat 300
cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 360
gatggcttcc aaaataagaa atgggacctt tttgttgaac gcagcaaagc ctacagcaac 420
tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 480
acactggagt ttaacaatga aagtttcaat tggactggag tcactcaaaa cggaacaagc 540
tctgcttgca taaggagatc taataacagt ttctttagta gattgaattg gttgacccac 600
ttaaaattca aatacccagc attgaacgtg actatgccaa acaatgaaaa atttgacaaa 660
ttgtacattt ggggggttca ccacccgggt acggacaatg accaaatctt cctgtatgct 720
caagcatcag gaagaatcac agtctctacc aaaagaagcc aacaaactgt aatcccgaat 780
atcggatcta gacccagagt aaggaatatc cccagcagaa taagcatcta ttggacaata 840
gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 900
tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 960
tgcaattctg aatgcatcac tccaaacgga agcattccca atgacaaacc attccaaaat 1020
gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg 1080
gcaacaggga tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatcgcg 1140
ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtatggttt caggcatcaa 1200
aattctgagg gaataggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1260
atcaatggga agctgaatag gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1320
aaagagttct cagaagtcga agggagaatc caggaccttg agaaatatgt tgaggacacc 1380
aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1440
attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1500
gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1560
tgcataggat caatcagaaa tggaacttat gaccacgatg tatacagaga tgaagcatta 1620
aacaaccggt tccagatcaa gggcgttgag ctgaagtcag gatacaaaga ttggatacta 1680
tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1740
tgggcctgcc aaaaaggcaa cattaggtgc aacatttgca tttgagagct c 1791
<210> 39
<211> 1791
<212> DNA
<213> Artificial sequence
<220>
<223> clone 777 - nucleotide sequence of A/Wisconsin/67/2005 (H3N2)
<400> 39
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaag actatcattg ctttgagcta cattctatgt 120
ctggttttca ctcaaaaact tcccggaaat gacaacagca cggcaacgct gtgccttggg 180
caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt 240
actaatgcta ctgagctggt tcagagttcc tcaacaggtg gaatatgcga cagtcctcat 300
cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 360
gatggcttcc aaaataagaa atgggacctt tttgttgaac gcagcaaagc ctacagcaac 420
tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 480
acactggagt ttaacgatga aagtttcaat tggactggag tcactcaaaa tggaacaagc 540
tctgcttgca aaaggagatc taataacagt ttctttagta gattgaattg gttgacccac 600
ttaaaattca aatacccagc attgaacgtg actatgccaa acaatgaaaa atttgacaaa 660
ttgtacattt ggggggttca ccacccgggt acggacaatg accaaatctt cctgcatgct 720
caagcatcag gaagaatcac agtctctacc aaaagaagcc aacaaactgt aatcccgaat 780
atcggatcta gacccagaat aaggaatatc cccagcagaa taagcatcta ttggacaata 840
gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 900
tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 960
tgcaattctg aatgcatcac tccaaatgga agcattccca atgacaaacc atttcaaaat 1020
gtaaacagga tcacatatgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg 1080
gcaacaggga tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatcgcg 1140
ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1200
aattctgagg gaataggaca agcagcagat ctcaaaagca ctcaagcagc aatcaatcaa 1260
atcaatggga agctgaatag gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1320
aaagagttct cagaagtaga agggagaatc caggacctcg agaaatatgt tgaggacact 1380
aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1440
attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa gaacaaagaa gcaactgagg 1500
gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1560
tgcataggat caatcagaaa tggaacttat gaccatgatg tatacagaga tgaagcatta 1620
aacaaccggt tccagatcaa aggcgttgag ctgaagtcag gatacaaaga ttggatacta 1680
tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1740
tgggcctgcc aaaaaggcaa cattaggtgc aacatttgca tttgagagct c 1791
<210> 40
<211> 1848
<212> DNA
<213> Artificial sequence
<220>
<223> clone 778 - nucleotide sequence of B/Malaysia/2506/2004
<400> 40
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaag gcaataattg tactactcat ggtagtaaca 120
tccaatgcag atcgaatctg cactgggata acatcgtcaa actcaccaca tgttgtcaaa 180
actgctactc aaggggaggt caatgtgact ggtgtaatac cactgacaac aacacccacc 240
aaatctcatt ttgcaaatct caaaggaaca gaaaccagag ggaaactatg cccaaaatgc 300
ctcaactgca cagatctgga cgtggccttg ggcagaccaa aatgcacggg gaacataccc 360
tcggcaagag tttcaatact ccatgaagtc agacctgtta catctgggtg ctttcctata 420
atgcacgaca gaacaaaaat tagacagctg cctaaacttc tcagaggata cgaacatatc 480
aggttatcaa ctcataacgt tatcaatgca gaaaatgcac caggaggacc ctacaaaatt 540
ggaacctcag ggtcttgccc taacgttacc aatggaaacg gatttttcgc aacaatggct 600
tgggccgtcc caaaaaacga caacaacaaa acagcaacaa attcattaac aatagaagta 660
ccatacattt gtacagaagg agaagaccaa attaccgttt gggggttcca ctctgataac 720
gaaacccaaa tggcaaagct ctatggggac tcaaagcccc agaagttcac ctcatctgcc 780
aacggagtga ccacacatta cgtttcacag attggtggct tcccaaatca aacagaagac 840
ggaggactac cacaaagcgg tagaattgtt gttgattaca tggtgcaaaa atctgggaaa 900
acaggaacaa ttacctatca aagaggtatt ttattgcctc aaaaagtgtg gtgcgcaagt 960
ggcaggagca aggtaataaa aggatcgttg cctttaattg gagaagcaga ttgcctccac 1020
gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggggaaca tgcaaaggcc 1080
ataggaaatt gcccaatatg ggtgaaaaca cccttgaagc tggccaatgg aaccaaatat 1140
agacctcctg caaaactatt aaaggaaagg ggtttcttcg gagctattgc tggtttctta 1200
gaaggaggat gggaaggaat gattgcaggt tggcacggat acacatccca tggggcacat 1260
ggagtagcgg tggcagcaga ccttaagagc actcaagagg ccataaacaa gataacaaaa 1320
aatctcaact ctttgagtga gctggaagta aagaatcttc aaagactaag cggtgccatg 1380
gatgaactcc acaacgaaat actagaacta gacgagaaag tggatgatct cagagctgat 1440
acaataagct cacaaataga actcgcagtc ctgctttcca atgaaggaat aataaacagt 1500
gaagatgagc atctcttggc gcttgaaaga aagctgaaga aaatgctggg cccctctgct 1560
gtagagatag ggaatggatg ctttgaaacc aaacacaagt gcaaccagac ctgtctcgac 1620
agaatagctg ctggtacctt tgatgcagga gaattttctc tccccacttt tgattcactg 1680
aatattactg ctgcatcttt aaatgacgat ggattggata atcatactat actgctttac 1740
tactcaactg ctgcctccag tttggctgta acattgatga tagctatctt tgttgtttat 1800
atggtctcca gagacaatgt ttcttgctcc atctgtctat aagagctc 1848
<210> 41
<211> 1845
<212> DNA
<213> Artificial sequence
<220>
<223> clone 779 - nucleotide sequence of B/Florida/4/2006
<400> 41
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaag gcaataattg tactactcat ggtagtaaca 120
tccaatgcag atcgaatctg cactggaata acatcttcaa actcacctca tgtggtcaaa 180
acagccactc aaggggaggt caatgtgact ggtgtgatac cactaacaac aacaccaaca 240
aaatcttatt ttgcaaatct caaaggaaca aggaccagag ggaaactatg cccagactgt 300
ctcaactgca cagatctgga tgtggctttg ggcagaccaa tgtgtgtggg gaccacacct 360
tcggcgaagg cttcaatact ccacgaagtc aaacctgtta catccgggtg ctttcctata 420
atgcacgaca gaacaaaaat caggcaacta cccaatcttc tcagaggata tgaaaatatc 480
aggctatcaa cccaaaacgt catcgatgcg gaaaaggcac caggaggacc ctacagactt 540
ggaacctcag gatcttgccc taacgctacc agtaagagcg gatttttcgc aacaatggct 600
tgggctgtcc caaaggacaa caacaaaaat gcaacgaacc cactaacagt agaagtacca 660
tacatttgta cagaagggga agaccaaatc actgtttggg ggttccattc agataacaaa 720
acccaaatga agaacctcta tggagactca aatcctcaaa agttcacctc atctgctaat 780
ggagtaacca cacactatgt ttctcagatt ggcagcttcc cagatcaaac agaagacgga 840
ggactaccac aaagcggcag gattgttgtt gattacatga tgcaaaaacc tgggaaaaca 900
ggaacaattg tctaccaaag aggtgttttg ttgcctcaaa aggtgtggtg cgcgagtggc 960
aggagcaaag taataaaagg gtccttgcct ttaattggtg aagcagattg ccttcatgaa 1020
aaatacggtg gattaaacaa aagcaagcct tactacacag gagaacatgc aaaagccata 1080
ggaaattgcc caatatgggt gaaaacacct ttgaagctcg ccaatggaac caaatataga 1140
cctcctgcaa aactattaaa ggaaaggggt ttcttcggag ctattgctgg tttcctagaa 1200
ggaggatggg aaggaatgat tgcaggctgg cacggataca catctcacgg agcacatgga 1260
gtggcagtgg cggcggacct taagagtacg caagaagcta taaacaagat aacaaaaaat 1320
ctcaattctt tgagtgagct agaagtaaag aatcttcaaa gactaagtgg tgccatggat 1380
gaactccaca acgaaatact cgagctggat gagaaagtgg atgatctcag agctgacact 1440
ataagctcgc aaatagaact tgcagtcttg ctttccaacg aaggaataat aaacagtgaa 1500
gatgagcatc tattggcact tgagagaaaa ctaaagaaaa tgctgggtcc ctctgctgta 1560
gagataggaa atggatgctt cgaaaccaaa cacaagtgca accagacctg cttagacagg 1620
atagctgctg gcacctttaa tgcaggagaa ttttctctcc ccacttttga ttcactgaac 1680
attactgctg catctttaaa tgatgatgga ttggataacc atactatact gctctattac 1740
tcaactgctg cttctagttt ggctgtaaca ttgatgctag ctatttttat tgtttatatg 1800
gtctccagag acaacgtttc atgctccatc tgtctataag agctc 1845
<210> 42
<211> 1779
<212> DNA
<213> Artificial sequence
<220>
<223> clone 780 - nucleotide sequence of A/Singapore/1/57 (H2N2)
<400> 42
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatggcc atcatttatc taattctcct gttcacagca 120
gtgagagggg accaaatatg cattggatac catgccaata attccacaga gaaggtcgac 180
acaattctag agcggaacgt cactgtgact catgccaagg acattcttga gaagacccat 240
aacggaaagt tatgcaaact aaacggaatc cctccacttg aactagggga ctgtagcatt 300
gccggatggc tccttggaaa tccagaatgt gataggcttc taagtgtgcc agaatggtcc 360
tatataatgg agaaagaaaa cccgagagac ggtttgtgtt atccaggcag cttcaatgat 420
tatgaagaat tgaaacatct cctcagcagc gtgaaacatt tcgagaaagt aaagattctg 480
cccaaagata gatggacaca gcatacaaca actggaggtt cacgggcctg cgcggtgtct 540
ggtaatccat cattcttcag gaacatggtc tggctgacaa agaaagaatc aaattatccg 600
gttgccaaag gatcgtacaa caatacaagc ggagaacaaa tgctaataat ttggggggtg 660
caccatccca atgatgagac agaacaaaga acattgtacc agaatgtggg aacctatgtt 720
tccgtaggca catcaacatt gaacaaaagg tcaaccccag acatagcaac aaggcctaaa 780
gtgaatggac taggaagtag aatggagttc tcttggaccc tattggatat gtgggacacc 840
ataaattttg agagtactgg taatctaatt gcaccagagt atggattcaa aatatcgaaa 900
agaggtagtt cagggatcat gaaaacagaa ggaacacttg agaactgtga gaccaaatgc 960
caaactcctt tgggagcaat aaatacaaca ttgccttttc acaatgtcca cccactgaca 1020
ataggtgagt gccccaaata tgtaaaatcg gagaagttgg tcttagcaac aggactaagg 1080
aatgttcccc agattgaatc aagaggattg tttggggcaa tagctggttt tatagaagga 1140
ggatggcaag gaatggttga tggttggtat ggataccatc acagcaatga ccagggatca 1200
gggtatgcag cagacaaaga atccactcaa aaggcatttg atggaatcac caacaaggta 1260
aattctgtga ttgaaaagat gaacacccaa tttgaagctg ttgggaaaga gttcagtaac 1320
ttagagagaa gactggagaa cttgaacaaa aagatggaag acgggtttct agatgtgtgg 1380
acatacaatg ctgagcttct agttctgatg gaaaatgaga ggacacttga ctttcatgat 1440
tctaatgtca agaatctgta tgataaagtc agaatgcagc tgagagacaa cgtcaaagaa 1500
ctaggaaatg gatgttttga attttatcac aaatgtgatg atgaatgcat gaatagtgtg 1560
aaaaacggga cgtatgatta tcccaagtat gaagaagagt ctaaactaaa tagaaatgaa 1620
atcaaagggg taaaattgag cagcatgggg gtttatcaaa tccttgccat ttatgctaca 1680
gtagcaggtt ctctgtcact ggcaatcatg atggctggga tctctttctg gatgtgctcc 1740
aacgggtctc tgcagtgcag gatctgcata tgagagctc 1779
<210> 43
<211> 1794
<212> DNA
<213> Artificial sequence
<220>
<223> clone 781 - nucleotide sequence of A/Anhui/1/2005 (H5N1)
<400> 43
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatggag aaaatagtgc ttcttcttgc aatagtcagc 120
cttgttaaaa gtgatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 180
gacacaataa tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 240
cacaacggga agctctgcga tctagatgga gtgaagcctc tgattttaag agattgtagt 300
gtagctggat ggctcctcgg aaacccaatg tgtgacgagt tcatcaatgt gccggaatgg 360
tcttacatag tggagaaggc caacccagcc aatgacctct gttacccagg gaatttcaac 420
gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 480
atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gggtcagctc agcatgtcca 540
taccagggaa cgccctcctt tttcagaaat gtggtatggc ttatcaaaaa gaacaataca 600
tacccaacaa taaagagaag ctacaataat accaaccagg aagatctttt gatactgtgg 660
gggattcatc attctaatga tgcggcagag cagacaaagc tctatcaaaa cccaaccacc 720
tatatttccg ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga 780
tccaaagtaa acgggcaaag tggaaggatg gatttcttct ggacaatttt aaaaccgaat 840
gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 900
gtcaagaaag gggactcagc aattgttaaa agtgaagtgg aatatggtaa ctgcaataca 960
aagtgtcaaa ctccaatagg ggcgataaac tctagtatgc cattccacaa catacaccct 1020
ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca aattagtcct tgcgactggg 1080
ctcagaaata gtcctctaag agaaagaaga agaaaaagag gactatttgg agctatagca 1140
gggtttatag agggaggatg gcagggaatg gtagatggtt ggtatgggta ccaccatagc 1200
aatgagcagg ggagtgggta cgctgcagac aaagaatcca ctcaaaaggc aatagatgga 1260
gtcaccaata aggtcaactc gatcattgac aaaatgaaca ctcagtttga ggccgttgga 1320
agggaattta ataacttaga aaggagaata gagaatttaa acaagaaaat ggaagacgga 1380
ttcctagatg tctggactta taatgctgaa cttctggttc tcatggaaaa tgagagaact 1440
ctagacttcc atgattcaaa tgtcaagaac ctttacgaca aggtccgact acagcttagg 1500
gataatgcaa aggagctggg taacggttgt ttcgagttct atcacaaatg tgataatgaa 1560
tgtatggaaa gtgtaagaaa cggaacgtat gactacccgc agtattcaga agaagcaaga 1620
ttaaaaagag aggaaataag tggagtaaaa ttggaatcaa taggaactta ccaaatactg 1680
tcaatttatt caacagttgc gagttctcta gcactggcaa tcatggtggc tggtctatct 1740
ttgtggatgt gctccaatgg gtcgttacaa tgcagaattt gcatttaaga gctc 1794
<210> 44
<211> 1797
<212> DNA
<213> Artificial sequence
<220>
<223> clone 782 - nucleotide sequence of A/Vietnam/1194/2004 (H5N1)
<400> 44
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatggag aaaatagtgc ttctttttgc aatagtcagt 120
cttgttaaaa gtgatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 180
gacacaataa tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 240
cacaatggga agctctgcga tctagatgga gtgaagcctc taattttgag agattgtagt 300
gtagctggat ggctcctcgg aaacccaatg tgtgacgagt tcatcaatgt gccggaatgg 360
tcttacatag tggagaaggc caatccagtc aatgacctct gttacccagg ggatttcaat 420
gactatgaag aattgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 480
atccccaaaa gttcttggtc cagtcatgaa gcctcattgg gggtcagctc agcatgtcca 540
taccagggaa agtcctcctt tttcagaaat gtggtatggc ttatcaaaaa gaacagtaca 600
tacccaacaa taaagaggag ctacaataat accaaccaag aagatctttt ggtactgtgg 660
gggattcacc atcctaatga tgcggcagag cagacaaagc tctatcaaaa cccaaccacc 720
tatatttccg ttgggacatc tacactaaac cagagattgg taccaagaat agctactaga 780
tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaaccgaat 840
gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 900
gtcaagaaag gggactcaac aattatgaaa agtgaattgg aatatggtaa ctgcaatacc 960
aagtgtcaaa ctccaatggg ggcgataaac tctagcatgc cattccacaa tatacaccct 1020
ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca gattagtcct tgcgactggg 1080
ctcagaaata gccctcaaag agagagaaga agaaaaaaga gaggattatt tggagctata 1140
gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat 1200
agcaacgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat 1260
ggagtcacca ataaggtcaa ctcgattatt gacaaaatga acactcagtt tgaggccgtt 1320
ggaagggaat ttaacaactt agaaaggaga atagagaatt taaacaagaa gatggaagac 1380
gggttcctag atgtctggac ttataatgct gaacttctag ttctcatgga aaacgagaga 1440
actctagact ttcatgactc aaatgtcaag aacctttacg acaaggtccg actacagctt 1500
agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcataa atgtgataat 1560
gaatgtatgg aaagtgtaag aaacggaacg tatgactacc cgcagtattc agaagaagca 1620
agactaaaaa gagaggaaat aagtggagta aaattggaat caataggaat ttaccaaata 1680
ttgtcaattt attctacagt ggccagctcc ctagcactgg caatcatggt agctggtcta 1740
tccttatgga tgtgctccaa tgggtcgtta caatgcagaa tttgcattta agagctc 1797
<210> 45
<211> 1791
<212> DNA
<213> Artificial sequence
<220>
<223> clone 783 - nucleotide sequence of A/Teal/HongKong/W312/97 (H6N1)
<400> 45
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgatt gcaatcattg taatagcaat actggcagca 120
gccggaaagt cagacaagat ctgcattggg tatcatgcca acaattcaac aacacaggta 180
gatacgatac ttgagaagaa tgtgactgtc acacactcaa ttgaattgct ggaaaatcag 240
aaggaagaaa gattctgcaa gatattgaac aaggcccctc tcgacttaag ggaatgtacc 300
atagagggtt ggatcttggg gaatccccaa tgcgacctat tgcttggtga tcaaagctgg 360
tcatacattg tggaaagacc tactgctcaa aacgggatct gctacccagg aaccttaaat 420
gaggtagaag aactgagggc acttattgga tcaggagaaa gggtagagag atttgagatg 480
tttccccaaa gcacctggca aggagttgac accaacagtg gaacaacaag atcctgccct 540
tattctactg gtgcgtcttt ctacagaaac ctcctatgga taataaaaac caagacagca 600
gaatatccag taattaaggg aatttacaac aacactggaa cccagccaat cctctatttc 660
tggggtgtgc atcatcctcc taacaccgac gagcaagata ctctgtatgg ctctggtgat 720
cgatacgtta gaatgggaac tgaaagcatg aattttgcca agagtccgga aattgcggca 780
aggcctgctg tgaatggaca aagaggcaga attgattatt attggtcggt tttaaaacca 840
ggggaaacct tgaatgtgga atctaatgga aatctaatcg ccccttggta tgcatacaaa 900
tttgtcaaca caaatagtaa aggagccgtc ttcaggtcag atttaccaat cgagaactgc 960
gatgccacat gccagactat tgcaggggtt ctaaggacca ataaaacatt tcagaatgtg 1020
agtcccctgt ggataggaga atgtcccaaa tacgtgaaaa gtgaaagtct gaggcttgca 1080
actggactaa gaaatgttcc acagattgaa actagaggac tcttcggagc tattgcaggg 1140
tttattgaag gaggatggac tgggatgata gatgggtggt atggctatca ccatgaaaat 1200
tctcaagggt caggatatgc agcagacaga gaaagcactc aaaaggctgt aaacagaatt 1260
acaaataagg tcaattccat catcaacaaa atgaacacac aatttgaagc tgtcgatcac 1320
gaattttcaa atctggagag gagaattgac aatctgaaca aaagaatgca agatggattt 1380
ctggatgttt ggacatacaa tgctgaactg ttggttcttc ttgaaaacga aagaacacta 1440
gacatgcatg acgcaaatgt gaagaaccta catgaaaagg tcaaatcaca actaagggac 1500
aatgctacga tcttagggaa tggttgcttt gaattttggc ataagtgtga caatgaatgc 1560
atagagtctg tcaaaaatgg tacatatgac tatcccaaat accagactga aagcaaatta 1620
aacaggctaa aaatagaatc agtaaagcta gagaaccttg gtgtgtatca aattcttgcc 1680
atttatagta cggtatcgag cagcctagtg ttggtagggc tgatcatggc aatgggtctt 1740
tggatgtgtt caaatggttc aatgcagtgc aggatatgta tataagagct c 1791
<210> 46
<211> 1803
<212> DNA
<213> Artificial sequence
<220>
<223> clone 784 - nucleotide sequence of A/Equine/Prague/56 (H7N7)
<400> 46
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaac actcaaattc taatattagc cacttcggca 120
ttcttctatg tacgtgcaga taaaatctgc ctaggacatc atgctgtgtc taatggaacc 180
aaagtagaca cccttactga aaaaggaata gaagttgtca atgcaacaga aacagttgaa 240
caaacaaaca tccctaagat ctgctcaaaa ggaaaacaga ctgttgacct tggtcaatgt 300
ggattactag ggaccgttat tggtcctccc caatgtgacc aatttcttga gttctctgct 360
aatttaatag ttgaaagaag ggaaggtaat gacatttgtt atccaggcaa atttgacaat 420
gaagaaacat tgagaaaaat actcagaaaa tccggaggaa ttaaaaagga gaatatggga 480
ttcacatata ccggagtgag aaccaatgga gagactagcg catgtagaag gtcaagatct 540
tccttttatg cagagatgaa atggcttcta tccagcacag acaatgggac atttccacaa 600
atgacaaagt cctacaagaa cactaagaag gtaccagctc tgataatctg gggaatccac 660
cactcaggat caactactga acagactaga ttatatggaa gtgggaataa attgataaca 720
gtttggagtt ccaaatacca acaatctttt gtcccaaatc ctggaccaag accgcaaatg 780
aatggtcaat caggaagaat tgactttcac tggctgatgc tagatcccaa tgatactgtc 840
actttcagtt ttaatggggc ctttatagca cctgaccgcg ccagttttct aagaggtaaa 900
tctctaggaa tccaaagtga tgcacaactt gacaataatt gtgaaggtga atgctatcat 960
attggaggta ctataattag caacttgccc tttcaaaaca ttaatagtag ggcaatcgga 1020
aaatgcccca gatacgtgaa gcagaagagc ttaatgctag caacaggaat gaaaaatgtt 1080
cctgaagctc ctgcacataa acaactaact catcacatgc gcaaaaaaag aggtttattt 1140
ggtgcaatag caggattcat tgaaaatggg tgggaaggat taatagacgg atggtatgga 1200
tataagcatc agaatgcaca aggagaaggg actgctgcag actacaaaag tacacaatct 1260
gctatcaacc aaataaccgg aaaattgaac agactaatag aaaaaaccaa ccagcaattc 1320
gaactaatag ataatgagtt caatgaaata gaaaaacaaa ttggcaatgt tattaactgg 1380
actagagatt ctatcatcga agtatggtca tataatgcag agttcctcgt agcagtggag 1440
aatcaacaca ctattgattt aactgactca gaaatgaaca aactatatga aaaggtaaga 1500
agacaactga gagaaaatgc tgaggaagat ggtaatggct gttttgaaat attccaccaa 1560
tgtgacaatg attgcatggc cagcattaga aacaacacat atgaccataa aaaatacaga 1620
aaagaggcaa tacaaaacag aatccagatt gacgcagtaa agttgagcag tggttacaaa 1680
gatataatac tttggtttag cttcggggca tcatgtttct tatttcttgc cattgcaatg 1740
ggtcttgttt tcatatgtat aaaaaatgga aacatgcggt gcactatttg tatataagag 1800
ctc 1803
<210> 47
<211> 1773
<212> DNA
<213> Artificial sequence
<220>
<223> clone 785 - nucleotide sequence of A/HongKong/1073/99 (H9N2)
<400> 47
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatggaa acaatatcac taataactat actactagta 120
gtaacagcaa gcaatgcaga taaaatctgc atcggccacc agtcaacaaa ctccacagaa 180
actgtggaca cgctaacaga aaccaatgtt cctgtgacac atgccaaaga attgctccac 240
acagagcata atggaatgct gtgtgcaaca agcctgggac atcccctcat tctagacaca 300
tgcactattg aaggactagt ctatggcaac ccttcttgtg acctgctgtt gggaggaaga 360
gaatggtcct acatcgtcga aagatcatca gctgtaaatg gaacgtgtta ccctgggaat 420
gtagaaaacc tagaggaact caggacactt tttagttccg ctagttccta ccaaagaatc 480
caaatcttcc cagacacaac ctggaatgtg acttacactg gaacaagcag agcatgttca 540
ggttcattct acaggagtat gagatggctg actcaaaaga gcggttttta ccctgttcaa 600
gacgcccaat acacaaataa caggggaaag agcattcttt tcgtgtgggg catacatcac 660
ccacccacct ataccgagca aacaaatttg tacataagaa acgacacaac aacaagcgtg 720
acaacagaag atttgaatag gaccttcaaa ccagtgatag ggccaaggcc ccttgtcaat 780
ggtctgcagg gaagaattga ttattattgg tcggtactaa aaccaggcca aacattgcga 840
gtacgatcca atgggaatct aattgctcca tggtatggac acgttctttc aggagggagc 900
catggaagaa tcctgaagac tgatttaaaa ggtggtaatt gtgtagtgca atgtcagact 960
gaaaaaggtg gcttaaacag tacattgcca ttccacaata tcagtaaata tgcatttgga 1020
acctgcccca aatatgtaag agttaatagt ctcaaactgg cagtcggtct gaggaacgtg 1080
cctgctagat caagtagagg actatttgga gccatagctg gattcataga aggaggttgg 1140
ccaggactag tcgctggctg gtatggtttc cagcattcaa atgatcaagg ggttggtatg 1200
gctgcagata gggattcaac tcaaaaggca attgataaaa taacatccaa ggtgaataat 1260
atagtcgaca agatgaacaa gcaatatgaa ataattgatc atgaatttag tgaggttgaa 1320
actagactca atatgatcaa taataagatt gatgaccaaa tacaagacgt atgggcatat 1380
aatgcagaat tgctagtact acttgaaaat caaaaaacac tcgatgagca tgatgcgaac 1440
gtgaacaatc tatataacaa ggtgaagagg gcactgggct ccaatgctat ggaagatggg 1500
aaaggctgtt tcgagctata ccataaatgt gatgatcagt gcatggaaac aattcggaac 1560
gggacctata ataggagaaa gtatagagag gaatcaagac tagaaaggca gaaaatagag 1620
ggggttaagc tggaatctga gggaacttac aaaatcctca ccatttattc gactgtcgcc 1680
tcatctcttg tgcttgcaat ggggtttgct gccttcctgt tctgggccat gtccaatgga 1740
tcttgcagat gcaacatttg tatataagag ctc 1773
<210> 48
<211> 565
<212> PRT
<213> Artificial sequence
<220>
<223> clone 774 (A/Brisbane/59/2007 (H1N1)
<400> 48
Met Lys Val Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr
1 5 10 15
Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr
20 25 30
Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn
35 40 45
Leu Leu Glu Asn Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile
50 55 60
Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly
65 70 75 80
Asn Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile
85 90 95
Val Glu Lys Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly His Phe
100 105 110
Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe
115 120 125
Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr
130 135 140
Val Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser Ser Phe
145 150 155 160
Tyr Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn
165 170 175
Leu Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu
180 185 190
Trp Gly Val His His Pro Pro Asn Ile Gly Asp Gln Lys Ala Leu Tyr
195 200 205
His Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg
210 215 220
Lys Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu
225 230 235 240
Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile
245 250 255
Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Arg Tyr Ala Phe Ala
260 265 270
Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Asn Ser Asn Ala Pro Met
275 280 285
Asp Lys Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser
290 295 300
Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro
305 310 315 320
Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn
325 330 335
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
340 345 350
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
355 360 365
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr
370 375 380
Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu
385 390 395 400
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu
405 410 415
Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Ile
420 425 430
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
435 440 445
Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
450 455 460
Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
465 470 475 480
Phe Glu Phe Tyr His Lys Cys Asn Asp Glu Cys Met Glu Ser Val Lys
485 490 495
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn
500 505 510
Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln
515 520 525
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val
530 535 540
Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln
545 550 555 560
Cys Arg Ile Cys Ile
565
<210> 49
<211> 565
<212> PRT
<213> Artificial sequence
<220>
<223> clone 775 (A/Solomon Islands 3/2006 (H1N1)
<400> 49
Met Lys Val Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr
1 5 10 15
Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr
20 25 30
Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn
35 40 45
Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile
50 55 60
Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly
65 70 75 80
Asn Pro Glu Cys Glu Leu Leu Ile Ser Arg Glu Ser Trp Ser Tyr Ile
85 90 95
Val Glu Lys Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly His Phe
100 105 110
Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe
115 120 125
Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr
130 135 140
Thr Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser Ser Phe
145 150 155 160
Tyr Lys Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn
165 170 175
Leu Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu
180 185 190
Trp Gly Val His His Pro Pro Asn Ile Gly Asp Gln Arg Ala Leu Tyr
195 200 205
His Lys Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg
210 215 220
Lys Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu
225 230 235 240
Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile
245 250 255
Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Arg Tyr Ala Phe Ala
260 265 270
Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Asn Ser Asn Ala Pro Met
275 280 285
Asp Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser
290 295 300
Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro
305 310 315 320
Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn
325 330 335
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
340 345 350
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
355 360 365
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr
370 375 380
Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu
385 390 395 400
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu
405 410 415
Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Ile
420 425 430
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
435 440 445
Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
450 455 460
Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
465 470 475 480
Phe Glu Phe Tyr His Lys Cys Asn Asp Glu Cys Met Glu Ser Val Lys
485 490 495
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn
500 505 510
Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln
515 520 525
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val
530 535 540
Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln
545 550 555 560
Cys Arg Ile Cys Ile
565
<210> 50
<211> 566
<212> PRT
<213> Artificial sequence
<220>
<223> clone 776 (A/Brisbane/10/2007 (H3N2)
<400> 50
Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Leu Cys Leu Val Phe Thr
1 5 10 15
Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly
20 25 30
His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp
35 40 45
Gln Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ser Ser Thr
50 55 60
Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys
65 70 75 80
Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln
85 90 95
Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn
100 105 110
Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val
115 120 125
Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Thr
130 135 140
Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Asn
145 150 155 160
Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Lys Phe Lys
165 170 175
Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Lys Phe Asp Lys
180 185 190
Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Asn Asp Gln Ile
195 200 205
Phe Leu Tyr Ala Gln Ala Ser Gly Arg Ile Thr Val Ser Thr Lys Arg
210 215 220
Ser Gln Gln Thr Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Val Arg
225 230 235 240
Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly
245 250 255
Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly
260 265 270
Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala
275 280 285
Pro Ile Gly Lys Cys Asn Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile
290 295 300
Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala
305 310 315 320
Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met
325 330 335
Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala
340 345 350
Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly
355 360 365
Phe Arg His Gln Asn Ser Glu Gly Ile Gly Gln Ala Ala Asp Leu Lys
370 375 380
Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu
385 390 395 400
Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser
405 410 415
Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr
420 425 430
Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu
435 440 445
Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe
450 455 460
Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn
465 470 475 480
Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser
485 490 495
Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu
500 505 510
Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys
515 520 525
Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys
530 535 540
Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile
545 550 555 560
Arg Cys Asn Ile Cys Ile
565
<210> 51
<211> 566
<212> PRT
<213> Artificial sequence
<220>
<223> clone 777 (A/Wisconsin/67/2005 (H3N2)
<400> 51
Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Leu Cys Leu Val Phe Thr
1 5 10 15
Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly
20 25 30
His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp
35 40 45
Gln Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ser Ser Thr
50 55 60
Gly Gly Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys
65 70 75 80
Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln
85 90 95
Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn
100 105 110
Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val
115 120 125
Ala Ser Ser Gly Thr Leu Glu Phe Asn Asp Glu Ser Phe Asn Trp Thr
130 135 140
Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Lys Arg Arg Ser Asn
145 150 155 160
Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Lys Phe Lys
165 170 175
Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Lys Phe Asp Lys
180 185 190
Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Asn Asp Gln Ile
195 200 205
Phe Leu His Ala Gln Ala Ser Gly Arg Ile Thr Val Ser Thr Lys Arg
210 215 220
Ser Gln Gln Thr Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg
225 230 235 240
Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly
245 250 255
Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly
260 265 270
Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala
275 280 285
Pro Ile Gly Lys Cys Asn Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile
290 295 300
Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala
305 310 315 320
Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met
325 330 335
Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala
340 345 350
Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly
355 360 365
Phe Arg His Gln Asn Ser Glu Gly Ile Gly Gln Ala Ala Asp Leu Lys
370 375 380
Ser Thr Gln Ala Ala Ile Asn Gln Ile Asn Gly Lys Leu Asn Arg Leu
385 390 395 400
Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser
405 410 415
Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr
420 425 430
Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu
435 440 445
Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe
450 455 460
Glu Arg Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn
465 470 475 480
Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser
485 490 495
Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu
500 505 510
Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys
515 520 525
Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys
530 535 540
Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile
545 550 555 560
Arg Cys Asn Ile Cys Ile
565
<210> 52
<211> 585
<212> PRT
<213> Artificial sequence
<220>
<223> clone 778 (B/Malaysia/2506/2004)
<400> 52
Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp
1 5 10 15
Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys
20 25 30
Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr
35 40 45
Thr Thr Pro Thr Lys Ser His Phe Ala Asn Leu Lys Gly Thr Glu Thr
50 55 60
Arg Gly Lys Leu Cys Pro Lys Cys Leu Asn Cys Thr Asp Leu Asp Val
65 70 75 80
Ala Leu Gly Arg Pro Lys Cys Thr Gly Asn Ile Pro Ser Ala Arg Val
85 90 95
Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro Ile
100 105 110
Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Lys Leu Leu Arg Gly
115 120 125
Tyr Glu His Ile Arg Leu Ser Thr His Asn Val Ile Asn Ala Glu Asn
130 135 140
Ala Pro Gly Gly Pro Tyr Lys Ile Gly Thr Ser Gly Ser Cys Pro Asn
145 150 155 160
Val Thr Asn Gly Asn Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro
165 170 175
Lys Asn Asp Asn Asn Lys Thr Ala Thr Asn Ser Leu Thr Ile Glu Val
180 185 190
Pro Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe
195 200 205
His Ser Asp Asn Glu Thr Gln Met Ala Lys Leu Tyr Gly Asp Ser Lys
210 215 220
Pro Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val
225 230 235 240
Ser Gln Ile Gly Gly Phe Pro Asn Gln Thr Glu Asp Gly Gly Leu Pro
245 250 255
Gln Ser Gly Arg Ile Val Val Asp Tyr Met Val Gln Lys Ser Gly Lys
260 265 270
Thr Gly Thr Ile Thr Tyr Gln Arg Gly Ile Leu Leu Pro Gln Lys Val
275 280 285
Trp Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu
290 295 300
Ile Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys
305 310 315 320
Ser Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys
325 330 335
Pro Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr
340 345 350
Arg Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala Ile
355 360 365
Ala Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His
370 375 380
Gly Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu
385 390 395 400
Lys Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser
405 410 415
Leu Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met
420 425 430
Asp Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp
435 440 445
Leu Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu
450 455 460
Ser Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu
465 470 475 480
Glu Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile Gly
485 490 495
Asn Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp
500 505 510
Arg Ile Ala Ala Gly Thr Phe Asp Ala Gly Glu Phe Ser Leu Pro Thr
515 520 525
Phe Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu
530 535 540
Asp Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu
545 550 555 560
Ala Val Thr Leu Met Ile Ala Ile Phe Val Val Tyr Met Val Ser Arg
565 570 575
Asp Asn Val Ser Cys Ser Ile Cys Leu
580 585
<210> 53
<211> 584
<212> PRT
<213> Artificial
<220>
<223> clone 779 (B/Florida/4/2006)
<400> 53
Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp
1 5 10 15
Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys
20 25 30
Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr
35 40 45
Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg Thr
50 55 60
Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp Val
65 70 75 80
Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys Ala
85 90 95
Ser Ile Leu His Glu Val Lys Pro Val Thr Ser Gly Cys Phe Pro Ile
100 105 110
Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg Gly
115 120 125
Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu Lys
130 135 140
Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn
145 150 155 160
Ala Thr Ser Lys Ser Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro
165 170 175
Lys Asp Asn Asn Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro
180 185 190
Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe His
195 200 205
Ser Asp Asn Lys Thr Gln Met Lys Asn Leu Tyr Gly Asp Ser Asn Pro
210 215 220
Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser
225 230 235 240
Gln Ile Gly Ser Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro Gln
245 250 255
Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys Thr
260 265 270
Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val Trp
275 280 285
Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu Ile
290 295 300
Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys Ser
305 310 315 320
Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys Pro
325 330 335
Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg
340 345 350
Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala Ile Ala
355 360 365
Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His Gly
370 375 380
Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu Lys
385 390 395 400
Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu
405 410 415
Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met Asp
420 425 430
Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp Leu
435 440 445
Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu Ser
450 455 460
Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu Glu
465 470 475 480
Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile Gly Asn
485 490 495
Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp Arg
500 505 510
Ile Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr Phe
515 520 525
Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp
530 535 540
Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu Ala
545 550 555 560
Val Thr Leu Met Leu Ala Ile Phe Ile Val Tyr Met Val Ser Arg Asp
565 570 575
Asn Val Ser Cys Ser Ile Cys Leu
580
<210> 54
<211> 562
<212> PRT
<213> Artificial sequence
<220>
<223> clone 780 (A/Singapore/1/57 (H2N2))
<400> 54
Met Ala Ile Ile Tyr Leu Ile Leu Leu Phe Thr Ala Val Arg Gly Asp
1 5 10 15
Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Lys Val Asp
20 25 30
Thr Ile Leu Glu Arg Asn Val Thr Val Thr His Ala Lys Asp Ile Leu
35 40 45
Glu Lys Thr His Asn Gly Lys Leu Cys Lys Leu Asn Gly Ile Pro Pro
50 55 60
Leu Glu Leu Gly Asp Cys Ser Ile Ala Gly Trp Leu Leu Gly Asn Pro
65 70 75 80
Glu Cys Asp Arg Leu Leu Ser Val Pro Glu Trp Ser Tyr Ile Met Glu
85 90 95
Lys Glu Asn Pro Arg Asp Gly Leu Cys Tyr Pro Gly Ser Phe Asn Asp
100 105 110
Tyr Glu Glu Leu Lys His Leu Leu Ser Ser Val Lys His Phe Glu Lys
115 120 125
Val Lys Ile Leu Pro Lys Asp Arg Trp Thr Gln His Thr Thr Thr Gly
130 135 140
Gly Ser Arg Ala Cys Ala Val Ser Gly Asn Pro Ser Phe Phe Arg Asn
145 150 155 160
Met Val Trp Leu Thr Lys Lys Glu Ser Asn Tyr Pro Val Ala Lys Gly
165 170 175
Ser Tyr Asn Asn Thr Ser Gly Glu Gln Met Leu Ile Ile Trp Gly Val
180 185 190
His His Pro Asn Asp Glu Thr Glu Gln Arg Thr Leu Tyr Gln Asn Val
195 200 205
Gly Thr Tyr Val Ser Val Gly Thr Ser Thr Leu Asn Lys Arg Ser Thr
210 215 220
Pro Asp Ile Ala Thr Arg Pro Lys Val Asn Gly Leu Gly Ser Arg Met
225 230 235 240
Glu Phe Ser Trp Thr Leu Leu Asp Met Trp Asp Thr Ile Asn Phe Glu
245 250 255
Ser Thr Gly Asn Leu Ile Ala Pro Glu Tyr Gly Phe Lys Ile Ser Lys
260 265 270
Arg Gly Ser Ser Gly Ile Met Lys Thr Glu Gly Thr Leu Glu Asn Cys
275 280 285
Glu Thr Lys Cys Gln Thr Pro Leu Gly Ala Ile Asn Thr Thr Leu Pro
290 295 300
Phe His Asn Val His Pro Leu Thr Ile Gly Glu Cys Pro Lys Tyr Val
305 310 315 320
Lys Ser Glu Lys Leu Val Leu Ala Thr Gly Leu Arg Asn Val Pro Gln
325 330 335
Ile Glu Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly
340 345 350
Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn
355 360 365
Asp Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala
370 375 380
Phe Asp Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn
385 390 395 400
Thr Gln Phe Glu Ala Val Gly Lys Glu Phe Ser Asn Leu Glu Arg Arg
405 410 415
Leu Glu Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp
420 425 430
Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu
435 440 445
Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Met
450 455 460
Gln Leu Arg Asp Asn Val Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe
465 470 475 480
Tyr His Lys Cys Asp Asp Glu Cys Met Asn Ser Val Lys Asn Gly Thr
485 490 495
Tyr Asp Tyr Pro Lys Tyr Glu Glu Glu Ser Lys Leu Asn Arg Asn Glu
500 505 510
Ile Lys Gly Val Lys Leu Ser Ser Met Gly Val Tyr Gln Ile Leu Ala
515 520 525
Ile Tyr Ala Thr Val Ala Gly Ser Leu Ser Leu Ala Ile Met Met Ala
530 535 540
Gly Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile
545 550 555 560
Cys Ile
<210> 55
<211> 567
<212> PRT
<213> Artificial sequence
<220>
<223> clone 781 (A/Anhui/1/2005 (H5N1))
<400> 55
Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser
1 5 10 15
Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val
20 25 30
Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile
35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys
50 55 60
Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn
65 70 75 80
Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val
85 90 95
Glu Lys Ala Asn Pro Ala Asn Asp Leu Cys Tyr Pro Gly Asn Phe Asn
100 105 110
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu
115 120 125
Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser
130 135 140
Ser Gly Val Ser Ser Ala Cys Pro Tyr Gln Gly Thr Pro Ser Phe Phe
145 150 155 160
Arg Asn Val Val Trp Leu Ile Lys Lys Asn Asn Thr Tyr Pro Thr Ile
165 170 175
Lys Arg Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Ile Leu Trp
180 185 190
Gly Ile His His Ser Asn Asp Ala Ala Glu Gln Thr Lys Leu Tyr Gln
195 200 205
Asn Pro Thr Thr Tyr Ile Ser Val Gly Thr Ser Thr Leu Asn Gln Arg
210 215 220
Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly
225 230 235 240
Arg Met Asp Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn
245 250 255
Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile
260 265 270
Val Lys Lys Gly Asp Ser Ala Ile Val Lys Ser Glu Val Glu Tyr Gly
275 280 285
Asn Cys Asn Thr Lys Cys Gln Thr Pro Ile Gly Ala Ile Asn Ser Ser
290 295 300
Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys
305 310 315 320
Tyr Val Lys Ser Asn Lys Leu Val Leu Ala Thr Gly Leu Arg Asn Ser
325 330 335
Pro Leu Arg Glu Arg Arg Arg Lys Arg Gly Leu Phe Gly Ala Ile Ala
340 345 350
Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly
355 360 365
Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu
370 375 380
Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser Ile
385 390 395 400
Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe Asn
405 410 415
Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp Gly
420 425 430
Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu
435 440 445
Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr
450 455 460
Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly Asn
465 470 475 480
Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser
485 490 495
Val Arg Asn Gly Thr Tyr Asp Tyr Pro Gln Tyr Ser Glu Glu Ala Arg
500 505 510
Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly Thr
515 520 525
Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu
530 535 540
Ala Ile Met Val Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly Ser
545 550 555 560
Leu Gln Cys Arg Ile Cys Ile
565
<210> 56
<211> 568
<212> PRT
<213> Artificial sequence
<220>
<223> clone 782 (A/Vietnam/1194/2004 (H5N1))
<400> 56
Met Glu Lys Ile Val Leu Leu Phe Ala Ile Val Ser Leu Val Lys Ser
1 5 10 15
Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val
20 25 30
Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile
35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys
50 55 60
Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn
65 70 75 80
Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val
85 90 95
Glu Lys Ala Asn Pro Val Asn Asp Leu Cys Tyr Pro Gly Asp Phe Asn
100 105 110
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu
115 120 125
Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Ser His Glu Ala Ser
130 135 140
Leu Gly Val Ser Ser Ala Cys Pro Tyr Gln Gly Lys Ser Ser Phe Phe
145 150 155 160
Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile
165 170 175
Lys Arg Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp
180 185 190
Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Lys Leu Tyr Gln
195 200 205
Asn Pro Thr Thr Tyr Ile Ser Val Gly Thr Ser Thr Leu Asn Gln Arg
210 215 220
Leu Val Pro Arg Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly
225 230 235 240
Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn
245 250 255
Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile
260 265 270
Val Lys Lys Gly Asp Ser Thr Ile Met Lys Ser Glu Leu Glu Tyr Gly
275 280 285
Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser
290 295 300
Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys
305 310 315 320
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser
325 330 335
Pro Gln Arg Glu Arg Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile
340 345 350
Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr
355 360 365
Gly Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys
370 375 380
Glu Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser
385 390 395 400
Ile Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe
405 410 415
Asn Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp
420 425 430
Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met
435 440 445
Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu
450 455 460
Tyr Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly
465 470 475 480
Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu
485 490 495
Ser Val Arg Asn Gly Thr Tyr Asp Tyr Pro Gln Tyr Ser Glu Glu Ala
500 505 510
Arg Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly
515 520 525
Ile Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala
530 535 540
Leu Ala Ile Met Val Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly
545 550 555 560
Ser Leu Gln Cys Arg Ile Cys Ile
565
<210> 57
<211> 566
<212> PRT
<213> Artificial sequence
<220>
<223> clone 783 (A/Teal/HongKong/W312/97 (H6N1))
<400> 57
Met Ile Ala Ile Ile Val Ile Ala Ile Leu Ala Ala Ala Gly Lys Ser
1 5 10 15
Asp Lys Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Thr Gln Val
20 25 30
Asp Thr Ile Leu Glu Lys Asn Val Thr Val Thr His Ser Ile Glu Leu
35 40 45
Leu Glu Asn Gln Lys Glu Glu Arg Phe Cys Lys Ile Leu Asn Lys Ala
50 55 60
Pro Leu Asp Leu Arg Glu Cys Thr Ile Glu Gly Trp Ile Leu Gly Asn
65 70 75 80
Pro Gln Cys Asp Leu Leu Leu Gly Asp Gln Ser Trp Ser Tyr Ile Val
85 90 95
Glu Arg Pro Thr Ala Gln Asn Gly Ile Cys Tyr Pro Gly Thr Leu Asn
100 105 110
Glu Val Glu Glu Leu Arg Ala Leu Ile Gly Ser Gly Glu Arg Val Glu
115 120 125
Arg Phe Glu Met Phe Pro Gln Ser Thr Trp Gln Gly Val Asp Thr Asn
130 135 140
Ser Gly Thr Thr Arg Ser Cys Pro Tyr Ser Thr Gly Ala Ser Phe Tyr
145 150 155 160
Arg Asn Leu Leu Trp Ile Ile Lys Thr Lys Thr Ala Glu Tyr Pro Val
165 170 175
Ile Lys Gly Ile Tyr Asn Asn Thr Gly Thr Gln Pro Ile Leu Tyr Phe
180 185 190
Trp Gly Val His His Pro Pro Asn Thr Asp Glu Gln Asp Thr Leu Tyr
195 200 205
Gly Ser Gly Asp Arg Tyr Val Arg Met Gly Thr Glu Ser Met Asn Phe
210 215 220
Ala Lys Ser Pro Glu Ile Ala Ala Arg Pro Ala Val Asn Gly Gln Arg
225 230 235 240
Gly Arg Ile Asp Tyr Tyr Trp Ser Val Leu Lys Pro Gly Glu Thr Leu
245 250 255
Asn Val Glu Ser Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Tyr Lys
260 265 270
Phe Val Asn Thr Asn Ser Lys Gly Ala Val Phe Arg Ser Asp Leu Pro
275 280 285
Ile Glu Asn Cys Asp Ala Thr Cys Gln Thr Ile Ala Gly Val Leu Arg
290 295 300
Thr Asn Lys Thr Phe Gln Asn Val Ser Pro Leu Trp Ile Gly Glu Cys
305 310 315 320
Pro Lys Tyr Val Lys Ser Glu Ser Leu Arg Leu Ala Thr Gly Leu Arg
325 330 335
Asn Val Pro Gln Ile Glu Thr Arg Gly Leu Phe Gly Ala Ile Ala Gly
340 345 350
Phe Ile Glu Gly Gly Trp Thr Gly Met Ile Asp Gly Trp Tyr Gly Tyr
355 360 365
His His Glu Asn Ser Gln Gly Ser Gly Tyr Ala Ala Asp Arg Glu Ser
370 375 380
Thr Gln Lys Ala Val Asn Arg Ile Thr Asn Lys Val Asn Ser Ile Ile
385 390 395 400
Asn Lys Met Asn Thr Gln Phe Glu Ala Val Asp His Glu Phe Ser Asn
405 410 415
Leu Glu Arg Arg Ile Asp Asn Leu Asn Lys Arg Met Gln Asp Gly Phe
420 425 430
Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn
435 440 445
Glu Arg Thr Leu Asp Met His Asp Ala Asn Val Lys Asn Leu His Glu
450 455 460
Lys Val Lys Ser Gln Leu Arg Asp Asn Ala Thr Ile Leu Gly Asn Gly
465 470 475 480
Cys Phe Glu Phe Trp His Lys Cys Asp Asn Glu Cys Ile Glu Ser Val
485 490 495
Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Gln Thr Glu Ser Lys Leu
500 505 510
Asn Arg Leu Lys Ile Glu Ser Val Lys Leu Glu Asn Leu Gly Val Tyr
515 520 525
Gln Ile Leu Ala Ile Tyr Ser Thr Val Ser Ser Ser Leu Val Leu Val
530 535 540
Gly Leu Ile Met Ala Met Gly Leu Trp Met Cys Ser Asn Gly Ser Met
545 550 555 560
Gln Cys Arg Ile Cys Ile
565
<210> 58
<211> 570
<212> PRT
<213> Artificial sequence
<220>
<223> clone 784 (A/Equine/Prague/56 (H7N7))
<400> 58
Met Asn Thr Gln Ile Leu Ile Leu Ala Thr Ser Ala Phe Phe Tyr Val
1 5 10 15
Arg Ala Asp Lys Ile Cys Leu Gly His His Ala Val Ser Asn Gly Thr
20 25 30
Lys Val Asp Thr Leu Thr Glu Lys Gly Ile Glu Val Val Asn Ala Thr
35 40 45
Glu Thr Val Glu Gln Thr Asn Ile Pro Lys Ile Cys Ser Lys Gly Lys
50 55 60
Gln Thr Val Asp Leu Gly Gln Cys Gly Leu Leu Gly Thr Val Ile Gly
65 70 75 80
Pro Pro Gln Cys Asp Gln Phe Leu Glu Phe Ser Ala Asn Leu Ile Val
85 90 95
Glu Arg Arg Glu Gly Asn Asp Ile Cys Tyr Pro Gly Lys Phe Asp Asn
100 105 110
Glu Glu Thr Leu Arg Lys Ile Leu Arg Lys Ser Gly Gly Ile Lys Lys
115 120 125
Glu Asn Met Gly Phe Thr Tyr Thr Gly Val Arg Thr Asn Gly Glu Thr
130 135 140
Ser Ala Cys Arg Arg Ser Arg Ser Ser Phe Tyr Ala Glu Met Lys Trp
145 150 155 160
Leu Leu Ser Ser Thr Asp Asn Gly Thr Phe Pro Gln Met Thr Lys Ser
165 170 175
Tyr Lys Asn Thr Lys Lys Val Pro Ala Leu Ile Ile Trp Gly Ile His
180 185 190
His Ser Gly Ser Thr Thr Glu Gln Thr Arg Leu Tyr Gly Ser Gly Asn
195 200 205
Lys Leu Ile Thr Val Trp Ser Ser Lys Tyr Gln Gln Ser Phe Val Pro
210 215 220
Asn Pro Gly Pro Arg Pro Gln Met Asn Gly Gln Ser Gly Arg Ile Asp
225 230 235 240
Phe His Trp Leu Met Leu Asp Pro Asn Asp Thr Val Thr Phe Ser Phe
245 250 255
Asn Gly Ala Phe Ile Ala Pro Asp Arg Ala Ser Phe Leu Arg Gly Lys
260 265 270
Ser Leu Gly Ile Gln Ser Asp Ala Gln Leu Asp Asn Asn Cys Glu Gly
275 280 285
Glu Cys Tyr His Ile Gly Gly Thr Ile Ile Ser Asn Leu Pro Phe Gln
290 295 300
Asn Ile Asn Ser Arg Ala Ile Gly Lys Cys Pro Arg Tyr Val Lys Gln
305 310 315 320
Lys Ser Leu Met Leu Ala Thr Gly Met Lys Asn Val Pro Glu Ala Pro
325 330 335
Ala His Lys Gln Leu Thr His His Met Arg Lys Lys Arg Gly Leu Phe
340 345 350
Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu Gly Leu Ile Asp
355 360 365
Gly Trp Tyr Gly Tyr Lys His Gln Asn Ala Gln Gly Glu Gly Thr Ala
370 375 380
Ala Asp Tyr Lys Ser Thr Gln Ser Ala Ile Asn Gln Ile Thr Gly Lys
385 390 395 400
Leu Asn Arg Leu Ile Glu Lys Thr Asn Gln Gln Phe Glu Leu Ile Asp
405 410 415
Asn Glu Phe Asn Glu Ile Glu Lys Gln Ile Gly Asn Val Ile Asn Trp
420 425 430
Thr Arg Asp Ser Ile Ile Glu Val Trp Ser Tyr Asn Ala Glu Phe Leu
435 440 445
Val Ala Val Glu Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met
450 455 460
Asn Lys Leu Tyr Glu Lys Val Arg Arg Gln Leu Arg Glu Asn Ala Glu
465 470 475 480
Glu Asp Gly Asn Gly Cys Phe Glu Ile Phe His Gln Cys Asp Asn Asp
485 490 495
Cys Met Ala Ser Ile Arg Asn Asn Thr Tyr Asp His Lys Lys Tyr Arg
500 505 510
Lys Glu Ala Ile Gln Asn Arg Ile Gln Ile Asp Ala Val Lys Leu Ser
515 520 525
Ser Gly Tyr Lys Asp Ile Ile Leu Trp Phe Ser Phe Gly Ala Ser Cys
530 535 540
Phe Leu Phe Leu Ala Ile Ala Met Gly Leu Val Phe Ile Cys Ile Lys
545 550 555 560
Asn Gly Asn Met Arg Cys Thr Ile Cys Ile
565 570
<210> 59
<211> 560
<212> PRT
<213> Artificial sequence
<220>
<223> clone 785 (A/HongKong/1073/99 (H9N2))
<400> 59
Met Glu Thr Ile Ser Leu Ile Thr Ile Leu Leu Val Val Thr Ala Ser
1 5 10 15
Asn Ala Asp Lys Ile Cys Ile Gly His Gln Ser Thr Asn Ser Thr Glu
20 25 30
Thr Val Asp Thr Leu Thr Glu Thr Asn Val Pro Val Thr His Ala Lys
35 40 45
Glu Leu Leu His Thr Glu His Asn Gly Met Leu Cys Ala Thr Ser Leu
50 55 60
Gly His Pro Leu Ile Leu Asp Thr Cys Thr Ile Glu Gly Leu Val Tyr
65 70 75 80
Gly Asn Pro Ser Cys Asp Leu Leu Leu Gly Gly Arg Glu Trp Ser Tyr
85 90 95
Ile Val Glu Arg Ser Ser Ala Val Asn Gly Thr Cys Tyr Pro Gly Asn
100 105 110
Val Glu Asn Leu Glu Glu Leu Arg Thr Leu Phe Ser Ser Ala Ser Ser
115 120 125
Tyr Gln Arg Ile Gln Ile Phe Pro Asp Thr Thr Trp Asn Val Thr Tyr
130 135 140
Thr Gly Thr Ser Arg Ala Cys Ser Gly Ser Phe Tyr Arg Ser Met Arg
145 150 155 160
Trp Leu Thr Gln Lys Ser Gly Phe Tyr Pro Val Gln Asp Ala Gln Tyr
165 170 175
Thr Asn Asn Arg Gly Lys Ser Ile Leu Phe Val Trp Gly Ile His His
180 185 190
Pro Pro Thr Tyr Thr Glu Gln Thr Asn Leu Tyr Ile Arg Asn Asp Thr
195 200 205
Thr Thr Ser Val Thr Thr Glu Asp Leu Asn Arg Thr Phe Lys Pro Val
210 215 220
Ile Gly Pro Arg Pro Leu Val Asn Gly Leu Gln Gly Arg Ile Asp Tyr
225 230 235 240
Tyr Trp Ser Val Leu Lys Pro Gly Gln Thr Leu Arg Val Arg Ser Asn
245 250 255
Gly Asn Leu Ile Ala Pro Trp Tyr Gly His Val Leu Ser Gly Gly Ser
260 265 270
His Gly Arg Ile Leu Lys Thr Asp Leu Lys Gly Gly Asn Cys Val Val
275 280 285
Gln Cys Gln Thr Glu Lys Gly Gly Leu Asn Ser Thr Leu Pro Phe His
290 295 300
Asn Ile Ser Lys Tyr Ala Phe Gly Thr Cys Pro Lys Tyr Val Arg Val
305 310 315 320
Asn Ser Leu Lys Leu Ala Val Gly Leu Arg Asn Val Pro Ala Arg Ser
325 330 335
Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp
340 345 350
Pro Gly Leu Val Ala Gly Trp Tyr Gly Phe Gln His Ser Asn Asp Gln
355 360 365
Gly Val Gly Met Ala Ala Asp Arg Asp Ser Thr Gln Lys Ala Ile Asp
370 375 380
Lys Ile Thr Ser Lys Val Asn Asn Ile Val Asp Lys Met Asn Lys Gln
385 390 395 400
Tyr Glu Ile Ile Asp His Glu Phe Ser Glu Val Glu Thr Arg Leu Asn
405 410 415
Met Ile Asn Asn Lys Ile Asp Asp Gln Ile Gln Asp Val Trp Ala Tyr
420 425 430
Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Gln Lys Thr Leu Asp Glu
435 440 445
His Asp Ala Asn Val Asn Asn Leu Tyr Asn Lys Val Lys Arg Ala Leu
450 455 460
Gly Ser Asn Ala Met Glu Asp Gly Lys Gly Cys Phe Glu Leu Tyr His
465 470 475 480
Lys Cys Asp Asp Gln Cys Met Glu Thr Ile Arg Asn Gly Thr Tyr Asn
485 490 495
Arg Arg Lys Tyr Arg Glu Glu Ser Arg Leu Glu Arg Gln Lys Ile Glu
500 505 510
Gly Val Lys Leu Glu Ser Glu Gly Thr Tyr Lys Ile Leu Thr Ile Tyr
515 520 525
Ser Thr Val Ala Ser Ser Leu Val Leu Ala Met Gly Phe Ala Ala Phe
530 535 540
Leu Phe Trp Ala Met Ser Asn Gly Ser Cys Arg Cys Asn Ile Cys Ile
545 550 555 560
<210> 60
<211> 3111
<212> DNA
<213> Artificial sequence
<220>
<223> H5 from A/Indonesia/5/2005 (Construct # 660)
<400> 60
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggagaaaat agtgcttctt 1020
cttgcaatag tcagtcttgt taaaagtgat cagatttgca ttggttacca tgcaaacaat 1080
tcaacagagc aggttgacac aatcatggaa aagaacgtta ctgttacaca tgcccaagac 1140
atactggaaa agacacacaa cgggaagctc tgcgatctag atggagtgaa gcctctaatt 1200
ttaagagatt gtagtgtagc tggatggctc ctcgggaacc caatgtgtga cgaattcatc 1260
aatgtaccgg aatggtctta catagtggag aaggccaatc caaccaatga cctctgttac 1320
ccagggagtt tcaacgacta tgaagaactg aaacacctat tgagcagaat aaaccatttt 1380
gagaaaattc aaatcatccc caaaagttct tggtccgatc atgaagcctc atcaggagtt 1440
agctcagcat gtccatacct gggaagtccc tcctttttta gaaatgtggt atggcttatc 1500
aaaaagaaca gtacataccc aacaataaag aaaagctaca ataataccaa ccaagaggat 1560
cttttggtac tgtggggaat tcaccatcct aatgatgcgg cagagcagac aaggctatat 1620
caaaacccaa ccacctatat ttccattggg acatcaacac taaaccagag attggtacca 1680
aaaatagcta ctagatccaa agtaaacggg caaagtggaa ggatggagtt cttctggaca 1740
attttaaaac ctaatgatgc aatcaacttc gagagtaatg gaaatttcat tgctccagaa 1800
tatgcataca aaattgtcaa gaaaggggac tcagcaatta tgaaaagtga attggaatat 1860
ggtaactgca acaccaagtg tcaaactcca atgggggcga taaactctag tatgccattc 1920
cacaacatac accctctcac catcggggaa tgccccaaat atgtgaaatc aaacagatta 1980
gtccttgcaa cagggctcag aaatagccct caaagagaga gcagaagaaa aaagagagga 2040
ctatttggag ctatagcagg ttttatagag ggaggatggc agggaatggt agatggttgg 2100
tatgggtacc accatagcaa tgagcagggg agtgggtacg ctgcagacaa agaatccact 2160
caaaaggcaa tagatggagt caccaataag gtcaactcaa tcattgacaa aatgaacact 2220
cagtttgagg ccgttggaag ggaatttaat aacttagaaa ggagaataga gaatttaaac 2280
aagaagatgg aagacgggtt tctagatgtc tggacttata atgccgaact tctggttctc 2340
atggaaaatg agagaactct agactttcat gactcaaatg ttaagaacct ctacgacaag 2400
gtccgactac agcttaggga taatgcaaag gagctgggta acggttgttt cgagttctat 2460
cacaaatgtg ataatgaatg tatggaaagt ataagaaacg gaacgtacaa ctatccgcag 2520
tattcagaag aagcaagatt aaaaagagag gaaataagtg gggtaaaatt ggaatcaata 2580
ggaacttacc aaatactgtc aatttattca acagtggcga gttccctagc actggcaatc 2640
atgatggctg gtctatcttt atggatgtgc tccaatggat cgttacaatg cagaatttgc 2700
atttaagagc tctaagttaa aatgcttctt cgtctcctat ttataatatg gtttgttatt 2760
gttaattttg ttcttgtaga agagcttaat taatcgttgt tgttatgaaa tactatttgt 2820
atgagatgaa ctggtgtaat gtaattcatt tacataagtg gagtcagaat cagaatgttt 2880
cctccataac taactagaca tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac 2940
taaaattgaa catcttttgc cacaacttta taagtggtta atatagctca aatatatggt 3000
caagttcaat agattaataa tggaaatatc agttatcgaa attcattaac aatcaactta 3060
acgttattaa ctactaattt tatatcatcc cctttgataa atgatagtac a 3111
<210> 61
<211> 3123
<212> DNA
<213> Artificial sequence
<220>
<223> H1 from A/New Caledonia/20/1999 (Construct # 540)
<400> 61
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt 1020
ttcggcttat tgttttctct tcttgtgttg gttccttctc agatcttcgc tgacacaata 1080
tgtataggct accatgccaa caactcaacc gacactgttg acacagtact tgagaagaat 1140
gtgacagtga cacactctgt caacctactt gaggacagtc acaatggaaa actatgtcta 1200
ctaaaaggaa tagccccact acaattgggt aattgcagcg ttgccggatg gatcttagga 1260
aacccagaat gcgaattact gatttccaag gaatcatggt cctacattgt agaaacacca 1320
aatcctgaga atggaacatg ttacccaggg tatttcgccg actatgagga actgagggag 1380
caattgagtt cagtatcttc atttgagaga ttcgaaatat tccccaaaga aagctcatgg 1440
cccaaccaca ccgtaaccgg agtatcagca tcatgctccc ataatgggaa aagcagtttt 1500
tacagaaatt tgctatggct gacggggaag aatggtttgt acccaaacct gagcaagtcc 1560
tatgtaaaca acaaagagaa agaagtcctt gtactatggg gtgttcatca cccgcctaac 1620
atagggaacc aaagggcact ctatcataca gaaaatgctt atgtctctgt agtgtcttca 1680
cattatagca gaagattcac cccagaaata gccaaaagac ccaaagtaag agatcaggaa 1740
ggaagaatca actactactg gactctgctg gaacctgggg atacaataat atttgaggca 1800
aatggaaatc taatagcgcc atggtatgct tttgcactga gtagaggctt tggatcagga 1860
atcatcacct caaatgcacc aatggatgaa tgtgatgcga agtgtcaaac acctcaggga 1920
gctataaaca gcagtcttcc tttccagaat gtacacccag tcacaatagg agagtgtcca 1980
aagtatgtca ggagtgcaaa attaaggatg gttacaggac taaggaacat cccatccatt 2040
caatccagag gtttgtttgg agccattgcc ggtttcattg aaggggggtg gactggaatg 2100
gtagatgggt ggtatggtta tcatcatcag aatgagcaag gatctggcta tgctgcagat 2160
caaaaaagta cacaaaatgc cattaacggg attacaaaca aggtcaattc tgtaattgag 2220
aaaatgaaca ctcaattcac agctgtgggc aaagagttca acaaattgga aagaaggatg 2280
gaaaacttaa ataaaaaagt tgatgatggg tttctagaca tttggacata taatgcagaa 2340
ttgttggttc tactggaaaa tgaaaggact ttggatttcc atgactccaa tgtgaagaat 2400
ctgtatgaga aagtaaaaag ccaattaaag aataatgcca aagaaatagg aaacgggtgt 2460
tttgagttct atcacaagtg taacaatgaa tgcatggaga gtgtgaaaaa tggtacctat 2520
gactatccaa aatattccga agaatcaaag ttaaacaggg agaaaattga tggagtgaaa 2580
ttggaatcaa tgggagtata ccagattctg gcgatctact caactgtcgc cagttccctg 2640
gttcttttgg tctccctggg ggcaatcagc ttctggatgt gttccaatgg gtctttgcag 2700
tgtagaatat gcatctaaga gctctaagtt aaaatgcttc ttcgtctcct atttataata 2760
tggtttgtta ttgttaattt tgttcttgta gaagagctta attaatcgtt gttgttatga 2820
aatactattt gtatgagatg aactggtgta atgtaattca tttacataag tggagtcaga 2880
atcagaatgt ttcctccata actaactaga catgaagacc tgccgcgtac aattgtctta 2940
tatttgaaca actaaaattg aacatctttt gccacaactt tataagtggt taatatagct 3000
caaatatatg gtcaagttca atagattaat aatggaaata tcagttatcg aaattcatta 3060
acaatcaact taacgttatt aactactaat tttatatcat cccctttgat aaatgatagt 3120
aca 3123
<210> 62
<211> 3088
<212> DNA
<213> Artificial
<220>
<223> H1 from A/Brisbane/59/2007 (construct #774)
<400> 62
ctggtatatt tatatgttgt caaataactc aaaaaccata aaagtttaag ttagcaagtg 60
tgtacatttt tacttgaaca aaaatattca cctactactg ttataaatca ttattaaaca 120
ttagagtaaa gaaatatgga tgataagaac aagagtagtg atattttgac aacaattttg 180
ttgcaacatt tgagaaaatt ttgttgttct ctcttttcat tggtcaaaaa caatagagag 240
agaaaaagga agagggagaa taaaaacata atgtgagtat gagagagaaa gttgtacaaa 300
agttgtacca aaatagttgt acaaatatca ttgaggaatt tgacaaaagc tacacaaata 360
agggttaatt gctgtaaata aataaggatg acgcattaga gagatgtacc attagagaat 420
ttttggcaag tcattaaaaa gaaagaataa attattttta aaattaaaag ttgagtcatt 480
tgattaaaca tgtgattatt taatgaattg atgaaagagt tggattaaag ttgtattagt 540
aattagaatt tggtgtcaaa tttaatttga catttgatct tttcctatat attgccccat 600
agagtcagtt aactcatttt tatatttcat agatcaaata agagaaataa cggtatatta 660
atccctccaa aaaaaaaaaa cggtatattt actaaaaaat ctaagccacg taggaggata 720
acaggatccc cgtaggagga taacatccaa tccaaccaat cacaacaatc ctgatgagat 780
aacccacttt aagcccacgc atctgtggca catctacatt atctaaatca cacattcttc 840
cacacatctg agccacacaa aaaccaatcc acatctttat cacccattct ataaaaaatc 900
acactttgtg agtctacact ttgattccct tcaaacacat acaaagagaa gagactaatt 960
aattaattaa tcatcttgag agaaaatgaa agtaaaacta ctggtcctgt tatgcacatt 1020
tacagctaca tatgcagaca caatatgtat aggctaccat gctaacaact cgaccgacac 1080
tgttgacaca gtacttgaaa agaatgtgac agtgacacac tctgtcaacc tgcttgagaa 1140
cagtcacaat ggaaaactat gtctattaaa aggaatagcc ccactacaat tgggtaattg 1200
cagcgttgcc gggtggatct taggaaaccc agaatgcgaa ttactgattt ccaaggagtc 1260
atggtcctac attgtagaaa aaccaaatcc tgagaatgga acatgttacc cagggcattt 1320
cgctgactat gaggaactga gggagcaatt gagttcagta tcttcatttg agaggttcga 1380
aatattcccc aaagaaagct catggcccaa ccacaccgta accggagtgt cagcatcatg 1440
ctcccataat ggggaaagca gtttttacag aaatttgcta tggctgacgg ggaagaatgg 1500
tttgtaccca aacctgagca agtcctatgc aaacaacaaa gaaaaagaag tccttgtact 1560
atggggtgtt catcacccgc caaacatagg tgaccaaaag gccctctatc atacagaaaa 1620
tgcttatgtc tctgtagtgt cttcacatta tagcagaaaa ttcaccccag aaatagccaa 1680
aagacccaaa gtaagagatc aagaaggaag aatcaattac tactggactc tgcttgaacc 1740
cggggataca ataatatttg aggcaaatgg aaatctaata gcgccaagat atgctttcgc 1800
actgagtaga ggctttggat caggaatcat caactcaaat gcaccaatgg ataaatgtga 1860
tgcgaagtgc caaacacctc agggagctat aaacagcagt cttcctttcc agaacgtaca 1920
cccagtcaca ataggagagt gtccaaagta tgtcaggagt gcaaaattaa ggatggttac 1980
aggactaagg aacatcccat ccattcaatc cagaggtttg tttggagcca ttgccggttt 2040
cattgaaggg gggtggactg gaatggtaga tggttggtat ggttatcatc atcagaatga 2100
gcaaggatct ggctatgctg cagatcaaaa aagcacacaa aatgccatta atgggattac 2160
aaacaaggtc aattctgtaa ttgagaaaat gaacactcaa ttcacagcag tgggcaaaga 2220
gttcaacaaa ttggaaagaa ggatggaaaa cttgaataaa aaagttgatg atgggtttat 2280
agacatttgg acatataatg cagaactgtt ggttctactg gaaaatgaaa ggactttgga 2340
tttccatgac tccaatgtga agaatctgta tgagaaagta aaaagccagt taaagaataa 2400
tgctaaagaa ataggaaatg ggtgttttga gttctatcac aagtgtaacg atgaatgcat 2460
ggagagtgta aagaatggaa cttatgacta tccaaaatat tccgaagaat caaagttaaa 2520
cagggagaaa attgatggag tgaaattgga atcaatggga gtctatcaga ttctggcgat 2580
ctactcaaca gtcgccagtt ctctggttct tttggtctcc ctgggggcaa tcagcttctg 2640
gatgtgttcc aatgggtctt tacagtgtag aatatgcatc taagagctct aagttaaaat 2700
gcttcttcgt ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga 2760
gcttaattaa tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta 2820
attcatttac ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga 2880
agacctgccg cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac 2940
aactttataa gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg 3000
aaatatcagt tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat 3060
atcatcccct ttgataaatg atagtaca 3088
<210> 63
<211> 3102
<212> DNA
<213> Artificial
<220>
<223> H1 from A/Solomon Islands/3/2006 (H1N1) (Construct # 775)
<400> 63
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgaaagtaaa actactggtc 1020
ctgttatgca catttacagc tacatatgca gacacaatat gtataggcta ccatgccaac 1080
aactcaaccg acactgttga cacagtactt gagaagaatg tgacagtgac acactctgtc 1140
aacctgcttg aggacagtca caatggaaaa ttatgtctat taaaaggaat agccccacta 1200
caattgggta attgcagcgt tgccggatgg atcttaggaa acccagaatg cgaattactg 1260
atttccaggg aatcatggtc ctacattgta gaaaaaccaa atcctgagaa tggaacatgt 1320
tacccagggc atttcgccga ctatgaggaa ctgagggagc aattgagttc agtatcttca 1380
tttgagagat tcgaaatatt ccccaaagaa agctcatggc ccaaccacac cacaaccgga 1440
gtatcagcat catgctccca taatggggaa agcagttttt acaaaaattt gctatggctg 1500
acggggaaga atggtttgta cccaaacctg agcaagtcct atgcaaacaa caaagagaaa 1560
gaagtccttg tactatgggg tgttcatcac ccgcctaaca taggtgacca aagggctctc 1620
tatcataaag aaaatgctta tgtctctgta gtgtcttcac attatagcag aaaattcacc 1680
ccagaaatag ccaaaagacc caaagtaaga gatcaagaag gaagaatcaa ctactactgg 1740
actctacttg aacccgggga tacaataata tttgaggcaa atggaaatct aatagcgcca 1800
agatatgctt tcgcactgag tagaggcttt ggatcaggaa tcatcaactc aaatgcacca 1860
atggatgaat gtgatgcgaa gtgccaaaca cctcagggag ctataaacag cagtcttcct 1920
ttccagaatg tacaccctgt cacaatagga gagtgtccaa agtatgtcag gagtgcaaaa 1980
ttaaggatgg ttacaggact aaggaacatc ccatccattc aatccagagg tttgtttgga 2040
gccattgccg gtttcattga aggggggtgg actggaatgg tagatggttg gtatggttat 2100
catcatcaga atgagcaagg atctggctat gctgcagatc aaaaaagcac acaaaatgcc 2160
attaatggga ttacaaacaa ggtcaattct gtaattgaga aaatgaacac tcaattcaca 2220
gctgtgggca aagagttcaa caaattggaa agaaggatgg aaaacttaaa taaaaaagtt 2280
gatgatgggt ttatagacat ttggacatat aatgcagaat tgttggttct actggaaaat 2340
gaaaggactt tggatttcca tgactccaat gtgaagaatc tgtatgagaa agtaaaaagc 2400
caattaaaga ataatgccaa agaaatagga aatgggtgtt ttgagttcta tcataagtgt 2460
aacgatgaat gcatggagag tgtaaaaaat ggaacttatg actatccaaa atattccgaa 2520
gaatcaaagt taaacaggga gaaaattgat ggagtgaaat tggaatcaat gggagtctat 2580
cagattctgg cgatctactc aacagtcgcc agttctctgg ttcttttggt ctccctgggg 2640
gcaatcagct tctggatgtg ttccaatggg tctttgcagt gtagaatatg catctgagag 2700
ctctaagtta aaatgcttct tcgtctccta tttataatat ggtttgttat tgttaatttt 2760
gttcttgtag aagagcttaa ttaatcgttg ttgttatgaa atactatttg tatgagatga 2820
actggtgtaa tgtaattcat ttacataagt ggagtcagaa tcagaatgtt tcctccataa 2880
ctaactagac atgaagacct gccgcgtaca attgtcttat atttgaacaa ctaaaattga 2940
acatcttttg ccacaacttt ataagtggtt aatatagctc aaatatatgg tcaagttcaa 3000
tagattaata atggaaatat cagttatcga aattcattaa caatcaactt aacgttatta 3060
actactaatt ttatatcatc ccctttgata aatgatagta ca 3102
<210> 64
<211> 3093
<212> DNA
<213> Artificial sequence
<220>
<223> H2 from A/Singapore/1/57 (H2N2) (construct # 780)
<400> 64
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggccatcat ttatctaatt 1020
ctcctgttca cagcagtgag aggggaccaa atatgcattg gataccatgc caataattcc 1080
acagagaagg tcgacacaat tctagagcgg aacgtcactg tgactcatgc caaggacatt 1140
cttgagaaga cccataacgg aaagttatgc aaactaaacg gaatccctcc acttgaacta 1200
ggggactgta gcattgccgg atggctcctt ggaaatccag aatgtgatag gcttctaagt 1260
gtgccagaat ggtcctatat aatggagaaa gaaaacccga gagacggttt gtgttatcca 1320
ggcagcttca atgattatga agaattgaaa catctcctca gcagcgtgaa acatttcgag 1380
aaagtaaaga ttctgcccaa agatagatgg acacagcata caacaactgg aggttcacgg 1440
gcctgcgcgg tgtctggtaa tccatcattc ttcaggaaca tggtctggct gacaaagaaa 1500
gaatcaaatt atccggttgc caaaggatcg tacaacaata caagcggaga acaaatgcta 1560
ataatttggg gggtgcacca tcccaatgat gagacagaac aaagaacatt gtaccagaat 1620
gtgggaacct atgtttccgt aggcacatca acattgaaca aaaggtcaac cccagacata 1680
gcaacaaggc ctaaagtgaa tggactagga agtagaatgg agttctcttg gaccctattg 1740
gatatgtggg acaccataaa ttttgagagt actggtaatc taattgcacc agagtatgga 1800
ttcaaaatat cgaaaagagg tagttcaggg atcatgaaaa cagaaggaac acttgagaac 1860
tgtgagacca aatgccaaac tcctttggga gcaataaata caacattgcc ttttcacaat 1920
gtccacccac tgacaatagg tgagtgcccc aaatatgtaa aatcggagaa gttggtctta 1980
gcaacaggac taaggaatgt tccccagatt gaatcaagag gattgtttgg ggcaatagct 2040
ggttttatag aaggaggatg gcaaggaatg gttgatggtt ggtatggata ccatcacagc 2100
aatgaccagg gatcagggta tgcagcagac aaagaatcca ctcaaaaggc atttgatgga 2160
atcaccaaca aggtaaattc tgtgattgaa aagatgaaca cccaatttga agctgttggg 2220
aaagagttca gtaacttaga gagaagactg gagaacttga acaaaaagat ggaagacggg 2280
tttctagatg tgtggacata caatgctgag cttctagttc tgatggaaaa tgagaggaca 2340
cttgactttc atgattctaa tgtcaagaat ctgtatgata aagtcagaat gcagctgaga 2400
gacaacgtca aagaactagg aaatggatgt tttgaatttt atcacaaatg tgatgatgaa 2460
tgcatgaata gtgtgaaaaa cgggacgtat gattatccca agtatgaaga agagtctaaa 2520
ctaaatagaa atgaaatcaa aggggtaaaa ttgagcagca tgggggttta tcaaatcctt 2580
gccatttatg ctacagtagc aggttctctg tcactggcaa tcatgatggc tgggatctct 2640
ttctggatgt gctccaacgg gtctctgcag tgcaggatct gcatatgaga gctctaagtt 2700
aaaatgcttc ttcgtctcct atttataata tggtttgtta ttgttaattt tgttcttgta 2760
gaagagctta attaatcgtt gttgttatga aatactattt gtatgagatg aactggtgta 2820
atgtaattca tttacataag tggagtcaga atcagaatgt ttcctccata actaactaga 2880
catgaagacc tgccgcgtac aattgtctta tatttgaaca actaaaattg aacatctttt 2940
gccacaactt tataagtggt taatatagct caaatatatg gtcaagttca atagattaat 3000
aatggaaata tcagttatcg aaattcatta acaatcaact taacgttatt aactactaat 3060
tttatatcat cccctttgat aaatgatagt aca 3093
<210> 65
<211> 3108
<212> DNA
<213> Artificial sequence
<220>
<223> H5 from A/Anhui/1/2005 (H5N1) (Construct# 781)
<400> 65
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggagaaaat agtgcttctt 1020
cttgcaatag tcagccttgt taaaagtgat cagatttgca ttggttacca tgcaaacaac 1080
tcgacagagc aggttgacac aataatggaa aagaacgtta ctgttacaca tgcccaagac 1140
atactggaaa agacacacaa cgggaagctc tgcgatctag atggagtgaa gcctctgatt 1200
ttaagagatt gtagtgtagc tggatggctc ctcggaaacc caatgtgtga cgagttcatc 1260
aatgtgccgg aatggtctta catagtggag aaggccaacc cagccaatga cctctgttac 1320
ccagggaatt tcaacgacta tgaagaactg aaacacctat tgagcagaat aaaccatttt 1380
gagaaaattc agatcatccc caaaagttct tggtccgatc atgaagcctc atcaggggtc 1440
agctcagcat gtccatacca gggaacgccc tcctttttca gaaatgtggt atggcttatc 1500
aaaaagaaca atacataccc aacaataaag agaagctaca ataataccaa ccaggaagat 1560
cttttgatac tgtgggggat tcatcattct aatgatgcgg cagagcagac aaagctctat 1620
caaaacccaa ccacctatat ttccgttggg acatcaacac taaaccagag attggtacca 1680
aaaatagcta ctagatccaa agtaaacggg caaagtggaa ggatggattt cttctggaca 1740
attttaaaac cgaatgatgc aatcaacttc gagagtaatg gaaatttcat tgctccagaa 1800
tatgcataca aaattgtcaa gaaaggggac tcagcaattg ttaaaagtga agtggaatat 1860
ggtaactgca atacaaagtg tcaaactcca ataggggcga taaactctag tatgccattc 1920
cacaacatac accctctcac catcggggaa tgccccaaat atgtgaaatc aaacaaatta 1980
gtccttgcga ctgggctcag aaatagtcct ctaagagaaa gaagaagaaa aagaggacta 2040
tttggagcta tagcagggtt tatagaggga ggatggcagg gaatggtaga tggttggtat 2100
gggtaccacc atagcaatga gcaggggagt gggtacgctg cagacaaaga atccactcaa 2160
aaggcaatag atggagtcac caataaggtc aactcgatca ttgacaaaat gaacactcag 2220
tttgaggccg ttggaaggga atttaataac ttagaaagga gaatagagaa tttaaacaag 2280
aaaatggaag acggattcct agatgtctgg acttataatg ctgaacttct ggttctcatg 2340
gaaaatgaga gaactctaga cttccatgat tcaaatgtca agaaccttta cgacaaggtc 2400
cgactacagc ttagggataa tgcaaaggag ctgggtaacg gttgtttcga gttctatcac 2460
aaatgtgata atgaatgtat ggaaagtgta agaaacggaa cgtatgacta cccgcagtat 2520
tcagaagaag caagattaaa aagagaggaa ataagtggag taaaattgga atcaatagga 2580
acttaccaaa tactgtcaat ttattcaaca gttgcgagtt ctctagcact ggcaatcatg 2640
gtggctggtc tatctttgtg gatgtgctcc aatgggtcgt tacaatgcag aatttgcatt 2700
taagagctct aagttaaaat gcttcttcgt ctcctattta taatatggtt tgttattgtt 2760
aattttgttc ttgtagaaga gcttaattaa tcgttgttgt tatgaaatac tatttgtatg 2820
agatgaactg gtgtaatgta attcatttac ataagtggag tcagaatcag aatgtttcct 2880
ccataactaa ctagacatga agacctgccg cgtacaattg tcttatattt gaacaactaa 2940
aattgaacat cttttgccac aactttataa gtggttaata tagctcaaat atatggtcaa 3000
gttcaataga ttaataatgg aaatatcagt tatcgaaatt cattaacaat caacttaacg 3060
ttattaacta ctaattttat atcatcccct ttgataaatg atagtaca 3108
<210> 66
<211> 3111
<212> DNA
<213> Artificial sequence
<220>
<223> H5 from A/Vietnam/1194/2004 (H5N1) (Construct # 782)
<400> 66
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggagaaaat agtgcttctt 1020
tttgcaatag tcagtcttgt taaaagtgat cagatttgca ttggttacca tgcaaacaac 1080
tcgacagagc aggttgacac aataatggaa aagaacgtta ctgttacaca tgcccaagac 1140
atactggaaa agacacacaa tgggaagctc tgcgatctag atggagtgaa gcctctaatt 1200
ttgagagatt gtagtgtagc tggatggctc ctcggaaacc caatgtgtga cgagttcatc 1260
aatgtgccgg aatggtctta catagtggag aaggccaatc cagtcaatga cctctgttac 1320
ccaggggatt tcaatgacta tgaagaattg aaacacctat tgagcagaat aaaccatttt 1380
gagaaaattc agatcatccc caaaagttct tggtccagtc atgaagcctc attgggggtc 1440
agctcagcat gtccatacca gggaaagtcc tcctttttca gaaatgtggt atggcttatc 1500
aaaaagaaca gtacataccc aacaataaag aggagctaca ataataccaa ccaagaagat 1560
cttttggtac tgtgggggat tcaccatcct aatgatgcgg cagagcagac aaagctctat 1620
caaaacccaa ccacctatat ttccgttggg acatctacac taaaccagag attggtacca 1680
agaatagcta ctagatccaa agtaaacggg caaagtggaa ggatggagtt cttctggaca 1740
attttaaaac cgaatgatgc aatcaacttc gagagtaatg gaaatttcat tgctccagaa 1800
tatgcataca aaattgtcaa gaaaggggac tcaacaatta tgaaaagtga attggaatat 1860
ggtaactgca ataccaagtg tcaaactcca atgggggcga taaactctag catgccattc 1920
cacaatatac accctctcac catcggggaa tgccccaaat atgtgaaatc aaacagatta 1980
gtccttgcga ctgggctcag aaatagccct caaagagaga gaagaagaaa aaagagagga 2040
ttatttggag ctatagcagg ttttatagag ggaggatggc agggaatggt agatggttgg 2100
tatgggtacc accatagcaa cgagcagggg agtgggtacg ctgcagacaa agaatccact 2160
caaaaggcaa tagatggagt caccaataag gtcaactcga ttattgacaa aatgaacact 2220
cagtttgagg ccgttggaag ggaatttaac aacttagaaa ggagaataga gaatttaaac 2280
aagaagatgg aagacgggtt cctagatgtc tggacttata atgctgaact tctagttctc 2340
atggaaaacg agagaactct agactttcat gactcaaatg tcaagaacct ttacgacaag 2400
gtccgactac agcttaggga taatgcaaag gagctgggta acggttgttt cgagttctat 2460
cataaatgtg ataatgaatg tatggaaagt gtaagaaacg gaacgtatga ctacccgcag 2520
tattcagaag aagcaagact aaaaagagag gaaataagtg gagtaaaatt ggaatcaata 2580
ggaatttacc aaatattgtc aatttattct acagtggcca gctccctagc actggcaatc 2640
atggtagctg gtctatcctt atggatgtgc tccaatgggt cgttacaatg cagaatttgc 2700
atttaagagc tctaagttaa aatgcttctt cgtctcctat ttataatatg gtttgttatt 2760
gttaattttg ttcttgtaga agagcttaat taatcgttgt tgttatgaaa tactatttgt 2820
atgagatgaa ctggtgtaat gtaattcatt tacataagtg gagtcagaat cagaatgttt 2880
cctccataac taactagaca tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac 2940
taaaattgaa catcttttgc cacaacttta taagtggtta atatagctca aatatatggt 3000
caagttcaat agattaataa tggaaatatc agttatcgaa attcattaac aatcaactta 3060
acgttattaa ctactaattt tatatcatcc cctttgataa atgatagtac a 3111
<210> 67
<211> 3105
<212> DNA
<213> Artificial
<220>
<223> H6 from A/Teal/Hong Kong/W312/97 (H6N1) (Construct # 783)
<400> 67
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgattgcaat cattgtaata 1020
gcaatactgg cagcagccgg aaagtcagac aagatctgca ttgggtatca tgccaacaat 1080
tcaacaacac aggtagatac gatacttgag aagaatgtga ctgtcacaca ctcaattgaa 1140
ttgctggaaa atcagaagga agaaagattc tgcaagatat tgaacaaggc ccctctcgac 1200
ttaagggaat gtaccataga gggttggatc ttggggaatc cccaatgcga cctattgctt 1260
ggtgatcaaa gctggtcata cattgtggaa agacctactg ctcaaaacgg gatctgctac 1320
ccaggaacct taaatgaggt agaagaactg agggcactta ttggatcagg agaaagggta 1380
gagagatttg agatgtttcc ccaaagcacc tggcaaggag ttgacaccaa cagtggaaca 1440
acaagatcct gcccttattc tactggtgcg tctttctaca gaaacctcct atggataata 1500
aaaaccaaga cagcagaata tccagtaatt aagggaattt acaacaacac tggaacccag 1560
ccaatcctct atttctgggg tgtgcatcat cctcctaaca ccgacgagca agatactctg 1620
tatggctctg gtgatcgata cgttagaatg ggaactgaaa gcatgaattt tgccaagagt 1680
ccggaaattg cggcaaggcc tgctgtgaat ggacaaagag gcagaattga ttattattgg 1740
tcggttttaa aaccagggga aaccttgaat gtggaatcta atggaaatct aatcgcccct 1800
tggtatgcat acaaatttgt caacacaaat agtaaaggag ccgtcttcag gtcagattta 1860
ccaatcgaga actgcgatgc cacatgccag actattgcag gggttctaag gaccaataaa 1920
acatttcaga atgtgagtcc cctgtggata ggagaatgtc ccaaatacgt gaaaagtgaa 1980
agtctgaggc ttgcaactgg actaagaaat gttccacaga ttgaaactag aggactcttc 2040
ggagctattg cagggtttat tgaaggagga tggactggga tgatagatgg gtggtatggc 2100
tatcaccatg aaaattctca agggtcagga tatgcagcag acagagaaag cactcaaaag 2160
gctgtaaaca gaattacaaa taaggtcaat tccatcatca acaaaatgaa cacacaattt 2220
gaagctgtcg atcacgaatt ttcaaatctg gagaggagaa ttgacaatct gaacaaaaga 2280
atgcaagatg gatttctgga tgtttggaca tacaatgctg aactgttggt tcttcttgaa 2340
aacgaaagaa cactagacat gcatgacgca aatgtgaaga acctacatga aaaggtcaaa 2400
tcacaactaa gggacaatgc tacgatctta gggaatggtt gctttgaatt ttggcataag 2460
tgtgacaatg aatgcataga gtctgtcaaa aatggtacat atgactatcc caaataccag 2520
actgaaagca aattaaacag gctaaaaata gaatcagtaa agctagagaa ccttggtgtg 2580
tatcaaattc ttgccattta tagtacggta tcgagcagcc tagtgttggt agggctgatc 2640
atggcaatgg gtctttggat gtgttcaaat ggttcaatgc agtgcaggat atgtatataa 2700
gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat 2760
tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga 2820
tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca 2880
taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat 2940
tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt 3000
caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta 3060
ttaactacta attttatatc atcccctttg ataaatgata gtaca 3105
<210> 68
<211> 3087
<212> DNA
<213> Artificial sequence
<220>
<223> H9 from A/Hong Kong/1073/99 (H9N2) (Construct # 785)
<400> 68
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggaaacaat atcactaata 1020
actatactac tagtagtaac agcaagcaat gcagataaaa tctgcatcgg ccaccagtca 1080
acaaactcca cagaaactgt ggacacgcta acagaaacca atgttcctgt gacacatgcc 1140
aaagaattgc tccacacaga gcataatgga atgctgtgtg caacaagcct gggacatccc 1200
ctcattctag acacatgcac tattgaagga ctagtctatg gcaacccttc ttgtgacctg 1260
ctgttgggag gaagagaatg gtcctacatc gtcgaaagat catcagctgt aaatggaacg 1320
tgttaccctg ggaatgtaga aaacctagag gaactcagga cactttttag ttccgctagt 1380
tcctaccaaa gaatccaaat cttcccagac acaacctgga atgtgactta cactggaaca 1440
agcagagcat gttcaggttc attctacagg agtatgagat ggctgactca aaagagcggt 1500
ttttaccctg ttcaagacgc ccaatacaca aataacaggg gaaagagcat tcttttcgtg 1560
tggggcatac atcacccacc cacctatacc gagcaaacaa atttgtacat aagaaacgac 1620
acaacaacaa gcgtgacaac agaagatttg aataggacct tcaaaccagt gatagggcca 1680
aggccccttg tcaatggtct gcagggaaga attgattatt attggtcggt actaaaacca 1740
ggccaaacat tgcgagtacg atccaatggg aatctaattg ctccatggta tggacacgtt 1800
ctttcaggag ggagccatgg aagaatcctg aagactgatt taaaaggtgg taattgtgta 1860
gtgcaatgtc agactgaaaa aggtggctta aacagtacat tgccattcca caatatcagt 1920
aaatatgcat ttggaacctg ccccaaatat gtaagagtta atagtctcaa actggcagtc 1980
ggtctgagga acgtgcctgc tagatcaagt agaggactat ttggagccat agctggattc 2040
atagaaggag gttggccagg actagtcgct ggctggtatg gtttccagca ttcaaatgat 2100
caaggggttg gtatggctgc agatagggat tcaactcaaa aggcaattga taaaataaca 2160
tccaaggtga ataatatagt cgacaagatg aacaagcaat atgaaataat tgatcatgaa 2220
tttagtgagg ttgaaactag actcaatatg atcaataata agattgatga ccaaatacaa 2280
gacgtatggg catataatgc agaattgcta gtactacttg aaaatcaaaa aacactcgat 2340
gagcatgatg cgaacgtgaa caatctatat aacaaggtga agagggcact gggctccaat 2400
gctatggaag atgggaaagg ctgtttcgag ctataccata aatgtgatga tcagtgcatg 2460
gaaacaattc ggaacgggac ctataatagg agaaagtata gagaggaatc aagactagaa 2520
aggcagaaaa tagagggggt taagctggaa tctgagggaa cttacaaaat cctcaccatt 2580
tattcgactg tcgcctcatc tcttgtgctt gcaatggggt ttgctgcctt cctgttctgg 2640
gccatgtcca atggatcttg cagatgcaac atttgtatat aagagctcta agttaaaatg 2700
cttcttcgtc tcctatttat aatatggttt gttattgtta attttgttct tgtagaagag 2760
cttaattaat cgttgttgtt atgaaatact atttgtatga gatgaactgg tgtaatgtaa 2820
ttcatttaca taagtggagt cagaatcaga atgtttcctc cataactaac tagacatgaa 2880
gacctgccgc gtacaattgt cttatatttg aacaactaaa attgaacatc ttttgccaca 2940
actttataag tggttaatat agctcaaata tatggtcaag ttcaatagat taataatgga 3000
aatatcagtt atcgaaattc attaacaatc aacttaacgt tattaactac taattttata 3060
tcatcccctt tgataaatga tagtaca 3087
<210> 69
<211> 3105
<212> DNA
<213> Artificial sequence
<220>
<223> H3 from A/Brisbane/10/2007 (H3N2)
<400> 69
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgaagactat cattgctttg 1020
agctacattc tatgtctggt tttcactcaa aaacttcccg gaaatgacaa cagcacggca 1080
acgctgtgcc ttgggcacca tgcagtacca aacggaacga tagtgaaaac aatcacgaat 1140
gaccaaattg aagttactaa tgctactgag ctggttcaga gttcctcaac aggtgaaata 1200
tgcgacagtc ctcatcagat ccttgatgga gaaaactgca cactaataga tgctctattg 1260
ggagaccctc agtgtgatgg cttccaaaat aagaaatggg acctttttgt tgaacgcagc 1320
aaagcctaca gcaactgtta cccttatgat gtgccggatt atgcctccct taggtcacta 1380
gttgcctcat ccggcacact ggagtttaac aatgaaagtt tcaattggac tggagtcact 1440
caaaacggaa caagctctgc ttgcataagg agatctaata acagtttctt tagtagattg 1500
aattggttga cccacttaaa attcaaatac ccagcattga acgtgactat gccaaacaat 1560
gaaaaatttg acaaattgta catttggggg gttcaccacc cgggtacgga caatgaccaa 1620
atcttcctgt atgctcaagc atcaggaaga atcacagtct ctaccaaaag aagccaacaa 1680
actgtaatcc cgaatatcgg atctagaccc agagtaagga atatccccag cagaataagc 1740
atctattgga caatagtaaa accgggagac atacttttga ttaacagcac agggaatcta 1800
attgctccta ggggttactt caaaatacga agtgggaaaa gctcaataat gagatcagat 1860
gcacccattg gcaaatgcaa ttctgaatgc atcactccaa acggaagcat tcccaatgac 1920
aaaccattcc aaaatgtaaa caggatcaca tacggggcct gtcccagata tgttaagcaa 1980
aacactctga aattggcaac agggatgcga aatgtaccag agaaacaaac tagaggcata 2040
tttggcgcaa tcgcgggttt catagaaaat ggttgggagg gaatggtgga tggttggtat 2100
ggtttcaggc atcaaaattc tgagggaata ggacaagcag cagatctcaa aagcactcaa 2160
gcagcaatcg atcaaatcaa tgggaagctg aataggttga tcgggaaaac caacgagaaa 2220
ttccatcaga ttgaaaaaga gttctcagaa gtcgaaggga gaatccagga ccttgagaaa 2280
tatgttgagg acaccaaaat agatctctgg tcatacaacg cggagcttct tgttgccctg 2340
gagaaccaac atacaattga tctaactgac tcagaaatga acaaactgtt tgaaaaaaca 2400
aagaagcaac tgagggaaaa tgctgaggat atgggcaatg gttgtttcaa aatataccac 2460
aaatgtgaca atgcctgcat aggatcaatc agaaatggaa cttatgacca cgatgtatac 2520
agagatgaag cattaaacaa ccggttccag atcaagggcg ttgagctgaa gtcaggatac 2580
aaagattgga tactatggat ttcctttgcc atatcatgtt ttttgctttg tgttgctttg 2640
ttggggttca tcatgtgggc ctgccaaaaa ggcaacatta ggtgcaacat ttgcatttga 2700
gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat 2760
tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga 2820
tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca 2880
taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat 2940
tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt 3000
caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta 3060
ttaactacta attttatatc atcccctttg ataaatgata gtaca 3105
<210> 70
<211> 3105
<212> DNA
<213> Artificial sequence
<220>
<223> H3 from A/Wisconsin/67/2005 (H3N2)
<400> 70
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgaagactat cattgctttg 1020
agctacattc tatgtctggt tttcactcaa aaacttcccg gaaatgacaa cagcacggca 1080
acgctgtgcc ttgggcacca tgcagtacca aacggaacga tagtgaaaac aatcacgaat 1140
gaccaaattg aagttactaa tgctactgag ctggttcaga gttcctcaac aggtggaata 1200
tgcgacagtc ctcatcagat ccttgatgga gaaaactgca cactaataga tgctctattg 1260
ggagaccctc agtgtgatgg cttccaaaat aagaaatggg acctttttgt tgaacgcagc 1320
aaagcctaca gcaactgtta cccttatgat gtgccggatt atgcctccct taggtcacta 1380
gttgcctcat ccggcacact ggagtttaac gatgaaagtt tcaattggac tggagtcact 1440
caaaatggaa caagctctgc ttgcaaaagg agatctaata acagtttctt tagtagattg 1500
aattggttga cccacttaaa attcaaatac ccagcattga acgtgactat gccaaacaat 1560
gaaaaatttg acaaattgta catttggggg gttcaccacc cgggtacgga caatgaccaa 1620
atcttcctgc atgctcaagc atcaggaaga atcacagtct ctaccaaaag aagccaacaa 1680
actgtaatcc cgaatatcgg atctagaccc agaataagga atatccccag cagaataagc 1740
atctattgga caatagtaaa accgggagac atacttttga ttaacagcac agggaatcta 1800
attgctccta ggggttactt caaaatacga agtgggaaaa gctcaataat gagatcagat 1860
gcacccattg gcaaatgcaa ttctgaatgc atcactccaa atggaagcat tcccaatgac 1920
aaaccatttc aaaatgtaaa caggatcaca tatggggcct gtcccagata tgttaagcaa 1980
aacactctga aattggcaac agggatgcga aatgtaccag agaaacaaac tagaggcata 2040
tttggcgcaa tcgcgggttt catagaaaat ggttgggagg gaatggtgga tggttggtac 2100
ggtttcaggc atcaaaattc tgagggaata ggacaagcag cagatctcaa aagcactcaa 2160
gcagcaatca atcaaatcaa tgggaagctg aataggttga tcgggaaaac caacgagaaa 2220
ttccatcaga ttgaaaaaga gttctcagaa gtagaaggga gaatccagga cctcgagaaa 2280
tatgttgagg acactaaaat agatctctgg tcatacaacg cggagcttct tgttgccctg 2340
gagaaccaac atacaattga tctaactgac tcagaaatga acaaactgtt tgaaagaaca 2400
aagaagcaac tgagggaaaa tgctgaggat atgggcaatg gttgtttcaa aatataccac 2460
aaatgtgaca atgcctgcat aggatcaatc agaaatggaa cttatgacca tgatgtatac 2520
agagatgaag cattaaacaa ccggttccag atcaaaggcg ttgagctgaa gtcaggatac 2580
aaagattgga tactatggat ttcctttgcc atatcatgtt ttttgctttg tgttgctttg 2640
ttggggttca tcatgtgggc ctgccaaaaa ggcaacatta ggtgcaacat ttgcatttga 2700
gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat 2760
tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga 2820
tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca 2880
taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat 2940
tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt 3000
caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta 3060
ttaactacta attttatatc atcccctttg ataaatgata gtaca 3105
<210> 71
<211> 3117
<212> DNA
<213> Artificial sequence
<220>
<223> H7 from A/Equine/Prague/56 (H7N7)
<400> 71
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgaacactca aattctaata 1020
ttagccactt cggcattctt ctatgtacgt gcagataaaa tctgcctagg acatcatgct 1080
gtgtctaatg gaaccaaagt agacaccctt actgaaaaag gaatagaagt tgtcaatgca 1140
acagaaacag ttgaacaaac aaacatccct aagatctgct caaaaggaaa acagactgtt 1200
gaccttggtc aatgtggatt actagggacc gttattggtc ctccccaatg tgaccaattt 1260
cttgagttct ctgctaattt aatagttgaa agaagggaag gtaatgacat ttgttatcca 1320
ggcaaatttg acaatgaaga aacattgaga aaaatactca gaaaatccgg aggaattaaa 1380
aaggagaata tgggattcac atataccgga gtgagaacca atggagagac tagcgcatgt 1440
agaaggtcaa gatcttcctt ttatgcagag atgaaatggc ttctatccag cacagacaat 1500
gggacatttc cacaaatgac aaagtcctac aagaacacta agaaggtacc agctctgata 1560
atctggggaa tccaccactc aggatcaact actgaacaga ctagattata tggaagtggg 1620
aataaattga taacagtttg gagttccaaa taccaacaat cttttgtccc aaatcctgga 1680
ccaagaccgc aaatgaatgg tcaatcagga agaattgact ttcactggct gatgctagat 1740
cccaatgata ctgtcacttt cagttttaat ggggccttta tagcacctga ccgcgccagt 1800
tttctaagag gtaaatctct aggaatccaa agtgatgcac aacttgacaa taattgtgaa 1860
ggtgaatgct atcatattgg aggtactata attagcaact tgccctttca aaacattaat 1920
agtagggcaa tcggaaaatg ccccagatac gtgaagcaga agagcttaat gctagcaaca 1980
ggaatgaaaa atgttcctga agctcctgca cataaacaac taactcatca catgcgcaaa 2040
aaaagaggtt tatttggtgc aatagcagga ttcattgaaa atgggtggga aggattaata 2100
gacggatggt atggatataa gcatcagaat gcacaaggag aagggactgc tgcagactac 2160
aaaagtacac aatctgctat caaccaaata accggaaaat tgaacagact aatagaaaaa 2220
accaaccagc aattcgaact aatagataat gagttcaatg aaatagaaaa acaaattggc 2280
aatgttatta actggactag agattctatc atcgaagtat ggtcatataa tgcagagttc 2340
ctcgtagcag tggagaatca acacactatt gatttaactg actcagaaat gaacaaacta 2400
tatgaaaagg taagaagaca actgagagaa aatgctgagg aagatggtaa tggctgtttt 2460
gaaatattcc accaatgtga caatgattgc atggccagca ttagaaacaa cacatatgac 2520
cataaaaaat acagaaaaga ggcaatacaa aacagaatcc agattgacgc agtaaagttg 2580
agcagtggtt acaaagatat aatactttgg tttagcttcg gggcatcatg tttcttattt 2640
cttgccattg caatgggtct tgttttcata tgtataaaaa atggaaacat gcggtgcact 2700
atttgtatat aagagctcta agttaaaatg cttcttcgtc tcctatttat aatatggttt 2760
gttattgtta attttgttct tgtagaagag cttaattaat cgttgttgtt atgaaatact 2820
atttgtatga gatgaactgg tgtaatgtaa ttcatttaca taagtggagt cagaatcaga 2880
atgtttcctc cataactaac tagacatgaa gacctgccgc gtacaattgt cttatatttg 2940
aacaactaaa attgaacatc ttttgccaca actttataag tggttaatat agctcaaata 3000
tatggtcaag ttcaatagat taataatgga aatatcagtt atcgaaattc attaacaatc 3060
aacttaacgt tattaactac taattttata tcatcccctt tgataaatga tagtaca 3117
<210> 72
<211> 3162
<212> DNA
<213> Artificial sequence
<220>
<223> HA from B/Malaysia/2506/2004
<400> 72
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgaaggcaat aattgtacta 1020
ctcatggtag taacatccaa tgcagatcga atctgcactg ggataacatc gtcaaactca 1080
ccacatgttg tcaaaactgc tactcaaggg gaggtcaatg tgactggtgt aataccactg 1140
acaacaacac ccaccaaatc tcattttgca aatctcaaag gaacagaaac cagagggaaa 1200
ctatgcccaa aatgcctcaa ctgcacagat ctggacgtgg ccttgggcag accaaaatgc 1260
acggggaaca taccctcggc aagagtttca atactccatg aagtcagacc tgttacatct 1320
gggtgctttc ctataatgca cgacagaaca aaaattagac agctgcctaa acttctcaga 1380
ggatacgaac atatcaggtt atcaactcat aacgttatca atgcagaaaa tgcaccagga 1440
ggaccctaca aaattggaac ctcagggtct tgccctaacg ttaccaatgg aaacggattt 1500
ttcgcaacaa tggcttgggc cgtcccaaaa aacgacaaca acaaaacagc aacaaattca 1560
ttaacaatag aagtaccata catttgtaca gaaggagaag accaaattac cgtttggggg 1620
ttccactctg ataacgaaac ccaaatggca aagctctatg gggactcaaa gccccagaag 1680
ttcacctcat ctgccaacgg agtgaccaca cattacgttt cacagattgg tggcttccca 1740
aatcaaacag aagacggagg actaccacaa agcggtagaa ttgttgttga ttacatggtg 1800
caaaaatctg ggaaaacagg aacaattacc tatcaaagag gtattttatt gcctcaaaaa 1860
gtgtggtgcg caagtggcag gagcaaggta ataaaaggat cgttgccttt aattggagaa 1920
gcagattgcc tccacgaaaa atacggtgga ttaaacaaaa gcaagcctta ctacacaggg 1980
gaacatgcaa aggccatagg aaattgccca atatgggtga aaacaccctt gaagctggcc 2040
aatggaacca aatatagacc tcctgcaaaa ctattaaagg aaaggggttt cttcggagct 2100
attgctggtt tcttagaagg aggatgggaa ggaatgattg caggttggca cggatacaca 2160
tcccatgggg cacatggagt agcggtggca gcagacctta agagcactca agaggccata 2220
aacaagataa caaaaaatct caactctttg agtgagctgg aagtaaagaa tcttcaaaga 2280
ctaagcggtg ccatggatga actccacaac gaaatactag aactagacga gaaagtggat 2340
gatctcagag ctgatacaat aagctcacaa atagaactcg cagtcctgct ttccaatgaa 2400
ggaataataa acagtgaaga tgagcatctc ttggcgcttg aaagaaagct gaagaaaatg 2460
ctgggcccct ctgctgtaga gatagggaat ggatgctttg aaaccaaaca caagtgcaac 2520
cagacctgtc tcgacagaat agctgctggt acctttgatg caggagaatt ttctctcccc 2580
acttttgatt cactgaatat tactgctgca tctttaaatg acgatggatt ggataatcat 2640
actatactgc tttactactc aactgctgcc tccagtttgg ctgtaacatt gatgatagct 2700
atctttgttg tttatatggt ctccagagac aatgtttctt gctccatctg tctataagag 2760
ctctaagtta aaatgcttct tcgtctccta tttataatat ggtttgttat tgttaatttt 2820
gttcttgtag aagagcttaa ttaatcgttg ttgttatgaa atactatttg tatgagatga 2880
actggtgtaa tgtaattcat ttacataagt ggagtcagaa tcagaatgtt tcctccataa 2940
ctaactagac atgaagacct gccgcgtaca attgtcttat atttgaacaa ctaaaattga 3000
acatcttttg ccacaacttt ataagtggtt aatatagctc aaatatatgg tcaagttcaa 3060
tagattaata atggaaatat cagttatcga aattcattaa caatcaactt aacgttatta 3120
actactaatt ttatatcatc ccctttgata aatgatagta ca 3162
<210> 73
<211> 3159
<212> DNA
<213> Artificial sequence
<220>
<223> HA from B/Florida/4/2006
<400> 73
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgaaggcaat aattgtacta 1020
ctcatggtag taacatccaa tgcagatcga atctgcactg gaataacatc ttcaaactca 1080
cctcatgtgg tcaaaacagc cactcaaggg gaggtcaatg tgactggtgt gataccacta 1140
acaacaacac caacaaaatc ttattttgca aatctcaaag gaacaaggac cagagggaaa 1200
ctatgcccag actgtctcaa ctgcacagat ctggatgtgg ctttgggcag accaatgtgt 1260
gtggggacca caccttcggc gaaggcttca atactccacg aagtcaaacc tgttacatcc 1320
gggtgctttc ctataatgca cgacagaaca aaaatcaggc aactacccaa tcttctcaga 1380
ggatatgaaa atatcaggct atcaacccaa aacgtcatcg atgcggaaaa ggcaccagga 1440
ggaccctaca gacttggaac ctcaggatct tgccctaacg ctaccagtaa gagcggattt 1500
ttcgcaacaa tggcttgggc tgtcccaaag gacaacaaca aaaatgcaac gaacccacta 1560
acagtagaag taccatacat ttgtacagaa ggggaagacc aaatcactgt ttgggggttc 1620
cattcagata acaaaaccca aatgaagaac ctctatggag actcaaatcc tcaaaagttc 1680
acctcatctg ctaatggagt aaccacacac tatgtttctc agattggcag cttcccagat 1740
caaacagaag acggaggact accacaaagc ggcaggattg ttgttgatta catgatgcaa 1800
aaacctggga aaacaggaac aattgtctac caaagaggtg ttttgttgcc tcaaaaggtg 1860
tggtgcgcga gtggcaggag caaagtaata aaagggtcct tgcctttaat tggtgaagca 1920
gattgccttc atgaaaaata cggtggatta aacaaaagca agccttacta cacaggagaa 1980
catgcaaaag ccataggaaa ttgcccaata tgggtgaaaa cacctttgaa gctcgccaat 2040
ggaaccaaat atagacctcc tgcaaaacta ttaaaggaaa ggggtttctt cggagctatt 2100
gctggtttcc tagaaggagg atgggaagga atgattgcag gctggcacgg atacacatct 2160
cacggagcac atggagtggc agtggcggcg gaccttaaga gtacgcaaga agctataaac 2220
aagataacaa aaaatctcaa ttctttgagt gagctagaag taaagaatct tcaaagacta 2280
agtggtgcca tggatgaact ccacaacgaa atactcgagc tggatgagaa agtggatgat 2340
ctcagagctg acactataag ctcgcaaata gaacttgcag tcttgctttc caacgaagga 2400
ataataaaca gtgaagatga gcatctattg gcacttgaga gaaaactaaa gaaaatgctg 2460
ggtccctctg ctgtagagat aggaaatgga tgcttcgaaa ccaaacacaa gtgcaaccag 2520
acctgcttag acaggatagc tgctggcacc tttaatgcag gagaattttc tctccccact 2580
tttgattcac tgaacattac tgctgcatct ttaaatgatg atggattgga taaccatact 2640
atactgctct attactcaac tgctgcttct agtttggctg taacattgat gctagctatt 2700
tttattgttt atatggtctc cagagacaac gtttcatgct ccatctgtct ataagagctc 2760
taagttaaaa tgcttcttcg tctcctattt ataatatggt ttgttattgt taattttgtt 2820
cttgtagaag agcttaatta atcgttgttg ttatgaaata ctatttgtat gagatgaact 2880
ggtgtaatgt aattcattta cataagtgga gtcagaatca gaatgtttcc tccataacta 2940
actagacatg aagacctgcc gcgtacaatt gtcttatatt tgaacaacta aaattgaaca 3000
tcttttgcca caactttata agtggttaat atagctcaaa tatatggtca agttcaatag 3060
attaataatg gaaatatcag ttatcgaaat tcattaacaa tcaacttaac gttattaact 3120
actaatttta tatcatcccc tttgataaat gatagtaca 3159
<210> 74
<211> 565
<212> PRT
<213> Influenza virus
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa can be Ala or Val
<220>
<221> misc_feature
<222> (52)..(52)
<223> Xaa can be Asp or Asn
<220>
<221> misc_feature
<222> (90)..(90)
<223> Xaa can be Lys or Arg
<220>
<221> misc_feature
<222> (99)..(99)
<223> Xaa can be Lys or Thr
<220>
<221> misc_feature
<222> (111)..(111)
<223> Xaa can be Tyr or His
<220>
<221> misc_feature
<222> (145)..(145)
<223> Xaa can be Val or Thr
<220>
<221> misc_feature
<222> (157)..(157)
<223> Xaa can be Glu Lys
<220>
<221> misc_feature
<222> (162)..(162)
<223> Xaa can be Arg or Lys
<220>
<221> misc_feature
<222> (182)..(182)
<223> Xaa can be Val or Ala
<220>
<221> misc_feature
<222> (203)..(203)
<223> Xaa can be Asp or Asn
<220>
<221> misc_feature
<222> (205)..(205)
<223> Xaa can be Arg or Lys
<220>
<221> misc_feature
<222> (210)..(210)
<223> Xaa can be Thr or Lys
<220>
<221> misc_feature
<222> (225)..(225)
<223> Xaa can be Arg or Lys
<220>
<221> misc_feature
<222> (268)..(268)
<223> Xaa can be Trp or Arg
<220>
<221> misc_feature
<222> (283)..(283)
<223> Xaa can be Thr or Asn
<220>
<221> misc_feature
<222> (290)..(290)
<223> Xaa can be Glu or Gly
<220>
<221> misc_feature
<222> (432)..(432)
<223> Xaa can be Ile or Leu
<220>
<221> misc_feature
<222> (489)..(489)
<223> Xaa can be Asn or Asp
<400> 74
Met Lys Xaa Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr
1 5 10 15
Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr
20 25 30
Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn
35 40 45
Leu Leu Glu Xaa Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile
50 55 60
Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly
65 70 75 80
Asn Pro Glu Cys Glu Leu Leu Ile Ser Xaa Glu Ser Trp Ser Tyr Ile
85 90 95
Val Glu Xaa Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Xaa Phe
100 105 110
Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe
115 120 125
Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr
130 135 140
Xaa Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Xaa Ser Ser Phe
145 150 155 160
Tyr Xaa Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn
165 170 175
Leu Ser Lys Ser Tyr Xaa Asn Asn Lys Glu Lys Glu Val Leu Val Leu
180 185 190
Trp Gly Val His His Pro Pro Asn Ile Gly Xaa Gln Xaa Ala Leu Tyr
195 200 205
His Xaa Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg
210 215 220
Xaa Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu
225 230 235 240
Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile
245 250 255
Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Xaa Tyr Ala Phe Ala
260 265 270
Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Xaa Ser Asn Ala Pro Met
275 280 285
Asp Xaa Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser
290 295 300
Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro
305 310 315 320
Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn
325 330 335
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
340 345 350
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
355 360 365
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr
370 375 380
Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu
385 390 395 400
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu
405 410 415
Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Xaa
420 425 430
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
435 440 445
Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
450 455 460
Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
465 470 475 480
Phe Glu Phe Tyr His Lys Cys Asn Xaa Glu Cys Met Glu Ser Val Lys
485 490 495
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn
500 505 510
Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln
515 520 525
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val
530 535 540
Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln
545 550 555 560
Cys Arg Ile Cys Ile
565
<210> 75
<211> 565
<212> PRT
<213> Influenza virus
<400> 75
Met Lys Ala Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr
1 5 10 15
Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr
20 25 30
Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn
35 40 45
Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile
50 55 60
Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly
65 70 75 80
Asn Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile
85 90 95
Val Glu Thr Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Tyr Phe
100 105 110
Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe
115 120 125
Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr
130 135 140
Val Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Lys Ser Ser Phe
145 150 155 160
Tyr Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn
165 170 175
Leu Ser Lys Ser Tyr Val Asn Asn Lys Glu Lys Glu Val Leu Val Leu
180 185 190
Trp Gly Val His His Pro Pro Asn Ile Gly Asn Gln Arg Ala Leu Tyr
195 200 205
His Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg
210 215 220
Arg Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu
225 230 235 240
Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile
245 250 255
Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Phe Ala
260 265 270
Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Thr Ser Asn Ala Pro Met
275 280 285
Asp Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser
290 295 300
Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro
305 310 315 320
Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn
325 330 335
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
340 345 350
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
355 360 365
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr
370 375 380
Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu
385 390 395 400
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu
405 410 415
Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu
420 425 430
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
435 440 445
Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
450 455 460
Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
465 470 475 480
Phe Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys
485 490 495
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn
500 505 510
Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln
515 520 525
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val
530 535 540
Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln
545 550 555 560
Cys Arg Ile Cys Ile
565
<210> 76
<211> 252
<212> PRT
<213> Influenza virus
<400> 76
Met Ser Leu Leu Thr Glu Val Glu Thr Tyr Val Leu Ser Ile Ile Pro
1 5 10 15
Ser Gly Pro Leu Lys Ala Glu Ile Ala Gln Arg Leu Glu Asp Val Phe
20 25 30
Ala Gly Lys Asn Thr Asp Leu Glu Val Leu Met Glu Trp Leu Lys Thr
35 40 45
Arg Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe
50 55 60
Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Gln Arg Arg Arg Phe Val
65 70 75 80
Gln Asn Ala Leu Asn Gly Asn Gly Asp Pro Asn Asn Met Asp Lys Ala
85 90 95
Val Lys Leu Tyr Arg Lys Leu Lys Arg Glu Ile Thr Phe His Gly Ala
100 105 110
Lys Glu Ile Ser Leu Ser Tyr Ser Ala Gly Ala Leu Ala Ser Cys Met
115 120 125
Gly Leu Ile Tyr Asn Arg Met Gly Ala Val Thr Thr Glu Val Ala Phe
130 135 140
Gly Leu Val Cys Ala Thr Cys Glu Gln Ile Ala Asp Ser Gln His Arg
145 150 155 160
Ser His Arg Gln Met Val Thr Thr Thr Asn Pro Leu Ile Arg His Glu
165 170 175
Asn Arg Met Val Leu Ala Ser Thr Thr Ala Lys Ala Met Glu Gln Met
180 185 190
Ala Gly Ser Ser Glu Gln Ala Ala Glu Ala Met Glu Val Ala Ser Gln
195 200 205
Ala Arg Gln Met Val Gln Ala Met Arg Thr Ile Gly Thr His Pro Ser
210 215 220
Ser Ser Ala Gly Leu Lys Asn Asp Leu Leu Glu Asn Leu Gln Ala Tyr
225 230 235 240
Gln Lys Arg Met Gly Val Gln Met Gln Arg Phe Lys
245 250
<210> 77
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> pBinPlus.2613c
<400> 77
aggaagggaa gaaagcgaaa ggag 24
<210> 78
<211> 56
<212> DNA
<213> Artificial sequence
<220>
<223> Mut-ATG115.r
<400> 78
gtgccgaagc acgatctgac aacgttgaag atcgctcacg caagaaagac aagaga 56
<210> 79
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> Mut-ATG161.c
<400> 79
gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc ga 52
<210> 80
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> LC-C5-1.110r
<400> 80
tctcctggag tcacagacag ggtgg 25
<210> 81
<211> 2065
<212> DNA
<213> Artificial sequence
<220>
<223> Expression cassette number 828
<400> 81
ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60
gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120
ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180
cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240
attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300
acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360
tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420
tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480
tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540
tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600
cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660
tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720
tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780
acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840
cccaaatttg tcgggcccat ggttttcaca cctcagatac ttggacttat gcttttttgg 900
atttcagcct ccagaggtga tattgtgcta actcagtctc cagccaccct gtctgtgact 960
ccaggagata gtgtcagtct ttcctgcagg gccagccaaa gtattagcaa caacctacac 1020
tggtttcaac aaaaatcgca tgagtctcca aggcttctca tcaagtatgc ttcccagtcc 1080
atatctggga tcccctccag gttcagtggc agtggatctg ggacagattt cactctcagt 1140
atcaacagtg tgaagactga agattttgga atgtttttct gtcaacagag taacagctgg 1200
cctctcacgt tcggtgatgg gacaaagctg gagctgaaac gggctgatgc tgcaccaact 1260
gtatccatct tcccaccatc cagtgagcag ttaacatctg gaggtgcctc agtcgtgtgc 1320
ttcttgaaca acttctaccc caaagacatc aatgtcaagt ggaagattga tggcagtgaa 1380
cgacaaaatg gcgtcctgaa cagttggact gatcaggaca gcaaagacag cacctacagc 1440
atgagcagca ccctcacgtt gaccaaggac gagtatgaac gacataacag ctatacctgt 1500
gaggccactc acaagacatc aacttcaccc attgtcaaga gcttcaacag gaatgagtgt 1560
tagaggccta ttttctttag tttgaattta ctgttattcg gtgtgcattt ctatgtttgg 1620
tgagcggttt tctgtgctca gagtgtgttt attttatgta atttaatttc tttgtgagct 1680
cctgtttagc aggtcgtccc ttcagcaagg acacaaaaag attttaattt tattaaaaaa 1740
aaaaaaaaaa aagaccggga attcgatatc aagcttatcg acctgcagat cgttcaaaca 1800
tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg attatcatat 1860
aatttctgtt gaattacgtt aagcatgtaa taattaacat gtaatgcatg acgttattta 1920
tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg atagaaaaca 1980
aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg ttactagatt 2040
ctagagtctc aagcttcggc gcgcc 2065
<210> 82
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> SpPDI-HA(Ind).c
<400> 82
gttccttctc agatcttcgc tgatcagatt tgcattggtt accatgca 48
<210> 83
<211> 3218
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number 663, from HindIII
<400> 83
aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60
tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120
tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180
taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240
catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300
aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360
accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420
aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480
caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540
aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600
aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660
agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720
ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780
tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840
ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900
tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960
tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020
ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1080
tcttgtgttg gttccttctc agatcttcgc tgatcagatt tgcattggtt accatgcaaa 1140
caattcaaca gagcaggttg acacaatcat ggaaaagaac gttactgtta cacatgccca 1200
agacatactg gaaaagacac acaacgggaa gctctgcgat ctagatggag tgaagcctct 1260
aattttaaga gattgtagtg tagctggatg gctcctcggg aacccaatgt gtgacgaatt 1320
catcaatgta ccggaatggt cttacatagt ggagaaggcc aatccaacca atgacctctg 1380
ttacccaggg agtttcaacg actatgaaga actgaaacac ctattgagca gaataaacca 1440
ttttgagaaa attcaaatca tccccaaaag ttcttggtcc gatcatgaag cctcatcagg 1500
agttagctca gcatgtccat acctgggaag tccctccttt tttagaaatg tggtatggct 1560
tatcaaaaag aacagtacat acccaacaat aaagaaaagc tacaataata ccaaccaaga 1620
ggatcttttg gtactgtggg gaattcacca tcctaatgat gcggcagagc agacaaggct 1680
atatcaaaac ccaaccacct atatttccat tgggacatca acactaaacc agagattggt 1740
accaaaaata gctactagat ccaaagtaaa cgggcaaagt ggaaggatgg agttcttctg 1800
gacaatttta aaacctaatg atgcaatcaa cttcgagagt aatggaaatt tcattgctcc 1860
agaatatgca tacaaaattg tcaagaaagg ggactcagca attatgaaaa gtgaattgga 1920
atatggtaac tgcaacacca agtgtcaaac tccaatgggg gcgataaact ctagtatgcc 1980
attccacaac atacaccctc tcaccatcgg ggaatgcccc aaatatgtga aatcaaacag 2040
attagtcctt gcaacagggc tcagaaatag ccctcaaaga gagagcagaa gaaaaaagag 2100
aggactattt ggagctatag caggttttat agagggagga tggcagggaa tggtagatgg 2160
ttggtatggg taccaccata gcaatgagca ggggagtggg tacgctgcag acaaagaatc 2220
cactcaaaag gcaatagatg gagtcaccaa taaggtcaac tcaatcattg acaaaatgaa 2280
cactcagttt gaggccgttg gaagggaatt taataactta gaaaggagaa tagagaattt 2340
aaacaagaag atggaagacg ggtttctaga tgtctggact tataatgccg aacttctggt 2400
tctcatggaa aatgagagaa ctctagactt tcatgactca aatgttaaga acctctacga 2460
caaggtccga ctacagctta gggataatgc aaaggagctg ggtaacggtt gtttcgagtt 2520
ctatcacaaa tgtgataatg aatgtatgga aagtataaga aacggaacgt acaactatcc 2580
gcagtattca gaagaagcaa gattaaaaag agaggaaata agtggggtaa aattggaatc 2640
aataggaact taccaaatac tgtcaattta ttcaacagtg gcgagttccc tagcactggc 2700
aatcatgatg gctggtctat ctttatggat gtgctccaat ggatcgttac aatgcagaat 2760
ttgcatttaa gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt 2820
tattgttaat tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat 2880
ttgtatgaga tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat 2940
gtttcctcca taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa 3000
caactaaaat tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata 3060
tggtcaagtt caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa 3120
cttaacgtta ttaactacta attttatatc atcccctttg ataaatgata gtacaccaat 3180
taggaaggag catgctcgag gcctggctgg ccgaattc 3218
<210> 84
<211> 49
<212> DNA
<213> Artificial sequence
<220>
<223> SpPDI-H1B.c
<400> 84
ttctcagatc ttcgctgaca caatatgtat aggctaccat gctaacaac 49
<210> 85
<211> 47
<212> DNA
<213> Artificial sequence
<220>
<223> SacI-H1B.r
<400> 85
cttagagctc ttagatgcat attctacact gtaaagaccc attggaa 47
<210> 86
<211> 3206
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number 787, from HindIII
<400> 86
aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60
tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120
tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180
taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240
catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300
aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360
accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420
aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480
caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540
aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600
aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660
agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720
ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780
tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840
ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900
tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960
tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020
ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1080
tcttgtgttg gttccttctc agatcttcgc tgacacaata tgtataggct accatgctaa 1140
caactcgacc gacactgttg acacagtact tgaaaagaat gtgacagtga cacactctgt 1200
caacctgctt gagaacagtc acaatggaaa actatgtcta ttaaaaggaa tagccccact 1260
acaattgggt aattgcagcg ttgccgggtg gatcttagga aacccagaat gcgaattact 1320
gatttccaag gagtcatggt cctacattgt agaaaaacca aatcctgaga atggaacatg 1380
ttacccaggg catttcgctg actatgagga actgagggag caattgagtt cagtatcttc 1440
atttgagagg ttcgaaatat tccccaaaga aagctcatgg cccaaccaca ccgtaaccgg 1500
agtgtcagca tcatgctccc ataatgggga aagcagtttt tacagaaatt tgctatggct 1560
gacggggaag aatggtttgt acccaaacct gagcaagtcc tatgcaaaca acaaagaaaa 1620
agaagtcctt gtactatggg gtgttcatca cccgccaaac ataggtgacc aaaaggccct 1680
ctatcataca gaaaatgctt atgtctctgt agtgtcttca cattatagca gaaaattcac 1740
cccagaaata gccaaaagac ccaaagtaag agatcaagaa ggaagaatca attactactg 1800
gactctgctt gaacccgggg atacaataat atttgaggca aatggaaatc taatagcgcc 1860
aagatatgct ttcgcactga gtagaggctt tggatcagga atcatcaact caaatgcacc 1920
aatggataaa tgtgatgcga agtgccaaac acctcaggga gctataaaca gcagtcttcc 1980
tttccagaac gtacacccag tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa 2040
attaaggatg gttacaggac taaggaacat cccatccatt caatccagag gtttgtttgg 2100
agccattgcc ggtttcattg aaggggggtg gactggaatg gtagatggtt ggtatggtta 2160
tcatcatcag aatgagcaag gatctggcta tgctgcagat caaaaaagca cacaaaatgc 2220
cattaatggg attacaaaca aggtcaattc tgtaattgag aaaatgaaca ctcaattcac 2280
agcagtgggc aaagagttca acaaattgga aagaaggatg gaaaacttga ataaaaaagt 2340
tgatgatggg tttatagaca tttggacata taatgcagaa ctgttggttc tactggaaaa 2400
tgaaaggact ttggatttcc atgactccaa tgtgaagaat ctgtatgaga aagtaaaaag 2460
ccagttaaag aataatgcta aagaaatagg aaatgggtgt tttgagttct atcacaagtg 2520
taacgatgaa tgcatggaga gtgtaaagaa tggaacttat gactatccaa aatattccga 2580
agaatcaaag ttaaacaggg agaaaattga tggagtgaaa ttggaatcaa tgggagtcta 2640
tcagattctg gcgatctact caacagtcgc cagttctctg gttcttttgg tctccctggg 2700
ggcaatcagc ttctggatgt gttccaatgg gtctttacag tgtagaatat gcatctaaga 2760
gctctaagtt aaaatgcttc ttcgtctcct atttataata tggtttgtta ttgttaattt 2820
tgttcttgta gaagagctta attaatcgtt gttgttatga aatactattt gtatgagatg 2880
aactggtgta atgtaattca tttacataag tggagtcaga atcagaatgt ttcctccata 2940
actaactaga catgaagacc tgccgcgtac aattgtctta tatttgaaca actaaaattg 3000
aacatctttt gccacaactt tataagtggt taatatagct caaatatatg gtcaagttca 3060
atagattaat aatggaaata tcagttatcg aaattcatta acaatcaact taacgttatt 3120
aactactaat tttatatcat cccctttgat aaatgatagt acaccaatta ggaaggagca 3180
tgctcgaggc ctggctggcc gaattc 3206
<210> 87
<211> 45
<212> DNA
<213> Artificial sequence
<220>
<223> H3B-SpPDI.r
<400> 87
tgtcatttcc gggaagtttt tgagcgaaga tctgagaagg aacca 45
<210> 88
<211> 45
<212> DNA
<213> Artificial sequence
<220>
<223> SpPDI-H3B.c
<400> 88
tctcagatct tcgctcaaaa acttcccgga aatgacaaca gcacg 45
<210> 89
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> H3(A-Bri).982r
<400> 89
ttgcttaaca tatctgggac agg 23
<210> 90
<211> 3212
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number 790, from HindIII
<400> 90
aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60
tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120
tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180
taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240
catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300
aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360
accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420
aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480
caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540
aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600
aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660
agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720
ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780
tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840
ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900
tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960
tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020
ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1080
tcttgtgttg gttccttctc agatcttcgc tcaaaaactt cccggaaatg acaacagcac 1140
ggcaacgctg tgccttgggc accatgcagt accaaacgga acgatagtga aaacaatcac 1200
gaatgaccaa attgaagtta ctaatgctac tgagctggtt cagagttcct caacaggtga 1260
aatatgcgac agtcctcatc agatccttga tggagaaaac tgcacactaa tagatgctct 1320
attgggagac cctcagtgtg atggcttcca aaataagaaa tgggaccttt ttgttgaacg 1380
cagcaaagcc tacagcaact gttaccctta tgatgtgccg gattatgcct cccttaggtc 1440
actagttgcc tcatccggca cactggagtt taacaatgaa agtttcaatt ggactggagt 1500
cactcaaaac ggaacaagct ctgcttgcat aaggagatct aataacagtt tctttagtag 1560
attgaattgg ttgacccact taaaattcaa atacccagca ttgaacgtga ctatgccaaa 1620
caatgaaaaa tttgacaaat tgtacatttg gggggttcac cacccgggta cggacaatga 1680
ccaaatcttc ctgtatgctc aagcatcagg aagaatcaca gtctctacca aaagaagcca 1740
acaaactgta atcccgaata tcggatctag acccagagta aggaatatcc ccagcagaat 1800
aagcatctat tggacaatag taaaaccggg agacatactt ttgattaaca gcacagggaa 1860
tctaattgct cctaggggtt acttcaaaat acgaagtggg aaaagctcaa taatgagatc 1920
agatgcaccc attggcaaat gcaattctga atgcatcact ccaaacggaa gcattcccaa 1980
tgacaaacca ttccaaaatg taaacaggat cacatacggg gcctgtccca gatatgttaa 2040
gcaaaacact ctgaaattgg caacagggat gcgaaatgta ccagagaaac aaactagagg 2100
catatttggc gcaatcgcgg gtttcataga aaatggttgg gagggaatgg tggatggttg 2160
gtatggtttc aggcatcaaa attctgaggg aataggacaa gcagcagatc tcaaaagcac 2220
tcaagcagca atcgatcaaa tcaatgggaa gctgaatagg ttgatcggga aaaccaacga 2280
gaaattccat cagattgaaa aagagttctc agaagtcgaa gggagaatcc aggaccttga 2340
gaaatatgtt gaggacacca aaatagatct ctggtcatac aacgcggagc ttcttgttgc 2400
cctggagaac caacatacaa ttgatctaac tgactcagaa atgaacaaac tgtttgaaaa 2460
aacaaagaag caactgaggg aaaatgctga ggatatgggc aatggttgtt tcaaaatata 2520
ccacaaatgt gacaatgcct gcataggatc aatcagaaat ggaacttatg accacgatgt 2580
atacagagat gaagcattaa acaaccggtt ccagatcaag ggcgttgagc tgaagtcagg 2640
atacaaagat tggatactat ggatttcctt tgccatatca tgttttttgc tttgtgttgc 2700
tttgttgggg ttcatcatgt gggcctgcca aaaaggcaac attaggtgca acatttgcat 2760
ttgagagctc taagttaaaa tgcttcttcg tctcctattt ataatatggt ttgttattgt 2820
taattttgtt cttgtagaag agcttaatta atcgttgttg ttatgaaata ctatttgtat 2880
gagatgaact ggtgtaatgt aattcattta cataagtgga gtcagaatca gaatgtttcc 2940
tccataacta actagacatg aagacctgcc gcgtacaatt gtcttatatt tgaacaacta 3000
aaattgaaca tcttttgcca caactttata agtggttaat atagctcaaa tatatggtca 3060
agttcaatag attaataatg gaaatatcag ttatcgaaat tcattaacaa tcaacttaac 3120
gttattaact actaatttta tatcatcccc tttgataaat gatagtacac caattaggaa 3180
ggagcatgct cgaggcctgg ctggccgaat tc 3212
<210> 91
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> HBF-SpPDI.r
<400> 91
gttattccag tgcagattcg atcagcgaag atctgagaag gaaccaacac 50
<210> 92
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> SpPDI-HBF.c
<400> 92
cagatcttcg ctgatcgaat ctgcactgga ataacatctt caaactcacc 50
<210> 93
<211> 28
<212> DNA
<213> Artificial sequence
<220>
<223> Plaster80r
<400> 93
caaatagtat ttcataacaa caacgatt 28
<210> 94
<211> 3269
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number 798, from HindIII
<400> 94
aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60
tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120
tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180
taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240
catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300
aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360
accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420
aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480
caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540
aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600
aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660
agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720
ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780
tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840
ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900
tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960
tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020
ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1080
tcttgtgttg gttccttctc agatcttcgc tgatcgaatc tgcactggaa taacatcttc 1140
aaactcacct catgtggtca aaacagccac tcaaggggag gtcaatgtga ctggtgtgat 1200
accactaaca acaacaccaa caaaatctta ttttgcaaat ctcaaaggaa caaggaccag 1260
agggaaacta tgcccagact gtctcaactg cacagatctg gatgtggctt tgggcagacc 1320
aatgtgtgtg gggaccacac cttcggcgaa ggcttcaata ctccacgaag tcaaacctgt 1380
tacatccggg tgctttccta taatgcacga cagaacaaaa atcaggcaac tacccaatct 1440
tctcagagga tatgaaaata tcaggctatc aacccaaaac gtcatcgatg cggaaaaggc 1500
accaggagga ccctacagac ttggaacctc aggatcttgc cctaacgcta ccagtaagag 1560
cggatttttc gcaacaatgg cttgggctgt cccaaaggac aacaacaaaa atgcaacgaa 1620
cccactaaca gtagaagtac catacatttg tacagaaggg gaagaccaaa tcactgtttg 1680
ggggttccat tcagataaca aaacccaaat gaagaacctc tatggagact caaatcctca 1740
aaagttcacc tcatctgcta atggagtaac cacacactat gtttctcaga ttggcagctt 1800
cccagatcaa acagaagacg gaggactacc acaaagcggc aggattgttg ttgattacat 1860
gatgcaaaaa cctgggaaaa caggaacaat tgtctaccaa agaggtgttt tgttgcctca 1920
aaaggtgtgg tgcgcgagtg gcaggagcaa agtaataaaa gggtccttgc ctttaattgg 1980
tgaagcagat tgccttcatg aaaaatacgg tggattaaac aaaagcaagc cttactacac 2040
aggagaacat gcaaaagcca taggaaattg cccaatatgg gtgaaaacac ctttgaagct 2100
cgccaatgga accaaatata gacctcctgc aaaactatta aaggaaaggg gtttcttcgg 2160
agctattgct ggtttcctag aaggaggatg ggaaggaatg attgcaggct ggcacggata 2220
cacatctcac ggagcacatg gagtggcagt ggcggcggac cttaagagta cgcaagaagc 2280
tataaacaag ataacaaaaa atctcaattc tttgagtgag ctagaagtaa agaatcttca 2340
aagactaagt ggtgccatgg atgaactcca caacgaaata ctcgagctgg atgagaaagt 2400
ggatgatctc agagctgaca ctataagctc gcaaatagaa cttgcagtct tgctttccaa 2460
cgaaggaata ataaacagtg aagatgagca tctattggca cttgagagaa aactaaagaa 2520
aatgctgggt ccctctgctg tagagatagg aaatggatgc ttcgaaacca aacacaagtg 2580
caaccagacc tgcttagaca ggatagctgc tggcaccttt aatgcaggag aattttctct 2640
ccccactttt gattcactga acattactgc tgcatcttta aatgatgatg gattggataa 2700
ccatactata ctgctctatt actcaactgc tgcttctagt ttggctgtaa cattgatgct 2760
agctattttt attgtttata tggtctccag agacaacgtt tcatgctcca tctgtctata 2820
agagctctaa gttaaaatgc ttcttcgtct cctatttata atatggtttg ttattgttaa 2880
ttttgttctt gtagaagagc ttaattaatc gttgttgtta tgaaatacta tttgtatgag 2940
atgaactggt gtaatgtaat tcatttacat aagtggagtc agaatcagaa tgtttcctcc 3000
ataactaact agacatgaag acctgccgcg tacaattgtc ttatatttga acaactaaaa 3060
ttgaacatct tttgccacaa ctttataagt ggttaatata gctcaaatat atggtcaagt 3120
tcaatagatt aataatggaa atatcagtta tcgaaattca ttaacaatca acttaacgtt 3180
attaactact aattttatat catccccttt gataaatgat agtacaccaa ttaggaagga 3240
gcatgctcga ggcctggctg gccgaattc 3269
<210> 95
<211> 45
<212> DNA
<213> Artificial sequence
<220>
<223> ApaI-SpPDI.c
<400> 95
ttgtcgggcc catggcgaaa aacgttgcga ttttcggctt attgt 45
<210> 96
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<223> StuI-H1(A-NC).r
<400> 96
aaaataggcc tttagatgca tattctacac tgcaaagacc ca 42
<210> 97
<211> 3079
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number 580, from PacI
<400> 97
ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60
gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120
ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180
cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240
attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300
acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360
tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420
tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480
tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540
tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600
cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660
tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720
tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780
acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840
cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900
cttgtgttgg ttccttctca gatcttcgct gacacaatat gtataggcta ccatgccaac 960
aactcaaccg acactgttga cacagtactt gagaagaatg tgacagtgac acactctgtc 1020
aacctacttg aggacagtca caatggaaaa ctatgtctac taaaaggaat agccccacta 1080
caattgggta attgcagcgt tgccggatgg atcttaggaa acccagaatg cgaattactg 1140
atttccaagg aatcatggtc ctacattgta gaaacaccaa atcctgagaa tggaacatgt 1200
tacccagggt atttcgccga ctatgaggaa ctgagggagc aattgagttc agtatcttca 1260
tttgagagat tcgaaatatt ccccaaagaa agctcatggc ccaaccacac cgtaaccgga 1320
gtatcagcat catgctccca taatgggaaa agcagttttt acagaaattt gctatggctg 1380
acggggaaga atggtttgta cccaaacctg agcaagtcct atgtaaacaa caaagagaaa 1440
gaagtccttg tactatgggg tgttcatcac ccgcctaaca tagggaacca aagggcactc 1500
tatcatacag aaaatgctta tgtctctgta gtgtcttcac attatagcag aagattcacc 1560
ccagaaatag ccaaaagacc caaagtaaga gatcaggaag gaagaatcaa ctactactgg 1620
actctgctgg aacctgggga tacaataata tttgaggcaa atggaaatct aatagcgcca 1680
tggtatgctt ttgcactgag tagaggcttt ggatcaggaa tcatcacctc aaatgcacca 1740
atggatgaat gtgatgcgaa gtgtcaaaca cctcagggag ctataaacag cagtcttcct 1800
ttccagaatg tacacccagt cacaatagga gagtgtccaa agtatgtcag gagtgcaaaa 1860
ttaaggatgg ttacaggact aaggaacatc ccatccattc aatccagagg tttgtttgga 1920
gccattgccg gtttcattga aggggggtgg actggaatgg tagatgggtg gtatggttat 1980
catcatcaga atgagcaagg atctggctat gctgcagatc aaaaaagtac acaaaatgcc 2040
attaacggga ttacaaacaa ggtcaattct gtaattgaga aaatgaacac tcaattcaca 2100
gctgtgggca aagagttcaa caaattggaa agaaggatgg aaaacttaaa taaaaaagtt 2160
gatgatgggt ttctagacat ttggacatat aatgcagaat tgttggttct actggaaaat 2220
gaaaggactt tggatttcca tgactccaat gtgaagaatc tgtatgagaa agtaaaaagc 2280
caattaaaga ataatgccaa agaaatagga aacgggtgtt ttgagttcta tcacaagtgt 2340
aacaatgaat gcatggagag tgtgaaaaat ggtacctatg actatccaaa atattccgaa 2400
gaatcaaagt taaacaggga gaaaattgat ggagtgaaat tggaatcaat gggagtatac 2460
cagattctgg cgatctactc aactgtcgcc agttccctgg ttcttttggt ctccctgggg 2520
gcaatcagct tctggatgtg ttccaatggg tctttgcagt gtagaatatg catctaaagg 2580
cctattttct ttagtttgaa tttactgtta ttcggtgtgc atttctatgt ttggtgagcg 2640
gttttctgtg ctcagagtgt gtttatttta tgtaatttaa tttctttgtg agctcctgtt 2700
tagcaggtcg tcccttcagc aaggacacaa aaagatttta attttattaa aaaaaaaaaa 2760
aaaaaagacc gggaattcga tatcaagctt atcgacctgc agatcgttca aacatttggc 2820
aataaagttt cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc 2880
tgttgaatta cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat 2940
gggtttttat gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat 3000
agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gattctagag 3060
tctcaagctt cggcgcgcc 3079
<210> 98
<211> 39
<212> DNA
<213> Artificial sequence
<220>
<223> ApaI-H5 (A-Indo).1c
<400> 98
tgtcgggccc atggagaaaa tagtgcttct tcttgcaat 39
<210> 99
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> H5 (A-Indo)-StuI.1707r
<400> 99
aaataggcct ttaaatgcaa attctgcatt gtaacga 37
<210> 100
<211> 3067
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number 685, from PacI
<400> 100
ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60
gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120
ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180
cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240
attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300
acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360
tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420
tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480
tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540
tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600
cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660
tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720
tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780
acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840
cccaaatttg tcgggcccat ggagaaaata gtgcttcttc ttgcaatagt cagtcttgtt 900
aaaagtgatc agatttgcat tggttaccat gcaaacaatt caacagagca ggttgacaca 960
atcatggaaa agaacgttac tgttacacat gcccaagaca tactggaaaa gacacacaac 1020
gggaagctct gcgatctaga tggagtgaag cctctaattt taagagattg tagtgtagct 1080
ggatggctcc tcgggaaccc aatgtgtgac gaattcatca atgtaccgga atggtcttac 1140
atagtggaga aggccaatcc aaccaatgac ctctgttacc cagggagttt caacgactat 1200
gaagaactga aacacctatt gagcagaata aaccattttg agaaaattca aatcatcccc 1260
aaaagttctt ggtccgatca tgaagcctca tcaggagtta gctcagcatg tccatacctg 1320
ggaagtccct ccttttttag aaatgtggta tggcttatca aaaagaacag tacataccca 1380
acaataaaga aaagctacaa taataccaac caagaggatc ttttggtact gtggggaatt 1440
caccatccta atgatgcggc agagcagaca aggctatatc aaaacccaac cacctatatt 1500
tccattggga catcaacact aaaccagaga ttggtaccaa aaatagctac tagatccaaa 1560
gtaaacgggc aaagtggaag gatggagttc ttctggacaa ttttaaaacc taatgatgca 1620
atcaacttcg agagtaatgg aaatttcatt gctccagaat atgcatacaa aattgtcaag 1680
aaaggggact cagcaattat gaaaagtgaa ttggaatatg gtaactgcaa caccaagtgt 1740
caaactccaa tgggggcgat aaactctagt atgccattcc acaacataca ccctctcacc 1800
atcggggaat gccccaaata tgtgaaatca aacagattag tccttgcaac agggctcaga 1860
aatagccctc aaagagagag cagaagaaaa aagagaggac tatttggagc tatagcaggt 1920
tttatagagg gaggatggca gggaatggta gatggttggt atgggtacca ccatagcaat 1980
gagcagggga gtgggtacgc tgcagacaaa gaatccactc aaaaggcaat agatggagtc 2040
accaataagg tcaactcaat cattgacaaa atgaacactc agtttgaggc cgttggaagg 2100
gaatttaata acttagaaag gagaatagag aatttaaaca agaagatgga agacgggttt 2160
ctagatgtct ggacttataa tgccgaactt ctggttctca tggaaaatga gagaactcta 2220
gactttcatg actcaaatgt taagaacctc tacgacaagg tccgactaca gcttagggat 2280
aatgcaaagg agctgggtaa cggttgtttc gagttctatc acaaatgtga taatgaatgt 2340
atggaaagta taagaaacgg aacgtacaac tatccgcagt attcagaaga agcaagatta 2400
aaaagagagg aaataagtgg ggtaaaattg gaatcaatag gaacttacca aatactgtca 2460
atttattcaa cagtggcgag ttccctagca ctggcaatca tgatggctgg tctatcttta 2520
tggatgtgct ccaatggatc gttacaatgc agaatttgca tttaaaggcc tattttcttt 2580
agtttgaatt tactgttatt cggtgtgcat ttctatgttt ggtgagcggt tttctgtgct 2640
cagagtgtgt ttattttatg taatttaatt tctttgtgag ctcctgttta gcaggtcgtc 2700
ccttcagcaa ggacacaaaa agattttaat tttattaaaa aaaaaaaaaa aaaagaccgg 2760
gaattcgata tcaagcttat cgacctgcag atcgttcaaa catttggcaa taaagtttct 2820
taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 2880
ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 2940
ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 3000
aggataaatt atcgcgcgcg gtgtcatcta tgttactaga ttctagagtc tcaagcttcg 3060
gcgcgcc 3067
<210> 101
<211> 3091
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number 686, from PacI
<400> 101
ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60
gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120
ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180
cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240
attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300
acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360
tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420
tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480
tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540
tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600
cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660
tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720
tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780
acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840
cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900
cttgtgttgg ttccttctca gatcttcgct gatcagattt gcattggtta ccatgcaaac 960
aattcaacag agcaggttga cacaatcatg gaaaagaacg ttactgttac acatgcccaa 1020
gacatactgg aaaagacaca caacgggaag ctctgcgatc tagatggagt gaagcctcta 1080
attttaagag attgtagtgt agctggatgg ctcctcggga acccaatgtg tgacgaattc 1140
atcaatgtac cggaatggtc ttacatagtg gagaaggcca atccaaccaa tgacctctgt 1200
tacccaggga gtttcaacga ctatgaagaa ctgaaacacc tattgagcag aataaaccat 1260
tttgagaaaa ttcaaatcat ccccaaaagt tcttggtccg atcatgaagc ctcatcagga 1320
gttagctcag catgtccata cctgggaagt ccctcctttt ttagaaatgt ggtatggctt 1380
atcaaaaaga acagtacata cccaacaata aagaaaagct acaataatac caaccaagag 1440
gatcttttgg tactgtgggg aattcaccat cctaatgatg cggcagagca gacaaggcta 1500
tatcaaaacc caaccaccta tatttccatt gggacatcaa cactaaacca gagattggta 1560
ccaaaaatag ctactagatc caaagtaaac gggcaaagtg gaaggatgga gttcttctgg 1620
acaattttaa aacctaatga tgcaatcaac ttcgagagta atggaaattt cattgctcca 1680
gaatatgcat acaaaattgt caagaaaggg gactcagcaa ttatgaaaag tgaattggaa 1740
tatggtaact gcaacaccaa gtgtcaaact ccaatggggg cgataaactc tagtatgcca 1800
ttccacaaca tacaccctct caccatcggg gaatgcccca aatatgtgaa atcaaacaga 1860
ttagtccttg caacagggct cagaaatagc cctcaaagag agagcagaag aaaaaagaga 1920
ggactatttg gagctatagc aggttttata gagggaggat ggcagggaat ggtagatggt 1980
tggtatgggt accaccatag caatgagcag gggagtgggt acgctgcaga caaagaatcc 2040
actcaaaagg caatagatgg agtcaccaat aaggtcaact caatcattga caaaatgaac 2100
actcagtttg aggccgttgg aagggaattt aataacttag aaaggagaat agagaattta 2160
aacaagaaga tggaagacgg gtttctagat gtctggactt ataatgccga acttctggtt 2220
ctcatggaaa atgagagaac tctagacttt catgactcaa atgttaagaa cctctacgac 2280
aaggtccgac tacagcttag ggataatgca aaggagctgg gtaacggttg tttcgagttc 2340
tatcacaaat gtgataatga atgtatggaa agtataagaa acggaacgta caactatccg 2400
cagtattcag aagaagcaag attaaaaaga gaggaaataa gtggggtaaa attggaatca 2460
ataggaactt accaaatact gtcaatttat tcaacagtgg cgagttccct agcactggca 2520
atcatgatgg ctggtctatc tttatggatg tgctccaatg gatcgttaca atgcagaatt 2580
tgcatttaaa ggcctatttt ctttagtttg aatttactgt tattcggtgt gcatttctat 2640
gtttggtgag cggttttctg tgctcagagt gtgtttattt tatgtaattt aatttctttg 2700
tgagctcctg tttagcaggt cgtcccttca gcaaggacac aaaaagattt taattttatt 2760
aaaaaaaaaa aaaaaaaaga ccgggaattc gatatcaagc ttatcgacct gcagatcgtt 2820
caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta 2880
tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt 2940
tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag 3000
aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatgttac 3060
tagattctag agtctcaagc ttcggcgcgc c 3091
<210> 102
<211> 45
<212> DNA
<213> Artificial sequence
<220>
<223> ApaI-H1B.c
<400> 102
tgtcgggccc atgaaagtaa aactactggt cctgttatgc acatt 45
<210> 103
<211> 46
<212> DNA
<213> Artificial sequence
<220>
<223> StuI-H2B.r
<400> 103
aaataggcct ttagatgcat attctacact gtaaagaccc attgga 46
<210> 104
<211> 3058
<212> DNA
<213> Artificial sequence
<220>
<223> Construct 732, from PacI
<400> 104
ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60
gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120
ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180
cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240
attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300
acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360
tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420
tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480
tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540
tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600
cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660
tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720
tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780
acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840
cccaaatttg tcgggcccat gaaagtaaaa ctactggtcc tgttatgcac atttacagct 900
acatatgcag acacaatatg tataggctac catgctaaca actcgaccga cactgttgac 960
acagtacttg aaaagaatgt gacagtgaca cactctgtca acctgcttga gaacagtcac 1020
aatggaaaac tatgtctatt aaaaggaata gccccactac aattgggtaa ttgcagcgtt 1080
gccgggtgga tcttaggaaa cccagaatgc gaattactga tttccaagga gtcatggtcc 1140
tacattgtag aaaaaccaaa tcctgagaat ggaacatgtt acccagggca tttcgctgac 1200
tatgaggaac tgagggagca attgagttca gtatcttcat ttgagaggtt cgaaatattc 1260
cccaaagaaa gctcatggcc caaccacacc gtaaccggag tgtcagcatc atgctcccat 1320
aatggggaaa gcagttttta cagaaatttg ctatggctga cggggaagaa tggtttgtac 1380
ccaaacctga gcaagtccta tgcaaacaac aaagaaaaag aagtccttgt actatggggt 1440
gttcatcacc cgccaaacat aggtgaccaa aaggccctct atcatacaga aaatgcttat 1500
gtctctgtag tgtcttcaca ttatagcaga aaattcaccc cagaaatagc caaaagaccc 1560
aaagtaagag atcaagaagg aagaatcaat tactactgga ctctgcttga acccggggat 1620
acaataatat ttgaggcaaa tggaaatcta atagcgccaa gatatgcttt cgcactgagt 1680
agaggctttg gatcaggaat catcaactca aatgcaccaa tggataaatg tgatgcgaag 1740
tgccaaacac ctcagggagc tataaacagc agtcttcctt tccagaacgt acacccagtc 1800
acaataggag agtgtccaaa gtatgtcagg agtgcaaaat taaggatggt tacaggacta 1860
aggaacatcc catccattca atccagaggt ttgtttggag ccattgccgg tttcattgaa 1920
ggggggtgga ctggaatggt agatggttgg tatggttatc atcatcagaa tgagcaagga 1980
tctggctatg ctgcagatca aaaaagcaca caaaatgcca ttaatgggat tacaaacaag 2040
gtcaattctg taattgagaa aatgaacact caattcacag cagtgggcaa agagttcaac 2100
aaattggaaa gaaggatgga aaacttgaat aaaaaagttg atgatgggtt tatagacatt 2160
tggacatata atgcagaact gttggttcta ctggaaaatg aaaggacttt ggatttccat 2220
gactccaatg tgaagaatct gtatgagaaa gtaaaaagcc agttaaagaa taatgctaaa 2280
gaaataggaa atgggtgttt tgagttctat cacaagtgta acgatgaatg catggagagt 2340
gtaaagaatg gaacttatga ctatccaaaa tattccgaag aatcaaagtt aaacagggag 2400
aaaattgatg gagtgaaatt ggaatcaatg ggagtctatc agattctggc gatctactca 2460
acagtcgcca gttctctggt tcttttggtc tccctggggg caatcagctt ctggatgtgt 2520
tccaatgggt ctttacagtg tagaatatgc atctaaaggc ctattttctt tagtttgaat 2580
ttactgttat tcggtgtgca tttctatgtt tggtgagcgg ttttctgtgc tcagagtgtg 2640
tttattttat gtaatttaat ttctttgtga gctcctgttt agcaggtcgt cccttcagca 2700
aggacacaaa aagattttaa ttttattaaa aaaaaaaaaa aaaaagaccg ggaattcgat 2760
atcaagctta tcgacctgca gatcgttcaa acatttggca ataaagtttc ttaagattga 2820
atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg 2880
taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc 2940
cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat 3000
tatcgcgcgc ggtgtcatct atgttactag attctagagt ctcaagcttc ggcgcgcc 3058
<210> 105
<211> 3079
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number 733, from PacI
<400> 105
ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60
gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120
ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180
cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240
attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300
acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360
tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420
tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480
tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540
tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600
cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660
tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720
tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780
acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840
cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900
cttgtgttgg ttccttctca gatcttcgct gacacaatat gtataggcta ccatgctaac 960
aactcgaccg acactgttga cacagtactt gaaaagaatg tgacagtgac acactctgtc 1020
aacctgcttg agaacagtca caatggaaaa ctatgtctat taaaaggaat agccccacta 1080
caattgggta attgcagcgt tgccgggtgg atcttaggaa acccagaatg cgaattactg 1140
atttccaagg agtcatggtc ctacattgta gaaaaaccaa atcctgagaa tggaacatgt 1200
tacccagggc atttcgctga ctatgaggaa ctgagggagc aattgagttc agtatcttca 1260
tttgagaggt tcgaaatatt ccccaaagaa agctcatggc ccaaccacac cgtaaccgga 1320
gtgtcagcat catgctccca taatggggaa agcagttttt acagaaattt gctatggctg 1380
acggggaaga atggtttgta cccaaacctg agcaagtcct atgcaaacaa caaagaaaaa 1440
gaagtccttg tactatgggg tgttcatcac ccgccaaaca taggtgacca aaaggccctc 1500
tatcatacag aaaatgctta tgtctctgta gtgtcttcac attatagcag aaaattcacc 1560
ccagaaatag ccaaaagacc caaagtaaga gatcaagaag gaagaatcaa ttactactgg 1620
actctgcttg aacccgggga tacaataata tttgaggcaa atggaaatct aatagcgcca 1680
agatatgctt tcgcactgag tagaggcttt ggatcaggaa tcatcaactc aaatgcacca 1740
atggataaat gtgatgcgaa gtgccaaaca cctcagggag ctataaacag cagtcttcct 1800
ttccagaacg tacacccagt cacaatagga gagtgtccaa agtatgtcag gagtgcaaaa 1860
ttaaggatgg ttacaggact aaggaacatc ccatccattc aatccagagg tttgtttgga 1920
gccattgccg gtttcattga aggggggtgg actggaatgg tagatggttg gtatggttat 1980
catcatcaga atgagcaagg atctggctat gctgcagatc aaaaaagcac acaaaatgcc 2040
attaatggga ttacaaacaa ggtcaattct gtaattgaga aaatgaacac tcaattcaca 2100
gcagtgggca aagagttcaa caaattggaa agaaggatgg aaaacttgaa taaaaaagtt 2160
gatgatgggt ttatagacat ttggacatat aatgcagaac tgttggttct actggaaaat 2220
gaaaggactt tggatttcca tgactccaat gtgaagaatc tgtatgagaa agtaaaaagc 2280
cagttaaaga ataatgctaa agaaatagga aatgggtgtt ttgagttcta tcacaagtgt 2340
aacgatgaat gcatggagag tgtaaagaat ggaacttatg actatccaaa atattccgaa 2400
gaatcaaagt taaacaggga gaaaattgat ggagtgaaat tggaatcaat gggagtctat 2460
cagattctgg cgatctactc aacagtcgcc agttctctgg ttcttttggt ctccctgggg 2520
gcaatcagct tctggatgtg ttccaatggg tctttacagt gtagaatatg catctaaagg 2580
cctattttct ttagtttgaa tttactgtta ttcggtgtgc atttctatgt ttggtgagcg 2640
gttttctgtg ctcagagtgt gtttatttta tgtaatttaa tttctttgtg agctcctgtt 2700
tagcaggtcg tcccttcagc aaggacacaa aaagatttta attttattaa aaaaaaaaaa 2760
aaaaaagacc gggaattcga tatcaagctt atcgacctgc agatcgttca aacatttggc 2820
aataaagttt cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc 2880
tgttgaatta cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat 2940
gggtttttat gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat 3000
agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gattctagag 3060
tctcaagctt cggcgcgcc 3079
<210> 106
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> ApaI-H3B.c
<400> 106
ttgtcgggcc catgaagact atcattgctt tgagctacat tctatgtc 48
<210> 107
<211> 44
<212> DNA
<213> Artificial sequence
<220>
<223> StuI-H3B.r
<400> 107
aaaataggcc ttcaaatgca aatgttgcac ctaatgttgc cttt 44
<210> 108
<211> 3061
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number 735, from PacI
<400> 108
ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60
gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120
ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180
cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240
attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300
acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360
tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420
tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480
tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540
tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600
cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660
tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720
tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780
acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840
cccaaatttg tcgggcccat gaagactatc attgctttga gctacattct atgtctggtt 900
ttcactcaaa aacttcccgg aaatgacaac agcacggcaa cgctgtgcct tgggcaccat 960
gcagtaccaa acggaacgat agtgaaaaca atcacgaatg accaaattga agttactaat 1020
gctactgagc tggttcagag ttcctcaaca ggtgaaatat gcgacagtcc tcatcagatc 1080
cttgatggag aaaactgcac actaatagat gctctattgg gagaccctca gtgtgatggc 1140
ttccaaaata agaaatggga cctttttgtt gaacgcagca aagcctacag caactgttac 1200
ccttatgatg tgccggatta tgcctccctt aggtcactag ttgcctcatc cggcacactg 1260
gagtttaaca atgaaagttt caattggact ggagtcactc aaaacggaac aagctctgct 1320
tgcataagga gatctaataa cagtttcttt agtagattga attggttgac ccacttaaaa 1380
ttcaaatacc cagcattgaa cgtgactatg ccaaacaatg aaaaatttga caaattgtac 1440
atttgggggg ttcaccaccc gggtacggac aatgaccaaa tcttcctgta tgctcaagca 1500
tcaggaagaa tcacagtctc taccaaaaga agccaacaaa ctgtaatccc gaatatcgga 1560
tctagaccca gagtaaggaa tatccccagc agaataagca tctattggac aatagtaaaa 1620
ccgggagaca tacttttgat taacagcaca gggaatctaa ttgctcctag gggttacttc 1680
aaaatacgaa gtgggaaaag ctcaataatg agatcagatg cacccattgg caaatgcaat 1740
tctgaatgca tcactccaaa cggaagcatt cccaatgaca aaccattcca aaatgtaaac 1800
aggatcacat acggggcctg tcccagatat gttaagcaaa acactctgaa attggcaaca 1860
gggatgcgaa atgtaccaga gaaacaaact agaggcatat ttggcgcaat cgcgggtttc 1920
atagaaaatg gttgggaggg aatggtggat ggttggtatg gtttcaggca tcaaaattct 1980
gagggaatag gacaagcagc agatctcaaa agcactcaag cagcaatcga tcaaatcaat 2040
gggaagctga ataggttgat cgggaaaacc aacgagaaat tccatcagat tgaaaaagag 2100
ttctcagaag tcgaagggag aatccaggac cttgagaaat atgttgagga caccaaaata 2160
gatctctggt catacaacgc ggagcttctt gttgccctgg agaaccaaca tacaattgat 2220
ctaactgact cagaaatgaa caaactgttt gaaaaaacaa agaagcaact gagggaaaat 2280
gctgaggata tgggcaatgg ttgtttcaaa atataccaca aatgtgacaa tgcctgcata 2340
ggatcaatca gaaatggaac ttatgaccac gatgtataca gagatgaagc attaaacaac 2400
cggttccaga tcaagggcgt tgagctgaag tcaggataca aagattggat actatggatt 2460
tcctttgcca tatcatgttt tttgctttgt gttgctttgt tggggttcat catgtgggcc 2520
tgccaaaaag gcaacattag gtgcaacatt tgcatttgaa ggcctatttt ctttagtttg 2580
aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg tgctcagagt 2640
gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt cgtcccttca 2700
gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga ccgggaattc 2760
gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt ttcttaagat 2820
tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc 2880
atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag 2940
tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata 3000
aattatcgcg cgcggtgtca tctatgttac tagattctag agtctcaagc ttcggcgcgc 3060
c 3061
<210> 109
<211> 3085
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number 736, from PacI
<400> 109
ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60
gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120
ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180
cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240
attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300
acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360
tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420
tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480
tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540
tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600
cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660
tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720
tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780
acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840
cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900
cttgtgttgg ttccttctca gatcttcgct caaaaacttc ccggaaatga caacagcacg 960
gcaacgctgt gccttgggca ccatgcagta ccaaacggaa cgatagtgaa aacaatcacg 1020
aatgaccaaa ttgaagttac taatgctact gagctggttc agagttcctc aacaggtgaa 1080
atatgcgaca gtcctcatca gatccttgat ggagaaaact gcacactaat agatgctcta 1140
ttgggagacc ctcagtgtga tggcttccaa aataagaaat gggacctttt tgttgaacgc 1200
agcaaagcct acagcaactg ttacccttat gatgtgccgg attatgcctc ccttaggtca 1260
ctagttgcct catccggcac actggagttt aacaatgaaa gtttcaattg gactggagtc 1320
actcaaaacg gaacaagctc tgcttgcata aggagatcta ataacagttt ctttagtaga 1380
ttgaattggt tgacccactt aaaattcaaa tacccagcat tgaacgtgac tatgccaaac 1440
aatgaaaaat ttgacaaatt gtacatttgg ggggttcacc acccgggtac ggacaatgac 1500
caaatcttcc tgtatgctca agcatcagga agaatcacag tctctaccaa aagaagccaa 1560
caaactgtaa tcccgaatat cggatctaga cccagagtaa ggaatatccc cagcagaata 1620
agcatctatt ggacaatagt aaaaccggga gacatacttt tgattaacag cacagggaat 1680
ctaattgctc ctaggggtta cttcaaaata cgaagtggga aaagctcaat aatgagatca 1740
gatgcaccca ttggcaaatg caattctgaa tgcatcactc caaacggaag cattcccaat 1800
gacaaaccat tccaaaatgt aaacaggatc acatacgggg cctgtcccag atatgttaag 1860
caaaacactc tgaaattggc aacagggatg cgaaatgtac cagagaaaca aactagaggc 1920
atatttggcg caatcgcggg tttcatagaa aatggttggg agggaatggt ggatggttgg 1980
tatggtttca ggcatcaaaa ttctgaggga ataggacaag cagcagatct caaaagcact 2040
caagcagcaa tcgatcaaat caatgggaag ctgaataggt tgatcgggaa aaccaacgag 2100
aaattccatc agattgaaaa agagttctca gaagtcgaag ggagaatcca ggaccttgag 2160
aaatatgttg aggacaccaa aatagatctc tggtcataca acgcggagct tcttgttgcc 2220
ctggagaacc aacatacaat tgatctaact gactcagaaa tgaacaaact gtttgaaaaa 2280
acaaagaagc aactgaggga aaatgctgag gatatgggca atggttgttt caaaatatac 2340
cacaaatgtg acaatgcctg cataggatca atcagaaatg gaacttatga ccacgatgta 2400
tacagagatg aagcattaaa caaccggttc cagatcaagg gcgttgagct gaagtcagga 2460
tacaaagatt ggatactatg gatttccttt gccatatcat gttttttgct ttgtgttgct 2520
ttgttggggt tcatcatgtg ggcctgccaa aaaggcaaca ttaggtgcaa catttgcatt 2580
tgaaggccta ttttctttag tttgaattta ctgttattcg gtgtgcattt ctatgtttgg 2640
tgagcggttt tctgtgctca gagtgtgttt attttatgta atttaatttc tttgtgagct 2700
cctgtttagc aggtcgtccc ttcagcaagg acacaaaaag attttaattt tattaaaaaa 2760
aaaaaaaaaa aagaccggga attcgatatc aagcttatcg acctgcagat cgttcaaaca 2820
tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg attatcatat 2880
aatttctgtt gaattacgtt aagcatgtaa taattaacat gtaatgcatg acgttattta 2940
tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg atagaaaaca 3000
aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg ttactagatt 3060
ctagagtctc aagcttcggc gcgcc 3085
<210> 110
<211> 46
<212> DNA
<213> Artificial sequence
<220>
<223> ApI-HBF.c
<400> 110
ttgtcgggcc catgaaggca ataattgtac tactcatggt agtaac 46
<210> 111
<211> 46
<212> DNA
<213> Artificial sequence
<220>
<223> StuI-HBF.r
<400> 111
aaaataggcc tttatagaca gatggagcat gaaacgttgt ctctgg 46
<210> 112
<211> 3115
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number 738, from PacI
<400> 112
ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60
gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120
ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180
cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240
attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300
acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360
tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420
tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480
tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540
tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600
cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660
tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720
tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780
acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840
cccaaatttg tcgggcccat gaaggcaata attgtactac tcatggtagt aacatccaat 900
gcagatcgaa tctgcactgg aataacatct tcaaactcac ctcatgtggt caaaacagcc 960
actcaagggg aggtcaatgt gactggtgtg ataccactaa caacaacacc aacaaaatct 1020
tattttgcaa atctcaaagg aacaaggacc agagggaaac tatgcccaga ctgtctcaac 1080
tgcacagatc tggatgtggc tttgggcaga ccaatgtgtg tggggaccac accttcggcg 1140
aaggcttcaa tactccacga agtcaaacct gttacatccg ggtgctttcc tataatgcac 1200
gacagaacaa aaatcaggca actacccaat cttctcagag gatatgaaaa tatcaggcta 1260
tcaacccaaa acgtcatcga tgcggaaaag gcaccaggag gaccctacag acttggaacc 1320
tcaggatctt gccctaacgc taccagtaag agcggatttt tcgcaacaat ggcttgggct 1380
gtcccaaagg acaacaacaa aaatgcaacg aacccactaa cagtagaagt accatacatt 1440
tgtacagaag gggaagacca aatcactgtt tgggggttcc attcagataa caaaacccaa 1500
atgaagaacc tctatggaga ctcaaatcct caaaagttca cctcatctgc taatggagta 1560
accacacact atgtttctca gattggcagc ttcccagatc aaacagaaga cggaggacta 1620
ccacaaagcg gcaggattgt tgttgattac atgatgcaaa aacctgggaa aacaggaaca 1680
attgtctacc aaagaggtgt tttgttgcct caaaaggtgt ggtgcgcgag tggcaggagc 1740
aaagtaataa aagggtcctt gcctttaatt ggtgaagcag attgccttca tgaaaaatac 1800
ggtggattaa acaaaagcaa gccttactac acaggagaac atgcaaaagc cataggaaat 1860
tgcccaatat gggtgaaaac acctttgaag ctcgccaatg gaaccaaata tagacctcct 1920
gcaaaactat taaaggaaag gggtttcttc ggagctattg ctggtttcct agaaggagga 1980
tgggaaggaa tgattgcagg ctggcacgga tacacatctc acggagcaca tggagtggca 2040
gtggcggcgg accttaagag tacgcaagaa gctataaaca agataacaaa aaatctcaat 2100
tctttgagtg agctagaagt aaagaatctt caaagactaa gtggtgccat ggatgaactc 2160
cacaacgaaa tactcgagct ggatgagaaa gtggatgatc tcagagctga cactataagc 2220
tcgcaaatag aacttgcagt cttgctttcc aacgaaggaa taataaacag tgaagatgag 2280
catctattgg cacttgagag aaaactaaag aaaatgctgg gtccctctgc tgtagagata 2340
ggaaatggat gcttcgaaac caaacacaag tgcaaccaga cctgcttaga caggatagct 2400
gctggcacct ttaatgcagg agaattttct ctccccactt ttgattcact gaacattact 2460
gctgcatctt taaatgatga tggattggat aaccatacta tactgctcta ttactcaact 2520
gctgcttcta gtttggctgt aacattgatg ctagctattt ttattgttta tatggtctcc 2580
agagacaacg tttcatgctc catctgtcta taaaggccta ttttctttag tttgaattta 2640
ctgttattcg gtgtgcattt ctatgtttgg tgagcggttt tctgtgctca gagtgtgttt 2700
attttatgta atttaatttc tttgtgagct cctgtttagc aggtcgtccc ttcagcaagg 2760
acacaaaaag attttaattt tattaaaaaa aaaaaaaaaa aagaccggga attcgatatc 2820
aagcttatcg acctgcagat cgttcaaaca tttggcaata aagtttctta agattgaatc 2880
ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 2940
taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 3000
aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 3060
cgcgcgcggt gtcatctatg ttactagatt ctagagtctc aagcttcggc gcgcc 3115
<210> 113
<211> 3142
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number 739, from PacI
<400> 113
ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60
gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120
ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180
cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240
attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300
acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360
tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420
tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480
tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540
tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600
cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660
tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720
tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780
acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840
cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900
cttgtgttgg ttccttctca gatcttcgct gatcgaatct gcactggaat aacatcttca 960
aactcacctc atgtggtcaa aacagccact caaggggagg tcaatgtgac tggtgtgata 1020
ccactaacaa caacaccaac aaaatcttat tttgcaaatc tcaaaggaac aaggaccaga 1080
gggaaactat gcccagactg tctcaactgc acagatctgg atgtggcttt gggcagacca 1140
atgtgtgtgg ggaccacacc ttcggcgaag gcttcaatac tccacgaagt caaacctgtt 1200
acatccgggt gctttcctat aatgcacgac agaacaaaaa tcaggcaact acccaatctt 1260
ctcagaggat atgaaaatat caggctatca acccaaaacg tcatcgatgc ggaaaaggca 1320
ccaggaggac cctacagact tggaacctca ggatcttgcc ctaacgctac cagtaagagc 1380
ggatttttcg caacaatggc ttgggctgtc ccaaaggaca acaacaaaaa tgcaacgaac 1440
ccactaacag tagaagtacc atacatttgt acagaagggg aagaccaaat cactgtttgg 1500
gggttccatt cagataacaa aacccaaatg aagaacctct atggagactc aaatcctcaa 1560
aagttcacct catctgctaa tggagtaacc acacactatg tttctcagat tggcagcttc 1620
ccagatcaaa cagaagacgg aggactacca caaagcggca ggattgttgt tgattacatg 1680
atgcaaaaac ctgggaaaac aggaacaatt gtctaccaaa gaggtgtttt gttgcctcaa 1740
aaggtgtggt gcgcgagtgg caggagcaaa gtaataaaag ggtccttgcc tttaattggt 1800
gaagcagatt gccttcatga aaaatacggt ggattaaaca aaagcaagcc ttactacaca 1860
ggagaacatg caaaagccat aggaaattgc ccaatatggg tgaaaacacc tttgaagctc 1920
gccaatggaa ccaaatatag acctcctgca aaactattaa aggaaagggg tttcttcgga 1980
gctattgctg gtttcctaga aggaggatgg gaaggaatga ttgcaggctg gcacggatac 2040
acatctcacg gagcacatgg agtggcagtg gcggcggacc ttaagagtac gcaagaagct 2100
ataaacaaga taacaaaaaa tctcaattct ttgagtgagc tagaagtaaa gaatcttcaa 2160
agactaagtg gtgccatgga tgaactccac aacgaaatac tcgagctgga tgagaaagtg 2220
gatgatctca gagctgacac tataagctcg caaatagaac ttgcagtctt gctttccaac 2280
gaaggaataa taaacagtga agatgagcat ctattggcac ttgagagaaa actaaagaaa 2340
atgctgggtc cctctgctgt agagatagga aatggatgct tcgaaaccaa acacaagtgc 2400
aaccagacct gcttagacag gatagctgct ggcaccttta atgcaggaga attttctctc 2460
cccacttttg attcactgaa cattactgct gcatctttaa atgatgatgg attggataac 2520
catactatac tgctctatta ctcaactgct gcttctagtt tggctgtaac attgatgcta 2580
gctattttta ttgtttatat ggtctccaga gacaacgttt catgctccat ctgtctataa 2640
aggcctattt tctttagttt gaatttactg ttattcggtg tgcatttcta tgtttggtga 2700
gcggttttct gtgctcagag tgtgtttatt ttatgtaatt taatttcttt gtgagctcct 2760
gtttagcagg tcgtcccttc agcaaggaca caaaaagatt ttaattttat taaaaaaaaa 2820
aaaaaaaaag accgggaatt cgatatcaag cttatcgacc tgcagatcgt tcaaacattt 2880
ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt atcatataat 2940
ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg ttatttatga 3000
gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata gaaaacaaaa 3060
tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta ctagattcta 3120
gagtctcaag cttcggcgcg cc 3142
<210> 114
<211> 1272
<212> DNA
<213> Medicago sativa
<400> 114
atgtttgggc gcggaccaac aaggaagagt gataacacca aatattacga tattcttggt 60
gtttcaaaaa gtgctagtga agatgaaatc aagaaagcct atagaaaggc agcgatgaag 120
aaccatccag ataagggtgg ggatcctgag aagttcaagg agttgggcca agcatatgaa 180
gtgttgagcg atcctgaaaa gaaagaactg tatgatcaat atggtgaaga tgcccttaaa 240
gaaggaatgg ggggaggcgc aggaagctca tttcataatc cgtttgatat tttcgaatca 300
ttttttggtg caggctttgg tggtggtggt ccttcacgcg caagaagaca gaagcaagga 360
gaagatgtgg tgcattctat aaaggtttcc ttggaggatg tgtataacgg cactacaaag 420
aagctatcac tttctaggaa tgcactgtgc tcaaaatgta aagggaaagg ttcaaaaagt 480
ggaactgctg gaaggtgttt tggatgccag ggcacaggta tgaagattac cagaaggcaa 540
attggactgg gcatgattca acaaatgcaa cacgtctgtc ctgactgcaa aggaacaggc 600
gaggtcatta gtgagagaga tagatgccct caatgcaagg gaaacaagat tactcaagaa 660
aagaaggtgc tggaggtgca tgtggaaaag gggatgcagc agggtcacaa gattgtattc 720
gaaggacaag ctgatgaagc tcctgataca atcacaggag acatagtttt tgtcttgcaa 780
gtaaagggac atccgaagtt tcggagggag cgtgatgacc tccacattga acacaatttg 840
agcttaactg aggctctctg tggcttccag tttaatgtca cacatcttga tggaaggcaa 900
ctattggtca aatcgaaccc cggcgaagtc atcaagccag gtcaacataa agctataaat 960
gatgagggaa tgccacaaca tggtaggccg ttcatgaagg gacgcctata catcaagttt 1020
agtgttgatt tcccggattc gggttttctt tccccaagcc aaagcctgga attagaaaag 1080
atattacctc aaaagacaag caagaacttg tcccaaaagg aggtagatga ttgtgaggag 1140
accaccctgc atgatgtcaa tattgcagag gagatgagtc gaaagaagca acaataccgt 1200
gaggcatatg atgacgatga tgatgaagat gatgagcact cgcagcctcg ggtgcaatgc 1260
gctcaacagt ag 1272
<210> 115
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> Hsp-40Luz.1c
<400> 115
atgtttgggc gcggaccaac 20
<210> 116
<211> 31
<212> DNA
<213> Artificial sequence
<220>
<223> Hsp40Luz-SacI.1272r
<400> 116
agctgagctc ctactgttga gcgcattgca c 31
<210> 117
<211> 36
<212> DNA
<213> Artificial sequence
<220>
<223> Hsp40Luz-Plasto.r
<400> 117
gttggtccgc gcccaaacat tttctctcaa gatgat 36
<210> 118
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Hsp70Ara.1c
<400> 118
atgtcgggta aaggagaagg a 21
<210> 119
<211> 33
<212> DNA
<213> Artificial sequence
<220>
<223> Hsp70Ara-SacI.1956r
<400> 119
agctgagctc ttagtcgacc tcctcgatct tag 33
<210> 120
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> Hsp70Ara-Plasto.r
<400> 120
tccttctcct ttacccgaca ttttctctca agatgat 37
<210> 121
<211> 4402
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number R850, from HindIII
<400> 121
aagcttgcat gcctgcaggt cgactctaga ggatccccgg gctggtctgt acattcatct 60
tgccgccttt gcattcactt ggccacaaag agtagagaga aggaagagaa gagcccagac 120
ttcaagaagc gaccttgcaa gtgcactcga gggtcagaaa ctgtatatca tatctatgtg 180
agagaaaggg gaacatttga gatggagtcc atttacttga ggtatactta ttattttgat 240
caataaattt gtatacttct tatttagatc aataaatttg tcattaagct ataatccaaa 300
ataaattacg atcaaatatg caaatgttag ccagtacttg tgttaaactt gatggcatct 360
cttggtttct ttggcaatca catgcctaag aaataaatag tatcatatga ttgtgtttgg 420
tcagacttca gagtcagatg actctgtttg gataaacagc ttaattaagc gcttatagaa 480
tatcatatga ttgtgtttgg tcagacttca gagcatctct tggtttctct ggcaatcata 540
tgcctaagaa ataaatagta tcatatgatt gtgtttggtc agacttcaga gtcagatgac 600
cctgtttggg taaacagctt aattaagtgc ttatagaata agcgcttatc atataagtgc 660
ttttgtacag ttatttctat gaaagtagaa gaaatagtca tattgtttta atataagcta 720
tcctggagag cttgtggaaa taaccagaaa agaacttatg gacacgtcat gagctgttta 780
cataagatct ccctaacagt ctcaaaagtg tttatgccag tagataaatt caaataagtc 840
aatctaaaca gaccctaaat ccattatggt acctatcatt ttagcttatt ccatctttat 900
taagaatgtc atgagataac ataatgataa cacattattt tgacacaaat gggcagatct 960
agcaatttaa ctctggagtc cttcaagact gctgttctta cgaagttcac gtccctgaat 1020
catgttcctg tatggaagcc tgaaagacct caaattctaa aaggtggcga taaattgaag 1080
gtttacaaaa tataccctgc gggcttgaca cagaggcaag ctctttatac cttccagttc 1140
aacggggatg ttgatttcag aagtcacttg gagagcaatc cttgtgccaa gtttgaagta 1200
atttttgtgt agcatatgtt gagctaccta caatttacat gatcacctag cattagctct 1260
ttcacttaac tgagagaatg aagttttagg aatgagtatg accatggagt cggcatggct 1320
ttgtaatgcc taccctactt tggccaactc atcggggatt tacattcaga aaatatacat 1380
gacttcaacc atacttaaac ccctttttgt aagataactg aatgttcata tttaatgttg 1440
ggttgtagtg tttttacttg attatatcca gacagttaca agttggacaa caagattgtg 1500
ggtctgtact gttatttatt tatttttttt ttagcagaaa caccttatct tttgtttcgt 1560
ttgaatgtag aatgaaaata aaagaaagaa aatataacat catcggccgc gcttgtctaa 1620
tttcgggcag ttaggatcct ctccggtcac cggaaagttt cagtagaaga aacaaaacac 1680
cgtgactaaa atgatactat tattttattt attgtgtttt tcttttttct accggaactt 1740
tttagaacgg atcccaactc gttccggggc cgctacaact gaaacaaaag aagatatttt 1800
ctctctcttc agaaatgtaa gttttccttt acagataccc attcaccatt tgattcagat 1860
gtggtgacta gagataaagc atactaattt gactcttgga aacccataaa gtttatgtta 1920
tccgtgttct ggaccaatcc acttgggggc ataacctgtg tctatgtgtg gtttggtttc 1980
cattctgatt tatgcggcga cttgtaattt aaaatctagg aggggcagac attgaacaat 2040
cccaatattt taataactta tgcaagattt tttttattaa tgagatgatg tgtttgtgac 2100
tgagattgag tcatacattt cactaagaaa tggttccaag taccaaacta tcatgaccca 2160
gttgcaaaca tgacgttcgg gagtggtcac tttgatagtt caatttcatc ttggcttctt 2220
attcctttta taattctaat tcttcttgtg taaactattt catgtattat ttttctttaa 2280
aatttacatg tcatttattt tgcctcacta actcaatttt gcatataaca atgataagtg 2340
atattttgac tcacaaaatt tacatcaaat ttcgacatcg tttattatgt tcattggatg 2400
attaacaaat ataacaaact ttgcaactaa ttaaccacca actgaatata attaactata 2460
actgtgaaag tagttaactc atttttatat ttcatagatc aaataagaga aataacggta 2520
tattaatccc tccaaaaaaa aaaaacggta tatttactaa aaaatctaag ccacgtagga 2580
ggataacagg atccccgtag gaggataaca tccaatccaa ccaatcacaa caatcctgat 2640
gagataaccc actttaagcc cacgcatctg tggcacatct acattatcta aatcacacat 2700
tcttccacac atctgagcca cacaaaaacc aatccacatc tttatcaccc attctataaa 2760
aaatcacact ttgtgagtct acactttgat tcccttcaaa cacatacaaa gagaagagac 2820
taattaatta attaatcatc ttgagagaaa atgtttgggc gcggaccaac aaggaagagt 2880
gataacacca aatattacga tattcttggt gtttcaaaaa gtgctagtga agatgaaatc 2940
aagaaagcct atagaaaggc agcgatgaag aaccatccag ataagggtgg ggatcctgag 3000
aagttcaagg agttgggcca agcatatgaa gtgttgagcg atcctgaaaa gaaagaactg 3060
tatgatcaat atggtgaaga tgcccttaaa gaaggaatgg ggggaggcgc aggaagctca 3120
tttcataatc cgtttgatat tttcgaatca ttttttggtg caggctttgg tggtggtggt 3180
ccttcacgcg caagaagaca gaagcaagga gaagatgtgg tgcattctat aaaggtttcc 3240
ttggaggatg tgtataacgg cactacaaag aagctatcac tttctaggaa tgcactgtgc 3300
tcaaaatgta aagggaaagg ttcaaaaagt ggaactgctg gaaggtgttt tggatgccag 3360
ggcacaggta tgaagattac cagaaggcaa attggactgg gcatgattca acaaatgcaa 3420
cacgtctgtc ctgactgcaa aggaacaggc gaggtcatta gtgagagaga tagatgccct 3480
caatgcaagg gaaacaagat tactcaagaa aagaaggtgc tggaggtgca tgtggaaaag 3540
gggatgcagc agggtcacaa gattgtattc gaaggacaag ctgatgaagc tcctgataca 3600
atcacaggag acatagtttt tgtcttgcaa gtaaagggac atccgaagtt tcggagggag 3660
cgtgatgacc tccacattga acacaatttg agcttaactg aggctctctg tggcttccag 3720
tttaatgtca cacatcttga tggaaggcaa ctattggtca aatcgaaccc cggcgaagtc 3780
atcaagccag gtcaacataa agctataaat gatgagggaa tgccacaaca tggtaggccg 3840
ttcatgaagg gacgcctata catcaagttt agtgttgatt tcccggattc gggttttctt 3900
tccccaagcc aaagcctgga attagaaaag atattacctc aaaagacaag caagaacttg 3960
tcccaaaagg aggtagatga ttgtgaggag accaccctgc atgatgtcaa tattgcagag 4020
gagatgagtc gaaagaagca acaataccgt gaggcatatg atgacgatga tgatgaagat 4080
gatgagcact cgcagcctcg ggtgcaatgc gctcaacagt aggagctcag ctcgaatttc 4140
cccgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 4200
gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 4260
tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 4320
tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 4380
tctatgttac tagatcgaat tc 4402
<210> 122
<211> 5086
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number R860, from HindIII
<400> 122
aagcttgcat gcctgcaggt cgactctaga ggatccccgg gctggtctgt acattcatct 60
tgccgccttt gcattcactt ggccacaaag agtagagaga aggaagagaa gagcccagac 120
ttcaagaagc gaccttgcaa gtgcactcga gggtcagaaa ctgtatatca tatctatgtg 180
agagaaaggg gaacatttga gatggagtcc atttacttga ggtatactta ttattttgat 240
caataaattt gtatacttct tatttagatc aataaatttg tcattaagct ataatccaaa 300
ataaattacg atcaaatatg caaatgttag ccagtacttg tgttaaactt gatggcatct 360
cttggtttct ttggcaatca catgcctaag aaataaatag tatcatatga ttgtgtttgg 420
tcagacttca gagtcagatg actctgtttg gataaacagc ttaattaagc gcttatagaa 480
tatcatatga ttgtgtttgg tcagacttca gagcatctct tggtttctct ggcaatcata 540
tgcctaagaa ataaatagta tcatatgatt gtgtttggtc agacttcaga gtcagatgac 600
cctgtttggg taaacagctt aattaagtgc ttatagaata agcgcttatc atataagtgc 660
ttttgtacag ttatttctat gaaagtagaa gaaatagtca tattgtttta atataagcta 720
tcctggagag cttgtggaaa taaccagaaa agaacttatg gacacgtcat gagctgttta 780
cataagatct ccctaacagt ctcaaaagtg tttatgccag tagataaatt caaataagtc 840
aatctaaaca gaccctaaat ccattatggt acctatcatt ttagcttatt ccatctttat 900
taagaatgtc atgagataac ataatgataa cacattattt tgacacaaat gggcagatct 960
agcaatttaa ctctggagtc cttcaagact gctgttctta cgaagttcac gtccctgaat 1020
catgttcctg tatggaagcc tgaaagacct caaattctaa aaggtggcga taaattgaag 1080
gtttacaaaa tataccctgc gggcttgaca cagaggcaag ctctttatac cttccagttc 1140
aacggggatg ttgatttcag aagtcacttg gagagcaatc cttgtgccaa gtttgaagta 1200
atttttgtgt agcatatgtt gagctaccta caatttacat gatcacctag cattagctct 1260
ttcacttaac tgagagaatg aagttttagg aatgagtatg accatggagt cggcatggct 1320
ttgtaatgcc taccctactt tggccaactc atcggggatt tacattcaga aaatatacat 1380
gacttcaacc atacttaaac ccctttttgt aagataactg aatgttcata tttaatgttg 1440
ggttgtagtg tttttacttg attatatcca gacagttaca agttggacaa caagattgtg 1500
ggtctgtact gttatttatt tatttttttt ttagcagaaa caccttatct tttgtttcgt 1560
ttgaatgtag aatgaaaata aaagaaagaa aatataacat catcggccgc gcttgtctaa 1620
tttcgggcag ttaggatcct ctccggtcac cggaaagttt cagtagaaga aacaaaacac 1680
cgtgactaaa atgatactat tattttattt attgtgtttt tcttttttct accggaactt 1740
tttagaacgg atcccaactc gttccggggc cgctacaact gaaacaaaag aagatatttt 1800
ctctctcttc agaaatgtaa gttttccttt acagataccc attcaccatt tgattcagat 1860
gtggtgacta gagataaagc atactaattt gactcttgga aacccataaa gtttatgtta 1920
tccgtgttct ggaccaatcc acttgggggc ataacctgtg tctatgtgtg gtttggtttc 1980
cattctgatt tatgcggcga cttgtaattt aaaatctagg aggggcagac attgaacaat 2040
cccaatattt taataactta tgcaagattt tttttattaa tgagatgatg tgtttgtgac 2100
tgagattgag tcatacattt cactaagaaa tggttccaag taccaaacta tcatgaccca 2160
gttgcaaaca tgacgttcgg gagtggtcac tttgatagtt caatttcatc ttggcttctt 2220
attcctttta taattctaat tcttcttgtg taaactattt catgtattat ttttctttaa 2280
aatttacatg tcatttattt tgcctcacta actcaatttt gcatataaca atgataagtg 2340
atattttgac tcacaaaatt tacatcaaat ttcgacatcg tttattatgt tcattggatg 2400
attaacaaat ataacaaact ttgcaactaa ttaaccacca actgaatata attaactata 2460
actgtgaaag tagttaactc atttttatat ttcatagatc aaataagaga aataacggta 2520
tattaatccc tccaaaaaaa aaaaacggta tatttactaa aaaatctaag ccacgtagga 2580
ggataacagg atccccgtag gaggataaca tccaatccaa ccaatcacaa caatcctgat 2640
gagataaccc actttaagcc cacgcatctg tggcacatct acattatcta aatcacacat 2700
tcttccacac atctgagcca cacaaaaacc aatccacatc tttatcaccc attctataaa 2760
aaatcacact ttgtgagtct acactttgat tcccttcaaa cacatacaaa gagaagagac 2820
taattaatta attaatcatc ttgagagaaa atgtcgggta aaggagaagg accagctatc 2880
ggtatcgatc ttggtaccac ttactcttgc gtcggagtat ggcaacacga ccgtgttgag 2940
atcattgcta atgatcaagg aaacagaacc acgccatctt acgttgcttt caccgactcc 3000
gagaggttga tcggtgacgc agctaagaat caggtcgcca tgaaccccgt taacaccgtt 3060
ttcgacgcta agaggttgat cggtcgtcgt ttctctgaca gctctgttca gagtgacatg 3120
aaattgtggc cattcaagat tcaagccgga cctgccgata agccaatgat ctacgtcgaa 3180
tacaagggtg aagagaaaga gttcgcagct gaggagattt cttccatggt tcttattaag 3240
atgcgtgaga ttgctgaggc ttaccttggt gtcacaatca agaacgccgt tgttaccgtt 3300
ccagcttact tcaacgactc tcagcgtcag gctacaaagg atgctggtgt catcgctggt 3360
ttgaacgtta tgcgaatcat caacgagcct acagccgccg ctattgccta cggtcttgac 3420
aaaaaggcta ccagcgttgg agagaagaat gttcttatct tcgatcttgg tggtggcact 3480
tttgatgtct ctcttcttac cattgaagag ggtatctttg aggtgaaggc aactgctggt 3540
gacacccatc ttggtgggga agattttgac aacagaatgg ttaaccactt tgtccaagag 3600
ttcaagagga agagtaagaa ggatatcacc ggtaacccaa gagctcttag gaggttgaga 3660
acttcctgtg agagagcgaa gaggactctt tcttccactg ctcagaccac catcgagatt 3720
gactctctat acgagggtat cgacttctac tccaccatca cccgtgctag atttgaggag 3780
ctcaacatgg atctcttcag gaagtgtatg gagccagttg agaagtgtct tcgtgatgct 3840
aagatggaca agagcactgt tcatgatgtt gtccttgttg gtggttctac ccgtatccct 3900
aaggttcagc aattgctcca ggacttcttc aacggcaaag agctttgcaa gtctattaac 3960
cctgatgagg ctgttgccta cggtgctgct gtccagggag ctattctcag cggtgaagga 4020
aacgagaagg ttcaagatct tctattgctc gatgtcactc ctctctccct tggtttggaa 4080
actgccggtg gtgtcatgac cactttgatc ccaaggaaca caaccatccc aaccaagaag 4140
gaacaagtct tctccaccta ctcagacaac caacccggtg tgttgatcca ggtgtacgaa 4200
ggagagagag ccagaaccaa ggacaacaac cttcttggta aatttgagct ctccggaatt 4260
cctccagctc ctcgtggtgt cccccagatc acagtctgct ttgacattga tgccaatggt 4320
atcctcaatg tctctgctga ggacaagacc accggacaga agaacaagat caccatcacc 4380
aatgacaagg gtcgtctctc caaggatgag attgagaaga tggttcaaga ggctgagaag 4440
tacaagtccg aagacgagga gcacaagaag aaggttgaag ccaagaacgc tctcgagaac 4500
tacgcttaca acatgaggaa caccatccaa gacgagaaga ttggtgagaa gctcccggct 4560
gcagacaaga agaagatcga ggattctatt gagcaggcga ttcaatggct cgagggtaac 4620
cagttggctg aggctgatga gttcgaagac aagatgaagg aattggagag catctgcaac 4680
ccaatcattg ccaagatgta ccaaggagct ggtggtgaag ccggtggtcc aggtgcctct 4740
ggtatggacg atgatgctcc ccctgcttca ggcggtgctg gacctaagat cgaggaggtc 4800
gactaagagc tcagctcgaa tttccccgat cgttcaaaca tttggcaata aagtttctta 4860
agattgaatc ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt 4920
aagcatgtaa taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt 4980
agagtcccgc aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag 5040
gataaattat cgcgcgcggt gtcatctatg ttactagatc gaattc 5086
<210> 123
<211> 9493
<212> DNA
<213> Artificial sequence
<220>
<223> Construct number R870, from HindIII
<400> 123
aagcttgcat gcctgcaggt cgactctaga ggatccccgg gctggtctgt acattcatct 60
tgccgccttt gcattcactt ggccacaaag agtagagaga aggaagagaa gagcccagac 120
ttcaagaagc gaccttgcaa gtgcactcga gggtcagaaa ctgtatatca tatctatgtg 180
agagaaaggg gaacatttga gatggagtcc atttacttga ggtatactta ttattttgat 240
caataaattt gtatacttct tatttagatc aataaatttg tcattaagct ataatccaaa 300
ataaattacg atcaaatatg caaatgttag ccagtacttg tgttaaactt gatggcatct 360
cttggtttct ttggcaatca catgcctaag aaataaatag tatcatatga ttgtgtttgg 420
tcagacttca gagtcagatg actctgtttg gataaacagc ttaattaagc gcttatagaa 480
tatcatatga ttgtgtttgg tcagacttca gagcatctct tggtttctct ggcaatcata 540
tgcctaagaa ataaatagta tcatatgatt gtgtttggtc agacttcaga gtcagatgac 600
cctgtttggg taaacagctt aattaagtgc ttatagaata agcgcttatc atataagtgc 660
ttttgtacag ttatttctat gaaagtagaa gaaatagtca tattgtttta atataagcta 720
tcctggagag cttgtggaaa taaccagaaa agaacttatg gacacgtcat gagctgttta 780
cataagatct ccctaacagt ctcaaaagtg tttatgccag tagataaatt caaataagtc 840
aatctaaaca gaccctaaat ccattatggt acctatcatt ttagcttatt ccatctttat 900
taagaatgtc atgagataac ataatgataa cacattattt tgacacaaat gggcagatct 960
agcaatttaa ctctggagtc cttcaagact gctgttctta cgaagttcac gtccctgaat 1020
catgttcctg tatggaagcc tgaaagacct caaattctaa aaggtggcga taaattgaag 1080
gtttacaaaa tataccctgc gggcttgaca cagaggcaag ctctttatac cttccagttc 1140
aacggggatg ttgatttcag aagtcacttg gagagcaatc cttgtgccaa gtttgaagta 1200
atttttgtgt agcatatgtt gagctaccta caatttacat gatcacctag cattagctct 1260
ttcacttaac tgagagaatg aagttttagg aatgagtatg accatggagt cggcatggct 1320
ttgtaatgcc taccctactt tggccaactc atcggggatt tacattcaga aaatatacat 1380
gacttcaacc atacttaaac ccctttttgt aagataactg aatgttcata tttaatgttg 1440
ggttgtagtg tttttacttg attatatcca gacagttaca agttggacaa caagattgtg 1500
ggtctgtact gttatttatt tatttttttt ttagcagaaa caccttatct tttgtttcgt 1560
ttgaatgtag aatgaaaata aaagaaagaa aatataacat catcggccgc gcttgtctaa 1620
tttcgggcag ttaggatcct ctccggtcac cggaaagttt cagtagaaga aacaaaacac 1680
cgtgactaaa atgatactat tattttattt attgtgtttt tcttttttct accggaactt 1740
tttagaacgg atcccaactc gttccggggc cgctacaact gaaacaaaag aagatatttt 1800
ctctctcttc agaaatgtaa gttttccttt acagataccc attcaccatt tgattcagat 1860
gtggtgacta gagataaagc atactaattt gactcttgga aacccataaa gtttatgtta 1920
tccgtgttct ggaccaatcc acttgggggc ataacctgtg tctatgtgtg gtttggtttc 1980
cattctgatt tatgcggcga cttgtaattt aaaatctagg aggggcagac attgaacaat 2040
cccaatattt taataactta tgcaagattt tttttattaa tgagatgatg tgtttgtgac 2100
tgagattgag tcatacattt cactaagaaa tggttccaag taccaaacta tcatgaccca 2160
gttgcaaaca tgacgttcgg gagtggtcac tttgatagtt caatttcatc ttggcttctt 2220
attcctttta taattctaat tcttcttgtg taaactattt catgtattat ttttctttaa 2280
aatttacatg tcatttattt tgcctcacta actcaatttt gcatataaca atgataagtg 2340
atattttgac tcacaaaatt tacatcaaat ttcgacatcg tttattatgt tcattggatg 2400
attaacaaat ataacaaact ttgcaactaa ttaaccacca actgaatata attaactata 2460
actgtgaaag tagttaactc atttttatat ttcatagatc aaataagaga aataacggta 2520
tattaatccc tccaaaaaaa aaaaacggta tatttactaa aaaatctaag ccacgtagga 2580
ggataacagg atccccgtag gaggataaca tccaatccaa ccaatcacaa caatcctgat 2640
gagataaccc actttaagcc cacgcatctg tggcacatct acattatcta aatcacacat 2700
tcttccacac atctgagcca cacaaaaacc aatccacatc tttatcaccc attctataaa 2760
aaatcacact ttgtgagtct acactttgat tcccttcaaa cacatacaaa gagaagagac 2820
taattaatta attaatcatc ttgagagaaa atgtcgggta aaggagaagg accagctatc 2880
ggtatcgatc ttggtaccac ttactcttgc gtcggagtat ggcaacacga ccgtgttgag 2940
atcattgcta atgatcaagg aaacagaacc acgccatctt acgttgcttt caccgactcc 3000
gagaggttga tcggtgacgc agctaagaat caggtcgcca tgaaccccgt taacaccgtt 3060
ttcgacgcta agaggttgat cggtcgtcgt ttctctgaca gctctgttca gagtgacatg 3120
aaattgtggc cattcaagat tcaagccgga cctgccgata agccaatgat ctacgtcgaa 3180
tacaagggtg aagagaaaga gttcgcagct gaggagattt cttccatggt tcttattaag 3240
atgcgtgaga ttgctgaggc ttaccttggt gtcacaatca agaacgccgt tgttaccgtt 3300
ccagcttact tcaacgactc tcagcgtcag gctacaaagg atgctggtgt catcgctggt 3360
ttgaacgtta tgcgaatcat caacgagcct acagccgccg ctattgccta cggtcttgac 3420
aaaaaggcta ccagcgttgg agagaagaat gttcttatct tcgatcttgg tggtggcact 3480
tttgatgtct ctcttcttac cattgaagag ggtatctttg aggtgaaggc aactgctggt 3540
gacacccatc ttggtgggga agattttgac aacagaatgg ttaaccactt tgtccaagag 3600
ttcaagagga agagtaagaa ggatatcacc ggtaacccaa gagctcttag gaggttgaga 3660
acttcctgtg agagagcgaa gaggactctt tcttccactg ctcagaccac catcgagatt 3720
gactctctat acgagggtat cgacttctac tccaccatca cccgtgctag atttgaggag 3780
ctcaacatgg atctcttcag gaagtgtatg gagccagttg agaagtgtct tcgtgatgct 3840
aagatggaca agagcactgt tcatgatgtt gtccttgttg gtggttctac ccgtatccct 3900
aaggttcagc aattgctcca ggacttcttc aacggcaaag agctttgcaa gtctattaac 3960
cctgatgagg ctgttgccta cggtgctgct gtccagggag ctattctcag cggtgaagga 4020
aacgagaagg ttcaagatct tctattgctc gatgtcactc ctctctccct tggtttggaa 4080
actgccggtg gtgtcatgac cactttgatc ccaaggaaca caaccatccc aaccaagaag 4140
gaacaagtct tctccaccta ctcagacaac caacccggtg tgttgatcca ggtgtacgaa 4200
ggagagagag ccagaaccaa ggacaacaac cttcttggta aatttgagct ctccggaatt 4260
cctccagctc ctcgtggtgt cccccagatc acagtctgct ttgacattga tgccaatggt 4320
atcctcaatg tctctgctga ggacaagacc accggacaga agaacaagat caccatcacc 4380
aatgacaagg gtcgtctctc caaggatgag attgagaaga tggttcaaga ggctgagaag 4440
tacaagtccg aagacgagga gcacaagaag aaggttgaag ccaagaacgc tctcgagaac 4500
tacgcttaca acatgaggaa caccatccaa gacgagaaga ttggtgagaa gctcccggct 4560
gcagacaaga agaagatcga ggattctatt gagcaggcga ttcaatggct cgagggtaac 4620
cagttggctg aggctgatga gttcgaagac aagatgaagg aattggagag catctgcaac 4680
ccaatcattg ccaagatgta ccaaggagct ggtggtgaag ccggtggtcc aggtgcctct 4740
ggtatggacg atgatgctcc ccctgcttca ggcggtgctg gacctaagat cgaggaggtc 4800
gactaagagc tcagctcgaa tttccccgat cgttcaaaca tttggcaata aagtttctta 4860
agattgaatc ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt 4920
aagcatgtaa taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt 4980
agagtcccgc aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag 5040
gataaattat cgcgcgcggt gtcatctatg ttactagatc gaattcgtaa tcatggtcat 5100
agctgtttcc tgtgtgaaat tgttatccgg ggctggtctg tacattcatc ttgccgcctt 5160
tgcattcact tggccacaaa gagtagagag aaggaagaga agagcccaga cttcaagaag 5220
cgaccttgca agtgcactcg agggtcagaa actgtatatc atatctatgt gagagaaagg 5280
ggaacatttg agatggagtc catttacttg aggtatactt attattttga tcaataaatt 5340
tgtatacttc ttatttagat caataaattt gtcattaagc tataatccaa aataaattac 5400
gatcaaatat gcaaatgtta gccagtactt gtgttaaact tgatggcatc tcttggtttc 5460
tttggcaatc acatgcctaa gaaataaata gtatcatatg attgtgtttg gtcagacttc 5520
agagtcagat gactctgttt ggataaacag cttaattaag cgcttataga atatcatatg 5580
attgtgtttg gtcagacttc agagcatctc ttggtttctc tggcaatcat atgcctaaga 5640
aataaatagt atcatatgat tgtgtttggt cagacttcag agtcagatga ccctgtttgg 5700
gtaaacagct taattaagtg cttatagaat aagcgcttat catataagtg cttttgtaca 5760
gttatttcta tgaaagtaga agaaatagtc atattgtttt aatataagct atcctggaga 5820
gcttgtggaa ataaccagaa aagaacttat ggacacgtca tgagctgttt acataagatc 5880
tccctaacag tctcaaaagt gtttatgcca gtagataaat tcaaataagt caatctaaac 5940
agaccctaaa tccattatgg tacctatcat tttagcttat tccatcttta ttaagaatgt 6000
catgagataa cataatgata acacattatt ttgacacaaa tgggcagatc tagcaattta 6060
actctggagt ccttcaagac tgctgttctt acgaagttca cgtccctgaa tcatgttcct 6120
gtatggaagc ctgaaagacc tcaaattcta aaaggtggcg ataaattgaa ggtttacaaa 6180
atataccctg cgggcttgac acagaggcaa gctctttata ccttccagtt caacggggat 6240
gttgatttca gaagtcactt ggagagcaat ccttgtgcca agtttgaagt aatttttgtg 6300
tagcatatgt tgagctacct acaatttaca tgatcaccta gcattagctc tttcacttaa 6360
ctgagagaat gaagttttag gaatgagtat gaccatggag tcggcatggc tttgtaatgc 6420
ctaccctact ttggccaact catcggggat ttacattcag aaaatataca tgacttcaac 6480
catacttaaa cccctttttg taagataact gaatgttcat atttaatgtt gggttgtagt 6540
gtttttactt gattatatcc agacagttac aagttggaca acaagattgt gggtctgtac 6600
tgttatttat ttattttttt tttagcagaa acaccttatc ttttgtttcg tttgaatgta 6660
gaatgaaaat aaaagaaaga aaatataaca tcatcggccg cgcttgtcta atttcgggca 6720
gttaggatcc tctccggtca ccggaaagtt tcagtagaag aaacaaaaca ccgtgactaa 6780
aatgatacta ttattttatt tattgtgttt ttcttttttc taccggaact ttttagaacg 6840
gatcccaact cgttccgggg ccgctacaac tgaaacaaaa gaagatattt tctctctctt 6900
cagaaatgta agttttcctt tacagatacc cattcaccat ttgattcaga tgtggtgact 6960
agagataaag catactaatt tgactcttgg aaacccataa agtttatgtt atccgtgttc 7020
tggaccaatc cacttggggg cataacctgt gtctatgtgt ggtttggttt ccattctgat 7080
ttatgcggcg acttgtaatt taaaatctag gaggggcaga cattgaacaa tcccaatatt 7140
ttaataactt atgcaagatt ttttttatta atgagatgat gtgtttgtga ctgagattga 7200
gtcatacatt tcactaagaa atggttccaa gtaccaaact atcatgaccc agttgcaaac 7260
atgacgttcg ggagtggtca ctttgatagt tcaatttcat cttggcttct tattcctttt 7320
ataattctaa ttcttcttgt gtaaactatt tcatgtatta tttttcttta aaatttacat 7380
gtcatttatt ttgcctcact aactcaattt tgcatataac aatgataagt gatattttga 7440
ctcacaaaat ttacatcaaa tttcgacatc gtttattatg ttcattggat gattaacaaa 7500
tataacaaac tttgcaacta attaaccacc aactgaatat aattaactat aactgtgaaa 7560
gtagttaact catttttata tttcatagat caaataagag aaataacggt atattaatcc 7620
ctccaaaaaa aaaaaacggt atatttacta aaaaatctaa gccacgtagg aggataacag 7680
gatccccgta ggaggataac atccaatcca accaatcaca acaatcctga tgagataacc 7740
cactttaagc ccacgcatct gtggcacatc tacattatct aaatcacaca ttcttccaca 7800
catctgagcc acacaaaaac caatccacat ctttatcacc cattctataa aaaatcacac 7860
tttgtgagtc tacactttga ttcccttcaa acacatacaa agagaagaga ctaattaatt 7920
aattaatcat cttgagagaa aatgtttggg cgcggaccaa caaggaagag tgataacacc 7980
aaatattacg atattcttgg tgtttcaaaa agtgctagtg aagatgaaat caagaaagcc 8040
tatagaaagg cagcgatgaa gaaccatcca gataagggtg gggatcctga gaagttcaag 8100
gagttgggcc aagcatatga agtgttgagc gatcctgaaa agaaagaact gtatgatcaa 8160
tatggtgaag atgcccttaa agaaggaatg gggggaggcg caggaagctc atttcataat 8220
ccgtttgata ttttcgaatc attttttggt gcaggctttg gtggtggtgg tccttcacgc 8280
gcaagaagac agaagcaagg agaagatgtg gtgcattcta taaaggtttc cttggaggat 8340
gtgtataacg gcactacaaa gaagctatca ctttctagga atgcactgtg ctcaaaatgt 8400
aaagggaaag gttcaaaaag tggaactgct ggaaggtgtt ttggatgcca gggcacaggt 8460
atgaagatta ccagaaggca aattggactg ggcatgattc aacaaatgca acacgtctgt 8520
cctgactgca aaggaacagg cgaggtcatt agtgagagag atagatgccc tcaatgcaag 8580
ggaaacaaga ttactcaaga aaagaaggtg ctggaggtgc atgtggaaaa ggggatgcag 8640
cagggtcaca agattgtatt cgaaggacaa gctgatgaag ctcctgatac aatcacagga 8700
gacatagttt ttgtcttgca agtaaaggga catccgaagt ttcggaggga gcgtgatgac 8760
ctccacattg aacacaattt gagcttaact gaggctctct gtggcttcca gtttaatgtc 8820
acacatcttg atggaaggca actattggtc aaatcgaacc ccggcgaagt catcaagcca 8880
ggtcaacata aagctataaa tgatgaggga atgccacaac atggtaggcc gttcatgaag 8940
ggacgcctat acatcaagtt tagtgttgat ttcccggatt cgggttttct ttccccaagc 9000
caaagcctgg aattagaaaa gatattacct caaaagacaa gcaagaactt gtcccaaaag 9060
gaggtagatg attgtgagga gaccaccctg catgatgtca atattgcaga ggagatgagt 9120
cgaaagaagc aacaataccg tgaggcatat gatgacgatg atgatgaaga tgatgagcac 9180
tcgcagcctc gggtgcaatg cgctcaacag taggagctca gctcgaattt ccccgatcgt 9240
tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt 9300
atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg 9360
ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata 9420
gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta 9480
ctagatcgaa ttc 9493
<210> 124
<211> 34
<212> DNA
<213> Artificial sequence
<220>
<223> supP19-plasto.r
<400> 124
ccttgtatag ctcgttccat tttctctcaa gatg 34
<210> 125
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> supP19-1c
<400> 125
atggaacgag ctatacaagg 20
<210> 126
<211> 32
<212> DNA
<213> Artificial sequence
<220>
<223> SupP19-SacI.r
<400> 126
agtcgagctc ttactcgctt tctttttcga ag 32
<210> 127
<211> 3462
<212> DNA
<213> Artificial
<220>
<223> A/California/04/09 (cassette number 560)
<400> 127
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780
acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840
cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900
cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960
ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020
gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080
gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140
tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200
tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260
gcccatggcg aaaaacgttg cgattttcgg cttattgttt tctcttcttg tgttggttcc 1320
ttctcagatc ttcgctgaca cattatgtat aggttatcat gcgaacaatt caacagacac 1380
tgtagacaca gtactagaaa agaatgtaac agtaacacac tctgttaacc ttctagaaga 1440
caagcataac gggaaactat gcaaactaag aggggtagcc ccattgcatt tgggtaaatg 1500
taacattgct ggctggatcc tgggaaatcc agagtgtgaa tcactctcca cagcaagctc 1560
atggtcctac attgtggaaa cacctagttc agacaatgga acgtgttacc caggagattt 1620
catcgattat gaggagctaa gagagcaatt aagctcagtg tcatcatttg aaaggtttga 1680
gatattcccc aagacaagtt catggcccaa tcatgactcg aacaaaggtg taacggcagc 1740
atgtcctcat gctggagcaa aaagcttcta caaaaattta atatggctag ttaaaaaagg 1800
aaattcatac ccaaagctca gcaaatccta cattaatgat aaagggaaag aagtcctcgt 1860
gctatggggc attcaccatc catctactag tgctgaccaa caaagtctct atcagaatgc 1920
agatacatat gtttttgtgg ggtcatcaag atacagcaag aagttcaagc cggaaatagc 1980
aataagaccc aaagtgaggg atcaagaagg gagaatgaac tattactgga cactagtaga 2040
gccgggagac aaaataacat tcgaagcaac tggaaatcta gtggtaccga gatatgcatt 2100
cgcaatggaa agaaatgctg gatctggtat tatcatttca gatacaccag tccacgattg 2160
caatacaact tgtcaaacac ccaagggtgc tataaacacc agcctcccat ttcagaatat 2220
acatccgatc acaattggaa aatgtccaaa atatgtaaaa agcacaaaat tgagactggc 2280
cacaggattg aggaatatcc cgtctattca atctagagga ctatttgggg ccattgccgg 2340
tttcattgaa ggggggtgga cagggatggt agatggatgg tacggttatc accatcaaaa 2400
tgagcagggg tcaggatatg cagccgacct gaagagcaca cagaatgcca ttgacgagat 2460
tactaacaaa gtaaattctg ttattgaaaa gatgaataca cagttcacag cagtaggtaa 2520
agagttcaac cacctggaaa aaagaataga gaatttaaat aaaaaagttg atgatggttt 2580
cctggacatt tggacttaca atgccgaact gttggttcta ttggaaaatg aaagaacttt 2640
ggactaccac gattcaaatg tgaagaactt atatgaaaag gtaagaagcc agctaaaaaa 2700
caatgccaag gaaattggaa acggctgctt tgaattttac cacaaatgcg ataacacgtg 2760
catggaaagt gtcaaaaatg ggacttatga ctacccaaaa tactcagagg aagcaaaatt 2820
aaacagagaa gaaatagatg gggtaaagct ggaatcaaca aggatttacc agattttggc 2880
gatctattca actgtcgcca gttcattggt actggtagtc tccctggggg caatcagttt 2940
ctggatgtgc tctaatgggt ctctacagtg tagaatatgt atttaaaggc ctattttctt 3000
tagtttgaat ttactgttat tcggtgtgca tttctatgtt tggtgagcgg ttttctgtgc 3060
tcagagtgtg tttattttat gtaatttaat ttctttgtga gctcctgttt agcaggtcgt 3120
cccttcagca aggacacaaa aagattttaa ttttattaaa aaaaaaaaaa aaaaagaccg 3180
ggaattcgat atcaagctta tcgacctgca gatcgttcaa acatttggca ataaagtttc 3240
ttaagattga atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac 3300
gttaagcatg taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg 3360
attagagtcc cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac 3420
taggataaat tatcgcgcgc ggtgtcatct atgttactag at 3462
<210> 128
<211> 573
<212> PRT
<213> Artificial sequence
<220>
<223> A/California/04/09
<400> 128
Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val
1 5 10 15
Leu Val Pro Ser Gln Ile Phe Ala Asp Thr Leu Cys Ile Gly Tyr His
20 25 30
Ala Asn Asn Ser Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val
35 40 45
Thr Val Thr His Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys
50 55 60
Leu Cys Lys Leu Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn
65 70 75 80
Ile Ala Gly Trp Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr
85 90 95
Ala Ser Ser Trp Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly
100 105 110
Thr Cys Tyr Pro Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln
115 120 125
Leu Ser Ser Val Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr
130 135 140
Ser Ser Trp Pro Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys
145 150 155 160
Pro His Ala Gly Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val
165 170 175
Lys Lys Gly Asn Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp
180 185 190
Lys Gly Lys Glu Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr
195 200 205
Ser Ala Asp Gln Gln Ser Leu Tyr Gln Asn Ala Asp Thr Tyr Val Phe
210 215 220
Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile
225 230 235 240
Arg Pro Lys Val Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr Trp Thr
245 250 255
Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu
260 265 270
Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly
275 280 285
Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln
290 295 300
Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His
305 310 315 320
Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu
325 330 335
Arg Leu Ala Thr Gly Leu Arg Asn Ile Pro Ser Ile Gln Ser Arg Gly
340 345 350
Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met
355 360 365
Val Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly
370 375 380
Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr
385 390 395 400
Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala
405 410 415
Val Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn
420 425 430
Lys Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu
435 440 445
Leu Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser
450 455 460
Asn Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn
465 470 475 480
Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp
485 490 495
Asn Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys
500 505 510
Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys
515 520 525
Leu Glu Ser Thr Arg Ile Tyr Gln Ile Leu Ala Ile Tyr Ser Thr Val
530 535 540
Ala Ser Ser Leu Val Leu Val Val Ser Leu Gly Ala Ile Ser Phe Trp
545 550 555 560
Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile
565 570
<210> 129
<211> 747
<212> DNA
<213> Artificial sequence
<220>
<223> 2X35S promoter
<400> 129
gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60
gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120
ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180
tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240
ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300
acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360
tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420
agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480
aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540
atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600
atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660
tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720
taaggaagtt catttcattt ggagagg 747
<210> 130
<211> 43
<212> DNA
<213> Artificial sequence
<220>
<223> primer PacI-MCS-2X35S.c
<400> 130
aattgttaat taagtcgaca agcttgcatg cctgcaggtc aac 43
<210> 131
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> primer CPMV 5'UTR-2X35S.r
<400> 131
tcaaaaccta ttaagatttt aatacctctc caaatgaaat gaacttcc 48
<210> 132
<211> 49
<212> DNA
<213> Artificial sequence
<220>
<223> primer 2X35S-CPMV 5'UTR.c
<400> 132
ttggagaggt attaaaatct taataggttt tgataaaagc gaacgtggg 49
<210> 133
<211> 44
<212> DNA
<213> Artificial sequence
<220>
<223> primer ApaI-M prot.r
<400> 133
tctccatggg cccgacaaat ttgggcagaa tatacagaag ctta 44
<210> 134
<211> 3505
<212> DNA
<213> Artificial sequence
<220>
<223> expression cassette number 972
<400> 134
ttaattaagt cgacaagctt gcatgcctgc aggtcaacat ggtggagcac gacacacttg 60
tctactccaa aaatatcaaa gatacagtct cagaagacca aagggcaatt gagacttttc 120
aacaaagggt aatatccgga aacctcctcg gattccattg cccagctatc tgtcacttta 180
ttgtgaagat agtggaaaag gaaggtggct cctacaaatg ccatcattgc gataaaggaa 240
aggccatcgt tgaagatgcc tctgccgaca gtggtcccaa agatggaccc ccacccacga 300
ggagcatcgt ggaaaaagaa gacgttccaa ccacgtcttc aaagcaagtg gattgatgtg 360
ataacatggt ggagcacgac acacttgtct actccaaaaa tatcaaagat acagtctcag 420
aagaccaaag ggcaattgag acttttcaac aaagggtaat atccggaaac ctcctcggat 480
tccattgccc agctatctgt cactttattg tgaagatagt ggaaaaggaa ggtggctcct 540
acaaatgcca tcattgcgat aaaggaaagg ccatcgttga agatgcctct gccgacagtg 600
gtcccaaaga tggaccccca cccacgagga gcatcgtgga aaaagaagac gttccaacca 660
cgtcttcaaa gcaagtggat tgatgtgata tctccactga cgtaagggat gacgcacaat 720
cccactatcc ttcgcaagac ccttcctcta tataaggaag ttcatttcat ttggagaggt 780
attaaaatct taataggttt tgataaaagc gaacgtgggg aaacccgaac caaaccttct 840
tctaaactct ctctcatctc tcttaaagca aacttctctc ttgtctttct tgcgtgagcg 900
atcttcaacg ttgtcagatc gtgcttcggc accagtacaa cgttttcttt cactgaagcg 960
aaatcaaaga tctctttgtg gacacgtagt gcggcgccat taaataacgt gtacttgtcc 1020
tattcttgtc ggtgtggtct tgggaaaaga aagcttgctg gaggctgctg ttcagcccca 1080
tacattactt gttacgattc tgctgacttt cggcgggtgc aatatctcta cttctgcttg 1140
acgaggtatt gttgcctgta cttctttctt cttcttcttg ctgattggtt ctataagaaa 1200
tctagtattt tctttgaaac agagttttcc cgtggttttc gaacttggag aaagattgtt 1260
aagcttctgt atattctgcc caaatttgtc gggcccatgg agaaaatagt gcttcttctt 1320
gcaatagtca gtcttgttaa aagtgatcag atttgcattg gttaccatgc aaacaattca 1380
acagagcagg ttgacacaat catggaaaag aacgttactg ttacacatgc ccaagacata 1440
ctggaaaaga cacacaacgg gaagctctgc gatctagatg gagtgaagcc tctaatttta 1500
agagattgta gtgtagctgg atggctcctc gggaacccaa tgtgtgacga attcatcaat 1560
gtaccggaat ggtcttacat agtggagaag gccaatccaa ccaatgacct ctgttaccca 1620
gggagtttca acgactatga agaactgaaa cacctattga gcagaataaa ccattttgag 1680
aaaattcaaa tcatccccaa aagttcttgg tccgatcatg aagcctcatc aggagttagc 1740
tcagcatgtc catacctggg aagtccctcc ttttttagaa atgtggtatg gcttatcaaa 1800
aagaacagta catacccaac aataaagaaa agctacaata ataccaacca agaggatctt 1860
ttggtactgt ggggaattca ccatcctaat gatgcggcag agcagacaag gctatatcaa 1920
aacccaacca cctatatttc cattgggaca tcaacactaa accagagatt ggtaccaaaa 1980
atagctacta gatccaaagt aaacgggcaa agtggaagga tggagttctt ctggacaatt 2040
ttaaaaccta atgatgcaat caacttcgag agtaatggaa atttcattgc tccagaatat 2100
gcatacaaaa ttgtcaagaa aggggactca gcaattatga aaagtgaatt ggaatatggt 2160
aactgcaaca ccaagtgtca aactccaatg ggggcgataa actctagtat gccattccac 2220
aacatacacc ctctcaccat cggggaatgc cccaaatatg tgaaatcaaa cagattagtc 2280
cttgcaacag ggctcagaaa tagccctcaa agagagagca gaagaaaaaa gagaggacta 2340
tttggagcta tagcaggttt tatagaggga ggatggcagg gaatggtaga tggttggtat 2400
gggtaccacc atagcaatga gcaggggagt gggtacgctg cagacaaaga atccactcaa 2460
aaggcaatag atggagtcac caataaggtc aactcaatca ttgacaaaat gaacactcag 2520
tttgaggccg ttggaaggga atttaataac ttagaaagga gaatagagaa tttaaacaag 2580
aagatggaag acgggtttct agatgtctgg acttataatg ccgaacttct ggttctcatg 2640
gaaaatgaga gaactctaga ctttcatgac tcaaatgtta agaacctcta cgacaaggtc 2700
cgactacagc ttagggataa tgcaaaggag ctgggtaacg gttgtttcga gttctatcac 2760
aaatgtgata atgaatgtat ggaaagtata agaaacggaa cgtacaacta tccgcagtat 2820
tcagaagaag caagattaaa aagagaggaa ataagtgggg taaaattgga atcaatagga 2880
acttaccaaa tactgtcaat ttattcaaca gtggcgagtt ccctagcact ggcaatcatg 2940
atggctggtc tatctttatg gatgtgctcc aatggatcgt tacaatgcag aatttgcatt 3000
taaaggccta ttttctttag tttgaattta ctgttattcg gtgtgcattt ctatgtttgg 3060
tgagcggttt tctgtgctca gagtgtgttt attttatgta atttaatttc tttgtgagct 3120
cctgtttagc aggtcgtccc ttcagcaagg acacaaaaag attttaattt tattaaaaaa 3180
aaaaaaaaaa aagaccggga attcgatatc aagcttatcg acctgcagat cgttcaaaca 3240
tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg attatcatat 3300
aatttctgtt gaattacgtt aagcatgtaa taattaacat gtaatgcatg acgttattta 3360
tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg atagaaaaca 3420
aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg ttactagatt 3480
ctagagtctc aagcttcggc gcgcc 3505
<210> 135
<211> 1701
<212> DNA
<213> Influenza virus
<400> 135
atgaaggcaa tactagtagt tctgctatat acatttgcaa ccgcaaatgc agacacatta 60
tgtataggtt atcatgcgaa caattcaaca gacactgtag acacagtact agaaaagaat 120
gtaacagtaa cacactctgt taaccttcta gaagacaagc ataacgggaa actatgcaaa 180
ctaagagggg tagccccatt gcatttgggt aaatgtaaca ttgctggctg gatcctggga 240
aatccagagt gtgaatcact ctccacagca agctcatggt cctacattgt ggaaacacct 300
agttcagaca atggaacgtg ttacccagga gatttcatcg attatgagga gctaagagag 360
caattgagct cagtgtcatc atttgaaagg tttgagatat tccccaagac aagttcatgg 420
cccaatcatg actcgaacaa aggtgtaacg gcagcatgtc ctcatgctgg agcaaaaagc 480
ttctacaaaa atttaatatg gctagttaaa aaaggaaatt catacccaaa gctcagcaaa 540
tcctacatta atgataaagg gaaagaagtc ctcgtgctat ggggcattca ccatccatct 600
actagtgctg accaacaaag tctctatcag aatgcagata catatgtttt tgtggggtca 660
tcaagataca gcaagaagtt caagccggaa atagcaataa gacccaaagt gagggatcaa 720
gaagggagaa tgaactatta ctggacacta gtagagccgg gagacaaaat aacattcgaa 780
gcaactggaa atctagtggt accgagatat gcattcgcaa tggaaagaaa tgctggatct 840
ggtattatca tttcagatac accagtccac gattgcaata caacttgtca aacacccaag 900
ggtgctataa acaccagcct cccatttcag aatatacatc cgatcacaat tggaaaatgt 960
ccaaaatatg taaaaagcac aaaattgaga ctggccacag gattgaggaa tatcccgtct 1020
attcaatcta gaggcctatt tggggccatt gccggtttca ttgaaggggg gtggacaggg 1080
atggtagatg gatggtacgg ttatcaccat caaaatgagc aggggtcagg atatgcagcc 1140
gacctgaaga gcacacagaa tgccattgac gagattacta acaaagtaaa ttctgttatt 1200
gaaaagatga atacacagtt cacagcagta ggtaaagagt tcaaccacct ggaaaaaaga 1260
atagagaatt taaataaaaa agttgatgat ggtttcctgg acatttggac ttacaatgcc 1320
gaactgttgg ttctattgga aaatgaaaga actttggact accacgattc aaatgtgaag 1380
aacttatatg aaaaggtaag aagccagcta aaaaacaatg ccaaggaaat tggaaacggc 1440
tgctttgaat tttaccacaa atgcgataac acgtgcatgg aaagtgtcaa aaatgggact 1500
tatgactacc caaaatactc agaggaagca aaattaaaca gagaagaaat agatggggta 1560
aagctggaat caacaaggat ttaccagatt ttggcgatct attcaactgt cgccagttca 1620
ttggtactgg tagtctccct gggggcaatc agtttctgga tgtgctctaa tgggtctcta 1680
cagtgtagaa tatgtattta a 1701
<210> 136
<211> 2056
<212> DNA
<213> Artificial sequence
<220>
<223> to be synthesized containing H1 A/California/4/2009
<400> 136
atgctaatat cacgtagtgc ggcgccatta aataacgtgt acttgtccta ttcttgtcgg 60
tgtggtcttg ggaaaagaaa gcttgctgga ggctgctgtt cagccccata cattacttgt 120
tacgattctg ctgactttcg gcgggtgcaa tatctctact tctgcttgac gaggtattgt 180
tgcctgtact tctttcttct tcttcttgct gattggttct ataagaaatc tagtattttc 240
tttgaaacag agttttcccg tggttttcga acttggagaa agattgttaa gcttctgtat 300
attctgccca aatttgtcgg gcccatggcg aaaaacgttg cgattttcgg cttattgttt 360
tctcttcttg tgttggttcc ttctcagatc ttcgctgaca cattatgtat aggttatcat 420
gcgaacaatt caacagacac tgtagacaca gtactagaaa agaatgtaac agtaacacac 480
tctgttaacc ttctagaaga caagcataac gggaaactat gcaaactaag aggggtagcc 540
ccattgcatt tgggtaaatg taacattgct ggctggatcc tgggaaatcc agagtgtgaa 600
tcactctcca cagcaagctc atggtcctac attgtggaaa cacctagttc agacaatgga 660
acgtgttacc caggagattt catcgattat gaggagctaa gagagcaatt aagctcagtg 720
tcatcatttg aaaggtttga gatattcccc aagacaagtt catggcccaa tcatgactcg 780
aacaaaggtg taacggcagc atgtcctcat gctggagcaa aaagcttcta caaaaattta 840
atatggctag ttaaaaaagg aaattcatac ccaaagctca gcaaatccta cattaatgat 900
aaagggaaag aagtcctcgt gctatggggc attcaccatc catctactag tgctgaccaa 960
caaagtctct atcagaatgc agatacatat gtttttgtgg ggtcatcaag atacagcaag 1020
aagttcaagc cggaaatagc aataagaccc aaagtgaggg atcaagaagg gagaatgaac 1080
tattactgga cactagtaga gccgggagac aaaataacat tcgaagcaac tggaaatcta 1140
gtggtaccga gatatgcatt cgcaatggaa agaaatgctg gatctggtat tatcatttca 1200
gatacaccag tccacgattg caatacaact tgtcaaacac ccaagggtgc tataaacacc 1260
agcctcccat ttcagaatat acatccgatc acaattggaa aatgtccaaa atatgtaaaa 1320
agcacaaaat tgagactggc cacaggattg aggaatatcc cgtctattca atctagagga 1380
ctatttgggg ccattgccgg tttcattgaa ggggggtgga cagggatggt agatggatgg 1440
tacggttatc accatcaaaa tgagcagggg tcaggatatg cagccgacct gaagagcaca 1500
cagaatgcca ttgacgagat tactaacaaa gtaaattctg ttattgaaaa gatgaataca 1560
cagttcacag cagtaggtaa agagttcaac cacctggaaa aaagaataga gaatttaaat 1620
aaaaaagttg atgatggttt cctggacatt tggacttaca atgccgaact gttggttcta 1680
ttggaaaatg aaagaacttt ggactaccac gattcaaatg tgaagaactt atatgaaaag 1740
gtaagaagcc agctaaaaaa caatgccaag gaaattggaa acggctgctt tgaattttac 1800
cacaaatgcg ataacacgtg catggaaagt gtcaaaaatg ggacttatga ctacccaaaa 1860
tactcagagg aagcaaaatt aaacagagaa gaaatagatg gggtaaagct ggaatcaaca 1920
aggatttacc agattttggc gatctattca actgtcgcca gttcattggt actggtagtc 1980
tccctggggg caatcagttt ctggatgtgc tctaatgggt ctctacagtg tagaatatgt 2040
atttaaaggc ctaata 2056
<210> 137
<211> 714
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized fragment 1
<400> 137
atgctaatat cacgtagtgc ggcgccatta aataacgtgt acttgtccta ttcttgtcgg 60
tgtggtcttg ggaaaagaaa gcttgctgga ggctgctgtt cagccccata cattacttgt 120
tacgattctg ctgactttcg gcgggtgcaa tatctctact tctgcttgac gaggtattgt 180
tgcctgtact tctttcttct tcttcttgct gattggttct ataagaaatc tagtattttc 240
tttgaaacag agttttcccg tggttttcga acttggagaa agattgttaa gcttctgtat 300
attctgccca aatttgtcgg gcccatggcg aaaaacgttg cgattttcgg cttattgttt 360
tctcttcttg tgttggttcc ttctcagatc ttcgctgaca cattatgtat aggttatcat 420
gcgaacaatt caacagacac tgtagacaca gtactagaaa agaatgtaac agtaacacac 480
tctgttaacc ttctagaaga caagcataac gggaaactat gcaaactaag aggggtagcc 540
ccattgcatt tgggtaaatg taacattgct ggctggatcc tgggaaatcc agagtgtgaa 600
tcactctcca cagcaagctc atggtcctac attgtggaaa cacctagttc agacaatgga 660
acgtgttacc caggagattt catcgattat gaggagctaa gagagcaatt aagc 714
<210> 138
<211> 849
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized fragment 2
<400> 138
tggaaacacc tagttcagac aatggaacgt gttacccagg agatttcatc gattatgagg 60
agctaagaga gcaattaagc tcagtgtcat catttgaaag gtttgagata ttccccaaga 120
caagttcatg gcccaatcat gactcgaaca aaggtgtaac ggcagcatgt cctcatgctg 180
gagcaaaaag cttctacaaa aatttaatat ggctagttaa aaaaggaaat tcatacccaa 240
agctcagcaa atcctacatt aatgataaag ggaaagaagt cctcgtgcta tggggcattc 300
accatccatc tactagtgct gaccaacaaa gtctctatca gaatgcagat acatatgttt 360
ttgtggggtc atcaagatac agcaagaagt tcaagccgga aatagcaata agacccaaag 420
tgagggatca agaagggaga atgaactatt actggacact agtagagccg ggagacaaaa 480
taacattcga agcaactgga aatctagtgg taccgagata tgcattcgca atggaaagaa 540
atgctggatc tggtattatc atttcagata caccagtcca cgattgcaat acaacttgtc 600
aaacacccaa gggtgctata aacaccagcc tcccatttca gaatatacat ccgatcacaa 660
ttggaaaatg tccaaaatat gtaaaaagca caaaattgag actggccaca ggattgagga 720
atatcccgtc tattcaatct agaggactat ttggggccat tgccggtttc attgaagggg 780
ggtggacagg gatggtagat ggatggtacg gttatcacca tcaaaatgag caggggtcag 840
gatatgcag 849
<210> 139
<211> 651
<212> DNA
<213> Artificial sequence
<220>
<223> synthesized fragment 3
<400> 139
ttgaaggggg gtggacaggg atggtagatg gatggtacgg ttatcaccat caaaatgagc 60
aggggtcagg atatgcagcc gacctgaaga gcacacagaa tgccattgac gagattacta 120
acaaagtaaa ttctgttatt gaaaagatga atacacagtt cacagcagta ggtaaagagt 180
tcaaccacct ggaaaaaaga atagagaatt taaataaaaa agttgatgat ggtttcctgg 240
acatttggac ttacaatgcc gaactgttgg ttctattgga aaatgaaaga actttggact 300
accacgattc aaatgtgaag aacttatatg aaaaggtaag aagccagcta aaaaacaatg 360
ccaaggaaat tggaaacggc tgctttgaat tttaccacaa atgcgataac acgtgcatgg 420
aaagtgtcaa aaatgggact tatgactacc caaaatactc agaggaagca aaattaaaca 480
gagaagaaat agatggggta aagctggaat caacaaggat ttaccagatt ttggcgatct 540
attcaactgt cgccagttca ttggtactgg tagtctccct gggggcaatc agtttctgga 600
tgtgctctaa tgggtctcta cagtgtagaa tatgtattta aaggcctaat a 651
<210> 140
<211> 48
<212> DNA
<213> Artificial sequence
<220>
<223> primer DraIII-MProt#2.c
<400> 140
atgctaatat cacgtagtgc ggcgccatta aataacgtgt acttgtcc 48
<210> 141
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<223> primer H1 Cal.390r
<400> 141
gcttaattgc tctcttagct cctcataatc gatgaaatct cc 42
<210> 142
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<223> primer H1 Cal.310c
<400> 142
tggaaacacc tagttcagac aatggaacgt gttacccagg ag 42
<210> 143
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<223> primer H1 Cal.1159r
<400> 143
ctgcatatcc tgacccctgc tcattttgat ggtgataacc gt 42
<210> 144
<211> 42
<212> DNA
<213> Artificial sequence
<220>
<223> primer H1 Cal.1081c
<400> 144
ttgaaggggg gtggacaggg atggtagatg gatggtacgg tt 42
<210> 145
<211> 45
<212> DNA
<213> Artificial sequence
<220>
<223> primer StuI-H1 Cal.r
<400> 145
tattaggcct ttaaatacat attctacact gtagagaccc attag 45
<210> 146
<211> 3520
<212> DNA
<213> Artificial sequence
<220>
<223> expression cassette number 560
<400> 146
ttaattaagt cgacaagctt gcatgcctgc aggtcaacat ggtggagcac gacacacttg 60
tctactccaa aaatatcaaa gatacagtct cagaagacca aagggcaatt gagacttttc 120
aacaaagggt aatatccgga aacctcctcg gattccattg cccagctatc tgtcacttta 180
ttgtgaagat agtggaaaag gaaggtggct cctacaaatg ccatcattgc gataaaggaa 240
aggccatcgt tgaagatgcc tctgccgaca gtggtcccaa agatggaccc ccacccacga 300
ggagcatcgt ggaaaaagaa gacgttccaa ccacgtcttc aaagcaagtg gattgatgtg 360
ataacatggt ggagcacgac acacttgtct actccaaaaa tatcaaagat acagtctcag 420
aagaccaaag ggcaattgag acttttcaac aaagggtaat atccggaaac ctcctcggat 480
tccattgccc agctatctgt cactttattg tgaagatagt ggaaaaggaa ggtggctcct 540
acaaatgcca tcattgcgat aaaggaaagg ccatcgttga agatgcctct gccgacagtg 600
gtcccaaaga tggaccccca cccacgagga gcatcgtgga aaaagaagac gttccaacca 660
cgtcttcaaa gcaagtggat tgatgtgata tctccactga cgtaagggat gacgcacaat 720
cccactatcc ttcgcaagac ccttcctcta tataaggaag ttcatttcat ttggagaggt 780
attaaaatct taataggttt tgataaaagc gaacgtgggg aaacccgaac caaaccttct 840
tctaaactct ctctcatctc tcttaaagca aacttctctc ttgtctttct tgcgtgagcg 900
atcttcaacg ttgtcagatc gtgcttcggc accagtacaa cgttttcttt cactgaagcg 960
aaatcaaaga tctctttgtg gacacgtagt gcggcgccat taaataacgt gtacttgtcc 1020
tattcttgtc ggtgtggtct tgggaaaaga aagcttgctg gaggctgctg ttcagcccca 1080
tacattactt gttacgattc tgctgacttt cggcgggtgc aatatctcta cttctgcttg 1140
acgaggtatt gttgcctgta cttctttctt cttcttcttg ctgattggtt ctataagaaa 1200
tctagtattt tctttgaaac agagttttcc cgtggttttc gaacttggag aaagattgtt 1260
aagcttctgt atattctgcc caaatttgtc gggcccatgg cgaaaaacgt tgcgattttc 1320
ggcttattgt tttctcttct tgtgttggtt ccttctcaga tcttcgctga cacattatgt 1380
ataggttatc atgcgaacaa ttcaacagac actgtagaca cagtactaga aaagaatgta 1440
acagtaacac actctgttaa ccttctagaa gacaagcata acgggaaact atgcaaacta 1500
agaggggtag ccccattgca tttgggtaaa tgtaacattg ctggctggat cctgggaaat 1560
ccagagtgtg aatcactctc cacagcaagc tcatggtcct acattgtgga aacacctagt 1620
tcagacaatg gaacgtgtta cccaggagat ttcatcgatt atgaggagct aagagagcaa 1680
ttaagctcag tgtcatcatt tgaaaggttt gagatattcc ccaagacaag ttcatggccc 1740
aatcatgact cgaacaaagg tgtaacggca gcatgtcctc atgctggagc aaaaagcttc 1800
tacaaaaatt taatatggct agttaaaaaa ggaaattcat acccaaagct cagcaaatcc 1860
tacattaatg ataaagggaa agaagtcctc gtgctatggg gcattcacca tccatctact 1920
agtgctgacc aacaaagtct ctatcagaat gcagatacat atgtttttgt ggggtcatca 1980
agatacagca agaagttcaa gccggaaata gcaataagac ccaaagtgag ggatcaagaa 2040
gggagaatga actattactg gacactagta gagccgggag acaaaataac attcgaagca 2100
actggaaatc tagtggtacc gagatatgca ttcgcaatgg aaagaaatgc tggatctggt 2160
attatcattt cagatacacc agtccacgat tgcaatacaa cttgtcaaac acccaagggt 2220
gctataaaca ccagcctccc atttcagaat atacatccga tcacaattgg aaaatgtcca 2280
aaatatgtaa aaagcacaaa attgagactg gccacaggat tgaggaatat cccgtctatt 2340
caatctagag gactatttgg ggccattgcc ggtttcattg aaggggggtg gacagggatg 2400
gtagatggat ggtacggtta tcaccatcaa aatgagcagg ggtcaggata tgcagccgac 2460
ctgaagagca cacagaatgc cattgacgag attactaaca aagtaaattc tgttattgaa 2520
aagatgaata cacagttcac agcagtaggt aaagagttca accacctgga aaaaagaata 2580
gagaatttaa ataaaaaagt tgatgatggt ttcctggaca tttggactta caatgccgaa 2640
ctgttggttc tattggaaaa tgaaagaact ttggactacc acgattcaaa tgtgaagaac 2700
ttatatgaaa aggtaagaag ccagctaaaa aacaatgcca aggaaattgg aaacggctgc 2760
tttgaatttt accacaaatg cgataacacg tgcatggaaa gtgtcaaaaa tgggacttat 2820
gactacccaa aatactcaga ggaagcaaaa ttaaacagag aagaaataga tggggtaaag 2880
ctggaatcaa caaggattta ccagattttg gcgatctatt caactgtcgc cagttcattg 2940
gtactggtag tctccctggg ggcaatcagt ttctggatgt gctctaatgg gtctctacag 3000
tgtagaatat gtatttaaag gcctattttc tttagtttga atttactgtt attcggtgtg 3060
catttctatg tttggtgagc ggttttctgt gctcagagtg tgtttatttt atgtaattta 3120
atttctttgt gagctcctgt ttagcaggtc gtcccttcag caaggacaca aaaagatttt 3180
aattttatta aaaaaaaaaa aaaaaaagac cgggaattcg atatcaagct tatcgacctg 3240
cagatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg 3300
cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat 3360
gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat 3420
acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat 3480
ctatgttact agatctctag agtctcaagc ttggcgcgcc 3520
Claims (20)
- 식물에서 활성인 조절 영역에 작동 가능하게 연결된 타입 A/California/04/09의 인플루엔자 헤마글루티닌(HA)을 암호화하는 뉴클레오티드 서열을 포함하는 핵산.
- 제 1 항에 있어서, HA가 자생 또는 비-자생 신호 펩티드를 포함하는 것을 특징으로 하는 핵산.
- 제 2 항에 있어서, 비-자생 신호 펩티드가 단백질 이황화물 이소머라제 신호 펩티드인 것을 특징으로 하는 핵산.
- a) 제 1 항의 핵산을 식물, 또는 식물의 일부에 도입하는 단계, 및
b) 핵산의 발현을 허용하는 조건에서 식물 또는 식물의 일부를 인큐베이션하여 바이러스-유사 입자(VLP)를 생산하는 단계
를 포함하는, 식물에서 인플루엔자 바이러스-유사 입자(VLP)를 생산하는 방법. - 제 4 항에 있어서, 도입 단계(단계 a)에서, 핵산을 식물에 일시 방식으로 도입하는 것을 특징으로 하는 방법.
- 제 4 항에 있어서, 도입 단계(단계 a)에서, 핵산을 식물에 안정하게 도입하는 것을 특징으로 하는 방법.
- 제 4 항에 있어서,
c) 숙주를 수거하고 바이러스-유사 입자(VLP)를 정제하는 단계
를 더 포함하는 것을 특징으로 하는 방법. - 제 4 항에 있어서, 도입 단계(단계 a)에서, 하나 이상의 샤프롱(chaperone) 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 제 2 핵산을 식물에 도입하는 것을 특징으로 하는 방법.
- 제 8 항에 있어서, 하나 이상의 샤프롱 단백질은 Hsp40 및 Hsp70으로 구성되는 군으로부터 선택되는 것을 특징으로 하는 방법.
- a) 제 1 항의 핵산을 포함하는 식물 또는 식물의 일부를 제공하는 단계, 및
b) 핵산의 발현을 허용하는 조건에서 식물 또는 식물의 일부를 인큐베이션하여 바이러스-유사 입자(VLP)를 생산하는 단계
를 포함하는, 식물에서 인플루엔자 바이러스-유사 입자(VLP)를 생산하는 방법. - 제 1 항의 핵산을 포함하는 식물.
- 제 11 항에 있어서, 식물에서 활성인 조절 영역에 작동 가능하게 연결된 하나 이상의 샤프롱 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 더 포함하는 것을 특징으로 하는 식물. 15. 제 14 항에 있어서, 하나 이상의 샤프롱 단백질은 Hsp40 및 Hsp70으로 구성되는 군으로부터 선택되는 것을 특징으로 하는 식물.
- 타입 A/California/04/09의 인플루엔자 바이러스 헤마글루티닌(HA) 단백질과 식물로부터 유래된 하나 이상의 지질을 포함하는 바이러스-유사 입자(VLP).
- 제 13 항의 바이러스-유사 입자(VLP)의 유효 용량과 제약학적으로 허용되는 담체를 포함하는 조성물.
- 제 13 항의 바이러스-유사 입자를 투여하는 단계를 포함하는, 피험체에서 인플루엔자 바이러스 감염에 대한 면역성을 유도하는 방법.
- 제 15 항에 있어서, 바이러스-유사 입자를 경구, 피내, 비내, 근육내, 복강내, 정맥내, 또는 피하 경로로 피험체에게 투여하는 것을 특징으로 하는 방법.
- 식물-특이적 N-글리칸, 또는 변형된 N-글리칸을 보유한 타입 A/California/04/09의 인플루엔자 바이러스 HA를 포함하는 바이러스-유사 입자(VLP).
- 제 17 항의 바이러스-유사 입자(VLP)의 유효 용량과 제약학적으로 허용되는 담체를 포함하는 조성물.
- 제 18 항의 조성물을 투여하는 단계를 포함하는, 피험체에서 인플루엔자 바이러스 감염에 대한 면역성을 유도하는 방법.
- 제 19 항에 있어서, 조성물을 경구, 피내, 비내, 근육내, 복강내, 정맥내, 또는 피하 경로로 피험체에게 투여하는 것을 특징으로 하는 방법.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CA2008/001281 WO2009009876A1 (en) | 2007-07-13 | 2008-07-11 | Influenza virus-like particles (vlps) comprising hemagglutinin produced within a plant |
CAPCT/CA2008/001281 | 2008-07-11 | ||
CAPCT/CA2009/000032 | 2009-01-12 | ||
PCT/CA2009/000032 WO2009076778A1 (en) | 2007-11-27 | 2009-01-12 | Recombinant influenza virus-like particles (vlps) produced in transgenic plants expressing hemagglutinin |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20110034650A true KR20110034650A (ko) | 2011-04-05 |
Family
ID=41507811
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167010959A KR101956910B1 (ko) | 2008-01-21 | 2009-01-12 | 헤마글루티닌을 발현하는 트랜스제닉 식물에서 생산된 재조합 인플루엔자 바이러스-유사 입자(VLPs) |
KR1020117001798A KR20110034650A (ko) | 2008-07-11 | 2009-07-02 | 헤마글루티닌을 포함하는 인플루엔자 바이러스-유사 입자(vlps) |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167010959A KR101956910B1 (ko) | 2008-01-21 | 2009-01-12 | 헤마글루티닌을 발현하는 트랜스제닉 식물에서 생산된 재조합 인플루엔자 바이러스-유사 입자(VLPs) |
Country Status (15)
Country | Link |
---|---|
EP (2) | EP2307549A4 (ko) |
JP (1) | JP5921884B2 (ko) |
KR (2) | KR101956910B1 (ko) |
CN (1) | CN102272308A (ko) |
AU (1) | AU2009267759A1 (ko) |
BR (1) | BRPI0915896A2 (ko) |
CA (1) | CA2730185C (ko) |
EA (1) | EA034733B1 (ko) |
ES (1) | ES2525177T3 (ko) |
IL (1) | IL210215A (ko) |
MX (1) | MX2011000459A (ko) |
NZ (1) | NZ590144A (ko) |
RU (1) | RU2011105073A (ko) |
SG (1) | SG187500A1 (ko) |
WO (1) | WO2010003225A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021215857A1 (ko) * | 2020-04-22 | 2021-10-28 | 포항공과대학교 산학협력단 | 삼량체를 형성하는 코로나-19 바이러스 (covid-19, coronavirus disease 2019)의 재조합 스파이크 단백질 및 식물에서의 상기 재조합 스파이크 단백질의 대량 생산 방법과 이를 기반으로하는 백신조성물 제조 방법 |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2615372A1 (en) | 2007-07-13 | 2009-01-13 | Marc-Andre D'aoust | Influenza virus-like particles (vlps) comprising hemagglutinin |
EP2610345B1 (en) | 2007-11-27 | 2015-08-19 | Medicago Inc. | Recombinant influenza virus-like particles (VLPS) produced in transgenic plants expressing hemagglutinin |
ES2424332T3 (es) * | 2008-06-14 | 2013-10-01 | Veredus Laboratories Pte Ltd | Secuencias de la gripe |
PT2294202E (pt) | 2008-07-08 | 2015-10-09 | Medicago Inc | Antigénios gripais recombinantes solúveis |
CN102165062B (zh) | 2008-07-18 | 2017-09-08 | 麦迪卡格公司 | 新的流感病毒免疫表位 |
SI2445928T1 (en) | 2009-06-24 | 2018-05-31 | Medicago Inc. | HYPER PARTICULARS, SIMILAR VIRUSES OF GRIPE, WHICH HAVE EXPOSED HEMAGLUTININE |
ES2752323T3 (es) * | 2009-09-18 | 2020-04-06 | Fraunhofer Usa Inc | Partículas de tipo virus que comprenden proteínas diana fusionadas a proteínas de revestimiento de virus vegetales |
KR102115226B1 (ko) | 2009-09-22 | 2020-05-27 | 메디카고 인코포레이티드 | 식물-유래 단백질의 제조방법 |
US20130295609A1 (en) * | 2010-11-04 | 2013-11-07 | Medicago Inc. | Plant expression system |
TWI526539B (zh) * | 2010-12-22 | 2016-03-21 | 苜蓿股份有限公司 | 植物中生產類病毒顆粒(vlp)的方法及以該方法生產之vlp |
TWI620816B (zh) | 2011-03-23 | 2018-04-11 | 苜蓿股份有限公司 | 植物衍生蛋白回收方法 |
KR20140047069A (ko) | 2011-06-20 | 2014-04-21 | 유니버시티 오브 피츠버그 - 오브 더 커먼웰쓰 시스템 오브 하이어 에듀케이션 | 계산에 최적화된 광범위 반응을 나타내는 h1n1 인플루엔자를 위한 항원 |
EP3418300B1 (en) | 2011-07-18 | 2020-10-28 | Institute for Research in Biomedicine | Neutralizing anti-influenza a virus antibodies and uses thereof |
JP6248040B2 (ja) | 2011-09-30 | 2017-12-13 | メディカゴ インコーポレイテッド | 植物における増加するウイルス様粒子収量 |
US11390878B2 (en) | 2011-09-30 | 2022-07-19 | Medicago Inc. | Increasing protein yield in plants |
US20140302158A1 (en) * | 2011-11-11 | 2014-10-09 | Phillip Morris Products S.A. | Influenza virus-like particles (vlps) comprising hemagglutinin produced nicotiana tabacum |
SG11201404653UA (en) * | 2012-02-07 | 2014-09-26 | Univ Pittsburgh | Computationally optimized broadly reactive antigens for h3n2, h2n2, and b influenza viruses |
EP2831094B1 (en) | 2012-03-30 | 2018-06-13 | University of Pittsburgh - Of the Commonwealth System of Higher Education | Computationally optimized broadly reactive antigens for h5n1 and h1n1 influenza viruses |
MX364778B (es) | 2012-09-05 | 2019-05-06 | Medicago Inc | Produccion de particulas similares a picornavirus en plantas. |
US9309290B2 (en) * | 2012-11-27 | 2016-04-12 | University of Pittsburgh—of the Commonwealth System of Higher Education | Computationally optimized broadly reactive antigens for H1N1 influenza |
KR102199018B1 (ko) * | 2013-03-28 | 2021-01-07 | 메디카고 인코포레이티드 | 식물에서 인플루엔자 바이러스-유사 입자 생산 |
RU2699982C2 (ru) * | 2014-01-10 | 2019-09-11 | Медикаго Инк. | Энхансерные элементы cpmv |
AU2015234595B2 (en) | 2014-03-27 | 2021-03-25 | Medicago Inc. | Modified CPMV enhancer elements |
CN106795510A (zh) | 2014-07-11 | 2017-05-31 | 莫迪卡戈公司 | 改进植物中的蛋白产生 |
US11020470B2 (en) | 2015-04-13 | 2021-06-01 | The Regents Of The University Of Michigan | Virus-like particles |
WO2016196846A2 (en) | 2015-06-02 | 2016-12-08 | Sanofi Pasteur Inc. | Engineered influenza antigenic polypeptides and immunogenic compositions thereof |
CA2991139A1 (en) | 2015-07-02 | 2017-01-05 | Medicago Inc. | Jasmonic acid pathway activator |
US10844097B2 (en) | 2016-06-02 | 2020-11-24 | Sanofi Pasteur Inc. | Engineered influenza antigenic polypeptides and immunogenic compositions thereof |
JP6622825B2 (ja) * | 2018-01-25 | 2019-12-18 | インスティテュート・フォー・リサーチ・イン・バイオメディシンInstitute For Research In Biomedicine | A型インフルエンザウイルス中和抗体及びその使用法 |
CA3103842A1 (en) * | 2018-06-27 | 2020-01-02 | Medicago Inc. | Influenza virus hemagglutinin mutants |
WO2020092207A1 (en) * | 2018-10-28 | 2020-05-07 | University Of Georgia Research Foundation | Broadly reactive immunogens of influenza virus, compositions, and methods of use thereof |
WO2020176972A1 (en) * | 2019-03-06 | 2020-09-10 | Plantform Corporation | T-dna vectors with engineered 5' sequences upstream of post-translational modification enzymes and methods of use thereof |
AU2019434270A1 (en) | 2019-03-14 | 2021-09-30 | Aramis Biotechnologies Inc. | Endogenous plant expression enhancer |
JP2020048568A (ja) * | 2019-11-22 | 2020-04-02 | インスティテュート・フォー・リサーチ・イン・バイオメディシンInstitute For Research In Biomedicine | A型インフルエンザウイルス中和抗体及びその使用法 |
CN115715326A (zh) * | 2020-04-22 | 2023-02-24 | 浦项工科大学校产学协力团 | 可形成三聚体的源自于流感病毒表面蛋白的重组血球凝集素蛋白及其用途 |
EP4351320A1 (en) | 2021-06-09 | 2024-04-17 | ImmunityBio, Inc. | Methods and systems for producing a protein of interest in a plant |
CN114891074B (zh) * | 2022-05-10 | 2023-04-11 | 中山大学·深圳 | 一种季节性甲型流感通用病毒样颗粒及其制备方法与应用 |
CN115992101B (zh) * | 2023-03-22 | 2023-07-28 | 深圳市卫光生物制品股份有限公司 | 一种流感病毒裂解疫苗原液的制备方法 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5428147A (en) | 1983-04-15 | 1995-06-27 | Mycogen Plant Science, Inc. | Octopine T-DNA promoters |
US5100792A (en) | 1984-11-13 | 1992-03-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues |
US5036006A (en) | 1984-11-13 | 1991-07-30 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US4962028A (en) | 1986-07-09 | 1990-10-09 | Dna Plant Technology Corporation | Plant promotors |
US5232833A (en) | 1988-09-14 | 1993-08-03 | Stressgen Biotechnologies Corporation | Accumulation of heat shock proteins for evaluating biological damage due to chronic exposure of an organism to sublethal levels of pollutants |
US6403865B1 (en) | 1990-08-24 | 2002-06-11 | Syngenta Investment Corp. | Method of producing transgenic maize using direct transformation of commercially important genotypes |
UA48104C2 (uk) | 1991-10-04 | 2002-08-15 | Новартіс Аг | Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника |
NZ517906A (en) | 1999-10-04 | 2003-01-31 | Medicago Inc | Cloning of genomic sequences encoding nitrite reductase (NiR) for use in regulated expression of foreign genes in host plants |
US7125978B1 (en) | 1999-10-04 | 2006-10-24 | Medicago Inc. | Promoter for regulating expression of foreign genes |
ES2295175T3 (es) * | 2000-06-23 | 2008-04-16 | Wyeth Holdings Corporation | Ensamblaje de particulas similares al virus (vlp) de la gripe de tipo salvaje y quimericas. |
EP1635772A4 (en) | 2003-05-05 | 2008-02-13 | Dow Agrosciences Llc | STERILE IMMUNOPROPHYLACTIC AND THERAPEUTIC COMPOSITIONS DERIVED FROM TRANSGENIC VEGETABLE CELLS AND METHODS OF PRODUCTION THEREOF |
AU2004235813B2 (en) * | 2003-05-05 | 2010-07-29 | Boyce Thompson Institute For Plant Research | Vectors and cells for preparing immunoprotective compositions derived from transgenic plants |
US8592197B2 (en) * | 2003-07-11 | 2013-11-26 | Novavax, Inc. | Functional influenza virus-like particles (VLPs) |
CN100410378C (zh) * | 2005-05-09 | 2008-08-13 | 中国农业科学院生物技术研究所 | 编码禽流感血凝素的基因及其植物表达载体和应用 |
AU2006270065A1 (en) * | 2005-07-19 | 2007-01-25 | Dow Global Technologies Inc. | Recombinant flu vaccines |
BRPI0710689A2 (pt) * | 2006-04-21 | 2012-02-22 | Dow Agrosciences Llc | método para preparação de uma vacina de aiv feita de planta e a referida vacina |
US8778353B2 (en) * | 2006-05-01 | 2014-07-15 | Technovax, Inc. | Influenza virus-like particle (VLP) compositions |
US8519113B2 (en) | 2006-05-22 | 2013-08-27 | Plant Bioscience Limited | Bipartite system, method and composition for the constitutive and inducible expression of high levels of foreign proteins in plants |
KR100964462B1 (ko) * | 2007-07-10 | 2010-06-16 | 성균관대학교산학협력단 | 형질전환 식물 유래의 조류독감 바이러스 백신 및 그 제조방법 |
-
2009
- 2009-01-12 SG SG2013004577A patent/SG187500A1/en unknown
- 2009-01-12 EA EA201001198A patent/EA034733B1/ru not_active IP Right Cessation
- 2009-01-12 KR KR1020167010959A patent/KR101956910B1/ko active IP Right Grant
- 2009-07-02 AU AU2009267759A patent/AU2009267759A1/en not_active Abandoned
- 2009-07-02 CA CA2730185A patent/CA2730185C/en active Active
- 2009-07-02 EP EP09793741A patent/EP2307549A4/en not_active Withdrawn
- 2009-07-02 RU RU2011105073/10A patent/RU2011105073A/ru not_active Application Discontinuation
- 2009-07-02 EP EP12181077.4A patent/EP2570484B1/en active Active
- 2009-07-02 JP JP2011516934A patent/JP5921884B2/ja active Active
- 2009-07-02 KR KR1020117001798A patent/KR20110034650A/ko not_active Application Discontinuation
- 2009-07-02 NZ NZ590144A patent/NZ590144A/xx not_active IP Right Cessation
- 2009-07-02 CN CN2009801348688A patent/CN102272308A/zh active Pending
- 2009-07-02 WO PCT/CA2009/000926 patent/WO2010003225A1/en active Application Filing
- 2009-07-02 BR BRPI0915896A patent/BRPI0915896A2/pt not_active IP Right Cessation
- 2009-07-02 ES ES12181077.4T patent/ES2525177T3/es active Active
- 2009-07-02 MX MX2011000459A patent/MX2011000459A/es not_active Application Discontinuation
-
2010
- 2010-12-23 IL IL210215A patent/IL210215A/en not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021215857A1 (ko) * | 2020-04-22 | 2021-10-28 | 포항공과대학교 산학협력단 | 삼량체를 형성하는 코로나-19 바이러스 (covid-19, coronavirus disease 2019)의 재조합 스파이크 단백질 및 식물에서의 상기 재조합 스파이크 단백질의 대량 생산 방법과 이를 기반으로하는 백신조성물 제조 방법 |
Also Published As
Publication number | Publication date |
---|---|
BRPI0915896A2 (pt) | 2019-09-24 |
JP5921884B2 (ja) | 2016-05-24 |
EP2307549A4 (en) | 2011-09-07 |
AU2009267759A1 (en) | 2010-01-14 |
IL210215A0 (en) | 2011-03-31 |
ES2525177T3 (es) | 2014-12-18 |
EA034733B1 (ru) | 2020-03-13 |
RU2011105073A (ru) | 2012-08-20 |
CN102272308A (zh) | 2011-12-07 |
SG187500A1 (en) | 2013-02-28 |
EP2570484B1 (en) | 2014-09-10 |
EP2570484A1 (en) | 2013-03-20 |
NZ590144A (en) | 2012-11-30 |
IL210215A (en) | 2013-11-28 |
WO2010003225A1 (en) | 2010-01-14 |
WO2010003225A8 (en) | 2010-07-22 |
KR20160049061A (ko) | 2016-05-04 |
KR101956910B1 (ko) | 2019-03-12 |
EP2307549A1 (en) | 2011-04-13 |
MX2011000459A (es) | 2011-02-23 |
JP2011527180A (ja) | 2011-10-27 |
CA2730185A1 (en) | 2010-01-14 |
CA2730185C (en) | 2016-02-09 |
EA201001198A1 (ru) | 2011-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101956910B1 (ko) | 헤마글루티닌을 발현하는 트랜스제닉 식물에서 생산된 재조합 인플루엔자 바이러스-유사 입자(VLPs) | |
US20230044454A1 (en) | Recombinant influenza virus-like particles (vlps) produced in transgenic plants | |
DK2610345T3 (en) | RECOMBINANT INFLUENZA VIRUS SIMULAR PARTICULARS (VLPS) MADE IN TRANSGENE PLANTS THAT EXPRESS HEMAGGLUTININ | |
DK2445928T3 (en) | CHEMICAL INFLUENZA VIRUS-LIKE PARTICLES INCLUDING HEMAGGLUTIN | |
KR101974017B1 (ko) | 식물에서 바이러스-유사 입자 수득율을 증가시키는 방법 | |
RU2569195C9 (ru) | Химерные вирусоподобные частицы, содержащие гемагглютинин, сходные с частицами вируса гриппа |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |