CN111315408A - 在嗜热毁丝霉(myceliophthora thermophila)中生产流感疫苗 - Google Patents

在嗜热毁丝霉(myceliophthora thermophila)中生产流感疫苗 Download PDF

Info

Publication number
CN111315408A
CN111315408A CN201880053773.2A CN201880053773A CN111315408A CN 111315408 A CN111315408 A CN 111315408A CN 201880053773 A CN201880053773 A CN 201880053773A CN 111315408 A CN111315408 A CN 111315408A
Authority
CN
China
Prior art keywords
ser
gly
leu
thr
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880053773.2A
Other languages
English (en)
Inventor
M·艾玛法布
T·C·维沃尔德
M·R·阿尔费尼托
M·贝尔
I·勒加斯特卢瓦
M-P·卡泽克
M-C·伯纳德
J·杜拜勒
R·肯辛格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Erjin International Co Ltd
Dyadic International Inc
Original Assignee
Erjin International Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Erjin International Co Ltd filed Critical Erjin International Co Ltd
Publication of CN111315408A publication Critical patent/CN111315408A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/145Orthomyxoviridae, e.g. influenza virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/145Fungal isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5256Virus expressing foreign proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/16Antivirals for RNA viruses for influenza or rhinoviruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16111Influenzavirus A, i.e. influenza A virus
    • C12N2760/16134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16211Influenzavirus B, i.e. influenza B virus
    • C12N2760/16234Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16211Influenzavirus B, i.e. influenza B virus
    • C12N2760/16251Methods of production or purification of viral material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/18011Paramyxoviridae
    • C12N2760/18111Avulavirus, e.g. Newcastle disease virus
    • C12N2760/18134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Virology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Mycology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pulmonology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Botany (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

本发明提供了流感病毒表面蛋白在真菌嗜热毁丝霉(Myceliophthora thermophila)菌株C1中的重组表达。所述重组蛋白用于流感疫苗组合物中。

Description

在嗜热毁丝霉(MYCELIOPHTHORA THERMOPHILA)中生产流感 疫苗
技术领域
本发明涉及在真菌嗜热毁丝霉(Myceliophthora thermophila)中生产重组流感病毒表面蛋白。所述重组蛋白用于流感疫苗组合物中。
背景技术
流感病毒是一种脂质包膜的病毒,带有负义单链分段RNA基因组。病毒粒子的包膜包含两种类型的表面糖蛋白,即血凝素和神经氨酸酶,它们在病毒感染中发挥必不可少的作用。血凝素(HA)通过膜融合介导病毒与其宿主细胞的结合和病毒的进入。神经氨酸酶(NA)是在新后代的释放和防止其聚集中发挥重要作用的一种酶。
在核蛋白和基质蛋白的差异的基础上,流感病毒被分类为A、B和C型。每种类型根据它们表面上存在的HA和NA的组合,被进一步分类成亚型。对于甲型流感病毒来说,已鉴定到16种HA亚型和9种NA亚型,其中三种HA亚型(H1、H2和H3)和两种NA亚型(N1和N2)通常存在于人类中。对于乙型流感病毒来说,仅仅识别到1种HA亚型和1种NA亚型。
世界卫生组织(World Health Organization)对流感病毒株命名的指导原则如下所述:首先,确定病毒类型(A、B或C),然后是宿主(如果不是人类的话)、分离地点、分离编号和分离年份,用斜线分开。对于甲型流感来说,HA和NA亚型在括号中注明。例如,在流感疫苗中常常包括的毒株是:A/新喀里多尼亚/20/1999(H1N1)。
每年在流感季之前对高风险人群进行疫苗接种,是降低流感影响的最有效措施。最常用的流感疫苗由使用受精鸡蛋生产的失活的病毒粒子构成。在每个流感季之前,特别委员会选择据认为代表了在即将来临的流感季中最可能来袭的病毒的三株病毒株。将所选病毒的样品提供给制造商,作为具有所需抗原特征的种子病毒储用物。将所述种子病毒注射到受精鸡蛋中。将这些鸡蛋温育,此时所述流感病毒繁殖。在适合的时间段后,将所述鸡蛋打开并收获蛋清。该样品含有所述病毒。将所述病毒从所述鸡蛋材料纯化并失活。然后将各个病毒储用物合并以产生常用的三价流感疫苗。
在鸡蛋中生产疫苗伴有大量缺点。首先,需要大量的鸡蛋,高达1-2个鸡蛋/剂。此外,生产是耗时、昂贵的并缺少灵活性,例如如果在流感季期间需要改变疫苗组成的话。此外,在鸡蛋中生产产生可变的病毒产率,并且也伴有对卵蛋白的过敏性反应。
为了避开鸡蛋的使用,已提出了用于生产流感病毒的可选方法。这些方法包括通过将病毒在哺乳动物细胞培养物中,例如在MDCK细胞(Novartis)或PERC.6细胞(Crucell)中繁殖来生产病毒粒子。此外,已建议了生产重组血凝素和/或神经氨酸酶蛋白,例如在昆虫细胞中使用杆状病毒表达载体(
Figure BDA0002386913300000021
Protein Sciences Corp.),在植物细胞中(Medicago Inc.),在细菌系统中(VaxInnate)和在真菌例如粗糙脉孢菌(Neurosporacrassa)(Intrexon/Neugenesis)和巴斯德毕赤酵母(Pichia pastoris)中(参见例如Murugan等,2013,Journal of Virological Methods,187:20–25)。然而,迄今为止所描述的方法相对昂贵和/或它们的产率相对低。
US 8,163,533公开了使用丝状真菌异核体快速生产多价重组疫苗的方法和组合物。丝状真菌异核体从其中已引入编码源自于病原生物体的抗原的变体的重组DNA分子的两种或更多种亲代菌株的组合产生。得到的疫苗是多价的。
WO 2014/151488公开了提高重组血凝素制剂特别是重组流感血凝素(rHA)的稳定性并维持其效价的方法。具体来说,已显示通过突变半胱氨酸残基或通过用还原剂和柠檬酸钠配制,可以显著提高rHA制剂的稳定性。
以前被称为Chrysosporium lucknowense菌株C1的嗜热毁丝霉(Myceliophthorathermophila)菌株C1,是一种在1990年代早期发现的丝状嗜热真菌。野生型C1天然产生高水平的纤维素酶,使其对于在商业规模上生产这些酶具有吸引力。多年来,已经开发了C1的表达系统和几种改良的菌株,用于在C1中生产其他酶和其他工业蛋白质。例如,已开发出以与野生型C1分离株相比更高水平生产纤维素酶为特征的改良的C1菌株,被称为“高纤维素酶”或“HC”。另外,也已开发出生产低水平纤维素酶的C1菌株,被称为“低纤维素酶”或“LC”,从而能够商业上生产更纯的酶。
野生型C1根据布达佩斯条约(Budapest Treaty)以编号VKM F-3500D保藏,保藏日期为1996年8月29日。HC和LC菌株也已被保藏,例如:菌株UV13-6,保藏号VKM F-3632D;菌株NG7C-19,保藏号VKM F-3633D;菌株UV18-25,保藏号VKM F-3631D。已被保藏的其他改良的C1菌株包括:(i)HC菌株UV18-100f(Δalp1Δpyr5)–保藏号CBS141147;(ii)HC菌株UV18-100f(Δalp1Δpep4Δalp2Δpyr5,Δprt1)保藏号CBS141143;(iii)LC菌株W1L#100I(Δchi1Δalp1Δalp2Δpyr5)–保藏号CBS141153;和(iv)LC菌株W1L#100I(Δchi1Δalp1Δpyr5)–保藏号CBS141149。
US 8,268,585和US 8,871,493公开了一种在用于表达和分泌异源蛋白或多肽的丝状真菌领域中的转化系统。还公开了以经济的方式生产大量多肽或蛋白质的方法。所述系统包括金孢霉(Chrysosporium)属、更特别是Chrysosporium lucknowense及其突变株或衍生株的转化或转染的真菌菌株。还公开了含有金孢霉编码序列的转化体以及金孢霉基因的表达调控序列。
US 9,175,296公开了Chrysosporium lucknowense的一种真菌宿主菌株。还公开了一种用于同源和/或异源生产纯度高于75%的纯蛋白的方法,一种用于生产人造蛋白混合物的方法和一种用于简化功能性表达所需酶的菌株的筛选的方法。US 9,175,296还公开了一种适合于Chrysosporium lucknowense中的基因表达的转录调控的分离的启动子序列,和一种用于分离其中蛋白酶分泌比Chrysosporium lucknowense菌株UV 18-25的蛋白酶分泌低20%的Chrysosporium lucknowense真菌宿主菌株的方法。
对用于生产流感疫苗组合物的改进的方法存在着需求,所述方法成本效益高,并以时间约束的方式提供满足季节性流感疫苗生产要求的高产量的有效的免疫原性蛋白。
发明内容
根据某些方面,本发明提供了用于生产流感病毒表面蛋白血凝素和神经氨酸酶的遗传修饰的嗜热毁丝霉(Myceliophthora thermophila)菌株C1。
正如本文中公开的,所述流感病毒表面蛋白作为含有其胞外域和跨膜结构域两者的全长膜结合蛋白生产。已令人吃惊地发现,通过C1生产的全长膜结合形式是有功能且免疫原性的,而修饰的分泌形式是无活性的。正如在小鼠模型中示例的,所述膜结合形式是特别有效的,并在相对低的浓度下引发免疫应答。有利的是,C1可以以适合于商业规模生产的高产量生产。
因此,本发明提供了一种以高产量生产用于流感疫苗组合物的有效的免疫原性流感病毒蛋白的高效系统。
根据一个方面,本发明提供了一种用于生产流感病毒表面蛋白的遗传修饰的嗜热毁丝霉(Myceliophthora thermophila)C1,其包含包括可操作连接到至少一种C1调控序列的编码所述流感病毒表面蛋白的核酸序列的表达构建物,其中所述流感病毒表面蛋白包含其胞外域和跨膜结构域,并且在所述C1中作为膜结合蛋白表达。
在某些实施方式中,所述流感病毒表面蛋白是血凝素(HA)。根据这些实施方式,所述表达构建物还包含同框连接到编码上述HA的核酸序列的编码C1信号肽的核酸序列。
在某些实施方式中,所述HA亚型选自流感A-H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15和H16和流感B亚型。
在某些特定实施方式中,所述HA亚型是感染人类的选自流感A亚型H1、H2和H3和流感B亚型的亚型。每种可能性代表了本发明的独立实施方式。
在某些实施方式中,所述HA来自于选自A/新喀里多尼亚/20/99(H1N1)、A/加利福尼亚/04/2009(H1N1)、A/乌拉圭/716/07(H3N2)(A/布里斯班/10/07样)、B/佛罗里达/04/2006:B山形谱系、A/波多黎各/08/1934(H1N1)和A/德克萨斯/50/2012(H3N2)的流感病毒株。
在某些实施方式中,所述至少一种C1调控序列包含C1启动子。在某些实施方式中,所述C1启动子选自hex1(伏鲁宁体)、cbh1(纤维二糖水解酶1)和chi1(几丁质酶1)启动子。每种可能性代表了本发明的独立实施方式。在某些特定实施方式中,所述C1启动子是hex1启动子。
在某些实施方式中,所述C1信号肽是源自于选自Cbh1(纤维二糖水解酶1,C1)、Gla1(葡萄糖淀粉酶1,C1)和GlaA(葡萄糖淀粉酶A,曲霉(Aspergillus))的信号肽。每种可能性代表了本发明的独立实施方式。在某些特定实施方式中,所述C1信号肽源自于Cbh1。
在某些实施方式中,所述表达构建物包含可操作连接到编码融合到HA的Cbh1信号肽的核酸序列的hex1启动子。根据这些实施方式,所述HA来自于选自A/新喀里多尼亚/20/99(H1N1)、A/加利福尼亚/04/2009(H1N1)、B/佛罗里达/04/2006:B山形谱系、A/波多黎各/08/1934(H1N1)和A/德克萨斯/50/2012(H3N2)的流感病毒株。
在某些实施方式中,所述流感病毒表面蛋白是神经氨酸酶(NA)。
在某些实施方式中,所述NA亚型选自流感A-N1、N2、N3、N4、N5、N6、N7、N8和N9和流感B亚型。
在某些特定实施方式中,所述NA亚型是感染人类的选自流感A亚型N1和N2和流感B亚型的亚型。每种可能性代表了本发明的独立实施方式。
在某些实施方式中,所述表达构建物包含可操作连接到编码NA的核酸序列的hex1启动子。根据这些实施方式,所述NA来自于流感病毒株A/新喀里多尼亚/20/99(H1N1)。
在某些实施方式中,所述C1菌株选自:W1L#100I(prt-Δalp1Δchi1Δalp2Δpyr5)保藏号CBS141153,UV18-100f(prt-Δalp1,Δpyr5)保藏号CBS141147,W1L#100I(prt-Δalp1Δchi1Δpyr5)保藏号CBS141149,和UV18-100f(prt-Δalp1Δpep4Δalp2,Δprt1Δpyr5)保藏号CBS141143。在某些特定实施方式中,所述C1菌株是W1L#100I(prt-Δalp1Δchi1Δalp2Δpyr5)保藏号CBS141153。在另外的特定实施方式中,所述C1菌株是UV18-100f(prt-Δalp1,Δpyr5)保藏号CBS141147。
在某些实施方式中,所述C1菌株是被突变以缺失一个或多个编码内源蛋白酶的基因的菌株。在某些实施方式中,所述C1菌株是被突变以缺失编码内源几丁质酶的基因的菌株。
根据其他方面,本发明提供了一种生产流感病毒表面蛋白的方法,所述方法包括将本发明的遗传修饰的嗜热毁丝霉(Myceliophthora thermophila)C1在适合于表达所述流感病毒表面蛋白的条件下培养;以及回收所述流感病毒表面蛋白。
在某些实施方式中,回收所述流感病毒表面蛋白包括从菌丝体提取。
在某些实施方式中,所述回收的蛋白质的得率为至少80%。根据某些示例性实施方式,所述得率为80%。
根据另一方面,本文中提供了一种用于在嗜热毁丝霉(Myceliophthorathermophila)C1中表达膜结合的流感病毒表面蛋白的表达构建物,所述表达构建物包含可操作连接到编码流感病毒表面蛋白的核酸序列的至少一种C1调控序列,其中所述流感病毒表面蛋白包含其胞外域和跨膜结构域。
根据又一方面,本文中提供了一种由本发明的修饰的嗜热毁丝霉(Myceliophthora thermophila)C1生产的基本上纯的重组流感病毒表面蛋白,其中所述流感病毒表面蛋白被纯化到95%或更高的纯度,是有活性和免疫原性的,并在用作疫苗时诱导保护性免疫应答。
本文中还提供了一种流感疫苗组合物,其包含由本发明的修饰的嗜热毁丝霉(Myceliophthora thermophila)C1生产的流感病毒表面蛋白。
从下面的详细描述、实施例和权利要求书,本发明的这些和其他方面和特点将变得显而易见。
附图说明
图1A-1B.被设计和测试的表达构建物。血凝素(HA),第一系列。P=启动子,ss=信号序列,T=终止子。每个构建物中包括的HA类型以黑体标出。
图2A-2B.被设计和测试的表达构建物。血凝素(HA),第二系列。P=启动子,ss=信号序列,T=终止子。每个构建物中包括的HA类型以黑体标出。图2C.含有构建物Phex1-ssCbh-NC-TMD-Tcbh1的表达载体的图示。图2D.用于转化的片段的图示。
图3.被设计和测试的表达构建物。血凝素(HA),第三系列。P=启动子,ss=信号序列,T=终止子。每个构建物中包括的HA类型以黑体标出。
图4.被设计和测试的表达构建物。神经氨酸酶(NA)。P=启动子,ss=信号序列,T=终止子。每个构建物中包括的NA类型以黑体标出。
图5.缩略语表。
图6.用于C1中的异源蛋白生产的示例性表达载体。
图7.含有TMD的HA的纯化程序。
图8.用于区分细胞内定位或细胞壁附着的HA的分级研究的流程图。
图9.rHA-TMD的生物化学评估。
图10A-10B.在注射到小鼠后第27天(图10A)和第49天(图10B)在C1中产生的针对A/新喀里多尼亚/20/99(H1N1)引发的抗体应答。
图11.使用搅拌釜式发酵在C1中进行的HA生产的Western印迹分析。
具体实施方式
本发明涉及流感病毒表面蛋白在真菌嗜热毁丝霉(Myceliophthorathermophila)中,特别是在菌株C1中的重组表达。根据某些实施方式,本发明提供了表达流感病毒表面蛋白的遗传修饰的C1细胞和使用所述细胞生产流感疫苗组合物的方法。
现在公开,在C1中生产的流感抗原与工业标准抗原相比在小鼠中产生相等或甚至更好的免疫应答。
当在本文中使用时,“C1”或“嗜热毁丝霉(Myceliophthora thermophila)C1”是指以前被命名为Chrysosporium lucknowense菌株C1的嗜热毁丝霉(Myceliophthorathermophila)菌株C1,其根据布达佩斯条约(Budapest Treaty)在编号VKM F-3500D下保藏,保藏日期为1996年8月29日。所述术语还涵盖其已被突变以例如缺失一个或多个内源基因的遗传修饰的同一性株。例如,C1菌株(亚株)可以是被突变以缺失一个或多个编码内源蛋白酶的基因和/或一个或多个编码内源几丁质酶的基因的菌株。例如,被本发明涵盖的C1菌株包括W1L#100I(prt-Δalp1Δchi1Δalp2Δpyr5)保藏号CBS141153、UV18-100f(prt-Δalp1,Δpyr5)保藏号CBS141147、W1L#100I(prt-Δalp1Δchi1Δpyr5)保藏号CBS141149和UV18-100f(prt-Δalp1Δpep4Δalp2,Δprt1Δpyr5)保藏号CBS141143。
值得注意的是,最近的论文(Marin-Felix等,2015,Mycologica,3:619-63)提出了在几种判据例如温度生长、在培养物中的有性形态和分生孢子性质的基础上拆分毁丝霉(Myceliophthora)属。根据所述提出的判据,C1属于Thermothelomyce属heterothallica/thermophila种。因此,根据Marin-Felix的论文,C1的更新名是Thermothelomycesthermophila菌株C1。
表达构建物
术语“表达构建物”、“DNA构建物”或“表达盒”在本文中可互换使用,并且是指人工组装或分离的核酸分子,其包含编码感兴趣的蛋白的核酸序列并且被组装使得所述感兴趣的蛋白质在靶宿主细胞中表达。表达构建物通常包含可操作连接到编码所述感兴趣的蛋白质的核酸序列的适合的调控序列。表达构建物还可以包括编码选择标志物的核酸序列。
术语“核酸序列”、“核苷酸序列”和“多核苷酸”在本文中用于指称采取分开的片段的形式或作为较大构建物的组分的脱氧核糖核苷酸(DNA)、核糖核苷酸(RNA)及其修饰形式的聚合物。核酸序列可以是编码序列,即编码细胞中的终产物例如蛋白质的序列。核酸序列也可以是调控序列例如启动子。
术语“肽”、“多肽”和“蛋白质”在本文中用于指称氨基酸残基的聚合物。术语“肽”通常指由2至50个氨基酸构成的氨基酸序列,而“蛋白质”指由超过50个氨基酸残基构成的氨基酸序列。
与参比序列“同源的”序列(例如核酸序列和氨基酸序列)在本文中是指所述序列之间的百分同一性,其中所述百分同一性为至少70%,优选为至少80%、至少85%、至少90%、至少95%、至少98%或至少99%。每种可能性代表了本发明的独立实施方式。同源核酸序列包括与密码子用法和遗传密码的简并性相关的变异。
序列同一性可以使用本领域中已知的核苷酸/氨基酸序列比较算法来确定。
术语“调控序列”是指控制编码序列的表达(转录)的DNA序列,例如启动子和终止子。
术语“启动子”是指在体内或体外控制或指导另一个DNA序列的转录的调控DNA序列。通常,启动子位于所述被转录序列的5'区中(即在所述被转录序列之前,位于其上游)。启动子可以整体源自于本源来源,或者由源自于自然界中存在的不同启动子的不同元件构成,或甚至包含合成的核苷酸区段。启动子可以是组成型(即启动子活化不受诱导剂调控,并且因此转录速率是恒定的)或诱导型的(即启动子活化由诱导剂调控)。在大多数情况下,调控序列的确切边界尚未被完全确定,并且在某些情况下不能被完全确定,因此某些变种的DNA序列可能具有相同的启动子活性。
术语“终止子”是指调控转录终止的另一个调控DNA序列。终止子序列被可操作连接到待转录的核酸序列的3′端。
术语“C1启动子”和“C1终止子”是指适合用于C1中,即能够在C1中指导基因表达的启动子和终止子序列。根据某些实施方式,所述C1启动子/终止子源自于嗜热毁丝霉(Myceliophthora thermophila)C1的内源基因。例如,在某些实施方式中,所述C1启动子是hex1(伏鲁宁体)启动子。示例性的hex1启动子序列如SEQ ID NO:1所示。在另外的实施方式中,所述C1启动子是chi1(几丁质酶1)启动子。示例性的chi1启动子序列如SEQ ID NO:2所示。
根据某些实施方式,所述C1启动子/终止子源自于嗜热毁丝霉(Myceliophthorathermophila)C1外源的基因。例如,可以使用bgl启动子。
术语“可操作连接”意味着所选核酸序列在调控元件(启动子或终止子)附近,以允许所述调控元件调控所述所选核酸序列的表达。
术语“信号肽”或“信号序列”在本文中可互换使用,并且是指通常存在于新合成的多肽链的N-端,并在宿主细胞中将所述蛋白质导向分泌途径的短肽(通常长为5-30个氨基酸)。所述信号肽通常随后被去除。“C1信号肽”指示适合用于C1,即能够指导C1中表达的蛋白质进入C1的分泌途径的信号肽。根据某些实施方式,所述C1信号肽源自于嗜热毁丝霉(Myceliophthora thermophila)C1的内源基因。例如,在某些实施方式中,所述C1信号肽是源自于Gla1(葡萄糖淀粉酶1,C1)的信号肽。编码Gla1信号肽的示例性序列示出在SEQ IDNO:23的第1-20位中。在另外的实施方式中,所述C1信号肽是源自于Cbh1(纤维二糖水解酶1,C1)的信号肽。编码Cbh1信号肽的示例性序列如SEQ ID NO:3所示。
根据某些实施方式,所述C1信号肽源自于对嗜热毁丝霉(Myceliophthorathermophila)C1来说外源的基因。例如,在某些实施方式中,所述C1信号肽源自于GlaA(葡萄糖淀粉酶A,曲霉(Aspergillus))。编码GlaA信号肽的示例性序列示出在SEQ ID NO:24的第1-18位中。
当在本文中使用时,当指称一个或多个核酸序列时,术语“同框”指示这些序列被连接成使得它们的正确阅读框得以保留。
根据本发明的某些实施方式,表达构建物包含可操作连接到同框融合的编码C1信号肽和流感病毒表面蛋白的核酸序列的C1启动子序列和C1终止子序列。
在某些实施方式中,所述表达构建物不含编码融合到所述流感病毒表面蛋白并促进其分泌的载体蛋白的核酸序列。
特定表达构建物可以通过各种不同的方法来组装,包括常规的分子生物学方法例如聚合酶链反应(PCR)、限制性内切酶消化、体外和体内组装方法以及基因合成方法或其组合。
流感病毒表面蛋白
血凝素,缩写为“HA”,是一种I型膜糖蛋白,其介导病毒与其宿主细胞通过所述宿主细胞上的含唾液酸受体的附连。HA分子在病毒中作为同三聚体存在。每个单体通常包含被称为HA1和HA2的两个结构域,其中HA2结构域包含将HA蛋白连接到病毒膜的跨膜区和小的胞质尾区。所述单体作为被称为HA0的75kDa的前体蛋白合成,其在病毒的表面处组装成三聚体蛋白。信号肽将所述HA0引导到宿主细胞的分泌途径中,并且在成熟蛋白中不存在。为了具有活性,所述HA0前体必须被宿主的细胞蛋白酶切割。在切割后产生对应于HA1和HA2结构域的两个亚基,其通过二硫键相连(并锚定到病毒的表面)。
除非另有定义,否则本文中使用的术语“血凝素”或“HA”是指流感病毒血凝素,特别是含有延伸到病毒粒子外部的胞外域、跨膜结构域和胞质尾区的全长蛋白。所述术语涵盖了HA0未切割形式以及成熟的HA1+HA2形式。
本发明的HA的亚型可以是流感A亚型H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15或H16。所述HA亚型也可以是流感B亚型。在特定实施方式中,所述HA亚型是感染人类的亚型。在某些实施方式中,所述HA亚型选自流感A亚型H1、H2和H3。在另外的特定实施方式中,所述HA亚型是流感B亚型。
神经氨酸酶,缩写为“NA”,是一种II型膜结合酶,其介导新的病毒后代从宿主细胞的释放。它作为四个相同的单体的四聚体存在于病毒表面上,每个单体通常包含胞质结构域、跨膜结构域、茎部结构域和带有酶活性位点的球状头部结构域。除非另有定义,否则本文中使用的术语“神经氨酸酶”或“NA”是指全长蛋白。
本发明的NA的亚型可以是流感A亚型N1、N2、N3、N4、N5、N6、N7、N8或N9或流感B亚型。在特定实施方式中,所述NA亚型是感染人类的亚型。在某些实施方式中,所述NA亚型选自流感A亚型N1和N2。在另外的特定实施方式中,所述NA亚型是流感B亚型。
来自于各种不同流感病毒株的HA和NA的核苷酸和蛋白质序列可公开获得,例如在美国国家生物技术信息中心(National Center for Biotechnology Information)(NCBI)的数据库中。HA和NA基因/蛋白质的示例性序列包括来自于流感毒株A/新喀里多尼亚/20/99(H1N1)、A/加利福尼亚/04/2009(H1N1)、A/乌拉圭/716/07(H3N2)(A/布里斯班/10/07样)、B/佛罗里达/04/2006:B山形谱系、A/波多黎各/08/1934(H1N1)和A/德克萨斯/50/2012(H3N2)的序列。每种可能性代表了本发明的独立实施方式。
HA和NA的遗传修饰的变体也可以被工程化到根据本发明的C1中,例如被称为“通用”HA和NA的变体。通用HA和NA是刺激针对多种流感毒株的保护的交叉反应性抗原,正如在例如Carter等,(2016)用于H1N1流感病毒的计算优化的广泛反应性血凝素疫苗的设计和表征(Design and Characterization of a Computationally Optimized BroadlyReactive Hemagglutinin Vaccine for H1N1 Influenza Viruses),J Virol.90(9).4720-34中所描述的。
所述流感病毒表面蛋白根据本发明被克隆并表达为包含其胞外域和跨膜结构域的膜结合蛋白。本发明的克隆的HA/NA基因通常通过用C1信号肽代替天然信号肽来修饰。
在某些实施方式中,所述HA来自于流感病毒株A/新喀里多尼亚/20/99(H1N1)(“HA新喀里多尼亚”)。带有其跨膜结构域而没有天然信号肽的HA新喀里多尼亚的氨基酸序列如SEQ ID NO:4所示。编码带有其跨膜结构域而没有天然信号肽的HA新喀里多尼亚的核苷酸序列如SEQ ID NO:5所示。
在某些实施方式中,所述HA来自于流感病毒株A/德克萨斯/50/2012(H3N2)(“HA德克萨斯”)。带有其跨膜结构域而没有天然信号肽的HA德克萨斯的氨基酸序列如SEQ ID NO:6所示。编码带有其跨膜结构域而没有天然信号肽的HA德克萨斯的核苷酸序列如SEQ IDNO:7所示。
在某些实施方式中,所述HA来自于流感病毒株A/波多黎各/08/1934(H1N1)(“HA波多黎各”)。带有其跨膜结构域而没有天然信号肽的HA波多黎各的氨基酸序列如SEQ ID NO:8所示。编码带有其跨膜结构域而没有天然信号肽的HA波多黎各的核苷酸序列如SEQ IDNO:9所示。
在某些实施方式中,所述HA来自于流感病毒株B/佛罗里达/04/2006:B山形谱系(“HA佛罗里达”)。带有其跨膜结构域而没有天然信号肽的HA佛罗里达的氨基酸序列如SEQID NO:10所示。编码带有其跨膜结构域而没有天然信号肽的HA佛罗里达的核苷酸序列如SEQ ID NO:11所示。
在某些实施方式中,所述HA来自于流感病毒株A/加利福尼亚/04/2009(H1N1)(“HA加利福尼亚”)。带有其跨膜结构域而没有天然信号肽的HA加利福尼亚的氨基酸序列如SEQID NO:12所示。编码带有其跨膜结构域而没有天然信号肽的HA加利福尼亚的核苷酸序列如SEQ ID NO:13所示。
在某些实施方式中,所述NA来自于流感病毒株A/新喀里多尼亚/20/99(H1N1)(“NA新喀里多尼亚”)。全长NA新喀里多尼亚的氨基酸序列如SEQ ID NO:14所示。编码全长NA新喀里多尼亚的核苷酸序列如SEQ ID NO:15所示。
为了在C1中表达,优选地将所述克隆的HA/NA基因进行用于C1表达的密码子优化,意味着所克隆的基因在感兴趣的流感病毒表面蛋白的氨基酸序列的基础上,使用C1的密码子用法来设计。
根据某些示例性实施方式,所述基因在C1启动子和C1终止子下克隆。
在hex1启动子和cbh1终止子下编码带有HA新喀里多尼亚的跨膜结构域并带有Cbh信号序列的HA新喀里多尼亚的示例性表达构建物,如SEQ ID NO:16所示。编码所述HA的序列对应于SEQ ID NO:16的第2920-4563位。这个区段可以用编码不同HA蛋白或NA蛋白的核苷酸序列代替,以获得编码不同HA蛋白或NA蛋白的表达构建物。
包含如SEQ ID NO:16所示的表达构建物的示例性表达载体如SEQ ID NO:17所示,并示出在图2C中。
遗传工程改造的C1
根据本发明的被遗传工程改造以生产流感病毒表面蛋白的C1细胞,通过在C1细胞中、特别是在C1细胞的核中引入如上所述的包含编码流感病毒表面蛋白的核酸的表达构建物来产生。具体来说,根据本发明的遗传修饰意味着将所述表达构建物合并到宿主基因组。
在某些实施方式中,C1被遗传工程改造以生产单一流感病毒蛋白。在其他实施方式中,C1被遗传工程改造以生产多种不同的流感病毒蛋白。“多个”指至少两个。
表达构建物在C1细胞中的引入,即C1的转化,可以通过本领域中已知的用于转化丝状真菌的方法来进行。例如,转化可以使用本领域中已知并且也在下面的实施例部分中描述的原生质体转化方法来进行。
为了便于被转化细胞的容易的选择,可以将选择标志物转化到所述C1细胞中。“选择标志物”指示编码赋予在未转化的细胞中不存在的特定类型的表型的基因产物的多核苷酸,所述表型例如抗生素抗性(抗性标志物)、利用某些资源的能力(利用/营养缺陷标志物)或可以例如通过光谱测量检测的报告蛋白的表达。在食品或制药工业中,营养缺陷标志物作为选择手段通常是优选的。所述选择标志物可以在与所述表达构建物共同转化的分开的多核苷酸上,或者在与所述表达构建物相同的多核苷酸上。
转化后,通过将所述C1细胞在例如根据所选选择标志物的选择性培养基上培养,来选择阳性转化子。
所述感兴趣的蛋白质的表达可以使用标准方法来检测。所述检测可以通过检测所述蛋白质本身例如通过各种不同类型的染色或通过免疫学方法,或通过检测它的活性例如通过血凝测定法来进行。在检测之前,可以将所述蛋白质用各种不同的技术例如SDS-PAGE进行分离。示例性程序描述在下面的实施例部分中。
选择最佳生产菌株并用于发酵中,以产生大量所需基因产物。
蛋白质生产
为了生产所述蛋白质,将所述遗传修饰的C1细胞在允许编码所述流感病毒表面蛋白的核酸表达的条件下培养。用于摇瓶和搅拌釜发酵的示例性培养条件在下面的实施例部分中详述。
疫苗组合物
根据本发明的疫苗或免疫原性组合物包含如上所述生产的流感病毒表面蛋白和可药用载体。
术语“免疫原性”或“免疫原性的”是指物质刺激或引发免疫应答的能力。免疫原性通过例如在用物质激发免疫活性生物体后确定特异性针对所述物质的抗体的存在来测量。特异性针对所述物质的抗体的存在和它们的量通过本领域中已知的方法,例如使用ELISA测定法来检测。
在某些实施方式中,所述疫苗被配制成免疫接种剂型,所述剂型包括源自于FDA为特定流感季所推荐的三个流感病毒株的纯化的HA蛋白。功能性免疫可以使用对结合到流感血凝素、阻断流感病毒凝集红细胞的能力或中和所述流感病毒的抗体进行定量的测定法来测量。使用重组HA疫苗的保护性免疫应答也可以在对流感感染易感的动物中或在人类激发研究中测量。
本发明的疫苗包含重组HA和/或NA蛋白,并任选地包含佐剂。正如下文中示例的,令人吃惊地发现根据本发明在C1中生产的重组HA蛋白在小鼠中引发体液应答,即使在不与佐剂一起给药时。
所述疫苗可以被配制成用于以许多不同方式之一给药,包括通过肌肉内、鼻内、真皮内、口服、腹膜内、皮下或透皮给药方式。
在某些实施方式中,所述疫苗被配制成用于肠胃外给药。在某些特定实施方式中,所述疫苗被配制成用于肌肉内给药。在其他特定实施方式中,所述疫苗被配制成用于真皮内给药。
在另外的特定实施方式中,所述疫苗被配制成用于粘膜递送,特别是鼻内递送。
所述疫苗组合物可以含有各种不同的赋形剂,包括稳定剂、缓冲剂或防腐剂。
根据某些实施方式,根据本发明的疫苗组合物不含佐剂。
在某些应用中,可以在所述疫苗制剂中包括可药用佐剂。所述佐剂的选择部分由所述疫苗的给药方式决定。
鼻内佐剂的非限制性实例包括壳聚糖粉、PLA和PLG微球、QS-21、磷酸钙纳米粒子(CAP)和mCTA/LTB(突变的霍乱毒素E112K和不耐热肠毒素的五聚体B亚基)。
用于其他给药方式的佐剂的实例包括采取凝胶形式的无机佐剂(氢氧化铝/磷酸铝)、磷酸钙、细菌佐剂例如单磷酰脂质A和胞壁肽、颗粒佐剂例如ISCOMS(“免疫刺激性复合物”)、脂质体和生物可降解微球、基于油性乳液和乳化剂的佐剂例如IFA(“不完全弗氏佐剂”)、SAF(“Syntex佐剂制剂”)、皂苷类(例如QS-21)、角鲨烯/角鲨烷、合成佐剂例如非离子型嵌段共聚物、胞壁肽类似物、合成脂质A、合成多核苷酸和聚阳离子佐剂。
佐剂以佐剂量使用,所述佐剂量可以随着佐剂、宿主动物和免疫原而变。典型的量可以在每次免疫接种约1微克至约1mg之间变化。本领域技术人员了解,适合的浓度和量可以被容易地确定。
序列表
Figure BDA0002386913300000191
Figure BDA0002386913300000201
Figure BDA0002386913300000211
Figure BDA0002386913300000221
提出下述实施例是为了充分说明本发明的某些实施方式。然而,它们绝不应该被解释为限制本发明的广阔范围。在不背离本发明的范围的情况下,本领域技术人员可以容易地设计出本文公开的原理的许多变型和修改。
实施例
实施例1–血凝素(HA)和神经氨酸酶(NA)在嗜热毁丝霉(Myceliophthora thermophila)(C1)中的表达
设计了几个系列的表达构建物,用于在C1中表达各个不同流感病毒株的重组HA蛋白。在本研究中测试的HA蛋白详述在下面的表1中。所述表达构建物详述在图1-4中(图1-3-带有HA的构建物;图4-带有NA的构建物。P=启动子,ss=信号序列,T=终止子)。每个构建物中包括的HA类型或NA用粗体标注。用于描述所述构建物中的各种不同元件的缩略语表提供在图5中。所述构建物的产生详细描述在下文“材料和方法”下。
表1.HA蛋白/病毒株
Figure BDA0002386913300000222
Figure BDA0002386913300000231
最初,将HA在cbh1(纤维二糖水解酶1)或chi1(几丁质酶1)启动子下表达,并融合到作为载体的分泌良好的黑曲霉葡萄糖淀粉酶A(GlaA),以促进HA分泌到细胞外培养基中。将所述HA基因融合到所述glaA基因的编码GlaA的催化结构域的部分。将KEX2切割位点(VISKR)设计在所述glaA和HA基因之间,以在高尔基体中在所述位点切割后获得分开的HA蛋白。所述构建物还包括用于检测和纯化目的的C-端FLAG标签。在这个初始系列的表达构建物中,表达的HA不带有它们的跨膜结构域(TMD)和胞质尾区。
在所述表达构建物的改良版本中,测试了hex1(六角形过氧化物酶体,伏鲁宁体)启动子,其被认为是一种早期组成型启动子,与另外两个启动子相比更早被诱导。
对于HA新喀里多尼亚来说,制造了如下所述的另外的构建物变体:
-具有cbh1或chi1启动子,不具有GlaA载体蛋白,但具有cbh1信号序列用于靶向到ER的构建物。
-具有chi1启动子和作为载体蛋白的Gla1(C1葡萄糖淀粉酶1)的构建物。
-具有作为载体蛋白的EG2(内切葡聚糖酶2)的构建物。
-具有hex1启动子、GlaA载体蛋白并且没有FLAG标签的构建物。
在蛋白水解稳定性测定法的基础上选择用于表达所述构建物的C1宿主菌株。简单来说,在几种候选C1宿主菌株(参见下面的表2)的发酵终点(EOF)培养基中测试使用杆状病毒表达系统(Protein Sciences Corporation,Meriden USA)生产的HA的蛋白水解稳定性。与测试的其他菌株相比,在菌株D240(高纤维素酶(HC)菌株)和D389(低纤维素酶(LC)菌株)的培养过滤液存在下观察到更少的HA降解。因此,选择D240和D389作为用于生产重组HA的宿主菌株。在晚些时候的实验中,也试验了D382用于HA的重组表达。
转化如下文在“材料和方法”下所述来进行。
在转化后,收集转化子并将其在96孔板中培养。筛选培养基中葡萄糖淀粉酶(如果适用)和血凝素的表达。将阳性转化子进一步在摇瓶中培养,并使用印迹技术和HA活性测定法评估HA的表达。结果概述在图1A-B中。
得到的转化子的分析揭示,当省略FLAG-标签序列时,重组HA_NC在C1中更好地表达。在没有该标签的情况下,在摇瓶发酵的细胞外培养基中检测到含有HA的高分子量物质(130–160kDa),正如在使用针对HA_NC的单克隆抗体的Western印迹上所示。在所述信号强度的基础上,如果外推到大规模发酵,这代表了培养基中大约30mg/L,达到10g/L的总细胞外蛋白水平。与在HC菌株中相比,在LC菌株中HA_NC的表达水平更高。此外,发现了高水平的细胞内和/或与细胞壁结合的HA,其据估算至少与培养基中存在的同样多。
使用含有带有hex1启动子的构建物的转化子获得了最高表达。
设计了第二系列的表达构建物,在其中测试了HA的本源跨膜结构域(TMD)或来自于T4噬菌体纤维蛋白的重组C-端三聚化结构域(T4 foldon结构域)的存在。添加所述T4foldon结构域是为了促进HA在细胞外分泌后的稳定性。将8个Gly残基的连接物(“8xG”)克隆在所述HA与T4 foldon结构域之间。添加所述TMD是为了测试它对得到的HA的表达水平和活性的影响(含有所述TMD的HA构建物预期不被分泌,而是存在于细胞内或与细胞壁结合)。此外,在HA与GlaA载体之间测试了含有5个Gly残基(“5xG”)的区段的改良的KEX2蛋白水解位点,以便测试这种改良的连接物是否导致获得更高水平的分开的HA蛋白。用于这个系列的启动子是hex1,这是基于在前一系列中使用这个启动子获得了更强的表达。所述系列中的各种不同构建物详述在图2A-2B中。图2C示出了含有构建物Phex1-ssCbh-NC-TMD-Tcbh1的表达载体(所述表达载体的序列如SEQ ID NO:17所示)。图2D示出了用于转化的片段。
正如使用所述第一系列所看到的,在不带有载体GlaA的情况下实现更好的表达。当所述载体存在时,只能看到Gla-HA融合蛋白,即使当在所述两个组成部分之间使用改良的蛋白水解位点时。C-端T4-foldon结构域的存在对细胞外检测到的HA水平具有正面影响,然而得到的HA似乎是无活性的(在血凝测定法中阴性结果)。为了进一步评估融合到T4foldon结构域的HA的活性,将从构建物Phex1-ssCbh-NC-8xG-T4foldon-Tcbh1表达的HA纯化,并在小鼠中在免疫原性测定法中测试(参见下面的实施例2)。没有观察到功能性免疫原性。
HA的天然跨膜结构域对表达水平(细胞内或细胞壁结合的)具有正面影响。此外,得到的蛋白质在HA活性测定法中具有高活性。为了进一步评估带有其TMD的HA的活性,将从构建物Phex1-ssCbh-NC-TMD-Tcbh1表达的HA纯化,并在小鼠中在免疫原性测定法中测试(参见下面的实施例2)。观察到特别有效的功能性免疫原性,正如将在下文更详细描述的。
设计了第三系列的表达构建物,其中将不同类型、包括迄今为止没有被测试过的类型的HA在hex1启动子下表达,带有cbh信号序列,没有载体,并在C-端带有T4 foldon结构域或TMD。在这个系列中,所述T4 foldon结构域在没有Gly连接物或在HA与T4 foldon结构域之间具有改良连接物的情况下克隆。此外,还测试了神经氨酸酶(NA)的两个变体。所述系列中的各种不同构建物详述在图3-4中。
C1能够生产不同类型的HA。证实了通过C1菌株可以生产每升50–100mg蛋白之间的每种HA类型。在一种或多种情况下,实现了每升~300mg的表达水平。
正如使用所述第二系列所看到的,C-端T4-foldon结构域的存在对细胞外检测到的HA水平具有正面影响,然而得到的HA似乎是无活性的(在血凝测定法中阴性结果),即使在没有Gly连接物或在HA与T4 foldon之间具有改良连接物的情况下。HA的天然跨膜结构域同样显示出对表达水平(细胞内或细胞壁结合的)的正面影响。此外,所述得到的蛋白质在HA活性测定法中具有高活性。A型和B型流感蛋白两者都被成功表达,并被发现是具有生物活性的。
对于NA来说,发现它在C1中良好表达,并且在细胞外和细胞内均可以检测到。
材料和方法
HA蛋白标准品
HA蛋白标准品从Protein Sciences Corporation(Meriden,USA)获得。这些蛋白质使用杆状病毒表达载体系统在昆虫细胞中生产,并在保存生物学活性和三级结构的条件下纯化至>90%的纯度。所述蛋白质标准品如制造商所推荐的储存在4℃下。此外,从国家生物标准品和对照研究所(National Institute for Biological Standards and Control)(NIBSC)订购了一批鸡蛋来源的来自于A/H1N1 A/新喀里多尼亚/20/99(NC)的HA。将该样品分成等分试样并如制造商所推荐的储存在-20℃下。
C1菌株
在本研究中测试的候选C1生产宿主在表2中指明。HC是指C1高纤维素酶菌株,LC是指C1低纤维素酶菌株。Prt-是指的蛋白酶缺陷,Δalp1是指主要分泌蛋白酶的基因破坏,Δalp2是指高表达的空泡蛋白酶的基因破坏,Δchi1是指在C1中高表达的细胞外C1几丁质酶的基因破坏。所有菌株都是Δpyr5。
表2.C1宿主菌株
C1宿主菌株 保藏信息 编号
HC prt- D202
HC prt-Δalp1 “UV18-100f”保藏号CBS141147 D240
HC prt-Δalp1Δpep4 D249
HC prt-Δalp1Δpep4Δalp2,Δprt1 “UV18-100f”保藏号CBS141143 D270
LC prt-Δalp1 D326
LC prt-Δalp1Δchi1 “W1L#100I”保藏号CBS141149 D382
LC prt-Δalp1Δchi1Δalp2 “W1L#100I”保藏号CBS141153 D389
表达载体的构建
本文中用于C1中的异源蛋白质生产的表达载体,pP-ssglaA-glaA-HA-FLAG-标签,示出在图6中。这个表达载体利用良好分泌的黑曲霉葡萄糖淀粉酶A蛋白作为载体,促进异源蛋白在细胞外培养基中的分泌。将HA基因融合到glaA基因的编码黑曲霉葡萄糖淀粉酶A的催化结构域的部分。将FLAG-标签序列C-端融合并且并入,用于检测和纯化目的。所述FLAG-标签是短的、亲水的8个氨基酸的肽,具有序列Asp-Tyr-Lys-Asp-Asp-Asp-Asp-Lys(DYKDDDDK,SEQ ID NO:32)。
第一系列构建物的产生
对于HC转化实验来说,使用了下述基础克隆载体:
用EcoRV–EcoRI消化的pVJ1(Pcbh1_glaA_kex2_基因X_Tcbh1)。
EcoRV位于kex2位点中,并且EcoRI紧靠基因X的终止密码子之后。
该载体被用于连接下述合成的基因片段,所述基因片段已在分泌到培养基中的43种表达良好的基因的基础上对C1进行了密码子优化(所有合成的片段通过
Figure BDA0002386913300000281
亚克隆在pMK或pMS穿梭载体中):
-HA_NC_FLAG-标签x EcoRV–EcoRI(1577bp)
-HA_UR_FLAG-标签x EcoRV–EcoRI(1586bp)
-HA_FL_FLAG-标签x EcoRV–EcoRI(1655bp)
-HA_NC x EcoRV–EcoRI(1553bp)
对于LC转化实验来说,使用了下述基础克隆载体:
用EcoRV–EcoRI消化的pVJ6(Pchi1_glaA_kex2_感兴趣的基因_Tcbh1)。
EcoRV位于kex2位点中,并且EcoRI紧靠感兴趣的基因的终止密码子之后。
该载体被用于连接下述合成的基因片段(所有合成的片段通过
Figure BDA0002386913300000282
亚克隆在pMK或pMS穿梭载体中):
-HA_NC_FLAG-标签x EcoRV–EcoRI(1577bp)
-HA_UR_FLAG-标签x EcoRV–EcoRI(1586bp)
-HA_FL_FLAG-标签x EcoRV–EcoRI 1655bp)
-HA_NC x EcoRV–EcoRI(1553bp)
对于HA新喀里多尼亚来说,制造了如下所述的其他构建物变体:
*带有cbh1启动子或chi1启动子,没有GlaA载体蛋白,但带有cbh1信号序列用于靶向到ER的载体。该载体如下产生:
将克隆载体pCBHProm用SacI–BspHI消化,并分离含有cbh1启动子的1819bp片段。
将克隆载体pVJ1用SacI–EcoRI消化,并分离含有cbh1终止子和pUC骨架的3896bp片段。
将这两个片段在三路连接中与用PciI–EcoRI消化的含有sscbh1-HA_NC_FLAG-标签的合成片段(1617bp)连接。
将克隆载体pPchi1-linker-Tcbh1用NcoI–BspHI消化,并分离含有cbh1启动子–cbh1终止子和pUC骨架的5758bp片段。将所述载体用于与所述用PciI–EcoRI消化的含有sscbh1-HA_NC_FLAG-标签的合成片段(1617bp)的连接中。
*带有chi1启动子和作为载体蛋白的Gla1(C1同源物)的载体,其如下产生:
将克隆载体pPchi1-Gla1-XynB用BsrGI–EcoRI消化,并分离含有chi1启动子、Gla1载体蛋白的一部分和cbh1终止子的6609bp片段。
将克隆载体pPchi1-Gla1-XynB用BsrGI–MabI消化,并分离含有Gla1载体蛋白的一部分的783bp片段。
将这两个片段在三路连接中与用MabI–EcoRI消化的含有Gla1的一部分、KEX2位点和HA_NC_FLAG-标签的合成片段(1723bp)连接。
*带有作为载体蛋白的EG2的载体,其如下产生:
将克隆载体pPcbh1_EG2_Tcbh1用SacI–PciI消化,并分离含有cbh1启动子和EG2载体蛋白的一部分的3031bp片段。
将克隆载体pVJ1用SacI–EcoRI消化,并分离含有cbh1终止子和pUC骨架的3896bp片段。
将这两个片段在三路连接中与用PciI–EcoRI消化的含有EG2的一部分、KEX2位点和HA_NC_FLAG-标签的合成片段(1669bp)连接。
*带有“早期组成型”启动子hex1、GlaA载体蛋白和HA_NC并且没有FLAG-标签的载体,其如下产生:
将克隆载体pTcV1011用SacI–EcoRV消化,并分离含有hex1启动子、GlaA载体蛋白和KEX2位点的一部分的1643bp片段。
将克隆载体pVJ1用SacI–EcoRI消化,并分离含有cbh1终止子和pUC骨架的3896bp片段。
将这两个片段在三路连接中与用EcoRV–EcoRI消化的含有sscbh1-HA_NC的合成片段(1553bp)连接。
所有载体在XL1-blue(Stratagene)中产生。从所有载体,通过序列分析验证克隆连接部。
第三系列构建物的产生
使用NotI将HA或NA表达盒从它们的载体切下。使用BglII将pyr5选择标志物从它的载体(DNL35)切下。将两个片段与质粒骨架分开,并使用
Figure BDA0002386913300000301
SV凝胶和PCR净化系统(Promega)从凝胶纯化。将C1宿主D389和D382用单一HA或NA表达盒和pyr5标志物共转化。
转化和微量滴定板(MTP)培养
将表达载体用NotI消化以产生无外来DNA的表达盒。将这些表达盒与pyr5标志物共转化在pyr5缺陷的C1菌株中。
在含有蔗糖的基本培养基平板上制作每种菌株的96个转化子的纯化划线,并在35℃温育4天。将纯菌落转移到含有Caylase培养基的96孔板(母板)并在35℃温育。3天后,将每孔3μl培养物转移到含有生产培养基((NH4)2SO4,35mM;NaCl,7mM;KH2PO4,55mM;葡萄糖,0.5%;MgSO4,2mM;微量元素溶液;酪蛋白氨基酸,0.1%;生物素,4μg/L;青霉素20g/L;链霉素50g/L;10mM,用10M KOH将pH设定到5.5)的新的96孔板(子板),并将板温育72-96小时。随后测定上清液中所需的靶表达或酶活性。对于某些构建物来说,使用的子板培养基是生产培养基或改编的接种培养基(aIM),生长温度为35℃、30℃或35℃然后30℃的组合,并将子板温育48和72(aIM)hrs。
在含TMD的抗原的情况下,将100μl每种培养物(孔)从子板孔转移到96孔PCR板的孔。将其以4000rpm离心15分钟。除去培养液,并且每孔添加100μL提取缓冲液(50mM Tris-Cl pH 7.5,1mM EDTA,1%SDS,0.2%CHAPS)。将其充分混合,并在96℃温育5分钟。随后将所述板以4000rpm离心15分钟,并将上清液转移到新的96孔板。将20μL该上清液用于在PVDF膜上点样。随后将斑点印迹用BSA阻断并使用适合的抗体筛选。使用HRP偶联的第二抗体底物SuperSignalTM West Dura长时间底物(34075;ThermoFisher Scientific)可视化结合的抗体。图像使用Bio-Rad ChemiDoc制作。将微量滴定板或摇瓶来源的所选转化子的培养物样品按照标准技术,使用SDS-PAGE和western印迹进一步研究。所述western印迹使用与用于斑点印迹相同的抗体并以相似的方式进行筛选。
摇瓶培养条件
摇瓶培养实验在含有50ml培养基的300ml摇瓶中进行。将LC和HC在含有铵盐作为氮源和0.5%葡萄糖的如上所述的生长培养基中进行标准培养。两种菌株也在基本培养基(MM)和完全培养基(CM)中进行试验,所述培养基除了1%葡萄糖之外还含有作为氮源的硝酸盐、0.1%酪蛋白氨基酸(在CM的情况下)、0.5%YE(在CM的情况下)(和维生素)。培养在250rpm(1英寸/圈)和35℃下进行。
斑点印迹分析
将大多数获得的转化子通过斑点印迹分析进行筛选。在微量滴定板培养后,将板通过离心收获,并将上清液转移到新的96孔板。对于LC菌株来说,使用25μl上清液,对于HC菌株来说,使用12.5μl上清液。将样品在96℃变性5min,在冰上冷却并转移到PVDF膜。将斑点印迹用mAbαGlaA或mAbαHA_NC(AbCam ab66189)染色。
SDS-PAGE和Western分析
SDS-PAGE和Western印迹按照标准程序来进行。Western印迹使用碱性磷酸酶的显色使用NBT和BCIP作为底物来进行。Western印迹使用辣根过氧化物酶的显色使用ECL检测试剂,按照制造商(Invitrogen:
Figure BDA0002386913300000321
ECL#WP20005)的说明来进行。将下述方案用于显色的Western印迹的剥离(按照AbCam的温和剥离程序):
制备新鲜的剥离缓冲液(1L:15g甘氨酸,1g SDS,10ml Tween20,将pH调整到2.2),并将膜在所述剥离缓冲液中在RT温育10min(振摇)。舍弃缓冲液,并使用新鲜的剥离缓冲液重复所述程序。接下来,将膜用PBS清洗两次并用TBS-Tween20清洗两次。
2D凝胶电泳
在2D SDS-PAGE之前,使用Amicon Ultra 0.5ml 10K离心式滤器将样品10–20x浓缩,随后使用BioRad micro Biospin 6层析柱将样品脱盐,并使用BCA测定法(Pierce)确定蛋白质浓度。蛋白质样品使用BioRad ReadyPrep 2D清理试剂盒按照制造商的说明进行纯化。在纯化后,将蛋白质沉积物(~200μg)在200μl 2-D重新水合缓冲液1(BioRad)中重新水合,所述缓冲液含有:7M尿素,2M硫脲,4%CHAPS,50mM DTT,0.2%Bio-Lyte 3/10两性电解质(20%)和0.002%溴酚蓝。将重新水合的蛋白质样品装载在BioRad Ready Strip IPG条板(11cm pH 4-7)上,并在RT温育O/N。在IPG条板完全重新水合后,将所述条板按照制造商(BioRad)的说明聚焦。第二维在SDS-PAGE Criterion TGX 4-15%梯度凝胶(BioRad)上运行。将凝胶用于考马斯亮蓝染色或将蛋白质转移到PVDF。
血凝测定法
通常,流感病毒粒子在它们的表面上具有结合到细胞上的唾液酸受体的HA。所述病毒结合到红细胞,导致网格的形成。这种性质被称为血凝。如果在含有红细胞的样品中存在有功能的HA,则所述网格形成,其被可视为“留在溶液中”而不是红细胞沉淀到容器的底部。
对于HA在培养基中的分泌的快速检测来说,通过在V型底96孔板中将连续稀释的(过滤的)真菌培养上清液[在1xPBS(不含Ca2+和Mg2+)中,最终量为50μl]添加到等量(50μl)的1x PBS(不含Ca2+和Mg2+)中的清洗过的0.5%鸡红细胞,来测试培养物的血凝素活性。然后将板在RT温育1h。将样品与已知量的纯化的HA标准品(Protein Sciences Corp.或NIBSC)进行比较。
EG2活性测定
EG2活性通过azo-CMCase测定法(MegaZyme),按照制造商的说明来测量。
BCA测定
蛋白质含量通过BCA测定法(Pierce),按照制造商的说明来定量。
分泌的HA的纯化
在摇瓶培养后,将发酵液离心并收集上清液。将35ml上清液样品使用MilliporeAmicon Ultra滤器(截留分子量为10kDa)浓缩至总体积为300μl(>100x浓缩)。在装载到柱上之前,将样品通过离心进行澄清(在14000rpm下1min)。凝胶过滤在PBS中进行,并将100μl样品装载到24-ml Superdex 200柱上。样品使用1ml/min的流速进行处理,并收集0.5ml的级分(
Figure BDA0002386913300000331
Explorer系统1)。级分在Western印迹上使用针对HA_NC的单克隆抗体进行分析。
含有TMD的HA的纯化
含有TMD的HA使用提取缓冲液从菌丝体片段提取,并随后使用AEX-Capto QImpRes进行纯化。对于纯化程序,参见图7。
脱糖基化实验
将细胞外和细胞内级分两者用于脱糖基化实验中。EndoH(内切β-N乙酰基氨基葡萄糖苷酶;Roche 11 088 726 001)脱糖基化在供应商推荐的条件下进行。因此,反应在37℃下,在含有下述物质的缓冲液中进行O/N:20mM NaOAc pH 5.5,0.5mM PMSF(苯甲基磺酰氟),0.1Mβ-巯基乙醇和0.02%SDS。在添加10mU EndoH之前,将所述蛋白质样品在96℃下变性10min。样品通过SDS-PAGE和Western印迹进行分析,并用针对HA_NC的mAb(AbCamab66189)染色。PNGaseF(来自于Elizabethkingia miricola的肽N-糖苷酶F;Sigma-Aldrich G5166)脱糖基化在与EndoH脱糖基化相近的条件下进行,唯一的区别是添加Triton X-100至终浓度为0.1%。在蛋白质样品变性后,添加5UPNGaseF,并将样品在37℃温育O/N。将样品通过SDS-PAGE和Western印迹进行分析,并用针对HA_NC的mAb(AbCamab66189)进行染色。
体外KEX2加工
将细胞外和细胞内级分两者用于KEX2加工实验。样品以本源和变性形式进行测试。KEX2蛋白酶源自于酿酒酵母(Saccharomyces cerevisiae),在High-5昆虫细胞(AbCam;ab96554)中生产。KEX2蛋白酶切割在下述条件下进行:将级分在50mM Tris/HCl pH=7.5,5mM CaCl2,0.5mM PMSF和0.1%Triton X-100中温育。将蛋白质样品以本源或变性形式与80mU KEX2在37℃下温育4hrs。将样品通过SDS-PAGE和Western印迹进行分析,并用针对HA_NC的mAb(AbCam ab66189)和针对GlaA的单克隆抗体进行染色。
胰蛋白酶消化
部分胰蛋白酶消化在RT下,在50mM NaOAc pH=5.5缓冲液中进行。将细胞外样品与测定缓冲液和胰蛋白酶[TPCK胰蛋白酶(Pierce);储用溶液为50mg/ml(等分试样被储存在-70℃下),工作溶液为50ng/μl]混合。在t=0、t=2’、t=5’、t=10’、t=15’、t=20’、t=30’、t=45’和t=60’时获取样品。通过添加6x SDS-PAGE载样缓冲液并在96℃下变性5min来终止消化。将样品通过SDS-PAGE和Western印迹进行分析,并用针对HA_NC的mAb(AbCamab66189)和针对GlaA的单克隆抗体进行染色。
真菌菌丝体提取物
用于区分细胞内定位或细胞壁附连的HA的分级研究如图8中示意显示的来进行。简单来说,收集来自于摇瓶培养的细胞外培养基(Ex)(量被测量)并收获菌丝体。将菌丝体用冷的新鲜生产培养基清洗,称重,并在含有或不含SDS的清洗缓冲液中分成相等的部分。这个清洗步骤在RT下进行1hr,并将清洗培养基在SDS-PAGE上进行分析。将磨碎的菌丝体重悬浮以与原始摇瓶培养物中相同的g/体积比率重悬浮,在旋转平台上在RT下在试管中留置10分钟,然后将所述试管以14000rpm离心5分钟。将上清液在SDS-PAGE上进行分析。将剩余的沉积物再次重悬浮在相同体积的提取缓冲液中,所述缓冲液现在添加了Triton-X100以溶解膜。在通过离心除去上清液后,将最终的细胞沉积物重悬浮在SDS-PAGE样品缓冲液中。
真菌原生质体的制备
将C1 LC培养物如上所述在完全培养基中生长2天。产生原生质体并纯化。进行额外的清洗步骤以降低细胞壁片段污染原生质体的风险。
实施例2–在嗜热毁丝霉(Myceliophthora thermophila)(C1)中生产的HA的免疫 原性
进行了动物试验以测试在C1中生产的来自于A/新喀里多尼亚/20/99(H1N1)流感毒株的具有跨膜结构域的全长重组血凝素蛋白(rHA-TMD)的免疫原性。rHA-TMD的生物化学评估示出在图9中,其示出了SDS-PAGE、非变性PAGE和使用TEM负染色的寡聚体状态的分析。所述TEM图像中的放大倍数为x29000。比例尺=200nm。白色箭头指向~40nm的寡聚体。白色圆圈标出~15nm的寡聚体。
先前的免疫原性研究使用在C1中生产的来自于同一病毒株的rHA的分泌形式来进行。该rHA的跨膜结构域被截短,并且它含有在本源HA中不存在的另外的结构域(8-Gly结构域和T4 foldon结构域)。所述rHA-8Gly-T4构建物不诱导功能性抗体应答。然后提出带有跨膜结构域的构建物(rHA-TMD)可能诱导更好的免疫原性。
为此,8组8只Balb/C ByJ小鼠接受1至30μg范围内的3倍爬升剂量的在C1中生产的rHA-TMD的两次肌肉内(IM)注射,相隔4周提供。作为阴性对照,将5只小鼠按照相同的免疫接种方案用PBS免疫接种。在第27天和第49天收集血液样品,用于通过血凝抑制(HI)测定法进行抗体应答分析。
正如将在下文中更详细描述的,结果显示,早在C1中生产的全长rHA在小鼠中的单次注射后,特异性有功能的抗体应答已被诱导,其在第二次注射后被进一步增强。
材料和方法
测试的组合物
表3列出了在所述研究中测试的组合物。将通过Bradford技术定量的蛋白质含量用于注射药剂制备,所有组合物在使用之前储存在+5℃±3℃。
表3.测试的组合物
Figure BDA0002386913300000361
Figure BDA0002386913300000371
*在sp的Endosafe测试
动物信息
动物物种:小鼠
状态:SPF
株系:Balb/c ByJ小鼠
供应商:Charles River
年龄:在D0时9周龄
性别:雌性
体重:20-22g
通过着色进行个体识别
看护和维护:每日
饲养
场所:对于所有组来说4只动物/笼,笼子在符合L2生物安全性要求的空调建筑物中。
动物数目/笼:4
饮食:颗粒饲料(M20,SDS,DIETEX France,St Gratien,France)
水:自来水,随意取用,通过自动给水系统
检疫:N/A
适应环境:被指派用于研究的小鼠在免疫接种前适应它们的设计饲养条件5天。
组定义
组定义概述在表4中。
表4.组
Figure BDA0002386913300000381
研究时间表
研究时间表详述在表5中。
表5.研究时间表
Figure BDA0002386913300000382
临床监测
在免疫接种后,动物在工作日(从星期一至星期五)每日观察,并在第-1天和第27天称重。
生物学取样
对于所有动物,血液样品在D27在异氟烷麻醉下从眶后窦(ROS)或颌下静脉获取,并且在D49在通过颈动脉剖开放血后获取,在D49,麻醉通过经腹膜内途径在200μL体积下给药的Imalgène(1.6mg的氯胺酮)和Rompun(0.32mg的甲苯噻嗪)来进行。
对于体液应答测定法来说,在D27,将200μL血液收集在含有凝块活化剂和血清分离剂的小管(BD Microtainer SST ref 365951)中。在+37℃下2小时后,将血液以10,000rpm离心5分钟,并在分析之前将血清储存在-20℃下。
在D49:将1mL血液收集在含有凝块活化剂和血清分离剂的小管(BD VacutainerSST II Advance ref 367957)中。在+5℃下2天后,将血液以2000g离心20分钟,并在分析之前将血清储存在-20℃下。
血凝抑制(HI)测定法
所述测定法是基于流感病毒凝集红细胞的能力。含有针对HA的有功能的抗体的血清抑制所述血凝活性。在所述测定法中,将来自于流感免疫接种的动物的血清用流感病毒滴定,以便表征有功能的抗HA抗体的浓度。
试剂:
-96孔V型底板(NUNC)
-RDE(受体破坏酶):来自于霍乱弧菌(Vibrio cholerae)的III型神经氨酸酶,10mU/mL(Sigma)
-不含Ca++和Mg++的PBS(Gibco)
-TPCK胰蛋白酶(Thermo Scientific)
-鸡红细胞(“cRBC”):在PBS中10%用于血清处理,在PBS中0.5%用于HI测定法(Sanofi Pasteur)
-流感毒株A/新喀里多尼亚/20/99,澄清的尿囊液1900血凝单位(HAU)/50μL
所述滴定如下进行:将病毒在PBS中进行连续稀释(2倍),以便校准所述病毒悬液并获得4HAU/50μL的浓度。然后将校准的病毒(50μL)添加到V型96孔板中50μL的从1/10开始在PBS中的血清连续稀释液(2倍)上,并在室温温育1小时。然后向每个孔添加鸡红细胞(在PBS中0.5%)(50μL),并在室温下1小时后目测读取血凝的抑制(红色点)或血凝(粉色网络)。
为了消除针对HA的血清非特异性抑制剂,在HI测定法之前将每种血清用受体破坏酶(RDE)、鸡红细胞和TPCK胰蛋白酶处理。简单来说,向每种血清添加10mU/mL的RDE(对于1体积血清来说5体积RDE)。然后将所述混合物在+37℃温育18h,然后在+56℃下失活1h。为了冷却,将混合物“血清-RDE”在+4℃下放置30min至4小时之间。然后将所述“血清-RDE”混合物在室温下,在PBS中的10%cRBC上吸附30min(对于1体积血清来说5体积cRBC),然后在+5℃下以700g离心10min。收集上清液,并通过将10体积的RDE-RBC-热失活血清(稀释血清1:10)与1体积的0.4%胰蛋白酶(w/v,盐水中)在+56℃混合30min,来进行胰蛋白酶处理。然后进行HI,并且最终血清稀释度仍被当作1:10。
将病毒在PBS中进行连续稀释(2倍),以便校准所述病毒悬液并获得4HAU/50μL的浓度。然后将校准的病毒(50μL)添加到V型96孔板中50μL的从1/10开始在PBS中的血清连续稀释液(2倍)上,并在室温温育1小时。然后向每个孔添加鸡红细胞(在PBS中0.5%)(50μL),并在室温下1小时后目测读取血凝的抑制(红色点)或血凝(粉色网络)。
所述HI滴度值是完全抑制血凝的血清的最后稀释度的倒数。为确定为阴性的所有血清任意地给出对应于初始稀释度(1/10)的一半的5的值,以便进行统计分析。
为每种血清设置不存在非特异性凝集素的对照(每种血清的4个连续稀释度和cRBC,不含病毒)。在每个板上进行cRBC的对照(只有cRBC和PBS)和存在4HAU的病毒工作稀释液的对照。
观察和偏差
在D28,即从颌下静脉获取血样之后的那一天,发现来自于A组的小鼠患病,可能是因为它未能从这种干预恢复,并因此被安乐死。
结果
临床监测
从D1到D27,在所有组中观察到平均体重的增加。
体液应答
通过HI测定法,在D27和D49从所有动物收集的个体血清中测量到针对A/新喀里多尼亚/20/99(H1N1)引发的抗体应答。结果呈现在图10A-10B中。
在rHA的第一次注射后,在两个最低的C1-rHA剂量下没有诱导或诱导低的HI应答,妨碍了统计分析。尽管如此,结果仍然强烈建议C1-rHA确实诱导抗体应答。
在加强注射后,应答被进一步增强。C1-rHA诱导了显著的剂量依赖性HI效应,分别对于1和30μg剂量来说,平均HI滴度在108至830的范围内。
应该指出,在C1中生产的全长重组HA在小鼠中不诱导任何负面临床征兆。
在5天的发酵中C1可以容易地生产水平为1g/L的HA和其他抗原,因此:
在季节性流感疫苗中—分配的总药剂=146M/年
每份0.5mL的药剂被配制成含有:15μg的每种毒株的HA。
因此,3X 1000L规模的发酵批次能够供应2,175g的每年全球针对流感的HA/毒株的需求。
实施例3–HA的搅拌釜发酵
进行了实验以测量上述rHA-TMD在较大规模上,在使用分批和补料分批技术的搅拌釜式发酵罐中的生产水平。为此,使用MiniforsTM3L生物反应器来培养表达rHA-TMD的C1菌株D389。
表6概述了进行50hrs的一组初始实验的发酵条件。“分批”——在发酵开始时所指示的糖类浓度。“补料分批”——在补料中糖类的浓度。发酵在pH 7.5下使用1.5升的起始体积进行。
表6.发酵条件50hrs
运行编号 温度(℃) 分批 补料分批
R465F2 25 4%木糖
R465F4 35 1%木糖 47%木糖.
R465F5 35 1%葡萄糖 50%葡萄糖.
R465F6 35 4.7%葡萄糖
在发酵后,收集菌丝体并提取HA。
为了评估菌丝体浓度,测量菌丝体干重。简单来说,收集一定量的发酵液并清洗几次,以除去培养基和培养基组分例如发酵中间产物和分泌的蛋白质。然后将得到的材料在90℃下干燥24h并称重。发现所有发酵样品含有近似相同的菌丝体浓度。
HA的定量通过将为提取的HA获得的Western印迹信号与已知量的HA标准品进行比较来进行(图13)。
最佳批次的生产水平被计算为大约375mg/l,其等于170mg/l/天。
表7概述了进行98-137hrs的第二组实验的发酵条件和得到的HA生产水平。所述表示出了发酵终点(EOF)结果。
表7.发酵条件和HA生产水平
Figure BDA0002386913300000431
Figure BDA0002386913300000441
*干细胞质量
**估算值。
上面对特定实施例的描述将如此充分地揭示本发明的一般性质,以至于其他人可以通过应用当前的知识容易地修改和/或改编这些特定实施例以适应于各种不同应用,而无需过多实验并且不背离通用概念,因此,这些改编和修改应当并且打算被理解为在所公开的实施方式的等同性的含义和范围之内。应当理解,本文中采用的措词或术语是出于描述而非限制的目的。用于执行各种公开的化学结构和功能的手段、材料和步骤可以采取各种不同的可替代形式,而不背离本发明。
序列表
<110> 二进国际有限公司
<120> 在嗜热毁丝霉(MYCELIOPHTHORA THERMOPHILA)中生产流感疫苗
<130> DYD/001 PCT
<150> US 62/547,885
<151> 2017-08-21
<160> 32
<170> PatentIn version 3.5
<210> 1
<211> 2869
<212> DNA
<213> Artificial Sequence
<220>
<223> Promoter
<400> 1
ggccgctcta gaactagtac ggcgtgcaag tagtgtcttt ctttgcactc ccgccgtccc 60
agaagacgcc gcaacaagct gagcttgctg gaagccgaac aaaggcgtta cagagcacaa 120
acatagtggc agtgtaggaa ctctaactgg gaccaaaact acgggcccgg cagaaacgtt 180
ccccgccccg aagcgaaggc gaacgtcgaa aagcaagacc gggaccgctc gtcccaggat 240
tagccacgaa gttccagacc aagtatagga gtaaacgctc gctcgtcaaa acaattgtca 300
ccaatcagca ccacatcggc acataacaac cggttgcgga actcgcatgt gaacaacaag 360
cggctccggg ggagtgatcg gctcgggcgg atgacccgga ctcttccgcg cagcaactcg 420
gcgtgttgtt gacggcagta ctccgtagtt gccatgacaa cagtcaatgg cgtgcttcac 480
aaggtggaga gccgagaaag cacctcggca tgtacgagta tgtagatagt gtatcaagca 540
ggaagatggg ggttacttta tctcaatcag atgcctgtaa gcgagagccg agagcctgcc 600
ctgttgttga cacaattctg gcctgataac gagtgacaag cgctgggacg gcggctgggg 660
tcttttgctc gcggcttcag ctcaattcca atcctgggcc ggtgccgaac ggcccaatcg 720
cgagcgccca cgaaatcgga ggtcgaggaa agaaggctgg gcgagacgcg gcgacaagct 780
gtggcaaaat ggccaattga ggttctgggt cggctggtga tcaaccatgc atttcccagc 840
ccgcagattc tctttctctc tcgtgcagca gcggcaccag cagcagcagc agccaggggt 900
ttgaccaacc tctccgccca gccaccgata gtaaagatgc tgcctgcgta ttctgggctg 960
caggagttcc aagatctttc ggtctggcca ccagctgtca cgtcaccctc cacctttgga 1020
cgacgttgct ggaaaattcg aagccttcac taagataact atgccgtagc acttgcagcc 1080
ccggaagctg caagttgatt cttggagggc tctctccacc accaatacgg gagatctggc 1140
cccgcacttg aggaggctgg agtctcggat cgcccacttc gcgtcgccct gggccctggg 1200
ccctggggtg atgggcccgt tgccgtggtg gatggcagga gcttttcagc tctcaatggg 1260
cgaatgctac tccgtaggtc ggagtggctg gaagcggcgg aacggacagg gggaggttgg 1320
ggaaaatgct ccgcaggaag agcagggagt ggggagctgc ggtcggccct gtggagcccg 1380
tgcagggcca gctaatccaa ttcgggccac aataaacaag agagggcccc acatcatgta 1440
aacagaggct cagaagctcc tgccacactg ggagggtttc gaagtctgac gactgccaat 1500
ggaccccagc catcgcgagc acacagcagt tcgcacgctc ccattgggtt cctcatcacg 1560
cagtcgctct ccccgccaac cagcgccagg tccgggaaca gcggcgcaaa tgcgtatttg 1620
agggcgcctc gctcgagcaa cctgtgcctg accttctcct cctccttctg caccttgcat 1680
ctcgtcgcgt ccactcgcag gcaaccacac atcctcctcc tctcccaaaa cccccccgct 1740
ttttctttcc cttgttggaa ttcgattgaa aaagaagacg ggtccgtcta gagaccgcct 1800
tctcaccttt ctctcgactt ctttctagga aaagaagcaa gagtcattct tcttgtccac 1860
cttctggttc acggaaggtc gaggagaaga ttgcctctgc ccccaaagtc gccaacctgg 1920
actttgaagc acgtgttccg gtccctttca gtgtcttccc gtcctcgtac agggagtccg 1980
agaccgccac ccaaacccac tcccacgaag aggttgagat caagctcccc cagctcgccg 2040
gacgggaagg tcaacactct tcattccaag cccaagcaca tcttcctccc agcggagagg 2100
gtcgcttcag agaagaagag gtccgcatca ctcgtcaaga ggaacatcac cgccgtcccg 2160
gcatccgtga agagttcgtt caccgcgagg agcgtcaccg gtaagtttag tttttgtttt 2220
gattcaccac ccattgtctt ccccgccttt ttctttttct tcccttgctc tcttgcccct 2280
gtctagtgta gggcattgcc aaggccatct tcacacacac acaccccccc ccccccccac 2340
cctcagctgg gggggggggt ggcctgggtt gaccaaggga cggtgaagac tactactact 2400
tgagccactc aaacccatgc atgacacagg gttttccttt ttcttttctc ttttccttta 2460
actaaccaac cactccaaca ttagccctca gtcaacctac tccgagtctc gcatcgagtt 2520
cgatactgag caccgcactc acaactccgt cattgacgtt gctgagagcg agtatcgtgc 2580
ccgtgtccag cccaactacc gcaaggaagc ttccgtagtc ggtaccaccg tcgacggatc 2640
ccgcttcagc cacagccgca aggccagcag caccacctcc acccacaccg acgagtacac 2700
cgtcgatccc cctagccacc gccccgtcta caagaaggag tcggttgaag tcgccggtac 2760
cactgttgac ccccctgctc ctcgttcgac ctaccacgag caggtgaaca ttgttgaaga 2820
gaccgttgac gctcaccgtt acgctcctca acccaacaac aacaacacc 2869
<210> 2
<211> 1162
<212> DNA
<213> Artificial Sequence
<220>
<223> Promoter
<400> 2
gactagcagc acgcggcagg attcttcaaa attggctaaa acgcgttggc ggggtgctcc 60
aagctcgagt gtgatcgaat gggagcaaag catcgccgct tgagtcagcc cgggctcggc 120
cattgattgg gggtgcccat gtcagctcaa ggcagcaagc ggatagaagc gccgtgggaa 180
gactagcaac gcctgctctg ggcatggccg ctgaatgtct gctggttctc aacgacgcgg 240
ggaacttgtg caactggagc gaaatatcgg cttggcaggg gctccttcta ctttgggagg 300
agaactggca tcacccactc ggctctacgg cttgaagatg ccgtgtgtgg caaccaacag 360
gcactgaaaa ttcatgcagg cagaccccgt tctgggaagc aaaatgcagc agcgccttcc 420
ttggctctcg cgagctgtta gtagagcacg aacgaaactc gaccagtttg agggtctatc 480
acgctcccgt accgcaagaa ggatctcatg tagtaggact gagatgtttt ttttcttccc 540
ttcctacttt tttgtgcgct cttgaaggta ttaagaccat cacgatggga tacctacctc 600
ttcaaagcat acatggcacg gcaaccgacc ccccaaacgt taggtagcac gccagcgggc 660
ggatggccca tcgtggaatt cacggtctgg gcccgcggga ggattgcttg cacctgcgtg 720
ataatttcct gggacacccc cctgttcgcg gacagcgagc ccggatgtca acgacagcgg 780
acgcatcgtg gaagcgggtt gccgttctcc ctcccccccc cccccttttc tctccagggg 840
tggccctttt cccttctgag ctggcttggc taagttgggc ctcctcctat gaaaggctgc 900
cgttcccttt gcctccctag ggccgtcttc ttcccgccgc ctccctcttg gttcctgttc 960
aattcaacac cagacggcgt gctctccccg gccgttgcaa acgtcttgtt tgcgtccttt 1020
cgttgtgtgc ttctgccgtt gcagctcatc agtcgctcct ttactacggc ccggccatcc 1080
tcggccattc actcgttttc cgtgtgtgca gacgaacaaa cacatactca ccttgtattg 1140
ttaatatcac gtctcgtcca ta 1162
<210> 3
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Signal sequence
<400> 3
atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc t 51
<210> 4
<211> 548
<212> PRT
<213> Influenza virus
<400> 4
Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr Val
1 5 10 15
Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn Leu
20 25 30
Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile Ala
35 40 45
Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly Asn
50 55 60
Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile Val
65 70 75 80
Glu Thr Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Tyr Phe Ala
85 90 95
Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe Glu
100 105 110
Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr Val
115 120 125
Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Lys Ser Ser Phe Tyr
130 135 140
Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn Leu
145 150 155 160
Ser Lys Ser Tyr Val Asn Asn Lys Glu Lys Glu Val Leu Val Leu Trp
165 170 175
Gly Val His His Pro Pro Asn Ile Gly Asn Gln Arg Ala Leu Tyr His
180 185 190
Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg Arg
195 200 205
Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu Gly
210 215 220
Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile Ile
225 230 235 240
Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Phe Ala Leu
245 250 255
Ser Arg Gly Phe Gly Ser Gly Ile Ile Thr Ser Asn Ala Pro Met Asp
260 265 270
Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser Ser
275 280 285
Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro Lys
290 295 300
Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn Ile
305 310 315 320
Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile
325 330 335
Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His
340 345 350
Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr Gln
355 360 365
Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys
370 375 380
Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu Glu
385 390 395 400
Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp
405 410 415
Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg
420 425 430
Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val
435 440 445
Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe
450 455 460
Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys Asn
465 470 475 480
Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn Arg
485 490 495
Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln Ile
500 505 510
Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser
515 520 525
Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys
530 535 540
Arg Ile Cys Ile
545
<210> 5
<211> 1644
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide
<400> 5
gacaccatct gcatcggcta ccacgccaac aacagcaccg acaccgtcga cacggtcctc 60
gagaagaacg tcaccgtcac ccacagcgtc aacctgctcg aggacagcca caacggcaag 120
ctctgcctcc tcaagggcat cgcccccctc cagctcggca actgcagcgt cgccggctgg 180
atcctcggca accccgagtg cgagctgctc atcagcaagg agagctggtc gtacatcgtc 240
gagaccccca accccgagaa cggcacgtgc taccccggct acttcgccga ctacgaggag 300
ctgcgcgagc agctcagcag cgtcagctcg ttcgagcgct tcgagatctt ccccaaggag 360
agcagctggc ccaaccacac cgtcaccggc gtcagcgcca gctgctcgca caacggcaag 420
agcagcttct accgcaacct cctctggctc accggcaaga acggcctcta cccgaacctc 480
agcaagagct acgtcaacaa caaggagaag gaggtcctcg tcctctgggg cgtccaccac 540
ccccccaaca tcggcaacca gcgcgccctc taccacaccg agaacgccta cgtcagcgtc 600
gtcagcagcc actacagccg ccgcttcacc cccgagatcg ccaagcgccc caaggtccgc 660
gaccaggagg gccgcatcaa ctactactgg accctcctcg agcccggcga caccatcatc 720
ttcgaggcca acggcaacct gatcgccccc tggtacgcct tcgccctcag ccgcggcttc 780
ggcagcggca tcatcaccag caacgccccc atggacgagt gcgacgccaa gtgccagacc 840
ccccagggcg ccatcaacag cagcctcccg ttccagaacg tccaccccgt caccatcggc 900
gagtgcccca agtacgtccg cagcgccaag ctccgcatgg tcaccggcct ccgcaacatc 960
cccagcatcc agagccgcgg cctcttcggc gccatcgccg gcttcatcga gggcggctgg 1020
accggcatgg tcgacggctg gtacggctac caccaccaga acgagcaggg cagcggctac 1080
gccgccgacc agaagtcgac ccagaacgcc atcaacggca tcaccaacaa ggtcaacagc 1140
gtcatcgaga agatgaacac ccagttcacc gccgtcggca aggagttcaa caagctcgag 1200
cgccgcatgg agaacctcaa caagaaggtc gacgacggct tcctcgacat ctggacctac 1260
aacgccgagc tgctcgtcct cctcgagaac gagcgcaccc tcgacttcca cgacagcaac 1320
gtcaagaacc tgtacgagaa ggtcaagagc cagctcaaga acaacgccaa ggagatcggc 1380
aacggctgct tcgagttcta ccacaagtgc aacaacgagt gcatggagag cgtcaagaac 1440
ggcacctacg actaccccaa gtacagcgag gagagcaagc tcaaccgcga gaagatcgac 1500
ggcgtcaagc tcgagagcat gggcgtctac cagatcctcg ccatctacag caccgtcgcc 1560
agcagcctcg tcctcctggt cagcctcggc gccatctcgt tctggatgtg cagcaacggc 1620
agcctccagt gccgcatctg catc 1644
<210> 6
<211> 550
<212> PRT
<213> Influenza virus
<400> 6
Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly
1 5 10 15
His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp
20 25 30
Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile
35 40 45
Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys
50 55 60
Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln
65 70 75 80
Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn
85 90 95
Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val
100 105 110
Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Asn
115 120 125
Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Asn
130 135 140
Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Phe Lys
145 150 155 160
Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp Lys
165 170 175
Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile
180 185 190
Phe Leu Tyr Ala Gln Pro Ser Gly Arg Ile Thr Val Ser Thr Lys Arg
195 200 205
Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg
210 215 220
Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly
225 230 235 240
Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly
245 250 255
Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala
260 265 270
Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile
275 280 285
Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala
290 295 300
Cys Pro Arg Tyr Val Lys Gln Ser Thr Leu Lys Leu Ala Thr Gly Met
305 310 315 320
Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala
325 330 335
Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly
340 345 350
Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys
355 360 365
Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu
370 375 380
Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser
385 390 395 400
Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr
405 410 415
Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu
420 425 430
Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe
435 440 445
Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn
450 455 460
Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser
465 470 475 480
Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu
485 490 495
Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys
500 505 510
Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys
515 520 525
Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile
530 535 540
Arg Cys Asn Ile Cys Ile
545 550
<210> 7
<211> 1650
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide
<400> 7
caaaaacttc ctggaaatga caatagcacg gcaacgctgt gccttgggca ccatgcagta 60
ccaaacggaa cgatagtgaa aacaatcacg aatgaccgaa ttgaagttac taatgctact 120
gaactggttc agaattcctc aataggtgaa atatgcgaca gtcctcatca gatccttgat 180
ggagaaaact gcacactaat agatgctcta ttgggagacc ctcagtgtga tggcttccaa 240
aataagaaat gggacctttt tgttgaacga agcaaagcct acagcaactg ttacccttat 300
gatgtgccgg attatgcctc ccttaggtca ctagttgcct catccggcac actggagttt 360
aacaatgaaa gcttcaattg gaatggagtc actcaaaacg gaacaagttc tgcttgcata 420
aggagatcta ataatagttt ctttagtaga ttaaattggt tgacccactt aaacttcaaa 480
tacccagcat tgaacgtgac tatgccaaac aatgaacaat ttgacaaatt gtacatttgg 540
ggggttcacc acccgggtac ggacaaggac caaatcttcc tgtatgctca accatcagga 600
agaatcacag tatctaccaa aagaagccaa caagctgtaa tcccgaatat cggatctaga 660
cccagaataa ggaatatccc tagcagaata agcatctatt ggacaatagt aaaaccggga 720
gacatacttt tgattaacag cacagggaat ctaattgctc ctaggggtta cttcaaaata 780
cgaagtggga aaagctcaat aatgagatca gatgcaccca ttggcaaatg caagtctgaa 840
tgcatcactc caaatggaag cattcccaat gacaaaccat tccaaaatgt aaacaggatc 900
acatacgggg cctgtcccag atatgttaag caaagcactc tgaaattggc aacaggaatg 960
cggaatgtac cagagaaaca aactagaggc atatttggcg caatagcggg tttcatagaa 1020
aatggttggg agggaatggt ggatggttgg tacggtttca ggcatcaaaa ttctgaggga 1080
agaggacaag cagcagatct caaaagcact caagcagcaa tcgatcaaat caatgggaag 1140
ctgaatcgat tgatcgggaa aaccaacgag aaattccatc agattgaaaa agaattctca 1200
gaagtagaag ggagaattca ggaccttgag aaatatgttg aggacactaa aatagatctc 1260
tggtcataca acgcggagct tcttgttgcc ctggagaacc aacatacaat tgatctaact 1320
gactcagaaa tgaacaaact gtttgaaaaa acaaagaagc aactgaggga aaatgctgag 1380
gatatgggca atggttgttt caaaatatac cacaaatgtg acaatgcctg cataggatca 1440
atcagaaatg gaacttatga ccacgatgta tacagagatg aagcattaaa caaccggttc 1500
cagatcaagg gagttgagct gaagtcaggg tacaaagatt ggatcctatg gatttccttt 1560
gccatatcat gttttttgct ttgtgttgct ttgttggggt tcatcatgtg ggcctgccaa 1620
aagggcaaca ttaggtgcaa catttgcatt 1650
<210> 8
<211> 548
<212> PRT
<213> Influenza virus
<400> 8
Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr Val
1 5 10 15
Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn Leu
20 25 30
Leu Glu Asp Ser His Asn Gly Lys Leu Cys Arg Leu Lys Gly Ile Ala
35 40 45
Pro Leu Gln Leu Gly Lys Cys Asn Ile Ala Gly Trp Leu Leu Gly Asn
50 55 60
Pro Glu Cys Asp Pro Leu Leu Pro Val Arg Ser Trp Ser Tyr Ile Val
65 70 75 80
Glu Thr Pro Asn Ser Glu Asn Gly Ile Cys Tyr Pro Gly Asp Phe Ile
85 90 95
Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe Glu
100 105 110
Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Asn Thr
115 120 125
Asn Gly Val Thr Ala Ala Cys Ser His Glu Gly Lys Ser Ser Phe Tyr
130 135 140
Arg Asn Leu Leu Trp Leu Thr Glu Lys Glu Gly Ser Tyr Pro Lys Leu
145 150 155 160
Lys Asn Ser Tyr Val Asn Lys Lys Gly Lys Glu Val Leu Val Leu Trp
165 170 175
Gly Ile His His Pro Pro Asn Ser Lys Glu Gln Gln Asn Leu Tyr Gln
180 185 190
Asn Glu Asn Ala Tyr Val Ser Val Val Thr Ser Asn Tyr Asn Arg Arg
195 200 205
Phe Thr Pro Glu Ile Ala Glu Arg Pro Lys Val Arg Asp Gln Ala Gly
210 215 220
Arg Met Asn Tyr Tyr Trp Thr Leu Leu Lys Pro Gly Asp Thr Ile Ile
225 230 235 240
Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Met Tyr Ala Phe Ala Leu
245 250 255
Ser Arg Gly Phe Gly Ser Gly Ile Ile Thr Ser Asn Ala Ser Met His
260 265 270
Glu Cys Asn Thr Lys Cys Gln Thr Pro Leu Gly Ala Ile Asn Ser Ser
275 280 285
Leu Pro Tyr Gln Asn Ile His Pro Val Thr Ile Gly Glu Cys Pro Lys
290 295 300
Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn Ile
305 310 315 320
Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile
325 330 335
Glu Gly Gly Trp Thr Gly Met Ile Asp Gly Trp Tyr Gly Tyr His His
340 345 350
Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr Gln
355 360 365
Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Thr Val Ile Glu Lys
370 375 380
Met Asn Ile Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu Glu
385 390 395 400
Lys Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp
405 410 415
Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg
420 425 430
Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val
435 440 445
Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe
450 455 460
Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser Val Arg Asn
465 470 475 480
Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn Arg
485 490 495
Glu Lys Val Asp Gly Val Lys Leu Glu Ser Met Gly Ile Tyr Gln Ile
500 505 510
Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val Ser
515 520 525
Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys
530 535 540
Arg Ile Cys Ile
545
<210> 9
<211> 1647
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide
<400> 9
gacacaatat gtataggcta ccatgcgaac aattcaaccg acactgttga cacagtactc 60
gagaagaatg tgacagtgac acactctgtt aacctgctcg aagacagcca caacggaaaa 120
ctatgtagat taaaaggaat agccccacta caattgggga aatgtaacat cgccggatgg 180
ctcttgggaa acccagaatg cgacccactg cttccagtga gatcatggtc ctacattgta 240
gaaacaccaa actctgagaa tggaatatgt tatccaggag atttcatcga ctatgaggag 300
ctgagggagc aattgagctc agtgtcatca ttcgaaagat tcgaaatatt tcccaaagaa 360
agctcatggc ccaaccacaa cacaaacgga gtaacggcag catgctccca tgaggggaaa 420
agcagttttt acagaaattt gctatggctg acggagaagg agggctcata cccaaagctg 480
aaaaattctt atgtgaacaa aaaagggaaa gaagtccttg tactgtgggg tattcatcac 540
ccgcctaaca gtaaggaaca acagaatctc tatcagaatg aaaatgctta tgtctctgta 600
gtgacttcaa attataacag gagatttacc ccggaaatag cagaaagacc caaagtaaga 660
gatcaagctg ggaggatgaa ctattactgg accttgctaa aacccggaga cacaataata 720
tttgaggcaa atggaaatct aatagcacca atgtatgctt tcgcactgag tagaggcttt 780
gggtccggca tcatcacctc aaacgcatca atgcatgagt gtaacacgaa gtgtcaaaca 840
cccctgggag ctataaacag cagtctccct taccagaata tacacccagt cacaatagga 900
gagtgcccaa aatacgtcag gagtgccaaa ttgaggatgg ttacaggact aaggaacatt 960
ccgtccattc aatccagagg tctatttgga gccattgccg gttttattga agggggatgg 1020
actggaatga tagatggatg gtatggttat catcatcaga atgaacaggg atcaggctat 1080
gcagcggatc aaaaaagcac acaaaatgcc attaacggga ttacaaacaa ggtgaacact 1140
gttatcgaga aaatgaacat tcaattcaca gctgtgggta aagaattcaa caaattagaa 1200
aaaaggatgg aaaatttaaa taaaaaagtt gatgatggat ttctggacat ttggacatat 1260
aatgcagaat tgttagttct actggaaaat gaaaggactc tggatttcca tgactcaaat 1320
gtgaagaatc tgtatgagaa agtaaaaagc caattaaaga ataatgccaa agaaatcgga 1380
aatggatgtt ttgagttcta ccacaagtgt gacaatgaat gcatggaaag tgtaagaaat 1440
gggacttatg attatcccaa atattcagaa gagtcaaagt tgaacaggga aaaggtagat 1500
ggagtgaaat tggaatcaat ggggatctat cagattctgg cgatctactc aactgtcgcc 1560
agttcactgg tgcttttggt ctccctgggg gcaatcagtt tctggatgtg ttctaatgga 1620
tctttgcagt gcagaatatg catctga 1647
<210> 10
<211> 569
<212> PRT
<213> Influenza virus
<400> 10
Asp Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val
1 5 10 15
Lys Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu
20 25 30
Thr Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg
35 40 45
Thr Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp
50 55 60
Val Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys
65 70 75 80
Ala Ser Ile Leu His Glu Val Lys Pro Val Thr Ser Gly Cys Phe Pro
85 90 95
Ile Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg
100 105 110
Gly Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu
115 120 125
Lys Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro
130 135 140
Asn Ala Thr Ser Lys Ser Gly Phe Phe Ala Thr Met Ala Trp Ala Val
145 150 155 160
Pro Lys Asp Asn Asn Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val
165 170 175
Pro Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe
180 185 190
His Ser Asp Asp Lys Thr Gln Met Lys Asn Leu Tyr Gly Asp Ser Asn
195 200 205
Pro Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val
210 215 220
Ser Gln Ile Gly Ser Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro
225 230 235 240
Gln Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys
245 250 255
Thr Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val
260 265 270
Trp Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu
275 280 285
Ile Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys
290 295 300
Ser Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys
305 310 315 320
Pro Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr
325 330 335
Arg Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala Ile
340 345 350
Ala Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His
355 360 365
Gly Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu
370 375 380
Lys Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser
385 390 395 400
Leu Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met
405 410 415
Asp Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp
420 425 430
Leu Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu
435 440 445
Ser Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu
450 455 460
Glu Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile Gly
465 470 475 480
Asn Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp
485 490 495
Arg Ile Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr
500 505 510
Phe Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu
515 520 525
Asp Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu
530 535 540
Ala Val Thr Leu Met Leu Ala Ile Phe Ile Val Tyr Met Val Ser Arg
545 550 555 560
Asp Asn Val Ser Cys Ser Ile Cys Leu
565
<210> 11
<211> 1707
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide
<400> 11
gatcgaatct gcactggaat aacatcttca aactcacctc atgtggtcaa aacagccact 60
caaggggagg tcaatgtgac tggtgtgata ccactaacaa caacaccaac aaaatcttat 120
tttgcaaatc tcaaaggaac aaggaccaga gggaaactat gcccagactg tctcaactgc 180
acagatctgg atgtggcttt gggcagacca atgtgtgtgg ggaccacacc ttcggcgaaa 240
gcttcaatac tccacgaagt caaacctgtt acatccgggt gctttcctat aatgcacgac 300
agaacaaaaa tcaggcaact acccaatctt ctcagaggat atgaaaatat caggctatca 360
acccaaaacg tcatcgatgc ggaaaaggca ccaggaggac cctacagact tggaacctca 420
ggatcttgcc ctaacgctac cagtaagagc ggatttttcg caacaatggc ttgggctgtc 480
ccaaaggaca acaacaaaaa tgcaacgaac ccactaacag tagaagtacc atacatttgt 540
acagaagggg aagaccaaat cactgtttgg gggttccatt cagatgacaa aacccaaatg 600
aagaacctct atggagactc aaatcctcaa aagttcacct catctgctaa tggagtaacc 660
acacactatg tttctcagat tggcagcttc ccagatcaaa cagaagacgg aggactacca 720
caaagcggca ggattgttgt tgattacatg atgcaaaaac ctgggaaaac aggaacaatt 780
gtctaccaaa gaggtgtttt gttgcctcaa aaggtgtggt gcgcgagtgg caggagcaaa 840
gtaataaaag ggtccttgcc tttaattggt gaagcagatt gccttcatga aaaatacggt 900
ggattaaaca aaagcaagcc ttactacaca ggagaacatg caaaagccat aggaaattgc 960
ccaatatggg tgaaaacacc tttgaagctt gccaatggaa ccaaatatag acctcctgca 1020
aaactattaa aggaaagggg tttcttcgga gctattgctg gtttcctaga aggaggatgg 1080
gaaggaatga ttgcaggctg gcacggatac acatctcacg gagcacatgg agtggcagtg 1140
gcggcggacc ttaagagtac gcaagaagct ataaacaaga taacaaaaaa tctcaattct 1200
ttgagtgagc tagaagtaaa gaatcttcaa agactaagtg gtgccatgga tgaactccac 1260
aacgaaatac tcgagctgga tgagaaagtg gatgatctca gagctgacac tataagctcg 1320
caaatagaac ttgcagtctt gctttccaac gaaggaataa taaacagtga agatgagcat 1380
ctattggcac ttgagagaaa actaaagaaa atgctgggtc cctctgctgt agagatagga 1440
aatggatgct tcgaaaccaa acacaagtgc aaccagacct gcttagacag gatagctgct 1500
ggcaccttta atgcaggaga attttctctc cccacttttg attcactgaa cattactgct 1560
gcatctttaa atgatgatgg attggataac catactatac tgctctatta ctcaactgct 1620
gcttctagtt tggctgtaac attgatgcta gctattttta ttgtttatat ggtctccaga 1680
gacaacgttt catgctccat ctgtcta 1707
<210> 12
<211> 549
<212> PRT
<213> Influenza virus
<400> 12
Asp Thr Leu Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr Val
1 5 10 15
Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn Leu
20 25 30
Leu Glu Asp Lys His Asn Gly Lys Leu Cys Lys Leu Arg Gly Val Ala
35 40 45
Pro Leu His Leu Gly Lys Cys Asn Ile Ala Gly Trp Ile Leu Gly Asn
50 55 60
Pro Glu Cys Glu Ser Leu Ser Thr Ala Ser Ser Trp Ser Tyr Ile Val
65 70 75 80
Glu Thr Pro Ser Ser Asp Asn Gly Thr Cys Tyr Pro Gly Asp Phe Ile
85 90 95
Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe Glu
100 105 110
Arg Phe Glu Ile Phe Pro Lys Thr Ser Ser Trp Pro Asn His Asp Ser
115 120 125
Asn Lys Gly Val Thr Ala Ala Cys Pro His Ala Gly Ala Lys Ser Phe
130 135 140
Tyr Lys Asn Leu Ile Trp Leu Val Lys Lys Gly Asn Ser Tyr Pro Lys
145 150 155 160
Leu Ser Lys Ser Tyr Ile Asn Asp Lys Gly Lys Glu Val Leu Val Leu
165 170 175
Trp Gly Ile His His Pro Ser Thr Ser Ala Asp Gln Gln Ser Leu Tyr
180 185 190
Gln Asn Ala Asp Ala Tyr Val Phe Val Gly Ser Ser Arg Tyr Ser Lys
195 200 205
Lys Phe Lys Pro Glu Ile Ala Ile Arg Pro Lys Val Arg Asp Gln Glu
210 215 220
Gly Arg Met Asn Tyr Tyr Trp Thr Leu Val Glu Pro Gly Asp Lys Ile
225 230 235 240
Thr Phe Glu Ala Thr Gly Asn Leu Val Val Pro Arg Tyr Ala Phe Ala
245 250 255
Met Glu Arg Asn Ala Gly Ser Gly Ile Ile Ile Ser Asp Thr Pro Val
260 265 270
His Asp Cys Asn Thr Thr Cys Gln Thr Pro Lys Gly Ala Ile Asn Thr
275 280 285
Ser Leu Pro Phe Gln Asn Ile His Pro Ile Thr Ile Gly Lys Cys Pro
290 295 300
Lys Tyr Val Lys Ser Thr Lys Leu Arg Leu Ala Thr Gly Leu Arg Asn
305 310 315 320
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
325 330 335
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
340 345 350
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Leu Lys Ser Thr
355 360 365
Gln Asn Ala Ile Asp Glu Ile Thr Asn Lys Val Asn Ser Val Ile Glu
370 375 380
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn His Leu
385 390 395 400
Glu Lys Arg Ile Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu
405 410 415
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
420 425 430
Arg Thr Leu Asp Tyr His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
435 440 445
Val Arg Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
450 455 460
Phe Glu Phe Tyr His Lys Cys Asp Asn Thr Cys Met Glu Ser Val Lys
465 470 475 480
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ala Lys Leu Asn
485 490 495
Arg Glu Glu Ile Asp Gly Val Lys Leu Glu Ser Thr Arg Ile Tyr Gln
500 505 510
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Val Val
515 520 525
Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln
530 535 540
Cys Arg Ile Cys Ile
545
<210> 13
<211> 1590
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide
<400> 13
gacacattat gtataggtta tcatgcgaac aattcaacag acactgtaga cacagtacta 60
gaaaagaatc taagaggggt agccccattg catttgggta aatgtaacat tgctggctgg 120
atcctgggaa atccagagtg tgaatcactc tccacagcaa gctcatggtc ctacattgtg 180
gaaacaccta gttcagacaa tggaacgtgt tacccaggag atttcatcga ttatgaggag 240
ctaagagagc aattgagctc agtgtcatca tttgaaaggt ttgagatatt ccccaagaca 300
agttcatggc ccaatcatga ctcgaacaaa ggtgtaacgg cagcatgtcc tcatgctgga 360
gcaaaaagct tctacaaaaa tttaatatgg ctagttaaaa aaggaaattc atacccaaag 420
ctcagcaaat cctacattaa tgataaaggg aaagaagtcc tcgtgctatg gggcattcac 480
catccatcta ctagtgctga ccaacaaagt ctctatcaga atgcagatgc atatgttttt 540
gtggggtcat caagatacag caagaagttc aagccggaaa tagcaataag acccaaagtg 600
agggatcaag aagggagaat gaactattac tggacactag tagagccggg agacaaaata 660
acattcgaag caactggaaa tctagtggta ccgagatatg cattcgcaat ggaaagaaat 720
gctggatctg gtattatcat ttcagataca ccagtccacg attgcaatac aacttgtcaa 780
acacccaagg gtgctataaa caccagcctc ccatttcaga atatacatcc gatcacaatt 840
ggaaaatgtc caaaatatgt aaaaagcaca aaattgagac tggccacagg attgaggaat 900
atcccgtcta ttcaatctag aggcctattt ggggccattg ccggtttcat tgaagggggg 960
tggacaggga tggtagatgg atggtacggt tatcaccatc aaaatgagca ggggtcagga 1020
tatgcagccg acctgaagag cacacagaat gccattgacg agattactaa caaagtaaat 1080
tctgttattg aaaagatgaa tacacagttc acagcagtag gtaaagagtt caaccacctg 1140
gaaaaaagaa tagagaattt aaataaaaaa gttgatgatg gtttcctgga catttggact 1200
tacaatgccg aactgttggt tctattggaa aatgaaagaa ctttggacta ccacgattca 1260
aatgtgaaga acttatatga aaaggtaaga agccagctaa aaaacaatgc caaggaaatt 1320
ggaaacggct gctttgaatt ttaccacaaa tgcgataaca cgtgcatgga aagtgtcaaa 1380
aatgggactt atgactaccc aaaatactca gaggaagcaa aattaaacag agaagaaata 1440
gatggggtaa agctggaatc aacaaggatt taccagattt tggcgatcta ttcaactgtc 1500
gccagttcat tggtactggt agtctccctg ggggcaatca gtttctggat gtgctctaat 1560
gggtctctac agtgtagaat atgtatttaa 1590
<210> 14
<211> 470
<212> PRT
<213> Influenza virus
<400> 14
Met Asn Pro Asn Gln Lys Ile Ile Thr Ile Gly Ser Ile Ser Ile Ala
1 5 10 15
Ile Gly Ile Ile Ser Leu Met Leu Gln Ile Gly Asn Ile Ile Ser Ile
20 25 30
Trp Ala Ser His Ser Ile Gln Thr Gly Ser Gln Asn His Thr Gly Val
35 40 45
Cys Asn Gln Arg Ile Ile Thr Tyr Glu Asn Ser Thr Trp Val Asn His
50 55 60
Thr Tyr Val Asn Ile Asn Asn Thr Asn Val Val Ala Gly Lys Asp Lys
65 70 75 80
Thr Ser Val Thr Leu Ala Gly Asn Ser Ser Leu Cys Ser Ile Ser Gly
85 90 95
Trp Ala Ile Tyr Thr Lys Asp Asn Ser Ile Arg Ile Gly Ser Lys Gly
100 105 110
Asp Val Phe Val Ile Arg Glu Pro Phe Ile Ser Cys Ser His Leu Glu
115 120 125
Cys Arg Thr Phe Phe Leu Thr Gln Gly Ala Leu Leu Asn Asp Lys His
130 135 140
Ser Asn Gly Thr Val Lys Asp Arg Ser Pro Tyr Arg Ala Leu Met Ser
145 150 155 160
Cys Pro Leu Gly Glu Ala Pro Ser Pro Tyr Asn Ser Lys Phe Glu Ser
165 170 175
Val Ala Trp Ser Ala Ser Ala Cys His Asp Gly Met Gly Trp Leu Thr
180 185 190
Ile Gly Ile Ser Gly Pro Asp Asn Gly Ala Val Ala Val Leu Lys Tyr
195 200 205
Asn Gly Ile Ile Thr Glu Thr Ile Lys Ser Trp Lys Lys Arg Ile Leu
210 215 220
Arg Thr Gln Glu Ser Glu Cys Val Cys Val Asn Gly Ser Cys Phe Thr
225 230 235 240
Ile Met Thr Asp Gly Pro Ser Asn Gly Ala Ala Ser Tyr Lys Ile Phe
245 250 255
Lys Ile Glu Lys Gly Lys Val Thr Lys Ser Ile Glu Leu Asn Ala Pro
260 265 270
Asn Phe His Tyr Glu Glu Cys Ser Cys Tyr Pro Asp Thr Gly Thr Val
275 280 285
Met Cys Val Cys Arg Asp Asn Trp His Gly Ser Asn Arg Pro Trp Val
290 295 300
Ser Phe Asn Gln Asn Leu Asp Tyr Gln Ile Gly Tyr Ile Cys Ser Gly
305 310 315 320
Val Phe Gly Asp Asn Pro Arg Pro Lys Asp Gly Glu Gly Ser Cys Asn
325 330 335
Pro Val Thr Val Asp Gly Ala Asp Gly Val Lys Gly Phe Ser Tyr Lys
340 345 350
Tyr Gly Asn Gly Val Trp Ile Gly Arg Thr Lys Ser Asn Arg Leu Arg
355 360 365
Lys Gly Phe Glu Met Ile Trp Asp Pro Asn Gly Trp Thr Asp Thr Asp
370 375 380
Ser Asp Phe Ser Val Lys Gln Asp Val Val Ala Ile Thr Asp Trp Ser
385 390 395 400
Gly Tyr Ser Gly Ser Phe Val Gln His Pro Glu Leu Thr Gly Leu Asp
405 410 415
Cys Ile Arg Pro Cys Phe Trp Val Glu Leu Val Arg Gly Leu Pro Arg
420 425 430
Glu Asn Thr Thr Ile Trp Thr Ser Gly Ser Ser Ile Ser Phe Cys Gly
435 440 445
Val Asn Ser Asp Thr Ala Asn Trp Ser Trp Pro Asp Gly Ala Glu Leu
450 455 460
Pro Phe Thr Ile Asp Lys
465 470
<210> 15
<211> 1410
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide
<400> 15
atgaatccaa atcaaaaaat aataaccatt ggatcaatca gtatagcaat cggaataatt 60
agtctaatgt tgcaaatagg aaatattatt tcaatatggg ctagtcactc aatccaaact 120
ggaagtcaaa accacactgg agtatgcaac caaagaatca tcacatatga aaacagcacc 180
tgggtgaatc acacatatgt taatattaac aacactaatg ttgttgctgg aaaggacaaa 240
acttcagtga cattggccgg caattcatct ctttgttcta tcagtggatg ggctatatac 300
acaaaagaca acagcataag aattggctcc aaaggagatg tttttgtcat aagagaacct 360
ttcatatcat gttctcactt ggaatgcaga accttttttc tgacccaagg tgctctatta 420
aatgacaaac attcaaatgg gaccgttaag gacagaagtc cttatagggc cttaatgagc 480
tgtcctctag gtgaagctcc gtccccatac aattcaaagt ttgaatcagt tgcatggtca 540
gcaagcgcat gccatgatgg catgggctgg ttaacaatcg gaatttctgg tccagacaat 600
ggagctgtgg ctgtactaaa atacaacggc ataataactg aaaccataaa aagttggaaa 660
aagcgaatat taagaacaca agagtctgaa tgtgtctgtg tgaacgggtc atgtttcacc 720
ataatgaccg atggcccgag taatggggcc gcctcgtaca aaatcttcaa gatcgaaaag 780
gggaaggtta ctaaatcaat agagttgaat gcacccaatt ttcattatga ggaatgttcc 840
tgttacccag acactggcac agtgatgtgt gtatgcaggg acaactggca tggttcaaat 900
cgaccttggg tgtcttttaa tcaaaacctg gattatcaaa taggatacat ctgcagtggg 960
gtgttcggtg acaatccgcg tcccaaagat ggagagggca gctgtaatcc agtgactgtt 1020
gatggagcag acggagtaaa ggggttttca tacaaatatg gtaatggtgt ttggatagga 1080
aggactaaaa gtaacagact tagaaagggg tttgagatga tttgggatcc taatggatgg 1140
acagataccg acagtgattt ctcagtgaaa caggatgttg tggcaataac tgattggtca 1200
gggtacagcg gaagtttcgt tcaacatcct gagttaacag gattggactg tataagacct 1260
tgcttctggg ttgagttagt cagaggactg cctagagaaa atacaacaat ctggactagt 1320
gggagcagca tttctttttg tggcgtaaat agtgatactg caaactggtc ttggccagac 1380
ggtgctgagt tgccgttcac cattgacaag 1410
<210> 16
<211> 5589
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide
<220>
<221> misc_feature
<222> (4774)..(4774)
<223> n is a, c, g, or t
<400> 16
ggccgctcta gaactagtac ggcgtgcaag tagtgtcttt ctttgcactc ccgccgtccc 60
agaagacgcc gcaacaagct gagcttgctg gaagccgaac aaaggcgtta cagagcacaa 120
acatagtggc agtgtaggaa ctctaactgg gaccaaaact acgggcccgg cagaaacgtt 180
ccccgccccg aagcgaaggc gaacgtcgaa aagcaagacc gggaccgctc gtcccaggat 240
tagccacgaa gttccagacc aagtatagga gtaaacgctc gctcgtcaaa acaattgtca 300
ccaatcagca ccacatcggc acataacaac cggttgcgga actcgcatgt gaacaacaag 360
cggctccggg ggagtgatcg gctcgggcgg atgacccgga ctcttccgcg cagcaactcg 420
gcgtgttgtt gacggcagta ctccgtagtt gccatgacaa cagtcaatgg cgtgcttcac 480
aaggtggaga gccgagaaag cacctcggca tgtacgagta tgtagatagt gtatcaagca 540
ggaagatggg ggttacttta tctcaatcag atgcctgtaa gcgagagccg agagcctgcc 600
ctgttgttga cacaattctg gcctgatacg agtgacaagc gctgggacgg cggctggggt 660
cttttgctcg cggcttcagc tcaattccaa tcctgggccg gtgccgaacg gcccaatcgc 720
gagcgcccac gaaatcggag gtcgaggaaa gaaggctggg cgagacgcgg cgacaagctg 780
tggcaaaatg gccaattgag gttctgggtc ggctggtgat caaccatgca tttcccagcc 840
cgcagattct ctttctctct cgtgcagcag cggcaccagc agcagcagca gccaggggtt 900
tgaccaacct ctccgcccag ccaccgatag taaagatgct gcctgcgtat tctgggctgc 960
aggagttcca agatctttcg gtctggccac cagctgtcac gtcaccctcc acctttggac 1020
gacgttgctg gaaaattcga agccttcact aagataacta tgccgtagca cttgcagccc 1080
cggaagctgc aagttgattc ttggagggct ctctccacca ccaatacggg agatctggcc 1140
ccgcacttga ggaggctgga gtctcggatc gcccacttcg cgtcgccctg ggccctgggc 1200
cctggggtga tgggcccgtt gccgtggtgg atggcaggag cttttcagct ctcaatgggc 1260
gaatgctact ccgtaggtcg gagtggctgg aagcggcgga acggacaggg ggaggttggg 1320
gaaaatgctc cgcaggaaga gcagggagtg gggagctgcg gtcggccctg tggagcccgt 1380
gcagggccag ctaatccaat tcgggccaca ataaacaaga gagggcccca catcatgtaa 1440
acagaggctc agaagctcct gccacactgg gagggtttcg aagtctgacg actgccaatg 1500
gaccccagcc atcgcgagca cacagcagtt cgcacgctcc cattgggttc ctcatcacgc 1560
agtcgctctc cccgccaacc agcgccaggt ccgggaacag cggcgcaaat gcgtatttga 1620
gggcgcctcg ctcgagcaac ctgtgcctga ccttctcctc ctccttctgc accttgcatc 1680
tcgtcgcgtc cactcgcagg caaccacaca tcctcctcct ctcccaaaac ccccccgctt 1740
tttctttccc ttgttggaat tcgattgaaa aagaagacgg gtccgtctag agaccgcctt 1800
ctcacctttc tctcgacttc tttctaggaa aagaagcaag agtcattctt cttgtccacc 1860
ttctggttca cggaaggtcg aggagaagat tgcctctgcc cccaaagtcg ccaacctgga 1920
ctttgaagca cgtgttccgg tccctttcag tgtcttcccg tcctcgtaca gggagtccga 1980
gaccgccacc caaacccact cccacgaaga ggttgagatc aagctccccc agctcgccgg 2040
acgggaaggt caacactctt cattccaagc ccaagcacat cttcctccca gcggagaggg 2100
tcgcttcaga gaagaagagg tccgcatcac tcgtcaagag gaacatcacc gccgtcccgg 2160
catccgtgaa gagttcgttc accgcgagga gcgtcaccgg taagtttagt ttttgttttg 2220
attcaccacc cattgtcttc cccgcctttt tctttttctt cccttgctct cttgcccctg 2280
tctagtgtag ggcattgcca aggccatctt cacacacaca cacccccccc cccccccacc 2340
ctcagctggg ggggggggtg gcctgggttg accaagggac ggtgaagact actactactt 2400
gagccactca aacccatgca tgacacaggg ttttcctttt tcttttctct tttcctttaa 2460
ctaaccaacc actccaacat tagccctcag tcaacctact ccgagtctcg catcgagttc 2520
gatactgagc accgcactca caactccgtc attgacgttg ctgagagcga gtatcgtgcc 2580
cgtgtccagc ccaactaccg caaggaagct tccgtagtcg gtaccaccgt cgacggatcc 2640
cgcttcagcc acagccgcaa ggccagcagc accacctcca cccacaccga cgagtacacc 2700
gtcgatcccc ctagccaccg ccccgtctac aagaaggagt cggttgaagt cgccggtacc 2760
actgttgacc cccctgctcc tcgttcgacc taccacgagc aggtgaacat tgttgaagag 2820
accgttgacg ctcaccgtta cgctcctcaa cccaacaaca acaacaccat gtacgccaag 2880
ttcgcgaccc tcgccgccct tgtggctggc gccgctgctg acaccatctg catcggctac 2940
cacgccaaca acagcaccga caccgtcgac acggtcctcg agaagaacgt caccgtcacc 3000
cacagcgtca acctgctcga ggacagccac aacggcaagc tctgcctcct caagggcatc 3060
gcccccctcc agctcggcaa ctgcagcgtc gccggctgga tcctcggcaa ccccgagtgc 3120
gagctgctca tcagcaagga gagctggtcg tacatcgtcg agacccccaa ccccgagaac 3180
ggcacgtgct accccggcta cttcgccgac tacgaggagc tgcgcgagca gctcagcagc 3240
gtcagctcgt tcgagcgctt cgagatcttc cccaaggaga gcagctggcc caaccacacc 3300
gtcaccggcg tcagcgccag ctgctcgcac aacggcaaga gcagcttcta ccgcaacctc 3360
ctctggctca ccggcaagaa cggcctctac ccgaacctca gcaagagcta cgtcaacaac 3420
aaggagaagg aggtcctcgt cctctggggc gtccaccacc cccccaacat cggcaaccag 3480
cgcgccctct accacaccga gaacgcctac gtcagcgtcg tcagcagcca ctacagccgc 3540
cgcttcaccc ccgagatcgc caagcgcccc aaggtccgcg accaggaggg ccgcatcaac 3600
tactactgga ccctcctcga gcccggcgac accatcatct tcgaggccaa cggcaacctg 3660
atcgccccct ggtacgcctt cgccctcagc cgcggcttcg gcagcggcat catcaccagc 3720
aacgccccca tggacgagtg cgacgccaag tgccagaccc cccagggcgc catcaacagc 3780
agcctcccgt tccagaacgt ccaccccgtc accatcggcg agtgccccaa gtacgtccgc 3840
agcgccaagc tccgcatggt caccggcctc cgcaacatcc ccagcatcca gagccgcggc 3900
ctcttcggcg ccatcgccgg cttcatcgag ggcggctgga ccggcatggt cgacggctgg 3960
tacggctacc accaccagaa cgagcagggc agcggctacg ccgccgacca gaagtcgacc 4020
cagaacgcca tcaacggcat caccaacaag gtcaacagcg tcatcgagaa gatgaacacc 4080
cagttcaccg ccgtcggcaa ggagttcaac aagctcgagc gccgcatgga gaacctcaac 4140
aagaaggtcg acgacggctt cctcgacatc tggacctaca acgccgagct gctcgtcctc 4200
ctcgagaacg agcgcaccct cgacttccac gacagcaacg tcaagaacct gtacgagaag 4260
gtcaagagcc agctcaagaa caacgccaag gagatcggca acggctgctt cgagttctac 4320
cacaagtgca acaacgagtg catggagagc gtcaagaacg gcacctacga ctaccccaag 4380
tacagcgagg agagcaagct caaccgcgag aagatcgacg gcgtcaagct cgagagcatg 4440
ggcgtctacc agatcctcgc catctacagc accgtcgcca gcagcctcgt cctcctggtc 4500
agcctcggcg ccatctcgtt ctggatgtgc agcaacggca gcctccagtg ccgcatctgc 4560
atctgagaat tcggatccta agtaagtaaa cgaacctctc tgaaggaggt tctgagacac 4620
gcgcgattct tctgtatata gttttatttt tcactctgga gtgcttcgct ccaccagtac 4680
ataaaccttt tttttcacgt aacaaaatgg cttcttttca gaccatgtga accatcttga 4740
tgccttgacc tcttcagttc tcactttaac gtanttcgcg ttagtctgta tgtcccagtt 4800
gcatgtagtt gagataaata cccctggaag tgggtctggg cctttgtggg acggagccct 4860
ctttctgtgg tctggagagc ccgctctcta ccgcctacct tcttaccaca gtacactact 4920
cacacattgc tgaactgacc catcataccg tactttatcc tgttaattcg tggtgctgtc 4980
gactattcta tttgctcaaa tggagagcac attcatcggc gcagggatac acggtttatg 5040
gaccccaaga gtgtaaggac tattattagt aatattatat gcctctaggc gccttaactt 5100
caacaggcga gcactactaa tcaacttttg gtagacccaa ttacaaacga ccatacgtgc 5160
cggaaatttt gggattccgt ccgctctccc caaccaagct agaagaggca acgaacagcc 5220
aatcccggtg ctaattaaat tatatggttc atttttttta aaaaaatttt ttcttcccat 5280
tttcctctcg cttttctttt tcgcatcgta gttgatcaaa gtccaagtca agcgagctat 5340
ttgtgctata gctcggtggc tataatcagt acagcttaga gaggctgtaa aggtatgata 5400
ccacagcagt attcgcgcta taagcggcac tcctagacta attgttacgg tctacagaag 5460
taggtaataa aagcgttaat tgttctaaat actagaggca cttagagaag ctatctaaat 5520
atatattgac cctagcttat tatccctatt agtaagttag ttagctctaa cctatagata 5580
gatgcatgc 5589
<210> 17
<211> 5589
<212> DNA
<213> Artificial Sequence
<220>
<223> Vector
<220>
<221> misc_feature
<222> (4774)..(4774)
<223> n is a, c, g, or t
<400> 17
ggccgctcta gaactagtac ggcgtgcaag tagtgtcttt ctttgcactc ccgccgtccc 60
agaagacgcc gcaacaagct gagcttgctg gaagccgaac aaaggcgtta cagagcacaa 120
acatagtggc agtgtaggaa ctctaactgg gaccaaaact acgggcccgg cagaaacgtt 180
ccccgccccg aagcgaaggc gaacgtcgaa aagcaagacc gggaccgctc gtcccaggat 240
tagccacgaa gttccagacc aagtatagga gtaaacgctc gctcgtcaaa acaattgtca 300
ccaatcagca ccacatcggc acataacaac cggttgcgga actcgcatgt gaacaacaag 360
cggctccggg ggagtgatcg gctcgggcgg atgacccgga ctcttccgcg cagcaactcg 420
gcgtgttgtt gacggcagta ctccgtagtt gccatgacaa cagtcaatgg cgtgcttcac 480
aaggtggaga gccgagaaag cacctcggca tgtacgagta tgtagatagt gtatcaagca 540
ggaagatggg ggttacttta tctcaatcag atgcctgtaa gcgagagccg agagcctgcc 600
ctgttgttga cacaattctg gcctgatacg agtgacaagc gctgggacgg cggctggggt 660
cttttgctcg cggcttcagc tcaattccaa tcctgggccg gtgccgaacg gcccaatcgc 720
gagcgcccac gaaatcggag gtcgaggaaa gaaggctggg cgagacgcgg cgacaagctg 780
tggcaaaatg gccaattgag gttctgggtc ggctggtgat caaccatgca tttcccagcc 840
cgcagattct ctttctctct cgtgcagcag cggcaccagc agcagcagca gccaggggtt 900
tgaccaacct ctccgcccag ccaccgatag taaagatgct gcctgcgtat tctgggctgc 960
aggagttcca agatctttcg gtctggccac cagctgtcac gtcaccctcc acctttggac 1020
gacgttgctg gaaaattcga agccttcact aagataacta tgccgtagca cttgcagccc 1080
cggaagctgc aagttgattc ttggagggct ctctccacca ccaatacggg agatctggcc 1140
ccgcacttga ggaggctgga gtctcggatc gcccacttcg cgtcgccctg ggccctgggc 1200
cctggggtga tgggcccgtt gccgtggtgg atggcaggag cttttcagct ctcaatgggc 1260
gaatgctact ccgtaggtcg gagtggctgg aagcggcgga acggacaggg ggaggttggg 1320
gaaaatgctc cgcaggaaga gcagggagtg gggagctgcg gtcggccctg tggagcccgt 1380
gcagggccag ctaatccaat tcgggccaca ataaacaaga gagggcccca catcatgtaa 1440
acagaggctc agaagctcct gccacactgg gagggtttcg aagtctgacg actgccaatg 1500
gaccccagcc atcgcgagca cacagcagtt cgcacgctcc cattgggttc ctcatcacgc 1560
agtcgctctc cccgccaacc agcgccaggt ccgggaacag cggcgcaaat gcgtatttga 1620
gggcgcctcg ctcgagcaac ctgtgcctga ccttctcctc ctccttctgc accttgcatc 1680
tcgtcgcgtc cactcgcagg caaccacaca tcctcctcct ctcccaaaac ccccccgctt 1740
tttctttccc ttgttggaat tcgattgaaa aagaagacgg gtccgtctag agaccgcctt 1800
ctcacctttc tctcgacttc tttctaggaa aagaagcaag agtcattctt cttgtccacc 1860
ttctggttca cggaaggtcg aggagaagat tgcctctgcc cccaaagtcg ccaacctgga 1920
ctttgaagca cgtgttccgg tccctttcag tgtcttcccg tcctcgtaca gggagtccga 1980
gaccgccacc caaacccact cccacgaaga ggttgagatc aagctccccc agctcgccgg 2040
acgggaaggt caacactctt cattccaagc ccaagcacat cttcctccca gcggagaggg 2100
tcgcttcaga gaagaagagg tccgcatcac tcgtcaagag gaacatcacc gccgtcccgg 2160
catccgtgaa gagttcgttc accgcgagga gcgtcaccgg taagtttagt ttttgttttg 2220
attcaccacc cattgtcttc cccgcctttt tctttttctt cccttgctct cttgcccctg 2280
tctagtgtag ggcattgcca aggccatctt cacacacaca cacccccccc cccccccacc 2340
ctcagctggg ggggggggtg gcctgggttg accaagggac ggtgaagact actactactt 2400
gagccactca aacccatgca tgacacaggg ttttcctttt tcttttctct tttcctttaa 2460
ctaaccaacc actccaacat tagccctcag tcaacctact ccgagtctcg catcgagttc 2520
gatactgagc accgcactca caactccgtc attgacgttg ctgagagcga gtatcgtgcc 2580
cgtgtccagc ccaactaccg caaggaagct tccgtagtcg gtaccaccgt cgacggatcc 2640
cgcttcagcc acagccgcaa ggccagcagc accacctcca cccacaccga cgagtacacc 2700
gtcgatcccc ctagccaccg ccccgtctac aagaaggagt cggttgaagt cgccggtacc 2760
actgttgacc cccctgctcc tcgttcgacc taccacgagc aggtgaacat tgttgaagag 2820
accgttgacg ctcaccgtta cgctcctcaa cccaacaaca acaacaccat gtacgccaag 2880
ttcgcgaccc tcgccgccct tgtggctggc gccgctgctg acaccatctg catcggctac 2940
cacgccaaca acagcaccga caccgtcgac acggtcctcg agaagaacgt caccgtcacc 3000
cacagcgtca acctgctcga ggacagccac aacggcaagc tctgcctcct caagggcatc 3060
gcccccctcc agctcggcaa ctgcagcgtc gccggctgga tcctcggcaa ccccgagtgc 3120
gagctgctca tcagcaagga gagctggtcg tacatcgtcg agacccccaa ccccgagaac 3180
ggcacgtgct accccggcta cttcgccgac tacgaggagc tgcgcgagca gctcagcagc 3240
gtcagctcgt tcgagcgctt cgagatcttc cccaaggaga gcagctggcc caaccacacc 3300
gtcaccggcg tcagcgccag ctgctcgcac aacggcaaga gcagcttcta ccgcaacctc 3360
ctctggctca ccggcaagaa cggcctctac ccgaacctca gcaagagcta cgtcaacaac 3420
aaggagaagg aggtcctcgt cctctggggc gtccaccacc cccccaacat cggcaaccag 3480
cgcgccctct accacaccga gaacgcctac gtcagcgtcg tcagcagcca ctacagccgc 3540
cgcttcaccc ccgagatcgc caagcgcccc aaggtccgcg accaggaggg ccgcatcaac 3600
tactactgga ccctcctcga gcccggcgac accatcatct tcgaggccaa cggcaacctg 3660
atcgccccct ggtacgcctt cgccctcagc cgcggcttcg gcagcggcat catcaccagc 3720
aacgccccca tggacgagtg cgacgccaag tgccagaccc cccagggcgc catcaacagc 3780
agcctcccgt tccagaacgt ccaccccgtc accatcggcg agtgccccaa gtacgtccgc 3840
agcgccaagc tccgcatggt caccggcctc cgcaacatcc ccagcatcca gagccgcggc 3900
ctcttcggcg ccatcgccgg cttcatcgag ggcggctgga ccggcatggt cgacggctgg 3960
tacggctacc accaccagaa cgagcagggc agcggctacg ccgccgacca gaagtcgacc 4020
cagaacgcca tcaacggcat caccaacaag gtcaacagcg tcatcgagaa gatgaacacc 4080
cagttcaccg ccgtcggcaa ggagttcaac aagctcgagc gccgcatgga gaacctcaac 4140
aagaaggtcg acgacggctt cctcgacatc tggacctaca acgccgagct gctcgtcctc 4200
ctcgagaacg agcgcaccct cgacttccac gacagcaacg tcaagaacct gtacgagaag 4260
gtcaagagcc agctcaagaa caacgccaag gagatcggca acggctgctt cgagttctac 4320
cacaagtgca acaacgagtg catggagagc gtcaagaacg gcacctacga ctaccccaag 4380
tacagcgagg agagcaagct caaccgcgag aagatcgacg gcgtcaagct cgagagcatg 4440
ggcgtctacc agatcctcgc catctacagc accgtcgcca gcagcctcgt cctcctggtc 4500
agcctcggcg ccatctcgtt ctggatgtgc agcaacggca gcctccagtg ccgcatctgc 4560
atctgagaat tcggatccta agtaagtaaa cgaacctctc tgaaggaggt tctgagacac 4620
gcgcgattct tctgtatata gttttatttt tcactctgga gtgcttcgct ccaccagtac 4680
ataaaccttt tttttcacgt aacaaaatgg cttcttttca gaccatgtga accatcttga 4740
tgccttgacc tcttcagttc tcactttaac gtanttcgcg ttagtctgta tgtcccagtt 4800
gcatgtagtt gagataaata cccctggaag tgggtctggg cctttgtggg acggagccct 4860
ctttctgtgg tctggagagc ccgctctcta ccgcctacct tcttaccaca gtacactact 4920
cacacattgc tgaactgacc catcataccg tactttatcc tgttaattcg tggtgctgtc 4980
gactattcta tttgctcaaa tggagagcac attcatcggc gcagggatac acggtttatg 5040
gaccccaaga gtgtaaggac tattattagt aatattatat gcctctaggc gccttaactt 5100
caacaggcga gcactactaa tcaacttttg gtagacccaa ttacaaacga ccatacgtgc 5160
cggaaatttt gggattccgt ccgctctccc caaccaagct agaagaggca acgaacagcc 5220
aatcccggtg ctaattaaat tatatggttc atttttttta aaaaaatttt ttcttcccat 5280
tttcctctcg cttttctttt tcgcatcgta gttgatcaaa gtccaagtca agcgagctat 5340
ttgtgctata gctcggtggc tataatcagt acagcttaga gaggctgtaa aggtatgata 5400
ccacagcagt attcgcgcta taagcggcac tcctagacta attgttacgg tctacagaag 5460
taggtaataa aagcgttaat tgttctaaat actagaggca cttagagaag ctatctaaat 5520
atatattgac cctagcttat tatccctatt agtaagttag ttagctctaa cctatagata 5580
gatgcatgc 5589
<210> 18
<211> 545
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide
<400> 18
Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr Val
1 5 10 15
Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn Leu
20 25 30
Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile Ala
35 40 45
Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly Asn
50 55 60
Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile Val
65 70 75 80
Glu Thr Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Tyr Phe Ala
85 90 95
Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe Glu
100 105 110
Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr Val
115 120 125
Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Lys Ser Ser Phe Tyr
130 135 140
Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn Leu
145 150 155 160
Ser Lys Ser Tyr Val Asn Asn Lys Glu Lys Glu Val Leu Val Leu Trp
165 170 175
Gly Val His His Pro Pro Asn Ile Gly Asn Gln Arg Ala Leu Tyr His
180 185 190
Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg Arg
195 200 205
Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu Gly
210 215 220
Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile Ile
225 230 235 240
Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Phe Ala Leu
245 250 255
Ser Arg Gly Phe Gly Ser Gly Ile Ile Thr Ser Asn Ala Pro Met Asp
260 265 270
Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser Ser
275 280 285
Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro Lys
290 295 300
Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn Ile
305 310 315 320
Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile
325 330 335
Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His His
340 345 350
Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr Gln
355 360 365
Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys
370 375 380
Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu Glu
385 390 395 400
Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu Asp
405 410 415
Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu Arg
420 425 430
Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys Val
435 440 445
Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys Phe
450 455 460
Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys Asn
465 470 475 480
Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn Arg
485 490 495
Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln Gly
500 505 510
Gly Gly Gly Gly Gly Gly Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly
515 520 525
Gln Ala Tyr Val Arg Lys Asp Gly Glu Trp Val Leu Leu Ser Thr Phe
530 535 540
Leu
545
<210> 19
<211> 1690
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide
<400> 19
atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc tgacaccatc 60
tgcatcggct accacgccaa caacagcacc gacaccgtcg acacggtcct cgagaagaac 120
gtcaccgtca cccacagcgt caacctgctc gaggacagcc acaacggcaa gctctgcctc 180
ctcaagggca tcgcccccct ccagctcggc aactgcagcg tcgccggctg gatcctcggc 240
aaccccgagt gcgagctgct catcagcaag gagagctggt cgtacatcgt cgagaccccc 300
aaccccgaga acggcacgtg ctaccccggc tacttcgccg actacgagga gctgcgcgag 360
cagctcagca gcgtcagctc gttcgagcgc ttcgagatct tccccaagga gagcagctgg 420
cccaaccaca ccgtcaccgg cgtcagcgcc agctgctcgc acaacggcaa gagcagcttc 480
taccgcaacc tcctctggct caccggcaag aacggcctct acccgaacct cagcaagagc 540
tacgtcaaca acaaggagaa ggaggtcctc gtcctctggg gcgtccacca cccccccaac 600
atcggcaacc agcgcgccct ctaccacacc gagaacgcct acgtcagcgt cgtcagcagc 660
cactacagcc gccgcttcac ccccgagatc gccaagcgcc ccaaggtccg cgaccaggag 720
ggccgcatca actactactg gaccctcctc gagcccggcg acaccatcat cttcgaggcc 780
aacggcaacc tgatcgcccc ctggtacgcc ttcgccctca gccgcggctt cggcagcggc 840
atcatcacca gcaacgcccc catggacgag tgcgacgcca agtgccagac cccccagggc 900
gccatcaaca gcagcctccc gttccagaac gtccaccccg tcaccatcgg cgagtgcccc 960
aagtacgtcc gcagcgccaa gctccgcatg gtcaccggcc tccgcaacat ccccagcatc 1020
cagagccgcg gcctcttcgg cgccatcgcc ggcttcatcg agggcggctg gaccggcatg 1080
gtcgacggct ggtacggcta ccaccaccag aacgagcagg gcagcggcta cgccgccgac 1140
cagaagtcga cccagaacgc catcaacggc atcaccaaca aggtcaacag cgtcatcgag 1200
aagatgaaca cccagttcac cgccgtcggc aaggagttca acaagctcga gcgccgcatg 1260
gagaacctca acaagaaggt cgacgacggc ttcctcgaca tctggaccta caacgccgag 1320
ctgctcgtcc tcctcgagaa cgagcgcacc ctcgacttcc acgacagcaa cgtcaagaac 1380
ctgtacgaga aggtcaagag ccagctcaag aacaacgcca aggagatcgg caacggctgc 1440
ttcgagttct accacaagtg caacaacgag tgcatggaga gcgtcaagaa cggcacctac 1500
gactacccca agtacagcga ggagagcaag ctcaaccgcg agaagatcga cggcgtcaag 1560
ctcgagagca tgggcgtcta ccagggcggc ggcggcggcg gcggcggcta catccccgag 1620
gccccccgcg acggccaggc ctacgtccgc aaggacggcg agtgggtcct cctcagcacc 1680
ttcctgtgag 1690
<210> 20
<211> 571
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide
<400> 20
Asp Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val
1 5 10 15
Lys Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu
20 25 30
Thr Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg
35 40 45
Thr Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp
50 55 60
Val Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys
65 70 75 80
Ala Ser Ile Leu His Glu Val Lys Pro Val Thr Ser Gly Cys Phe Pro
85 90 95
Ile Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg
100 105 110
Gly Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu
115 120 125
Lys Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro
130 135 140
Asn Ala Thr Ser Lys Ser Gly Phe Phe Ala Thr Met Ala Trp Ala Val
145 150 155 160
Pro Lys Asp Asn Asn Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val
165 170 175
Pro Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe
180 185 190
His Ser Asp Asp Lys Thr Gln Met Lys Asn Leu Tyr Gly Asp Ser Asn
195 200 205
Pro Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val
210 215 220
Ser Gln Ile Gly Ser Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro
225 230 235 240
Gln Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys
245 250 255
Thr Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val
260 265 270
Trp Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu
275 280 285
Ile Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys
290 295 300
Ser Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys
305 310 315 320
Pro Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr
325 330 335
Arg Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala Ile
340 345 350
Ala Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His
355 360 365
Gly Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu
370 375 380
Lys Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser
385 390 395 400
Leu Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met
405 410 415
Asp Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp
420 425 430
Leu Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu
435 440 445
Ser Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu
450 455 460
Glu Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile Gly
465 470 475 480
Asn Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp
485 490 495
Arg Ile Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr
500 505 510
Phe Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu
515 520 525
Asp Asn His Thr Ile Leu Leu Tyr Tyr Gly Gly Gly Gly Gly Gly Gly
530 535 540
Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys
545 550 555 560
Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
565 570
<210> 21
<211> 1768
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide
<400> 21
atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc tgaccgcatc 60
tgcaccggca tcaccagcag caacagcccc cacgtcgtca agaccgccac ccagggcgag 120
gtcaacgtca cgggcgtcat ccccctcacc accaccccca ccaagagcta cttcgccaac 180
ctcaagggca cccgcacccg cggcaagctc tgccccgact gcctcaactg caccgacctc 240
gacgtcgccc tcggccgccc catgtgcgtc ggcaccaccc ccagcgccaa ggccagcatc 300
ctccacgagg tcaagcccgt caccagcggc tgcttcccca tcatgcacga ccgcaccaag 360
atccgccagc tccccaacct cctccgcggc tacgagaaca tccgcctcag cacccagaac 420
gtcatcgacg ccgagaaggc ccccggcggc ccctaccgcc tcggcaccag cggctcgtgc 480
cccaacgcca ccagcaagag cggcttcttc gccaccatgg cctgggccgt ccccaaggac 540
aacaacaaga acgccaccaa ccccctgacc gtcgaggtcc cctacatctg caccgagggc 600
gaggaccaga tcaccgtctg gggcttccac agcgacgaca agacccagat gaagaacctc 660
tacggcgaca gcaaccccca gaagttcacc agcagcgcca acggcgtcac cacccactac 720
gtcagccaga tcggcagctt ccccgaccag accgaggacg gcggcctccc ccagtcgggc 780
cgcatcgtcg tcgactacat gatgcagaag cccggcaaga ccggcaccat cgtctaccag 840
cgcggcgtcc tcctgcccca gaaggtctgg tgcgcctcgg gccgcagcaa ggtcatcaag 900
ggcagcctcc cgctcatcgg cgaggccgac tgcctccacg agaagtacgg cggcctcaac 960
aagagcaagc cctactacac gggcgagcac gccaaggcca tcggcaactg ccccatctgg 1020
gtcaagaccc ccctcaagct cgccaacggc accaagtacc gcccccccgc caagctcctc 1080
aaggagcggg gcttcttcgg cgccatcgcc ggcttcctcg agggcggctg ggagggcatg 1140
atcgccggct ggcacggcta caccagccac ggcgcccacg gcgtcgccgt cgccgccgac 1200
ctcaagtcga cccaggaggc catcaacaag atcaccaaga acctcaacag cctcagcgag 1260
ctggaggtca agaacctcca gcgcctctcg ggcgccatgg acgagctgca caacgagatc 1320
ctcgagctgg acgagaaggt cgacgacctc cgcgccgaca ccatcagcag ccagatcgag 1380
ctggccgtcc tcctcagcaa cgagggcatc atcaacagcg aggacgagca cctcctggcc 1440
ctcgagcgca agctcaagaa gatgctcggc cccagcgccg tcgagatcgg caacggctgc 1500
ttcgagacca agcacaagtg caaccagacc tgcctcgacc ggatcgccgc cggcaccttc 1560
aacgccggcg agttcagcct ccccaccttc gacagcctca acatcaccgc cgccagcctc 1620
aacgacgacg gcctcgacaa ccacaccatc ctgctctact acggcggcgg cggcggcggc 1680
ggcggctaca tccccgaggc cccccgcgac ggccaggcct acgtccgcaa ggacggcgag 1740
tgggtcctcc tcagcacctt cctgtgag 1768
<210> 22
<211> 449
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide
<400> 22
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala
1 5 10 15
Ala Ser Ser Ser Asp Tyr Ser Asp Leu Gln Arg Val Lys Gln Glu Leu
20 25 30
Leu Glu Glu Val Lys Lys Glu Leu Gln Lys Val Lys Glu Glu Ile Ile
35 40 45
Glu Ala Phe Val Gln Glu Leu Arg Lys Arg Gly Gly Ser Val Thr Leu
50 55 60
Ala Gly Asn Ser Ser Leu Cys Ser Ile Ser Gly Trp Ala Ile Tyr Thr
65 70 75 80
Lys Asp Asn Ser Ile Arg Ile Gly Ser Lys Gly Asp Val Phe Val Ile
85 90 95
Arg Glu Pro Phe Ile Ser Cys Ser His Leu Glu Cys Arg Thr Phe Phe
100 105 110
Leu Thr Gln Gly Ala Leu Leu Asn Asp Lys His Ser Asn Gly Thr Val
115 120 125
Lys Asp Arg Ser Pro Tyr Arg Ala Leu Met Ser Cys Pro Leu Gly Glu
130 135 140
Ala Pro Ser Pro Tyr Asn Ser Lys Phe Glu Ser Val Ala Trp Ser Ala
145 150 155 160
Ser Ala Cys His Asp Gly Met Gly Trp Leu Thr Ile Gly Ile Ser Gly
165 170 175
Pro Asp Asn Gly Ala Val Ala Val Leu Lys Tyr Asn Gly Ile Ile Thr
180 185 190
Glu Thr Ile Lys Ser Trp Lys Lys Arg Ile Leu Arg Thr Gln Glu Ser
195 200 205
Glu Cys Val Cys Val Asn Gly Ser Cys Phe Thr Ile Met Thr Asp Gly
210 215 220
Pro Ser Asn Gly Ala Ala Ser Tyr Lys Ile Phe Lys Ile Glu Lys Gly
225 230 235 240
Lys Val Thr Lys Ser Ile Glu Leu Asn Ala Pro Asn Phe His Tyr Glu
245 250 255
Glu Cys Ser Cys Tyr Pro Asp Thr Gly Thr Val Met Cys Val Cys Arg
260 265 270
Asp Asn Trp His Gly Ser Asn Arg Pro Trp Val Ser Phe Asn Gln Asn
275 280 285
Leu Asp Tyr Gln Ile Gly Tyr Ile Cys Ser Gly Val Phe Gly Asp Asn
290 295 300
Pro Arg Pro Lys Asp Gly Glu Gly Ser Cys Asn Pro Val Thr Val Asp
305 310 315 320
Gly Ala Asp Gly Val Lys Gly Phe Ser Tyr Lys Tyr Gly Asn Gly Val
325 330 335
Trp Ile Gly Arg Thr Lys Ser Asn Arg Leu Arg Lys Gly Phe Glu Met
340 345 350
Ile Trp Asp Pro Asn Gly Trp Thr Asp Thr Asp Ser Asp Phe Ser Val
355 360 365
Lys Gln Asp Val Val Ala Ile Thr Asp Trp Ser Gly Tyr Ser Gly Ser
370 375 380
Phe Val Gln His Pro Glu Leu Thr Gly Leu Asp Cys Ile Arg Pro Cys
385 390 395 400
Phe Trp Val Glu Leu Val Arg Gly Leu Pro Arg Glu Asn Thr Thr Ile
405 410 415
Trp Thr Ser Gly Ser Ser Ile Ser Phe Cys Gly Val Asn Ser Asp Thr
420 425 430
Ala Asn Trp Ser Trp Pro Asp Gly Ala Glu Leu Pro Phe Thr Ile Asp
435 440 445
Lys
<210> 23
<211> 628
<212> PRT
<213> Myceliophthora thermophila
<400> 23
Met His Ala Leu Ser Ser Leu Ala Val Leu Gly Ala Trp Ala Val Gln
1 5 10 15
Thr Val Leu Gly Arg Pro Ala Thr Leu Ser Lys Arg Ala Thr Asp Ser
20 25 30
Phe Ile Glu Thr Glu Thr Pro Ile Ala Trp Glu Lys Leu Arg Cys Asn
35 40 45
Ile Gly Ala Asn Gly Cys Ala Ala Ser Gly Ala Ala Ala Gly Val Val
50 55 60
Ile Ala Ser Pro Ser Lys Ser Asp Pro Asp Tyr Phe Tyr Thr Trp Thr
65 70 75 80
Arg Asp Ala Gly Leu Val Leu Thr Gly Ile Val Asp Ala Leu Ser Gln
85 90 95
Asn Tyr Ser Ala Ala Leu Gln Thr Asn Ile Gln Asp Tyr Ile Ile Ala
100 105 110
Gln Ala Lys Leu Gln Gly Val Ser Asn Pro Ser Gly Ser Leu Ser Asp
115 120 125
Gly Thr Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Leu Thr Gln Phe
130 135 140
Thr Gly Asp Trp Gly Arg Pro Gln Arg Asp Gly Pro Pro Leu Arg Ala
145 150 155 160
Ile Ala Leu Ile Arg Tyr Ala Lys Trp Leu Ala Ser Asn Gly Tyr Lys
165 170 175
Asp Thr Ala Asn Ser Val Val Trp Pro Val Ile Lys Asn Asp Leu Ala
180 185 190
Tyr Ala Ala Gln Tyr Trp Asn Glu Thr Gly Phe Asp Leu Trp Glu Glu
195 200 205
Val Pro Gly Ser Ser Phe Phe Thr Ile Ala Ser Thr His Arg Ala Leu
210 215 220
Val Glu Gly Ala Ala Leu Ala Ala Gln Leu Gly Thr Glu Cys Ser Ala
225 230 235 240
Cys Ile Thr Val Ala Pro Gln Val Leu Cys Phe Gln Gln Ser Phe Trp
245 250 255
Asn Pro Ser Gly Gly Tyr Val Val Ser Asn Ile Asn Gly Gly Asn Asn
260 265 270
Arg Ser Gly Lys Asp Leu Asn Ser Val Leu Ala Ser Ile His Thr Phe
275 280 285
Asp Pro Ala Val Gly Cys Asp Ser Val Thr Phe Gln Pro Cys Ser Asp
290 295 300
Lys Ala Leu Ser Asn His Lys Ala Tyr Val Asp Ser Phe Arg Ser Val
305 310 315 320
Tyr Ala Ile Asn Ser Gly Ile Ala Gln Gly Lys Ala Val Ala Val Gly
325 330 335
Arg Tyr Ser Glu Asp Val Tyr Tyr Asn Gly Asn Pro Trp Tyr Leu Ala
340 345 350
Asn Phe Ala Ala Ala Glu Gln Leu Tyr Asp Ala Val Phe Val Trp Lys
355 360 365
Lys Gln Gln Ser Ile Glu Val Thr Gln Leu Ser Leu Pro Phe Phe Lys
370 375 380
Asp Leu Leu Pro Gly Ile Ser Thr Gly Thr Tyr Thr Pro Ser Ser Ser
385 390 395 400
Thr Tyr Gln Gln Ile Leu Asp Ala Val Ser Ala Tyr Ala Asp Gly Phe
405 410 415
Ile Asp Val Ala Ala Lys Tyr Thr Pro Ser Asp Gly Ser Leu Ala Glu
420 425 430
Gln Tyr Thr Arg Asp Ser Gly Gln Pro Ile Ser Ala Lys Asp Leu Thr
435 440 445
Trp Ser Tyr Ala Ala Phe Leu Ser Ala Ala Asp Arg Arg Ala Gly Ile
450 455 460
Val Pro Ala Gly Trp Ser Ala Glu His Gly Lys Thr Leu Pro Gly Ser
465 470 475 480
Cys Ser Ala Val Gln Val Ala Gly Thr Tyr Thr Gln Ala Thr Ala Thr
485 490 495
Ser Phe Pro Pro Gly Gln Thr Pro Asn Pro Thr Ser Asp Thr Pro Ala
500 505 510
Pro Phe Pro Thr Ala Cys Ala Asp Ser Thr Gln Val Phe Val Thr Phe
515 520 525
Arg Ala Glu Val Thr Thr Gln Trp Gly Gln Ser Val Lys Val Val Gly
530 535 540
Ser Ser Ser Glu Leu Gly Asn Trp Asp Val Ser Lys Ala Pro Arg Leu
545 550 555 560
Ser Ala Ser Ala Tyr Thr Ala Ser Asp Pro Leu Trp Ala Ile Thr Val
565 570 575
Pro Met Lys Ala Gly Gln Ser Val Gln Tyr Lys Phe Val Lys Val Asn
580 585 590
Gly Asp Gly Ser Ile Gln Trp Glu Ser Asp Pro Asn Arg Gln Phe Thr
595 600 605
Val Ser Ser Ser Ser Thr Ala Ser Gly Cys Ala Trp Gln Thr Ile Glu
610 615 620
Ala Thr Trp Arg
625
<210> 24
<211> 640
<212> PRT
<213> Aspergillus niger
<400> 24
Met Ser Phe Arg Ser Leu Leu Ala Leu Ser Gly Leu Val Cys Thr Gly
1 5 10 15
Leu Ala Asn Val Ile Ser Lys Arg Ala Thr Leu Asp Ser Trp Leu Ser
20 25 30
Asn Glu Ala Thr Val Ala Arg Thr Ala Ile Leu Asn Asn Ile Gly Ala
35 40 45
Asp Gly Ala Trp Val Ser Gly Ala Asp Ser Gly Ile Val Val Ala Ser
50 55 60
Pro Ser Thr Asp Asn Pro Asp Tyr Phe Tyr Thr Trp Thr Arg Asp Ser
65 70 75 80
Gly Leu Val Leu Lys Thr Leu Val Asp Leu Phe Arg Asn Gly Asp Thr
85 90 95
Ser Leu Leu Ser Thr Ile Glu Asn Tyr Ile Ser Ala Gln Ala Ile Val
100 105 110
Gln Gly Ile Ser Asn Pro Ser Gly Asp Leu Ser Ser Gly Ala Gly Leu
115 120 125
Gly Glu Pro Lys Phe Asn Val Asp Glu Thr Ala Tyr Thr Gly Ser Trp
130 135 140
Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu Arg Ala Thr Ala Met Ile
145 150 155 160
Gly Phe Gly Gln Trp Leu Leu Asp Asn Gly Tyr Thr Ser Thr Ala Thr
165 170 175
Asp Ile Val Trp Pro Leu Val Arg Asn Asp Leu Ser Tyr Val Ala Gln
180 185 190
Tyr Trp Asn Gln Thr Gly Tyr Asp Leu Trp Glu Glu Val Asn Gly Ser
195 200 205
Ser Phe Phe Thr Ile Ala Val Gln His Arg Ala Leu Val Glu Gly Ser
210 215 220
Ala Phe Ala Thr Ala Val Gly Ser Ser Cys Ser Trp Cys Asp Ser Gln
225 230 235 240
Ala Pro Glu Ile Leu Cys Tyr Leu Gln Ser Phe Trp Thr Gly Ser Phe
245 250 255
Ile Leu Ala Asn Phe Asp Ser Ser Arg Ser Gly Lys Asp Ala Asn Thr
260 265 270
Leu Leu Gly Ser Ile His Thr Phe Asp Pro Glu Ala Ala Cys Asp Asp
275 280 285
Ser Thr Phe Gln Pro Cys Ser Pro Arg Ala Leu Ala Asn His Lys Glu
290 295 300
Val Val Asp Ser Phe Arg Ser Ile Tyr Thr Leu Asn Asp Gly Leu Ser
305 310 315 320
Asp Ser Glu Ala Val Ala Val Gly Arg Tyr Pro Glu Asp Thr Tyr Tyr
325 330 335
Asn Gly Asn Pro Trp Phe Leu Cys Thr Leu Ala Ala Ala Glu Gln Leu
340 345 350
Tyr Asp Ala Leu Tyr Gln Trp Asp Lys Gln Gly Ser Leu Glu Val Thr
355 360 365
Asp Val Ser Leu Asp Phe Phe Lys Ala Leu Tyr Ser Asp Ala Ala Thr
370 375 380
Gly Thr Tyr Ser Ser Ser Ser Ser Thr Tyr Ser Ser Ile Val Asp Ala
385 390 395 400
Val Lys Thr Phe Ala Asp Gly Phe Val Ser Ile Val Glu Thr His Ala
405 410 415
Ala Ser Asn Gly Ser Met Ser Glu Gln Tyr Asp Lys Ser Asp Gly Glu
420 425 430
Gln Leu Ser Ala Arg Asp Leu Thr Trp Ser Tyr Ala Ala Leu Leu Thr
435 440 445
Ala Asn Asn Arg Arg Asn Ser Val Val Pro Ala Ser Trp Gly Glu Thr
450 455 460
Ser Ala Ser Ser Val Pro Gly Thr Cys Ala Ala Thr Ser Ala Ile Gly
465 470 475 480
Thr Tyr Ser Ser Val Thr Val Thr Ser Trp Pro Ser Ile Val Ala Thr
485 490 495
Gly Gly Thr Thr Thr Thr Ala Thr Pro Thr Gly Ser Gly Ser Val Thr
500 505 510
Ser Thr Ser Lys Thr Thr Ala Thr Ala Ser Lys Thr Ser Thr Ser Thr
515 520 525
Ser Ser Thr Ser Cys Thr Thr Pro Thr Ala Val Ala Val Thr Phe Asp
530 535 540
Leu Thr Ala Thr Thr Thr Tyr Gly Glu Asn Ile Tyr Leu Val Gly Ser
545 550 555 560
Ile Ser Gln Leu Gly Asp Trp Glu Thr Ser Asp Gly Ile Ala Leu Ser
565 570 575
Ala Asp Lys Tyr Thr Ser Ser Asp Pro Leu Trp Tyr Val Thr Val Thr
580 585 590
Leu Pro Ala Gly Glu Ser Phe Glu Tyr Lys Phe Ile Arg Ile Glu Ser
595 600 605
Asp Asp Ser Val Glu Trp Glu Ser Asp Pro Asn Arg Glu Tyr Thr Val
610 615 620
Pro Gln Ala Cys Gly Thr Ser Thr Ala Thr Val Thr Asp Thr Trp Arg
625 630 635 640
<210> 25
<211> 1920
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide
<400> 25
atgtcgttcc gatctctact cgccctgagc ggcctcgtct gcacagggtt ggcaaatgtg 60
atttccaagc gcgcgacctt ggattcatgg ttgagcaacg aagcgaccgt ggctcgtact 120
gccatcctga ataacatcgg ggcggacggt gcttgggtgt cgggcgcgga ctctggcatt 180
gtcgttgcta gtcccagcac ggataacccg gactacttct acacctggac tcgcgactct 240
ggtctcgtcc tcaagaccct cgtcgatctc ttccgaaatg gagataccag tctcctctcc 300
accattgaga actacatctc cgcccaggca attgtccagg gtatcagtaa cccctctggt 360
gatctgtcca gcggcgctgg tctcggtgaa cccaagttca atgtcgatga gactgcctac 420
actggttctt ggggacggcc gcagcgagat ggtccggctc tgagagcaac tgctatgatc 480
ggcttcgggc agtggctgct tgacaatggc tacaccagca ccgcaacgga cattgtttgg 540
cccctcgtta ggaacgacct gtcgtatgtg gctcaatact ggaaccagac aggatatgat 600
ctctgggaag aagtcaatgg ctcgtctttc tttacgattg ctgtgcaaca ccgcgccctt 660
gtcgaaggta gtgccttcgc gacggccgtc ggctcgtcct gctcctggtg tgattctcag 720
gcacccgaaa ttctctgcta cctgcagtcc ttctggaccg gcagcttcat tctggccaac 780
ttcgatagca gccgttccgg caaggacgca aacaccctcc tgggaagcat ccacaccttt 840
gatcctgagg ccgcatgcga cgactccacc ttccagccct gctccccgcg cgcgctcgcc 900
aaccacaagg aggttgtaga ctctttccgc tcaatctata ccctcaacga tggtctcagt 960
gacagcgagg ctgttgcggt gggtcggtac cctgaggaca cgtactacaa cggcaacccg 1020
tggttcctgt gcaccttggc tgccgcagag cagttgtacg atgctctata ccagtgggac 1080
aagcaggggt cgttggaggt cacagatgtg tcgctggact tcttcaaggc actgtacagc 1140
gatgctgcta ctggcaccta ctcttcgtcc agttcgactt atagtagcat tgtagatgcc 1200
gtgaagactt tcgccgatgg cttcgtctct attgtggaaa ctcacgccgc aagcaacggc 1260
tccatgtccg agcaatacga caagtctgat ggcgagcagc tttccgctcg cgacctgacc 1320
tggtcttatg ctgctctgct gaccgccaac aaccgtcgta actccgtcgt gcctgcttct 1380
tggggcgaga cctctgccag cagcgtgccc ggcacctgtg cggccacatc tgccattggt 1440
acctacagca gtgtgactgt cacctcgtgg ccgagtatcg tggctactgg cggcaccact 1500
acgacggcta cccccactgg atccggcagc gtgacctcga ccagcaagac caccgcgact 1560
gctagcaaga ccagcaccag tacgtcatca acctcctgta ccactcccac cgccgtggct 1620
gtgactttcg atctgacagc taccaccacc tacggcgaga acatctacct ggtcggatcg 1680
atctctcagc tgggtgactg ggaaaccagc gacggcatag ctctgagtgc tgacaagtac 1740
acttccagcg acccgctctg gtatgtcact gtgactctgc cggctggtga gtcgtttgag 1800
tacaagttta tccgcattga gagcgatgac tccgtggagt gggagagtga tcccaaccga 1860
gaatacaccg ttcctcaggc gtgcggaacg tcgaccgcga cggtgactga cacctggcgg 1920
<210> 26
<211> 389
<212> PRT
<213> Myceliophthora thermophila
<400> 26
Met Lys Ser Ser Ile Leu Ala Ser Val Phe Ala Thr Gly Ala Val Ala
1 5 10 15
Gln Ser Gly Pro Trp Gln Gln Cys Gly Gly Ile Gly Trp Gln Gly Ser
20 25 30
Thr Asp Cys Val Ser Gly Tyr His Cys Val Tyr Gln Asn Asp Trp Tyr
35 40 45
Ser Gln Cys Val Pro Gly Ala Ala Ser Thr Thr Leu Gln Thr Ser Thr
50 55 60
Thr Ser Arg Pro Thr Ala Thr Ser Thr Ala Pro Pro Ser Ser Thr Thr
65 70 75 80
Ser Pro Ser Lys Gly Lys Leu Lys Trp Leu Gly Ser Asn Glu Ser Gly
85 90 95
Ala Glu Phe Gly Glu Gly Asn Tyr Pro Gly Leu Trp Gly Lys His Phe
100 105 110
Ile Phe Pro Ser Thr Ser Ala Ile Gln Thr Leu Ile Asn Asp Gly Tyr
115 120 125
Asn Ile Phe Arg Ile Asp Phe Ser Met Glu Arg Leu Val Pro Asn Gln
130 135 140
Leu Thr Ser Ser Phe Asp Glu Gly Tyr Leu Arg Asn Leu Thr Glu Val
145 150 155 160
Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His
165 170 175
Asn Tyr Gly Arg Tyr Tyr Gly Asn Val Ile Thr Asp Thr Asn Ala Phe
180 185 190
Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu
195 200 205
Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu
210 215 220
Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly
225 230 235 240
Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala
245 250 255
Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro
260 265 270
Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser
275 280 285
Ser Gly Thr His Ala Glu Cys Val Ser Ser Asn Ile Gly Ala Gln Arg
290 295 300
Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val
305 310 315 320
Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val
325 330 335
Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Asp Val Trp Leu Gly
340 345 350
Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser
355 360 365
Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Asn Tyr Asn Ser Ile Leu
370 375 380
Lys Lys Tyr Leu Pro
385
<210> 27
<211> 1167
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide
<400> 27
atgaagtcct ccatcctcgc cagcgtcttc gccacgggcg ccgtggctca aagtggtccg 60
tggcagcaat gtggtggcat cggatggcaa ggatcgaccg actgtgtgtc gggttaccac 120
tgcgtctacc agaacgattg gtacagccag tgcgtgcctg gcgcggcgtc gacaacgctc 180
cagacatcta ccacgtccag gcccaccgcc accagcaccg cccctccgtc gtccaccacc 240
tcgcctagca agggcaagct caagtggctc ggcagcaacg agtcgggcgc cgagttcggg 300
gagggcaact accccggcct ctggggcaag cacttcatct tcccgtcgac ttcggcgatt 360
cagacgctca tcaatgatgg atacaacatc ttccggatcg acttctcgat ggagcgtctg 420
gtgcccaacc agttgacgtc gtccttcgac gagggctacc tccgcaacct gaccgaggtg 480
gtcaacttcg tgacgaacgc gggcaagtac gccgtcctgg acccgcacaa ctacggccgg 540
tactacggca acgtcatcac ggacacgaac gcgttccgga ccttctggac caacctggcc 600
aagcagttcg cctccaactc gctcgtcatc ttcgacacca acaacgagta caacacgatg 660
gaccagaccc tggtgctcaa cctcaaccag gccgccatcg acggcatccg ggccgccggc 720
gcgacctcgc agtacatctt cgtcgagggc aacgcgtgga gcggggcctg gagctggaac 780
acgaccaaca ccaacatggc cgccctgacg gacccgcaga acaagatcgt gtacgagatg 840
caccagtacc tcgactcgga cagctcgggc acccacgccg agtgcgtcag cagcaacatc 900
ggcgcccagc gcgtcgtcgg agccacccag tggctccgcg ccaacggcaa gctcggcgtc 960
ctcggcgagt tcgccggcgg cgccaacgcc gtctgccagc aggccgtcac cggcctcctc 1020
gaccacctcc aggacaacag cgacgtctgg ctgggtgccc tctggtgggc cgccggtccc 1080
tggtggggcg actacatgta ctcgttcgag cctccttcgg gcaccggcta tgtcaactac 1140
aactcgatcc taaagaagta cttgccg 1167
<210> 28
<211> 281
<212> PRT
<213> Artificial Sequence
<220>
<223> Polypeptide
<400> 28
Met Ser Glu Tyr Gln Pro Ser Leu Phe Ala Leu Asn Pro Met Gly Phe
1 5 10 15
Ser Pro Leu Asp Gly Ser Lys Ser Thr Asn Glu Asn Val Ser Ala Ser
20 25 30
Thr Ser Thr Ala Lys Pro Met Val Gly Gln Leu Ile Phe Asp Lys Phe
35 40 45
Ile Lys Thr Glu Glu Asp Pro Ile Ile Lys Gln Asp Thr Pro Ser Asn
50 55 60
Leu Asp Phe Asp Phe Ala Leu Pro Gln Thr Ala Thr Ala Pro Asp Ala
65 70 75 80
Lys Thr Val Leu Pro Ile Pro Glu Leu Asp Asp Ala Val Val Glu Ser
85 90 95
Phe Phe Ser Ser Ser Thr Asp Ser Thr Pro Met Phe Glu Tyr Glu Asn
100 105 110
Leu Glu Asp Asn Ser Lys Glu Trp Thr Ser Leu Phe Asp Asn Asp Ile
115 120 125
Pro Val Thr Thr Asp Asp Val Ser Leu Ala Asp Lys Ala Ile Glu Ser
130 135 140
Thr Glu Glu Val Ser Leu Val Pro Ser Asn Leu Glu Val Ser Thr Thr
145 150 155 160
Ser Phe Leu Pro Thr Pro Val Leu Glu Asp Ala Lys Leu Thr Gln Thr
165 170 175
Arg Lys Val Lys Lys Pro Asn Ser Val Val Lys Lys Ser His His Val
180 185 190
Gly Lys Asp Asp Glu Ser Arg Leu Asp His Leu Gly Val Val Ala Tyr
195 200 205
Asn Arg Lys Gln Arg Ser Ile Pro Leu Ser Pro Ile Val Pro Glu Ser
210 215 220
Ser Asp Pro Ala Ala Leu Lys Arg Ala Arg Asn Thr Glu Ala Ala Arg
225 230 235 240
Arg Ser Arg Ala Arg Lys Leu Gln Arg Met Lys Gln Leu Glu Asp Lys
245 250 255
Val Glu Glu Leu Leu Ser Lys Asn Tyr His Leu Glu Asn Glu Val Ala
260 265 270
Arg Leu Lys Lys Leu Val Gly Glu Arg
275 280
<210> 29
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> Peptide
<400> 29
Gly Tyr Ile Pro Glu Ala Pro Arg Asp Gly Gln Ala Tyr Val Arg Lys
1 5 10 15
Asp Gly Glu Trp Val Leu Leu Ser Thr Phe Leu
20 25
<210> 30
<211> 85
<212> PRT
<213> Artificial Sequence
<220>
<223> Polynucleotide
<400> 30
Gly Gly Cys Thr Ala Cys Ala Thr Cys Cys Cys Cys Gly Ala Gly Gly
1 5 10 15
Cys Cys Cys Cys Cys Cys Gly Cys Gly Ala Cys Gly Gly Cys Cys Ala
20 25 30
Gly Gly Cys Cys Thr Ala Cys Gly Thr Cys Cys Gly Cys Ala Ala Gly
35 40 45
Gly Ala Cys Gly Gly Cys Gly Ala Gly Thr Gly Gly Gly Thr Cys Cys
50 55 60
Thr Cys Cys Thr Cys Ala Gly Cys Ala Cys Cys Thr Thr Cys Cys Thr
65 70 75 80
Gly Thr Gly Ala Gly
85
<210> 31
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Peptide
<400> 31
Val Ile Ser Lys Arg
1 5
<210> 32
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> Peptide
<400> 32
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5

Claims (24)

1.一种被遗传修饰以生产流感病毒表面蛋白的嗜热毁丝霉(Myceliophthorathermophila)C1,其包含含有可操作连接到至少一种C1调控序列的编码所述流感病毒表面蛋白的核酸序列的表达构建物,其中所述流感病毒表面蛋白包含其胞外域和跨膜结构域,并且作为膜结合蛋白表达在所述C1中。
2.权利要求1所述的C1,其中所述流感病毒表面蛋白是血凝素(HA)。
3.权利要求2所述的C1,其中所述表达构建物还包含同框连接到编码所述HA的核酸序列的编码C1信号肽的核酸序列。
4.权利要求2所述的C1,其中所述HA亚型选自流感A-H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15和H16和流感B亚型。
5.权利要求2所述的C1,其中所述HA亚型是感染人类的选自流感A亚型H1、H2和H3和流感B亚型的亚型。
6.权利要求2所述的C1,其中所述HA来自于选自A/新喀里多尼亚/20/99(H1N1)、A/加利福尼亚/04/2009(H1N1)、A/乌拉圭/716/07(H3N2)(A/布里斯班/10/07样)、B/佛罗里达/04/2006:B山形谱系、A/波多黎各/08/1934(H1N1)和A/德克萨斯/50/2012(H3N2)的流感病毒株。
7.权利要求1所述的C1,其中所述至少一种C1调控序列包含C1启动子。
8.权利要求7所述的C1,其中所述C1启动子选自hex1(伏鲁宁体)、cbh1(纤维二糖水解酶1)和chi1(几丁质酶1)启动子。
9.权利要求7所述的C1,其中所述C1启动子是hex1启动子。
10.权利要求3所述的C1,其中所述C1信号肽是源自于选自Gla1(葡萄糖淀粉酶1,C1)、GlaA(葡萄糖淀粉酶A,曲霉(Aspergillus))和Cbh1(纤维二糖水解酶1,C1)的蛋白的信号肽。
11.权利要求10所述的C1,其中所述C1信号肽源自于Cbh1。
12.权利要求1所述的C1,其中所述表达构建物包含可操作连接到编码融合到HA的Cbh1信号肽的核酸序列的hex1启动子。
13.权利要求12所述的C1,其中所述HA来自于选自A/新喀里多尼亚/20/99(H1N1)、A/加利福尼亚/04/2009(H1N1)、B/佛罗里达/04/2006:B山形谱系、A/波多黎各/08/1934(H1N1)和A/德克萨斯/50/2012(H3N2)的流感病毒株。
14.权利要求1所述的C1,其中所述流感病毒表面蛋白是神经氨酸酶(NA)。
15.权利要求14所述的C1,其中所述NA亚型选自流感A-N1、N2、N3、N4、N5、N6、N7、N8和N9和流感B亚型。
16.权利要求14所述的C1,其中所述NA亚型是感染人类的选自流感A亚型N1和N2和流感B亚型的亚型。
17.权利要求14所述的C1,其中所述表达构建物包含可操作连接到编码NA的核酸序列的hex1启动子。
18.权利要求17所述的C1,其中所述NA来自于流感病毒株A/新喀里多尼亚/20/99(H1N1)。
19.权利要求1所述的C1,其中所述C1菌株选自W1L#100I(prt-Δalp1Δchi1Δalp2Δpyr5)保藏号CBS141153、UV18-100f(prt-Δalp1,Δpyr5)保藏号CBS141147、W1L#100I(prt-Δalp1Δchi1Δpyr5)保藏号CBS141149和UV18-100f(prt-Δalp1Δpep4Δalp2,Δprt1Δpyr5)保藏号CBS141143。
20.一种生产流感病毒表面蛋白的方法,所述方法包括将权利要求1所述的嗜热毁丝霉(Myceliophthora thermophila)C1在适合于表达所述流感病毒表面蛋白的条件下培养;以及回收所述流感病毒表面蛋白。
21.权利要求20所述的方法,其中回收所述流感病毒表面蛋白包括从菌丝体提取。
22.一种用于在嗜热毁丝霉(Myceliophthora thermophila)C1中表达膜结合的流感病毒表面蛋白的表达构建物,所述表达构建物包含可操作连接到编码流感病毒表面蛋白的核酸序列的至少一种C1调控序列,其中所述流感病毒表面蛋白包含其胞外域和跨膜结构域。
23.一种基本上纯的重组流感病毒表面蛋白,其由权利要求1所述的修饰的嗜热毁丝霉(Myceliophthora thermophila)C1生产,其中所述流感病毒表面蛋白被纯化到95%或更高的纯度,是有活性和免疫原性的,并在用作疫苗时诱导保护性免疫应答。
24.一种流感疫苗组合物,其包含由权利要求1所述的修饰的嗜热毁丝霉(Myceliophthora thermophila)C1生产的流感病毒表面蛋白。
CN201880053773.2A 2017-08-21 2018-08-09 在嗜热毁丝霉(myceliophthora thermophila)中生产流感疫苗 Pending CN111315408A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762547885P 2017-08-21 2017-08-21
US62/547,885 2017-08-21
PCT/IB2018/056003 WO2019038623A1 (en) 2017-08-21 2018-08-09 PRODUCTION OF AN INFLUENZA VACCINE IN MYCELIOPHTHORA THERMOPHILA

Publications (1)

Publication Number Publication Date
CN111315408A true CN111315408A (zh) 2020-06-19

Family

ID=65438455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880053773.2A Pending CN111315408A (zh) 2017-08-21 2018-08-09 在嗜热毁丝霉(myceliophthora thermophila)中生产流感疫苗

Country Status (9)

Country Link
US (2) US11738080B2 (zh)
EP (1) EP3672630A4 (zh)
JP (1) JP2020533966A (zh)
KR (1) KR20200090143A (zh)
CN (1) CN111315408A (zh)
AU (1) AU2018319501A1 (zh)
CA (1) CA3073646A1 (zh)
IL (1) IL272568A (zh)
WO (1) WO2019038623A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230313121A1 (en) * 2020-05-14 2023-10-05 Dyadic International (Usa), Inc. Modified filamentous fungi for production of exogenous proteins
JP2024509895A (ja) * 2021-03-11 2024-03-05 ダイアディク インターナショナル(ユーエスエー),インコーポレイテッド N-結合グリコシル化が低いか全くない外因性タンパク質の産生のための遺伝子組換え糸状菌
US20230372467A1 (en) 2022-05-20 2023-11-23 Phibro Animal Health Corporation Using fungal constructs to produce viral protein antigens

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043903A (zh) * 2004-10-15 2007-09-26 纽詹尼西斯有限公司 基于组合方式产生多价重组抗原的方法和组合物
WO2008073490A1 (en) * 2006-12-12 2008-06-19 Carrington Laboratories Inc., Purification of influenza viral antigens
US20120107856A1 (en) * 2009-03-16 2012-05-03 Punt Peter J New Fungal Production System
WO2016097369A1 (en) * 2014-12-19 2016-06-23 Sanofi Pasteur Multimerization of recombinant protein by fusion to a sequence from lamprey

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995032309A1 (en) 1994-05-20 1995-11-30 The Mount Sinai School Of Medicine Of The City University Of New York Treatment of influenza virus infection using antivirals that inhibit acylation/palmitylation of hemagglutinin
DE69922978T2 (de) 1998-10-06 2005-12-08 Emalfarb, Mark Aaron, Jupiter Transformationsystem in filamentösen fungiziden chrysosporium-wirtszellen
HUP0300469A2 (hu) * 2000-04-13 2003-06-28 Emalfarb, Mark Aaron Új, expressziós szabályzó szekvenciák és expressziós termékek fonalas gombákban
US8506967B2 (en) 2003-07-11 2013-08-13 Novavax, Inc. Functional influenza virus like particles (VLPs)
US8680252B2 (en) 2006-12-10 2014-03-25 Dyadic International (Usa), Inc. Expression and high-throughput screening of complex expressed DNA libraries in filamentous fungi
JP2012521786A (ja) 2009-03-30 2012-09-20 モウント シナイ スクール オフ メディシネ インフルエンザウイルスワクチン及びその使用
WO2010150982A2 (ko) 2009-06-23 2010-12-29 한밭대학교 산학협력단 안전성이 뛰어난 인플루엔자 바이러스 백신용 재조합 헤마글루티닌 단백질 및 이를 함유하는 생분해성 plga 미립자의 제조 방법
JP2013518059A (ja) 2010-01-24 2013-05-20 バイオロジカル・ミメティックス,インコーポレーテッド 免疫原性インフルエンザ組成物
EP2825644A1 (en) * 2012-03-12 2015-01-21 Codexis, Inc. Cbh1a variants
US20130315955A1 (en) 2012-04-13 2013-11-28 Protein Sciences Corporation Stability and potency of hemagglutinin
MX2018006535A (es) 2015-12-02 2018-08-15 Basf Se Metodo para producir proteinas en hongos filamentosos con accion clr2 reducida.

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101043903A (zh) * 2004-10-15 2007-09-26 纽詹尼西斯有限公司 基于组合方式产生多价重组抗原的方法和组合物
WO2008073490A1 (en) * 2006-12-12 2008-06-19 Carrington Laboratories Inc., Purification of influenza viral antigens
US20120107856A1 (en) * 2009-03-16 2012-05-03 Punt Peter J New Fungal Production System
WO2016097369A1 (en) * 2014-12-19 2016-06-23 Sanofi Pasteur Multimerization of recombinant protein by fusion to a sequence from lamprey

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ISABELLE LEGASTELOIS 等: "Non-conventional expression systems for the production of vaccine proteins and immunotherapeutic molecules" *

Also Published As

Publication number Publication date
EP3672630A4 (en) 2021-06-02
US11738080B2 (en) 2023-08-29
KR20200090143A (ko) 2020-07-28
CA3073646A1 (en) 2019-02-28
US20200215183A1 (en) 2020-07-09
WO2019038623A1 (en) 2019-02-28
AU2018319501A1 (en) 2020-04-02
US20230346913A1 (en) 2023-11-02
IL272568A (en) 2020-03-31
EP3672630A1 (en) 2020-07-01
JP2020533966A (ja) 2020-11-26

Similar Documents

Publication Publication Date Title
JP6666950B2 (ja) 微細藻類における異種ポリペプチド、微細藻類細胞外体、組成物の産生、ならびにそれらの作製および使用の方法
KR101541330B1 (ko) 식물에서 생산된 헤마글루티닌을 포함하는 인플루엔자 바이러스-유사 입자(VLPs)
US20230346913A1 (en) Production of flu vaccine in myceliophthora thermophila
EA034733B1 (ru) Нуклеиновая кислота для увеличенной экспрессии гемагглютинина вируса гриппа в растении и ее применение
KR20100120157A (ko) 헤마글루티닌을 발현하는 트랜스제닉 식물에서 생산된 재조합 인플루엔자 바이러스-유사 입자(VLPs)
CN112592389A (zh) 植物中流感样病毒颗粒的产生
CN110981968B (zh) 含有狂犬病病毒g蛋白的融合蛋白及其制备方法、应用和疫苗
KR20210025627A (ko) 인플루엔자 바이러스 헤마글루티닌 돌연변이들
CN106636015B (zh) 一种嵌合型新城疫病毒样颗粒的制备方法
CN113797326B (zh) 一种预防冠状病毒引起疾病的疫苗
CN113827714B (zh) 一种h7n9亚型禽流感病毒样颗粒疫苗制剂及制备和应用
CN114075567A (zh) 优化的表达新型冠状病毒抗原的核苷酸序列及其应用
RU2801708C2 (ru) Мутанты гемагглютинина вируса гриппа
RU2809237C2 (ru) Мутанты гемагглютинина вируса гриппа
CN115956084A (zh) 包含与唾液酸的相互作用降低的修饰的流感血球凝集素的超结构
CN116589596A (zh) 甲型流感na多肽广谱免疫原及其序贯免疫方法
Mahmoud Bayoumi et al. Giza, 12211-Egypt
AU2015202195A1 (en) New influenza virus immunizing epitope
KR19990022028A (ko) 인플루엔자 헤마글루티닌 다가 백신의 제조방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200619

WD01 Invention patent application deemed withdrawn after publication