CN113164586B - 免疫组合物及其制备方法与应用 - Google Patents

免疫组合物及其制备方法与应用 Download PDF

Info

Publication number
CN113164586B
CN113164586B CN201980063806.6A CN201980063806A CN113164586B CN 113164586 B CN113164586 B CN 113164586B CN 201980063806 A CN201980063806 A CN 201980063806A CN 113164586 B CN113164586 B CN 113164586B
Authority
CN
China
Prior art keywords
leu
thr
ala
gly
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201980063806.6A
Other languages
English (en)
Other versions
CN113164586A (zh
Inventor
慕婷
赵萍
徐龙
肖杨
朱利安·琼·菲利普
吴月
谢亮
陈雪婷
刘奇
谢铎源
庄再成
克莱因·米歇尔
杜林森
吴克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bravovax Co ltd
Original Assignee
Bravovax Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bravovax Co ltd filed Critical Bravovax Co ltd
Publication of CN113164586A publication Critical patent/CN113164586A/zh
Application granted granted Critical
Publication of CN113164586B publication Critical patent/CN113164586B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/245Herpetoviridae, e.g. herpes simplex virus
    • A61K39/25Varicella-zoster virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/39Medicinal preparations containing antigens or antibodies characterised by the immunostimulating additives, e.g. chemical adjuvants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/20Antivirals for DNA viruses
    • A61P31/22Antivirals for DNA viruses for herpes viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/01DNA viruses
    • C07K14/03Herpetoviridae, e.g. pseudorabies virus
    • C07K14/04Varicella-zoster virus
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/255Salmonella (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/545Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55516Proteins; Peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/60Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
    • A61K2039/6031Proteins
    • A61K2039/6068Other bacterial proteins, e.g. OMP
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/40Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10041Use of virus, viral particle or viral elements as a vector
    • C12N2710/10043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16711Varicellovirus, e.g. human herpesvirus 3, Varicella Zoster, pseudorabies
    • C12N2710/16722New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16711Varicellovirus, e.g. human herpesvirus 3, Varicella Zoster, pseudorabies
    • C12N2710/16734Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Abstract

本发明提供了一种免疫组合物及其制备方法与应用。本发明通过原核表达体系或重组腺病毒体系高效表达VZV包膜gE糖蛋白及其gE鞭毛素融合蛋白。将制得的重组gE蛋白、gE鞭毛素融合蛋白及重组腺病毒载体或其组合物免疫小鼠后可刺激机体产生gE和VZV特异性抗体滴度及gE和VZV特异性的细胞免疫。

Description

免疫组合物及其制备方法与应用
技术领域
本发明涉及一种重组VZV gE糖蛋白及自身具有佐剂功能的融合蛋白、重组载体、制备方法、免疫组合物及其制备方法与应用。
背景技术
水痘-带状疱疹病毒(varicella-zoster virus,VZV)是疱疹病毒属(Herpesviridae)α疱疹病毒亚科成员,是一种直径150~200nm的双链DNA病毒,形态学上是由核酸内心、蛋白衣壳和包膜构成的同心圆状结构,表面由162个壳微粒组成的对称正二十面体。VZV是一种全球性病原体,有嗜皮肤和神经的特征。儿童原发性感染可导致水痘。水痘是一种通过皮肤接触或呼吸道飞沫传播的高传染性疾病,其特征是面部和躯干出现播散性水疱样皮疹,伴随瘙痒和发热。VZV原发性感染偶见内脏并发症,例如脑炎、肝炎、胰腺炎或肺炎等可能危及生命的严重并发症,尤其是在未接种疫苗的幼儿和成人以及免疫抑制人群中。初次感染后,VZV可终生潜伏于颅神经和背根神经节。数十年后,VZV仍可被重新激活,引起疼痛性带状疱疹(HZ)疾病或其他严重的神经系统并发症或眼部并发症,并可导致衰竭性带状疱疹愈后神经痛—最常见的带状疱疹慢性并发症。超过95%的50岁以上免疫力正常人群血清呈VZV抗体阳性,因而有罹患带状疱疹的风险。带状疱疹的终生发病风险在25%至30%之间,80岁后风险则上升到50%(Johnson RW et al.,Ther Adv Vaccines,3:109-120,2015)。在免疫受损的个体中,VZV感染的发生率和死亡率都很高。例如,在器官移植患者中,水痘可能是致命性的,伴随有严重的播散性皮损、脏器损伤和血管内凝血。带状疱疹(HZ)也是器官移植患者常见的并发症。VZV引起的疾病及其相关后遗症(如带状疱疹愈后神经痛)已逐渐成为重大的疾病负担及重要的公共卫生问题,并急需得到更多医疗方面的关注。
对于水痘和带状疱疹,主要是对症处理,无特效治疗方法。抗病毒药物,如阿昔洛韦、伐昔洛韦、泛昔洛韦等,虽有助于水痘及HZ患者康复,但不能预防VZV感染。而暴露VZV后给予病毒特异性免疫球蛋白,对于中止或减轻疾病负担也是有限的。研究发现,抗VZV膜抗原抗体滴度≥1/64被认为与疾病的保护相关,抗gE糖蛋白的抗体也被发现与长期保护有关。虽然感染可产生对病毒的终生免疫,但完整的细胞免疫对于从感染和复发性疾病中恢复至关重要,因为带状疱疹发生于随年龄增长T细胞免疫下降或免疫抑制的时候。CD4+T细胞增殖反应在带状疱疹预防和/或治疗中起到重要作用,不过迄今为止还未建立其与效力的相关性(Plotkin SA.,Clin Vaccine Immunol,17:1055-1065,2010)。
鉴于此,接种疫苗仍然是最有效和最可靠的预防和控制水痘和带状疱疹的手段。
水痘减毒活疫苗最早由日本的高桥(Takahashi)研究组于1974年研发成功。他们从1例3岁名叫Oka的水痘患儿体内分离出一株VZV,经人胚胎成纤维细胞、豚鼠成纤维细胞和人二倍体成纤维细胞连续传代后减毒。这一减毒活疫苗被称为Oka疫苗(vOka)。Oka疫苗目前已纳入多个国家的常规免疫计划。一般情况下,Oka疫苗十分安全,即使在免疫力部分损伤的儿童和人类免疫缺陷病毒感染儿童中也没有出现严重不良反应,还显示出良好的免疫保护效果。然而,Oka疫苗诱导的免疫保护的持久性不够长,并且一些个体在连续接种疫苗后不能达到有效的保护状态。且对青少年,Oka疫苗的免疫效果低于1~12岁的儿童,因此对于学龄前儿童,需要对该疫苗进行二次接种。目前市面上所有水痘疫苗均为减毒活疫苗,虽然罕见严重副作用,但也有报道反映接种疫苗后出现严重皮疹、肺部或肝脏感染、脑膜炎、惊厥、肺炎或全身性疫苗株严重感染,尤其是在免疫受损儿童中。
目前,带状疱疹疫苗有Merck的Zostavax以及GSK的Shingrix。Zostavax是浓缩版的Oka疫苗,于2006年获得美国FDA批准。它的有效性随着疫苗接种者的年龄下降,60岁以上人群不推荐使用,目前已被证明其能在大约五年内提供50%的保护,其效力在疫苗接种后5-8年逐步降低,且在疫苗接种8年后保护力不再具有统计学意义(Morrison VA,et al.,Clin Infect Dis,60:900-909,2015)。GSK的Shingrix采用基因重组技术,在中国仓鼠卵巢细胞中表达水痘带状疱疹病毒糖蛋白E,于2017年获得FDA批准,用于50岁及以上的人群。Shingrix对带状疱疹的保护率为90%,降低了带状疱疹愈后神经痛的风险,是Zostavax的首选替代品。但是,Shingrix使用的佐剂为GSK公司的AS01,具有副作用。
水痘减毒活疫苗给接种者带来多重风险,包括罕见但十分严重的并发症、传染给免疫受损个体及潜伏感染,更为重要地,30%接种者会遭受潜伏病毒被重新激活而导致带状疱疹发生。带状疱疹疫苗方面,中国国家药品监督局于2019年批准了Shingrix的进口注册申请,填补了国内带状疱疹疫苗的空白。但Shingrix具有副作用,国外售价大约在150美元/剂,而且目前只是针对于50岁及以上的人,由于副作用太强不能作为水痘疫苗用于儿童人群。因此,需进一步开发安全、副作用较低、无潜伏风险和带状疱疹愈后神经痛并发症风险以及更低价的改良VZV疫苗,但目前尚无进展。新型疫苗应既能引起强烈的体液反应来中和病毒,又可诱发广泛的细胞免疫以控制疾病。
VZV基因组的开放读码框架(open reading frame,ORF)共编码8种糖蛋白:糖蛋白E(gE)、gB、gH、gI、gC、gL、gK和gM。其中gE糖蛋白由ORF68基因编码,属于I型膜蛋白,是生成感染性病毒颗粒必需的糖蛋白,也是病毒包膜中含量最丰富、免疫原性最强的糖蛋白,存在于病毒颗粒的表面及VZV感染细胞的胞质内,在病毒不同成熟阶段以不同的糖基化形式存在。在处于恢复期的水痘和带状疱疹患者血清中,VZV抗体主要针对gE、gB和gH。特异性抗gE单克隆抗体可中和VZV,介导抗体依赖性细胞毒性(ADCC)。gE还是细胞免疫的主要靶点,能控制疾病和破坏感染病毒的细胞。这些特性使得gE成为开发安全、有效广谱疫苗的理想免疫原。
非活性人用疫苗通常由一种或多种免疫原组成,制剂中加入可增强其效力的免疫佐剂。目前仅有有限数量的免疫佐剂可供人类使用,如铝盐、矿物油、植物或细菌提取物。免疫佐剂具有不同的增强特性,并可引起各种不良副作用。随着对免疫应答调节机制认识的不断深入,人们发现了表达于免疫系统前哨细胞(如树突状细胞和巨噬细胞)表面及表达于淋巴细胞、共同调节先天免疫和适应性免疫的Toll样受体(Toll-like receptors,TLRs)。TLR识别保守的微生物相关分子模式(MAMP)。激动剂触发TLR产生多种多效性免疫介质,如细胞因子和趋化因子,它们参与前炎症反应,刺激先天免疫,从而起到免疫佐剂的作用。
Toll样受体5(TLR5)是一种特异性识别细菌鞭毛素蛋白的跨膜受体。鞭毛素蛋白是革兰氏阴性菌鞭毛的主要结构蛋白。鞭毛素诱导激活TLR5,启动先天免疫,诱导单核-巨噬细胞、上皮细胞活化,并释放IL-1、IL-8和TNF-α等前炎症因子。因此,鞭毛素蛋白是一种强效的全身和粘膜免疫佐剂。它由四个结构域D0、D1、D2和D3组成,其中结构域D0和D1在变形菌门中高度保守。鞭毛素蛋白N端D0-D1的螺旋和C端D1-D0的螺旋之间的相互作用形成茎状核心结构,该结构对TLR5的结合和活化至关重要。与此相反,鞭毛素的D2和D3结构域在不同细菌之间差异很大,具有很强的免疫原性但在功能性上非必须。删除D2-D3结构域不会削弱TLR5的活化,且可最大程度降低无用的抗鞭毛素蛋白抗体应答。研究显示,鞭毛素必须与目标免疫原结合才能产生最佳的免疫佐剂效应。这可以通过构建一种自身具有佐剂效应的融合蛋白来实现,其中免疫原共价连接到鞭毛素或其保留TLR 5结合活性的功能片段上,并由此保留其固有免疫刺激属性。
发明内容
本发明是为了克服已上市疫苗的上述缺陷以及改善不良反应,采用两种的不同方法开发新型免疫组合物,一种是生产能够诱导强的中和抗体和CD4+T细胞反应,副作用更低的原性的重组gE蛋白或基于gE的融合免疫原;另一种是构建更加安全的复制缺陷型腺病毒载体来表达gE基因或gE鞭毛素融合蛋白基因,以引起中和抗体应答和更广泛的CD4+T细胞和CD8+T细胞免疫;从而获得了新的糖蛋白、融合蛋白、重组载体、制备方法、组合物,且可运用于抗VZV感染的新疫苗制备中。
本发明提供了一种免疫组合物,包含基于水痘带状疱疹病毒糖蛋白E(简称gE)的抗原,可用来预防或者治疗水痘带状疱疹病毒(VZV)感染。
在一些实施方案中,基于gE的免疫原至少包含:(i)gE胞外区或其片段,或者其相应的编码核酸分子;(ii)基于gE的融合蛋白,或者其编码核酸分子;(iii)基于gE的重组载体;或者(iv)上述两种或更多的组合。
进一步地,基于gE的融合蛋白至少包含:gE胞外区或其片段共价偶联至自身具有佐剂效应的细菌鞭毛素蛋白或其片段,其中所述细菌鞭毛素蛋白或其片段具有TLR-5激动活性。
VZV gE以及鞭毛素的氨基酸序列或核酸序列可以在公众可获得的如GenBank(GB)、SwissPro(sp)、EMBL等数据库中找到,gE代表性的数据库条目包括但不限于:GBAQT34120.1、AAG32558.1、ABE03086.1等,所述登记号代表的序列通过引用并入本发明。
gE糖蛋白是一种膜蛋白,其结构包含信号肽、胞外区、跨膜区和胞内区。胞外区暴露在细菌表面并是免疫系统识别的靶点。故应当理解为本发明中提及的gE至少包含其胞外区或其片段,如有需要可在保留gE一定的抗原活性基础上进一步包含其它结构片段如跨膜和/或胞内区。根据常识,本领域技术人员可以确定gE的各结构片段,gE胞外区片段可理解为保留一定的gE的自身免疫原性的片段。
应理解的是,在保留gE一定的免疫活性的情况下,可对其做一定微小的修饰,包括但不限于:突变、替换(如功能上类似的氨基酸的保守置换)、增加、缺失或截短等,仍视为本发明公开内容。
在一些实施方案中,gE胞外区具有与SEQ ID NO.1所示氨基酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同源性。
细菌鞭毛素蛋白是许多革兰氏阴性细菌(如大肠杆菌或沙门氏菌等)的主要鞭毛成分,其一级氨基酸序列在组成和大小上随着细菌种类的不同而不同。在不同的细菌中,保守的N端D0-D1区和C端D1-D0区的结构域相互作用形成了一个功能茎样结构,该结构是TLR5结合和信号传递所必须的。中间“超变的”D2和D3区为TLR-5信号转导非必须的结构域,但分子中的“超可变”D2和D3结构域不是TLR 5信号转导所必需的,且具有很强的免疫原性并诱发不良反应,因此该部分区域可被删除且不会影响TLR5结合活性。本发明中的细菌鞭毛素蛋白可为原始的或经改造的鞭毛素蛋白。所述改造包括但不限于突变、替换(如功能上类似的氨基酸的保守置换)、增加、缺失或截短等,但应保留一定程度的TLR-5结合能力以激活天然免疫。应当理解为:本发明中的细菌鞭毛素蛋白或其片段不应引起显著的促炎性副作用。实际上,在公开的专利US2011110962A1和/或US2011230643A1中描述了鞭毛素蛋白的免疫性及其某些修饰,被引入到本发明中。在本发明中若无特殊说明,鞭毛素蛋白的N端是指其N端D0-D1区,鞭毛素蛋白的C端是指其C端D1-D0区。
在一些实施方案中,基于gE的融合蛋白至少包含:鞭毛素蛋白的N端区、鞭毛素蛋白的C端区,和gE胞外区或其片段。换言之,基于gE的融合蛋白还可包含鞭毛素蛋白或gE的其它片段
在一些具体的实施方案中,gE胞外区或其片段位于所述基于gE的融合蛋白的N端或C端;或者插入到鞭毛素蛋白N端和C端之间。
作为优选的实施方式:所述基于gE的融合蛋白选自如下任一融合形式:
融合形式1:鞭毛素蛋白N端区-鞭毛素蛋白C端区-gE胞外区或其片段;
融合形式2:gE胞外区或其片段-鞭毛素蛋白N端区-鞭毛素蛋白C端区;
融合形式3:鞭毛素蛋白N端区-gE胞外区或其片段-鞭毛素蛋白C端区;
其中,所述鞭毛素蛋白的N端区或C端区可直接或者通过连接体与gE胞外区或其片段相连;
所述鞭毛素蛋白N端区可直接或者通过连接体与鞭毛素蛋白C端区相连。
所述的连接体包括基因工程肽链(如1-20个肽键连接的氨基酸)和非肽化学接头(如烷基接头或聚乙二醇基团,其中烷基接头还可被非立体阻碍性的基团如卤素、CN、NH2等基团取代)。应当理解为所选择的连接体不会干扰所述融合蛋白的生物活性。
优选地,所述连接体为1-20个肽键连接的氨基酸,如连接体I或连接体II;连接体I如SEQ ID NO:4所示;连接体II如SEQ ID NO:7所示。
SEQ ID NO:4:SPGISGGGGGILDSMG
SEQ ID NO:7:GGGGSGGGGSGGGGS
在一些具体的实施方案中,所述鞭毛素蛋白的N端区或C端区分别通过连接体II与gE胞外区或其片段相连。
在一些具体的实施方案中,所述鞭毛素蛋白N端区通过连接体I与鞭毛素蛋白C端区相连。
在一些实施方案中,所述的鞭毛素蛋白来自沙门氏菌,例如鼠伤寒沙门氏菌(Salmonella enterica subsp.enterica serovar typhimurium(S.typhimurium))或肠道沙门氏菌(Salmonella enterica subsp.enterica serovar typhi(S.typhi)),所述鼠伤寒沙门氏菌包括但不限于strain LT2;肠道沙门氏菌包括但不限strain Ty2。
在一些具体的实施方案中,所述鞭毛素蛋白的氨基酸序列如SEQ ID NO:3(源自strain LT2)或SEQ ID NO:29(源自strain Ty2)所示。虽然蛋氨酸是天然鞭毛素分子的N端第一位氨基酸,但本发明中鞭毛素蛋白的N端始于天然序列的第二氨基酸(Ala)。
本发明所述的鼠伤寒沙门氏菌LT2鞭毛素蛋白的N端区一般为起始于SEQ ID NO:3中的第2位丙氨酸(Alanine),终止于137-176位氨基酸的任一位氨基酸;C端区一般为起始于第392-406任一位氨基酸,终止于495位氨基酸。
作为本发明一个具体的实施方式,所述鞭毛素蛋白的N端区为至少与SEQ ID NO:3中第2至176位氨基酸区域有95%同源性(例如97%,98%或99%的同源性)的氨基酸序列;C端区为至少与SEQ ID NO:3中第392至495位氨基酸区域有95%同源性(例如97%,98%或99%的同源性)的氨基酸序列。
在一个具体的实施方式中,所述鞭毛素蛋白的N端区的氨基酸序列如序列表SEQID NO:5所示:所述鞭毛素蛋白的C端区的氨基酸序列如序列表SEQ ID NO:6所示
本发明所述的肠道沙门氏菌Ty2鞭毛素蛋白的N端区一般为起始于SEQ ID NO:29的第2位丙氨酸(Alanine),终止于180-200位氨基酸的任一位氨基酸;C端区起始于第278-400任一位氨基酸,终止于506位氨基酸。
在一些实施方式中,所述Ty2鞭毛素蛋白的N端区为SEQ ID NO:29的2-180,C端区为400-506位;或者Ty2鞭毛素蛋白的N端区为SEQ ID NO:29的2-220,C端区为320-506位;或者Ty2鞭毛素蛋白的N端区为SEQ ID NO:29的1-190,C端区为278-506位。
在本发明的一些具体的实施方式中,所述鞭毛素蛋白N端区为至少与SEQ ID NO:29中第2至180位氨基酸区域有95%(例如97%,98%或99%的同源性)同源性的氨基酸序列;C端保守区为至少与SEQ ID NO:29中第400至506位氨基酸区域有95%(例如97%,98%或99%的同源性)同源性的氨基酸序列。
在一个具体的实施方式中,所述的N端保守区的氨基酸序列如SEQ ID NO:30所示;所述的C端保守区的氨基酸序列如序列表SEQ ID NO:31所示。
本发明的一些具体的实施方式中,所述基于gE的融合蛋白的氨基酸序列如SEQ IDNO:8~10、SEQ ID NO:32-34任一所示。
本发明所述的核酸分子一般为根据表达系统优化后的核酸分子,包括但不限于:DNA,RNA,mRNA,ssDNA或cDNA。
所述核酸分子可通过操作与表达控制序列连接,所述表达控制序列包括但不限于:启动子、增强子、转录终止子、起始密码子(如ATG)、内含子的剪接信号和终止密码子等,其中可考虑使用体外和体内条件性表达控制元件。利用标准的分子生物学技术,可添加额外的基因片段,例如但不限于人巨细胞病毒的早期增强子、Kozak共识序列、先导序列、Woodchuck肝炎病毒转录后调控元件、编码糖基化受体序列的核酸序列、或无关蛋白如标记或切割位点等,所述可添加的无关蛋白包括用于优化基因表达、信息稳定性、蛋白质产量、分泌和纯化等。技术人员所熟知的多种基因的克隆和构建方法,以及宿主细胞的表达系统均可使用。本发明公开的编码蛋白质的DNA序列可以在原核和真核宿主细胞中表达。
在真核表达系统中,所述核酸分子5’端还可进一步添加核酸先导序列来促进蛋白分泌,所述核酸先导序列包括但不限于日本脑炎病毒(Japanese encephalitis virus,JEV)prM蛋白基因先导序列或小鼠Igκ轻链基因先导序列;和/或所述核酸分子的5’端还可添加Kozak序列以增强翻译效率;和/或所述核酸分子的3’端还可添加polyadelynation(polyA)序列增加核酸分子的稳定性;所述polyA序列包括但不限于SV40 polyA。
优选地,JEV信号肽基因序列如SEQ ID NO:14所示。
优选地,Igκ信号肽基因序列如SEQ ID NO:15所示。
优选地,Kozak序列基因序列如SEQ ID NO:16所示。
优选地,SV40 polyA基因序列如SEQ ID NO:17所示。
由核酸先导序列编码的信号肽在天然蛋白的细胞内的加工过程中被水解切割。
一些具体的实施方式中,编码所述gE胞外区或其片段的核酸分子如SEQ ID NO:2,18-19任一所示。
一些具体的实施方式中,编码所述基于gE的融合蛋白的核酸分子如SEQ ID NO:11-13、SEQ ID NO:20-26任一所示。
其中编码如SEQ ID NO:8所示的基于gE的融合蛋白的基因序列如SEQ ID NO:11,20-21任一所示:编码如SEQ ID NO:9所示的基于gE的融合蛋白的核酸分子序列如SEQ IDNO:12,22-23任一所示:编码如SEQ ID NO:10所示的基于gE的融合蛋白的核酸分子序列如SEQ ID NO:13,24-25任一所示。编码如SEQ ID NO:34所示的基于gE的融合蛋白的核酸分子序列如SEQ ID NO:26所示。
本发明所述的基于gE的重组载体,携带如上所述的核酸分子。应当理解为所述的基于gE的重组载体可携带如上所述的gE胞外区或其片段的编码基因,或携带如上所述的gE的融合蛋白的基因。所述载体可以是表达载体、克隆载体或转移载体,包含但不限于:病毒载体、DNA载体或mRNA载体等。其中病毒载体包括但不限于:腺病毒载体、腺病毒相关病毒载体、痘病毒载体、水疱性口炎病毒载体、牛副流感病毒载体、人副流感病毒载体、新城疫病毒载体、仙台病毒载体、麻疹病毒载体、减毒RSV载体、副粘病毒载体、甲型病毒载体(如委内瑞拉马脑炎病毒载、塞姆利基森林病毒载体、辛德比病毒载体)、棒状病毒载体、狂犬病病毒载体、小核糖核酸病毒、慢病毒载体、疱疹病毒载体、或植物来源的病毒用于在植物表达系统中表达。
一些具体的实施方式中,所述腺病毒载体为人源腺病毒载体(如5型腺病毒载体Ad5)、黑猩猩源腺病毒载体(如ChAd68)、大猩猩腺病毒载体或其他人类适用的腺病毒载体。
一些具体的实施方式中,所述重组腺病毒载体为复制缺陷型重组腺病毒载体,所述复制缺陷型可为腺病毒基因组的E1区删除或功能性缺失从而形成复制缺陷型腺病毒,或E3区进一步删除或功能性缺失;或E1区和E3区中均删除或功能性缺失;所有E1功能性缺失的载体均为复制缺陷型载体。所述的功能性缺失一般指由于突变、缺失或增加位点等原因的导致的E1原有功能的缺失,进而影响腺病毒复制。因此,这些病毒只能在补充表达E1蛋白的哺乳动物细胞中复制,例如HEK293及PER.C6细胞,这些细胞的基因组被修饰以表达E1基因。
本发明的复制缺陷型重组腺病毒载体的其余腺病毒基因组可为腺病毒原始基因组(即可理解为除了E1区删除或功能性缺失,或E1和E3都删除或功能性缺失外,其余基因组未有进一步修饰,如购自Thermo Fisher Scientific公司的pAd5-CMV/V5-Dest载体)或可被进一步修饰的腺病毒基因组,所述的修饰指对腺病毒原始基因组进行替换,突变等修饰,例如在特定的实施例中,复制缺陷型黑猩猩腺病毒(如ChAd68)本身的E4区被人5型腺病毒E4区取代以提高载体的性能。
当所述基于gE的重组载体携带如上所述的编码gE胞外区或其片段的核酸分子(例如SEQ ID NO:2,18-19任一所示的核酸分子)时,被称为重组腺病毒载体A,换言之,该gE为非融合形式表达。
优选地,所述的重组腺病毒载体A通过同源重组的方式进行构建。
优选地,构建所述的重组腺病毒载体A所用的骨架质粒为pAd5-CMV/V5-DEST。
优选地,构建所述的重组腺病毒载体A所用的穿梭质粒为pDONR221。
优选地,构建所述的重组腺病毒载体A所用的宿主细胞系包括但不限于HEK 293或PER.C6细胞系。
一些具体的实施方式中,所述的重组腺病毒载体A由下述方法构建:将测序正确的重组穿梭质粒pDONR221-gE基因-PolyA与病毒骨架质粒pAd5-CMV/V5-DEST进行同源重组,将重组混合物转化至大肠杆菌TOP10感受态细胞中,筛选测序正确的腺病毒载体pAd5-CMV-gE基因-PolyA,将腺病毒载体pAd5-CMV-gE基因-PolyA线性化后转染HEK 293或PER.C6细胞进行包装得到所述的重组腺病毒载体A。该技术是本领域技术人员熟知的。
当所述基于gE的重组载体携带如上所述的编码基于gE的融合蛋白的核酸分子时(例如SEQ ID NO:11-13,20-26任一所示的核酸分子)被称为重组腺病毒载体B。
优选地,所述的重组腺病毒载体B通过同源重组的方式进行构建。
优选地,构建所述的重组腺病毒载体B所用的病毒骨架质粒为pAd5-CMV/V5-DEST。
优选地,构建所述的重组腺病毒载体B所用的穿梭质粒为pDONR221。
优选地,构建所述的重组腺病毒载体B所用的宿主细胞系包括但不限于HEK 293或PER.C6细胞系。
一些具体的实施方式中,所述的重组腺病毒B由下述方法构建:将测序正确的重组穿梭质粒pDONR221-gE-鞭毛素融合蛋白基因-PolyA转化与病毒骨架质粒pAd5-CMV/V5-DEST进行同源重组,将重组混合物转化至大肠杆菌TOP10感受态细胞,筛选测序正确的腺病毒载体pAd5-CMV-gE-鞭毛素融合蛋白基因-PolyA,将腺病毒载体pAd5-CMV-融合蛋白基因-PolyA线性化后转染HEK 293或PER.C6细胞进行包装得到所述的重组腺病毒载体B。该技术是本领域技术人员熟知的。
本发明如上所述的免疫组合物还可以进一步包含一种或多种其他组分,例如药学可接受的载体,和/或佐剂,和/或免疫刺激分子等。所述的佐剂包括但不限于:铝盐(如氢氧化铝或磷酸铝)水包油乳液或油包水乳液、MF-59、TLR激动剂(如单磷酰脂质A(MPL)或其类似物,或CpG寡核苷酸)、Quil A或其QS21组分、壳聚糖、或其两种或多种的组合。所述的佐剂具有增强体液和/或细胞反应的用途。免疫刺激分子可包括但不限于大肠杆菌耐热肠毒素LT、霍乱毒素CT或其类似物等;细胞因子或趋化因子;抗体或其片段,该抗体或其片段针对特异性细胞表面分化抗原或参与免疫应答的受体,并可增强体液和细胞免疫反应。
医学上可接受的载体可为本领域的常规使用的载体,一般取决于药物的给药方式。例如胃肠外给药剂型等通常包含医学上和生理上可接受的可注射的流体,包括但不限于水、生理盐水、平衡盐溶液、甘油或其他碳水化合物等作载体。另外所述的免疫组合物中还可含有少量的无毒辅助物质,如乳化剂、pH缓冲液、稳定剂或防腐剂等。无菌溶液是通过无菌过滤或本领域已知的其他方法制备的。溶液的pH值一般在3.0~9.0之间,优先为pH5.0~7.5。制剂可以液体形式或冻干剂的形式保存,可以单剂量提供或者多剂量密封容器提供。本发明中的所述的免疫组合物也可以使用载体系统(包括但不限于脂质体、微球、胶束系统、免疫刺激复合物(ISCOMS)和纳米颗粒)来传递,所述纳米颗粒包括铁蛋白、包囊素、硫加氧酶还原酶(SOR)和鲁米嗪合成酶-纳米颗粒。
本发明如上所述的免疫组合物可通过本领域熟练人员所熟知的传递系统进行给药包括通过皮下、肌肉、皮内或鼻内等途径给药。本发明基于核酸的免疫组合物也可以通过基因枪法给药,重组蛋白免疫原可通过无针输送系统进行给药。
本发明如上所述的免疫组合物可用于预防和/或治疗水痘带状疱疹感染。具体地,所述的免疫组合物可用于婴儿、儿童、青少年、成年或老人接种免疫对抗水痘感染或老年人接种免疫对抗带状疱疹感染,另一方面,所述的免疫组合物可用于治疗带状疱疹和/或带状疱疹愈后神经痛。一般0-12月龄之间为婴儿,1-12岁为儿童,青少年为12-18岁,大于18岁为成年,50岁以上为老人。应当理解为年龄的划分并不绝限与上述描述,所述的免疫组合物可用于免疫适龄人群对抗水痘或带状疱疹感染。
本发明另一方面提供了如上所述的免疫组合物在用于制备预防和/或治疗水痘-带状疱疹病毒感染的药物中的应用;进一步地,为在制备水痘疫苗和/或带状疱疹疫苗中的应用;或所述的免疫组合物可用于制备治疗带状疱疹和/或带状疱疹愈后神经痛的药物。
本发明进一步还提供了一种联合疫苗,其包含如上所述的免疫组合物以及一种或多种其他疫苗。应当理解为,该联合疫苗各抗原组分间互不干扰,或可进一步达到协同作用。互不干扰一般指维持免疫原的稳定性及各免疫组分之间兼容性,且无抗原间的竞争,或严重不良反应的风险。另外,联合疫苗中的各抗原组分应当具有相同或相似的受试人群以及免疫程序。本发明中,所述的可联合的其他疫苗包含但不限于:流行性腮腺炎、麻疹和风疹疫苗。
本发明如上所述的基于gE的融合蛋白、相应的所述的核酸分子、所述的基于gE的重组载体可用于预防和/或治疗由水痘带状疱疹感染,具体地可用于婴儿、儿童、青少年、成年或老人接种免疫对抗水痘感染或老年人接种免疫对抗带状疱疹感染。
本发明一方面提供了如上所述的基于gE的融合蛋白、所述的核酸分子、所述的基于gE的融合蛋白重组载体在制备用于预防和/或治疗水痘-带状疱疹病毒感染的药物中的应用;进一步地,为在制备水痘疫苗和/或带状疱疹疫苗中的应用。所述的免疫组合物可用于制备治疗带状疱疹和/或带状疱疹愈后神经痛的药物。疫苗接种可能涉及在一个或多个月间隔时间内的单次或多次注射,剂量范围为在1μg至100μg的重组蛋白或1010到1012个病毒颗粒(VP)的腺病毒载体。具体的使用剂量将在临床试验中确定,并取决于给药途径和目标人群。如果需要,每年可给予加强免疫。
初免-强化免疫程序包括向受试者施用第一种免疫组合物(初免疫苗),然后施用第二种免疫组合物(加强疫苗)以诱导最佳的免疫反应。本领域技术人员应当了解初次免疫与加强免疫之间的合适时间间隔。初次免疫和加强免疫施用的免疫组合物可以相同或者不同且各自的数量可能不同。本发明中:所述的gE胞外区或其片段、基于gE的融合蛋白、核酸分子和基于gE的重组载体可分别用于初次免疫或加强免疫。例如,本发明提供了如下初免-强化免疫程序:(1)可以使用上述基于gE的重组载体做初次免疫,gE胞外区或其片段或基于gE的融合蛋白进行加强免疫;或者(2)可以使用上述gE胞外区或其片段或基于gE的融合蛋白做初次免疫,基于gE的重组载体进行加强免疫。所述的初免-加强免疫程序的组合包括但不限于上述的表述。例如,初免可以用基于gE的腺病毒载体来执行,然后用来自于表达相同基因的如上所述的不同载体(如痘病毒载体等)来执行加强免疫,或者反过来,初免可以用基于gE的异源载体(可理解为除了腺病毒载体之外的其它载体)来实现,并用本发明的所述的基于gE的腺病毒载体进行加强免疫。此外,两种表达相同或不同的基于gE基因的不同类型或不同物种的腺病毒载体也可以在初免-强化免疫程序中联合使用。
使用剂量取决于免疫组分、给药途径、目标人群和其他因素。临床试验人员将根据他们的知识确定每种免疫组分的适当剂量和有效的免疫方案。单次给药即足够或需要采用单个和/或联合免疫原进行多次给药。
本发明又一方面提供了一种分离的宿主细胞其包含如上所述的基于gE的基因(如gE胞外区或其片段的编码核酸分子,或基于gE的融合蛋白的编码核酸分子)。所述的宿主细胞包含但不限于:大肠杆菌、枯草芽孢杆菌、沙门氏菌、酿酒酵母、巴斯德毕赤酵母、昆虫细胞、HEK293细胞、PER.C6细胞、Vero细胞、CHO细胞、W38细胞、BHK细胞或COS细胞。
本发明一方面提供了一种制备如上所示的gE胞外区或其片段,或如上所述的基于gE的融合蛋白的方法,具体地可通过原核表达系统或真核表达系统表达。所述gE胞外区或其片段被制备成含或者不含有利于纯化的共价结合蛋白标签;所述基于gE的融合蛋白被制备成含或者不含有利于纯化的共价结合蛋白标签;所述的共价结合蛋白标签包含但不限于多聚组氨酸标签(His标签)。
所述原核表达系统包括但不限于大肠杆菌表达系统。一些具体实施方式中,所用大肠杆菌为BL21(DE3),所述原核表达载体可含有但不限于T7启动子,优选地该表达载体为pET28a。优选地,所述gE胞外区的氨基酸序列如SEQ ID NO:35所示,所述gE胞外区的基因序列如SEQ ID NO:36所示;所述基于gE的融合蛋白的氨基酸序列如SEQ ID NO:37-39所示;所述基于gE的融合蛋白的基因序列如SEQ ID NO:40-42所示。
作为本发明一具体的实施方式,所述原核表达可包括以下步骤:将携带所述gE胞外区或其片段的基因或携带所述基于gE的融合蛋白基因的pET28a表达载体转化至大肠杆菌BL21(DE3),涂布在琼脂平板上的添有加卡那霉素(50μg/ml)的LB培养基培养。挑取单克隆接种至含有卡那霉素的LB液体培养基中,37℃培养至OD600达到0.6时,加入0.1~1mMIPTG,16~37℃诱导表达。超声或高压均匀仪破碎收获的菌体,离心收获包涵体(IB),用含去污剂的盐水洗涤包涵体数次。将包涵体重悬并用含有6M盐酸胍或8M尿素的缓冲液中(20mM Tris,5mM咪唑,500mM NaCl,pH 8.0)进行溶解。将溶解后的包涵体上样至Ni柱中,清洗Ni柱用5-10个柱体积(20mM Tris,8M尿素,5 -50mM咪唑,500mM NaCl,pH 8.0),并用适当浓度的咪唑(20mM Tris,8M尿素,500mM咪唑,500mM NaCl,pH 8.0)洗脱蛋白质。蛋白复性可在柱上或纯化后进行。
所述真核表达系统包括但不限于酵母表达系统,哺乳动物细胞表达系统,或重组病毒(如人、动物或植物重组病毒表达系统,又如杆状病毒、腺病毒、慢病毒或痘病毒)表达系统,或植物表达系统。优选地,用于表达的哺乳动物细胞系包括但不限于293细胞或PER.C6细胞系,中国仓鼠卵巢CHO细胞系,昆虫细胞系如SF9细胞,Vero细胞,或转基因动物或植物细胞系。重组蛋白可通过瞬时表达、稳转细胞系表达或重组病毒载体表达。细胞培养基可从商业来源获得,培养细胞的适当条件是众所周知的,本领域技术人员能够很容易地选择培养基和宿主细胞的培养条件来表达目的免疫原。合适的培养基可能含有或者不含血清。
一些具体的实施方式中,所述真核表达包括以下步骤:将如上所述基于gE的重组载体(优选地为编码所述的gE蛋白的重组腺病毒载体A和编码所述gE-鞭毛素融合蛋白的重组腺病毒载体B)以一定MOI值感染90%汇合点的宿主细胞(在一些实施例中,所述的宿主细胞包括但不限于Vero或CHO等细胞),感染四到五天后,收获培养上清,将收获上清纯化后得到相应蛋白。其中:MOI值可以为10~500,更加优选地MOI值可以为100~200。纯化步骤包括疏水层析后经离子交换层析和/或分子排阻层析纯化;其中,疏水填料包括但不限于:Phenyl,Octyl或butyl相关填料;离子交换填料包括但不限于:Qsephrase FF,DEAE或Source 30Q;其中,分子排阻色谱填料包括但不限于Sephadex G200,G100或G75。作为优选的实施方式,所述的纯化过程是先经疏水层析,后经离子交换层析,优选地,所述疏水填料为Capto Phenyl Impress,所述离子交换填料是Source30Q。
本发明还提供了如上所述的重组腺病毒载体pAd5-CMV-gE基因-PolyA,gE基因为如SEQ ID NO:2,18-19任一所示的核酸序列。
本发明还提供了一种如上所述的重组腺病毒载体Ad5-CMV-gE-鞭毛素融合基因-PolyA,gE-鞭毛素融合基因具有如SEQ ID NO:11-13,20-26任一所示的核酸序列。
本发明另一方面还提供了一种改造的鞭毛素蛋白,所述鞭毛素蛋白N端区为至少与SEQ ID NO:3中第2至176位氨基酸区域有95%(例如:96%、97%、98%或99%的同源性)同源性的氨基酸序列;鞭毛素蛋白C端区为至少与SEQ ID NO:3中第392至495位氨基酸区域有95%(例如:96%、97%、98%或99%的同源性)同源性的氨基酸序列;所述鞭毛素蛋白N端区直接或者通过连接体与鞭毛素蛋白C端区相连。
所述连接体可为1-20个肽键连接的氨基酸,如具有如SEQ ID NO:4所示的氨基酸序列。
在一些实施方式中,所述鞭毛素蛋白的N端区的氨基酸序列如序列表SEQ ID NO:5所示:C端区的氨基酸序列如序列表SEQ ID NO:6所示。
在本发明的一些实施方式中,所述改造的鞭毛素蛋白具有如SEQ ID NO:27所示的氨基酸序列。
本发明还提供了一种核酸序列,其能编码如SEQ ID NO:27所示的氨基酸序列。优选地,所述的核酸序列如SEQ ID NO:28所示。
本发明还提供了所述的改造的鞭毛素蛋白作为免疫佐剂的应用,当其与gE或其片段偶联时形成的融合蛋白具有内在的佐剂特性,因此,基于gE的融合蛋白或可表达gE-鞭毛素融合蛋白的重组腺病毒载体(如重组腺病毒载体B)可直接用于制备用于免疫宿主(人或动物)诱导和/或增强对VZV的免疫应答的疫苗,对抗急性或者潜在VZV感染。
本发明公开了通过原核表达系统或重组腺病毒系统高效表达gE或gE-鞭毛素融合免疫原的方法,通过实验数据可知,制得的gE、gE鞭毛素融合蛋白及重组腺病毒载体可刺激免疫宿主产生高水平抗体滴度和良好的细胞免疫,可开发为新一代和改良的VZV疫苗。
术语
预防或治疗疾病:“预防”是指在有疾病风险的受试者(如VZV感染)中抑制感染或疾病的全面发展。“治疗”是指在疾病或病理状态开始发展之后,改善其体征或症状的治疗干预。术语“改善”是指任何可观察的有益治疗效果,如延迟出现疾病的临床症状、疾病症状减少、病情发展减缓、受试者的整体健康改善,或领域内中公认的特殊疾病的其他特定指标。“预防性”治疗是对没有出现疾病症状或仅出现早期症状的受试者进行的治疗,目的是降低发生病状的风险。
5型腺病毒(Ad5):一种双链DNA病毒,属于腺病毒科,主要引起人类呼吸道感染。E1基因产物(包括E1A和E1B)参与病毒的复制。大多数E3蛋白参与调节感染细胞的免疫应答。可以通过删除E1区域使该病毒失去复制能力,然后将异源转基因插入到删除的E1和E3区域,使病毒作为载体,实现免疫或基因治疗目的。
佐剂:增强宿主对免疫原或疫苗的免疫反应的物质。
抗体:由特异性浆细胞产生的血液蛋白,在抵抗外来分子或病原体的体液适应性免疫反应中起主要作用。抗体识别同源免疫原上的特定位点,从而中和或消除这些抗原。
抗体依赖性细胞毒性(antibody-dependent cellular cytoxicity,ADCC):一种免疫防御机制,通过这种机制,免疫系统的效应细胞主动裂解膜表面抗原已被特异性抗体结合的靶细胞。
细胞免疫:涉及激活哨兵树突状细胞和响应免疫原的淋巴细胞亚群的免疫反应。树突状细胞负责非特异性先天免疫以及免疫原特异性适应性免疫的启动。淋巴细胞亚群负责包括前炎症反应、辅助抗体产生的CD4+辅助性T细胞,以及杀死受感染靶点的细胞毒性CD8+T细胞。
条件性基因表达:指任意激活或抑制特定基因或基因产物表达的能力。
CpG寡核苷酸:CpG寡脱氧核苷酸是短单链合成DNA分子,含有胞嘧啶三磷酸脱氧核苷酸和鸟嘌呤三磷酸脱氧核苷酸。CpG基序是病原体相关分子模式,因此作为TLR9激动剂,具有免疫佐剂性质。
胞外域:膜蛋白延伸到细胞外空间的结构域。膜蛋白由胞外结构域(胞外域)、跨膜段和胞质内尾部组成。
增强子:一种DNA序列,能提高位于编码序列附近的基因的转录水平。
鞭毛素:一种聚合蛋白,是革兰氏阴性细菌鞭毛的主要成分,决定鞭毛在引起免疫反应方面的特异性。鞭毛素是一种有效的免疫调节剂。
融合蛋白:最初编码分离蛋白的两个或多个基因结合而产生的蛋白。
同源重组:含有长段相似碱基序列的两股DNA之间的遗传物质交换。同源重组自然存在于真核生物、细菌及某些病毒中,是基因工程的有力工具。
宿主细胞:含有外来分子、病毒或微生物的细胞。
免疫原:一种物质或有机体,进入宿主后能引起免疫,包括体液(抗体)和细胞反应。
免疫组合物:一种能诱导免疫的组合物。
免疫刺激分子:能刺激或增强免疫反应的分子。
先天免疫:由免疫系统的前哨细胞(如树突状细胞和巨噬细胞)进行防御的自然机制。这一免疫并非是由先前对免疫原的致敏,如感染或接种疫苗而引发。由于先天免疫不受特异性免疫原的刺激,因此先天免疫通常是即时的、非特异性和无记忆的,完全不同于具有免疫原特异性和记忆性的获得性免疫。
ISCOM:免疫刺激复合物(ISCOM)是胆固醇、磷脂和槲皮皂苷在特定的化学计量比下混合时自发形成的球形笼状结构。ISCOM显示出免疫佐剂的特性,可用于疫苗以增强其免疫应答。
Kozak序列:存在于真核生物mRNA上的核酸序列,通常为(gcc)gccRccAUGG。Kozak序列在翻译过程的启动中起着重要作用。
前导序列:信使RNA(和DNA)5'端的核苷酸序列,位于翻译起始密码子上游。
脂质体:包裹水滴的磷脂分子的微小球体,尤指人工形成的将疫苗、药物或其他物质输送到组织中的脂质体。
纳米颗粒:小于100纳米的微粒,不仅可以提高疫苗的稳定性和免疫原性,而且可以有效地递送和缓释。
中和:通过与病原体的特异性抗体相互作用而导致病原体感染性的丧失。
包装细胞系:将重组载体转染到包装细胞系中,以补充重组病毒载体中缺失的病毒基因,从而产生含有转基因的重组病毒。
多聚腺苷酸化序列(polyA tail):在信使RNA上加入多个单磷酸腺苷,是翻译前信使RNA(mRNA)成熟过程的一部分。
启动子:DNA分子中的一个位点,RNA聚合酶和转录因子在此位点结合,启动特定基因对mRNA的转录。
复制缺陷型载体:指病毒基因组的关键部分已经被删除,使得病毒载体不能复制。
穿梭质粒:一种能在两种不同宿主物种中繁殖的质粒。
信号肽:一种短肽(长度5-30个氨基酸),存在于大多数新合成蛋白质的N端,并最终进入分泌途径。
起始密码子:起始密码子是由核糖体翻译的信使RNA(mRNA)转录物的第一个密码子。在真核生物中,起始密码子始终编码蛋氨酸,而在原核生物中,起始密码子始终编码修饰的蛋氨酸(fMet)。最常见的起始密码子是AUG。
SV40 polyA:SV40 polyA序列是一个终止子序列,表示一个转录单元的结束。
标签:蛋白标签是基因接枝到重组蛋白上的肽序列,尤其是为了便于纯化。例如,多组氨酸标签结合到镍柱,从而可利用亲和层析纯化蛋白。
T细胞亚群:对免疫应答具有特异性免疫功能的淋巴细胞亚群。CD4+辅助性T细胞对于抗体产生不可或缺。它还通过释放可溶性免疫刺激介质,如细胞因子和趋化因子,参与前炎症反应。1型辅助性T细胞(Th1)是宿主抵抗细胞内病毒和细菌病原体所必需的细胞并产生干扰素γ(IFN-γ)。2型辅助性T细胞(Th2)在宿主抵抗细胞外病原体中起重要作用并分泌IL-4。细胞毒性CD8+T细胞是负责杀死受感染细胞并分泌IFN-γ的淋巴细胞的一个亚群。
TLR激动剂:能够通过与同源TLR受体相互作用来激活免疫细胞的试剂,从而促进和协调先天免疫和适应性免疫的启动。
Toll样受体(Toll-like receptors,TLRs):是一类在先天免疫系统中起关键作用的蛋白,是单一、跨膜、非催化的受体,通常表达在前哨细胞(如巨噬细胞和树突状细胞)上,识别从微生物衍生的结构保守分子。
转录终止子:在转录过程中标记基因组DNA中基因或操纵子末端的核酸序列的一部分。
转染:将核酸导入哺乳动物细胞的过程。有很多不同的方法和技术,包括脂质转染及化学和物理方法,如电穿孔。
转化:将外源质粒或连接产物插入大肠杆菌等细菌中。
病毒载体:分子生物学家常用来将遗传物质输送到细胞中的工具。这一过程可在活的有机体(体内)或细胞培养(体外)中进行。病毒已经进化出专门的分子机制来有效地运输其基因组,能够在其感染的细胞内传递基因和其他遗传物质。
附图说明
图1.使用Phyre2软件模拟计算的修饰后鞭毛素蛋白与Toll样受体相互作用三维结构示意图。(参考文献:Phyre2 web portal for protein modeling,prediction andanalysis.Kelley LA et al.,Nature Protocols 10,845-858,2015).
图2.gE-鞭毛素融合蛋白与Toll样受体相互作用计算机模拟三维结构示意图。计算机预测免疫原设计方法如下:首先使用Phyre2网页生成水痘带状疱疹病毒(strainDumas;UniProtKB P09259)的包膜糖蛋白E模型,然后从蛋白模型中去除VZV gE的信号肽分泌序列、跨膜区以及胞内区,然后根据数据库PDB ID’s 3v47 and3a5x(Yoon S-il et al.,Science,335:859-864,2012)中的信息,选择鼠伤寒沙门氏菌鞭毛素蛋白序列(strainLT2;UniProtKB P06179)的边界。在设计VZV gE和鞭毛素蛋白的融合蛋白时,根据融合的位置(N-端,C-端或gE蛋白插入中间)分别设计了不同长度的GGGGS连接体,以最小化空间位阻。图2A.修饰的鞭毛素蛋白融合至gE蛋白的N端(ANF);图2B.修饰的鞭毛素蛋白融合至gE蛋白的C端(ACF);图2C.将ge蛋白取代鞭毛素蛋白的D2和D3结构域插入其高变区(ASF)。
图3.携带gE及gE-鞭毛素融合基因的重组腺病毒载体命名简称及其对应插入基因图例。“Js”代表乙型脑炎病毒(JEV)prM先导肽基因序列。“Igκ”是指小鼠IgGκ轻链先导肽基因序列。
图4.Western Bloting(WB)检测重组腺病毒1:rAd5-ACF(Js);2:rAd5-ACF-SV40(Js)3:rAd5-ANF(Js);4:rAd5-ANF-SV40(Js);5:rAd5-gE(Js);6:rAd5-gE-SV40(Js)-感染后Vero细胞上清中外源基因的表达。图4A使用的一抗为小鼠anti-VZV gE单克隆抗体;图4B使用的一抗为兔anti-鞭毛素D0,D1多克隆抗体。M,蛋白分子量markers。
图5.Western Bloting及SDS-PAGE分析重组腺病毒感染后的293A细胞上清(S)及细胞裂解液(L)中外源基因表达结果。5A.鼠抗VZV gE单克隆抗体作为一抗,WB检测结果;5B.兔抗鞭毛素D0,D1抗血清作为一抗,WB检测结果;5C.SDS-PAGE检测结果;图中,gE代表rAd5-gE-SV40(Js)感染的HEK293细胞上清液(S)和细胞裂解液(L);ANF代表rAd5-ANF-SV40(Js)感染的HEK293细胞上清液(S)和细胞裂解液(L);ACF代表rAd5-ACF-SV40(Js)感染的HEK293细胞上清液(S)和细胞裂解液(L);ASF代表rAd5 ASF(Js)-感染的HEK293细胞上清液(S)和细胞裂解液(L)。
图6.纯化后的重组腺病毒检测。图6A,纯化后的重组腺病毒WB鉴定结果(以兔抗Ad5多克隆抗体作为一抗)。M:分子量Marekers;泳道1:纯化后的rAd5-gE-SV40(Js)病毒;泳道2:纯化后的rAd5-ANF-SV40(Js)病毒;泳道3:纯化后的rAd5-ACF-SV40(Js)病毒。泳道4:纯化后的rAd5-ASF(Js)病毒。泳道5:纯化后的rAd5-SE(Igκ)病毒。6B.透射电镜(TEM)分析1010TCID50/ml样品中的病毒颗粒检测结果。6C.阴离子交换-高效液相色谱法(agilent1260)分析纯化后的rAd5-gE-SV40(Js)病毒。将40μl纯化后的病毒样品上样至用90%的流动相A(20mM Tris,pH值8.0)和10%的流动相B(20mM Tris,1M NaCl,pH值8.0)平衡好的柱子上(4.8x 250mm Sepax SAX-NP5阴离子交换柱,Sepax,中国)。上样结束后,线性梯度(10-60%流动相B)洗脱柱子8分钟,然后用60%的流动相B冲洗柱子4分钟,之后再用另一线性梯度(60-100%流动相B)洗脱柱子4分钟。最后,用平衡缓冲液洗洗4分钟。
图7.原核表达的含His标签的重组gE及gE-鞭毛素融合蛋白命名简称及其对应插入基因图例。
图8.SDS-PAGE及Western Bloting检测纯化后的大肠杆菌表达的重组gE及重组gE-鞭毛素融合蛋白。8A.SDS-PAGE结果;8B.使用小鼠抗VZV-gE单克隆抗体作为一抗WB结果;8C.使用兔抗鞭毛素D0,D1抗血清作为一抗WB结果。M:蛋白分子量Markers;泳道1:纯化后的gE蛋白;泳道2:纯化后的ENF蛋白;泳道3:纯化后的ESF蛋白;泳道4:纯化后的ECF蛋白。
图9.SDS-PAGE及Western Bloting检测纯化后的Vero细胞表达的重组gE及重组gE-鞭毛素融合蛋白。9A.SDS-PAGE检测结果;9B.使用小鼠抗VZV-gE单克隆抗体作为一抗WB结果;9C.使用兔抗鞭毛素D0,D1抗血清作为一抗WB结果。M:蛋白分子量Markers;泳道1:纯化后的gE蛋白;泳道2:纯化后的ANF蛋白;泳道3:纯化后的ASF蛋白;泳道4:纯化后的ACF蛋白。
图10.重组腺病毒免疫的小鼠血清中的VZV-gE特异性抗体检测。将各种重组腺病毒(109TCID50/剂)或商品化水痘疫苗(700pfu/剂)通过肌肉注射免疫C57BL/6小鼠,共免疫两剂,免疫间隔30天。在第一次免疫后的第12天、26天和42天收集血清,并按照材料和方法中的描述,使用酶联免疫吸附试验(ELISA法)检测gE特异性抗体滴度。gE特异性抗体反应的结果几何平均滴度(GMT)表示,上下置信区间95%。***p<0.001(ANOVA/Bonferroni单因素方差分析法)。
图11.重组腺病毒免疫的小鼠血清中,抗体介导的中和VZV病毒感染活性的分析。将各种重组腺病毒(109TCID50/剂)或商品化水痘疫苗(700pfu/剂)通过肌肉注射免疫C57BL/6小鼠,共免疫两剂,免疫间隔30天。第二针免疫后30天,收集小鼠血清,并检测VZV特异性中和抗体滴度。取复孔测定的平均值表示中和抗体滴度。计算能够使空斑数减少50%的稀释倍数,取其倒数,表示中和抗体效价。**p<0.01,***p<0.001(ANOVA/Bonferroni单因素方差分析法)。
图12.流式细胞术分析重组腺病毒诱导的gE特异性CD4+和CD8+T细胞反应。第二次免疫后36天收集脾细胞,用覆盖整个gE胞外区的15个重叠多肽混合物(2μg/肽)刺激脾细胞。按照CD3+/CD4+和CD3+/CD8+T细胞双阳画门,用荧光标记的抗IFN-γ抗体进行胞内因子染色法(ICS)流式细胞术分析。结果按照表达IFN-γ的CD4+和CD8+T细胞的百分比表示,上下置信区间95%。**p<0.01,****p<0.0001(ANOVA/Bonferroni单因素方差分析法)。阴性对照为未刺激的脾细胞,阳性对照为PMA(50ng)。
图13.Elispot分析重组腺病毒诱导的产生IFN-γ及IL-4的T细胞。第二次免疫后36天收集脾细胞,用覆盖整个gE胞外区的15个重叠多肽混合物(2μg/肽)刺激脾细胞并分析产生IFN-γ及IL-4的T细胞数量。结果以斑点数/5x 105的平均值表示。*p<0.05,**p<0.01,****p<0.0001(ANOVA/Bonferroni单因素方差分析法)。阴性对照为未刺激的空载体腺病毒组脾细胞,阳性对照为PMA(50ng)。
图14.gE及gE-鞭毛素融合蛋白诱导的gE特异性抗体滴度。将含或不含MF59佐剂(50μl/剂)的gE蛋白(5μg/剂)或gE-鞭毛素融合蛋白(8μg/剂)免疫C57BL/6小鼠,共免疫两剂,免疫间隔14天。第二剂免疫后14天,收集免疫血清,ELISA法检测gE-特异性抗体滴度。***p<0.001,****p<0.0001(ANOVA/Bonferroni单因素方差分析法)。
图15.gE或gE-鞭毛素融合蛋白(含或不含MF59佐剂)免疫血清中,抗体介导的VZV感染活性中和效价。将含或不含MF59佐剂(50μl/剂)的gE蛋白(5μg/剂)或gE-鞭毛素融合蛋白(8μg/剂),或商品化的水痘疫苗免疫C57BL/6小鼠,共免疫两剂,免疫间隔14天。第二剂免疫后14天,收集免疫血清,将每组小鼠的血清两两合并后检测VZV特异性中和抗体滴度。取复孔测定的平均值表示中和抗体滴度。计算能够使空斑数减少50%的稀释倍数,取其倒数,表示中和抗体效价。*p<0.05(ANOVA/Bonferroni单因素方差分析法)。
图16.Elispot分析gE及gE-鞭毛素融合蛋白(含或不含MF59佐剂)诱导的产生IFN-γ及IL-4的T细胞。用覆盖整个gE胞外区的15个重叠多肽混合物(2μg/肽)刺激脾细胞并分析产生IFN-γ及IL-4的T细胞数量。结果以斑点数/5x 105的平均值表示。*p<0.05,**p<0.01(ANOVA/Bonferroni单因素方差分析法)。阴性对照为盐水组免疫的脾细胞,阳性对照为PMA(50ng)。
实施例
实施例中使用的材料和方法:
动物及细胞
6-8周的无特定病原体(SPF级)C57BL/6雌性小鼠购自湖北省疾病预防控制中心。所有的动物研究在GLP(Good Laboratory)实验室条件下开展,并按照“动物福利伦理审查实验室动物指南”处理动物。人胚胎肾细胞HEK293购自(Thermo Fisher Scientific,美国),使用含10%胎牛血清(FBS)的DMEM培养。THP-1细胞购自ATCC,使用含10%FBS及1%青霉素/链霉素双抗的RPMI-1640培养基培养(Gibco,美国)。
试剂
所有基因片段均有上海生工合成(上海,中国),引物由武汉擎科生物公司合成(武汉,中国);pDONR221,pAd5-CMV/V5-Dest载体,Gateway BP重组,LR重组酶,大肠杆菌TOP10感受态,lip2000转染试剂,均购自Thermo Fisher Scientific公司(美国)。pET28a表达质粒购自Novagen(美国)。质粒提取试剂盒,胶回收试剂盒购自Axygen公司(美国)。Mouseanti-VZV-gE单抗购自Merck公司(美国),rabbit anti-鞭毛素D0-D1抗体通过免疫兔子制备。将三条合成的来自鞭毛素D0和D1结构域多肽(见表1.)与载体蛋白(CCH,Thermo FisherScientific.美国)结合。免疫过程:第一剂,0.4mg结合物含完全弗氏佐剂,肌肉注射,第二剂及第三剂,用0.2mg结合物含不完全弗氏佐剂,肌肉注射;最后用0.1mg结合物,静脉冲击;分别免疫兔子。Rabbit anti-Ad5单抗购自Abcam公司(英国)。细胞培养瓶及移液管购自Corning公司(美国)。不含内毒素的鞭毛素蛋白购自Alpha Diagnostic公司(美国);IL-8及TNF-α含量ELISA试剂盒及Elispot试剂盒购自达科为公司;中和抗体检测实验所用豚鼠补体血清购自BD公司(美国)。流式所用抗体均购自Thermo fisher公司。商品化的水痘减毒活疫苗为长春祁健(中国)或长春百克公司(中国)生产。
表1.鞭毛素蛋白D0-D1多肽序列
序号 多肽序列
1 LNKSQSALGTAIERLSSGLRINSAKDDAAC
2 NNLQRVRELAVQSANSTNC
3 LTSARSRIEDSDYATEVSNM
PCR及琼脂糖电泳
向含1μl上下游引物的管子中,分别加入2x PCR预混溶液25μl,DNA模板50-100ng,补加ddH2O至50μl,循环条件:第一步,95℃,2min;第二步:95℃,15s,45℃~55℃,15s,72℃,1min30s共30个循环;第三步:72℃5min。PCR结束后将PCR产物加入上样缓冲液并进行1%琼脂糖凝胶电泳,电泳条件180V,20~30min,紫外检测PCR结果。
SDS-PAGE及Western blotting
向80μl样品中加入20μl 5倍浓缩的上样缓冲液,煮沸5mins。将煮沸后的样品进行10% SDS-PAGE进行电泳(100V,20mins然后160V,1小时20mins)。电泳结束后,湿转法将蛋白转至PVDF膜上(Merck,美国),用含5%脱脂奶粉的PBST溶液(含0.05% Tween 20的PBS溶液)4℃封闭过夜;PBST洗膜两次后加入鼠抗VZV-gE蛋白单克隆抗体(1:5000稀释,Millipore)或兔抗anti-鞭毛素抗血清(1:10000稀释)或兔抗-Ad5多克隆抗体(1:10000稀释),37℃孵育1小时;PBST洗膜两次后加入辣根过氧化物酶(HRP)标记的羊抗鼠IgG(1:5000稀释,碧云天)或HRP标记的羊抗兔IgG(1:5 000稀释,碧云天),37℃孵育1小时;PBST洗膜两次后,使用Western Blotting ECL显色液处理后,化学发光法显色。
腺病毒滴度-TCID50
取内含90%汇合度生长于含10% FBS的DMEM培养基的293细胞一瓶(T-75瓶)。在测定前一天,用PBS清洗后,加入1x TypLE消化2mins,加入含2%FBS的DMEM培养基终止消化,将细胞用相同培养基重悬后计数。调整细胞浓度至1.0~2.0x105细胞/mL,每孔100μl细胞,接种96孔板,将96孔板置于37℃,5% CO2培养箱16~20小时;将待测病毒液及参考品分别用DMEM+2%FBS培养基进行十倍连续稀释(从10-1稀释至10-10)。将稀释后的病毒液分别加入1~10列,每孔100μl,每个病毒稀释度重复8孔。第11和12列加入100μl DMEM+2%FBS培养基做阴性对照。将96孔板置于CO2培养箱37℃培养10天,然后在倒置显微镜下观察,判断并记录每列细胞病变效应(CPE)情况。判断的标准是只要有少量细胞发生CPE即为阳性。最后按照Karber法计算病毒滴度。(G.,Archiv f experiment Pathol u Pharmakol,162:480-483,1931).
TLR-5活性检测
取对数生长期表达TLR5受体且生长于含10% FBS的RPM-1640培养中的THP-1细胞,125g离心5mins,弃上清,用含10%FBS的RPMI-1640培养基重悬细胞,调整细胞浓度至1x107cells/ml,接种于96孔细胞培养板中,100μl/孔。用含10%FBS的RPMI-1640培养基溶液稀释阳性对照至终浓度2.5μg/ml(不含内毒素的鞭毛素蛋白)。用相同的培养基将纯化后内毒素含量<5EU/ml的gE-鞭毛素融合蛋白稀释至等摩尔浓度(5μg/ml),纯化后的gE蛋白作为阴性对照。将稀释后的样品,无内毒素-鞭毛素或gE分别加入96孔板中,100μl/孔。将96孔细胞培养板放入CO2培养箱中37℃培养12~24小时。培养结束后,将各孔中的细胞吸出,2000g离心10mins,收集细胞上清液。通过检测培养上清中IL-8,TNF-α细胞因子的含量来检测TLR5的活性,细胞因子含量按照IL-8,TNF-α细胞因子Elisa检测试剂盒说明书进行操作。
酶联免疫反应(ELISA)检测血清中anti-gE抗体滴度
将纯化后的原核表达gE蛋白用无菌碳酸钠缓冲液(8.4g/L NaHCO3,3.5g/LNa2CO3,pH 9.6)稀释至1μg/ml,100μl/孔加入96孔酶标板,4℃包被过夜。次日,取出酶标板,弃去孔内液体,用PBST(含0.1% Tween 20的PBS溶液)洗板3次。每孔加入封闭液(含10%脱脂奶粉的PBST溶液)37℃封闭1小时。封闭结束后,弃封闭液,将免疫后的小鼠血清用封闭液进行系列梯度稀释,并设置封闭液作为空白对照。将稀释后的血清以100μl每孔加入96孔板,每个稀释度血清做三个复孔,37℃孵育1小时。用PBST洗板三次,之后每孔加入100μl 1:1000稀释的过氧化物酶(HRP)标记的羊抗小鼠IgG抗体,37℃孵育1小时。用PBST洗板3次后,加入TMB底物(3,3',5,5'-四甲基联苯胺,KPL,美国)。加入0.2M硫酸终止反应。用酶标仪在波长450nm,参比波长620处测定吸光度。
中和抗体检测
抗体介导的中和VZV病毒感染活性中和效价测定步骤如下:将VZV病毒用VZV稀释液稀释至2×103PFU/ml(磷酸盐缓冲盐(PBS)、蔗糖5%、谷氨酸1%、胎牛血清(FBS)10%、pH7.1)。将150μl病毒与150μl连续稀释的热灭活血清及5μl豚鼠补体在37℃孵育1小时。取孵育后的病毒血清混合物加入长满MRC-5单层细胞的24孔板(100ul/孔)中,每个稀释度做两个复孔,37℃孵育2小时。2小时后加入2ml病毒维持液(含2% FBS的MEM)。7天后,去除培养基,固定细胞,用考马斯蓝溶液(考马斯蓝0.5%,甲醇45%,乙酸10%)染色10分钟,用蒸馏水洗涤平板,数斑。每个稀释度检测两个复孔。取使空斑数减少50%的血清稀释度的倒数,即为中和抗体效价。
小鼠脾细胞分离
将小鼠脾脏无菌取出并转移到放置在6孔板的单个孔中的细胞过滤器中,添加3ml培养基(RPMI-1640,含5%FBS),研磨释放脾细胞,200目细胞筛网过滤脾脏。将细胞收集于15ml试管中,350×g、4℃下离心5min。丢弃上清液,将细胞沉淀重悬后加入2ml红细胞(RBC)裂解缓冲液(Thermo Fisher Scientific)室温裂解10mins,加入6ml RPMI-1640培养基终止裂解红细胞,离心(4℃,350g,5mins)。弃上清,加入10ml RPMI-1640培养基重悬细胞,离心(4℃,350g,5min)。弃上清,加5ml RPMI-1640+10%FBS重悬细胞。取重悬后的脾细胞悬液进行计数后待用。
Elispot检测
gE-特异性细胞免疫通过干扰素-γ(IFN-γ)和IL-4的Elispot来检测,使用覆盖整个gE胞外区的15个重叠多肽混合物作为刺激物。将预包被有IFN-γ或IL-4抗体的Elispot板(达科为),每孔加入200μl RPMI-1640培养基,室温静置10分钟后将其扣出。调整脾细胞终浓度至2~8x 106细胞/ml。将100μl脾细胞悬液与多肽混合(每条肽的浓度为2μg/ml),每个样品做三个复孔。将ELISpot板置于37℃培养箱培养36~72小时。培养结束后,按照Elispot板子说明书进行斑点显色操作(具体操作流程见厂家说明书)。板子晾干后,使用酶联斑点成像系统进行斑点计数。计算每5x105个细胞中形成斑点的细胞数(SFC)。培养基背景水平通常<15SFC/5x105个细胞。
胞内细胞因子染色
在体外用覆盖整个gE蛋白胞外区(含11个重叠氨基酸的15肽)的多肽混合物(2μg/ml)37℃刺激脾细胞2小时,刺激结束后加入Brefeldin A(3μg/ml)及离子霉素(1μg/ml)37℃孵育过夜。收获各孔细胞至EP管,350g离心5分钟,弃上清。使用50μl含2% Fc抗体及1%FBS的PBS溶液重悬细胞,4℃孵育10分钟。再加入50μl含anti-CD3 Alex fluor 700、anti-CD4-FITC和anti-CD8-PE-Cy7(BD Biosciences,1:100稀释)的抗体混合液,避光4℃孵育30分钟。用FACS洗涤液洗涤细胞1次后,加入200μl固定液,避光室温孵育25分钟。固定结束后,再加入1.5ml稀释好的破膜剂洗涤细胞,350g离心细胞悬液5分钟,弃上清。使用破膜剂稀释IFN-γ-APC,IL-2-PerCp-Cy5.5 and IL-4-PE抗体,将稀释后的抗体混合物加入细胞悬液,避光室温孵育30分钟。使用CytoFLEX S流式细胞仪(Beckman)及Flow Jo软件分析CD3+/CD4+阳性和CD3+/CD8+阳性T细胞亚群。
实施例1
重组腺病毒的构建,鉴定,扩增及纯化
1.1试验设计
1.1.1根据计算机计算及模拟结果设计用于gE鞭毛素融合蛋白的linker序列,鞭毛素蛋白与TLR5受体结合计算机模拟图见图1,设计后的gE鞭毛素融合蛋白与TLR5受体结合模拟结构图见图2,其中图2A为ANF、图2B为ACF、图2C为ASF。
1.1.2本研究使用引物见表2,插入基因与对应制备的重组腺病毒简称见图3.
表2.本研究使用引物信息
引物名称 序列
AttB1-JEV-F GGGGACAAGTTTGTACAAAAAAGCAGGCTTCGCCGCCGCCATGGGAAAACGGTCC
AttB2-SV40-R GGGGACCACTTTGTACAAGAAAGCTGGGTCAGACATGATAAGATACATTGATGAG
AttB2-GE-R GGGGACCACTTTGTACAAGAAAGCTGGGTCTTATTATTATCTGATCAGGGGGCTAG
AttB2-hOACF-R GGGGACCACTTTGTACAAGAAAGCTGGGTCTTATTATTACCTCAGCAGGCTCAG
AttB2-hOANF-R GGGGACCACTTTGTACAAGAAAGCTGGGTCTTATTATTATCTAATCAGAGGGCTAG
注:1.引物名称中,F代表正向引物,R代表反向引物;2.扩增含或者不含SV40polyA的gE及gE-鞭毛素基因所使用的正向引物均相同,即AttB1-JEV-F;3.扩增含SV40polyA的gE及gE-鞭毛素基因所使用的反向引物均为AttB2-SV40-R。
1.2重组腺病毒构建
1.2.1pDONR221转移载体构建
将1.1所示的基因片段进行基因合成,用高保真DNA聚合酶分别扩增基因合成的各个目的基因片段(扩增引物序列见1.1.2中表2.所示)。PCR扩增后,将1%琼脂糖凝胶电泳检测PCR产物,用DNA胶回收试剂盒分别回收目的DNA片段,PCR循环条件:第一步:95℃,2mins;第二步,95℃,15s,55℃,15s,72℃,1min 30s,共30个循环,第三步,72℃,5mins。根据厂家说明书,将回收后的目的DNA片段分别和pDONR221质粒做BP重组(Thermo FisherScientific,Cat 11789020),将重组混合物转化大肠杆菌TOP10感受态细胞并涂布含Kana抗性的固体LB平板。提取质粒,并送测序。
其中,制备得到的TOP10/pDONR221-Js-ASF-SV40plyA,TOP10/pDONR221-Js-ACF-SV40plyA和TOP10/pDONR221-Js-ANF-SV40plyA于2019年9月10日在中国典型培养物保藏中心(CCTCC)进行保藏,保藏编号分别为:CCTCC M 2019707,CCTCC M 2019708and CCTCC M2019709。
1.2.2重组腺病毒表达载体构建
按照厂家说明书操作,将测序正确的重组pDONR221质粒,分别和目的质粒pAd5-CMV/V5-DEST做LR重组(Thermo Fisher Scientific,Cat 11791020)。将重组混合物并转化大肠杆菌TOP10感受态细胞,并涂布含Ampicillin(Amp,100μg/ml)抗性的固体LB平板。次日,挑取不同的菌落,这些菌落可能含有不同的pAd5-CMV质粒,将这些分别携带含或者不含SV40 poly A的gE或gE-鞭毛素融合基因的pAd5-CMV质粒(称为pAd5-CMV(VZV))。将挑取的菌落在含Amp抗性的LB培养基中培养。提取质粒并测序。
1.2.3重组腺病毒质粒的制备
将测序正确的pAd5-CMV(VZV)质粒分别转化大肠杆菌TOP10感受态细胞,并涂布含Amp抗性的固体LB平板。次日,分别挑取单克隆接种于200ml含Amp的LB液体培养基,过夜培养后,质粒大抽试剂盒,分别提取大量的pAd5-CMV(VZV)质粒。
其中,制备得到的TOP10/pAd5-Js-gE-SV40plyA于2019年9月10日在中国典型培养物保藏中心(CCTCC)进行保藏,保藏编号为:CCTCC M 2019710。
1.2.4重组腺病毒载体线性化处理
将1.2.3中获得的质粒分别用PacI限制性内切酶(NEB,美国),37℃酶切3h,酶切体系如下:pAd5-CMV(VZV)质粒:10μg,10*NEB CutSmart buffer:5μl,PacI酶:5μl,加ddH2O至终体积50μl。酶切完成后用PCR产物回收试剂盒,回收酶切后的DNA片段。并用微量核酸定量仪对回收后的DNA片段进行定量。
1.2.5重组腺病毒的包装
根据Lipofectamine2000转染试剂的使用说明,将Pac I线性化的pAd5-CMV(VZV)质粒分别转染汇合度为60-70%的6孔板中的HEK293细胞。转染前2h,将培养基更换成无抗生素培养基,加入DNA/脂质体复合物。转染后5小时,将培养基更换为含10% FBS和1%双抗的DMEM培养基。在倒置显微镜下隔日观察细胞病变,直至60%的HEK293细胞出现噬斑时收集细胞,在室温与-80℃超低温之间反复冻融3次,1200g离心5min,收集上清即获得rAd5-gE(Js),rAd5-gE-SV40(Js),rAd5-ANF(Js),rAd5-ANF-SV40(Js),rAd5-ACF(Js),rAd5-ACF-SV40(Js),rAd5-ASF(Js)and rAd5-SE-SV40(Igκ)重组腺病毒,置于-80℃冰箱保存。
1.3重组腺病毒目的基因表达鉴定
1.3.1PCR鉴定
初次病毒扩增保存液用病毒RNA/DNA提取试剂盒(Takara,日本),按照操作说明书,提取病毒基因组DNA,PCR扩增提取后的病毒基因组DNA,鉴定插入重组腺病毒载体的VZVgE或gE-鞭毛素融合基因。引物:T7-F/V5-C-R,PCR条件:病毒DNA1μl,正反向引物各0.5μl,5μl 2×PrimerSTAR mix,ddH2O 3μl,循环条件:第一步:95℃,2min;第二步,95℃,15s,45℃,15s,72℃,1min 30s共30个循环;第三步,72℃,5mins。PCR结束后将PCR产物经1%琼脂糖凝胶电泳后,切胶回收目的条带并送测序公司进行测序。
1.3.2重组腺病毒的VZV gE和gE-鞭毛素融合基因表达
将HEK293细胞或Vero细胞接种于6孔板(5x 105/孔),待6孔板中汇合率为90%时,将P3代重组腺病毒以MOI 0.2(HEK293细胞)和20(Vero细胞)接种至6孔板中,并设置正常细胞为阴性对照。37℃培养48小时后,用细胞刮将细胞挂下,离心后分别收集细胞和上清,上清标记为细胞培养上清,细胞沉淀中加入100μl哺乳动物细胞裂解液(碧云天,中国),冰上裂解后,3,500x g离心5mins取裂解上清标记为细胞裂解液。向80μl细胞培养上清和细胞裂解液中分别加入20μl 5×上样缓冲液,100℃煮沸5mins,SDS-PAGE及WB检测gE或gE-鞭毛素融合蛋白的表达。Vero细胞检测结果见图4,HEK293细胞检测结果见图5。由图4和图5可知,经腺病毒A或B感染后,在HEK 293及Vero细胞的上清中均能够成功的检测到gE蛋白或gE鞭毛素融合蛋白的表达,表达的gE蛋白分子量约在80Kd左右,gE-鞭毛素融合蛋白分子量在120Kd左右。该gE蛋白及gE-鞭毛素融合蛋白能够被mouse anti-VZV gE单克隆抗体特异性识别。且gE-鞭毛素融合蛋白能被anti-鞭毛素多抗特异性识别。
1.4重组腺病毒小规模扩增:
将汇合度90%的HEK293细胞,按照MOI 0.01~1分别接种不同的重组腺病毒,并将细胞置于37℃,5%CO2培养箱持续培养,待70%以上细胞出现变圆,脱落时,将细胞用细胞刮刮下,2265g,离心十分钟,分别收获上清及细胞沉淀。将细胞沉淀用PBS重悬,并置于-80℃冰箱反复冻融三次,2265g,离心十分钟收获上清,用于下一步纯化。
1.5重组腺病毒纯化
预冷离心转子至4℃。在生物安全柜中,向离心管中缓慢加入12ml 1.4g/ml氯化铯(53g+87ml 10mM Tris-HCl,pH 7.9),再非常轻缓地加入9ml 1.2g/ml氯化铯(26.8g+92ml10mM Tris-HCl,pH 7.9)。之后在不连续梯度顶部加入13ml病毒保存液,平衡离心管,100000×g(SW28转子上为23000rpm)4℃离心120分钟。小心抽吸病毒带,将含病毒的溶液转移至无菌15ml离心管,加入等体积的10mM Tris HCl,pH 7.9。将20ml 1.35g/ml氯化铯加入离心管中。非常缓慢地顶部加入15ml上步中稀释的病毒悬液。平衡离心管后,100000×g 4℃离心18小时。超速离心后,小心收集蓝白色病毒带。将病毒在10000道尔顿的纤维素酯膜(购自美国BD公司)中进行4℃透析至PBS溶液中,以去除氯化铯盐。透析后的病毒溶液加入10%甘油,分装后冻存于-80℃冰箱。
1.6重组腺病毒的检定及分析
Western blotting检测纯化后的重组腺病毒(见图6A),WB使用抗体为兔Anti-Ad5多克隆抗体。图6A可见每种重组腺病毒均可被rabit anti-rAd5多克隆抗体特异性识别。将纯化后的重组病毒rAd5-gE复染(1%~2%的磷钨酸溶液,pH 6.8)之后进行电镜检测,经电镜观察可看到完整的病毒颗粒见图6B,阴离子-HPLC分析结果显示,纯化后的病毒纯度在95%以上见图6C。TCID50检测结果显示纯化后的腺病毒滴度在1010TCID50/ml以上。
实施例2
gE蛋白及gE-鞭毛素融合蛋白在原核系统中的表达,纯化及检定
2.1基因及蛋白命名
插入基因及对应表达的gE及gE-鞭毛素融合蛋白的命名见图7。
2.2pET28a表达载体的构建
将2.1所示个基因分别插入用NcoI和XhoI酶切后插入用相同酶切后的pET28a载体中,连接转化后,挑取单克隆接种含kanamycin(50μg/ml)抗性的LB培养基,过夜培养后提取质粒,送测序公司进行测序。获得pET28a-gE,pET28a-ENF,pET28a-ECF,pET28a-ESF表达质粒。
2.3gE及gE鞭毛素融合蛋白的表达
将测序正确的pET28a-gE,pET28a-ENF,pET28a-ECF,pET28a-ESF质粒分别转化BL21(DE3)感受态细胞,挑取单克隆接种于含kanamycin抗性的LB培养基中,37℃,200rpm过夜培养。次日,将菌种转接至新鲜的含kanamycin抗性的LB培养基中。37℃,200rpm培养4h,待OD600达到0.6~0.8时,加入0.1~1mM的IPTG进行诱导表达,表达温度16~37℃诱导4~16h,收获菌体,用于下一步纯化。
2.3gE及gE鞭毛素融合蛋白的纯化及复性。
将收集的菌体,使用高压匀浆仪进行破碎后,2,265x g,离心10min,收集包涵体。将包涵体用含去污剂的生理盐水洗涤3~4次后加入含6M盐酸胍或8M尿素的20mM Tris,5mMimidazole,500mM NaCl,pH 8.0缓冲液进行溶解。将清洗后的镍柱用平衡液A(20mM Tris,8M Urea,5mM imidazole,500mM NaCl,pH 8.0)平衡5个柱体积(CV)。将溶解后的包涵体上样至镍柱,上样结束后,用平衡液冲洗5CV,然后用20CV线性梯度至100%洗脱液B进行洗脱,洗脱液B液为20mM Tris,8M Urea,500mM imidazole,500mM NaCl,pH 8.0。分别收集各个洗脱峰。
透析复性:将纯化的包涵体(溶解于8M Urea)用透析袋逐步透析至含6M、4M、2MUrea的PBS溶液中。每隔2h更换一次透析液。最后再将纯化后的包涵体蛋白缓慢透析至PBS溶液中。
柱上复性:在包涵体上样结束后,使用平衡液A冲洗柱子5CV;使用20CV~40CV线性梯度至100%复性液B,进行柱上复性,复性液B为:20mM Tris+2M Urea+5mM咪唑+500mMNaCl+0.1mM GSSG/1mM GSH,pH:8.0。复性结束后,使用缓冲液C(20mM Tris,2M Urea,5mMimidazole,500mM NaCl,pH 8.0)冲洗柱子5CV。用20CV线性梯度至100%洗脱液D进行洗脱,洗脱液D为:20mM Tris+2M Urea+5mM咪唑+500mM NaCl,pH:8.0。分别收集各个洗脱峰。将收集的洗脱峰使用透析袋,透析至PBS溶液中。
2.4gE及gE鞭毛素融合蛋白的检定。
10% SDS-PAGE电泳及WB分析纯化后的蛋白,结果见图8。检测后可知纯化后的gE蛋白分子量在58Kd左右,gE-鞭毛素融合蛋白在90Kd左右,除ECF蛋白外,其它蛋白经纯化后纯度达80%以上。各蛋白能被鼠anti-gE单克隆抗体特异性识别,gE-鞭毛素融合蛋白能被兔anti-鞭毛素D0-D1抗血清特异性识别。经BCA法检测蛋白浓度可知,纯化后gE蛋白的产量在15mg~20mg/L,gE-鞭毛素融合蛋白的产量在8~15mg/L。由于纯化后残留的脂多糖污染(LPS,一种佐剂,会干扰鞭毛素活性测定)且部分蛋白存在降解,因此未比较来自大肠杆菌产生的免疫原与来真核系统(重组腺病毒载体)表达的相应蛋白免疫原性差距。然而,本领域普通技术人员应当能够优化产率、防止或最小化蛋白质水解降解并显著降低残余LPS含量。本发明中未对原核表达的蛋白进行进一步优化是因为本发明使用腺病毒真核表达系统获得了完整的、高产量且无LPS的重组蛋白。
实施例3
gE蛋白及gE-鞭毛素融合蛋白在真核细胞中的表达,纯化,检定及活性分析
3.1gE蛋白及gE-鞭毛素融合蛋白在Vero细胞中的表达。
取汇合度为90%的Vero细胞一瓶(T-75瓶),用PBS清洗两次后,分别感染包装获得的重组腺病毒A及重组腺病毒B,MOI 100~200,37摄氏度吸附1小时后,每瓶补加20ml的DMEM培养基。将培养瓶放入CO2培养箱,37℃继续培养4~5天。之后收获培养上清,用于下一步纯化。
3.2gE蛋白及gE-鞭毛素融合蛋白的纯化
取收获的gE或gE鞭毛素融合蛋白表达上清加入等体积的10mM PBS+1M(NH4)2SO4,pH:7.5溶液,0.2μm滤膜过滤后上样至平衡好的Capto Phenyl Impress柱子中。平衡缓冲液为10mM PBS+500mM(NH4)2SO4,pH:7.5。上样结束后继续用平衡液冲洗5CV;使用10CV的线性梯度洗脱至100% B液,B液为10mM PBS,pH:7.5。收集100%B时的洗脱峰。
将收集的洗脱峰上样至10mM PBS,pH 7.5平衡好的Source 30Q柱中,上样结束后使用平衡液冲洗5CV,使用10mM PB+250mM NaCl,pH 7.5进行阶梯洗脱,并收集纯化液即为最终纯化液。将纯化液(100μg~5mg/ml)添加10%甘油后,冻存于-80℃冰箱中。
3.3gE蛋白及gE鞭毛素融合蛋白的检定及活性分析。
将纯化后的gE及gE鞭毛素融合蛋白经SDS-PAGE分析可知(见图9A),纯化后的gE蛋白纯度在95%以上,纯化后的gE-鞭毛素融合蛋白纯度在85%以上,经BCA检测纯化后蛋白含量可知,该方法表达的gE蛋白产量可达到100mg/L,gE-鞭毛素融合蛋白的产量在50~80mg/L。本发明所制备的重组蛋白在浓度范围100μg至5mg/ml的水溶液中均为可溶状态,例如磷酸盐缓冲液(pH7.0-7.5)或4mM醋酸盐缓冲液(pH5.4)水溶液。掌握本领域知识的技术人员均熟悉蛋白质长时间稳定保存的方法。
纯化后的蛋白经WB分析可知(见图9B和9C)gE蛋白及gE-鞭毛素融合蛋白均能被鼠anti-gE单克隆抗体特异性识别。只有gE-鞭毛素融合蛋白能够被兔anti-鞭毛素D0-D1抗血清特异性识别,但不识别gE蛋白。
TLR-5活性分析(见表3)显示ANF,ACF,ASF三种融合蛋白均能通过激活THP-1TLR-5受体诱导THP-1细胞以剂量依赖的方式分泌较高浓度的IL-8及TNF-α因子。但按照相同方法制备并纯化的gE蛋白则不能诱导TLR-5活性细胞因子的分泌。表明这三种gE-鞭毛素融合蛋白均具通过TLR-5特异性的发挥鞭毛素蛋白的功能活性。其中ASF的鞭毛素活性与商品化鞭毛素蛋白活性基本一致。
表3.TLR-5活性分析结果
实施例4
免疫原性测试
4.1重组腺病毒A及重组腺病毒B免疫原性检测
4.1.1动物免疫及样品收集。
所有动物实验均按照湖北省食品药品安全评价中心,动物保护与利用委员会(IACUC)批准的方案进行。36只无特殊病原体(SPF级)的雌性C57BL/6小鼠,体重12~16g饲养于湖北省食品药品安全评价中心。检验检疫结束后,小鼠按体重随机分为6组,分别于第1天和第28天肌肉接种109TCID50/剂量的重组腺病毒A、重组腺病毒B或700pfu市售VZV疫苗(长春祁健生物技术有限公司,中国)。表4总结了分组细节。分别于第0、12、42和56天从眼眶静脉丛采血。
表4重组腺病毒免疫原性检测分组情况
4.1.5不同腺病毒载体疫苗及市售水痘疫苗对小鼠的免疫原性对比
血清anti-gE IgG抗体:通过ELISA检测免疫后血清中anti-gE IgG抗体滴度,检测结果见图10及表5,空载体对照组小鼠在免疫后12、42、56天均未检测到抗体滴度上升。而其余各组在109剂量下,免疫后12天抗体滴度均明显提高,在第二剂加强免疫后,抗体滴度水平进一步升高。携带gE-鞭毛素融合蛋白的不同重组腺病毒组,在免疫后第12天抗体水平均显著高于rAd5-gE组及市售水痘疫苗组抗体滴度水平。在免疫后第56天,重组腺病毒各组抗体水平与商品化疫苗组相比抗体滴度均具有显著性差异(p<0.001)。各腺病毒载体候选疫苗组之间比较,仅有rAd5-gE组抗体滴度略低于rAd5-ANF组(P=0.031),其余各gE-鞭毛素融合腺病毒组之间抗体滴度无显著差别(P>0.05)。
表5.重组腺病毒诱导的gE-特异性IgG抗体滴度
血清中和抗体滴度:如图11所示,109剂量条件下,在第一剂免疫后56天,各重组腺病毒组均诱导较高的中和抗体水平。而rAd5-ACF组诱导的中和抗体水平与其余各重组腺病毒组及市售VZV疫苗相比均有显著性差异(p<0.001)。
其余各组虽无显著性差异,但诱导的中和抗体水平与市售的减毒活疫苗水平相当。rAd5-ANF及rAd5-SE组诱导的中和抗体水平与rAd5-gE组相比虽无统计学差异,但更为一致和均一。
细胞免疫水平检测:细胞内细胞因子染色结果见图12,重组腺病毒免疫C57BL/6小鼠8周后,rAd5-gE组及rAd5-SE组可检测到VZV gE特异性CD4+T细胞免疫。两者的CD4+及CD8+T细胞中IFN-γ阳性细胞百分比均显著高于腺病毒空载体对照组(P<0.01或P<0.0001)。如图13所示,IFN-γElispot检测结果见图13进一步证实了细胞内细胞因子染色的结果。rAd5-gE组与rAd5-SE组脾细胞IFN-γ和IL-4斑点数与其余各实验组相比均有显著性差异(P<0.01或P<0.0001)。rAd5-gE组与市售疫苗组相比也具有显著性差异(P<0.05)。说明rAd5-gE和rAd5-SE组可诱导强烈的CD4+Th1和Th2细胞免疫反应,同时亦可诱导较强的CD8+T细胞毒性细胞免疫反应。
4.2gE鞭毛素融合蛋白免疫原性检测
4.2.1动物免疫及样品收集。
所有动物实验均按照湖北省食品药品安全评价中心,动物保护与利用委员会(IACUC)批准的方案进行。60只无特殊病原体(SPF级)的雌性C57BL/6小鼠,体重12~16g饲养于湖北省食品药品安全评价中心。检验检疫结束后,小鼠按体重随机分为10组,分别于第1天和第14天肌肉接种含和不含MF59(50μl/剂)佐剂的gE蛋白(5μg/剂)或含和不含MF59佐剂的gE-鞭毛素融合蛋白(8μg/剂)或700pfu市售VZV疫苗(长春祁健生物技术有限公司,中国)。表6总结了分组细节。分别于第0天和第28天从眼眶静脉丛采血。
表6.gE鞭毛素融合蛋白动物实验分组
组别 处理 剂量(μg/dose) 给药途径 数量
阴性对照组 生理盐水 / 肌肉注射,0.1ml/只 6
gE gE 5 肌肉注射,0.1ml/只 6
ANF ANF 8 肌肉注射,0.1ml/只 6
ACF ACF 8 肌肉注射,0.1ml/只 6
ASF ASF 8 肌肉注射,0.1ml/只 6
gE+MF59 gE+MF59 5+50μl 肌肉注射,0.1ml/只 6
ANF+MF59 ANF+MF59 8+50μl 肌肉注射,0.1ml/只 6
ACF+MF59 ACF+MF59 8+50μl 肌肉注射,0.1ml/只 6
ASF+MF59 ASF+MF59 8+50μl 肌肉注射,0.1ml/只 6
阳性疫苗 Licensed VZV 700PFU 肌肉注射,0.15ml/只 6
4.2.2含佐剂与不含佐剂的gE蛋白及gE-鞭毛素融合蛋白及市售水痘疫苗免疫原性对比。
血清anti-gE IgG抗体滴度:免疫后第28天,即第二剂免疫后第14天小鼠血清进行ELISA检测gE特异性抗体滴度,结果见图14及表7。ACF组gE特异性抗体滴度明显升高且与盐水组及gE组相比均具有统计学差异。ANF与ASF组gE特异性抗体滴度亦明显升高,与盐水组相比具有统计学差异;且gE特异性抗体滴度水平亦均高于gE组。该结果表明,在免疫后4周,所有不含MF59佐剂的的自身具有佐剂效应gE-鞭毛素融合蛋白诱导的抗体水平均显著高于对照组(p<0.0001)。在添加MF59佐剂后,抗体滴度进一步提高,表明该免疫组合物与佐剂联合具有增强体液免疫的作用,后期还可以考虑与其它能够诱导产生细胞免疫的佐剂联合使用。
表7.gE及gE-鞭毛素融合蛋白诱导的gE-特异性IgG抗体滴度
血清中和抗体滴度:如图15所示,在第二剂免疫后14天,含MF59佐剂的ACF组诱导的中和抗体水平显著高于含MF59佐剂的gE蛋白组诱导的中和抗体水平。虽然其它两个含MF59佐剂的gE-鞭毛素融合蛋白与含MF59佐剂的gE蛋白组相比中和抗体水平无显著差异,但含MF59佐剂的gE-鞭毛素融合蛋白组诱导的中和抗体水平仍然高于MF59佐剂的gE蛋白组。且含MF59佐剂的gE-鞭毛素融合蛋白组诱导的中和抗体水平与市售减毒水痘活疫苗诱导的中和抗体水平相当。除此之外,含MF59佐剂的ASF和ACF组诱导的中和抗体反应比市售疫苗组诱导的中和抗体水平更为一致和均一。
细胞免疫:IFN-γ及IL-4Elispot检测结果见图16。含MF59佐剂的gE及ACF组脾细胞产生的IL-4斑点数有明显增加。与市售水痘减毒活疫苗相比具有显著性差异。
结论:目前仍需要开发一种更安全的改良型水痘和带状疱疹疫苗。市售的水痘减毒活疫苗仍然会给疫苗接种者带来罕见但非常严重的不良反应风险,尤其是对婴儿及免疫抑制人群,一旦出现这些反应,即需要紧急医疗处理。此外,市售的水痘减毒活疫苗还存在传染免疫受损个体的风险。三分之一接种了减毒活疫苗的受试者日后将有患带状疱疹的风险,他们当中有五分之一的受试者将受到带状疱疹愈后衰弱慢性神经痛的影响。因而目前孕妇和免疫功能低下的人禁止使用水痘和带状疱疹减毒活疫苗。尽管含佐剂的亚单位带状疱疹疫苗Shingrix比减毒活疫苗更有效,但它不良反应更多,会引起更多的局部和全身不良反应(Tricco AC et al.,BMJ,363:k4029,2018)。
本发明公开了制备和实施新的免疫组分的方法,所述免疫组分可用于预防针对VZV感染的疫苗并诱导广泛的保护性体液和细胞免疫。所述免疫组分选取VZV-gE糖蛋白作为免疫原,是因为gE蛋白是VZV病毒中含量最丰富、免疫原性最强的一种蛋白。本发明所述的免疫组分包括含佐剂的重组VZV-gE蛋白和具有内在佐剂特性的gE-flagelin融合蛋白。所述免疫组分可在原核或真核表达系统中表达制备,亦可在表达gE或gE-鞭毛素蛋白的复制缺陷型腺病毒载体中制备。通过基因工程与gE蛋白共价连接的鞭毛素蛋白部分已被证明能够结合并激活TLR5,从而触发天然免疫。这种融合蛋白在人类疫苗中可能不需要进一步的佐剂,从而降低由佐剂引发的不良反应的风险。根据本发明,所有免疫组分都具有高度的免疫原性,能诱导很强的与保护作用相关的gE特异性抗体、体外功能性中和抗体;同时该免疫组分还可诱导出在带状疱疹预防及康复中起重要作用的CD4+Th1和Th2 T细胞免疫。具有自身佐剂效应的gE-鞭毛素融合蛋白无论是直接纯化后的或经腺病毒载体递送均比其相应的gE蛋白具有更高的免疫原性。如有需要,还可使用Shingrix中AS01反应性低得多的常规佐剂即可显著提高纯化蛋白的免疫原性。表达gE或gE-鞭毛素融合蛋白的非复制腺病毒载体不仅能诱导良好的gE特异性抗体、VZV中和反应和CD4+T细胞反应,而且还能诱导机体产生CD8+T细胞免疫,从而能够进一步破坏被VZV感染细胞。
本发明中几乎所有的免疫组分均比市售减毒水痘活疫苗的免疫原性更强。此外,本发明所述的各种免疫组分可被用作初免-加强免疫策略的一部分,以增强及扩大VZV特异性免疫。所述的各种免疫组分还可与其他免疫原混合用于联合疫苗中。这些免疫组分比市售的水痘减毒活疫苗更安全,因为它们不会传染,不会引起偶然的可能与使用相关的严重的不良事件,而且最重要的是不会使疫苗接种者暴露于罹患带状疱疹及愈后神经痛的重大风险。本发明还公开了gE和gE鞭毛素蛋白融合蛋白在原核系统中表达制备的方法,该方法可降低疫苗的生产成本。本发明公开的腺病毒载体亦可被开发为单次免疫的疫苗,从而减少免疫频次。
总之,本发明提供的免疫组分可用于生产更安全、有效和可能更便宜的预防和控制水痘和带状疱疹的新型疫苗。需要注意的是,上述实施例仅用于说明本发明的技术方案,但不应理解为对本发明的限制。本领域技术人员可以对本发明的上述内容进行进一步的改进和调整,属于本发明的保护范围。
序列表Table 8. 序列表
/>
SEQUENCE LISTING
<110> BRAVOVAX CO., LTD
<120> IMMUNE COMPOSITION, PREPARATION METHOD THEREFOR AND USE THEREOF
<130> FPUS20111744
<150> 2019105718393
<151> 2019-06-28
<150> 2018111315018
<151> 2019-09-27
<160> 42
<170> PatentIn version 3.3
<210> 1
<211> 507
<212> PRT
<213> Adenovirus
<220>
<221> UNSURE
<222> (1)..(507)
<400> 1
Ser Val Leu Arg Tyr Asp Asp Phe His Ile Asp Glu Asp Lys Leu Asp
1 5 10 15
Thr Asn Ser Val Tyr Glu Pro Tyr Tyr His Ser Asp His Ala Glu Ser
20 25 30
Ser Trp Val Asn Arg Gly Glu Ser Ser Arg Lys Ala Tyr Asp His Asn
35 40 45
Ser Pro Tyr Ile Trp Pro Arg Asn Asp Tyr Asp Gly Phe Leu Glu Asn
50 55 60
Ala His Glu His His Gly Val Tyr Asn Gln Gly Arg Gly Ile Asp Ser
65 70 75 80
Gly Glu Arg Leu Met Gln Pro Thr Gln Met Ser Ala Gln Glu Asp Leu
85 90 95
Gly Asp Asp Thr Gly Ile His Val Ile Pro Thr Leu Asn Gly Asp Asp
100 105 110
Arg His Lys Ile Val Asn Val Asp Gln Arg Gln Tyr Gly Asp Val Phe
115 120 125
Lys Gly Asp Leu Asn Pro Lys Pro Gln Gly Gln Arg Leu Ile Glu Val
130 135 140
Ser Val Glu Glu Asn His Pro Phe Thr Leu Arg Ala Pro Ile Gln Arg
145 150 155 160
Ile Tyr Gly Val Arg Tyr Thr Glu Thr Trp Ser Phe Leu Pro Ser Leu
165 170 175
Thr Cys Thr Gly Asp Ala Ala Pro Ala Ile Gln His Ile Cys Leu Lys
180 185 190
His Thr Thr Cys Phe Gln Asp Val Val Val Asp Val Asp Cys Ala Glu
195 200 205
Asn Thr Lys Glu Asp Gln Leu Ala Glu Ile Ser Tyr Arg Phe Gln Gly
210 215 220
Lys Lys Glu Ala Asp Gln Pro Trp Ile Val Val Asn Thr Ser Thr Leu
225 230 235 240
Phe Asp Glu Leu Glu Leu Asp Pro Pro Glu Ile Glu Pro Gly Val Leu
245 250 255
Lys Val Leu Arg Thr Glu Lys Gln Tyr Leu Gly Val Tyr Ile Trp Asn
260 265 270
Met Arg Gly Ser Asp Gly Thr Ser Thr Tyr Ala Thr Phe Leu Val Thr
275 280 285
Trp Lys Gly Asp Glu Lys Thr Arg Asn Pro Thr Pro Ala Val Thr Pro
290 295 300
Gln Pro Arg Gly Ala Glu Phe His Met Trp Asn Tyr His Ser His Val
305 310 315 320
Phe Ser Val Gly Asp Thr Phe Ser Leu Ala Met His Leu Gln Tyr Lys
325 330 335
Ile His Glu Ala Pro Phe Asp Leu Leu Leu Glu Trp Leu Tyr Val Pro
340 345 350
Ile Asp Pro Thr Cys Gln Pro Met Arg Leu Tyr Ser Thr Cys Leu Tyr
355 360 365
His Pro Asn Ala Pro Gln Cys Leu Ser His Met Asn Ser Gly Cys Thr
370 375 380
Phe Thr Ser Pro His Leu Ala Gln Arg Val Ala Ser Thr Val Tyr Gln
385 390 395 400
Asn Cys Glu His Ala Asp Asn Tyr Thr Ala Tyr Cys Leu Gly Ile Ser
405 410 415
His Met Glu Pro Ser Phe Gly Leu Ile Leu His Asp Gly Gly Thr Thr
420 425 430
Leu Lys Phe Val Asp Thr Pro Glu Ser Leu Ser Gly Leu Tyr Val Phe
435 440 445
Val Val Tyr Phe Asn Gly His Val Glu Ala Val Ala Tyr Thr Val Val
450 455 460
Ser Thr Val Asp His Phe Val Asn Ala Ile Glu Glu Arg Gly Phe Pro
465 470 475 480
Pro Thr Ala Gly Gln Pro Pro Ala Thr Thr Lys Pro Lys Glu Ile Thr
485 490 495
Pro Val Asn Pro Gly Thr Ser Pro Leu Ile Arg
500 505
<210> 2
<211> 1518
<212> DNA
<213> Adenovirus
<220>
<221> unsure
<222> (1)..(1518)
<400> 2
agcgtgtgag atatgatgac ttccacattg atgaggataa actagacact aatagcgtgt 60
atgagcctta ctaccatagt gaccatgctg aatctagctg ggtgaatagg ggtgaatcta 120
gccgtaaggc atagatcata actcccctta tatctggcct aggaatgact atgacggctt 180
tctggagaat gcccacgagc atcacggcgt gtacaatcag gggcggggca tcgacagcgg 240
cgagaggctg atgcagccaa ccagatgagc gcccaggagg acctgggcga cgacaccggc 300
atccacgtga tccccaccct gaacggcgac gacaggcaca agatcgtgaa cgtggaccag 360
aggcagtacg gcgatgtgtt caagggcacc tgaaccccaa accccagggc cagaggctga 420
tcgaggtgtc cgtggaggag aaccaccctt tcaccctgag agcccccatc cagcggatct 480
acggcgtgag atacaccgag acctggagct tcttcccagc ctgacctgca cgggcgatgc 540
cgcccccgcc atccagcaca tctgcctgaa gcacaccacc tgtttccagg atgtggtggt 600
tgatgtggac tgtgccgaaa atactaagga ggaccagctg gcgagatctc ctaccgcttc 660
cagggcaaaa aggaggccga ccagccctgg atcgtggtga acacctccac cctgttcgat 720
gagttagagc tggacccccc tgagatcgag cctggcgtgc tgaaagtgtg cgcaccgaga 780
agcagtacct gggcgtgtac atctggaaca tgaggggcag cgacggcacc agcacctacg 840
ccaccttcct ggtgacctgg aagggcgacg agaagaccag aaatcctacc cccgcgtgac 900
cccccagcct aggggcgccg agtttcacat gtggaactac cacagccacg tgttcagcgt 960
gggcgacacc ttcagcctgg ccatgcacct gcagtacaag atccacgagg cccccttcga 1020
ccgctgctgg agtggctgta cgtgcccatc gaccccacct gccagcccat gagactgtac 1080
agcacttgcc tgtaccaccc caacgccccc cagtgcctga gccacatgaa tagcggctgc 1140
accttcaccg cccccacctg gctcagaggg tggccagcac cgtgtaccag aactgcgagc 1200
acgccgacaa ttacaccgcc tactgcctgg gcatcagcca catggagccc agcttcggcc 1260
tgatcctgca cgacggggca ccaccctgaa gtttgtggac acccccgagt ccctgtctgg 1320
actgtatgtc tttgtggtgt attttaatgg acacgttgaa gccgtggcct atacagtggt 1380
gtctacagtg gaccactttg tgaatgccat tgaagaaaga ggctttcctc ctaccgccgg 1440
ccagccccca gccacaccaa gcctaaagaa atcacaccag tgaatccagg aactagcccc 1500
ctgatcagat aataataa 1518
<210> 3
<211> 495
<212> PRT
<213> Salmonella typhimurium
<220>
<221> UNSURE
<222> (1)..(495)
<400> 3
Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn
1 5 10 15
Asn Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu
20 25 30
Ser Ser Gly Leu Arg Ile Asn Ser Ala Lys Asp Asp Ala Ala Gly Gln
35 40 45
Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu Thr Gln Ala
50 55 60
Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly
65 70 75 80
Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala
85 90 95
Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile
100 105 110
Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly
115 120 125
Gln Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp Asn Thr Leu
130 135 140
Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu
145 150 155 160
Lys Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Thr Leu Asn Val Gln
165 170 175
Gln Lys Tyr Lys Val Ser Asp Thr Ala Ala Thr Val Thr Gly Tyr Ala
180 185 190
Asp Thr Thr Ile Ala Leu Asp Asn Ser Thr Phe Lys Ala Ser Ala Thr
195 200 205
Gly Leu Gly Gly Thr Asp Gln Lys Ile Asp Gly Asp Leu Lys Phe Asp
210 215 220
Asp Thr Thr Gly Lys Tyr Tyr Ala Lys Val Thr Val Thr Gly Gly Thr
225 230 235 240
Gly Lys Asp Gly Tyr Tyr Glu Val Ser Val Asp Lys Thr Asn Gly Glu
245 250 255
Val Thr Leu Ala Gly Gly Ala Thr Ser Pro Leu Thr Gly Gly Leu Pro
260 265 270
Ala Thr Ala Thr Glu Asp Val Lys Asn Val Gln Val Ala Asn Ala Asp
275 280 285
Leu Thr Glu Ala Lys Ala Ala Leu Thr Ala Ala Gly Val Thr Gly Thr
290 295 300
Ala Ser Val Val Lys Met Ser Tyr Thr Asp Asn Asn Gly Lys Thr Ile
305 310 315 320
Asp Gly Gly Leu Ala Val Lys Val Gly Asp Asp Tyr Tyr Ser Ala Thr
325 330 335
Gln Asn Lys Asp Gly Ser Ile Ser Ile Asn Thr Thr Lys Tyr Thr Ala
340 345 350
Asp Asp Gly Thr Ser Lys Thr Ala Leu Asn Lys Leu Gly Gly Ala Asp
355 360 365
Gly Lys Thr Glu Val Val Ser Ile Gly Gly Lys Thr Tyr Ala Ala Ser
370 375 380
Lys Ala Glu Gly His Asn Phe Lys Ala Gln Pro Asp Leu Ala Glu Ala
385 390 395 400
Ala Ala Thr Thr Thr Glu Asn Pro Leu Gln Lys Ile Asp Ala Ala Leu
405 410 415
Ala Gln Val Asp Thr Leu Arg Ser Asp Leu Gly Ala Val Gln Asn Arg
420 425 430
Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Thr
435 440 445
Ser Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser
450 455 460
Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu
465 470 475 480
Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser Leu Leu Arg
485 490 495
<210> 4
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<221> UNSURE
<222> (1)..(16)
<223> unknown
<400> 4
Ser Pro Gly Ile Ser Gly Gly Gly Gly Gly Ile Leu Asp Ser Met Gly
1 5 10 15
<210> 5
<211> 129
<212> PRT
<213> Salmonella typhimurium
<220>
<221> UNSURE
<222> (1)..(129)
<400> 5
Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn
1 5 10 15
Asn Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu
20 25 30
Ser Ser Gly Leu Arg Ile Asn Ser Ala Lys Asp Asp Ala Ala Gly Gln
35 40 45
Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu Thr Gln Ala
50 55 60
Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly
65 70 75 80
Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala
85 90 95
Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile
100 105 110
Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly
115 120 125
Gln
<210> 6
<211> 104
<212> PRT
<213> Salmonella typhimurium
<220>
<221> UNSURE
<222> (1)..(104)
<400> 6
Lys Ala Gln Pro Asp Leu Ala Glu Ala Ala Ala Thr Thr Thr Glu Asn
1 5 10 15
Pro Leu Gln Lys Ile Asp Ala Ala Leu Ala Gln Val Asp Thr Leu Arg
20 25 30
Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn
35 40 45
Leu Gly Asn Thr Val Asn Asn Leu Thr Ser Ala Arg Ser Arg Ile Glu
50 55 60
Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala Gln Ile
65 70 75 80
Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln Val Pro
85 90 95
Gln Asn Val Leu Ser Leu Leu Arg
100
<210> 7
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<221> UNSURE
<222> (1)..(15)
<223> unknown
<400> 7
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 8
<211> 817
<212> PRT
<213> Artificial Sequence
<220>
<221> UNSURE
<222> (1)..(817)
<223> unknown
<400> 8
Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn
1 5 10 15
Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser
20 25 30
Ser Gly Leu Arg Ile Asn Ser Ala Lys Asp Asp Ala Ala Gly Gln Ala
35 40 45
Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu Thr Gln Ala Ser
50 55 60
Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala
65 70 75 80
Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val
85 90 95
Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln
100 105 110
Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln
115 120 125
Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp Asn Thr Leu Thr
130 135 140
Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Lys
145 150 155 160
Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Thr Leu Asn Val Gln Ser
165 170 175
Pro Gly Ile Ser Gly Gly Gly Gly Gly Ile Leu Asp Ser Met Gly Lys
180 185 190
Ala Gln Pro Asp Leu Ala Glu Ala Ala Ala Thr Thr Thr Glu Asn Pro
195 200 205
Leu Gln Lys Ile Asp Ala Ala Leu Ala Gln Val Asp Thr Leu Arg Ser
210 215 220
Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn Leu
225 230 235 240
Gly Asn Thr Val Asn Asn Leu Thr Ser Ala Arg Ser Arg Ile Glu Asp
245 250 255
Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala Gln Ile Leu
260 265 270
Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln Val Pro Gln
275 280 285
Asn Val Leu Ser Leu Leu Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly
290 295 300
Ser Gly Gly Gly Gly Ser Ser Val Leu Arg Tyr Asp Asp Phe His Ile
305 310 315 320
Asp Glu Asp Lys Leu Asp Thr Asn Ser Val Tyr Glu Pro Tyr Tyr His
325 330 335
Ser Asp His Ala Glu Ser Ser Trp Val Asn Arg Gly Glu Ser Ser Arg
340 345 350
Lys Ala Tyr Asp His Asn Ser Pro Tyr Ile Trp Pro Arg Asn Asp Tyr
355 360 365
Asp Gly Phe Leu Glu Asn Ala His Glu His His Gly Val Tyr Asn Gln
370 375 380
Gly Arg Gly Ile Asp Ser Gly Glu Arg Leu Met Gln Pro Thr Gln Met
385 390 395 400
Ser Ala Gln Glu Asp Leu Gly Asp Asp Thr Gly Ile His Val Ile Pro
405 410 415
Thr Leu Asn Gly Asp Asp Arg His Lys Ile Val Asn Val Asp Gln Arg
420 425 430
Gln Tyr Gly Asp Val Phe Lys Gly Asp Leu Asn Pro Lys Pro Gln Gly
435 440 445
Gln Arg Leu Ile Glu Val Ser Val Glu Glu Asn His Pro Phe Thr Leu
450 455 460
Arg Ala Pro Ile Gln Arg Ile Tyr Gly Val Arg Tyr Thr Glu Thr Trp
465 470 475 480
Ser Phe Leu Pro Ser Leu Thr Cys Thr Gly Asp Ala Ala Pro Ala Ile
485 490 495
Gln His Ile Cys Leu Lys His Thr Thr Cys Phe Gln Asp Val Val Val
500 505 510
Asp Val Asp Cys Ala Glu Asn Thr Lys Glu Asp Gln Leu Ala Glu Ile
515 520 525
Ser Tyr Arg Phe Gln Gly Lys Lys Glu Ala Asp Gln Pro Trp Ile Val
530 535 540
Val Asn Thr Ser Thr Leu Phe Asp Glu Leu Glu Leu Asp Pro Pro Glu
545 550 555 560
Ile Glu Pro Gly Val Leu Lys Val Leu Arg Thr Glu Lys Gln Tyr Leu
565 570 575
Gly Val Tyr Ile Trp Asn Met Arg Gly Ser Asp Gly Thr Ser Thr Tyr
580 585 590
Ala Thr Phe Leu Val Thr Trp Lys Gly Asp Glu Lys Thr Arg Asn Pro
595 600 605
Thr Pro Ala Val Thr Pro Gln Pro Arg Gly Ala Glu Phe His Met Trp
610 615 620
Asn Tyr His Ser His Val Phe Ser Val Gly Asp Thr Phe Ser Leu Ala
625 630 635 640
Met His Leu Gln Tyr Lys Ile His Glu Ala Pro Phe Asp Leu Leu Leu
645 650 655
Glu Trp Leu Tyr Val Pro Ile Asp Pro Thr Cys Gln Pro Met Arg Leu
660 665 670
Tyr Ser Thr Cys Leu Tyr His Pro Asn Ala Pro Gln Cys Leu Ser His
675 680 685
Met Asn Ser Gly Cys Thr Phe Thr Ser Pro His Leu Ala Gln Arg Val
690 695 700
Ala Ser Thr Val Tyr Gln Asn Cys Glu His Ala Asp Asn Tyr Thr Ala
705 710 715 720
Tyr Cys Leu Gly Ile Ser His Met Glu Pro Ser Phe Gly Leu Ile Leu
725 730 735
His Asp Gly Gly Thr Thr Leu Lys Phe Val Asp Thr Pro Glu Ser Leu
740 745 750
Ser Gly Leu Tyr Val Phe Val Val Tyr Phe Asn Gly His Val Glu Ala
755 760 765
Val Ala Tyr Thr Val Val Ser Thr Val Asp His Phe Val Asn Ala Ile
770 775 780
Glu Glu Arg Gly Phe Pro Pro Thr Ala Gly Gln Pro Pro Ala Thr Thr
785 790 795 800
Lys Pro Lys Glu Ile Thr Pro Val Asn Pro Gly Thr Ser Pro Leu Ile
805 810 815
Arg
<210> 9
<211> 817
<212> PRT
<213> Artificial Sequence
<220>
<221> UNSURE
<222> (1)..(817)
<223> unknown
<400> 9
Ser Val Leu Arg Tyr Asp Asp Phe His Ile Asp Glu Asp Lys Leu Asp
1 5 10 15
Thr Asn Ser Val Tyr Glu Pro Tyr Tyr His Ser Asp His Ala Glu Ser
20 25 30
Ser Trp Val Asn Arg Gly Glu Ser Ser Arg Lys Ala Tyr Asp His Asn
35 40 45
Ser Pro Tyr Ile Trp Pro Arg Asn Asp Tyr Asp Gly Phe Leu Glu Asn
50 55 60
Ala His Glu His His Gly Val Tyr Asn Gln Gly Arg Gly Ile Asp Ser
65 70 75 80
Gly Glu Arg Leu Met Gln Pro Thr Gln Met Ser Ala Gln Glu Asp Leu
85 90 95
Gly Asp Asp Thr Gly Ile His Val Ile Pro Thr Leu Asn Gly Asp Asp
100 105 110
Arg His Lys Ile Val Asn Val Asp Gln Arg Gln Tyr Gly Asp Val Phe
115 120 125
Lys Gly Asp Leu Asn Pro Lys Pro Gln Gly Gln Arg Leu Ile Glu Val
130 135 140
Ser Val Glu Glu Asn His Pro Phe Thr Leu Arg Ala Pro Ile Gln Arg
145 150 155 160
Ile Tyr Gly Val Arg Tyr Thr Glu Thr Trp Ser Phe Leu Pro Ser Leu
165 170 175
Thr Cys Thr Gly Asp Ala Ala Pro Ala Ile Gln His Ile Cys Leu Lys
180 185 190
His Thr Thr Cys Phe Gln Asp Val Val Val Asp Val Asp Cys Ala Glu
195 200 205
Asn Thr Lys Glu Asp Gln Leu Ala Glu Ile Ser Tyr Arg Phe Gln Gly
210 215 220
Lys Lys Glu Ala Asp Gln Pro Trp Ile Val Val Asn Thr Ser Thr Leu
225 230 235 240
Phe Asp Glu Leu Glu Leu Asp Pro Pro Glu Ile Glu Pro Gly Val Leu
245 250 255
Lys Val Leu Arg Thr Glu Lys Gln Tyr Leu Gly Val Tyr Ile Trp Asn
260 265 270
Met Arg Gly Ser Asp Gly Thr Ser Thr Tyr Ala Thr Phe Leu Val Thr
275 280 285
Trp Lys Gly Asp Glu Lys Thr Arg Asn Pro Thr Pro Ala Val Thr Pro
290 295 300
Gln Pro Arg Gly Ala Glu Phe His Met Trp Asn Tyr His Ser His Val
305 310 315 320
Phe Ser Val Gly Asp Thr Phe Ser Leu Ala Met His Leu Gln Tyr Lys
325 330 335
Ile His Glu Ala Pro Phe Asp Leu Leu Leu Glu Trp Leu Tyr Val Pro
340 345 350
Ile Asp Pro Thr Cys Gln Pro Met Arg Leu Tyr Ser Thr Cys Leu Tyr
355 360 365
His Pro Asn Ala Pro Gln Cys Leu Ser His Met Asn Ser Gly Cys Thr
370 375 380
Phe Thr Ser Pro His Leu Ala Gln Arg Val Ala Ser Thr Val Tyr Gln
385 390 395 400
Asn Cys Glu His Ala Asp Asn Tyr Thr Ala Tyr Cys Leu Gly Ile Ser
405 410 415
His Met Glu Pro Ser Phe Gly Leu Ile Leu His Asp Gly Gly Thr Thr
420 425 430
Leu Lys Phe Val Asp Thr Pro Glu Ser Leu Ser Gly Leu Tyr Val Phe
435 440 445
Val Val Tyr Phe Asn Gly His Val Glu Ala Val Ala Tyr Thr Val Val
450 455 460
Ser Thr Val Asp His Phe Val Asn Ala Ile Glu Glu Arg Gly Phe Pro
465 470 475 480
Pro Thr Ala Gly Gln Pro Pro Ala Thr Thr Lys Pro Lys Glu Ile Thr
485 490 495
Pro Val Asn Pro Gly Thr Ser Pro Leu Ile Arg Gly Gly Gly Gly Ser
500 505 510
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Gln Val Ile Asn Thr
515 520 525
Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn Leu Asn Lys Ser Gln Ser
530 535 540
Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn
545 550 555 560
Ser Ala Lys Asp Asp Ala Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr
565 570 575
Ala Asn Ile Lys Gly Leu Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly
580 585 590
Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn
595 600 605
Asn Leu Gln Arg Val Arg Glu Leu Ala Val Gln Ser Ala Asn Ser Thr
610 615 620
Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg
625 630 635 640
Leu Asn Glu Ile Asp Arg Val Ser Gly Gln Thr Gln Phe Asn Gly Val
645 650 655
Lys Val Leu Ala Gln Asp Asn Thr Leu Thr Ile Gln Val Gly Ala Asn
660 665 670
Asp Gly Glu Thr Ile Asp Ile Asp Leu Lys Gln Ile Asn Ser Gln Thr
675 680 685
Leu Gly Leu Asp Thr Leu Asn Val Gln Ser Pro Gly Ile Ser Gly Gly
690 695 700
Gly Gly Gly Ile Leu Asp Ser Met Gly Lys Ala Gln Pro Asp Leu Ala
705 710 715 720
Glu Ala Ala Ala Thr Thr Thr Glu Asn Pro Leu Gln Lys Ile Asp Ala
725 730 735
Ala Leu Ala Gln Val Asp Thr Leu Arg Ser Asp Leu Gly Ala Val Gln
740 745 750
Asn Arg Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val Asn Asn
755 760 765
Leu Thr Ser Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala Thr Glu
770 775 780
Val Ser Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly Thr Ser
785 790 795 800
Val Leu Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser Leu Leu
805 810 815
Arg
<210> 10
<211> 816
<212> PRT
<213> Artificial Sequence
<220>
<221> UNSURE
<222> (1)..(816)
<223> unknown
<400> 10
Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn
1 5 10 15
Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser
20 25 30
Ser Gly Leu Arg Ile Asn Ser Ala Lys Asp Asp Ala Ala Gly Gln Ala
35 40 45
Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu Thr Gln Ala Ser
50 55 60
Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala
65 70 75 80
Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val
85 90 95
Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln
100 105 110
Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln
115 120 125
Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp Asn Thr Leu Thr
130 135 140
Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Lys
145 150 155 160
Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Thr Leu Asn Val Gln Gly
165 170 175
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ser Val
180 185 190
Leu Arg Tyr Asp Asp Phe His Ile Asp Glu Asp Lys Leu Asp Thr Asn
195 200 205
Ser Val Tyr Glu Pro Tyr Tyr His Ser Asp His Ala Glu Ser Ser Trp
210 215 220
Val Asn Arg Gly Glu Ser Ser Arg Lys Ala Tyr Asp His Asn Ser Pro
225 230 235 240
Tyr Ile Trp Pro Arg Asn Asp Tyr Asp Gly Phe Leu Glu Asn Ala His
245 250 255
Glu His His Gly Val Tyr Asn Gln Gly Arg Gly Ile Asp Ser Gly Glu
260 265 270
Arg Leu Met Gln Pro Thr Gln Met Ser Ala Gln Glu Asp Leu Gly Asp
275 280 285
Asp Thr Gly Ile His Val Ile Pro Thr Leu Asn Gly Asp Asp Arg His
290 295 300
Lys Ile Val Asn Val Asp Gln Arg Gln Tyr Gly Asp Val Phe Lys Gly
305 310 315 320
Asp Leu Asn Pro Lys Pro Gln Gly Gln Arg Leu Ile Glu Val Ser Val
325 330 335
Glu Glu Asn His Pro Phe Thr Leu Arg Ala Pro Ile Gln Arg Ile Tyr
340 345 350
Gly Val Arg Tyr Thr Glu Thr Trp Ser Phe Leu Pro Ser Leu Thr Cys
355 360 365
Thr Gly Asp Ala Ala Pro Ala Ile Gln His Ile Cys Leu Lys His Thr
370 375 380
Thr Cys Phe Gln Asp Val Val Val Asp Val Asp Cys Ala Glu Asn Thr
385 390 395 400
Lys Glu Asp Gln Leu Ala Glu Ile Ser Tyr Arg Phe Gln Gly Lys Lys
405 410 415
Glu Ala Asp Gln Pro Trp Ile Val Val Asn Thr Ser Thr Leu Phe Asp
420 425 430
Glu Leu Glu Leu Asp Pro Pro Glu Ile Glu Pro Gly Val Leu Lys Val
435 440 445
Leu Arg Thr Glu Lys Gln Tyr Leu Gly Val Tyr Ile Trp Asn Met Arg
450 455 460
Gly Ser Asp Gly Thr Ser Thr Tyr Ala Thr Phe Leu Val Thr Trp Lys
465 470 475 480
Gly Asp Glu Lys Thr Arg Asn Pro Thr Pro Ala Val Thr Pro Gln Pro
485 490 495
Arg Gly Ala Glu Phe His Met Trp Asn Tyr His Ser His Val Phe Ser
500 505 510
Val Gly Asp Thr Phe Ser Leu Ala Met His Leu Gln Tyr Lys Ile His
515 520 525
Glu Ala Pro Phe Asp Leu Leu Leu Glu Trp Leu Tyr Val Pro Ile Asp
530 535 540
Pro Thr Cys Gln Pro Met Arg Leu Tyr Ser Thr Cys Leu Tyr His Pro
545 550 555 560
Asn Ala Pro Gln Cys Leu Ser His Met Asn Ser Gly Cys Thr Phe Thr
565 570 575
Ser Pro His Leu Ala Gln Arg Val Ala Ser Thr Val Tyr Gln Asn Cys
580 585 590
Glu His Ala Asp Asn Tyr Thr Ala Tyr Cys Leu Gly Ile Ser His Met
595 600 605
Glu Pro Ser Phe Gly Leu Ile Leu His Asp Gly Gly Thr Thr Leu Lys
610 615 620
Phe Val Asp Thr Pro Glu Ser Leu Ser Gly Leu Tyr Val Phe Val Val
625 630 635 640
Tyr Phe Asn Gly His Val Glu Ala Val Ala Tyr Thr Val Val Ser Thr
645 650 655
Val Asp His Phe Val Asn Ala Ile Glu Glu Arg Gly Phe Pro Pro Thr
660 665 670
Ala Gly Gln Pro Pro Ala Thr Thr Lys Pro Lys Glu Ile Thr Pro Val
675 680 685
Asn Pro Gly Thr Ser Pro Leu Ile Arg Gly Gly Gly Gly Ser Gly Gly
690 695 700
Gly Gly Ser Gly Gly Gly Gly Ser Lys Ala Gln Pro Asp Leu Ala Glu
705 710 715 720
Ala Ala Ala Thr Thr Thr Glu Asn Pro Leu Gln Lys Ile Asp Ala Ala
725 730 735
Leu Ala Gln Val Asp Thr Leu Arg Ser Asp Leu Gly Ala Val Gln Asn
740 745 750
Arg Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val Asn Asn Leu
755 760 765
Thr Ser Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val
770 775 780
Ser Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly Thr Ser Val
785 790 795 800
Leu Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser Leu Leu Arg
805 810 815
<210> 11
<211> 878
<212> DNA
<213> Artificial sequence
<220>
<221> unsure
<222> (1)..(878)
<223> unknown
<400> 11
gcccaggtca ttaacaccaa ctccctgagc ctgctgaccc agaacaatct gaataaagcc 60
agagcgccct ggggaccgcc atcgagcggc tgagctccgg cctgcgcatc aattccgcca 120
aggatgacgc cgccggccag gctatcgcca accggttcac cgctaacatc aagggcctga 180
cccggctagc aggaatgcca atgacggcat tagcattgcc cagacaaccg agggcgccct 240
gaacgagatc aataataacc tgcagagagt gagggaactg gccgtgcagt ccgccaactc 300
tacaaactca agagcgatct ggattccatc caggccgaaa tcacccagcg cctgaatgag 360
atcgacagag tgagcggcca gacccagttt aacggcgtga aggtgctggc ccaggataat 420
accctgacca tccaggtggc gccaatgacg gcgagactat cgacattgat ctgaagcaga 480
ttaactccca gaccctgggc ctggacactc tgaacgtgca gagcccaggg atcagcgggg 540
ggggaggagg catcctggac agcagggcaa ggcccagcct gacctcgccg aggccgccgc 600
cacaaccacc gagaaccctc tgcagaagat cgacgccgcc ctggcccagg tggataccct 660
gcgcagtgat ctgggagccg tgcagaacag gttaacagcg ccatcaccaa cctgggcaat 720
accgtgaata atctgactag cgcccgcagc agaattgagg attctgatta cgccacagag 780
gtgtccaaca tgagccgcgc ccagatcctg cagcaggcgg gacctccgtg ctggcccagg 840
ccaatcaggt cccacagaac gtgctgagcc tgctgagg 878
<210> 12
<211> 887
<212> DNA
<213> Artificial sequence
<220>
<221> unsure
<222> (1)..(887)
<223> unknown
<400> 12
gccaagtgat caacaccaat agcctgagcc tcctgaccca gaacaacctg aacaagtccc 60
agagcgccct gggcaccgcc atcgagcggc tgagctccgg gctgcggatc aattccgcta 120
aggacgatgc gccggacagg ccatcgccaa ccggtttaca gccaatatca agggcctgac 180
ccaggcctcc cggaacgcca atgatggcat cagcatcgcc cagaccaccg agggcgccct 240
gaatgagatt aacaacatct gcagagagtg agggagctgg ccgtgcagtc cgccaacagc 300
accaactccc agtccgacct cgatagcatt caggccgaga tcacccagcg gctgaacgag 360
atcgatcgcg tgagcggcca gaccagttca acggcgtgaa ggtgctggcc caggacaaca 420
ccctgaccat ccaggtgggc gctaatgacg gcgagaccat tgatatcgac ctgaagcaga 480
ttaatagcca gacactgggc ctggacaccc gaacgtgcag agccctggga tcagcggcgg 540
gggaggcggc atcctggata gcatgggcaa agcccagcct gatctggccg aggctgccgc 600
caccacaacc gagaacccac tgcagaagat cgacgccccc tggcccaggt ggacaccctg 660
aggagcgacc tgggcgccgt gcagaatcgg ttcaattccg ccatcactaa cctggggaac 720
accgtgaaca acctgacctc tgcccgcagc cggattgaag acaggattac gccaccgagg 780
tgagcaacat gagcagggcc cagatcctgc agcaggccgg cacatccgtg ctggcccagg 840
ctaaccaggt gcctcagaac gtgctgagcc tgctgaggta ataataa 887
<210> 13
<211> 2457
<212> DNA
<213> Artificial sequence
<220>
<221> unsure
<222> (1)..(2457)
<223> unknown
<400> 13
gcccaggtca ttaacaccaa ctccctgagc ctgctgaccc agaacaatct gaataagagc 60
cagagcgccc tggggaccgc catcgagcgg ctgagctccg gcctgcgcat caattccgcc 120
aaggatgacg ccgccggcca ggctatcgcc aaccggttca ccgctaacat caagggcctg 180
acccaggcta gcaggaatgc caatgacggc attagcattg cccagacaac cgagggcgcc 240
ctgaacgaga tcaataataa cctgcagaga gtgagggaac tggccgtgca gtccgccaac 300
tctacaaact cacagagcga tctggattcc atccaggccg aaatcaccca gcgcctgaat 360
gagatcgaca gagtgagcgg ccagacccag tttaacggcg tgaaggtgct ggcccaggat 420
aataccctga ccatccaggt gggcgccaat gacggcgaga ctatcgacat tgatctgaag 480
cagattaact cccagaccct gggcctggac actctgaacg tgcagggcgg cggcgggtcc 540
ggaggcggcg gcagcggcgg cggcggctcc agcgtgctcc ggtatgacga cttccacatc 600
gatgaagata agctggacac caacagcgtg tacgagccct actaccactc cgaccacgct 660
gagagcagct gggtgaatag aggggagagc agcagaaagg cctatgatca taatagcccc 720
tacatctggc ctagaaatga ctacgatggc tttctcgaaa acgcccacga gcaccacggc 780
gtgtacaacc agggcagggg cattgacagc ggagaacggc tgatgcagcc aacccagatg 840
tccgcccagg aagacctggg agatgataca ggaatccacg tgatccccac cctgaacggc 900
gatgaccggc acaagattgt caatgtggat cagaggcagt acggagacgt gtttaagggg 960
gacctgaacc ctaaacccca ggggcagagg ctgatcgagg tgtctgtgga agaaaatcat 1020
cctttcacac tgagggcccc tatccagcga atctacggcg tgaggtacac cgagacctgg 1080
agcttcctgc ctagcctgac ttgtaccggg gacgccgccc ctgccattca gcacatttgt 1140
ctgaagcaca caacctgttt ccaggacgtg gtggtggatg tcgactgcgc cgagaataca 1200
aaggaagatc agctggccga aatcagctat agatttcagg gcaaaaaaga ggctgaccag 1260
ccctggatcg tggtgaacac cagcaccctg tttgacgagc tggagctgga ccctcccgag 1320
attgagccag gggtgctgaa ggtgctgagg acagagaagc agtacctggg cgtgtacatt 1380
tggaacatgc gggggtccga cggtactagc acctacgcca ccttcctggt gacatggaag 1440
ggcgatgaga agacccgcaa ccctaccccc gccgtgaccc cccagcccag aggggccgag 1500
tttcacatgt ggaattatca tagccacgtg ttctccgtgg gcgacacctt tagcctggcc 1560
atgcacctgc agtataagat ccacgaagcc ccattcgacc tgctgctgga gtggctgtat 1620
gtgcccatcg accccacctg ccagcccatg aggctgtaca gcacatgcct gtatcacccc 1680
aacgcccccc agtgcctgag ccacatgaac tctgggtgca ccttcacctc tccgcacctg 1740
gcccagcgcg tggcctccac agtgtaccag aattgtgagc acgccgataa ctacaccgcc 1800
tactgcctgg gcatcagcca catggaacct tccttcggcc tgatcctgca cgacggcggc 1860
acaaccctga aattcgtgga tacacctgaa tctctgtctg gactgtatgt ttttgtggtg 1920
tattttaatg gacacgtgga agctgtggcc tatacagtgg tgagcacagt ggatcacttt 1980
gtgaatgcca ttgaggagag aggcttccca ccaaccgccg gccagcctcc tgccaccact 2040
aaacctaaag aaatcacccc tgtgaatcct ggcactagcc ctctgattag aggcggcggg 2100
ggaagcggcg gcggcggcag cggcggcggc ggctccaagg cccagcctga cctcgccgag 2160
gccgccgcca caaccaccga gaaccctctg cagaagatcg acgccgccct ggcccaggtg 2220
gataccctgc gcagtgatct gggagccgtg cagaacaggt ttaacagcgc catcaccaac 2280
ctgggcaata ccgtgaataa tctgactagc gcccgcagca gaattgagga ttctgattac 2340
gccacagagg tgtccaacat gagccgcgcc cagatcctgc agcaggccgg gacctccgtg 2400
ctggcccagg ccaatcaggt cccacagaac gtgctgagcc tgctgaggta ataataa 2457
<210> 14
<211> 72
<212> DNA
<213> Artificial sequence
<220>
<221> unsure
<222> (1)..(72)
<223> unknown
<400> 14
atgggaaaac ggtccgccgg cagcatcatg tggctggcca gcctggccgt cgtgatcgcc 60
tgtgccggcg cc 72
<210> 15
<211> 63
<212> DNA
<213> Artificial sequence
<220>
<221> unsure
<222> (1)..(63)
<223> unknown
<400> 15
atggagacag acacactcct gctatgggta ctgctgctct gggttccagg ttccactggt 60
gac 63
<210> 16
<211> 9
<212> DNA
<213> Artificial sequence
<220>
<221> unsure
<222> (1)..(9)
<223> unknown
<400> 16
gccgccgcc 9
<210> 17
<211> 442
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(442)
<223> unknown
<400> 17
gaattcaagc ttgggatctt tgtgaaggaa ccttacttct gtggtgtgac ataattggac 60
aaacacctac agagatttaa agctctaagg taaatataaa atttttaagt gtataatgtg 120
ttaaactact gattctaatt gtttgtgtat tttagattca cagtcccaag gctcatttca 180
ggcccctcag tctcacagtc tgttcatgat cataatcagc cataccacat ttgtagaggt 240
tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc 300
aattgttgtt gttaactttt tattgcagct tataatggtt acaaataaag caatagcatc 360
acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc 420
atcaatgtat cttatcatgt ct 442
<210> 18
<211> 1599
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(1599)
<223> unknown
<400> 18
gccgccgcca tgggaaaacg gagcgccggc agcatcatgt ggctggcctc cctggccgtc 60
gtgatcgcct gcgccggcgc cagcgtgtga gatatgatga cttccacatt gatgaggata 120
aactagacac taatagcgtg tatgagcctt actaccatag tgaccatgct gaatctagct 180
gggtgaatag gggtgaatct agccgtaagg catagatcat aactcccctt atatctggcc 240
taggaatgac tatgacggct ttctggagaa tgcccacgag catcacggcg tgtacaatca 300
ggggcggggc atcgacagcg gcgagaggct gatgcagcca accagatgag cgcccaggag 360
gacctgggcg acgacaccgg catccacgtg atccccaccc tgaacggcga cgacaggcac 420
aagatcgtga acgtggacca gaggcagtac ggcgatgtgt tcaagggcac ctgaacccca 480
aaccccaggg ccagaggctg atcgaggtgt ccgtggagga gaaccaccct ttcaccctga 540
gagcccccat ccagcggatc tacggcgtga gatacaccga gacctggagc ttcttcccag 600
cctgacctgc acgggcgatg ccgcccccgc catccagcac atctgcctga agcacaccac 660
ctgtttccag gatgtggtgg ttgatgtgga ctgtgccgaa aatactaagg aggaccagct 720
ggcgagatct cctaccgctt ccagggcaaa aaggaggccg accagccctg gatcgtggtg 780
aacacctcca ccctgttcga tgagttagag ctggaccccc ctgagatcga gcctggcgtg 840
ctgaaagtgt gcgcaccgag aagcagtacc tgggcgtgta catctggaac atgaggggca 900
gcgacggcac cagcacctac gccaccttcc tggtgacctg gaagggcgac gagaagacca 960
gaaatcctac ccccgcgtga ccccccagcc taggggcgcc gagtttcaca tgtggaacta 1020
ccacagccac gtgttcagcg tgggcgacac cttcagcctg gccatgcacc tgcagtacaa 1080
gatccacgag gcccccttcg accgctgctg gagtggctgt acgtgcccat cgaccccacc 1140
tgccagccca tgagactgta cagcacttgc ctgtaccacc ccaacgcccc ccagtgcctg 1200
agccacatga atagcggctg caccttcacc gcccccacct ggctcagagg gtggccagca 1260
ccgtgtacca gaactgcgag cacgccgaca attacaccgc ctactgcctg ggcatcagcc 1320
acatggagcc cagcttcggc ctgatcctgc acgacggggc accaccctga agtttgtgga 1380
cacccccgag tccctgtctg gactgtatgt ctttgtggtg tattttaatg gacacgttga 1440
agccgtggcc tatacagtgg tgtctacagt ggaccacttt gtgaatgcca ttgaagaaag 1500
aggctttcct cctaccgccg gccagccccc agccacacca agcctaaaga aatcacacca 1560
gtgaatccag gaactagccc cctgatcaga taataataa 1599
<210> 19
<211> 2041
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(2041)
<223> unknown
<400> 19
gccgccgcca tgggaaaacg gagcgccggc agcatcatgt ggctggcctc cctggccgtc 60
gtgatcgcct gcgccggcgc cagcgtgtga gatatgatga cttccacatt gatgaggata 120
aactagacac taatagcgtg tatgagcctt actaccatag tgaccatgct gaatctagct 180
gggtgaatag gggtgaatct agccgtaagg catagatcat aactcccctt atatctggcc 240
taggaatgac tatgacggct ttctggagaa tgcccacgag catcacggcg tgtacaatca 300
ggggcggggc atcgacagcg gcgagaggct gatgcagcca accagatgag cgcccaggag 360
gacctgggcg acgacaccgg catccacgtg atccccaccc tgaacggcga cgacaggcac 420
aagatcgtga acgtggacca gaggcagtac ggcgatgtgt tcaagggcac ctgaacccca 480
aaccccaggg ccagaggctg atcgaggtgt ccgtggagga gaaccaccct ttcaccctga 540
gagcccccat ccagcggatc tacggcgtga gatacaccga gacctggagc ttcttcccag 600
cctgacctgc acgggcgatg ccgcccccgc catccagcac atctgcctga agcacaccac 660
ctgtttccag gatgtggtgg ttgatgtgga ctgtgccgaa aatactaagg aggaccagct 720
ggcgagatct cctaccgctt ccagggcaaa aaggaggccg accagccctg gatcgtggtg 780
aacacctcca ccctgttcga tgagttagag ctggaccccc ctgagatcga gcctggcgtg 840
ctgaaagtgt gcgcaccgag aagcagtacc tgggcgtgta catctggaac atgaggggca 900
gcgacggcac cagcacctac gccaccttcc tggtgacctg gaagggcgac gagaagacca 960
gaaatcctac ccccgcgtga ccccccagcc taggggcgcc gagtttcaca tgtggaacta 1020
ccacagccac gtgttcagcg tgggcgacac cttcagcctg gccatgcacc tgcagtacaa 1080
gatccacgag gcccccttcg accgctgctg gagtggctgt acgtgcccat cgaccccacc 1140
tgccagccca tgagactgta cagcacttgc ctgtaccacc ccaacgcccc ccagtgcctg 1200
agccacatga atagcggctg caccttcacc gcccccacct ggctcagagg gtggccagca 1260
ccgtgtacca gaactgcgag cacgccgaca attacaccgc ctactgcctg ggcatcagcc 1320
acatggagcc cagcttcggc ctgatcctgc acgacggggc accaccctga agtttgtgga 1380
cacccccgag tccctgtctg gactgtatgt ctttgtggtg tattttaatg gacacgttga 1440
agccgtggcc tatacagtgg tgtctacagt ggaccacttt gtgaatgcca ttgaagaaag 1500
aggctttcct cctaccgccg gccagccccc agccacacca agcctaaaga aatcacacca 1560
gtgaatccag gaactagccc cctgatcaga taataataag aattcaagct tgggatcttt 1620
gtgaaggaac cttacttctg tggtgtgaca taattggaca aacacctaca gagatttaaa 1680
gctctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg 1740
tttgtgtatt ttagattcac agtcccaagg ctcatttcag gcccctcagt ctcacagtct 1800
gttcatgatc ataatcagcc ataccacatt tgtagaggtt ttacttgctt taaaaaacct 1860
cccacacctc cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttttt 1920
attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac aaataaagca 1980
tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc 2040
t 2041
<210> 20
<211> 2522
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(2522)
<223> unknown
<400> 20
gccgccgcca tgggaaaacg gtccgccggc agcatcatgt ggctggccag cctggccgtc 60
gtgatcgcct gtgccggcgc cgcccaggtc attaacacca actccctgag cctgctgacc 120
cagaacaatc tgaataaagc cagagcgccc tggggaccgc catcgagcgg ctgagctccg 180
gcctgcgcat caattccgcc aaggatgacg ccgccggcca ggctatcgcc aaccggttca 240
ccgctaacat caagggcctg acccggctag caggaatgcc aatgacggca ttagcattgc 300
ccagacaacc gagggcgccc tgaacgagat caataataac ctgcagagag tgagggaact 360
ggccgtgcag tccgccaact ctacaaactc aagagcgatc tggattccat ccaggccgaa 420
atcacccagc gcctgaatga gatcgacaga gtgagcggcc agacccagtt taacggcgtg 480
aaggtgctgg cccaggataa taccctgacc atccaggtgg cgccaatgac ggcgagacta 540
tcgacattga tctgaagcag attaactccc agaccctggg cctggacact ctgaacgtgc 600
agagcccagg gatcagcggg gggggaggag gcatcctgga cagcagggca aggcccagcc 660
tgacctcgcc gaggccgccg ccacaaccac cgagaaccct ctgcagaaga tcgacgccgc 720
cctggcccag gtggataccc tgcgcagtga tctgggagcc gtgcagaaca ggttaacagc 780
gccatcacca acctgggcaa taccgtgaat aatctgacta gcgcccgcag cagaattgag 840
gattctgatt acgccacaga ggtgtccaac atgagccgcg cccagatcct gcagcaggcg 900
ggacctccgt gctggcccag gccaatcagg tcccacagaa cgtgctgagc ctgctgaggg 960
gcggcggcgg gtccggaggc ggcggcagcg gcggcggcgg ctccagcgtg ctccggtatg 1020
acgactccac atcgatgaag ataagctgga caccaacagc gtgtacgagc cctactacca 1080
ctccgaccac gctgagagca gctgggtgaa tagaggggag agcagcagaa aggcctatga 1140
tcataatagc cccacatctg gcctagaaat gactacgatg gctttctcga aaacgcccac 1200
gagcaccacg gcgtgtacaa ccagggcagg ggcattgaca gcggagaacg gctgatgcag 1260
ccaacccaga tgtccgccca gaagacctgg gagatgatac aggaatccac gtgatcccca 1320
ccctgaacgg cgatgaccgg cacaagattg tcaatgtgga tcagaggcag tacggagacg 1380
tgtttaaggg ggacctgaac cctaaaccca ggggcagagg ctgatcgagg tgtctgtgga 1440
agaaaatcat cctttcacac tgagggcccc tatccagcga atctacggcg tgaggtacac 1500
cgagacctgg agcttcctgc ctagcctgac ttgtaccggg gacgccgccc ctgccattca 1560
gcacatttgt ctgaagcaca caacctgttt ccaggacgtg gggtggatgt cgactgcgcc 1620
gagaatacaa aggaagatca gctggccgaa atcagctata gatttcaggg caaaaaagag 1680
gctgaccagc cctggatcgt ggtgaacacc agcaccctgt ttgacgagtg gagctggacc 1740
ctcccgagat tgagccaggg gtgctgaagg tgctgaggac agagaagcag tacctgggcg 1800
tgtacatttg gaacatgcgg gggtccgacg gtactagcac ctacgccacc ttcctgtgac 1860
atggaagggc gatgagaaga cccgcaaccc tacccccgcc gtgacccccc agcccagagg 1920
ggccgagttt cacatgtgga attatcatag ccacgtgttc tccgtgggcg acacctttag 1980
ccggccatgc acctgcagta taagatccac gaagccccat tcgacctgct gctggagtgg 2040
ctgtatgtgc ccatcgaccc cacctgccag cccatgaggc tgtacagcac atgcctgtat 2100
caccccaacc cccccagtgc ctgagccaca tgaactctgg gtgcaccttc acctctccgc 2160
acctggccca gcgcgtggcc tccacagtgt accagaattg tgagcacgcc gataactaca 2220
ccgcctactg cctgggatca gccacatgga accttccttc ggcctgatcc tgcacgacgg 2280
cggcacaacc ctgaaattcg tggatacacc tgaatctctg tctggactgt atgtttttgt 2340
ggtgtatttt aatggacacg tggagctgtg gcctatacag tggtgagcac agtggatcac 2400
tttgtgaatg ccattgagga gagaggcttc ccaccaaccg ccggccagcc tcctgccacc 2460
actaaaccta aagaaatcac ccctgtgaat ctggcactag ccctctgatt agataataat 2520
aa 2522
<210> 21
<211> 2967
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(2967)
<223> unknown
<400> 21
gccgccgcca tgggaaaacg gtccgccggc agcatcatgt ggctggccag cctggccgtc 60
gtgatcgcct gtgccggcgc cgcccaggtc attaacacca actccctgag cctgctgacc 120
cagaacaatc tgaataaagc cagagcgccc tggggaccgc catcgagcgg ctgagctccg 180
gcctgcgcat caattccgcc aaggatgacg ccgccggcca ggctatcgcc aaccggttca 240
ccgctaacat caagggcctg acccggctag caggaatgcc aatgacggca ttagcattgc 300
ccagacaacc gagggcgccc tgaacgagat caataataac ctgcagagag tgagggaact 360
ggccgtgcag tccgccaact ctacaaactc aagagcgatc tggattccat ccaggccgaa 420
atcacccagc gcctgaatga gatcgacaga gtgagcggcc agacccagtt taacggcgtg 480
aaggtgctgg cccaggataa taccctgacc atccaggtgg cgccaatgac ggcgagacta 540
tcgacattga tctgaagcag attaactccc agaccctggg cctggacact ctgaacgtgc 600
agagcccagg gatcagcggg gggggaggag gcatcctgga cagcagggca aggcccagcc 660
tgacctcgcc gaggccgccg ccacaaccac cgagaaccct ctgcagaaga tcgacgccgc 720
cctggcccag gtggataccc tgcgcagtga tctgggagcc gtgcagaaca ggttaacagc 780
gccatcacca acctgggcaa taccgtgaat aatctgacta gcgcccgcag cagaattgag 840
gattctgatt acgccacaga ggtgtccaac atgagccgcg cccagatcct gcagcaggcg 900
ggacctccgt gctggcccag gccaatcagg tcccacagaa cgtgctgagc ctgctgaggg 960
gcggcggcgg gtccggaggc ggcggcagcg gcggcggcgg ctccagcgtg ctccggtatg 1020
acgactccac atcgatgaag ataagctgga caccaacagc gtgtacgagc cctactacca 1080
ctccgaccac gctgagagca gctgggtgaa tagaggggag agcagcagaa aggcctatga 1140
tcataatagc cccacatctg gcctagaaat gactacgatg gctttctcga aaacgcccac 1200
gagcaccacg gcgtgtacaa ccagggcagg ggcattgaca gcggagaacg gctgatgcag 1260
ccaacccaga tgtccgccca gaagacctgg gagatgatac aggaatccac gtgatcccca 1320
ccctgaacgg cgatgaccgg cacaagattg tcaatgtgga tcagaggcag tacggagacg 1380
tgtttaaggg ggacctgaac cctaaaccca ggggcagagg ctgatcgagg tgtctgtgga 1440
agaaaatcat cctttcacac tgagggcccc tatccagcga atctacggcg tgaggtacac 1500
cgagacctgg agcttcctgc ctagcctgac ttgtaccggg gacgccgccc ctgccattca 1560
gcacatttgt ctgaagcaca caacctgttt ccaggacgtg gggtggatgt cgactgcgcc 1620
gagaatacaa aggaagatca gctggccgaa atcagctata gatttcaggg caaaaaagag 1680
gctgaccagc cctggatcgt ggtgaacacc agcaccctgt ttgacgagtg gagctggacc 1740
ctcccgagat tgagccaggg gtgctgaagg tgctgaggac agagaagcag tacctgggcg 1800
tgtacatttg gaacatgcgg gggtccgacg gtactagcac ctacgccacc ttcctgtgac 1860
atggaagggc gatgagaaga cccgcaaccc tacccccgcc gtgacccccc agcccagagg 1920
ggccgagttt cacatgtgga attatcatag ccacgtgttc tccgtgggcg acacctttag 1980
ccggccatgc acctgcagta taagatccac gaagccccat tcgacctgct gctggagtgg 2040
ctgtatgtgc ccatcgaccc cacctgccag cccatgaggc tgtacagcac atgcctgtat 2100
caccccaacc cccccagtgc ctgagccaca tgaactctgg gtgcaccttc acctctccgc 2160
acctggccca gcgcgtggcc tccacagtgt accagaattg tgagcacgcc gataactaca 2220
ccgcctactg cctgggatca gccacatgga accttccttc ggcctgatcc tgcacgacgg 2280
cggcacaacc ctgaaattcg tggatacacc tgaatctctg tctggactgt atgtttttgt 2340
ggtgtatttt aatggacacg tggagctgtg gcctatacag tggtgagcac agtggatcac 2400
tttgtgaatg ccattgagga gagaggcttc ccaccaaccg ccggccagcc tcctgccacc 2460
actaaaccta aagaaatcac ccctgtgaat ctggcactag ccctctgatt agataataat 2520
aagaattcaa gcttgggatc tttgtgaagg aaccttactt ctgtggtgtg acataattgg 2580
acaaactacc tacagagatt taaagctcta aggtaaatat aaaattttta agtgtataat 2640
gtgttaaact actgattcta attgtttgtg tattttagat tcacagtccc aaggctcatt 2700
tcaggcccct cagtcctcac agtctgttca tgatcataat cagccatacc acatttgtag 2760
aggttttact tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga 2820
atgcaattgt tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata 2880
gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca 2940
aactcatcaa tgtatcttat catgtct 2967
<210> 22
<211> 2564
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(2564)
<223> unknown
<400> 22
gccgccgcca tgggaaaacg gagcgccggc agcatcatgt ggctggctag cctggccgtc 60
gtgattgcct gtgccggagc cagcgtgctg aggtatgatg attttcatat tgatgaggac 120
aaactggaca caaatagcgt gtacgagcca tattatcata gtgatcatgc cgaaagtagc 180
tgggtgaata gaggcgagtc ttctaggaaa gcctatgatc ataattctcc ctatatttgg 240
cctaggaatg actatgatgg cttcctggaa aatgcccacg aacaccacgg agtgtataac 300
cagggaagag gcatcgactc tggggagcgg accgagacct ggagcttcct gccctgatgc 360
agccaacaca gatgagcgcc caggaggacc tgggcgacga taccggcatc cacgtgatcc 420
ccaccctgaa tggcgacgac agacacaaga tcgtgaacgt ggaccagaga cagtatggcg 480
acgtgtttaa gggcgacctg aatccaaagc cccagggcca gaggctgatt gaggtgtctg 540
tggaggagaa tcatcccttc accctgcggg cccccatcca gagaatctac ggcgtgaggt 600
ataccgagac ctggagcttc ctgccctctc tgacatgtac tggcgatgcc gcccctgcca 660
tccagcacat ctgcctgaag cacacaacat gtttccagga cgtggtggtg gacgtggact 720
gcgccgagaa cactaaagaa gaccagctgg ccgagattag ctacagattc caggggaaga 780
aggaggccga ccagccctgg atcgtggtga acaccagcac actgtttgac gagcttgagc 840
tggacccccc tgagatcgag ccaggcgtgc tcaaggtgct gcgcaccgag aagcagtatc 900
tgggcgtgta catctggaac atgcgcggct ctgacggcac cagcacctac gccacattcc 960
tggtgacatg gaagggggat gagaagaccc gcaatcctac cccagccgtg accccacagc 1020
ccaggggcgc cgagtttcat atgtggaact accatagcca cgtgtttagc gtgggcgaca 1080
ccttcagcct ggccatgcac ctgcagtaca aaatccacga agcccccttc gacctgctgc 1140
tggagtggct ctacgtgcct attgacccca catgccagcc catgagactg tacagcacct 1200
gcctgtacca ccccaatgct ccacagtgcc tgagccacat gaactccggc tgcactttca 1260
cctctcctca cctggctcag cgcgtggcct ccaccgtgta ccagaattgt gaacacgccg 1320
acaactacac cgcatactgt ctgggcatct cccacatgga gccctcattt ggcctgatcc 1380
tgcacgacgg ggggaccacc ctgaagttcg tggacacccc cgagagcctg tctggcctgt 1440
atgtgtttgt ggtgtacttc aacggccatg tggaggccgt ggcctatacc gtggtgtcca 1500
cagtggacca ctttgtgaac gccatcgagg agagaggctt cccccctacc gccggacagc 1560
cccccgccac cacaaagccc aaggagatca cccccgtgaa tcccggaacc agccccctga 1620
ttagaggcgg cgggggaagc ggcggcggcg gcagcggcgg cggcggctcc gcacaagtga 1680
tcaacaccaa tagcctgagc ctcctgaccc agaacaacct gaacaagtcc cagagcgccc 1740
tgggcaccgc catcgagcgg ctgagctccg ggctgcggat caattccgct aaggacgatg 1800
ccgccggaca ggccatcgcc aaccggttta cagccaatat caagggcctg acccaggcct 1860
cccggaacgc caatgatggc atcagcatcg cccagaccac cgagggcgcc ctgaatgaga 1920
ttaacaacaa tctgcagaga gtgagggagc tggccgtgca gtccgccaac agcaccaact 1980
cccagtccga cctcgatagc attcaggccg agatcaccca gcggctgaac gagatcgatc 2040
gcgtgagcgg ccagacccag ttcaacggcg tgaaggtgct ggcccaggac aacaccctga 2100
ccatccaggt gggcgctaat gacggcgaga ccattgatat cgacctgaag cagattaata 2160
gccagacact gggcctggac accctgaacg tgcagagccc tgggatcagc ggcgggggag 2220
gcggcatcct ggatagcatg ggcaaagccc agcctgatct ggccgaggct gccgccacca 2280
caaccgagaa cccactgcag aagatcgacg ccgccctggc ccaggtggac accctgagga 2340
gcgacctggg cgccgtgcag aatcggttca attccgccat cactaacctg gggaacaccg 2400
tgaacaacct gacctctgcc cgcagccgga ttgaagacag cgattacgcc accgaggtga 2460
gcaacatgag cagggcccag atcctgcagc aggccggcac atccgtgctg gcccaggcta 2520
accaggtgcc tcagaacgtg ctgagcctgc tgaggtaata ataa 2564
<210> 23
<211> 3009
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(3009)
<223> unknown
<400> 23
gccgccgcca tgggaaaacg gagcgccggc agcatcatgt ggctggctag cctggccgtc 60
gtgattgcct gtgccggagc cagcgtgctg aggtatgatg attttcatat tgatgaggac 120
aaactggaca caaatagcgt gtacgagcca tattatcata gtgatcatgc cgaaagtagc 180
tgggtgaata gaggcgagtc ttctaggaaa gcctatgatc ataattctcc ctatatttgg 240
cctaggaatg actatgatgg cttcctggaa aatgcccacg aacaccacgg agtgtataac 300
cagggaagag gcatcgactc tggggagcgg accgagacct ggagcttcct gccctgatgc 360
agccaacaca gatgagcgcc caggaggacc tgggcgacga taccggcatc cacgtgatcc 420
ccaccctgaa tggcgacgac agacacaaga tcgtgaacgt ggaccagaga cagtatggcg 480
acgtgtttaa gggcgacctg aatccaaagc cccagggcca gaggctgatt gaggtgtctg 540
tggaggagaa tcatcccttc accctgcggg cccccatcca gagaatctac ggcgtgaggt 600
ataccgagac ctggagcttc ctgccctctc tgacatgtac tggcgatgcc gcccctgcca 660
tccagcacat ctgcctgaag cacacaacat gtttccagga cgtggtggtg gacgtggact 720
gcgccgagaa cactaaagaa gaccagctgg ccgagattag ctacagattc caggggaaga 780
aggaggccga ccagccctgg atcgtggtga acaccagcac actgtttgac gagcttgagc 840
tggacccccc tgagatcgag ccaggcgtgc tcaaggtgct gcgcaccgag aagcagtatc 900
tgggcgtgta catctggaac atgcgcggct ctgacggcac cagcacctac gccacattcc 960
tggtgacatg gaagggggat gagaagaccc gcaatcctac cccagccgtg accccacagc 1020
ccaggggcgc cgagtttcat atgtggaact accatagcca cgtgtttagc gtgggcgaca 1080
ccttcagcct ggccatgcac ctgcagtaca aaatccacga agcccccttc gacctgctgc 1140
tggagtggct ctacgtgcct attgacccca catgccagcc catgagactg tacagcacct 1200
gcctgtacca ccccaatgct ccacagtgcc tgagccacat gaactccggc tgcactttca 1260
cctctcctca cctggctcag cgcgtggcct ccaccgtgta ccagaattgt gaacacgccg 1320
acaactacac cgcatactgt ctgggcatct cccacatgga gccctcattt ggcctgatcc 1380
tgcacgacgg ggggaccacc ctgaagttcg tggacacccc cgagagcctg tctggcctgt 1440
atgtgtttgt ggtgtacttc aacggccatg tggaggccgt ggcctatacc gtggtgtcca 1500
cagtggacca ctttgtgaac gccatcgagg agagaggctt cccccctacc gccggacagc 1560
cccccgccac cacaaagccc aaggagatca cccccgtgaa tcccggaacc agccccctga 1620
ttagaggcgg cgggggaagc ggcggcggcg gcagcggcgg cggcggctcc gcacaagtga 1680
tcaacaccaa tagcctgagc ctcctgaccc agaacaacct gaacaagtcc cagagcgccc 1740
tgggcaccgc catcgagcgg ctgagctccg ggctgcggat caattccgct aaggacgatg 1800
ccgccggaca ggccatcgcc aaccggttta cagccaatat caagggcctg acccaggcct 1860
cccggaacgc caatgatggc atcagcatcg cccagaccac cgagggcgcc ctgaatgaga 1920
ttaacaacaa tctgcagaga gtgagggagc tggccgtgca gtccgccaac agcaccaact 1980
cccagtccga cctcgatagc attcaggccg agatcaccca gcggctgaac gagatcgatc 2040
gcgtgagcgg ccagacccag ttcaacggcg tgaaggtgct ggcccaggac aacaccctga 2100
ccatccaggt gggcgctaat gacggcgaga ccattgatat cgacctgaag cagattaata 2160
gccagacact gggcctggac accctgaacg tgcagagccc tgggatcagc ggcgggggag 2220
gcggcatcct ggatagcatg ggcaaagccc agcctgatct ggccgaggct gccgccacca 2280
caaccgagaa cccactgcag aagatcgacg ccgccctggc ccaggtggac accctgagga 2340
gcgacctggg cgccgtgcag aatcggttca attccgccat cactaacctg gggaacaccg 2400
tgaacaacct gacctctgcc cgcagccgga ttgaagacag cgattacgcc accgaggtga 2460
gcaacatgag cagggcccag atcctgcagc aggccggcac atccgtgctg gcccaggcta 2520
accaggtgcc tcagaacgtg ctgagcctgc tgaggtaata ataagaattc aagcttggga 2580
tctttgtgaa ggaaccttac ttctgtggtg tgacataatt ggacaaacta cctacagaga 2640
tttaaagctc taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc 2700
taattgtttg tgtattttag attcacagtc ccaaggctca tttcaggccc ctcagtcctc 2760
acagtctgtt catgatcata atcagccata ccacatttgt agaggtttta cttgctttaa 2820
aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta 2880
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 2940
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 3000
atcatgtct 3009
<210> 24
<211> 2538
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(2538)
<223> unknown
<400> 24
gccgccgcca tgggaaaacg gtccgccggc agcatcatgt ggctggccag cctggccgtc 60
gtgatcgcct gtgccggcgc cgcccaggtc attaacacca actccctgag cctgctgacc 120
cagaacaatc tgaataagag ccagagcgcc ctggggaccg ccatcgagcg gctgagctcc 180
ggcctgcgca tcaattccgc caaggatgac gccgccggcc aggctatcgc caaccggttc 240
accgctaaca tcaagggcct gacccaggct agcaggaatg ccaatgacgg cattagcatt 300
gcccagacaa ccgagggcgc cctgaacgag atcaataata acctgcagag agtgagggaa 360
ctggccgtgc agtccgccaa ctctacaaac tcacagagcg atctggattc catccaggcc 420
gaaatcaccc agcgcctgaa tgagatcgac agagtgagcg gccagaccca gtttaacggc 480
gtgaaggtgc tggcccagga taataccctg accatccagg tgggcgccaa tgacggcgag 540
actatcgaca ttgatctgaa gcagattaac tcccagaccc tgggcctgga cactctgaac 600
gtgcagggcg gcggcgggtc cggaggcggc ggcagcggcg gcggcggctc cagcgtgctc 660
cggtatgacg acttccacat cgatgaagat aagctggaca ccaacagcgt gtacgagccc 720
tactaccact ccgaccacgc tgagagcagc tgggtgaata gaggggagag cagcagaaag 780
gcctatgatc ataatagccc ctacatctgg cctagaaatg actacgatgg ctttctcgaa 840
aacgcccacg agcaccacgg cgtgtacaac cagggcaggg gcattgacag cggagaacgg 900
ctgatgcagc caacccagat gtccgcccag gaagacctgg gagatgatac aggaatccac 960
gtgatcccca ccctgaacgg cgatgaccgg cacaagattg tcaatgtgga tcagaggcag 1020
tacggagacg tgtttaaggg ggacctgaac cctaaacccc aggggcagag gctgatcgag 1080
gtgtctgtgg aagaaaatca tcctttcaca ctgagggccc ctatccagcg aatctacggc 1140
gtgaggtaca ccgagacctg gagcttcctg cctagcctga cttgtaccgg ggacgccgcc 1200
cctgccattc agcacatttg tctgaagcac acaacctgtt tccaggacgt ggtggtggat 1260
gtcgactgcg ccgagaatac aaaggaagat cagctggccg aaatcagcta tagatttcag 1320
ggcaaaaaag aggctgacca gccctggatc gtggtgaaca ccagcaccct gtttgacgag 1380
ctggagctgg accctcccga gattgagcca ggggtgctga aggtgctgag gacagagaag 1440
cagtacctgg gcgtgtacat ttggaacatg cgggggtccg acggtactag cacctacgcc 1500
accttcctgg tgacatggaa gggcgatgag aagacccgca accctacccc cgccgtgacc 1560
ccccagccca gaggggccga gtttcacatg tggaattatc atagccacgt gttctccgtg 1620
ggcgacacct ttagcctggc catgcacctg cagtataaga tccacgaagc cccattcgac 1680
ctgctgctgg agtggctgta tgtgcccatc gaccccacct gccagcccat gaggctgtac 1740
agcacatgcc tgtatcaccc caacgccccc cagtgcctga gccacatgaa ctctgggtgc 1800
accttcacct ctccgcacct ggcccagcgc gtggcctcca cagtgtacca gaattgtgag 1860
cacgccgata actacaccgc ctactgcctg ggcatcagcc acatggaacc ttccttcggc 1920
ctgatcctgc acgacggcgg cacaaccctg aaattcgtgg atacacctga atctctgtct 1980
ggactgtatg tttttgtggt gtattttaat ggacacgtgg aagctgtggc ctatacagtg 2040
gtgagcacag tggatcactt tgtgaatgcc attgaggaga gaggcttccc accaaccgcc 2100
ggccagcctc ctgccaccac taaacctaaa gaaatcaccc ctgtgaatcc tggcactagc 2160
cctctgatta gaggcggcgg gggaagcggc ggcggcggca gcggcggcgg cggctccaag 2220
gcccagcctg acctcgccga ggccgccgcc acaaccaccg agaaccctct gcagaagatc 2280
gacgccgccc tggcccaggt ggataccctg cgcagtgatc tgggagccgt gcagaacagg 2340
tttaacagcg ccatcaccaa cctgggcaat accgtgaata atctgactag cgcccgcagc 2400
agaattgagg attctgatta cgccacagag gtgtccaaca tgagccgcgc ccagatcctg 2460
cagcaggccg ggacctccgt gctggcccag gccaatcagg tcccacagaa cgtgctgagc 2520
ctgctgaggt aataataa 2538
<210> 25
<211> 2983
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(2983)
<223> unknown
<400> 25
gccgccgcca tgggaaaacg gtccgccggc agcatcatgt ggctggccag cctggccgtc 60
gtgatcgcct gtgccggcgc cgcccaggtc attaacacca actccctgag cctgctgacc 120
cagaacaatc tgaataagag ccagagcgcc ctggggaccg ccatcgagcg gctgagctcc 180
ggcctgcgca tcaattccgc caaggatgac gccgccggcc aggctatcgc caaccggttc 240
accgctaaca tcaagggcct gacccaggct agcaggaatg ccaatgacgg cattagcatt 300
gcccagacaa ccgagggcgc cctgaacgag atcaataata acctgcagag agtgagggaa 360
ctggccgtgc agtccgccaa ctctacaaac tcacagagcg atctggattc catccaggcc 420
gaaatcaccc agcgcctgaa tgagatcgac agagtgagcg gccagaccca gtttaacggc 480
gtgaaggtgc tggcccagga taataccctg accatccagg tgggcgccaa tgacggcgag 540
actatcgaca ttgatctgaa gcagattaac tcccagaccc tgggcctgga cactctgaac 600
gtgcagggcg gcggcgggtc cggaggcggc ggcagcggcg gcggcggctc cagcgtgctc 660
cggtatgacg acttccacat cgatgaagat aagctggaca ccaacagcgt gtacgagccc 720
tactaccact ccgaccacgc tgagagcagc tgggtgaata gaggggagag cagcagaaag 780
gcctatgatc ataatagccc ctacatctgg cctagaaatg actacgatgg ctttctcgaa 840
aacgcccacg agcaccacgg cgtgtacaac cagggcaggg gcattgacag cggagaacgg 900
ctgatgcagc caacccagat gtccgcccag gaagacctgg gagatgatac aggaatccac 960
gtgatcccca ccctgaacgg cgatgaccgg cacaagattg tcaatgtgga tcagaggcag 1020
tacggagacg tgtttaaggg ggacctgaac cctaaacccc aggggcagag gctgatcgag 1080
gtgtctgtgg aagaaaatca tcctttcaca ctgagggccc ctatccagcg aatctacggc 1140
gtgaggtaca ccgagacctg gagcttcctg cctagcctga cttgtaccgg ggacgccgcc 1200
cctgccattc agcacatttg tctgaagcac acaacctgtt tccaggacgt ggtggtggat 1260
gtcgactgcg ccgagaatac aaaggaagat cagctggccg aaatcagcta tagatttcag 1320
ggcaaaaaag aggctgacca gccctggatc gtggtgaaca ccagcaccct gtttgacgag 1380
ctggagctgg accctcccga gattgagcca ggggtgctga aggtgctgag gacagagaag 1440
cagtacctgg gcgtgtacat ttggaacatg cgggggtccg acggtactag cacctacgcc 1500
accttcctgg tgacatggaa gggcgatgag aagacccgca accctacccc cgccgtgacc 1560
ccccagccca gaggggccga gtttcacatg tggaattatc atagccacgt gttctccgtg 1620
ggcgacacct ttagcctggc catgcacctg cagtataaga tccacgaagc cccattcgac 1680
ctgctgctgg agtggctgta tgtgcccatc gaccccacct gccagcccat gaggctgtac 1740
agcacatgcc tgtatcaccc caacgccccc cagtgcctga gccacatgaa ctctgggtgc 1800
accttcacct ctccgcacct ggcccagcgc gtggcctcca cagtgtacca gaattgtgag 1860
cacgccgata actacaccgc ctactgcctg ggcatcagcc acatggaacc ttccttcggc 1920
ctgatcctgc acgacggcgg cacaaccctg aaattcgtgg atacacctga atctctgtct 1980
ggactgtatg tttttgtggt gtattttaat ggacacgtgg aagctgtggc ctatacagtg 2040
gtgagcacag tggatcactt tgtgaatgcc attgaggaga gaggcttccc accaaccgcc 2100
ggccagcctc ctgccaccac taaacctaaa gaaatcaccc ctgtgaatcc tggcactagc 2160
cctctgatta gaggcggcgg gggaagcggc ggcggcggca gcggcggcgg cggctccaag 2220
gcccagcctg acctcgccga ggccgccgcc acaaccaccg agaaccctct gcagaagatc 2280
gacgccgccc tggcccaggt ggataccctg cgcagtgatc tgggagccgt gcagaacagg 2340
tttaacagcg ccatcaccaa cctgggcaat accgtgaata atctgactag cgcccgcagc 2400
agaattgagg attctgatta cgccacagag gtgtccaaca tgagccgcgc ccagatcctg 2460
cagcaggccg ggacctccgt gctggcccag gccaatcagg tcccacagaa cgtgctgagc 2520
ctgctgaggt aataataaga attcaagctt gggatctttg tgaaggaacc ttacttctgt 2580
ggtgtgacat aattggacaa actacctaca gagatttaaa gctctaaggt aaatataaaa 2640
tttttaagtg tataatgtgt taaactactg attctaattg tttgtgtatt ttagattcac 2700
agtcccaagg ctcatttcag gcccctcagt cctcacagtc tgttcatgat cataatcagc 2760
cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac 2820
ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt 2880
tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct 2940
agttgtggtt tgtccaaact catcaatgta tcttatcatg tct 2983
<210> 26
<211> 3102
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(3102)
<223> unknown
<400> 26
ccaccatgga gacagacaca ctcctgctat gggtactgct gctctgggtt ccaggttcca 60
ctggtgacac tagtatggca caagtcatta atacaaacag cctgtcgctg ttgacccaga 120
ataacctgaa caaatcccag tccgcactgg gcactgctat cgagcgtttg tcttccggtc 180
tgcgtatcaa cagcgcgaaa gacgatgcgg caggacaggc gattgctaac cgttttaccg 240
cgaacatcaa aggtctgact caggcttccc gtaacgctaa cgacggtatc tccattgcgc 300
agaccactga aggcgcgctg aacgaaatca acaacaacct gcagcgtgtg cgtgaactgg 360
cggttcagtc tgcgaatggt actaactccc agtctgacct cgactccatc caggctgaaa 420
tcacccagcg cctgaacgaa atcgaccgtg tatccggcca gactcagttc aacggcgtga 480
aagtcctggc gcaggacaac accctgacca tccaggttgg tgccaacgac ggtgaaacta 540
tcgatattga tttaaaagaa atcagctcta aaacactggg acttgataag cttaatgtcc 600
aagatgccta caccggtggt ggtggttctg gtggtggtgg ttctgctagc ggtggtggtg 660
gttctggtgg tggtggttct atggggacag ttaataaacc tgtggtgggg gtattgatgg 720
ggttcggaat tatcacggga acgttgcgta taacgaatcc ggtcagagca tccgtcttgc 780
gatacgatga ttttcacatc gatgaagaca aactggatac aaactccgta tatgagcctt 840
actaccattc agatcatgcg gagtcttcat gggtaaatcg gggagagtct tcgcgaaaag 900
cgtacgatca taactcacct tatatatggc cacgtaatga ttatgatgga tttttagaga 960
acgcacacga acaccacggg gtgtataatc agggccgtgg tatcgatagc ggggaacggt 1020
taatgcaacc cacacaaatg tctgcacagg aggatcttgg ggacgatacg ggcatccacg 1080
ttatccctac gttaaacggc gatgacagac ataaaattgt aaatgtggac caacgtcaat 1140
acggtgacgt gtttaaagga gatcttaatc caaaacccca aggccaaaga ctcattgagg 1200
tgtcagtgga agaaaatcac ccgtttactt tacgcgcacc gattcagcgg atttatggag 1260
tccggtacac cgagacttgg agctttttgc cgtcattaac ctgtacggga gacgcagcgc 1320
ccgccatcca gcatatatgc ttaaaacata caacatgctt tcaagacgtg gtggtggatg 1380
tggattgcgc ggaaaatact aaagaggatc agttggccga aatcagttac cgttttcaag 1440
gtaagaagga agcggaccaa ccgtggattg ttgtaaacac gagcacactg tttgatgaac 1500
tcgaattaga cccccccgag attgaaccgg gtgtcttgaa agtacttcgg acagaaaaac 1560
aatacttggg tgtgtacatt tggaacatgc gcggctccga tggtacgtct acctacgcca 1620
cgtttttggt cacctggaaa ggggatgaaa aaacaagaaa ccctacgccc gcagtaactc 1680
ctcaaccaag aggggctgag tttcatatgt ggaattacca ctcgcatgta ttttcagttg 1740
gtgatacgtt tagcttggca atgcatcttc agtataagat acatgaagcg ccatttgatt 1800
tgctgttaga gtggttgtat gtccccatcg atcctacatg tcaaccaatg cggttatatt 1860
ctacgtgttt gtatcatccc aacgcacccc aatgcctctc tcatatgaat tccggttgta 1920
catttacctc gccacattta gcccagcgtg ttgcaagcac agtgtatcaa aattgtgaac 1980
atgcagataa ctacaccgca tattgtctgg gaatatctca tatggagcct agctttggtc 2040
taatcttaca cgacgggggc accacgttaa agtttgtaga tacacccgag agtttgtcgg 2100
gattatacgt ttttgtggtg tattttaacg ggcatgttga agccgtagca tacactgttg 2160
tatccacagt agatcatttt gtaaacgcaa ttgaagagcg tggatttccg ccaacggccg 2220
gtcagccacc ggcgactact aaacccaagg aaattacccc cgtaaacccc ggaacgtcac 2280
cacttatacg aggtggtggt ggttctggtg gtggtggttc tggatcccat aacttcagaa 2340
caggcggtga gcttaaagag gttaatacag ataagactga aaacccactg cagaaaattg 2400
atgctgcctt ggcacaggtt gatacacttc gttctgacct gggtgcggtt cagaaccgtt 2460
tcaactccgc tatcaccaac ctgggcaata ccgtaaataa cctgtcttct gcccgtagcc 2520
gtatcgaaga ttccgactac gcaaccgaag tctccaacat gtctcgcgcg cagattctgc 2580
agcaggccgg tacctccgtt ctggcgcagg cgaaccaggt tccgcaaaac gtcctctctt 2640
tactgcgtta actcgaggaa ttcaagcttg ggatctttgt gaaggaacct tacttctgtg 2700
gtgtgacata attggacaaa ctacctacag agatttaaag ctctaaggta aatataaaat 2760
ttttaagtgt ataatgtgtt aaactactga ttctaattgt ttgtgtattt tagattcaca 2820
gtcccaaggc tcatttcagg cccctcagtc ctcacagtct gttcatgatc ataatcagcc 2880
ataccacatt tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc 2940
tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt 3000
acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 3060
gttgtggttt gtccaaactc atcaatgtat cttatcatgt ct 3102
<210> 27
<211> 295
<212> PRT
<213> Artificial Sequence
<220>
<221> UNSURE
<222> (1)..(295)
<223> unknown
<400> 27
Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn
1 5 10 15
Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser
20 25 30
Ser Gly Leu Arg Ile Asn Ser Ala Lys Asp Asp Ala Ala Gly Gln Ala
35 40 45
Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu Thr Gln Ala Ser
50 55 60
Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala
65 70 75 80
Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val
85 90 95
Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln
100 105 110
Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln
115 120 125
Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp Asn Thr Leu Thr
130 135 140
Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Lys
145 150 155 160
Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Thr Leu Asn Val Gln Ser
165 170 175
Pro Gly Ile Ser Gly Gly Gly Gly Gly Ile Leu Asp Ser Met Gly Lys
180 185 190
Ala Gln Pro Asp Leu Ala Glu Ala Ala Ala Thr Thr Thr Glu Asn Pro
195 200 205
Leu Gln Lys Ile Asp Ala Ala Leu Ala Gln Val Asp Thr Leu Arg Ser
210 215 220
Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn Leu
225 230 235 240
Gly Asn Thr Val Asn Asn Leu Thr Ser Ala Arg Ser Arg Ile Glu Asp
245 250 255
Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala Gln Ile Leu
260 265 270
Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln Val Pro Gln
275 280 285
Asn Val Leu Ser Leu Leu Arg
290 295
<210> 28
<211> 885
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(885)
<223> unknown
<400> 28
gcgcaggtga ttaacaccaa cagcctgagc ctgctgaccc agaacaacct gaacaaaagc 60
cagagcgcgc tgggcaccgc gattgaacgc ctgagcagcg gcctgcgcat taacagcgcg 120
aaagatgatg cggcgggcca ggcgattgcg aaccgcttta ccgcgaacat taaaggcctg 180
acccaggcga gccgcaacgc gaacgatggc attagcattg cgcagaccac cgaaggcgcg 240
ctgaacgaaa ttaacaacaa cctgcagcgc gtgcgcgaac tggcggtgca gagcgcgaac 300
agcaccaaca gccagagcga tctggatagc attcaggcgg aaattaccca gcgcctgaac 360
gaaattgatc gcgtgagcgg ccagacccag tttaacggcg tgaaagtgct ggcgcaggat 420
aacaccctga ccattcaggt gggcgcgaac gatggcgaaa ccattgatat tgatctgaaa 480
cagattaaca gccagaccct gggcctggat accctgaacg tgcagagccc gggcattagc 540
ggcggcggcg gcggcattct ggatagcatg ggcaaagcgc agccggatct ggcggaagcg 600
gcggcgacca ccaccgaaaa cccgctgcag aaaattgatg cggcgctggc gcaggtggat 660
accctgcgca gcgatctggg cgcggtgcag aaccgcttta acagcgcgat taccaacctg 720
ggcaacaccg tgaacaacct gaccagcgcg cgcagccgca ttgaagatag cgattatgcg 780
accgaagtga gcaacatgag ccgcgcgcag attctgcagc aggcgggcac cagcgtgctg 840
gcgcaggcga accaggtgcc gcagaacgtg ctgagcctgc tgcgc 885
<210> 29
<211> 506
<212> PRT
<213> Unknown
<220>
<221> UNSURE
<222> (1)..(506)
<223> unknown
<400> 29
Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn
1 5 10 15
Asn Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu
20 25 30
Ser Ser Gly Leu Arg Ile Asn Ser Ala Lys Asp Asp Ala Ala Gly Gln
35 40 45
Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu Thr Gln Ala
50 55 60
Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly
65 70 75 80
Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala
85 90 95
Val Gln Ser Ala Asn Gly Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile
100 105 110
Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly
115 120 125
Gln Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp Asn Thr Leu
130 135 140
Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu
145 150 155 160
Lys Glu Ile Ser Ser Lys Thr Leu Gly Leu Asp Lys Leu Asn Val Gln
165 170 175
Asp Ala Tyr Thr Pro Lys Glu Thr Ala Val Thr Val Asp Lys Thr Thr
180 185 190
Tyr Lys Asn Gly Thr Asp Pro Ile Thr Ala Gln Ser Asn Thr Asp Ile
195 200 205
Gln Thr Ala Ile Gly Gly Gly Ala Thr Gly Val Thr Gly Ala Asp Ile
210 215 220
Lys Phe Lys Asp Gly Gln Tyr Tyr Leu Asp Val Lys Gly Gly Ala Ser
225 230 235 240
Ala Gly Val Tyr Lys Ala Thr Tyr Asp Glu Thr Thr Lys Lys Val Asn
245 250 255
Ile Asp Thr Thr Asp Lys Thr Pro Leu Ala Thr Ala Glu Ala Thr Ala
260 265 270
Ile Arg Gly Thr Ala Thr Ile Thr His Asn Gln Ile Ala Glu Val Thr
275 280 285
Lys Glu Gly Val Asp Thr Thr Thr Val Ala Ala Gln Leu Ala Ala Ala
290 295 300
Gly Val Thr Gly Ala Asp Lys Asp Asn Thr Ser Leu Val Lys Leu Ser
305 310 315 320
Phe Glu Asp Lys Asn Gly Lys Val Ile Asp Gly Gly Tyr Ala Val Lys
325 330 335
Met Gly Asp Asp Phe Tyr Ala Ala Thr Tyr Asp Glu Lys Thr Gly Ala
340 345 350
Ile Thr Ala Lys Thr Thr Thr Tyr Thr Asp Gly Thr Gly Val Ala Gln
355 360 365
Thr Gly Ala Val Lys Phe Gly Gly Ala Asn Gly Lys Ser Glu Val Val
370 375 380
Thr Ala Thr Asp Gly Lys Thr Tyr Leu Ala Ser Asp Leu Asp Lys His
385 390 395 400
Asn Phe Arg Thr Gly Gly Glu Leu Lys Glu Val Asn Thr Asp Lys Thr
405 410 415
Glu Asn Pro Leu Gln Lys Ile Asp Ala Ala Leu Ala Gln Val Asp Thr
420 425 430
Leu Arg Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile
435 440 445
Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Ser Ala Arg Ser Arg
450 455 460
Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala
465 470 475 480
Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln
485 490 495
Val Pro Gln Asn Val Leu Ser Leu Leu Arg
500 505
<210> 30
<211> 179
<212> PRT
<213> Unknown
<220>
<221> UNSURE
<222> (1)..(179)
<223> unknown
<400> 30
Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn
1 5 10 15
Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser
20 25 30
Ser Gly Leu Arg Ile Asn Ser Ala Lys Asp Asp Ala Ala Gly Gln Ala
35 40 45
Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu Thr Gln Ala Ser
50 55 60
Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala
65 70 75 80
Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val
85 90 95
Gln Ser Ala Asn Gly Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln
100 105 110
Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln
115 120 125
Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp Asn Thr Leu Thr
130 135 140
Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Lys
145 150 155 160
Glu Ile Ser Ser Lys Thr Leu Gly Leu Asp Lys Leu Asn Val Gln Asp
165 170 175
Ala Tyr Thr
<210> 31
<211> 107
<212> PRT
<213> Unknown
<220>
<221> UNSURE
<222> (1)..(107)
<223> unknown
<400> 31
His Asn Phe Arg Thr Gly Gly Glu Leu Lys Glu Val Asn Thr Asp Lys
1 5 10 15
Thr Glu Asn Pro Leu Gln Lys Ile Asp Ala Ala Leu Ala Gln Val Asp
20 25 30
Thr Leu Arg Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala
35 40 45
Ile Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Ser Ala Arg Ser
50 55 60
Arg Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg
65 70 75 80
Ala Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn
85 90 95
Gln Val Pro Gln Asn Val Leu Ser Leu Leu Arg
100 105
<210> 32
<211> 824
<212> PRT
<213> Unknown
<220>
<221> UNSURE
<222> (1)..(824)
<223> unknown
<400> 32
Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn
1 5 10 15
Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser
20 25 30
Ser Gly Leu Arg Ile Asn Ser Ala Lys Asp Asp Ala Ala Gly Gln Ala
35 40 45
Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu Thr Gln Ala Ser
50 55 60
Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala
65 70 75 80
Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val
85 90 95
Gln Ser Ala Asn Gly Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln
100 105 110
Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln
115 120 125
Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp Asn Thr Leu Thr
130 135 140
Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Lys
145 150 155 160
Glu Ile Ser Ser Lys Thr Leu Gly Leu Asp Lys Leu Asn Val Gln Asp
165 170 175
Ala Tyr Thr Ser Pro Gly Ile Ser Gly Gly Gly Gly Gly Ile Leu Asp
180 185 190
Ser Met Gly His Asn Phe Arg Thr Gly Gly Glu Leu Lys Glu Val Asn
195 200 205
Thr Asp Lys Thr Glu Asn Pro Leu Gln Lys Ile Asp Ala Ala Leu Ala
210 215 220
Gln Val Asp Thr Leu Arg Ser Asp Leu Gly Ala Val Gln Asn Arg Phe
225 230 235 240
Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val Asn Asn Leu Ser Ser
245 250 255
Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn
260 265 270
Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly Thr Ser Val Leu Ala
275 280 285
Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser Leu Leu Arg Gly Gly
290 295 300
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ser Val Leu
305 310 315 320
Arg Tyr Asp Asp Phe His Ile Asp Glu Asp Lys Leu Asp Thr Asn Ser
325 330 335
Val Tyr Glu Pro Tyr Tyr His Ser Asp His Ala Glu Ser Ser Trp Val
340 345 350
Asn Arg Gly Glu Ser Ser Arg Lys Ala Tyr Asp His Asn Ser Pro Tyr
355 360 365
Ile Trp Pro Arg Asn Asp Tyr Asp Gly Phe Leu Glu Asn Ala His Glu
370 375 380
His His Gly Val Tyr Asn Gln Gly Arg Gly Ile Asp Ser Gly Glu Arg
385 390 395 400
Leu Met Gln Pro Thr Gln Met Ser Ala Gln Glu Asp Leu Gly Asp Asp
405 410 415
Thr Gly Ile His Val Ile Pro Thr Leu Asn Gly Asp Asp Arg His Lys
420 425 430
Ile Val Asn Val Asp Gln Arg Gln Tyr Gly Asp Val Phe Lys Gly Asp
435 440 445
Leu Asn Pro Lys Pro Gln Gly Gln Arg Leu Ile Glu Val Ser Val Glu
450 455 460
Glu Asn His Pro Phe Thr Leu Arg Ala Pro Ile Gln Arg Ile Tyr Gly
465 470 475 480
Val Arg Tyr Thr Glu Thr Trp Ser Phe Leu Pro Ser Leu Thr Cys Thr
485 490 495
Gly Asp Ala Ala Pro Ala Ile Gln His Ile Cys Leu Lys His Thr Thr
500 505 510
Cys Phe Gln Asp Val Val Val Asp Val Asp Cys Ala Glu Asn Thr Lys
515 520 525
Glu Asp Gln Leu Ala Glu Ile Ser Tyr Arg Phe Gln Gly Lys Lys Glu
530 535 540
Ala Asp Gln Pro Trp Ile Val Val Asn Thr Ser Thr Leu Phe Asp Glu
545 550 555 560
Leu Glu Leu Asp Pro Pro Glu Ile Glu Pro Gly Val Leu Lys Val Leu
565 570 575
Arg Thr Glu Lys Gln Tyr Leu Gly Val Tyr Ile Trp Asn Met Arg Gly
580 585 590
Ser Asp Gly Thr Ser Thr Tyr Ala Thr Phe Leu Val Thr Trp Lys Gly
595 600 605
Asp Glu Lys Thr Arg Asn Pro Thr Pro Ala Val Thr Pro Gln Pro Arg
610 615 620
Gly Ala Glu Phe His Met Trp Asn Tyr His Ser His Val Phe Ser Val
625 630 635 640
Gly Asp Thr Phe Ser Leu Ala Met His Leu Gln Tyr Lys Ile His Glu
645 650 655
Ala Pro Phe Asp Leu Leu Leu Glu Trp Leu Tyr Val Pro Ile Asp Pro
660 665 670
Thr Cys Gln Pro Met Arg Leu Tyr Ser Thr Cys Leu Tyr His Pro Asn
675 680 685
Ala Pro Gln Cys Leu Ser His Met Asn Ser Gly Cys Thr Phe Thr Ser
690 695 700
Pro His Leu Ala Gln Arg Val Ala Ser Thr Val Tyr Gln Asn Cys Glu
705 710 715 720
His Ala Asp Asn Tyr Thr Ala Tyr Cys Leu Gly Ile Ser His Met Glu
725 730 735
Pro Ser Phe Gly Leu Ile Leu His Asp Gly Gly Thr Thr Leu Lys Phe
740 745 750
Val Asp Thr Pro Glu Ser Leu Ser Gly Leu Tyr Val Phe Val Val Tyr
755 760 765
Phe Asn Gly His Val Glu Ala Val Ala Tyr Thr Val Val Ser Thr Val
770 775 780
Asp His Phe Val Asn Ala Ile Glu Glu Arg Gly Phe Pro Pro Thr Ala
785 790 795 800
Gly Gln Pro Pro Ala Thr Thr Lys Pro Lys Glu Ile Thr Pro Val Asn
805 810 815
Pro Gly Thr Ser Pro Leu Ile Arg
820
<210> 33
<211> 824
<212> PRT
<213> Unknown
<220>
<221> UNSURE
<222> (1)..(824)
<223> unknown
<400> 33
Ser Val Leu Arg Tyr Asp Asp Phe His Ile Asp Glu Asp Lys Leu Asp
1 5 10 15
Thr Asn Ser Val Tyr Glu Pro Tyr Tyr His Ser Asp His Ala Glu Ser
20 25 30
Ser Trp Val Asn Arg Gly Glu Ser Ser Arg Lys Ala Tyr Asp His Asn
35 40 45
Ser Pro Tyr Ile Trp Pro Arg Asn Asp Tyr Asp Gly Phe Leu Glu Asn
50 55 60
Ala His Glu His His Gly Val Tyr Asn Gln Gly Arg Gly Ile Asp Ser
65 70 75 80
Gly Glu Arg Leu Met Gln Pro Thr Gln Met Ser Ala Gln Glu Asp Leu
85 90 95
Gly Asp Asp Thr Gly Ile His Val Ile Pro Thr Leu Asn Gly Asp Asp
100 105 110
Arg His Lys Ile Val Asn Val Asp Gln Arg Gln Tyr Gly Asp Val Phe
115 120 125
Lys Gly Asp Leu Asn Pro Lys Pro Gln Gly Gln Arg Leu Ile Glu Val
130 135 140
Ser Val Glu Glu Asn His Pro Phe Thr Leu Arg Ala Pro Ile Gln Arg
145 150 155 160
Ile Tyr Gly Val Arg Tyr Thr Glu Thr Trp Ser Phe Leu Pro Ser Leu
165 170 175
Thr Cys Thr Gly Asp Ala Ala Pro Ala Ile Gln His Ile Cys Leu Lys
180 185 190
His Thr Thr Cys Phe Gln Asp Val Val Val Asp Val Asp Cys Ala Glu
195 200 205
Asn Thr Lys Glu Asp Gln Leu Ala Glu Ile Ser Tyr Arg Phe Gln Gly
210 215 220
Lys Lys Glu Ala Asp Gln Pro Trp Ile Val Val Asn Thr Ser Thr Leu
225 230 235 240
Phe Asp Glu Leu Glu Leu Asp Pro Pro Glu Ile Glu Pro Gly Val Leu
245 250 255
Lys Val Leu Arg Thr Glu Lys Gln Tyr Leu Gly Val Tyr Ile Trp Asn
260 265 270
Met Arg Gly Ser Asp Gly Thr Ser Thr Tyr Ala Thr Phe Leu Val Thr
275 280 285
Trp Lys Gly Asp Glu Lys Thr Arg Asn Pro Thr Pro Ala Val Thr Pro
290 295 300
Gln Pro Arg Gly Ala Glu Phe His Met Trp Asn Tyr His Ser His Val
305 310 315 320
Phe Ser Val Gly Asp Thr Phe Ser Leu Ala Met His Leu Gln Tyr Lys
325 330 335
Ile His Glu Ala Pro Phe Asp Leu Leu Leu Glu Trp Leu Tyr Val Pro
340 345 350
Ile Asp Pro Thr Cys Gln Pro Met Arg Leu Tyr Ser Thr Cys Leu Tyr
355 360 365
His Pro Asn Ala Pro Gln Cys Leu Ser His Met Asn Ser Gly Cys Thr
370 375 380
Phe Thr Ser Pro His Leu Ala Gln Arg Val Ala Ser Thr Val Tyr Gln
385 390 395 400
Asn Cys Glu His Ala Asp Asn Tyr Thr Ala Tyr Cys Leu Gly Ile Ser
405 410 415
His Met Glu Pro Ser Phe Gly Leu Ile Leu His Asp Gly Gly Thr Thr
420 425 430
Leu Lys Phe Val Asp Thr Pro Glu Ser Leu Ser Gly Leu Tyr Val Phe
435 440 445
Val Val Tyr Phe Asn Gly His Val Glu Ala Val Ala Tyr Thr Val Val
450 455 460
Ser Thr Val Asp His Phe Val Asn Ala Ile Glu Glu Arg Gly Phe Pro
465 470 475 480
Pro Thr Ala Gly Gln Pro Pro Ala Thr Thr Lys Pro Lys Glu Ile Thr
485 490 495
Pro Val Asn Pro Gly Thr Ser Pro Leu Ile Arg Gly Gly Gly Gly Ser
500 505 510
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Gln Val Ile Asn Thr
515 520 525
Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn Leu Asn Lys Ser Gln Ser
530 535 540
Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser Ser Gly Leu Arg Ile Asn
545 550 555 560
Ser Ala Lys Asp Asp Ala Ala Gly Gln Ala Ile Ala Asn Arg Phe Thr
565 570 575
Ala Asn Ile Lys Gly Leu Thr Gln Ala Ser Arg Asn Ala Asn Asp Gly
580 585 590
Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala Leu Asn Glu Ile Asn Asn
595 600 605
Asn Leu Gln Arg Val Arg Glu Leu Ala Val Gln Ser Ala Asn Gly Thr
610 615 620
Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln Ala Glu Ile Thr Gln Arg
625 630 635 640
Leu Asn Glu Ile Asp Arg Val Ser Gly Gln Thr Gln Phe Asn Gly Val
645 650 655
Lys Val Leu Ala Gln Asp Asn Thr Leu Thr Ile Gln Val Gly Ala Asn
660 665 670
Asp Gly Glu Thr Ile Asp Ile Asp Leu Lys Glu Ile Ser Ser Lys Thr
675 680 685
Leu Gly Leu Asp Lys Leu Asn Val Gln Asp Ala Tyr Thr Ser Pro Gly
690 695 700
Ile Ser Gly Gly Gly Gly Gly Ile Leu Asp Ser Met Gly His Asn Phe
705 710 715 720
Arg Thr Gly Gly Glu Leu Lys Glu Val Asn Thr Asp Lys Thr Glu Asn
725 730 735
Pro Leu Gln Lys Ile Asp Ala Ala Leu Ala Gln Val Asp Thr Leu Arg
740 745 750
Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn
755 760 765
Leu Gly Asn Thr Val Asn Asn Leu Ser Ser Ala Arg Ser Arg Ile Glu
770 775 780
Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala Gln Ile
785 790 795 800
Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln Val Pro
805 810 815
Gln Asn Val Leu Ser Leu Leu Arg
820
<210> 34
<211> 823
<212> PRT
<213> Unknown
<220>
<221> UNSURE
<222> (1)..(823)
<223> unknown
<400> 34
Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn
1 5 10 15
Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser
20 25 30
Ser Gly Leu Arg Ile Asn Ser Ala Lys Asp Asp Ala Ala Gly Gln Ala
35 40 45
Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu Thr Gln Ala Ser
50 55 60
Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala
65 70 75 80
Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val
85 90 95
Gln Ser Ala Asn Gly Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln
100 105 110
Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln
115 120 125
Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp Asn Thr Leu Thr
130 135 140
Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Lys
145 150 155 160
Glu Ile Ser Ser Lys Thr Leu Gly Leu Asp Lys Leu Asn Val Gln Asp
165 170 175
Ala Tyr Thr Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
180 185 190
Gly Ser Ser Val Leu Arg Tyr Asp Asp Phe His Ile Asp Glu Asp Lys
195 200 205
Leu Asp Thr Asn Ser Val Tyr Glu Pro Tyr Tyr His Ser Asp His Ala
210 215 220
Glu Ser Ser Trp Val Asn Arg Gly Glu Ser Ser Arg Lys Ala Tyr Asp
225 230 235 240
His Asn Ser Pro Tyr Ile Trp Pro Arg Asn Asp Tyr Asp Gly Phe Leu
245 250 255
Glu Asn Ala His Glu His His Gly Val Tyr Asn Gln Gly Arg Gly Ile
260 265 270
Asp Ser Gly Glu Arg Leu Met Gln Pro Thr Gln Met Ser Ala Gln Glu
275 280 285
Asp Leu Gly Asp Asp Thr Gly Ile His Val Ile Pro Thr Leu Asn Gly
290 295 300
Asp Asp Arg His Lys Ile Val Asn Val Asp Gln Arg Gln Tyr Gly Asp
305 310 315 320
Val Phe Lys Gly Asp Leu Asn Pro Lys Pro Gln Gly Gln Arg Leu Ile
325 330 335
Glu Val Ser Val Glu Glu Asn His Pro Phe Thr Leu Arg Ala Pro Ile
340 345 350
Gln Arg Ile Tyr Gly Val Arg Tyr Thr Glu Thr Trp Ser Phe Leu Pro
355 360 365
Ser Leu Thr Cys Thr Gly Asp Ala Ala Pro Ala Ile Gln His Ile Cys
370 375 380
Leu Lys His Thr Thr Cys Phe Gln Asp Val Val Val Asp Val Asp Cys
385 390 395 400
Ala Glu Asn Thr Lys Glu Asp Gln Leu Ala Glu Ile Ser Tyr Arg Phe
405 410 415
Gln Gly Lys Lys Glu Ala Asp Gln Pro Trp Ile Val Val Asn Thr Ser
420 425 430
Thr Leu Phe Asp Glu Leu Glu Leu Asp Pro Pro Glu Ile Glu Pro Gly
435 440 445
Val Leu Lys Val Leu Arg Thr Glu Lys Gln Tyr Leu Gly Val Tyr Ile
450 455 460
Trp Asn Met Arg Gly Ser Asp Gly Thr Ser Thr Tyr Ala Thr Phe Leu
465 470 475 480
Val Thr Trp Lys Gly Asp Glu Lys Thr Arg Asn Pro Thr Pro Ala Val
485 490 495
Thr Pro Gln Pro Arg Gly Ala Glu Phe His Met Trp Asn Tyr His Ser
500 505 510
His Val Phe Ser Val Gly Asp Thr Phe Ser Leu Ala Met His Leu Gln
515 520 525
Tyr Lys Ile His Glu Ala Pro Phe Asp Leu Leu Leu Glu Trp Leu Tyr
530 535 540
Val Pro Ile Asp Pro Thr Cys Gln Pro Met Arg Leu Tyr Ser Thr Cys
545 550 555 560
Leu Tyr His Pro Asn Ala Pro Gln Cys Leu Ser His Met Asn Ser Gly
565 570 575
Cys Thr Phe Thr Ser Pro His Leu Ala Gln Arg Val Ala Ser Thr Val
580 585 590
Tyr Gln Asn Cys Glu His Ala Asp Asn Tyr Thr Ala Tyr Cys Leu Gly
595 600 605
Ile Ser His Met Glu Pro Ser Phe Gly Leu Ile Leu His Asp Gly Gly
610 615 620
Thr Thr Leu Lys Phe Val Asp Thr Pro Glu Ser Leu Ser Gly Leu Tyr
625 630 635 640
Val Phe Val Val Tyr Phe Asn Gly His Val Glu Ala Val Ala Tyr Thr
645 650 655
Val Val Ser Thr Val Asp His Phe Val Asn Ala Ile Glu Glu Arg Gly
660 665 670
Phe Pro Pro Thr Ala Gly Gln Pro Pro Ala Thr Thr Lys Pro Lys Glu
675 680 685
Ile Thr Pro Val Asn Pro Gly Thr Ser Pro Leu Ile Arg Gly Gly Gly
690 695 700
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser His Asn Phe Arg
705 710 715 720
Thr Gly Gly Glu Leu Lys Glu Val Asn Thr Asp Lys Thr Glu Asn Pro
725 730 735
Leu Gln Lys Ile Asp Ala Ala Leu Ala Gln Val Asp Thr Leu Arg Ser
740 745 750
Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn Leu
755 760 765
Gly Asn Thr Val Asn Asn Leu Ser Ser Ala Arg Ser Arg Ile Glu Asp
770 775 780
Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala Gln Ile Leu
785 790 795 800
Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln Val Pro Gln
805 810 815
Asn Val Leu Ser Leu Leu Arg
820
<210> 35
<211> 517
<212> PRT
<213> Artificial Sequence
<220>
<221> UNSURE
<222> (1)..(517)
<223> unknown
<400> 35
Met Gly Ser Val Leu Arg Tyr Asp Asp Phe His Ile Asp Glu Asp Lys
1 5 10 15
Leu Asp Thr Asn Ser Val Tyr Glu Pro Tyr Tyr His Ser Asp His Ala
20 25 30
Glu Ser Ser Trp Val Asn Arg Gly Glu Ser Ser Arg Lys Ala Tyr Asp
35 40 45
His Asn Ser Pro Tyr Ile Trp Pro Arg Asn Asp Tyr Asp Gly Phe Leu
50 55 60
Glu Asn Ala His Glu His His Gly Val Tyr Asn Gln Gly Arg Gly Ile
65 70 75 80
Asp Ser Gly Glu Arg Leu Met Gln Pro Thr Gln Met Ser Ala Gln Glu
85 90 95
Asp Leu Gly Asp Asp Thr Gly Ile His Val Ile Pro Thr Leu Asn Gly
100 105 110
Asp Asp Arg His Lys Ile Val Asn Val Asp Gln Arg Gln Tyr Gly Asp
115 120 125
Val Phe Lys Gly Asp Leu Asn Pro Lys Pro Gln Gly Gln Arg Leu Ile
130 135 140
Glu Val Ser Val Glu Glu Asn His Pro Phe Thr Leu Arg Ala Pro Ile
145 150 155 160
Gln Arg Ile Tyr Gly Val Arg Tyr Thr Glu Thr Trp Ser Phe Leu Pro
165 170 175
Ser Leu Thr Cys Thr Gly Asp Ala Ala Pro Ala Ile Gln His Ile Cys
180 185 190
Leu Lys His Thr Thr Cys Phe Gln Asp Val Val Val Asp Val Asp Cys
195 200 205
Ala Glu Asn Thr Lys Glu Asp Gln Leu Ala Glu Ile Ser Tyr Arg Phe
210 215 220
Gln Gly Lys Lys Glu Ala Asp Gln Pro Trp Ile Val Val Asn Thr Ser
225 230 235 240
Thr Leu Phe Asp Glu Leu Glu Leu Asp Pro Pro Glu Ile Glu Pro Gly
245 250 255
Val Leu Lys Val Leu Arg Thr Glu Lys Gln Tyr Leu Gly Val Tyr Ile
260 265 270
Trp Asn Met Arg Gly Ser Asp Gly Thr Ser Thr Tyr Ala Thr Phe Leu
275 280 285
Val Thr Trp Lys Gly Asp Glu Lys Thr Arg Asn Pro Thr Pro Ala Val
290 295 300
Thr Pro Gln Pro Arg Gly Ala Glu Phe His Met Trp Asn Tyr His Ser
305 310 315 320
His Val Phe Ser Val Gly Asp Thr Phe Ser Leu Ala Met His Leu Gln
325 330 335
Tyr Lys Ile His Glu Ala Pro Phe Asp Leu Leu Leu Glu Trp Leu Tyr
340 345 350
Val Pro Ile Asp Pro Thr Cys Gln Pro Met Arg Leu Tyr Ser Thr Cys
355 360 365
Leu Tyr His Pro Asn Ala Pro Gln Cys Leu Ser His Met Asn Ser Gly
370 375 380
Cys Thr Phe Thr Ser Pro His Leu Ala Gln Arg Val Ala Ser Thr Val
385 390 395 400
Tyr Gln Asn Cys Glu His Ala Asp Asn Tyr Thr Ala Tyr Cys Leu Gly
405 410 415
Ile Ser His Met Glu Pro Ser Phe Gly Leu Ile Leu His Asp Gly Gly
420 425 430
Thr Thr Leu Lys Phe Val Asp Thr Pro Glu Ser Leu Ser Gly Leu Tyr
435 440 445
Val Phe Val Val Tyr Phe Asn Gly His Val Glu Ala Val Ala Tyr Thr
450 455 460
Val Val Ser Thr Val Asp His Phe Val Asn Ala Ile Glu Glu Arg Gly
465 470 475 480
Phe Pro Pro Thr Ala Gly Gln Pro Pro Ala Thr Thr Lys Pro Lys Glu
485 490 495
Ile Thr Pro Val Asn Pro Gly Thr Ser Pro Leu Ile Arg Leu Glu His
500 505 510
His His His His His
515
<210> 36
<211> 1554
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(1554)
<223> unknown
<400> 36
atgggtagcg ttctgcgtta cgatgatttc cacatcgatg aagataaact ggacaccaac 60
agcgtttacg aaccgtatta ccactctgat cacgctgaat ctagctgggt aaaccgtggt 120
gaaagcagcc gtaaagctta cgatcataac tctccgtaca tctggccgcg taacgattat 180
gacggctttc tggaaaacgc tcacgaacac cacggtgtgt acaaccaggg ccgcggtatc 240
gattctggtg aacgtctgat gcagccgacc cagatgtctg ctcaggaaga tctgggtgat 300
gatactggta ttcacgtgat cccgaccctg aatggtgatg atcgtcataa aatcgttaac 360
gttgatcagc gtcagtatgg tgatgttttc aaaggtgatc tgaacccgaa accgcagggt 420
cagcgtctga tcgaagtgtc tgtggaagaa aaccacccgt tcactctgcg tgctccgatt 480
cagcgtattt atggcgttcg ttacaccgaa acctggtctt ttctgccgtc tctgacttgc 540
actggcgatg cggctccggc aattcagcat atttgcctga aacatactac ttgctttcag 600
gatgtagtgg ttgatgttga ttgcgcggaa aacactaaag aagatcagct ggctgaaatc 660
agctaccgtt tccagggtaa aaaagaagcc gatcagccgt ggattgttgt gaacaccagc 720
accctgtttg atgaactgga actggatccg ccggaaattg aaccgggtgt tctgaaagtt 780
ctgcgtaccg aaaaacagta tctgggcgtg tatatttgga acatgcgtgg ttctgacggt 840
accagcacct acgctacctt cctggtgacc tggaaaggtg atgaaaaaac ccgcaacccg 900
accccggcgg ttaccccgca gccgcgtggc gctgaattcc atatgtggaa ctatcacagc 960
cacgtgttca gcgttggtga caccttctct ctggcgatgc atctgcagta taaaatccac 1020
gaagcaccgt tcgatctgct gcttgaatgg ctgtacgttc cgattgatcc gacctgccag 1080
ccgatgcgtc tgtactccac ctgcctgtac catccgaacg caccacagtg cctgagccat 1140
atgaactccg gctgtacgtt taccagcccg cacctggcgc agcgtgtggc tagcaccgtg 1200
taccagaact gcgaacatgc ggacaactat accgcatact gcctgggtat ttctcatatg 1260
gaaccgtctt tcggtctgat cctgcacgat ggcggcacca ctttgaaatt cgttgatact 1320
ccggaatccc tgtctggcct gtacgttttc gtggtgtact tcaacggtca cgtggaagca 1380
gtggcgtaca ccgttgttag caccgttgat cactttgtta acgcaattga agaacgtggc 1440
ttcccgccga ccgctggtca gccgccggca accactaaac cgaaagaaat taccccggtt 1500
aacccaggca ccagcccgct gatccgtctc gagcaccacc accaccacca ctga 1554
<210> 37
<211> 826
<212> PRT
<213> Artificial Sequence
<220>
<221> UNSURE
<222> (1)..(826)
<223> unknown
<400> 37
Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn
1 5 10 15
Asn Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu
20 25 30
Ser Ser Gly Leu Arg Ile Asn Ser Ala Lys Asp Asp Ala Ala Gly Gln
35 40 45
Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu Thr Gln Ala
50 55 60
Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly
65 70 75 80
Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala
85 90 95
Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile
100 105 110
Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly
115 120 125
Gln Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp Asn Thr Leu
130 135 140
Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu
145 150 155 160
Lys Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Thr Leu Asn Val Gln
165 170 175
Ser Pro Gly Ile Ser Gly Gly Gly Gly Gly Ile Leu Asp Ser Met Gly
180 185 190
Lys Ala Gln Pro Asp Leu Ala Glu Ala Ala Ala Thr Thr Thr Glu Asn
195 200 205
Pro Leu Gln Lys Ile Asp Ala Ala Leu Ala Gln Val Asp Thr Leu Arg
210 215 220
Ser Asp Leu Gly Ala Val Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn
225 230 235 240
Leu Gly Asn Thr Val Asn Asn Leu Thr Ser Ala Arg Ser Arg Ile Glu
245 250 255
Asp Ser Asp Tyr Ala Thr Glu Val Ser Asn Met Ser Arg Ala Gln Ile
260 265 270
Leu Gln Gln Ala Gly Thr Ser Val Leu Ala Gln Ala Asn Gln Val Pro
275 280 285
Gln Asn Val Leu Ser Leu Leu Arg Gly Gly Gly Gly Ser Gly Gly Gly
290 295 300
Gly Ser Gly Gly Gly Gly Ser Ser Val Leu Arg Tyr Asp Asp Phe His
305 310 315 320
Ile Asp Glu Asp Lys Leu Asp Thr Asn Ser Val Tyr Glu Pro Tyr Tyr
325 330 335
His Ser Asp His Ala Glu Ser Ser Trp Val Asn Arg Gly Glu Ser Ser
340 345 350
Arg Lys Ala Tyr Asp His Asn Ser Pro Tyr Ile Trp Pro Arg Asn Asp
355 360 365
Tyr Asp Gly Phe Leu Glu Asn Ala His Glu His His Gly Val Tyr Asn
370 375 380
Gln Gly Arg Gly Ile Asp Ser Gly Glu Arg Leu Met Gln Pro Thr Gln
385 390 395 400
Met Ser Ala Gln Glu Asp Leu Gly Asp Asp Thr Gly Ile His Val Ile
405 410 415
Pro Thr Leu Asn Gly Asp Asp Arg His Lys Ile Val Asn Val Asp Gln
420 425 430
Arg Gln Tyr Gly Asp Val Phe Lys Gly Asp Leu Asn Pro Lys Pro Gln
435 440 445
Gly Gln Arg Leu Ile Glu Val Ser Val Glu Glu Asn His Pro Phe Thr
450 455 460
Leu Arg Ala Pro Ile Gln Arg Ile Tyr Gly Val Arg Tyr Thr Glu Thr
465 470 475 480
Trp Ser Phe Leu Pro Ser Leu Thr Cys Thr Gly Asp Ala Ala Pro Ala
485 490 495
Ile Gln His Ile Cys Leu Lys His Thr Thr Cys Phe Gln Asp Val Val
500 505 510
Val Asp Val Asp Cys Ala Glu Asn Thr Lys Glu Asp Gln Leu Ala Glu
515 520 525
Ile Ser Tyr Arg Phe Gln Gly Lys Lys Glu Ala Asp Gln Pro Trp Ile
530 535 540
Val Val Asn Thr Ser Thr Leu Phe Asp Glu Leu Glu Leu Asp Pro Pro
545 550 555 560
Glu Ile Glu Pro Gly Val Leu Lys Val Leu Arg Thr Glu Lys Gln Tyr
565 570 575
Leu Gly Val Tyr Ile Trp Asn Met Arg Gly Ser Asp Gly Thr Ser Thr
580 585 590
Tyr Ala Thr Phe Leu Val Thr Trp Lys Gly Asp Glu Lys Thr Arg Asn
595 600 605
Pro Thr Pro Ala Val Thr Pro Gln Pro Arg Gly Ala Glu Phe His Met
610 615 620
Trp Asn Tyr His Ser His Val Phe Ser Val Gly Asp Thr Phe Ser Leu
625 630 635 640
Ala Met His Leu Gln Tyr Lys Ile His Glu Ala Pro Phe Asp Leu Leu
645 650 655
Leu Glu Trp Leu Tyr Val Pro Ile Asp Pro Thr Cys Gln Pro Met Arg
660 665 670
Leu Tyr Ser Thr Cys Leu Tyr His Pro Asn Ala Pro Gln Cys Leu Ser
675 680 685
His Met Asn Ser Gly Cys Thr Phe Thr Ser Pro His Leu Ala Gln Arg
690 695 700
Val Ala Ser Thr Val Tyr Gln Asn Cys Glu His Ala Asp Asn Tyr Thr
705 710 715 720
Ala Tyr Cys Leu Gly Ile Ser His Met Glu Pro Ser Phe Gly Leu Ile
725 730 735
Leu His Asp Gly Gly Thr Thr Leu Lys Phe Val Asp Thr Pro Glu Ser
740 745 750
Leu Ser Gly Leu Tyr Val Phe Val Val Tyr Phe Asn Gly His Val Glu
755 760 765
Ala Val Ala Tyr Thr Val Val Ser Thr Val Asp His Phe Val Asn Ala
770 775 780
Ile Glu Glu Arg Gly Phe Pro Pro Thr Ala Gly Gln Pro Pro Ala Thr
785 790 795 800
Thr Lys Pro Lys Glu Ile Thr Pro Val Asn Pro Gly Thr Ser Pro Leu
805 810 815
Ile Arg Leu Glu His His His His His His
820 825
<210> 38
<211> 827
<212> PRT
<213> Artificial Sequence
<220>
<221> UNSURE
<222> (1)..(827)
<223> unknown
<400> 38
Met Gly Ser Val Leu Arg Tyr Asp Asp Phe His Ile Asp Glu Asp Lys
1 5 10 15
Leu Asp Thr Asn Ser Val Tyr Glu Pro Tyr Tyr His Ser Asp His Ala
20 25 30
Glu Ser Ser Trp Val Asn Arg Gly Glu Ser Ser Arg Lys Ala Tyr Asp
35 40 45
His Asn Ser Pro Tyr Ile Trp Pro Arg Asn Asp Tyr Asp Gly Phe Leu
50 55 60
Glu Asn Ala His Glu His His Gly Val Tyr Asn Gln Gly Arg Gly Ile
65 70 75 80
Asp Ser Gly Glu Arg Leu Met Gln Pro Thr Gln Met Ser Ala Gln Glu
85 90 95
Asp Leu Gly Asp Asp Thr Gly Ile His Val Ile Pro Thr Leu Asn Gly
100 105 110
Asp Asp Arg His Lys Ile Val Asn Val Asp Gln Arg Gln Tyr Gly Asp
115 120 125
Val Phe Lys Gly Asp Leu Asn Pro Lys Pro Gln Gly Gln Arg Leu Ile
130 135 140
Glu Val Ser Val Glu Glu Asn His Pro Phe Thr Leu Arg Ala Pro Ile
145 150 155 160
Gln Arg Ile Tyr Gly Val Arg Tyr Thr Glu Thr Trp Ser Phe Leu Pro
165 170 175
Ser Leu Thr Cys Thr Gly Asp Ala Ala Pro Ala Ile Gln His Ile Cys
180 185 190
Leu Lys His Thr Thr Cys Phe Gln Asp Val Val Val Asp Val Asp Cys
195 200 205
Ala Glu Asn Thr Lys Glu Asp Gln Leu Ala Glu Ile Ser Tyr Arg Phe
210 215 220
Gln Gly Lys Lys Glu Ala Asp Gln Pro Trp Ile Val Val Asn Thr Ser
225 230 235 240
Thr Leu Phe Asp Glu Leu Glu Leu Asp Pro Pro Glu Ile Glu Pro Gly
245 250 255
Val Leu Lys Val Leu Arg Thr Glu Lys Gln Tyr Leu Gly Val Tyr Ile
260 265 270
Trp Asn Met Arg Gly Ser Asp Gly Thr Ser Thr Tyr Ala Thr Phe Leu
275 280 285
Val Thr Trp Lys Gly Asp Glu Lys Thr Arg Asn Pro Thr Pro Ala Val
290 295 300
Thr Pro Gln Pro Arg Gly Ala Glu Phe His Met Trp Asn Tyr His Ser
305 310 315 320
His Val Phe Ser Val Gly Asp Thr Phe Ser Leu Ala Met His Leu Gln
325 330 335
Tyr Lys Ile His Glu Ala Pro Phe Asp Leu Leu Leu Glu Trp Leu Tyr
340 345 350
Val Pro Ile Asp Pro Thr Cys Gln Pro Met Arg Leu Tyr Ser Thr Cys
355 360 365
Leu Tyr His Pro Asn Ala Pro Gln Cys Leu Ser His Met Asn Ser Gly
370 375 380
Cys Thr Phe Thr Ser Pro His Leu Ala Gln Arg Val Ala Ser Thr Val
385 390 395 400
Tyr Gln Asn Cys Glu His Ala Asp Asn Tyr Thr Ala Tyr Cys Leu Gly
405 410 415
Ile Ser His Met Glu Pro Ser Phe Gly Leu Ile Leu His Asp Gly Gly
420 425 430
Thr Thr Leu Lys Phe Val Asp Thr Pro Glu Ser Leu Ser Gly Leu Tyr
435 440 445
Val Phe Val Val Tyr Phe Asn Gly His Val Glu Ala Val Ala Tyr Thr
450 455 460
Val Val Ser Thr Val Asp His Phe Val Asn Ala Ile Glu Glu Arg Gly
465 470 475 480
Phe Pro Pro Thr Ala Gly Gln Pro Pro Ala Thr Thr Lys Pro Lys Glu
485 490 495
Ile Thr Pro Val Asn Pro Gly Thr Ser Pro Leu Ile Arg Gly Gly Gly
500 505 510
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Gln Val Ile
515 520 525
Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn Asn Leu Asn Lys Ser
530 535 540
Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu Ser Ser Gly Leu Arg
545 550 555 560
Ile Asn Ser Ala Lys Asp Asp Ala Ala Gly Gln Ala Ile Ala Asn Arg
565 570 575
Phe Thr Ala Asn Ile Lys Gly Leu Thr Gln Ala Ser Arg Asn Ala Asn
580 585 590
Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly Ala Leu Asn Glu Ile
595 600 605
Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala Val Gln Ser Ala Asn
610 615 620
Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile Gln Ala Glu Ile Thr
625 630 635 640
Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly Gln Thr Gln Phe Asn
645 650 655
Gly Val Lys Val Leu Ala Gln Asp Asn Thr Leu Thr Ile Gln Val Gly
660 665 670
Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu Lys Gln Ile Asn Ser
675 680 685
Gln Thr Leu Gly Leu Asp Thr Leu Asn Val Gln Ser Pro Gly Ile Ser
690 695 700
Gly Gly Gly Gly Gly Ile Leu Asp Ser Met Gly Lys Ala Gln Pro Asp
705 710 715 720
Leu Ala Glu Ala Ala Ala Thr Thr Thr Glu Asn Pro Leu Gln Lys Ile
725 730 735
Asp Ala Ala Leu Ala Gln Val Asp Thr Leu Arg Ser Asp Leu Gly Ala
740 745 750
Val Gln Asn Arg Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val
755 760 765
Asn Asn Leu Thr Ser Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala
770 775 780
Thr Glu Val Ser Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly
785 790 795 800
Thr Ser Val Leu Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser
805 810 815
Leu Leu Arg Leu Glu His His His His His His
820 825
<210> 39
<211> 825
<212> PRT
<213> Artificial Sequence
<220>
<221> UNSURE
<222> (1)..(825)
<223> unknown
<400> 39
Met Ala Gln Val Ile Asn Thr Asn Ser Leu Ser Leu Leu Thr Gln Asn
1 5 10 15
Asn Leu Asn Lys Ser Gln Ser Ala Leu Gly Thr Ala Ile Glu Arg Leu
20 25 30
Ser Ser Gly Leu Arg Ile Asn Ser Ala Lys Asp Asp Ala Ala Gly Gln
35 40 45
Ala Ile Ala Asn Arg Phe Thr Ala Asn Ile Lys Gly Leu Thr Gln Ala
50 55 60
Ser Arg Asn Ala Asn Asp Gly Ile Ser Ile Ala Gln Thr Thr Glu Gly
65 70 75 80
Ala Leu Asn Glu Ile Asn Asn Asn Leu Gln Arg Val Arg Glu Leu Ala
85 90 95
Val Gln Ser Ala Asn Ser Thr Asn Ser Gln Ser Asp Leu Asp Ser Ile
100 105 110
Gln Ala Glu Ile Thr Gln Arg Leu Asn Glu Ile Asp Arg Val Ser Gly
115 120 125
Gln Thr Gln Phe Asn Gly Val Lys Val Leu Ala Gln Asp Asn Thr Leu
130 135 140
Thr Ile Gln Val Gly Ala Asn Asp Gly Glu Thr Ile Asp Ile Asp Leu
145 150 155 160
Lys Gln Ile Asn Ser Gln Thr Leu Gly Leu Asp Thr Leu Asn Val Gln
165 170 175
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ser
180 185 190
Val Leu Arg Tyr Asp Asp Phe His Ile Asp Glu Asp Lys Leu Asp Thr
195 200 205
Asn Ser Val Tyr Glu Pro Tyr Tyr His Ser Asp His Ala Glu Ser Ser
210 215 220
Trp Val Asn Arg Gly Glu Ser Ser Arg Lys Ala Tyr Asp His Asn Ser
225 230 235 240
Pro Tyr Ile Trp Pro Arg Asn Asp Tyr Asp Gly Phe Leu Glu Asn Ala
245 250 255
His Glu His His Gly Val Tyr Asn Gln Gly Arg Gly Ile Asp Ser Gly
260 265 270
Glu Arg Leu Met Gln Pro Thr Gln Met Ser Ala Gln Glu Asp Leu Gly
275 280 285
Asp Asp Thr Gly Ile His Val Ile Pro Thr Leu Asn Gly Asp Asp Arg
290 295 300
His Lys Ile Val Asn Val Asp Gln Arg Gln Tyr Gly Asp Val Phe Lys
305 310 315 320
Gly Asp Leu Asn Pro Lys Pro Gln Gly Gln Arg Leu Ile Glu Val Ser
325 330 335
Val Glu Glu Asn His Pro Phe Thr Leu Arg Ala Pro Ile Gln Arg Ile
340 345 350
Tyr Gly Val Arg Tyr Thr Glu Thr Trp Ser Phe Leu Pro Ser Leu Thr
355 360 365
Cys Thr Gly Asp Ala Ala Pro Ala Ile Gln His Ile Cys Leu Lys His
370 375 380
Thr Thr Cys Phe Gln Asp Val Val Val Asp Val Asp Cys Ala Glu Asn
385 390 395 400
Thr Lys Glu Asp Gln Leu Ala Glu Ile Ser Tyr Arg Phe Gln Gly Lys
405 410 415
Lys Glu Ala Asp Gln Pro Trp Ile Val Val Asn Thr Ser Thr Leu Phe
420 425 430
Asp Glu Leu Glu Leu Asp Pro Pro Glu Ile Glu Pro Gly Val Leu Lys
435 440 445
Val Leu Arg Thr Glu Lys Gln Tyr Leu Gly Val Tyr Ile Trp Asn Met
450 455 460
Arg Gly Ser Asp Gly Thr Ser Thr Tyr Ala Thr Phe Leu Val Thr Trp
465 470 475 480
Lys Gly Asp Glu Lys Thr Arg Asn Pro Thr Pro Ala Val Thr Pro Gln
485 490 495
Pro Arg Gly Ala Glu Phe His Met Trp Asn Tyr His Ser His Val Phe
500 505 510
Ser Val Gly Asp Thr Phe Ser Leu Ala Met His Leu Gln Tyr Lys Ile
515 520 525
His Glu Ala Pro Phe Asp Leu Leu Leu Glu Trp Leu Tyr Val Pro Ile
530 535 540
Asp Pro Thr Cys Gln Pro Met Arg Leu Tyr Ser Thr Cys Leu Tyr His
545 550 555 560
Pro Asn Ala Pro Gln Cys Leu Ser His Met Asn Ser Gly Cys Thr Phe
565 570 575
Thr Ser Pro His Leu Ala Gln Arg Val Ala Ser Thr Val Tyr Gln Asn
580 585 590
Cys Glu His Ala Asp Asn Tyr Thr Ala Tyr Cys Leu Gly Ile Ser His
595 600 605
Met Glu Pro Ser Phe Gly Leu Ile Leu His Asp Gly Gly Thr Thr Leu
610 615 620
Lys Phe Val Asp Thr Pro Glu Ser Leu Ser Gly Leu Tyr Val Phe Val
625 630 635 640
Val Tyr Phe Asn Gly His Val Glu Ala Val Ala Tyr Thr Val Val Ser
645 650 655
Thr Val Asp His Phe Val Asn Ala Ile Glu Glu Arg Gly Phe Pro Pro
660 665 670
Thr Ala Gly Gln Pro Pro Ala Thr Thr Lys Pro Lys Glu Ile Thr Pro
675 680 685
Val Asn Pro Gly Thr Ser Pro Leu Ile Arg Gly Gly Gly Gly Ser Gly
690 695 700
Gly Gly Gly Ser Gly Gly Gly Gly Ser Lys Ala Gln Pro Asp Leu Ala
705 710 715 720
Glu Ala Ala Ala Thr Thr Thr Glu Asn Pro Leu Gln Lys Ile Asp Ala
725 730 735
Ala Leu Ala Gln Val Asp Thr Leu Arg Ser Asp Leu Gly Ala Val Gln
740 745 750
Asn Arg Phe Asn Ser Ala Ile Thr Asn Leu Gly Asn Thr Val Asn Asn
755 760 765
Leu Thr Ser Ala Arg Ser Arg Ile Glu Asp Ser Asp Tyr Ala Thr Glu
770 775 780
Val Ser Asn Met Ser Arg Ala Gln Ile Leu Gln Gln Ala Gly Thr Ser
785 790 795 800
Val Leu Ala Gln Ala Asn Gln Val Pro Gln Asn Val Leu Ser Leu Leu
805 810 815
Arg Leu Glu His His His His His His
820 825
<210> 40
<211> 2481
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(2481)
<223> unknown
<400> 40
atggcccagg tgattaacac caacagcctg tctctgctga cccagaacaa cctgaacaaa 60
tctcagtctg ctctgggcac cgcgatcgaa cgtctgagca gcggcctgcg tatcaactct 120
gcgaaagatg atgcggcggg tcaggcaatc gctaaccgtt tcaccgctaa cattaaaggc 180
ctgacccagg cgagccgtaa cgcaaacgat ggtatctcca tcgcgcaaac caccgaaggt 240
gcgctgaacg aaatcaacaa caacctgcag cgtgtgcgcg aactggcggt gcagtctgct 300
aacagcacca acagccagtc tgatctggat agcatccaag cagaaatcac ccagcgtctg 360
aatgaaattg atcgcgttag cggtcagacc cagttcaacg gtgtgaaagt tctggctcag 420
gataacaccc tgaccatcca ggttggcgct aacgatggtg agaccattga tatcgatctg 480
aaacagatca acagccagac cctgggtctg gataccctga acgttcagtc tccgggcatc 540
agcggtggtg gcggtggcat tctggacagc atgggtaaag ctcagcctga tctggctgaa 600
gctgcggcga ccaccaccga aaacccgctg cagaaaattg atgcggcgct ggcgcaggtt 660
gacacgctgc gtagcgatct gggcgcggtg cagaaccgtt ttaacagcgc tatcaccaac 720
ctgggtaaca ccgttaacaa cctgacctct gcacgttctc gcatcgaaga ttccgactat 780
gcgaccgaag tgtccaacat gagccgtgcg cagattctgc agcaggcggg cacgtctgtg 840
ctggcccagg caaaccaggt accgcagaac gttctgtctc tgctgcgtgg tggtggcggc 900
agcggcggcg gcggtagcgg cggcggcggc tccagcgttc tgcgttacga cgactttcat 960
atcgacgaag acaaactgga tactaacagc gtctacgaac cgtattatca ttccgaccac 1020
gccgaatctt cttgggtgaa ccgcggcgaa agcagccgta aagcgtatga tcataactct 1080
ccgtacatct ggccgcgtaa cgattatgac ggcttcctgg aaaacgcaca tgaacaccac 1140
ggcgtttaca accagggtcg tggtatcgac agcggtgaac gtctgatgca gccgacccag 1200
atgtccgctc aggaagactt gggtgatgac accggcattc acgtgatccc gaccctgaac 1260
ggtgacgatc gtcacaaaat cgttaacgtg gaccagcgcc agtacggcga cgtattcaaa 1320
ggtgatctga acccgaaacc gcagggtcag cgtctgatcg aagtgtccgt tgaagaaaac 1380
cacccgttca ccctgcgtgc accgattcag cgcatctatg gtgtgcgtta caccgaaacc 1440
tggtcgttcc tgccgtcgct gacctgcacg ggtgatgcgg ccccggccat ccagcacatt 1500
tgcctgaaac acaccacttg ctttcaggat gtggttgtgg acgttgactg tgctgaaaac 1560
accaaagaag atcagctggc agaaattagc tatcgtttcc agggtaaaaa agaagcggac 1620
cagccgtgga tcgtggttaa cactagcact ctgttcgatg aactggaact ggaccctccg 1680
gaaatcgaac cgggtgttct gaaagtgctg cgtaccgaaa aacagtacct gggtgtttac 1740
atctggaaca tgcgtggctc cgacggtacc tctacctacg cgactttcct ggtcacctgg 1800
aaaggtgatg aaaaaacccg taacccgacc ccggcagtta ccccgcagcc gcgtggcgcg 1860
gaattccaca tgtggaacta tcactctcat gttttctctg ttggtgatac tttctccttg 1920
gctatgcacc tgcagtacaa aatccatgaa gcgccgttcg atctgctgct ggaatggctg 1980
tatgttccga tcgatccgac ctgtcagccg atgcgtctgt atagcacctg tctgtaccac 2040
ccgaacgcgc cgcagtgtct gtcccacatg aactccggtt gcaccttcac tagcccgcac 2100
ctggcacagc gtgtggcttc caccgtttat cagaactgcg aacatgcgga caattatacc 2160
gcttactgcc tgggcatctc tcacatggaa ccgtctttcg gtctgatcct gcacgatggc 2220
ggcaccaccc tgaaattcgt agataccccg gaaagcctgt ctggtctgta cgtgttcgtt 2280
gtttacttca atggccatgt tgaagcggtt gcgtacaccg ttgttagcac cgttgatcac 2340
ttcgttaacg cgattgaaga acgtggcttc ccgccgaccg cgggccagcc gccggctacc 2400
actaaaccga aagaaatcac cccggttaat ccgggcacct ctccgctgat ccgtctcgag 2460
caccaccacc accaccacta a 2481
<210> 41
<211> 2499
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(2499)
<223> unknown
<400> 41
atggcccagg tgattaacac caacagcctg tctctgctga cccagaacaa cctgaacaaa 60
tctcagtctg ctctgggcac cgcgatcgaa cgtctgagca gcggcctgcg tatcaactct 120
gcgaaagatg atgcggcggg tcaggcaatc gctaaccgtt tcaccgctaa cattaaaggc 180
ctgacccagg cgagccgtaa cgcaaacgat ggtatctcca tcgcgcaaac caccgaaggt 240
gcgctgaacg aaatcaacaa caacctgcag cgtgtgcgcg aactggcggt gcagtctgct 300
aacagcacca acagccagtc tgatctggat agcatccaag cagaaatcac ccagcgtctg 360
aatgaaattg atcgcgttag cggtcagacc cagttcaacg gtgtgaaagt tctggctcag 420
gataacaccc tgaccatcca ggttggcgct aacgatggtg agaccattga tatcgatctg 480
aaacagatca acagccagac cctgggtctg gataccctga acgttcagtc tccgggcatc 540
agcggtggtg gcggtggcat tctggacagc atgggtaaag ctcagcctga tctggctgaa 600
gctgcggcga ccaccaccga aaacccgctg cagaaaattg atgcggcgct ggcgcaggtt 660
gacacgctgc gtagcgatct gggcgcggtg cagaaccgtt ttaacagcgc tatcaccaac 720
ctgggtaaca ccgttaacaa cctgacctct gcacgttctc gcatcgaaga ttccgactat 780
gcgaccgaag tgtccaacat gagccgtgcg cagattctgc agcaggcggg cacgtctgtg 840
ctggcccagg caaaccaggt accgcagaac gttctgtctc tgctgcgtgg tggtggcggc 900
agcggcggcg gcggtagcgg cggcggcggc tccagcgttc tgcgttacga cgactttcat 960
atcgacgaag acaaactgga tactaacagc gtctacgaac cgtattatca ttccgaccac 1020
gccgaatctt cttgggtgaa ccgcggcgaa agcagccgta aagcgtatga tcataactct 1080
ccgtacatct ggccgcgtaa cgattatgac ggcttcctgg aaaacgcaca tgaacaccac 1140
ggcgtttaca accagggtcg tggtatcgac agcggtgaac gtctgatgca gccgacccag 1200
atgtccgctc aggaagactt gggtgatgac accggcattc acgtgatccc gaccctgaac 1260
ggtgacgatc gtcacaaaat cgttaacgtg gaccagcgcc agtacggcga cgtattcaaa 1320
ggtgatctga acccgaaacc gcagggtcag cgtctgatcg aagtgtccgt tgaagaaaac 1380
cacccgttca ccctgcgtgc accgattcag cgcatctatg gtgtgcgtta caccgaaacc 1440
tggtcgttcc tgccgtcgct gacctgcacg ggtgatgcgg ccccggccat ccagcacatt 1500
tgcctgaaac acaccacttg ctttcaggat gtggttgtgg acgttgactg tgctgaaaac 1560
accaaagaag atcagctggc agaaattagc tatcgtttcc agggtaaaaa agaagcggac 1620
cagccgtgga tcgtggttaa cactagcact ctgttcgatg aactggaact ggaccctccg 1680
gaaatcgaac cgggtgttct gaaagtgctg cgtaccgaaa aacagtacct gggtgtttac 1740
atctggaaca tgcgtggctc cgacggtacc tctacctacg cgactttcct ggtcacctgg 1800
aaaggtgatg aaaaaacccg taacccgacc ccggcagtta ccccgcagcc gcgtggcgcg 1860
gaattccaca tgtggaacta tcactctcat gttttctctg ttggtgatac tttctccttg 1920
gctatgcacc tgcagtacaa aatccatgaa gcgccgttcg atctgctgct ggaatggctg 1980
tatgttccga tcgatccgac ctgtcagccg atgcgtctgt atagcacctg tctgtaccac 2040
ccgaacgcgc cgcagtgtct gtcccacatg aactccggtt gcaccttcac tagcccgcac 2100
ctggcacagc gtgtggcttc caccgtttat cagaactgcg aacatgcgga caattatacc 2160
gcttactgcc tgggcatctc tcacatggaa ccgtctttcg gtctgatcct gcacgatggc 2220
ggcaccaccc tgaaattcgt agataccccg gaaagcctgt ctggtctgta cgtgttcgtt 2280
gtttacttca atggccatgt tgaagcggtt gcgtacaccg ttgttagcac cgttgatcac 2340
ttcgttaacg cgattgaaga acgtggcttc ccgccgaccg cgggccagcc gccggctacc 2400
actaaaccga aagaaatcac cccggttaat ccgggcacct ctccgctgat ccgtctcgag 2460
caccaccacc accaccacta acaccaccac caccactaa 2499
<210> 42
<211> 2460
<212> DNA
<213> Artificial Sequence
<220>
<221> unsure
<222> (1)..(2460)
<223> unknown
<400> 42
atggcgcagg ttatcaacac taacagcctg agcctgctga cccagaacaa cctgaacaaa 60
agccagagcg cgctgggcac ggcgatcgaa cgtctgtctt ccggcctgcg catcaacagc 120
gcgaaagatg atgcggcagg tcaggcgatt gctaaccgct tcaccgctaa tatcaaaggc 180
ctgactcagg cttcccgcaa tgcgaacgac ggtatcagca tcgcacagac caccgaaggc 240
gcgctgaacg aaatcaacaa caacctgcag cgtgtgcgtg aactggcggt gcagtctgct 300
aactcgacga acagccagtc cgacctggat tccatccagg cggaaatcac ccagcgtctg 360
aacgaaatcg atcgcgttag cggtcagacc cagttcaacg gtgttaaagt tctggcgcag 420
gataataccc tgaccattca ggtcggcgct aacgacggtg aaaccattga catcgatctg 480
aaacagatta acagccagac cctgggtctg gataccctga acgttcaggg cggtggtggc 540
tctggcggcg gtggttccgg cggtggtggt tcctctgtcc tgcgttatga tgatttccac 600
atcgatgaag acaaactgga cacgaatagc gtttacgaac cgtattatca cagcgatcat 660
gctgaaagct cttgggttaa ccgtggtgaa tcttcccgta aagcgtacga tcacaactcc 720
ccgtacattt ggccgcgtaa cgactacgat ggcttcctgg aaaacgcaca cgaacaccac 780
ggcgtgtaca accagggccg tggcattgac agcggtgaac gcctgatgca gccgacccag 840
atgagcgcgc aagaagacct gggtgatgac accggtattc acgtgatccc gaccctgaac 900
ggcgatgatc gccacaaaat tgtaaacgtc gatcagcgtc agtatggcga tgtgtttaaa 960
ggtgatctga acccgaaacc gcaaggccag cgcctgatcg aggtgagcgt tgaagaaaac 1020
cacccgttca ccctgcgcgc tccgatccag cgcatttacg gtgtccgtta taccgaaact 1080
tggtcctttc tgccgtcgct gacctgcacc ggtgatgcgg ctccggctat ccagcacatc 1140
tgcctgaaac acacgacctg tttccaggat gtagttgttg acgtggactg tgcggaaaac 1200
actaaagaag accagctggc ggaaatcagc taccgtttcc agggcaaaaa ggaagcggac 1260
cagccgtgga tcgttgtaaa cacctccacc ctgttcgacg aactggaact ggatccgccg 1320
gaaattgaac cgggtgtgct gaaagttctg cgtaccgaaa aacagtacct gggcgtttac 1380
atttggaaca tgcgcggttc tgatggtacc tccacctacg caactttcct ggttacctgg 1440
aaaggcgatg aaaaaacccg taacccgacc ccggcggtta ccccgcagcc gcgtggtgct 1500
gaattccaca tgtggaatta tcactctcac gtgtttagcg tcggtgatac ctttagcctg 1560
gcaatgcacc tgcagtacaa aatccatgaa gcgccgttcg atctgctgct ggaatggctg 1620
tatgtgccga ttgatccgac ctgtcagccg atgcgtctgt actctacttg cctgtatcac 1680
ccaaacgctc cgcagtgcct gtcccacatg aactccggct gtaccttcac tagcccgcac 1740
ctggcgcagc gtgttgcgtc caccgtttat cagaactgcg aacacgcgga taactacacc 1800
gcttattgcc tgggtatctc tcacatggaa ccatctttcg gtctgatcct gcatgacggc 1860
ggcaccaccc tcaaatttgt tgacaccccg gaatctctgt ctggcctgta cgtttttgtg 1920
gtttatttca acggtcacgt agaagcggtc gcgtataccg ttgttagcac cgttgaccac 1980
ttcgttaatg cgatcgaaga acgtggcttc ccgccgaccg cgggccagcc gccggcgacc 2040
accaaaccga aagaaattac tccggtaaat ccgggtacct ctccgctgat ccgtggcggc 2100
ggtggcagcg gcggtggcgg ctccggtggc ggtggtagca aagcgcagcc ggatctggcg 2160
gaagcagccg caactactac cgaaaacccg ctgcagaaaa tcgacgcagc cctggcgcag 2220
gtagataccc tgcgttctga cctgggcgca gttcagaacc gttttaactc cgcaatcacc 2280
aacttgggta acacggttaa caacctgacc tctgcacgca gccgtattga agatagcgac 2340
tatgcgaccg aagtttctaa catgagccgt gcgcagatcc tgcagcaggc aggtacctct 2400
gttctggcgc aggcgaacca ggttccgcag aacgtgctga gcctgctgcg tctcgagcac 2460

Claims (14)

1.一种免疫组合物,其特征在于,包含基于gE的融合蛋白,或者其编码核酸分子,所述基于gE的融合蛋白的氨基酸序列如SEQ ID NO:32-34任一所示。
2.如权利要求1所述的免疫组合物,其特征在于,编码所述基于gE的融合蛋白的核酸分子如SEQ ID NO:20-26任一所示。
3.如权利要求1所述的免疫组合物,其特征在于,进一步包含药学上可接受的载体,和/或佐剂,和/或免疫刺激分子。
4.如权利要求3所述的免疫组合物,其特征在于,所述佐剂包含:铝盐、水包油乳液或油包水乳液、MF-59、QuilA或其QS21组分、TLR激动剂、壳聚糖、免疫刺激复合物ISCOMs或其两种或多种的组合。
5.一种重组载体,其特征在于,所述重组载体包含氨基酸序列如SEQ ID NO:32-34任一所示的基于gE的融合蛋白或核苷酸序列如SEQ ID NO:20-26任一所示的核酸分子。
6.如权利要求5所述的重组载体,其特征在于,所述载体为腺病毒载体、腺病毒相关病毒载体、痘病毒载体、水疱性口炎病毒载体、牛副流感病毒载体、人副流感病毒载体、新城疫病毒载体、仙台病毒载体、麻疹病毒载体、减毒RSV载体、副粘病毒载体、委内瑞拉马脑炎病毒载体、塞姆利基森林病毒载体、辛德比病毒载体、棒状病毒载体、狂犬病病毒载体、小核糖核酸病毒、慢病毒载体、疱疹病毒载体、或植物来源的病毒用于在植物表达系统中表达。
7.如权利要求6所述的重组载体,其特征在于,所述腺病毒载体为人源腺病毒载体、黑猩猩源腺病毒载体或大猩猩腺病毒载体。
8.如权利要求7所述的重组载体,其特征在于,所述人源腺病毒为5型腺病毒载体(Ad5);所述黑猩猩源腺病毒载体为ChAd68。
9.如权利要求7所述的重组载体,其特征在于,所述腺病毒载体为复制缺陷型腺病毒载体;所述腺病毒载体的E1区被删除或功能性缺失从而形成复制缺陷型载体;或E1区和E3区均被删除或功能性缺失;所述黑猩猩源腺病毒载体自身的E4区进一步被人5型腺病毒相应的E4区取代以增强载体的功能。
10.如权利要求5所述的重组载体,其特征在于,当所述基于gE的重组载体携带编码基于gE的融合蛋白的核酸分子时被称为重组腺病毒载体B,所述重组腺病毒载体B携带如SEQID NO:20-26任一所示的核酸分子。
11.如权利要求10所述的重组载体,其特征在于,构建所述的重组腺病毒载体B所用的骨架质粒为pAd5-CMV/V5-DEST,构建所述的重组腺病毒载体B所用的穿梭质粒为pDONR221;构建所述的重组腺病毒载体B所用的宿主细胞系包括但不限于HEK 293或PER.C6细胞系;所述的重组腺病毒载体B由下述方法构建:将测序正确的重组穿梭质粒pDONR221-gE-鞭毛素融合蛋白基因-PolyA转化与病毒骨架质粒pAd5-CMV/V5-DEST进行同源重组,将重组混合物转化至大肠杆菌TOP10感受态细胞,筛选测序正确的腺病毒载体pAd5-CMV-gE-鞭毛素融合蛋白基因-PolyA,将腺病毒载体pAd5-CMV-gE-鞭毛素融合蛋白基因-PolyA线性化后转染HEK 293或PER.C6细胞进行包装得到重组腺病毒载体B。
12.如权利要求1-4任一项所述的免疫组合物或权利要求5-11任一项所述的重组载体在制备水痘疫苗或带状疱疹疫苗,或用于制备治疗带状疱疹或其愈后神经痛的药物中的应用。
13.一种联合疫苗,其特征在于,至少包含如权利要求1-4任一项所述的免疫组合物或权利要求5-11任一项所述的重组载体和其他疫苗,所述其它疫苗包含:流行性腮腺炎、麻疹和风疹疫苗。
14.一种制备如权利要求1-4任一项中所述的基于gE的融合蛋白的方法,其特征在于,通过真核表达系统来制备;所述真核表达为Vero细胞表达,基于gE的融合蛋白通过将如权利要求10或11中所描述的重组腺病毒载体B感染培养Vero细胞获得。
CN201980063806.6A 2018-09-27 2019-09-12 免疫组合物及其制备方法与应用 Active CN113164586B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201811131501 2018-09-27
CN2018111315018 2018-09-27
CN201910571839 2019-06-28
CN2019105718393 2019-06-28
PCT/CN2019/105716 WO2020063370A2 (zh) 2018-09-27 2019-09-12 免疫组合物及其制备方法与应用

Publications (2)

Publication Number Publication Date
CN113164586A CN113164586A (zh) 2021-07-23
CN113164586B true CN113164586B (zh) 2024-04-16

Family

ID=69953299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980063806.6A Active CN113164586B (zh) 2018-09-27 2019-09-12 免疫组合物及其制备方法与应用

Country Status (6)

Country Link
US (1) US20210290759A1 (zh)
EP (1) EP3868399A4 (zh)
CN (1) CN113164586B (zh)
AU (1) AU2019349036A1 (zh)
CA (1) CA3114658A1 (zh)
WO (1) WO2020063370A2 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112142828B (zh) * 2019-06-28 2022-02-01 怡道生物科技(苏州)有限公司 一种gE基因及表达该基因的载体
CN110343722A (zh) * 2019-07-03 2019-10-18 上海大学 一种重组表达水痘-带状疱疹病毒v-Oka株截短型糖蛋白E的方法
CN112552380B (zh) * 2020-12-10 2021-12-24 武汉博沃生物科技有限公司 一种SARS-CoV-2病毒的免疫原及其应用
TWI782542B (zh) * 2021-05-25 2022-11-01 國立屏東科技大學 一種鞭毛蛋白的重組蛋白及其用途
CN114163503B (zh) * 2021-12-15 2023-11-24 北京交通大学 两种表达水痘-带状疱疹病毒的gE蛋白的重组腺病毒及应用
CN116350770A (zh) * 2021-12-28 2023-06-30 成都迈科康生物科技有限公司 一种带状疱疹疫苗制剂及其制备方法
WO2023179588A1 (zh) * 2022-03-21 2023-09-28 厦门大学 截短的水痘-带状疱疹病毒囊膜糖蛋白gE
CN116023510B (zh) * 2022-12-01 2023-09-22 北京吉诺卫生物科技有限公司 双佐剂重组带状疱疹疫苗
CN117003894B (zh) * 2023-08-09 2024-04-16 成都新诺明生物科技有限公司 一种含有IL-2和Fc的gE融合蛋白及其制备方法和应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101189254A (zh) * 2005-03-03 2008-05-28 葛兰素史密丝克莱恩生物有限公司 疫苗
CN103827131A (zh) * 2011-01-31 2014-05-28 宾夕法尼亚大学托管会 编码新型疱疹抗原的核酸分子、包含所述核酸分子的疫苗及其使用方法
CN105906721A (zh) * 2016-06-21 2016-08-31 芜湖天明生物技术有限公司 一种水痘-带状疱疹病毒gB-gE-gH-gL融合蛋白、基因工程亚单位疫苗及制备方法
CN107022559A (zh) * 2016-12-08 2017-08-08 长春祈健生物制品有限公司 一种水痘‑带状疱疹病毒糖蛋白e胞外区蛋白的制备方法
WO2018124615A1 (ko) * 2016-12-26 2018-07-05 재단법인 목암생명과학연구소 대상포진 백신 조성물
CN108727503A (zh) * 2017-04-18 2018-11-02 武汉博沃生物科技有限公司 VZV重组gE-鞭毛素融合蛋白及其制备方法和应用

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2391975T3 (es) * 2003-07-25 2012-12-03 Genvec, Inc. Vacunas a base de vector adenovírico
JP5756750B2 (ja) 2008-06-25 2015-07-29 インセルム(インスティチュート ナショナル ドゥ ラ サンテ エ ドゥ ラ ルシェルシュ メディカル) フラジェリンに基づく新規の免疫アジュバント化合物及びその使用
CN102002098B (zh) 2009-11-27 2013-07-24 中国科学院武汉病毒研究所 一种改造的鞭毛素蛋白及其制备方法和应用
US9683020B2 (en) * 2011-08-01 2017-06-20 Emory University VLPS containing ligands and methods related thereto
CN102488898B (zh) * 2011-12-23 2014-06-04 中国科学院武汉病毒研究所 龋齿疫苗及制备方法
CN102816246B (zh) * 2012-09-04 2014-07-23 成都蓉生药业有限责任公司 一种人巨细胞病毒免疫原融合蛋白及其制备方法和用途
CN103861101B (zh) * 2014-03-12 2016-04-27 中国药科大学 一种幽门螺杆菌多表位疫苗的新型嵌合鞭毛蛋白佐剂
JP2017537650A (ja) * 2014-10-09 2017-12-21 ライポテック・ピーティーワイ・リミテッド キメラタンパク質
KR101723605B1 (ko) * 2014-10-21 2017-04-07 진원생명과학 주식회사 대상포진 예방 및 치료용 dna 백신 조성물 및 이를 이용한 vzv 항원에 대한 t세포 활성화 방법
JP6367783B2 (ja) * 2015-11-26 2018-08-01 田中貴金属工業株式会社 水痘帯状疱疹ウイルス検出用免疫クロマト分析装置
WO2018097642A1 (ko) * 2016-11-25 2018-05-31 재단법인 목암생명과학연구소 바리셀라 조스터 바이러스 백신

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101189254A (zh) * 2005-03-03 2008-05-28 葛兰素史密丝克莱恩生物有限公司 疫苗
CN103827131A (zh) * 2011-01-31 2014-05-28 宾夕法尼亚大学托管会 编码新型疱疹抗原的核酸分子、包含所述核酸分子的疫苗及其使用方法
CN105906721A (zh) * 2016-06-21 2016-08-31 芜湖天明生物技术有限公司 一种水痘-带状疱疹病毒gB-gE-gH-gL融合蛋白、基因工程亚单位疫苗及制备方法
CN107022559A (zh) * 2016-12-08 2017-08-08 长春祈健生物制品有限公司 一种水痘‑带状疱疹病毒糖蛋白e胞外区蛋白的制备方法
WO2018124615A1 (ko) * 2016-12-26 2018-07-05 재단법인 목암생명과학연구소 대상포진 백신 조성물
CN108727503A (zh) * 2017-04-18 2018-11-02 武汉博沃生物科技有限公司 VZV重组gE-鞭毛素融合蛋白及其制备方法和应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Cell-mediated immune responses to a varicella-zoster virus glycoprotein E vaccine using both a TLR agonist and QS21 in mice;Najoua Dendouga等;《Vaccine》;第30卷(第20期);第3126-3135页 *
水痘—带状疱疹病毒糖蛋白E DNA疫苗的免疫原性研究;李福民;《中国优秀博士学位论文全文数据库医药卫生科技辑》(第2期);E059-30 *
水痘-带状疱疹病毒糖蛋白E真核表达载体的构建与鉴定;瘳勇梅等;《泸州医学院学报》(第4期);第307-309页 *

Also Published As

Publication number Publication date
WO2020063370A3 (zh) 2020-05-22
WO2020063370A2 (zh) 2020-04-02
CA3114658A1 (en) 2020-04-02
WO2020063370A4 (zh) 2020-06-25
US20210290759A1 (en) 2021-09-23
CN113164586A (zh) 2021-07-23
EP3868399A2 (en) 2021-08-25
EP3868399A4 (en) 2022-07-20
AU2019349036A1 (en) 2021-06-03
AU2019349036A8 (en) 2021-06-24

Similar Documents

Publication Publication Date Title
CN113164586B (zh) 免疫组合物及其制备方法与应用
CN111088283B (zh) mVSV病毒载体及其病毒载体疫苗、一种基于mVSV介导的新冠肺炎疫苗
AU2017204292B2 (en) Simian adenovirus nucleic acid- and amino acid-sequences, vectors containing same, and uses thereof
CN105792842B (zh) 埃巴病毒疫苗
CN107921115B (zh) 新颖杆状病毒载体及使用方法
CA2774640C (en) Virus like particles comprising target proteins fused to plant viral coat proteins
CN106232813B (zh) 预防减蛋综合征(eds)的疫苗
AU2007338383A1 (en) RSV F-protein and use thereof
AU2007219571A1 (en) Chimeric vaccine antigens against the avian influenza virus
CN113666990A (zh) 一种诱导广谱抗冠状病毒的t细胞疫苗免疫原及其应用
WO2023138334A1 (zh) 一种重组新型冠状病毒蛋白疫苗、其制备方法和应用
CN113151184A (zh) 基于细胞膜展示冠状病毒免疫原以诱导中和抗体的方法
US10117923B2 (en) Production of an immunogen using a plant virus
WO2022135563A1 (zh) 同时诱导抗多种病毒的免疫应答的方法
TW202206598A (zh) 對抗SARS-CoV-2之疫苗及其製品
CN108503696B (zh) 一种酵母细胞表达的寨卡病毒亚单位疫苗
RU2691302C1 (ru) Иммуногенная композиция на основе рекомбинантных псевдоаденовирусных частиц, а также на основе белковых антигенов и способ получения иммуногенной композиции
Toussaint et al. Genetic immunisation of cattle against bovine herpesvirus 1: glycoprotein gD confers higher protection than glycoprotein gC or tegument protein VP8
CN114437236B (zh) 一种重组非洲猪瘟病毒多表位融合蛋白、制备及其应用
WO2023023940A1 (zh) 一种诱导广谱抗冠状病毒的t细胞疫苗免疫原及其应用
CN116041534A (zh) 新型冠状病毒免疫原性物质、其制备方法和应用
CN113801206A (zh) 利用受体识别域诱导抗新冠病毒中和抗体的方法
CN115322247A (zh) 一种新型冠状病毒受体结合区电荷突变体抗原及应用
CN115975042B (zh) 一种β冠状病毒异源多聚体抗原、其制备方法和应用
WO2024008014A1 (zh) 抗SARS-CoV-2或其突变体感染的药物组合物及其联合用药物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 430075 bowo biological building, biomedical industrial park, 858 Gaoxin Avenue, Wuhan City, Hubei Province

Applicant after: BRAVOVAX Co.,Ltd.

Address before: 430075 Liang Jin, bowo biological building, biomedical industrial park, 858 Gaoxin Avenue, Wuhan City, Hubei Province

Applicant before: BRAVOVAX Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant