CN103936840B - 重组的人乳头瘤病毒33型l1蛋白及其用途 - Google Patents

重组的人乳头瘤病毒33型l1蛋白及其用途 Download PDF

Info

Publication number
CN103936840B
CN103936840B CN201410021940.9A CN201410021940A CN103936840B CN 103936840 B CN103936840 B CN 103936840B CN 201410021940 A CN201410021940 A CN 201410021940A CN 103936840 B CN103936840 B CN 103936840B
Authority
CN
China
Prior art keywords
gly
leu
thr
lys
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410021940.9A
Other languages
English (en)
Other versions
CN103936840A (zh
Inventor
刘永江
陈小江
陈林
盖大海
许铮
曹科
陈建平
潘勇昭
银飞
阮芳勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING HEALTH GUARD BIOTECHNOLOGY Co Ltd
Original Assignee
BEIJING HEALTH GUARD BIOTECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING HEALTH GUARD BIOTECHNOLOGY Co Ltd filed Critical BEIJING HEALTH GUARD BIOTECHNOLOGY Co Ltd
Priority to CN201410021940.9A priority Critical patent/CN103936840B/zh
Publication of CN103936840A publication Critical patent/CN103936840A/zh
Application granted granted Critical
Publication of CN103936840B publication Critical patent/CN103936840B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/20011Papillomaviridae
    • C12N2710/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/20011Papillomaviridae
    • C12N2710/20033Use of viral protein as therapeutic agent other than vaccine, e.g. apoptosis inducing or anti-inflammatory
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/20011Papillomaviridae
    • C12N2710/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Abstract

本发明提供一种新的编码重组的HPV33 L1蛋白的多核苷酸基因片段、包含该基因片段的载体、包括载体的宿主细胞,以及由该基因片段翻译表达的HPV33 L1蛋白五聚体和由该五聚体组成的抗HPV33型感染的疫苗。

Description

重组的人乳头瘤病毒33型L1蛋白及其用途
技术领域
本发明涉及人类乳头状瘤病毒感染的预防和/或治疗。更具体而言,本发明涉及一种重组的人乳头瘤病毒33型L1蛋白,及由其组成的五聚体,含该蛋白的疫苗及其在预防HPV33型病毒感染,特别是在预防HPV33型病毒感染引起的宫颈癌疾病中的用途。
背景技术
人类乳头状瘤病毒(Human Papillomavirus,简称HPV)是通过密切接触而传播的DNA病毒。在人体组织中,HPV主要感染皮肤和黏膜组织。HPV DNA按病毒致癌能力的大小分为三类:(1)低危型HPV,包括HPV6,11,40,42,43,44,54,61,70.72.51,主要引起良性外生性疣,宫颈上皮内瘤变(cervical intraepithelial neoplasm,CIN)(2)高危型HPV,包括HPV16,18,31,33,35,39,43,51,52,56,58,59,68,73,82,主要引起宫颈上皮内中、高度瘤变(CINII、CTNIII)和宫颈浸润型鳞癌.最常见的是HPV 16、18。(3)可能致癌型,包括HPV 26,53,66(Munoz N,Bosch Fx,Sanjose S,et a1.Epidemiologie classification of humanpapilloma virus types associated with cervical cancer[J].N Engl J Med,2003,348:8)。宫颈癌是女性第二大恶性肿瘤,每年全球的发病大概在54万(2013年),约有24万例死亡,幸运的是,宫颈癌是唯一研制出疫苗的癌症。2006 年6月8日,美国食品与药品管理局(FDA)正式批准美国Merck公司(即默沙东公司)生产的 Gardasil HPV 预防性疫苗上市;它是由酿酒酵母表达并纯化的HPV16/18/6/11 L1 VLP 四价宫颈癌预防性疫苗,被批准用于预防 6~ 26岁女孩和妇女 HPV16、18、6、11型感染所引起的宫颈癌、癌前病变和生殖器疣,这是FDA通过的世界上第一个肿瘤疫苗(Villa, Costa et al. 2005, Villa, Ault etal. 2006, Bryan 2007, Olsson, Villa et al. 2007, Goldstone and Vuocolo 2012)。随后英国葛兰素史克(GSK)公司生产的商品名为Cervarix的 HPV 预防性疫苗也成功上市,它是由来源于昆虫表达系统的 HPV16/18 L1 VLP 二价宫颈癌预防性疫苗。但这两种预防性疫苗价格昂贵,极大限制了在发展中国家和落后地区的使用,因此开发一种低成本的高效价HPV疫苗就显得尤为重要(Jansen and Shaw 2004, Buonaguro, Tornesello et al.2009, Campo and Roden 2010, Frazer, Leggatt et al. 2011, Hariri, Dunne et al.2011, Lehtinen and Dillner 2013, Shaw 2013)。
HPV属乳头多瘤空泡病毒科(Papovaviridae)乳头瘤病毒属,为无包膜DNA病毒。病毒基因组为双链闭环DNA,大小约为7.2~8kb,具有8个开放框。基因组按功能的不同可以分为三个区域:早期区(E),约4. 5kb,编码E1、E2、E4~E7共6个与病毒复制,转录及转化有关的非结构蛋白;晚期区(L),约2. 5kb,编码主要衣壳蛋白L1和次要衣壳蛋白L2;长调控区(LCR),位于L区末端与E区起始端之间,长约800~900bp,不编码任何蛋白,含DNA复制、表达调控元件。
HPV病毒颗粒直径为55~60nm,核衣壳呈20面体对称,由72个主要衣壳蛋白L1的五聚体及次要衣壳蛋白L2组成。大量研究证实,HPV L1蛋白是HPV疫苗的主要靶蛋白。在多种表达系统中表达的HPV L1蛋白无需L2蛋白辅助即可形成在形态结构与天然病毒颗粒相似的类病毒颗粒(Virus-L1keParticle,VLP)。重组HPV L1-VLP疫苗已经成功上市并用于预防HPV感染及由此导致的宫颈癌、尖锐湿疣等疾病,并充分证明了L1-VLP具有与野生同型病毒相同的抗原性和免疫原性。从组成VLP的三级结构看,其抗原决定簇均分布于组成VLP的基本结构单元五聚体的表面(Xiaojiang S. Chen,Robert L. Garcea, Ilya Goldberg ,Gregory Casini and Stephen C.(2000) . HarrisonStructure of Small Virus-likeParticles Assembled from the L1 Protein of Human Papillomavirus 16.MolecularCell, Vol. 5, 557–567.Brooke Bishop, Jhimli Dasgupta, Michael Klein, RobertL. Garcea, Neil D. Christensen, Rui Zhaoand Xiaojiang S. Chen.(2007). CrystalStructures of Four Types of Human Papillomavirus L1 Capsid Proteins. THEJOURNAL OF BIOLOGICAL CHEMISTRY VOL. 282, NO. 43, pp. 31803–31811),说明HPVL1-VLP的抗原性和免疫原性来源于或取决于L1组成的五聚体。因此,重组L1蛋白五聚体与VLP一样具备完整的抗原表位,也可以作为抗原用来制备疫苗。
HPV疫苗研制的关键是能够大量高效制备HPV L1蛋白。目前较为常用的表达系统可以分为真核表达系统及原核表达系统。常用的真核表达系统有痘病毒表达系统、昆虫杆状病毒表达系统、酵母表达系统。在真核表达系统中所表达的HPV L1蛋白天然构象破坏少,能自发的形成VLP,往往只需进行简单的纯化即可获得VLP。但是由于真核表达系统的表达量低,培养成本高,给大规模工业化生产带来了极大困难。原核表达系统中利用大肠杆菌表达系统表达HPVL1 蛋白已有报道。但是由于大肠杆菌所表达的HPV L1蛋白大多失去其天然构象,不能产生针对HPV 的保护抗体。或者上述蛋白虽然通过包含体纯化,复性等步骤也可得到HPV VLP,但是在复性过程中蛋白损失量大,得率低,难以在大规模生产上应用。HPV L1全长序列蛋白虽然也可以在大肠杆菌中以正确构象可溶性地表达,溶解于菌体的裂解上清中,但是表达量较低,而且上清中杂蛋白种类多且量大,要从中纯化出目的蛋白难度相当大,依然无法应用于大规模生产。
因此,本领域仍然需要成本低、纯度高、产量高、效果好的HPV L1蛋白生产技术和大规模工业化生产预防宫颈癌疫苗的新方法。
发明内容
本发明的目的是提供一种新的HPV33 L1蛋白,及由其组成的五聚体蛋白颗粒及含该五聚体蛋白颗粒的疫苗。
本发明涉及提供一种新的编码重组的HPV33 L1蛋白的多核苷酸基因片段、包含该基因片段的载体、包括载体的宿主细胞,以及由该基因片段翻译表达的HPV33 L1蛋白五聚体和由该五聚体组成的抗HPV33型感染的疫苗。
本发明公开了一种重组的HPV33 L1蛋白的氨基酸序列,所述蛋白的氨基酸序列在N端8-15个氨基酸全部或任意部分被2-10个氨基酸序列所取代,其氨基酸序列由G、S、A三者的任一组合方式;H4结构域被2-10个氨基酸序列取代,其氨基酸序列由G、S、A三者的任一组合方式。
本发明涉及的HPV33 L1蛋白,进一步是其氨基酸序列C端截短0个、1个、2个至21个氨基酸。
本发明所述的HPV33 L1蛋白,优选的被其氨基酸序列N端前8-15个氨基酸被GSGGG、ASASG或GSGAG取代,H4结构域优选的被GGGSG或GAGAS取代。
如实施例所述的HPV33 L1蛋白,优选其氨基酸序列在N端前8、10、12或15个氨基酸优选被GSGGG或ASASG氨基酸序列取代。C端优选截短10-21个氨基酸,更优选截短10个、21个氨基酸。
如实施例所述的HPV33 L1蛋白,其序列包含序列SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、 SEQ ID NO:8或SEQ ID NO:10。
本发明公开一种编码蛋白的多核苷酸序列。本发明公开一种包含多核苷酸序列的基因的表达载体。本发明公开一种包含表达载体的细胞。
本发明公开一种HPV33 L1蛋白五聚体,该蛋白五聚体由五个HPV33 L1蛋白单体形成。
本发明公开一种HPV 疫苗,该疫苗包括HPV33 L1 蛋白五聚体和药用佐剂。
本发明公开一种HPV疫苗的制备方法,该方法为:
A.克隆或合成重组HPV33 L1蛋白的基因片段;
B.在大肠杆菌或酵母表达系统中表达重组的HPV33 L1蛋白;
C.纯化由HPV33 L1蛋白组成的五聚体;
D.HPV33 L1蛋白五聚体加入药用佐剂制成疫苗。
上述方法中步骤C的纯化优选利用亲和层析色谱纯化HPV33 L1融合标签蛋白。
本发明公开HPV疫苗在制备预防和包括HPV33感染及导致疾病的药物中的应用。
本发明第一方面提供一种编码重组HPV33 L1蛋白的多核苷酸基因片段。
本发明第二方面提供了一种构建的表达载体,其包含本发明第一方面的编码重组HPV33 L1蛋白的多核苷酸基因片段。所述载体适合驱动异源DNA在细菌、昆虫或哺乳动物细胞中翻译表达HPV33 L1蛋白。在一个实施方案中,所述表达载体优选pGEX-6p-1或pGEX-4T-2。
本发明的第三方面提供了一种构建的工程菌细胞,该细胞包含本发明第一方面的多核苷酸基因片段,或第二方面的表达载体。所述的工程菌宿主细胞可以是细菌细胞,例如大肠杆菌,可以是真核细胞,例如酵母细胞,或者是昆虫细胞。
本发明第四方面提供了一种药用组合物,其包含采用本发明技术生产的表达产物HPV33 L1五聚体蛋白、赋形剂或载体。
本发明同时提供了制备上述编码重组HPV33 L1蛋白的多核苷酸序列、表达载体构建、工程菌细胞转化和药用组合物的方法。
本发明获得HPV33 L1蛋白的方法,其包括在表达系统中表达重组的HPV33 L1蛋白及其五聚体,然后将含有该重组蛋白的裂解上清进行纯化处理。具体获得HPV33 L1蛋白五聚体的方法包括:
1.从临床样本中克隆或人工合成编码HPV33 L1全长蛋白基因或截短蛋白基因的片段。
2.在大肠杆菌或酵母表达系统中表达重组的L1蛋白。
3.纯化HPV33 L1重组蛋白。
在一个实施方案中,获得重组HPV33 L1蛋白的优选方法包括:
1.N端1-15个氨基酸全部或任意部分被GSGGG取代、H4结构域被GGGSG序列取代的HPV33 L1重组蛋白。
2.在大肠杆菌或酵母表达系统中表达重组的L1蛋白。
3.纯化HPV33 L1重组蛋白。
在优选的实施例1方案中N端截短8个氨基酸被GSGGG取代,H4结构域被GGGSG序列取代,同时C端截短21个氨基酸,SEQ ID NO:2。
在一个优选的实施例2方案中N端截短8个氨基酸被GSGGG取代,H4结构域被GGGSG序列取代,同时C端截短10个氨基酸,SEQ ID NO:4。
在一个优选的实施例3方案中N端截短15个氨基酸被GSGAG取代,H4结构域被GAGSG序列取代,同时C端截短10个氨基酸,SEQ ID NO:6。
在一个优选的实施例4方案中N端截短15个氨基酸被ASASG取代,H4结构域被GGGSG序列取代,同时C端截短21个氨基酸,SEQ ID NO:8。
在一个优选的实施例5方案中N端截短8个氨基酸被GSGGG取代,H4结构域被GGGSG序列取代,同时C端保留不截短,SEQ ID NO:10。
在对比的实施例6方案中N端前8个氨基酸被GSGGG取代,H4结构域不取代,C端保留不截短。
本发明另提供了本发明药用组合物在制备预防或治疗HPV33型感染及导致疾病药物中的应用。
本发明还涉及一种预防宫颈癌或HPV感染的疫苗,其包含本发明重组的HPV33 L1五聚体,或者由五聚体组成的多聚体,包括1、2、 3、 4、 5……200个五聚体。优选该疫苗还包含至少一种选自HPV6 L1五聚体,HPV11 L1五聚体HPV16 L1五聚体,HPV18 L1五聚体,HPV31 L1五聚体,HPV35 L1五聚体,HPV45 L1五聚体,HPV52 L1五聚体,HPV58 L1五聚体,以及由上述五聚体任意组合组成的二价、三价、四价、五价、六价、七价、八价、九价或十价疫苗。该疫苗通常还包含疫苗用赋形剂或载体。
优选地,所述疫苗每剂含有本发明重组的HPV33 L1蛋白的量为1μg-200μg,优选5μg-50μg。所述疫苗含有本发明重组的HPV33 L1与HPV6 L1按照0.5-2:1比例组成的疫苗,重组的HPV33 L1与HPV11 L1按照0.5-2:1比例组成的疫苗,重组的HPV33 L1与HPV16 L1按照0.5-2:1比例组成的疫苗,重组的HPV33 L1与HPV18 L1按照0.5-2:1比例组成的疫苗,重组的HPV33 L1与HPV31 L1按照0.5-2:1比例组成的疫苗,重组的HPV33 L1与HPV35 L1按照0.5-2:1比例组成的疫苗, 重组的HPV33 L1与HPV45 L1按照0.5-2:1比例组成的疫苗, 重组的HPV33 L1与HPV52 L1按照0.5-2:1比例组成的疫苗, 重组的HPV33 L1与HPV58 L1按照0.5-2:1比例组成的疫苗,以及由重组的HPV33 L1五聚体与上述各型HPV L1五聚体按0.5-2:1比例组成的二价、三价、四价、五价、六价、七价、八价、九价或十价疫苗。
本发明还涉及一种制备用于预防宫颈癌或HPV感染疫苗的方法,其包含本发明重组的HPV33 L1五聚体,或者由该五聚体组成的多聚体,或与任选的一种或多种选自HPV33,6,11,16,18,31,35,45,52,和58的HPV型别的五聚体或多聚体与载体或者赋形剂混合制备成疫苗。
本发明进一步涉及包含本发明重组的HPV33 L1五聚体,或者由五聚体组成的多聚体在制备用于预防宫颈癌或HPV33感染疫苗中的用途。
本发明中相关术语的说明及解释
根据本发明,术语“大肠杆菌表达系统”是指由大肠杆菌(菌株)与表达载体组成,其中大肠杆菌(菌株)来源于市场上可得到的,在此举例但不限于:GI698,ER2566,BL21(DE3),B834 (DE3),BLR (DE3)等。
根据本发明,术语“载体”一词指的是,可将某编码蛋白的多核苷酸插入其中并使蛋白获得表达的一种核酸运载工具。载体可以通过转化,转导或者转染宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。举例来说,载体包括:质粒,噬菌体,柯斯质粒等。
根据本发明,术语“疫苗用赋形剂或载体”是指选自一种或多种,包括但不限于:pH调节剂,表面活性剂,佐剂,离子强度增强剂。例如,pH调节剂举例但不限于磷酸盐缓冲液,表面活性剂包括阳离子,阴离子或者非离子型表面活性剂。举例但不限于:Tween-80。佐剂举例但不限于氢氧化铝,磷酸铝、无定型羟基磷酸硫酸铝,氟氏完全佐剂。离子强度增强剂举例但不限于氯化钠。
根据本发明,术语“色谱层析”包括但不限于:离子交换色谱、疏水相互作用色谱、吸附层析法(例如羟基磷灰石色谱)、凝胶过滤(凝胶排阻)层析、亲和层析法。
根据本发明,术语“HPV33 L1 H4结构域”是指HPV33 L1 氨基酸序列中“FGLTPPPSASLQDTYRFV
TSQAITCQKT VPPK”,在Genebank登录号为AEI61253的L1序列中第403位氨基酸至434位,或其它HPV33 L1序列中与之对应的氨基酸位置。
根据本发明,在本发明获得的重组HPV33 L1蛋白的方法中,缓冲液是指可在一定范围内维持pH值稳定的溶液,包括但不限于,Tris缓冲液,磷酸盐缓冲液,HEPES缓冲液,MOPS缓冲液等等。
根据本发明,所述原核宿主细胞破碎包括但不限于通过匀浆器破碎、均质机破碎、超声波处理、研磨、高压挤压、溶菌酶处理中的一项或者多项方法来实现;
根据本发明,在本发明获得的重组HPV33 L1蛋白的方法中,所用的盐包括但不限于是中性盐,特别是碱金属盐、铵盐、盐酸盐、硫酸盐,硫酸盐,碳酸氢盐,磷酸盐或磷酸氢盐,特别是NaCI、KCI、NH4CI、(NH4) 2S04中的一种或几种。优选NaCI。所用的还原剂包括但不限于DTT,2-巯基乙醇。所用量包括但不限于lOmM-lOOmM。
根据本发明,所述的疫苗可采用患者可接受的形式,包括但不限于注射或鼻腔或口腔吸入或者阴道给药,优选注射剂。
根据本发明,术语“价”是指组成疫苗的组分所包含的基因型的数量。举例来说HPV16和18型抗原组成的疫苗称为“二价”疫苗。
本发明人经研究发现,经过对HPV33 L1蛋白N端、C端和H4区域的基因重组,再利用大肠杆菌表达系统进行表达即可获得大量的重组GST-HPV33 L1五聚体融合蛋白,该GST-HPV33 L1五聚体蛋白经亲和层析纯化后可得到高产率的HPV33 L1五聚体蛋白,纯度至少85%以上。进一步纯化后的HPV33 L1五聚体蛋白可达到98%以上的纯度并可诱导针对HPV33保护性抗体。本发明基于以上发明现已完成,为大规模工业化生产预防宫颈癌的疫苗提供了一种新方法。
本发明中在N端增加GSGGG或GSGAG,并且与GST蛋白相融合,可大大提高L1蛋白的可溶性,以及提高酶切效率,降低纯化成本,同时利用蛋白酶酶解方法切除GST蛋白,去除了外源杂质的引入;用GSGGG或GAGAS取代H4结构域,可以阻止L1五聚体蛋白进一步聚合,从而得到均一、稳定的五聚体蛋白,例如通过实施例12的实验,发现不同氨基酸序列组成的蛋白产物稳定性不同。其中序列H4结构域经过取代的蛋白产物与H4结构域未经取代的蛋白产物相比更稳定;C端截短氨基酸能够有效避免C端降解、减少由于蛋白降解而导致的产物不纯,从而影响五聚体蛋白疫苗的稳定性。
本发明序列对H4结构域改造所得的HPV33 L1蛋白只能形成五聚体,而且此五聚体具有良好的免疫原性,可以诱导高滴度的针对HPV33的中和抗体,预防HPV33对人体的感染,是一种良好的疫苗形式。在参考下列详述和附图后,本发明的这些和其它方面的有益效果将是显然的。此处公开的所有参考文献在此均完整引用作为参考。
附图说明
图1实施例制备的HPV33 L1五聚体透射电镜观察(100,000倍)结果;结果显示,视野中可见直径为13nm左右的五聚体,颗粒大小与理论大小相符,均匀一致。
图2-A 按照实施例1制备的五聚体的动态光散射观测结果,结果显示五聚体的粒径与粒度分布图。
图2-B按照实施例6制备的 HPV33 L1五聚体的动态光散射观测结果,结果显示五聚体的粒径与粒度分布图。
图3 实施例1 HPV33 L1五聚体蛋白的高压液相分子筛色谱图,图中显示经高度纯化的五聚体蛋白纯度。
图4 实施例制备的HPV33 L1五聚体疫苗接种小鼠后,在第二次加强免疫3周后,检测中和抗体的平均滴度水平。
下面结合实施例对本发明进一步举例描述。这些实施例是非限制性的。
实施例l:具有HPV33 L1序列2的工程菌的构建
1、HPV33 L1基因全长由金唯智生物科技有限公司(GENEWIZ)合成,其核苷酸序列SEQ ID NO:1,其源自GeneBank,序列号为GenBank: M14119.1。
2、含有SEQ ID NO:1基因片段做PCR反应的模板。以正向引物序列:5’- CGCGGATCCGGA GAAAAGGAAGACCCCTTAGGT -3’;在H4结构的5’端引入限制性内切酶AccIII位点,AccIII位点序列为TCCGGA。下游包含XhoI内切酶位点,反向引物序列:5’-GCTCTCCTCGAGTTA TTTAGGTTTT GCTTTAAGAC C-3’, 其5’端引入限制性内切酶XhoI位点,XhoI位点序列为CTCGAG。经PCR反应扩增得到HPV33B。
3、含有SEQ ID NO:1基因片段做PCR反应的模板。以含有引入的限制性内切酶BamHI位点,BamH I位点序列为GGATCC,正向引物序列:5’-CGCGGAGGATCC GGA GGA GGAGCCACAGTGTACCTGCCTCCTG -3’;在H4结构的3’端引入限制性内切酶AccIII位点,AccIII位点序列为TCCGGA,反向引物序列:GCTCTCTCCGGA TCC TCC TCC TTGCCAATCT TCTAAAATAT C;经PCR反应扩增扩增得到HPV33A。
4、HPV33A片段与HPV33B共同用限制性内切酶AccIII酶切,形成特异粘性末端,使用T4 DNA连接酶连接HPV33A和HPV33B片段,使之形成一个删除了H4结构域的、原H4结构域被编码连接多肽GGGSG的核苷碱基序列取代的HPV33C。
5、表达质粒pGEX-4T-2用BamH I和XhoI酶切消化,再用T4连接酶连接HPV33c和表达质粒。BamH I/XhoI酶切鉴定得到插入L1蛋白基因片段的阳性表达克隆pGEX-4T-2-HPV33C。利用M13(+)/(-)引物,测得质粒中插入的目的核苷酸序列正确,其编码的氨基酸序列为SEQ ID NO:2。
6、连接产物经电转化或CaCl2法将重组质粒转化至大肠杆菌中,优选转化大肠杆菌BL21宿主细胞。将转化的BL21细胞涂于含有氨苄青霉素的LB平板培养基上,经37℃培养,挑取单克隆菌落接种于LB液体培养基中37℃培养12 小时,从中取1ml菌液制备甘油管菌种于-70℃保存。
上述各步骤中PCR反应体系包含20μg DNA模板、lx PCR缓冲液、正向和反向特异引物(浓度均为0.2μΜ )、1.5mM镁离子、1.0 单位的 Taq DNA聚合酶;反应条件为:摄氏 95℃变性 5分钟,经 36个 PCR 循环放大,每一循环为 94℃ 30秒, 55℃ 30秒,72℃ 2分钟,反应产物在 72℃下温育10分钟,然后停止反应。
实施例2:具有HPV33 L1序列4的工程菌的构建
1、HPV33 L1基因全长的目标基因片断购自北京安贞医院妇科门诊含有野生型HPV33病毒的临床细胞样本废弃物,其核苷酸序列为SEQ ID NO:3(GenBank: FN870689.1)。
2、含有SEQ ID NO:3基因片段做PCR反应的模板。以正向引物序列:5’-CGCGGATCCGGA GAAAAGGAAGACCCCTTAGGT -3’;在H4结构的5’端引入限制性内切酶AccIII位点,AccIII位点序列为TCCGGA。下游包含XhoI内切酶位点,反向引物序列:5’-GCTCTCCTCGAGTTA TGTGCGGGTG GATGTGGGGG C-3’, 其5’端引入限制性内切酶XhoI位点,XhoI位点序列为CTCGAG。经PCR反应,扩增得到HPV33B。
3、含有SEQ ID NO:3基因片段做PCR反应的模板。以含有引入的限制性内切酶BamHI位点正向引物序列:5’-CGCGGAGGATCC GGA GGA GGA GCCACAGTGTACCTGCCTCCT-3’;在H4结构的3’端引入限制性内切酶AccIII位点,AccIII位点序列为TCCGGA,反向引物序列:GCTCTCTCCGGA TCC TCC TCC TTGCCAATCT TCTAAAATAT C ;经PCR反应,扩增得到HPV33A。
4、HPV33A片段与HPV33B共同用限制性内切酶AccIII酶切,形成特异粘性末端,使用T4 DNA连接酶连接HPV33A和HPV33B片段,使之形成一个删除了H4结构域的、原H4结构域被编码连接多肽GGGSG的核苷碱基序列取代的HPV33C。
5、表达质粒pGEX-4T-2用BamH I和XhoI酶切消化,再用T4连接酶连接HPV33c和表达质粒。BamH I/XhoI酶切鉴定得到插入L1蛋白基因片段的阳性表达克隆pGEX-4T-2-HPV33C。利用M13(+)/(-)引物,测得质粒中插入的目的核苷酸序列正确,其编码的氨基酸序列为SEQ ID NO:4。
6、连接产物经电转化或CaCl2法将重组质粒转化至大肠杆菌中,优选转化大肠杆菌BL21宿主细胞。将转化的BL21细胞涂于含有氨苄青霉素的LB平板培养基上,经37℃培养,挑取单克隆菌落接种于LB液体培养基中37℃培养12 小时,从中取1ml菌液制备甘油管菌种于-70℃保存。
上述各步骤中PCR反应体系包含20μg DNA模板、lx PCR缓冲液、正向和反向特异引物(浓度均为0.2μΜ )、1.5mM镁离子、1.0 单位的 Taq DNA聚合酶;反应条件为:摄氏 95℃变性 5分钟,经 36个 PCR 循环放大,每一循环为 94℃ 30秒, 55℃ 30秒,72℃ 2分钟,反应产物在 72℃下温育10分钟,然后停止反应。
实施例3:具有HPV33 L1序列6的工程菌的构建
1、HPV33 L1基因全长由金唯智生物科技有限公司(GENEWIZ)合成,其核苷酸序列SEQ ID NO:5,其源自GeneBank,序列号为GenBank: FN870694.1。
2、含有SEQ ID NO:3基因片段做PCR反应的模板。以正向引物序列:5’-CGCGGATCCGGA GAAAAGGAAGACCCCTTAGGT-3’;在H4结构的5’端引入限制性内切酶AccIII位点,AccIII位点序列为TCCGGA。下游包含XhoI内切酶位点,反向引物序列:5’-GCTCTCCTCGAGTTA TGTGCGGGTG GATGTGGGGG C-3’, 其5’端引入限制性内切酶XhoI位点,XhoI位点序列为CTCGAG。PCR反应,扩增得到HPV33B。
3、含有SEQ ID NO:3基因片段做PCR反应的模板。以含有引入的限制性内切酶BamHI位点正向引物序列:5’-CGCGGAGGATCC GGA GCC GGA GTACCTGTATCTAAAGTTGTC -3’;在H4结构的3’端引入限制性内切酶AccIII位点,AccIII位点序列为TCCGGA,反向引物序列:5’-GCTCTCTCCGGA TCC GGC TCC TTGCCAATCT TCTAAAATAT C -3’;经PCR反应,扩增得到HPV33A。
4、HPV33A片段与HPV33B共同用限制性内切酶AccIII酶切,形成特异粘性末端,使用T4 DNA连接酶连接HPV33A和HPV33B片段,使之形成一个删除了H4结构域的、原来的H4结构域被编码连接多肽GGGSG的核苷碱基序列取代的HPV33C。
5、表达质粒pGEX-4T-2用BamH I和XhoI酶切消化,再用T4连接酶连接HPV33c和表达质粒。BamH I/XhoI酶切鉴定得到插入L1蛋白基因片段的阳性表达克隆pGEX-4T-2-HPV33C。利用M13(+)/(-)引物,测得质粒中插入的目的核苷酸序列正确,其编码的氨基酸序列为SEQ ID NO:6。
其余操作步骤参照实施例1的方法。
实施例4:具有HPV33 L1序列8的工程菌的构建
1、HPV33 L1基因全长由金唯智生物科技有限公司(GENEWIZ)合成,其核苷酸序列SEQ ID NO:7,其源自GeneBank,序列号为GenBank: HE574702.1。
2、含有SEQ ID NO:7基因片段做PCR反应的模板。以正向引物序列:5’-CGCGGATCCGGA GAAAAGGAAGACCCCTTAGGT-3’;在H4结构的5’端引入限制性内切酶AccIII位点,AccIII位点序列为TCCGGA。下游包含XhoI内切酶位点,反向引物序列:5’-GCTCTCCTCGAGTTA TTTAGGTTTT GCTTTAAGAC C-3’, 其5’端引入限制性内切酶XhoI位点,XhoI位点序列为CTCGAG。经PCR反应,扩增得到HPV33B。
3、含有SEQ ID NO:7基因片段做PCR反应的模板。以含有引入的限制性内切酶NheI 位点正向引物序列:5’-CGCGGA GCTAGCGCC TCC GGA GTACCTGTATCTAAAGTTGTC -3’;在H4结构的3’端引入限制性内切酶AccIII位点,AccIII位点序列为TCCGGA,反向引物序列:5’-GCTCTCTCCGGA TCC TCC TCC TTGCCAATCT TCTAAAATAT C-3’;经PCR反应,扩增得到HPV33A。
4、HPV33A片段与HPV33B共同用限制性内切酶AccIII酶切,形成特异粘性末端,使用T4 DNA连接酶连接HPV33A和HPV33B片段,使之形成一个删除了H4结构域的、原来的H4结构域被编码连接多肽GGGSG的核苷碱基序列取代的HPV33C。
5、表达质粒pGEX-4T-2用BamH I和XhoI酶切消化,再用T4连接酶连接HPV33c和表达质粒。BamH I/XhoI酶切鉴定得到插入L1蛋白基因片段的阳性表达克隆pGEX-4T-2-HPV33C。利用M13(+)/(-)引物,测得质粒中插入的目的核苷酸序列正确,其编码的氨基酸序列为SEQ ID NO:8。
其余操作步骤参照实施例1的方法。
实施例5:具有HPV33 L1序列10的工程菌的构建
1、HPV33 L1基因全长由金唯智生物科技有限公司(GENEWIZ)合成,其核苷酸序列SEQ ID NO:9,其源自GeneBank,序列号为GenBank: AF335603.1。
2、含有SEQ ID NO:9基因片段做PCR反应的模板。以正向引物序列:5’-CGCGGATCCGGA GAAAAGGAAGACCCCTTGGGT-3’;在H4结构的5’端引入限制性内切酶AccIII位点,AccIII位点序列为TCCGGA。下游包含XhoI内切酶位点,反向引物序列:5’-GCTCTCCTCGAGTTA TTTTTTAACC TTTTTGCGTT T -3’, 其5’端引入限制性内切酶XhoI位点,XhoI位点序列为CTCGAG。经PCR反应,扩增得到HPV33B。
3、含有SEQ ID NO:9基因片段做PCR反应的模板。以含有引入的限制性内切酶BamHI位点正向引物序列:5’-CGCGGAGGATCC GGA GGA GGA GCCACAGTGTACCTGCCTCCT-3’;在H4结构的3’端引入限制性内切酶AccIII位点,AccIII位点序列为TCCGGA,反向引物序列:5’-GCTCTCTCCGGA TCC TCC TCC TTGCCAATCT TCTAAAATAT C -3’;经PCR反应,扩增得到HPV33A。
4、HPV33A片段与HPV33B共同用限制性内切酶AccIII酶切,形成特异粘性末端,使用T4 DNA连接酶连接HPV33A和HPV33B片段,使之形成一个删除了H4结构域的、原来的H4结构域被编码连接多肽GGGSG的核苷碱基序列取代的HPV33C。
5、表达质粒pGEX-4T-2用BamH I和XhoI酶切消化,再用T4连接酶连接HPV33c和表达质粒。BamH I/XhoI酶切鉴定得到插入L1蛋白基因片段的阳性表达克隆pGEX-4T-2-HPV33C。利用M13(+)/(-)引物,测得质粒中插入的目的核苷酸序列正确,其编码的氨基酸序列为SEQ ID NO:10。
其余操作步骤参照实施例1的方法。
实施例6:具有HPV33 L1序列11的工程菌的构建
以合成的含有SEQ ID NO: 1基因片段做PCR反应的模板,N端前8个氨基酸被GSGGG取代,C端不截短氨基酸,按照上述实施例1的方法PCR扩增,得到其目的氨基酸序列为SEQID NO:11。
实施例7:重组HPV33 L1蛋白的大量表达与纯化
蛋白表达:在-70℃中分别取出实施例1- 6的冻存菌种,平板活化,37℃培养14-20h,挑菌苔于80mL种子培养基中,37℃培养10-12h;然后接种于50L种子罐在37℃下培养10-12h;之后接种于500L发酵罐中,发酵培养、诱导表达;诱导表达结束后离心收集菌体。用pH7.4磷酸盐缓冲液重悬菌体,之后破碎,破碎方法可用但不限于:高压匀浆、超声波破碎或溶菌酶溶解等化学或物理手段。离心,获得上清液。可采用Lowry法检测总蛋白量,用Elisa法检测L1含量。
蛋白纯化:上清液可用但不限于盐析、等电点沉淀、离子交换层析、亲和层析、分子筛等分离纯化方法,得到纯度98%的HPV33 L1的五聚体。用电镜观察纯化产物,直径均为10nm左右的五聚体蛋白。
纯化方法具体步骤为将上清溶液中的L1蛋白经亲和色谱纯化:预装谷胱甘肽-琼脂糖树脂(GE公司生产的Glutathione Sepharose 4 B)色谱柱。取浓度为50%的Glutathione Sepharose 4 B树脂匀浆放入色谱柱中(每200ml蛋白清液需要5-10ml树脂匀浆)。用5-10倍的柱床体积的缓冲液A (组分为:50mmol/L的Tric-HCl,200mmol/L 的NaCl,1mmol/L 的EDTA,pH 8.0)洗涤树脂,然后将蛋白清液加入色谱柱中,与树脂混合均匀并在室温下作用20分钟后放出滤过液,用10倍柱床体积的缓冲液A洗涤树脂柱。将精确蛋白酶(Prescission Protease,简称PP酶)用缓冲液A稀释,上样并柱上循环酶切120min。放出酶切液,用适量的缓冲液A洗脱并收集目的蛋白。
离子交换色谱纯化:将上述收集的目的蛋白用Source Q或Mono Q(GE公司)阴离子交换柱进行离子交换层析,收集目的蛋白。
分子筛色谱纯化:将离子交换色谱收集的目的蛋白用分子量在10-600kDa的凝胶过滤介质进行分子筛层析,最终获得纯度大于98%的高纯度HPV33 L1五聚体蛋白。
实施例8:HPV33 L1 五聚体的形态学检测
将实施例1-6构建的工程菌株送上海生工公司测序,测得质粒中插入的目的DNA序列,其编码的氨基酸序列为SEQID NO:2、SEQID NO:4、SEQID NO:6、SEQID NO:8、SEQID NO:10 、SEQID NO:11所示,其中实施例1-5结果表明原来全长序列中H4结构域不复存在,取而代之的是编码连接多肽GGGSG或GAGSG序列的“GGA GGA GGA TCC GGA”或“GGA GCC GGA TCCGGA”核苷酸序列。
将实施例1-6方法获得的工程菌株采用实施例7的方法表达纯化得到的产物HPV33L1五聚体蛋白,透射电镜观察(100,000倍),结果显示,视野中可见直径为13nm左右的五聚体,颗粒大小与理论大小相符,均匀一致。其中实施1序列所得样品的电镜照片见附图1。
进行颗粒粒径测定。仪器为马尔文 Zetasizer NanoZS的动态光散射粒径仪,使用算法为Regulation算法。样品经0.22 u m滤膜过滤后进行测量,结果见表1。结果表明,六种五聚体平均粒径基本一致13.52-15.53nm,但分散性指数PdI(表明蛋白的均一性)存在显著差异,其中实施例1-5样品的分散性指数较小,说明样品很均一。实施例6样品的分散性指数较大,说明样品不均一。
表1 五聚体平均粒径和分散性指数
其中实施例1所制备的HPV33 L1五聚体颗粒的平均粒径为13.86nm,分散性指数PdI为0.063(具体见附图2-A); 实施例6所制备的HPV33 L1五聚体颗粒的水化分子动力学平均粒径为15.53nm,分散性指数PdI为0.136(具体见附图2-B)。
实施例9:蛋白原液纯度检测
色谱柱为TSK-GEL G3000 SWxl,或相同填料,分离范围10KDa-500 KDa的色谱柱;以pH6.8 的0.1mol/l磷酸盐缓冲液为流动相;流速为1ml/min;检测波长280nm;柱温25℃,上样量不得小于20ug,样品主峰理论塔板数不低于1000,拖尾因子小于2.0,连续进样5针,峰面积的相对标准偏差不得大于3%。
取实施例7所得的HPV蛋白原液,分别稀释浓度为1mg/ml,上样量20ul注入高压液相色谱仪,按照上述方法检测,按面积百分比计算纯度,结果见下表2及附图3(实施1所制备的HPV33 L1五聚体的分子筛层析色谱图),所有处理蛋白纯度均大于98%。
表2 纯化后蛋白原液的纯度
实施例10:含有HPV33 L1五聚体蛋白疫苗的制备
分别将实施例1-6制备后经实施例7步骤纯化的HPV33 L1五聚体蛋白原液用含有0.9% NaCl,pH7.2的硼酸缓冲盐稀释成100μg/ml的蛋白液,取1ml稀释后的蛋白液加入1ml50μg/ml氢氧化铝佐剂,充分混合吸附2小时,即获得50μg/ml的HPV33 L1五聚体蛋白疫苗,于4℃避光保存。
实施例11:HPV33 L1 五聚体疫苗的免疫原性测定
小鼠的免疫原性:将实施例10制备的HPV33 L1五聚体蛋白疫苗用疫苗稀释剂分别稀释成表1所示剂量,以每只0.5mL腹腔注射BALB/C小鼠,每个处理组10只。每3周免疫一次,共免疫2次。每次免疫后三周分别采取每只小鼠血清,采用假病毒细胞中和实验法分别测定每次免疫后的小鼠血清中针对HPV33的中和抗体滴度。结果如表3所示,在第二次加强免疫3周后,检测中和抗体的平均滴度水平如附图4所示。
表3 假病毒细胞中和实验法检测HPV33 L1五聚体蛋白中和抗体水平
结果表明,实施例制备的HPV33 L1五聚体蛋白接种小鼠,第一次免疫3周后即可产生中和抗体;二次免疫后的中和抗体即可达到很高的水平,分别如表所示。实验结果证明,各个实施例所得样品制备的HPV L1五聚体蛋白疫苗可以在动物体内产生中和抗体。说明本发明制备的HPV L1五聚体蛋白疫苗在人体临床试验中具有免疫原性,即能预防HPV33病毒感染引起的疾病。
实施例12:不同HPV33 L1重组序列的蛋白表达量及蛋白稳定性比较
将实施1-6方法构建的工程菌参照实施例7的方法,制备HPV33 L1蛋白,检测表达量(用Lowry法检测总蛋白量,用Elisa法检测L1含量),之后放置6-20小时比较蛋白的稳定性,结果如表4所示。
表4 蛋白含量及稳定性实验
结果表明,不同氨基酸序列组成的蛋白产物的表达量和稳定性存在差异。其中SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8的表达量基本相同,无显著差异,而且蛋白较稳定。SEQ ID NO:10和NO:11表达量明显低于NO:2、4、6、8序列。表明C端截短不但可以防止C短降解而且可以提高L1蛋白的表达量。从初步稳定性观察来看,H4结构域未改造的SEQ ID NO:11制备的HPV33 L1蛋白纯化产物与其他序列相比,在6小时即出现沉淀,说明H4结构域未改造序列,五聚体仍处于不稳定状态,会继续无规聚集,导致蛋白絮凝沉淀。
SEQUENCE LISTING
<110> 北京康乐卫士生物技术股份有限公司
<120> 重组的人乳头瘤病毒33型L1蛋白及其用途
<130> 2014
<160> 11
<170> PatentIn version 3.3
<210> 1
<211> 1500
<212> DNA
<213> 人工序列
<400> 1
atgtccgtgt ggcggcctag tgaggccaca gtgtacctgc ctcctgtacc tgtatctaaa 60
gttgtcagca ctgatgaata tgtgtctcgc acaagcattt attattatgc tggtagttcc 120
agacttcttg ctgttggcca tccatatttt tctattaaaa atcctaataa cgctaaaaag 180
ttattggtac ccaaagtatc aggcttgcaa tatagggttt ttagggtccg tttaccagat 240
cctaataaat ttggatttcc tgacacctcc ttttataacc ctgatacaca acgattggta 300
tgggcatgtg taggccttga aataggtaga gggcagccat taggcgttgg cataagtggt 360
catcctttat taaacaaatt tgatgacact gaaaccagta acaagtatcc tggacaaccg 420
ggtgctgata atagggaatg tttatccatg gattataaac aaacacagtt atgtttactt 480
ggatgtaagc ctccaacagg ggaacattgg ggtaaaggtg ttgcttgtac taatgcagca 540
cctgccaatg attgtccacc tttagaactt ataaatacta ttattgagga tggtgatatg 600
gtggacacag gatttggttg catggatttt aaaacattgc aggctaataa aagtgatgtt 660
cctattgata tttgtggcag tacatgcaaa tatccagatt atttaaaaat gactagtgag 720
ccttatggtg atagtttatt tttttttctt cgacgtgaac aaatgtttgt aagacacttt 780
tttaataggg ctggtaactt aggagaggct gttcccgatg acctgtacat taaaggttca 840
ggaactactg cctctattca aagcagtgct ttttttccca ctcctagtgg atctatggtt 900
acttccgaat ctcagttatt taataagcca tattggctac aacgtgcaca aggtcataat 960
aatggtattt gttggggcaa tcaggtattt gttactgtgg tagataccac tcgcagtact 1020
aatatgactt tatgcacaca agtaactagt gacagtacat ataaaaatga aaattttaaa 1080
gaatatataa gacatgttga agaatatgat ttacagtttg tttttcaact atgcaaagtt 1140
accttaactg cagaagttat gacatatatt catgctatga atccagatat tttagaagat 1200
tggcaatttg gtttaacacc tcctccatct gctagtttac aggataccta taggtttgtt 1260
acctctcagg ctattacgtg tcaaaaaaca gtacctccaa aggaaaagga agacccctta 1320
ggtaaatata cattttggga agtggattta aaggaaaaat tttcagcaga tttagatcag 1380
tttcctttgg gacgcaagtt tttattacag gcaggtctta aagcaaaacc taaacttaaa 1440
cgtgcagccc ccacatccac ccgcacatcg tctgcaaaac gcaggaaggt taaaaaataa 1500
<210> 2
<211> 447
<212> PRT
<213> 人工序列
<400> 2
Gly Ser Gly Gly Gly Ala Thr Val Tyr Leu Pro Pro Val Pro Val Ser
1 5 10 15
Lys Val Val Ser Thr Asp Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr
20 25 30
Tyr Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Phe Ser
35 40 45
Ile Lys Asn Pro Asn Asn Ala Lys Lys Leu Leu Val Pro Lys Val Ser
50 55 60
Gly Leu Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys
65 70 75 80
Phe Gly Phe Pro Asp Thr Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu
85 90 95
Val Trp Ala Cys Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly
100 105 110
Val Gly Ile Ser Gly His Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu
115 120 125
Thr Ser Asn Lys Tyr Pro Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys
130 135 140
Leu Ser Met Asp Tyr Lys Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys
145 150 155 160
Pro Pro Thr Gly Glu His Trp Gly Lys Gly Val Ala Cys Thr Asn Ala
165 170 175
Ala Pro Ala Asn Asp Cys Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile
180 185 190
Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Cys Met Asp Phe Lys
195 200 205
Thr Leu Gln Ala Asn Lys Ser Asp Val Pro Ile Asp Ile Cys Gly Ser
210 215 220
Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly
225 230 235 240
Asp Ser Leu Phe Phe Phe Leu Arg Arg Glu Gln Met Phe Val Arg His
245 250 255
Phe Phe Asn Arg Ala Gly Asn Leu Gly Glu Ala Val Pro Asp Asp Leu
260 265 270
Tyr Ile Lys Gly Ser Gly Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe
275 280 285
Phe Pro Thr Pro Ser Gly Ser Met Val Thr Ser Glu Ser Gln Leu Phe
290 295 300
Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile
305 310 315 320
Cys Trp Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser
325 330 335
Thr Asn Met Thr Leu Cys Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys
340 345 350
Asn Glu Asn Phe Lys Glu Tyr Ile Arg His Val Glu Glu Tyr Asp Leu
355 360 365
Gln Phe Val Phe Gln Leu Cys Lys Val Thr Leu Thr Ala Glu Val Met
370 375 380
Thr Tyr Ile His Ala Met Asn Pro Asp Ile Leu Glu Asp Trp Gln Gly
385 390 395 400
Gly Gly Ser Gly Lys Glu Asp Pro Leu Gly Lys Tyr Thr Phe Trp Glu
405 410 415
Val Asp Leu Lys Glu Lys Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu
420 425 430
Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu Lys Ala Lys Pro Lys
435 440 445
<210> 3
<211> 1500
<212> DNA
<213> 人工序列
<400> 3
atgtccgtgt ggcggcctag tgaggccaca gtgtacctgc ctcctgtacc tgtatctaaa 60
gttgtcagca ctgatgaata tgtgtctcgc acaagcattt attattatgc tggtagttcc 120
agacttcttg ctgttggcca tccatatttt tctattaaaa atcctaataa cgctaaaaaa 180
ttattggtac ccaaagtatc aggcttgcaa tatagggttt ttagggtccg tttaccagat 240
cctaataaat ttggatttcc tgacacctcc ttttataacc ctgatacaca acgattagta 300
tgggcatgtg taggccttga aataggtaga gggcagccat taggcgttgg cataagtggt 360
catcctttat taaacaaatt tgatgacact gaaaccagta acaagtatcc tggacaaccg 420
ggtgctgata atagggaatg tttatccatg gattataaac aaacacagtt atgtttactt 480
ggatgtaagc ctccaacagg ggaacattgg ggtaaaggtg ttgcttgtac taatgcagca 540
cctgccaatg attgtccacc tttagaactt ataaatacta ttattgagga tggtgatatg 600
gtggacacag gatttggttg catggatttt aaaacattgc aggctaataa aagtgatgtt 660
cctattgata tttgtggcag tacatgcaaa tatccagatt atttaaaaat gactagtgag 720
ccttatggtg atagtttatt tttctttctt cgacgtgaac aaatgtttgt aagacacttt 780
tttaataggg ctggtaaatt aggagaggct gttcccgatg acctgtacat taaaggttca 840
ggaactactg cctctattca aagcagtgct ttttttccca ctcccagtgg atcaatggtt 900
acttccgaat ctcagttatt taataagcca tattggctac aacgtgcaca aggtcataat 960
aatggtattt gttggggcaa tcaggtattt gttactgtgg tagataccac tcgcagtact 1020
aatatgactt tatgcacaca agtaactagt gacagtacat ataaaaatga gaattttaaa 1080
gaatatataa gacatgttga agaatatgat ctacagtttg tttttcaact atgcaaagtt 1140
accttaactg cagaagttat gacatatatt catgctatga atccagatat tttagaagat 1200
tggcaatttg gtttaacacc tcctccatct gctagtttac aggataccta taggtttgtt 1260
acctctcagg ctattacgtg tcaaaaaaca gtacctccaa aggaaaagga agacccctta 1320
ggtaaatata cattttggga agtggattta aaggaaaaat tttcagcaga tttagatcag 1380
tttcctttgg gacgcaagtt tttattacag gcaggtctta aagcaaaacc taaacttaaa 1440
cgtgcagccc ccacatccac ccgcacatcg tctgcaaaac gcaaaaaggt taaaaaataa 1500
<210> 4
<211> 458
<212> PRT
<213> 人工序列
<400> 4
Gly Ser Gly Gly Gly Ala Thr Val Tyr Leu Pro Pro Val Pro Val Ser
1 5 10 15
Lys Val Val Ser Thr Asp Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr
20 25 30
Tyr Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Phe Ser
35 40 45
Ile Lys Asn Pro Asn Asn Ala Lys Lys Leu Leu Val Pro Lys Val Ser
50 55 60
Gly Leu Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys
65 70 75 80
Phe Gly Phe Pro Asp Thr Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu
85 90 95
Val Trp Ala Cys Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly
100 105 110
Val Gly Ile Ser Gly His Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu
115 120 125
Thr Ser Asn Lys Tyr Pro Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys
130 135 140
Leu Ser Met Asp Tyr Lys Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys
145 150 155 160
Pro Pro Thr Gly Glu His Trp Gly Lys Gly Val Ala Cys Thr Asn Ala
165 170 175
Ala Pro Ala Asn Asp Cys Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile
180 185 190
Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Cys Met Asp Phe Lys
195 200 205
Thr Leu Gln Ala Asn Lys Ser Asp Val Pro Ile Asp Ile Cys Gly Ser
210 215 220
Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly
225 230 235 240
Asp Ser Leu Phe Phe Phe Leu Arg Arg Glu Gln Met Phe Val Arg His
245 250 255
Phe Phe Asn Arg Ala Gly Lys Leu Gly Glu Ala Val Pro Asp Asp Leu
260 265 270
Tyr Ile Lys Gly Ser Gly Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe
275 280 285
Phe Pro Thr Pro Ser Gly Ser Met Val Thr Ser Glu Ser Gln Leu Phe
290 295 300
Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile
305 310 315 320
Cys Trp Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser
325 330 335
Thr Asn Met Thr Leu Cys Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys
340 345 350
Asn Glu Asn Phe Lys Glu Tyr Ile Arg His Val Glu Glu Tyr Asp Leu
355 360 365
Gln Phe Val Phe Gln Leu Cys Lys Val Thr Leu Thr Ala Glu Val Met
370 375 380
Thr Tyr Ile His Ala Met Asn Pro Asp Ile Leu Glu Asp Trp Gln Gly
385 390 395 400
Gly Gly Ser Gly Lys Glu Asp Pro Leu Gly Lys Tyr Thr Phe Trp Glu
405 410 415
Val Asp Leu Lys Glu Lys Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu
420 425 430
Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu Lys Ala Lys Pro Lys Leu
435 440 445
Lys Arg Ala Ala Pro Thr Ser Thr Arg Thr
450 455
<210> 5
<211> 1500
<212> DNA
<213> 人工序列
<400> 5
atgtccgtgt ggcggcctag tgaggccaca gtgtacctgc ctcctgtacc tgtatctaaa 60
gttgtcagca ctgatgaata tgtgtctcgc acaagcattt attattatgc tggtagttcc 120
agacttcttg ctgttggcca tccatatttt tctattaaaa atcctactaa cgctaaaaaa 180
ttattggtac ccaaagtatc aggcttgcaa tatagggttt ttagggtccg tttaccagat 240
cctaataaat ttggatttcc tgacacctcc ttttataacc ctgatacaca acgattagta 300
tgggcatgtg taggccttga aataggtaga gggcagccat taggcgttgg cataagtggt 360
catcctttat taaacaaatt tgatgacact gaaaccggta acaagtatcc tggacaaccg 420
ggtgctgata atagggaatg tttatccatg gattataaac aaacacagtt atgtttactt 480
ggatgtaagc ctccaacagg ggaacattgg ggtaaaggtg ttgcttgtac taatgcagca 540
cctgccaatg attgtccacc tttagaactt ataaatacta ttattgagga tggtgatatg 600
gtggacacag gatttggttg catggatttt aaaacattgc aggctaataa aagtgatgtt 660
cctattgata tttgtggcag tacatgcaaa tatccagatt atttaaaaat gactagtgag 720
ccttatggtg atagtttatt tttctttctt cgacgtgaac aaatgtttgt aagacacttt 780
tttaataggg ctggtacatt aggagaggct gttcccgatg acctgtacat taaaggttca 840
ggaactactg cctctattca aagcagtgct ttttttccca ctcctagtgg atcaatggtt 900
acttccgaat ctcagttatt taataagcca tattggctac aacgtgcaca aggtcataat 960
aatggtattt gttggggcaa tcaggtattt gttactgtgg tagataccac tcgcagtact 1020
aatatgactt tatgcacaca agtaactagt gacagtacat ataaaaatga aaattttaaa 1080
gaatatataa gacatgttga agaatatgat ctacagtttg tttttcaact atgcaaagtt 1140
accttaactg cagaagttat gacatatatt catgctatga atccagatat tttagaagat 1200
tggcaatttg gtttaacacc tcctccatct gctagtttac aggataccta taggtttgtt 1260
acctctcagg ctattacgtg tcaaaaaaca gtacctccaa aggaaaagga agacccctta 1320
ggtaaatata cattttggga agtggattta aaggaaaaat tttcagcaga tttagatcag 1380
tttcctttgg gacgcaagtt tttattacag gcaggtctta aagcaaaacc taaacttaaa 1440
cgtgcagccc ccacatccac ccgcacatcg tctgcaaaac gcaaaaaggt taaaaaataa 1500
<210> 6
<211> 451
<212> PRT
<213> 人工序列
<400> 6
Gly Ser Gly Ala Gly Val Pro Val Ser Lys Val Val Ser Thr Asp Glu
1 5 10 15
Tyr Val Ser Arg Thr Ser Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu
20 25 30
Leu Ala Val Gly His Pro Tyr Phe Ser Ile Lys Asn Pro Thr Asn Ala
35 40 45
Lys Lys Leu Leu Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val Phe
50 55 60
Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr Ser
65 70 75 80
Phe Tyr Asn Pro Asp Thr Gln Arg Leu Val Trp Ala Cys Val Gly Leu
85 90 95
Glu Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro
100 105 110
Leu Leu Asn Lys Phe Asp Asp Thr Glu Thr Gly Asn Lys Tyr Pro Gly
115 120 125
Gln Pro Gly Ala Asp Asn Arg Glu Cys Leu Ser Met Asp Tyr Lys Gln
130 135 140
Thr Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Thr Gly Glu His Trp
145 150 155 160
Gly Lys Gly Val Ala Cys Thr Asn Ala Ala Pro Ala Asn Asp Cys Pro
165 170 175
Pro Leu Glu Leu Ile Asn Thr Ile Ile Glu Asp Gly Asp Met Val Asp
180 185 190
Thr Gly Phe Gly Cys Met Asp Phe Lys Thr Leu Gln Ala Asn Lys Ser
195 200 205
Asp Val Pro Ile Asp Ile Cys Gly Ser Thr Cys Lys Tyr Pro Asp Tyr
210 215 220
Leu Lys Met Thr Ser Glu Pro Tyr Gly Asp Ser Leu Phe Phe Phe Leu
225 230 235 240
Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ala Gly Thr
245 250 255
Leu Gly Glu Ala Val Pro Asp Asp Leu Tyr Ile Lys Gly Ser Gly Thr
260 265 270
Thr Ala Ser Ile Gln Ser Ser Ala Phe Phe Pro Thr Pro Ser Gly Ser
275 280 285
Met Val Thr Ser Glu Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu Gln
290 295 300
Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln Val Phe
305 310 315 320
Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Thr Leu Cys Thr
325 330 335
Gln Val Thr Ser Asp Ser Thr Tyr Lys Asn Glu Asn Phe Lys Glu Tyr
340 345 350
Ile Arg His Val Glu Glu Tyr Asp Leu Gln Phe Val Phe Gln Leu Cys
355 360 365
Lys Val Thr Leu Thr Ala Glu Val Met Thr Tyr Ile His Ala Met Asn
370 375 380
Pro Asp Ile Leu Glu Asp Trp Gln Gly Ala Gly Ser Gly Lys Glu Asp
385 390 395 400
Pro Leu Gly Lys Tyr Thr Phe Trp Glu Val Asp Leu Lys Glu Lys Phe
405 410 415
Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln
420 425 430
Ala Gly Leu Lys Ala Lys Pro Lys Leu Lys Arg Ala Ala Pro Thr Ser
435 440 445
Thr Arg Thr
450
<210> 7
<211> 1500
<212> DNA
<213> 人工序列
<400> 7
atgtccgtgt ggcggcctag tgaggccaca gtgtacctgc ctcctgtacc tgtatctaaa 60
gttgtcagca ctgatgaata tgtgtctcgc acaagcattt attattatgc tggtagttcc 120
agacttcttg ctgttggcca tccatatttt tctattaaaa atcctactaa cgctaaaaaa 180
ttattggtac ccaaagtatc aggcttgcaa tatagggttt ttagggtccg tttaccagat 240
cctaataaat ttggatttcc tgacacctcc ttttataacc ctgatacaca acgattagta 300
tgggcatgtg taggccttga aataggtaga gggcagccat taggcgttgg cataagtggt 360
catcctttat taaacaaatt tgatgacact gaaaccggta acaagtatcc tggacaaccg 420
ggtgctgata atagggaatg tttatccatg gattataaac aaacacagtt atgtttactt 480
ggatgtaagc ctccaacagg ggaacattgg ggtaaaggtg ttgcttgtac taatgcagca 540
cctgccaatg attgtccacc tttagaactt ataaatacta ttattgagga tggtgatatg 600
gtggacacag gatttggttg catggatttt aaaacattgc aggctaataa aagtgaagtt 660
cctattgata tttgtggcag tacatgcaaa tatccagatt atttaaaaat gactagtgag 720
ccttatggtg atagtttatt tttctttctt cgacgtgaac aaatgtttgt aagacacttt 780
tttaataggg ctggtacatt aggagaggct gttcccgatg acctgtacat taaaggttca 840
ggaactactg cctctattca aagcagtgct ttttttccca ctcctagtgg atcaatggtt 900
acttccgaat ctcagttatt taataagcca tattggctac aacgtgcaca aggtcataat 960
aatggtattt gttggggcaa tcaggtattt gttactgtgg tagataccac tcgcagtact 1020
aatatgactt tatgcacaca agtaactagt gacagtacat ataaaaatga aaattttaaa 1080
gaatatataa gacatgttga agaatatgat ctacagtttg tttttcaact atgcaaagtt 1140
accctaactg cagaagttat gacatatatt catgctatga atccagatat tttagaagat 1200
tggcaatttg gtttaacacc tcctccatct gctagtttac aggataccta taggtttgtt 1260
acctctcagg ctattacgtg tcaaaaaaca gtacctccaa aggaaaagga agacccctta 1320
ggtaaatata cattttggga agtggattta aaggaaaaat tttcagcaga tttagatcag 1380
tttcctttgg gacgcaagtt tttattacag gcaggtctta aagcaaaacc taaacttaaa 1440
cgtgcagccc ccacatccac ccgcacatcg tctgcaaaac gcaaaaaggt taaaaaataa 1500
<210> 8
<211> 490
<212> PRT
<213> 人工序列
<400> 8
Ala Ser Ala Ser Gly Val Pro Val Ser Lys Val Val Ser Thr Asp Glu
1 5 10 15
Tyr Val Ser Arg Thr Ser Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu
20 25 30
Leu Ala Val Gly His Pro Tyr Phe Ser Ile Lys Asn Pro Thr Asn Ala
35 40 45
Lys Lys Ala Ser Ala Ser Gly Val Pro Val Ser Lys Val Val Ser Thr
50 55 60
Asp Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr Tyr Ala Gly Ser Ser
65 70 75 80
Arg Leu Leu Ala Val Gly His Pro Tyr Phe Ser Ile Lys Asn Pro Thr
85 90 95
Asn Ala Lys Lys Leu Leu Val Pro Lys Val Ser Gly Leu Gln Tyr Arg
100 105 110
Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp
115 120 125
Thr Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu Val Trp Ala Cys Val
130 135 140
Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly
145 150 155 160
His Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu Thr Gly Asn Lys Tyr
165 170 175
Pro Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys Leu Ser Met Asp Tyr
180 185 190
Lys Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Thr Gly Glu
195 200 205
His Trp Gly Lys Gly Val Ala Cys Thr Asn Ala Ala Pro Ala Asn Asp
210 215 220
Cys Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile Glu Asp Gly Asp Met
225 230 235 240
Val Asp Thr Gly Phe Gly Cys Met Asp Phe Lys Thr Leu Gln Ala Asn
245 250 255
Lys Ser Glu Val Pro Ile Asp Ile Cys Gly Ser Thr Cys Lys Tyr Pro
260 265 270
Asp Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly Asp Ser Leu Phe Phe
275 280 285
Phe Leu Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ala
290 295 300
Gly Thr Leu Gly Glu Ala Val Pro Asp Asp Leu Tyr Ile Lys Gly Ser
305 310 315 320
Gly Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe Phe Pro Thr Pro Ser
325 330 335
Gly Ser Met Val Thr Ser Glu Ser Gln Leu Phe Asn Lys Pro Tyr Trp
340 345 350
Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln
355 360 365
Val Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Thr Leu
370 375 380
Cys Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys Asn Glu Asn Phe Lys
385 390 395 400
Glu Tyr Ile Arg His Val Glu Glu Tyr Asp Leu Gln Phe Val Phe Gln
405 410 415
Leu Cys Lys Val Thr Leu Thr Ala Glu Val Met Thr Tyr Ile His Ala
420 425 430
Met Asn Pro Asp Ile Leu Glu Asp Trp Gln Gly Gly Gly Ser Gly Lys
435 440 445
Glu Asp Pro Leu Gly Lys Tyr Thr Phe Trp Glu Val Asp Leu Lys Glu
450 455 460
Lys Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu
465 470 475 480
Leu Gln Ala Gly Leu Lys Ala Lys Pro Lys
485 490
<210> 9
<211> 1500
<212> DNA
<213> 人工序列
<400> 9
atgtccgtgt ggcggcctag tgaggccaca gtgtacctgc ctcctgtacc tgtatctaaa 60
gttgtcagca ctgatgaata tgtgtctcgc acaagcattt attattatgc tggtagttcc 120
agacttcttg ctgttggcca tccatatttt tctattaaaa atcctactaa cgctaaaaaa 180
ttattggtac ccaaagtatc aggcttgcaa tatagggttt ttagggtccg tttaccagat 240
cctaataaat ttggatttcc tgacacctcc ttttataacc ctgatacaca acgattagta 300
tgggcatgtg taggccttga aataggtaga gggcagccat taggcgttgg cataagtggt 360
catcctttat taaacaaatt tgatgacact gaaaccggta acaggtatcc tggacaaccg 420
ggtgctgata atagggaatg tttatccatg gattataaac aaacacagtt atgtttactt 480
ggatgtaagc ctccaacagg ggaacattgg ggtaaaggtg ttgcttgtac taatgcagca 540
cctgccaatg attgtccacc tttagaactt ataaatacta tcattgagga tggtgatatg 600
gtggacacag gatttggttg catggatttt aaaacattgc aggctaataa aagtgatgtt 660
cctattgata tttgtggcag tacatgcaaa tatccagatt atttaaaaat gactagtgag 720
ccttatggtg atagtttatt tttctttctt cgacgtgaac aaatgtttgt aagacacttt 780
tttaataggg ctggtaaatt agaagaggct gttcccgatg acctgtacat taaaggttca 840
ggaactactg cctctattca aagcagtgct ttttttccca ctcctagtgg atcaatggtt 900
acttccgaat ctcagttatt taataagcca tattggctac aacgtgcaca aggtcataat 960
aatggtattt gttggggcaa tcaggtattt gttactgtgg tagataccac tcgcagtact 1020
aatatgactt tatgcacaca ggtaactagt gacagtacat ataaaaatga gaattttaag 1080
gaatatataa gacatgttga agaatatgat ctacagtttg tttttcaact atgcaaagtt 1140
accttaactg cagaagttat gacatatatt catgctatga atccagatat tttagaagat 1200
tggcaatttg gtttaacacc tcctccatct gctagtttac aggataccta taggtttgtt 1260
acctctcagg ctattacgtg tcaaaaaaca gtacctccaa aggaaaagga agaccccttg 1320
ggtaaatata cattttggga agtggattta aaggaaaaat tttcagcaga tttagatcag 1380
tttcctttgg gacgcaagtt tttattacag gcaggtctta aagcaaaacc taaacttaaa 1440
cgtgcagccc ccacatccac ccgcacatcg tctgcaaaac gcaaaaaggt taaaaaataa 1500
<210> 10
<211> 468
<212> PRT
<213> 人工序列
<400> 10
Gly Ser Gly Gly Gly Ala Thr Val Tyr Leu Pro Pro Val Pro Val Ser
1 5 10 15
Lys Val Val Ser Thr Asp Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr
20 25 30
Tyr Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Phe Ser
35 40 45
Ile Lys Asn Pro Thr Asn Ala Lys Lys Leu Leu Val Pro Lys Val Ser
50 55 60
Gly Leu Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys
65 70 75 80
Phe Gly Phe Pro Asp Thr Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu
85 90 95
Val Trp Ala Cys Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly
100 105 110
Val Gly Ile Ser Gly His Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu
115 120 125
Thr Gly Asn Arg Tyr Pro Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys
130 135 140
Leu Ser Met Asp Tyr Lys Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys
145 150 155 160
Pro Pro Thr Gly Glu His Trp Gly Lys Gly Val Ala Cys Thr Asn Ala
165 170 175
Ala Pro Ala Asn Asp Cys Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile
180 185 190
Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Cys Met Asp Phe Lys
195 200 205
Thr Leu Gln Ala Asn Lys Ser Asp Val Pro Ile Asp Ile Cys Gly Ser
210 215 220
Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly
225 230 235 240
Asp Ser Leu Phe Phe Phe Leu Arg Arg Glu Gln Met Phe Val Arg His
245 250 255
Phe Phe Asn Arg Ala Gly Lys Leu Glu Glu Ala Val Pro Asp Asp Leu
260 265 270
Tyr Ile Lys Gly Ser Gly Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe
275 280 285
Phe Pro Thr Pro Ser Gly Ser Met Val Thr Ser Glu Ser Gln Leu Phe
290 295 300
Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile
305 310 315 320
Cys Trp Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser
325 330 335
Thr Asn Met Thr Leu Cys Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys
340 345 350
Asn Glu Asn Phe Lys Glu Tyr Ile Arg His Val Glu Glu Tyr Asp Leu
355 360 365
Gln Phe Val Phe Gln Leu Cys Lys Val Thr Leu Thr Ala Glu Val Met
370 375 380
Thr Tyr Ile His Ala Met Asn Pro Asp Ile Leu Glu Asp Trp Gln Gly
385 390 395 400
Gly Gly Ser Gly Lys Glu Asp Pro Leu Gly Lys Tyr Thr Phe Trp Glu
405 410 415
Val Asp Leu Lys Glu Lys Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu
420 425 430
Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu Lys Ala Lys Pro Lys Leu
435 440 445
Lys Arg Ala Ala Pro Thr Ser Thr Arg Thr Ser Ser Ala Lys Arg Lys
450 455 460
Lys Val Lys Lys
465
<210> 11
<211> 496
<212> PRT
<213> 人工序列
<400> 11
Gly Ser Gly Gly Gly Ala Thr Val Tyr Leu Pro Pro Val Pro Val Ser
1 5 10 15
Lys Val Val Ser Thr Asp Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr
20 25 30
Tyr Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Phe Ser
35 40 45
Ile Lys Asn Pro Asn Asn Ala Lys Lys Leu Leu Val Pro Lys Val Ser
50 55 60
Gly Leu Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys
65 70 75 80
Phe Gly Phe Pro Asp Thr Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu
85 90 95
Val Trp Ala Cys Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly
100 105 110
Val Gly Ile Ser Gly His Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu
115 120 125
Thr Ser Asn Lys Tyr Pro Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys
130 135 140
Leu Ser Met Asp Tyr Lys Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys
145 150 155 160
Pro Pro Thr Gly Glu His Trp Gly Lys Gly Val Ala Cys Thr Asn Ala
165 170 175
Ala Pro Ala Asn Asp Cys Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile
180 185 190
Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Cys Met Asp Phe Lys
195 200 205
Thr Leu Gln Ala Asn Lys Ser Asp Val Pro Ile Asp Ile Cys Gly Ser
210 215 220
Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly
225 230 235 240
Asp Ser Leu Phe Phe Phe Leu Arg Arg Glu Gln Met Phe Val Arg His
245 250 255
Phe Phe Asn Arg Ala Gly Asn Leu Gly Glu Ala Val Pro Asp Asp Leu
260 265 270
Tyr Ile Lys Gly Ser Gly Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe
275 280 285
Phe Pro Thr Pro Ser Gly Ser Met Val Thr Ser Glu Ser Gln Leu Phe
290 295 300
Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile
305 310 315 320
Cys Trp Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser
325 330 335
Thr Asn Met Thr Leu Cys Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys
340 345 350
Asn Glu Asn Phe Lys Glu Tyr Ile Arg His Val Glu Glu Tyr Asp Leu
355 360 365
Gln Phe Val Phe Gln Leu Cys Lys Val Thr Leu Thr Ala Glu Val Met
370 375 380
Thr Tyr Ile His Ala Met Asn Pro Asp Ile Leu Glu Asp Trp Gln Phe
385 390 395 400
Gly Leu Thr Pro Pro Pro Ser Ala Ser Leu Gln Asp Thr Tyr Arg Phe
405 410 415
Val Thr Ser Gln Ala Ile Thr Cys Gln Lys Thr Val Pro Pro Lys Glu
420 425 430
Lys Glu Asp Pro Leu Gly Lys Tyr Thr Phe Trp Glu Val Asp Leu Lys
435 440 445
Glu Lys Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe
450 455 460
Leu Leu Gln Ala Gly Leu Lys Ala Lys Pro Lys Leu Lys Arg Ala Ala
465 470 475 480
Pro Thr Ser Thr Arg Thr Ser Ser Ala Lys Arg Arg Lys Val Lys Lys
485 490 495

Claims (9)

1.一种重组的HPV33L1蛋白,其特征在于,所述重组的HPV33L1蛋白的氨基酸序列为以下序列中的任意一种:
SEQ ID NO:2;
SEQ ID NO:4;
SEQ ID NO:6;
SEQ ID NO:8;
SEQ ID NO:10。
2.编码权利要求1所述的重组的HPV33L1蛋白的多核苷酸。
3.包含权利要求2所述的多核苷酸的表达载体。
4.包含权利要求3所述的表达载体的细胞。
5.一种HPV33L1蛋白五聚体,其特征在于,所述蛋白五聚体由五个相同的HPV33L1蛋白单体形成,所述HPV33L1蛋白单体的序列如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8或SEQ ID NO:10所示。
6.一种HPV疫苗,其特征在于,所述HPV疫苗包括权利要求5所述的HPV33L1蛋白五聚体和药用佐剂。
7.如权利要求6所述的HPV疫苗的制备方法,其特征在于,该方法为:
A、克隆或合成编码权利要求1所述的重组的HPV33L1蛋白的基因片段;
B、在大肠杆菌或酵母表达系统中表达权利要求1所述的重组的HPV33L1蛋白;
C、纯化由权利要求1所述的重组的HPV33L1蛋白组成的五聚体;
D、将所述HPV33L1蛋白五聚体加入药用佐剂制成疫苗。
8.如权利要求5所述的HPV33L1蛋白五聚体在制备预防HPV33感染及其导致疾病的药物中的应用。
9.如权利要求6所述的HPV疫苗在制备预防HPV33感染及其导致疾病的药物中的应用。
CN201410021940.9A 2013-01-18 2014-01-18 重组的人乳头瘤病毒33型l1蛋白及其用途 Active CN103936840B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410021940.9A CN103936840B (zh) 2013-01-18 2014-01-18 重组的人乳头瘤病毒33型l1蛋白及其用途

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201310018764.9 2013-01-18
CN2013100187649 2013-01-18
CN201310018764 2013-01-18
CN201410021940.9A CN103936840B (zh) 2013-01-18 2014-01-18 重组的人乳头瘤病毒33型l1蛋白及其用途

Publications (2)

Publication Number Publication Date
CN103936840A CN103936840A (zh) 2014-07-23
CN103936840B true CN103936840B (zh) 2019-04-09

Family

ID=51184743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410021940.9A Active CN103936840B (zh) 2013-01-18 2014-01-18 重组的人乳头瘤病毒33型l1蛋白及其用途

Country Status (1)

Country Link
CN (1) CN103936840B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106701797B (zh) * 2015-08-12 2021-06-15 北京康乐卫士生物技术股份有限公司 31型重组人乳头瘤病毒病毒样颗粒及其制备方法
CN106399329B (zh) * 2015-08-12 2021-06-11 北京康乐卫士生物技术股份有限公司 33型重组人乳头瘤病毒病毒样颗粒及其制备方法
CN114127097A (zh) * 2019-07-19 2022-03-01 神州细胞工程有限公司 嵌合的人乳头瘤病毒56型l1蛋白
WO2021013078A1 (zh) * 2019-07-19 2021-01-28 神州细胞工程有限公司 嵌合的人乳头瘤病毒52型l1蛋白

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1173203A (zh) * 1994-11-14 1998-02-11 麦克公司 纯化的乳头状瘤病毒蛋白
CN101245099A (zh) * 2007-02-14 2008-08-20 马润林 重组人乳头瘤病毒l1衣壳蛋白的氨基酸序列及其应用
CN101481408A (zh) * 2008-01-07 2009-07-15 马润林 防止高度聚合的重组人乳头瘤病毒l1蛋白的修饰序列
CN102229660A (zh) * 2011-05-25 2011-11-02 厦门大学 截短的人乳头瘤病毒33型l1蛋白

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1173203A (zh) * 1994-11-14 1998-02-11 麦克公司 纯化的乳头状瘤病毒蛋白
CN101245099A (zh) * 2007-02-14 2008-08-20 马润林 重组人乳头瘤病毒l1衣壳蛋白的氨基酸序列及其应用
CN101481408A (zh) * 2008-01-07 2009-07-15 马润林 防止高度聚合的重组人乳头瘤病毒l1蛋白的修饰序列
CN102229660A (zh) * 2011-05-25 2011-11-02 厦门大学 截短的人乳头瘤病毒33型l1蛋白

Also Published As

Publication number Publication date
CN103936840A (zh) 2014-07-23

Similar Documents

Publication Publication Date Title
CN101293918B (zh) 截短的人乳头瘤病毒16型l1蛋白
DK2716653T3 (en) TRUNCATED L1 PROTEIN OF HUMANT PAPILLOMAVIRUS TYPE 33
CN105039359B (zh) 16型重组人乳头瘤病毒病毒样颗粒及其制备方法
US10940194B2 (en) Mutant of L1 protein of human papillomavirus type 58
WO2008145020A1 (en) A truncated l1 protein of human papillomavirus 11
EP2589604B1 (en) Truncated l1 protein of human papillomavirus type 52
EP3385274B1 (en) Mutant of human papillomavirus type 11 l1 protein
CN103936840B (zh) 重组的人乳头瘤病毒33型l1蛋白及其用途
US11427618B2 (en) Mutant of L1 protein of human papillomavirus type 39
WO2008145021A1 (en) A truncated l1 protein of human papillomavirus 6
US9738691B2 (en) Truncated L1 protein of human papillomavirus type 58
CN103992395B (zh) 重组hpv-58型l1的vlp疫苗及其制备方法
CN104045696B (zh) 重组的人乳头瘤病毒16型l1蛋白及其用途
WO2008134935A1 (fr) Protéines 18 l1 de type papillomavirus humain tronqué
CN106399329B (zh) 33型重组人乳头瘤病毒病毒样颗粒及其制备方法
CN103819543B (zh) 重组的人乳头瘤病毒6型l1蛋白及其用途
CN104045695B (zh) 重组的人乳头瘤病毒18型l1蛋白及其用途
CN104211782B (zh) 截短的人乳头瘤病毒45型l1蛋白
US11213580B2 (en) Mutant of L1 protein of human papillomavirus type 16
US7763259B2 (en) Therapeutic and prophylactic vaccine for the treatment and prevention of papillomavirus infection
CN106701797A (zh) 31型重组人乳头瘤病毒病毒样颗粒及其制备方法
CN106701796A (zh) 52型重组人乳头瘤病毒病毒样颗粒及其制备方法
WO2019233412A1 (zh) 一种人乳头瘤病毒18型l1蛋白的突变体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant