CN103936840B

CN103936840B - 重组的人乳头瘤病毒33型l1蛋白及其用途

Info

Publication number: CN103936840B
Application number: CN201410021940.9A
Authority: CN
Inventors: 刘永江; 陈小江; 陈林; 盖大海; 许铮; 曹科; 陈建平; 潘勇昭; 银飞; 阮芳勇
Original assignee: BEIJING HEALTH GUARD BIOTECHNOLOGY Co Ltd
Current assignee: BEIJING HEALTH GUARD BIOTECHNOLOGY Co Ltd
Priority date: 2013-01-18
Filing date: 2014-01-18
Publication date: 2019-04-09
Anticipated expiration: 2034-01-18
Also published as: CN103936840A

Abstract

本发明提供一种新的编码重组的HPV33 L1蛋白的多核苷酸基因片段、包含该基因片段的载体、包括载体的宿主细胞，以及由该基因片段翻译表达的HPV33 L1蛋白五聚体和由该五聚体组成的抗HPV33型感染的疫苗。

Description

重组的人乳头瘤病毒33型L1蛋白及其用途

技术领域

本发明涉及人类乳头状瘤病毒感染的预防和/或治疗。更具体而言，本发明涉及一种重组的人乳头瘤病毒33型L1蛋白，及由其组成的五聚体，含该蛋白的疫苗及其在预防HPV33型病毒感染，特别是在预防HPV33型病毒感染引起的宫颈癌疾病中的用途。

背景技术

人类乳头状瘤病毒(Human Papillomavirus,简称HPV)是通过密切接触而传播的DNA病毒。在人体组织中,HPV主要感染皮肤和黏膜组织。HPV DNA按病毒致癌能力的大小分为三类：(1)低危型HPV，包括HPV6，11，40，42，43，44，54，61，70.72.51，主要引起良性外生性疣，宫颈上皮内瘤变(cervical intraepithelial neoplasm，CIN)(2)高危型HPV，包括HPV16，18，31，33，35，39，43，51，52，56，58，59，68，73，82，主要引起宫颈上皮内中、高度瘤变(CINII、CTNIII)和宫颈浸润型鳞癌.最常见的是HPV 16、18。(3)可能致癌型，包括HPV 26，53，66（Munoz N，Bosch Fx，Sanjose S，et a1.Epidemiologie classification of humanpapilloma virus types associated with cervical cancer[J].N Engl J Med，2003，348：8）。宫颈癌是女性第二大恶性肿瘤,每年全球的发病大概在54万(2013年),约有24万例死亡,幸运的是,宫颈癌是唯一研制出疫苗的癌症。2006 年6月8日,美国食品与药品管理局(FDA)正式批准美国Merck公司(即默沙东公司)生产的 Gardasil HPV 预防性疫苗上市；它是由酿酒酵母表达并纯化的HPV16/18/6/11 L1 VLP 四价宫颈癌预防性疫苗，被批准用于预防 6~ 26岁女孩和妇女 HPV16、18、6、11型感染所引起的宫颈癌、癌前病变和生殖器疣，这是FDA通过的世界上第一个肿瘤疫苗(Villa, Costa et al. 2005, Villa, Ault etal. 2006, Bryan 2007, Olsson, Villa et al. 2007, Goldstone and Vuocolo 2012)。随后英国葛兰素史克(GSK)公司生产的商品名为Cervarix的 HPV 预防性疫苗也成功上市，它是由来源于昆虫表达系统的 HPV16/18 L1 VLP 二价宫颈癌预防性疫苗。但这两种预防性疫苗价格昂贵，极大限制了在发展中国家和落后地区的使用，因此开发一种低成本的高效价HPV疫苗就显得尤为重要(Jansen and Shaw 2004, Buonaguro, Tornesello et al.2009, Campo and Roden 2010, Frazer, Leggatt et al. 2011, Hariri, Dunne et al.2011, Lehtinen and Dillner 2013, Shaw 2013)。

HPV属乳头多瘤空泡病毒科(Papovaviridae)乳头瘤病毒属，为无包膜DNA病毒。病毒基因组为双链闭环DNA，大小约为7.2～8kb，具有8个开放框。基因组按功能的不同可以分为三个区域：早期区(E)，约4. 5kb，编码E1、E2、E4～E7共6个与病毒复制，转录及转化有关的非结构蛋白；晚期区(L)，约2. 5kb，编码主要衣壳蛋白L1和次要衣壳蛋白L2；长调控区(LCR)，位于L区末端与E区起始端之间，长约800～900bp，不编码任何蛋白，含DNA复制、表达调控元件。

HPV病毒颗粒直径为55～60nm，核衣壳呈20面体对称，由72个主要衣壳蛋白L1的五聚体及次要衣壳蛋白L2组成。大量研究证实，HPV L1蛋白是HPV疫苗的主要靶蛋白。在多种表达系统中表达的HPV L1蛋白无需L2蛋白辅助即可形成在形态结构与天然病毒颗粒相似的类病毒颗粒(Virus-L1keParticle，VLP)。重组HPV L1-VLP疫苗已经成功上市并用于预防HPV感染及由此导致的宫颈癌、尖锐湿疣等疾病，并充分证明了L1-VLP具有与野生同型病毒相同的抗原性和免疫原性。从组成VLP的三级结构看，其抗原决定簇均分布于组成VLP的基本结构单元五聚体的表面（Xiaojiang S. Chen,Robert L. Garcea, Ilya Goldberg ,Gregory Casini and Stephen C.(2000) . HarrisonStructure of Small Virus-likeParticles Assembled from the L1 Protein of Human Papillomavirus 16.MolecularCell, Vol. 5, 557–567.Brooke Bishop, Jhimli Dasgupta, Michael Klein, RobertL. Garcea, Neil D. Christensen, Rui Zhaoand Xiaojiang S. Chen.(2007). CrystalStructures of Four Types of Human Papillomavirus L1 Capsid Proteins. THEJOURNAL OF BIOLOGICAL CHEMISTRY VOL. 282, NO. 43, pp. 31803–31811），说明HPVL1-VLP的抗原性和免疫原性来源于或取决于L1组成的五聚体。因此，重组L1蛋白五聚体与VLP一样具备完整的抗原表位，也可以作为抗原用来制备疫苗。

HPV疫苗研制的关键是能够大量高效制备HPV L1蛋白。目前较为常用的表达系统可以分为真核表达系统及原核表达系统。常用的真核表达系统有痘病毒表达系统、昆虫杆状病毒表达系统、酵母表达系统。在真核表达系统中所表达的HPV L1蛋白天然构象破坏少，能自发的形成VLP，往往只需进行简单的纯化即可获得VLP。但是由于真核表达系统的表达量低，培养成本高，给大规模工业化生产带来了极大困难。原核表达系统中利用大肠杆菌表达系统表达HPVL1 蛋白已有报道。但是由于大肠杆菌所表达的HPV L1蛋白大多失去其天然构象，不能产生针对HPV 的保护抗体。或者上述蛋白虽然通过包含体纯化，复性等步骤也可得到HPV VLP，但是在复性过程中蛋白损失量大，得率低，难以在大规模生产上应用。HPV L1全长序列蛋白虽然也可以在大肠杆菌中以正确构象可溶性地表达，溶解于菌体的裂解上清中，但是表达量较低，而且上清中杂蛋白种类多且量大，要从中纯化出目的蛋白难度相当大，依然无法应用于大规模生产。

因此，本领域仍然需要成本低、纯度高、产量高、效果好的HPV L1蛋白生产技术和大规模工业化生产预防宫颈癌疫苗的新方法。

发明内容

本发明的目的是提供一种新的HPV33 L1蛋白，及由其组成的五聚体蛋白颗粒及含该五聚体蛋白颗粒的疫苗。

本发明涉及提供一种新的编码重组的HPV33 L1蛋白的多核苷酸基因片段、包含该基因片段的载体、包括载体的宿主细胞，以及由该基因片段翻译表达的HPV33 L1蛋白五聚体和由该五聚体组成的抗HPV33型感染的疫苗。

本发明公开了一种重组的HPV33 L1蛋白的氨基酸序列，所述蛋白的氨基酸序列在N端8-15个氨基酸全部或任意部分被2-10个氨基酸序列所取代，其氨基酸序列由G、S、A三者的任一组合方式；H4结构域被2-10个氨基酸序列取代，其氨基酸序列由G、S、A三者的任一组合方式。

本发明涉及的HPV33 L1蛋白，进一步是其氨基酸序列C端截短0个、1个、2个至21个氨基酸。

本发明所述的HPV33 L1蛋白，优选的被其氨基酸序列N端前8-15个氨基酸被GSGGG、ASASG或GSGAG取代，H4结构域优选的被GGGSG或GAGAS取代。

如实施例所述的HPV33 L1蛋白，优选其氨基酸序列在N端前8、10、12或15个氨基酸优选被GSGGG或ASASG氨基酸序列取代。C端优选截短10-21个氨基酸，更优选截短10个、21个氨基酸。

如实施例所述的HPV33 L1蛋白，其序列包含序列SEQ ID NO：2、SEQ ID NO：4、SEQID NO：6、 SEQ ID NO：8或SEQ ID NO：10。

本发明公开一种编码蛋白的多核苷酸序列。本发明公开一种包含多核苷酸序列的基因的表达载体。本发明公开一种包含表达载体的细胞。

本发明公开一种HPV33 L1蛋白五聚体，该蛋白五聚体由五个HPV33 L1蛋白单体形成。

本发明公开一种HPV 疫苗，该疫苗包括HPV33 L1 蛋白五聚体和药用佐剂。

本发明公开一种HPV疫苗的制备方法，该方法为：

A.克隆或合成重组HPV33 L1蛋白的基因片段；

B.在大肠杆菌或酵母表达系统中表达重组的HPV33 L1蛋白；

C.纯化由HPV33 L1蛋白组成的五聚体；

D.HPV33 L1蛋白五聚体加入药用佐剂制成疫苗。

上述方法中步骤C的纯化优选利用亲和层析色谱纯化HPV33 L1融合标签蛋白。

本发明公开HPV疫苗在制备预防和包括HPV33感染及导致疾病的药物中的应用。

本发明第一方面提供一种编码重组HPV33 L1蛋白的多核苷酸基因片段。

本发明第二方面提供了一种构建的表达载体，其包含本发明第一方面的编码重组HPV33 L1蛋白的多核苷酸基因片段。所述载体适合驱动异源DNA在细菌、昆虫或哺乳动物细胞中翻译表达HPV33 L1蛋白。在一个实施方案中，所述表达载体优选pGEX-6p-1或pGEX-4T-2。

本发明的第三方面提供了一种构建的工程菌细胞，该细胞包含本发明第一方面的多核苷酸基因片段，或第二方面的表达载体。所述的工程菌宿主细胞可以是细菌细胞，例如大肠杆菌，可以是真核细胞，例如酵母细胞，或者是昆虫细胞。

本发明第四方面提供了一种药用组合物，其包含采用本发明技术生产的表达产物HPV33 L1五聚体蛋白、赋形剂或载体。

本发明同时提供了制备上述编码重组HPV33 L1蛋白的多核苷酸序列、表达载体构建、工程菌细胞转化和药用组合物的方法。

本发明获得HPV33 L1蛋白的方法，其包括在表达系统中表达重组的HPV33 L1蛋白及其五聚体，然后将含有该重组蛋白的裂解上清进行纯化处理。具体获得HPV33 L1蛋白五聚体的方法包括：

1.从临床样本中克隆或人工合成编码HPV33 L1全长蛋白基因或截短蛋白基因的片段。

2.在大肠杆菌或酵母表达系统中表达重组的L1蛋白。

3.纯化HPV33 L1重组蛋白。

在一个实施方案中，获得重组HPV33 L1蛋白的优选方法包括：

1.N端1-15个氨基酸全部或任意部分被GSGGG取代、H4结构域被GGGSG序列取代的HPV33 L1重组蛋白。

2.在大肠杆菌或酵母表达系统中表达重组的L1蛋白。

3.纯化HPV33 L1重组蛋白。

在优选的实施例1方案中N端截短8个氨基酸被GSGGG取代，H4结构域被GGGSG序列取代，同时C端截短21个氨基酸，SEQ ID NO：2。

在一个优选的实施例2方案中N端截短8个氨基酸被GSGGG取代，H4结构域被GGGSG序列取代，同时C端截短10个氨基酸，SEQ ID NO：4。

在一个优选的实施例3方案中N端截短15个氨基酸被GSGAG取代，H4结构域被GAGSG序列取代，同时C端截短10个氨基酸，SEQ ID NO：6。

在一个优选的实施例4方案中N端截短15个氨基酸被ASASG取代，H4结构域被GGGSG序列取代，同时C端截短21个氨基酸，SEQ ID NO：8。

在一个优选的实施例5方案中N端截短8个氨基酸被GSGGG取代，H4结构域被GGGSG序列取代，同时C端保留不截短，SEQ ID NO：10。

在对比的实施例6方案中N端前8个氨基酸被GSGGG取代，H4结构域不取代，C端保留不截短。

本发明另提供了本发明药用组合物在制备预防或治疗HPV33型感染及导致疾病药物中的应用。

本发明还涉及一种预防宫颈癌或HPV感染的疫苗，其包含本发明重组的HPV33 L1五聚体，或者由五聚体组成的多聚体，包括1、2、 3、 4、 5……200个五聚体。优选该疫苗还包含至少一种选自HPV6 L1五聚体，HPV11 L1五聚体HPV16 L1五聚体，HPV18 L1五聚体，HPV31 L1五聚体，HPV35 L1五聚体，HPV45 L1五聚体，HPV52 L1五聚体，HPV58 L1五聚体，以及由上述五聚体任意组合组成的二价、三价、四价、五价、六价、七价、八价、九价或十价疫苗。该疫苗通常还包含疫苗用赋形剂或载体。

优选地，所述疫苗每剂含有本发明重组的HPV33 L1蛋白的量为1μg-200μg,优选5μg-50μg。所述疫苗含有本发明重组的HPV33 L1与HPV6 L1按照0.5-2：1比例组成的疫苗，重组的HPV33 L1与HPV11 L1按照0.5-2：1比例组成的疫苗，重组的HPV33 L1与HPV16 L1按照0.5-2：1比例组成的疫苗，重组的HPV33 L1与HPV18 L1按照0.5-2：1比例组成的疫苗，重组的HPV33 L1与HPV31 L1按照0.5-2：1比例组成的疫苗，重组的HPV33 L1与HPV35 L1按照0.5-2：1比例组成的疫苗, 重组的HPV33 L1与HPV45 L1按照0.5-2：1比例组成的疫苗, 重组的HPV33 L1与HPV52 L1按照0.5-2：1比例组成的疫苗, 重组的HPV33 L1与HPV58 L1按照0.5-2：1比例组成的疫苗,以及由重组的HPV33 L1五聚体与上述各型HPV L1五聚体按0.5-2:1比例组成的二价、三价、四价、五价、六价、七价、八价、九价或十价疫苗。

本发明还涉及一种制备用于预防宫颈癌或HPV感染疫苗的方法，其包含本发明重组的HPV33 L1五聚体，或者由该五聚体组成的多聚体，或与任选的一种或多种选自HPV33，6，11，16，18，31，35，45，52，和58的HPV型别的五聚体或多聚体与载体或者赋形剂混合制备成疫苗。

本发明进一步涉及包含本发明重组的HPV33 L1五聚体，或者由五聚体组成的多聚体在制备用于预防宫颈癌或HPV33感染疫苗中的用途。

本发明中相关术语的说明及解释

根据本发明，术语“大肠杆菌表达系统”是指由大肠杆菌（菌株）与表达载体组成，其中大肠杆菌（菌株）来源于市场上可得到的，在此举例但不限于：GI698，ER2566，BL21(DE3)，B834 (DE3)，BLR (DE3)等。

根据本发明，术语“载体”一词指的是，可将某编码蛋白的多核苷酸插入其中并使蛋白获得表达的一种核酸运载工具。载体可以通过转化，转导或者转染宿主细胞，使其携带的遗传物质元件在宿主细胞中获得表达。举例来说，载体包括：质粒，噬菌体，柯斯质粒等。

根据本发明，术语“疫苗用赋形剂或载体”是指选自一种或多种，包括但不限于：pH调节剂，表面活性剂，佐剂，离子强度增强剂。例如，pH调节剂举例但不限于磷酸盐缓冲液，表面活性剂包括阳离子，阴离子或者非离子型表面活性剂。举例但不限于：Tween-80。佐剂举例但不限于氢氧化铝，磷酸铝、无定型羟基磷酸硫酸铝，氟氏完全佐剂。离子强度增强剂举例但不限于氯化钠。

根据本发明，术语“色谱层析”包括但不限于：离子交换色谱、疏水相互作用色谱、吸附层析法（例如羟基磷灰石色谱）、凝胶过滤（凝胶排阻）层析、亲和层析法。

根据本发明，术语“HPV33 L1 H4结构域”是指HPV33 L1 氨基酸序列中“FGLTPPPSASLQDTYRFV

TSQAITCQKT VPPK”，在Genebank登录号为AEI61253的L1序列中第403位氨基酸至434位，或其它HPV33 L1序列中与之对应的氨基酸位置。

根据本发明，在本发明获得的重组HPV33 L1蛋白的方法中，缓冲液是指可在一定范围内维持pH值稳定的溶液，包括但不限于，Tris缓冲液，磷酸盐缓冲液，HEPES缓冲液，MOPS缓冲液等等。

根据本发明，所述原核宿主细胞破碎包括但不限于通过匀浆器破碎、均质机破碎、超声波处理、研磨、高压挤压、溶菌酶处理中的一项或者多项方法来实现；

根据本发明，在本发明获得的重组HPV33 L1蛋白的方法中，所用的盐包括但不限于是中性盐，特别是碱金属盐、铵盐、盐酸盐、硫酸盐，硫酸盐，碳酸氢盐，磷酸盐或磷酸氢盐，特别是NaCI、KCI、NH4CI、(NH4) 2S04中的一种或几种。优选NaCI。所用的还原剂包括但不限于DTT，2-巯基乙醇。所用量包括但不限于lOmM-lOOmM。

根据本发明，所述的疫苗可采用患者可接受的形式，包括但不限于注射或鼻腔或口腔吸入或者阴道给药，优选注射剂。

根据本发明，术语“价”是指组成疫苗的组分所包含的基因型的数量。举例来说HPV16和18型抗原组成的疫苗称为“二价”疫苗。

本发明人经研究发现，经过对HPV33 L1蛋白N端、C端和H4区域的基因重组，再利用大肠杆菌表达系统进行表达即可获得大量的重组GST-HPV33 L1五聚体融合蛋白，该GST-HPV33 L1五聚体蛋白经亲和层析纯化后可得到高产率的HPV33 L1五聚体蛋白，纯度至少85%以上。进一步纯化后的HPV33 L1五聚体蛋白可达到98%以上的纯度并可诱导针对HPV33保护性抗体。本发明基于以上发明现已完成，为大规模工业化生产预防宫颈癌的疫苗提供了一种新方法。

本发明中在N端增加GSGGG或GSGAG，并且与GST蛋白相融合，可大大提高L1蛋白的可溶性，以及提高酶切效率，降低纯化成本，同时利用蛋白酶酶解方法切除GST蛋白，去除了外源杂质的引入；用GSGGG或GAGAS取代H4结构域，可以阻止L1五聚体蛋白进一步聚合，从而得到均一、稳定的五聚体蛋白，例如通过实施例12的实验，发现不同氨基酸序列组成的蛋白产物稳定性不同。其中序列H4结构域经过取代的蛋白产物与H4结构域未经取代的蛋白产物相比更稳定；C端截短氨基酸能够有效避免C端降解、减少由于蛋白降解而导致的产物不纯，从而影响五聚体蛋白疫苗的稳定性。

本发明序列对H4结构域改造所得的HPV33 L1蛋白只能形成五聚体，而且此五聚体具有良好的免疫原性，可以诱导高滴度的针对HPV33的中和抗体，预防HPV33对人体的感染，是一种良好的疫苗形式。在参考下列详述和附图后，本发明的这些和其它方面的有益效果将是显然的。此处公开的所有参考文献在此均完整引用作为参考。

附图说明

图1实施例制备的HPV33 L1五聚体透射电镜观察(100，000倍)结果；结果显示，视野中可见直径为13nm左右的五聚体，颗粒大小与理论大小相符，均匀一致。

图2-A 按照实施例1制备的五聚体的动态光散射观测结果，结果显示五聚体的粒径与粒度分布图。

图2-B按照实施例6制备的 HPV33 L1五聚体的动态光散射观测结果，结果显示五聚体的粒径与粒度分布图。

图3 实施例1 HPV33 L1五聚体蛋白的高压液相分子筛色谱图，图中显示经高度纯化的五聚体蛋白纯度。

图4 实施例制备的HPV33 L1五聚体疫苗接种小鼠后，在第二次加强免疫3周后，检测中和抗体的平均滴度水平。

下面结合实施例对本发明进一步举例描述。这些实施例是非限制性的。

实施例l：具有HPV33 L1序列2的工程菌的构建

1、HPV33 L1基因全长由金唯智生物科技有限公司(GENEWIZ)合成，其核苷酸序列SEQ ID NO：1，其源自GeneBank，序列号为GenBank: M14119.1。

2、含有SEQ ID NO：1基因片段做PCR反应的模板。以正向引物序列：5’- CGCGGATCCGGA GAAAAGGAAGACCCCTTAGGT -3’；在H4结构的5’端引入限制性内切酶AccIII位点，AccIII位点序列为TCCGGA。下游包含XhoI内切酶位点，反向引物序列：5’-GCTCTCCTCGAGTTA TTTAGGTTTT GCTTTAAGAC C-3’, 其5’端引入限制性内切酶XhoI位点，XhoI位点序列为CTCGAG。经PCR反应扩增得到HPV33B。

3、含有SEQ ID NO：1基因片段做PCR反应的模板。以含有引入的限制性内切酶BamHI位点，BamH I位点序列为GGATCC，正向引物序列：5’-CGCGGAGGATCC GGA GGA GGAGCCACAGTGTACCTGCCTCCTG -3’；在H4结构的3’端引入限制性内切酶AccIII位点，AccIII位点序列为TCCGGA，反向引物序列：GCTCTCTCCGGA TCC TCC TCC TTGCCAATCT TCTAAAATAT C；经PCR反应扩增扩增得到HPV33A。

4、HPV33A片段与HPV33B共同用限制性内切酶AccIII酶切，形成特异粘性末端，使用T4 DNA连接酶连接HPV33A和HPV33B片段，使之形成一个删除了H4结构域的、原H4结构域被编码连接多肽GGGSG的核苷碱基序列取代的HPV33C。

5、表达质粒pGEX-4T-2用BamH I和XhoI酶切消化，再用T4连接酶连接HPV33c和表达质粒。BamH I/XhoI酶切鉴定得到插入L1蛋白基因片段的阳性表达克隆pGEX-4T-2-HPV33C。利用M13(+)/(-)引物，测得质粒中插入的目的核苷酸序列正确，其编码的氨基酸序列为SEQ ID NO：2。

6、连接产物经电转化或CaCl2法将重组质粒转化至大肠杆菌中，优选转化大肠杆菌BL21宿主细胞。将转化的BL21细胞涂于含有氨苄青霉素的LB平板培养基上，经37℃培养，挑取单克隆菌落接种于LB液体培养基中37℃培养12 小时，从中取1ml菌液制备甘油管菌种于-70℃保存。

上述各步骤中PCR反应体系包含20μg DNA模板、lx PCR缓冲液、正向和反向特异引物（浓度均为0.2μΜ )、1.5mM镁离子、1.0 单位的 Taq DNA聚合酶；反应条件为：摄氏 95℃变性 5分钟，经 36个 PCR 循环放大，每一循环为 94℃ 30秒， 55℃ 30秒，72℃ 2分钟，反应产物在 72℃下温育10分钟，然后停止反应。

实施例2：具有HPV33 L1序列4的工程菌的构建

1、HPV33 L1基因全长的目标基因片断购自北京安贞医院妇科门诊含有野生型HPV33病毒的临床细胞样本废弃物，其核苷酸序列为SEQ ID NO：3（GenBank: FN870689.1）。

2、含有SEQ ID NO：3基因片段做PCR反应的模板。以正向引物序列：5’-CGCGGATCCGGA GAAAAGGAAGACCCCTTAGGT -3’；在H4结构的5’端引入限制性内切酶AccIII位点，AccIII位点序列为TCCGGA。下游包含XhoI内切酶位点，反向引物序列：5’-GCTCTCCTCGAGTTA TGTGCGGGTG GATGTGGGGG C-3’, 其5’端引入限制性内切酶XhoI位点，XhoI位点序列为CTCGAG。经PCR反应，扩增得到HPV33B。

3、含有SEQ ID NO：3基因片段做PCR反应的模板。以含有引入的限制性内切酶BamHI位点正向引物序列：5’-CGCGGAGGATCC GGA GGA GGA GCCACAGTGTACCTGCCTCCT-3’；在H4结构的3’端引入限制性内切酶AccIII位点，AccIII位点序列为TCCGGA，反向引物序列：GCTCTCTCCGGA TCC TCC TCC TTGCCAATCT TCTAAAATAT C ；经PCR反应，扩增得到HPV33A。

5、表达质粒pGEX-4T-2用BamH I和XhoI酶切消化，再用T4连接酶连接HPV33c和表达质粒。BamH I/XhoI酶切鉴定得到插入L1蛋白基因片段的阳性表达克隆pGEX-4T-2-HPV33C。利用M13(+)/(-)引物，测得质粒中插入的目的核苷酸序列正确，其编码的氨基酸序列为SEQ ID NO：4。

实施例3：具有HPV33 L1序列6的工程菌的构建

1、HPV33 L1基因全长由金唯智生物科技有限公司(GENEWIZ)合成，其核苷酸序列SEQ ID NO：5，其源自GeneBank，序列号为GenBank: FN870694.1。

2、含有SEQ ID NO：3基因片段做PCR反应的模板。以正向引物序列：5’-CGCGGATCCGGA GAAAAGGAAGACCCCTTAGGT-3’；在H4结构的5’端引入限制性内切酶AccIII位点，AccIII位点序列为TCCGGA。下游包含XhoI内切酶位点，反向引物序列：5’-GCTCTCCTCGAGTTA TGTGCGGGTG GATGTGGGGG C-3’, 其5’端引入限制性内切酶XhoI位点，XhoI位点序列为CTCGAG。PCR反应，扩增得到HPV33B。

3、含有SEQ ID NO：3基因片段做PCR反应的模板。以含有引入的限制性内切酶BamHI位点正向引物序列：5’-CGCGGAGGATCC GGA GCC GGA GTACCTGTATCTAAAGTTGTC -3’；在H4结构的3’端引入限制性内切酶AccIII位点，AccIII位点序列为TCCGGA，反向引物序列：5’-GCTCTCTCCGGA TCC GGC TCC TTGCCAATCT TCTAAAATAT C -3’；经PCR反应，扩增得到HPV33A。

4、HPV33A片段与HPV33B共同用限制性内切酶AccIII酶切，形成特异粘性末端，使用T4 DNA连接酶连接HPV33A和HPV33B片段，使之形成一个删除了H4结构域的、原来的H4结构域被编码连接多肽GGGSG的核苷碱基序列取代的HPV33C。

5、表达质粒pGEX-4T-2用BamH I和XhoI酶切消化，再用T4连接酶连接HPV33c和表达质粒。BamH I/XhoI酶切鉴定得到插入L1蛋白基因片段的阳性表达克隆pGEX-4T-2-HPV33C。利用M13(+)/(-)引物，测得质粒中插入的目的核苷酸序列正确，其编码的氨基酸序列为SEQ ID NO：6。

其余操作步骤参照实施例1的方法。

实施例4：具有HPV33 L1序列8的工程菌的构建

1、HPV33 L1基因全长由金唯智生物科技有限公司(GENEWIZ)合成，其核苷酸序列SEQ ID NO：7，其源自GeneBank，序列号为GenBank: HE574702.1。

2、含有SEQ ID NO：7基因片段做PCR反应的模板。以正向引物序列：5’-CGCGGATCCGGA GAAAAGGAAGACCCCTTAGGT-3’；在H4结构的5’端引入限制性内切酶AccIII位点，AccIII位点序列为TCCGGA。下游包含XhoI内切酶位点，反向引物序列：5’-GCTCTCCTCGAGTTA TTTAGGTTTT GCTTTAAGAC C-3’, 其5’端引入限制性内切酶XhoI位点，XhoI位点序列为CTCGAG。经PCR反应，扩增得到HPV33B。

3、含有SEQ ID NO：7基因片段做PCR反应的模板。以含有引入的限制性内切酶NheI 位点正向引物序列：5’-CGCGGA GCTAGCGCC TCC GGA GTACCTGTATCTAAAGTTGTC -3’；在H4结构的3’端引入限制性内切酶AccIII位点，AccIII位点序列为TCCGGA，反向引物序列：5’-GCTCTCTCCGGA TCC TCC TCC TTGCCAATCT TCTAAAATAT C-3’；经PCR反应，扩增得到HPV33A。

5、表达质粒pGEX-4T-2用BamH I和XhoI酶切消化，再用T4连接酶连接HPV33c和表达质粒。BamH I/XhoI酶切鉴定得到插入L1蛋白基因片段的阳性表达克隆pGEX-4T-2-HPV33C。利用M13(+)/(-)引物，测得质粒中插入的目的核苷酸序列正确，其编码的氨基酸序列为SEQ ID NO：8。

其余操作步骤参照实施例1的方法。

实施例5：具有HPV33 L1序列10的工程菌的构建

1、HPV33 L1基因全长由金唯智生物科技有限公司(GENEWIZ)合成，其核苷酸序列SEQ ID NO：9，其源自GeneBank，序列号为GenBank: AF335603.1。

2、含有SEQ ID NO：9基因片段做PCR反应的模板。以正向引物序列：5’-CGCGGATCCGGA GAAAAGGAAGACCCCTTGGGT-3’；在H4结构的5’端引入限制性内切酶AccIII位点，AccIII位点序列为TCCGGA。下游包含XhoI内切酶位点，反向引物序列：5’-GCTCTCCTCGAGTTA TTTTTTAACC TTTTTGCGTT T -3’, 其5’端引入限制性内切酶XhoI位点，XhoI位点序列为CTCGAG。经PCR反应，扩增得到HPV33B。

3、含有SEQ ID NO：9基因片段做PCR反应的模板。以含有引入的限制性内切酶BamHI位点正向引物序列：5’-CGCGGAGGATCC GGA GGA GGA GCCACAGTGTACCTGCCTCCT-3’；在H4结构的3’端引入限制性内切酶AccIII位点，AccIII位点序列为TCCGGA，反向引物序列：5’-GCTCTCTCCGGA TCC TCC TCC TTGCCAATCT TCTAAAATAT C -3’；经PCR反应，扩增得到HPV33A。

5、表达质粒pGEX-4T-2用BamH I和XhoI酶切消化，再用T4连接酶连接HPV33c和表达质粒。BamH I/XhoI酶切鉴定得到插入L1蛋白基因片段的阳性表达克隆pGEX-4T-2-HPV33C。利用M13(+)/(-)引物，测得质粒中插入的目的核苷酸序列正确，其编码的氨基酸序列为SEQ ID NO：10。

其余操作步骤参照实施例1的方法。

实施例6：具有HPV33 L1序列11的工程菌的构建

以合成的含有SEQ ID NO： 1基因片段做PCR反应的模板，N端前8个氨基酸被GSGGG取代，C端不截短氨基酸，按照上述实施例1的方法PCR扩增，得到其目的氨基酸序列为SEQID NO：11。

实施例7：重组HPV33 L1蛋白的大量表达与纯化

蛋白表达：在-70℃中分别取出实施例1- 6的冻存菌种，平板活化，37℃培养14-20h，挑菌苔于80mL种子培养基中，37℃培养10-12h；然后接种于50L种子罐在37℃下培养10-12h；之后接种于500L发酵罐中，发酵培养、诱导表达；诱导表达结束后离心收集菌体。用pH7.4磷酸盐缓冲液重悬菌体，之后破碎，破碎方法可用但不限于：高压匀浆、超声波破碎或溶菌酶溶解等化学或物理手段。离心，获得上清液。可采用Lowry法检测总蛋白量，用Elisa法检测L1含量。

蛋白纯化：上清液可用但不限于盐析、等电点沉淀、离子交换层析、亲和层析、分子筛等分离纯化方法，得到纯度98%的HPV33 L1的五聚体。用电镜观察纯化产物，直径均为10nm左右的五聚体蛋白。

纯化方法具体步骤为将上清溶液中的L1蛋白经亲和色谱纯化：预装谷胱甘肽-琼脂糖树脂(GE公司生产的Glutathione Sepharose 4 B)色谱柱。取浓度为50％的Glutathione Sepharose 4 B树脂匀浆放入色谱柱中(每200ml蛋白清液需要5-10ml树脂匀浆)。用5-10倍的柱床体积的缓冲液A (组分为：50mmol/L的Tric-HCl，200mmol/L 的NaCl，1mmol/L 的EDTA，pH 8.0)洗涤树脂，然后将蛋白清液加入色谱柱中，与树脂混合均匀并在室温下作用20分钟后放出滤过液，用10倍柱床体积的缓冲液A洗涤树脂柱。将精确蛋白酶（Prescission Protease，简称PP酶）用缓冲液A稀释，上样并柱上循环酶切120min。放出酶切液，用适量的缓冲液A洗脱并收集目的蛋白。

离子交换色谱纯化：将上述收集的目的蛋白用Source Q或Mono Q（GE公司）阴离子交换柱进行离子交换层析，收集目的蛋白。

分子筛色谱纯化：将离子交换色谱收集的目的蛋白用分子量在10-600kDa的凝胶过滤介质进行分子筛层析，最终获得纯度大于98%的高纯度HPV33 L1五聚体蛋白。

实施例8：HPV33 L1 五聚体的形态学检测

将实施例1-6构建的工程菌株送上海生工公司测序，测得质粒中插入的目的DNA序列，其编码的氨基酸序列为SEQID NO：2、SEQID NO：4、SEQID NO：6、SEQID NO：8、SEQID NO：10 、SEQID NO：11所示，其中实施例1-5结果表明原来全长序列中H4结构域不复存在，取而代之的是编码连接多肽GGGSG或GAGSG序列的“GGA GGA GGA TCC GGA”或“GGA GCC GGA TCCGGA”核苷酸序列。

将实施例1-6方法获得的工程菌株采用实施例7的方法表达纯化得到的产物HPV33L1五聚体蛋白，透射电镜观察(100，000倍)，结果显示，视野中可见直径为13nm左右的五聚体，颗粒大小与理论大小相符，均匀一致。其中实施1序列所得样品的电镜照片见附图1。

进行颗粒粒径测定。仪器为马尔文 Zetasizer NanoZS的动态光散射粒径仪，使用算法为Regulation算法。样品经0.22 u m滤膜过滤后进行测量，结果见表1。结果表明，六种五聚体平均粒径基本一致13.52-15.53nm，但分散性指数PdI（表明蛋白的均一性）存在显著差异，其中实施例1-5样品的分散性指数较小，说明样品很均一。实施例6样品的分散性指数较大，说明样品不均一。

表1 五聚体平均粒径和分散性指数

其中实施例1所制备的HPV33 L1五聚体颗粒的平均粒径为13.86nm，分散性指数PdI为0.063（具体见附图2-A）；实施例6所制备的HPV33 L1五聚体颗粒的水化分子动力学平均粒径为15.53nm，分散性指数PdI为0.136（具体见附图2-B）。

实施例9：蛋白原液纯度检测

色谱柱为TSK-GEL G3000 SWxl，或相同填料，分离范围10KDa-500 KDa的色谱柱；以pH6.8 的0.1mol/l磷酸盐缓冲液为流动相；流速为1ml/min；检测波长280nm；柱温25℃，上样量不得小于20ug，样品主峰理论塔板数不低于1000，拖尾因子小于2.0，连续进样5针，峰面积的相对标准偏差不得大于3%。

取实施例7所得的HPV蛋白原液，分别稀释浓度为1mg/ml，上样量20ul注入高压液相色谱仪，按照上述方法检测，按面积百分比计算纯度，结果见下表2及附图3（实施1所制备的HPV33 L1五聚体的分子筛层析色谱图），所有处理蛋白纯度均大于98%。

表2 纯化后蛋白原液的纯度

实施例10：含有HPV33 L1五聚体蛋白疫苗的制备

分别将实施例1-6制备后经实施例7步骤纯化的HPV33 L1五聚体蛋白原液用含有0.9% NaCl，pH7.2的硼酸缓冲盐稀释成100μg/ml的蛋白液，取1ml稀释后的蛋白液加入1ml50μg/ml氢氧化铝佐剂，充分混合吸附2小时，即获得50μg/ml的HPV33 L1五聚体蛋白疫苗，于4℃避光保存。

实施例11：HPV33 L1 五聚体疫苗的免疫原性测定

小鼠的免疫原性：将实施例10制备的HPV33 L1五聚体蛋白疫苗用疫苗稀释剂分别稀释成表1所示剂量，以每只0.5mL腹腔注射BALB/C小鼠，每个处理组10只。每3周免疫一次，共免疫2次。每次免疫后三周分别采取每只小鼠血清，采用假病毒细胞中和实验法分别测定每次免疫后的小鼠血清中针对HPV33的中和抗体滴度。结果如表3所示，在第二次加强免疫3周后，检测中和抗体的平均滴度水平如附图4所示。

表3 假病毒细胞中和实验法检测HPV33 L1五聚体蛋白中和抗体水平

结果表明，实施例制备的HPV33 L1五聚体蛋白接种小鼠，第一次免疫3周后即可产生中和抗体；二次免疫后的中和抗体即可达到很高的水平，分别如表所示。实验结果证明，各个实施例所得样品制备的HPV L1五聚体蛋白疫苗可以在动物体内产生中和抗体。说明本发明制备的HPV L1五聚体蛋白疫苗在人体临床试验中具有免疫原性，即能预防HPV33病毒感染引起的疾病。

实施例12：不同HPV33 L1重组序列的蛋白表达量及蛋白稳定性比较

将实施1-6方法构建的工程菌参照实施例7的方法，制备HPV33 L1蛋白，检测表达量(用Lowry法检测总蛋白量，用Elisa法检测L1含量)，之后放置6-20小时比较蛋白的稳定性，结果如表4所示。

表4 蛋白含量及稳定性实验

结果表明，不同氨基酸序列组成的蛋白产物的表达量和稳定性存在差异。其中SEQID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8的表达量基本相同，无显著差异，而且蛋白较稳定。SEQ ID NO：10和NO：11表达量明显低于NO：2、4、6、8序列。表明C端截短不但可以防止C短降解而且可以提高L1蛋白的表达量。从初步稳定性观察来看，H4结构域未改造的SEQ ID NO：11制备的HPV33 L1蛋白纯化产物与其他序列相比，在6小时即出现沉淀，说明H4结构域未改造序列，五聚体仍处于不稳定状态，会继续无规聚集，导致蛋白絮凝沉淀。

SEQUENCE LISTING

<110> 北京康乐卫士生物技术股份有限公司

<120> 重组的人乳头瘤病毒33型L1蛋白及其用途

<130> 2014

<160> 11

<170> PatentIn version 3.3

<210> 1

<211> 1500

<212> DNA

<213> 人工序列

<400> 1

atgtccgtgt ggcggcctag tgaggccaca gtgtacctgc ctcctgtacc tgtatctaaa 60

gttgtcagca ctgatgaata tgtgtctcgc acaagcattt attattatgc tggtagttcc 120

agacttcttg ctgttggcca tccatatttt tctattaaaa atcctaataa cgctaaaaag 180

ttattggtac ccaaagtatc aggcttgcaa tatagggttt ttagggtccg tttaccagat 240

cctaataaat ttggatttcc tgacacctcc ttttataacc ctgatacaca acgattggta 300

tgggcatgtg taggccttga aataggtaga gggcagccat taggcgttgg cataagtggt 360

catcctttat taaacaaatt tgatgacact gaaaccagta acaagtatcc tggacaaccg 420

ggtgctgata atagggaatg tttatccatg gattataaac aaacacagtt atgtttactt 480

ggatgtaagc ctccaacagg ggaacattgg ggtaaaggtg ttgcttgtac taatgcagca 540

cctgccaatg attgtccacc tttagaactt ataaatacta ttattgagga tggtgatatg 600

gtggacacag gatttggttg catggatttt aaaacattgc aggctaataa aagtgatgtt 660

cctattgata tttgtggcag tacatgcaaa tatccagatt atttaaaaat gactagtgag 720

ccttatggtg atagtttatt tttttttctt cgacgtgaac aaatgtttgt aagacacttt 780

tttaataggg ctggtaactt aggagaggct gttcccgatg acctgtacat taaaggttca 840

ggaactactg cctctattca aagcagtgct ttttttccca ctcctagtgg atctatggtt 900

acttccgaat ctcagttatt taataagcca tattggctac aacgtgcaca aggtcataat 960

aatggtattt gttggggcaa tcaggtattt gttactgtgg tagataccac tcgcagtact 1020

aatatgactt tatgcacaca agtaactagt gacagtacat ataaaaatga aaattttaaa 1080

gaatatataa gacatgttga agaatatgat ttacagtttg tttttcaact atgcaaagtt 1140

accttaactg cagaagttat gacatatatt catgctatga atccagatat tttagaagat 1200

tggcaatttg gtttaacacc tcctccatct gctagtttac aggataccta taggtttgtt 1260

acctctcagg ctattacgtg tcaaaaaaca gtacctccaa aggaaaagga agacccctta 1320

ggtaaatata cattttggga agtggattta aaggaaaaat tttcagcaga tttagatcag 1380

tttcctttgg gacgcaagtt tttattacag gcaggtctta aagcaaaacc taaacttaaa 1440

cgtgcagccc ccacatccac ccgcacatcg tctgcaaaac gcaggaaggt taaaaaataa 1500

<210> 2

<211> 447

<212> PRT

<213> 人工序列

<400> 2

Gly Ser Gly Gly Gly Ala Thr Val Tyr Leu Pro Pro Val Pro Val Ser

1 5 10 15

Lys Val Val Ser Thr Asp Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr

20 25 30

Tyr Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Phe Ser

35 40 45

Ile Lys Asn Pro Asn Asn Ala Lys Lys Leu Leu Val Pro Lys Val Ser

50 55 60

Gly Leu Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys

65 70 75 80

Phe Gly Phe Pro Asp Thr Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu

85 90 95

Val Trp Ala Cys Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly

100 105 110

Val Gly Ile Ser Gly His Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu

115 120 125

Thr Ser Asn Lys Tyr Pro Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys

130 135 140

Leu Ser Met Asp Tyr Lys Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys

145 150 155 160

Pro Pro Thr Gly Glu His Trp Gly Lys Gly Val Ala Cys Thr Asn Ala

165 170 175

Ala Pro Ala Asn Asp Cys Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile

180 185 190

Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Cys Met Asp Phe Lys

195 200 205

Thr Leu Gln Ala Asn Lys Ser Asp Val Pro Ile Asp Ile Cys Gly Ser

210 215 220

Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly

225 230 235 240

Asp Ser Leu Phe Phe Phe Leu Arg Arg Glu Gln Met Phe Val Arg His

245 250 255

Phe Phe Asn Arg Ala Gly Asn Leu Gly Glu Ala Val Pro Asp Asp Leu

260 265 270

Tyr Ile Lys Gly Ser Gly Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe

275 280 285

Phe Pro Thr Pro Ser Gly Ser Met Val Thr Ser Glu Ser Gln Leu Phe

290 295 300

Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile

305 310 315 320

Cys Trp Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser

325 330 335

Thr Asn Met Thr Leu Cys Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys

340 345 350

Asn Glu Asn Phe Lys Glu Tyr Ile Arg His Val Glu Glu Tyr Asp Leu

355 360 365

Gln Phe Val Phe Gln Leu Cys Lys Val Thr Leu Thr Ala Glu Val Met

370 375 380

Thr Tyr Ile His Ala Met Asn Pro Asp Ile Leu Glu Asp Trp Gln Gly

385 390 395 400

Gly Gly Ser Gly Lys Glu Asp Pro Leu Gly Lys Tyr Thr Phe Trp Glu

405 410 415

Val Asp Leu Lys Glu Lys Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu

420 425 430

Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu Lys Ala Lys Pro Lys

435 440 445

<210> 3

<211> 1500

<212> DNA

<213> 人工序列

<400> 3

atgtccgtgt ggcggcctag tgaggccaca gtgtacctgc ctcctgtacc tgtatctaaa 60

gttgtcagca ctgatgaata tgtgtctcgc acaagcattt attattatgc tggtagttcc 120

agacttcttg ctgttggcca tccatatttt tctattaaaa atcctaataa cgctaaaaaa 180

ttattggtac ccaaagtatc aggcttgcaa tatagggttt ttagggtccg tttaccagat 240

cctaataaat ttggatttcc tgacacctcc ttttataacc ctgatacaca acgattagta 300

tgggcatgtg taggccttga aataggtaga gggcagccat taggcgttgg cataagtggt 360

catcctttat taaacaaatt tgatgacact gaaaccagta acaagtatcc tggacaaccg 420

ggtgctgata atagggaatg tttatccatg gattataaac aaacacagtt atgtttactt 480

ggatgtaagc ctccaacagg ggaacattgg ggtaaaggtg ttgcttgtac taatgcagca 540

cctgccaatg attgtccacc tttagaactt ataaatacta ttattgagga tggtgatatg 600

gtggacacag gatttggttg catggatttt aaaacattgc aggctaataa aagtgatgtt 660

cctattgata tttgtggcag tacatgcaaa tatccagatt atttaaaaat gactagtgag 720

ccttatggtg atagtttatt tttctttctt cgacgtgaac aaatgtttgt aagacacttt 780

tttaataggg ctggtaaatt aggagaggct gttcccgatg acctgtacat taaaggttca 840

ggaactactg cctctattca aagcagtgct ttttttccca ctcccagtgg atcaatggtt 900

acttccgaat ctcagttatt taataagcca tattggctac aacgtgcaca aggtcataat 960

aatggtattt gttggggcaa tcaggtattt gttactgtgg tagataccac tcgcagtact 1020

aatatgactt tatgcacaca agtaactagt gacagtacat ataaaaatga gaattttaaa 1080

gaatatataa gacatgttga agaatatgat ctacagtttg tttttcaact atgcaaagtt 1140

accttaactg cagaagttat gacatatatt catgctatga atccagatat tttagaagat 1200

tggcaatttg gtttaacacc tcctccatct gctagtttac aggataccta taggtttgtt 1260

acctctcagg ctattacgtg tcaaaaaaca gtacctccaa aggaaaagga agacccctta 1320

ggtaaatata cattttggga agtggattta aaggaaaaat tttcagcaga tttagatcag 1380

tttcctttgg gacgcaagtt tttattacag gcaggtctta aagcaaaacc taaacttaaa 1440

cgtgcagccc ccacatccac ccgcacatcg tctgcaaaac gcaaaaaggt taaaaaataa 1500

<210> 4

<211> 458

<212> PRT

<213> 人工序列

<400> 4

Gly Ser Gly Gly Gly Ala Thr Val Tyr Leu Pro Pro Val Pro Val Ser

1 5 10 15

Lys Val Val Ser Thr Asp Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr

20 25 30

Tyr Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Phe Ser

35 40 45

Ile Lys Asn Pro Asn Asn Ala Lys Lys Leu Leu Val Pro Lys Val Ser

50 55 60

Gly Leu Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys

65 70 75 80

Phe Gly Phe Pro Asp Thr Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu

85 90 95

Val Trp Ala Cys Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly

100 105 110

Val Gly Ile Ser Gly His Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu

115 120 125

Thr Ser Asn Lys Tyr Pro Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys

130 135 140

Leu Ser Met Asp Tyr Lys Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys

145 150 155 160

Pro Pro Thr Gly Glu His Trp Gly Lys Gly Val Ala Cys Thr Asn Ala

165 170 175

Ala Pro Ala Asn Asp Cys Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile

180 185 190

Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Cys Met Asp Phe Lys

195 200 205

Thr Leu Gln Ala Asn Lys Ser Asp Val Pro Ile Asp Ile Cys Gly Ser

210 215 220

Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly

225 230 235 240

Asp Ser Leu Phe Phe Phe Leu Arg Arg Glu Gln Met Phe Val Arg His

245 250 255

Phe Phe Asn Arg Ala Gly Lys Leu Gly Glu Ala Val Pro Asp Asp Leu

260 265 270

Tyr Ile Lys Gly Ser Gly Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe

275 280 285

Phe Pro Thr Pro Ser Gly Ser Met Val Thr Ser Glu Ser Gln Leu Phe

290 295 300

Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile

305 310 315 320

Cys Trp Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser

325 330 335

Thr Asn Met Thr Leu Cys Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys

340 345 350

Asn Glu Asn Phe Lys Glu Tyr Ile Arg His Val Glu Glu Tyr Asp Leu

355 360 365

Gln Phe Val Phe Gln Leu Cys Lys Val Thr Leu Thr Ala Glu Val Met

370 375 380

Thr Tyr Ile His Ala Met Asn Pro Asp Ile Leu Glu Asp Trp Gln Gly

385 390 395 400

Gly Gly Ser Gly Lys Glu Asp Pro Leu Gly Lys Tyr Thr Phe Trp Glu

405 410 415

Val Asp Leu Lys Glu Lys Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu

420 425 430

Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu Lys Ala Lys Pro Lys Leu

435 440 445

Lys Arg Ala Ala Pro Thr Ser Thr Arg Thr

450 455

<210> 5

<211> 1500

<212> DNA

<213> 人工序列

<400> 5

atgtccgtgt ggcggcctag tgaggccaca gtgtacctgc ctcctgtacc tgtatctaaa 60

gttgtcagca ctgatgaata tgtgtctcgc acaagcattt attattatgc tggtagttcc 120

agacttcttg ctgttggcca tccatatttt tctattaaaa atcctactaa cgctaaaaaa 180

ttattggtac ccaaagtatc aggcttgcaa tatagggttt ttagggtccg tttaccagat 240

cctaataaat ttggatttcc tgacacctcc ttttataacc ctgatacaca acgattagta 300

tgggcatgtg taggccttga aataggtaga gggcagccat taggcgttgg cataagtggt 360

catcctttat taaacaaatt tgatgacact gaaaccggta acaagtatcc tggacaaccg 420

ggtgctgata atagggaatg tttatccatg gattataaac aaacacagtt atgtttactt 480

ggatgtaagc ctccaacagg ggaacattgg ggtaaaggtg ttgcttgtac taatgcagca 540

cctgccaatg attgtccacc tttagaactt ataaatacta ttattgagga tggtgatatg 600

gtggacacag gatttggttg catggatttt aaaacattgc aggctaataa aagtgatgtt 660

cctattgata tttgtggcag tacatgcaaa tatccagatt atttaaaaat gactagtgag 720

ccttatggtg atagtttatt tttctttctt cgacgtgaac aaatgtttgt aagacacttt 780

tttaataggg ctggtacatt aggagaggct gttcccgatg acctgtacat taaaggttca 840

ggaactactg cctctattca aagcagtgct ttttttccca ctcctagtgg atcaatggtt 900

acttccgaat ctcagttatt taataagcca tattggctac aacgtgcaca aggtcataat 960

aatggtattt gttggggcaa tcaggtattt gttactgtgg tagataccac tcgcagtact 1020

aatatgactt tatgcacaca agtaactagt gacagtacat ataaaaatga aaattttaaa 1080

gaatatataa gacatgttga agaatatgat ctacagtttg tttttcaact atgcaaagtt 1140

accttaactg cagaagttat gacatatatt catgctatga atccagatat tttagaagat 1200

tggcaatttg gtttaacacc tcctccatct gctagtttac aggataccta taggtttgtt 1260

acctctcagg ctattacgtg tcaaaaaaca gtacctccaa aggaaaagga agacccctta 1320

ggtaaatata cattttggga agtggattta aaggaaaaat tttcagcaga tttagatcag 1380

tttcctttgg gacgcaagtt tttattacag gcaggtctta aagcaaaacc taaacttaaa 1440

cgtgcagccc ccacatccac ccgcacatcg tctgcaaaac gcaaaaaggt taaaaaataa 1500

<210> 6

<211> 451

<212> PRT

<213> 人工序列

<400> 6

Gly Ser Gly Ala Gly Val Pro Val Ser Lys Val Val Ser Thr Asp Glu

1 5 10 15

Tyr Val Ser Arg Thr Ser Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu

20 25 30

Leu Ala Val Gly His Pro Tyr Phe Ser Ile Lys Asn Pro Thr Asn Ala

35 40 45

Lys Lys Leu Leu Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val Phe

50 55 60

Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr Ser

65 70 75 80

Phe Tyr Asn Pro Asp Thr Gln Arg Leu Val Trp Ala Cys Val Gly Leu

85 90 95

Glu Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro

100 105 110

Leu Leu Asn Lys Phe Asp Asp Thr Glu Thr Gly Asn Lys Tyr Pro Gly

115 120 125

Gln Pro Gly Ala Asp Asn Arg Glu Cys Leu Ser Met Asp Tyr Lys Gln

130 135 140

Thr Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Thr Gly Glu His Trp

145 150 155 160

Gly Lys Gly Val Ala Cys Thr Asn Ala Ala Pro Ala Asn Asp Cys Pro

165 170 175

Pro Leu Glu Leu Ile Asn Thr Ile Ile Glu Asp Gly Asp Met Val Asp

180 185 190

Thr Gly Phe Gly Cys Met Asp Phe Lys Thr Leu Gln Ala Asn Lys Ser

195 200 205

Asp Val Pro Ile Asp Ile Cys Gly Ser Thr Cys Lys Tyr Pro Asp Tyr

210 215 220

Leu Lys Met Thr Ser Glu Pro Tyr Gly Asp Ser Leu Phe Phe Phe Leu

225 230 235 240

Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ala Gly Thr

245 250 255

Leu Gly Glu Ala Val Pro Asp Asp Leu Tyr Ile Lys Gly Ser Gly Thr

260 265 270

Thr Ala Ser Ile Gln Ser Ser Ala Phe Phe Pro Thr Pro Ser Gly Ser

275 280 285

Met Val Thr Ser Glu Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu Gln

290 295 300

Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln Val Phe

305 310 315 320

Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Thr Leu Cys Thr

325 330 335

Gln Val Thr Ser Asp Ser Thr Tyr Lys Asn Glu Asn Phe Lys Glu Tyr

340 345 350

Ile Arg His Val Glu Glu Tyr Asp Leu Gln Phe Val Phe Gln Leu Cys

355 360 365

Lys Val Thr Leu Thr Ala Glu Val Met Thr Tyr Ile His Ala Met Asn

370 375 380

Pro Asp Ile Leu Glu Asp Trp Gln Gly Ala Gly Ser Gly Lys Glu Asp

385 390 395 400

Pro Leu Gly Lys Tyr Thr Phe Trp Glu Val Asp Leu Lys Glu Lys Phe

405 410 415

Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln

420 425 430

Ala Gly Leu Lys Ala Lys Pro Lys Leu Lys Arg Ala Ala Pro Thr Ser

435 440 445

Thr Arg Thr

450

<210> 7

<211> 1500

<212> DNA

<213> 人工序列

<400> 7

atgtccgtgt ggcggcctag tgaggccaca gtgtacctgc ctcctgtacc tgtatctaaa 60

gttgtcagca ctgatgaata tgtgtctcgc acaagcattt attattatgc tggtagttcc 120

agacttcttg ctgttggcca tccatatttt tctattaaaa atcctactaa cgctaaaaaa 180

ttattggtac ccaaagtatc aggcttgcaa tatagggttt ttagggtccg tttaccagat 240

cctaataaat ttggatttcc tgacacctcc ttttataacc ctgatacaca acgattagta 300

tgggcatgtg taggccttga aataggtaga gggcagccat taggcgttgg cataagtggt 360

catcctttat taaacaaatt tgatgacact gaaaccggta acaagtatcc tggacaaccg 420

ggtgctgata atagggaatg tttatccatg gattataaac aaacacagtt atgtttactt 480

ggatgtaagc ctccaacagg ggaacattgg ggtaaaggtg ttgcttgtac taatgcagca 540

cctgccaatg attgtccacc tttagaactt ataaatacta ttattgagga tggtgatatg 600

gtggacacag gatttggttg catggatttt aaaacattgc aggctaataa aagtgaagtt 660

cctattgata tttgtggcag tacatgcaaa tatccagatt atttaaaaat gactagtgag 720

ccttatggtg atagtttatt tttctttctt cgacgtgaac aaatgtttgt aagacacttt 780

tttaataggg ctggtacatt aggagaggct gttcccgatg acctgtacat taaaggttca 840

ggaactactg cctctattca aagcagtgct ttttttccca ctcctagtgg atcaatggtt 900

acttccgaat ctcagttatt taataagcca tattggctac aacgtgcaca aggtcataat 960

aatggtattt gttggggcaa tcaggtattt gttactgtgg tagataccac tcgcagtact 1020

aatatgactt tatgcacaca agtaactagt gacagtacat ataaaaatga aaattttaaa 1080

gaatatataa gacatgttga agaatatgat ctacagtttg tttttcaact atgcaaagtt 1140

accctaactg cagaagttat gacatatatt catgctatga atccagatat tttagaagat 1200

tggcaatttg gtttaacacc tcctccatct gctagtttac aggataccta taggtttgtt 1260

acctctcagg ctattacgtg tcaaaaaaca gtacctccaa aggaaaagga agacccctta 1320

ggtaaatata cattttggga agtggattta aaggaaaaat tttcagcaga tttagatcag 1380

tttcctttgg gacgcaagtt tttattacag gcaggtctta aagcaaaacc taaacttaaa 1440

cgtgcagccc ccacatccac ccgcacatcg tctgcaaaac gcaaaaaggt taaaaaataa 1500

<210> 8

<211> 490

<212> PRT

<213> 人工序列

<400> 8

Ala Ser Ala Ser Gly Val Pro Val Ser Lys Val Val Ser Thr Asp Glu

1 5 10 15

Tyr Val Ser Arg Thr Ser Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu

20 25 30

Leu Ala Val Gly His Pro Tyr Phe Ser Ile Lys Asn Pro Thr Asn Ala

35 40 45

Lys Lys Ala Ser Ala Ser Gly Val Pro Val Ser Lys Val Val Ser Thr

50 55 60

Asp Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr Tyr Ala Gly Ser Ser

65 70 75 80

Arg Leu Leu Ala Val Gly His Pro Tyr Phe Ser Ile Lys Asn Pro Thr

85 90 95

Asn Ala Lys Lys Leu Leu Val Pro Lys Val Ser Gly Leu Gln Tyr Arg

100 105 110

Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp

115 120 125

Thr Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu Val Trp Ala Cys Val

130 135 140

Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly

145 150 155 160

His Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu Thr Gly Asn Lys Tyr

165 170 175

Pro Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys Leu Ser Met Asp Tyr

180 185 190

Lys Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Thr Gly Glu

195 200 205

His Trp Gly Lys Gly Val Ala Cys Thr Asn Ala Ala Pro Ala Asn Asp

210 215 220

Cys Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile Glu Asp Gly Asp Met

225 230 235 240

Val Asp Thr Gly Phe Gly Cys Met Asp Phe Lys Thr Leu Gln Ala Asn

245 250 255

Lys Ser Glu Val Pro Ile Asp Ile Cys Gly Ser Thr Cys Lys Tyr Pro

260 265 270

Asp Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly Asp Ser Leu Phe Phe

275 280 285

Phe Leu Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ala

290 295 300

Gly Thr Leu Gly Glu Ala Val Pro Asp Asp Leu Tyr Ile Lys Gly Ser

305 310 315 320

Gly Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe Phe Pro Thr Pro Ser

325 330 335

Gly Ser Met Val Thr Ser Glu Ser Gln Leu Phe Asn Lys Pro Tyr Trp

340 345 350

Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln

355 360 365

Val Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Thr Leu

370 375 380

Cys Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys Asn Glu Asn Phe Lys

385 390 395 400

Glu Tyr Ile Arg His Val Glu Glu Tyr Asp Leu Gln Phe Val Phe Gln

405 410 415

Leu Cys Lys Val Thr Leu Thr Ala Glu Val Met Thr Tyr Ile His Ala

420 425 430

Met Asn Pro Asp Ile Leu Glu Asp Trp Gln Gly Gly Gly Ser Gly Lys

435 440 445

Glu Asp Pro Leu Gly Lys Tyr Thr Phe Trp Glu Val Asp Leu Lys Glu

450 455 460

Lys Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu

465 470 475 480

Leu Gln Ala Gly Leu Lys Ala Lys Pro Lys

485 490

<210> 9

<211> 1500

<212> DNA

<213> 人工序列

<400> 9

atgtccgtgt ggcggcctag tgaggccaca gtgtacctgc ctcctgtacc tgtatctaaa 60

gttgtcagca ctgatgaata tgtgtctcgc acaagcattt attattatgc tggtagttcc 120

agacttcttg ctgttggcca tccatatttt tctattaaaa atcctactaa cgctaaaaaa 180

ttattggtac ccaaagtatc aggcttgcaa tatagggttt ttagggtccg tttaccagat 240

cctaataaat ttggatttcc tgacacctcc ttttataacc ctgatacaca acgattagta 300

tgggcatgtg taggccttga aataggtaga gggcagccat taggcgttgg cataagtggt 360

catcctttat taaacaaatt tgatgacact gaaaccggta acaggtatcc tggacaaccg 420

ggtgctgata atagggaatg tttatccatg gattataaac aaacacagtt atgtttactt 480

ggatgtaagc ctccaacagg ggaacattgg ggtaaaggtg ttgcttgtac taatgcagca 540

cctgccaatg attgtccacc tttagaactt ataaatacta tcattgagga tggtgatatg 600

gtggacacag gatttggttg catggatttt aaaacattgc aggctaataa aagtgatgtt 660

cctattgata tttgtggcag tacatgcaaa tatccagatt atttaaaaat gactagtgag 720

ccttatggtg atagtttatt tttctttctt cgacgtgaac aaatgtttgt aagacacttt 780

tttaataggg ctggtaaatt agaagaggct gttcccgatg acctgtacat taaaggttca 840

ggaactactg cctctattca aagcagtgct ttttttccca ctcctagtgg atcaatggtt 900

acttccgaat ctcagttatt taataagcca tattggctac aacgtgcaca aggtcataat 960

aatggtattt gttggggcaa tcaggtattt gttactgtgg tagataccac tcgcagtact 1020

aatatgactt tatgcacaca ggtaactagt gacagtacat ataaaaatga gaattttaag 1080

gaatatataa gacatgttga agaatatgat ctacagtttg tttttcaact atgcaaagtt 1140

accttaactg cagaagttat gacatatatt catgctatga atccagatat tttagaagat 1200

tggcaatttg gtttaacacc tcctccatct gctagtttac aggataccta taggtttgtt 1260

acctctcagg ctattacgtg tcaaaaaaca gtacctccaa aggaaaagga agaccccttg 1320

ggtaaatata cattttggga agtggattta aaggaaaaat tttcagcaga tttagatcag 1380

tttcctttgg gacgcaagtt tttattacag gcaggtctta aagcaaaacc taaacttaaa 1440

cgtgcagccc ccacatccac ccgcacatcg tctgcaaaac gcaaaaaggt taaaaaataa 1500

<210> 10

<211> 468

<212> PRT

<213> 人工序列

<400> 10

Gly Ser Gly Gly Gly Ala Thr Val Tyr Leu Pro Pro Val Pro Val Ser

1 5 10 15

Lys Val Val Ser Thr Asp Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr

20 25 30

Tyr Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Phe Ser

35 40 45

Ile Lys Asn Pro Thr Asn Ala Lys Lys Leu Leu Val Pro Lys Val Ser

50 55 60

Gly Leu Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys

65 70 75 80

Phe Gly Phe Pro Asp Thr Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu

85 90 95

Val Trp Ala Cys Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly

100 105 110

Val Gly Ile Ser Gly His Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu

115 120 125

Thr Gly Asn Arg Tyr Pro Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys

130 135 140

Leu Ser Met Asp Tyr Lys Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys

145 150 155 160

Pro Pro Thr Gly Glu His Trp Gly Lys Gly Val Ala Cys Thr Asn Ala

165 170 175

Ala Pro Ala Asn Asp Cys Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile

180 185 190

Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Cys Met Asp Phe Lys

195 200 205

Thr Leu Gln Ala Asn Lys Ser Asp Val Pro Ile Asp Ile Cys Gly Ser

210 215 220

Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly

225 230 235 240

Asp Ser Leu Phe Phe Phe Leu Arg Arg Glu Gln Met Phe Val Arg His

245 250 255

Phe Phe Asn Arg Ala Gly Lys Leu Glu Glu Ala Val Pro Asp Asp Leu

260 265 270

Tyr Ile Lys Gly Ser Gly Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe

275 280 285

Phe Pro Thr Pro Ser Gly Ser Met Val Thr Ser Glu Ser Gln Leu Phe

290 295 300

Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile

305 310 315 320

Cys Trp Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser

325 330 335

Thr Asn Met Thr Leu Cys Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys

340 345 350

Asn Glu Asn Phe Lys Glu Tyr Ile Arg His Val Glu Glu Tyr Asp Leu

355 360 365

Gln Phe Val Phe Gln Leu Cys Lys Val Thr Leu Thr Ala Glu Val Met

370 375 380

Thr Tyr Ile His Ala Met Asn Pro Asp Ile Leu Glu Asp Trp Gln Gly

385 390 395 400

Gly Gly Ser Gly Lys Glu Asp Pro Leu Gly Lys Tyr Thr Phe Trp Glu

405 410 415

Val Asp Leu Lys Glu Lys Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu

420 425 430

Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu Lys Ala Lys Pro Lys Leu

435 440 445

Lys Arg Ala Ala Pro Thr Ser Thr Arg Thr Ser Ser Ala Lys Arg Lys

450 455 460

Lys Val Lys Lys

465

<210> 11

<211> 496

<212> PRT

<213> 人工序列

<400> 11

Gly Ser Gly Gly Gly Ala Thr Val Tyr Leu Pro Pro Val Pro Val Ser

1 5 10 15

Lys Val Val Ser Thr Asp Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr

20 25 30

Tyr Ala Gly Ser Ser Arg Leu Leu Ala Val Gly His Pro Tyr Phe Ser

35 40 45

Ile Lys Asn Pro Asn Asn Ala Lys Lys Leu Leu Val Pro Lys Val Ser

50 55 60

Gly Leu Gln Tyr Arg Val Phe Arg Val Arg Leu Pro Asp Pro Asn Lys

65 70 75 80

Phe Gly Phe Pro Asp Thr Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu

85 90 95

Val Trp Ala Cys Val Gly Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly

100 105 110

Val Gly Ile Ser Gly His Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu

115 120 125

Thr Ser Asn Lys Tyr Pro Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys

130 135 140

Leu Ser Met Asp Tyr Lys Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys

145 150 155 160

Pro Pro Thr Gly Glu His Trp Gly Lys Gly Val Ala Cys Thr Asn Ala

165 170 175

Ala Pro Ala Asn Asp Cys Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile

180 185 190

Glu Asp Gly Asp Met Val Asp Thr Gly Phe Gly Cys Met Asp Phe Lys

195 200 205

Thr Leu Gln Ala Asn Lys Ser Asp Val Pro Ile Asp Ile Cys Gly Ser

210 215 220

Thr Cys Lys Tyr Pro Asp Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly

225 230 235 240

Asp Ser Leu Phe Phe Phe Leu Arg Arg Glu Gln Met Phe Val Arg His

245 250 255

Phe Phe Asn Arg Ala Gly Asn Leu Gly Glu Ala Val Pro Asp Asp Leu

260 265 270

Tyr Ile Lys Gly Ser Gly Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe

275 280 285

Phe Pro Thr Pro Ser Gly Ser Met Val Thr Ser Glu Ser Gln Leu Phe

290 295 300

Asn Lys Pro Tyr Trp Leu Gln Arg Ala Gln Gly His Asn Asn Gly Ile

305 310 315 320

Cys Trp Gly Asn Gln Val Phe Val Thr Val Val Asp Thr Thr Arg Ser

325 330 335

Thr Asn Met Thr Leu Cys Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys

340 345 350

Asn Glu Asn Phe Lys Glu Tyr Ile Arg His Val Glu Glu Tyr Asp Leu

355 360 365

Gln Phe Val Phe Gln Leu Cys Lys Val Thr Leu Thr Ala Glu Val Met

370 375 380

Thr Tyr Ile His Ala Met Asn Pro Asp Ile Leu Glu Asp Trp Gln Phe

385 390 395 400

Gly Leu Thr Pro Pro Pro Ser Ala Ser Leu Gln Asp Thr Tyr Arg Phe

405 410 415

Val Thr Ser Gln Ala Ile Thr Cys Gln Lys Thr Val Pro Pro Lys Glu

420 425 430

Lys Glu Asp Pro Leu Gly Lys Tyr Thr Phe Trp Glu Val Asp Leu Lys

435 440 445

Glu Lys Phe Ser Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe

450 455 460

Leu Leu Gln Ala Gly Leu Lys Ala Lys Pro Lys Leu Lys Arg Ala Ala

465 470 475 480

Pro Thr Ser Thr Arg Thr Ser Ser Ala Lys Arg Arg Lys Val Lys Lys

485 490 495

Claims

1.一种重组的HPV33L1蛋白，其特征在于，所述重组的HPV33L1蛋白的氨基酸序列为以下序列中的任意一种：

SEQ ID NO：2；

SEQ ID NO：4；

SEQ ID NO：6；

SEQ ID NO：8；

SEQ ID NO：10。

2.编码权利要求1所述的重组的HPV33L1蛋白的多核苷酸。

3.包含权利要求2所述的多核苷酸的表达载体。

4.包含权利要求3所述的表达载体的细胞。

5.一种HPV33L1蛋白五聚体，其特征在于，所述蛋白五聚体由五个相同的HPV33L1蛋白单体形成，所述HPV33L1蛋白单体的序列如SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQID NO：8或SEQ ID NO：10所示。

6.一种HPV疫苗，其特征在于，所述HPV疫苗包括权利要求5所述的HPV33L1蛋白五聚体和药用佐剂。

7.如权利要求6所述的HPV疫苗的制备方法，其特征在于，该方法为：

A、克隆或合成编码权利要求1所述的重组的HPV33L1蛋白的基因片段；

B、在大肠杆菌或酵母表达系统中表达权利要求1所述的重组的HPV33L1蛋白；

C、纯化由权利要求1所述的重组的HPV33L1蛋白组成的五聚体；

D、将所述HPV33L1蛋白五聚体加入药用佐剂制成疫苗。

8.如权利要求5所述的HPV33L1蛋白五聚体在制备预防HPV33感染及其导致疾病的药物中的应用。

9.如权利要求6所述的HPV疫苗在制备预防HPV33感染及其导致疾病的药物中的应用。