CN106701797B

CN106701797B - 31型重组人乳头瘤病毒病毒样颗粒及其制备方法

Info

Publication number: CN106701797B
Application number: CN201510490172.6A
Authority: CN
Inventors: 刘永江; 伍树明; 高文双; 陈晓; 任永峰; 王雅君; 姜绪林; 张瑞霞; 高俊; 张海江; 张庆峰; 薛俊莲; 张佳涛; 杜晓莉; 夏丽
Original assignee: Beijing Kangleweishi Biological Technology Co ltd
Current assignee: Beijing Kangleweishi Biological Technology Co ltd
Priority date: 2015-08-12
Filing date: 2015-08-12
Publication date: 2021-06-15
Anticipated expiration: 2035-08-12
Also published as: CN106701797A

Abstract

本发明涉及31型重组人乳头瘤病毒病毒样颗粒及其制备方法，具体技术要点是提供一种新的编码重组的HPV31 L1蛋白的多核苷酸基因片段、包含该基因片段的载体、包括载体的宿主细胞，以及由该基因片段翻译表达的HPV31 L1溶合蛋白、五聚体和由该五聚体组成VLP，本发明还公开该五聚体、VLP蛋白及其组成的疫苗组合物在制备预防HPV31感染的药物中的应用。

Description

31型重组人乳头瘤病毒病毒样颗粒及其制备方法

技术领域

本发明涉及人乳头状瘤病毒的病毒样颗粒及其制备方法。更具体而言，本发明涉及一种重组的人乳头瘤病毒L1蛋白的五聚体及病毒样颗粒（Virus-like Particle，VLP）及其制备方法，及含该病毒样颗粒的疫苗组合物在预防人乳头瘤病毒感染中的应用。

背景技术

人乳头瘤病毒(Human Papillomavirus,简称HPV)主要通过人体密切接触，如性传播的病毒，可引起人类多种增殖性上皮病变，包括乳头状瘤（疣）和瘤样病变。具体来讲，HPV诱发的疾病主要包括3大类，第1类:宫颈、阴道、女性外阴、阴茎和肛门的癌症及某些类型的头颈部肿瘤等恶性病变。100%的宫颈癌患者都是HPV感染所导致的，90%的肛门癌，40%的外阴、阴道及阴茎，12%的口咽及3%的口腔癌症归因于HPV感染。第2类:良性病变如扁平疣、尖锐湿疣等生殖器疣，是一种性传播疾病，在性行为活跃的人群中很常见。虽然生殖器疣不会像癌症一样造成严重的后果，但是病变通常会引起病人较为痛苦的临床症状如灼痛、出血和疼痛，同时产生尴尬、焦虑和自卑等负而的心理反应，而且反复治疗的过程浪费了大量的医疗资源。在世界范围内估计由非致癌性HPV(主要是6和11型)引起的生殖器疣有3000万，其中20～50%的病变中还包含有高危型HPV的混合感染。第3类:HPV感染还能引起复发性呼吸道乳头瘤( RRP)，这是一种罕见的、具有潜在致命性的疾病，主要发生在青少年时期，有时，大量的乳头瘤可以引起呼吸困难并导致较小年龄儿童死亡。所以预防或治疗HPV感染对人类健康意义十分重大。

HPV是无囊膜的双链DNA病毒，主要由病毒外壳和基因组DNA组成(Bernard, Burket al. 2011)。HPV病毒外壳是由360个L1蛋白质（形成72个五聚体）和至多72个L2蛋白质构成的二十面体结构，直径55～60 nm(Howley and Lowy 2007)。病毒外壳蛋白质具有自组装特性，在体外L1蛋白质单独或与L2蛋白质共同自组装形成病毒样样颗粒（Virus-likeParticle，VLP）(Chen, Garcea et al. 2000, Finnen, Erickson et al. 2003, Buck,Cheng et al. 2008, Wang and Roden 2013)。

由于HPV不能在体外细胞培养, 要获得该病毒的特异性抗原, 只能用重组DNA 技术的方法制备基因工程疫苗。重组Ll或L1/L2组装形成的病毒样颗粒VLPs，无病毒DNA，安全性好，具有和天然病毒颗粒相似的抗原表位，刺激机体后可产生中和抗体IgG和IgA，因此HPV VLPs可作为预防性疫苗，从而大大降低因感染HPV导致产生相关肿瘤的可能性(Howley and Lowy 2007) 。

HPV疫苗研制的关键是能够大量制备高纯度、稳定的HPV抗原。在HPV疫苗抗原制备技术方面，目前较为常用的生产HPV抗原的表达系统可以分为真核表达系统及原核表达系统。常用的真核表达系统有痘病毒表达系统、昆虫杆状病毒表达系统、酵母表达系统。在真核表达系统中所表达的HPV L1能自发的形成VLP，往往只需进行简单的纯化即可获得VLP。但是由于真核表达系统的表达量低，培养成本高，给大规模工业化生产带来了极大困难。原核表达系统中利用大肠杆菌表达系统表达HPV L1蛋白质已有报道。但是由于大肠杆菌所表达的HPV L1蛋白质可溶性低，目前已知的纯化方法大多通过无盐沉淀或变性复性等步骤从蛋白质种类繁杂的细胞液中最终纯化得到HPV VLP。例如：在专利CN02129070.9中公开通过原核细胞表达和制备HPV L1多聚体的方法，其中纯化工艺包括通过3.3M尿素处理和透析复性过程；在WO-0204007专利中对L1-GST融合蛋白质的纯化方法也是通过尿素变性处理并进行透析复性；在现有技术中也有公开L1蛋白质的纯化方法是包括磷酸缓冲液超滤透析和离心，使目的蛋白沉淀再复溶的步骤。但是在这些纯化过程中蛋白质损失量大，得率低，难以在大规模生产上应用。

在HPV疫苗抗原蛋白质VLP的均一性方面，现有技术中所组装的HPV L1 VLP的粒径分散度有使用polyd值表示，polyd值<15%说明颗粒有很好的均一性，15%到30%之间说明颗粒有较大的不均一性，大于30%说明颗粒完全不够均一。现有技术中制备的HPV L1 VLP多大于15%。另一个说明粒径均一的指标是PdI值，PdI值为粒径分布系数，小于0.05为高度均一的样品；0.05～0.1为准均一的样品，0.1～0.3为均一性较差的样品，大于0.3为不均一的样品。在US7205125B2专利中公开两个型别HPV L1 VLP的混合蛋白液的PdI为0.07。

因此，本领域仍然需要成本低、纯度高、产量高、质量稳定的HPV L1蛋白质生产技术和大规模工业化生产重组HPV L1 VLP的新方法。

发明内容

本发明的目的是公开一种优化的编码HPV31 L1 蛋白质的核苷酸序列，包含该核苷酸序列的载体、包括载体的宿主细胞，以及由该多核苷酸序列翻译表达的HPV L1蛋白质，Tag-HPV-L1重组蛋白，由该L1蛋白质形成的五聚体和VLP，以及由该五聚体和VLP作为抗原组成的预防HPV感染的疫苗。

本发明第一方面提供一种经密码子优化的HPV31 L1的基因,其核苷酸序列为SEQNO：2。

本发明第二方面提供一种构建的表达载体，其包含本发明第一方面的经密码子优化的HPV31 L1的基因。所述载体适合驱动异源DNA在细菌中翻译表达HPV L1蛋白质。在一个实施方案中，所述表达载体优选pGEX-6p-1、pGEX-4T-2、 pMAL或pET28a。

本发明的第三方面提供一种构建的工程菌细胞，该细胞包含本发明第一方面的基因，或第二方面的表达载体。所述的工程菌宿主细胞是大肠杆菌，在一个实施方案中，所述宿主细胞优选BL21细胞株。

本发明第四方面提供一种Tag-HPV31 L1融合蛋白，其中标签Tag为6*His.Tag，GST.Tag，SUMO.Tag，MBP.Tag，6*His - SUMO.Tag或GST- SUMO.Tag；L1为HPV31 L1全长蛋白质和/或C端截短5个、10个、15个或不多于30个氨基酸和/或N端截短2个、4个、6个或不多于10个氨基酸的L1蛋白质。

编码Tag-HPVL1融合蛋白GST-HPV31 L1的核苷酸序列为SEQ NO：3、SEQ NO：11，，GST-SUMO-HPV31 L1的核苷酸序列为SEQ NO：4、SEQ NO：12，MBP的核苷酸序列SEQ NO：5、SEQ NO：13，6*His-HPV31 L1的核苷酸序列为SEQ NO：6， 6*His-SUMO-HPV31 L1的核苷酸序列为SEQ NO：7。

编码Tag-HPVL1融合蛋白GST-HPV31 L1的氨基酸序列为SEQ NO：8，GST-SUMO-HPV31 L1的氨基酸序列为SEQ NO：9，MBP的氨基酸序列SEQ NO：10。

本发明第五方面提供Tag-HPVL1融合蛋白质经过纯化后获得的HPV L1的五聚体，及由五聚体组装的VLP。在一个优选实施例中HPV31 L1五聚体蛋白平均粒径10～15nm PdI<0.1。在一个优选实施例中HPV31 L1VLP的平均粒径45～65nm PdI<0.1。

本发明第六方面提供了一种疫苗组合物，其包含本发明HPV L1的五聚体或HPV L1的VLP，所述组合物中进一步包含可药用的赋形剂和药用佐剂。

在一个实施方案中将含有HPV31 L1五聚体或VLP蛋白原液（根据上述方法制备所得）分别与氢氧化铝佐剂生理盐水溶液按照蛋白与铝含量1:10比例进行吸附配制即可制得重组HPV L1蛋白质五聚体或VLP疫苗，在4℃保存待用。

另一方面，本发明还提供一种获得Tag-HPVL1融合蛋白的方法，包括如下步骤：

A.通过用大肠杆菌偏爱的密码子取代HPV31 L1基因序列的翻译同种蛋白的密码子，得到大肠杆菌表达系统偏爱的密码子优化的HPV31 L1的基因；

B.构建HPV31 L1基因的大肠杆菌表达载体；

C.构建Tag-HPV31 L1的大肠杆菌表达工程菌株；

D.诱导表达并纯化得融合蛋白Tag-HPV31 L1。

上述制备融合蛋白Tag-HPV31 L1方法中原核宿主细胞选自但不限于GI698，ER2566，BL21 (DE3)，XA90，B834 (DE3)，BLR (DE3)。

上述制备融合蛋白Tag-HPV31 L1方法中表达条件是：20～37℃温度条件下，诱导表达3～20小时。在一个具体实施例中优选在28℃温度条件下,诱导表达 16小时。

本发明还提供一种获得HPV31 L1五聚体的方法，包括如下步骤：

a)用亲和层析方法吸附融合蛋白Tag-HPV31 L1；

b)加入蛋白质水解酶切除Tag标签，得到HPV31 L1五聚体蛋白质；

c)纯化HPVL1五聚体蛋白质、得到纯度>98%,平均粒径10～15nm PdI<0.1的L1五聚体蛋白质。

上述制备HPV31 L1五聚体方法中所述用于蛋白酶为切除Tag标签的位点专一的蛋白质水解酶：重组3C蛋白酶，凝血酶，SUMO蛋白酶，SENP1或TEV蛋白酶。

上述制备HPV31 L1五聚体方法中纯化方法选自但不限于离子交换色谱法，疏水性色谱法，分子筛（或称凝胶过滤或分子排阻）色谱法；优选地纯化包括离子交换色谱法和分子筛色谱法。

上述制备HPV31 L1五聚体方法中纯化方法还包括使用还原剂，例如加入DTT。

上述制备HPV31 L1五聚体方法中最终纯化后所得到HPV31 L1五聚体蛋白平均粒径10～15nm PdI<0.1。

本发明还提供了一种HPV31 L1五聚体组装成VLP的方法，包括如下步骤：

将平均粒径10～15nm PdI<0.1的L1五聚体蛋白质液与组装缓冲液混合,最终获得pH值为5.0～5.9，盐浓度为500～2000 mM，平均粒径45～65nm PdI<0.1的HPV31 L1 VLP蛋白质液，优选获得pH值为5.7，盐浓度为1300 mM的HPV31 L1 VLP蛋白质液。

组装缓冲液包括但不限于Tris缓冲液，磷酸盐缓冲液，醋酸缓冲液，HEPES缓冲液，MOPS缓冲液，枸橼酸缓冲液、组氨酸缓冲液，硼酸缓冲液等。

上述HPV31 L1五聚体组装成VLP的方法中HPV31 L1-VLP蛋白质液中还可以加入保护剂，例如：0.01～0.1聚山梨酯80。

本发明还提供了另一种组装VLP的方法—低温冷冻处理组装法，包括如下步骤：

将HPV L1五聚体蛋白质液置于pH值为5.5～8.0 盐浓度为150～1000 mM条件下缓冲液，在-20～-80℃条件下完全冷冻，优选冷冻24小时后，再放置室温至蛋白质原液融解，获得平均粒径45～65nm PdI<0.1的HPV31 L1VLP蛋白质液。

另一方面，本发明还提供了HPV L1的五聚体、VLP和包括五聚体或VLP的疫苗组合物在制备预防HPV感染的药物中的应用。

根据本发明，本发明的疫苗可采用患者可接受的形式，包括但不限于注射或鼻腔或口腔吸入或者阴道给药，优选注射剂和肌内注射。

本发明中相关术语的说明及解释

根据本发明，术语“大肠杆菌表达系统”是指由大肠杆菌（菌株）与载体组成，其中大肠杆菌（菌株）来源于市场上可得到的，在此举例但不限于： GI698，ER2566，BL21 (DE3)，XA90，DH(5a)、B834 (DE3)，BLR (DE3)。

根据本发明，术语“载体”一词指的是，可将某编码蛋白质的多聚核苷酸插入其中并使蛋白质获得表达的一种核酸运载工具。载体可以通过转化，转导或者转染宿主细胞，使其携带的遗传物质元件在宿主细胞中获得表达。举例来说，载体包括：质粒；噬菌体；柯斯质粒等等。

根据本发明，术语“疫苗用赋形剂或载体“是指选自一种或多种，包括但不限于：pH调节剂，表面活性剂，佐剂，离子强度增强剂。例如，pH调节剂举例但不限于磷酸盐缓冲液，表面活性剂包括阳离子，阴离子或者非离子型表面活性剂。举例但不限于：聚山梨酯80。佐剂举例但不限于氢氧化铝，磷酸铝、氟氏完全佐剂、氟氏不完全佐剂等。离子强度增强剂举例但不限于氯化钠。

根据本发明，术语“色谱”包括但不限于：离子交换色谱（例如阳离子交换色谱、阴离子交换色谱）、疏水相互作用色谱、吸附色谱层析法（例如羟基磷灰石色谱）、分子筛色谱层析（凝胶过滤或分子排阻层析）、亲和色谱层析法。

根据本发明，在本发明获得的重组HPV L1蛋白质的方法中，缓冲液是指一种能在加入少量酸或碱和水时大大降低pH变动幅度的溶液，包括但不限于Tris缓冲液，磷酸盐缓冲液，醋酸缓冲液，HEPES缓冲液，MOPS缓冲液，枸橼酸缓冲液、组氨酸缓冲液，硼酸缓冲液等。

根据本发明，所述细胞破碎包括但不限于通过匀浆器破碎、均质机破碎、超声波处理、研磨、高压挤压、溶菌酶处理中的一项或者多项方法来实现；

根据本发明，在本发明获得的重组HPV L1蛋白质的方法中，所用的盐包括但不限于是中性盐，特别是碱金属盐、铵盐、盐酸盐、硫酸盐，碳酸氢盐，磷酸盐或磷酸氢盐，特别是NaCI、KCl、CaCl2、NH4Cl、KCI、NH4CI、MgSO4 、(NH4)2SO4中的一种或几种。优选NaCI。所用的还原剂包括但不限于DTT，2-巯基乙醇。所用量包括但不限于2mM～lO0mM，优选10～15mM。

有益效果

本发明提供了一种合成基因，该基因序列是根据大肠杆菌的密码子偏好进行过密码子优化的核苷酸序列，该序列编码了HPV L1蛋白氨基酸序列。研究发现经过密码子优化的核酸序列相对于未经密码子优化的核酸序列的L1蛋白的表达量有显著提高。

本发明公开的大肠杆菌表达系统具有表达量高、易于培养和操作以及生产成本低等优点。但是，仅仅使用该表达系统仍难以直接获得大量可溶性的HPV L1蛋白，其原因在于L1蛋白极容易形成包涵体，即无生物学活性的不溶性聚合体。此外，即使获得大量的包涵体，为了得到有生物学活性的蛋白，还必须对包涵体进行变性、复性处理，这个过程往往损失大量的蛋白。为了解决这一难题，本发明采用融合技术，将L1基因与具有协助蛋白质正确折叠的蛋白如谷胱甘肽硫转移酶（GST）、SUMO、MBP、6*His- SUMO或GST- SUMO等进行融合表达，不仅蛋白的可溶性及收率有所提高，而且GST-SUMO-HPVL1，6*His-SUMO-HPVL1使得在HPV L1蛋白质N端没有外源氨基酸的残留，同时发现其中的GST-SUMO作为重组蛋白HPVL1表达的融合标签和分子伴侣，具有抗蛋白酶水解、显著增加重组蛋白表达量以及促进靶蛋白正确折叠，提高可溶性等功能。因此本发明采用的技术路线是在构建HPV L1蛋白表达载体时采用了标签蛋白融合技术，一方面通过标签蛋白与L1蛋白形成的融合蛋白来提高目的蛋白的可溶性、提高产量，另一方面通过GST融合标签可以利用亲和层析和蛋白水解酶切除融合质标签方法进行目的蛋白的纯化特点，从而实现了从种类繁杂的细胞裂解液中一步纯化即可获得纯度达到70%以上的HPV L1蛋白，大大提高了纯化效率，从而提高了终产物HPV L1蛋白的产量。

本发明提供的先表达、分离纯化获得高纯度的HPV L1五聚体蛋白后再人工控制组装形成VLP的技术路线，可以解决当前公知技术存在的从杂蛋白种类繁多的细胞破碎液中直接纯化VLP纯度低、降解比例高，收率低的问题，得到高纯度五聚体体外组装VLP及VLP保存条件。

另外，本发明人出人意料地发现了一种新的组装条件和方法：即低温冷冻处理组装法。通过该方法得到的VLP可将冻融前组装的粒径不均一的蛋白质（PdI大于0.1）变成粒径大小符合理论预期而且均一的，PdI小于0.1的VLP，对比现有技术得到的VLP更加稳定，并且可保存于不同盐浓度、pH值范围更广泛的缓冲液中，更便于最终疫苗制剂的稀释和配制。

本发明经重组所得的HPV L1 VLP蛋白质，具有良好的免疫原性，可以诱导高滴度的针对同型HPV的中和抗体，预防HPV对人体的感染，是一种良好的疫苗形式。

在参考下列详述和附图后，本发明的这些和其它方面将是显然的。此处公开的所有参考文献在此均完整引用作为参考。

附图说明

图l：GST-HPV31 L1 蛋白质亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准泳道从上至下为：94kDa，66kDa,45kDa,33kDa,26kDa,20kdat；1泳道为亲和吸附GST-L1的介质，分子量大约为80 kDa；2泳道为酶解后GST与L1的介质。

图2：GST-SUMO-HPV31 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为为蛋白质量标准（从上至下为：94kDa，66kDa,45kDa,33kDa,26kDa,20kDa），1泳道为亲和吸附GST-SUMO -L1的介质，2泳道为酶解后GST-SUMO与L1的介质。

图3：MBP-HPV31 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为为蛋白质量标准（从上至下为：94kDa，66kDa,45kDa,33kDa,26kDa,20kda），1泳道为亲和吸附MBP-L1的介质，2泳道为酶解后MBP与L1的介质。

图4： 6*HIS-SUMO-HPV31 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为为蛋白质量标准（从上至下为：94kDa，66kDa,45kDa,33kDa,26kDa,20kda），1泳道为亲和吸附6*HIS-SUMO - L1的介质，2泳道为酶解后6*HIS-SUMO与L1的介质。通过凝胶电泳图显示蛋白酶切开了带有6*HIS-SUMO标签的溶合蛋白。

图5：本发明经过分子筛色谱纯化后的重组HPV31 L1五聚体蛋白质SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准（从上至下为：94kDa，66kDa,45kDa,33kDa,26kDa,20kda），另一泳道为HPV L1蛋白。

图6：HPV31 L1五聚体的动态光散射观测结果。结果显示五聚体的粒径直径为14.55 nM，粒度分布PdI为 0.077。

图7： HPV31 L1 VLP的动态光散射观测结果。结果显示VLP的粒径直径为53.06 nM，粒度分布PdI为0.055。

图8：HPV31 L1五聚体蛋白的透射电镜照片。

图9：HPV31 L1 VLP蛋白的透射电镜照片。

图10：HPV31 L1五聚体蛋白质的高压液相分子筛色谱图，图中显示经高度纯化的L1五聚体蛋白质纯度大于98%。

图11：HPV31 L1 VLP蛋白质的高压液相分子筛色谱图，图中显示经高度纯化的VLP蛋白质纯度大于98%。

图12：HPV31 L1五聚体各实验组疫苗接种小鼠后，在第二次加强免疫4周后，检测中和抗体的平均滴度水平。

图13：HPV31 L1 VLP各实验组疫苗接种小鼠后，在第二次加强免疫4周后，检测中和抗体的平均滴度水平。

下面结合实施例对本发明进一步举例描述。这些实施例是非限制性的。

实施例l：密码子优化的HPV L1基因的设计与合成

基因序列来源于PUBMED上已公开的各型HPV序列。参照大肠杆菌对基因转录密码子的偏好对选定的各型HPV DNA序列进行密码子优化后合成所有HPV DNA序列。根据合成DNA序列设计引物，利用合成基因为模板进行PCR扩增。所得的密码子优化序列通过DNA序列测定验证。

优化前与优化后的HPV各型DNA序列：

SEQ NO.1：优化前的HPV31型L1的DNA序列

SEQ NO.2：优化后的HPV31型L1的DNA序列

实施例2：重组载体pGEX-6P-1-GST- HPV31 L1的构建及鉴定：

扩增HPV31 L1 的DNA片段引物：（酶切位点分别是BamHI和XhoI）

Forward-HPV31 L1-ApaI:5’ACTTCAGGATCC ATGTCTCTGTGGCGTCCGTCTG

Reverse-HPV31 L1-XhoI:5’ATCTCACTCGAGCTA TTTTTTGGTTTTTTTACGTTT

PCR扩增反应体系：10 x Pfu buffer 20 μL，Pfu酶 4 μL，10 mM dNTP 2.5 μL，5’Primer (5μM) 10μL，3’ Primer (5μM) 10μL，模板DNA 50 ng，加d2H2O至200μL。

基因PCR扩增条件：95℃ 3 min； 95℃ 30 sec，58℃ 30 sec，72℃ 4 min；循环32次；72℃ 10 min。

将含有BamH I和XhoI酶切位点的L1基因片段以及载体pGEX-6P-1进行BamH I/XhoI双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGEX-6P-1进行连接反应，16 ℃ 10～15 h。

连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由上海生工生物公司进行测序，得到融合重组GST-HPV31-L1蛋白质的核苷酸序列为SEQ NO.3，氨基酸序列为SEQ NO.8。

参照该实施例方法制备带有GST-标签的融合重组载体GST-HPV-L1，其基因序列SEQ NO.11。

实施例3：重组载体pGEX-6P-1m-GST-SUMO- HPV31 L1 载体构建

pGEX-6p-1m载体构建：为使得多酶切位点附近的ApaI酶切位点（GGGCCC）为载体的唯一ApaI酶切位点，在不改变lacI基因蛋白质表达序列的前提下，通过点突变技术将市售的pGEX-6p-1载体的另一ApaI识别序列GGGCCC中的Gly密码子GGC改变为它的同义密码子GGT，即可消除ApaI（3890）。通过这样的改造使得ApaI 成为可用来插入表达基因的位点。

扩增SUMO 的DNA片段引物：（酶切位点分别是ApaI和BamHI）

Forward -SUMO-ApaI: ACTTCAGGGCCCTCTGACCAGGAAGCTAAACCGTC

Reverse-SUMO-BamHI: CGCGGATCCACCGGTCTGTTCCTGGTAAAC

扩增HPV31 L1 的DNA片段引物：（酶切位点分别是BamHI和XhoI）

Forward-HPV31 L1-ApaI:5’ACTTCAGGATCC ATGTCTCTGTGGCGTCCGTCTG

Reverse-HPV31 L1-XhoI:5’ATCTCACTCGAGCTA TTTTTTGGTTTTTTTACGTTT

基因PCR扩增条件：95℃ 1.5 min； 95℃ 30 sec，58℃ 30 sec，72℃ 1 min；循环32次；72℃ 10 min。

基因PCR扩增条件同上述实施例。

酶切连接：将含有ApaI和BamHI酶切位点的SUMO基因片段以及载体pGEX-6P-1m进行Apa I/ BamHI双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGEX-6P-1m进行连接反应，16 ℃ 10～15h。

转化鉴定：连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由苏州金唯智生物科技有限公司进行测序，得到融合重组载体pGSTSUMO-6p-1m。

再次酶切连接：将含有BamHI和Xho1酶切位点的L1基因片段以及重组载体pGSTSUMO-6p-1m进行BamHI/Xho1双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGSTSUMO-6p1m进行连接反应，16 ℃ 10～15 h。

再次转化鉴定：连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由苏州金唯智生物科技有限公司进行测序，得到带有GST-SUMO标签的融合重组载体GST-SUMO-L1，其基因序列SEQ NO.4，氨基酸序列为SEQ NO.9。

参照该实施例方法制备带有GST-SUMO标签的融合重组载体GST-SUMO-L1，其基因序列SEQ NO.12。

实施例4：重组载体pMAL—MBP-HPV31 L1的构建

扩增HPV31 L1 的DNA片段引物：（酶切位点分别是EcoRI和HindIII）

Forward-HPV31 L1-EcoRI:5’ ACTTCA GAATTC ATGTCTCTGTGGCGTCCGTCTG

Reverse-HPV31 L1-HindIII:5’ ATCTCA AAGCTTCTA TTTTTTGGTTTTTTTACGTTT

将含有EcoRI和HindIII酶切位点的L1基因片段以及载体pMAL进行EcoRI/HindIII双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pMAL进行连接反应，16 ℃ 10～15 h。

连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由上海生工生物公司进行测序，得到融合重组MBP-HPV31-L1蛋白质的基因序列SEQ NO.5，氨基酸序列为SEQ NO.10。

参照该实施例方法制备带有MBP标签的融合重组载体MBP-HPV-L1，其基因序列SEQNO.13。

实施例5：重组载体pET28a-6*His-HPV31 L1的构建

扩增HPV31 L1 的DNA片段引物：（酶切位点分别是NdeI和XhoI, pET28a）

Forward-HPV31 L1-NdeI:5’ GACTTCA CATATGATGTCTCTGTGGCGTCCGTCTG

Reverse-HPV31 L1-XhoI:5’ CATCTCACTCGAGCTA TTTTTTGGTTTTTTTACGTTT

将含有NdeI和XhoI酶切位点的L1基因片段以及载体pMAL进行NdeI/XhoI双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pET28a进行连接反应，16℃ 10～15 h。

连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由上海生工生物公司进行测序，得到融合重组MBP-HPV31-L1蛋白质的基因序列SEQ NO.6。

实施例6：重组载体6*His-SUMO-HPV31 L1 载体构建

扩增SUMO 的DNA片段引物：（酶切位点分别是NdeI和BamHI）

Forward -SUMO-NdeI: GGAATTCCATATGTCTGACCAGGAAGCTAAACCGTC

Reverse-SUMO-BamHI: CGC GGATCCACCGGTCTGTTCCTGGTAAAC

扩增HPV31 L1 的DNA片段引物：（酶切位点分别是BamHI和XhoI）

Forward-HPV31 L1-ApaI:5’ACTTCAGGATCC ATGTCTCTGTGGCGTCCGTCTG

Reverse-HPV31 L1-XhoI:5’ATCTCACTCGAGCTA TTTTTTGGTTTTTTTACGTTT

SUMO基因、L1基因PCR扩增条件、反应体系同上述实施例所述。

酶切连接：将含有NdeI和BamHI酶切位点的SUMO基因片段以及载体pET-28a进行NdeI/ BamHI双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pET28a进行连接反应，16 ℃ 10～15 h。

转化鉴定：连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由苏州金唯智生物科技有限公司进行测序，得到融合重组载体pETSUMO-28a。

再次酶切连接：将含有BamHI和Xho1酶切位点的L1基因片段以及重组载体pETSUMO-28a进行BamHI/Xho1双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pETSUMO-28a进行连接反应，16 ℃ 10～15 h。

再次转化鉴定：连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由上海生工生物公司进行测序，得到融合重组MBP-HPV31-L1蛋白质的基因序列SEQ NO.7。

实施例7：重组HPV L1五聚体蛋白质的表达

将测序结果正确实施例2、3、4、5和6的重组载体转化大肠杆菌BL21宿主细胞，并作为表达重组蛋白质的工程菌进行HPV L1蛋白的表达。工程菌培养基为2YT培养基（10 g/L胰化蛋白胨；5 g/L酵母粉；10 g/L NaCl）。挑取含重组质粒的菌体单斑于10ml 2YT培养基（含100μg/ml氨苄青霉素）中，230转/分钟（rpm），37℃振荡培养过夜。转接5 ml过夜菌于500 ml（含100 μg/ml 氨苄青霉素）2YT液体培养基中，37℃震荡培养至重组工程菌生长至OD600nm≈0.4～1时，加入终浓度0.2mM的IPTG诱导，在28℃的条件下进行6h以上重组蛋白质的诱导表达。

细胞收集及破碎：对发酵培养物进行离心，弃上清，收获菌体沉淀，称重；使用buffer L（pH 8.0，50 mM Tris，200 mM NaCl，5mM DTT）洗涤沉淀，然后将其重悬于bufferL中进行超声波破碎，随后通过高速离心机对破菌液进行离心（16000 rpm，30 min，4℃），收集上清液。

实施例8：重组HPV L1五聚体蛋白在大肠杆菌中表达量的检测

采用ELISA夹心法检测亲和层析上样前Tag-HPV L1五聚体蛋白在大肠杆菌中表达量,样品及供试品:

包被抗体：自制抗HPV31 L1小鼠单抗。

对照品：自制高纯度的HPV31 L1蛋白。

供试品：用样品稀释液将供试品Tag-HPV31 L1稀释至浓度在对照品梯度稀释浓度范围内。

酶标抗体：自制的辣根过氧化物酶标记的兔抗HPV31 L1蛋白多抗。

结果计算:计算平行孔的平均值，以对照品系列浓度OD₄₅₀吸收值对其相应的L1蛋白抗原作直线方程，平行样品孔间变异系数不得大于10%，直线回归方程R²不得小于0.980，将供试品的OD₄₅₀吸收值代入方程计算出稀释后供试品L1蛋白抗原含量，再乘以相应的稀释倍数即为供试品中L1蛋白抗原含量，见表1。

表1 检测表达后Tag-HPV L1蛋白抗原含量

实施例9：重组HPV L1五聚体蛋白质亲和层析

带GST标签重组蛋白的亲和层析：亲和柱中装入GST琼脂糖亲和层析介质5ml，以buffer L（pH 8.0，50 mM Tris，200 mM NaCl，5mM DTT）平衡层析柱，然后上样实施例8中带有GST或GST-SUMO标签的蛋白液，完毕后以Buffer L洗至无蛋白质流出，亲和完毕。以5mLBuffer L悬浮亲和介质，取样检测并计算介质中结合L1蛋白质的总量。

带MBP标签重组蛋白的亲和层析：亲和柱中装入Amylose-Resin亲和层析介质5ml，以buffer L（pH 8.0，50 mM Tris，200 mM NaCl，5mM DTT）平衡层析柱，然后上样实施例8中带有GST或GST-SUMO标签的蛋白液，完毕后以Buffer L洗至无蛋白质流出，亲和完毕。以5mLBuffer L悬浮亲和介质，取样检测并计算介质中结合L1蛋白质的总量。

带6*HIS标签重组蛋白的亲和层析：取5ml Ni-NTA凝胶装柱，在柱上缓慢加入10倍柱体积的平衡液（50mmol/L NaH2PO4，300mmol/L Nacl，20mmol/L imidazole，用NaOH调整PH值至8），以充分平衡Ni-NTA凝胶，流速为1ml/min。取实施例8中过滤后的带有6*His标签的上清液，完全进入凝胶后，用10倍柱体积的平衡液继续洗涤凝胶，保存流速为1ml/min。用平衡液洗脱至无蛋白质流出，亲和完毕。取样检测并计算介质中结合L1蛋白质的总量。

实施例10：重组Tag-HPV L1蛋白质的酶切纯化

按照目的蛋白质与蛋白酶质量比100：1加入酶量，其中带有GST-HPV-L1的蛋白质用3C蛋白酶切，带有GST-SUMO-HPV-L1和6*His-SUMO-HPV-L1 的蛋白质用SENP1蛋白酶切,带有Mbp-HPV-L1的蛋白质用Factor Xa蛋白酶切,带有6*His-HPV-L1的蛋白质用Thrombin蛋白酶切,分别混合酶切2h后，分别洗脱收集各个蛋白酶切后所得的HPV31 L1五聚体蛋白质溶液。

将3C酶酶切GST标签后的L1蛋白质溶液用SDS- PAGE凝胶电泳检测，结果见图1亲和层析电泳结果，实验表明，可将90%的目的蛋白切下。图2为SENP1蛋白酶切带有GST-SUMO-HPV-L1的蛋白质，用SDS- PAGE凝胶电泳检测。图3为Factor Xa蛋白酶切带有Mbp-HPV-L1的蛋白质，用SDS- PAGE凝胶电泳检测。图1-图3说明说明得到了55kDa 的HPV31 L1蛋白。

Thrombin蛋白酶没有

切开6*His-HPV-L1的蛋白质；用SENP1酶切6*His-SUMO-L1的蛋白质溶液用SDS-PAGE凝胶电泳检测，结果见图4，显示SENP1蛋白酶未能切开带有6*His-SUMO标签的溶合蛋白。

实施例11：重组HPV L1五聚体蛋白质的纯化

分子筛色谱纯化：将上一个实施例收集的酶切纯化后的HPV31 L1五聚体蛋白质分别进行纯化，可先经过离子交换色谱收集的HPV31 L1五聚体蛋白质，或不经过离子交换步骤直接用Superdex200(GE公司生产)的凝胶过滤介质进行进一步分子筛层析，分子筛流动相为pH8.0，10 mM Tris，100 mM NaCl，收集HPV31 L1五聚体蛋白质紫外吸收峰的馏分。

纯化后测定样品纯度：将收集的蛋白质溶液取样用SDS- PAGE凝胶电泳检测，目的蛋白质HPV31 L1五聚体经过分子筛层析纯化后最终纯度均大于98%，详见图5，经过分子筛色谱纯化后的重组HPV31 L1五聚体蛋白质SDS-PAGE凝胶电泳图。

测定样品蛋白浓度：用Bradford法进行蛋白浓度检测，使用标样2mg/ml BAS配制从100ug/ul稀释到500ug/ul，样品反应体系取10ul稀释的BSA+200ulBradford工作液：标准曲线为y = 0.0013 x - 0.0294 ，R² = 0.9986 ，测定样品的 OD₅₉₅，代入标准曲线，计算样品的蛋白浓度，结果见表2。

表2 Bradford法检测重组HPV31 L1五聚体蛋白浓度

注：样品组1为GST-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液；样品组2为GST-SUMO-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液；样品组3为Mbp-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液。

实施例12：重组HPV31 L1五聚体蛋白质组装成VLP

在置于如下盐浓度（NaCl）和PH值条件下，HPV L1五聚体溶液样品组1、2和3，放置稳定后，使用马尔文 Zetasizer NanoZS的动态光散射粒径仪，进行粒径及粒径分布测定（粒径分布系数PdI值为粒径分散度指标，小于0.05为高度均一的样品；0.05～0.1为准均一的样品，0.1～0.3为均一性较差的样品，大于0.3为不均一的样品），，HPV31 L1五聚体蛋白组装得到粒径均一的VLP（PdI＜0.05）。

表3 不同pH和盐浓度条件下组装HPV31 L1 VLP的粒径检测

注：样品组1为GST-HPV L1经分子筛纯化后得HPV L1 VLP蛋白溶液；样品组2为GST-SUMO-HPV L1经分子筛纯化后得HPV L1VLP蛋白溶液；样品组3为Mbp-HPV L1经分子筛纯化后得HPV L1VLP蛋白溶液。

实施例13：动态光散射（DLS）对L1五聚体和VLP蛋白质粒径测定

仪器为马尔文 Zetasizer NanoZS的动态光散射粒径仪，取各样品组最终制得的HPV31 L1五聚体和HPV31 L1 VLP蛋白质进行检测，测平均粒径和分散性指数PdI（表明蛋白质的均一性），说明各组样品最终制备的L1五聚体和VLP蛋白均一。其中样品组2最终制得的五聚体蛋白质和其组装获得的HPV31 L1 VLP蛋白质粒径分布详见附图6和7。

实施例14：HPV31 L1五聚体和VLP的制备

依据本发明上述实施例1-13所采用的技术，制备具有序列11，12，13的HPV31 L1蛋白，以上蛋白均可纯化得到纯度达到98%以上的蛋白，得到平均粒径10～15nm PdI<0.1的HPV31 L1五聚体蛋白。进一步组装得到平均粒径45～65nm PdI<0.1的HPV31 L1VLP蛋白。

实施例15：HPV31 L1 五聚体和VLP的形态学检测

透射电镜观察：将实施例中各个纯化获得的HPV31 L1五聚体蛋白质、组装获得的HPV31 L1-VLP蛋白质，通过中国科学院生物物理所利用透射电镜平台观察。冷冻样品制备及拍照流程：

1)将液氮盒装满液氮，待液面不沸腾时，将乙烷缓慢注入冷却的铜碗中，使之冷却为液态。

2)将铜网在PDC-32型等离子清洗器做亲水性处理。

3)在Vitrobot TM Mark IV冷冻样品制备设备中，将 3.5 μL 的五聚体及VLP样品吸附在 300目的 QUANTIFOIL 铜网中，吸水4s后，通过液态乙烷冷冻样品。

4)迅速将样品转移到液氮中保存。

5)收集冷冻照片时，电子剂量为 20 e-/Å2。数据通过300 KV 的 300 kV TitanKrios 透射电子显微镜的 Gatan UltraScan 4000 CCD记录。加速电压为300 kV。

结果显示，在HPV31 L1五聚体蛋白质样品组中，视野中可见大量直径与理论大小相符的10nm左右的五聚体蛋白；在HPV31 L1-VLP蛋白质样品组中，可见颗粒大小与理论相符的大量直径为50nm左右的病毒样颗粒（VLP），均匀一致。其中GST-SUMO标签组（样品组2）酶切纯化后HPV31 L1五聚体所得样品的透射电镜照片见附图8， Mbp标签组（样品组3）酶切纯化后再组装的VLP蛋白的透射电镜照片见附图9。

实施例16：HPV31 L1蛋白质原液纯度检测

分子排阻高效液相色谱测定：色谱柱Agilent Bio SEC-5um，2000Å，7.8×300mm，柱体积约15 m1，分子量范围≥lO,OOOkDa；以pH6.8 的0.1mol/L磷酸盐缓冲液（称取磷酸氢二钠25.8g，磷酸二氢钠4.37g，加超纯水使溶解，用磷酸调pH至6.8，超纯水定容成1000ml）为流动相；流速为1ml/min；检测波长280nm；柱温25℃，上样量不得小于20ug，样品主峰理论塔板数不低于1000，拖尾因子小于2.0，连续进样5针，峰面积的相对标准偏差不得大于3%。

取纯化后的样品2组最终制得的HPV31 L1五聚体和组装后的VLP的蛋白质原液，分别稀释浓度为1mg/ml，上样量20ul注入高压液相色谱仪，按照上述方法检测，按面积归一法计算纯度，所有处理蛋白质纯度均大于98%，结果见附图10和表4、附图11和表5。

表4 HPV31 L1五聚体的HPLC蛋白质纯度检测

表5 HPV31 L1组装后VLP的HPLC蛋白质纯度检测

实施例17：HPV VLP稳定性实验

将各个样品组最终制得的HPV31 VLP蛋白质在下表的缓冲液条件下，在25℃放置14天至28天，进行粒径检测，结果见下表，证明HPV31 VLP在pH 5.0至5.9，盐浓度500～2000mM下存放稳定。样品组3所得HPV31 VLP在pH 5.0至5.9，盐浓度500～2000mM下放置14-28天后检测结果详见如下表。

表6 HPV31 L1 VLP 在25℃下放置14-28天粒径检测结果

实施例31：制备含有HPV L1 五聚体或VLP的单价疫苗

将含有各个样品组的HPV31 L1五聚体或VLP蛋白原液分别与氢氧化铝佐剂生理盐水溶液按照蛋白与铝含量1:10比例进行吸附配制即可制得重组HPV L1蛋白质五聚体或VLP疫苗，在4℃保存待用。

实施例19：HPV L1 五聚体和VLP的免疫原性测定

分别取上述L1五聚体或VLP疫苗，加入灭菌过的生理盐水分别稀释成20μg/ml浓度的五聚体或VLP蛋白疫苗，以每只0.1ml肌肉注射BALB/c小鼠，每组10只。小鼠每4周加强免疫一次，共免疫2次。加强免疫4周后，采用假病毒细胞中和实验法分别测定每次免疫后的小鼠血清中针对同型HPV的中和抗体滴度，结果如附图12、13所示。

结果表明，HPV L1五聚体和VLP蛋白疫苗接种小鼠，二次免疫后4周中和抗体即可达到很高的水平。实验结果证明，HPV L1五聚体和组装的VLP疫苗均可以在动物体内产生中和抗体，说明HPV L1五聚体和VLP蛋白质疫苗在人体临床试验中都具有免疫原性，即能预防HPV同型病毒引起的疾病。

SEQUENCE LISTING

<110> 北京康乐卫士生物技术股份有限公司

<120> 31型重组人乳头瘤病毒病毒样颗粒及其制备方法

<130> 2015

<160> 13

<170> PatentIn version 3.3

<210> 1

<211> 1503

<212> DNA

<213> 人工序列

<400> 1

atgtggcggc ctagcgacag cacagtatat gtgcctcctc ctaaccctgt atccaaagtt 60

gttgccacgg atgcttatgt tactcgcacc aacatatttt atcatgccag cagttctaga 120

cttcttgcag tgggacatcc ttatttttcc ataaaacggg ctaacaaaac tgttgtgcca 180

aaggtgtcag gatatcaata cagggtattt aaggtggtgt taccagatcc taacaaattt 240

gcattgcctg actcgtctct tttcgatccc acaacacaac gtttagtatg ggcatgcaca 300

ggcctagagg tgggcagggg acagccatta ggtgtgggtg taagtggaca tcctttccta 360

aataaatatg atgatgttga aaattcaggg agtggtggta accctggaca ggataacagg 420

gttaatgtag gtatggatta taaacaaaca caattatgca tggttggatg tgccccccct 480

ttgggcgagc attggggtaa aggtaaacag tgtactaata cacctgtaca ggctggtgac 540

tgcccgccct tagaacttat taccagtgtt atacaggatg gcgatatggt tgacacaggc 600

tttggtgcta tgaattttgc tgatttgcag accaataaat cagatgttcc tattgacata 660

tgtggcacta catgtaaata tccagattat ttacaaatgg ctgcagaccc atatggtgat 720

agattatttt tttttctacg gaaggaacaa atgtttgcca gacatttttt taacagggct 780

ggcgaggtgg gggaacctgt gcctgataca cttataatta agggtagtgg aaatcgcacg 840

tctgtaggga gtagtatata tgttaacacc ccgagcggct ctttggtgtc ctctgaggca 900

caattgttta ataagccata ttggctacaa aaagcccagg gacataacaa tggtatttgt 960

tggggtaatc aactgtttgt tactgtggta gataccacac gcagtaccaa catgacatta 1020

tgtgcatccg taactacatc ttccacatac accaattctg attataaaga gtacatgcgt 1080

catgtggaag agtatgattt acaatttatt tttcaattat gtagcattac attgtctgct 1140

gaagtaatgg cctatattca cacaatgaat ccctctgttt tggaagactg gaactttggg 1200

ttatcgcctc ccccaaatgg tacattagaa gatacctata ggtatgtgca gtcacaggcc 1260

attacctgtc aaaagcccac tcctgaaaag gaaaagccag atccctataa gaaccttagt 1320

ttttgggagg ttaatttaaa agaaaagttt tctagtgaat tggatcagta tcctttggga 1380

cgcaagtttt tgttacaaag tggatatagg ggacggtcct ctattcgtac aggtgttaag 1440

cgccctgctg tttccaaagc ctctgctgcc cctaaacgta agcgcgccaa aactaaaagg 1500

taa 1503

<210> 2

<211> 1515

<212> DNA

<213> 人工序列

<400> 2

atgtctctgt ggcgtccgtc tgaagctacc gtttacctgc cgccggttcc ggtttctaaa 60

gttgtttcta ccgacgaata cgttacccgt accaacatct actaccacgc tggttctgct 120

cgtctgctga ccgttggtca cccgtactac tctatcccga aatctgacaa cccgaaaaaa 180

atcgttgttc cgaaagtttc tggtctgcag taccgtgttt tccgtgttcg tctgccggac 240

ccgaacaaat tcggtttccc ggacacctct ttctacaacc cggaaaccca gcgtctggtt 300

tgggcttgcg ttggtctgga agttggtcgt ggtcagccgc tgggtgttgg tatctctggt 360

cacccgctgc tgaacaaatt cgacgacacc gaaaactcta accgttacgc tggtggtccg 420

ggtaccgaca accgtgaatg catctctatg gactacaaac agacccagct gtgcctgctg 480

ggttgcaaac cgccgatcgg tgaacactgg ggtaaaggtt ctccgtgctc taacaacgct 540

atcaccccgg gtgactgccc gccgctggaa ctgaaaaact ctgttatcca ggacggtgac 600

atggttgaca ccggtttcgg tgctatggac ttcaccgctc tgcaggacac caaatctaac 660

gttccgctgg acatctgcaa ctctatctgc aaatacccgg actacctgaa aatggttgct 720

gaaccgtacg gtgacaccct gttcttctac ctgcgtcgtg aacagatgtt cgttcgtcac 780

ttcttcaacc gttctggtac cgttggtgaa tctgttccga ccgacctgta catcaaaggt 840

tctggttcta ccgctaccct ggctaactct acctacttcc cgaccccgtc tggttctatg 900

gttacctctg acgctcagat cttcaacaaa ccgtactgga tgcagcgtgc tcagggtcac 960

aacaacggta tctgctgggg taaccagctg ttcgttaccg ttgttgacac cacccgttct 1020

accaacatgt ctgtttgcgc tgctatcgct aactctgaca ccaccttcaa atcttctaac 1080

ttcaaagaat acctgcgtca cggtgaagaa ttcgacctgc agttcatctt ccagctgtgc 1140

aaaatcaccc tgtctgctga catcatgacc tacatccact ctatgaaccc ggctatcctg 1200

gaagactgga acttcggtct gaccaccccg ccgtctggtt ctctggaaga cacctaccgt 1260

ttcgttacct ctcaggctat cacctgccag aaaaccgctc cgcagaaacc gaaagaagac 1320

ccgttcaaag actacgtttt ctgggaagtt aacctgaaag aaaaattctc tgctgacctg 1380

gaccagttcc cgctgggtcg taaattcctg ctgcaggctg gttaccgtgc tcgtccgaaa 1440

ttcaaagctg gtaaacgttc tgctccgtct gcttctacca ccaccccggc taaacgtaaa 1500

aaaaccaaaa aatag 1515

<210> 3

<211> 2208

<212> DNA

<213> 人工序列

<400> 3

atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60

ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120

tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180

ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240

atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300

gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360

gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420

acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480

gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540

aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600

tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660

ctggaagttc tgttccaggg gcccctggga tccatgtctc tgtggcgtcc gtctgaagct 720

accgtttacc tgccgccggt tccggtttct aaagttgttt ctaccgacga atacgttacc 780

cgtaccaaca tctactacca cgctggttct gctcgtctgc tgaccgttgg tcacccgtac 840

tactctatcc cgaaatctga caacccgaaa aaaatcgttg ttccgaaagt ttctggtctg 900

cagtaccgtg ttttccgtgt tcgtctgccg gacccgaaca aattcggttt cccggacacc 960

tctttctaca acccggaaac ccagcgtctg gtttgggctt gcgttggtct ggaagttggt 1020

cgtggtcagc cgctgggtgt tggtatctct ggtcacccgc tgctgaacaa attcgacgac 1080

accgaaaact ctaaccgtta cgctggtggt ccgggtaccg acaaccgtga atgcatctct 1140

atggactaca aacagaccca gctgtgcctg ctgggttgca aaccgccgat cggtgaacac 1200

tggggtaaag gttctccgtg ctctaacaac gctatcaccc cgggtgactg cccgccgctg 1260

gaactgaaaa actctgttat ccaggacggt gacatggttg acaccggttt cggtgctatg 1320

gacttcaccg ctctgcagga caccaaatct aacgttccgc tggacatctg caactctatc 1380

tgcaaatacc cggactacct gaaaatggtt gctgaaccgt acggtgacac cctgttcttc 1440

tacctgcgtc gtgaacagat gttcgttcgt cacttcttca accgttctgg taccgttggt 1500

gaatctgttc cgaccgacct gtacatcaaa ggttctggtt ctaccgctac cctggctaac 1560

tctacctact tcccgacccc gtctggttct atggttacct ctgacgctca gatcttcaac 1620

aaaccgtact ggatgcagcg tgctcagggt cacaacaacg gtatctgctg gggtaaccag 1680

ctgttcgtta ccgttgttga caccacccgt tctaccaaca tgtctgtttg cgctgctatc 1740

gctaactctg acaccacctt caaatcttct aacttcaaag aatacctgcg tcacggtgaa 1800

gaattcgacc tgcagttcat cttccagctg tgcaaaatca ccctgtctgc tgacatcatg 1860

acctacatcc actctatgaa cccggctatc ctggaagact ggaacttcgg tctgaccacc 1920

ccgccgtctg gttctctgga agacacctac cgtttcgtta cctctcaggc tatcacctgc 1980

cagaaaaccg ctccgcagaa accgaaagaa gacccgttca aagactacgt tttctgggaa 2040

gttaacctga aagaaaaatt ctctgctgac ctggaccagt tcccgctggg tcgtaaattc 2100

ctgctgcagg ctggttaccg tgctcgtccg aaattcaaag ctggtaaacg ttctgctccg 2160

tctgcttcta ccaccacccc ggctaaacgt aaaaaaacca aaaaatag 2208

<210> 4

<211> 2490

<212> DNA

<213> 人工序列

<400> 4

atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60

ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120

tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180

ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240

atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300

gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360

gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420

acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480

gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540

aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600

tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660

ctggaagttc tgttccaggg gccctctgac caggaagcta aaccgtctac cgaagacctg 720

ggtgacaaaa aagaaggtga atacatcaaa ctgaaagtta tcggtcagga ctcttctgaa 780

atccacttca aagttaaaat gaccacccac ctgaaaaaac tgaaagaatc ttactgccag 840

cgtcagggtg ttccgatgaa ctctctgcgt ttcctgttcg aaggtcagcg tatcgctgac 900

aaccacaccc cgaaagaact gggtatggaa gaagaagacg ttatcgaagt ttaccaggaa 960

cagaccggtg gatccatgtc tctgtggcgt ccgtctgaag ctaccgttta cctgccgccg 1020

gttccggttt ctaaagttgt ttctaccgac gaatacgtta cccgtaccaa catctactac 1080

cacgctggtt ctgctcgtct gctgaccgtt ggtcacccgt actactctat cccgaaatct 1140

gacaacccga aaaaaatcgt tgttccgaaa gtttctggtc tgcagtaccg tgttttccgt 1200

gttcgtctgc cggacccgaa caaattcggt ttcccggaca cctctttcta caacccggaa 1260

acccagcgtc tggtttgggc ttgcgttggt ctggaagttg gtcgtggtca gccgctgggt 1320

gttggtatct ctggtcaccc gctgctgaac aaattcgacg acaccgaaaa ctctaaccgt 1380

tacgctggtg gtccgggtac cgacaaccgt gaatgcatct ctatggacta caaacagacc 1440

cagctgtgcc tgctgggttg caaaccgccg atcggtgaac actggggtaa aggttctccg 1500

tgctctaaca acgctatcac cccgggtgac tgcccgccgc tggaactgaa aaactctgtt 1560

atccaggacg gtgacatggt tgacaccggt ttcggtgcta tggacttcac cgctctgcag 1620

gacaccaaat ctaacgttcc gctggacatc tgcaactcta tctgcaaata cccggactac 1680

ctgaaaatgg ttgctgaacc gtacggtgac accctgttct tctacctgcg tcgtgaacag 1740

atgttcgttc gtcacttctt caaccgttct ggtaccgttg gtgaatctgt tccgaccgac 1800

ctgtacatca aaggttctgg ttctaccgct accctggcta actctaccta cttcccgacc 1860

ccgtctggtt ctatggttac ctctgacgct cagatcttca acaaaccgta ctggatgcag 1920

cgtgctcagg gtcacaacaa cggtatctgc tggggtaacc agctgttcgt taccgttgtt 1980

gacaccaccc gttctaccaa catgtctgtt tgcgctgcta tcgctaactc tgacaccacc 2040

ttcaaatctt ctaacttcaa agaatacctg cgtcacggtg aagaattcga cctgcagttc 2100

atcttccagc tgtgcaaaat caccctgtct gctgacatca tgacctacat ccactctatg 2160

aacccggcta tcctggaaga ctggaacttc ggtctgacca ccccgccgtc tggttctctg 2220

gaagacacct accgtttcgt tacctctcag gctatcacct gccagaaaac cgctccgcag 2280

aaaccgaaag aagacccgtt caaagactac gttttctggg aagttaacct gaaagaaaaa 2340

ttctctgctg acctggacca gttcccgctg ggtcgtaaat tcctgctgca ggctggttac 2400

cgtgctcgtc cgaaattcaa agctggtaaa cgttctgctc cgtctgcttc taccaccacc 2460

ccggctaaac gtaaaaaaac caaaaaatag 2490

<210> 5

<211> 2688

<212> DNA

<213> 人工序列

<400> 5

atgaaaatcg aagaaggtaa actggtaatc tggattaacg gcgataaagg ctataacggt 60

ctcgctgaag tcggtaagaa attcgagaaa gataccggaa ttaaagtcac cgttgagcat 120

ccggataaac tggaagagaa attcccacag gttgcggcaa ctggcgatgg ccctgacatt 180

atcttctggg cacacgaccg ctttggtggc tacgctcaat ctggcctgtt ggctgaaatc 240

accccggaca aagcgttcca ggacaagctg tatccgttta cctgggatgc cgtacgttac 300

aacggcaagc tgattgctta cccgatcgct gttgaagcgt tatcgctgat ttataacaaa 360

gatctgctgc cgaacccgcc aaaaacctgg gaagagatcc cggcgctgga taaagaactg 420

aaagcgaaag gtaagagcgc gctgatgttc aacctgcaag aaccgtactt cacctggccg 480

ctgattgctg ctgacggggg ttatgcgttc aagtatgaaa acggcaagta cgacattaaa 540

gacgtgggcg tggataacgc tggcgcgaaa gcgggtctga ccttcctggt tgacctgatt 600

aaaaacaaac acatgaatgc agacaccgat tactccatcg cagaagctgc ctttaataaa 660

ggcgaaacag cgatgaccat caacggcccg tgggcatggt ccaacatcga caccagcaaa 720

gtgaattatg gtgtaacggt actgccgacc ttcaagggtc aaccatccaa accgttcgtt 780

ggcgtgctga gcgcaggtat taacgccgcc agtccgaaca aagagctggc aaaagagttc 840

ctcgaaaact atctgctgac tgatgaaggt ctggaagcgg ttaataaaga caaaccgctg 900

ggtgccgtag cgctgaagtc ttacgaggaa gagttggcga aagatccacg tattgccgcc 960

actatggaaa acgcccagaa aggtgaaatc atgccgaaca tcccgcagat gtccgctttc 1020

tggtatgccg tgcgtactgc ggtgatcaac gccgccagcg gtcgtcagac tgtcgatgaa 1080

gccctgaaag acgcgcagac taattcgagc tcgaacaaca acaacaataa caataacaac 1140

aacctcggga tcgagggaag gatttcagaa ttcatgtctc tgtggcgtcc gtctgaagct 1200

accgtttacc tgccgccggt tccggtttct aaagttgttt ctaccgacga atacgttacc 1260

cgtaccaaca tctactacca cgctggttct gctcgtctgc tgaccgttgg tcacccgtac 1320

tactctatcc cgaaatctga caacccgaaa aaaatcgttg ttccgaaagt ttctggtctg 1380

cagtaccgtg ttttccgtgt tcgtctgccg gacccgaaca aattcggttt cccggacacc 1440

tctttctaca acccggaaac ccagcgtctg gtttgggctt gcgttggtct ggaagttggt 1500

cgtggtcagc cgctgggtgt tggtatctct ggtcacccgc tgctgaacaa attcgacgac 1560

accgaaaact ctaaccgtta cgctggtggt ccgggtaccg acaaccgtga atgcatctct 1620

atggactaca aacagaccca gctgtgcctg ctgggttgca aaccgccgat cggtgaacac 1680

tggggtaaag gttctccgtg ctctaacaac gctatcaccc cgggtgactg cccgccgctg 1740

gaactgaaaa actctgttat ccaggacggt gacatggttg acaccggttt cggtgctatg 1800

gacttcaccg ctctgcagga caccaaatct aacgttccgc tggacatctg caactctatc 1860

tgcaaatacc cggactacct gaaaatggtt gctgaaccgt acggtgacac cctgttcttc 1920

tacctgcgtc gtgaacagat gttcgttcgt cacttcttca accgttctgg taccgttggt 1980

gaatctgttc cgaccgacct gtacatcaaa ggttctggtt ctaccgctac cctggctaac 2040

tctacctact tcccgacccc gtctggttct atggttacct ctgacgctca gatcttcaac 2100

aaaccgtact ggatgcagcg tgctcagggt cacaacaacg gtatctgctg gggtaaccag 2160

ctgttcgtta ccgttgttga caccacccgt tctaccaaca tgtctgtttg cgctgctatc 2220

gctaactctg acaccacctt caaatcttct aacttcaaag aatacctgcg tcacggtgaa 2280

gaattcgacc tgcagttcat cttccagctg tgcaaaatca ccctgtctgc tgacatcatg 2340

acctacatcc actctatgaa cccggctatc ctggaagact ggaacttcgg tctgaccacc 2400

ccgccgtctg gttctctgga agacacctac cgtttcgtta cctctcaggc tatcacctgc 2460

cagaaaaccg ctccgcagaa accgaaagaa gacccgttca aagactacgt tttctgggaa 2520

gttaacctga aagaaaaatt ctctgctgac ctggaccagt tcccgctggg tcgtaaattc 2580

ctgctgcagg ctggttaccg tgctcgtccg aaattcaaag ctggtaaacg ttctgctccg 2640

tctgcttcta ccaccacccc ggctaaacgt aaaaaaacca aaaaatag 2688

<210> 6

<211> 1578

<212> DNA

<213> 人工序列

<400> 6

atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60

atgatgtctc tgtggcgtcc gtctgaagct accgtttacc tgccgccggt tccggtttct 120

aaagttgttt ctaccgacga atacgttacc cgtaccaaca tctactacca cgctggttct 180

gctcgtctgc tgaccgttgg tcacccgtac tactctatcc cgaaatctga caacccgaaa 240

aaaatcgttg ttccgaaagt ttctggtctg cagtaccgtg ttttccgtgt tcgtctgccg 300

gacccgaaca aattcggttt cccggacacc tctttctaca acccggaaac ccagcgtctg 360

gtttgggctt gcgttggtct ggaagttggt cgtggtcagc cgctgggtgt tggtatctct 420

ggtcacccgc tgctgaacaa attcgacgac accgaaaact ctaaccgtta cgctggtggt 480

ccgggtaccg acaaccgtga atgcatctct atggactaca aacagaccca gctgtgcctg 540

ctgggttgca aaccgccgat cggtgaacac tggggtaaag gttctccgtg ctctaacaac 600

gctatcaccc cgggtgactg cccgccgctg gaactgaaaa actctgttat ccaggacggt 660

gacatggttg acaccggttt cggtgctatg gacttcaccg ctctgcagga caccaaatct 720

aacgttccgc tggacatctg caactctatc tgcaaatacc cggactacct gaaaatggtt 780

gctgaaccgt acggtgacac cctgttcttc tacctgcgtc gtgaacagat gttcgttcgt 840

cacttcttca accgttctgg taccgttggt gaatctgttc cgaccgacct gtacatcaaa 900

ggttctggtt ctaccgctac cctggctaac tctacctact tcccgacccc gtctggttct 960

atggttacct ctgacgctca gatcttcaac aaaccgtact ggatgcagcg tgctcagggt 1020

cacaacaacg gtatctgctg gggtaaccag ctgttcgtta ccgttgttga caccacccgt 1080

tctaccaaca tgtctgtttg cgctgctatc gctaactctg acaccacctt caaatcttct 1140

aacttcaaag aatacctgcg tcacggtgaa gaattcgacc tgcagttcat cttccagctg 1200

tgcaaaatca ccctgtctgc tgacatcatg acctacatcc actctatgaa cccggctatc 1260

ctggaagact ggaacttcgg tctgaccacc ccgccgtctg gttctctgga agacacctac 1320

cgtttcgtta cctctcaggc tatcacctgc cagaaaaccg ctccgcagaa accgaaagaa 1380

gacccgttca aagactacgt tttctgggaa gttaacctga aagaaaaatt ctctgctgac 1440

ctggaccagt tcccgctggg tcgtaaattc ctgctgcagg ctggttaccg tgctcgtccg 1500

aaattcaaag ctggtaaacg ttctgctccg tctgcttcta ccaccacccc ggctaaacgt 1560

aaaaaaacca aaaaatag 1578

<210> 7

<211> 1869

<212> DNA

<213> 人工序列

<400> 7

atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60

atgtctgacc aggaagctaa accgtctacc gaagacctgg gtgacaaaaa agaaggtgaa 120

tacatcaaac tgaaagttat cggtcaggac tcttctgaaa tccacttcaa agttaaaatg 180

accacccacc tgaaaaaact gaaagaatct tactgccagc gtcagggtgt tccgatgaac 240

tctctgcgtt tcctgttcga aggtcagcgt atcgctgaca accacacccc gaaagaactg 300

ggtatggaag aagaagacgt tatcgaagtt taccaggaac agaccggtgg atccatgtct 360

ctgtggcgtc cgtctgaagc taccgtttac ctgccgccgg ttccggtttc taaagttgtt 420

tctaccgacg aatacgttac ccgtaccaac atctactacc acgctggttc tgctcgtctg 480

ctgaccgttg gtcacccgta ctactctatc ccgaaatctg acaacccgaa aaaaatcgtt 540

gttccgaaag tttctggtct gcagtaccgt gttttccgtg ttcgtctgcc ggacccgaac 600

aaattcggtt tcccggacac ctctttctac aacccggaaa cccagcgtct ggtttgggct 660

tgcgttggtc tggaagttgg tcgtggtcag ccgctgggtg ttggtatctc tggtcacccg 720

ctgctgaaca aattcgacga caccgaaaac tctaaccgtt acgctggtgg tccgggtacc 780

gacaaccgtg aatgcatctc tatggactac aaacagaccc agctgtgcct gctgggttgc 840

aaaccgccga tcggtgaaca ctggggtaaa ggttctccgt gctctaacaa cgctatcacc 900

ccgggtgact gcccgccgct ggaactgaaa aactctgtta tccaggacgg tgacatggtt 960

gacaccggtt tcggtgctat ggacttcacc gctctgcagg acaccaaatc taacgttccg 1020

ctggacatct gcaactctat ctgcaaatac ccggactacc tgaaaatggt tgctgaaccg 1080

tacggtgaca ccctgttctt ctacctgcgt cgtgaacaga tgttcgttcg tcacttcttc 1140

aaccgttctg gtaccgttgg tgaatctgtt ccgaccgacc tgtacatcaa aggttctggt 1200

tctaccgcta ccctggctaa ctctacctac ttcccgaccc cgtctggttc tatggttacc 1260

tctgacgctc agatcttcaa caaaccgtac tggatgcagc gtgctcaggg tcacaacaac 1320

ggtatctgct ggggtaacca gctgttcgtt accgttgttg acaccacccg ttctaccaac 1380

atgtctgttt gcgctgctat cgctaactct gacaccacct tcaaatcttc taacttcaaa 1440

gaatacctgc gtcacggtga agaattcgac ctgcagttca tcttccagct gtgcaaaatc 1500

accctgtctg ctgacatcat gacctacatc cactctatga acccggctat cctggaagac 1560

tggaacttcg gtctgaccac cccgccgtct ggttctctgg aagacaccta ccgtttcgtt 1620

acctctcagg ctatcacctg ccagaaaacc gctccgcaga aaccgaaaga agacccgttc 1680

aaagactacg ttttctggga agttaacctg aaagaaaaat tctctgctga cctggaccag 1740

ttcccgctgg gtcgtaaatt cctgctgcag gctggttacc gtgctcgtcc gaaattcaaa 1800

gctggtaaac gttctgctcc gtctgcttct accaccaccc cggctaaacg taaaaaaacc 1860

aaaaaatag 1869

<210> 8

<211> 735

<212> PRT

<213> 人工序列

<400> 8

Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro

1 5 10 15

Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu

20 25 30

Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu

35 40 45

Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys

50 55 60

Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn

65 70 75 80

Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu

85 90 95

Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser

100 105 110

Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu

115 120 125

Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn

130 135 140

Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp

145 150 155 160

Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu

165 170 175

Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr

180 185 190

Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala

195 200 205

Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Glu Val Leu

210 215 220

Phe Gln Gly Pro Leu Gly Ser Met Ser Leu Trp Arg Pro Ser Glu Ala

225 230 235 240

Thr Val Tyr Leu Pro Pro Val Pro Val Ser Lys Val Val Ser Thr Asp

245 250 255

Glu Tyr Val Thr Arg Thr Asn Ile Tyr Tyr His Ala Gly Ser Ala Arg

260 265 270

Leu Leu Thr Val Gly His Pro Tyr Tyr Ser Ile Pro Lys Ser Asp Asn

275 280 285

Pro Lys Lys Ile Val Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val

290 295 300

Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr

305 310 315 320

Ser Phe Tyr Asn Pro Glu Thr Gln Arg Leu Val Trp Ala Cys Val Gly

325 330 335

Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His

340 345 350

Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu Asn Ser Asn Arg Tyr Ala

355 360 365

Gly Gly Pro Gly Thr Asp Asn Arg Glu Cys Ile Ser Met Asp Tyr Lys

370 375 380

Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Ile Gly Glu His

385 390 395 400

Trp Gly Lys Gly Ser Pro Cys Ser Asn Asn Ala Ile Thr Pro Gly Asp

405 410 415

Cys Pro Pro Leu Glu Leu Lys Asn Ser Val Ile Gln Asp Gly Asp Met

420 425 430

Val Asp Thr Gly Phe Gly Ala Met Asp Phe Thr Ala Leu Gln Asp Thr

435 440 445

Lys Ser Asn Val Pro Leu Asp Ile Cys Asn Ser Ile Cys Lys Tyr Pro

450 455 460

Asp Tyr Leu Lys Met Val Ala Glu Pro Tyr Gly Asp Thr Leu Phe Phe

465 470 475 480

Tyr Leu Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ser

485 490 495

Gly Thr Val Gly Glu Ser Val Pro Thr Asp Leu Tyr Ile Lys Gly Ser

500 505 510

Gly Ser Thr Ala Thr Leu Ala Asn Ser Thr Tyr Phe Pro Thr Pro Ser

515 520 525

Gly Ser Met Val Thr Ser Asp Ala Gln Ile Phe Asn Lys Pro Tyr Trp

530 535 540

Met Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln

545 550 555 560

Leu Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Ser Val

565 570 575

Cys Ala Ala Ile Ala Asn Ser Asp Thr Thr Phe Lys Ser Ser Asn Phe

580 585 590

Lys Glu Tyr Leu Arg His Gly Glu Glu Phe Asp Leu Gln Phe Ile Phe

595 600 605

Gln Leu Cys Lys Ile Thr Leu Ser Ala Asp Ile Met Thr Tyr Ile His

610 615 620

Ser Met Asn Pro Ala Ile Leu Glu Asp Trp Asn Phe Gly Leu Thr Thr

625 630 635 640

Pro Pro Ser Gly Ser Leu Glu Asp Thr Tyr Arg Phe Val Thr Ser Gln

645 650 655

Ala Ile Thr Cys Gln Lys Thr Ala Pro Gln Lys Pro Lys Glu Asp Pro

660 665 670

Phe Lys Asp Tyr Val Phe Trp Glu Val Asn Leu Lys Glu Lys Phe Ser

675 680 685

Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala

690 695 700

Gly Tyr Arg Ala Arg Pro Lys Phe Lys Ala Gly Lys Arg Ser Ala Pro

705 710 715 720

Ser Ala Ser Thr Thr Thr Pro Ala Lys Arg Lys Lys Thr Lys Lys

725 730 735

<210> 9

<211> 829

<212> PRT

<213> 人工序列

<400> 9

Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro

1 5 10 15

Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu

20 25 30

Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu

35 40 45

Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys

50 55 60

Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn

65 70 75 80

Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu

85 90 95

Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser

100 105 110

Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu

115 120 125

Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn

130 135 140

Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp

145 150 155 160

Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu

165 170 175

Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr

180 185 190

Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala

195 200 205

Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Glu Val Leu

210 215 220

Phe Gln Gly Pro Ser Asp Gln Glu Ala Lys Pro Ser Thr Glu Asp Leu

225 230 235 240

Gly Asp Lys Lys Glu Gly Glu Tyr Ile Lys Leu Lys Val Ile Gly Gln

245 250 255

Asp Ser Ser Glu Ile His Phe Lys Val Lys Met Thr Thr His Leu Lys

260 265 270

Lys Leu Lys Glu Ser Tyr Cys Gln Arg Gln Gly Val Pro Met Asn Ser

275 280 285

Leu Arg Phe Leu Phe Glu Gly Gln Arg Ile Ala Asp Asn His Thr Pro

290 295 300

Lys Glu Leu Gly Met Glu Glu Glu Asp Val Ile Glu Val Tyr Gln Glu

305 310 315 320

Gln Thr Gly Gly Ser Met Ser Leu Trp Arg Pro Ser Glu Ala Thr Val

325 330 335

Tyr Leu Pro Pro Val Pro Val Ser Lys Val Val Ser Thr Asp Glu Tyr

340 345 350

Val Thr Arg Thr Asn Ile Tyr Tyr His Ala Gly Ser Ala Arg Leu Leu

355 360 365

Thr Val Gly His Pro Tyr Tyr Ser Ile Pro Lys Ser Asp Asn Pro Lys

370 375 380

Lys Ile Val Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val Phe Arg

385 390 395 400

Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr Ser Phe

405 410 415

Tyr Asn Pro Glu Thr Gln Arg Leu Val Trp Ala Cys Val Gly Leu Glu

420 425 430

Val Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro Leu

435 440 445

Leu Asn Lys Phe Asp Asp Thr Glu Asn Ser Asn Arg Tyr Ala Gly Gly

450 455 460

Pro Gly Thr Asp Asn Arg Glu Cys Ile Ser Met Asp Tyr Lys Gln Thr

465 470 475 480

Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Ile Gly Glu His Trp Gly

485 490 495

Lys Gly Ser Pro Cys Ser Asn Asn Ala Ile Thr Pro Gly Asp Cys Pro

500 505 510

Pro Leu Glu Leu Lys Asn Ser Val Ile Gln Asp Gly Asp Met Val Asp

515 520 525

Thr Gly Phe Gly Ala Met Asp Phe Thr Ala Leu Gln Asp Thr Lys Ser

530 535 540

Asn Val Pro Leu Asp Ile Cys Asn Ser Ile Cys Lys Tyr Pro Asp Tyr

545 550 555 560

Leu Lys Met Val Ala Glu Pro Tyr Gly Asp Thr Leu Phe Phe Tyr Leu

565 570 575

Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ser Gly Thr

580 585 590

Val Gly Glu Ser Val Pro Thr Asp Leu Tyr Ile Lys Gly Ser Gly Ser

595 600 605

Thr Ala Thr Leu Ala Asn Ser Thr Tyr Phe Pro Thr Pro Ser Gly Ser

610 615 620

Met Val Thr Ser Asp Ala Gln Ile Phe Asn Lys Pro Tyr Trp Met Gln

625 630 635 640

Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln Leu Phe

645 650 655

Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Ser Val Cys Ala

660 665 670

Ala Ile Ala Asn Ser Asp Thr Thr Phe Lys Ser Ser Asn Phe Lys Glu

675 680 685

Tyr Leu Arg His Gly Glu Glu Phe Asp Leu Gln Phe Ile Phe Gln Leu

690 695 700

Cys Lys Ile Thr Leu Ser Ala Asp Ile Met Thr Tyr Ile His Ser Met

705 710 715 720

Asn Pro Ala Ile Leu Glu Asp Trp Asn Phe Gly Leu Thr Thr Pro Pro

725 730 735

Ser Gly Ser Leu Glu Asp Thr Tyr Arg Phe Val Thr Ser Gln Ala Ile

740 745 750

Thr Cys Gln Lys Thr Ala Pro Gln Lys Pro Lys Glu Asp Pro Phe Lys

755 760 765

Asp Tyr Val Phe Trp Glu Val Asn Leu Lys Glu Lys Phe Ser Ala Asp

770 775 780

Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Gly Tyr

785 790 795 800

Arg Ala Arg Pro Lys Phe Lys Ala Gly Lys Arg Ser Ala Pro Ser Ala

805 810 815

Ser Thr Thr Thr Pro Ala Lys Arg Lys Lys Thr Lys Lys

820 825

<210> 10

<211> 895

<212> PRT

<213> 人工序列

<400> 10

Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys

1 5 10 15

Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr

20 25 30

Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe

35 40 45

Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala

50 55 60

His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile

65 70 75 80

Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp

85 90 95

Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu

100 105 110

Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys

115 120 125

Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly

130 135 140

Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro

145 150 155 160

Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys

165 170 175

Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly

180 185 190

Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp

195 200 205

Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala

210 215 220

Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys

225 230 235 240

Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser

245 250 255

Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro

260 265 270

Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp

275 280 285

Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala

290 295 300

Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala

305 310 315 320

Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln

325 330 335

Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala

340 345 350

Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Asn

355 360 365

Ser Ser Ser Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Leu Gly Ile

370 375 380

Glu Gly Arg Ile Ser Glu Phe Met Ser Leu Trp Arg Pro Ser Glu Ala

385 390 395 400

Thr Val Tyr Leu Pro Pro Val Pro Val Ser Lys Val Val Ser Thr Asp

405 410 415

Glu Tyr Val Thr Arg Thr Asn Ile Tyr Tyr His Ala Gly Ser Ala Arg

420 425 430

Leu Leu Thr Val Gly His Pro Tyr Tyr Ser Ile Pro Lys Ser Asp Asn

435 440 445

Pro Lys Lys Ile Val Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val

450 455 460

Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr

465 470 475 480

Ser Phe Tyr Asn Pro Glu Thr Gln Arg Leu Val Trp Ala Cys Val Gly

485 490 495

Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His

500 505 510

Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu Asn Ser Asn Arg Tyr Ala

515 520 525

Gly Gly Pro Gly Thr Asp Asn Arg Glu Cys Ile Ser Met Asp Tyr Lys

530 535 540

Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Ile Gly Glu His

545 550 555 560

Trp Gly Lys Gly Ser Pro Cys Ser Asn Asn Ala Ile Thr Pro Gly Asp

565 570 575

Cys Pro Pro Leu Glu Leu Lys Asn Ser Val Ile Gln Asp Gly Asp Met

580 585 590

Val Asp Thr Gly Phe Gly Ala Met Asp Phe Thr Ala Leu Gln Asp Thr

595 600 605

Lys Ser Asn Val Pro Leu Asp Ile Cys Asn Ser Ile Cys Lys Tyr Pro

610 615 620

Asp Tyr Leu Lys Met Val Ala Glu Pro Tyr Gly Asp Thr Leu Phe Phe

625 630 635 640

Tyr Leu Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ser

645 650 655

Gly Thr Val Gly Glu Ser Val Pro Thr Asp Leu Tyr Ile Lys Gly Ser

660 665 670

Gly Ser Thr Ala Thr Leu Ala Asn Ser Thr Tyr Phe Pro Thr Pro Ser

675 680 685

Gly Ser Met Val Thr Ser Asp Ala Gln Ile Phe Asn Lys Pro Tyr Trp

690 695 700

Met Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln

705 710 715 720

Leu Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Ser Val

725 730 735

Cys Ala Ala Ile Ala Asn Ser Asp Thr Thr Phe Lys Ser Ser Asn Phe

740 745 750

Lys Glu Tyr Leu Arg His Gly Glu Glu Phe Asp Leu Gln Phe Ile Phe

755 760 765

Gln Leu Cys Lys Ile Thr Leu Ser Ala Asp Ile Met Thr Tyr Ile His

770 775 780

Ser Met Asn Pro Ala Ile Leu Glu Asp Trp Asn Phe Gly Leu Thr Thr

785 790 795 800

Pro Pro Ser Gly Ser Leu Glu Asp Thr Tyr Arg Phe Val Thr Ser Gln

805 810 815

Ala Ile Thr Cys Gln Lys Thr Ala Pro Gln Lys Pro Lys Glu Asp Pro

820 825 830

Phe Lys Asp Tyr Val Phe Trp Glu Val Asn Leu Lys Glu Lys Phe Ser

835 840 845

Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala

850 855 860

Gly Tyr Arg Ala Arg Pro Lys Phe Lys Ala Gly Lys Arg Ser Ala Pro

865 870 875 880

Ser Ala Ser Thr Thr Thr Pro Ala Lys Arg Lys Lys Thr Lys Lys

885 890 895

<210> 11

<211> 2100

<212> DNA

<213> 人工序列

<400> 11

atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60

ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120

tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180

ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240

atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300

gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360

gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420

acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480

gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540

aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600

tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660

ctggaagttc tgttccaggg gccctctgaa gctaccgttt acctgccgcc ggttccggtt 720

tctaaagttg tttctaccga cgaatacgtt acccgtacca acatctacta ccacgctggt 780

tctgctcgtc tgctgaccgt tggtcacccg tactactcta tcccgaaatc tgacaacccg 840

aaaaaaatcg ttgttccgaa agtttctggt ctgcagtacc gtgttttccg tgttcgtctg 900

ccggacccga acaaattcgg tttcccggac acctctttct acaacccgga aacccagcgt 960

ctggtttggg cttgcgttgg tctggaagtt ggtcgtggtc agccgctggg tgttggtatc 1020

tctggtcacc cgctgctgaa caaattcgac gacaccgaaa actctaaccg ttacgctggt 1080

ggtccgggta ccgacaaccg tgaatgcatc tctatggact acaaacagac ccagctgtgc 1140

ctgctgggtt gcaaaccgcc gatcggtgaa cactggggta aaggttctcc gtgctctaac 1200

aacgctatca ccccgggtga ctgcccgccg ctggaactga aaaactctgt tatccaggac 1260

ggtgacatgg ttgacaccgg tttcggtgct atggacttca ccgctctgca ggacaccaaa 1320

tctaacgttc cgctggacat ctgcaactct atctgcaaat acccggacta cctgaaaatg 1380

gttgctgaac cgtacggtga caccctgttc ttctacctgc gtcgtgaaca gatgttcgtt 1440

cgtcacttct tcaaccgttc tggtaccgtt ggtgaatctg ttccgaccga cctgtacatc 1500

aaaggttctg gttctaccgc taccctggct aactctacct acttcccgac cccgtctggt 1560

tctatggtta cctctgacgc tcagatcttc aacaaaccgt actggatgca gcgtgctcag 1620

ggtcacaaca acggtatctg ctggggtaac cagctgttcg ttaccgttgt tgacaccacc 1680

cgttctacca acatgtctgt ttgcgctgct atcgctaact ctgacaccac cttcaaatct 1740

tctaacttca aagaatacct gcgtcacggt gaagaattcg acctgcagtt catcttccag 1800

ctgtgcaaaa tcaccctgtc tgctgacatc atgacctaca tccactctat gaacccggct 1860

atcctggaag actggaactt cggtctgacc accccgccgt ctggttctct ggaagacacc 1920

taccgtttcg ttacctctca ggctatcacc tgccagaaaa ccgctccgca gaaaccgaaa 1980

gaagacccgt tcaaagacta cgttttctgg gaagttaacc tgaaagaaaa attctctgct 2040

gacctggacc agttcccgct gggtcgtaaa ttcctgctgc aggctggtta ccgtgcttag 2100

<210> 12

<211> 2472

<212> DNA

<213> 人工序列

<400> 12

atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60

ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120

tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180

ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240

atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300

gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360

gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420

acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480

gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540

aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600

tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660

ctggaagttc tgttccaggg gccctctgac caggaagcta aaccgtctac cgaagacctg 720

ggtgacaaaa aagaaggtga atacatcaaa ctgaaagtta tcggtcagga ctcttctgaa 780

atccacttca aagttaaaat gaccacccac ctgaaaaaac tgaaagaatc ttactgccag 840

cgtcagggtg ttccgatgaa ctctctgcgt ttcctgttcg aaggtcagcg tatcgctgac 900

aaccacaccc cgaaagaact gggtatggaa gaagaagacg ttatcgaagt ttaccaggaa 960

cagaccggtg gatcctctga agctaccgtt tacctgccgc cggttccggt ttctaaagtt 1020

gtttctaccg acgaatacgt tacccgtacc aacatctact accacgctgg ttctgctcgt 1080

ctgctgaccg ttggtcaccc gtactactct atcccgaaat ctgacaaccc gaaaaaaatc 1140

gttgttccga aagtttctgg tctgcagtac cgtgttttcc gtgttcgtct gccggacccg 1200

aacaaattcg gtttcccgga cacctctttc tacaacccgg aaacccagcg tctggtttgg 1260

gcttgcgttg gtctggaagt tggtcgtggt cagccgctgg gtgttggtat ctctggtcac 1320

ccgctgctga acaaattcga cgacaccgaa aactctaacc gttacgctgg tggtccgggt 1380

accgacaacc gtgaatgcat ctctatggac tacaaacaga cccagctgtg cctgctgggt 1440

tgcaaaccgc cgatcggtga acactggggt aaaggttctc cgtgctctaa caacgctatc 1500

accccgggtg actgcccgcc gctggaactg aaaaactctg ttatccagga cggtgacatg 1560

gttgacaccg gtttcggtgc tatggacttc accgctctgc aggacaccaa atctaacgtt 1620

ccgctggaca tctgcaactc tatctgcaaa tacccggact acctgaaaat ggttgctgaa 1680

ccgtacggtg acaccctgtt cttctacctg cgtcgtgaac agatgttcgt tcgtcacttc 1740

ttcaaccgtt ctggtaccgt tggtgaatct gttccgaccg acctgtacat caaaggttct 1800

ggttctaccg ctaccctggc taactctacc tacttcccga ccccgtctgg ttctatggtt 1860

acctctgacg ctcagatctt caacaaaccg tactggatgc agcgtgctca gggtcacaac 1920

aacggtatct gctggggtaa ccagctgttc gttaccgttg ttgacaccac ccgttctacc 1980

aacatgtctg tttgcgctgc tatcgctaac tctgacacca ccttcaaatc ttctaacttc 2040

aaagaatacc tgcgtcacgg tgaagaattc gacctgcagt tcatcttcca gctgtgcaaa 2100

atcaccctgt ctgctgacat catgacctac atccactcta tgaacccggc tatcctggaa 2160

gactggaact tcggtctgac caccccgccg tctggttctc tggaagacac ctaccgtttc 2220

gttacctctc aggctatcac ctgccagaaa accgctccgc agaaaccgaa agaagacccg 2280

ttcaaagact acgttttctg ggaagttaac ctgaaagaaa aattctctgc tgacctggac 2340

cagttcccgc tgggtcgtaa attcctgctg caggctggtt accgtgctcg tccgaaattc 2400

aaagctggta aacgttctgc tccgtctgct tctaccacca ccccggctaa acgtaaaaaa 2460

accaaaaaat ag 2472

<210> 13

<211> 2643

<212> DNA

<213> 人工序列

<400> 13

atgaaaatcg aagaaggtaa actggtaatc tggattaacg gcgataaagg ctataacggt 60

ctcgctgaag tcggtaagaa attcgagaaa gataccggaa ttaaagtcac cgttgagcat 120

ccggataaac tggaagagaa attcccacag gttgcggcaa ctggcgatgg ccctgacatt 180

atcttctggg cacacgaccg ctttggtggc tacgctcaat ctggcctgtt ggctgaaatc 240

accccggaca aagcgttcca ggacaagctg tatccgttta cctgggatgc cgtacgttac 300

aacggcaagc tgattgctta cccgatcgct gttgaagcgt tatcgctgat ttataacaaa 360

gatctgctgc cgaacccgcc aaaaacctgg gaagagatcc cggcgctgga taaagaactg 420

aaagcgaaag gtaagagcgc gctgatgttc aacctgcaag aaccgtactt cacctggccg 480

ctgattgctg ctgacggggg ttatgcgttc aagtatgaaa acggcaagta cgacattaaa 540

gacgtgggcg tggataacgc tggcgcgaaa gcgggtctga ccttcctggt tgacctgatt 600

aaaaacaaac acatgaatgc agacaccgat tactccatcg cagaagctgc ctttaataaa 660

ggcgaaacag cgatgaccat caacggcccg tgggcatggt ccaacatcga caccagcaaa 720

gtgaattatg gtgtaacggt actgccgacc ttcaagggtc aaccatccaa accgttcgtt 780

ggcgtgctga gcgcaggtat taacgccgcc agtccgaaca aagagctggc aaaagagttc 840

ctcgaaaact atctgctgac tgatgaaggt ctggaagcgg ttaataaaga caaaccgctg 900

ggtgccgtag cgctgaagtc ttacgaggaa gagttggcga aagatccacg tattgccgcc 960

actatggaaa acgcccagaa aggtgaaatc atgccgaaca tcccgcagat gtccgctttc 1020

tggtatgccg tgcgtactgc ggtgatcaac gccgccagcg gtcgtcagac tgtcgatgaa 1080

gccctgaaag acgcgcagac taattcgagc tcgaacaaca acaacaataa caataacaac 1140

aacctcggga tcgagggaag gatttcagaa ttcatgtctc tgtggcgtcc gtctgaagct 1200

accgtttacc tgccgccggt tccggtttct aaagttgttt ctaccgacga atacgttacc 1260

cgtaccaaca tctactacca cgctggttct gctcgtctgc tgaccgttgg tcacccgtac 1320

tactctatcc cgaaatctga caacccgaaa aaaatcgttg ttccgaaagt ttctggtctg 1380

cagtaccgtg ttttccgtgt tcgtctgccg gacccgaaca aattcggttt cccggacacc 1440

tctttctaca acccggaaac ccagcgtctg gtttgggctt gcgttggtct ggaagttggt 1500

cgtggtcagc cgctgggtgt tggtatctct ggtcacccgc tgctgaacaa attcgacgac 1560

accgaaaact ctaaccgtta cgctggtggt ccgggtaccg acaaccgtga atgcatctct 1620

atggactaca aacagaccca gctgtgcctg ctgggttgca aaccgccgat cggtgaacac 1680

tggggtaaag gttctccgtg ctctaacaac gctatcaccc cgggtgactg cccgccgctg 1740

gaactgaaaa actctgttat ccaggacggt gacatggttg acaccggttt cggtgctatg 1800

gacttcaccg ctctgcagga caccaaatct aacgttccgc tggacatctg caactctatc 1860

tgcaaatacc cggactacct gaaaatggtt gctgaaccgt acggtgacac cctgttcttc 1920

tacctgcgtc gtgaacagat gttcgttcgt cacttcttca accgttctgg taccgttggt 1980

gaatctgttc cgaccgacct gtacatcaaa ggttctggtt ctaccgctac cctggctaac 2040

tctacctact tcccgacccc gtctggttct atggttacct ctgacgctca gatcttcaac 2100

aaaccgtact ggatgcagcg tgctcagggt cacaacaacg gtatctgctg gggtaaccag 2160

ctgttcgtta ccgttgttga caccacccgt tctaccaaca tgtctgtttg cgctgctatc 2220

gctaactctg acaccacctt caaatcttct aacttcaaag aatacctgcg tcacggtgaa 2280

gaattcgacc tgcagttcat cttccagctg tgcaaaatca ccctgtctgc tgacatcatg 2340

acctacatcc actctatgaa cccggctatc ctggaagact ggaacttcgg tctgaccacc 2400

ccgccgtctg gttctctgga agacacctac cgtttcgtta cctctcaggc tatcacctgc 2460

cagaaaaccg ctccgcagaa accgaaagaa gacccgttca aagactacgt tttctgggaa 2520

gttaacctga aagaaaaatt ctctgctgac ctggaccagt tcccgctggg tcgtaaattc 2580

ctgctgcagg ctggttaccg tgctcgtccg aaattcaaag ctggtaaacg ttctgctccg 2640

taa 2643

Claims

1.一种经大肠杆菌偏好密码子优化的编码人乳头瘤病毒HPV31 L1的融合基因，其特征在于，优化的编码人乳头瘤病毒HPV31 L1的基因核苷酸序列如SEQ ID NO.2所示，并融合有编码GST-SUMO的编码核苷酸序列。

2.如权利要求1所述的融合基因，其特征在于，该融合基因编码的氨基酸序列如SEQ IDNO：9所示。

3.如权利要求1所述的融合基因，其特征在于，该融合基因的核苷酸序列如为SEQ IDNO：4所示。

4.一种大肠杆菌表达载体，其特征在于该载体包括具有权利要求1-3任一项所述融合基因。

5.如权利要求4所述的大肠杆菌表达载体，其特征在于，出发载体为pGEX-6p-1、pGEX-4T-2、pMAL或pET28a。

6.一种工程菌细胞，该细胞包含权利要求1-3任一项所述的基因，或权利要求4或5所述的表达载体。