CN106399329B

CN106399329B - 33型重组人乳头瘤病毒病毒样颗粒及其制备方法

Info

Publication number: CN106399329B
Application number: CN201510490177.9A
Authority: CN
Inventors: 刘永江; 伍树明; 高文双; 陈晓; 任永峰; 王雅君; 姜绪林; 张瑞霞; 高俊; 张海江; 陈建平; 银飞; 徐岚; 仉春艳; 夏丽
Original assignee: Beijing Kangleweishi Biological Technology Co ltd
Current assignee: Beijing Kangleweishi Biological Technology Co ltd
Priority date: 2015-08-12
Filing date: 2015-08-12
Publication date: 2021-06-11
Anticipated expiration: 2035-08-12
Also published as: CN106399329A

Abstract

本发明涉及33型重组人乳头瘤病毒病毒样颗粒及其制备方法，具体技术要点是提供一种新的编码重组的HPV33 L1蛋白的多核苷酸基因片段、包含该基因片段的载体、包括载体的宿主细胞，以及由该基因片段翻译表达的HPV33 L1溶合蛋白、五聚体和由该五聚体组成VLP，本发明还公开该五聚体、VLP蛋白及其组成的疫苗组合物在制备预防HPV33感染的药物中的应用。

Description

33型重组人乳头瘤病毒病毒样颗粒及其制备方法

技术领域

本发明涉及人乳头瘤病毒的病毒样颗粒及其制备方法。更具体而言，本发明涉及一种重组的人乳头瘤病毒L1蛋白的五聚体及病毒样颗粒（Virus-like Particle，VLP）及其制备方法，及含该病毒样颗粒的疫苗组合物在预防人乳头瘤病毒感染中的应用。

背景技术

人乳头瘤病毒(Human Papillomavirus，简称HPV)主要通过人体密切接触，如性传播的病毒，可引起人类多种增殖性上皮病变，包括乳头状瘤（疣）和瘤样病变。具体来讲，HPV诱发的疾病主要包括3大类，第1类：宫颈、阴道、女性外阴、阴茎和肛门的癌症及某些类型的头颈部肿瘤等恶性病变。100%的宫颈癌患者都是HPV感染所导致的，90%的肛门癌，40%的外阴、阴道及阴茎，12%的口咽及3%的口腔癌症归因于HPV感染。第2类：良性病变如扁平疣、尖锐湿疣等生殖器疣，是一种性传播疾病，在性行为活跃的人群中很常见。虽然生殖器疣不会像癌症一样造成严重的后果，但是病变通常会引起病人较为痛苦的临床症状如灼痛、出血和疼痛，同时产生尴尬、焦虑和自卑等负面的心理反应，而且反复治疗的过程浪费了大量的医疗资源。在世界范围内估计由非致癌性HPV(主要是6和11型)引起的生殖器疣有3000万，其中20～50%的病变中还包含有高危型HPV的混合感染。第3类：HPV感染还能引起复发性呼吸道乳头瘤( RRP)，这是一种罕见的、具有潜在致命性的疾病，主要发生在青少年时期，有时，大量的乳头瘤可以引起呼吸困难并导致较小年龄儿童死亡。所以预防或治疗HPV感染对人类健康意义十分重大。

HPV是无囊膜的双链DNA病毒，主要由病毒外壳和基因组DNA组成(Bernard， Burket al. 2011)。HPV病毒外壳是由360个L1蛋白质（形成72个五聚体）和至多72个L2蛋白质构成的二十面体结构，直径55～60 nm(Howley and Lowy 2007)。病毒外壳蛋白质具有自组装特性，在体外L1蛋白质单独或与L2蛋白质共同自组装形成病毒样样颗粒（Virus-likeParticle，VLP）(Chen， Garcea et al. 2000， Finnen， Erickson et al. 2003， Buck，Cheng et al. 2008， Wang and Roden 2013)。

由于HPV不能在体外细胞培养，要获得该病毒的特异性抗原，只能用重组DNA 技术的方法制备基因工程疫苗。重组Ll或L1/L2组装形成的病毒样颗粒VLPs，无病毒DNA，安全性好，具有和天然病毒颗粒相似的抗原表位，刺激机体后可产生中和抗体IgG和IgA，因此HPV VLPs可作为预防性疫苗，从而大大降低因感染HPV导致产生相关肿瘤的可能性(Howley and Lowy 2007) 。

HPV疫苗研制的关键是能够大量制备高纯度、稳定的HPV抗原。在HPV疫苗抗原制备技术方面，目前较为常用的生产HPV抗原的表达系统可以分为真核表达系统及原核表达系统。常用的真核表达系统有痘病毒表达系统、昆虫杆状病毒表达系统、酵母表达系统。在真核表达系统中所表达的HPV L1能自发的形成VLP，往往只需进行简单的纯化即可获得VLP。但是由于真核表达系统的表达量低，培养成本高，给大规模工业化生产带来了极大困难。原核表达系统中利用大肠杆菌表达系统表达HPV L1蛋白质已有报道。但是由于大肠杆菌所表达的HPV L1蛋白质可溶性低，目前已知的纯化方法大多通过无盐沉淀或变性复性等步骤从蛋白质种类繁杂的细胞液中最终纯化得到HPV VLP。例如：在专利CN02129070.9中公开通过原核细胞表达和制备HPV L1多聚体的方法，其中纯化工艺包括通过3.3M尿素处理和透析复性过程；在WO-0204007专利中对L1-GST融合蛋白质的纯化方法也是通过尿素变性处理并进行透析复性；在现有技术中也有公开L1蛋白质的纯化方法是包括磷酸缓冲液超滤透析和离心，使目的蛋白沉淀再复溶的步骤。但是在这些纯化过程中蛋白质损失量大，得率低，难以在大规模生产上应用。

在HPV疫苗抗原蛋白质VLP的均一性方面，现有技术中所组装的HPV L1 VLP的粒径分散度有使用polyd值表示，polyd值<15%说明颗粒有很好的均一性，15%到30%之间说明颗粒有较大的不均一性，大于30%说明颗粒完全不够均一。现有技术中制备的HPV L1 VLP多大于15%。另一个说明粒径均一的指标是PdI值，PdI值为粒径分布系数，小于0.05为高度均一的样品；0.05～0.1为准均一的样品，0.1～0.3为均一性较差的样品，大于0.3为不均一的样品。在US7205125B2专利中公开两个型别HPV L1 VLP的混合蛋白液的PdI为0.07。

因此，本领域仍然需要成本低、纯度高、产量高、质量稳定的HPV L1蛋白质生产技术和大规模工业化生产重组HPV L1 VLP的新方法。

发明内容

本发明的目的是公开一种优化的编码HPV33 L1 蛋白质的核苷酸序列，包含该核苷酸序列的载体、包括载体的宿主细胞，以及由该多核苷酸序列翻译表达的HPV L1蛋白质，Tag-HPV-L1重组蛋白，由该L1蛋白质形成的五聚体和VLP，以及由该五聚体和VLP作为抗原组成的预防HPV感染的疫苗。

本发明第一方面提供一种经密码子优化的HPV33 L1的基因，其核苷酸序列为SEQNO：2。

本发明第二方面提供一种构建的表达载体，其包含本发明第一方面的经密码子优化的HPV33 L1的基因。所述载体适合驱动异源DNA在细菌中翻译表达HPV L1蛋白质。在一个实施方案中，所述表达载体优选pGEX-6p-1、pGEX-4T-2、 pMAL或pET28a。

本发明的第三方面提供一种构建的工程菌细胞，该细胞包含本发明第一方面的基因，或第二方面的表达载体。所述的工程菌宿主细胞是大肠杆菌，在一个实施方案中，所述宿主细胞优选BL21细胞株。

本发明第四方面提供一种Tag-HPV33 L1融合蛋白，其中标签Tag为6*His.Tag，GST.Tag，SUMO.Tag，MBP.Tag，6*His - SUMO.Tag或GST- SUMO.Tag；L1为HPV33 L1全长蛋白质和/或C端截短5个、10个、15个或不多于30个氨基酸和/或N端截短2个、4个、6个或不多于10个氨基酸的L1蛋白质。

编码Tag-HPVL1融合蛋白GST-HPV33 L1的核苷酸序列为SEQ NO：3、SEQ NO：11，，GST-SUMO-HPV33 L1的核苷酸序列为SEQ NO：4、SEQ NO：12，MBP的核苷酸序列SEQ NO：5、SEQ NO：13，6*His-HPV33 L1的核苷酸序列为SEQ NO：6， 6*His-SUMO-HPV33 L1的核苷酸序列为SEQ NO：7。

编码Tag-HPVL1融合蛋白GST-HPV33 L1的氨基酸序列为SEQ NO：8，GST-SUMO-HPV33 L1的氨基酸序列为SEQ NO：9，MBP的氨基酸序列SEQ NO：10。

本发明第五方面提供Tag-HPVL1融合蛋白质经过纯化后获得的HPV L1的五聚体，及由五聚体组装的VLP。在一个优选实施例中HPV33 L1五聚体蛋白平均粒径10～15nm PdI<0.1。在一个优选实施例中HPV33 L1VLP的平均粒径45～65nm PdI<0.1。

本发明第六方面提供了一种疫苗组合物，其包含本发明HPV L1的五聚体或HPV L1的VLP，所述组合物中进一步包含可药用的赋形剂和药用佐剂。

在一个实施方案中将含有HPV33 L1五聚体或VLP蛋白原液（根据上述方法制备所得）分别与氢氧化铝佐剂生理盐水溶液按照蛋白与铝含量1：10比例进行吸附配制即可制得重组HPV L1蛋白质五聚体或VLP疫苗，在4℃保存待用。

另一方面，本发明还提供一种获得Tag-HPVL1融合蛋白的方法，包括如下步骤：

A.通过用大肠杆菌偏爱的密码子取代HPV33 L1基因序列的翻译同种蛋白的密码子，得到大肠杆菌表达系统偏爱的密码子优化的HPV33 L1的基因；

B.构建HPV33 L1基因的大肠杆菌表达载体；

C.构建Tag-HPV33 L1的大肠杆菌表达工程菌株；

D.诱导表达并纯化得融合蛋白Tag-HPV33 L1。

上述制备融合蛋白Tag-HPV33 L1方法中原核宿主细胞选自但不限于GI698，ER2566，BL21 (DE3)，XA90，B834 (DE3)，BLR (DE3)。

上述制备融合蛋白Tag-HPV33 L1方法中表达条件是：20～37℃温度条件下，诱导表达3～20小时。在一个具体实施例中优选在28℃温度条件下，诱导表达 16小时。

本发明还提供一种获得HPV33 L1五聚体的方法，包括如下步骤：

a)用亲和层析方法吸附融合蛋白Tag-HPV33 L1；

b)加入蛋白质水解酶切除Tag标签，得到HPV33 L1五聚体蛋白质；

c)纯化HPVL1五聚体蛋白质、得到纯度>98%，平均粒径10～15nm PdI<0.1的L1五聚体蛋白质。

上述制备HPV33 L1五聚体方法中所述用于蛋白酶为切除Tag标签的位点专一的蛋白质水解酶：重组3C蛋白酶，凝血酶，SUMO蛋白酶，SENP1或TEV蛋白酶。

上述制备HPV33 L1五聚体方法中纯化方法选自但不限于离子交换色谱法，疏水性色谱法，分子筛（或称凝胶过滤或分子排阻）色谱法；优选地纯化包括离子交换色谱法和分子筛色谱法。

上述制备HPV33 L1五聚体方法中纯化方法还包括使用还原剂，例如加入DTT。

上述制备HPV33 L1五聚体方法中最终纯化后所得到HPV33 L1五聚体蛋白平均粒径10～15nm PdI<0.1。

本发明还提供了一种HPV33 L1五聚体组装成VLP的方法，包括如下步骤：

将平均粒径10～15nm PdI<0.1的L1五聚体蛋白质液与组装缓冲液混合，最终获得pH值为5.0～5.9，盐浓度为500～2000 mM，平均粒径45～65nm PdI<0.1的HPV33 L1 VLP蛋白质液，优选获得pH值为5.7，盐浓度为1300 mM的HPV33 L1 VLP蛋白质液。

组装缓冲液包括但不限于Tris缓冲液，磷酸盐缓冲液，醋酸缓冲液，HEPES缓冲液，MOPS缓冲液，枸橼酸缓冲液、组氨酸缓冲液，硼酸缓冲液等。

上述HPV33 L1五聚体组装成VLP的方法中HPV33 L1-VLP蛋白质液中还可以加入保护剂，例如：0.01～0.1聚山梨酯80。

另一方面，本发明还提供了HPV L1的五聚体、VLP和包括五聚体或VLP的疫苗组合物在制备预防HPV感染的药物中的应用。

根据本发明，本发明的疫苗可采用患者可接受的形式，包括但不限于注射或鼻腔或口腔吸入或者阴道给药，优选注射剂和肌内注射。

本发明中相关术语的说明及解释

根据本发明，术语“大肠杆菌表达系统”是指由大肠杆菌（菌株）与载体组成，其中大肠杆菌（菌株）来源于市场上可得到的，在此举例但不限于： GI698，ER2566，BL21 (DE3)，XA90，DH(5a)、B834 (DE3)，BLR (DE3)。

根据本发明，术语“载体”一词指的是，可将某编码蛋白质的多聚核苷酸插入其中并使蛋白质获得表达的一种核酸运载工具。载体可以通过转化，转导或者转染宿主细胞，使其携带的遗传物质元件在宿主细胞中获得表达。举例来说，载体包括：质粒；噬菌体；柯斯质粒等等。

根据本发明，术语“疫苗用赋形剂或载体“是指选自一种或多种，包括但不限于：pH调节剂，表面活性剂，佐剂，离子强度增强剂。例如，pH调节剂举例但不限于磷酸盐缓冲液，表面活性剂包括阳离子，阴离子或者非离子型表面活性剂。举例但不限于：聚山梨酯80。佐剂举例但不限于氢氧化铝，磷酸铝、氟氏完全佐剂、氟氏不完全佐剂等。离子强度增强剂举例但不限于氯化钠。

根据本发明，术语“色谱”包括但不限于：离子交换色谱（例如阳离子交换色谱、阴离子交换色谱）、疏水相互作用色谱、吸附色谱层析法（例如羟基磷灰石色谱）、分子筛色谱层析（凝胶过滤或分子排阻层析）、亲和色谱层析法。

根据本发明，在本发明获得的重组HPV L1蛋白质的方法中，缓冲液是指一种能在加入少量酸或碱和水时大大降低pH变动幅度的溶液，包括但不限于Tris缓冲液，磷酸盐缓冲液，醋酸缓冲液，HEPES缓冲液，MOPS缓冲液，枸橼酸缓冲液、组氨酸缓冲液，硼酸缓冲液等。

根据本发明，所述细胞破碎包括但不限于通过匀浆器破碎、均质机破碎、超声波处理、研磨、高压挤压、溶菌酶处理中的一项或者多项方法来实现；

根据本发明，在本发明获得的重组HPV L1蛋白质的方法中，所用的盐包括但不限于是中性盐，特别是碱金属盐、铵盐、盐酸盐、硫酸盐，碳酸氢盐，磷酸盐或磷酸氢盐，特别是NaCl、KCl、CaCl2、NH4Cl、KCl、NH₄Cl、MgSO₄ 、(NH4)₂SO₄中的一种或几种。优选NaCl。所用的还原剂包括但不限于DTT，2-巯基乙醇。所用量包括但不限于2mM～l00mM，优选10～15mM。

有益效果

本发明提供了一种合成基因，该基因序列是根据大肠杆菌的密码子偏好进行过密码子优化的核苷酸序列，该序列编码了HPV L1蛋白氨基酸序列。研究发现经过密码子优化的核酸序列相对于未经密码子优化的核酸序列的L1蛋白的表达量有显著提高。

本发明公开的大肠杆菌表达系统具有表达量高、易于培养和操作以及生产成本低等优点。但是，仅仅使用该表达系统仍难以直接获得大量可溶性的HPV L1蛋白，其原因在于L1蛋白极容易形成包涵体，即无生物学活性的不溶性聚合体。此外，即使获得大量的包涵体，为了得到有生物学活性的蛋白，还必须对包涵体进行变性、复性处理，这个过程往往损失大量的蛋白。为了解决这一难题，本发明采用融合技术，将L1基因与具有协助蛋白质正确折叠的蛋白如谷胱甘肽硫转移酶（GST）、SUMO、MBP、6*His- SUMO或GST- SUMO等进行融合表达，不仅蛋白的可溶性及收率有所提高，而且GST-SUMO-HPVL1，6*His-SUMO-HPVL1使得在HPV L1蛋白质N端没有外源氨基酸的残留，同时发现其中的GST-SUMO作为重组蛋白HPVL1表达的融合标签和分子伴侣，具有抗蛋白酶水解、显著增加重组蛋白表达量以及促进靶蛋白正确折叠，提高可溶性等功能。因此本发明采用的技术路线是在构建HPV L1蛋白表达载体时采用了标签蛋白融合技术，一方面通过标签蛋白与L1蛋白形成的融合蛋白来提高目的蛋白的可溶性、提高产量，另一方面通过GST融合标签可以利用亲和层析和蛋白水解酶切除融合质标签方法进行目的蛋白的纯化特点，从而实现了从种类繁杂的细胞裂解液中一步纯化即可获得纯度达到70%以上的HPV L1蛋白，大大提高了纯化效率，从而提高了终产物HPV L1蛋白的产量。

本发明提供的先表达、分离纯化获得高纯度的HPV L1五聚体蛋白后再人工控制组装形成VLP的技术路线，可以解决当前公知技术存在的从杂蛋白种类繁多的细胞破碎液中直接纯化VLP纯度低、降解比例高，收率低的问题，得到高纯度五聚体体外组装VLP及VLP保存条件。

本发明经重组所得的HPV L1 VLP蛋白质，具有良好的免疫原性，可以诱导高滴度的针对同型HPV的中和抗体，预防HPV对人体的感染，是一种良好的疫苗形式。

在参考下列详述和附图后，本发明的这些和其它方面将是显然的。此处公开的所有参考文献在此均完整引用作为参考。

附图说明

图l：GST-HPV33 L1 蛋白质亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准泳道从上至下为：94kDa，66kDa，45kDa，33kDa，26kDa，20kdat；1泳道为亲和吸附GST-L1的介质，分子量大约为80kDa；2泳道为酶解后GST与L1的介质。

图2：GST-SUMO-HPV33 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为为蛋白质量标准（从上至下为：94kDa，66kDa，45kDa，33kDa，26kDa，20kDa），1泳道为亲和吸附GST-SUMO -L1的介质，2泳道为酶解后GST-SUMO与L1的介质。

图3：MBP-HPV33 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为为蛋白质量标准（从上至下为：94kDa，66kDa，45kDa，33kDa，26kDa，20kda），1泳道为亲和吸附MBP-L1的介质，2泳道为酶解后MBP与L1的介质。

图4： 6*HIS-SUMO-HPV33 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为为蛋白质量标准（从上至下为：94kDa，66kDa，45kDa，33kDa，26kDa，20kda），1泳道为亲和吸附6*HIS-SUMO - L1的介质，2泳道为酶解后6*HIS-SUMO与L1的介质。通过凝胶电泳图显示蛋白酶切开了带有6*HIS-SUMO标签的溶合蛋白。

图5：本发明经过分子筛色谱纯化后的重组HPV33 L1五聚体蛋白质SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准（从上至下为：94kDa，66kDa，45kDa，33kDa，26kDa，20kda），另一泳道为HPV L1蛋白。

图6：HPV33 L1五聚体的动态光散射观测结果。结果显示五聚体的粒径直径为14.72 nM，粒度分布PdI为 0.091。

图7： HPV33 L1 VLP的动态光散射观测结果。结果显示VLP的粒径直径为54.29 nM，粒度分布PdI为0.015。

图8：HPV33 L1五聚体蛋白的透射电镜照片。

图9：HPV33 L1 VLP蛋白的透射电镜照片。

图10：HPV33 L1五聚体蛋白质的高压液相分子筛色谱图，图中显示经高度纯化的L1五聚体蛋白质纯度大于98%。

图11：HPV33 L1 VLP蛋白质的高压液相分子筛色谱图，图中显示经高度纯化的VLP蛋白质纯度大于98%。

图12：HPV33 L1五聚体各实验组疫苗接种小鼠后，在第二次加强免疫4周后，检测中和抗体的平均滴度水平。

图13：HPV33 L1 VLP各实验组疫苗接种小鼠后，在第二次加强免疫4周后，检测中和抗体的平均滴度水平。

下面结合实施例对本发明进一步举例描述。这些实施例是非限制性的。

实施例l：密码子优化的HPV L1基因的设计与合成

基因序列来源于PUBMED上已公开的各型HPV序列。参照大肠杆菌对基因转录密码子的偏好对选定的各型HPV DNA序列进行密码子优化后合成所有HPV DNA序列。根据合成DNA序列设计引物，利用合成基因为模板进行PCR扩增。所得的密码子优化序列通过DNA序列测定验证。

优化前与优化后的HPV各型DNA序列：

SEQ NO.1：优化前的HPV33型L1的DNA序列

SEQ NO.2：优化后的HPV33型L1的DNA序列

实施例2：重组载体pGEX-6P-1-GST- HPV33 L1的构建及鉴定：

扩增HPV33 L1 的DNA片段引物：（酶切位点分别是BamHI和XhoI）

Forward-HPV33 L1-ApaI：5’ACTTCAGGATCC ATGTCTGTTTGGCGTCCGTCTG

Reverse-HPV33 L1-XhoI：5’ATCTCACTCGAGCTA TTTTTTAACTTTTTTACGTTT

PCR扩增反应体系：10 x Pfu buffer 20 μL，Pfu酶 4 μL，10 mM dNTP 2.5 μL，5’Primer (5μM) 10μL，3’ Primer (5μM) 10μL，模板DNA 50 ng，加d₂H₂O至200μL。

基因PCR扩增条件：95℃　3 min； 95℃　30 sec，58℃　30 sec，72℃　4 min；循环32次；72℃　10 min。

将含有BamH I和XhoI酶切位点的L1基因片段以及载体pGEX-6P-1进行BamH I/XhoI双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGEX-6P-1进行连接反应，16 ℃ 10～15 h。

连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由上海生工生物公司进行测序，得到融合重组GST-HPV33-L1蛋白质的核苷酸序列为SEQ NO.3，氨基酸序列为SEQ NO.8。

参照该实施例方法制备带有GST-标签的融合重组载体GST-HPV-L1，其基因序列SEQ NO.11。

实施例3：重组载体pGEX-6P-1m-GST-SUMO- HPV33 L1 载体构建

pGEX-6p-1m载体构建：为使得多酶切位点附近的ApaI酶切位点（GGGCCC）为载体的唯一ApaI酶切位点，在不改变lacI基因蛋白质表达序列的前提下，通过点突变技术将市售的pGEX-6p-1载体的另一ApaI识别序列GGGCCC中的Gly密码子GGC改变为它的同义密码子GGT，即可消除ApaI（3890）。通过这样的改造使得ApaI 成为可用来插入表达基因的位点。

扩增SUMO 的DNA片段引物：（酶切位点分别是ApaI和BamHI）

Forward -SUMO-ApaI： ACTTCAGGGCCCTCTGACCAGGAAGCTAAACCGTC

Reverse-SUMO-BamHI： CGCGGATCCACCGGTCTGTTCCTGGTAAAC

扩增HPV33 L1 的DNA片段引物：（酶切位点分别是BamHI和XhoI）

Forward-HPV33 L1-ApaI：5’ACTTCAGGATCC ATGTCTGTTTGGCGTCCGTCTG

Reverse-HPV33 L1-XhoI：5’ATCTCACTCGAGCTA TTTTTTAACTTTTTTACGTTT

基因PCR扩增条件：95℃　1.5 min； 95℃　30 sec，58℃　30 sec，72℃　1 min；循环32次；72℃　10 min。

基因PCR扩增条件同上述实施例。

酶切连接：将含有ApaI和BamHI酶切位点的SUMO基因片段以及载体pGEX-6P-1m进行Apa I/ BamHI双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGEX-6P-1m进行连接反应，16 ℃ 10～15h。

转化鉴定：连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由苏州金唯智生物科技有限公司进行测序，得到融合重组载体pGSTSUMO-6p-1m。

再次酶切连接：将含有BamHI和Xho1酶切位点的L1基因片段以及重组载体pGSTSUMO-6p-1m进行BamHI/Xho1双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGST-SUMO-6p1m进行连接反应，16 ℃ 10～15 h。

再次转化鉴定：连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由苏州金唯智生物科技有限公司进行测序，得到带有GST-SUMO标签的融合重组载体GST-SUMO-L1，其基因序列SEQ NO.4，氨基酸序列为SEQ NO.9。

参照该实施例方法制备带有GST-SUMO标签的融合重组载体GST-SUMO-L1，其基因序列SEQ NO.12。

实施例4：重组载体pMAL—MBP-HPV33 L1的构建

扩增HPV33 L1 的DNA片段引物：（酶切位点分别是EcoRI和HindIII）

Forward-HPV33 L1-EcoRI：5’ ACTTCA GAATTC ATGTCTGTTTGGCGTCCGTCTG

Reverse-HPV33 L1-HindIII：5’ ATCTCA AAGCTTCTA TTTTTTAACTTTTTTACGTTT

将含有EcoRI和HindIII酶切位点的L1基因片段以及载体pMAL进行EcoRI/HindIII双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pMAL进行连接反应，16 ℃ 10～15 h。

连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由上海生工生物公司进行测序，得到融合重组MBP-HPV33-L1蛋白质的基因序列SEQ NO.5，氨基酸序列为SEQ NO.10。

参照该实施例方法制备带有MBP标签的融合重组载体MBP-HPV-L1，其基因序列SEQNO.13。

实施例5：重组载体pET28a-6*His-HPV33 L1的构建

扩增HPV33 L1 的DNA片段引物：（酶切位点分别是NdeI和XhoI， pET28a）

Forward-HPV33 L1-NdeI：5’ GACTTCA CATATGATGTCTGTTTGGCGTCCGTCTG

Reverse-HPV33 L1-XhoI：5’ CATCTCACTCGAGCTA TTTTTTAACTTTTTTACGTTT

将含有NdeI和XhoI酶切位点的L1基因片段以及载体pMAL进行NdeI/XhoI双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pET28a进行连接反应，16℃ 10～15 h。

连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由上海生工生物公司进行测序，得到融合重组6*His-HPV33-L1蛋白质的基因序列SEQ NO.6。

实施例6：重组载体6*His-SUMO-HPV33 L1 载体构建

扩增SUMO 的DNA片段引物：（酶切位点分别是NdeI和BamHI）

Forward -SUMO-NdeI： GGAATTCCATATGTCTGACCAGGAAGCTAAACCGTC

Reverse-SUMO-BamHI： CGC GGATCCACCGGTCTGTTCCTGGTAAAC

扩增HPV33 L1 的DNA片段引物：（酶切位点分别是BamHI和XhoI）

Forward-HPV33 L1-ApaI：5’ACTTCAGGATCC ATGTCTGTTTGGCGTCCGTCTG

Reverse-HPV33 L1-XhoI：5’ATCTCACTCGAGCTA TTTTTTAACTTTTTTACGTTT

SUMO基因、L1基因PCR扩增条件、反应体系同上述实施例所述。

酶切连接：将含有NdeI和BamHI酶切位点的SUMO基因片段以及载体pET-28a进行NdeI/ BamHI双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pET28a进行连接反应，16 ℃ 10～15 h。

转化鉴定：连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由苏州金唯智生物科技有限公司进行测序，得到融合重组载体pETSUMO-28a。

再次酶切连接：将含有BamHI和Xho1酶切位点的L1基因片段以及重组载体pETSUMO-28a进行BamHI/Xho1双酶切处理，之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pETSUMO-28a进行连接反应，16 ℃ 10～15 h。

再次转化鉴定：连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取，之后由上海生工生物公司进行测序，得到融合重组6*His-SUMO-HPV33-L1蛋白质的基因序列SEQ NO.7。

实施例7：重组HPV L1五聚体蛋白质的表达

将测序结果正确实施例2、3、4、5和6的重组载体转化大肠杆菌BL21宿主细胞，并作为表达重组蛋白质的工程菌进行HPV L1蛋白的表达。工程菌培养基为2YT培养基（10 g/L胰化蛋白胨；5 g/L酵母粉；10 g/L NaCl）。挑取含重组质粒的菌体单斑于10ml 2YT培养基（含100μg/ml氨苄青霉素）中，230转/分钟（rpm），37℃振荡培养过夜。转接5 ml过夜菌于500 ml（含100 μg/ml 氨苄青霉素）2YT液体培养基中，37℃震荡培养至重组工程菌生长至OD₆₀₀nm≈0.4～1时，加入终浓度0.2mM的IPTG诱导，在28℃的条件下进行6h以上重组蛋白质的诱导表达。

细胞收集及破碎：对发酵培养物进行离心，弃上清，收获菌体沉淀，称重；使用buffer L（pH 8.0，50 mM Tris，200 mM NaCl，5mM DTT）洗涤沉淀，然后将其重悬于bufferL中进行超声波破碎，随后通过高速离心机对破菌液进行离心（16000 rpm，30 min，4℃），收集上清液。

实施例8：重组HPV L1五聚体蛋白在大肠杆菌中表达量的检测

采用ELISA夹心法检测亲和层析上样前Tag-HPV L1五聚体蛋白在大肠杆菌中表达量，样品及供试品：

包被抗体：自制抗HPV33 L1小鼠单抗。

对照品：自制高纯度的HPV33 L1蛋白。

供试品：用样品稀释液将供试品Tag-HPV33 L1稀释至浓度在对照品梯度稀释浓度范围内。

酶标抗体：自制的辣根过氧化物酶标记的兔抗HPV33 L1蛋白多抗。

结果计算：计算平行孔的平均值，以对照品系列浓度OD₄₅₀吸收值对其相应的L1蛋白抗原作直线方程，平行样品孔间变异系数不得大于10%，直线回归方程R²不得小于0.980，将供试品的OD₄₅₀吸收值代入方程计算出稀释后供试品L1蛋白抗原含量，再乘以相应的稀释倍数即为供试品中L1蛋白抗原含量，见表1。

表1 检测表达后Tag-HPV L1蛋白抗原含量

实施例9：重组HPV L1五聚体蛋白质亲和层析

带GST标签重组蛋白的亲和层析：亲和柱中装入GST琼脂糖亲和层析介质5ml，以buffer L（pH 8.0，50 mM Tris，200 mM NaCl，5mM DTT）平衡层析柱，然后上样实施例8中带有GST或GST-SUMO标签的蛋白液，完毕后以Buffer L洗至无蛋白质流出，亲和完毕。以5mLBuffer L悬浮亲和介质，取样检测并计算介质中结合L1蛋白质的总量。

带MBP标签重组蛋白的亲和层析：亲和柱中装入Amylose-Resin亲和层析介质5ml，以buffer L（pH 8.0，50 mM Tris，200 mM NaCl，5mM DTT）平衡层析柱，然后上样实施例8中带有MBP标签的蛋白液，完毕后以Buffer L洗至无蛋白质流出，亲和完毕。以5mL Buffer L悬浮亲和介质，取样检测并计算介质中结合L1蛋白质的总量。

带6*HIS标签重组蛋白的亲和层析：取5ml Ni-NTA凝胶装柱，在柱上缓慢加入10倍柱体积的平衡液（50mmol/L NaH₂PO₄，300mmol/L Nacl，20mmol/L imidazole，用NaOH调整PH值至8），以充分平衡Ni-NTA凝胶，流速为1ml/min。取实施例8中过滤后的带有6*His或6*His-SUMO标签的上清液，完全进入凝胶后，用10倍柱体积的平衡液继续洗涤凝胶，保存流速为1ml/min。用平衡液洗脱至无蛋白质流出，亲和完毕。取样检测并计算介质中结合L1蛋白质的总量。

实施例10：重组Tag-HPV L1蛋白质的酶切纯化

按照目的蛋白质与蛋白酶质量比100：1加入酶量，其中带有GST-HPV-L1的蛋白质用3C蛋白酶切，带有GST-SUMO-HPV-L1和6*His-SUMO-HPV-L1 的蛋白质用SENP1蛋白酶切，带有Mbp-HPV-L1的蛋白质用Factor Xa蛋白酶切，带有6*His-HPV-L1的蛋白质用Thrombin蛋白酶切，分别混合酶切2h后，分别洗脱收集各个蛋白酶切后所得的HPV33 L1五聚体蛋白质溶液。

将3C酶酶切GST标签后的L1蛋白质溶液用SDS- PAGE凝胶电泳检测，结果见图1亲和层析电泳结果，实验表明，可将90%的目的蛋白切下。图2为SENP1蛋白酶切带有GST-SUMO-HPV-L1的蛋白质，用SDS- PAGE凝胶电泳检测。图3为Factor Xa蛋白酶切带有Mbp-HPV-L1的蛋白质，用SDS- PAGE凝胶电泳检测。图1-图3说明说明得到了55kDa 的HPV33 L1蛋白。

Thrombin蛋白酶没有切开6*His-HPV-L1的蛋白质；用SENP1酶切6*His-SUMO-L1的蛋白质溶液用SDS- PAGE凝胶电泳检测，结果见图4，显示SENP1蛋白酶能切开带有6*His-SUMO标签的溶合蛋白。

实施例11：重组HPV L1五聚体蛋白质的纯化

分子筛色谱纯化：将上一个实施例收集的酶切纯化后的HPV33 L1五聚体蛋白质分别进行纯化，可先经过离子交换色谱收集的HPV33 L1五聚体蛋白质，或不经过离子交换步骤直接用Superdex200(GE公司生产)的凝胶过滤介质进行进一步分子筛层析，分子筛流动相为pH8.0，10 mM Tris，100 mM NaCl，收集HPV33 L1五聚体蛋白质紫外吸收峰的馏分。

纯化后测定样品纯度：将收集的蛋白质溶液取样用SDS- PAGE凝胶电泳检测，目的蛋白质HPV33 L1五聚体经过分子筛层析纯化后最终纯度均大于98%，详见图5，经过分子筛色谱纯化后的重组HPV33 L1五聚体蛋白质SDS-PAGE凝胶电泳图。

测定样品蛋白浓度：用Bradford法进行蛋白浓度检测，使用标样2mg/ml BAS配制从100ug/µl稀释到500ug/µl，样品反应体系取10µl稀释的BSA+200µlBradford工作液：标准曲线为y = 0.0013 x - 0.0294 ，R² = 0.9986 ，测定样品的 OD₅₉₅，代入标准曲线，计算样品的蛋白浓度，结果见表2。

表2 Bradford法检测重组HPV33 L1五聚体蛋白浓度

注：样品组1为GST-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液；样品组2为GST-SUMO-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液；样品组3为Mbp-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液。

实施例12：重组HPV33 L1五聚体蛋白质组装成VLP

在置于如下盐浓度（NaCl）和pH值条件下，HPV L1五聚体溶液样品组1、2和3，放置稳定后，使用马尔文 Zetasizer NanoZS的动态光散射粒径仪，进行粒径及粒径分布测定（粒径分布系数PdI值为粒径分散度指标，小于0.05为高度均一的样品；0.05～0.1为准均一的样品，0.1～0.3为均一性较差的样品，大于0.3为不均一的样品），，HPV33 L1五聚体蛋白组装得到粒径均一的VLP（PdI＜0.05）。

表3 不同pH和盐浓度条件下组装HPV33 L1 VLP的粒径检测

注：样品组1为GST-HPV L1经分子筛纯化后得HPV L1 VLP蛋白溶液；样品组2为GST-SUMO-HPV L1经分子筛纯化后得HPV L1VLP蛋白溶液；样品组3为Mbp-HPV L1经分子筛纯化后得HPV L1VLP蛋白溶液。

实施例13：动态光散射（DLS）对L1五聚体和VLP蛋白质粒径测定

仪器为马尔文 Zetasizer NanoZS的动态光散射粒径仪，取各样品组最终制得的HPV33 L1五聚体和HPV33 L1 VLP蛋白质进行检测，测平均粒径和分散性指数PdI（表明蛋白质的均一性），说明各组样品最终制备的L1五聚体和VLP蛋白均一。其中样品组2最终制得的五聚体蛋白质和其组装获得的HPV33 L1 VLP蛋白质粒径分布详见附图6和7。

实施例14：HPV33 L1五聚体和VLP的制备

依据本发明上述实施例1-13所采用的技术，制备具有序列11，12，13的HPV33 L1蛋白，以上蛋白均可纯化得到纯度达到98%以上的蛋白，得到平均粒径10～15nm PdI<0.1的HPV33 L1五聚体蛋白。进一步组装得到平均粒径45～65nm PdI<0.1的HPV33 L1VLP蛋白。

实施例15：HPV33 L1 五聚体和VLP的形态学检测

透射电镜观察：将实施例中各个纯化获得的HPV33 L1五聚体蛋白质、组装获得的HPV33 L1-VLP蛋白质，通过中国科学院生物物理所利用透射电镜平台观察。冷冻样品制备及拍照流程：

1)将液氮盒装满液氮，待液面不沸腾时，将乙烷缓慢注入冷却的铜碗中，使之冷却为液态。

2)将铜网在PDC-32型等离子清洗器做亲水性处理。

3)在Vitrobot TM Mark IV冷冻样品制备设备中，将 3.5 μL 的五聚体及VLP样品吸附在 300目的 QUANTIFOIL 铜网中，吸水4s后，通过液态乙烷冷冻样品。

4)迅速将样品转移到液氮中保存。

5)收集冷冻照片时，电子剂量为 20 e-/Å2。数据通过300 KV 的 300 kV TitanKrios 透射电子显微镜的 Gatan UltraScan 4000 CCD记录。加速电压为300 kV。

结果显示，在HPV33 L1五聚体蛋白质样品组中，视野中可见大量直径与理论大小相符的10nm左右的五聚体蛋白；在HPV33 L1-VLP蛋白质样品组中，可见颗粒大小与理论相符的大量直径为50nm左右的病毒样颗粒（VLP），均匀一致。其中GST-SUMO标签组（样品组2）酶切纯化后HPV33 L1五聚体所得样品的透射电镜照片见附图8， Mbp标签组（样品组3）酶切纯化后再组装的VLP蛋白的透射电镜照片见附图9。

实施例16：HPV33 L1蛋白质原液纯度检测

分子排阻高效液相色谱测定：色谱柱Agilent Bio SEC-5um，2000Å，7.8×300mm，柱体积约15 m1，分子量范围≥l0，000kDa；以pH6.8 的0.1mol/L磷酸盐缓冲液（称取磷酸氢二钠25.8g，磷酸二氢钠4.37g，加超纯水使溶解，用磷酸调pH至6.8，超纯水定容成1000ml）为流动相；流速为1ml/min；检测波长280nm；柱温25℃，上样量不得小于20ug，样品主峰理论塔板数不低于1000，拖尾因子小于2.0，连续进样5针，峰面积的相对标准偏差不得大于3%。

取纯化后的样品2组最终制得的HPV33 L1五聚体和组装后的VLP的蛋白质原液，分别稀释浓度为1mg/ml，上样量20µl注入高压液相色谱仪，按照上述方法检测，按面积归一法计算纯度，所有处理蛋白质纯度均大于98%，结果见附图10和表4、附图11和表5。

表4 HPV33 L1五聚体的HPLC蛋白质纯度检测

表5 HPV33 L1组装后VLP的HPLC蛋白质纯度检测

实施例17：HPV VLP稳定性实验

将各个样品组最终制得的HPV33 VLP蛋白质在下表的缓冲液条件下，在25℃放置14天至28天，进行粒径检测，结果见下表，证明HPV33 VLP在pH 5.0至5.9，盐浓度500～2000mM下存放稳定。样品组3所得HPV33 VLP在pH 5.0至5.9，盐浓度500～2000mM下放置14-28天后检测结果详见如下表。

表6 HPV33 L1 VLP 在25℃下放置14-28天粒径检测结果

实施例18：制备含有HPV L1 五聚体或VLP的单价疫苗

将含有各个样品组的HPV33 L1五聚体或VLP蛋白原液分别与氢氧化铝佐剂生理盐水溶液按照蛋白与铝含量1：10比例进行吸附配制即可制得重组HPV L1蛋白质五聚体或VLP疫苗，在4℃保存待用。

实施例19：HPV L1 五聚体和VLP的免疫原性测定

分别取上述L1五聚体或VLP疫苗，加入灭菌过的生理盐水分别稀释成20μg/ml浓度的五聚体或VLP蛋白疫苗，以每只0.1ml肌肉注射BALB/c小鼠，每组10只。小鼠每4周加强免疫一次，共免疫2次。加强免疫4周后，采用假病毒细胞中和实验法分别测定每次免疫后的小鼠血清中针对同型HPV的中和抗体滴度，结果如附图12、13所示。

结果表明，HPV L1五聚体和VLP蛋白疫苗接种小鼠，二次免疫后4周中和抗体即可达到很高的水平。实验结果证明，HPV L1五聚体和组装的VLP疫苗均可以在动物体内产生中和抗体，说明HPV L1五聚体和VLP蛋白质疫苗在人体临床试验中都具有免疫原性，即能预防HPV同型病毒引起的疾病。

SEQUENCE LISTING

<110> 北京康乐卫士生物技术股份有限公司

<120> 33型重组人乳头瘤病毒病毒样颗粒及其制备方法

<130> 2015

<160> 13

<170> PatentIn version 3.3

<210> 1

<211> 1500

<212> DNA

<213> 人工序列

<400> 1

atgtccgtgt ggcggcctag tgaggccaca gtgtacctgc ctcctgtacc tgtatctaaa 60

gttgtcagca ctgatgaata tgtgtctcgc acaagcattt attattatgc tggtagttcc 120

agacttcttg ctgttggcca tccatatttt tctattaaaa atcctaataa cgctaaaaaa 180

ttattggtac ccaaagtatc aggcttgcaa tatagggttt ttagggtccg tttaccagat 240

cctaataaat ttggatttcc tgacacctcc ttttataacc ctgatacaca acgattagta 300

tgggcatgtg taggccttga aataggtaga gggcagccat taggcgttgg cataagtggt 360

catcctttat taaacaaatt tgatgacact gaaaccagta acaagtatcc tggacaaccg 420

ggtgctgata atagggaatg tttatccatg gattataaac aaacacagtt atgtttactt 480

ggatgtaagc ctccaacagg ggaacattgg ggtaaaggtg ttgcttgtac taatgcagca 540

cctgccaatg attgtccacc tttagaactt ataaatacta ttattgagga tggtgatatg 600

gtggacacag gatttggttg catggatttt aaaacattgc aggctaataa aagtgatgtt 660

cctattgata tttgtggcag tacatgcaaa tatccagatt atttaaaaat gactagtgag 720

ccttatggtg atagtttatt tttctttctt cgacgtgaac aaatgtttgt aagacacttt 780

tttaataggg ctggtaaatt aggagaggct gttcccgatg acctgtacat taaaggttca 840

ggaactactg cctctattca aagcagtgct ttttttccca ctcccagtgg atcaatggtt 900

acttccgaat ctcagttatt taataagcca tattggctac aacgtgcaca aggtcataat 960

aatggtattt gttggggcaa tcaggtattt gttactgtgg tagataccac tcgcagtact 1020

aatatgactt tatgcacaca agtaactagt gacagtacat ataaaaatga gaattttaaa 1080

gaatatataa gacatgttga agaatatgat ctacagtttg tttttcaact atgcaaagtt 1140

accttaactg cagaagttat gacatatatt catgctatga atccagatat tttagaagat 1200

tggcaatttg gtttaacacc tcctccatct gctagtttac aggataccta taggtttgtt 1260

acctctcagg ctattacgtg tcaaaaaaca gtacctccaa aggaaaagga agacccctta 1320

ggtaaatata cattttggga agtggattta aaggaaaaat tttcagcaga tttagatcag 1380

tttcctttgg gacgcaagtt tttattacag gcaggtctta aagcaaaacc taaacttaaa 1440

cgtgcagccc ccacatccac ccgcacatcg tctgcaaaac gcaaaaaggt taaaaaataa 1500

<210> 2

<211> 1500

<212> DNA

<213> 人工序列

<400> 2

atgtctgttt ggcgtccgtc tgaagctacc gtttacctgc cgccggttcc ggtttctaaa 60

gttgtttcta ccgacgaata cgtttctcgt acctctatct actactacgc tggttcttct 120

cgtctgctgg ctgttggtca cccgtacttc tctatcaaaa acccgaacaa cgctaaaaaa 180

ctgctggttc cgaaagtttc tggtctgcag taccgtgttt tccgtgttcg tctgccggac 240

ccgaacaaat tcggtttccc ggacacctct ttctacaacc cggacaccca gcgtctggtt 300

tgggcttgcg ttggtctgga aatcggtcgt ggtcagccgc tgggtgttgg tatctctggt 360

cacccgctgc tgaacaaatt cgacgacacc gaaacctcta acaaataccc gggtcagccg 420

ggtgctgaca accgtgaatg cctgtctatg gactacaaac agacccagct gtgcctgctg 480

ggttgcaaac cgccgaccgg tgaacactgg ggtaaaggtg ttgcttgcac caacgctgct 540

ccggctaacg actgcccgcc gctggaactg atcaacacca tcatcgaaga cggtgacatg 600

gttgacaccg gtttcggttg catggacttc aaaaccctgc aggctaacaa atctgacgtt 660

ccgatcgaca tctgcggttc tacctgcaaa tacccggact acctgaaaat gacctctgaa 720

ccgtacggtg actctctgtt cttcttcctg cgtcgtgaac agatgttcgt tcgtcacttc 780

ttcaaccgtg ctggtaaact gggtgaagct gttccggacg acctgtacat caaaggttct 840

ggtaccaccg cttctatcca gtcttctgct ttcttcccga ccccgtctgg ttctatggtt 900

acctctgaat ctcagctgtt caacaaaccg tactggctgc agcgtgctca gggtcacaac 960

aacggtatct gctggggtaa ccaggttttc gttaccgttg ttgacaccac ccgttctacc 1020

aacatgaccc tgtgcaccca ggttacctct gactctacct acaaaaacga aaacttcaaa 1080

gaatacatcc gtcacgttga agaatacgac ctgcagttcg ttttccagct gtgcaaagtt 1140

accctgaccg ctgaagttat gacctacatc cacgctatga acccggacat cctggaagac 1200

tggcagttcg gtctgacccc gccgccgtct gcttctctgc aggacaccta ccgtttcgtt 1260

acctctcagg ctatcacctg ccagaaaacc gttccgccga aagaaaaaga agacccgctg 1320

ggtaaataca ccttctggga agttgacctg aaagaaaaat tctctgctga cctggaccag 1380

ttcccgctgg gtcgtaaatt cctgctgcag gctggtctga aagctaaacc gaaactgaaa 1440

cgtgctgctc cgacctctac ccgtacctct tctgctaaac gtaaaaaagt taaaaaatag 1500

<210> 3

<211> 2193

<212> DNA

<213> 人工序列

<400> 3

atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60

ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120

tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180

ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240

atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300

gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360

gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420

acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480

gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540

aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600

tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660

ctggaagttc tgttccaggg gcccctggga tccatgtctg tttggcgtcc gtctgaagct 720

accgtttacc tgccgccggt tccggtttct aaagttgttt ctaccgacga atacgtttct 780

cgtacctcta tctactacta cgctggttct tctcgtctgc tggctgttgg tcacccgtac 840

ttctctatca aaaacccgaa caacgctaaa aaactgctgg ttccgaaagt ttctggtctg 900

cagtaccgtg ttttccgtgt tcgtctgccg gacccgaaca aattcggttt cccggacacc 960

tctttctaca acccggacac ccagcgtctg gtttgggctt gcgttggtct ggaaatcggt 1020

cgtggtcagc cgctgggtgt tggtatctct ggtcacccgc tgctgaacaa attcgacgac 1080

accgaaacct ctaacaaata cccgggtcag ccgggtgctg acaaccgtga atgcctgtct 1140

atggactaca aacagaccca gctgtgcctg ctgggttgca aaccgccgac cggtgaacac 1200

tggggtaaag gtgttgcttg caccaacgct gctccggcta acgactgccc gccgctggaa 1260

ctgatcaaca ccatcatcga agacggtgac atggttgaca ccggtttcgg ttgcatggac 1320

ttcaaaaccc tgcaggctaa caaatctgac gttccgatcg acatctgcgg ttctacctgc 1380

aaatacccgg actacctgaa aatgacctct gaaccgtacg gtgactctct gttcttcttc 1440

ctgcgtcgtg aacagatgtt cgttcgtcac ttcttcaacc gtgctggtaa actgggtgaa 1500

gctgttccgg acgacctgta catcaaaggt tctggtacca ccgcttctat ccagtcttct 1560

gctttcttcc cgaccccgtc tggttctatg gttacctctg aatctcagct gttcaacaaa 1620

ccgtactggc tgcagcgtgc tcagggtcac aacaacggta tctgctgggg taaccaggtt 1680

ttcgttaccg ttgttgacac cacccgttct accaacatga ccctgtgcac ccaggttacc 1740

tctgactcta cctacaaaaa cgaaaacttc aaagaataca tccgtcacgt tgaagaatac 1800

gacctgcagt tcgttttcca gctgtgcaaa gttaccctga ccgctgaagt tatgacctac 1860

atccacgcta tgaacccgga catcctggaa gactggcagt tcggtctgac cccgccgccg 1920

tctgcttctc tgcaggacac ctaccgtttc gttacctctc aggctatcac ctgccagaaa 1980

accgttccgc cgaaagaaaa agaagacccg ctgggtaaat acaccttctg ggaagttgac 2040

ctgaaagaaa aattctctgc tgacctggac cagttcccgc tgggtcgtaa attcctgctg 2100

caggctggtc tgaaagctaa accgaaactg aaacgtgctg ctccgacctc tacccgtacc 2160

tcttctgcta aacgtaaaaa agttaaaaaa tag 2193

<210> 4

<211> 2475

<212> DNA

<213> 人工序列

<400> 4

atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60

ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120

tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180

ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240

atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300

gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360

gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420

acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480

gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540

aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600

tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660

ctggaagttc tgttccaggg gccctctgac caggaagcta aaccgtctac cgaagacctg 720

ggtgacaaaa aagaaggtga atacatcaaa ctgaaagtta tcggtcagga ctcttctgaa 780

atccacttca aagttaaaat gaccacccac ctgaaaaaac tgaaagaatc ttactgccag 840

cgtcagggtg ttccgatgaa ctctctgcgt ttcctgttcg aaggtcagcg tatcgctgac 900

aaccacaccc cgaaagaact gggtatggaa gaagaagacg ttatcgaagt ttaccaggaa 960

cagaccggtg gatccatgtc tgtttggcgt ccgtctgaag ctaccgttta cctgccgccg 1020

gttccggttt ctaaagttgt ttctaccgac gaatacgttt ctcgtacctc tatctactac 1080

tacgctggtt cttctcgtct gctggctgtt ggtcacccgt acttctctat caaaaacccg 1140

aacaacgcta aaaaactgct ggttccgaaa gtttctggtc tgcagtaccg tgttttccgt 1200

gttcgtctgc cggacccgaa caaattcggt ttcccggaca cctctttcta caacccggac 1260

acccagcgtc tggtttgggc ttgcgttggt ctggaaatcg gtcgtggtca gccgctgggt 1320

gttggtatct ctggtcaccc gctgctgaac aaattcgacg acaccgaaac ctctaacaaa 1380

tacccgggtc agccgggtgc tgacaaccgt gaatgcctgt ctatggacta caaacagacc 1440

cagctgtgcc tgctgggttg caaaccgccg accggtgaac actggggtaa aggtgttgct 1500

tgcaccaacg ctgctccggc taacgactgc ccgccgctgg aactgatcaa caccatcatc 1560

gaagacggtg acatggttga caccggtttc ggttgcatgg acttcaaaac cctgcaggct 1620

aacaaatctg acgttccgat cgacatctgc ggttctacct gcaaataccc ggactacctg 1680

aaaatgacct ctgaaccgta cggtgactct ctgttcttct tcctgcgtcg tgaacagatg 1740

ttcgttcgtc acttcttcaa ccgtgctggt aaactgggtg aagctgttcc ggacgacctg 1800

tacatcaaag gttctggtac caccgcttct atccagtctt ctgctttctt cccgaccccg 1860

tctggttcta tggttacctc tgaatctcag ctgttcaaca aaccgtactg gctgcagcgt 1920

gctcagggtc acaacaacgg tatctgctgg ggtaaccagg ttttcgttac cgttgttgac 1980

accacccgtt ctaccaacat gaccctgtgc acccaggtta cctctgactc tacctacaaa 2040

aacgaaaact tcaaagaata catccgtcac gttgaagaat acgacctgca gttcgttttc 2100

cagctgtgca aagttaccct gaccgctgaa gttatgacct acatccacgc tatgaacccg 2160

gacatcctgg aagactggca gttcggtctg accccgccgc cgtctgcttc tctgcaggac 2220

acctaccgtt tcgttacctc tcaggctatc acctgccaga aaaccgttcc gccgaaagaa 2280

aaagaagacc cgctgggtaa atacaccttc tgggaagttg acctgaaaga aaaattctct 2340

gctgacctgg accagttccc gctgggtcgt aaattcctgc tgcaggctgg tctgaaagct 2400

aaaccgaaac tgaaacgtgc tgctccgacc tctacccgta cctcttctgc taaacgtaaa 2460

aaagttaaaa aatag 2475

<210> 5

<211> 2673

<212> DNA

<213> 人工序列

<400> 5

atgaaaatcg aagaaggtaa actggtaatc tggattaacg gcgataaagg ctataacggt 60

ctcgctgaag tcggtaagaa attcgagaaa gataccggaa ttaaagtcac cgttgagcat 120

ccggataaac tggaagagaa attcccacag gttgcggcaa ctggcgatgg ccctgacatt 180

atcttctggg cacacgaccg ctttggtggc tacgctcaat ctggcctgtt ggctgaaatc 240

accccggaca aagcgttcca ggacaagctg tatccgttta cctgggatgc cgtacgttac 300

aacggcaagc tgattgctta cccgatcgct gttgaagcgt tatcgctgat ttataacaaa 360

gatctgctgc cgaacccgcc aaaaacctgg gaagagatcc cggcgctgga taaagaactg 420

aaagcgaaag gtaagagcgc gctgatgttc aacctgcaag aaccgtactt cacctggccg 480

ctgattgctg ctgacggggg ttatgcgttc aagtatgaaa acggcaagta cgacattaaa 540

gacgtgggcg tggataacgc tggcgcgaaa gcgggtctga ccttcctggt tgacctgatt 600

aaaaacaaac acatgaatgc agacaccgat tactccatcg cagaagctgc ctttaataaa 660

ggcgaaacag cgatgaccat caacggcccg tgggcatggt ccaacatcga caccagcaaa 720

gtgaattatg gtgtaacggt actgccgacc ttcaagggtc aaccatccaa accgttcgtt 780

ggcgtgctga gcgcaggtat taacgccgcc agtccgaaca aagagctggc aaaagagttc 840

ctcgaaaact atctgctgac tgatgaaggt ctggaagcgg ttaataaaga caaaccgctg 900

ggtgccgtag cgctgaagtc ttacgaggaa gagttggcga aagatccacg tattgccgcc 960

actatggaaa acgcccagaa aggtgaaatc atgccgaaca tcccgcagat gtccgctttc 1020

tggtatgccg tgcgtactgc ggtgatcaac gccgccagcg gtcgtcagac tgtcgatgaa 1080

gccctgaaag acgcgcagac taattcgagc tcgaacaaca acaacaataa caataacaac 1140

aacctcggga tcgagggaag gatttcagaa ttcatgtctg tttggcgtcc gtctgaagct 1200

accgtttacc tgccgccggt tccggtttct aaagttgttt ctaccgacga atacgtttct 1260

cgtacctcta tctactacta cgctggttct tctcgtctgc tggctgttgg tcacccgtac 1320

ttctctatca aaaacccgaa caacgctaaa aaactgctgg ttccgaaagt ttctggtctg 1380

cagtaccgtg ttttccgtgt tcgtctgccg gacccgaaca aattcggttt cccggacacc 1440

tctttctaca acccggacac ccagcgtctg gtttgggctt gcgttggtct ggaaatcggt 1500

cgtggtcagc cgctgggtgt tggtatctct ggtcacccgc tgctgaacaa attcgacgac 1560

accgaaacct ctaacaaata cccgggtcag ccgggtgctg acaaccgtga atgcctgtct 1620

atggactaca aacagaccca gctgtgcctg ctgggttgca aaccgccgac cggtgaacac 1680

tggggtaaag gtgttgcttg caccaacgct gctccggcta acgactgccc gccgctggaa 1740

ctgatcaaca ccatcatcga agacggtgac atggttgaca ccggtttcgg ttgcatggac 1800

ttcaaaaccc tgcaggctaa caaatctgac gttccgatcg acatctgcgg ttctacctgc 1860

aaatacccgg actacctgaa aatgacctct gaaccgtacg gtgactctct gttcttcttc 1920

ctgcgtcgtg aacagatgtt cgttcgtcac ttcttcaacc gtgctggtaa actgggtgaa 1980

gctgttccgg acgacctgta catcaaaggt tctggtacca ccgcttctat ccagtcttct 2040

gctttcttcc cgaccccgtc tggttctatg gttacctctg aatctcagct gttcaacaaa 2100

ccgtactggc tgcagcgtgc tcagggtcac aacaacggta tctgctgggg taaccaggtt 2160

ttcgttaccg ttgttgacac cacccgttct accaacatga ccctgtgcac ccaggttacc 2220

tctgactcta cctacaaaaa cgaaaacttc aaagaataca tccgtcacgt tgaagaatac 2280

gacctgcagt tcgttttcca gctgtgcaaa gttaccctga ccgctgaagt tatgacctac 2340

atccacgcta tgaacccgga catcctggaa gactggcagt tcggtctgac cccgccgccg 2400

tctgcttctc tgcaggacac ctaccgtttc gttacctctc aggctatcac ctgccagaaa 2460

accgttccgc cgaaagaaaa agaagacccg ctgggtaaat acaccttctg ggaagttgac 2520

ctgaaagaaa aattctctgc tgacctggac cagttcccgc tgggtcgtaa attcctgctg 2580

caggctggtc tgaaagctaa accgaaactg aaacgtgctg ctccgacctc tacccgtacc 2640

tcttctgcta aacgtaaaaa agttaaaaaa tag 2673

<210> 6

<211> 1563

<212> DNA

<213> 人工序列

<400> 6

atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60

atgatgtctg tttggcgtcc gtctgaagct accgtttacc tgccgccggt tccggtttct 120

aaagttgttt ctaccgacga atacgtttct cgtacctcta tctactacta cgctggttct 180

tctcgtctgc tggctgttgg tcacccgtac ttctctatca aaaacccgaa caacgctaaa 240

aaactgctgg ttccgaaagt ttctggtctg cagtaccgtg ttttccgtgt tcgtctgccg 300

gacccgaaca aattcggttt cccggacacc tctttctaca acccggacac ccagcgtctg 360

gtttgggctt gcgttggtct ggaaatcggt cgtggtcagc cgctgggtgt tggtatctct 420

ggtcacccgc tgctgaacaa attcgacgac accgaaacct ctaacaaata cccgggtcag 480

ccgggtgctg acaaccgtga atgcctgtct atggactaca aacagaccca gctgtgcctg 540

ctgggttgca aaccgccgac cggtgaacac tggggtaaag gtgttgcttg caccaacgct 600

gctccggcta acgactgccc gccgctggaa ctgatcaaca ccatcatcga agacggtgac 660

atggttgaca ccggtttcgg ttgcatggac ttcaaaaccc tgcaggctaa caaatctgac 720

gttccgatcg acatctgcgg ttctacctgc aaatacccgg actacctgaa aatgacctct 780

gaaccgtacg gtgactctct gttcttcttc ctgcgtcgtg aacagatgtt cgttcgtcac 840

ttcttcaacc gtgctggtaa actgggtgaa gctgttccgg acgacctgta catcaaaggt 900

tctggtacca ccgcttctat ccagtcttct gctttcttcc cgaccccgtc tggttctatg 960

gttacctctg aatctcagct gttcaacaaa ccgtactggc tgcagcgtgc tcagggtcac 1020

aacaacggta tctgctgggg taaccaggtt ttcgttaccg ttgttgacac cacccgttct 1080

accaacatga ccctgtgcac ccaggttacc tctgactcta cctacaaaaa cgaaaacttc 1140

aaagaataca tccgtcacgt tgaagaatac gacctgcagt tcgttttcca gctgtgcaaa 1200

gttaccctga ccgctgaagt tatgacctac atccacgcta tgaacccgga catcctggaa 1260

gactggcagt tcggtctgac cccgccgccg tctgcttctc tgcaggacac ctaccgtttc 1320

gttacctctc aggctatcac ctgccagaaa accgttccgc cgaaagaaaa agaagacccg 1380

ctgggtaaat acaccttctg ggaagttgac ctgaaagaaa aattctctgc tgacctggac 1440

cagttcccgc tgggtcgtaa attcctgctg caggctggtc tgaaagctaa accgaaactg 1500

aaacgtgctg ctccgacctc tacccgtacc tcttctgcta aacgtaaaaa agttaaaaaa 1560

tag 1563

<210> 7

<211> 1854

<212> DNA

<213> 人工序列

<400> 7

atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60

atgtctgacc aggaagctaa accgtctacc gaagacctgg gtgacaaaaa agaaggtgaa 120

tacatcaaac tgaaagttat cggtcaggac tcttctgaaa tccacttcaa agttaaaatg 180

accacccacc tgaaaaaact gaaagaatct tactgccagc gtcagggtgt tccgatgaac 240

tctctgcgtt tcctgttcga aggtcagcgt atcgctgaca accacacccc gaaagaactg 300

ggtatggaag aagaagacgt tatcgaagtt taccaggaac agaccggtgg atccatgtct 360

gtttggcgtc cgtctgaagc taccgtttac ctgccgccgg ttccggtttc taaagttgtt 420

tctaccgacg aatacgtttc tcgtacctct atctactact acgctggttc ttctcgtctg 480

ctggctgttg gtcacccgta cttctctatc aaaaacccga acaacgctaa aaaactgctg 540

gttccgaaag tttctggtct gcagtaccgt gttttccgtg ttcgtctgcc ggacccgaac 600

aaattcggtt tcccggacac ctctttctac aacccggaca cccagcgtct ggtttgggct 660

tgcgttggtc tggaaatcgg tcgtggtcag ccgctgggtg ttggtatctc tggtcacccg 720

ctgctgaaca aattcgacga caccgaaacc tctaacaaat acccgggtca gccgggtgct 780

gacaaccgtg aatgcctgtc tatggactac aaacagaccc agctgtgcct gctgggttgc 840

aaaccgccga ccggtgaaca ctggggtaaa ggtgttgctt gcaccaacgc tgctccggct 900

aacgactgcc cgccgctgga actgatcaac accatcatcg aagacggtga catggttgac 960

accggtttcg gttgcatgga cttcaaaacc ctgcaggcta acaaatctga cgttccgatc 1020

gacatctgcg gttctacctg caaatacccg gactacctga aaatgacctc tgaaccgtac 1080

ggtgactctc tgttcttctt cctgcgtcgt gaacagatgt tcgttcgtca cttcttcaac 1140

cgtgctggta aactgggtga agctgttccg gacgacctgt acatcaaagg ttctggtacc 1200

accgcttcta tccagtcttc tgctttcttc ccgaccccgt ctggttctat ggttacctct 1260

gaatctcagc tgttcaacaa accgtactgg ctgcagcgtg ctcagggtca caacaacggt 1320

atctgctggg gtaaccaggt tttcgttacc gttgttgaca ccacccgttc taccaacatg 1380

accctgtgca cccaggttac ctctgactct acctacaaaa acgaaaactt caaagaatac 1440

atccgtcacg ttgaagaata cgacctgcag ttcgttttcc agctgtgcaa agttaccctg 1500

accgctgaag ttatgaccta catccacgct atgaacccgg acatcctgga agactggcag 1560

ttcggtctga ccccgccgcc gtctgcttct ctgcaggaca cctaccgttt cgttacctct 1620

caggctatca cctgccagaa aaccgttccg ccgaaagaaa aagaagaccc gctgggtaaa 1680

tacaccttct gggaagttga cctgaaagaa aaattctctg ctgacctgga ccagttcccg 1740

ctgggtcgta aattcctgct gcaggctggt ctgaaagcta aaccgaaact gaaacgtgct 1800

gctccgacct ctacccgtac ctcttctgct aaacgtaaaa aagttaaaaa atag 1854

<210> 8

<211> 730

<212> PRT

<213> 人工序列

<400> 8

Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro

1 5 10 15

Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu

20 25 30

Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu

35 40 45

Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys

50 55 60

Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn

65 70 75 80

Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu

85 90 95

Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser

100 105 110

Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu

115 120 125

Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn

130 135 140

Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp

145 150 155 160

Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu

165 170 175

Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr

180 185 190

Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala

195 200 205

Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Glu Val Leu

210 215 220

Phe Gln Gly Pro Leu Gly Ser Met Ser Val Trp Arg Pro Ser Glu Ala

225 230 235 240

Thr Val Tyr Leu Pro Pro Val Pro Val Ser Lys Val Val Ser Thr Asp

245 250 255

Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg

260 265 270

Leu Leu Ala Val Gly His Pro Tyr Phe Ser Ile Lys Asn Pro Asn Asn

275 280 285

Ala Lys Lys Leu Leu Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val

290 295 300

Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr

305 310 315 320

Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu Val Trp Ala Cys Val Gly

325 330 335

Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His

340 345 350

Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu Thr Ser Asn Lys Tyr Pro

355 360 365

Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys Leu Ser Met Asp Tyr Lys

370 375 380

Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Thr Gly Glu His

385 390 395 400

Trp Gly Lys Gly Val Ala Cys Thr Asn Ala Ala Pro Ala Asn Asp Cys

405 410 415

Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile Glu Asp Gly Asp Met Val

420 425 430

Asp Thr Gly Phe Gly Cys Met Asp Phe Lys Thr Leu Gln Ala Asn Lys

435 440 445

Ser Asp Val Pro Ile Asp Ile Cys Gly Ser Thr Cys Lys Tyr Pro Asp

450 455 460

Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly Asp Ser Leu Phe Phe Phe

465 470 475 480

Leu Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ala Gly

485 490 495

Lys Leu Gly Glu Ala Val Pro Asp Asp Leu Tyr Ile Lys Gly Ser Gly

500 505 510

Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe Phe Pro Thr Pro Ser Gly

515 520 525

Ser Met Val Thr Ser Glu Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu

530 535 540

Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln Val

545 550 555 560

Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Thr Leu Cys

565 570 575

Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys Asn Glu Asn Phe Lys Glu

580 585 590

Tyr Ile Arg His Val Glu Glu Tyr Asp Leu Gln Phe Val Phe Gln Leu

595 600 605

Cys Lys Val Thr Leu Thr Ala Glu Val Met Thr Tyr Ile His Ala Met

610 615 620

Asn Pro Asp Ile Leu Glu Asp Trp Gln Phe Gly Leu Thr Pro Pro Pro

625 630 635 640

Ser Ala Ser Leu Gln Asp Thr Tyr Arg Phe Val Thr Ser Gln Ala Ile

645 650 655

Thr Cys Gln Lys Thr Val Pro Pro Lys Glu Lys Glu Asp Pro Leu Gly

660 665 670

Lys Tyr Thr Phe Trp Glu Val Asp Leu Lys Glu Lys Phe Ser Ala Asp

675 680 685

Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu

690 695 700

Lys Ala Lys Pro Lys Leu Lys Arg Ala Ala Pro Thr Ser Thr Arg Thr

705 710 715 720

Ser Ser Ala Lys Arg Lys Lys Val Lys Lys

725 730

<210> 9

<211> 824

<212> PRT

<213> 人工序列

<400> 9

Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro

1 5 10 15

Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu

20 25 30

Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu

35 40 45

Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys

50 55 60

Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn

65 70 75 80

Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu

85 90 95

Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser

100 105 110

Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu

115 120 125

Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn

130 135 140

Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp

145 150 155 160

Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu

165 170 175

Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr

180 185 190

Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala

195 200 205

Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Glu Val Leu

210 215 220

Phe Gln Gly Pro Ser Asp Gln Glu Ala Lys Pro Ser Thr Glu Asp Leu

225 230 235 240

Gly Asp Lys Lys Glu Gly Glu Tyr Ile Lys Leu Lys Val Ile Gly Gln

245 250 255

Asp Ser Ser Glu Ile His Phe Lys Val Lys Met Thr Thr His Leu Lys

260 265 270

Lys Leu Lys Glu Ser Tyr Cys Gln Arg Gln Gly Val Pro Met Asn Ser

275 280 285

Leu Arg Phe Leu Phe Glu Gly Gln Arg Ile Ala Asp Asn His Thr Pro

290 295 300

Lys Glu Leu Gly Met Glu Glu Glu Asp Val Ile Glu Val Tyr Gln Glu

305 310 315 320

Gln Thr Gly Gly Ser Met Ser Val Trp Arg Pro Ser Glu Ala Thr Val

325 330 335

Tyr Leu Pro Pro Val Pro Val Ser Lys Val Val Ser Thr Asp Glu Tyr

340 345 350

Val Ser Arg Thr Ser Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu

355 360 365

Ala Val Gly His Pro Tyr Phe Ser Ile Lys Asn Pro Asn Asn Ala Lys

370 375 380

Lys Leu Leu Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val Phe Arg

385 390 395 400

Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr Ser Phe

405 410 415

Tyr Asn Pro Asp Thr Gln Arg Leu Val Trp Ala Cys Val Gly Leu Glu

420 425 430

Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro Leu

435 440 445

Leu Asn Lys Phe Asp Asp Thr Glu Thr Ser Asn Lys Tyr Pro Gly Gln

450 455 460

Pro Gly Ala Asp Asn Arg Glu Cys Leu Ser Met Asp Tyr Lys Gln Thr

465 470 475 480

Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Thr Gly Glu His Trp Gly

485 490 495

Lys Gly Val Ala Cys Thr Asn Ala Ala Pro Ala Asn Asp Cys Pro Pro

500 505 510

Leu Glu Leu Ile Asn Thr Ile Ile Glu Asp Gly Asp Met Val Asp Thr

515 520 525

Gly Phe Gly Cys Met Asp Phe Lys Thr Leu Gln Ala Asn Lys Ser Asp

530 535 540

Val Pro Ile Asp Ile Cys Gly Ser Thr Cys Lys Tyr Pro Asp Tyr Leu

545 550 555 560

Lys Met Thr Ser Glu Pro Tyr Gly Asp Ser Leu Phe Phe Phe Leu Arg

565 570 575

Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ala Gly Lys Leu

580 585 590

Gly Glu Ala Val Pro Asp Asp Leu Tyr Ile Lys Gly Ser Gly Thr Thr

595 600 605

Ala Ser Ile Gln Ser Ser Ala Phe Phe Pro Thr Pro Ser Gly Ser Met

610 615 620

Val Thr Ser Glu Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg

625 630 635 640

Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln Val Phe Val

645 650 655

Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Thr Leu Cys Thr Gln

660 665 670

Val Thr Ser Asp Ser Thr Tyr Lys Asn Glu Asn Phe Lys Glu Tyr Ile

675 680 685

Arg His Val Glu Glu Tyr Asp Leu Gln Phe Val Phe Gln Leu Cys Lys

690 695 700

Val Thr Leu Thr Ala Glu Val Met Thr Tyr Ile His Ala Met Asn Pro

705 710 715 720

Asp Ile Leu Glu Asp Trp Gln Phe Gly Leu Thr Pro Pro Pro Ser Ala

725 730 735

Ser Leu Gln Asp Thr Tyr Arg Phe Val Thr Ser Gln Ala Ile Thr Cys

740 745 750

Gln Lys Thr Val Pro Pro Lys Glu Lys Glu Asp Pro Leu Gly Lys Tyr

755 760 765

Thr Phe Trp Glu Val Asp Leu Lys Glu Lys Phe Ser Ala Asp Leu Asp

770 775 780

Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu Lys Ala

785 790 795 800

Lys Pro Lys Leu Lys Arg Ala Ala Pro Thr Ser Thr Arg Thr Ser Ser

805 810 815

Ala Lys Arg Lys Lys Val Lys Lys

820

<210> 10

<211> 890

<212> PRT

<213> 人工序列

<400> 10

Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys

1 5 10 15

Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr

20 25 30

Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe

35 40 45

Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala

50 55 60

His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile

65 70 75 80

Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp

85 90 95

Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu

100 105 110

Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys

115 120 125

Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly

130 135 140

Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro

145 150 155 160

Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys

165 170 175

Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly

180 185 190

Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp

195 200 205

Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala

210 215 220

Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys

225 230 235 240

Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser

245 250 255

Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro

260 265 270

Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp

275 280 285

Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala

290 295 300

Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala

305 310 315 320

Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln

325 330 335

Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala

340 345 350

Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Asn

355 360 365

Ser Ser Ser Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Leu Gly Ile

370 375 380

Glu Gly Arg Ile Ser Glu Phe Met Ser Val Trp Arg Pro Ser Glu Ala

385 390 395 400

Thr Val Tyr Leu Pro Pro Val Pro Val Ser Lys Val Val Ser Thr Asp

405 410 415

Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg

420 425 430

Leu Leu Ala Val Gly His Pro Tyr Phe Ser Ile Lys Asn Pro Asn Asn

435 440 445

Ala Lys Lys Leu Leu Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val

450 455 460

Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr

465 470 475 480

Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu Val Trp Ala Cys Val Gly

485 490 495

Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His

500 505 510

Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu Thr Ser Asn Lys Tyr Pro

515 520 525

Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys Leu Ser Met Asp Tyr Lys

530 535 540

Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Thr Gly Glu His

545 550 555 560

Trp Gly Lys Gly Val Ala Cys Thr Asn Ala Ala Pro Ala Asn Asp Cys

565 570 575

Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile Glu Asp Gly Asp Met Val

580 585 590

Asp Thr Gly Phe Gly Cys Met Asp Phe Lys Thr Leu Gln Ala Asn Lys

595 600 605

Ser Asp Val Pro Ile Asp Ile Cys Gly Ser Thr Cys Lys Tyr Pro Asp

610 615 620

Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly Asp Ser Leu Phe Phe Phe

625 630 635 640

Leu Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ala Gly

645 650 655

Lys Leu Gly Glu Ala Val Pro Asp Asp Leu Tyr Ile Lys Gly Ser Gly

660 665 670

Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe Phe Pro Thr Pro Ser Gly

675 680 685

Ser Met Val Thr Ser Glu Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu

690 695 700

Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln Val

705 710 715 720

Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Thr Leu Cys

725 730 735

Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys Asn Glu Asn Phe Lys Glu

740 745 750

Tyr Ile Arg His Val Glu Glu Tyr Asp Leu Gln Phe Val Phe Gln Leu

755 760 765

Cys Lys Val Thr Leu Thr Ala Glu Val Met Thr Tyr Ile His Ala Met

770 775 780

Asn Pro Asp Ile Leu Glu Asp Trp Gln Phe Gly Leu Thr Pro Pro Pro

785 790 795 800

Ser Ala Ser Leu Gln Asp Thr Tyr Arg Phe Val Thr Ser Gln Ala Ile

805 810 815

Thr Cys Gln Lys Thr Val Pro Pro Lys Glu Lys Glu Asp Pro Leu Gly

820 825 830

Lys Tyr Thr Phe Trp Glu Val Asp Leu Lys Glu Lys Phe Ser Ala Asp

835 840 845

Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu

850 855 860

Lys Ala Lys Pro Lys Leu Lys Arg Ala Ala Pro Thr Ser Thr Arg Thr

865 870 875 880

Ser Ser Ala Lys Arg Lys Lys Val Lys Lys

885 890

<210> 11

<211> 2094

<212> DNA

<213> 人工序列

<400> 11

atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60

ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120

tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180

ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240

atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300

gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360

gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420

acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480

gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540

aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600

tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660

ctggaagttc tgttccaggg gccctctgaa gctaccgttt acctgccgcc ggttccggtt 720

tctaaagttg tttctaccga cgaatacgtt tctcgtacct ctatctacta ctacgctggt 780

tcttctcgtc tgctggctgt tggtcacccg tacttctcta tcaaaaaccc gaacaacgct 840

aaaaaactgc tggttccgaa agtttctggt ctgcagtacc gtgttttccg tgttcgtctg 900

ccggacccga acaaattcgg tttcccggac acctctttct acaacccgga cacccagcgt 960

ctggtttggg cttgcgttgg tctggaaatc ggtcgtggtc agccgctggg tgttggtatc 1020

tctggtcacc cgctgctgaa caaattcgac gacaccgaaa cctctaacaa atacccgggt 1080

cagccgggtg ctgacaaccg tgaatgcctg tctatggact acaaacagac ccagctgtgc 1140

ctgctgggtt gcaaaccgcc gaccggtgaa cactggggta aaggtgttgc ttgcaccaac 1200

gctgctccgg ctaacgactg cccgccgctg gaactgatca acaccatcat cgaagacggt 1260

gacatggttg acaccggttt cggttgcatg gacttcaaaa ccctgcaggc taacaaatct 1320

gacgttccga tcgacatctg cggttctacc tgcaaatacc cggactacct gaaaatgacc 1380

tctgaaccgt acggtgactc tctgttcttc ttcctgcgtc gtgaacagat gttcgttcgt 1440

cacttcttca accgtgctgg taaactgggt gaagctgttc cggacgacct gtacatcaaa 1500

ggttctggta ccaccgcttc tatccagtct tctgctttct tcccgacccc gtctggttct 1560

atggttacct ctgaatctca gctgttcaac aaaccgtact ggctgcagcg tgctcagggt 1620

cacaacaacg gtatctgctg gggtaaccag gttttcgtta ccgttgttga caccacccgt 1680

tctaccaaca tgaccctgtg cacccaggtt acctctgact ctacctacaa aaacgaaaac 1740

ttcaaagaat acatccgtca cgttgaagaa tacgacctgc agttcgtttt ccagctgtgc 1800

aaagttaccc tgaccgctga agttatgacc tacatccacg ctatgaaccc ggacatcctg 1860

gaagactggc agttcggtct gaccccgccg ccgtctgctt ctctgcagga cacctaccgt 1920

ttcgttacct ctcaggctat cacctgccag aaaaccgttc cgccgaaaga aaaagaagac 1980

ccgctgggta aatacacctt ctgggaagtt gacctgaaag aaaaattctc tgctgacctg 2040

gaccagttcc cgctgggtcg taaattcctg ctgcaggctg gtctgaaagc ttag 2094

<210> 12

<211> 2457

<212> DNA

<213> 人工序列

<400> 12

atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60

ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120

tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180

ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240

atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300

gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360

gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420

acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480

gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540

aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600

tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660

ctggaagttc tgttccaggg gccctctgac caggaagcta aaccgtctac cgaagacctg 720

ggtgacaaaa aagaaggtga atacatcaaa ctgaaagtta tcggtcagga ctcttctgaa 780

atccacttca aagttaaaat gaccacccac ctgaaaaaac tgaaagaatc ttactgccag 840

cgtcagggtg ttccgatgaa ctctctgcgt ttcctgttcg aaggtcagcg tatcgctgac 900

aaccacaccc cgaaagaact gggtatggaa gaagaagacg ttatcgaagt ttaccaggaa 960

cagaccggtg gatcctctga agctaccgtt tacctgccgc cggttccggt ttctaaagtt 1020

gtttctaccg acgaatacgt ttctcgtacc tctatctact actacgctgg ttcttctcgt 1080

ctgctggctg ttggtcaccc gtacttctct atcaaaaacc cgaacaacgc taaaaaactg 1140

ctggttccga aagtttctgg tctgcagtac cgtgttttcc gtgttcgtct gccggacccg 1200

aacaaattcg gtttcccgga cacctctttc tacaacccgg acacccagcg tctggtttgg 1260

gcttgcgttg gtctggaaat cggtcgtggt cagccgctgg gtgttggtat ctctggtcac 1320

ccgctgctga acaaattcga cgacaccgaa acctctaaca aatacccggg tcagccgggt 1380

gctgacaacc gtgaatgcct gtctatggac tacaaacaga cccagctgtg cctgctgggt 1440

tgcaaaccgc cgaccggtga acactggggt aaaggtgttg cttgcaccaa cgctgctccg 1500

gctaacgact gcccgccgct ggaactgatc aacaccatca tcgaagacgg tgacatggtt 1560

gacaccggtt tcggttgcat ggacttcaaa accctgcagg ctaacaaatc tgacgttccg 1620

atcgacatct gcggttctac ctgcaaatac ccggactacc tgaaaatgac ctctgaaccg 1680

tacggtgact ctctgttctt cttcctgcgt cgtgaacaga tgttcgttcg tcacttcttc 1740

aaccgtgctg gtaaactggg tgaagctgtt ccggacgacc tgtacatcaa aggttctggt 1800

accaccgctt ctatccagtc ttctgctttc ttcccgaccc cgtctggttc tatggttacc 1860

tctgaatctc agctgttcaa caaaccgtac tggctgcagc gtgctcaggg tcacaacaac 1920

ggtatctgct ggggtaacca ggttttcgtt accgttgttg acaccacccg ttctaccaac 1980

atgaccctgt gcacccaggt tacctctgac tctacctaca aaaacgaaaa cttcaaagaa 2040

tacatccgtc acgttgaaga atacgacctg cagttcgttt tccagctgtg caaagttacc 2100

ctgaccgctg aagttatgac ctacatccac gctatgaacc cggacatcct ggaagactgg 2160

cagttcggtc tgaccccgcc gccgtctgct tctctgcagg acacctaccg tttcgttacc 2220

tctcaggcta tcacctgcca gaaaaccgtt ccgccgaaag aaaaagaaga cccgctgggt 2280

aaatacacct tctgggaagt tgacctgaaa gaaaaattct ctgctgacct ggaccagttc 2340

ccgctgggtc gtaaattcct gctgcaggct ggtctgaaag ctaaaccgaa actgaaacgt 2400

gctgctccga cctctacccg tacctcttct gctaaacgta aaaaagttaa aaaatag 2457

<210> 13

<211> 2628

<212> DNA

<213> 人工序列

<400> 13

atgaaaatcg aagaaggtaa actggtaatc tggattaacg gcgataaagg ctataacggt 60

ctcgctgaag tcggtaagaa attcgagaaa gataccggaa ttaaagtcac cgttgagcat 120

ccggataaac tggaagagaa attcccacag gttgcggcaa ctggcgatgg ccctgacatt 180

atcttctggg cacacgaccg ctttggtggc tacgctcaat ctggcctgtt ggctgaaatc 240

accccggaca aagcgttcca ggacaagctg tatccgttta cctgggatgc cgtacgttac 300

aacggcaagc tgattgctta cccgatcgct gttgaagcgt tatcgctgat ttataacaaa 360

gatctgctgc cgaacccgcc aaaaacctgg gaagagatcc cggcgctgga taaagaactg 420

aaagcgaaag gtaagagcgc gctgatgttc aacctgcaag aaccgtactt cacctggccg 480

ctgattgctg ctgacggggg ttatgcgttc aagtatgaaa acggcaagta cgacattaaa 540

gacgtgggcg tggataacgc tggcgcgaaa gcgggtctga ccttcctggt tgacctgatt 600

aaaaacaaac acatgaatgc agacaccgat tactccatcg cagaagctgc ctttaataaa 660

ggcgaaacag cgatgaccat caacggcccg tgggcatggt ccaacatcga caccagcaaa 720

gtgaattatg gtgtaacggt actgccgacc ttcaagggtc aaccatccaa accgttcgtt 780

ggcgtgctga gcgcaggtat taacgccgcc agtccgaaca aagagctggc aaaagagttc 840

ctcgaaaact atctgctgac tgatgaaggt ctggaagcgg ttaataaaga caaaccgctg 900

ggtgccgtag cgctgaagtc ttacgaggaa gagttggcga aagatccacg tattgccgcc 960

actatggaaa acgcccagaa aggtgaaatc atgccgaaca tcccgcagat gtccgctttc 1020

tggtatgccg tgcgtactgc ggtgatcaac gccgccagcg gtcgtcagac tgtcgatgaa 1080

gccctgaaag acgcgcagac taattcgagc tcgaacaaca acaacaataa caataacaac 1140

aacctcggga tcgagggaag gatttcagaa ttcatgtctg tttggcgtcc gtctgaagct 1200

accgtttacc tgccgccggt tccggtttct aaagttgttt ctaccgacga atacgtttct 1260

cgtacctcta tctactacta cgctggttct tctcgtctgc tggctgttgg tcacccgtac 1320

ttctctatca aaaacccgaa caacgctaaa aaactgctgg ttccgaaagt ttctggtctg 1380

cagtaccgtg ttttccgtgt tcgtctgccg gacccgaaca aattcggttt cccggacacc 1440

tctttctaca acccggacac ccagcgtctg gtttgggctt gcgttggtct ggaaatcggt 1500

cgtggtcagc cgctgggtgt tggtatctct ggtcacccgc tgctgaacaa attcgacgac 1560

accgaaacct ctaacaaata cccgggtcag ccgggtgctg acaaccgtga atgcctgtct 1620

atggactaca aacagaccca gctgtgcctg ctgggttgca aaccgccgac cggtgaacac 1680

tggggtaaag gtgttgcttg caccaacgct gctccggcta acgactgccc gccgctggaa 1740

ctgatcaaca ccatcatcga agacggtgac atggttgaca ccggtttcgg ttgcatggac 1800

ttcaaaaccc tgcaggctaa caaatctgac gttccgatcg acatctgcgg ttctacctgc 1860

aaatacccgg actacctgaa aatgacctct gaaccgtacg gtgactctct gttcttcttc 1920

ctgcgtcgtg aacagatgtt cgttcgtcac ttcttcaacc gtgctggtaa actgggtgaa 1980

gctgttccgg acgacctgta catcaaaggt tctggtacca ccgcttctat ccagtcttct 2040

gctttcttcc cgaccccgtc tggttctatg gttacctctg aatctcagct gttcaacaaa 2100

ccgtactggc tgcagcgtgc tcagggtcac aacaacggta tctgctgggg taaccaggtt 2160

ttcgttaccg ttgttgacac cacccgttct accaacatga ccctgtgcac ccaggttacc 2220

tctgactcta cctacaaaaa cgaaaacttc aaagaataca tccgtcacgt tgaagaatac 2280

gacctgcagt tcgttttcca gctgtgcaaa gttaccctga ccgctgaagt tatgacctac 2340

atccacgcta tgaacccgga catcctggaa gactggcagt tcggtctgac cccgccgccg 2400

tctgcttctc tgcaggacac ctaccgtttc gttacctctc aggctatcac ctgccagaaa 2460

accgttccgc cgaaagaaaa agaagacccg ctgggtaaat acaccttctg ggaagttgac 2520

ctgaaagaaa aattctctgc tgacctggac cagttcccgc tgggtcgtaa attcctgctg 2580

caggctggtc tgaaagctaa accgaaactg aaacgtgctg ctccgtaa 2628

Claims

1.一种经大肠杆菌偏好密码子优化的编码人乳头瘤病毒HPV33 L1的融合基因，其特征在于，优化的编码人乳头瘤病毒HPV33 L1的基因核苷酸序列如SEQ ID NO.2所示，并融合有编码GST-SUMO的编码核苷酸序列。

2.如权利要求1所述的融合基因，其特征在于，该融合基因编码的氨基酸序列如SEQ IDNO：9所示。

3.如权利要求1所述的融合基因，其特征在于，该融合基因的核苷酸序列如为SEQ IDNO：4所示。

4.一种大肠杆菌表达载体，其特征在于该载体包括如权利要求1-3任一项所述融合基因。

5.如权利要求4所述的大肠杆菌表达载体，其特征在于，出发载体为pGEX-6p-1、pGEX-4T-2、pMAL或pET28a。

6.一种工程菌细胞，该细胞包含权利要求1-3任一项所述的基因，或权利要求4或5所述的表达载体。