CN106701798B - 45型重组人乳头瘤病毒病毒样颗粒及其制备方法 - Google Patents

45型重组人乳头瘤病毒病毒样颗粒及其制备方法 Download PDF

Info

Publication number
CN106701798B
CN106701798B CN201510490367.0A CN201510490367A CN106701798B CN 106701798 B CN106701798 B CN 106701798B CN 201510490367 A CN201510490367 A CN 201510490367A CN 106701798 B CN106701798 B CN 106701798B
Authority
CN
China
Prior art keywords
hpv
protein
leu
pro
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510490367.0A
Other languages
English (en)
Other versions
CN106701798A (zh
Inventor
刘永江
银飞
伍树明
高文双
陈晓
王雅君
姜绪林
张瑞霞
高俊
张海江
李闯
刘玉莹
陈丹
沈迩萃
夏丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kangleweishi Biological Technology Co ltd
Original Assignee
Beijing Kangleweishi Biological Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kangleweishi Biological Technology Co ltd filed Critical Beijing Kangleweishi Biological Technology Co ltd
Priority to CN201510490367.0A priority Critical patent/CN106701798B/zh
Publication of CN106701798A publication Critical patent/CN106701798A/zh
Application granted granted Critical
Publication of CN106701798B publication Critical patent/CN106701798B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及45型重组人乳头瘤病毒病毒样颗粒及其制备方法,具体技术要点是提供一种新的编码重组的HPV45 L1蛋白的多核苷酸基因片段、包含该基因片段的载体、包括载体的宿主细胞,以及由该基因片段翻译表达的HPV45 L1溶合蛋白、五聚体和由该五聚体组成VLP,本发明还公开该五聚体、VLP蛋白及其组成的疫苗组合物在制备预防HPV45感染的药物中的应用。

Description

45型重组人乳头瘤病毒病毒样颗粒及其制备方法
技术领域
本发明涉及人乳头瘤病毒的病毒样颗粒及其制备方法。更具体而言,本发明涉及一种重组的人乳头瘤病毒L1蛋白的五聚体及病毒样颗粒(Virus-like PartiCle,VLP)及其制备方法,及含该病毒样颗粒的疫苗组合物在预防人乳头瘤病毒感染中的应用。
背景技术
人乳头瘤病毒(Human Papillomavirus,简称HPV)主要通过人体密切接触,如性传播的病毒,可引起人类多种增殖性上皮病变,包括乳头状瘤(疣)和瘤样病变。具体来讲,HPV诱发的疾病主要包括3大类,第1类:宫颈、阴道、女性外阴、阴茎和肛门的癌症及某些类型的头颈部肿瘤等恶性病变。100%的宫颈癌患者都是HPV感染所导致的,90%的肛门癌,40%的外阴、阴道及阴茎,12%的口咽及3%的口腔癌症归因于HPV感染。第2类:良性病变如扁平疣、尖锐湿疣等生殖器疣,是一种性传播疾病,在性行为活跃的人群中很常见。虽然生殖器疣不会像癌症一样造成严重的后果,但是病变通常会引起病人较为痛苦的临床症状如灼痛、出血和疼痛,同时产生尴尬、焦虑和自卑等负面的心理反应,而且反复治疗的过程浪费了大量的医疗资源。在世界范围内估计由非致癌性HPV(主要是6和11型)引起的生殖器疣有3000万,其中20~50%的病变中还包含有高危型HPV的混合感染。第3类:HPV感染还能引起复发性呼吸道乳头瘤( RRP),这是一种罕见的、具有潜在致命性的疾病,主要发生在青少年时期,有时,大量的乳头瘤可以引起呼吸困难并导致较小年龄儿童死亡。所以预防或治疗HPV感染对人类健康意义十分重大。
HPV是无囊膜的双链DNA病毒,主要由病毒外壳和基因组DNA组成(Bernard, Burket al. 2011)。HPV病毒外壳是由360个L1蛋白质(形成72个五聚体)和至多72个L2蛋白质构成的二十面体结构,直径55~60 nm(Howley and Lowy 2007)。病毒外壳蛋白质具有自组装特性,在体外L1蛋白质单独或与L2蛋白质共同自组装形成病毒样颗粒(Virus-likePartiCle,VLP)(Chen, Garcea et al. 2000, Finnen, Erickson et al. 2003, Buck,Cheng et al. 2008, Wang and Roden 2013)。
由于HPV不能在体外细胞培养, 要获得该病毒的特异性抗原, 只能用重组DNA 技术的方法制备基因工程疫苗。重组Ll或L1/L2组装形成的病毒样颗粒VLPs,无病毒DNA,安全性好,具有和天然病毒颗粒相似的抗原表位,刺激机体后可产生中和抗体IgG和IgA,因此HPV VLPs可作为预防性疫苗,从而大大降低因感染HPV导致产生相关肿瘤的可能性(Howley and Lowy 2007) 。
HPV疫苗研制的关键是能够大量制备高纯度、稳定的HPV抗原。在HPV疫苗抗原制备技术方面,目前较为常用的生产HPV抗原的表达系统可以分为真核表达系统及原核表达系统。常用的真核表达系统有痘病毒表达系统、昆虫杆状病毒表达系统、酵母表达系统。在真核表达系统中所表达的HPV L1能自发的形成VLP,往往只需进行简单的纯化即可获得VLP。但是由于真核表达系统的表达量低,培养成本高,给大规模工业化生产带来了极大困难。原核表达系统中利用大肠杆菌表达系统表达HPV L1蛋白质已有报道。但是由于大肠杆菌所表达的HPV L1蛋白质可溶性低,目前已知的纯化方法大多通过无盐沉淀或变性复性等步骤从蛋白质种类繁杂的细胞液中最终纯化得到HPV VLP。例如:在专利CN02129070.9中公开通过原核细胞表达和制备HPV L1多聚体的方法,其中纯化工艺包括通过3.3M尿素处理和透析复性过程;在WO-0204007专利中对L1-GST融合蛋白质的纯化方法也是通过尿素变性处理并进行透析复性;在现有技术中也有公开L1蛋白质的纯化方法是包括磷酸缓冲液超滤透析和离心,使目的蛋白沉淀再复溶的步骤。但是在这些纯化过程中蛋白质损失量大,得率低,难以在大规模生产上应用。
在HPV疫苗抗原蛋白质VLP的均一性方面,现有技术中所组装的HPV L1 VLP的粒径分散度有使用polyd值表示,polyd值<15%说明颗粒有很好的均一性,15%到30%之间说明颗粒有较大的不均一性,大于30%说明颗粒完全不够均一。现有技术中制备的HPV L1 VLP多大于15%。另一个说明粒径均一的指标是PdI值,PdI值为粒径分布系数,小于0.05为高度均一的样品;0.05~0.1为准均一的样品,0.1~0.3为均一性较差的样品,大于0.3为不均一的样品。在US7205125B2专利中公开两个型别HPV L1 VLP的混合蛋白液的PdI为0.07。
因此,本领域仍然需要成本低、纯度高、产量高、质量稳定的HPV L1蛋白质生产技术和大规模工业化生产重组HPV L1 VLP的新方法。
发明内容
本发明的目的是公开一种优化的编码HPV45 L1 蛋白质的核苷酸序列,包含该核苷酸序列的载体、包括载体的宿主细胞,以及由该多核苷酸序列翻译表达的HPV L1蛋白质,Tag-HPV-L1重组蛋白,由该L1蛋白质形成的五聚体和VLP,以及由该五聚体和VLP作为抗原组成的预防HPV感染的疫苗。
本发明第一方面提供一种经密码子优化的HPV45 L1的基因,其核苷酸序列为SEQNO:2。
本发明第二方面提供一种构建的表达载体,其包含本发明第一方面的经密码子优化的HPV45 L1的基因。所述载体适合驱动异源DNA在细菌中翻译表达HPV L1蛋白质。在一个实施方案中,所述表达载体优选pGEX-6p-1、pGEX-4T-2、 pMAL或pET28a。
本发明的第三方面提供一种构建的工程菌细胞,该细胞包含本发明第一方面的基因,或第二方面的表达载体。所述的工程菌宿主细胞是大肠杆菌,在一个实施方案中,所述宿主细胞优选BL21细胞株。
本发明第四方面提供一种Tag-HPV45 L1融合蛋白,其中标签Tag为6*His.Tag,GST.Tag,SUMO.Tag,MBP.Tag,6*His - SUMO.Tag或GST- SUMO.Tag;L1为HPV45 L1全长蛋白质和/或C端截短5个、10个、15个或不多于30个氨基酸和/或N端截短2个、4个、6个或不多于10个氨基酸的L1蛋白质。
编码Tag-HPVL1融合蛋白GST-HPV45 L1的核苷酸序列为SEQ NO:3、SEQ NO:11,,GST-SUMO-HPV45 L1的核苷酸序列为SEQ NO:4、SEQ NO:12,MBP的核苷酸序列SEQ NO:5、SEQ NO:13,6*His-HPV45 L1的核苷酸序列为SEQ NO:6, 6*His-SUMO-HPV45 L1的核苷酸序列为SEQ NO:7。
编码Tag-HPVL1融合蛋白GST-HPV45 L1的氨基酸序列为SEQ NO:8,GST-SUMO-HPV45 L1的氨基酸序列为SEQ NO:9,MBP的氨基酸序列SEQ NO:10。
本发明第五方面提供Tag-HPVL1融合蛋白质经过纯化后获得的HPV L1的五聚体,及由五聚体组装的VLP。在一个优选实施例中HPV45 L1五聚体蛋白平均粒径10~15nm PdI<0.1。在一个优选实施例中HPV45 L1VLP的平均粒径45~65nm PdI<0.1。
本发明第六方面提供了一种疫苗组合物,其包含本发明HPV L1的五聚体或HPV L1的VLP,所述组合物中进一步包含可药用的赋形剂和药用佐剂。
在一个实施方案中将含有HPV45 L1五聚体或VLP蛋白原液(根据上述方法制备所得)分别与氢氧化铝佐剂生理盐水溶液按照蛋白与铝含量1:10比例进行吸附配制即可制得重组HPV L1蛋白质五聚体或VLP疫苗,在4℃保存待用。
另一方面,本发明还提供一种获得Tag-HPVL1融合蛋白的方法,包括如下步骤:
A.通过用大肠杆菌偏爱的密码子取代HPV45 L1基因序列的翻译同种蛋白的密码子,得到大肠杆菌表达系统偏爱的密码子优化的HPV45 L1的基因;
B.构建HPV45 L1基因的大肠杆菌表达载体;
C.构建Tag-HPV45 L1的大肠杆菌表达工程菌株;
D.诱导表达并纯化得融合蛋白Tag-HPV45 L1。
上述制备融合蛋白Tag-HPV45 L1方法中原核宿主细胞选自但不限于GI698,ER2566,BL21 (DE3),XA90,B834 (DE3),BLR (DE3)。
上述制备融合蛋白Tag-HPV45 L1方法中表达条件是:20~37℃温度条件下,诱导表达3~20小时。在一个具体实施例中优选在28℃温度条件下,诱导表达 16小时。
本发明还提供一种获得HPV45 L1五聚体的方法,包括如下步骤:
a)用亲和层析方法吸附融合蛋白Tag-HPV45 L1;
b)加入蛋白质水解酶切除Tag标签,得到HPV45 L1五聚体蛋白质;
c)纯化HPVL1五聚体蛋白质、得到纯度>98%,平均粒径10~15nm PdI<0.1的L1五聚体蛋白质。
上述制备HPV45 L1五聚体方法中所述用于蛋白酶为切除Tag标签的位点专一的蛋白质水解酶:重组3C蛋白酶,凝血酶,SUMO蛋白酶,SENP1或TEV蛋白酶。
上述制备HPV45 L1五聚体方法中纯化方法选自但不限于离子交换色谱法,疏水性色谱法,分子筛(或称凝胶过滤或分子排阻)色谱法;优选地纯化包括离子交换色谱法和分子筛色谱法。
上述制备HPV45 L1五聚体方法中纯化方法还包括使用还原剂,例如加入DTT。
上述制备HPV45 L1五聚体方法中最终纯化后所得到HPV45 L1五聚体蛋白平均粒径10~15nm PdI<0.1。
本发明还提供了一种HPV45 L1五聚体组装成VLP的方法,包括如下步骤:
将平均粒径10~15nm PdI<0.1的L1五聚体蛋白质液与组装缓冲液混合,最终获得pH值为5.0~5.9,盐浓度为500~2000 mM,平均粒径45~65nm PdI<0.1的HPV45 L1 VLP蛋白质液,优选获得pH值为5.7,盐浓度为1300 mM的HPV45 L1 VLP蛋白质液。
组装缓冲液包括但不限于Tris缓冲液,磷酸盐缓冲液,醋酸缓冲液,HEPES缓冲液,MOPS缓冲液,枸橼酸缓冲液、组氨酸缓冲液,硼酸缓冲液等。
上述HPV45 L1五聚体组装成VLP的方法中HPV45 L1-VLP蛋白质液中还可以加入保护剂,例如:0.01~0.1聚山梨酯80。
另一方面,本发明还提供了HPV L1的五聚体、VLP和包括五聚体或VLP的疫苗组合物在制备预防HPV感染的药物中的应用。
根据本发明,本发明的疫苗可采用患者可接受的形式,包括但不限于注射或鼻腔或口腔吸入或者阴道给药,优选注射剂和肌内注射。
本发明中相关术语的说明及解释
根据本发明,术语“大肠杆菌表达系统”是指由大肠杆菌(菌株)与载体组成,其中大肠杆菌(菌株)来源于市场上可得到的,在此举例但不限于: GI698,ER2566,BL21 (DE3),XA90,DH(5a)、B834 (DE3),BLR (DE3)。
根据本发明,术语“载体”一词指的是,可将某编码蛋白质的多聚核苷酸插入其中并使蛋白质获得表达的一种核酸运载工具。载体可以通过转化,转导或者转染宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。举例来说,载体包括:质粒;噬菌体;柯斯质粒等等。
根据本发明,术语“疫苗用赋形剂或载体“是指选自一种或多种,包括但不限于:pH调节剂,表面活性剂,佐剂,离子强度增强剂。例如,pH调节剂举例但不限于磷酸盐缓冲液,表面活性剂包括阳离子,阴离子或者非离子型表面活性剂。举例但不限于:聚山梨酯80。佐剂举例但不限于氢氧化铝,磷酸铝、氟氏完全佐剂、氟氏不完全佐剂等。离子强度增强剂举例但不限于氯化钠。
根据本发明,术语“色谱”包括但不限于:离子交换色谱(例如阳离子交换色谱、阴离子交换色谱)、疏水相互作用色谱、吸附色谱层析法(例如羟基磷灰石色谱)、分子筛色谱层析(凝胶过滤或分子排阻层析)、亲和色谱层析法。
根据本发明,在本发明获得的重组HPV L1蛋白质的方法中,缓冲液是指一种能在加入少量酸或碱和水时大大降低pH变动幅度的溶液,包括但不限于Tris缓冲液,磷酸盐缓冲液,醋酸缓冲液,HEPES缓冲液,MOPS缓冲液,枸橼酸缓冲液、组氨酸缓冲液,硼酸缓冲液等。
根据本发明,所述细胞破碎包括但不限于通过匀浆器破碎、均质机破碎、超声波处理、研磨、高压挤压、溶菌酶处理中的一项或者多项方法来实现;
根据本发明,在本发明获得的重组HPV L1蛋白质的方法中,所用的盐包括但不限于是中性盐,特别是碱金属盐、铵盐、盐酸盐、硫酸盐,碳酸氢盐,磷酸盐或磷酸氢盐,特别是NaCL、KCl、CaCl2、NH4Cl、KCL、NH4CL、MgSO4 、(NH4)2SO4中的一种或几种。优选NaCL。所用的还原剂包括但不限于DTT,2-巯基乙醇。所用量包括但不限于2mM~l00mM,优选10~15mM。
有益效果
本发明提供了一种合成基因,该基因序列是根据大肠杆菌的密码子偏好进行过密码子优化的核苷酸序列,该序列编码了HPV L1蛋白氨基酸序列。研究发现经过密码子优化的核酸序列相对于未经密码子优化的核酸序列的L1蛋白的表达量有显著提高。
本发明公开的大肠杆菌表达系统具有表达量高、 易于培养和操作以及生产成本低等优点。但是, 仅仅使用该表达系统仍难以直接获得大量可溶性的HPV L1蛋白, 其原因在于L1蛋白极容易形成包涵体,即无生物学活性的不溶性聚合体。此外, 即使获得大量的包涵体, 为了得到有生物学活性的蛋白, 还必须对包涵体进行变性、 复性处理,这个过程往往损失大量的蛋白。为了解决这一难题,本发明采用融合技术,将L1基因与具有协助蛋白质正确折叠的蛋白如谷胱甘肽硫转移酶(GST)、SUMO、MBP、6*His- SUMO或GST- SUMO等进行融合表达,不仅蛋白的可溶性及收率有所提高,而且GST-SUMO-HPVL1,6*His-SUMO-HPVL1使得在HPV L1蛋白质N端没有外源氨基酸的残留,同时发现其中的GST-SUMO作为重组蛋白HPVL1表达的融合标签和分子伴侣, 具有抗蛋白酶水解、显著增加重组蛋白表达量以及促进靶蛋白正确折叠, 提高可溶性等功能。因此本发明采用的技术路线是在构建HPV L1蛋白表达载体时采用了标签蛋白融合技术,一方面通过标签蛋白与L1蛋白形成的融合蛋白来提高目的蛋白的可溶性、提高产量,另一方面通过GST融合标签可以利用亲和层析和蛋白水解酶切除融合质标签方法进行目的蛋白的纯化特点,从而实现了从种类繁杂的细胞裂解液中一步纯化即可获得纯度达到70%以上的HPV L1蛋白,大大提高了纯化效率,从而提高了终产物HPV L1蛋白的产量。
本发明提供的先表达、分离纯化获得高纯度的HPV L1五聚体蛋白后再人工控制组装形成VLP的技术路线,可以解决当前公知技术存在的从杂蛋白种类繁多的细胞破碎液中直接纯化VLP纯度低、降解比例高,收率低的问题,得到高纯度五聚体体外组装VLP及VLP保存条件。
本发明经重组所得的HPV L1 VLP蛋白质,具有良好的免疫原性,可以诱导高滴度的针对同型HPV的中和抗体,预防HPV对人体的感染,是一种良好的疫苗形式。
在参考下列详述和附图后,本发明的这些和其它方面将是显然的。此处公开的所有参考文献在此均完整引用作为参考。
附图说明
图l:GST-HPV45 L1 蛋白质亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准泳道从上至下为:94kDa,66kDa,45kDa,45kDa,26kDa,20kdat;1泳道为亲和吸附GST-L1的介质,分子量大约为80kDa;2泳道为酶解后GST与L1的介质。
图2:GST-SUMO-HPV45 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准(从上至下为:94kDa,66kDa,45kDa,45kDa,26kDa,20kDa),1泳道为亲和吸附GST-SUMO -L1的介质,2泳道为酶解后GST-SUMO与L1的介质。
图3:MBP-HPV45 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准(从上至下为:94kDa,66kDa,45kDa,45kDa,26kDa,20kda),1泳道为亲和吸附MBP -L1的介质,2泳道为酶解后MBP与L1的介质。
图4: 6*HIS-SUMO-HPV45 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准(从上至下为:94kDa,66kDa,45kDa,45kDa,26kDa,20kda),1泳道为亲和吸附6*HIS-SUMO - L1的介质,2泳道为酶解后6*HIS-SUMO与L1的介质。通过凝胶电泳图显示蛋白酶切开了带有6*HIS-SUMO标签的溶合蛋白。
图5:本发明经过分子筛色谱纯化后的重组HPV45 L1五聚体蛋白质SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准(从上至下为:94kDa,66kDa,45kDa,45kDa,26kDa,20kda),另一泳道为HPV L1蛋白。
图6:HPV45 L1五聚体的动态光散射观测结果。结果显示五聚体的粒径直径为12.14 nM,粒度分布PdI为 0.077。
图7: HPV45 L1 VLP的动态光散射观测结果。结果显示VLP的粒径直径为57.56 nM,粒度分布PdI为0.010。
图8:HPV45 L1五聚体蛋白的透射电镜照片。
图9:HPV45 L1 VLP蛋白的透射电镜照片。
图10:HPV45 L1五聚体蛋白质的高压液相分子筛色谱图,图中显示经高度纯化的L1五聚体蛋白质纯度大于98%。
图11:HPV45 L1 VLP蛋白质的高压液相分子筛色谱图,图中显示经高度纯化的VLP蛋白质纯度大于98%。
图12:HPV45 L1五聚体各实验组疫苗接种小鼠后,在第二次加强免疫4周后,检测中和抗体的平均滴度水平。
图13:HPV45 L1 VLP各实验组疫苗接种小鼠后,在第二次加强免疫4周后,检测中和抗体的平均滴度水平。
下面结合实施例对本发明进一步举例描述。这些实施例是非限制性的。
实施例l:密码子优化的HPV L1基因的设计与合成
基因序列来源于PUBMED上已公开的各型HPV序列。参照大肠杆菌对基因转录密码子的偏好对选定的各型HPV DNA序列进行密码子优化后合成所有HPV DNA序列。根据合成DNA序列设计引物,利用合成基因为模板进行PCR扩增。所得的密码子优化序列通过DNA序列测定验证。
优化前与优化后的HPV各型DNA序列:
SEQ NO.1:优化前的HPV45型L1的DNA序列
SEQ NO.2:优化后的HPV45型L1的DNA序列
实施例2:重组载体pGEX-6P-1-GST- HPV45 L1的构建及鉴定:
扩增HPV45 L1 的DNA片段引物:(酶切位点分别是BamHI和XhoI)
Forward-HPV45 L1-ApaI:5’ACTTCAGGATCC ATGGCTCTGTGGCGTCCGTCTG
Reverse-HPV45 L1-XhoI:5’ATCTCACTCGAGCTA TTTTTTAGAACGGATACGAAC
PCR扩增反应体系:10 x Pfu buffer 20 μL,Pfu酶 4 μL,10 mM dNTP 2.5 μL,5’Primer (5μM) 10μL,3’ Primer (5μM) 10μL,模 板DNA 50 ng,加d2H2O至200μL。
基因PCR扩增条件:95℃ 3 min; 95℃ 30 sec,58℃ 30 sec,72℃ 4 min;循环32次;72℃ 10 min。
将含有BamH I和XhoI酶切位点的L1基因片段以及载体pGEX-6P-1进行BamH I/XhoI双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGEX-6P-1进行连接反应,16 ℃ 10~15 h。
连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由上海生工生物公司进行测序,得到融合重组GST-HPV45-L1蛋白质的核苷酸序列为SEQ NO.3,氨基酸序列为SEQ NO.8。
参照该实施例方法制备带有GST-标签的融合重组载体GST-HPV-L1,其基因序列SEQ NO.11。
实施例3:重组载体pGEX-6P-1m-GST-SUMO- HPV45 L1 载体构建
pGEX-6p-1m载体构建:为使得多酶切位点附近的ApaI酶切位点 (GGGCCC)为载体的唯一ApaI酶切位点, 在不改变laCl基因蛋白质表达序列的前提下,通过点突变技术将市售的pGEX-6p-1载体的另一ApaI识别序列GGGCCC中的Gly密码子GGC改变为它的同义密码子GGT,即可消除ApaI(3890)。通过这样的改造使得ApaI 成为可用来插入表达基因的位点。
扩增SUMO 的DNA片段引物:(酶切位点分别是ApaI和BamHI)
Forward -SUMO-ApaI: ACTTCAGGGCCCTCTGACCAGGAAGCTAAACCGTC
Reverse-SUMO-BamHI: CGCGGATCCACCGGTCTGTTCCTGGTAAAC
扩增HPV45 L1 的DNA片段引物:(酶切位点分别是BamHI和XhoI)
Forward-HPV45 L1-ApaI:5’ACTTCAGGATCC ATGGCTCTGTGGCGTCCGTCTG
Reverse-HPV45 L1-XhoI:5’ATCTCACTCGAGCTA TTTTTTAGAACGGATACGAAC
PCR扩增反应体系:10 x Pfu buffer 20 μL,Pfu酶 4 μL,10 mM dNTP 2.5 μL,5’Primer (5μM) 10μL,3’ Primer (5μM) 10μL,模 板DNA 50 ng,加d2H2O至200μL。
基因PCR扩增条件:95℃ 1.5 min; 95℃ 30 sec,58℃ 30 sec,72℃ 1 min;循环32次;72℃ 10 min。
基因PCR扩增条件同上述实施例。
酶切连接:将含有ApaI和BamHI酶切位点的SUMO基因片段以及载体pGEX-6P-1m进行Apa I/ BamHI双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGEX-6P-1m进行连接反应,16 ℃ 10~15h。
转化鉴定:连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由苏州金唯智生物科技有限公司进行测序,得到融合重组载体pGSTSUMO-6p-1m。
再次酶切连接:将含有BamHI和Xho1酶切位点的L1基因片段以及重组载体pGSTSUMO-6p-1m进行BamHI/Xho1双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGST-SUMO-6p1m进行连接反应,16 ℃ 10~15 h。
再次转化鉴定:连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由苏州金唯智生物科技有限公司进行测序,得到带有GST-SUMO标签的融合重组载体GST-SUMO-L1,其基因序列SEQ NO.4,氨基酸序列为SEQ NO.9。
参照该实施例方法制备带有GST-SUMO标签的融合重组载体GST-SUMO-L1,其基因序列SEQ NO.12。
实施例4:重组载体pMAL—MBP-HPV45 L1的构建
扩增HPV45 L1 的DNA片段引物:(酶切位点分别是EcoRI和HindIII)
Forward-HPV45 L1-EcoRI:5’ ACTTCA GAATTC ATGGCTCTGTGGCGTCCGTCTG
Reverse-HPV45 L1-HindIII:5’ ATCTCA AAGCTTCTA TTTTTTAGAACGGATACGAAC
将含有EcoRI和HindIII酶切位点的L1基因片段以及载体pMAL进行EcoRI/HindIII双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pMAL进行连接反应,16 ℃ 10~15 h。
连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由上海生工生物公司进行测序,得到融合重组MBP-HPV45-L1蛋白质的基因序列SEQ NO.5,氨基酸序列为SEQ NO.10。
参照该实施例方法制备带有MBP标签的融合重组载体MBP-HPV-L1,其基因序列SEQNO.13。
实施例5:重组载体pET28a-6*His-HPV45 L1的构建
扩增HPV45 L1 的DNA片段引物:(酶切位点分别是NdeI和XhoI, pET28a)
Forward-HPV45 L1-NdeI:5’ GACTTCA CATATGATGGCTCTGTGGCGTCCGTCTG
Reverse-HPV45 L1-XhoI:5’ CATCTCACTCGAGCTA TTTTTTAGAACGGATACGAAC
将含有NdeI和XhoI酶切位点的L1基因片段以及载体pMAL进行NdeI/XhoI双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pET28a进行连接反应,16℃ 10~15 h。
连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由上海生工生物公司进行测序,得到融合重组6*His-HPV45-L1蛋白质的基因序列SEQ NO.6。
实施例6:重组载体6*His-SUMO-HPV45 L1 载体构建
扩增SUMO 的DNA片段引物:(酶切位点分别是NdeI和BamHI)
Forward -SUMO-NdeI: GGAATTCCATATGTCTGACCAGGAAGCTAAACCGTC
Reverse-SUMO-BamHI: CGC GGATCCACCGGTCTGTTCCTGGTAAAC
扩增HPV45 L1 的DNA片段引物:(酶切位点分别是BamHI和XhoI)
Forward-HPV45 L1-ApaI:5’ACTTCAGGATCC ATGGCTCTGTGGCGTCCGTCTG
Reverse-HPV45 L1-XhoI:5’ATCTCACTCGAGCTA TTTTTTAGAACGGATACGAAC
SUMO基因、L1基因PCR扩增条件、反应体系同上述实施例所述。
酶切连接:将含有NdeI和BamHI酶切位点的SUMO基因片段以及载体pET-28a进行NdeI/ BamHI双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pET28a进行连接反应,16 ℃ 10~15 h。
转化鉴定:连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由苏州金唯智生物科技有限公司进行测序,得到融合重组载体pETSUMO-28a。
再次酶切连接:将含有BamHI和Xho1酶切位点的L1基因片段以及重组载体pETSUMO-28a进行BamHI/Xho1双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pETSUMO-28a进行连接反应,16 ℃ 10~15 h。
再次转化鉴定:连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由上海生工生物公司进行测序,得到融合重组6*His-SUMO-HPV45-L1蛋白质的基因序列SEQ NO.7。
实施例7:重组HPV L1五聚体蛋白质的表达
将测序结果正确实施例2、3、4、5和6的重组载体转化大肠杆菌BL21宿主细胞,并作为表达重组蛋白质的工程菌进行HPV L1蛋白的表达。工程菌培养基为2YT培养基(10 g/L胰化蛋白胨;5 g/L酵母粉;10 g/L NaCl)。挑取含重组质粒的菌体单斑于10ml 2YT培养基(含100μg/ml氨苄青霉素)中,230转/分钟(rpm),37℃振荡培养过夜。转接5 ml过夜菌于500 ml(含100 μg/ml 氨苄青霉素)2YT液体培养基中,37℃震荡培养至重组工程菌生长至OD600nm≈0.4~1时,加入终浓度0.2mM的IPTG诱导,在28℃的条件下进行6h以上重组蛋白质的诱导表达。
细胞收集及破碎:对发酵培养物进行离心,弃上清,收获菌体沉淀,称重;使用buffer L(pH 8.0,50 mM Tris,200 mM NaCl,5mM DTT)洗涤沉淀,然后将其重悬于bufferL中进行超声波破碎,随后通过高速离心机对破菌液进行离心(16000 rpm,30 min,4℃),收集上清液。
实施例8:重组HPV L1五聚体蛋白在大肠杆菌中表达量的检测
采用ELISA夹心法检测亲和层析上样前Tag-HPV L1五聚体蛋白在大肠杆菌中表达量,样品及供试品:
包被抗体:自制抗HPV45 L1小鼠单抗。
对照品:自制高纯度的HPV45 L1蛋白。
供试品:用样品稀释液将供试品Tag-HPV45 L1稀释至浓度在对照品梯度稀释浓度范围内。
酶标抗体:自制的辣根过氧化物酶标记的兔抗HPV45 L1蛋白多抗。
结果计算:计算平行孔的平均值,以对照品系列浓度OD450吸收值对其相应的L1蛋白抗原作直线方程,平行样品孔间变异系数不得大于10%,直线回归方程R2不得小于0.980,将供试品的OD450吸收值代入方程计算出稀释后供试品L1蛋白抗原含量,再乘以相应的稀释倍数即为供试品中L1蛋白抗原含量,见表1。
表1 检测表达后Tag-HPV L1蛋白抗原含量
Figure 437252DEST_PATH_IMAGE001
实施例9:重组HPV L1五聚体蛋白质亲和层析
带GST标签重组蛋白的亲和层析:亲和柱中装入GST琼脂糖亲和层析介质5ml,以buffer L(pH 8.0,50 mM Tris,200 mM NaCl,5mM DTT)平衡层析柱,然后上样实施例8中带有GST或GST-SUMO标签的蛋白液,完毕后以Buffer L洗至无蛋白质流出,亲和完毕。以5mLBuffer L悬浮亲和介质,取样检测并计算介质中结合L1蛋白质的总量。
带MBP标签重组蛋白的亲和层析:亲和柱中装入Amylose-Resin亲和层析介质5ml,以buffer L(pH 8.0,50 mM Tris,200 mM NaCl,5mM DTT)平衡层析柱,然后上样实施例8中带有MBP标签的蛋白液,完毕后以Buffer L洗至无蛋白质流出,亲和完毕。以5mL Buffer L悬浮亲和介质,取样检测并计算介质中结合L1蛋白质的总量。
带6*HIS标签重组蛋白的亲和层析:取5ml Ni-NTA凝胶装柱,在柱上缓慢加入10倍柱体积的平衡液(50mmol/L NaH2PO4,300mmol/L NaCl,20mmol/L imidazole,用NaOH调整PH值至8),以充分平衡Ni-NTA凝胶,流速为1ml/min。取实施例8中过滤后的带有6*His或6*His-SUMO标签的上清液,完全进入凝胶后,用10倍柱体积的平衡液继续洗涤凝胶,保存流速为1ml/min。用平衡液洗脱至无蛋白质流出,亲和完毕。取样检测并计算介质中结合L1蛋白质的总量。
实施例10:重组Tag-HPV L1蛋白质的酶切纯化
按照目的蛋白质与蛋白酶质量比100:1加入酶量,其中带有GST-HPV-L1的蛋白质用3C蛋白酶切,带有GST-SUMO-HPV-L1和6*His-SUMO-HPV-L1 的蛋白质用SENP1蛋白酶切,带有Mbp-HPV-L1的蛋白质用Factor Xa蛋白酶切,带有6*His-HPV-L1的蛋白质用Thrombin蛋白酶切,分别混合酶切2h后,分别洗脱收集各个蛋白酶切后所得的HPV45 L1五聚体蛋白质溶液。
将3C酶酶切GST标签后的L1蛋白质溶液用SDS- PAGE凝胶电泳检测,结果见图1亲和层析电泳结果,实验表明,可将90%的目的蛋白切下。图2为SENP1蛋白酶切带有GST-SUMO-HPV-L1的蛋白质,用SDS- PAGE凝胶电泳检测。图3为Factor Xa蛋白酶切带有Mbp-HPV-L1的蛋白质,用SDS- PAGE凝胶电泳检测。图1-图3说明说明得到了55kDa 的HPV45 L1蛋白。
Thrombin蛋白酶没有切开6*His-HPV-L1的蛋白质;用SENP1酶切6*His-SUMO-L1的蛋白质溶液用SDS- PAGE凝胶电泳检测,结果见图4,显示SENP1蛋白酶能切开带有6*His-SUMO标签的溶合蛋白。
实施例11:重组HPV L1五聚体蛋白质的纯化
分子筛色谱纯化:将上一个实施例收集的酶切纯化后的HPV45 L1五聚体蛋白质分别进行纯化,可先经过离子交换色谱收集的HPV45 L1五聚体蛋白质,或不经过离子交换步骤直接用Superdex200(GE公司生产)的凝胶过滤介质进行进一步分子筛层析,分子筛流动相为pH8.0,10 mM Tris,100 mM NaCl,收集HPV45 L1五聚体蛋白质紫外吸收峰的馏分。
纯化后测定样品纯度:将收集的蛋白质溶液取样用SDS- PAGE凝胶电泳检测,目的蛋白质HPV45 L1五聚体经过分子筛层析纯化后最终纯度均大于98%,详见图5,经过分子筛色谱纯化后的重组HPV45 L1五聚体蛋白质SDS-PAGE凝胶电泳图。
测定样品蛋白浓度:用Bradford法进行蛋白浓度检测,使用标样2mg/ml BAS配制从100ug/µl稀释到500ug/µl,样品反应体系取10µl稀释的BSA+200µlBradford工作液:标准曲线为y = 0.0013 x - 0.0294 ,R² = 0.9986 ,测定样品的 OD595,代入标准曲线,计算样品的蛋白浓度,结果见表2。
表2 Bradford法检测重组HPV45 L1五聚体蛋白浓度
Figure 292076DEST_PATH_IMAGE002
注:样品组1为GST-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液;样品组2为GST-SUMO-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液;样品组3为Mbp-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液。
实施例12:重组HPV45 L1五聚体蛋白质组装成VLP
在置于如下盐浓度(NaCl)和pH值条件下,HPV L1五聚体溶液样品组1、2和3,放置稳定后,使用马尔文 Zetasizer NanoZS的动态光散射粒径仪,进行粒径及粒径分布测定(粒径分布系数PdI值为粒径分散度指标,小于0.05为高度均一的样品;0.05~0.1为准均一的样品,0.1~0.3为均一性较差的样品,大于0.3为不均一的样品),,HPV45 L1五聚体蛋白组装得到粒径均一的VLP(PdI<0.05)。
表3 不同pH和盐浓度条件下组装HPV45 L1 VLP的粒径检测
Figure 602971DEST_PATH_IMAGE003
注:样品组1为GST-HPV L1经分子筛纯化后得HPV L1 VLP蛋白溶液;样品组2为GST-SUMO-HPV L1经分子筛纯化后得HPV L1VLP蛋白溶液;样品组3为Mbp-HPV L1经分子筛纯化后得HPV L1VLP蛋白溶液。
实施例13:动态光散射(DLS)对L1五聚体和VLP蛋白质粒径测定
仪器为马尔文 Zetasizer NanoZS的动态光散射粒径仪,取各样品组最终制得的HPV45 L1五聚体和HPV45 L1 VLP蛋白质进行检测,测平均粒径和分散性指数PdI(表明蛋白质的均一性),说明各组样品最终制备的L1五聚体和VLP蛋白均一。其中样品组2最终制得的五聚体蛋白质和其组装获得的HPV45 L1 VLP蛋白质粒径分布详见附图6和7。
实施例14:HPV45 L1五聚体和VLP的制备
依据本发明上述实施例1-13所采用的技术,制备具有序列11,12,13的HPV45 L1蛋白,以上蛋白均可纯化得到纯度达到98%以上的蛋白,得到平均粒径10~15nm PdI<0.1的HPV45 L1五聚体蛋白。进一步组装得到平均粒径45~65nm PdI<0.1的HPV45 L1VLP蛋白。
实施例15:HPV45 L1 五聚体和VLP的形态学检测
透射电镜观察:将实施例中各个纯化获得的HPV45 L1五聚体蛋白质、组装获得的HPV45 L1-VLP蛋白质,通过中国科学院生物物理所利用透射电镜平台观察。冷冻样品制备及拍照流程:
1)将液氮盒装满液氮,待液面不沸腾时,将乙烷缓慢注入冷却的铜碗中,使之冷却为液态。
2)将铜网在PDC-32型等离子清洗器做亲水性处理。
3)在Vitrobot TM Mark IV冷冻样品制备设备中,将 3.5 μL 的五聚体及VLP样品吸附在 300目的 QUANTIFOIL 铜网中,吸水4s后,通过液态乙烷冷冻样品。
4)迅速将样品转移到液氮中保存。
5)收集冷冻照片时,电子剂量为 20 e-/Å2。数据通过300 KV 的 300 kV TitanKrios 透射电子显微镜的 Gatan µltraScan 4000 CCD记录。加速电压为300 kV。
结果显示,在HPV45 L1五聚体蛋白质样品组中,视野中可见大量直径与理论大小相符的10nm左右的五聚体蛋白;在HPV45 L1-VLP蛋白质样品组中,可见颗粒大小与理论相符的大量直径为50nm左右的病毒样颗粒(VLP),均匀一致。其中GST-SUMO标签组(样品组2)酶切纯化后HPV45 L1五聚体所得样品的透射电镜照片见附图8, Mbp标签组(样品组3)酶切纯化后再组装的VLP蛋白的透射电镜照片见附图9。
实施例16:HPV45 L1蛋白质原液纯度检测
分子排阻高效液相色谱测定:色谱柱Agilent Bio SEC-5um,2000Å,7.8×300mm,柱体积约15 m1,分子量范围≥l0,000kDa;以pH6.8 的0.1mol/L磷酸盐缓冲液(称取磷酸氢二钠25.8g,磷酸二氢钠4.37g,加超纯水使溶解,用磷酸调pH至6.8,超纯水定容成1000ml)为流动相;流速为1ml/min;检测波长280nm;柱温25℃,上样量不得小于20ug,样品主峰理论塔板数不低于1000,拖尾因子小于2.0,连续进样5针,峰面积的相对标准偏差不得大于3%。
取纯化后的样品2组最终制得的HPV45 L1五聚体和组装后的VLP的蛋白质原液,分别稀释浓度为1mg/ml,上样量20µl注入高压液相色谱仪,按照上述方法检测,按面积归一法计算纯度,所有处理蛋白质纯度均大于98%,结果见附图10和表4、附图11和表5。
表4 HPV45 L1五聚体的HPLC蛋白质纯度检测
Figure 690792DEST_PATH_IMAGE004
表5 HPV45 L1组装后VLP的HPLC蛋白质纯度检测
Figure 708427DEST_PATH_IMAGE005
实施例17:HPV VLP稳定性实验
将各个样品组最终制得的HPV45 VLP蛋白质在下表的缓冲液条件下,在25℃放置14天至28天,进行粒径检测,结果见下表,证明HPV45 VLP在pH 5.0至5.9,盐浓度500~2000mM下存放稳定。样品组3所得HPV45 VLP在pH 5.0至5.9,盐浓度500~2000mM下放置14-28天后检测结果详见如下表。
表6 HPV45 L1 VLP 在25℃下放置14-28天粒径检测结果
Figure 671835DEST_PATH_IMAGE006
实施例18:制备含有HPV L1 五聚体或VLP的单价疫苗
将含有各个样品组的HPV45 L1五聚体或VLP蛋白原液分别与氢氧化铝佐剂生理盐水溶液按照蛋白与铝含量1:10比例进行吸附配制即可制得重组HPV L1蛋白质五聚体或VLP疫苗,在4℃保存待用。
实施例19:HPV L1 五聚体和VLP的免疫原性测定
分别取上述L1五聚体或VLP疫苗,加入灭菌过的生理盐水分别稀释成20μg/ml浓度的五聚体或VLP蛋白疫苗,以每只0.1ml肌肉注射BALB/c小鼠,每组10只。小鼠每4周加强免疫一次,共免疫2次。加强免疫4周后,采用假病毒细胞中和实验法分别测定每次免疫后的小鼠血清中针对同型HPV的中和抗体滴度,结果如附图12、13所示。
结果表明,HPV L1五聚体和VLP蛋白疫苗接种小鼠,二次免疫后4周中和抗体即可达到很高的水平。实验结果证明,HPV L1五聚体和组装的VLP疫苗均可以在动物体内产生中和抗体,说明HPV L1五聚体和VLP蛋白质疫苗在人体临床试验中都具有免疫原性,即能预防HPV同型病毒引起的疾病。
SEQUENCE LISTING
<110> 北京康乐卫士生物技术股份有限公司
<120> 45型重组人乳头瘤病毒病毒样颗粒及其制备方法
<130> 2015
<160> 13
<170> PatentIn version 3.3
<210> 1
<211> 1533
<212> DNA
<213> 人工序列
<400> 1
atggctttgt ggcggcctag tgacagtacg gtatatcttc caccaccttc tgtggccaga 60
gttgtcaaca ctgatgatta tgtgtctcgc acaagcatat tttatcatgc aggcagttcc 120
cgattattaa ctgtaggcaa tccatatttt agggttgtac ctaatggtgc aggtaataaa 180
caggctgttc ctaaggtatc cgcatatcag tatagggtgt ttagagtagc tttacccgat 240
cctaataaat ttggattacc tgattctact atatataatc ctgaaacaca acgtttggtt 300
tgggcatgtg taggtatgga aattggtcgt gggcagcctt taggtattgg cctaagtggc 360
catccatttt ataataaatt ggatgataca gaaagtgctc atgcagctac agctgttatt 420
acgcaggatg ttagggataa tgtgtcagtt gattataagc aaacacagct gtgtatttta 480
ggttgtgtac ctgctattgg tgagcactgg gccaagggca cactttgtaa acctgcacaa 540
ttgcaacctg gtgactgtcc tcctttggaa cttaaaaaca ccattattga ggatggtgat 600
atggtggata caggttatgg ggcaatggat tttagtacat tgcaggatac aaagtgcgag 660
gttccattag acatttgtca atccatctgt aaatatccag attatttgca aatgtctgct 720
gatccctatg gggattctat gtttttttgc ctacgccgtg aacaactgtt tgcaagacat 780
ttttggaata gggcaggtgt tatgggggac acagtaccta cggacctata tattaaaggc 840
actagcgcta atatgcgtga aacccctggc agttgtgtgt attccccttc tcccagtggc 900
tctattatta cttctgattc tcaattattt aataagccat attggttaca taaggcccag 960
ggccataaca atggtatttg ttggcataat cagttgtttg ttactgtagt ggacactacc 1020
cgcagtacta atttaacatt atgtgcctct acacaaaatc ctgtgccaag tacatatgac 1080
cctactaagt ttaagcagta tagtagacat gtggaggaat atgatttaca gtttattttt 1140
cagttgtgca ctattacttt aactgcagag gttatgtcat atatccatag tatgaatagt 1200
agtatattag aaaattggaa ttttggtgtc cctccaccac ctactacaag tttagtggat 1260
acatatcgtt ttgtgcaatc agttgctgtt acctgtcaaa aggatactac acctccggaa 1320
aagcaggatc catatgataa attaaagttt tggactgttg acctaaagga aaaattttcc 1380
tccgatttgg atcaatatcc ccttggtcga aagtttttag ttcaggctgg gttacgtcgt 1440
aggcctacca taggacctcg taagcgtcct gctgcttcca cgtctactgc atctaggcct 1500
gccaaacgtg tacgtatacg tagtaagaaa taa 1533
<210> 2
<211> 1533
<212> DNA
<213> 人工序列
<400> 2
atggctctgt ggcgtccgtc tgactcgacc gtatacctgc ccccgccgtc tgttgctcgt 60
gttgttaaca ccgacgacta cgtttctcgt acctctatct tctaccacgc tggttcttct 120
cgtctgctga ccgttggtaa cccgtacttc cgtgttgttc cgaacggtgc tggtaacaaa 180
caggctgttc cgaaagtttc tgcttaccag taccgtgttt tccgtgttgc tctgccggac 240
ccgaacaaat tcggtctgcc ggactctacc atctacaacc cggaaaccca acgtctggtc 300
tgggcgtgcg ttggtatgga aatcggtcgt ggtcagccgc tgggtatcgg tctgtctggt 360
cacccgttct acaacaaact ggacgacacc gaatctgctc acgctgctac cgctgttatc 420
acccaggacg tacgtgacaa cgtaagcgtt gactacaaac agacccagct gtgcatcctg 480
ggttgcgttc cggctatcgg tgaacactgg gctaaaggta ccctgtgcaa accggctcag 540
ctgcagccgg gtgactgccc gccgctggaa ctgaaaaaca ccatcatcga agacggtgac 600
atggttgaca ccggttacgg tgctatggac ttctctaccc tgcaggacac caaatgcgaa 660
gttccgctgg acatctgcca gtctatctgc aaatacccgg actacctgca gatgtctgct 720
gacccgtacg gtgactctat gttcttctgc ctgcgtcgtg aacagctgtt cgctcgtcac 780
ttctggaacc gtgctggtgt tatgggtgac accgttccga ccgacctgta catcaaaggt 840
acctctgcta acatgcgtga aaccccgggt tcttgcgttt actctccgtc tccgtctggt 900
tctatcatca cctctgactc tcagctgttc aacaaaccgt actggctgca caaagctcag 960
ggtcacaaca acggtatctg ctggcacaac cagctgttcg ttaccgttgt tgacaccacc 1020
cgttctacca acctgaccct gtgcgcttct acccagaacc cggttccgtc tacctacgac 1080
ccgaccaaat tcaaacagta ctctcgtcac gttgaagaat acgacctgca gttcatcttc 1140
cagctgtgca ccatcaccct gaccgctgaa gttatgtctt acatccactc tatgaactct 1200
tctatcctgg aaaactggaa cttcggtgtt ccgccgccgc cgaccacctc tctggttgac 1260
acttacaggt tcgttcagtc tgttgctgtt acctgccaga aagacaccac cccgccggaa 1320
aaacaggacc cgtacgacaa actgaaattc tggaccgttg acctgaaaga aaaattctct 1380
tctgacctgg accagtaccc gctgggtcgt aaattcctgg ttcaggctgg tctgcgtcgt 1440
cgtccgacca tcggtccgcg taaacgtccg gctgcttcta cctctaccgc ttctcgtccg 1500
gctaaacgtg ttcgtatccg ttctaaaaaa tag 1533
<210> 3
<211> 2226
<212> DNA
<213> 人工序列
<400> 3
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggaagttc tgttccaggg gcccctggga tccatggctc tgtggcgtcc gtctgactcg 720
accgtatacc tgcccccgcc gtctgttgct cgtgttgtta acaccgacga ctacgtttct 780
cgtacctcta tcttctacca cgctggttct tctcgtctgc tgaccgttgg taacccgtac 840
ttccgtgttg ttccgaacgg tgctggtaac aaacaggctg ttccgaaagt ttctgcttac 900
cagtaccgtg ttttccgtgt tgctctgccg gacccgaaca aattcggtct gccggactct 960
accatctaca acccggaaac ccaacgtctg gtctgggcgt gcgttggtat ggaaatcggt 1020
cgtggtcagc cgctgggtat cggtctgtct ggtcacccgt tctacaacaa actggacgac 1080
accgaatctg ctcacgctgc taccgctgtt atcacccagg acgtacgtga caacgtaagc 1140
gttgactaca aacagaccca gctgtgcatc ctgggttgcg ttccggctat cggtgaacac 1200
tgggctaaag gtaccctgtg caaaccggct cagctgcagc cgggtgactg cccgccgctg 1260
gaactgaaaa acaccatcat cgaagacggt gacatggttg acaccggtta cggtgctatg 1320
gacttctcta ccctgcagga caccaaatgc gaagttccgc tggacatctg ccagtctatc 1380
tgcaaatacc cggactacct gcagatgtct gctgacccgt acggtgactc tatgttcttc 1440
tgcctgcgtc gtgaacagct gttcgctcgt cacttctgga accgtgctgg tgttatgggt 1500
gacaccgttc cgaccgacct gtacatcaaa ggtacctctg ctaacatgcg tgaaaccccg 1560
ggttcttgcg tttactctcc gtctccgtct ggttctatca tcacctctga ctctcagctg 1620
ttcaacaaac cgtactggct gcacaaagct cagggtcaca acaacggtat ctgctggcac 1680
aaccagctgt tcgttaccgt tgttgacacc acccgttcta ccaacctgac cctgtgcgct 1740
tctacccaga acccggttcc gtctacctac gacccgacca aattcaaaca gtactctcgt 1800
cacgttgaag aatacgacct gcagttcatc ttccagctgt gcaccatcac cctgaccgct 1860
gaagttatgt cttacatcca ctctatgaac tcttctatcc tggaaaactg gaacttcggt 1920
gttccgccgc cgccgaccac ctctctggtt gacacttaca ggttcgttca gtctgttgct 1980
gttacctgcc agaaagacac caccccgccg gaaaaacagg acccgtacga caaactgaaa 2040
ttctggaccg ttgacctgaa agaaaaattc tcttctgacc tggaccagta cccgctgggt 2100
cgtaaattcc tggttcaggc tggtctgcgt cgtcgtccga ccatcggtcc gcgtaaacgt 2160
ccggctgctt ctacctctac cgcttctcgt ccggctaaac gtgttcgtat ccgttctaaa 2220
aaatag 2226
<210> 4
<211> 2508
<212> DNA
<213> 人工序列
<400> 4
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggaagttc tgttccaggg gccctctgac caggaagcta aaccgtctac cgaagacctg 720
ggtgacaaaa aagaaggtga atacatcaaa ctgaaagtta tcggtcagga ctcttctgaa 780
atccacttca aagttaaaat gaccacccac ctgaaaaaac tgaaagaatc ttactgccag 840
cgtcagggtg ttccgatgaa ctctctgcgt ttcctgttcg aaggtcagcg tatcgctgac 900
aaccacaccc cgaaagaact gggtatggaa gaagaagacg ttatcgaagt ttaccaggaa 960
cagaccggtg gatccatggc tctgtggcgt ccgtctgact cgaccgtata cctgcccccg 1020
ccgtctgttg ctcgtgttgt taacaccgac gactacgttt ctcgtacctc tatcttctac 1080
cacgctggtt cttctcgtct gctgaccgtt ggtaacccgt acttccgtgt tgttccgaac 1140
ggtgctggta acaaacaggc tgttccgaaa gtttctgctt accagtaccg tgttttccgt 1200
gttgctctgc cggacccgaa caaattcggt ctgccggact ctaccatcta caacccggaa 1260
acccaacgtc tggtctgggc gtgcgttggt atggaaatcg gtcgtggtca gccgctgggt 1320
atcggtctgt ctggtcaccc gttctacaac aaactggacg acaccgaatc tgctcacgct 1380
gctaccgctg ttatcaccca ggacgtacgt gacaacgtaa gcgttgacta caaacagacc 1440
cagctgtgca tcctgggttg cgttccggct atcggtgaac actgggctaa aggtaccctg 1500
tgcaaaccgg ctcagctgca gccgggtgac tgcccgccgc tggaactgaa aaacaccatc 1560
atcgaagacg gtgacatggt tgacaccggt tacggtgcta tggacttctc taccctgcag 1620
gacaccaaat gcgaagttcc gctggacatc tgccagtcta tctgcaaata cccggactac 1680
ctgcagatgt ctgctgaccc gtacggtgac tctatgttct tctgcctgcg tcgtgaacag 1740
ctgttcgctc gtcacttctg gaaccgtgct ggtgttatgg gtgacaccgt tccgaccgac 1800
ctgtacatca aaggtacctc tgctaacatg cgtgaaaccc cgggttcttg cgtttactct 1860
ccgtctccgt ctggttctat catcacctct gactctcagc tgttcaacaa accgtactgg 1920
ctgcacaaag ctcagggtca caacaacggt atctgctggc acaaccagct gttcgttacc 1980
gttgttgaca ccacccgttc taccaacctg accctgtgcg cttctaccca gaacccggtt 2040
ccgtctacct acgacccgac caaattcaaa cagtactctc gtcacgttga agaatacgac 2100
ctgcagttca tcttccagct gtgcaccatc accctgaccg ctgaagttat gtcttacatc 2160
cactctatga actcttctat cctggaaaac tggaacttcg gtgttccgcc gccgccgacc 2220
acctctctgg ttgacactta caggttcgtt cagtctgttg ctgttacctg ccagaaagac 2280
accaccccgc cggaaaaaca ggacccgtac gacaaactga aattctggac cgttgacctg 2340
aaagaaaaat tctcttctga cctggaccag tacccgctgg gtcgtaaatt cctggttcag 2400
gctggtctgc gtcgtcgtcc gaccatcggt ccgcgtaaac gtccggctgc ttctacctct 2460
accgcttctc gtccggctaa acgtgttcgt atccgttcta aaaaatag 2508
<210> 5
<211> 2706
<212> DNA
<213> 人工序列
<400> 5
atgaaaatcg aagaaggtaa actggtaatc tggattaacg gcgataaagg ctataacggt 60
ctcgctgaag tcggtaagaa attcgagaaa gataccggaa ttaaagtcac cgttgagcat 120
ccggataaac tggaagagaa attcccacag gttgcggcaa ctggcgatgg ccctgacatt 180
atcttctggg cacacgaccg ctttggtggc tacgctcaat ctggcctgtt ggctgaaatc 240
accccggaca aagcgttcca ggacaagctg tatccgttta cctgggatgc cgtacgttac 300
aacggcaagc tgattgctta cccgatcgct gttgaagcgt tatcgctgat ttataacaaa 360
gatctgctgc cgaacccgcc aaaaacctgg gaagagatcc cggcgctgga taaagaactg 420
aaagcgaaag gtaagagcgc gctgatgttc aacctgcaag aaccgtactt cacctggccg 480
ctgattgctg ctgacggggg ttatgcgttc aagtatgaaa acggcaagta cgacattaaa 540
gacgtgggcg tggataacgc tggcgcgaaa gcgggtctga ccttcctggt tgacctgatt 600
aaaaacaaac acatgaatgc agacaccgat tactccatcg cagaagctgc ctttaataaa 660
ggcgaaacag cgatgaccat caacggcccg tgggcatggt ccaacatcga caccagcaaa 720
gtgaattatg gtgtaacggt actgccgacc ttcaagggtc aaccatccaa accgttcgtt 780
ggcgtgctga gcgcaggtat taacgccgcc agtccgaaca aagagctggc aaaagagttc 840
ctcgaaaact atctgctgac tgatgaaggt ctggaagcgg ttaataaaga caaaccgctg 900
ggtgccgtag cgctgaagtc ttacgaggaa gagttggcga aagatccacg tattgccgcc 960
actatggaaa acgcccagaa aggtgaaatc atgccgaaca tcccgcagat gtccgctttc 1020
tggtatgccg tgcgtactgc ggtgatcaac gccgccagcg gtcgtcagac tgtcgatgaa 1080
gccctgaaag acgcgcagac taattcgagc tcgaacaaca acaacaataa caataacaac 1140
aacctcggga tcgagggaag gatttcagaa ttcatggctc tgtggcgtcc gtctgactcg 1200
accgtatacc tgcccccgcc gtctgttgct cgtgttgtta acaccgacga ctacgtttct 1260
cgtacctcta tcttctacca cgctggttct tctcgtctgc tgaccgttgg taacccgtac 1320
ttccgtgttg ttccgaacgg tgctggtaac aaacaggctg ttccgaaagt ttctgcttac 1380
cagtaccgtg ttttccgtgt tgctctgccg gacccgaaca aattcggtct gccggactct 1440
accatctaca acccggaaac ccaacgtctg gtctgggcgt gcgttggtat ggaaatcggt 1500
cgtggtcagc cgctgggtat cggtctgtct ggtcacccgt tctacaacaa actggacgac 1560
accgaatctg ctcacgctgc taccgctgtt atcacccagg acgtacgtga caacgtaagc 1620
gttgactaca aacagaccca gctgtgcatc ctgggttgcg ttccggctat cggtgaacac 1680
tgggctaaag gtaccctgtg caaaccggct cagctgcagc cgggtgactg cccgccgctg 1740
gaactgaaaa acaccatcat cgaagacggt gacatggttg acaccggtta cggtgctatg 1800
gacttctcta ccctgcagga caccaaatgc gaagttccgc tggacatctg ccagtctatc 1860
tgcaaatacc cggactacct gcagatgtct gctgacccgt acggtgactc tatgttcttc 1920
tgcctgcgtc gtgaacagct gttcgctcgt cacttctgga accgtgctgg tgttatgggt 1980
gacaccgttc cgaccgacct gtacatcaaa ggtacctctg ctaacatgcg tgaaaccccg 2040
ggttcttgcg tttactctcc gtctccgtct ggttctatca tcacctctga ctctcagctg 2100
ttcaacaaac cgtactggct gcacaaagct cagggtcaca acaacggtat ctgctggcac 2160
aaccagctgt tcgttaccgt tgttgacacc acccgttcta ccaacctgac cctgtgcgct 2220
tctacccaga acccggttcc gtctacctac gacccgacca aattcaaaca gtactctcgt 2280
cacgttgaag aatacgacct gcagttcatc ttccagctgt gcaccatcac cctgaccgct 2340
gaagttatgt cttacatcca ctctatgaac tcttctatcc tggaaaactg gaacttcggt 2400
gttccgccgc cgccgaccac ctctctggtt gacacttaca ggttcgttca gtctgttgct 2460
gttacctgcc agaaagacac caccccgccg gaaaaacagg acccgtacga caaactgaaa 2520
ttctggaccg ttgacctgaa agaaaaattc tcttctgacc tggaccagta cccgctgggt 2580
cgtaaattcc tggttcaggc tggtctgcgt cgtcgtccga ccatcggtcc gcgtaaacgt 2640
ccggctgctt ctacctctac cgcttctcgt ccggctaaac gtgttcgtat ccgttctaaa 2700
aaatag 2706
<210> 6
<211> 1596
<212> DNA
<213> 人工序列
<400> 6
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atgatggctc tgtggcgtcc gtctgactcg accgtatacc tgcccccgcc gtctgttgct 120
cgtgttgtta acaccgacga ctacgtttct cgtacctcta tcttctacca cgctggttct 180
tctcgtctgc tgaccgttgg taacccgtac ttccgtgttg ttccgaacgg tgctggtaac 240
aaacaggctg ttccgaaagt ttctgcttac cagtaccgtg ttttccgtgt tgctctgccg 300
gacccgaaca aattcggtct gccggactct accatctaca acccggaaac ccaacgtctg 360
gtctgggcgt gcgttggtat ggaaatcggt cgtggtcagc cgctgggtat cggtctgtct 420
ggtcacccgt tctacaacaa actggacgac accgaatctg ctcacgctgc taccgctgtt 480
atcacccagg acgtacgtga caacgtaagc gttgactaca aacagaccca gctgtgcatc 540
ctgggttgcg ttccggctat cggtgaacac tgggctaaag gtaccctgtg caaaccggct 600
cagctgcagc cgggtgactg cccgccgctg gaactgaaaa acaccatcat cgaagacggt 660
gacatggttg acaccggtta cggtgctatg gacttctcta ccctgcagga caccaaatgc 720
gaagttccgc tggacatctg ccagtctatc tgcaaatacc cggactacct gcagatgtct 780
gctgacccgt acggtgactc tatgttcttc tgcctgcgtc gtgaacagct gttcgctcgt 840
cacttctgga accgtgctgg tgttatgggt gacaccgttc cgaccgacct gtacatcaaa 900
ggtacctctg ctaacatgcg tgaaaccccg ggttcttgcg tttactctcc gtctccgtct 960
ggttctatca tcacctctga ctctcagctg ttcaacaaac cgtactggct gcacaaagct 1020
cagggtcaca acaacggtat ctgctggcac aaccagctgt tcgttaccgt tgttgacacc 1080
acccgttcta ccaacctgac cctgtgcgct tctacccaga acccggttcc gtctacctac 1140
gacccgacca aattcaaaca gtactctcgt cacgttgaag aatacgacct gcagttcatc 1200
ttccagctgt gcaccatcac cctgaccgct gaagttatgt cttacatcca ctctatgaac 1260
tcttctatcc tggaaaactg gaacttcggt gttccgccgc cgccgaccac ctctctggtt 1320
gacacttaca ggttcgttca gtctgttgct gttacctgcc agaaagacac caccccgccg 1380
gaaaaacagg acccgtacga caaactgaaa ttctggaccg ttgacctgaa agaaaaattc 1440
tcttctgacc tggaccagta cccgctgggt cgtaaattcc tggttcaggc tggtctgcgt 1500
cgtcgtccga ccatcggtcc gcgtaaacgt ccggctgctt ctacctctac cgcttctcgt 1560
ccggctaaac gtgttcgtat ccgttctaaa aaatag 1596
<210> 7
<211> 1887
<212> DNA
<213> 人工序列
<400> 7
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atgtctgacc aggaagctaa accgtctacc gaagacctgg gtgacaaaaa agaaggtgaa 120
tacatcaaac tgaaagttat cggtcaggac tcttctgaaa tccacttcaa agttaaaatg 180
accacccacc tgaaaaaact gaaagaatct tactgccagc gtcagggtgt tccgatgaac 240
tctctgcgtt tcctgttcga aggtcagcgt atcgctgaca accacacccc gaaagaactg 300
ggtatggaag aagaagacgt tatcgaagtt taccaggaac agaccggtgg atccatggct 360
ctgtggcgtc cgtctgactc gaccgtatac ctgcccccgc cgtctgttgc tcgtgttgtt 420
aacaccgacg actacgtttc tcgtacctct atcttctacc acgctggttc ttctcgtctg 480
ctgaccgttg gtaacccgta cttccgtgtt gttccgaacg gtgctggtaa caaacaggct 540
gttccgaaag tttctgctta ccagtaccgt gttttccgtg ttgctctgcc ggacccgaac 600
aaattcggtc tgccggactc taccatctac aacccggaaa cccaacgtct ggtctgggcg 660
tgcgttggta tggaaatcgg tcgtggtcag ccgctgggta tcggtctgtc tggtcacccg 720
ttctacaaca aactggacga caccgaatct gctcacgctg ctaccgctgt tatcacccag 780
gacgtacgtg acaacgtaag cgttgactac aaacagaccc agctgtgcat cctgggttgc 840
gttccggcta tcggtgaaca ctgggctaaa ggtaccctgt gcaaaccggc tcagctgcag 900
ccgggtgact gcccgccgct ggaactgaaa aacaccatca tcgaagacgg tgacatggtt 960
gacaccggtt acggtgctat ggacttctct accctgcagg acaccaaatg cgaagttccg 1020
ctggacatct gccagtctat ctgcaaatac ccggactacc tgcagatgtc tgctgacccg 1080
tacggtgact ctatgttctt ctgcctgcgt cgtgaacagc tgttcgctcg tcacttctgg 1140
aaccgtgctg gtgttatggg tgacaccgtt ccgaccgacc tgtacatcaa aggtacctct 1200
gctaacatgc gtgaaacccc gggttcttgc gtttactctc cgtctccgtc tggttctatc 1260
atcacctctg actctcagct gttcaacaaa ccgtactggc tgcacaaagc tcagggtcac 1320
aacaacggta tctgctggca caaccagctg ttcgttaccg ttgttgacac cacccgttct 1380
accaacctga ccctgtgcgc ttctacccag aacccggttc cgtctaccta cgacccgacc 1440
aaattcaaac agtactctcg tcacgttgaa gaatacgacc tgcagttcat cttccagctg 1500
tgcaccatca ccctgaccgc tgaagttatg tcttacatcc actctatgaa ctcttctatc 1560
ctggaaaact ggaacttcgg tgttccgccg ccgccgacca cctctctggt tgacacttac 1620
aggttcgttc agtctgttgc tgttacctgc cagaaagaca ccaccccgcc ggaaaaacag 1680
gacccgtacg acaaactgaa attctggacc gttgacctga aagaaaaatt ctcttctgac 1740
ctggaccagt acccgctggg tcgtaaattc ctggttcagg ctggtctgcg tcgtcgtccg 1800
accatcggtc cgcgtaaacg tccggctgct tctacctcta ccgcttctcg tccggctaaa 1860
cgtgttcgta tccgttctaa aaaatag 1887
<210> 8
<211> 741
<212> PRT
<213> 人工序列
<400> 8
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Glu Val Leu
210 215 220
Phe Gln Gly Pro Leu Gly Ser Met Ala Leu Trp Arg Pro Ser Asp Ser
225 230 235 240
Thr Val Tyr Leu Pro Pro Pro Ser Val Ala Arg Val Val Asn Thr Asp
245 250 255
Asp Tyr Val Ser Arg Thr Ser Ile Phe Tyr His Ala Gly Ser Ser Arg
260 265 270
Leu Leu Thr Val Gly Asn Pro Tyr Phe Arg Val Val Pro Asn Gly Ala
275 280 285
Gly Asn Lys Gln Ala Val Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val
290 295 300
Phe Arg Val Ala Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Ser
305 310 315 320
Thr Ile Tyr Asn Pro Glu Thr Gln Arg Leu Val Trp Ala Cys Val Gly
325 330 335
Met Glu Ile Gly Arg Gly Gln Pro Leu Gly Ile Gly Leu Ser Gly His
340 345 350
Pro Phe Tyr Asn Lys Leu Asp Asp Thr Glu Ser Ala His Ala Ala Thr
355 360 365
Ala Val Ile Thr Gln Asp Val Arg Asp Asn Val Ser Val Asp Tyr Lys
370 375 380
Gln Thr Gln Leu Cys Ile Leu Gly Cys Val Pro Ala Ile Gly Glu His
385 390 395 400
Trp Ala Lys Gly Thr Leu Cys Lys Pro Ala Gln Leu Gln Pro Gly Asp
405 410 415
Cys Pro Pro Leu Glu Leu Lys Asn Thr Ile Ile Glu Asp Gly Asp Met
420 425 430
Val Asp Thr Gly Tyr Gly Ala Met Asp Phe Ser Thr Leu Gln Asp Thr
435 440 445
Lys Cys Glu Val Pro Leu Asp Ile Cys Gln Ser Ile Cys Lys Tyr Pro
450 455 460
Asp Tyr Leu Gln Met Ser Ala Asp Pro Tyr Gly Asp Ser Met Phe Phe
465 470 475 480
Cys Leu Arg Arg Glu Gln Leu Phe Ala Arg His Phe Trp Asn Arg Ala
485 490 495
Gly Val Met Gly Asp Thr Val Pro Thr Asp Leu Tyr Ile Lys Gly Thr
500 505 510
Ser Ala Asn Met Arg Glu Thr Pro Gly Ser Cys Val Tyr Ser Pro Ser
515 520 525
Pro Ser Gly Ser Ile Ile Thr Ser Asp Ser Gln Leu Phe Asn Lys Pro
530 535 540
Tyr Trp Leu His Lys Ala Gln Gly His Asn Asn Gly Ile Cys Trp His
545 550 555 560
Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Leu
565 570 575
Thr Leu Cys Ala Ser Thr Gln Asn Pro Val Pro Ser Thr Tyr Asp Pro
580 585 590
Thr Lys Phe Lys Gln Tyr Ser Arg His Val Glu Glu Tyr Asp Leu Gln
595 600 605
Phe Ile Phe Gln Leu Cys Thr Ile Thr Leu Thr Ala Glu Val Met Ser
610 615 620
Tyr Ile His Ser Met Asn Ser Ser Ile Leu Glu Asn Trp Asn Phe Gly
625 630 635 640
Val Pro Pro Pro Pro Thr Thr Ser Leu Val Asp Thr Tyr Arg Phe Val
645 650 655
Gln Ser Val Ala Val Thr Cys Gln Lys Asp Thr Thr Pro Pro Glu Lys
660 665 670
Gln Asp Pro Tyr Asp Lys Leu Lys Phe Trp Thr Val Asp Leu Lys Glu
675 680 685
Lys Phe Ser Ser Asp Leu Asp Gln Tyr Pro Leu Gly Arg Lys Phe Leu
690 695 700
Val Gln Ala Gly Leu Arg Arg Arg Pro Thr Ile Gly Pro Arg Lys Arg
705 710 715 720
Pro Ala Ala Ser Thr Ser Thr Ala Ser Arg Pro Ala Lys Arg Val Arg
725 730 735
Ile Arg Ser Lys Lys
740
<210> 9
<211> 835
<212> PRT
<213> 人工序列
<400> 9
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Glu Val Leu
210 215 220
Phe Gln Gly Pro Ser Asp Gln Glu Ala Lys Pro Ser Thr Glu Asp Leu
225 230 235 240
Gly Asp Lys Lys Glu Gly Glu Tyr Ile Lys Leu Lys Val Ile Gly Gln
245 250 255
Asp Ser Ser Glu Ile His Phe Lys Val Lys Met Thr Thr His Leu Lys
260 265 270
Lys Leu Lys Glu Ser Tyr Cys Gln Arg Gln Gly Val Pro Met Asn Ser
275 280 285
Leu Arg Phe Leu Phe Glu Gly Gln Arg Ile Ala Asp Asn His Thr Pro
290 295 300
Lys Glu Leu Gly Met Glu Glu Glu Asp Val Ile Glu Val Tyr Gln Glu
305 310 315 320
Gln Thr Gly Gly Ser Met Ala Leu Trp Arg Pro Ser Asp Ser Thr Val
325 330 335
Tyr Leu Pro Pro Pro Ser Val Ala Arg Val Val Asn Thr Asp Asp Tyr
340 345 350
Val Ser Arg Thr Ser Ile Phe Tyr His Ala Gly Ser Ser Arg Leu Leu
355 360 365
Thr Val Gly Asn Pro Tyr Phe Arg Val Val Pro Asn Gly Ala Gly Asn
370 375 380
Lys Gln Ala Val Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val Phe Arg
385 390 395 400
Val Ala Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Ser Thr Ile
405 410 415
Tyr Asn Pro Glu Thr Gln Arg Leu Val Trp Ala Cys Val Gly Met Glu
420 425 430
Ile Gly Arg Gly Gln Pro Leu Gly Ile Gly Leu Ser Gly His Pro Phe
435 440 445
Tyr Asn Lys Leu Asp Asp Thr Glu Ser Ala His Ala Ala Thr Ala Val
450 455 460
Ile Thr Gln Asp Val Arg Asp Asn Val Ser Val Asp Tyr Lys Gln Thr
465 470 475 480
Gln Leu Cys Ile Leu Gly Cys Val Pro Ala Ile Gly Glu His Trp Ala
485 490 495
Lys Gly Thr Leu Cys Lys Pro Ala Gln Leu Gln Pro Gly Asp Cys Pro
500 505 510
Pro Leu Glu Leu Lys Asn Thr Ile Ile Glu Asp Gly Asp Met Val Asp
515 520 525
Thr Gly Tyr Gly Ala Met Asp Phe Ser Thr Leu Gln Asp Thr Lys Cys
530 535 540
Glu Val Pro Leu Asp Ile Cys Gln Ser Ile Cys Lys Tyr Pro Asp Tyr
545 550 555 560
Leu Gln Met Ser Ala Asp Pro Tyr Gly Asp Ser Met Phe Phe Cys Leu
565 570 575
Arg Arg Glu Gln Leu Phe Ala Arg His Phe Trp Asn Arg Ala Gly Val
580 585 590
Met Gly Asp Thr Val Pro Thr Asp Leu Tyr Ile Lys Gly Thr Ser Ala
595 600 605
Asn Met Arg Glu Thr Pro Gly Ser Cys Val Tyr Ser Pro Ser Pro Ser
610 615 620
Gly Ser Ile Ile Thr Ser Asp Ser Gln Leu Phe Asn Lys Pro Tyr Trp
625 630 635 640
Leu His Lys Ala Gln Gly His Asn Asn Gly Ile Cys Trp His Asn Gln
645 650 655
Leu Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Leu Thr Leu
660 665 670
Cys Ala Ser Thr Gln Asn Pro Val Pro Ser Thr Tyr Asp Pro Thr Lys
675 680 685
Phe Lys Gln Tyr Ser Arg His Val Glu Glu Tyr Asp Leu Gln Phe Ile
690 695 700
Phe Gln Leu Cys Thr Ile Thr Leu Thr Ala Glu Val Met Ser Tyr Ile
705 710 715 720
His Ser Met Asn Ser Ser Ile Leu Glu Asn Trp Asn Phe Gly Val Pro
725 730 735
Pro Pro Pro Thr Thr Ser Leu Val Asp Thr Tyr Arg Phe Val Gln Ser
740 745 750
Val Ala Val Thr Cys Gln Lys Asp Thr Thr Pro Pro Glu Lys Gln Asp
755 760 765
Pro Tyr Asp Lys Leu Lys Phe Trp Thr Val Asp Leu Lys Glu Lys Phe
770 775 780
Ser Ser Asp Leu Asp Gln Tyr Pro Leu Gly Arg Lys Phe Leu Val Gln
785 790 795 800
Ala Gly Leu Arg Arg Arg Pro Thr Ile Gly Pro Arg Lys Arg Pro Ala
805 810 815
Ala Ser Thr Ser Thr Ala Ser Arg Pro Ala Lys Arg Val Arg Ile Arg
820 825 830
Ser Lys Lys
835
<210> 10
<211> 901
<212> PRT
<213> 人工序列
<400> 10
Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys
1 5 10 15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr
20 25 30
Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe
35 40 45
Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala
50 55 60
His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile
65 70 75 80
Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp
85 90 95
Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu
100 105 110
Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys
115 120 125
Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly
130 135 140
Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro
145 150 155 160
Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys
165 170 175
Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly
180 185 190
Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp
195 200 205
Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala
210 215 220
Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys
225 230 235 240
Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser
245 250 255
Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro
260 265 270
Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp
275 280 285
Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala
290 295 300
Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala
305 310 315 320
Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln
325 330 335
Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala
340 345 350
Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Asn
355 360 365
Ser Ser Ser Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Leu Gly Ile
370 375 380
Glu Gly Arg Ile Ser Glu Phe Met Ala Leu Trp Arg Pro Ser Asp Ser
385 390 395 400
Thr Val Tyr Leu Pro Pro Pro Ser Val Ala Arg Val Val Asn Thr Asp
405 410 415
Asp Tyr Val Ser Arg Thr Ser Ile Phe Tyr His Ala Gly Ser Ser Arg
420 425 430
Leu Leu Thr Val Gly Asn Pro Tyr Phe Arg Val Val Pro Asn Gly Ala
435 440 445
Gly Asn Lys Gln Ala Val Pro Lys Val Ser Ala Tyr Gln Tyr Arg Val
450 455 460
Phe Arg Val Ala Leu Pro Asp Pro Asn Lys Phe Gly Leu Pro Asp Ser
465 470 475 480
Thr Ile Tyr Asn Pro Glu Thr Gln Arg Leu Val Trp Ala Cys Val Gly
485 490 495
Met Glu Ile Gly Arg Gly Gln Pro Leu Gly Ile Gly Leu Ser Gly His
500 505 510
Pro Phe Tyr Asn Lys Leu Asp Asp Thr Glu Ser Ala His Ala Ala Thr
515 520 525
Ala Val Ile Thr Gln Asp Val Arg Asp Asn Val Ser Val Asp Tyr Lys
530 535 540
Gln Thr Gln Leu Cys Ile Leu Gly Cys Val Pro Ala Ile Gly Glu His
545 550 555 560
Trp Ala Lys Gly Thr Leu Cys Lys Pro Ala Gln Leu Gln Pro Gly Asp
565 570 575
Cys Pro Pro Leu Glu Leu Lys Asn Thr Ile Ile Glu Asp Gly Asp Met
580 585 590
Val Asp Thr Gly Tyr Gly Ala Met Asp Phe Ser Thr Leu Gln Asp Thr
595 600 605
Lys Cys Glu Val Pro Leu Asp Ile Cys Gln Ser Ile Cys Lys Tyr Pro
610 615 620
Asp Tyr Leu Gln Met Ser Ala Asp Pro Tyr Gly Asp Ser Met Phe Phe
625 630 635 640
Cys Leu Arg Arg Glu Gln Leu Phe Ala Arg His Phe Trp Asn Arg Ala
645 650 655
Gly Val Met Gly Asp Thr Val Pro Thr Asp Leu Tyr Ile Lys Gly Thr
660 665 670
Ser Ala Asn Met Arg Glu Thr Pro Gly Ser Cys Val Tyr Ser Pro Ser
675 680 685
Pro Ser Gly Ser Ile Ile Thr Ser Asp Ser Gln Leu Phe Asn Lys Pro
690 695 700
Tyr Trp Leu His Lys Ala Gln Gly His Asn Asn Gly Ile Cys Trp His
705 710 715 720
Asn Gln Leu Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Leu
725 730 735
Thr Leu Cys Ala Ser Thr Gln Asn Pro Val Pro Ser Thr Tyr Asp Pro
740 745 750
Thr Lys Phe Lys Gln Tyr Ser Arg His Val Glu Glu Tyr Asp Leu Gln
755 760 765
Phe Ile Phe Gln Leu Cys Thr Ile Thr Leu Thr Ala Glu Val Met Ser
770 775 780
Tyr Ile His Ser Met Asn Ser Ser Ile Leu Glu Asn Trp Asn Phe Gly
785 790 795 800
Val Pro Pro Pro Pro Thr Thr Ser Leu Val Asp Thr Tyr Arg Phe Val
805 810 815
Gln Ser Val Ala Val Thr Cys Gln Lys Asp Thr Thr Pro Pro Glu Lys
820 825 830
Gln Asp Pro Tyr Asp Lys Leu Lys Phe Trp Thr Val Asp Leu Lys Glu
835 840 845
Lys Phe Ser Ser Asp Leu Asp Gln Tyr Pro Leu Gly Arg Lys Phe Leu
850 855 860
Val Gln Ala Gly Leu Arg Arg Arg Pro Thr Ile Gly Pro Arg Lys Arg
865 870 875 880
Pro Ala Ala Ser Thr Ser Thr Ala Ser Arg Pro Ala Lys Arg Val Arg
885 890 895
Ile Arg Ser Lys Lys
900
<210> 11
<211> 2109
<212> DNA
<213> 人工序列
<400> 11
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggaagttc tgttccaggg gccctctgac tcgaccgtat acctgccccc gccgtctgtt 720
gctcgtgttg ttaacaccga cgactacgtt tctcgtacct ctatcttcta ccacgctggt 780
tcttctcgtc tgctgaccgt tggtaacccg tacttccgtg ttgttccgaa cggtgctggt 840
aacaaacagg ctgttccgaa agtttctgct taccagtacc gtgttttccg tgttgctctg 900
ccggacccga acaaattcgg tctgccggac tctaccatct acaacccgga aacccaacgt 960
ctggtctggg cgtgcgttgg tatggaaatc ggtcgtggtc agccgctggg tatcggtctg 1020
tctggtcacc cgttctacaa caaactggac gacaccgaat ctgctcacgc tgctaccgct 1080
gttatcaccc aggacgtacg tgacaacgta agcgttgact acaaacagac ccagctgtgc 1140
atcctgggtt gcgttccggc tatcggtgaa cactgggcta aaggtaccct gtgcaaaccg 1200
gctcagctgc agccgggtga ctgcccgccg ctggaactga aaaacaccat catcgaagac 1260
ggtgacatgg ttgacaccgg ttacggtgct atggacttct ctaccctgca ggacaccaaa 1320
tgcgaagttc cgctggacat ctgccagtct atctgcaaat acccggacta cctgcagatg 1380
tctgctgacc cgtacggtga ctctatgttc ttctgcctgc gtcgtgaaca gctgttcgct 1440
cgtcacttct ggaaccgtgc tggtgttatg ggtgacaccg ttccgaccga cctgtacatc 1500
aaaggtacct ctgctaacat gcgtgaaacc ccgggttctt gcgtttactc tccgtctccg 1560
tctggttcta tcatcacctc tgactctcag ctgttcaaca aaccgtactg gctgcacaaa 1620
gctcagggtc acaacaacgg tatctgctgg cacaaccagc tgttcgttac cgttgttgac 1680
accacccgtt ctaccaacct gaccctgtgc gcttctaccc agaacccggt tccgtctacc 1740
tacgacccga ccaaattcaa acagtactct cgtcacgttg aagaatacga cctgcagttc 1800
atcttccagc tgtgcaccat caccctgacc gctgaagtta tgtcttacat ccactctatg 1860
aactcttcta tcctggaaaa ctggaacttc ggtgttccgc cgccgccgac cacctctctg 1920
gttgacactt acaggttcgt tcagtctgtt gctgttacct gccagaaaga caccaccccg 1980
ccggaaaaac aggacccgta cgacaaactg aaattctgga ccgttgacct gaaagaaaaa 2040
ttctcttctg acctggacca gtacccgctg ggtcgtaaat tcctggttca ggctggtctg 2100
cgtcgttag 2109
<210> 12
<211> 2490
<212> DNA
<213> 人工序列
<400> 12
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggaagttc tgttccaggg gccctctgac caggaagcta aaccgtctac cgaagacctg 720
ggtgacaaaa aagaaggtga atacatcaaa ctgaaagtta tcggtcagga ctcttctgaa 780
atccacttca aagttaaaat gaccacccac ctgaaaaaac tgaaagaatc ttactgccag 840
cgtcagggtg ttccgatgaa ctctctgcgt ttcctgttcg aaggtcagcg tatcgctgac 900
aaccacaccc cgaaagaact gggtatggaa gaagaagacg ttatcgaagt ttaccaggaa 960
cagaccggtg gatcctctga ctcgaccgta tacctgcccc cgccgtctgt tgctcgtgtt 1020
gttaacaccg acgactacgt ttctcgtacc tctatcttct accacgctgg ttcttctcgt 1080
ctgctgaccg ttggtaaccc gtacttccgt gttgttccga acggtgctgg taacaaacag 1140
gctgttccga aagtttctgc ttaccagtac cgtgttttcc gtgttgctct gccggacccg 1200
aacaaattcg gtctgccgga ctctaccatc tacaacccgg aaacccaacg tctggtctgg 1260
gcgtgcgttg gtatggaaat cggtcgtggt cagccgctgg gtatcggtct gtctggtcac 1320
ccgttctaca acaaactgga cgacaccgaa tctgctcacg ctgctaccgc tgttatcacc 1380
caggacgtac gtgacaacgt aagcgttgac tacaaacaga cccagctgtg catcctgggt 1440
tgcgttccgg ctatcggtga acactgggct aaaggtaccc tgtgcaaacc ggctcagctg 1500
cagccgggtg actgcccgcc gctggaactg aaaaacacca tcatcgaaga cggtgacatg 1560
gttgacaccg gttacggtgc tatggacttc tctaccctgc aggacaccaa atgcgaagtt 1620
ccgctggaca tctgccagtc tatctgcaaa tacccggact acctgcagat gtctgctgac 1680
ccgtacggtg actctatgtt cttctgcctg cgtcgtgaac agctgttcgc tcgtcacttc 1740
tggaaccgtg ctggtgttat gggtgacacc gttccgaccg acctgtacat caaaggtacc 1800
tctgctaaca tgcgtgaaac cccgggttct tgcgtttact ctccgtctcc gtctggttct 1860
atcatcacct ctgactctca gctgttcaac aaaccgtact ggctgcacaa agctcagggt 1920
cacaacaacg gtatctgctg gcacaaccag ctgttcgtta ccgttgttga caccacccgt 1980
tctaccaacc tgaccctgtg cgcttctacc cagaacccgg ttccgtctac ctacgacccg 2040
accaaattca aacagtactc tcgtcacgtt gaagaatacg acctgcagtt catcttccag 2100
ctgtgcacca tcaccctgac cgctgaagtt atgtcttaca tccactctat gaactcttct 2160
atcctggaaa actggaactt cggtgttccg ccgccgccga ccacctctct ggttgacact 2220
tacaggttcg ttcagtctgt tgctgttacc tgccagaaag acaccacccc gccggaaaaa 2280
caggacccgt acgacaaact gaaattctgg accgttgacc tgaaagaaaa attctcttct 2340
gacctggacc agtacccgct gggtcgtaaa ttcctggttc aggctggtct gcgtcgtcgt 2400
ccgaccatcg gtccgcgtaa acgtccggct gcttctacct ctaccgcttc tcgtccggct 2460
aaacgtgttc gtatccgttc taaaaaataa 2490
<210> 13
<211> 2661
<212> DNA
<213> 人工序列
<400> 13
atgaaaatcg aagaaggtaa actggtaatc tggattaacg gcgataaagg ctataacggt 60
ctcgctgaag tcggtaagaa attcgagaaa gataccggaa ttaaagtcac cgttgagcat 120
ccggataaac tggaagagaa attcccacag gttgcggcaa ctggcgatgg ccctgacatt 180
atcttctggg cacacgaccg ctttggtggc tacgctcaat ctggcctgtt ggctgaaatc 240
accccggaca aagcgttcca ggacaagctg tatccgttta cctgggatgc cgtacgttac 300
aacggcaagc tgattgctta cccgatcgct gttgaagcgt tatcgctgat ttataacaaa 360
gatctgctgc cgaacccgcc aaaaacctgg gaagagatcc cggcgctgga taaagaactg 420
aaagcgaaag gtaagagcgc gctgatgttc aacctgcaag aaccgtactt cacctggccg 480
ctgattgctg ctgacggggg ttatgcgttc aagtatgaaa acggcaagta cgacattaaa 540
gacgtgggcg tggataacgc tggcgcgaaa gcgggtctga ccttcctggt tgacctgatt 600
aaaaacaaac acatgaatgc agacaccgat tactccatcg cagaagctgc ctttaataaa 660
ggcgaaacag cgatgaccat caacggcccg tgggcatggt ccaacatcga caccagcaaa 720
gtgaattatg gtgtaacggt actgccgacc ttcaagggtc aaccatccaa accgttcgtt 780
ggcgtgctga gcgcaggtat taacgccgcc agtccgaaca aagagctggc aaaagagttc 840
ctcgaaaact atctgctgac tgatgaaggt ctggaagcgg ttaataaaga caaaccgctg 900
ggtgccgtag cgctgaagtc ttacgaggaa gagttggcga aagatccacg tattgccgcc 960
actatggaaa acgcccagaa aggtgaaatc atgccgaaca tcccgcagat gtccgctttc 1020
tggtatgccg tgcgtactgc ggtgatcaac gccgccagcg gtcgtcagac tgtcgatgaa 1080
gccctgaaag acgcgcagac taattcgagc tcgaacaaca acaacaataa caataacaac 1140
aacctcggga tcgagggaag gatttcagaa ttcatggctc tgtggcgtcc gtctgactcg 1200
accgtatacc tgcccccgcc gtctgttgct cgtgttgtta acaccgacga ctacgtttct 1260
cgtacctcta tcttctacca cgctggttct tctcgtctgc tgaccgttgg taacccgtac 1320
ttccgtgttg ttccgaacgg tgctggtaac aaacaggctg ttccgaaagt ttctgcttac 1380
cagtaccgtg ttttccgtgt tgctctgccg gacccgaaca aattcggtct gccggactct 1440
accatctaca acccggaaac ccaacgtctg gtctgggcgt gcgttggtat ggaaatcggt 1500
cgtggtcagc cgctgggtat cggtctgtct ggtcacccgt tctacaacaa actggacgac 1560
accgaatctg ctcacgctgc taccgctgtt atcacccagg acgtacgtga caacgtaagc 1620
gttgactaca aacagaccca gctgtgcatc ctgggttgcg ttccggctat cggtgaacac 1680
tgggctaaag gtaccctgtg caaaccggct cagctgcagc cgggtgactg cccgccgctg 1740
gaactgaaaa acaccatcat cgaagacggt gacatggttg acaccggtta cggtgctatg 1800
gacttctcta ccctgcagga caccaaatgc gaagttccgc tggacatctg ccagtctatc 1860
tgcaaatacc cggactacct gcagatgtct gctgacccgt acggtgactc tatgttcttc 1920
tgcctgcgtc gtgaacagct gttcgctcgt cacttctgga accgtgctgg tgttatgggt 1980
gacaccgttc cgaccgacct gtacatcaaa ggtacctctg ctaacatgcg tgaaaccccg 2040
ggttcttgcg tttactctcc gtctccgtct ggttctatca tcacctctga ctctcagctg 2100
ttcaacaaac cgtactggct gcacaaagct cagggtcaca acaacggtat ctgctggcac 2160
aaccagctgt tcgttaccgt tgttgacacc acccgttcta ccaacctgac cctgtgcgct 2220
tctacccaga acccggttcc gtctacctac gacccgacca aattcaaaca gtactctcgt 2280
cacgttgaag aatacgacct gcagttcatc ttccagctgt gcaccatcac cctgaccgct 2340
gaagttatgt cttacatcca ctctatgaac tcttctatcc tggaaaactg gaacttcggt 2400
gttccgccgc cgccgaccac ctctctggtt gacacttaca ggttcgttca gtctgttgct 2460
gttacctgcc agaaagacac caccccgccg gaaaaacagg acccgtacga caaactgaaa 2520
ttctggaccg ttgacctgaa agaaaaattc tcttctgacc tggaccagta cccgctgggt 2580
cgtaaattcc tggttcaggc tggtctgcgt cgtcgtccga ccatcggtcc gcgtaaacgt 2640
ccggctgctt ctacctctta a 2661

Claims (11)

1.一种经大肠杆菌偏好密码子优化的编码人乳头瘤病毒HPV45 L1的融合基因,其特征在于,优化的编码人乳头瘤病毒HPV45 L1的基因核苷酸序列如SEQ ID NO.2所示,并融合有编码GST-SUMO的编码核苷酸序列。
2.如权利要求1所述的融合基因,其特征在于,该融合基因编码的氨基酸序列如SEQ IDNO:9所示。
3.如权利要求1所述的融合基因,其特征在于,该融合基因的核苷酸序列如为SEQ IDNO:4所示。
4.一种大肠杆菌表达载体,其特征在于该载体包括具有权利要求1至3任一项所述融合基因。
5.如权利要求4所述的大肠杆菌表达载体,其特征在于该载体为pGEX-6p-1、pGEX-4T-2、 pMAL或pET28a。
6.一种工程菌细胞,该细胞包含权利要求1至3任一项所述的融合基因,或权利要求4、5所述的大肠杆菌表达载体。
7.如权利要求6所述的工程菌细胞,其特征在于,为GI698,ER2566,BL21 (DE3),XA90,B834 (DE3)或BLR (DE3)。
8.一种由权利要求1至3任一项所述的融合基因编码的融合蛋白。
9.如权利要求8所述的融合蛋白,其特征在于其氨基酸序列如SEQ ID NO.9所示。
10.一种HPV45 L1五聚体蛋白质的制备方法,其特征在于该方法包括如下步骤:
用亲和层析方法吸附如权利要求8或9所述的融合蛋白;
加入SENP1蛋白质水解酶切除Tag标签,得HPV45 L1五聚体蛋白质;
纯化HPVL1五聚体蛋白质、得纯度>98%,平均粒径10~15nm PdI<0.1的L1五聚体蛋白质。
11.一种HPV45 L1 VLP的制备方法,其特征在于该方法包括如下步骤:
将平均粒径10~15nm PdI<0.1的如权利要求10所述的方法制备得到HPV L1五聚体蛋白质与组装缓冲液混合,混合后pH值为5.0~5.9,盐浓度为500~2000 mM,最终获得平均粒径45~65nm PdI<0.1的HPV45 L1 VLP蛋白质液。
CN201510490367.0A 2015-08-12 2015-08-12 45型重组人乳头瘤病毒病毒样颗粒及其制备方法 Active CN106701798B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510490367.0A CN106701798B (zh) 2015-08-12 2015-08-12 45型重组人乳头瘤病毒病毒样颗粒及其制备方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510490367.0A CN106701798B (zh) 2015-08-12 2015-08-12 45型重组人乳头瘤病毒病毒样颗粒及其制备方法

Publications (2)

Publication Number Publication Date
CN106701798A CN106701798A (zh) 2017-05-24
CN106701798B true CN106701798B (zh) 2021-09-17

Family

ID=58929943

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510490367.0A Active CN106701798B (zh) 2015-08-12 2015-08-12 45型重组人乳头瘤病毒病毒样颗粒及其制备方法

Country Status (1)

Country Link
CN (1) CN106701798B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101016542A (zh) * 2007-02-14 2007-08-15 马润林 一种提高人乳头瘤病毒l1蛋白原核表达产率的方法
NZ545834A (en) * 2003-09-29 2009-02-28 Merck & Co Inc Optimized expression of HPV 45 L1 in yeast
CN104211782A (zh) * 2013-06-04 2014-12-17 厦门大学 截短的人乳头瘤病毒45型l1蛋白

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ545834A (en) * 2003-09-29 2009-02-28 Merck & Co Inc Optimized expression of HPV 45 L1 in yeast
CN101016542A (zh) * 2007-02-14 2007-08-15 马润林 一种提高人乳头瘤病毒l1蛋白原核表达产率的方法
CN104211782A (zh) * 2013-06-04 2014-12-17 厦门大学 截短的人乳头瘤病毒45型l1蛋白

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Phylogenetic considerations in designing a broadly protective multimeric L2 vaccine;Subhashini Jagu等;《Journal of virology》;20130327;第87卷(第11期);全文 *
以假病毒为基础的人乳头瘤病毒(HPV)中和抗体检测方法和动物感染模型的建立及初步应用;吴雪伶;《中国优秀硕士学位论文全文数据库》;20081115;全文 *

Also Published As

Publication number Publication date
CN106701798A (zh) 2017-05-24

Similar Documents

Publication Publication Date Title
CN105039358B (zh) 58型重组人乳头瘤病毒病毒样颗粒及其制备方法
DK2154147T3 (en) Truncated L1 protein of human papillomavirus 16
US10537629B2 (en) Truncated L1 protein of human papillomavirus type 11
CN106399329B (zh) 33型重组人乳头瘤病毒病毒样颗粒及其制备方法
CN106831958B (zh) 一种人乳头瘤病毒11型l1蛋白的突变体
WO2019233415A1 (zh) 一种人乳头瘤病毒39型l1蛋白的突变体
US9034340B2 (en) Genes encoding major capsid protein L1 of human papilloma virus
CN106701797B (zh) 31型重组人乳头瘤病毒病毒样颗粒及其制备方法
WO2008145021A1 (en) A truncated l1 protein of human papillomavirus 6
CN106701796B (zh) 52型重组人乳头瘤病毒病毒样颗粒及其制备方法
US11213580B2 (en) Mutant of L1 protein of human papillomavirus type 16
CN106701798B (zh) 45型重组人乳头瘤病毒病毒样颗粒及其制备方法
CN110950935A (zh) 一种人乳头瘤病毒51型l1蛋白的突变体
CN110551185A (zh) 一种人乳头瘤病毒68型l1蛋白的突变体
CN110551184A (zh) 一种人乳头瘤病毒56型l1蛋白的突变体
CN104045695B (zh) 重组的人乳头瘤病毒18型l1蛋白及其用途
WO2019233400A1 (zh) 一种人乳头瘤病毒66型l1蛋白的突变体
WO2019233412A1 (zh) 一种人乳头瘤病毒18型l1蛋白的突变体
CN110551186A (zh) 一种人乳头瘤病毒45型l1蛋白的突变体
CN110950936A (zh) 一种人乳头瘤病毒69型l1蛋白的突变体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant