CN106399329B - 33型重组人乳头瘤病毒病毒样颗粒及其制备方法 - Google Patents

33型重组人乳头瘤病毒病毒样颗粒及其制备方法 Download PDF

Info

Publication number
CN106399329B
CN106399329B CN201510490177.9A CN201510490177A CN106399329B CN 106399329 B CN106399329 B CN 106399329B CN 201510490177 A CN201510490177 A CN 201510490177A CN 106399329 B CN106399329 B CN 106399329B
Authority
CN
China
Prior art keywords
leu
hpv
lys
protein
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510490177.9A
Other languages
English (en)
Other versions
CN106399329A (zh
Inventor
刘永江
伍树明
高文双
陈晓
任永峰
王雅君
姜绪林
张瑞霞
高俊
张海江
陈建平
银飞
徐岚
仉春艳
夏丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kangleweishi Biological Technology Co ltd
Original Assignee
Beijing Kangleweishi Biological Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kangleweishi Biological Technology Co ltd filed Critical Beijing Kangleweishi Biological Technology Co ltd
Priority to CN201510490177.9A priority Critical patent/CN106399329B/zh
Publication of CN106399329A publication Critical patent/CN106399329A/zh
Application granted granted Critical
Publication of CN106399329B publication Critical patent/CN106399329B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及33型重组人乳头瘤病毒病毒样颗粒及其制备方法,具体技术要点是提供一种新的编码重组的HPV33 L1蛋白的多核苷酸基因片段、包含该基因片段的载体、包括载体的宿主细胞,以及由该基因片段翻译表达的HPV33 L1溶合蛋白、五聚体和由该五聚体组成VLP,本发明还公开该五聚体、VLP蛋白及其组成的疫苗组合物在制备预防HPV33感染的药物中的应用。

Description

33型重组人乳头瘤病毒病毒样颗粒及其制备方法
技术领域
本发明涉及人乳头瘤病毒的病毒样颗粒及其制备方法。更具体而言,本发明涉及一种重组的人乳头瘤病毒L1蛋白的五聚体及病毒样颗粒(Virus-like Particle,VLP)及其制备方法,及含该病毒样颗粒的疫苗组合物在预防人乳头瘤病毒感染中的应用。
背景技术
人乳头瘤病毒(Human Papillomavirus,简称HPV)主要通过人体密切接触,如性传播的病毒,可引起人类多种增殖性上皮病变,包括乳头状瘤(疣)和瘤样病变。具体来讲,HPV诱发的疾病主要包括3大类,第1类:宫颈、阴道、女性外阴、阴茎和肛门的癌症及某些类型的头颈部肿瘤等恶性病变。100%的宫颈癌患者都是HPV感染所导致的,90%的肛门癌,40%的外阴、阴道及阴茎,12%的口咽及3%的口腔癌症归因于HPV感染。第2类:良性病变如扁平疣、尖锐湿疣等生殖器疣,是一种性传播疾病,在性行为活跃的人群中很常见。虽然生殖器疣不会像癌症一样造成严重的后果,但是病变通常会引起病人较为痛苦的临床症状如灼痛、出血和疼痛,同时产生尴尬、焦虑和自卑等负面的心理反应,而且反复治疗的过程浪费了大量的医疗资源。在世界范围内估计由非致癌性HPV(主要是6和11型)引起的生殖器疣有3000万,其中20~50%的病变中还包含有高危型HPV的混合感染。第3类:HPV感染还能引起复发性呼吸道乳头瘤( RRP),这是一种罕见的、具有潜在致命性的疾病,主要发生在青少年时期,有时,大量的乳头瘤可以引起呼吸困难并导致较小年龄儿童死亡。所以预防或治疗HPV感染对人类健康意义十分重大。
HPV是无囊膜的双链DNA病毒,主要由病毒外壳和基因组DNA组成(Bernard, Burket al. 2011)。HPV病毒外壳是由360个L1蛋白质(形成72个五聚体)和至多72个L2蛋白质构成的二十面体结构,直径55~60 nm(Howley and Lowy 2007)。病毒外壳蛋白质具有自组装特性,在体外L1蛋白质单独或与L2蛋白质共同自组装形成病毒样样颗粒(Virus-likeParticle,VLP)(Chen, Garcea et al. 2000, Finnen, Erickson et al. 2003, Buck,Cheng et al. 2008, Wang and Roden 2013)。
由于HPV不能在体外细胞培养, 要获得该病毒的特异性抗原, 只能用重组DNA 技术的方法制备基因工程疫苗。重组Ll或L1/L2组装形成的病毒样颗粒VLPs,无病毒DNA,安全性好,具有和天然病毒颗粒相似的抗原表位,刺激机体后可产生中和抗体IgG和IgA,因此HPV VLPs可作为预防性疫苗,从而大大降低因感染HPV导致产生相关肿瘤的可能性(Howley and Lowy 2007) 。
HPV疫苗研制的关键是能够大量制备高纯度、稳定的HPV抗原。在HPV疫苗抗原制备技术方面,目前较为常用的生产HPV抗原的表达系统可以分为真核表达系统及原核表达系统。常用的真核表达系统有痘病毒表达系统、昆虫杆状病毒表达系统、酵母表达系统。在真核表达系统中所表达的HPV L1能自发的形成VLP,往往只需进行简单的纯化即可获得VLP。但是由于真核表达系统的表达量低,培养成本高,给大规模工业化生产带来了极大困难。原核表达系统中利用大肠杆菌表达系统表达HPV L1蛋白质已有报道。但是由于大肠杆菌所表达的HPV L1蛋白质可溶性低,目前已知的纯化方法大多通过无盐沉淀或变性复性等步骤从蛋白质种类繁杂的细胞液中最终纯化得到HPV VLP。例如:在专利CN02129070.9中公开通过原核细胞表达和制备HPV L1多聚体的方法,其中纯化工艺包括通过3.3M尿素处理和透析复性过程;在WO-0204007专利中对L1-GST融合蛋白质的纯化方法也是通过尿素变性处理并进行透析复性;在现有技术中也有公开L1蛋白质的纯化方法是包括磷酸缓冲液超滤透析和离心,使目的蛋白沉淀再复溶的步骤。但是在这些纯化过程中蛋白质损失量大,得率低,难以在大规模生产上应用。
在HPV疫苗抗原蛋白质VLP的均一性方面,现有技术中所组装的HPV L1 VLP的粒径分散度有使用polyd值表示,polyd值<15%说明颗粒有很好的均一性,15%到30%之间说明颗粒有较大的不均一性,大于30%说明颗粒完全不够均一。现有技术中制备的HPV L1 VLP多大于15%。另一个说明粒径均一的指标是PdI值,PdI值为粒径分布系数,小于0.05为高度均一的样品;0.05~0.1为准均一的样品,0.1~0.3为均一性较差的样品,大于0.3为不均一的样品。在US7205125B2专利中公开两个型别HPV L1 VLP的混合蛋白液的PdI为0.07。
因此,本领域仍然需要成本低、纯度高、产量高、质量稳定的HPV L1蛋白质生产技术和大规模工业化生产重组HPV L1 VLP的新方法。
发明内容
本发明的目的是公开一种优化的编码HPV33 L1 蛋白质的核苷酸序列,包含该核苷酸序列的载体、包括载体的宿主细胞,以及由该多核苷酸序列翻译表达的HPV L1蛋白质,Tag-HPV-L1重组蛋白,由该L1蛋白质形成的五聚体和VLP,以及由该五聚体和VLP作为抗原组成的预防HPV感染的疫苗。
本发明第一方面提供一种经密码子优化的HPV33 L1的基因,其核苷酸序列为SEQNO:2。
本发明第二方面提供一种构建的表达载体,其包含本发明第一方面的经密码子优化的HPV33 L1的基因。所述载体适合驱动异源DNA在细菌中翻译表达HPV L1蛋白质。在一个实施方案中,所述表达载体优选pGEX-6p-1、pGEX-4T-2、 pMAL或pET28a。
本发明的第三方面提供一种构建的工程菌细胞,该细胞包含本发明第一方面的基因,或第二方面的表达载体。所述的工程菌宿主细胞是大肠杆菌,在一个实施方案中,所述宿主细胞优选BL21细胞株。
本发明第四方面提供一种Tag-HPV33 L1融合蛋白,其中标签Tag为6*His.Tag,GST.Tag,SUMO.Tag,MBP.Tag,6*His - SUMO.Tag或GST- SUMO.Tag;L1为HPV33 L1全长蛋白质和/或C端截短5个、10个、15个或不多于30个氨基酸和/或N端截短2个、4个、6个或不多于10个氨基酸的L1蛋白质。
编码Tag-HPVL1融合蛋白GST-HPV33 L1的核苷酸序列为SEQ NO:3、SEQ NO:11,,GST-SUMO-HPV33 L1的核苷酸序列为SEQ NO:4、SEQ NO:12,MBP的核苷酸序列SEQ NO:5、SEQ NO:13,6*His-HPV33 L1的核苷酸序列为SEQ NO:6, 6*His-SUMO-HPV33 L1的核苷酸序列为SEQ NO:7。
编码Tag-HPVL1融合蛋白GST-HPV33 L1的氨基酸序列为SEQ NO:8,GST-SUMO-HPV33 L1的氨基酸序列为SEQ NO:9,MBP的氨基酸序列SEQ NO:10。
本发明第五方面提供Tag-HPVL1融合蛋白质经过纯化后获得的HPV L1的五聚体,及由五聚体组装的VLP。在一个优选实施例中HPV33 L1五聚体蛋白平均粒径10~15nm PdI<0.1。在一个优选实施例中HPV33 L1VLP的平均粒径45~65nm PdI<0.1。
本发明第六方面提供了一种疫苗组合物,其包含本发明HPV L1的五聚体或HPV L1的VLP,所述组合物中进一步包含可药用的赋形剂和药用佐剂。
在一个实施方案中将含有HPV33 L1五聚体或VLP蛋白原液(根据上述方法制备所得)分别与氢氧化铝佐剂生理盐水溶液按照蛋白与铝含量1:10比例进行吸附配制即可制得重组HPV L1蛋白质五聚体或VLP疫苗,在4℃保存待用。
另一方面,本发明还提供一种获得Tag-HPVL1融合蛋白的方法,包括如下步骤:
A.通过用大肠杆菌偏爱的密码子取代HPV33 L1基因序列的翻译同种蛋白的密码子,得到大肠杆菌表达系统偏爱的密码子优化的HPV33 L1的基因;
B.构建HPV33 L1基因的大肠杆菌表达载体;
C.构建Tag-HPV33 L1的大肠杆菌表达工程菌株;
D.诱导表达并纯化得融合蛋白Tag-HPV33 L1。
上述制备融合蛋白Tag-HPV33 L1方法中原核宿主细胞选自但不限于GI698,ER2566,BL21 (DE3),XA90,B834 (DE3),BLR (DE3)。
上述制备融合蛋白Tag-HPV33 L1方法中表达条件是:20~37℃温度条件下,诱导表达3~20小时。在一个具体实施例中优选在28℃温度条件下,诱导表达 16小时。
本发明还提供一种获得HPV33 L1五聚体的方法,包括如下步骤:
a)用亲和层析方法吸附融合蛋白Tag-HPV33 L1;
b)加入蛋白质水解酶切除Tag标签,得到HPV33 L1五聚体蛋白质;
c)纯化HPVL1五聚体蛋白质、得到纯度>98%,平均粒径10~15nm PdI<0.1的L1五聚体蛋白质。
上述制备HPV33 L1五聚体方法中所述用于蛋白酶为切除Tag标签的位点专一的蛋白质水解酶:重组3C蛋白酶,凝血酶,SUMO蛋白酶,SENP1或TEV蛋白酶。
上述制备HPV33 L1五聚体方法中纯化方法选自但不限于离子交换色谱法,疏水性色谱法,分子筛(或称凝胶过滤或分子排阻)色谱法;优选地纯化包括离子交换色谱法和分子筛色谱法。
上述制备HPV33 L1五聚体方法中纯化方法还包括使用还原剂,例如加入DTT。
上述制备HPV33 L1五聚体方法中最终纯化后所得到HPV33 L1五聚体蛋白平均粒径10~15nm PdI<0.1。
本发明还提供了一种HPV33 L1五聚体组装成VLP的方法,包括如下步骤:
将平均粒径10~15nm PdI<0.1的L1五聚体蛋白质液与组装缓冲液混合,最终获得pH值为5.0~5.9,盐浓度为500~2000 mM,平均粒径45~65nm PdI<0.1的HPV33 L1 VLP蛋白质液,优选获得pH值为5.7,盐浓度为1300 mM的HPV33 L1 VLP蛋白质液。
组装缓冲液包括但不限于Tris缓冲液,磷酸盐缓冲液,醋酸缓冲液,HEPES缓冲液,MOPS缓冲液,枸橼酸缓冲液、组氨酸缓冲液,硼酸缓冲液等。
上述HPV33 L1五聚体组装成VLP的方法中HPV33 L1-VLP蛋白质液中还可以加入保护剂,例如:0.01~0.1聚山梨酯80。
另一方面,本发明还提供了HPV L1的五聚体、VLP和包括五聚体或VLP的疫苗组合物在制备预防HPV感染的药物中的应用。
根据本发明,本发明的疫苗可采用患者可接受的形式,包括但不限于注射或鼻腔或口腔吸入或者阴道给药,优选注射剂和肌内注射。
本发明中相关术语的说明及解释
根据本发明,术语“大肠杆菌表达系统”是指由大肠杆菌(菌株)与载体组成,其中大肠杆菌(菌株)来源于市场上可得到的,在此举例但不限于: GI698,ER2566,BL21 (DE3),XA90,DH(5a)、B834 (DE3),BLR (DE3)。
根据本发明,术语“载体”一词指的是,可将某编码蛋白质的多聚核苷酸插入其中并使蛋白质获得表达的一种核酸运载工具。载体可以通过转化,转导或者转染宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。举例来说,载体包括:质粒;噬菌体;柯斯质粒等等。
根据本发明,术语“疫苗用赋形剂或载体“是指选自一种或多种,包括但不限于:pH调节剂,表面活性剂,佐剂,离子强度增强剂。例如,pH调节剂举例但不限于磷酸盐缓冲液,表面活性剂包括阳离子,阴离子或者非离子型表面活性剂。举例但不限于:聚山梨酯80。佐剂举例但不限于氢氧化铝,磷酸铝、氟氏完全佐剂、氟氏不完全佐剂等。离子强度增强剂举例但不限于氯化钠。
根据本发明,术语“色谱”包括但不限于:离子交换色谱(例如阳离子交换色谱、阴离子交换色谱)、疏水相互作用色谱、吸附色谱层析法(例如羟基磷灰石色谱)、分子筛色谱层析(凝胶过滤或分子排阻层析)、亲和色谱层析法。
根据本发明,在本发明获得的重组HPV L1蛋白质的方法中,缓冲液是指一种能在加入少量酸或碱和水时大大降低pH变动幅度的溶液,包括但不限于Tris缓冲液,磷酸盐缓冲液,醋酸缓冲液,HEPES缓冲液,MOPS缓冲液,枸橼酸缓冲液、组氨酸缓冲液,硼酸缓冲液等。
根据本发明,所述细胞破碎包括但不限于通过匀浆器破碎、均质机破碎、超声波处理、研磨、高压挤压、溶菌酶处理中的一项或者多项方法来实现;
根据本发明,在本发明获得的重组HPV L1蛋白质的方法中,所用的盐包括但不限于是中性盐,特别是碱金属盐、铵盐、盐酸盐、硫酸盐,碳酸氢盐,磷酸盐或磷酸氢盐,特别是NaCl、KCl、CaCl2、NH4Cl、KCl、NH4Cl、MgSO4 、(NH4)2SO4中的一种或几种。优选NaCl。所用的还原剂包括但不限于DTT,2-巯基乙醇。所用量包括但不限于2mM~l00mM,优选10~15mM。
有益效果
本发明提供了一种合成基因,该基因序列是根据大肠杆菌的密码子偏好进行过密码子优化的核苷酸序列,该序列编码了HPV L1蛋白氨基酸序列。研究发现经过密码子优化的核酸序列相对于未经密码子优化的核酸序列的L1蛋白的表达量有显著提高。
本发明公开的大肠杆菌表达系统具有表达量高、 易于培养和操作以及生产成本低等优点。但是, 仅仅使用该表达系统仍难以直接获得大量可溶性的HPV L1蛋白, 其原因在于L1蛋白极容易形成包涵体,即无生物学活性的不溶性聚合体。此外, 即使获得大量的包涵体, 为了得到有生物学活性的蛋白, 还必须对包涵体进行变性、 复性处理,这个过程往往损失大量的蛋白。为了解决这一难题,本发明采用融合技术,将L1基因与具有协助蛋白质正确折叠的蛋白如谷胱甘肽硫转移酶(GST)、SUMO、MBP、6*His- SUMO或GST- SUMO等进行融合表达,不仅蛋白的可溶性及收率有所提高,而且GST-SUMO-HPVL1,6*His-SUMO-HPVL1使得在HPV L1蛋白质N端没有外源氨基酸的残留,同时发现其中的GST-SUMO作为重组蛋白HPVL1表达的融合标签和分子伴侣, 具有抗蛋白酶水解、显著增加重组蛋白表达量以及促进靶蛋白正确折叠, 提高可溶性等功能。因此本发明采用的技术路线是在构建HPV L1蛋白表达载体时采用了标签蛋白融合技术,一方面通过标签蛋白与L1蛋白形成的融合蛋白来提高目的蛋白的可溶性、提高产量,另一方面通过GST融合标签可以利用亲和层析和蛋白水解酶切除融合质标签方法进行目的蛋白的纯化特点,从而实现了从种类繁杂的细胞裂解液中一步纯化即可获得纯度达到70%以上的HPV L1蛋白,大大提高了纯化效率,从而提高了终产物HPV L1蛋白的产量。
本发明提供的先表达、分离纯化获得高纯度的HPV L1五聚体蛋白后再人工控制组装形成VLP的技术路线,可以解决当前公知技术存在的从杂蛋白种类繁多的细胞破碎液中直接纯化VLP纯度低、降解比例高,收率低的问题,得到高纯度五聚体体外组装VLP及VLP保存条件。
本发明经重组所得的HPV L1 VLP蛋白质,具有良好的免疫原性,可以诱导高滴度的针对同型HPV的中和抗体,预防HPV对人体的感染,是一种良好的疫苗形式。
在参考下列详述和附图后,本发明的这些和其它方面将是显然的。此处公开的所有参考文献在此均完整引用作为参考。
附图说明
图l:GST-HPV33 L1 蛋白质亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准泳道从上至下为:94kDa,66kDa,45kDa,33kDa,26kDa,20kdat;1泳道为亲和吸附GST-L1的介质,分子量大约为80kDa;2泳道为酶解后GST与L1的介质。
图2:GST-SUMO-HPV33 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为为蛋白质量标准(从上至下为:94kDa,66kDa,45kDa,33kDa,26kDa,20kDa),1泳道为亲和吸附GST-SUMO -L1的介质,2泳道为酶解后GST-SUMO与L1的介质。
图3:MBP-HPV33 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为为蛋白质量标准(从上至下为:94kDa,66kDa,45kDa,33kDa,26kDa,20kda),1泳道为亲和吸附MBP-L1的介质,2泳道为酶解后MBP与L1的介质。
图4: 6*HIS-SUMO-HPV33 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为为蛋白质量标准(从上至下为:94kDa,66kDa,45kDa,33kDa,26kDa,20kda),1泳道为亲和吸附6*HIS-SUMO - L1的介质,2泳道为酶解后6*HIS-SUMO与L1的介质。通过凝胶电泳图显示蛋白酶切开了带有6*HIS-SUMO标签的溶合蛋白。
图5:本发明经过分子筛色谱纯化后的重组HPV33 L1五聚体蛋白质SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准(从上至下为:94kDa,66kDa,45kDa,33kDa,26kDa,20kda),另一泳道为HPV L1蛋白。
图6:HPV33 L1五聚体的动态光散射观测结果。结果显示五聚体的粒径直径为14.72 nM,粒度分布PdI为 0.091。
图7: HPV33 L1 VLP的动态光散射观测结果。结果显示VLP的粒径直径为54.29 nM,粒度分布PdI为0.015。
图8:HPV33 L1五聚体蛋白的透射电镜照片。
图9:HPV33 L1 VLP蛋白的透射电镜照片。
图10:HPV33 L1五聚体蛋白质的高压液相分子筛色谱图,图中显示经高度纯化的L1五聚体蛋白质纯度大于98%。
图11:HPV33 L1 VLP蛋白质的高压液相分子筛色谱图,图中显示经高度纯化的VLP蛋白质纯度大于98%。
图12:HPV33 L1五聚体各实验组疫苗接种小鼠后,在第二次加强免疫4周后,检测中和抗体的平均滴度水平。
图13:HPV33 L1 VLP各实验组疫苗接种小鼠后,在第二次加强免疫4周后,检测中和抗体的平均滴度水平。
下面结合实施例对本发明进一步举例描述。这些实施例是非限制性的。
实施例l:密码子优化的HPV L1基因的设计与合成
基因序列来源于PUBMED上已公开的各型HPV序列。参照大肠杆菌对基因转录密码子的偏好对选定的各型HPV DNA序列进行密码子优化后合成所有HPV DNA序列。根据合成DNA序列设计引物,利用合成基因为模板进行PCR扩增。所得的密码子优化序列通过DNA序列测定验证。
优化前与优化后的HPV各型DNA序列:
SEQ NO.1:优化前的HPV33型L1的DNA序列
SEQ NO.2:优化后的HPV33型L1的DNA序列
实施例2:重组载体pGEX-6P-1-GST- HPV33 L1的构建及鉴定:
扩增HPV33 L1 的DNA片段引物:(酶切位点分别是BamHI和XhoI)
Forward-HPV33 L1-ApaI:5’ACTTCAGGATCC ATGTCTGTTTGGCGTCCGTCTG
Reverse-HPV33 L1-XhoI:5’ATCTCACTCGAGCTA TTTTTTAACTTTTTTACGTTT
PCR扩增反应体系:10 x Pfu buffer 20 μL,Pfu酶 4 μL,10 mM dNTP 2.5 μL,5’Primer (5μM) 10μL,3’ Primer (5μM) 10μL,模 板DNA 50 ng,加d2H2O至200μL。
基因PCR扩增条件:95℃ 3 min; 95℃ 30 sec,58℃ 30 sec,72℃ 4 min;循环32次;72℃ 10 min。
将含有BamH I和XhoI酶切位点的L1基因片段以及载体pGEX-6P-1进行BamH I/XhoI双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGEX-6P-1进行连接反应,16 ℃ 10~15 h。
连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由上海生工生物公司进行测序,得到融合重组GST-HPV33-L1蛋白质的核苷酸序列为SEQ NO.3,氨基酸序列为SEQ NO.8。
参照该实施例方法制备带有GST-标签的融合重组载体GST-HPV-L1,其基因序列SEQ NO.11。
实施例3:重组载体pGEX-6P-1m-GST-SUMO- HPV33 L1 载体构建
pGEX-6p-1m载体构建:为使得多酶切位点附近的ApaI酶切位点 (GGGCCC)为载体的唯一ApaI酶切位点, 在不改变lacI基因蛋白质表达序列的前提下,通过点突变技术将市售的pGEX-6p-1载体的另一ApaI识别序列GGGCCC中的Gly密码子GGC改变为它的同义密码子GGT,即可消除ApaI(3890)。通过这样的改造使得ApaI 成为可用来插入表达基因的位点。
扩增SUMO 的DNA片段引物:(酶切位点分别是ApaI和BamHI)
Forward -SUMO-ApaI: ACTTCAGGGCCCTCTGACCAGGAAGCTAAACCGTC
Reverse-SUMO-BamHI: CGCGGATCCACCGGTCTGTTCCTGGTAAAC
扩增HPV33 L1 的DNA片段引物:(酶切位点分别是BamHI和XhoI)
Forward-HPV33 L1-ApaI:5’ACTTCAGGATCC ATGTCTGTTTGGCGTCCGTCTG
Reverse-HPV33 L1-XhoI:5’ATCTCACTCGAGCTA TTTTTTAACTTTTTTACGTTT
PCR扩增反应体系:10 x Pfu buffer 20 μL,Pfu酶 4 μL,10 mM dNTP 2.5 μL,5’Primer (5μM) 10μL,3’ Primer (5μM) 10μL,模 板DNA 50 ng,加d2H2O至200μL。
基因PCR扩增条件:95℃ 1.5 min; 95℃ 30 sec,58℃ 30 sec,72℃ 1 min;循环32次;72℃ 10 min。
基因PCR扩增条件同上述实施例。
酶切连接:将含有ApaI和BamHI酶切位点的SUMO基因片段以及载体pGEX-6P-1m进行Apa I/ BamHI双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGEX-6P-1m进行连接反应,16 ℃ 10~15h。
转化鉴定:连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由苏州金唯智生物科技有限公司进行测序,得到融合重组载体pGSTSUMO-6p-1m。
再次酶切连接:将含有BamHI和Xho1酶切位点的L1基因片段以及重组载体pGSTSUMO-6p-1m进行BamHI/Xho1双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGST-SUMO-6p1m进行连接反应,16 ℃ 10~15 h。
再次转化鉴定:连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由苏州金唯智生物科技有限公司进行测序,得到带有GST-SUMO标签的融合重组载体GST-SUMO-L1,其基因序列SEQ NO.4,氨基酸序列为SEQ NO.9。
参照该实施例方法制备带有GST-SUMO标签的融合重组载体GST-SUMO-L1,其基因序列SEQ NO.12。
实施例4:重组载体pMAL—MBP-HPV33 L1的构建
扩增HPV33 L1 的DNA片段引物:(酶切位点分别是EcoRI和HindIII)
Forward-HPV33 L1-EcoRI:5’ ACTTCA GAATTC ATGTCTGTTTGGCGTCCGTCTG
Reverse-HPV33 L1-HindIII:5’ ATCTCA AAGCTTCTA TTTTTTAACTTTTTTACGTTT
将含有EcoRI和HindIII酶切位点的L1基因片段以及载体pMAL进行EcoRI/HindIII双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pMAL进行连接反应,16 ℃ 10~15 h。
连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由上海生工生物公司进行测序,得到融合重组MBP-HPV33-L1蛋白质的基因序列SEQ NO.5,氨基酸序列为SEQ NO.10。
参照该实施例方法制备带有MBP标签的融合重组载体MBP-HPV-L1,其基因序列SEQNO.13。
实施例5:重组载体pET28a-6*His-HPV33 L1的构建
扩增HPV33 L1 的DNA片段引物:(酶切位点分别是NdeI和XhoI, pET28a)
Forward-HPV33 L1-NdeI:5’ GACTTCA CATATGATGTCTGTTTGGCGTCCGTCTG
Reverse-HPV33 L1-XhoI:5’ CATCTCACTCGAGCTA TTTTTTAACTTTTTTACGTTT
将含有NdeI和XhoI酶切位点的L1基因片段以及载体pMAL进行NdeI/XhoI双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pET28a进行连接反应,16℃ 10~15 h。
连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由上海生工生物公司进行测序,得到融合重组6*His-HPV33-L1蛋白质的基因序列SEQ NO.6。
实施例6:重组载体6*His-SUMO-HPV33 L1 载体构建
扩增SUMO 的DNA片段引物:(酶切位点分别是NdeI和BamHI)
Forward -SUMO-NdeI: GGAATTCCATATGTCTGACCAGGAAGCTAAACCGTC
Reverse-SUMO-BamHI: CGC GGATCCACCGGTCTGTTCCTGGTAAAC
扩增HPV33 L1 的DNA片段引物:(酶切位点分别是BamHI和XhoI)
Forward-HPV33 L1-ApaI:5’ACTTCAGGATCC ATGTCTGTTTGGCGTCCGTCTG
Reverse-HPV33 L1-XhoI:5’ATCTCACTCGAGCTA TTTTTTAACTTTTTTACGTTT
SUMO基因、L1基因PCR扩增条件、反应体系同上述实施例所述。
酶切连接:将含有NdeI和BamHI酶切位点的SUMO基因片段以及载体pET-28a进行NdeI/ BamHI双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pET28a进行连接反应,16 ℃ 10~15 h。
转化鉴定:连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由苏州金唯智生物科技有限公司进行测序,得到融合重组载体pETSUMO-28a。
再次酶切连接:将含有BamHI和Xho1酶切位点的L1基因片段以及重组载体pETSUMO-28a进行BamHI/Xho1双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pETSUMO-28a进行连接反应,16 ℃ 10~15 h。
再次转化鉴定:连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由上海生工生物公司进行测序,得到融合重组6*His-SUMO-HPV33-L1蛋白质的基因序列SEQ NO.7。
实施例7:重组HPV L1五聚体蛋白质的表达
将测序结果正确实施例2、3、4、5和6的重组载体转化大肠杆菌BL21宿主细胞,并作为表达重组蛋白质的工程菌进行HPV L1蛋白的表达。工程菌培养基为2YT培养基(10 g/L胰化蛋白胨;5 g/L酵母粉;10 g/L NaCl)。挑取含重组质粒的菌体单斑于10ml 2YT培养基(含100μg/ml氨苄青霉素)中,230转/分钟(rpm),37℃振荡培养过夜。转接5 ml过夜菌于500 ml(含100 μg/ml 氨苄青霉素)2YT液体培养基中,37℃震荡培养至重组工程菌生长至OD600nm≈0.4~1时,加入终浓度0.2mM的IPTG诱导,在28℃的条件下进行6h以上重组蛋白质的诱导表达。
细胞收集及破碎:对发酵培养物进行离心,弃上清,收获菌体沉淀,称重;使用buffer L(pH 8.0,50 mM Tris,200 mM NaCl,5mM DTT)洗涤沉淀,然后将其重悬于bufferL中进行超声波破碎,随后通过高速离心机对破菌液进行离心(16000 rpm,30 min,4℃),收集上清液。
实施例8:重组HPV L1五聚体蛋白在大肠杆菌中表达量的检测
采用ELISA夹心法检测亲和层析上样前Tag-HPV L1五聚体蛋白在大肠杆菌中表达量,样品及供试品:
包被抗体:自制抗HPV33 L1小鼠单抗。
对照品:自制高纯度的HPV33 L1蛋白。
供试品:用样品稀释液将供试品Tag-HPV33 L1稀释至浓度在对照品梯度稀释浓度范围内。
酶标抗体:自制的辣根过氧化物酶标记的兔抗HPV33 L1蛋白多抗。
结果计算:计算平行孔的平均值,以对照品系列浓度OD450吸收值对其相应的L1蛋白抗原作直线方程,平行样品孔间变异系数不得大于10%,直线回归方程R2不得小于0.980,将供试品的OD450吸收值代入方程计算出稀释后供试品L1蛋白抗原含量,再乘以相应的稀释倍数即为供试品中L1蛋白抗原含量,见表1。
表1 检测表达后Tag-HPV L1蛋白抗原含量
Figure 547802DEST_PATH_IMAGE001
实施例9:重组HPV L1五聚体蛋白质亲和层析
带GST标签重组蛋白的亲和层析:亲和柱中装入GST琼脂糖亲和层析介质5ml,以buffer L(pH 8.0,50 mM Tris,200 mM NaCl,5mM DTT)平衡层析柱,然后上样实施例8中带有GST或GST-SUMO标签的蛋白液,完毕后以Buffer L洗至无蛋白质流出,亲和完毕。以5mLBuffer L悬浮亲和介质,取样检测并计算介质中结合L1蛋白质的总量。
带MBP标签重组蛋白的亲和层析:亲和柱中装入Amylose-Resin亲和层析介质5ml,以buffer L(pH 8.0,50 mM Tris,200 mM NaCl,5mM DTT)平衡层析柱,然后上样实施例8中带有MBP标签的蛋白液,完毕后以Buffer L洗至无蛋白质流出,亲和完毕。以5mL Buffer L悬浮亲和介质,取样检测并计算介质中结合L1蛋白质的总量。
带6*HIS标签重组蛋白的亲和层析:取5ml Ni-NTA凝胶装柱,在柱上缓慢加入10倍柱体积的平衡液(50mmol/L NaH2PO4,300mmol/L Nacl,20mmol/L imidazole,用NaOH调整PH值至8),以充分平衡Ni-NTA凝胶,流速为1ml/min。取实施例8中过滤后的带有6*His或6*His-SUMO标签的上清液,完全进入凝胶后,用10倍柱体积的平衡液继续洗涤凝胶,保存流速为1ml/min。用平衡液洗脱至无蛋白质流出,亲和完毕。取样检测并计算介质中结合L1蛋白质的总量。
实施例10:重组Tag-HPV L1蛋白质的酶切纯化
按照目的蛋白质与蛋白酶质量比100:1加入酶量,其中带有GST-HPV-L1的蛋白质用3C蛋白酶切,带有GST-SUMO-HPV-L1和6*His-SUMO-HPV-L1 的蛋白质用SENP1蛋白酶切,带有Mbp-HPV-L1的蛋白质用Factor Xa蛋白酶切,带有6*His-HPV-L1的蛋白质用Thrombin蛋白酶切,分别混合酶切2h后,分别洗脱收集各个蛋白酶切后所得的HPV33 L1五聚体蛋白质溶液。
将3C酶酶切GST标签后的L1蛋白质溶液用SDS- PAGE凝胶电泳检测,结果见图1亲和层析电泳结果,实验表明,可将90%的目的蛋白切下。图2为SENP1蛋白酶切带有GST-SUMO-HPV-L1的蛋白质,用SDS- PAGE凝胶电泳检测。图3为Factor Xa蛋白酶切带有Mbp-HPV-L1的蛋白质,用SDS- PAGE凝胶电泳检测。图1-图3说明说明得到了55kDa 的HPV33 L1蛋白。
Thrombin蛋白酶没有切开6*His-HPV-L1的蛋白质;用SENP1酶切6*His-SUMO-L1的蛋白质溶液用SDS- PAGE凝胶电泳检测,结果见图4,显示SENP1蛋白酶能切开带有6*His-SUMO标签的溶合蛋白。
实施例11:重组HPV L1五聚体蛋白质的纯化
分子筛色谱纯化:将上一个实施例收集的酶切纯化后的HPV33 L1五聚体蛋白质分别进行纯化,可先经过离子交换色谱收集的HPV33 L1五聚体蛋白质,或不经过离子交换步骤直接用Superdex200(GE公司生产)的凝胶过滤介质进行进一步分子筛层析,分子筛流动相为pH8.0,10 mM Tris,100 mM NaCl,收集HPV33 L1五聚体蛋白质紫外吸收峰的馏分。
纯化后测定样品纯度:将收集的蛋白质溶液取样用SDS- PAGE凝胶电泳检测,目的蛋白质HPV33 L1五聚体经过分子筛层析纯化后最终纯度均大于98%,详见图5,经过分子筛色谱纯化后的重组HPV33 L1五聚体蛋白质SDS-PAGE凝胶电泳图。
测定样品蛋白浓度:用Bradford法进行蛋白浓度检测,使用标样2mg/ml BAS配制从100ug/µl稀释到500ug/µl,样品反应体系取10µl稀释的BSA+200µlBradford工作液:标准曲线为y = 0.0013 x - 0.0294 ,R² = 0.9986 ,测定样品的 OD595,代入标准曲线,计算样品的蛋白浓度,结果见表2。
表2 Bradford法检测重组HPV33 L1五聚体蛋白浓度
Figure 996101DEST_PATH_IMAGE002
注:样品组1为GST-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液;样品组2为GST-SUMO-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液;样品组3为Mbp-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液。
实施例12:重组HPV33 L1五聚体蛋白质组装成VLP
在置于如下盐浓度(NaCl)和pH值条件下,HPV L1五聚体溶液样品组1、2和3,放置稳定后,使用马尔文 Zetasizer NanoZS的动态光散射粒径仪,进行粒径及粒径分布测定(粒径分布系数PdI值为粒径分散度指标,小于0.05为高度均一的样品;0.05~0.1为准均一的样品,0.1~0.3为均一性较差的样品,大于0.3为不均一的样品),,HPV33 L1五聚体蛋白组装得到粒径均一的VLP(PdI<0.05)。
表3 不同pH和盐浓度条件下组装HPV33 L1 VLP的粒径检测
Figure 306997DEST_PATH_IMAGE003
注:样品组1为GST-HPV L1经分子筛纯化后得HPV L1 VLP蛋白溶液;样品组2为GST-SUMO-HPV L1经分子筛纯化后得HPV L1VLP蛋白溶液;样品组3为Mbp-HPV L1经分子筛纯化后得HPV L1VLP蛋白溶液。
实施例13:动态光散射(DLS)对L1五聚体和VLP蛋白质粒径测定
仪器为马尔文 Zetasizer NanoZS的动态光散射粒径仪,取各样品组最终制得的HPV33 L1五聚体和HPV33 L1 VLP蛋白质进行检测,测平均粒径和分散性指数PdI(表明蛋白质的均一性),说明各组样品最终制备的L1五聚体和VLP蛋白均一。其中样品组2最终制得的五聚体蛋白质和其组装获得的HPV33 L1 VLP蛋白质粒径分布详见附图6和7。
实施例14:HPV33 L1五聚体和VLP的制备
依据本发明上述实施例1-13所采用的技术,制备具有序列11,12,13的HPV33 L1蛋白,以上蛋白均可纯化得到纯度达到98%以上的蛋白,得到平均粒径10~15nm PdI<0.1的HPV33 L1五聚体蛋白。进一步组装得到平均粒径45~65nm PdI<0.1的HPV33 L1VLP蛋白。
实施例15:HPV33 L1 五聚体和VLP的形态学检测
透射电镜观察:将实施例中各个纯化获得的HPV33 L1五聚体蛋白质、组装获得的HPV33 L1-VLP蛋白质,通过中国科学院生物物理所利用透射电镜平台观察。冷冻样品制备及拍照流程:
1)将液氮盒装满液氮,待液面不沸腾时,将乙烷缓慢注入冷却的铜碗中,使之冷却为液态。
2)将铜网在PDC-32型等离子清洗器做亲水性处理。
3)在Vitrobot TM Mark IV冷冻样品制备设备中,将 3.5 μL 的五聚体及VLP样品吸附在 300目的 QUANTIFOIL 铜网中,吸水4s后,通过液态乙烷冷冻样品。
4)迅速将样品转移到液氮中保存。
5)收集冷冻照片时,电子剂量为 20 e-/Å2。数据通过300 KV 的 300 kV TitanKrios 透射电子显微镜的 Gatan UltraScan 4000 CCD记录。加速电压为300 kV。
结果显示,在HPV33 L1五聚体蛋白质样品组中,视野中可见大量直径与理论大小相符的10nm左右的五聚体蛋白;在HPV33 L1-VLP蛋白质样品组中,可见颗粒大小与理论相符的大量直径为50nm左右的病毒样颗粒(VLP),均匀一致。其中GST-SUMO标签组(样品组2)酶切纯化后HPV33 L1五聚体所得样品的透射电镜照片见附图8, Mbp标签组(样品组3)酶切纯化后再组装的VLP蛋白的透射电镜照片见附图9。
实施例16:HPV33 L1蛋白质原液纯度检测
分子排阻高效液相色谱测定:色谱柱Agilent Bio SEC-5um,2000Å,7.8×300mm,柱体积约15 m1,分子量范围≥l0,000kDa;以pH6.8 的0.1mol/L磷酸盐缓冲液(称取磷酸氢二钠25.8g,磷酸二氢钠4.37g,加超纯水使溶解,用磷酸调pH至6.8,超纯水定容成1000ml)为流动相;流速为1ml/min;检测波长280nm;柱温25℃,上样量不得小于20ug,样品主峰理论塔板数不低于1000,拖尾因子小于2.0,连续进样5针,峰面积的相对标准偏差不得大于3%。
取纯化后的样品2组最终制得的HPV33 L1五聚体和组装后的VLP的蛋白质原液,分别稀释浓度为1mg/ml,上样量20µl注入高压液相色谱仪,按照上述方法检测,按面积归一法计算纯度,所有处理蛋白质纯度均大于98%,结果见附图10和表4、附图11和表5。
表4 HPV33 L1五聚体的HPLC蛋白质纯度检测
Figure 233364DEST_PATH_IMAGE004
表5 HPV33 L1组装后VLP的HPLC蛋白质纯度检测
Figure 578895DEST_PATH_IMAGE005
实施例17:HPV VLP稳定性实验
将各个样品组最终制得的HPV33 VLP蛋白质在下表的缓冲液条件下,在25℃放置14天至28天,进行粒径检测,结果见下表,证明HPV33 VLP在pH 5.0至5.9,盐浓度500~2000mM下存放稳定。样品组3所得HPV33 VLP在pH 5.0至5.9,盐浓度500~2000mM下放置14-28天后检测结果详见如下表。
表6 HPV33 L1 VLP 在25℃下放置14-28天粒径检测结果
Figure 666937DEST_PATH_IMAGE006
实施例18:制备含有HPV L1 五聚体或VLP的单价疫苗
将含有各个样品组的HPV33 L1五聚体或VLP蛋白原液分别与氢氧化铝佐剂生理盐水溶液按照蛋白与铝含量1:10比例进行吸附配制即可制得重组HPV L1蛋白质五聚体或VLP疫苗,在4℃保存待用。
实施例19:HPV L1 五聚体和VLP的免疫原性测定
分别取上述L1五聚体或VLP疫苗,加入灭菌过的生理盐水分别稀释成20μg/ml浓度的五聚体或VLP蛋白疫苗,以每只0.1ml肌肉注射BALB/c小鼠,每组10只。小鼠每4周加强免疫一次,共免疫2次。加强免疫4周后,采用假病毒细胞中和实验法分别测定每次免疫后的小鼠血清中针对同型HPV的中和抗体滴度,结果如附图12、13所示。
结果表明,HPV L1五聚体和VLP蛋白疫苗接种小鼠,二次免疫后4周中和抗体即可达到很高的水平。实验结果证明,HPV L1五聚体和组装的VLP疫苗均可以在动物体内产生中和抗体,说明HPV L1五聚体和VLP蛋白质疫苗在人体临床试验中都具有免疫原性,即能预防HPV同型病毒引起的疾病。
SEQUENCE LISTING
<110> 北京康乐卫士生物技术股份有限公司
<120> 33型重组人乳头瘤病毒病毒样颗粒及其制备方法
<130> 2015
<160> 13
<170> PatentIn version 3.3
<210> 1
<211> 1500
<212> DNA
<213> 人工序列
<400> 1
atgtccgtgt ggcggcctag tgaggccaca gtgtacctgc ctcctgtacc tgtatctaaa 60
gttgtcagca ctgatgaata tgtgtctcgc acaagcattt attattatgc tggtagttcc 120
agacttcttg ctgttggcca tccatatttt tctattaaaa atcctaataa cgctaaaaaa 180
ttattggtac ccaaagtatc aggcttgcaa tatagggttt ttagggtccg tttaccagat 240
cctaataaat ttggatttcc tgacacctcc ttttataacc ctgatacaca acgattagta 300
tgggcatgtg taggccttga aataggtaga gggcagccat taggcgttgg cataagtggt 360
catcctttat taaacaaatt tgatgacact gaaaccagta acaagtatcc tggacaaccg 420
ggtgctgata atagggaatg tttatccatg gattataaac aaacacagtt atgtttactt 480
ggatgtaagc ctccaacagg ggaacattgg ggtaaaggtg ttgcttgtac taatgcagca 540
cctgccaatg attgtccacc tttagaactt ataaatacta ttattgagga tggtgatatg 600
gtggacacag gatttggttg catggatttt aaaacattgc aggctaataa aagtgatgtt 660
cctattgata tttgtggcag tacatgcaaa tatccagatt atttaaaaat gactagtgag 720
ccttatggtg atagtttatt tttctttctt cgacgtgaac aaatgtttgt aagacacttt 780
tttaataggg ctggtaaatt aggagaggct gttcccgatg acctgtacat taaaggttca 840
ggaactactg cctctattca aagcagtgct ttttttccca ctcccagtgg atcaatggtt 900
acttccgaat ctcagttatt taataagcca tattggctac aacgtgcaca aggtcataat 960
aatggtattt gttggggcaa tcaggtattt gttactgtgg tagataccac tcgcagtact 1020
aatatgactt tatgcacaca agtaactagt gacagtacat ataaaaatga gaattttaaa 1080
gaatatataa gacatgttga agaatatgat ctacagtttg tttttcaact atgcaaagtt 1140
accttaactg cagaagttat gacatatatt catgctatga atccagatat tttagaagat 1200
tggcaatttg gtttaacacc tcctccatct gctagtttac aggataccta taggtttgtt 1260
acctctcagg ctattacgtg tcaaaaaaca gtacctccaa aggaaaagga agacccctta 1320
ggtaaatata cattttggga agtggattta aaggaaaaat tttcagcaga tttagatcag 1380
tttcctttgg gacgcaagtt tttattacag gcaggtctta aagcaaaacc taaacttaaa 1440
cgtgcagccc ccacatccac ccgcacatcg tctgcaaaac gcaaaaaggt taaaaaataa 1500
<210> 2
<211> 1500
<212> DNA
<213> 人工序列
<400> 2
atgtctgttt ggcgtccgtc tgaagctacc gtttacctgc cgccggttcc ggtttctaaa 60
gttgtttcta ccgacgaata cgtttctcgt acctctatct actactacgc tggttcttct 120
cgtctgctgg ctgttggtca cccgtacttc tctatcaaaa acccgaacaa cgctaaaaaa 180
ctgctggttc cgaaagtttc tggtctgcag taccgtgttt tccgtgttcg tctgccggac 240
ccgaacaaat tcggtttccc ggacacctct ttctacaacc cggacaccca gcgtctggtt 300
tgggcttgcg ttggtctgga aatcggtcgt ggtcagccgc tgggtgttgg tatctctggt 360
cacccgctgc tgaacaaatt cgacgacacc gaaacctcta acaaataccc gggtcagccg 420
ggtgctgaca accgtgaatg cctgtctatg gactacaaac agacccagct gtgcctgctg 480
ggttgcaaac cgccgaccgg tgaacactgg ggtaaaggtg ttgcttgcac caacgctgct 540
ccggctaacg actgcccgcc gctggaactg atcaacacca tcatcgaaga cggtgacatg 600
gttgacaccg gtttcggttg catggacttc aaaaccctgc aggctaacaa atctgacgtt 660
ccgatcgaca tctgcggttc tacctgcaaa tacccggact acctgaaaat gacctctgaa 720
ccgtacggtg actctctgtt cttcttcctg cgtcgtgaac agatgttcgt tcgtcacttc 780
ttcaaccgtg ctggtaaact gggtgaagct gttccggacg acctgtacat caaaggttct 840
ggtaccaccg cttctatcca gtcttctgct ttcttcccga ccccgtctgg ttctatggtt 900
acctctgaat ctcagctgtt caacaaaccg tactggctgc agcgtgctca gggtcacaac 960
aacggtatct gctggggtaa ccaggttttc gttaccgttg ttgacaccac ccgttctacc 1020
aacatgaccc tgtgcaccca ggttacctct gactctacct acaaaaacga aaacttcaaa 1080
gaatacatcc gtcacgttga agaatacgac ctgcagttcg ttttccagct gtgcaaagtt 1140
accctgaccg ctgaagttat gacctacatc cacgctatga acccggacat cctggaagac 1200
tggcagttcg gtctgacccc gccgccgtct gcttctctgc aggacaccta ccgtttcgtt 1260
acctctcagg ctatcacctg ccagaaaacc gttccgccga aagaaaaaga agacccgctg 1320
ggtaaataca ccttctggga agttgacctg aaagaaaaat tctctgctga cctggaccag 1380
ttcccgctgg gtcgtaaatt cctgctgcag gctggtctga aagctaaacc gaaactgaaa 1440
cgtgctgctc cgacctctac ccgtacctct tctgctaaac gtaaaaaagt taaaaaatag 1500
<210> 3
<211> 2193
<212> DNA
<213> 人工序列
<400> 3
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggaagttc tgttccaggg gcccctggga tccatgtctg tttggcgtcc gtctgaagct 720
accgtttacc tgccgccggt tccggtttct aaagttgttt ctaccgacga atacgtttct 780
cgtacctcta tctactacta cgctggttct tctcgtctgc tggctgttgg tcacccgtac 840
ttctctatca aaaacccgaa caacgctaaa aaactgctgg ttccgaaagt ttctggtctg 900
cagtaccgtg ttttccgtgt tcgtctgccg gacccgaaca aattcggttt cccggacacc 960
tctttctaca acccggacac ccagcgtctg gtttgggctt gcgttggtct ggaaatcggt 1020
cgtggtcagc cgctgggtgt tggtatctct ggtcacccgc tgctgaacaa attcgacgac 1080
accgaaacct ctaacaaata cccgggtcag ccgggtgctg acaaccgtga atgcctgtct 1140
atggactaca aacagaccca gctgtgcctg ctgggttgca aaccgccgac cggtgaacac 1200
tggggtaaag gtgttgcttg caccaacgct gctccggcta acgactgccc gccgctggaa 1260
ctgatcaaca ccatcatcga agacggtgac atggttgaca ccggtttcgg ttgcatggac 1320
ttcaaaaccc tgcaggctaa caaatctgac gttccgatcg acatctgcgg ttctacctgc 1380
aaatacccgg actacctgaa aatgacctct gaaccgtacg gtgactctct gttcttcttc 1440
ctgcgtcgtg aacagatgtt cgttcgtcac ttcttcaacc gtgctggtaa actgggtgaa 1500
gctgttccgg acgacctgta catcaaaggt tctggtacca ccgcttctat ccagtcttct 1560
gctttcttcc cgaccccgtc tggttctatg gttacctctg aatctcagct gttcaacaaa 1620
ccgtactggc tgcagcgtgc tcagggtcac aacaacggta tctgctgggg taaccaggtt 1680
ttcgttaccg ttgttgacac cacccgttct accaacatga ccctgtgcac ccaggttacc 1740
tctgactcta cctacaaaaa cgaaaacttc aaagaataca tccgtcacgt tgaagaatac 1800
gacctgcagt tcgttttcca gctgtgcaaa gttaccctga ccgctgaagt tatgacctac 1860
atccacgcta tgaacccgga catcctggaa gactggcagt tcggtctgac cccgccgccg 1920
tctgcttctc tgcaggacac ctaccgtttc gttacctctc aggctatcac ctgccagaaa 1980
accgttccgc cgaaagaaaa agaagacccg ctgggtaaat acaccttctg ggaagttgac 2040
ctgaaagaaa aattctctgc tgacctggac cagttcccgc tgggtcgtaa attcctgctg 2100
caggctggtc tgaaagctaa accgaaactg aaacgtgctg ctccgacctc tacccgtacc 2160
tcttctgcta aacgtaaaaa agttaaaaaa tag 2193
<210> 4
<211> 2475
<212> DNA
<213> 人工序列
<400> 4
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggaagttc tgttccaggg gccctctgac caggaagcta aaccgtctac cgaagacctg 720
ggtgacaaaa aagaaggtga atacatcaaa ctgaaagtta tcggtcagga ctcttctgaa 780
atccacttca aagttaaaat gaccacccac ctgaaaaaac tgaaagaatc ttactgccag 840
cgtcagggtg ttccgatgaa ctctctgcgt ttcctgttcg aaggtcagcg tatcgctgac 900
aaccacaccc cgaaagaact gggtatggaa gaagaagacg ttatcgaagt ttaccaggaa 960
cagaccggtg gatccatgtc tgtttggcgt ccgtctgaag ctaccgttta cctgccgccg 1020
gttccggttt ctaaagttgt ttctaccgac gaatacgttt ctcgtacctc tatctactac 1080
tacgctggtt cttctcgtct gctggctgtt ggtcacccgt acttctctat caaaaacccg 1140
aacaacgcta aaaaactgct ggttccgaaa gtttctggtc tgcagtaccg tgttttccgt 1200
gttcgtctgc cggacccgaa caaattcggt ttcccggaca cctctttcta caacccggac 1260
acccagcgtc tggtttgggc ttgcgttggt ctggaaatcg gtcgtggtca gccgctgggt 1320
gttggtatct ctggtcaccc gctgctgaac aaattcgacg acaccgaaac ctctaacaaa 1380
tacccgggtc agccgggtgc tgacaaccgt gaatgcctgt ctatggacta caaacagacc 1440
cagctgtgcc tgctgggttg caaaccgccg accggtgaac actggggtaa aggtgttgct 1500
tgcaccaacg ctgctccggc taacgactgc ccgccgctgg aactgatcaa caccatcatc 1560
gaagacggtg acatggttga caccggtttc ggttgcatgg acttcaaaac cctgcaggct 1620
aacaaatctg acgttccgat cgacatctgc ggttctacct gcaaataccc ggactacctg 1680
aaaatgacct ctgaaccgta cggtgactct ctgttcttct tcctgcgtcg tgaacagatg 1740
ttcgttcgtc acttcttcaa ccgtgctggt aaactgggtg aagctgttcc ggacgacctg 1800
tacatcaaag gttctggtac caccgcttct atccagtctt ctgctttctt cccgaccccg 1860
tctggttcta tggttacctc tgaatctcag ctgttcaaca aaccgtactg gctgcagcgt 1920
gctcagggtc acaacaacgg tatctgctgg ggtaaccagg ttttcgttac cgttgttgac 1980
accacccgtt ctaccaacat gaccctgtgc acccaggtta cctctgactc tacctacaaa 2040
aacgaaaact tcaaagaata catccgtcac gttgaagaat acgacctgca gttcgttttc 2100
cagctgtgca aagttaccct gaccgctgaa gttatgacct acatccacgc tatgaacccg 2160
gacatcctgg aagactggca gttcggtctg accccgccgc cgtctgcttc tctgcaggac 2220
acctaccgtt tcgttacctc tcaggctatc acctgccaga aaaccgttcc gccgaaagaa 2280
aaagaagacc cgctgggtaa atacaccttc tgggaagttg acctgaaaga aaaattctct 2340
gctgacctgg accagttccc gctgggtcgt aaattcctgc tgcaggctgg tctgaaagct 2400
aaaccgaaac tgaaacgtgc tgctccgacc tctacccgta cctcttctgc taaacgtaaa 2460
aaagttaaaa aatag 2475
<210> 5
<211> 2673
<212> DNA
<213> 人工序列
<400> 5
atgaaaatcg aagaaggtaa actggtaatc tggattaacg gcgataaagg ctataacggt 60
ctcgctgaag tcggtaagaa attcgagaaa gataccggaa ttaaagtcac cgttgagcat 120
ccggataaac tggaagagaa attcccacag gttgcggcaa ctggcgatgg ccctgacatt 180
atcttctggg cacacgaccg ctttggtggc tacgctcaat ctggcctgtt ggctgaaatc 240
accccggaca aagcgttcca ggacaagctg tatccgttta cctgggatgc cgtacgttac 300
aacggcaagc tgattgctta cccgatcgct gttgaagcgt tatcgctgat ttataacaaa 360
gatctgctgc cgaacccgcc aaaaacctgg gaagagatcc cggcgctgga taaagaactg 420
aaagcgaaag gtaagagcgc gctgatgttc aacctgcaag aaccgtactt cacctggccg 480
ctgattgctg ctgacggggg ttatgcgttc aagtatgaaa acggcaagta cgacattaaa 540
gacgtgggcg tggataacgc tggcgcgaaa gcgggtctga ccttcctggt tgacctgatt 600
aaaaacaaac acatgaatgc agacaccgat tactccatcg cagaagctgc ctttaataaa 660
ggcgaaacag cgatgaccat caacggcccg tgggcatggt ccaacatcga caccagcaaa 720
gtgaattatg gtgtaacggt actgccgacc ttcaagggtc aaccatccaa accgttcgtt 780
ggcgtgctga gcgcaggtat taacgccgcc agtccgaaca aagagctggc aaaagagttc 840
ctcgaaaact atctgctgac tgatgaaggt ctggaagcgg ttaataaaga caaaccgctg 900
ggtgccgtag cgctgaagtc ttacgaggaa gagttggcga aagatccacg tattgccgcc 960
actatggaaa acgcccagaa aggtgaaatc atgccgaaca tcccgcagat gtccgctttc 1020
tggtatgccg tgcgtactgc ggtgatcaac gccgccagcg gtcgtcagac tgtcgatgaa 1080
gccctgaaag acgcgcagac taattcgagc tcgaacaaca acaacaataa caataacaac 1140
aacctcggga tcgagggaag gatttcagaa ttcatgtctg tttggcgtcc gtctgaagct 1200
accgtttacc tgccgccggt tccggtttct aaagttgttt ctaccgacga atacgtttct 1260
cgtacctcta tctactacta cgctggttct tctcgtctgc tggctgttgg tcacccgtac 1320
ttctctatca aaaacccgaa caacgctaaa aaactgctgg ttccgaaagt ttctggtctg 1380
cagtaccgtg ttttccgtgt tcgtctgccg gacccgaaca aattcggttt cccggacacc 1440
tctttctaca acccggacac ccagcgtctg gtttgggctt gcgttggtct ggaaatcggt 1500
cgtggtcagc cgctgggtgt tggtatctct ggtcacccgc tgctgaacaa attcgacgac 1560
accgaaacct ctaacaaata cccgggtcag ccgggtgctg acaaccgtga atgcctgtct 1620
atggactaca aacagaccca gctgtgcctg ctgggttgca aaccgccgac cggtgaacac 1680
tggggtaaag gtgttgcttg caccaacgct gctccggcta acgactgccc gccgctggaa 1740
ctgatcaaca ccatcatcga agacggtgac atggttgaca ccggtttcgg ttgcatggac 1800
ttcaaaaccc tgcaggctaa caaatctgac gttccgatcg acatctgcgg ttctacctgc 1860
aaatacccgg actacctgaa aatgacctct gaaccgtacg gtgactctct gttcttcttc 1920
ctgcgtcgtg aacagatgtt cgttcgtcac ttcttcaacc gtgctggtaa actgggtgaa 1980
gctgttccgg acgacctgta catcaaaggt tctggtacca ccgcttctat ccagtcttct 2040
gctttcttcc cgaccccgtc tggttctatg gttacctctg aatctcagct gttcaacaaa 2100
ccgtactggc tgcagcgtgc tcagggtcac aacaacggta tctgctgggg taaccaggtt 2160
ttcgttaccg ttgttgacac cacccgttct accaacatga ccctgtgcac ccaggttacc 2220
tctgactcta cctacaaaaa cgaaaacttc aaagaataca tccgtcacgt tgaagaatac 2280
gacctgcagt tcgttttcca gctgtgcaaa gttaccctga ccgctgaagt tatgacctac 2340
atccacgcta tgaacccgga catcctggaa gactggcagt tcggtctgac cccgccgccg 2400
tctgcttctc tgcaggacac ctaccgtttc gttacctctc aggctatcac ctgccagaaa 2460
accgttccgc cgaaagaaaa agaagacccg ctgggtaaat acaccttctg ggaagttgac 2520
ctgaaagaaa aattctctgc tgacctggac cagttcccgc tgggtcgtaa attcctgctg 2580
caggctggtc tgaaagctaa accgaaactg aaacgtgctg ctccgacctc tacccgtacc 2640
tcttctgcta aacgtaaaaa agttaaaaaa tag 2673
<210> 6
<211> 1563
<212> DNA
<213> 人工序列
<400> 6
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atgatgtctg tttggcgtcc gtctgaagct accgtttacc tgccgccggt tccggtttct 120
aaagttgttt ctaccgacga atacgtttct cgtacctcta tctactacta cgctggttct 180
tctcgtctgc tggctgttgg tcacccgtac ttctctatca aaaacccgaa caacgctaaa 240
aaactgctgg ttccgaaagt ttctggtctg cagtaccgtg ttttccgtgt tcgtctgccg 300
gacccgaaca aattcggttt cccggacacc tctttctaca acccggacac ccagcgtctg 360
gtttgggctt gcgttggtct ggaaatcggt cgtggtcagc cgctgggtgt tggtatctct 420
ggtcacccgc tgctgaacaa attcgacgac accgaaacct ctaacaaata cccgggtcag 480
ccgggtgctg acaaccgtga atgcctgtct atggactaca aacagaccca gctgtgcctg 540
ctgggttgca aaccgccgac cggtgaacac tggggtaaag gtgttgcttg caccaacgct 600
gctccggcta acgactgccc gccgctggaa ctgatcaaca ccatcatcga agacggtgac 660
atggttgaca ccggtttcgg ttgcatggac ttcaaaaccc tgcaggctaa caaatctgac 720
gttccgatcg acatctgcgg ttctacctgc aaatacccgg actacctgaa aatgacctct 780
gaaccgtacg gtgactctct gttcttcttc ctgcgtcgtg aacagatgtt cgttcgtcac 840
ttcttcaacc gtgctggtaa actgggtgaa gctgttccgg acgacctgta catcaaaggt 900
tctggtacca ccgcttctat ccagtcttct gctttcttcc cgaccccgtc tggttctatg 960
gttacctctg aatctcagct gttcaacaaa ccgtactggc tgcagcgtgc tcagggtcac 1020
aacaacggta tctgctgggg taaccaggtt ttcgttaccg ttgttgacac cacccgttct 1080
accaacatga ccctgtgcac ccaggttacc tctgactcta cctacaaaaa cgaaaacttc 1140
aaagaataca tccgtcacgt tgaagaatac gacctgcagt tcgttttcca gctgtgcaaa 1200
gttaccctga ccgctgaagt tatgacctac atccacgcta tgaacccgga catcctggaa 1260
gactggcagt tcggtctgac cccgccgccg tctgcttctc tgcaggacac ctaccgtttc 1320
gttacctctc aggctatcac ctgccagaaa accgttccgc cgaaagaaaa agaagacccg 1380
ctgggtaaat acaccttctg ggaagttgac ctgaaagaaa aattctctgc tgacctggac 1440
cagttcccgc tgggtcgtaa attcctgctg caggctggtc tgaaagctaa accgaaactg 1500
aaacgtgctg ctccgacctc tacccgtacc tcttctgcta aacgtaaaaa agttaaaaaa 1560
tag 1563
<210> 7
<211> 1854
<212> DNA
<213> 人工序列
<400> 7
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atgtctgacc aggaagctaa accgtctacc gaagacctgg gtgacaaaaa agaaggtgaa 120
tacatcaaac tgaaagttat cggtcaggac tcttctgaaa tccacttcaa agttaaaatg 180
accacccacc tgaaaaaact gaaagaatct tactgccagc gtcagggtgt tccgatgaac 240
tctctgcgtt tcctgttcga aggtcagcgt atcgctgaca accacacccc gaaagaactg 300
ggtatggaag aagaagacgt tatcgaagtt taccaggaac agaccggtgg atccatgtct 360
gtttggcgtc cgtctgaagc taccgtttac ctgccgccgg ttccggtttc taaagttgtt 420
tctaccgacg aatacgtttc tcgtacctct atctactact acgctggttc ttctcgtctg 480
ctggctgttg gtcacccgta cttctctatc aaaaacccga acaacgctaa aaaactgctg 540
gttccgaaag tttctggtct gcagtaccgt gttttccgtg ttcgtctgcc ggacccgaac 600
aaattcggtt tcccggacac ctctttctac aacccggaca cccagcgtct ggtttgggct 660
tgcgttggtc tggaaatcgg tcgtggtcag ccgctgggtg ttggtatctc tggtcacccg 720
ctgctgaaca aattcgacga caccgaaacc tctaacaaat acccgggtca gccgggtgct 780
gacaaccgtg aatgcctgtc tatggactac aaacagaccc agctgtgcct gctgggttgc 840
aaaccgccga ccggtgaaca ctggggtaaa ggtgttgctt gcaccaacgc tgctccggct 900
aacgactgcc cgccgctgga actgatcaac accatcatcg aagacggtga catggttgac 960
accggtttcg gttgcatgga cttcaaaacc ctgcaggcta acaaatctga cgttccgatc 1020
gacatctgcg gttctacctg caaatacccg gactacctga aaatgacctc tgaaccgtac 1080
ggtgactctc tgttcttctt cctgcgtcgt gaacagatgt tcgttcgtca cttcttcaac 1140
cgtgctggta aactgggtga agctgttccg gacgacctgt acatcaaagg ttctggtacc 1200
accgcttcta tccagtcttc tgctttcttc ccgaccccgt ctggttctat ggttacctct 1260
gaatctcagc tgttcaacaa accgtactgg ctgcagcgtg ctcagggtca caacaacggt 1320
atctgctggg gtaaccaggt tttcgttacc gttgttgaca ccacccgttc taccaacatg 1380
accctgtgca cccaggttac ctctgactct acctacaaaa acgaaaactt caaagaatac 1440
atccgtcacg ttgaagaata cgacctgcag ttcgttttcc agctgtgcaa agttaccctg 1500
accgctgaag ttatgaccta catccacgct atgaacccgg acatcctgga agactggcag 1560
ttcggtctga ccccgccgcc gtctgcttct ctgcaggaca cctaccgttt cgttacctct 1620
caggctatca cctgccagaa aaccgttccg ccgaaagaaa aagaagaccc gctgggtaaa 1680
tacaccttct gggaagttga cctgaaagaa aaattctctg ctgacctgga ccagttcccg 1740
ctgggtcgta aattcctgct gcaggctggt ctgaaagcta aaccgaaact gaaacgtgct 1800
gctccgacct ctacccgtac ctcttctgct aaacgtaaaa aagttaaaaa atag 1854
<210> 8
<211> 730
<212> PRT
<213> 人工序列
<400> 8
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Glu Val Leu
210 215 220
Phe Gln Gly Pro Leu Gly Ser Met Ser Val Trp Arg Pro Ser Glu Ala
225 230 235 240
Thr Val Tyr Leu Pro Pro Val Pro Val Ser Lys Val Val Ser Thr Asp
245 250 255
Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg
260 265 270
Leu Leu Ala Val Gly His Pro Tyr Phe Ser Ile Lys Asn Pro Asn Asn
275 280 285
Ala Lys Lys Leu Leu Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val
290 295 300
Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr
305 310 315 320
Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu Val Trp Ala Cys Val Gly
325 330 335
Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His
340 345 350
Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu Thr Ser Asn Lys Tyr Pro
355 360 365
Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys Leu Ser Met Asp Tyr Lys
370 375 380
Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Thr Gly Glu His
385 390 395 400
Trp Gly Lys Gly Val Ala Cys Thr Asn Ala Ala Pro Ala Asn Asp Cys
405 410 415
Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile Glu Asp Gly Asp Met Val
420 425 430
Asp Thr Gly Phe Gly Cys Met Asp Phe Lys Thr Leu Gln Ala Asn Lys
435 440 445
Ser Asp Val Pro Ile Asp Ile Cys Gly Ser Thr Cys Lys Tyr Pro Asp
450 455 460
Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly Asp Ser Leu Phe Phe Phe
465 470 475 480
Leu Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ala Gly
485 490 495
Lys Leu Gly Glu Ala Val Pro Asp Asp Leu Tyr Ile Lys Gly Ser Gly
500 505 510
Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe Phe Pro Thr Pro Ser Gly
515 520 525
Ser Met Val Thr Ser Glu Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu
530 535 540
Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln Val
545 550 555 560
Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Thr Leu Cys
565 570 575
Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys Asn Glu Asn Phe Lys Glu
580 585 590
Tyr Ile Arg His Val Glu Glu Tyr Asp Leu Gln Phe Val Phe Gln Leu
595 600 605
Cys Lys Val Thr Leu Thr Ala Glu Val Met Thr Tyr Ile His Ala Met
610 615 620
Asn Pro Asp Ile Leu Glu Asp Trp Gln Phe Gly Leu Thr Pro Pro Pro
625 630 635 640
Ser Ala Ser Leu Gln Asp Thr Tyr Arg Phe Val Thr Ser Gln Ala Ile
645 650 655
Thr Cys Gln Lys Thr Val Pro Pro Lys Glu Lys Glu Asp Pro Leu Gly
660 665 670
Lys Tyr Thr Phe Trp Glu Val Asp Leu Lys Glu Lys Phe Ser Ala Asp
675 680 685
Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu
690 695 700
Lys Ala Lys Pro Lys Leu Lys Arg Ala Ala Pro Thr Ser Thr Arg Thr
705 710 715 720
Ser Ser Ala Lys Arg Lys Lys Val Lys Lys
725 730
<210> 9
<211> 824
<212> PRT
<213> 人工序列
<400> 9
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Glu Val Leu
210 215 220
Phe Gln Gly Pro Ser Asp Gln Glu Ala Lys Pro Ser Thr Glu Asp Leu
225 230 235 240
Gly Asp Lys Lys Glu Gly Glu Tyr Ile Lys Leu Lys Val Ile Gly Gln
245 250 255
Asp Ser Ser Glu Ile His Phe Lys Val Lys Met Thr Thr His Leu Lys
260 265 270
Lys Leu Lys Glu Ser Tyr Cys Gln Arg Gln Gly Val Pro Met Asn Ser
275 280 285
Leu Arg Phe Leu Phe Glu Gly Gln Arg Ile Ala Asp Asn His Thr Pro
290 295 300
Lys Glu Leu Gly Met Glu Glu Glu Asp Val Ile Glu Val Tyr Gln Glu
305 310 315 320
Gln Thr Gly Gly Ser Met Ser Val Trp Arg Pro Ser Glu Ala Thr Val
325 330 335
Tyr Leu Pro Pro Val Pro Val Ser Lys Val Val Ser Thr Asp Glu Tyr
340 345 350
Val Ser Arg Thr Ser Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg Leu Leu
355 360 365
Ala Val Gly His Pro Tyr Phe Ser Ile Lys Asn Pro Asn Asn Ala Lys
370 375 380
Lys Leu Leu Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val Phe Arg
385 390 395 400
Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr Ser Phe
405 410 415
Tyr Asn Pro Asp Thr Gln Arg Leu Val Trp Ala Cys Val Gly Leu Glu
420 425 430
Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro Leu
435 440 445
Leu Asn Lys Phe Asp Asp Thr Glu Thr Ser Asn Lys Tyr Pro Gly Gln
450 455 460
Pro Gly Ala Asp Asn Arg Glu Cys Leu Ser Met Asp Tyr Lys Gln Thr
465 470 475 480
Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Thr Gly Glu His Trp Gly
485 490 495
Lys Gly Val Ala Cys Thr Asn Ala Ala Pro Ala Asn Asp Cys Pro Pro
500 505 510
Leu Glu Leu Ile Asn Thr Ile Ile Glu Asp Gly Asp Met Val Asp Thr
515 520 525
Gly Phe Gly Cys Met Asp Phe Lys Thr Leu Gln Ala Asn Lys Ser Asp
530 535 540
Val Pro Ile Asp Ile Cys Gly Ser Thr Cys Lys Tyr Pro Asp Tyr Leu
545 550 555 560
Lys Met Thr Ser Glu Pro Tyr Gly Asp Ser Leu Phe Phe Phe Leu Arg
565 570 575
Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ala Gly Lys Leu
580 585 590
Gly Glu Ala Val Pro Asp Asp Leu Tyr Ile Lys Gly Ser Gly Thr Thr
595 600 605
Ala Ser Ile Gln Ser Ser Ala Phe Phe Pro Thr Pro Ser Gly Ser Met
610 615 620
Val Thr Ser Glu Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu Gln Arg
625 630 635 640
Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln Val Phe Val
645 650 655
Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Thr Leu Cys Thr Gln
660 665 670
Val Thr Ser Asp Ser Thr Tyr Lys Asn Glu Asn Phe Lys Glu Tyr Ile
675 680 685
Arg His Val Glu Glu Tyr Asp Leu Gln Phe Val Phe Gln Leu Cys Lys
690 695 700
Val Thr Leu Thr Ala Glu Val Met Thr Tyr Ile His Ala Met Asn Pro
705 710 715 720
Asp Ile Leu Glu Asp Trp Gln Phe Gly Leu Thr Pro Pro Pro Ser Ala
725 730 735
Ser Leu Gln Asp Thr Tyr Arg Phe Val Thr Ser Gln Ala Ile Thr Cys
740 745 750
Gln Lys Thr Val Pro Pro Lys Glu Lys Glu Asp Pro Leu Gly Lys Tyr
755 760 765
Thr Phe Trp Glu Val Asp Leu Lys Glu Lys Phe Ser Ala Asp Leu Asp
770 775 780
Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu Lys Ala
785 790 795 800
Lys Pro Lys Leu Lys Arg Ala Ala Pro Thr Ser Thr Arg Thr Ser Ser
805 810 815
Ala Lys Arg Lys Lys Val Lys Lys
820
<210> 10
<211> 890
<212> PRT
<213> 人工序列
<400> 10
Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys
1 5 10 15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr
20 25 30
Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe
35 40 45
Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala
50 55 60
His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile
65 70 75 80
Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp
85 90 95
Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu
100 105 110
Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys
115 120 125
Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly
130 135 140
Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro
145 150 155 160
Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys
165 170 175
Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly
180 185 190
Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp
195 200 205
Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala
210 215 220
Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys
225 230 235 240
Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser
245 250 255
Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro
260 265 270
Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp
275 280 285
Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala
290 295 300
Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala
305 310 315 320
Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln
325 330 335
Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala
340 345 350
Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Asn
355 360 365
Ser Ser Ser Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Leu Gly Ile
370 375 380
Glu Gly Arg Ile Ser Glu Phe Met Ser Val Trp Arg Pro Ser Glu Ala
385 390 395 400
Thr Val Tyr Leu Pro Pro Val Pro Val Ser Lys Val Val Ser Thr Asp
405 410 415
Glu Tyr Val Ser Arg Thr Ser Ile Tyr Tyr Tyr Ala Gly Ser Ser Arg
420 425 430
Leu Leu Ala Val Gly His Pro Tyr Phe Ser Ile Lys Asn Pro Asn Asn
435 440 445
Ala Lys Lys Leu Leu Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val
450 455 460
Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr
465 470 475 480
Ser Phe Tyr Asn Pro Asp Thr Gln Arg Leu Val Trp Ala Cys Val Gly
485 490 495
Leu Glu Ile Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His
500 505 510
Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu Thr Ser Asn Lys Tyr Pro
515 520 525
Gly Gln Pro Gly Ala Asp Asn Arg Glu Cys Leu Ser Met Asp Tyr Lys
530 535 540
Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Thr Gly Glu His
545 550 555 560
Trp Gly Lys Gly Val Ala Cys Thr Asn Ala Ala Pro Ala Asn Asp Cys
565 570 575
Pro Pro Leu Glu Leu Ile Asn Thr Ile Ile Glu Asp Gly Asp Met Val
580 585 590
Asp Thr Gly Phe Gly Cys Met Asp Phe Lys Thr Leu Gln Ala Asn Lys
595 600 605
Ser Asp Val Pro Ile Asp Ile Cys Gly Ser Thr Cys Lys Tyr Pro Asp
610 615 620
Tyr Leu Lys Met Thr Ser Glu Pro Tyr Gly Asp Ser Leu Phe Phe Phe
625 630 635 640
Leu Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ala Gly
645 650 655
Lys Leu Gly Glu Ala Val Pro Asp Asp Leu Tyr Ile Lys Gly Ser Gly
660 665 670
Thr Thr Ala Ser Ile Gln Ser Ser Ala Phe Phe Pro Thr Pro Ser Gly
675 680 685
Ser Met Val Thr Ser Glu Ser Gln Leu Phe Asn Lys Pro Tyr Trp Leu
690 695 700
Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln Val
705 710 715 720
Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Thr Leu Cys
725 730 735
Thr Gln Val Thr Ser Asp Ser Thr Tyr Lys Asn Glu Asn Phe Lys Glu
740 745 750
Tyr Ile Arg His Val Glu Glu Tyr Asp Leu Gln Phe Val Phe Gln Leu
755 760 765
Cys Lys Val Thr Leu Thr Ala Glu Val Met Thr Tyr Ile His Ala Met
770 775 780
Asn Pro Asp Ile Leu Glu Asp Trp Gln Phe Gly Leu Thr Pro Pro Pro
785 790 795 800
Ser Ala Ser Leu Gln Asp Thr Tyr Arg Phe Val Thr Ser Gln Ala Ile
805 810 815
Thr Cys Gln Lys Thr Val Pro Pro Lys Glu Lys Glu Asp Pro Leu Gly
820 825 830
Lys Tyr Thr Phe Trp Glu Val Asp Leu Lys Glu Lys Phe Ser Ala Asp
835 840 845
Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Gly Leu
850 855 860
Lys Ala Lys Pro Lys Leu Lys Arg Ala Ala Pro Thr Ser Thr Arg Thr
865 870 875 880
Ser Ser Ala Lys Arg Lys Lys Val Lys Lys
885 890
<210> 11
<211> 2094
<212> DNA
<213> 人工序列
<400> 11
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggaagttc tgttccaggg gccctctgaa gctaccgttt acctgccgcc ggttccggtt 720
tctaaagttg tttctaccga cgaatacgtt tctcgtacct ctatctacta ctacgctggt 780
tcttctcgtc tgctggctgt tggtcacccg tacttctcta tcaaaaaccc gaacaacgct 840
aaaaaactgc tggttccgaa agtttctggt ctgcagtacc gtgttttccg tgttcgtctg 900
ccggacccga acaaattcgg tttcccggac acctctttct acaacccgga cacccagcgt 960
ctggtttggg cttgcgttgg tctggaaatc ggtcgtggtc agccgctggg tgttggtatc 1020
tctggtcacc cgctgctgaa caaattcgac gacaccgaaa cctctaacaa atacccgggt 1080
cagccgggtg ctgacaaccg tgaatgcctg tctatggact acaaacagac ccagctgtgc 1140
ctgctgggtt gcaaaccgcc gaccggtgaa cactggggta aaggtgttgc ttgcaccaac 1200
gctgctccgg ctaacgactg cccgccgctg gaactgatca acaccatcat cgaagacggt 1260
gacatggttg acaccggttt cggttgcatg gacttcaaaa ccctgcaggc taacaaatct 1320
gacgttccga tcgacatctg cggttctacc tgcaaatacc cggactacct gaaaatgacc 1380
tctgaaccgt acggtgactc tctgttcttc ttcctgcgtc gtgaacagat gttcgttcgt 1440
cacttcttca accgtgctgg taaactgggt gaagctgttc cggacgacct gtacatcaaa 1500
ggttctggta ccaccgcttc tatccagtct tctgctttct tcccgacccc gtctggttct 1560
atggttacct ctgaatctca gctgttcaac aaaccgtact ggctgcagcg tgctcagggt 1620
cacaacaacg gtatctgctg gggtaaccag gttttcgtta ccgttgttga caccacccgt 1680
tctaccaaca tgaccctgtg cacccaggtt acctctgact ctacctacaa aaacgaaaac 1740
ttcaaagaat acatccgtca cgttgaagaa tacgacctgc agttcgtttt ccagctgtgc 1800
aaagttaccc tgaccgctga agttatgacc tacatccacg ctatgaaccc ggacatcctg 1860
gaagactggc agttcggtct gaccccgccg ccgtctgctt ctctgcagga cacctaccgt 1920
ttcgttacct ctcaggctat cacctgccag aaaaccgttc cgccgaaaga aaaagaagac 1980
ccgctgggta aatacacctt ctgggaagtt gacctgaaag aaaaattctc tgctgacctg 2040
gaccagttcc cgctgggtcg taaattcctg ctgcaggctg gtctgaaagc ttag 2094
<210> 12
<211> 2457
<212> DNA
<213> 人工序列
<400> 12
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggaagttc tgttccaggg gccctctgac caggaagcta aaccgtctac cgaagacctg 720
ggtgacaaaa aagaaggtga atacatcaaa ctgaaagtta tcggtcagga ctcttctgaa 780
atccacttca aagttaaaat gaccacccac ctgaaaaaac tgaaagaatc ttactgccag 840
cgtcagggtg ttccgatgaa ctctctgcgt ttcctgttcg aaggtcagcg tatcgctgac 900
aaccacaccc cgaaagaact gggtatggaa gaagaagacg ttatcgaagt ttaccaggaa 960
cagaccggtg gatcctctga agctaccgtt tacctgccgc cggttccggt ttctaaagtt 1020
gtttctaccg acgaatacgt ttctcgtacc tctatctact actacgctgg ttcttctcgt 1080
ctgctggctg ttggtcaccc gtacttctct atcaaaaacc cgaacaacgc taaaaaactg 1140
ctggttccga aagtttctgg tctgcagtac cgtgttttcc gtgttcgtct gccggacccg 1200
aacaaattcg gtttcccgga cacctctttc tacaacccgg acacccagcg tctggtttgg 1260
gcttgcgttg gtctggaaat cggtcgtggt cagccgctgg gtgttggtat ctctggtcac 1320
ccgctgctga acaaattcga cgacaccgaa acctctaaca aatacccggg tcagccgggt 1380
gctgacaacc gtgaatgcct gtctatggac tacaaacaga cccagctgtg cctgctgggt 1440
tgcaaaccgc cgaccggtga acactggggt aaaggtgttg cttgcaccaa cgctgctccg 1500
gctaacgact gcccgccgct ggaactgatc aacaccatca tcgaagacgg tgacatggtt 1560
gacaccggtt tcggttgcat ggacttcaaa accctgcagg ctaacaaatc tgacgttccg 1620
atcgacatct gcggttctac ctgcaaatac ccggactacc tgaaaatgac ctctgaaccg 1680
tacggtgact ctctgttctt cttcctgcgt cgtgaacaga tgttcgttcg tcacttcttc 1740
aaccgtgctg gtaaactggg tgaagctgtt ccggacgacc tgtacatcaa aggttctggt 1800
accaccgctt ctatccagtc ttctgctttc ttcccgaccc cgtctggttc tatggttacc 1860
tctgaatctc agctgttcaa caaaccgtac tggctgcagc gtgctcaggg tcacaacaac 1920
ggtatctgct ggggtaacca ggttttcgtt accgttgttg acaccacccg ttctaccaac 1980
atgaccctgt gcacccaggt tacctctgac tctacctaca aaaacgaaaa cttcaaagaa 2040
tacatccgtc acgttgaaga atacgacctg cagttcgttt tccagctgtg caaagttacc 2100
ctgaccgctg aagttatgac ctacatccac gctatgaacc cggacatcct ggaagactgg 2160
cagttcggtc tgaccccgcc gccgtctgct tctctgcagg acacctaccg tttcgttacc 2220
tctcaggcta tcacctgcca gaaaaccgtt ccgccgaaag aaaaagaaga cccgctgggt 2280
aaatacacct tctgggaagt tgacctgaaa gaaaaattct ctgctgacct ggaccagttc 2340
ccgctgggtc gtaaattcct gctgcaggct ggtctgaaag ctaaaccgaa actgaaacgt 2400
gctgctccga cctctacccg tacctcttct gctaaacgta aaaaagttaa aaaatag 2457
<210> 13
<211> 2628
<212> DNA
<213> 人工序列
<400> 13
atgaaaatcg aagaaggtaa actggtaatc tggattaacg gcgataaagg ctataacggt 60
ctcgctgaag tcggtaagaa attcgagaaa gataccggaa ttaaagtcac cgttgagcat 120
ccggataaac tggaagagaa attcccacag gttgcggcaa ctggcgatgg ccctgacatt 180
atcttctggg cacacgaccg ctttggtggc tacgctcaat ctggcctgtt ggctgaaatc 240
accccggaca aagcgttcca ggacaagctg tatccgttta cctgggatgc cgtacgttac 300
aacggcaagc tgattgctta cccgatcgct gttgaagcgt tatcgctgat ttataacaaa 360
gatctgctgc cgaacccgcc aaaaacctgg gaagagatcc cggcgctgga taaagaactg 420
aaagcgaaag gtaagagcgc gctgatgttc aacctgcaag aaccgtactt cacctggccg 480
ctgattgctg ctgacggggg ttatgcgttc aagtatgaaa acggcaagta cgacattaaa 540
gacgtgggcg tggataacgc tggcgcgaaa gcgggtctga ccttcctggt tgacctgatt 600
aaaaacaaac acatgaatgc agacaccgat tactccatcg cagaagctgc ctttaataaa 660
ggcgaaacag cgatgaccat caacggcccg tgggcatggt ccaacatcga caccagcaaa 720
gtgaattatg gtgtaacggt actgccgacc ttcaagggtc aaccatccaa accgttcgtt 780
ggcgtgctga gcgcaggtat taacgccgcc agtccgaaca aagagctggc aaaagagttc 840
ctcgaaaact atctgctgac tgatgaaggt ctggaagcgg ttaataaaga caaaccgctg 900
ggtgccgtag cgctgaagtc ttacgaggaa gagttggcga aagatccacg tattgccgcc 960
actatggaaa acgcccagaa aggtgaaatc atgccgaaca tcccgcagat gtccgctttc 1020
tggtatgccg tgcgtactgc ggtgatcaac gccgccagcg gtcgtcagac tgtcgatgaa 1080
gccctgaaag acgcgcagac taattcgagc tcgaacaaca acaacaataa caataacaac 1140
aacctcggga tcgagggaag gatttcagaa ttcatgtctg tttggcgtcc gtctgaagct 1200
accgtttacc tgccgccggt tccggtttct aaagttgttt ctaccgacga atacgtttct 1260
cgtacctcta tctactacta cgctggttct tctcgtctgc tggctgttgg tcacccgtac 1320
ttctctatca aaaacccgaa caacgctaaa aaactgctgg ttccgaaagt ttctggtctg 1380
cagtaccgtg ttttccgtgt tcgtctgccg gacccgaaca aattcggttt cccggacacc 1440
tctttctaca acccggacac ccagcgtctg gtttgggctt gcgttggtct ggaaatcggt 1500
cgtggtcagc cgctgggtgt tggtatctct ggtcacccgc tgctgaacaa attcgacgac 1560
accgaaacct ctaacaaata cccgggtcag ccgggtgctg acaaccgtga atgcctgtct 1620
atggactaca aacagaccca gctgtgcctg ctgggttgca aaccgccgac cggtgaacac 1680
tggggtaaag gtgttgcttg caccaacgct gctccggcta acgactgccc gccgctggaa 1740
ctgatcaaca ccatcatcga agacggtgac atggttgaca ccggtttcgg ttgcatggac 1800
ttcaaaaccc tgcaggctaa caaatctgac gttccgatcg acatctgcgg ttctacctgc 1860
aaatacccgg actacctgaa aatgacctct gaaccgtacg gtgactctct gttcttcttc 1920
ctgcgtcgtg aacagatgtt cgttcgtcac ttcttcaacc gtgctggtaa actgggtgaa 1980
gctgttccgg acgacctgta catcaaaggt tctggtacca ccgcttctat ccagtcttct 2040
gctttcttcc cgaccccgtc tggttctatg gttacctctg aatctcagct gttcaacaaa 2100
ccgtactggc tgcagcgtgc tcagggtcac aacaacggta tctgctgggg taaccaggtt 2160
ttcgttaccg ttgttgacac cacccgttct accaacatga ccctgtgcac ccaggttacc 2220
tctgactcta cctacaaaaa cgaaaacttc aaagaataca tccgtcacgt tgaagaatac 2280
gacctgcagt tcgttttcca gctgtgcaaa gttaccctga ccgctgaagt tatgacctac 2340
atccacgcta tgaacccgga catcctggaa gactggcagt tcggtctgac cccgccgccg 2400
tctgcttctc tgcaggacac ctaccgtttc gttacctctc aggctatcac ctgccagaaa 2460
accgttccgc cgaaagaaaa agaagacccg ctgggtaaat acaccttctg ggaagttgac 2520
ctgaaagaaa aattctctgc tgacctggac cagttcccgc tgggtcgtaa attcctgctg 2580
caggctggtc tgaaagctaa accgaaactg aaacgtgctg ctccgtaa 2628

Claims (6)

1.一种经大肠杆菌偏好密码子优化的编码人乳头瘤病毒HPV33 L1的融合基因,其特征在于,优化的编码人乳头瘤病毒HPV33 L1的基因核苷酸序列如SEQ ID NO.2所示,并融合有编码GST-SUMO的编码核苷酸序列。
2.如权利要求1所述的融合基因,其特征在于,该融合基因编码的氨基酸序列如SEQ IDNO:9所示。
3.如权利要求1所述的融合基因,其特征在于,该融合基因的核苷酸序列如为SEQ IDNO:4所示。
4.一种大肠杆菌表达载体,其特征在于该载体包括如权利要求1-3任一项所述融合基因。
5.如权利要求4所述的大肠杆菌表达载体,其特征在于,出发载体为pGEX-6p-1、pGEX-4T-2、pMAL或pET28a。
6.一种工程菌细胞,该细胞包含权利要求1-3任一项所述的基因,或权利要求4或5所述的表达载体。
CN201510490177.9A 2015-08-12 2015-08-12 33型重组人乳头瘤病毒病毒样颗粒及其制备方法 Active CN106399329B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510490177.9A CN106399329B (zh) 2015-08-12 2015-08-12 33型重组人乳头瘤病毒病毒样颗粒及其制备方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510490177.9A CN106399329B (zh) 2015-08-12 2015-08-12 33型重组人乳头瘤病毒病毒样颗粒及其制备方法

Publications (2)

Publication Number Publication Date
CN106399329A CN106399329A (zh) 2017-02-15
CN106399329B true CN106399329B (zh) 2021-06-11

Family

ID=58007717

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510490177.9A Active CN106399329B (zh) 2015-08-12 2015-08-12 33型重组人乳头瘤病毒病毒样颗粒及其制备方法

Country Status (1)

Country Link
CN (1) CN106399329B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021013070A1 (zh) * 2019-07-19 2021-01-28 神州细胞工程有限公司 嵌合的人乳头瘤病毒35型l1蛋白
CN114127097A (zh) * 2019-07-19 2022-03-01 神州细胞工程有限公司 嵌合的人乳头瘤病毒56型l1蛋白
CN114174319B (zh) * 2019-07-19 2024-05-14 神州细胞工程有限公司 嵌合的人乳头瘤病毒52型l1蛋白
CN113528544B (zh) * 2021-06-02 2022-07-08 郑州大学 编码可溶性hpv23 l1蛋白的基因及其重组质粒的构建与应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1259051A (zh) * 1997-04-08 2000-07-05 麦克公司 稳定化后的人乳头瘤病毒制剂
CN101016542A (zh) * 2007-02-14 2007-08-15 马润林 一种提高人乳头瘤病毒l1蛋白原核表达产率的方法
CN101245099A (zh) * 2007-02-14 2008-08-20 马润林 重组人乳头瘤病毒l1衣壳蛋白的氨基酸序列及其应用
CN102229660A (zh) * 2011-05-25 2011-11-02 厦门大学 截短的人乳头瘤病毒33型l1蛋白
CN103936840A (zh) * 2013-01-18 2014-07-23 北京康乐卫士生物技术股份有限公司 重组的人乳头瘤病毒33型l1蛋白及其用途
CN104710515A (zh) * 2013-12-17 2015-06-17 北京康乐卫士生物技术股份有限公司 人乳头瘤病毒l1蛋白突变体及其制备方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1259051A (zh) * 1997-04-08 2000-07-05 麦克公司 稳定化后的人乳头瘤病毒制剂
CN101016542A (zh) * 2007-02-14 2007-08-15 马润林 一种提高人乳头瘤病毒l1蛋白原核表达产率的方法
CN101245099A (zh) * 2007-02-14 2008-08-20 马润林 重组人乳头瘤病毒l1衣壳蛋白的氨基酸序列及其应用
CN102229660A (zh) * 2011-05-25 2011-11-02 厦门大学 截短的人乳头瘤病毒33型l1蛋白
CN103936840A (zh) * 2013-01-18 2014-07-23 北京康乐卫士生物技术股份有限公司 重组的人乳头瘤病毒33型l1蛋白及其用途
CN104710515A (zh) * 2013-12-17 2015-06-17 北京康乐卫士生物技术股份有限公司 人乳头瘤病毒l1蛋白突变体及其制备方法

Also Published As

Publication number Publication date
CN106399329A (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
CN105039358B (zh) 58型重组人乳头瘤病毒病毒样颗粒及其制备方法
DK2154147T3 (en) Truncated L1 protein of human papillomavirus 16
CN106399329B (zh) 33型重组人乳头瘤病毒病毒样颗粒及其制备方法
CN106831958B (zh) 一种人乳头瘤病毒11型l1蛋白的突变体
CN110551183A (zh) 一种人乳头瘤病毒39型l1蛋白的突变体
CN106831959A (zh) 一种人乳头瘤病毒33型l1蛋白的突变体
CN106701797B (zh) 31型重组人乳头瘤病毒病毒样颗粒及其制备方法
WO2008145021A1 (en) A truncated l1 protein of human papillomavirus 6
CN103936840B (zh) 重组的人乳头瘤病毒33型l1蛋白及其用途
CN106701796B (zh) 52型重组人乳头瘤病毒病毒样颗粒及其制备方法
EP2479186A1 (en) Genes encoding major capsid protein L1 of human papilloma viruses
US11213580B2 (en) Mutant of L1 protein of human papillomavirus type 16
CN110551185A (zh) 一种人乳头瘤病毒68型l1蛋白的突变体
CN106701798B (zh) 45型重组人乳头瘤病毒病毒样颗粒及其制备方法
CN104045695B (zh) 重组的人乳头瘤病毒18型l1蛋白及其用途
WO2019233412A1 (zh) 一种人乳头瘤病毒18型l1蛋白的突变体
WO2019233400A1 (zh) 一种人乳头瘤病毒66型l1蛋白的突变体
CN110551186A (zh) 一种人乳头瘤病毒45型l1蛋白的突变体
CN110950936B (zh) 一种人乳头瘤病毒69型l1蛋白的突变体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant