CN106701797B - 31型重组人乳头瘤病毒病毒样颗粒及其制备方法 - Google Patents

31型重组人乳头瘤病毒病毒样颗粒及其制备方法 Download PDF

Info

Publication number
CN106701797B
CN106701797B CN201510490172.6A CN201510490172A CN106701797B CN 106701797 B CN106701797 B CN 106701797B CN 201510490172 A CN201510490172 A CN 201510490172A CN 106701797 B CN106701797 B CN 106701797B
Authority
CN
China
Prior art keywords
hpv
leu
protein
lys
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510490172.6A
Other languages
English (en)
Other versions
CN106701797A (zh
Inventor
刘永江
伍树明
高文双
陈晓
任永峰
王雅君
姜绪林
张瑞霞
高俊
张海江
张庆峰
薛俊莲
张佳涛
杜晓莉
夏丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kangleweishi Biological Technology Co ltd
Original Assignee
Beijing Kangleweishi Biological Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kangleweishi Biological Technology Co ltd filed Critical Beijing Kangleweishi Biological Technology Co ltd
Priority to CN201510490172.6A priority Critical patent/CN106701797B/zh
Publication of CN106701797A publication Critical patent/CN106701797A/zh
Application granted granted Critical
Publication of CN106701797B publication Critical patent/CN106701797B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及31型重组人乳头瘤病毒病毒样颗粒及其制备方法,具体技术要点是提供一种新的编码重组的HPV31 L1蛋白的多核苷酸基因片段、包含该基因片段的载体、包括载体的宿主细胞,以及由该基因片段翻译表达的HPV31 L1溶合蛋白、五聚体和由该五聚体组成VLP,本发明还公开该五聚体、VLP蛋白及其组成的疫苗组合物在制备预防HPV31感染的药物中的应用。

Description

31型重组人乳头瘤病毒病毒样颗粒及其制备方法
技术领域
本发明涉及人乳头状瘤病毒的病毒样颗粒及其制备方法。更具体而言,本发明涉及一种重组的人乳头瘤病毒L1蛋白的五聚体及病毒样颗粒(Virus-like Particle,VLP)及其制备方法,及含该病毒样颗粒的疫苗组合物在预防人乳头瘤病毒感染中的应用。
背景技术
人乳头瘤病毒(Human Papillomavirus,简称HPV)主要通过人体密切接触,如性传播的病毒,可引起人类多种增殖性上皮病变,包括乳头状瘤(疣)和瘤样病变。具体来讲,HPV诱发的疾病主要包括3大类,第1类:宫颈、阴道、女性外阴、阴茎和肛门的癌症及某些类型的头颈部肿瘤等恶性病变。100%的宫颈癌患者都是HPV感染所导致的,90%的肛门癌,40%的外阴、阴道及阴茎,12%的口咽及3%的口腔癌症归因于HPV感染。第2类:良性病变如扁平疣、尖锐湿疣等生殖器疣,是一种性传播疾病,在性行为活跃的人群中很常见。虽然生殖器疣不会像癌症一样造成严重的后果,但是病变通常会引起病人较为痛苦的临床症状如灼痛、出血和疼痛,同时产生尴尬、焦虑和自卑等负而的心理反应,而且反复治疗的过程浪费了大量的医疗资源。在世界范围内估计由非致癌性HPV(主要是6和11型)引起的生殖器疣有3000万,其中20~50%的病变中还包含有高危型HPV的混合感染。第3类:HPV感染还能引起复发性呼吸道乳头瘤( RRP),这是一种罕见的、具有潜在致命性的疾病,主要发生在青少年时期,有时,大量的乳头瘤可以引起呼吸困难并导致较小年龄儿童死亡。所以预防或治疗HPV感染对人类健康意义十分重大。
HPV是无囊膜的双链DNA病毒,主要由病毒外壳和基因组DNA组成(Bernard, Burket al. 2011)。HPV病毒外壳是由360个L1蛋白质(形成72个五聚体)和至多72个L2蛋白质构成的二十面体结构,直径55~60 nm(Howley and Lowy 2007)。病毒外壳蛋白质具有自组装特性,在体外L1蛋白质单独或与L2蛋白质共同自组装形成病毒样样颗粒(Virus-likeParticle,VLP)(Chen, Garcea et al. 2000, Finnen, Erickson et al. 2003, Buck,Cheng et al. 2008, Wang and Roden 2013)。
由于HPV不能在体外细胞培养, 要获得该病毒的特异性抗原, 只能用重组DNA 技术的方法制备基因工程疫苗。重组Ll或L1/L2组装形成的病毒样颗粒VLPs,无病毒DNA,安全性好,具有和天然病毒颗粒相似的抗原表位,刺激机体后可产生中和抗体IgG和IgA,因此HPV VLPs可作为预防性疫苗,从而大大降低因感染HPV导致产生相关肿瘤的可能性(Howley and Lowy 2007) 。
HPV疫苗研制的关键是能够大量制备高纯度、稳定的HPV抗原。在HPV疫苗抗原制备技术方面,目前较为常用的生产HPV抗原的表达系统可以分为真核表达系统及原核表达系统。常用的真核表达系统有痘病毒表达系统、昆虫杆状病毒表达系统、酵母表达系统。在真核表达系统中所表达的HPV L1能自发的形成VLP,往往只需进行简单的纯化即可获得VLP。但是由于真核表达系统的表达量低,培养成本高,给大规模工业化生产带来了极大困难。原核表达系统中利用大肠杆菌表达系统表达HPV L1蛋白质已有报道。但是由于大肠杆菌所表达的HPV L1蛋白质可溶性低,目前已知的纯化方法大多通过无盐沉淀或变性复性等步骤从蛋白质种类繁杂的细胞液中最终纯化得到HPV VLP。例如:在专利CN02129070.9中公开通过原核细胞表达和制备HPV L1多聚体的方法,其中纯化工艺包括通过3.3M尿素处理和透析复性过程;在WO-0204007专利中对L1-GST融合蛋白质的纯化方法也是通过尿素变性处理并进行透析复性;在现有技术中也有公开L1蛋白质的纯化方法是包括磷酸缓冲液超滤透析和离心,使目的蛋白沉淀再复溶的步骤。但是在这些纯化过程中蛋白质损失量大,得率低,难以在大规模生产上应用。
在HPV疫苗抗原蛋白质VLP的均一性方面,现有技术中所组装的HPV L1 VLP的粒径分散度有使用polyd值表示,polyd值<15%说明颗粒有很好的均一性,15%到30%之间说明颗粒有较大的不均一性,大于30%说明颗粒完全不够均一。现有技术中制备的HPV L1 VLP多大于15%。另一个说明粒径均一的指标是PdI值,PdI值为粒径分布系数,小于0.05为高度均一的样品;0.05~0.1为准均一的样品,0.1~0.3为均一性较差的样品,大于0.3为不均一的样品。在US7205125B2专利中公开两个型别HPV L1 VLP的混合蛋白液的PdI为0.07。
因此,本领域仍然需要成本低、纯度高、产量高、质量稳定的HPV L1蛋白质生产技术和大规模工业化生产重组HPV L1 VLP的新方法。
发明内容
本发明的目的是公开一种优化的编码HPV31 L1 蛋白质的核苷酸序列,包含该核苷酸序列的载体、包括载体的宿主细胞,以及由该多核苷酸序列翻译表达的HPV L1蛋白质,Tag-HPV-L1重组蛋白,由该L1蛋白质形成的五聚体和VLP,以及由该五聚体和VLP作为抗原组成的预防HPV感染的疫苗。
本发明第一方面提供一种经密码子优化的HPV31 L1的基因,其核苷酸序列为SEQNO:2。
本发明第二方面提供一种构建的表达载体,其包含本发明第一方面的经密码子优化的HPV31 L1的基因。所述载体适合驱动异源DNA在细菌中翻译表达HPV L1蛋白质。在一个实施方案中,所述表达载体优选pGEX-6p-1、pGEX-4T-2、 pMAL或pET28a。
本发明的第三方面提供一种构建的工程菌细胞,该细胞包含本发明第一方面的基因,或第二方面的表达载体。所述的工程菌宿主细胞是大肠杆菌,在一个实施方案中,所述宿主细胞优选BL21细胞株。
本发明第四方面提供一种Tag-HPV31 L1融合蛋白,其中标签Tag为6*His.Tag,GST.Tag,SUMO.Tag,MBP.Tag,6*His - SUMO.Tag或GST- SUMO.Tag;L1为HPV31 L1全长蛋白质和/或C端截短5个、10个、15个或不多于30个氨基酸和/或N端截短2个、4个、6个或不多于10个氨基酸的L1蛋白质。
编码Tag-HPVL1融合蛋白GST-HPV31 L1的核苷酸序列为SEQ NO:3、SEQ NO:11,,GST-SUMO-HPV31 L1的核苷酸序列为SEQ NO:4、SEQ NO:12,MBP的核苷酸序列SEQ NO:5、SEQ NO:13,6*His-HPV31 L1的核苷酸序列为SEQ NO:6, 6*His-SUMO-HPV31 L1的核苷酸序列为SEQ NO:7。
编码Tag-HPVL1融合蛋白GST-HPV31 L1的氨基酸序列为SEQ NO:8,GST-SUMO-HPV31 L1的氨基酸序列为SEQ NO:9,MBP的氨基酸序列SEQ NO:10。
本发明第五方面提供Tag-HPVL1融合蛋白质经过纯化后获得的HPV L1的五聚体,及由五聚体组装的VLP。在一个优选实施例中HPV31 L1五聚体蛋白平均粒径10~15nm PdI<0.1。在一个优选实施例中HPV31 L1VLP的平均粒径45~65nm PdI<0.1。
本发明第六方面提供了一种疫苗组合物,其包含本发明HPV L1的五聚体或HPV L1的VLP,所述组合物中进一步包含可药用的赋形剂和药用佐剂。
在一个实施方案中将含有HPV31 L1五聚体或VLP蛋白原液(根据上述方法制备所得)分别与氢氧化铝佐剂生理盐水溶液按照蛋白与铝含量1:10比例进行吸附配制即可制得重组HPV L1蛋白质五聚体或VLP疫苗,在4℃保存待用。
另一方面,本发明还提供一种获得Tag-HPVL1融合蛋白的方法,包括如下步骤:
A.通过用大肠杆菌偏爱的密码子取代HPV31 L1基因序列的翻译同种蛋白的密码子,得到大肠杆菌表达系统偏爱的密码子优化的HPV31 L1的基因;
B.构建HPV31 L1基因的大肠杆菌表达载体;
C.构建Tag-HPV31 L1的大肠杆菌表达工程菌株;
D.诱导表达并纯化得融合蛋白Tag-HPV31 L1。
上述制备融合蛋白Tag-HPV31 L1方法中原核宿主细胞选自但不限于GI698,ER2566,BL21 (DE3),XA90,B834 (DE3),BLR (DE3)。
上述制备融合蛋白Tag-HPV31 L1方法中表达条件是:20~37℃温度条件下,诱导表达3~20小时。在一个具体实施例中优选在28℃温度条件下,诱导表达 16小时。
本发明还提供一种获得HPV31 L1五聚体的方法,包括如下步骤:
a)用亲和层析方法吸附融合蛋白Tag-HPV31 L1;
b)加入蛋白质水解酶切除Tag标签,得到HPV31 L1五聚体蛋白质;
c)纯化HPVL1五聚体蛋白质、得到纯度>98%,平均粒径10~15nm PdI<0.1的L1五聚体蛋白质。
上述制备HPV31 L1五聚体方法中所述用于蛋白酶为切除Tag标签的位点专一的蛋白质水解酶:重组3C蛋白酶,凝血酶,SUMO蛋白酶,SENP1或TEV蛋白酶。
上述制备HPV31 L1五聚体方法中纯化方法选自但不限于离子交换色谱法,疏水性色谱法,分子筛(或称凝胶过滤或分子排阻)色谱法;优选地纯化包括离子交换色谱法和分子筛色谱法。
上述制备HPV31 L1五聚体方法中纯化方法还包括使用还原剂,例如加入DTT。
上述制备HPV31 L1五聚体方法中最终纯化后所得到HPV31 L1五聚体蛋白平均粒径10~15nm PdI<0.1。
本发明还提供了一种HPV31 L1五聚体组装成VLP的方法,包括如下步骤:
将平均粒径10~15nm PdI<0.1的L1五聚体蛋白质液与组装缓冲液混合,最终获得pH值为5.0~5.9,盐浓度为500~2000 mM,平均粒径45~65nm PdI<0.1的HPV31 L1 VLP蛋白质液,优选获得pH值为5.7,盐浓度为1300 mM的HPV31 L1 VLP蛋白质液。
组装缓冲液包括但不限于Tris缓冲液,磷酸盐缓冲液,醋酸缓冲液,HEPES缓冲液,MOPS缓冲液,枸橼酸缓冲液、组氨酸缓冲液,硼酸缓冲液等。
上述HPV31 L1五聚体组装成VLP的方法中HPV31 L1-VLP蛋白质液中还可以加入保护剂,例如:0.01~0.1聚山梨酯80。
本发明还提供了另一种组装VLP的方法—低温冷冻处理组装法,包括如下步骤:
将HPV L1五聚体蛋白质液置于pH值为5.5~8.0 盐浓度为150~1000 mM条件下缓冲液,在-20~-80℃条件下完全冷冻,优选冷冻24小时后,再放置室温至蛋白质原液融解,获得平均粒径45~65nm PdI<0.1的HPV31 L1VLP蛋白质液。
另一方面,本发明还提供了HPV L1的五聚体、VLP和包括五聚体或VLP的疫苗组合物在制备预防HPV感染的药物中的应用。
根据本发明,本发明的疫苗可采用患者可接受的形式,包括但不限于注射或鼻腔或口腔吸入或者阴道给药,优选注射剂和肌内注射。
本发明中相关术语的说明及解释
根据本发明,术语“大肠杆菌表达系统”是指由大肠杆菌(菌株)与载体组成,其中大肠杆菌(菌株)来源于市场上可得到的,在此举例但不限于: GI698,ER2566,BL21 (DE3),XA90,DH(5a)、B834 (DE3),BLR (DE3)。
根据本发明,术语“载体”一词指的是,可将某编码蛋白质的多聚核苷酸插入其中并使蛋白质获得表达的一种核酸运载工具。载体可以通过转化,转导或者转染宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。举例来说,载体包括:质粒;噬菌体;柯斯质粒等等。
根据本发明,术语“疫苗用赋形剂或载体“是指选自一种或多种,包括但不限于:pH调节剂,表面活性剂,佐剂,离子强度增强剂。例如,pH调节剂举例但不限于磷酸盐缓冲液,表面活性剂包括阳离子,阴离子或者非离子型表面活性剂。举例但不限于:聚山梨酯80。佐剂举例但不限于氢氧化铝,磷酸铝、氟氏完全佐剂、氟氏不完全佐剂等。离子强度增强剂举例但不限于氯化钠。
根据本发明,术语“色谱”包括但不限于:离子交换色谱(例如阳离子交换色谱、阴离子交换色谱)、疏水相互作用色谱、吸附色谱层析法(例如羟基磷灰石色谱)、分子筛色谱层析(凝胶过滤或分子排阻层析)、亲和色谱层析法。
根据本发明,在本发明获得的重组HPV L1蛋白质的方法中,缓冲液是指一种能在加入少量酸或碱和水时大大降低pH变动幅度的溶液,包括但不限于Tris缓冲液,磷酸盐缓冲液,醋酸缓冲液,HEPES缓冲液,MOPS缓冲液,枸橼酸缓冲液、组氨酸缓冲液,硼酸缓冲液等。
根据本发明,所述细胞破碎包括但不限于通过匀浆器破碎、均质机破碎、超声波处理、研磨、高压挤压、溶菌酶处理中的一项或者多项方法来实现;
根据本发明,在本发明获得的重组HPV L1蛋白质的方法中,所用的盐包括但不限于是中性盐,特别是碱金属盐、铵盐、盐酸盐、硫酸盐,碳酸氢盐,磷酸盐或磷酸氢盐,特别是NaCI、KCl、CaCl2、NH4Cl、KCI、NH4CI、MgSO4 、(NH4)2SO4中的一种或几种。优选NaCI。所用的还原剂包括但不限于DTT,2-巯基乙醇。所用量包括但不限于2mM~lO0mM,优选10~15mM。
有益效果
本发明提供了一种合成基因,该基因序列是根据大肠杆菌的密码子偏好进行过密码子优化的核苷酸序列,该序列编码了HPV L1蛋白氨基酸序列。研究发现经过密码子优化的核酸序列相对于未经密码子优化的核酸序列的L1蛋白的表达量有显著提高。
本发明公开的大肠杆菌表达系统具有表达量高、 易于培养和操作以及生产成本低等优点。但是, 仅仅使用该表达系统仍难以直接获得大量可溶性的HPV L1蛋白, 其原因在于L1蛋白极容易形成包涵体,即无生物学活性的不溶性聚合体。此外, 即使获得大量的包涵体, 为了得到有生物学活性的蛋白, 还必须对包涵体进行变性、 复性处理,这个过程往往损失大量的蛋白。为了解决这一难题,本发明采用融合技术,将L1基因与具有协助蛋白质正确折叠的蛋白如谷胱甘肽硫转移酶(GST)、SUMO、MBP、6*His- SUMO或GST- SUMO等进行融合表达,不仅蛋白的可溶性及收率有所提高,而且GST-SUMO-HPVL1,6*His-SUMO-HPVL1使得在HPV L1蛋白质N端没有外源氨基酸的残留,同时发现其中的GST-SUMO作为重组蛋白HPVL1表达的融合标签和分子伴侣, 具有抗蛋白酶水解、显著增加重组蛋白表达量以及促进靶蛋白正确折叠, 提高可溶性等功能。因此本发明采用的技术路线是在构建HPV L1蛋白表达载体时采用了标签蛋白融合技术,一方面通过标签蛋白与L1蛋白形成的融合蛋白来提高目的蛋白的可溶性、提高产量,另一方面通过GST融合标签可以利用亲和层析和蛋白水解酶切除融合质标签方法进行目的蛋白的纯化特点,从而实现了从种类繁杂的细胞裂解液中一步纯化即可获得纯度达到70%以上的HPV L1蛋白,大大提高了纯化效率,从而提高了终产物HPV L1蛋白的产量。
本发明提供的先表达、分离纯化获得高纯度的HPV L1五聚体蛋白后再人工控制组装形成VLP的技术路线,可以解决当前公知技术存在的从杂蛋白种类繁多的细胞破碎液中直接纯化VLP纯度低、降解比例高,收率低的问题,得到高纯度五聚体体外组装VLP及VLP保存条件。
另外,本发明人出人意料地发现了一种新的组装条件和方法:即低温冷冻处理组装法。通过该方法得到的VLP可将冻融前组装的粒径不均一的蛋白质(PdI大于0.1)变成粒径大小符合理论预期而且均一的,PdI小于0.1的VLP,对比现有技术得到的VLP更加稳定,并且可保存于不同盐浓度、pH值范围更广泛的缓冲液中,更便于最终疫苗制剂的稀释和配制。
本发明经重组所得的HPV L1 VLP蛋白质,具有良好的免疫原性,可以诱导高滴度的针对同型HPV的中和抗体,预防HPV对人体的感染,是一种良好的疫苗形式。
在参考下列详述和附图后,本发明的这些和其它方面将是显然的。此处公开的所有参考文献在此均完整引用作为参考。
附图说明
图l:GST-HPV31 L1 蛋白质亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准泳道从上至下为:94kDa,66kDa,45kDa,33kDa,26kDa,20kdat;1泳道为亲和吸附GST-L1的介质,分子量大约为80 kDa;2泳道为酶解后GST与L1的介质。
图2:GST-SUMO-HPV31 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为为蛋白质量标准(从上至下为:94kDa,66kDa,45kDa,33kDa,26kDa,20kDa),1泳道为亲和吸附GST-SUMO -L1的介质,2泳道为酶解后GST-SUMO与L1的介质。
图3:MBP-HPV31 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为为蛋白质量标准(从上至下为:94kDa,66kDa,45kDa,33kDa,26kDa,20kda),1泳道为亲和吸附MBP-L1的介质,2泳道为酶解后MBP与L1的介质。
图4: 6*HIS-SUMO-HPV31 L1 蛋白质经亲和与酶解后的SDS-PAGE凝胶电泳图。M泳道为为蛋白质量标准(从上至下为:94kDa,66kDa,45kDa,33kDa,26kDa,20kda),1泳道为亲和吸附6*HIS-SUMO - L1的介质,2泳道为酶解后6*HIS-SUMO与L1的介质。通过凝胶电泳图显示蛋白酶切开了带有6*HIS-SUMO标签的溶合蛋白。
图5:本发明经过分子筛色谱纯化后的重组HPV31 L1五聚体蛋白质SDS-PAGE凝胶电泳图。M泳道为蛋白质量标准(从上至下为:94kDa,66kDa,45kDa,33kDa,26kDa,20kda),另一泳道为HPV L1蛋白。
图6:HPV31 L1五聚体的动态光散射观测结果。结果显示五聚体的粒径直径为14.55 nM,粒度分布PdI为 0.077。
图7: HPV31 L1 VLP的动态光散射观测结果。结果显示VLP的粒径直径为53.06 nM,粒度分布PdI为0.055。
图8:HPV31 L1五聚体蛋白的透射电镜照片。
图9:HPV31 L1 VLP蛋白的透射电镜照片。
图10:HPV31 L1五聚体蛋白质的高压液相分子筛色谱图,图中显示经高度纯化的L1五聚体蛋白质纯度大于98%。
图11:HPV31 L1 VLP蛋白质的高压液相分子筛色谱图,图中显示经高度纯化的VLP蛋白质纯度大于98%。
图12:HPV31 L1五聚体各实验组疫苗接种小鼠后,在第二次加强免疫4周后,检测中和抗体的平均滴度水平。
图13:HPV31 L1 VLP各实验组疫苗接种小鼠后,在第二次加强免疫4周后,检测中和抗体的平均滴度水平。
下面结合实施例对本发明进一步举例描述。这些实施例是非限制性的。
实施例l:密码子优化的HPV L1基因的设计与合成
基因序列来源于PUBMED上已公开的各型HPV序列。参照大肠杆菌对基因转录密码子的偏好对选定的各型HPV DNA序列进行密码子优化后合成所有HPV DNA序列。根据合成DNA序列设计引物,利用合成基因为模板进行PCR扩增。所得的密码子优化序列通过DNA序列测定验证。
优化前与优化后的HPV各型DNA序列:
SEQ NO.1:优化前的HPV31型L1的DNA序列
SEQ NO.2:优化后的HPV31型L1的DNA序列
实施例2:重组载体pGEX-6P-1-GST- HPV31 L1的构建及鉴定:
扩增HPV31 L1 的DNA片段引物:(酶切位点分别是BamHI和XhoI)
Forward-HPV31 L1-ApaI:5’ACTTCAGGATCC ATGTCTCTGTGGCGTCCGTCTG
Reverse-HPV31 L1-XhoI:5’ATCTCACTCGAGCTA TTTTTTGGTTTTTTTACGTTT
PCR扩增反应体系:10 x Pfu buffer 20 μL,Pfu酶 4 μL,10 mM dNTP 2.5 μL,5’Primer (5μM) 10μL,3’ Primer (5μM) 10μL,模 板DNA 50 ng,加d2H2O至200μL。
基因PCR扩增条件:95℃ 3 min; 95℃ 30 sec,58℃ 30 sec,72℃ 4 min;循环32次;72℃ 10 min。
将含有BamH I和XhoI酶切位点的L1基因片段以及载体pGEX-6P-1进行BamH I/XhoI双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGEX-6P-1进行连接反应,16 ℃ 10~15 h。
连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由上海生工生物公司进行测序,得到融合重组GST-HPV31-L1蛋白质的核苷酸序列为SEQ NO.3,氨基酸序列为SEQ NO.8。
参照该实施例方法制备带有GST-标签的融合重组载体GST-HPV-L1,其基因序列SEQ NO.11。
实施例3:重组载体pGEX-6P-1m-GST-SUMO- HPV31 L1 载体构建
pGEX-6p-1m载体构建:为使得多酶切位点附近的ApaI酶切位点 (GGGCCC)为载体的唯一ApaI酶切位点, 在不改变lacI基因蛋白质表达序列的前提下,通过点突变技术将市售的pGEX-6p-1载体的另一ApaI识别序列GGGCCC中的Gly密码子GGC改变为它的同义密码子GGT,即可消除ApaI(3890)。通过这样的改造使得ApaI 成为可用来插入表达基因的位点。
扩增SUMO 的DNA片段引物:(酶切位点分别是ApaI和BamHI)
Forward -SUMO-ApaI: ACTTCAGGGCCCTCTGACCAGGAAGCTAAACCGTC
Reverse-SUMO-BamHI: CGCGGATCCACCGGTCTGTTCCTGGTAAAC
扩增HPV31 L1 的DNA片段引物:(酶切位点分别是BamHI和XhoI)
Forward-HPV31 L1-ApaI:5’ACTTCAGGATCC ATGTCTCTGTGGCGTCCGTCTG
Reverse-HPV31 L1-XhoI:5’ATCTCACTCGAGCTA TTTTTTGGTTTTTTTACGTTT
PCR扩增反应体系:10 x Pfu buffer 20 μL,Pfu酶 4 μL,10 mM dNTP 2.5 μL,5’Primer (5μM) 10μL,3’ Primer (5μM) 10μL,模 板DNA 50 ng,加d2H2O至200μL。
基因PCR扩增条件:95℃ 1.5 min; 95℃ 30 sec,58℃ 30 sec,72℃ 1 min;循环32次;72℃ 10 min。
基因PCR扩增条件同上述实施例。
酶切连接:将含有ApaI和BamHI酶切位点的SUMO基因片段以及载体pGEX-6P-1m进行Apa I/ BamHI双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGEX-6P-1m进行连接反应,16 ℃ 10~15h。
转化鉴定:连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由苏州金唯智生物科技有限公司进行测序,得到融合重组载体pGSTSUMO-6p-1m。
再次酶切连接:将含有BamHI和Xho1酶切位点的L1基因片段以及重组载体pGSTSUMO-6p-1m进行BamHI/Xho1双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pGSTSUMO-6p1m进行连接反应,16 ℃ 10~15 h。
再次转化鉴定:连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由苏州金唯智生物科技有限公司进行测序,得到带有GST-SUMO标签的融合重组载体GST-SUMO-L1,其基因序列SEQ NO.4,氨基酸序列为SEQ NO.9。
参照该实施例方法制备带有GST-SUMO标签的融合重组载体GST-SUMO-L1,其基因序列SEQ NO.12。
实施例4:重组载体pMAL—MBP-HPV31 L1的构建
扩增HPV31 L1 的DNA片段引物:(酶切位点分别是EcoRI和HindIII)
Forward-HPV31 L1-EcoRI:5’ ACTTCA GAATTC ATGTCTCTGTGGCGTCCGTCTG
Reverse-HPV31 L1-HindIII:5’ ATCTCA AAGCTTCTA TTTTTTGGTTTTTTTACGTTT
将含有EcoRI和HindIII酶切位点的L1基因片段以及载体pMAL进行EcoRI/HindIII双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pMAL进行连接反应,16 ℃ 10~15 h。
连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由上海生工生物公司进行测序,得到融合重组MBP-HPV31-L1蛋白质的基因序列SEQ NO.5,氨基酸序列为SEQ NO.10。
参照该实施例方法制备带有MBP标签的融合重组载体MBP-HPV-L1,其基因序列SEQNO.13。
实施例5:重组载体pET28a-6*His-HPV31 L1的构建
扩增HPV31 L1 的DNA片段引物:(酶切位点分别是NdeI和XhoI, pET28a)
Forward-HPV31 L1-NdeI:5’ GACTTCA CATATGATGTCTCTGTGGCGTCCGTCTG
Reverse-HPV31 L1-XhoI:5’ CATCTCACTCGAGCTA TTTTTTGGTTTTTTTACGTTT
将含有NdeI和XhoI酶切位点的L1基因片段以及载体pMAL进行NdeI/XhoI双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pET28a进行连接反应,16℃ 10~15 h。
连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由上海生工生物公司进行测序,得到融合重组MBP-HPV31-L1蛋白质的基因序列SEQ NO.6。
实施例6:重组载体6*His-SUMO-HPV31 L1 载体构建
扩增SUMO 的DNA片段引物:(酶切位点分别是NdeI和BamHI)
Forward -SUMO-NdeI: GGAATTCCATATGTCTGACCAGGAAGCTAAACCGTC
Reverse-SUMO-BamHI: CGC GGATCCACCGGTCTGTTCCTGGTAAAC
扩增HPV31 L1 的DNA片段引物:(酶切位点分别是BamHI和XhoI)
Forward-HPV31 L1-ApaI:5’ACTTCAGGATCC ATGTCTCTGTGGCGTCCGTCTG
Reverse-HPV31 L1-XhoI:5’ATCTCACTCGAGCTA TTTTTTGGTTTTTTTACGTTT
SUMO基因、L1基因PCR扩增条件、反应体系同上述实施例所述。
酶切连接:将含有NdeI和BamHI酶切位点的SUMO基因片段以及载体pET-28a进行NdeI/ BamHI双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pET28a进行连接反应,16 ℃ 10~15 h。
转化鉴定:连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由苏州金唯智生物科技有限公司进行测序,得到融合重组载体pETSUMO-28a。
再次酶切连接:将含有BamHI和Xho1酶切位点的L1基因片段以及重组载体pETSUMO-28a进行BamHI/Xho1双酶切处理,之后利用T4 DNA连接酶将回收的基因片段与含有对应粘性末端的pETSUMO-28a进行连接反应,16 ℃ 10~15 h。
再次转化鉴定:连接反应后转化连接产物到宿主菌DH5α中进行重组子的筛选。将筛选的单克隆菌落进行扩大培养并进行质粒的提取,之后由上海生工生物公司进行测序,得到融合重组MBP-HPV31-L1蛋白质的基因序列SEQ NO.7。
实施例7:重组HPV L1五聚体蛋白质的表达
将测序结果正确实施例2、3、4、5和6的重组载体转化大肠杆菌BL21宿主细胞,并作为表达重组蛋白质的工程菌进行HPV L1蛋白的表达。工程菌培养基为2YT培养基(10 g/L胰化蛋白胨;5 g/L酵母粉;10 g/L NaCl)。挑取含重组质粒的菌体单斑于10ml 2YT培养基(含100μg/ml氨苄青霉素)中,230转/分钟(rpm),37℃振荡培养过夜。转接5 ml过夜菌于500 ml(含100 μg/ml 氨苄青霉素)2YT液体培养基中,37℃震荡培养至重组工程菌生长至OD600nm≈0.4~1时,加入终浓度0.2mM的IPTG诱导,在28℃的条件下进行6h以上重组蛋白质的诱导表达。
细胞收集及破碎:对发酵培养物进行离心,弃上清,收获菌体沉淀,称重;使用buffer L(pH 8.0,50 mM Tris,200 mM NaCl,5mM DTT)洗涤沉淀,然后将其重悬于bufferL中进行超声波破碎,随后通过高速离心机对破菌液进行离心(16000 rpm,30 min,4℃),收集上清液。
实施例8:重组HPV L1五聚体蛋白在大肠杆菌中表达量的检测
采用ELISA夹心法检测亲和层析上样前Tag-HPV L1五聚体蛋白在大肠杆菌中表达量,样品及供试品:
包被抗体:自制抗HPV31 L1小鼠单抗。
对照品:自制高纯度的HPV31 L1蛋白。
供试品:用样品稀释液将供试品Tag-HPV31 L1稀释至浓度在对照品梯度稀释浓度范围内。
酶标抗体:自制的辣根过氧化物酶标记的兔抗HPV31 L1蛋白多抗。
结果计算:计算平行孔的平均值,以对照品系列浓度OD450吸收值对其相应的L1蛋白抗原作直线方程,平行样品孔间变异系数不得大于10%,直线回归方程R2不得小于0.980,将供试品的OD450吸收值代入方程计算出稀释后供试品L1蛋白抗原含量,再乘以相应的稀释倍数即为供试品中L1蛋白抗原含量,见表1。
表1 检测表达后Tag-HPV L1蛋白抗原含量
Figure 357098DEST_PATH_IMAGE001
实施例9:重组HPV L1五聚体蛋白质亲和层析
带GST标签重组蛋白的亲和层析:亲和柱中装入GST琼脂糖亲和层析介质5ml,以buffer L(pH 8.0,50 mM Tris,200 mM NaCl,5mM DTT)平衡层析柱,然后上样实施例8中带有GST或GST-SUMO标签的蛋白液,完毕后以Buffer L洗至无蛋白质流出,亲和完毕。以5mLBuffer L悬浮亲和介质,取样检测并计算介质中结合L1蛋白质的总量。
带MBP标签重组蛋白的亲和层析:亲和柱中装入Amylose-Resin亲和层析介质5ml,以buffer L(pH 8.0,50 mM Tris,200 mM NaCl,5mM DTT)平衡层析柱,然后上样实施例8中带有GST或GST-SUMO标签的蛋白液,完毕后以Buffer L洗至无蛋白质流出,亲和完毕。以5mLBuffer L悬浮亲和介质,取样检测并计算介质中结合L1蛋白质的总量。
带6*HIS标签重组蛋白的亲和层析:取5ml Ni-NTA凝胶装柱,在柱上缓慢加入10倍柱体积的平衡液(50mmol/L NaH2PO4,300mmol/L Nacl,20mmol/L imidazole,用NaOH调整PH值至8),以充分平衡Ni-NTA凝胶,流速为1ml/min。取实施例8中过滤后的带有6*His标签的上清液,完全进入凝胶后,用10倍柱体积的平衡液继续洗涤凝胶,保存流速为1ml/min。用平衡液洗脱至无蛋白质流出,亲和完毕。取样检测并计算介质中结合L1蛋白质的总量。
实施例10:重组Tag-HPV L1蛋白质的酶切纯化
按照目的蛋白质与蛋白酶质量比100:1加入酶量,其中带有GST-HPV-L1的蛋白质用3C蛋白酶切,带有GST-SUMO-HPV-L1和6*His-SUMO-HPV-L1 的蛋白质用SENP1蛋白酶切,带有Mbp-HPV-L1的蛋白质用Factor Xa蛋白酶切,带有6*His-HPV-L1的蛋白质用Thrombin蛋白酶切,分别混合酶切2h后,分别洗脱收集各个蛋白酶切后所得的HPV31 L1五聚体蛋白质溶液。
将3C酶酶切GST标签后的L1蛋白质溶液用SDS- PAGE凝胶电泳检测,结果见图1亲和层析电泳结果,实验表明,可将90%的目的蛋白切下。图2为SENP1蛋白酶切带有GST-SUMO-HPV-L1的蛋白质,用SDS- PAGE凝胶电泳检测。图3为Factor Xa蛋白酶切带有Mbp-HPV-L1的蛋白质,用SDS- PAGE凝胶电泳检测。图1-图3说明说明得到了55kDa 的HPV31 L1蛋白。
Thrombin蛋白酶没有
切开6*His-HPV-L1的蛋白质;用SENP1酶切6*His-SUMO-L1的蛋白质溶液用SDS-PAGE凝胶电泳检测,结果见图4,显示SENP1蛋白酶未能切开带有6*His-SUMO标签的溶合蛋白。
实施例11:重组HPV L1五聚体蛋白质的纯化
分子筛色谱纯化:将上一个实施例收集的酶切纯化后的HPV31 L1五聚体蛋白质分别进行纯化,可先经过离子交换色谱收集的HPV31 L1五聚体蛋白质,或不经过离子交换步骤直接用Superdex200(GE公司生产)的凝胶过滤介质进行进一步分子筛层析,分子筛流动相为pH8.0,10 mM Tris,100 mM NaCl,收集HPV31 L1五聚体蛋白质紫外吸收峰的馏分。
纯化后测定样品纯度:将收集的蛋白质溶液取样用SDS- PAGE凝胶电泳检测,目的蛋白质HPV31 L1五聚体经过分子筛层析纯化后最终纯度均大于98%,详见图5,经过分子筛色谱纯化后的重组HPV31 L1五聚体蛋白质SDS-PAGE凝胶电泳图。
测定样品蛋白浓度:用Bradford法进行蛋白浓度检测,使用标样2mg/ml BAS配制从100ug/ul稀释到500ug/ul,样品反应体系取10ul稀释的BSA+200ulBradford工作液:标准曲线为y = 0.0013 x - 0.0294 ,R² = 0.9986 ,测定样品的 OD595,代入标准曲线,计算样品的蛋白浓度,结果见表2。
表2 Bradford法检测重组HPV31 L1五聚体蛋白浓度
Figure 211921DEST_PATH_IMAGE002
注:样品组1为GST-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液;样品组2为GST-SUMO-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液;样品组3为Mbp-HPV L1经分子筛纯化后得HPV L1五聚体蛋白溶液。
实施例12:重组HPV31 L1五聚体蛋白质组装成VLP
在置于如下盐浓度(NaCl)和PH值条件下,HPV L1五聚体溶液样品组1、2和3,放置稳定后,使用马尔文 Zetasizer NanoZS的动态光散射粒径仪,进行粒径及粒径分布测定(粒径分布系数PdI值为粒径分散度指标,小于0.05为高度均一的样品;0.05~0.1为准均一的样品,0.1~0.3为均一性较差的样品,大于0.3为不均一的样品),,HPV31 L1五聚体蛋白组装得到粒径均一的VLP(PdI<0.05)。
表3 不同pH和盐浓度条件下组装HPV31 L1 VLP的粒径检测
Figure 414495DEST_PATH_IMAGE003
注:样品组1为GST-HPV L1经分子筛纯化后得HPV L1 VLP蛋白溶液;样品组2为GST-SUMO-HPV L1经分子筛纯化后得HPV L1VLP蛋白溶液;样品组3为Mbp-HPV L1经分子筛纯化后得HPV L1VLP蛋白溶液。
实施例13:动态光散射(DLS)对L1五聚体和VLP蛋白质粒径测定
仪器为马尔文 Zetasizer NanoZS的动态光散射粒径仪,取各样品组最终制得的HPV31 L1五聚体和HPV31 L1 VLP蛋白质进行检测,测平均粒径和分散性指数PdI(表明蛋白质的均一性),说明各组样品最终制备的L1五聚体和VLP蛋白均一。其中样品组2最终制得的五聚体蛋白质和其组装获得的HPV31 L1 VLP蛋白质粒径分布详见附图6和7。
实施例14:HPV31 L1五聚体和VLP的制备
依据本发明上述实施例1-13所采用的技术,制备具有序列11,12,13的HPV31 L1蛋白,以上蛋白均可纯化得到纯度达到98%以上的蛋白,得到平均粒径10~15nm PdI<0.1的HPV31 L1五聚体蛋白。进一步组装得到平均粒径45~65nm PdI<0.1的HPV31 L1VLP蛋白。
实施例15:HPV31 L1 五聚体和VLP的形态学检测
透射电镜观察:将实施例中各个纯化获得的HPV31 L1五聚体蛋白质、组装获得的HPV31 L1-VLP蛋白质,通过中国科学院生物物理所利用透射电镜平台观察。冷冻样品制备及拍照流程:
1)将液氮盒装满液氮,待液面不沸腾时,将乙烷缓慢注入冷却的铜碗中,使之冷却为液态。
2)将铜网在PDC-32型等离子清洗器做亲水性处理。
3)在Vitrobot TM Mark IV冷冻样品制备设备中,将 3.5 μL 的五聚体及VLP样品吸附在 300目的 QUANTIFOIL 铜网中,吸水4s后,通过液态乙烷冷冻样品。
4)迅速将样品转移到液氮中保存。
5)收集冷冻照片时,电子剂量为 20 e-/Å2。数据通过300 KV 的 300 kV TitanKrios 透射电子显微镜的 Gatan UltraScan 4000 CCD记录。加速电压为300 kV。
结果显示,在HPV31 L1五聚体蛋白质样品组中,视野中可见大量直径与理论大小相符的10nm左右的五聚体蛋白;在HPV31 L1-VLP蛋白质样品组中,可见颗粒大小与理论相符的大量直径为50nm左右的病毒样颗粒(VLP),均匀一致。其中GST-SUMO标签组(样品组2)酶切纯化后HPV31 L1五聚体所得样品的透射电镜照片见附图8, Mbp标签组(样品组3)酶切纯化后再组装的VLP蛋白的透射电镜照片见附图9。
实施例16:HPV31 L1蛋白质原液纯度检测
分子排阻高效液相色谱测定:色谱柱Agilent Bio SEC-5um,2000Å,7.8×300mm,柱体积约15 m1,分子量范围≥lO,OOOkDa;以pH6.8 的0.1mol/L磷酸盐缓冲液(称取磷酸氢二钠25.8g,磷酸二氢钠4.37g,加超纯水使溶解,用磷酸调pH至6.8,超纯水定容成1000ml)为流动相;流速为1ml/min;检测波长280nm;柱温25℃,上样量不得小于20ug,样品主峰理论塔板数不低于1000,拖尾因子小于2.0,连续进样5针,峰面积的相对标准偏差不得大于3%。
取纯化后的样品2组最终制得的HPV31 L1五聚体和组装后的VLP的蛋白质原液,分别稀释浓度为1mg/ml,上样量20ul注入高压液相色谱仪,按照上述方法检测,按面积归一法计算纯度,所有处理蛋白质纯度均大于98%,结果见附图10和表4、附图11和表5。
表4 HPV31 L1五聚体的HPLC蛋白质纯度检测
Figure 996655DEST_PATH_IMAGE004
表5 HPV31 L1组装后VLP的HPLC蛋白质纯度检测
Figure 748710DEST_PATH_IMAGE005
实施例17:HPV VLP稳定性实验
将各个样品组最终制得的HPV31 VLP蛋白质在下表的缓冲液条件下,在25℃放置14天至28天,进行粒径检测,结果见下表,证明HPV31 VLP在pH 5.0至5.9,盐浓度500~2000mM下存放稳定。样品组3所得HPV31 VLP在pH 5.0至5.9,盐浓度500~2000mM下放置14-28天后检测结果详见如下表。
表6 HPV31 L1 VLP 在25℃下放置14-28天粒径检测结果
Figure 259588DEST_PATH_IMAGE006
实施例31:制备含有HPV L1 五聚体或VLP的单价疫苗
将含有各个样品组的HPV31 L1五聚体或VLP蛋白原液分别与氢氧化铝佐剂生理盐水溶液按照蛋白与铝含量1:10比例进行吸附配制即可制得重组HPV L1蛋白质五聚体或VLP疫苗,在4℃保存待用。
实施例19:HPV L1 五聚体和VLP的免疫原性测定
分别取上述L1五聚体或VLP疫苗,加入灭菌过的生理盐水分别稀释成20μg/ml浓度的五聚体或VLP蛋白疫苗,以每只0.1ml肌肉注射BALB/c小鼠,每组10只。小鼠每4周加强免疫一次,共免疫2次。加强免疫4周后,采用假病毒细胞中和实验法分别测定每次免疫后的小鼠血清中针对同型HPV的中和抗体滴度,结果如附图12、13所示。
结果表明,HPV L1五聚体和VLP蛋白疫苗接种小鼠,二次免疫后4周中和抗体即可达到很高的水平。实验结果证明,HPV L1五聚体和组装的VLP疫苗均可以在动物体内产生中和抗体,说明HPV L1五聚体和VLP蛋白质疫苗在人体临床试验中都具有免疫原性,即能预防HPV同型病毒引起的疾病。
SEQUENCE LISTING
<110> 北京康乐卫士生物技术股份有限公司
<120> 31型重组人乳头瘤病毒病毒样颗粒及其制备方法
<130> 2015
<160> 13
<170> PatentIn version 3.3
<210> 1
<211> 1503
<212> DNA
<213> 人工序列
<400> 1
atgtggcggc ctagcgacag cacagtatat gtgcctcctc ctaaccctgt atccaaagtt 60
gttgccacgg atgcttatgt tactcgcacc aacatatttt atcatgccag cagttctaga 120
cttcttgcag tgggacatcc ttatttttcc ataaaacggg ctaacaaaac tgttgtgcca 180
aaggtgtcag gatatcaata cagggtattt aaggtggtgt taccagatcc taacaaattt 240
gcattgcctg actcgtctct tttcgatccc acaacacaac gtttagtatg ggcatgcaca 300
ggcctagagg tgggcagggg acagccatta ggtgtgggtg taagtggaca tcctttccta 360
aataaatatg atgatgttga aaattcaggg agtggtggta accctggaca ggataacagg 420
gttaatgtag gtatggatta taaacaaaca caattatgca tggttggatg tgccccccct 480
ttgggcgagc attggggtaa aggtaaacag tgtactaata cacctgtaca ggctggtgac 540
tgcccgccct tagaacttat taccagtgtt atacaggatg gcgatatggt tgacacaggc 600
tttggtgcta tgaattttgc tgatttgcag accaataaat cagatgttcc tattgacata 660
tgtggcacta catgtaaata tccagattat ttacaaatgg ctgcagaccc atatggtgat 720
agattatttt tttttctacg gaaggaacaa atgtttgcca gacatttttt taacagggct 780
ggcgaggtgg gggaacctgt gcctgataca cttataatta agggtagtgg aaatcgcacg 840
tctgtaggga gtagtatata tgttaacacc ccgagcggct ctttggtgtc ctctgaggca 900
caattgttta ataagccata ttggctacaa aaagcccagg gacataacaa tggtatttgt 960
tggggtaatc aactgtttgt tactgtggta gataccacac gcagtaccaa catgacatta 1020
tgtgcatccg taactacatc ttccacatac accaattctg attataaaga gtacatgcgt 1080
catgtggaag agtatgattt acaatttatt tttcaattat gtagcattac attgtctgct 1140
gaagtaatgg cctatattca cacaatgaat ccctctgttt tggaagactg gaactttggg 1200
ttatcgcctc ccccaaatgg tacattagaa gatacctata ggtatgtgca gtcacaggcc 1260
attacctgtc aaaagcccac tcctgaaaag gaaaagccag atccctataa gaaccttagt 1320
ttttgggagg ttaatttaaa agaaaagttt tctagtgaat tggatcagta tcctttggga 1380
cgcaagtttt tgttacaaag tggatatagg ggacggtcct ctattcgtac aggtgttaag 1440
cgccctgctg tttccaaagc ctctgctgcc cctaaacgta agcgcgccaa aactaaaagg 1500
taa 1503
<210> 2
<211> 1515
<212> DNA
<213> 人工序列
<400> 2
atgtctctgt ggcgtccgtc tgaagctacc gtttacctgc cgccggttcc ggtttctaaa 60
gttgtttcta ccgacgaata cgttacccgt accaacatct actaccacgc tggttctgct 120
cgtctgctga ccgttggtca cccgtactac tctatcccga aatctgacaa cccgaaaaaa 180
atcgttgttc cgaaagtttc tggtctgcag taccgtgttt tccgtgttcg tctgccggac 240
ccgaacaaat tcggtttccc ggacacctct ttctacaacc cggaaaccca gcgtctggtt 300
tgggcttgcg ttggtctgga agttggtcgt ggtcagccgc tgggtgttgg tatctctggt 360
cacccgctgc tgaacaaatt cgacgacacc gaaaactcta accgttacgc tggtggtccg 420
ggtaccgaca accgtgaatg catctctatg gactacaaac agacccagct gtgcctgctg 480
ggttgcaaac cgccgatcgg tgaacactgg ggtaaaggtt ctccgtgctc taacaacgct 540
atcaccccgg gtgactgccc gccgctggaa ctgaaaaact ctgttatcca ggacggtgac 600
atggttgaca ccggtttcgg tgctatggac ttcaccgctc tgcaggacac caaatctaac 660
gttccgctgg acatctgcaa ctctatctgc aaatacccgg actacctgaa aatggttgct 720
gaaccgtacg gtgacaccct gttcttctac ctgcgtcgtg aacagatgtt cgttcgtcac 780
ttcttcaacc gttctggtac cgttggtgaa tctgttccga ccgacctgta catcaaaggt 840
tctggttcta ccgctaccct ggctaactct acctacttcc cgaccccgtc tggttctatg 900
gttacctctg acgctcagat cttcaacaaa ccgtactgga tgcagcgtgc tcagggtcac 960
aacaacggta tctgctgggg taaccagctg ttcgttaccg ttgttgacac cacccgttct 1020
accaacatgt ctgtttgcgc tgctatcgct aactctgaca ccaccttcaa atcttctaac 1080
ttcaaagaat acctgcgtca cggtgaagaa ttcgacctgc agttcatctt ccagctgtgc 1140
aaaatcaccc tgtctgctga catcatgacc tacatccact ctatgaaccc ggctatcctg 1200
gaagactgga acttcggtct gaccaccccg ccgtctggtt ctctggaaga cacctaccgt 1260
ttcgttacct ctcaggctat cacctgccag aaaaccgctc cgcagaaacc gaaagaagac 1320
ccgttcaaag actacgtttt ctgggaagtt aacctgaaag aaaaattctc tgctgacctg 1380
gaccagttcc cgctgggtcg taaattcctg ctgcaggctg gttaccgtgc tcgtccgaaa 1440
ttcaaagctg gtaaacgttc tgctccgtct gcttctacca ccaccccggc taaacgtaaa 1500
aaaaccaaaa aatag 1515
<210> 3
<211> 2208
<212> DNA
<213> 人工序列
<400> 3
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggaagttc tgttccaggg gcccctggga tccatgtctc tgtggcgtcc gtctgaagct 720
accgtttacc tgccgccggt tccggtttct aaagttgttt ctaccgacga atacgttacc 780
cgtaccaaca tctactacca cgctggttct gctcgtctgc tgaccgttgg tcacccgtac 840
tactctatcc cgaaatctga caacccgaaa aaaatcgttg ttccgaaagt ttctggtctg 900
cagtaccgtg ttttccgtgt tcgtctgccg gacccgaaca aattcggttt cccggacacc 960
tctttctaca acccggaaac ccagcgtctg gtttgggctt gcgttggtct ggaagttggt 1020
cgtggtcagc cgctgggtgt tggtatctct ggtcacccgc tgctgaacaa attcgacgac 1080
accgaaaact ctaaccgtta cgctggtggt ccgggtaccg acaaccgtga atgcatctct 1140
atggactaca aacagaccca gctgtgcctg ctgggttgca aaccgccgat cggtgaacac 1200
tggggtaaag gttctccgtg ctctaacaac gctatcaccc cgggtgactg cccgccgctg 1260
gaactgaaaa actctgttat ccaggacggt gacatggttg acaccggttt cggtgctatg 1320
gacttcaccg ctctgcagga caccaaatct aacgttccgc tggacatctg caactctatc 1380
tgcaaatacc cggactacct gaaaatggtt gctgaaccgt acggtgacac cctgttcttc 1440
tacctgcgtc gtgaacagat gttcgttcgt cacttcttca accgttctgg taccgttggt 1500
gaatctgttc cgaccgacct gtacatcaaa ggttctggtt ctaccgctac cctggctaac 1560
tctacctact tcccgacccc gtctggttct atggttacct ctgacgctca gatcttcaac 1620
aaaccgtact ggatgcagcg tgctcagggt cacaacaacg gtatctgctg gggtaaccag 1680
ctgttcgtta ccgttgttga caccacccgt tctaccaaca tgtctgtttg cgctgctatc 1740
gctaactctg acaccacctt caaatcttct aacttcaaag aatacctgcg tcacggtgaa 1800
gaattcgacc tgcagttcat cttccagctg tgcaaaatca ccctgtctgc tgacatcatg 1860
acctacatcc actctatgaa cccggctatc ctggaagact ggaacttcgg tctgaccacc 1920
ccgccgtctg gttctctgga agacacctac cgtttcgtta cctctcaggc tatcacctgc 1980
cagaaaaccg ctccgcagaa accgaaagaa gacccgttca aagactacgt tttctgggaa 2040
gttaacctga aagaaaaatt ctctgctgac ctggaccagt tcccgctggg tcgtaaattc 2100
ctgctgcagg ctggttaccg tgctcgtccg aaattcaaag ctggtaaacg ttctgctccg 2160
tctgcttcta ccaccacccc ggctaaacgt aaaaaaacca aaaaatag 2208
<210> 4
<211> 2490
<212> DNA
<213> 人工序列
<400> 4
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggaagttc tgttccaggg gccctctgac caggaagcta aaccgtctac cgaagacctg 720
ggtgacaaaa aagaaggtga atacatcaaa ctgaaagtta tcggtcagga ctcttctgaa 780
atccacttca aagttaaaat gaccacccac ctgaaaaaac tgaaagaatc ttactgccag 840
cgtcagggtg ttccgatgaa ctctctgcgt ttcctgttcg aaggtcagcg tatcgctgac 900
aaccacaccc cgaaagaact gggtatggaa gaagaagacg ttatcgaagt ttaccaggaa 960
cagaccggtg gatccatgtc tctgtggcgt ccgtctgaag ctaccgttta cctgccgccg 1020
gttccggttt ctaaagttgt ttctaccgac gaatacgtta cccgtaccaa catctactac 1080
cacgctggtt ctgctcgtct gctgaccgtt ggtcacccgt actactctat cccgaaatct 1140
gacaacccga aaaaaatcgt tgttccgaaa gtttctggtc tgcagtaccg tgttttccgt 1200
gttcgtctgc cggacccgaa caaattcggt ttcccggaca cctctttcta caacccggaa 1260
acccagcgtc tggtttgggc ttgcgttggt ctggaagttg gtcgtggtca gccgctgggt 1320
gttggtatct ctggtcaccc gctgctgaac aaattcgacg acaccgaaaa ctctaaccgt 1380
tacgctggtg gtccgggtac cgacaaccgt gaatgcatct ctatggacta caaacagacc 1440
cagctgtgcc tgctgggttg caaaccgccg atcggtgaac actggggtaa aggttctccg 1500
tgctctaaca acgctatcac cccgggtgac tgcccgccgc tggaactgaa aaactctgtt 1560
atccaggacg gtgacatggt tgacaccggt ttcggtgcta tggacttcac cgctctgcag 1620
gacaccaaat ctaacgttcc gctggacatc tgcaactcta tctgcaaata cccggactac 1680
ctgaaaatgg ttgctgaacc gtacggtgac accctgttct tctacctgcg tcgtgaacag 1740
atgttcgttc gtcacttctt caaccgttct ggtaccgttg gtgaatctgt tccgaccgac 1800
ctgtacatca aaggttctgg ttctaccgct accctggcta actctaccta cttcccgacc 1860
ccgtctggtt ctatggttac ctctgacgct cagatcttca acaaaccgta ctggatgcag 1920
cgtgctcagg gtcacaacaa cggtatctgc tggggtaacc agctgttcgt taccgttgtt 1980
gacaccaccc gttctaccaa catgtctgtt tgcgctgcta tcgctaactc tgacaccacc 2040
ttcaaatctt ctaacttcaa agaatacctg cgtcacggtg aagaattcga cctgcagttc 2100
atcttccagc tgtgcaaaat caccctgtct gctgacatca tgacctacat ccactctatg 2160
aacccggcta tcctggaaga ctggaacttc ggtctgacca ccccgccgtc tggttctctg 2220
gaagacacct accgtttcgt tacctctcag gctatcacct gccagaaaac cgctccgcag 2280
aaaccgaaag aagacccgtt caaagactac gttttctggg aagttaacct gaaagaaaaa 2340
ttctctgctg acctggacca gttcccgctg ggtcgtaaat tcctgctgca ggctggttac 2400
cgtgctcgtc cgaaattcaa agctggtaaa cgttctgctc cgtctgcttc taccaccacc 2460
ccggctaaac gtaaaaaaac caaaaaatag 2490
<210> 5
<211> 2688
<212> DNA
<213> 人工序列
<400> 5
atgaaaatcg aagaaggtaa actggtaatc tggattaacg gcgataaagg ctataacggt 60
ctcgctgaag tcggtaagaa attcgagaaa gataccggaa ttaaagtcac cgttgagcat 120
ccggataaac tggaagagaa attcccacag gttgcggcaa ctggcgatgg ccctgacatt 180
atcttctggg cacacgaccg ctttggtggc tacgctcaat ctggcctgtt ggctgaaatc 240
accccggaca aagcgttcca ggacaagctg tatccgttta cctgggatgc cgtacgttac 300
aacggcaagc tgattgctta cccgatcgct gttgaagcgt tatcgctgat ttataacaaa 360
gatctgctgc cgaacccgcc aaaaacctgg gaagagatcc cggcgctgga taaagaactg 420
aaagcgaaag gtaagagcgc gctgatgttc aacctgcaag aaccgtactt cacctggccg 480
ctgattgctg ctgacggggg ttatgcgttc aagtatgaaa acggcaagta cgacattaaa 540
gacgtgggcg tggataacgc tggcgcgaaa gcgggtctga ccttcctggt tgacctgatt 600
aaaaacaaac acatgaatgc agacaccgat tactccatcg cagaagctgc ctttaataaa 660
ggcgaaacag cgatgaccat caacggcccg tgggcatggt ccaacatcga caccagcaaa 720
gtgaattatg gtgtaacggt actgccgacc ttcaagggtc aaccatccaa accgttcgtt 780
ggcgtgctga gcgcaggtat taacgccgcc agtccgaaca aagagctggc aaaagagttc 840
ctcgaaaact atctgctgac tgatgaaggt ctggaagcgg ttaataaaga caaaccgctg 900
ggtgccgtag cgctgaagtc ttacgaggaa gagttggcga aagatccacg tattgccgcc 960
actatggaaa acgcccagaa aggtgaaatc atgccgaaca tcccgcagat gtccgctttc 1020
tggtatgccg tgcgtactgc ggtgatcaac gccgccagcg gtcgtcagac tgtcgatgaa 1080
gccctgaaag acgcgcagac taattcgagc tcgaacaaca acaacaataa caataacaac 1140
aacctcggga tcgagggaag gatttcagaa ttcatgtctc tgtggcgtcc gtctgaagct 1200
accgtttacc tgccgccggt tccggtttct aaagttgttt ctaccgacga atacgttacc 1260
cgtaccaaca tctactacca cgctggttct gctcgtctgc tgaccgttgg tcacccgtac 1320
tactctatcc cgaaatctga caacccgaaa aaaatcgttg ttccgaaagt ttctggtctg 1380
cagtaccgtg ttttccgtgt tcgtctgccg gacccgaaca aattcggttt cccggacacc 1440
tctttctaca acccggaaac ccagcgtctg gtttgggctt gcgttggtct ggaagttggt 1500
cgtggtcagc cgctgggtgt tggtatctct ggtcacccgc tgctgaacaa attcgacgac 1560
accgaaaact ctaaccgtta cgctggtggt ccgggtaccg acaaccgtga atgcatctct 1620
atggactaca aacagaccca gctgtgcctg ctgggttgca aaccgccgat cggtgaacac 1680
tggggtaaag gttctccgtg ctctaacaac gctatcaccc cgggtgactg cccgccgctg 1740
gaactgaaaa actctgttat ccaggacggt gacatggttg acaccggttt cggtgctatg 1800
gacttcaccg ctctgcagga caccaaatct aacgttccgc tggacatctg caactctatc 1860
tgcaaatacc cggactacct gaaaatggtt gctgaaccgt acggtgacac cctgttcttc 1920
tacctgcgtc gtgaacagat gttcgttcgt cacttcttca accgttctgg taccgttggt 1980
gaatctgttc cgaccgacct gtacatcaaa ggttctggtt ctaccgctac cctggctaac 2040
tctacctact tcccgacccc gtctggttct atggttacct ctgacgctca gatcttcaac 2100
aaaccgtact ggatgcagcg tgctcagggt cacaacaacg gtatctgctg gggtaaccag 2160
ctgttcgtta ccgttgttga caccacccgt tctaccaaca tgtctgtttg cgctgctatc 2220
gctaactctg acaccacctt caaatcttct aacttcaaag aatacctgcg tcacggtgaa 2280
gaattcgacc tgcagttcat cttccagctg tgcaaaatca ccctgtctgc tgacatcatg 2340
acctacatcc actctatgaa cccggctatc ctggaagact ggaacttcgg tctgaccacc 2400
ccgccgtctg gttctctgga agacacctac cgtttcgtta cctctcaggc tatcacctgc 2460
cagaaaaccg ctccgcagaa accgaaagaa gacccgttca aagactacgt tttctgggaa 2520
gttaacctga aagaaaaatt ctctgctgac ctggaccagt tcccgctggg tcgtaaattc 2580
ctgctgcagg ctggttaccg tgctcgtccg aaattcaaag ctggtaaacg ttctgctccg 2640
tctgcttcta ccaccacccc ggctaaacgt aaaaaaacca aaaaatag 2688
<210> 6
<211> 1578
<212> DNA
<213> 人工序列
<400> 6
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atgatgtctc tgtggcgtcc gtctgaagct accgtttacc tgccgccggt tccggtttct 120
aaagttgttt ctaccgacga atacgttacc cgtaccaaca tctactacca cgctggttct 180
gctcgtctgc tgaccgttgg tcacccgtac tactctatcc cgaaatctga caacccgaaa 240
aaaatcgttg ttccgaaagt ttctggtctg cagtaccgtg ttttccgtgt tcgtctgccg 300
gacccgaaca aattcggttt cccggacacc tctttctaca acccggaaac ccagcgtctg 360
gtttgggctt gcgttggtct ggaagttggt cgtggtcagc cgctgggtgt tggtatctct 420
ggtcacccgc tgctgaacaa attcgacgac accgaaaact ctaaccgtta cgctggtggt 480
ccgggtaccg acaaccgtga atgcatctct atggactaca aacagaccca gctgtgcctg 540
ctgggttgca aaccgccgat cggtgaacac tggggtaaag gttctccgtg ctctaacaac 600
gctatcaccc cgggtgactg cccgccgctg gaactgaaaa actctgttat ccaggacggt 660
gacatggttg acaccggttt cggtgctatg gacttcaccg ctctgcagga caccaaatct 720
aacgttccgc tggacatctg caactctatc tgcaaatacc cggactacct gaaaatggtt 780
gctgaaccgt acggtgacac cctgttcttc tacctgcgtc gtgaacagat gttcgttcgt 840
cacttcttca accgttctgg taccgttggt gaatctgttc cgaccgacct gtacatcaaa 900
ggttctggtt ctaccgctac cctggctaac tctacctact tcccgacccc gtctggttct 960
atggttacct ctgacgctca gatcttcaac aaaccgtact ggatgcagcg tgctcagggt 1020
cacaacaacg gtatctgctg gggtaaccag ctgttcgtta ccgttgttga caccacccgt 1080
tctaccaaca tgtctgtttg cgctgctatc gctaactctg acaccacctt caaatcttct 1140
aacttcaaag aatacctgcg tcacggtgaa gaattcgacc tgcagttcat cttccagctg 1200
tgcaaaatca ccctgtctgc tgacatcatg acctacatcc actctatgaa cccggctatc 1260
ctggaagact ggaacttcgg tctgaccacc ccgccgtctg gttctctgga agacacctac 1320
cgtttcgtta cctctcaggc tatcacctgc cagaaaaccg ctccgcagaa accgaaagaa 1380
gacccgttca aagactacgt tttctgggaa gttaacctga aagaaaaatt ctctgctgac 1440
ctggaccagt tcccgctggg tcgtaaattc ctgctgcagg ctggttaccg tgctcgtccg 1500
aaattcaaag ctggtaaacg ttctgctccg tctgcttcta ccaccacccc ggctaaacgt 1560
aaaaaaacca aaaaatag 1578
<210> 7
<211> 1869
<212> DNA
<213> 人工序列
<400> 7
atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60
atgtctgacc aggaagctaa accgtctacc gaagacctgg gtgacaaaaa agaaggtgaa 120
tacatcaaac tgaaagttat cggtcaggac tcttctgaaa tccacttcaa agttaaaatg 180
accacccacc tgaaaaaact gaaagaatct tactgccagc gtcagggtgt tccgatgaac 240
tctctgcgtt tcctgttcga aggtcagcgt atcgctgaca accacacccc gaaagaactg 300
ggtatggaag aagaagacgt tatcgaagtt taccaggaac agaccggtgg atccatgtct 360
ctgtggcgtc cgtctgaagc taccgtttac ctgccgccgg ttccggtttc taaagttgtt 420
tctaccgacg aatacgttac ccgtaccaac atctactacc acgctggttc tgctcgtctg 480
ctgaccgttg gtcacccgta ctactctatc ccgaaatctg acaacccgaa aaaaatcgtt 540
gttccgaaag tttctggtct gcagtaccgt gttttccgtg ttcgtctgcc ggacccgaac 600
aaattcggtt tcccggacac ctctttctac aacccggaaa cccagcgtct ggtttgggct 660
tgcgttggtc tggaagttgg tcgtggtcag ccgctgggtg ttggtatctc tggtcacccg 720
ctgctgaaca aattcgacga caccgaaaac tctaaccgtt acgctggtgg tccgggtacc 780
gacaaccgtg aatgcatctc tatggactac aaacagaccc agctgtgcct gctgggttgc 840
aaaccgccga tcggtgaaca ctggggtaaa ggttctccgt gctctaacaa cgctatcacc 900
ccgggtgact gcccgccgct ggaactgaaa aactctgtta tccaggacgg tgacatggtt 960
gacaccggtt tcggtgctat ggacttcacc gctctgcagg acaccaaatc taacgttccg 1020
ctggacatct gcaactctat ctgcaaatac ccggactacc tgaaaatggt tgctgaaccg 1080
tacggtgaca ccctgttctt ctacctgcgt cgtgaacaga tgttcgttcg tcacttcttc 1140
aaccgttctg gtaccgttgg tgaatctgtt ccgaccgacc tgtacatcaa aggttctggt 1200
tctaccgcta ccctggctaa ctctacctac ttcccgaccc cgtctggttc tatggttacc 1260
tctgacgctc agatcttcaa caaaccgtac tggatgcagc gtgctcaggg tcacaacaac 1320
ggtatctgct ggggtaacca gctgttcgtt accgttgttg acaccacccg ttctaccaac 1380
atgtctgttt gcgctgctat cgctaactct gacaccacct tcaaatcttc taacttcaaa 1440
gaatacctgc gtcacggtga agaattcgac ctgcagttca tcttccagct gtgcaaaatc 1500
accctgtctg ctgacatcat gacctacatc cactctatga acccggctat cctggaagac 1560
tggaacttcg gtctgaccac cccgccgtct ggttctctgg aagacaccta ccgtttcgtt 1620
acctctcagg ctatcacctg ccagaaaacc gctccgcaga aaccgaaaga agacccgttc 1680
aaagactacg ttttctggga agttaacctg aaagaaaaat tctctgctga cctggaccag 1740
ttcccgctgg gtcgtaaatt cctgctgcag gctggttacc gtgctcgtcc gaaattcaaa 1800
gctggtaaac gttctgctcc gtctgcttct accaccaccc cggctaaacg taaaaaaacc 1860
aaaaaatag 1869
<210> 8
<211> 735
<212> PRT
<213> 人工序列
<400> 8
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Glu Val Leu
210 215 220
Phe Gln Gly Pro Leu Gly Ser Met Ser Leu Trp Arg Pro Ser Glu Ala
225 230 235 240
Thr Val Tyr Leu Pro Pro Val Pro Val Ser Lys Val Val Ser Thr Asp
245 250 255
Glu Tyr Val Thr Arg Thr Asn Ile Tyr Tyr His Ala Gly Ser Ala Arg
260 265 270
Leu Leu Thr Val Gly His Pro Tyr Tyr Ser Ile Pro Lys Ser Asp Asn
275 280 285
Pro Lys Lys Ile Val Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val
290 295 300
Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr
305 310 315 320
Ser Phe Tyr Asn Pro Glu Thr Gln Arg Leu Val Trp Ala Cys Val Gly
325 330 335
Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His
340 345 350
Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu Asn Ser Asn Arg Tyr Ala
355 360 365
Gly Gly Pro Gly Thr Asp Asn Arg Glu Cys Ile Ser Met Asp Tyr Lys
370 375 380
Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Ile Gly Glu His
385 390 395 400
Trp Gly Lys Gly Ser Pro Cys Ser Asn Asn Ala Ile Thr Pro Gly Asp
405 410 415
Cys Pro Pro Leu Glu Leu Lys Asn Ser Val Ile Gln Asp Gly Asp Met
420 425 430
Val Asp Thr Gly Phe Gly Ala Met Asp Phe Thr Ala Leu Gln Asp Thr
435 440 445
Lys Ser Asn Val Pro Leu Asp Ile Cys Asn Ser Ile Cys Lys Tyr Pro
450 455 460
Asp Tyr Leu Lys Met Val Ala Glu Pro Tyr Gly Asp Thr Leu Phe Phe
465 470 475 480
Tyr Leu Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ser
485 490 495
Gly Thr Val Gly Glu Ser Val Pro Thr Asp Leu Tyr Ile Lys Gly Ser
500 505 510
Gly Ser Thr Ala Thr Leu Ala Asn Ser Thr Tyr Phe Pro Thr Pro Ser
515 520 525
Gly Ser Met Val Thr Ser Asp Ala Gln Ile Phe Asn Lys Pro Tyr Trp
530 535 540
Met Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln
545 550 555 560
Leu Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Ser Val
565 570 575
Cys Ala Ala Ile Ala Asn Ser Asp Thr Thr Phe Lys Ser Ser Asn Phe
580 585 590
Lys Glu Tyr Leu Arg His Gly Glu Glu Phe Asp Leu Gln Phe Ile Phe
595 600 605
Gln Leu Cys Lys Ile Thr Leu Ser Ala Asp Ile Met Thr Tyr Ile His
610 615 620
Ser Met Asn Pro Ala Ile Leu Glu Asp Trp Asn Phe Gly Leu Thr Thr
625 630 635 640
Pro Pro Ser Gly Ser Leu Glu Asp Thr Tyr Arg Phe Val Thr Ser Gln
645 650 655
Ala Ile Thr Cys Gln Lys Thr Ala Pro Gln Lys Pro Lys Glu Asp Pro
660 665 670
Phe Lys Asp Tyr Val Phe Trp Glu Val Asn Leu Lys Glu Lys Phe Ser
675 680 685
Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala
690 695 700
Gly Tyr Arg Ala Arg Pro Lys Phe Lys Ala Gly Lys Arg Ser Ala Pro
705 710 715 720
Ser Ala Ser Thr Thr Thr Pro Ala Lys Arg Lys Lys Thr Lys Lys
725 730 735
<210> 9
<211> 829
<212> PRT
<213> 人工序列
<400> 9
Met Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro
1 5 10 15
Thr Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu
20 25 30
Tyr Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu
35 40 45
Gly Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys
50 55 60
Leu Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn
65 70 75 80
Met Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu
85 90 95
Gly Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser
100 105 110
Lys Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu
115 120 125
Met Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn
130 135 140
Gly Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp
145 150 155 160
Val Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu
165 170 175
Val Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr
180 185 190
Leu Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala
195 200 205
Thr Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Glu Val Leu
210 215 220
Phe Gln Gly Pro Ser Asp Gln Glu Ala Lys Pro Ser Thr Glu Asp Leu
225 230 235 240
Gly Asp Lys Lys Glu Gly Glu Tyr Ile Lys Leu Lys Val Ile Gly Gln
245 250 255
Asp Ser Ser Glu Ile His Phe Lys Val Lys Met Thr Thr His Leu Lys
260 265 270
Lys Leu Lys Glu Ser Tyr Cys Gln Arg Gln Gly Val Pro Met Asn Ser
275 280 285
Leu Arg Phe Leu Phe Glu Gly Gln Arg Ile Ala Asp Asn His Thr Pro
290 295 300
Lys Glu Leu Gly Met Glu Glu Glu Asp Val Ile Glu Val Tyr Gln Glu
305 310 315 320
Gln Thr Gly Gly Ser Met Ser Leu Trp Arg Pro Ser Glu Ala Thr Val
325 330 335
Tyr Leu Pro Pro Val Pro Val Ser Lys Val Val Ser Thr Asp Glu Tyr
340 345 350
Val Thr Arg Thr Asn Ile Tyr Tyr His Ala Gly Ser Ala Arg Leu Leu
355 360 365
Thr Val Gly His Pro Tyr Tyr Ser Ile Pro Lys Ser Asp Asn Pro Lys
370 375 380
Lys Ile Val Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val Phe Arg
385 390 395 400
Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr Ser Phe
405 410 415
Tyr Asn Pro Glu Thr Gln Arg Leu Val Trp Ala Cys Val Gly Leu Glu
420 425 430
Val Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His Pro Leu
435 440 445
Leu Asn Lys Phe Asp Asp Thr Glu Asn Ser Asn Arg Tyr Ala Gly Gly
450 455 460
Pro Gly Thr Asp Asn Arg Glu Cys Ile Ser Met Asp Tyr Lys Gln Thr
465 470 475 480
Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Ile Gly Glu His Trp Gly
485 490 495
Lys Gly Ser Pro Cys Ser Asn Asn Ala Ile Thr Pro Gly Asp Cys Pro
500 505 510
Pro Leu Glu Leu Lys Asn Ser Val Ile Gln Asp Gly Asp Met Val Asp
515 520 525
Thr Gly Phe Gly Ala Met Asp Phe Thr Ala Leu Gln Asp Thr Lys Ser
530 535 540
Asn Val Pro Leu Asp Ile Cys Asn Ser Ile Cys Lys Tyr Pro Asp Tyr
545 550 555 560
Leu Lys Met Val Ala Glu Pro Tyr Gly Asp Thr Leu Phe Phe Tyr Leu
565 570 575
Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ser Gly Thr
580 585 590
Val Gly Glu Ser Val Pro Thr Asp Leu Tyr Ile Lys Gly Ser Gly Ser
595 600 605
Thr Ala Thr Leu Ala Asn Ser Thr Tyr Phe Pro Thr Pro Ser Gly Ser
610 615 620
Met Val Thr Ser Asp Ala Gln Ile Phe Asn Lys Pro Tyr Trp Met Gln
625 630 635 640
Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln Leu Phe
645 650 655
Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Ser Val Cys Ala
660 665 670
Ala Ile Ala Asn Ser Asp Thr Thr Phe Lys Ser Ser Asn Phe Lys Glu
675 680 685
Tyr Leu Arg His Gly Glu Glu Phe Asp Leu Gln Phe Ile Phe Gln Leu
690 695 700
Cys Lys Ile Thr Leu Ser Ala Asp Ile Met Thr Tyr Ile His Ser Met
705 710 715 720
Asn Pro Ala Ile Leu Glu Asp Trp Asn Phe Gly Leu Thr Thr Pro Pro
725 730 735
Ser Gly Ser Leu Glu Asp Thr Tyr Arg Phe Val Thr Ser Gln Ala Ile
740 745 750
Thr Cys Gln Lys Thr Ala Pro Gln Lys Pro Lys Glu Asp Pro Phe Lys
755 760 765
Asp Tyr Val Phe Trp Glu Val Asn Leu Lys Glu Lys Phe Ser Ala Asp
770 775 780
Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala Gly Tyr
785 790 795 800
Arg Ala Arg Pro Lys Phe Lys Ala Gly Lys Arg Ser Ala Pro Ser Ala
805 810 815
Ser Thr Thr Thr Pro Ala Lys Arg Lys Lys Thr Lys Lys
820 825
<210> 10
<211> 895
<212> PRT
<213> 人工序列
<400> 10
Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys
1 5 10 15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr
20 25 30
Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe
35 40 45
Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala
50 55 60
His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile
65 70 75 80
Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp
85 90 95
Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu
100 105 110
Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys
115 120 125
Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly
130 135 140
Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro
145 150 155 160
Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys
165 170 175
Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly
180 185 190
Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp
195 200 205
Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala
210 215 220
Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys
225 230 235 240
Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser
245 250 255
Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro
260 265 270
Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp
275 280 285
Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala
290 295 300
Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala
305 310 315 320
Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln
325 330 335
Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala
340 345 350
Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Asn
355 360 365
Ser Ser Ser Asn Asn Asn Asn Asn Asn Asn Asn Asn Asn Leu Gly Ile
370 375 380
Glu Gly Arg Ile Ser Glu Phe Met Ser Leu Trp Arg Pro Ser Glu Ala
385 390 395 400
Thr Val Tyr Leu Pro Pro Val Pro Val Ser Lys Val Val Ser Thr Asp
405 410 415
Glu Tyr Val Thr Arg Thr Asn Ile Tyr Tyr His Ala Gly Ser Ala Arg
420 425 430
Leu Leu Thr Val Gly His Pro Tyr Tyr Ser Ile Pro Lys Ser Asp Asn
435 440 445
Pro Lys Lys Ile Val Val Pro Lys Val Ser Gly Leu Gln Tyr Arg Val
450 455 460
Phe Arg Val Arg Leu Pro Asp Pro Asn Lys Phe Gly Phe Pro Asp Thr
465 470 475 480
Ser Phe Tyr Asn Pro Glu Thr Gln Arg Leu Val Trp Ala Cys Val Gly
485 490 495
Leu Glu Val Gly Arg Gly Gln Pro Leu Gly Val Gly Ile Ser Gly His
500 505 510
Pro Leu Leu Asn Lys Phe Asp Asp Thr Glu Asn Ser Asn Arg Tyr Ala
515 520 525
Gly Gly Pro Gly Thr Asp Asn Arg Glu Cys Ile Ser Met Asp Tyr Lys
530 535 540
Gln Thr Gln Leu Cys Leu Leu Gly Cys Lys Pro Pro Ile Gly Glu His
545 550 555 560
Trp Gly Lys Gly Ser Pro Cys Ser Asn Asn Ala Ile Thr Pro Gly Asp
565 570 575
Cys Pro Pro Leu Glu Leu Lys Asn Ser Val Ile Gln Asp Gly Asp Met
580 585 590
Val Asp Thr Gly Phe Gly Ala Met Asp Phe Thr Ala Leu Gln Asp Thr
595 600 605
Lys Ser Asn Val Pro Leu Asp Ile Cys Asn Ser Ile Cys Lys Tyr Pro
610 615 620
Asp Tyr Leu Lys Met Val Ala Glu Pro Tyr Gly Asp Thr Leu Phe Phe
625 630 635 640
Tyr Leu Arg Arg Glu Gln Met Phe Val Arg His Phe Phe Asn Arg Ser
645 650 655
Gly Thr Val Gly Glu Ser Val Pro Thr Asp Leu Tyr Ile Lys Gly Ser
660 665 670
Gly Ser Thr Ala Thr Leu Ala Asn Ser Thr Tyr Phe Pro Thr Pro Ser
675 680 685
Gly Ser Met Val Thr Ser Asp Ala Gln Ile Phe Asn Lys Pro Tyr Trp
690 695 700
Met Gln Arg Ala Gln Gly His Asn Asn Gly Ile Cys Trp Gly Asn Gln
705 710 715 720
Leu Phe Val Thr Val Val Asp Thr Thr Arg Ser Thr Asn Met Ser Val
725 730 735
Cys Ala Ala Ile Ala Asn Ser Asp Thr Thr Phe Lys Ser Ser Asn Phe
740 745 750
Lys Glu Tyr Leu Arg His Gly Glu Glu Phe Asp Leu Gln Phe Ile Phe
755 760 765
Gln Leu Cys Lys Ile Thr Leu Ser Ala Asp Ile Met Thr Tyr Ile His
770 775 780
Ser Met Asn Pro Ala Ile Leu Glu Asp Trp Asn Phe Gly Leu Thr Thr
785 790 795 800
Pro Pro Ser Gly Ser Leu Glu Asp Thr Tyr Arg Phe Val Thr Ser Gln
805 810 815
Ala Ile Thr Cys Gln Lys Thr Ala Pro Gln Lys Pro Lys Glu Asp Pro
820 825 830
Phe Lys Asp Tyr Val Phe Trp Glu Val Asn Leu Lys Glu Lys Phe Ser
835 840 845
Ala Asp Leu Asp Gln Phe Pro Leu Gly Arg Lys Phe Leu Leu Gln Ala
850 855 860
Gly Tyr Arg Ala Arg Pro Lys Phe Lys Ala Gly Lys Arg Ser Ala Pro
865 870 875 880
Ser Ala Ser Thr Thr Thr Pro Ala Lys Arg Lys Lys Thr Lys Lys
885 890 895
<210> 11
<211> 2100
<212> DNA
<213> 人工序列
<400> 11
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggaagttc tgttccaggg gccctctgaa gctaccgttt acctgccgcc ggttccggtt 720
tctaaagttg tttctaccga cgaatacgtt acccgtacca acatctacta ccacgctggt 780
tctgctcgtc tgctgaccgt tggtcacccg tactactcta tcccgaaatc tgacaacccg 840
aaaaaaatcg ttgttccgaa agtttctggt ctgcagtacc gtgttttccg tgttcgtctg 900
ccggacccga acaaattcgg tttcccggac acctctttct acaacccgga aacccagcgt 960
ctggtttggg cttgcgttgg tctggaagtt ggtcgtggtc agccgctggg tgttggtatc 1020
tctggtcacc cgctgctgaa caaattcgac gacaccgaaa actctaaccg ttacgctggt 1080
ggtccgggta ccgacaaccg tgaatgcatc tctatggact acaaacagac ccagctgtgc 1140
ctgctgggtt gcaaaccgcc gatcggtgaa cactggggta aaggttctcc gtgctctaac 1200
aacgctatca ccccgggtga ctgcccgccg ctggaactga aaaactctgt tatccaggac 1260
ggtgacatgg ttgacaccgg tttcggtgct atggacttca ccgctctgca ggacaccaaa 1320
tctaacgttc cgctggacat ctgcaactct atctgcaaat acccggacta cctgaaaatg 1380
gttgctgaac cgtacggtga caccctgttc ttctacctgc gtcgtgaaca gatgttcgtt 1440
cgtcacttct tcaaccgttc tggtaccgtt ggtgaatctg ttccgaccga cctgtacatc 1500
aaaggttctg gttctaccgc taccctggct aactctacct acttcccgac cccgtctggt 1560
tctatggtta cctctgacgc tcagatcttc aacaaaccgt actggatgca gcgtgctcag 1620
ggtcacaaca acggtatctg ctggggtaac cagctgttcg ttaccgttgt tgacaccacc 1680
cgttctacca acatgtctgt ttgcgctgct atcgctaact ctgacaccac cttcaaatct 1740
tctaacttca aagaatacct gcgtcacggt gaagaattcg acctgcagtt catcttccag 1800
ctgtgcaaaa tcaccctgtc tgctgacatc atgacctaca tccactctat gaacccggct 1860
atcctggaag actggaactt cggtctgacc accccgccgt ctggttctct ggaagacacc 1920
taccgtttcg ttacctctca ggctatcacc tgccagaaaa ccgctccgca gaaaccgaaa 1980
gaagacccgt tcaaagacta cgttttctgg gaagttaacc tgaaagaaaa attctctgct 2040
gacctggacc agttcccgct gggtcgtaaa ttcctgctgc aggctggtta ccgtgcttag 2100
<210> 12
<211> 2472
<212> DNA
<213> 人工序列
<400> 12
atgtccccta tactaggtta ttggaaaatt aagggccttg tgcaacccac tcgacttctt 60
ttggaatatc ttgaagaaaa atatgaagag catttgtatg agcgcgatga aggtgataaa 120
tggcgaaaca aaaagtttga attgggtttg gagtttccca atcttcctta ttatattgat 180
ggtgatgtta aattaacaca gtctatggcc atcatacgtt atatagctga caagcacaac 240
atgttgggtg gttgtccaaa agagcgtgca gagatttcaa tgcttgaagg agcggttttg 300
gatattagat acggtgtttc gagaattgca tatagtaaag actttgaaac tctcaaagtt 360
gattttctta gcaagctacc tgaaatgctg aaaatgttcg aagatcgttt atgtcataaa 420
acatatttaa atggtgatca tgtaacccat cctgacttca tgttgtatga cgctcttgat 480
gttgttttat acatggaccc aatgtgcctg gatgcgttcc caaaattagt ttgttttaaa 540
aaacgtattg aagctatccc acaaattgat aagtacttga aatccagcaa gtatatagca 600
tggcctttgc agggctggca agccacgttt ggtggtggcg accatcctcc aaaatcggat 660
ctggaagttc tgttccaggg gccctctgac caggaagcta aaccgtctac cgaagacctg 720
ggtgacaaaa aagaaggtga atacatcaaa ctgaaagtta tcggtcagga ctcttctgaa 780
atccacttca aagttaaaat gaccacccac ctgaaaaaac tgaaagaatc ttactgccag 840
cgtcagggtg ttccgatgaa ctctctgcgt ttcctgttcg aaggtcagcg tatcgctgac 900
aaccacaccc cgaaagaact gggtatggaa gaagaagacg ttatcgaagt ttaccaggaa 960
cagaccggtg gatcctctga agctaccgtt tacctgccgc cggttccggt ttctaaagtt 1020
gtttctaccg acgaatacgt tacccgtacc aacatctact accacgctgg ttctgctcgt 1080
ctgctgaccg ttggtcaccc gtactactct atcccgaaat ctgacaaccc gaaaaaaatc 1140
gttgttccga aagtttctgg tctgcagtac cgtgttttcc gtgttcgtct gccggacccg 1200
aacaaattcg gtttcccgga cacctctttc tacaacccgg aaacccagcg tctggtttgg 1260
gcttgcgttg gtctggaagt tggtcgtggt cagccgctgg gtgttggtat ctctggtcac 1320
ccgctgctga acaaattcga cgacaccgaa aactctaacc gttacgctgg tggtccgggt 1380
accgacaacc gtgaatgcat ctctatggac tacaaacaga cccagctgtg cctgctgggt 1440
tgcaaaccgc cgatcggtga acactggggt aaaggttctc cgtgctctaa caacgctatc 1500
accccgggtg actgcccgcc gctggaactg aaaaactctg ttatccagga cggtgacatg 1560
gttgacaccg gtttcggtgc tatggacttc accgctctgc aggacaccaa atctaacgtt 1620
ccgctggaca tctgcaactc tatctgcaaa tacccggact acctgaaaat ggttgctgaa 1680
ccgtacggtg acaccctgtt cttctacctg cgtcgtgaac agatgttcgt tcgtcacttc 1740
ttcaaccgtt ctggtaccgt tggtgaatct gttccgaccg acctgtacat caaaggttct 1800
ggttctaccg ctaccctggc taactctacc tacttcccga ccccgtctgg ttctatggtt 1860
acctctgacg ctcagatctt caacaaaccg tactggatgc agcgtgctca gggtcacaac 1920
aacggtatct gctggggtaa ccagctgttc gttaccgttg ttgacaccac ccgttctacc 1980
aacatgtctg tttgcgctgc tatcgctaac tctgacacca ccttcaaatc ttctaacttc 2040
aaagaatacc tgcgtcacgg tgaagaattc gacctgcagt tcatcttcca gctgtgcaaa 2100
atcaccctgt ctgctgacat catgacctac atccactcta tgaacccggc tatcctggaa 2160
gactggaact tcggtctgac caccccgccg tctggttctc tggaagacac ctaccgtttc 2220
gttacctctc aggctatcac ctgccagaaa accgctccgc agaaaccgaa agaagacccg 2280
ttcaaagact acgttttctg ggaagttaac ctgaaagaaa aattctctgc tgacctggac 2340
cagttcccgc tgggtcgtaa attcctgctg caggctggtt accgtgctcg tccgaaattc 2400
aaagctggta aacgttctgc tccgtctgct tctaccacca ccccggctaa acgtaaaaaa 2460
accaaaaaat ag 2472
<210> 13
<211> 2643
<212> DNA
<213> 人工序列
<400> 13
atgaaaatcg aagaaggtaa actggtaatc tggattaacg gcgataaagg ctataacggt 60
ctcgctgaag tcggtaagaa attcgagaaa gataccggaa ttaaagtcac cgttgagcat 120
ccggataaac tggaagagaa attcccacag gttgcggcaa ctggcgatgg ccctgacatt 180
atcttctggg cacacgaccg ctttggtggc tacgctcaat ctggcctgtt ggctgaaatc 240
accccggaca aagcgttcca ggacaagctg tatccgttta cctgggatgc cgtacgttac 300
aacggcaagc tgattgctta cccgatcgct gttgaagcgt tatcgctgat ttataacaaa 360
gatctgctgc cgaacccgcc aaaaacctgg gaagagatcc cggcgctgga taaagaactg 420
aaagcgaaag gtaagagcgc gctgatgttc aacctgcaag aaccgtactt cacctggccg 480
ctgattgctg ctgacggggg ttatgcgttc aagtatgaaa acggcaagta cgacattaaa 540
gacgtgggcg tggataacgc tggcgcgaaa gcgggtctga ccttcctggt tgacctgatt 600
aaaaacaaac acatgaatgc agacaccgat tactccatcg cagaagctgc ctttaataaa 660
ggcgaaacag cgatgaccat caacggcccg tgggcatggt ccaacatcga caccagcaaa 720
gtgaattatg gtgtaacggt actgccgacc ttcaagggtc aaccatccaa accgttcgtt 780
ggcgtgctga gcgcaggtat taacgccgcc agtccgaaca aagagctggc aaaagagttc 840
ctcgaaaact atctgctgac tgatgaaggt ctggaagcgg ttaataaaga caaaccgctg 900
ggtgccgtag cgctgaagtc ttacgaggaa gagttggcga aagatccacg tattgccgcc 960
actatggaaa acgcccagaa aggtgaaatc atgccgaaca tcccgcagat gtccgctttc 1020
tggtatgccg tgcgtactgc ggtgatcaac gccgccagcg gtcgtcagac tgtcgatgaa 1080
gccctgaaag acgcgcagac taattcgagc tcgaacaaca acaacaataa caataacaac 1140
aacctcggga tcgagggaag gatttcagaa ttcatgtctc tgtggcgtcc gtctgaagct 1200
accgtttacc tgccgccggt tccggtttct aaagttgttt ctaccgacga atacgttacc 1260
cgtaccaaca tctactacca cgctggttct gctcgtctgc tgaccgttgg tcacccgtac 1320
tactctatcc cgaaatctga caacccgaaa aaaatcgttg ttccgaaagt ttctggtctg 1380
cagtaccgtg ttttccgtgt tcgtctgccg gacccgaaca aattcggttt cccggacacc 1440
tctttctaca acccggaaac ccagcgtctg gtttgggctt gcgttggtct ggaagttggt 1500
cgtggtcagc cgctgggtgt tggtatctct ggtcacccgc tgctgaacaa attcgacgac 1560
accgaaaact ctaaccgtta cgctggtggt ccgggtaccg acaaccgtga atgcatctct 1620
atggactaca aacagaccca gctgtgcctg ctgggttgca aaccgccgat cggtgaacac 1680
tggggtaaag gttctccgtg ctctaacaac gctatcaccc cgggtgactg cccgccgctg 1740
gaactgaaaa actctgttat ccaggacggt gacatggttg acaccggttt cggtgctatg 1800
gacttcaccg ctctgcagga caccaaatct aacgttccgc tggacatctg caactctatc 1860
tgcaaatacc cggactacct gaaaatggtt gctgaaccgt acggtgacac cctgttcttc 1920
tacctgcgtc gtgaacagat gttcgttcgt cacttcttca accgttctgg taccgttggt 1980
gaatctgttc cgaccgacct gtacatcaaa ggttctggtt ctaccgctac cctggctaac 2040
tctacctact tcccgacccc gtctggttct atggttacct ctgacgctca gatcttcaac 2100
aaaccgtact ggatgcagcg tgctcagggt cacaacaacg gtatctgctg gggtaaccag 2160
ctgttcgtta ccgttgttga caccacccgt tctaccaaca tgtctgtttg cgctgctatc 2220
gctaactctg acaccacctt caaatcttct aacttcaaag aatacctgcg tcacggtgaa 2280
gaattcgacc tgcagttcat cttccagctg tgcaaaatca ccctgtctgc tgacatcatg 2340
acctacatcc actctatgaa cccggctatc ctggaagact ggaacttcgg tctgaccacc 2400
ccgccgtctg gttctctgga agacacctac cgtttcgtta cctctcaggc tatcacctgc 2460
cagaaaaccg ctccgcagaa accgaaagaa gacccgttca aagactacgt tttctgggaa 2520
gttaacctga aagaaaaatt ctctgctgac ctggaccagt tcccgctggg tcgtaaattc 2580
ctgctgcagg ctggttaccg tgctcgtccg aaattcaaag ctggtaaacg ttctgctccg 2640
taa 2643

Claims (6)

1.一种经大肠杆菌偏好密码子优化的编码人乳头瘤病毒HPV31 L1的融合基因,其特征在于,优化的编码人乳头瘤病毒HPV31 L1的基因核苷酸序列如SEQ ID NO.2所示,并融合有编码GST-SUMO的编码核苷酸序列。
2.如权利要求1所述的融合基因,其特征在于,该融合基因编码的氨基酸序列如SEQ IDNO:9所示。
3.如权利要求1所述的融合基因,其特征在于,该融合基因的核苷酸序列如为SEQ IDNO:4所示。
4.一种大肠杆菌表达载体,其特征在于该载体包括具有权利要求1-3任一项所述融合基因。
5.如权利要求4所述的大肠杆菌表达载体,其特征在于,出发载体为pGEX-6p-1、pGEX-4T-2、pMAL或pET28a。
6.一种工程菌细胞,该细胞包含权利要求1-3任一项所述的基因,或权利要求4或5所述的表达载体。
CN201510490172.6A 2015-08-12 2015-08-12 31型重组人乳头瘤病毒病毒样颗粒及其制备方法 Active CN106701797B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510490172.6A CN106701797B (zh) 2015-08-12 2015-08-12 31型重组人乳头瘤病毒病毒样颗粒及其制备方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510490172.6A CN106701797B (zh) 2015-08-12 2015-08-12 31型重组人乳头瘤病毒病毒样颗粒及其制备方法

Publications (2)

Publication Number Publication Date
CN106701797A CN106701797A (zh) 2017-05-24
CN106701797B true CN106701797B (zh) 2021-06-15

Family

ID=58929859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510490172.6A Active CN106701797B (zh) 2015-08-12 2015-08-12 31型重组人乳头瘤病毒病毒样颗粒及其制备方法

Country Status (1)

Country Link
CN (1) CN106701797B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021013062A1 (zh) * 2019-07-19 2021-01-28 神州细胞工程有限公司 嵌合的人乳头瘤病毒31型l1蛋白
CN114716561B (zh) * 2021-01-04 2024-03-12 中国医学科学院基础医学研究所 一种人乳头瘤病毒31型嵌合蛋白及其用途
CN113528544B (zh) * 2021-06-02 2022-07-08 郑州大学 编码可溶性hpv23 l1蛋白的基因及其重组质粒的构建与应用

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1259051A (zh) * 1997-04-08 2000-07-05 麦克公司 稳定化后的人乳头瘤病毒制剂
CN1761759A (zh) * 2003-03-24 2006-04-19 麦克公司 Hpv31l1在酵母中的优化表达
CN101016542A (zh) * 2007-02-14 2007-08-15 马润林 一种提高人乳头瘤病毒l1蛋白原核表达产率的方法
CN101217976A (zh) * 2005-04-26 2008-07-09 葛兰素史密丝克莱恩生物有限公司 疫苗
CN101245099A (zh) * 2007-02-14 2008-08-20 马润林 重组人乳头瘤病毒l1衣壳蛋白的氨基酸序列及其应用
CN103936840A (zh) * 2013-01-18 2014-07-23 北京康乐卫士生物技术股份有限公司 重组的人乳头瘤病毒33型l1蛋白及其用途
CN104212818A (zh) * 2013-06-04 2014-12-17 厦门大学 一种优化的人乳头瘤病毒31型l1蛋白的基因序列
CN104710515A (zh) * 2013-12-17 2015-06-17 北京康乐卫士生物技术股份有限公司 人乳头瘤病毒l1蛋白突变体及其制备方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1259051A (zh) * 1997-04-08 2000-07-05 麦克公司 稳定化后的人乳头瘤病毒制剂
CN1761759A (zh) * 2003-03-24 2006-04-19 麦克公司 Hpv31l1在酵母中的优化表达
CN101217976A (zh) * 2005-04-26 2008-07-09 葛兰素史密丝克莱恩生物有限公司 疫苗
CN101016542A (zh) * 2007-02-14 2007-08-15 马润林 一种提高人乳头瘤病毒l1蛋白原核表达产率的方法
CN101245099A (zh) * 2007-02-14 2008-08-20 马润林 重组人乳头瘤病毒l1衣壳蛋白的氨基酸序列及其应用
CN103936840A (zh) * 2013-01-18 2014-07-23 北京康乐卫士生物技术股份有限公司 重组的人乳头瘤病毒33型l1蛋白及其用途
CN104212818A (zh) * 2013-06-04 2014-12-17 厦门大学 一种优化的人乳头瘤病毒31型l1蛋白的基因序列
CN104710515A (zh) * 2013-12-17 2015-06-17 北京康乐卫士生物技术股份有限公司 人乳头瘤病毒l1蛋白突变体及其制备方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Comparison of the immunogenicity of the human papillomavirus (HPV)-16/18 vaccine and the HPV-6/11/16/18 vaccine for oncogenic non-vaccine types HPV-31 and HPV-45 in healthy women aged 18–45 years;Mark H. Einstein;《Human Vaccines》;20111201;第7卷(第12期);第1359-1370页 *

Also Published As

Publication number Publication date
CN106701797A (zh) 2017-05-24

Similar Documents

Publication Publication Date Title
CN105039359B (zh) 16型重组人乳头瘤病毒病毒样颗粒及其制备方法
CN112358533B (zh) 重组刺突蛋白及其制备方法和用途
DK2154147T3 (en) Truncated L1 protein of human papillomavirus 16
CN106399329B (zh) 33型重组人乳头瘤病毒病毒样颗粒及其制备方法
CN106831958B (zh) 一种人乳头瘤病毒11型l1蛋白的突变体
CN106701797B (zh) 31型重组人乳头瘤病毒病毒样颗粒及其制备方法
CN110551183A (zh) 一种人乳头瘤病毒39型l1蛋白的突变体
CN106831959A (zh) 一种人乳头瘤病毒33型l1蛋白的突变体
WO2008145021A1 (en) A truncated l1 protein of human papillomavirus 6
CN106701796B (zh) 52型重组人乳头瘤病毒病毒样颗粒及其制备方法
EP2479186A1 (en) Genes encoding major capsid protein L1 of human papilloma viruses
CN103936840B (zh) 重组的人乳头瘤病毒33型l1蛋白及其用途
US11213580B2 (en) Mutant of L1 protein of human papillomavirus type 16
CN110551184A (zh) 一种人乳头瘤病毒56型l1蛋白的突变体
CN110551185A (zh) 一种人乳头瘤病毒68型l1蛋白的突变体
CN110950935A (zh) 一种人乳头瘤病毒51型l1蛋白的突变体
CN106701798B (zh) 45型重组人乳头瘤病毒病毒样颗粒及其制备方法
CN104045695B (zh) 重组的人乳头瘤病毒18型l1蛋白及其用途
WO2019233400A1 (zh) 一种人乳头瘤病毒66型l1蛋白的突变体
WO2019233412A1 (zh) 一种人乳头瘤病毒18型l1蛋白的突变体
CN110551186A (zh) 一种人乳头瘤病毒45型l1蛋白的突变体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant