抗肿瘤重组蛋白及其编码基因与应用
技术领域
本发明涉及生物工程领域中的抗肿瘤重组蛋白及其编码基因与应用。
背景技术
恶性肿瘤是目前危害人类健康最严重的一类疾病。目前治疗癌症的常用方法有:外科手术治疗、化学药物疗法、放射治疗、生物疗法和中医中药疗法。其中以外科手术治疗、化学药物疗法、放射治疗最为常用。外科手术治疗作为大多数肿瘤治疗的首选和主要方案,使无数肿瘤患者得以康复、延长寿命或者提高了生活质量。但是,在肿瘤治疗方面,外科手术治疗只适用于一定条件和范围的病人,而且由于肿瘤可复发和转移的原因,手术切除并不都能达到根治的目的。化学药物疗法和放射治疗的运用在肿瘤的治疗方面也发挥着非常重要和必不可少的作用,并且也在不断的发展。但是,目前应用的化疗药物疗法和放射治疗对身体中所有活跃的增殖细胞都有侵害,如造血系统、胃肠道等,所以放化疗的病人常有血象降低、胃肠道出血、恶心、呕吐等症状。而且,由于受到病人机体和精神方面承受力及肿瘤细胞出现耐药性等多方面原因的限制,放化疗并不能杀死所有的肿瘤细胞,为肿瘤的复发和转移及疾病的恶化留下了隐患。生物疗法和中医中药疗法也是抗肿瘤的合理的方法,但仍需继续研究以提高疗效。因此,开发有明显治疗效果、安全的抗肿瘤药物已经成为医药界面临的一项迫在眉睫的任务。
研究表明,恶性实体肿瘤的无限制侵袭性生长及其转移依赖于新血管的不断生成,所以抑制血管生成能显著地抑制肿瘤的生长。抑制血管生成,阻断瘤体血液供应是不同于常规抗肿瘤治疗的新策略,也称为“肿瘤饥饿疗法”,已经成为抗肿瘤治疗研究的热点。正常生理状态下,除了女性生殖系统在排卵,黄体生成,怀孕等过程,有短暂的新生血管生成过程外,成年人的脉管系统增生处于相对静止状态。但是在肿瘤组织中,为适应瘤组织的快速生长,血管生成非常活跃,以及时为瘤组织生长供应血液。肿瘤组织中的微血管来源有两种:一种是肿瘤细胞等产生的血管内皮生长因子,诱导瘤体生成微血管;另一种是残存于瘤体的宿主血管逐渐变为肿瘤血管,既宿主血管的肿瘤化。与正常血管不同,肿瘤血管的血管内皮细胞不完整,基底膜稀疏且易于泄露。肿瘤血管生成后不再进一步分化改建成动脉及静脉,无平滑肌及神经末梢,属于被动血管,其血流完全依赖于体循环。新生的微血管是肿瘤浸润和转移的第一站,肿瘤细胞通过肿瘤微血管壁进入血液循环向远处转移。
实体肿瘤生长需要大量的血液供应。许多实验研究证实抑制动物体内新血管生成,可有效地切断为肿瘤生长提供养分的血液供应,使瘤体萎缩以至消失。抗新生血管药物TNP-470以及抗bFGF、VEGF单克隆抗体的应用,突变型VEGF受体FlK-1竞争性阻断VEGF信号传导,αVβ3过度表达诱导内皮细胞凋亡、以及Angiostatin特异抑制肿瘤新生血管形成等,均可抑制肿瘤生长,是一种新型的、有前途的抗肿瘤药物,可以弥补当前临床肿瘤治疗手段的局限并取代部分治疗手段。由于这类药物是通过抑制新生血管的形成来达到抑制肿瘤生长的,而人的正常组织细胞的生长不依赖于新生血管的生成,所以对正常组织几乎没有毒副作用。这类药物不直接作用于肿瘤细胞,故抑制肿瘤具有广谱性而不产生抗药性,是当前国际上公认的有效、安全、有前途的抗肿瘤药物。它主要用于原位和转移实体瘤的治疗和辅助肿瘤的手术治疗,也可以用来防止肿瘤的复发和转移。因此,开发具有血管增生抑制作用的抗肿瘤药物,在恶性肿瘤的防治方面,具有重要的临床意义。
心肌肌钙蛋白I和心肌肌钙蛋白C均是心肌肌钙蛋白的亚基,目前常被用作心肌梗塞诊断的标志物,心肌肌钙蛋白I是序列表中的SEQ ID №:1,由210个氨基酸残基组成;心肌肌钙蛋白C由160个氨基酸残基组成。
大肠杆菌和毕赤酵母表达系统是用于表达外源蛋白的最成功的表达系统之一,近年来发展非常迅速,目前已有几百种蛋白在该表达系统中得以表达。毕赤酵母是一种甲醇营养型酵母菌,其生长迅速,培养条件简单,可以高密度连续培养,遗传操作与酿酒酵母相似,技术已相当成熟,是工业生产中常用的高表达菌种。
发明内容
本发明的目的是提供抗肿瘤重组蛋白及其编码基因。
本发明提供的抗肿瘤重组蛋白,选自下列蛋白质家族中任意一种:
(1)心肌肌钙蛋白I的N末端氨基酸残基与心肌肌钙蛋白C羧基端氨基酸残基序列部分或全部相融合的蛋白质;
(2)心肌肌钙蛋白I的C末端氨基酸残基与心肌肌钙蛋白C氨基端氨基酸残基序列部分或全部相融合的蛋白质;
(3)心肌肌钙蛋白I的N末端氨基酸残基与心肌肌钙蛋白C羧基端氨基酸残基序列部分或全部、心肌肌钙蛋白I的C末端氨基酸残基与心肌肌钙蛋白C氨基端氨基酸残基序列部分或全部相融合的蛋白质。
上述心肌肌钙蛋白C氨基端氨基酸残基序列是序列表中SEQ ID№:2的氨基酸残基序列,其羧基端氨基酸残基序列是序列表中SEQ ID №:3的氨基酸残基序列。
所述抗肿瘤重组蛋白可为序列表中SEQ ID №:4的氨基酸残基序列或将SEQ ID№:4的氨基酸残基序列经过一个或几个氨基酸残基的取代、缺失或添加且具有与SEQID№:4相同活性的由SEQ ID№:4衍生的蛋白质;所述抗肿瘤重组蛋白可为序列表中SEQ ID №:5的氨基酸残基序列或将SEQ ID №:5的氨基酸残基序列经过一个或几个氨基酸残基的取代、缺失或添加且具有与SEQ ID№:5相同活性的由SEQ ID№:5衍生的蛋白质;所述抗肿瘤重组蛋白可为序列表中SEQ ID№:6的氨基酸残基序列或将SEQ ID№:6的氨基酸残基序列经过一个或几个氨基酸残基的取代、缺失或添加且具有与SEQ ID №:6相同活性的由SEQ ID №:6衍生的蛋白质。
本发明的第二个目的是提供抗肿瘤重组蛋白的编码基因。
本发明提供的抗肿瘤重组蛋白的编码基因是下列核苷酸序列之一:
(1)序列表中的SEQ ID№:7或与其限定的DNA序列具有90%以上同源性,且编码相同功能蛋白质的DNA序列;
(2)序列表中的SEQ ID№:8或与其限定的DNA序列具有90%以上同源性,且编码相同功能蛋白质的DNA序列;
(3)序列表中的SEQ ID №:9或与其限定的DNA序列具有90%以上同源性,且编码相同功能蛋白质的DNA序列;
(4)序列表中的SEQ ID№:10或与其限定的DNA序列具有90%以上同源性,且编码相同功能蛋白质的DNA序列;
(5)序列表中的SEQ ID№:11或与其限定的DNA序列具有90%以上同源性,且编码相同功能蛋白质的DNA序列;
(6)序列表中的SEQ ID №:12或与其限定的DNA序列具有90%以上同源性,且编码相同功能蛋白质的DNA序列;
(7)编码序列表中SEQ ID№:4蛋白质序列的多核苷酸;
(8)编码序列表中SEQ ID№:5蛋白质序列的多核苷酸;
(9)编码序列表中SEQ ID№:6蛋白质序列的多核苷酸。
含有上述基因的表达载体及细胞系均属本发明所要求保护的范围。
本发明的第三个目的是提供一种上述抗肿瘤重组蛋白在大肠杆菌和毕赤酵母菌中的高效表达方法。
抗肿瘤重组蛋白的高效表达方法一,是将编码抗肿瘤重组蛋白的基因导入到毕赤酵母菌中,表达获得抗肿瘤重组蛋白。
具体地说,该方法包括以下步骤:
1、选用毕赤酵母菌优选密码子,并用计算机模拟计算了翻译起始区和抗肿瘤重组蛋白基因5’端二级结构最小生成自由能,设计并合成序列7,或序列8,或序列11抗肿瘤重组蛋白基因序列;
2、将合成的基因片段分别与载体pPIC9K连接,得到表达质粒,转化毕赤酵母菌后获得表达工程菌;
3、培养工程菌,表达产物分泌到培养液中,获得目标蛋白。
为了获得更好的效果,毕赤酵母菌的表达过程中用甲醇进行诱导。诱导过程中的甲醇终浓度优选为1%-5%。
所述毕赤酵母菌优选为GS115毕赤酵母菌。
抗肿瘤重组蛋白的高效表达方法二,是将编码抗肿瘤重组蛋白的基因导入到大肠杆菌中,表达获得抗肿瘤重组蛋白。
具体地说,该方法包括以下步骤:
1、选用大肠杆菌优选密码子,设计并合成序列9,或序列10,或序列12抗肿瘤重组蛋白基因序列;
2、将合成的基因片段分别与载体pET21b连接,得到表达质粒,转化大肠杆菌后获得表达工程菌;
3、培养工程菌,表达产物,获得目标蛋白。
所述大肠杆菌优选为BL21-DE3大肠杆菌。
本发明将心肌肌钙蛋白I和心肌肌钙蛋白C进行融合,合成新的心肌肌钙蛋白I-C融和体。该融合体具有明显的抗小鼠实体肿瘤的作用,大鼠静脉注射融合体蛋白的血浆稳定性较静脉注射心肌肌钙蛋白I的血浆稳定性明显延长。在临床上可降低药剂量提高疗效。在恶性肿瘤的治疗方面,具有重要意义。
用本发明的方法得到的抗肿瘤重组蛋白占培养液总蛋白的20-60%,表达过程操作简单,产品成本较低,可用于规模化生产,对于开发新的抗肿瘤药物具有重要意义。
附图说明
图1为pPIC-AAF表达质粒的图谱。
图2为pPIC-AAF表达质粒酶切凝胶电泳图谱。
图3为甲醇诱导后的GS115毕赤酵母菌培养液电泳图谱
图4为pET-AAF表达质粒的图谱。
图5为pET-AAF表达质粒酶切凝胶电泳图谱。
图6为IPTG诱导后的BL21-DE3大肠杆菌培养液电泳图谱。
具体实施方式
实施例1、抗肿瘤重组蛋白的毕赤酵母菌体外表达
1、抗肿瘤重组蛋白基因的合成
人工合成序列表中序列13(心肌肌钙蛋白I的编码基因)的全长序列,并在其5’端加上NdeI、3’端加上NotI酶切位点,得到序列AFF1;人工合成序列表中序列7的1-285位碱基序列,并在其5’端加上NdeI酶切位点、3’端加上与基因序列13的5’端互补的15个碱基,然后将此序列与序列AFF1连接,得到序列AFF2;人工合成序列表中序列8的631-858碱基,并在其3’端加上NotI酶切位点、5’端加上与基因序列13的3’端互补的15个碱基,然后将此序列与序列AFF1连接,得到序列AFF3。
2、抗肿瘤重组蛋白体外表达
(1)将上述人工合成的全序列分别装入pGEM-T-EASY质粒内,分别构建pGEM-AAF1\AAF2\AAF3克隆载体。
(2)表达质粒的构建
采用购自美国Invitrogen公司的高效表达质粒pPIC9K,用NdeI和NotI分别酶切pGEM-AAF1\AAF2\AAF3质粒和pPIC9K质粒,凝胶电泳收集目标片段,用T4连接酶16℃过夜连接。经常规方法的转化,挑菌,扩增获得表达质粒pPIC9K-AAF1\AAF2\AAF3,其通用结构图谱如图1所示。如图4所示,酶切鉴定,证明表达质粒的结构正确。图中,泳道1为pPIC-AAF1表达质粒酶切凝胶电泳结果,泳道2为pPIC-AAF3表达质粒酶切凝胶电泳结果,泳道3为pPIC-AAF2表达质粒酶切凝胶电泳结果。
(3)将质粒pPIC9K-AAF1\AAF2\AAF3分别用SacI线性化,采用浙江新芝公司电基因导入仪,将线性化的pPIC9K-AAF1\AAF2\AAF3分别导入GS115毕赤酵母菌(购自Invitrogen公司)内,经培养,挑选,筛选等过程,获得三种抗G418mg/ml的单克隆菌。
(4)挑选单克隆菌,接种于5ml培养基中,30℃过夜,然后转入250ml培养基中,继续培养至OD600=10-20,收集菌体,用无碳源培养基稀释至OD600=50,继续培养24小时,加入甲醇至终浓度为1%诱导表达,每隔24小时加甲醇一次,至96小时。离心取上清液,进行凝胶电泳分析和功能测定。取10ml上清液,用12%SDS-PAGE电泳,并经考马斯亮兰染色。结果如图3所示,AAF1序列在32KD的位置,有诱导的蛋白表达,并根据BSA对照,表达量为30mg/L;AAF2序列在38KD的位置,有诱导的蛋白表达,并根据BSA对照,表达量为50mg/L;AAF3序列在43KD的位置,有诱导的蛋白表达,并根据BSA对照,表达量为80mg/L。图中,泳道1为pPIC-AAF1表达质粒的转化菌培养液电泳结果,泳道2为pPIC-AAF3表达质的转化菌培养液电泳结果,泳道3为pPIC-AAF2表达质粒的转化菌培养液电泳结果。
在本实施例中,培养单克隆菌体时用甲醇进行诱导意义很大,在没有诱导之前,培养液中目标蛋白的含量很低,如图3所示,诱导后的培养液中有显著的目标蛋白带,而诱导前的培养液中没有显著的目标蛋白带。
3、本发明抗肿瘤重组蛋白的功能测定
取24只昆明小鼠,分为甲醇诱导前上清和甲醇诱导后上清两组,分别颈部皮下接种S180腹水细胞瘤株,三天后分别皮下注射甲醇诱导前上清和甲醇诱导后上清0.5ml/只,每隔12小时注射一次,连续注射7天。观察并切取瘤组织,称重,结果甲醇诱导前上清和甲醇诱导后上清序列AAF1、AAF2和AAF3组瘤体重分别为0.82+0.22克和0.11+0.05克,0.13+0.08克,0.09+0.05克,抑瘤率分别为86.6%,84.1%和89.0%。
实施例2、抗肿瘤重组蛋白的大肠杆菌体外表达
1、人工基因的合成:人工合成序列表中序列14(心肌肌钙蛋白I的编码基因)的全长序列,并在其5’端加上NdeI、3’端加上NotI酶切位点,得到序列AFF4;人工合成序列表中序列9的1-285位碱基序列,并在其5’端加上NdeI酶切位点、3’端加上与基因序列14的5’端互补的15个碱基,然后将此序列与序列AFF4连接,得到序列AFF5;人工合成序列表中序列10的631-858碱基,并在其3’端加上NotI酶切位点、5’端加上与基因序列14的3’端互补的15个碱基,然后将此序列与序列AFF4连接,得到序列AFF6。
2、抗肿瘤重组蛋白体外表达
(1)将上述人工合成的全序列分别装入pGEM-T-EASY质粒内,构建pGEM-AAF4\AAF5\AAF6克隆载体。
(2)表达质粒的构建
采用购自美国Novagen公司的高效表达质粒pET21b,用SnabI和NotI分别酶切pGEM-AAF4\AAF5\AAF6质粒和pET21b质粒,凝胶电泳收集目标片段,用T4连接酶16℃过夜连接。经常规方法的转化,挑菌,扩增获得表达质粒pET-AAF4\AAF5\AAF6,其通用结构图谱如图4所示。如图5所示,酶切鉴定,证明表达质粒的结构正确。图中,泳道1为pET-AAF4表达质粒酶切凝胶电泳结果,泳道2为pET-AAF6表达质粒酶切凝胶电泳结果,泳道3为pET-AAF5表达质粒酶切凝胶电泳结果。
(3)分别将质粒pET-AAF4\AAF5\AAF6经转化导入BL21-DE3大肠杆菌内,经培养,挑选,筛选等过程,获得单克隆菌。
(4)挑选单克隆菌,接种于5ml培养基中,37℃过夜,然后转入250ml培养基中,继续培养至OD600=0.8,加入IPTG至终浓度为1%37℃诱导表达4小时。离心取沉淀,用裂解液混悬,超声破碎,10000g离心30分钟,弃上清,沉淀洗涤两次,最后用8M尿素溶解,经50mM磷酸盐缓冲液过夜透析。取透析后的蛋白质溶液10ul,用12%SDS-PAGE电泳,并经考马斯亮兰染色。结果如图6所示,AAF4序列在29KD的位置,有诱导的蛋白表达,并根据BSA对照,表达量为30mg/L;AAF5序列在37KD的位置,有诱导的蛋白表达,并根据BSA对照,表达量为45mg/L;AAF6序列在42KD的位置,有诱导的蛋白表达,并根据BSA对照,表达量为50mg/L。图中,泳道1为pET-AAF4表达质粒的转化菌培养液电泳结果,泳道2为pET-AAF5表达质的转化菌培养液电泳结果,泳道3为pET-AAF6表达质粒的转化菌培养液电泳结果。
3、本发明抗肿瘤重组蛋白的功能测定
取24只昆明小鼠,分为磷酸盐缓冲液和表达提纯液组,分别颈部皮下接种S180腹水细胞瘤株,三天后分别皮下注射磷酸盐缓冲液和表达提纯液1.0mg蛋白/kg,每隔12小时注射一次,连续注射7天。观察并切取瘤组织,称重,结果磷酸盐缓冲液和表达提纯液序列AAF4,AAF5和AAF6组瘤体重分别为1.02+0.28克和0.15+0.06克,0.12+0.06克,0.11+0.04克,抑瘤率分别为85.3%,88.1%和89.2%。
实施例3、抗肿瘤重组蛋白的大肠杆菌体外表达提纯液的体内稳定性实验:
取24只昆明小鼠,分为磷酸盐缓冲液和表达提纯液组,分别皮下注射磷酸盐缓冲液和实施例2中得到的表达提纯液2.0mg蛋白/kg,注射8小时,眼底静脉取血,分离血清,采用常规酶联免疫法测定血清抗肿瘤重组蛋白浓度。结果磷酸盐缓冲液和表达提纯液序列AAF4,AAF5和AAF6组血清抗肿瘤重组蛋白浓度分别为0.52+0.08ng/ml、3.55+0.12ng/ml、8.22+1.08ng/ml和9.31+1.62ng/ml,表明与肌钙蛋白C融合可增加其体内稳定性,延缓降解。
序列表
<160>14
<210>1
<211>210
<212>PRT
<213>人属人(Homo sapiens)
<220>
<223>
<400>1
Met Ala Asp Gly Ser Ser Asp Ala Ala Arg Glu Pro Arg Pro Ala
1 5 10 15
Pro Ala Pro Ile Arg Arg Arg Ser Ser Asn Tyr Arg Ala Tyr Ala
20 25 30
Thr Glu Pro His Ala Lys Lys Lys Ser Lys Ile Ser Ala Ser Arg
35 40 45
Lys Leu Gln Leu Lys Thr Leu Leu Leu Gln Ile Ala Lys Gln Glu
50 55 60
Leu Glu Arg Glu Ala Glu Glu Arg Arg Gly Glu Lys Gly Arg Ala
65 70 75
Leu Ser Thr Arg Cys Gln Pro Leu Glu Leu Ala Gly Leu Gly Phe
80 85 90
Ala Glu Leu Gln Asp Leu Cys Arg Gln Leu His Ala Arg Val Asp
95 100 105
Lys Val Asp Glu Glu Arg Tyr Asp Ile Glu Ala Lys Val Thr Lys
110 115 120
Asn Ile Thr Glu Ile Ala Asp Leu Thr Gln Lys Ile Phe Asp Leu
125 130 135
Arg Gly Lys Phe Lys Arg Pro Thr Leu Arg Arg Val Arg Ile Ser
140 145 150
Ala Asp Ala Met Met Gln Ala Leu Leu Gly Ala Arg Ala Lys Glu
155 160 165
Ser Leu Asp Leu Arg Ala His Leu Lys Gln Val Lys Lys Glu Asp
170 175 180
Thr Glu Lys Glu Asn Arg Glu Val Gly Asp Trp Arg Lys Asn Ile
185 190 195
Asp Ala Leu Ser Gly Met Glu Gly Arg Lys Lys Lys Phe Glu Ser
200 205 210
<210>2
<211>95
<212>PRT
<213>人工序列
<220>
<223>
<400>2
Met Asp Asp Ile Tyr Lys Ala Ala Val Glu Gln Leu Thr Glu Glu
1 5 10 15
Gln Lys Asn Glu Phe Lys Ala Ala Phe Asp Ile Phe Val Leu Gly
20 25 30
Ala Glu Asp Gly Cys Ile Ser Thr Lys Glu Leu Gly Lys Val Met
35 40 45
Arg Met Leu Gly Gln Asn Pro Thr Pro Glu Glu Leu Gln Glu Met
50 55 60
Ile Asp Glu Val Asp Glu Asp Gly Ser Gly Thr Val Asp Phe Asp
65 70 75
Glu Phe Leu Val Met Met Val Arg Cys Met Lys Asp Asp Ser Lys
80 85 90
Gly Lys Ser Glu Glu
95
<210>3
<211>75
<212>PRT
<213>人工序列
<220>
<223>
<400>3
Lys Asp Asp Ser Lys Gly Lys Ser Glu Glu Leu Ser Asp Leu Phe
1 5 10 15
Arg Met Phe Asp Lys Asn Ala Asp Gly Tyr Ile Asp Leu Asp Glu
20 25 30
Leu Lys Ile Met Leu Gln Ala Thr Gly Glu Thr Ile Thr Glu Asp
35 40 45
Asp Ile Glu Glu Leu Met Lys Asp Gly Asp Lys Asn Asn Asp Gly
50 55 60
Arg Ile Asp Tyr Asp Glu Phe Leu Glu Phe Met Lys Gly Val Glu
65 70 75
<210>4
<211>305
<212>PRT
<213>人工序列
<220>
<223>
<400>4
Met Asp Asp Ile Tyr Lys Ala Ala Val Glu Gln Leu Thr Glu Glu
1 5 10 15
Gln Lys Asn Glu Phe Lys Ala Ala Phe Asp Ile Phe Val Leu Gly
20 25 30
Ala Glu Asp Gly Cys Ile Ser Thr Lys Glu Leu Gly Lys Val Met
35 40 45
Arg Met Leu Gly Gln Asn Pro Thr Pro Glu Glu Leu Gln Glu Met
50 55 60
Ile Asp Glu Val Asp Glu Asp Gly Ser Gly Thr Val Asp Phe Asp
65 70 75
Glu Phe Leu Val Met Met Val Arg Cys Met Lys Asp Asp Ser Lys
80 85 90
Gly Lys Ser Glu Glu Met Ala Asp Gly Ser Ser Asp Ala Ala Arg
95 100 105
Glu Pro Arg Pro Ala Pro Ala Pro Ile Arg Arg Arg Ser Ser Asn
110 115 120
Tyr Arg Ala Tyr Ala Thr Glu Pro His Ala Lys Lys Lys Ser Lys
125 130 135
Ile Ser Ala Ser Arg Lys Leu Gln Leu Lys Thr Leu Leu Leu Gln
140 145 150
Ile Ala Lys Gln Glu Leu Glu Arg Glu Ala Glu Glu Arg Arg Gly
155 160 165
Glu Lys Gly Arg Ala Leu Ser Thr Arg Cys Gln Pro Leu Glu Leu
170 175 180
Ala Gly Leu Gly Phe Ala Glu Leu Gln Asp Leu Cys Arg Gln Leu
185 190 195
His Ala Arg Val Asp Lys Val Asp Glu Glu Arg Tyr Asp Ile Glu
200 205 210
Ala Lys Val Thr Lys Asn Ile Thr Glu Ile Ala Asp Leu Thr Gln
215 220 225
Lys Ile Phe Asp Leu Arg Gly Lys Phe Lys Arg Pro Thr Leu Arg
230 235 240
Arg Val Arg Ile Ser Ala Asp Ala Met Met Gln Ala Leu Leu Gly
245 250 255
Ala Arg Ala Lys Glu Ser Leu Asp Leu Arg Ala His Leu Lys Gln
260 265 270
Val Lys Lys Glu Asp Thr Glu Lys Glu Asn Arg Glu Val Gly Asp
275 280 285
Trp Arg Lys Asn Ile Asp Ala Leu Ser Gly Met Glu Gly Arg Lys
290 295 300
Lys Lys Phe Glu Ser
305
<210>5
<211>285
<212>PRT
<213>人工序列
<220>
<223>
<400>5
Met Ala Asp Gly Ser Ser Asp Ala Ala Arg Glu Pro Arg Pro Ala
1 5 10 15
Pro Ala Pro Ile Arg Arg Arg Ser Ser Asn Tyr Arg Ala Tyr Ala
20 25 30
Thr Glu Pro His Ala Lys Lys Lys Ser Lys Ile Ser Ala Ser Arg
35 40 45
Lys Leu Gln Leu Lys Thr Leu Leu Leu Gln Ile Ala Lys Gln Glu
50 55 60
Leu Glu Arg Glu Ala Glu Glu Arg Arg Gly Glu Lys Gly Arg Ala
65 70 75
Leu Ser Thr Arg Cys Gln Pro Leu Glu Leu Ala Gly Leu Gly Phe
80 85 90
Ala Glu Leu Gln Asp Leu Cys Arg Gln Leu His Ala Arg Val Asp
95 100 105
Lys Val Asp Glu Glu Arg Tyr Asp Ile Glu Ala Lys Val Thr Lys
110 115 120
Asn Ile Thr Glu Ile Ala Asp Leu Thr Gln Lys Ile Phe Asp Leu
125 130 135
Arg Gly Lys Phe Lys Arg Pro Thr Leu Arg Arg Val Arg Ile Ser
140 145 150
Ala Asp Ala Met Met Gln Ala Leu Leu Gly Ala Arg Ala Lys Glu
155 160 165
Ser Leu Asp Leu Arg Ala His Leu Lys Gln Val Lys Lys Glu Asp
170 175 180
Thr Glu Lys Glu Asn Arg Glu Val Gly Asp Trp Arg Lys Asn Ile
185 190 195
Asp Ala Leu Ser Gly Met Glu Gly Arg Lys Lys Lys Phe Glu Ser
200 205 210
Lys Asp Asp Ser Lys Gly Lys Ser Glu Glu Leu Ser Asp Leu Phe
215 220 225
Arg Met Phe Asp Lys Asn Ala Asp Gly Tyr Ile Asp Leu Asp Glu
230 235 240
Leu Lys Ile Met Leu Gln Ala Thr Gly Glu Thr Ile Thr Glu Asp
245 250 255
Asp Ile Glu Glu Leu Met Lys Asp Gly Asp Lys Asn Asn Asp Gly
260 265 270
Arg Ile Asp Tyr Asp Glu Phe Leu Glu Phe Met Lys Gly Val Glu
275 280 285
<210>6
<211>380
<212>PRT
<213>人工序列
<220>
<223>
<400>6
Met Asp Asp Ile Tyr Lys Ala Ala Val Glu Gln Leu Thr Glu Glu
1 5 10 15
Gln Lys Asn Glu Phe Lys Ala Ala Phe Asp Ile Phe Val Leu Gly
20 25 30
Ala Glu Asp Gly Cys Ile Ser Thr Lys Glu Leu Gly Lys Val Met
35 40 45
Arg Met Leu Gly Gln Asn Pro Thr Pro Glu Glu Leu Gln Glu Met
50 55 60
Ile Asp Glu Val Asp Glu Asp Gly Ser Gly Thr Val Asp Phe Asp
65 70 75
Glu Phe Leu Val Met Met Val Arg Cys Met Lys Asp Asp Ser Lys
80 85 90
Gly Lys Ser Glu Glu Met Ala Asp Gly Ser Ser Asp Ala Ala Arg
95 100 105
Glu Pro Arg Pro Ala Pro Ala Pro Ile Arg Arg Arg Ser Ser Asn
110 115 120
Tyr Arg Ala Tyr Ala Thr Glu Pro His Ala Lys Lys Lys Ser Lys
125 130 135
Ile Ser Ala Ser Arg Lys Leu Gln Leu Lys Thr Leu Leu Leu Gln
140 145 150
Ile Ala Lys Gln Glu Leu Glu Arg Glu Ala Glu Glu Arg Arg Gly
155 160 165
Glu Lys Gly Arg Ala Leu Ser Thr Arg Cys Gln Pro Leu Glu Leu
170 175 180
Ala Gly Leu Gly Phe Ala Glu Leu Gln Asp Leu Cys Arg Gln Leu
185 190 195
His Ala Arg Val Asp Lys Val Asp Glu Glu Arg Tyr Asp Ile Glu
200 205 210
Ala Lys Val Thr Lys Asn Ile Thr Glu Ile Ala Asp Leu Thr Gln
215 220 225
Lys Ile Phe Asp Leu Arg Gly Lys Phe Lys Arg Pro Thr Leu Arg
230 235 240
Arg Val Arg Ile Ser Ala Asp Ala Met Met Gln Ala Leu Leu Gly
245 250 255
Ala Arg Ala Lys Glu Ser Leu Asp Leu Arg Ala His Leu Lys Gln
260 265 270
Val Lys Lys Glu Asp Thr Glu Lys Glu Asn Arg Glu Val Gly Asp
275 280 285
Trp Arg Lys Asn Ile Asp Ala Leu Ser Gly Met Glu Gly Arg Lys
290 295 300
Lys Lys Phe Glu Ser Lys Asp Asp Ser Lys Gly Lys Ser Glu Glu
305 310 315
Leu Ser Asp Leu Phe Arg Met Phe Asp Lys Asn Ala Asp Gly Tyr
320 325 330
Ile Asp Leu Asp Glu Leu Lys Ile Met Leu Gln Ala Thr Gly Glu
335 340 345
Thr Ile Thr Glu Asp Asp Ile Glu Glu Leu Met Lys Asp Gly Asp
350 355 360
Lys Ash Asn Asp Gly Arg Ile Asp Tyr Asp Glu Phe Leu Glu Phe
365 370 375
Met Lys Gly Val Glu
380
<210>7
<211>918
<212>DNA
<213>人工序列
<220>
<223>
<400>7
atggacgaca tctacaaggc tgctgtcgag caattgaccg aggagcaaaa gaacgagttc 60
aaggctgctt tcgacatctt cgtcttgggt gctgaggacg gttgtatctc caccaaggag 120
ttgggtaagg tcatgagaat gttgggtcaa aacccaaccc cagaggagtt gcaagagatg 180
atcgacgagg tcgacgagga cggttccggt accgtcgact tcgacgagtt cttggtcatg 240
atggtcagat gtatgaagga cgactccaag ggtaagtccg aggagatggc tgacggttcc 300
tccgacgctg ctagagagcc aagaccagct ccagctccaa tcagaagaag atcctccaac 360
tacagagctt acgctaccga gccacacgct aagaagaagt ccaagatctc cgcttccaga 420
aagttgcaat tgaagacctt gttgttgcaa atcgctaagc aagagttgga gagagaggct 480
gaggagagaa gaggtgagaa gggtagagct ttgtccacca gatgtcaacc attggagttg 540
gctggtttgg gtttcgctga gttgcaagac ttgtgtagac aattgcacgc tagagtcgac 600
aaggtcgacg aggagagata cgacatcgag gctaaggtca ccaagaacat caccgagatc 660
gctgacttga cccaaaagat cttcgacttg agaggtaagt tcaagagacc aaccttgaga 720
agagtcagaa tctccgctga cgctatgatg caagctttgt tgggtgctag agctaaggag 780
tccttggact tgagagctca cttgaagcaa gtcaagaagg aggacaccga gaaggagaac 840
agagaggtcg gtgactggag aaagaacatc gacgctttgt ccggtatgga gggtagaaag 900
aagaagttcg agtcctaa 918
<210>8
<211>858
<212>DNA
<213>人工序列
<220>
<223>
<400>8
atggctgacg gttcctccga cgctgctaga gagccaagac cagctccagc tccaatcaga 60
agaagatcct ccaactacag agcttacgct accgagccac acgctaagaa gaagtccaag 120
atctccgctt ccagaaagtt gcaattgaag accttgttgt tgcaaatcgc taagcaagag 180
ttggagagag aggctgagga gagaagaggt gagaagggta gagctttgtc caccagatgt 240
caaccattgg agttggctgg tttgggtttc gctgagttgc aagacttgtg tagacaattg 300
cacgctagag tcgacaaggt cgacgaggag agatacgaca tcgaggctaa ggtcaccaag 360
aacatcaccg agatcgctga cttgacccaa aagatcttcg acttgagagg taagttcaag 420
agaccaacct tgagaagagt cagaatctcc gctgacgcta tgatgcaagc tttgttgggt 480
gctagagcta aggagtcctt ggacttgaga gctcacttga agcaagtcaa gaaggaggac 540
accgagaagg agaacagaga ggtcggtgac tggagaaaga acatcgacgc tttgtccggt 600
atggagggta gaaagaagaa gttcgagtcc aaggacgact ccaagggtaa gtccgaggag 660
ttgtccgact tgttcagaat gttcgacaag aacgctgacg gttacatcga cttggacgag 720
ttgaagatca tgttgcaagc taccggtgag accatcaccg aggacgacat cgaggagttg 780
atgaaggacg gtgacaagaa caacgacggt agaatcgact acgacgagtt cttggagttc 840
atgaagggtg tcgagtaa 858
<210>9
<211>918
<212>DNA
<213>人工序列
<220>
<223>
<400>9
atggacgaca tctacaaagc tgctgttgaa cagctgactg aagaacagaa aaacgaattc 60
aaagctgctt tcgacatctt cgttctgggt gctgaagacg gttgcatctc tactaaagaa 120
ctgggtaaag ttatgcgtat gctgggtcag aacccgactc cggaagaact gcaggaaatg 180
atcgacgaag ttgacgaaga cggttctggt actgttgact tcgacgaatt cctggttatg 240
atggttcgtt gcatgaaaga cgactctaaa ggtaaatctg aagaaatggc tgacggttct 300
tctgacgctg ctcgtgaacc gcgtccggct ccggctccga tccgtcgtcg ttcttctaac 360
taccgtgctt acgctactga accgcacgct aaaaaaaaat ctaaaatctc tgcttctcgt 420
aaactgcagc tgaaaactct gctgctgcag atcgctaaac aggaactgga acgtgaagct 480
gaagaacgtc gtggtgaaaa aggtcgtgct ctgtctactc gttgccagcc gctggaactg 540
gctggtctgg gtttcgctga actgcaggac ctgtgccgtc agctgcacgc tcgtgttgac 600
aaagttgacg aagaacgtta cgacatcgaa gctaaagtta ctaaaaacat cactgaaatc 660
gctgacctga ctcagaaaat cttcgacctg cgtggtaaat tcaaacgtcc gactctgcgt 720
cgtgttcgta tctctgctga cgctatgatg caggctctgc tgggtgctcg tgctaaagaa 780
tctctggacc tgcgtgctca cctgaaacag gttaaaaaag aagacactga aaaagaaaac 840
cgtgaagttg gtgactggcg taaaaacatc gacgctctgt ctggtatgga aggtcgtaaa 900
aaaaaattcg aatcttaa 918
<210>10
<211>858
<212>DNA
<213>人工序列
<220>
<223>
<400>10
atggctgacg gttcttctga cgctgctcgt gaaccgcgtc cggctccggc tccgatccgt 60
cgtcgttctt ctaactaccg tgcttacgct actgaaccgc acgctaaaaa aaaatctaaa 120
atctctgctt ctcgtaaact gcagctgaaa actctgctgc tgcagatcgc taaacaggaa 180
ctggaacgtg aagctgaaga acgtcgtggt gaaaaaggtc gtgctctgtc tactcgttgc 240
cagccgctgg aactggctgg tctgggtttc gctgaactgc aggacctgtg ccgtcagctg 300
cacgctcgtg ttgacaaagt tgacgaagaa cgttacgaca tcgaagctaa agttactaaa 360
aacatcactg aaatcgctga cctgactcag aaaatcttcg acctgcgtgg taaattcaaa 420
cgtccgactc tgcgtcgtgt tcgtatctct gctgacgcta tgatgcaggc tctgctgggt 480
gctcgtgcta aagaatctct ggacctgcgt gctcacctga aacaggttaa aaaagaagac 540
actgaaaaag aaaaccgtga agttggtgac tggcgtaaaa acatcgacgc tctgtctggt 600
atggaaggtc gtaaaaaaaa attcgaatct aaagacgact ctaaaggtaa atctgaagaa 660
ctgtctgacc tgttccgtat gttcgacaaa aacgctgacg gttacatcga cctggacgaa 720
ctgaaaatca tgctgcaggc tactggtgaa actatcactg aagacgacat cgaagaactg 780
atgaaagacg gtgacaaaaa caacgacggt cgtatcgact acgacgaatt cctggaattc 840
atgaaaggtg ttgaataa 858
<210>11
<211>1143
<212>DNA
<213>人工序列
<220>
<223>
<400>11
atggacgaca tctacaaggc tgctgtcgag caattgaccg aggagcaaaa gaacgagttc 60
aaggctgctt tcgacatctt cgtcttgggt gctgaggacg gttgtatctc caccaaggag 120
ttgggtaagg tcatgagaat gttgggtcaa aacccaaccc cagaggagtt gcaagagatg 180
atcgacgagg tcgacgagga cggttccggt accgtcgact tcgacgagtt cttggtcatg 240
atggtcagat gtatgaagga cgactccaag ggtaagtccg aggagatggc tgacggttcc 300
tccgacgctg ctagagagcc aagaccagct ccagctccaa tcagaagaag atcctccaac 360
tacagagctt acgctaccga gccacacgct aagaagaagt ccaagatctc cgcttccaga 420
aagttgcaat tgaagacctt gttgttgcaa atcgctaagc aagagttgga gagagaggct 480
gaggagagaa gaggtgagaa gggtagagct ttgtccacca gatgtcaacc attggagttg 540
gctggtttgg gtttcgctga gttgcaagac ttgtgtagac aattgcacgc tagagtcgac 600
aaggtcgacg aggagagata cgacatcgag gctaaggtca ccaagaacat caccgagatc 660
gctgacttga cccaaaagat cttcgacttg agaggtaagt tcaagagacc aaccttgaga 720
agagtcagaa tctccgctga cgctatgatg caagctttgt tgggtgctag agctaaggag 780
tccttggact tgagagctca cttgaagcaa gtcaagaagg aggacaccga gaaggagaac 840
agagaggtcg gtgactggag aaagaacatc gacgctttgt ccggtatgga gggtagaaag 900
aagaagttcg agtccaagga cgactccaag ggtaagtccg aggagttgtc cgacttgttc 960
agaatgttcg acaagaacgc tgacggttac atcgacttgg acgagttgaa gatcatgttg 1020
caagctaccg gtgagaccat caccgaggac gacatcgagg agttgatgaa ggacggtgac 1080
aagaacaacg acggtagaat cgactacgac gagttcttgg agttcatgaa gggtgtcgag 1140
taa 1143
<210>12
<211>1143
<212>DNA
<213>人工序列
<220>
<223>
<400>12
atggacgaca tctacaaagc tgctgttgaa cagctgactg aagaacagaa aaacgaattc 60
aaagctgctt tcgacatctt cgttctgggt gctgaagacg gttgcatctc tactaaagaa 120
ctgggtaaag ttatgcgtat gctgggtcag aacccgactc cggaagaact gcaggaaatg 180
atcgacgaag ttgacgaaga cggttctggt actgttgact tcgacgaatt cctggttatg 240
atggttcgtt gcatgaaaga cgactctaaa ggtaaatctg aagaaatggc tgacggttct 300
tctgacgctg ctcgtgaacc gcgtccggct ccggctccga tccgtcgtcg ttcttctaac 360
taccgtgctt acgctactga accgcacgct aaaaaaaaat ctaaaatctc tgcttctcgt 420
aaactgcagc tgaaaactct gctgctgcag atcgctaaac aggaactgga acgtgaagct 480
gaagaacgtc gtggtgaaaa aggtcgtgct ctgtctactc gttgccagcc gctggaactg 540
gctggtctgg gtttcgctga actgcaggac ctgtgccgtc agctgcacgc tcgtgttgac 600
aaagttgacg aagaacgtta cgacatcgaa gctaaagtta ctaaaaacat cactgaaatc 660
gctgacctga ctcagaaaat cttcgacctg cgtggtaaat tcaaacgtcc gactctgcgt 720
cgtgttcgta tctctgctga cgctatgatg caggctctgc tgggtgctcg tgctaaagaa 780
tctctggacc tgcgtgctca cctgaaacag gttaaaaaag aagacactga aaaagaaaac 840
cgtgaagttg gtgactggcg taaaaacatc gacgctctgt ctggtatgga aggtcgtaaa 900
aaaaaattcg aatctaaaga cgactctaaa ggtaaatctg aagaactgtc tgacctgttc 960
cgtatgttcg acaaaaacgc tgacggttac atcgacctgg acgaactgaa aatcatgctg 1020
caggctactg gtgaaactat cactgaagac gacatcgaag aactgatgaa agacggtgac 1080
aaaaacaacg acggtcgtat cgactacgac gaattcctgg aattcatgaa aggtgttgaa 1140
taa 1143
<210>13
<211>633
<212>DNA
<213>人工序列
<220>
<223>
<400>13
atggctgacg gttcctccga cgctgctaga gagccaagac cagctccagc tccaatcaga 60
agaagatcct ccaactacag agcttacgct accgagccac acgctaagaa gaagtccaag 120
atctccgctt ccagaaagtt gcaattgaag accttgttgt tgcaaatcgc taagcaagag 180
ttggagagag aggctgagga gagaagaggt gagaagggta gagctttgtc caccagatgt 240
caaccattgg agttggctgg tttgggtttc gctgagttgc aagacttgtg tagacaattg 300
cacgctagag tcgacaaggt cgacgaggag agatacgaca tcgaggctaa ggtcaccaag 360
aacatcaccg agatcgctga cttgacccaa aagatcttcg acttgagagg taagttcaag 420
agaccaacct tgagaagagt cagaatctcc gctgacgcta tgatgcaagc tttgttgggt 480
gctagagcta aggagtcctt ggacttgaga gctcacttga agcaagtcaa gaaggaggac 540
accgagaagg agaacagaga ggtcggtgac tggagaaaga acatcgacgc tttgtccggt 600
atggagggta gaaagaagaa gttcgagtcc taa 633
<210>14
<211>633
<212>DNA
<213>人工序列
<220>
<223>
<400>14
atggctgacg gttcttctga cgctgctcgt gaaccgcgtc cggctccggc tccgatccgt 60
cgtcgttctt ctaactaccg tgcttacgct actgaaccgc acgctaaaaa aaaatctaaa 120
atctctgctt ctcgtaaact gcagctgaaa actctgctgc tgcagatcgc taaacaggaa 180
ctggaacgtg aagctgaaga acgtcgtggt gaaaaaggtc gtgctctgtc tactcgttgc 240
cagccgctgg aactggctgg tctgggtttc gctgaactgc aggacctgtg ccgtcagctg 300
cacgctcgtg ttgacaaagt tgacgaagaa cgttacgaca tcgaagctaa agttactaaa 360
aacatcactg aaatcgctga cctgactcag aaaatcttcg acctgcgtgg taaattcaaa 420
cgtccgactc tgcgtcgtgt tcgtatctct gctgacgcta tgatgcaggc tctgctgggt 480
gctcgtgcta aagaatctct ggacctgcgt gctcacctga aacaggttaa aaaagaagac 540
actgaaaaag aaaaccgtga agttggtgac tggcgtaaaa acatcgacgc tctgtctggt 600
atggaaggtc gtaaaaaaaa attcgaatct taa 633