CN111406071B - Pas化的vegfr/pdgfr融合蛋白及其在治疗中的用途 - Google Patents

Pas化的vegfr/pdgfr融合蛋白及其在治疗中的用途 Download PDF

Info

Publication number
CN111406071B
CN111406071B CN201880063990.XA CN201880063990A CN111406071B CN 111406071 B CN111406071 B CN 111406071B CN 201880063990 A CN201880063990 A CN 201880063990A CN 111406071 B CN111406071 B CN 111406071B
Authority
CN
China
Prior art keywords
seq
linker
pdgfr
protein
vegfr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880063990.XA
Other languages
English (en)
Other versions
CN111406071A (zh
Inventor
董庆
米凯拉·格宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Shuoder Pharmaceutical Co ltd
Original Assignee
Chengdu Shuoder Pharmaceutical Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Shuoder Pharmaceutical Co ltd filed Critical Chengdu Shuoder Pharmaceutical Co ltd
Priority claimed from PCT/CN2018/115733 external-priority patent/WO2019096226A1/en
Publication of CN111406071A publication Critical patent/CN111406071A/zh
Application granted granted Critical
Publication of CN111406071B publication Critical patent/CN111406071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

本发明涉及包含(i)血小板衍生生长因子受体(PDGFR)的结构域和(ii)血管内皮生长因子受体(VEGFR)的结构域的蛋白质。在优选的实施方案中,所述PDGFR的结构域和VEGFR的结构域通过由脯氨酸,丙氨酸和丝氨酸组成的接头附接。所述PDGFR的结构域和所述VEGFR的结构域也可以通过由脯氨酸和丙氨酸组成的接头附接。本发明还提供包含所述蛋白质的组合物,以及其治疗用途。

Description

PAS化的VEGFR/PDGFR融合蛋白及其在治疗中的用途
技术领域
本发明涉及包含(i)血小板衍生生长因子受体(PDGFR)的结构域和(ii)血管内皮生长因子受体(VEGFR)的结构域的蛋白质。在优选的实施方案中,所述PDGFR的结构域和VEGFR的结构域通过由脯氨酸,丙氨酸和丝氨酸组成的接头附接(attach)。PDGFR的结构域和所述VEGFR的结构域也可以通过由脯氨酸和丙氨酸组成的接头附接。本发明还提供包含所述蛋白的组合物,以及其治疗用途。
背景技术
目前最先进的抗血管生成治疗靶向VEGF通路,其是血管生成的主要必需信号通路,包括癌症和眼部疾病中的病理性血管生成。然而,在具有眼部疾病患者抗VEGF单一疗法的长期结果在某种程度上令人失望(Dugel,2013),因为长期抗VEGF治疗似乎在一些患者群体中引起疾病抗性,这通常与视力的实质性丧失相关(Rofagha等人,2013;Ying等人,2014;Rosenfeld等,2011)。由于患者玻璃体中VEGF水平变化,提出抗VEGF疗法的那些不良反应者由于较高水平的VEGF,可能需要剂量高得多的抗VEGF药物。然而,一项大型的临床研究(READ-3)1年结果显示使用比常规方案高4倍的剂量没有额外的益处(Nguyen等人,2014;白玉婧等人,2016)。这些观察提示,多种通路涉及眼部疾病中的视网膜和脉络膜新生血管形成。事实上,越来越多的临床和实验室证据表明,除VEGF外,其为新生血管(或湿性)年龄相关性黄斑变性(AMD;Rosenfeld等人,2006;Heier等人,2012)中的关键因素,PDGF也可能在该疾病的发病机理中起关键作用。实际上,VEGF和PDGF的双重抑制可能比单独靶向VEGF更有效(Robins等人,1994;Benjamin等人,1998;Zehetner等人,2014;Bergers等人,2003;Erber等人,2004;Pachydaki等人,2012)。
当不稳定且高度可渗透的血管生长并从脉络膜入侵到视网膜中时,病理状况AMD发生,其中渗漏和出血导致视力的快速丧失(在几周至几个月的时段期间)。在这种情况下,VEGF是已知的血管通透性最有力的诱导剂之一(Carmeliet,2000),尽管VEGF增加血管通透性的精确机制尚不完全清楚。
检查视网膜的出生后重塑的研究提供了VEGF和PDGF在湿性AMD中的重要性的初步线索(Benjamin等人,1998),而在癌症模型方面的工作为追求用于湿性AMD治疗的抗VEGF/PDGF联合疗法提供了最终推动力(Bergers等人,2003;Erber等人,2004)。抗VEGF单一疗法的患者通常在治疗的前3或4个月内获得视敏度(即视力清晰度)的初步改善,其后是整个研究期间持续的平稳时期(Dugel,2013)。在这前几个月的治疗中,抗VEGF单一疗法主要作用于形成血管壁衬里(inner lining)的有孔(fenestrated)内皮细胞,导致水肿减少,从而导致视敏度的初步改善。然而,此后新生血管复合体的其余部分似乎受到周细胞的保护,所述周细胞覆盖并稳定内皮细管。在这种情况下,认为周细胞使对VEGF抑制有抗性的血管存活,这可能是初始抗VEGF治疗后通常观察到的平稳时期(plateau)的原因(Dugel,2013)。值得注意的是,抗VEGF疗法可能不仅导致内皮细胞凋亡,而且还增强周细胞募集,从而潜在地逆转VEGF抑制的作用(Winkler等人,2004;Pachydaki等人,2012)。
临床有用的VEGF阻断剂的库(arsenal)随着时间发展,其中较新世代通过增加对VEGF-A的亲和力和/或其抑制的VEGF同种型(isoforms)和家族成员的数量,提供潜在的改善的抗血管生成活性。原则上,这些阻断剂落入两类:(i)单克隆抗体,可变的链接蛋白(支架)或生物工程化的可溶性受体片段和(ii)VEGFR和相关受体的激酶结构域的小分子抑制剂。
FDA批准用于AMD的首批抗VEGF疗法之一是pegaptanib(Macugen),其是结合并中和VEGF-A165的RNA适体(Gragoudas等人,2004)。采用VEGF中和策略的第一种基于蛋白的疗法是贝伐单抗(Bevacizumab)(Avastin,Genentech),其是通过其可变区经由抗原识别来阻断所有VEGF同种型的重组人源化抗VEGF抗体。贝伐单抗最早被批准用于治疗转移性结肠直肠癌,非小细胞肺癌和多形性胶质母细胞瘤(Grothey等人,2009;Ferrara等人,2004)。伴随着此类癌症疗法的发展,VEGF被发现也在新生血管性AMD和糖尿病性视网膜病变中起关键作用。
从这一概念开始,兰尼单抗(Ranibizumab)(Lucentis,Genentech)是基于贝伐单抗开发的,作为亲和力成熟的抗原结合片段(Fab),其特别用于玻璃体内施用以治疗血管性眼病,特别是湿性或新生血管形式的AMD(Ferrara等人,2006),最近也有用于糖尿病性视网膜病变((Stewart,2017))。认为与全尺寸抗体相比,Fab的较小尺寸增强其从玻璃体扩散到视网膜中以及脉络膜中的可能(Ferrara等人,2006)。
VEGF-Trap(aflibercept;Regeneron Pharmaceuticals)是生物工程化可溶性诱饵受体,其基于与其关联细胞受体VEGFR-1和VEGFR-2的生长因子分子相互作用而结合VEGF-A。VEGF-Trap由全人氨基酸序列组成,所述全人氨基酸序列包含与人IgG1的恒定区(Fc)串联融合的人VEGFR1的第二Ig结构域和人VEGFR2的第三Ig结构域(Holash等人,2002)。因此,VEGF-Trap具有比抗体更广的特异性,不仅识别VEGF-A的多个同种型,而且识别相关的VEGF-B,PlGF(胎盘生长因子)和PlGF2(Papadopoulos等人,2012),其全部是两种酪氨酸激酶(TK)受体VEGFR-1和VEGFR-2的生理配体。
发明内容
尽管迄今描述的试剂的有效性和可用性已被证实,为了改善VEGF靶向和/或克服对现有抗VEGF疗法的抗性,需要另外的且更有效的抗VEGF疗法。目前,维持疾病控制通常需要连续玻璃体内注射VEGF拮抗剂进行长期抑制,而没有一种可用的药物导致脉络膜新生血管膜完全消退。与此一致,不是所有的患者都对治疗有反应,有些发展成为无应答者。理想情况下,新的方法将解决目前的(单一)疗法的所有这些限制。
在治疗过程中,无论是内在的还是可调整的,造成VEGF阻塞的关键因素之一是VEGF信号系统的冗余(Giuliano&Pages,2013).其他血管生成因子的表达增加可能会为血管生成提供替代的信号通路,这可能引发VEGF无关的新血管化,并导致对单抗VEGF药物的耐药性。特别是针对多种病理路径的药物的混合,可能会增强治疗的效果,因为它以一种典型的协同作用或一种添加剂的方式来靶向关键的通路。
除从VEGF这个靶点角度考虑外,PDGF和PDGFR是多种疾病,特别是癌症和血管病症中的有效治疗靶点(Andrae等人,2008)。PDGF是A和B多肽链的异或同二聚体或C或D链的同二聚体,其与它们的关联PDGF受体相互作用:除PDGF-DD之外的所有PDGF形式结合PDGFR-α受体,而仅PDGF-BB和PDGF-DD结合PDGF-β受体(Hoch等人,2003)。因此,与PDGFR-β相比,PDGFR-α具有更广泛的配体结合活性,此外,对PDGF-AA和PDGF-BB两者之和甚至PDGF-CC具有更高的亲和力。
迄今为止,该不同的特异性的基础尚不清楚。PDGF-CC已显示与脉络膜和视网膜新生血管形成有关(Hou等人,2010;Cao等人,2002)。PDGF-BB的致病作用涉及缺血性视网膜病变,如增生性糖尿病性视网膜病变,增生性玻璃体视网膜病变和脉络膜新生血管形成。值得注意的是,在血管生成和血管成熟的过程期间,血小板衍生生长因子-B(PDGF-BB)经由通过PDGF受体β(PDGFR-β)的信号传导,调节周细胞向生长的内皮细胞管的募集。
在增生性视网膜病变的临床前兔模型中,PDGF-BB抑制适体的眼内注射显示保护眼睛免于视网膜脱离(Akiyama等人,2006)。
值得注意的是,使用玻璃体内注射PDGF阻断剂联合玻璃体内抗VEGF疗法的临床试验的初步结果已经证明了该组合策略对于治疗AMD的潜力(Diago等人,2008;Boyer等人,2009)。
然而,同时在一项临床试验中设置两种生长因子仍然有一些技术困难。最近,Fovista(E10030;Ophthotech),一种抗PDGF-B聚乙二醇化的适体,作为兰尼单抗的辅助药物的一项临床II期和III期研究显示,尽管与单独使用兰尼单抗相比,向患有湿性AMD的患者联合施用E10030和兰尼单抗,导致视力结果62%的增加(Jaffe等人,2016),但通过收到的反馈可知,联合施用组的不良事件出现率更高。
在另一项用于湿性老年性黄斑变性AMD的临床II期试验中,联合施用2种抗体类分子药物阿柏西普(VEGF陷阱)和rinucumab(一种抗PDGFRβ抗体),众所周知这个试验编号REGN2176-3,与单独使用阿柏西普相比,联合施用组出现不良事件更多,并且从接受治疗的患者的效果反馈来看,联合施用组的结膜出血增加,眼睛刺激性和眼睛疼痛为23.5%和20%,而单独使用阿柏西普却只有16%。ClinicalTrials.gov Identifier:NCT02418754).
值得注意的是,阿柏西普和rinucumab这2种药物都含有IgG的Fc结晶片段,但这些分子的Fc构成,也就是免疫效益区域,是否会影响眼睛生理机制,现在还是不清楚的,正常情况下,一个物理屏障,视网膜可以阻止免疫球蛋白(Igs)和其他大型分子自由出入眼睛,因此建立起免疫微环境,这使得这个器官具有独特的免疫性。尽管基于玻璃体内注射高浓度免疫球蛋白药物治疗的效果不是很清楚,但已有证据表明Fc组件和视网膜Fc受体在相互作用,因此可能对AMD的内部炎症反应有贡献(Souid et al.,2016;Powner et al.,2014;Murinello et al.,2014).
理想情况下,由于每次注射过程对病人来说是很大的负担,而且还需要承担出现并发症的风险。基于蛋白质药物用于慢性的眼科疾病治疗应该是允许提供更少剂量,获得更长眼内半衰期的药物(Day et al.,2011)。对于这样一种蛋白质药物,获得延长半衰期的方法之一就是提供一种是基因多肽融合蛋白,这种蛋白可以提供了一种理想的药动学特征,但也存在有(生理和生化反应)惰性。这种方式允许进一步稳定的设计,有两个或两个以上的融合部分组成的第二代蛋白质药物,每个融合部分都包含特定的靶点模式。
因此,针对上述技术问题,本发明提供了同时用于双靶向VEGF和PDGFR配体的治疗手段和方法。
通过提供权利要求书中表征的实施方案解决了该技术问题。
因此,本发明涉及蛋白质,所述蛋白质包含
(i)血小板衍生生长因子受体(PDGFR)的结构域;和
(ii)血管内皮生长因子受体(VEGFR)的结构域。
在优选的方面,本文提供蛋白质,所述蛋白质包含
(i)人血小板衍生生长因子受体(PDGFR)的胞外结构域;和
(ii)人血管内皮生长因子受体(VEGFR)的胞外结构域。
在优选的实施方案中,所述PDGFR的结构域和所述VEGFR的结构域通过由脯氨酸、丙氨酸和丝氨酸组成的接头附接。
如本文以下解释的,VEGF和PDGF信号传导抑制的协同效果可由一种治疗性蛋白质介导。如实施例中显示,设计了能够同时结合VEGF和PDGF配体的单链蛋白。该融合蛋白作为VEGF,PDGF和相关配体的分子陷阱(molecular trap)发挥功能,因此在这些配体协同作用的病理过程(包括AMD或癌症)中是有益的。
如实施例所示,将蛋白质设计为VEGF受体-1和-2以及PDGF受体α(PDGFR-α)的N末端胞外域之间的融合物,所述N末端胞外域分别参与VEGF或PDGF的配体结合。这两类受体(VEGFR1/2和PDGFR-α)都包含非常广泛的配体结合活性,这被认为在血管发生是主导过程的疾病状态下是有益的。像所有蛋白酪氨酸激酶受体一样,VEGFR-1,VEGFR-2和PDGFR-α(以及还有PDGFR-β)由五至七个免疫球蛋白(Ig)样结构域(D1-D7)的胞外区,单个跨膜区段和细胞内分裂催化酪氨酸激酶结构域组成(Shibuya等人,1999;Stuttfeld等人,2009)。二聚体VEGF/PDGF配体与这些受体的结合通常发生在第二和第三个Ig样结构域(D2,D3),其中它促进受体的同或异二聚化,并因此促进信号转导。胞外区的近端结构域4-7(D4-7)似乎对于稳定配体-受体复合物是重要的,而最接近细胞膜的结构域D7对于配体诱导的酪氨酸磷酸化和细胞信号传导至关重要。
因此,对于构建有效的诱饵受体片段,如本文所示,其足以主要利用直接参与配体结合的来自N末端胞外区的结构域。然而,诱饵受体也可受益于延长的形式,例如通过亲合力效应。
在实施例中,将VEGFR的细胞外部分置于融合蛋白的C末端或N末端,并且具有与美国专利5,952,199中描述的工程化杂合VEGFR1-D2/VEGFR2-D3胞外域的高亲和力配体结合区相同的组成。将包含该受体的前三个胞外域D1-3的PDGFR-α部分排列在融合蛋白的N末端或C末端,从而保留PDGFR-α/VEGFR的天然N末端,包括其在分泌时被处理的信号肽。尽管关于PDGFR-α的分子结构所知不多,但相关的PDGFR-β和VEGFR受体的结构(Schlessinger,2000;Shim等人,2010)提供了关于相应配体/受体识别复合物的中心部分的信息,其被认为一般是相似的,因为PDGF和VEGF是共同起源的(McDonald和Hendrickson,1993)。从这些结构可知,PDGFR-β和VEGFR的D1结构域不直接参与配体结合,但由于D1和D2之间的疏水性界面,充当配体结合D2结构域的帽(cap)(Hye-Ryong等人,2010;等人,2013)。因此,本文认为在PDGFR-α的诱饵形式中包含第一结构域D1对治疗性融合蛋白有益,如本文实施例中提供的。事实上,从PDGF-α的胞外域中的缺失分析中得知(Mahadewan等人,1995),PDGFR-α中D1的存在似乎也对配体与PDGF-AA的结合具有小的差异效果。
在优选方面,提供了融合蛋白质,其中PDGFR-α的细胞外部分D1-3和VEGFR1/2的D2/D3通过PAS-多肽序列或者备选地无Ser的P/A序列连接。此类PAS/PA序列例如公开于WO2008/155134 A1和WO2011/144756 A1。该PAS/PA间隔区提供了个别胞外域的结构柔性,从而允许VEGF和PDGF配体两者的接近。另外,这些无规卷曲序列显著增加了融合蛋白的流体动力学体积,其减缓了融合的胞外域在体内的清除,因此延长和/或增强了药理效果(Schlapschy等人,2013)。另外,PAS/PA多肽是氨脯氨酸(Pronine,Pro,P),丙氨酸(Alanine,Ala,A)和丝氨酸((Serine,Ser,S)或分别为脯氨酸和丙氨酸)的亲水均聚物,其提供生物相容性并可降解。
PAS接头/间隔序列的无规卷曲性质(Schlapschy等人,2013)给个别VEGFR和PDGFR胞外域提供高柔性,使得在配体存在下,诱饵受体融合体的每个臂能够结合二聚体配体,最终形成功能诱饵二聚体(见图2)。一旦经由与第一配体(VEGF或PDGF)形成复合体形成后,这种二聚化的融合蛋白进一步通过亲合力效应获得对第二配体的功能性亲和力。因此,PDGFR和VEGFR胞外域的亲和力应通过多重结合相互作用协同综合,特别是在两种配体都丰富的疾病状况下。
这是高度有利的,因为在二聚化的胞外域受体融合体中,如果存在第一配体,理想地是VEGF,则天然PDGFR胞外域对于其同/异二聚体PDGF配体的相对中等的亲和力可以通过杂合VEGFR1-D2/VEGFR2-D3结构域对VEGF-A的高亲和力配体结合位点而增强(Holash等人,2002)。如本文提供和公开的诱饵受体一方面应当可以与相应的膜结合天然受体在亲和力和特异性方面相当,但另一方面其应当不能够触发信号传导,或向信号传导复合物呈递激动剂。
根据上文,本申请提供代表性蛋白质实施例如下;
-VEGF165诱导的HUVEC细胞增殖抑制试验(试验例20)
-抑制斑马鱼胚胎中的节间血管(ISV)发育(试验例21)
-抑制人VEGFA诱导的肿瘤新血管形成(试验例22);
-样品在大鼠体内半衰期(T1/2)检测(试验例23);
-抑制食蟹猴的激光诱导的脉络膜新生血管形成(CNV)(试验例24)
-显示在新西兰兔中半衰期(T1/2)增加(试验例25);
-在天然PAGE和电动迁移率凝胶位移测定中显示与目标化合物形成复合物(试验例26);
-抑制VEGF165诱导的HUVEC细胞增殖(试验例27)。
本申请涉及以下项:
1.蛋白质,所述蛋白质包含
(i)人血小板衍生生长因子受体(PDGFR)的胞外结构域;和
(ii)人血管内皮生长因子受体(VEGFR)的胞外结构域。
2.项1的蛋白质,其中所述PDGFR的结构域和所述VEGFR的结构域通过由脯氨酸、丙氨酸和丝氨酸的接头附接。
3.项2的蛋白质,其中所述脯氨酸残基占所述接头的多于4%且少于40%。
4.项2或3的蛋白质,其中所述接头具有如下氨基酸序列:(ASPAAPAPASPAAPAPSAPA)n,其中n为10-100的整数。
5.项4的蛋白质,其中所述接头具有如下氨基酸序列:(ASPAAPAPASPAAPAPSAPA)n,其中n为10-60的整数。
6.项5的蛋白质,其中所述接头具有如下氨基酸序列:(ASPAAPAPASPAAPAPSAPA)n,其中n为10-40的整数。
7.项6的蛋白质,其中所述接头其中所述接头具有如下氨基酸序列:(ASPAAPAPASPAAPAPSAPA)n,其中n为10-30的整数。
8.项7的蛋白质,其中所述接头具有如下氨基酸序列:(ASPAAPAPASPAAPAPSAPA)n,其中n为10、20或30。
9.项4的蛋白质,其中所述接头具有选自下述氨基酸序列:SEQ ID No.2中显示的氨基酸序列或其中所述接头是由具有如SEQ ID No.1中显示的核苷酸序列的核酸分子编码的多肽。
10.项1的蛋白质,其中所述PDGFR的结构域和所述VEGFR的结构域通过由脯氨酸和丙氨酸组成的接头附接。
11.项10的蛋白质,其中所述脯氨酸残基占所述接头的多于约10%且少于约75%。
12.项11或10的蛋白质,其中所述接头具有如下氨基酸序列:
(AAPAAPAPAAPAAPAAPA)n,其中n为10-100的整数。
13.项12所述的蛋白质,其中所述接头具有选自下述氨基酸序列:SEQ ID No.70中显示的氨基酸序列或其中所述接头是由具有如SEQ ID No.69中显示的核苷酸序列的核酸分子编码的多肽。
14.项2至10中任一项的蛋白质,其中所述接头具有由约50个至约3000个氨基酸残基组成的氨基酸序列。
15.项14的蛋白质,其中所述PDGFR的结构域包含PDGFR的Ig结构域1至5的一个或多个。
16.项15的蛋白质,其中所述PDGFR的结构域包含PDGFR的Ig结构域1至3的一个或多个。
17.项1至16中任一项的蛋白质,其中所述PDGFR的结构域包含PDGFR的Ig结构域1至3。
18.项1至17中任一项的蛋白质,其中所述PDGFR的结构域能够结合血小板衍生生长因子(PDGF)。
19.项1至18的蛋白质,其中所述PDGF是PDGF二聚体。
20.项19的蛋白质,其中所述PDGF二聚体是PDGF同二聚体或PDGF异二聚体。
21.项1至21中任一项的蛋白质,其中所述PDGFR是人PDGFRα。
22.项1至21中任一项的蛋白质,其中所述PDGFR的结构域包含
(a)具有如SEQ ID No.4或SEQ ID No.20中显示的氨基酸序列的蛋白;
(b)如(a)中定义的蛋白质,其中缺失、插入、添加或取代了1至10个氨基酸;
(c)由具有如SEQ ID No.3或SEQ ID No.19中显示的核苷酸序列的核酸分子编码的多肽;
(d)具有由核酸编码的氨基酸序列的多肽,所述核酸在严格条件下与如(c)中定义的核酸分子的互补链杂交;
(e)与(a)至(d)中任一项的多肽具有至少70%同一性的多肽;和
(f)具有由核酸编码的氨基酸序列的多肽,所述核酸由于遗传密码而与如(c)或(d)中定义的核酸的核苷酸序列是简并的。
23.项21或22的蛋白质,其中所述PDGFR的结构域能够结合血小板衍生生长因子(PDGF),其中所述PDGF是PDGF同二聚体,且其中所述PDGF同二聚体是PDGFA同二聚体,PDGFB同二聚体,或PDGFC同二聚体。
24.项21或22的蛋白质,其中所述PDGFR的结构域能够结合血小板衍生生长因子(PDGF),其中所述PDGF优选为PDGF异二聚体,且其中所述PDGF异二聚体优选为异二聚体PDGFAB。
25.项1至20中任一项的蛋白质,其中所述PDGFR是人PDGFRβ。
26.项1至20和25中任一项的蛋白质,其中所述PDGFR的结构域包含
(a)具有如SEQ ID No.6中显示的氨基酸序列的蛋白;
(b)如(a)中定义的蛋白质,其中缺失、插入、添加或取代了1至10个氨基酸;
(c)由具有如SEQ ID No.5中显示的核苷酸序列的核酸分子编码的多肽;
(d)具有由核酸编码的氨基酸序列的多肽,所述核酸在严格条件下与如(c)中定义的核酸分子的互补链杂交;
(e)与(a)至(d)中任一项的多肽具有至少70%同一性的多肽;和
(f)具有由核酸编码的氨基酸序列的多肽,所述核酸由于遗传密码而与如(c)或(d)中定义的核酸的核苷酸序列是简并的。
27.项25或26的蛋白质,其中所述PDGFR的结构域能够结合血小板衍生生长因子(PDGF),其中所述PDGF优选为PDGF同二聚体,且其中所述PDGF同二聚体优选为PDGFB同二聚体。
28.项18至27中任一项的蛋白质,其中所述血小板衍生生长因子(PDGF)是人PDGF。
29.项1至28中任一项的蛋白质,其中所述VEGFR的结构域包含VEGFR的Ig结构域1至7的一个或多个。
30.项1至29中任一项的蛋白质,其中所述VEGFR的结构域包含VEGFR的Ig结构域2和/或Ig结构域3。
31.项1至30中任一项的蛋白质,其中所述VEGFR的结构域包含VEGFR的Ig结构域2和Ig结构域3。
32.项1至31中任一项的蛋白质,其中所述VEGFR是人VEGFR-1或人VEGFR-2。
33.项1至32中任一项的蛋白质,其中所述VEGFR的结构域包含VEGFR-1的Ig结构域2和VEGFR-2的Ig结构域3。
34.项1至33中任一项的蛋白质,其中所述VEGFR的结构域包含
(a)具有如SEQ ID No.8中显示的氨基酸序列的蛋白;
(b)如(a)中定义的蛋白质,其中缺失、插入、添加或取代了1至10个氨基酸;
(c)由具有如SEQ ID No.7中显示的核苷酸序列的核酸。分子编码的多肽;
(d)具有由核酸编码的氨基酸序列的多肽,所述核酸在严格条件下与如(c)中定义的核酸分子的互补链杂交;
(e)与(a)至(d)中任一项的多肽具有至少70%同一性的多肽;和
(f)具有由核酸编码的氨基酸序列的多肽,所述核酸由于遗传密码而与如(c)或(d)中定义的核酸的核苷酸序列是简并的。
35.项1至34中任一项的蛋白质,其中所述VEGFR的结构域能够结合血管内皮生长因子(VEGF)。
36.项35的蛋白质,其中所述血管内皮生长因子(VEGF)是VEGF二聚体。
37.项36的蛋白质,其中所述VEGF二聚体是VEGF同二聚体。
38.项37的蛋白质,其中所述VEGF同二聚体是VEGFA同二聚体。
39.项35至38中任一项的蛋白质,其中所述血管内皮生长因子(VEGF)是人VEGF。
40.项1至39中任一项的蛋白质,其中所述蛋白是融合蛋白。
41.项1至40中任一项的蛋白质,其中所述蛋白质包含
(a)具有如SEQ ID No.16、SEQ ID No.46、SEQ ID No.48、SEQ ID No.50、SEQ IDNo.52、SEQ ID No.54、SEQ ID No.56、SEQ ID No.58、SEQ ID No.60、SEQ ID No.62、SEQ IDNo.64、SEQ ID No.66或者SEQ ID No.68中显示的氨基酸序列的蛋白质;
(b)如(a)中定义的蛋白质,其中缺失、插入、添加或取代了1至10个氨基酸;
(c)由具有如SEQ ID No.15、SEQ ID No.45、SEQ ID No.47、SEQ ID No.49、SEQ IDNo.51、SEQ ID No.53、SEQ ID No.55、SEQ ID No.57、SEQ ID No.59、SEQ ID No.61、SEQ IDNo.63、SEQ ID No.65或者SEQ ID No.67中显示的核苷酸序列的核酸分子编码的多肽;
(d)具有由核酸编码的氨基酸序列的多肽,所述核酸在严格条件下与如(c)中定义的核酸分子的互补链杂交;
(e)与(a)至(d)中任一项的多肽具有至少70%同一性的多肽;和
(f)具有由核酸编码的氨基酸序列的多肽,所述核酸由于遗传密码而与如(c)或(d)中定义的核酸的核苷酸序列是简并的。
42.项1至41中任一项的蛋白质,其中所述蛋白质包含N末端信号肽序列。
43.项42的蛋白质,其中所述N末端信号肽序列是PDGFR的N末端信号肽序列。
44.项43的蛋白质,其中所述N末端信号肽序列是人PDGFRα的N末端信号肽序列。
45.项42至44中任一项的蛋白质,其中所述N末端信号肽序列具有如SEQ ID No.10中显示的氨基酸序列或其中所述N末端信号肽序列是由具有如SEQ ID No.9中显示的核苷酸序列的核酸分子编码的多肽。
46.项1至45中任一项的蛋白质,其中所述蛋白还包含纯化标签。
47.项46的蛋白质,其中所述纯化标签是His标签。
48.项46或47的蛋白质,其中所述纯化标签具有如SEQ ID No.12中显示的氨基酸序列或其中所述纯化标签是由具有如SEQ ID No.11中显示的核苷酸序列的核酸分子编码的多肽。
49.项1至48中任一项的蛋白质,其中所述蛋白质以如下顺序从N端至C端排列:
(任选的信号肽序列)-一个或多个PDGFR的结构域-(任选的接头)-一个或多个VEGFR的结构域-(任选的纯化标签);
(任选的信号肽序列)-VEGFR的一个或多个结构域-(任选的接头)-PDGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-(任选的接头)-VEGFR的一个或多个结构域-PDGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-(任选的接头)-PDGFR的一个或多个结构域-VEGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-(任选的接头)-PDGFR的一个或多个结构域-(任选的接头)-VEGFR的一个或多个结构域-(任选的接头)-(任选的纯化标签)。
50.权利要求1至49中任一项的蛋白质,其中所述蛋白质以如下顺序从N端至C端排列:
(任选的信号肽序列)-PDGFR的一个或多个结构域-PAS/PA-VEGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-VEGFR的一个或多个结构域-PAS/PA-PDGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-PAS/PA-VEGFR的一个或多个结构域-PDGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-PAS/PA-PDGFR的一个或多个结构域-VEGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-PAS/PA-PDGFR的一个或多个结构域-PAS/PA-VEGFR的一个或多个结构域-PAS/PA-(任选的纯化标签)。
51.权利要求1至50中任一项的蛋白质,其中所述蛋白质以如下顺序从N端至C端排列:
(任选的信号肽序列)-PDGFR的一个或多个结构域-(GGGGS)n-PAS/PA-(GGGGS)n-VEGFR的一个或多个结构域-(任选的纯化标签);或
(任选的信号肽序列)-VEGFR的一个或多个结构域-(GGGGS)n-PAS/PA-(GGGGS)n-PDGFR的一个或多个结构域-(任选的纯化标签);
其中,n=0-5。
52.项1至51中任一项的蛋白质,其中所述蛋白质包含
(a)具有如SEQ ID No.14、SEQ ID No.22、SEQ ID No.24、SEQ ID No.26、SEQ IDNo.28、SEQ ID No.30、SEQ ID No.32、SEQ ID No.34、SEQ ID No.36、SEQ ID No.38、SEQ IDNo.40或者SEQ ID No.42或者SEQ ID No.44中显示的氨基酸序列的蛋白;
(b)如(a)中定义的蛋白质,其中缺失、插入、添加或取代了1至10个氨基酸;
(c)由具有如SEQ ID No.13、SEQ ID No.21、SEQ ID No.23、SEQ ID No.25、SEQ IDNo.27、SEQ ID No.29、SEQ ID No.31、SEQ ID No.33、SEQ ID No.35、SEQ ID No.37、SEQ IDNo.39、SEQ ID No.41或SEQ ID No.43中显示的核苷酸序列的核酸分子编码的多肽;
(d)具有由核酸编码的氨基酸序列的多肽,所述核酸在严格条件下与如(c)中定义的核酸分子的互补链杂交;
(e)与(a)至(d)中任一项的多肽具有至少70%同一性的多肽;和
(f)具有由核酸编码的氨基酸序列的多肽,所述核酸由于遗传密码而与如(c)或(d)中定义的核酸的核苷酸序列是简并的。
53.编码项1至52中任一项的蛋白质的核酸分子。
54.包含项53的核酸的载体。
55.包含项53的核酸或项54的载体的宿主细胞。
56.根据项55的宿主细胞,其中所述宿主细胞是真核宿主细胞或原核宿主细胞。
57.根据项56的宿主细胞,其中所述原核宿主细胞是大肠杆菌(E.coli)。
58.根据项56的宿主细胞,其中所述真核宿主细胞是真菌或动物细胞。
59.根据项58的宿主细胞,其中所述动物细胞是HEK细胞或CHO细胞。
60.用于制备项1至52中任一项的蛋白质的方法。
61.项60的方法,所述方法包括培养根据项55至59中任一项的宿主细胞,并从培养物或从所述细胞分离所述蛋白。
62.组合物,所述组合物包含项1至52中任一项的蛋白质,通过项60或61的方法制备的蛋白质,项53的核酸,项54的载体,或权利55至58中任一项的细胞。
63.根据项62的组合物,其为药物组合物,任选地还包含(a)药学上可接受的载体。
64.项1至52中任一项的蛋白质,通过项60或61的方法制备的蛋白质,项53的核酸,项54的载体,或项55至58中任一项的细胞,或项62或63的组合物,用于作为药物使用。
65.项1至52中任一项的蛋白质,通过项60或61的方法制备的蛋白质,项53的核酸,项54的载体,或项55至58中任一项的细胞,或项62或63的组合物,用于治疗与血管新生相关的疾病,包括但不限于各种肿瘤、各种眼科疾病、癌症、肾纤维化、硬化、动脉粥样硬化、门静脉高压或系统性硬化症的治疗中使用。
66.根据项65使用的蛋白质,根据项65使用的核酸,根据项65使用的载体,根据项65使用的细胞,或根据项65使用的组合物,其中所述癌症是实体癌。
67.根据项66使用的蛋白质,根据项66使用的核酸,根据项66使用的载体,根据项66使用的细胞,或根据项66使用的组合物,其中所述实体癌是结肠癌,肝细胞癌,非小细胞肺癌,软组织肉瘤,前列腺癌,乳腺癌,卵巢癌,神经胶质瘤,隆凸性皮肤纤维肉瘤,口腔鳞状细胞癌,胰腺癌。
68.根据项65使用的蛋白质,根据项65使用的核酸,根据项65使用的载体,根据项65使用的细胞,或根据项65使用的组合物,其中所述癌症是非实体癌。
69.根据项68使用的蛋白质,根据项68使用的核酸,根据项68使用的载体,根据项68使用的细胞,或根据项68使用的组合物,其中所述非实体癌是白血病或非霍奇金淋巴瘤(non-Hodgkin’s lymphoma)。
70.根据项65使用的蛋白质,根据项65使用的核酸,根据项65使用的载体,根据项65使用的细胞,或根据项65使用的组合物,其中所述眼科疾病是与年龄相关的黄斑变性(AMD),糖尿病性视网膜病变(DR),糖尿病性黄斑水肿(DME),脉络膜血管化(CNV),视网膜静脉阻塞(RVO),中央视网膜静脉阻塞(CRVO),视网膜静脉阻塞(BRVO),病理近视(PM)。
71.根据项65使用的蛋白质,根据权利要求65使用的核酸,根据权利要求65使用的载体,根据权利要求65使用的细胞,或根据权利要求65使用的组合物,其中所述眼科疾病是与年龄相关的黄斑变性(AMD)。
在某些方面,本文提供以下项:
如上文所提到的,本文提供蛋白质,所述蛋白质包含
(i)人血小板衍生生长因子受体(PDGFR)的胞外结构域;和
(ii)人血管内皮生长因子受体(VEGFR)的胞外结构域。
如上文所提到的,在优选的实施方案中,所述PDGFR的结构域和所述VEGFR的结构域通过由脯氨酸、丙氨酸和丝氨酸组成的接头附接。
血小板衍生生长因子(PDGF)家族由A,B,C和D多肽链的二硫键键合的同二聚体和异二聚体PDGF-AB组成。据报道PDGF同种型通过与其各自的受体(PDGF受体(PDGFR))结合而发挥其细胞作用。术语“血小板衍生生长因子”,“PDGF”,“血小板衍生生长因子蛋白”和“PDGF蛋白”在本文中可互换使用。术语“血小板衍生生长因子受体”,“PDGF受体”,“PDGFR”,“血小板衍生生长因子受体蛋白”,“PDGF受体蛋白”和“PDGFR蛋白”在本文中可互换使用。
据报道血管内皮生长因子(VEGF)及其受体(VEGFR)调节血管发生(早期胚胎发生过程中从前体细胞形成血管)和血管发生(在稍后阶段从先前存在的血管形成血管)两者。VEGF基因家族含有至少7个成员,而根据脊椎动物物种,VEGFR基因家族有3至4个成员。术语“血管内皮生长因子”,“VEGF”,“血管内皮生长因子蛋白”和“VEGF蛋白”在本文中可互换使用。术语“血管内皮生长因子受体”,“VEGF受体”,“VEGFR”,“血管内皮生长因子受体蛋白”,“VEGF受体蛋白”和“VEGFR蛋白”在本文中可以互换使用。
术语“结构域”或“蛋白质结构域”的含义是本领域公知的,并且该术语本文中相应使用。术语“结构域”和“蛋白质结构域”在本文中可互换使用。蛋白质结构域可以视为蛋白质结构的基本结构单元。每个结构域的核心通常在很大程度上由一组相互连接的β片层或α螺旋或两者组成。结构域通常由通常含有50至350个氨基酸的多肽链的部分构建。
涵盖本文提供的蛋白质可以起“诱饵”受体作用,即它们可以结合配体PDGF和/或VEGF。
在优选方面,PDGFR的结构域能够结合血小板衍生生长因子(PDGF)。PDGF可以是单体,但优选为PDGF二聚体。PDGF二聚体可以是PDGF同二聚体或PDGF异二聚体。
在优选的方面,VEGFR的结构域能够结合血管内皮生长因子(VEGF)。VEGF可以是单体,但优选为PDGF二聚体。VEGF二聚体可以是VEGF同二聚体,如VEGFA同二聚体。
更优选地,PDGFR的结构域能够结合血小板衍生生长因子(PDGF),且VEGFR的结构域能够结合血管内皮生长因子(VEGF)。
本文中根据本领域的常规含义使用术语“能够结合”,“结合能力”等。在配体-受体相互作用的背景下,“结合能力”是指配体(这里分别为PDGF和VEGF)结合其受体(分别为PDGFR的结构域和VEGFR的结构域)的能力。
可以通过IC50(受体结合位点的一半被占据的配体的浓度)来表征配体结合。
可以使用称为标记化(tagged)配体的放射性标记(标记化)配体来确定结合亲和力。非标记方法包括表面等离振子共振,双极化干涉测量法(dual polarizationinterferometry),多参数表面等离振子共振(Multi-Parametric Surface PlasmonResonance)(MP-SPR)和微型热迁移(Microscal thermophoresis)。
PDGF和VEGF分别与PDGFR的结构域和VEGFR的结构域的相互作用可以在结合亲和力方面表征。高亲和力的PDGF/VEGF结合源自PDGF/VEGF与其相应的PDGFR结构域和VEGFR结构域之间更大的分子间力。
PDGF通常与其受体PDGFR的细胞外结构域结合。
本文优选PDGFR的结构域包含PDGFR的细胞外结构域或由PDGFR的细胞外结构域组成。PDGFR的细胞外结构域含有5个Ig样结构域。术语“Ig样结构域”和“Ig结构域”在本文中可互换使用。认为优先对Ig结构域2和3发生配体结合。
根据上文,PDGFR的结构域可以包含或由PDGFR的Ig结构域1至5中的一个或多个组成,即PDGFR的Ig结构域1,PDGFR的Ig结构域2,PDGFR的Ig结构域3,PDGFR的Ig结构域4,PDGFR的Ig结构域5的一个或多个。在本文中包括其任何组合,以及PDGFR的Ig结构域1至5中的一个或多个的片段或衍生物的用途(和PDGFR的Ig结构域1至5的一个或多个和PDGFR的Ig结构域1至5的一个或多个的任何片段或衍生物的任何组合)。
本文使用的PDGFR的结构域可以例如包含或组成为PDGFR的Ig结构域1至3中的一个或多个,即PDGFR的Ig结构域1,PDGFR的Ig结构域2和PDGFR的Ig结构域3中的一个或多个。在本文中包括其任何组合,以及PDGFR的Ig结构域1至3中的一个或多个的片段或衍生物的用途(PDGFR的Ig结构域1至3的一个或多个和PDGFR的Ig结构域1至3的一个或多个的任何片段或衍生物的任何组合)。
如所附的实施例中显示,包含PDGFR的Ig结构域1至3的蛋白质确实能够结合PDGF。
在优选的方面,PDGFR的结构域包含或组成为PDGFR的Ig结构域1至3,特别优选人PDGFRα的Ig结构域1至3。
本文涵盖动物PDGFR(即动物来源)的使用,例如PDGFR的细胞外结构域和/或PDGFR的Ig结构域1至5的一个或多个),例如哺乳动物PDGFR,例如大鼠,小鼠,猪,豚鼠,猴PDGFR等。本文优选的是PDGFR是人PDGFR(即人来源),例如人PDGFR的细胞外结构域和/或人PDGFR的Ig结构域1至5中的一个或多个)。人PDGFR的氨基酸序列和核苷酸序列在现有技术中是公知的,参见例如NCBI Reference Sequence:NP_001334758.1,NP_001334756.1,NP_001334757.1,NP_001341945.1,NP_002600.1。
本文涵盖本文的PDGFR结构域可以由各种PDGFR蛋白(或PDGFR同种型)的部分/片段组成,例如,不同来源的PDGFR蛋白(和/或PDGFR同种型)的部分/片段,例如不同的动物来源/或人来源。例如,本文的PDGFR结构域可以由人源的PDGFR蛋白(包括各种PDGFR同种型)的部分/片段和动物来源的PDGFR蛋白(包括各种PDGFR同种型)的部分/片段(例如大鼠,小鼠,猪,豚鼠或猴PDGFR蛋白(包括各种PDGFR同种型)的)组成。本文涵盖,本文的PDGFR结构域可以由各种PDGFR同种型(例如人和/或动物来源的各种PDGFR同种型)的部分/片段组成。例如,本文的PDGFR结构域可以由各种人PDGFR同种型(例如人来源的各种PDGFR同种型)的部分,例如人PDGFRα和/或人PDGFRβ的部分组成。
例如,PDGFR的结构域可以包含或例如由不同动物来源的和/或人源的例如PDGFR的Ig结构域的一个或多个组成。例如,PDGFR的结构域可以包含或组成为动物来源的PDGFR的Ig结构域1和/或2和人来源的PDGFR的Ig结构域3(或反之亦然)。例如,PDGFR的结构域可以包含各种(人)PDGFR同种型,例如人PDGFRα和/或人PDGFRβ的Ig结构域1至5的一个或多个。例如,PDGFR的结构域可以包含或组成为人PDGFRα的Ig结构域1和/或2和人PDGFRβ的Ig结构域3(或反之亦然)。例如PDGFR的结构域可以包含或组成为人PDGFRα的Ig结构域1和人PDGFRβ的Ig结构域2和/或3(或反之亦然)。
例如,本文所涉及的蛋白质,其包括例如包含不同来源(例如不同的动物来源和/或人来源)的PDGFR结构域的蛋白质。例如,涵盖组合物,其包括例如包含人来源的PDGFR结构域的蛋白质和包含动物来源的PDGFR结构域,例如,大鼠,小鼠,猪,豚鼠或猴PDGFR的蛋白质。例如,涵盖组合物,其包括例如包含各种PDGFR同种型(例如各种人PDGFR同种型)的PDGFR结构域的蛋白质,如组合物,其包括例如包含人PDGFRα的PDGFR结构域的蛋白质和包含人PDGFRβ的VEGFR结构域的蛋白质。
在本文优选的方面,PDGFR是人PDGFRα。
PDGFR的结构域可以包含或组成为:
(a)具有如SEQ ID No.4或SEQ ID No.20中显示的氨基酸序列的蛋白;
(b)如(a)中定义的蛋白质,其中缺失、插入、添加或取代了1至10个氨基酸;
(c)由具有如SEQ ID No.3或SEQ ID No.19中显示的核苷酸序列的核酸分子编码的多肽;
(d)具有由核酸编码的氨基酸序列的多肽,所述核酸在严格条件下与如(c)中定义的核酸分子的互补链杂交;
(e)与(a)至(d)中任一项的多肽具有至少70%同一性的多肽;和
(f)具有由核酸编码的氨基酸序列的多肽,所述核酸由于遗传密码而与如(c)或(d)中定义的核酸的核苷酸序列是简并的。
具有如SEQ ID No.4中显示的氨基酸序列的蛋白质对应人PDGFRα的Ig结构域1至3。编码此类蛋白质的相应核酸序列显示于SEQ ID No.3中。
具有如SEQ ID No.20中显示的氨基酸序列的蛋白质对应人PDGFRα的Ig结构域1至3。编码此类蛋白质的相应核酸序列显示于SEQ ID No.19中。
在优选的实施方案中,PDGFR的结构域包含或组成为:
(a)具有如SEQ ID No.4或SEQ ID No.20中显示的氨基酸序列的蛋白;或(c)由具有如SEQ ID No.3或SEQ ID No.19中显示的核苷酸序列的核酸分子编码的多肽。
特别地如果PDGFR是人PDGFRα(或如果PDGFR结构域是人PDGFRα的PDGFR结构域),且如果PDGFR结构域能够结合血小板衍生生长因子(PDGF),则所述PDGF可以是PDGF同二聚体,例如PDGFA同二聚体,PDGFB同二聚体,或PDGFC同二聚体。
特别地如果PDGFR是人PDGFRα(或如果PDGFR结构域是人PDGFRα的PDGFR结构域),且如果PDGFR结构域能够结合血小板衍生生长因子(PDGF),所述PDGF可以是PDGF异二聚体,例如PDGF-AB的异二聚体。
本文涵盖的PDGFR可以是人PDGFRβ(或PDGFR结构域可以是人PDGFRβ的PDGFR结构域)。
PDGFR的结构域可以包含或组成为
(a)具有如SEQ ID No.6中显示的氨基酸序列的蛋白;
(b)如(a)中定义的蛋白质,其中缺失、插入、添加或取代了1至10个氨基酸;
(c)由具有如SEQ ID No.5中显示的核苷酸序列的核酸分子编码的多肽;
(d)具有由核酸编码的氨基酸序列的多肽,所述核酸在严格条件下与如(c)中定义的核酸分子的互补链杂交;
(e)与(a)至(d)中任一项的多肽具有至少70%同一性的多肽;和
(f)具有由核酸编码的氨基酸序列的多肽,所述核酸由于遗传密码而与如(c)或(d)中定义的核酸的核苷酸序列是简并的。
具有如SEQ ID No.6中显示的氨基酸序列的蛋白质对应人PDGFRβ的Ig结构域1至3。编码该蛋白质的相应核酸序列显示于SEQ ID No.5中。
在优选的方面,PDGFR的结构域包含或组成为:
(a)具有如SEQ ID No.6中显示的氨基酸序列的蛋白;或
(c)由具有如SEQ ID No.5中显示的核苷酸序列的核酸分子编码的多肽。
特别地如果PDGFR是人PDGFRβ(或如果PDGFR结构域是人PDGFRβ的PDGFR结构域),且如果PDGFR的结构域能够结合血小板衍生生长因子(PDGF),则所述PDGF可以是PDGF同二聚体,例如PDGFBB同二聚体。
本文涵盖动物PDGF(即动物来源),例如哺乳动物PDGF,例如大鼠、小鼠、猪、豚鼠、猴PDGF等的用途。本文优选的是PDGF是人PDGF(即人起源)。此外,PDGF(例如人PDGF)的氨基酸序列和核苷酸序列是本领域公知的,见例如NCBI Reference Sequences NP_002598.4,NP_148983.1,NP_002599,NP_148937or NP_057289.1。
本文提供的蛋白质包含VEGFR的结构域。
通常VEGF结合其受体VEGFR的细胞外结构域。
本文优选的是VEGFR的结构域包含或由VEGFR的细胞外结构域组成。VEGFR的细胞外结构域含有7个Ig样结构域。术语“Ig样结构域”和“Ig结构域”在本文中可互换使用。认为优先对Ig结构域2和3发生配体结合。
根据上文,VEGFR的结构域可以包含或组成为VEGFR的Ig结构域1至7中的一个或多个,即VEGFR的Ig结构域1,VEGFR的Ig结构域2,VEGFR的Ig结构域3,VEGFR的Ig结构域4,VEGFR的Ig结构域5,VEGFR的Ig结构域6和VEGFR的Ig结构域7的一个或多个。在本文中包括其任何组合,以及VEGFR的Ig结构域1至7的一个或多个的片段或衍生物的用途(和VEGFR的Ig结构域1至7的一个或多个以及VEGFR的Ig结构域1至7的一个或多个的任何片段或衍生物的任何组合)。
本文使用的VEGFR的结构域可以例如包含或组成为VEGFR的Ig结构域2和/或3,即VEGFR的Ig结构域2和/或Ig结构域3。在本文中包括其任何组合,以及VEGFR的Ig结构域2和/或Ig结构域3的片段或衍生物的用途(和VEGFR的Ig结构域2和/或Ig结构域3以及VEGFR的Ig结构域2和/或Ig结构域3的任何片段或衍生物的任何组合)。
如所附实施例所示,包含VEGFR的Ig结构域2和3的蛋白质确实能够结合VEGF。
在优选的方面,VEGFR的结构域包含或组成为VEGFR的Ig结构域2和3。
本文涵盖动物VEGFR(即动物来源)的使用,例如VEGFR的细胞外结构域和/或VEGFR的Ig结构域1至7中的一个或多个,例如哺乳动物VEGFR,例如大鼠,小鼠,猪,豚鼠或猴VEGFR等。本文优选的是VEGFR是人VEGFR(即人来源),例如人VEGFR的细胞外结构域和/或人VEGFR的Ig结构域1至7中的一个或多个。人VEGFR的氨基酸序列和核苷酸序列是现有技术中公知的,参见例如NCBI Reference Sequences:NP_002010.2,NP_001153392.1,NP_001153502.1,NP_001153503.1or NP_002244.1。
本文优选的是VEGFR是人VEGFR-1和/或人VEGFR-2。
本文涵盖,本文的VEGFR结构域可以由各种VEGFR蛋白(或VEGFR同种型)的部分/片段组成,例如不同来源(例如不同动物来源和/或人源)的VEGFR蛋白(和/或VEGFR同种型)的部分/片段。例如,本文的VEGFR结构域可以由人来源的VEGFR蛋白(包括各种VEGFR同种型)的部分/片段和动物来源的VEGFR蛋白(包括各种VEGFR同种型)例如大鼠,小鼠,猪,豚鼠或猴VEGFR蛋白(VEGFR同种型)的部分/片段组成。本文还涵盖,本文的VEGFR结构域可以由各种VEGFR同种型(例如人和/或动物来源的各种VEGFR同种型)的部分/片段组成。例如,本文的VEGFR结构域可以由各种人VEGFR同种型(例如人来源的各种VEGFR同种型)的部分/片段组成,例如,人VEGFR-1或人VEGFR-2的部分/片段。
例如,VEGFR的结构域可以包括或组成为例如不同动物来源和/或人来源的例如VEGFR的Ig结构域1至7的一个或多个。例如,VEGFR的结构域可以包含或组成为动物来源的VEGFR的Ig结构域和人来源的VEGFR的Ig结构域3(或反之亦然)。例如VEGFR的结构域可以包含或组成为各种(人)VEGFR同种型(例如人VEGFR-1和/或人VEGFR-2)的Ig结构域1至7、1至5、1至4、1至3、1至2或2至3中的一个或多个。例如,VEGFR的结构域可以包含或组成为人VEGFR-1的Ig结构域1和/或2和人VEGFR-2的Ig结构域3(或反之亦然)。例如,VEGFR的结构域可以包含或组成为人VEGFR-1的Ig结构域1和人VEGFR-2的Ig结构域2和/或3(或反之亦然)。
在优选的方面,VEGFR的结构域包含或组成为VEGFR-1的Ig结构域2和VEGFR-2的Ig结构域3。在特别优选的方面,VEGFR的结构域包含或组成为人VEGFR-1的Ig结构域2和人VEGFR-2的Ig结构域3。
例如,本文涵盖组合物,其包括例如包含不同来源的VEGFR结构域的蛋白质,例如不同的动物来源和/或人来源。例如,涵盖组合物,其包括例如包含人来源VEGFR的结构域的蛋白质和包含动物来源的VEGFR结构域(例如大鼠,小鼠,猪,豚鼠或猴VEGFR)的蛋白质。例如,涵盖组合物成,其包括例如包含各种VEGFR同种型(例如各种人VEGFR同种型)的VEGFR的结构域的蛋白质,如组合物,该组合物包含例如包含人VEGFR-1的VEGFR结构域的蛋白质和包含人VEGFR-2的VEGFR结构域的蛋白质。
VEGFR的结构域可以包含或组成为:
(a)具有如SEQ ID No.8中显示的氨基酸序列的蛋白;
(b)如(a)中定义的蛋白质,其中缺失、插入、添加或取代了1至10个氨基酸;
(c)由具有如SEQ ID No.7中显示的核苷酸序列的核酸分子编码的多肽;
(d)具有由核酸编码的氨基酸序列的多肽,所述核酸在严格条件下与如(c)中定义的核酸分子的互补链杂交;
(e)与(a)至(d)中任一项的多肽具有至少70%同一性的多肽;和
(f)具有由核酸编码的氨基酸序列的多肽,所述核酸由于遗传密码而与如(c)或(d)中定义的核酸的核苷酸序列是简并的。
具有如SEQ ID No.8中显示的氨基酸序列的蛋白质对应人VEGFR-1的Ig结构域2和人VEGFR-2的Ig结构域3。编码该蛋白质的相应核酸分子显示于SEQ ID No.7中。
在优选的实施方案中,VEGFR的结构域包含或组成为:
(a)具有如SEQ ID No.8中显示的氨基酸序列的蛋白;或
(c)由具有如SEQ ID No.7中显示的核苷酸序列的核酸分子编码的多肽。
如提到的,优选地,VEGFR的结构域能够结合血管内皮生长因子(VEGF)。
特别地如果VEGFR是人VEGFR(或如果VEGFR结构域是人VEGFR的VEGFR结构域),且如果VEGFR的结构域能够结合VEGF,则所述VEGF可以是VEGF二聚体,特别是VEGF同二聚体,且优选VEGFA同二聚体。
本文涵盖动物VEGF(即动物来源)的用途,例如哺乳动物VEGF,例如大鼠、小鼠、猪、豚鼠、猴VEGF等。本文优选的是VEGF是人VEGF(即人来源)。此外,VEGF(例如人VEGF)的氨基酸序列和核苷酸序列是本领域公知的,见例如NCBI Reference Sequences:NP_001020537.2,NP_001020538.2,NP_001020539.2,NP_001020540.2,NP_001020541.2,NP_001028928.1,NP_001165093.1,NP_001165094.1,NP_001165095.1,NP_001165096.1,NP_001165097.1,NP_001165098.1,NP_001165099.1,NP_001165100.1,NP_001165101.1,NP_001191313.1,NP_001191314.1,NP_001273973.1,NP_001303939.1or NP_003367.4.
PDGFR的结构域和VEGFR结构域可以通过接头如肽或多肽接头附接。本文使用的接头主要用于向VEGFR和PDGFR结构域提供高柔性的目的,使得每个结构域(诱饵受体的每个臂)能够结合(二聚体)配体(分别为VEGF和PDGF)。因此,可以在配体的存在下形成蛋白二聚体,即可以形成功能性诱饵二聚体。接头优选为柔性接头。肽或多肽接头可以由柔性残基,如甘氨酸和/或丝氨酸组成。
接头可具有由约50至约3000个氨基酸残基组成的氨基酸序列,例如约100,200,300,400,500,600,700,800,900,1000,1100,1200,1300,1400,1500,1600,1700,1800,1900,2000,2100,2200,2300,2400,2500,2600,2700,2800,2900或3000个氨基酸残基。在优选的方面,接头具有由200个氨基酸残基组成的氨基酸序列。
在优选的方面,所述PDGFR的结构域和所述VEGFR的结构域通过由脯氨酸,丙氨酸和丝氨酸组成的接头附接。在这方面,脯氨酸残基可占所述接头多于4%且少于40%。
优选的,接头具有如下氨基酸序列:(ASPAAPAPASPAAPAPSAPA)n,其中n为10-100的整数;进一步优选n为10-60;更优选n为10-40;进一步优选n为10-30;进一步优选n为10、20或30。
特别优选,接头可以具有如SEQ ID No.2中显示的氨基酸序列,或者所述接头可以是由具有如SEQ ID No.1中显示核苷酸序列的核酸分子编码的多肽。接头可以具有由约50至约3000个氨基酸残基组成的氨基酸序列。
PDGFR的结构域和VEGFR的结构域可以通过由脯氨酸和丙氨酸组成的接头附接。在这方面,脯氨酸残基可以占所述接头的多于约10%且少于约75%。优选的,所述接头具有如下氨基酸序列:(AAPAAPAPAAPAAPAAPA)n,其中n为10-100的整数。进一步的,接头可以具有如SEQ ID No.70中显示的氨基酸序列或其中所述接头是由具有如SEQ ID No.69中显示的核苷酸序列的核酸分子编码的多肽。接头可具有由约50至约3000个氨基酸残基组成的氨基酸序列。
在优选的方面,本文提供蛋白质,其中所述蛋白质包含
(a)具有如SEQ ID No.16、SEQ ID No.46、SEQ ID No.48、SEQ ID No.50、SEQ IDNo.52、SEQ ID No.54、SEQ ID No.56、SEQ ID No.58、SEQ ID No.60、SEQ ID No.62、SEQ IDNo.64、SEQ ID No.66或者SEQ ID No.68中显示的氨基酸序列的蛋白;
(b)如(a)中定义的蛋白质,其中缺失、插入、添加或取代了1至10个氨基酸;
(c)由具有如SEQ ID No.15、SEQ ID No.45、SEQ ID No.47、SEQ ID No.49、SEQ IDNo.51、SEQ ID No.53、SEQ ID No.55、SEQ ID No.57、SEQ ID No.59、SEQ ID No.61、SEQ IDNo.63、SEQ ID No.65或者SEQ ID No.67中显示的核苷酸序列的核酸分子编码的多肽;
(d)具有由核酸编码的氨基酸序列的多肽,所述核酸在严格条件下与如(c)中定义的核酸分子的互补链杂交;
(e)与(a)至(d)中任一项的多肽具有至少70%同一性的多肽;和
(f)具有由核酸编码的氨基酸序列的多肽,所述核酸由于遗传密码而与如(c)或(d)中定义的核酸的核苷酸序列是简并的。
在本申请中,优选的蛋白质是EPS1104P、EPS1107P、EPS1108P、EPS1115P。它们的序列和结构如下表所示:
以下进一步定义由脯氨酸、丙氨酸和丝氨酸组成的接头/由脯氨酸和丙氨酸组成的接头。本文考虑该接头形成无规卷曲。
如本文所使用的,术语“无规卷曲”指多聚分子的任何构象,包括氨基酸多聚体,特别是由L-氨基酸制成的多肽,其中形成所述聚合结构的单个单体元件基本上随机地朝着一个或多个相邻的单体元件定向,同时仍然是化学连接的。特别地,采用/具有/形成“无规卷曲构象”的编码多肽或氨基酸聚合物实质上缺乏确定的二级结构和三级结构。编码的多肽无规卷曲的性质及其实验鉴定方法是本领域技术人员已知的,并已描述于科学文献(Cantor(1980)Biophysical Chemistry,第2版,WH Freeman and Company,New York;Creighton(1993)Proteins-Structures and Molecular Properties,第2版,WH Freemanand Company,New York;Smith(1996)Fold.Dat.1:R95-R106)和专利文献例如WO2011/144756和WO2008/155134。
如本文提供的蛋白质中包含的接头可采用/形成无规卷曲构象,例如在水性溶液中和/或在生理条件下。术语“生理条件”是本领域已知的,并且指蛋白通常采用其天然的折叠构象的条件。更具体地,术语“生理条件”指环境生物物理参数,因为它们通常对于较高形式的生命有效,特别是对于哺乳动物,最优选是人类。术语“生理条件”可以指生物化学和生物物理学参数,因为它们通常在哺乳动物,特别是人的体内,特别是在体液中发现。所述“生理条件”可以指在健康身体中发现的相应参数以及在疾病状况下或在人类患者中发现的参数。例如,当所述哺乳动物或所述人患有发烧时,患病的哺乳动物或人类患者可能具有较高的但“生理的”体温(即,温度条件)。关于蛋白质采用其天然构象/状态的“生理条件”,最重要的参数是温度(对于健康人体为37℃),pH(对于人血液为7.35-7.45),渗量(osmolarity)(280-300mmol/kg H2O),和如果必要的话,一般血清蛋白质含量(66-85g/l)。
然而,本领域技术人员知道,在生理条件下,这些参数可以变化,例如,给定的身体或组织液体如血液,脑脊髓液,腹膜液和淋巴液中的温度,pH,渗量和蛋白质含量可能不同(Klinke(2005)Physiologie,第4版,Georg Thieme Verlag,Stuttgart)。例如,在脑脊液中,渗量可以是约290mmol/kg H2O,而蛋白质浓度可以在0.15g/l和0.45g/l之间,而在淋巴中,pH可能在7.4左右,并且蛋白质含量可能在3g/l和5g/l之间。当在实验条件下确定多肽接头是否形成/采用无规卷曲构象时,生物物理参数如温度,pH,渗量和蛋白质含量可能与通常在体内发现的生理条件不同。在体外生理条件下,1℃至42℃之间或优选4℃至25℃的温度可被认为有用于测试和/或验证多肽接头(如包括在本文提供的蛋白中)的生物物理性质和生物学活性。
认为几种缓冲液(对于药物组合物可以包括溶剂和/或赋形剂)在体外,特别是在实验室设置中,例如在CD测量或其它方法的背景下代表“生理溶液”/“生理条件”,所述方法允许本领域技术人员确定蛋白质/氨基酸序列的结构特性。此类缓冲液的例子为,例如磷酸盐缓冲盐水(PBS,例如:115mM NaCl,4mM KH2PO4,16mM Na2HPO4 pH7.4),Tris缓冲液,乙酸盐缓冲液,柠檬酸盐缓冲液或类似缓冲液。通常,代表“生理溶液条件”的缓冲液的pH应在6.5至8.5的范围内,优选在7.0至8.0的范围内,最优选在7.2至7.7的范围内,且渗量应在10至1000mmol/kg H2O的范围内,更优选在50至500mmol/kg H2O的范围内,最优选在200至350mmol/kg H2O的范围内。任选地,生理溶液的蛋白质含量可以在0至100g/l的范围内,忽略采用无规卷曲构象的所研究的蛋白质本身;此外,可存在典型的稳定蛋白质,例如人或牛血清白蛋白。
本文提供的多肽接头不仅在生理条件下形成无规卷曲构象,更通常在水溶液中形成;例如,参见WO2011/144756。术语“水性溶液”是本领域公知的。“水性溶液”可以是水(H2O)含量为至少约20%,至少约30%,至少约40%,至少约50%,至少约60%,至少约70%,至少约80%或至少约90%H2O(重量/重量)的溶液。因此,本发明中提供的编码的多肽可以在可能含有其它可混溶的溶剂的水性溶液中,或者在具有较宽的温度、pH值、渗量或蛋白质含量范围的水性分散体中形成无规卷曲构象。
本文涵盖多肽接头的无规卷曲构象在药物组合物如液体药物/生物制剂或冻干药物组合物中保持。优选地,“生理条件”用于相应的缓冲系统,溶剂和/或赋形剂中。然而,例如,在冻干或干燥的组合物(如例如药物组合物)中,涵盖本文提供的无规卷曲多肽接头的无规卷曲构象可能暂时不存在和/或不能检出。然而,在相应的缓冲液/溶液/赋形剂/溶剂中重构后或在施用至患者或动物的身体后,所述无规卷曲多肽/接头将再次采用/形成其无规卷曲。
在本发明的某些方面,接头由脯氨酸,丙氨酸和任选地丝氨酸组成,其中不超过9个连续的氨基酸残基是相同的。采用无规卷曲构象的接头可以包含多个氨基酸重复,其中所述“氨基酸重复”主要或仅由脯氨酸,丙氨酸和任选地丝氨酸氨基酸残基组成,其中不超过9个连续的氨基酸残基是相同的。采用无规卷曲构象的接头可以包含多个氨基酸重复,其中所述“氨基酸重复”主要或仅由脯氨酸,丙氨酸和丝氨酸氨基酸残基组成,其中不超过9个连续的氨基酸残基是相同的。采用无规卷曲构象的接头可以包含多个氨基酸重复序列,其中所述“氨基酸重复”主要或仅由脯氨酸和丙氨酸氨基酸残基组成,其中不超过9个连续的氨基酸残基是相同的。
在某些方面,接头包含多个氨基酸重复序列,其中不超过8个连续的氨基酸残基是相同的,并且其中所述接头形成无规卷曲,其中不超过7个连续氨基酸残基是相同的,并且其中所述连接体形成无规卷曲,或其中不超过6个连续的氨基酸残基是相同的,并且其中所述接头形成无规卷曲。特别优选地,接头包含多个氨基酸重复序列,其中不超过5个连续的氨基酸残基是相同的,并且其中所述接头形成无规卷曲。更特别优选地,接头包含多个氨基酸重复序列,其中不超过4个连续的氨基酸残基是相同的,并且其中所述接头形成无规卷曲。最优选地,接头包含多个氨基酸重复序列,其中不超过3个连续的氨基酸残基是相同的,并且其中所述接头形成无规卷曲。
本文以下提供了仅由脯氨酸,丙氨酸和丝氨酸残基组成的氨基酸重复的非限制性实例:(SEQ ID No.2)。
接头可以主要或仅由三种氨基酸残基脯氨酸(Pronine,Pro,P),丙氨酸(Alanine,Ala,A)和任选地丝氨酸(Serine,Ser,S)组成。如本文所用的,术语“任选地”是指接头主要或仅由脯氨酸,丙氨酸和丝氨酸组成,或者主要或仅由脯氨酸和丙氨酸组成。主要或仅由三种氨基酸残基脯氨酸,丙氨酸和丝氨酸组成的接头在本文中称为“PAS”接头。主要或仅由两种氨基酸残基脯氨酸和丙氨酸组成的接头在本文中称为“PA”接头。SEQ ID No.2中给出了由脯氨酸,丙氨酸和丝氨酸组成的接头的非限制性实例。如本文所用的,术语“主要”是指优选至少约90%或至少约95%的编码的氨基酸是脯氨酸,丙氨酸和任选地丝氨酸,由此脯氨酸,丙氨酸和丝氨酸总计构成多数,但可能不是仅有的氨基酸残基;因此,接头的氨基酸序列不一定是100%脯氨酸,丙氨酸和任选地丝氨酸。因此,接头也可以包含除脯氨酸、丙氨酸和任选地丝氨酸外的其它氨基酸作为次要成分,只要该接头形成/采用/具有无规卷曲构象。可以通过本文描述的手段和方法容易确定这种无规卷曲构象。相应地,优先形成无规卷曲的接头可以主要由脯氨酸,丙氨酸和任选地丝氨酸组成。
在接头由脯氨酸和丙氨酸组成的情况下,所述脯氨酸残基占所述接头的多于约10%且少于约75%。因而,接头可主要由脯氨酸和丙氨酸组成,其中脯氨酸残基占氨基酸序列的多于约10%且少于75%。丙氨酸残基占氨基酸序列的剩余的至少25%至90%。
优选地,接头的氨基酸序列(接头)包含多于约10%,优选多于约12%,更优选多于约14%,18%,20%,更优选多于约22%,23%,24%或25%,更优选多于约27%,29%或30%,更优选多于约32%,33%或34%,最优选多于约35%的脯氨酸残基。接头的氨基酸序列(接头)优选包含少于约75%,更优选少于70%,更优选少于65%,更优选少于60%,更优选少于55%,更优选少于50%的脯氨酸残基,其中较低的值是优选的。甚至更优选地,接头的氨基酸序列(接头)包含少于约48%,46%,44%,42%的脯氨酸残基。更优选的是下述接头的氨基酸序列(接头),其包含少于约41%,40%,39%,38%,37%或36%的脯氨酸残基,其中优选较低的值。更优选的是下述接头的氨基酸序列(接头),其包含少于约34%,32%或30%。更优选的是接头的氨基酸序列(接头),其包含少于约28%,26%或25%。最优选地,接头的氨基酸序列(接头)包含少于约35%的脯氨酸残基。
反之亦然,接头的氨基酸序列(接头)优选包含小于约90%,更优选少于88%,86%,84%,82%或80%的丙氨酸残基,其中较低的值是优选的。更优选地,接头的氨基酸序列(接头)包含少于约79%,78%,77%,76%的丙氨酸残基,其中优选较低的值。更优选地,接头的氨基酸序列(接头)包含少于约74%,72%或70%的丙氨酸残基,其中优选较低的值。更优选地,接头的氨基酸序列(接头)包含少于约69%,67%或65%的丙氨酸残基,其中优选较低的值。最优选地,接头的氨基酸序列(接头)包含少于约75%的丙氨酸残基。本文还优选的是下述接头的氨基酸序列(接头),其包含多于约25%,优选多于约30%,更优选多于约35%,更优选多于约40%,更优选多于约45%,更优选多于约50%,更优选大于约52%,54%,56%,58%或59%的丙氨酸残基,其中较高的值是优选的。甚至更优选地,接头的氨基酸序列(接头)包含多于约60%,61%,62%,63%或64%的丙氨酸残基。更优选地,接头的氨基酸序列(接头)包含多于约66%,67%,69%或70%的丙氨酸残基。更优选地,接头的氨基酸序列(接头)包含多于约72%,74%或75%的丙氨酸残基。最优选地,接头的氨基酸序列(接头)包含多于约65%的丙氨酸残基。
因而,接头可以包含分别由约25%或30%的脯氨酸残基和约75%或70%的丙氨酸残基组成的氨基酸序列。或者,接头可以包含由约35%的脯氨酸残基和约65%的丙氨酸残基组成的氨基酸序列。如上文使用的,术语“约X%”不限于百分比的精确数目,而是包括多10%至20%或少10%至20%的残基的数值。例如,术语10%也可分别指11%或12%和9%或8%。
在接头由脯氨酸,丙氨酸和丝氨酸组成的情况下,所述脯氨酸残基可占所述接头的氨基酸序列(接头)的多于约4%且少于约40%。丙氨酸和丝氨酸残基占所述接头的氨基酸序列(接头)的剩余量。
优选地,接头的氨基酸序列(接头)包含多于约4%,优选多于约6%,更优选多于约10%,更优选多于约15%,更优选多于约20%,更优选多于约22%,23%或24%,更优选多于约26%,29%或30%,更优选多于约31%,32%,33%,34%或35%和最优选多于约25%的脯氨酸残基。接头的氨基酸序列(接头)优选包含少于约40%,更优选少于38%,35%,30%,26%的脯氨酸残基,其中较低的值是优选的。
接头的氨基酸序列(接头)优选包含少于约95%,更优选少于90%,86%,84%,82%或80%的丙氨酸残基,其中较低的值是优选的。更优选地,接头的氨基酸序列(接头)包含少于约79%,78%,77%,76%的丙氨酸残基,其中优选较低的值。更优选地,接头的氨基酸序列(接头)包含少于约75%,73%,71%或70%的丙氨酸残基,其中优选较低的值。更优选地,接头的氨基酸序列(接头)包含少于约69%,67%,66%或65%的丙氨酸残基,其中优选较低的值。更优选地,接头的氨基酸序列(接头)包含少于约64%,63%,62%或60%的丙氨酸残基,其中优选较低的值。更优选地,接头的氨基酸序列(接头)包含少于约59%,57%,56%或55%的丙氨酸残基,其中优选较低的值。更优选地,接头的氨基酸序列(接头)包含少于约54%,53%或51%的丙氨酸残基,其中优选较低的值。最优选地,接头的氨基酸序列(接头)包含少于约50%的丙氨酸残基。
本文还优选的是接头的氨基酸序列(接头),其包含多于约10%,优选多于约15%,17%,19%或20%,更优选多于约22%,24%或25%,更优选多于约27%,29%或30%,更优选多于约32%,34%或35%,更优选多于约37%,39%或40%,更优选多于约42%,44%或45%,更优选多于约46%,47%或49%的丙氨酸残基,其中较高的值是优选的。最优选地,氨基酸序列包含多于约50个丙氨酸残基。如上文所述,丝氨酸残基包含所述氨基酸序列的剩余量。因而,接头(接头)可以包含由约35%脯氨酸残基,约50%丙氨酸和15%丝氨酸残基组成的氨基酸序列。如上文使用的,术语“约X%”不限于百分比的精确数目,而是包括多10%至20%或少10%至20%的残基。例如,术语10%也可分别指11%或12%和9%或8%。
然而,如上文所述并在下文进一步详细说明的,接头的氨基酸序列(接头)还可以包含不同于脯氨酸,丙氨酸和任选地丝氨酸的另外的氨基酸作为次要组分。如上文已经讨论的,所述次要成分,即不同于脯氨酸,丙氨酸或任选地丝氨酸的氨基酸可以占接头的少于约10%或少于约5%。
技术人员知道,当除脯氨酸,丙氨酸和任选地丝氨酸外的其它残基在所述接头的氨基酸序列(接头)中作为次要成分包含时,接头也可以形成无规卷曲构象。如本文所用的,术语“次要成分”是指接头中最多5%或最多10%的不同于脯氨酸,丙氨酸或丝氨酸的氨基酸残基。这意味着100个氨基酸中最多10个可以不同于脯氨酸,丙氨酸和任选地丝氨酸,优选最多为8%,即100个氨基酸中最多8个可以不同于脯氨酸,丙氨酸和任选地丝氨酸,更优选最多6%,即100个氨基酸中最多6个可以不同于脯氨酸,丙氨酸和任选地丝氨酸,甚至更优选最多5%,即100个氨基酸的最多5个可能不同于脯氨酸,丙氨酸和任选地丝氨酸,特别优选最多4%,即100个氨基酸的最多4个可以不同于脯氨酸,丙氨酸和任选地丝氨酸,更特别优选最多3%,即100个氨基酸中最多3个可能不同于脯氨酸,丙氨酸和任选地丝氨酸,甚至更特别优选最多2%,即100个氨基酸的最多2个可以不同于脯氨酸,丙氨酸和任选地丝氨酸,最优选最多1%,即包含在无规卷曲多肽中的100个氨基酸的最多1个可以不同于脯氨酸,丙氨酸和任选地丝氨酸。所述不同于脯氨酸,丙氨酸和任选地丝氨酸的氨基酸可以选自下组:Arg,Asn,Asp,Cys,Gln,Glu,Gly,His,Ile,Leu,Lys,Met,Phe,Thr,Trp,Tyr和Val,包括翻译后修饰的氨基酸或非天然氨基酸(参见例如Budisa(2004)Angew Chem Int Ed Engl43:6426-6463;Young(2010)J Biol Chem 285:11039-11044;Liu(2010)Annu Rev Biochem79:413-444;Wagner(1983)AngewChem Int Ed Engl 22:816-828;Walsh(2010)DrugDiscov Today 15:773-780。在某些情况下,富含PA的序列还可以包含Ser作为次要成分。例如,在接头由脯氨酸和丙氨酸组成的情况下,也可以认为丝氨酸是次要成分。
通常,本文优选的是这些“次要”氨基酸(除脯氨酸,丙氨酸和任选地丝氨酸之外)不存在于如本文所述的接头中。根据上文,接头的氨基酸序列(接头)具体可以仅由脯氨酸,丙氨酸和任选地丝氨酸残基组成(即在接头的氨基酸序列(接头)中不存在其它氨基酸残基)。
本文提供的蛋白可以包含N末端信号肽序列,例如PDGFR,特别是人PDGFRα的N末端信号肽序列。N末端信号肽序列可以具有如SEQ ID No.10所示的氨基酸序列,或者所述N末端信号肽序列可以是由具有如SEQ ID No.9所示核苷酸序列的核酸分子编码的多肽。
蛋白质可以进一步包含标签,例如纯化标签,如His标签。本文也可以使用其他已建立的标签,如HA标签,Flag标签,c-myc标签,V5标签或C9标签。可以代替His标签,或者除His标签外使用这些标签。标签可用于纯化和检测本文提供的蛋白。通过使用特异性结合标签的抗体(例如通过ELISA测定,如化学发光ELISA(CLIA)和AlphaLISA),例如可以可靠和快速地评估蛋白质的水平和/或促进纯化。
纯化标签可以具有溶液SEQ ID No:12所示的氨基酸序列,或者它可以是由具有如SEQ ID No:11所示核苷酸序列的核酸分子编码的多肽。
主要地,术语“标签”是指“蛋白标签”。术语“标签”和“蛋白标签”是本领域已知的;特别参见Fritze CE,Anderson TR.“Epitope tagging:general method for trackingrecombinant proteins”。Methods Enzymol.2000;327:3-16;Brizzard B,ChubetR.Epitope tagging of recombinant proteins。Curr Protoc Neurosci.2001May;Chapter 5:Unit 5.8;和/或Terpe K.Overview of tag protein fusions:frommolecular and biochemical fundamentals to commercial systems.Appl MicrobiolBiotechnol.2003Jan;60(5):523-33。
通常,本文使用的标签是与蛋白融合的蛋白标签。例如,编码标签的核酸可以与编码包含PDGFR结构域和VEGFR结构域的蛋白质的核酸融合,从而表达包含标签和PDGFR结构域和VEGFR结构域两者的融合蛋白。标签可以融合到编码PDGFR结构域和VEGFR结构域的核酸的5'-末端,插入到核酸内和/或融合到编码PDGFR结构域和VEGFR结构域的核酸的3'-末端。因此,所得融合蛋白可包含在N末端,内部(即PDGFR的结构域和VEGFR的结构域内)和/或C末端的标签。
各种标签在本领域中是已知的,并且可以依照本发明使用。通常,本文使用的标签具有约1-3kDa的低分子量,优选约1kDa。示例性的非限制性低分子量标签是HA标签,His标签,Flag标签,c-myc标签,V5-标签或C9-标签。本文使用的Flag标签可以是1xFlag标签或3xFlag标签。标签的长度中反映了低分子量,即组成标签的氨基酸残基的数量。例如,本文可以使用His标签(6个氨基酸),HA标签(9个氨基酸),FLAG标签(8个氨基酸)或3xFLAG标签(22个氨基酸)。
结构域可以以从N末端到C末端的任何顺序排列。优选地,蛋白质从N末端至C末端以如下顺序排列:
(任选的信号肽序列)-PDGFR的一个或多个结构域-(任选的接头)-VEGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-VEGFR的一个或多个结构域-(任选的接头)-PDGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-(任选的接头)-VEGFR的一个或多个结构域-PDGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-(任选的接头)-PDGFR的一个或多个结构域-VEGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-(任选的接头)-PDGFR的一个或多个结构域-(任选的接头)-VEGFR的一个或多个结构域-(任选的接头)-(任选的纯化标签)。
进一步优选,蛋白质从N末端至C末端以如下顺序排列:
(任选的信号肽序列)-PDGFR的一个或多个结构域-PAS/PA-VEGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-VEGFR的一个或多个结构域-PAS/PA-PDGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-PAS/PA-VEGFR的一个或多个结构域-PDGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-PAS/PA-PDGFR的一个或多个结构域-VEGFR的一个或多个结构域-(任选的纯化标签);
(任选的信号肽序列)-PAS/PA-PDGFR的一个或多个结构域-PAS/PA-VEGFR的一个或多个结构域-PAS/PA-(任选的纯化标签)。
再进一步优选,蛋白质从N末端至C末端以如下顺序排列:
(任选的信号肽序列)-PDGFR的一个或多个结构域-(GGGGS)n-PAS/PA-(GGGGS)n-VEGFR的一个或多个结构域-(任选的纯化标签),其中,n=0-5,例如n=1、2、3、4、5,优选n=3;
(任选的信号肽序列)-VEGFR的一个或多个结构域-(GGGGS)n-PAS/PA(GGGGS)n-PDGFR的一个或多个结构域-(任选的纯化标签);
其中,n=0-5,例如n=1、2、3、4、5,优选n=3。
在优选的实施方案中,本文提供蛋白质,其中所述蛋白质包含
(a)具有如SEQ ID No.14、SEQ ID No.22、SEQ ID No.24、SEQ ID No.26、SEQ IDNo.28、SEQ ID No.30、SEQ ID No.32、SEQ ID No.34、SEQ ID No.36、SEQ ID No.38、SEQ IDNo.40、SEQ ID No.42或者SEQ ID No.44中显示的氨基酸序列的蛋白;
(b)如(a)中定义的蛋白质,其中缺失、插入、添加或取代了1至10个氨基酸;
(c)由具有如SEQ ID No.13、SEQ ID No.21、SEQ ID No.23、SEQ ID No.25、SEQ IDNo.27、SEQ ID No.29、SEQ ID No.31、SEQ ID No.33、SEQ ID No.35、SEQ ID No.37、SEQ IDNo.39、SEQ ID No.41或SEQ ID No.43中显示的核苷酸序列的核酸分子编码的多肽;
(d)具有由核酸编码的氨基酸序列的多肽,所述核酸在严格条件下与如(c)中定义的核酸分子的互补链杂交;
(e)与(a)至(d)中任一项的多肽具有至少70%同一性的多肽;和
(f)具有由核酸编码的氨基酸序列的多肽,所述核酸由于遗传密码而与如(c)或(d)中定义的核酸的核苷酸序列是简并的。
以下涉及根据本发明使用的蛋白质(或其功能片段或衍生物)。
术语“蛋白质”和“核酸序列/分子”的含义是本领域公知的,并且在本发明的上下文中相应使用。
例如,如本文所用的,术语“蛋白质”是指由氨基酸残基的一个或多个链组成的生物分子。术语“多肽”和“氨基酸残基链”可以在本文中互换使用。氨基酸残基的单个直链通常称为多肽。术语蛋白通常是指稳定构象的生物分子(即意味着形成了三维结构)。通常,蛋白质含有多于20-30个氨基酸残基,特别是多于50个氨基酸残基。蛋白质可以含有多达3000个氨基酸残基,例如多达1500个氨基酸残基。然而,本文涵盖了甚至更大的蛋白质。
单个氨基酸残基通过肽键结合在一起。一般来说,遗传密码规定20种标准氨基酸;然而,本文还涵盖非标准氨基酸如硒代半胱氨酸的使用。本文也涵盖了化学修饰,例如翻译后修饰。
短蛋白质也可以通过一系列称为肽合成的方法进行化学合成,其依赖于有机合成技术,如化学连接。
如本文所述,提供了制备本文公开的蛋白质的方法。该方法可以包括培养如本文提供的宿主细胞,并且从培养物或从(宿主)细胞分离所述蛋白质。如本文所述,可以通过表达如本文提供的核酸分子,并且任选地通过分离表达的融合蛋白来制备如本文提供的融合蛋白。
或者,可以通过培养/制备包含编码接头,特别是由脯氨酸,丙氨酸和任选地丝氨酸组成的接头的核苷酸序列的宿主来制备蛋白质。因此,接头可以在宿主中表达和/或任选地分离。然后,可以例如通过肽键或非肽键将由脯氨酸,丙氨酸和任选地丝氨酸组成的接头缀合到PDGFR和/或VEGFR结构域。特别地,PDGFR或VEGFR结构域可以例如在活化剂,如N-(3-二甲基氨基丙基)-N'-乙基碳二亚胺(N-(3-dimethylaminopropyl)-N'-ethylcarbodiimide,EDC)或N-羟基琥珀酰亚胺(N-hydroxysuccinimide(NHS)ester,NHS)酯存在下位点特异性缀合(Hermanson(1996)Bioconjugate Techniques,1st edition,Academic Press,San Diego,CA)到接头的N末端,特别是由脯氨酸,丙氨酸和任选丝氨酸组成的接头。或者,PDGFR或VEGFR结构域可以位点特异性缀合至接头的C末端,特别是由脯氨酸,丙氨酸和任选地丝氨酸组成的接头,例如在活化剂如EDC的存在下或者在以NHS酯活化后。
本文优选的是蛋白质是融合蛋白。
为了制备融合蛋白,编码PDGFR结构域的核苷酸序列可以在与VEGFR结构域相同的阅读框中可操作地连接。如果融合蛋白质包含接头(特别是由脯氨酸,丙氨酸和任选地丝氨酸组成的接头),融合蛋白可以例如制备成编码PDGFR结构域的核苷酸序列以相同的阅读框可操作地连接至编码接头的核苷酸序列,并且编码接头的核苷酸序列以相同的阅读框可操作地连接至编码VEGFR结构域的核苷酸序列。
因此,本文提供的核酸分子可以编码包含PDGFR结构域,由脯氨酸,丙氨酸和任选地丝氨酸组成的接头和VEGFR结构域的融合蛋白/异源药物缀合物。
如本文所使用的,术语“可操作地连接”是指并置(juxtaposition),其中所讨论的组分处于允许它们以其预期方式发挥功能的关系。
编码接头,特别是由脯氨酸,丙氨酸和任选地丝氨酸组成的接头的核苷酸序列可以无缝地缀合至编码PDGFR结构域和/或VEGFR结构域的核苷酸序列,即没有进一步间隔区散布这些序列。间隔区可以在接受携带此类间隔区的融合蛋白的受试者中引起免疫应答。因此,编码接头的核苷酸序列可以无缝地缀合至编码PDGFR结构域和/或VEGFR结构域的核苷酸序列。如本文所用,“无缝”是指编码接头的核苷酸序列直接缀合到编码PDGFR结构域和/或VEGFR结构域的核苷酸序列。因此,不引入编码除脯氨酸,丙氨酸和任选地丝氨酸之外的氨基酸残基的另外的核苷酸。
或者,可以在接头和PDGFR结构域和/或VEGFR结构域之间包含间隔区结构。因此,在本发明的某些方面,将编码氨基酸间隔区的核苷酸序列插入编码接头的核苷酸序列和编码PDGFR结构域和/或VEGFR结构域的核苷酸序列之间。示例性间隔区可以是蛋白酶敏感的切割位点,丝氨酸/甘氨酸-接头,亲和标签如His6标签或Strep-tag II,信号肽,保留肽,靶向肽,如膜移位肽或另外的效应结构域,例如与抗肿瘤毒素相关的用于肿瘤靶向的抗体片段或用于前体药物活化的酶等。包含间隔区的蛋白质可以具有允许所述蛋白质的受控释放的血浆蛋白酶切割位点。可以在无需过度负担的情况下鉴定不同类型或长度的间隔区以获得/保持蛋白质的最佳生物活性。
一个典型的丝氨酸/甘氨酸连接头可以有如下序列,(GGGGS)n,其中,n=0-5,例如n=1、2、3、4、5,优选n=3;当n=0的时候,就没有丝氨酸/甘氨酸连接头。例如,丝氨酸/甘氨酸连接头可以按以下序列排列,
(任选的信号肽序列)-PDGFR的一个或多个结构域-(GGGGS)n-PAS/PA-(GGGGS)n-VEGFR的一个或多个结构域-(任选的纯化标签),其中,n=0-5,例如n=1、2、3、4、5,优选n=3;
或者
(任选的信号肽序列)-VEGFR的一个或多个结构域-(GGGGS)n-PAS/PA(GGGGS)n-PDGFR的一个或多个结构域-(任选的纯化标签);
其中,n=0-5,例如n=1、2、3、4、5,优选n=3。
技术人员可以使用本领域已知的方法来鉴定具有与本文提供的序列一定水平的同一性的核酸序列,例如通过使用杂交测定或通过使用比对,手动地或通过使用计算机程序,如下文结合术语“杂交”和同源性程度定义的那些计算机程序。
核酸序列可以与如SEQ ID No.3,5,7,13或15,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65或67中任一项所示的核酸序列至少70%相同。更优选地,核酸序列与如SEQ ID No.3,5,7,13或15,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65或67任一项中显示的核酸序列至少90%,91%,92%,93%,94%,95%,96%,97%或98%相同,其中较高的值是优选的。最优选地,核酸序列与如SEQ ID No.3,5,7,13或15,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65或67中任一项所示的核酸序列至少99%相同。
用于表征与如本文提供的核酸序列具有一定水平的同一性的核酸的杂交测定法是本领域熟知的;参见例如Sambrook,Russell"Molecular Cloning,A LaboratoryManual",Cold Spring Harbor Laboratory,N.Y.(2001);Ausubel,"Current Protocolsin Molecular Biology",Green Publishing Associates and Wiley Interscience,N.Y.(1989)。如本文所用的,术语“杂交”可以指在严格或非严格条件下的杂交。如果没有进一步规定,则条件优选是非严格的。所述杂交条件可以根据常规方案建立,所述方案记载于例如Sambrook(2001)同上;Ausubel(1989)同上,或Higgins and Hames(编)"Nucleic acidhybridization,a practical approach"IRL Press Oxford,Washington DC,(1985)。条件的设置完全在技术人员的技术范围内,并且可以根据本领域中描述的方案来确定。因此,仅特异性杂交序列的检测通常需要严格的杂交和洗涤条件,如例如0.1 x SSC,0.1%SDS,65℃或2 x SSC,60℃,0.1%SDS的高严格条件。用于同源或不完全互补序列的检测的低严格杂交条件可以例如设置为6 x SSC,1%SDS,65℃。众所周知,探针的长度和待确定的核酸的组成构成杂交条件的进一步参数。本文涵盖,核酸可以是引物或探针,例如在严格条件下与本文的核酸的互补链杂交的核酸提供如上文定义和提供的蛋白质(或如本文定义的其片段)等。引物和探针通常在10-30个核苷酸的范围内。因此,本文提供的是在严格条件下与上文定义和提供的蛋白质的互补链杂交的核酸(如引物或探针),其中所述杂交核酸小于50,49,48,47,46,45,44,43,42,41,40,39,38,37,36,35,34,33,32,31,30,29,28,27,26,25,24,23,22,21或20个核苷酸,并且大于5,6,7,8,9,10,11,12,13,14或15个核苷酸。优选地,核酸具有10至35个核苷酸的长度,更优选15至25个核苷酸,特别优选18至21个,例如18,19,20或21个核苷酸。
根据本发明,在两个或更多个核酸序列的上下文中,术语“同源性”或“百分比同源性”或“相同”或“百分数同一性”或“百分比同一性”或“序列同一性”是指当为了在比较窗内(优选在全长内)或在指定区域内实现最大对应性而比较和比对时,相同的两种或更多种序列或亚序列,或者具有相同的核苷酸的规定百分比(至少70%,75%,80%,85%,最优选至少90%,91%,92%,93%,94%,95%,96%,97%或98%同一性,最优选至少99%同一性),如使用本领域已知的序列比较算法或通过手动比对和目视检查测量。具有例如75%至90%或更高序列同一性的序列可被认为是基本相同的。这样的定义也适用于测试序列的互补物。优选地,所描述的同一性存在于长度为至少约15至25个核苷酸的区域里,更优选在长度为至少约50至100个核苷酸的区域里,且最优选在全长里。本领域技术人员将知晓如何使用算法,如基于CLUSTALW计算机程序的算法(Thompson Nucl.Acids Res.2(1994),4673-4680)or FASTDB(Brutlag Comp.App.Biosci.6(1990),237-245)来确定序列间的百分比同一性,如本领域已知的。
尽管FASTDB算法在其计算中通常不考虑序列中的内部不匹配缺失或添加,即缺口,但是这可以手动校正,以避免%同一性的过度评估(overestimation)。然而,CLUSTALW在其同一性计算中考虑到了序列缺口。本领域技术人员也可用BLAST和BLAST 2.0算法(Altschul,(1997)Nucl.Acids Res.25:3389-3402;Altschul(1993)J.Mol.Evol.36:290-300;Altschul(1990)J.Mol.Biol.215:403-410)。用于核酸序列的BLASTN程序以默认值使用字长(W)为11,期望值(E)为10,M=5,N=4,和两条链的比较。BLOSUM62评分矩阵(Henikoff(1989)PNAS 89:10915)使用比对(B)为50,期望值(E)为10,M=5,N=4,以及两条链的比较。
为了确定核酸序列中的核苷酸残基是否对应于例如SEQ ID No.3,5,7,13,15,19,21,23,25,27,29,31,33,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65或67的核苷酸序列中的特定位置,技术人员可以使用本领域公知的手段和方法,例如比对,手动或通过使用计算机程序,如本文提到的那些。例如,BLAST 2.0,其代表基础局部比对搜索工具(Basic Local Alignment Search Tool BLAST)(Altschul(1997),同上;Altschul(1993),同上;Altschul(1990),同上)可以用于搜索局部搜索比对。如上文所讨论的,BLAST产生核苷酸序列的比对以确定序列相似性。由于比对的局部性质,BLAST在确定精确匹配或识别相似序列方面特别有用。BLAST算法输出的基本单位是高评分区段对(High-scoring SegmentPair,HSP)。HSP由两个任意但相等长度的序列片段组成,所述序列的比对是局部最大的,且比对得分满足或超过用户设置的阈值或截留分数。BLAST方法是在查询序列和数据库序列之间寻找HSP,以评估发现的任何匹配的统计学显著性,并仅报告满足用户选择的显著性阈值的匹配。参数E建立报告数据库序列匹配的统计学上显著的阈值。E被解释为在整个数据库搜索的情况中HSP(或HSP组)的机会发生的预期频率的上限。任何其匹配满足E的数据库序列在程序输出中报告。
使用BLAST的类似计算机技术(Altschul(1997),同上;Altschul(1993),同上;Altschul(1990),同上)用于在核苷酸数据库例如GenBank或EMBL中搜索相同或相关的分子。该分析比基于膜的多重杂交快得多。此外,可以修改计算机搜索的灵敏度以确定是否将任何特定匹配分类为精确或相似。搜索的基础是乘积得分(product score),其定义为:
并且其考虑两个序列之间的相似度和序列匹配的长度两者。例如,在乘积得分为40的情况下,匹配将在1-2%的误差内是精确的;在70,匹配将是精确的。类似的分子通常通过选择显示15到40之间的乘积得分的那些来鉴定,尽管较低的得分可以鉴定相关分子。能够产生序列比对的程序的另一个例子是CLUSTALW计算机程序(Thompson(1994)Nucl.AcidsRes.2:4673-4680)or FASTDB(Brutlag(1990)Comp.App.Biosci.6:237-245),如本领域已知的。
上文关于“核酸序列的同源性/同一性”给出的解释和定义经必要修改适用于如SEQ ID No.4,6,8,14,16,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66或68中任一项所示的本文提供蛋白质的“氨基酸序列”,如下文所解释的。
根据本发明使用的蛋白质可以与具有如SEQ ID No:4,6,8,14,16,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66或68中任一项所示氨基酸序列的蛋白质具有至少70%的同一性/相似性。更优选地,蛋白质分别与具有如SEQ IDNo:4,6,8,14和16中任一项所示氨基酸序列的蛋白质具有至少90%,91%,92%,93%,94%,95%,96%,97%或98%的同一性/相似性,其中较高的值是优选的。最优选地,蛋白质可以分别与具有如SEQ ID No:4,6,8,14,16,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66或68中任一项所示氨基酸序列的蛋白质具有至少99%的同一性/相似性。
还可以使用本文提供的蛋白质的(功能)片段或(功能)衍生物,例如具有如SEQ IDNo:4,6,8,14,16,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66或68中任一项所示的氨基酸序列的蛋白质的(功能)片段或(功能)衍生物。
因此,本文提供并根据本发明使用的蛋白质的(功能)片段可以是如SEQ ID No.4,6,8,14,16,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66或68中任一项所示的任何上述特定蛋白质,其中缺失一个或多个氨基酸。
术语“一个或多个氨基酸”是指例如“1,2,3,4,5,6,7,8,9或10”个氨基酸。
本文提供并根据本发明使用的蛋白质的(功能)衍生物可以是如SEQ ID No.4,6,8,14,16,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66或68中任一项所示的任何上述特定蛋白质,其中插入,添加或取代一个或多个氨基酸。
本文提供并根据本发明使用的蛋白的(功能)片段可以由如SEQ ID No.4,6,8,14,16,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66或68中任一项所示的氨基酸序列的至少100,120,140,160或180个连续的氨基酸组成。
片段或衍生物优选具有与其衍生的全长蛋白相同(或基本上相同的)生物活性,全长多肽具有如SEQ ID No.4,6,8,14,16,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66或68中任一项所示的氨基酸序列。在这个意义上,该片段或衍生物是本文使用的“功能”片段或衍生物。
本发明提供的蛋白(具有如SEQ ID No.4,6,8,14,16,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66或68中任一项所示的氨基酸序列)可以具有一个或多个氨基酸缺失,插入,添加和/或取代,条件是多肽基本上维持其衍生的多肽特征性的生物活性。
优选地,任何此类缺失,插入,添加和/或取代(在本背景中特别是取代)是保守的,即氨基酸被具有相同或相似特征的氨基酸取代。例如,疏水性氨基酸优选被另外的疏水性氨基酸取代等。
本文提供的蛋白质特征性的“生物活性”可以例如认为是如本文定义的结合配体(分别为PDGF和VEGF)的能力。关于接头,特别是由脯氨酸,丙氨酸和任选地丝氨酸组成的接头,“生物活性”特别可以认为是形成无规构象的能力。
本文提供了编码本文提供的蛋白质的核酸分子。
例如,如本文所用的,“核酸序列/分子”是指所有形式的天然存在或重组产生的核酸和/或核酸序列/分子以及化学合成的核酸序列/分子的类型。该术语还包括核酸类似物和核酸衍生物,如例如锁定DNA,PNA,寡核苷酸硫代磷酸酯和取代的核糖寡核苷酸。此外,术语“核酸序列/分子”也指包含核苷酸或核苷酸类似物的任何分子。术语“核酸”和“核酸分子”在本文中可互换使用。
优选地,术语“核酸序列/分子”是指脱氧核糖核酸(DNA)和核糖核酸(RNA)。“核酸序列/分子”可以通过本领域普通技术人员已知的合成化学方法或通过使用重组技术制备,或者可以从天然来源分离,或通过其组合。DNA和RNA可以任选地包含非天然核苷酸,并且可以是单链或双链的。“核酸序列/分子”也指有义和反义DNA和RNA,即与DNA和/或RNA中特定的核苷酸序列互补的核苷酸序列。
此外,术语“核酸序列/分子”可以指现有技术已知的DNA或RNA或其杂合体或其任何修饰(对于修饰的例子,参见例如US 5525711,US 4711955,US 5792608或EP 302175)。核酸分子可以是单链或双链,线性或环状,天然或合成的,并且没有任何尺寸限制。例如,核酸分子可以是基因组DNA,cDNA,mRNA,反义RNA,核酶或编码此类RNA的DNA或嵌合修复体(chimeroplasts)(Colestrauss,Science(1996),1386-1389)。所述核酸分子可以是质粒或病毒DNA或RNA的形式。“核酸序列/分子”也可以指寡核苷酸,其中包括现有技术修饰中的任何一种,如硫代磷酸酯或肽核酸(PNA)。
此外,提供了包含核酸的载体。
许多合适的载体是分子生物学技术人员已知的。合适载体的选择取决于所需的功能,包括质粒,粘粒,病毒,噬菌体和遗传工程中常规使用的其它载体。
优选地,载体是质粒,更优选基于通用大肠杆菌表达载体pASK37,pASK75或pXL2的质粒。
本领域技术人员熟知的方法可用于构建各种质粒;参见例如Sambrook(2001)同上和Ausubel(1989)同上中描述的技术。典型的质粒载体包括例如pQE-12,pUC系列质粒,pBluescript(Stratagene),pET系列表达载体(Novagen)或pCRTOPO(Invitrogen),lambdagt11,pJOE,pBBR1-MCS系列,pJB861,pBSMuL,pBC2,pUCPKS,pTACT1。与哺乳动物细胞中表达相容的典型载体包括E-027pCAGKosak-Cherry(L45a)载体系统,pREP(Invitrogen),pCEP4(Invitrogen),pMC1neo(Stratagene),pXT1(Stratagene),pSG5(Stratagene),EBO-pSV2neo,pBPV-1,pdBPVMMTneo,pRSVgpt,pRSVneo,pSV2-dhfr,pIZD35,Okayama-Berg cDNA表达载体pcDV1(Pharmacia),pRc/CMV,pcDNA1,pcDNA3(Invitrogen),pcDNA3.1,pSPORT1(GIBCO BRL),pGEMHE(Promega),pLXIN,pSIR(Clontech),pIRES-EGFP(Clontech),pEAK-10(Edge Biosystems),pTriEx-Hygro(Novagen)和pCINeo(Promega)。适用于巴斯德毕赤酵母(Pichia pastoris)的质粒载体的非限制性实例包括例如质粒pAO815,pPIC9K和pPIC3.5K(均为Invitrogen)。
通常,载体可以含有一个或多个复制起点(ori)和用于克隆或表达的遗传系统,用于在宿主中选择的一个或多个标志物,例如抗生素抗性和一个或多个表达盒。适合的复制起点的例子包括例如全长ColE1,其截短的形式,如存在于pUC质粒上的那些,SV40病毒和M13噬菌体复制起点。可选择标志物的非限制性例子包括氨苄青霉素,氯霉素,四环素,卡那霉素,dhfr,gpt,新霉素,潮霉素,杀稻瘟素或遗传霉素。
此外,所述载体包含与本文定义的所述核苷酸序列或核酸分子可操作地连接的调控序列。
载体中包含的编码序列(例如编码本文提供的蛋白质的所述核苷酸序列,所述蛋白质包含PDGFR结构域和VEGFR结构域和优选地由PAS或PA组成的接头)可以使用建立的方法连接至转录调控元件和/或其它氨基酸编码序列。此类调控序列是本领域技术人员熟知的,且包括但不限于确保转录起始的调控序列,内部核糖体进入位点(IRES)和任选地确保转录终止和稳定转录物的调控元件。确保转录起始的此类调控序列的非限制性实例包括启动子,翻译起始密码子,增强子,绝缘子和/或确保转录终止的调控元件。另外的例子包括Kozak序列和侧接有RNA剪接的供体和受体位点的间插序列(intervening sequence),编码分泌信号的核酸序列,或取决于使用的表达系统,能够将表达的蛋白质导向细胞区室或培养基的信号序列。
适合的启动子的实例包括但不限于巨细胞病毒(CMV)启动子,SV40启动子,RSV(劳斯肉瘤(Rous sarcoma)病毒)启动子,lacZ启动子,鸡β-肌动蛋白启动子,CAG启动子(鸡β-肌动蛋白启动子和巨细胞病毒立即早期增强子的组合),人延长因子1a启动子,AOX1启动子,GAL1启动子,CaM-激酶启动子,lac,trp或tac启动子,lacUV5启动子,T7或T5启动子,苜蓿银纹夜蛾多核型多角体病毒(Autographa californica multiple nuclearpolyhedrosis virus)(AcMNPV)多角体启动子或哺乳动物和其它动物细胞中的球蛋白内含子。增强子的一个实例是例如SV40增强子。用于确保转录终止的调控元件/序列的非限制性另外的实例包括SV40多聚A位点,tk多聚A位点或AcMNPV多角体多聚腺苷酸化信号。
此外,取决于表达系统,能够将多肽导向细胞隔室或将其分泌到培养基中的前导序列可以添加至本文提供的核酸分子的编码序列。前导序列与翻译,起始和终止序列以符合读码框的方式装配,优选地,前导序列能够将翻译的蛋白质或其部分的分泌导向周质空间或细胞外培养基。适合的前导序列为例如大肠杆菌中BAP(细菌碱性磷酸酶),CTB(霍乱毒素亚基B),DsbA,ENX,OmpA,PhoA,stII,OmpT,PelB,Tat(双精氨酸易位,Twin-argininetranslocation)的信号序列,和真核细胞中的牛生长激素,人糜蛋白酶原,人因子VIII,人ig-kappa,人胰岛素,人白介素-2,来自Metrida或Vargula的萤光素酶,人胰蛋白酶原-2,来自马克思克鲁维酵母(Kluyveromyces marxianus)的菊粉酶(inulinase),来自酿酒酵母(Saccharomyces cerevisiae)的交配因子alpha-1,二甲双胍,人天青素(azurocidin)等的信号序列。
载体还可以含有编码一种或多种分子伴侣(chaperones)以促进正确的蛋白质折叠的另外的可表达的核酸序列。
存在于本文所述的宿主中的载体可以是表达载体,或者载体可以以下述方式介导如本文提供的核酸分子稳定整合到宿主细胞的基因组中,使得确保蛋白质的编导。用于选择其中如本文提供的核酸分子已经成功导入,使得确保蛋白质表达的宿主细胞的手段和方法是本领域公知的,并已经描述(Browne(2007)Trends Biotechnol.25:425-432;Matasci(2008)Drug Discov.Today:Technol.5:e37-e42;Wurm(2004)Nat.Biotechnol.22:1393-1398)。
优选地,本文使用的载体是表达载体。本文使用的表达载体能够指导本文提供的核酸分子的复制和表达,例如包含编码本文提供的蛋白的核苷酸序列的核酸分子。
本文公开了包含本文提供的核酸或本文提供的载体的宿主细胞。宿主细胞可以是真核宿主细胞或原核宿主细胞。优选的原核宿主细胞是大肠杆菌。真核宿主细胞可以是真菌或动物细胞。优选的动物细胞是HEK细胞或CHO细胞。
本公开还涉及用本文提供的载体或核酸分子转化的宿主细胞或非人宿主。应当理解,根据本公开的术语“用载体转化的宿主细胞或非人宿主”指包含如本文提供的载体或核酸分子的宿主细胞或非人宿主。
用于多肽的表达的宿主细胞是本领域公知的,并且包括原核细胞以及真核细胞。因此,宿主/宿主细胞可以选自下组:细菌,哺乳动物细胞,藻类细胞,纤毛虫(ciliate),酵母和植物细胞。
适合的细菌表达宿主包括例如衍生于大肠杆菌JM83,W3110,KS272,TG1,BL21(例如BL21(DE3),BL21(DE3)PlysS,BL21(DE3)RIL,BL21(DE3)PRARE),Origami(K-12),OrigamiB或Rosetta的菌株。对于载体修饰,PCR扩增和连接技术,参见Sambrook(2001)同上中描述的方法。
此外,杆状病毒系统也可以用作载体,以便在真核表达系统中表达本发明的核酸分子。在这些方面,pFBDM载体可以用作表达载体。在DH10MultiBac大肠杆菌细胞的转化后,通过Tn7转座序列介导插入到MultiBac杆状病毒DNA中(Berger(2013)J.Vis.Exp.77:50159,Fitzgerald(2006)Nat.Methods.2006 3:1021-1032.)。可以在Sf21(草地贪夜蛾(Spodoptera frugiperda))或High Five(粉纹夜蛾(Trichoplusia ni))细胞中进行病毒扩增和表达。
如上文所述的核酸分子和/或载体可以设计用于通过例如非化学方法(电穿孔,声孔(sonoporation),光学转染,基因电转移,流体动力递送,或将细胞与本发明的核酸分子接触时的自然发生的转化),基于化学的方法(磷酸钙,DMSO,PEG,脂质体,DEAE-葡聚糖(dextrane),聚乙烯亚胺,核转染等),基于颗粒的方法(基因枪,磁转染(magnetofection),刺穿染(impalefection)),基于噬菌体或噬菌粒载体的方法和病毒方法引入细胞中。例如,可以使用衍生于病毒如逆转录病毒,牛痘病毒,腺伴随病毒,疱疹病毒,塞米利克森林病毒(Semliki Forest Virus)或牛乳头瘤病毒(bovine papilloma virus)的表达载体用于将核酸分子递送到目标细胞群体中。
优选地,本文提供的核酸分子和/或载体设计用于通过电穿孔转化电感受态大肠杆菌或通过磷酸钙,聚乙烯亚胺(polyethylenimine)或阳离子脂质体转染(lipofectaminetransfection)稳定转染CHO细胞(Pham(2006)Mol.Biotechnol.34:225-237;Geisse(2012)Methods Mol.Biol.899:203-219;Hacker(2013)Protein Expr.Purif.92:67-76)。
典型的细菌包括埃希氏菌属(Escherichia),棒杆菌属(Corynebacterium)(谷氨酸棒杆菌(Corynebacterium glutamicum)),假单胞菌属(Pseudomonas)(荧光假单胞菌),乳杆菌属(Lactobacillus),链霉菌属(Streptomyces),沙门氏菌属(Salmonella),芽孢杆菌属(Bacillus)(如巨大芽孢杆菌(Bacillus megaterium)或枯草芽孢杆菌(Bacillussubtilis))或棒杆菌属(Corynebacterium)(例如谷氨酸棒杆菌(Corynebacteriumglutamicum))。本文中最优选的细菌宿主是大肠杆菌。本文使用的示例性纤毛虫是四膜虫属(Tetrahymena),例如嗜热四膜虫(Tetrahymena thermophila)。
典型的哺乳动物细胞包括Hela,HEK293,HEK293T,H9,Per.C6和Jurkat细胞,小鼠NIH3T3,NS0和C127细胞,COS 1,COS 7和CV1,鹌鹑(quail)QC1-3细胞,小鼠L细胞,小鼠肉瘤细胞,Bowes黑素瘤细胞和中国仓鼠卵巢(CHO)细胞。根据本发明的最优选的哺乳动物宿主细胞是CHO细胞。本文使用的示例性宿主是仓鼠属(Cricetulus),例如中国仓鼠(Cricetulus griseus,Chinese hamster)。此外,优选人胚胎肾(HEK)细胞。
其它的适合的真核宿主细胞是例如酵母,如巴斯德毕赤酵母(Pichia pastoris),乳酸克鲁维酵母(Kluyveromyces lactis),酿酒酵母(Saccharomyces cerevisiae)和粟酒裂殖酵母(Schizosaccharomyces pombe),或鸡细胞,如DT40细胞。适合用于表达的昆虫细胞是例如,果蝇(Drosophila)S2,果蝇Kc,草地夜蛾(Spodoptera)Sf9和Sf21或Trichoplusia Hi5细胞。优选的藻类细胞是莱茵衣藻(Chlamydomonas reinhardtii)或Synechococcus elongatus细胞等。示例性植物是立碗藓属(Physcomitrella),例如小立碗藓(Physcomitrella patens)。示例性植物细胞是立碗藓属植物细胞,例如小立碗藓植物细胞。
原代哺乳动物细胞或细胞系也在本发明的范围内。原代细胞是从生物体直接得到的细胞。适合的原代细胞是例如小鼠胚胎成纤维细胞(MEF),小鼠原代肝细胞,心肌细胞和神经元细胞以及小鼠肌肉干细胞(卫星细胞(satellite cells)),人皮肤和肺成纤维细胞,人上皮细胞(鼻,气管,肾,胎盘,肠道,支气管上皮细胞),人分泌细胞(来自唾液腺,皮脂腺和汗腺),人内分泌细胞(甲状腺细胞),人脂肪细胞,人平滑肌细胞,人骨骼肌细胞,人白细胞如B细胞,T细胞,NK细胞或树突状细胞以及其衍生的稳定的永生化细胞系(例如hTERT或癌基因永生化细胞)。用于上述宿主细胞的合适的培养基和条件是本领域已知的。
可以采用宿主细胞例如以产生大量本文提供的核酸分子和/或如本文提供的蛋白。因此,本文提供的是制备本文提供的核酸分子或载体的方法,该方法包括在适合的条件下培养本发明的宿主或宿主细胞,和任选地分离产生的核酸分子和/或载体。此外,本文提供的是用于制备本文所述和提供的蛋白的方法,所述方法包括在适合的条件下培养本文提供的宿主或宿主细胞,和任选地分离产生的蛋白。特别是在这方面,涵盖该蛋白是融合蛋白。
或者,该方法还可以包括培养如本文提供的宿主或宿主细胞(即包含核酸的宿主或宿主细胞,所述核酸编码如本文提供的接头,特别是由脯氨酸,丙氨酸和任选地丝氨酸组成的接头)和/或培养包含编码本文定义的PDGFR结构域和/或VEGFR结构域的核酸的宿主或宿主细胞,和任选地分离产生的接头和/或分离产生的PDGFR结构域和/或VEGFR结构域,和进一步任选地缀合接头和PDGFR结构域和/或VEGFR结构域(例如通过化学偶联)以产生蛋白。
“培养宿主或宿主细胞”在此语境下包括在宿主或宿主细胞中表达本文定义的接头和/或PDGFR结构域和/或VEGFR结构域。
用于培养原核或真核宿主细胞的适合的条件是本领域技术人员熟知的。例如,细菌例如大肠杆菌可以在Luria Bertani(LB)培养基中通气培养,通常在4至约37℃的温度下培养。为了增加表达产物的产量和溶解度,可以用已知增强或促进两者的适合的添加剂缓冲或补充培养基。在诱导型启动子控制宿主中存在的载体中本发明的核酸分子的情况下,可以通过添加适当的诱导剂如异丙基-β-硫代半乳糖苷(isopropyl-β-D-thiogalactopyranoside,IPTG)或脱水四环素(aTc)诱导多肽的表达,如在所附的实施例中采用的。本领域例如在Sambrook(2001)同上,(Gebauer(2012)Meth.Enzymol.503:157-188)中已经描述适合的表达方案和策略,并且如果需要,可以适于特定宿主细胞的需要和待表达的蛋白质的要求。
取决于细胞类型及其特定要求,哺乳动物细胞培养可以例如在RPMI,Williams'E或含有10%(v/v)FCS,2mM L-谷氨酰胺和100U/ml青霉素/链霉素的培养基DMEM中进行。可以将细胞保持在例如37℃,或对于DT40鸡细胞在41℃,在5%CO2,水饱和的环境中。例如,对于昆虫细胞培养适合的培养基为TNM+10%FCS,SF900或HyClone SFX-昆虫培养基。昆虫细胞通常在27℃作为粘附或悬浮培养物生长。用于真核或脊椎动物细胞的适合的表达方案是本领域技术人员公知的,并且可以从例如Sambrook(2001)(同上)中找到。
优选地,用于制备如本文所述的蛋白质,核酸分子和载体的方法使用细菌细胞,如大肠杆菌细胞或哺乳动物细胞,如例如CHO细胞进行。更优选地,该方法使用大肠杆菌细胞或CHO细胞进行,最优选地,该方法使用大肠杆菌细胞进行。
用于分离产生的编码多肽的方法包括但不限于纯化步骤,例如亲和层析(优选使用融合标签如Strep-tag II或His6-标签),凝胶过滤(尺寸排阻层析SEC),阴离子交换层析,阳离子交换层析,疏水相互作用层析,高压液相层析(HPLC),反相HPLC,硫酸铵沉淀或免疫沉淀。这些方法是本领域熟知的,并且已经在例如Sambrook(2001)同上中一般性描述。此类方法提供基本上纯的多肽。所述纯的多肽具有优选至少约90至95%(在蛋白质水平),更优选至少约98至99%的同质性。最优选地,这些纯的多肽适用于药物用途/应用。取决于产生过程中使用的宿主细胞/生物体,本发明提供的蛋白质可以是糖基化的或可以是非糖基化的。优选地,本文提供的由脯氨酸,丙氨酸和任选地丝氨酸组成的接头不经翻译后修饰,特别是不糖基化。最优选地,本文提供的由脯氨酸,丙氨酸和任选地丝氨酸组成的接头在其侧链中不经翻译后修饰,如例如通过脯氨酸羟化。
在可以由丙氨酸,脯氨酸和任选地丝氨酸残基组成的接头中,可以不存在O-或N-糖基化所需的氨基酸残基苏氨酸或天冬酰胺(或丝氨酸,如果适用)。因此,接头将(基本上)在Pro/Ala/Ser或Pro/Ala序列中没有翻译后修饰。这对于真核细胞中的重组蛋白生产是有利的,如通常选择用于复合蛋白的生物合成的中国仓鼠卵巢细胞(CHO),HEK细胞或酵母。
本文公开的是包含本文提供的或通过上文公开的方法制备的蛋白质,本文提供的核酸,本文提供的载体或本文提供的(宿主)细胞的组合物。
组合物可以是药物组合物,任选地还包含药学上可接受的载体。
在一个方面,本文提供的或通过本文以上公开的方法制备的蛋白质,本文提供的核酸,本文提供的载体,本文提供的细胞或本文提供的组合物用于作为药物使用。
在一个方面,本文提供的或通过上文公开的方法制备的蛋白质,本文提供的核酸,本文提供的载体,本文提供的细胞或本文提供的组合物用于在治疗中使用。
在一个方面,公开了本文提供的或通过上文公开的方法制备的蛋白质的使用,本文提供的核酸的使用,本文提供的载体的用途,本文提供的细胞的使用,或本文提供的组合物的使用,用于制备用于在治疗中使用的药物组合物。
在一个方面,公开了本文提供的或通过上文公开的方法制备的蛋白质,本文提供的核酸,本文提供的载体,本文提供的细胞或本文提供的组合物可以有效地抑制血管新生,用于治疗与血管新生相关的疾病,包括但不限于各种肿瘤、各种眼科疾病(例如糖尿病性视网膜病变(DR),糖尿病性黄斑水肿(DME),脉络膜血管化(CNV),视网膜静脉阻塞(RVO),中央视网膜静脉阻塞(CRVO),视网膜静脉阻塞(BRVO),病理近视(PM),优选年龄相关性黄斑变性(AMD);癌症、肾纤维化、硬化、动脉粥样硬化、门静脉高压或系统性硬化的药物组合物。
进一步的,在一个方面,公开了本文提供的或通过上文公开的方法制备的蛋白质,本文提供的核酸,本文提供的载体,本文提供的细胞或本文提供的组合物可以用于治疗各种眼科疾病(例如糖尿病性视网膜病变(DR),糖尿病性黄斑水肿(DME),脉络膜血管化(CNV),视网膜静脉阻塞(RVO),中央视网膜静脉阻塞(CRVO),视网膜静脉阻塞(BRVO),病理近视(PM),特别是,如与年龄相关的黄斑变性(AMD)),癌症、肾纤维化、硬化、动脉粥样硬化、门静脉高压或系统性硬化。在一方面,一方面,公开了本文提供的或通过上文公开的方法制备的蛋白质,本文提供的核酸,本文提供的载体,本文提供的细胞或本文提供的组合物可以用于抑制血管新生(特别是在已患病人群中)。
在一个方面,公开了本文提供的或通过上文公开的方法制备的蛋白质的使用,本文提供的核酸的使用,本文提供的载体的用途,本文提供的细胞的使用,或本文提供的组合物的使用,用于制备用于治疗年龄相关性黄斑变性(AMD),糖尿病性视网膜病变(DR),糖尿病性黄斑水肿(DME),脉络膜血管化(CNV),视网膜静脉阻塞(RVO),中央视网膜静脉阻塞(CRVO),视网膜静脉阻塞(BRVO),病理近视(PM),癌症,肾纤维化,硬化,动脉粥样硬化,门静脉高压或系统性硬化的药物组合物。
在一个方面,公开了治疗年龄相关性黄斑变性(AMD),,糖尿病性视网膜病变(DR),糖尿病性黄斑水肿(DME),脉络膜血管化(CNV),视网膜静脉阻塞(RVO),中央视网膜静脉阻塞(CRVO),视网膜静脉阻塞(BRVO),病理近视(PM),癌症,肾纤维化,硬化,动脉粥样硬化,门静脉高压或系统性硬化的方法,该方法包括向受试者(需要治疗)施用(有效量的)本文提供的或通过上文公开的方法制备的蛋白质,本文提供的核酸,本文提供的载体,本文提供的细胞,或本文提供的组合物。
癌症可以是实体癌。实体癌可以是结肠癌,肝细胞癌,非小细胞肺癌,软组织肉瘤,前列腺癌,乳腺癌,卵巢癌,神经胶质瘤,皮肤纤维肉瘤突起,口腔鳞状细胞癌或胰腺癌。癌症可以是非实体癌,如白血病或非霍奇金淋巴瘤。
术语“治疗/处理”等通常用于表示获得期望的药理和/或生理效果。在完全或部分预防疾病或其症状方面,该效果可以是预防性的,和/或在部分或完全治愈疾病和/或归因于疾病的不利影响方面,该效果可以是治疗性的。如本文所用的,术语“治疗”涵盖对受试者的疾病的任何治疗,并且包括:(a)在可能易患该疾病的受试者中预防相关疾病;(b)抑制疾病,即阻止其发展;或(c)减轻疾病,即引起疾病的消退。
为了本发明的目的,“个体”,“患者”或“受试者”包括人和其他动物,特别是哺乳动物,和其他生物体。因此,该方法适用于人类治疗和兽医应用。优选地,“个体”,“患者”或“受试者”是哺乳动物,并且最优选地,“个体”,“患者”或“受试者”是人。
本文提供的蛋白质可以作为单一药剂(即单一疗法的形式)或联合疗法的形式施用,例如常规治疗如视网膜病变如糖尿病性视网膜病变、视网膜炎、湿性视网膜黄斑变性或青光眼。癌症的例子可能会被现在的发明所治疗,包括那些内轴的脑癌、卵巢癌、结肠癌、前列腺癌、肺癌、Kaposi的肉瘤和皮肤癌,这些都是不适当的PDGF-R活动。血管增生障碍的例子包括炎症性的障碍,再狭窄和动脉粥样硬化。
考虑到个体患者的临床状况,药物组合物的递送部位,施用方法,施用安排,以及实践者已知的其它因素,药物组合物将以符合良好医学实践的方式配制和给药。因此,通过这些考虑确定用于本文目的的药物组合物的“有效量”。
技术人员知道施用至个体的药物组合物的有效量将尤其取决于化合物的性质。本文提供的组合物的施用可以尤其包括每天两次,每天,每隔一天,每三天,每四天,每五天,一周一次,每两周一次,每三周一次,每月一次施用等。
本发明的药物组合物优选包含药学上可接受的载体。“药学上可接受的载体”是指任何类型的无毒固体,半固体或液体填充剂,稀释剂,包囊材料或制剂助剂。如本文所用的,术语“肠胃外”是指包括静脉内,肌肉内,腹膜内,胸骨内,皮下和关节内注射和输注的施用方式。
药物组合物也适合地通过持续释放系统施用。持续释放组合物的适合的例子包括成形制品形式的半透性聚合物基质,例如膜或微囊体(mirocapsules)。持续释放基质包括聚丙交酯(美国专利号3,773,919,EP 58,481),L-谷氨酸和γ-乙基-L-谷氨酸的共聚物(Sidman,U.et al.,Biopolymers 22:547-556(1983)),聚(甲基丙烯酸2-羟基乙酯)(poly(2-hydroxyethyl methacrylate))(R.Langer等人,J.Biomed.Mater.Res.15:167-277(1981)和R.Langer,Chem.Tech.12:98-105(1982)),乙烯乙酸乙烯酯(ethylene vinylacetate)(R.Langer等人,同上)或聚-D-(-)-3-羟基丁酸(EP 133,988)。持续释放药物组合物还包括脂质体包埋的化合物(liposomally entrapped compound)。含有药物组合物的脂质体通过本身已知的方法制备:DE 3,218,121;Epstein等人,Proc.Natl.Acad.Sci.(USA)82:3688-3692(1985);Hwang等人,Proc.Natl.Acad.Sci.(USA)77:4030-4034(1980);EP52,322;EP 36,676;EP 88,046;EP 143,949;EP 142,641;日本专利申请83-118008;美国专利号4,485,045和4,544,545;和EP 102,324。通常,脂质体是小的(约200-800埃)单层型,其中脂质含量大于约30mol百分比胆固醇,为最佳治疗调整选择的比例。
通常,通过使药物组合物的组分与液体载体或精细分开的固体载体或两者均匀且紧密地接触来制备制剂。然后,如果必需的话,将产品成型为期望的制剂。优选地,载体是肠胃外载体,更优选与接受者的血液等张的溶液。此类载体媒介物的实例包括水,盐水,林格氏溶液和右旋糖溶液。本文中也可用非水性媒介物如不挥发油和油酸乙酯,以及脂质体。载体适当地含有少量添加剂,如增强等张性和化学稳定性的物质。此类材料在所采用的剂量和浓度下对接受者无毒,并且包括缓冲液如磷酸盐,柠檬酸盐,琥珀酸盐,乙酸和其它有机酸或其盐;抗氧化剂如抗坏血酸;低分子量(少于约十个残基)(多)肽,例如聚精氨酸或三肽;蛋白质,如血清白蛋白,明胶或免疫球蛋白;亲水性聚合物如聚乙烯吡咯烷酮;氨基酸,如甘氨酸,谷氨酸,天冬氨酸或精氨酸;单糖,二糖和其他碳水化合物,包括纤维素或其衍生物,葡萄糖,甘露糖或糊精;螯合剂如EDTA;糖醇如甘露糖醇或山梨糖醇;平衡离子如钠;和/或非离子表面活性剂如聚山梨醇酯(polysorbates),泊洛沙姆(poloxamers)或PEG。
用于治疗性施用的药物组合物的组分必须是无菌的。通过无菌过滤膜(例如0.2微米膜)过滤容易地实现无菌。药物组合物的治疗成分通常放置在具有无菌入口的容器中,例如具有可被皮下注射针刺穿的塞的静脉内溶液袋或小瓶。
药物组合物的组分通常将作为水性溶液或作为用于重建的冻干制剂储存在单位或多剂量容器中,例如密封的安瓿或小瓶。作为冻干制剂的实例,用5ml无菌过滤的1%(w/v)水溶液填充10ml小瓶,并将所得混合物冻干。通过使用抑菌注射用水重建冻干化合物来制备输注溶液。
本文提供的核酸分子也可以单独使用或作为载体的一部分用于基因治疗的目的。基因治疗(其基于通过离体或体内技术将治疗性基因导入细胞)是基因转移的最重要的应用之一。用于体内基因治疗的合适的载体,方法或基因递送系统在文献中描述并且是本领域技术人员已知的;参见,例如Giordano(1996)Nat.Med.2:534-539;Schaper(1996)Circ.Res.79:911-919;Anderson(1992)Science 256:808-813;Verma(1997)Nature 389:239-249;Isner(1996)Lancet 348:370-374;Muhlhauser(1995)Circ.Res.77:1077-1086;Onodera(1998)Blood 91:30-36;Verma(1998)Gene Ther.5:692-699;Nabel(1997)Ann.N.Y.Acad.Sci.811:289-292;Verzeletti(1998)Hum.Gene Ther.9:2243-2251;Wang(1996)Nat.Med.2:714-716;WO 94/29469;WO 97/00957,US 5,580,859;US 5,589,466;或Schaper(1996)Curr.Opin.Biotechnol.7:635-640。本文提供的核酸分子和载体可以设计用于直接导入或通过脂质体或病毒载体(例如,腺病毒,逆转录病毒)导入细胞。例如,载体可以是腺伴随病毒(AAV)载体,特别是AAV8载体。AAV载体对于基因治疗是有吸引力的。AAV系统具有几项优势,包括长期基因表达,无辅助病毒无自主复制能力,分裂细胞和非分裂细胞的转导,以及野生型感染缺乏致病性等优点。优选地,导入有核酸分子或载体的所述细胞是生殖细胞,胚胎细胞或卵细胞或由其衍生,最优选所述细胞是干细胞。胚胎干细胞的实例可以尤其是Nagy(1993)Proc.Natl.Acad.Sci.USA 90:8424-8428中所述的干细胞。
如本文所使用的,术语“包含”或“包括”或其语法变体将被视为指定所述特征,整数,步骤或组分,但不排除添加一个或多个另外的特征,整数,步骤,组分或其组。术语“包含”/“包括”包含术语“由...组成”和“基本上由...组成”。因此,每当在本文中使用术语“包括”/“包括”时,它们可以由“基本上由...组成”或优选地“由...组成”代替。
术语“包含”/“包括”意味着可以存在任何另外的组分(或同样地特征,整数,步骤等)。
术语“由...组成”意味着不能存在另外的组分(或同样地特征,整数,步骤等)。
术语“基本上由...组成”或其语法变体在本文中使用时视为指定所述的特征,整数,步骤或组分,但不排除添加一个或多个另外的特征,整数,步骤,组分或其组,但是仅当另外的特征,整数,步骤,组件或其组不会实质上改变所要求保护的产品,组合物,装置或方法等的基本和新颖特征。
因此,术语“基本上由...组成”意味着可以存在特定的其它组分(或同样地特征,整体,步骤等),即不会实质影响产品,组合物,装置或方法的基本特征的那些。换句话说,术语“基本上由...组成”(其在本文中可以与术语“基本上包括”互换使用)允许在产品,组合物,装置或方法中存在除了强制性组分(或同样地特征,整数,步骤等)之外的其它组分,条件是该产品,组合物,装置或方法的基本特征不会受到其它组分的存在的重大影响。
术语“方法”是指完成给定任务的方式,手段,技术和过程,包括但不限于化学、生物学和生物物理学领域从业者已知的那些方式,手段,技术和过程,或容易地从已知的方式,手段,技术和过程开发的。
如果没有另外说明,如本文所用的,术语“约”是指±10%。
附图简述
通过参考以下非限制性附图和实施例进一步描述本发明。
附图显示了:
图1.
pDSG33-PDGFR-PAS200-VEGFR上编码的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3融合蛋白,本申请命名为EPS1108P,和核苷酸和氨基酸序列(侧翼有XbaI和HindIII限制性位点)。下划线:PDGFR-α的信号序列,其在分泌期间被切割。波浪下划线:PAS多肽序列。间断下划线:用于亲和纯化和检测的His6标签。
图2.
PDGFRαD123-PAS(200)-VEGFR1D2/R2D3与两种配体VEGF和PDGF以其同二聚体状态的完全配体结合复合物的3D模型。对于建模,使用与PDGF-BB(PDB条目3MJG)复合的PDGFR-β和与VEGF-C(PDB条目2X1W)复合的VEGFR2的晶体结构。描述无规卷曲构象的柔性PAS多肽间隔区,过度简化为带状。(N或C=N或C末端终止)
图3.
PDGFRαD123-PAS(200)-VEGFR1D2/R2D3融合蛋白,本申请命名为EPS1108P的纯化和SDS PAGE分析。(A)转染7天后在MEXi-293E细胞中瞬时表达的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的不同纯化步骤的SDS-PAGE分析。(1)从条件化培养基上清的NH4SO4沉淀。(2)Resourch Q(阴离子交换)层析后的蛋白。(3)Resourch S(阳离子交换)层析后的蛋白。(4)尺寸排阻层析后的蛋白。在4-20%梯度Bis-Tris凝胶上分析样品,并使用InstantBlue胶体考马斯蓝蛋白染色显现。蛋白质分子量标志物:PageRuler Plus Prestained蛋白梯(250,130,100,70,55,35,25,15,10kDa)。(B)在(1)还原和(2)非还原条件(+/-5mM DTT)下从MEXi-293E条件化培养基中纯化的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的SDS-PAGE分析。(C)使用抗聚His抗体通过C末端His6标签纯化的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的Western印迹分析。蛋白质分子量标志物:PageRulerPlus Prestained蛋白梯度(250,130,100,70,55,35,25,15,10kDa)。
图4.
Superdex 200 10/30GL上的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3,,本申请命名为EPS1108P的尺寸排阻层析(运行缓冲液:10mM Hepes/NaOH,150mM NaCl pH 7.4;外水体积V0=7.1ml;柱体积:23.6ml;样品体积:0.5ml)。(A)从条件化MEXi-293E培养基纯化的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3在9.6ml洗脱为尖峰。(B)用于估算天然分子量的校准线,其基于在相同的Superdex 200 10/30GL柱上在分析凝胶过滤期间各种球状尺寸标准蛋白的保留体积。从半对数拟合计算,PAS化的融合蛋白揭示了约530kDa的表观分子量,其比PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的基于氨基酸序列计算的分子量(75kDa)大7倍,从而揭示了扩展的分子体积是由于PAS间隔区的无规卷曲行为所致。
图5.
在等摩尔量的PDGF-AA或VEGF-A165或两者的存在下,经由PDGFRαD123-PAS(200)-VEGFR1D2/R2D3,本申请命名为EPS1108P的天然PAGE的电迁移率凝胶移位测定(Electromobility gel shift assay)。(1)根据基于氨基酸序列(无糖基化)计算的质量72.3kDa,从条件化MEXi-293E培养基纯化的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3融合蛋白是糖基化的并作为宽的条带运行。38.4kDa的同二聚体VEGF-A165(3),28.6kDa的同二聚体PDGF-AA(4)或两种蛋白质配体VEGF-A165和PDGF-AA(2)的结合相当大地改变了PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的电泳迁移行为,并也导致更集中和更好确定的蛋白条带,其对于形成的复合物是指示性的。
图6.
PDGFRαD123-PAS(300)-VEGFR1D2/R2D3,本申请中命名为EPS1103P,SDS-PAGE分析结果见附图6A;纯化后蛋白尺寸排阻层析(SEC)结果见附图6B,结果显示蛋白纯度达98.88%。
图7.
PDGFRαD123-PAS(300)-VEGFR1D2/R2D3,本申请中命名为EPS1104P,SDS-PAGE分析结果见附图7A;纯化后蛋白尺寸排阻层析(SEC)结果见附图7B,结果显示蛋白纯度达98.97%。
图8.
VEGFR1D2/R2D3-PAS(200)-PDGFRαD123,本申请中命名为EPS1105P,SDS-PAGE分析结果见附图8A;纯化后蛋白尺寸排阻层析(SEC)结果见附图8B,结果显示蛋白纯度达99.82%。
图9.
PDGFRαD123-(GGGGS)3-PAS(200)-(GGGGS)3-VEGFR1D2/R2D3,本申请中命名为EPS1106P,纯化后SDS-PAGE分析结果见附图9A;纯化后蛋白尺寸排阻层析(SEC)结果见附图9B,结果显示蛋白纯度达99.79%。
图10.
VEGFR1D2/R2D3-(GGGGS)3-PAS(200)-(GGGGS)3-PDGFRαD123,本申请中命名为EPS1107P,纯化蛋白SDS-PAGE分析结果见附图10A;纯化后蛋白尺寸排阻层析(SEC)结果见附图10B,结果显示蛋白纯度达99.43%。
图11.
PAS(200)-VEGFR1D2/R2D3-PDGFRαD123,本申请中命名为EPS1109P,纯化后蛋白SDS-PAGE分析结果见附图11A;纯化后蛋白尺寸排阻层析(SEC)结果见附图11B,结果显示蛋白纯度达99.62%。
图12.
PAS(200)-PDGFRαD123-VEGFR1D2/R2D3,本申请中命名为EPS1110P,纯化后蛋白SDS-PAGE分析结果见附图12A;纯化蛋白尺寸排阻层析(SEC)结果见附图12B,结果显示蛋白纯度达99.52%。
图13
PDGFRαD123-PAS(600)-VEGFR1D2/R2D3,本申请中命名为EPS1113P,纯化后蛋白SDS-PAGE分析结果见附图13A;纯化蛋白尺寸排阻层析(SEC)结果见附图13B,结果显示蛋白纯度达92.28%。
图14.
PDGFRαD123-(GGGGS)3-PAS(600)-(GGGGS)3-VEGFR1D2/R2D3,本申请中命名为EPS1114P,纯化后蛋白SDS-PAGE分析结果见附图14A;纯化蛋白尺寸排阻层析(SEC)结果见附图14B,结果显示蛋白纯度达98.77%。
图15.
VEGFR1D2/R2D3-(GGGGS)3-PAS(600)-(GGGGS)3-PDGFRαD123,本申请中命名为EPS1115P,纯化后蛋白SDS-PAGE分析结果见附图15A;纯化蛋白尺寸排阻层析(SEC)结果见附图15B,结果显示蛋白纯度达99.58%。
图16
native-PAGE电泳图;四个通道的检测结果如下:通道1:EPS1104P融合蛋白;通道2:由EPS1104P与PDGF-BB结合形成的复合物;通道3:由EPS1104P与VEGF165结合形成的复合物;通道4:由EPS1104P与PDGF-BB和VEGF165结合形成的复合物。
实施例说明了本申请。
实施例1:PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的克隆。
在本申请中,PDGFRαD123-PAS(200)-VEGFR1D2/R2D3,命名为EPS1108P。
在两个步骤中构建编码融合蛋白PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的DNA序列。首先,通过从Geneart(Regensburg,Germany;SEQ ID No.17)基因合成获得两个受体胞外域的编码区。在该构建体中,(i)编码PDGFR-α前导信号序列的DNA序列(69bp,包括起始Met)后面有(ii)PDGF-受体α结构域D1-D3的876bp核苷酸序列,(iii)VEGFR1D2/VEGFR2D3的615bp序列,(iv)His6标签和最后终止密码子。将SapI的限制性位点引入PDGFR-αD123和VEGFR1D2/VEGFR2D3的编码区之间,以允许充当柔性接头/间隔区的PAS或P/A序列的随后阅读框内克隆。另外,在整个合成基因的侧翼区域引入XbaI和HindIII的限制性位点,以简化克隆到具有相容限制性内切核酸酶位点的表达载体上。注意,当使用从dam+宿主例如大肠杆菌菌株XL1Blue制备的质粒DNA时,PDGFR-α的基因内的天然存在的XbaI限制性位点对于dam甲基化敏感,并因此在用XbaI的限制性消化方面受到封闭。受体胞外域的核苷酸序列对于PDGFR-αD123取自Genbank条目NM006206.4而对于VEGFR1D2/R2D3(Aflibercept)来自美国专利5,952,199。通过pDSG33上的XbaI/HindIII位点将全长合成基因(990bp)克隆,所述pDSG33(pDSG-IBA33的衍生物(IBA,Germany))设计用于在哺乳动物宿主细胞中高水平稳定且非复制型的瞬时表达。在第二步,通过使用限制性酶SapI的双切割从质粒pXL1-PAS(200)切下编码PAS序列的200个残基的基因片段,并使用克隆的合成基因插入pDSG33载体中,其已经使用SapI线性化。在分析限制性消化和通过DNA测序(MWG,Ebersberg,Germany)确认正确的插入片段后,将所得的编码PDGFRαD123-PAS(200)-VEGFR1D2/R2D3融合蛋白(SEQ ID No.18;SEQ ID No.14;图1)的表达载体命名为pDSG33-PDGFR-PAS200-VEGFR(SEQ ID No.13)。/>
实施例2:PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的表达。
为了产生融合蛋白(图1),使用QIAGEN Plasmid Midi试剂盒(Qiagen,Hilden,Germany)制备了pDSG33-PDGFR-PAS200-VEGFR(SEQ ID No.13)的质粒DNA,然后用于转染在MEXi-TM转染培养基(IBA;使用8mM L-丙氨酰基-L-谷氨酰胺补充)中200ml指数生长的MEXi-293E悬浮细胞(IBA,Germany)。根据制造商的说明,使用聚乙酰亚胺(polyethylenimine)(PEI,Polyscienences,Warrington PA,USA)和质粒DNA以4比1的质量比率并应用1μg DNA每一百万个细胞(以1x106细胞/ml的密度)完成转染。转染后四个小时,将细胞在新鲜的MEXi-CM培养基(IBA;使用50mg/l G-418和8mM L-丙氨酰基-L-谷氨酰胺补充)中稀释至400ml的最终培养体积。在湿润的CO2培养箱中在温和搅动(120rpm),37℃下孵育转染的细胞7天。此后,通过在4500g离心20分钟去除细胞,并收集和无菌过滤(0.2μm)含有PDGFRαD123-PAS(200)-VEGFR1D2/R2D3融合蛋白的澄清的条件化培养基。
实施例3:PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的蛋白质纯化。
通过向400ml的条件化培养基添加150g硫酸铵从以上获得的澄清培养基沉淀PDGFRαD123-PAS(200)-VEGFR1D2/R2D3(图1)。将混合物在温和搅拌下在4℃过夜,然后通过在15,000g离心40分钟收集沉淀。回收沉淀,并且在100ml含有1M NaCl的40mM Hepes/NaOH,pH7.4中溶解,然后对相同的缓冲液在4℃透析过夜。对于固定化金属离子亲和层析(IMAC),将6ml HisTrap HP柱(GE Healthcare,Uppsala,Sweden)用100ml 40mM Hepes/NaOH,pH 7.4,1M NaCl(运行缓冲液)平衡,并加载约100ml的无菌过滤的蛋白质溶液。使用相同的缓冲液清洗柱,直到280nm处的吸光度(A280)达到基线,并且在8个柱体积里使用运行缓冲液中的0至210mM咪唑/HCl的线性梯度洗脱PDGFRαD123-PAS(200)-VEGFR1D2/R2D3。对于随后的阴离子交换层析,将含有PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的洗脱部分用层析缓冲液(20mM MES/NaOH,pH 5.9)在4℃下透析过夜,无菌过滤,然后加载到预平衡的Resource Q柱(GEHealthcare,Uppsala,Sweden),其床体积为85ml。将柱用层析缓冲液洗涤至A280基线,然后通过缓冲液改变至补充有225mM NaCl的层析缓冲液,将融合蛋白在一个步骤中洗脱。在洗脱级分中,融合蛋白为约85%纯。作为最终精制步骤,将该蛋白质溶液对20mM MES/NaOH,pH5.9透析过夜,并加载到具有85ml床体积的Resource S柱(GE Healthcare)上并用相同的缓冲液平衡。通过在相同的缓冲液中应用逐步浓度梯度来实现洗脱,以150mM NaCl开始,然后是225mM NaCl和300mM NaCl,最终产生融合蛋白。根据制造商的说明,使用MOPS运行缓冲液中的4-20%Bis-Tris梯度凝胶(Genscript,Piscataway NJ,USA),通过SDS-PAGE(图3),然后用InstantBlue胶体考马斯蓝蛋白染色剂(Expedeon,Cambridge,UK)染色分析PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的纯度。通过数字成像记录凝胶。注意:在SDS-PAGE(图3)中看到的诱饵受体融合物表观上较高的分子量源自PAS化,其已经在Schlapschy等人,2013中对于其它PAS化的蛋白观察到。
实施例4:PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的Western印迹分析。
根据制造商的说明,在MOPS运行缓冲液中的4-20%Bis-Tris梯度凝胶(Genscript)上分离携带C末端His6标签的纯化的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3,并使用半干转移装置在Immobilion-P PVDF膜(Merck,Darmstadt,Germany)上进行印迹。该膜使用补充含有0.1%Tween-20的磷酸盐缓冲盐水(PBS;4mM KH2PO4,16mM Na2HPO4,115mMNaClpH 7.4)(PBST)洗涤膜两次,然后在室温(RT)使用PBST中的3%(w/v)BSA溶液针对非特异性结合封闭1小时。接着,封闭的膜在以1:2000稀释于0.1%(w/v)BSA,PBST的单克隆抗多聚组氨酸-过氧化物酶HIS-1抗体缀合物(A7058;Sigma Aldrich,St.Louis,MO,USA)的溶液中孵育,在RT持续1小时。该膜使用PBST洗涤两次,然后添加辣根过氧化物酶底物3,3'-二氨基联苯胺(3,3′-diaminobenzidine)(Sigma Aldrich)。在PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的尺寸处,在该膜上检测到了褐色的沉淀,其通过数字成像记录(图3)。
实施例5:PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的尺寸排阻层析。
为了分析纯化的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的完整性和表观尺寸,将500μl的溶于20mM MES/NaOH,pH 5.9,300mM NaCl的0.43mg/ml蛋白质样品(3nmol)加载到使用10mM Hepes/NaOH,pH 7.4,150mM NaCl预平衡的Superdex 200 10/30GL柱(GEHealthcare)上。如上文所述从条件化MEXi-293E培养基纯化的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3以9.6ml洗脱为尖峰(图4.A),其对应530kDa的平均分子量,如从校准曲线(图4.B)计算的。
实施例6:天然PAGE和电迁移率凝胶移位测定。
将纯化的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3(25pmol)与25pmol VEGF-A165(#8065-LF;Cell Signaling Technology,Danvers MA,USA)或25pmol PDGF-AA(#8913-LF;Cell Signaling Technology)或两种配体(各25pmol)在25μl反应中在20mM HEPES/NaOH,pH 7.4,100mM NaCl存在下在冰上孵育30分钟,如图5中显示。然后将溶液与10x天然样品缓冲液(60mM Tris碱,480mM甘氨酸,pH 8.3;50%(v/v)甘油,0.01%(w/v)溴酚蓝)混合,并立即加载到3-8%Tris-乙酸聚丙烯酰胺凝胶上(无SDS,Invitrogen,Carlsbad,CA,USA)。将凝胶在室温下,在Tris-甘氨酸运行缓冲液pH 8.3(Invitrogen)中以90V运行,直到溴酚蓝标志物到达凝胶的底部。将凝胶在水中短暂漂洗,然后使用Instant Blue胶体考马斯蓝蛋白染色剂(Expedeon,Cambridge,UK)染色。通过数字成像仪记录凝胶。在用于PAGE的天然条件下,两种配体VEGF-A165和PDGF-AA都结合PDGFRαD123-PAS(200)-VEGFR1D2/R2D3并形成稳定的复合物(参考图2),其可以通过以下检测:(I)两种配体的同时结合,当两种抗体都存在时或(II)PDGF-AA或VEGF-A165的结合,当另一种配体不存在时(图5)。
实施例7:PDGFRαD123-PAS(300)-VEGFR1D2/R2D3的克隆、表达和纯化
PDGFRαD123-PAS(300)-VEGFR1D2/R2D3,本申请中命名为EPS1103P。
EPS1103P的克隆:
设计PCR引物和测序引物,从头合成编码EPS1103P的基因。基因通过PCR扩增,然后克隆到pUC57载体中,转入感受态E.coli细胞中,37℃倒置培养过夜;通过PCR扫描获得阳性克隆;从阳性克隆提取质粒进行测序验证。提取的质粒和目标载体(pcDNA3.4)使用限制性内切酶进行酶切,酶切产物通过电泳获得,然后通过连接酶缓冲液克隆到pcDNA3.4载体中,缓冲液37℃培养过夜;通过PCR扫描获得阳性克隆;从阳性克隆提取质粒进行测序验证。一小份质粒在电热恒温浴缸中通过内切酶进行酶切,然后通过琼脂糖凝胶电泳进行验证;验证后质粒转入E.coli细胞中,通过抗性固体LB培养基进行菌落筛选,然后在培养箱中培养过夜扩增菌株克隆;从阳性克隆中提取质粒。
EPS1103P的表达:
CHO-3E7细胞加入无血清FreeStyleTM CHO表达培养基(Life Technologies,Carlsbad,CA,USA)中,置于摇瓶(Corning Inc.,Acton,MA)中于37℃,5%CO2摇床(VWRScientific,Chester,PA)培养。转染前两天,重新在摇瓶中接种适当密度的细胞进行培养;转染当天,将质粒和转染试剂按照一个最佳的比例混合,然后加入到上述摇瓶中进行转染。转染后继续培养,在第6天收取细胞培养上清液用于纯化。
EPS1103P的纯化:
细胞培养液离心,然后过滤,过滤后的EPS1103P上清液以25mM Tris-HCl(pH8.0)稀释,加载至Hitrap Q HP柱(GE,Cat.No.17115401),流速1.0ml/min,以适当的缓冲液洗脱,洗脱部分合并,用Ni柱(GenScript,Cat.No.L00465)进行纯化;然后目标蛋白进一步通过HiLoad Superdex 200 26/600pg柱(GE Healthcare,Uppsala,Sweden)去除聚合体和其它杂志。纯化后的蛋白通过SDS-PAGE和SEC-HPLC进行分子量和纯度分析,分析结果分别见图6A和图6B,其中SEC-HPLC结果显示纯度为98.88%。
实施例8:PDGFRαD123-PAS(400)-VEGFR1D2/R2D3的克隆、表达和纯化
PDGFRαD123-PAS(400)-VEGFR1D2/R2D3,本申请中命名为EPS1104P,其克隆、表达、纯化参考实施例7所述方法,纯化后蛋白SDS-PAGE分析结果见附图7A;纯化蛋白尺寸排阻层析(SEC)结果见附图7B,结果显示蛋白纯度达98.97%。
实施例9:VEGFR1D2/R2D3-PAS(200)-PDGFRαD123的克隆、表达和纯化
VEGFR1D2/R2D3-PAS(200)-PDGFRαD123,本申请中命名为EPS1105P,其克隆、表达、纯化参考实施例7所述方法,纯化后蛋白SDS-PAGE分析结果见附图8A;纯化蛋白尺寸排阻层析(SEC)结果见附图8B,结果显示蛋白纯度达99.82%。
实施例10:PDGFRαD123-(GGGGS)3-PAS(200)-(GGGGS)3-VEGFR1D2/R2D3的克隆、表达和纯化
PDGFRαD123-(GGGGS)3-PAS(200)-(GGGGS)3-VEGFR1D2/R2D3,本申请中命名为EPS1106P,其克隆、表达、纯化参考实施例7所述方法,纯化后蛋白SDS-PAGE分析结果见附图9A;纯化蛋白尺寸排阻层析(SEC)结果见附图9B,结果显示蛋白纯度达99.79%。
实施例11:VEGFR1D2/R2D3-(GGGGS)3-PAS(200)-(GGGGS)3-PDGFRαD123的克隆、表达和纯化
VEGFR1D2/R2D3-(GGGGS)3-PAS(200)-(GGGGS)3-PDGFRαD123,本申请中命名为EPS1107P,其克隆、表达、纯化参考实施例7所述方法,纯化后蛋白SDS-PAGE分析结果见附图10A;纯化蛋白尺寸排阻层析(SEC)结果见附图10B,结果显示蛋白纯度达99.43%。
实施例12:PAS(200)-PDGFRαD123-VEGFR1D2/R2D3的克隆、表达和纯化
PAS(200)-VEGFR1D2/R2D3-PDGFRαD123,本申请中命名为EPS1109P,其克隆、表达、纯化参考实施例7所述方法,纯化后蛋白SDS-PAGE分析结果见附图11A;纯化蛋白尺寸排阻层析(SEC)结果见附图11B,结果显示蛋白纯度达99.62%。
实施例13:PAS(200)-PDGFRαD123-VEGFR1D2/R2D3的克隆、表达和纯化
PAS(200)-PDGFRαD123-VEGFR1D2/R2D3,本申请中命名为EPS1110P,其克隆、表达、纯化参考实施例7所述方法,纯化后蛋白SDS-PAGE分析结果见附图12A;纯化蛋白尺寸排阻层析(SEC)结果见附图12B,结果显示蛋白纯度达99.52%。
实施例14:PDGFRβD123-PAS(200)-VEGFR1D2/R2D3的克隆、表达和纯化
PDGFRβD123-PAS(200)-VEGFR1D2/R2D3,本申请中命名为EPS1111P,其克隆、表达、纯化参考实施例7所述方法。
实施例15:PDGFRαD123-PAS(600)-VEGFR1D2/R2D3的克隆、表达和纯化
PDGFRαD123-PAS(600)-VEGFR1D2/R2D3,本申请中命名为EPS1113P,其克隆、表达、纯化参考实施例7所述方法,纯化后蛋白SDS-PAGE分析结果见附图13A;纯化蛋白尺寸排阻层析(SEC)结果见附图13B,结果显示蛋白纯度达92.28%。
实施例16:PDGFRαD123-(GGGGS)3-PAS(600)-(GGGGS)3-VEGFR1D2/R2D3的克隆、表达和纯化
PDGFRαD123-(GGGGS)3-PAS(600)-(GGGGS)3-VEGFR1D2/R2D3,本申请中命名为EPS1114P,其克隆、表达、纯化参考实施例7所述方法,纯化后蛋白SDS-PAGE分析结果见附图14A;纯化蛋白尺寸排阻层析结果见附图14B,结果显示蛋白纯度达98.77%。
实施例17:VEGFR1D2/R2D3-(GGGGS)3-PAS(600)-(GGGGS)3-PDGFRαD123的克隆、表达和纯化
VEGFR1D2/R2D3-(GGGGS)3-PAS(600)-(GGGGS)3-PDGFRαD123,本申请中命名为EPS1115P,其克隆、表达、纯化参考实施例7所述方法,纯化后蛋白SDS-PAGE分析结果见附图15A;纯化蛋白尺寸排阻层析(SEC)结果见附图15B,结果显示蛋白纯度达99.58%。
实施例18:突变的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的克隆、表达和纯化
突变的PDGFRαD123-PAS(200)-VEGFR1D2/R2D3,本申请中命名为EPS1116P,其克隆、表达、纯化参考实施例7所述方法。
试验例19:与人VEGF/PDGF配体结合亲和力试验
1.检测方法
为了检测与VEGF的亲和力,待测的融合蛋白和参考蛋白用试剂稀释溶液对其进行了连续稀释,与人VEGF165配体混合(50pM最终浓度),并在室温下以每小时300转的速度孵化1小时。然后,通过人VEGF-specific ELISA测定游离VEGF165的量(Human VEGF DuoSetELISA kit,R&D Systems,CAT.No.DY293B-05).
为了检测与PDGF-BB的亲合力,待测的融合蛋白和参考蛋白用试剂稀释溶液对其进行了连续稀释,与人PDGF-BB配体混合(1ng/ml最后浓度),在室温下以每小时300转的速度进行孵化1小时。然后,通过人PDGF-BB-specificELISA测定游离PDGF-BB的(Human PDGF-BB DuoSet ELISA kit,R&D Systems,CAT.No.DY220)。
2、检测过程:
2.1、试剂准备
2.1.1涂层缓冲液
PBS:137mM NaCl,2.7mM KCl,8.1mM Na2HPO4、1.5mM KH2PO4,pH 7.2-7.4,通过0.2μm过滤器过滤。
2.1.2洗涤缓冲液
将9.55g PBS溶解于Milli-Q水中,使总体积增至1L,其中包含0.05%Tween20(v/v),并将pH值调节至7.4。
2.1.3阻塞缓冲区
将3g牛血清白蛋白(BSA)添加到100mL PBS中。
2.1.4试剂稀释液
将1g牛血清白蛋白(BSA)添加到100mL PBS中。
2.1.5终止溶液
向Mill-Q水中添加81.4mL的36-38%盐酸,使总体积达到1L。
2.2、过程
2.2.1镀膜
使用PBS将捕获的抗体稀释至工作浓度(400ng/mL),将其立即转移到96孔微孔板中,100μL/孔。密封板并在室温下孵育过夜。
2.2.2洗涤
吸取每个孔并用洗涤缓冲液(300μL)洗涤,重复此过程两次。
2.2.3阻止
通过向每个孔中添加300μL封闭缓冲液封闭平板,在室温下培养1小时。
2.2.4样品制备和预培养
为了制备亲和力样品,分别用试剂稀释液分别稀释测试融合蛋白(EPS1103P,EPS1104P,EPS1105P,EPS1106P,EPS1107P,EPS1108P,EPS1109P,EPS1110P,EPS1111P,EPS1113P,EPS1114P,EPS1115P或EPS1116P)或参考蛋白(Aflibercept),将其与人VEGF165配体(最终浓度为50pM)或人PDGFBB配体(最终浓度为1ng/ml)混合,并在室温下于300RPM的振荡器上培养1小时。
为了制备标准样品,分别使用试剂稀释液(2000、1000、500、250、125、62.5和31.25pg/ml)以2倍系列稀释液稀释PDGF-BB或VEGF165
2.2.5样品培育
每孔将100μL样品溶液转移到包被的测定板中,所有样品重复两次。将测定板用乙酸酯板密封剂覆盖,并将板在设定为500rpm的振荡器上于室温培育2小时,将板洗涤3次。
2.2.6用检测抗体一起培育
将100μL稀释的检测抗体添加到板的每个孔中,然后用新的胶条覆盖,并在设定为500rpm的振荡器上于室温下培育1小时;将孔洗涤3遍。
2.2.7用链霉亲和素-HRP培育
将100μL预先制备的链霉亲和素-HRP溶液添加到每个孔中,然后用新的胶条覆盖,并在室温下孵育30分钟;将孔洗涤3遍。
2.2.8用底物溶液培育(TMB)
将100μL底物溶液添加到每个孔中,在室温下孵育10分钟。
2.2.9添加终止液(1N HCl)
与TMB孵育10分钟后,向每个孔中加入100μL终止溶液(1N HCl),轻轻敲打板以确保充分混合。
2.2.10读板
立即使用配备SoftMax Pro 6.5.1 GxP的Molecular Devices M2E读板器(分别设置在450nm和570nm处)确定每个孔的光密度;从450nm的读数中减去570nm的读数,得到每个孔的光密度。
2.2.11数据分析
使用4个参数曲线和吸光度值计算未结合的人VEGF165或PDGF-BB。并使用未结合的人VEGF165或PDGF-BB的4个参数曲线计算被测融合蛋白和参比的IC50。
3.结果
表1.与VEGF165/PDGFBB配体的亲和力(IC50)
分析物 Human VEGF165(M) Human PDGFBB(M)
Aflibercept 9.82E-12 --*
EPS1108P 3.20E-10 6.63E-8
EPS1103P 8.69E-10 TBD
EPS1104P 4.95E-10 TBD
EPS1105P 5.46E-10 TBD
EPS1106P 5.55E-10 TBD
EPS1107P 3.04E-10 TBD
EPS1109P 2.18E-10 TBD
EPS1110P 3.31E-10 TBD
EPS1111P TBD TBD
EPS1113P 6.46E-10 TBD
EPS1114P 5.06E-10 TBD
EPS1115P 4.40E-10 TBD
EPS1116P TBD TBD
*:未检测到亲和力。
4、试验结论:
本发明融合蛋白和参考蛋白均能与人VEGF165结合,且均具有很高的亲和力水平;仅本发明融合蛋白能和人PDGFBB结合,且具有很高的亲和力水平。
试验例20、VEGF诱导的HUVEC细胞增殖抑制试验
1、检测方法
1.1、设计了三组,分别为空白对照组,模型对照组(VEGF对照)和测试样品(TAs)组。将样品一式三份进行测试,并重复试验3次。
1.2、取对数生长期的HUVEC细胞,制备单细胞悬浮液。
1.3、以基础培养液调整细胞浓度为5×104个/ml,接种于96孔细胞培养板,体积为100μL/孔,空白对照组则加入100μL/孔PBS,置于37℃、5%CO2培养箱培养过夜(细胞饥饿处理)。
1.4、用完全培养基与基础培养基以体积比1:16混合作为样品稀释培养基,对供试品/对照品和VEGF165进行系列稀释,供试品和对照品终浓度根据预实验结果确定,VEGF165终浓度为25ng/mL。加入不同浓度的供试品与对照品100μL/孔,置于37℃、5%CO2培养箱继续培养72h;
1.5、在检测时间点,每孔加入20μL CCK-8溶液,继续培养4~6h;(根据细胞生长特性适当调整)。
1.6、于酶标仪检测450nm波长的吸光度(OD值)。
1.7、每组的IC50用graphpad pyramid 5软件(GraphPad Software,Inc)计算。
2、结果:
表2:每组样品对HUVEC细胞增殖的抑制作用
3、结论:
本发明所有待测样品(EPS1108P、EPS1105P、EPS1106P和EPS1107P)对VEGF165诱导的HUVEC细胞增殖具有较强的抑制作用。
试验例21、样品对斑马鱼新生血管的抑制作用
1、试验方法:
血管生成导致斑马鱼胚胎干管的内段血管(ISV)的形成,因此它被用来作为一种人类疾病模型来研究抗血管增生化合物的作用。
试验过程:
在28hpf收集Tg(Flk1-GFP)转基因斑马鱼胚胎,使用链酶蛋白酶E溶液脱去卵膜(山东科学院生物研究所)。在体视显微镜下挑选正常的斑马鱼胚胎,并用200μg/ml的三卡因进行麻醉,利用显微注射仪进行注射给药,分别将不同浓度(500,250,25,2.5μg/ml)药物10nL注入斑马鱼体内,移入24孔培养板中,每孔8-10枚,每次每组三个重复孔。然后加盖,置于光照培养箱(28℃)让胚胎继续发育。在48hpf时,荧光显微镜观察,计算节间血管生成长度,并观察胚胎死亡或畸形情况。
2、结果
各组均未发现胚胎死亡或畸形情况,节间血管长度见下表(表3):
表3:对斑马鱼节间血管生长的影响
/>
*与溶剂对照组比较,有统计学差异(p<0.05)
**与溶剂对照组比较,有显著的统计学差异(p<0.01)
3、结论:
与溶剂对照组Tg(Flk1-GFP)转基因斑马鱼胚胎比较,本发明样品EPS1108P,EPS1104P,EPS1107P,EPS1113P,EPS1114P和EPS1115显著缩短斑马鱼节间血管长度(p<0.01),表明本发明待测融合蛋白能显著抑制斑马鱼胚胎节间血管的生长。
试验例22、样品对斑马鱼肿瘤血管生长抑制作用
1.方法
在本研究中,建立了新型的Tg(Flk1:EGFP)转基因斑马鱼异种移植肿瘤模型,其中可以清楚地区分单个绿色内皮细胞和红色肿瘤细胞。该模型可用于研究抗血管生成化合物对肿瘤新血管形成的抑制作用。
试验过程:
1.1斑马鱼异种移植肿瘤模型的建立
用pcDNA3.1质粒或编码人VEGFA的pcDNA3.1质粒转染B16-F10-mCherry肿瘤细胞,在48h培养和收获细胞,通过显微注射仪注射至Tg(Flk1:GFP)转基因斑马鱼胚胎(中国四川大学生物治疗国家重点实验室)卵周隙建立移植瘤模型,注射体积10nl,约含200个肿瘤细胞。
1.2组分配和给药剂量
斑马鱼被随机分为5组,分组情况如下表(表4)所示:
表4:样品对斑马鱼肿瘤血管生长抑制作用试验分组信息
/>
在植入肿瘤细胞后12h,通过电子调节气压显微注射器将10nL的EPS1108P溶液(250,1250μg/ml)注射到斑马鱼胚胎的卵黄囊中。注射EPS1108P后12小时,对各组斑马鱼进行肿瘤血管观察及激光共聚焦显微镜(Lieca SP5II)拍照记录,数据通过Image J和spss19.0单因素方差分析(ANOVA)进行统计,统计指标为肿瘤区域血管面积/肿瘤面积比值。
1.3数据分析
数据以均值±标准差表示,并通过SPSS19.0软件(IBM Corporation)进行分析。组间差异通过单向方差分析(ANOVA)确定。如果p<0.05,则认为比较具有统计学意义。确定显著差异后,进行最小显著差异测试以进行进一步分析。
2、实验结果:
表5:各组肿瘤区域血管面积与肿瘤面积比值(面积比%)
组别 面积比(肿瘤区域血管/肿瘤)%
空白对照组(BC) 28.54±6.61
载体对照组(VC) 25.91±5.61
hVEGFA对照组(VEC) 78.79±9.37a,b
EPS1108P-250μg/ml 54.12±1.48c
EPS1108P-1250μg/ml 46.38±2.28c
a:与空白对照组(BC)比较,差异具有统计学意义(p<0.05);
b:与载体对照组比较,差异具有统计学意义(p<0.05);
c:与模型对照组比较,差异具有统计学意义(p<0.05);
3、结论:
与空白对照组(BC)和载体对照组(VC)相比,模型对照组(VEC)组的面积(肿瘤血管/肿瘤)比率明显增加(p<0.05),结果表明hVEGFA显著诱导了肿瘤新血管形成,成功建立了斑马鱼中的斑马鱼异种移植肿瘤模型。
与模型对照组(VEC)相比,EPS1108P-250μg/ml和EPS1108P-1250μg/ml组的面积(肿瘤血管/肿瘤)比率明显降低(p<0.05),结果表明EPS1108P可以显著抑制由人VEGFA诱导的新生肿瘤血管形成。
试验例23、样品在大鼠体内半衰期检测
1、试验方法和过程
1.1动物研究
SD大鼠(成都达硕生物科技有限公司,动物生产许可证号SCXK[四川]2015-030),体重200-250g,随机分为4组,分组及给药如下表6所示:
表6:大鼠体内半衰期检测试验分组和给药剂量
组别 实验动物 数量(只) 给药途径 剂量 给药体积
EPS1108P SD大鼠,雄性 3 尾静脉注射 1mg/kg 4ml/kg
EPS1104P SD大鼠,雄性 3 尾静脉注射 1mg/kg 4ml/kg
EPS1113P SD大鼠,雄性 3 尾静脉注射 1mg/kg 4ml/kg
Aflibercept SD大鼠,雄性 3 尾静脉注射 1mg/kg 4ml/kg
本发明待测融合蛋白在无菌条件下,生理盐水稀释至终浓度为0.25mg/ml,
通过大鼠单次尾静脉注射给药静脉单剂量给药(1mg/kg);各组大鼠分别于时间点5min、1h、6h、24h、48h、96h、144h通过颈静脉采血,采血量为300μL。血样室温放置1h凝集,1000g离心15min,取上清。血清样品分装后放-80℃冰箱保存,避免反复冻融。使用ELISA分析血清样品。
1.2样品分析
1.2.1、将VEGF165配体(0.5μg/ml,R&D Systems,Cat.No.293-VE)包被于96孔板中,室温孵育过夜;
1.2.2、PBST洗板三次,用含3%BSA的PBS封闭,每孔300μL。37℃摇床孵育2h,同时封闭无包被的空白孔做对照。
1.2.3、PBST洗板三次,分别加入系列稀释的标准品(高纯度的待检测蛋白)和待检测血清,每孔100μL,37℃摇床孵育2h。
1.2.4、PBST洗板三次,将稀释后的检测抗体(450ng/ml)加入96孔板,每孔100μL,37℃摇床孵育2h。
1.2.5、PBST洗板三次,加入链霉素亲和素-HRP工作液(1:200稀释),每孔100μL,室温孵育20min,避光。
1.2.6、PBST洗板三次,加入TMB显色液,每孔100μL,室温孵育20min,避光。
1.2.7、加入终止液,每孔50μL。轻叩酶标板,确保溶液充分混合。
1.2.8、多功能酶标仪读取450nm波长处的OD值。
1.2.9、根据标准曲线方程和血清样品的OD值,计算血清样品中实际的药物浓度。
2、结果
使用DAS3.0软件(中国芜湖,皖南药科大学,药物与统计)中的非房室模型进行药代动力学参数计算,得到其半衰期(T1/2),结果如下:
表7:大鼠体内半衰期
3、结论:
本发明融合蛋白含有PDGFR区域和VEGFR区域,通过由脯氨酸、丙氨酸和丝氨酸组成的接头附接,在本文中称为“PAS”接头,EPS1108P、EPS1104P和EPS1113P中“PAS”接头分别由200、400和600个氨基酸残基组成,结果显示本发明融合蛋白大鼠单次尾静脉注射半衰期(T1/2)随“PAS”接头的长度增加而延长,其中EPS1113P在大鼠体内半衰期有明显的延长。
试验例24、EPS1108P对食蟹猴激光诱导的脉络膜新生血管形成(CNV)的抑制作用
1、建立激光诱导的CNV模型
1.1 CNV模型诱导
选取经筛选合格的动物进行双眼眼底激光光凝造模,以诱导食蟹猴CNV模型,光凝当天记为D1。
建模方法:通过双眼激光光凝术诱导脉络膜新生血管形成,每只眼有6-8个斑点。
过程:
1)瞳孔散大:将1-2滴0.5%的复方托吡卡胺滴眼液滴入动物的两只眼睛。
2)麻醉:用肌肉注射麻醉动物,避免角膜反射,四肢和腹肌松弛和稳定的呼吸显示为中度麻醉。
3)激光光凝:在激光光凝之前将卡波姆滴眼液(0.2%)输送到眼睛,然后将激光透镜适当地放在眼睛上以清晰观察眼底,在约1.5-2PD的眼周区域进行激光光凝距中心凹中心的椎间盘直径。注意避免任何可见的血管。激光参数如下:波长为532nm;功率400~500mW;光斑尺寸为50μm;曝光时间为100毫秒.
4)动物护理:激光光凝后,用氧氟沙星眼药膏涂抹动物的眼睛。将动物放在毯子上保暖,并在意识恢复后放回笼子。
1.2成功CNV的评估
造模后第13天(D14),通过眼底荧光造影(FFA)检查评估动物的眼底荧光渗漏情况,将食蟹猴CNV渗漏按严重程度分为4个等级。渗漏评级的4个等级:1级,光斑没有出现高荧光;2级,光斑高荧光但没有荧光渗漏;3级,光斑高荧光,轻度荧光渗漏,渗漏不超过光斑边缘;4级,光斑高荧光,重度荧光渗漏,渗漏超过光斑边缘。同时,将对4级病变的渗漏面积进行随机化测量。
2、分组
D15,挑选有4级渗漏光斑的动物入组,根据4级光斑平均渗漏面积和4级光斑率进行平均分组,保证在分组时各组动物眼底4级光斑平均渗漏面积和4级光斑率无显著差异,具体分组和给药方案见下表(表8):
表8:试验分组和给药方案
3、给药方案
剂量途径:玻璃体腔注射
剂量频率和持续时间:第15天单次给药。
剂量:50μL/只,双眼
给药方法:向每只动物的两只眼睛滴加1-2滴0.5%的复方托吡卡胺滴眼液,然后如CNV模型诱导中所述进行麻醉。麻醉后,将动物放在手术台上,用聚维酮碘消毒眼睛周围的角膜缘,睫毛,皮肤和头发。眼球完全暴露,在颞上或鼻缘后方2-3mm处小心注射玻璃体,以免损伤后晶状体囊和视网膜其他部分。注射后,将针头保持在玻璃体腔中2-5秒,然后缓慢拔出针头。拔出针头后,立即用聚维酮碘伏棉签按压注射点约10秒钟,头三天每天两次使用氧氟沙星眼药膏。在意识恢复前,将动物放在毯子上以保暖,在意识恢复后放回去。
4、眼科检查:
在眼科检查前,动物双眼先给予0.5%复方托吡卡胺滴眼液1-2滴散瞳,然后按照CNV模型诱导中的描述进行麻醉。。
4.1、一般眼科检查
进行了一般的眼科检查。普通眼科检查的观察内容包括眼睑,结膜,角膜,虹膜,巩膜,瞳孔,晶状体,玻璃体和眼底。
4.2眼底照相和荧光素血管造影(FP&FFA)
所有动物在造模前、造模后即刻(D1)、造模后13天(D14)、给药后1周(D22)、给药后2周(D29)、给药后3周(D36)和给药后4周(D43)进行一般眼科检查。在进行荧光血管造影之前,通过静脉内注射给予动物荧光素钠注射液(10mg/kg,100mg/mL)。
观察:比较早期和晚期FFA图像,以检测和测量CNV泄漏的证据和程度。如果存在CNV,则在激光点周围会产生高荧光,这种荧光会发展到后期扩散泄漏,并且在烧伤区域周围的浆液性分离中会积聚染料。泄漏按1到4的标准等级分级;在CNV成功评估中定义了评分分数。将4级病变定义为经典实验CNV模型的临床上明显的荧光渗漏,并测量渗漏面积。同时,每组4级病变的发生率通过以下公式计算:
4级病变率(%)=4级病变数/激光斑数量*100%
5、统计分析:
数据以平均值±SD表示,并通过SPSS13.0软件(IBM Corporation)进行分析。用方差分析确定各组平均值之间的差异。如果p<0.05,则认为比较具有统计学意义。确定显着差异后,进行最小显著差异测试以进行进一步分析。在p<0.05的方差异质性的情况下,执行Kruskal-Wallis检验。
6、结果:
所有动物在造模前进行了眼底照相和荧光造影检查,结果均无明显异常。造模后D14、D22、D29、D36和D43进行了眼底照相和荧光造影检查,各组动物眼底照相除可见激光光凝斑,均未发现其他异常。
6.1.1各组4级光斑率
各组4级光斑率见下表9:
表9:各组4级光斑率
注:n表示动物眼数。
a:与同期模型对照组比较,差异显著(p<0.05);
b:与同期阳性对照组比较,差异显著(p<0.05);
6.1.2各组平均荧光渗漏面积
各组平均荧光渗漏面积如表10所示:
表10:各组平均荧光渗漏面积
/>
注:n表示动物眼数。
a:与同期模型对照组比较,差异显著(p<0.05);
b:与同期阳性对照组比较,差异显著(p<0.05)。
7、试验结论:
眼底照相和荧光素血管造影(FP&FFA)结果表明,成功建立了动物眼激光诱导的CNV模型。通过单次玻璃体腔内注射(IVT)EPS1108P(250和500μg/眼),能够显著减少4级光斑率和荧光渗漏面积,且具有剂量效应关系,这表明EPS1108P是在食蟹猴模型中治疗CNV的潜在药物。
与阳性对照相比,EPS1108P在D36(给药后21d)和D43(给药后28d)的抑制作用与aflibercept相当。阳性对照可立即改善4级病变率和荧光素泄漏的平均面积,而EPS1108P更柔和,并可持续地抑制到与阳性对照相同的水平。
试验25、新西兰兔单次玻璃体腔注射给药药代动力学研究试验
1、试验方法和过程
1.1、动物研究
新西兰兔,2-2.5kg,雌雄不限,购自成都达硕实验动物有限公司(许可证号.SCXK[四川]2015-030)。所有兔子随机分成3组;分组和剂量信息如下表所示(表11):
表11分组和给药剂量
所有测试融合蛋白在无菌条件下用盐水稀释。
所有动物通过初步筛选入组,适应饲养7天。给药当天,分别给双眼滴加2滴盐酸奥布卡因滴眼液(#B2030,参天制药公司),用聚维酮碘在新西兰兔眼睫毛周围擦拭一遍。待麻醉效果起效后,用一次性无菌胰岛素注射器分别给各试验组注射待测融合蛋白(50μL/眼)。在注射给药后的注射后分别在以下第1、4、8、12、16和21天的时间点切开兔眼。收集玻璃体并立即在-80℃冷冻。通过ELISA测定分析玻璃体样品。
2、结果
通过使用Phoenix中的非房室模型来计算药代动力学参数(T1/2)。
表12各试验组蛋白在玻璃体内的半衰期
融合蛋白 T1/2(天)
EPS1108P 5.77
EPS1104P 8.72
Aflibercept 4.26
3、结论
本发明待测的融合蛋白包含PDGFR结构域和VEGFR结构域,它们通过由脯氨酸,丙氨酸和丝氨酸组成的接头连接,EPS1108P和EPS1104P中接头的长度(氨基酸残基数)分别为200和400。
结果表明,随着氨基酸残基长度的增加,融合蛋白在新西兰兔试验中显示的半衰期(T1/2)变长。与Aflibercept相比,其报道的半衰期为3.9天(Park SJ,Choi Y,Na YM等人,兔模型中玻璃体内阿柏西普(eylea)的眼内药代动力学。InvestOphthalmol VisSci.2016;57:2612–2617),EPS1108P和EPS1104P的T1/2都显著延长。半衰期明显延长意味着有可能成为长效药物,从而可以显著减少眼科患者的给药频率,降低眼睛感染的风险,减轻患者的痛苦和经济负担。
试验例26、天然PAGE和电动迁移率凝胶位移测定
将EPS1104P与VEGF165(#C083,Novoprotein,中国上海),PDGF-BB(#C199,Novoprotein,中国上海)和VEGF+PDGF-BB混合,并在冰浴中孵育30分钟。将上述三种培养混合物的40μL和EPS1104P分别加入10μl的5×上样缓冲液(#ES005,中国,上海,万圣浩天)中,并将这四个样品上样至Native PAGE泳道内(#NGSH2001-8T,中国,上海,万生浩天)。电泳在70V下运行6小时。通过使用考马斯蓝蛋白染色剂对凝胶染色,然后漂白。凝胶电泳图如附图16所示。
电泳图显示,通道2(EPS1104P+PDGF-BB)、3(EPS1104P+VEGF165)+和4(EPS1104P+VEGF165+PDGF-BB)的分子量大于通道1(EPS1104P)的分子量,表明EPS1104P可以单独与VEGF165或PDGF-BB结合形成稳定的复合物。也可以与VEGF165和PDGF-BB结合形成稳定的复合物。
试验例27、VEGF165诱导的HUVEC细胞增殖抑制试验
1、检测方法
1.1实验中建立了空白对照组,VEGF对照组和测试样品组(EPS1104P)。每组设置三个平行的孔,并将正式实验重复三次。
1.2收获在指数生长期生长的HUVEC细胞,并准备用于单细胞悬浮液。
1.3计数细胞并用基础培养基(#1001-b,Sciencell)调节至5×104细胞/mL的浓度。将100μL的细胞悬液接种到96孔板中。在37℃,5%CO2下孵育过夜(不添加饲料)。
1.4将稀释培养基与完全培养基(#1001,Sciencell)和基础培养基混合。将100μL不含VEGF165的稀释培养基加入空白对照组的孔中。将包含25ng/mL VEGF165的100μL稀释培养基添加至VEGF对照组的孔中。用含有25ng/mL VEGF165的稀释培养基将EPS1104P连续稀释至工作浓度(200nM,50nM,12.5nM,3.125nM,0.781nM,0.195nM,0.049nM和0.012nM)。添加100μL稀释的EPS1104P到测试样品组的孔中。将三组的96孔板在37℃,5%CO2下孵育72h。
1.5孵育后,向每个孔中加入20μL细胞计数试剂盒8(#CK04,Dojindo,上海),然后在培养箱中孵育2-3h。
1.6使用酶标仪(Thermofisher)在450nm处测量吸光度(OD值)。
1.7每组的IC50用Origin计算。
2、结果
表13.每组HUVEC细胞增殖抑制
样品 IC50(nM)
EPS1104P 1.43
3、结论
在VEGF165诱导的HUVEC细胞增殖抑制中,EPS1104P显示出了显著的抑制作用。
本公开涉及以下核苷酸和氨基酸序列。
本文提供的一些序列尤其可在NCBI数据库中获得,并且可从www.ncbi.nlm.nih.gov/sites/entrez?db=gene检索;这些序列也涉及注释和修饰的序列。本文提供了技术和方法,其中使用本文提供的简明序列的同源序列和变体。优选地,此类“变体”是遗传性变体。
SEQ ID No.1:编码PAS接头的核苷酸序列
gcctctcctgctgcccctgccccagcttctccagctgctcctgcaccttctgctccagccgctagtcctgcagctccagctcctgcttctcctgccgcaccagcacctagtgcccctgctgcatcaccagcagctcccgcacccgctagcccagctgcaccagctccaagtgctccagcagcttcacccgcagcacccgctccagcaagtccagcagccccagccccttcagcaccagctgcatctcccgcagcccctgctcctgccagccctgccgctcctgctccaagcgctcctgctgctagtccagccgcccctgcaccagcaagtcctgctgctcccgcacctagtgcaccagcagcaagccctgcagctcctgcaccagcatctccagcagcaccagcaccatcagcccctgccgcttctcccgcagctccagccccagcctcccctgctgctccagccccctctgctcctgcagcatctcctgccgctcccgcccctgcaagtcccgccgctccagcaccatccgctccagctgcttccccagccgctccagctccagctagccccgcagcccccgcaccatctgccccagca
SEQ ID No.2:PAS接头的氨基酸序列
ASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPA
SEQ ID No.3:编码PDGFRα的Ig结构域1至3的核苷酸序列
cagctgagcctgccctccatcctgcctaacgagaatgagaaggtggtgcagctgaactccagcttctccctgagatgctttggcgagtctgaggtgtcctggcagtacccaatgagcgaggaggagtcttccgacgtggagatccgcaatgaggagaacaattctggcctgttcgtgaccgtgctggaggtgagctctgcctccgccgctcacaccggcctgtacacatgttactataaccatacccagacagaggagaatgagctggagggcagacacatctacatctatgtgcccgatcctgacgtggcctttgtgccactgggcatgaccgattacctggtcatcgtggaggacgatgacagcgccatcatcccctgcaggaccacagaccccgagacacctgtgacactgcataactctgagggcgtggtgccagccagctacgattctcggcagggcttcaatggcacctttacagtgggcccctatatctgtgaggccaccgtgaagggcaagaagttccagacaatcccttttaacgtgtacgccctgaaggctaccagcgagctggacctggagatggaggccctgaagacagtgtataagtctggcgagacaatcgtggtgacatgcgccgtgttcaacaatgaggtggtggatctgcagtggacctaccccggcgaggtgaagggcaagggcatcacaatgctggaggagatcaaggtgccttctatcaagctggtgtacaccctgacagtgccagaggccaccgtgaaggattccggcgactatgagtgtgccgctaggcaggctacccgggaggtgaaggagatgaagaaggtgacaatctctgtgcacgagaaggga
SEQ ID No.4:
PDGFRα的Ig结构域1至3的氨基酸序列
QLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKG
SEQ ID No.5:编码PDGFRβ的Ig结构域1至3的核苷酸序列
aacgatgccgaggaactgttcatcttcctgaccgagattaccgagatcacaatcccctgccgcgtgacagatcctcagctggtggttaccctgcatgagaagaaaggcgacgtggccctgcctgtgccttacgatcatcagagaggcttctccggcatcttcgaggaccggtcttacatctgcaagaccaccatcggcgacagagaggtggactccgacgcctactacgtgtacagactccaggtgtcctccatcaacgtgtccgtgaatgccgtgcagacagttgtgcggcagggcgagaatatcaccctgatgtgcatcgtgatcggcaacgaggtggtcaacttcgagtggacctatcctcggaaagaatctggccggctggtggaacctgtgaccgacttcctgctggacatgccctaccacatccggtctatcctgcacatcccttccgccgagctggaagattccggcacctacacctgtaacgtgaccgagtccgtgaacgaccaccaggacgagaaggccatcaatatcaccgtggtggaatccggctacgtgcggctgttgggagaagtgggcacactgcagtttgctgagctg
SEQ ID No.6:
PDGFRβ的Ig结构域1至3的氨基酸序列
NDAEELFIFLTEITEITIPCRVTDPQLVVTLHEKKGDVALPVPYDHQRGFSGIFEDRSYICKTTIGDREVDSDAYYVYRLQVSSINVSVNAVQTVVRQGENITLMCIVIGNEVVNFEWTYPRKESGRLVEPVTDFLLDMPYHIRSILHIPSAELEDSGTYTCNVTESVNDHQDEKAINITVVESGYVRLLGEVGTLQFAEL
SEQ ID No.7:
编码VEGFR-1的Ig结构域2和VEGFR-2的Ig结构域3的核苷酸序列
agtgataccggtagacctttcgtagagatgtacagtgaaatccccgaaattatacacatgactgaaggaagggagctcgtcattccctgccgggttacgtcacctaacatcactgttactttaaaaaagtttccacttgacactttgatccctgatggaaaacgcataatctgggacagtagaaagggcttcatcatatcaaatgcaacgtacaaagaaatagggcttctgacctgtgaagcaacagtcaatgggcatttgtataagacaaactatctcacacatcgacaaaccaatacaatcatagatgtggttctgagtccgtctcatggaattgaactatctgttggagaaaagctcgtcttaaattgtacagcaagaactgaactaaatgtggggattgacttcaactgggaatacccttcttcgaagcatcagcataagaaacttgtaaaccgagacctaaaaacccagtctgggagtgagatgaagaaatttttgagcaccttaactatagatggtgtaacccggagtgaccaaggattgtacacctgtgcagcatccagtgggctgatgaccaagaagaacagcacatttgtcagggtccatgaaaag
SEQ ID No.8:
VEGFR-1的Ig结构域2和VEGFR-2的Ig结构域3的氨基酸序列
SDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEK
SEQ ID No.9:
编码N末端信号肽序列的核苷酸序列
atggggacttcccatccggcgttcctggtcttaggctgtcttctcacagggctgagcctaatcctctgc
SEQ ID No.10:
N末端信号肽序列的氨基酸序列
MGTSHPAFLVLGCLLTGLSLILC
SEQ ID No.11:
编码纯化标签的核苷酸序列
caccatcaccatcaccacgcc
SEQ ID No.12:
纯化标签的氨基酸序列
HHHHHHA
SEQ ID No.13:
载体pDSG33-PDGFR-PAS200-VEGFR的核苷酸序列(7190bp)
acccacaatggggacttcccatccggcgttcctggtcttaggctgtcttctcacagggctgagcctaatcctctgccagctttcattaccctctatccttccaaatgaaaatgaaaaggttgtgcagctgaattcatccttttctctgagatgctttggggagagtgaagtgagctggcagtaccccatgtctgaagaagagtcttccgatgtggaaatcagaaatgaagaaaacaacagcggcctttttgtgacggtcttggaagtgagcagtgcctcggcggcccacacagggttgtacacttgctattacaaccacactcagacagaagagaatgagcttgaaggcaggcacatttacatctatgtgccagacccagatgtagcctttgtacctctaggaatgacggattatttagtcatcgtggaggatgatgattctgccattataccttgtcgcacaactgatcccgagactcctgtaaccttacacaacagtgagggggtggtacctgcctcctacgacagcagacagggctttaatgggaccttcactgtagggccctatatctgtgaggccaccgtcaaaggaaagaagttccagaccatcccatttaatgtttatgctttaaaagcaacatcagagctggatctagaaatggaagctcttaaaaccgtgtataagtcaggggaaacgattgtggtcacctgtgctgtttttaacaatgaggtggttgaccttcaatggacttaccctggagaagtgaaaggcaaaggcatcacaatgctggaagaaatcaaagtcccatccatcaaattggtgtacactttgacggtccccgaggccacggtgaaagacagtggagattacgaatgtgctgcccgccaggctaccagggaggtcaaagaaatgaagaaagtcactatttctgtccatgagaaaggtgcctctcctgctgcccctgccccagcttctccagctgctcctgcaccttctgctccagccgctagtcctgcagctccagctcctgcttctcctgccgcaccagcacctagtgcccctgctgcatcaccagcagctcccgcacccgctagcccagctgcaccagctccaagtgctccagcagcttcacccgcagcacccgctccagcaagtccagcagccccagccccttcagcaccagctgcatctcccgcagcccctgctcctgccagccctgccgctcctgctccaagcgctcctgctgctagtccagccgcccctgcaccagcaagtcctgctgctcccgcacctagtgcaccagcagcaagccctgcagctcctgcaccagcatctccagcagcaccagcaccatcagcccctgccgcttctcccgcagctccagccccagcctcccctgctgctccagccccctctgctcctgcagcatctcctgccgctcccgcccctgcaagtcccgccgctccagcaccatccgctccagctgcttccccagccgctccagctccagctagccccgcagcccccgcaccatctgccccagcagccagtgataccggtagacctttcgtagagatgtacagtgaaatccccgaaattatacacatgactgaaggaagggagctcgtcattccctgccgggttacgtcacctaacatcactgttactttaaaaaagtttccacttgacactttgatccctgatggaaaacgcataatctgggacagtagaaagggcttcatcatatcaaatgcaacgtacaaagaaatagggcttctgacctgtgaagcaacagtcaatgggcatttgtataagacaaactatctcacacatcgacaaaccaatacaatcatagatgtggttctgagtccgtctcatggaattgaactatctgttggagaaaagctcgtcttaaattgtacagcaagaactgaactaaatgtggggattgacttcaactgggaatacccttcttcgaagcatcagcataagaaacttgtaaaccgagacctaaaaacccagtctgggagtgagatgaagaaatttttgagcaccttaactatagatggtgtaacccggagtgaccaaggattgtacacctgtgcagcatccagtgggctgatgaccaagaagaacagcacatttgtcagggtccatgaaaagcaccatcaccatcaccacgcctgaagagcttaagcttgcggccgcagatctagcttaagtttaaaccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagcttggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtctaggttcacctaagaatgggagcaaccagcaggaaaaggacaagcagcgaaaattcacgcccccttgggaggtggcggcatatgcaaaggatagcactcccactctactactgggtatcatatgctgactgtatatgcatgaggatagcatatgctacccggatacagattaggatagcatatactacccagatatagattaggatagcatatgctacccagatatagattaggatagcctatgctacccagatataaattaggatagcatatactacccagatatagattaggatagcatatgctacccagatatagattaggatagcctatgctacccagatatagattaggatagcatatgctacccagatatagattaggatagcatatgctatccagatatttgggtagtatatgctacccagatataaattaggatagcatatactaccctaatctctattaggatagcatatgctacccggatacagattaggatagcatatactacccagatatagattaggatagcatatgctacccagatatagattaggatagcctatgctacccagatataaattaggatagcatatactacccagatatagattaggatagcatatgctacccagatatagattaggatagcctatgctacccagatatagattaggatagcatatgctatccagatatttgggtagtatatgctacccatggcaacattagcccaccgtgctctcagcgacctcgtgaatatgaggaccaacaaccctgtgcttggcgctcaggcgcaagtgtgtgtaatttgtcctccagatcgcagcaatcgcgcccctatcttggcccgcccacctacttatgcaggtattccccggggtgccattagtggttttgtgggcaagtggtttgaccgcagtggttagcggggttacaatcagccaagttattacacccttattttacagtccaaaaccgcagggcggcgtgtgggggctgacgcgtgcccccactccacaatttcaaaaaaaagagtggccacttgtctttgtttatgggccccattggcgtggagccccgtttaattttcgggggtgttagagacaaccagtggagtccgctgctgtcggcgtccactctctttccccttgttacaaatagagtgtaacaacatggttcacctgtcttggtccctgcctgggacacatcttaataaccccagtatcatattgcactaggattatgtgttgcccatagccataaattcgtgtgagatggacatccagtctttacggcttgtccccaccccatggatttctattgttaaagatattcagaatgtttcattcctacactagtatttattgcccaaggggtttgtgagggttatattggtgtcatagcacaatgccaccactgaaccccccgtccaaattttattctgggggcgtcacctgaaaccttgttttcgagcacctcacatacaccttactgttcacaactcagcagttattctattagctaaacgaaggagaatgaagaagcaggcgaagattcaggagagttcactgcccgctccttgatcttcagccactgcccttgtgactaaaatggttcactaccctcgtggaatcctgaccccatgtaaataaaaccgtgacagctcatggggtgggagatatcgctgttccttaggacccttttactaaccctaattcgatagcatatgcttcccgttgggtaacatatgctattgaattagggttagtctggatagtatatactactacccgggaagcatatgctacccgtttagggttaacaagggggccttataaacactattgctaatgccctcttgagggtccgcttatcggtagctacacaggcccctctgattgacgttggtgtagcctcccgtagtcttcctgggcccctgggaggtacatgtcccccagcattggtgtaagagcttcagccaagagttacacataaaggcaatgttgtgttgcagtccacagactgcaaagtctgctccaggatgaaagccactcagtgttggcaaatgtgcacatccatttataaggatgtcaactacagtcagagaacccctttgtgtttggtccccccccgtgtcacatgtggaacagggcccagttggcaagttgtaccaaccaactgaagggattacatgcactgccccgcattaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctctctggctaactagagaacccactgcttactggcttatcgaaattaatacgactcactatagggtctag
SEQ ID No.14:
编码蛋白质序列PDGFRαD123-PAS(200)-VEGFR1D2/R2D3(726个氨基酸;包括信号序列和纯化标签)的pDSG33-PDGFR-PAS200-VEGFR核苷酸8-2188的翻译
MGTSHPAFLVLGCLLTGLSLILCQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKHHHHHHA
SEQ ID No.15:
编码EPS1108P删除信号肽和纯化标签的核苷酸序列
cagctttcattaccctctatccttccaaatgaaaatgaaaaggttgtgcagctgaattcatccttttctctgagatgctttggggagagtgaagtgagctggcagtaccccatgtctgaagaagagtcttccgatgtggaaatcagaaatgaagaaaacaacagcggcctttttgtgacggtcttggaagtgagcagtgcctcggcggcccacacagggttgtacacttgctattacaaccacactcagacagaagagaatgagcttgaaggcaggcacatttacatctatgtgccagacccagatgtagcctttgtacctctaggaatgacggattatttagtcatcgtggaggatgatgattctgccattataccttgtcgcacaactgatcccgagactcctgtaaccttacacaacagtgagggggtggtacctgcctcctacgacagcagacagggctttaatgggaccttcactgtagggccctatatctgtgaggccaccgtcaaaggaaagaagttccagaccatcccatttaatgtttatgctttaaaagcaacatcagagctggatctagaaatggaagctcttaaaaccgtgtataagtcaggggaaacgattgtggtcacctgtgctgtttttaacaatgaggtggttgaccttcaatggacttaccctggagaagtgaaaggcaaaggcatcacaatgctggaagaaatcaaagtcccatccatcaaattggtgtacactttgacggtccccgaggccacggtgaaagacagtggagattacgaatgtgctgcccgccaggctaccagggaggtcaaagaaatgaagaaagtcactatttctgtccatgagaaaggtgcctctcctgctgcccctgccccagcttctccagctgctcctgcaccttctgctccagccgctagtcctgcagctccagctcctgcttctcctgccgcaccagcacctagtgcccctgctgcatcaccagcagctcccgcacccgctagcccagctgcaccagctccaagtgctccagcagcttcacccgcagcacccgctccagcaagtccagcagccccagccccttcagcaccagctgcatctcccgcagcccctgctcctgccagccctgccgctcctgctccaagcgctcctgctgctagtccagccgcccctgcaccagcaagtcctgctgctcccgcacctagtgcaccagcagcaagccctgcagctcctgcaccagcatctccagcagcaccagcaccatcagcccctgccgcttctcccgcagctccagccccagcctcccctgctgctccagccccctctgctcctgcagcatctcctgccgctcccgcccctgcaagtcccgccgctccagcaccatccgctccagctgcttccccagccgctccagctccagctagccccgcagcccccgcaccatctgccccagcagccagtgataccggtagacctttcgtagagatgtacagtgaaatccccgaaattatacacatgactgaaggaagggagctcgtcattccctgccgggttacgtcacctaacatcactgttactttaaaaaagtttccacttgacactttgatccctgatggaaaacgcataatctgggacagtagaaagggcttcatcatatcaaatgcaacgtacaaagaaatagggcttctgacctgtgaagcaacagtcaatgggcatttgtataagacaaactatctcacacatcgacaaaccaatacaatcatagatgtggttctgagtccgtctcatggaattgaactatctgttggagaaaagctcgtcttaaattgtacagcaagaactgaactaaatgtggggattgacttcaactgggaatacccttcttcgaagcatcagcataagaaacttgtaaaccgagacctaaaaacccagtctgggagtgagatgaagaaatttttgagcaccttaactatagatggtgtaacccggagtgaccaaggattgtacacctgtgcagcatccagtgggctgatgaccaagaagaacagcacatttgtcagggtccatgaaaag
SEQ ID No.16:
EPS1108P的氨基酸序列,删除信号肽和纯化标签
QLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEK
SEQ ID No.17:
用于克隆到pDSG33-PDGFR-PAS200-VEGFR的PDGFRαD123克隆位点-VEGFR1D2/R2D3的DNA序列(下划线为XbaI和HindIII的限制性酶切位点的序列)
tctagacccacaatggggacttcccatccggcgttcctggtcttaggctgtcttctcacagggctgagcctaatcctctgccagctttcattaccctctatccttccaaatgaaaatgaaaaggttgtgcagctgaattcatccttttctctgagatgctttggggagagtgaagtgagctggcagtaccccatgtctgaagaagagtcttccgatgtggaaatcagaaatgaagaaaacaacagcggcctttttgtgacggtcttggaagtgagcagtgcctcggcggcccacacagggttgtacacttgctattacaaccacactcagacagaagagaatgagcttgaaggcaggcacatttacatctatgtgccagacccagatgtagcctttgtacctctaggaatgacggattatttagtcatcgtggaggatgatgattctgccattataccttgtcgcacaactgatcccgagactcctgtaaccttacacaacagtgagggggtggtacctgcctcctacgacagcagacagggctttaatgggaccttcactgtagggccctatatctgtgaggccaccgtcaaaggaaagaagttccagaccatcccatttaatgtttatgctttaaaagcaacatcagagctggatctagaaatggaagctcttaaaaccgtgtataagtcaggggaaacgattgtggtcacctgtgctgtttttaacaatgaggtggttgaccttcaatggacttaccctggagaagtgaaaggcaaaggcatcacaatgctggaagaaatcaaagtcccatccatcaaattggtgtacactttgacggtccccgaggccacggtgaaagacagtggagattacgaatgtgctgcccgccaggctaccagggaggtcaaagaaatgaagaaagtcactatttctgtccatgagaaaggtgccagaagagcagatctgggctcttctgcccaccatcaccatcaccattaagcttgcggctcttctgccagtgataccggtagacctttcgtagagatgtacagtgaaatccccgaaattatacacatgactgaaggaagggagctctaagctt
SEQ ID No.18:
pDSG33-PDGFR-PAS200-VEGFR中PDGFRαD123-PAS(200)-VEGFR1D2/R2D3的DNA序列(序列两侧为XbaI和HindIII的限制性酶切位点;带下划线)
tctagacccacaatggggacttcccatccggcgttcctggtcttaggctgtcttctcacagggctgagcctaatcctctgccagctttcattaccctctatccttccaaatgaaaatgaaaaggttgtgcagctgaattcatccttttctctgagatgctttggggagagtgaagtgagctggcagtaccccatgtctgaagaagagtcttccgatgtggaaatcagaaatgaagaaaacaacagcggcctttttgtgacggtcttggaagtgagcagtgcctcggcggcccacacagggttgtacacttgctattacaaccacactcagacagaagagaatgagcttgaaggcaggcacatttacatctatgtgccagacccagatgtagcctttgtacctctaggaatgacggattatttagtcatcgtggaggatgatgattctgccattataccttgtcgcacaactgatcccgagactcctgtaaccttacacaacagtgagggggtggtacctgcctcctacgacagcagacagggctttaatgggaccttcactgtagggccctatatctgtgaggccaccgtcaaaggaaagaagttccagaccatcccatttaatgtttatgctttaaaagcaacatcagagctggatctagaaatggaagctcttaaaaccgtgtataagtcaggggaaacgattgtggtcacctgtgctgtttttaacaatgaggtggttgaccttcaatggacttaccctggagaagtgaaaggcaaaggcatcacaatgctggaagaaatcaaagtcccatccatcaaattggtgtacactttgacggtccccgaggccacggtgaaagacagtggagattacgaatgtgctgcccgccaggctaccagggaggtcaaagaaatgaagaaagtcactatttctgtccatgagaaaggtgcctctcctgctgcccctgccccagcttctccagctgctcctgcaccttctgctccagccgctagtcctgcagctccagctcctgcttctcctgccgcaccagcacctagtgcccctgctgcatcaccagcagctcccgcacccgctagcccagctgcaccagctccaagtgctccagcagcttcacccgcagcacccgctccagcaagtccagcagccccagccccttcagcaccagctgcatctcccgcagcccctgctcctgccagccctgccgctcctgctccaagcgctcctgctgctagtccagccgcccctgcaccagcaagtcctgctgctcccgcacctagtgcaccagcagcaagccctgcagctcctgcaccagcatctccagcagcaccagcaccatcagcccctgccgcttctcccgcagctccagccccagcctcccctgctgctccagccccctctgctcctgcagcatctcctgccgctcccgcccctgcaagtcccgccgctccagcaccatccgctccagctgcttccccagccgctccagctccagctagccccgcagcccccgcaccatctgccccagcagccagtgataccggtagacctttcgtagagatgtacagtgaaatccccgaaattatacacatgactgaaggaagggagctcgtcattccctgccgggttacgtcacctaacatcactgttactttaaaaaagtttccacttgacactttgatccctgatggaaaacgcataatctgggacagtagaaagggcttcatcatatcaaatgcaacgtacaaagaaatagggcttctgacctgtgaagcaacagtcaatgggcatttgtataagacaaactatctcacacatcgacaaaccaatacaatcatagatgtggttctgagtccgtctcatggaattgaactatctgttggagaaaagctcgtcttaaattgtacagcaagaactgaactaaatgtggggattgacttcaactgggaatacccttcttcgaagcatcagcataagaaacttgtaaaccgagacctaaaaacccagtctgggagtgagatgaagaaatttttgagcaccttaactatagatggtgtaacccggagtgaccaaggattgtacacctgtgcagcatccagtgggctgatgaccaagaagaacagcacatttgtcagggtccatgaaaagcaccatcaccatcaccacgcctgaagagcttaagctt
SEQ ID No.19:
编码突变的PDGFRα的Ig结构域1至3的核苷酸序列
cagctgagcctgccaagcatcctgcctaacgaaaatgagaaggtggtccagctgaacagctccttcagtctgagatgctttggcgaatcagaggtgagctggcagtacccaatgtcagaggaagagtctagtgacgtggaaattaggaatgaagagaacaattcaggactgttcgtgaccgtcctggaggtgtcaagcgccagcgccgctcacaccggactgtacacatgttactataaccatactcagaccgaagagaatgaactggaggggaggcacatctccatccacgtgcccgatcctgacgtggcctttgccccactgggaatgacagattacctggtcatcgtcgaggacgatgactctgccatcattccctgccgcacctcagactccgaaactcctgtgaccctgcataacagtgagggcgtggtccccgcctcctacgattctcgacagggattcaatggcaccttcaccgtcggaccctatatctgtgaggccactgtgaagggcaagaaattccagaccattccttttaacgtgtacgcactgaaagccacatccgaactggacctggaaatggaggccctgaagactgtctataaatctggagagactatcgtggtcacctgcgccgtgttcaacaatgaagtggtcgatgcgcagtggacttaccccggcgaggtcaagggcaaagggattaccatggacgaagagatcaaggtgcctagccagaagctggtgtacaccctgacagtcccagaagccaccgtgaaggattccggggactatgagtgtgcagcccggcaggcctccagagaagtgaaggagatgaagaaagtgacaatcagtgtccacgagaaagga
SEQ ID No.20:突变的PDGFRα的Ig结构域1至3的氨基酸序列
QLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHISIHVPDPDVAFAPLGMTDYLVIVEDDDSAIIPCRTSDSETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDAQWTYPGEVKGKGITMDEEIKVPSQKLVYTLTVPEATVKDSGDYECAARQASREVKEMKKVTISVHEKG
SEQ ID No.21:编码EPS1103P的核苷酸序列
atgggtacaagccatcccgccttcctggtcctgggttgcctgctgactggtctgtctctgatcctgtgccagctgagcctgccttcaatcctgcccaacgagaatgagaaggtggtgcagctgaactccagcttcagcctgagatgctttggcgagtctgaggtgtcctggcagtaccctatgtctgaggaggagtcttccgacgtggagatccgcaatgaggagaacaattccggcctgttcgtgaccgtgctggaggtgagctctgccagcgccgctcacaccggcctgtacacatgttactataaccatacccagacagaggagaatgagctggagggcagacacatctacatctatgtgcccgatcctgacgtggcctttgtgccactgggcatgaccgattacctggtcatcgtggaggacgatgactctgccatcatcccctgcaggaccacagacccagagacacccgtgacactgcataactccgagggagtggtgccagctagctacgattctcggcagggcttcaatggcacctttacagtgggcccctatatctgtgaggccaccgtgaagggcaagaagttccagacaatcccttttaacgtgtacgccctgaaggctacctctgagctggacctggagatggaggccctgaagacagtgtataagtccggcgagacaatcgtggtgacatgcgccgtgttcaacaatgaggtggtggatctgcagtggacctaccctggcgaggtgaagggcaagggcatcacaatgctggaggagatcaaggtgccttccatcaagctggtgtacaccctgacagtgccagaggccaccgtgaaggatagcggcgactatgagtgtgctgctaggcaggctaccagggaggtgaaggagatgaagaaggtgacaatctccgtgcacgagaagggagctagcccagctgctccagctccagctagccccgccgctcctgctccatctgctcctgctgcttccccagctgctcccgcccctgcttctcctgctgctccagctccatccgccccagctgcttctcctgccgctcctgccccagcttccccagccgctcccgccccttccgctccagccgcctctcccgccgcccctgctccagctagcccagcagccccagccccttctgctccagccgcctctccagccgcccctgctcccgcatcccccgccgcccccgccccttccgcccctgccgcctccccagctgccccagctcctgcctctcctgctgcccctgctccatccgctccagccgccagtcccgccgcccccgctccagctagcccagccgcaccagccccttctgctcccgccgcctctcccgccgcacctgctccagcatcccccgccgccccagccccttccgcccctgcagcctccccagctgcccccgctcctgcctctcctgcagcccctgctccttccgctccagccgcatctcccgccgccccagccccagctagcccagcagcaccagccccctctgctccagccgccagccctgccgcccctgctcccgcttcccccgccgccccagcaccttccgcccctgccgcatccccagcagcccccgctcctgccagccctgctgcccctgcaccttccgctccagccgcttctcccgccgccccagcacccgctagcccagctgcccctgccccttctgctccagcagcctctcctgccgcccctgctcctgcatcccccgccgcacccgccccttccgcccccgccgcctccccagctgcaccagctccagcctctccagctgctccagctccttccgccccagctagcgataccggccgcccttttgtggagatgtacagcgagatccccgagatcatccacatgaccgagggcagggagctggtcatcccatgccgggtgacatctcccaacatcaccgtgacactgaagaagttccctctggataccctgatcccagacggcaagagaatcatctgggactctcgcaagggctttatcatctccaatgccacatataaggagatcggcctgctgacctgcgaggctacagtgaacggccacctgtacaagaccaattatctgacacataggcagaccaacacaatcatcgatgtggtgctgagcccatctcatggcatcgagctgagcgtgggcgagaagctggtgctgaattgtaccgcccggacagagctgaacgtgggcatcgacttcaattgggagtacccttccagcaagcaccagcataagaagctggtgaacagagatctgaagacccagtccggcagcgagatgaagaagtttctgagcaccctgacaatcgatggcgtgacccgctctgaccagggcctgtatacatgtgccgcttcttccggcctgatgactaagaaaaactccacctttgtgcgggtccacgaaaaacaccaccaccaccaccat
SEQ ID No.22:EPS1103P的氨基酸序列
MGTSHPAFLVLGCLLTGLSLILCQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKHHHHHH
SEQ ID No.23:编码EPS1104P的核苷酸序列
atgggtacttcacatcctgcttttctggtcctgggttgtctgctgactggtctgagcctgatcctgtgccagctgagcctgccctccatcctgcctaacgagaatgagaaggtggtgcagctgaactccagcttctccctgagatgctttggcgagtctgaggtgtcctggcagtacccaatgagcgaggaggagtcttccgacgtggagatccgcaatgaggagaacaattctggcctgttcgtgaccgtgctggaggtgagctctgcctccgccgctcacaccggcctgtacacatgttactataaccatacccagacagaggagaatgagctggagggcagacacatctacatctatgtgcccgatcctgacgtggcctttgtgccactgggcatgaccgattacctggtcatcgtggaggacgatgacagcgccatcatcccctgcaggaccacagaccccgagacacctgtgacactgcataactctgagggcgtggtgccagccagctacgattctcggcagggcttcaatggcacctttacagtgggcccctatatctgtgaggccaccgtgaagggcaagaagttccagacaatcccttttaacgtgtacgccctgaaggctaccagcgagctggacctggagatggaggccctgaagacagtgtataagtctggcgagacaatcgtggtgacatgcgccgtgttcaacaatgaggtggtggatctgcagtggacctaccccggcgaggtgaagggcaagggcatcacaatgctggaggagatcaaggtgccttctatcaagctggtgtacaccctgacagtgccagaggccaccgtgaaggattccggcgactatgagtgtgccgctaggcaggctacccgggaggtgaaggagatgaagaaggtgacaatctctgtgcacgagaagggagcttccccagctgctccagctccagcttcccccgccgctcctgccccatctgctccagctgcctctccagctgctccagctcctgctagccctgccgctccagccccctccgcccctgccgcttctccagccgctcctgccccagctagccctgctgctccagctccttccgctccagccgcctctccagccgctccagcccccgcctctcctgctgccccagctccttctgctccagctgccagccccgccgcccctgcccccgcctctcccgctgcccctgctccttccgccccagctgcctcccctgctgctcctgccccagcttcacctgccgcccctgccccttccgctccagccgcatctcccgccgctccagcccccgcaagccctgcagccccagctccctctgctccagctgcctcacccgccgcccctgcccctgcctctcccgctgcccccgctccttccgccccagcagcctcccctgcagctcctgccccagcttctccagccgctcccgccccttccgctcccgccgcctctcctgctgcaccagcccccgcttccccagctgctcctgctccatccgccccagctgcttccccagctgctccagctccagcttcccccgccgctcctgccccatctgctccagctgcctctccagctgctccagctcctgctagccctgccgctccagccccctccgcccctgccgcttctccagccgctcctgccccagctagccctgctgctccagctccttccgctccagccgcctctccagccgctccagcccccgcctctcctgctgccccagctccttctgctccagctgccagccccgccgcccctgcccccgcctctcccgctgcccctgctccttccgccccagctgcctcccctgctgctcctgccccagcttcacctgccgcccctgccccttccgctccagccgcatctcccgccgctccagcccccgcaagccctgcagccccagctccctctgctccagctgcctcacccgccgcccctgcccctgcctctcccgctgcccccgctccttccgccccagcagcctcccctgcagctcctgccccagcttctccagccgctcccgccccttccgctcccgccgcctctcctgctgcaccagcccccgcttccccagctgctcctgctccatccgccccagctagcgataccggccgcccttttgtggagatgtacagcgagatccctgagatcatccacatgaccgagggcagggagctggtcatcccatgccgggtgacatctcccaacatcaccgtgacactgaagaagttccctctggataccctgatcccagacggcaagagaatcatctgggacagccgcaagggctttatcatctctaatgccacatataaggagatcggcctgctgacctgcgaggctacagtgaacggccacctgtacaagaccaattatctgacacataggcagaccaacacaatcatcgatgtggtgctgagcccctctcatggcatcgagctgtccgtgggcgagaagctggtgctgaattgtaccgcccggacagagctgaacgtgggcatcgacttcaattgggagtacccttccagcaagcaccagcataagaagctggtgaacagagatctgaagacccagtccggcagcgagatgaagaagtttctgtccaccctgacaatcgatggagtgacccgcagcgaccagggcctgtatacatgtgccgcttcttccggcctgatgactaagaaaaatagcacctttgtgagggtccacgaaaaacaccaccaccaccaccat
SEQ ID No.24:
EPS1104P的氨基酸序列
MGTSHPAFLVLGCLLTGLSLILCQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKHHHHHH
SEQ ID No.25:
编码EPS1105P的核苷酸序列
atggtctcttattgggacactggggtgctgctgtgcgccctgctgagttgcctgctgctgactggttcttcttccgggagcgataccggccgccccttcgtggagatgtacagcgagatccctgagatcatccacatgaccgagggcagggagctggtcatcccttgccgggtgacatctccaaacatcaccgtgacactgaagaagttccccctggataccctgatccctgacggcaagagaatcatctgggactctcgcaagggctttatcatctccaatgccacctataaggagatcggcctgctgacctgcgaggctacagtgaacggccacctgtacaagaccaattatctgacacatcggcagaccaacacaatcatcgatgtggtgctgagcccttctcatggcatcgagctgtccgtgggcgagaagctggtgctgaattgtaccgccagaacagagctgaacgtgggcatcgatttcaattgggagtacccatccagcaagcaccagcataagaagctggtgaacagggacctgaagacccagtccggcagcgagatgaagaagtttctgtctaccctgacaatcgatggagtgacccgctccgaccagggcctgtatacatgtgccgcttcttccggcctgatgaccaagaagaatagcacatttgtgagggtgcacgagaaggcctccccagctgctccagctcctgctagcccagccgctccagccccctctgctccagccgcttcccccgccgctcctgccccagcttctccagccgctcccgccccttccgcccctgccgcttctcctgctgctccagcccctgcctctcctgccgctcctgccccatccgctcccgccgctagccctgccgctcccgcccctgctagccctgctgcccctgctccttctgctcctgctgcctctccagctgccccagctcctgcctcccctgctgcccctgcaccatccgccccagccgcttctcctgcagctccagcccctgccagccctgctgccccagctccttccgctcctgctgccagtccagctgcccctgctcctgctagccctgctgcacctgctccttctgctcccgctgcctctccagctgcaccagctcctgcctcccccgctgcccctgctccatccgcccccgccgcttctcctgccgccccagcccctgcctctccagctgctccagctccctccgctcctgctgccagcccagctgcccctgcacctgctagccctgctgctcctgccccctctgccccagctcagctgtctctgccatccatcctgcccaacgagaatgagaaggtggtgcagctgaacagctctttctctctgcggtgctttggcgagagcgaggtgtcttggcagtaccccatgtccgaggaggagtccagcgacgtggagatcagaaatgaggagaacaatagcggcctgttcgtgaccgtgctggaggtgtcttccgcctctgccgctcacaccggcctgtacacatgttactataaccatacccagacagaggagaatgagctggagggccggcacatctacatctatgtgcctgatccagacgtggcctttgtgcccctgggcatgaccgattacctggtcatcgtggaggacgatgactccgccatcatcccttgccgcaccacagaccccgagacacctgtgacactgcataacagcgagggagtggtgccagcttcctacgatagcaggcagggcttcaatggcacctttacagtgggcccttatatctgtgaggccaccgtgaagggcaagaagttccagacaatccccttcaacgtgtacgccctgaaggctacctccgagctggacctggagatggaggccctgaagacagtgtataagagcggcgagacaatcgtggtgacatgcgccgtgttcaacaatgaggtggtggatctgcagtggacctaccctggcgaggtgaagggcaagggcatcacaatgctggaggagatcaaggtgccaagcatcaagctggtgtacaccctgacagtgcccgaggccaccgtgaaggattctggcgactatgagtgtgccgctaggcaggctacacgggaggtgaaagaaatgaagaaggtcacaatcagcgtccacgaaaaggggcatcaccaccaccaccat
SEQ ID No.26:
EPS1105P的氨基酸序列
MVSYWDTGVLLCALLSCLLLTGSSSGSDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGHHHHHH
SEQ ID No.27:
编码EPS1106P的核苷酸序列
atgggcaccagccatcctgcttttctggtgctgggatgcctgctgaccggcctgtctctgattctgtgccagctgtccctgccttccatcctgcctaacgagaacgagaaggtggtgcagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggactgtacacctgttactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccctgccggaccacagatcctgagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctaccgtgaagggcaagaagttccagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagccctgaaaaccgtgtacaagagcggcgagacaatcgtcgtgacctgcgccgtgttcaacaacgaggtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcaccatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccacagtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagagatgaagaaagtcaccatctccgtgcacgagaaaggcggcggaggcggaagcggtggcggaggaagcggaggcggcggatctgcttctcctgctgctccagctccagcttctccagcagctcctgcaccttctgcaccagctgcaagtcctgcagcacccgcaccagctagtcctgccgctcctgctcctagtgctcctgccgcaagtccagctgctcccgctcctgcatcaccagccgcaccagcaccaagtgctccagctgcctctccagcagcaccagctccagcaagccctgctgcaccagcaccttcagctccagcagcatcacccgctgcacccgctccagcatctcccgctgctccagcaccaagcgcacccgctgctagcccagccgctccagctcctgccagtcctgctgctcctgcaccatctgctcccgcagcttcaccagctgctcccgcaccagctagcccagcagcaccagcaccatctgcacccgccgcatctcccgccgcaccagctccagctagtcccgcagctcccgctccatctgctccagccgctagtcccgctgctcctgctccagctagtcctgctgcacccgctcctagcgcaccagctgcttcacccgcagctccagctccagcttcacccgctgcaccagctccatctgctccagctggtggcggaggatctggcggaggcggatctggcggcggtggttcttctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccttgcagagtgacctctcctaacatcacagtgaccctgaagaagtttcccctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggactgctgacctgcgaagccactgtgaacggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagagaaactggtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtaccccagctccaaacaccagcacaagaagctggtcaaccgggatctgaaaacccagtccggctccgaaatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggcctgtatacctgtgccgcctcttctggcctgatgaccaagaaaaactccaccttcgtgcgggtccacgagaagcaccatcaccaccatcat
SEQ ID No.28:
EPS1106P的氨基酸序列
MGTSHPAFLVLGCLLTGLSLILCQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGGGGGSGGGGSGGGGSASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAGGGGSGGGGSGGGGSSDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKHHHHHH
SEQ ID No.29:
编码EPS1107P的核苷酸序列
atggtgtcctactgggatacaggcgtgctgctgtgtgccctgctgtcttgtctgctgctgaccggctcctcttctggctctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccctgcagagtgacctctcctaacatcaccgtgactctgaagaagttccctctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggcctgctgacctgcgaggccaccgttaatggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagaaaagctggtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtacccctccagcaagcaccagcacaagaagctggtcaaccgggacctgaaaacccagtccggctccgagatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggcctgtatacctgcgccgcttcctctggcctgatgaccaagaaaaactccaccttcgtgcgggtgcacgagaaaggtggcggaggatctggcggaggcggctctggcggcggtggatctgcttctcctgctgctccagctccagcttctccagcagctcctgcaccttctgcaccagctgcaagtcctgcagcacccgcaccagctagtcctgccgctcctgctcctagtgctcctgccgcaagtccagctgctcccgctcctgcaagcccagctgcaccagcaccaagtgctccagctgcctcaccagccgcaccagctccagcaagccctgcagctcccgctccttcagctcctgctgcttctcccgcagcacccgctccagcatcaccagccgctccagcaccatcagctccagcagcatctcctgcagctccagctcctgctagtcccgctgctcccgcacctagtgcaccagccgcttctcccgccgctcctgctcctgcatctcctgctgcacccgctccatctgctcccgccgcatcacccgcagctcccgcaccagcctctccagctgcaccagctcctagcgcaccagcagctagcccagctgctcctgcaccagctagccccgcagctccagctccaagcgctcctgctgcatccccagctgctccagctcctgcctcaccagctgctccagcaccttctgctcccgctggcggtggcggaagcggaggtggtggtagtggcggcggaggttctcagctgtccctgccttctatcctgcctaacgagaacgagaaggtggtccagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggcctgtacacatgctactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccttgccggaccaccgatccagagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctacagtgaagggcaagaagtttcagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagctctgaaaaccgtgtacaagtccggcgagacaatcgtcgtgacctgtgccgtgttcaacaacgaagtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcaccatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccactgtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagaaatgaagaaagtgaccatctccgtccacgagaagggccaccaccaccatcaccat
SEQ ID No.30:
EPS1107P的氨基酸序列
MVSYWDTGVLLCALLSCLLLTGSSSGSDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKGGGGSGGGGSGGGGSASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAGGGGSGGGGSGGGGSQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGHHHHHH
SEQ ID No.31:编码EPS1109P的核苷酸序列
atgggctggtcctgcatcatcctgtttctggtggctaccgctaccggcgtgcactctcaccaccatcaccatcacgcttctccagccgctccagctcctgcttctcctgctgcaccagcaccatctgctccagctgcaagtccagctgctcccgcaccagcaagtcctgcagcacccgctcctagtgctccagcagcatctcccgcagcaccagctccagcttcaccagcagctcccgctccatcagcaccagccgcatcacccgctgctccagcaccagcttctcccgccgctcctgcaccttctgcacccgcagctagccctgctgctcctgctccagcatctccagctgcacccgctccaagcgcacccgctgctagtccagcagcaccagcaccagctagtcccgctgctccagctccttctgctccagcagcttcaccagccgctccagcaccagctagcccagccgcaccagcacctagtgctcccgccgctagtcctgcagctccagctcctgctagcccagctgctcccgctcctagcgctcctgccgcttcaccagctgcaccagctccagcaagtccagccgctcctgctccaagtgcaccagctgcctctccagctgctcctgctcctgcaagtcccgcagctccagcacctagcgcaccagcatctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccctgcagagtgacctctcctaacatcaccgtgactctgaagaagttccctctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggcctgctgacctgcgaggccaccgttaatggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagaaaagctcgtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtaccccagctccaaacaccagcacaagaaactggtcaaccgggacctgaaaacccagtccggctccgagatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggcctgtatacctgcgccgcttcttctggcctgatgaccaagaaaaactccaccttcgtgcgcgtgcacgagaagcagctgtccctgccttctatcctgcctaacgagaacgagaaggtggtccagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggcctgtacacatgctactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccttgccggaccaccgatccagagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctacagtgaagggcaagaagtttcagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagctctgaaaaccgtgtacaagtccggcgagacaatcgtcgtgacctgtgccgtgttcaacaacgaggtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcaccatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccactgtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagaaatgaagaaagtgaccatctccgtccacgagaagggc
SEQ ID No32:EPS1109P的氨基酸序列
MGWSCIILFLVATATGVHSHHHHHHASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKG
SEQ ID No.33:
编码EPS1110P的核苷酸序列
atgggctggtcctgcatcatcctgtttctggtggctaccgctaccggcgtgcactctcaccaccatcaccatcacgcttctccagccgctccagctcctgcttctcctgctgcaccagcaccatctgctccagctgcaagtccagctgctcccgcaccagcaagtcctgcagcacccgctcctagtgctccagcagcatctcccgcagcaccagctccagcttcaccagcagctcccgctccatcagcaccagccgcatcacccgctgctccagcaccagcttctcccgccgctcctgcaccttctgcacccgcagctagccctgctgctcctgctccagcatctccagctgcacccgctccaagcgcacccgctgctagtccagcagcaccagcaccagctagtcccgctgctccagctccttctgctccagcagcttcaccagccgctccagcaccagctagcccagccgcaccagcacctagtgctcccgccgctagtcctgcagctccagctcctgctagcccagctgctcccgctcctagcgctcctgccgcttcaccagctgcaccagctccagcaagtccagccgctcctgctccaagtgcaccagctgcctctccagctgctcctgctcctgcaagtcccgcagctccagcacctagcgcaccagctcaactgtccctgccttccatcctgcctaacgagaacgagaaggtggtccagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggcctgtacacctgttactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccctgccggaccacagatcctgagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctaccgtgaagggcaagaagttccagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagccctgaaaaccgtgtacaagtccggcgagacaatcgtcgtgacctgcgccgtgttcaacaacgaggtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcaccatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccacagtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagagatgaagaaagtcaccatctccgtgcacgagaagggctccgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccttgcagagtgacctctcctaacatcacagtgaccctgaagaagtttcccctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggcctgctgacctgtgaagccaccgtgaatggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgtccccaagccatggcatcgagctgtccgtgggagaaaagctcgtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtaccccagctccaaacaccagcacaagaaactggtcaaccgggacctcaagacccagtccggctccgaaatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggactgtatacctgtgccgcctcctctggcctgatgaccaagaaaaactccaccttcgtgcgggtccacgagaag
SEQ ID No.34:
EPS1110P的氨基酸序列
MGWSCIILFLVATATGVHSHHHHHHASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGSDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEK
SEQ ID No.35:
编码EPS1111P的核苷酸序列
atgggctggtcctgcatcatcctgtttctggtggctaccgctaccggcgtgcactctcaccaccatcaccatcacgcttctccagccgctccagctcctgcttctcctgctgcaccagcaccatctgctccagctgcaagtccagctgctcccgcaccagcaagtcctgcagcacccgctcctagtgctccagcagcatctcccgcagcaccagctccagcttcaccagcagctcccgctccatcagcaccagccgcatcacccgctgctccagcaccagcttctcccgccgctcctgcaccttctgcacccgcagctagccctgctgctcctgctccagcatctccagctgcacccgctccaagcgcacccgctgctagtccagcagcaccagcaccagctagtcccgctgctccagctccttctgctccagcagcttcaccagccgctccagcaccagctagcccagccgcaccagcacctagtgctcccgccgctagtcctgcagctccagctcctgctagcccagctgctcccgctcctagcgctcctgccgcttcaccagctgcaccagctccagcaagtccagccgctcctgctccaagtgcaccagctgcctctccagctgctcctgctcctgcaagtcccgcagctccagcacctagcgcaccagcatctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccctgcagagtgacctctcctaacatcaccgtgactctgaagaagttccctctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggcctgctgacctgcgaggccaccgttaatggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagaaaagctcgtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtaccccagctccaaacaccagcacaagaaactggtcaaccgggacctgaaaacccagtccggctccgagatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggcctgtatacctgcgccgcttcttctggcctgatgaccaagaaaaactccaccttcgtgcgcgtgcacgagaagaacgatgccgaggaactgttcatcttcctgaccgagattaccgagatcacaatcccctgccgcgtgacagatcctcagctggtggttaccctgcatgagaagaaaggcgacgtggccctgcctgtgccttacgatcatcagagaggcttctccggcatcttcgaggaccggtcttacatctgcaagaccaccatcggcgacagagaggtggactccgacgcctactacgtgtacagactccaggtgtcctccatcaacgtgtccgtgaatgccgtgcagacagttgtgcggcagggcgagaatatcaccctgatgtgcatcgtgatcggcaacgaggtggtcaacttcgagtggacctatcctcggaaagaatctggccggctggtggaacctgtgaccgacttcctgctggacatgccctaccacatccggtctatcctgcacatcccttccgccgagctggaagattccggcacctacacctgtaacgtgaccgagtccgtgaacgaccaccaggacgagaaggccatcaatatcaccgtggtggaatccggctacgtgcggctgttgggagaagtgggcacactgcagtttgctgagctg
SEQ ID No.36:
EPS1111P的氨基酸序列
MGWSCIILFLVATATGVHSHHHHHHASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKNDAEELFIFLTEITEITIPCRVTDPQLVVTLHEKKGDVALPVPYDHQRGFSGIFEDRSYICKTTIGDREVDSDAYYVYRLQVSSINVSVNAVQTVVRQGENITLMCIVIGNEVVNFEWTYPRKESGRLVEPVTDFLLDMPYHIRSILHIPSAELEDSGTYTCNVTESVNDHQDEKAINITVVESGYVRLLGEVGTLQFAEL
SEQ ID No.37:编码EPS1113P的核苷酸序列
atgggtacaagccatcccgccttcctggtcctgggttgcctgctgactggtctgtctctgatcctgtgccagctgtccctgccttctatcctgcctaacgagaacgagaaggtggtgcagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggcctgtacacctgttactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccctgccggaccacagatcctgagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctaccgtgaagggcaagaagttccagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagccctgaaaaccgtgtacaagtccggcgagacaatcgtcgtgacctgcgccgtgttcaacaacgaggtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcaccatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccacagtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagagatgaagaaagtcaccatctccgtgcacgagaagggcgcctctccagctgctcctgctccagctagtcctgcagctccagctccatctgcaccagctgcttctccagcagcacccgcaccagcttctcccgccgctcctgcacctagtgcaccagcagctagccctgctgcaccagcaccagcaagtccagccgcaccagctcctagtgctccagctgcatcccctgctgctcccgctcctgcttcaccagccgctccagcaccatcagctcccgcagcatctccagcagctccagctcctgcttctcctgctgcacccgctccatctgctcccgctgcaagtcctgctgctcctgcaccagcatcacccgcagctcccgcaccaagcgctccagccgcttcacccgcagcaccagctccagcctcaccagcagcaccagcaccttccgctccagctgctagtccagccgctcctgctcctgcaagccccgctgctccagctcctagcgcacccgctgctagccccgcagctcccgctccagcaagcccagcagctcctgctccttctgctccagcagcatctcctgccgcaccagctccagctagcccagctgctcccgcaccatccgcaccagcagcaagtcccgcagctccagcaccagctagtcccgcagcacccgcaccttcagcaccagccgcatcaccagctgctccagctccagcatctcccgctgcaccagcaccaagtgctcccgctgcttctcctgcagctcctgctccagcctctccagctgctcccgcaccttctgctccagctgcctctccagctgctccagcaccagcttcaccagctgctcccgctcctagtgctcctgccgctagtccagcagctcccgcaccagctagccctgccgctcctgctccaagtgctccagccgcaagtcccgctgcacccgctccagcttctccagcagctcccgctccaagcgcacccgcagcttctcccgctgctcccgcaccagcaagtcctgctgctccagctccttcagctcctgccgcttctcctgctgctccagctcctgcaagtccagctgctccagcaccaagtgcaccagcagcaagtccagctgctcctgctcctgcctctccagcagcaccagctcctagcgcaccagccgccagtcctgcagcaccagctccagcttctcccgctgctcctgctccttcagcaccagctgctagtcctgctgctcctgctccagcttctcctgccgctccagcaccaagcgctccagctgcatctcccgcagctcccgctccagcatctcctgcagcacccgcaccatcagctccagctgcttccccagccgctcctgcaccagctagcccagcagctcctgcacctagcgctcccgctgcttcaccagcagctccagcaccagccagtccagctgctcctgcaccatctgcacccgctgctagtcccgctgctccagctcctgctagccctgcagcaccagctccaagtgcacccgccgcatcacccgccgcaccagcaccagcaagccctgcagcacccgctccaagcgctccagctgctagcccagcagcaccagcaccagcatcaccagccgctccagcaccttctgcaccagcagcttcacccgctgcacccgctccagcatcacccgccgctccagctcctagcgctcctgcagcctctcctgcagctccagcaccagcaagccccgctgcaccagcaccatctgctccagcagctagccctgcagctcccgctcctgcatctcccgccgcaccagctccatctgcacccgcagcatctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccttgcagagtgacctctcctaacatcacagtgaccctgaagaagtttcccctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggcctgctgacctgtgaagccaccgtgaatggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagagaagctcgtgctgaactgtaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtaccctagctccaaacaccagcacaagaaactggtcaaccgggacctcaagacccagtccggctccgaaatgaagaaattcctgtccacactgaccatcgacggcgtgaccagatctgaccagggactgtatacctgtgccgcctcctctggcctgatgaccaagaaaaactccaccttcgtgcgggtccacgagaagcaccaccaccatcatcat
SEQ ID No.38:EPS1113P的氨基酸序列
MGTSHPAFLVLGCLLTGLSLILCQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKHHHHHH
SEQ ID No.39:
编码EPS1114P的核苷酸序列
atgggcaccagccatcctgcttttctggtgctgggatgcctgctgaccggcctgtctctgattctgtgccagctgtccctgccttccatcctgcctaacgagaacgagaaggtggtgcagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggactgtacacctgttactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccctgccggaccacagatcctgagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctaccgtgaagggcaagaagttccagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagccctgaaaaccgtgtacaagagcggcgagacaatcgtcgtgacctgcgccgtgttcaacaacgaggtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcaccatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccacagtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagagatgaagaaagtcaccatctccgtgcacgagaaaggcggcggaggcggaagcggtggcggaggaagcggaggcggcggatctgcttctcctgctgctcctgctccagctagtcctgctgcaccagcaccttcagctccagctgcttctccagcagcacccgcaccagcatcaccagccgctccagcaccaagtgcaccagctgctagcccagctgctcccgctcctgcatctcctgcagcaccagctccatctgcaccagcagcaagtccagcagctccagctcctgcttcacccgctgctcccgcaccatctgctccagccgcatcacccgctgcaccagctccagcttctcccgccgctccagctccttctgctcctgcagcatctcctgctgctccagcaccagcaagcccagccgctcctgctccatcagcacccgctgcctctccagctgctcctgcaccagcctctccagctgcacccgctcctagtgctccagctgcaagtcccgccgcaccagcaccagctagtcctgcagctcctgcaccaagcgctccagcagcttcccctgcagctcctgctcctgcctctcctgccgctcctgctcctagtgcaccagccgcatctcccgcagctcccgctcctgctagtccagcagctcccgcaccttctgcaccagcagcttccccagccgcaccagctccagcaagccccgctgctccagcacctagtgctcccgctgcctcaccagcagctcccgctccagcaagccctgctgcacccgctccaagcgcaccagcagcatcaccagctgcacccgcaccagctagcccagcagcaccagctcctagcgctcccgcagctagccctgctgctcccgcaccagcttcacccgcagcacccgctccatcagctcccgccgctagtcccgctgctcctgctcctgcaagccctgctgctcctgctccttctgctccagctgctagtcctgccgctcctgctccagcttctccagcagctcctgcacctagcgcacccgccgctagtccagcagcaccagcaccagcttctccagctgcaccagcaccatcagcacccgcagcttcaccagcagctccagcaccagcatctcccgcagctccagcaccatcagctccagcagcaagcccagctgcaccagctccagcatcaccagctgctcccgctccaagcgctcctgctgcttctcctgccgcaccagctccagccagtccagcagcacccgctccaagtgcacccgccgcttctccagctgctccagctcctgctagccccgcagctccagctccaagtgctccagccgccagtcctgcagctcccgcaccagctagccccgctgctcctgcaccatccgcaccagctgctagtcccgcagcaccagctccagctagcccagccgcaccagcaccatctgctcccgctgctagccctgcagcacccgctccagccagtcctgctgctccagctccatctgctcccgccgcttctcctgcagctcctgcaccagcttctcccgctgctcctgctcctagcgctccagcagcctctccagcagcaccagctccagcaagtcctgcagcaccagcacctagtgcaccagcagcttcacccgctgctcccgctccagcatctccagctgctccagcaccttctgctccagctgcaagccccgcagctcctgcaccagcaagtcctgccgctccagctcctagcgctcctgctgcaagtccagctgctcccgctccagcttcaccagccgcaccagcaccttccgcaccagcagctagtccagctgctcctgctccagctagcccagctgctccagctccttcagcaccagcagccggtggcggaggatctggcggaggcggatctggcggcggtggttcttctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccttgcagagtgacctctcctaacatcacagtgaccctgaagaagtttcccctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggactgctgacctgcgaagccactgtgaacggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagagaaactggtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtaccccagctccaaacaccagcacaagaagctggtcaaccgggatctgaaaacccagtccggctccgaaatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggcctgtatacctgtgccgcctcttctggcctgatgaccaagaaaaactccaccttcgtgcgggtccacgagaagcaccatcaccaccatcat
SEQ ID No.40:
EPS1114P的氨基酸序列
MGTSHPAFLVLGCLLTGLSLILCQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGGGGGSGGGGSGGGGSASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAAGGGGSGGGGSGGGGSSDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKHHHHHH
SEQ ID No.41:
编码EPS1115P的核苷酸序列
atggtgtcctactgggatacaggcgtgctgctgtgtgccctgctgtcttgtctgctgctgaccggctcctcttctggctctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccctgcagagtgacctctcctaacatcaccgtgactctgaagaagttccctctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggcctgctgacctgcgaggccaccgttaatggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagaaaagctggtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtacccctccagcaagcaccagcacaagaagctggtcaaccgggacctgaaaacccagtccggctccgagatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggcctgtatacctgcgccgcttcctctggcctgatgaccaagaaaaactccaccttcgtgcgggtgcacgagaaaggtggcggaggatctggcggaggcggctctggcggcggtggatctgcttctcctgctgctccagctccagcttctccagcagctcctgcaccttctgcaccagctgcaagtcctgcagcacccgcaccagctagtcctgccgctcctgctcctagtgctcctgccgcaagtccagctgctcccgctcctgcaagcccagctgcaccagcaccaagtgctccagctgcctcaccagccgcaccagctccagcaagccctgcagctcccgctccttcagctcctgctgcttctcccgcagcacccgctccagcatcaccagccgctccagcaccatcagctccagcagcatctcctgcagctccagctcctgctagtcccgctgctcccgcacctagtgcaccagccgcttctcccgccgctcctgctcctgcatctcctgctgcacccgctccatctgctcccgccgcatcacccgcagctcccgcaccagcctctccagctgcaccagctcctagcgcaccagcagctagcccagctgctcctgcaccagctagccccgcagctccagctccaagcgctcctgctgcatccccagctgctccagctcctgcctcaccagctgctccagcaccttctgctcccgccgcttctcctgccgcaccagctccagctagtccagccgcaccagcaccatctgcacccgctgctagccctgctgcaccagctccagcatcacccgctgcaccagctccatccgcaccagctgcttcaccagcagctcccgctccagcttcacccgctgctcccgctcctagcgctcccgcagcttcaccagctgcacccgctccagccagtccagctgctcccgcaccatccgcaccagcagcaagtcccgccgctccagctccagctagcccagctgctccagctccatctgcaccagccgcatctccagctgctccagctccagctagtcctgctgcacccgctcctagcgctccagctgcaagtcctgccgctcctgctccagcctctcctgccgctccagcacctagcgctcccgctgccagtccagcagctccagctcctgcatctcccgccgcaccagcaccaagcgcacccgcagcatctcccgctgctcccgctccagcaagccctgccgctcctgcaccaagtgcaccagcagcatccccagcagctcccgctccagcatctccagcagctccagctccaagtgctccagcagctagtcctgctgctccagctcctgctagccctgcagctcctgcaccatctgctcccgcagccagtcctgcagctcctgcaccagcaagtccagctgctcctgcacctagcgctccagctgcatctcccgctgcaccagctccagcaagtcccgctgctcctgctccttctgctccagcagcttcccctgctgctcctgctcctgcttcacccgccgctccagctccatctgctcccgctgcctctccagccgctcctgcaccagcatcaccagctgctcccgcaccaagcgcacccgctgcaagcccagccgctcctgctcctgctagtccagccgctcctgcaccttcagcacccgcagcttccccagctgctccagctccagcaagtccagcagctccagctccttccgctccagctgcaagccccgcagctccagctcctgcttctcctgctgctcctgcaccatcagctccagctgctagtccagcagctcctgcaccagccagtcctgccgcaccagcaccttcagctccagctgcttcacccgctgctcccgcaccagctagtccagccgctccagcaccaagtgctcccgccgctggtggtggtggatctggtggtggcggaagcggaggtggtggttctcagctgtccctgccttccatcctgcctaacgagaacgagaaggtggtccagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggcctgtacacatgctactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccttgccggaccaccgatccagagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctacagtgaagggcaagaagtttcagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagctctgaaaaccgtgtacaagtccggcgagacaatcgtcgtgacctgtgccgtgttcaacaacgaagtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcacaatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccactgtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagaaatgaagaaagtgaccatctccgtccacgagaagggccaccatcatcaccaccat
SEQ ID No.42:EPS1115P的氨基酸序列
MVSYWDTGVLLCALLSCLLLTGSSSGSDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKGGGGSGGGGSGGGGSASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAAGGGGSGGGGSGGGGSQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGHHHHHH
SEQ ID No.43:
编码EPS1116P的核苷酸序列
atggggacctctcatcctgccttcctggtgctggggtgcctgctgaccggcctgtctctgattctgtgccagctgagcctgccaagcatcctgcctaacgaaaatgagaaggtggtccagctgaacagctccttcagtctgagatgctttggcgaatcagaggtgagctggcagtacccaatgtcagaggaagagtctagtgacgtggaaattaggaatgaagagaacaattcaggactgttcgtgaccgtcctggaggtgtcaagcgccagcgccgctcacaccggactgtacacatgttactataaccatactcagaccgaagagaatgaactggaggggaggcacatctccatccacgtgcccgatcctgacgtggcctttgccccactgggaatgacagattacctggtcatcgtcgaggacgatgactctgccatcattccctgccgcacctcagactccgaaactcctgtgaccctgcataacagtgagggcgtggtccccgcctcctacgattctcgacagggattcaatggcaccttcaccgtcggaccctatatctgtgaggccactgtgaagggcaagaaattccagaccattccttttaacgtgtacgcactgaaagccacatccgaactggacctggaaatggaggccctgaagactgtctataaatctggagagactatcgtggtcacctgcgccgtgttcaacaatgaagtggtcgatgcgcagtggacttaccccggcgaggtcaagggcaaagggattaccatggacgaagagatcaaggtgcctagccagaagctggtgtacaccctgacagtcccagaagccaccgtgaaggattccggggactatgagtgtgcagcccggcaggcctccagagaagtgaaggagatgaagaaagtgacaatcagtgtccacgagaaaggagcaagccccgccgctccagcccccgcaagcccagccgcaccagcaccttccgcaccagccgcctccccagcagcacccgcacccgcttcccctgccgcccccgcccctagcgcccccgccgcctcccctgccgccccagcccccgcctctccagccgcccctgccccatctgccccagccgccagcccagccgcccccgcccctgccagccccgccgccccagccccctccgcccctgctgcttcccctgccgcccctgccccagccagcccagctgctcctgctccaagcgcccctgctgcaagcccagctgctccagcccccgcctctcccgctgctccagctccttctgcccctgctgcttccccagctgctcccgcccctgcctctcctgctgctcctgctccctccgcccctgctgcatcccccgctgctcctgccccagcttccccagctgcacctgctccaagcgccccagctgcaagcccagctgcacctgcacctgcttcccccgctgcccctgccccaagcgcccccgccgcatcccccgccgcaccagcccccgcctcacccgcagcaccagccccatcagcaccagccgcctcaccagccgcccccgcacccgcaagtccagcagcacccgcaccatccgcccccgccgcaagcccagccgcccccgctccagcatcccctgccgcccccgcccccagcgcccccgccgcctcccctgccgccccagcccccgcctctccagccgcccctgccccatctgccccagccgccagccccgccgcccccgcccctgccagccccgccgccccagccccctccgcccctgctgcttcccccgccgcccctgccccagccagcccagctgctcccgctccaagcgcccccgctgcaagcccagctgctccagcccccgcctctcccgctgctccagctccttctgcccctgctgcttcccccgctgctcccgcccccgcctctcctgctgctcccgctccctccgcccctgctgcatcccccgctgctcctgccccagcttccccagctgcacctgctcccagcgccccagctgcaagccccgctgcacctgcacctgcttcccccgctgcccctgccccaagcgcccccgccgcctcacccgcagcccccgctccagccagccccgcagcaccagcaccctcagccccagcctcagataccggccggccttttgtggagatgtactccgaaatccccgagatcattcacatgaccgaagggcgagagctggtcatcccatgccgggtgacaagccccaacattactgtgaccctgaagaaattccctctggatactctgatcccagacgggaagaggatcatttgggacagccgcaaaggcttcatcatttccaatgccacatataaggaaattggcctgctgacatgcgaggccactgtgaacgggcacctgtacaaaaccaattatctgacacatcggcagacaaacactatcattgatgtggtcctgagcccttcccatgggatcgaactgagcgtcggagagaagctggtgctgaattgtacagccagaactgaactgaacgtgggcattgacttcaattgggagtacccctcctctaagcaccagcataagaaactggtgaatagggatctgaaaacccagtctgggagtgagatgaagaaatttctgtctaccctgacaatcgatggcgtgacacgcagtgaccaggggctgtatacttgtgcagccagttcaggcctgatgaccaagaagaacagcacatttgtccgagtccacgaaaagcaccaccaccaccatcac
SEQ ID No.44:
EPS1116P的氨基酸序列
MGTSHPAFLVLGCLLTGLSLILCQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHISIHVPDPDVAFAPLGMTDYLVIVEDDDSAIIPCRTSDSETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDAQWTYPGEVKGKGITMDEEIKVPSQKLVYTLTVPEATVKDSGDYECAARQASREVKEMKKVTISVHEKGASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKHHHHHH
SEQ ID No.45:
编码EPS1103P删除信号肽和纯化标签的核苷酸序列
cagctgagcctgccttcaatcctgcccaacgagaatgagaaggtggtgcagctgaactccagcttcagcctgagatgctttggcgagtctgaggtgtcctggcagtaccctatgtctgaggaggagtcttccgacgtggagatccgcaatgaggagaacaattccggcctgttcgtgaccgtgctggaggtgagctctgccagcgccgctcacaccggcctgtacacatgttactataaccatacccagacagaggagaatgagctggagggcagacacatctacatctatgtgcccgatcctgacgtggcctttgtgccactgggcatgaccgattacctggtcatcgtggaggacgatgactctgccatcatcccctgcaggaccacagacccagagacacccgtgacactgcataactccgagggagtggtgccagctagctacgattctcggcagggcttcaatggcacctttacagtgggcccctatatctgtgaggccaccgtgaagggcaagaagttccagacaatcccttttaacgtgtacgccctgaaggctacctctgagctggacctggagatggaggccctgaagacagtgtataagtccggcgagacaatcgtggtgacatgcgccgtgttcaacaatgaggtggtggatctgcagtggacctaccctggcgaggtgaagggcaagggcatcacaatgctggaggagatcaaggtgccttccatcaagctggtgtacaccctgacagtgccagaggccaccgtgaaggatagcggcgactatgagtgtgctgctaggcaggctaccagggaggtgaaggagatgaagaaggtgacaatctccgtgcacgagaagggagctagcccagctgctccagctccagctagccccgccgctcctgctccatctgctcctgctgcttccccagctgctcccgcccctgcttctcctgctgctccagctccatccgccccagctgcttctcctgccgctcctgccccagcttccccagccgctcccgccccttccgctccagccgcctctcccgccgcccctgctccagctagcccagcagccccagccccttctgctccagccgcctctccagccgcccctgctcccgcatcccccgccgcccccgccccttccgcccctgccgcctccccagctgccccagctcctgcctctcctgctgcccctgctccatccgctccagccgccagtcccgccgcccccgctccagctagcccagccgcaccagccccttctgctcccgccgcctctcccgccgcacctgctccagcatcccccgccgccccagccccttccgcccctgcagcctccccagctgcccccgctcctgcctctcctgcagcccctgctccttccgctccagccgcatctcccgccgccccagccccagctagcccagcagcaccagccccctctgctccagccgccagccctgccgcccctgctcccgcttcccccgccgccccagcaccttccgcccctgccgcatccccagcagcccccgctcctgccagccctgctgcccctgcaccttccgctccagccgcttctcccgccgccccagcacccgctagcccagctgcccctgccccttctgctccagcagcctctcctgccgcccctgctcctgcatcccccgccgcacccgccccttccgcccccgccgcctccccagctgcaccagctccagcctctccagctgctccagctccttccgccccagctagcgataccggccgcccttttgtggagatgtacagcgagatccccgagatcatccacatgaccgagggcagggagctggtcatcccatgccgggtgacatctcccaacatcaccgtgacactgaagaagttccctctggataccctgatcccagacggcaagagaatcatctgggactctcgcaagggctttatcatctccaatgccacatataaggagatcggcctgctgacctgcgaggctacagtgaacggccacctgtacaagaccaattatctgacacataggcagaccaacacaatcatcgatgtggtgctgagcccatctcatggcatcgagctgagcgtgggcgagaagctggtgctgaattgtaccgcccggacagagctgaacgtgggcatcgacttcaattgggagtacccttccagcaagcaccagcataagaagctggtgaacagagatctgaagacccagtccggcagcgagatgaagaagtttctgagcaccctgacaatcgatggcgtgacccgctctgaccagggcctgtatacatgtgccgcttcttccggcctgatgactaagaaaaactccacctttgtgcgggtccacgaaaaa
SEQ ID No.46:
EPS1103P删除信号肽和纯化标签的氨基酸序列
QLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEK
SEQ ID No.47:
编码EPS1104P删除信号肽和纯化标签的核苷酸序列
cagctgagcctgccctccatcctgcctaacgagaatgagaaggtggtgcagctgaactccagcttctccctgagatgctttggcgagtctgaggtgtcctggcagtacccaatgagcgaggaggagtcttccgacgtggagatccgcaatgaggagaacaattctggcctgttcgtgaccgtgctggaggtgagctctgcctccgccgctcacaccggcctgtacacatgttactataaccatacccagacagaggagaatgagctggagggcagacacatctacatctatgtgcccgatcctgacgtggcctttgtgccactgggcatgaccgattacctggtcatcgtggaggacgatgacagcgccatcatcccctgcaggaccacagaccccgagacacctgtgacactgcataactctgagggcgtggtgccagccagctacgattctcggcagggcttcaatggcacctttacagtgggcccctatatctgtgaggccaccgtgaagggcaagaagttccagacaatcccttttaacgtgtacgccctgaaggctaccagcgagctggacctggagatggaggccctgaagacagtgtataagtctggcgagacaatcgtggtgacatgcgccgtgttcaacaatgaggtggtggatctgcagtggacctaccccggcgaggtgaagggcaagggcatcacaatgctggaggagatcaaggtgccttctatcaagctggtgtacaccctgacagtgccagaggccaccgtgaaggattccggcgactatgagtgtgccgctaggcaggctacccgggaggtgaaggagatgaagaaggtgacaatctctgtgcacgagaagggagcttccccagctgctccagctccagcttcccccgccgctcctgccccatctgctccagctgcctctccagctgctccagctcctgctagccctgccgctccagccccctccgcccctgccgcttctccagccgctcctgccccagctagccctgctgctccagctccttccgctccagccgcctctccagccgctccagcccccgcctctcctgctgccccagctccttctgctccagctgccagccccgccgcccctgcccccgcctctcccgctgcccctgctccttccgccccagctgcctcccctgctgctcctgccccagcttcacctgccgcccctgccccttccgctccagccgcatctcccgccgctccagcccccgcaagccctgcagccccagctccctctgctccagctgcctcacccgccgcccctgcccctgcctctcccgctgcccccgctccttccgccccagcagcctcccctgcagctcctgccccagcttctccagccgctcccgccccttccgctcccgccgcctctcctgctgcaccagcccccgcttccccagctgctcctgctccatccgccccagctgcttccccagctgctccagctccagcttcccccgccgctcctgccccatctgctccagctgcctctccagctgctccagctcctgctagccctgccgctccagccccctccgcccctgccgcttctccagccgctcctgccccagctagccctgctgctccagctccttccgctccagccgcctctccagccgctccagcccccgcctctcctgctgccccagctccttctgctccagctgccagccccgccgcccctgcccccgcctctcccgctgcccctgctccttccgccccagctgcctcccctgctgctcctgccccagcttcacctgccgcccctgccccttccgctccagccgcatctcccgccgctccagcccccgcaagccctgcagccccagctccctctgctccagctgcctcacccgccgcccctgcccctgcctctcccgctgcccccgctccttccgccccagcagcctcccctgcagctcctgccccagcttctccagccgctcccgccccttccgctcccgccgcctctcctgctgcaccagcccccgcttccccagctgctcctgctccatccgccccagctagcgataccggccgcccttttgtggagatgtacagcgagatccctgagatcatccacatgaccgagggcagggagctggtcatcccatgccgggtgacatctcccaacatcaccgtgacactgaagaagttccctctggataccctgatcccagacggcaagagaatcatctgggacagccgcaagggctttatcatctctaatgccacatataaggagatcggcctgctgacctgcgaggctacagtgaacggccacctgtacaagaccaattatctgacacataggcagaccaacacaatcatcgatgtggtgctgagcccctctcatggcatcgagctgtccgtgggcgagaagctggtgctgaattgtaccgcccggacagagctgaacgtgggcatcgacttcaattgggagtacccttccagcaagcaccagcataagaagctggtgaacagagatctgaagacccagtccggcagcgagatgaagaagtttctgtccaccctgacaatcgatggagtgacccgcagcgaccagggcctgtatacatgtgccgcttcttccggcctgatgactaagaaaaatagcacctttgtgagggtccacgaaaaa
SEQ ID No.48:
EPS1104P删除信号肽和纯化标签的氨基酸序列
QLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEK
SEQ ID No.49:
编码EPS1105P删除信号肽和纯化标签的核苷酸序列
agcgataccggccgccccttcgtggagatgtacagcgagatccctgagatcatccacatgaccgagggcagggagctggtcatcccttgccgggtgacatctccaaacatcaccgtgacactgaagaagttccccctggataccctgatccctgacggcaagagaatcatctgggactctcgcaagggctttatcatctccaatgccacctataaggagatcggcctgctgacctgcgaggctacagtgaacggccacctgtacaagaccaattatctgacacatcggcagaccaacacaatcatcgatgtggtgctgagcccttctcatggcatcgagctgtccgtgggcgagaagctggtgctgaattgtaccgccagaacagagctgaacgtgggcatcgatttcaattgggagtacccatccagcaagcaccagcataagaagctggtgaacagggacctgaagacccagtccggcagcgagatgaagaagtttctgtctaccctgacaatcgatggagtgacccgctccgaccagggcctgtatacatgtgccgcttcttccggcctgatgaccaagaagaatagcacatttgtgagggtgcacgagaaggcctccccagctgctccagctcctgctagcccagccgctccagccccctctgctccagccgcttcccccgccgctcctgccccagcttctccagccgctcccgccccttccgcccctgccgcttctcctgctgctccagcccctgcctctcctgccgctcctgccccatccgctcccgccgctagccctgccgctcccgcccctgctagccctgctgcccctgctccttctgctcctgctgcctctccagctgccccagctcctgcctcccctgctgcccctgcaccatccgccccagccgcttctcctgcagctccagcccctgccagccctgctgccccagctccttccgctcctgctgccagtccagctgcccctgctcctgctagccctgctgcacctgctccttctgctcccgctgcctctccagctgcaccagctcctgcctcccccgctgcccctgctccatccgcccccgccgcttctcctgccgccccagcccctgcctctccagctgctccagctccctccgctcctgctgccagcccagctgcccctgcacctgctagccctgctgctcctgccccctctgccccagctcagctgtctctgccatccatcctgcccaacgagaatgagaaggtggtgcagctgaacagctctttctctctgcggtgctttggcgagagcgaggtgtcttggcagtaccccatgtccgaggaggagtccagcgacgtggagatcagaaatgaggagaacaatagcggcctgttcgtgaccgtgctggaggtgtcttccgcctctgccgctcacaccggcctgtacacatgttactataaccatacccagacagaggagaatgagctggagggccggcacatctacatctatgtgcctgatccagacgtggcctttgtgcccctgggcatgaccgattacctggtcatcgtggaggacgatgactccgccatcatcccttgccgcaccacagaccccgagacacctgtgacactgcataacagcgagggagtggtgccagcttcctacgatagcaggcagggcttcaatggcacctttacagtgggcccttatatctgtgaggccaccgtgaagggcaagaagttccagacaatccccttcaacgtgtacgccctgaaggctacctccgagctggacctggagatggaggccctgaagacagtgtataagagcggcgagacaatcgtggtgacatgcgccgtgttcaacaatgaggtggtggatctgcagtggacctaccctggcgaggtgaagggcaagggcatcacaatgctggaggagatcaaggtgccaagcatcaagctggtgtacaccctgacagtgcccgaggccaccgtgaaggattctggcgactatgagtgtgccgctaggcaggctacacgggaggtgaaagaaatgaagaaggtcacaatcagcgtccacgaaaagggg
SEQ ID No.50:EPS1105P删除信号肽和纯化标签的氨基酸序列
SDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKG
SEQ ID No.51:
编码EPS1106P删除信号肽和纯化标签的核苷酸序列
cagctgtccctgccttccatcctgcctaacgagaacgagaaggtggtgcagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggactgtacacctgttactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccctgccggaccacagatcctgagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctaccgtgaagggcaagaagttccagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagccctgaaaaccgtgtacaagagcggcgagacaatcgtcgtgacctgcgccgtgttcaacaacgaggtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcaccatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccacagtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagagatgaagaaagtcaccatctccgtgcacgagaaaggcggcggaggcggaagcggtggcggaggaagcggaggcggcggatctgcttctcctgctgctccagctccagcttctccagcagctcctgcaccttctgcaccagctgcaagtcctgcagcacccgcaccagctagtcctgccgctcctgctcctagtgctcctgccgcaagtccagctgctcccgctcctgcatcaccagccgcaccagcaccaagtgctccagctgcctctccagcagcaccagctccagcaagccctgctgcaccagcaccttcagctccagcagcatcacccgctgcacccgctccagcatctcccgctgctccagcaccaagcgcacccgctgctagcccagccgctccagctcctgccagtcctgctgctcctgcaccatctgctcccgcagcttcaccagctgctcccgcaccagctagcccagcagcaccagcaccatctgcacccgccgcatctcccgccgcaccagctccagctagtcccgcagctcccgctccatctgctccagccgctagtcccgctgctcctgctccagctagtcctgctgcacccgctcctagcgcaccagctgcttcacccgcagctccagctccagcttcacccgctgcaccagctccatctgctccagctggtggcggaggatctggcggaggcggatctggcggcggtggttcttctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccttgcagagtgacctctcctaacatcacagtgaccctgaagaagtttcccctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggactgctgacctgcgaagccactgtgaacggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagagaaactggtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtaccccagctccaaacaccagcacaagaagctggtcaaccgggatctgaaaacccagtccggctccgaaatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggcctgtatacctgtgccgcctcttctggcctgatgaccaagaaaaactccaccttcgtgcgggtccacgagaag
SEQ ID No.52:
EPS1106P删除信号肽和纯化标签的氨基酸序列
QLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGGGGGSGGGGSGGGGSASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAGGGGSGGGGSGGGGSSDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEK
SEQ ID No.53:
编码EPS1107P删除信号肽和纯化标签的核苷酸序列
tctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccctgcagagtgacctctcctaacatcaccgtgactctgaagaagttccctctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggcctgctgacctgcgaggccaccgttaatggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagaaaagctggtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtacccctccagcaagcaccagcacaagaagctggtcaaccgggacctgaaaacccagtccggctccgagatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggcctgtatacctgcgccgcttcctctggcctgatgaccaagaaaaactccaccttcgtgcgggtgcacgagaaaggtggcggaggatctggcggaggcggctctggcggcggtggatctgcttctcctgctgctccagctccagcttctccagcagctcctgcaccttctgcaccagctgcaagtcctgcagcacccgcaccagctagtcctgccgctcctgctcctagtgctcctgccgcaagtccagctgctcccgctcctgcaagcccagctgcaccagcaccaagtgctccagctgcctcaccagccgcaccagctccagcaagccctgcagctcccgctccttcagctcctgctgcttctcccgcagcacccgctccagcatcaccagccgctccagcaccatcagctccagcagcatctcctgcagctccagctcctgctagtcccgctgctcccgcacctagtgcaccagccgcttctcccgccgctcctgctcctgcatctcctgctgcacccgctccatctgctcccgccgcatcacccgcagctcccgcaccagcctctccagctgcaccagctcctagcgcaccagcagctagcccagctgctcctgcaccagctagccccgcagctccagctccaagcgctcctgctgcatccccagctgctccagctcctgcctcaccagctgctccagcaccttctgctcccgctggcggtggcggaagcggaggtggtggtagtggcggcggaggttctcagctgtccctgccttctatcctgcctaacgagaacgagaaggtggtccagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggcctgtacacatgctactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccttgccggaccaccgatccagagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctacagtgaagggcaagaagtttcagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagctctgaaaaccgtgtacaagtccggcgagacaatcgtcgtgacctgtgccgtgttcaacaacgaagtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcaccatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccactgtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagaaatgaagaaagtgaccatctccgtccacgagaagggc
SEQ ID No.54:
EPS1107P删除信号肽和纯化标签的氨基酸序列
SDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKGGGGSGGGGSGGGGSASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAGGGGSGGGGSGGGGSQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKG
SEQ ID No.55:编码EPS1109P删除信号肽和纯化标签的核苷酸序列
gcttctccagccgctccagctcctgcttctcctgctgcaccagcaccatctgctccagctgcaagtccagctgctcccgcaccagcaagtcctgcagcacccgctcctagtgctccagcagcatctcccgcagcaccagctccagcttcaccagcagctcccgctccatcagcaccagccgcatcacccgctgctccagcaccagcttctcccgccgctcctgcaccttctgcacccgcagctagccctgctgctcctgctccagcatctccagctgcacccgctccaagcgcacccgctgctagtccagcagcaccagcaccagctagtcccgctgctccagctccttctgctccagcagcttcaccagccgctccagcaccagctagcccagccgcaccagcacctagtgctcccgccgctagtcctgcagctccagctcctgctagcccagctgctcccgctcctagcgctcctgccgcttcaccagctgcaccagctccagcaagtccagccgctcctgctccaagtgcaccagctgcctctccagctgctcctgctcctgcaagtcccgcagctccagcacctagcgcaccagcatctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccctgcagagtgacctctcctaacatcaccgtgactctgaagaagttccctctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggcctgctgacctgcgaggccaccgttaatggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagaaaagctcgtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtaccccagctccaaacaccagcacaagaaactggtcaaccgggacctgaaaacccagtccggctccgagatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggcctgtatacctgcgccgcttcttctggcctgatgaccaagaaaaactccaccttcgtgcgcgtgcacgagaagcagctgtccctgccttctatcctgcctaacgagaacgagaaggtggtccagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggcctgtacacatgctactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccttgccggaccaccgatccagagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctacagtgaagggcaagaagtttcagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagctctgaaaaccgtgtacaagtccggcgagacaatcgtcgtgacctgtgccgtgttcaacaacgaggtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcaccatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccactgtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagaaatgaagaaagtgaccatctccgtccacgagaagggc
SEQ ID No.56:EPS1109P删除信号肽和纯化标签的氨基酸序列
ASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKG
SEQ ID No.57:
编码EPS1110P删除信号肽和纯化标签的核苷酸序列
gcttctccagccgctccagctcctgcttctcctgctgcaccagcaccatctgctccagctgcaagtccagctgctcccgcaccagcaagtcctgcagcacccgctcctagtgctccagcagcatctcccgcagcaccagctccagcttcaccagcagctcccgctccatcagcaccagccgcatcacccgctgctccagcaccagcttctcccgccgctcctgcaccttctgcacccgcagctagccctgctgctcctgctccagcatctccagctgcacccgctccaagcgcacccgctgctagtccagcagcaccagcaccagctagtcccgctgctccagctccttctgctccagcagcttcaccagccgctccagcaccagctagcccagccgcaccagcacctagtgctcccgccgctagtcctgcagctccagctcctgctagcccagctgctcccgctcctagcgctcctgccgcttcaccagctgcaccagctccagcaagtccagccgctcctgctccaagtgcaccagctgcctctccagctgctcctgctcctgcaagtcccgcagctccagcacctagcgcaccagctcaactgtccctgccttccatcctgcctaacgagaacgagaaggtggtccagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggcctgtacacctgttactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccctgccggaccacagatcctgagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctaccgtgaagggcaagaagttccagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagccctgaaaaccgtgtacaagtccggcgagacaatcgtcgtgacctgcgccgtgttcaacaacgaggtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcaccatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccacagtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagagatgaagaaagtcaccatctccgtgcacgagaagggctccgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccttgcagagtgacctctcctaacatcacagtgaccctgaagaagtttcccctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggcctgctgacctgtgaagccaccgtgaatggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgtccccaagccatggcatcgagctgtccgtgggagaaaagctcgtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtaccccagctccaaacaccagcacaagaaactggtcaaccgggacctcaagacccagtccggctccgaaatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggactgtatacctgtgccgcctcctctggcctgatgaccaagaaaaactccaccttcgtgcgggtccacgagaag
SEQ ID No.58:
EPS1110P删除信号肽和纯化标签的氨基酸序列
ASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGSDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEK
SEQ ID No.59:
编码EPS1111P删除信号肽和纯化标签的核苷酸序列
gcttctccagccgctccagctcctgcttctcctgctgcaccagcaccatctgctccagctgcaagtccagctgctcccgcaccagcaagtcctgcagcacccgctcctagtgctccagcagcatctcccgcagcaccagctccagcttcaccagcagctcccgctccatcagcaccagccgcatcacccgctgctccagcaccagcttctcccgccgctcctgcaccttctgcacccgcagctagccctgctgctcctgctccagcatctccagctgcacccgctccaagcgcacccgctgctagtccagcagcaccagcaccagctagtcccgctgctccagctccttctgctccagcagcttcaccagccgctccagcaccagctagcccagccgcaccagcacctagtgctcccgccgctagtcctgcagctccagctcctgctagcccagctgctcccgctcctagcgctcctgccgcttcaccagctgcaccagctccagcaagtccagccgctcctgctccaagtgcaccagctgcctctccagctgctcctgctcctgcaagtcccgcagctccagcacctagcgcaccagcatctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccctgcagagtgacctctcctaacatcaccgtgactctgaagaagttccctctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggcctgctgacctgcgaggccaccgttaatggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagaaaagctcgtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtaccccagctccaaacaccagcacaagaaactggtcaaccgggacctgaaaacccagtccggctccgagatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggcctgtatacctgcgccgcttcttctggcctgatgaccaagaaaaactccaccttcgtgcgcgtgcacgagaagaacgatgccgaggaactgttcatcttcctgaccgagattaccgagatcacaatcccctgccgcgtgacagatcctcagctggtggttaccctgcatgagaagaaaggcgacgtggccctgcctgtgccttacgatcatcagagaggcttctccggcatcttcgaggaccggtcttacatctgcaagaccaccatcggcgacagagaggtggactccgacgcctactacgtgtacagactccaggtgtcctccatcaacgtgtccgtgaatgccgtgcagacagttgtgcggcagggcgagaatatcaccctgatgtgcatcgtgatcggcaacgaggtggtcaacttcgagtggacctatcctcggaaagaatctggccggctggtggaacctgtgaccgacttcctgctggacatgccctaccacatccggtctatcctgcacatcccttccgccgagctggaagattccggcacctacacctgtaacgtgaccgagtccgtgaacgaccaccaggacgagaaggccatcaatatcaccgtggtggaatccggctacgtgcggctgttgggagaagtgggcacactgcagtttgctgagctg
SEQ ID No.60:
EPS1111P删除信号肽和纯化标签的氨基酸序列
ASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKNDAEELFIFLTEITEITIPCRVTDPQLVVTLHEKKGDVALPVPYDHQRGFSGIFEDRSYICKTTIGDREVDSDAYYVYRLQVSSINVSVNAVQTVVRQGENITLMCIVIGNEVVNFEWTYPRKESGRLVEPVTDFLLDMPYHIRSILHIPSAELEDSGTYTCNVTESVNDHQDEKAINITVVESGYVRLLGEVGTLQFAEL
SEQ ID No.61:
编码EPS1113P删除信号肽和纯化标签的核苷酸序列
cagctgtccctgccttctatcctgcctaacgagaacgagaaggtggtgcagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggcctgtacacctgttactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccctgccggaccacagatcctgagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctaccgtgaagggcaagaagttccagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagccctgaaaaccgtgtacaagtccggcgagacaatcgtcgtgacctgcgccgtgttcaacaacgaggtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcaccatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccacagtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagagatgaagaaagtcaccatctccgtgcacgagaagggcgcctctccagctgctcctgctccagctagtcctgcagctccagctccatctgcaccagctgcttctccagcagcacccgcaccagcttctcccgccgctcctgcacctagtgcaccagcagctagccctgctgcaccagcaccagcaagtccagccgcaccagctcctagtgctccagctgcatcccctgctgctcccgctcctgcttcaccagccgctccagcaccatcagctcccgcagcatctccagcagctccagctcctgcttctcctgctgcacccgctccatctgctcccgctgcaagtcctgctgctcctgcaccagcatcacccgcagctcccgcaccaagcgctccagccgcttcacccgcagcaccagctccagcctcaccagcagcaccagcaccttccgctccagctgctagtccagccgctcctgctcctgcaagccccgctgctccagctcctagcgcacccgctgctagccccgcagctcccgctccagcaagcccagcagctcctgctccttctgctccagcagcatctcctgccgcaccagctccagctagcccagctgctcccgcaccatccgcaccagcagcaagtcccgcagctccagcaccagctagtcccgcagcacccgcaccttcagcaccagccgcatcaccagctgctccagctccagcatctcccgctgcaccagcaccaagtgctcccgctgcttctcctgcagctcctgctccagcctctccagctgctcccgcaccttctgctccagctgcctctccagctgctccagcaccagcttcaccagctgctcccgctcctagtgctcctgccgctagtccagcagctcccgcaccagctagccctgccgctcctgctccaagtgctccagccgcaagtcccgctgcacccgctccagcttctccagcagctcccgctccaagcgcacccgcagcttctcccgctgctcccgcaccagcaagtcctgctgctccagctccttcagctcctgccgcttctcctgctgctccagctcctgcaagtccagctgctccagcaccaagtgcaccagcagcaagtccagctgctcctgctcctgcctctccagcagcaccagctcctagcgcaccagccgccagtcctgcagcaccagctccagcttctcccgctgctcctgctccttcagcaccagctgctagtcctgctgctcctgctccagcttctcctgccgctccagcaccaagcgctccagctgcatctcccgcagctcccgctccagcatctcctgcagcacccgcaccatcagctccagctgcttccccagccgctcctgcaccagctagcccagcagctcctgcacctagcgctcccgctgcttcaccagcagctccagcaccagccagtccagctgctcctgcaccatctgcacccgctgctagtcccgctgctccagctcctgctagccctgcagcaccagctccaagtgcacccgccgcatcacccgccgcaccagcaccagcaagccctgcagcacccgctccaagcgctccagctgctagcccagcagcaccagcaccagcatcaccagccgctccagcaccttctgcaccagcagcttcacccgctgcacccgctccagcatcacccgccgctccagctcctagcgctcctgcagcctctcctgcagctccagcaccagcaagccccgctgcaccagcaccatctgctccagcagctagccctgcagctcccgctcctgcatctcccgccgcaccagctccatctgcacccgcagcatctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccttgcagagtgacctctcctaacatcacagtgaccctgaagaagtttcccctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggcctgctgacctgtgaagccaccgtgaatggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagagaagctcgtgctgaactgtaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtaccctagctccaaacaccagcacaagaaactggtcaaccgggacctcaagacccagtccggctccgaaatgaagaaattcctgtccacactgaccatcgacggcgtgaccagatctgaccagggactgtatacctgtgccgcctcctctggcctgatgaccaagaaaaactccaccttcgtgcgggtccacgagaag
SEQ ID No.62:EPS1113P删除信号肽和纯化标签的氨基酸序列
QLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEK
SEQ ID No.63:编码EPS1114P删除信号肽和纯化标签的核苷酸序列
cagctgtccctgccttccatcctgcctaacgagaacgagaaggtggtgcagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggactgtacacctgttactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccctgccggaccacagatcctgagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctaccgtgaagggcaagaagttccagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagccctgaaaaccgtgtacaagagcggcgagacaatcgtcgtgacctgcgccgtgttcaacaacgaggtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcaccatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccacagtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagagatgaagaaagtcaccatctccgtgcacgagaaaggcggcggaggcggaagcggtggcggaggaagcggaggcggcggatctgcttctcctgctgctcctgctccagctagtcctgctgcaccagcaccttcagctccagctgcttctccagcagcacccgcaccagcatcaccagccgctccagcaccaagtgcaccagctgctagcccagctgctcccgctcctgcatctcctgcagcaccagctccatctgcaccagcagcaagtccagcagctccagctcctgcttcacccgctgctcccgcaccatctgctccagccgcatcacccgctgcaccagctccagcttctcccgccgctccagctccttctgctcctgcagcatctcctgctgctccagcaccagcaagcccagccgctcctgctccatcagcacccgctgcctctccagctgctcctgcaccagcctctccagctgcacccgctcctagtgctccagctgcaagtcccgccgcaccagcaccagctagtcctgcagctcctgcaccaagcgctccagcagcttcccctgcagctcctgctcctgcctctcctgccgctcctgctcctagtgcaccagccgcatctcccgcagctcccgctcctgctagtccagcagctcccgcaccttctgcaccagcagcttccccagccgcaccagctccagcaagccccgctgctccagcacctagtgctcccgctgcctcaccagcagctcccgctccagcaagccctgctgcacccgctccaagcgcaccagcagcatcaccagctgcacccgcaccagctagcccagcagcaccagctcctagcgctcccgcagctagccctgctgctcccgcaccagcttcacccgcagcacccgctccatcagctcccgccgctagtcccgctgctcctgctcctgcaagccctgctgctcctgctccttctgctccagctgctagtcctgccgctcctgctccagcttctccagcagctcctgcacctagcgcacccgccgctagtccagcagcaccagcaccagcttctccagctgcaccagcaccatcagcacccgcagcttcaccagcagctccagcaccagcatctcccgcagctccagcaccatcagctccagcagcaagcccagctgcaccagctccagcatcaccagctgctcccgctccaagcgctcctgctgcttctcctgccgcaccagctccagccagtccagcagcacccgctccaagtgcacccgccgcttctccagctgctccagctcctgctagccccgcagctccagctccaagtgctccagccgccagtcctgcagctcccgcaccagctagccccgctgctcctgcaccatccgcaccagctgctagtcccgcagcaccagctccagctagcccagccgcaccagcaccatctgctcccgctgctagccctgcagcacccgctccagccagtcctgctgctccagctccatctgctcccgccgcttctcctgcagctcctgcaccagcttctcccgctgctcctgctcctagcgctccagcagcctctccagcagcaccagctccagcaagtcctgcagcaccagcacctagtgcaccagcagcttcacccgctgctcccgctccagcatctccagctgctccagcaccttctgctccagctgcaagccccgcagctcctgcaccagcaagtcctgccgctccagctcctagcgctcctgctgcaagtccagctgctcccgctccagcttcaccagccgcaccagcaccttccgcaccagcagctagtccagctgctcctgctccagctagcccagctgctccagctccttcagcaccagcagccggtggcggaggatctggcggaggcggatctggcggcggtggttcttctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccttgcagagtgacctctcctaacatcacagtgaccctgaagaagtttcccctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggactgctgacctgcgaagccactgtgaacggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagagaaactggtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtaccccagctccaaacaccagcacaagaagctggtcaaccgggatctgaaaacccagtccggctccgaaatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggcctgtatacctgtgccgcctcttctggcctgatgaccaagaaaaactccaccttcgtgcgggtccacgagaag
SEQ ID No.64:EPS1114P删除信号肽和纯化标签的氨基酸序列
QLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKGGGGGSGGGGSGGGGSASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAAGGGGSGGGGSGGGGSSDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEK
SEQ ID No.65:编码EPS1115P删除信号肽和纯化标签的核苷酸序列
tctgataccggcagacccttcgtggaaatgtacagcgagatccccgagatcatccacatgaccgagggcagagagctggtcatcccctgcagagtgacctctcctaacatcaccgtgactctgaagaagttccctctggacacactgatccccgacggcaagagaatcatctgggactcccggaagggcttcatcatctccaacgccacctacaaagagatcggcctgctgacctgcgaggccaccgttaatggccacctgtacaagaccaactatctgacccacagacagaccaacaccatcatcgacgtggtgctgagcccctctcatggcatcgagctgtccgtgggagaaaagctggtgctgaactgcaccgccagaaccgagctgaacgtgggcatcgacttcaactgggagtacccctccagcaagcaccagcacaagaagctggtcaaccgggacctgaaaacccagtccggctccgagatgaagaaattcctgagcaccctgaccatcgacggcgtgaccagatctgaccagggcctgtatacctgcgccgcttcctctggcctgatgaccaagaaaaactccaccttcgtgcgggtgcacgagaaaggtggcggaggatctggcggaggcggctctggcggcggtggatctgcttctcctgctgctccagctccagcttctccagcagctcctgcaccttctgcaccagctgcaagtcctgcagcacccgcaccagctagtcctgccgctcctgctcctagtgctcctgccgcaagtccagctgctcccgctcctgcaagcccagctgcaccagcaccaagtgctccagctgcctcaccagccgcaccagctccagcaagccctgcagctcccgctccttcagctcctgctgcttctcccgcagcacccgctccagcatcaccagccgctccagcaccatcagctccagcagcatctcctgcagctccagctcctgctagtcccgctgctcccgcacctagtgcaccagccgcttctcccgccgctcctgctcctgcatctcctgctgcacccgctccatctgctcccgccgcatcacccgcagctcccgcaccagcctctccagctgcaccagctcctagcgcaccagcagctagcccagctgctcctgcaccagctagccccgcagctccagctccaagcgctcctgctgcatccccagctgctccagctcctgcctcaccagctgctccagcaccttctgctcccgccgcttctcctgccgcaccagctccagctagtccagccgcaccagcaccatctgcacccgctgctagccctgctgcaccagctccagcatcacccgctgcaccagctccatccgcaccagctgcttcaccagcagctcccgctccagcttcacccgctgctcccgctcctagcgctcccgcagcttcaccagctgcacccgctccagccagtccagctgctcccgcaccatccgcaccagcagcaagtcccgccgctccagctccagctagcccagctgctccagctccatctgcaccagccgcatctccagctgctccagctccagctagtcctgctgcacccgctcctagcgctccagctgcaagtcctgccgctcctgctccagcctctcctgccgctccagcacctagcgctcccgctgccagtccagcagctccagctcctgcatctcccgccgcaccagcaccaagcgcacccgcagcatctcccgctgctcccgctccagcaagccctgccgctcctgcaccaagtgcaccagcagcatccccagcagctcccgctccagcatctccagcagctccagctccaagtgctccagcagctagtcctgctgctccagctcctgctagccctgcagctcctgcaccatctgctcccgcagccagtcctgcagctcctgcaccagcaagtccagctgctcctgcacctagcgctccagctgcatctcccgctgcaccagctccagcaagtcccgctgctcctgctccttctgctccagcagcttcccctgctgctcctgctcctgcttcacccgccgctccagctccatctgctcccgctgcctctccagccgctcctgcaccagcatcaccagctgctcccgcaccaagcgcacccgctgcaagcccagccgctcctgctcctgctagtccagccgctcctgcaccttcagcacccgcagcttccccagctgctccagctccagcaagtccagcagctccagctccttccgctccagctgcaagccccgcagctccagctcctgcttctcctgctgctcctgcaccatcagctccagctgctagtccagcagctcctgcaccagccagtcctgccgcaccagcaccttcagctccagctgcttcacccgctgctcccgcaccagctagtccagccgctccagcaccaagtgctcccgccgctggtggtggtggatctggtggtggcggaagcggaggtggtggttctcagctgtccctgccttccatcctgcctaacgagaacgagaaggtggtccagctgaactcctccttctctctgcggtgcttcggcgagtccgaagtgtcttggcagtaccccatgtccgaagaggaatcctccgacgtggaaatccggaacgaggaaaacaactccggcctgttcgtgaccgtgctggaagtgtcctctgcctctgctgctcacaccggcctgtacacatgctactacaatcacacccagaccgaagagaacgagctggaaggccggcacatctacatctacgtgcccgatcctgacgtggcctttgtgcctctgggcatgaccgactacctggtcatcgtggaagatgacgactccgctatcatcccttgccggaccaccgatccagagacacctgtgacactgcacaactccgaaggcgtggtgcctgcctcctacgattctagacagggcttcaacggcaccttcaccgtgggaccttacatctgcgaggctacagtgaagggcaagaagtttcagacaatccccttcaacgtgtacgccctgaaggccacctctgagctggacctggaaatggaagctctgaaaaccgtgtacaagtccggcgagacaatcgtcgtgacctgtgccgtgttcaacaacgaagtggtggacctgcagtggacctatcctggcgaagtgaaaggcaagggcatcacaatgctggaagagatcaaggtgccctccatcaagctggtgtataccctgaccgtgcctgaggccactgtgaaggactctggcgactacgagtgtgccgctagacaggccaccagagaagtcaaagaaatgaagaaagtgaccatctccgtccacgagaagggc
SEQ ID No.66:EPS1115P删除信号肽和纯化标签的氨基酸序列
SDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEKGGGGSGGGGSGGGGSASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAAGGGGSGGGGSGGGGSQLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHIYIYVPDPDVAFVPLGMTDYLVIVEDDDSAIIPCRTTDPETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDLQWTYPGEVKGKGITMLEEIKVPSIKLVYTLTVPEATVKDSGDYECAARQATREVKEMKKVTISVHEKG
SEQ ID No.67:编码EPS1116P删除信号肽和纯化标签的核苷酸序列
cagctgagcctgccaagcatcctgcctaacgaaaatgagaaggtggtccagctgaacagctccttcagtctgagatgctttggcgaatcagaggtgagctggcagtacccaatgtcagaggaagagtctagtgacgtggaaattaggaatgaagagaacaattcaggactgttcgtgaccgtcctggaggtgtcaagcgccagcgccgctcacaccggactgtacacatgttactataaccatactcagaccgaagagaatgaactggaggggaggcacatctccatccacgtgcccgatcctgacgtggcctttgccccactgggaatgacagattacctggtcatcgtcgaggacgatgactctgccatcattccctgccgcacctcagactccgaaactcctgtgaccctgcataacagtgagggcgtggtccccgcctcctacgattctcgacagggattcaatggcaccttcaccgtcggaccctatatctgtgaggccactgtgaagggcaagaaattccagaccattccttttaacgtgtacgcactgaaagccacatccgaactggacctggaaatggaggccctgaagactgtctataaatctggagagactatcgtggtcacctgcgccgtgttcaacaatgaagtggtcgatgcgcagtggacttaccccggcgaggtcaagggcaaagggattaccatggacgaagagatcaaggtgcctagccagaagctggtgtacaccctgacagtcccagaagccaccgtgaaggattccggggactatgagtgtgcagcccggcaggcctccagagaagtgaaggagatgaagaaagtgacaatcagtgtccacgagaaaggagcaagccccgccgctccagcccccgcaagcccagccgcaccagcaccttccgcaccagccgcctccccagcagcacccgcacccgcttcccctgccgcccccgcccctagcgcccccgccgcctcccctgccgccccagcccccgcctctccagccgcccctgccccatctgccccagccgccagcccagccgcccccgcccctgccagccccgccgccccagccccctccgcccctgctgcttcccctgccgcccctgccccagccagcccagctgctcctgctccaagcgcccctgctgcaagcccagctgctccagcccccgcctctcccgctgctccagctccttctgcccctgctgcttccccagctgctcccgcccctgcctctcctgctgctcctgctccctccgcccctgctgcatcccccgctgctcctgccccagcttccccagctgcacctgctccaagcgccccagctgcaagcccagctgcacctgcacctgcttcccccgctgcccctgccccaagcgcccccgccgcatcccccgccgcaccagcccccgcctcacccgcagcaccagccccatcagcaccagccgcctcaccagccgcccccgcacccgcaagtccagcagcacccgcaccatccgcccccgccgcaagcccagccgcccccgctccagcatcccctgccgcccccgcccccagcgcccccgccgcctcccctgccgccccagcccccgcctctccagccgcccctgccccatctgccccagccgccagccccgccgcccccgcccctgccagccccgccgccccagccccctccgcccctgctgcttcccccgccgcccctgccccagccagcccagctgctcccgctccaagcgcccccgctgcaagcccagctgctccagcccccgcctctcccgctgctccagctccttctgcccctgctgcttcccccgctgctcccgcccccgcctctcctgctgctcccgctccctccgcccctgctgcatcccccgctgctcctgccccagcttccccagctgcacctgctcccagcgccccagctgcaagccccgctgcacctgcacctgcttcccccgctgcccctgccccaagcgcccccgccgcctcacccgcagcccccgctccagccagccccgcagcaccagcaccctcagccccagcctcagataccggccggccttttgtggagatgtactccgaaatccccgagatcattcacatgaccgaagggcgagagctggtcatcccatgccgggtgacaagccccaacattactgtgaccctgaagaaattccctctggatactctgatcccagacgggaagaggatcatttgggacagccgcaaaggcttcatcatttccaatgccacatataaggaaattggcctgctgacatgcgaggccactgtgaacgggcacctgtacaaaaccaattatctgacacatcggcagacaaacactatcattgatgtggtcctgagcccttcccatgggatcgaactgagcgtcggagagaagctggtgctgaattgtacagccagaactgaactgaacgtgggcattgacttcaattgggagtacccctcctctaagcaccagcataagaaactggtgaatagggatctgaaaacccagtctgggagtgagatgaagaaatttctgtctaccctgacaatcgatggcgtgacacgcagtgaccaggggctgtatacttgtgcagccagttcaggcctgatgaccaagaagaacagcacatttgtccgagtccacgaaaag
SEQ ID No.68:EPS1116P删除信号肽和纯化标签的氨基酸序列
QLSLPSILPNENEKVVQLNSSFSLRCFGESEVSWQYPMSEEESSDVEIRNEENNSGLFVTVLEVSSASAAHTGLYTCYYNHTQTEENELEGRHISIHVPDPDVAFAPLGMTDYLVIVEDDDSAIIPCRTSDSETPVTLHNSEGVVPASYDSRQGFNGTFTVGPYICEATVKGKKFQTIPFNVYALKATSELDLEMEALKTVYKSGETIVVTCAVFNNEVVDAQWTYPGEVKGKGITMDEEIKVPSQKLVYTLTVPEATVKDSGDYECAARQASREVKEMKKVTISVHEKGASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPAASPAAPAPASPAAPAPSAPASDTGRPFVEMYSEIPEIIHMTEGRELVIPCRVTSPNITVTLKKFPLDTLIPDGKRIIWDSRKGFIISNATYKEIGLLTCEATVNGHLYKTNYLTHRQTNTIIDVVLSPSHGIELSVGEKLVLNCTARTELNVGIDFNWEYPSSKHQHKKLVNRDLKTQSGSEMKKFLSTLTIDGVTRSDQGLYTCAASSGLMTKKNSTFVRVHEK
SEQ ID No.69:编码PA接头的核苷酸序列
gccgctcctg ctgctccagc tcctgctgcc ccagcagccc ctgccccagc tgctcctgcagcagctcccg cagccccagc acccgccgca ccagcagctc cagcccctgc agcaccagct gctgcccctgccgcccctgc tccagccgca cccgctgcac ccgcaccagc tgccccagcc gccgcacccg cagctccagctcccgctgct cctgctgcac cagcccctgc cgctccagca gccgcaccag cagcaccagc cccagctgctcccgctgctc cagcacccgc agcccccgca gcagcaccag ccgctcctgc tcctgccgcc ccagcagctcctgctccagc agcccctgct gctgctccag cagcaccagc accagctgct ccagctgccc cagctcctgcagcacccgcc gctgctcccg cagctcctgc ccctgctgca cccgcagcac ccgctccagc agcacctgcagctgcaccag ctgctcccgc acctgccgct cccgcagctc ccgctcctgc agctccagcc gcagctcctgctgctcctgc accagcagct cccgccgcac cagctccagc tgcccctgct
SEQ ID No.70:PA接头的氨基酸序列
AAPAAPAPAAPAAPAPAAPAAAPAAPAPAAPAAPAPAAPAAAPAAPAPAAPAAPAPAAPAAAPAAPAPAAPAAPAPAAPAAAPAAPAPAAPAAPAPAAPAAAPAAPAPAAPAAPAPAAPAAAPAAPAPAAPAAPAPAAPAAAPAAPAPAAPAAPAPAAPAAAPAAPAPAAPAAPAPAAPAAAPAAPAPAAPAAPAPAAPA
参考文献列表
Andrae,Johanna,Radiosa Gallini,and Christer Betsholtz.“Role ofPlatelet-Derived Growth Factors in Physiology and Medicine.”Genes&Development22.10(2008):1276–1312.PMC.Akiyama H.,Kachi S.,Silva R.L.,Umeda N.,HackettS.F.,McCauley D.,McCauley T.,Zoltoski A.,Epstein D.M.,CampochiaroP.A.Intraocular injection of an aptamer that binds PDGF-B:A potentialtreatment for proliferative retinopathies.J.Cell.Physiol.2006;207:407–412
Aiello LP,Northrup JM,Keyt BA,et al.Hypoxic regulation of vascularendothelial growth factor in retinal cells.Arch Ophthalmol 1995;113:1538–1544.
Benjamin LE,Hemo I,Keshet E.A plasticity window for blood vesselremodelling is defined by pericyte coverage of the preformed endothelialnetwork and is regulated by PDGF-B and VEGF.Development.May 1998;125(9):1591-1598.
白玉婧,黎晓新,新生血管性老年性黄斑变性药物治疗面临的挑战与未来的发展趋势。中华眼底病杂志,第32卷1期3-7页(2016)。
Boyer DS;Ophthotech Anti-PDGF in AMD Study Group.Combined inhibitionof platelet derived(PDGF)and vascular endothelial(VEGF)growth factors for thetreatment of neovascular age-related macular degeneration(NV-AMD)-results ofa phase 1 study[ARVO abstract].Invest Ophthalmol Vis Sci.2009;50:1260.
Carmeliet P,Mechanisms of angiogenesis and arteriogenesis.NatMed.2000 Apr;6(4):389-95.Darland DC,Massingham LJ,Smith SR,Piek E,Saint-Geniez M,D’Amore PA.Pericyte production of cell-associated VEGF isdifferentiation-dependent and is associated with endothelial survival.DevBiol.2003;264:275–288
Diago T,Pulido JS,Molina JR,Collett LC,Link TP,Ryan EH.Jr.Ranibizumabcombined with low-dose sorafenib for exudative age-related maculardegeneration.Mayo Clin.Proc.83(2),231–234(2008)
Dugel PU.Anti-PDGF combination therapy in neovascular age-relatedmacular degeneration:results of a phase 2b study 2013;(March).
Erber R,Thurnher A,Katsen AD et al.Combined inhibition of VEGF andPDGF signaling enforces tumor vessel regression by interfering with pericyte-mediated endothelial cell survival mechanisms.FASEBJ.18(2),338-340
Ferrara N,Hillan KJ,Gerber HP,Novotny W.Discovery and development ofbevacizumab,an anti-VEGF antibody for treating cancer.Nat Rev DrugDiscov.2004;3:391–400
Ferrara N,Damico L,Shams N,Lowman H,Kim R.Development of ranibizumab,an anti-vascular endothelial growth factor antigen binding fragment,astherapy for neovascular age-related macular degeneration.Retina.2006;26:859–870
Fuh G,et al.Requirements for binding and signaling of the kinasedomain receptor for vascular endothelial growth factor.J Biol Chem.1998;273:11197–11204
Grothey A1,Galanis E.Targeting angiogenesis:progress with anti-VEGFtreatment with large molecules.Nat Rev Clin Oncol.2009 Sep;6(9):507-18.
E.S.Gragoudas,A.P.Adamis,E.T.Cunningham Jr,M.Feinsod,D.R.Guyer,VEGFInhibition Study in Ocular Neovascularization Clinical Trial Group Pegaptanibfor neovascular age-related macular degeneration N Engl J Med,351(2004),pp.2805–2816
Heier JS,Brown DM,Chong V,Korobelnik JF,Kaiser PK,Nguyen QD,KirchhofB,Ho A,Ogura Y,Yancopoulos GD,Stahl N,Vitti R,Berliner AJ,Soo Y,Anderesi M,Groetzbach G,Sommerauer B,Sandbrink R,Simader C,Schmidt-Erfurth U,VIEW 1 andVIEW 2 Study Groups.Intravitreal aflibercept(VEGF trap-eye)in wet age-relatedmacular degeneration.Ophthalmology.2012 Dec;119(12):2537-48.
Holash J,Davis S,Papadopoulos N,Croll SD,Ho L,Russell M,Boland P,Leidich R,Hylton D,Burova E,Ioffe E,Huang T,Radziejewski C,Bailey K,Fandl JP,Daly T,Wiegand SJ,Yancopoulos GD,Rudge JS.VEGF-Trap:a VEGF blocker withpotent antitumor effects.ProcNatl Acad Sci USA.2002;99:11393–11398
Hoch RV,Soriano P.Roles of PDGF in animal development.Development 130(20),4769–4784(2003)
Veli-Matti et al.“Structural and Mechanistic Insights intoVEGF Receptor 3 Ligand Binding and Activation.”Proceedings of the NationalAcademy of Sciences of the United States of America 110.32(2013):12960–12965.PMC.Web.30 Nov.2016.
Mahadevan D.,Yu J.-C.,Saldanha J.W.,Thanki N.,McPhie P.,Uren A.,LaRochelle W.J.,Heidaran M.A.(1995)J.Biol.Chem.270:27595–27600.
McDonald NQ,Hendrickson WA.A structural superfamily of growth factorscontaining a cystine knot motif.Cell.1993;73:421–424
Nguyen Q.High Dose Ranibizumab for Diabetic Macular Edema:Month 24Outcomes of the READ-3 Study(Ranibizumab for Edema of the mAcula in Diabetes–Protocol 3).Abstract,American Society of Retina Specialists Meeting.2014
Papadopoulos N,Martin J,Ruan Q,et al.Binding and neutralization ofvascular endothelial growth factor(VEGF)and related ligands by VEGF Trap,ranibizumab and bevacizumab.Angiogenesis.2012;15:171-185
Pachydaki SI,Jakobiec FA,Bhat P,et al.Surgical management andultrastructural study of choroidal neovascularization in punctate innerchoroidopathy after bevacizumab.J Ophthalmic Inflamm Infect.2012;2(1):29-37.doi:10.1007/s12348-011-0050-x.8–340(2004).
Pavlakovic,Helena et al.“Soluble VEGFR-2:An Anti-LymphangiogenicVariant of VEGF Receptors.”Annals of the New York Academy of Sciences1207.Suppl 1(2010):E7–15.PMC.
Reinmuth N,Liu W,Jung YD,et al.Induction of VEGF in perivascularcells defines a potential paracrine mechanism for endothelial cellsurvival.FASEB J.2001;15(7):1239-1241.
Robbins SG,Mixon RN,Wilson DJ,et al.Platelet-derived growth factorligands and receptors immunolocalized in proliferative retinaldiseases.Invest Ophthalmol Vis Sci.Sep 1994;35(10):3649-3663.
Rofagha,Soraya et al..Seven-Year Outcomes in Ranibizumab-TreatedPatients in ANCHOR,MARINA,and HORIZON.Ophthalmology,2013,Volume 120,Issue 11,2292–2299.
Rosenfeld PJ,Brown DM,Heier JS,Boyer DS,Kaiser PK,Chung CY,Kim RY,MARINA Study Group.Ranibizumab for neovascular age-related maculardegeneration.N Engl J Med.2006 Oct 5;355(14):1419-31.
Rosenfeld,Philip J.et al.Characteristics of Patients Losing Visionafter 2Years of Monthly Dosing in the Phase III Ranibizumab ClinicalTrials.Ophthalmology,2011.Volume 118,Issue 3,523-530
Sampat KM Garg SJ Complications of intravitreal injections.Curr OpinOphthalmol.2010:21:178–1 83.
Schlessinger J.Cell signaling by receptor tyrosine kinases.Cell.2000;103:211–225.
Schlapschy M.,Binder U.,Theobald I.,Wachinger K.,Kisling S.,Haller D.,Skerra A.(2013)PASylation:a biological alternative to PEGylationfor extending the plasma half-life of pharmaceutically activeproteins.Protein Eng.Des.Sel.26,489-501.
Shibuya M,Ito N,Claesson-Welsh L.Structure and function of vascularendothelial growth factor receptor-1 and-2.Curr Top Microbiol Immunol.1999;237:59–83.
Hye-Ryong Shim,Ann et al.“Structures of a Platelet-Derived GrowthFactor/propeptide Complex and a Platelet-Derived Growth Factor/receptorComplex.”Proceedings of the National Academy of Sciences of the United Statesof America 107.25(2010):11307–11312.
Stuttfeld E,Ballmer-Hofer K.Structure and function of VEGFreceptors.IUBMB Life.2009;61:915–922.
Uemura A,Ogawa M,Hirashima M,Fujiwara T,Koyama S,Takagi H,Honda Y,Wiegand SJ,Yancopoulos GD,Nishikawa S Recombinant angiopoietin-1restoreshigher-order architecture of growing blood vessels in mice in the absence ofmural cells.J Clin Invest.2002 Dec;110(11):1619-28.
Winkler F,Kozin SV,Tong RT,Chae SS,Booth MF,Garkavtsev I,Xu L,HicklinDJ,Fukumura D,di Tomaso E,Munn LL,Jain RK.Kinetics of vascular normalizationby VEGFR2 blockade governs brain tumor response to radiation:role ofoxygenation,angiopoietin-1,and matrix metalloproteinases.Cancer Cell.2004Dec;6(6):553-63.
Ying G,Kim BJ,Maguire MG,Huang J,Daniel E,Jaffe GJ,Grunwald JE,Blinder KJ,Flaxel CJ,Rahhal F,Regillo C,Martin DF,for the CATT ResearchGroup.Sustained Visual Acuity Loss in the Comparison of Age-Related MacularDegeneration Treatments Trials.JAMA Ophthalmol.2014;132(8):915-921.
Zehetner C1,Kirchmair R,Neururer SB,Kralinger MT,Bechrakis NE,Kieselbach GF.Systemic upregulation of PDGF-B in patients with neovascularAMD.Investigative Ophthalmology&Visual Science January 2014,Vol.55,337-344.
本文引用的所有参考文献通过引用完全并入本文。现在已经完全描述了本发明,本领域技术人员将会理解,本发明可以在条件,参数等的宽泛且等同的范围内实施,而不会影响本发明或其任何实施方案的精神或范围。
序列表
<110> 成都苑东生物制药股份有限公司
XL-蛋白有限责任公司
<120> PAS化的VEGFR/PDGFR融合蛋白及其在治疗中的用途
<130> Z2610PCT S3
<150> 201711136582.6
<151> 2017-11-16
<150> EP17204968.6
<151> 2017-12-01
<160> 70
<170> SIPOSequenceListing 1.0
<210> 1
<211> 600
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 1
gcctctcctg ctgcccctgc cccagcttct ccagctgctc ctgcaccttc tgctccagcc 60
gctagtcctg cagctccagc tcctgcttct cctgccgcac cagcacctag tgcccctgct 120
gcatcaccag cagctcccgc acccgctagc ccagctgcac cagctccaag tgctccagca 180
gcttcacccg cagcacccgc tccagcaagt ccagcagccc cagccccttc agcaccagct 240
gcatctcccg cagcccctgc tcctgccagc cctgccgctc ctgctccaag cgctcctgct 300
gctagtccag ccgcccctgc accagcaagt cctgctgctc ccgcacctag tgcaccagca 360
gcaagccctg cagctcctgc accagcatct ccagcagcac cagcaccatc agcccctgcc 420
gcttctcccg cagctccagc cccagcctcc cctgctgctc cagccccctc tgctcctgca 480
gcatctcctg ccgctcccgc ccctgcaagt cccgccgctc cagcaccatc cgctccagct 540
gcttccccag ccgctccagc tccagctagc cccgcagccc ccgcaccatc tgccccagca 600
<210> 2
<211> 200
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 2
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
1 5 10 15
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
20 25 30
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
35 40 45
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
50 55 60
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
65 70 75 80
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
85 90 95
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
100 105 110
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
115 120 125
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
130 135 140
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
145 150 155 160
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
165 170 175
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
180 185 190
Ala Pro Ala Pro Ser Ala Pro Ala
195 200
<210> 3
<211> 870
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 3
cagctgagcc tgccctccat cctgcctaac gagaatgaga aggtggtgca gctgaactcc 60
agcttctccc tgagatgctt tggcgagtct gaggtgtcct ggcagtaccc aatgagcgag 120
gaggagtctt ccgacgtgga gatccgcaat gaggagaaca attctggcct gttcgtgacc 180
gtgctggagg tgagctctgc ctccgccgct cacaccggcc tgtacacatg ttactataac 240
catacccaga cagaggagaa tgagctggag ggcagacaca tctacatcta tgtgcccgat 300
cctgacgtgg cctttgtgcc actgggcatg accgattacc tggtcatcgt ggaggacgat 360
gacagcgcca tcatcccctg caggaccaca gaccccgaga cacctgtgac actgcataac 420
tctgagggcg tggtgccagc cagctacgat tctcggcagg gcttcaatgg cacctttaca 480
gtgggcccct atatctgtga ggccaccgtg aagggcaaga agttccagac aatccctttt 540
aacgtgtacg ccctgaaggc taccagcgag ctggacctgg agatggaggc cctgaagaca 600
gtgtataagt ctggcgagac aatcgtggtg acatgcgccg tgttcaacaa tgaggtggtg 660
gatctgcagt ggacctaccc cggcgaggtg aagggcaagg gcatcacaat gctggaggag 720
atcaaggtgc cttctatcaa gctggtgtac accctgacag tgccagaggc caccgtgaag 780
gattccggcg actatgagtg tgccgctagg caggctaccc gggaggtgaa ggagatgaag 840
aaggtgacaa tctctgtgca cgagaaggga 870
<210> 4
<211> 290
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 4
Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val
1 5 10 15
Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val
20 25 30
Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile
35 40 45
Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val
50 55 60
Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn
65 70 75 80
His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Tyr Ile
85 90 95
Tyr Val Pro Asp Pro Asp Val Ala Phe Val Pro Leu Gly Met Thr Asp
100 105 110
Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg
115 120 125
Thr Thr Asp Pro Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val
130 135 140
Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr
145 150 155 160
Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln
165 170 175
Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp
180 185 190
Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile
195 200 205
Val Val Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Leu Gln Trp
210 215 220
Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Leu Glu Glu
225 230 235 240
Ile Lys Val Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr Val Pro Glu
245 250 255
Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala
260 265 270
Thr Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu
275 280 285
Lys Gly
290
<210> 5
<211> 603
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 5
aacgatgccg aggaactgtt catcttcctg accgagatta ccgagatcac aatcccctgc 60
cgcgtgacag atcctcagct ggtggttacc ctgcatgaga agaaaggcga cgtggccctg 120
cctgtgcctt acgatcatca gagaggcttc tccggcatct tcgaggaccg gtcttacatc 180
tgcaagacca ccatcggcga cagagaggtg gactccgacg cctactacgt gtacagactc 240
caggtgtcct ccatcaacgt gtccgtgaat gccgtgcaga cagttgtgcg gcagggcgag 300
aatatcaccc tgatgtgcat cgtgatcggc aacgaggtgg tcaacttcga gtggacctat 360
cctcggaaag aatctggccg gctggtggaa cctgtgaccg acttcctgct ggacatgccc 420
taccacatcc ggtctatcct gcacatccct tccgccgagc tggaagattc cggcacctac 480
acctgtaacg tgaccgagtc cgtgaacgac caccaggacg agaaggccat caatatcacc 540
gtggtggaat ccggctacgt gcggctgttg ggagaagtgg gcacactgca gtttgctgag 600
ctg 603
<210> 6
<211> 201
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 6
Asn Asp Ala Glu Glu Leu Phe Ile Phe Leu Thr Glu Ile Thr Glu Ile
1 5 10 15
Thr Ile Pro Cys Arg Val Thr Asp Pro Gln Leu Val Val Thr Leu His
20 25 30
Glu Lys Lys Gly Asp Val Ala Leu Pro Val Pro Tyr Asp His Gln Arg
35 40 45
Gly Phe Ser Gly Ile Phe Glu Asp Arg Ser Tyr Ile Cys Lys Thr Thr
50 55 60
Ile Gly Asp Arg Glu Val Asp Ser Asp Ala Tyr Tyr Val Tyr Arg Leu
65 70 75 80
Gln Val Ser Ser Ile Asn Val Ser Val Asn Ala Val Gln Thr Val Val
85 90 95
Arg Gln Gly Glu Asn Ile Thr Leu Met Cys Ile Val Ile Gly Asn Glu
100 105 110
Val Val Asn Phe Glu Trp Thr Tyr Pro Arg Lys Glu Ser Gly Arg Leu
115 120 125
Val Glu Pro Val Thr Asp Phe Leu Leu Asp Met Pro Tyr His Ile Arg
130 135 140
Ser Ile Leu His Ile Pro Ser Ala Glu Leu Glu Asp Ser Gly Thr Tyr
145 150 155 160
Thr Cys Asn Val Thr Glu Ser Val Asn Asp His Gln Asp Glu Lys Ala
165 170 175
Ile Asn Ile Thr Val Val Glu Ser Gly Tyr Val Arg Leu Leu Gly Glu
180 185 190
Val Gly Thr Leu Gln Phe Ala Glu Leu
195 200
<210> 7
<211> 615
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 7
agtgataccg gtagaccttt cgtagagatg tacagtgaaa tccccgaaat tatacacatg 60
actgaaggaa gggagctcgt cattccctgc cgggttacgt cacctaacat cactgttact 120
ttaaaaaagt ttccacttga cactttgatc cctgatggaa aacgcataat ctgggacagt 180
agaaagggct tcatcatatc aaatgcaacg tacaaagaaa tagggcttct gacctgtgaa 240
gcaacagtca atgggcattt gtataagaca aactatctca cacatcgaca aaccaataca 300
atcatagatg tggttctgag tccgtctcat ggaattgaac tatctgttgg agaaaagctc 360
gtcttaaatt gtacagcaag aactgaacta aatgtgggga ttgacttcaa ctgggaatac 420
ccttcttcga agcatcagca taagaaactt gtaaaccgag acctaaaaac ccagtctggg 480
agtgagatga agaaattttt gagcacctta actatagatg gtgtaacccg gagtgaccaa 540
ggattgtaca cctgtgcagc atccagtggg ctgatgacca agaagaacag cacatttgtc 600
agggtccatg aaaag 615
<210> 8
<211> 205
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 8
Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile Pro Glu
1 5 10 15
Ile Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys Arg Val
20 25 30
Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu Asp Thr
35 40 45
Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe
50 55 60
Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu
65 70 75 80
Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg
85 90 95
Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His Gly Ile
100 105 110
Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala Arg Thr
115 120 125
Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys
130 135 140
His Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln Ser Gly
145 150 155 160
Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly Val Thr
165 170 175
Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met
180 185 190
Thr Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys
195 200 205
<210> 9
<211> 69
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 9
atggggactt cccatccggc gttcctggtc ttaggctgtc ttctcacagg gctgagccta 60
atcctctgc 69
<210> 10
<211> 23
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 10
Met Gly Thr Ser His Pro Ala Phe Leu Val Leu Gly Cys Leu Leu Thr
1 5 10 15
Gly Leu Ser Leu Ile Leu Cys
20
<210> 11
<211> 21
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 11
caccatcacc atcaccacgc c 21
<210> 12
<211> 7
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 12
His His His His His His Ala
1 5
<210> 13
<211> 7190
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 13
acccacaatg gggacttccc atccggcgtt cctggtctta ggctgtcttc tcacagggct 60
gagcctaatc ctctgccagc tttcattacc ctctatcctt ccaaatgaaa atgaaaaggt 120
tgtgcagctg aattcatcct tttctctgag atgctttggg gagagtgaag tgagctggca 180
gtaccccatg tctgaagaag agtcttccga tgtggaaatc agaaatgaag aaaacaacag 240
cggccttttt gtgacggtct tggaagtgag cagtgcctcg gcggcccaca cagggttgta 300
cacttgctat tacaaccaca ctcagacaga agagaatgag cttgaaggca ggcacattta 360
catctatgtg ccagacccag atgtagcctt tgtacctcta ggaatgacgg attatttagt 420
catcgtggag gatgatgatt ctgccattat accttgtcgc acaactgatc ccgagactcc 480
tgtaacctta cacaacagtg agggggtggt acctgcctcc tacgacagca gacagggctt 540
taatgggacc ttcactgtag ggccctatat ctgtgaggcc accgtcaaag gaaagaagtt 600
ccagaccatc ccatttaatg tttatgcttt aaaagcaaca tcagagctgg atctagaaat 660
ggaagctctt aaaaccgtgt ataagtcagg ggaaacgatt gtggtcacct gtgctgtttt 720
taacaatgag gtggttgacc ttcaatggac ttaccctgga gaagtgaaag gcaaaggcat 780
cacaatgctg gaagaaatca aagtcccatc catcaaattg gtgtacactt tgacggtccc 840
cgaggccacg gtgaaagaca gtggagatta cgaatgtgct gcccgccagg ctaccaggga 900
ggtcaaagaa atgaagaaag tcactatttc tgtccatgag aaaggtgcct ctcctgctgc 960
ccctgcccca gcttctccag ctgctcctgc accttctgct ccagccgcta gtcctgcagc 1020
tccagctcct gcttctcctg ccgcaccagc acctagtgcc cctgctgcat caccagcagc 1080
tcccgcaccc gctagcccag ctgcaccagc tccaagtgct ccagcagctt cacccgcagc 1140
acccgctcca gcaagtccag cagccccagc cccttcagca ccagctgcat ctcccgcagc 1200
ccctgctcct gccagccctg ccgctcctgc tccaagcgct cctgctgcta gtccagccgc 1260
ccctgcacca gcaagtcctg ctgctcccgc acctagtgca ccagcagcaa gccctgcagc 1320
tcctgcacca gcatctccag cagcaccagc accatcagcc cctgccgctt ctcccgcagc 1380
tccagcccca gcctcccctg ctgctccagc cccctctgct cctgcagcat ctcctgccgc 1440
tcccgcccct gcaagtcccg ccgctccagc accatccgct ccagctgctt ccccagccgc 1500
tccagctcca gctagccccg cagcccccgc accatctgcc ccagcagcca gtgataccgg 1560
tagacctttc gtagagatgt acagtgaaat ccccgaaatt atacacatga ctgaaggaag 1620
ggagctcgtc attccctgcc gggttacgtc acctaacatc actgttactt taaaaaagtt 1680
tccacttgac actttgatcc ctgatggaaa acgcataatc tgggacagta gaaagggctt 1740
catcatatca aatgcaacgt acaaagaaat agggcttctg acctgtgaag caacagtcaa 1800
tgggcatttg tataagacaa actatctcac acatcgacaa accaatacaa tcatagatgt 1860
ggttctgagt ccgtctcatg gaattgaact atctgttgga gaaaagctcg tcttaaattg 1920
tacagcaaga actgaactaa atgtggggat tgacttcaac tgggaatacc cttcttcgaa 1980
gcatcagcat aagaaacttg taaaccgaga cctaaaaacc cagtctggga gtgagatgaa 2040
gaaatttttg agcaccttaa ctatagatgg tgtaacccgg agtgaccaag gattgtacac 2100
ctgtgcagca tccagtgggc tgatgaccaa gaagaacagc acatttgtca gggtccatga 2160
aaagcaccat caccatcacc acgcctgaag agcttaagct tgcggccgca gatctagctt 2220
aagtttaaac cgctgatcag cctcgactgt gccttctagt tgccagccat ctgttgtttg 2280
cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc tttcctaata 2340
aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg ggggtggggt 2400
ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg gggatgcggt 2460
gggctctatg gagcttggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 2520
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 2580
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 2640
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 2700
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 2760
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 2820
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 2880
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag 2940
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 3000
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 3060
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 3120
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 3180
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 3240
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 3300
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 3360
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 3420
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 3480
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 3540
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 3600
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 3660
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 3720
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 3780
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 3840
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 3900
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 3960
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 4020
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 4080
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 4140
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 4200
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc taggttcacc 4260
taagaatggg agcaaccagc aggaaaagga caagcagcga aaattcacgc ccccttggga 4320
ggtggcggca tatgcaaagg atagcactcc cactctacta ctgggtatca tatgctgact 4380
gtatatgcat gaggatagca tatgctaccc ggatacagat taggatagca tatactaccc 4440
agatatagat taggatagca tatgctaccc agatatagat taggatagcc tatgctaccc 4500
agatataaat taggatagca tatactaccc agatatagat taggatagca tatgctaccc 4560
agatatagat taggatagcc tatgctaccc agatatagat taggatagca tatgctaccc 4620
agatatagat taggatagca tatgctatcc agatatttgg gtagtatatg ctacccagat 4680
ataaattagg atagcatata ctaccctaat ctctattagg atagcatatg ctacccggat 4740
acagattagg atagcatata ctacccagat atagattagg atagcatatg ctacccagat 4800
atagattagg atagcctatg ctacccagat ataaattagg atagcatata ctacccagat 4860
atagattagg atagcatatg ctacccagat atagattagg atagcctatg ctacccagat 4920
atagattagg atagcatatg ctatccagat atttgggtag tatatgctac ccatggcaac 4980
attagcccac cgtgctctca gcgacctcgt gaatatgagg accaacaacc ctgtgcttgg 5040
cgctcaggcg caagtgtgtg taatttgtcc tccagatcgc agcaatcgcg cccctatctt 5100
ggcccgccca cctacttatg caggtattcc ccggggtgcc attagtggtt ttgtgggcaa 5160
gtggtttgac cgcagtggtt agcggggtta caatcagcca agttattaca cccttatttt 5220
acagtccaaa accgcagggc ggcgtgtggg ggctgacgcg tgcccccact ccacaatttc 5280
aaaaaaaaga gtggccactt gtctttgttt atgggcccca ttggcgtgga gccccgttta 5340
attttcgggg gtgttagaga caaccagtgg agtccgctgc tgtcggcgtc cactctcttt 5400
ccccttgtta caaatagagt gtaacaacat ggttcacctg tcttggtccc tgcctgggac 5460
acatcttaat aaccccagta tcatattgca ctaggattat gtgttgccca tagccataaa 5520
ttcgtgtgag atggacatcc agtctttacg gcttgtcccc accccatgga tttctattgt 5580
taaagatatt cagaatgttt cattcctaca ctagtattta ttgcccaagg ggtttgtgag 5640
ggttatattg gtgtcatagc acaatgccac cactgaaccc cccgtccaaa ttttattctg 5700
ggggcgtcac ctgaaacctt gttttcgagc acctcacata caccttactg ttcacaactc 5760
agcagttatt ctattagcta aacgaaggag aatgaagaag caggcgaaga ttcaggagag 5820
ttcactgccc gctccttgat cttcagccac tgcccttgtg actaaaatgg ttcactaccc 5880
tcgtggaatc ctgaccccat gtaaataaaa ccgtgacagc tcatggggtg ggagatatcg 5940
ctgttcctta ggaccctttt actaacccta attcgatagc atatgcttcc cgttgggtaa 6000
catatgctat tgaattaggg ttagtctgga tagtatatac tactacccgg gaagcatatg 6060
ctacccgttt agggttaaca agggggcctt ataaacacta ttgctaatgc cctcttgagg 6120
gtccgcttat cggtagctac acaggcccct ctgattgacg ttggtgtagc ctcccgtagt 6180
cttcctgggc ccctgggagg tacatgtccc ccagcattgg tgtaagagct tcagccaaga 6240
gttacacata aaggcaatgt tgtgttgcag tccacagact gcaaagtctg ctccaggatg 6300
aaagccactc agtgttggca aatgtgcaca tccatttata aggatgtcaa ctacagtcag 6360
agaacccctt tgtgtttggt ccccccccgt gtcacatgtg gaacagggcc cagttggcaa 6420
gttgtaccaa ccaactgaag ggattacatg cactgccccg cattaattgc atgaagaatc 6480
tgcttagggt taggcgtttt gcgctgcttc gcgatgtacg ggccagatat acgcgttgac 6540
attgattatt gactagttat taatagtaat caattacggg gtcattagtt catagcccat 6600
atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg 6660
acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 6720
tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag 6780
tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 6840
attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag 6900
tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt ggatagcggt 6960
ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 7020
accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg acgcaaatgg 7080
gcggtaggcg tgtacggtgg gaggtctata taagcagagc tctctggcta actagagaac 7140
ccactgctta ctggcttatc gaaattaata cgactcacta tagggtctag 7190
<210> 14
<211> 726
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 14
Met Gly Thr Ser His Pro Ala Phe Leu Val Leu Gly Cys Leu Leu Thr
1 5 10 15
Gly Leu Ser Leu Ile Leu Cys Gln Leu Ser Leu Pro Ser Ile Leu Pro
20 25 30
Asn Glu Asn Glu Lys Val Val Gln Leu Asn Ser Ser Phe Ser Leu Arg
35 40 45
Cys Phe Gly Glu Ser Glu Val Ser Trp Gln Tyr Pro Met Ser Glu Glu
50 55 60
Glu Ser Ser Asp Val Glu Ile Arg Asn Glu Glu Asn Asn Ser Gly Leu
65 70 75 80
Phe Val Thr Val Leu Glu Val Ser Ser Ala Ser Ala Ala His Thr Gly
85 90 95
Leu Tyr Thr Cys Tyr Tyr Asn His Thr Gln Thr Glu Glu Asn Glu Leu
100 105 110
Glu Gly Arg His Ile Tyr Ile Tyr Val Pro Asp Pro Asp Val Ala Phe
115 120 125
Val Pro Leu Gly Met Thr Asp Tyr Leu Val Ile Val Glu Asp Asp Asp
130 135 140
Ser Ala Ile Ile Pro Cys Arg Thr Thr Asp Pro Glu Thr Pro Val Thr
145 150 155 160
Leu His Asn Ser Glu Gly Val Val Pro Ala Ser Tyr Asp Ser Arg Gln
165 170 175
Gly Phe Asn Gly Thr Phe Thr Val Gly Pro Tyr Ile Cys Glu Ala Thr
180 185 190
Val Lys Gly Lys Lys Phe Gln Thr Ile Pro Phe Asn Val Tyr Ala Leu
195 200 205
Lys Ala Thr Ser Glu Leu Asp Leu Glu Met Glu Ala Leu Lys Thr Val
210 215 220
Tyr Lys Ser Gly Glu Thr Ile Val Val Thr Cys Ala Val Phe Asn Asn
225 230 235 240
Glu Val Val Asp Leu Gln Trp Thr Tyr Pro Gly Glu Val Lys Gly Lys
245 250 255
Gly Ile Thr Met Leu Glu Glu Ile Lys Val Pro Ser Ile Lys Leu Val
260 265 270
Tyr Thr Leu Thr Val Pro Glu Ala Thr Val Lys Asp Ser Gly Asp Tyr
275 280 285
Glu Cys Ala Ala Arg Gln Ala Thr Arg Glu Val Lys Glu Met Lys Lys
290 295 300
Val Thr Ile Ser Val His Glu Lys Gly Ala Ser Pro Ala Ala Pro Ala
305 310 315 320
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
325 330 335
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
340 345 350
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
355 360 365
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
370 375 380
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
385 390 395 400
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
405 410 415
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
420 425 430
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
435 440 445
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
450 455 460
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
465 470 475 480
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
485 490 495
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
500 505 510
Ala Ala Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile
515 520 525
Pro Glu Ile Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys
530 535 540
Arg Val Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu
545 550 555 560
Asp Thr Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys
565 570 575
Gly Phe Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr
580 585 590
Cys Glu Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr
595 600 605
His Arg Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His
610 615 620
Gly Ile Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala
625 630 635 640
Arg Thr Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser
645 650 655
Ser Lys His Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln
660 665 670
Ser Gly Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly
675 680 685
Val Thr Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly
690 695 700
Leu Met Thr Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys His
705 710 715 720
His His His His His Ala
725
<210> 15
<211> 2088
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 15
cagctttcat taccctctat ccttccaaat gaaaatgaaa aggttgtgca gctgaattca 60
tccttttctc tgagatgctt tggggagagt gaagtgagct ggcagtaccc catgtctgaa 120
gaagagtctt ccgatgtgga aatcagaaat gaagaaaaca acagcggcct ttttgtgacg 180
gtcttggaag tgagcagtgc ctcggcggcc cacacagggt tgtacacttg ctattacaac 240
cacactcaga cagaagagaa tgagcttgaa ggcaggcaca tttacatcta tgtgccagac 300
ccagatgtag cctttgtacc tctaggaatg acggattatt tagtcatcgt ggaggatgat 360
gattctgcca ttataccttg tcgcacaact gatcccgaga ctcctgtaac cttacacaac 420
agtgaggggg tggtacctgc ctcctacgac agcagacagg gctttaatgg gaccttcact 480
gtagggccct atatctgtga ggccaccgtc aaaggaaaga agttccagac catcccattt 540
aatgtttatg ctttaaaagc aacatcagag ctggatctag aaatggaagc tcttaaaacc 600
gtgtataagt caggggaaac gattgtggtc acctgtgctg tttttaacaa tgaggtggtt 660
gaccttcaat ggacttaccc tggagaagtg aaaggcaaag gcatcacaat gctggaagaa 720
atcaaagtcc catccatcaa attggtgtac actttgacgg tccccgaggc cacggtgaaa 780
gacagtggag attacgaatg tgctgcccgc caggctacca gggaggtcaa agaaatgaag 840
aaagtcacta tttctgtcca tgagaaaggt gcctctcctg ctgcccctgc cccagcttct 900
ccagctgctc ctgcaccttc tgctccagcc gctagtcctg cagctccagc tcctgcttct 960
cctgccgcac cagcacctag tgcccctgct gcatcaccag cagctcccgc acccgctagc 1020
ccagctgcac cagctccaag tgctccagca gcttcacccg cagcacccgc tccagcaagt 1080
ccagcagccc cagccccttc agcaccagct gcatctcccg cagcccctgc tcctgccagc 1140
cctgccgctc ctgctccaag cgctcctgct gctagtccag ccgcccctgc accagcaagt 1200
cctgctgctc ccgcacctag tgcaccagca gcaagccctg cagctcctgc accagcatct 1260
ccagcagcac cagcaccatc agcccctgcc gcttctcccg cagctccagc cccagcctcc 1320
cctgctgctc cagccccctc tgctcctgca gcatctcctg ccgctcccgc ccctgcaagt 1380
cccgccgctc cagcaccatc cgctccagct gcttccccag ccgctccagc tccagctagc 1440
cccgcagccc ccgcaccatc tgccccagca gccagtgata ccggtagacc tttcgtagag 1500
atgtacagtg aaatccccga aattatacac atgactgaag gaagggagct cgtcattccc 1560
tgccgggtta cgtcacctaa catcactgtt actttaaaaa agtttccact tgacactttg 1620
atccctgatg gaaaacgcat aatctgggac agtagaaagg gcttcatcat atcaaatgca 1680
acgtacaaag aaatagggct tctgacctgt gaagcaacag tcaatgggca tttgtataag 1740
acaaactatc tcacacatcg acaaaccaat acaatcatag atgtggttct gagtccgtct 1800
catggaattg aactatctgt tggagaaaag ctcgtcttaa attgtacagc aagaactgaa 1860
ctaaatgtgg ggattgactt caactgggaa tacccttctt cgaagcatca gcataagaaa 1920
cttgtaaacc gagacctaaa aacccagtct gggagtgaga tgaagaaatt tttgagcacc 1980
ttaactatag atggtgtaac ccggagtgac caaggattgt acacctgtgc agcatccagt 2040
gggctgatga ccaagaagaa cagcacattt gtcagggtcc atgaaaag 2088
<210> 16
<211> 696
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 16
Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val
1 5 10 15
Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val
20 25 30
Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile
35 40 45
Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val
50 55 60
Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn
65 70 75 80
His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Tyr Ile
85 90 95
Tyr Val Pro Asp Pro Asp Val Ala Phe Val Pro Leu Gly Met Thr Asp
100 105 110
Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg
115 120 125
Thr Thr Asp Pro Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val
130 135 140
Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr
145 150 155 160
Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln
165 170 175
Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp
180 185 190
Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile
195 200 205
Val Val Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Leu Gln Trp
210 215 220
Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Leu Glu Glu
225 230 235 240
Ile Lys Val Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr Val Pro Glu
245 250 255
Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala
260 265 270
Thr Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu
275 280 285
Lys Gly Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
290 295 300
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
305 310 315 320
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
325 330 335
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
340 345 350
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
355 360 365
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
370 375 380
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
385 390 395 400
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
405 410 415
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
420 425 430
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
435 440 445
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
450 455 460
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
465 470 475 480
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Asp Thr Gly Arg
485 490 495
Pro Phe Val Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile His Met Thr
500 505 510
Glu Gly Arg Glu Leu Val Ile Pro Cys Arg Val Thr Ser Pro Asn Ile
515 520 525
Thr Val Thr Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly
530 535 540
Lys Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala
545 550 555 560
Thr Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr Val Asn Gly
565 570 575
His Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg Gln Thr Asn Thr Ile
580 585 590
Ile Asp Val Val Leu Ser Pro Ser His Gly Ile Glu Leu Ser Val Gly
595 600 605
Glu Lys Leu Val Leu Asn Cys Thr Ala Arg Thr Glu Leu Asn Val Gly
610 615 620
Ile Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys His Gln His Lys Lys
625 630 635 640
Leu Val Asn Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu Met Lys Lys
645 650 655
Phe Leu Ser Thr Leu Thr Ile Asp Gly Val Thr Arg Ser Asp Gln Gly
660 665 670
Leu Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met Thr Lys Lys Asn Ser
675 680 685
Thr Phe Val Arg Val His Glu Lys
690 695
<210> 17
<211> 1105
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 17
tctagaccca caatggggac ttcccatccg gcgttcctgg tcttaggctg tcttctcaca 60
gggctgagcc taatcctctg ccagctttca ttaccctcta tccttccaaa tgaaaatgaa 120
aaggttgtgc agctgaattc atccttttct ctgagatgct ttggggagag tgaagtgagc 180
tggcagtacc ccatgtctga agaagagtct tccgatgtgg aaatcagaaa tgaagaaaac 240
aacagcggcc tttttgtgac ggtcttggaa gtgagcagtg cctcggcggc ccacacaggg 300
ttgtacactt gctattacaa ccacactcag acagaagaga atgagcttga aggcaggcac 360
atttacatct atgtgccaga cccagatgta gcctttgtac ctctaggaat gacggattat 420
ttagtcatcg tggaggatga tgattctgcc attatacctt gtcgcacaac tgatcccgag 480
actcctgtaa ccttacacaa cagtgagggg gtggtacctg cctcctacga cagcagacag 540
ggctttaatg ggaccttcac tgtagggccc tatatctgtg aggccaccgt caaaggaaag 600
aagttccaga ccatcccatt taatgtttat gctttaaaag caacatcaga gctggatcta 660
gaaatggaag ctcttaaaac cgtgtataag tcaggggaaa cgattgtggt cacctgtgct 720
gtttttaaca atgaggtggt tgaccttcaa tggacttacc ctggagaagt gaaaggcaaa 780
ggcatcacaa tgctggaaga aatcaaagtc ccatccatca aattggtgta cactttgacg 840
gtccccgagg ccacggtgaa agacagtgga gattacgaat gtgctgcccg ccaggctacc 900
agggaggtca aagaaatgaa gaaagtcact atttctgtcc atgagaaagg tgccagaaga 960
gcagatctgg gctcttctgc ccaccatcac catcaccatt aagcttgcgg ctcttctgcc 1020
agtgataccg gtagaccttt cgtagagatg tacagtgaaa tccccgaaat tatacacatg 1080
actgaaggaa gggagctcta agctt 1105
<210> 18
<211> 2206
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 18
tctagaccca caatggggac ttcccatccg gcgttcctgg tcttaggctg tcttctcaca 60
gggctgagcc taatcctctg ccagctttca ttaccctcta tccttccaaa tgaaaatgaa 120
aaggttgtgc agctgaattc atccttttct ctgagatgct ttggggagag tgaagtgagc 180
tggcagtacc ccatgtctga agaagagtct tccgatgtgg aaatcagaaa tgaagaaaac 240
aacagcggcc tttttgtgac ggtcttggaa gtgagcagtg cctcggcggc ccacacaggg 300
ttgtacactt gctattacaa ccacactcag acagaagaga atgagcttga aggcaggcac 360
atttacatct atgtgccaga cccagatgta gcctttgtac ctctaggaat gacggattat 420
ttagtcatcg tggaggatga tgattctgcc attatacctt gtcgcacaac tgatcccgag 480
actcctgtaa ccttacacaa cagtgagggg gtggtacctg cctcctacga cagcagacag 540
ggctttaatg ggaccttcac tgtagggccc tatatctgtg aggccaccgt caaaggaaag 600
aagttccaga ccatcccatt taatgtttat gctttaaaag caacatcaga gctggatcta 660
gaaatggaag ctcttaaaac cgtgtataag tcaggggaaa cgattgtggt cacctgtgct 720
gtttttaaca atgaggtggt tgaccttcaa tggacttacc ctggagaagt gaaaggcaaa 780
ggcatcacaa tgctggaaga aatcaaagtc ccatccatca aattggtgta cactttgacg 840
gtccccgagg ccacggtgaa agacagtgga gattacgaat gtgctgcccg ccaggctacc 900
agggaggtca aagaaatgaa gaaagtcact atttctgtcc atgagaaagg tgcctctcct 960
gctgcccctg ccccagcttc tccagctgct cctgcacctt ctgctccagc cgctagtcct 1020
gcagctccag ctcctgcttc tcctgccgca ccagcaccta gtgcccctgc tgcatcacca 1080
gcagctcccg cacccgctag cccagctgca ccagctccaa gtgctccagc agcttcaccc 1140
gcagcacccg ctccagcaag tccagcagcc ccagcccctt cagcaccagc tgcatctccc 1200
gcagcccctg ctcctgccag ccctgccgct cctgctccaa gcgctcctgc tgctagtcca 1260
gccgcccctg caccagcaag tcctgctgct cccgcaccta gtgcaccagc agcaagccct 1320
gcagctcctg caccagcatc tccagcagca ccagcaccat cagcccctgc cgcttctccc 1380
gcagctccag ccccagcctc ccctgctgct ccagccccct ctgctcctgc agcatctcct 1440
gccgctcccg cccctgcaag tcccgccgct ccagcaccat ccgctccagc tgcttcccca 1500
gccgctccag ctccagctag ccccgcagcc cccgcaccat ctgccccagc agccagtgat 1560
accggtagac ctttcgtaga gatgtacagt gaaatccccg aaattataca catgactgaa 1620
ggaagggagc tcgtcattcc ctgccgggtt acgtcaccta acatcactgt tactttaaaa 1680
aagtttccac ttgacacttt gatccctgat ggaaaacgca taatctggga cagtagaaag 1740
ggcttcatca tatcaaatgc aacgtacaaa gaaatagggc ttctgacctg tgaagcaaca 1800
gtcaatgggc atttgtataa gacaaactat ctcacacatc gacaaaccaa tacaatcata 1860
gatgtggttc tgagtccgtc tcatggaatt gaactatctg ttggagaaaa gctcgtctta 1920
aattgtacag caagaactga actaaatgtg gggattgact tcaactggga atacccttct 1980
tcgaagcatc agcataagaa acttgtaaac cgagacctaa aaacccagtc tgggagtgag 2040
atgaagaaat ttttgagcac cttaactata gatggtgtaa cccggagtga ccaaggattg 2100
tacacctgtg cagcatccag tgggctgatg accaagaaga acagcacatt tgtcagggtc 2160
catgaaaagc accatcacca tcaccacgcc tgaagagctt aagctt 2206
<210> 19
<211> 870
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 19
cagctgagcc tgccaagcat cctgcctaac gaaaatgaga aggtggtcca gctgaacagc 60
tccttcagtc tgagatgctt tggcgaatca gaggtgagct ggcagtaccc aatgtcagag 120
gaagagtcta gtgacgtgga aattaggaat gaagagaaca attcaggact gttcgtgacc 180
gtcctggagg tgtcaagcgc cagcgccgct cacaccggac tgtacacatg ttactataac 240
catactcaga ccgaagagaa tgaactggag gggaggcaca tctccatcca cgtgcccgat 300
cctgacgtgg cctttgcccc actgggaatg acagattacc tggtcatcgt cgaggacgat 360
gactctgcca tcattccctg ccgcacctca gactccgaaa ctcctgtgac cctgcataac 420
agtgagggcg tggtccccgc ctcctacgat tctcgacagg gattcaatgg caccttcacc 480
gtcggaccct atatctgtga ggccactgtg aagggcaaga aattccagac cattcctttt 540
aacgtgtacg cactgaaagc cacatccgaa ctggacctgg aaatggaggc cctgaagact 600
gtctataaat ctggagagac tatcgtggtc acctgcgccg tgttcaacaa tgaagtggtc 660
gatgcgcagt ggacttaccc cggcgaggtc aagggcaaag ggattaccat ggacgaagag 720
atcaaggtgc ctagccagaa gctggtgtac accctgacag tcccagaagc caccgtgaag 780
gattccgggg actatgagtg tgcagcccgg caggcctcca gagaagtgaa ggagatgaag 840
aaagtgacaa tcagtgtcca cgagaaagga 870
<210> 20
<211> 290
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 20
Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val
1 5 10 15
Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val
20 25 30
Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile
35 40 45
Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val
50 55 60
Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn
65 70 75 80
His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Ser Ile
85 90 95
His Val Pro Asp Pro Asp Val Ala Phe Ala Pro Leu Gly Met Thr Asp
100 105 110
Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg
115 120 125
Thr Ser Asp Ser Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val
130 135 140
Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr
145 150 155 160
Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln
165 170 175
Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp
180 185 190
Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile
195 200 205
Val Val Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Ala Gln Trp
210 215 220
Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Asp Glu Glu
225 230 235 240
Ile Lys Val Pro Ser Gln Lys Leu Val Tyr Thr Leu Thr Val Pro Glu
245 250 255
Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala
260 265 270
Ser Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu
275 280 285
Lys Gly
290
<210> 21
<211> 2472
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 21
atgggtacaa gccatcccgc cttcctggtc ctgggttgcc tgctgactgg tctgtctctg 60
atcctgtgcc agctgagcct gccttcaatc ctgcccaacg agaatgagaa ggtggtgcag 120
ctgaactcca gcttcagcct gagatgcttt ggcgagtctg aggtgtcctg gcagtaccct 180
atgtctgagg aggagtcttc cgacgtggag atccgcaatg aggagaacaa ttccggcctg 240
ttcgtgaccg tgctggaggt gagctctgcc agcgccgctc acaccggcct gtacacatgt 300
tactataacc atacccagac agaggagaat gagctggagg gcagacacat ctacatctat 360
gtgcccgatc ctgacgtggc ctttgtgcca ctgggcatga ccgattacct ggtcatcgtg 420
gaggacgatg actctgccat catcccctgc aggaccacag acccagagac acccgtgaca 480
ctgcataact ccgagggagt ggtgccagct agctacgatt ctcggcaggg cttcaatggc 540
acctttacag tgggccccta tatctgtgag gccaccgtga agggcaagaa gttccagaca 600
atccctttta acgtgtacgc cctgaaggct acctctgagc tggacctgga gatggaggcc 660
ctgaagacag tgtataagtc cggcgagaca atcgtggtga catgcgccgt gttcaacaat 720
gaggtggtgg atctgcagtg gacctaccct ggcgaggtga agggcaaggg catcacaatg 780
ctggaggaga tcaaggtgcc ttccatcaag ctggtgtaca ccctgacagt gccagaggcc 840
accgtgaagg atagcggcga ctatgagtgt gctgctaggc aggctaccag ggaggtgaag 900
gagatgaaga aggtgacaat ctccgtgcac gagaagggag ctagcccagc tgctccagct 960
ccagctagcc ccgccgctcc tgctccatct gctcctgctg cttccccagc tgctcccgcc 1020
cctgcttctc ctgctgctcc agctccatcc gccccagctg cttctcctgc cgctcctgcc 1080
ccagcttccc cagccgctcc cgccccttcc gctccagccg cctctcccgc cgcccctgct 1140
ccagctagcc cagcagcccc agccccttct gctccagccg cctctccagc cgcccctgct 1200
cccgcatccc ccgccgcccc cgccccttcc gcccctgccg cctccccagc tgccccagct 1260
cctgcctctc ctgctgcccc tgctccatcc gctccagccg ccagtcccgc cgcccccgct 1320
ccagctagcc cagccgcacc agccccttct gctcccgccg cctctcccgc cgcacctgct 1380
ccagcatccc ccgccgcccc agccccttcc gcccctgcag cctccccagc tgcccccgct 1440
cctgcctctc ctgcagcccc tgctccttcc gctccagccg catctcccgc cgccccagcc 1500
ccagctagcc cagcagcacc agccccctct gctccagccg ccagccctgc cgcccctgct 1560
cccgcttccc ccgccgcccc agcaccttcc gcccctgccg catccccagc agcccccgct 1620
cctgccagcc ctgctgcccc tgcaccttcc gctccagccg cttctcccgc cgccccagca 1680
cccgctagcc cagctgcccc tgccccttct gctccagcag cctctcctgc cgcccctgct 1740
cctgcatccc ccgccgcacc cgccccttcc gcccccgccg cctccccagc tgcaccagct 1800
ccagcctctc cagctgctcc agctccttcc gccccagcta gcgataccgg ccgccctttt 1860
gtggagatgt acagcgagat ccccgagatc atccacatga ccgagggcag ggagctggtc 1920
atcccatgcc gggtgacatc tcccaacatc accgtgacac tgaagaagtt ccctctggat 1980
accctgatcc cagacggcaa gagaatcatc tgggactctc gcaagggctt tatcatctcc 2040
aatgccacat ataaggagat cggcctgctg acctgcgagg ctacagtgaa cggccacctg 2100
tacaagacca attatctgac acataggcag accaacacaa tcatcgatgt ggtgctgagc 2160
ccatctcatg gcatcgagct gagcgtgggc gagaagctgg tgctgaattg taccgcccgg 2220
acagagctga acgtgggcat cgacttcaat tgggagtacc cttccagcaa gcaccagcat 2280
aagaagctgg tgaacagaga tctgaagacc cagtccggca gcgagatgaa gaagtttctg 2340
agcaccctga caatcgatgg cgtgacccgc tctgaccagg gcctgtatac atgtgccgct 2400
tcttccggcc tgatgactaa gaaaaactcc acctttgtgc gggtccacga aaaacaccac 2460
caccaccacc at 2472
<210> 22
<211> 824
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 22
Met Gly Thr Ser His Pro Ala Phe Leu Val Leu Gly Cys Leu Leu Thr
1 5 10 15
Gly Leu Ser Leu Ile Leu Cys Gln Leu Ser Leu Pro Ser Ile Leu Pro
20 25 30
Asn Glu Asn Glu Lys Val Val Gln Leu Asn Ser Ser Phe Ser Leu Arg
35 40 45
Cys Phe Gly Glu Ser Glu Val Ser Trp Gln Tyr Pro Met Ser Glu Glu
50 55 60
Glu Ser Ser Asp Val Glu Ile Arg Asn Glu Glu Asn Asn Ser Gly Leu
65 70 75 80
Phe Val Thr Val Leu Glu Val Ser Ser Ala Ser Ala Ala His Thr Gly
85 90 95
Leu Tyr Thr Cys Tyr Tyr Asn His Thr Gln Thr Glu Glu Asn Glu Leu
100 105 110
Glu Gly Arg His Ile Tyr Ile Tyr Val Pro Asp Pro Asp Val Ala Phe
115 120 125
Val Pro Leu Gly Met Thr Asp Tyr Leu Val Ile Val Glu Asp Asp Asp
130 135 140
Ser Ala Ile Ile Pro Cys Arg Thr Thr Asp Pro Glu Thr Pro Val Thr
145 150 155 160
Leu His Asn Ser Glu Gly Val Val Pro Ala Ser Tyr Asp Ser Arg Gln
165 170 175
Gly Phe Asn Gly Thr Phe Thr Val Gly Pro Tyr Ile Cys Glu Ala Thr
180 185 190
Val Lys Gly Lys Lys Phe Gln Thr Ile Pro Phe Asn Val Tyr Ala Leu
195 200 205
Lys Ala Thr Ser Glu Leu Asp Leu Glu Met Glu Ala Leu Lys Thr Val
210 215 220
Tyr Lys Ser Gly Glu Thr Ile Val Val Thr Cys Ala Val Phe Asn Asn
225 230 235 240
Glu Val Val Asp Leu Gln Trp Thr Tyr Pro Gly Glu Val Lys Gly Lys
245 250 255
Gly Ile Thr Met Leu Glu Glu Ile Lys Val Pro Ser Ile Lys Leu Val
260 265 270
Tyr Thr Leu Thr Val Pro Glu Ala Thr Val Lys Asp Ser Gly Asp Tyr
275 280 285
Glu Cys Ala Ala Arg Gln Ala Thr Arg Glu Val Lys Glu Met Lys Lys
290 295 300
Val Thr Ile Ser Val His Glu Lys Gly Ala Ser Pro Ala Ala Pro Ala
305 310 315 320
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
325 330 335
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
340 345 350
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
355 360 365
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
370 375 380
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
385 390 395 400
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
405 410 415
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
420 425 430
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
435 440 445
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
450 455 460
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
465 470 475 480
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
485 490 495
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
500 505 510
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
515 520 525
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
530 535 540
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
545 550 555 560
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
565 570 575
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
580 585 590
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
595 600 605
Pro Ser Ala Pro Ala Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr
610 615 620
Ser Glu Ile Pro Glu Ile Ile His Met Thr Glu Gly Arg Glu Leu Val
625 630 635 640
Ile Pro Cys Arg Val Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys
645 650 655
Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp
660 665 670
Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly
675 680 685
Leu Leu Thr Cys Glu Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn
690 695 700
Tyr Leu Thr His Arg Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser
705 710 715 720
Pro Ser His Gly Ile Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn
725 730 735
Cys Thr Ala Arg Thr Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu
740 745 750
Tyr Pro Ser Ser Lys His Gln His Lys Lys Leu Val Asn Arg Asp Leu
755 760 765
Lys Thr Gln Ser Gly Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr
770 775 780
Ile Asp Gly Val Thr Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala
785 790 795 800
Ser Ser Gly Leu Met Thr Lys Lys Asn Ser Thr Phe Val Arg Val His
805 810 815
Glu Lys His His His His His His
820
<210> 23
<211> 2772
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 23
atgggtactt cacatcctgc ttttctggtc ctgggttgtc tgctgactgg tctgagcctg 60
atcctgtgcc agctgagcct gccctccatc ctgcctaacg agaatgagaa ggtggtgcag 120
ctgaactcca gcttctccct gagatgcttt ggcgagtctg aggtgtcctg gcagtaccca 180
atgagcgagg aggagtcttc cgacgtggag atccgcaatg aggagaacaa ttctggcctg 240
ttcgtgaccg tgctggaggt gagctctgcc tccgccgctc acaccggcct gtacacatgt 300
tactataacc atacccagac agaggagaat gagctggagg gcagacacat ctacatctat 360
gtgcccgatc ctgacgtggc ctttgtgcca ctgggcatga ccgattacct ggtcatcgtg 420
gaggacgatg acagcgccat catcccctgc aggaccacag accccgagac acctgtgaca 480
ctgcataact ctgagggcgt ggtgccagcc agctacgatt ctcggcaggg cttcaatggc 540
acctttacag tgggccccta tatctgtgag gccaccgtga agggcaagaa gttccagaca 600
atccctttta acgtgtacgc cctgaaggct accagcgagc tggacctgga gatggaggcc 660
ctgaagacag tgtataagtc tggcgagaca atcgtggtga catgcgccgt gttcaacaat 720
gaggtggtgg atctgcagtg gacctacccc ggcgaggtga agggcaaggg catcacaatg 780
ctggaggaga tcaaggtgcc ttctatcaag ctggtgtaca ccctgacagt gccagaggcc 840
accgtgaagg attccggcga ctatgagtgt gccgctaggc aggctacccg ggaggtgaag 900
gagatgaaga aggtgacaat ctctgtgcac gagaagggag cttccccagc tgctccagct 960
ccagcttccc ccgccgctcc tgccccatct gctccagctg cctctccagc tgctccagct 1020
cctgctagcc ctgccgctcc agccccctcc gcccctgccg cttctccagc cgctcctgcc 1080
ccagctagcc ctgctgctcc agctccttcc gctccagccg cctctccagc cgctccagcc 1140
cccgcctctc ctgctgcccc agctccttct gctccagctg ccagccccgc cgcccctgcc 1200
cccgcctctc ccgctgcccc tgctccttcc gccccagctg cctcccctgc tgctcctgcc 1260
ccagcttcac ctgccgcccc tgccccttcc gctccagccg catctcccgc cgctccagcc 1320
cccgcaagcc ctgcagcccc agctccctct gctccagctg cctcacccgc cgcccctgcc 1380
cctgcctctc ccgctgcccc cgctccttcc gccccagcag cctcccctgc agctcctgcc 1440
ccagcttctc cagccgctcc cgccccttcc gctcccgccg cctctcctgc tgcaccagcc 1500
cccgcttccc cagctgctcc tgctccatcc gccccagctg cttccccagc tgctccagct 1560
ccagcttccc ccgccgctcc tgccccatct gctccagctg cctctccagc tgctccagct 1620
cctgctagcc ctgccgctcc agccccctcc gcccctgccg cttctccagc cgctcctgcc 1680
ccagctagcc ctgctgctcc agctccttcc gctccagccg cctctccagc cgctccagcc 1740
cccgcctctc ctgctgcccc agctccttct gctccagctg ccagccccgc cgcccctgcc 1800
cccgcctctc ccgctgcccc tgctccttcc gccccagctg cctcccctgc tgctcctgcc 1860
ccagcttcac ctgccgcccc tgccccttcc gctccagccg catctcccgc cgctccagcc 1920
cccgcaagcc ctgcagcccc agctccctct gctccagctg cctcacccgc cgcccctgcc 1980
cctgcctctc ccgctgcccc cgctccttcc gccccagcag cctcccctgc agctcctgcc 2040
ccagcttctc cagccgctcc cgccccttcc gctcccgccg cctctcctgc tgcaccagcc 2100
cccgcttccc cagctgctcc tgctccatcc gccccagcta gcgataccgg ccgccctttt 2160
gtggagatgt acagcgagat ccctgagatc atccacatga ccgagggcag ggagctggtc 2220
atcccatgcc gggtgacatc tcccaacatc accgtgacac tgaagaagtt ccctctggat 2280
accctgatcc cagacggcaa gagaatcatc tgggacagcc gcaagggctt tatcatctct 2340
aatgccacat ataaggagat cggcctgctg acctgcgagg ctacagtgaa cggccacctg 2400
tacaagacca attatctgac acataggcag accaacacaa tcatcgatgt ggtgctgagc 2460
ccctctcatg gcatcgagct gtccgtgggc gagaagctgg tgctgaattg taccgcccgg 2520
acagagctga acgtgggcat cgacttcaat tgggagtacc cttccagcaa gcaccagcat 2580
aagaagctgg tgaacagaga tctgaagacc cagtccggca gcgagatgaa gaagtttctg 2640
tccaccctga caatcgatgg agtgacccgc agcgaccagg gcctgtatac atgtgccgct 2700
tcttccggcc tgatgactaa gaaaaatagc acctttgtga gggtccacga aaaacaccac 2760
caccaccacc at 2772
<210> 24
<211> 924
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 24
Met Gly Thr Ser His Pro Ala Phe Leu Val Leu Gly Cys Leu Leu Thr
1 5 10 15
Gly Leu Ser Leu Ile Leu Cys Gln Leu Ser Leu Pro Ser Ile Leu Pro
20 25 30
Asn Glu Asn Glu Lys Val Val Gln Leu Asn Ser Ser Phe Ser Leu Arg
35 40 45
Cys Phe Gly Glu Ser Glu Val Ser Trp Gln Tyr Pro Met Ser Glu Glu
50 55 60
Glu Ser Ser Asp Val Glu Ile Arg Asn Glu Glu Asn Asn Ser Gly Leu
65 70 75 80
Phe Val Thr Val Leu Glu Val Ser Ser Ala Ser Ala Ala His Thr Gly
85 90 95
Leu Tyr Thr Cys Tyr Tyr Asn His Thr Gln Thr Glu Glu Asn Glu Leu
100 105 110
Glu Gly Arg His Ile Tyr Ile Tyr Val Pro Asp Pro Asp Val Ala Phe
115 120 125
Val Pro Leu Gly Met Thr Asp Tyr Leu Val Ile Val Glu Asp Asp Asp
130 135 140
Ser Ala Ile Ile Pro Cys Arg Thr Thr Asp Pro Glu Thr Pro Val Thr
145 150 155 160
Leu His Asn Ser Glu Gly Val Val Pro Ala Ser Tyr Asp Ser Arg Gln
165 170 175
Gly Phe Asn Gly Thr Phe Thr Val Gly Pro Tyr Ile Cys Glu Ala Thr
180 185 190
Val Lys Gly Lys Lys Phe Gln Thr Ile Pro Phe Asn Val Tyr Ala Leu
195 200 205
Lys Ala Thr Ser Glu Leu Asp Leu Glu Met Glu Ala Leu Lys Thr Val
210 215 220
Tyr Lys Ser Gly Glu Thr Ile Val Val Thr Cys Ala Val Phe Asn Asn
225 230 235 240
Glu Val Val Asp Leu Gln Trp Thr Tyr Pro Gly Glu Val Lys Gly Lys
245 250 255
Gly Ile Thr Met Leu Glu Glu Ile Lys Val Pro Ser Ile Lys Leu Val
260 265 270
Tyr Thr Leu Thr Val Pro Glu Ala Thr Val Lys Asp Ser Gly Asp Tyr
275 280 285
Glu Cys Ala Ala Arg Gln Ala Thr Arg Glu Val Lys Glu Met Lys Lys
290 295 300
Val Thr Ile Ser Val His Glu Lys Gly Ala Ser Pro Ala Ala Pro Ala
305 310 315 320
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
325 330 335
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
340 345 350
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
355 360 365
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
370 375 380
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
385 390 395 400
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
405 410 415
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
420 425 430
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
435 440 445
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
450 455 460
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
465 470 475 480
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
485 490 495
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
500 505 510
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
515 520 525
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
530 535 540
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
545 550 555 560
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
565 570 575
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
580 585 590
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
595 600 605
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
610 615 620
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
625 630 635 640
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
645 650 655
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
660 665 670
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
675 680 685
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
690 695 700
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ser Asp Thr Gly Arg Pro Phe
705 710 715 720
Val Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile His Met Thr Glu Gly
725 730 735
Arg Glu Leu Val Ile Pro Cys Arg Val Thr Ser Pro Asn Ile Thr Val
740 745 750
Thr Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly Lys Arg
755 760 765
Ile Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala Thr Tyr
770 775 780
Lys Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr Val Asn Gly His Leu
785 790 795 800
Tyr Lys Thr Asn Tyr Leu Thr His Arg Gln Thr Asn Thr Ile Ile Asp
805 810 815
Val Val Leu Ser Pro Ser His Gly Ile Glu Leu Ser Val Gly Glu Lys
820 825 830
Leu Val Leu Asn Cys Thr Ala Arg Thr Glu Leu Asn Val Gly Ile Asp
835 840 845
Phe Asn Trp Glu Tyr Pro Ser Ser Lys His Gln His Lys Lys Leu Val
850 855 860
Asn Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu Met Lys Lys Phe Leu
865 870 875 880
Ser Thr Leu Thr Ile Asp Gly Val Thr Arg Ser Asp Gln Gly Leu Tyr
885 890 895
Thr Cys Ala Ala Ser Ser Gly Leu Met Thr Lys Lys Asn Ser Thr Phe
900 905 910
Val Arg Val His Glu Lys His His His His His His
915 920
<210> 25
<211> 2181
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 25
atggtctctt attgggacac tggggtgctg ctgtgcgccc tgctgagttg cctgctgctg 60
actggttctt cttccgggag cgataccggc cgccccttcg tggagatgta cagcgagatc 120
cctgagatca tccacatgac cgagggcagg gagctggtca tcccttgccg ggtgacatct 180
ccaaacatca ccgtgacact gaagaagttc cccctggata ccctgatccc tgacggcaag 240
agaatcatct gggactctcg caagggcttt atcatctcca atgccaccta taaggagatc 300
ggcctgctga cctgcgaggc tacagtgaac ggccacctgt acaagaccaa ttatctgaca 360
catcggcaga ccaacacaat catcgatgtg gtgctgagcc cttctcatgg catcgagctg 420
tccgtgggcg agaagctggt gctgaattgt accgccagaa cagagctgaa cgtgggcatc 480
gatttcaatt gggagtaccc atccagcaag caccagcata agaagctggt gaacagggac 540
ctgaagaccc agtccggcag cgagatgaag aagtttctgt ctaccctgac aatcgatgga 600
gtgacccgct ccgaccaggg cctgtataca tgtgccgctt cttccggcct gatgaccaag 660
aagaatagca catttgtgag ggtgcacgag aaggcctccc cagctgctcc agctcctgct 720
agcccagccg ctccagcccc ctctgctcca gccgcttccc ccgccgctcc tgccccagct 780
tctccagccg ctcccgcccc ttccgcccct gccgcttctc ctgctgctcc agcccctgcc 840
tctcctgccg ctcctgcccc atccgctccc gccgctagcc ctgccgctcc cgcccctgct 900
agccctgctg cccctgctcc ttctgctcct gctgcctctc cagctgcccc agctcctgcc 960
tcccctgctg cccctgcacc atccgcccca gccgcttctc ctgcagctcc agcccctgcc 1020
agccctgctg ccccagctcc ttccgctcct gctgccagtc cagctgcccc tgctcctgct 1080
agccctgctg cacctgctcc ttctgctccc gctgcctctc cagctgcacc agctcctgcc 1140
tcccccgctg cccctgctcc atccgccccc gccgcttctc ctgccgcccc agcccctgcc 1200
tctccagctg ctccagctcc ctccgctcct gctgccagcc cagctgcccc tgcacctgct 1260
agccctgctg ctcctgcccc ctctgcccca gctcagctgt ctctgccatc catcctgccc 1320
aacgagaatg agaaggtggt gcagctgaac agctctttct ctctgcggtg ctttggcgag 1380
agcgaggtgt cttggcagta ccccatgtcc gaggaggagt ccagcgacgt ggagatcaga 1440
aatgaggaga acaatagcgg cctgttcgtg accgtgctgg aggtgtcttc cgcctctgcc 1500
gctcacaccg gcctgtacac atgttactat aaccataccc agacagagga gaatgagctg 1560
gagggccggc acatctacat ctatgtgcct gatccagacg tggcctttgt gcccctgggc 1620
atgaccgatt acctggtcat cgtggaggac gatgactccg ccatcatccc ttgccgcacc 1680
acagaccccg agacacctgt gacactgcat aacagcgagg gagtggtgcc agcttcctac 1740
gatagcaggc agggcttcaa tggcaccttt acagtgggcc cttatatctg tgaggccacc 1800
gtgaagggca agaagttcca gacaatcccc ttcaacgtgt acgccctgaa ggctacctcc 1860
gagctggacc tggagatgga ggccctgaag acagtgtata agagcggcga gacaatcgtg 1920
gtgacatgcg ccgtgttcaa caatgaggtg gtggatctgc agtggaccta ccctggcgag 1980
gtgaagggca agggcatcac aatgctggag gagatcaagg tgccaagcat caagctggtg 2040
tacaccctga cagtgcccga ggccaccgtg aaggattctg gcgactatga gtgtgccgct 2100
aggcaggcta cacgggaggt gaaagaaatg aagaaggtca caatcagcgt ccacgaaaag 2160
gggcatcacc accaccacca t 2181
<210> 26
<211> 727
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 26
Met Val Ser Tyr Trp Asp Thr Gly Val Leu Leu Cys Ala Leu Leu Ser
1 5 10 15
Cys Leu Leu Leu Thr Gly Ser Ser Ser Gly Ser Asp Thr Gly Arg Pro
20 25 30
Phe Val Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile His Met Thr Glu
35 40 45
Gly Arg Glu Leu Val Ile Pro Cys Arg Val Thr Ser Pro Asn Ile Thr
50 55 60
Val Thr Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly Lys
65 70 75 80
Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala Thr
85 90 95
Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr Val Asn Gly His
100 105 110
Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg Gln Thr Asn Thr Ile Ile
115 120 125
Asp Val Val Leu Ser Pro Ser His Gly Ile Glu Leu Ser Val Gly Glu
130 135 140
Lys Leu Val Leu Asn Cys Thr Ala Arg Thr Glu Leu Asn Val Gly Ile
145 150 155 160
Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys His Gln His Lys Lys Leu
165 170 175
Val Asn Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu Met Lys Lys Phe
180 185 190
Leu Ser Thr Leu Thr Ile Asp Gly Val Thr Arg Ser Asp Gln Gly Leu
195 200 205
Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met Thr Lys Lys Asn Ser Thr
210 215 220
Phe Val Arg Val His Glu Lys Ala Ser Pro Ala Ala Pro Ala Pro Ala
225 230 235 240
Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala
245 250 255
Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala
260 265 270
Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser
275 280 285
Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala
290 295 300
Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala
305 310 315 320
Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala
325 330 335
Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala
340 345 350
Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser
355 360 365
Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala
370 375 380
Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala
385 390 395 400
Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala
405 410 415
Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Gln
420 425 430
Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val Gln
435 440 445
Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val Ser
450 455 460
Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile Arg
465 470 475 480
Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val Ser
485 490 495
Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn His
500 505 510
Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Tyr Ile Tyr
515 520 525
Val Pro Asp Pro Asp Val Ala Phe Val Pro Leu Gly Met Thr Asp Tyr
530 535 540
Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg Thr
545 550 555 560
Thr Asp Pro Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val Val
565 570 575
Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr Val
580 585 590
Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln Thr
595 600 605
Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp Leu
610 615 620
Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile Val
625 630 635 640
Val Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Leu Gln Trp Thr
645 650 655
Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Leu Glu Glu Ile
660 665 670
Lys Val Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr Val Pro Glu Ala
675 680 685
Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala Thr
690 695 700
Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu Lys
705 710 715 720
Gly His His His His His His
725
<210> 27
<211> 2262
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 27
atgggcacca gccatcctgc ttttctggtg ctgggatgcc tgctgaccgg cctgtctctg 60
attctgtgcc agctgtccct gccttccatc ctgcctaacg agaacgagaa ggtggtgcag 120
ctgaactcct ccttctctct gcggtgcttc ggcgagtccg aagtgtcttg gcagtacccc 180
atgtccgaag aggaatcctc cgacgtggaa atccggaacg aggaaaacaa ctccggcctg 240
ttcgtgaccg tgctggaagt gtcctctgcc tctgctgctc acaccggact gtacacctgt 300
tactacaatc acacccagac cgaagagaac gagctggaag gccggcacat ctacatctac 360
gtgcccgatc ctgacgtggc ctttgtgcct ctgggcatga ccgactacct ggtcatcgtg 420
gaagatgacg actccgctat catcccctgc cggaccacag atcctgagac acctgtgaca 480
ctgcacaact ccgaaggcgt ggtgcctgcc tcctacgatt ctagacaggg cttcaacggc 540
accttcaccg tgggacctta catctgcgag gctaccgtga agggcaagaa gttccagaca 600
atccccttca acgtgtacgc cctgaaggcc acctctgagc tggacctgga aatggaagcc 660
ctgaaaaccg tgtacaagag cggcgagaca atcgtcgtga cctgcgccgt gttcaacaac 720
gaggtggtgg acctgcagtg gacctatcct ggcgaagtga aaggcaaggg catcaccatg 780
ctggaagaga tcaaggtgcc ctccatcaag ctggtgtata ccctgaccgt gcctgaggcc 840
acagtgaagg actctggcga ctacgagtgt gccgctagac aggccaccag agaagtcaaa 900
gagatgaaga aagtcaccat ctccgtgcac gagaaaggcg gcggaggcgg aagcggtggc 960
ggaggaagcg gaggcggcgg atctgcttct cctgctgctc cagctccagc ttctccagca 1020
gctcctgcac cttctgcacc agctgcaagt cctgcagcac ccgcaccagc tagtcctgcc 1080
gctcctgctc ctagtgctcc tgccgcaagt ccagctgctc ccgctcctgc atcaccagcc 1140
gcaccagcac caagtgctcc agctgcctct ccagcagcac cagctccagc aagccctgct 1200
gcaccagcac cttcagctcc agcagcatca cccgctgcac ccgctccagc atctcccgct 1260
gctccagcac caagcgcacc cgctgctagc ccagccgctc cagctcctgc cagtcctgct 1320
gctcctgcac catctgctcc cgcagcttca ccagctgctc ccgcaccagc tagcccagca 1380
gcaccagcac catctgcacc cgccgcatct cccgccgcac cagctccagc tagtcccgca 1440
gctcccgctc catctgctcc agccgctagt cccgctgctc ctgctccagc tagtcctgct 1500
gcacccgctc ctagcgcacc agctgcttca cccgcagctc cagctccagc ttcacccgct 1560
gcaccagctc catctgctcc agctggtggc ggaggatctg gcggaggcgg atctggcggc 1620
ggtggttctt ctgataccgg cagacccttc gtggaaatgt acagcgagat ccccgagatc 1680
atccacatga ccgagggcag agagctggtc atcccttgca gagtgacctc tcctaacatc 1740
acagtgaccc tgaagaagtt tcccctggac acactgatcc ccgacggcaa gagaatcatc 1800
tgggactccc ggaagggctt catcatctcc aacgccacct acaaagagat cggactgctg 1860
acctgcgaag ccactgtgaa cggccacctg tacaagacca actatctgac ccacagacag 1920
accaacacca tcatcgacgt ggtgctgagc ccctctcatg gcatcgagct gtccgtggga 1980
gagaaactgg tgctgaactg caccgccaga accgagctga acgtgggcat cgacttcaac 2040
tgggagtacc ccagctccaa acaccagcac aagaagctgg tcaaccggga tctgaaaacc 2100
cagtccggct ccgaaatgaa gaaattcctg agcaccctga ccatcgacgg cgtgaccaga 2160
tctgaccagg gcctgtatac ctgtgccgcc tcttctggcc tgatgaccaa gaaaaactcc 2220
accttcgtgc gggtccacga gaagcaccat caccaccatc at 2262
<210> 28
<211> 754
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 28
Met Gly Thr Ser His Pro Ala Phe Leu Val Leu Gly Cys Leu Leu Thr
1 5 10 15
Gly Leu Ser Leu Ile Leu Cys Gln Leu Ser Leu Pro Ser Ile Leu Pro
20 25 30
Asn Glu Asn Glu Lys Val Val Gln Leu Asn Ser Ser Phe Ser Leu Arg
35 40 45
Cys Phe Gly Glu Ser Glu Val Ser Trp Gln Tyr Pro Met Ser Glu Glu
50 55 60
Glu Ser Ser Asp Val Glu Ile Arg Asn Glu Glu Asn Asn Ser Gly Leu
65 70 75 80
Phe Val Thr Val Leu Glu Val Ser Ser Ala Ser Ala Ala His Thr Gly
85 90 95
Leu Tyr Thr Cys Tyr Tyr Asn His Thr Gln Thr Glu Glu Asn Glu Leu
100 105 110
Glu Gly Arg His Ile Tyr Ile Tyr Val Pro Asp Pro Asp Val Ala Phe
115 120 125
Val Pro Leu Gly Met Thr Asp Tyr Leu Val Ile Val Glu Asp Asp Asp
130 135 140
Ser Ala Ile Ile Pro Cys Arg Thr Thr Asp Pro Glu Thr Pro Val Thr
145 150 155 160
Leu His Asn Ser Glu Gly Val Val Pro Ala Ser Tyr Asp Ser Arg Gln
165 170 175
Gly Phe Asn Gly Thr Phe Thr Val Gly Pro Tyr Ile Cys Glu Ala Thr
180 185 190
Val Lys Gly Lys Lys Phe Gln Thr Ile Pro Phe Asn Val Tyr Ala Leu
195 200 205
Lys Ala Thr Ser Glu Leu Asp Leu Glu Met Glu Ala Leu Lys Thr Val
210 215 220
Tyr Lys Ser Gly Glu Thr Ile Val Val Thr Cys Ala Val Phe Asn Asn
225 230 235 240
Glu Val Val Asp Leu Gln Trp Thr Tyr Pro Gly Glu Val Lys Gly Lys
245 250 255
Gly Ile Thr Met Leu Glu Glu Ile Lys Val Pro Ser Ile Lys Leu Val
260 265 270
Tyr Thr Leu Thr Val Pro Glu Ala Thr Val Lys Asp Ser Gly Asp Tyr
275 280 285
Glu Cys Ala Ala Arg Gln Ala Thr Arg Glu Val Lys Glu Met Lys Lys
290 295 300
Val Thr Ile Ser Val His Glu Lys Gly Gly Gly Gly Gly Ser Gly Gly
305 310 315 320
Gly Gly Ser Gly Gly Gly Gly Ser Ala Ser Pro Ala Ala Pro Ala Pro
325 330 335
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
340 345 350
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
355 360 365
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
370 375 380
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
385 390 395 400
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
405 410 415
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
420 425 430
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
435 440 445
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
450 455 460
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
465 470 475 480
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
485 490 495
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
500 505 510
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
515 520 525
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ser
530 535 540
Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile Pro Glu Ile
545 550 555 560
Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys Arg Val Thr
565 570 575
Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu Asp Thr Leu
580 585 590
Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe Ile
595 600 605
Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu Ala
610 615 620
Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg Gln
625 630 635 640
Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His Gly Ile Glu
645 650 655
Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala Arg Thr Glu
660 665 670
Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys His
675 680 685
Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln Ser Gly Ser
690 695 700
Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly Val Thr Arg
705 710 715 720
Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met Thr
725 730 735
Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys His His His His
740 745 750
His His
<210> 29
<211> 2271
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 29
atggtgtcct actgggatac aggcgtgctg ctgtgtgccc tgctgtcttg tctgctgctg 60
accggctcct cttctggctc tgataccggc agacccttcg tggaaatgta cagcgagatc 120
cccgagatca tccacatgac cgagggcaga gagctggtca tcccctgcag agtgacctct 180
cctaacatca ccgtgactct gaagaagttc cctctggaca cactgatccc cgacggcaag 240
agaatcatct gggactcccg gaagggcttc atcatctcca acgccaccta caaagagatc 300
ggcctgctga cctgcgaggc caccgttaat ggccacctgt acaagaccaa ctatctgacc 360
cacagacaga ccaacaccat catcgacgtg gtgctgagcc cctctcatgg catcgagctg 420
tccgtgggag aaaagctggt gctgaactgc accgccagaa ccgagctgaa cgtgggcatc 480
gacttcaact gggagtaccc ctccagcaag caccagcaca agaagctggt caaccgggac 540
ctgaaaaccc agtccggctc cgagatgaag aaattcctga gcaccctgac catcgacggc 600
gtgaccagat ctgaccaggg cctgtatacc tgcgccgctt cctctggcct gatgaccaag 660
aaaaactcca ccttcgtgcg ggtgcacgag aaaggtggcg gaggatctgg cggaggcggc 720
tctggcggcg gtggatctgc ttctcctgct gctccagctc cagcttctcc agcagctcct 780
gcaccttctg caccagctgc aagtcctgca gcacccgcac cagctagtcc tgccgctcct 840
gctcctagtg ctcctgccgc aagtccagct gctcccgctc ctgcaagccc agctgcacca 900
gcaccaagtg ctccagctgc ctcaccagcc gcaccagctc cagcaagccc tgcagctccc 960
gctccttcag ctcctgctgc ttctcccgca gcacccgctc cagcatcacc agccgctcca 1020
gcaccatcag ctccagcagc atctcctgca gctccagctc ctgctagtcc cgctgctccc 1080
gcacctagtg caccagccgc ttctcccgcc gctcctgctc ctgcatctcc tgctgcaccc 1140
gctccatctg ctcccgccgc atcacccgca gctcccgcac cagcctctcc agctgcacca 1200
gctcctagcg caccagcagc tagcccagct gctcctgcac cagctagccc cgcagctcca 1260
gctccaagcg ctcctgctgc atccccagct gctccagctc ctgcctcacc agctgctcca 1320
gcaccttctg ctcccgctgg cggtggcgga agcggaggtg gtggtagtgg cggcggaggt 1380
tctcagctgt ccctgccttc tatcctgcct aacgagaacg agaaggtggt ccagctgaac 1440
tcctccttct ctctgcggtg cttcggcgag tccgaagtgt cttggcagta ccccatgtcc 1500
gaagaggaat cctccgacgt ggaaatccgg aacgaggaaa acaactccgg cctgttcgtg 1560
accgtgctgg aagtgtcctc tgcctctgct gctcacaccg gcctgtacac atgctactac 1620
aatcacaccc agaccgaaga gaacgagctg gaaggccggc acatctacat ctacgtgccc 1680
gatcctgacg tggcctttgt gcctctgggc atgaccgact acctggtcat cgtggaagat 1740
gacgactccg ctatcatccc ttgccggacc accgatccag agacacctgt gacactgcac 1800
aactccgaag gcgtggtgcc tgcctcctac gattctagac agggcttcaa cggcaccttc 1860
accgtgggac cttacatctg cgaggctaca gtgaagggca agaagtttca gacaatcccc 1920
ttcaacgtgt acgccctgaa ggccacctct gagctggacc tggaaatgga agctctgaaa 1980
accgtgtaca agtccggcga gacaatcgtc gtgacctgtg ccgtgttcaa caacgaagtg 2040
gtggacctgc agtggaccta tcctggcgaa gtgaaaggca agggcatcac catgctggaa 2100
gagatcaagg tgccctccat caagctggtg tataccctga ccgtgcctga ggccactgtg 2160
aaggactctg gcgactacga gtgtgccgct agacaggcca ccagagaagt caaagaaatg 2220
aagaaagtga ccatctccgt ccacgagaag ggccaccacc accatcacca t 2271
<210> 30
<211> 757
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 30
Met Val Ser Tyr Trp Asp Thr Gly Val Leu Leu Cys Ala Leu Leu Ser
1 5 10 15
Cys Leu Leu Leu Thr Gly Ser Ser Ser Gly Ser Asp Thr Gly Arg Pro
20 25 30
Phe Val Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile His Met Thr Glu
35 40 45
Gly Arg Glu Leu Val Ile Pro Cys Arg Val Thr Ser Pro Asn Ile Thr
50 55 60
Val Thr Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly Lys
65 70 75 80
Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala Thr
85 90 95
Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr Val Asn Gly His
100 105 110
Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg Gln Thr Asn Thr Ile Ile
115 120 125
Asp Val Val Leu Ser Pro Ser His Gly Ile Glu Leu Ser Val Gly Glu
130 135 140
Lys Leu Val Leu Asn Cys Thr Ala Arg Thr Glu Leu Asn Val Gly Ile
145 150 155 160
Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys His Gln His Lys Lys Leu
165 170 175
Val Asn Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu Met Lys Lys Phe
180 185 190
Leu Ser Thr Leu Thr Ile Asp Gly Val Thr Arg Ser Asp Gln Gly Leu
195 200 205
Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met Thr Lys Lys Asn Ser Thr
210 215 220
Phe Val Arg Val His Glu Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly
225 230 235 240
Ser Gly Gly Gly Gly Ser Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
245 250 255
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
260 265 270
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
275 280 285
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
290 295 300
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
305 310 315 320
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
325 330 335
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
340 345 350
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
355 360 365
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
370 375 380
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
385 390 395 400
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
405 410 415
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
420 425 430
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Gly Gly
435 440 445
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Leu Ser
450 455 460
Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val Gln Leu Asn
465 470 475 480
Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val Ser Trp Gln
485 490 495
Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile Arg Asn Glu
500 505 510
Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val Ser Ser Ala
515 520 525
Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn His Thr Gln
530 535 540
Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Tyr Ile Tyr Val Pro
545 550 555 560
Asp Pro Asp Val Ala Phe Val Pro Leu Gly Met Thr Asp Tyr Leu Val
565 570 575
Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg Thr Thr Asp
580 585 590
Pro Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val Val Pro Ala
595 600 605
Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr Val Gly Pro
610 615 620
Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln Thr Ile Pro
625 630 635 640
Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp Leu Glu Met
645 650 655
Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile Val Val Thr
660 665 670
Cys Ala Val Phe Asn Asn Glu Val Val Asp Leu Gln Trp Thr Tyr Pro
675 680 685
Gly Glu Val Lys Gly Lys Gly Ile Thr Met Leu Glu Glu Ile Lys Val
690 695 700
Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr Val Pro Glu Ala Thr Val
705 710 715 720
Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala Thr Arg Glu
725 730 735
Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu Lys Gly His
740 745 750
His His His His His
755
<210> 31
<211> 2160
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 31
atgggctggt cctgcatcat cctgtttctg gtggctaccg ctaccggcgt gcactctcac 60
caccatcacc atcacgcttc tccagccgct ccagctcctg cttctcctgc tgcaccagca 120
ccatctgctc cagctgcaag tccagctgct cccgcaccag caagtcctgc agcacccgct 180
cctagtgctc cagcagcatc tcccgcagca ccagctccag cttcaccagc agctcccgct 240
ccatcagcac cagccgcatc acccgctgct ccagcaccag cttctcccgc cgctcctgca 300
ccttctgcac ccgcagctag ccctgctgct cctgctccag catctccagc tgcacccgct 360
ccaagcgcac ccgctgctag tccagcagca ccagcaccag ctagtcccgc tgctccagct 420
ccttctgctc cagcagcttc accagccgct ccagcaccag ctagcccagc cgcaccagca 480
cctagtgctc ccgccgctag tcctgcagct ccagctcctg ctagcccagc tgctcccgct 540
cctagcgctc ctgccgcttc accagctgca ccagctccag caagtccagc cgctcctgct 600
ccaagtgcac cagctgcctc tccagctgct cctgctcctg caagtcccgc agctccagca 660
cctagcgcac cagcatctga taccggcaga cccttcgtgg aaatgtacag cgagatcccc 720
gagatcatcc acatgaccga gggcagagag ctggtcatcc cctgcagagt gacctctcct 780
aacatcaccg tgactctgaa gaagttccct ctggacacac tgatccccga cggcaagaga 840
atcatctggg actcccggaa gggcttcatc atctccaacg ccacctacaa agagatcggc 900
ctgctgacct gcgaggccac cgttaatggc cacctgtaca agaccaacta tctgacccac 960
agacagacca acaccatcat cgacgtggtg ctgagcccct ctcatggcat cgagctgtcc 1020
gtgggagaaa agctcgtgct gaactgcacc gccagaaccg agctgaacgt gggcatcgac 1080
ttcaactggg agtaccccag ctccaaacac cagcacaaga aactggtcaa ccgggacctg 1140
aaaacccagt ccggctccga gatgaagaaa ttcctgagca ccctgaccat cgacggcgtg 1200
accagatctg accagggcct gtatacctgc gccgcttctt ctggcctgat gaccaagaaa 1260
aactccacct tcgtgcgcgt gcacgagaag cagctgtccc tgccttctat cctgcctaac 1320
gagaacgaga aggtggtcca gctgaactcc tccttctctc tgcggtgctt cggcgagtcc 1380
gaagtgtctt ggcagtaccc catgtccgaa gaggaatcct ccgacgtgga aatccggaac 1440
gaggaaaaca actccggcct gttcgtgacc gtgctggaag tgtcctctgc ctctgctgct 1500
cacaccggcc tgtacacatg ctactacaat cacacccaga ccgaagagaa cgagctggaa 1560
ggccggcaca tctacatcta cgtgcccgat cctgacgtgg cctttgtgcc tctgggcatg 1620
accgactacc tggtcatcgt ggaagatgac gactccgcta tcatcccttg ccggaccacc 1680
gatccagaga cacctgtgac actgcacaac tccgaaggcg tggtgcctgc ctcctacgat 1740
tctagacagg gcttcaacgg caccttcacc gtgggacctt acatctgcga ggctacagtg 1800
aagggcaaga agtttcagac aatccccttc aacgtgtacg ccctgaaggc cacctctgag 1860
ctggacctgg aaatggaagc tctgaaaacc gtgtacaagt ccggcgagac aatcgtcgtg 1920
acctgtgccg tgttcaacaa cgaggtggtg gacctgcagt ggacctatcc tggcgaagtg 1980
aaaggcaagg gcatcaccat gctggaagag atcaaggtgc cctccatcaa gctggtgtat 2040
accctgaccg tgcctgaggc cactgtgaag gactctggcg actacgagtg tgccgctaga 2100
caggccacca gagaagtcaa agaaatgaag aaagtgacca tctccgtcca cgagaagggc 2160
<210> 32
<211> 720
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 32
Met Gly Trp Ser Cys Ile Ile Leu Phe Leu Val Ala Thr Ala Thr Gly
1 5 10 15
Val His Ser His His His His His His Ala Ser Pro Ala Ala Pro Ala
20 25 30
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
35 40 45
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
50 55 60
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
65 70 75 80
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
85 90 95
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
100 105 110
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
115 120 125
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
130 135 140
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
145 150 155 160
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
165 170 175
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
180 185 190
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
195 200 205
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
210 215 220
Ala Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile Pro
225 230 235 240
Glu Ile Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys Arg
245 250 255
Val Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu Asp
260 265 270
Thr Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys Gly
275 280 285
Phe Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr Cys
290 295 300
Glu Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr His
305 310 315 320
Arg Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His Gly
325 330 335
Ile Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala Arg
340 345 350
Thr Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser Ser
355 360 365
Lys His Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln Ser
370 375 380
Gly Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly Val
385 390 395 400
Thr Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly Leu
405 410 415
Met Thr Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys Gln Leu
420 425 430
Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val Gln Leu
435 440 445
Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val Ser Trp
450 455 460
Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile Arg Asn
465 470 475 480
Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val Ser Ser
485 490 495
Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn His Thr
500 505 510
Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Tyr Ile Tyr Val
515 520 525
Pro Asp Pro Asp Val Ala Phe Val Pro Leu Gly Met Thr Asp Tyr Leu
530 535 540
Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg Thr Thr
545 550 555 560
Asp Pro Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val Val Pro
565 570 575
Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr Val Gly
580 585 590
Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln Thr Ile
595 600 605
Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp Leu Glu
610 615 620
Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile Val Val
625 630 635 640
Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Leu Gln Trp Thr Tyr
645 650 655
Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Leu Glu Glu Ile Lys
660 665 670
Val Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr Val Pro Glu Ala Thr
675 680 685
Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala Thr Arg
690 695 700
Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu Lys Gly
705 710 715 720
<210> 33
<211> 2160
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 33
atgggctggt cctgcatcat cctgtttctg gtggctaccg ctaccggcgt gcactctcac 60
caccatcacc atcacgcttc tccagccgct ccagctcctg cttctcctgc tgcaccagca 120
ccatctgctc cagctgcaag tccagctgct cccgcaccag caagtcctgc agcacccgct 180
cctagtgctc cagcagcatc tcccgcagca ccagctccag cttcaccagc agctcccgct 240
ccatcagcac cagccgcatc acccgctgct ccagcaccag cttctcccgc cgctcctgca 300
ccttctgcac ccgcagctag ccctgctgct cctgctccag catctccagc tgcacccgct 360
ccaagcgcac ccgctgctag tccagcagca ccagcaccag ctagtcccgc tgctccagct 420
ccttctgctc cagcagcttc accagccgct ccagcaccag ctagcccagc cgcaccagca 480
cctagtgctc ccgccgctag tcctgcagct ccagctcctg ctagcccagc tgctcccgct 540
cctagcgctc ctgccgcttc accagctgca ccagctccag caagtccagc cgctcctgct 600
ccaagtgcac cagctgcctc tccagctgct cctgctcctg caagtcccgc agctccagca 660
cctagcgcac cagctcaact gtccctgcct tccatcctgc ctaacgagaa cgagaaggtg 720
gtccagctga actcctcctt ctctctgcgg tgcttcggcg agtccgaagt gtcttggcag 780
taccccatgt ccgaagagga atcctccgac gtggaaatcc ggaacgagga aaacaactcc 840
ggcctgttcg tgaccgtgct ggaagtgtcc tctgcctctg ctgctcacac cggcctgtac 900
acctgttact acaatcacac ccagaccgaa gagaacgagc tggaaggccg gcacatctac 960
atctacgtgc ccgatcctga cgtggccttt gtgcctctgg gcatgaccga ctacctggtc 1020
atcgtggaag atgacgactc cgctatcatc ccctgccgga ccacagatcc tgagacacct 1080
gtgacactgc acaactccga aggcgtggtg cctgcctcct acgattctag acagggcttc 1140
aacggcacct tcaccgtggg accttacatc tgcgaggcta ccgtgaaggg caagaagttc 1200
cagacaatcc ccttcaacgt gtacgccctg aaggccacct ctgagctgga cctggaaatg 1260
gaagccctga aaaccgtgta caagtccggc gagacaatcg tcgtgacctg cgccgtgttc 1320
aacaacgagg tggtggacct gcagtggacc tatcctggcg aagtgaaagg caagggcatc 1380
accatgctgg aagagatcaa ggtgccctcc atcaagctgg tgtataccct gaccgtgcct 1440
gaggccacag tgaaggactc tggcgactac gagtgtgccg ctagacaggc caccagagaa 1500
gtcaaagaga tgaagaaagt caccatctcc gtgcacgaga agggctccga taccggcaga 1560
cccttcgtgg aaatgtacag cgagatcccc gagatcatcc acatgaccga gggcagagag 1620
ctggtcatcc cttgcagagt gacctctcct aacatcacag tgaccctgaa gaagtttccc 1680
ctggacacac tgatccccga cggcaagaga atcatctggg actcccggaa gggcttcatc 1740
atctccaacg ccacctacaa agagatcggc ctgctgacct gtgaagccac cgtgaatggc 1800
cacctgtaca agaccaacta tctgacccac agacagacca acaccatcat cgacgtggtg 1860
ctgtccccaa gccatggcat cgagctgtcc gtgggagaaa agctcgtgct gaactgcacc 1920
gccagaaccg agctgaacgt gggcatcgac ttcaactggg agtaccccag ctccaaacac 1980
cagcacaaga aactggtcaa ccgggacctc aagacccagt ccggctccga aatgaagaaa 2040
ttcctgagca ccctgaccat cgacggcgtg accagatctg accagggact gtatacctgt 2100
gccgcctcct ctggcctgat gaccaagaaa aactccacct tcgtgcgggt ccacgagaag 2160
<210> 34
<211> 720
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 34
Met Gly Trp Ser Cys Ile Ile Leu Phe Leu Val Ala Thr Ala Thr Gly
1 5 10 15
Val His Ser His His His His His His Ala Ser Pro Ala Ala Pro Ala
20 25 30
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
35 40 45
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
50 55 60
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
65 70 75 80
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
85 90 95
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
100 105 110
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
115 120 125
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
130 135 140
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
145 150 155 160
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
165 170 175
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
180 185 190
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
195 200 205
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
210 215 220
Ala Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val
225 230 235 240
Val Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu
245 250 255
Val Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu
260 265 270
Ile Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu
275 280 285
Val Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr
290 295 300
Asn His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Tyr
305 310 315 320
Ile Tyr Val Pro Asp Pro Asp Val Ala Phe Val Pro Leu Gly Met Thr
325 330 335
Asp Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys
340 345 350
Arg Thr Thr Asp Pro Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly
355 360 365
Val Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe
370 375 380
Thr Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe
385 390 395 400
Gln Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu
405 410 415
Asp Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr
420 425 430
Ile Val Val Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Leu Gln
435 440 445
Trp Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Leu Glu
450 455 460
Glu Ile Lys Val Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr Val Pro
465 470 475 480
Glu Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln
485 490 495
Ala Thr Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His
500 505 510
Glu Lys Gly Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu
515 520 525
Ile Pro Glu Ile Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro
530 535 540
Cys Arg Val Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro
545 550 555 560
Leu Asp Thr Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg
565 570 575
Lys Gly Phe Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu
580 585 590
Thr Cys Glu Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu
595 600 605
Thr His Arg Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser
610 615 620
His Gly Ile Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr
625 630 635 640
Ala Arg Thr Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro
645 650 655
Ser Ser Lys His Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr
660 665 670
Gln Ser Gly Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp
675 680 685
Gly Val Thr Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser
690 695 700
Gly Leu Met Thr Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys
705 710 715 720
<210> 35
<211> 1893
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 35
atgggctggt cctgcatcat cctgtttctg gtggctaccg ctaccggcgt gcactctcac 60
caccatcacc atcacgcttc tccagccgct ccagctcctg cttctcctgc tgcaccagca 120
ccatctgctc cagctgcaag tccagctgct cccgcaccag caagtcctgc agcacccgct 180
cctagtgctc cagcagcatc tcccgcagca ccagctccag cttcaccagc agctcccgct 240
ccatcagcac cagccgcatc acccgctgct ccagcaccag cttctcccgc cgctcctgca 300
ccttctgcac ccgcagctag ccctgctgct cctgctccag catctccagc tgcacccgct 360
ccaagcgcac ccgctgctag tccagcagca ccagcaccag ctagtcccgc tgctccagct 420
ccttctgctc cagcagcttc accagccgct ccagcaccag ctagcccagc cgcaccagca 480
cctagtgctc ccgccgctag tcctgcagct ccagctcctg ctagcccagc tgctcccgct 540
cctagcgctc ctgccgcttc accagctgca ccagctccag caagtccagc cgctcctgct 600
ccaagtgcac cagctgcctc tccagctgct cctgctcctg caagtcccgc agctccagca 660
cctagcgcac cagcatctga taccggcaga cccttcgtgg aaatgtacag cgagatcccc 720
gagatcatcc acatgaccga gggcagagag ctggtcatcc cctgcagagt gacctctcct 780
aacatcaccg tgactctgaa gaagttccct ctggacacac tgatccccga cggcaagaga 840
atcatctggg actcccggaa gggcttcatc atctccaacg ccacctacaa agagatcggc 900
ctgctgacct gcgaggccac cgttaatggc cacctgtaca agaccaacta tctgacccac 960
agacagacca acaccatcat cgacgtggtg ctgagcccct ctcatggcat cgagctgtcc 1020
gtgggagaaa agctcgtgct gaactgcacc gccagaaccg agctgaacgt gggcatcgac 1080
ttcaactggg agtaccccag ctccaaacac cagcacaaga aactggtcaa ccgggacctg 1140
aaaacccagt ccggctccga gatgaagaaa ttcctgagca ccctgaccat cgacggcgtg 1200
accagatctg accagggcct gtatacctgc gccgcttctt ctggcctgat gaccaagaaa 1260
aactccacct tcgtgcgcgt gcacgagaag aacgatgccg aggaactgtt catcttcctg 1320
accgagatta ccgagatcac aatcccctgc cgcgtgacag atcctcagct ggtggttacc 1380
ctgcatgaga agaaaggcga cgtggccctg cctgtgcctt acgatcatca gagaggcttc 1440
tccggcatct tcgaggaccg gtcttacatc tgcaagacca ccatcggcga cagagaggtg 1500
gactccgacg cctactacgt gtacagactc caggtgtcct ccatcaacgt gtccgtgaat 1560
gccgtgcaga cagttgtgcg gcagggcgag aatatcaccc tgatgtgcat cgtgatcggc 1620
aacgaggtgg tcaacttcga gtggacctat cctcggaaag aatctggccg gctggtggaa 1680
cctgtgaccg acttcctgct ggacatgccc taccacatcc ggtctatcct gcacatccct 1740
tccgccgagc tggaagattc cggcacctac acctgtaacg tgaccgagtc cgtgaacgac 1800
caccaggacg agaaggccat caatatcacc gtggtggaat ccggctacgt gcggctgttg 1860
ggagaagtgg gcacactgca gtttgctgag ctg 1893
<210> 36
<211> 631
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 36
Met Gly Trp Ser Cys Ile Ile Leu Phe Leu Val Ala Thr Ala Thr Gly
1 5 10 15
Val His Ser His His His His His His Ala Ser Pro Ala Ala Pro Ala
20 25 30
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
35 40 45
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
50 55 60
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
65 70 75 80
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
85 90 95
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
100 105 110
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
115 120 125
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
130 135 140
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
145 150 155 160
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
165 170 175
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
180 185 190
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
195 200 205
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
210 215 220
Ala Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile Pro
225 230 235 240
Glu Ile Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys Arg
245 250 255
Val Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu Asp
260 265 270
Thr Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys Gly
275 280 285
Phe Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr Cys
290 295 300
Glu Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr His
305 310 315 320
Arg Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His Gly
325 330 335
Ile Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala Arg
340 345 350
Thr Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser Ser
355 360 365
Lys His Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln Ser
370 375 380
Gly Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly Val
385 390 395 400
Thr Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly Leu
405 410 415
Met Thr Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys Asn Asp
420 425 430
Ala Glu Glu Leu Phe Ile Phe Leu Thr Glu Ile Thr Glu Ile Thr Ile
435 440 445
Pro Cys Arg Val Thr Asp Pro Gln Leu Val Val Thr Leu His Glu Lys
450 455 460
Lys Gly Asp Val Ala Leu Pro Val Pro Tyr Asp His Gln Arg Gly Phe
465 470 475 480
Ser Gly Ile Phe Glu Asp Arg Ser Tyr Ile Cys Lys Thr Thr Ile Gly
485 490 495
Asp Arg Glu Val Asp Ser Asp Ala Tyr Tyr Val Tyr Arg Leu Gln Val
500 505 510
Ser Ser Ile Asn Val Ser Val Asn Ala Val Gln Thr Val Val Arg Gln
515 520 525
Gly Glu Asn Ile Thr Leu Met Cys Ile Val Ile Gly Asn Glu Val Val
530 535 540
Asn Phe Glu Trp Thr Tyr Pro Arg Lys Glu Ser Gly Arg Leu Val Glu
545 550 555 560
Pro Val Thr Asp Phe Leu Leu Asp Met Pro Tyr His Ile Arg Ser Ile
565 570 575
Leu His Ile Pro Ser Ala Glu Leu Glu Asp Ser Gly Thr Tyr Thr Cys
580 585 590
Asn Val Thr Glu Ser Val Asn Asp His Gln Asp Glu Lys Ala Ile Asn
595 600 605
Ile Thr Val Val Glu Ser Gly Tyr Val Arg Leu Leu Gly Glu Val Gly
610 615 620
Thr Leu Gln Phe Ala Glu Leu
625 630
<210> 37
<211> 3375
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 37
atgggtacaa gccatcccgc cttcctggtc ctgggttgcc tgctgactgg tctgtctctg 60
atcctgtgcc agctgtccct gccttctatc ctgcctaacg agaacgagaa ggtggtgcag 120
ctgaactcct ccttctctct gcggtgcttc ggcgagtccg aagtgtcttg gcagtacccc 180
atgtccgaag aggaatcctc cgacgtggaa atccggaacg aggaaaacaa ctccggcctg 240
ttcgtgaccg tgctggaagt gtcctctgcc tctgctgctc acaccggcct gtacacctgt 300
tactacaatc acacccagac cgaagagaac gagctggaag gccggcacat ctacatctac 360
gtgcccgatc ctgacgtggc ctttgtgcct ctgggcatga ccgactacct ggtcatcgtg 420
gaagatgacg actccgctat catcccctgc cggaccacag atcctgagac acctgtgaca 480
ctgcacaact ccgaaggcgt ggtgcctgcc tcctacgatt ctagacaggg cttcaacggc 540
accttcaccg tgggacctta catctgcgag gctaccgtga agggcaagaa gttccagaca 600
atccccttca acgtgtacgc cctgaaggcc acctctgagc tggacctgga aatggaagcc 660
ctgaaaaccg tgtacaagtc cggcgagaca atcgtcgtga cctgcgccgt gttcaacaac 720
gaggtggtgg acctgcagtg gacctatcct ggcgaagtga aaggcaaggg catcaccatg 780
ctggaagaga tcaaggtgcc ctccatcaag ctggtgtata ccctgaccgt gcctgaggcc 840
acagtgaagg actctggcga ctacgagtgt gccgctagac aggccaccag agaagtcaaa 900
gagatgaaga aagtcaccat ctccgtgcac gagaagggcg cctctccagc tgctcctgct 960
ccagctagtc ctgcagctcc agctccatct gcaccagctg cttctccagc agcacccgca 1020
ccagcttctc ccgccgctcc tgcacctagt gcaccagcag ctagccctgc tgcaccagca 1080
ccagcaagtc cagccgcacc agctcctagt gctccagctg catcccctgc tgctcccgct 1140
cctgcttcac cagccgctcc agcaccatca gctcccgcag catctccagc agctccagct 1200
cctgcttctc ctgctgcacc cgctccatct gctcccgctg caagtcctgc tgctcctgca 1260
ccagcatcac ccgcagctcc cgcaccaagc gctccagccg cttcacccgc agcaccagct 1320
ccagcctcac cagcagcacc agcaccttcc gctccagctg ctagtccagc cgctcctgct 1380
cctgcaagcc ccgctgctcc agctcctagc gcacccgctg ctagccccgc agctcccgct 1440
ccagcaagcc cagcagctcc tgctccttct gctccagcag catctcctgc cgcaccagct 1500
ccagctagcc cagctgctcc cgcaccatcc gcaccagcag caagtcccgc agctccagca 1560
ccagctagtc ccgcagcacc cgcaccttca gcaccagccg catcaccagc tgctccagct 1620
ccagcatctc ccgctgcacc agcaccaagt gctcccgctg cttctcctgc agctcctgct 1680
ccagcctctc cagctgctcc cgcaccttct gctccagctg cctctccagc tgctccagca 1740
ccagcttcac cagctgctcc cgctcctagt gctcctgccg ctagtccagc agctcccgca 1800
ccagctagcc ctgccgctcc tgctccaagt gctccagccg caagtcccgc tgcacccgct 1860
ccagcttctc cagcagctcc cgctccaagc gcacccgcag cttctcccgc tgctcccgca 1920
ccagcaagtc ctgctgctcc agctccttca gctcctgccg cttctcctgc tgctccagct 1980
cctgcaagtc cagctgctcc agcaccaagt gcaccagcag caagtccagc tgctcctgct 2040
cctgcctctc cagcagcacc agctcctagc gcaccagccg ccagtcctgc agcaccagct 2100
ccagcttctc ccgctgctcc tgctccttca gcaccagctg ctagtcctgc tgctcctgct 2160
ccagcttctc ctgccgctcc agcaccaagc gctccagctg catctcccgc agctcccgct 2220
ccagcatctc ctgcagcacc cgcaccatca gctccagctg cttccccagc cgctcctgca 2280
ccagctagcc cagcagctcc tgcacctagc gctcccgctg cttcaccagc agctccagca 2340
ccagccagtc cagctgctcc tgcaccatct gcacccgctg ctagtcccgc tgctccagct 2400
cctgctagcc ctgcagcacc agctccaagt gcacccgccg catcacccgc cgcaccagca 2460
ccagcaagcc ctgcagcacc cgctccaagc gctccagctg ctagcccagc agcaccagca 2520
ccagcatcac cagccgctcc agcaccttct gcaccagcag cttcacccgc tgcacccgct 2580
ccagcatcac ccgccgctcc agctcctagc gctcctgcag cctctcctgc agctccagca 2640
ccagcaagcc ccgctgcacc agcaccatct gctccagcag ctagccctgc agctcccgct 2700
cctgcatctc ccgccgcacc agctccatct gcacccgcag catctgatac cggcagaccc 2760
ttcgtggaaa tgtacagcga gatccccgag atcatccaca tgaccgaggg cagagagctg 2820
gtcatccctt gcagagtgac ctctcctaac atcacagtga ccctgaagaa gtttcccctg 2880
gacacactga tccccgacgg caagagaatc atctgggact cccggaaggg cttcatcatc 2940
tccaacgcca cctacaaaga gatcggcctg ctgacctgtg aagccaccgt gaatggccac 3000
ctgtacaaga ccaactatct gacccacaga cagaccaaca ccatcatcga cgtggtgctg 3060
agcccctctc atggcatcga gctgtccgtg ggagagaagc tcgtgctgaa ctgtaccgcc 3120
agaaccgagc tgaacgtggg catcgacttc aactgggagt accctagctc caaacaccag 3180
cacaagaaac tggtcaaccg ggacctcaag acccagtccg gctccgaaat gaagaaattc 3240
ctgtccacac tgaccatcga cggcgtgacc agatctgacc agggactgta tacctgtgcc 3300
gcctcctctg gcctgatgac caagaaaaac tccaccttcg tgcgggtcca cgagaagcac 3360
caccaccatc atcat 3375
<210> 38
<211> 1125
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 38
Met Gly Thr Ser His Pro Ala Phe Leu Val Leu Gly Cys Leu Leu Thr
1 5 10 15
Gly Leu Ser Leu Ile Leu Cys Gln Leu Ser Leu Pro Ser Ile Leu Pro
20 25 30
Asn Glu Asn Glu Lys Val Val Gln Leu Asn Ser Ser Phe Ser Leu Arg
35 40 45
Cys Phe Gly Glu Ser Glu Val Ser Trp Gln Tyr Pro Met Ser Glu Glu
50 55 60
Glu Ser Ser Asp Val Glu Ile Arg Asn Glu Glu Asn Asn Ser Gly Leu
65 70 75 80
Phe Val Thr Val Leu Glu Val Ser Ser Ala Ser Ala Ala His Thr Gly
85 90 95
Leu Tyr Thr Cys Tyr Tyr Asn His Thr Gln Thr Glu Glu Asn Glu Leu
100 105 110
Glu Gly Arg His Ile Tyr Ile Tyr Val Pro Asp Pro Asp Val Ala Phe
115 120 125
Val Pro Leu Gly Met Thr Asp Tyr Leu Val Ile Val Glu Asp Asp Asp
130 135 140
Ser Ala Ile Ile Pro Cys Arg Thr Thr Asp Pro Glu Thr Pro Val Thr
145 150 155 160
Leu His Asn Ser Glu Gly Val Val Pro Ala Ser Tyr Asp Ser Arg Gln
165 170 175
Gly Phe Asn Gly Thr Phe Thr Val Gly Pro Tyr Ile Cys Glu Ala Thr
180 185 190
Val Lys Gly Lys Lys Phe Gln Thr Ile Pro Phe Asn Val Tyr Ala Leu
195 200 205
Lys Ala Thr Ser Glu Leu Asp Leu Glu Met Glu Ala Leu Lys Thr Val
210 215 220
Tyr Lys Ser Gly Glu Thr Ile Val Val Thr Cys Ala Val Phe Asn Asn
225 230 235 240
Glu Val Val Asp Leu Gln Trp Thr Tyr Pro Gly Glu Val Lys Gly Lys
245 250 255
Gly Ile Thr Met Leu Glu Glu Ile Lys Val Pro Ser Ile Lys Leu Val
260 265 270
Tyr Thr Leu Thr Val Pro Glu Ala Thr Val Lys Asp Ser Gly Asp Tyr
275 280 285
Glu Cys Ala Ala Arg Gln Ala Thr Arg Glu Val Lys Glu Met Lys Lys
290 295 300
Val Thr Ile Ser Val His Glu Lys Gly Ala Ser Pro Ala Ala Pro Ala
305 310 315 320
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
325 330 335
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
340 345 350
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
355 360 365
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
370 375 380
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
385 390 395 400
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
405 410 415
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
420 425 430
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
435 440 445
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
450 455 460
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
465 470 475 480
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
485 490 495
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
500 505 510
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
515 520 525
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
530 535 540
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
545 550 555 560
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
565 570 575
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
580 585 590
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
595 600 605
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
610 615 620
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
625 630 635 640
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
645 650 655
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
660 665 670
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
675 680 685
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
690 695 700
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
705 710 715 720
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
725 730 735
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
740 745 750
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
755 760 765
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
770 775 780
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
785 790 795 800
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
805 810 815
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
820 825 830
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
835 840 845
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
850 855 860
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
865 870 875 880
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
885 890 895
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
900 905 910
Ala Ala Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile
915 920 925
Pro Glu Ile Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys
930 935 940
Arg Val Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu
945 950 955 960
Asp Thr Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys
965 970 975
Gly Phe Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr
980 985 990
Cys Glu Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr
995 1000 1005
His Arg Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His
1010 1015 1020
Gly Ile Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala
1025 1030 1035 1040
Arg Thr Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser
1045 1050 1055
Ser Lys His Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln
1060 1065 1070
Ser Gly Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly
1075 1080 1085
Val Thr Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly
1090 1095 1100
Leu Met Thr Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys His
1105 1110 1115 1120
His His His His His
1125
<210> 39
<211> 3465
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 39
atgggcacca gccatcctgc ttttctggtg ctgggatgcc tgctgaccgg cctgtctctg 60
attctgtgcc agctgtccct gccttccatc ctgcctaacg agaacgagaa ggtggtgcag 120
ctgaactcct ccttctctct gcggtgcttc ggcgagtccg aagtgtcttg gcagtacccc 180
atgtccgaag aggaatcctc cgacgtggaa atccggaacg aggaaaacaa ctccggcctg 240
ttcgtgaccg tgctggaagt gtcctctgcc tctgctgctc acaccggact gtacacctgt 300
tactacaatc acacccagac cgaagagaac gagctggaag gccggcacat ctacatctac 360
gtgcccgatc ctgacgtggc ctttgtgcct ctgggcatga ccgactacct ggtcatcgtg 420
gaagatgacg actccgctat catcccctgc cggaccacag atcctgagac acctgtgaca 480
ctgcacaact ccgaaggcgt ggtgcctgcc tcctacgatt ctagacaggg cttcaacggc 540
accttcaccg tgggacctta catctgcgag gctaccgtga agggcaagaa gttccagaca 600
atccccttca acgtgtacgc cctgaaggcc acctctgagc tggacctgga aatggaagcc 660
ctgaaaaccg tgtacaagag cggcgagaca atcgtcgtga cctgcgccgt gttcaacaac 720
gaggtggtgg acctgcagtg gacctatcct ggcgaagtga aaggcaaggg catcaccatg 780
ctggaagaga tcaaggtgcc ctccatcaag ctggtgtata ccctgaccgt gcctgaggcc 840
acagtgaagg actctggcga ctacgagtgt gccgctagac aggccaccag agaagtcaaa 900
gagatgaaga aagtcaccat ctccgtgcac gagaaaggcg gcggaggcgg aagcggtggc 960
ggaggaagcg gaggcggcgg atctgcttct cctgctgctc ctgctccagc tagtcctgct 1020
gcaccagcac cttcagctcc agctgcttct ccagcagcac ccgcaccagc atcaccagcc 1080
gctccagcac caagtgcacc agctgctagc ccagctgctc ccgctcctgc atctcctgca 1140
gcaccagctc catctgcacc agcagcaagt ccagcagctc cagctcctgc ttcacccgct 1200
gctcccgcac catctgctcc agccgcatca cccgctgcac cagctccagc ttctcccgcc 1260
gctccagctc cttctgctcc tgcagcatct cctgctgctc cagcaccagc aagcccagcc 1320
gctcctgctc catcagcacc cgctgcctct ccagctgctc ctgcaccagc ctctccagct 1380
gcacccgctc ctagtgctcc agctgcaagt cccgccgcac cagcaccagc tagtcctgca 1440
gctcctgcac caagcgctcc agcagcttcc cctgcagctc ctgctcctgc ctctcctgcc 1500
gctcctgctc ctagtgcacc agccgcatct cccgcagctc ccgctcctgc tagtccagca 1560
gctcccgcac cttctgcacc agcagcttcc ccagccgcac cagctccagc aagccccgct 1620
gctccagcac ctagtgctcc cgctgcctca ccagcagctc ccgctccagc aagccctgct 1680
gcacccgctc caagcgcacc agcagcatca ccagctgcac ccgcaccagc tagcccagca 1740
gcaccagctc ctagcgctcc cgcagctagc cctgctgctc ccgcaccagc ttcacccgca 1800
gcacccgctc catcagctcc cgccgctagt cccgctgctc ctgctcctgc aagccctgct 1860
gctcctgctc cttctgctcc agctgctagt cctgccgctc ctgctccagc ttctccagca 1920
gctcctgcac ctagcgcacc cgccgctagt ccagcagcac cagcaccagc ttctccagct 1980
gcaccagcac catcagcacc cgcagcttca ccagcagctc cagcaccagc atctcccgca 2040
gctccagcac catcagctcc agcagcaagc ccagctgcac cagctccagc atcaccagct 2100
gctcccgctc caagcgctcc tgctgcttct cctgccgcac cagctccagc cagtccagca 2160
gcacccgctc caagtgcacc cgccgcttct ccagctgctc cagctcctgc tagccccgca 2220
gctccagctc caagtgctcc agccgccagt cctgcagctc ccgcaccagc tagccccgct 2280
gctcctgcac catccgcacc agctgctagt cccgcagcac cagctccagc tagcccagcc 2340
gcaccagcac catctgctcc cgctgctagc cctgcagcac ccgctccagc cagtcctgct 2400
gctccagctc catctgctcc cgccgcttct cctgcagctc ctgcaccagc ttctcccgct 2460
gctcctgctc ctagcgctcc agcagcctct ccagcagcac cagctccagc aagtcctgca 2520
gcaccagcac ctagtgcacc agcagcttca cccgctgctc ccgctccagc atctccagct 2580
gctccagcac cttctgctcc agctgcaagc cccgcagctc ctgcaccagc aagtcctgcc 2640
gctccagctc ctagcgctcc tgctgcaagt ccagctgctc ccgctccagc ttcaccagcc 2700
gcaccagcac cttccgcacc agcagctagt ccagctgctc ctgctccagc tagcccagct 2760
gctccagctc cttcagcacc agcagccggt ggcggaggat ctggcggagg cggatctggc 2820
ggcggtggtt cttctgatac cggcagaccc ttcgtggaaa tgtacagcga gatccccgag 2880
atcatccaca tgaccgaggg cagagagctg gtcatccctt gcagagtgac ctctcctaac 2940
atcacagtga ccctgaagaa gtttcccctg gacacactga tccccgacgg caagagaatc 3000
atctgggact cccggaaggg cttcatcatc tccaacgcca cctacaaaga gatcggactg 3060
ctgacctgcg aagccactgt gaacggccac ctgtacaaga ccaactatct gacccacaga 3120
cagaccaaca ccatcatcga cgtggtgctg agcccctctc atggcatcga gctgtccgtg 3180
ggagagaaac tggtgctgaa ctgcaccgcc agaaccgagc tgaacgtggg catcgacttc 3240
aactgggagt accccagctc caaacaccag cacaagaagc tggtcaaccg ggatctgaaa 3300
acccagtccg gctccgaaat gaagaaattc ctgagcaccc tgaccatcga cggcgtgacc 3360
agatctgacc agggcctgta tacctgtgcc gcctcttctg gcctgatgac caagaaaaac 3420
tccaccttcg tgcgggtcca cgagaagcac catcaccacc atcat 3465
<210> 40
<211> 1155
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 40
Met Gly Thr Ser His Pro Ala Phe Leu Val Leu Gly Cys Leu Leu Thr
1 5 10 15
Gly Leu Ser Leu Ile Leu Cys Gln Leu Ser Leu Pro Ser Ile Leu Pro
20 25 30
Asn Glu Asn Glu Lys Val Val Gln Leu Asn Ser Ser Phe Ser Leu Arg
35 40 45
Cys Phe Gly Glu Ser Glu Val Ser Trp Gln Tyr Pro Met Ser Glu Glu
50 55 60
Glu Ser Ser Asp Val Glu Ile Arg Asn Glu Glu Asn Asn Ser Gly Leu
65 70 75 80
Phe Val Thr Val Leu Glu Val Ser Ser Ala Ser Ala Ala His Thr Gly
85 90 95
Leu Tyr Thr Cys Tyr Tyr Asn His Thr Gln Thr Glu Glu Asn Glu Leu
100 105 110
Glu Gly Arg His Ile Tyr Ile Tyr Val Pro Asp Pro Asp Val Ala Phe
115 120 125
Val Pro Leu Gly Met Thr Asp Tyr Leu Val Ile Val Glu Asp Asp Asp
130 135 140
Ser Ala Ile Ile Pro Cys Arg Thr Thr Asp Pro Glu Thr Pro Val Thr
145 150 155 160
Leu His Asn Ser Glu Gly Val Val Pro Ala Ser Tyr Asp Ser Arg Gln
165 170 175
Gly Phe Asn Gly Thr Phe Thr Val Gly Pro Tyr Ile Cys Glu Ala Thr
180 185 190
Val Lys Gly Lys Lys Phe Gln Thr Ile Pro Phe Asn Val Tyr Ala Leu
195 200 205
Lys Ala Thr Ser Glu Leu Asp Leu Glu Met Glu Ala Leu Lys Thr Val
210 215 220
Tyr Lys Ser Gly Glu Thr Ile Val Val Thr Cys Ala Val Phe Asn Asn
225 230 235 240
Glu Val Val Asp Leu Gln Trp Thr Tyr Pro Gly Glu Val Lys Gly Lys
245 250 255
Gly Ile Thr Met Leu Glu Glu Ile Lys Val Pro Ser Ile Lys Leu Val
260 265 270
Tyr Thr Leu Thr Val Pro Glu Ala Thr Val Lys Asp Ser Gly Asp Tyr
275 280 285
Glu Cys Ala Ala Arg Gln Ala Thr Arg Glu Val Lys Glu Met Lys Lys
290 295 300
Val Thr Ile Ser Val His Glu Lys Gly Gly Gly Gly Gly Ser Gly Gly
305 310 315 320
Gly Gly Ser Gly Gly Gly Gly Ser Ala Ser Pro Ala Ala Pro Ala Pro
325 330 335
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
340 345 350
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
355 360 365
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
370 375 380
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
385 390 395 400
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
405 410 415
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
420 425 430
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
435 440 445
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
450 455 460
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
465 470 475 480
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
485 490 495
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
500 505 510
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
515 520 525
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
530 535 540
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
545 550 555 560
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
565 570 575
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
580 585 590
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
595 600 605
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
610 615 620
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
625 630 635 640
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
645 650 655
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
660 665 670
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
675 680 685
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
690 695 700
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
705 710 715 720
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
725 730 735
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
740 745 750
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
755 760 765
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
770 775 780
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
785 790 795 800
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
805 810 815
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
820 825 830
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
835 840 845
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
850 855 860
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
865 870 875 880
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
885 890 895
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
900 905 910
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
915 920 925
Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
930 935 940
Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile Pro Glu
945 950 955 960
Ile Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys Arg Val
965 970 975
Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu Asp Thr
980 985 990
Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe
995 1000 1005
Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu
1010 1015 1020
Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg
1025 1030 1035 1040
Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His Gly Ile
1045 1050 1055
Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala Arg Thr
1060 1065 1070
Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys
1075 1080 1085
His Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln Ser Gly
1090 1095 1100
Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly Val Thr
1105 1110 1115 1120
Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met
1125 1130 1135
Thr Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys His His His
1140 1145 1150
His His His
1155
<210> 41
<211> 3474
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 41
atggtgtcct actgggatac aggcgtgctg ctgtgtgccc tgctgtcttg tctgctgctg 60
accggctcct cttctggctc tgataccggc agacccttcg tggaaatgta cagcgagatc 120
cccgagatca tccacatgac cgagggcaga gagctggtca tcccctgcag agtgacctct 180
cctaacatca ccgtgactct gaagaagttc cctctggaca cactgatccc cgacggcaag 240
agaatcatct gggactcccg gaagggcttc atcatctcca acgccaccta caaagagatc 300
ggcctgctga cctgcgaggc caccgttaat ggccacctgt acaagaccaa ctatctgacc 360
cacagacaga ccaacaccat catcgacgtg gtgctgagcc cctctcatgg catcgagctg 420
tccgtgggag aaaagctggt gctgaactgc accgccagaa ccgagctgaa cgtgggcatc 480
gacttcaact gggagtaccc ctccagcaag caccagcaca agaagctggt caaccgggac 540
ctgaaaaccc agtccggctc cgagatgaag aaattcctga gcaccctgac catcgacggc 600
gtgaccagat ctgaccaggg cctgtatacc tgcgccgctt cctctggcct gatgaccaag 660
aaaaactcca ccttcgtgcg ggtgcacgag aaaggtggcg gaggatctgg cggaggcggc 720
tctggcggcg gtggatctgc ttctcctgct gctccagctc cagcttctcc agcagctcct 780
gcaccttctg caccagctgc aagtcctgca gcacccgcac cagctagtcc tgccgctcct 840
gctcctagtg ctcctgccgc aagtccagct gctcccgctc ctgcaagccc agctgcacca 900
gcaccaagtg ctccagctgc ctcaccagcc gcaccagctc cagcaagccc tgcagctccc 960
gctccttcag ctcctgctgc ttctcccgca gcacccgctc cagcatcacc agccgctcca 1020
gcaccatcag ctccagcagc atctcctgca gctccagctc ctgctagtcc cgctgctccc 1080
gcacctagtg caccagccgc ttctcccgcc gctcctgctc ctgcatctcc tgctgcaccc 1140
gctccatctg ctcccgccgc atcacccgca gctcccgcac cagcctctcc agctgcacca 1200
gctcctagcg caccagcagc tagcccagct gctcctgcac cagctagccc cgcagctcca 1260
gctccaagcg ctcctgctgc atccccagct gctccagctc ctgcctcacc agctgctcca 1320
gcaccttctg ctcccgccgc ttctcctgcc gcaccagctc cagctagtcc agccgcacca 1380
gcaccatctg cacccgctgc tagccctgct gcaccagctc cagcatcacc cgctgcacca 1440
gctccatccg caccagctgc ttcaccagca gctcccgctc cagcttcacc cgctgctccc 1500
gctcctagcg ctcccgcagc ttcaccagct gcacccgctc cagccagtcc agctgctccc 1560
gcaccatccg caccagcagc aagtcccgcc gctccagctc cagctagccc agctgctcca 1620
gctccatctg caccagccgc atctccagct gctccagctc cagctagtcc tgctgcaccc 1680
gctcctagcg ctccagctgc aagtcctgcc gctcctgctc cagcctctcc tgccgctcca 1740
gcacctagcg ctcccgctgc cagtccagca gctccagctc ctgcatctcc cgccgcacca 1800
gcaccaagcg cacccgcagc atctcccgct gctcccgctc cagcaagccc tgccgctcct 1860
gcaccaagtg caccagcagc atccccagca gctcccgctc cagcatctcc agcagctcca 1920
gctccaagtg ctccagcagc tagtcctgct gctccagctc ctgctagccc tgcagctcct 1980
gcaccatctg ctcccgcagc cagtcctgca gctcctgcac cagcaagtcc agctgctcct 2040
gcacctagcg ctccagctgc atctcccgct gcaccagctc cagcaagtcc cgctgctcct 2100
gctccttctg ctccagcagc ttcccctgct gctcctgctc ctgcttcacc cgccgctcca 2160
gctccatctg ctcccgctgc ctctccagcc gctcctgcac cagcatcacc agctgctccc 2220
gcaccaagcg cacccgctgc aagcccagcc gctcctgctc ctgctagtcc agccgctcct 2280
gcaccttcag cacccgcagc ttccccagct gctccagctc cagcaagtcc agcagctcca 2340
gctccttccg ctccagctgc aagccccgca gctccagctc ctgcttctcc tgctgctcct 2400
gcaccatcag ctccagctgc tagtccagca gctcctgcac cagccagtcc tgccgcacca 2460
gcaccttcag ctccagctgc ttcacccgct gctcccgcac cagctagtcc agccgctcca 2520
gcaccaagtg ctcccgccgc tggtggtggt ggatctggtg gtggcggaag cggaggtggt 2580
ggttctcagc tgtccctgcc ttccatcctg cctaacgaga acgagaaggt ggtccagctg 2640
aactcctcct tctctctgcg gtgcttcggc gagtccgaag tgtcttggca gtaccccatg 2700
tccgaagagg aatcctccga cgtggaaatc cggaacgagg aaaacaactc cggcctgttc 2760
gtgaccgtgc tggaagtgtc ctctgcctct gctgctcaca ccggcctgta cacatgctac 2820
tacaatcaca cccagaccga agagaacgag ctggaaggcc ggcacatcta catctacgtg 2880
cccgatcctg acgtggcctt tgtgcctctg ggcatgaccg actacctggt catcgtggaa 2940
gatgacgact ccgctatcat cccttgccgg accaccgatc cagagacacc tgtgacactg 3000
cacaactccg aaggcgtggt gcctgcctcc tacgattcta gacagggctt caacggcacc 3060
ttcaccgtgg gaccttacat ctgcgaggct acagtgaagg gcaagaagtt tcagacaatc 3120
cccttcaacg tgtacgccct gaaggccacc tctgagctgg acctggaaat ggaagctctg 3180
aaaaccgtgt acaagtccgg cgagacaatc gtcgtgacct gtgccgtgtt caacaacgaa 3240
gtggtggacc tgcagtggac ctatcctggc gaagtgaaag gcaagggcat cacaatgctg 3300
gaagagatca aggtgccctc catcaagctg gtgtataccc tgaccgtgcc tgaggccact 3360
gtgaaggact ctggcgacta cgagtgtgcc gctagacagg ccaccagaga agtcaaagaa 3420
atgaagaaag tgaccatctc cgtccacgag aagggccacc atcatcacca ccat 3474
<210> 42
<211> 1158
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 42
Met Val Ser Tyr Trp Asp Thr Gly Val Leu Leu Cys Ala Leu Leu Ser
1 5 10 15
Cys Leu Leu Leu Thr Gly Ser Ser Ser Gly Ser Asp Thr Gly Arg Pro
20 25 30
Phe Val Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile His Met Thr Glu
35 40 45
Gly Arg Glu Leu Val Ile Pro Cys Arg Val Thr Ser Pro Asn Ile Thr
50 55 60
Val Thr Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly Lys
65 70 75 80
Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala Thr
85 90 95
Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr Val Asn Gly His
100 105 110
Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg Gln Thr Asn Thr Ile Ile
115 120 125
Asp Val Val Leu Ser Pro Ser His Gly Ile Glu Leu Ser Val Gly Glu
130 135 140
Lys Leu Val Leu Asn Cys Thr Ala Arg Thr Glu Leu Asn Val Gly Ile
145 150 155 160
Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys His Gln His Lys Lys Leu
165 170 175
Val Asn Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu Met Lys Lys Phe
180 185 190
Leu Ser Thr Leu Thr Ile Asp Gly Val Thr Arg Ser Asp Gln Gly Leu
195 200 205
Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met Thr Lys Lys Asn Ser Thr
210 215 220
Phe Val Arg Val His Glu Lys Gly Gly Gly Gly Ser Gly Gly Gly Gly
225 230 235 240
Ser Gly Gly Gly Gly Ser Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
245 250 255
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
260 265 270
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
275 280 285
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
290 295 300
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
305 310 315 320
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
325 330 335
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
340 345 350
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
355 360 365
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
370 375 380
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
385 390 395 400
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
405 410 415
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
420 425 430
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
435 440 445
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
450 455 460
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
465 470 475 480
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
485 490 495
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
500 505 510
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
515 520 525
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
530 535 540
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
545 550 555 560
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
565 570 575
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
580 585 590
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
595 600 605
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
610 615 620
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
625 630 635 640
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
645 650 655
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
660 665 670
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
675 680 685
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
690 695 700
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
705 710 715 720
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
725 730 735
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
740 745 750
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
755 760 765
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
770 775 780
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
785 790 795 800
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
805 810 815
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
820 825 830
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Gly
835 840 845
Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Leu
850 855 860
Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val Gln Leu
865 870 875 880
Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val Ser Trp
885 890 895
Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile Arg Asn
900 905 910
Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val Ser Ser
915 920 925
Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn His Thr
930 935 940
Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Tyr Ile Tyr Val
945 950 955 960
Pro Asp Pro Asp Val Ala Phe Val Pro Leu Gly Met Thr Asp Tyr Leu
965 970 975
Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg Thr Thr
980 985 990
Asp Pro Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val Val Pro
995 1000 1005
Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr Val Gly
1010 1015 1020
Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln Thr Ile
1025 1030 1035 1040
Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp Leu Glu
1045 1050 1055
Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile Val Val
1060 1065 1070
Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Leu Gln Trp Thr Tyr
1075 1080 1085
Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Leu Glu Glu Ile Lys
1090 1095 1100
Val Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr Val Pro Glu Ala Thr
1105 1110 1115 1120
Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala Thr Arg
1125 1130 1135
Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu Lys Gly
1140 1145 1150
His His His His His His
1155
<210> 43
<211> 2772
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 43
atggggacct ctcatcctgc cttcctggtg ctggggtgcc tgctgaccgg cctgtctctg 60
attctgtgcc agctgagcct gccaagcatc ctgcctaacg aaaatgagaa ggtggtccag 120
ctgaacagct ccttcagtct gagatgcttt ggcgaatcag aggtgagctg gcagtaccca 180
atgtcagagg aagagtctag tgacgtggaa attaggaatg aagagaacaa ttcaggactg 240
ttcgtgaccg tcctggaggt gtcaagcgcc agcgccgctc acaccggact gtacacatgt 300
tactataacc atactcagac cgaagagaat gaactggagg ggaggcacat ctccatccac 360
gtgcccgatc ctgacgtggc ctttgcccca ctgggaatga cagattacct ggtcatcgtc 420
gaggacgatg actctgccat cattccctgc cgcacctcag actccgaaac tcctgtgacc 480
ctgcataaca gtgagggcgt ggtccccgcc tcctacgatt ctcgacaggg attcaatggc 540
accttcaccg tcggacccta tatctgtgag gccactgtga agggcaagaa attccagacc 600
attcctttta acgtgtacgc actgaaagcc acatccgaac tggacctgga aatggaggcc 660
ctgaagactg tctataaatc tggagagact atcgtggtca cctgcgccgt gttcaacaat 720
gaagtggtcg atgcgcagtg gacttacccc ggcgaggtca agggcaaagg gattaccatg 780
gacgaagaga tcaaggtgcc tagccagaag ctggtgtaca ccctgacagt cccagaagcc 840
accgtgaagg attccgggga ctatgagtgt gcagcccggc aggcctccag agaagtgaag 900
gagatgaaga aagtgacaat cagtgtccac gagaaaggag caagccccgc cgctccagcc 960
cccgcaagcc cagccgcacc agcaccttcc gcaccagccg cctccccagc agcacccgca 1020
cccgcttccc ctgccgcccc cgcccctagc gcccccgccg cctcccctgc cgccccagcc 1080
cccgcctctc cagccgcccc tgccccatct gccccagccg ccagcccagc cgcccccgcc 1140
cctgccagcc ccgccgcccc agccccctcc gcccctgctg cttcccctgc cgcccctgcc 1200
ccagccagcc cagctgctcc tgctccaagc gcccctgctg caagcccagc tgctccagcc 1260
cccgcctctc ccgctgctcc agctccttct gcccctgctg cttccccagc tgctcccgcc 1320
cctgcctctc ctgctgctcc tgctccctcc gcccctgctg catcccccgc tgctcctgcc 1380
ccagcttccc cagctgcacc tgctccaagc gccccagctg caagcccagc tgcacctgca 1440
cctgcttccc ccgctgcccc tgccccaagc gcccccgccg catcccccgc cgcaccagcc 1500
cccgcctcac ccgcagcacc agccccatca gcaccagccg cctcaccagc cgcccccgca 1560
cccgcaagtc cagcagcacc cgcaccatcc gcccccgccg caagcccagc cgcccccgct 1620
ccagcatccc ctgccgcccc cgcccccagc gcccccgccg cctcccctgc cgccccagcc 1680
cccgcctctc cagccgcccc tgccccatct gccccagccg ccagccccgc cgcccccgcc 1740
cctgccagcc ccgccgcccc agccccctcc gcccctgctg cttcccccgc cgcccctgcc 1800
ccagccagcc cagctgctcc cgctccaagc gcccccgctg caagcccagc tgctccagcc 1860
cccgcctctc ccgctgctcc agctccttct gcccctgctg cttcccccgc tgctcccgcc 1920
cccgcctctc ctgctgctcc cgctccctcc gcccctgctg catcccccgc tgctcctgcc 1980
ccagcttccc cagctgcacc tgctcccagc gccccagctg caagccccgc tgcacctgca 2040
cctgcttccc ccgctgcccc tgccccaagc gcccccgccg cctcacccgc agcccccgct 2100
ccagccagcc ccgcagcacc agcaccctca gccccagcct cagataccgg ccggcctttt 2160
gtggagatgt actccgaaat ccccgagatc attcacatga ccgaagggcg agagctggtc 2220
atcccatgcc gggtgacaag ccccaacatt actgtgaccc tgaagaaatt ccctctggat 2280
actctgatcc cagacgggaa gaggatcatt tgggacagcc gcaaaggctt catcatttcc 2340
aatgccacat ataaggaaat tggcctgctg acatgcgagg ccactgtgaa cgggcacctg 2400
tacaaaacca attatctgac acatcggcag acaaacacta tcattgatgt ggtcctgagc 2460
ccttcccatg ggatcgaact gagcgtcgga gagaagctgg tgctgaattg tacagccaga 2520
actgaactga acgtgggcat tgacttcaat tgggagtacc cctcctctaa gcaccagcat 2580
aagaaactgg tgaataggga tctgaaaacc cagtctggga gtgagatgaa gaaatttctg 2640
tctaccctga caatcgatgg cgtgacacgc agtgaccagg ggctgtatac ttgtgcagcc 2700
agttcaggcc tgatgaccaa gaagaacagc acatttgtcc gagtccacga aaagcaccac 2760
caccaccatc ac 2772
<210> 44
<211> 924
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 44
Met Gly Thr Ser His Pro Ala Phe Leu Val Leu Gly Cys Leu Leu Thr
1 5 10 15
Gly Leu Ser Leu Ile Leu Cys Gln Leu Ser Leu Pro Ser Ile Leu Pro
20 25 30
Asn Glu Asn Glu Lys Val Val Gln Leu Asn Ser Ser Phe Ser Leu Arg
35 40 45
Cys Phe Gly Glu Ser Glu Val Ser Trp Gln Tyr Pro Met Ser Glu Glu
50 55 60
Glu Ser Ser Asp Val Glu Ile Arg Asn Glu Glu Asn Asn Ser Gly Leu
65 70 75 80
Phe Val Thr Val Leu Glu Val Ser Ser Ala Ser Ala Ala His Thr Gly
85 90 95
Leu Tyr Thr Cys Tyr Tyr Asn His Thr Gln Thr Glu Glu Asn Glu Leu
100 105 110
Glu Gly Arg His Ile Ser Ile His Val Pro Asp Pro Asp Val Ala Phe
115 120 125
Ala Pro Leu Gly Met Thr Asp Tyr Leu Val Ile Val Glu Asp Asp Asp
130 135 140
Ser Ala Ile Ile Pro Cys Arg Thr Ser Asp Ser Glu Thr Pro Val Thr
145 150 155 160
Leu His Asn Ser Glu Gly Val Val Pro Ala Ser Tyr Asp Ser Arg Gln
165 170 175
Gly Phe Asn Gly Thr Phe Thr Val Gly Pro Tyr Ile Cys Glu Ala Thr
180 185 190
Val Lys Gly Lys Lys Phe Gln Thr Ile Pro Phe Asn Val Tyr Ala Leu
195 200 205
Lys Ala Thr Ser Glu Leu Asp Leu Glu Met Glu Ala Leu Lys Thr Val
210 215 220
Tyr Lys Ser Gly Glu Thr Ile Val Val Thr Cys Ala Val Phe Asn Asn
225 230 235 240
Glu Val Val Asp Ala Gln Trp Thr Tyr Pro Gly Glu Val Lys Gly Lys
245 250 255
Gly Ile Thr Met Asp Glu Glu Ile Lys Val Pro Ser Gln Lys Leu Val
260 265 270
Tyr Thr Leu Thr Val Pro Glu Ala Thr Val Lys Asp Ser Gly Asp Tyr
275 280 285
Glu Cys Ala Ala Arg Gln Ala Ser Arg Glu Val Lys Glu Met Lys Lys
290 295 300
Val Thr Ile Ser Val His Glu Lys Gly Ala Ser Pro Ala Ala Pro Ala
305 310 315 320
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
325 330 335
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
340 345 350
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
355 360 365
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
370 375 380
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
385 390 395 400
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
405 410 415
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
420 425 430
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
435 440 445
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
450 455 460
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
465 470 475 480
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
485 490 495
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
500 505 510
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
515 520 525
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
530 535 540
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
545 550 555 560
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
565 570 575
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
580 585 590
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
595 600 605
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
610 615 620
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
625 630 635 640
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
645 650 655
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
660 665 670
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
675 680 685
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
690 695 700
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ser Asp Thr Gly Arg Pro Phe
705 710 715 720
Val Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile His Met Thr Glu Gly
725 730 735
Arg Glu Leu Val Ile Pro Cys Arg Val Thr Ser Pro Asn Ile Thr Val
740 745 750
Thr Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly Lys Arg
755 760 765
Ile Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala Thr Tyr
770 775 780
Lys Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr Val Asn Gly His Leu
785 790 795 800
Tyr Lys Thr Asn Tyr Leu Thr His Arg Gln Thr Asn Thr Ile Ile Asp
805 810 815
Val Val Leu Ser Pro Ser His Gly Ile Glu Leu Ser Val Gly Glu Lys
820 825 830
Leu Val Leu Asn Cys Thr Ala Arg Thr Glu Leu Asn Val Gly Ile Asp
835 840 845
Phe Asn Trp Glu Tyr Pro Ser Ser Lys His Gln His Lys Lys Leu Val
850 855 860
Asn Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu Met Lys Lys Phe Leu
865 870 875 880
Ser Thr Leu Thr Ile Asp Gly Val Thr Arg Ser Asp Gln Gly Leu Tyr
885 890 895
Thr Cys Ala Ala Ser Ser Gly Leu Met Thr Lys Lys Asn Ser Thr Phe
900 905 910
Val Arg Val His Glu Lys His His His His His His
915 920
<210> 45
<211> 2385
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 45
cagctgagcc tgccttcaat cctgcccaac gagaatgaga aggtggtgca gctgaactcc 60
agcttcagcc tgagatgctt tggcgagtct gaggtgtcct ggcagtaccc tatgtctgag 120
gaggagtctt ccgacgtgga gatccgcaat gaggagaaca attccggcct gttcgtgacc 180
gtgctggagg tgagctctgc cagcgccgct cacaccggcc tgtacacatg ttactataac 240
catacccaga cagaggagaa tgagctggag ggcagacaca tctacatcta tgtgcccgat 300
cctgacgtgg cctttgtgcc actgggcatg accgattacc tggtcatcgt ggaggacgat 360
gactctgcca tcatcccctg caggaccaca gacccagaga cacccgtgac actgcataac 420
tccgagggag tggtgccagc tagctacgat tctcggcagg gcttcaatgg cacctttaca 480
gtgggcccct atatctgtga ggccaccgtg aagggcaaga agttccagac aatccctttt 540
aacgtgtacg ccctgaaggc tacctctgag ctggacctgg agatggaggc cctgaagaca 600
gtgtataagt ccggcgagac aatcgtggtg acatgcgccg tgttcaacaa tgaggtggtg 660
gatctgcagt ggacctaccc tggcgaggtg aagggcaagg gcatcacaat gctggaggag 720
atcaaggtgc cttccatcaa gctggtgtac accctgacag tgccagaggc caccgtgaag 780
gatagcggcg actatgagtg tgctgctagg caggctacca gggaggtgaa ggagatgaag 840
aaggtgacaa tctccgtgca cgagaaggga gctagcccag ctgctccagc tccagctagc 900
cccgccgctc ctgctccatc tgctcctgct gcttccccag ctgctcccgc ccctgcttct 960
cctgctgctc cagctccatc cgccccagct gcttctcctg ccgctcctgc cccagcttcc 1020
ccagccgctc ccgccccttc cgctccagcc gcctctcccg ccgcccctgc tccagctagc 1080
ccagcagccc cagccccttc tgctccagcc gcctctccag ccgcccctgc tcccgcatcc 1140
cccgccgccc ccgccccttc cgcccctgcc gcctccccag ctgccccagc tcctgcctct 1200
cctgctgccc ctgctccatc cgctccagcc gccagtcccg ccgcccccgc tccagctagc 1260
ccagccgcac cagccccttc tgctcccgcc gcctctcccg ccgcacctgc tccagcatcc 1320
cccgccgccc cagccccttc cgcccctgca gcctccccag ctgcccccgc tcctgcctct 1380
cctgcagccc ctgctccttc cgctccagcc gcatctcccg ccgccccagc cccagctagc 1440
ccagcagcac cagccccctc tgctccagcc gccagccctg ccgcccctgc tcccgcttcc 1500
cccgccgccc cagcaccttc cgcccctgcc gcatccccag cagcccccgc tcctgccagc 1560
cctgctgccc ctgcaccttc cgctccagcc gcttctcccg ccgccccagc acccgctagc 1620
ccagctgccc ctgccccttc tgctccagca gcctctcctg ccgcccctgc tcctgcatcc 1680
cccgccgcac ccgccccttc cgcccccgcc gcctccccag ctgcaccagc tccagcctct 1740
ccagctgctc cagctccttc cgccccagct agcgataccg gccgcccttt tgtggagatg 1800
tacagcgaga tccccgagat catccacatg accgagggca gggagctggt catcccatgc 1860
cgggtgacat ctcccaacat caccgtgaca ctgaagaagt tccctctgga taccctgatc 1920
ccagacggca agagaatcat ctgggactct cgcaagggct ttatcatctc caatgccaca 1980
tataaggaga tcggcctgct gacctgcgag gctacagtga acggccacct gtacaagacc 2040
aattatctga cacataggca gaccaacaca atcatcgatg tggtgctgag cccatctcat 2100
ggcatcgagc tgagcgtggg cgagaagctg gtgctgaatt gtaccgcccg gacagagctg 2160
aacgtgggca tcgacttcaa ttgggagtac ccttccagca agcaccagca taagaagctg 2220
gtgaacagag atctgaagac ccagtccggc agcgagatga agaagtttct gagcaccctg 2280
acaatcgatg gcgtgacccg ctctgaccag ggcctgtata catgtgccgc ttcttccggc 2340
ctgatgacta agaaaaactc cacctttgtg cgggtccacg aaaaa 2385
<210> 46
<211> 795
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 46
Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val
1 5 10 15
Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val
20 25 30
Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile
35 40 45
Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val
50 55 60
Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn
65 70 75 80
His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Tyr Ile
85 90 95
Tyr Val Pro Asp Pro Asp Val Ala Phe Val Pro Leu Gly Met Thr Asp
100 105 110
Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg
115 120 125
Thr Thr Asp Pro Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val
130 135 140
Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr
145 150 155 160
Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln
165 170 175
Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp
180 185 190
Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile
195 200 205
Val Val Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Leu Gln Trp
210 215 220
Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Leu Glu Glu
225 230 235 240
Ile Lys Val Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr Val Pro Glu
245 250 255
Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala
260 265 270
Thr Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu
275 280 285
Lys Gly Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
290 295 300
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
305 310 315 320
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
325 330 335
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
340 345 350
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
355 360 365
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
370 375 380
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
385 390 395 400
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
405 410 415
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
420 425 430
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
435 440 445
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
450 455 460
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
465 470 475 480
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
485 490 495
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
500 505 510
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
515 520 525
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
530 535 540
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
545 550 555 560
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
565 570 575
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ser Asp
580 585 590
Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile
595 600 605
His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys Arg Val Thr Ser
610 615 620
Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile
625 630 635 640
Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile
645 650 655
Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr
660 665 670
Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg Gln Thr
675 680 685
Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His Gly Ile Glu Leu
690 695 700
Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala Arg Thr Glu Leu
705 710 715 720
Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys His Gln
725 730 735
His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu
740 745 750
Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly Val Thr Arg Ser
755 760 765
Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met Thr Lys
770 775 780
Lys Asn Ser Thr Phe Val Arg Val His Glu Lys
785 790 795
<210> 47
<211> 2685
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 47
cagctgagcc tgccctccat cctgcctaac gagaatgaga aggtggtgca gctgaactcc 60
agcttctccc tgagatgctt tggcgagtct gaggtgtcct ggcagtaccc aatgagcgag 120
gaggagtctt ccgacgtgga gatccgcaat gaggagaaca attctggcct gttcgtgacc 180
gtgctggagg tgagctctgc ctccgccgct cacaccggcc tgtacacatg ttactataac 240
catacccaga cagaggagaa tgagctggag ggcagacaca tctacatcta tgtgcccgat 300
cctgacgtgg cctttgtgcc actgggcatg accgattacc tggtcatcgt ggaggacgat 360
gacagcgcca tcatcccctg caggaccaca gaccccgaga cacctgtgac actgcataac 420
tctgagggcg tggtgccagc cagctacgat tctcggcagg gcttcaatgg cacctttaca 480
gtgggcccct atatctgtga ggccaccgtg aagggcaaga agttccagac aatccctttt 540
aacgtgtacg ccctgaaggc taccagcgag ctggacctgg agatggaggc cctgaagaca 600
gtgtataagt ctggcgagac aatcgtggtg acatgcgccg tgttcaacaa tgaggtggtg 660
gatctgcagt ggacctaccc cggcgaggtg aagggcaagg gcatcacaat gctggaggag 720
atcaaggtgc cttctatcaa gctggtgtac accctgacag tgccagaggc caccgtgaag 780
gattccggcg actatgagtg tgccgctagg caggctaccc gggaggtgaa ggagatgaag 840
aaggtgacaa tctctgtgca cgagaaggga gcttccccag ctgctccagc tccagcttcc 900
cccgccgctc ctgccccatc tgctccagct gcctctccag ctgctccagc tcctgctagc 960
cctgccgctc cagccccctc cgcccctgcc gcttctccag ccgctcctgc cccagctagc 1020
cctgctgctc cagctccttc cgctccagcc gcctctccag ccgctccagc ccccgcctct 1080
cctgctgccc cagctccttc tgctccagct gccagccccg ccgcccctgc ccccgcctct 1140
cccgctgccc ctgctccttc cgccccagct gcctcccctg ctgctcctgc cccagcttca 1200
cctgccgccc ctgccccttc cgctccagcc gcatctcccg ccgctccagc ccccgcaagc 1260
cctgcagccc cagctccctc tgctccagct gcctcacccg ccgcccctgc ccctgcctct 1320
cccgctgccc ccgctccttc cgccccagca gcctcccctg cagctcctgc cccagcttct 1380
ccagccgctc ccgccccttc cgctcccgcc gcctctcctg ctgcaccagc ccccgcttcc 1440
ccagctgctc ctgctccatc cgccccagct gcttccccag ctgctccagc tccagcttcc 1500
cccgccgctc ctgccccatc tgctccagct gcctctccag ctgctccagc tcctgctagc 1560
cctgccgctc cagccccctc cgcccctgcc gcttctccag ccgctcctgc cccagctagc 1620
cctgctgctc cagctccttc cgctccagcc gcctctccag ccgctccagc ccccgcctct 1680
cctgctgccc cagctccttc tgctccagct gccagccccg ccgcccctgc ccccgcctct 1740
cccgctgccc ctgctccttc cgccccagct gcctcccctg ctgctcctgc cccagcttca 1800
cctgccgccc ctgccccttc cgctccagcc gcatctcccg ccgctccagc ccccgcaagc 1860
cctgcagccc cagctccctc tgctccagct gcctcacccg ccgcccctgc ccctgcctct 1920
cccgctgccc ccgctccttc cgccccagca gcctcccctg cagctcctgc cccagcttct 1980
ccagccgctc ccgccccttc cgctcccgcc gcctctcctg ctgcaccagc ccccgcttcc 2040
ccagctgctc ctgctccatc cgccccagct agcgataccg gccgcccttt tgtggagatg 2100
tacagcgaga tccctgagat catccacatg accgagggca gggagctggt catcccatgc 2160
cgggtgacat ctcccaacat caccgtgaca ctgaagaagt tccctctgga taccctgatc 2220
ccagacggca agagaatcat ctgggacagc cgcaagggct ttatcatctc taatgccaca 2280
tataaggaga tcggcctgct gacctgcgag gctacagtga acggccacct gtacaagacc 2340
aattatctga cacataggca gaccaacaca atcatcgatg tggtgctgag cccctctcat 2400
ggcatcgagc tgtccgtggg cgagaagctg gtgctgaatt gtaccgcccg gacagagctg 2460
aacgtgggca tcgacttcaa ttgggagtac ccttccagca agcaccagca taagaagctg 2520
gtgaacagag atctgaagac ccagtccggc agcgagatga agaagtttct gtccaccctg 2580
acaatcgatg gagtgacccg cagcgaccag ggcctgtata catgtgccgc ttcttccggc 2640
ctgatgacta agaaaaatag cacctttgtg agggtccacg aaaaa 2685
<210> 48
<211> 895
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 48
Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val
1 5 10 15
Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val
20 25 30
Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile
35 40 45
Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val
50 55 60
Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn
65 70 75 80
His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Tyr Ile
85 90 95
Tyr Val Pro Asp Pro Asp Val Ala Phe Val Pro Leu Gly Met Thr Asp
100 105 110
Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg
115 120 125
Thr Thr Asp Pro Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val
130 135 140
Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr
145 150 155 160
Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln
165 170 175
Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp
180 185 190
Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile
195 200 205
Val Val Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Leu Gln Trp
210 215 220
Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Leu Glu Glu
225 230 235 240
Ile Lys Val Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr Val Pro Glu
245 250 255
Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala
260 265 270
Thr Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu
275 280 285
Lys Gly Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
290 295 300
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
305 310 315 320
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
325 330 335
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
340 345 350
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
355 360 365
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
370 375 380
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
385 390 395 400
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
405 410 415
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
420 425 430
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
435 440 445
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
450 455 460
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
465 470 475 480
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
485 490 495
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
500 505 510
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
515 520 525
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
530 535 540
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
545 550 555 560
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
565 570 575
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
580 585 590
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
595 600 605
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
610 615 620
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
625 630 635 640
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
645 650 655
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
660 665 670
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
675 680 685
Pro Ala Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile
690 695 700
Pro Glu Ile Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys
705 710 715 720
Arg Val Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu
725 730 735
Asp Thr Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys
740 745 750
Gly Phe Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr
755 760 765
Cys Glu Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr
770 775 780
His Arg Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His
785 790 795 800
Gly Ile Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala
805 810 815
Arg Thr Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser
820 825 830
Ser Lys His Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln
835 840 845
Ser Gly Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly
850 855 860
Val Thr Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly
865 870 875 880
Leu Met Thr Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys
885 890 895
<210> 49
<211> 2085
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 49
agcgataccg gccgcccctt cgtggagatg tacagcgaga tccctgagat catccacatg 60
accgagggca gggagctggt catcccttgc cgggtgacat ctccaaacat caccgtgaca 120
ctgaagaagt tccccctgga taccctgatc cctgacggca agagaatcat ctgggactct 180
cgcaagggct ttatcatctc caatgccacc tataaggaga tcggcctgct gacctgcgag 240
gctacagtga acggccacct gtacaagacc aattatctga cacatcggca gaccaacaca 300
atcatcgatg tggtgctgag cccttctcat ggcatcgagc tgtccgtggg cgagaagctg 360
gtgctgaatt gtaccgccag aacagagctg aacgtgggca tcgatttcaa ttgggagtac 420
ccatccagca agcaccagca taagaagctg gtgaacaggg acctgaagac ccagtccggc 480
agcgagatga agaagtttct gtctaccctg acaatcgatg gagtgacccg ctccgaccag 540
ggcctgtata catgtgccgc ttcttccggc ctgatgacca agaagaatag cacatttgtg 600
agggtgcacg agaaggcctc cccagctgct ccagctcctg ctagcccagc cgctccagcc 660
ccctctgctc cagccgcttc ccccgccgct cctgccccag cttctccagc cgctcccgcc 720
ccttccgccc ctgccgcttc tcctgctgct ccagcccctg cctctcctgc cgctcctgcc 780
ccatccgctc ccgccgctag ccctgccgct cccgcccctg ctagccctgc tgcccctgct 840
ccttctgctc ctgctgcctc tccagctgcc ccagctcctg cctcccctgc tgcccctgca 900
ccatccgccc cagccgcttc tcctgcagct ccagcccctg ccagccctgc tgccccagct 960
ccttccgctc ctgctgccag tccagctgcc cctgctcctg ctagccctgc tgcacctgct 1020
ccttctgctc ccgctgcctc tccagctgca ccagctcctg cctcccccgc tgcccctgct 1080
ccatccgccc ccgccgcttc tcctgccgcc ccagcccctg cctctccagc tgctccagct 1140
ccctccgctc ctgctgccag cccagctgcc cctgcacctg ctagccctgc tgctcctgcc 1200
ccctctgccc cagctcagct gtctctgcca tccatcctgc ccaacgagaa tgagaaggtg 1260
gtgcagctga acagctcttt ctctctgcgg tgctttggcg agagcgaggt gtcttggcag 1320
taccccatgt ccgaggagga gtccagcgac gtggagatca gaaatgagga gaacaatagc 1380
ggcctgttcg tgaccgtgct ggaggtgtct tccgcctctg ccgctcacac cggcctgtac 1440
acatgttact ataaccatac ccagacagag gagaatgagc tggagggccg gcacatctac 1500
atctatgtgc ctgatccaga cgtggccttt gtgcccctgg gcatgaccga ttacctggtc 1560
atcgtggagg acgatgactc cgccatcatc ccttgccgca ccacagaccc cgagacacct 1620
gtgacactgc ataacagcga gggagtggtg ccagcttcct acgatagcag gcagggcttc 1680
aatggcacct ttacagtggg cccttatatc tgtgaggcca ccgtgaaggg caagaagttc 1740
cagacaatcc ccttcaacgt gtacgccctg aaggctacct ccgagctgga cctggagatg 1800
gaggccctga agacagtgta taagagcggc gagacaatcg tggtgacatg cgccgtgttc 1860
aacaatgagg tggtggatct gcagtggacc taccctggcg aggtgaaggg caagggcatc 1920
acaatgctgg aggagatcaa ggtgccaagc atcaagctgg tgtacaccct gacagtgccc 1980
gaggccaccg tgaaggattc tggcgactat gagtgtgccg ctaggcaggc tacacgggag 2040
gtgaaagaaa tgaagaaggt cacaatcagc gtccacgaaa agggg 2085
<210> 50
<211> 695
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 50
Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile Pro Glu
1 5 10 15
Ile Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys Arg Val
20 25 30
Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu Asp Thr
35 40 45
Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe
50 55 60
Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu
65 70 75 80
Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg
85 90 95
Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His Gly Ile
100 105 110
Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala Arg Thr
115 120 125
Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys
130 135 140
His Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln Ser Gly
145 150 155 160
Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly Val Thr
165 170 175
Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met
180 185 190
Thr Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys Ala Ser Pro
195 200 205
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
210 215 220
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
225 230 235 240
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
245 250 255
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
260 265 270
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
275 280 285
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
290 295 300
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
305 310 315 320
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
325 330 335
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
340 345 350
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
355 360 365
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
370 375 380
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
385 390 395 400
Pro Ser Ala Pro Ala Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu
405 410 415
Asn Glu Lys Val Val Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe
420 425 430
Gly Glu Ser Glu Val Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser
435 440 445
Ser Asp Val Glu Ile Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val
450 455 460
Thr Val Leu Glu Val Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr
465 470 475 480
Thr Cys Tyr Tyr Asn His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly
485 490 495
Arg His Ile Tyr Ile Tyr Val Pro Asp Pro Asp Val Ala Phe Val Pro
500 505 510
Leu Gly Met Thr Asp Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala
515 520 525
Ile Ile Pro Cys Arg Thr Thr Asp Pro Glu Thr Pro Val Thr Leu His
530 535 540
Asn Ser Glu Gly Val Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe
545 550 555 560
Asn Gly Thr Phe Thr Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys
565 570 575
Gly Lys Lys Phe Gln Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala
580 585 590
Thr Ser Glu Leu Asp Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys
595 600 605
Ser Gly Glu Thr Ile Val Val Thr Cys Ala Val Phe Asn Asn Glu Val
610 615 620
Val Asp Leu Gln Trp Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile
625 630 635 640
Thr Met Leu Glu Glu Ile Lys Val Pro Ser Ile Lys Leu Val Tyr Thr
645 650 655
Leu Thr Val Pro Glu Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys
660 665 670
Ala Ala Arg Gln Ala Thr Arg Glu Val Lys Glu Met Lys Lys Val Thr
675 680 685
Ile Ser Val His Glu Lys Gly
690 695
<210> 51
<211> 2175
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 51
cagctgtccc tgccttccat cctgcctaac gagaacgaga aggtggtgca gctgaactcc 60
tccttctctc tgcggtgctt cggcgagtcc gaagtgtctt ggcagtaccc catgtccgaa 120
gaggaatcct ccgacgtgga aatccggaac gaggaaaaca actccggcct gttcgtgacc 180
gtgctggaag tgtcctctgc ctctgctgct cacaccggac tgtacacctg ttactacaat 240
cacacccaga ccgaagagaa cgagctggaa ggccggcaca tctacatcta cgtgcccgat 300
cctgacgtgg cctttgtgcc tctgggcatg accgactacc tggtcatcgt ggaagatgac 360
gactccgcta tcatcccctg ccggaccaca gatcctgaga cacctgtgac actgcacaac 420
tccgaaggcg tggtgcctgc ctcctacgat tctagacagg gcttcaacgg caccttcacc 480
gtgggacctt acatctgcga ggctaccgtg aagggcaaga agttccagac aatccccttc 540
aacgtgtacg ccctgaaggc cacctctgag ctggacctgg aaatggaagc cctgaaaacc 600
gtgtacaaga gcggcgagac aatcgtcgtg acctgcgccg tgttcaacaa cgaggtggtg 660
gacctgcagt ggacctatcc tggcgaagtg aaaggcaagg gcatcaccat gctggaagag 720
atcaaggtgc cctccatcaa gctggtgtat accctgaccg tgcctgaggc cacagtgaag 780
gactctggcg actacgagtg tgccgctaga caggccacca gagaagtcaa agagatgaag 840
aaagtcacca tctccgtgca cgagaaaggc ggcggaggcg gaagcggtgg cggaggaagc 900
ggaggcggcg gatctgcttc tcctgctgct ccagctccag cttctccagc agctcctgca 960
ccttctgcac cagctgcaag tcctgcagca cccgcaccag ctagtcctgc cgctcctgct 1020
cctagtgctc ctgccgcaag tccagctgct cccgctcctg catcaccagc cgcaccagca 1080
ccaagtgctc cagctgcctc tccagcagca ccagctccag caagccctgc tgcaccagca 1140
ccttcagctc cagcagcatc acccgctgca cccgctccag catctcccgc tgctccagca 1200
ccaagcgcac ccgctgctag cccagccgct ccagctcctg ccagtcctgc tgctcctgca 1260
ccatctgctc ccgcagcttc accagctgct cccgcaccag ctagcccagc agcaccagca 1320
ccatctgcac ccgccgcatc tcccgccgca ccagctccag ctagtcccgc agctcccgct 1380
ccatctgctc cagccgctag tcccgctgct cctgctccag ctagtcctgc tgcacccgct 1440
cctagcgcac cagctgcttc acccgcagct ccagctccag cttcacccgc tgcaccagct 1500
ccatctgctc cagctggtgg cggaggatct ggcggaggcg gatctggcgg cggtggttct 1560
tctgataccg gcagaccctt cgtggaaatg tacagcgaga tccccgagat catccacatg 1620
accgagggca gagagctggt catcccttgc agagtgacct ctcctaacat cacagtgacc 1680
ctgaagaagt ttcccctgga cacactgatc cccgacggca agagaatcat ctgggactcc 1740
cggaagggct tcatcatctc caacgccacc tacaaagaga tcggactgct gacctgcgaa 1800
gccactgtga acggccacct gtacaagacc aactatctga cccacagaca gaccaacacc 1860
atcatcgacg tggtgctgag cccctctcat ggcatcgagc tgtccgtggg agagaaactg 1920
gtgctgaact gcaccgccag aaccgagctg aacgtgggca tcgacttcaa ctgggagtac 1980
cccagctcca aacaccagca caagaagctg gtcaaccggg atctgaaaac ccagtccggc 2040
tccgaaatga agaaattcct gagcaccctg accatcgacg gcgtgaccag atctgaccag 2100
ggcctgtata cctgtgccgc ctcttctggc ctgatgacca agaaaaactc caccttcgtg 2160
cgggtccacg agaag 2175
<210> 52
<211> 725
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 52
Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val
1 5 10 15
Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val
20 25 30
Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile
35 40 45
Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val
50 55 60
Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn
65 70 75 80
His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Tyr Ile
85 90 95
Tyr Val Pro Asp Pro Asp Val Ala Phe Val Pro Leu Gly Met Thr Asp
100 105 110
Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg
115 120 125
Thr Thr Asp Pro Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val
130 135 140
Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr
145 150 155 160
Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln
165 170 175
Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp
180 185 190
Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile
195 200 205
Val Val Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Leu Gln Trp
210 215 220
Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Leu Glu Glu
225 230 235 240
Ile Lys Val Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr Val Pro Glu
245 250 255
Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala
260 265 270
Thr Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu
275 280 285
Lys Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
290 295 300
Ser Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
305 310 315 320
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
325 330 335
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
340 345 350
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
355 360 365
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
370 375 380
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
385 390 395 400
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
405 410 415
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
420 425 430
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
435 440 445
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
450 455 460
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
465 470 475 480
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
485 490 495
Ala Ala Pro Ala Pro Ser Ala Pro Ala Gly Gly Gly Gly Ser Gly Gly
500 505 510
Gly Gly Ser Gly Gly Gly Gly Ser Ser Asp Thr Gly Arg Pro Phe Val
515 520 525
Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile His Met Thr Glu Gly Arg
530 535 540
Glu Leu Val Ile Pro Cys Arg Val Thr Ser Pro Asn Ile Thr Val Thr
545 550 555 560
Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly Lys Arg Ile
565 570 575
Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala Thr Tyr Lys
580 585 590
Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr Val Asn Gly His Leu Tyr
595 600 605
Lys Thr Asn Tyr Leu Thr His Arg Gln Thr Asn Thr Ile Ile Asp Val
610 615 620
Val Leu Ser Pro Ser His Gly Ile Glu Leu Ser Val Gly Glu Lys Leu
625 630 635 640
Val Leu Asn Cys Thr Ala Arg Thr Glu Leu Asn Val Gly Ile Asp Phe
645 650 655
Asn Trp Glu Tyr Pro Ser Ser Lys His Gln His Lys Lys Leu Val Asn
660 665 670
Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu Met Lys Lys Phe Leu Ser
675 680 685
Thr Leu Thr Ile Asp Gly Val Thr Arg Ser Asp Gln Gly Leu Tyr Thr
690 695 700
Cys Ala Ala Ser Ser Gly Leu Met Thr Lys Lys Asn Ser Thr Phe Val
705 710 715 720
Arg Val His Glu Lys
725
<210> 53
<211> 2175
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 53
tctgataccg gcagaccctt cgtggaaatg tacagcgaga tccccgagat catccacatg 60
accgagggca gagagctggt catcccctgc agagtgacct ctcctaacat caccgtgact 120
ctgaagaagt tccctctgga cacactgatc cccgacggca agagaatcat ctgggactcc 180
cggaagggct tcatcatctc caacgccacc tacaaagaga tcggcctgct gacctgcgag 240
gccaccgtta atggccacct gtacaagacc aactatctga cccacagaca gaccaacacc 300
atcatcgacg tggtgctgag cccctctcat ggcatcgagc tgtccgtggg agaaaagctg 360
gtgctgaact gcaccgccag aaccgagctg aacgtgggca tcgacttcaa ctgggagtac 420
ccctccagca agcaccagca caagaagctg gtcaaccggg acctgaaaac ccagtccggc 480
tccgagatga agaaattcct gagcaccctg accatcgacg gcgtgaccag atctgaccag 540
ggcctgtata cctgcgccgc ttcctctggc ctgatgacca agaaaaactc caccttcgtg 600
cgggtgcacg agaaaggtgg cggaggatct ggcggaggcg gctctggcgg cggtggatct 660
gcttctcctg ctgctccagc tccagcttct ccagcagctc ctgcaccttc tgcaccagct 720
gcaagtcctg cagcacccgc accagctagt cctgccgctc ctgctcctag tgctcctgcc 780
gcaagtccag ctgctcccgc tcctgcaagc ccagctgcac cagcaccaag tgctccagct 840
gcctcaccag ccgcaccagc tccagcaagc cctgcagctc ccgctccttc agctcctgct 900
gcttctcccg cagcacccgc tccagcatca ccagccgctc cagcaccatc agctccagca 960
gcatctcctg cagctccagc tcctgctagt cccgctgctc ccgcacctag tgcaccagcc 1020
gcttctcccg ccgctcctgc tcctgcatct cctgctgcac ccgctccatc tgctcccgcc 1080
gcatcacccg cagctcccgc accagcctct ccagctgcac cagctcctag cgcaccagca 1140
gctagcccag ctgctcctgc accagctagc cccgcagctc cagctccaag cgctcctgct 1200
gcatccccag ctgctccagc tcctgcctca ccagctgctc cagcaccttc tgctcccgct 1260
ggcggtggcg gaagcggagg tggtggtagt ggcggcggag gttctcagct gtccctgcct 1320
tctatcctgc ctaacgagaa cgagaaggtg gtccagctga actcctcctt ctctctgcgg 1380
tgcttcggcg agtccgaagt gtcttggcag taccccatgt ccgaagagga atcctccgac 1440
gtggaaatcc ggaacgagga aaacaactcc ggcctgttcg tgaccgtgct ggaagtgtcc 1500
tctgcctctg ctgctcacac cggcctgtac acatgctact acaatcacac ccagaccgaa 1560
gagaacgagc tggaaggccg gcacatctac atctacgtgc ccgatcctga cgtggccttt 1620
gtgcctctgg gcatgaccga ctacctggtc atcgtggaag atgacgactc cgctatcatc 1680
ccttgccgga ccaccgatcc agagacacct gtgacactgc acaactccga aggcgtggtg 1740
cctgcctcct acgattctag acagggcttc aacggcacct tcaccgtggg accttacatc 1800
tgcgaggcta cagtgaaggg caagaagttt cagacaatcc ccttcaacgt gtacgccctg 1860
aaggccacct ctgagctgga cctggaaatg gaagctctga aaaccgtgta caagtccggc 1920
gagacaatcg tcgtgacctg tgccgtgttc aacaacgaag tggtggacct gcagtggacc 1980
tatcctggcg aagtgaaagg caagggcatc accatgctgg aagagatcaa ggtgccctcc 2040
atcaagctgg tgtataccct gaccgtgcct gaggccactg tgaaggactc tggcgactac 2100
gagtgtgccg ctagacaggc caccagagaa gtcaaagaaa tgaagaaagt gaccatctcc 2160
gtccacgaga agggc 2175
<210> 54
<211> 725
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 54
Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile Pro Glu
1 5 10 15
Ile Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys Arg Val
20 25 30
Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu Asp Thr
35 40 45
Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe
50 55 60
Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu
65 70 75 80
Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg
85 90 95
Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His Gly Ile
100 105 110
Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala Arg Thr
115 120 125
Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys
130 135 140
His Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln Ser Gly
145 150 155 160
Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly Val Thr
165 170 175
Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met
180 185 190
Thr Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Ser Pro Ala
210 215 220
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
225 230 235 240
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
245 250 255
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
260 265 270
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
275 280 285
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
290 295 300
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
305 310 315 320
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
325 330 335
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
340 345 350
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
355 360 365
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
370 375 380
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
385 390 395 400
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
405 410 415
Ser Ala Pro Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
420 425 430
Gly Gly Ser Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu
435 440 445
Lys Val Val Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu
450 455 460
Ser Glu Val Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp
465 470 475 480
Val Glu Ile Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val
485 490 495
Leu Glu Val Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys
500 505 510
Tyr Tyr Asn His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His
515 520 525
Ile Tyr Ile Tyr Val Pro Asp Pro Asp Val Ala Phe Val Pro Leu Gly
530 535 540
Met Thr Asp Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile
545 550 555 560
Pro Cys Arg Thr Thr Asp Pro Glu Thr Pro Val Thr Leu His Asn Ser
565 570 575
Glu Gly Val Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly
580 585 590
Thr Phe Thr Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys
595 600 605
Lys Phe Gln Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser
610 615 620
Glu Leu Asp Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly
625 630 635 640
Glu Thr Ile Val Val Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp
645 650 655
Leu Gln Trp Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met
660 665 670
Leu Glu Glu Ile Lys Val Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr
675 680 685
Val Pro Glu Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala
690 695 700
Arg Gln Ala Thr Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser
705 710 715 720
Val His Glu Lys Gly
725
<210> 55
<211> 2085
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 55
gcttctccag ccgctccagc tcctgcttct cctgctgcac cagcaccatc tgctccagct 60
gcaagtccag ctgctcccgc accagcaagt cctgcagcac ccgctcctag tgctccagca 120
gcatctcccg cagcaccagc tccagcttca ccagcagctc ccgctccatc agcaccagcc 180
gcatcacccg ctgctccagc accagcttct cccgccgctc ctgcaccttc tgcacccgca 240
gctagccctg ctgctcctgc tccagcatct ccagctgcac ccgctccaag cgcacccgct 300
gctagtccag cagcaccagc accagctagt cccgctgctc cagctccttc tgctccagca 360
gcttcaccag ccgctccagc accagctagc ccagccgcac cagcacctag tgctcccgcc 420
gctagtcctg cagctccagc tcctgctagc ccagctgctc ccgctcctag cgctcctgcc 480
gcttcaccag ctgcaccagc tccagcaagt ccagccgctc ctgctccaag tgcaccagct 540
gcctctccag ctgctcctgc tcctgcaagt cccgcagctc cagcacctag cgcaccagca 600
tctgataccg gcagaccctt cgtggaaatg tacagcgaga tccccgagat catccacatg 660
accgagggca gagagctggt catcccctgc agagtgacct ctcctaacat caccgtgact 720
ctgaagaagt tccctctgga cacactgatc cccgacggca agagaatcat ctgggactcc 780
cggaagggct tcatcatctc caacgccacc tacaaagaga tcggcctgct gacctgcgag 840
gccaccgtta atggccacct gtacaagacc aactatctga cccacagaca gaccaacacc 900
atcatcgacg tggtgctgag cccctctcat ggcatcgagc tgtccgtggg agaaaagctc 960
gtgctgaact gcaccgccag aaccgagctg aacgtgggca tcgacttcaa ctgggagtac 1020
cccagctcca aacaccagca caagaaactg gtcaaccggg acctgaaaac ccagtccggc 1080
tccgagatga agaaattcct gagcaccctg accatcgacg gcgtgaccag atctgaccag 1140
ggcctgtata cctgcgccgc ttcttctggc ctgatgacca agaaaaactc caccttcgtg 1200
cgcgtgcacg agaagcagct gtccctgcct tctatcctgc ctaacgagaa cgagaaggtg 1260
gtccagctga actcctcctt ctctctgcgg tgcttcggcg agtccgaagt gtcttggcag 1320
taccccatgt ccgaagagga atcctccgac gtggaaatcc ggaacgagga aaacaactcc 1380
ggcctgttcg tgaccgtgct ggaagtgtcc tctgcctctg ctgctcacac cggcctgtac 1440
acatgctact acaatcacac ccagaccgaa gagaacgagc tggaaggccg gcacatctac 1500
atctacgtgc ccgatcctga cgtggccttt gtgcctctgg gcatgaccga ctacctggtc 1560
atcgtggaag atgacgactc cgctatcatc ccttgccgga ccaccgatcc agagacacct 1620
gtgacactgc acaactccga aggcgtggtg cctgcctcct acgattctag acagggcttc 1680
aacggcacct tcaccgtggg accttacatc tgcgaggcta cagtgaaggg caagaagttt 1740
cagacaatcc ccttcaacgt gtacgccctg aaggccacct ctgagctgga cctggaaatg 1800
gaagctctga aaaccgtgta caagtccggc gagacaatcg tcgtgacctg tgccgtgttc 1860
aacaacgagg tggtggacct gcagtggacc tatcctggcg aagtgaaagg caagggcatc 1920
accatgctgg aagagatcaa ggtgccctcc atcaagctgg tgtataccct gaccgtgcct 1980
gaggccactg tgaaggactc tggcgactac gagtgtgccg ctagacaggc caccagagaa 2040
gtcaaagaaa tgaagaaagt gaccatctcc gtccacgaga agggc 2085
<210> 56
<211> 695
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 56
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
1 5 10 15
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
20 25 30
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
35 40 45
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
50 55 60
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
65 70 75 80
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
85 90 95
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
100 105 110
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
115 120 125
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
130 135 140
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
145 150 155 160
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
165 170 175
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
180 185 190
Ala Pro Ala Pro Ser Ala Pro Ala Ser Asp Thr Gly Arg Pro Phe Val
195 200 205
Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile His Met Thr Glu Gly Arg
210 215 220
Glu Leu Val Ile Pro Cys Arg Val Thr Ser Pro Asn Ile Thr Val Thr
225 230 235 240
Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly Lys Arg Ile
245 250 255
Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala Thr Tyr Lys
260 265 270
Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr Val Asn Gly His Leu Tyr
275 280 285
Lys Thr Asn Tyr Leu Thr His Arg Gln Thr Asn Thr Ile Ile Asp Val
290 295 300
Val Leu Ser Pro Ser His Gly Ile Glu Leu Ser Val Gly Glu Lys Leu
305 310 315 320
Val Leu Asn Cys Thr Ala Arg Thr Glu Leu Asn Val Gly Ile Asp Phe
325 330 335
Asn Trp Glu Tyr Pro Ser Ser Lys His Gln His Lys Lys Leu Val Asn
340 345 350
Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu Met Lys Lys Phe Leu Ser
355 360 365
Thr Leu Thr Ile Asp Gly Val Thr Arg Ser Asp Gln Gly Leu Tyr Thr
370 375 380
Cys Ala Ala Ser Ser Gly Leu Met Thr Lys Lys Asn Ser Thr Phe Val
385 390 395 400
Arg Val His Glu Lys Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu
405 410 415
Asn Glu Lys Val Val Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe
420 425 430
Gly Glu Ser Glu Val Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser
435 440 445
Ser Asp Val Glu Ile Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val
450 455 460
Thr Val Leu Glu Val Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr
465 470 475 480
Thr Cys Tyr Tyr Asn His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly
485 490 495
Arg His Ile Tyr Ile Tyr Val Pro Asp Pro Asp Val Ala Phe Val Pro
500 505 510
Leu Gly Met Thr Asp Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala
515 520 525
Ile Ile Pro Cys Arg Thr Thr Asp Pro Glu Thr Pro Val Thr Leu His
530 535 540
Asn Ser Glu Gly Val Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe
545 550 555 560
Asn Gly Thr Phe Thr Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys
565 570 575
Gly Lys Lys Phe Gln Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala
580 585 590
Thr Ser Glu Leu Asp Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys
595 600 605
Ser Gly Glu Thr Ile Val Val Thr Cys Ala Val Phe Asn Asn Glu Val
610 615 620
Val Asp Leu Gln Trp Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile
625 630 635 640
Thr Met Leu Glu Glu Ile Lys Val Pro Ser Ile Lys Leu Val Tyr Thr
645 650 655
Leu Thr Val Pro Glu Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys
660 665 670
Ala Ala Arg Gln Ala Thr Arg Glu Val Lys Glu Met Lys Lys Val Thr
675 680 685
Ile Ser Val His Glu Lys Gly
690 695
<210> 57
<211> 2085
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 57
gcttctccag ccgctccagc tcctgcttct cctgctgcac cagcaccatc tgctccagct 60
gcaagtccag ctgctcccgc accagcaagt cctgcagcac ccgctcctag tgctccagca 120
gcatctcccg cagcaccagc tccagcttca ccagcagctc ccgctccatc agcaccagcc 180
gcatcacccg ctgctccagc accagcttct cccgccgctc ctgcaccttc tgcacccgca 240
gctagccctg ctgctcctgc tccagcatct ccagctgcac ccgctccaag cgcacccgct 300
gctagtccag cagcaccagc accagctagt cccgctgctc cagctccttc tgctccagca 360
gcttcaccag ccgctccagc accagctagc ccagccgcac cagcacctag tgctcccgcc 420
gctagtcctg cagctccagc tcctgctagc ccagctgctc ccgctcctag cgctcctgcc 480
gcttcaccag ctgcaccagc tccagcaagt ccagccgctc ctgctccaag tgcaccagct 540
gcctctccag ctgctcctgc tcctgcaagt cccgcagctc cagcacctag cgcaccagct 600
caactgtccc tgccttccat cctgcctaac gagaacgaga aggtggtcca gctgaactcc 660
tccttctctc tgcggtgctt cggcgagtcc gaagtgtctt ggcagtaccc catgtccgaa 720
gaggaatcct ccgacgtgga aatccggaac gaggaaaaca actccggcct gttcgtgacc 780
gtgctggaag tgtcctctgc ctctgctgct cacaccggcc tgtacacctg ttactacaat 840
cacacccaga ccgaagagaa cgagctggaa ggccggcaca tctacatcta cgtgcccgat 900
cctgacgtgg cctttgtgcc tctgggcatg accgactacc tggtcatcgt ggaagatgac 960
gactccgcta tcatcccctg ccggaccaca gatcctgaga cacctgtgac actgcacaac 1020
tccgaaggcg tggtgcctgc ctcctacgat tctagacagg gcttcaacgg caccttcacc 1080
gtgggacctt acatctgcga ggctaccgtg aagggcaaga agttccagac aatccccttc 1140
aacgtgtacg ccctgaaggc cacctctgag ctggacctgg aaatggaagc cctgaaaacc 1200
gtgtacaagt ccggcgagac aatcgtcgtg acctgcgccg tgttcaacaa cgaggtggtg 1260
gacctgcagt ggacctatcc tggcgaagtg aaaggcaagg gcatcaccat gctggaagag 1320
atcaaggtgc cctccatcaa gctggtgtat accctgaccg tgcctgaggc cacagtgaag 1380
gactctggcg actacgagtg tgccgctaga caggccacca gagaagtcaa agagatgaag 1440
aaagtcacca tctccgtgca cgagaagggc tccgataccg gcagaccctt cgtggaaatg 1500
tacagcgaga tccccgagat catccacatg accgagggca gagagctggt catcccttgc 1560
agagtgacct ctcctaacat cacagtgacc ctgaagaagt ttcccctgga cacactgatc 1620
cccgacggca agagaatcat ctgggactcc cggaagggct tcatcatctc caacgccacc 1680
tacaaagaga tcggcctgct gacctgtgaa gccaccgtga atggccacct gtacaagacc 1740
aactatctga cccacagaca gaccaacacc atcatcgacg tggtgctgtc cccaagccat 1800
ggcatcgagc tgtccgtggg agaaaagctc gtgctgaact gcaccgccag aaccgagctg 1860
aacgtgggca tcgacttcaa ctgggagtac cccagctcca aacaccagca caagaaactg 1920
gtcaaccggg acctcaagac ccagtccggc tccgaaatga agaaattcct gagcaccctg 1980
accatcgacg gcgtgaccag atctgaccag ggactgtata cctgtgccgc ctcctctggc 2040
ctgatgacca agaaaaactc caccttcgtg cgggtccacg agaag 2085
<210> 58
<211> 695
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 58
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
1 5 10 15
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
20 25 30
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
35 40 45
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
50 55 60
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
65 70 75 80
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
85 90 95
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
100 105 110
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
115 120 125
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
130 135 140
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
145 150 155 160
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
165 170 175
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
180 185 190
Ala Pro Ala Pro Ser Ala Pro Ala Gln Leu Ser Leu Pro Ser Ile Leu
195 200 205
Pro Asn Glu Asn Glu Lys Val Val Gln Leu Asn Ser Ser Phe Ser Leu
210 215 220
Arg Cys Phe Gly Glu Ser Glu Val Ser Trp Gln Tyr Pro Met Ser Glu
225 230 235 240
Glu Glu Ser Ser Asp Val Glu Ile Arg Asn Glu Glu Asn Asn Ser Gly
245 250 255
Leu Phe Val Thr Val Leu Glu Val Ser Ser Ala Ser Ala Ala His Thr
260 265 270
Gly Leu Tyr Thr Cys Tyr Tyr Asn His Thr Gln Thr Glu Glu Asn Glu
275 280 285
Leu Glu Gly Arg His Ile Tyr Ile Tyr Val Pro Asp Pro Asp Val Ala
290 295 300
Phe Val Pro Leu Gly Met Thr Asp Tyr Leu Val Ile Val Glu Asp Asp
305 310 315 320
Asp Ser Ala Ile Ile Pro Cys Arg Thr Thr Asp Pro Glu Thr Pro Val
325 330 335
Thr Leu His Asn Ser Glu Gly Val Val Pro Ala Ser Tyr Asp Ser Arg
340 345 350
Gln Gly Phe Asn Gly Thr Phe Thr Val Gly Pro Tyr Ile Cys Glu Ala
355 360 365
Thr Val Lys Gly Lys Lys Phe Gln Thr Ile Pro Phe Asn Val Tyr Ala
370 375 380
Leu Lys Ala Thr Ser Glu Leu Asp Leu Glu Met Glu Ala Leu Lys Thr
385 390 395 400
Val Tyr Lys Ser Gly Glu Thr Ile Val Val Thr Cys Ala Val Phe Asn
405 410 415
Asn Glu Val Val Asp Leu Gln Trp Thr Tyr Pro Gly Glu Val Lys Gly
420 425 430
Lys Gly Ile Thr Met Leu Glu Glu Ile Lys Val Pro Ser Ile Lys Leu
435 440 445
Val Tyr Thr Leu Thr Val Pro Glu Ala Thr Val Lys Asp Ser Gly Asp
450 455 460
Tyr Glu Cys Ala Ala Arg Gln Ala Thr Arg Glu Val Lys Glu Met Lys
465 470 475 480
Lys Val Thr Ile Ser Val His Glu Lys Gly Ser Asp Thr Gly Arg Pro
485 490 495
Phe Val Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile His Met Thr Glu
500 505 510
Gly Arg Glu Leu Val Ile Pro Cys Arg Val Thr Ser Pro Asn Ile Thr
515 520 525
Val Thr Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly Lys
530 535 540
Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala Thr
545 550 555 560
Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr Val Asn Gly His
565 570 575
Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg Gln Thr Asn Thr Ile Ile
580 585 590
Asp Val Val Leu Ser Pro Ser His Gly Ile Glu Leu Ser Val Gly Glu
595 600 605
Lys Leu Val Leu Asn Cys Thr Ala Arg Thr Glu Leu Asn Val Gly Ile
610 615 620
Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys His Gln His Lys Lys Leu
625 630 635 640
Val Asn Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu Met Lys Lys Phe
645 650 655
Leu Ser Thr Leu Thr Ile Asp Gly Val Thr Arg Ser Asp Gln Gly Leu
660 665 670
Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met Thr Lys Lys Asn Ser Thr
675 680 685
Phe Val Arg Val His Glu Lys
690 695
<210> 59
<211> 1818
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 59
gcttctccag ccgctccagc tcctgcttct cctgctgcac cagcaccatc tgctccagct 60
gcaagtccag ctgctcccgc accagcaagt cctgcagcac ccgctcctag tgctccagca 120
gcatctcccg cagcaccagc tccagcttca ccagcagctc ccgctccatc agcaccagcc 180
gcatcacccg ctgctccagc accagcttct cccgccgctc ctgcaccttc tgcacccgca 240
gctagccctg ctgctcctgc tccagcatct ccagctgcac ccgctccaag cgcacccgct 300
gctagtccag cagcaccagc accagctagt cccgctgctc cagctccttc tgctccagca 360
gcttcaccag ccgctccagc accagctagc ccagccgcac cagcacctag tgctcccgcc 420
gctagtcctg cagctccagc tcctgctagc ccagctgctc ccgctcctag cgctcctgcc 480
gcttcaccag ctgcaccagc tccagcaagt ccagccgctc ctgctccaag tgcaccagct 540
gcctctccag ctgctcctgc tcctgcaagt cccgcagctc cagcacctag cgcaccagca 600
tctgataccg gcagaccctt cgtggaaatg tacagcgaga tccccgagat catccacatg 660
accgagggca gagagctggt catcccctgc agagtgacct ctcctaacat caccgtgact 720
ctgaagaagt tccctctgga cacactgatc cccgacggca agagaatcat ctgggactcc 780
cggaagggct tcatcatctc caacgccacc tacaaagaga tcggcctgct gacctgcgag 840
gccaccgtta atggccacct gtacaagacc aactatctga cccacagaca gaccaacacc 900
atcatcgacg tggtgctgag cccctctcat ggcatcgagc tgtccgtggg agaaaagctc 960
gtgctgaact gcaccgccag aaccgagctg aacgtgggca tcgacttcaa ctgggagtac 1020
cccagctcca aacaccagca caagaaactg gtcaaccggg acctgaaaac ccagtccggc 1080
tccgagatga agaaattcct gagcaccctg accatcgacg gcgtgaccag atctgaccag 1140
ggcctgtata cctgcgccgc ttcttctggc ctgatgacca agaaaaactc caccttcgtg 1200
cgcgtgcacg agaagaacga tgccgaggaa ctgttcatct tcctgaccga gattaccgag 1260
atcacaatcc cctgccgcgt gacagatcct cagctggtgg ttaccctgca tgagaagaaa 1320
ggcgacgtgg ccctgcctgt gccttacgat catcagagag gcttctccgg catcttcgag 1380
gaccggtctt acatctgcaa gaccaccatc ggcgacagag aggtggactc cgacgcctac 1440
tacgtgtaca gactccaggt gtcctccatc aacgtgtccg tgaatgccgt gcagacagtt 1500
gtgcggcagg gcgagaatat caccctgatg tgcatcgtga tcggcaacga ggtggtcaac 1560
ttcgagtgga cctatcctcg gaaagaatct ggccggctgg tggaacctgt gaccgacttc 1620
ctgctggaca tgccctacca catccggtct atcctgcaca tcccttccgc cgagctggaa 1680
gattccggca cctacacctg taacgtgacc gagtccgtga acgaccacca ggacgagaag 1740
gccatcaata tcaccgtggt ggaatccggc tacgtgcggc tgttgggaga agtgggcaca 1800
ctgcagtttg ctgagctg 1818
<210> 60
<211> 606
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 60
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
1 5 10 15
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
20 25 30
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
35 40 45
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
50 55 60
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
65 70 75 80
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
85 90 95
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
100 105 110
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
115 120 125
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
130 135 140
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
145 150 155 160
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
165 170 175
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
180 185 190
Ala Pro Ala Pro Ser Ala Pro Ala Ser Asp Thr Gly Arg Pro Phe Val
195 200 205
Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile His Met Thr Glu Gly Arg
210 215 220
Glu Leu Val Ile Pro Cys Arg Val Thr Ser Pro Asn Ile Thr Val Thr
225 230 235 240
Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly Lys Arg Ile
245 250 255
Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala Thr Tyr Lys
260 265 270
Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr Val Asn Gly His Leu Tyr
275 280 285
Lys Thr Asn Tyr Leu Thr His Arg Gln Thr Asn Thr Ile Ile Asp Val
290 295 300
Val Leu Ser Pro Ser His Gly Ile Glu Leu Ser Val Gly Glu Lys Leu
305 310 315 320
Val Leu Asn Cys Thr Ala Arg Thr Glu Leu Asn Val Gly Ile Asp Phe
325 330 335
Asn Trp Glu Tyr Pro Ser Ser Lys His Gln His Lys Lys Leu Val Asn
340 345 350
Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu Met Lys Lys Phe Leu Ser
355 360 365
Thr Leu Thr Ile Asp Gly Val Thr Arg Ser Asp Gln Gly Leu Tyr Thr
370 375 380
Cys Ala Ala Ser Ser Gly Leu Met Thr Lys Lys Asn Ser Thr Phe Val
385 390 395 400
Arg Val His Glu Lys Asn Asp Ala Glu Glu Leu Phe Ile Phe Leu Thr
405 410 415
Glu Ile Thr Glu Ile Thr Ile Pro Cys Arg Val Thr Asp Pro Gln Leu
420 425 430
Val Val Thr Leu His Glu Lys Lys Gly Asp Val Ala Leu Pro Val Pro
435 440 445
Tyr Asp His Gln Arg Gly Phe Ser Gly Ile Phe Glu Asp Arg Ser Tyr
450 455 460
Ile Cys Lys Thr Thr Ile Gly Asp Arg Glu Val Asp Ser Asp Ala Tyr
465 470 475 480
Tyr Val Tyr Arg Leu Gln Val Ser Ser Ile Asn Val Ser Val Asn Ala
485 490 495
Val Gln Thr Val Val Arg Gln Gly Glu Asn Ile Thr Leu Met Cys Ile
500 505 510
Val Ile Gly Asn Glu Val Val Asn Phe Glu Trp Thr Tyr Pro Arg Lys
515 520 525
Glu Ser Gly Arg Leu Val Glu Pro Val Thr Asp Phe Leu Leu Asp Met
530 535 540
Pro Tyr His Ile Arg Ser Ile Leu His Ile Pro Ser Ala Glu Leu Glu
545 550 555 560
Asp Ser Gly Thr Tyr Thr Cys Asn Val Thr Glu Ser Val Asn Asp His
565 570 575
Gln Asp Glu Lys Ala Ile Asn Ile Thr Val Val Glu Ser Gly Tyr Val
580 585 590
Arg Leu Leu Gly Glu Val Gly Thr Leu Gln Phe Ala Glu Leu
595 600 605
<210> 61
<211> 3288
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 61
cagctgtccc tgccttctat cctgcctaac gagaacgaga aggtggtgca gctgaactcc 60
tccttctctc tgcggtgctt cggcgagtcc gaagtgtctt ggcagtaccc catgtccgaa 120
gaggaatcct ccgacgtgga aatccggaac gaggaaaaca actccggcct gttcgtgacc 180
gtgctggaag tgtcctctgc ctctgctgct cacaccggcc tgtacacctg ttactacaat 240
cacacccaga ccgaagagaa cgagctggaa ggccggcaca tctacatcta cgtgcccgat 300
cctgacgtgg cctttgtgcc tctgggcatg accgactacc tggtcatcgt ggaagatgac 360
gactccgcta tcatcccctg ccggaccaca gatcctgaga cacctgtgac actgcacaac 420
tccgaaggcg tggtgcctgc ctcctacgat tctagacagg gcttcaacgg caccttcacc 480
gtgggacctt acatctgcga ggctaccgtg aagggcaaga agttccagac aatccccttc 540
aacgtgtacg ccctgaaggc cacctctgag ctggacctgg aaatggaagc cctgaaaacc 600
gtgtacaagt ccggcgagac aatcgtcgtg acctgcgccg tgttcaacaa cgaggtggtg 660
gacctgcagt ggacctatcc tggcgaagtg aaaggcaagg gcatcaccat gctggaagag 720
atcaaggtgc cctccatcaa gctggtgtat accctgaccg tgcctgaggc cacagtgaag 780
gactctggcg actacgagtg tgccgctaga caggccacca gagaagtcaa agagatgaag 840
aaagtcacca tctccgtgca cgagaagggc gcctctccag ctgctcctgc tccagctagt 900
cctgcagctc cagctccatc tgcaccagct gcttctccag cagcacccgc accagcttct 960
cccgccgctc ctgcacctag tgcaccagca gctagccctg ctgcaccagc accagcaagt 1020
ccagccgcac cagctcctag tgctccagct gcatcccctg ctgctcccgc tcctgcttca 1080
ccagccgctc cagcaccatc agctcccgca gcatctccag cagctccagc tcctgcttct 1140
cctgctgcac ccgctccatc tgctcccgct gcaagtcctg ctgctcctgc accagcatca 1200
cccgcagctc ccgcaccaag cgctccagcc gcttcacccg cagcaccagc tccagcctca 1260
ccagcagcac cagcaccttc cgctccagct gctagtccag ccgctcctgc tcctgcaagc 1320
cccgctgctc cagctcctag cgcacccgct gctagccccg cagctcccgc tccagcaagc 1380
ccagcagctc ctgctccttc tgctccagca gcatctcctg ccgcaccagc tccagctagc 1440
ccagctgctc ccgcaccatc cgcaccagca gcaagtcccg cagctccagc accagctagt 1500
cccgcagcac ccgcaccttc agcaccagcc gcatcaccag ctgctccagc tccagcatct 1560
cccgctgcac cagcaccaag tgctcccgct gcttctcctg cagctcctgc tccagcctct 1620
ccagctgctc ccgcaccttc tgctccagct gcctctccag ctgctccagc accagcttca 1680
ccagctgctc ccgctcctag tgctcctgcc gctagtccag cagctcccgc accagctagc 1740
cctgccgctc ctgctccaag tgctccagcc gcaagtcccg ctgcacccgc tccagcttct 1800
ccagcagctc ccgctccaag cgcacccgca gcttctcccg ctgctcccgc accagcaagt 1860
cctgctgctc cagctccttc agctcctgcc gcttctcctg ctgctccagc tcctgcaagt 1920
ccagctgctc cagcaccaag tgcaccagca gcaagtccag ctgctcctgc tcctgcctct 1980
ccagcagcac cagctcctag cgcaccagcc gccagtcctg cagcaccagc tccagcttct 2040
cccgctgctc ctgctccttc agcaccagct gctagtcctg ctgctcctgc tccagcttct 2100
cctgccgctc cagcaccaag cgctccagct gcatctcccg cagctcccgc tccagcatct 2160
cctgcagcac ccgcaccatc agctccagct gcttccccag ccgctcctgc accagctagc 2220
ccagcagctc ctgcacctag cgctcccgct gcttcaccag cagctccagc accagccagt 2280
ccagctgctc ctgcaccatc tgcacccgct gctagtcccg ctgctccagc tcctgctagc 2340
cctgcagcac cagctccaag tgcacccgcc gcatcacccg ccgcaccagc accagcaagc 2400
cctgcagcac ccgctccaag cgctccagct gctagcccag cagcaccagc accagcatca 2460
ccagccgctc cagcaccttc tgcaccagca gcttcacccg ctgcacccgc tccagcatca 2520
cccgccgctc cagctcctag cgctcctgca gcctctcctg cagctccagc accagcaagc 2580
cccgctgcac cagcaccatc tgctccagca gctagccctg cagctcccgc tcctgcatct 2640
cccgccgcac cagctccatc tgcacccgca gcatctgata ccggcagacc cttcgtggaa 2700
atgtacagcg agatccccga gatcatccac atgaccgagg gcagagagct ggtcatccct 2760
tgcagagtga cctctcctaa catcacagtg accctgaaga agtttcccct ggacacactg 2820
atccccgacg gcaagagaat catctgggac tcccggaagg gcttcatcat ctccaacgcc 2880
acctacaaag agatcggcct gctgacctgt gaagccaccg tgaatggcca cctgtacaag 2940
accaactatc tgacccacag acagaccaac accatcatcg acgtggtgct gagcccctct 3000
catggcatcg agctgtccgt gggagagaag ctcgtgctga actgtaccgc cagaaccgag 3060
ctgaacgtgg gcatcgactt caactgggag taccctagct ccaaacacca gcacaagaaa 3120
ctggtcaacc gggacctcaa gacccagtcc ggctccgaaa tgaagaaatt cctgtccaca 3180
ctgaccatcg acggcgtgac cagatctgac cagggactgt atacctgtgc cgcctcctct 3240
ggcctgatga ccaagaaaaa ctccaccttc gtgcgggtcc acgagaag 3288
<210> 62
<211> 1096
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 62
Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val
1 5 10 15
Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val
20 25 30
Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile
35 40 45
Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val
50 55 60
Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn
65 70 75 80
His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Tyr Ile
85 90 95
Tyr Val Pro Asp Pro Asp Val Ala Phe Val Pro Leu Gly Met Thr Asp
100 105 110
Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg
115 120 125
Thr Thr Asp Pro Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val
130 135 140
Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr
145 150 155 160
Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln
165 170 175
Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp
180 185 190
Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile
195 200 205
Val Val Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Leu Gln Trp
210 215 220
Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Leu Glu Glu
225 230 235 240
Ile Lys Val Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr Val Pro Glu
245 250 255
Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala
260 265 270
Thr Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu
275 280 285
Lys Gly Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
290 295 300
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
305 310 315 320
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
325 330 335
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
340 345 350
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
355 360 365
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
370 375 380
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
385 390 395 400
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
405 410 415
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
420 425 430
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
435 440 445
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
450 455 460
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
465 470 475 480
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
485 490 495
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
500 505 510
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
515 520 525
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
530 535 540
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
545 550 555 560
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
565 570 575
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
580 585 590
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
595 600 605
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
610 615 620
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
625 630 635 640
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
645 650 655
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
660 665 670
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
675 680 685
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
690 695 700
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
705 710 715 720
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
725 730 735
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
740 745 750
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
755 760 765
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
770 775 780
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
785 790 795 800
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
805 810 815
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
820 825 830
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
835 840 845
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
850 855 860
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
865 870 875 880
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Asp Thr Gly Arg
885 890 895
Pro Phe Val Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile His Met Thr
900 905 910
Glu Gly Arg Glu Leu Val Ile Pro Cys Arg Val Thr Ser Pro Asn Ile
915 920 925
Thr Val Thr Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly
930 935 940
Lys Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala
945 950 955 960
Thr Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr Val Asn Gly
965 970 975
His Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg Gln Thr Asn Thr Ile
980 985 990
Ile Asp Val Val Leu Ser Pro Ser His Gly Ile Glu Leu Ser Val Gly
995 1000 1005
Glu Lys Leu Val Leu Asn Cys Thr Ala Arg Thr Glu Leu Asn Val Gly
1010 1015 1020
Ile Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys His Gln His Lys Lys
1025 1030 1035 1040
Leu Val Asn Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu Met Lys Lys
1045 1050 1055
Phe Leu Ser Thr Leu Thr Ile Asp Gly Val Thr Arg Ser Asp Gln Gly
1060 1065 1070
Leu Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met Thr Lys Lys Asn Ser
1075 1080 1085
Thr Phe Val Arg Val His Glu Lys
1090 1095
<210> 63
<211> 3378
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 63
cagctgtccc tgccttccat cctgcctaac gagaacgaga aggtggtgca gctgaactcc 60
tccttctctc tgcggtgctt cggcgagtcc gaagtgtctt ggcagtaccc catgtccgaa 120
gaggaatcct ccgacgtgga aatccggaac gaggaaaaca actccggcct gttcgtgacc 180
gtgctggaag tgtcctctgc ctctgctgct cacaccggac tgtacacctg ttactacaat 240
cacacccaga ccgaagagaa cgagctggaa ggccggcaca tctacatcta cgtgcccgat 300
cctgacgtgg cctttgtgcc tctgggcatg accgactacc tggtcatcgt ggaagatgac 360
gactccgcta tcatcccctg ccggaccaca gatcctgaga cacctgtgac actgcacaac 420
tccgaaggcg tggtgcctgc ctcctacgat tctagacagg gcttcaacgg caccttcacc 480
gtgggacctt acatctgcga ggctaccgtg aagggcaaga agttccagac aatccccttc 540
aacgtgtacg ccctgaaggc cacctctgag ctggacctgg aaatggaagc cctgaaaacc 600
gtgtacaaga gcggcgagac aatcgtcgtg acctgcgccg tgttcaacaa cgaggtggtg 660
gacctgcagt ggacctatcc tggcgaagtg aaaggcaagg gcatcaccat gctggaagag 720
atcaaggtgc cctccatcaa gctggtgtat accctgaccg tgcctgaggc cacagtgaag 780
gactctggcg actacgagtg tgccgctaga caggccacca gagaagtcaa agagatgaag 840
aaagtcacca tctccgtgca cgagaaaggc ggcggaggcg gaagcggtgg cggaggaagc 900
ggaggcggcg gatctgcttc tcctgctgct cctgctccag ctagtcctgc tgcaccagca 960
ccttcagctc cagctgcttc tccagcagca cccgcaccag catcaccagc cgctccagca 1020
ccaagtgcac cagctgctag cccagctgct cccgctcctg catctcctgc agcaccagct 1080
ccatctgcac cagcagcaag tccagcagct ccagctcctg cttcacccgc tgctcccgca 1140
ccatctgctc cagccgcatc acccgctgca ccagctccag cttctcccgc cgctccagct 1200
ccttctgctc ctgcagcatc tcctgctgct ccagcaccag caagcccagc cgctcctgct 1260
ccatcagcac ccgctgcctc tccagctgct cctgcaccag cctctccagc tgcacccgct 1320
cctagtgctc cagctgcaag tcccgccgca ccagcaccag ctagtcctgc agctcctgca 1380
ccaagcgctc cagcagcttc ccctgcagct cctgctcctg cctctcctgc cgctcctgct 1440
cctagtgcac cagccgcatc tcccgcagct cccgctcctg ctagtccagc agctcccgca 1500
ccttctgcac cagcagcttc cccagccgca ccagctccag caagccccgc tgctccagca 1560
cctagtgctc ccgctgcctc accagcagct cccgctccag caagccctgc tgcacccgct 1620
ccaagcgcac cagcagcatc accagctgca cccgcaccag ctagcccagc agcaccagct 1680
cctagcgctc ccgcagctag ccctgctgct cccgcaccag cttcacccgc agcacccgct 1740
ccatcagctc ccgccgctag tcccgctgct cctgctcctg caagccctgc tgctcctgct 1800
ccttctgctc cagctgctag tcctgccgct cctgctccag cttctccagc agctcctgca 1860
cctagcgcac ccgccgctag tccagcagca ccagcaccag cttctccagc tgcaccagca 1920
ccatcagcac ccgcagcttc accagcagct ccagcaccag catctcccgc agctccagca 1980
ccatcagctc cagcagcaag cccagctgca ccagctccag catcaccagc tgctcccgct 2040
ccaagcgctc ctgctgcttc tcctgccgca ccagctccag ccagtccagc agcacccgct 2100
ccaagtgcac ccgccgcttc tccagctgct ccagctcctg ctagccccgc agctccagct 2160
ccaagtgctc cagccgccag tcctgcagct cccgcaccag ctagccccgc tgctcctgca 2220
ccatccgcac cagctgctag tcccgcagca ccagctccag ctagcccagc cgcaccagca 2280
ccatctgctc ccgctgctag ccctgcagca cccgctccag ccagtcctgc tgctccagct 2340
ccatctgctc ccgccgcttc tcctgcagct cctgcaccag cttctcccgc tgctcctgct 2400
cctagcgctc cagcagcctc tccagcagca ccagctccag caagtcctgc agcaccagca 2460
cctagtgcac cagcagcttc acccgctgct cccgctccag catctccagc tgctccagca 2520
ccttctgctc cagctgcaag ccccgcagct cctgcaccag caagtcctgc cgctccagct 2580
cctagcgctc ctgctgcaag tccagctgct cccgctccag cttcaccagc cgcaccagca 2640
ccttccgcac cagcagctag tccagctgct cctgctccag ctagcccagc tgctccagct 2700
ccttcagcac cagcagccgg tggcggagga tctggcggag gcggatctgg cggcggtggt 2760
tcttctgata ccggcagacc cttcgtggaa atgtacagcg agatccccga gatcatccac 2820
atgaccgagg gcagagagct ggtcatccct tgcagagtga cctctcctaa catcacagtg 2880
accctgaaga agtttcccct ggacacactg atccccgacg gcaagagaat catctgggac 2940
tcccggaagg gcttcatcat ctccaacgcc acctacaaag agatcggact gctgacctgc 3000
gaagccactg tgaacggcca cctgtacaag accaactatc tgacccacag acagaccaac 3060
accatcatcg acgtggtgct gagcccctct catggcatcg agctgtccgt gggagagaaa 3120
ctggtgctga actgcaccgc cagaaccgag ctgaacgtgg gcatcgactt caactgggag 3180
taccccagct ccaaacacca gcacaagaag ctggtcaacc gggatctgaa aacccagtcc 3240
ggctccgaaa tgaagaaatt cctgagcacc ctgaccatcg acggcgtgac cagatctgac 3300
cagggcctgt atacctgtgc cgcctcttct ggcctgatga ccaagaaaaa ctccaccttc 3360
gtgcgggtcc acgagaag 3378
<210> 64
<211> 1126
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 64
Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val
1 5 10 15
Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val
20 25 30
Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile
35 40 45
Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val
50 55 60
Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn
65 70 75 80
His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Tyr Ile
85 90 95
Tyr Val Pro Asp Pro Asp Val Ala Phe Val Pro Leu Gly Met Thr Asp
100 105 110
Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg
115 120 125
Thr Thr Asp Pro Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val
130 135 140
Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr
145 150 155 160
Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln
165 170 175
Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp
180 185 190
Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile
195 200 205
Val Val Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Leu Gln Trp
210 215 220
Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Leu Glu Glu
225 230 235 240
Ile Lys Val Pro Ser Ile Lys Leu Val Tyr Thr Leu Thr Val Pro Glu
245 250 255
Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala
260 265 270
Thr Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu
275 280 285
Lys Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly
290 295 300
Ser Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
305 310 315 320
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
325 330 335
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
340 345 350
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
355 360 365
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
370 375 380
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
385 390 395 400
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
405 410 415
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
420 425 430
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
435 440 445
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
450 455 460
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
465 470 475 480
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
485 490 495
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
500 505 510
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
515 520 525
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
530 535 540
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
545 550 555 560
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
565 570 575
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
580 585 590
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
595 600 605
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
610 615 620
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
625 630 635 640
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
645 650 655
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
660 665 670
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
675 680 685
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
690 695 700
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
705 710 715 720
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
725 730 735
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
740 745 750
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
755 760 765
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
770 775 780
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
785 790 795 800
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
805 810 815
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala
820 825 830
Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro
835 840 845
Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro
850 855 860
Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala
865 870 875 880
Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro
885 890 895
Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Gly Gly Gly Gly Ser Gly
900 905 910
Gly Gly Gly Ser Gly Gly Gly Gly Ser Ser Asp Thr Gly Arg Pro Phe
915 920 925
Val Glu Met Tyr Ser Glu Ile Pro Glu Ile Ile His Met Thr Glu Gly
930 935 940
Arg Glu Leu Val Ile Pro Cys Arg Val Thr Ser Pro Asn Ile Thr Val
945 950 955 960
Thr Leu Lys Lys Phe Pro Leu Asp Thr Leu Ile Pro Asp Gly Lys Arg
965 970 975
Ile Ile Trp Asp Ser Arg Lys Gly Phe Ile Ile Ser Asn Ala Thr Tyr
980 985 990
Lys Glu Ile Gly Leu Leu Thr Cys Glu Ala Thr Val Asn Gly His Leu
995 1000 1005
Tyr Lys Thr Asn Tyr Leu Thr His Arg Gln Thr Asn Thr Ile Ile Asp
1010 1015 1020
Val Val Leu Ser Pro Ser His Gly Ile Glu Leu Ser Val Gly Glu Lys
1025 1030 1035 1040
Leu Val Leu Asn Cys Thr Ala Arg Thr Glu Leu Asn Val Gly Ile Asp
1045 1050 1055
Phe Asn Trp Glu Tyr Pro Ser Ser Lys His Gln His Lys Lys Leu Val
1060 1065 1070
Asn Arg Asp Leu Lys Thr Gln Ser Gly Ser Glu Met Lys Lys Phe Leu
1075 1080 1085
Ser Thr Leu Thr Ile Asp Gly Val Thr Arg Ser Asp Gln Gly Leu Tyr
1090 1095 1100
Thr Cys Ala Ala Ser Ser Gly Leu Met Thr Lys Lys Asn Ser Thr Phe
1105 1110 1115 1120
Val Arg Val His Glu Lys
1125
<210> 65
<211> 3378
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 65
tctgataccg gcagaccctt cgtggaaatg tacagcgaga tccccgagat catccacatg 60
accgagggca gagagctggt catcccctgc agagtgacct ctcctaacat caccgtgact 120
ctgaagaagt tccctctgga cacactgatc cccgacggca agagaatcat ctgggactcc 180
cggaagggct tcatcatctc caacgccacc tacaaagaga tcggcctgct gacctgcgag 240
gccaccgtta atggccacct gtacaagacc aactatctga cccacagaca gaccaacacc 300
atcatcgacg tggtgctgag cccctctcat ggcatcgagc tgtccgtggg agaaaagctg 360
gtgctgaact gcaccgccag aaccgagctg aacgtgggca tcgacttcaa ctgggagtac 420
ccctccagca agcaccagca caagaagctg gtcaaccggg acctgaaaac ccagtccggc 480
tccgagatga agaaattcct gagcaccctg accatcgacg gcgtgaccag atctgaccag 540
ggcctgtata cctgcgccgc ttcctctggc ctgatgacca agaaaaactc caccttcgtg 600
cgggtgcacg agaaaggtgg cggaggatct ggcggaggcg gctctggcgg cggtggatct 660
gcttctcctg ctgctccagc tccagcttct ccagcagctc ctgcaccttc tgcaccagct 720
gcaagtcctg cagcacccgc accagctagt cctgccgctc ctgctcctag tgctcctgcc 780
gcaagtccag ctgctcccgc tcctgcaagc ccagctgcac cagcaccaag tgctccagct 840
gcctcaccag ccgcaccagc tccagcaagc cctgcagctc ccgctccttc agctcctgct 900
gcttctcccg cagcacccgc tccagcatca ccagccgctc cagcaccatc agctccagca 960
gcatctcctg cagctccagc tcctgctagt cccgctgctc ccgcacctag tgcaccagcc 1020
gcttctcccg ccgctcctgc tcctgcatct cctgctgcac ccgctccatc tgctcccgcc 1080
gcatcacccg cagctcccgc accagcctct ccagctgcac cagctcctag cgcaccagca 1140
gctagcccag ctgctcctgc accagctagc cccgcagctc cagctccaag cgctcctgct 1200
gcatccccag ctgctccagc tcctgcctca ccagctgctc cagcaccttc tgctcccgcc 1260
gcttctcctg ccgcaccagc tccagctagt ccagccgcac cagcaccatc tgcacccgct 1320
gctagccctg ctgcaccagc tccagcatca cccgctgcac cagctccatc cgcaccagct 1380
gcttcaccag cagctcccgc tccagcttca cccgctgctc ccgctcctag cgctcccgca 1440
gcttcaccag ctgcacccgc tccagccagt ccagctgctc ccgcaccatc cgcaccagca 1500
gcaagtcccg ccgctccagc tccagctagc ccagctgctc cagctccatc tgcaccagcc 1560
gcatctccag ctgctccagc tccagctagt cctgctgcac ccgctcctag cgctccagct 1620
gcaagtcctg ccgctcctgc tccagcctct cctgccgctc cagcacctag cgctcccgct 1680
gccagtccag cagctccagc tcctgcatct cccgccgcac cagcaccaag cgcacccgca 1740
gcatctcccg ctgctcccgc tccagcaagc cctgccgctc ctgcaccaag tgcaccagca 1800
gcatccccag cagctcccgc tccagcatct ccagcagctc cagctccaag tgctccagca 1860
gctagtcctg ctgctccagc tcctgctagc cctgcagctc ctgcaccatc tgctcccgca 1920
gccagtcctg cagctcctgc accagcaagt ccagctgctc ctgcacctag cgctccagct 1980
gcatctcccg ctgcaccagc tccagcaagt cccgctgctc ctgctccttc tgctccagca 2040
gcttcccctg ctgctcctgc tcctgcttca cccgccgctc cagctccatc tgctcccgct 2100
gcctctccag ccgctcctgc accagcatca ccagctgctc ccgcaccaag cgcacccgct 2160
gcaagcccag ccgctcctgc tcctgctagt ccagccgctc ctgcaccttc agcacccgca 2220
gcttccccag ctgctccagc tccagcaagt ccagcagctc cagctccttc cgctccagct 2280
gcaagccccg cagctccagc tcctgcttct cctgctgctc ctgcaccatc agctccagct 2340
gctagtccag cagctcctgc accagccagt cctgccgcac cagcaccttc agctccagct 2400
gcttcacccg ctgctcccgc accagctagt ccagccgctc cagcaccaag tgctcccgcc 2460
gctggtggtg gtggatctgg tggtggcgga agcggaggtg gtggttctca gctgtccctg 2520
ccttccatcc tgcctaacga gaacgagaag gtggtccagc tgaactcctc cttctctctg 2580
cggtgcttcg gcgagtccga agtgtcttgg cagtacccca tgtccgaaga ggaatcctcc 2640
gacgtggaaa tccggaacga ggaaaacaac tccggcctgt tcgtgaccgt gctggaagtg 2700
tcctctgcct ctgctgctca caccggcctg tacacatgct actacaatca cacccagacc 2760
gaagagaacg agctggaagg ccggcacatc tacatctacg tgcccgatcc tgacgtggcc 2820
tttgtgcctc tgggcatgac cgactacctg gtcatcgtgg aagatgacga ctccgctatc 2880
atcccttgcc ggaccaccga tccagagaca cctgtgacac tgcacaactc cgaaggcgtg 2940
gtgcctgcct cctacgattc tagacagggc ttcaacggca ccttcaccgt gggaccttac 3000
atctgcgagg ctacagtgaa gggcaagaag tttcagacaa tccccttcaa cgtgtacgcc 3060
ctgaaggcca cctctgagct ggacctggaa atggaagctc tgaaaaccgt gtacaagtcc 3120
ggcgagacaa tcgtcgtgac ctgtgccgtg ttcaacaacg aagtggtgga cctgcagtgg 3180
acctatcctg gcgaagtgaa aggcaagggc atcacaatgc tggaagagat caaggtgccc 3240
tccatcaagc tggtgtatac cctgaccgtg cctgaggcca ctgtgaagga ctctggcgac 3300
tacgagtgtg ccgctagaca ggccaccaga gaagtcaaag aaatgaagaa agtgaccatc 3360
tccgtccacg agaagggc 3378
<210> 66
<211> 1126
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 66
Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile Pro Glu
1 5 10 15
Ile Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys Arg Val
20 25 30
Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu Asp Thr
35 40 45
Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys Gly Phe
50 55 60
Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr Cys Glu
65 70 75 80
Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr His Arg
85 90 95
Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His Gly Ile
100 105 110
Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala Arg Thr
115 120 125
Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser Ser Lys
130 135 140
His Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln Ser Gly
145 150 155 160
Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly Val Thr
165 170 175
Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly Leu Met
180 185 190
Thr Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys Gly Gly Gly
195 200 205
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Ser Pro Ala
210 215 220
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
225 230 235 240
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
245 250 255
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
260 265 270
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
275 280 285
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
290 295 300
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
305 310 315 320
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
325 330 335
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
340 345 350
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
355 360 365
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
370 375 380
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
385 390 395 400
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
405 410 415
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
420 425 430
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
435 440 445
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
450 455 460
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
465 470 475 480
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
485 490 495
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
500 505 510
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
515 520 525
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
530 535 540
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
545 550 555 560
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
565 570 575
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
580 585 590
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
595 600 605
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
610 615 620
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
625 630 635 640
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
645 650 655
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
660 665 670
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
675 680 685
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
690 695 700
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
705 710 715 720
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
725 730 735
Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala
740 745 750
Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro
755 760 765
Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala
770 775 780
Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala
785 790 795 800
Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro
805 810 815
Ser Ala Pro Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
820 825 830
Gly Gly Gly Ser Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn
835 840 845
Glu Lys Val Val Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly
850 855 860
Glu Ser Glu Val Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser
865 870 875 880
Asp Val Glu Ile Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr
885 890 895
Val Leu Glu Val Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr
900 905 910
Cys Tyr Tyr Asn His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg
915 920 925
His Ile Tyr Ile Tyr Val Pro Asp Pro Asp Val Ala Phe Val Pro Leu
930 935 940
Gly Met Thr Asp Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile
945 950 955 960
Ile Pro Cys Arg Thr Thr Asp Pro Glu Thr Pro Val Thr Leu His Asn
965 970 975
Ser Glu Gly Val Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn
980 985 990
Gly Thr Phe Thr Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly
995 1000 1005
Lys Lys Phe Gln Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr
1010 1015 1020
Ser Glu Leu Asp Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser
1025 1030 1035 1040
Gly Glu Thr Ile Val Val Thr Cys Ala Val Phe Asn Asn Glu Val Val
1045 1050 1055
Asp Leu Gln Trp Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr
1060 1065 1070
Met Leu Glu Glu Ile Lys Val Pro Ser Ile Lys Leu Val Tyr Thr Leu
1075 1080 1085
Thr Val Pro Glu Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala
1090 1095 1100
Ala Arg Gln Ala Thr Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile
1105 1110 1115 1120
Ser Val His Glu Lys Gly
1125
<210> 67
<211> 2685
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 67
cagctgagcc tgccaagcat cctgcctaac gaaaatgaga aggtggtcca gctgaacagc 60
tccttcagtc tgagatgctt tggcgaatca gaggtgagct ggcagtaccc aatgtcagag 120
gaagagtcta gtgacgtgga aattaggaat gaagagaaca attcaggact gttcgtgacc 180
gtcctggagg tgtcaagcgc cagcgccgct cacaccggac tgtacacatg ttactataac 240
catactcaga ccgaagagaa tgaactggag gggaggcaca tctccatcca cgtgcccgat 300
cctgacgtgg cctttgcccc actgggaatg acagattacc tggtcatcgt cgaggacgat 360
gactctgcca tcattccctg ccgcacctca gactccgaaa ctcctgtgac cctgcataac 420
agtgagggcg tggtccccgc ctcctacgat tctcgacagg gattcaatgg caccttcacc 480
gtcggaccct atatctgtga ggccactgtg aagggcaaga aattccagac cattcctttt 540
aacgtgtacg cactgaaagc cacatccgaa ctggacctgg aaatggaggc cctgaagact 600
gtctataaat ctggagagac tatcgtggtc acctgcgccg tgttcaacaa tgaagtggtc 660
gatgcgcagt ggacttaccc cggcgaggtc aagggcaaag ggattaccat ggacgaagag 720
atcaaggtgc ctagccagaa gctggtgtac accctgacag tcccagaagc caccgtgaag 780
gattccgggg actatgagtg tgcagcccgg caggcctcca gagaagtgaa ggagatgaag 840
aaagtgacaa tcagtgtcca cgagaaagga gcaagccccg ccgctccagc ccccgcaagc 900
ccagccgcac cagcaccttc cgcaccagcc gcctccccag cagcacccgc acccgcttcc 960
cctgccgccc ccgcccctag cgcccccgcc gcctcccctg ccgccccagc ccccgcctct 1020
ccagccgccc ctgccccatc tgccccagcc gccagcccag ccgcccccgc ccctgccagc 1080
cccgccgccc cagccccctc cgcccctgct gcttcccctg ccgcccctgc cccagccagc 1140
ccagctgctc ctgctccaag cgcccctgct gcaagcccag ctgctccagc ccccgcctct 1200
cccgctgctc cagctccttc tgcccctgct gcttccccag ctgctcccgc ccctgcctct 1260
cctgctgctc ctgctccctc cgcccctgct gcatcccccg ctgctcctgc cccagcttcc 1320
ccagctgcac ctgctccaag cgccccagct gcaagcccag ctgcacctgc acctgcttcc 1380
cccgctgccc ctgccccaag cgcccccgcc gcatcccccg ccgcaccagc ccccgcctca 1440
cccgcagcac cagccccatc agcaccagcc gcctcaccag ccgcccccgc acccgcaagt 1500
ccagcagcac ccgcaccatc cgcccccgcc gcaagcccag ccgcccccgc tccagcatcc 1560
cctgccgccc ccgcccccag cgcccccgcc gcctcccctg ccgccccagc ccccgcctct 1620
ccagccgccc ctgccccatc tgccccagcc gccagccccg ccgcccccgc ccctgccagc 1680
cccgccgccc cagccccctc cgcccctgct gcttcccccg ccgcccctgc cccagccagc 1740
ccagctgctc ccgctccaag cgcccccgct gcaagcccag ctgctccagc ccccgcctct 1800
cccgctgctc cagctccttc tgcccctgct gcttcccccg ctgctcccgc ccccgcctct 1860
cctgctgctc ccgctccctc cgcccctgct gcatcccccg ctgctcctgc cccagcttcc 1920
ccagctgcac ctgctcccag cgccccagct gcaagccccg ctgcacctgc acctgcttcc 1980
cccgctgccc ctgccccaag cgcccccgcc gcctcacccg cagcccccgc tccagccagc 2040
cccgcagcac cagcaccctc agccccagcc tcagataccg gccggccttt tgtggagatg 2100
tactccgaaa tccccgagat cattcacatg accgaagggc gagagctggt catcccatgc 2160
cgggtgacaa gccccaacat tactgtgacc ctgaagaaat tccctctgga tactctgatc 2220
ccagacggga agaggatcat ttgggacagc cgcaaaggct tcatcatttc caatgccaca 2280
tataaggaaa ttggcctgct gacatgcgag gccactgtga acgggcacct gtacaaaacc 2340
aattatctga cacatcggca gacaaacact atcattgatg tggtcctgag cccttcccat 2400
gggatcgaac tgagcgtcgg agagaagctg gtgctgaatt gtacagccag aactgaactg 2460
aacgtgggca ttgacttcaa ttgggagtac ccctcctcta agcaccagca taagaaactg 2520
gtgaataggg atctgaaaac ccagtctggg agtgagatga agaaatttct gtctaccctg 2580
acaatcgatg gcgtgacacg cagtgaccag gggctgtata cttgtgcagc cagttcaggc 2640
ctgatgacca agaagaacag cacatttgtc cgagtccacg aaaag 2685
<210> 68
<211> 895
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 68
Gln Leu Ser Leu Pro Ser Ile Leu Pro Asn Glu Asn Glu Lys Val Val
1 5 10 15
Gln Leu Asn Ser Ser Phe Ser Leu Arg Cys Phe Gly Glu Ser Glu Val
20 25 30
Ser Trp Gln Tyr Pro Met Ser Glu Glu Glu Ser Ser Asp Val Glu Ile
35 40 45
Arg Asn Glu Glu Asn Asn Ser Gly Leu Phe Val Thr Val Leu Glu Val
50 55 60
Ser Ser Ala Ser Ala Ala His Thr Gly Leu Tyr Thr Cys Tyr Tyr Asn
65 70 75 80
His Thr Gln Thr Glu Glu Asn Glu Leu Glu Gly Arg His Ile Ser Ile
85 90 95
His Val Pro Asp Pro Asp Val Ala Phe Ala Pro Leu Gly Met Thr Asp
100 105 110
Tyr Leu Val Ile Val Glu Asp Asp Asp Ser Ala Ile Ile Pro Cys Arg
115 120 125
Thr Ser Asp Ser Glu Thr Pro Val Thr Leu His Asn Ser Glu Gly Val
130 135 140
Val Pro Ala Ser Tyr Asp Ser Arg Gln Gly Phe Asn Gly Thr Phe Thr
145 150 155 160
Val Gly Pro Tyr Ile Cys Glu Ala Thr Val Lys Gly Lys Lys Phe Gln
165 170 175
Thr Ile Pro Phe Asn Val Tyr Ala Leu Lys Ala Thr Ser Glu Leu Asp
180 185 190
Leu Glu Met Glu Ala Leu Lys Thr Val Tyr Lys Ser Gly Glu Thr Ile
195 200 205
Val Val Thr Cys Ala Val Phe Asn Asn Glu Val Val Asp Ala Gln Trp
210 215 220
Thr Tyr Pro Gly Glu Val Lys Gly Lys Gly Ile Thr Met Asp Glu Glu
225 230 235 240
Ile Lys Val Pro Ser Gln Lys Leu Val Tyr Thr Leu Thr Val Pro Glu
245 250 255
Ala Thr Val Lys Asp Ser Gly Asp Tyr Glu Cys Ala Ala Arg Gln Ala
260 265 270
Ser Arg Glu Val Lys Glu Met Lys Lys Val Thr Ile Ser Val His Glu
275 280 285
Lys Gly Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
290 295 300
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
305 310 315 320
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
325 330 335
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
340 345 350
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
355 360 365
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
370 375 380
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
385 390 395 400
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
405 410 415
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
420 425 430
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
435 440 445
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
450 455 460
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
465 470 475 480
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
485 490 495
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
500 505 510
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
515 520 525
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
530 535 540
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
545 550 555 560
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
565 570 575
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
580 585 590
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
595 600 605
Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro
610 615 620
Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser
625 630 635 640
Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser Pro Ala Ala Pro
645 650 655
Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala Pro Ala Ala Ser
660 665 670
Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro Ser Ala
675 680 685
Pro Ala Ser Asp Thr Gly Arg Pro Phe Val Glu Met Tyr Ser Glu Ile
690 695 700
Pro Glu Ile Ile His Met Thr Glu Gly Arg Glu Leu Val Ile Pro Cys
705 710 715 720
Arg Val Thr Ser Pro Asn Ile Thr Val Thr Leu Lys Lys Phe Pro Leu
725 730 735
Asp Thr Leu Ile Pro Asp Gly Lys Arg Ile Ile Trp Asp Ser Arg Lys
740 745 750
Gly Phe Ile Ile Ser Asn Ala Thr Tyr Lys Glu Ile Gly Leu Leu Thr
755 760 765
Cys Glu Ala Thr Val Asn Gly His Leu Tyr Lys Thr Asn Tyr Leu Thr
770 775 780
His Arg Gln Thr Asn Thr Ile Ile Asp Val Val Leu Ser Pro Ser His
785 790 795 800
Gly Ile Glu Leu Ser Val Gly Glu Lys Leu Val Leu Asn Cys Thr Ala
805 810 815
Arg Thr Glu Leu Asn Val Gly Ile Asp Phe Asn Trp Glu Tyr Pro Ser
820 825 830
Ser Lys His Gln His Lys Lys Leu Val Asn Arg Asp Leu Lys Thr Gln
835 840 845
Ser Gly Ser Glu Met Lys Lys Phe Leu Ser Thr Leu Thr Ile Asp Gly
850 855 860
Val Thr Arg Ser Asp Gln Gly Leu Tyr Thr Cys Ala Ala Ser Ser Gly
865 870 875 880
Leu Met Thr Lys Lys Asn Ser Thr Phe Val Arg Val His Glu Lys
885 890 895
<210> 69
<211> 600
<212> DNA
<213> 人工序列(ArtificialSequence)
<400> 69
gccgctcctg ctgctccagc tcctgctgcc ccagcagccc ctgccccagc tgctcctgca 60
gcagctcccg cagccccagc acccgccgca ccagcagctc cagcccctgc agcaccagct 120
gctgcccctg ccgcccctgc tccagccgca cccgctgcac ccgcaccagc tgccccagcc 180
gccgcacccg cagctccagc tcccgctgct cctgctgcac cagcccctgc cgctccagca 240
gccgcaccag cagcaccagc cccagctgct cccgctgctc cagcacccgc agcccccgca 300
gcagcaccag ccgctcctgc tcctgccgcc ccagcagctc ctgctccagc agcccctgct 360
gctgctccag cagcaccagc accagctgct ccagctgccc cagctcctgc agcacccgcc 420
gctgctcccg cagctcctgc ccctgctgca cccgcagcac ccgctccagc agcacctgca 480
gctgcaccag ctgctcccgc acctgccgct cccgcagctc ccgctcctgc agctccagcc 540
gcagctcctg ctgctcctgc accagcagct cccgccgcac cagctccagc tgcccctgct 600
<210> 70
<211> 200
<212> PRT
<213> 人工序列(ArtificialSequence)
<400> 70
Ala Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala Ala Pro Ala Pro
1 5 10 15
Ala Ala Pro Ala Ala Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala
20 25 30
Ala Pro Ala Pro Ala Ala Pro Ala Ala Ala Pro Ala Ala Pro Ala Pro
35 40 45
Ala Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala Ala Ala Pro Ala
50 55 60
Ala Pro Ala Pro Ala Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala
65 70 75 80
Ala Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala Ala Pro Ala Pro
85 90 95
Ala Ala Pro Ala Ala Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala
100 105 110
Ala Pro Ala Pro Ala Ala Pro Ala Ala Ala Pro Ala Ala Pro Ala Pro
115 120 125
Ala Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala Ala Ala Pro Ala
130 135 140
Ala Pro Ala Pro Ala Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala
145 150 155 160
Ala Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala Ala Pro Ala Pro
165 170 175
Ala Ala Pro Ala Ala Ala Pro Ala Ala Pro Ala Pro Ala Ala Pro Ala
180 185 190
Ala Pro Ala Pro Ala Ala Pro Ala
195 200

Claims (23)

1.蛋白质,所述蛋白质以如下顺序从N端至C端排列:
一个PDGFR的胞外结构域-接头(I)- 一个VEGFR的胞外结构域;
一个VEGFR的胞外结构域-接头(I)- 一个PDGFR的胞外结构域;
信号肽序列- 一个PDGFR的胞外结构域-接头(I)- 一个VEGFR的胞外结构域;
信号肽序列- 一个VEGFR的胞外结构域-接头(I)- 一个PDGFR的胞外结构域;
一个PDGFR的胞外结构域-接头(I)- 一个VEGFR的胞外结构域-纯化标签;
一个VEGFR的胞外结构域-接头(I)- 一个PDGFR的胞外结构域-纯化标签;
信号肽序列- 一个PDGFR的胞外结构域-接头(I)- 一个VEGFR的胞外结构域-纯化标签;
信号肽序列- 一个VEGFR的胞外结构域-接头(I)- 一个PDGFR的胞外结构域-纯化标签;
一个PDGFR的胞外结构域-接头(II)-接头(I)-接头(II)- 一个VEGFR的胞外结构域;
一个VEGFR的胞外结构域-接头(II)-接头(I)-接头(II)- 一个PDGFR的胞外结构域;
信号肽序列- 一个PDGFR的胞外结构域-接头(II)-接头(I)-接头(II)- 一个VEGFR的胞外结构域;
信号肽序列- 一个VEGFR的胞外结构域-接头(II)-接头(I)-接头(II)- 一个PDGFR的胞外结构域;
一个PDGFR的胞外结构域-接头(II)-接头(I)-接头(II)- 一个VEGFR的胞外结构域-纯化标签;
一个VEGFR的胞外结构域-接头(II)-接头(I)-接头(II)- 一个PDGFR的胞外结构域-纯化标签;
信号肽序列- 一个PDGFR的胞外结构域-接头(II)-接头(I)-接头(II)- 一个VEGFR的胞外结构域-纯化标签;
信号肽序列- 一个VEGFR的胞外结构域-接头(II)-接头(I)-接头(II)- 一个PDGFR的胞外结构域-纯化标签;
接头(III)- 一个PDGFR的胞外结构域- 一个VEGFR的胞外结构域;
接头(III)- 一个VEGFR的胞外结构域- 一个PDGFR的胞外结构域;
信号肽序列-接头(III)- 一个PDGFR的胞外结构域- 一个VEGFR的胞外结构域;
信号肽序列-接头(III)- 一个VEGFR的胞外结构域- 一个PDGFR的胞外结构域;
接头(III)- 一个PDGFR的胞外结构域- 一个VEGFR的胞外结构域-纯化标签;
接头(III)- 一个VEGFR的胞外结构域- 一个PDGFR的胞外结构域-纯化标签;
信号肽序列-接头(III)- 一个PDGFR的胞外结构域- 一个VEGFR的胞外结构域-纯化标签;
信号肽序列-接头(III)- 一个VEGFR的胞外结构域- 一个PDGFR的胞外结构域-纯化标签;
接头(I)为如下氨基酸序列:(ASPAAPAPASPAAPAPSAPA)n,其中n为10-40的整数;
接头(II)为如下氨基酸序列:(GGGGS)n,其中n为1-5的整数;
接头(III)为如下氨基酸序列:(ASPAAPAPASPAAPAPSAPA)n,其中n为10的整数;
PDGFR的胞外结构域为:
(a) 如SEQ ID No.4或SEQ ID No.20中显示的氨基酸序列的蛋白质;或
(b) 如SEQ ID No.3或 SEQ ID No.19中显示的核苷酸序列的核酸分子编码的蛋白质;
(d) 如SEQ ID No.6中显示的氨基酸序列的蛋白质;或
(e) 如SEQ ID No.5中显示的核苷酸序列的核酸分子编码的蛋白质;
VEGFR的胞外结构域为:
(a) 如SEQ ID No.8中显示的氨基酸序列的蛋白;或
(b) 如SEQ ID No.7中显示的核苷酸序列的核酸分子编码的蛋白质。
2.根据权利要求1所述的蛋白质,其中所述接头(I)为如下氨基酸序列:(ASPAAPAPASPAAPAPSAPA)n,其中n为10-30的整数。
3.根据权利要求2所述的蛋白质,其中所述接头(I)为如下氨基酸序列:(ASPAAPAPASPAAPAPSAPA)n,其中n为10、20或30。
4. 根据权利要求1中任一项的蛋白质,其中所述蛋白质为:
(a) 如SEQ ID No.16、SEQ ID No.46、SEQ ID No.48、SEQ ID No.50、
SEQ ID No.52、SEQ ID No.54、SEQ ID No.56、SEQ ID No.58、SEQ ID No.60、SEQ IDNo.62、SEQ ID No.64、SEQ ID No.66或SEQ ID No.68中显示的氨基酸序列的蛋白质;或
(c) 由如SEQ ID No.15、SEQ ID No.45、SEQ ID No.47、SEQ ID No.49、SEQ ID No.51、SEQ ID No.53、SEQ ID No.55、SEQ ID No.57、SEQ ID No.59、SEQ ID No.61、SEQ IDNo.63、SEQ ID No.65或SEQ ID No.67中显示的核苷酸序列的核酸分子编码的蛋白。
5.根据权利要求1的蛋白质,其中所述信号肽序列是PDGFR的N末端信号肽序列。
6.根据权利要求5的蛋白质,其中所述信号肽序列是人PDGFRα的N末端信号肽序列。
7. 根据权利要求6的蛋白质,其中所述信号肽的序列为如SEQ ID No.10中显示的氨基酸序列或其中所述信号肽序列是由如SEQ ID No.9中显示的核苷酸序列的核酸分子编码的氨基酸序列。
8.根据权利要求1的蛋白质,其中所述纯化标签是His标签。
9. 根据权利要求8的蛋白质,其中所述纯化标签为如SEQ ID No.12中显示的氨基酸序列或其中所述纯化标签是由如SEQ ID No.11中显示的核苷酸序列的核酸分子编码的多肽。
10. 权利要求1的蛋白质,其中所述蛋白质为:
(a) SEQ ID No.14、SEQ ID No.22、SEQ ID No.24、SEQ ID No.26、SEQ ID No.28、SEQID No.30、SEQ ID No.32、SEQ ID No.34、SEQ ID No.36、SEQ ID No.38、SEQ ID No.40、SEQID No.42或者SEQ ID No.44中显示的氨基酸序列的蛋白;或
(c) 由如SEQ ID No.13、SEQ ID No.21、SEQ ID No.23、SEQ ID No.25、SEQ ID No.27、SEQ ID No.29、SEQ ID No.31、SEQ ID No.33、SEQ ID No.35、SEQ ID No.37、SEQ IDNo.39、SEQ ID No.41或SEQ ID No.43中显示的核苷酸序列的核酸分子编码的蛋白。
11.编码权利要求1至10中任一项的蛋白质的核酸分子。
12.包含权利要求11的核酸分子的载体。
13.包含权利要求11的核酸分子或权利要求12的载体的宿主细胞。
14.根据权利要求13的宿主细胞,其中所述宿主细胞是真核宿主细胞或原核宿主细胞。
15.根据权利要求14的宿主细胞,其中所述原核宿主细胞是大肠杆菌。
16.根据权利要求14的宿主细胞,其中所述真核宿主细胞是真菌或动物细胞。
17.根据权利要求16的宿主细胞,其中所述动物细胞是HEK细胞或CHO细胞。
18.用于制备权利要求1至10中任一项的蛋白质的方法,所述方法包括培养根据权利要求13至17中任一项的宿主细胞,并从培养物或从所述细胞分离所述蛋白质。
19.组合物,所述组合物包含权利要求1至10中任一项的蛋白质,通过权利要求18的方法制备的蛋白质,权利要求11的核酸分子,权利要求12的载体,或权利要求13至17中任一项的宿主细胞。
20.根据权利要求19的组合物,其为药物组合物,还包含药学上可接受的载体。
21.权利要求1至10中任一项的蛋白质、通过权利要求18的方法制备的蛋白质、权利要求11的核酸分子、权利要求12的载体、或权利要求13至17中任一项的宿主细胞或权利要求19或20的组合物在制备治疗眼科疾病、癌症药物中的应用;所述眼科疾病是与年龄相关的黄斑变性(AMD)、糖尿病性视网膜病变(DR)、糖尿病性黄斑水肿(DME)、脉络膜血管化(CNV)、视网膜静脉阻塞(RVO);所述癌症是结肠癌、肝细胞癌、非小细胞肺癌、软组织肉瘤、前列腺癌、乳腺癌、卵巢癌、神经胶质瘤、胰腺癌。
22.根据权利要求21所述的应用,其中所述视网膜静脉阻塞(RVO)是中央视网膜静脉阻塞(CRVO)或视网膜分支静脉阻塞(BRVO)。
23.根据权利要求21所述的应用,其中所述眼科疾病是与年龄相关的黄斑变性(AMD)。
CN201880063990.XA 2017-11-16 2018-11-15 Pas化的vegfr/pdgfr融合蛋白及其在治疗中的用途 Active CN111406071B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN2017111365826 2017-11-16
CN201711136582 2017-11-16
EP172049686 2017-12-01
EP20049686 2017-12-01
PCT/CN2018/115733 WO2019096226A1 (en) 2017-11-16 2018-11-15 Pasylated vegfr/pdgfr fusion proteins and their use in therapy

Publications (2)

Publication Number Publication Date
CN111406071A CN111406071A (zh) 2020-07-10
CN111406071B true CN111406071B (zh) 2024-01-16

Family

ID=71437640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880063990.XA Active CN111406071B (zh) 2017-11-16 2018-11-15 Pas化的vegfr/pdgfr融合蛋白及其在治疗中的用途

Country Status (1)

Country Link
CN (1) CN111406071B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1780853A (zh) * 2003-03-24 2006-05-31 阿雷斯贸易股份有限公司 分泌性蛋白质家族
WO2007146959A2 (en) * 2006-06-12 2007-12-21 Receptor Biologix Inc. Pan-cell surface receptor- specific therapeutics
CN102311502A (zh) * 2010-07-10 2012-01-11 成都康弘生物科技有限公司 一种抑制血管新生或生长的融合蛋白及其医疗应用
WO2014160507A1 (en) * 2013-03-13 2014-10-02 Genzyme Corporation Fusion proteins comprising pdgf and vegf binding portions and methods of using thereof
TW201609803A (zh) * 2014-01-24 2016-03-16 上海恆瑞醫藥有限公司 VEGF與PDGFRβ雙特異性融合蛋白及其用途
WO2016145189A1 (en) * 2015-03-11 2016-09-15 Allgenesis Biotherapeutics Inc. Fusion protein comprising a ligand binding domain of vegf and pdgf
WO2017109087A1 (en) * 2015-12-22 2017-06-29 Xl-Protein Gmbh Nucleic acids encoding repetitive amino acid sequences rich in proline and alanine residues that have low repetitive nucleotide sequences
CN107298714A (zh) * 2016-04-14 2017-10-27 殷跃云 一种双靶标融合蛋白及其制备方法和用途

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1780853A (zh) * 2003-03-24 2006-05-31 阿雷斯贸易股份有限公司 分泌性蛋白质家族
WO2007146959A2 (en) * 2006-06-12 2007-12-21 Receptor Biologix Inc. Pan-cell surface receptor- specific therapeutics
CN102311502A (zh) * 2010-07-10 2012-01-11 成都康弘生物科技有限公司 一种抑制血管新生或生长的融合蛋白及其医疗应用
WO2014160507A1 (en) * 2013-03-13 2014-10-02 Genzyme Corporation Fusion proteins comprising pdgf and vegf binding portions and methods of using thereof
TW201609803A (zh) * 2014-01-24 2016-03-16 上海恆瑞醫藥有限公司 VEGF與PDGFRβ雙特異性融合蛋白及其用途
WO2016145189A1 (en) * 2015-03-11 2016-09-15 Allgenesis Biotherapeutics Inc. Fusion protein comprising a ligand binding domain of vegf and pdgf
CN107108757A (zh) * 2015-03-11 2017-08-29 新源生物科技股份有限公司 包含vegf及pdgf的配体结合域的融合蛋白
WO2017109087A1 (en) * 2015-12-22 2017-06-29 Xl-Protein Gmbh Nucleic acids encoding repetitive amino acid sequences rich in proline and alanine residues that have low repetitive nucleotide sequences
CN107298714A (zh) * 2016-04-14 2017-10-27 殷跃云 一种双靶标融合蛋白及其制备方法和用途

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Targeting Angiogenesis in Cancer Therapy: Moving Beyond Vascular Endothelial Growth Factor;Yujie Zhao等;《The Oncologist》;pubmed;20150630;第20卷(第6期);第660-673页 *
抗 VEGF/VEGFR 靶向肿瘤血管药物的研究进展;李伊培等;《现代生物医学进展》;万方;20140630;第14卷(第6期);第3158-3162页 *

Also Published As

Publication number Publication date
CN111406071A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
JP4981229B2 (ja) ハイブリッド血管内皮成長因子DNAsおよびタンパク質に関与する物質および方法
KR101698362B1 (ko) Vegf-a 수용체 상호작용을 억제하는 결합 단백질
AU737106B2 (en) Type II TGF-beta receptor/immunoglobulin constant region fusion proteins
JP6010528B2 (ja) Vegf−aレセプターの相互作用を阻害する改変結合タンパク質
JP2020158546A (ja) 筋ジストロフィー治療のためのユートロフィン誘導に関するactriibタンパク質およびその改変体およびその使用
US7087411B2 (en) Fusion protein capable of binding VEGF
KR20220157517A (ko) 키메라 수용체 및 그의 사용 방법
KR20180081503A (ko) 유전적 작제물
US11510950B2 (en) Variant AAV capsids for intravitreal delivery
CN107207577A (zh) 用于治疗和预防炎症的组合物和方法
CN117467025B (zh) 一种抗vegf和补体双功能融合蛋白及其应用
WO2004106378A2 (en) Method of treating corneal transplant rejection by using vegf antagonists
CN109971714B (zh) 自表达pd-1抗体并靶向间皮素的嵌合抗原受体修饰t细胞及其用途
TW201106971A (en) Antigen-binding proteins
JP2002332300A (ja) 抗semp1抗体、その製法及び使用
CN111406071B (zh) Pas化的vegfr/pdgfr融合蛋白及其在治疗中的用途
WO2015000181A1 (zh) 新型重组融合蛋白及其制法和用途
US11548931B2 (en) PASylated VEGFR/PDGFR fusion proteins and their use in therapy
CN112063640A (zh) 靶向人源化cea的嵌合抗原受体及其用途
KR20220147787A (ko) 보체 경로 억제 단백질을 포함하는 융합단백질 및 이의 용도
KR20220006013A (ko) 보체 경로 억제제를 포함하는 융합단백질 및 이의 용도
WO2020022438A1 (ja) 網膜線維化を伴う眼疾患の処置剤
KR102505262B1 (ko) 솔루블 VEGFR-1 변이체 cDNA를 함유하는 rAAV를 포함하는 당뇨망막병증 치료용 조성물
AU2021227958A1 (en) Method of enhancing aqueous humor outflow and reducing intraocular pressure
CN112063641A (zh) 靶向人源化EGFRvIII的嵌合抗原受体及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20231212

Address after: Shuode Pharmaceutical, No. 18, Section 2, Biotech City Middle Road, Shuangliu District, Chengdu City, Sichuan Province, 610200

Applicant after: Chengdu shuoder Pharmaceutical Co.,Ltd.

Address before: 611731 No. 8 Xiyuan Avenue, Chengdu High-tech Zone, Sichuan Province

Applicant before: Chengdu Easton Biopharmaceuticals Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant