酶切范威尔邦德因子(vWF)的蛋白酶
技术领域
本发明涉及一种与医药学领域相关的血浆蛋白。更具体地说,本发明涉及一种特异性酶切范威尔邦德因子(von Willebrand factor,以下简称为vWF)的蛋白酶,该vWF因子与血液凝固有关。本发明的酶切vWF的蛋白酶能够替代治疗(replacement therapy)病人,所述病人患有由于该蛋白酶的缺陷或减少导致的疾病,比如血栓性血小板减少性紫癜(以下简称为TTP)。另外,该蛋白酶有望作为一种新的抗血小板血栓的药物。
背景技术
vWF是在血管内皮细胞或巨核细胞中产生的,是一种血液凝固因子,该因子中单个亚基通过S-S键形成多体结构(分子量介于500-20,000kDa),所述亚基包括2050个氨基酸残基(大约250kDa的单体)。该因子在血液中含量约为10μg/ml,而且高分子量的因子通常具有较高的比活。
vWF作为一种止血因子,具有两个主要功能。功能之一是作为一种载体蛋白,其中vWF与血液凝固因子VIII结合而稳定该因子。功能之二是在损伤的血管壁周围的血管内皮亚细胞组织,通过粘附和聚集血小板形成血栓。
血栓性血小板减少性紫癜是一种在全身的体小动脉和毛细血管形成血栓的疾病。无论医学技术的最新进展如何,与此疾病相关的死亡率从1971至1991年约上升3倍。病理学上,TTP是由于血管内皮细胞毒性或血管血小板聚集形成。组织免疫学发现,形成的血栓中存在大量的vWF,并且在血栓形成过程中起主要作用。TTP患者体内,以正常或高分子量的vWF多体结构为主,并且推断在加剧血小板凝聚或在高抗剪应力条件下形成微血栓过程中起主要作用的是一种异常大的vWF多体(ULvWFM)或大的vWF多体(LvWFM)。相反,已知在高抗剪应力条件下,健康人周血中的vWF由于酶切vWF蛋白酶的作用下而在842位的Tyr和843位的Met之间被降解。因此,可以认为TTP以如下方式发生,即血浆中由于某种原因蛋白酶活性降低,以及ULvWRM或LvWFM增高加剧了血小板的凝集,因而在血管内形成血栓。
最近Furlan等(Blood,vol.87,4223-4234:1996,日本专利公开(Kohyo)No 2000-508918)和Tsai等(Blood,vol.87,4235-4244:1996)发展了一种检测特异性切割vWF的蛋白酶的方法。在他们的报告中,TTP患者体内该蛋白酶活性的确降低了。同时前述作者还报道该蛋白酶是血浆中的一种金属蛋白,并且部分地纯化了该蛋白。然而,他们并未成功获得其特异性的氨基酸序列,而且至今没有进展报告。
发明内容
到目前为至,用于患先天性特异性切割vWF酶缺失的病人和获得性抗该酶抗体阳性的病人的治疗方法是血浆去除术。迫切需要建立运用纯化产品的替代疗法,诸如应用前述蛋白酶的重组基因产品。家族性的TTP患者是由于特异性切割vWF酶的先天缺失所致,而非家族性的TTP患者是由于获得性的特异性切割vWF酶的自身抗体的存在所致。因而,使用该酶的替代疗法可优先用于家族性TTP患者的治疗(事实上进行了血浆施用),而通过血浆去除术去除自身抗体以及使用该酶的替代品对于非家族性TTP患者来说是必需的。另外,该酶有望作为一种新的抗血小板血栓形成药物。
然而,如前所述,Furlan等(Blood,vol.87,4223-4234:1996,JP PatentPublication(Kohyo)No 2000-508918)和Tsai等(Blood,vol.87,4235-4244:1996)提出vWF切割酶是血浆中的一种金属蛋白。据报道,该酶已经从血浆中部分纯化,并且根据其比活计算浓缩了1000至10000倍。即便如此,经过长达5年的艰苦努力仍未能分析出诸如氨基酸序列等的该蛋白酶的性质,也未获得涉及该酶的特异性生物学信息。正如Furlan等报道的,靶标蛋白应当是一种巨大分子,因而有许多问题存在。比如,该蛋白酶可能以多种不同的形式存在,例如存在相互作用的不同分子或辅因子。由于纯化过程的复杂性,纯化步骤中非特异性作用所致的分离效果降低以及其它的一些因素,可以断定Furlan等的纯化步骤很难从血浆级分中分离鉴定出该蛋白酶。
鉴于这种情况,本发明人对该酶的分离和纯化进行了深入研究。结果,成功分离、纯化出目的vWF切割蛋白酶,该结果未见报道。进一步地,发明人成功地确定了该蛋白酶成熟蛋白的氨基酸序列与编码该氨基酸序列的基因。
本发明的vWF切割蛋白酶能够切开位于vWF第842位的Tyr和第843位的Met之间的键。按照一个实施方案,在还原或非还原性的SDS-PAGE电泳中,该酶分子量介于105-160kDa或160-250kDa。该酶包含一段部分序列为Leu-Leu-Val-Ala-Val的多肽,更优选地,该酶包含一段多肽链,其具有成熟蛋白的部分N末端氨基酸序列,即Ala-Ala-Gly-Gly-Ile-Leu-His-Leu-Glu-Leu-Leu-Val-Ala-Val。它是一种新物质,具有以下特性:
1)vWF-切割活性
根据切割片段的N末端序列分析,本发明的蛋白酶切断位于第842位的Tyr和第843位的Met之间的肽键。
2)凝胶过滤分离(fractionation)
用FI粘稠物(paste)作为起始物,通过凝胶过滤层析柱分离,大部分的活性集中在分子量介于150-300kDa的级分里。按照本发明的一个实施方案,由电泳结果表明:实际获得的活性物质分子量约在105-160kDa之间。因此,本发明的蛋白酶是这样一种物质,它倾向于形成二聚体等或与另一种分子结合,或者与一种易被降解物质结合,或者能添加异源性的糖链。
3)硫酸铵沉淀
例如,用FI粘稠物作为纯化起始物,大部分的该蛋白酶能够从33%的饱和硫酸铵沉淀粗提物中回收。
4)SDS-PAGE
例如,本发明中的蛋白酶,主要来源于由合并的人血浆或低温沉淀制得的FI粘稠物,通过SDS-PAGE中的分子量标记,确定其分子量约为105-160kDa。根据SEQ ID NO:15所示的核酸序列,通过基因重组表达由位于445的起始密码子atg和位于4726位的终止密码子之间框架表示的氨基酸序列,发现依赖于不同的宿主有不同的分子量变异体。尽管如此,通过分子量标记仍可确定分子量约为160-250kDa。这种大小的分子在正常人和某些TTP病人血浆中可以观测到。正常人血浆中存在几种该蛋白酶的分子,主要是由于基因克隆时存在不同的剪切产物(SEQ ID NO:16-20),或者是由于翻译后修饰的不同,如糖链修饰,或者是由于纯化过程中的降解造成。而且,在非还原性SDS-PAGE电泳后,可以部分地回收有活性的该蛋白酶。
5)氨基酸序列分析
对分离的多肽片段进行了氨基酸序列分析。这里所举例子是部分氨基酸序列为Leu-Leu-Val-Ala-Val序列的多肽链,和成熟蛋白N端序列 Ala-Ala-Gly-Gly-Ile-Leu-His-Leu-Glu-Leu-Leu-Val-Ala-Val。进一步地,根据前述的部分序列,应用目前的生物信息学
(BIOINFORMATICS:A Practical Guide to the Analysis of Genes andProteins,Andreas D.Baxevanis和B.F.Francis Ouellette编),通过检索数据库,高度精确地确定了编码氨基酸序列的核酸序列。更确切地讲,应用tblastn程序检索了基因组数据库。进而确定了一个染色体克隆(AL158826),并推断其编码本发明的蛋白酶。随后,用表达序列标签(EST)数据库校正,推断出克隆(AI346761和AJ011374)是编码目的蛋白酶的部分序列以及上述基因组编码的多肽的部分肽。因而,确定SEQ ID NO:3或7中所显示的氨基酸序列为活性vWF切割蛋白酶位点。
获得了根据基因组推断的一段序列:GCT GCA GGC GGC ATCCTA CAC CTG GAG CTG CTG GTG GCC GTG,更优选它的一部分、根据EST确定其转录的序列CTG CTG GTG GCC GTG。在此基础上,对获得的核酸序列进行了序列与基元序列分析,结果发现本发明的蛋白酶具有一个候选的金属蛋白酶结构域。基于以上发现,有可能发现一个多肽链序列,作为蛋白酶的更特异性的示例。而且,已知蛋白酶的活性通常随氨基酸序列的不同而变化,比如,在一段氨基酸序列中有替代、缺失、插入或点突变(Blood coagulation factor VII mutants,Soejima等,日本专利公开(Kokai)No.2001-61479A)。类似地,本发明的蛋白酶可以通过各种修饰,比如缺失、替代、或增加一个或几个氨基酸来制备优化的蛋白酶。
进一步获得大量的蛋白酶,确定了其N末端的29个氨基酸序列。这些氨基酸序列如SEQ ID NO:8中所示。本结果与通过生物信息学推断的SEQ ID NO:3或7中所示序列大体上是一致的。唯一的区别是SEQ ID NO:3或7中第27位的氨基酸是Glu而此N端序列分析的结果为Arg。这可被认为是一种基因多态性的表现。因此,可以肯定该蛋白酶包含一条多肽链,其成熟蛋白的N末端有一段如SEQ IDNO:3或7中所示的氨基酸序列。然后,以下面方式克隆出编码该蛋白酶的基因片段。
根据SEQ ID NO:7所示核酸序列,基于图9中下划线所示核酸序列,制备正向(sense)引物(SEQ ID NO:9)和反向(antisense)引物(SEQID NO:10),然后扩增出两条引物之间的序列。克隆并测序该片段。用该基因片段作为探针进行Northern印迹,分析定位该蛋白酶基因的表达,结果发现:该蛋白酶的表达主要集中在人肝脏中。因此,购买了人肝cDNA文库,应用cDNA末端快速扩增技术(RACE)确定了编码该蛋白酶的基因。根据这些结果,确定了最大的、接近5kb的mRNA(cDNA)序列,如SEQ ID NO:15所示,该序列已经到达poly(A)添加位点。
根据该蛋白酶核酸序列推断出其氨基酸序列,表明该蛋白酶应该有前原序列(preprosequence)存在,应当属于具有去整合素样结构域和金属蛋白酶结构域等的去整合素和金属蛋白酶(ADAM)家族,尤其可能属于具有血小板反应蛋白(thrombospondin)1型结构域(TSP-1)的ADAM-TS家族。最后,确定了SEQ ID NO:16-21中所示的、在成熟前原序列被切除后在N末端具有SEQ ID NO:3和7所示序列的同工酶(isoform),包括在部分核酸序列中存在插入或缺失的那些。因而,本发明的蛋白酶应当能够在第842位Tyr和第843位Met之间切割vWF,而且具有Leu-Leu-Val-Ala-Val氨基酸序列。
本发明的vWF切割蛋白酶可以通过下面方法制备。
根据本发明,检测该蛋白酶活性方法的特点是能够在短时间内评价其活性。按照Furlan等的报道(Blood,vol.87,4223-4234:1996,日本专利公开(Kohyo)No.2000-508918),应用抗vWF抗体,通过Western印迹方法检测vWF切割模式来检测其活性,因而需要耗时将蛋白酶转移到膜上。更确切的说,该方法至少需要约45个小时,即24小时用于与底物vWF的酶切反应,17小时用于电泳,3小时用于转印蛋白酶,然后用抗vWF抗体检测。相对的,本发明人在总共18小时内完成了检测,即16小时用于与底物vWF的酶切反应,2小时用于电泳和检测。这表明检测所需时间可以缩短至常规检测方法所需时间的三分之一或更短,同时能够缩短纯化所需时间,从而降低蛋白酶被灭活的程度。因此,与Furlan等的方法相比纯化效率提高了,同时纯度也改善了。
更进一步地,用上述检测系统检验了不同的起始物,结果发现:FI粘稠物中蛋白酶的活性比Furlan等过去报道的低温沉淀中的活性更高。因此,运用上述方法与前述起始物,能够分离、鉴定出该目的蛋白酶。具体的方案中,联合应用凝胶过滤层析和离子交换层析以及上述活性检测方法来纯化该蛋白酶。
更明确的进,用一种缓冲液溶解FI粘稠物后,上凝胶过滤层析柱。该蛋白酶的活性分布于分子量范围在150-300kDa的洗脱物中,该分子量范围是根据凝胶过滤层析柱的分子标志物推断的。然后用33%的饱和硫酸铵沉淀并浓缩该洗脱物。共重复三次。第三次凝胶过滤层析收集的活性部分,用含50mM NaCl的50mM Tris-HCl(pH7.1)的缓冲液4℃透析过夜。将该透析产物,上阴离子交换层析柱(DAEA),然后用0.25M NaCl洗脱。本发明人对本发明所述的蛋白酶的分离和鉴定方法进行了深入研究。令人惊奇的是,他们发现该蛋白酶在非还原性SDS-PAGE电泳后能够回收活性条带。为了成功地大量制备该蛋白酶,纯化并浓缩的洗脱物,进一步用Biophoresis电泳,该方法原理同SDS-PAGE。然后,从电泳级分中分离出含vWF切割活性的部分。按照这时地比活的粗略计算,纯化程度达30000-100000倍。高效快速的重复几次后,获得0.5pmol的样品,达到了目前氨基酸序列分析的要求,因而可以进行氨基酸序列分析。确切的说,基于SDS-PAGE电泳原理的最后的分离纯化步骤(Biophoresis)是至关重要的,该步骤是前面深入研究的结果,是它使得本发明得以完成。
按照Furlan等的报道,尽管本质上没有分离或鉴定出该蛋白酶,但比活能够提高10000倍之多。这可能是由于纯化过程中蛋白酶被灭活,或者由于分离、鉴定中的困难所致,这些困难可能是用不同的液相色谱分离过程中,巨大分子能够与其它的蛋白如本发明的蛋白酶相互作用。此外根据本发明,推断血浆中该蛋白酶含量很低,有必要建立一种方法,而且使用该方法能够纯化重组的基因。
根据本发明的发现,用所获得的序列制备的多肽或蛋白被确定为抗原。因此应用多肽或蛋白,可以使用现有的免疫学方法制备单抗、多抗或人源化抗体(Current Protocols in Molecular Biology,AntibodyEngineering:A PRACTICAL APPROACH,J.McCAFFERTY等编,或ANTIBODY ENGINEERING第2版,Carl A.K.BORREBAECK编)。
另外,通过利用噬菌体展示技术(Phage Display of Peptides and Proteins:A Laboratory Manual,Brian K.Kay等编,或ANTIBODYENGINEERING第2版,Carl A.K.BORREBAECK编)的制备抗体的技术可以制备与前述蛋白酶结合的抗体。另外,应用这些技术,能够从含抗该蛋白酶的自身抗体的TTP患者中分离出针对该蛋白酶活性的中和抗体或仅是结合的抗体。这些抗体能够用于象TTP疾病的诊断和治疗。
根据获得的基因组或EST序列,用目前的技术(Molecular Cloning,2nd edition)能够克隆出编码本发明的蛋白酶的基因组基因或cDNA。而且,应用生物信息学技术(BIOINFORMATICS:A Practical Guide tothe Analysis of Genes and Proteins,Andreas D.Baxevanis和B.F.Francis Ouellette编),能够克隆出其它动物种类的且与人的该蛋白酶同源的蛋白基因,通过通用技术获得的基因可以用于制备TTP样疾病的动物模型(比如,Gene Targeting:A Practical Approach,第1版,A.l.Joyner编,Tetratocarcinomas and embryonic stem cell a practicalapproach)。尤其是,确定了编码该蛋白酶的小鼠的基因序列,可以获得敲除该基因的小鼠。因此,能够制备先天性TTP疾病等的小鼠模型。
应用通用技术(比如,J.Sambrook等,Molecular Cloning,2ndedition,或CURRENT PROTOCOLS IN MOLECULAR BIOLOGY),能够将这些基因掺入合适的表达载体,然后转化到合适的宿主细胞,因而可以制备该蛋白酶基因的重组产物。此时,待掺入的基因不必是完整的编码该蛋白的基因。它也包括根据用途,由结构域限定的蛋白部分表达。
例如,运用如转导、转染或转化等常规方法,将本发明的多核苷酸转入一合适的宿主细胞。多核苷酸可以单独或与另一条多核苷酸一起转入,另一条多核苷酸可以独立地、同时地或与本发明的多核苷酸联合转入。
例如,应用标准的同时转染技术将本发明的多核苷酸转入一个合适细胞,比如哺乳动物细胞,用另一条编码选择性标记的多核苷酸进行筛选。在这种情况下,多核苷酸通常能够稳定的整合到宿主细胞的基因组中。
可选性的,多核酸序列可以连接至含选择性标志的载体中,以使之在宿主中扩增。构建好的载体通过上面所述方法转入宿主细胞。通常,质粒载体用DNA沉淀,如磷酸钙沉淀或带电荷的脂质体复合物等方法转染宿主细胞。电穿孔技术也可以用于转化宿主细胞。使用病毒载体时,病毒可以体外包装或转入包装细胞,然后用包装好的病毒转入细胞。
与本发明方案一致的其它适合于将获得多核苷酸和转染多核苷酸进入宿主细胞的方法,都是本领域中已知且通用的。这类方法在Sambrook等(同上)有论述,本文中对各种标准实验方法作了详尽解释。在本发明的具体方案中,载体指诸如质粒载体、单双链噬菌体载体或单双链RNA/DNA病毒载体。这样一个载体作为多聚核酸,尤其是作为DNA,通过通用的将DNA或RNA引入细胞的方法被引入宿主细胞。当载体是噬菌体或病毒时,载体最好先通过已知的转染或转导技术,引入一种能够包装或封装病毒的细胞。病毒载体可以是具有复制功能或缺陷型的。
优选的载体是一种能够表达本发明的核酸或多肽的载体。通常,这样的载体包含一段顺反子调控区,在宿主内能够有效的调节所连接的多聚核酸的表达。当合适的顺式作用因子(比如涉及翻译后处理的如信号肽酶等的一组蛋白酶或弗林蛋白酶)被引入宿主细胞时,能够被宿主细胞,互补的载体或载体本身利用。
在优选方案中,载体能够特异性的表达。这种特异性的表达可以是可诱导性的或仅在某一种特定的细胞中表达。或者,是可诱导并且是细胞特异性的表达。最佳的诱导型表达载体能够通过一种简易可操作的环境因子如温度或添加营养等诱导表达。本发明方案中,能够用于原核或真核表达的各种载体而构建的各种载体和可诱导表达的载体都是已知的,本领域的技术人员都常常用到这些技术。
基因工程宿主细胞能够培养于通用的培养基,经修饰后尤其适合启动子的活化,转化子的选择或基因的扩增。总的说来,很显然本领域的技术人员所选择的表达宿主细胞的培养条件如温度、pH等,可用于本发明多肽的表达。
更多的表达载体能够用于表达本发明的多肽。这类载体的例子,包括染色体,游离体和病毒源性的载体。这些载体来源于细菌质粒、噬菌体,酵母附加体,酵母染色体元件,或诸如杆病毒、疱疹病毒如猴病毒40(SV40)、痘苗病毒、腺病毒、禽痘病毒、假狂犬病病毒或逆转录病毒。而且还可以使用来源于前面所述载体的综合载体,例如载体含来源于质粒和噬菌体的元件,更明确的讲,粘粒或噬菌粒也可以使用。与本发明方案同样,它们可用于蛋白酶的表达。大体上来说,由于多肽可以在宿主中表达,任何适于维持、扩增或表达多聚核酸的载体都能够与上述方案一样可用于表达。合适的DNA序列,可通过各种常规方法插入载体。总体上,欲表达的DNA序列经一个或多个限制性内切酶酶切DNA序列和载体,然后用T4DNA连接酶连接限制性酶切的片段和载体。为上述目的所用的酶切和连接技术对于本领域的技术人员都是已知的和常用的。在这方面,Sambrook等(前面已经提及)很详尽的叙述了另一种构建表达载体的方法,这种方法对于本领域的技术人员都是已知的和常用的。
表达载体中的DNA可连接到一段表达调控序列,该调控序列包含一段启动子来定向mRNA的转录。少数的几个典型的启动子是λ噬菌体PL启动子,大肠杆菌lac,trp,trc,tac启动子,SV40早期和晚期启动子和逆转录病毒LTR启动子。按照本发明中的方法,已知的、未提及的适于使用的启动子,仍可很容易的被用于本发明的例子。大体来讲,构建的表达载体包含一个核糖体结合位点,用于在转录起始点或终止位点或一个可转录的结构域的翻译。构建的欲表达的成熟的转录子的编码区中,在起始位点包含起始密码子AUG和在欲翻译的多肽末端有终止密码子。另外,构建的表达载体包含一个能够调节与诱导表达的调控区域。通常,这样一段区域可通过调控抑制子结合位点、增强子的转录等的与各种常规方法一致的激活途径激活。
扩增与表达载体都包括选择性标记,这些标记适于扩增,或载体中包含上述目的的其它标记。表达载体最好包含一个或多个选择性标记基因,提供选择转化后的宿主细胞的表型特征。与真核细胞培养有关的优选标记包括二氢叶酸还原酶或新霉素抗性。与大肠杆菌和其它的细菌培养相关的选择性标记包括四环素或氨苄青霉素抗性。为了目的多肽的表达,合适的载体包含一段如上述DNA序列,一段合适的启动子或调控序列,然后用各种已知的方法将其引入合适的宿主细胞。
代表性的合适的宿主细胞包括:如大肠杆菌、链霉菌和鼠伤寒沙门氏杆菌的细菌;如酵母细胞的真菌;如果蝇细胞S2和Spodoptera sf9细胞;如CHO、COS、Bowes黑色素瘤细胞和SP2/0等贴壁细胞或悬浮细胞或植物细胞。用于表达的各种宿主都是已知的,本领域的技术人员都是能够轻而易举的选择一种与本发明公开的方案一致的表达多肽的宿主细胞。
更确切的说,本发明包括重组构建体,如包含上述一个或多个序列的表达载体的构建体。构建体是载体,如在质粒或病毒载体中插入本发明的序列,该序列可以是正向的或反向的。更确切的例子,构建的载体包含一段连接到表达的序列的调控序列,该调控序列包含启动子等。本领域的技术人员都了解各种合适的载体和启动子,而且目前有很多商品化的载体,用于本发明的表达。
可以买到的载体举例如下。可用于细菌表达的载体如:pQE70,pQE60和pQE-9(Qiagen);pBS载体,PhageScript载体,Bluescript载体,pNH8A,pNH16a,pNH18A和pNH46A(Stratagene);和ptrc99a,pKK223-3,pKK233-3,pDR540和pRIT5(Pharmacia)。优选的真核表达载体有pWLNEO,pSV2CAT,pOg44,pXT1和pSG(stratagene)以及pSVK3,pBPV,pMSG与pSVL(Pharmacia)。对于本领域内技术人员,这些商品化的载体都可以用于表达本发明方案中的目的蛋白,这些载体已列出。例如,其它能够在宿主中引入、维持、扩增或表达本发明的多聚核酸或多肽的质粒或载体,也可按照本发明中的方案使用。
通过使用包含一个候选启动子片段的载体,一个感兴趣的基因中选择启动子序列。例如在象报告基因氯霉素乙酰转移酶(CAT)一样无启动子序列的转录单位中,引入含启动子序列的基因片段,其中该转录单位位于限制性酶切位点下游。众所周知,在CAT基因上游的酶切位点引入载体的含启动子片段能够产生CAT活性,该活性可以通过标准的CAT检测方法检测出来。为此目的一种载体需是已知的且可获得的,比如,pKK233-8和pCM7。因此,用于表达本发明的多聚核酸的启动子不仅包括可获得的、已知的启动子,而且还包括使用上述方法获得的启动子。
根据本发明,其中已知适于表达多聚核酸和多肽的细菌启动子,有E.coli的lacI和lacZ启动子,T3和T7启动子,gpt启动子,lambdaPR和PL启动子,trp和trc启动子;其中已知适于表达多聚核酸和多肽的真核启动子,有巨细胞病毒(CMV)启动子和HSV的腺嘧啶激酶启动子,早期和晚期SV40启动子,逆转录病毒LTR启动子,如Rous肉瘤病毒启动子以及如金属硫蛋白I启动子的金属硫蛋白启动子。
适于一种宿主细胞中表达的载体与启动子的选择,是一种已知的技术。必要的表达载体构建技术,将载体导入宿主细胞以及在宿主中表达的技术,都是本领域中常用的技术。本发明还涉及前面构建的宿主细胞。宿主细胞可以是较高等的真核细胞,如哺乳动物细胞,也可以是较低等的真核细胞如酵母细胞,或者是象细菌一样的原核细胞。
构建体可以通过如磷酸钙沉淀,DEAE右旋糖苷介导的转染,阳离子脂质体介导的转染,电穿孔,转导,感染或其它方法。这些方法在多种实验室操作手册中都有论述,如Sambrook等的书中。
可以用常规方法使用宿主细胞中的构建体,它能够生产重组基因序列编码的基因产物。另外本发明的部分多肽,也可以用常规的多肽合成仪合成。成熟的蛋白在适当的启动子控制下可以在哺乳动物细胞,酵母,细菌或其它细胞表达。而且,蛋白还能够在无细胞的翻译系统中,用本发明构建的DNA载体获得的RNA来生产。适于原核和真核宿主克隆和表达的载体在Sambrook等的书中有论述。
通常,重组表达载体包含:复制起点,启动子以及选择性标记;其中启动子源于高效表达基因,能够定向下游结构基因序列转录;选择性标记则与载体一起进入细胞,并用于分离出含载体的细胞。可以诱导基因表达的启动子来自糖分解酶基因,3-如磷酸甘油酸激酶(PGK)的基因,α因子基因,酸性磷酸酶基因以及热休克蛋白基因。选择性标记则包括大肠杆菌的氨苄青霉素抗性基因和酿酒酵母的trp1基因。
载体中插入一个增强子,能够增强编码本发明多肽的DNA在较高等的真核细胞中的转录。通常增强子是一种DNA顺反子元件,能够增强启动子在预定宿主细胞中的转录活性。这样的增强子包括SV40增强子,巨细胞病毒的早期启动子/增强子,位于复制起点后的多瘤病毒增强子,β肌动蛋白增强子和腺病毒增强子。
应用现有的标准技术可将本发明的多核苷酸插入一个表达载体,可操作性的连接到表达启动子上,所述多核苷酸编码一段本发明肽链的异源性结构序列。合适的多肽的转录起始位点位于核糖体结合位点的5’端。核糖体结合位点又位于欲表达多肽的翻译起点AUG的5’端。通常从起始密码子AUG开始,在核糖体结合位点和起始密码子之间不存在另外的开放阅读框架。通常,终止密码子位于肽的末端,适当的腺苷酰化信号和终止密码子位于转录区域的3’末端。
至于使翻译的蛋白分泌至ER网腔内,胞浆或细胞外,需要在与欲表达的多肽中插入引入适当的分泌信号,该信号对多肽来讲,可以是内源性的或异源的。
另外,位于信号序列后的原序列可以是内源或外源性的(比如另一种金属硫蛋白的前原序列)。
多肽能以一种修饰的形式,如融合蛋白获得表达,不仅可以包括一段分泌信号,而且还可以附加异源性的功能区。因而,附加的氨基酸,尤其是带电荷的氨基酸区段等,可添加到多肽上,以提高纯化过程中多肽在宿主细胞中及存储的稳定性,以及随后的操作与存储中的稳定性。另外,可以将给定的区域添加到多肽上以加快纯化。在多肽制备的最后步骤之前,这类型附加区可被除去。这些分泌或外泌性诱导,稳定性的提高或者增加部分肽段利于多肽纯化技术,都是该领域内已知且常用的技术。
适于扩增、维持或表达本发明多核苷酸或多肽的原核宿主,包括:大肠杆菌,枯草杆菌,鼠伤寒沙门氏杆菌。在这方面,不同种类的假单胞杆菌,链霉菌以及葡萄球菌也是合适的宿主。而且,本领域内技术人员所知的其它宿主细胞都可被使用。代表性的、可用于细菌的表达载体,包括细菌的复制起点,一个选择性标记基因和一个基因元件,但不限于此,复制起点来源于商品化的质粒,选择性标记基因和基因元件来自一个已知的克隆载体pBR322(ATCC37017)。这些商品化的载体包括pKK233-3(Pharmacia Fine Chemicals,Uppsala,Sweden)和GEM1(Promega Biotec,Madison,Wisconsin,U.S.A)。这些pBR322(主链)部分可与合适的启动子以及要表达的结构基因结合。
宿主被适当转化并扩增至优选的细胞浓度,然后通过一种合适的手段(例如,温度变化或使用化学诱导剂)诱导选择性启动子,然后进一步培养细胞。一般采用离心收集细胞并用物理或化学方法破碎。这种初提物,可以进一步被纯化。而用于蛋白表达的原核细胞可以用任何常规的手段破碎,可选的方法有:反复冻溶,超声处理,机械破碎以及应用裂解试剂。这些都是本领域内技术人员所共知的方法。
源于哺乳动物细胞的不同细胞系,也可用于表达。可用于表达的哺乳动物细胞系的例证包括Gluzman等描述的猴肾纤维细胞系COS-6(Cell 23:175(1981))。其它能够表达兼容性载体的细胞例子包括C127,3T3,CHO,HeLa,人肾细胞293以及BHK细胞。另外,悬浮的骨髓瘤细胞系SP2/0同样可用于表达。
哺乳动物表达载体包含复制起点,合适的启动子与增强子,必要的核糖体结合位点,多聚腺苷酸化位点,剪接供体和受体位点,转录终止序列以及表达必须的5’端非转录序列。来源于SV40的剪切位点和腺苷酸化位点可以作为不转化或不转录的靶基因元件,CAG表达载体(H.Niwa等,Gene,108,193-199(1991))就是这样的一个实例。
根据上述蛋白酶的基因序列,应用现有的技术可以设计了探针,引物或反义核酸。由于反义DNA或RNA或形成三聚体的应用,所以反义核酸技术可被用于调控基因的表达。这项技术在Okano,J.,Neurochem,56:560(1991);OLIGODEOXYNUCLEOTIDES ASANTISENSE INHIBITORS OF GENE EXPRESSION,CRC Press,BocaRaton,FL(1998)中有论述。形成的三聚体能够被检测到,如Lee等nucleic acids research 6:3073(1979),Cooney等,Science 241:456(1988)和Dervan等,Science 251:1360(1991)中有论述。本方法原理是多聚核酸可以与互补的DNA或RNA结合,可以用于基因诊断或基因治疗。
比如,用编码多肽的DNA或RNA等多聚核酸对源于患者的细胞,在体外进行基因工程处理。然后,用处理的细胞给需要用多肽治疗的患者使用。例如,用含编码本发明多肽的RNA的逆转录病毒载体,在体外对细胞进行基因工程处理。这样一种技术在本领域内是共知的,其在本专利中的应用与此处论述一致。同样,细胞可以用与体内多肽表达一致的常规方法在体外进行基因工程处理。例如,本发明中的多聚核酸,如前所述,通过基因工程的方法克隆入复制缺陷型的逆转录病毒中,然后分离出构建的逆转录病毒,导入包装细胞以及用含编码本发明多肽的RNA的逆转录病毒载体转导。这样,包装细胞生产具有基因可控的感染性的病毒颗粒。这些获得的细胞在体外用基因工程方法处理,然后给患者使用,以使多肽在体内进行表达。本发明所教的使用方法以及本发明所述其它的多肽药物使用方法,应当能被本领域内的技术人员透彻的了解。
上述的逆转录病毒实例中,逆转录病毒质粒载体可来源于如下病毒,包括但并不限于:Moloney鼠白血病病毒,Rous肉瘤病毒,Harvey肉瘤病毒,禽白血病病毒,长臂猿白血病病毒,人免疫缺陷病毒,骨髓增值肉瘤病毒以及乳腺癌病毒。这些类型的载体包含一个或多个用以表达多肽的启动子。这些可用的、合适的启动子实例包括,但不限于逆转录病毒LTR,SV40启动子,Mill等在BIOTECHNIQUES7:980-990(1989)中所描述的CMV启动子以及其它的启动子(比如,象真核细胞启动子一类的,但并不现于,组蛋白,RNA聚合酶以及β肌动蛋白的启动子)。可用的其它病毒启动子的实例,包括但并不限于腺病毒启动子,腺嘧啶激酶(TK)启动子,B19细小病毒启动子。本领域的技术人员,根据本发明所教,能够轻而易举的选择一个合适的启动子。
编码本发明多肽的一段核酸序列处于合适的启动子控制之下。可用的合适的启动子实例,包括但并不限于腺病毒启动子,如腺病毒主要的晚期启动子,如CMV的异源启动子,呼吸道合胞病毒(RSV)启动子,如MMT或金属硫蛋白等的可诱导性启动子,热休克启动子,人白蛋白启动子,ApoAI启动子,人珠蛋白启动子,病毒性胸腺嘧啶激酶启动子如单纯疱疹病毒胸腺嘧啶激酶启动子,包括前面提及的修饰过的逆转录病毒LTR的逆转录病毒LTR,β肌动蛋白的启动子以及人生长激素启动子。启动子可以是天然性的控制编码多肽的基因。逆转录病毒质粒载体可用于转导包装细胞系形成生产细胞。
可供转染的包装细胞系的实例,包括但并不限于PE501,PA317,Y-2,Y-AM,PA12,T19-14X,VT-19-17-H2,YCRE,YCRIP,GP+E-86,GP+envAm12以及Miller等在《人类基因治疗(Human Gene Therapy)》一书第5-14页中所描述的DAN细胞系。
用本领域中已知的方法,可将载体导入包装细胞。这些方法包括但并不限于电穿孔,应用脂质体以及CaPO4沉淀。另外,逆转录病毒质粒载体可以包装入脂质体或连接到脂质上以供宿主使用。生产细胞系生产具有感染性的病毒载体颗粒,其中包含编码多肽的多核苷酸。这些逆转录表达载体颗粒,可用于在体内或体外转导真核细胞。
被转导后的真核细胞,表达编码多肽的多核苷酸。可供转导的真核细胞实例,包含但并不限于生发层干细胞,胚胎癌性细胞,造血干细胞,肝细胞,成纤维细胞,成肌细胞,角质细胞,内皮细胞以及支气管上皮细胞。
本发明的蛋白酶,抗该蛋白酶的抗体,该蛋白酶的拮抗剂,抑制剂,激动剂,活性修饰物等可用生理盐水,缓冲液或类似的溶液制成制剂。因此,可以制备成药物组成成分。该制剂的pH值最好在酸性与中性之间,与体液pH接近。其最低限最好介于5.0-6.4,其最高限最好介于6.4-7.4。可选的方案,制剂以一种能够长期保存的方式提供,比如冷冻干燥的制剂。此时,制剂在使用时,以目标浓度溶于水、生理盐水或缓冲液之类的溶液中使用。
本发明的制剂可以包含药物学上能够接受的添加剂,比如载体,赋形剂或药学上常用的溶剂,稳定剂,或药学上必须的组分。稳定剂的实例包括单糖如葡萄糖,二糖如蔗糖和麦芽糖,糖醇如甘露醇和山梨醇,中性盐如氯化钠,氨基酸如甘氨酸,非离子表面活化剂如聚乙二醇,聚氧乙烯,聚氧乙烯共聚物(Pluronic),聚氧乙烯山梨糖醇酐脂肪酸酯(Tween)以及人白蛋白。添加的量最好占1-10w/v%。
本发明的制药成分的有效计量可通过如下用药途径,比如一次或分开几次静脉注射,肌肉注射或皮下注射。剂量根据病症,年龄,体重或其它因素不同而变化,最优剂量为0.001-100mg/剂量。
编码本发明蛋白酶的正义或反义的DNA同样也可以制成制剂,而获得药物组合物。
另外,本发明中包括了使用本发明的肽,蛋白以及DNA,抑制与心肌梗死或脑梗死相关的血小板血栓的形成的方法,抑制动脉硬化的方法,阻止指心瓣手术后的再狭窄方法,再栓塞,或PTCA相关的梗死,或阻止与PTCR相关的再栓塞,以及阻止由HUS或O-157所导致的血小板血栓形成的方法。而且本发明还包括使用本发明的肽,蛋白以及DNA制成药学产品,来抑制与心肌梗死或脑梗死相关的血小板血栓的形成,抑制动脉硬化的药物,阻止指心瓣手术后的再狭窄药物,再栓塞药物,或阻止PTCA相关的梗死药物,或阻止与PTCR相关的再栓塞药物,以及阻止由HUS或O-157所导致的血小板血栓形成药物。
本发明的蛋白酶肽或蛋白可作为氨基酸修饰的先导物。这样能够制备具有与本发明的蛋白酶不同活性的分子。其中,能够获得一个变异分子的例子是制备该蛋白酶的拮抗剂分子,方法是:对位于金属硫蛋白酶结构域活性中心周围的氨基酸与另一个氨基酸之间的氨基酸进行替换,获得灭活的变异体,或使分子的识别位点与催化位点分离,或者改变这些位点中的一个或两个来获得。
本文所述的评价vWF切割活性的方法体系,可用于评价拮抗剂或激动剂的活性。比如,有效的拮抗剂可以是一种小的有机分子、肽或多肽。例子之一就是结合本发明多肽的抗体,可以抑制或消除该肽的活性。
同样,使用前面所述的vWF切割活性的评价体系,能够筛选具有切割vWF活性的化合物。在这种情况下,被测试化合物的活性可以用前面所述方法体系评价。
附图简述
图1.vWF多体结构以及vWF切割蛋白酶的切割位点示意图。
图2.vWF多体分析结果的照片(琼脂糖电泳)。
图3.还原条件下分析每份血浆级分的vWF切割活性的SDS-PAGE(5%凝胶)结果的照片。
图4.非还原条件下分析级分1(F1)粘稠物的可溶性样品SDS-PAGE(5%)结果的照片。
图5.分析用F1粘稠物中可溶性样品作为起始物,通过三次凝胶过滤层析后vWF切割蛋白酶级分的结果的照片。图5A凝胶过滤层析图;图5B非还原条件下各级分的SDS-PAGE图;图5C还原条件下vWF切割活性SDS-PAGE结果
图6.凝胶过滤层析后,vWF切割蛋白酶级分用DEAE离子交换柱纯化的分析结果照片;图6A凝胶过滤层析图;图5B非还原条件下各洗脱级分的SDS-PAGE(8%凝胶)结果图;图6C还原条件下vWF切割活性SDS-PAGE结果图。图6C中,如同图5C所示三条待分别为完整的vWF分子(未切割),以及两条vWF切割片段。
图7.DEAE离子交换柱纯化浓缩后进一步用基于SDS-PAGE(非还原条件)的Biophoresis纯化后的电泳片段结果的照片
图8.进一步通过基于Biophoresis的SDS-PAGE纯化vWF切割蛋白酶级分获得的级分的电泳结果的照片,分析vWF切割蛋白酶活性,和还原条件下的活性级分SDS-PAGE结果的照片;图8A非还原条件下分析vWF切割蛋白酶活性的SDS-PAGE结果,图8B还原条件下分析活性级分的SDS-PAGE结果。
图9.有关vWF切割蛋白酶基因鉴定,图中所示引物用于扩增作Northern印迹的探针。
图10.有关vWF切割蛋白酶基因鉴定,图中所示为Northern印迹后的放射自显影结果图。图10A为用编码蛋白酶的基因作为探针时的结果;10B为用β肌动蛋白探针(RNA对照)时的结果。
图11.有关vWF切割蛋白酶基因鉴定,图中所示为用于RACE实验的引物的位置和序列。
图12.设计的克隆全长cDNA的引物位置和序列
图13.包含全长cDNA载体构建示意图
图14.不同细胞系表达结果图(使用抗FLAG抗体,在还原条件下作Northern印迹,阴性对照为基因反向插入表达载体)。图14中每条泳道结果是用所示样品所作。
泳道1:Mock(宿主:293细胞)
泳道2:vWF切割蛋白酶,cDNA+FLAG(宿主:293细胞)
泳道3:Mock(宿主:HepG2细胞)
泳道4:vWF切割蛋白酶,cDNA+FLAG(宿主:HepG2细胞)
泳道5:Mock(宿主:HeLa细胞)
泳道6:vWF切割蛋白酶,cDNA+FLAG(宿主:HeLa细胞)
图15.重组表达的蛋白酶活性检测结果的照片(在还原条件下通过SDS-PAGE分析vWF切割活性,阴性对照为基因反向插入表达载体)。图15中每条泳道结果是用所示样品所作。
泳道1:Mock(宿主:HeLa细胞)
泳道2:表达vWF切割蛋白酶上清(宿主:HeLa细胞)
泳道3:Mock(宿主:HepG2细胞)
泳道4:表达vWF切割蛋白酶上清(宿主:HepG2细胞)
泳道5:Mock(宿主:293细胞)
泳道6:表达vWF切割蛋白酶上清(宿主:293细胞)
泳道7:Mock(宿主:BHK细胞)
泳道8:表达vWF切割蛋白酶上清(宿主:BHK细胞)
泳道9:Mock(宿主:COS细胞)
泳道10:表达vWF切割蛋白酶上清(宿主:COS细胞)
泳道11:Mock(宿主:CHO细胞)
泳道12:表达vWF切割蛋白酶上清(宿主:CHO细胞)
图16.用抗本发明的蛋白酶的抗体进行WESTERN印迹结果的照片,用不同的抗血清以293细胞作为宿主所获得的vWF切割蛋白酶。在图16中,每条泳道结果是用所示样品所作。
泳道1:鼠抗血清(用纯化蛋白制备)
泳道2:兔抗血清(皮下注射表达载体给兔子后制备)
泳道3:未处理的兔血清
泳道4:兔抗血清(用合成的部分肽与klh交联后制备)
图17.用制备的抗本发明蛋白酶的抗体进行Western印迹结果的照片,其中样品来源于人细菌和重组表达,检测所用兔抗血清为用vWF切割蛋白酶的全长cDNA免疫所得。图17中,每条泳道结果是用所示样品所作。
泳道1:来源于人血浆低温沉淀的部分纯化的样品
泳道2:纯化的源于人血浆的样品
泳道3:从人血浆中获得FI粘稠物经凝胶过滤后的样品
泳道4:重组vWF切割蛋白酶(宿主:293细胞)
泳道5:重组vWF切割蛋白酶(宿主:HeLa细胞)
图18.用制备的抗本发明蛋白酶的抗体获得的Western结果的照片,其中兔抗血清是通过合成的部分vWF切割蛋白酶的肽免疫兔子后获得,然后用于确定健康人血浆中的vWF切割蛋白酶以及TTP患者的vWF切割蛋白酶和基因重组产物。图18中每条泳道结果是用所示样品所作。
泳道1:从人血浆中获得F1粘稠物经凝胶过滤后的样品
泳道2:正常人血浆1
泳道3:正常人血浆2
泳道4:正常人血浆3
泳道5:TTP患者血浆1
泳道6:TTP患者血浆2
泳道7,重组vWF切割蛋白酶(宿主293细胞)
泳道8,重组vWF切割蛋白酶(宿主HeLa细胞)
图19用制备的抗本发明的蛋白酶抗体获得ELISA结果
图20用抗体在还原条件下亲和纯化后各级分的SDS-PAGE(银染)结果的照片。图20中条泳道结果是用所示样品所作。
泳道1:上柱培养上清(稀释10倍)
泳道2:过柱后样品
泳道3:柱子洗涤液部分,
泳道4:洗脱部分
图21用抗体评价中和活性的结果的照片(用SDS-PAGE分析非还原条件下的vWF切割活性)。图21中条泳道结果是用所示样品所作。
泳道1:vWF切割蛋白酶溶液∶正常兔血清=1∶1
泳道2:vWF切割蛋白酶溶液∶正常兔血清(稀释5倍)=1∶1
泳道3:vWF切割蛋白酶溶液∶肽免疫的兔血清=1∶1
泳道4:vWF切割蛋白酶溶液∶肽免疫的兔血清(稀释5倍)=1∶1
泳道5:vWF切割蛋白酶溶液∶重组蛋白免疫的兔血清=1∶1
泳道6:vWF切割蛋白酶溶液∶重组蛋白免疫的兔血清(稀释5倍)=1∶1
泳道7:vWF切割蛋白酶溶液∶10mMEDTA=1∶1
泳道8∶vWF切割蛋白酶溶液∶缓冲液=1∶1
泳道9:缓冲液(不含vWF切割蛋白酶)∶缓冲液=1∶1
图22无C末端结构域的分子表达载体构建示意图
本发明的最佳实施方式
下面参照实施例详细描述本发明,尽管本发明并不限于这些实施例。
实施例1
(vWF的制备)
血浆低温沉淀物(2克)溶解于20ml缓冲液(0.01%Tween-80/50mM Tris-HCl/100 mM NaCl,pH7.4。),然后上Sephacryl S-500 HR凝胶层析柱(2.6×90cm,Amersham Pharmacia)制备vWF。以2ml/min流速收集各级分,每管6ml。用过氧化物酶标记的兔抗人vWF抗体(DAKO),通过Western印迹方法分析vWF,合并高分子量的vWF级分。合并的级分通过如下所述凝胶电泳方法进行多体分析。
如图1所示,天然的vWF具有多体结构,主要通过vWF单体之间N末端或C末端聚合而成,而且vWF可被vWF切割蛋白酶部分水解。如图2所示的分析结果显示,根据凝胶电泳结果,纯化的vWF与正常人血浆中的vWF呈现相似的多体模式。(图中的梯状条带显示了vWF具有多体结构的电泳模式,上部表明高级聚合的vWF)。这就能够制备不含降解该产品的杂质的vWF,作为下面所述的vWF切割蛋白酶活性检测的底物。
实施例2
(vWF切割反应)
下面检测vWF切割活性。样品在含10mM氯化钡(终浓度)溶液中37℃中预孵育5分钟活化蛋白酶。在一50ml的Falcon试管中加入缓冲液(15-20ml,1.5M尿素/5mM Tris-HCl,pH8.0)。然后,在其中悬浮一块滤膜(0.025μm,Millipore)。加入50微升vWF底物混合后液制备活化的样品,并向Falcon试管中加入100微升活化的样品。37℃孵育过夜,第二天回收滤膜。回收的样品按照下面所述的“SDS-PAGE”部分评价vWF切割模式。
SDS-PAGE
制备并使用含5%的聚丙烯凝胶。加电泳缓冲液(2微升,在有或无还原剂如2巯基乙醇存在时)至10微升“vWF切割活性检测”部分的样品中。样品煮沸3分钟,制成电泳样品。在30mA电泳条件下电泳1小时,用Code Blue Stain试剂(PIERCE)对电泳凝胶进行CBB染色。如同图1所示,根据切割片段的变化以及在还原或非还原条件下未被酶切的片段是否仍然存在来评价蛋白酶活性。这些将在实施例3中以及图3中更为详尽的描述。
用琼脂糖电泳进行多体分析
凝胶制备,电泳
低熔点琼脂糖(II型,Sigma)加入375mM Tris-HCl(pH6.8)至终浓度为1.4%,并用微波炉加热至完全溶解。而后,加0.1%SDS,保持56℃。然后倒入凝胶制备槽,4℃过夜凝固(分离胶)。第二天,将高温琼脂糖凝胶(SeaKem)与375mM Tris-HCl(pH6.8)混合至终浓度为0.8%,并用微波炉加热至完全溶解,保持56℃(浓缩胶)。切割前一天制备的胶,留10cm长。然后倒入前述高温琼脂糖胶至切割部分,4℃放置至少3小时,充分凝固。加派若宁Y至“vWF切割活性检测” 部分所述样品中,非还原条件电泳样品不需煮沸。使用该凝胶用SDS-PAGE缓冲液进行电泳,条件为10mA电泳至少24小时。
Western印迹
电泳完成后,凝胶在凝胶转移缓冲液(0.005%SDS,50mM磷酸缓冲液,pH7.4)中浸泡10分钟,然后用电转仪将电泳胶中的级分转移至硝酸纤维素膜上,4℃,0.5A转移过夜。接着,用封闭液(5%牛奶,PBS)封闭30分钟。凝胶与用封闭液稀释l000倍的过氧化物酶标记的兔抗人vWF抗体(DAKO)反应至少6小时。然后,用封闭液洗涤3次,用PBS洗涤一次,用可作为过氧化物酶底物的KonicaImmunostain HRP-1000(Konica)显色。检测结果发现,纯化的vWF未被降解,完全可以作为本发明的底物。(图2)
实施例3
(vWF切割蛋白酶的制备)
将血浆用乙醇分级分离(Cohn法)。当四种级分(起始血浆,低温沉淀物,级分I(FI)上清,以及粘稠物)中蛋白量相当时,选择具有高vWF切割活性的蛋白酶。如图3所示,FI粘稠物中的蛋白酶活性最高。对切割的片段进行N末端序列分析,结果发现,来源于低温沉淀和FI粘稠物中的活性级分能够切割第842位Tyr和第843位Met之间的肽键。因此,确定用FI粘稠物作为主要的起始物来纯化。
FI粘稠物的溶解
FI粘稠物分成每份12克,然后低温保存。在使用的前一天于4℃融化。第二天,按照10mg/ml浓度加入溶解缓冲液120ml(0.05%叠氮钠,50mMTris-HCl(pH7.4),100mM NaCl),37℃搅拌2小时。10000rpm,离心10分钟,回收上清,然后按照5.0μm,0.8μm孔径先后过滤。获得溶解性的样品。图4显示了溶解好的样品的SDS-PAGE结果。
vWF切割蛋白酶的凝胶过滤层析
FI粘稠物中可溶性的部分上Sephacryl S-300 HR柱(5×90cm,Amersham Pharmacia)进行凝胶过滤。使用与溶解缓冲液相同的含0.05%叠氮钠,50mM Tris-HCl(pH7.4),100mM NaCl缓冲液(以下简称“洗脱液”)洗脱。流速为5ml/min,上样后从600ml处收集,每10ml收集1管。对各级分进行vWF切割反应,然后用SDS-PAGE进行活性分析。收集有活性的蛋白酶级分,少量的饱和硫酸铵逐滴加入至终浓度为33%。混合物4℃放置过夜。第二天10000rpm离心10分钟,回收含目的活性级分的沉淀。用包括溶解,凝胶过滤以及硫酸铵沉淀的这一列程序操作5批,收集产物-20℃低温保存。
由第一次凝胶过滤后,硫酸铵沉淀(2-3批)的产物溶解于50ml洗脱缓冲液中,然后用与第一次过柱同样的条件再过一次SephacrylS-300 HR柱(5×90cm)。所用洗脱缓冲液,洗脱条件以及操作等与第一次相同。收集的级分用于vWF切割反应,然后用SDS-PAGE进行活性分析。收集、合并有活性的级分,用硫酸铵沉淀。同样的步骤重复2次。
第二次层析后并用硫酸铵沉淀的产物(2批)溶解于50ml洗脱缓冲液中,然后用与第一、二次过柱同样的条件再过第三次Sephacryl S-300HR柱(5×90cm),洗脱缓冲液,条件以及操作等同第一、二次过柱。收集的级分用于vWF切割反应,然后用SDS-PAGE分析活性并收集。图5为SDS-PAGE分析这些级分及其vWF切割活性的结果图。根据凝胶层析的结果以及活性,发现本发明的蛋白酶洗脱区域在第37至47级分之间。根据各次高分子量的凝胶层析(Amersham Pharmacia)洗脱位置推断其分子量在150-300kDa之间。此时,仍有不少的杂质存在。
DEAE阴离子交换柱
3次凝胶过滤层析所获得的合并的级分,4℃对含50mMTris-HCl,50mM NaCl(pH7.1)的缓冲液透析过夜。透析后,用5ml的HiTrapDEAE-Sepharose Fast Flow柱(Pharmacia)进行进一步的纯化。平衡并洗涤柱子,所用缓冲液为50mM Tris-HCl,(pH7.1);洗脱用25mM NaCl溶液。流速为5ml/min,每5ml收集1级分,共收集5级分。图6为SDS-PAGE分析各级分及其相应活性的结果图。根据SDS-PAGE的活性检测结果,有活性的本发明的蛋白酶被有效的浓缩在洗脱级分。
SDS-PAGE分级分离
用DEAE阴离子交换柱纯化、浓缩的样品(5ml),进一步用Centricon(截留分子量为10000Da,Amicon)浓缩至0.5ml。利用SDS-PAGE的BIophoresis III(Atto Corporation)分离本发明的蛋白酶。与Laemmli的方法一致(Nature,vol.227,680-685,1970),制备电泳缓冲液,用8%的聚丙烯酰胺凝胶来回收电泳级分。图7为回收级分的SDS-PAGE分析结果。回收缓冲液含50mM Tris-HCl和10%甘油(pH8.8)。很显然,图7表明本发明的这个方法可以有效地分离。图8为进一步用电泳纯化后级分的活性分析以及分析级分活性的SDS-PAGE结果。具有活性的本发明的蛋白酶可以在电泳后回收。当血浆中的该蛋白酶的比活定为1时,根据血浆中的平均蛋白浓度(60mg/ml),推断纯度可达30000-100000倍。
实施例4
(部分氨基酸测序)
确定了纯化蛋白酶的部分氨基酸序列。用Biophoresis分离的蛋白酶,用常规SDS-PGE电泳后将其转移至PVDF膜上,空气干燥,然后用蛋白自动分析仪(model 492;PE Applied Biosystems)进行分析。结果发现,上述条件下分离的本发明的vWF切割蛋白酶包含一条多肽,非还原条件下SDS-PAGE结果显示其分子量在105-160kDa。而且该蛋白酶具有这样的部分序列Leu-Leu-Val-Ala-Val,更优选的是,Ala-Ala-Gly-Gly-Ile-Leu-His-Leu-Glu-Leu-Leu-Val-Ala-Val
应用生物信息学推断分离的蛋白酶
目前,生物信息学能够通过与以前收集的信息比较,在未获得基因克隆的情况下推断编码多肽的全核苷酸序列(BIOINFORMATICS:APractical Guide to the Analysis of Genes and Proteins,Andreas D.Baxevanis和B.F.Francis Ouellette编)。根据前述的方法测序的部分氨基酸序列(Ala-Ala-Gly-Gly-Ile-Leu-His-Leu-Glu-Leu-Leu-Val-Ala-Val),用tblast程序检索数据库。结果检索基因组数据库后,确定了基因组克隆(AL158826),推断其编码本发明的蛋白酶。进而,确定了目的蛋白酶的部分表达序列标签(EST)和前述推断的基因组编码的多肽克隆(AI346761和AJ011374)。据此推断出vWF切割蛋白酶活性位点的氨基酸序列,如SEQ ID NO:3或7所示。
实施例5
(基因鉴定)
按要求,由GreinerJapan有限公司合成下列合成引物。除非特别指出,所用基因克隆试剂由TAKARA,TOYOBO和New EnglandBiolabs公司生产。
制备Northern印迹探针的基因片段
制备正向引物(SEQ ID NO:9)和反向引物(SEQ ID NO:10)。用Universal QUICK-CloneTM cDNA(Clonetech)和带有富含GC的缓冲液的TaKaRa LA Taq酶进行PCR,所述cDNA是源于正常人组织的cDNA混合物,用作模板。扩增两条引物之间的基因,然后用TOPO TAcloningTM试剂盒(Invitrogen)克隆扩增的片段。分离获得的几个克隆中,DNA序列如SEQ ID NO:6中所示。
用EcoR I酶切去除克隆的DNA中的载体序列,用琼脂糖凝胶电泳纯化回收,然后用于制备Northern印迹探针的模板。
Northern印迹
上述制备的基因片段作为模板,用[α-32P]dCTP(AmershamPharmacia)和BcaBESTTM标记试剂盒(TAKARA)标记。按照第二版Molecular Cloning第9.52-9.55页所述方法,用Human12-lane MultipleTissue Northern BlotsTM(Clontech)滤膜进行杂交,用放射自显影检测。如图10所示,编码蛋白酶的mRNA主要表达在肝中。发现mRNA大于4.4kb。
分离鉴定编码蛋白酶的基因
Northern印迹发现,mRNA主要在肝中表达。因此,用正常人肝组织来源的polyA+RNA和Marathon-ReadyTM cDNA(Clontech),按照RACE技术,分离鉴定编码本发明的蛋白酶基因。
更具体地说,5’RACE的第一轮PCR用正常人肝组织来源的Marathon-ReadyTM cDNA试剂盒进行,按照产品操作手册,用试剂盒附带的AP-1引物以及反向引物(SEQ ID NO:11-13)扩增,该反向引物随机选自除位于最上游的引物1之外的基因特异性引物组(GSP),如图11。Nested PCR(第二轮PCR)所用AP-2引物和反向引物均位于如图11所示的第一轮引物的内侧。然后,进行TA克隆。按照常规的方法(Molecular cloning 2nd edition,pp1.25-1.28),从长出的克隆中制备基因,用全自动测序仪解读核酸序列。测序引物为PCR引物或位于其内侧的引物。进而根据一系列测序结果,再进一步设计引物。
用3’Full RACE Core SET(TAKARA)试剂盒进行3’RACE,从正常人肝组织来源的polyA+RNA开始,按照产品操作手册,用试剂盒附带的寡dT引物进行反转录。如图11所示,用位于“引物2”的正向引物(SEQ ID NO:14)以及试剂盒附带的寡dT引物,进行PCR扩增,通过琼脂糖凝胶电泳分离、纯化回收扩增的片段,然后执行TA克隆。按照常规的方法,从长出的克隆中制备基因,用全自动测序仪解读核酸序列。根据一系列的测序结果,设计测序引物。
实施例6
(制备含全长cDNA 1的载体)
用一步法PCR扩增编码蛋白酶的cDNA,其中正向引物(SEQ IDNO:22)含XhoI限制性内切酶位点和起始位点,反向引物(SEQ ID NO:23)含SalI限制性内切酶位点和终止位点,模板为上述正常人肝组织来源的Marathon-ReadyTM cDNA,以及带有富含GC缓冲液的TaKaRaLA Taq酶。获得片段后,执行TA克隆。然后用全自动DNA序列分析仪确定全长基因。
实施例7
(制备含全长cDNA 2的载体)
在编码蛋白酶的cDNA序列内部找出仅有唯一切点的切割cDNA的限制性内切酶位点AccI和AvrII。然后,使用这些酶,全长cDNA被分成如图12所示的3段。按照上述3个片段,分别获得:位于正向引物1(SEQ ID NO:22)和反向引物3(SEQ ID NO:24)之间的片段1,位于正向引物4(SEQ ID NO:25)和反向引物5(SEQ ID NO:26)之间的片段2,位于正向引物6(SEQ ID NO:27)和反向引物2(SEQ ID NO:23)之间的片段3。每个片段,用上述正常人肝组织来源的Marathon-ReadyTMcDNA,以及用TaKaRa LA Taq酶,通过PCR反应获得,该酶附带富含GC的缓冲液,然后执行TA克隆。用全自动DNA序列分析仪解读全长基因。进一步,用TA克隆试剂盒中的pCR2.1载体,使之自连接,然后XhoI/HindIII酶切,并连接入一个含XhoI/AccI/AvrII/HindIII酶切位点的接头(通过合成DNA退火连接而成,序列如SEQ ID NO:28或29所示)。将上述3个片段,用常规方方法顺序接入而结合在一起。进而,获得包含全部区域的cDNA(见图13)。
实施例8
(制备包含全长cDNA的表达载体:动物细胞宿主)
用限制性内切酶XhoI/SalI切割在实施例6或7中获得的DNA,然后连接至,例如pCAG载体的SalI位点(Niwa,H等,Gene,vol.108,193-199),基因插入的方向以及全序列由全自动DNA序列分析仪确定。
实施例9
(含全长cDNA的表达载体转染动物细胞)
实施例8中制备的动物细胞表达载体,按照下面的方法转染293细胞系(人胚胎肾细胞系)、HeLa细胞和HepG2细胞。开始转染前24小时,细胞按照1-3×105/35mm碟接种细胞并培养。第二天,按照所用试剂提供的用法说明,100微升无血清的培养基(如Opti-MEM)中,加1微克的表达载体和2微升的TransIt(TAKARA)聚胺转染试剂,制成含DNA的混合物,然后将其逐滴加入已准备的各种细胞中,孵育2-8小时,然后换培养基继续培养。3天后,换含G418的选择性培养基。以后,每3天换一次培养基至获得稳定表达的细胞株。图14所示即为C末端含FLAG标签的暂时性表达株的例子,先用抗FLAG-M2抗体(Kodack)结合,然后用碱性磷酸酶标记的抗鼠Ig抗体系统染色,通过Western印迹的方法检测的结果。本实施例中,cDNA重组细胞株在还原条件下表达出约250kDa大小的分子。该分子在正常人血浆中也有表达(见下面实施例14中图18所示)。人血浆中还发现几种分子大小不同的本发明蛋白酶,这可能是由于存在不同的剪切产物(SEQ ID NO:6-20)所至,在基因克隆时就已经观察到这种情况,以及诸如翻译后修饰如糖基化修饰或者纯化过程中降解(如本发明实施例14中图17以及Gerritsen等在Blood,vol。98,1654-1661(2001)中所述)。
随后,重组表达细胞株表达产物的vWF切割活性通过实施例2中所述方法检测(图15)。结果发现,来源于人血浆的蛋白酶和本发明的基因重组产物都表现了同样的vWF切割活性。
实施例10
(制备包含部分cDNA序列的表达载体:大肠杆菌宿主)
用含NcoI限制性内切酶位点以及起始密码子的正向引物(SEQ IDNO:30)和含HindIII限制性内切酶位点以及终止密码子的反向引物(SEQ ID NO:31),扩增获得编码蛋白金属硫蛋白结构域的部分cDNA,模板为前面提及的正常人肝组织来源的Marathon-ReadyTMcDNA或实施例6或7获得的cDNA,酶为TAKARA LA TAQ酶,缓冲液为酶附带的富含GC的缓冲液。PCR产物用NcoI/HindIII消化,连接到用相同酶切的大肠杆菌表达载体,如pUT 1中(Soejima等,J.Biochem.Tokoyo,vol.130,269-277(2001)),然后用常规方法转化大肠杆菌JM109感受态细胞。选择几个获得的克隆,并从中制备基因。然后,通过全自动DNA测序仪,分析确定该基因为编码多肽的基因,而且质粒中核酸序列插入位点与SEQ ID NO:32或实质上SEQID NO:33所表现的序列一致。
实施例11
(含部分cDNA序列的表达载体在大肠杆菌中的表达)
实施例10中构建的含表达载体的大肠杆菌接种至200ml含50微克/ml氨苄青霉素的LB培养基中,30℃培养过夜。然后将其接种至含8升LB培养基的发酵罐中,30℃培养至600nm处浊度在0.2-0.5之间。然后,加入异丙基硫代-β-D半乳糖苷至终浓度为1mM,继续培养过夜,诱导表达金属硫蛋白结构域的蛋白。离心收集(4℃,30分钟)培养的大肠杆菌。
随后,用蒸馏水重悬大肠杆菌沉淀,并加入溶菌酶(终浓度为0.6mg/ml)。室温搅拌30分钟,4℃放置过夜,彻底使细胞破裂。然后超声处理,离心(4℃,20分钟),收集沉淀。用含50mM Tris,10mMEDTA和1%Triton(pH8.0)的缓冲液重悬沉淀。重复离心,超声与重悬几次。然后沉淀重悬于蒸馏水中。同样,重复离心,超声与重悬几次来回收包含体。包含体在抗体制备中作抗原。
实施例12
(其它动物同源基因的分离)
用SEQ ID NO:15中所示核酸序列作探针,在GenomeNet WWW服务器(http//www.genome.ad.jp)上用BLASTN程序进行同源检索。结果获得了定位于鼠10号染色体上的染色体克隆AC091762和AC090008。根据这些序列,推断与本发明蛋白酶基因同源的鼠基因如SEQ ID NO:34中所示。根据序列设计新的引物,用与分离鉴定编码人vWF切割蛋白酶的基因技术同样的方法,进行Northern Blot分析。发现,与人的情况类似,鼠肝中由明确的表达。进而,用正常鼠肝组织来源的polyA+RNA和Marathon-ReadyTMcDNA(Clontech)分离鉴定该基因,方法同本发明分离鉴定本发明的蛋白酶基因的RACE技术。最终,确定了鼠同源的该蛋白酶的基因序列,如SEQ ID NO:35和36所示。
根据确定的鼠同源基因的部分序列,确定了鼠第10号染色体中5’端外显子/内含子结构。据此,按照常规方法(如,Gene Targeting:APractical Approach第1版,A.L.Joyner编,Teratocarcinomas andembryonic stem cell a practical approach),可以制备出靶向基因敲除(插入)载体。这样可以获得基因突变鼠。而且该蛋白可以用常规方法进行重组表达。
实施例13
(抗体制备以及用该抗体构建本发明蛋白酶的检测系统)
按照常规技术(如Current Protocols in Biology,第11章,Immunology,Antibody engineering:A PRACTICAL APPROACH,J.McCAFFERTY等编或ANTIBODY ENGINEERING第二版,Carl A.K.BORREBAECK编),用表达载体免疫小鼠或大鼠。所用表达载体包含一种物质,该物质是通过选择性的将一种优选的载体物资如KLH(比如,在n或c末端添加Cys以利于KLH的增添)结合至抗原蛋白或合成肽,以及前述基因重组蛋白或编码该蛋白酶的基因上制备的,其中抗原蛋白部分纯化自人血浆,合成肽包含如下氨基酸序列(如多肽序列C末端肽序列(SEQ ID NO:37):Phe-Ser-Pro-Ala-Pro-Gln-Pro-Arg-Arg-Leu-Leu-Pro-Gly-Pro-Gln-Glu-Asn-Ser-Val-Gln-Ser-Ser,这是本发明蛋白酶的一种同工酶)。从而建立表达抗体的杂交瘤细胞以及获得多抗(抗血清)。
然后将上述方法制备的抗体,用于Western印迹的常规技术(如,Current Protocols in Molecular Biology:第10章analysis of Protein,第11章Immunology),检测本发明的蛋白酶。更确切的讲,按照实施例9中所述程序获得的重组表达细胞293的表达上清,进行非还原性条件下的SDS-PAGE,然后转移至PVDF膜,并用鼠或兔抗血清确定基因重组产物的表达(图16)。结果发现一条分子量范围在160-250kDa之间的表达带,推断为本发明的蛋白酶。随后,对起始物血浆等以及重组产物,在非还原性条件下检测,结果发现了105-160kDa或160-250kDa之间有一条带(图17)。而且,在来自相似重组表达株的表达产物的检测中也检测到一条带,所用抗体是通过免疫重组蛋白(克隆号为CPHSWH-10)获得的单克隆抗体。
随后,本发明蛋白酶的另一种同工酶,其C末端肽序列为:Phe-Ser-Pro-Ala-Pro-Gln-Pro-Arg-Arg-Leu-Leu-Pro-Gly-Pro-Gln-Glu-Asn-Ser-Val-Gln-Ser-Ser(SEQ ID NO:37)的肽连接至KLH上。然后作为免疫原,去获得肽的抗体。再用它检测来自正常人血浆,TTP患者血浆,还原条件下重组表达上清中本发明的蛋白酶。结果发现一条约250kDa的带,推断其是本发明的蛋白酶,尽管该带在检测TTP患者的血浆时不清晰(图18)。
进一步用获得的抗体,建立酶联检测方法(ELISA),使用该方法能够获得一条标准曲线,该曲线对培养上清中重组蛋白浓度是依赖性的(图19)。ELISA的一个实施例如下所述。在Maxisorp板(Nunc)上包被获得的抗vWF切割蛋白酶抗体,加入经1/1、1/2、1/4稀释的vWF切割蛋白酶暂时表达细胞293的表达上清,100微升/孔(对照上清调零),37℃反应1小时,然后用含0.05%Tween 20的TBS洗涤。加入10倍稀释的抗vWF切割蛋白酶抗体,总量为100微升/孔,37℃反应1小时,然后用含0.05%Tween 20的TBS洗板。加入1000倍稀释的抗过氧化物酶标记的抗兔Ig抗体(BioRad),总量为100微升/孔,37℃反应1小时,然后用含0.05%Tween 20的TBS洗板。最后,在给定的时间内用显色底物TMBZ显色,用1M的硫酸终止反应,检测450nm处的光吸收值。该方法可以对不同标本中的本发明蛋白酶进行定量。
实施例14
(用抗体纯化蛋白酶)
将获得的抗体交联到合适的固相载体上,制备亲和层析柱,并用该柱纯化本发明的蛋白酶。亲和柱的制备是将抗体固相化至NHS活化的Cellulofine(Chisso Corporatin),方法同产品附带的说明。如实施例9中获得的表达本蛋白酶重组基因的293细胞株的培养上清,过这样制备的膨胀载体(约1ml)。然后用含50mM Tris-HCl和0.1MNaCl(pH7.5,以下简称TBS)的缓冲液洗涤,用含0.1M甘氨酸的尿素缓冲液(pH3)洗脱,然后对TBS透析。图20为获得的纯化蛋白酶的SDS-PAGE结果图。而且还发现,纯化获得的产品有vWF切割活性。通过对重组蛋白酶切割片段的N末端氨基酸序列分析,发现重组蛋白酶对vWF的切割位点位于842位Tyr和843位Met之间。同样,建立了几株克隆(克隆号CPHSWH-7.2和10),这些克隆株可用单克隆抗体进行纯化,单抗制备方法见实施例13。
紧接着,又确定了纯化蛋白酶的部分氨基酸序列。按照常规技术,对该蛋白酶进行SDS-PGE后转移至PVDF膜上,空气干燥,然后用蛋白自动分析仪(model 492;PE Applied Biosystems)进行分析。结果发现,蛋白酶包含一段Ala-Ala-Gly-Gly-Ile-的N末端序列,该序列与由基因组成推断的本发明的成熟蛋白酶的N末端序列一致。
实施例15
(用抗体中和蛋白酶活性)
评价了前面所述兔多抗对切割vWF蛋白酶的中和活性。正常兔血清,兔抗C末端序列为Phe-Ser-Pro-Ala-Pro-Gln-Pro-Arg-Arg-Leu-Leu-Pro-Gly-Pro-Gln-Glu-Asn-Ser-Val-Gln-Ser-Ser(SEQ ID NO:37)并连接至KLH的肽的抗血清,以及免疫实施例7或8所述表达载体表达的重组产物所获得的抗vWF切割蛋白酶的抗血清,分别与1-10微克/ml的基因重组vWF切割蛋白酶,按照体积比1∶1,37℃预反应1小时(与Bradford方法相似)。或者用5倍稀释的抗血清,在上述条件下按照体积比1∶1的比例预反应。然后,用前面所述方法评价vWF切割活性。结果发现通过免疫蛋白获得的抗血清,能够抑制本发明蛋白酶的活性(图21)(拮抗剂活性)(金属硫蛋白酶抑制剂,如EDTA作对照)。这表明:有可能构建获得性TTP样模型动物,其体内有抗vWF切割蛋白酶的抗体,以及获得中和抗体的可能性。
实施例16
(C末端缺失修饰单元的构建)
根据图22所示策略,实施例6或7中获得的含全长vWF切割蛋白酶基因的载体(pCR2.1 vWFCP),通过在某位置上突变造成随后的了C末端结构域缺失(T1135stop,W1016stop,W897stop和Q449stop,每个数值表示位于编码Met的起始密码子AGT和终止密码子之间的氨基酸残基数,以及表示插入FLAG表位(DNA序列:gactacaaggacgatgacgataagtga(SEQ ID NO:47)的位置与氨基酸序列:AspTyr Lys Asp Asp Asp Asp Lys(SEQ ID NO:48))。此处所用引物如下:S代表正向引物,AS代表反向引物。Genes Stu I-S(SEQ ID NO:38),Acc I-S(SEQ ID NO:39),Avr II-S(SEQ ID NO:40),Q449stop-AS(SEQID NO:41),T581stop-AS(SEQ ID NO:42),W897stop-AS(SEQ ID NO:43),W1016stop-AS(SEQ ID NO:44),T1135stop-AS(SEQ ID NO:45)以及全长-AS(SEQ ID NO:46),制备这些基因并插入pCAG表达载体中,方法同实施例8和9中所述。将这些表达载体导入HeLa细胞。图22上部的酶切图谱底部所示的引物对,用于获得PCR片段(A)-(F)。每个PCR片段连接到pCR2.1 vWFCP载体。进而,用StuI/SalI消化该载体和片段(A)和(B)用StuI/SalI后连接。进一步用AccI消化pCR2.1vWFCP载体和片段(C)AccI后连接。用AvrII/SalI消化pCR2.1vWFCP载体和片段(D)(E)和(F)后连接。结果发现C末端与W897之间区域缺失的突变体有活性,尽管该活性仅是定性分析的结果。通过这样的方法能够确定不同的功能性结构域。拮抗剂或激动剂可以通过设计包含这些结构域但没有蛋白酶活性的分子来实现。
工业实用性
本发明的发现,可使建立针对如血栓性血小板减少性紫癜患者等由于蛋白酶不足所致的疾病的替代疗法成为可能。同时,建立了一系列的从血清或血浆进行基因克隆和高效纯化的方法。尤其是,由本发明提供的信息,能够保证核酸序列的基因重组,稳定生产以及本发明的蛋白酶的稳定供应,这在以前是难以实现的。而且,通过抑制与心肌梗死或脑梗死相关的血小板血栓的形成,抑制动脉硬化,阻止指心瓣手术后的再狭窄,或PTCA相关的梗死,或阻止与PTCR相关的再栓塞,以及阻止由HUS或O-157所导致的血小板血栓形成,替代目前治疗TTP患者的疗法。应用编码本发明蛋白酶的基因或针对该酶的抗体,实现诊断与治疗。
本文所引用的文献此全文引用。本领域内的技术人员可以容易地理解在本发明的技术思路以及附带的权利要求范围内的可以对本发明进行修饰与改变。本发明旨在包括这些修饰与改变。
序 列 表
<110>JURIDICAL FOUNDATION THE CHEMO-SERO-THERAPEUTIC RESEARCH INSTITUTE
<120>vWF切割蛋白酶
<130>PH1553-PCT
<160>48
<210>1
<211>5
<212>PRT
<213>人
<400>1
Leu Leu Val Ala Val
1 5
<210>2
<211>14
<212>PRT
<213>人
<400>2
Ala Ala Gly Gly Ile Leu His Leu Glu Leu Leu Val Ala Val
1 5 10
<210>3
<211>161
<212>PRT
<213>人
<400>3
Ala Ala Gly Gly Ile Leu His Leu Glu Leu Leu Val Ala Val Gly
1 5 10 15
Pro Asp Val Phe Gln Ala His Gln Lys Asp Thr Glu Arg Tyr Val
20 25 30
Leu Thr Asn Leu Asn Ile Gly Ala Glu Leu Leu Arg Asp Pro Ser
35 40 45
Leu Gly Ala Gln Phe Arg Val His Leu Val Lys Met Val Ile Leu
50 55 60
Thr Glu Pro Glu Gly Ala Pro Asn Ile Thr Ala Asn Leu Thr Ser
65 70 75
Ser Leu Leu Ser Val Cys Gly Trp Ser Gln Thr Ile Asn Pro Glu
80 85 90
Asp Asp Thr Asp Pro Gly His Ala Asp Leu Val Leu Tyr Ile Thr
95 100 105
Arg Phe Asp Leu Glu Leu Pro Asp Gly Asn Arg Gln Val Arg Gly
110 115 120
Val Thr Gln Leu Gly Gly Ala Cys Ser Pro Thr Trp Ser Cys Leu
125 130 135
Ile Thr Glu Asp Thr Gly Phe Asp Leu Gly Val Thr Ile Ala His
140 145 150
Glu Ile Gly His Ser Phe Gly Leu Glu His Asp
155 160
<210>4
<211>15
<212>DNA
<213>人
<400>4
ctgctggtgg ccgtg 15
<210>5
<211>42
<212>DNA
<213>人
<400>5
gctgcaggcg gcatcctaca cctggagctg ctggtggccg tg 42
<210>6
<211>483
<212>DNA
<213>人
<400>6
gctgcaggcg gcatcctaca cctggagctg ctggtggccg tgggccccga tgtcttccag 60
gctcaccaga aggacacaga gcgctatgtg ctcaccaacc tcaacatcgg ggcagaactg 120
cttcgggacc cgtccctggg ggctcagttt cgggtgcacc tggtgaagat ggtcattctg 180
acagagcctg agggtgctcc aaatatcaca gcaaacctca cctcgtccct gctgagcgtc 240
tgtgggtgga gccagaccat caaccctgag gacgacacgg atcctggcca tgctgacctg 300
gtcctctata tcactaggtt tgacctggag ttgcctgatg gtaaccggca ggtgcggggc 360
gtcacccagc tgggcggtgc ctgctcccca acctggagct gcctcattac cgaggacact 420
ggcttcgacc tgggagtcac cattgcccat gagattgggc acagcttcgg cctggagcac 480
gac 483
<210>7
<211>161
<212>PRT
<213>人
<400>7
gct gca ggc ggc atc cta cac ctg gag ctg ctg gtg gcc gtg ggc 45
Ala Ala Gly Gly Ile Leu His Leu Glu Leu Leu Val Ala Val Gly
1 5 10 15
ccc gat gtc ttc cag gct cac cag aag gac aca gag cgc tat gtg 90
Pro Asp Val Phe Gln Ala His Gln Lys Asp Thr Glu Arg Tyr Val
20 25 30
ctc acc aac ctc aac atc ggg gca gaa ctg ctt cgg gac ccg tcc 135
Leu Thr Asn Leu Asn Ile Gly Ala Glu Leu Leu Arg Asp Pro Ser
35 40 45
ctg ggg gct cag ttt cgg gtg cac ctg gtg aag atg gtc att ctg 180
Leu Gly Ala Gln Phe Arg Val His Leu Val Lys Met Val Ile Leu
50 55 60
aca gag cct gag ggt gct cca aat atc aca gca aac ctc acc tcg 225
Thr Glu Pro Glu Gly Ala Pro Asn Ile Thr Ala Asn Leu Thr Ser
65 70 75
tcc ctg ctg agc gtc tgt ggg tgg agc cag acc atc aac cct gag 270
Ser Leu Leu Ser Val Cys Gly Trp Ser Gln Thr Ile Asn Pro Glu
80 85 90
gac gac acg gat cct ggc cat gct gac ctg gtc ctc tat atc act 315
Asp Asp Thr Asp Pro Gly His Ala Asp Leu Val Leu Tyr Ile Thr
95 100 105
agg ttt gac ctg gag ttg cct gat ggt aac cgg cag gtg cgg ggc 360
Arg Phe Asp Leu Glu Leu Pro Asp Gly Asn Arg Gln Val Arg Gly
110 115 120
gtc acc cag ctg ggc ggt gcc tgc tcc cca acc tgg agc tgc ctc 405
Val Thr Gln Leu Gly Gly Ala Cys Ser Pro Thr Trp Ser Cys Leu
125 130 135
att acc gag gac act ggc ttc gac ctg gga gtc acc att gcc cat 450
Ile Thr Glu Asp Thr Gly Phe Asp Leu Gly Val Thr Ile Ala His
140 145 150
gag att ggg cac agc ttc ggc ctg gag cac gac 483
Glu Ile Gly His Ser Phe Gly Leu Glu His Asp
155 160
<210>8
<211>29
<212>PRT
<213>人
<400>8
Ala Ala Gly Gly Ile Leu His Leu Glu Leu Leu Val Ala Val Gly
1 5 丂 10 15
Pro Asp Val Phe Gln Ala His Gln Lys Asp Thr Arg Arg Tyr
20 25
<210>9
<211>30
<212>DNA
<213>人
<400>9
gctgcaggcg gcatcctaca cctggagctg 30
<210>10
<211>21
<212>DNA
<213>人
<400>10
cccaatctca tgggcaatgg t 21
<210>11
<211>21
<212>DNA
<213>人
<400>11
cccaatctca tgggcaatgg t 21
<210>12
<211>30
<212>DNA
<213>人
<400>12
ccgatgttga ggttggtgag cacatagcgc 30
<210>13
<211>20
<212>DNA
<213>人
<400>13
gtgtcgtcct cagggttgat 20
<210>14
<211>21
<212>DNA
<213>人
<400>14
accattgccc atgagattgg g 21
<210>15
<211>4950
<212>DNA
<213>人
<400>15
aaccacgatg tctttggcac agcctctcat ctgtcagatg ggagcgggga ccccggagag 60
ggagtcagcc gaggtcctgg cattccttgt gaacccccgt ctgtgggttt ctggtccagt 120
gtcccttctc cagattagat ggcttaggcc tcctctaagg gggtgggcgt gcacatccgg 180
agagctgtct ggtgtgcagg actgggctgc aggttaccct gaactgcaac catcttagag 240
caaggcccag cttgcagcag gaggagctgc aggccgccca ccctagccac ggcccctgcc 300
ctggcaggaa gcttccaaga gtaaacactg cctaatcgtc ccgcccagta gtgagcaggc 360
ctgtcccatt ccatactgac cagattccca gtcaccaagg ccccctctca ctccgctcca 420
ctcctcgggc tggctctcct gaggatgcac cagcgtcacc cccgggcaag atgccctccc 480
ctctgtgtgg ccggaatcct tgcctgtggc tttctcctgg gctgctgggg accctcccat 540
ttccagcaga gttgtcttca ggctttggag ccacaggccg tgtcttctta cttgagccct 600
ggtgctccct taaaaggccg ccctccttcc cctggcttcc agaggcagag gcagaggcag 660
aggcgggctg caggcggcat cctacacctg gagctgctgg tggccgtggg ccccgatgtc 720
ttccaggctc accaggagga cacagagcgc tatgtgctca ccaacctcaa catcggggca 780
gaactgcttc gggacccgtc cctgggggct cagtttcggg tgcacctggt gaagatggtc 840
attctgacag agcctgaggg tgctccaaat atcacagcca acctcacctc gtccctgctg 900
agcgtctgtg ggtggagcca gaccatcaac cctgaggacg acacggatcc tggccatgct 960
gacctggtcc tctatatcac taggtttgac ctggagttgc ctgatggtaa ccggcaggtg 1020
cggggcgtca cccagctggg cggtgcctgc tccccaacct ggagctgcct cattaccgag 1080
gacactggct tcgacctggg agtcaccatt gcccatgaga ttgggcacag cttcggcctg 1140
gagcacgacg gcgcgcccgg cagcggctgc ggccccagcg gacacgtgat ggcttcggac 1200
ggcgccgcgc cccgcgccgg cctcgcctgg tccccctgca gccgccggca gctgctgagc 1260
ctgctcagcg caggacgggc gcgctgcgtg tgggacccgc cgcggcctca acccgggtcc 1320
gcggggcacc cgccggatgc gcagcctggc ctctactaca gcgccaacga gcagtgccgc 1380
gtggccttcg gccccaaggc tgtcgcctgc accttcgcca gggagcacct ggatatgtgc 1440
caggccctct cctgccacac agacccgctg gaccaaagca gctgcagccg cctcctcgtt 1500
cctctcctgg atgggacaga atgtggcgtg gagaagtggt gctccaaggg tcgctgccgc 1560
tccctggtgg agctgacccc catagcagca gtgcatgggc gctggtctag ctggggtccc 1620
cgaagtcctt gctcccgctc ctgcggagga ggtgtggtca ccaggaggcg gcagtgcaac 1680
aaccccagac ctgcctttgg ggggcgtgca tgtgttggtg ctgacctcca ggccgagatg 1740
tgcaacactc aggcctgcga gaagacccag ctggagttca tgtcgcaaca gtgcgccagg 1800
accgacggcc agccgctgcg ctcctcccct ggcggcgcct ccttctacca ctggggtgct 1860
gctgtaccac acagccaagg ggatgctctg tgcagacaca tgtgccgggc cattggcgag 1920
agcttcatca tgaagcgtgg agacagcttc ctcgatggga cccggtgtat gccaagtggc 1980
ccccgggagg acgggaccct gagcctgtgt gtgtcgggca gctgcaggac atttggctgt 2040
gatggtagga tggactccca gcaggtatgg gacaggtgcc aggtgtgtgg tggggacaac 2100
agcacgtgca gcccacggaa gggctctttc acagctggca gagcgagaga atatgtcacg 2160
tttctgacag ttacccccaa cctgaccagt gtctacattg ccaaccacag gcctctcttc 2220
acacacttgg cggtgaggat cggagggcgc tatgtcgtgg ctgggaagat gagcatctcc 2280
cctaacacca cctacccctc cctcctggag gatggtcgtg tcgagtacag agtggccctc 2340
accgaggacc ggctgccccg cctggaggag atccgcatct ggggacccct ccaggaagat 2400
gctgacatcc aggtttacag gcggtatggc gaggagtatg gcaacctcac ccgcccagac 2460
atcaccttca cctacttcca gcctaagcca cggcaggcct gggtgtgggc cgctgtgcgt 2520
gggccctgct cggtgagctg tggggcaggg ctgcgctggg taaactacag ctgcctggac 2580
caggccagga aggagttggt ggagactgtc cagtgccaag ggagccagca gccaccagcg 2640
tggccagagg cctgcgtgct cgaaccctgc cctccctact gggcggtggg agacttcggc 2700
ccatgcagcg cctcctgtgg gggcggcctg cgggagcggc cagtgcgctg cgtggaggcc 2760
cagggcagcc tcctgaagac attgccccca gcccggtgca gagcaggggc ccagcagcca 2820
gctgtggcgc tggaaacctg caacccccag ccctgccctg ccaggtggga ggtgtcagag 2880
cccagctcat gcacatcagc tggtggagca ggcctggcct tggagaacga gacctgtgtg 2940
ccaggggcag atggcctgga ggctccagtg actgaggggc ctggctccgt agatgagaag 3000
ctgcctgccc ctgagccctg tgtcgggatg tcatgtcctc caggctgggg ccatctggat 3060
gccacctctg caggggagaa ggctccctcc ccatggggca gcatcaggac gggggctcaa 3120
gctgcacacg tgtggacccc tgcggcaggg tcgtgctccg tctcctgcgg gcgaggtctg 3180
atggagctgc gtttcctgtg catggactct gccctcaggg tgcctgtcca ggaagagctg 3240
tgtggcctgg caagcaagcc tgggagccgg cgggaggtct gccaggctgt cccgtgccct 3300
gctcggtggc agtacaagct ggcggcctgc agcgtgagct gtgggagagg ggtcgtgcgg 3360
aggatcctgt attgtgcccg ggcccatggg gaggacgatg gtgaggagat cctgttggac 3420
acccagtgcc aggggctgcc tcgcccggaa ccccaggagg cctgcagcct ggagccctgc 3480
ccacctaggt ggaaagtcat gtcccttggc ccatgttcgg ccagctgtgg ccttggcact 3540
gctagacgct cggtggcctg tgtgcagctc gaccaaggcc aggacgtgga ggtggacgag 3600
gcggcctgtg cggcgctggt gcggcccgag gccagtgtcc cctgtctcat tgccgactgc 3660
acctaccgct ggcatgttgg cacctggatg gagtgctctg tttcctgtgg ggatggcatc 3720
cagcgccggc gtgacacctg cctcggaccc caggcccagg cgcctgtgcc agctgatttc 3780
tgccagcact tgcccaagcc ggtgactgtg cgtggctgct gggctgggcc ctgtgtggga 3840
cagggtacgc ccagcctggt gccccacgaa gaagccgctg ctccaggacg gaccacagcc 3900
acccctgctg gtgcctccct ggagtggtcc caggcccggg gcctgctctt ctccccggct 3960
ccccagcctc ggcggctcct gcccgggccc caggaaaact cagtgcagtc cagtgcctgt 4020
ggcaggcagc accttgagcc aacaggaacc attgacatgc gaggcccagg gcaggcagac 4080
tgtgcagtgg ccattgggcg gcccctcggg gaggtggtga ccctccgcgt ccttgagagt 4140
tctctcaact gcagtgcggg ggacatgttg ctgctttggg gccggctcac ctggaggaag 4200
atgtgcagga agctgttgga catgactttc agctccaaga ccaacacgct ggtggtgagg 4260
cagcgctgcg ggcggccagg aggtggggtg ctgctgcggt atgggagcca gcttgctcct 4320
gaaaccttct acagagaatg tgacatgcag ctctttgggc cctggggtga aatcgtgagc 4380
ccctcgctga gtccagccac gagtaatgca gggggctgcc ggctcttcat taatgtggct 4440
ccgcacgcac ggattgccat ccatgccctg gccaccaaca tgggcgctgg gaccgaggga 4500
gccaatgcca gctacatctt gatccgggac acccacagct tgaggaccac agcgttccat 4560
gggcagcagg tgctctactg ggagtcagag agcagccagg ctgagatgga gttcagcgag 4620
ggcttcctga aggctcaggc cagcctgcgg ggccagtact ggaccctcca atcatgggta 4680
ccggagatgc aggaccctca gtcctggaag ggaaaggaag gaacctgagg gtcattgaac 4740
atttgttccg tgtctggcca gccctggagg gttgacccct ggtctcagtg ctttccaatt 4800
cgaacttttt ccaatcttag gtatctactt tagagtcttc tccaatgtcc aaaaggctag 4860
ggggttggag gtggggactc tggaaaagca gcccccattt cctcgggtac caataaataa 4920
aacatgcagg ccaaaaaaaa aaaaaaaaaa 4950
<210>16
<211>1353
<212>PRT
<213>人
<400>16
gct gca ggc ggc atc cta cac ctg gag ctg ctg gtg gcc gtg ggc 45
Ala Ala Gly Gly Ile Leu His Leu Glu Leu Leu Val Ala Val Gly
1 5 10 15
ccc gat gtc ttc cag gct cac cag gag gac aca gag cgc tat gtg 90
Pro Asp Val Phe Gln Ala His Gln Glu Asp Thr Glu Arg Tyr Val
20 25 30
ctc acc aac ctc aac atc ggg gca gaa ctg ctt cgg gac ccg tcc 135
Leu Thr Asn Leu Asn Ile Gly Ala Glu Leu Leu Arg Asp Pro Ser
35 40 45
ctg ggg gct cag ttt cgg gtg cac ctg gtg aag atg gtc att ctg 180
Leu Gly Ala Gln Phe Arg Val His Leu Val Lys Met Val Ile Leu
50 55 60
aca gag cct gag ggt gct cca aat atc aca gcc aac ctc acc tcg 225
Thr Glu Pro Glu Gly Ala Pro Asn Ile Thr Ala Asn Leu Thr Ser
65 70 75
tcc ctg ctg agc gtc tgt ggg tgg agc cag acc atc aac cct gag 270
Ser Leu Leu Ser Val Cys Gly Trp Ser Gln Thr Ile Asn Pro Glu
80 85 90
gac gac acg gat cct ggc cat gct gac ctg gtc ctc tat atc act 315
Asp Asp Thr Asp Pro Gly His Ala Asp Leu Val Leu Tyr Ile Thr
95 100 105
agg ttt gac ctg gag ttg cct gat ggt aac cgg cag gtg cgg ggc 360
Arg Phe Asp Leu Glu Leu Pro Asp Gly Asn Arg Gln Val Arg Gly
110 115 120
gtc acc cag ctg ggc ggt gcc tgc tcc cca acc tgg agc tgc ctc 405
Val Thr Gln Leu Gly Gly Ala Cys Ser Pro Thr Trp Ser Cys Leu
125 130 135
att acc gag gac act ggc ttc gac ctg gga gtc acc att gcc cat 450
Ile Thr Glu Asp Thr Gly Phe Asp Leu Gly Val Thr Ile Ala His
140 145 150
gag att ggg cac agc ttc ggc ctg gag cac gac ggc gcg ccc ggc 495
Glu Ile Gly His Ser Phe Gly Leu Glu His Asp Gly Ala Pro Gly
155 160 165
agc ggc tgc ggc ccc agc gga cac gtg atg gct tcg gac ggc gcc 540
Ser Gly Cys Gly Pro Ser Gly His Val Met Ala Ser Asp Gly Ala
170 175 180
gcg ccc cgc gcc ggc ctc gcc tgg tcc ccc tgc agc cgc cgg cag 585
Ala Pro Arg Ala Gly Leu Ala Trp Ser Pro Cys Ser Arg Arg Gln
185 190 195
ctg ctg agc ctg ctc agc gca gga cgg gcg cgc tgc gtg tgg gac 630
Leu Leu Ser Leu Leu Ser Ala Gly Arg Ala Arg Cys Val Trp Asp
200 205 210
ccg ccg cgg cct caa ccc ggg tcc gcg ggg cac ccg ccg gat gcg 675
Pro Pro Arg Pro Gln Pro Gly Ser Ala Gly His Pro Pro Asp Ala
215 220 225
cag cct ggc ctc tac tac agc gcc aac gag cag tgc cgc gtg gcc 720
Gln Pro Gly Leu Tyr Tyr Ser Ala Asn Glu Gln Cys Arg Val Ala
230 235 240
ttc ggc ccc aag gct gtc gcc tgc acc ttc gcc agg gag cac ctg 765
Phe Gly Pro Lys Ala Val Ala Cys Thr Phe Ala Arg Glu His Leu
245 250 255
gat atg tgc cag gcc ctc tcc tgc cac aca gac ccg ctg gac caa 810
Asp Met Cys Gln Ala Leu Ser Cys His Thr Asp Pro Leu Asp Gln
260 265 270
agc agc tgc agc cgc ctc ctc gtt cct ctc ctg gat ggg aca gaa 855
Ser Ser Cys Ser Arg Leu Leu Val Pro Leu Leu Asp Gly Thr Glu
275 280 285
tgt ggc gtg gag aag tgg tgc tcc aag ggt cgc tgc cgc tcc ctg 900
Cys Gly Val Glu Lys Trp Cys Ser Lys Gly Arg Cys Arg Ser Leu
290 295 300
gtg gag ctg acc ccc ata gca gca gtg cat ggg cgc tgg tct agc 945
Val Glu Leu Thr Pro Ile Ala Ala Val His Gly Arg Trp Ser Ser
305 310 315
tgg ggt ccc cga agt cct tgc tcc cgc tcc tgc gga gga ggt gtg 990
Trp Gly Pro Arg Ser Pro Cys Ser Arg Ser Cys Gly Gly Gly Val
320 325 330
gtc acc agg agg cgg cag tgc aac aac ccc aga cct gcc ttt ggg 1035
Val Thr Arg Arg Arg Gln Cys Asn Asn Pro Arg Pro Ala Phe Gly
335 340 345
ggg cgt gca tgt gtt ggt gct gac ctc cag gcc gag atg tgc aac 1080
Gly Arg Ala Cys Val Gly Ala Asp Leu Gln Ala Glu Met Cys Asn
350 355 360
act cag gcc tgc gag aag acc cag ctg gag ttc atg tcg caa cag 1125
Thr Gln Ala Cys Glu Lys Thr Gln Leu Glu Phe Met Ser Gln Gln
365 370 375
tgc gcc agg acc gac ggc cag ccg ctg cgc tcc tcc cct ggc ggc 1170
Cys Ala Arg Thr Asp Gly Gln Pro Leu Arg Ser Ser Pro Gly Gly
380 385 390
gcc tcc ttc tac cac tgg ggt gct gct gta cca cac agc caa ggg 1215
Ala Ser Phe Tyr His Trp Gly Ala Ala Val Pro His Ser Gln Gly
395 400 405
gat gct ctg tgc aga cac atg tgc cgg gcc att ggc gag agc ttc 1260
Asp Ala Leu Cys Arg His Met Cys Arg Ala Ile Gly Glu Ser Phe
410 415 420
atc atg aag cgt gga gac agc ttc ctc gat ggg acc cgg tgt atg 1305
Ile Met Lys Arg Gly Asp Ser Phe Leu Asp Gly Thr Arg Cys Met
425 430 435
cca agt ggc ccc cgg gag gac ggg acc ctg agc ctg tgt gtg tcg 1350
Pro Ser Gly Pro Arg Glu Asp Gly Thr Leu Ser Leu Cys Val Ser
440 445 450
ggc agc tgc agg aca ttt ggc tgt gat ggt agg atg gac tcc cag 1395
Gly Ser Cys Arg Thr Phe Gly Cys Asp Gly Arg Met Asp Ser Gln
455 460 465
cag gta tgg gac agg tgc cag gtg tgt ggt ggg gac aac agc acg 1440
Gln Val Trp Asp Arg Cys Gln Val Cys Gly Gly Asp Asn Ser Thr
470 475 480
tgc agc cca cgg aag ggc tct ttc aca gct ggc aga gcg aga gaa 1485
Cys Ser Pro Arg Lys Gly Ser Phe Thr Ala Gly Arg Ala Arg Glu
485 490 495
tat gtc acg ttt ctg aca gtt acc ccc aac ctg acc agt gtc tac 1530
Tyr Val Thr Phe Leu Thr Val Thr Pro Asn Leu Thr Ser Val Tyr
500 505 510
att gcc aac cac agg cct ctc ttc aca cac ttg gcg gtg agg atc 1575
Ile Ala Asn His Arg Pro Leu Phe Thr His Leu Ala Val Arg Ile
515 520 525
gga ggg cgc tat gtc gtg gct ggg aag atg agc atc tcc cct aac 1620
Gly Gly Arg Tyr Val Val Ala Gly Lys Met Ser Ile Ser Pro Asn
530 535 540
acc acc tac ccc tcc ctc ctg gag gat ggt cgt gtc gag tac aga 1665
Thr Thr Tyr Pro Ser Leu Leu Glu Asp Gly Arg Val Glu Tyr Arg
545 550 555
gtg gcc ctc acc gag gac cgg ctg ccc cgc ctg gag gag atc cgc 1710
Val Ala Leu Thr Glu Asp Arg Leu Pro Arg Leu Glu Glu Ile Arg
560 565 570
atc tgg gga ccc ctc cag gaa gat gct gac atc cag gtt tac agg 1755
Ile Trp Gly Pro Leu Gln Glu Asp Ala Asp Ile Gln Val Tyr Arg
575 580 585
cgg tat ggc gag gag tat ggc aac ctc acc cgc cca gac atc acc 1800
Arg Tyr Gly Glu Glu Tyr Gly Asn Leu Thr Arg Pro Asp Ile Thr
590 595 600
ttc acc tac ttc cag cct aag cca cgg cag gcc tgg gtg tgg gcc 1845
Phe Thr Tyr Phe Gln Pro Lys Pro Arg Gln Ala Trp Val Trp Ala
605 610 615
gct gtg cgt ggg ccc tgc tcg gtg agc tgt ggg gca ggg ctg cgc 1890
Ala Val Arg Gly Pro Cys Ser Val Ser Cys Gly Ala Gly Leu Arg
620 625 630
tgg gta aac tac agc tgc ctg gac cag gcc agg aag gag ttg gtg 1935
Trp Val Asn Tyr Ser Cys Leu Asp Gln Ala Arg Lys Glu Leu Val
635 640 645
gag act gtc cag tgc caa ggg agc cag cag cca cca gcg tgg cca 1980
Glu Thr Val Gln Cys Gln Gly Ser Gln Gln Pro Pro Ala Trp Pro
650 655 660
gag gcc tgc gtg ctc gaa ccc tgc cct ccc tac tgg gcg gtg gga 2025
Glu Ala Cys Val Leu Glu Pro Cys Pro Pro Tyr Trp Ala Val Gly
665 670 675
gac ttc ggc cca tgc agc gcc tcc tgt ggg ggc ggc ctg cgg gag 2070
Asp Phe Gly Pro Cys Ser Ala Ser Cys Gly Gly Gly Leu Arg Glu
680 685 690
cgg cca gtg cgc tgc gtg gag gcc cag ggc agc ctc ctg aag aca 2115
Arg Pro Val Arg Cys Val Glu Ala Gln Gly Ser Leu Leu Lys Thr
695 700 705
ttg ccc cca gcc cgg tgc aga gca ggg gcc cag cag cca gct gtg 2160
Leu Pro Pro Ala Arg Cys Arg Ala Gly Ala Gln Gln Pro Ala Val
710 715 720
gcg ctg gaa acc tgc aac ccc cag ccc tgc cct gcc agg tgg gag 2205
Ala Leu Glu Thr Cys Asn Pro Gln Pro Cys Pro Ala Arg Trp Glu
725 730 735
gtg tca gag ccc agc tca tgc aca tca gct ggt gga gca ggc ctg 2250
Val Ser Glu Pro Ser Ser Cys Thr Ser Ala Gly Gly Ala Gly Leu
740 745 750
gcc ttg gag aac gag acc tgt gtg cca ggg gca gat ggc ctg gag 2295
Ala Leu Glu Asn Glu Thr Cys Val Pro Gly Ala Asp Gly Leu Glu
755 760 765
gct cca gtg act gag ggg cct ggc tcc gta gat gag aag ctg cct 2340
Ala Pro Val Thr Glu Gly Pro Gly Ser Val Asp Glu Lys Leu Pro
770 775 780
gcc cct gag ccc tgt gtc ggg atg tca tgt cct cca ggc tgg ggc 2385
Ala Pro Glu Pro Cys Val Gly Met Ser Cys Pro Pro Gly Trp Gly
785 790 795
cat ctg gat gcc acc tct gca ggg gag aag gct ccc tcc cca tgg 2430
His Leu Asp Ala Thr Ser Ala Gly Glu Lys Ala Pro Ser Pro Trp
800 805 810
ggc agc atc agg acg ggg gct caa gct gca cac gtg tgg acc cct 2475
Gly Ser Ile Arg Thr Gly Ala Gln Ala Ala His Val Trp Thr Pro
815 820 825
gcg gca ggg tcg tgc tcc gtc tcc tgc ggg cga ggt ctg atg gag 2520
Ala Ala Gly Ser Cys Ser Val Ser Cys Gly Arg Gly Leu Met Glu
830 835 840
ctg cgt ttc ctg tgc atg gac tct gcc ctc agg gtg cct gtc cag 2565
Leu Arg Phe Leu Cys Met Asp Ser Ala Leu Arg Val Pro Val Gln
845 850 855
gaa gag ctg tgt ggc ctg gca agc aag cct ggg agc cgg cgg gag 2610
Glu Glu Leu Cys Gly Leu Ala Ser Lys Pro Gly Ser Arg Arg Glu
860 865 870
gtc tgc cag gct gtc ccg tgc cct gct cgg tgg cag tac aag ctg 2655
Val Cys Gln Ala Val Pro Cys Pro Ala Arg Trp Gln Tyr Lys Leu
875 880 885
gcg gcc tgc agc gtg agc tgt ggg aga ggg gtc gtg cgg agg atc 2700
Ala Ala Cys Ser Val Ser Cys Gly Arg Gly Val Val Arg Arg Ile
890 895 900
ctg tat tgt gcc cgg gcc cat ggg gag gac gat ggt gag gag atc 2745
Leu Tyr Cys Ala Arg Ala His Gly Glu Asp Asp Gly Glu Glu Ile
905 910 915
ctg ttg gac acc cag tgc cag ggg ctg cct cgc ccg gaa ccc cag 2790
Leu Leu Asp Thr Gln Cys Gln Gly Leu Pro Arg Pro Glu Pro Gln
920 925 930
gag gcc tgc agc ctg gag ccc tgc cca cct agg tgg aaa gtc atg 2835
Glu ALa Cys Ser Leu Glu Pro Cys Pro Pro Arg Trp Lys Val Met
935 940 945
tcc ctt ggc cca tgt tcg gcc agc tgt ggc ctt ggc act gct aga 2880
Ser Leu Gly Pro Cys Ser Ala Ser Cys Gly Leu Gly Thr Ala Arg
950 955 960
cgc tcg gtg gcc tgt gtg cag ctc gac caa ggc cag gac gtg gag 2925
Arg Ser Val Ala Cys Val Gln Leu Asp Gln Gly Gln Asp Val Glu
965 970 975
gtg gac gag gcg gcc tgt gcg gcg ctg gtg cgg ccc gag gcc agt 2970
Val Asp Glu Ala Ala Cys Ala Ala Leu Val Arg Pro Glu Ala Ser
980 985 990
gtc ccc tgt ctc att gcc gac tgc acc tac cgc tgg cat gtt ggc 3015
Val Pro Cys Leu Ile Ala Asp Cys Thr Tyr Arg Trp His Val Gly
995 1000 1005
acc tgg atg gag tgc tct gtt tcc tgt ggg gat ggc atc cag cgc 3060
Thr Trp Met Glu Cys Ser Val Ser Cys Gly Asp Gly Ile Gln Arg
1010 1015 1020
cgg cgt gac acc tgc ctc gga ccc cag gcc cag gcg cct gtg cca 3105
Arg Arg Asp Thr Cys Leu Gly Pro Gln Ala Gln Ala Pro Val Pro
1025 1030 1035
gct gat ttc tgc cag cac ttg ccc aag ccg gtg act gtg cgt ggc 3150
Ala Asp Phe Cys Gln His Leu Pro Lys Pro Val Thr Val Arg Gly
1040 1045 1050
tgc tgg gct ggg ccc tgt gtg gga cag ggt acg ccc agc ctg gtg 3195
Cys Trp Ala Gly Pro Cys Val Gly Gln Gly Thr Pro Ser Leu Val
1055 1060 1065
ccc cac gaa gaa gcc gct gct cca gga cgg acc aca gcc acc cct 3240
Pro His Glu Glu Ala Ala Ala Pro Gly Arg Thr Thr Ala Thr Pro
1070 1075 1080
gct ggt gcc tcc ctg gag tgg tcc cag gcc cgg ggc ctg ctc ttc 3285
Ala Gly Ala Ser Leu Glu Trp Ser Gln Ala Arg Gly Leu Leu Phe
1085 1090 1095
tcc ccg gct ccc cag cct cgg cgg ctc ctg ccc ggg ccc cag gaa 3330
Ser Pro Ala Pro Gln Pro Arg Arg Leu Leu Pro Gly Pro Gln Glu
1100 1105 1110
aac tca gtg cag tcc agt gcc tgt ggc agg cag cac ctt gag cca 3375
Asn Ser Val Gln Ser Ser Ala Cys Gly Arg Gln His Leu Glu Pro
1115 1120 1125
aca gga acc att gac atg cga ggc cca ggg cag gca gac tgt gca 3420
Thr Gly Thr Ile Asp Met Arg Gly Pro Gly Gln Ala Asp Cys Ala
1130 1135 1140
gtg gcc att ggg cgg ccc ctc ggg gag gtg gtg acc ctc cgc gtc 3465
Val Ala Ile Gly Arg Pro Leu Gly Glu Val Val Thr Leu Arg Val
1145 1150 1155
ctt gag agt tct ctc aac tgc agt gcg ggg gac atg ttg ctg ctt 3510
Leu Glu Ser Ser Leu Asn Cys Ser Ala Gly Asp Met Leu Leu Leu
1160 1165 1170
tgg ggc cgg ctc acc tgg agg aag atg tgc agg aag ctg ttg gac 3555
Trp Gly Arg Leu Thr Trp Arg Lys Met Cys Arg Lys Leu Leu Asp
1175 1180 1185
atg act ttc agc tcc aag acc aac acg ctg gtg gtg agg cag cgc 3600
Met Thr Phe Ser Ser Lys Thr Asn Thr Leu Val Val Arg Gln Arg
1190 1195 1200
tgc ggg cgg cca gga ggt ggg gtg ctg ctg cgg tat ggg agc cag 3645
Cys Gly Arg Pro Gly Gly Gly Val Leu Leu Arg Tyr Gly Ser Gln
1205 1210 1215
ctt gct cct gaa acc ttc tac aga gaa tgt gac atg cag ctc ttt 3690
Leu Ala Pro Glu Thr Phe Tyr Arg Glu Cys Asp Met Gln Leu Phe
1220 1225 1230
ggg ccc tgg ggt gaa atc gtg agc ccc tcg ctg agt cca gcc acg 3735
Gly Pro Trp Gly Glu Ile Val Ser Pro Ser Leu Ser Pro Ala Thr
1235 1240 1245
agt aat gca ggg ggc tgc cgg ctc ttc att aat gtg gct ccg cac 3780
Ser Asn Ala Gly Gly Cys Arg Leu Phe Ile Asn Val Ala Pro His
1250 1255 1260
gca cgg att gcc atc cat gcc ctg gcc acc aac atg ggc gct ggg 3825
Ala Arg Ile Ala Ile His Ala Leu Ala Thr Asn Met Gly Ala Gly
1265 1270 1275
acc gag gga gcc aat gcc agc tac atc ttg atc cgg gac acc cac 3870
Thr Glu Gly Ala Asn Ala Ser Tyr Ile Leu Ile Arg Asp Thr His
1280 1285 1290
agc ttg agg acc aca gcg ttc cat ggg cag cag gtg ctc tac tgg 3915
Ser Leu Arg Thr Thr Ala Phe His Gly Gln Gln Val Leu Tyr Trp
1295 1300 1305
gag tca gag agc agc cag gct gag atg gag ttc agc gag ggc ttc 3960
Glu Ser Glu Ser Ser Gln Ala Glu Met Glu Phe Ser Glu Gly Phe
1310 1315 1320
ctg aag gct cag gcc agc ctg cgg ggc cag tac tgg acc ctc caa 4005
Leu Lys Ala Gln Ala Ser Leu Arg Gly Gln Tyr Trp Thr Leu Gln
1325 1330 1335
tca tgg gta ccg gag atg cag gac cct cag tcc tgg aag gga aag 4050
Ser Trp Val Pro Glu Met Gln Asp Pro Gln Ser Trp Lys Gly Lys
1340 1345 1350
gaa gga acc 4059
Glu Gly Thr
<210>17
<211>1297
<212>PRT
<213>人
<400>17
gct gca ggc ggc atc cta cac ctg gag ctg ctg gtg gcc gtg ggc 45
Ala Ala Gly Gly Ile Leu His Leu Glu Leu Leu Val Ala Val Gly
1 5 10 15
ccc gat gtc ttc cag gct cac cag gag gac aca gag cgc tat gtg 90
Pro Asp Val Phe Gln Ala His Gln Glu Asp Thr Glu Arg Tyr Val
20 25 30
ctc acc aac ctc aac atc ggg gca gaa ctg ctt cgg gac ccg tcc 135
Leu Thr Asn Leu Asn Ile Gly Ala Glu Leu Leu Arg Asp Pro Ser
35 40 45
ctg ggg gct cag ttt cgg gtg cac ctg gtg aag atg gtc att ctg 180
Leu Gly Ala Gln Phe Arg Val His Leu Val Lys Met Val Ile Leu
50 55 60
aca gag cct gag ggt gct cca aat atc aca gcc aac ctc acc tcg 225
Thr Glu Pro Glu Gly Ala Pro Asn Ile Thr Ala Asn Leu Thr Ser
65 70 75
tcc ctg ctg agc gtc tgt ggg tgg agc cag acc atc aac cct gag 270
Ser Leu Leu Ser Val Cys Gly Trp Ser Gln Thr Ile Asn Pro Glu
80 85 90
gac gac acg gat cct ggc cat gct gac ctg gtc ctc tat atc act 315
Asp Asp Thr Asp Pro Gly His Ala Asp Leu Val Leu Tyr Ile Thr
95 100 105
agg ttt gac ctg gag ttg cct gat ggt aac cgg cag gtg cgg ggc 360
Arg Phe Asp Leu Glu Leu Pro Asp Gly Asn Arg Gln Val Arg Gly
110 115 120
gtc acc cag ctg ggc ggt gcc tgc tcc cca acc tgg agc tgc ctc 405
Val Thr Gln Leu Gly Gly Ala Cys Ser Pro Thr Trp Ser Cys Leu
125 130 135
att acc gag gac act ggc ttc gac ctg gga gtc acc att gcc cat 450
Ile Thr Glu Asp Thr Gly Phe Asp Leu Gly Val Thr Ile Ala His
140 145 150
gag att ggg cac agc ttc ggc ctg gag cac gac ggc gcg ccc ggc 495
Glu Ile Gly His Ser Phe Gly Leu Glu His Asp Gly Ala Pro Gly
155 160 165
agc ggc tgc ggc ccc agc gga cac gtg atg gct tcg gac ggc gcc 540
Ser Gly Cys Gly Pro Ser Gly His Val Met Ala Ser Asp Gly Ala
170 175 180
gcg ccc cgc gcc ggc ctc gcc tgg tcc ccc tgc agc cgc cgg cag 585
Ala Pro Arg Ala Gly Leu Ala Trp Ser Pro Cys Ser Arg Arg Gln
185 190 195
ctg ctg agc ctg ctc agc gca gga cgg gcg cgc tgc gtg tgg gac 630
Leu Leu Ser Leu Leu Ser Ala Gly Arg Ala Arg Cys Val Trp Asp
200 205 210
ccg ccg cgg cct caa ccc ggg tcc gcg ggg cac ccg ccg gat gcg 675
Pro Pro Arg Pro Gln Pro Gly Ser Ala Gly His Pro Pro Asp Ala
215 220 225
cag cct ggc ctc tac tac agc gcc aac gag cag tgc cgc gtg gcc 720
Gln Pro Gly Leu Tyr Tyr Ser Ala Asn Glu Gln Cys Arg Val Ala
230 235 240
ttc ggc ccc aag gct gtc gcc tgc acc ttc gcc agg gag cac ctg 765
Phe Gly Pro Lys Ala Val Ala Cys Thr Phe Ala Arg Glu His Leu
245 250 255
gat atg tgc cag gcc ctc tcc tgc cac aca gac ccg ctg gac caa 810
Asp Met Cys Gln Ala Leu Ser Cys His Thr Asp Pro Leu Asp Gln
260 265 270
agc agc tgc agc cgc ctc ctc gtt cct ctc ctg gat ggg aca gaa 855
Ser Ser Cys Ser Arg Leu Leu Val Pro Leu Leu Asp Gly Thr Glu
275 280 285
tgt ggc gtg gag aag tgg tgc tcc aag ggt cgc tgc cgc tcc ctg 900
Cys Gly Val Glu Lys Trp Cys Ser Lys Gly Arg Cys Arg Ser Leu
290 295 300
gtg gag ctg acc ccc ata gca gca gtg cat ggg cgc tgg tct agc 945
Val Glu Leu Thr Pro Ile Ala Ala Val His Gly Arg Trp Ser Ser
305 310 315
tgg ggt ccc cga ggt cct tgc tcc cgc tcc tgc gga gga ggt gtg 990
Trp Gly Pro Arg Ser Pro Cys Ser Arg Ser Cys Gly Gly Gly Val
320 325 330
gtc acc agg agg cgg cag tgc aac aac ccc aga cct gcc ttt ggg 1035
Val Thr Arg Arg Arg Gln Cys Asn Asn Pro Arg Pro Ala Phe Gly
335 340 345
ggg cgt gca tgt gtt ggt gct gac ctc cag gcc gag atg tgc aac 1080
Gly Arg Ala Cys Val Gly Ala Asp Leu Gln Ala Glu Met Cys Asn
350 355 360
act cag gcc tgc gag aag acc cag ctg gag ttc atg tcg caa cag 1125
Thr Gln Ala Cys Glu Lys Thr Gln Leu Glu Phe Met Ser Gln Gln
365 370 375
tgc gcc agg acc gac ggc cag ccg ctg cgc tcc tcc cct ggc ggc 1170
Cys Ala Arg Thr Asp Gly Gln Pro Leu Arg Ser Ser Pro Gly Gly
380 385 390
gcc tcc ttc tac cac tgg ggt gct gct gta cca cac agc caa ggg 1215
Ala Ser Phe Tyr His Trp Gly Ala Ala Val Pro His Ser Gln Gly
395 400 405
gat gct ctg tgc aga cac atg tgc cgg gcc att ggc gag agc ttc 1260
Asp Ala Leu Cys Arg His Met Cys Arg Ala Ile Gly Glu Ser Phe
410 415 420
atc atg aag cgt gga gac agc ttc ctc gat ggg acc cgg tgt atg 1305
Ile Met Lys Arg Gly Asp Ser Phe Leu Asp Gly Thr Arg Cys Met
425 430 435
cca agt ggc ccc cgg gag gac ggg acc ctg agc ctg tgt gtg tcg 1350
Pro Ser Gly Pro Arg Glu Asp Gly Thr Leu Ser Leu Cys Val Ser
440 445 450
ggc agc tgc agg aca ttt ggc tgt gat ggt agg atg gac tcc cag 1395
Gly Ser Cys Arg Thr Phe Gly Cys Asp Gly Arg Met Asp Ser Gln
455 460 465
cag gta tgg gac agg tgc cag gtg tgt ggt ggg gac aac agc acg 1440
Gln Val Trp Asp Arg Cys Gln Val Cys Gly Gly Asp Asn Ser Thr
470 475 480
tgc agc cca cgg aag ggc tct ttc aca gct ggc aga gcg aga gaa 1485
Cys Ser Pro Arg Lys Gly Ser Phe Thr Ala Gly Arg Ala Arg Glu
485 490 495
tat gtc acg ttt ctg aca gtt acc ccc aac ctg acc agt gtc tac 1530
Tyr Val Thr Phe Leu Thr Val Thr Pro Asn Leu Thr Ser Val Tyr
500 505 510
att gcc aac cac agg cct ctc ttc aca cac ttg gcg gtg agg atc 1575
Ile Ala Asn His Arg Pro Leu Phe Thr His Leu Ala Val Arg Ile
515 520 525
gga ggg cgc tat gtc gtg gct ggg aag atg agc atc tcc cct aac 1620
Gly Gly Arg Tyr Val Val Ala Gly Lys Met Ser Ile Ser Pro Asn
530 535 540
acc acc tac ccc tcc ctc ctg gag gat ggt cgt gtc gag tac aga 1665
Thr Thr Tyr Pro Ser Leu Leu Glu Asp Gly Arg Val Glu Tyr Arg
545 550 555
gtg gcc ctc acc gag gac cgg ctg ccc cgc ctg gag gag atc cgc 1710
Val Ala Leu Thr Glu Asp Arg Leu Pro Arg Leu Glu Glu Ile Arg
560 565 570
atc tgg gga ccc ctc cag gaa gat gct gac atc cag gtt tac agg 1755
Ile Trp Gly Pro Leu Gln Glu Asp Ala Asp Ile Gln Val Tyr Arg
575 580 585
cgg tat ggc gag gag tat ggc aac ctc acc cgc cca gac atc acc 1800
Arg Tyr Gly Glu Glu Tyr Gly Asn Leu Thr Arg Pro Asp Ile Thr
590 595 600
ttc acc tac ttc cag cct aag cca cgg cag gcc tgg gtg tgg gcc 1845
Phe Thr Tyr Phe Gln Pro Lys Pro Arg Gln Ala Trp Val Trp Ala
605 610 615
gct gtg cgt ggg ccc tgc tcg gtg agc tgt ggg gca ggg ctg cgc 1890
Ala Val Arg Gly Pro Cys Ser Val Ser Cys Gly Ala Gly Leu Arg
620 625 630
tgg gta aac tac agc tgc ctg gac cag gcc agg aag gag ttg gtg 1935
Trp Val Asn Tyr Ser Cys Leu Asp Gln Ala Arg Lys Glu Leu Val
635 640 645
gag act gtc cag tgc caa ggg agc cag cag cca cca gcg tgg cca 1980
Glu Thr Val Gln Cys Gln Gly Ser Gln Gln Pro Pro Ala Trp Pro
650 655 660
gag gcc tgc gtg ctc gaa ccc tgc cct ccc tac tgg gcg gtg gga 2025
Glu Ala Cys Val Leu Glu Pro Cys Pro Pro Tyr Trp Ala Val Gly
665 670 675
gac ttc ggc cca tgc agc gcc tcc tgt ggg ggc ggc ctg cgg gag 2070
Asp Phe Gly Pro Cys Ser Ala Ser Cys Gly Gly Gly Leu Arg Glu
680 685 690
cgg cca gtg cgc tgc gtg gag gcc cag ggc agc ctc ctg aag aca 2115
Arg Pro Val Arg Cys Val Glu Ala Gln Gly Ser Leu Leu Lys Thr
695 700 705
ttg ccc cca gcc cgg tgc aga gca ggg gcc cag cag cca gct gtg 2160
Leu Pro Pro Ala Arg Cys Arg Ala Gly Ala Gln Gln Pro Ala Val
710 715 720
gcg ctg gaa acc tgc aac ccc cag ccc tgc cct gcc agg tgg gag 2205
Ala Leu Glu Thr Cys Asn Pro Gln Pro Cys Pro Ala Arg Trp Glu
725 730 735
gtg tca gag ccc agc tca tgc aca tca gct ggt gga gca ggc ctg 2250
Val Ser Glu Pro Ser Ser Cys Thr Ser Ala Gly Gly Ala Gly Leu
740 745 750
gcc ttg gag aac gag acc tgt gtg cca ggg gca gat ggc ctg gag 2295
Ala Leu Glu Asn Glu Thr Cys Val Pro Gly Ala Asp Gly Leu Glu
755 760 765
gct cca gtg act gag ggg cct ggc tcc gta gat gag aag ctg cct 2340
Ala Pro Val Thr Glu Gly Pro Gly Ser Val Asp Glu Lys Leu Pro
770 775 780
gcc cct gag ccc tgt gtc ggg atg tca tgt cct cca ggc tgg ggc 2385
Ala Pro Glu Pro Cys Val Gly Met Ser Cys Pro Pro Gly Trp Gly
785 790 795
cat ctg gat gcc acc tct gca ggg gag aag gct ccc tcc cca tgg 2430
His Leu Asp Ala Thr Ser Ala Gly Glu Lys Ala Pro Ser Pro Trp
800 805 810
ggc agc atc agg acg ggg gct caa gct gca cac gtg tgg acc cct 2475
Gly Ser Ile Arg Thr Gly Ala Gln Ala Ala His Val Trp Thr Pro
815 820 825
gcg gca ggg tcg tgc tcc gtc tcc tgc ggg cga ggt ctg atg gag 2520
Ala Ala Gly Ser Cys Ser Val Ser Cys Gly Arg Gly Leu Met Glu
830 835 840
ctg cgt ttc ctg tgc atg gac tct gcc ctc agg gtg cct gtc cag 2565
Leu Arg Phe Leu Cys Met Asp Ser Ala Leu Arg Val Pro Val Gln
845 850 855
gaa gag ctg tgt ggc ctg gca agc aag cct ggg agc cgg cgg gag 2610
Glu Glu Leu Cys Gly Leu Ala Ser Lys Pro Gly Ser Arg Arg Glu
860 865 870
gtc tgc cag gct gtc ccg tgc cct gct cgg tgg cag tac aag ctg 2655
Val Cys Gln Ala Val Pro Cys Pro Ala Arg Trp Gln Tyr Lys Leu
875 880 885
gcg gcc tgc agc gtg agc tgt ggg aga ggg gtc gtg cgg agg atc 2700
Ala Ala Cys Ser Val Ser Cys Gly Arg Gly Val Val Arg Arg Ile
890 895 900
ctg tat tgt gcc cgg gcc cat ggg gag gac gat ggt gag gag atc 2745
Leu Tyr Cys Ala Arg Ala His Gly Glu Asp Asp Gly Glu Glu Ile
905 910 915
ctg ttg gac acc cag tgc cag ggg ctg cct cgc ccg gaa ccc cag 2790
Leu Leu Asp Thr Gln Cys Gln Gly Leu Pro Arg Pro Glu Pro Gln
920 925 930
gag gcc tgc agc ctg gag ccc tgc cca cct agg tgg aaa gtc atg 2835
Glu Ala Cys Ser Leu Glu Pro Cys Pro Pro Arg Trp Lys Val Met
935 940 945
tcc ctt ggc cca tgt tcg gcc agc tgt ggc ctt ggc act gct aga 2880
Ser Leu Gly Pro Cys Ser Ala Ser Cys Gly Leu Gly Thr Ala Arg
950 955 960
cgc tcg gtg gcc tgt gtg cag ctc gac caa ggc cag gac gtg gag 2925
Arg Ser Val Ala Cys Val Gln Leu Asp Gln Gly Gln Asp Val Glu
965 970 975
gtg gac gag gcg gcc tgt gcg gcg ctg gtg cgg ccc gag gcc agt 2970
Val Asp Glu Ala Ala Cys Ala Ala Leu Val Arg Pro Glu Ala Ser
980 985 990
gtc ccc tgt ctc att gcc gac tgc acc tac cgc tgg cat gtt ggc 3015
Val Pro Cys Leu Ile Ala Asp Cys Thr Tyr Arg Trp His Val Gly
995 1000 1005
acc tgg atg gag tgc tct gtt tcc tgt ggg gat ggc atc cag cgc 3060
Thr Trp Met Glu Cys Ser Val Ser Cys Gly Asp Gly Ile Gln Arg
1010 1015 1020
cgg cgt gac acc tgc ctc gga ccc cag gcc cag gcg cct gtg cca 3105
Arg Arg Asp Thr Cys Leu Gly Pro Gln Ala Gln Ala Pro Val Pro
1025 1030 1035
gct gat ttc tgc cag cac ttg ccc aag ccg gtg act gtg cgt ggc 3150
Ala Asp Phe Cys Gln His Leu Pro Lys Pro Val Thr Val Arg Gly
1040 1045 1050
tgc tgg gct ggg ccc tgt gtg gga cag ggt gcc tgt ggc agg cag 3195
Cys Trp Ala Gly Pro Cys Val Gly Gln Gly Ala Cys Gly Arg Gln
1055 1060 1065
cac ctt gag cca aca gga acc att gac atg cga ggc cca ggg cag 3240
His Leu Glu Pro Thr Gly Thr Ile Asp Met Arg Gly Pro Gly Gln
1070 1075 1080
gca gac tgt gca gtg gcc att ggg cgg ccc ctc ggg gag gtg gtg 3285
Ala Asp Cys Ala Val Ala Ile Gly Arg Pro Leu Gly Glu Val Val
1085 1090 1095
acc ctc cgc gtc ctt gag agt tct ctc aac tgc agt gcg ggg gac 3330
Thr Leu Arg Val Leu Glu Ser Ser Leu Asn Cys Ser Ala Gly Asp
1100 1105 1110
atg ttg ctg ctt tgg ggc cgg ctc acc tgg agg aag atg tgc agg 3375
Met Leu Leu Leu Trp Gly Arg Leu Thr Trp Arg Lys Met Cys Arg
1115 1120 1125
aag ctg ttg gac atg act ttc agc tcc aag acc aac acg ctg gtg 3420
Lys Leu Leu Asp Met Thr Phe Ser Ser Lys Thr Asn Thr Leu Val
1130 1135 1140
gtg agg cag cgc tgc ggg cgg cca gga ggt ggg gtg ctg ctg cgg 3465
Val Arg Gln Arg Cys Gly Arg Pro Gly Gly Gly Val Leu Leu Arg
1145 1150 1155
tat ggg agc cag ctt gct cct gaa acc ttc tac aga gaa tgt gac 3510
Tyr Gly Ser Gln Leu Ala Pro Glu Thr Phe Tyr Arg Glu Cys Asp
1160 1165 1170
atg cag ctc ttt ggg ccc tgg ggt gaa atc gtg agc ccc tcg ctg 3555
Met Gln Leu Phe Gly Pro Trp Gly Glu Ile Val Ser Pro Ser Leu
1175 1180 1185
agt cca gcc acg agt aat gca ggg ggc tgc cgg ctc ttc att aat 3600
Ser Pro Ala Thr Ser Asn Ala Gly Gly Cys Arg Leu Phe Ile Asn
1190 1195 1200
gtg gct ccg cac gca cgg att gcc atc cat gcc ctg gcc acc aac 3645
Val Ala Pro His Ala Arg Ile Ala Ile His Ala Leu Ala Thr Asn
1205 1210 1215
atg ggc gct ggg acc gag gga gcc aat gcc agc tac atc ttg atc 3690
Met Gly Ala Gly Thr Glu Gly Ala Asn Ala Ser Tyr Ile Leu Ile
1220 1225 1230
cgg gac acc cac agc ttg agg acc aca gcg ttc cat ggg cag cag 3735
Arg Asp Thr His Ser Leu Arg Thr Thr Ala Phe His Gly Gln Gln
1235 1240 1245
gtg ctc tac tgg gag tca gag agc agc cag gct gag atg gag ttc 3780
Val Leu Tyr Trp Glu Ser Glu Ser Ser Gln Ala Glu Met Glu Phe
1250 1255 1260
agc gag ggc ttc ctg aag gct cag gcc agc ctg cgg ggc cag tac 3825
Ser Glu Gly Phe Leu Lys Ala Gln Ala Ser Leu Arg Gly Gln Tyr
1265 1270 1275
tgg acc ctc caa tca tgg gta ccg gag atg cag gac cct cag tcc 3870
Trp Thr Leu Gln Ser Trp Val Pro Glu Met Gln Asp Pro Gln Ser
1280 1285 1290
tgg aag gga aag gaa gga acc 3891
Trp Lys Gly Lys Glu Gly Thr
1295
<210>18
<211>1378
<212>PRT
<213>人
<400>18
gct gca ggc ggc atc cta cac ctg gag ctg ctg gtg gcc gtg ggc 45
Ala Ala Gly Gly Ile Leu His Leu Glu Leu Leu Val Ala Val Gly
1 5 10 15
ccc gat gtc ttc cag gct cac cag gag gac aca gag cgc tat gtg 90
Pro Asp Val Phe Gln Ala His Gln Glu Asp Thr Glu Arg Tyr Val
20 25 30
ctc acc aac ctc aac atc ggg gca gaa ctg ctt cgg gac ccg tcc 135
Leu Thr Asn Leu Asn Ile Gly Ala Glu Leu Leu Arg Asp Pro Ser
35 40 45
ctg ggg gct cag ttt cgg gtg cac ctg gtg aag atg gtc att ctg 180
Leu Gly Ala Gln Phe Arg Val His Leu Val Lys Met Val Ile Leu
50 55 60
aca gag cct gag ggt gct cca aat atc aca gcc aac ctc acc tcg 225
Thr Glu Pro Glu Gly Ala Pro Asn Ile Thr Ala Asn Leu Thr Ser
65 70 75
tcc ctg ctg agc gtc tgt ggg tgg agc cag acc atc aac cct gag 270
Ser Leu Leu Ser Val Cys Gly Trp Ser Gln Thr Ile Asn Pro Glu
80 85 90
gac gac acg gat cct ggc cat gct gac ctg gtc ctc tat atc act 315
Asp Asp Thr Asp Pro Gly His Ala Asp Leu Val Leu Tyr Ile Thr
95 100 105
agg ttt gac ctg gag ttg cct gat ggt aac cgg cag gtg cgg ggc 360
Arg Phe Asp Leu Glu Leu Pro Asp Gly Asn Arg Gln Val Arg Gly
110 115 120
gtc acc cag ctg ggc ggt gcc tgc tcc cca acc tgg agc tgc ctc 405
Val Thr Gln Leu Gly Gly Ala Cys Ser Pro Thr Trp Ser Cys Leu
125 130 135
att acc gag gac act ggc ttc gac ctg gga gtc acc att gcc cat 450
Ile Thr Glu Asp Thr Gly Phe Asp Leu Gly Val Thr Ile Ala His
140 145 150
gag att ggg cac agc ttc ggc ctg gag cac gac ggc gcg ccc ggc 495
Glu Ile Gly His Ser Phe Gly Leu Glu His Asp Gly Ala Pro Gly
155 160 165
agc ggc tgc ggc ccc agc gga cac gtg atg gct tcg gac ggc gcc 540
Ser Gly Cys Gly Pro Ser Gly His Val Met Ala Ser Asp Gly Ala
170 175 180
gcg ccc cgc gcc ggc ctc gcc tgg tcc ccc tgc agc cgc cgg cag 585
Ala Pro Arg Ala Gly Leu Ala Trp Ser Pro Cys Ser Arg Arg Gln
185 190 195
ctg ctg agc ctg ctc agg acg ggc gcg ctg cgt gtg gga ccc gcc 630
Leu Leu Ser Leu Leu Arg Thr Gly Ala Leu Arg Val Gly Pro Ala
200 205 210
gcg gcc tca acc cgg gtc cgc ggg gca ccc gcc gga tgc gca gcc 675
Ala Ala Ser Thr Arg Val Arg Gly Ala Pro Ala Gly Cys Ala Ala
215 220 225
tgg cct cta cta cag cgc caa cga gca gtg ccg cgt ggc ctt cgg 720
Trp Pro Leu Leu Gln Arg Gln Arg Ala Val Pro Arg Gly Leu Arg
230 235 240
ccc caa ggc tgt cgc ctg cac ctt cgc cag gga gca cct ggt gag 765
Pro Gln Gly Cys Arg Leu His Leu Arg Gln Gly Ala Pro Gly Glu
245 250 255
tct gcc ggc ggt ggc ctg gga ttg gct gtg agg tcc ctc cgc atc 810
Ser Ala Gly Gly Gly Leu Gly Leu Ala Val Arg Ser Leu Arg Ile
260 265 270
acc cag ctc acg tcc ccc caa acg tgc atg gat atg tgc cag gcc 855
Thr Gln Leu Thr Ser Pro Gln Thr Cys Met Asp Met Cys Gln Ala
275 280 285
ctc tcc tgc cac aca gac ccg ctg gac caa agc agc tgc agc cgc 900
Leu Ser Cys His Thr Asp Pro Leu Asp Gln Ser Ser Cys Ser Arg
290 295 300
ctc ctc gtt cct ctc ctg gat ggg aca gaa tgt ggc gtg gag aag 945
Leu Leu Val Pro Leu Leu Asp Gly Thr Glu Cys Gly Val Glu Lys
305 310 315
tgg tgc tcc aag ggt cgc tgc cgc tcc ctg gtg gag ctg acc ccc 990
Trp Cys Ser Lys Gly Arg Cys Arg Ser Leu Val Glu Leu Thr Pro
320 325 330
ata gca gca gtg cat ggg cgc tgg tct agc tgg ggt ccc cga agt 1035
Ile Ala Ala Val His Gly Arg Trp Ser Ser Trp Gly Pro Arg Ser
335 340 345
cct tgc tcc cgc tcc tgc gga gga ggt gtg gtc acc agg agg cgg 1080
Pro Cys Ser Arg Ser Cys Gly Gly Gly Val Val Thr Arg Arg Arg
350 355 360
cag tgc aac aac ccc aga cct gcc ttt ggg ggg cgt gca tgt gtt 1125
Gln Cys Asn Asn Pro Arg Pro Ala Phe Gly Gly Arg Ala Cys Val
365 370 375
ggt gct gac ctc cag gcc gag atg tgc aac act cag gcc tgc gag 1170
Gly Ala Asp Leu Gln Ala Glu Met Cys Asn Thr Gln Ala Cys Glu
380 385 390
aag acc cag ctg gag ttc atg tcg caa cag tgc gcc agg acc gac 1215
Lys Thr Gln Leu Glu Phe Met Ser Gln Gln Cys Ala Arg Thr Asp
395 400 405
ggc cag ccg ctg cgc tcc tcc cct ggc ggc gcc tcc ttc tac cac 1260
Gly Gln Pro Leu Arg Ser Ser Pro Gly Gly Ala Ser Phe Tyr His
410 415 420
tgg ggt gct gct gta cca cac agc caa ggg gat gct ctg tgc aga 1305
Trp Gly Ala Ala Val Pro His Ser Gln Gly Asp Ala Leu Cys Arg
425 430 435
cac atg tgc cgg gcc att ggc gag agc ttc atc atg aag cgt gga 1350
His Met Cys Arg Ala Ile Gly Glu Ser Phe Ile Met Lys Arg Gly
440 445 450
gac agc ttc ctc gat ggg acc cgg tgt atg cca agt ggc ccc cgg 1395
Asp Ser Phe Leu Asp Gly Thr Arg Cys Met Pro Ser Gly Pro Arg
455 460 465
gag gac ggg acc ctg agc ctg tgt gtg tcg ggc agc tgc agg aca 1440
Glu Asp Gly Thr Leu Ser Leu Cys Val Ser Gly Ser Cys Arg Thr
470 475 480
ttt ggc tgt gat ggt agg atg gac tcc cag cag gta tgg gac agg 1485
Phe Gly Cys Asp Gly Arg Met Asp Ser Gln Gln Val Trp Asp Arg
485 490 495
tgc cag gtg tgt ggt ggg gac aac agc acg tgc agc cca cgg aag 1530
Cys Gln Val Cys Gly Gly Asp Asn Ser Thr Cys Ser Pro Arg Lys
500 505 510
ggc tct ttc aca gct ggc aga gcg aga gaa tat gtc acg ttt ctg 1575
Gly Ser Phe Thr Ala Gly Arg Ala Arg Glu Tyr Val Thr Phe Leu
515 520 525
aca gtt acc ccc aac ctg acc agt gtc tac att gcc aac cac agg 1620
Thr Val Thr Pro Asn Leu Thr Ser Val Tyr Ile Ala Asn His Arg
530 535 540
cct ctc ttc aca cac ttg gcg gtg agg atc gga ggg cgc tat gtc 1665
Pro Leu Phe Thr His Leu Ala Val Arg Ile Gly Gly Arg Tyr Val
545 550 555
gtg gct ggg aag atg agc atc tcc cct aac acc acc tac ccc tcc 1710
Val Ala Gly Lys Met Ser Ile Ser Pro Asn Thr Thr Tyr Pro Ser
560 565 570
ctc ctg gag gat ggt cgt gtc gag tac aga gtg gcc ctc acc gag 1755
Leu Leu Glu Asp Gly Arg Val Glu Tyr Arg Val Ala Leu Thr Glu
575 580 585
gac cgg ctg ccc cgc ctg gag gag atc cgc atc tgg gga ccc ctc 1800
Asp Arg Leu Pro Arg Leu Glu Glu Ile Arg Ile Trp Gly Pro Leu
590 595 600
cag gaa gat gct gac atc cag gtt tac agg cgg tat ggc gag gag 1845
Gln Glu Asp Ala Asp Ile Gln Val Tyr Arg Arg Tyr Gly Glu Glu
605 610 615
tat ggc aac ctc acc cgc cca gac atc acc ttc acc tac ttc cag 1890
Tyr Gly Asn Leu Thr Arg Pro Asp Ile Thr Phe Thr Tyr Phe Gln
620 625 630
cct aag cca cgg cag gcc tgg gtg tgg gcc gct gtg cgt ggg ccc 1935
Pro Lys Pro Arg Gln Ala Trp Val Trp Ala Ala Val Arg Gly Pro
635 640 645
tgc tcg gtg agc tgt ggg gca ggg ctg cgc tgg gta aac tac agc 1980
Cys Ser Val Ser Cys Gly Ala Gly Leu Arg Trp Val Asn Tyr Ser
650 655 660
tgc ctg gac cag gcc agg aag gag ttg gtg gag act gtc cag tgc 2025
Cys Leu Asp Gln Ala Arg Lys Glu Leu Val Glu Thr Val Gln Cys
665 670 675
caa ggg agc cag cag cca cca gcg tgg cca gag gcc tgc gtg ctc 2070
Gln Gly Ser Gln Gln Pro Pro Ala Trp Pro Glu Ala Cys Val Leu
680 685 690
gaa ccc tgc cct ccc tac tgg gcg gtg gga gac ttc ggc cca tgc 2115
Glu Pro Cys Pro Pro Tyr Trp Ala Val Gly Asp Phe Gly Pro Cys
695 700 705
agc gcc tcc tgt ggg ggc ggc ctg cgg gag cgg cca gtg cgc tgc 2160
Ser Ala Ser Cys Gly Gly Gly Leu Arg Glu Arg Pro Val Arg Cys
710 715 720
gtg gag gcc cag ggc agc ctc ctg aag aca ttg ccc cca gcc cgg 2205
Val Glu Ala Gln Gly Ser Leu Leu Lys Thr Leu Pro Pro Ala Arg
725 730 735
tgc aga gca ggg gcc cag cag cca gct gtg gcg ctg gaa acc tgc 2250
Cys Arg Ala Gly Ala Gln Gln Pro Ala Val Ala Leu Glu Thr Cys
740 745 750
aac ccc cag ccc tgc cct gcc agg tgg gag gtg tca gag ccc agc 2295
Asn Pro Gln Pro Cys Pro Ala Arg Trp Glu Val Ser Glu Pro Ser
755 760 765
tca tgc aca tca gct ggt gga gca ggc ctg gcc ttg gag aac gag 2340
Ser Cys Thr Ser Ala Gly Gly Ala Gly Leu Ala Leu Glu Asn Glu
770 775 780
acc tgt gtg cca ggg gca gat ggc ctg gag gct cca gtg act gag 2385
Thr Cys Val Pro Gly Ala Asp Gly Leu Glu Ala Pro Val Thr Glu
785 790 795
ggg cct ggc tcc gta gat gag aag ctg cct gcc cct gag ccc tgt 2430
Gly Pro Gly Ser Val Asp Glu Lys Leu Pro Ala Pro Glu Pro Cys
800 805 810
gtc ggg atg tca tgt cct cca ggc tgg ggc cat ctg gat gcc acc 2475
Val Gly Met Ser Cys Pro Pro Gly Trp Gly His Leu Asp Ala Thr
815 820 825
tct gca ggg gag aag gct ccc tcc cca tgg ggc agc atc agg acg 2520
Ser Ala Gly Glu Lys Ala Pro Ser Pro Trp Gly Ser Ile Arg Thr
830 835 840
ggg gct caa gct gca cac gtg tgg acc cct gcg gca ggg tcg tgc 2565
Gly Ala Gln Ala Ala His Val Trp Thr Pro Ala Ala Gly Ser Cys
845 850 855
tcc gtc tcc tgc ggg cga ggt ctg atg gag ctg cgt ttc ctg tgc 2610
Ser Val Ser Cys Gly Arg Gly Leu Met Glu Leu Arg Phe Leu Cys
860 865 870
atg gac tct gcc ctc agg gtg cct gtc cag gaa gag ctg tgt ggc 2655
Met Asp Ser Ala Leu Arg Val Pro Val Gln Glu Glu Leu Cys Gly
875 880 885
ctg gca agc aag cct ggg agc cgg cgg gag gtc tgc cag gct gtc 2700
Leu Ala Ser Lys Pro Gly Ser Arg Arg Glu Val Cys Gln Ala Val
890 895 900
ccg tgc cct gct cgg tgg cag tac aag ctg gcg gcc tgc agc gtg 2745
Pro Cys Pro Ala Arg Trp Gln Tyr Lys Leu Ala Ala Cys Ser Val
905 910 915
agc tgt ggg aga ggg gtc gtg cgg agg atc ctg tat tgt gcc cgg 2790
Ser Cys Gly Arg Gly Val Val Arg Arg Ile Leu Tyr Cys Ala Arg
920 925 930
gcc cat ggg gag gac gat ggt gag gag atc ctg ttg gac acc cag 2835
Ala His Gly Glu Asp Asp Gly Glu Glu Ile Leu Leu Asp Thr Gln
935 940 945
tgc cag ggg ctg cct cgc ccg gaa ccc cag gag gcc tgc agc ctg 2880
Cys Gln Gly Leu Pro Arg Pro Glu Pro Gln Glu Ala Cys Ser Leu
950 955 960
gag ccc tgc cca cct agg tgg aaa gtc atg tcc ctt ggc cca tgt 2925
Glu Pro Cys Pro Pro Arg Trp Lys Val Met Ser Leu Gly Pro Cys
965 970 975
tcg gcc agc tgt ggc ctt ggc act gct aga cgc tcg gtg gcc tgt 2970
Ser Ala Ser Cys Gly Leu Gly Thr Ala Arg Arg Ser Val Ala Cys
980 985 990
gtg cag ctc gac caa ggc cag gac gtg gag gtg gac gag gcg gcc 3015
Val Gln Leu Asp Gln Gly Gln Asp Val Glu Val Asp Glu Ala Ala
995 1000 1005
tgt gcg gcg ctg gtg cgg ccc gag gcc agt gtc ccc tgt ctc att 3060
Cys Ala Ala Leu Val Arg Pro Glu Ala Ser Val Pro Cys Leu Ile
1010 1015 1020
gcc gac tgc acc tac cgc tgg cat gtt ggc acc tgg atg gag tgc 3105
Ala Asp Cys Thr Tyr Arg Trp His Val Gly Thr Trp Met Glu Cys
1025 1030 1035
tct gtt tcc tgt ggg gat ggc atc cag cgc cgg cgt gac acc tgc 3150
Ser Val Ser Cys Gly Asp Gly Ile Gln Arg Arg Arg Asp Thr Cys
1040 1045 1050
ctc gga ccc cag gcc cag gcg cct gtg cca gct gat ttc tgc cag 3195
Leu Gly Pro Gln Ala Gln Ala Pro Val Pro Ala Asp Phe Cys Gln
1055 1060 1065
cac ttg ccc aag ccg gtg act gtg cgt ggc tgc tgg gct ggg ccc 3240
His Leu Pro Lys Pro Val Thr Val Arg Gly Cys Trp Ala Gly Pro
1070 1075 1080
tgt gtg gga cag ggt acg ccc agc ctg gtg ccc cac gaa gaa gcc 3285
Cys Val Gly Gln Gly Thr Pro Ser Leu Val Pro His Glu Glu Ala
1085 1090 1095
gct gct cca gga cgg acc aca gcc acc cct gct ggt gcc tcc ctg 3330
Ala Ala Pro Gly Arg Thr Thr Ala Thr Pro Ala Gly Ala Ser Leu
1100 1105 1110
gag tgg tcc cag gcc cgg ggc ctg ctc ttc tcc ccg gct ccc cag 3375
Glu Trp Ser Gln Ala Arg Gly Leu Leu Phe Ser Pro Ala Pro Gln
1115 1120 1125
cct cgg cgg ctc ctg ccc ggg ccc cag gaa aac tca gtg cag tcc 3420
Pro Arg Arg Leu Leu Pro Gly Pro Gln Glu Asn Ser Val Gln Ser
1130 1135 1140
agt gcc tgt ggc agg cag cac ctt gag cca aca gga acc att gac 3465
Ser Ala Cys Gly Arg Gln His Leu Glu Pro Thr Gly Thr Ile Asp
1145 1150 1155
atg cga ggc cca ggg cag gca gac tgt gca gtg gcc att ggg cgg 3510
Met Arg Gly Pro Gly Gln Ala Asp Cys Ala Val Ala Ile Gly Arg
1160 1165 1170
ccc ctc ggg gag gtg gtg acc ctc cgc gtc ctt gag agt tct ctc 3555
Pro Leu Gly Glu Val Val Thr Leu Arg Val Leu Glu Ser Ser Leu
1175 1180 1185
aac tgc agt gcg ggg gac atg ttg ctg ctt tgg ggc cgg ctc acc 3600
Asn Cys Ser Ala Gly Asp Met Leu Leu Leu Trp Gly Arg Leu Thr
1190 1195 1200
tgg agg aag atg tgc agg aag ctg ttg gac atg act ttc agc tcc 3645
Trp Arg Lys Met Cys Arg Lys Leu Leu Asp Met Thr Phe Ser Ser
1205 1210 1215
aag acc aac acg ctg gtg gtg agg cag cgc tgc ggg cgg cca gga 3690
Lys Thr Asn Thr Leu Val Val Arg Gln Arg Cys Gly Arg Pro Gly
1220 1225 1230
ggt ggg gtg ctg ctg cgg tat ggg agc cag ctt gct cct gaa acc 3735
Gly Gly Val Leu Leu Arg Tyr Gly Ser Gln Leu Ala Pro Glu Thr
1235 1240 1245
ttc tac aga gaa tgt gac atg cag ctc ttt ggg ccc tgg ggt gaa 3780
Phe Tyr Arg Glu Cys Asp Met Gln Leu Phe Gly Pro Trp Gly Glu
1250 1255 1260
atc gtg agc ccc tcg ctg agt cca gcc acg agt aat gca ggg ggc 3825
Ile Val Ser Pro Ser Leu Ser Pro Ala Thr Ser Asn Ala Gly Gly
1265 1270 1275
tgc cgg ctc ttc att aat gtg gct ccg cac gca cgg att gcc atc 3870
Cys Arg Leu Phe Ile Asn Val Ala Pro His Ala Arg Ile Ala Ile
1280 1285 1290
cat gcc ctg gcc acc aac atg ggc gct ggg acc gag gga gcc aat 3915
His Ala Leu Ala Thr Asn Met Gly Ala Gly Thr Glu Gly Ala Asn
1295 1300 1305
gcc agc tac atc ttg atc cgg gac acc cac agc ttg agg acc aca 3960
Ala Ser Tyr Ile Leu Ile Arg Asp Thr His Ser Leu Arg Thr Thr
1310 1315 1320
gcg ttc cat ggg cag cag gtg ctc tac tgg gag tca gag agc agc 4005
Ala Phe His Gly Gln Gln Val Leu Tyr Trp Glu Ser Glu Ser Ser
1325 1330 1335
cag gct gag atg gag ttc agc gag ggc ttc ctg aag gct cag gcc 4050
Gln Ala Glu Met Glu Phe Ser Glu Gly Phe Leu Lys Ala Gln Ala
1340 1345 1350
agc ctg cgg ggc cag tac tgg acc ctc caa tca tgg gta ccg gag 4095
Ser Leu Arg Gly Gln Tyr Trp Thr Leu Gln Ser Trp Val Pro Glu
1355 1360 1365
atg cag gac cct cag tcc tgg aag gga aag gaa gga acc 4134
Met Gln Asp Pro Gln Ser Trp Lys Gly Lys Glu Gly Thr
1370 1375
<210>19
<211>1322
<212>PRT
<213>人
<400>19
gct gca ggc ggc atc cta cac ctg gag ctg ctg gtg gcc gtg ggc 45
Ala Ala Gly Gly Ile Leu His Leu Glu Leu Leu Val Ala Val Gly
1 5 10 15
ccc gat gtc ttc cag gct cac cag gag gac aca gag cgc tat gtg 90
Pro Asp Val Phe Gln Ala His Gln Glu Asp Thr Glu Arg Tyr Val
20 25 30
ctc acc aac ctc aac atc ggg gca gaa ctg ctt cgg gac ccg tcc 135
Leu Thr Asn Leu Asn Ile Gly Ala Glu Leu Leu Arg Asp Pro Ser
35 40 45
ctg ggg gct cag ttt cgg gtg cac ctg gtg aag atg gtc att ctg 180
Leu Gly Ala Gln Phe Arg Val His Leu Val Lys Met Val Ile Leu
50 55 60
aca gag cct gag ggt gct cca aat atc aca gcc aac ctc acc tcg 225
Thr Glu Pro Glu Gly Ala Pro Asn Ile Thr Ala Asn Leu Thr Ser
65 70 75
tcc ctg ctg agc gtc tgt ggg tgg agc cag acc atc aac cct gag 270
Ser Leu Leu Ser Val Cys Gly Trp Ser Gln Thr Ile Asn Pro Glu
80 85 90
gac gac acg gat cct ggc cat gct gac ctg gtc ctc tat atc act 315
Asp Asp Thr Asp Pro Gly His Ala Asp Leu Val Leu Tyr Ile Thr
95 100 105
agg ttt gac ctg gag ttg cct gat ggt aac cgg cag gtg cgg ggc 360
Arg Phe Asp Leu Glu Leu Pro Asp Gly Asn Arg Gln Val Arg Gly
110 115 120
gtc acc cag ctg ggc ggt gcc tgc tcc cca acc tgg agc tgc ctc 405
Val Thr Gln Leu Gly Gly Ala Cys Ser Pro Thr Trp Ser Cys Leu
125 130 135
att acc gag gac act ggc ttc gac ctg gga gtc acc att gcc cat 450
Ile Thr Glu Asp Thr Gly Phe Asp Leu Gly Val Thr Ile Ala His
140 145 150
gag att ggg cac agc ttc ggc ctg gag cac gac ggc gcg ccc ggc 495
Glu Ile Gly His Ser Phe Gly Leu Glu His Asp Gly Ala Pro Gly
155 160 165
agc ggc tgc ggc ccc agc gga cac gtg atg gct tcg gac ggc gcc 540
Ser Gly Cys Gly Pro Ser Gly His Val Met Ala Ser Asp Gly Ala
170 175 180
gcg ccc cgc gcc ggc ctc gcc tgg tcc ccc tgc agc cgc cgg cag 585
Ala Pro Arg Ala Gly Leu Ala Trp Ser Pro Cys Ser Arg Arg Gln
185 190 195
ctg ctg agc ctg ctc agg acg ggc gcg ctg cgt gtg gga ccc gcc 630
Leu Leu Ser Leu Leu Arg Thr Gly Ala Leu Arg Val Gly Pro Ala
200 205 210
gcg gcc tca acc cgg gtc cgc ggg gca ccc gcc gga tgc gca gcc 675
Ala Ala Ser Thr Arg Val Arg Gly Ala Pro Ala Gly Cys Ala Ala
215 220 225
tgg cct cta cta cag cgc caa cga gca gtg ccg cgt ggc ctt cgg 720
Trp Pro Leu Leu Gln Arg Gln Arg Ala Val Pro Arg Gly Leu Arg
230 235 240
ccc caa ggc tgt cgc ctg cac ctt cgc cag gga gca cct ggt gag 765
Pro Gln Gly Cys Arg Leu His Leu Arg Gln Gly Ala Pro Gly Glu
245 250 255
tct gcc ggc ggt ggc ctg gga ttg gct gtg agg tcc ctc cgc atc 810
Ser Ala Gly Gly Gly Leu Gly Leu Ala Val Arg Ser Leu Arg Ile
260 265 270
acc cag ctc acg tcc ccc caa acg tgc atg gat atg tgc cag gcc 855
Thr Gln Leu Thr Ser Pro Gln Thr Cys Met Asp Met Cys Gln Ala
275 280 285
ctc tcc tgc cac aca gac ccg ctg gac caa agc agc tgc agc cgc 900
Leu Ser Cys His Thr Asp Pro Leu Asp Gln Ser Ser Cys Ser Arg
290 295 300
ctc ctc gtt cct ctc ctg gat ggg aca gaa tgt ggc gtg gag aag 945
Leu Leu Val Pro Leu Leu Asp Gly Thr Glu Cys Gly Val Glu Lys
305 310 315
tgg tgc tcc aag ggt cgc tgc cgc tcc ctg gtg gag ctg acc ccc 990
Trp Cys Ser Lys Gly Arg Cys Arg Ser Leu Val Glu Leu Thr Pro
320 325 330
ata gca gca gtg cat ggg cgc tgg tct agc tgg ggt ccc cga agt 1035
Ile Ala Ala Val His Gly Arg Trp Ser Ser Trp Gly Pro Arg Ser
335 340 345
cct tgc tcc cgc tcc tgc gga gga ggt gtg gtc acc agg agg cgg 1080
Pro Cys Ser Arg Ser Cys Gly Gly Gly Val Val Thr Arg Arg Arg
350 355 360
cag tgc aac aac ccc aga cct gcc ttt ggg ggg cgt gca tgt gtt 1125
Gln Cys Asn Asn Pro Arg Pro Ala Phe Gly Gly Arg Ala Cys Val
365 370 375
ggt gct gac ctc cag gcc gag atg tgc aac act cag gcc tgc gag 1170
Gly Ala Asp Leu Gln Ala Glu Met Cys Asn Thr Gln Ala Cys Glu
380 385 390
aag acc cag ctg gag ttc atg tcg caa cag tgc gcc agg acc gac 1215
Lys Thr Gln Leu Glu Phe Met Ser Gln Gln Cys Ala Arg Thr Asp
395 400 405
ggc cag ccg ctg cgc tcc tcc cct ggc ggc gcc tcc ttc tac cac 1260
Gly Gln Pro Leu Arg Ser Ser Pro Gly Gly Ala Ser Phe Tyr His
410 415 420
tgg ggt gct gct gta cca cac agc caa ggg gat gct ctg tgc aga 1305
Trp Gly Ala Ala Val Pro His Ser Gln Gly Asp Ala Leu Cys Arg
425 430 435
cac atg tgc cgg gcc att ggc gag agc ttc atc atg aag cgt gga 1350
His Met Cys Arg Ala Ile Gly Glu Ser Phe Ile Met Lys Arg Gly
440 445 450
gac agc ttc ctc gat ggg acc cgg tgt atg cca agt ggc ccc cgg 1395
Asp Ser Phe Leu Asp Gly Thr Arg Cys Met Pro Ser Gly Pro Arg
455 460 465
gag gac ggg acc ctg agc ctg tgt gtg tcg ggc agc tgc agg aca 1440
Glu Asp Gly Thr Leu Ser Leu Cys Val Ser Gly Ser Cys Arg Thr
470 475 480
ttt ggc tgt gat ggt agg atg gac tcc cag cag gta tgg gac agg 1485
Phe Gly Cys Asp Gly Arg Met Asp Ser Gln Gln Val Trp Asp Arg
485 490 495
tgc cag gtg tgt ggt ggg gac aac agc acg tgc agc cca cgg aag 1530
Cys Gln Val Cys Gly Gly Asp Asn Ser Thr Cys Ser Pro Arg Lys
500 505 510
ggc tct ttc aca gct ggc aga gcg aga gaa tat gtc acg ttt ctg 1575
Gly Ser Phe Thr Ala Gly Arg Ala Arg Glu Tyr Val Thr Phe Leu
515 520 525
aca gtt acc ccc aac ctg acc agt gtc tac att gcc aac cac agg 1620
Thr Val Thr Pro Asn Leu Thr Ser Val Tyr Ile Ala Asn His Arg
530 535 540
cct ctc ttc aca cac ttg gcg gtg agg atc gga ggg cgc tat gtc 1665
Pro Leu Phe Thr His Leu Ala Val Arg Ile Gly Gly Arg Tyr Val
545 550 555
gtg gct ggg aag atg agc atc tcc cct aac acc acc tac ccc tcc 1710
Val Ala Gly Lys Met Ser Ile Ser Pro Asn Thr Thr Tyr Pro Ser
560 565 570
ctc ctg gag gat ggt cgt gtc gag tac aga gtg gcc ctc acc gag 1755
Leu Leu Glu Asp Gly Arg Val Glu Tyr Arg Val Ala Leu Thr Glu
575 580 585
gac cgg ctg ccc cgc ctg gag gag atc cgc atc tgg gga ccc ctc 1800
Asp Arg Leu Pro Arg Leu Glu Glu Ile Arg Ile Trp Gly Pro Leu
590 595 600
cag gaa gat gct gac atc cag gtt tac agg cgg tat ggc gag gag 1845
Gln Glu Asp Ala Asp Ile Gln Val Tyr Arg Arg Tyr Gly Glu Glu
605 610 615
tat ggc aac ctc acc cgc cca gac atc acc ttc acc tac ttc cag 1890
Tyr Gly Asn Leu Thr Arg Pro Asp Ile Thr Phe Thr Tyr Phe Gln
620 625 630
cct aag cca cgg cag gcc tgg gtg tgg gcc gct gtg cgt ggg ccc 1935
Pro Lys Pro Arg Gln Ala Trp Val Trp Ala Ala Val Arg Gly Pro
635 640 645
tgc tcg gtg agc tgt ggg gca ggg ctg cgc tgg gta aac tac agc 1980
Cys Ser Val Ser Cys Gly Ala Gly Leu Arg Trp Val Asn Tyr Ser
650 655 660
tgc ctg gac cag gcc agg aag gag ttg gtg gag act gtc cag tgc 2025
Cys Leu Asp Gln Ala Arg Lys Glu Leu Val Glu Thr Val Gln Cys
665 670 675
caa ggg agc cag cag cca cca gcg tgg cca gag gcc tgc gtg ctc 2070
Gln Gly Ser Gln Gln Pro Pro Ala Trp Pro Glu Ala Cys Val Leu
680 685 690
gaa ccc tgc cct ccc tac tgg gcg gtg gga gac ttc ggc cca tgc 2115
Glu Pro Cys Pro Pro Tyr Trp Ala Val Gly Asp Phe Gly Pro Cys
695 700 705
agc gcc tcc tgt ggg ggc ggc ctg cgg gag cgg cca gtg cgc tgc 2160
Ser Ala Ser Cys Gly Gly Gly Leu Arg Glu Arg Pro Val Arg Cys
710 715 720
gtg gag gcc cag ggc agc ctc ctg aag aca ttg ccc cca gcc cgg 2205
Val Glu Ala Gln Gly Ser Leu Leu Lys Thr Leu Pro Pro Ala Arg
725 730 735
tgc aga gca ggg gcc cag cag cca gct gtg gcg ctg gaa acc tgc 2250
Cys Arg Ala Gly Ala Gln Gln Pro Ala Val Ala Leu Glu Thr Cys
740 745 750
aac ccc cag ccc tgc cct gcc agg tgg gag gtg tca gag ccc agc 2295
Asn Pro Gln Pro Cys Pro Ala Arg Trp Glu Val Ser Glu Pro Ser
755 760 765
tca tgc aca tca gct ggt gga gca ggc ctg gcc ttg gag aac gag 2340
Ser Cys Thr Ser Ala Gly Gly Ala Gly Leu Ala Leu Glu Asn Glu
770 775 780
acc tgt gtg cca ggg gca gat ggc ctg gag gct cca gtg act gag 2385
Thr Cys Val Pro Gly Ala Asp Gly Leu Glu Ala Pro Val Thr Glu
785 790 795
ggg cct ggc tcc gta gat gag aag ctg cct gcc cct gag ccc tgt 2430
Gly Pro Gly Ser Val Asp Glu Lys Leu Pro Ala Pro Glu Pro Cys
800 805 810
gtc ggg atg tca tgt cct cca ggc tgg ggc cat ctg gat gcc acc 2475
Val Gly Met Ser Cys Pro Pro Gly Trp Gly His Leu Asp Ala Thr
815 820 825
tct gca ggg gag aag gct ccc tcc cca tgg ggc agc atc agg acg 2520
Ser Ala Gly Glu Lys Ala Pro Ser Pro Trp Gly Ser Ile Arg Thr
830 835 840
ggg gct caa gct gca cac gtg tgg acc cct gcg gca ggg tcg tgc 2565
Gly Ala Gln Ala Ala His Val Trp Thr Pro Ala Ala Gly Ser Cys
845 850 855
tcc gtc tcc tgc ggg cga ggt ctg atg gag ctg cgt ttc ctg tgc 2610
Ser Val Ser Cys Gly Arg Gly Leu Met Glu Leu Arg Phe Leu Cys
860 865 870
atg gac tct gcc ctc agg gtg cct gtc cag gaa gag ctg tgt ggc 2655
Met Asp Ser Ala Leu Arg Val Pro Val Gln Glu Glu Leu Cys Gly
875 880 885
ctg gca agc aag cct ggg agc cgg cgg gag gtc tgc cag gct gtc 2700
Leu Ala Ser Lys Pro Gly Ser Arg Arg Glu Val Cys Gln Ala Val
890 895 900
ccg tgc cct gct cgg tgg cag tac aag ctg gcg gcc tgc agc gtg 2745
Pro Cys Pro Ala Arg Trp Gln Tyr Lys Leu Ala Ala Cys Ser Val
905 910 915
agc tgt ggg aga ggg gtc gtg cgg agg atc ctg tat tgt gcc cgg 2790
Ser Cys Gly Arg Gly Val Val Arg Arg Ile Leu Tyr Cys Ala Arg
920 925 930
gcc cat ggg gag gac gat ggt gag gag ate ctg ttg gac acc cag 2835
Ala His Gly Glu Asp Asp Gly Glu Glu Ile Leu Leu Asp Thr Gln
935 940 945
tgc cag ggg ctg cct cgc ccg gaa ccc cag gag gcc tgc agc ctg 2880
Cys Gln Gly Leu Pro Arg Pro Glu Pro Gln Glu Ala Cys Ser Leu
950 955 960
gag ccc tgc cca cct agg tgg aaa gtc atg tcc ctt ggc cca tgt 2925
Glu Pro Cys Pro Pro Arg Trp Lys Val Met Ser Leu Gly Pro Cys
965 970 975
tcg gcc agc tgt ggc ctt ggc act gct aga cgc tcg gtg gcc tgt 2970
Ser Ala Ser Cys Gly Leu Gly Thr Ala Arg Arg Ser Val Ala Cys
980 985 990
gtg cag crc gac caa ggc cag gac gtg gag gtg gac gag gcg gcc 3015
Val Gln Leu Asp Gln Gly Gln Asp Val Glu Val Asp Glu Ala Ala
995 1000 1005
tgt gcg gcg ctg gtg cgg ccc gag gcc agt gtc ccc tgt ctc att 3060
Cys Ala Ala Leu Val Arg Pro Glu Ala Ser Val Pro Cys Leu Ile
1010 1015 1020
gcc gac tgc acc tac cgc tgg cat gtt ggc acc tgg atg gag tgc 3105
Ala Asp Cys Thr Tyr Arg Trp His Val Gly Thr Trp Met Glu Cys
1025 1030 1035
tct gtt tcc tgt ggg gat ggc atc cag cgc cgg cgt gac acc tgc 3150
Ser Val Ser Cys Gly Asp Gly Ile Gln Arg Arg Arg Asp Thr Cys
1040 1045 1050
ctc gga ccc cag gcc cag gcg cct gtg cca gct gat ttc tgc cag 3195
Leu Gly Pro Gln Ala Gln Ala Pro Val Pro Ala Asp Phe Cys Gln
1055 1060 1065
cac ttg ccc aag ccg gtg act gtg cgt ggc tgc tgg gct ggg ccc 3240
His Leu Pro Lys Pro Val Thr Val Arg Gly Cys Trp Ala Gly Pro
1070 1075 1080
tgt gtg gga cag ggt gcc tgt ggc agg cag cac ctt gag cca aca 3285
Cys Val Gly Gln Gly Ala Cys Gly Arg Gln His Leu Glu Pro Thr
1085 1090 1095
gga acc att gac atg cga ggc cca ggg cag gca gac tgt gca gtg 3330
Gly Thr Ile Asp Met Arg Gly Pro Gly Gln Ala Asp Cys Ala Val
1100 1105 1110
gcc att ggg cgg ccc ctc ggg gag gtg gtg acc ctc cgc gtc ctt 3375
Ala Ile Gly Arg Pro Leu Gly Glu Val Val Thr Leu Arg Val Leu
1115 1120 1125
gag agt tct ctc aac tgc agt gcg ggg gac atg ttg ctg ctt tgg 3420
Glu Ser Ser Leu Asn Cys Ser Ala Gly Asp Met Leu Leu Leu Trp
1130 1135 1140
ggc cgg ctc acc tgg agg aag atg tgc agg aag ctg ttg gac atg 3465
Gly Arg Leu Thr Trp Arg Lys Met Cys Arg Lys Leu Leu Asp Met
1145 1150 1155
act ttc agc tcc aag acc aac acg ctg gtg gtg agg cag cgc tgc 3510
Thr Phe Ser Ser Lys Thr Asn Thr Leu Val Val Arg Gln Arg Cys
1160 1165 1170
ggg cgg cca gga ggt ggg gtg ctg ctg cgg tat ggg agc cag ctt 3555
Gly Arg Pro Gly Gly Gly Val Leu Leu Arg Tyr Gly Ser Gln Leu
1175 1180 1185
gct cct gaa acc ttc tac aga gaa tgt gac atg cag ctc ttt ggg 3600
Ala Pro Glu Thr Phe Tyr Arg Glu Cys Asp Met Gln Leu Phe Gly
1190 1195 1200
ccc tgg ggt gaa atc gtg agc ccc tcg ctg agt cca gcc acg agt 3645
Pro Trp Gly Glu Ile Val Ser Pro Ser Leu Ser Pro Ala Thr Ser
1205 1210 1215
aat gca ggg ggc tgc cgg ctc ttc att aat gtg gct ccg cac gca 3690
Asn Ala Gly Gly Cys Arg Leu Phe Ile Asn Val Ala Pro His Ala
1220 1225 1230
cgg att gcc atc cat gcc ctg gcc acc aac atg ggc gct ggg acc 3735
Arg Ile Ala Ile His Ala Leu Ala Thr Asn Met Gly Ala Gly Thr
1235 1240 1245
gag gga gcc aat gcc agc tac atc ttg atc cgg gac acc cac agc 3780
Glu Gly Ala Asn Ala Ser Tyr Ile Leu Ile Arg Asp Thr His Ser
1250 1255 1260
ttg agg acc aca gcg ttc cat ggg cag cag gtg ctc tac tgg gag 3825
Leu Arg Thr Thr Ala Phe His Gly Gln Gln Val Leu Tyr Trp Glu
1265 1270 1275
tca gag agc agc cag gct gag atg gag ttc agc gag ggc ttc ctg 3870
Ser Glu Ser Ser Gln Ala Glu Met Glu Phe Ser Glu Gly Phe Leu
1280 1285 1290
aag gct cag gcc agc ctg cgg ggc cag tac tgg acc ctc caa tca 3915
Lys Ala Gln Ala Ser Leu Arg Gly Gln Tyr Trp Thr Leu Gln Ser
1295 1300 1305
tgg gta ccg gag atg cag gac cct cag tcc tgg aag gga aag gaa 3960
Trp Val Pro Glu Met Gln Asp Pro Gln Ser Trp Lys Gly Lys Glu
1310 1315 1320
gga acc 3966
Gly Thr
<210>20
<211>312
<212>PRT
<213>人
<400>20
gct gca ggc ggc atc cta cac ctg gag ctg ctg gtg gcc gtg ggc 45
Ala Ala Gly Gly Ile Leu His Leu Glu Leu Leu Val Ala Val Gly
1 5 10 15
ccc gat gtc ttc cag gct cac cag gag gac aca gag cgc tat gtg 90
Pro Asp Val Phe Gln Ala His Gln Glu Asp Thr Glu Arg Tyr Val
20 25 30
ctc acc aac ctc aac atc ggg gca gaa ctg ctt cgg gac ccg tcc 135
Leu Thr Asn Leu Asn Ile Gly Ala Glu Leu Leu Arg Asp Pro Ser
35 40 45
ctg ggg gct cag ttt cgg gtg cac ctg gtg aag atg gtc att ctg 180
Leu Gly Ala Gln Phe Arg Val His Leu Val Lys Met Val Ile Leu
50 55 60
aca gag cct gag ggt gct cca aat atc aca gcc aac ctc acc tcg 225
Thr Glu Pro Glu Gly Ala Pro Asn Ile Thr Ala Asn Leu Thr Ser
65 70 75
tcc ctg ctg agc gtc tgt ggg tgg agc cag acc atc aac cct gag 270
Ser Leu Leu Ser Val Cys Gly Trp Ser Gln Thr Ile Asn Pro Glu
80 85 90
gac gac acg gat cct ggc cat gct gac ctg gtc ctc tat atc act 315
Asp Asp Thr Asp Pro Gly His Ala Asp Leu Val Leu Tyr Ile Thr
95 100 105
agg ttt gac ctg gag ttg cct gat ggt aac cgg cag gtg cgg ggc 360
Arg Phe Asp Leu Glu Leu Pro Asp Gly Asn Arg Gln Val Arg Gly
110 115 120
gtc acc cag ctg ggc ggt gcc tgc tcc cca acc tgg agc tgc ctc 405
Val Thr Gln Leu Gly Gly Ala Cys Ser Pro Thr Trp Ser Cys Leu
125 130 135
att acc gag gac act ggc ttc gac ctg gga gtc acc att gcc cat 450
Ile Thr Glu Asp Thr Gly Phe Asp Leu Gly Val Thr Ile Ala His
140 145 150
gag att ggg cac agc ttc ggc ctg gag cac gac ggc gcg ccc ggc 495
Glu Ile Gly His Ser Phe Gly Leu Glu His Asp Gly Ala Pro Gly
155 160 165
agc ggc tgc ggc ccc agc gga cac gtg atg gct tcg gac ggc gcc 540
Ser Gly Cys Gly Pro Ser Gly His Val Met Ala Ser Asp Gly Ala
170 175 180
gcg ccc cgc gcc ggc ctc gcc tgg tcc ccc tgc agc cgc cgg cag 585
Ala Pro Arg Ala Gly Leu Ala Trp Ser Pro Cys Ser Arg Arg Gln
185 190 195
ctg ctg agc ctg ctc agg acg ggc gcg ctg cgt gtg gga ccc gcc 630
Leu Leu Ser Leu Leu Arg Thr Gly Ala Leu Arg Val Gly Pro Ala
200 205 210
gcg gcc tca acc cgg gtc cgc ggg gca ccc gcc gga tgc gca gcc 675
Ala Ala Ser Thr Arg Val Arg Gly Ala Pro Ala Gly Cys Ala Ala
215 220 225
tgg cct cta cta cag cgc caa cga gca gtg ccg cgt ggc ctt cgg 720
Trp Pro Leu Leu Gln Arg Gln Arg Ala Val Pro Arg Gly Leu Arg
230 235 240
ccc caa ggc tgt cgc ctg cac ctt cgc cag gga gca cct gga tat 765
Pro Gln Gly Cys Arg Leu His Leu Arg Gln Gly Ala Pro Gly Tyr
245 250 255
gtg cca ggc cct ctc ctg cca cac aga ccc gct gga cca aag cag 810
Val Pro Gly Pro Leu Leu Pro His Arg Pro Ala Gly Pro Lys Gln
260 265 270
ctg cag ccg cct cct cgt tcc tct cct gga tgg gac aga atg tgg 855
Leu Gln Pro Pro Pro Arg Ser Ser Pro Gly Trp Asp Arg Met Trp
275 280 285
cgt gga gaa gtg gtg ctc caa ggg tcg ctg ccg ctc cct ggt gga 900
Arg Gly Glu Val Val Leu Gln Gly Ser Leu Pro Leu Pro Gly Gly
290 295 300
gct gac ccc cat agc agc agt gca tgg gcg ctg gtc 936
Ala Asp Pro His Ser Ser Ser Ala Trp Ala Leu Val
305 310
<210>21
<211>270
<212>PRT
<213>人
<400>21
gct gca ggc ggc atc cta cac ctg gag ctg ctg gtg gcc gtg ggc 45
Ala Ala Gly Gly Ile Leu His Leu Glu Leu Leu Val Ala Val Gly
1 5 10 15
ccc gat gtc ttc cag gct cac cag gag gac aca gag cgc tat gtg 90
Pro Asp Val Phe Gln Ala His Gln Glu Asp Thr Glu Arg Tyr Val
20 25 30
ctc acc aac ctc aac atc ggg gca gaa ctg ctt cgg gac ccg tcc 135
Leu Thr Asn Leu Asn Ile Gly Ala Glu Leu Leu Arg Asp Pro Ser
35 40 45
ctg ggg gct cag ttt cgg gtg cac ctg gtg aag atg gtc att ctg 180
Leu Gly Ala Gln Phe Arg Val His Leu Val Lys Met Val Ile Leu
50 55 60
aca gag cct gag ggt gct cca aat atc aca gcc aac ctc acc tcg 225
Thr Glu Pro Glu Gly Ala Pro Asn Ile Thr Ala Asn Leu Thr Ser
65 70 75
tcc ctg ctg agc gtc tgt ggg tgg agc cag acc atc aac cct gag 270
Ser Leu Leu Ser Val Cys Gly Trp Ser Gln Thr Ile Asn Pro Glu
80 85 90
gac gac acg gat cct ggc cat gct gac ctg gtc ctc tat atc act 315
Asp Asp Thr Asp Pro Gly His Ala Asp Leu Val Leu Tyr Ile Thr
95 100 105
agg ttt gac ctg gag ttg cct gat ggt aac cgg cag gtg cgg ggc 360
Arg Phe Asp Leu Glu Leu Pro Asp Gly Asn Arg Gln Val Arg Gly
110 115 120
gtc acc cag ctg ggc ggt gcc tgc tcc cca acc tgg agc tgc ctc 405
Val Thr Gln Leu Gly Gly Ala Cys Ser Pro Thr Trp Ser Cys Leu
125 130 135
att acc gag gac act ggc ttc gac ctg gga gtc acc att gcc cat 450
Ile Thr Glu Asp Thr Gly Phe Asp Leu Gly Val Thr Ile Ala His
140 145 150
gag att ggg cac agc ttc ggc ctg gag cac gac ggc gcg ccc ggc 495
Glu Ile Gly His Ser Phe Gly Leu Glu His Asp Gly Ala Pro Gly
155 160 165
agc ggc tgc ggc ccc agc gga cac gtg atg gct tcg gac ggc gcc 540
Ser Gly Cys Gly Pro Ser Gly His Val Met Ala Ser Asp Gly Ala
170 175 180
gcg ccc cgc gcc ggc ctc gcc tgg tcc ccc tgc agc cgc cgg cag 585
Ala Pro Arg Ala Gly Leu Ala Trp Ser Pro Cys Ser Arg Arg Gln
185 190 195
ctg ctg agc ctg ctc aga ccc gtc cct ccg tcg ccg ctc cct ctg 630
Leu Leu Ser Leu Leu Arg Pro Val Pro Pro Ser Pro Leu Pro Leu
200 205 210
ctg gcc acc cac ctc tgc gcc ggc agg agc ctt agt ctt ggt ccc 675
Leu Ala Thr His Leu Cys Ala Gly Arg Ser Leu Ser Leu Gly Pro
215 220 225
agc caa gag ccg gct cct ggt ggg ggg cgc ggg ccg aga act cct 720
Ser Gln Glu Pro Ala Pro Gly Gly Gly Arg Gly Pro Arg Thr Pro
230 235 240
gtt ccc act cac aaa agg cca cgc ttc caa acg ctt cca tcc tcg 765
Val Pro Thr His Lys Arg Pro Arg Phe Gln Thr Leu Pro Ser Ser
245 250 255
tgc cca ctc ctc cgt ccc gcc tcc tcc cgg tgt aca ccc cgg gac 810
Cys Pro Leu Leu Arg Pro Ala Ser Ser Arg Cys Thr Pro Arg Asp
260 265 270
<210>22
<211>43
<212>DNA
<213>人
<400>22
ggactcgagc caccaatgca ccagcgtcac ccccgggcaa gat 43
<210>23
<211>45
<212>DNA
<213>人
<400>23
tccgtcgact cattatcagg ttccttcctt tcccttccag gactg 45
<210>24
<211>30
<212>DNA
<213>人
<400>24
ggttggcaat gtagacactg gtcaggttgg 30
<210>25
<211>30
<212>DNA
<213>人
<400>25
ccaacctgac cagtgtctac attgccaacc 30
<210>26
<211>30
<212>DNA
<213>人
<400>26
ctttccacct aggtgggcag ggctccaggc 30
<210>27
<211>30
<212>DNA
<213>人
<400>27
gcctggagcc ctgcccacct aggtggaaag 30
<210>28
<211>33
<212>DNA
<213>人
<400>28
tcgagaaaaa gtctacgggg gcctaggttt tta 33
<210>29
<211>33
<212>DNA
<213>人
<400>29
agcttaaaaa cctaggcccc cgtagacttt ttc 33
<210>30
<211>30
<212>DNA
<213>人
<400>30
tcggccatgg ccgcaggcgg catcctacac 30
<210>31
<211>28
<212>DNA
<213>人
<400>31
ggcaagctta tcagcggggc gcggcgcc 28
<210>32
<211>564
<212>DNA
<213>人
<400>32
ccatggccgc aggcggcatc ctacacctgg agctgctggt ggccgtgggc cccgatgtct 60
tccaggctca ccaggaggac acagagcgct atgtgctcac caacctcaac atcggggcag 120
aactgcttcg ggacccgtcc ctgggggctc agtttcgggt gcacctggtg aagatggtca 180
ttctgacaga gcctgagggt gctccaaata tcacagccaa cctcacctcg tccctgctga 240
gcgtctgtgg gtggagccag accatcaacc ctgaggacga cacggatcct ggccatgctg 300
acctggtcct ctatatcact aggtttgacc tggagttgcc tgatggtaac cggcaggtgc 360
ggggcgtcac ccagctgggc ggtgcctgct ccccaacctg gagctgcctc attaccgagg 420
acactggctt cgacctggga gtcaccattg cccatgagat tgggcacagc ttcggcctgg 480
agcacgacgg cgcgcccggc agcggctgcg gccccagcgg acacgtgatg gcttcggacg 540
gcgccgcgcc ccgctgataa gctt 564
<210>33
<211>184
<212>PRT
<213>人
<400>33
Met Ala Ala Gly Gly Ile Leu His Leu Glu Leu Leu Val Ala Val
1 5 10 15
Gly Pro Asp Val Phe Gln Ala His Gln Glu Asp Thr Glu Arg Tyr
20 25 30
Val Leu Thr Asn Leu Asn Ile Gly Ala Glu Leu Leu Arg Asp Pro
35 40 45
Ser Leu Gly Ala Gln Phe Arg Val His Leu Val Lys Met Val Ile
50 55 60
Leu Thr Glu Pro Glu Gly Ala Pro Asn Ile Thr Ala Asn Leu Thr
65 70 75
Ser Ser Leu Leu Ser Val Cys Gly Trp Ser Gln Thr Ile Asn Pro
80 85 90
Glu Asp Asp Thr Asp Pro Gly His Ala Asp Leu Val Leu Tyr Ile
95 100 105
Thr Arg Phe Asp Leu Glu Leu Pro Asp Gly Asn Arg Gln Val Arg
110 115 120
Gly Val Thr Gln Leu Gly Gly Ala Cys Ser Pro Thr Trp Ser Cys
125 130 135
Leu Ile Thr Glu Asp Thr Gly Phe Asp Leu Gly Val Thr Ile Ala
140 145 150
His Glu Ile Gly His Ser Phe Gly Leu Glu His Asp Gly Ala Pro
155 160 165
Gly Ser Gly Cys Gly Pro Ser Gly His Val Met Ala Ser Asp Gly
170 175 180
Ala Ala Pro Arg
185
<210>34
<211>2529
<212>DNA
<213>Mus musculus
<400>34
atgagccagc tttgcctgtg gttgacgtgc cagccttgtt atgctgtcag 50
tgtcagagga atcctcactg gtgccatctt cattctgggc tgctgggggc 100
tctctgactt ccagaagagt cttcttcaag atctggagcc caaggatgtg 150
tcttcttact ttggccacca tgctgctcca ttcacaggcc atcctccctc 200
tcacctccag agactgagac ggagaaggac tttggaggac attctgcacc 250
tggaactcct ggtagctgtg ggccccgatg tttcccgggc tcatcaggag 300
gacacagaac gctacgtgct cactaatctc aatatcgggt cagaactgtt 350
gagaaaccca tccctgggag tccagttcca ggtgcacctg gtgaagctaa 400
tcaccctctc tgactcagag agtactccga atatcacggc caacatcacc 450
tcatccttga tgagcgtctg cgagtggagc cagacgatca acccccacga 500
tgacagggat ccaagtcacg ctgacctgat tctctatatc accagcaacg 550
tggctggtgc cactgtcctt gtgattcatt ttctcttatc aaggtttgac 600
ctggagttgc ctgatggcaa ccagcaggtt cggggtgtca cccagctggg 650
aggtgcctgc tccctttcct ggagttgcct tatcactgag gatactggct 700
ttgacctggg ggtcaccatc gcccatgaga ttgggcacag cttcgggctg 750
gaccatgatg gtgctccagg tagtggcagc acctgcaagg ccagtggcca 800
cgtgatggcg gctgatggcg caacacctac tggagggacc ctggagtggt 850
ctgcctgcag ccaaaggcag ttgcagcacc tactcagcac agggcaaatg 900
cactgcttcc aggacccacc tgggctgcag tcaggactta cacggcacca 950
gctgatggca cagcctggcc tctactacag tgcagatgat cagtgccgtg 1000
tggctttcgg ttctggggct gtcgcctgca ccttctccag ggagggtctg 1050
aacacagcac tcagtggtcc ttccaccttg atcctgtccg cagacccctg 1100
ccagaagtcc tggatggctc ctgaagctct caaattctcc ttctccacca 1150
aatccgacat ctggtctctg ggctgcatca ttctagacat ggccacttgc 1200
tccttcctga acgacacaga agccatgcaa ctgcggaagg ccatccgcca 1250
tcatccaggc agcctgaagc ccatcctgaa aaccatggag gagaagcaaa 1300
tccctggtac agatgtctac tatttgcttc tgcccttcat gttgcatatc 1350
aacccctccg atcgactggc aatcaaggat gtgatgcaag tcaccttcat 1400
gagcaactcc ttcaaaagct cctctgttgc gctgaatatg cagcggcaga 1450
aggtccccat cttcatcact gacgtgctgc ttgaaggcaa catggccaac 1500
atcttaggtg atggcagctg gctgtgtgct tcctttgtga acgacagcag 1550
gcactgtgac tcagggattg gctcgcagag acttgggttt gattttcagt 1600
cagtctcttg gacagagcac cctctgaaag atgtcatgca gaatttctcc 1650
agtcgaccag aggtccagct cagagccatt aacaagttgt tgacaatgcc 1700
agaggaccag ctagcactgg caaaggaccc agaagctgag atcccaagga 1750
gcagtttgat catctccttc ctgatggata ccttgcggag ccatcctaac 1800
tctgaaaggc ttgttaatgt ggtctacaac gtgcttgcca ttatttccag 1850
ccaaggacag atctcagaag agctggaaga ggaggggttg tttcagcttg 1900
cccaagagaa cctggagcac ttccaagagg acagggacat ctgcctctct 1950
atcctgagcc tgctctggtc cctcctggta gatgttgtca ctgtggacaa 2000
agagcccttg gagcagctct ctggcatggt cacctgggtg ctggctactc 2050
atccggagga cgtggaaata gcagaggctg gctgtgcggt gctctggctg 2100
ctgtccttgt tgggctgcat aaaggagagt cagtttgagc aggtggtagt 2150
gctgctcctg agaagcatcc agctgtgccc tggcagagta ctgctggtga 2200
acaatgcatt ccgtggcttg gccagcctcg caaaggtgtc cggcccaccc 2250
tcacagttag agccaaatga ctgggtatcc agccccagcc cccttttgtg 2300
gaatcagaga cttcactatg tgaacaagca aaagctgttc atgcctctgt 2350
gggtgctgag gcaagagcac cctcattact gctgtgctaa tgaccctaca 2400
tcagagcaca tccaggcagt actaagtgga ctaaatgggt ttgaaaagaa 2450
gcacagttgt gtggaatctt gtgtggaatg tggctgcagg cagcaggaga 2500
agaatagagg aggagcccca gggatttga 2529
<210>35
<211>2514
<212>DNA
<213>Mus musculus
<400>35
aggaagctcc caagagtaaa cactgcctga tgtcccgccc agccagcaag 50
tgaacattgc acactaacca gaatcccagt cactagggct cctgtccggc 100
catcaactgc cttttctaaa gatgagccag ctttgcctgt ggttgacgtg 150
ccagccttgt tatgctgtca gtgtcagagg aatcctcact ggtgccatct 200
tcattctggg ctgctggggg ctctctgact tccagaagag tcttcttcaa 250
gatctggagc ccaaggatgt gtcttcttac tttggccacc atgctgctcc 300
attcacaggc catcctccct ctcacctcca gagactgaga cggagaagga 350
ctttggagga cattctgcac ctggaactcc tggtagctgt gggccccgat 400
gtttcccggg ctcatcagga ggacacagaa cgctacgtgc tcactaatct 450
caatatcggg tcagaactgt tgagaaaccc atccctggga gtccagttcc 500
aggtgcacct ggtgaagcta atcaccctct ctgactcaga gagtactccg 550
aatatcacgg ccaacatcac ctcatccttg atgagcgtct gcgagtggag 600
ccagacgatc aacccccacg atgacaggga tccaagtcac gctgacctga 650
ttctctatat caccaggttt gacctggagt tgcctgatgg caaccagcag 700
gttcggggtg tcacccagct gggaggtgcc tgctcccttt cctggagttg 750
ccttatcact gaggatactg gctttgacct gggggtcacc atcgcccatg 800
agattgggca cagcttcggg ctggaccatg atggtgctcc aggtagtggc 850
agcacctgca aggccagtgg ccacgtgatg gcggctgatg gcgcaacacc 900
tactggaggg accctggagt ggtctgcctg cagccaaagg cagttgcagc 950
acctactcag cacagggcag atgcactgct tccaggaccc acctgggctg 1000
cagtcaggac ttacacggca ccagctgatg gcacagcctg gcctctacta 1050
cagtgcagat gatcagtgcc gtgtggcttt cggttctggg gctgtcgcct 1100
gcaccttctc cagggagggt ctggatgtat gccaggccct gtcctgccac 1150
acagaccccc tggaccaaag cagctgcagc cgcctccttg ttcctctcct 1200
ggatgggaca ggatgtggtg tggagaagtg gtgctccaag gctcgctgtc 1250
gctccctagc tgagctggct cctgtggctg cagtacatgg acactggtct 1300
agctggggcc cccatagtcc ctgctcccga tcctgtggag gaggtgtgat 1350
taccaggagg cggtggtgca acaaccccag gcctgcattt gggggacgtg 1400
catgtgtggg tgaagacctc caggctaaga tgtgcaacac gcaggcttgt 1450
gagaagactc agctggagtt catgtccgag cagtgtgccc agacagacag 1500
acaaccactg caactttccc aaggcactgc ctccttctac cactgggatg 1550
ctgctgtgca gtatagtcaa ggagataccc tgtgcagaca catgtgctgg 1600
gctgttggag aaagcttcat tgtcagccgt ggggacaggt tcctagatgg 1650
gacccgttgt gtgccaagtg gtccccagga tgatgggacc ctaagcctct 1700
gtttgttggg cagctgcagg acctttggct gtgatggcag gatggactcc 1750
cagaaggttt gggatgcgtg ccaggtgtgt ggaggagaca acagcacctg 1800
cagctcacgg aatggttctt tcacagctgg gagagccaga gaatatgtca 1850
cgttcctgat tgttactccc aacatgacca acgcacacat tgtcaaccgc 1900
aggcctctct tcacacactt ggcggtgagg atccagggcc actacattgt 1950
ggcagggaag actagcatct cacccaacac cacctaccct tcccttctgg 2000
aggactaccg tgtggaatac agagtgactc tcactgagga ccagctgccc 2050
cacttagagg agattcacat ccggggaccc gtccgggatg acattgagat 2100
tcaggtgtac agacgatatg gaggagaata tggggatctt acacacccag 2150
acatcacctt ttcctacttt caactgaagc agcaggcagc ctgggtatgg 2200
accgctaagc gtggaccctg ctcagtgagc tgtggggcag ggctgcgctg 2250
ggtgacctac agctgccagg atcaagctca agacaagtgg gtaaagaacg 2300
cccagtgcca agggagccca cagccacctg catggcaaga gccttgtgtc 2350
tctgccccct gctccccata ttgggtagct ggggacttca gcccatgtag 2400
cgtgtcttgt ggcgggggcc ttcgggagcg gtcactgcgc tgtgtagaga 2450
cccaagatgg cttcttaaag acactgccac ctgcccggtg cagagcagta 2500
gcccagcagc cagc 2514
<210>36
<211>3512
<212>DNA
<213>Mus musculus
<400>36
aggaagctcc caagagtaaa cactgcctga tgtcccgccc agccagcaag 50
tgaacattgc acactaacca gaatcccagt cactagggct cctgtccggc 100
catcaactgc cttttctaaa gatgagccag ctttgcctgt ggttgacgtg 150
ccagccttgt tatgctgtca gtgtcagagg aatcctcact ggtgccatct 200
tcattctggg ctgctggggg ctctctgact tccagaagag tcttcttcaa 250
gatctggagc ccaaggatgt gtcttcttac tttggccacc atgctgctcc 300
attcacaggc catcctccct ctcacctcca gagactgaga cggagaagga 350
ctttggagga cattctgcac ctggaactcc tggtagctgt gggccccgat 400
gtttcccggg ctcatcagga ggacacagaa cgctacgtgc tcactaatct 450
caatatcggg tcagaactgt tgagaaaccc atccctggga gtccagttcc 500
aggtgcacct ggtgaagcta atcaccctct ctgactcaga gagtactccg 550
aatatcacgg ccaacatcac ctcatccttg atgagcgtct gcgagtggag 600
ccagacgatc aacccccacg atgacaggga tccaagtcac gctgacctga 650
ttctctatat caccaggttt gacctggagt tgcctgatgg caaccagcag 700
gttcggggtg tcacccagct gggaggtgcc tgctcccttt cctggagttg 750
ccttatcact gaggatactg gctttgacct gggggtcacc atcgcccatg 800
agattgggca cagcttcggg ctggaccatg atggtgctcc aggtagtggc 850
agcacctgca aggccagtgg ccacgtgatg gcggctgacg gcgcaacacc 900
cactggaggg accctggagt ggtctgcctg cagccaaagg cagttgcagc 950
acctactcag cacagggcaa atgcactgct tccaggaccc acctgggctg 1000
cagtcaggac ttacacggca ccagctgatg gcacagcctg gcctctacta 1050
cagtgcagat gatcagtgcc gtgtggcttt cggttctggg gctgtcgcct 1100
gcaccttctc cagggagggt ctggatgtat gccaggccct gtcctgccac 1150
acagacccct tggaccaaag cagctgcagc cgcctccttg ttcctctcct 1200
ggatgggaca gaatgtggtg tggagaagtg gtgctccaag gctcgctgtc 1250
gctccctagc tgagctggct cctgtggctg cagtacatgg acactggtct 1300
agctggggcc cccatagtcc ctgctcccga tcctgtggag gaggtgtgat 1350
taccaggagg cggtggtgca acaaccccag gcctgcattt gggggacgtg 1400
catgtgtggg tgaagacctc caggctaaga tgtgcaacac gcaggcttgt 1450
gagaagactc agctggagtt catgtccgag cagtgtgccc agacagacag 1500
acaaccactg caactttccc aaggcactgc ctccttctac cactgggatg 1550
ctgctgtgca gtatagtcaa ggagataccc tgtgcagaca catgtgctgg 1600
gctgttggag aaagcttcat tgtcagccgt ggggacaggt tcctagatgg 1650
gacccgttgt gtgccaagtg gtcctcagga tgatgggacc ctaagcctct 1700
gtttgttggg cagctgcagg acctttggct gtgatggcag gatggactcc 1750
cagaaggttt gggatgcgtg ccaggtgtgt ggaggagaca acagcacctg 1800
cagctcacgg aatggttctt tcacagctgg gagagccaga gaatatgtca 1850
cgttcctgat tgttactccc aacatgacca acgcacacat tgtcaaccgc 1900
aggcctctct tcacacactt ggcggtgagg atccagggcc actacattgt 1950
ggcagggaag actagcatct cacccaacac cacctaccct tcccttctgg 2000
aggactaccg tgtggaatac agagtgactc tcactgagga ccagctgccc 2050
cacttagagg agattcacat ccggggaccc gtccgggatg acattgagat 2100
tcaggtgtac agacgatatg gaggagaata tggggatctt acacacccag 2150
acatcacctt ttcctacttt caactgaagc agcaggcagc ctgggtatgg 2200
accgctaagc gtggaccctg ctcagtgagc tgtggggcag ggctgcgctg 2250
ggtgacctac agctgccagg atcaagctca agacaagtgg gtaaagaacg 2300
cccagtgcca agggagccca cagccacctg catggcaaga gccttgtgtc 2350
tctgccccct gctccccata ttgggtagct ggggacttca gcccatgtag 2400
cgtgtcttgt ggcgggggcc ttcgggagcg gtcactgcgc tgtgtagaga 2450
cccaagatgg cttcttaaag acactgccac ctgcccggtg cagagcagta 2500
gcccagcagc cagcagcaga agtggaaaac tgcaactccc agccctgtcc 2550
caccaggtgg gaggtgtcag accctggccc ttgcatgcca tctgcctgtg 2600
aggcaggtct ggactcaagg aatgtgacat gtgtgtccag ggcgggtgac 2650
ccggagaagc cagaaactgc aggcccctgc cgcaccgacg agatgtcagc 2700
tatgctggag ccctgctcca ggagcctgtg ttctccaggc ttgggtcagg 2750
tggacaacac catgtctctg ggcgaggagg ctccatcccc ggtgggcagt 2800
gacaagccag gggctcaggc tgagcatgtg tggacccctc tggtggggct 2850
gtgctccatc tcttgtggga gaggtctgaa ggaactgtat ttcctgtgca 2900
tggattctgt cctcaaaatg cctgtccagg aagagctatg cggcttggct 2950
agtaagcccc caagccggtg ggaggtctgc agggctcgcc cctgtcctgc 3000
tcggtgggag actcaagtct tggcaccgtg cccggtgacc tgtggtgggg 3050
ggcgagtgcc actgtctgtt cgttgtgtgc agctagaccg tggccacccg 3100
atatctgtac ctcactccaa gtgctcgcca gtgcctaagc caggctcctt 3150
cgaggactgc agccctgagc cttgtcctgc tagggcacta gtgtgggaag 3200
ccgcccccac attcgccgtc acaagatggc gctgacatcc tgtgttctaa 3250
gttggtaaac aaataatctg cgcatgagcc aagggtattt acgactactt 3300
gtactctgtt tttcccgtga acgtcagctc ggccatgggc tgcagccaat 3350
cagggagtga tgcgtcctag gcaattgttg ttctctttta aatagaaggg 3400
gtttcgtttt tctctttttc ttgcttctta cactctggcc ccaaaaagat 3450
gtaagcaata aagctttgcc gtaggaaaaa aaaaaaaaaa ggatccggta 3500
cctctagatc ag 3512
<210>37
<211>22
<212>PRT
<213>人
<400>3
Phe Ser Pro Ala Pro Gln Pro Arg Arg Leu Leu Pro Gly Pro Gln
1 5 10 15
Glu Asn Ser Val Gln Ser Ser
20
<210>38
<211>30
<212>DNA
<213>人
<400>38
atgtgcaaca ctcaggcctg cgagaagacc 30
<210>39
<211>30
<212>DNA
<213>人
<400>39
ccaacctgac cagtgtctac attgccaacc 30
<210>40
<211>21
<212>DNA
<213>人
<400>40
ctggagccct gcccacctag g 21
<210>41
<211>62
<212>DNA
<213>人
<400>41
gccgtcgact cttatcactt atcgtcatcg tccttgtagt cttgcgacat gaactccagc 60
tg 62
<210>42
<211>62
<212>DNA
<213>人
<400>42
gccgtcgact cttatcactt atcgtcatcg tccttgtagt ccaggttggg ggtaactgtc 60
ag 62
<210>43
<211>62
<212>DNA
<213>人
<400>43
gccgtcgact cttatcactt atcgtcatcg tccttgtagt ccacgtgtgc agcttgagcc 60
cc 62
<210>44
<211>62
<212>DNA
<213>人
<400>44
gccgtcgact cttatcactt atcgtcatcg tccttgtagt ccctaggtgg gcagggctcc 60
ag 62
<210>45
<211>62
<212>DNA
<213>人
<400>45
gccgtcgact cttatcactt atcgtcatcg tccttgtagt caccctgtcc cacacagggc 60
cc 62
<210>46
<211>60
<212>DNA
<213>人
<400>46
tccaagcttg tcgactctta tcacttatcg tcatcgtcct tgtagtcggt tccttccttt 60
<210>47
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成的DNA
<400>47
gactacaagg acgatgacga taagtga 27
<210>48
<211>8
<212>RPT
<213>人工序列
<220>
<223>人工序列的描述:合成的
<400>47
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5