CN1194989C - 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 - Google Patents

具有抑制癌细胞生长功能的新的人蛋白及其编码序列 Download PDF

Info

Publication number
CN1194989C
CN1194989C CNB011045450A CN01104545A CN1194989C CN 1194989 C CN1194989 C CN 1194989C CN B011045450 A CNB011045450 A CN B011045450A CN 01104545 A CN01104545 A CN 01104545A CN 1194989 C CN1194989 C CN 1194989C
Authority
CN
China
Prior art keywords
leu
ser
ala
pro
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB011045450A
Other languages
English (en)
Other versions
CN1309135A (zh
Inventor
顾健人
杨胜利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cancer Institute
Original Assignee
Shanghai Cancer Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cancer Institute filed Critical Shanghai Cancer Institute
Priority to CNB011045450A priority Critical patent/CN1194989C/zh
Publication of CN1309135A publication Critical patent/CN1309135A/zh
Application granted granted Critical
Publication of CN1194989C publication Critical patent/CN1194989C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。

Description

具有抑制癌细胞生长功能的新的人蛋白及其编码序列
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ IDNO:14、SEQ ID NO:17、SEQ ID NO:20。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续的10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
本发明采用大规模cDNA克隆转染癌细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对癌细胞(肝癌细胞)具有抑制克隆形成的作用,其抑制率在50%或50%以上。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。具有抑癌功能的蛋白多肽的纯度能用氨基酸序列分析。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以SP329蛋白为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。对于其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ ID NO:2所示的成熟多肽有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,ALaboratory Manual,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽(Science,1984;224:1431)。一般来说有以下步骤:
(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.Molecular Cloning,a Laboratory Manual,cold Spring HarborLaboratory.New York,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
上述方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。其例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有抑癌功能的蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有抑癌功能的蛋白,以抑制内源性的具有抑癌功能的蛋白活性。例如,一种变异的具有抑癌功能的蛋白可以是缩短的、缺失了信号传导功能域的具有抑癌功能的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭具有抑癌功能的人蛋白阳性的细胞。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.Pat No.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与具有抑癌功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具体位置且并可与其杂交。现在,只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。根据本发明,为了将这些序列与疾病相关基因相关联,其重要的第一步就是将这些DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与JohnsHopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力,被精确定位至与疾病有关的染色体区域的cDNA,可以是50至500个潜在致病基因间之一种(假定l兆碱基作图分辨能力和每20kb对应于一个基因)。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:cDNA基因的获得及对癌细胞克隆形成的抑制作用
SP329来自于从GIBCO BRL公司购得肝cDNA文库(cat,No.10422-012),PP203,PP238,PP856,PP1065,PP1221,PP2250来自于按常规方法构建的人胎盘cDNA文库。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Seratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg cDNA滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系7721。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24~48小时,边观察,边换G418浓度不等的培液。约2~3次后,直到镜检细胞有克隆形成,计数。发现SP329,PP203,PP238,PP856,PP1065,PP1221,PP2250和PP3898有抑制细胞克隆形成作用(抑制率在50%或50%以上),结果如下表1所示。
     cDNA克隆转染细胞(7721)克隆形成情况
cDNA克隆    CDNA克隆数       空载体克隆数
名称        (三个重复)       (三个重复)
SP329        2 0 0            18 24 23
PP203        6 8 13           27 31 26
PP238        0 0 0            20 17 16
PP856        0 1 0            30 13 15
PP1065       2 0 1            32 39 37
PP1221       0 0 1            30 20 22
PP2250       0 0 1            32 31 34
PP3898       2 0 0            33 34 38
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列。
对SP329、PP203、PP238、PP856、PP1065、PP1221、PP2250、PP3898 cDNA克隆序列分析后发现基因尚不完整,采用Clontech公司SMART RACE cDNA扩增试剂盒(Cat.No.K1811-1),设计基因特异引物(如下表2所示),按说明书进行操作,获得全长克隆。
                                   表2
克隆名称 特异引物1 特异引物2
SP329  5′GCTTCGCTCAAGAAGAAAAAGGCAC 3′ 5′AGGACCTCCCAACTGCATGCCTC 3′
PP203  5′ACCCCTGGGATCCAACTCTTTGGTG 3′ 5′CTGGGTATAGGCCACAGCGATCCAA 3′
PP238  5′TGTTCTGCCGGGAGGAGAAGCAGTA 3′ 5′CCGTTCTTCTTCTCCACCTGCTCCC 3′
PP856  5′CCAGGGTGACTCAGCTGTCACTCCA 3′ 5′CCAGAACTTTCCGCAGACCTTGTGC 3′
PP1065  5′GGAAAGGGGCTAGCATGAAGGTCCA 3′ 5′TATGTTGGGGTGGGAGGAGCTCTGA 3′
PP1221  5′TATGGCTTTCTTGCCAGGAGGGGTC 3′ 5′CCCTGGGTAGAACGGGTGAAGGGAT 3′
PP2250  5′GTCTGGGTATCAGCTGTTGGGGCCT 3′ 5′ACAAGGAGAGAGTGCGGCTGCTGAG 3′
PP3898  5′TCATCCAGCCGGTCACTTGACTTGA 3′ 5′GCCACAGCTGGTAGTTGGACTTGCC 3′
具体而言,对各克隆使用如下引物:
PP203克隆
通用引物mix(UPM)Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3′
巢式通用引物(NUP)    5′AAGCAGTGGTAACAACGCAGAGT 3′
pp203-NB             5′ACCCCTGGGATCCAACTCTTTGGTG 3′
pp203-B              5′CTGGGTATAGGCCACAGCGATCCAA 3′
PP238克隆
通用引物mix(UPM)Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3″
巢式通用引物(NUP)    5′AAGCAGTGGTAACAACGCAGAGT 3′
pp238-NB           5′TGTTCTGCCGGGAGGAGAAGCAGTA 3′
pp238-B            5′CCGTTCTTCTTCTCCACCTGCTCCC 3′
PP856克隆
通用引物mix(UPM)Long  5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3′
巢式通用引物(NUP)  5′AAGCAGTGGTAACAACGCAGAGT 3′
pp856-NB           5′CCAGGGTGACTCAGCTGTCACTCCA3′
pp856-B            5′CCAGAACTTTCCGCAGACCTTGTGC 3′
PP1065克隆
通用引物mix(UPM)Long  5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3′
巢式通用引物(NUP)  5′AAGCAGTGGTAACAACGCAGAGT 3′
PP1065-B:         5′GGAAAGGGGCTAGCATGAAGGTCCA 3′
PP1065-NB          5′TATGTTGGGGTGGGAGGAGCTCTGA 3′
PP1221克隆
衔接引物1(AP1)     5′CCATCCTAATACGACTCACTATAGGGC3′ 27
衔接引物2(AP2)     5′ACTCACTATAGGGCTCGAGCGGC 3′    23
pp1221-C           5′TATGGCTTTCTTGCCAGGAGGGGTC 3′  25
pp1221-NC          5′CCCTGGGTAGAACGGGTGAAGGGAT 3′  25
pp2250-C           5′ACAAGGAGAGAGTGCGGCTGCTGAG 3′
pp2250-D           5′TGCATGCCACTTTCAGTCAACAGGA 3′
PP329克隆
衔接引物1(AP1)     5′CCATCCTAATACGACTCACTATAGGGC 3′27
衔接引物2(AP2)     5′ACTCACTATAGGGCTCGAGCGGC 3′    23
sp329-B            5′gcttcgctcaagaagaaaaaggcac 3′  25
sp329-NB           5′aggacctcccaactgcatgcctc 3′    23
其中,对使用通用引物的克隆,获得全长基因按如下操作。用人胎盘组织mRNA为起始材料,按Clontech公司SM ART RACE cDNA扩增试剂盒(cat # 1811-1)说明书获得cDNA.然后分别次UPM引物和基因特异的X-B进行第一软PCR,再以NUP引物和基因特异的X-NB进行第二轮PCR,获得基因片段(注:X为基因克隆号码)。
反应条件为:94℃3′一个循环
(第一轮)    94℃1′58℃1′72℃2′35个循环
            72℃10′一个循环
(第二轮)    同上,但退火温度为60℃
对使用衔接引物的克隆,以Clonteoh公司Marathon-Ready人肝cDNA(cat # 7407-1)为样板,分别以Apl和X-C引物进行第一轮PCR,再以Apl和X-NC进行第二轮PCR获得基因片段(注:X为基因克隆号码)。反应条件同上。
PP2250以人胎盘cDNA为样板,PP2250-C,PP2250-D为引物按94℃3′1个循环,94℃1′60℃1′1  70℃2′35个循环,72℃10′一个循环进行PCR,获得基因片段。
实施例2:cDNA克隆序列分析
1. SP329
A:核苷酸序列(SEQ ID NO:1)长度:2360
TGTCAGTAAG TGGAAAAGGC AAGACTCCAC TTCGAAAGAG GTACAACTCC CATCAGATGG  60
GCCAGTCGAA GCAGTTTCCC CTCGAGGAAA GCAGCTGTGA GAAAGGCTGT CAGGTCACCA  120
GTGAGCAGAT CAAAGCCGAT ATGAAAGCAG CTAGGGATAT TCCTGAAAAG AAAAAAAACA  180
AGGATGTTTA TCCCAGCTGC AGCAGCACCA CCGCCAGCAC AGTGGGAAAC TCCAGCTCAC  240
ACAACACTGC TTCTCAAAGC CCCGACTTTG TAAGGACGGT GAACAGCGGC GGCTCTTCCG  300
AGCCTAGCCC TACAGAAGTG GATGTGTCCA GGCAGTGTGC CTGCTCCCCC GGTGGGTCAG  360
AGGACTCTGA GGCCATGGAG GAGGGAGATG CAGAGAGTTC TGTCTGCCCA GATGCTTGCT  420
GTCACAGGCC CCAGGAATTC CCAAAGGAGA ACTAGCAGGT GTTCTGATGA GGAACGTCCT  480
TCAACCAGCC GAGCCTGTGT TGTGAATGGC CCGGATGGTA CGAGATCCGC CTTTTCCTTT  540
AGGACTCTGC CACAAGGGGG GTCTTCAGGC CCAGCACATG ATGAGAGGAC TAATGGGAGT  600
GGCTCTGGGG CTACAGGTGA GGACAGGAGG GGGAGCTCCC AGCCTGAGAG TTGTGACGTG  660
CAGTCTAATG AAGACTACCC TCGGAGGCCC CTAACCAGGG CCAGGAGCAG ACTGTCCCAT  720
GTACTGCTGG TATCTGAGTC AGAAGTAGCC AAAACAAAGC CACGTCACGC CATGAAACGG  780
AAGCGGACAG CAGATAAATC CACTAGTACA AGTGATCCTG TGATCGAGGA TGACCATGTG  840
CAGGTTCTTG TATTAAAATC CAAGAATCTT GTTGGAGTCA CTATGACCAA TTGTGGAATC  900
ACAGATCTAG TGCTAAAAGA CTGTCCAAAG ATGATGTTCA TCCATGCTAC CAGGTGCAGG  960
GTACTAAAAC ATTTAAAGGT AGAAAATGCA CCAATTGTAA ACCGATTTGA CTATGCACAG  1020
TGCAAGAAAC TGAACATGGA TCAGGTACTA GACCAGATAC TAAGAATGCC ACCCGAGAGA  1080
AACCGCATCA TATACCTACG CCCAATGCAG CAGGTGGACA CTCTAACTTT GGAGCAGAAG  1140
CTATTTAGTG GTCCCTACCC CTATCACATC TGTATTATCC ATGAATTCAG TAACCCTCCC  1200
AATGTCCGGA ATAAGGTGCG CATTCGCAGC TGGATGGACA CTATAGCAAA CATCAATCAA  1260
GAGCTCATTA AATATGAATT CTTCCCTGAA GCCACTCGAA GTGAAGAAGA CTTAAAGAAA  1320
TACCCCAAGT ACCCCTGGGG GAGAGAAATC TATACTTTAG AAGGTGTTGT GGATGGAGCT  1380
CCATATTCCA TGATTTCTGA CTTCCCTTGG CTGAGGTCAT TACGAGCTGC AGAGCCCAAC  1440
AGCTTCGCTC GATACGACTT TGAAGACGAT GAAGAAAGCA CTATCTATGC TCCTAGAAGG  1500
AAAGGACAGC TGTCTGCAGA CATCTGTATG GAAACAATAG GAGAGGAAAT TTCAGAGATG  1560
CGTCAGATGA AGAAGGGTGT ATTTCAGCGA GTAGTGGCAA TTTTTATCCA CTATTGTGAT  1620
GTCAATGGAG AGCCAGTTGA AGATGACTAC ATTTAATTGG TCCCTCCTCC TTTCCAGCTA  1680
TTTTGTCAGA AAGCAAGTAG GGCCATCCAG CTGCCAGAGT GCTCCACAGG GACTTGAGGC  1740
ATGCAGTTGG GAGGTCCTGG CTCGGTTTGC TATATAGGGA ATATATAAGG AACATCGAAA  1800
TTGTATACAA AGATTTGTAC ATAAAAAATA TACAAAGACG CTTCCTAAAG TACCAACTTT  1860
ATATCATATG TTTATACAAT TTAATTTAAA AATTCATTTT AAGGAAGACA GATAATTTGA  1920
AAGACTTTTG TTTTTCTTGA CTTAATTCAT GAAGTATCAT TTTTTGACTG AGTCTCCATT  1980
TACTTCATTC TTAATGATTA TTGTCATCCC TTTAAATCTG TGCCTTTTTC TTCTTGAGCG  2040
AAGCTGTTTG AGTAAACCTG TTGAAGAGTG TTTGTGTCTT GTGTGCTTTT TTGTTGTTAT  2100
TAAAACACCA ACTAAACCTT ATAGTCAAGA CAAGGCTCTA TGTTTCTGTA CAAAGCTGTA  2160
GTTCTTTCTT AGTATTATAG TTGCCATGTT TCTTAAAATC AAGTAAAAAG ACTTATGAGC  2220
TTAAAAAAAA GTGAGTTTGA GAGGGAAATG GAAAAGTTTC CAGAGTATTT CTAGTAATTA  2280
TTTCCACATT GAATTGTGTA TATGCTTTAT CTTGAATATA AAATAAAAGT TTATTAAAAA  2340
CTTTAAAAAA AAAAAAAAAA                                              2360
B:氨基酸序列(SEQ ID NO:2)长度:444
  1  MCPGSVPAPP VGQRTLRPWR REMQRVLSAQ MLAVTGPRNS QRRTSRCSDE
 51  ERPSTSRACV VNGPDGTRSA FSFRTLPQGG SSGPAHDERT NGSGSGATGE
101  DRRGSSQPES CDVQSNEDYP RRPLTRARSR LSHVLLVSES EVAKTKPRHA
151  MKRKRTADKS TSTSDPVIED DHVQVLVLKS KNLVGVTMTN CGITDLVLKD
201  CPKMMFIHAT RCRVLKHLKV ENAPIVNRFD YAQCKKLNMD QVLDQILRMP
251  PERNRIIYLR PMQQVDTLTL EQKLFSGPYP YHICIIHEFS NPPNVRNKVR
301  IRSWMDTIAN INQELIKYEF FPEATRSEED LKKYPKYPWG REIYTLEGVV
351  DGAPYSMISD FPWLRSLRAA EPNSFARYDF EDDEESTIYA PRRKGQLSAD
401  ICMETIGEEI SEMRQMKKGV FQRVVAIFIH YCDVNGEPVE DDYI
克隆号:SP329(SEQ ID NO:3)
起始编码子:322 ATG  终止编码子:1656 TAA  蛋白质分子量:50647.03
   1  TGT CAG TAA GTG GAA AAG GCA AGA CTC CAC TTC GAA AGA GGT ACA ACT    48
  49  CCC ATC AGA TGG GCC AGT CGA AGC AGT TTC CCC TCG AGG AAA GCA GCT    96
  97  GTG AGA AAG GCT GTC AGG TCA CCA GTG AGC AGA TCA AAG CCG ATA TGA   144
 145  AAG CAG CTA GGG ATA TTC CTG AAA AGA AAA AAA ACA AGG ATG TTT ATC   192
 193  CCA GCT GCA GCA GCA CCA CCG CCA GCA CAG TGG GAA ACT CCA GCT CAC   240
 241  ACA ACA CTG CTT CTC AAA GCC CCG ACT TTG TAA GGA CGG TGA ACA GCG   288
 289  GCG GCT CTT CCG AGC CTA GCC CTA CAG AAG TGG ATG TGT CCA GGC AGT   336
   1                                             Met Cys Pro Gly Ser      5
 337  GTG CCT GCT CCC CCG GTG GGT CAG AGG ACT CTG AGG CCA TGG AGG AGG   384
   6  Val Pro Ala Pro Pro Val Gly Gln Arg Thr Leu Arg Pro Trp Arg Arg    21
 385  GAG ATG CAG AGA GTT CTG TCT GCC CAG ATG CTT GCT GTC ACA GGC CCC   432
  22  Glu Met Gln Arg Val Leu Ser Ala Gln Met Leu Ala Val Thr Gly Pro    37
 433  AGG AAT TCC CAA AGG AGA ACT AGC AGG TGT TCT GAT GAG GAA CGT CCT   480
  38  Arg Asn Ser Gln Arg Arg Thr Ser Arg Cys Ser Asp Glu Glu Arg Pro    53
 481  TCA ACC AGC CGA GCC TGT GTT GTG AAT GGC CCG GAT GGT ACG AGA TCC   528
  54  Ser Thr Ser Arg Ala Cys Val Val Asn Gly Pro Asp Gly Thr Arg Ser    69
 529  GCC TTT TCC TTT AGG ACT CTG CCA CAA GGG GGG TCT TCA GGC CCA GCA   576
  70  Ala Phe Ser Phe Arg Thr Leu Pro Gln Gly Gly Ser Ser Gly Pro Ala    85
 577  CAT GAT GAG AGG ACT AAT GGG AGT GGC TCT GGG GCT ACA GGT GAG GAC   624
  86  His Asp Glu Arg Thr Asn Gly Ser Gly Ser Gly Ala Thr Gly Glu Asp   101
 625  AGG AGG GGG AGC TCC CAG CCT GAG AGT TGT GAC GTG CAG TCT AAT GAA   672
 102  Arg Arg Gly Ser Ser Gln Pro Glu Ser Cys Asp Val Gln Ser Asn Glu   117
 673  GAC TAC CCT CGG AGG CCC CTA ACC AGG GCC AGG AGC AGA CTG TCC CAT   720
 118  Asp Tyr Pro Arg Arg Pro Leu Thr Arg Ala Arg Ser Arg Leu Ser His   133
 721  GTA CTG CTG GTA TCT GAG TCA GAA GTA GCC AAA ACA AAG CCA CGT CAC   768
 134  Val Leu Leu Val Ser Glu Ser Glu Val Ala Lys Thr Lys Pro Arg His   149
 769  GCC ATG AAA CGG AAG CGG ACA GCA GAT AAA TCC ACT AGT ACA AGT GAT   816
 150  Ala Met Lys Arg Lys Arg Thr Ala Asp Lys Ser Thr Ser Thr Ser Asp   165
 817  CCT GTG ATC GAG GAT GAC CAT GTG CAG GTT CTT GTA TTA AAA TCC AAG   864
 166  Pro Val Ile Glu Asp Asp His Val Gln Val Leu Val Leu Lys Ser Lys   181
 865  AAT CTT GTT GGA GTC ACT ATG ACC AAT TGT GGA ATC ACA GAT CTA GTG   912
 182  Asn Leu Val Gly Val Thr Met Thr Asn Cys Gly Ile Thr Asp Leu Val   197
 913  CTA AAA GAC TGT CCA AAG ATG ATG TTC ATC CAT GCT ACC AGG TGC AGG   960
 198  Leu Lys Asp Cys Pro Lys Met Met Phe Ile His Ala Thr Arg Cys Arg   213
 961  GTA CTA AAA CAT TTA AAG GTA GAA AAT GCA CCA ATT GTA AAC CGA TTT  1008
 214  Val Leu Lys His Leu Lys Val Glu Asn Ala Pro Ile Val Asn Arg Phe   229
1009  GAC TAT GCA CAG TGC AAG AAA CTG AAC ATG GAT CAG GTA CTA GAC CAG  1056
 230  Asp Tyr Ala Gln Cys Lys Lys Leu Asn Met Asp Gln Val Leu Asp Gln   245
1057  ATA CTA AGA ATG CCA CCC GAG AGA AAC CGC ATC ATA TAC CTA CGC CCA  1104
 246  Ile Leu Arg Met Pro Pro Glu Arg Asn Arg Ile Ile Tyr Leu Arg Pro   261
1105  ATG CAG CAG GTG GAC ACT CTA ACT TTG GAG CAG AAG CTA TTT AGT GGT  1152
 262  Met Gln Gln Val Asp Thr Leu Thr Leu Glu Gln Lys Leu Phe Ser Gly   277
1153  CCC TAC CCC TAT CAC ATC TGT ATT ATC CAT GAA TTC AGT AAC CCT CCC  1200
 278  Pro Tyr Pro Tyr His Ile Cys Ile Ile His Glu Phe Ser Asn Pro Pro   293
1201  AAT GTC CGG AAT AAG GTG CGC ATT CGC AGC TGG ATG GAC ACT ATA GCA  1248
 294  Asn Val Arg Asn Lys Val Arg Ile Arg Ser Trp Met Asp Thr Ile Ala   309
1249  AAC ATC AAT CAA GAG CTC ATT AAA TAT GAA TTC TTC CCT GAA GCC ACT  1296
 310  Asn Ile Asn Gln Glu Leu Ile Lys Tyr Glu Phe Phe Pro Glu Ala Thr   325
1297  CGA AGT GAA GAA GAC TTA AAG AAA TAC CCC AAG TAC CCC TGG GGG AGA  1344
 326  Arg Ser Glu Glu Asp Leu Lys Lys Tyr Pro Lys Tyr Pro Trp Gly Arg   341
1345  GAA ATC TAT ACT TTA GAA GGT GTT GTG GAT GGA GCT CCA TAT TCC ATG  1392
 342  Glu Ile Tyr Thr Leu Glu Gly Val Val Asp Gly Ala Pro Tyr Ser Met   357
1393  ATT TCT GAC TTC CCT TGG CTG AGG TCA TTA CGA GCT GCA GAG CCC AAC  1440
 358  Ile Ser Asp Phe Pro Trp Leu Arg Ser Leu Arg Ala Ala Glu Pro Asn   373
1441  AGC TTC GCT CGA TAC GAC TTT GAA GAC GAT GAA GAA AGC ACT ATC TAT  1488
 374  Ser Phe Ala Arg Tyr Asp Phe Glu Asp Asp Glu Glu Ser Thr Ile Tyr   389
1489  GCT CCT AGA AGG AAA GGA CAG CTG TCT GCA GAC ATC TGT ATG GAA ACA  1536
 390  Ala Pro Arg Arg Lys Gly Gln Leu Ser Ala Asp Ile Cys Met Glu Thr   405
1537  ATA GGA GAG GAA ATT TCA GAG ATG CGT CAG ATG AAG AAG GGT GTA TTT  1584
 406  Ile Gly Glu Glu Ile Ser Glu Met Arg Gln Met Lys Lys Gly Val Phe   421
1585  CAG CGA GTA GTG GCA ATT TTT ATC CAC TAT TGT GAT GTC AAT GGA GAG  1632
 422  Gln Arg Val Val Ala Ile Phe Ile His Tyr Cys Asp Val Asn Gly Glu   437
1633  CCA GTT GAA GAT GAC TAC ATT TAA TTG GTC CCT CCT CCT TTC CAG CTA  1680
 438  Pro Val Glu Asp Asp Tyr Ile ***                                   445
1681  TTT TGT CAG AAA GCA AGT AGG GCC ATC CAG CTG CCA GAG TGC TCC ACA  1728
1729  GGG ACT TGA GGC ATG CAG TTG GGA GGT CCT GGC TCG GTT TGC TAT ATA  1776
1777  GGG AAT ATA TAA GGA ACA TCG AAA TTG TAT ACA AAG ATT TGT ACA TAA  1824
1825  AAA ATA TAC AAA GAC GCT TCC TAA AGT ACC AAC TTT ATA TCA TAT GTT  1872
1873  TAT ACA ATT TAA TTT AAA AAT TCA TTT TAA GGA AGA CAG ATA ATT TGA  1920
1921  AAG ACT TTT GTT TTT CTT GAC TTA ATT CAT GAA GTA TCA TTT TTT GAC  1968
1969  TGA GTC TCC ATT TAC TTC ATT CTT AAT GAT TAT TGT CAT CCC TTT AAA  2016
2017  TCT GTG CCT TTT TCT TCT TGA GCG AAG CTG TTT GAG TAA ACC TGT TGA  2064
2065  AGA GTG TTT GTG TCT TGT GTG CTT TTT TGT TGT TAT TAA AAC ACC AAC  2112
2113  TAA ACC TTA TAG TCA AGA CAA GGC TCT ATG TTT CTG TAC AAA GCT GTA  2160
2161  GTT CTT TCT TAG TAT TAT AGT TGC CAT GTT TCT TAA AAT CAA GTA AAA  2208
2209  AGA CTT ATG AGC TTA AAA AAA AGT GAG TTT GAG AGG GAA ATG GAA AAG  2256
2257  TTT CCA GAG TAT TTC TAG TAA TTA TTT CCA CAT TGA ATT GTG TAT ATG  2304
2305  CTT TAT CTT GAA TAT AAA ATA AAA GTT TAT TAA AAA CTT TAA AAA AAA  2352
2353  AAA AAA AA                                                       2360
2. PP203
A:核苷酸序列(SEQ ID NO:4)长度:2379
GGTGCACACC CGGAAGTGGG TGCGGGCCAG CCGGCTCGCC CGGGGGCCAT GGCAGCAGCG  60
GCTACTGCAG CCGAGGGGGT CCCCAGTCGG GGGCCTCCCG GGGAAGTCAT TCATCTGAAT  120
GTGGGAGGCA AGAGATTCAG TACCTCTCGC CAGACTCTCA CCTGGATCCC AGACTCCTTC  180
TTCTCCAGTC TTCTGAGCGG ACGCATCTCG ACGCTGAAAG ATGAGACCGG AGCAATCTTC  240
ATCGACAGGG ACCCTACAGT CTTCGCCCCC ATCCTCAACT TCCTGCGCAC CAAAGAGTTG  300
GATCCCAGGG GTGTCCACGG TTCCAGCCTC CTCCATGAAG CCCAGTTCTA TGGGCTCACT  360
CCTCTGGTTC GTCGCCTGCA GCTTCGAGAG GAGTTGGATC GATCTTCTTG TGGAAACGTC  420
CTCTTCAATG GTTACCTGCC GCCACCAGTG TTCCCAGTGA AGCGGCGGAA CCGGCACAGC  480
CTAGTGGGGC CTCAGCAGCT AGGAGGACGG CCAGCCCCTG TCCGACGGAG CAACACGATG  540
CCCCCCAACC TTGGCAATGC AGGGCTGCTG GGCCGAATGC TGGATGAGAA AACCCCTCCC  600
TCACCCTCAG GACAACCTGA GGAGCCGGGG ATGGTGCGCC TGGTGTGTGG ACACCATAAT  660
TGGATCGCTG TGGCCTATAC CCAGTTTCTA GTCTGCTACA GGTTGAAGGA AGCCTCTGGC  720
TGGCAGCTGG TGTTTTCCAG CCCCCGCCTG GACTGGCCCA TCGAACGACT GGCGCTCACA  780
GCCCGGGTGC ATGGTGGGGC TTTGGGTGAA CATGACAAGA TGGTGGCAGC AGCCACCGGC  840
AGCGAGATCC TGCTATGGGC TCTGCAGGCG GAAGGCGGTG GCTCCGAGAT AGGGGTCTTT  900
CATCTGGGGG TGCCTGTGGA GGCCTTGTTC TTCGTCGGGA ACCAGCTCAT TGCTACAAGC  960
CACACAGGGC GCATCGGGGT GTGGAATGCC GTCACCAAGC ACTGGCAGGT CCAGGAGGTG  1020
CAGCCCATCA CCAGTTATGA CGCGGCAGGC TCCTTCCTCC TCCTGGGCTG CAACAACGGC  1080
TCCATTTACT ACGTGGATGT GCAGAAGTTC CCCTTGCGCA TGAAAGACAA CGACCTCCTT  1140
GTCAGCGAGC TCTATCGGGA CCCAGCGGAG GATGGGGTCA CCGCCCTCAG TGTCTACCTC  1200
ACCCCCAAGA CCAGTGACAG TGGGAACTGG ATCGAGATCG CCTATGGCAC CAGCTCAGGG  1260
GGCGTGCGGG TCATCGTGCA GCACCCGGAG ACTGTGGGCT CGGGGCCTCA GCTCTTCCAG  1320
ACCTTCACTG TGCACCGCAG CCCTGTCACC AAGATCATGC TGTCGGAGAA GCACCTCATC  1380
TCAGTCTGTG CCGACAACAA CCACGTGCGG ACATGGTCTG TGACTCGCTT CCGCGGCATG  1440
ATTTCCACCC AGCCCGGCTC CACCCCACTC GCTTCCTTTA AGATCCTGGC TCTGGAGTCG  1500
GCAGATGGGC ATGGCGGCTG CAGTGCTGGC AATGACATTG GCCCCTACGG TGAGCGGGAC  1560
GACCAGCAAG TGTTCATCCA GAAGGTGGTG CCCAGTGCCA GCCAGCTCTT CGTGCGTCTC  1620
TCATCTACTG GGCAGCGGGT GTGCTCCGTG CGCTCCGTGG ACGGCTCACC CACGACGGCC  1680
TTCACAGTGC TGGAGTGCGA GGGCTCCCGG CGGCTCGGCT CTCGGCCCCG GCGCTACCTG  1740
CTCACTGGCC AGGCCAACGG CAGCTTGGCC ATGTGGGACC TAACCACCGC CATGGACGGC  1800
CTCGGCCAGG CCCCTGCAGG TGGCCTGACG GAGCAAGAGC TGATGGAACA GCTGGAACAC  1860
TGTGAGCTGG CCCCGCCGGC TCCTTCAGCT CCCTCATGGG GCTGTCTCCC CAGCCCCTCA  1920
CCCCGCATCT CCCTCACCAG CCTCCACTCA GCCTCCAGCA ACACCTCCTT GTCTGGCCAC  1980
CGTGGGAGCC CAAGCCCCCC GCAGGCTGAG GCCCGGCGCC GTGGTGGGGG CAGCTTTGTG  2040
GAACGCTGCC AGGAACTGGT GCGGAGTGGG CCAGACCTCC GACGGCCACC CACACCAGCC  2100
CCGTGGCCCT CCAGCGGTCT CGGCACTCCC CTCACACCTC CCAAGATGAA GCTCAATGAA  2160
ACTTCCTTTT GAACAACGCA GCTGCCATGA TGCCTTGGGA TGCCCTGGTC CTGGGGGACT  2220
CAGGTGCCTC CCTGATTCCT GTGGGAACCC CGGGTTCAGG GCCAGGGCCT CCTTGGAATA  2280
AATGGTTATT GTTACTAGGT CCCCACCTTC CCTCTTTTCT GGAAGCCAAA GTCAGCCTCC  2340
CCAATAAAGT CCTCACTGCC AAAAAAAAAA AAAAAAAAA                         2379
B:氨基酸序列(SEQ ID NO:5)长度:707
  1  MAAAATAAEG VPSRGPPGEV IHLNVGGKRF STSRQTLTWI PDSFFSSLLS
 51  GRISTLKDET GAIFIDRDPT VFAPILNFLR TKELDPRGVH GSSLLHEAQF
101  YGLTPLVRRL QLREELDRSS CGNVLFNGYL PPPVFPVKRR NRHSLVGPQQ
151  LGGRPAPVRR SNTMPPNLGN AGLLGRMLDE KTPPSPSGQP EEPGMVRLVC
201  GHHNWIAVAY TQFLVCYRLK EASGWQLVFS SPRLDWPIER LALTARVHGG
251  ALGEHDKMVA AATGSEILLW ALQAEGGGSE IGVFHLGVPV EALFFVGNQL
301  IATSHTGRIG VWNAVTKHWQ VQEVQPITSY DAAGSFLLLG CNNGSIYYVD
351  VQKFPLRMKD NDLLVSELYR DPAEDGVTAL SVYLTPKTSD SGNWIEIAYG
401  TSSGGVRVIV QHPETVGSGP QLFQTFTVHR SPVTKIMLSE KHLISVCADN
451  NHVRTWSVTR FRGMISTQPG STPLASFKIL ALESADGHGG CSAGNDIGPY
501  GERDDQQVFI QKVVPSASQL FVRLSSTGQR VCSVRSVDGS PTTAFTVLEC
551  EGSRRLGSRP RRYLLTGQAN GSLAMWDLTT AMDGLGQAPA GGLTEQELME
601  QLEHCELAPP APSAPSWGCL PSPSPRISLT SLHSASSNTS LSGHRGSPSP
651  PQAEARRRGG GSFVERCQEL VRSGPDLRRP PTPAPWPSSG LGTPLTPPKM
701  KLNETSF
克隆号:PP203(SEQ ID NO:6)
起始编码子:49 ATG  终止编码子:2172 TGA  蛋白质分子量:76339.52
  1  GGT GCA CAC CCG GAA GTG GGT GCG GGC CAG CCG GCT CGC CCG GGG GCC   48
 49  ATG GCA GCA GCG GCT ACT GCA GCC GAG GGG GTC CCC AGT CGG GGG CCT   96
  1  Met Ala Ala Ala Ala Thr Ala Ala Glu Gly Val Pro Ser Arg Gly Pro   16
 97  CCC GGG GAA GTC ATT CAT CTG AAT GTG GGA GGC AAG AGA TTC AGT ACC  144
 17  Pro Gly Glu Val Ile His Leu Asn Val Gly GLy Lys Arg Phe Ser Thr   32
145  TCT CGC CAG ACT CTC ACC TGG ATC CCA GAC TCC TTC TTC TCC AGT CTT  192
 33  Ser Arg Gln Thr Leu Thr Trp Ile Pro Asp Ser Phe Phe Ser Ser Leu   48
193  CTG AGC GGA CGC ATC TCG ACG CTG AAA GAT GAG ACC GGA GCA ATC TTC  240
 49  Leu Ser Gly Arg Ile Ser Thr Leu Lys Asp Glu Thr Gly Ala Ile Phe   64
241  ATC GAC AGG GAC CCT ACA GTC TTC GCC CCC ATC CTC AAC TTC CTG CGC  288
 65  Ile Asp Arg Asp Pro Thr Val Phe Ala Pro Ile Leu Asn Phe Leu Arg   80
289  ACC AAA GAG TTG GAT CCC AGG GGT GTC CAC GGT TCC AGC CTC CTC CAT  336
  81  Thr Lys Glu Leu Asp Pro Arg Gly Val His Gly Ser Ser Leu Leu His    96
 337  GAA GCC CAG TTC TAT GGG CTC ACT CCT CTG GTT CGT CGC CTG CAG CTT   384
  97  Glu Ala Gln Phe Tyr Gly Leu Thr Pro Leu Val Arg Arg Leu Gln Leu   112
 385  CGA GAG GAG TTG GAT CGA TCT TCT TGT GGA AAC GTC CTC TTC AAT GGT   432
 113  Arg Glu Glu Leu Asp Arg Ser Ser Cys Gly Asn Val Leu Phe Asn Gly   128
 433  TAC CTG CCG CCA CCA GTG TTC CCA GTG AAG CGG CGG AAC CGG CAC AGC   480
 129  Tyr Leu Pro Pro Pro Val Phe Pro Val Lys Arg Arg Asn Arg His Ser   144
 481  CTA GTG GGG CCT CAG CAG CTA GGA GGA CGG CCA GCC CCT GTC CGA CGG   528
 145  Leu Val Gly Pro Gln Gln Leu Gly Gly Arg Pro Ala Pro Val Arg Arg   160
 529  AGC AAC ACG ATG CCC CCC AAC CTT GGC AAT GCA GGG CTG CTG GGC CGA   576
 161  Ser Asn Thr Met Pro Pro Asn Leu Gly Asn Ala Gly Leu Leu Gly Arg   176
 577  ATG CTG GAT GAG AAA ACC CCT CCC TCA CCC TCA GGA CAA CCT GAG GAG   624
 177  Met Leu Asp Glu Lys Thr Pro Pro Ser Pro Ser Gly Gln Pro Glu Glu   192
 625  CCG GGG ATG GTG CGC CTG GTG TGT GGA CAC CAT AAT TGG ATC GCT GTG   672
 193  Pro Gly Met Val Arg Leu Val Cys Gly His His Asn Trp Ile Al8 Val   208
 673  GCC TAT ACC CAG TTT CTA GTC TGC TAC AGG TTG AAG GAA GCC TCT GGC   720
 209  Ala Tyr Thr Gln Phe Leu Val Cys Tyr Arg Leu Lys Glu Ala Ser Gly   224
 721  TGG CAG CTG GTG TTT TCC AGC CCC CGC CTG GAC TGG CCC ATC GAA CGA   768
 225  Trp Gln Leu Val Phe Ser Ser Pro Arg Leu Asp Trp Pro Ile Glu Arg   240
 769  CTG GCG CTC ACA GCC CGG GTG CAT GGT GGG GCT TTG GGT GAA CAT GAC   816
 241  Leu Ala Leu Thr Ala Arg Val His Gly Gly Ala Leu Gly Glu His Asp   256
 817  AAG ATG GTG GCA GCA GCC ACC GGC AGC GAG ATC CTG CTA TGG GCT CTG   864
 257  Lys Met Val Ala Ala Ala Thr Gly Ser Glu Ile Leu Leu Trp Ala Leu   272
 865  CAG GCG GAA GGC GGT GGC TCC GAG ATA GGG GTC TTT CAT CTG GGG GTG   912
 273  Gln Ala Glu Gly Gly Gly Ser Glu Ile Gly Val Phe His Leu Gly Val   288
 913  CCT GTG GAG GCC TTG TTC TTC GTC GGG AAC CAG CTC ATT GCT ACA AGC   960
 289  Pro Val Glu Ala Leu Phe Phe Val Gly Asn Gln Leu Ile Ala Thr Ser   304
 961  CAC ACA GGG CGC ATC GGG GTG TGG AAT GCC GTC ACC AAG CAC TGG CAG  1008
 305  His Thr Gly Arg Ile Gly Val Trp Asn Ala Val Thr Lys His Trp Gln   320
1009  GTC CAG GAG GTG CAG CCC ATC ACC AGT TAT GAC GCG GCA GGC TCC TTC  1056
 321  Val Gln Glu Val Gln Pro Ile Thr Ser Tyr Asp Ala Ala Gly Ser Phe   336
1057  CTC CTC CTG GGC TGC AAC AAC GGC TCC ATT TAC TAC GTG GAT GTG CAG  1104
 337  Leu Leu Leu Gly Cys Asn Asn Gly Ser Ile Tyr Tyr Val Asp Val Gln   352
1105  AAG TTC CCC TTG CGC ATG AAA GAC AAC GAC CTC CTT GTC AGC GAG CTC  1152
 353  Lys Phe Pro Leu Arg Met Lys Asp Asn Asp Leu Leu Val Ser Glu Leu   368
1153  TAT CGG GAC CCA GCG GAG GAT GGG GTC ACC GCC CTC AGT GTC TAC CTC  1200
 369  Tyr Arg Asp Pro Ala Glu Asp Gly Val Thr Ala Leu Ser Val Tyr Leu   384
1201  ACC CCC AAG ACC AGT GAC AGT GGG AAC TGG ATC GAG ATC GCC TAT GGC  1248
 385  Thr Pro Lys Thr Ser Asp Ser Gly Asn Trp Ile Glu Ile Ala Tyr Gly   400
1249  ACC AGC TCA GGG GGC GTG CGG GTC ATC GTG CAG CAC CCG GAG ACT GTG  1296
 401  Thr Ser Ser Gly Gly Val Arg Val Ile Val Gln His Pro Glu Thr Val   416
1297  GGC TCG GGG CCT CAG CTC TTC CAG ACC TTC ACT GTG CAC CGC AGC CCT  1344
 417  Gly Ser Gly Pro Gln Leu Phe Gln Thr Phe Thr Val His Arg Ser Pro   432
1345  GTC ACC AAG ATC ATG CTG TCG GAG AAG CAC CTC ATC TCA GTC TGT GCC  1392
 433  Val Thr Lys Ile Met Leu Ser Glu Lys His Leu Ile Ser Val Cys Ala   448
1393  GAC AAC AAC CAC GTG CGG ACA TGG TCT GTG ACT CGC TTC CGC GGC ATG  1440
 449  Asp Asn Asn His Val Arg Thr Trp Ser Val Thr Arg Phe Arg Gly Met   464
1441  ATT TCC ACC CAG CCC GGC TCC ACC CCA CTC GCT TCC TTT AAG ATC CTG  1488
 465  Ile Ser Thr Gln Pro Gly Ser Thr Pro Leu Ala Ser Phe Lys Ile Leu   480
1489  GCT CTG GAG TCG GCA GAT GGG CAT GGC GGC TGC AGT GCT GGC AAT GAC  1536
 481  Ala Leu Glu Ser Ala Asp Gly His Gly Gly Cys Ser Ala Gly Asn Asp   496
1537  ATT GGC CCC TAC GGT GAG CGG GAC GAC CAG CAA GTG TTC ATC CAG AAG  1584
 497  Ile Gly Pro Tyr Gly Glu Arg Asp Asp Gln Gln Val Phe Ile Gln Lys   512
1585  GTG GTG CCC AGT GCC AGC CAG CTC TTC GTG CGT CTC TCA TCT ACT GGG  1632
 513  Val Val Pro Ser Ala Ser Gln Leu Phe Val Arg Leu Ser Ser Thr Gly   528
1633  CAG CGG GTG TGC TCC GTG CGC TCC GTG GAC GGC TCA CCC ACG ACG GCC  1680
 529  Gln Arg Val Cys Ser Val Arg Ser Val Asp Gly Ser Pro Thr Thr Ala   544
1681  TTC ACA GTG CTG GAG TGC GAG GGC TCC CGG CGG CTC GGC TCT CGG CCC  1728
 545  Phe Thr Val Leu Glu Cys Glu Gly Ser Arg Arg Leu Gly Ser Arg Pro   560
1729  CGG CGC TAC CTG CTC ACT GGC CAG GCC AAC GGC AGC TTG GCC ATG TGG  1776
 561  Arg Arg Tyr Leu Leu Thr Gly Gln Ala Asn Gly Ser Leu Ala Met Trp   576
1777  GAC CTA ACC ACC GCC ATG GAC GGC CTC GGC CAG GCC CCT GCA GGT GGC  1824
 577  Asp Leu Thr Thr Ala Met Asp Gly Leu Gly Gln Ala Pro Ala Gly Gly   592
1825  CTG ACG GAG CAA GAG CTG ATG GAA CAG CTG GAA CAC TGT GAG CTG GCC  1872
 593  Leu Thr Glu Gln Glu Leu Met Glu Gln Leu Glu His Cys Glu Leu Ala   608
1873  CCG CCG GCT CCT TCA GCT CCC TCA TGG GGC TGT CTC CCC AGC CCC TCA  1920
 609  Pro Pro Ala Pro Ser Ala Pro Ser Trp Gly Cys Leu Pro Ser Pro Ser   624
1921  CCC CGC ATC TCC CTC ACC AGC CTC CAC TCA GCC TCC AGC AAC ACC TCC  1968
 625  Pro Arg Ile Ser Leu Thr Ser Leu His Ser Ala Ser Ser Asn Thr Ser   640
1969  TTG TCT GGC CAC CGT GGG AGC CCA AGC CCC CCG CAG GCT GAG GCC CGG  2016
 641  Leu Ser Gly His Arg Gly Ser Pro Ser Pro Pro Gln Ala Glu Ala Arg   656
2017  CGC CGT GGT GGG GGC AGC TTT GTG GAA CGC TGC CAG GAA CTG GTG CGG  2064
 657  Arg Arg Gly Gly Gly Ser Phe Val Glu Arg Cys Gln Glu Leu Val Arg   672
2065  AGT GGG CCA GAC CTC CGA CGG CCA CCC ACA CCA GCC CCG TGG CCC TCC  2112
 673  Ser Gly Pro Asp Leu Arg Arg Pro Pro Thr Pro Ala Pro Trp Pro Ser   688
2113  AGC GGT CTC GGC ACT CCC CTC ACA CCT CCC AAG ATG AAG CTC AAT GAA  2160
 689  Ser Gly Leu Gly Thr Pro Leu Thr Pro Pro Lys Met Lys Leu Asn Glu   704
2161  ACT TCC TTT TGA ACA ACG CAG CTG CCA TGA TGC CTT GGG ATG CCC TGG  2208
 705  Thr Ser Phe ***                                                   708
2209  TCC TGG GGG ACT CAG GTG CCT CCC TGA TTC CTG TGG GAA CCC CGG GTT  2256
2257  CAG GGC CAG GGC CTC CTT GGA ATA AAT GGT TAT TGT TAC TAG GTC CCC  2304
2305  ACC TTC CCT CTT TTC TGG AAG CCA AAG TCA GCC TCC CCA ATA AAG TCC  2352
2353  TCA CTG CCA AAA AAA AAA AAA AAA AAA                              2379
3. PP238
A:核苷酸序列(SEQ ID NO:7)长度:2023
GGGCTAGGGC CGGGGCCTGG CTGCGCGGCT GGGCCAAGGC CCGCGATGGT GATCTGCTGT  60
GCGGCCGTGA ACTGCTCCAA CCGGCAGGGA AAGGGCGAGA AGCGCGCCGT CTCCTTCCAC  120
AGGTTCCCCC TAAAGGACTC AAAACGTCTA ATCCAATGGT TAAAAGCTGT TCAGAGGGAT  180
AACTGGACTC CCACTAAGTA TTCATTTCTC TGTAGTGAGC ATTTCACCAA AGACAGCTTC  240
TCCAAGAGGC TGGAGGACCA GCATCGCCTG CTGAAGCCCA CGGCCGTGCC ATCCATCTTC  300
CACCTGACCG AGAAGAAGAG GGGGGCTGGA GGCCATGGCC GCACCCGGAG AAAAGATGCC  360
AGCAAGGCCA CAGGGGGTGT GAGGGGACAC TCGAGTGCCG CCACCGGCAG AGGAGCTGCA  420
GGTTGGTCAC CGTCCTCGAG TGGAAACCCG ATGGCCAAGC CAGAGTCCCG CAGGTTGAAG  480
CAAGCTGCTC TGCAAGGTGA AGCCACACCC AGGGCGGCCC AGGAGGCCGC CAGCCAGGAG  540
CAGGCCCAGC AAGCTCTGGA ACGGACTCCA GGAGATGGAC TGGCCACCAT GGTGGCAGGC  600
AGTCAGGGAA AAGCAGAAGC GTCTGCCACA GATGCTGGCG ATGAGAGCGC CACTTCCTCC  660
ATCGAAGGGG GCGTGACAGA TAAGAGTGGC ATTTCTATGG ATGACTTTAC GCCCCCAGGA  720
TCTGGGGCGT GCAAATTTAT CGGCTCACTT CATTCGTACA GTTTCTCCTC TAAGCACACC  780
CGAGAAAGGC CATCTGTCCC CCGAGAGCCC ATTGACCGCA AGAGGCTGAA GAAAGATGTG  840
GAACCAAGCT GCAGTGGGAG CAGCCTGGGA CCCGACAAGG GCCTGGCCCA GAGCCCTCCC  900
AGCTCATCAC TTACCGCGAC ACCGCAGAAG CCTTCCCAGA GCCCCTCTGC CCCTCCTGCC  960
GACGTCACCC CAAAGCCAGC CACGGAAGCC GTGCAGAGCG AGCACAGCGA CGCCAGCCCC  1020
ATGTCCATCA ACGAGGTCAT CCTGTCGGCG TCAGGGGCCT GCAAGCTCAT CGACTCACTG  1080
CACTCCTACT GCTTCTCCTC CCGGCAGAAC AAGAGCCAGG TGTGCTGCCT GCGGGAGCAG  1140
GTGGAGAAGA AGAACGGCGA GCTGAAGAGC CTGCGGCAGA GGGTCAGCCG CTCCGACAGC  1200
CAGGTGCGGA AGCTACAGGA GAAGCTGGAT GAGCTGAGGA GAGTGAGCGT CCCCTATCCA  1260
AGTAGCCTGC TGTCGCCCAG CCGCGAGCCC CCCAAGATGA ACCCAGTGGT GGAGCCACTG  1320
TCCTGGATGC TGGGCACCTG GCTGTCGGAC CCACCTGGAG CCGGGACCTA CCCCACACTG  1380
CAGCCCTTCC AGTACCTGGA GGAGGTTCAC ATCTCCCACG TGGGCCAGCC CATGCTGAAC  1440
TTCTCGTTCA ACTCCTTCCA CCCGGACACG CGCAAGCCGA TGCACAGAGA GTGTGGCTTC  1500
ATTCGCCTCA AGCCCGACAC CAACAAGGTG GCCTTTGTCA GCGCCCAGAA CACAGGCGTG  1560
GTGGAAGTGG AGGAGGGCGA GGTGAACGGG CAGGAGCTGT GCATCGCATC CCACTCCATC  1620
GCCAGGATCT CCTTCGCCAA GGAGCCCCAC GTAGAGCAGA TCACCCGGAA GTTCAGGCTG  1680
AATTCTGAAG GCAAACTTGA GCAGACGGTC TCCATGGCAA CCACGACACA GCCAATGACT  1740
CAGCATCTTC ACGTCACCTA CAAGAAGGTG ACCCCGTAAA CCTAGAGCTT CTGGAGCCCT  1800
CGGGAGGGCC TGGCTACTGT GCCTCAACGG TTCGGCTCCT CAACAGACAG TCCCTGCGGC  1860
AAAAGTGGGT GTGGCCGTGA GCCTCTGCAG GCTCAAGAGT GTTGTCCAGA TGTTTCTGTA  1920
CTGGCATAGA AAAACCAAAT AAAAGGCCTT TATTTTTATG GCTGAGGATT TTGAATATTA  1980
AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAA                    2023
B:氨基酸序列(SEQ ID NO:8)长度:577
  1  MVICCAAVNC SNRQGKGEKR AVSFHRFPLK DSKRLIQWLK AVQRDNWTPT
 51  KYSFLCSEHF TKDSFSKRLE DQHRLLKPTA VPSIFHLTEK KRGAGGHGRT
101  RRKDASKATG GVRGHSSAAT GRGAAGWSPS SSGNPMAKPE SRRLKQAALQ
151  GEATPRAAQE AASQEQAQQA LERTPGDGLA TMVAGSQGKA EASATDAGDE
201  SATSSIEGGV TDKSGISMDD FTPPGSGACK FIGSLHSYSF SSKHTRERPS
251  VPREPIDRKR LKKDVEPSCS GSSLGPDKGL AQSPPSSSLT ATPQKPSQSP
301  SAPPADVTPK PATEAVQSEH SDASPMSINE VILSASGACK LIDSLHSYCF
351  SSRQNKSQVC CLREQVEKKN GELKSLRQRV SRSDSQVRKL QEKLDELRRV
401  SVPYPSSLLS PSREPPKMNP VVEPLSWMLG TWLSDPPGAG TYPTLQPFQY
451  LEEVHISHVG QPMLNFSFNS FHPDTRKPMH RECGFIRLKP DTNKVAFVSA
501  QNTGVVEVEE GEVNGQELCI ASHSIARISF AKEPHVEQIT RKFRLNSEGK
551  LEQTVSMATT TQPMTQHLHV TYKKVTP
克隆号:PP238(SEQ ID NO:9)
起始编码子:46 ATG  终止编码子:1779 TAA蛋白质分子量:62856.51
  1  GGG CTA GGG CCG GGG CCT GGC TGC GCG GCT GGG CCA AGG CCC GCG ATG     48
  1                                                              Met      1
 49  GTG ATC TGC TGT GCG GCC GTG AAC TGC TCC AAC CGG CAG GGA AAG GGC     96
  2  Val Ile Cys Cys Ala Ala Val Asn Cys Ser Asn Arg Gln Gly Lys Gly     17
 97  GAG AAG CGC GCC GTC TCC TTC CAC AGG TTC CCC CTA AAG GAC TCA AAA    144
 18  Glu Lys Arg Ala Val Ser Phe His Arg Phe Pro Leu Lys Asp Ser Lys     33
145  CGT CTA ATC CAA TGG TTA AAA GCT GTT CAG AGG GAT AAC TGG ACT CCC    192
 34  Arg Leu Ile Gln Trp Leu Lys Ala Val Gln Arg Asp Asn Trp Thr Pro     49
193  ACT AAG TAT TCA TTT CTC TGT AGT GAG CAT TTC ACC AAA GAC AGC TTC    240
 50  Thr Lys Tyr Ser Phe Leu Cys Ser Glu His Phe Thr Lys Asp Ser Phe     65
241  TCC AAG AGG CTG GAG GAC CAG CAT CGC CTG CTG AAG CCC ACG GCC GTG    288
 66  Ser Lys Arg Leu Glu Asp Gln His Arg Leu Leu Lys Pro Thr Ala Val     81
289  CCA TCC ATC TTC CAC CTG ACC GAG AAG AAG AGG GGG GCT GGA GGC CAT    336
 82  Pro Ser Ile Phe His Leu Thr Glu Lys Lys Arg Gly Ala Gly Gly His     97
337  GGC CGC ACC CGG AGA AAA GAT GCC AGC AAG GCC ACA GGG GGT GTG AGG    384
 98  Gly Arg Thr Arg Arg Lys Asp Ala Ser Lys Ala Thr Gly Gly Val Arg    113
385  GGA CAC TCG AGT GCC GCC ACC GGC AGA GGA GCT GCA GGT TGG TCA CCG    432
114  Gly His Ser Ser Ala Ala Thr Gly Arg Gly Ala Ala Gly Trp Ser Pro    129
433  TCC TCG AGT GGA AAC CCG ATG GCC AAG CCA GAG TCC CGC AGG TTG AAG    480
130  Ser Ser Ser Gly Asn Pro Met Ala Lys Pro Glu Ser Arg Arg Leu Lys    145
481  CAA GCT GCT CTG CAA GGT GAA GCC ACA CCC AGG GCG GCC CAG GAG GCC    528
146  Gln Ala Ala Leu Gln Gly Glu Ala Thr Pro Arg Ala Ala Gln Glu Ala    161
529  GCC AGC CAG GAG CAG GCC CAG CAA GCT CTG GAA CGG ACT CCA GGA GAT    576
 162  Ala Ser Gln Glu Gln Ala Gln Gln Ala Leu Glu Arg Thr Pro Gly Asp   177
 577  GGA CTG GCC ACC ATG GTG GCA GGC AGT CAG GGA AAA GCA GAA GCG TCT   624
 178  Gly Leu Ala Thr Met Val Ala Gly Ser Gln Gly Lys Ala Glu Ala Ser   193
 625  GCC ACA GAT GCT GGC GAT GAG AGC GCC ACT TCC TCC ATC GAA GGG GGC   672
 194  Ala Thr Asp Ala Gly Asp Glu Ser Ala Thr Ser Ser Ile Glu Gly Gly   209
 673  GTG ACA GAT AAG AGT GGC ATT TCT ATG GAT GAC TTT ACG CCC CCA GGA   720
 210  Val Thr Asp Lys Ser Gly Ile Ser Met Asp Asp Phe Thr Pro Pro Gly   225
 721  TCT GGG GCG TGC AAA TTT ATC GGC TCA CTT CAT TCG TAC AGT TTC TCC   768
 226  Ser Gly Ala Cys Lys Phe Ile Gly Ser Leu His Ser Tyr Ser Phe Ser   241
 769  TCT AAG CAC ACC CGA GAA AGG CCA TCT GTC CCC CGA GAG CCC ATT GAC   816
 242  Ser Lys His Thr Arg Glu Arg Pro Ser Val Pro Arg Glu Pro Ile Asp   257
 817  CGC AAG AGG CTG AAG AAA GAT GTG GAA CCA AGC TGC AGT GGG AGC AGC   864
 258  Arg Lys Arg Leu Lys Lys Asp Val Glu Pro Ser Cys Ser Gly Ser Ser   273
 865  CTG GGA CCC GAC AAG GGC CTG GCC CAG AGC CCT CCC AGC TCA TCA CTT   912
 274  Leu Gly Pro Asp Lys Gly Leu Ala Gln Ser Pro Pro Ser Ser Ser Leu   289
 913  ACC GCG ACA CCG CAG AAG CCT TCC CAG AGC CCC TCT GCC CCT CCT GCC   960
 290  Thr Ala Thr Pro Gln Lys Pro Ser Gln Ser Pro Ser Ala Pro Pro Ala   305
 961  GAC GTC ACC CCA AAG CCA GCC ACG GAA GCC GTG CAG AGC GAG CAC AGC  1008
 306  Asp Val Thr Pro Lys Pro Ala Thr Glu Ala Val Gln Ser Glu His Ser   321
1009  GAC GCC AGC CCC ATG TCC ATC AAC GAG GTC ATC CTG TCG GCG TCA GGG  1056
 322  Asp Ala Ser Pro Met Ser Ile Asn Glu Val Ile Leu Ser Ala Ser Gly   337
1057  GCC TGC AAG CTC ATC GAC TCA CTG CAC TCC TAC TGC TTC TCC TCC CGG  1104
 338  Ala Cys Lys Leu Ile Asp Ser Leu His Ser Tyr Cys Phe Ser Ser Arg   353
1105  CAG AAC AAG AGC CAG GTG TGC TGC CTG CGG GAG CAG GTG GAG AAG AAG  1152
 354  Gln Asn Lys Ser Gln Val Cys Cys Leu Arg Glu Gln Val Glu Lys Lys   369
1153  AAC GGC GAG CTG AAG AGC CTG CGG CAG AGG GTC AGC CGC TCC GAC AGC  1200
 370  Asn Gly Glu Leu Lys Ser Leu Arg Gln Arg Val Ser Arg Ser Asp Ser   385
1201  CAG GTG CGG AAG CTA CAG GAG AAG CTG GAT GAG CTG AGG AGA GTG AGC  1248
 386  Gln Val Arg Lys Leu Gln Glu Lys Leu Asp Glu Leu Arg Arg Val Ser   401
1249  GTC CCC TAT CCA AGT AGC CTG CTG TCG CCC AGC CGC GAG CCC CCC AAG  1296
 402  Val Pro Tyr Pro Ser Ser Leu Leu Ser Pro Ser Arg Glu Pro Pro Lys   417
1297  ATG AAC CCA GTG GTG GAG CCA CTG TCC TGG ATG CTG GGC ACC TGG CTG  1344
 418  Met Asn Pro Val Val Glu Pro Leu Ser Trp Met Leu Gly Thr Trp Leu   433
1345  TCG GAC CCA CCT GGA GCC GGG ACC TAC CCC ACA CTG CAG CCC TTC CAG  1392
 434  Ser Asp Pro Pro Gly Ala Gly Thr Tyr Pro Thr Leu Gln Pro Phe Gln   449
1393  TAC CTG GAG GAG GTT CAC ATC TCC CAC GTG GGC CAG CCC ATG CTG AAC  1440
 450  Tyr Leu Glu Glu Val His Ile Ser His Val Gly Gln Pro Met Leu Asn   465
1441  TTC TCG TTC AAC TCC TTC CAC CCG GAC ACG CGC AAG CCG ATG CAC AGA  1488
 466  Phe Ser Phe Asn Ser Phe His Pro Asp Thr Arg Lys Pro Met His Arg   481
1489  GAG TGT GGC TTC ATT CGC CTC AAG CCC GAC ACC AAC AAG GTG GCC TTT  1536
 482  Glu Cys Gly Phe Ile Arg Leu Lys Pro Asp Thr Asn Lys Val Ala Phe   497
1537  GTC AGC GCC CAG AAC ACA GGC GTG GTG GAA GTG GAG GAG GGC GAG GTG  1584
 498  Val Ser Ala Gln Asn Thr Gly Val Val Glu Val Glu Glu Gly Glu Val   513
1585  AAC GGG CAG GAG CTG TGC ATC GCA TCC CAC TCC ATC GCC AGG ATC TCC  1632
 514  Asn Gly Gln Glu Leu Cys Ile Ala Ser His Ser Ile Ala Arg Ile Ser   529
1633  TTC GCC AAG GAG CCC CAC GTA GAG CAG ATC ACC CGG AAG TTC AGG CTG  1680
 530  Phe Ala Lys Glu Pro His Val Glu Gln Ile Thr Arg Lys Phe Arg Leu   545
1681  AAT TCT GAA GGC AAA CTT GAG CAG ACG GTC TCC ATG GCA ACC ACG ACA  1728
 546  Asn Ser Glu Gly Lys Leu Glu Gln Thr Val Ser Met Ala Thr Thr Thr   561
1729  CAG CCA ATG ACT CAG CAT CTT CAC GTC ACC TAC AAG AAG GTG ACC CCG  1776
 562  Gln Pro Met Thr Gln His Leu His Val Thr Tyr Lys Lys Val Thr Pro   577
1777  TAA ACC TAG AGC TTC TGG AGC CCT CGG GAG GGC CTG GCT ACT GTG CCT  1824
 578  ***                                                               578
1825  CAA CGG TTC GGC TCC TCA ACA GAC AGT CCC TGC GGC AAA AGT GGG TGT  1872
1873  GGC CGT GAG CCT CTG CAG GCT CAA GAG TGT TGT CCA GAT GTT TCT GTA  1920
1921  CTG GCA TAG AAA AAC CAA ATA AAA GGC CTT TAT TTT TAT GGC TGA GGA    1968
1969  TTT TGA ATA TTA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    2016
2017  AAA AAA A                                                          2023
4. PP856
A:核苷酸序列(SEQ ID NO:10)长度:2364
GGAACACGTG CTTTCTGGGC AGGTCGCCCC TCAGTCTCCA CTAGAGACAG GACTGACCAG  60
TTGCTCTTCC TTCCAAGAAC CTTCGAGATC TGCGGTCTGG GGTCTGGTTG AAAGATGGCG  120
GCCCTCACTA CCCTGTTTAA GTACATAGAT GAAAATCAGG ATCGCTACAT TAAGAAACTC  180
GCAAAATGGG TGGCTATCCA GAGTGTGTCT GCGTGGCCGG AGAAGAGAGG CGAAATCAGG  240
AGGATGATGG AAGTTGCTGC TGCAGATGTT AAGCAGTTGG GGGGCTCTGT GGAACTGGTG  300
GATATCGGAA AACAAAAGGA GATTCCTGTC AACGTCCGAT TCTGCCTCGA AGGCATGGAG  360
GAGTCAGGCT CTGAGGGCCT AGACGAGCTG ATTTTTGCCC GGAAAGACAC ATTCTTTAAG  420
GATGTGGACT ATGTCTGCAT TTCTGACAAT TACTGGCTGG GAAAGAAGAA GCCCTGCATC  480
ACCTACGGCC TCAGGGGCAT TTGCTACTTT TTCATCGAGG TGGAGTGCAG CAACAAAGAC  540
CTCCATTCTG GCGTGTACGG GGGCTCGGTG CATGAGGCCA TGACTGATCT CATTTTGCTG  600
ATGGGCTCTT TGGTGGACAA GAGGGGGAAC ATCCTGATCC CCGGCATTAA CGAGGCCGTG  660
GCCGCCGTCA CGGAAGAGGA GCACAAGCTG TACGACGACA TCGACTTTGA CATAGAGGAG  720
TTTGCCAAGG ATGTGGGGGC GCAGATCCTC CTGCACAGCC ACAAGAAAGA CATCCTCATG  780
CACCGATGGC GGTACCCGTC TCTGTCCCTC CATGGCATCG AAGGCGCCTT CTCTGGGTCT  840
GGGGCCAAGA CCGTGATTCC CAGGAAGGTG GTTGGCAAGT TCTCCATCAG GCTCGTGCCG  900
AACATGACTC CTGAAGTCGT CGGCGAGCAG GTCACAAGCT ACCTAACTAA GAAGTTTGCT  960
GAACTACGCA GCCCCAATGA GTTCAAGGTG TACATGGGCC ACGGTGGGAA GCCCTGGGTC  1020
TCCGACTTCA GTCACCCTCA TTACCTGGCT GGGAGAAGAG CCATGAAGAC AGTTTTTGGT  1080
GTTGAGCCAG ACTTGACCAG GGAAGGCGGC AGTATTCCCG TGACCTTGAC CTTTCAGGAG  1140
GCCACGGGCA AGAACGTCAT GCTGCTGCCT GTGGGGTCAG CGGATGACGG AGCCCACTCC  1200
CAGAATGAAA AGCTCAACAG GTATAACTAC ATAGAGGGAA CCAAGATGCT GGCCGCGTAC  1260
CTGTATGAGG TCTCCCAGCT GAAGGACTAG GCCAAGCCCT CTGTGTGCCA TCTCCAATGA  1320
GAAGGAATCC TGCCCTCACC TCACCCTTTT CCAACTTGCC CAGGGAAGTG GAGGTTCCCT  1380
CTTTCCTTTC CCTCTTGTCA GGTCATCCAT GACTTTAGAG AACAGACACA AGTGTATCCA  1440
GCTGTCCACG GGTGGAGCTA CCCGTTGGGC TTATGAGTGA CCTGGAGTGA CAGCTGAGTC  1500
ACCCTGGGTA AGTTCTCAGA GTGGTCAGGA TGGCTTGACC TGCAGAAGAT ACCCAAGGTC  1560
CAAAAGCACA AGGTCTGCGG AAAGTTCTGG TTGTCGGCTG GGCACCACGG CTCACACCTA  1620
TAATCGAGCA CTTTGGGAGG CCAAGACAGG AGGATCACTT GAGGCCAGGA GTCTGAGACA  1680
AGCCTAGGCA ACAAAACAAG ACTCTGTCTC TACAAAAAGT TTAAGAAATG AGCCAGACAT  1740
GGTGGTGTAT GCCTGTAGTC CCAGCCACTC AGAAGGCTGA GGCAGGAGGA TCGCTTGAGA  1800
CCAAGAGTTT GAGCCTGCGG TGAGCTGTGA ATGCACCACG GCACTCAAGC CTGGGCAATG  1860
TAGCAAGATC CTGTCTCTAC AAGAAATTTT TTAAAAATGA GCCAAGTGTG GTGGTGCATG  1920
CCTGTAGTTC CAGCTACTCA GGACACTGAC GTAGGAGGGT TGCTTGAGAC TGAGAGTTGG  1980
AGGCTGCGAT GAGCCATGAA TGCCCCACTG CACTCCAGCC TGGGCGACAG AACGAGACCC  2040
CATCTCAAAA AAAATAAGTT CTGGTTGTCA TTGAATTGGG ATAAACAGAG AGCTTGATGC  2100
TTTCTGCCTT CTGTCTCAGG TGATGCATTG CACATTTGGG ATATTTGGAA AGGAAATGAG  2160
GAAAGAAATT AGGGCCTCCT CTGATCTCTC GCTATCTGCG GGTCCTGTCC TTTTCTCAAG  2220
ACCTTCACCA TTACTGGTGT TTTCCTGTCT TCTCTTTAGT ATGATCCCTC AAAACCTCAC  2280
TAACTGGAAG GATGATTTTG TCTCAGTTTG TACTCCTAAA TAAAAAGTAA ACATGACACC  2340
TCTAAAAAAA AAAAAAAAAA AAAA                                         2364
B:氨基酸序列(SEQ ID NO:11)长度:391
  1  MAALTTLFKY IDENQDRYIK KLAKWVAIQS VSAWPEKRGE IRRMMEVAAA
 51  DVKQLGGSVE LVDIGKQKEI PVNVRFCLEG MEESGSEGLD ELIFARKDTF
101  FKDVDYVCIS DNYWLGKKKP CITYGLRGIC YFFIEVECSN KDLHSGVYGG
151  SVHEAMTDLI LLMGSLVDKR GNILIPGINE AVAAVTEEEH KLYDDIDFDI
201  EEFAKDVGAQ ILLHSHKKDI LMHRWRYPSL SLHGIEGAFS GSGAKTVIPR
251  KVVGKFSIRL VPNMTPEVVG EQVTSYLTKK FAELRSPNEF KVYMGHGGKP
301  WVSDFSHPHY LAGRRAMKTV FGVEPDLTRE GGSIPVTLTF QEATGKNVML
351  LPVGSADDGA HSQNEKLNRY NYIEGTKMLA AYLYEVSQLK D
克隆号:PP856(SEQ ID NO:12)
起始编码子:115 ATG  终止编码子:1290 TAG  蛋白质分子量:43831.06
   1  GGA ACA CGT GCT TTC TGG GCA GGT CGC CCC TCA GTC TCC ACT AGA GAC    48
  49  AGG ACT GAC CAG TTG CTC TTC CTT CCA AGA ACC TTC GAG ATC TGC GGT    96
  97  CTG GGG TCT GGT TGA AAG ATG GCG GCC CTC ACT ACC CTG TTT AAG TAC   144
   1                          Met Ala Ala Leu Thr Thr Leu Phe Lys Tyr    10
 145  ATA GAT GAA AAT CAG GAT CGC TAC ATT AAG AAA CTC GCA AAA TGG GTG   192
  11  Ile Asp Glu Asn Gln Asp Arg Tyr Ile Lys Lys Leu Ala Lys Trp Val    26
 193  GCT ATC CAG AGT GTG TCT GCG TGG CCG GAG AAG AGA GGC GAA ATC AGG   240
  27  Ala Ile Gln Ser Val Ser Ala Trp Pro Glu Lys Arg Gly Glu Ile Arg    42
 241  AGG ATG ATG GAA GTT GCT GCT GCA GAT GTT AAG CAG TTG GGG GGC TCT   288
  43  Arg Met Met Glu Val Ala Ala Ala Asp Val Lys Gln Leu Gly Gly Ser    58
 289  GTG GAA CTG GTG GAT ATC GGA AAA CAA AAG GAG ATT CCT GTC AAC GTC   336
  59  Val Glu Leu Val Asp Ile Gly Lys Gln Lys Glu Ile Pro Val Asn Val    74
 337  CGA TTC TGC CTC GAA GGC ATG GAG GAG TCA GGC TCT GAG GGC CTA GAC   384
  75  Arg Phe Cys Leu Glu Gly Met Glu Glu Ser Gly Ser Glu Gly Leu Asp    90
 385  GAG CTG ATT TTT GCC CGG AAA GAC ACA TTC TTT AAG GAT GTG GAC TAT   432
  91  Glu Leu Ile Phe Ala Arg Lys Asp Thr Phe Phe Lys Asp Val Asp Tyr   106
 433  GTC TGC ATT TCT GAC AAT TAC TGG CTG GGA AAG AAG AAG CCC TGC ATC   480
 107  Val Cys Ile Ser Asp Asn Tyr Trp Leu Gly Lys Lys Lys Pro Cys Ile   122
 481  ACC TAC GGC CTC AGG GGC ATT TGC TAC TTT TTC ATC GAG GTG GAG TGC   528
 123  Thr Tyr Gly Leu Arg Gly Ile Cys Tyr Phe Phe Ile Glu Val Glu Cys   138
 529  AGC AAC AAA GAC CTC CAT TCT GGG GTG TAC GGG GGC TCG GTG CAT GAG   576
 139  Ser Asn Lys Asp Leu His Ser Gly Val Tyr Gly Gly Ser Val His Glu   154
 577  GCC ATG ACT GAT CTC ATT TTG CTG ATG GGC TCT TTG GTG GAC AAG AGG   624
 155  Ala Met Thr Asp Leu Ile Leu Leu Met Gly Ser Leu Val Asp Lys Arg   170
 625  GGG AAC ATC CTG ATC CCC GGC ATT AAC GAG GCC GTG GCC GCC GTC ACG   672
 171  Gly Asn Ile Leu Ile Pro Gly Ile Asn Glu Ala Val Ala Ala Val Thr   186
 673  GAA GAG GAG CAC AAG CTG TAC GAC GAC ATC GAC TTT GAC ATA GAG GAG   720
 187  Glu Glu Glu His Lys Leu Tyr Asp Asp Ile Asp Phe Asp Ile Glu Glu   202
 721  TTT GCC AAG GAT GTG GGG GCG CAG ATC CTC CTG CAC AGC CAC AAG AAA   768
 203  Phe Ala Lys Asp Val Gly Ala Gln Ile Leu Leu His Ser His Lys Lys   218
 769  GAC ATC CTC ATG CAC CGA TGG CGG TAC CCG TCT CTG TCC CTC CAT GGC   816
 219  Asp Ile Leu Met His Arg Trp Arg Tyr Pro Ser Leu Ser Leu His Gly   234
 817  ATC GAA GGC GCC TTC TCT GGG TCT GGG GCC AAG ACC GTG ATT CCC AGG   864
 235  Ile Glu Gly Ala Phe Ser Gly Ser Gly Ala Lys Thr Val Ile Pro Arg   250
 865  AAG GTG GTT GGC AAG TTC TCC ATC AGG CTC GTG CCG AAC ATG ACT CCT   912
 251  Lys Val Val Gly Lys Phe Ser Ile Arg Leu Val Pro Asn Met Thr Pro   266
 913  GAA GTC GTC GGC GAG CAG GTC ACA AGC TAC CTA ACT AAG AAG TTT GCT   960
 267  Glu Val Val Gly Glu Gln Val Thr Ser Tyr Leu Thr Lys Lys Phe Ala   282
 961  GAA CTA CGC AGC CCC AAT GAG TTC AAG GTG TAC ATG GGC CAC GGT GGG  1008
 283  Glu Leu Arg Ser Pro Asn Glu Phe Lys Val Tyr Met Gly His Gly Gly   298
1009  AAG CCC TGG GTC TCC GAC TTC AGT CAC CCT CAT TAC CTG GCT GGG AGA  1056
 299  Lys Pro Trp Val Ser Asp Phe Ser His Pro His Tyr Leu Ala Gly Arg   314
1057  AGA GCC ATG AAG ACA GTT TTT GGT GTT GAG CCA GAC TTG ACC AGG GAA  1104
 315  Arg Ala Met Lys Thr Val Phe Gly Val Glu Pro Asp Leu Thr Arg Glu   330
1105  GGC GGC AGT ATT CCC GTG ACC TTG ACC TTT CAG GAG GCC ACG GGC AAG  1152
 331  Gly Gly Ser Ile Pro Val Thr Leu Thr Phe Gln Glu Ala Thr Gly Lys   346
1153  AAC GTC ATG CTG CTG CCT GTG GGG TCA GCG GAT GAC GGA GCC CAC TCC  1200
 347  Asn Val Met Leu Leu Pro Val Gly Ser Ala Asp Asp Gly Ala His Ser   362
1201  CAG AAT GAA AAG CTC AAC AGG TAT AAC TAC ATA GAG GGA ACC AAG ATG  1248
 363  Gln Asn Glu Lys Leu Asn Arg Tyr Asn Tyr Ile Glu Gly Thr Lys Met   378
1249  CTG GCC GCG TAC CTG TAT GAG GTC TCC CAG CTG AAG GAC TAG GCC AAG  1296
 379  Leu Ala Ala Tyr Leu Tyr Glu Val Ser Gln Leu Lys Asp ***           392
1297  CCC TCT GTG TGC CAT CTC CAA TGA GAA GGA ATC CTG CCC TCA CCT CAC  1344
1345  CCT TTT CCA ACT TGC CCA GGG AAG TGG AGG TTC CCT CTT TCC TTT CCC  1392
1393  TCT TGT CAG GTC ATC CAT GAC TTT AGA GAA CAG ACA CAA GTG TAT CCA  1440
144l  GCT GTC CAC GGG TGG AGC TAC CCG TTG GGC TTA TGA GTG ACC TGG AGT  1488
1489  GAC AGC TGA GTC ACC CTG GGT AAG TTC TCA GAG TGG TCA GGA TGG CTT  1536
1537  GAC CTG CAG AAG ATA CCC AAG GTC CAA AAG CAC AAG GTC TGC GGA AAG  1584
1585  TTC TGG TTG TCG GCT GGG CAC CAC GGC TCA CAC CTA TAA TCG AGC ACT  1632
1633  TTG GGA GGC CAA GAC AGG AGG ATC ACT TGA GGC CAG GAG TCT GAG ACA  1680
1681  AGC CTA GGC AAC AAA ACA AGA CTC TGT CTC TAC AAA AAG TTT AAG AAA  1728
1729  TGA GCC AGA CAT GGT GGT GTA TGC CTG TAG TCC CAG CCA CTC AGA AGG  1776
1777  CTG AGG CAG GAG GAT CGC TTG AGA CCA AGA GTT TGA GCC TGC GGT GAG  1824
1825  CTG TGA ATG CAC CAC GGC ACT CAA GCC TGG GCA ATG TAG CAA GAT CCT  1872
1873  GTC TCT ACA AGA AAT TTT TTA AAA ATG AGC CAA GTG TGG TGG TGC ATG  1920
1921  CCT GTA GTT CCA GCT ACT CAG GAC ACT GAC GTA GGA GGG TTG CTT GAG  1968
1969  ACT GAG AGT TGG AGG CTG CGA TGA GCC ATG AAT GCC CCA CTG CAC TCC  2016
2017  AGC CTG GGC GAC AGA ACG AGA CCC CAT CTC AAA AAA AAT AAG TTC TGG  2064
2065  TTG TCA TTG AAT TGG GAT AAA CAG AGA GCT TGA TGC TTT CTG CCT TCT  2112
2113  GTC TCA GGT GAT GCA TTG CAC ATT TGG GAT ATT TGG AAA GGA AAT GAG  2160
2161  GAA AGA AAT TAG GGC CTC CTC TGA TCT CTC GCT ATC TGC GGG TCC TGT  2208
2209  CCT TTT CTC AAG ACC TTC ACC ATT ACT GGT GTT TTC CTG TCT TCT CTT  2256
2257  TAG TAT GAT CCC TCA AAA CCT CAC TAA CTG GAA GGA TGA TTT TGT CTC  2304
2305  AGT TTG TAC TCC TAA ATA AAA AGT AAA CAT GAC ACC TCT AAA AAA AAA  2352
2353  AAA AAA AAA AAA                                                  2364
5. PP1065
A:核苷酸序列(SEQ ID NO:13)长度:1910
GGGAAGTAGA AGACAGCGGC GTTGCCATGG CGGCGTCTCT GGGGCAGGTG TTGGCTCTGG  60
TGCTGGTGGC CGCTCTGTGG GGTGGCACGC AGCCGCTGCT GAAGCGGGCC TCCGCCGGCC  120
TGCAGCGGGT TCATGAGCCG ACCTGGGCCC AGCAGTTGCT ACAGGAGATG AAGACCCTCT  180
TCTTGAATAC TGAGTACCTG ATGCCCTTTC TCCTCAACCA GTGTGGATCC CTTCTCTATT  240
ACCTCACCTT GGCATCGACA GATCTGACCC TGGCTGTGCC CATCTGTAAC TCTCTGGCTA  300
TCATCTTCAC ACTGATTGTT GGGAAGGCCC TTGGAGAAGA TATTGGTGGA AAACGAGCAG  360
TTGCTGGCAT GGTGCTCACC GTGATAGGAA TTTCACTCTG CATCACAAGC TCAGTTCCAT  420
GGACTGCAGA ACTCCAGCTG CATGGAAAGG GCCAGCTGCA GACTTTGAGC CAGAAATGCA  480
AACGGGAGGC CTCTGGGACT CAGTCAGAGC GCTTTGGCTG AATGAGGGGT GGAACCGAGG  540
GAAGAAGGTA GAGAGCTGTG AGCCCCAGCC CCACCTGACT CCAGCACACC TGGCGAGTAG  600
TAGCTGTCAA TAAATCTATG GTAAACAGAC AAGAGGAGGT GGAAGGCCAT ACAGAATGGA  660
GCCGTGAGTA TGGCCAGCCT CCAGCTCTCA GCCAGGAGGT CCCCAACCCC AAGGAAGGAA  720
GAAACTGGAA ATTAGGAACT GCTTCCTCAT TTAACAAGGT AGGAAGTTAG GAGATCATTT  780
ACTTTCAATC ACAAGGGAGG AGAACTGTTC CTGGGGCCCA AGGCTGCCAG TTTCCAGCTC  840
AGAGCTCCTC CCACCCCAAC ATACTGTTTC CTGATCCAAC AGCTTACCTG ATCCAAGGGC  900
TCCTCTGTCT GAGTGTCTTC ATCATCTGCT ACTTCCAGGG CCCCCGCTGT CTCCTTCCTT  960
CGGTGGGGAG CTCCATATAC TCCTATAACT CCTAAAGAGG GGAGGCAGCA CTGGGTGATG  1020
CCCAGGCTGA AGAGCCCTCA GCATTCCTGC CCTGGACCTT CATGCTAGCC CCTTTCCCTC  1080
CCCTGAACCT GGTTCTGCAT TCCCCACCAC CTCCCAGGAT GGCAAGGAAG TGAGAGGTGG  1140
GCCTTTGGTC CCACCCCCAT CCCCTCTATA TCCCACCCCT GAAGTCTTAT CGCTTTAAGC  1200
ACTGCCCTTT CCAGGTGCTT CTTTTCATGT GATGAGGCCC TGTGAAGAAG GGACAGGATA  1260
TACAGACGGG GGCAGCTGGA GACAGTTATG ATGAGTGCCG GCTTTGTGTC TGAGCATTCT  1320
GCTCCCATGG ACATCCCCAA CAACAGCAGG GACCAACCTA TGTCACTGTC AAAGGGCAGC  1380
TGAGAAGGGC CTGAGCCCCA GGGACCCCTC ACCTGATGGG AATGAGAGTG TGGGGAGCTT  1440
GCTTCTTGGC TGAATGGTCT GCTGGGGTCT GGCATAGAAA GCAGATGGCT TAATTCGGTC  1500
TGGTTCCTTT GGAGAGGGCT GGGTTACCTG GGCCCTGTGG CCTTGGGCCT AGAGAAGGGA  1560
CACTGGGCTT GGACCCTGAT TGCTGGCCAT TCTTACCTTT CCTACTCCCC AGTTCAGGCT  1620
TCAGAGACCC CCTGACGCCT GCAGGAACAT GGCAGAGGAG ACACCGTCTG TCTTCACAAA  1680
GTACGTCCTC CCTCCTTGCT GCCTCTTCCC ACCAGCCTGA CTTATCCAGG GACAGAGCAG  1740
TAGATGCCTG GCACTCCTCG ATGCCCAGTG AAACCAGACT GTGCTTCCCC ACCCCCACCA  1800
CCATGCCCCA TGCTCACTGG CTCATTTCTT GGGAGGGCTT AGAGCTGGAT AATATAAGTT  1860
CCCTTGGGAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA             1910
B:氨基酸序列(SEQ ID NO:14)长度:164
  1  MAASLGQVLA LVLVAALWGG TQPLLKRASA GLQRVHEPTW AQQLLQEMKT
 51  LFLNTEYLMP FLLNQCGSLL YYLTLASTDL TLAVPICNSL AIIFTLIVGK
101  ALGEDIGGKR AVAGMVLTVI GISLCITSSV PWTAELQLHG KGQLQTLSQK
151  CKREASGTQS ERFG
克隆号:PP1065(SEQ ID NO:15)
起始编码子:27 ATG  终止编码子:521 TGA  蛋白质分子量:17599.78
   1   GG GAA GTA GAA GAC AGC GGC GTT GCC ATG GCG GCG TCT CTG GGG CAG    47
   1                                      Met Ala Ala Ser Leu Gly Gln     7
  48  GTG TTG GCT CTG GTG CTG GTG GCC GCT CTG TGG GGT GGC ACG CAG CCG    95
   8  Val Leu Ala Leu Val Leu Val Ala Ala Leu Trp Gly Gly Thr Gln Pro    23
  96  CTG CTG AAG CGG GCC TCC GCC GGC CTG CAG CGG GTT CAT GAG CCG ACC   143
  24  Leu Leu Lys Arg Ala Ser Ala Gly Leu Gln Arg Val His Glu Pro Thr    39
 144  TGG GCC CAG CAG TTG CTA CAG GAG ATG AAG ACC CTC TTC TTG AAT ACT   191
  40  Trp Ala Gln Gln Leu Leu Gln Glu Met Lys Thr Leu Phe Leu Asn Thr    55
 192  GAG TAC CTG ATG CCC TTT CTC CTC AAC CAG TGT GGA TCC CTT CTC TAT   239
  56  Glu Tyr Leu Met Pro Phe Leu Leu Asn Gln Cys Gly Ser Leu Leu Tyr    71
 240  TAC CTC ACC TTG GCA TCG ACA GAT CTG ACC CTG GCT GTG CCC ATC TGT   287
  72  Tyr Leu Thr Leu Ala Ser Thr Asp Leu Thr Leu Ala Val Pro Ile Cys    87
 288  AAC TCT CTG GCT ATC ATC TTC ACA CTG ATT GTT GGG AAG GCC CTT GGA   335
  88  Asn Ser Leu Ala Ile Ile Phe Thr Leu Ile Val Gly Lys Ala Leu Gly   103
 336  GAA GAT ATT GGT GGA AAA CGA GCA GTT GCT GGC ATG GTG CTC ACC GTG   383
 104  Glu Asp Ile Gly Gly Lys Arg Ala Val Ala Gly Met Val Leu Thr Val   119
 384  ATA GGA ATT TCA CTC TGC ATC ACA AGC TCA GTT CCA TGG ACT GCA GAA   431
 120  Ile Gly Ile Ser Leu Cys Ile Thr Ser Ser Val Pro Trp Thr Ala Glu   135
 432  CTC CAG CTG CAT GGA AAG GGC CAG CTG CAG ACT TTG AGC CAG AAA TGC   479
 136  Leu Gln Leu His Gly Lys Gly Gln Leu Gln Thr Leu Ser Gln Lys Cys   151
 480  AAA CGG GAG GCC TCT GGG ACT CAG TCA GAG CGC TTT GGC TGA ATG AGG   527
 152  Lys Arg Glu Ala Ser Gly Thr Gln Ser Glu Arg Phe Gly ***           165
 528  GGT GGA ACC GAG GGA AGA AGG TAG AGA GCT GTG AGC CCC AGC CCC ACC   575
 576  TGA CTC CAG CAC ACC TGG CGA GTA GTA GCT GTC AAT AAA TCT ATG GTA   623
 624  AAC AGA CAA GAG GAG GTG GAA GGC CAT ACA GAA TGG AGC CGT GAG TAT   671
 672  GGC CAG CCT CCA GCT CTC AGC CAG GAG GTC CCC AAC CCC AAG GAA GGA   719
 720  AGA AAC TGG AAA TTA GGA ACT GCT TCC TCA TTT AAC AAG GTA GGA AGT   767
 768  TAG GAG ATC ATT TAC TTT CAA TCA CAA GGG AGG AGA ACT GTT CCT GGG   815
 816  GCC CAA GGC TGC CAG TTT CCA GCT CAG AGC TCC TCC CAC CCC AAC ATA   863
 864  CTG TTT CCT GAT CCA ACA GCT TAC CTG ATC CAA GGG CTC CTC TGT CTG   911
 912  AGT GTC TTC ATC ATC TGC TAC TTC CAG GGC CCC CGC TGT CTC CTT CCT   959
 960  TCG GTG GGG AGC TCC ATA TAC TCC TAT AAC TCC TAA AGA GGG GAG GCA  1007
1008  GCA CTG GGT GAT GCC CAG GCT GAA GAG CCC TCA GCA TTC CTG CCC TGG  1055
1056  ACC TTC ATG CTA GCC CCT TTC CCT CCC CTG AAC CTG GTT CTG CAT TCC  1103
1104  CCA CCA CCT CCC AGG ATG GCA AGG AAG TGA GAG GTG GGC CTT TGG TCC  1151
1152  CAC CCC CAT CCC CTC TAT ATC CCA CCC CTG AAG TCT TAT CGC TTT AAG  1199
1200  CAC TGC CCT TTC CAG GTG CTT CTT TTC ATG TGA TGA GGC CCT GTG AAG  1247
1248  AAG GGA CAG GAT ATA CAG ACG GGG GCA GCT GGA GAC AGT TAT GAT GAG  1295
1296  TGC CGG CTT TGT GTC TGA GCA TTC TGC TCC CAT GGA CAT CCC CAA CAA  1343
1344  CAG CAG GGA CCA ACC TAT GTC ACT GTC AAA GGG CAG CTG AGA AGG GCC  1391
1392  TGA GCC CCA GGG ACC CCT CAC CTG ATG GGA ATG AGA GTG TGG GGA GCT  1439
1440  TGC TTC TTG GCT GAA TGG TCT GCT GGG GTC TGG CAT AGA AAG CAG ATG  1487
1488  GCT TAA TTC GGT CTG GTT CCT TTG GAG AGG GCT GGG TTA CCT GGG CCC  1535
1536  TGT GGC CTT GGG CCT AGA GAA GGG ACA CTG GGC TTG GAC CCT GAT TGC  1583
1584  TGG CCA TTC TTA CCT TTC CTA CTC CCC AGT TCA GGC TTC AGA GAG CCC  1631
1632  CTG ACG CCT GCA GGA ACA TGG CAG AGG AGA CAC CGT CTG TCT TCA CAA  1679
1680  AGT ACG TCC TCC CTC CTT GCT GCC TCT TCC CAC CAG CCT GAC TTA TCC  1727
1728  AGG GAC AGA GCA GTA GAT GCC TGG CAC TCC TCG ATG CCC AGT GAA ACC  1775
1776  AGA CTG TGC TTC CCC ACC CCC ACC ACC ATG CCC CAT GCT CAC T3G CTC  1823
1824  ATT TCT TGG GAG GGC TTA GAG CTG GAT AAT ATA AGT TGC CTT GGG AAA  1871
1872  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA              1910
6. PP1221
A:核苷酸序列(SEQ ID NO:16)长度:3657
GGCTGCCAAC GGTTTTGAGC GTAGGGGGAG GCGTGAGAGG GGGATCTCAG GGGAGGAGGT  60
CAATCGCTTG CCCCCCACTT TGGCAAATTG GGGACTGAGG ACTGGAAGGG TGGAGAGTAG  120
GCGGAACCAG GTGGTCGTCG GGGCAGAGGA TCTCGGGCTA GGCTTGAGGG CGGCGTGCTT  180
CTTAGGGACG ACTTAGGGCG TGACTGAGGG TTCACAAGGT TTCTTTTGGG GTGGTCGGGA  240
GGGAGAGATT CTAGGGAACA AGGAAGCTCG CTATGGCTTT CTTGCCAGGA GGGGTCGAAG  300
GGAAAGTACA AGGGAGCTGA CCCTGGGTAG AACGGGTGAA GGGATGGGGG AGCGTGAGGT  360
TCCGCCCTCT CTTGAGACTG GAACCAATTG GAGGGACTAG TAGGGCAGGG GGACAGAAAT  420
TGGGCTCCTA GTGGATTTGG GTCCGTTTCC GTTGGGACGT TTTGGGTGTG AGAACTTAAG  480
AGCTCAGTTG ACCGGGGATA GCCTGTGCCG GAGTTGATCT GCAGCTTCCA GCACTCGTAG  540
TCGGGAAGAG GAGCTTCAGC AGCGCTGTTG TCCCACAGTA GGTCTTCTGT CCGCACCCGC  600
TCTGCGCTGC ACCCTCTTAA CGCTGTTCCC AGGAGCTGGG GAAAGGGATG CTTTTGCCCA  660
CTCCCATGGC CCCTGGAACT GGTGGAAACC TTTCCTCTAA CCAGAAAGCC TCGATATCCT  720
TAATTCACCA AGGATCCTTG GCGTGGAGTC TTCCTCCCTT CTCCCAAGTC TTTCTCCGTG  780
AACTTTTCCT CCTGGACTTT GCTAAAGCAG AACCTCCCAG CTCTTTGCTG TCTCCGGTTG  840
TCTCTTCCCT GTATTCATGG CAACATCAGC TGACAGCCCC AGTTCACCCC TCGGGGCGGA  900
GGATCTCCTG AGTGATTCAT CAGAACCCCC TGGGCTCAAC CAAGTGTCGT CTGAAGTGAC  960
CTCCCAGCTC TATGCTTCTT TGCGCCTCAG CCGGCAGGCG GAGGCCACGG CCCGAGCCCA  1020
GCTGTATTTA CCCTCCACCT CCCCGCCTCA TGAAGGGTTA GACGGCTTCG CCCAAGAATT  1080
GAGTCGAAGC TTGTCAGTCG GATTGGAAAA GAACTTGAAG AAAAAGGATG GTTCTAAGCA  1140
TATCTTTGAG ATGGAAAGTG TTCGGGGTCA GCTCCAGACC ATGCTCCAAA CCTCACGTGA  1200
TACAGCCTAT CGGGATCCTC TCATTCCTGG CGCTGGCTCA GAGAGACGGG AAGAGGACTC  1260
CTTTGACAGT GATAGCACAG CCACCTTGCT CAACACCCGG CCCCTGCAAG ACTTGTCTCC  1320
ATCTAGCTCA GCCCAAGCCC TGGAGGAGCT GTTTCCCCGC TACACCAGCC TTCGGCCAGG  1380
GCCTCCACTC AATCCCCCAG ATTTTCAGGG GCTGAGAGAT GCATTGGATT CAGAGCATAC  1440
CCGCCGCAAG CATTGTGAGC GCCATATTCA GAGCCTGCAG ACCCGAGTGT TAGAGCTACA  1500
GCAACAATTA GCCGTGGCTG TGGCTGCCGA CCGCAAGAAA GATACCATGA TTGAACAACT  1560
GGACAAGACC CTGGCCCGTG TGGTGGAGGG CTGGAACCGG CATGAGGCTG AGCGGACAGA  1620
GGTTCTCAGG GGACTTCAAG AGGAACACCA GGCAGCAGAG CTCACCAGAA GCAAGCAGCA  1680
GGAGACAGTA ACCCGCCTGG AACAAAGCCT TTCTGAGGCC ATGGAGGCCC TGAATCGTGA  1740
GCAGGAAAGT GCCAGACTGC AGCAACGGGA AAGAGAGACA CTGGAGGAGG AAAGGCAAGC  1800
TCTGACTCTG AGGTTGGAGG CAGAACAGCA GCGGTGCTGT GTCCTGCAGG AAGAGCGGGA  1860
TGCAGCTCGG GCTGGGCAAC TGAGTGAGCA TCGAGAGTTG GAGACTCTTC GGGCTGCCCT  1920
AGAAGAAGAA CGGCAGACCT GCGCCCAGCA AGAGCACCAG CTTAAGGAAC ACTACCAGGC  1980
GCTGCAGGAG GAGAGCCAGG CTCAGCTGGA AAGGGAGAAG GAGAAGAGCC AGAGGGAAGC  2040
CCAGGCCGCC TGGGAGACCC AGCACCAGTT GGCATTGGTG CAGTCTGAGG TGCGGCGGCT  2100
GGAAGGAGAG CTGGATACAG CTCGGAGAGA GAGAGATGCC CTGCAGCTGG AAATGAGCTT  2160
GGTGCAGGCC CGGTATGAAA GCCAGCGGAT CCAGCTGGAG TCGGAGCTGG CTGTGCAGCT  2220
GGAGCAGCGG GTGACAGAGC GGCTGGCGCA GGCTCAGGAG AGCAGCCTAC GGCAAGCAGC  2280
CTCCCTCAGG GAACATCACA GGAAGCAGCT GCAGGACCTG AGTGGACAGC ACCAGCAGGA  2340
GCTGGCCAGT CAGCTAGCTC AGTTCAAGGT GGAAATGGCA GAACGAGAGG AACGGCAACA  2400
GCAGGTGGCT GAGGACTACG AGCTCAGACT GGCCCGGGAG CAAGCGCAAG TGTGCGAACT  2460
GCAGAGTGGG AACCAGCAGC TGGAGGAGCA GCGGGTGGAG CTGGTGGAAA GACTGCAGGC  2520
CATGCTGCAG GCCCACTGGG ATGAGGCCAA CCAGCTGCTC AGCACCACTC TCCCGCCGCC  2580
CAACCCTCCA GCTCCTCCTG CTGGACCCTC CAGCCCCGGG CCTCAGGAGC CCGAGAAGGA  2640
GGAGAGGAGG GTCTGGACTA TGCCTCCCAT GGCCGTGGCC CTGAAGCCTG TATTGCAGCA  2700
GAGCCGGGAA GCAAGGGACG AGCTACCTGG AGCGCCTCCT GTTCTTTGCA GTTCCTCCTC  2760
AGATCTTAGC CTCCTGTTGG GCCCCTCTTT TCAGAGCCAG CATTCTTTCC AGCCCCTGGA  2820
GCCCAAACCA GACCTCACTT CATCCACAGC TGGGGCCTTC TCTGCACTTG GGGCCTTCCA  2880
TCCCGATCAT AGGGCAGAAA GGCCATTCCC TGAGGAAGAT CCTGGACCTG ACGGGGAGGG  2940
CCTCCTAAAG CAAGGGCTGC CGCCTGCTCA GCTGGAGGGC CTCAAGAATT TTTTGCACCA  3000
GTTGCTGGAG ACAGTGCCCC AGAACAATGA GAACCCTTCT GTCGACCTGT TGCCCCCTAA  3060
GTCTGGTCCT CTGACTGTCC GATCTTGGGA GGAAGCCCCT CAAGTGCCAC GTATTCCACC  3120
GCCTGTCCAC AAAACCAAAG TTCCCTTAGC CATGGCATCC AGTCTTTTCC GGGTCCCTGA  3180
GCCTCCCTCC TCCCATTCAC AAGGCAGTGG TCCCAGCAGT GGTTCCCCAG AGAGAGGTGG  3240
AGATGGGCTT ACATTCCCAA GGCAGCTGAT GGAGGTGTCT CAACTGTTGC GACTCTACCA  3300
GGCTCGGGGC TGGGGGGCTC TGCCTGCTGA GGATCTCCTG CTCTACCTGA AGAGGCTGGA  3360
ACACAGCGGG ACTGATGGCC GAGGGGATAA TGTCCCCAGA AGGAACACAG ACTCCCGCTT  3420
GGGTGAGATC CCCCGGAAAG AGATTCCCTC CCAGGCTGTC CCTCGCCGCC TTGCTACAGC  3480
CCCCAAGACT GAAAAACCTC CCGCACGGAA GAAAAGTGGG CACCCTGCCC CGAGTAGCAT  3540
GAGGAGCCGG GGGGGAGTCT GGAGATGAGC CCCCCTACCC TCTCTCCTCT TTGTTCTCTC  3600
ATTGTTGTTA TTTTAATAAA TGCTCAGTAG TCTGTAAAAA AAAAAAAAAA AAAAAAA     3657
B:氨基酸序列(SEQ ID NO:17)长度:903
  1  MATSADSPSS PLGAEDLLSD SSEPPGLNQV SSEVTSQLYA SLRLSRQAEA
 51  TARAQLYLPS TSPPHEGLDG FAQELSRSLS VGLEKNLKKK DGSKHIFEME
101  SVRGQLQTML QTSRDTAYRD PLIPGAGSER REEDSFDSDS TATLLNTRPL
151  QDLSPSSSAQ ALEELFPRYT SLRPGPPLNP PDFQGLRDAL DSEHTRRKHC
201  ERHIQSLQTR VLELQQQLAV AVAADRKKDT MIEQLDKTLA RVVEGWNRHE
251  AERTEVLRGL QEEHQAAELT RSKQQETVTR LEQSLSEAME ALNREQESAR
301  LQQRERETLE EERQALTLRL EAEQQRCCVL QEERDAARAG QLSEHRELET
351  LRAALEEERQ TWAQQEHQLK EHYQALQEES QAQLEREKEK SQREAQAAWE
401  TQHQLALVQS EVRRLEGELD TARRERDALQ LEMSLVQARY ESQRIQLESE
451  LAVQLEQRVT ERLAQAQESS LRQAASLREH HRKQLQDLSG QHQQELASQL
501  AQFKVEMAER EERQQQVAED YELRLAREQA QVCELQSGNQ QLEEQRVELV
551  ERLQAMLQAH WDEANQLLST TLPPPNPPAP PAGPSSPGPQ EPEKEERRVW
601  TMPPMAVALK PVLQQSREAR DELPGAPPVL CSSSSDLSLL LGPSFQSQHS
651  FQPLEPKPDL TSSTAGAFSA LGAFHPDHRA ERPFPEEDPG PDGEGLLKQG
701  LPPAQLEGLK NFLHQLLETV PQNNENPSVD LLPPKSGPLT VPSWEEAPQV
751  PRIPPPVHKT KVPLAMASSL FRVPEPPSSH SQGSGPSSGS PERGGDGLTF
801  PRQLMEVSQL LRLYQARGWG ALPAEDLLLY LKRLEHSGTD GRGDNVPRRN
851  TDSRLGEIPR KEIPSQAVPR RLATAPKTEK PPARKKSGHP APSSMRSRGG
901  VWR
克隆号:PP1221(SEQ ID NO:18)
起始编码子:857 ATG  终止编码子:3568 TGA蛋白质分子量:101219.36
   1    G GCT GCC AAC GGT TTT GAG CGT AGG GGG AGG CGT GAG AGG GGG ATC    46
  47  TCA GGG GAG GAG GTC AAT CGC TTG CCC CCC ACT TTG GCA AAT TGG GGA    94
  95  CTG AGG ACT GGA AGG GTG GAG AGT AGG CGG AAC CAG GTG GTC GTC GGG   142
 143  GCA GAG GAT CTC GGG CTA GGC TTG AGG GCG GCG TGC TTC TTA GGG ACG   190
 191  ACT TAG GGC GTG ACT GAG GGT TCA CAA GGT TTC TTT TGG GGT GGT CGG   238
 239  GAG GGA GAG ATT CTA GGG AAC AAG GAA GCT CGC TAT GGC TTT CTT GCC   286
 287  AGG AGG GGT CGA AGG GAA AGT ACA AGG GAG CTG ACC CTG GGT AGA ACG   334
 335  GGT GAA GGG ATG GGG GAG CGT GAG GTT CCG CCC TCT CTT GAG ACT GGA   382
 383  ACC AAT TGG AGG GAC TAG TAG GGC AGG GGG ACA GAA ATT GGG CTC CTA   430
 431  GTG GAT TTG GGT CCG TTT CCG TTG GGA CGT TTT GGG TGT GAG AAC TTA   478
 479  AGA GCT CAG TTG ACC GGG GAT AGC CTG TGC CGG AGT TGA TCT GCA GCT   526
 527  TCC AGC ACT CGT AGT CGG GAA GAG GAG CTT CAG CAG CGC TGT TGT CCC   574
 575  ACA GTA GGT CTT CTG TCC GCA CCC GCT CTG CGC TGC ACC CTC TTA ACG   622
 623  CTG TTC CCA GGA GCT GGG GAA AGG GAT GCT TTT GCC CAC TCC CAT GGC   670
 671  CCC TGG AAC TGG TGG AAA CCT TTC CTC TAA CCA GAA AGC CTC GAT ATC   718
 719  CTT AAT TCA CCA AGG ATC CTT GGC GTG GAG TCT TCC TCC CTT CTC CCA   766
 767  AGT CTT TCT CCG TGA ACT TTT CCT CCT GGA CTT TGC TAA AGC AGA ACC   814
 815  TCC CAG CTC TTT GCT GTC TCC GGT TGT CTC TTC CCT GTA TTC ATG GCA   862
   1                                                          Met Ala     2
 863  ACA TCA GCT GAC AGC CCC AGT TCA CCC CTC GGG GCG GAG GAT CTC CTG   910
   3  Thr Ser Ala Asp Ser Pro Ser Ser Pro Leu Gly Ala Glu Asp Leu Leu    18
 911  AGT GAT TCA TCA GAA CCC CCT GGG CTC AAC CAA GTG TCG TCT GAA GTG   958
  19  Ser Asp Ser Ser Glu Pro Pro Gly Leu Asn Gln Val Ser Ser Glu Val    34
 959  ACC TCC CAG CTC TAT GCT TCT TTG CGC CTC AGC CGG CAG GCG GAG GCC  1006
  35  Thr Ser Gln Leu Tyr Ala Ser Leu Arg Leu Ser Arg Gln Ala Glu Ala    50
1007  ACG GCC CGA GCC CAG CTG TAT TTA CCC TCC ACC TCC CCG CCT CAT GAA  1054
  51  Thr Ala Arg Ala Gln Leu Tyr Leu Pro Ser Thr Ser Pro Pro His Glu    66
1055  GGG TTA GAC GGC TTC GCC CAA GAA TTG AGT CGA AGC TTG TCA GTC GGA  1102
  67  Gly Leu Asp Gly Phe Ala Gln Glu Leu Ser Arg Ser Leu Ser Val Gly    82
1103  TTG GAA AAG AAC TTG AAG AAA AAG GAT GGT TCT AAG CAT ATC TTT GAG  1150
  83  Leu Glu Lys Asn Leu Lys Lys Lys Asp Gly Ser Lys His Ile Phe Glu    98
1151  ATG GAA AGT GTT CGG GGT CAG CTC CAG ACC ATG CTC CAA ACC TCA CGT  1198
  99  Met Glu Ser Val Arg Gly Gln Leu Gln Thr Met Leu Gln Thr Ser Arg   114
1199  GAT ACA GCC TAT CGG GAT CCT CTC ATT CCT GGC GCT GGC TCA GAG AGA  1246
 115  Asp Thr Ala Tyr Arg Asp Pro Leu Ile Pro Gly Ala Gly Ser Glu Arg   130
1247  CGG GAA GAG GAC TCC TTT GAC AGT GAT AGC ACA GCC ACC TTG CTC AAC  1294
 131  Arg Glu Glu Asp Ser Phe Asp Ser Asp Ser Thr Ala Thr Leu Leu Asn   146
1295  ACC CGG CCC CTG CAA GAC TTG TCT CCA TCT AGC TCA GCC CAA GCC CTG  1342
 147  Thr Arg Pro Leu Gln Asp Leu Ser Pro Ser Ser Ser Ala Gln Ala Leu   162
1343  GAG GAG CTG TTT CCC CGC TAC ACC AGC CTT CGG CCA GGG CCT CCA CTC  1390
 163  Glu Glu Leu Phe Pro Arg Tyr Thr Ser Leu Arg Pro Gly Pro Pro Leu   178
1391  AAT CCC CCA GAT TTT CAG GGG CTG AGA GAT GCA TTG GAT TCA GAG CAT  1438
 179  Asn Pro Pro Asp Phe Gln Gly Leu Arg Asp Ala Leu Asp Ser Glu His   194
1439  ACC CGC CGC AAG CAT TGT GAG CGC CAT ATT CAG AGC CTG CAG ACC CGA  1486
 195  Thr Arg Arg Lys His Cys Glu Arg His Ile Gln Ser Leu Gln Thr Arg   210
1487  GTG TTA GAG CTA CAG CAA CAA TTA GCC GTG GCT GTG GCT GCC GAC CGC  1534
 211  Val Leu Glu Leu Gln Gln Gln Leu Ala Val Ala Val Ala Ala Asp Arg   226
1535  AAG AAA GAT ACC ATG ATT GAA CAA CTG GAC AAG ACC CTG GCC CGT GTG  1582
 227  Lys Lys Asp Thr Met Ile Glu Gln Leu Asp Lys Thr Leu Ala Arg Val   242
1583  GTG GAG GGC TGG AAC CGG CAT GAG GCT GAG CGG ACA GAG GTT CTC AGG  1630
 243  Val Glu Gly Trp Asn Arg His Glu Ala Glu Arg Thr Glu Val Leu Arg   258
1631  GGA CTT CAA GAG GAA CAC CAG GCA GCA GAG CTC ACC AGA AGC AAG CAG  1678
 259  Gly Leu Gln Glu Glu His Gln Ala Ala Glu Leu Thr Arg Ser Lys Gln   274
1679  CAG GAG ACA GTA ACC CGC CTG GAA CAA AGC CTT TCT GAG GCC ATG GAG  1726
 275  Gln Glu Thr Val Thr Arg Leu Glu Gln Ser Leu Ser Glu Ala Met Glu   290
1727  GCC CTG AAT CGT GAG CAG GAA AGT GCC AGA CTG CAG CAA CGG GAA AGA  1774
 291  Ala Leu Asn Arg Glu Gln Glu Ser Ala Arg Leu Gln Gln Arg Glu Arg   306
1775  GAG ACA CTG GAG GAG GAA AGG CAA GCT CTG ACT CTG AGG TTG GAG GCA  1822
 307  Glu Thr Leu Glu Glu Glu Arg Gln Ala Leu Thr Leu Arg Leu Glu Ala   322
1823  GAA CAG CAG CGG TGC TGT GTC CTG CAG GAA GAG CGG GAT GCA GCT CGG  1870
 323  Glu Gln Gln Arg Cys Cys Val Leu Gln Glu Glu Arg Asp Ala Ala Arg   338
1871  GCT GGG CAA CTG AGT GAG CAT CGA GAG TTG GAG ACT CTT CGG GCT GCC  1918
 339  Ala Gly Gln Leu Ser Glu His Arg Glu Leu Glu Thr Leu Arg Ala Ala   354
1919  CTA GAA GAA GAA CGG CAG ACC TGG GCC CAG CAA GAG CAC CAG CTT AAG  1966
 355  Leu Glu Glu Glu Arg Gln Thr Trp Ala Gln Gln Glu His Gln Leu Lys   370
1967  GAA CAC TAC CAG GCG CTG CAG GAG GAG AGC CAG GCT CAG CTG GAA AGG  2014
 371  Glu His Tyr Gln Ala Leu Gln Glu Glu Ser Gln Ala Gln Leu Glu Arg   386
2015  GAG AAG GAG AAG AGC CAG AGG GAA GCC CAG GCC GCC TGG GAG ACC CAG  2062
 387  Glu Lys Glu Lys Ser Gln Arg Glu Ala Gln Ala Ala Trp Glu Thr Gln   402
2063  CAC CAG TTG GCA TTG GTG CAG TCT GAG GTG CGG CGG CTG GAA GGA GAG  2110
 403  His Gln Leu Ala Leu Val Gln Ser Glu Val Arg Arg Leu Glu Gly Glu   418
2111  CTG GAT ACA GCT CGG AGA GAG AGA GAT GCC CTG CAG CTG GAA ATG AGC  2158
 419  Leu Asp Thr Ala Arg Arg Glu Arg Asp Ala Leu Gln Leu Glu Met Ser   434
2159  TTG GTG CAG GCC CGG TAT GAA AGC CAG CGG ATC CAG CTG GAG TCG GAG  2206
 435  Leu Val Gln Ala Arg Tyr Glu Ser Gln Arg Ile Gln Leu Glu Ser Glu   450
2207  CTG GCT GTG CAG CTG GAG CAG CGG GTG ACA GAG CGG CTG GCG CAG GCT  2254
 451  Leu Ala Val Gln Leu Glu Gln Arg Val Thr Glu Arg Leu Ala Gln Ala   466
2255  CAG GAG AGC AGC CTA CGG CAA GCA GCC TCC CTC AGG GAA CAT CAC AGG  2302
 467  Gln Glu Ser Ser Leu Arg Gln Ala Ala Ser Leu Arg Glu His His Arg   482
2303  AAG CAG CTG CAG GAC CTG AGT GGA CAG CAC CAG CAG GAG CTG GCC AGT  2350
 483  Lys Gln Leu Gln Asp Leu Ser Gly Gln His Gln Gln Glu Leu Ala Ser   498
2351  CAG CTA GCT CAG TTC AAG GTG GAA ATG GCA GAA CGA GAG GAA CGG CAA  2398
 499  Gln Leu Ala Gln Phe Lys Val Glu Met Ala Glu Arg Glu Glu Arg Gln   514
2399  CAG CAG GTG GCT GAG GAC TAC GAG CTC AGA CTG GCC CGG GAG CAA GCG  2446
 515  Gln Gln Val Ala Glu Asp Tyr Glu Leu Arg Leu Ala Arg Glu Gln Ala   530
2447  CAA GTG TGC GAA CTG CAG AGT GGG AAC CAG CAG CTG GAG GAG CAG CGG  2494
 531  Gln Val Cys Glu Leu Gln Ser Gly Asn Gln Gln Leu Glu Glu Gln Arg   546
2495  GTG GAG CTG GTG GAA AGA CTG CAG GCC ATG CTG CAG GCC CAC TGG GAT  2542
 547  Val Glu Leu Val Glu Arg Leu Gln Ala Met Leu Gln Ala His Trp Asp   562
2543  GAG GCC AAC CAG CTG CTC AGC ACC ACT CTC CCG CCG CCC AAC CCT CCA  2590
 563  Glu Ala Asn Gln Leu Leu Ser Thr Thr Leu Pro Pro Pro Asn Pro Pro   578
259l  GCT CCT CCT GCT GGA CCC TCC AGC CCC GGG CCT CAG GAG CCC GAG AAG  2638
 579  Ala Pro Pro Ala Gly Pro Ser Ser Pro Gly Pro Gln Glu Pro Glu Lys   594
2639  GAG GAG AGG AGG GTC TGG ACT ATG CCT CCC ATG GCC GTG GCC CTG AAG  2686
 595  Glu Glu Arg Arg Val Trp Thr Met Pro Pro Met Ala Val Ala Leu Lys   610
2687  CCT GTA TTG CAG CAG AGC CGG GAA GCA AGG GAC GAG CTA CCT GGA GCG  2734
 611  Pro Val Leu Gln Gln Ser Arg Glu Ala Arg Asp Glu Leu Pro Gly Ala   626
2735  CCT CCT GTT CTT TGC AGT TCC TCC TCA GAT CTT AGC CTC CTG TTG GGC  2782
 627  Pro Pro Val Leu Cys Ser Ser Ser Ser Asp Leu Ser Leu Leu Leu Gly   642
2783  CCC TCT TTT CAG AGC CAG CAT TCT TTC CAG CCC CTG GAG CCC AAA CCA  2830
 643  Pro Ser Phe Gln Ser Gln His Ser Phe Gln Pro Leu Glu Pro Lys Pro   658
2831  GAC CTC ACT TCA TCC ACA GCT GGG GCC TTC TCT GCA CTT GGG GCC TTC  2878
 659  Asp Leu Thr Ser Ser Thr Ala Gly Ala Phe Ser Ala Leu Gly Ala Phe   674
2879  CAT CCC GAT CAT AGG GCA GAA AGG CCA TTC CCT GAG GAA GAT CCT GGA  2926
 675  His Pro Asp His Arg Ala Glu Arg Pro Phe Pro Glu Glu Asp Pro Gly   690
2927  CCT GAC GGG GAG GGC CTC CTA AAG CAA GGG CTG CCG CCT GCT CAG CTG  2974
 691  Pro Asp Gly Glu Gly Leu Leu Lys Gln Gly Leu Pro Pro Ala Gln Leu   706
2975  GAG GGC CTC AAG AAT TTT TTG CAC CAG TTG CTG GAG ACA GTG CCC CAG  3022
 707  Glu Gly Leu Lys Asn Phe Leu His Gln Leu Leu Glu Thr Val Pro Gln   722
3023  AAC AAT GAG AAC CCT TCT GTC GAC CTG TTG CCC CCT AAG TCT GGT CCT  3070
 723  Asn Asn Glu Asn Pro Ser Val Asp Leu Leu Pro Pro Lys Ser Gly Pro   738
3071  CTG ACT GTC CCA TCT TGG GAG GAA GCC CCT CAA GTG CCA CGT ATT CCA  3118
 739  Leu Thr Val Pro Ser Trp Glu Glu Ala Pro Gln Val Pro Arg Ile Pro   754
3119  CCG CCT GTC CAC AAA ACC AAA GTT CCC TTA GCC ATG GCA TCC AGT CTT  3166
 755  Pro Pro Val His Lys Thr Lys Val Pro Leu Ala Met Ala Ser Ser Leu   770
3167  TTC CGG GTC CCT GAG CCT CCC TCC TCC CAT TCA CAA GGC AGT GGT CCC  3214
 771  Phe Arg Val Pro Glu Pro Pro Ser Ser His Ser Gln Gly Ser Gly Pro   786
3215  AGC AGT GGT TCC CCA GAG AGA GGT GGA GAT GGG CTT ACA TTC CCA AGG  3262
 787  Ser Ser Gly Ser Pro Glu Arg Gly Gly Asp Gly Leu Thr Phe Pro Arg   802
3263  CAG CTG ATG GAG GTG TCT CAA CTG TTG CGA CTC TAC CAG GCT CGG GGC  3310
 803  Gln Leu Met Glu Val Ser Gln Leu Leu Arg Leu Tyr Gln Ala Arg Gly   818
3311  TGG GGG GCT CTG CCT GCT GAG GAT CTC CTG CTC TAC CTG AAG AGG CTG  3358
 819  Trp Gly Ala Leu Pro Ala Glu Asp Leu Leu Leu Tyr Leu Lys Arg Leu   834
3359  GAA CAC AGC GGG ACT GAT GGC CGA GGG GAT AAT GTC CCC AGA AGG AAC  3406
 835  Glu His Ser Gly Thr Asp Gly Arg Gly Asp Asn Val Pro Arg Arg Asn   850
3407  ACA GAC TCC CGC TTG GGT GAG ATC CCC CGG AAA GAG ATT CCC TCC CAG  3454
 851  Thr Asp Ser Arg Leu Gly Glu Ile Pro Arg Lys Glu Ile Pro Ser Gln   866
3455  GCT GTC CCT CGC CGC CTT GCT ACA GCC CCC AAG ACT GAA AAA CCT CCC  3502
 867  Ala Val Pro Arg Arg Leu Ala Thr Ala Pro Lys Thr Glu Lys Pro Pro   882
3503  GCA CGG AAG AAA AGT GGG CAC CCT GCC CCG AGT AGC ATG AGG AGC CGG  3550
 883  Ala Arg Lys Lys Ser Gly His Pro Ala Pro Ser Ser Met Arg Ser Arg   898
3551  GGG GGA GTC TGG AGA TGA GCC CCC CTA CCC TCT CTC CTC TTT GTT CTC  3598
 899  Gly Gly Val Trp Arg ***                                           904
3599  TCA TTG TTG TTA TTT TAA TAA ATG CTC AGT AGT CTG TAA AAA AAA AAA  3646
3647  AAA AAA AAA AA                                                   3657
7. PP2250
A:核苷酸序列(SEQ ID NO:19)长度:2745
GCCGCGCTGG CATTTTCTCC TGGACAAGGA GAGAGTGCGG CTGCTGAGAG CCGAGCCCAG  60
CAATCCCGAT CCTCTGAGTC GTGAAGAAGG GAGGCAGCGA GGGGGTTGGG GTTGGGGCCT  120
GAGGCAAGCC CCCAGGCTCC GCTCTTGCCA GAGGGACAGG AGCCATGGCT CAGAAAATGG  180
ACTGTGGTGC GGGCCTCCTC GGCTTCCAGG CTGAGGCCTC CGTAGAAGAC AGCGCCTTGC  240
TTATGCAGAC CTTGATGGAG GCCATCCAGA TCTCAGAGGC TCCACCTACT AACCAGGCCA  300
CCGCAGCTGC TAGTCCCCAG AGTTCACAGC CCCCAACTGC CAATGAGATG GCTGACATTC  360
AGGTTTCAGC AGCTGCCGCT AGGCCTAAGT CAGCCTTTAA AGTCCAGAAT GCCACCACAA  420
AAGGCCCAAA TGGTGTCTAT GATTTCTCTC AGGCTCATAA TGCCAAGGAT GTGCCCAACA  480
CGCAGCCCAA GGCAGCCTTT AAGTCCCAAA ATGCTACCCC AAAGGGTCCA AATGCTGCCT  540
ATGATTTTTC CCAGGCAGCA ACCACTGGTG AGTTAGCTGC TAACAAGTCT GAGATGGCCT  600
TCAAGGCCCA GAATGCCACT ACTAAAGTGG GCCCAAATGC CACCTACAAT TTCTCTCAGT  660
CTCTCAATGC CAATGACCTG GCCAACAGCA GGCCTAAGAC CCCTTTCAAG GCTTGGAATG  720
ATACCACTAA GGCCCCAACA GCTGATACCC AGACCCAGAA TGTAAATCAG GCCAAAATGG  780
CCACTTCCCA GGCTGACATA GAGACCGACC CAGGTATCTC TGAACCTGAC GGTGCAACTG  840
CACAGACATC AGCAGATGGT TCCCAGGCTC AGAATCTGGA GTCCCGGACA ATAATTCGGG  900
GCAAGAGGAC CCGCAAGATT AATAACTTGA ATGTTGAAGA GAACAGCAGT GGGGATCAGA  960
GGCGGGCCCC ACTGGCTGCA GGGACCTGGA GGTCTGCACC AGTTCCAGTG ACCACTCAGA  1020
ACCCACCTGG CGCACCCCCC AATGTGCTCT GGCAGACGCC ATTGGCTTGG CAGAACCCCT  1080
CAGGCTGGCA AAACCAGACA GCCAGGCAGA CCCCACCAGC ACGTCAGAGC CCTCCAGCTA  1140
GGCAGACCCC ACCAGCCTGG CAGAACCCAG TCGCTTGGCA GAACCCAGTG ATTTGGCCAA  1200
ACCCAGTAAT CTGGCAGAAC CCAGTGATCT GGCCAAACCC CATTGTCTGG CCCGGCCCTG  1260
TTGTCTGGCC GAATCCACTG GCCTGGCAGA ATCCACCTGG ATGGCAGACT CCACCTGGAT  1320
GGCAGACCCC ACCGGGCTGG CAGGGTCCTC CAGACTGGCA AGGTCCTCCT GACTGGCCGC  1380
TACCACCCGA CTGGCCACTG CCACCTGATT GGCCACTTCC CACTGACTGG CCACTACCAC  1440
CTGACTGGAT CCCCGCTGAT TGGCCAATTC CACCTGACTG GCAGAACCTG CGCCCCTCGC  1500
CTAACCTGCG CCCTTCTCCC AACTCGCGTG CCTCACAGAA CCCAGGTGCT GCACAGCCCC  1560
GAGATGTGGC CCTTCTTCAG GAAAGAGCAA ATAAGTTGGT CAAGTACTTG ATGCTTAAGG  1620
ACTACACAAA GGTGCCCATC AAGCGCTCAG AAATGCTGAG AGATATCATC CGTGAATACA  1680
CTGATGTTTA TCCAGAAATC ATTGAACGTG CATGCTTTGT CCTAGAGAAG AAATTTGGGA  1740
TTCAACTGAA AGAAATTGAC AAAGAAGAAC ACCTGTATAT TCTCATCAGT ACCCCCGAGT  1800
CCCTGGCTGG CATACTGGGA ACGACCAAAG ACACACCCAA GCTCGGTCTC CTCTTGGTGA  1860
TTCTGGGTGT CATCTTCATG AATGGCAACC GTGCCAGTGA GGCTGTCCTC TGGGAGGCAC  1920
TACGCAAGAT GGGACTGCGT CCTGGGGTGA GACATCCCCT CCTTGGAGAT CTAAGGAAAC  1980
TTCTCACCTA TGAGTTTGTA AAGCAGAAAT ACCTGGACTA CAGACGAGTG CCCAACAGCA  2040
ACCCCCCGGA GTATGAGTTC CTCTGGGGCC TCCGTTCCTA CCATGAGACT AGCAAGATGA  2100
AAGTGCTGAG ATTCATTGCA GAGGTTCAGA AAAGAGACCC TCGTGACTGG ACTGCACAGT  2160
TCATGGAGGC TGCAGATGAG GCCTTGGATG CTCTGGATGC TGCTGCAGCT GAGGCCGAAG  2220
CCAGGGCTGA AGCAAGAACC CGCATGGGAA TTGGAGATGA GGCTGTGTCT GGGCCCTGGA  2280
GCTGGGATGA CATTGAGTTT GAGCTGCTGA CCTGGGATGA GGAAGGAGAT TTTGGAGATC  2340
CCTGGTCCAG AATTCCATTT ACCTTCTGGG CCAGATACCA CCAGAATGCC CGCTCCAGAT  2400
TCCCTCAGAC CTTTGCCGGT CCCATTATTG GTCCTGGTGG TACAGCCAGT GCCAACTTCG  2460
CTGCCAACTT TGGTGCCATT GGTTTCTTCT GGGTTGAGTG AGATGTTGGA TATTGCTATC  2520
AATCGCAGTA GTCTTTCCCC TGTGTGAGGC TGAAGCCTCA GATTCCTTCT AAACACAGCT  2580
ATCTAGAGAG CCACATCCTG TTGACTGAAA GTGGCATGCA AGATAAATTT ATTTGCTGTT  2640
CCTTGTCTAC TGCTTTTTTT CCCCTTGTGT GCTGTCAAGT TTTGGTATCA GAAATAAACA  2700
TTGAAATTGC AAAGTGAAAA AAAAAAAAAA AAAAAAAAAA AAAAA                  2745
B:氨基酸序列(SEQ IDNO:20)长度:779
  1  MAQKMDCGAG LLGFQAEASV EDSALLMQTL MEAIQISEAP PTNQATAAAS
 51  PQSSQPPTAN EMADIQVSAA AARPKSAFKV QNATTKGPNG VYDFSQAHNA
101  KDVPNTQPKA AFKSQNATPK GPNAAYDFSQ AATTGELAAN KSEMAFKAQN
151  ATTKVGPNAT YNFSQSLNAN DLANSRPKTP FKAWNDTTKA PTADTQTQNV
201  NQAKMATSQA DIETDPGISE PDGATAQTSA DGSQAQNLES RTIIRGKRTR
251  KINNLNVEEN SSGDQRRAPL AAGTWRSAPV PVTTQNPPGA PPNVLWQTPL
301  AWQNPSGWQN QTARQTPPAR QSPPARQTPP AWQNPVAWQN PVIWPNPVIW
351  QNPVIWPNPI VWPGPVVWPN PLAWQNPPGW QTPPGWQTPP GWQGPPDWQG
401  PPDWPLPPDW PLPPDWPLPT DWPLPPDWIP ADWPIPPDWQ NLRPSPNLRP
451  SPNSRASQNP GAAQPRDVAL LQERANKLVK YLMLKDYTKV PIKRSEMLRD
501  IIREYTDVYP EIIERACFVL EKKFGIQLKE IDKEEHLYIL ISTPESLAGI
551  LGTTKDTPKL GLLLVILGVI FMNGNRASEA VLWEALRKMG LRPGVRHPLL
601  GDLRKLLTYE FVKQKYLDYR RVPNSNPPEY EFLWGLRSYH ETSKMKVLRF
651  IAEVQKRDPR DWTAQFMEAA DEALDALDAA AAEAEARAEA RTRMGIGDEA
701  VSGPWSWDDI EFELLTWDEE GDFGDPWSRI PFTFWARYHQ NARSRFPQTF
751  AGPIIGPGGT ASANFAANFG AIGFFWVE*
克隆号:PP2250(SEQ ID NO:21)
起始编码子:165 ATG  终止编码子:2501 TGA蛋白质分子量:86156.01
  1   GC CGC GCT GGC ATT TTC TCC TGG ACA AGG AGA GAG TGC GGC TGC TGA   47
 48  GAG CCG AGC CCA GCA ATC CCG ATC CTC TGA GTC GTG AAG AAG GGA GGC   95
 96  AGC GAG GGG GTT GGG GTT GGG GCC TGA GGC AAG CCC CCA GGC TCC GCT  143
144  CTT GCC AGA GGG ACA GGA GCC ATG GCT CAG AAA ATG GAC TGT GGT GCG  191
  1                              Met ALa Gln Lys Met Asp Cys Gly Ala    9
192  GGC CTC CTC GGC TTC CAG GCT GAG GCC TCC GTA GAA GAC AGC GCC TTG  239
 10  Gly Leu Leu Gly Phe Gln Ala Glu Ala Ser Val Glu Asp Ser Ala Leu   25
 240  CTT ATG CAG ACC TTG ATG GAG GCC ATC CAG ATC TCA GAG GCT CCA CCT   287
  26  Leu Met Gln Thr Leu Met Glu Ala Ile Gln Ile Ser Glu Ala Pro Pro    41
 288  ACT AAC CAG GCC ACC GCA GCT GCT AGT CCC CAG AGT TCA CAG CCC CCA   335
  42  Thr Asn Gln Ala Thr Ala Ala Ala Ser Pro Gln Ser Ser Gln Pro Pro    57
 336  ACT GCC AAT GAG ATG GCT GAC ATT CAG GTT TCA GCA GCT GCC GCT AGG   383
  58  Thr Ala Asn Glu Met Ala Asp Ile Gln Val Ser Ala Ala Ala Ala Arg    73
 384  CCT AAG TCA GCC TTT AAA GTC CAG AAT GCC ACC ACA AAA GGC CCA AAT   431
  74  Pro Lys Ser Ala Phe Lys Val Gln Asn Ala Thr Thr Lys Gly Pro Asn    89
 432  GGT GTC TAT GAT TTC TCT CAG GCT CAT AAT GCC AAG GAT GTG CCC AAC   479
  90  Gly Val Tyr Asp Phe Ser Gln Ala His Asn Ala Lys Asp Val Pro Asn   105
 480  ACG CAG CCC AAG GCA GCC TTT AAG TCC CAA AAT GCT ACC CCA AAG GGT   527
 106  Thr Gln Pro Lys Ala Ala Phe Lys Ser Gln Asn Ala Thr Pro Lys Gly   121
 528  CCA AAT GCT GCC TAT GAT TTT TCC CAG GCA GCA ACC ACT GGT GAG TTA   575
 122  Pro Asn Ala Ala Tyr Asp Phe Ser Gln Ala Ala Thr Thr Gly Glu Leu   137
 576  GCT GCT AAC AAG TCT GAG ATG GCC TTC AAG GCC CAG AAT GCC ACT ACT   623
 138  Ala Ala Asn Lys Ser Glu Met Ala Phe Lys Ala Gln Asn Ala Thr Thr   153
 624  AAA GTG GGC CCA AAT GCC ACC TAC AAT TTC TCT CAG TCT CTC AAT GCC   671
 154  Lys Val Gly Pro Asn Ala Thr Tyr Asn Phe Ser Gln Ser Leu Asn Ala   169
 672  AAT GAC CTG GCC AAC AGC AGG CCT AAG ACC CCT TTC AAG GCT TGG AAT   719
 170  Asn Asp Leu Ala Asn Ser Arg Pro Lys Thr Pro Phe Lys Ala Trp Asn   185
 720  GAT ACC ACT AAG GCC CCA ACA GCT GAT ACC CAG ACC CAG AAT GTA AAT   767
 186  Asp Thr Thr Lys Ala Pro Thr Ala Asp Thr Gln Thr Gln Asn Val Asn   201
 768  CAG GCC AAA ATG GCC ACT TCC CAG GCT GAC ATA GAG ACC GAC CCA GGT   815
 202  Gln Ala Lys Met Ala Thr Ser Gln Ala Asp Ile Glu Thr Asp Pro Gly   217
 816  ATC TCT GAA CCT GAC GGT GCA ACT GCA CAG ACA TCA GCA GAT GGT TCC   863
 218  Ile Ser Glu Pro Asp Gly Ala Thr Ala Gln Thr Ser Ala Asp Gly Ser   233
 864  CAG GCT CAG AAT CTG GAG TCC CGG ACA ATA ATT CGG GGC AAG AGG ACC   911
 234  Gln Ala Gln Asn Leu Glu Ser Arg Thr Ile Ile Arg Gly Lys Arg Thr   249
 912  CGC AAG ATT AAT AAC TTG AAT GTT GAA GAG AAC AGC AGT GGG GAT CAG   959
 250  Arg Lys Ile Asn Asn Leu Asn Val Glu Glu Asn Ser Ser Gly Asp Gln   265
 960  AGG CGG GCC CCA CTG GCT GCA GGG ACC TGG AGG TCT GCA CCA GTT CCA  1007
 266  Arg Arg Ala Pro Leu Ala Ala Gly Thr Trp Arg Ser Ala Pro Val Pro   281
1008  GTG ACC ACT CAG AAC CCA CCT GGC GCA CCC CCC AAT GTG CTC TGG CAG  1055
 282  Val Thr Thr Gln Asn Pro Pro Gly Ala Pro Pro Asn Val Leu Trp Gln   297
1056  ACG CCA TTG GCT TGG CAG AAC CCC TCA GGC TGG CAA AAC CAG ACA GCC  1103
 298  Thr Pro Leu Ala Trp Gln Asn Pro Ser Gly Trp Gln Asn Gln Thr Ala   313
1104  AGG CAG ACC CCA CCA GCA CGT CAG AGC CCT CCA GCT AGG CAG ACC CCA  1151
 314  Arg Gln Thr Pro Pro Ala Arg Gln Ser Pro Pro Ala Arg Gln Thr Pro   329
1152  CCA GCC TGG CAG AAC CCA GTC GCT TGG CAG AAC CCA GTG ATT TGG CCA  1199
 330  Pro Ala Trp Gln Asn Pro Val Ala Trp Gln Asn Pro Val Ile Trp Pro   345
1200  AAC CCA GTA ATC TGG CAG AAC CCA GTG ATC TGG CCA AAC CCC ATT GTC  1247
 346  Asn Pro Val Ile Trp Gln Asn Pro Val Ile Trp Pro Asn Pro Ile Val   361
1248  TGG CCC GGC CCT GTT GTC TGG CCG AAT CCA CTG GCC TGG CAG AAT CCA  1295
 362  Trp Pro Gly Pro Val Val Trp Pro Asn Pro Leu Ala Trp Gln Asn Pro   377
1296  CCT GGA TGG CAG ACT CCA CCT GGA TGG CAG ACC CCA CCG GGC TGG CAG  1343
 378  Pro Gly Trp Gln Thr Pro Pro Gly Trp Gln Thr Pro Pro Gly Trp Gln   393
1344  GGT CCT CCA GAC TGG CAA GGT CCT CCT GAC TGG CCG CTA CCA CCC GAC  1391
 394  Gly Pro Pro Asp Trp Gln Gly Pro Pro Asp Trp Pro Leu Pro Pro Asp   409
1392  TGG CCA CTG CCA CCT GAT TGG CCA CTT CCC ACT GAC TGG CCA CTA CCA  1439
 410  Trp Pro Leu Pro Pro Asp Trp Pro Leu Pro Thr Asp Trp Pro Leu Pro   425
1440  CCT GAC TGG ATC CCC GCT GAT TGG CCA ATT CCA CCT GAC TGG CAG AAC  1487
 426  Pro Asp Trp Ile Pro Ala Asp Trp Pro Ile Pro Pro Asp Trp Gln Asn   441
1488  CTG CGC CCC TCG CCT AAC CTG CGC CCT TCT CCC AAC TCG CGT GCC TCA  1535
 442  Leu Arg Pro Ser Pro Asn Leu Arg Pro Ser Pro Asn Ser Arg Ala Ser   457
1536  CAG AAC CCA GGT GCT GCA CAG CCC CGA GAT GTG GCC CTT CTT CAG GAA  1583
 458  Gln Asn Pro Gly Ala Ala Gln Pro Arg Asp Val Ala Leu Leu Gln Glu   473
1584  AGA GCA AAT AAG TTG GTC AAG TAC TTG ATG CTT AAG GAC TAC ACA AAG  1631
 474  Arg Ala Asn Lys Leu Val Lys Tyr Leu Met Leu Lys Asp Tyr Thr Lys   489
1632  GTG CCC ATC AAG CGC TCA GAA ATG CTG AGA GAT ATC ATC CGT GAA TAC  1679
 490  Val Pro Ile Lys Arg Ser Glu Met Leu Arg Asp Ile Ile Arg Glu Tyr   505
1680  ACT GAT GTT TAT CCA GAA ATC ATT GAA CGT GCA TGC TTT GTC CTA GAG  1727
 506  Thr Asp Val Tyr Pro Glu Ile Ile Glu Arg Ala Cys Phe Val Leu Glu   521
1728  AAG AAA TTT GGG ATT CAA CTG AAA GAA ATT GAC AAA GAA GAA CAC CTG  1775
 522  Lys Lys Phe Gly Ile Gln Leu Lys Glu Ile Asp Lys Glu Glu His Leu   537
1776  TAT ATT CTC ATC AGT ACC CCC GAG TCC CTG GCT GGC ATA CTG GGA ACG  1823
 538  Tyr Ile Leu Ile Ser Thr Pro Glu Ser Leu Ala Gly Ile Leu Gly Thr   553
1824  ACC AAA GAC ACA CCC AAG CrC GGT CTC CTC TTG GTG ATT CTG GGT GTC  1871
 554  Thr Lys Asp Thr Pro Lys Leu Gly Leu Leu Leu Val Ile Leu Gly Val   569
1872  ATC TTC ATG AAT GGC AAC CGT GCC AGT GAG GCT GTC CTC TGG GAG GCA  1919
 570  Ile Phe Met Asn Gly Asn Arg Ala Ser Glu Ala Val Leu Trp Glu Ala   585
1920  CTA CGC AAG ATG GGA CTG CGT CCT GGG GTG AGA CAT CCC CTC CTT GGA  1967
 586  Leu Arg Lys Met Gly Leu Arg Pro Gly Val Arg His Pro Leu Leu Gly   601
1968  GAT CTA AGG AAA CTT CTC ACC TAT GAG TTT GTA AAG CAG AAA TAC CTG  2015
 602  Asp Leu Arg Lys Leu Leu Thr Tyr Glu Phe Val Lys Gln Lys Tyr Leu   617
2016  GAC TAC AGA CGA GTG CCC AAC AGC AAC CCC CCG GAG TAT GAG TTC CTC  2063
 618  Asp Tyr Arg Arg Val Pro Asn Ser Asn Pro Pro Glu Tyr Glu Phe Leu   633
2064  TGG GGC CTC CGT TCC TAC CAT GAG ACT AGC AAG ATG AAA GTG CTG AGA  2111
 634  Trp Gly Leu Arg Ser Tyr His Glu Thr Ser Lys Met Lys Val Leu Arg   649
2112  TTC ATT GCA GAG GTT CAG AAA AGA GAC CCT CGT GAC TGG ACT GCA CAG  2159
 650  Phe Ile Ala Glu Val Gln Lys Arg Asp Pro Arg Asp Trp Thr Ala Gln   665
2160  TTC ATG GAG GCT GCA GAT GAG GCC TTG GAT GCT CTG GAT GCT GCT GCA  2207
 666  Phe Met Glu Ala Ala Asp Glu Ala Leu Asp Ala Leu Asp Ala Ala Ala   681
2208  GCT GAG GCC GAA GCC AGG GCT GAA GCA AGA ACC CGC ATG GGA ATT GGA  2255
 682  Ala Glu Ala Glu Ala Arg Ala Glu Ala Arg Thr Arg Met Gly Ile Gly   697
2256  GAT GAG GCT GTG TCT GGG CCC TGG AGC TGG GAT GAC ATT GAG TTT GAG  2303
 698  Asp Glu Ala Val Ser Gly Pro Trp Ser Trp Asp Asp Ile Glu Phe Glu   713
2304  CTG CTG ACC TGG GAT GAG GAA GGA GAT TTT GGA GAT CCC TGG TCC AGA  2351
 714  Leu Leu Thr Trp Asp Glu Glu Gly Asp Phe Gly Asp Pro Trp Ser Arg   729
2352  ATT CCA TTT ACC TTC TGG GCC AGA TAC CAC CAG AAT GCC CGC TCC AGA  2399
 730  Ile Pro Phe Thr Phe Trp Ala Arg Tyr His Gln Asn Ala Arg Ser Arg   745
2400  TTC CCT CAG ACC TTT GCC GGT CCC ATT ATT GGT CCT GGT GGT ACA GCC  2447
 746  Phe Pro Gln Thr Phe Ala Gly Pro Ile Ile Gly Pro Gly Gly Thr Ala   761
2448  AGT GCC AAC TTC GCT GCC AAC TTT GGT GCC ATT GGT TTC TTC TGG GTT  2495
 762  Ser Ala Asn Phe Ala Ala Asn Phe Gly Ala Ile Gly Phe Phe Trp Val   777
2496  GAG TGA GAT GTT GGA TAT TGC TAT CAA TCG CAG TAG TCT TTC CCC TGT  2543
  78  Glu ***                                                           779
2544  GTG AGG CTG AAG CCT CAG ATT CCT TCT AAA CAC AGC TAT CTA GAG AGC  2591
2592  CAC ATC CTG TTG ACT GAA AGT GGC ATG CAA GAT AAA TTT ATT TGC TGT  2639
2640  TCC TTG TCT ACT GCT TTT TTT CCC CTT GTG TGC TGT CAA GTT TTG GTA  2687
2688  TCA GAA ATA AAC ATT GAA ATT GCA AAG TGA AAA AAA AAA AAA AAA AAA  2735
2736  AAA AAA AAA A                                                    2745

Claims (5)

1.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列选自下组:
(a)编码以下多肽的多核苷酸,所述的多肽含有选自下组的氨基酸序列的多肽:SEQ IDNO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、或SEQ IDNO:20;
(b)与多核苷酸(a)互补的多核苷酸。
2.如权利要求1所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ IDNO:17、SEQ ID NO:20。
3.如权利要求1所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21的编码区序列或全长序列。
4.一种载体,其特征在于,它含有权利要求1所述的多核苷酸。
5.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求4所述的载体转化或转导的宿主细胞;
(b)用权利要求1所述的多核苷酸转化或转导的宿主细胞。
CNB011045450A 2000-02-17 2001-02-13 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 Expired - Fee Related CN1194989C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB011045450A CN1194989C (zh) 2000-02-17 2001-02-13 具有抑制癌细胞生长功能的新的人蛋白及其编码序列

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN00111697.5 2000-02-17
CN00111697 2000-02-17
CNB011045450A CN1194989C (zh) 2000-02-17 2001-02-13 具有抑制癌细胞生长功能的新的人蛋白及其编码序列

Publications (2)

Publication Number Publication Date
CN1309135A CN1309135A (zh) 2001-08-22
CN1194989C true CN1194989C (zh) 2005-03-30

Family

ID=25739364

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB011045450A Expired - Fee Related CN1194989C (zh) 2000-02-17 2001-02-13 具有抑制癌细胞生长功能的新的人蛋白及其编码序列

Country Status (1)

Country Link
CN (1) CN1194989C (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1671843B (zh) * 2002-07-25 2010-07-14 索尼株式会社 参与转录调控的因子

Also Published As

Publication number Publication date
CN1309135A (zh) 2001-08-22

Similar Documents

Publication Publication Date Title
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1194989C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1169954C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1160370C (zh) 新的人细胞周期控制相关蛋白及其编码序列
CN1177864C (zh) 在肝癌组织中具有表达差异的新的人蛋白及其编码序列
CN1169955C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1177048C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1932016A (zh) 影响sre活性的多核苷酸及其编码多肽和用途
CN1155615C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1199998C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1194010C (zh) 具有抑制癌细胞生长功能的人蛋白及基编码序列
CN1177049C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1169958C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1209373C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1199997C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1170848C (zh) 新的人肝癌相关蛋白及其编码序列
CN1166686C (zh) 具有抑制癌细胞生长功能的人蛋白及其编码序列
CN1193041C (zh) 具有抑制癌细胞生长功能的人蛋白及其编码序列
CN1169957C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1169831C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1209374C (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1230445C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1177050C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1193040C (zh) 具有抑制癌细胞生长功能的人蛋白及其编码序列
CN1199996C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee