CN1205225C - 具有抑癌功能的新的人蛋白及其编码序列 - Google Patents

具有抑癌功能的新的人蛋白及其编码序列 Download PDF

Info

Publication number
CN1205225C
CN1205225C CNB011053127A CN01105312A CN1205225C CN 1205225 C CN1205225 C CN 1205225C CN B011053127 A CNB011053127 A CN B011053127A CN 01105312 A CN01105312 A CN 01105312A CN 1205225 C CN1205225 C CN 1205225C
Authority
CN
China
Prior art keywords
ctg
ccc
leu
gcc
cag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB011053127A
Other languages
English (en)
Other versions
CN1368511A (zh
Inventor
顾健人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cancer Institute
Original Assignee
Shanghai Cancer Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cancer Institute filed Critical Shanghai Cancer Institute
Priority to CNB011053127A priority Critical patent/CN1205225C/zh
Publication of CN1368511A publication Critical patent/CN1368511A/zh
Application granted granted Critical
Publication of CN1205225C publication Critical patent/CN1205225C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。

Description

具有抑癌功能的新的人蛋白及其编码序列
技术领域
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸和此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
背景技术
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
发明内容
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
3T3细胞是一种小鼠成纤维细胞(J.Cell.Biol.,17:299,1963)。在癌症研究领域中,常将外源基因(尤其是人基因)引入3T3细胞,观察其对3T3细胞生长的影响情况。通常认为,对3T3细胞生长有影响的基因是癌症相关基因,其中对3T3细胞生长有抑制作用的基因大多是抑癌基因,而对3T3细胞生长有促进作用的基因大多是(原)癌基因。
本发明采用大规模cDNA克隆转染小鼠胚胎成纤维细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对3T3细胞具有抑制克隆形成的作用,其抑制率≥50%。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP239蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ IDNO:3所示的编码区序列有差别的核酸序列。再以PP446蛋白为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。对于其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽有相同的生物学功能(以PP239蛋白为例)和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold SpringHarbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明多核苷酸的载体,以及用本发明载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将本发明蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,etal.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。这些抗体可用常规方法制备。抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与本发明蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而现在只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
具体实施方式
实施例1:cDNA基因的获得及对3T3细胞克隆形成的抑制作用
PP239、PP446、PP5715、PP6977、PP8482、PP8607、PP8857、PP8875、PP8997、PP9012、PP9286和PP9363是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染细胞系3T3。100ngDNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克隆形成,计数。发现以上12个克隆有抑制细胞克隆形成作用,结果如下表所示。
         cDNA克隆转染细胞(3T3)的克隆形成情况
cDNA克隆名称 cDNA克隆数(三个重复) 空载体克隆数(三个重复)
    PP239PP446PP5715PP6977PP8482PP8607PP8857PP8875PP8997PP9012PP9286PP9363     6     5     38     6     310    12    1414    15    1913    14    1811    15    1710    12    1411    15    1710    21    1413    15    197     6     33     2     4     50    36    2550    36    2527    29    3027    29    3027    29    3027    29    3027    29    3027    29    3027    29    3027    29    3027    29    3027    29    30
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28、31、34)。
实施例2:从胎盘cDNA中PCR获得全长基因:
取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表所示),按97℃3′1个循环;94℃30″→60℃30″→72℃1′,共35个循环;72℃10′,1个循环进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,获得重组蛋白(SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35)。
                          基因特异引物
    克隆名称     特异引物1(5′→3′)   特异引物2(5′→3′)
    PP239PP446PP5715PP6977PP8482PP8607PP8857PP8875PP8997PP9012PP9286PP9363     TAGTGATTGAGGCCATGCTGTTTGCCATCACATACCTGGACTTTGGACTGAGGTCCCTGTAGGACCTGTGTGAGCTGCATGGGGGTATGATAAGCTGGGACCTCCCGCTGAGTGTATTTCAGATGAATGTGGCCTTCGAGAGGGGTTAACGTTAGCATGGCTCGTCCCTCCGCAGTCTGAGACGCAGCTGTGTGAAATCCGTCCTGAATGTCTTGGAGCCTTCTTCCAGGACAAGCTG   AGAGGCACAAGGAGGCAGTAGCTGCAGTCTTGGATGGTCTCAGCATTTGTGCTTCTGAGCCAGGTAGCCCCGTAGCAGTTCGTCACTCTCCATGTCCAGGCTCTGGGATGAACTTGGAGGGATCCAGCAGTGAGAAGGACAAACCTGAGTCCTCCTCCAGGAAGGGGTTCATGTCATTGTTTGGAGAAAGCTGCAAAAGCAGGCTCGCCTTCTCAATAGTGTGTCAGGTACAGGTGGGA
实施例3:cDNA克隆序列分析
1.PP239
A:核苷酸序列(SEQ ID NO:1)长度:2453
   1  GGCCATTTTG CGGGAAGAGG AGGCGCTGTA CCTGCAGTGC TGCTTTTCTT GCCTAGACTC
  61  TAGGAACTAT CCGAGCTCCA CTCCCCACAA CATACTCAAA GGAACGGAGA GAACCGGGAC
 121  CCCCCTGCGG GGACCCGGAA CTGATCTGAC AGGATGGCAT CTGATGACTT TGACATAGTG
 181  ATTGAGGCCA TGCTGGAAGC TCCCTATAAA AAAGAAGAGG ATGAGCAACA AAGGAAAGAA
 241  GTTAAAAAGG ATTATCCTAG CAATACCACC AGCAGCACCA GCAACAGTGG CAATGAGACC
 301  AGTGGAAGCA GCACCATCGG GGAGACAAGC AAGAAGAAGA GGAGTCGGAG CCATAATAAA
 361  AGCAGGGATA GAAAGCGCAG TCGTAGTCGA GATCGGGATC GGTATAGACG GAGAAATAGT
 421  CGGAGCCGAA GTCCAGGTCG GCAGTGTCGT CACCCGTAGC CGTAGCTGGG ATCGTCGACA
 481  TGGTAGTGAG TCGCGAAGTC GGGACCATCG TCGTGAGGAT CGTGTGCATT ACAGGAGTCC
 541  TCCACTTACC ACTGGTTATA GATATGGACA CAGTAAGAGT CCTCATTTCA GAGAGAAGAG
 601  CCCAGTCAGG GAGCCAGTTG ATAATCTGAG TCCTGAGGAG CGTGATGCCC GCACAGTTTT
 661  CTGTATGCAG TTAGCTGCCC GAATTCGGCC TCGAGATCTG GAGGACTTTT TCTCTGCTGT
 721  AGGCAAGGTT CGCGATGTAC GTATCATTTC AGATCGGAAC TCACGTCGTT CTAAGGGCAT
 781  TGCCTACGTG GAATTCTGTG AAATCCAGTC TGTGCCACTG GCCATTGGGC TGACTGGGCA
 841  GCGGTTGCTG GGAGTGCCTA TCATTGTACA GGCTTCACAG GCAGAGAAAA ACCGACTGGC
 901  AGCCATGGCC AACAACCTGC AAAAGGGCAA TGGTGGACCA ATGCGCCTCT ATGTGGGTTC
 961  CCTGCACTTC AATATCACTG AAGACATGCT CCGGGGCATC TTTGAGCCCT TTGGTAAAAT
1021  TGATAATATT GTCCTGATGA AGGACTCAGA TACAGGCCGC TCTAAAGGTT ATGGTTTCAT
1081  CACGTTCTCT GATTCTGAGT GTGCCCGGCG GGCCCTGGAA CAGTTGAATG GGTTTGAGCT
1141  TGCTGGTCGA CCTATGAGGG TTGGCCATGT GACTGAGCGA CTGGATGGTG GCACAGACAT
1201  CACTTTTCCT GATGGGGACC AGGAGCTGGA TCTGGGATCA GCAGGTGGAC GTTTTCAGCT
1261  CATGGCAAAA CTGGCAGAAG GCGCTGGAAT CCAACTGCCA AGCACTGCTG CTGCTGCTGC
1321  TGCCGCCGCC GCCGCCCAGG CTGCTGCCTT GCAACTGAAT GGAGCAGTTC CCTTGGGGGC
1381  CCTGAATCCA GCAGCTCTGA CTGCTCTGAG TCCAGCCCTG AACCTTGCCT CCCAGTGTTT
1441  CCAGCTCTCC AGCCTCTTTA CCCCCCAGAC CATGTAAATC AGTGGCACAG TATACTGCCT
1501  CCTTGTGCCT CTGGATCCTG CCACTTCACA TCTACTCTTC CATGGCCCCA TTTCTCCATT
1561  TTGTGGACCA AGCCATCCTG AGGGCATGGA CATTGTCTCT GAGGAAATTG GGGCCACCCT
1621  TAAGATACCA AGAAAAGCTC CTGCCCATGG TCCCACTGGA AATGGACTCT GCTGAGCAAA
1681  GCCACCAGTT GAAGAGAACA GAATCCACAC CTGCATTGAA TACCTGTTTC TCCATGTGTA
1741  TCGTCTCTGA GATTACCTTC TTGCCCTTTC CAACACCTTA GTGATTCCTC AATTTCTCCC
1801  CCATTGGGAA GGCCATAGGG CATTAACTGA AGGAACTGAC CTCTCTCCTT TTCCTGTACC
1861  TTTAACCTTT AGTCTGTCAA GGAAAACCCT TAGGACCTCT GAATCAAGAG GACTGAGTTT
1921  GTGGGTGAAC CTTGAAGGTG CTCTTTCTGC TACAAGGGCC CTGGGAGATA GCATGGACGT
1981  GCATTGAGAA GCCAGCCTCA GACCTTAGCT TGAAGCAGCT TGAGGCCAGA CCTACTGTAG
2041  CCTCAGCATC TTGCTAGGAG GCATGGAAGT GATCTATCCT GCCAGGAGGC CTCAGAGTGA
2101  TCTGTCCTGC CAGGAGGTGT GAGAGTGATC TGTCCTGTGA GGCATTTAGG GGCTTTCAGG
2161  AATTTAGTAA AAGGTGGAGT ATGCCTTTCC AGTATCTTCC ATCTTCCTTT GTATACTTGT
2221  CCTTCCTCCC ATTTCCTCCC TTTGGCCCGA GGTAGGAGGA TGGAGGGAGG CTGCTACTCT
2281  ACCACTTCCT GTGTGCCTCT ACTGTGGCCT CAACCCTGGC AATTATAGCT ACTCCCATCC
2341  CTTACCTGGG CATGTGTGAG CCCTTCTCAC TGGATTTTAT ACCCTTGTGT CTGTGTACAT
2401  AAATATATAT ACATATATAT ATCCATAAAA AAAAAAAAAA AAAAAAAAAA AAA
B:氨基酸序列(SEQ ID NO:2)长度:418
  1  MSNKGKKLKR IILAIPPAAP ATVAMRPVEA APSGRQARRR GVGAIIKAGI ESAVVVEIGI
 61  GIDGEIVGAE VQVGSVVTRS RSWDRRHGSE SRSRDHRRED RVHYRSPPLT TGYRYGHSKS
121  PHFREKSPVR EPVDNLSPEE RDARTVFCMQ LAARIRPRDL EDFFSAVGKV RDVRIISDRN
181  SRRSKGIAYV EFCEIQSVPL AIGLTGQRLL GVPIIVQASQ AEKNRLAAMA NNLQKGNGGP
241  MRLYVGSLHF NITEDMLRGI FEPFGKIDNI VLMKDSDTGR SKGYGFITFS DSECARRALE
301  QLNGFELAGR PMRVGHVTER LDGGTDITFP DGDQELDLGS AGGRFQLMAK LAEGAGIQLP
361  STAAAAAAAA AAQAAALQLN GAVPLGALNP AALTALSPAL NLASQCFQLS SLFTPQTM
C.核苷酸及氨基酸组合序列(SEQ ID NO:3)克隆号:PP239
起始编码子:221 ATG  终止编码子:1475 TAA  蛋白质分子量:45028.93
(注:(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿。)
  1     G GCC ATT TTG CGG GAA GAG GAG GCG CTG TAC CTG CAG TGC TGC TTT      46
  47  TCT TGC CTA GAC TCT AGG AAC TAT CCG AGC TCC ACT CCC CAC AAC ATA      94
  95  CTC AAA GGA ACG GAG AGA ACC GGG ACC CCC CTG CGG GGA CCC GGA ACT     142
 143  GAT CTG ACA GGA TGG CAT CTG ATG ACT TTG ACA TAG TGA TTG AGG CCA     190
 191  TGC TGG AAG CTC CCT ATA AAA AAG AAG AGG ATG AGC AAC AAA GGA AAG     238
   1                                          Met Ser Asn Lys Gly Lys       6
 239  AAG TTA AAA AGG ATT ATC CTA GCA ATA CCA CCA GCA GCA CCA GCA ACA     286
   7  Lys Leu Lys Arg Ile I1e Leu Ala Ile Pro Pro Ala Ala Pro Ala Thr      22
 287  GTG GCA ATG AGA CCA GTG GAA GCA GCA CCA TCG GGG AGA CAA GCA AGA     334
  23  Val Ala Met Arg Pro Val Glu Ala Ala Pro Ser Gly Arg Gln Ala Arg      38
 335  AGA AGA GGA GTC GGA GCC ATA ATA AAA GCA GGG ATA GAA AGC GCA GTC     382
  39  Arg Arg Gly Val Gly Ala Ile Ile Lys Ala Gly Ile Glu Ser Ala Val      54
 383  GTA GTC GAG ATC GGG ATC GGT ATA GAC GGA GAA ATA GTC GGA GCC GAA     430
  55  Val Val Glu Ile Gly Ile Gly Ile Asp Gly Glu Ile Val Gly Ala Glu      70
 431  GTC CAG GTC GGC AGT GTC GTC ACC CGT AGC CGT AGC TGG GAT CGT CGA     478
  71  Val Gln Val Gly Ser Val Val Thr Arg Ser Arg Ser Trp Asp Arg Arg      86
 479  CAT GGT AGT GAG TCG CGA AGT CGG GAC CAT CGT CGT GAG GAT CGT GTG     526
  87  His Gly Ser Glu Ser Arg Ser Arg Asp His Arg Arg Glu Asp Arg Val     102
 527  CAT TAC AGG AGT CCT CCA CTT ACC ACT GGT TAT AGA TAT GGA CAC AGT     574
 103  His Tyr Arg Ser Pro Pro Leu Thr Thr Gly Tyr Arg Tyr Gly His Ser     118
 575  AAG AGT CCT CAT TTC AGA GAG AAG AGC CCA GTC AGG GAG CCA GTT GAT     622
 119  Lys Ser Pro His Phe Arg Glu Lys Ser Pro Val Arg Glu Pro Val Asp     134
 623  AAT CTG AGT CCT GAG GAG CGT GAT GCC CGC ACA GTT TTC TGT ATG CAG     670
 135  Asn Leu Ser Pro Glu Glu Arg Asp Ala Arg Thr Val Phe Cys Met Gln     150
 671  TTA GCT GCC CGA ATT CGG CCT CGA GAT CTG GAG GAC TTT TTC TCT GCT     718
 151  Leu Ala Ala Arg Ile Arg Pro Arg Asp Leu Glu Asp Phe Phe Ser Ala     166
 719  GTA GGC AAG GTT CGC GAT GTA CGT ATC ATT TCA GAT CGG AAC TCA CGT     766
 167  Val Gly Lys Val Arg Asp Val Arg Ile Ile Ser Asp Arg Asn Ser Arg     182
 767  CGT TCT AAG GGC ATT GCC TAC GTG GAA TTC TGT GAA ATC CAG TCT GTG     814
 183  Arg Ser Lys Gly Ile Ala Tyr Val Glu Phe Cys Glu Ile Gln Ser Val     198
 815  CCA CTG GCC ATT GGG CTG ACT GGG CAG CGG TTG CTG GGA GTG CCT ATC     862
 199  Pro Leu Ala Ile Gly Leu Thr Gly Gln Arg Leu Leu Gly Val Pro Ile     214
 863  ATT GTA CAG GCT TCA CAG GCA GAG AAA AAC CGA CTG GCA GCC ATG GCC     910
 215  Ile Val Gln Ala Ser Gln Ala Glu Lys Asn Arg Leu Ala Ala Met Ala     230
 911  AAC AAC CTG CAA AAG GGC AAT GGT GGA CCA ATG CGC CTC TAT GTG GGT     958
 231  Asn Asn Leu Gln Lys Gly Asn Gly Gly Pro Met Arg Leu Tyr Val Gly     246
 959  TCC CTG CAC TTC AAT ATC ACT GAA GAC ATG CTC CGG GGC ATC TTT GAG    1006
 247  Ser Leu His Phe Asn Ile Thr Glu Asp Met Leu Arg Gly Ile Phe Glu     262
1007  CCC TTT GGT AAA ATT GAT AAT ATT GTC CTG ATG AAG GAC TCA GAT ACA    1054
 263  Pro Phe Gly Lys Ile Asp Asn Ile Val Leu Met Lys Asp Ser Asp Thr     278
1055  GGC CGC TCT AAA GGT TAT GGT TTC ATC ACG TTC TCT GAT TCT GAG TGT    1102
 279  Gly Arg Ser Lys Gly Tyr Gly Phe Ile Thr Phe Ser Asp Ser Glu Cys     294
1103  GCC CGG CGG GCC CTG GAA CAG TTG AAT GGG TTT GAG CTT GCT GGT CGA    1150
 295  Ala Arg Arg Ala Leu Glu Gln Leu Asn Gly Phe Glu Leu Ala Gly Arg     310
1151  CCT ATG AGG GTT GGC CAT GTG ACT GAG CGA CTG GAT GGT GGC ACA GAC    1198
 311  Pro Met Arg Val Gly His Val Thr Glu Arg Leu Asp Gly Gly Thr Asp     326
1199  ATC ACT TTT CCT GAT GGG GAC CAG GAG CTG GAT CTG GGA TCA GCA GGT    1246
 327  Ile Thr Phe Pro Asp Gly Asp Gln Glu Leu Asp Leu Gly Ser Ala Gly     342
1247  GGA CGT TTT CAG CTC ATG GCA AAA CTG GCA GAA GGC GCT GGA ATC CAA    1294
 343  Gly Arg Phe Gln Leu Met Ala Lys Leu Ala Glu Gly Ala Gly Ile Gln     358
1295  CTG CCA AGC ACT GCT GCT GCT GCT GCT GCC GCC GCC GCC GCC CAG GCT    1342
 359  Leu Pro Ser Thr Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Gln Ala     374
1343  GCT GCC TTG CAA CTG AAT GGA GCA GTT CCC TTG GGG GCC CTG AAT CCA    1390
 375  Ala Ala Leu Gln Leu Asn Gly Ala Val Pro Leu Gly Ala Leu Asn Pro     390
1391  GCA GCT CTG ACT GCT CTG AGT CCA GCC CTG AAC CTT GCC TCC CAG TGT    1438
 391  Ala Ala Leu Thr Ala Leu Ser Pro Ala Leu Asn Leu Ala Ser Gln Cys     406
1439  TTC CAG CTC TCC AGC CTC TTT ACC CCC CAG ACC ATG TAA ATC AGT GGC    1486
 407  Phe Gln Leu Ser Ser Leu Phe Thr Pro Gln Thr Met ***                 419
1487  ACA GTA TAC TGC CTC CTT GTG CCT CTG GAT CCT GCC ACT TCA CAT CTA    1534
1535  CTC TTC CAT GGC CCC ATT TCT CCA TTT TGT GGA CCA AGC CAT CCT GAG    1582
1583  GGC ATG GAC ATT GTC TCT GAG GAA ATT GGG GCC ACC CTT AAG ATA CCA    1630
1631  AGA AAA GCT CCT GCC CAT GGT CCC ACT GGA AAT GGA CTC TGC TGA GCA    1678
1679  AAG CCA CCA GTT GAA GAG AAC AGA ATC CAC ACC TGC ATT GAA TAC CTG    1726
1727  TTT CTC CAT GTG TAT CGT CTC TGA GAT TAC CTT CTT GCC CTT TCC AAC    1774
1775  ACC TTA GTG ATT CCT CAA TTT CTC CCC CAT TGG GAA GGC CAT AGG GCA    1822
1823  TTA ACT GAA GGA ACT GAC CTC TCT CCT TTT CCT GTA CCT TTA ACC TTT    1870
1871  AGT CTG TCA AGG AAA ACC CTT AGG ACC TCT GAA TCA AGA GGA CTG AGT    1918
1919  TTG TGG GTG AAC CTT GAA GGT GCT CTT TCT GCT ACA AGG GCC CTG GGA    1966
1967  GAT AGC ATG GAC GTG CAT TGA GAA GCC AGC CTC AGA CCT TAG CTT GAA    2014
2015  GCA GCT TGA GGC CAG ACC TAC TGT AGC CTC AGC ATC TTG CTA GGA GGC    2062
2063  ATG GAA GTG ATC TAT CCT GCC AGG AGG CCT CAG AGT GAT CTG TCC TGC    2110
2111  CAG GAG GTG TGA GAG TGA TCT GTC CTG TGA GGC ATT TAG GGG CTT TCA    2158
2159  GGA ATT TAG TAA AAG GTG GAG TAT GCC TTT CCA GTA TCT TCC ATC TTC    2206
2207  CTT TGT ATA CTT GTC CTT CCT CCC ATT TCC TCC CTT TGG CCC GAG GTA    2254
2255  GGA GGA TGG AGG GAG GCT GCT ACT CTA CCA CTT CCT GTG TGC CTC TAC    2302
2303  TGT GGC CTC AAC CCT GGC AAT TAT AGC TAC TCC CAT CCC TTA CCT GGG    2350
2351  CAT GTG TGA GCC CTT CTC ACT GGA TTT TAT ACC CTT GTG TCT GTG TAC    2398
2399  ATA AAT ATA TAT ACA TAT ATA TAT CCA TAA AAA AAA AAA AAA AAA AAA    2446
2447  AAA AAA A                                                          2453
2.PP446
A:核苷酸序列(SEQ ID NO:4)长度:2086
   1  GGGCATCAAG TCTCTGTCTC CCTTTGCCAT CACATACCTG GATCGGCTGC TCCTGATGCA
  61  TCCCAACCTT ACCAAGGGCT TCGGCATGAT TGGCCCCAAG GACTTCTTCC CACTTCTGGA
 121  CTTTGCCTAT ATGCCGAACA ACTCCCTGAC ACCCAGCCTG CAGGAGCAGC TGTGTCAGCT
 181  CTACCCCCGA CTGAAAGTGC TGGCATTTGG AGCAAAGCCG GATTCCACCC TGCATACCTA
 241  CTTCCCTTCT TTCCTGTCCA GAGCCACCCC TAGCTGTCCC CCTGAGATGA AGAAAGAGCT
 301  CCTGAGCAGC CTGACTGAGT GCCTGACGGT GGACCCCCTC AGTGCCAGCG TCTGGAGGCA
 361  GTTGTACCCT AAGCACCTGT CACAGTCCAG CCTTCTGCTG GAGCACTTGC TCAGCTCCTG
 421  GGAGCAGATT CCCAAGAAGG TACAGAAGTC TTTGCAAGAA ACCATTCAGT CCCTCAAGCT
 481  TACCAACCAG GAGCTGCTGA GGAAGGGTAG CAGTAACAAC CAGGATGTCG TCACCTGTGA
 541  CATGGCCTGC AAGGGCCTGT TGCAGCAGGT TCAGGGTCCT CGGCTGCCCT GGACGCGGCT
 601  CCTCCTGTTG CTGCTGGTCT TCGCTGTAGG CTTCCTGTGC CATGACCTCT GGTCACACAG
 661  CTCCTTCCAG GCCTCCCTTA CTGGCCGGTT GCTTCGATCA TCTGGCTTCT TACCTGCTAG
 721  CCAACAAGCG TGTGCCAAGC TCTACTCCTA CAGTCTGCAA GGCTACAGCT GGCTGGGGGA
 781  GACACTGCCG CTCTGGGGCT CCCACCTGCT CACCGTGGTG CGGCCCAGCT TGCAGCTGGC
 841  CTGGGCTCAC ACCAATGCCA CAGTCAGCTT CCTTTCTGCC CACTGTGCCT CTCACCTTGC
 901  GTGGTTTGGT GACAGTCTCA CCAGTCTCTC TCAGAGGCTG CAGATCCAGC TCCCCGATTC
 961  CGTGAATCAG CTACTCCGCT ATCTGAGAGA GCTGCCCCTG CTTTTCCACC AGAATGTGCT
1021  GCTGCCACTG TGGCACCTCT TGCTTGAGGC CCTGGCCTGG GCCCAGGAGC ACTGCCATGA
1081  GGCATGCAGA GGTGAGGTGA CCTGGGACTG CATGAAGACA CAGCTCAGTG AGGCTGTCCA
1141  CTGGACCTGG CTTTGCCTAC AGGACATTAC AGTGGCTTTC TTGGACTGGG CACTTGCCCT
1201  GATATCCCAG CAGTAGGCCC TGCCTTCCTG GCCACTGATT TCTGCATGGG TAGACCATCC
1261  AAGACTGCAG CGGGTAGAAG GTGGCAGTTC TTCATGGGAG TCTTTTTAAC TTGGTGCCTG
1321  AGTTCTCTCC TAGGCAAGTG GCCAGTTGCC TCCACCTCAG TTCTTCCATC TTTGGTGGGG
1381  ACAGGGCCCA GCAGCATCTC AGCCTCCTAC CCACAATTCC ACTGAACACT TTTCTGGCCC
1441  TACTGCACAT GGCCCCCAGC CTCCATCCTT GTGCTGGTAG CCTCTCACAA CTCCGCCCTT
1501  GCCCTCTGCC TTCCACTTCC TTCCATCTCA TTTCTAAACC CCAAACAGCT CATCTCTAAA
1561  AAGATAGAAC TCCCAGCAGG TGGCTTCTGT GTTCTTCTGA CAAATGATTC CTGCTTCTCC
1621  AGACTTTAGC AGCCTCCTGT TCCCATTCTT GGTCACAGCT CTAGCCACAG CAGAAGGAAA
1681  GGGGCTTCCA GAAGAATATA GCACCGCATT GGGAAACAGC AGCCTCACCT CCACCTGAAG
1741  CCTGGGTGTG GCTGTCAGTG GACATGGGGA GCTGGATGGA AATGCCTCTC ACTTCAAAAT
1801  GCCCAGCCTG CCCCAAATGC CTCTAAGCCC CTCCCTGTCC CCTCCCTTGT AGTCCTACTT
1861  CTTCCAACTT TCCATTCCCC ATCATGCTGG GGGTCTTGGT CACAAGGCTC AGCTTCTCTC
1921  CACTGTCCAT CCCTCCTATC ATCTGTAGAG CAGAGCACAG GCAGTTGTGT GCCTTGGGCC
1981  CAGGGAACCC TCCATCAACC TGAGACAGGA CTCAGTATAT GGTTCTTGGG TATGCCCTAC
2041  CAGGTGGAAT AAAGGACACA GATTTGAAAA AAAAAAAAAA AAAAAA
B:氨基酸序列(SEQ ID NO:5)长度:386
  1  MHPNLTKGFG MIGPKDFFPL LDFAYMPNNS LTPSLQEQLC QLYPRLKVLA FGAKPDSTLH
 61  TYFPSFLSRA TPSCPPEMKK ELLSSLTECL TVDPLSASVW RQLYPKHLSQ SSLLLEHLLS
121  SWEQIPKKVQ KSLQETIQSL KLTNQELLRK GSSNNQDVVT CDMACKGLLQ QVQGPRLPWT
181  RLLLLLLVFA VGFLCHDLWS HSSFQASLTG RLLRSSGFLP ASQQACAKLY SYSLQGYSWL
241  GETLPLWGSH LLTVVRPSLQ LAWAHTNATV SFLSAHCASH LAWFGDSLTS LSQRLQIQLP
301  DSVNQLLRYL RELPLLFHQN VLLPLWHLLL EALAWAQEHC HEACRGEVTW DCMKTQLSEA
361  VHWTWLCLQD ITVAFLDWAL ALISQQ
C.核苷酸及氨基酸组合序列(SEQ ID NO:6)克隆号:PP446
起始编码子:56 ATG  终止编码子:1214 TAG  蛋白质分子量:43684.30
  1    G GGC ATC AAG TCT CTG TCT CCC TTT GCC ATC ACA TAC CTG GAT CGG     46
 47  CTG CTC CTG ATG CAT CCC AAC CTT ACC AAG GGC TTC GGC ATG ATT GGC     94
  1              Met His Pro Asn Leu Thr Lys Gly Phe Gly Met Ile Gly     13
 95  CCC AAG GAC TTC TTC CCA CTT CTG GAC TTT GCC TAT ATG CCG AAC AAC    142
 14  Pro Lys Asp Phe Phe Pro Leu Leu Asp Phe Ala Tyr Met Pro Asn Asn     29
143  TCC CTG ACA CCC AGC CTG CAG GAG CAG CTG TGT CAG CTC TAC CCC CGA    190
 30  Ser Leu Thr Pro Ser Leu Gln Glu Gln Leu Cys Gln Leu Tyr Pro Arg     45
191  CTG AAA GTG CTG GCA TTT GGA GCA AAG CCG GAT TCC ACC CTG CAT ACC    238
 46  Leu Lys Val Leu Ala Phe Gly Ala Lys Pro Asp Ser Thr Leu His Thr     61
239  TAC TTC CCT TCT TTC CTG TCC AGA GCC ACC CCT AGC TGT CCC CCT GAG    286
 62  Tyr Phe Pro Ser Phe Leu Ser Arg Ala Thr Pro Ser Cys Pro Pro Glu     77
287  ATG AAG AAA GAG CTC CTG AGC AGC CTG ACT GAG TGC CTG ACG GTG GAC    334
 78  Met Lys Lys Glu Leu Leu Ser Ser Leu Thr Glu Cys Leu Thr Val Asp     93
335  CCC CTC AGT GCC AGC GTC TGG AGG CAG TTG TAC CCT AAG CAC CTG TCA    382
 94  Pro Leu Ser Ala Ser Val Trp Arg Gln Leu Tyr Pro Lys His Leu Ser    109
383  CAG TCC AGC CTT CTG CTG GAG CAC TTG CTC AGC TCC TGG GAG CAG ATT    430
110  Gln Ser Ser Leu Leu Leu Glu His Leu Leu Ser Ser Trp Glu Gln Ile    125
431  CCC AAG AAG GTA CAG AAG TCT TTG CAA GAA ACC ATT CAG TCC CTC AAG    478
126  Pro Lys Lys Val Gln Lys Ser Leu Gln Glu Thr Ile Gln Ser Leu Lys    141
479  CTT ACC AAC CAG GAG CTG CTG AGG AAG GGT AGC AGT AAC AAC CAG GAT    526
142  Leu Thr Asn Gln Glu Leu Leu Arg Lys Gly Ser Ser Asn Asn Gln Asp    157
527  GTC GTC ACC TGT GAC ATG GCC TGC AAG GGC CTG TTG CAG CAG GTT CAG    574
158  Val Val Thr Cys Asp Met Ala Cys Lys Gly Leu Leu Gln Gln Val Gln    173
575  GGT CCT CGG CTG CCC TGG ACG CGG CTC CTC CTG TTG CTG CTG GTC TTC    622
174  Gly Pro Arg Leu Pro Trp Thr Arg Leu Leu Leu Leu Leu Leu Val Phe    189
623  GCT GTA GGC TTC CTG TGC CAT GAC CTC TGG TCA CAC AGC TCC TTC CAG    670
190  Ala Val Gly Phe Leu Cys His Asp Leu Trp Ser His Ser Ser Phe Gln    205
671  GCC TCC CTT ACT GGC CGG TTG CTT CGA TCA TCT GGC TTC TTA CCT GCT    718
206  Ala Ser Leu Thr Gly Arg Leu Leu Arg Ser Ser Gly Phe Leu Pro Ala    221
719  AGC CAA CAA GCG TGT GCC AAG CTC TAC TCC TAC AGT CTG CAA GGC TAC    766
 222  Ser Gln Gln Ala Cys Ala Lys Leu Tyr Ser Tyr Ser Leu Gln Gly Tyr     237
 767  AGC TGG CTG GGG GAG ACA CTG CCG CTC TGG GGC TCC CAC CTG CTC ACC     814
 238  Ser Trp Leu Gly Glu Thr Leu Pro Leu Trp Gly Ser His Leu Leu Thr     253
 815  GTG GTG CGG CCC AGC TTG CAG CTG GCC TGG GCT CAC ACC AAT GCC ACA     862
 254  Val Val Arg Pro Ser Leu Gln Leu Ala Trp Ala His Thr Asn Ala Thr     269
 863  GTC AGC TTC CTT TCT GCC CAC TGT GCC TCT CAC CTT GCG TGG TTT GGT     910
 270  Val Ser Phe Leu Ser Ala His Cys Ala Ser His Leu Ala Trp Phe Gly     285
 911  GAC AGT GTC ACC AGT CTC TCT CAG AGG CTG CAG ATC CAG CTC CCC GAT     958
 286  Asp Ser Leu Thr Ser Leu Ser Gln Arg Leu Gln Ile Gln Leu Pro Asp     301
 959  TCC GTG AAT CAG CTA CTC CGC TAT CTG AGA GAG CTG CCC CTG CTT TTC    1006
 302  Ser Val Asn Gln Leu Leu Arg Tyr Leu Arg Glu Leu Pro Leu Leu Phe     317
1007  CAC CAG AAT GTG CTG CTG CCA CTG TGG CAC CTC TTG CTT GAG GCC CTG    1054
 318  His Gln Asn Val Leu Leu Pro Leu Trp His Leu Leu Leu Glu Ala Leu     333
1055  GCC TGG GCC CAG GAG CAC TGC CAT GAG GCA TGC AGA GGT GAG GTG ACC    1102
 334  Ala Trp Ala Gln Glu His Cys His Glu Ala Cys Arg Gly Glu Val Thr     349
1103  TGG GAC TGC ATG AAG ACA CAG CTC AGT GAG GCT GTC CAC TGG ACC TGG    1150
 350  Trp Asp Cys Met Lys Thr Gln Leu Ser Glu Ala Val His Trp Thr Trp     365
1151  CTT TGC CTA CAG GAC ATT ACA GTG GCT TTC TTG GAC TGG GCA CTT GCC    1198
 366  Leu Cys Leu Gln Asp Ile Thr Val Ala Phe Leu Asp Trp Ala Leu Ala     381
1199  CTG ATA TCC CAG CAG TAG GCC CTG CCT TCC TGG CCA CTG ATT TCT GCA    1246
 382  Leu Ile Ser Gln Gln ***                                             387
1247  TGG GTA GAC CAT CCA AGA CTG CAG CGG GTA GAA GGT GGC AGT TCT TCA    1294
1295  TGG GAG TCT TTT TAA CTT GGT GCC TGA GTT CTC TCC TAG GCA AGT GGC    1342
1343  CAG TTG CCT CCA CCT CAG TTC TTC CAT CTT TGG TGG GGA CAG GGC CCA    1390
1391  GCA GCA TCT CAG CCT CCT ACC CAC AAT TCC ACT GAA CAC TTT TCT GGC    1438
1439  CCT ACT GCA CAT GGC CCC CAG CCT CCA TCC TTG TGC TGG TAG CCT CTC    1486
1487  ACA ACT CCG CCC TTG CCC TCT GCC TTC CAC TTC CTT CCA TCT CAT TTC    1534
1535  TAA ACC CCA AAC AGC TCA TCT CTA AAA AGA TAG AAC TCC CAG CAG GTG    1582
1583  GCT TCT GTG TTC TTC TGA CAA ATG ATT CCT GCT TCT CCA GAC TTT AGC    1630
1631  AGC CTC CTG TTC CCA TTC TTG GTC ACA GCT CTA GCC ACA GCA GAA GGA    1678
1679  AAG GGG CTT CCA GAA GAA TAT AGC ACC GCA TTG GGA AAC AGC AGC CTC    1726
1727  ACC TCC ACC TGA AGC CTG GGT GTG GCT GTC AGT GGA CAT GGG GAG CTG    1774
1775  GAT GGA AAT GCC TCT CAC TTC AAA ATG CCC AGC CTG CCC CAA ATG CCT    1822
1823  CTA AGC CCC TCC CTG TCC CCT CCC TTG TAG TCC TAC TTC TTC CAA CTT    1870
1871  TCC ATT CCC CAT CAT GCT GGG GGT CTT GGT CAC AAG GCT CAG CTT CTC    1918
1919  TCC ACT GTC CAT CCC TCC TAT CAT CTG TAG AGC AGA GCA CAG GCA GTT    1966
1967  GTG TGC CTT GGG CCC AGG GAA CCC TCC ATC AAC CTG AGA CAG GAC TCA    2014
2015  GTA TAT GGT TCT TGG GTA TGC CCT ACC AGG TGG AAT AAA GGA CAC AGA    2062
2063  TTT GAA AAA AAA AAA AAA AAA AAA                                    2086
3.PP5715
A:核苷酸序列(SEQ ID NO:7)长度:3178
  1  GCCTGGCCCT CTTCTCCTTC GTCACAGCCC TCATGTTCAG CTCCATCGTC TGCAGCGTCC
 61  CGCACACCTG GCAGCAAAAG AGAGGCCCTG ATGAGGACGG GGAGGAGGAG GCCGCTCCAG
121  GGCCGCGGCA GGCGCACGAC AGCCTCTACC GCGTCCACAT GCCCAGCCTG TACAGCTGTG
181  GCAGCAGCTA CGGCAGTGAG ACCAGCATCC CGGCCGCGGC CCACACCGTC AGCAACGCCC
241  CGGGCACTGA GTACATGAGC CAGAACGCTA ATTTCCAGAA CCCCCGCTGT GAGAACACCC
301  CACTCATTGG GCGCGAGTCC CCGCCGCCTC ATACACCTCC AGCATGAGAG CCAAATACCT
361  CGCCACGAGC CAGCCTCGCC CTGACTCCAG CGGCAGCCAC TAGACCGGCC CGGCAGCCAC
421  CCACCCCACG TGCCAACTTC CCCTCCCCGT GCCAGCACTG CCGCTTCCAC CTGGGCCACC
481  CACCGGACCC TCGCACGCCG TGCCAGGCCT GCCCCAGACG CGTCTGCAGG CCGCTTGCCC
541  TCCTGTCCCC TCCCCGCAGG GGCACAGTGG AGACGCAGGG GCTCTGGGCC CGTACCGCCA
601  ACTCGGGTCA CACCTGAACG CTGCTGCCAG CCGATGCCCC AGCCCTGCAC GCCACCCACT
661  ATCCCGGCAC GCTCCCTCTG CAGATGGTCG CCTGCACCTA CAAGCCCTGG CCGCACCCAA
 721  CCTGTGTTGT TGCCGCCCGG CCCTTCCCTC CACAGCTCTC CTTCCTCCCG CCCGGCACTT
 781  CTGTGGACCC CTTCTTAGTT CACAGGCACG GCTGGGGCCG CTCTGTGCTG GCGCCTGCTG
 841  GCCACTGAGG GACAGAGACA CGTGCCACCT GCTCATCTCT GCCCTGAGGT CACCCCGTGG
 901  TCCCTCCACG TGCCCATCTC TCTGCAGTGC CCTCCTCGCC TGTGGAGCCC GCCCACCCAC
 961  AGGCTCACCC CTCCTGCCGG CTGCCAGAGG CCCCCTCCAG CAGGGCCTCT CTCCGTTGCC
1021  CCAGCTTCAC TCTCTCCCTC AGCACCTGCC CTGCTGGAGG CCCCAGCCCT CCGTGGACAG
1081  CAGGGGCCAC GTGGAGCCCG GGCCGCTCAC CCGCCACCCA GTGCTGGCCG CCTTCTTGGT
1141  GCCAAACCCC CTTCCCCCAC CCAGAGACTG GGCAGCTGTG TCTGGTTCGT TCTTTGCACT
1201  AACCACATTT GTCATCTCTA GGACAGGCTG GGGCTGCGGG CTGAGGGGGA CCGCTGGCAC
1261  CCCCCTTCCC TCCCTTCTTG GTTCCATTTC CATCCATGAC AGGTACAGCA TTCCAGGAGC
1321  CCGGCCTGAG GGGCTGGACC CGAGCCGGCT GTGAACATCC CTCAGCCCCT GCTGTCCCCC
1381  CTTGGGACTA ACCACTAACC TCACCCCCAA ACTCCACGGG TGCCCCTAGC TGGCCCAGAG
1441  CCGGCAGTGT GAGCCCAAGT CCGGGCTGGA GCCGAGGCCG GAGCAGCTGT CTGGGAGTCA
1501  AGGCTGCAGT AGCGTTTCTT CATGGGGTGC TCAGGGGGTG CCACAGACCG ACAGGCAGCC
1561  CAAGGGCCTG GACACCCCTC CCCAGGCAGG TGCTGCCCCA GGAGGACTGT CCTCGGGAAT
1621  GAACCTCCCG CGGGCTTTGG ACTGAGGTCC CTGTGGCCTC GGTCTCCTCC CCATGAAGTG
1681  GGAGCGAGGC TCCCCAATGG TGCTTTTGGC TTTAGTGTAC GATGTTTGCT GTGCTTCCCG
1741  CCGTGGAGGG CAGAGCCACC CCACATCAGG ATCGGACGTG CTACCCCTCC CGGTCCCGGC
1801  CCTGGCCCAG CCAGCCCAGC CCTCGAGGCT CGATGCCTGT GCCAGGGCCA GGGGCAGCCA
1861  GAGGGCAGCT GGATGGCCAC GTGCAGGGGT CAAGGCTGGG CCCCGCAGTG GGGCGGGCCG
1921  CCAGCCCCAG CAGTTTACAG ACGCATGGCT CTTCCTCCCA GAGCAGCCGG CAGCTACCTG
1981  GACCGGAAAT GTCCTCATCC CCTCCCTGGG GCCAGGCTCT GCCCTGGCCT TCCTCTGTGA
2041  ACCCCTCCTT TCTTTGTGCT GGTGTCTGGG ACCAAAAAGG GGGAATATGG GAGGGCAGAG
2101  TGGGGAGGGG AGTCCATGGG CCTGGGGCCC CAAGCCGGGG CGTCTGAGCT CCCCAGGCAT
2161  GACCAAACCT CAGTGGAGGG GCCTCTGCTT CAGGCCCCGC CTGGCTGACA TTCTGAGCCC
2221  CCCTCGGAGG CCCCGCCACA GCCAACCTGC CCAGTCTTTC CTCTGGGCTT GACCCGCCAG
2281  GGGAGTTCTC CAGGCCTAGG GCCAGGAGAG AGGCCCTGGC ACCCTGGCGT GGGTGCCCGC
2341  CAAACGCCCT GCGACCGCTC AGAAGCACAA ATGCTGTCCA TGGCCGTGAG GCTGCCTGCC
2401  AGGTGAATGG ACATAGCGTG AGAGGCGGTG AGGCCAGGGC TTCCAGCCTC GTGCTGTCTC
2461  GGGACTCCTG ACCGTGGTGT GCGTGTGTGC CCATCTGTGA CTTTCTACTC ACCAAGGTTG
2521  AAGAAAGGAA ACGGGGAAAA TCAAAAGGGG TTCAAACCCC ACCTCAGTAG GTGGAGGGGA
2581  GCGCCTGCCA TTGGTTGTAT TTTTGTTCTG AGTTTTCGGT GCCGTGTTCC TAACTACTCC
2641  ATCCCATGAC CTCGCCACAC CTACTGGGGC ATCTGGCTGG CGCCTGCTGC CATGGCCAGC
2701  CCCCACTCTC ACCCTGCACA GGGGGTCTTG CAGCCCCCAG GCCCACAGCC TCGTTGGGAG
2761  GACAGGGTGG CCCTGGGGAC AAGAGGGAGG AGCCCAGGGG CTTACCTCAC TGAGAGTGCT
2821  CCCCAGCAGG CATCCACTAC CCCAGGGCCC CCCACATGTC ATGGCAAGGT TGGTAGTGAA
2881  TGGGCCTGGT TGGGAGCAGC CCCTGGCCCA TTGCCCACCC ACCCATCTCA CTATGCAATT
2941  CGAGTTCCAA GCAACATTTG CTCCTGCCCT GGGGCCAGCT CTGCCCCAGC CCTGAGAGGG
3001  GTGGTGAAGC AGCCCCCTGG ACCCCAGAAC CCCAGACAAG GGGGCAGGCG GGGGACCAGG
3061  GCCTCTCCTG TGGGATCTTT GTTTTGTGTT TAACCATAAT GGTTGTGTAC TGAACCACTT
3121  CATATTTGTT ATATATAATA TATATATATA TAATCTCAAA AAAAAAAAAA AAAAAAAA
B:氨基酸序列(SEQ ID NO:8)长度:199
  1  MKWERGSPMV LLALVYDVCC ASRRGGQSHP TSGSDVLPLP VPALAQPAQP SRLDACARAR
 61  GSQRAAGWPR AGYKAGPRSG AGRQPQQFTD AWLFLPEQPA ATWTGNVLIP SLGPGSALAF
121  LCEPLLSLCW CLGPKRGNMG GQSGEGSPWA WGPKPGRLSS PGMTKPQWRG LCFRPRLADI
181  LSPPRRPRHS QPAQSFLWA
C.核苷酸及氨基酸组合序列(SEQ ID NO:9)克隆号:PP5715
起始编码子:1673 ATG  终止编码子:2270 TGA  蛋白质分子量:21306.37
  1    G CCT GGC CCT CTT CTC CTT CGT CAC AGC CCT CAT GTT CAG CTC CAT     46
 47  CGT CTG CAG CGT CCC GCA CAC CTG GCA GCA AAA GAG AGG CCC TGA TGA     94
 95  GGA CGG GGA GGA GGA GGC CGC TCC AGG GCC GCG GCA GGC GCA CGA CAG    142
143  CCT CTA CCG CGT CCA CAT GCC CAG CCT GTA CAG CTG TGG CAG CAG CTA    190
191  CGG CAG TGA GAC CAG CAT CCC GGC CGC GGC CCA CAC CGT CAG CAA CGC    238
239  CCC GGG CAC TGA GTA CAT GAG CCA GAA CGC TAA TTT CCA GAA CCC CCG    286
287  CTG TGA GAA CAC CCC ACT CAT TGG GCG CGA GTC CCC GCC GCC TCA TAC    334
335  ACC TCC AGC ATG AGA GCC AAA TAC CTC GCC ACG AGC CAG CCT CGC CCT    382
 383  GAC TCC AGC GGC AGC CAC TAG ACC GGC CCG GCA GCC ACC CAC CCC ACG     430
 431  TGC CAA CTT CCC CTC CCC GTG CCA GCA CTG CCG CTT CCA CCT GGG CCA     478
 479  CCC ACC GGA CCC TCG CAC GCC GTG CCA GGC CTG CCC CAG ACG CGT CTG     526
 527  CAG GCC GCT TGC CCT CCT GTC CCC TCC CCG CAG GGG CAC AGT GGA GAC     574
 575  GCA GGG GCT CTG GGC CCG TAC CGC CAA CTC GGG TCA CAC CTG AAC GCT     622
 623  GCT GCC AGC CGA TGC CCC AGC CCT GCA CGC CAC CCA CTA TCC CGG CAC     670
 671  GCT CCC TCT GCA GAT GGT CGC CTG CAC CTA CAA GCC CTG GCC GCA CCC     718
 719  AAC CTG TGT TGT TGC CGC CCG GCC CTT CCC TCC ACA GCT CTC CTT CCT     766
 767  CCC GCC CGG CAC TTC TGT GGA CCC CTT CTT AGT TCA CAG GCA CGG CTG     814
 815  GGG CCG CTC TGT GCT GGC GCC TGC TGG CCA CTG AGG GAC AGA GAC ACG     862
 863  TGC CAC CTG CTC ATC TCT GCC CTG AGG TCA CCC CGT GGT CCC TCC ACG     910
 911  TGC CCA TCT CTC TGC AGT GCC CTC CTC GCC TGT GCA GCC CGC CCA CCC     958
 959  ACA GGC TCA CCC CTC CTG CCG GCT GCC AGA GGC CCC CTC CAG CAG GGC    1006
1007  CTC TCT CCG TTG CCC CAG CTT CAC TCT CTC CCT CAG CAC CTG CCC TGC    1054
1055  TGG AGG CCC CAG CCC TCC GTG GAC AGC AGG GGC CAC GTG GAG CCC GGG    1102
1103  CCG CTC ACC CGC CAC CCA GTG CTG GCC GCC TTC TTG GTG CCA AAC CCC    1150
1151  CTT CCC CCA CCC AGA GAC TGG GCA GCT GTG TCT GGT TCG TTC TTT GCA    1198
1199  CTA ACC ACA TTT GTC ATC TCT AGG ACA GGC TGG GGC TGC GGG CTG AGG    1246
1247  GGG ACC GCT GGC ACC CCC CTT CCC TCC CTT CTT GGT TCC ATT TCC ATC    1294
1295  CAT GAC AGG TAC AGC ATT CCA GGA GCC CGG CCT GAG GGG CTG GAC CCG    1342
1343  AGC CGG CTG TGA ACA TCC CTC AGC CCC TGC TGT CCC CCC TTG GGA CTA    1390
1391  ACC ACT AAC CTC ACC CCC AAA CTC CAC GGG TGC CCC TAG CTG GCC CAG    1438
1439  AGC CGG CAG TGT GAG CCC AAG TCC GGG CTG GAG CCG AGG CCG GAG CAG    1486
1487  CTG TCT GGG AGT CAA GGC TGC AGT AGC GTT TCT TCA TGG GGT GCT CAG    1534
1535  GGG GTG CCA CAG ACC GAC AGG CAG CCC AAG GGC CTG GAC ACC CCT CCC    1582
1583  CAG GCA GGT GCT GCC CCA GGA GGA CTG TCC TCG GGA ATG AAC CTC CCG    1630
1631  CGG GCT TTG GAC TGA GGT CCC TGT GGC CTC GGT CTC CTC CCC ATG AAG    1678
   1                                                          Met Lys       2
1679  TGG GAG CGA GGC TCC CCA ATG GTG CTT TTG GCT TTA GTG TAC GAT GTT    1726
   3  Trp Glu Arg Gly Ser Pro Met Val Leu Leu Ala Leu Val Tyr Asp Val      18
1727  TGC TGT GCT TCC CGC CGT GGA GGG CAG AGC CAC CCC ACA TCA GGA TCG    1774
  19  Cys Cys Ala Ser Arg Arg Gly Gly Gln Ser His Pro Thr Ser Gly Ser      34
1775  GAC GTG CTA CCC CTC CCG GTC CCG GCC CTG GCC CAG CCA GCC CAG CCC    1822
  35  Asp Val Leu Pro Leu Pro Val Pro Ala Leu Ala Gln Pro Ala Gln Pro      50
1823  TCG AGG CTC GAT GCC TGT GCC AGG GCC AGG GGC AGC CAG AGG GCA GCT    1870
  51  Ser Arg Leu Asp Ala Cys Ala Arg Ala Arg Gly Ser Gln Arg Ala Ala      66
1871  GGA TGG CCA CGT GCA GGG GTC AAG GCT GGG CCC CGC AGT GGG GCG GGC    1918
  67  Gly Trp Pro Arg Ala Gly Val Lys Ala Gly Pro Arg Ser Gly Ala Gly      82
1919  CGC CAG CCC CAG CAG TTT ACA GAC GCA TGG CTC TTC CTC CCA GAG CAG    1966
  83  Arg Gln Pro Gln Gln Phe Thr Asp Ala Trp Leu Phe Leu Pro Glu Gln      98
1967  CCG GCA GCT ACC TGG ACC GGA AAT GTC CTC ATC CCC TCC CTG GGG CCA    2014
  99  Pro Ala Ala Thr Trp Thr Gly Asn Val Leu Ile Pro Ser Leu Gly Pro     114
2015  GGC TCT GCC CTG GCC TTC CTC TGT GAA CCC CTC CTT TCT TTG TGC TGG    2062
 115  Gly Ser Ala Leu Ala Phe Leu Cys Glu Pro Leu Leu Ser Leu Cys Trp     130
2063  TGT CTG GGA CCA AAA AGG GGG AAT ATG GGA GGG CAG AGT GGG GAG GGG    2110
 131  Cys Leu Gly Pro Lys Arg Gly Asn Met Gly Gly Gln Ser Gly Glu Gly     146
2111  AGT CCA TGG GCC TGG GGC CCC AAG CCG GGG CGT CTG AGC TCC CCA GGC    2158
 147  Ser Pro Trp Ala Trp Gly Pro Lys Pro Gly Arg Leu Ser Ser Pro Gly     162
2159  ATG ACC AAA CCT CAG TGG AGG GGC CTC TGC TTC AGG CCC CGC CTG GCT    2206
 163  Met Thr Lys Pro Gln Trp Arg Gly Leu Cys Phe Arg Pro Arg Leu Ala     178
2207  GAC ATT CTG AGC CCC CCT CGG AGG CCC CGC CAC AGC CAA CCT GCC CAG    2254
 179  Asp Ile Leu Ser Pro Pro Arg Arg Pro Arg His Ser Gln Pro Ala Gln     194
2255  TCT TTC CTC TGG GCT TGA CCC GCC AGG GGA GTT CTC CAG GCC TAG GGC    2302
 195  Ser Phe Leu Trp Ala ***                                             200
2303  CAG GAG AGA GGC CCT GGC ACC CTG GCG TGG GTG CCC GCC AAA CGC CCT    2350
2351  GCG ACC GCT CAG AAG CAC AAA TGC TGT CCA TGG CCG TGA GGC TGC CTG    2398
2399  CCA GGT GAA TGG ACA TAG CGT GAG AGG CGG TGA GGC CAG GGC TTC CAG    2446
2447  CCT CGT GCT GTC TCG GGA CTC CTG ACC GTG GTG TGC GTG TGT GCC CAT    2494
2495  CTG TGA CTT TCT ACT CAC CAA GGT TGA AGA AAG GAA ACG GGG AAA ATC    2542
2543  AAA AGG GGT TCA AAC CCC ACC TCA GTA GGT GGA GGG GAG CGC CTG CCA    2590
2591  TTG GTT GTA TTT TTG TTC TGA GTT TTC GGT GCC GTG TTC CTA ACT ACT    2638
2639  CCA TCC CAT GAC CTC GCC ACA CCT ACT GGG GCA TCT GGC TGG CGC CTG    2686
2687  CTG CCA TGG CCA GCC CCC ACT CTC ACC CTG CAC AGG GGG TCT TGC AGC    2734
2735  CCC CAG GCC CAC AGC CTC GTT GGG AGG ACA GGG TGG CCC TGG GGA CAA    2782
2783  GAG GGA GGA GCC CAG GGG CTT ACC TCA CTG AGA GTG CTC CCC AGC AGG    2830
2831  CAT CCA CTA CCC CAG GGC CCC CCA CAT GTC ATG GCA AGG TTG GTA GTG    2878
2879  AAT GGG CCT GGT TGG GAG CAG CCC CTG GCC CAT TGC CCA CCC ACC CAT    2926
2927  CTC ACT ATG CAA TTC GAG TTC CAA GCA ACA TTT GCT CCT GCC CTG GGG    2974
2975  CCA GCT CTG CCC CAG CCC TGA GAG GGG TGG TGA AGC AGC CCC CTG GAC    3022
3023  CCC AGA ACC CCA GAC AAG GGG GCA GGC GGG GGA CCA GGG CCT CTC CTG    3070
3071  TGG GAT CTT TGT TTT GTG TTT AAC CAT AAT GGT TGT GTA CTG AAC CAC    3118
3119  TTC ATA TTT GTT ATA TAT AAT ATA TAT ATA TAT AAT CTC AAA AAA AAA    3166
3167  AAA AAA AAA AAA                                                    3178
4.PP6977
A:核苷酸序列(SEQ ID NO:10)长度:2469
   1  GGGCCGCGGC CTGTCCTCCT GCCTCAGCCT GGGGAAGGCT GGGCCGGGCC GAAGAGGGAG
  61  GCCAAGTCCT TGGGACAGGA GGAGACCCAC ACCTGAGATT AGTGGAAACC CAGCCAGAAG
 121  CTGCCATGCA GGTGTGGCTC TGGGCATCAG GATCTGTCGT GAGAGCCCCC ATGAGTGCCC
 181  AGTGCAGAAT GGCTGGCAGC CCGCCCTGAC GGGGAGCAGA GGGGCTGGAC GCGGTGCCCT
 241  TCACGGGATG ACACCCAGCT GTTTGCCCTG TGTCCAGGGG GTTGCTTCTC TGACAGAGGC
 301  CCTATGGCTC GTGTCTGACT CCTGTCCAGG TTCTGCCAGC CTGACCATCC ATCGCTCTGG
 361  CACCAAGAGC CCACCCTTTT GTTCTTCCTG GCGTCCCAGG GAAAGCCCTG CCTGGGTGGG
 421  GCAGCTCCTG GCCCTTCAGA TGGAAGACGC AGTCCAGTCA GCACCATCAT AGGAAACAAG
 481  TTCAGAAATG TCTCACTTAC TATTCCGGGC AGGGAGGGCG CCATGAGTCA GGGGGTGCAT
 541  CCTCCCTCCT GGCGTCACCC GAGGCAGGAA TGAAGAGTCA GGCAGAGAGC GCGCGTGTGG
 601  CAGCTGGTGG TGTAGATATT AGGGACTAGT GTGAATTCTA GTTCACCGGC CAATGCCTGG
 661  ATGGTCCAGA GCTGGGTCGG CTGGGCGGAG AGCTGCCTCC AGGTTCCTGC CTCTGGCCCT
 721  GGCGTGGGGT CGACACTGGG TGTGGTGTGT GTCTCATGTC CAGGCAGTGG CCTTTGCTGT
 781  GCCGTCCTGT TACAGGAGCC AGGATGGTGG GGACGGGACC GGACCGGAGG GTTGGCGGGG
 841  CTGCCCCTGC AGCCGACAGC CCCATCCTGC AGCCACCAAT GGCATGACCC AGGGCCCCGG
 901  CACTGCCTGT GTGAGGGGCT GGCAGCTTTC CAACTGCAGC AAGTGGAGGC CCCTGCCAGC
 961  TTCGGGCCTG TGGGCAGGGG CTCAGTGGGG CAGGGGTGTG GCTGCCCCGC CCGGCACGCC
1021  TGCACCTGTC TCCTCAGTGT GACCAGTACC GCAAGGGGAT CATCTCGGGC TCCGTCTGCC
1081  AGGACCTGTG TGAGCTGCAT ATGGTGGAGT GGAGGACCTG CCTCTCGGTG GCCCCGGGCC
1141  AGCAGGTGTA CAGCGGGCTC TGGCGGGACA AGGATGTAAC CATCAAGTGT GGCATTGAGG
1201  AGACCCTCGA CTCCAAGGCC CGGTCGGATG CGGCCCCCCG GCGGGAGCTG GTACTGTTTG
1261  ACAAGCCCAC CCGGGGCACC TCCATCAAGG AATTCCGGGA GATGACCCTC GGCTTCCTCA
1321  AGGCGAACCT GGGAGACCTG CCTTCCCTGC CGGCGCTGGT TGGCCAGGTC CTGCTCATGG
1381  CTGACTTCAA CAAGGACAAC CGGGTGTCCC TGGCGGAAGC CAAGTCCGTG TGGGCCCTGC
1441  TGCAGCGTAA CGAGTTCCTG CTGCTGCTGT CCCTGCAGGA GAAGGAGCAC GCCTCCAGAC
1501  TGCTGGGCTA CTGTGGGGAC CTCTACCTCA CCGAGGGCGT GCCGCATGGC GCCTGGCACG
1561  CGGCCGCCCT TCCACCCCTG TTGCGCCCAC TGCTGCCGCC TGCCCTGCAG GGTGCTCTCC
1621  AGCAGTGGCT GGGGCCTGCG TGGCCTTGGC GGGCCAAGAT CGCCATCGGC CTGCTGGAGT
1681  TCGTGGAGGA GCTCTTCCAC GGCTCTTACG GGACTTTCTA CATGTGTGAG ACCACACTGG
1741  CCAACGTGGG CTACACAGCC ACCTACGACT TCAAGATGGC CGACCTGCAG CAGGTGGCAC
1801  CCGAGGCCAC CGTGCGCCGC TTCCTGCAGG GCCGCCGCTG CGAGCACAGC ACCGACTGCA
1861  CTACGGGCGC GACTGCAGGG CCCCGTGTGA CAGGCTCATG AGGCAGTGCA AGGGCGACCT
1921  CATCCAGCCC AACCTGGCCA AGGTGTGCGC ACTGCTACGG GGCTACCTGC TGCCTTGCGC
1981  GCCCGCCGAC CTCCGCGAGG AGCTGGGCAC ACACTGCGCA CCTGTACCAC GCTGAGCGGG
2041  CTGGCCAGCC AGGTGGAGGC CCATCACTCG CTGGTGCTCA GCCACCTCAA GACTCTGCTC
2101  TGGAAGAAGA TCTCCAACAC CAAGTACTCT TGATGGGGCA GTGAGGGGCC TGGCCACCCT
2161  TCCTGGAGCT GGCCAGGTGC CAGGGTCCAA CCCTCCCTCA AGGAATCCTG TCAGAAGATG
2221  TGAAATGCAA CTGTGTTGCA AAATCACTCC CCTACCGTCA GGGCTCTGGA TTCCAGCACC
2281  ACAGACATGA GACCCCAGCT CGGAGCAAAG GCGGACATGG ACATCCCGGC AGGAGAGTCC
2341  TCCAAGGGGG TTTGTTACTC TGAAGAACGT AATGTCAATA AACAGCTTTT ATGTAAAAAA
2401  AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
2461  AAAAAAAAA
B:氨基酸序列(SEQ ID NO:11)长度:266
  1  MVEWRTCLSV APGQQVYSGL WRDKDVTIKC GIEETLDSKA RSDAAPRREL VLFDKPTRGT
 61  SIKEFREMTL GFLKANLGDL PSLPALVGQV LLMADFNKDN RVSLAEAKSV WALLQRNEFL
121  LLLSLQEKEH ASRLLGYCGD LYLTEGVPHG AWHAAALPPL LRPLLPPALQ GALQQWLGPA
181  WPWRAKIAIG LLEFVEELFH GSYGTFYMCE TTLANVGYTA TYDFKMADLQ QVAPEATVRR
241  FLQGRRCEHS TDCTTGATAG PRVTGS
C.核苷酸及氨基酸组合序列(SEQ ID NO:12)克隆号:PP6977
起始编码子:1101 ATG  终止编码子:1899 TGA  蛋白质分子量:29507.34
   1   GG GCC GCG GCC TGT CCT CCT GCC TCA GCC TGG GGA AGG CTG GGC CGG      47
  48  GCC GAA GAG GGA GGC CAA GTC CTT GGG ACA GGA GGA GAC CCA CAC CTG      95
  96  AGA TTA GTG GAA ACC CAG CCA GAA GCT GCC ATG CAG GTG TGG CTC TGG     143
 144  GCA TCA GGA TCT GTC GTG AGA GCC CCC ATG AGT GCC CAG TGC AGA ATG     191
 192  GCT GGC AGC CCG CCC TGA CGG GGA GCA GAG GGG CTG GAC GCG GTG CCC     239
 240  TTC ACG GGA TGA CAC CCA GCT GTT TGC CCT GTG TCC AGG GGG TTG CTT     287
 288  CTC TGA CAG AGG CCC TAT GGC TCG TGT CTG ACT CCT GTC CAG GTT CTG     335
 336  CCA GCC TGA CCA TCC ATC GCT CTG GCA CCA AGA GCC CAC CCT TTT GTT     383
 384  CTT CCT GGC GTC CCA GGG AAA GCC CTG CCT GGG TGG GGC AGC TCC TGG     431
 432  CCC TTC AGA TGG AAG ACG CAG TCC AGT CAG CAC CAT CAT AGG AAA CAA     479
 480  GTT CAG AAA TGT CTC ACT TAC TAT TCC GGG CAG GGA GGG CGC CAT GAG     527
 528  TCA GGG GGT GCA TCC TCC CTC CTG GCG TCA CCC GAG GCA GGA ATG AAG     575
 576  AGT CAG GCA GAG AGC GCG CGT GTG GCA GCT GGT GGT GTA GAT ATT AGG     623
 624  GAC TAG TGT GAA TTC TAG TTC ACC GGC CAA TGC CTG GAT GGT CCA GAG     671
 672  CTG GGT CGG CTG GGC GGA GAG CTG CCT CCA GGT TCC TGC CTC TGG CCC     719
 720  TGG CGT GGG GTC GAC ACT GGG TGT GGT GTG TGT CTC ATG TCC AGG CAG     767
 768  TGG CCT TTG CTG TGC CGT CCT GTT ACA GGA GCC AGG ATG GTG GGG ACG     815
 816  GGA CCG GAC CGG AGG GTT GGC GGG GCT GCC CCT GCA GCC GAC AGC CCC     863
 864  ATC CTG CAG CCA CCA ATG GCA TGA CCC AGG GCC CCG GCA CTG CCT GTG     911
 912  TGA GGG GCT GGC AGC TTT CCA ACT GCA GCA AGT GGA GGC CCC TGC CAG     959
 960  CTT CGG GCC TGT GGG CAG GGG CTC AGT GGG GCA GGG GTG TGG CTG CCC    1007
1008  CGC CCG GCA CGC CTG CAC CTG TCT CCT CAG TGT GAC CAG TAC CGC AAG    1055
1056  GGG ATC ATC TCG GGC TCC GTC TGC CAG GAC CTG TGT GAG CTG CAT ATG    1103
   1                                                              Met       1
1104  GTG GAG TGG AGG ACC TGC CTC TCG GTG GCC CCG GGC CAG CAG GTG TAC    1151
   2  Val Glu Trp Arg Thr Cys Leu Ser Val Ala Pro Gly Gln Gln Val Tyr      17
1152  AGC GGG CTC TGG CGG GAC AAG GAT GTA ACC ATC AAG TGT GGC ATT GAG    1199
  18  Ser Gly Leu Trp Arg Asp Lys Asp Val Thr Ile Lys Cys Gly Ile Glu      33
1200  GAG ACC CTC GAC TCC AAG GCC CGG TCG GAT GCG GCC CCC CGG CGG GAG    1247
  34  Glu Thr Leu Asp Ser Lys Ala Arg Ser Asp Ala Ala Pro Arg Arg Glu      49
1248  CTG GTA CTG TTT GAC AAG CCC ACC CGG GGC ACC TCC ATC AAG GAA TTC    1295
  50  Leu Val Leu Phe Asp Lys Pro Thr Arg Gly Thr Ser Ile Lys Glu Phe      65
1296  CGG GAG ATG ACC CTC GGC TTC CTC AAG GCG AAC CTG GGA GAC CTG CCT    1343
  66  Arg Glu Met Thr Leu Gly Phe Leu Lys Ala Asn Leu Gly Asp Leu Pro      81
1344  TCC CTG CCG GCG CTG GTT GGC CAG GTC CTG CTC ATG GCT GAC TTC AAC    1391
  82  Ser Leu Pro Ala Leu Val Gly Gln Val Leu Leu Met Ala Asp Phe Asn      97
1392  AAG GAC AAC CGG GTG TCC CTG GCG GAA GCC AAG TCC GTG TGG GCC CTG    1439
  98  Lys Asp Asn Arg Val Ser Leu Ala Glu Ala Lys Ser Val Trp Ala Leu     113
1440  CTG CAG CGT AAC GAG TTC CTG CTG CTG CTG TCC CTG CAG GAG AAG GAG    1487
 114  Leu Gln Arg Asn Glu Phe Leu Leu Leu Leu Ser Leu Gln Glu Lys Glu     129
1488  CAC GCC TCC AGA CTG CTG GGC TAC TGT GGG GAC CTC TAC CTC ACC GAG    1535
 130  His Ala Ser Arg Leu Leu Gly Tyr Cys Gly Asp Leu Tyr Leu Thr Glu     145
1536  GGC GTG CCG CAT GGC GCC TGG CAC GCG GCC GCC CTT CCA CCC CTG TTG    1583
 146  Gly Val Pro His Gly Ala Trp His Ala Ala Ala Leu Pro Pro Leu Leu     161
1584  CGC CCA CTG CTG CCG CCT GCC CTG CAG GGT GCT CTC CAG CAG TGG CTG    1631
 162  Arg Pro Leu Leu Pro Pro Ala Leu Gln Gly Ala Leu Gln Gln Trp Leu     177
1632  GGG CCT GCG TGG CCT TGG CGG GCC AAG ATC GCC ATC GGC CTG CTG GAG    1679
 178  Gly Pro Ala Trp Pro Trp Arg Ala Lys Ile Ala Ile Gly Leu Leu Glu     193
1680  TTC GTG GAG GAG CTC TTC CAC GGC TCT TAC GGG ACT TTC TAC ATG TGT    1727
 194  Phe Val Glu Glu Leu Phe His Gly Ser Tyr Gly Thr Phe Tyr Met Cys     209
1728  GAG ACC ACA CTG GCC AAC GTG GGC TAC ACA GCC ACC TAC GAC TTC AAG    1775
 210  Glu Thr Thr Leu Ala Asn Val Gly Tyr Thr Ala Thr Tyr Asp Phe Lys     225
1776  ATG GCC GAC CTG CAG CAG GTG GCA CCC GAG GCC ACC GTG CGC CGC TTC    1823
 226  Met Ala Asp Leu Gln Gln Val Ala Pro Glu Ala Thr Val Arg Arg Phe     241
1824  CTG CAG GGC CGC CGC TGC GAG CAC AGC ACC GAC TGC ACT ACG GGC GCG    1871
 242  Leu Gln Gly Arg Arg Cys Glu His Ser Thr Asp Cys Thr Thr Gly Ala     257
1872  ACT GCA GGG CCC CGT GTG ACA GGC TCA TGA GGC AGT GCA AGG GCG ACC    1919
 258  Thr Ala Gly Pro Arg Val Thr Gly Ser ***                             267
1920  TCA TCC AGC CCA ACC TGG CCA AGG TGT GCG CAC TGC TAC GGG GCT ACC    1967
1968  TGC TGC CTT GCG CGC CCG CCG ACC TCC GCG AGG AGC TGG GCA CAC ACT    2015
2016  GCG CAC CTG TAC CAC GCT GAG CGG GCT GGC CAG CCA GGT GGA GGC CCA    2063
2064  TCA CTC GCT GGT GCT CAG CCA CCT CAA GAC TCT GCT CTG GAA GAA GAT    2111
2112  CTC CAA CAC CAA GTA CTC TTG ATG GGG CAG TGA GGG GCC TGG CCA CCC    2159
2160  TTC CTG GAG CTG GCC AGG TGC CAG GGT CCA ACC CTC CCT CAA GGA ATC    2207
2208  CTG TCA GAA GAT GTG AAA TGC AAC TGT GTT GCA AAA TCA CTC CCC TAC    2255
2256  CGT CAG GGC TCT GGA TTC CAG CAC CAC AGA CAT GAG ACC CCA GCT CGG    2303
2304  AGC AAA GGC GGA CAT GGA CAT CCC GGC AGG AGA GTC CTC CAA GGG GGT    2351
2352  TTG TTA CTC TGA AGA ACG TAA TGT CAA TAA ACA GCT TTT ATG TAA AAA    2399
2400  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    2447
2448  AAA AAA AAA AAA AAA AAA AAA A                                      2469
5.PP8482
A:核苷酸序列(SEQ ID NO:13)长度:939
  1  GGGCTTCCTG GGGAGGGTGT GGCAGGGTGG TGGGCATCCC CTCCCTCACC AAAGCATGGG
 61  CTCTTTGTTT CCTCTTTGCC AGGCCTGGGT CCTTCCCAGT GACCCCTCAG CCTTCACTTC
121  CTCCTCACTC CCGGGGAGCT GTGACAGGTG TTTGGGGGAG GGGAGGGGGG TATGATAAGC
181  TGGGACAGCT GCACCCACCG GTGCTCTGGT GAGATGGGGG GCCCGGATGT TGGGGAGACA
241  CATCTGCTGG GTTCCCAGCC CAAGGTCCCC AACCCTGGCT GTCTGGCCTT GTCTGTCACC
301  CCCCGTGCCC ACTGGCAGGG ACAGGAAGCT CCCCCCCCAC CCCGCTTTGG GCAGTTTGCC
361  TTGGCACGGG CCTGATGTGT TTTCCTCCCC AGAGCAGCTG CTGTTCTGTC TGCTGGGCAG
421  AGGGCTGGGT TCCTCCGAGG TAGGCAGGGG CCTCAACCCA GAGCCCCTCT CACACCCTCT
481  TTCAACTCAG GCTTATGTCT CTCCCTCCTC CCCCACCCCC ACCCCAGGAA GAGGAGATCC
541  CAGAACTGGA GATTGACGTG GATGAGCTCC TGGACATGGA GAGTGACGAT GCCCGGGCTG
601  CCAGGGTCAA GGAGCTGCTG GTTGACTGTT ACAAACCCAC AGAGGCCTTC ATTTCTGGCC
661  TGCTGGACAA GATCCGGGGC ATGCAGAAGC TGAGCACACC CCAGAAGAAG TGAGGGTCCC
721  CGACCCAGGA GAACGGTGGC TCCCACAGGA CAATCGCTGC CCCCCAACCT CGTAGCAACA
781  GCAATACCGG GGGACCCTGC GGCCAGGCCT GGTGCCATGA GCAGGGCTCC TCGTGCCCCT
841  GGCCCAGGGG TCTCTTCCCC TGCCCCCTCA GTTTTCCACT TTTGGGGTTT TTTATTGTTA
901  TTAAACTGAT GGGACTTTAA AAAAAAAAAA AAAAAAAAA
B:氨基酸序列(SEQ ID NO:14)长度:109
 1  MLGRHICWVP SPRSPTLAVW PCLSPPVPTG RDRKLPPHPA LGSLPWHGPD LFSSPEQLLF
61  CLLGRGLGSS EVGRGLNPEP LSHPLSTQAY VSPSSPTPTP GRGDPRTGD
C.核苷酸及氨基酸组合序列(SEQ ID NO:15)克隆号:PP8482
起始编码子:227 ATG  终止编码子:554 TGA  蛋白质分子量:11600.60
  1    G GGC TTC CTG GGG AGG GTG TGG CAG GGT GGT GGG CAT CCC CTC CCT     46
 47  CAC CAA AGC ATG GGC TCT TTG TTT CCT CTT TGC CAG GCC TGG GTC CTT     94
 95  CCC AGT GAC CCC TCA GCC TTC ACT TCC TCC TCA CTC CCG GGG AGC TGT    142
143  GAC AGG TGT TTG GGG GAG GGG AGG GGG GTA TGA TAA GCT GGG ACA GCT    190
191  GCA CCC ACC GGT GCT CTG GTG AGA TGG GGG GCC CGG ATG TTG GGG AGA    238
  1                                                  Met Leu Gly Arg      4
239  CAC ATC TGC TGG GTT CCC AGC CCA AGG TCC CCA ACC CTG GCT GTC TGG    286
  5  His Ile Cys Trp Val Pro Ser Pro Arg Ser Pro Thr Leu Ala Val Trp     20
287  CCT TGT CTG TCA CCC CCC GTG CCC ACT GGC AGG GAC AGG AAG CTC CCC    334
 21  Pro Cys Leu Ser Pro Pro Val Pro Thr Gly Arg Asp Arg Lys Leu Pro     36
335  CCC CAC CCC GCT TTG GGC AGT TTG CCT TGG CAC GGG CCT GAT CTG TTT    382
 37  Pro His Pro Ala Leu Gly Ser Leu Pro Trp His Gly Pro Asp Leu Phe     52
383  TCC TCC CCA GAG CAG CTG CTG TTC TGT CTG CTG GGC AGA GGG CTG GGT    430
 53  Ser Ser Pro Glu Gln Leu Leu Phe Cys Leu Leu Gly Arg Gly Leu Gly     68
431  TCC TCC GAG GTA GGC AGG GGC CTC AAC CCA GAG CCC CTC TCA CAC CCT    478
 69  Ser Ser Glu Val Gly Arg Gly Leu Asn Pro Glu Pro Leu Ser His Pro     84
479  CTT TCA ACT CAG GCT TAT GTC TCT CCC TCC TCC CCC ACC CCC ACC CCA    526
 85  Leu Ser Thr Gln Ala Tyr Val Ser Pro Ser Ser Pro Thr Pro Thr Pro    100
527  GGA AGA GGA GAT CCC AGA ACT GGA GAT TGA CGT GGA TGA GCT CCT GGA    574
101  Gly Arg Gly Asp Pro Arg Thr Gly Asp ***                            110
575  CAT GGA GAG TGA CGA TGC CCG GGC TGC CAG GGT CAA GGA GCT GCT GGT    622
623  TGA CTG TTA CAA ACC CAC AGA GGC CTT CAT TTC TGG CCT GCT GGA CAA    670
671  GAT CCG GGG CAT GCA GAA GCT GAG CAC ACC CCA GAA GAA GTG AGG GTC    718
719  CCC GAC CCA GGA GAA CGG TGG CTC CCA CAG GAC AAT CGC TGC CCC CCA    766
767  ACC TCG TAG CAA CAG CAA TAC CGG GGG ACC CTG CGG CCA GGC CTG GTG    814
815  CCA TGA GCA GGG CTC CTC GTG CCC CTG GCC CAG GGG TCT CTT CCC CTG    862
863  CCC CCT CAG TTT TCC ACT TTT GGG GTT TTT TAT TGT TAT TAA ACT GAT    910
911  GGG ACT TTA AAA AAA AAA AAA AAA AAA AA                             939
6.PP8607
A:核苷酸序列(SEQ ID NO:16)长度:2316
   1  GCCGCTGCCC GCCGGAAGCC TGCCCCCGTA CCCTCCCTAC TTCGAAGGCG CCCCCTTCCC
  61  TCACCCGCTG TGGCTCCGGG ACACGTACAA GCTGTGGGTG CCCCAGCCGC CGCCCAGGAC
 121  CATCAAGCGC ACGCGGCGGC GTCTGTCCCG CAACCGCGAC CCGGGGCGCC TCATCCTCAG
 181  CACCATCCGC CTGCGGCCGC GCCAGGTCCT CTGTGAGAAG TGCAAGAGCA CGCTGAGCCC
 241  CCCGGAGGCC AGCCCCGGAC CCCCAGCCGC GCCCAGGGCC CGCAGGAGGC TGGGCAGCGG
 301  CCCGGACAGG GAGCTCCGCA AGCCGGAGGA GCCGGAGAAC GGCGAGCCCA CGGCTGCGGC
 361  CACCGCCAGG AGGAGCAAGA GGGAGAGGCG CGAGGAGGAC AGGGCCCCGG CAGAGCAGGT
 421  CCCGCGGAGC CCGGTCATCA AGATCTCCTA CAGCACGCCC CAGGGCAAGG GAGAGGTGGT
 481  CAAGATCCCC TCCCGCGTGC ACGGCTCTCT GGAGCCCTTC CGTCCCCAGC AGGCCCCGCA
 541  GGACGACGGC AGCCAGGACC CCGAGGTGCT GGACAGAGAG TCCCGGGACC GGCCGTCCTG
 601  CGCGCCCTCG GCCTCCATCC CCAAGTTGAA ACTGACACGG CCTGTGCCGG CCGGCGCGGA
 661  CCTGCCGCCC CCTAAGATCC GCCTGAAGCC CCACCGTCTG GGGGACAGCG AGCACGAGCC
 721  CGTGTACCGG GCCGAGCTGG TGGGGGAGCT GAACGGGTAC CTGCGGGACA GCTCGCCGGC
 781  GCCCTGTGCG GACGGCCCTG CCGGTGGGCT GGCGGACTTG TCTTCTGGAA GTTCGGGTGA
 841  GGACGATGAC TTCAAGAGCT GTCCCCAGGG TCCACAGGGA CGCGAGGGCT TGGCTTTTCT
 901  CGTCAGCTGC CCTGAGGGGA GAGCGGACTG TGCCAGTGAG TCGGCGTGCA GCAGCGACAG
 961  CCTGGACGAG GCCAGATCGT CCGGCTCGGA AGGGACGCCG GCAGACACGG GTGACCTCTC
1021  GCCTGGCCAC GGCGCGTCAG CGCCCTCGGT GTCCAGAGAG GCTCGCCAAA CGGTGCCGCC
1081  CCTGACGGTC AGGCTGCACA CACAGAGCGT GTCGGAGTGC ATCACGGAGG ACGGCAGGAC
1141  TGTGGCCGTG GGGGACATCG TCTGGGGTAA GATCCATGGT TTTCCTTGGT GGCCGGCGCG
1201  TGTTCTTGAC ATCAGTCTCG GCCAGAAGGA GGACGGAGAG CCGTCTTGGC GAGAAGCGAA
1261  GGTCTCGTGG TTTGGTTCTC CGACTACGTC GTTCTTGTCT ATTTCAAAAC TCTCCCCTTT
1321  CTCTGAATTT TTCAAACTGA GATTTAATCG TAAGAAGAAG GGGATGTATC GGAAAGCTAT
1381  AACCGAGGCT GCAAATGCCG CAAGACACGT GGCCCCGGAA ATCAGGGAGC TCTTAACCCA
1441  GTTTGAAACG TAACTGGTTC CCTGACCAGG TCACCGACGA TGAGGGCGCA CCTGCTGTCC
1501  TGGAGCTTCC GATCTCTGTT CGGGGACCCT GTGAGCCTTC TGGCCGGCTG CGTGCAGAGC
1561  CCACTGGGCA CGGTGGTCGG CCTGGTGTGA GGCCCCCCGG GGACCGGCAG TGTGTCCAGG
1621  GAGGGGATGG CCCTGAGCCC AGCGGCTCCT CCCGCTGAGT GTATTTCTTC CCACCACTCA
1681  GCGCATGGCT GCCCTGGCTC ACGAGGCAGT CGGGACTCGT GACTTGCTGG CTGCTGGCTG
1741  CTGCTGCCTC GCGCGCTGGG GTTCCATGGA GGAACTGGGC CTGCCGCCCC GGCCTCACCT
1801  GCTGCCCGCA TGCTGGGGTC CCATGGAGGA ACCAGGCCTG GCGCCCCGGC CTCGCCCAGC
1861  GGCTGGTGTG GGCAGCTGTT CCCTGCCTCG CAGTGTCCTG GAGGCAGCTG TCTCGCAGAC
1921  TCAGCTTGGT CTCCCGCAGG CTTCAGAAAA ACCCAATTGC ACGTGTGGGA TTCTTCCCCA
1981  GCCCTTGGGT GCGGGGTCTC TGTGCACTTG AGAGCTGGGG GACCCACCCA CCGTCTCCCA
2041  CTCCAAGTTC ATCCCAGAGC GTGGGGCCCG CTGGGCACCT GGCACCTGGC CTGCAGATGC
2101  TGCTACGAGT GACCAGTGCT GTGTGGAGGA GGCCAAGGGC GGCCCCTGGG AAACCGGGCT
2161  TCAACAAGTA CAAGGAAAAG AAACTTGCTC TGTTTTGTAA GAAGCGTGTT CCTTTTCCTC
2221  TTTTTTGTCA CTTTAAAGAC CCAAAAGAAT AAAGAAAGAA AAGAAAAAAT TTTAAAAAAA
2281  AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAA
B:氨基酸序列(SEQ ID NO:17)长度:108
 1  MAALAHEAVG TRDLLAAGCC CLARWGSMEE LGLPPRPHLL PACWGPMEEP GLAPRPRPAA
61  GVGSCSLPRS VLEAAVSQTQ LGLPQASEKP NCTCGILPQP LGAGSLCT
C.核苷酸及氨基酸组合序列(SEQ ID NO:18)克隆号:PP8607
起始编码子:1685 ATG  终止编码子:2009 TGA  蛋白质分子量:11038.26
   1    G CCG CTG CCC GCC GGA AGC CTG CCC CCG TAC CCT CCC TAC TTC GAA      46
  47  GGC GCC CCC TTC CCT CAC CCG CTG TGG CTC CGG GAC ACG TAC AAG CTG      94
  95  TGG GTG CCC CAG CCG CCG CCC AGG ACC ATC AAG CGC ACG CGG CGG CGT     142
 143  CTG TCC CGC AAC CGC GAC CCG GGG CGC CTC ATC CTC AGC ACC ATC CGC     190
 191  CTG CGG CCG CGC CAG GTC CTC TGT GAG AAG TGC AAG AGC ACG CTG AGC     238
 239  CCC CCG GAG GCC AGC CCC GGA CCC CCA GCC GCG CCC AGG GCC CGC AGG     286
 287  AGG CTG GGC AGC GGC CCG GAC AGG GAG CTC CGC AAG CCG GAG GAG CCG     334
 335  GAG AAC GGC GAG CCC ACG GCT GCG GCC ACC GCC AGG AGG AGC AAG AGG     382
 383  GAG AGG CGC GAG GAG GAC AGG GCC CCG GCA GAG CAG GTC CCG CGG AGC     430
 431  CCG GTC ATC AAG ATC TCC TAC AGC ACG CCC CAG GGC AAG GGA GAG GTG     478
 479  GTC AAG ATC CCC TCC CGC GTG CAC GGC TCT CTG GAG CCC TTC CGT CCC     526
 527  CAG CAG GCC CCG CAG GAC GAC GGC AGC CAG GAC CCC GAG GTG CTG GAC     574
 575  AGA GAG TCC CGG GAC CGG CCG TCC TGC GCG CCC TCG GCC TCC ATC CCC     622
 623  AAG TTG AAA CTG ACA CGG CCT GTG CCG GCC GGC GCG GAC CTG CCG CCC     670
 671  CCT AAG ATC CGC CTG AAG CCC CAC CGT CTG GGG GAC AGC GAG CAC GAG     718
 719  CCC GTG TAC CGG GCC GAG CTG GTG GGG GAG CTG AAC GGG TAC CTG CGG     766
 767  GAC AGC TCG CCG GCG CCC TGT GCG GAC GGC CCT GCC GGT GGG CTG GCG     814
 815  GAC TTG TCT TCT GGA AGT TCG GGT GAG GAC GAT GAC TTC AAG AGC TGT     862
 863  CCC CAG GGT CCA CAG GGA CGC GAG GGC TTG GCT TTT CTC GTC AGC TGC     910
 911  CCT GAG GGG AGA GCG GAC TGT GCC AGT GAG TCG GCG TGC AGC AGC GAC     958
 959  AGC CTG GAC GAG GCC AGA TCG TCC GGC TCG GAA GGG ACG CCG GCA GAC    1006
1007  ACG GGT GAC CTC TCG CCT GGC CAC GGC GCG TCA GCG CCC TCG GTG TCC    1054
1055  AGA GAG GCT CGC CAA ACG GTG CCG CCC CTG ACG GTC AGG CTG CAC ACA    1102
1103  CAG AGC GTG TCG GAG TGC ATC AC6 GAG GAC GGC AGG ACT GTG GCC GTG    1150
1151  GGG GAC ATC GTC TGG GGT AAG ATC CAT GGT TTT CCT TGG TGG CCG GCG    1198
1199  CGT GTT CTT GAC ATC AGT CTC GGC CAG AAG GAG GAC GGA GAG CCG TCT    1246
1247  TGG CGA GAA GCG AAG GTC TCG TGG TTT GGT TCT CCG ACT ACG TCG TTC    1294
1295  TTG TCT ATT TCA AAA CTC TCC CCT TTC TCT GAA TTT TTC AAA CTG AGA    1342
1343  TTT AAT CGT AAG AAG AAG GGG ATG TAT CGG AAA GCT ATA ACC GAG GCT    1390
1391  GCA AAT GCC GCA AGA CAC GTG GCC CCG GAA ATC AGG GAG CTC TTA ACC    1438
1439  CAG TTT GAA ACG TAA CTG GTT CCC TGA CCA GGT CAC CGA CGA TGA GGG    1486
1487  CGC ACC TGC TGT CCT GGA GCT TCC GAT CTC TGT TCG GGG ACC CTG TGA    1534
1535  GCC TTC TGG CCG GCT GCG TGC AGA GCC CAC TGG GCA CGG TGG TCG GCC    1582
1583  TGG TGT GAG GCC CCC CGG GGA CCG GCA GTG TGT CCA GGG AGG GGA TGG    1630
1631  CCC TGA GCC CAG CGG CTC CTC CCG CTG AGT GTA TTT CTT CCC ACC ACT    1678
1679  CAG CGC ATG GCT GCC CTG GCT CAC GAG GCA GTC GGG ACT CGT GAC TTG    1726
   1          Met Ala Ala Leu Ala His Glu Ala Val Gly Thr Arg Asp Leu      14
1727  CTG GCT GCT GGC TGC TGC TGC CTC GCG CGC TGG GGT TCC ATG GAG GAA    1774
  15  Leu Ala Ala Gly Cys Cys Cys Leu Ala Arg Trp Gly Ser Met Glu Glu      30
1775  CTG GGC CTG CCG CCC CGG CCT CAC CTG CTG CCC GCA TGC TGG GGT CCC    1822
  31  Leu Gly Leu Pro Pro Arg Pro His Leu Leu Pro Ala Cys Trp Gly Pro      46
1823  ATG GAG GAA CCA GGC CTG GCG CCC CGG CCT CGC CCA GCG GCT GGT GTG    1870
  47  Met Glu Glu Pro Gly Leu Ala Pro Arg Pro Arg Pro Ala Ala Gly Val      62
1871  GGC AGC TGT TCC CTG CCT CGC AGT GTC CTG GAG GCA GCT GTC TCG CAG    1918
  63  Gly Ser Cys Ser Leu Pro Arg Ser Val Leu Glu Ala Ala Val Ser Gln      78
1919  ACT CAG CTT GGT CTC CCG CAG GCT TCA GAA AAA CCC AAT TGC ACG TGT    1966
  79  Thr Gln Leu Gly Leu Pro Gln Ala Ser Glu Lys Pro Asn Cys Thr Cys      94
1967  GGG ATT CTT CCC CAG CCC TTG GGT GCG GGG TCT CTG TGC ACT TGA GAG    2014
  95  Gly Ile Leu Pro Gln Pro Leu Gly Ala Gly Ser Leu Cys Thr ***         109
2015  CTG GGG GAC CCA CCC ACC GTC TCC CAC TCC AAG TTC ATC CCA GAG CGT    2062
2063  GGG GCC CGC TGG GCA CCT GGC ACC TGG CCT GCA GAT GCT GCT ACG AGT    2110
2111  GAC CAG TGC TGT GTG GAG GAG GCC AAG GGC GGC CCC TGG GAA ACC GGG    2158
2159  CTT CAA CAA GTA CAA GGA AAA GAA ACT TGC TCT GTT TTG TAA GAA GCG    2206
2207  TGT TCC TTT TCC TCT TTT TTG TCA CTT TAA AGA CCC AAA AGA ATA AAG    2254
2255  AAA GAA AAG AAA AAA TTT TAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    2302
2303  AAA AAA AAA AAA AA                                                 2316
7.PP8857
A:核苷酸序列(SEQ ID NO:19)长度:2423
   1  GCAGCCGCGG AACTCCGGGC CCTGAGAGGG GGCGGGGGTG CAGGGGTCCC AGGGCCGGGC
  61  CGGGGTCTTT CCTGGCCCGG GGGAAACCGG CCCAGGCCTC CCGGGGGGGG CAATCGCCCA
 121  ACAAAGGATT CTTGGGGCGC CCGCCCTCGA GGACTTCCCT GCCCCTGGAT CCGGCCCCCC
 181  CAGCGCTCCG GGCCCGGCAT CCCGGGGCTC TCCATCGCGG GGTACCCCAG TTCGCGGTCT
 241  GCCATCGGGC AGCCCGGGCG CTACTCACCT CCGCCCGCGT CCGTGTTCCA GGTCCGGCCC
 301  GGAGCGGCCA TGTCCCACGG CCCCAAGCAG CCCGGCGCGG CCGCCGCGCC GGCGGGCGGC
 361  AAGGCTCCGG GCCAGCATGG GGGCTTCGTG GTGACTGTCA AGCAAGAGCG CGGCGAGGGT
 421  CCACGCGCGG GCGAGAAGGG GTCCCACGAG GAGGAGGTGA GAGTCCCTGC GCTGAGCTGG
 481  GGGAGGCCCC GGGCTCCCGC CCCAGCCTCG AAGCCCCGCC CCAGGCTGGA TTTGAATTGC
 541  TTGTGGCTCC GCCCACAGCC CATTTTCCTC TGGAAGCTGA GACCCCGCCC CGTGCCAGCT
 601  GCCACGCCCC TGACAGGTCC TCTGCCACTC TAAGTCCAGG CCCCGCCCAC CGCACAATGC
 661  CAGCTCTGCC CACTCTAAGG TCCCGCCCAC TTCCACTCCT TGGGGGCGGC ACCCTCCCCT
 721  TGGTCCTGTG GGCCCGTTCT CCAGCAGAAA ACCACGCCCA CCAAGCAGAG GCCACGCCCA
 781  CAACCGAAGT CAACGCCAAC CCTGTACTCA AACCTCGGCC CATAGTTCCT CAGATCCCCT
 841  CACCCCTGGC CAGGGATCCC TCTAACCCAC CGTGTCCCGA CTGCTGACCG GGCCCTACCT
 901  CCATCTTTTC CGGGTTCTTC CTCCCAGCTA GGCCCCGCCC CCATCCCCGC CCATACGCGT
 961  TAGGCCCCGC CCATGCCCCT CTGAGCCCTG CCCCAGTACG CCAGGCCCCC CTCCCAACGA
1021  CGCAGCCCGG TTCTGCAGCC GGTGAAGAAA CGCGGCTGGC CCAAGGGCAA GAAGCGGAAG
1081  AAGATTCTGC CGAATGGGCC CAAGGCACCG GTCACGGGCT ACGTGCGCTT CCTGAACGAG
1141  CGGCGCGAGC AGATCCGCAC GCGCCACCCG GATCTGCCCT TTCCCGAGAT CACCAAGATG
1201  CTGGGCCCCG AGTGGAGCAA GCTGCAGCCA ACGGAAAAGC AGCGGTACCT GGATGAGGCC
1261  GAGAGAGAGA AGCAGCAGTA CATGAAGGAG CTGCGGGCGT ACCAGCAGTC TGAAGCCTAT
1321  AAGATGTGCA CGGAGAAGAT CCAGGAGAAG AAGATCAAGA AAGAAGACTG AGCTCTGGGC
1381  TCATGAACAC TCTCCTGAAT GGACACAAGG GTGGGGACTG CGATGGCTTC TCCACCTTCG
1441  ATGTTCCCAT CTTCACTGAA GAGTTCTTGG ACCAAAACAA AGCGCGTGAG GCGGAGCTTC
1501  GGCGCTTGCG GAAGATGAAT GTGGCCTTCG AGGAGCAGAA CGCGGTACTG CAGAGGCACA
1561  CGCAGAGCAT GAGCAGCGCG CGCGAGCGTC TGGAGCAGGA GCTGGCGCTG GAGGAGCGGA
1621  GGACGCTGGC GCTGCAGCAG CAGCTCCAGG CCGTGCGCCA GGCGCTCACC GCCAGCTTCG
1681  CCTCACTGCC GGTGCCGGGC ACGGGCGAAA CGCCCACGCT GGGCACTCTG GACTTCTACA
1741  TGGCCCGGCT TCACGGAGCC ATCGAGCGCG ACCCCGCCCA GCACGAGAAG CTCATCGTCC
1801  GCATCAAGGA AATCCTGGCC CAGGTCGCCA GCGAGCACCT GTGAGGAGTG GGCGGGCCCA
1861  CGATGCAGAG GAGAAGCTGT GGGCGCGGCC CTGCCACACC CCACCCCGTG GACGAGAGGC
1921  TGGGGGTCCA CCCTTTGGGG CCTGGTCCCA TCCTGCACCT TGGGGGCTCC AGCCCCCCTA
1981  AAATTAAATT TCTGCAGCAT CCCTTTAGCT TTCAATCTCC CCAGCCCCCT GAACCCGGAA
2041  AAAGCACTCG CTGCGCGATA CACCCAGAAG AACCTCACAG CCGAGGGTGC CCCTCCTCGG
2101  AGGACAGCCA CGCGCTACAC TGGCTCTCCG GGCCACCCCC AGGACACAGG GCAGACGAAA
2161  CCCACCCCCA GCACACGGCA GGACCCCCCA AATTACTCAC TACGGGGGGC TGTGCCATAG
2221  GCCACACAGG AAGCTGCCTT GTGGGGACTT ACCTGGGGTG TCCCCCGCAT GCCTGTACCC
2281  CAGATGGGTG GGGGCCGGCT TTGCCCATCC TGCTCTCCTC CAGCCGAGGG ACCCTGGTGG
2341  GGGTGGCTCC TTCTCACTGC TGGATCCGGA CTTTTTAAAT AAAAACAAGT AAAATTTGTG
2401  TTTTAAAAAA AAAAAAAAAA AAA
B:氨基酸序列(SEQ ID NO:20)长度:171
  1  MQRRSCGRGP ATPHPVDERL GVHPLGPGPI LHLGGSSPPK IKFLQHPFSF QSPQPPEPGK
 61  STRCAIHPEE PHSRGCPSSE DSHALHWLSG PPPGHRADET HPQHTAGPPK LLTTGGCAIG
121  HTGSCLVGTY LGCPPHACTP DGWGPALPIL LSSSRGTLVG VAPSHCWIRT F
C.核苷酸及氨基酸组合序列(SEQ ID NO:21)克隆号:PP8857
起始编码子:1863 ATG  终止编码子:2376 TAA  蛋白质分子量:17989.50
   1   GC AGC CGC GGA ACT CCG GGC CCT GAG AGG GGG CGG GGG TGC AGG GGT      47
  48  CCC AGG GCC GGG CCG GGG TCT TTC CTG GCC CGG GGG AAA CCG GCC CAG      95
  96  GCC TCC CGG GGG GGG CAA TCG CCC AAC AAA GGA TTC TTG GGG CGC CCG     143
 144  CCC TCG AGG ACT TCC CTG CCC CTG GAT CCG GCC CCC CCA GCG CTC CGG     191
 192  GCC CGG CAT CCC GGG GCT CTC CAT CGC GGG GTA CCC CAG TTC GCG GTC     239
 240  TGC CAT CGG GCA GCC CGG GCG CTA CTC ACC TCC GCC CGC GTC CGT GTT     287
 288  CCA GGT CCG GCC CGG AGC GGC CAT GTC CCA CGG CCC CAA GCA GCC CGG     335
 336  CGC GGC CGC CGC GCC GGC GGG CGG CAA GGC TCC GGG CCA GCA TGG GGG     383
 384  CTT CGT GGT GAC TGT CAA GCA AGA GCG CGG CGA GGG TCC ACG CGC GGG     431
 432  CGA GAA GGG GTC CCA CGA GGA GGA GGT GAG AGT CCC TGC GCT GAG CTG     479
 480  GGG GAG GCC CCG GGC TCC CGC CCC AGC CTC GAA GCC CCG CCC CAG GCT     527
 528  GGA TTT GAA TTG CTT GTG GCT CCG CCC ACA GCC CAT TTT CCT CTG GAA     575
 576  GCT GAG ACC CCG CCC CGT GCC AGC TGC CAC GCC CCT GAC AGG TCC TCT     623
 624  GCC ACT CTA AGT CCA GGC CCC GCC CAC CGC ACA ATG CCA GCT CTG CCC     671
 672  ACT CTA AGG TCC CGC CCA CTT CCA CTC CTT GGG GGC GGC ACC CTC CCC     719
 720  TTG GTC CTG TGG GCC CGT TCT CCA GCA GAA AAC CAC GCC CAC CAA GCA     767
 768  GAG GCC ACG CCC ACA ACC GAA GTC AAC GCC AAC CCT GTA CTC AAA CCT     815
 816  CGG CCC ATA GTT CCT CAG ATC CCC TCA CCC CTG GCC AGG GAT CCC TCT     863
 864  AAC CCA CCG TGT CCC GAC TGC TGA CCG GGC CCT ACC TCC ATC TTT TCC     911
 912  GGG TTC TTC CTC CCA GCT AGG CCC CGC CCC CAT CCC CGC CCA TAC GCG     959
 960  TTA GGC CCC GCC CAT GCC CCT CTG AGC CCT GCC CCA GTA CGC CAG GCC    1007
1008  CCC CTC CCA ACG ACG CAG CCC GGT TCT GCA GCC GGT GAA GAA ACG CGG    1055
1056  CTG GCC CAA GGG CAA GAA GCG GAA GAA GAT TCT GCC GAA TGG GCC CAA    1103
1104  GGC ACC GGT CAC GGG CTA CGT GCG CTT CCT GAA CGA GCG GCG CGA GCA    1151
1152  GAT CCG CAC GCG CCA CCC GGA TCT GCC CTT TCC CGA GAT CAC CAA GAT    1199
1200  GCT GGG CCC CGA GTG GAG CAA GCT GCA GCC AAC GGA AAA GCA GCG GTA    1247
1248  CCT GGA TGA GGC CGA GAG AGA GAA GCA GCA GTA CAT GAA GGA GCT GCG    1295
1296  GGC GTA CCA GCA GTC TGA AGC CTA TAA GAT GTG CAC GGA GAA GAT CCA    1343
1344  GGA GAA GAA GAT CAA GAA AGA AGA CTG AGC TCT GGG CTC ATG AAC ACT    1391
1392  CTC CTG AAT GGA CAC AAG GGT GGG GAC TGC GAT GGC TTC TCC ACC TTC    1439
1440  GAT GTT CCC ATC TTC ACT GAA GAG TTC TTG GAC CAA AAC AAA GCG CGT    1487
1488  GAG GCG GAG CTT CGG CGC TTG CGG AAG ATG AAT GTG GCC TTC GAG GAG    1535
1536  CAG AAC GCG GTA CTG CAG AGG CAC ACG CAG AGC ATG AGC AGC GCG CGC    1583
1584  GAG CGT CTG GAG CAG GAG CTG GCG CTG GAG GAG CGG AGG ACG CTG GCG    1631
1632  CTG CAG CAG CAG CTC CAG GCC GTG CGC CAG GCG CTC ACC GCC AGC TTC    1679
1680  GCC TCA CTG CCG GTG CCG GGC ACG GGC GAA ACG CCC ACG CTG GGC ACT    1727
1728  CTG GAC TTC TAC ATG GCC CGG CTT CAC GGA GCC ATC GAG CGC GAC CCC    1775
1776  GCC CAG CAC GAG AAG CTC ATC GTC CGC ATC AAG GAA ATC CTG GCC CAG    1823
1824  GTC GCC AGC GAG CAC CTG TGA GGA GTG GGC GGG CCC ACG ATG CAG AGG    1871
   1                                                      Met Gln Arg       3
1872  AGA AGC TGT GGG CGC GGC CCT GCC ACA CCC CAC CCC GTG GAC GAG AGG    1919
   4  Arg Ser Cys Gly Arg Gly Pro Ala Thr Pro His Pro Val Asp Glu Arg      19
1920  CTG GGG GTC CAC CCT TTG GGG CCT GGT CCC ATC CTG CAC CTT GGG GGC    1967
  20  Leu Gly Val His Pro Leu Gly Pro Gly Pro Ile Leu His Leu Gly Gly      35
1968  TCC AGC CCC CCT AAA ATT AAA TTT CTG CAG CAT CCC TTT AGC TTT CAA    2015
  36  Ser Ser Pro Pro Lys Ile Lys Phe Leu Gln His Pro Phe Ser Phe Gln      51
2016  TCT CCC CAG CCC CCT GAA CCC GGA AAA AGC ACT CGC TGC GCG ATA CAC    2063
  52  Ser Pro Gln Pro Pro Glu Pro Gly Lys Ser Thr Arg Cys Ala Ile His      67
2064  CCA GAA GAA CCT CAC AGC CGA GGG TGC CCC TCC TCG GAG GAC AGC CAC    2111
  68  Pro Glu Glu Pro His Ser Arg Gly Cys Pro Ser Ser Glu Asp Ser His      83
2112  GCG CTA CAC TGG CTC TCC GGG CCA CCC CCA GGA CAC AGG GCA GAC GAA    2159
  84  Ala Leu His Trp Leu Ser Gly Pro Pro Pro Gly His Arg Ala Asp Glu      99
2160  ACC CAC CCC CAG CAC ACG GCA GGA CCC CCC AAA TTA CTC ACT ACG GGG    2207
 100  Thr His Pro Gln His Thr Ala Gly Pro Pro Lys Leu Leu Thr Thr Gly     115
2208  GGC TGT GCC ATA GGC CAC ACA GGA AGC TGC CTT GTG GGG ACT TAC CTG    2255
 116  Gly Cys Ala Ile Gly His Thr Gly Ser Cys Leu Val Gly Thr Tyr Leu     131
2256  GGG TGT CCC CCG CAT GCC TGT ACC CCA GAT GGG TGG GGG CCG GCT TTG    2303
 132  Gly Cys Pro Pro His Ala Cys Thr Pro Asp Gly Trp Gly Pro Ala Leu     147
2304  CCC ATC CTG CTC TCC TCC AGC CGA GGG ACC CTG GTG GGG GTG GCT CCT    2351
 148  Pro Ile Leu Leu Ser Ser Ser Arg Gly Thr Leu Val Gly Val Ala Pro     163
2352  TCT CAC TGC TGG ATC CGG ACT TTT TAA ATA AAA ACA AGT AAA ATT TGT    2399
 164  Ser His Cys Trp Ile Arg Thr Phe ***                                 172
2400  GTT TTA AAA AAA AAA AAA AAA AAA                                    2423
8.PP8875
A:核苷酸序列(SEQ ID NO:22)长度:4109
   1  GTTCCCGCAG GGGTGCTGGG CCCCTGCGGC TCCCACCACA TTGCGCTGGA CTCTTGTGGC
  61  CCGTGCTGAC CTGGTGTTCC AGATGCTGTC TCTGCAGAGC TCTGCGTGGT CTCTGGTGTT
 121  AGAGAGGTGG CCACCCACCG CCCTATCATT GTCCTCATCC CCACTGTGAG GAGAAGCTAT
 181  CAGATCTGCC TGTGGCCCCC AGGTGGCTCA GGAAGGGCCG TCCTGACCCC CATCCTGGCC
 241  CCTTTCGGAG CTGCAGAGAT TTCCTGTGCC TCCAGCTCTG GCTTCCTGGG TCTGTCCTTG
 301  GCGTGGAGCG GGCACAGGCT TCCCGTAGAC ACGGTTGCCC AGAGTGGGGT TCATAACTGG
 361  GCACTGTAAA GGGTGTGGTC TCCACGGCTT AGGATGGGCC CCCCCTTCCT GGTGGCCTGC
 421  TGTGCCCGGG GCTGGTGTGG AGGCCTGTGG GGGTGCAGAG GCCGCCCGGC CCTGGGCTTC
 481  CTCTGGGGTT ACATGTGTAC CCTTGCACCC ACCTGTTAGC ACCCACCGGG AGAGTCTCAC
 541  TCAGCCTAAA CCAGGGCCCC TCAGGAGGAA AAGGTCCCCA GCTTCATGAT GGGGCCCAGT
 601  GTGCCTTCCA TCCCCGCCCT GACTCAGTGC CCACTGTGCG AGGTGTGAGC ACTGTCCACA
 661  GCAGCCAGGG CGGCCGGTGG GGAGTGCATT GGAGGGGGTT GAGGTCTCTT GGGCACCTGG
 721  TGAGTTCTCA AGGGTGAGAG GAAGCCGAGG CCATCAGGCT TAGCTGACGC TGCATGGGGC
 781  AGGCTGCCAA GAGGGAGGCT GAATGGAGCA GCCTCAGGTG AGCCGACAAT CCTCACCTCC
 841  GCCTGGTCAG CCAGGACCCG GCTCCCCTCC AGTCCCGCCT GCTTTCCCCA AAGCAGATCC
 901  AGCCAGTCTC AATGGCTCGC CCGGGGGGTG CTGGTTAGGC TGTGAGCATC CTTCCTGGGT
 961  GCAGGCCCCC GACAGCCAGC AGTGCTGTGC TGTGTGTGTG TTGGGGACTC TGCTGAGCCC
1021  TTTGTGGCCA GACTGGGGAG GCTCCTCCGG GCTGGCTCTG TCCCCTGTAC CTTGTGAGGG
1081  AGGGGCTGAC CCCCTGACTG GGTTACATCG TGGTGAGCAG TTCAGAAACA AGCTGTGGAA
1141  TGAAGTGGAC GTGGCGTTTT AAACACATGA GCCCCATCTG TTCTTAGGGG TTTTGTTTGT
1201  TGTCCCAGTC CGTGACTCCA AGACTGGGAC CCCCAGAGTT CCCAGGATGG TCTGGAGCCT
1261  TTATCCTCAG GTCAGCATTG TGGAGTTAAA GGGAGGGGAC CACGGCCCCT CATTCTCAGG
1321  AGAGCCATGG TGACCTTGAT GGCGGAGGCT CAGGGGGACC TGGACCGTGG ACACCACACA
1381  GCTGCCCTCC TCCCTCCCGA GGCCATTTCA GGGCTGGAAT CCCTGCCCCC CTCTCCTTTC
1441  CTCCCGGGCT GGTTGTTGCC TTGAGAGTCC GTGCGCTCAT CTCCCCACTT TTACCCCAGG
1501  GGGAGGCCCC TCACCTTCCC ACCATATCCC TTGTACTTCC TCCCACCCTG GACTTGGGGG
1561  AGCTGGGGGG AGGGGGCCCT TCCTTCAGCA GCAAACCCTC CTGGTGTAGG GCTGTAGGCC
1621  ATCCCACCGC AGCCTGTCCA GGAGCTGCTG AGCCTGTCAG CCCCAACTAG CACCTCCTGT
1681  CCAGGCCCGG CCCAGCCCTG CCTCCAGAGC CTACAGAGGG GCCTCGCCCA GGTCCTGCTG
1741  CTCCAGAGCT TGTGGGTGCC CACGCTGCAG GCTGTTTGGG GTGGTGGAGT AGAGCACCCG
1801  CTGGAGCTGG GGGCTGAGTG GCCATGGGGG GACCATGCTC CTCCTATGGC CCAAGGCCCA
1861  GGGGTTCCAC CTCGTAATTT TTGTTTGTTT TTAAATAAGG AAAATGCAAA AAGCGAGGCG
1921  ACGGCTTAAA GATGGAGAAC GACCCCCAGG AGGCGGAGTC TGAAATGGCC CTGGATGCTG
1981  AGTTCCTGGA CGTGTACAAG AACTGCAACG GGGTGGTCAT GATGTTCGAC ATTACCAAGC
2041  AGTGGACCTT CAATTACATT CTCCGGGAGC TTCCAAAAGT GCCCACCCAC GTGCCAGTGT
2101  GCGTGCTGGG GAACTACCGG GACATGGGCG AGCACCGAGT CATCCTGCCG GACGACGTGC
2161  GTGACTTCAT CGACAACCTG GACAGGTGGG TGCGGTGGCC CTGCTCCCGA GGGACCCTGC
2221  CCGGTGCTCC GGTGTGCGGG GGAGGGTGCT GAGGCAGAGG CCCAGGGAGG GGTTAACGTT
2281  AGCATGGGGC CCGGCGGATG TGGGTCTCGC CGCTGAGTGG GGCTCACTGA AGCCTGGGTC
2341  TCCCCGATGG CAGGGCCGGG AACTGTGTGC TGGGGAACTG TGTGCCAGGG TGAAGTGCTG
2401  GCACTGTGGG GTCACCTGCA GAAGGGCACT CGGCTTAGCT GCTTAGCAGG GCTCAGCAGG
2461  GTCCTGTGGC CTCAGGAGCC TGCAGGAGGA GGGAGGGCAG TGCGGACCCA CAGCTGTGGG
2521  CCCAGGGGTG ATCCTTGGCA CCAGGGCAAG GGTCTTTCTC TTGCATCTTT TTTCCTTTCT
2581  GAAAGCAGAC CTCCAGGTTC CTCCTACTTC CGCTATGCTG AGTCTTCCAT GAAGAACAGC
2641  TTCGGCCTAA AGTACCTTCA TAAGTTCTTC AATATCCCAT TTTTGCAGCT TCAGAGGGAG
2701  ACGCTGTTGC GGCAGCTGGA GACGAACCAG CTGGACATGG ACGCCACGCT GGAGGAGCTG
2761  TCGGTGCAGC AGGAGACGGA GGACCAGAAC TACGGCATGT ATGTGGCGGG ACCCGCCCGT
2821  GCGGGCGGTG TGGGGGCTGC GGGCGTGGCC GTGGTGCAGG GCCATGGGCT GCACCAAGGA
2881  GACAGCAGAG GGGAGTGTCC CCTGTTTGGG GTAAATTAGT CACCTTTGGG CACGGGTGGA
2941  GGAGGACTCA GGTTTGCACT GCCCCCAGCA GCCCCCCCAC AGTCACCCCT GGCGTGGACT
3001  CCTCATACAG GTCATGCTGT GCCTGCCACT CTGAGTACCG CTGACCGTGG CCAGGTGCTG
3061  GTGCTCATGG AGTGCTGCTG GGGCTGCCTG CCCATCAGGG GCTTGGCCTC CCAGATTGAT
3121  GCCAGCATGG GGTGTGCTTT CTGGGGAGCT GCTTGACTTT GGGAAGCTCC CTGTGTTGAA
3181  GAGGCATACA GGCCAGGACA TGGAGGTCTC TGGTCCTCGA CAGCAGAGGG AGGCTCAGAG
3241  CATCCTCCTG AGTGGGCCTG GGCAGTGCAT AGCCCCGGGG TTGCGGCCAG TGGGACAGCT
3301  GGCCCGTTCT CTGCCTCAGG CTCCTGTACA GCTAGGGGCT TGGTGCCTCC CCTGGGACCC
3361  AGGCAGGGAC CACGGAATCA GTGGCCCTCC TGAGGCCCCC CAGGAGGTCT CTGTTTCCAG
3421  AAGGAGAGCC CTGTGGGTCA CCTTGGATCT GGCTGTTGGC TCAGACACAG CAAGAGACCG
3481  AGAGGGAAGG CAGTTTGATG CCTGGAGAGG GACCCGTGGC TTCCAGCTGC CAGGCCAGCC
3541  CCAGAATGGA GCCCCCCGCA TGGGCGCTTC TCTGTTGAAC CAATCCTGGC ATTTCCTGGG
3601  CCTGAGAGTT GGGTCAAGCT GAATGCTGCG ATGGCCGCAC GTGCTCCACC AAGCCCCAGC
3661  CCCCTCCTCT TCCCAGAAAC CCCCGCTCAC GGGAAGGTCC AGTTGCTTGC CATCTGGCCA
3721  CCTCTGCATG GAGCCCCCAA CAGCTGTGCC TCAGAACAGA TCCGAAGTGA CTTTCAGGGG
3781  AGCTGGACAC ATGTACGCTG GTGCCTGCTG TCCCCACCCT TTGGCACTGC TGCTCTTTCT
3841  TTTTCTGAGA TGGAGTCTCG CTCTGTCGCC CAGGCTGGAG CGCAGTGGTG TGATCTCGGC
3901  TCACCGCAAG CTCCGCCTCC CGGGTTCACG CCATTCTCCT GCCTCAGCCT CCCAGCTACT
3961  GGGGAGGCTG AGGCAGGGGA ATTGCTTGAA CCCGGGAGGC AGAGGTTATC GTGAGCTGAC
4021  ATTGCGCCAC TGCACTCCAG CGCGGAAGAC AGAGTGAGCA AAAAAAAAAA AAAAAAAAGA
4081  AAAAGTGACC AAAAAAAAAA AAAAAAAAA
B:氨基酸序列(SEQ ID NO:23)长度:190
  1  MAGPGTVCWG TVCQGEVLAL WGHLQKGTRL SCLAGLSRVL WPQEPAGGGR AVRTHSCGPR
 61  GDPWHQGKGL SLASFFLSES RPPGSSYFRY AESSMKNSFG LKYLHKFFNI PFLQLQRETL
121  LRQLETNQLD MDATLEELSV QQETEDQNYG MYVAGPARAG GVGAAGVAVV QGHGLHQGDS
181  RGECPLFGVN
C.核苷酸及氨基酸组合序列(SEQ ID NO:24)克隆号:PP8875
起始编码子:2347 ATG  终止编码子:2917 TAG  蛋白质分子量:20536.18
 1   GTT CCC GCA GGG GTG CTG GGC CCC TGC GGC TCC CAC CAC ATT GCG CTG     48
 49  GAC TCT TGT GGC CCG TGC TGA CCT GGT GTT CCA GAT GCT GTC TCT GCA     96
 97  GAG CTC TGC GTG GTC TCT GGT GTT AGA GAG GTG GCC ACC CAC CGC CCT    144
145  ATC ATT GTC CTC ATC CCC ACT GTG AGG AGA AGC TAT CAG ATC TGC CTG    192
193  TGG CCC CCA GGT GGC TCA GGA AGG GCC GTC CTG ACC CCC ATC CTG GCC    240
241  CCT TTC GGA GCT GCA GAG ATT TCC TGT GCC TCC AGC TCT GGC TTC CTG    288
289  GGT CTG TCC TTG GCG TGG AGC GGG CAC AGG CTT CCC GTA GAC ACG GTT    336
337  GCC CAG AGT GGG GTT CAT AAC TGG GCA CTG TAA AGG GTG TGG TCT CCA    384
 385  CGG CTT AGG ATG GGC CCC CCC TTC CTG GTG GCC TGC TGT GCC CGG GGC     432
 433  TGG TGT GGA GGC CTG TGG GGG TGG AGA GGC CGC CCG GCC CTG GGC TTC     480
 481  CTC TGG GGT TAC ATG TGT ACC CTT GCA CCC ACC TGT TAG CAC CCA CCG     528
 529  GGA GAG TCT CAC TCA GCC TAA ACC AGG GCC CCT CAG GAG GAA AAG GTC     576
 577  CCC AGC TTC ATG ATG GGG CCC AGT GTG CCT TCC ATC CCC GCC CTG ACT     624
 625  CAG TGC CCA CTG TGC GAG GTG TGA GCA CTG TCC ACA GCA GCC AGG GCG     672
 673  GCC GGT GGG GAG TGC ATT GGA GGG GGT TGA GGT CTC TTG GGC ACC TGG     720
 721  TGA GTT CTC AAG GGT GAG AGG AAG CCG AGG CCA TCA GGC TTA GCT GAC     768
 769  GCT GCA TGG GGC AGG CTG CCA AGA GGG AGG CTG AAT GGA GCA GCC TCA     816
 817  GGT GAG CCG ACA ATC CTC ACC TCC GCC TGG TCA GCC AGG ACC CGG CTC     864
 865  CCC TCC AGT CCC GCC TGC TTT CCC CAA AGC AGA TCC AGC CAG TCT CAA     912
 913  TGG CTC GCC CGG GGG GTG CTG GTT AGG CTG TGA GCA TCC TTC CTG GGT     960
 961  GCA GGC CCC CGA CAG CCA GCA GTG CTG TGC TGT GTG TGT GTT GGG GAC    1008
1009  TCT GCT GAG CCC TTT GTG GCC AGA CTG GGG AGG CTC CTC CGG GCT GGC    1056
1057  TCT GTC CCC TGT ACC TTG TGA GGG AGG GGC TGA CCC CCT GAC TGG GTT    1104
1105  ACA TCG TGG TGA GCA GTT CAG AAA CAA GCT GTG GAA TGA AGT GGA CGT    1152
1153  GGC GTT TTA AAC ACA TGA GCC CCA TCT GTT CTT AGG GGT TTT GTT TGT    1200
1201  TGT CCC AGT CCG TGA CTC CAA GAC TGG GAC CCC CAG AGT TCC CAG GAT    1248
1249  GGT CTG GAG CCT TTA TCC TCA GGT CAG CAT TGT GGA GTT AAA GGG AGG    1296
1297  GGA CCA CGG CCC CTC ATT CTC AGG AGA GCC ATG GTG ACC TTG ATG GCG    1344
1345  GAG GCT CAG GGG GAC CTG GAC CGT GGA CAC CAC ACA GCT GCC CTC CTC    1392
1393  CCT CCC GAG GCC ATT TCA GGG CTG GAA TCC CTG CCC CCC TCT CCT TTC    1440
1441  CTC CCG GGC TGG TTG TTG CCT TGA GAG TCC GTG CGC TCA TCT CCC CAC    1488
1489  TTT TAC CCC AGG GGG AGG CCC CTC ACC TTC CCA CCA TAT CCC TTG TAC    1536
1537  TTC CTC CCA CCC TGG ACT TGG GGG AGC TGG GGG GAG GGG GCC CTT CCT    1584
1585  TCA GCA GCA AAC CCT CCT GGT GTA GGG CTG TAG GCC ATC CCA CCG CAG    1632
1633  CCT GTC CAG GAG CTG CTG AGC CTG TCA GCC CCA ACT AGC ACC TCC TGT    1680
1681  CCA GGC CCG GCC CAG CCC TGC CTC CAG AGC CTA CAG AGG GGC CTC GCC    1728
1729  CAG GTC CTG CTG CTC CAG AGC TTG TGG GTG CCC ACG CTG CAG GCT GTT    1776
1777  TGG GGT GGT GGA GTA GAG CAC CCG CTG GAG CTG GGG GCT GAG TGG CCA    1824
1825  TGG GGG GAC CAT GCT CCT CCT ATG GCC CAA GGC CCA GGG GTT CCA CCT    1872
1873  CGT AAT TTT TGT TTG TTT TTA AAT AAG GAA AAT GCA AAA AGC GAG GCG    1920
1921  ACG GCT TAA AGA TGG AGA ACG ACC CCC AGG AGG CGG AGT CTG AAA TGG    1968
1969  CCC TGG ATG CTG AGT TCC TGG ACG TGT ACA AGA ACT GCA ACG GGG TGG    2016
2017  TCA TGA TGT TCG ACA TTA CCA AGC AGT GGA CCT TCA ATT ACA TTC TCC    2064
2065  GGG AGC TTC CAA AAG TGC CCA CCC ACG TGC CAG TGT GCG TGC TGG GGA    2112
2113  ACT ACC GGG ACA TGG GCG AGC ACC GAG TCA TCC TGC CGG ACG ACG TGC    2160
2161  GTG ACT TCA TCG ACA ACC TGG ACA GGT GGG TGC GGT GGC CCT GCT CCC    2208
2209  GAG GGA CCC TGC CCG GTG CTC CGG TGT GCG GGG GAG GGT GCT GAG GCA    2256
2257  GAG GCC CAG GGA GGG GTT AAC GTT AGC ATG GGG CCC GGC GGA TGT GGG    2304
2305  TCT CGC CGC TGA GTG GGG CTC ACT GAA GCC TGG GTC TCC CCG ATG GCA    2352
   1                                                          Met Ala       2
2353  GGG CCG GGA ACT GTG TGC TGG GGA ACT GTG TGC CAG GGT GAA GTG CTG    2400
   3  Gly Pro Gly Thr Val Cys Trp Gly Thr Val Cys Gln Gly Glu Val Leu      18
2401  GCA CTG TGG GGT CAC CTG CAG AAG GGC ACT CGG CTT AGC TGC TTA GCA    2448
  19  Ala Leu Trp Gly His Leu Gln Lys Gly Thr Arg Leu Ser Cys Leu Ala      34
2449  GGG CTC AGC AGG GTC CTG TGG CCT CAG GAG CCT GCA GGA GGA GGG AGG    2496
  35  Gly Leu Ser Arg Val Leu Trp Pro Gln Glu Pro Ala Gly Gly Gly Arg      50
2497  GCA GTG CGG ACC CAC AGC TGT GGG CCC AGG GGT GAT CCT TGG CAC CAG    2544
  51  Ala Val Arg Thr His Ser Cys Gly Pro Arg Gly Asp Pro Trp His Gln      66
2545  GGC AAG GGT CTT TCT CTT GCA TCT TTT TTC CTT TCT GAA AGC AGA CCT    2592
  67  Gly Lys Gly Leu Ser Leu Ala Ser Phe Phe Leu Ser Glu Ser Arg Pro      82
2593  CCA GGT TCC TCC TAC TTC CGC TAT GCT GAG TCT TCC ATG AAG AAC AGC    2640
  83  Pro Gly Ser Ser Tyr Phe Arg Tyr Ala Glu Ser Ser Met Lys Asn Ser      98
2641  TTC GGC CTA AAG TAC CTT CAT AAG TTC TTC AAT ATC CCA TTT TTG CAG    2688
  99  Phe Gly Leu Lys Tyr Leu His Lys Phe Phe Asn Ile Pro Phe Leu Gln     114
2689  CTT CAG AGG GAG ACG CTG TTG CGG CAG CTG GAG ACG AAC CAG CTG GAC    2736
 115  Leu Gln Arg Glu Thr Leu Leu Arg Gln Leu Glu Thr Asn Gln Leu Asp     130
2737  ATG GAC GCC ACG CTG GAG GAG CTG TCG GTG CAG CAG GAG ACG GAG GAC    2784
 131  Met Asp Ala Thr Leu Glu Glu Leu Ser Val Gln Gln Glu Thr Glu Asp     146
2785  CAG AAC TAC GGC ATG TAT GTG GCG GGA CCC GCC CGT GCG GGC GGT GTG    2832
 147  Gln Asn Tyr Gly Met Tyr Val Ala Gly Pro Ala Arg Ala Gly Gly Val     162
2833  GGG GCT GCG GGC GTG GCC GTG GTG CAG GGC CAT GGG CTG CAC CAA GGA    2880
 163  Gly Ala Ala Gly Val Ala Val Val Gln Gly His Gly Leu His Gln Gly     178
2881  GAC AGC AGA GGG GAG TGT CCC CTG TTT GGG GTA AAT TAG TCA CCT TTG    2928
 179  Asp Ser Arg Gly Glu Cys Pro Leu Phe Gly Val Asn ***                 191
2929  GGC ACG GGT GGA GGA GGA CTC AGG TTT GCA CTG CCC CCA GCA GCC CCC    2976
2977  CCA CAG TCA CCC CTG GCG TGG ACT CCT CAT ACA GGT CAT GCT GTG CCT    3024
3025  GCC ACT CTG AGT ACC GCT GAC CGT GGC CAG GTG CTG GTG CTC ATG GAG    3072
3073  TGC TGC TGG GGC TGC CTG CCC ATC AGG GGC TTG GCC TCC CAG ATT GAT    3120
3121  GCC AGC ATG GGG TGT GCT TTC TGG GGA GCT GCT TGA CTT TGG GAA GCT    3168
3169  CCC TGT GTT GAA GAG GCA TAC AGG CCA GGA CAT GGA GGT CTC TGG TCC    3216
3217  TCG ACA GCA GAG GGA GGC TCA GAG CAT CCT CCT GAG TGG GCC TGG GCA    3264
3265  GTG CAT AGC CCC GGG GTT GCG GCC AGT GGG ACA GCT GGC CCG TTC TCT    3312
3313  GCC TCA GGC TCC TGT ACA GCT AGG GGC TTG GTG CCT CCC CTG GGA CCC    3360
3361  AGG CAG GGA CCA CGG AAT CAG TGG CCC TCC TGA GGC CCC CCA GGA GGT    3408
3409  CTC TGT TTC CAG AAG GAG AGC CCT GTG GGT CAC CTT GGA TCT GGC TGT    3456
3457  TGG CTC AGA CAC AGC AAG AGA CCG AGA GGG AAG GCA GTT TGA TGC CTG    3504
3505  GAG AGG GAC CCG TGG CTT CCA GCT GCC AGG CCA GCC CCA GAA TGG AGC    3552
3553  CCC CCG CAT GGG CGC TTC TCT GTT GAA CCA ATC CTG GCA TTT CCT GGG    3600
3601  CCT GAG AGT TGG GTC AAG CTG AAT GCT GCG ATG GCC GCA CGT GCT CCA    3648
3649  CCA AGC CCC AGC CCC CTC CTC TTC CCA GAA ACC CCC GCT CAC GGG AAG    3696
3697  GTC CAG TTG CTT GCC ATC TGG CCA CCT CTG CAT GGA GCC CCC AAC AGC    3744
3745  TGT GCC TCA GAA CAG ATC CGA AGT GAC TTT CAG GGG AGC TGG ACA CAT    3792
3793  GTA CGC TGG TGC CTG CTG TCC CCA CCC TTT GGC ACT GCT GCT CTT TCT    3840
3841  TTT TCT GAG ATG GAG TCT CGC TCT GTC GCC CAG GCT GGA GCG CAG TGG    3888
3889  TGT GAT CTC GGC TCA CCG CAA GCT CCG CCT CCC GGG TTC ACG CCA TTC    3936
3937  TCC TGC CTC AGC CTC CCA GCT ACT GGG GAG GCT GAG GCA GGG GAA TTG    3984
3985  CTT GAA CCC GGG AGG CAG AGG TTA TCG TGA GCT GAC ATT GCG CCA CTG    4032
4033  CAC TCC AGC GCG GAA GAC AGA GTG AGC AAA AAA AAA AAA AAA AAA AGA    4080
4081  AAA AGT GAC CAA AAA AAA AAA AAA AAA AA                             4109
9.PP8997
A:核苷酸序列(SEQ ID NO:25)长度:3191
   1  GCGGACCCCT CGTCCCTCCG CAGTCTCCGG CTGGCAGCGA TGGAGGGCGC TGGGGAGAAC
  61  GCCCCGGAGT CCAGCTCCTC TGCCCCTGGG TCCGAAGAGT CTGCCAGGGA TCCACAGGTG
 121  CCCCCTCCGG AGGAAGAATC GGGGGACTGC GCCCGGTCCC TGGAGGCGGT CCCCAAGAAA
 181  CTCTGTGGGT ATTTAAGTAA GTTCGGCGGC AAAGGGCCCA TCCGGGGCTG GAAATCCCGC
 241  TGGTTCTTCT ACGACGAAAG GAAATGTCAG CTGTATTACT CGCGGACCGC TCAGGATGCC
 301  AATCCCTTGG ACAGCATCGA CCTCTCCAGT GCAGTGTTTG ACTGTAAGGC GGACGCTGAG
 361  GAGGGGATCT TCGAAATCAA GACTCCCAGC CGGGTTATTA CCCTGAAGGC CGCCACCAAG
 421  CAAGCGATGC TGTACTGGCT GCAGCAGCTG CAGATGAAGC GCTGGGAATT CCACAACAGC
 481  CCGCCGGCAC CTCCTGCCAC CCCTGATGCC GCCCTGGCTG GGAATGGGCC CGTCCTGCAC
 541  CTCGAGCTAG GGCAAGAAGA GGCAGAGCTG GAGGAGTTCC TGTGCCCTGT GAAAACACCC
 601  CCTGGGCTAG TGGGCGTGGC AGCTGCCTTG CAGCCCTTCC CTGCCCTTCA GAATATTTCC
 661  CTCAAGCACC TGGGGACTGA AATACAGAAC ACAATGCACA ACATCCGTGG CAACAAGCAG
 721  GCCCAGGGAA CAGGCCATGA ACCTCCAGGG GAAGATTCTC CACAGAGTGG GGAGCCTCAG
 781  AGGGAGGAGC AGCCCTTGGC CTCTGACGCC AGCACCCCAG GGAGAGAGCC AGAGGATTCT
 841  CCAAAGCCTG CACCCAAGCC TTCTCTGACC ATCAGTTTCG CTCAGAAAGC CAAGCGCCAG
 901  AACAACACCT TCCCATTCTT TTCTGAAGGA ATCACACGGA ACCGAACTGC CCAGGAGAAA
 961  GTGGCAGCCT TGGAGCAACA GGTTCTGATG CTCACCAAGG AGTTAAAGTC TCAGAAGGAG
1021  CTAGTGAAGA TCCTGCACAA GGCACTGGAG GCCGCCCAGC AGGAGAAGCG GGCGTCCAGC
1081  GCATACCTGG CGGCGGCTGA GGACAAGGAC CGGCTGGAGC TGGTGCGGCA CAAAGTGCGG
1141  CAGATCGCGG AGCTGGGCCG GCGGGTGGAG GCCCTGGAGC AGGAGCGGGA GAGCCTGGCG
1201  CACACAGCGA GCCTGCGGGA GCAGCAGGTG CAGGAGCTAC AGCAGCACGT GCAGCTGCTT
1261  ATGGACAAGA ACCACGCCAA GCAGCAGGTC ATCTGCAAGC TCTCTGAGAA GGTCACCCAG
1321  GACTTCACGC ACCCCCCTGA CCAGTCTCCT TTGCGCCCCG ACGCTGCCAA CAGGGACTTC
1381  CTGAGCCAGC AGGGGAAGAT AGAGCACCTG AAGGATGACA TGGAAGCTTA CCGGACCCAG
1441  AACTGCTTCC TCAACTCCGA GATCCACCAG GTCACAAAGA TCTGGAGAAA GGTGGCTGAG
1501  AAGGAGAAGG CCCTTCTGAC GAAGTGCGCC TACCTCCAAG CCAGAAACTG CCAGGTGGAA
1561  AGCAAGTACC TGGCCGGTCT GAGAAGGCTG CAGGAGGCCC TGGGGGACGA AGCCAGCGAG
1621  TGCTCAGAGC TGCTGAGGCA GCTTGTCCAG GAGGCACTGC AGTGGGAAGC TGGGGAGGCC
1681  TCATCTGACA GCATCGAGCT GAGCCCCATC AGTAAGTATG ATGAGTACGG CTTCCTGACG
1741  GTGCCCGACT ATGAGGTGGA AGACCTGAAG CTGCTGGCCA AGATCCAGGC GTTGGAGTCA
1801  CGATCCCACC ACCTGCTGGG CCTCGAGGCT GTGGATCGGC CGCTGAGGGA GCGCTGGGCT
1861  GCCCTGGGCG ATCTTGTGCC CTCAGCCGAG CTCAAGCAGC TACTGCGGGC AGGAGTACCC
1921  CGTGAACACC GGCCTCGTGT CTGGAGGTGG CTGGTCCACC TCCGTGTCCA GCACCTGCAC
1981  ACTCCAGGCT GCTACCAGGA ACTGCTGAGC CGGGGCCAGG CCCGCGAGCA CCCTGCTGCC
2041  CGCCAGATTG AGCTGGACCT GAACCGGACC TTCCCCAACA ACAAACACTT CACCTGCCCC
2101  ACCTCCAGCT TCCCCGACAA GCTCCGCCGG GTGCTGCTGG CCTTCTCCTG GCAGAACCCC
2161  ACCATCGGCT ACTGCCAGGG CCTGAACAGG CTGGCGGCCA TTGCCCTGCT GGTCCTAGAG
2221  GAGGAGGAGA GCGCCTTCTG GTGCCTGGTG GCCATTGTGG AGACCATCAT GCCCGCTGAT
2281  TACTACTGCA ACACGCTGAC GGCATCCCAG GTGGACCAGC GGGTGCTCCA GGACCTGCTC
2341  TCGGAGAAGC TGCCCAGGCT GATGGCCCAT CTGGGGCAGC ACCACGTGGA TCTCTCCCTC
2401  GTCACCTTCA ACTGGTTCCT CGTGGTCTTT GCGGACAGTC TCATTAGCAA CATCCTCCTT
2461  CGGGTCTGGG ATGCCTTCCT GTACGAGGGG ACGAAGGTGG TGTTTCGCTA TGCCTTGGCC
2521  ATTTTCAAGT ACAACGAGAA GGAGATCTTG AGGCTACACA ATGGCCTGGA AATCTACCAG
2581  TACCTGCGCT TCTTCACCAA GACCATCTCC AACAGCCGCT GATGAACATC GCCTTCAATG
2641  ACATGAACCC CTTCCGCATG AAACAGCTGC GGCAGCTGCG CATGGTCCAC CGGGAGCGGC
2701  TGGAGGCTGA GCTGCGGGAG CTGGAGCAGC TTAAGGCAGA GTACCTGGAG AGGCGGGCAT
2761  CCCGGCGCAG AGCTGTGTCC GAGGGCTGTG CCAGCGAGGA CGAGGTGGAG GGGGAAGCCT
2821  GACTTGGCCA CCTCCCCTCC CCACAGCCTT CCTCACCCTT GGCTGGCAGA CCCACTGGAG
2881  GTCAGGCACG GACCAGTGGC CCAGCCCTGG GTGTCCCATC ACCATGTGAC CTTGGACATG
2941  TCCCTTCCCC TCTCTGGCCC TCAGTTTCCC CACTGGGACA TTGTGTGCTG CAAAGCCATT
3001  GGTTGGGCTA CTTCTTCATA GGCACTTACT TACCCAGGGA TGCCACCCTT TCGTCACCTC
3061  TTCCACAGAG CACTTTGGCA TGTAAACAAG CAAGAGCACT GCCTCTATAG GGTAACCTGG
3121  AACATTCTCT AGGTTATATC AATATAAAAC AATGTAAATG GTGGAAATCA TTCAAAAAAA
3181  AAAAAAAAAA A
B:氨基酸序列(SEQ ID NO:26)长度:860
  1  MEGAGENAPE SSSSAPGSEE SARDPQVPPP EEESGDCARS LEAVPKKLCG YLSKFGGKGP
 61  IRGWKSRWFF YDERKCQLYY SRTAQDANPL DSIDLSSAVF DCKADAEEGI FEIKTPSRVI
121  TLKAATKQAM LYWLQQLQMK RWEFHNSPPA PPATPDAALA GNGPVLHLEL GQEEAELEEF
181  LCPVKTPPGL VGVAAALQPF PALQNISLKH LGTEIQNTMH NIRGNKQAQG TGHEPPGEDS
241  PQSGEPQREE QPLASDASTP GREPEDSPKP APKPSLTISF AQKAKRQNNT FPFFSEGITR
301  NRTAQEKVAA LEQQVLMLTK ELKSQKELVK ILHKALEAAQ QEKRASSAYL AAAEDKDRLE
361  LVRHKVRQIA ELGRRVEALE QERESLAHTA SLREQQVQEL QQHVQLLMDK NHAKQQVICK
421  LSEKVTQDFT HPPDQSPLRP DAANRDFLSQ QGKIEHLKDD MEAYRTQNCF LNSEIHQVTK
481  IWRKVAEKEK ALLTKCAYLQ ARNCQVESKY LAGLRRLQEA LGDEASECSE LLRQLVQEAL
541  QWEAGEASSD SIELSPISKY DEYGFLTVPD YEVEDLKLLA KIQALESRSH HLLGLEAVDR
601  PLRERWAALG DLVPSAELKQ LLRAGVPREH RPRVWRWLVH LRVQHLHTPG CYQELLSRGQ
661  AREHPAARQI ELDLNRTFPN NKHFTCPTSS FPDKLRRVLL AFSWQNPTIG YCQGLNRLAA
721  IALLVLEEEE SAFWCLVAIV ETIMPADYYC NTLTASQVDQ RVLQDLLSEK LPRLMAHLGQ
781  HHVDLSLVTF NWFLVVFADS LISNILLRVW DAFLYEGTKV VFRYALAIFK YNEKEILRLH
841  NGLEIYQYLR FFTKTISNSR
C.核苷酸及氨基酸组合序列(SEQ ID NO:27)克隆号:PP8997
起始编码子:40 ATG  终止编码子:2620 TGA  蛋白质分子量:97300.38
 1  GCG GAC CCC TCG TCC CTC CGC AGT CTC CGG CTG GCA GCG ATG GAG GGC    48
 1                                                      Met Glu Gly     3
49  GCT GGG GAG AAC GCC CCG GAG TCC AGC TCC TCT GCC CCT GGG TCC GAA    96
   4  Ala Gly Glu Asn Ala Pro Glu Ser Ser Ser Ser Ala Pro Gly Ser Glu      19
  97  GAG TCT GCC AGG GAT CCA CAG GTG CCG CCT CCG GAG GAA GAA TCG GGG     144
  20  Glu Ser Ala Arg Asp Pro Gln Val Pro Pro Pro Glu Glu Glu Ser Gly      35
 145  GAC TGC GCC CGG TCC CTG GAG GCG GTC CCC AAG AAA CTC TGT GGG TAT     192
  36  Asp Cys Ala Arg Ser Leu Glu Ala Val Pro Lys Lys Leu Cys Gly Tyr      51
 193  TTA AGT AAG TTC GGC GGC AAA GGG CCC ATC CGG GGC TGG AAA TCC CGC     240
  52  Leu Ser Lys Phe Gly Gly Lys Gly Pro Ile Arg Gly Trp Lys Ser Arg      67
 241  TGG TTC TTC TAC GAC GAA AGG AAA TGT CAG CTG TAT TAC TCG CGG ACC     288
  68  Trp Phe Phe Tyr Asp Glu Arg Lys Cys Gln Leu Tyr Tyr Ser Arg Thr      83
 289  GCT CAG GAT GCC AAT CCC TTG GAC AGC ATC GAC CTC TCC AGT GCA GTG     336
  84  Ala Gln Asp Ala Asn Pro Leu Asp Ser Ile Asp Leu Ser Ser Ala Val      99
 337  TTT GAC TGT AAG GCG GAC GCT GAG GAG GGG ATC TTC GAA ATC AAG ACT     384
 100  Phe Asp Cys Lys Ala Asp Ala Glu Glu Gly Ile Phe Glu Ile Lys Thr     115
 385  CCC AGC CGG GTT ATT ACC CTG AAG GCC GCC ACC AAG CAA GCG ATG CTG     432
 116  Pro Ser Arg Val Ile Thr Leu Lys Ala Ala Thr Lys Gln Ala Met Leu     131
 433  TAC TGG CTG CAG CAG CTG CAG ATG AAG CGC TGG GAA TTC CAC AAC AGC     480
 132  Tyr Trp Leu Gln Gln Leu Gln Met Lys Arg Trp Glu Phe His Asn Ser     147
 481  CCG CCG GCA CCT CCT GCC ACC CCT GAT GCC GCC CTG GCT GGG AAT GGG     528
 148  Pro Pro Ala Pro Pro Ala Thr Pro Asp Ala Ala Leu Ala Gly Asn Gly     163
 529  CCC GTC CTG CAC CTC GAG CTA GGG CAA GAA GAG GCA GAG CTG GAG GAG     576
 164  Pro Val Leu His Leu Glu Leu Gly Gln Glu Glu Ala Glu Leu Glu Glu     179
 577  TTC CTG TGC CCT GTG AAA ACA CCC CCT GGG CTA GTG GGC GTG GCA GCT     624
 180  Phe Leu Cys Pro Val Lys Thr Pro Pro Gly Leu Val Gly Val Ala Ala     195
 625  GCC TTG CAG CCC TTC CCT GCC CTT CAG AAT ATT TCC CTC AAG CAC CTG     672
 196  Ala Leu Gln Pro Phe Pro Ala Leu Gln Asn Ile Ser Leu Lys His Leu     211
 673  GGG ACT GAA ATA CAG AAC ACA ATG CAC AAC ATC CGT GGC AAC AAG CAG     720
 212  Gly Thr Glu Ile Gln Asn Thr Met His Asn Ile Arg Gly Asn Lys Gln     227
 721  GCC CAG GGA ACA GGC CAT GAA CCT CCA GGG GAA GAT TCT CCA CAG AGT     768
 228  Ala Gln Gly Thr Gly His Glu Pro Pro Gly Glu Asp Ser Pro Gln Ser     243
 769  GGG GAG CCT CAG AGG GAG GAG CAG CCC TTG GCC TCT GAC GCC AGC ACC     816
 244  Gly Glu Pro Gln Arg Glu Glu Gln Pro Leu Ala Ser Asp Ala Ser Thr     259
 817  CCA GGG AGA GAG CCA GAG GAT TCT CCA AAG CCT GCA CCC AAG CCT TCT     864
 260  Pro Gly Arg Glu Pro Glu Asp Ser Pro Lys Pro Ala Pro Lys Pro Ser     275
 865  CTG ACC ATC AGT TTC GCT CAG AAA GCC AAG CGC CAG AAC AAC ACC TTC     912
 276  Leu Thr Ile Ser Phe Ala Gln Lys Ala Lys Arg Gln Asn Asn Thr Phe     291
 913  CCA TTC TTT TCT GAA GGA ATC ACA CGG AAC CGA ACT GCC CAG GAG AAA     960
 292  Pro Phe Phe Ser Glu Gly Ile Thr Arg Asn Arg Thr Ala Gln Glu Lys     307
 961  GTG GCA GCC TTG GAG CAA CAG GTT CTG ATG CTC ACC AAG GAG TTA AAG    1008
 308  Val Ala Ala Leu Glu Gln Gln Val Leu Met Leu Thr Lys Glu Leu Lys     323
1009  TCT CAG AAG GAG CTA GTG AAG ATC CTG CAC AAG GCA CTG GAG GCC GCC    1056
 324  Ser Gln Lys Glu Leu Val Lys Ile Leu His Lys Ala Leu Glu Ala Ala     339
1057  CAG CAG GAG AAG CGG GCG TCC AGC GCA TAC CTG GCG GCG GCT GAG GAC    1104
 340  Gln Gln Glu Lys Arg Ala Ser Ser Ala Tyr Leu Ala Ala Ala Glu Asp     355
1105  AAG GAC CGG CTG GAG CTG GTG CGG CAC AAA GTG CGG CAG ATC GCG GAG    1152
 356  Lys Asp Arg Leu Glu Leu Val Arg His Lys Val Arg Gln Ile Ala Glu     371
1153  CTG GGC CGG CGG GTG GAG GCC CTG GAG CAG GAG CGG GAG AGC CTG GCG    1200
 372  Leu Gly Arg Arg Val Glu Ala Leu Glu Gln Glu Arg Glu Ser Leu Ala     387
1201  CAC ACA GCG AGC CTG CGG GAG CAG CAG GTG CAG GAG CTA CAG CAG CAC    1248
 388  His Thr Ala Ser Leu Arg Glu Gln Gln Val Gln Glu Leu Gln Gln His     403
1249  GTG CAG CTG CTT ATG GAC AAG AAC CAC GCC AAG CAG CAG GTC ATC TGC    1296
 404  Val Gln Leu Leu Met Asp Lys Asn His Ala Lys Gln Gln Val Ile Cys     419
1297  AAG CTC TCT GAG AAG GTC ACC CAG GAC TTC ACG CAC CCC CCT GAC CAG    1344
 420  Lys Leu Ser Glu Lys Val Thr Gln Asp Phe Thr His Pro Pro Asp Gln     435
1345  TCT CCT TTG CGC CCC GAC GCT GCC AAC AGG GAC TTC CTG AGC CAG CAG    1392
 436  Ser Pro Leu Arg Pro Asp Ala Ala Asn Arg Asp Phe Leu Ser Gln Gln     451
1393  GGG AAG ATA GAG CAC CTG AAG GAT GAC ATG GAA GCT TAC CGG ACC CAG    1440
 452  Gly Lys Ile Glu His Leu Lys Asp Asp Met Glu Ala Tyr Arg Thr Gln     467
1441  AAC TGC TTC CTC AAC TCC GAG ATC CAC CAG GTC ACA AAG ATC TGG AGA    1488
 468  Asn Cys Phe Leu Asn Ser Glu Ile His Gln Val Thr Lys Ile Trp Arg     483
1489  AAG GTG GCT GAG AAG GAG AAG GCC CTT CTG ACG AAG TGC GCC TAC CTC    1536
 484  Lys Val Ala Glu Lys Glu Lys Ala Leu Leu Thr Lys Cys Ala Tyr Leu     499
1537  CAA GCC AGA AAC TGC CAG GTG GAA AGC AAG TAC CTG GCC GGT CTG AGA    1584
 500  Gln Ala Arg Asn Cys Gln Val Glu Ser Lys Tyr Leu Ala Gly Leu Arg     515
1585  AGG CTG CAG GAG GCC CTG GGG GAC GAA GCC AGC GAG TGC TCA GAG CTG    1632
 516  Arg Leu Gln Glu Ala Leu Gly Asp Glu Ala Ser Glu Cys Ser Glu Leu     531
1633  CTG AGG CAG CTT GTC CAG GAG GCA CTG CAG TGG GAA GCT GGG GAG GCC    1680
 532  Leu Arg Gln Leu Val Gln Glu Ala Leu Gln Trp Glu Ala Gly Glu Ala     547
1681  TCA TCT GAC AGC ATC GAG CTG AGC CCC ATC AGT AAG TAT GAT GAG TAC    1728
 548  Ser Ser Asp Ser Ile Glu Leu Ser Pro Ile Ser Lys Tyr Asp Glu Tyr     563
1729  GGC TTC CTG ACG GTG CCC GAC TAT GAG GTG GAA GAC CTG AAG CTG CTG    1776
 564  Gly Phe Leu Thr Val Pro Asp Tyr Glu Val Glu Asp Leu Lys Leu Leu     579
1777  GCC AAG ATC CAG GCG TTG GAG TCA CGA TCC CAC CAC CTG CTG GGC CTC    1824
 580  Ala Lys Ile Gln Ala Leu Glu Ser Arg Ser His His Leu Leu Gly Leu     595
1825  GAG GCT GTG GAT CGG CCG CTG AGG GAG CGC TGG GCT GCC CTG GGC GAT    1872
 596  Glu Ala Val Asp Arg Pro Leu Arg Glu Arg Trp Ala Ala Leu Gly Asp     611
1873  CTT GTG CCC TCA GCC GAG CTC AAG CAG CTA CTG CGG GCA GGA GTA CCC    1920
 612  Leu Val Pro Ser Ala Glu Leu Lys Gln Leu Leu Arg Ala Gly Val Pro     627
1921  CGT GAA CAC CGG CCT CGT GTC TGG AGG TGG CTG GTC CAC CTC CGT GTC    1968
 628  Arg Glu His Arg Pro Arg Val Trp Arg Trp Leu Val His Leu Arg Val     643
1969  CAG CAC CTG CAC ACT CCA GGC TGC TAC CAG GAA CTG CTG AGC CGG GGC    2016
 644  Gln His Leu His Thr Pro Gly Cys Tyr Gln Glu Leu Leu Ser Arg Gly     659
2017  CAG GCC CGC GAG CAC CCT GCT GCC CGC CAG ATT GAG CTG GAC CTG AAC    2064
 660  Gln Ala Arg Glu His Pro Ala Ala Arg Gln Ile Glu Leu Asp Leu Asn     675
2065  CGG ACC TTC CCC AAC AAC AAA CAC TTC ACC TGC CCC ACC TCC AGC TTC    2112
 676  Arg Thr Phe Pro Asn Asn Lys His Phe Thr Cys Pro Thr Ser Ser Phe     691
2113  CCC GAC AAG CTC CGC CGG GTG CTG CTG GCC TTC TCC TGG CAG AAC CCC    2160
 692  Pro Asp Lys Leu Arg Arg Val Leu Leu Ala Phe Ser Trp Gln Asn Pro     707
2161  ACC ATC GGC TAC TGC CAG GGC CTG AAC AGG CTG GCG GCC ATT GCC CTG    2208
 708  Thr Ile Gly Tyr Cys Gln Gly Leu Asn Arg Leu Ala Ala Ile Ala Leu     723
2209  CTG GTC CTA GAG GAG GAG GAG AGC GCC TTC TGG TGC CTG GTG GCC ATT    2256
 724  Leu Val Leu Glu Glu Glu Glu Ser Ala Phe Trp Cys Leu Val Ala Ile     739
2257  GTG GAG ACC ATC ATG CCC GCT GAT TAC TAC TGC AAC ACG CTG ACG GCA    2304
 740  Val Glu Thr Ile Met Pro Ala Asp Tyr Tyr Cys Asn Thr Leu Thr Ala     755
2305  TCC CAG GTG GAC CAG CGG GTG CTC CAG GAC CTG CTC TCG GAG AAG CTG    2352
 756  Ser Gln Val Asp Gln Arg Val Leu Gln Asp Leu Leu Ser Glu Lys Leu     771
2353  CCC AGG CTG ATG GCC CAT CTG GGG CAG CAC CAC GTG GAT CTC TCC CTC    2400
 772  Pro Arg Leu Met Ala His Leu Gly Gln His His Val Asp Leu Ser Leu     787
2401  GTC ACC TTC AAC TGG TTC CTC GTG GTC TTT GCG GAC AGT CTC ATT AGC    2448
 788  Val Thr Phe Asn Trp Phe Leu Val Val Phe Ala Asp Ser Leu Ile Ser     803
2449  AAC ATC CTC CTT CGG GTC TGG GAT GCC TTC CTG TAC GAG GGG ACG AAG    2496
 804  Asn Ile Leu Leu Arg Val Trp Asp Ala Phe Leu Tyr Glu Gly Thr Lys     819
2497  GTG GTG TTT CGC TAT GCC TTG GCC ATT TTC AAG TAC AAC GAG AAG GAG    2544
 820  Val Val Phe Arg Tyr Ala Leu Ala Ile Phe Lys Tyr Asn Glu Lys Glu     835
2545  ATC TTG AGG CTA CAC AAT GGC CTG GAA ATC TAC CAG TAC CTG CGC TTC    2592
 836  Ile Leu Arg Leu His Asn Gly Leu Glu Ile Tyr Gln Tyr Leu Arg Phe     851
2593  TTC ACC AAG ACC ATC TCC AAC AGC CGC TGA TGA ACA TCG CCT TCA ATG    2640
 852  Phe Thr Lys Thr Ile Ser Asn Ser Arg ***                             861
2641  ACA TGA ACC CCT TCC GCA TGA AAC AGC TGC GGC AGC TGC GCA TGG TCC    2688
2689  ACC GGG AGC GGC TGG AGG CTG AGC TGC GGG AGC TGG AGC AGC TTA AGG    2736
2737  CAG AGT ACC TGG AGA GGC GGG CAT CCC GGC GCA GAG CTG TGT CCG AGG    2784
2785  GCT GTG CCA GCG AGG ACG AGG TGG AGG GGG AAG CCT GAC TTG GCC ACC    2832
2833  TCC CCT CCC CAC AGC CTT CCT CAC CCT TGG CTG GCA GAC CCA CTG GAG    2880
2881  GTC AGG CAC GGA CCA GTG GCC CAG CCC TGG GTG TCC CAT CAC CAT GTG    2928
2929  ACC TTG GAC ATG TCC CTT CCC CTC TCT GGC CCT CAG TTT CCC CAC TGG    2976
2977  GAC ATT GTG TGC TGC AAA GCC ATT GGT TGG GCT ACT TCT TCA TAG GCA    3024
3025  CTT ACT TAC CCA GGG ATG CCA CCC TTT CGT CAC CTC TTC CAC AGA GCA    3072
3073  CTT TGG CAT GTA AAC AAG CAA GAG CAC TGC CTC TAT AGG GTA ACC TGG    3120
3121  AAC ATT CTC TAG GTT ATA TCA ATA TAA AAC AAT GTA AAT GGT GGA AAT    3168
3169  CAT TCA AAA AAA AAA AAA AAA AA                                     3191
10.PP9012
A:核苷酸序列(SEQ ID NO:28)长度:524
  1  GGTGAGGGTG TGAGGGTCGC GTTCCTGCTG TCTGGACTTT TTCTGTCCCA CTGAGACGCA
 61  GCTGTGTGAA ATATGATTTG GCGAGGAAGA TCAACATATA GGCATAGGCC GAGGAGAAGT
121  GTACCACCTC CTGAGCTGAT TGGGCCTATG CTGGAGCCCG GTGATGAGGA GCCTCAGCAA
181  GAGGAACCAC CAACTGAAAG TCGGGATCCT GCACCTGGTC AGGAGAGAGA AGAAGATCAG
241  GGTGCAGCTG AGACTCAAGT GCCTGACCTG GAAGCTGATC TCCAGGAGCT GTCTCAGTCA
301  AAGACTGGGG GTGAATGTGG AAATGGTCCT GATGACCAGG GGAAGATTCT GCCAAAATCA
361  GAACAATTTA AAATGCCAGA AGGAGGTGAC AGGCAACCAC AGGTTTAAAT GAAGACAAGC
421  TGAAACAACA CAAAACTGTT TTTATCTAAG ATATTTGACT TAAAAATATC AAAATAAACT
481  TTTGCAGCTT TCTCCAAAAA AAAAAAAAAA AAAAAAAAAA AAAA
B:氨基酸序列(SEQ ID NO:29)长度:111
 1  MIWRGRSTYR HRPRRSVPPP ELIGPMLEPG DEEPQQEEPP TESRDPAPGQ EREEDQGAAE
61  TQVPDLEADL QELSQSKTGG ECGNGPDDQG KILPKSEQFK MPEGGDRQPQ V
C.核苷酸及氨基酸组合序列(SEQ ID NO:30)克隆号:PP9012
起始编码子:73 ATG  终止编码子:406 TAA  蛋白质分子量:12341.84
  1  GGT GAG GGT GTC AGG GTC GCG TTC CTG CTG TCT GGA CTT TTT CTG TCC     48
 49  CAC TGA GAC GCA GCT GTG TGA AAT ATG ATT TGG CGA GGA AGA TCA ACA     96
  1                                  Met Ile Trp Arg Gly Arg Ser Thr      8
 97  TAT AGG CAT AGG CCG AGG AGA AGT GTA CCA CCT CCT GAG CTG ATT GGG    144
  9  Tyr Arg His Arg Pro Arg Arg Ser Val Pro Pro Pro Glu Leu Ile Gly     24
145  CCT ATG CTG GAG CCC GGT GAT GAG GAG CCT CAG CAA GAG GAA CCA CCA    192
 25  Pro Met Leu Glu Pro Gly Asp Glu Glu Pro Gln Gln Glu Glu Pro Pro     40
193  ACT GAA AGT CGG GAT CCT GCA CCT GGT CAG GAG AGA GAA GAA GAT CAG    240
 41  Thr Glu Ser Arg Asp Pro Ala Pro Gly Gln Glu Arg Glu Glu Asp Gln     56
241  GGT GCA GCT GAG ACT CAA GTG CCT GAC CTG GAA GCT GAT CTC CAG GAG    288
 57  Gly Ala Ala Glu Thr Gln Val Pro Asp Leu Glu Ala Asp Leu Gln Glu     72
289  CTG TCT CAG TCA AAG ACT GGG GGT GAA TGT GGA AAT GGT CCT GAT GAC    336
 73  Leu Ser Gln Ser Lys Thr Gly Gly Glu Cys Gly Asn Gly Pro Asp Asp     88
337  CAG GGG AAG ATT CTG CCA AAA TCA GAA CAA TTT AAA ATG CCA GAA GGA    384
 89  Gln Gly Lys Ile Leu Pro Lys Ser Glu Gln Phe Lys Met Pro Glu Gly    104
385  GGT GAC AGG CAA CCA CAG GTT TAA ATG AAG ACA AGC TGA AAC AAC ACA    432
105  Gly Asp Arg Gln Pro Gln Val ***                                    112
433  AAA CTG TTT TTA TCT AAG ATA TTT GAC TTA AAA ATA TCA AAA TAA ACT    480
481  TTT GCA GCT TTC TCC AAA AAA AAA AAA AAA AAA AAA AAA AAA AA         524
11.PP9286
A:核苷酸序列(SEQ ID NO:31)长度:2943
   1  GCTGAAGGCT GCAAATCTAA GATCAGGGCA ACATAATGAG ACCTTGTCTC TACCAAAAAA
  61  AAACTTAAAA ATTAGCCAGG CATGGTGACT GGTGTCTATA GCCCCACCTG CTCAGGAGGC
 121  TGAGGTGGGA GGACCACTTG AGCCCAGGAG TGTGAGGATG CAGTGAATGC CATGATCACA
 181  CCATACACTC CAGCCTGGGT GACAGAGTAA GGCCCTGTTA AAAAAAAAAA AAAAGCAGAG
 241  ACTCTAGTCT TAGACTGCTT GGGCTCAAAT CCCTGTCCCC TACTTACTAA CTTGTGATCT
 301  CGGGCAAGTT ACTTAATTCT CAGTGCCTCA GTTTGCTTAT CTGTGAAAGA CATAATGATA
 361  CTAGGTACCC ACTTTAAGGT GTTTGGAGAA TTAAGTGTGT TAATTTATGT AGCTTGCTCT
 421  GAATGTGCCT GGCACATGGT GAGCTCTCAG TACATATTCA CTGTTATTAT CCTTGGCCTT
 481  TGACAATCAA GATTACCACC AGCCCCCTTG GCTGGTGAAG TGAAACCAGT TGACAGTCAC
 541  CCCCCACCCC ACCTTTGTCA TACAAGCCTC AAAAGGCTGG AGTCTTGGCT CACTGCAGCT
 601  TCAGCCTCTG GAGCTCAAGT GATCCTCCTG CCTCACCCCG CAAGCAGCTG GGAGTACACA
 661  CATGTGCCAC CACGCCTGGC TATTTTTATT TTTTGTAGAG ATGGGGTTTC ACCATGCTGC
 721  CCAGGCTGGT CTCGAACTCC TCACCTTAGG CAACCCACCC ATCTTGGCCT CCCAAAGTGC
 781  TGGGATTACA GGCATGGGCC ACTGCACCCA GCTAACATGT TTGTAACATC TGATTTAAAG
 841  TCTTTATCCA GTAAGGTCAG TGTCAGCTTC CTCGGGCGCA GTTTGCATTG ATTGCTTTTT
 901  TTCCTCCCGT GTCTGGGCCA TGCTTCTTTG CATGTTTCAG AATTTTGTTA AAAGCTGGAC
 961  ATTTTAAGTA ACATAATGTG GCAACTGTGG AAATCATATT CTCCTCCCTC CCCATGGTGG
1021  TTCCTTTTTC TTGTTTAATG TCTTTTCTGA ACTAATTATG TAAAGTTGTG TTCTTTGTCA
1081  TGTGTGGCCA CTATAGTCTC TGCTTGATTA GCTTAGTGGT CCTCTAACCA TTAGATCTCC
1141  TTAATTGCCT GGAACCCGTA AGTCACTCAG CCAAGAGTTT ATAACTGCCT TAGACTTTAC
1201  TTCCTCATTC TGCAGAGGCT CAAGGTAGCC AGTGGTGAGA GCTTAGGGCT TTCTAGATCT
1261  TACCTGAGCA TGCACACAGC ACTGGGCATA AGCACATCCC TATGCATATG AATGGCCTTC
1321  TAGACTCCCA GGAGTACGTC ACAGCCTTTC AAAGCCCCCT GTAGCCATCT CATAGTAACA
1381  GAAAGCAGAT CAGTGGATGC CTGGGTCCAG TAGTAGCGGG ACGGTTGCAC AGGAAGTGAT
1441  GAAAATGTTC TGCAACTTCA CTGCGAGGGA GGTTACACAG GTACATACAT TTGTCACCTC
1501  ACGTTGAACT TTATACTTTA AACACAGTTT ATATATAAAT TATACCTCAA CAAAGCTGAT
1561  GTTTTTAAAG ATGTAGTTTA AAAACGAAAC AAAAAACGTG GTTTGCAGGA GACACCTTGC
1621  TCGTGATCCT CTAAAACACA GGTCTCCACT CAGATACCTG CAGGATGAGG ACAGGGTGGG
1681  CGAGGGAAAG GAGCCAGAGC CCTCCAGGGG TGTGAAGCAG CTTTTCCTGG GTGGGGCTTG
1741  GCGTGCTGCG CTCACTCTCC CTGGAGGAGG AAGTGCCTAA TCCAGTCCTC TGGGTCTGGG
1801  CCCAGGAGAT GGGGCCTTAA AGCCTCTCTT GGTAAAGACT AGCCCTGTGG GAACAAACAG
1861  GACACCCTCT CCTCTGATTC TGTATCTTCT AGGGGCTCCT ACTGTACTTC AGGGATACCT
1921  GACCTGAGTT GCAGTCACAT TAGCTCCTGG AAAGCCAGGA CAGCCCATGT TGAACCCCAC
1981  TTACTACTGC TGAGGACTGT GCGCCCTAAG GGGTTTGGGG CCTCTGCTCT TGCCACTGGC
2041  CTTGGAACAT GTGTGGCAGT TCTTCTGCCT CACCCTCACT CTGGGGCATG GCCCACTCTG
2101  CCAGGGCATC TGACATGTTC TTTGTCCCTG GCTCAGTTTG GGGGCAGCCC AGTGTCCTGC
2161  GCTGTGGGGC TGGCCGTCCT GAATGTCTTG GAGAAGGAGC AGCTCCAGGA TCATGCCACC
2221  AGTGTAGGCA GCTTCCTGAT GCAGCTCCTC GGGCAGCAAA AAATCAAACA TCCCATCGTC
2281  GGGGATGTCA GGGGTGTTGG GCTCTTCATT GGTGTGGATC TGATCAAAGA TGAGGCCACA
2341  AGGACACCAG CAACTGAAGA GGCTGCCTAC TTGGTATCAA GGCTGAAGGA GAACTACGTT
2401  TTGCTGAGCA CTGATGGCCC TGGGAGGAAC ATCCTGAAGT TTAAGCCCCC AATGTGCTTC
2461  AGCCTGGACA ATGCACGGCA GGTGGTGGCA AAGCTGGATG CCATTCTGAC TGACATGGAA
2521  GAGAAGGTGA GAAGTTGTGA AACGCTGAGG CTCCAGCCCT AAGCCAGCCC TGCTCTGCCT
2581  AAGTGTACTC CAGAAGAAAC TCATCTCATC CAAATACACG CTATTGAGAA GGCGAGCCTG
2641  ACCTCCCTCT TACAGATAAA GTCAGCTTTC AGAGGCTCAG GGTGGGGGGG CCTGCCCGAG
2701  GCCATAATGC TACCCACCCC CTCCTCCTAA CCACTGGTCT GTTGGAATAA CCCAGATGTC
2761  TGCATCCCCT CAAGTCAGTC AATTTCCTTT CTGTCCACTG GGGGTGGAAT GGGGTAGGGT
2821  GGGATACTTT AAAGTGCTCC TGCTTAAATA AATTAGACCA GACCAGTGTA TTTCTAAAGA
2881  AAATCCTGAC ATGCACACCC ATTAAAAATA GTACATTTTA CAGTGAAAAA AAAAAAAAAA
2941  AAA
B:氨基酸序列(SEQ ID NO:32)长度:107
 1  MQLLGQQKIK HPIVGDVRGV GLFIGVDLIK DEATRTPATE EAAYLVSRLK ENYVLLSTDG
61  PGRNILKFKP PMCFSLDNAR QVVAKLDAIL TDMEEKVRSC ETLRLQP
C.核苷酸及氨基酸组合序列(SEQ ID NO:33)克隆号:PP9286
起始编码子:2239 ATG  终止编码子:2560 TAA  蛋白质分子量:11923.31
   1  GCT GAA GGC TGC AAA TCT AAG ATC AGG GCA ACA TAA TGA GAC CTT GTC     48
  49  TCT ACC AAA AAA AAA CTT AAA AAT TAG CCA GGC ATG GTG ACT GGT GTC     96
  97  TAT AGC CCC ACC TGC TCA GGA GGC TGA GGT GGG AGG ACC ACT TGA GCC    144
 145  CAG GAG TGT GAG GAT GCA GTG AAT GCC ATG ATC ACA CCA TAC ACT CCA    192
 193  GCC TGG GTG ACA GAG TAA GGC CCT GTT AAA AAA AAA AAA AAA GCA GAG    240
 241  ACT CTA GTC TTA GAC TGC TTG GGC TCA AAT CCC TGT CCC CTA CTT ACT    288
 289  AAC TTG TGA TCT CGG GCA AGT TAC TTA ATT CTC AGT GCC TCA GTT TGC    336
 337  TTA TCT GTG AAA GAC ATA ATG ATA CTA GGT ACC CAC TTT AAG GTG TTT    384
 385  GGA GAA TTA AGT GTG TTA ATT TAT GTA GCT TGC TCT GAA TGT GCC TGG    432
 433  CAC ATG GTG AGC TCT CAG TAC ATA TTC ACT GTT ATT ATC CTT GGC CTT    480
 481  TGA CAA TCA AGA TTA CCA CCA GCC CCC TTG GCT GGT GAA GTG AAA CCA    528
 529  GTT GAC AGT CAC CCC CCA CCC CAC CTT TGT CAT ACA AGC CTC AAA AGG    576
 577  CTG GAG TCT TGG CTC ACT GCA GCT TCA GCC TCT GGA GCT CAA GTG ATC    624
 625  CTC CTG CCT CAC CCC GCA AGC AGC TGG GAG TAC ACA CAT GTG CCA CCA    672
 673  CGC CTG GCT ATT TTT ATT TTT TGT AGA GAT GGG GTT TCA CCA TGC TGC    720
 721  CCA GGC TGG TCT CGA ACT CCT CAC CTT AGG CAA CCC ACC CAT CTT GGC    768
 769  CTC CCA AAG TGC TGG GAT TAC AGG CAT GGG CCA CTG CAC CCA GCT AAC    816
 817  ATG TTT GTA ACA TCT GAT TTA AAG TCT TTA TCC AGT AAG GTC AGT GTC    864
 865  AGC TTC CTC GGG CGC AGT TTG CAT TGA TTG CTT TTT TTC CTC CCG TGT    912
 913  CTG GGC CAT GCT TCT TTG CAT GTT TCA GAA TTT TGT TAA AAG CTG GAC    960
 961  ATT TTA AGT AAC ATA ATG TGG CAA CTG TGG AAA TCA TAT TCT CCT CCC   1008
1009  TCC CCA TGG TGG TTC CTT TTT CTT GTT TAA TGT CTT TTC TGA ACT AAT   1056
1057  TAT GTA AAG TTG TGT TCT TTG TCA TGT GTG GCC ACT ATA GTC TCT GCT   1104
1105  TGA TTA GCT TAG TGG TCC TCT AAC CAT TAG ATC TCC TTA ATT GCC TGG   1152
1153  AAC CCG TAA GTC ACT CAG CCA AGA GTT TAT AAC TGC CTT AGA CTT TAC   1200
1201  TTC CTC ATT CTG CAG AGG CTC AAG GTA GCC AGT GGT GAG AGC TTA GGG   1248
1249  CTT TCT AGA TCT TAC CTG AGC ATG CAC ACA GCA CTG GGC ATA AGC ACA   1296
1297  TCC CTA TGC ATA TGA ATG GCC TTC TAG ACT CCC AGG AGT ACG TCA CAG   1344
1345  CCT TTC AAA GCC CCC TGT AGC CAT CTC ATA GTA ACA GAA AGC AGA TCA   1392
1393  GTG GAT GCC TGG GTC CAG TAG TAG CGG GAC GGT TGC ACA GGA AGT GAT   1440
1441  GAA AAT GTT CTG CAA CTT CAC TGC GAG GGA GGT TAC ACA GGT ACA TAC   1488
1489  ATT TGT CAC CTC ACG TTG AAC TTT ATA CTT TAA ACA CAG TTT ATA TAT   1536
1537  AAA TTA TAC CTC AAC AAA GCT GAT GTT TTT AAA GAT GTA GTT TAA AAA   1584
1585  CGA AAC AAA AAA CGT GGT TTG CAG GAG ACA CCT TGC TCG TGA TCC TCT   1632
1633  AAA ACA CAG GTC TCC ACT CAG ATA CCT GCA GGA TGA GGA CAG GGT GGG   1680
1681  CGA GGG AAA GGA GCC AGA GCC CTC CAG GGG TGT GAA GCA GCT TTT CCT   1728
1729  GGG TGG GGC TTG GCG TGC TGC GCT CAC TCT CCC TGG AGG AGG AAG TGC   1776
1777  CTA ATC CAG TCC TCT GGG TCT GGG CCC AGG AGA TGG GGC CTT AAA GCC   1824
1825  TCT CTT GGT AAA GAC TAG CCC TGT GGG AAC AAA CAG GAC ACC CTC TCC   1872
1873  TCT GAT TCT GTA TCT TCT AGG GGC TCC TAC TGT ACT TCA GGG ATA CCT   1920
1921  GAC CTG AGT TGC AGT CAC ATT AGC TCC TGG AAA GCC AGG ACA GCC CAT   1968
1969  GTT GAA CCC CAC TTA CTA CTG CTG AGG ACT GTG CGC CCT AAG GGG TTT   2016
2017  GGG GCC TCT GCT CTT GCC ACT GGC CTT GGA ACA TGT GTG GCA GTT CTT   2064
2065  CTG CCT CAC CCT CAC TCT GGG GCA TGG CCC ACT CTG CCA GGG CAT CTG   2112
2113  ACA TGT TCT TTG TCC CTG GCT CAG TTT GGG GGC AGC CCA GTG TCC TGC   2160
2161  GCT GTG GGG CTG GCC GTC CTG AAT GTC TTG GAG AAG GAG CAG CTC CAG   2208
2209  GAT CAT GCC ACC AGT GTA GGC AGC TTC CTG ATG CAG CTC CTC GGG CAG   2256
   1                                          Met Gln Leu Leu Gly Gln      6
2257  CAA AAA ATC AAA CAT CCC ATC GTC GGG GAT GTC AGG GGT GTT GGG CTC   2304
  7   Gln Lys Ile Lys His Pro Ile Val Gly Asp Val Arg Gly Val Gly Leu      22
2305  TTC ATT GGT GTG GAT CTG ATC AAA GAT GAG GCC ACA AGG ACA CCA GCA    2352
  23  Phe Ile Gly Val Asp Leu Ile Lys Asp Glu Ala Thr Arg Thr Pro Ala      38
2353  ACT GAA GAG GCT GCC TAC TTG GTA TCA AGG CTG AAG GAG AAC TAC GTT    2400
  39  Thr Glu Glu Ala Ala Tyr Leu Val Ser Arg Leu Lys Glu Asn Tyr Val      54
2401  TTG CTG AGC ACT GAT GGC CCT GGG AGG AAC ATC CTG AAG TTT AAG CCC    2448
  55  Leu Leu Ser Thr Asp Gly Pro Gly Arg Asn Ile Leu Lys Phe Lys Pro      70
2449  CCA ATG TGC TTC AGC CTG GAC AAT GCA CGG CAG GTG GTG GCA AAG CTG    2496
  71  Pro Met Cys Phe Ser Leu Asp Asn Ala Arg Gln Val Val Ala Lys Leu      86
2497  GAT GCC ATT CTG ACT GAC ATG GAA GAG AAG GTG AGA AGT TGT GAA ACG    2544
  87  Asp Ala Ile Leu Thr Asp Met Glu Glu Lys Val Arg Ser Cys Glu Thr     102
2545  CTG AGG CTC CAG CCC TAA GCC AGC CCT GCT CTG CCT AAG TGT ACT CCA    2592
 103  Leu Arg Leu Gln Pro ***                                             108
2593  GAA GAA ACT CAT CTC ATC CAA ATA CAC GCT ATT GAG AAG GCG AGC CTG    2640
2641  ACC TCC CTC TTA CAG ATA AAG TCA GCT TTC AGA GGC TCA GGG TGG GGG    2688
2689  GGC CTG CCC GAG GCC ATA ATG CTA CCC ACC CCC TCC TCC TAA CCA CTG    2736
2737  GTC TGT TGG AAT AAC CCA GAT GTC TGC ATC CCC TCA AGT CAG TCA ATT    2784
2785  TCC TTT CTG TCC ACT GGG GGT GGA ATG GGG TAG GGT GGG ATA CTT TAA    2832
2833  AGT GCT CCT GCT TAA ATA AAT TAG ACC AGA CCA GTG TAT TTC TAA AGA    2880
2881  AAA TCC TGA CAT GCA CAC CCA TTA AAA ATA GTA CAT TTT ACA GTG AAA    2928
2929  AAA AAA AAA AAA AAA                                                2943
12.PP9363
A:核苷酸序列(SEQ ID NO:34)长度:3503
   1  GGCCGGGAGC TCGGGAGTCG GCCGCCGCGC CGAGGTTCGC CCCGTTTTGC AGAGAGAGCC
  61  GAGTCGGGAC CTGGAAAGAC GTCCCCGCGG GGCTCCGGCC GCCGCGCCTC CCCGCCGGCG
 121  CCTGCCCTGC CCTGCCCGTC CCAGCCCCGC GGTTCGGGGC GTGCGGCCGG GACGCGCGGA
 181  GCCCCGGCCC TGACCCGCTG CGCCGGGACG GGACGCTCCT AACGCCGCCG TACCGGTCCG
 241  TGGTTGCAGG GTCGCTCCGC GCCTTTCCGT CAGTGAGGGT CGGAACCCCA GCTCCAGGGC
 301  TAGCGCAGTG TGGCCCCAGG CCCTCGCCTC CGGTGCACGG GACCCCGGAC CCCCCCAAGC
 361  CTCTGGCTTC ACGAGACCCC AACCTTCAGT TGGAACAGCT TGGAACAGCG CGAGCGCCCG
 421  GGAAGCCCTG GCCGGGTCGT GCGCTCCGTG AGGGGTCCTA GGCGGGCAGG ACAGTCGGAC
 481  CGAACCGCCG GGCTGGTGCC GCGAGCCCAG GCTGTCACCT TCGTCCCGCC TCAGGCGAGG
 541  GGTTCAGCGC CTGCCCCGAA GATAACACAG GGGTCCCCTT CTGTCCCGGC GGCCCGCGAG
 601  AGCCAAGGCT GCAGCTCTCC CAGTGAAGTG ATATCACTGC CTCTGTGGAC AAGACACCTC
 661  CAGGAGCCCA GCTCACAGCC ACCGGTACCT TCTTCCAGGA CAAGCTGGGG GCCTCCATGG
 721  GCGCCTGAGG GCCAGGCGCC AGGGCCGTGG GCACGAGTAT GGTGAGACAC CAGCCCCTGC
 781  AGTACTACGA GCCACAGCTG TGCCTCTCCT GCCTCACGGG CATCTACGGC TGCCGTTGGA
 841  AGCGCTACCA GCGCTCCCAT GATGATACCA CACCGTGGGA GCGCCTCTGG TTCCTGCTCC
 901  TCACCTTCAC CTTTGGCCTC ACGCTCACCT GGCTTTACTT CTGGTGGGAA GTCCACAATG
 961  ACTATGATGA ATTCAACTGG TACCTCTACA ACCGCATGGG CTACTGGAGC GACTGGCCCG
1021  TACCCATCCT TGTGACCACA GCTGCTGCCT TCGCATACAT CGCTGGCCTC CTGGTCCTGG
1081  CACTATGTCA CATTGCCGTG GGGCAGCAGA TGAACCTGCA CTGGCTGCAC AAGATCGGGC
1141  TGGTGGTCAT CCTGGCTTCC ACGGTGGTGG CCATGTCGGC CGTGGCCCAG CTGTGGGAGG
1201  ACGAGTGGGA GGTGCTGCTG ATCTCCCTGC AGGGCACAGC GCCATTCCTG CATGTGGGGG
1261  CTGTGGCAGC AGTCACCATG CTCTCCTGGA TCGTGGCAGG ACAGTTCGCC CGTGCAGAGC
1321  GGACCTCCTC CCAGGTGACC ATTCTCTGTA CCTTCTTCAC CGTGGTGTTT GCCCTCTACC
1381  TGGCCCCTCT CACCATCTCC TCTCCCTGCA TCATGGAGAA GAAAGACCTC GGCCCCAAGC
1441  CTGCTCTCAT TGGCCACCGC GGGGCCCCCA TGCTGGCTCC AGAGCACACG CTCATGTCCT
1501  TCCGGAAGGC CCTCGAGCAG AAGCTGTACG GGCTCCAGGC TGACATTACC ATCAGCCTGG
1561  ACGGCGTGCC CTTCCTCATG CATGACACCA CCCTGCGGCG CACCACCAAC GTGGAGGAGG
1621  AGTTCCCGGA GCTGGCCCGC AGGCCTGCCT CCATGCTTAA CTGGACCACC CTGCAGAGAC
1681  TCAACGCTGG CCAGTGGTTC CTGAAGACTG ACCCCTTCTG GACAGCCAGC TCCCTGTCAC
1741  CCTCCGACCA CAGAGAGGCC CAGAACCAGT CCATCTGCAG CCTGGCAGAG CTCCTGGAGC
1801  TGGCCAAGGG CAATGCCACA CTGCTGCTCA ACCTGCGTGA CCCGCCCCGG GAGCACCCCT
1861  ACCGCAGCAG TTTTATCAAC GTGACTCTGG AGGCCGTGCT GCACTCCGGC TTCCCCCAGC
1921  ACCAGGTCAT GTGGCTGCCT AGCAGGCAGA GGCCCCTGGT GCGGAAGGTG GCTCCCGGCT
1981  TCCAACAGAC ATCAGGCTCC AAGGAGGCAG TCGCCAGCCT GCGGAGAGGC CACATCCAGC
2041  GGCTGAACCT GCGCTACACT CAGGTGTCCC GCCAGGAGCT CAGGGACTAC GCGTCCTGGA
2101  ACCTGAGTGT GAACCTCTAC ACAGTCAACG CACCGTGGCT CTTCTCCCTG CTGTGGTGTG
2161  CGGGGGTCCC ATCCGTCACC TCTGACAACT CCCACACCCT GTCCCAGGTG CCTTCCCCCC
2221  TCTGGATCAT GCCCCCGGAC GAGTACTGTC TCATGTGGGT CACTGCCGAC CTGGTCTCCT
2281  TCACCCTCAT CGTGGGCATC TTCGTGCTCC AGAAGTGGCG CCTGGGTGGC ATACGGAGCT
2341  ACAACCCTGA GCAGATCATG CTGAGTGCTG CGGTGCGCCG GACCAGCCGG GACGTCAGCA
2401  TCATGAAGGA GAAGCTTATT TTCTCAGAGA TCAGCGATGG TGTAGAGGTC TCCGATGTGC
2461  TCTCCGTATG TTCAGACAAC AGTTATGACA CATATGCCAA CAGCACCGCC ACCCCTGTGG
2521  GCCCCCGAGG GGGTGGCAGC CACACCAAGA CCCTCATAGA GCGGAGTGGG CGTTAGCTGA
2581  AGACATGTCT GTCCCACCTG TACCTGACAC AGAAGCTGGG GAGCCTAGGA GAGCTGGTGG
2641  AAGTGTGTCT GAACTCGGAG TGCTCTGGGA GCGGGCTCCA CAGCCTCCTT GTGGGCTCCA
2701  GCCCCTTGTC AGCCGCAGCC TCTCTTGAGG GGGACTCCCT GTCTCCTGAG GCCCAGCTGG
2761  GCCAGGACTC CATCCTTTCA GATGCCCCTG CAGGCCTGGG GCTCCTTCTG GGAAGTATGG
2821  GGCCTAGGGC TTGGTCCCCC TCTTCTGAGG CCCTCTCCTG TATCCCGACC TGGAAGCTTT
2881  GATGGGTCAT GGGCCATGCC ATACCCCCTG TGGCAATGGA GTGTGTGGAT GCTCACCTGT
2941  GCCATCTGTC CTCCTGTCTG TGCCAGGAGG CACCTGAGTT CTCTGCTGTT ATCCTGCCCC
3001  AAGGGCCTGG GCCGAGCCTC TACCTGAAGC AACTCTGCTC TTCCTGTCAG TCTCAAAGCA
3061  CAAGGAGGTT CAGCCCAGGA GGAAGCCAGC TGCAATGTGG AGACACGTCC TCCTCCCCAA
3121  CCCACCTCAT GCCACCGCCA ACCCCCTGCC CCAGGAGCGG GCCTGAGCCA CGTCCCCTAG
3181  GAGCAGCTGG AGATGGCCAA AAGAGTGAGC TCAGGACTAC TGGATCCCAT GCCCAGGTGT
3241  CCAGCAGACC TCAAGGCAGA AGGGTCACCT AACCCAGGAG TCCACAGACT GATGTGACCT
3301  CAGGTTCCCA CATCAGTGGC CACAGGGCAG GGCCCACCTG GTAGAAGTGT TCTGGATATG
3361  GCCAGGGTGG GTGTGTGGCT AAGTGGGCCT GAACAGAGGG AACCTAGGGC CCTTGGCAAT
3421  GTGATTTAAA GCTGCCATCT TGCGGAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
3481  AAAAAAAAAA AAAAAAAAAA AAA
B:氨基酸序列(SEQ ID NO:35)长度:605
  1  MVRHQPLQYY EPQLCLSCLT GIYGCRWKRY QRSHDDTTPW ERLWFLLLTF TFGLTLTWLY
 61  FWWEVHNDYD EFNWYLYNRM GYWSDWPVPI LVTTAAAFAY IAGLLVLALC HIAVGQQMNL
121  HWLHKIGLVV ILASTVVAMS AVAQLWEDEW EVLLISLQGT APFLHVGAVA AVTMLSWIVA
181  GQFARAERTS SQVTILCTFF TVVFALYLAP LTISSPCIME KKDLGPKPAL IGHRGAPMLA
241  PEHTLMSFRK ALEQKLYGLQ ADITISLDGV PFLMHDTTLR RTTNVEEEFP ELARRPASML
301  NWTTLQRLNA GQWFLKTDPF WTASSLSPSD HREAQNQSIC SLAELLELAK GNATLLLNLR
361  DPPREHPYRS SFINVTLEAV LHSGFPQHQV MWLPSRQRPL VRKVAPGFQQ TSGSKEAVAS
421  LRRGHIQRLN LRYTQVSRQE LRDYASWNLS VNLYTVNAPW LFSLLWCAGV PSVTSDNSHT
481  LSQVPSPLWI MPPDEYCLMW VTADLVSFTL IVGIFVLQKW RLGGIRSYNP EQIMLSAAVR
541  RTSRDVSIMK EKLIFSEISD GVEVSDVLSV CSDNSYDTYA NSTATPVGPR GGGSHTKTLI
601  ERSGR
C.核苷酸及氨基酸组合序列(SEQ ID NO:36)克隆号:PP9363
起始编码子:759 ATG  终止编码子:2574 TAG  蛋白质分子量:68612.34
  1   GG CCG GGA GCT CGG GAG TCG GCC GCC GCG CCG AGG TTC GCC CCG TTT     47
 48  TGC AGA GAG AGC CGA GTC GGG ACC TGG AAA GAC GTC CCC GCG GGG CTC     95
 96  CGG CCG CCG CGC CTC CCC GCC GGC GCC TGC CCT GCC CTG CCC GTC CCA    143
144  GCC CCG CGG TTC GGG GCG TGC GGC CGG GAC GCG CGG AGC CCC GGC CCT    191
192  GAC CCG CTG CGC CGG GAC GGG ACG CTC CTA ACG CCG CCG TAC CGG TCC    239
240  GTG GTT GCA GGG TCG CTC CGC GCC TTT CCG TCA GTG AGG GTC GGA ACC    287
288  CCA GCT CCA GGG CTA GCG CAG TGT GGC CCC AGG CCC TCG CCT CCG GTG    335
336  CAC GGG ACC CCG GAC CCC CCC AAG CCT CTG GCT TCA CGA GAC CCC AAC    383
384  CTT CAG TTG GAA CAG CTT GGA ACA GCG CGA GCG CCC GGG AAG CCC TGG    431
432  CCG GGT CGT GCG CTC CGT GAG GGG TCC TAG GCG GGC AGG ACA GTC GGA    479
480  CCG AAC CGC CGG GCT GGT GCC GCG AGC CCA GGC TGT CAC CTT CGT CCC    527
528  GCC TCA GGC GAG GGG TTC AGC GCC TGC CCC GAA GAT AAC ACA GGG GTC    575
576  CCC TTC TGT CCC GGC GGC CCG CGA GAG CCA AGG CTG CAG CTC TCC CAG    623
624  TGA AGT GAT ATC ACT GCC TCT GTG GAC AAG ACA CCT CCA GGA GCC CAG    671
672  CTC ACA GCC ACC GGT ACC TTC TTC CAG GAC AAG CTG GGG GCC TCC ATG    719
 720  GGC GCC TGA GGG CCA GGC GCC AGG GCC GTG GGC ACG AGT ATG GTG AGA     767
   1                                                      Met Val Arg       3
 768  CAC CAG CCC CTG CAG TAC TAC GAG CCA CAG CTG TGC CTC TCC TGC CTC     815
   4  His Gln Pro Leu Gln Tyr Tyr Glu Pro Gln Leu Cys Leu Ser Cys Leu      19
 816  ACG GGC ATC TAC GGC TGC CGT TGG AAG CGC TAC CAG CGC TCC CAT GAT     863
  20  Thr Gly Ile Tyr Gly Cys Arg Trp Lys Arg Tyr Gln Arg Ser His Asp      35
 864  GAT ACC ACA CCG TGG GAG CGC CTC TGG TTC CTG CTC CTC ACC TTC ACC     911
  36  Asp Thr Thr Pro Trp Glu Arg Leu Trp Phe Leu Leu Leu Thr Phe Thr      51
 912  TTT GGC CTC ACG CTC ACC TGG CTT TAC TTC TGG TGG GAA GTC CAC AAT     959
  52  Phe Gly Leu Thr Leu Thr Trp Leu Tyr Phe Trp Trp Glu Val His Asn      67
 960  GAC TAT GAT GAA TTC AAC TGG TAC CTC TAC AAC CGC ATG GGC TAC TGG    1007
  68  Asp Tyr Asp Glu Phe Asn Trp Tyr Leu Tyr Asn Arg Met Gly Tyr Trp      83
1008  AGC GAC TGG CCC GTA CCC ATC CTT GTG ACC ACA GCT GCT GCC TTC GCA    1055
  84  Ser Asp Trp Pro Val Pro Ile Leu Val Thr Thr Ala Ala Ala Phe Ala      99
1056  TAC ATC GCT GGC CTC CTG GTC CTG GCA CTA TGT CAC ATT GCC GTG GGG    1103
 100  Tyr Ile Ala Gly Leu Leu Val Leu Ala Leu Cys His Ile Ala yal Gly     115
1104  CAG CAG ATG AAC CTG CAC TGG CTG CAC AAG ATC GGG CTG GTG GTC ATC    1151
 116  Gln Gln Met Asn Leu His Trp Leu His Lys Ile Gly Leu Val Val Ile     131
1152  CTG GCT TCC ACG GTG GTG GCC ATG TCG GCC GTG GCC CAG CTG TGG GAG    1199
 132  Leu Ala Ser Thr Val Val Ala Met Ser Ala Val Ala Gln Leu Trp Glu     147
1200  GAC GAG TGG GAG GTG CTG CTG ATC TCC CTG CAG GGC ACA GCG CCA TTC    1247
 148  Asp Glu Trp Glu Val Leu Leu Ile Ser Leu Gln Gly Thr Ala Pro Phe     163
1248  CTG CAT GTG GGG GCT GTG GCA GCA GTC ACC ATG CTC TCC TGG ATC GTG    1295
 164  Leu His Val Gly Ala Val Ala Ala Val Thr Met Leu Ser Trp Ile Val     179
1296  GCA GGA CAG TTC GCC CGT GCA GAG CGG ACC TCC TCC CAG GTG ACC ATT    1343
 180  Ala Gly Gln Phe Ala Arg Ala Glu Arg Thr Ser Ser Gln Val Thr Ile     195
1344  CTC TGT ACC TTC TTC ACC GTG GTG TTT GCC CTC TAC CTG GCC CCT CTC    1391
 196  Leu Cys Thr Phe Phe Thr Val Val Phe Ala Leu Tyr Leu Ala Pro Leu     211
1392  ACC ATC TCC TCT CCC TGC ATC ATG GAG AAG AAA GAC CTC GGC CCC AAG    1439
 212  Thr Ile Ser Ser Pro Cys Ile Met Glu Lys Lys Asp Leu Gly Pro Lys     227
1440  CCT GCT CTC ATT GGC CAC CGC GGG GCC CCC ATG CTG GCT CCA GAG CAC    1487
 228  Pro Ala Leu Ile Gly His Arg Gly Ala Pro Met Leu Ala Pro Glu His     243
1488  ACG CTC ATG TCC TTC CGG AAG GCC CTC GAG CAG AAG CTG TAC GGG CTC    1535
 244  Thr Leu Met Ser Phe Arg Lys Ala Leu Glu Gln Lys Leu Tyr Gly Leu     259
1536  CAG GCT GAC ATT ACC ATC AGC CTG GAC GGC GTG CCC TTC CTC ATG CAT    1583
 260  Gln Ala Asp Ile Thr Ile Ser Leu Asp Gly Val Pro Phe Leu Met His     275
1584  GAC ACC ACC CTG CGG CGC ACC ACC AAC GTG GAG GAG GAG TTC CCG GAG    1631
 276  Asp Thr Thr Leu Arg Arg Thr Thr Asn Val Glu Glu Glu Phe Pro Glu     291
1632  CTG GCC CGC AGG CCT GCC TCC ATG CTT AAC TGG ACC ACC CTG CAG AGA    1679
 292  Leu Ala Arg Arg Pro Ala Ser Met Leu Asn Trp Thr Thr Leu Gln Arg     307
1680  CTC AAC GCT GGC CAG TGG TTC CTG AAG ACT GAC CCC TTC TGG ACA GCC    1727
 308  Leu Asn Ala Gly Gln Trp Phe Leu Lys Thr Asp Pro Phe Trp Thr Ala     323
1728  AGC TCC CTG TCA CCC TCC GAC CAC AGA GAG GCC CAG AAC CAG TCC ATC    1775
 324  Ser Ser Leu Ser Pro Ser Asp His Arg Glu Ala Gln Asn Gln Ser Ile     339
1776  TGC AGC CTG GCA GAG CTC CTG GAG CTG GCC AAG GGC AAT GCC ACA CTG    1823
 340  Cys Ser Leu Ala Glu Leu Leu Glu Leu Ala Lys Gly Asn Ala Thr Leu     355
1824  CTG CTC AAC CTG CGT GAC CCG CCC CGG GAG CAC CCC TAC CGC AGC AGT    1871
 356  Leu Leu Asn Leu Arg Asp Pro Pro Arg Glu His Pro Tyr Arg Ser Ser     371
1872  TTT ATC AAC GTG ACT CTG GAG GCC GTG CTG CAC TCC GGC TTC CCC CAG    1919
 372  Phe Ile Asn Val Thr Leu Glu Ala Val Leu His Ser Gly Phe Pro Gln     387
1920  CAC CAG GTC ATG TGG CTG CCT AGC AGG CAG AGG CCC CTG GTG CGG AAG    1967
 388  His Gln Val Met Trp Leu Pro Ser Arg Gln Arg Pro Leu Val Arg Lys     403
1968  GTG GCT CCC GGC TTC CAA CAG ACA TCA GGC TCC AAG GAG GCA GTC GCC    2015
 404  Val Ala Pro Gly Phe Gln Gln Thr Ser Gly Ser Lys Glu Ala Val Ala     419
2016  AGC CTG CGG AGA GGC CAC ATC CAG CGG CTG AAC CTG CGC TAC ACT CAG    2063
 420  Ser Leu Arg Arg Gly His Ile Gln Arg Leu Asn Leu Arg Tyr Thr Gln     435
2064  GTG TCC CGC CAG GAG CTC AGG GAC TAC GCG TCC TGG AAC CTG AGT GTG    2111
 436  Val Ser Arg Gln Glu Leu Arg Asp Tyr Ala Ser Trp Asn Leu Ser Val     451
2112  AAC CTC TAC ACA GTC AAC GCA CCG TGG CTC TTC TCC CTG CTG TGG TGT    2159
 452  Asn Leu Tyr Thr Val Asn Ala Pro Trp Leu Phe Ser Leu Leu Trp Cys     467
2160  GCG GGG GTC CCA TCC GTC ACC TCT GAC AAC TCC CAC ACC CTG TCC CAG    2207
 468  Ala Gly Val Pro Ser Val Thr Ser Asp Asn Ser His Thr Leu Ser Gln     483
2208  GTG CCT TCC CCC CTC TGG ATC ATG CCC CCG GAC GAG TAC TGT CTC ATG    2255
 484  Val Pro Ser Pro Leu Trp Ile Met Pro Pro Asp Glu Tyr Cys Leu Met     499
2256  TGG GTC ACT GCC GAC CTG GTC TCC TTC ACC CTC ATC GTG GGC ATC TTC    2303
 500  Trp Val Thr Ala Asp Leu Val Ser Phe Thr Leu Ile Val Gly Ile Phe     515
2304  GTG CTC CAG AAG TGG CGC CTG GGT GGC ATA CGG AGC TAC AAC CCT GAG    2351
 516  Val Leu Gln Lys Trp Arg Leu Gly Gly Ile Arg Ser Tyr Asn Pro Glu     531
2352  CAG ATC ATG CTG AGT GCT GCG GTG CGC CGG ACC AGC CGG GAC GTC AGC    2399
 532  Gln Ile Met Leu Ser Ala Ala Val Arg Arg Thr Ser Arg Asp Val Ser     547
2400  ATC ATG AAG GAG AAG CTT ATT TTC TCA GAG ATC AGC GAT GGT GTA GAG    2447
 548  Ile Met Lys Glu Lys Leu Ile Phe Ser Glu Ile Ser Asp Gly Val Glu     563
2448  GTC TCC GAT GTG CTC TCC GTA TGT TCA GAC AAC AGT TAT GAC ACA TAT    2495
 564  Val Ser Asp Val Leu Ser Val Cys Ser Asp Asn Ser Tyr Asp Thr Tyr     579
2496  GCC AAC AGC ACC GCC ACC CCT GTG GGC CCC CGA GGG GGT GGC AGC CAC    2543
 580  Ala Asn Ser Thr Ala Thr Pro Val Gly Pro Arg Gly Gly Gly Ser His     595
2544  ACC AAG ACC CTC ATA GAG CGG AGT GGG CGT TAG CTG AAG ACA TGT CTG    2591
 596  Thr Lys Thr Leu Ile Glu Arg Ser Gly Arg ***                         606
2592  TCC CAC CTG TAC CTG ACA CAG AAG CTG GGG AGC CTA GGA GAG CTG GTG    2639
2640  GAA GTG TGT CTG AAC TCG GAG TGC TCT GGG AGC GGG CTC CAC AGC CTC    2687
2688  CTT GTG GGC TCC AGC CCC TTG TCA GCC GCA GCC TCT CTT GAG GGG GAC    2735
2736  TCC CTG TCT CCT GAG GCC CAG CTG GGC CAG GAC TCC ATC CTT TCA GAT    2783
2784  GCC CCT GCA GGC CTG GGG CTC CTT CTG GGA AGT ATG GGG CCT AGG GCT    2831
2832  TGG TCC CCC TCT TCT GAG GCC CTC TCC TGT ATC CCG ACC TGG AAG CTT    2879
2880  TGA TGG GTC ATG GGC CAT GCC ATA CCC CCT GTG GCA ATG GAG TGT GTG    2927
2928  GAT GCT CAC CTG TGC CAT CTG TCC TCC TGT CTG TGC CAG GAG GCA CCT    2975
2976  GAG TTC TCT GCT GTT ATC CTG CCC CAA GGG CCT GGG CCG AGC CTC TAC    3023
3024  CTG AAG CAA CTC TGC TCT TCC TGT CAG TCT CAA AGC ACA AGG AGG TTC    3071
3072  AGC CCA GGA GGA AGC CAG CTG CAA TGT GGA GAC ACG TCC TCC TCC CCA    3119
3120  ACC CAC CTC ATG CCA CCG CCA ACC CCC TGC CCC AGG AGC GGG CCT GAG    3167
3168  CCA CGT CCC CTA GGA GCA GCT GGA GAT GGC CAA AAG AGT GAG CTC AGG    3215
3216  ACT ACT GGA TCC CAT GCC CAG GTG TCC AGC AGA CCT CAA GGC AGA AGG    3263
3264  GTC ACC TAA CCC AGG AGT CCA CAG ACT GAT GTG ACC TCA GGT TCC CAC    3311
3312  ATC AGT GGC CAC AGG GCA GGG CCC ACC TGG TAG AAG TGT TCT GGA TAT    3359
3360  GGC CAG GGT GGG TGT GTG GCT AAG TGG GCC TGA ACA GAG GGA ACC TAG    3407
3408  GGC CCT TGG CAA TGT GAT TTA AAG CTG CCA TCT TGC GGA AAA AAA AAA    3455
3456  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    3503

Claims (10)

1.一种分离的具有抑癌功能的人蛋白多肽,其特征在于,它是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
2.如权利要求1所述的多肽,其特征在于,该多肽的氨基酸序列选自下组:SEQ ID NO:2、5、32、35。
3.一种分离的多核苷酸,其特征在于,选自下组:
(a)编码如权利要求1所述多肽的多核苷酸;
(b)与多核苷酸(a)完全互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求6所述的载体转化或转导的宿主细胞;
(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有抑癌功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含:
(a)在适合表达具有抑癌功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;
(b)从培养物中分离出具有抑癌功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有抑癌功能的人蛋白多肽特异性结合的抗体。
10.一种药物组合物,其特征在于,它含有安全有效量的权利要求1所述的多肽以及药学上可接受的载体。
CNB011053127A 2001-02-08 2001-02-08 具有抑癌功能的新的人蛋白及其编码序列 Expired - Fee Related CN1205225C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB011053127A CN1205225C (zh) 2001-02-08 2001-02-08 具有抑癌功能的新的人蛋白及其编码序列

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB011053127A CN1205225C (zh) 2001-02-08 2001-02-08 具有抑癌功能的新的人蛋白及其编码序列

Publications (2)

Publication Number Publication Date
CN1368511A CN1368511A (zh) 2002-09-11
CN1205225C true CN1205225C (zh) 2005-06-08

Family

ID=4654395

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB011053127A Expired - Fee Related CN1205225C (zh) 2001-02-08 2001-02-08 具有抑癌功能的新的人蛋白及其编码序列

Country Status (1)

Country Link
CN (1) CN1205225C (zh)

Also Published As

Publication number Publication date
CN1368511A (zh) 2002-09-11

Similar Documents

Publication Publication Date Title
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1169954C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1205225C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1177049C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1177048C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199998C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1177050C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1177864C (zh) 在肝癌组织中具有表达差异的新的人蛋白及其编码序列
CN1169831C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1932016A (zh) 影响sre活性的多核苷酸及其编码多肽和用途
CN1209373C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1230445C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1194989C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1169955C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1155615C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1231496C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1199997C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1169833C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1199996C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1199994C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1222616C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1169956C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1194010C (zh) 具有抑制癌细胞生长功能的人蛋白及基编码序列
CN1169958C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1209370C (zh) 具有抑癌功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee