CN1209373C

CN1209373C - 具有抑制癌细胞生长功能的新的人蛋白及其编码序列

Info

Publication number: CN1209373C
Application number: CNB011053119A
Authority: CN
Inventors: 顾健人
Original assignee: Shanghai Cancer Institute
Current assignee: Shanghai Cancer Institute
Priority date: 2001-02-08
Filing date: 2001-02-08
Publication date: 2005-07-06
Anticipated expiration: 2021-02-08
Also published as: CN1368510A

Abstract

本发明公开了一类新的具有抑癌功能的人蛋白，编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。

Description

具有抑制癌细胞生长功能的新的人蛋白及其编码序列

技术领域

本发明属于生物技术领域，具体地说，本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸和此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。

背景技术

人基因组学研究目前是国际上的热点，除人染色体DNA大规模测序，表达序列测序(EST)的方法外，还缺少从功能开始的筛选具有功能基因的高通量的方法。

癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤，目前人们已越来越关注肿瘤的基因治疗。因此，本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。

发明内容

本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。

本发明的另一目的是提供编码这些多肽的多核苷酸。

本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。

在本发明的第一方面，提供新颖的分离出的具有抑癌功能的蛋白多肽，它包含具有选自下组的氨基酸序列的多肽：SEQ ID NO：2、5、8、11、14、17、20、23、26、29、32、35；或其保守性变异多肽、或其活性片段、或其活性衍生物。

较佳地，该多肽是具有选自下组的氨基酸序列的多肽：SEQ ID NO：2、5、8、11、14、17、20、23、26、29、32、35。

在本发明的第二方面，提供了一种分离的多核苷酸，它包含一核苷酸序列，该核苷酸序列与选自下组的一种核苷酸序列有至少85％相同性：(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸；(b)与多核苷酸(a)互补的多核苷酸。较佳地，该多核苷酸编码的多肽具有选自下组的氨基酸序列：SEQ ID NO：2、5、8、11、14、17、20、23、26、29、32、35。更佳地，该多核苷酸的序列选自下组：SEQ ID NO：3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。

在本发明的第三方面，提供了含有上述多核苷酸的载体，以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。

在本发明的第四方面，提供了制备具有抑癌功能的蛋白活性的多肽的制备方法，该方法包含：(a)在适合表达具有抑癌功能的蛋白的条件下，培养上述被转化或转导的宿主细胞；(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。

在本发明的第五方面，提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子，它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸，较佳地它含有连续的约10-800个核苷酸。

在本发明的第六方面，提供了一种药物组合物，它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。

本发明的其它方面由于本文的公开内容，对本领域的技术人员而言是显而易见的。

本发明采用大规模cDNA克隆转染癌细胞，在获得具有抑癌作用的基础上，经测序证明为新的基因，进一步得到全长cDNA克隆。DNA转染试验证明，本发明的具有抑癌功能的蛋白对癌细胞(肝癌细胞)具有抑制克隆形成的作用，其抑制率在50％或50％以上。

如本文所用，“分离的”是指物质从其原始环境中分离出来(如果是天然的物质，原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的，但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开，则为分离纯化的。

如本文所用，“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。

本发明的多肽可以是重组多肽、天然多肽、合成多肽，优选重组多肽。本发明的多肽可以是天然纯化的产物，或是化学合成的产物，或使用重组技术从原核或真核宿主(例如，细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主，本发明的多肽可以是糖基化的，或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。

本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用，术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽，而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的，或(ii)在一个或多个氨基酸残基中具有取代基团的多肽，或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物，例如聚乙二醇)融合所形成的多肽，或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导，这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。

本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP579蛋白(在本申请中，蛋白质的命名采用其克隆编号)为例，编码成熟多肽的编码区序列可以与SEQ ID NO：3所示的编码区序列相同或者是简并的变异体。如本文所用，“简并的变异体”在本发明中是指编码具有SEQ ID NO：2的蛋白质，但与SEQ ID NO：3所示的编码区序列有差别的核酸序列。再以PP730蛋白(在本申请中，蛋白质的命名采用其克隆编号)为例，编码成熟多肽的编码区序列可以与SEQ ID NO：6所示的编码区序列相同或者是简并的变异体。如本文所用，“简并的变异体”在本发明中是指编码具有SEQ ID NO：5的蛋白质，但与SEQ ID NO：6所示的编码区序列有差别的核酸序列。对于其他具有抑癌功能的蛋白，可依此类推。

编码成熟多肽的多核苷酸包括：只编码成熟多肽的编码序列；成熟多肽的编码序列和各种附加编码序列；成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。

术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸，也可以是还包括附加编码和/或非编码序列的多核苷酸。

本发明还涉及上述多核苷酸的变异体，其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的，等位变异体是一个多核苷酸的替换形式，它可能是一个或多个核苷酸的取代、缺失或插入，但不会从实质上改变其编码的多肽的功能。

本发明还涉及与上述的序列杂交且两个序列之间具有至少50％，较佳地至少70％，更佳地至少80％相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中，“严格条件”是指：(1)在较低离子强度和较高温度下的杂交和洗脱，如0.2×SSC，0.1％SDS，60℃；或(2)杂交时加有变性剂，如50％(v/v)甲酰胺，0.1％小牛血清/0.1％Ficoll，42℃等；或(3)仅在两条序列之间的相同性至少在95％以上，更好是97％以上时才发生杂交。并且，可杂交的多核苷酸编码的多肽与SEQ ID NO：2所示的成熟多肽有相同的生物学功能(以PP579蛋白为例)和活性。

本发明还涉及与上述的序列杂交的核酸片段。如本文所用，“核酸片段”的长度至少含15个核苷酸，较好是至少30个核苷酸，更好是至少50个核苷酸，最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。

本发明中的多肽和多核苷酸优选以分离的形式提供，更佳地被纯化至均质。

本发明的DNA序列能用几种方法获得。例如，用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于：1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列，和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。

编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得：1)从基因组DNA分离双链DNA序列；2)化学合成DNA序列以获得所需多肽的双链DNA。

上述提到的方法中，分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时，DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时，DNA序列的直接化学合成是不可能的，选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录，形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术，试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook，et al.，Molecular Cloning，A Laboratory Manual，Cold Spring Harbor Laboratory.New York，1989)。还可得到商业供应的cDNA文库，如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时，即使极少的表达产物也能克隆。

可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于)：(1)DNA-DNA或DNA-RNA杂交；(2)标志基因的功能出现或丧失；(3)测定具有抑癌功能的蛋白的转录本的水平；(4)通过免疫学技术或测定生物学活性，来检测基因表达的蛋白产物。上述方法可单用，也可多种方法联合应用。

在第(1)种方法中，杂交所用的探针是与本发明的多核苷酸的任何一部分同源，其长度至少15个核苷酸，较好是至少30个核苷酸，更好是至少50个核苷酸，最好是至少100个核苷酸。此外，探针的长度通常在2kb之内，较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素，荧光素或酶(如碱性磷酸酶)等。

在第(4)种方法中，检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法，放射免疫沉淀法，酶联免疫吸附法(ELISA)等。

应用PCR技术扩增DNA/RNA的方法(Saiki，et al.Science 1985；230：1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时，可优选使用RACE法(RACE-cDNA末端快速扩增法)，用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择，并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。

如上所述得到的本发明的基因，或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS，1977，74：5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列，测序需反复进行。有时需要测定多个克隆的cDNA序列，才能拼接成全长的cDNA序列。

本发明也涉及包含本发明的多核苷酸的载体，以及用本发明的载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞，以及经重组技术产生本发明所述多肽的方法。

通过常规的重组DNA技术(Science，1984；224：1431)，可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽。一般来说有以下步骤：

(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体)，或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞；

(2).在合适的培养基中培养的宿主细胞；

(3).从培养基或细胞中分离、纯化蛋白质。

本发明中，具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于：在细菌中表达的基于T7的表达载体(Rosenberg，et al.Gene，1987，56：125)；在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans，J Bio Chem.263：3521，1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之，只要能在宿主体内复制和稳定，任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。

本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook，et al.)。所述的DNA序列可有效连接到表达载体中的适当启动子上，以指导mRNA合成。这些启动子的代表性例子有：大肠杆菌的lac或trp启动子；λ噬菌体P_L启动子；真核启动子包括CMV立即早期启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。

此外，表达载体优选地包含一个或多个选择性标记基因，以提供用于选择转化的宿主细胞的表型性状，如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP)，或用于大肠杆菌的四环素或氨苄青霉素抗性。

包含上述的适当DNA序列以及适当启动子或者控制序列的载体，可以用于转化适当的宿主细胞，以使其能够表达蛋白质。

宿主细胞可以是原核细胞，如细菌细胞；或是低等真核细胞，如酵母细胞；或是高等真核细胞，如哺乳动物细胞。代表性例子有：大肠杆菌，链霉菌属；鼠伤寒沙门氏菌的细菌细胞；真菌细胞如酵母；植物细胞；果蝇S2或Sf9的昆虫细胞；CHO、COS或Bowes黑素瘤细胞的动物细胞等。

本发明的多核苷酸在高等真核细胞中表达时，如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子，通常大约有10到300个碱基对，作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。

本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。

用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时，能吸收DNA的感受态细胞可在指数生长期后收获，用CaCl₂法处理，所用的步骤在本领域众所周知。可供选择的是用MgCl₂。如果需要，转化也可用电穿孔的方法进行。当宿主是真核生物，可选用如下的DNA转染方法：磷酸钙共沉淀法，常规机械方法如显微注射、电穿孔、脂质体包装等。

获得的转化子可以用常规方法培养，表达本发明的基因所编码的多肽。根据所用的宿主细胞，培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后，用合适的方法(如温度转换或化学诱导)诱导选择的启动子，将细胞再培养一段时间。

在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要，可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于：常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。

重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于)：直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病，和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如，抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。

本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能，而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如，能在药物的存在下，将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。

具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能，或是抑制具有抑癌功能的人蛋白的产生，或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。

在筛选作为拮抗剂的化合物时，可以将本发明蛋白加入生物分析测定中，通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法，可以筛选出起拮抗剂作用的受体缺失物和类似物。

本发明的多肽可直接用于疾病治疗，例如，各种恶性肿瘤、和细胞异常增殖等。

本发明的多肽，及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术，三瘤技术，人B-细胞杂交瘤技术，EBV-杂交瘤技术等。

可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。

本发明还提供含有一种或多种容器的药盒或试剂盒，容器中装有一种或多种本发明的药用组合物成分。与这些容器一起，可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示，该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外，本发明的多肽可以与其它的治疗化合物结合使用。

药物组合物可以以方便的方式给药，如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素，如给药方式、待治疗者的健康条件和诊断医生的判断。

具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook，et al.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。

抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子，其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得，如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性，可用多种方法对其进行修饰，如增加两侧的序列长度，核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。

多聚核苷酸导入组织或细胞内的方法包括：将多聚核苷酸直接注入到体内组织中；或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中，再将细胞移植到体内等。

本发明的多肽还可用作肽谱分析，例如，多肽可用物理的、化学或酶进行特异性切割，并进行一维或二维或三维的凝胶电泳分析。

本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于)：多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。这些抗体可用常规方法制备。抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中，检测活检标本中的具有抑癌功能的人蛋白。

与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记，注入体内可跟踪其位置和分布。本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。

抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素，蓖麻蛋白，红豆碱等)共价结合。

多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物，如家兔，小鼠，大鼠等。多种佐剂可用于增强免疫反应，包括但不限于弗氏佐剂等。

具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature，1975，256：495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al，PNAS，1985，81：6851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。

能与本发明蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时，必须对具有抑癌功能的人蛋白分子进行标记。

本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的，且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平，可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。

具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面，具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法，Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术，相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上，用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。

检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外，突变有可能影响蛋白的表达，因此用Northern印迹法、Western印迹法可间接判断基因有无突变。

本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前，需要鉴定染色体上的各基因的具体位点。然而现在只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。

简而言之，根据cDNA制备PCR引物(优选15-35bp)，可以将序列定位于染色体上。然后，将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。

体细胞杂合细胞的PCR定位法，是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物，通过类似方法，可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选，从而构建染色体特异的cDNA库。

将cDNA克隆与中期染色体进行荧光原位杂交(FISH)，可以在一个步骤中精确地进行染色体定位。此技术的综述，参见Verma等，Human Chromosomes：a Manual of BasicTechniques，Pergamon Press，New York(1988)。

一旦序列被定位到准确的染色体位置，此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如，V.Mckusick，Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析，确定基因与业已定位到染色体区域上的疾病之间的关系。

接着，需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变，而该突变在任何正常个体中未观察到，则该突变可能是疾病的病因。比较患病和未患病个体，通常涉及首先寻找染色体中结构的变化，如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。

本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法，可根据本发明所公开的有关核苷酸序列，尤其是开放阅读框序列来设计引物，并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板，扩增而得有关序列。当序列较长时，常常需要进行两次或多次PCR扩增，然后再将各次扩增出的片段按正确次序拼接在一起。

一旦获得了有关的序列，就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体，再转入细胞，然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。

此外，还可用人工合成的方法来合成有关序列，尤其是片段长度较短时。通常，通过先合成多个小片段，然后再进行连接可获得序列很长的片段。

目前，已经可以完全通过化学合成来编码本发明蛋白(或其片段，或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外，还可通过化学合成将突变引入本发明蛋白序列中。

此外，由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列，因此，与来源于其他物种的同族蛋白相比，预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件如Sambrook等人，分子克隆：实验室手册(New York：Cold Spring Harbor Laboratory Press，1989)中所述的条件，或按照制造厂商所建议的条件。

具体实施方式

实施例1：cDNA基因的获得及对癌细胞克隆形成的抑制作用

PP579、PP730、PP791、PP1494、PP2386、PP6170、PP7684、PP7704、PP8407、PP8961、PP8985和PP9003是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织，用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA，用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXRcDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL)，反转录反应在42℃进行。转化XL 10-Gold感受细胞，获得了1×10⁶cfu/μg cDNA滴度的cDNA文库。第一轮随机挑取cDNA克隆，其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针，杂交筛选cDNA文库，挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒，按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系7721。100ng DNA酒精沉淀干燥后，加6μl H₂O溶解，待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液，混匀后，室温放置10分钟。每管中加150μl无血清培液，均分加入3孔生长于96孔板的7721细胞中，37℃放置2小时，每孔再加50μl无血清培液，37℃ 24小时。每孔换100μl全培液，37℃ 24小时，换含G418的全培液100μl，37℃ 24～48小时，边观察，边换G418浓度不等的培液。约2～3次后，直到镜检细胞有克隆形成，计数。发现以上克隆有抑制细胞克隆形成作用，结果如下表所示。

cDNA克隆转染细胞(7721)克隆形成情况

cDNA克隆名称

cDNA克隆数(三个重复)

空载体克隆数(三个重复)

PP579PP730PP791PP1494PP2386PP6170PP7684PP7704PP8407PP8961PP8985PP9003

0 0 19 7 60 1 07 2 38 3 55 4 65 4 716 18 198 12 1411 9 1210 8 1117 16 18

37 38 4237 38 4237 38 4237 38 4223 28 2523 28 2523 28 2523 28 2523 28 2523 28 2523 28 2523 28 25

对cDNA克隆采用双脱氧终止法，在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后，确定为新基因克隆，进行另一端测序，仍未获得全长cDNA序列，设计引物，再次进行测序，直到获得全长序列(SEQ ID NO：1、4、7、10、13、16、19、22、25、28、31、34)。

实施例2：从胎盘cDNA中PCR获得全长基因：

取3、6、10月龄的胎盘组织，用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA，用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL)，反转录酶在42℃进行反转录反应，获得胎盘cDNA。利用各个基因的转异引物(如下表所示)，按97℃ 3′1个循环。94℃ 30″，60℃ 30″，72℃ 1′，35个循环，72℃ 10′1个循环进行PCR扩增，获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证，与实施例1测得的序列相符，随后用常规技术将扩增产物转入宿主细胞，获得重组蛋白(SEQ ID NO：2、5、8、11、14、17、20、23、26、29、32、35)。

基因特异引物

克隆名称	特异引物1(5′→3′)	特异引物2(5′→3′)
克隆名称	特异引物1(5′→3′)	特异引物2(5′→3′)	PP579PP730PP791PP1494PP2386PP6170PP7684PP7704PP8407PP8961	TCTGCAGTTTTCTCGTGGTGTCCCATGACTTGACTCTGGACGTGTACTGGTTCTGCCTGTCGGGCTTTTAGGACACACTCCACGTCTGTCGCGTTATGAGTACTTTGAGCTGGAGGTGCGCATCCATTCTCCACGGATTCGCGTCTGTTTCCTTCGATTCAGCTCCTGTGGAAGTTGCTCAGCTACAGGGCTCTCATCCA	GGAGGGAAAGGTGTCTTCCTTTCAGCGATGTGTTTGGTGTTTGCAGCCCAGTCACAGTAGTCATCAGTGCTTTGACTGCCGGCTGTACAGGCTGAAGGATGCGTCCTGTTCCAATGACTTATAGGAGATGGTGTCCGGTGTCAATCATTGGTTTCGGGATTGAAGCACACTATGTTCTGGAAGGTGCTCATGACGCAAAGGT

PP8985PP9003

GGTCGGGTGCACTGGTAGTTCTGTTACACAGGGCGGAT

CTCAGAGGCACTCTGGTGGCCTCCAGTTTGGCAACATCT

实施例3：cDNA克隆序列分析

1.PP579

A：核苷酸序列(SEQ ID NO：1)长度：2435

1 GGCAGTTCCC GGGTCCCTCG GCCACCGAAG CCACCCTGCC CTGGTGAAAG GGCTCCCGCA

61 CCGCCCGGTG CTCCCCATCT GCCTGGCGTT GTGCGCAGAG CTGGAAAGCA TGGCTGTTAT

121 AAATGAATTC TGATTTTGGG GAGCAGATGC CAACTTAGAG CCTCGTACCA ATCTCTCTGT

181 CTTTAAAAGA TGAGGTGACT TGGTGATTTT CCTGGAAAAT TATAGGTGCC CAGCTAAGAC

241 CTGAATGCCA TCACCCTCCC CAGGGCTCTG CAGTTTTCTC GTGGTGAACC CTTGATGGAT

301 TTGTTGTTGC TTGAGAAATG GCGATGATCG AATTGGGGTT TGGAAGACAG AATTTTCATC

361 CATTAAAGAG GAAGAGTTCA TTGCTGTTGA AACTCATAGC TGTTGTCTTT GCTGTGCTTC

421 TATTTTGTGA ATTTTTAATC TATTACTTAG CGATCTTTCA GTGTAATTGG CCTGAAGTGA

481 AAACCACAGC CTCTGATGGT GAACAGACCA CACGTGAGCC TGTGCTCAAA GCCATGTTTT

541 TGGCTGACAC CCATTTGCTT GGGGAATTCC TAGGCCACTG GCTGGACAAA TTACGAAGGG

601 AATGGCGGAT GGAGAGAGCG TTCCAGACAG CTCTGTGGTT GCTGCAGCCG GAAGTCGTCT

661 TCATCCTGGG GGATATCTTT GATGAAGGGA AGTGGAGCAC CCCTGAGGCC TGGGCGCATG

721 ATGTGGAGCG GTTTCAGAAA ATGTTCAGAC ACCCAAGTCA TGTACAGCTG AAGGTAGTTG

781 CTGGAAACCA TGACATTGGC TTCCATTATG AGATGAACAC ATACAAAGTA GAACGCTTTG

841 AGAAAGTGTT CAGCTCTGAA AGACTGTTTT CTTGGAAAGG CATTAACTTT GTGATGGTCA

901 ACAGCGTGGC GCTGAACGGG GATGGCTGTG GCATCTGCTC TGAAACAGAA GCAGAGCTCA

961 TTGAAGTTTC TCACAGACTG AACTGCTCCC GAGAGGCACG TGGCTCCAGC CGGTGTGGAC

1021 CTGGGCCTCT GCTGCCCACG TCTGCCCCTG TCCTCCTGCA GCATTATCCT CTGTATCGGA

1081 GAAGTGATGC TAACTGTTCT GGGGAAGACG CTGCTCCTCC AGAGGAAAGG GACATCCCAT

1141 TTAAGGAGAA CTATGACGTG CTTTCACGGG AGGCATCACA AAAGCTGCTG TGGTGGCTCC

1201 AGCCGCGCCT GGTTCTCAGT GGCCACACGC ACAGCGCCTG CGAGGTGCAC CACGGGGGCC

1261 GAGTCCCCGA GCTCAGCGTC CCATCTTTCA GTTGGAGGAA CAGAAACAAC CCCAGTTTCA

1321 TCATGGGAAC AGATGCTTAG TTGAGCATCA AGGGGCAGGA AGACACCTTT CCCTCCTTGT

1381 TCCTCGCTGA CCGATGACCC TGGAACTCCA CGGTGCCTCT CTGAATCTCT GTTATGGATC

1441 CCCCACTATA TTTGATGGGA ACCCAGTGAG CCAGGGGCCA GTTTTGACAG GGTAGCATCA

1501 CGCCCACAGA CTACACCCTC TCCAAGTGCT ACCTCCCACG TGAGGATGTG GTTTTGATCA

1561 TCTACTGTGG AGTGGTGGGC TTCCTTGTGG TCCTCACACT CACTCACTTT GGGCTTCTAG

1621 CCTCACCTTT TCTTTCTGGT TTGAACTTGC TCGGAAAGCG TAAGACAAGA TGAAGAGCAG

1681 GCGCCATTAT AAATATCAAA GCCCAAGAAA TGGAACTTTG GGCAGAGATC ATGTTAGAAT

1741 CAAGTGGATG ATGAGACCAA TTACAGGCCG TCTCTCTGCA CAGCACAGAA ATTCTCAATC

1801 ACTGAAATGA GTAACTGCAA AATAAATAGT TGATTGTACT GTTCTCATGC TATAAAAGTG

1861 GACAGGTACT CTACAACAAA TCTGTTTTCT CATTTTTATC AAATATATGT ATCATCAAAG

1921 GTTGCATCTG TACAGTATGT AAATGCTATT AATGTCGTCA CTCACATGCA CGACAGTCCT

1981 TGTTCCCCCA GGAACGGCCT GGTGGCCCCA GCACACACTT GGGATTATGT GTATACATAA

2041 ATAAATATTG GGCTGTTTCC CTCTTCCTGT GAAGTGGTTC TCAAATTCCT ATGTACTGTA

2101 AAGCTGTACC CTTAAAAGTA CAGATGTGGC CGGGCACAGT GGCTCACACC TGTAATCCCA

2161 GCACTTTGGG AGGCTGAGGC GGGTGGATCA CTTGAGGTCA GGAGTTCAAG ACCAGCCTGG

2221 CCAACATGGT GAAACCTCGT CTCCGCTAGA AATACAAAAA TTAGCCAAGC ATGGTAGCAA

2281 GTGCCTATAA TACCAGCTGA GGCTGAGGCA GGAGAATCCC TTGAGCCCGG GAGGCGGAGG

2341 TTGCAGTGAG CCAAGATCAT GCCACTGCAC TCTAGCCTGG GCAACAGAGT GAGACTCCGT

2401 CTCAAAAAAA TATATTTAAA AAAAAAAAAA AAAAA

B：氨基酸序列(SEQ ID NO：2) 长度：340

1 MAMIELGFGR QNFHPLKRKS SLLLKLIAVV FAVLLFCEFL IYYLAIFQCN WPEVKTTASD

61 GEQTTREPVL KAMFLADTHL LGEFLGHWLD KLRREWRMER AFQTALWLLQ PEVVFILGDI

121 FDEGKWSTPE AWADDVERFQ KMFRHPSHVQ LKVVAGNHDI GFHYEMNTYK VERFEKVFSS

181 ERLFSWKGIN FVMVNSVALN GDGCGICSET EAELIEVSHR LNCSREARGS SRCGPGPLLP

241 TSAPVLLQHY PLYRRSDANC SGEDAAPPEE RDIPFKENYD VLSREASQKL LWWLQPRLVL

301 SGHTHSACEV HHGGRVPELS VPSFSWRNRN NPSFIMGTDA

C.核苷酸及氨基酸组合序列(SEQ ID NO：3) 克隆号：PP579

起始编码子：318 ATG 终止编码子：1338 TAG 蛋白质分子量：38984.57

(注：(1)给出的是起始和终止编码子第一个核苷酸的位置，(2)分子量单位是道尔顿。)

1 GG CAG TTC CCG GGT CCC TCG GCC ACC GAA GCC ACC CTG CCC TGG TGA 47

48 AAG GGC TCC CGC ACC GCC CGG TGC TCC CCA TCT GCC TGG CGT TGT GCG 95

96 CAG AGC TGG AAA GCA TGG CTG TTA TAA ATG AAT TCT GAT TTT GGG GAG 143

144 CAG ATG CCA ACT TAG AGC CTC GTA CCA ATC TCT CTG TCT TTA AAA GAT 191

192 GAG GTG ACT TGG TGA TTT TCC TGG AAA ATT ATA GGT GCC CAG CTA AGA 239

240 CCT GAA TGC CAT CAC CCT CCC CAG GGC TCT GCA GTT TTC TCG TGG TGA 287

288 ACC CTT GAT GGA TTT GTT GTT GCT TGA GAA ATG GCG ATG ATC GAA TTG 335

1 Met Ala Met Ile Glu Leu 6

336 GGG TTT GGA AGA CAG AAT TTT CAT CCA TTA AAG AGG AAG AGT TCA TTG 383

7 Gly Phe Gly Arg Gln Asn Phe His Pro Leu Lys Arg Lys Ser Ser Leu 22

384 CTG TTG AAA CTC ATA GCT GTT GTC TTT GCT GTG CTT CTA TTT TGT GAA 431

23 Leu Leu Lys Leu Ile Ala Val Val Phe Ala Val Leu Leu Phe Cys Glu 38

432 TTT TTA ATC TAT TAC TTA GCG ATC TTT CAG TGT AAT TGG CCT GAA GTG 479

39 Phe Leu Ile Tyr Tyr Leu Ala Ile Phe Gln Cys Asn Trp Pro Glu Val 54

480 AAA ACC ACA GCC TCT GAT GGT GAA CAG ACC ACA CGT GAG CCT GTG CTC 527

55 Lys Thr Thr Ala Ser Asp Gly Glu Gln Thr Thr Arg Glu Pro Val Leu 70

528 AAA GCC ATG TTT TTG GCT GAC ACC CAT TTG CTT GGG GAA TTC CTA GGC 575

71 Lys Ala Met Phe Leu Ala Asp Thr His Leu Leu Gly Glu Phe Leu Gly 86

576 CAC TGG CTG GAC AAA TTA CGA AGG GAA TGG CGG ATG GAG AGA GCG TTC 623

87 His Trp Leu Asp Lys Leu Arg Arg Glu Trp Arg Met Glu Arg Ala Phe 102

624 CAG ACA GCT CTG TGG TTG CTG CAG CCG GAA GTC GTC TTC ATC CTG GGG 671

103 Gln Thr Ala Leu Trp Leu Leu Gln Pro Glu Val Val Phe Ile Leu Gly 118

672 GAT ATC TTT GAT GAA GGG AAG TGG AGC ACC CCT GAG GCC TGG GCG GAT 719

119 Asp Ile Phe Asp Glu Gly Lys Trp Ser Thr Pro Glu Ala Trp Ala Asp 134

720 GAT GTG GAG CGG TTT CAG AAA ATG TTC AGA CAC CCA AGT CAT GTA CAG 767

135 Asp Val Glu Arg Phe Gln Lys Met Phe Arg His Pro Ser His Val Gln 150

768 CTG AAG GTA GTT GCT GGA AAC CAT GAC ATT GGC TTC CAT TAT GAG ATG 815

151 Leu Lys Val Val Ala Gly Asn His Asp Ile Gly Phe His Tyr Glu Met 166

816 AAC ACA TAC AAA GTA GAA CGC TTT GAG AAA GTG TTC AGC TCT GAA AGA 863

167 Asn Thr Tyr Lys Val Glu Arg Phe Glu Lys Val Phe Ser Ser Glu Arg 182

864 CTG TTT TCT TGG AAA GGC ATT AAC TTT GTG ATG GTC AAC AGC GTG GCG 911

183 Leu Phe Ser Trp Lys Gly Ile Asn Phe Val Met Val Asn Ser Val Ala 198

912 CTG AAC GGG GAT GGC TGT GGC ATC TGC TCT GAA ACA GAA GCA GAG CTC 959

199 Leu Asn Gly Asp Gly Cys Gly Ile Cys Ser Glu Thr Glu Ala Glu Leu 214

960 ATT GAA GTT TCT CAC AGA CTG AAC TGC TCC CGA GAG GCA CGT GGC TCC 1007

215 Ile Glu Val Ser His Arg Leu Asn Cys Ser Arg Glu Ala Arg Gly Ser 230

1008 AGC CGG TGT GGA CCT GGG CCT CTG CTG CCC ACG TCT GCC CCT GTC CTC 1055

231 Ser Arg Cys Gly Pro Gly Pro Leu Leu Pro Thr Ser Ala Pro Val Leu 246

1056 CTG CAG CAT TAT CCT CTG TAT CGG AGA AGT GAT GCT AAC TGT TCT GGG 1103

247 Leu Gln His Tyr Pro Leu Tyr Arg Arg Ser Asp Ala Asn Cys Ser Gly 262

1104 GAA GAC GCT GCT CCT CCA GAG GAA AGG GAC ATC CCA TTT AAG GAG AAC 1151

263 Glu Asp Ala Ala Pro Pro Glu Glu Arg Asp Ile Pro Phe Lys Glu Asn 278

1152 TAT GAC GTG CTT TCA CGG GAG GCA TCA CAA AAG CTG CTG TGG TGG CTC 1199

279 Tyr Asp Val Leu Ser Arg Glu Ala Ser Gln Lys Leu Leu Trp Trp Leu 294

1200 CAG CCG CGC CTG GTT CTC AGT GGC CAC ACG CAC AGC GCC TGC GAG GTG 1247

295 Gln Pro Arg Leu Val Leu Ser Gly His Thr His Ser Ala Cys Glu Val 310

1248 CAC CAC GGG GGC CGA GTC CCC GAG CTC AGC GTC CCA TCT TTC AGT TGG 1295

311 His His Gly Gly Arg Val Pro Glu Leu Ser Val Pro Ser Phe Ser Trp 326

1296 AGG AAC AGA AAC AAC CCC AGT TTC ATC ATG GGA ACA GAT GCT TAG TTG 1343

327 Arg Asn Arg Asn Asn Pro Ser Phe Ile Met Gly Thr Asp Ala *** 341

1344 AGC ATC AAG GGG CAG GAA GAC ACC TTT CCC TCC TTG TTC CTC GCT GAC 1391

1392 CGA TGA CCC TGG AAC TCC ACG GTG CCT CTC TGA ATC TCT GTT ATG GAT 1439

1440 CCC CCA CTA TAT TTG ATG GGA ACC CAG TGA GCC AGG GGC CAG TTT TGA 1487

1488 CAG GGT AGC ATC ACG CCC ACA GAC TAC ACC CTC TCC AAG TGC TAC CTC 1535

1536 CCA CGT GAG GAT GTG GTT TTG ATC ATC TAC TGT GGA GTG GTG GGC TTC 1583

1584 CTT GTG GTC CTC ACA CTC ACT CAC TTT GGG CTT CTA GCC TCA CCT TTT 1631

1632 CTT TCT GGT TTG AAC TTG CTC GGA AAG CGT AAG ACA AGA TGA AGA GCA 1679

1680 GGC GCC ATT ATA AAT ATC AAA GCC CAA GAA ATG GAA CTT TGG GCA GAG 1727

1728 ATC ATG TTA GAA TCA AGT GGA TGA TGA GAC CAA TTA CAG GCC GTC TCT 1775

1776 CTG CAC AGC ACA GAA ATT CTC AAT CAC TGA AAT GAG TAA CTG CAA AAT 1823

1824 AAA TAG TTG ATT GTA CTG TTC TCA TGC TAT AAA AGT GGA CAG GTA CTC 1871

1872 TAC AAC AAA TCT GTT TTC TCA TTT TTA TCA AAT ATA TGT ATC ATC AAA 1919

1920 GGT TGC ATC TGT ACA GTA TGT AAA TGC TAT TAA TGT CGT CAC TCA CAT 1967

1968 GCA CGA CAG TCC TTG TTC CCC CAG GAA GGG CCT GGT GGC CCC AGC ACA 2015

2016 CAC TTG GGA TTA TGT GTA TAC ATA AAT AAA TAT TGG GCT GTT TCC CTC 2063

2064 TTC CTG TGA AGT GGT TCT CAA ATT CCT ATG TAC TGT AAA GCT GTA CCC 2111

2112 TTA AAA GTA CAG ATG TGG CCG GGC ACA GTG GCT CAC ACC TGT AAT CCC 2159

2160 AGC ACT TTG GGA GGC TGA GGC GGG TGG ATC ACT TGA GGT CAG GAG TTC 2207

2208 AAG ACC AGC CTG GCC AAC ATG GTG AAA CCT CGT CTC CGC TAG AAA TAC 2255

2256 AAA AAT TAG CCA AGC ATG GTA GCA AGT GCC TAT AAT ACC AGC TGA GGC 2303

2304 TGA GGC AGG AGA ATC CCT TGA GCC CGG GAG GCG GAG GTT GCA GTG AGC 2351

2352 CAA GAT CAT GCC ACT GCA CTC TAG CCT GGG CAA CAG AGT GAG ACT CCG 2399

2400 TCT CAA AAA AAT ATA TTT AAA AAA AAA AAA AAA AAA 2435

2.PP730

A：核苷酸序列(SEQ ID NO：4)长度：2057

1 GGACTCGCTT TCCGTGCGGT GCGGCGAGTG AGGCCCCGGT CTTCCTCCTC GTCCTGCCGC

61 AGGGCCAGAA CCCCTGACGG TATTCAGCTG CGCGTAAGTC TGGCCGGTGC CATCTGTCTC

121 CGCAATGCCC CCCAAGAAAC AGGCTCAGGC CAGGGGCAGC AAAAAGGCGG AGCAAAAAAA

181 GAAGGAGAAG ATTATCGAAG GCAAAACTTT CGGTTTGAAG AATAAGAAAG GAACAAAGCA

241 ACAGAAGTTT ATCAAGGCTG TCACACATCA AGTTAAATTT GGTCAACAAA ATCCACGTCA

301 GGTAGCACAG AGTGAAGCTG AAAAGAAATT GAAGAAGGAT GACAAGAAGA AAGAATTGCA

361 GGAGCTAAAT GAGCTGTTCA AACCTGTAGT TGCTGCTCAA AAAAATAAGT AAAGGTGCAG

421 ATCCCAAGTC TGTAGTATGT GCATTCTTCA AGCAAGGACA GTGTACTAAA GGAGATAAGT

481 GTAAGTTCTC CCATGACTTG ACTCTGGAGA GAAAATGTGA AAAGCGAAGT GTTTACATTG

541 ATGCAAGAGA TGAAGAACTT GAAAAAGATA CTATGGATAA TTGGGATGAG AAAAAGCTGG

601 AAGAAGTAGT GAACAAGAAG CACGGTGAGG CGGAAAAGAA AAAACCAAAA ACTCAAATAG

661 TGTGCAAGCA TTTCCTGGAA GCTATTGAAA ACAACAAGTA TGGCTGGTTT TGGGTATGCC

721 CTGGAGGGGG TGATATTTGC ATGTATCGTC ATGCACTTCC TCCTGGATTT GTGTTGAAAA

781 AAGATAAAAA GAAAGAAGAG AAAGAAGATG AAATTTCATT AGAAGATCTA ATTGAGAGAG

841 AGCGTTCTGC CCTAGGTCCA AATGTTACCA AAATCACTCT AGAATCTTTT CTTGCCTGGA

901 AGAAAAGGAA AAGACAAGAA AAGATTGATA AACTTGAACA AGATATGGAA AGAAGGAAAG

961 CTGACTTCAA AGCAGGGAAA GCACTAGTGA TCAGTGGTCG TGAAGTGTTT GAATTTCGTC

1021 CTGAACTGGT CAATGATGAT GATGAGGAAG CAGATGATAC ACGCTACACC CAGGGAACAG

1081 GTGGTGATGA GGTTGATGAT TCAGTGAGTG TAAATGACAT AGATTTAAGC CTGTACATCC

1141 CAAGAGATGT AGATGAAACA GGTATTACTG TAGCCAGTCT TGAAAGATTC AGCACATATA

1201 CTTCAGATAA AGATGAAAAC AAATTAAGTG AAGCTTCTGG AGGTAGGGCT GAAAATGGCG

1261 AAAGAAGTGA CTTGGAAGAG GACAACGAGA GGGAGGGAAC GGAAAATGGA GCCATTGATG

1321 CTGTTCCTGT TGATGAAAAT CTTTTCACTG GAGAGGATTT GGATGAACTA GAAGAAGAAT

1381 TAAATACACT TGATTTAGAA GAATGACACC AAACACATCG CTGAAAAAAT TAAGTCAGCT

1441 CAGCACGAGT TGGAATTGAC TACATTAATT TCTTTCCACC TAGAATCAAC AGGATGTTTA

1501 TTTCCTATGC TGATTCTGGA GGAGTTAACC TCCTGCAAAA AAGGCATCTT GTCCCTACAT

1561 CTTCTCTTCT GACTTTGGCT ACATCTCATA GTAAGTTCAG AGTAGTTCAT GATAAATTGA

1621 AAATATAATG GTCATTGCAG AAAATGATTG ATGTTGTAAC TGTCCACCCA AGTAAGAAGT

1681 GTATCTGCCT TTCCATCTTT TGGTTTTCAT TTGGGCATGT GCTATTACCA GAAACAACAA

1741 ACTTATATTT AAAATACCCT TCATTTGACA CAGTTTTTAA TGAGTGATTT AATTTCCTCT

1801 GTATTTGTAT GTTTAGAAGA CTGCCTAAAA CATGAGCACT GTACTTCATA AAGGAAACTG

1861 CGTATGCAGA TTCAGTATTG TGTATCTTTG GACAATTAGA TGGACATTTA AAATGGAACT

1921 TCTTTTATCT GACAGGATCA GCTACAATGC CCTGTGTTAA ATTGTTTAAA AGTTTCCCTT

1981 TTCTTTTTTG CCAATAAAGT TGTAAATAAA GACCATCATA CATTAAAATC CCAAAAAAAA

2041 AAAAAAAAAA AAAAAAA

B：氨基酸序列(SEQ ID NO：5) 长度：277

1 MDNWDEKKLE EVVNKKHGEA EKKKPKTQIV CKHFLEAIEN NKYGWFWVCP GGGDICMYRH

61 ALPPGFVLKK DKKKEEKEDE ISLEDLIERE RSALGPNVTK ITLESFLAWK KRKRQEKIDK

121 LEQDMERRKA DFKAGKALVI SGREVFEFRP ELVNDDDEEA DDTRYTQGTG GDEVDDSVSV

181 NDIDLSLYIP RDVDETGITV ASLERFSTYT SDKDENKLSE ASGGRAENGE RSDLEEDNER

241 EGTENGAIDA VPVDENLFTG EDLDELEEEL NTLDLEE

C.核苷酸及氨基酸组合序列(SEQ ID NO：6) 克隆号：PP730

起始编码子：573 ATG 终止编码子：1404 TGA 蛋白质分子量：31669.20

1 GG ACT CGC TTT CCG TGC GGT GCG GCG AGT GAG GCC CCG GTC TTC CTC 47

48 CTC GTC CTG CCG CAG GGC CAG AAC CCC TGA CGG TAT TCA GCT GCG CGT 95

96 AAG TCT GGC CGG TGC CAT CTG TCT CCG CAA TGC CCC CCA AGA AAC AGG 143

144 CTC AGG CCA GGG GCA GCA AAA AGG CGG AGC AAA AAA AGA AGG AGA AGA 191

192 TTA TCG AAG GCA AAA CTT TCG GTT TGA AGA ATA AGA AAG GAA CAA AGC 239

240 AAC AGA AGT TTA TCA AGG CTG TCA CAC ATC AAG TTA AAT TTG GTC AAC 287

288 AAA ATC CAC GTC AGG TAG CAC AGA GTG AAG CTG AAA AGA AAT TGA AGA 335

336 AGG ATG ACA AGA AGA AAG AAT TGC AGG AGC TAA ATG AGC TGT TCA AAC 383

384 CTG TAG TTG CTG CTC AAA AAA ATA AGT AAA GGT GCA GAT CCC AAG TCT 431

432 GTA GTA TGT GCA TTC TTC AAG CAA GGA CAG TGT ACT AAA GGA GAT AAG 479

480 TGT AAG TTC TCC CAT GAC TTG ACT CTG GAG AGA AAA TGT GAA AAG CGA 527

528 AGT GTT TAC ATT GAT GCA AGA GAT GAA GAA CTT GAA AAA GAT ACT ATG 575

1 Met 1

576 GAT AAT TGG GAT GAG AAA AAG CTG GAA GAA GTA GTG AAC AAG AAG CAC 623

2 Asp Asn Trp Asp Glu Lys Lys Leu Glu Glu Val Val Asn Lys Lys His 17

624 GGT GAG GCG GAA AAG AAA AAA CCA AAA ACT CAA ATA GTG TGC AAG CAT 671

18 Gly Glu Ala Glu Lys Lys Lys Pro Lys Thr Gln Ile Val Cys Lys His 33

672 TTC CTG GAA GCT ATT GAA AAC AAC AAG TAT GGC TGG TTT TGG GTA TGC 719

34 Phe Leu Glu Ala Ile Glu Asn Asn Lys Tyr Gly Trp Phe Trp Val Cys 49

720 CCT GGA GGG GGT GAT ATT TGC ATG TAT CGT CAT GCA CTT CCT CCT GGA 767

50 Pro Gly Gly Gly Asp Ile Cys Met Tyr Arg His Ala Leu Pro Pro Gly 65

768 TTT GTG TTG AAA AAA GAT AAA AAG AAA GAA GAG AAA GAA GAT GAA ATT 815

66 Phe Val Leu Lys Lys Asp Lys Lys Lys Glu Glu Lys Glu Asp Glu Ile 81

816 TCA TTA GAA GAT CTA ATT GAG AGA GAG CGT TCT GCC CTA GGT CCA AAT 863

82 Ser Leu Glu Asp Leu Ile Glu Arg Glu Arg Ser Ala Leu Gly Pro Asn 97

864 GTT ACC AAA ATC ACT CTA GAA TCT TTT CTT GCC TGG AAG AAA AGG AAA 911

98 Val Thr Lys Ile Thr Leu Glu Ser Phe Leu Ala Trp Lys Lys Arg Lys 113

912 AGA CAA GAA AAG ATT GAT AAA CTT GAA CAA GAT ATG GAA AGA AGG AAA 959

114 Arg Gln Glu Lys Ile Asp Lys Leu Glu Gln Asp Met Glu Arg Arg Lys 129

960 GCT GAC TTC AAA GCA GGG AAA GCA CTA GTG ATC AGT GGT CGT GAA GTG 1007

130 Ala Asp Phe Lys Ala Gly Lys Ala Leu Val Ile Ser Gly Arg Glu Val 145

1008 TTT GAA TTT CGT CCT GAA CTG GTC AAT GAT GAT GAT GAG GAA GCA GAT 1055

146 Phe Glu Phe Arg Pro Glu Leu Val Asn Asp Asp Asp Glu Glu Ala Asp 161

1056 GAT ACA CGC TAC ACC CAG GGA ACA GGT GGT GAT GAG GTT GAT GAT TCA 1103

162 Asp Thr Arg Tyr Thr Gln Gly Thr Gly Gly Asp Glu Val Asp Asp Ser 177

1104 GTG AGT GTA AAT GAC ATA GAT TTA AGC CTG TAC ATC CCA AGA GAT GTA 1151

178 Val Ser Val Asn Asp Ile Asp Leu Ser Leu Tyr Ile Pro Arg Asp Val 193

1152 GAT GAA ACA GGT ATT ACT GTA GCC AGT CTT GAA AGA TTC AGC ACA TAT 1199

194 Asp Glu Thr Gly Ile Thr Val Ala Ser Leu Glu Arg Phe Ser Thr Tyr 209

1200 ACT TCA GAT AAA GAT GAA AAC AAA TTA AGT GAA GCT TCT GGA GGT AGG 1247

210 Thr Ser Asp Lys Asp Glu Asn Lys Leu Ser Glu Ala Ser Gly Gly Arg 225

1248 GCT GAA AAT GGC GAA AGA AGT GAC TTG GAA GAG GAC AAC GAG AGG GAG 1295

226 Ala Glu Asn Gly Glu Arg Ser Asp Leu Glu Glu Asp Asn Glu Arg Glu 241

1296 GGA ACG GAA AAT GGA GCC ATT GAT GCT GTT CCT GTT GAT GAA AAT CTT 1343

242 Gly Thr Glu Asn Gly Ala Ile Asp Ala Val Pro Val Asp Glu Asn Leu 257

1344 TTC ACT GGA GAG GAT TTG GAT GAA CTA GAA GAA GAA TTA AAT ACA CTT 1391

258 Phe Thr Gly Glu Asp Leu Asp Glu Leu Glu Glu Glu Leu Asn Thr Leu 273

1392 GAT TTA GAA GAA TGA CAC CAA ACA CAT CGC TGA AAA AAT TAA GTC AGC 1439

274 Asp Leu Glu Glu *** 278

1440 TCA GCA CGA GTT GGA ATT GAC TAC ATT AAT TTC TTT CCA CCT AGA ATC 1487

1488 AAC AGG ATG TTT ATT TCC TAT GCT GAT TCT GGA GGA GTT AAC CTC CTG 1535

1536 CAA AAA AGG CAT CTT GTC CCT ACA TCT TCT CTT CTG ACT TTG GCT ACA 1583

1584 TCT CAT AGT AAG TTC AGA GTA GTT CAT GAT AAA TTG AAA ATA TAA TGG 1631

1632 TCA TTG CAG AAA ATG ATT GAT GTT GTA ACT GTC CAC CCA AGT AAG AAG 1679

1680 TGT ATC TGC CTT TCC ATC TTT TGG TTT TCA TTT GGG CAT GTG CTA TTA 1727

1728 CCA GAA ACA ACA AAC TTA TAT TTA AAA TAC CCT TCA TTT GAC ACA GTT 1775

1776 TTT AAT GAG TGA TTT AAT TTC CTC TGT ATT TGT ATG TTT AGA AGA CTG 1823

1824 CCT AAA ACA TGA GCA CTG TAC TTC ATA AAG GAA ACT GCG TAT GCA GAT 1871

1872 TCA GTA TTG TGT ATC TTT GGA CAA TTA GAT GGA CAT TTA AAA TGG AAC 1919

1920 TTC TTT TAT CTG ACA GGA TCA GCT ACA ATG CCC TGT GTT AAA TTG TTT 1967

1968 AAA AGT TTC CCT TTT CTT TTT TGC CAA TAA AGT TGT AAA TAA AGA CCA 2015

2016 TCA TAC ATT AAA ATC CCA AAA AAA AAA AAA AAA AAA AAA AAA 2057

3.PP791

A：核苷酸序列(SEQ ID NO：7)长度：4001

1 GGCTGTCCAG GGAGGCTGAG GCGAGAGGTA GCTGTCCGGG TGGGGAGCCC GCACTACCTT

61 CTTCCTCTTC CTCCTCCTCC GGGTGAGGGG AGCGAAGGTT GGGGGTCCCC GAGCCCATGG

121 ACCAGGAAGA GGCGGAGGCC GCCGAGAGCC GGGGCCCCGC TATGTGGCCC TGAGCCCCGT

181 GTACTGGTTC TGCCTGTCTG GAGGGCCATG GAGAAGAGGC TGGGAGTCAA GCCAAATCCT

241 GCTTCCTGGA TTTTATCAGG ATATTATTGG CAGACATCTG CGAAGTGGTT GAGAAGCCTG

301 TACCTGTTTT ATACTTACTT TTGCTTCAGC GTTCTGTGGT TGTCAACAGA TGCCAGTGAG

361 AGCAGGTGCC AGCAGGGGAA GACACAATTT GGAGTTGGCC TGAGATCTGG GGGAGAAAAT

421 CACCTCTGGC TTCTTGAAGG AACCCCCTCT CTCCAGTCAT GTTGGGCTGC CTGCTGCCAG

481 GACTCTGCCT GCCATGTCTT TTGGTGGCTA GAAGGGATGT GCATTCAGGC AGACTGCAGC

541 AGGCCCCAGA GCTGCCGGGC TTTTAGGACA CACTCCTCCA ATTCCATGCT GGTGTTTTTA

601 AAAAAATTCC AAACTGCAGA TGATTTGGGC TTTCTACCTG AAGATGATGT ACCACATCTT

661 CTGGGGCTAG GTTGGAACTG GGCATCTTGG AGGCAGAGCC CACCCAGAGC TGCACTCAGA

721 CCTGCTGTAT CTTCCAGTGA CCAGCAGAGC TTAATCAGGA AGCTTCAGAA GAGAGGTAGT

781 CCCAGTGACG TAGTTACACC TATAGTGACA CAGTATTCTA AAGTGAATGA CTCCAACGAA

841 TTAGGTGGTC TGACTACCAG TGGCTCTGCA GAGGTCCACA AGGCGATTAC AATTTCCAGT

901 CCCCTAACCA CAGACTTGAC TGCAGAGCTG TCTGGTGGGC CAAAGAATGT ATCAGTGCAA

961 CCTGAAATAT CAGAGGGTCT TGCTACTACG CCCAGCACTC AACAAGTAAA AAGTTCTGAG

1021 AAAACCCAGA TTGCTGTCCC CCAGCCAGTG GCTCCCTCCT ACAGTTATGC TACCCCTACC

1081 CCCCAGGCCT CTTTCCAGAG CACCTCAGCA CCATACCCAG TTATAAAGGA ACTGGTGGTA

1141 TCTGCTGGAG AGAGTGTCCA GATAACCCTG CCTAAGAATG AAGTTCAATT AAATGCATAT

1201 GTTCTCCAAG AACCACCTAA AGGAGAAACC TACACCTACG ACTGGCAGCT GATTACTCAT

1261 CCTAGAGACT ACAGTGGAGA AATGGAAGGG AAACATTCCC AGATCCTCAA ACTATCGAAG

1321 CTCACTCCAG GCCTGTATGA ATTCAAAGTG ATTGTAGAGG GTCAAAATGC CCATGGGGAA

1381 GGCTATGTGA ACGTGACAGT CAAGCCAGAG CCCCGTAAGA ATCGGCCCCC CATTGCTATT

1441 GTGTCACCTC AGTTCCAGGA GATCTCTTTG CCAACCACTT CTACAGTCAT TGATGGCAGT

1501 CAAAGCACTG ATGATGATAA AATCGTTCAG TACCATTGGG AAGAACTTAA GGGGCCTCTA

1561 AGAGAAGAGA AGATTTCTGA AGATACAGCC ATATTAAAAC TAAGTAAACT CGTCCCTGGG

1621 AACTACACTT TCAGCTTGAC TGTAGTAGAC TCTGATGGAG CTACCAACTC TACTACTGCA

1681 AACCTGACAG TGAACAAAGC TGTGGATTAC CCCCCTGTGG CCAACGCAGG CCCCAACCAA

1741 GTGATCACCC TGCCCCAAAA CTCCACCACC CTCTTTGGGA ACCAGAGCAC TGATGATCAT

1801 GGCATCACCA GCTATGAGTG GTCACTCAGC CCAAGCAGCA AAGGGAAAGT GGTGGAGATG

1861 CAGGGTGTTA GAACACCAAC CTTACAGCTC TCTGCGATGC AAGAAGGAGA CTACACTTAC

1921 CAGCTCACAG TGACTGACAC AATAGGACAG CAGGCCACTG CTCAAGTGAC CGTTATTGTG

1981 CAACCTGAAA ACAATAAGCC TCCTCAGGCA GATGCAGGCC CAGATAAAGA GCTGACCCTT

2041 CCTGTGGATA GCACAACCCT GGATGGCAGC AAGAGCTCAG ATGATCAGAA AATTATCTCA

2101 TATCTCTGGG AAAAAAACAC AGGGACCTGA TGGGGTGCAG CTCGAGAATG CTAACAGCAG

2161 TGTTGCTACT GTGACTGGGC TGCAAGTGGG GACCTATGTG TTCACCTTGA CTGTCAAAGA

2221 TGAGAGGAAC CTGCAAAGCC AGAGCTCTGT GAATGTCATT GTCAAAGAAG AAATAAACAA

2281 ACCACCTATA GCCAAGATAA CTGGGAATGT GGTGATTACC CTACCCACGA GCACAGCAGA

2341 GCTGGATGGC TCTAAGTCCT CAGATGACAA GGGAATAGTC AGCTACCTCT GGACTCGAGA

2401 TGAGGGGAGC CCAGCAGCAG GGGAGGTGTT AAATCACTCT GACCATCACC CTATCCTTTT

2461 TCTTTCAAAC CTGGTTGAGG GAACCTACAC TTTTCACCTG AAAGTGACCG ATGCAAAGGG

2521 TGAGAGTGAC ACAGACCGGA CCACTGTGGA GGTGAAACCT GATCCCAGGA AAAACAACCT

2581 GGTGGAGATC ATCTTGGATA TCAACGTCAG TCAGCTAACT GAGAGGCTGA AGGGGATGTT

2641 CATCCGCCAG ATTGGGGTCC TCCTGGGGGT GCTGGATTCC GACATCATTG TGCAAAAGAT

2701 TCAGCCGTAC ACGGAGCAGA GCACCAAAAT GGTATTTTTT GTTCAAAACG AGCCTCCCCA

2761 CCAGATCTTC AAAGGCCATG AGGTGGCAGC GATGCTCAAG AGTGAGCTGC GGAAGCAAAA

2821 GGCAGACTTT TTGATATTCA GAGCCTTGGA AGTCAACACT GTCACATGTC AGCTGAACTG

2881 TTCCGACCAT GGCCACTGTG ACTCGTTCAC CAAACGCTGT ATCTGTGACC CTTTTTGGAT

2941 GGAGAATTTC ATCAAGGTGC AGCTGAGGGA TGGAGACAGC AACTGTGAGT GGAGCGTGTT

3001 ATATGTTATC ATTGCTACCT TTGTCATTGT TGTTGCCTTG GGAATCCTGT CTTGGACTGT

3061 GATCTGTTGT TGTAAGAGGC AAAAAGGAAA ACCCAAGAGG AAAAGCAAGT ACAAGATCCT

3121 GGATGCCACG GATCAGGAAA GCCTGGAGCT GAAGCCAACC TCCCGAGCAG GCATCAAACA

3181 GAAAGGCCTT TTGCTAAGTA GCAGCCTGAT GCACTCCGAG TCAGAGCTGG ACAGCGACGA

3241 TGCCATCTTT ACATGGCCAG ACCGAGAGAA GGGCAAACTC CTGCATGGTC AGAATGGCTC

3301 TGTACCCAAC GGGCAGACCC CTCTGAAGGC CAGGAGCCCG CGGGAGGAGA TCCTGTAGCC

3361 ACCTGGTCTG TCTCCTCAGG GCAGGGCCCA GCACACTGCC CGGCCAGTCC TCCTACCTCC

3421 CGAGTCTGCG GGCAGCTGCT GTCCCAGCAT CTGCTGGTCA TTTCGCCCTG ACAGTCCCAA

3481 CCAGAACCCC TGGGACTTGA ATCCAGAGAC GTCCTCCAGG AACCCCTCAA CGAAGCTGTG

3541 AATGAAGAGG TTTCCTCTTT AAACCTGTCT GGTGGGCCCC CAGATATCCT CACCTCAGGG

3601 CCTCCTTTTT TTGCAAACTC CTCCCCTCCC CCGAGGGCAG ACCCAGCCAG CTGCTAAGCT

3661 CTGCAGCTCC CCAGTGGACA GTGTCATTGT GCCCAGAGTG CTGCAAGGTG AGGCCTGCTG

3721 TGCTGCCCGC ACACCTGAGT GCAAAACCAA GCACTGTGGG CATGGTGTTT CCCTCTCTGG

3781 GGTAGAGTAC GCCCTCTCGC TGGGCAAAGA GGAAGTGGCA CCCCTCCCCT CACCACAGAT

3841 GCTGAGATGG TAGCATAGAA ATGATGGCCG GGCGCGGTGG CTCACGCCTG TAATCCCAGC

3901 ACTTTGGGAG GCCGAGGCGG GCGGATCATG AGGTCAGGAG ATCAAGACCA CCCTGGCTAA

3961 CACGGTGAAA CCCCATCTCT ACTAAAAAAA AAAAAAAAAA A

B：氨基酸序列(SEQ ID NO：8) 长度：640

1 MEKRLGVKPN PASWILSGYY WQTSAKWLRS LYLFYTYFCF SVLWLSTDAS ESRCQQGKTQ

61 FGVGLRSGGE NHLWLLEGTP SLQSCWAACC QDSACHVFWW LEGMCIQADC SRPQSCRAFR

121 THSSNSMLVF LKKFQTADDL GFLPEDDVPH LLGLGWNWAS WRQSPPRAAL RPAVSSSDQQ

181 SLIRKLQKRG SPSDVVTPIV TQYSKVNDSN ELGGLTTSGS AEVHKAITIS SPLTTDLTAE

241 LSGGPKNVSV QPEISEGLAT TPSTQQVKSS EKTQIAVPQP VAPSYSYATP TPQASFQSTS

301 APYPVIKELV VSAGESVQIT LPKNEVQLNA YVLQEPPKGE TYTYDWQLIT HPRDYSGEME

361 GKHSQILKLS KLTPGLYEFK VIVEGQNAHG EGYVNVTVKP EPRKNRPPIA IVSPQFQEIS

421 LPTTSTyIDG SQSTDDDKIV QYHWEELKGP LREEKISEDT AILKLSKLyP GNYTFSLTyV

481 DSDGATNSTT ANLTVNKAVD YPPVANAGPN QVITLPQNST TLFGNQSTDD HGITSYEWSL

541 SPSSKGKVVE MQGVRTPTLQ LSAMQEGDYT YQLTVTDTIG QQATAQVTVI VQPENNKPPQ

601 ADAGPDKELT LPVDSTTLDG SKSSDDQKII SYLWEKNTGT

C.核苷酸及氨基酸组合序列(SEQ ID NO：9) 克隆号：PP791

起始编码子：208 ATG 终止编码子：2128 TGA 蛋白质分子量：70168.88

1 GGC TGT CCA GGG AGG CTG AGG CGA GAG GTA GCT GTC CGG GTG GGG AGC 48

49 CCG CAC TAC CTT CTT CCT CTT CCT CCT CCT CCG GGT GAG GGG AGC GAA 96

97 GGT TGG GGG TCC CCG AGC CCA TGG ACC AGG AAG AGG CGG AGG CCG CCG 144

145 AGA GCC GGG GCC CCG CTA TGT GGC CCT GAG CCC CGT GTA CTG GTT CTG 192

193 CCT GTC TGG AGG GCC ATG GAG AAG AGG CTG GGA GTC AAG CCA AAT CCT 240

1 Met Glu Lys Arg Leu Gly Val Lys Pro Asn Pro 11

241 GCT TCC TGG ATT TTA TCA GGA TAT TAT TGG CAG ACA TCT GCG AAG TGG 288

12 Ala Ser Trp Ile Leu Ser Gly Tyr Tyr Trp Gln Thr Ser Ala Lys Trp 27

289 TTG AGA AGC CTG TAC CTG TTT TAT ACT TAC TTT TGC TTC AGC GTT CTG 336

28 Leu Arg Ser Leu Tyr Leu Phe Tyr Thr Tyr Phe Cys Phe Ser Val Leu 43

337 TGG TTG TCA ACA GAT GCC AGT GAG AGC AGG TGC CAG CAG GGG AAG ACA 384

44 Trp Leu Ser Thr Asp Ala Ser Glu Ser Arg Cys Gln Gln Gly Lys Thr 59

385 CAA TTT GGA GTT GGC CTG AGA TCT GGG GGA GAA AAT CAC CTC TGG CTT 432

60 Gln Phe Gly yal Gly Leu Arg Ser Gly Gly Glu Asn His Leu Trp Leu 75

433 CTT GAA GGA ACC CCC TCT CTC CAG TCA TGT TGG GCT GCC TGC TGC CAG 480

76 Leu Glu Gly Thr Pro Ser Leu Gln Ser Cys Trp Ala Ala Cys Cys Gln 91

481 GAC TCT GCC TGC CAT GTC TTT TGG TGG CTA GAA GGG ATG TGC ATT CAG 528

92 Asp Ser Ala Cys His Val Phe Trp Trp Leu Glu Gly Met Cys Ile Gln 107

529 GCA GAC TGC AGC AGG CCC CAG AGC TGC CGG GCT TTT AGG ACA CAC TCC 576

108 Ala Asp Cys Ser Arg Pro Gln Ser Cys Arg Ala Phe Arg Thr His Ser 123

577 TCC AAT TCC ATG CTG GTG TTT TTA AAA AAA TTC CAA ACT GCA GAT GAT 624

124 Ser Asn Ser Met Leu Val Phe Leu Lys Lys Phe Gln Thr Ala Asp Asp 139

625 TTG GGC TTT CTA CCT GAA GAT GAT GTA CCA CAT CTT CTG GGG CTA GGT 672

140 Leu Gly Phe Leu Pro Glu Asp Asp Val Pro His Leu Leu Gly Leu Gly 155

673 TGG AAC TGG GCA TCT TGG AGG CAG AGC CCA CCC AGA GCT GCA CTC AGA 720

156 Trp Asn Trp Ala Ser Trp Arg Gln Ser Pro Pro Arg Ala Ala Leu Arg 171

721 CCT GCT GTA TCT TCC AGT GAC CAG CAG AGC TTA ATC AGG AAG CTT CAG 768

172 Pro Ala Val Ser Ser Ser Asp Gln Gln Ser Leu Ile Arg Lys Leu Gln 187

769 AAG AGA GGT AGT CCC AGT GAC GTA GTT ACA CCT ATA GTG ACA CAG TAT 816

188 Lys Arg Gly Ser Pro Ser Asp Val Val Thr Pro Ile Val Thr Gln Tyr 203

817 TCT AAA GTG AAT GAC TCC AAC GAA TTA GGT GGT CTG ACT ACC AGT GGC 864

204 Ser Lys Val Asn Asp Ser Asn Glu Leu Gly Gly Leu Thr Thr Ser Gly 219

865 TCT GCA GAG GTC CAC AAG GCG ATT ACA ATT TCC AGT CCC CTA ACC ACA 912

220 Ser Ala Glu Val His Lys Ala Ile Thr Ile Ser Ser Pro Leu Thr Thr 235

913 GAC TTG ACT GCA GAG CTG TCT GGT GGG CCA AAG AAT GTA TCA GTG CAA 960

236 Asp Leu Thr Ala Glu Leu Ser Gly Gly Pro Lys Asn Val Ser Val Gln 251

961 CCT GAA ATA TCA GAG GGT CTT GCT ACT ACG CCC AGC ACT CAA CAA GTA 1008

252 Pro Glu Ile Ser Glu Gly Leu Ala Thr Thr Pro Ser Thr Gln Gln Val 267

1009 AAA AGT TCT GAG AAA ACC CAG ATT GCT GTC CCC CAG CCA GTG GCT CCC 1056

268 Lys Ser Ser Glu LYs Thr Gln Ile Ala Val Pro Gln Pro Val Ala Pro 283

1057 TCC TAC AGT TAT GCT ACC CCT ACC CCC CAG GCC TCT TTC CAG AGC ACC 1104

284 Ser Tyr Ser Tyr Ala Thr Pro Thr Pro Gln Ala Ser Phe Gln Ser Thr 299

1105 TCA GCA CCA TAC CCA GTT ATA AAG GAA CTG GTG GTA TCT GCT GGA GAG 1152

300 Ser Ala Pro Tyr Pro Val Ile Lys Glu Leu Val Val Ser Ala Gly Glu 315

1153 AGT GTC CAG ATA ACC CTG CCT AAG AAT GAA GTT CAA TTA AAT GCA TAT 1200

316 Ser Val Gln Ile Thr Leu Pro Lys Asn Glu Val Gln Leu Asn Ala Tyr 331

1201 GTT CTC CAA GAA CCA CCT AAA GGA GAA ACC TAC ACC TAC GAC TGG CAG 1248

332 Val Leu Gln Glu Pro Pro Lys Gly Glu Thr Tyr Thr Tyr Asp Trp Gln 347

1249 CTG ATT ACT CAT CCT AGA GAC TAC AGT GGA GAA ATG GAA GGG AAA CAT 1296

348 Leu Ile Thr His Pro Arg Asp Tyr Ser Gly Glu Met Glu Gly Lys His 363

1297 TCC CAG ATC CTC AAA CTA TCG AAG CTC ACT CCA GGC CTG TAT GAA TTC 1344

364 Ser Gln Ile Leu Lys Leu Ser Lys Leu Thr Pro Gly Leu Tyr Glu Phe 379

1345 AAA GTG ATT GTA GAG GGT CAA AAT GCC CAT GGG GAA GGC TAT GTG AAC 1392

380 Lys Val Ile Val Glu Gly Gln Asn Ala His Gly Glu Gly Tyr Val Asn 395

1393 GTG ACA GTC AAG CCA GAG CCC CGT AAG AAT CGG CCC CCC ATT GCT ATT 1440

396 Val Thr Val Lys Pro Glu Pro Arg Lys Asn Arg Pro Pro Ile Ala Ile 411

1441 GTG TCA CCT CAG TTC CAG GAG ATC TCT TTG CCA ACC ACT TCT ACA GTC 1488

412 Val Ser Pro Gln Phe Gln Glu Ile Ser Leu Pro Thr Thr Ser Thr Val 427

1489 ATT GAT GGC AGT CAA AGC ACT GAT GAT GAT AAA ATC GTT CAG TAC CAT 1536

428 Ile Asp Gly Ser Gln Ser Thr Asp Asp Asp Lys Ile Val Gln Tyr His 443

1537 TGG GAA GAA CTT AAG GGG CCT CTA AGA GAA GAG AAG ATT TCT GAA GAT 1584

444 Trp Glu Glu Leu Lys Gly Pro Leu Arg Glu Glu Lys Ile Ser Glu Asp 459

1585 ACA GCC ATA TTA AAA CTA AGT AAA CTC GTC CCT GGG AAC TAC ACT TTC 1632

460 Thr Ala Ile Leu Lys Leu Ser Lys Leu Val Pro Gly Asn Tyr Thr Phe 475

1633 AGC TTG ACT GTA GTA GAC TCT GAT GGA GCT ACC AAC TCT ACT ACT GCA 1680

476 Ser Leu Thr Val Val Asp Ser Asp Gly Ala Thr Asn Ser Thr Thr Ala 491

1681 AAC CTG ACA GTG AAC AAA GCT GTG GAT TAC CCC CCT GTG GCC AAC GCA 1728

492 Asn Leu Thr Val Asn Lys Ala Val Asp Tyr Pro Pro Val Ala Asn Ala 507

1729 GGC CCC AAC CAA GTG ATC ACC CTG CCC CAA AAC TCC ACC ACC CTC TTT 1776

508 Gly Pro Asn Gln Val Ile Thr Leu Pro Gln Asn Ser Thr Thr Leu Phe 523

1777 GGG AAC CAG AGC ACT GAT GAT CAT GGC ATC ACC AGC TAT GAG TGG TCA 1824

524 Gly Asn Gln Ser Thr Asp Asp His Gly Ile Thr Ser Tyr Glu Trp Ser 539

1825 CTC AGC CCA AGC AGC AAA GGG AAA GTG GTG GAG ATG CAG GGT GTT AGA 1872

540 Leu Ser Pro Ser Ser Lys Gly Lys Val Val Glu Met Gln Gly Val Arg 555

1873 ACA CCA ACC TTA CAG CTC TCT GCG ATG CAA GAA GGA GAC TAC ACT TAC 1920

556 Thr Pro Thr Leu Gln Leu Ser Ala Met Gln Glu Gly Asp Tyr Thr Tyr 571

1921 CAG CTC ACA GTG ACT GAC ACA ATA GGA CAG CAG GCC ACT GCT CAA GTG 1968

572 Gln Leu Thr Val Thr Asp Thr Ile Gly Gln Gln Ala Thr Ala Gln Val 587

1969 ACC GTT ATT GTG CAA CCT GAA AAC AAT AAG CCT CCT CAG CCA GAT GCA 2016

588 Thr Val Ile Val Gln Pro Glu Asn Asn Lys Pro Pro Gln Ala Asp Ala 603

2017 GGC CCA GAT AAA GAG CTG ACC CTT CCT GTG GAT AGC ACA ACC CTG GAT 2064

604 Gly Pro Asp Lys Glu Leu Thr Leu Pro Val Asp Ser Thr Thr Leu Asp 619

2065 GGC AGC AAG AGC TCA GAT GAT CAG AAA ATT ATC TCA TAT CTC TGG GAA 2112

620 Gly Ser Lys Ser Ser Asp Asp Gln Lys Ile Ile Ser Tyr Leu Trp Glu 635

2113 AAA AAC ACA GGG ACC TGA TGG GGT GCA GCT CGA GAA TGC TAA CAG CAG 2160

636 Lys Asn Thr Gly Thr *** 641

2161 TGT TGC TAC TGT GAC TGG GCT GCA AGT GGG GAC CTA TGT GTT CAC CTT 2208

2209 GAC TGT CAA AGA TGA GAG GAA CCT GCA AAG CCA GAG CTC TGT GAA TGT 2256

2257 CAT TGT CAA AGA AGA AAT AAA CAA ACC ACC TAT AGC CAA GAT AAC TGG 2304

2305 GAA TGT GGT GAT TAC CCT ACC CAC GAG CAC AGC AGA GCT GGA TGG CTC 2352

2353 TAA GTC CTC AGA TGA CAA GGG AAT AGT CAG CTA CCT CTG GAC TCG AGA 2400

2401 TGA GGG GAG CCC AGC AGC AGG GGA GGT GTT AAA TCA CTC TGA CCA TCA 2448

2449 CCC TAT CCT TTT TCT TTC AAA CCT GGT TGA GGG AAC CTA CAC TTT TCA 2496

2497 CCT GAA AGT GAC CGA TGC AAA GGG TGA GAG TGA CAC AGA CCG GAC CAC 2544

2545 TGT GGA GGT GAA ACC TGA TCC CAG GAA AAA CAA CCT GGT GGA GAT CAT 2592

2593 CTT GGA TAT CAA CGT CAG TCA GCT AAC TGA GAG GCT GAA GGG GAT GTT 2640

2641 CAT CCG CCA GAT TGG GGT CCT CCT GGG GGT GCT GGA TTC CGA CAT CAT 2688

2689 TGT GCA AAA GAT TCA GCC GTA CAC GGA GCA GAG CAC CAA AAT GGT ATT 2736

2737 TTT TGT TCA AAA CGA GCC TCC CCA CCA GAT CTT CAA AGG CCA TGA GGT 2784

2785 GGC AGC GAT GCT CAA GAG TGA GCT GCG GAA GCA AAA GGC AGA CTT TTT 2832

2833 GAT ATT CAG AGC CTT GGA AGT CAA CAC TGT CAC ATG TCA GCT GAA CTG 2880

2881 TTC CGA CCA TGG CCA CTG TGA CTC GTT CAC CAA ACG CTG TAT CTG TGA 2928

2929 CCC TTT TTG GAT GGA GAA TTT CAT CAA GGT GCA GCT GAG GGA TGG AGA 2976

2977 CAG CAA CTG TGA GTG GAG CGT GTT ATA TGT TAT CAT TGC TAC CTT TGT 3024

3025 CAT TGT TGT TGC CTT GGG AAT CCT GTC TTG GAC TGT GAT CTG TTG TTG 3072

3073 TAA GAG GCA AAA AGG AAA ACC CAA GAG GAA AAG CAA GTA CAA GAT CCT 3120

3121 GGA TGC CAC GGA TCA GGA AAG CCT GGA GCT GAA GCC AAC CTC CCG AGC 3168

3169 AGG CAT CAA ACA GAA AGG CCT TTT GCT AAG TAG CAG CCT GAT GCA CTC 3216

3217 CGA GTC AGA GCT GGA CAG CGA CGA TGC CAT CTT TAC ATG GCC AGA CCG 3264

3265 AGA GAA GGG CAA ACT CCT GCA TGG TCA GAA TGG CTC TGT ACC CAA CGG 3312

3313 GCA GAC CCC TCT GAA GGC CAG GAG CCC GCG GGA GGA GAT CCT GTA GCC 3360

3361 ACC TGG TCT GTC TCC TCA GGG CAG GGC CCA GCA CAC TGC CCG GCC AGT 3408

3409 CCT CCT ACC TCC CGA GTC TGC GGG CAG CTG CTG TCC CAG CAT CTG CTG 3456

3457 GTC ATT TCG CCC TGA CAG TCC CAA CCA GAA CCC CTG GGA CTT GAA TCC 3504

3505 AGA GAC GTC CTC CAG GAA CCC CTC AAC GAA GCT GTG AAT GAA GAG GTT 3552

3553 TCC TCT TTA AAC CTG TCT GGT GGG CCC CCA GAT ATC CTC ACC TCA GGG 3600

3601 CCT CCT TTT TTT GCA AAC TCC TCC CCT CCC CCG AGG GCA GAC CCA GCC 3648

3649 AGC TGC TAA GCT CTG CAG CTC CCC AGT GGA CAG TGT CAT TGT GCC CAG 3696

3697 AGT GCT GCA AGG TGA GGC CTG CTG TGC TGC CCG CAC ACC TGA GTG CAA 3744

3745 AAC CAA GCA CTG TGG GCA TGG TGT TTC CCT CTC TGG GGT AGA GTA CGC 3792

3793 CCT CTC GCT GGG CAA AGA GGA AGT GGC ACC CCT CCC CTC ACC ACA GAT 3840

3841 GCT GAG ATG GTA GCA TAG AAA TGA TGG CCG GGC GCG GTG GCT CAC GCC 3888

3889 TGT AAT CCC AGC ACT TTG GGA GGC CGA GGC GGG CGG ATC ATG AGG TCA 3936

3937 GGA GAT CAA GAC CAC CCT GGC TAA CAC GGT GAA ACC CCA TCT CTA CTA 3984

3985 AAA AAA AAA AAA AAA AA 4001

4.PP1494

A：核苷酸序列(SEQ ID NO：10) 长度：1648

1 GAGTACGGAC TGGGCCTGGC CTGGGGCGTC CCCGCGAAGC CTGGGCCTGT CAGGCGGTTC

61 CGTCCGGGTC TCGGCCACCG TCGAGTTCCG TCGAGTTCCG TCCCGGCCCT GCTCACAGCA

121 GCGCCCTCGG AGCGCCCAGC ACCTGCGGCC GGCCAGGCAG CGCGATCCTG CGGCGTCTGG

181 CCATCCCGAA TGCTATGGCC GCCGTCGCCG TCTTGCGGGC CTTCGGGGCA AGTGGGCCCA

241 TGTGTCTCCG GCGCGGCCCC TGGGCCCAGC TCCCCGCCCG CTTCTGCAGC CGGGACCCGG

301 CCGGGGCGGG GCGGCGGGAG TCGGAGCCGC GGCCCACCAG CGCGCGGCAG CTGGACGGCA

361 TAAGGAACAT CGTCTTGAGC AATCCCAAGA AGAGGAACAC GTTGTCACTT GCAATGCTGA

421 AATCTCTCCA AAGTGACATT CTTCATGACG CTGACAGCAA CGATCTGAAA GTCATTATCA

481 TCTCGGCTGA GGGGCCTGTG TTTTCTTCTG GGCATGACTT AAAGGAGCTG ACAGAGGAGC

541 AAGGCCGTGA TTACCATGCC GAAGTATTTC AGACCTGTTC CAAGGTCATG ATGCACATCC

601 GGAACCACCC CGTCCCCGTC ATTGCCATGG TCAATGGCCT GGCCACGGCT GCCGGCTGTC

661 AACTGGTTGC CAGCTGCGAC ATTGCCGTGG CGAGCGACAA GTCCTCTTTT GCCACTCCTG

721 GGGTGAACGT CGGGCTCTTC TGTTCTACCC CTGGGGTTGC CTTGGCAAGA GCAGTGCCTA

781 GAAAGGTGGC CTTGGAGATG CTCTTTACTG GTGAGCCCAT TTCTGCCCAG GAGGCCCTGC

841 TCCACGGGCT GCTTAGCAAG GTGGTGCCAG AGGCGGAGCT GCAGGAGGAG ACCATGCGGA

901 TCGCTAGGAA GATCGCATCG CTGAGCCGTC CGGTGGTATC CCTGGGCAAA GCCACCTTCT

961 ACAAGCAGCT GCCCCAGGAC CTGGGGACAG CTTACTACCT CACCTCCCAG GCCATGGTGG

1021 ACAACCTGGC CCTGCGGGAC GGGCAGGAGG GCATCACGGC CTTCCTCCAG AAGAGAAAAC

1081 CTGTCTGGTC ACACGAGCCA GTGTGAGTGG AGGCAGAGGA GTGAGGCCCA CGGGCAGCGC

1141 CCAGGAGCCC ACCTTCCCCT CTGGCCCAGC CACCACTGCC TCTCAGCTTA AACAGGTGAC

1201 AGGCTGCTTT CGTGACTTGA TATTGGTGTC ATAGCATTTG GCCTACATTA AAAGCCACAA

1261 TTTCATGGGG AAAGGACAAA ATGGAGGGTG ACTGAGGTGC TGACCTCAAT GCAAGGCTGG

1321 TGAACCCTGC AGCGGGCCAG CTATGGTGGG AAGCCTGGCA TTTGGGGTGC TCCTTGCAAC

1381 GTCTTAAGCA AGCGACCCCC CTGACATAGC AAAAGGTGGC AACCCATGGA GGCAGAAAGA

1441 AGGACGCCAG CCTGACCCTT ATCTGAAACG TCCTAAGCAG AGTTAATCCT GGCTGCTCAG

1501 GAGAGGCGAC ACATTTCAAA TCTCCACGAG ATATTCTCCA CACAGAAAAT CTTCTTGATT

1561 CTATAGAGAC TTAATCATGC CTATGGCTTT GAATAATCTT ATGTGATTTA AATAAATTAA

1621 ATCTTTATAA AAAAAAAAAA AAAAAAAA

B：氨基酸序列(SEQ ID NO：11) 长度：303

1 MAAVAVLRAF GASGPMCLRR GPWAQLPARF CSRDPAGAGR RESEPRPTSA RQLDGIRNIV

61 LSNPKKRNTL SLAMLKSLQS DILHDADSND LKVIIISAEG PVFSSGHDLK ELTEEQGRDY

121 HAEVFQTCSK VMMHIRNHPV PVIAMVNGLA TAAGCQLVAS CDIAVASDKS SFATPGVNVG

181 LFCSTPGVAL ARAVPRKVAL EMLFTGEPIS AQEALLHGLL SKVVPEAELQ EETMRIARKI

241 ASLSRPVVSL GKATFYKQLP QDLGTAYYLT SQAMVDNLAL RDGQEGITAF LQKRKPVWSH

301 EPV

C.核苷酸及氨基酸组合序列(SEQ ID NO：12) 克隆号：PP1494

起始编码子：195 ATG 终止编码子：1104 TGA 蛋白质分子量：32691.96

1 GA GTA CGG ACT GGG CCT GGC CTG GGG CGT CCC CGC GAA GCC TGG GCC 47

48 TGT CAG GCG GTT CCG TCC GGG TCT CGG CCA CCG TCG AGT TCC GTC GAG 95

96 TTC CGT CCC GGC CCT GCT CAC AGC AGC GCC CTC GGA GCG CCC AGC ACC 143

144 TGC GGC CGG CCA GGC AGC GCG ATC CTG CGG CGT CTG GCC ATC CCG AAT 191

192 GCT ATG GCC GCC GTC GCC GTC TTG CGG GCC TTC GGG GCA AGT GGG CCC 239

1 Met Ala Ala Val Ala Val Leu Arg Ala Phe Gly Ala Ser Gly Pro 15

240 ATG TGT CTC CGG CGC GGC CCC TGG GCC CAG CTC CCC GCC CGC TTC TGC 287

16 Met Cys Leu Arg Arg Gly Pro Trp Ala Gln Leu Pro Ala Arg Phe Cys 31

288 AGC CGG GAC CCG GCC GGG GCG GGG CGG CGG GAG TCG GAG CCG CGG CCC 335

32 Ser Arg Asp Pro Ala Gly Ala Gly Arg Arg Glu Ser Glu Pro Arg Pro 47

336 ACC AGC GCG CGG CAG CTG GAC GGC ATA AGG AAC ATC GTC TTG AGC AAT 383

48 Thr Ser Ala Arg Gln Leu Asp Gly Ile Arg Asn Ile Val Leu Ser Asn 63

384 CCC AAG AAG AGG AAC ACG TTG TCA CTT GCA ATG CTG AAA TCT CTC CAA 431

64 Pro Lys Lys Arg Asn Thr Leu Ser Leu Ala Met Leu Lys Ser Leu Gln 79

432 AGT GAC ATT CTT CAT GAC GCT GAC AGC AAC GAT CTG AAA GTC ATT ATC 479

80 Ser Asp Ile Leu His Asp Ala Asp Ser Asn Asp Leu Lys Val Ile Ile 95

480 ATC TCG GCT GAG GGG CCT GTG TTT TCT TCT GGG CAT GAC TTA AAG GAG 527

96 Ile Ser Ala Glu Gly Pro Val Phe Ser Ser Gly His Asp Leu Lys Glu 111

528 CTG ACA GAG GAG CAA GGC CGT GAT TAC CAT GCC GAA GTA TTT CAG ACC 575

112 Leu Thr Glu Glu Gln Gly Arg Asp Tyr His Ala Glu Val Phe Gln Thr 127

576 TGT TCC AAG GTC ATG ATG CAC ATC CGG AAC CAC CCC GTC CCC GTC ATT 623

128 Cys Ser Lys Val Met Met His Ile Arg Asn His Pro Val Pro Val Ile 143

624 GCC ATG GTC AAT GGC CTG GCC ACG GCT GCC GGC TGT CAA CTG GTT GCC 671

144 Ala Met Val Asn Gly Leu Ala Thr Ala Ala Gly Cys Gln Leu Val Ala 159

672 AGC TGC GAC ATT GCC GTG GCG AGC GAC AAG TCC TCT TTT GCC ACT CCT 719

160 Ser Cys Asp Ile Ala Val Ala Ser Asp Lys Ser Ser Phe Ala Thr Pro 175

720 GGG GTG AAC GTC GGG CTC TTC TGT TCT ACC CCT GGG GTT GCC TTG GCA 767

176 Gly Val Asn Val Gly Leu Phe Cys Ser Thr Pro Gly Val Ala Leu Ala 191

768 AGA GCA GTG CCT AGA AAG GTG GCC TTG GAG ATG CTC TTT ACT GGT GAG 815

192 Arg Ala Val Pro Arg Lys Val Ala Leu Glu Met Leu Phe Thr Gly Glu 207

816 CCC ATT TCT GCC CAG GAG GCC CTG CTC CAC GGG CTG CTT AGC AAG GTG 863

208 Pro Ile Ser Ala Gln Glu Ala Leu Leu His Gly Leu Leu Ser Lys Val 223

864 GTG CCA GAG GCG GAG CTG CAG GAG GAG ACC ATG CGG ATC GCT AGG AAG 911

224 Val Pro Glu Ala Glu Leu Gln Glu Glu Thr Met Arg Ile Ala Arg Lys 239

912 ATC GCA TCG CTG AGC CGT CCG GTG GTA TCC CTG GGC AAA GCC ACC TTC 959

240 Ile Ala Ser Leu Ser Arg Pro Val Val Ser Leu Gly Lys Ala Thr Phe 255

960 TAC AAG CAG CTG CCC CAG GAC CTG GGG ACA GCT TAC TAC CTC ACC TCC 1007

256 Tyr Lys Gln Leu Pro Gln Asp Leu Gly Thr Ala Tyr Tyr Leu Thr Ser 271

1008 CAG GCC ATG GTG GAC AAC CTG GCC CTG CGG GAC GGG CAG GAG GGC ATC 1055

272 Gln Ala Met Val Asp Asn Leu Ala Leu Arg Asp Gly Gln Glu Gly Ile 287

1056 ACG GCC TTC CTC CAG AAG AGA AAA CCT GTC TGG TCA CAC GAG CCA GTG 1103

288 Thr Ala Phe Leu Gln Lys Arg Lys Pro Val Trp Ser His Glu Pro Val 303

1104 TGA GTG GAG GCA GAG GAG TGA GGC CCA CGG GCA GCG CCC AGG AGC CCA 1151

304 *** 304

1152 CCT TCC CCT CTG GCC CAG CCA CCA CTG CCT CTC AGC TTA AAC AGG TGA 1199

1200 CAG GCT GCT TTC GTG ACT TGA TAT TGG TGT CAT AGC ATT TGG CCT ACA 1247

1248 TTA AAA GCC ACA ATT TCA TGG GGA AAG GAC AAA ATG GAG GGT GAC TGA 1295

1296 GGT GCT GAC CTC AAT GCA AGG CTG GTG AAC CCT GCA GCG GGC CAG CTA 1343

1344 TGG TGG GAA GCC TGG CAT TTG GGG TGC TCC TTG CAA CGT CTT AAG CAA 1391

1392 GCG ACC CCC CTG ACA TAG CAA AAG GTG GCA ACC CAT GGA GGC AGA AAG 1439

1440 AAG GAC GCC AGC CTG ACC CTT ATC TGA AAC GTC CTA AGC AGA GTT AAT 1487

1488 CCT GGC TGC TCA GGA GAG GCG ACA CAT TTC AAA TCT CCA CGA GAT ATT 1535

1536 CTC CAC ACA GAA AAT CTT CTT GAT TCT ATA GAG ACT TAA TCA TGC CTA 1583

1584 TGG CTT TGA ATA ATC TTA TGT GAT TTA AAT AAA TTA AAT CTT TAT AAA 1631

1632 AAA AAA AAA AAA AAA AA 1648

5.PP2386

A：核苷酸序列(SEQ ID NO：13) 长度：3835

1 CAGCAGGTGA GGGTGTGAGG ACAGGGGTTG CGGGAGGTGT CCAGGGCCCT GCACTGGGCC

61 CTGGCCAAGC CTAGCCAGTG GAGAAGGGAC AATGTTCACC CCTTCCCCCA TGTCTTGCAC

121 GGTCCCCTCT TGGCCTTGGG CTGAGTTGAA CACACAGGCA GCACAGGGAA GTACACGGGG

181 TGGACTGGCC TCTGGCACTG TCTGAACCCT AACACCAGTG GTGAATTTGT TTCCATGGAA

241 ACATGGCACT GTGTCCAGAC AACTGAATTC TGCCTCACCT TGTTCATAAA CTAGGGATTG

301 TCTGATATTG GTTTGTGTGG TTAGGCTTCT AGAGCTTATT AGAATAGACA TTGCAGATTA

361 TTATTTTGTA AAGGGTGACA TTGACTAAAA TAGAATAATG TCTTCATCGG TGAACAAGGG

421 TGTTTACTGA ATGTGGAGAA GTCAGTGAAA TCTCCACAGT GACAGATGCA CTCTGGAGAT

481 GGGGCTGAGG CTAGGTGTGC ACCTCCCCTG CCAGCCATCA GCAGCCTGCC CACGTCTGTC

541 GCGAAATGAG TTGTTGATCT TAAATTTCTG CAAATGTTTC TTGTTACAGA GTATGGTGTT

601 TGCGAAAACT TGCGGAAGCT GGAGATCACA GGCGTGTCTT GTCGGGACGT CTATGCGAAG

661 CTGCTTCACC GATATAGACA CATTTTGGGA TTGTGGCAGC CAGATATCGG GCCATACGGA

721 GGACTGCTGA ACGTGGTGGT GGACGGCCTG TTCATCATCG GGTGGATGTA CCTGCCTCCC

781 CATGACCCCC ACGTCGATGA CCCTATGAGA TTCAAGCCTC TGTTCAGGAT CCACCTGATG

841 GAGAGGAAGG CTGCCACAGT GGAGTGCATG TACGGCCACA AAGGGCCCCA CCACGGCCAC

901 ATCCAGATTG TGAAGAAGGA TGAGTTCTCC ACCAAGTGCA ACCAGACGGA CCACCACAGG

961 ATGTCCGGCG GGAGGCAGGA GGAGTTTCGG ACGTGGCTGA GGGAGGAATG GGGGCGCACG

1021 CTGGAGGACA TCTTCCACGA GCACATGCAG GAGCTCATCC TGATGAAGTT CATCTACACC

1081 AGTCAGTACG ACAACTGCCT GACCTACCGC CGCATCTACC TGCCGCCCAG CCGCCCCGAC

1141 GACCTCATCA AGCCTGGCCT CTTCAAAGGT ACCTATGGCA GCCACGGCCT GGAGATTGTG

1201 ATGCTCAGCT TCCACGGCCG GCGTGCCAGG GGCACCAAGA TCACGGGCGA CCCCAACATC

1261 CCCGCTGGGC AGCAGACAGT GGAGATCGAC CTGAGGCATC GGATCCAGCT GCCCGACCTC

1321 GAGAACCAGC GCAACTTCAA TGAGCTCTCC CGCATCGTCC TGGAGGTGCG CGAGAGGGTG

1381 CGCCAGGAGC AGCAGGAAGG CGGGCACGAG GCGGGCGAGG GTCGTGGCCG GCAGGGCCCC

1441 CGGGAGTCCG AGCCAAGCCC TGCCCAGCCC AGGGCAGAGG CGCCCAGCAA GGGCCCAGAT

1501 GGGACACCTG GTGAGGATGG TGGCGAGCCT GGGGATGCCG TAGCTGCGGC CGAGCAGCCT

1561 GCCCAGTGTG GGCAGGGGCA GCCGTTCGTG CTGCCCGTGG GCGTGAGCTC CAGGAATGAG

1621 GACTACCCCC GAACCTGCAG GATGTGTTTT TATGGCACAG GCCTCATCGC GGGCCACGGC

1681 TTCACCAGCC CTGAACGCAC CCCCGGGGTC TTCATCCTCT TCGATGAGGA CCGTTCGGGT

1741 TCGTCTGGCT GGAGCTGAAA TCCTTCAGCC TGTACAGCCG GGTCCAGGCC ACCTTCCGGA

1801 ACGCAGATGC GCCGTCCCCA CAGGCCTTCG ATGAGATGCT CAAGAACATT CAGTCCCTCA

1861 CCTCCTGACC GGCCACATCC TTGCCGCCAC ATCCCGGGTG GCTCTGGGGC TCTGAACTCT

1921 GACCTGTGAA TAGAAGCAGC ATGCACTTTG GAAATCCGGC CTTTTGACCA GAACGCACAC

1981 CTCGTCGGGG GGCCCAGTCC AGCCACCCCC CAGCACTTTA TGTAGAGAGT GTGACATAGA

2041 CCTGCATATT TGTCAGTGCC ATGATGGAAG AAGCTGAGCA TGTCTTACCA AAAACAGAGA

2101 GAACGAGCCT GAATACAGCA GATGTAGGGG ACAGCCGTGG GACCGCGTGA GAATTGAAGC

2161 GGTGGGGTTC CCGCACCCTG GGCTGGCTGG TGGTTTTCTC GGGAAGCAGG ACCCTCCTGA

2221 CTGGTGCTCT TCCTGTGAGC GGATAGAGTG ATAGACTGGG TCGTGTGTGA GACGCATGTG

2281 CTCCACCCCA CTCCTTTTGG GGGAAGCCAG GCAACAGTGG CCTCTGGGAG GGGGTCAGGA

2341 AGAGGCGAAC AGCTCAGGCA GCGCAGGTGT GATGGGCACA GTACGCAGAG CAAGCTCGGG

2401 AAGTTGGTAG GATCTCAGGC TTGGGGCCGG GACTCTGGAG TGAATCCCCA TTTCTCTACC

2461 GGCTTGCTTG GAGTTTGGAC AGAAGCATTT CACCTCTGAT CTCAGCTTCC CCACCTGTGG

2521 AGTGGGTTTA GTGACCTGAG TCACTAGGGA ATGTCACCTG AATGCACAGC CCAGCCCATG

2581 CACCTGCCCC AGCCCCTCCA GCTTTGGAGC CAAGGCCATC GTTCCAGCCA CTTGACTGTC

2641 CTCGACGGCC TGTTCCAGAC AGGGCGTTTG TTTTGTCCAT GCCTTCCTCC CTGCACGCAC

2701 ACGGCGTCAA AACCAAGCTG CCGGCCACTG TCTCCAGAAC GCAAGGCTCC AGGCCCGTGT

2761 GTCTGAAGCA GTGAGTGGTC CACACATGTG CCAGGAGTGC CCATATGAGA TGACGAGGAA

2821 ACCCCTTTGC AGGTGAGGGG ACAGCTTTCT AGAAAAGCCA CACCTGCATC TGGGGACACA

2881 CTTTGGAAAG TGGGACCCTC CAGCCTGGAG ACCCCATGGA CTGATGCCTC CACTGCTGTG

2941 TGCCCCATGT TGTGTTAACA CCTGCGTGTG GGGACCCCAT CTGAGGTCTT GCCTGACCTT

3001 GGCATCTCCT GAAGAACAGA GAGCACGGTG TCCAGAGCTG GCCCTTCCCC CAGCCCACAG

3061 CCAGCTCCGT GCCCGAGTGG GCGTCCCCAG CGAGCCTTCC CTCTCTGCCG CTTGTCCTTG

3121 TGTCTGGGCT GCTCCAAGTC CTTGTGCTGG GCACCCTGGA CACGTCCTGC TGGTGAGGGA

3181 CCTCGGGAAG GTGACAGTCT GTGTGCCTTG GTGTGGAGAC CAACCTGAGG ATGTCCTGGG

3241 AAATGTTTTC CTGATGAATT TCTCCTTGAC TGGCCTTTAA AGAACATAAG AATTCCCATT

3301 GCCCAGCCTC AGTGCATTTG GCAAATGCTT ACTTTGCTTC CCAGAGTCAG AGAATTGGCA

3361 AAGGTTCCTA AATGGTAATC TGGCCGGCCT GGGAGAAAGA CTCACGAGAA AAGCCAGTGG

3421 AGAAAGCGCC CTTCCAGGCG GCAGCAGCGG GAGCCACGCA GACCCCGAGG CGCACCTGCT

3481 GGCTCTTGTG TGTGGCCCCA GTTTCTAGCG GCTTTTGCAG CATTAGCCTA CAAGCTTTGT

3541 CACTCCCTGC CCTCTGTGGT GGTCACTGTT TTTCTCTCTT GCCAAATGAG GCAGTCTCTG

3601 AGTGACGGTG ACTGTGGCCT TGAAGCCTGG AGGACTGTTG GGCATGTAGA CTGGCACCTT

3661 GAAGATTCAC CATTGTTTAA ATAAAATCAA GCAAATGCTT TTTTACCAAG AGCCCGAGCC

3721 TCGCTCTAAG GGACGCAGTC CTAGAGGCGT GCCCTTTGGG GCTTGAAGAG CACACTGTGG

3781 GACGCACGTG CTTCTGATTA AAGGAATCTC AGATCTCAAA AAAAAAAAAA AAAAA

B：氨基酸序列(SEQ ID NO：14) 长度：394

1 MFLVTEYGVC ENLRKLEITG VSCRDVYAKL LHRYRHILGL WQPDIGPYGG LLNVVVDGLF

61 IIGWMYLPPH DPHVDDPMRF KPLFRIHLME RKAATVECMY GHKGPHHGHI QIVKKDEFST

121 KCNQTDHHRM SGGRQEEFRT WLREEWGRTL EDIFHEHMQE LILMKFIYTS QYDNCLTYRR

181 IYLPPSRPDD LIKPGLFKGT YGSHGLEIVM LSFHGRRARG TKITGDPNIP AGQQTVEIDL

241 RHRIQLPDLE NQRNFNELSR IVLEVRERVR QEQQEGGHEA GEGRGRQGPR ESEPSPAQPR

301 AEAPSKGPDG TPGEDGGEPG DAVAAAEQPA QCGQGQPFVL PVGVSSRNED YPRTCRMCFY

361 GTGLIAGHGF TSPERTPGVF ILFDEDRSGS SGWS

C.核苷酸及氨基酸组合序列(SEQ ID NO：15) 克隆号：PP2386

起始编码子：574 ATG 终止编码子：1756 TGA 蛋白质分子量：44662.29

1 CAG CAG GTG AGG GTG TGA GGA CAG GGG TTG CGG GAG GTG TCC AGG GCC 48

49 CTG CAC TGG GCC CTG GCC AAG CCT AGC CAG TGG AGA AGG GAC AAT GTT 96

97 CAC CCC TTC CCC CAT GTC TTG CAC GGT CCC CTC TTG GCC TTG GGC TGA 144

145 GTT GAA CAC ACA GGC AGC ACA GGG AAG TAC ACG GGG TGG ACT GGC CTC 192

193 TGG CAC TGT CTG AAC CCT AAC ACC AGT GGT GAA TTT GTT TCC ATG GAA 240

241 ACA TGG CAC TGT GTC CAG ACA ACT GAA TTC TGC CTC ACC TTG TTC ATA 288

289 AAC TAG GGA TTG TCT GAT ATT GGT TTG TGT GGT TAG GCT TCT AGA GCT 336

337 TAT TAG AAT AGA CAT TGC AGA TTA TTA TTT TGT AAA GGG TGA CAT TGA 384

385 CTA AAA TAG AAT AAT GTC TTC ATC GGT GAA CAA GGG TGT TTA CTG AAT 432

433 GTG GAG AAG TCA GTG AAA TCT CCA CAG TGA CAG ATG CAC TCT GGA GAT 480

481 GGG GCT GAG GCT AGG TGT GCA CCT CCC CTG CCA GCC ATC AGC AGC CTG 528

529 CCC ACG TCT GTC GCG TTA TGA GTT GTT GAT CTT AAA TTT CTG CAA ATG 576

1 Met 1

577 TTT CTT GTT ACA GAG TAT GGT GTT TGC GAA AAC TTG CGG AAG CTG GAG 624

2 Phe Leu Val Thr Glu Tyr Gly Val Cys Glu Asn Leu Arg Lys Leu Glu 17

625 ATC ACA GGC GTG TCT TGT CGG GAC GTC TAT GCG AAG CTG CTT CAC CGA 672

18 Ile Thr Gly Val Ser Cys Arg Asp Val Tyr Ala Lys Leu Leu His Arg 33

673 TAT AGA CAC ATT TTG GGA TTG TGG CAG CCA GAT ATC GGG CCA TAC GGA 720

34 Tyr Arg His Ile Leu Gly Leu Trp Gln Pro Asp Ile Gly Pro Tyr Gly 49

721 GGA CTG CTG AAC GTG GTG GTG GAC GGC CTG TTC ATC ATC GGG TGG ATG 768

50 Gly Leu Leu Asn Val Val Val Asp Gly Leu Phe Ile Ile Gly Trp Met 65

769 TAC CTG CCT CCC CAT GAC CCC CAC GTC GAT GAC CCT ATG AGA TTC AAG 816

66 Tyr Leu Pro Pro His Asp Pro His Val Asp Asp Pro Met Arg Phe Lys 81

817 CCT CTG TTC AGG ATC CAC CTG ATG GAG AGG AAG GCT GCC ACA GTG GAG 864

82 Pro Leu Phe Arg Ile His Leu Met Glu Arg Lys Ala Ala Thr Val Glu 97

865 TGC ATG TAC GGC CAC AAA GGG CCC CAC CAC GGC CAC ATC CAG ATT GTG 912

98 Cys Met Tyr Gly His Lys Gly Pro His His Gly His Ile Gln Ile Val 113

913 AAG AAG GAT GAG TTC TCC ACC AAG TGC AAC CAG ACG GAC CAC CAC AGG 960

114 Lys Lys Asp Glu Phe Ser Thr Lys Cys Asn Gln Thr Asp His His Arg 129

961 ATG TCC GGC GGG AGG CAG GAG GAG TTT CGG ACG TGG CTG AGG GAG GAA 1008

130 Met Ser Gly Gly Arg Gln Glu Glu Phe Arg Thr Trp Leu Arg Glu Glu 145

1009 TGG GGG CGC ACG CTG GAG GAC ATC TTC CAC GAG CAC ATG CAG GAG CTC 1056

146 Trp Gly Arg Thr Leu Glu Asp Ile Phe His Glu His Met Gln Glu Leu 161

1057 ATC CTG ATG AAG TTC ATC TAC ACC AGT CAG TAC GAC AAC TGC CTG ACC 1104

162 Ile Leu Met Lys Phe Ile Tyr Thr Ser Gln Tyr Asp Asn Cys Leu Thr 177

1105 TAC CGC CGC ATC TAC CTG CCG CCC AGC CGC CCC GAC GAC CTC ATC AAG 1152

178 Tyr Arg Arg Ile Tyr Leu Pro Pro Ser Arg Pro Asp Asp Leu Ile Lys 193

1153 CCT GGC CTC TTC AAA GGT ACC TAT GGC AGC CAC GGC CTG GAG ATT GTG 1200

194 Pro Gly Leu Phe Lys Gly Thr Tyr Gly Ser His Gly Leu Glu Ile Val 209

1201 ATG CTC AGC TTC CAC GGC CGG CGT GCC AGG GGC ACC AAG ATC ACG GGC 1248

210 Met Leu Ser Phe His Gly Arg Arg Ala Arg Gly Thr Lys Ile Thr Gly 225

1249 GAC CCC AAC ATC CCC GCT GGG CAG CAG ACA GTG GAG ATC GAC CTG AGG 1296

226 Asp Pro Asn Ile Pro Ala Gly Gln Gln Thr Val Glu Ile Asp Leu Arg 241

1297 CAT CGG ATC CAG CTG CCC GAC CTC GAG AAC CAG CGC AAC TTC AAT GAG 1344

242 His Arg Ile Gln Leu Pro Asp Leu Glu Asn Gln Arg Asn Phe Asn Glu 257

1345 CTC TCC CGC ATC GTC CTG GAG GTG CGC GAG AGG GTG CGC CAG GAG CAG 1392

258 Leu Ser Arg Ile Val Leu Glu Val Arg Glu Arg Val Arg Gln Glu Gln 273

1393 CAG GAA GGC GGG CAC GAG GCG GGC GAG GGT CGT GGC CGG CAG GGC CCC 1440

274 Gln Glu Gly Gly His Glu Ala Gly Glu Gly Arg Gly Arg Gln Gly Pro 289

1441 CGG GAG TCC GAG CCA AGC CCT GCC CAG CCC AGG GCA GAG GCG CCC AGC 1488

290 Arg Glu Ser Glu Pro Ser Pro Ala Gln Pro Arg Ala Glu Ala Pro Ser 305

1489 AAG GGC CCA GAT GGG ACA CCT GGT GAG GAT GGT GGC GAG CCT GGG GAT 1536

306 Lys Gly Pro Asp Gly Thr Pro Gly Glu Asp Gly Gly Glu Pro Gly Asp 321

1537 GCC GTA GCT GCG GCC GAG CAG CCT GCC CAG TGT GGG CAG GGG CAG CCG 1584

322 Ala Val Ala Ala Ala Glu Gln Pro Ala Gln Cys Gly Gln Gly Gln Pro 337

1585 TTC GTG CTG CCC GTG GGC GTG AGC TCC AGG AAT GAG GAC TAC CCC CGA 1632

338 Phe Val Leu Pro Val Gly Val Ser Ser Arg Asn Glu Asp Tyr Pro Arg 353

1633 ACC TGC AGG ATG TGT TTT TAT GGC ACA GGC CTC ATC GCG GGC CAC GGC 1680

354 Thr Cys Arg Met Cys Phe Tyr Gly Thr Gly Leu Ile Ala Gly His Gly 369

1681 TTC ACC AGC CCT GAA CGC ACC CCC CGG GTC TTC ATC CTC TTC GAT GAG 1728

370 Phe Thr Ser Pro Glu Arg Thr Pro Gly Val Phe Ile Leu Phe Asp Glu 385

1729 GAC CGT TCG GGT TCG TCT GGC TGG AGC TGA AAT CCT TCA GCC TGT ACA 1776

386 Asp Arg Ser Gly Ser Ser Gly Trp Ser *** 395

1777 GCC GGG TCC AGG CCA CCT TCC GGA ACG CAG ATG CGC CGT CCC CAC AGG 1824

1825 CCT TCG ATG AGA TGC TCA AGA ACA TTC AGT CCC TCA CCT CCT GAC CGG 1872

1873 CCA CAT CCT TGC CGC CAC ATC CCG GGT GGC TCT GGG GCT CTG AAC TCT 1920

1921 GAC CTG TGA ATA GAA GCA GCA TGC ACT TTG GAA ATC CGG CCT TTT GAC 1968

1969 CAG AAC GCA CAC CTC GTC GGG GGG CCC AGT CCA GCC ACC CCC CAG CAC 2016

2017 TTT ATG TAG AGA GTG TGA CAT AGA CCT GCA TAT TTG TCA GTG CCA TGA 2064

2065 TGG AAG AAG CTG AGC ATG TCT TAC CAA AAA CAG AGA GAA CGA GCC TGA 2112

2113 ATA CAG CAG ATG TAG GGG ACA GCC GTG GGA CCG CGT GAG AAT TGA AGC 2160

2161 GGT GGG GTT CCC GCA CCC TGG GCT GGC TGG TGG TTT TCT CGG GAA GCA 2208

2209 GGA CCC TCC TGA CTG GTG CTC TTC CTG TGA GCG GAT AGA GTG ATA GAC 2256

2257 TGG GTC GTG TGT GAG ACG CAT GTG CTC CAC CCC ACT CCT TTT GGG GGA 2304

2305 AGC CAG GCA ACA GTG GCC TCT GGG AGG GGG TCA GGA AGA GGC GAA CAG 2352

2353 CTC AGG CAG CGC AGG TGT GAT GGG CAC AGT ACG CAG AGC AAG CTC GGG 2400

2401 AAG TTG GTA GGA TCT CAG GCT TGG GGC CGG GAC TCT GGA GTG AAT CCC 2448

2449 CAT TTC TCT ACC GGC TTG CTT GGA GTT TGG ACA GAA GCA TTT CAC CTC 2496

2497 TGA TCT CAG CTT CCC CAC CTG TGG AGT GGG TTT AGT GAC CTG AGT CAC 2544

2545 TAG GGA ATG TCA CCT GAA TGC ACA GCC CAG CCC ATG CAC CTG CCC CAG 2592

2593 CCC CTC CAG CTT TGG AGC CAA GGC CAT CGT TCC AGC CAC TTG ACT GTC 2640

2641 CTC GAC GGC CTG TTC CAG ACA GGG CGT TTG TTT TGT CCA TGC CTT CCT 2688

2689 CCC TGC ACG CAC ACG GCG TCA AAA CCA AGC TGC CGG CCA CTG TCT CCA 2736

2737 GAA CGC AAG GCT CCA GGC CCG TGT GTC TGA AGC AGT GAG TGG TCC ACA 2784

2785 CAT GTG CCA GGA GTG CCC ATA TGA GAT GAC GAG GAA ACC CCT TTG CAG 2832

2833 GTG AGG GGA CAG CTT TCT AGA AAA GCC ACA CCT GCA TCT GGG GAC ACA 2880

2881 CTT TGG AAA GTG GGA CCC TCC AGC CTG GAG ACC CCA TGG ACT GAT GCC 2928

2929 TCC ACT GCT GTG TGC CCC ATG TTG TGT TAA CAC CTG CGT GTG GGG ACC 2976

2977 CCA TCT GAG GTC TTG GCT GAG GTT GGC ATC TCC TGA AGA ACA GAG AGC 3024

3025 ACG GTG TCC AGA GCT GGC CCT TCC CCC AGC CCA CAG CCA GCT CCG TGC 3072

3073 CCG AGT GGG CGT CCC CAG CGA GCC TTC CCT CTC TGC CGC TTG TCC TTG 3120

3121 TGT CTG GGC TGC TCC AAG TCC TTG TGC TGG GCA CCC TGG ACA CGT CCT 3168

3169 GCT GGT GAG GGA CCT CGG GAA GGT GAC AGT CTG TGT GCC TTG GTG TGG 3216

3217 AGA CCA ACC TGA GGA TGT CCT GGG AAA TGT TTT CCT GAT GAA TTT CTC 3264

3265 CTT GAC TGG CCT TTA AAG AAC ATA AGA ATT CCC ATT GCC CAG CCT CAG 3312

3313 TGC ATT TGG CAA ATG CTT ACT TTG CTT CCC AGA GTC AGA GAA TTG GCA 3360

3361 AAG GTT CCT AAA TGG TAA TCT GGC CGG CCT GGG AGA AAG ACT CAC GAG 3408

3409 AAA AGC CAG TGG AGA AAG CGC CCT TCC AGG CGG CAG CAG CGG GAG CCA 3456

3457 CGC AGA CCC CGA GGC GCA CCT GCT GGC TCT TGT GTG TGG CCC CAG TTT 3504

3505 CTA GCG GCT TTT GCA GCA TTA GCC TAC AAG CTT TGT CAC TCC CTG CCC 3552

3553 TCT GTG GTG GTC ACT GTT TTT CTC TCT TGC CAA ATG AGG CAG TCT CTG 3600

3601 AGT GAC GGT GAC TGT GGC CTT GAA GCC TGG AGG ACT GTT GGG CAT GTA 3648

3649 GAC TGG CAC CTT GAA GAT TCA CCA TTG TTT AAA TAA AAT CAA GCA AAT 3696

3697 GCT TTT TTA CCA AGA GCC CGA GCC TCG CTC TAA GGG ACG CAG TCC TAG 3744

3745 AGG CGT GCC CTT TGG GGC TTG AAG AGC ACA CTG TGG GAC GCA CGT GCT 3792

3793 TCT GAT TAA AGG AAT CTC AGA TCT CAA AAA AAA AAA AAA AAA A 3835

6.PP6170

A：核苷酸序列(SEQ ID NO：16) 长度：1715

1 GTTTTGTCTG GGGGTCGTTG CCCCCCCACT GTTGGCACCT CCCAACACAC TGCCACGTGG

61 GGGTGGAGGT GGCAGCCCCC ATGAGACCCA GCCCCAGCTC AGCCCCTCAC AGGCAAGATG

121 TCAGCCCCAC CCAGGTTGGT CGGTCTCTCT CTCTCTGTCT CTCCCACCCC CTTCTCTACC

181 CCCGTCCCTT GCCTTAAACC CCTGATCCTG CTCTCCTCTG CCCCTGCCGC CCCCACCTGC

241 CTTTTTTAGA CAAAACCAGG GGTGATCCAG CCATTGGCTC AGGCCTGGCC AAGGGGCTCC

301 CCAGCCCCCA GGGGCAGAGG TTGTCCCCAC TCCGTGAGTG CTCTGTCCCG TGGGTGGGGG

361 TGGCAGAGCC TCCTTCCCCA GCAGGATGGT GGGTGGGGAT CAAAGGCAGG CGGGGGGACA

421 GGCGGGGGGA CAGCCGGTGG TGAGTTGCAC ACAGCTGCAG CCCCGACAGC TGCCCCAGCA

481 TAGCTCACAA GAGCCCCACC CCCCAGCCGC CCTCCCCGCC TTCTCCGGAT GAGCTGCCCG

541 CCAATGTGAA GCAGGCCTAC AGGGCCTTCG CGGCCGTGCC CACTTCTCAC CCGCCTGAGG

601 ATGCCCCTGC CCAGCCCCCC ACGCCTGGGC CTGCAGCCTC CCCGGAGCAG CTGTCCTTCC

661 GGGAGCGGCA GAAGTACTTT GAGCTGGAGG TGCGCGTGCC CCAGGCCGAG GGCCCCCCTA

721 AGCGCGTGTC CCTGGTGGGT GCTGCGACCT GCGGAAGATG CAGGAGGAGG AAGCCAGAAA

781 ACTACAGCAG AAGAGAGCGC AGATGCTGCG GGAGGCGGCA GAGGCTGGGG CCGAAGCGAG

841 GCTCGCCCTG GACGGGGAGA CGCTGGGCGA GGAGGAACAG GAGGATGAGC AGCCACCCTG

901 GGCCAGCCCG AGCCCCACCT CAAGAGCCCG GCGTCCCCCC CGCCCCTGGG AGGTGGCGCC

961 CCGGTGCGGA CGGCCAAAGC TGAACGGCGC CACCAGGAGC GGCTGCGCGT GCAGAGTCCG

1021 GAGCCACCGG CACCCGAGCG TGCCCTGTCC CCTGCCGAGC TCCGGGCCCT GGAGGCCGAG

1081 AAGCGTGCGC TGTGGAGGGC AGCCAGGATG AAGTCATTGG AACAGGACGC TCTCCGAGCA

1141 CAGATGGTCC TCAGCAGGTC CCAGGAAGGC CGGGGCACGC GGGGGCCCCT GGAGCGACTG

1201 GCCGAGGCCC CTTCCCCTGC GCCCACCCCG TCGCCCACCC CTGTGGAAGT CACCGGACTT

1261 TGCTGAGGAG TTGAGGTCCC TGGAACCATC TCCCAGCCCT GGCCCGCAGG AGGAGGATGG

1321 AGAAGTGGCT CTGGTGCTTC TGGGCAGGCC CTCACCCGGC GCTGTGGGCC CTGAAGATGT

1381 GGCACTGTGC AGCAGCCGCC GCCCCGTAAG GCCTGGGCGC CGTGGCCTGG GCCCTGTGCC

1441 CTCCTAGAGG AGCAGGCACC TCCCCCAGAC TTGGGGTGGG GGCCCTGCCA GCTCCAGCAC

1501 CACCCTTGCC CCAAGTCTTT TAACCTGGGT GTTAGCATTT TAAAGAGACC CCACAGGAGT

1561 TCTGGCCTGT GACTAACTAA CTGCCCCACC CCAGCCGAGA CCTCGGCGAG ACTGTAACTA

1621 GTGATGTTTG TACAACCAAA GACTCTATTT TGTGGTTTAA GGAGAATAAA GTTGACTACA

1681 TTTTAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAA

B：氨基酸序列(SEQ ID NO：17) 长度：117

1 MQEEEARKLQ QKRAQMLREA AEAGAEARLA LDGETLGEEE QEDEQPPWAS PSPTSRARRP

61 PRPWEVAPRC GRPKLNGATR SGCACRVRSH RHPSVPCPLP SSGPWRPRSV RCGGQPG

C.核苷酸及氨基酸组合序列(SEQ ID NO：18) 克隆号：PP6170

起始编码子：758 ATG 终止编码子：1109 TGA 蛋白质分子量：12911.82

1 G TTT TGT CTG GGG GTC GTT GCC CCC CCA CTG TTG GCA CCT CCC AAC 46

47 ACA CTG CCA CGT GGG GGT GGA GGT GGC AGC CCC CAT GAG ACC CAG CCC 94

95 CAG CTC AGC CCC TCA CAG GCA AGA TGT CAG CCC CAC CCA GGT TGG TCG 142

143 GTC TCT CTC TCT CTG TCT CTC CCA CCC CCT TCT CTA CCC CCG TCC CTT 190

191 GCC TTA AAC CCC TGA TCC TGC TCT CCT CTG CCC CTG CCG CCC CCA CCT 238

239 GCC TTT TTT AGA CAA AAC CAG GGG TGA TCC AGC CAT TGG CTC AGG CCT 286

287 GGC CAA GGG GCT CCC CAG CCC CCA GGG GCA GAG GTT GTC CCC ACT CCG 334

335 TGA GTG CTC TGT CCC GTG GGT GGG GGT GGC AGA GCC TCC TTC CCC AGC 382

383 AGG ATG GTG GGT GGG GAT CAA AGG CAG GCG GGG GGA CAG GCG GGG GGA 430

431 CAG CCG GTG GTG AGT TGC ACA CAG CTG CAG CCC CGA CAG CTG CCC CAG 478

479 CAT AGC TCA CAA GAG CCC CAC CCC CCA GCC GCC CTC CCC GCC TTC TCC 526

527 GGA TGA GCT GCC CGC CAA TGT GAA GCA GGC CTA CAG GGC CTT CGC GGC 574

575 CGT GCC CAC TTC TCA CCC GCC TGA GGA TGC CCC TGC CCA GCC CCC CAC 622

623 GCC TGG GCC TGC AGC CTC CCC GGA GCA GCT GTC CTT CCG GGA GCG GCA 670

671 GAA GTA CTT TGA GCT GGA GGT GCG CGT GCC CCA GGC CGA GGG CCC CCC 718

719 TAA GCG CGT GTC CCT GGT GGG TGC TGC GAC CTG CGG AAG ATG CAG GAG 766

1 Met Gln Glu 3

767 GAG GAA GCC AGA AAA CTA CAG CAG AAG AGA GCG CAG ATG CTG CGG GAG 814

4 Glu Glu Ala Arg Lys Leu Gln Gln Lys Arg Ala Gln Met Leu Arg Glu 19

815 GCG GCA GAG GCT GGG GCC GAA GCG AGG CTC GCC CTG GAC GGG GAG ACG 862

20 Ala Ala Glu Ala Gly Ala Glu Ala Arg Leu Ala Leu Asp Gly Glu Thr 35

863 CTG GGC GAG GAG GAA CAG GAG GAT GAG CAG CCA CCC TGG GCC AGC CCG 910

36 Leu Gly Glu Glu Glu Gln Glu Asp Glu Gln Pro Pro Trp Ala Ser Pro 51

911 AGC CCC ACC TCA AGA GCC CGG CGT CCC CCC CGC CCC TGG GAG GTG GCG 958

52 Ser Pro Thr Ser Arg Ala Arg Arg Pro Pro Arg Pro Trp Glu Val Ala 67

959 CCC CGG TGC GGA CGG CCA AAG CTG AAC GGC GCC ACC AGG AGC GGC TGC 1006

68 Pro Arg Cys Gly Arg Pro Lys Leu Asn Gly Ala Thr Arg Ser Gly Cys 83

1007 GCG TGC AGA GTC CGG AGC CAC CGG CAC CCG AGC GTG CCC TGT CCC CTG 1054

84 Ala Cys Arg yal Arg Ser His Arg His Pro Ser Val Pro Cys Pro Leu 99

1055 CCG AGC TCC GGG CCC TGG AGG CCG AGA AGC GTG CGC TGT GGA GGG CAG 1102

100 Pro Ser Ser Gly Pro Trp Arg Pro Arg Ser Val Arg Cys Gly Gly Gln 115

1103 CCA GGA TGA AGT CAT TGG AAC AGG ACG CTC TCC GAG CAC AGA TGG TCC 1150

116 Pro Gly *** 118

1151 TCA GCA GGT CCC AGG AAG GCC GGG GCA CGC GGG GGC CCC TGG AGC GAC 1198

1199 TGG CCG AGG CCC CTT CCC CTG CGC CCA CCC CGT CGC CCA CCC CTG TGG 1246

1247 AAG TCA CCG GAC TTT GCT GAG GAG TTG AGG TCC CTG GAA CCA TCT CCC 1294

1295 AGC CCT GGC CCG CAG GAG GAG GAT GGA GAA GTG GCT CTG GTG CTT CTG 1342

1343 GGC AGG CCC TCA CCC GGC GCT GTG GGC CCT GAA GAT GTG GCA CTG TGC 1390

1391 AGC AGC CGC CGC CCC GTA AGG CCT GGG CGC CGT GGC CTG GGC CCT GTG 1438

1439 CCC TCC TAG AGG AGC AGG CAC CTC CCC CAG ACT TGG GGT GGG GGC CCT 1486

1487 GCC AGC TCC AGC ACC ACC CTT GCC CCA AGT CTT TTA ACC TGG GTG TTA 1534

1535 GCA TTT TAA AGA GAC CCC ACA GGA GTT CTG GCC TGT GAC TAA CTA ACT 1582

1583 GCC CCA CCC CAG CCG AGA CCT CGG CGA GAC TGT AAC TAG TGA TGT TTG 1630

1631 TAC AAC CAA AGA CTC TAT TTT GTG GTT TAA GGA GAA TAA AGT TGA CTA 1678

1679 CAT TTT AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA A 1715

7.PP7684

A：核苷酸序列 (SEQ ID NO：19) 长度：1534

1 GCAGGCACTA AGCTGGGCAC TGGGAATGTA ATAAAATAGT CAAGGTCCCA CCTTCTAAGA

61 CTGTCCGACA GGGAAACGAA CAAGAGTCAA ATAAGGCAGA AGATGTGATG TAATACACCT

121 ACGAAATCTC AGAGGGTTGT AGGGTCGTGG GAGCTCAAGT GAGACACTTA ACCTGGCCTG

181 AGACATTCCA GAAGGCCTCC TGAAGAACTG ACATCTGAAC TGAGAACTGA AGGAAGATGA

241 GTACTAGTGA GGCTACCGGA CGTGAATGTG GAGATTGTGC AGGGCAATGC AAGAGGAGGC

301 TGTAGAAGTC AACCTGGCTA GATCACAGCG GGGTGTATGT GGGGCAGGAG CTTCTTTGTT

361 TGAATTTGCT CCTGAGAGGA TGAGGCCTCC TAGAGCACTG GCTCCTGGAC AGCAACCTCC

421 TTTGGTGCCT TGTGACCAGG GCCCTGATGG TTCATTAGAT GGAGCCTTCG AGTCTTAGGG

481 AGTTGCCGCA GGGTCCCCAC AGCGGCTCCC GACGGTTGTG AACCAGCATC CATTCTCCAC

541 GGATTCCGGC AACCCGCCTG GCCCTGGACG TGTCTCAACT GGCCCGCGTG AGGGGCCGCC

601 CCGGAAATGA CGCGCTGCCC CGCTGGCCAA GCGGAAGTGG AGATGGCGGA GCTGTACGTG

661 AAGCCGGGCA ACAAGGAACG CGGCTGGAAC GACCCGCCGC AGTTCTCATA CGGGCTGCAG

721 ACCCAGGCCG GCGGACCCAG GCGCTCGCTG CTTACCAAGA GGGTAGCCGC ACCCCAGGAT

781 GGATCCCCCA GAGTCCCCGC ATCAGAGACT TCTCCTGGGC CTCCCCCAAT GGGGCCTCCA

841 CCTCCTTCAA GTAAGGCTCC CAGGTCCCCA CCTGTGGGGA GTGGTCCTGC CTCTGGCGTG

901 GAGCCCACAA GTTTCCCAGT CGAGTCTGAG GCTCGACTGA TGGAGGATGT GCTGAGACCT

961 TTGGAACAGG CATTGGAAGA CTGCCGTGGC CACACAAGGA AGCAGGTATG TGATGACATC

1021 AGCCGACGCC TGGCACTGCT GCAGGAACAG TGGGCTGGAG GAAAGTTGTC AATACCTGTA

1081 AAGAAGAGAA TGGCTCTACT GGTGCAAGAG CTTTCAAGCC ACCGGTGGGA CGCAGCAGAT

1141 GACATCCACC GCTCCCTCAT GGTTGACCAT GTGACTGAGG TCAGTCAGTG GATGGTAGGA

1201 GTTAAAAGAT TAATTGCAGA AAAGAGGAGT CTGTTTTCAG AGGAGGCAGC CAATGAAGAG

1261 AAATCTGCAG CCACAGCTGA GAAGAACCAT ACCATACCAG GCTTCCAGCA GGCTTCATAA

1321 TCCTCGGTTC CCCAGACTCA CCGGACACCA TCTCCTATGC CTTGGAGACC TTCTGTCACT

1381 TGGCTCCCTT CTTACCACCA CCAAGACTGT CCCACTGGGC CTGACCCACC TATGAGGGAA

1441 GAAGTCCCAC CTGGGCCAGA GGGAGTTCAT GTGTTACTCA TAACATGCAT TTCAATAAAA

1501 ACATCTCTGC GGTGGAAAAA AAAAAAAAAA AAAA

B：氨基酸序列(SEQ ID NO：20) 长度：237

1 MTRCPAGQAE VEMAELYVKP GNKERGWNDP PQFSYGLQTQ AGGPRRSLLT KRVAAPQDGS

61 PRVPASETSP GPPPMGPPPP SSKAPRSPPV GSGPASGVEP TSFPVESEAR LMEDVLRPLE

121 QALEDCRGHT RKQVCDDISR RLALLQEQWA GGKLSIPVKK RMALLVQELS SHRWDAADDI

181 HRSLMVDHVT EVSQWMVGVK RLIAEKRSLF SEEAANEEKS AATAEKNHTI PGFQQAS

C.核苷酸及氨基酸组合序列(SEQ ID NO：21) 克隆号：PP7684

起始编码子：607 ATG 终止编码子：1318 TAA 蛋白质分子量：25841.84

1 GCA GGC ACT AAG CTG GGC ACT GGG AAT GTA ATA AAA TAG TCA AGG TCC 48

49 CAC CTT CTA AGA CTG TCC GAC AGG GAA ACG AAC AAG AGT CAA ATA AGG 96

97 CAG AAG ATG TGA TGT AAT ACA CCT ACG AAA TCT CAG AGG GTT GTA GGG 144

145 TCG TGG GAG CTC AAG TGA GAC ACT TAA CCT GGC CTG AGA CAT TCC AGA 192

193 AGG CCT CCT GAA GAA CTG ACA TCT GAA CTG AGA ACT GAA GGA AGA TGA 240

241 GTA CTA GTG AGG CTA CCG GAC GTG AAT GTG GAG ATT GTG CAG GGC AAT 288

289 GCA AGA GGA GGC TGT AGA AGT CAA CCT GGC TAG ATC ACA GCG GGG TGT 336

337 ATG TGG GGC AGG AGC TTC TTT GTT TGA ATT TGC TCC TGA GAG GAT GAG 384

385 GCC TCC TAG AGC ACT GGC TCC TGG ACA GCA ACC TCC TTT GGT GCC TTG 432

433 TGA CCA GGG CCC TGA TGG TTC ATT AGA TGG AGC CTT CGA GTC TTA GGG 480

481 AGT TGC CGC AGG GTC CCC ACA GCG GCT CCC GAC GGT TGT GAA CCA GCA 528

529 TCC ATT CTC CAC GGA TTC CGG CAA CCC GCC TGG CCC TGG ACG TGT CTC 576

577 AAC TGG CCC GCG TGA GGG GCC GCC CCG GAA ATG ACG CGC TGC CCC GCT 624

1 Met Thr Arg Cys Pro Ala 6

625 GGC CAA GCG GAA GTG GAG ATG GCG GAG CTG TAC GTG AAG CCG GGC AAC 672

7 Gly Gln Ala Glu Val Glu Met Ala Glu Leu Tyr Val Lys Pro Gly Asn 22

673 AAG GAA CGC GGC TGG AAC GAC CCG CCG CAG TTC TCA TAC GGG CTG CAG 720

23 Lys Glu Arg Gly Trp Asn Asp Pro Pro Gln Phe Ser Tyr Gly Leu Gln 38

721 ACC GAG GCC GGC GGA CCC AGG CGC TCG CTG CTT ACC AAG AGG GTA GCC 768

39 Thr Gln Ala Gly Gly Pro Arg Arg Ser Leu Leu Thr Lys Arg Val Ala 54

769 GCA CCC CAG GAT GGA TCC CCC AGA GTC CCC GCA TCA GAG ACT TCT CCT 816

55 Ala Pro Gln Asp Gly Ser Pro Arg Val Pro Ala Ser Glu Thr Ser Pro 70

817 GGG CCT CCC CCA ATG GGG CCT CCA CCT CCT TCA AGT AAG GCT CCC AGG 864

71 Gly Pro Pro Pro Met Gly Pro Pro Pro Pro Ser Ser Lys Ala Pro Arg 86

865 TCC CCA CCT GTG GGG AGT GGT CCT GCC TCT GGC GTG GAG CCC ACA AGT 912

87 Ser Pro Pro Val Gly Ser Gly Pro Ala Ser Gly Val Glu Pro Thr Ser 102

913 TTC CCA GTC GAG TCT GAG GCT CGA CTG ATG GAG GAT GTG CTG AGA CCT 960

103 Phe Pro Val Glu Ser Glu Ala Arg Leu Met Glu Asp Val Leu Arg Pro 118

961 TTG GAA CAG GCA TTG GAA GAC TGC CGT GGC CAC ACA AGG AAG CAG GTA 1008

119 Leu Glu Gln Ala Leu Glu Asp Cys Arg Gly His Thr Arg Lys Gln Val 134

1009 TGT GAT GAC ATC AGC CGA CGC CTG GCA CTG CTG CAG GAA CAG TGG GCT 1056

135 Cys Asp Asp Ile Ser Arg Arg Leu Ala Leu Leu Gln Glu Gln Trp Ala 150

1057 GGA GGA AAG TTG TCA ATA CCT GTA AAG AAG AGA ATG GCT CTA CTG GTG 1104

151 Gly Gly Lys Leu Ser Ile Pro Val Lys Lys Arg Met Ala Leu Leu Val 166

1105 CAA GAG CTT TCA AGC CAC CGG TGG GAC GCA GCA GAT GAC ATC CAC CGC 1152

167 Gln Glu Leu Ser Ser His Arg Trp Asp Ala Ala Asp Asp Ile His Arg 182

1153 TCC CTC ATG GTT GAC CAT GTG ACT GAG GTC AGT CAG TGG ATG GTA GGA 1200

183 Ser Leu Met Val Asp His Val Thr Glu Val Ser Gln Trp Met Val Gly 98

1201 GTT AAA AGA TTA ATT GCA GAA AAG AGG AGT CTG TTT TCA GAG GAG GCA 1248

199 Val Lys Arg Leu Ile Ala Glu Lys Arg Ser Leu Phe Ser Glu Glu Ala 214

1249 GCC AAT GAA GAG AAA TCT GCA GCC ACA GCT GAG AAG AAC CAT ACC ATA 1296

215 Ala Asn Glu Glu Lys Ser Ala Ala Thr Ala Glu Lys Asn His Thr Ile 230

1297 CCA GGC TTC CAG CAG GCT TCA TAA TCC TCG GTT CCC CAG ACT CAC CGG 1344

231 Pro Gly Phe Gln Gln Ala Ser *** 238

1345 ACA CCA TCT CCT ATG CCT TGG AGA CCT TCT GTC ACT TGG CTC CCT TCT 1392

1393 TAC CAC CAC CAA GAC TGT CCC ACT GGG CCT GAC CCA CCT ATG AGG GAA 1440

1441 GAA GTC CCA CCT GGG CCA GAG GGA GTT CAT GTG TTA CTC ATA ACA TGC 1488

1489 ATT TCA ATA AAA ACA TCT CTG CGG TGG AAA AAA AAA AAA AAA AAA A 1534

8.PP7704

A：核苷酸序列(SEQ ID NO：22) 长度：2101

1 GATTTTGTTT TGGACACCGA GCAGGAGCTG GCGGCCGCTG CAGACGAAAG GCAGGAAAGG

61 GCAGGCCGGG TGAGCAGACG GATCGGCCGA CTAGACAGCC AACCAGCAAC AACGAACTGA

121 GCTCGCATAC TACCGCTTAC GCATCTAACC AACCGCCCAT CTAGCTAACC CGAGCCCCTC

181 CACCGTCAAC TCAGGTTCGG CCGGTCCCCG GCCCGCCTGC CGGAGCCGTG GTGGCAGCCC

241 CGGGAGGAGC ACTGGCGTCT GTTTCCTTCG ATTCTCGGGA TTCGAAGATG GCTGCACAGT

301 CAGCGCCGAA AGTTGTGCTA AAAAGCACCA CCAAGATGTC TCTAAATGAG CGCTTTACTA

361 ATATGCTGAA GAACAAACAG CCGACGCCAG TGAATATTCG GGCTTCGATG CAGCAACAAC

421 AGCAGCTAGC CAGTGCCAGA AACAGAAGAC TGGCCCAGCA GATGGAGAAT AGACCCTCTG

481 TCCAGGCAGC ATTAAAACTT AAGCAGAGCT TAAAGCAGCG CCTGGGTAAG AGTAACATCC

541 AGGCACGGTT AGGCCGACCC ATAGGGGCCC TGGCCAGGGG AGCAATCGGA GGACGAGGCC

601 TACCCATAAT CCAGAGAGGC TTGCCCAGAG GAGGACTACG TGGGGGACGT GCCACCAGAA

661 CCCTACTTAG GGGCGGGATG TCACTCCGAG GTCAAAACCT GCTCCGAGGT GGACGAGCCG

721 TAGCTCCCCG AATGGGCTTA AGAAGAGGTG GTGTTCGAGG TCGTGGAGGT CCTGGGAGAG

781 GGGGCCTAGG GCGTGGAGCT ATGGGTCGTG GCGGAATCGG TGGTAGAGGG TCGGGGTATG

841 ATAGGTCGGG GAAGAGGGGG CTTTGGAGGC CGAGGCCGAG GGCGTGGACG AGGGAGAGGT

901 GCCCTTGCTC GCCCTGTATT GACCAAGGAG CAGCTGGACA ACCAATTGGA TGCATATATG

961 TCGAAAACAA AAGGACACCT GGATGCTGAG TTGGATGCCT ACATGGCGCA GACAGATCCC

1021 GAAACCAATG ATTGAAGCCT GCCCATCCTC CCATGAGAGA CTCTTGTTAG TCAACACATC

1081 TGTAAATAAC CTTGAGATAA CAGATGAGAA GAAATCTGAT TGATGCTGGA TGGACCTATC

1141 ACAATAGGCT GTGGACTTAC TTGCCACCAG CTTGTGCATT TAGTGTGTTC CTTTTACTTT

1201 TTGATACTGT GTTGTATGAA ACCCTTTTGT CCTTTGATTT GGTTTTTGTT TTTGTTTTTT

1261 TAGGGGGGAG GGGGGGTTTC CCTCCTTTGC CCAGACTTCT CTTTGAACAC AAATGCATTA

1321 GCCTTGTGGC TAGAACACCC TCTTCCTACC TCTGTCTCCC CTCACTTGTC ATATGCTCTG

1381 ACATGCTAAC ATTTCTTTTG TTCATCCCTG TTGCCCCCAC AGAAACATCC CAGAAAAACC

1441 GGTCAGTGTT CCTTCCTCCC TGATCCTTAG GTTTCTGAAA TAGGGTTCTG TTACATCCTC

1501 TTCGATAGCC TGTTTAAAAT GTTTAGAAGG TCTGGAGCTC AAAAATGCGT TCTTCCACAT

1561 TGATAATTTA GTAAACTGAG AACATTGACA TCACTACAGG GCAGCATAAG AGGTTGCTTA

1621 CATGTCGTAG CAGCTCTGGT TTGATTCAAG TTGCTACCAT GTACATTGAC AGCACATATA

1681 CCATAACCAG CGTGTTGGGT TGAATTGCAC TTTCTACCTT TGTATGAGAT TTACAGACTT

1741 TCCTTCTGGG TTTGTATCAT GACCAGAGGG GTACTATAGG GTTGGTTTAT ACTGCAATAT

1801 AGAGGATCAG AAGCCATTTG ATTTGGTAGG TGTGTCAGAA GGGAGAATGA TGGCAGACGA

1861 ACTGCTGGAA GAGGTCAGAA GATAGCCATG CTAAAATGCA ATTATATCCT CATGTTTATC

1921 CCAAACTAAT CTTGGACTTT TCCACTCATT AGCTTTGTTT TGCCCTTGTT TCCCTTGAAG

1981 GTTTAAGTTC AACCATATTC TGTCAACTGT TCAGTTTCAG TGGAATCTTG TATTTCTGGT

2041 TCATTATAAC AAATTGTTCG CTTAAATCCA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA

2101 A

B：氨基酸序列(SEQ ID NO：23) 长度：233

1 MAAQSAPKVV LKSTTKMSLN ERFTNMLKNK QPTPVNIRAS MQQQQQLASA RNRRLAQQME

61 NRPSVQAALK LKQSLKQRLG KSNIQARLGR PIGALARGAI GGRGLPIIQR GLPRGGLRGG

121 RATRTLLRGG MSLRGQNLLR GGRAVAPRMG LRRGGVRGRG GPGRGGLGRG AMGRGGIGGR

181 GSGYDRSGKR GLWRPRPRAW TRERCPCSPC IDQGAAGQPI GCIYVENKRT PGC

C.核苷酸及氨基酸组合序列(SEQ ID NO：24) 克隆号：PP7704

起始编码子：288 ATG 终止编码子：987 TGA 蛋白质分子量：24954.84

1 GA TTT TGT TTT GGA CAC CGA GCA GGA GCT GGC GGC CGC TGC AGA CGA 47

48 AAG GCA GGA AAG GGC AGG CCG GGT GAG CAG ACG GAT CGG CCG ACT AGA 95

96 CAG CCA ACC AGC AAC AAC GAA CTG AGC TCG CAT ACT ACC GCT TAC GCA 143

144 TCT AAC CAA CCG CCC ATC TAG CTA ACC CGA GCC CCT CCA CCG TCA ACT 191

192 CAG GTT CGG CCG GTC CCC GGC CCG CCT GCC GGA GCC GTG GTG GCA GCC 239

240 CCG GGA GGA GCA CTG GCG TCT GTT TCC TTC GAT TCT CGG GAT TCG AAG 287

288 ATG GCT GCA CAG TCA GCG CCG AAA GTT GTG CTA AAA AGC ACC ACC AAG 335

1 Met Ala Ala Gln Ser Ala Pro Lys Val Val Leu Lys Ser Thr Thr Lys 16

336 ATG TCT CTA AAT GAG CGC TTT ACT AAT ATG CTG AAG AAC AAA CAG CCG 383

17 Met Ser Leu Asn Glu Arg Phe Thr Asn Met Leu Lys Asn Lys Gln Pro 32

384 ACG CCA GTG AAT ATT CGG GCT TCG ATG CAG CAA CAA CAG CAG CTA GCC 431

33 Thr Pro Val Asn Ile Arg Ala Ser Met Gln Gln Gln Gln Gln Leu Ala 48

432 AGT GCC AGA AAC AGA AGA CTG GCC GAG CAG ATG GAG AAT AGA CCC TCT 479

49 Ser Ala Arg Asn Arg Arg Leu Ala Gln Gln Met Glu Asn Arg Pro Ser 64

480 GTC CAG GCA GCA TTA AAA CTT AAG CAG AGC TTA AAG CAG CGC CTG GGT 527

65 Val Gln Ala Ala Leu Lys Leu Lys Gln Ser Leu Lys Gln Arg Leu Gly 80

528 AAG AGT AAC ATC CAG GCA CGG TTA GGC CGA CCC ATA GGG GCC CTG GCC 575

81 Lys Ser Asn Ile Gln Ala Arg Leu Gly Arg Pro Ile Gly Ala Leu Ala 96

576 AGG GGA GCA ATC GGA GGA CGA GGC CTA CCC ATA ATC CAG AGA GGC TTG 623

97 Arg Gly Ala Ile Gly Gly Arg Gly Leu Pro Ile Ile Gln Arg Gly Leu 112

624 CCC AGA GGA GGA CTA CGT GGG GGA CGT GCC ACC AGA ACC CTA CTT AGG 671

113 Pro Arg Gly Gly Leu Arg Gly Gly Arg Ala Thr Arg Thr Leu Leu Arg 128

672 GGC GGG ATG TCA CTC CGA GGT CAA AAC CTG CTC CGA GGT GGA CGA GCC 719

129 Gly Gly Met Ser Leu Arg Gly Gln Asn Leu Leu Arg Gly Gly Arg Ala 144

720 GTA GCT CCC CGA ATG GGC TTA AGA AGA GGT GGT GTT CGA GGT CGT GGA 767

145 Val Ala Pro Arg Met Gly Leu Arg Arg Gly Gly Val Arg Gly Arg Gly 160

768 GGT CCT GGG AGA GGG GGC CTA GGG CGT GGA GCT ATG GGT CGT GGC GGA 815

161 Gly Pro Gly Arg Gly Gly Leu Gly Arg Gly Ala Met Gly Arg Gly Gly 176

816 ATC GGT GGT AGA GGG TCG GGG TAT GAT AGG TCG GGG AAG AGG GGG CTT 863

177 Ile Gly Gly Arg Gly Ser Gly Tyr Asp Arg Ser Gly Lys Arg Gly Leu 192

864 TGG AGG CCG AGG CCG AGG GCG TGG ACG AGG GAG AGG TGC CCT TGC TCG 911

193 Trp Arg Pro Arg Pro Arg Ala Trp Thr Arg Glu Arg Cys Pro Cys Ser 208

912 CCC TGT ATT GAC CAA GGA GCA GCT GGA CAA CCA ATT GGA TGC ATA TAT 959

209 Pro Cys Ile Asp Gln Gly Ala Ala Gly Gln Pro Ile Gly Cys Ile Tyr 224

960 GTC GAA AAC AAA AGG ACA CCT GGA TGC TGA GTT GGA TGC CTA CAT GGC 1007

225 Val Glu Asn Lys Arg Thr Pro Gly Cys *** 234

1008 GCA GAC AGA TCC CGA AAC CAA TGA TTG AAG CCT GCC CAT CCT CCC ATG 1055

1056 AGA GAC TCT TGT TAG TCA ACA CAT CTG TAA ATA ACC TTG AGA TAA CAG 1103

1104 ATG AGA AGA AAT CTG ATT GAT GCT GGA TGG ACC TAT CAC AAT AGG CTG 1151

1152 TGG ACT TAC TTG CCA CCA GCT TGT GCA TTT AGT GTG TTC CTT TTA CTT 1199

1200 TTT GAT ACT GTG TTG TAT GAA ACC CTT TTG TCC TTT GAT TTG GTT TTT 1247

1248 GTT TTT GTT TTT TTA GGG GGG AGG GGG GGT TTC CCT CCT TTG CCC AGA 1295

1296 CTT CTC TTT GAA CAC AAA TGC ATT AGC CTT GTG GCT AGA ACA CCC TCT 1343

1344 TCC TAC CTC TGT CTC CCC TCA CTT GTC ATA TGC TCT GAC ATG CTA ACA 1391

1392 TTT CTT TTG TTC ATC CCT GTT GCC CCC ACA GAA ACA TCC CAG AAA AAC 1439

1440 CGG TCA GTG TTC CTT CCT CCC TGA TCC TTA GGT TTC TGA AAT AGG GTT 1487

1488 CTG TTA CAT CCT CTT CGA TAG CCT GTT TAA AAT GTT TAG AAG GTC TGG 1535

1536 AGC TCA AAA ATG CGT TCT TCC ACA TTG ATA ATT TAG TAA ACT GAG AAC 1583

1584 ATT GAC ATC ACT ACA GGG CAG CAT AAG AGG TTG CTT ACA TGT GGT AGC 1631

1632 AGC TCT GGT TTG ATT CAA GTT GCT ACC ATG TAC ATT GAC AGC ACA TAT 1679

1680 ACC ATA ACC AGC GTG TTG GGT TGA ATT GCA CTT TCT ACC TTT GTA TGA 1727

1728 GAT TTA CAG ACT TTC CTT CTG GGT TTG TAT CAT GAC CAG AGG GGT ACT 1775

1776 ATA GGG TTG GTT TAT ACT GCA ATA TAG AGG ATC AGA AGC CAT TTG ATT 1823

1824 TGG TAG GTG TGT CAG AAG GGA GAA TGA TGG CAG ACG AAC TGC TGG AAG 1871

1872 AGG TCA GAA GAT AGC CAT GCT AAA ATG CAA TTA TAT CCT CAT GTT TAT 1919

1920 CCC AAA CTA ATC TTG GAC TTT TCC ACT CAT TAG CTT TGT TTT GCC CTT 1967

1968 GTT TCC CTT GAA GGT TTA AGT TCA ACC ATA TTC TGT CAA CTG TTC AGT 2015

2016 TTC AGT GGA ATC TTG TAT TTC TGG TTC ATT ATA ACA AAT TGT TCG CTT 2063

2064 AAA TCC AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AA 2101

9.PP8407

A：核苷酸序列(SEQ ID NO：25) 长度：3305

1 GCTGGGGTTT TCAGATGCAC ATTCAGTGTT GCTTCTTGGC CATGTTCGAC AGATGCTGAG

61 ACCATCGTAC AGGCAGAAGC TTTGGCCAGC ACCGTCACTC TCACTGCCAT TGCCGAGAGT

121 CCTGTTATTG AGGTAGAAAC AGAAAAGAAA GACGTTCTTG ATTTTGGTGA CTTGACTTAT

181 GGAGGCTGGA AAGCCCTCCC ACTAAAATTG ATAAACCGAA CGCATGCCAC TGTGCCAATT

241 AGACTGATTA TTAATGCTAA CGCTGTAGCC TGGCACTGTT TCACGTTTTC CAAGGAACCC

301 GTCCGAGCTC CTGTGGAAGT TGCTCCTTGC GCTGATGTGG TCACTCGGCT AGCAGGCCCT

361 TCTGTGGTCA ACCACATGAT GCCTGCTAGT TATGATGGAC AGGATCCAGA ATTTCTGATG

421 ATTTGGGTTC TTTTCCATAG TCCAAAGAAA CAGATCAGCT CTTCAGATAT TCTGGACTCA

481 GCAGAAGAAT TCTCGGCAAA AGTTGATATC GAAGTTGACA GCCCAAACCC TACGCCCGTT

541 CTTAGAAGTG TGAGTCTCCG AGCAAGAGCA GGAATAGCTA GGATCCATGC TCCCAGGGAC

601 TTGCAGACGA TGCATTTCTT GGCCAAAGTG GCTTCCTCAA GAAAGCAGCA CTTACCTTTG

661 AAAAATGCTG GGAACATTGA AGTTTATTTG GATATCAAGG TCCCAGAACA AGGAAGTCAC

721 TTTTCAGTGG ATCCAAAGAA TCTATTCCTT AAACCTGGAG AAGAACATGA GGTTATTGTT

781 TCATTTACTC CAAAGGATCC TGAAGCCTGC GAGGAAAGGA TCTTGAAAAT ATTTGTGCAG

841 CCATTTGGAC CTCAGTATGA GGTAGTGTTA AAAGGCGAAG TCATTTCTTC AGGAAGTAAA

901 CCTCTGTCAC CTGGACCTTG CTTAGATATT CCATCGATTT TGTCCAACAA ACAATTTCTG

961 GCTTGGGGAG GAGTCCCTCT AGGTAGAACA CAGCTTCAGA AACTAGCTTT AAGAAATAAT

1021 TCTGCATCTA CAACTCAACA TTTACGACTG CTTATTAGAG GACAAGATCA GGACTGCTTT

1081 CAGCTTCAGA ACACTTTTGG TTCAGAACAG CGATTGACCA GTAACTGTGA GATCAGAATT

1141 CACCCAAAGG AAGACATTTT CATCTCTGTA TTATTTGCAC CTACTCGATT ATCTTGCATG

1201 TTGGCTAGAC TAGAAATCAA ACAACTTGGA AATCGATCAC AACCAGGCAT TAAGTTCACA

1261 ATACCTTTGT CTGGATATGG AGGAACAAGC AATCTTATTT TGGAAGGCGT TAAAAAATTA

1321 TCTGACAGTT ACATGGTAAC AGTGAATGGC TTAGTACCTG GCAAAGAAAG TAAAATTGTT

1381 TTTTCTGTCC GCAACACTGG CTCCCGAGCA GCTTTTGTTA AAGCAGTAGG TTTTAAGGAT

1441 TCTCAGAAAA AAGTTTTGCT GGATCCTAAA GTATTGAGGA TTTTTCCAGA TAAATTTGTA

1501 CTCAAGGAAA GAACACAAGA AAATGTTACT TTAATATATA ATCCATCAGA CAGAGGAATC

1561 AATAATAAAA CTGCAACAGA ACTATCAACT GTATACTTAT TTGGTGGAGA TGAAATTTCA

1621 AGACAGCAGT ATCGCAGGCA GGGCCCTGCT ACATAAACCA GAGATGATAA AACAGATACT

1681 TCCAGAACAT AGTGTGCTTC AAAACATTAA TTTTGTTGAA GCATTTCAAG ATGAGCTATT

1741 AGTAACTGAA GTATATGATC TTCCCCAACG ACCTAATGAT GTTCAGCTCT TTTATGGAAG

1801 CATGTGTAAA ATTATACTTT CAGTAATTGG AGAATTCAGA GATTGCATTT CTAGCAGAGA

1861 ATTCCTTCAG CCTTCTTCCA AAGCTAGCTT GGAATCTACA AGCGACTTGG GAGCTTCTGG

1921 GAAACATGGT GGCAACGTCT CTTTGGATGT TTTACCAGTC AAAGGTCCTC AGGGTTCTCC

1981 TCTTCTCTCA CAGGCGGCTC GCCCGCCTCC GGATCAGCTG GCCTCCGAAG AGCCGTGGAC

2041 TGTCCTACCC GAGCACTTGA TTCTGGTAGC TCCTTCTCCT TGTGACATGG CAAAAACTGG

2101 ACGTTTCCAG ATTGTGAATA ACTCTGTGAG GTTACTGAGA TTTGAGCTGT GCTGGCCAGC

2161 GCATTGCCTC ACAGTCACGC CGCAGCATGG ATGTGTCGCG CCAGAGAGTA AACTACAAAT

2221 TCTTGTGAGT CCTAATTCCT CCTTATCCAC AAAACAGTCA ATGTTCCCGT GGAGTGGTTT

2281 GATCTATATA CACTGTGACG ATGGACAGAA GAAAATTGTG AAAGTTCAAA TTCGAGAAGA

2341 TTTAACTCAA GTGGAACTTT TAACTCGTTT GACCTCCAAA CCATTTGGAA TTCTTTCCCC

2401 AGTATCTGAG CCTTCAGTTA GTCATTTGGT CAAACCAATG ACAAAACCGC CTTCCACAAA

2461 AGTTGAAATA AGAAACAAGA GTATTACTTT TCCTACAACA GAACCTGGTG AAACTTCAGA

2521 GAGCTGTCTA GAACTCGAGA ATCATGGCAC CACAGACGTG AAATGGCATC TGTCATCTTT

2581 AGCGCCACCT TATGTCAAGG GAGTTGATGA AAGTGGAGAT GTTTTTAGAG CTACCTATGC

2641 AGCATTCAGA TGTTCTCCTA TTTCTGGTCT GCTGGAAAGC CATGGGATCC AAAAACAGGC

2701 AGCTTGATGT GACTGCTCGT GGAGTTTATG CCCCAGAGGA TGTGTACAGG TTCCTGCCGA

2761 CTAGTGTGGG GGAATCACGG ACACTTAAAG TCAATCTGCG AAATAATTCT TTTATTACAC

2821 ACTCACTGAA GTTTTTGAGT CCCAGAGAGC CATTCTATGT CAAACATTCC AAGTACTCTT

2881 TGAGAGCCCA GCATTACATC AACATGCCCG TGCAGTTCAA ACCGAAGTCC GCAGGCAAAT

2941 TTGAAGCTTT GCTTGTCATT CAAACAGATG AAGGCAAGAG TATTGCTATT CGACTAATTG

3001 GTGAAGCTCT TGGAAAAAAT TAACTAGAAT ACATTTTTGT GTAAAGTAAA TTACATAAGT

3061 TGTATTTTGT TAACTTTATC TTTCTACACT ACAATTATGC TTTTGTATAT ATATTTTGTA

3121 TGATGGATAT CTATAATTGT AGATTTTGTT TTTACAAGCT AATACTGAAG ACTCGACTGA

3181 AATATTATGT ATCTAGCCCA TAGTATTGTA CTTAACTTTT ACAGGTGAGA AGAGAGTTCT

3241 GTGTTTGCAT TGATTATGAT ATTCTGAATA AATATGGAAT ATATTTTAAA AAAAAAAAAA

3301 AAAAA

B：氨基酸序列(SEQ ID NO：26) 长度：426

1 MMPASYDGQD PEFLMIWVLF HSPKKQISSS DILDSAEEFS AKVDIEVDSP NPTPVLRSVS

61 LRARAGIARI HAPRDLQTMH FLAKVASSRK QHLPLKNAGN IEVYLDIKVP EQGSHFSVDP

121 KNLFLKPGEE HEVIVSFTPK DPEACEERIL KIFVQPFGPQ YEVVLKGEVI SSGSKPLSPG

181 PCLDIPSILS NKQFLAWGGV PLGRTQLQKL ALRNNSASTT QHLRLLIRGQ DQDCFQLQNT

241 FGSEQRLTSN CEIRIHPKED IFISVLFAPT RLSCMLARLE IKQLGNRSQP GIKFTIPLSG

301 YGGTSNLILE GVKKLSDSYM VTVNGLVPGK ESKIVFSVRN TGSRAAFVKA VGFKDSQKKV

361 LLDPKVLRIF PDKFVLKERT QENVTLIYNP SDRGINNKTA TELSTVYLFG GDEISRQQYR

421 RQGPAT

C.核苷酸及氨基酸组合序列(SEQ ID NO：27) 克隆号：PP8407

起始编码子：376 ATG 终止编码子：1654 TAA 蛋白质分子量：47410.05

1 GCT GGG GTT TTC AGA TGC ACA TTC AGT GTT GCT TCT TGG CCA TGT TCG 48

49 ACA GAT GCT GAG ACC ATC GTA CAG GCA GAA GCT TTG GCC AGC ACC GTC 96

97 ACT CTC ACT GCC ATT GCC GAG AGT CCT GTT ATT GAG GTA GAA ACA GAA 144

145 AAG AAA GAC GTT CTT GAT TTT GGT GAC TTG ACT TAT GGA GGC TGG AAA 192

193 GCC CTC CCA CTA AAA TTG ATA AAC CGA ACG CAT GCC ACT GTG CCA ATT 240

241 AGA CTG ATT ATT AAT GCT AAC GCT GTA GCC TGG CAC TGT TTC ACG TTT 288

289 TCC AAG GAA CCC GTC CGA GCT CCT GTG GAA GTT GCT CCT TGC GCT GAT 336

337 GTG GTC ACT CGG CTA GCA GGC CCT TCT GTG GTC AAC CAC ATG ATG CCT 384

1 Met Met Pro 3

385 GCT AGT TAT GAT GGA CAG GAT CCA GAA TTT CTG ATG ATT TGG GTT CTT 432

4 Ala Ser Tyr Asp Gly Gln Asp Pro Glu Phe Leu Met Ile Trp Val Leu 19

433 TTC CAT AGT CCA AAG AAA CAG ATC AGC TCT TCA GAT ATT CTG GAC TCA 480

20 Phe His Ser Pro Lys Lys Gln Ile Ser Ser Ser Asp Ile Leu Asp Ser 35

481 GCA GAA GAA TTC TCG GCA AAA GTT GAT ATC GAA GTT GAC AGC CCA AAC 528

36 Ala Glu Glu Phe Ser Ala Lys Val Asp Ile Glu Val Asp Ser Pro Asn 51

529 CCT ACG CCC GTT CTT AGA AGT GTG AGT CTC CGA GCA AGA GCA GGA ATA 576

52 Pro Thr Pro Val Leu Arg Ser Val Ser Leu Arg Ala Arg Ala Gly Ile 67

577 GCT AGG ATC CAT GCT CCC AGG GAG TTG CAG ACG ATG CAT TTC TTG GCC 624

68 Ala Arg Ile His Ala Pro Arg Asp Leu Gln Thr Met His Phe Leu Ala 83

625 AAA GTG GCT TCC TCA AGA AAG CAG CAC TTA CCT TTG AAA AAT GCT GGG 672

84 Lys Val Ala Ser Ser Arg Lys Gln His Leu Pro Leu Lys Asn Ala Gly 99

673 AAC ATT GAA GTT TAT TTG GAT ATC AAG GTC CCA GAA CAA GGA AGT CAC 720

100 Asn Ile Glu Val Tyr Leu Asp Ile Lys Val Pro Glu Gln Gly Ser His 115

721 TTT TCA GTG GAT CCA AAG AAT CTA TTC CTT AAA CCT GGA GAA GAA CAT 768

116 Phe Ser Val Asp Pro Lys Asn Leu Phe Leu Lys Pro Gly Glu Glu His 131

769 GAG GTT ATT GTT TCA TTT ACT CCA AAG GAT CCT GAA GCC TGC GAG GAA 816

132 Glu Val Ile Val Ser Phe Thr Pro Lys Asp Pro Glu Ala Cys Glu Glu 147

817 AGG ATC TTG AAA ATA TTT GTG CAG CCA TTT GGA CCT CAG TAT GAG GTA 864

148 Arg Ile Leu Lys Ile Phe Val Gln Pro Phe Gly Pro Gln Tyr Glu Val 163

865 GTG TTA AAA GGC GAA GTC ATT TCT TCA GGA AGT AAA CCT CTG TCA CCT 912

164 Val Leu Lys Gly Glu Val Ile Ser Ser Gly Ser Lys Pro Leu Ser Pro 179

913 GGA CCT TGC TTA GAT ATT CCA TCG ATT TTG TCC AAC AAA CAA TTT CTG 960

180 Gly Pro Cys Leu Asp Ile Pro Ser Ile Leu Ser Asn Lys Gln Phe Leu 195

961 GCT TGG GGA GGA GTC CCT CTA GGT AGA ACA CAG CTT CAG AAA CTA GCT 1008

196 Ala Trp Gly Gly Val Pro Leu Gly Arg Thr Gln Leu Gln Lys Leu Ala 211

1009 TTA AGA AAT AAT TCT GCA TCT ACA ACT CAA CAT TTA CGA CTG CTT ATT 1056

212 Leu Arg Asn Asn Ser Ala Ser Thr Thr Gln His Leu Arg Leu Leu Ile 227

1057 AGA GGA CAA GAT CAG GAC TGC TTT CAG CTT CAG AAC ACT TTT GGT TCA 1104

228 Arg Gly Gln Asp Gln Asp Cys Phe Gln Leu Gln Asn Thr Phe Gly Ser 243

1105 GAA CAG CGA TTG ACC AGT AAC TGT GAG ATC AGA ATT CAC CCA AAG GAA 1152

244 Glu Gln Arg Leu Thr Ser Asn Cys Glu Ile Arg Ile His Pro Lys Glu 259

1153 GAC ATT TTC ATC TCT GTA TTA TTT GCA CCT ACT CGA TTA TCT TGC ATG 1200

260 Asp Ile Phe Ile Ser Val Leu Phe Ala Pro Thr Arg Leu Ser Cys Met 275

1201 TTG GCT AGA CTA GAA ATC AAA CAA CTT GGA AAT CGA TCA CAA CCA GGC 1248

276 Leu Ala Arg Leu Glu Ile Lys Gln Leu Gly Asn Arg Ser Gln Pro Gly 291

1249 ATT AAG TTC ACA ATA CCT TTG TCT GGA TAT GGA GGA ACA AGC AAT CTT 1296

292 Ile Lys Phe Thr Ile Pro Leu Ser Gly Tyr Gly Gly Thr Ser Asn Leu 307

1297 ATT TTG GAA GGC GTT AAA AAA TTA TCT GAC AGT TAC ATG GTA ACA GTG 1344

308 Ile Leu Glu Gly Val Lys Lys Leu Ser Asp Ser Tyr Met Val Thr Val 323

1345 AAT GGC TTA GTA CCT GGC AAA GAA AGT AAA ATT GTT TTT TCT GTC CGC 1392

324 Asn Gly Leu Val Pro Gly Lys Glu Ser Lys Ile Val Phe Ser Val Arg 339

1393 AAC ACT GGC TCC CGA GCA GCT TTT GTT AAA GCA GTA GGT TTT AAG GAT 1440

340 Asn Thr Gly Ser Arg Ala Ala Phe Val Lys Ala Val Gly Phe Lys Asp 355

1441 TCT CAG AAA AAA GTT TTG CTG GAT CCT AAA GTA TTG AGG ATT TTT CCA 1488

356 Ser Gln Lys Lys Val Leu Leu Asp Pro Lys Val Leu Arg Ile Phe Pro 371

1489 GAT AAA TTT GTA CTC AAG GAA AGA ACA CAA GAA AAT GTT ACT TTA ATA 1536

372 Asp Lys Phe Val Leu Lys Glu Arg Thr Gln Glu Asn Val Thr Leu Ile 387

1537 TAT AAT CCA TCA GAC AGA GGA ATC AAT AAT AAA ACT GCA ACA GAA CTA 1584

388 Tyr Asn Pro Ser Asp Arg Gly Ile Asn Asn Lys Thr Ala Thr Glu Leu 403

1585 TCA ACT GTA TAC TTA TTT GGT GGA GAT GAA ATT TCA AGA CAG CAG TAT 1632

404 Ser Thr Val Tyr Leu Phe Gly Gly Asp Glu Ile Ser Arg Gln Gln Tyr 419

1633 CGC AGG CAG GGC CCT GCT ACA TAA ACC AGA GAT GAT AAA ACA GAT ACT 1680

420 Arg Arg Gln Gly Pro Ala Thr *** 427

1681 TCC AGA ACA TAG TGT GCT TCA AAA CAT TTT TTT TGT TGA AGC ATT TCA 1728

1729 AGA TGA GCT ATT AGT AAC TGA AGT ATA TGA TCT TCC CCA ACG ACC TAA 1776

1777 TGA TGT TCA GCT CTT TTA TGG AAG CAT GTG TAA AAT TAT ACT TTC AGT 1824

1825 AAT TGG AGA ATT CAG AGA TTG CAT TTC TAG CAG AGA ATT CCT TCA GCC 1872

1873 TTC TTC CAA AGC TAG CTT GGA ATC TAC AAG CGA CTT GGG AGC TTC TGG 1920

1921 GAA ACA TGG TGG CAA CGT CTC TTT GGA TGT TTT ACC AGT CAA AGG TCC 1968

1969 TCA GGG TTC TCC TCT TCT CTC ACA GGC GGC TCG CCC GCC TCC GGA TCA 2016

2017 GCT GGC CTC CGA AGA GCC GTG GAC TGT CCT ACC CGA GCA CTT GAT TCT 2064

2065 GGT AGC TCC TTC TCC TTG TGA CAT GGC AAA AAC TGG ACG TTT CCA GAT 2112

2113 TGT GAA TAA CTC TGT GAG GTT ACT GAG ATT TGA GCT GTG CTG GCC AGC 2160

2161 GCA TTG CCT CAC AGT CAC GCC GCA GCA TGG ATG TGT CGC GCC AGA GAG 2208

2209 TAA ACT ACA AAT TCT TGT GAG TCC TAA TTC CTC CTT ATC CAC AAA ACA 2256

2257 GTC AAT GTT CCC GTG GAG TGG TTT GAT CTA TAT ACA CTG TGA CGA TGG 2304

2305 ACA GAA GAA AAT TGT GAA AGT TCA AAT TCG AGA AGA TTT AAC TCA AGT 2352

2353 GGA ACT TTT AAC TCG TTT GAC CTC CAA ACC ATT TGG AAT TCT TTC CCC 2400

2401 AGT ATC TGA GCC TTC AGT TAG TCA TTT GGT CAA ACC AAT GAC AAA ACC 2448

2449 GCC TTC CAC AAA AGT TGA AAT AAG AAA CAA GAG TAT TAC TTT TCC TAC 2496

2497 AAC AGA ACC TGG TGA AAC TTC AGA GAG CTG TCT AGA ACT CGA GAA TCA 2544

2545 TGG CAC CAC AGA CGT GAA ATG GCA TCT GTC ATC TTT AGC GCC ACC TTA 2592

2593 TGT CAA GGG AGT TGA TGA AAG TGG AGA TGT TTT TAG AGC TAC CTA TGC 2640

2641 AGC ATT CAG ATG TTC TCC TAT TTC TGG TCT GCT GGA AAG CCA TGG GAT 2688

2689 CCA AAA ACA GGC AGC TTG ATG TGA CTG CTC GTG GAG TTT ATG CCC CAG 2736

2737 AGG ATG TGT ACA GGT TCC TGC CGA CTA GTG TGG GGG AAT CAC GGA CAC 2784

2785 TTA AAG TCA ATC TGC GAA ATA ATT CTT TTA TTA CAC ACT CAC TGA AGT 2832

2833 TTT TGA GTC CCA GAG AGC CAT TCT ATG TCA AAC ATT CCA AGT ACT CTT 2880

2881 TGA GAG CCC AGC ATT ACA TCA ACA TGC CCG TGC AGT TCA AAC CGA AGT 2928

2929 CCG CAG GCA AAT TTG AAG CTT TGC TTG TCA TTC AAA CAG ATG AAG GCA 2976

2977 AGA GTA TTG CTA TTC GAC TAA TTG GTG AAG CTC TTG GAA AAA ATT AAC 3024

3025 TAG AAT ACA TTT TTG TGT AAA GTA AAT TAC ATA AGT TGT ATT TTG TTA 3072

3073 ACT TTA TCT TTC TAC ACT ACA ATT ATG CTT TTG TAT ATA TAT TTT GTA 3120

3121 TGA TGG ATA TCT ATA ATT GTA GAT TTT GTT TTT ACA AGC TAA TAC TGA 3168

3169 AGA CTC GAC TGA AAT ATT ATG TAT CTA GCC CAT AGT ATT GTA CTT AAC 3216

3217 TTT TAC AGG TGA GAA GAG AGT TCT GTG TTT GCA TTG ATT ATG ATA TTC 3264

3265 TGA ATA AAT ATG GAA TAT ATT TTA AAA AAA AAA AAA AAA AA 3305

10.PP8961

A：核苷酸序列(SEQ ID NO：28) 长度：1971

1 GATGTCACCT CTGCCTCATT CTACTATCAA GGTGGTTGCA GGGACAGCCC AGGTTCAAAG

61 GAAGGAGAAG TAGACTCCCC CTCTTTTGAC TGGCAAGGGG ACATTGCAAA AAATCCTGTC

121 GTTTGGGGGG GATTGTTGTA GTCATCTTTG GAAACACAAT CTGCAACTTT GATGTTCATC

181 AAAGAAATCT GCTTGAGCTG TGAGCTCAAC TGGTATTCGA CTTAAGAAAT CCACAAAATC

241 GGTTCTGAAC TGCATTTTCA TCTCAGCGTT TGGCCACGGG CAATGAGAGC TTCATTCAGA

301 AGAGTCACAA AATCGTTCTG ACCAAGACCA TTTTGTCTAG ATCAGTAATT TGGGGATTTG

361 CCTGTCTCAG TGCCATCAGA AGCAACCACC TAACCCAGAA ATGCTAACAT TCCTCTTCTT

421 TCAGCAGTCA CTGACTACCT ACATCCCTCA GCTCCCTCCC CATCTCACAT CACCCTCAGG

481 GGCCTCCTGA GCACAGCATC ACCGAGGGGG CCACAGCAGC AGAACCTCCT ACCCAGATCT

541 CTCTAGGCAC TGCCATCATG TGACTAAACT CCCCTCTCAA CCACAACCTC CAGCTACAGG

601 GCTCTCATCC AAGTCAAAAA TCCAAAGACA GGCGTCTGGC TGGCTGCAGG AGTCCAGAGC

661 CATGAGTGTC CCTAAATTAG TCAACCATGG CTGGGAGACA GAGCCATGCA ATCCAGACCC

721 AGCTCTTCTG CTCACTGGGG CCGTTCCCGG AGAAGGAGAA ACCACGCTGG AGCGGGCACT

781 CCCACGAGTT GTCGGGGAAC AAGAACTCGG ATCCTGGCGG GAGACAGCGA ACAGTACACC

841 CGAGCGGCGG CTGTCACCCG CTTTGAAACA CGTAAGTGCC CGGCCAACCA GCATCCCAGA

901 AACGCCTGGG GAGCGGGGCG CGCGGACGAG GAGAGACCGC GCTGGGAGGG CGCGGAAGGG

961 CGAGGGCGCT GCCGCCTCCA CGCTGAGCTC ACTGCGCGGG GCGGCCCCCG AGGCAGGGCG

1021 CGGGGCGGAG GCGCCCGAGT GGTCCGTCTC GGGAGGCGCA GACGCGGTTC CTCTCGAGGG

1081 CGCTCCCGCT GTGAGGAGCA AATCCTAGGG ACCTTTGCGT CATGAGCACC CAACGGGGCC

1141 CGCCCCCTTA GGACCTGCAC CTGCCTGAGG GGAAAACCCG CCCACCACCC ACGGTCGCCC

1201 GCAGCGCTTG CCTGCCAGCC TTCTCATCTG CAAGCCGCCT CCTCCCTGCC AACCTCCTCC

1261 TCCCTGCCCA GCCTCTTTCT CTCTGCCAGC CTCCTCCTCC CCCATCGGCC GCCTCCTCTC

1321 CTGCCAGCCT CCTCCTCCCT GCCAACCTCC TCCTCTCCTG CCAGCCTCCT CCTCCCTGCC

1381 AACCTCCTCC TCTCCTGCCA GCCTCCTCCT CCCTGCAAGC CTCCTCCTTC CTGCCAGCCT

1441 CTTTCTCCCT GCCAACCTCC TCCTCTCCTG CCAGCCTCCT GCTCCCTGCA AGCCTCCTCC

1501 TTCCTGCCAG CCTCTTTCTC CCTACCAACC TCCTCCTCTC CTGTCAGCTT CCTCCTCCCT

1561 GCCAACCTTT CTGTCCTGCC ACCCCCCTCT TCCCTGCCAG TCTCCCCCTC TTCTGCCAGC

1621 CTCCTCCTCC CCTGCCAGCC TCTTCCTTCT CACCAGCCCC CTCCTCCCTT TTCATCTAAG

1681 ATCATTTGAC CTGTCATTCA AGGCCTAGTT GAAATGTCAC CTCTGTAGAA AAGTTTCTCC

1741 CCAGTTCTCT CTGATAGTTA GTTCTTTCTC TCCTTTGAGT GGGGTAGCAT GGTGCACATT

1801 TCTATATCAA GCTTCTTGGC CCGGTTTTGG TATTTACATG CTTATCTCTC CCCTGCAATA

1861 GGGACAGTGC TAACTTTCTG TCACATTTCT TTTTAATGCC TTCCTAAAAG AGTGACCAAC

1921 ACATGGGTGA TATTCAACAA ATGATTGAAA AAGAAAAAAA AAAAAAAAAA A

B：氨基酸序列(SEQ ID NO：29) 长度：148

1 MSVPKLVNHG WETEPCNPDP ALLLTGAVPG EGETTLERAL PRVVGEQELG SWRETANSTP

61 ERRLSPALKH VSARPTSIPE TPGERGARTR RDRAGRARKG EGAAASTLSS LRGAAPEAGR

121 GAEAPEWSVS GGADAVPLEG APAVRSKS

C.核苷酸及氨基酸组合序列(SEQ ID NO：30) 克隆号：PP8961

起始编码子：662 ATG 终止编码子：1106 TAG 蛋白质分子量：15403.22

1 G ATG TCA CCT CTG CCT CAT TCT ACT ATC AAG GTG GTT GCA GGG ACA 46

47 GCC CAG GTT CAA AGG AAG GAG AAG TAG ACT CCC CCT CTT TTG ACT GGC 94

95 AAG GGG ACA TTG CAA AAA ATC CTG TCG TTT GGG GGG GAT TGT TGT AGT 142

143 CAT CTT TGG AAA CAC AAT CTG CAA CTT TGA TGT TCA TCA AAG AAA TCT 190

191 GCT TGA GCT GTG AGC TCA ACT GGT ATT CGA CTT AAG AAA TCC ACA AAA 238

239 TCG GTT CTG AAC TGC ATT TTC ATC TCA GCG TTT GGC CAC GGG CAA TGA 286

287 GAG CTT CAT TCA GAA GAG TCA CAA AAT CGT TCT GAC CAA GAC CAT TTT 334

335 GTC TAG ATC AGT AAT TTG GGG ATT TGC CTG TCT CAG TGC CAT CAG AAG 382

383 CAA CCA CCT AAC CCA GAA ATG CTA ACA TTC CTC TTC TTT CAG CAG TCA 430

431 CTG ACT ACC TAC ATC CCT CAG CTC CCT CCC CAT CTC ACA TCA CCC TCA 478

479 GGG GCC TCC TGA GCA CAG CAT CAC CGA GGG GGC CAC AGC AGC AGA ACC 526

527 TCC TAC CCA GAT CTC TCT AGG CAC TGC CAT CAT GTG ACT AAA CTC CCC 574

575 TCT CAA CCA CAA CCT CCA GCT ACA GGG CTC TCA TCC AAG TCA AAA ATC 622

623 CAA AGA CAG GCG TCT GGC TGG CTG CAG GAG TCC AGA GCC ATG AGT GTC 670

1 Met Ser Val 3

671 CCT AAA TTA GTC AAC CAT GGC TGG GAG ACA GAG CCA TGC AAT CCA GAC 718

4 Pro Lys Leu Val Asn His Gly Trp Glu Thr Glu Pro Cys Asn Pro Asp 19

719 CCA GCT CTT CTG CTC ACT GGG GCC GTT CCC GGA GAA GGA GAA ACC ACG 766

20 Pro Ala Leu Leu Leu Thr Gly Ala Val Pro Gly Glu Gly Glu Thr Thr 35

767 CTG GAG CGG GCA CTC CCA CGA GTT GTC GGG GAA CAA GAA CTC GGA TCC 814

36 Leu Glu Arg Ala Leu Pro Arg Val Val Gly Glu Gln Glu Leu Gly Ser 51

815 TGG CGG GAG ACA GCG AAC AGT ACA CCC GAG CGG CGG CTG TCA CCC GCT 862

52 Trp Arg Glu Thr Ala Asn Ser Thr Pro Glu Arg Arg Leu Ser Pro Ala 67

863 TTG AAA CAC GTA AGT GCC CGG CCA ACC AGC ATC CCA GAA ACG CCT GGG 910

68 Leu Lys His Val Ser Ala Arg Pro Thr Ser Ile Pro Glu Thr Pro Gly 83

911 GAG CGG GGC GCG CGG ACG AGG AGA GAC CGC GCT GGG AGG GCG CGG AAG 958

84 Glu Arg Gly Ala Arg Thr Arg Arg Asp Arg Ala Gly Arg Ala Arg Lys 99

959 GGC GAG GGC GCT GCC GCC TCC ACG CTG AGC TCA CTG CGC GGG GCG GCC 1006

100 Gly Glu Gly Ala Ala Ala Ser Thr Leu Ser Ser Leu Arg Gly Ala Ala 115

1007 CCC GAG GCA GGG CGC GGG GCG GAG GCG CCC GAG TGG TCC GTC TCG GGA 1054

116 Pro Glu Ala Gly Arg Gly Ala Glu Ala Pro Glu Trp Ser Val Ser Gly 13l

1055 GGC GCA GAC GCG GTT CCT CTC GAG GGC GCT CCC GCT GTG AGG AGC AAA 1102

132 Gly Ala Asp Ala Val Pro Leu Glu Gly Ala Pro Ala Val Arg Ser Lys 147

1103 TCC TAG GGA CCT TTG CGT CAT GAG CAC CCA ACG GGG CCC GCC CCC TTA 1150

148 Ser *** 149

1151 GGA CCT GCA CCT GCC TGA GGG GAA AAC CCG CCC ACC ACC CAC GGT CGC 1198

1199 CCG CAG CGC TTG CCT GCC AGC CTT CTC ATC TGC AAG CCG CCT CCT CCC 1246

1247 TGC CAA CCT CCT CCT CCC TGC CCA GCC TCT TTC TCT CTG CCA GCC TCC 1294

1295 TCC TCC CCC ATC GGC CGC CTC CTC TCC TGC CAG CCT CCT CCT CCC TGC 1342

1343 CAA CCT CCT CCT CTC CTG CCA GCC TCC TCC TCC CTG CCA ACC TCC TCC 1390

1391 TCT CCT GCC AGC CTC CTC CTC CCT GCA AGC CTC CTC CTT CCT GCC AGC 1438

1439 CTC TTT CTC CCT GCC AAC CTC CTC CTC TCC TGC CAG CCT CCT GCT CCC 1486

1487 TGC AAG CCT CCT CCT TCC TGC CAG CCT CTT TCT CCC TAC CAA CCT CCT 1534

1535 CCT CTC CTG TCA GCT TCC TCC TCC CTG CCA ACC TTT CTG TCC TGC CAC 1582

1583 CCC CCT CTT CCC TGC CAG TCT CCC CCT CTT CTG CCA GCC TCC TCC TCC 1630

1631 CCT GCC AGC CTC TTC CTT CTC ACC AGC CCC CTC CTC CCT TTT CAT CTA 1678

1679 AGA TCA TTT GAC CTG TCA TTC AAG GCC TAG TTG AAA TGT CAC CTC TGT 1726

1727 AGA AAA GTT TCT CCC CAG TTC TCT CTG ATA GTT AGT TCT TTC TCT CCT 1774

1775 TTG AGT GGG GTA GCA TGG TGC ACA TTT CTA TAT CAA GCT TCT TGG CCC 1822

1823 GGT TTT GGT ATT TAC ATG CTT ATC TCT CCC CTG CAA TAG GGA CAG TGC 1870

1871 TAA CTT TCT GTC ACA TTT CTT TTT AAT GCC TTC CTA AAA GAG TGA CCA 1918

1919 ACA CAT GGG TGA TAT TCA ACA AAT GAT TGA AAA AGA AAA AAA AAA AAA 1966

1967 AAA AA 1971

11.PP8985

A：核苷酸序列(SEQ ID NO：31) 长度：2020

1 GGTCAGCCGC GTCGCGAATG GGGCAGGAGC GAGCCTCTCT GGTCCCGACG CGGGTGGCCC

61 GGGTCTCCTC GACTCCTGAG GAAAGCCCAC CGGGCGGGCC GGGAGGTGAA GAGGCTGGGG

121 AAGTCAGAGG TTAACCTGGG CGTCAGGGGA CGTTGGAGTT GATCCGTCAG GGTCCCGGGG

181 CGGTCTGGGG GCAGTAGAGA CGGGGCTTGG GCGCGGGGCC TGAGAGGTCA GGGGTCAGCA

241 GGAGTGAGGC TGGGGCGTCC AGGTCCGAGA GGTCAGGGGT CAGCTGGAGA GGGGCTGGGG

301 CGCCGGTTTC CCGGAGGTCA GGGGTCAGAA GGAACAGGGC TGCAGCGTCA GGGTCCGAGA

361 GGTTAGGGGT CGGCAGAGGC GGAGCTGGGG CACTGGGGGT CAGGGGTCGG GGATCAGGGC

421 GGGGTCGGGT GCACTGGTAG CCTGCGCATG GGCCTCCAGC TTCGCGCGCT GTTGGGAGCC

481 TTCGGACGGT GGACCCTGCG CCTGGGACCG CGTCCGTCCT GCTCGCCGCG CATGGCCGGG

541 AACGCGGAGC CGCCGCCCGC CGGAGCCGCA TGCCCCCAGG ACCGGAGGTC CTGCAGCGGC

601 CGGGCCGGGG GCGACCGCGT CTGGGAGGAC GGAGAACATC CGGCGAAGAA GCTCAAGAGC

661 GGTGGCGACG AGGAGCGGCG CGAGAAGCCG CCCAAGCGGA AGATCGTGCT GCTCATGGCC

721 TATTCGGGCA AGGGCTACCA CGGCATGCAG AGGAATGTCG GGTCCTCACA ATTCAAAACA

781 ATTGAAGATG ACTTGGTGTC CGCCCTCGTC CGGTCAGGCT GTATTCCTGA AAATCATGGT

841 GAGGACATGA GGAAAATGTC CTTCCAGCGC TGCGCCCGGA CAGACAAGGG TGTGTCCGCA

901 GCCGGCCAGG TGGTATCCCT GAAGGTGTGG CTGATTGACG ACATTCTAGA AAAGATCAAC

961 AGCCACCTTC CCTCTCACAT TCGGATTCTG GGACTGAAGC GGGTCACGGG CGGGTTTAAC

1021 TCCAAGAACA GATGTGATGC CAGGACCTAT TGCTACCTGC TGCCCACGTT TGCCTTTGCG

1081 CACAAGGACC GGGACGTTCA GGATGAGACC TACCGCCTGA GCGCCGAGAC GCTGCAGCAG

1141 GTCAACAGGC TCCTGGCCTG CTACAAGGGC ACGCACAACT TCCACAATTT CACCTCGCAG

1201 AAGGGGCCGC AGGATCCCAG TGCCTGCCGC TACATCCTGG AGATGTACTG CGAGGAACCC

1261 TTTGTGCGGG AGGGCCTGGA GTTTGCGGTG ATCAGGGTGA AGGGCCAGAG CTTCATGATG

1321 CATCAGATCC GGAAGATGGT CGGCCTGGTG GTGGCCATTG TGAAGGGTTA TGCCCCTGAG

1381 AGCGTGCTGG AGCGCAGCTG GGGCACAGAG AAGGTGGACG TGCCCAAGGG GCCCGGACTC

1441 GGCCTGGTCC TGGAGAGGGT GCACTTCGAG AAGTACAACC AGCGCTTTGG CAACGATGGG

1501 CTGCATGAGC CGCTGGACTG GGCGCAGGAG GAAGGAAAGG TCGCAGCCTT CAAGGAGGAG

1561 CACATCTACC CCACCATCAT CGGCACCGAG CGGGACGAAC GCTCCATGGC CCAGTGGCTG

1621 AGCACCTTGC CCATCCACAA CTTCAGTGCC ACCGCTCTCA CGGCAGGTGG CACGGGCGCC

1681 AAGGTGCCCA GTCCCCTGGA AGGCAGTGAA GGGGACGGAG ACACTGACTG AGGCGATGGG

1741 AGCTGCCCAC CAGAGTGCCT CTGAGCAGCT CACAGTGTGT GCCCAGATGT GCCACCCTCT

1801 GTGGGCAGCA AGAAGCTGGG ATCGCTGCAG CCATGTTTTC CCGGCCATGC CGGCGTTGTA

1861 ACCTCAGGAC CTTCCCTTGT AGGAACAGCC TTTCTCGAAT CTGTTTTCAG CTCTTGCATT

1921 GCATAGATGA ACCTCAGCAT GTAAAGAACT ATTTTTTTAA AGAAGTGATT TTCTTATTAA

1981 ACAAGTACAA ATTTTGCTTA GTCAAAAAAA AAAAAAAAAA

B：氨基酸序列(SEQ ID NO：32) 长度：427

1 MGLQLRALLG AFGRWTLRLG PRPSCSPRMA GNAEPPPAGA ACPQDRRSCS GRAGGDRVWE

61 DGEHPAKKLK SGGDEERREK PPKRKIVLLM AYSGKGYHGM QRNVGSSQFK TIEDDLVSAL

121 VRSGCIPENH GEDMRKMSFQ RCARTDKGVS AAGQVVSLKV WLIDDILEKI NSHLPSHIRI

181 LGLKRVTGGF NSKNRCDART YCYLLPTFAF AHKDRDVQDE TYRLSAETLQ QVNRLLACYK

241 GTHNFHNFTS QKGPQDPSAC RYILEMYCEE PFVREGLEFA VIRVKGQSFM MHQIRKMVGL

301 VVAIVKGYAP ESVLERSWGT EKVDVPKAPG LGLVLERVHF EKYNQRFGND GLHEPLDWAQ

361 EEGKVAAFKE EHIYPTIIGT ERDERSMAQW LSTLPIHNFS ATALTAGGTG AKVPSPLEGS

421 EGDGDTD

C.核苷酸及氨基酸组合序列(SEQ ID NO：33) 克隆号：PP8985

起始编码子：448 ATG 终止编码子：1729 TGA 蛋白质分子量：47467.61

1 GGT CAG CCG CGT CGC GAA TGG GGC AGG AGC GAG CCT CTC TGG TCC CGA 48

49 CGC GGG TGG CCC GGG TCT CCT CGA CTC CTG AGG AAA GCC CAC CGG GCG 96

97 GGG CGG GAG GTG AAG AGG CTG GGG AAG TCA GAG GTT AAC CTG GGC GTC 144

145 AGG GGA CGT TGG AGT TGA TCC GTC AGG GTC CCG GGG CGG TCT GGG GGC 192

193 AGT AGA GAC GGG GCT TGG GCG CGG GGC CTG AGA GGT CAG GGG TCA GCA 240

241 GGA GTG AGG CTG GGG GGT CCA GGT CCG AGA GGT CAG GGG TCA GCT GGA 288

289 GAG GGG CTG GGG CGC CGG TTT CCC GGA GGT CAG GGG TCA GAA GGA ACA 336

337 GGG CTG CAG CGT CAG GGT CCG AGA GGT TAG GGG TCG GCA GAG GCG GAG 384

385 CTG GGG CAC TGG GGG TCA GGG GTC GGG GAT CAG GGC GGG GTC GGG TGC 432

433 ACT GGT AGC CTG CGC ATG GGC CTC CAG CTT CGC GCG CTG TTG GGA GCC 480

1 Met Gly Leu Gln Leu Arg Ala Leu Leu Gly Ala 11

481 TTC GGA CGG TGG ACC CTG CGC CTG GGA CCG CGT CCG TCC TGC TCG CCG 528

12 Phe Gly Arg Trp Thr Leu Arg Leu Gly Pro Arg Pro Ser Cys Ser Pro 27

529 CGC ATG GCC GGG AAC GCG GAG CCG CCG CCC GCC GGA GCC GCA TGC CCC 576

28 Arg Met Ala Gly Asn Ala Glu Pro Pro Pro Ala Gly Ala Ala Cys Pro 43

577 CAG GAC CGG AGG TCC TGC AGC GGC CGG GCC GGG GGC GAC CGC GTC TGG 624

44 Gln Asp Arg Arg Ser Cys Ser Gly Arg Ala Gly Gly Asp Arg Val Trp 59

625 GAG GAC GGA GAA CAT CCG GCG AAG AAG CTC AAG AGG GGT GGC GAC GAG 672

60 Glu Asp Gly Glu His Pro Ala Lys Lys Leu Lys Ser Gly Gly Asp Glu 75

673 GAG CGG CGC GAG AAG CCG CCC AAG CGG AAG ATC GTG CTG CTC ATG GCC 720

76 Glu Arg Arg Glu Lys Pro Pro Lys Arg Lys Ile Val Leu Leu Met Ala 91

721 TAT TCG GGC AAG GGC TAC CAC GGC ATG CAG AGG AAT GTC GGG TCC TCA 768

92 Tyr Ser Gly Lys Gly Tyr His Gly Met Gln Arg Asn Val Gly Ser Ser 107

769 CAA TTC AAA ACA ATT GAA GAT GAC TTG GTG TCC GCC CTC GTC CGG TCA 816

108 Gln Phe Lys Thr Ile Glu Asp Asp Leu Val Ser Ala Leu Val Arg Ser 123

817 GGC TGT ATT CCT GAA AAT CAT GGT GAG GAC ATG AGG AAA ATG TCC TTC 864

124 Gly Cys Ile Pro Glu Asn His Gly Glu Asp Met Arg Lys Met Ser Phe 139

865 CAG CGC TGC GCC CGG ACA GAC AAG GGT GTG TCC GCA GCC GGC CAG GTG 912

140 Gln Arg Cys Ala Arg Thr Asp Lys Gly Val Ser Ala Ala Gly Gln Val 155

913 GTA TCC CTG AAG GTG TGG CTG ATT GAC GAC ATT CTA GAA AAG ATC AAC 960

156 Val Ser Leu Lys Val Trp Leu Ile Asp Asp Ile Leu Glu Lys Ile Asn 171

961 AGC CAC CTT CCC TCT CAC ATT CGG ATT CTG GGA CTG AAG CGG GTC ACG 1008

172 Ser His Leu Pro Ser His Ile Arg Ile Leu Gly Leu Lys Arg Val Thr 187

1009 GGC GGG TTT AAC TCC AAG AAC AGA TGT GAT GCC AGG ACC TAT TGC TAC 1056

188 Gly Gly Phe Asn Ser Lys Asn Arg Cys Asp Ala Arg Thr Tyr Cys Tyr 203

1057 CTG CTG CCC ACG TTT GCC TTT GCG CAC AAG GAC CGG GAC GTT CAG GAT 1104

204 Leu Leu Pro Thr Phe Ala Phe Ala His Lys Asp Arg Asp Val Gln Asp 219

1105 GAG ACC TAC CGC CTG AGC GCC GAG ACG CTG CAG CAG GTC AAC AGG CTC 1152

220 Glu Thr Tyr Arg Leu Ser Ala Glu Thr Leu Gln Gln Val Asn Arg Leu 235

1153 CTG GCC TGC TAC AAG GGC ACG CAC TTC TTC CAC AAT TTC ACC TCG CAG 1200

236 Leu Ala Cys Tyr Lys Gly Thr His Asn Phe His Asn Phe Thr Ser Gln 251

1201 AAG GGG CCG CAG GAT CCC AGT GCC TGC CGC TAC ATC CTG GAG ATG TAC 1248

252 Lys Gly Pro Gln Asp Pro Ser Ala Cys Arg Tyr Ile Leu Glu Met Tyr 267

1249 TGC GAG GAA CCC TTT GTG CGG GAG GGC CTG GAG TTT GCG GTG ATC AGG 1296

268 Cys Glu Glu Pro Phe Val Arg Glu Gly Leu Glu Phe Ala Val Ile Arg 283

1297 GTG AAG GGC CAG AGC TTC ATG ATG CAT CAG ATC CGG AAG ATG GTC GGC 1344

284 Val Lys Gly Gln Ser Phe Met Met His Gln Ile Arg Lys Met Val Gly 299

1345 CTG GTG GTG GCC ATT GTG AAG GGT TAT GCC CCT GAG AGC GTG CTG GAG 1392

300 Leu Val Val Ala Ile Val Lys Gly Tyr Ala Pro Glu Ser Val Leu Glu 315

1393 CGC AGC TGG GGC ACA GAG AAG GTG GAC GTG CCC AAG GCG CCC GGA CTC 1440

316 Arg Ser Trp Gly Thr Glu Lys Val Asp Val Pro Lys Ala Pro Gly Leu 331

1441 GGC CTG GTC CTG GAG AGG GTG CAC TTC GAG AAG TAC AAC CAG CGC TTT 1488

332 Gly Leu Val Leu Glu Arg Val His Phe Glu Lys Tyr Asn Gln Arg Phe 347

1489 GGC AAC GAT GGG CTG CAT GAG CCG CTG GAC TGG GCG CAG GAG GAA GGA 1536

348 Gly Asn Asp Gly Leu His Glu Pro Leu Asp Trp Ala Gln Glu Glu Gly 363

1537 AAG GTC GCA GCC TTC AAG GAG GAG CAC ATC TAC CCC ACC ATC ATC GGC 1584

364 Lys Val Ala Ala Phe Lys Glu Glu His Ile Tyr Pro Thr Ile Ile Gly 379

1585 ACC GAG CGG GAC GAA CGC TCC ATG GCC CAG TGG CTG AGC ACC TTG CCC 1632

380 Thr Glu Arg Asp Glu Arg Ser Met Ala Gln Trp Leu Ser Thr Leu Pro 395

1633 ATC CAC AAC TTC AGT GCC ACC GCT CTC ACG GCA GGT GGC ACG GGC GCC 1680

396 Ile His Asn Phe Ser Ala Thr Ala Leu Thr Ala Gly Gly Thr Gly Ala 411

1681 AAG GTG CCC AGT CCC CTG GAA GGC AGT GAA GGG GAC GGA GAC ACT GAC 1728

412 Lys Val Pro Ser Pro Leu Glu Gly Ser Glu Gly Asp Gly Asp Thr Asp 427

1729 TGA GGC GAT GGG AGC TGC CCA CCA GAG TGC CTC TGA GCA GCT CAC AGT 1776

428 *** 428

1777 GTG TGC CCA GAT GTG CCA CCC TCT GTG GGC AGC AAG AAG CTG GGA TCG 1824

1825 CTG CAG CCA TGT TTT CCC GGC CAT GCC GGC GTT GTA ACC TCA GGA CCT 1872

1873 TCC CTT GTA GGA ACA GCC TTT CTC GAA TCT GTT TTC AGC TCT TGC ATT 1920

1921 GCA TAG ATG AAC CTC AGC ATG TAA AGA ACT ATT TTT TTA AAG AAG TGA 1968

1969 TTT TCT TAT TAA ACA AGT ACA AAT TTT GCT TAG TCA AAA AAA AAA AAA 2016

2017 AAA A 2020

12.PP9003

A：核苷酸序列(SEQ ID NO：34) 长度：2056

1 GAGACTTTCC TCCAGGGGCT TCCTCACTGG GGAATTGCCG GAAAGAGCAA ACAAAAAAGG

61 CGCTGGTGTA GGCTCCAAAA TAAACACATC TGAATTCATG ATGGCATCGA CAGAGGCTCT

121 TATTGGATTA AAAGTTTCAA AACAAACAAT AACGCTTTGG AAAAAGGGTT GAATGCACCC

181 TCAGGCACGA CCATGGAGAA AGGTGGGAAC ATACAATTGG AGATTCCTGA CTTCAGCAAC

241 TCTGTCCTGA GCCATCTAAA CCAGTTGCGC ATGCAGGGCC GTCTCTGTGA TATTGTGGTC

301 AATGTGCAAG GACAAGCTTT TCGGGCTCAC AAAGTGGTGC TGGCTGCCAG CTCCCCCTAT

361 TTCCGGGATC ACATGTCCTT GAATGAGATG AGTACAGTCT CCATTTCAGT CATCAAGAAC

421 CCTACTGTTT TTGAACAGCT CCTTTCTTTC TGTTACACAG GGCGGATATG CCTGCAACTG

481 GCAGATATCA TCAGCTACCT AACAGCTGCC AGTTTTCTGC AAATGCAGCA TATTATAGAC

541 AAATGTACAC AGATCCTGGA GGGCATTCAT TTTCAAAAAT TAATGTGGCT GAGGTTGAAG

601 CAGAATTAAG TCAAACAAGG ACAAAGCATC AAGAGAGACC TCCAGAGTCT CACAGGGTTA

661 CACCAAATCT CAACCGCTCC CTTAGCCCAC GACATAATAC CCCAAAGGGA AACCGGCGAG

721 GTCAGGTTAG TGCTGTGCTG GATATCAGAG AGCTAAGTCC TCCTGAGGAG TCCACCAGCC

781 CTCAGATCAT TGAACCAAGT TCTGATGTAG AGAGCCGG(A GCCCATTCTT CGGATCAACC

841 GAGCAGGACA GTGGTATGTG GAGACAGGAG TGGCGGACCG TGGGGGTCGG AGTGATGATG

901 AAGTTAGAGT TCTTGGAGCA GTACACATCA AAACTGAAAA TCTGGAGGAG TGGCTTGGGC

961 CTGAGAATCA GCCTTCTGGA GAAGATGGGA GTAGTGCAGA GGAAGTAACA GCCATGGTGA

1021 TTGATACCAC AGGCCATGGT TCTGTAGGAC AGGAAAATTA TACTTTAGGG TCTTCAGGAG

1081 CCAAGGTGGC TCGGCCAACA AGCAGTGAAG TTGACAGATT TAGCCCCTCC GGCAGTGTTG

1141 TTCCCTTGAC AGAGAGACAC AGAGCCAGAA GTGAGTCTRC TGGGAGAATG GATGAGCCTA

1201 AGCAACCCAG CTCCCAGGTA GAAGAGTCAG CAATGATGGG AGTAAGTGGC TATGTGGAGT

1261 ATCTCCGAGA GCAGGAAGTA TCTGAGCGGT GGTTCCGGTA CAACCCTCGT CTCACCTGCA

1321 TCTATTGCGC CAAATCTTTC AACCAGAAGG GAAGCCTGGA CCGCCACATG CGCCTACACA

1381 TGGGGATCAC ACCATTCGTC TGCCGCATGT GTGGCAAGAA GTATACCCGG AAAGATCAGC

1441 TGGAGTATCA TATCCGCAAG CACACAGGCA ACAAGCCCTT TCACTGTCAT GTCTGTGGCA

1501 AAAGTTTCCC CTTCCAGGCC ATCTTGAATC AGCACTTTCG CAAAAACCAC CCTGGCTGTA

1561 TACCCCTGGA GGGGCCTCAC AGCATCTCCC CTGAAACAAC TGTCACATCT CGAGGACAAG

1621 CTGAGGAAGA GTCACCTTCA CAGGAAGAGA CAGTTGCTCC TGGGGAAGCT GTCCAGGGCT

1681 CTGTGTCCAC CACTGGGCCA GACTGAAACA TCCAGGGGGA GGGGGCTGAC CCTCTTCCCC

1741 TTTGAGCCAT AAGCAGCCAG CATCAGAGCC ATGGGCTGAT ACTTAGATTC ACAAAATGCC

1801 ACATCACTAG GCCAGAAGAT GCTCCCAAGA TGTTGCCAAA CTGGAGGATC AGCAACTTAC

1861 ACAAAAGCAC TAAAGGCTCC TCCCTTCTTA TTGCCCGCCT CACACTTTGG AAAATAATCA

1921 AGCAAATCAA CTTTCTAATT CAGGGATCAA CAGCCTTGGT TTGTTAACTT TATAAGAAAA

1981 AAGGTTTTTT TAACAAAACG ATGATGATAA ATGGTCATTT ATCTATCAAA AAAAAAAAAA

2041 AAAAAAAAAA AAAAAA

B：氨基酸序列(SEQ ID NO：35) 长度：412

1 MPATGRYHQL PNSCQFSANA AYYRQMYTDP GGHSFSKINV AEVEAELSQT RTKHQERPPE

61 SHRVTPNLNR SLSPRHNTPK GNRRGQVSAV LDIRELSPPE ESTSPQIIEP SSDVESREPI

121 LRINRAGQWY VETGVADRGG RSDDEVRVLG AVHIKTENLE EWLGPENQPS GEDGSSAEEV

181 TAMVIDTTGH GSVGQENYTL GSSGAKVARP TSSEVDRFSP SGSVVPLTER HRARSESXGR

241 MDEPKQPSSQ VEESAMMGVS GYVEYLREQE VSERWFRYNP RLTCIYCAKS FNQKGSLDRH

301 MRLHMGITPF VCRMCGKKYT RKDQLEYHIR KHTGNKPFHC HVCGKSFPFQ AILNQHFRKN

361 HPGCIPLEGP HSISPETTVT SRGQAEEESP SQEETVAPGE AVQGSVSTTG PD

C.核苷酸及氨基酸组合序列(SEQ ID NO：36) 克隆号：PP9003

起始编码子：468 ATG 终止编码子：1704 TGA 蛋白质分子量：45841.28

1 GA GAC TTT CCT CCA GGG GCT TCC TCA CTG GGG AAT TGC CGG AAA GAG 47

48 CAA ACA AAA AAG GCG CTG GTG TAG GCT CCA AAA TAA ACA CAT CTG AAT 95

96 TCA TGA TGG CAT CGA CAG AGG CTC TTA TTG GAT TAA AAG TTT CAA AAC 143

144 AAA CAA TAA CGC TTT GGA AAA AGG GTT GAA TGC ACC CTC AGG CAC GAC 191

192 CAT GGA GAA AGG TGG GAA CAT ACA ATT GGA GAT TCC TGA CTT CAG CAA 239

240 CTC TGT CCT GAG CCA TCT AAA CCA GTT GCG CAT GCA GGG CCG TCT CTG 287

288 TGA TAT TGT GGT CAA TGT GCA AGG ACA AGC TTT TCG GGC TCA CAA AGT 335

336 GGT GCT GGC TGC CAG CTC CCC CTA TTT CCG CGA TCA CAT GTC CTT GAA 383

384 TGA GAT GAG TAC AGT CTC CAT TTC AGT CAT CAA GAA CCC TAC TGT TTT 431

432 TGA ACA GCT CCT TTC TTT CTG TTA CAC AGG GCG GAT ATG CCT GCA ACT 479

1 Met Pro Ala Thr 4

480 GGC AGA TAT CAT CAG CTA CCT AAC AGC TGC GAG TTT TCT GCA AAT GCA 527

5 Gly Arg Tyr His Gln Leu Pro Asn Ser Cys Gln Phe Ser Ala Asn Ala 20

528 GCA TAT TAT AGA CAA ATG TAC ACA GAT CCT GGA GGG CAT TCA TTT TCA 575

21 Ala Tyr Tyr Arg Gln Met Tyr Thr Asp Pro Gly Gly His Ser Phe Ser 36

576 AAA ATT AAT GTG GCT GAG GTT GAA GCA GAA TTA AGT CAA ACA AGG ACA 623

37 Lys Ile Asn Val Ala Glu Val Glu Ala Glu Leu Ser Gln Thr Arg Thr 52

624 AAG CAT CAA GAG AGA CCT CCA GAG TCT CAC AGG GTT ACA CCA AAT CTC 671

53 Lys His Gln Glu Arg Pro Pro Glu Ser His Arg Val Thr Pro Asn Leu 68

672 AAC CGC TCC CTT AGC CCA CGA CAT AAT ACC CCA AAG GGA AAC CGG CGA 719

69 Asn Arg Ser Leu Ser Pro Arg His Asn Thr Pro Lys Gly Asn Arg Arg 84

720 GGT CAG GTT AGT GCT GTG CTG GAT ATC AGA GAG CTA AGT CCT CCT GAG 767

85 Gly Gln Val Ser Ala Val Leu Asp Ile Arg Glu Leu Ser Pro Pro Glu 100

768 GAG TCC ACC AGC CCT CAG ATC ATT GAA CCA AGT TCT GAT GTA GAG AGC 815

101 Glu Ser Thr Ser Pro Gln Ile Ile Glu Pro Ser Ser Asp Val Glu Ser 116

816 CGG GAG CCC ATT CTT CGG ATC AAC CGA GCA GGA CAG TGG TAT GTG GAG 863

117 Arg Glu Pro Ile Leu Arg Ile Asn Arg Ala Gly Gln Trp Tyr Val Glu 132

864 ACA GGA GTG GCG GAC CGT GGG GGT CGG AGT GAT GAT GAA GTT AGA GTT 911

133 Thr Gly Val Ala Asp Arg Gly Gly Arg Ser Asp Asp Glu Val Arg Val 148

912 CTT GGA GCA GTA CAC ATC AAA ACT GAA AAT CTG GAG GAG TGG CTT GGG 959

149 Leu Gly Ala Val His Ile Lys Thr Glu Asn Leu Glu Glu Trp Leu Gly 164

960 CCT GAG AAT CAG CCT TCT GGA GAA GAT GGG AGT AGT GCA GAG GAA GTA 1007

165 Pro Glu Asn Gin Pro Ser Gly Glu Asp Gly Ser Ser Ala Glu Glu Val 180

1008 ACA GCC ATG GTG ATT GAT ACC ACA GGC CAT GGT TCT GTA GGA CAG GAA 1055

181 Thr Ala Met Val Ile Asp Thr Thr Gly His Gly Ser Val Gly Gln Glu 196

1056 AAT TAT ACT TTA GGG TCT TCA GGA GCC AAG GTG GCT CGG CCA ACA AGC 1103

197 Asn Tyr Thr Leu Gly Ser Ser Gly Ala Lys Val Ala Arg Pro Thr Ser 212

1104 AGT GAA GTT GAC AGA TTT AGC CCC TCC GGC AGT GTT GTT CCC TTG ACA 1151

213 Ser Glu Val Asp Arg Phe Ser Pro Ser Gly Ser Val Val Pro Leu Thr 228

1152 GAG AGA CAC AGA GCC AGA AGT GAG TCT RCT GGG AGA ATG GAT GAG CCT 1199

229 Glu Arg His Arg Ala Arg Ser Glu Ser Xxx Gly Arg Met Asp Glu Pro 244

1200 AAG CAA CCC AGC TCC CAG GTA GAA GAG TCA GCA ATG ATG GGA GTA AGT 1247

245 Lys Gln Pro Ser Ser Gln Val Glu Glu Ser Ala Met Met Gly Val Ser 260

1248 GGC TAT GTG GAG TAT CTC CGA GAG CAG GAA GTA TCT GAG CGG TGG TTC 1295

261 Gly Tyr Val Glu Tyr Leu Arg Glu Gln Glu Val Ser Glu Arg Trp Phe 276

1296 CGG TAC AAC CCT CGT CTC ACC TGC ATC TAT TGC GCC AAA TCT TTC AAC 1343

277 Arg Tyr Asn Pro Arg Leu Thr Cys Ile Tyr Cys Ala Lys Ser Phe Asn 292

1344 CAG AAG GGA AGC CTG GAC CGC CAC ATG CGC CTA CAC ATG GGG ATC ACA 1391

293 Gln Lys Gly Ser Leu Asp Arg His Met Arg Leu His Met Gly Ile Thr 308

1392 CCA TTC GTC TGC CGC ATG TGT GGC AAG AAG TAT ACC CGG AAA GAT CAG 1439

309 Pro Phe Val Cys Arg Met Cys Gly Lys Lys Tyr Thr Arg Lys Asp Gln 324

1440 CTG GAG TAT CAT ATC CGC AAG CAC ACA GGC AAC AAG CCC TTT CAC TGT 1487

325 Leu Glu Tyr His Ile Arg Lys His Thr Gly Asn Lys Pro Phe His Cys 340

1488 CAT GTC TGT GGC AAA AGT TTC CCC TTC CAG GCC ATC TTG AAT CAG CAC 1535

341 His Val Cys Gly Lys Ser Phe Pro Phe Gln Ala Ile Leu Asn Gln His 356

1536 TTT CGC AAA AAC CAC CCT GGC TGT ATA CCC CTG GAG GGG CCT CAC AGC 1583

357 Phe Arg Lys Asn His Pro Gly Cys Ile Pro Leu Glu Gly Pro His Ser 372

1584 ATC TCC CCT GAA ACA ACT GTC ACA TCT CGA GGA CAA GCT GAG GAA GAG 1631

373 Ile Ser Pro Glu Thr Thr Val Thr Ser Arg Gly Gln Ala Glu Glu Glu 388

1632 TCA CCT TCA CAG GAA GAG ACA GTT GCT CCT GGG GAA GCT GTC CAG GGC 1679

389 Ser Pro Ser Gln Glu Glu Thr Val Ala Pro Gly Glu Ala Val Gln Gly 404

1680 TCT GTG TCC ACC ACT GGG CCA GAC TGA AAC ATC CAG GGG GAG GGG GCT 1727

405 Ser Val Ser Thr Thr Gly Pro Asp *** 413

1728 GAC CCT CTT CCC CTT TGA GCC ATA AGC AGC CAG CAT CAG AGC CAT GGG 1775

1776 CTG ATA CTT AGA TTC ACA AAA TGC CAC ATC ACT AGG CCA GAA GAT GCT 1823

1824 CCC AAG ATG TTG CCA AAC TGG AGG ATC AGC AAC TTA CAC AAA AGC ACT 1871

1872 AAA GGC TCC TCC CTT CTT ATT GCC CGC CTC ACA CTT TGG AAA ATA ATC 1919

1920 AAG CAA ATC AAC TTT CTA ATT CAG GGA TCA ACA GCC TTG GTT TGT TAA 1967

1968 CTT TAT AAG AAA AAA GGT TTT TTT AAC AAA ACG ATG ATG ATA AAT GGT 2015

2016 CAT TTA TCT ATC AAA AAA AAA AAA AAA AAA AAA AAA AAA AA 2056

Claims

1.一种分离的具有抑癌功能的人蛋白多肽，其特征在于，它是具有选自下组的氨基酸序列的多肽：SEQ ID NO：2、5、8、11、14、17、23、26、29、32、35。

2.如权利要求1所述的多肽，其特征在于，该多肽的氨基酸序列选自下组：SEQ ID NO：2、5、8、11、14、17。

3.一种分离的多核苷酸，其特征在于，选自下组：

(a)编码如权利要求1所述多肽的多核苷酸；

(b)与多核苷酸(a)完全互补的多核苷酸。

4.如权利要求3所述的多核苷酸，其特征在于，该多核苷酸编码的多肽具有选自下组的氨基酸序列：SEQ ID NO：2、5、8、11、14、17、23、26、29、32、35。

5.如权利要求3所述的多核苷酸，其特征在于，该多核苷酸的序列选自下组：

SEQ ID NO：3、6、9、12、15、18、24、27、30、33、36的编码区序列或全长序列。

6.一种载体，其特征在于，它含有权利要求3所述的多核苷酸。

7.一种遗传工程化的宿主细胞，其特征在于，它是选自下组的一种宿主细胞：

(a)用权利要求6所述的载体转化或转导的宿主细胞；

(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。

8.一种具有抑癌功能的人蛋白活性的多肽的制备方法，其特征在于，该方法包含：

(a)在适合表达具有抑癌功能的人蛋白的条件下，培养权利要求7所述的宿主细胞；

(b)从培养物中分离出具有抑癌功能的人蛋白活性的多肽。

9.一种能与权利要求1所述的具有抑癌功能的人蛋白多肽特异性结合的抗体。

10.一种药物组合物，其特征在于，它含有安全有效量的权利要求1所述的多肽以及药学上可接受的载体。