CN1194989C

CN1194989C - 具有抑制癌细胞生长功能的新的人蛋白及其编码序列

Info

Publication number: CN1194989C
Application number: CNB011045450A
Authority: CN
Inventors: 顾健人; 杨胜利
Original assignee: Shanghai Cancer Institute
Current assignee: Shanghai Cancer Institute
Priority date: 2000-02-17
Filing date: 2001-02-13
Publication date: 2005-03-30
Anticipated expiration: 2021-02-13
Also published as: CN1309135A

Abstract

本发明公开了一类新的具有抑癌功能的人蛋白，编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。

Description

具有抑制癌细胞生长功能的新的人蛋白及其编码序列

本发明属于生物技术领域，具体地说，本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸，以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。

人基因组学研究目前是国际上的热点，除人染色体DNA大规模测序，表达序列测序(EST)的方法外，还缺少从功能开始的筛选具有功能基因的高通量的方法。

癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤，目前人们已越来越关注肿瘤的基因治疗。因此，本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。

本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。

本发明的另一目的是提供编码这些多肽的多核苷酸。

本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。

在本发明的第一方面，提供新颖的分离出的具有抑癌功能的蛋白多肽，它包含具有选自下组的氨基酸序列的多肽：SEQ ID NO：2、SEQ ID NO：5、SEQ ID NO：8、SEQ ID NO：11、SEQ ID NO：14、SEQ ID NO：17、SEQ ID NO：20；或其保守性变异多肽、或其活性片段、或其活性衍生物。

较佳地，该多肽是具有选自下组的氨基酸序列的多肽：SEQ ID NO：2、SEQ ID NO：5、SEQ ID NO：8、SEQ ID NO：11、SEQ ID NO：14、SEQ ID NO：17、SEQ ID NO：20。

在本发明的第二方面，提供了一种分离的多核苷酸，它包含一核苷酸序列，该核苷酸序列与选自下组的一种核苷酸序列有至少85％相同性：(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸；(b)与多核苷酸(a)互补的多核苷酸。较佳地，该多核苷酸编码的多肽具有选自下组的氨基酸序列：SEQ ID NO：2、SEQ ID NO：5、SEQ ID NO：8、SEQ ID NO：11、SEQ IDNO：14、SEQ ID NO：17、SEQ ID NO：20。更佳地，该多核苷酸的序列选自下组：SEQ ID NO：3、SEQ ID NO：6、SEQ ID NO：9、SEQ ID NO：12、SEQ ID NO：15、SEQ ID NO：18、SEQ ID NO：21的编码区序列或全长序列。

在本发明的第三方面，提供了含有上述多核苷酸的载体，以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。

在本发明的第四方面，提供了制备具有抑癌功能的蛋白活性的多肽的制备方法，该方法包含：(a)在适合表达具有抑癌功能的蛋白的条件下，培养上述被转化或转导的宿主细胞；(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。

在本发明的第五方面，提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子，它含有上述的多核苷酸中连续的10-800个核苷酸。

在本发明的第六方面，提供了一种药物组合物，它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。

本发明的其它方面由于本文的技术的公开，对本领域的技术人员而言是显而易见的。

本发明采用大规模cDNA克隆转染癌细胞，在获得具有抑癌作用的基础上，经测序证明为新的基因，进一步得到全长cDNA克隆。DNA转染试验证明，本发明的具有抑癌功能的蛋白对癌细胞(肝癌细胞)具有抑制克隆形成的作用，其抑制率在50％或50％以上。

如本文所用，“分离的”是指物质从其原始环境中分离出来(如果是天然的物质，原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的，但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开，则为分离纯化的。

如本文所用，“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。具有抑癌功能的蛋白多肽的纯度能用氨基酸序列分析。

本发明的多肽可以是重组多肽、天然多肽、合成多肽，优选重组多肽。本发明的多肽可以是天然纯化的产物，或是化学合成的产物，或使用重组技术从原核或真核宿主(例如，细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主，本发明的多肽可以是糖基化的，或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。

本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用，术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽，而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的，或(ii)在一个或多个氨基酸残基中具有取代基团的多肽，或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物，例如聚乙二醇)融合所形成的多肽，或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导，这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。

本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以SP329蛋白为例，编码成熟多肽的编码区序列可以与SEQ ID NO：3所示的编码区序列相同或者是简并的变异体。如本文所用，“简并的变异体”在本发明中是指编码具有SEQ ID NO：2的蛋白质，但与SEQ ID NO：3所示的编码区序列有差别的核酸序列。对于其他具有抑癌功能的蛋白，可依此类推。

编码成熟多肽的多核苷酸包括：只编码成熟多肽的编码序列；成熟多肽的编码序列和各种附加编码序列；成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。

术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸，也可以是还包括附加编码和/或非编码序列的多核苷酸。

本发明还涉及上述多核苷酸的变异体，其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的，等位变异体是一个多核苷酸的替换形式，它可能是一个或多个核苷酸的取代、缺失或插入，但不会从实质上改变其编码的多肽的功能。

本发明还涉及与上述的序列杂交且两个序列之间具有至少50％，较佳地至少70％，更佳地至少80％相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中，“严格条件”是指：(1)在较低离子强度和较高温度下的杂交和洗脱，如0.2×SSC，0.1％SDS，60℃；或(2)杂交时加有变性剂，如50％(v/v)甲酰胺，0.1％小牛血清/0.1％Ficoll，42℃等；或(3)仅在两条序列之间的相同性至少在95％以上，更好是97％以上时才发生杂交。并且，可杂交的多核苷酸编码的多肽与SEQ ID NO：2所示的成熟多肽有相同的生物学功能和活性。

本发明还涉及与上述的序列杂交的核酸片段。如本文所用，“核酸片段”的长度至少含15个核苷酸，较好是至少30个核苷酸，更好是至少50个核苷酸，最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。

本发明中的多肽和多核苷酸优选以分离的形式提供，更佳地被纯化至均质。

本发明的DNA序列能用几种方法获得。例如，用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于：1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列，和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。

编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得：1)从基因组DNA分离双链DNA序列；2)化学合成DNA序列以获得所需多肽的双链DNA。

上述提到的方法中，分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时，DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时，DNA序列的直接化学合成是不可能的，选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录，形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术，试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook，et al.，Molecular Cloning，ALaboratory Manual，1989)。还可得到商业供应的cDNA文库，如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时，即使极少的表达产物也能克隆。

可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于)：(1)DNA-DNA或DNA-RNA杂交；(2)标志基因的功能出现或丧失；(3)测定具有抑癌功能的蛋白的转录本的水平；(4)通过免疫学技术或测定生物学活性，来检测基因表达的蛋白产物。上述方法可单用，也可多种方法联合应用。

在第(1)种方法中，杂交所用的探针是与本发明的多核苷酸的任何一部分同源，其长度至少15个核苷酸，较好是至少30个核苷酸，更好是至少50个核苷酸，最好是至少100个核苷酸。此外，探针的长度通常在2kb之内，较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素，荧光素或酶(如碱性磷酸酶)等。

在第(4)种方法中，检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法，放射免疫沉淀法，酶联免疫吸附法(ELISA)等。

应用PCR技术扩增DNA/RNA的方法(Saiki，et al.Science 1985；230：1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时，可优选使用RACE法(RACE-cDNA末端快速扩增法)，用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择，并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。

如上所述得到的本发明的基因，或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS，1977，74：5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列，测序需反复进行。有时需要测定多个克隆的cDNA序列，才能拼接成全长的cDNA序列。

本发明也涉及包含本发明的多核苷酸的载体，以及用本发明的载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞，以及经重组技术产生本发明所述多肽的方法。

通过常规的重组DNA技术，可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽(Science，1984；224：1431)。一般来说有以下步骤：

(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体)，或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞；

(2).在合适的培养基中培养的宿主细胞；

(3).从培养基或细胞中分离、纯化蛋白质。

本发明中，具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于：在细菌中表达的基于T7的表达载体(Rosenberg，et al.Gene，1987，56：125)；在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans，J Bio Chem.263：3521，1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之，只要能在宿主体内复制和稳定，任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。

本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook，et al.Molecular Cloning，a Laboratory Manual，cold Spring HarborLaboratory.New York，1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上，以指导mRNA合成。这些启动子的代表性例子有：大肠杆菌的lac或trp启动子；λ噬菌体PL启动子；真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。

此外，表达载体优选地包含一个或多个选择性标记基因，以提供用于选择转化的宿主细胞的表型性状，如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP)，或用于大肠杆菌的四环素或氨苄青霉素抗性。

包含上述的适当DNA序列以及适当启动子或者控制序列的载体，可以用于转化适当的宿主细胞，以使其能够表达蛋白质。

宿主细胞可以是原核细胞，如细菌细胞；或是低等真核细胞，如酵母细胞；或是高等真核细胞，如哺乳动物细胞。代表性例子有：大肠杆菌，链霉菌属；鼠伤寒沙门氏菌的细菌细胞；真菌细胞如酵母；植物细胞；果蝇S2或Sf9的昆虫细胞；CHO、COS或Bowes黑素瘤细胞的动物细胞等。

本发明的多核苷酸在高等真核细胞中表达时，如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子，通常大约有10到300个碱基对，作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。

本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。

用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时，能吸收DNA的感受态细胞可在指数生长期后收获，用CaCl2法处理，所用的步骤在本领域众所周知。可供选择的是用MgCl₂。如果需要，转化也可用电穿孔的方法进行。当宿主是真核生物，可选用如下的DNA转染方法：磷酸钙共沉淀法，常规机械方法如显微注射、电穿孔、脂质体包装等。

获得的转化子可以用常规方法培养，表达本发明的基因所编码的多肽。根据所用的宿主细胞，培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后，用合适的方法(如温度转换或化学诱导)诱导选择的启动子，将细胞再培养一段时间。

上述方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要，可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。其例子包括但并不限于：常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。

重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于)：直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病，和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如，抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。

本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能，而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如，能在药物的存在下，将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。

具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能，或是抑制具有抑癌功能的人蛋白的产生，或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。

在筛选作为拮抗剂的化合物时，可以将具有抑癌功能的蛋白加入生物分析测定中，通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法，可以筛选出起拮抗剂作用的受体缺失物和类似物。

本发明的多肽可直接用于疾病治疗，例如，各种恶性肿瘤、和细胞异常增殖等。

本发明的多肽，及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术，三瘤技术，人B-细胞杂交瘤技术，EBV-杂交瘤技术等。

可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。

本发明还提供含有一种或多种容器的药盒或试剂盒，容器中装有一种或多种本发明的药用组合物成分。与这些容器一起，可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示，该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外，本发明的多肽可以与其它的治疗化合物结合使用。

药物组合物可以以方便的方式给药，如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素，如给药方式、待治疗者的健康条件和诊断医生的判断。

具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有抑癌功能的蛋白，以抑制内源性的具有抑癌功能的蛋白活性。例如，一种变异的具有抑癌功能的蛋白可以是缩短的、缺失了信号传导功能域的具有抑癌功能的蛋白，虽可与下游的底物结合，但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook，et al.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。

抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子，其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得，如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性，可用多种方法对其进行修饰，如增加两侧的序列长度，核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。

多聚核苷酸导入组织或细胞内的方法包括：将多聚核苷酸直接注入到体内组织中；或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中，再将细胞移植到体内等。

本发明的多肽还可用作肽谱分析，例如，多肽可用物理的、化学或酶进行特异性切割，并进行一维或二维或三维的凝胶电泳分析。

本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于)：多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。

抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中，检测活检标本中的具有抑癌功能的人蛋白。

与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记，注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。

本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。

抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素，蓖麻蛋白，红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP，攻击抗体的氨基，通过二硫键的交换，将毒素结合于抗体上，这种杂交抗体可用于杀灭具有抑癌功能的人蛋白阳性的细胞。

多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物，如家兔，小鼠，大鼠等。多种佐剂可用于增强免疫反应，包括但不限于弗氏佐剂等。

具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature，1975，256：495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al，PNAS，1985，81：6851)。而已有的生产单链抗体的技术(U.S.Pat No.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。

能与具有抑癌功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时，必须对具有抑癌功能的人蛋白分子进行标记。

本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的，且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平，可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。

具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面，具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法，Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术，相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上，用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。

检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外，突变有可能影响蛋白的表达，因此用Northern印迹法、Western印迹法可间接判断基因有无突变。

本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具体位置且并可与其杂交。现在，只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。根据本发明，为了将这些序列与疾病相关基因相关联，其重要的第一步就是将这些DNA序列定位于染色体上。

简而言之，根据cDNA制备PCR引物(优选15-35bp)，可以将序列定位于染色体上。然后，将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。

体细胞杂合细胞的PCR定位法，是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物，通过类似方法，可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选，从而构建染色体特异的cDNA库。

将cDNA克隆与中期染色体进行荧光原位杂交(FISH)，可以在一个步骤中精确地进行染色体定位。此技术的综述，参见Verma等，Human Chromosomes:a Manual of BasicTechniques，Pergamon Press，New York(1988)。

一旦序列被定位到准确的染色体位置，此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如，V.Mckusick，Mendelian Inheritance in Man(可通过与JohnsHopkins University Welch Medical Library联机获得)。然后可通过连锁分析，确定基因与业已定位到染色体区域上的疾病之间的关系。

接着，需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变，而该突变在任何正常个体中未观察到，则该突变可能是疾病的病因。比较患病和未患病个体，通常涉及首先寻找染色体中结构的变化，如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力，被精确定位至与疾病有关的染色体区域的cDNA，可以是50至500个潜在致病基因间之一种(假定l兆碱基作图分辨能力和每20kb对应于一个基因)。

本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法，可根据本发明所公开的有关核苷酸序列，尤其是开放阅读框序列来设计引物，并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板，扩增而得有关序列。当序列较长时，常常需要进行两次或多次PCR扩增，然后再将各次扩增出的片段按正确次序拼接在一起。

一旦获得了有关的序列，就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体，再转入细胞，然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。

此外，还可用人工合成的方法来合成有关序列，尤其是片段长度较短时。通常，通过先合成多个小片段，然后再进行连接可获得序列很长的片段。

目前，已经可以完全通过化学合成来编码本发明蛋白(或其片段，或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外，还可通过化学合成将突变引入本发明蛋白序列中。

此外，由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列，因此，与来源于其他物种的同族蛋白相比，预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件如Sambrook等人，分子克隆：实验室手册(New York：Cold Spring Harbor Laboratory Press，1989)中所述的条件，或按照制造厂商所建议的条件。

实施例1：cDNA基因的获得及对癌细胞克隆形成的抑制作用

SP329来自于从GIBCO BRL公司购得肝cDNA文库(cat，No.10422-012)，PP203，PP238，PP856，PP1065，PP1221，PP2250来自于按常规方法构建的人胎盘cDNA文库。取3、6、10月龄的胎盘组织，用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA，用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Seratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL)，反转录反应在42℃进行。转化XL 10-Gold感受细胞，获得了1×10⁶cfu/μg cDNA滴度的cDNA文库。第一轮随机挑取cDNA克隆，其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针，杂交筛选cDNA文库，挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒，按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系7721。100ng DNA酒精沉淀干燥后，加6μl H₂O溶解，待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液，混匀后，室温放置10分钟。每管中加150μl无血清培液，均分加入3孔生长于96孔板的7721细胞中，37℃放置2小时，每孔再加50μl无血清培液，37℃24小时。每孔换100μl全培液，37℃24小时，换含G418的全培液100μl，37℃24～48小时，边观察，边换G418浓度不等的培液。约2～3次后，直到镜检细胞有克隆形成，计数。发现SP329，PP203，PP238，PP856，PP1065，PP1221，PP2250和PP3898有抑制细胞克隆形成作用(抑制率在50％或50％以上)，结果如下表1所示。

cDNA克隆转染细胞(7721)克隆形成情况

cDNA克隆 CDNA克隆数空载体克隆数

名称 (三个重复) (三个重复)

SP329 2 0 0 18 24 23

PP203 6 8 13 27 31 26

PP238 0 0 0 20 17 16

PP856 0 1 0 30 13 15

PP1065 2 0 1 32 39 37

PP1221 0 0 1 30 20 22

PP2250 0 0 1 32 31 34

PP3898 2 0 0 33 34 38

对cDNA克隆采用双脱氧终止法，在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后，确定为新基因克隆，进行另一端测序，仍未获得全长cDNA序列，设计引物，再次进行测序，直到获得全长序列。

对SP329、PP203、PP238、PP856、PP1065、PP1221、PP2250、PP3898 cDNA克隆序列分析后发现基因尚不完整，采用Clontech公司SMART RACE cDNA扩增试剂盒(Cat.No.K1811-1)，设计基因特异引物(如下表2所示)，按说明书进行操作，获得全长克隆。

表2

克隆名称	特异引物1	特异引物2
克隆名称	特异引物1	特异引物2	SP329	5′GCTTCGCTCAAGAAGAAAAAGGCAC 3′	5′AGGACCTCCCAACTGCATGCCTC 3′
PP203	5′ACCCCTGGGATCCAACTCTTTGGTG 3′	5′CTGGGTATAGGCCACAGCGATCCAA 3′	SP329	5′GCTTCGCTCAAGAAGAAAAAGGCAC 3′	5′AGGACCTCCCAACTGCATGCCTC 3′
PP203	5′ACCCCTGGGATCCAACTCTTTGGTG 3′	5′CTGGGTATAGGCCACAGCGATCCAA 3′	PP238	5′TGTTCTGCCGGGAGGAGAAGCAGTA 3′	5′CCGTTCTTCTTCTCCACCTGCTCCC 3′
PP856	5′CCAGGGTGACTCAGCTGTCACTCCA 3′	5′CCAGAACTTTCCGCAGACCTTGTGC 3′	PP238	5′TGTTCTGCCGGGAGGAGAAGCAGTA 3′	5′CCGTTCTTCTTCTCCACCTGCTCCC 3′
PP856	5′CCAGGGTGACTCAGCTGTCACTCCA 3′	5′CCAGAACTTTCCGCAGACCTTGTGC 3′	PP1065	5′GGAAAGGGGCTAGCATGAAGGTCCA 3′	5′TATGTTGGGGTGGGAGGAGCTCTGA 3′
PP1221	5′TATGGCTTTCTTGCCAGGAGGGGTC 3′	5′CCCTGGGTAGAACGGGTGAAGGGAT 3′	PP1065	5′GGAAAGGGGCTAGCATGAAGGTCCA 3′	5′TATGTTGGGGTGGGAGGAGCTCTGA 3′
PP1221	5′TATGGCTTTCTTGCCAGGAGGGGTC 3′	5′CCCTGGGTAGAACGGGTGAAGGGAT 3′	PP2250	5′GTCTGGGTATCAGCTGTTGGGGCCT 3′	5′ACAAGGAGAGAGTGCGGCTGCTGAG 3′
PP3898	5′TCATCCAGCCGGTCACTTGACTTGA 3′	5′GCCACAGCTGGTAGTTGGACTTGCC 3′	PP2250	5′GTCTGGGTATCAGCTGTTGGGGCCT 3′	5′ACAAGGAGAGAGTGCGGCTGCTGAG 3′

具体而言，对各克隆使用如下引物：

PP203克隆

通用引物mix(UPM)Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3′

巢式通用引物(NUP) 5′AAGCAGTGGTAACAACGCAGAGT 3′

pp203-NB 5′ACCCCTGGGATCCAACTCTTTGGTG 3′

pp203-B 5′CTGGGTATAGGCCACAGCGATCCAA 3′

PP238克隆

通用引物mix(UPM)Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3″

巢式通用引物(NUP) 5′AAGCAGTGGTAACAACGCAGAGT 3′

pp238-NB 5′TGTTCTGCCGGGAGGAGAAGCAGTA 3′

pp238-B 5′CCGTTCTTCTTCTCCACCTGCTCCC 3′

PP856克隆

通用引物mix(UPM)Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3′

巢式通用引物(NUP) 5′AAGCAGTGGTAACAACGCAGAGT 3′

pp856-NB 5′CCAGGGTGACTCAGCTGTCACTCCA3′

pp856-B 5′CCAGAACTTTCCGCAGACCTTGTGC 3′

PP1065克隆

通用引物mix(UPM)Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3′

巢式通用引物(NUP) 5′AAGCAGTGGTAACAACGCAGAGT 3′

PP1065-B： 5′GGAAAGGGGCTAGCATGAAGGTCCA 3′

PP1065-NB 5′TATGTTGGGGTGGGAGGAGCTCTGA 3′

PP1221克隆

衔接引物1(AP1) 5′CCATCCTAATACGACTCACTATAGGGC3′ 27

衔接引物2(AP2) 5′ACTCACTATAGGGCTCGAGCGGC 3′ 23

pp1221-C 5′TATGGCTTTCTTGCCAGGAGGGGTC 3′ 25

pp1221-NC 5′CCCTGGGTAGAACGGGTGAAGGGAT 3′ 25

pp2250-C 5′ACAAGGAGAGAGTGCGGCTGCTGAG 3′

pp2250-D 5′TGCATGCCACTTTCAGTCAACAGGA 3′

PP329克隆

衔接引物1(AP1) 5′CCATCCTAATACGACTCACTATAGGGC 3′27

衔接引物2(AP2) 5′ACTCACTATAGGGCTCGAGCGGC 3′ 23

sp329-B 5′gcttcgctcaagaagaaaaaggcac 3′ 25

sp329-NB 5′aggacctcccaactgcatgcctc 3′ 23

其中，对使用通用引物的克隆，获得全长基因按如下操作。用人胎盘组织mRNA为起始材料，按Clontech公司SM ART RACE cDNA扩增试剂盒(cat # 1811-1)说明书获得cDNA.然后分别次UPM引物和基因特异的X-B进行第一软PCR，再以NUP引物和基因特异的X-NB进行第二轮PCR，获得基因片段(注：X为基因克隆号码)。

反应条件为：94℃3′一个循环

(第一轮) 94℃1′58℃1′72℃2′35个循环

72℃10′一个循环

(第二轮) 同上，但退火温度为60℃

对使用衔接引物的克隆，以Clonteoh公司Marathon-Ready人肝cDNA(cat # 7407-1)为样板，分别以Apl和X-C引物进行第一轮PCR，再以Apl和X-NC进行第二轮PCR获得基因片段(注：X为基因克隆号码)。反应条件同上。

PP2250以人胎盘cDNA为样板，PP2250-C，PP2250-D为引物按94℃3′1个循环，94℃1′60℃1′1 70℃2′35个循环，72℃10′一个循环进行PCR，获得基因片段。

实施例2：cDNA克隆序列分析

1. SP329

A：核苷酸序列(SEQ ID NO：1)长度：2360

TGTCAGTAAG TGGAAAAGGC AAGACTCCAC TTCGAAAGAG GTACAACTCC CATCAGATGG 60

GCCAGTCGAA GCAGTTTCCC CTCGAGGAAA GCAGCTGTGA GAAAGGCTGT CAGGTCACCA 120

GTGAGCAGAT CAAAGCCGAT ATGAAAGCAG CTAGGGATAT TCCTGAAAAG AAAAAAAACA 180

AGGATGTTTA TCCCAGCTGC AGCAGCACCA CCGCCAGCAC AGTGGGAAAC TCCAGCTCAC 240

ACAACACTGC TTCTCAAAGC CCCGACTTTG TAAGGACGGT GAACAGCGGC GGCTCTTCCG 300

AGCCTAGCCC TACAGAAGTG GATGTGTCCA GGCAGTGTGC CTGCTCCCCC GGTGGGTCAG 360

AGGACTCTGA GGCCATGGAG GAGGGAGATG CAGAGAGTTC TGTCTGCCCA GATGCTTGCT 420

GTCACAGGCC CCAGGAATTC CCAAAGGAGA ACTAGCAGGT GTTCTGATGA GGAACGTCCT 480

TCAACCAGCC GAGCCTGTGT TGTGAATGGC CCGGATGGTA CGAGATCCGC CTTTTCCTTT 540

AGGACTCTGC CACAAGGGGG GTCTTCAGGC CCAGCACATG ATGAGAGGAC TAATGGGAGT 600

GGCTCTGGGG CTACAGGTGA GGACAGGAGG GGGAGCTCCC AGCCTGAGAG TTGTGACGTG 660

CAGTCTAATG AAGACTACCC TCGGAGGCCC CTAACCAGGG CCAGGAGCAG ACTGTCCCAT 720

GTACTGCTGG TATCTGAGTC AGAAGTAGCC AAAACAAAGC CACGTCACGC CATGAAACGG 780

AAGCGGACAG CAGATAAATC CACTAGTACA AGTGATCCTG TGATCGAGGA TGACCATGTG 840

CAGGTTCTTG TATTAAAATC CAAGAATCTT GTTGGAGTCA CTATGACCAA TTGTGGAATC 900

ACAGATCTAG TGCTAAAAGA CTGTCCAAAG ATGATGTTCA TCCATGCTAC CAGGTGCAGG 960

GTACTAAAAC ATTTAAAGGT AGAAAATGCA CCAATTGTAA ACCGATTTGA CTATGCACAG 1020

TGCAAGAAAC TGAACATGGA TCAGGTACTA GACCAGATAC TAAGAATGCC ACCCGAGAGA 1080

AACCGCATCA TATACCTACG CCCAATGCAG CAGGTGGACA CTCTAACTTT GGAGCAGAAG 1140

CTATTTAGTG GTCCCTACCC CTATCACATC TGTATTATCC ATGAATTCAG TAACCCTCCC 1200

AATGTCCGGA ATAAGGTGCG CATTCGCAGC TGGATGGACA CTATAGCAAA CATCAATCAA 1260

GAGCTCATTA AATATGAATT CTTCCCTGAA GCCACTCGAA GTGAAGAAGA CTTAAAGAAA 1320

TACCCCAAGT ACCCCTGGGG GAGAGAAATC TATACTTTAG AAGGTGTTGT GGATGGAGCT 1380

CCATATTCCA TGATTTCTGA CTTCCCTTGG CTGAGGTCAT TACGAGCTGC AGAGCCCAAC 1440

AGCTTCGCTC GATACGACTT TGAAGACGAT GAAGAAAGCA CTATCTATGC TCCTAGAAGG 1500

AAAGGACAGC TGTCTGCAGA CATCTGTATG GAAACAATAG GAGAGGAAAT TTCAGAGATG 1560

CGTCAGATGA AGAAGGGTGT ATTTCAGCGA GTAGTGGCAA TTTTTATCCA CTATTGTGAT 1620

GTCAATGGAG AGCCAGTTGA AGATGACTAC ATTTAATTGG TCCCTCCTCC TTTCCAGCTA 1680

TTTTGTCAGA AAGCAAGTAG GGCCATCCAG CTGCCAGAGT GCTCCACAGG GACTTGAGGC 1740

ATGCAGTTGG GAGGTCCTGG CTCGGTTTGC TATATAGGGA ATATATAAGG AACATCGAAA 1800

TTGTATACAA AGATTTGTAC ATAAAAAATA TACAAAGACG CTTCCTAAAG TACCAACTTT 1860

ATATCATATG TTTATACAAT TTAATTTAAA AATTCATTTT AAGGAAGACA GATAATTTGA 1920

AAGACTTTTG TTTTTCTTGA CTTAATTCAT GAAGTATCAT TTTTTGACTG AGTCTCCATT 1980

TACTTCATTC TTAATGATTA TTGTCATCCC TTTAAATCTG TGCCTTTTTC TTCTTGAGCG 2040

AAGCTGTTTG AGTAAACCTG TTGAAGAGTG TTTGTGTCTT GTGTGCTTTT TTGTTGTTAT 2100

TAAAACACCA ACTAAACCTT ATAGTCAAGA CAAGGCTCTA TGTTTCTGTA CAAAGCTGTA 2160

GTTCTTTCTT AGTATTATAG TTGCCATGTT TCTTAAAATC AAGTAAAAAG ACTTATGAGC 2220

TTAAAAAAAA GTGAGTTTGA GAGGGAAATG GAAAAGTTTC CAGAGTATTT CTAGTAATTA 2280

TTTCCACATT GAATTGTGTA TATGCTTTAT CTTGAATATA AAATAAAAGT TTATTAAAAA 2340

CTTTAAAAAA AAAAAAAAAA 2360

B：氨基酸序列(SEQ ID NO：2)长度：444

1 MCPGSVPAPP VGQRTLRPWR REMQRVLSAQ MLAVTGPRNS QRRTSRCSDE

51 ERPSTSRACV VNGPDGTRSA FSFRTLPQGG SSGPAHDERT NGSGSGATGE

101 DRRGSSQPES CDVQSNEDYP RRPLTRARSR LSHVLLVSES EVAKTKPRHA

151 MKRKRTADKS TSTSDPVIED DHVQVLVLKS KNLVGVTMTN CGITDLVLKD

201 CPKMMFIHAT RCRVLKHLKV ENAPIVNRFD YAQCKKLNMD QVLDQILRMP

251 PERNRIIYLR PMQQVDTLTL EQKLFSGPYP YHICIIHEFS NPPNVRNKVR

301 IRSWMDTIAN INQELIKYEF FPEATRSEED LKKYPKYPWG REIYTLEGVV

351 DGAPYSMISD FPWLRSLRAA EPNSFARYDF EDDEESTIYA PRRKGQLSAD

401 ICMETIGEEI SEMRQMKKGV FQRVVAIFIH YCDVNGEPVE DDYI

克隆号：SP329(SEQ ID NO：3)

起始编码子：322 ATG 终止编码子：1656 TAA 蛋白质分子量：50647.03

1 TGT CAG TAA GTG GAA AAG GCA AGA CTC CAC TTC GAA AGA GGT ACA ACT 48

49 CCC ATC AGA TGG GCC AGT CGA AGC AGT TTC CCC TCG AGG AAA GCA GCT 96

97 GTG AGA AAG GCT GTC AGG TCA CCA GTG AGC AGA TCA AAG CCG ATA TGA 144

145 AAG CAG CTA GGG ATA TTC CTG AAA AGA AAA AAA ACA AGG ATG TTT ATC 192

193 CCA GCT GCA GCA GCA CCA CCG CCA GCA CAG TGG GAA ACT CCA GCT CAC 240

241 ACA ACA CTG CTT CTC AAA GCC CCG ACT TTG TAA GGA CGG TGA ACA GCG 288

289 GCG GCT CTT CCG AGC CTA GCC CTA CAG AAG TGG ATG TGT CCA GGC AGT 336

1 Met Cys Pro Gly Ser 5

337 GTG CCT GCT CCC CCG GTG GGT CAG AGG ACT CTG AGG CCA TGG AGG AGG 384

6 Val Pro Ala Pro Pro Val Gly Gln Arg Thr Leu Arg Pro Trp Arg Arg 21

385 GAG ATG CAG AGA GTT CTG TCT GCC CAG ATG CTT GCT GTC ACA GGC CCC 432

22 Glu Met Gln Arg Val Leu Ser Ala Gln Met Leu Ala Val Thr Gly Pro 37

433 AGG AAT TCC CAA AGG AGA ACT AGC AGG TGT TCT GAT GAG GAA CGT CCT 480

38 Arg Asn Ser Gln Arg Arg Thr Ser Arg Cys Ser Asp Glu Glu Arg Pro 53

481 TCA ACC AGC CGA GCC TGT GTT GTG AAT GGC CCG GAT GGT ACG AGA TCC 528

54 Ser Thr Ser Arg Ala Cys Val Val Asn Gly Pro Asp Gly Thr Arg Ser 69

529 GCC TTT TCC TTT AGG ACT CTG CCA CAA GGG GGG TCT TCA GGC CCA GCA 576

70 Ala Phe Ser Phe Arg Thr Leu Pro Gln Gly Gly Ser Ser Gly Pro Ala 85

577 CAT GAT GAG AGG ACT AAT GGG AGT GGC TCT GGG GCT ACA GGT GAG GAC 624

86 His Asp Glu Arg Thr Asn Gly Ser Gly Ser Gly Ala Thr Gly Glu Asp 101

625 AGG AGG GGG AGC TCC CAG CCT GAG AGT TGT GAC GTG CAG TCT AAT GAA 672

102 Arg Arg Gly Ser Ser Gln Pro Glu Ser Cys Asp Val Gln Ser Asn Glu 117

673 GAC TAC CCT CGG AGG CCC CTA ACC AGG GCC AGG AGC AGA CTG TCC CAT 720

118 Asp Tyr Pro Arg Arg Pro Leu Thr Arg Ala Arg Ser Arg Leu Ser His 133

721 GTA CTG CTG GTA TCT GAG TCA GAA GTA GCC AAA ACA AAG CCA CGT CAC 768

134 Val Leu Leu Val Ser Glu Ser Glu Val Ala Lys Thr Lys Pro Arg His 149

769 GCC ATG AAA CGG AAG CGG ACA GCA GAT AAA TCC ACT AGT ACA AGT GAT 816

150 Ala Met Lys Arg Lys Arg Thr Ala Asp Lys Ser Thr Ser Thr Ser Asp 165

817 CCT GTG ATC GAG GAT GAC CAT GTG CAG GTT CTT GTA TTA AAA TCC AAG 864

166 Pro Val Ile Glu Asp Asp His Val Gln Val Leu Val Leu Lys Ser Lys 181

865 AAT CTT GTT GGA GTC ACT ATG ACC AAT TGT GGA ATC ACA GAT CTA GTG 912

182 Asn Leu Val Gly Val Thr Met Thr Asn Cys Gly Ile Thr Asp Leu Val 197

913 CTA AAA GAC TGT CCA AAG ATG ATG TTC ATC CAT GCT ACC AGG TGC AGG 960

198 Leu Lys Asp Cys Pro Lys Met Met Phe Ile His Ala Thr Arg Cys Arg 213

961 GTA CTA AAA CAT TTA AAG GTA GAA AAT GCA CCA ATT GTA AAC CGA TTT 1008

214 Val Leu Lys His Leu Lys Val Glu Asn Ala Pro Ile Val Asn Arg Phe 229

1009 GAC TAT GCA CAG TGC AAG AAA CTG AAC ATG GAT CAG GTA CTA GAC CAG 1056

230 Asp Tyr Ala Gln Cys Lys Lys Leu Asn Met Asp Gln Val Leu Asp Gln 245

1057 ATA CTA AGA ATG CCA CCC GAG AGA AAC CGC ATC ATA TAC CTA CGC CCA 1104

246 Ile Leu Arg Met Pro Pro Glu Arg Asn Arg Ile Ile Tyr Leu Arg Pro 261

1105 ATG CAG CAG GTG GAC ACT CTA ACT TTG GAG CAG AAG CTA TTT AGT GGT 1152

262 Met Gln Gln Val Asp Thr Leu Thr Leu Glu Gln Lys Leu Phe Ser Gly 277

1153 CCC TAC CCC TAT CAC ATC TGT ATT ATC CAT GAA TTC AGT AAC CCT CCC 1200

278 Pro Tyr Pro Tyr His Ile Cys Ile Ile His Glu Phe Ser Asn Pro Pro 293

1201 AAT GTC CGG AAT AAG GTG CGC ATT CGC AGC TGG ATG GAC ACT ATA GCA 1248

294 Asn Val Arg Asn Lys Val Arg Ile Arg Ser Trp Met Asp Thr Ile Ala 309

1249 AAC ATC AAT CAA GAG CTC ATT AAA TAT GAA TTC TTC CCT GAA GCC ACT 1296

310 Asn Ile Asn Gln Glu Leu Ile Lys Tyr Glu Phe Phe Pro Glu Ala Thr 325

1297 CGA AGT GAA GAA GAC TTA AAG AAA TAC CCC AAG TAC CCC TGG GGG AGA 1344

326 Arg Ser Glu Glu Asp Leu Lys Lys Tyr Pro Lys Tyr Pro Trp Gly Arg 341

1345 GAA ATC TAT ACT TTA GAA GGT GTT GTG GAT GGA GCT CCA TAT TCC ATG 1392

342 Glu Ile Tyr Thr Leu Glu Gly Val Val Asp Gly Ala Pro Tyr Ser Met 357

1393 ATT TCT GAC TTC CCT TGG CTG AGG TCA TTA CGA GCT GCA GAG CCC AAC 1440

358 Ile Ser Asp Phe Pro Trp Leu Arg Ser Leu Arg Ala Ala Glu Pro Asn 373

1441 AGC TTC GCT CGA TAC GAC TTT GAA GAC GAT GAA GAA AGC ACT ATC TAT 1488

374 Ser Phe Ala Arg Tyr Asp Phe Glu Asp Asp Glu Glu Ser Thr Ile Tyr 389

1489 GCT CCT AGA AGG AAA GGA CAG CTG TCT GCA GAC ATC TGT ATG GAA ACA 1536

390 Ala Pro Arg Arg Lys Gly Gln Leu Ser Ala Asp Ile Cys Met Glu Thr 405

1537 ATA GGA GAG GAA ATT TCA GAG ATG CGT CAG ATG AAG AAG GGT GTA TTT 1584

406 Ile Gly Glu Glu Ile Ser Glu Met Arg Gln Met Lys Lys Gly Val Phe 421

1585 CAG CGA GTA GTG GCA ATT TTT ATC CAC TAT TGT GAT GTC AAT GGA GAG 1632

422 Gln Arg Val Val Ala Ile Phe Ile His Tyr Cys Asp Val Asn Gly Glu 437

1633 CCA GTT GAA GAT GAC TAC ATT TAA TTG GTC CCT CCT CCT TTC CAG CTA 1680

438 Pro Val Glu Asp Asp Tyr Ile *** 445

1681 TTT TGT CAG AAA GCA AGT AGG GCC ATC CAG CTG CCA GAG TGC TCC ACA 1728

1729 GGG ACT TGA GGC ATG CAG TTG GGA GGT CCT GGC TCG GTT TGC TAT ATA 1776

1777 GGG AAT ATA TAA GGA ACA TCG AAA TTG TAT ACA AAG ATT TGT ACA TAA 1824

1825 AAA ATA TAC AAA GAC GCT TCC TAA AGT ACC AAC TTT ATA TCA TAT GTT 1872

1873 TAT ACA ATT TAA TTT AAA AAT TCA TTT TAA GGA AGA CAG ATA ATT TGA 1920

1921 AAG ACT TTT GTT TTT CTT GAC TTA ATT CAT GAA GTA TCA TTT TTT GAC 1968

1969 TGA GTC TCC ATT TAC TTC ATT CTT AAT GAT TAT TGT CAT CCC TTT AAA 2016

2017 TCT GTG CCT TTT TCT TCT TGA GCG AAG CTG TTT GAG TAA ACC TGT TGA 2064

2065 AGA GTG TTT GTG TCT TGT GTG CTT TTT TGT TGT TAT TAA AAC ACC AAC 2112

2113 TAA ACC TTA TAG TCA AGA CAA GGC TCT ATG TTT CTG TAC AAA GCT GTA 2160

2161 GTT CTT TCT TAG TAT TAT AGT TGC CAT GTT TCT TAA AAT CAA GTA AAA 2208

2209 AGA CTT ATG AGC TTA AAA AAA AGT GAG TTT GAG AGG GAA ATG GAA AAG 2256

2257 TTT CCA GAG TAT TTC TAG TAA TTA TTT CCA CAT TGA ATT GTG TAT ATG 2304

2305 CTT TAT CTT GAA TAT AAA ATA AAA GTT TAT TAA AAA CTT TAA AAA AAA 2352

2353 AAA AAA AA 2360

2. PP203

A：核苷酸序列(SEQ ID NO：4)长度：2379

GGTGCACACC CGGAAGTGGG TGCGGGCCAG CCGGCTCGCC CGGGGGCCAT GGCAGCAGCG 60

GCTACTGCAG CCGAGGGGGT CCCCAGTCGG GGGCCTCCCG GGGAAGTCAT TCATCTGAAT 120

GTGGGAGGCA AGAGATTCAG TACCTCTCGC CAGACTCTCA CCTGGATCCC AGACTCCTTC 180

TTCTCCAGTC TTCTGAGCGG ACGCATCTCG ACGCTGAAAG ATGAGACCGG AGCAATCTTC 240

ATCGACAGGG ACCCTACAGT CTTCGCCCCC ATCCTCAACT TCCTGCGCAC CAAAGAGTTG 300

GATCCCAGGG GTGTCCACGG TTCCAGCCTC CTCCATGAAG CCCAGTTCTA TGGGCTCACT 360

CCTCTGGTTC GTCGCCTGCA GCTTCGAGAG GAGTTGGATC GATCTTCTTG TGGAAACGTC 420

CTCTTCAATG GTTACCTGCC GCCACCAGTG TTCCCAGTGA AGCGGCGGAA CCGGCACAGC 480

CTAGTGGGGC CTCAGCAGCT AGGAGGACGG CCAGCCCCTG TCCGACGGAG CAACACGATG 540

CCCCCCAACC TTGGCAATGC AGGGCTGCTG GGCCGAATGC TGGATGAGAA AACCCCTCCC 600

TCACCCTCAG GACAACCTGA GGAGCCGGGG ATGGTGCGCC TGGTGTGTGG ACACCATAAT 660

TGGATCGCTG TGGCCTATAC CCAGTTTCTA GTCTGCTACA GGTTGAAGGA AGCCTCTGGC 720

TGGCAGCTGG TGTTTTCCAG CCCCCGCCTG GACTGGCCCA TCGAACGACT GGCGCTCACA 780

GCCCGGGTGC ATGGTGGGGC TTTGGGTGAA CATGACAAGA TGGTGGCAGC AGCCACCGGC 840

AGCGAGATCC TGCTATGGGC TCTGCAGGCG GAAGGCGGTG GCTCCGAGAT AGGGGTCTTT 900

CATCTGGGGG TGCCTGTGGA GGCCTTGTTC TTCGTCGGGA ACCAGCTCAT TGCTACAAGC 960

CACACAGGGC GCATCGGGGT GTGGAATGCC GTCACCAAGC ACTGGCAGGT CCAGGAGGTG 1020

CAGCCCATCA CCAGTTATGA CGCGGCAGGC TCCTTCCTCC TCCTGGGCTG CAACAACGGC 1080

TCCATTTACT ACGTGGATGT GCAGAAGTTC CCCTTGCGCA TGAAAGACAA CGACCTCCTT 1140

GTCAGCGAGC TCTATCGGGA CCCAGCGGAG GATGGGGTCA CCGCCCTCAG TGTCTACCTC 1200

ACCCCCAAGA CCAGTGACAG TGGGAACTGG ATCGAGATCG CCTATGGCAC CAGCTCAGGG 1260

GGCGTGCGGG TCATCGTGCA GCACCCGGAG ACTGTGGGCT CGGGGCCTCA GCTCTTCCAG 1320

ACCTTCACTG TGCACCGCAG CCCTGTCACC AAGATCATGC TGTCGGAGAA GCACCTCATC 1380

TCAGTCTGTG CCGACAACAA CCACGTGCGG ACATGGTCTG TGACTCGCTT CCGCGGCATG 1440

ATTTCCACCC AGCCCGGCTC CACCCCACTC GCTTCCTTTA AGATCCTGGC TCTGGAGTCG 1500

GCAGATGGGC ATGGCGGCTG CAGTGCTGGC AATGACATTG GCCCCTACGG TGAGCGGGAC 1560

GACCAGCAAG TGTTCATCCA GAAGGTGGTG CCCAGTGCCA GCCAGCTCTT CGTGCGTCTC 1620

TCATCTACTG GGCAGCGGGT GTGCTCCGTG CGCTCCGTGG ACGGCTCACC CACGACGGCC 1680

TTCACAGTGC TGGAGTGCGA GGGCTCCCGG CGGCTCGGCT CTCGGCCCCG GCGCTACCTG 1740

CTCACTGGCC AGGCCAACGG CAGCTTGGCC ATGTGGGACC TAACCACCGC CATGGACGGC 1800

CTCGGCCAGG CCCCTGCAGG TGGCCTGACG GAGCAAGAGC TGATGGAACA GCTGGAACAC 1860

TGTGAGCTGG CCCCGCCGGC TCCTTCAGCT CCCTCATGGG GCTGTCTCCC CAGCCCCTCA 1920

CCCCGCATCT CCCTCACCAG CCTCCACTCA GCCTCCAGCA ACACCTCCTT GTCTGGCCAC 1980

CGTGGGAGCC CAAGCCCCCC GCAGGCTGAG GCCCGGCGCC GTGGTGGGGG CAGCTTTGTG 2040

GAACGCTGCC AGGAACTGGT GCGGAGTGGG CCAGACCTCC GACGGCCACC CACACCAGCC 2100

CCGTGGCCCT CCAGCGGTCT CGGCACTCCC CTCACACCTC CCAAGATGAA GCTCAATGAA 2160

ACTTCCTTTT GAACAACGCA GCTGCCATGA TGCCTTGGGA TGCCCTGGTC CTGGGGGACT 2220

CAGGTGCCTC CCTGATTCCT GTGGGAACCC CGGGTTCAGG GCCAGGGCCT CCTTGGAATA 2280

AATGGTTATT GTTACTAGGT CCCCACCTTC CCTCTTTTCT GGAAGCCAAA GTCAGCCTCC 2340

CCAATAAAGT CCTCACTGCC AAAAAAAAAA AAAAAAAAA 2379

B：氨基酸序列(SEQ ID NO：5)长度：707

1 MAAAATAAEG VPSRGPPGEV IHLNVGGKRF STSRQTLTWI PDSFFSSLLS

51 GRISTLKDET GAIFIDRDPT VFAPILNFLR TKELDPRGVH GSSLLHEAQF

101 YGLTPLVRRL QLREELDRSS CGNVLFNGYL PPPVFPVKRR NRHSLVGPQQ

151 LGGRPAPVRR SNTMPPNLGN AGLLGRMLDE KTPPSPSGQP EEPGMVRLVC

201 GHHNWIAVAY TQFLVCYRLK EASGWQLVFS SPRLDWPIER LALTARVHGG

251 ALGEHDKMVA AATGSEILLW ALQAEGGGSE IGVFHLGVPV EALFFVGNQL

301 IATSHTGRIG VWNAVTKHWQ VQEVQPITSY DAAGSFLLLG CNNGSIYYVD

351 VQKFPLRMKD NDLLVSELYR DPAEDGVTAL SVYLTPKTSD SGNWIEIAYG

401 TSSGGVRVIV QHPETVGSGP QLFQTFTVHR SPVTKIMLSE KHLISVCADN

451 NHVRTWSVTR FRGMISTQPG STPLASFKIL ALESADGHGG CSAGNDIGPY

501 GERDDQQVFI QKVVPSASQL FVRLSSTGQR VCSVRSVDGS PTTAFTVLEC

551 EGSRRLGSRP RRYLLTGQAN GSLAMWDLTT AMDGLGQAPA GGLTEQELME

601 QLEHCELAPP APSAPSWGCL PSPSPRISLT SLHSASSNTS LSGHRGSPSP

651 PQAEARRRGG GSFVERCQEL VRSGPDLRRP PTPAPWPSSG LGTPLTPPKM

701 KLNETSF

克隆号：PP203(SEQ ID NO：6)

起始编码子：49 ATG 终止编码子：2172 TGA 蛋白质分子量：76339.52

1 GGT GCA CAC CCG GAA GTG GGT GCG GGC CAG CCG GCT CGC CCG GGG GCC 48

49 ATG GCA GCA GCG GCT ACT GCA GCC GAG GGG GTC CCC AGT CGG GGG CCT 96

1 Met Ala Ala Ala Ala Thr Ala Ala Glu Gly Val Pro Ser Arg Gly Pro 16

97 CCC GGG GAA GTC ATT CAT CTG AAT GTG GGA GGC AAG AGA TTC AGT ACC 144

17 Pro Gly Glu Val Ile His Leu Asn Val Gly GLy Lys Arg Phe Ser Thr 32

145 TCT CGC CAG ACT CTC ACC TGG ATC CCA GAC TCC TTC TTC TCC AGT CTT 192

33 Ser Arg Gln Thr Leu Thr Trp Ile Pro Asp Ser Phe Phe Ser Ser Leu 48

193 CTG AGC GGA CGC ATC TCG ACG CTG AAA GAT GAG ACC GGA GCA ATC TTC 240

49 Leu Ser Gly Arg Ile Ser Thr Leu Lys Asp Glu Thr Gly Ala Ile Phe 64

241 ATC GAC AGG GAC CCT ACA GTC TTC GCC CCC ATC CTC AAC TTC CTG CGC 288

65 Ile Asp Arg Asp Pro Thr Val Phe Ala Pro Ile Leu Asn Phe Leu Arg 80

289 ACC AAA GAG TTG GAT CCC AGG GGT GTC CAC GGT TCC AGC CTC CTC CAT 336

81 Thr Lys Glu Leu Asp Pro Arg Gly Val His Gly Ser Ser Leu Leu His 96

337 GAA GCC CAG TTC TAT GGG CTC ACT CCT CTG GTT CGT CGC CTG CAG CTT 384

97 Glu Ala Gln Phe Tyr Gly Leu Thr Pro Leu Val Arg Arg Leu Gln Leu 112

385 CGA GAG GAG TTG GAT CGA TCT TCT TGT GGA AAC GTC CTC TTC AAT GGT 432

113 Arg Glu Glu Leu Asp Arg Ser Ser Cys Gly Asn Val Leu Phe Asn Gly 128

433 TAC CTG CCG CCA CCA GTG TTC CCA GTG AAG CGG CGG AAC CGG CAC AGC 480

129 Tyr Leu Pro Pro Pro Val Phe Pro Val Lys Arg Arg Asn Arg His Ser 144

481 CTA GTG GGG CCT CAG CAG CTA GGA GGA CGG CCA GCC CCT GTC CGA CGG 528

145 Leu Val Gly Pro Gln Gln Leu Gly Gly Arg Pro Ala Pro Val Arg Arg 160

529 AGC AAC ACG ATG CCC CCC AAC CTT GGC AAT GCA GGG CTG CTG GGC CGA 576

161 Ser Asn Thr Met Pro Pro Asn Leu Gly Asn Ala Gly Leu Leu Gly Arg 176

577 ATG CTG GAT GAG AAA ACC CCT CCC TCA CCC TCA GGA CAA CCT GAG GAG 624

177 Met Leu Asp Glu Lys Thr Pro Pro Ser Pro Ser Gly Gln Pro Glu Glu 192

625 CCG GGG ATG GTG CGC CTG GTG TGT GGA CAC CAT AAT TGG ATC GCT GTG 672

193 Pro Gly Met Val Arg Leu Val Cys Gly His His Asn Trp Ile Al8 Val 208

673 GCC TAT ACC CAG TTT CTA GTC TGC TAC AGG TTG AAG GAA GCC TCT GGC 720

209 Ala Tyr Thr Gln Phe Leu Val Cys Tyr Arg Leu Lys Glu Ala Ser Gly 224

721 TGG CAG CTG GTG TTT TCC AGC CCC CGC CTG GAC TGG CCC ATC GAA CGA 768

225 Trp Gln Leu Val Phe Ser Ser Pro Arg Leu Asp Trp Pro Ile Glu Arg 240

769 CTG GCG CTC ACA GCC CGG GTG CAT GGT GGG GCT TTG GGT GAA CAT GAC 816

241 Leu Ala Leu Thr Ala Arg Val His Gly Gly Ala Leu Gly Glu His Asp 256

817 AAG ATG GTG GCA GCA GCC ACC GGC AGC GAG ATC CTG CTA TGG GCT CTG 864

257 Lys Met Val Ala Ala Ala Thr Gly Ser Glu Ile Leu Leu Trp Ala Leu 272

865 CAG GCG GAA GGC GGT GGC TCC GAG ATA GGG GTC TTT CAT CTG GGG GTG 912

273 Gln Ala Glu Gly Gly Gly Ser Glu Ile Gly Val Phe His Leu Gly Val 288

913 CCT GTG GAG GCC TTG TTC TTC GTC GGG AAC CAG CTC ATT GCT ACA AGC 960

289 Pro Val Glu Ala Leu Phe Phe Val Gly Asn Gln Leu Ile Ala Thr Ser 304

961 CAC ACA GGG CGC ATC GGG GTG TGG AAT GCC GTC ACC AAG CAC TGG CAG 1008

305 His Thr Gly Arg Ile Gly Val Trp Asn Ala Val Thr Lys His Trp Gln 320

1009 GTC CAG GAG GTG CAG CCC ATC ACC AGT TAT GAC GCG GCA GGC TCC TTC 1056

321 Val Gln Glu Val Gln Pro Ile Thr Ser Tyr Asp Ala Ala Gly Ser Phe 336

1057 CTC CTC CTG GGC TGC AAC AAC GGC TCC ATT TAC TAC GTG GAT GTG CAG 1104

337 Leu Leu Leu Gly Cys Asn Asn Gly Ser Ile Tyr Tyr Val Asp Val Gln 352

1105 AAG TTC CCC TTG CGC ATG AAA GAC AAC GAC CTC CTT GTC AGC GAG CTC 1152

353 Lys Phe Pro Leu Arg Met Lys Asp Asn Asp Leu Leu Val Ser Glu Leu 368

1153 TAT CGG GAC CCA GCG GAG GAT GGG GTC ACC GCC CTC AGT GTC TAC CTC 1200

369 Tyr Arg Asp Pro Ala Glu Asp Gly Val Thr Ala Leu Ser Val Tyr Leu 384

1201 ACC CCC AAG ACC AGT GAC AGT GGG AAC TGG ATC GAG ATC GCC TAT GGC 1248

385 Thr Pro Lys Thr Ser Asp Ser Gly Asn Trp Ile Glu Ile Ala Tyr Gly 400

1249 ACC AGC TCA GGG GGC GTG CGG GTC ATC GTG CAG CAC CCG GAG ACT GTG 1296

401 Thr Ser Ser Gly Gly Val Arg Val Ile Val Gln His Pro Glu Thr Val 416

1297 GGC TCG GGG CCT CAG CTC TTC CAG ACC TTC ACT GTG CAC CGC AGC CCT 1344

417 Gly Ser Gly Pro Gln Leu Phe Gln Thr Phe Thr Val His Arg Ser Pro 432

1345 GTC ACC AAG ATC ATG CTG TCG GAG AAG CAC CTC ATC TCA GTC TGT GCC 1392

433 Val Thr Lys Ile Met Leu Ser Glu Lys His Leu Ile Ser Val Cys Ala 448

1393 GAC AAC AAC CAC GTG CGG ACA TGG TCT GTG ACT CGC TTC CGC GGC ATG 1440

449 Asp Asn Asn His Val Arg Thr Trp Ser Val Thr Arg Phe Arg Gly Met 464

1441 ATT TCC ACC CAG CCC GGC TCC ACC CCA CTC GCT TCC TTT AAG ATC CTG 1488

465 Ile Ser Thr Gln Pro Gly Ser Thr Pro Leu Ala Ser Phe Lys Ile Leu 480

1489 GCT CTG GAG TCG GCA GAT GGG CAT GGC GGC TGC AGT GCT GGC AAT GAC 1536

481 Ala Leu Glu Ser Ala Asp Gly His Gly Gly Cys Ser Ala Gly Asn Asp 496

1537 ATT GGC CCC TAC GGT GAG CGG GAC GAC CAG CAA GTG TTC ATC CAG AAG 1584

497 Ile Gly Pro Tyr Gly Glu Arg Asp Asp Gln Gln Val Phe Ile Gln Lys 512

1585 GTG GTG CCC AGT GCC AGC CAG CTC TTC GTG CGT CTC TCA TCT ACT GGG 1632

513 Val Val Pro Ser Ala Ser Gln Leu Phe Val Arg Leu Ser Ser Thr Gly 528

1633 CAG CGG GTG TGC TCC GTG CGC TCC GTG GAC GGC TCA CCC ACG ACG GCC 1680

529 Gln Arg Val Cys Ser Val Arg Ser Val Asp Gly Ser Pro Thr Thr Ala 544

1681 TTC ACA GTG CTG GAG TGC GAG GGC TCC CGG CGG CTC GGC TCT CGG CCC 1728

545 Phe Thr Val Leu Glu Cys Glu Gly Ser Arg Arg Leu Gly Ser Arg Pro 560

1729 CGG CGC TAC CTG CTC ACT GGC CAG GCC AAC GGC AGC TTG GCC ATG TGG 1776

561 Arg Arg Tyr Leu Leu Thr Gly Gln Ala Asn Gly Ser Leu Ala Met Trp 576

1777 GAC CTA ACC ACC GCC ATG GAC GGC CTC GGC CAG GCC CCT GCA GGT GGC 1824

577 Asp Leu Thr Thr Ala Met Asp Gly Leu Gly Gln Ala Pro Ala Gly Gly 592

1825 CTG ACG GAG CAA GAG CTG ATG GAA CAG CTG GAA CAC TGT GAG CTG GCC 1872

593 Leu Thr Glu Gln Glu Leu Met Glu Gln Leu Glu His Cys Glu Leu Ala 608

1873 CCG CCG GCT CCT TCA GCT CCC TCA TGG GGC TGT CTC CCC AGC CCC TCA 1920

609 Pro Pro Ala Pro Ser Ala Pro Ser Trp Gly Cys Leu Pro Ser Pro Ser 624

1921 CCC CGC ATC TCC CTC ACC AGC CTC CAC TCA GCC TCC AGC AAC ACC TCC 1968

625 Pro Arg Ile Ser Leu Thr Ser Leu His Ser Ala Ser Ser Asn Thr Ser 640

1969 TTG TCT GGC CAC CGT GGG AGC CCA AGC CCC CCG CAG GCT GAG GCC CGG 2016

641 Leu Ser Gly His Arg Gly Ser Pro Ser Pro Pro Gln Ala Glu Ala Arg 656

2017 CGC CGT GGT GGG GGC AGC TTT GTG GAA CGC TGC CAG GAA CTG GTG CGG 2064

657 Arg Arg Gly Gly Gly Ser Phe Val Glu Arg Cys Gln Glu Leu Val Arg 672

2065 AGT GGG CCA GAC CTC CGA CGG CCA CCC ACA CCA GCC CCG TGG CCC TCC 2112

673 Ser Gly Pro Asp Leu Arg Arg Pro Pro Thr Pro Ala Pro Trp Pro Ser 688

2113 AGC GGT CTC GGC ACT CCC CTC ACA CCT CCC AAG ATG AAG CTC AAT GAA 2160

689 Ser Gly Leu Gly Thr Pro Leu Thr Pro Pro Lys Met Lys Leu Asn Glu 704

2161 ACT TCC TTT TGA ACA ACG CAG CTG CCA TGA TGC CTT GGG ATG CCC TGG 2208

705 Thr Ser Phe *** 708

2209 TCC TGG GGG ACT CAG GTG CCT CCC TGA TTC CTG TGG GAA CCC CGG GTT 2256

2257 CAG GGC CAG GGC CTC CTT GGA ATA AAT GGT TAT TGT TAC TAG GTC CCC 2304

2305 ACC TTC CCT CTT TTC TGG AAG CCA AAG TCA GCC TCC CCA ATA AAG TCC 2352

2353 TCA CTG CCA AAA AAA AAA AAA AAA AAA 2379

3. PP238

A：核苷酸序列(SEQ ID NO：7)长度：2023

GGGCTAGGGC CGGGGCCTGG CTGCGCGGCT GGGCCAAGGC CCGCGATGGT GATCTGCTGT 60

GCGGCCGTGA ACTGCTCCAA CCGGCAGGGA AAGGGCGAGA AGCGCGCCGT CTCCTTCCAC 120

AGGTTCCCCC TAAAGGACTC AAAACGTCTA ATCCAATGGT TAAAAGCTGT TCAGAGGGAT 180

AACTGGACTC CCACTAAGTA TTCATTTCTC TGTAGTGAGC ATTTCACCAA AGACAGCTTC 240

TCCAAGAGGC TGGAGGACCA GCATCGCCTG CTGAAGCCCA CGGCCGTGCC ATCCATCTTC 300

CACCTGACCG AGAAGAAGAG GGGGGCTGGA GGCCATGGCC GCACCCGGAG AAAAGATGCC 360

AGCAAGGCCA CAGGGGGTGT GAGGGGACAC TCGAGTGCCG CCACCGGCAG AGGAGCTGCA 420

GGTTGGTCAC CGTCCTCGAG TGGAAACCCG ATGGCCAAGC CAGAGTCCCG CAGGTTGAAG 480

CAAGCTGCTC TGCAAGGTGA AGCCACACCC AGGGCGGCCC AGGAGGCCGC CAGCCAGGAG 540

CAGGCCCAGC AAGCTCTGGA ACGGACTCCA GGAGATGGAC TGGCCACCAT GGTGGCAGGC 600

AGTCAGGGAA AAGCAGAAGC GTCTGCCACA GATGCTGGCG ATGAGAGCGC CACTTCCTCC 660

ATCGAAGGGG GCGTGACAGA TAAGAGTGGC ATTTCTATGG ATGACTTTAC GCCCCCAGGA 720

TCTGGGGCGT GCAAATTTAT CGGCTCACTT CATTCGTACA GTTTCTCCTC TAAGCACACC 780

CGAGAAAGGC CATCTGTCCC CCGAGAGCCC ATTGACCGCA AGAGGCTGAA GAAAGATGTG 840

GAACCAAGCT GCAGTGGGAG CAGCCTGGGA CCCGACAAGG GCCTGGCCCA GAGCCCTCCC 900

AGCTCATCAC TTACCGCGAC ACCGCAGAAG CCTTCCCAGA GCCCCTCTGC CCCTCCTGCC 960

GACGTCACCC CAAAGCCAGC CACGGAAGCC GTGCAGAGCG AGCACAGCGA CGCCAGCCCC 1020

ATGTCCATCA ACGAGGTCAT CCTGTCGGCG TCAGGGGCCT GCAAGCTCAT CGACTCACTG 1080

CACTCCTACT GCTTCTCCTC CCGGCAGAAC AAGAGCCAGG TGTGCTGCCT GCGGGAGCAG 1140

GTGGAGAAGA AGAACGGCGA GCTGAAGAGC CTGCGGCAGA GGGTCAGCCG CTCCGACAGC 1200

CAGGTGCGGA AGCTACAGGA GAAGCTGGAT GAGCTGAGGA GAGTGAGCGT CCCCTATCCA 1260

AGTAGCCTGC TGTCGCCCAG CCGCGAGCCC CCCAAGATGA ACCCAGTGGT GGAGCCACTG 1320

TCCTGGATGC TGGGCACCTG GCTGTCGGAC CCACCTGGAG CCGGGACCTA CCCCACACTG 1380

CAGCCCTTCC AGTACCTGGA GGAGGTTCAC ATCTCCCACG TGGGCCAGCC CATGCTGAAC 1440

TTCTCGTTCA ACTCCTTCCA CCCGGACACG CGCAAGCCGA TGCACAGAGA GTGTGGCTTC 1500

ATTCGCCTCA AGCCCGACAC CAACAAGGTG GCCTTTGTCA GCGCCCAGAA CACAGGCGTG 1560

GTGGAAGTGG AGGAGGGCGA GGTGAACGGG CAGGAGCTGT GCATCGCATC CCACTCCATC 1620

GCCAGGATCT CCTTCGCCAA GGAGCCCCAC GTAGAGCAGA TCACCCGGAA GTTCAGGCTG 1680

AATTCTGAAG GCAAACTTGA GCAGACGGTC TCCATGGCAA CCACGACACA GCCAATGACT 1740

CAGCATCTTC ACGTCACCTA CAAGAAGGTG ACCCCGTAAA CCTAGAGCTT CTGGAGCCCT 1800

CGGGAGGGCC TGGCTACTGT GCCTCAACGG TTCGGCTCCT CAACAGACAG TCCCTGCGGC 1860

AAAAGTGGGT GTGGCCGTGA GCCTCTGCAG GCTCAAGAGT GTTGTCCAGA TGTTTCTGTA 1920

CTGGCATAGA AAAACCAAAT AAAAGGCCTT TATTTTTATG GCTGAGGATT TTGAATATTA 1980

AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAA 2023

B：氨基酸序列(SEQ ID NO：8)长度：577

1 MVICCAAVNC SNRQGKGEKR AVSFHRFPLK DSKRLIQWLK AVQRDNWTPT

51 KYSFLCSEHF TKDSFSKRLE DQHRLLKPTA VPSIFHLTEK KRGAGGHGRT

101 RRKDASKATG GVRGHSSAAT GRGAAGWSPS SSGNPMAKPE SRRLKQAALQ

151 GEATPRAAQE AASQEQAQQA LERTPGDGLA TMVAGSQGKA EASATDAGDE

201 SATSSIEGGV TDKSGISMDD FTPPGSGACK FIGSLHSYSF SSKHTRERPS

251 VPREPIDRKR LKKDVEPSCS GSSLGPDKGL AQSPPSSSLT ATPQKPSQSP

301 SAPPADVTPK PATEAVQSEH SDASPMSINE VILSASGACK LIDSLHSYCF

351 SSRQNKSQVC CLREQVEKKN GELKSLRQRV SRSDSQVRKL QEKLDELRRV

401 SVPYPSSLLS PSREPPKMNP VVEPLSWMLG TWLSDPPGAG TYPTLQPFQY

451 LEEVHISHVG QPMLNFSFNS FHPDTRKPMH RECGFIRLKP DTNKVAFVSA

501 QNTGVVEVEE GEVNGQELCI ASHSIARISF AKEPHVEQIT RKFRLNSEGK

551 LEQTVSMATT TQPMTQHLHV TYKKVTP

克隆号：PP238(SEQ ID NO：9)

起始编码子：46 ATG 终止编码子：1779 TAA蛋白质分子量：62856.51

1 GGG CTA GGG CCG GGG CCT GGC TGC GCG GCT GGG CCA AGG CCC GCG ATG 48

1 Met 1

49 GTG ATC TGC TGT GCG GCC GTG AAC TGC TCC AAC CGG CAG GGA AAG GGC 96

2 Val Ile Cys Cys Ala Ala Val Asn Cys Ser Asn Arg Gln Gly Lys Gly 17

97 GAG AAG CGC GCC GTC TCC TTC CAC AGG TTC CCC CTA AAG GAC TCA AAA 144

18 Glu Lys Arg Ala Val Ser Phe His Arg Phe Pro Leu Lys Asp Ser Lys 33

145 CGT CTA ATC CAA TGG TTA AAA GCT GTT CAG AGG GAT AAC TGG ACT CCC 192

34 Arg Leu Ile Gln Trp Leu Lys Ala Val Gln Arg Asp Asn Trp Thr Pro 49

193 ACT AAG TAT TCA TTT CTC TGT AGT GAG CAT TTC ACC AAA GAC AGC TTC 240

50 Thr Lys Tyr Ser Phe Leu Cys Ser Glu His Phe Thr Lys Asp Ser Phe 65

241 TCC AAG AGG CTG GAG GAC CAG CAT CGC CTG CTG AAG CCC ACG GCC GTG 288

66 Ser Lys Arg Leu Glu Asp Gln His Arg Leu Leu Lys Pro Thr Ala Val 81

289 CCA TCC ATC TTC CAC CTG ACC GAG AAG AAG AGG GGG GCT GGA GGC CAT 336

82 Pro Ser Ile Phe His Leu Thr Glu Lys Lys Arg Gly Ala Gly Gly His 97

337 GGC CGC ACC CGG AGA AAA GAT GCC AGC AAG GCC ACA GGG GGT GTG AGG 384

98 Gly Arg Thr Arg Arg Lys Asp Ala Ser Lys Ala Thr Gly Gly Val Arg 113

385 GGA CAC TCG AGT GCC GCC ACC GGC AGA GGA GCT GCA GGT TGG TCA CCG 432

114 Gly His Ser Ser Ala Ala Thr Gly Arg Gly Ala Ala Gly Trp Ser Pro 129

433 TCC TCG AGT GGA AAC CCG ATG GCC AAG CCA GAG TCC CGC AGG TTG AAG 480

130 Ser Ser Ser Gly Asn Pro Met Ala Lys Pro Glu Ser Arg Arg Leu Lys 145

481 CAA GCT GCT CTG CAA GGT GAA GCC ACA CCC AGG GCG GCC CAG GAG GCC 528

146 Gln Ala Ala Leu Gln Gly Glu Ala Thr Pro Arg Ala Ala Gln Glu Ala 161

529 GCC AGC CAG GAG CAG GCC CAG CAA GCT CTG GAA CGG ACT CCA GGA GAT 576

162 Ala Ser Gln Glu Gln Ala Gln Gln Ala Leu Glu Arg Thr Pro Gly Asp 177

577 GGA CTG GCC ACC ATG GTG GCA GGC AGT CAG GGA AAA GCA GAA GCG TCT 624

178 Gly Leu Ala Thr Met Val Ala Gly Ser Gln Gly Lys Ala Glu Ala Ser 193

625 GCC ACA GAT GCT GGC GAT GAG AGC GCC ACT TCC TCC ATC GAA GGG GGC 672

194 Ala Thr Asp Ala Gly Asp Glu Ser Ala Thr Ser Ser Ile Glu Gly Gly 209

673 GTG ACA GAT AAG AGT GGC ATT TCT ATG GAT GAC TTT ACG CCC CCA GGA 720

210 Val Thr Asp Lys Ser Gly Ile Ser Met Asp Asp Phe Thr Pro Pro Gly 225

721 TCT GGG GCG TGC AAA TTT ATC GGC TCA CTT CAT TCG TAC AGT TTC TCC 768

226 Ser Gly Ala Cys Lys Phe Ile Gly Ser Leu His Ser Tyr Ser Phe Ser 241

769 TCT AAG CAC ACC CGA GAA AGG CCA TCT GTC CCC CGA GAG CCC ATT GAC 816

242 Ser Lys His Thr Arg Glu Arg Pro Ser Val Pro Arg Glu Pro Ile Asp 257

817 CGC AAG AGG CTG AAG AAA GAT GTG GAA CCA AGC TGC AGT GGG AGC AGC 864

258 Arg Lys Arg Leu Lys Lys Asp Val Glu Pro Ser Cys Ser Gly Ser Ser 273

865 CTG GGA CCC GAC AAG GGC CTG GCC CAG AGC CCT CCC AGC TCA TCA CTT 912

274 Leu Gly Pro Asp Lys Gly Leu Ala Gln Ser Pro Pro Ser Ser Ser Leu 289

913 ACC GCG ACA CCG CAG AAG CCT TCC CAG AGC CCC TCT GCC CCT CCT GCC 960

290 Thr Ala Thr Pro Gln Lys Pro Ser Gln Ser Pro Ser Ala Pro Pro Ala 305

961 GAC GTC ACC CCA AAG CCA GCC ACG GAA GCC GTG CAG AGC GAG CAC AGC 1008

306 Asp Val Thr Pro Lys Pro Ala Thr Glu Ala Val Gln Ser Glu His Ser 321

1009 GAC GCC AGC CCC ATG TCC ATC AAC GAG GTC ATC CTG TCG GCG TCA GGG 1056

322 Asp Ala Ser Pro Met Ser Ile Asn Glu Val Ile Leu Ser Ala Ser Gly 337

1057 GCC TGC AAG CTC ATC GAC TCA CTG CAC TCC TAC TGC TTC TCC TCC CGG 1104

338 Ala Cys Lys Leu Ile Asp Ser Leu His Ser Tyr Cys Phe Ser Ser Arg 353

1105 CAG AAC AAG AGC CAG GTG TGC TGC CTG CGG GAG CAG GTG GAG AAG AAG 1152

354 Gln Asn Lys Ser Gln Val Cys Cys Leu Arg Glu Gln Val Glu Lys Lys 369

1153 AAC GGC GAG CTG AAG AGC CTG CGG CAG AGG GTC AGC CGC TCC GAC AGC 1200

370 Asn Gly Glu Leu Lys Ser Leu Arg Gln Arg Val Ser Arg Ser Asp Ser 385

1201 CAG GTG CGG AAG CTA CAG GAG AAG CTG GAT GAG CTG AGG AGA GTG AGC 1248

386 Gln Val Arg Lys Leu Gln Glu Lys Leu Asp Glu Leu Arg Arg Val Ser 401

1249 GTC CCC TAT CCA AGT AGC CTG CTG TCG CCC AGC CGC GAG CCC CCC AAG 1296

402 Val Pro Tyr Pro Ser Ser Leu Leu Ser Pro Ser Arg Glu Pro Pro Lys 417

1297 ATG AAC CCA GTG GTG GAG CCA CTG TCC TGG ATG CTG GGC ACC TGG CTG 1344

418 Met Asn Pro Val Val Glu Pro Leu Ser Trp Met Leu Gly Thr Trp Leu 433

1345 TCG GAC CCA CCT GGA GCC GGG ACC TAC CCC ACA CTG CAG CCC TTC CAG 1392

434 Ser Asp Pro Pro Gly Ala Gly Thr Tyr Pro Thr Leu Gln Pro Phe Gln 449

1393 TAC CTG GAG GAG GTT CAC ATC TCC CAC GTG GGC CAG CCC ATG CTG AAC 1440

450 Tyr Leu Glu Glu Val His Ile Ser His Val Gly Gln Pro Met Leu Asn 465

1441 TTC TCG TTC AAC TCC TTC CAC CCG GAC ACG CGC AAG CCG ATG CAC AGA 1488

466 Phe Ser Phe Asn Ser Phe His Pro Asp Thr Arg Lys Pro Met His Arg 481

1489 GAG TGT GGC TTC ATT CGC CTC AAG CCC GAC ACC AAC AAG GTG GCC TTT 1536

482 Glu Cys Gly Phe Ile Arg Leu Lys Pro Asp Thr Asn Lys Val Ala Phe 497

1537 GTC AGC GCC CAG AAC ACA GGC GTG GTG GAA GTG GAG GAG GGC GAG GTG 1584

498 Val Ser Ala Gln Asn Thr Gly Val Val Glu Val Glu Glu Gly Glu Val 513

1585 AAC GGG CAG GAG CTG TGC ATC GCA TCC CAC TCC ATC GCC AGG ATC TCC 1632

514 Asn Gly Gln Glu Leu Cys Ile Ala Ser His Ser Ile Ala Arg Ile Ser 529

1633 TTC GCC AAG GAG CCC CAC GTA GAG CAG ATC ACC CGG AAG TTC AGG CTG 1680

530 Phe Ala Lys Glu Pro His Val Glu Gln Ile Thr Arg Lys Phe Arg Leu 545

1681 AAT TCT GAA GGC AAA CTT GAG CAG ACG GTC TCC ATG GCA ACC ACG ACA 1728

546 Asn Ser Glu Gly Lys Leu Glu Gln Thr Val Ser Met Ala Thr Thr Thr 561

1729 CAG CCA ATG ACT CAG CAT CTT CAC GTC ACC TAC AAG AAG GTG ACC CCG 1776

562 Gln Pro Met Thr Gln His Leu His Val Thr Tyr Lys Lys Val Thr Pro 577

1777 TAA ACC TAG AGC TTC TGG AGC CCT CGG GAG GGC CTG GCT ACT GTG CCT 1824

578 *** 578

1825 CAA CGG TTC GGC TCC TCA ACA GAC AGT CCC TGC GGC AAA AGT GGG TGT 1872

1873 GGC CGT GAG CCT CTG CAG GCT CAA GAG TGT TGT CCA GAT GTT TCT GTA 1920

1921 CTG GCA TAG AAA AAC CAA ATA AAA GGC CTT TAT TTT TAT GGC TGA GGA 1968

1969 TTT TGA ATA TTA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 2016

2017 AAA AAA A 2023

4. PP856

A：核苷酸序列(SEQ ID NO：10)长度：2364

GGAACACGTG CTTTCTGGGC AGGTCGCCCC TCAGTCTCCA CTAGAGACAG GACTGACCAG 60

TTGCTCTTCC TTCCAAGAAC CTTCGAGATC TGCGGTCTGG GGTCTGGTTG AAAGATGGCG 120

GCCCTCACTA CCCTGTTTAA GTACATAGAT GAAAATCAGG ATCGCTACAT TAAGAAACTC 180

GCAAAATGGG TGGCTATCCA GAGTGTGTCT GCGTGGCCGG AGAAGAGAGG CGAAATCAGG 240

AGGATGATGG AAGTTGCTGC TGCAGATGTT AAGCAGTTGG GGGGCTCTGT GGAACTGGTG 300

GATATCGGAA AACAAAAGGA GATTCCTGTC AACGTCCGAT TCTGCCTCGA AGGCATGGAG 360

GAGTCAGGCT CTGAGGGCCT AGACGAGCTG ATTTTTGCCC GGAAAGACAC ATTCTTTAAG 420

GATGTGGACT ATGTCTGCAT TTCTGACAAT TACTGGCTGG GAAAGAAGAA GCCCTGCATC 480

ACCTACGGCC TCAGGGGCAT TTGCTACTTT TTCATCGAGG TGGAGTGCAG CAACAAAGAC 540

CTCCATTCTG GCGTGTACGG GGGCTCGGTG CATGAGGCCA TGACTGATCT CATTTTGCTG 600

ATGGGCTCTT TGGTGGACAA GAGGGGGAAC ATCCTGATCC CCGGCATTAA CGAGGCCGTG 660

GCCGCCGTCA CGGAAGAGGA GCACAAGCTG TACGACGACA TCGACTTTGA CATAGAGGAG 720

TTTGCCAAGG ATGTGGGGGC GCAGATCCTC CTGCACAGCC ACAAGAAAGA CATCCTCATG 780

CACCGATGGC GGTACCCGTC TCTGTCCCTC CATGGCATCG AAGGCGCCTT CTCTGGGTCT 840

GGGGCCAAGA CCGTGATTCC CAGGAAGGTG GTTGGCAAGT TCTCCATCAG GCTCGTGCCG 900

AACATGACTC CTGAAGTCGT CGGCGAGCAG GTCACAAGCT ACCTAACTAA GAAGTTTGCT 960

GAACTACGCA GCCCCAATGA GTTCAAGGTG TACATGGGCC ACGGTGGGAA GCCCTGGGTC 1020

TCCGACTTCA GTCACCCTCA TTACCTGGCT GGGAGAAGAG CCATGAAGAC AGTTTTTGGT 1080

GTTGAGCCAG ACTTGACCAG GGAAGGCGGC AGTATTCCCG TGACCTTGAC CTTTCAGGAG 1140

GCCACGGGCA AGAACGTCAT GCTGCTGCCT GTGGGGTCAG CGGATGACGG AGCCCACTCC 1200

CAGAATGAAA AGCTCAACAG GTATAACTAC ATAGAGGGAA CCAAGATGCT GGCCGCGTAC 1260

CTGTATGAGG TCTCCCAGCT GAAGGACTAG GCCAAGCCCT CTGTGTGCCA TCTCCAATGA 1320

GAAGGAATCC TGCCCTCACC TCACCCTTTT CCAACTTGCC CAGGGAAGTG GAGGTTCCCT 1380

CTTTCCTTTC CCTCTTGTCA GGTCATCCAT GACTTTAGAG AACAGACACA AGTGTATCCA 1440

GCTGTCCACG GGTGGAGCTA CCCGTTGGGC TTATGAGTGA CCTGGAGTGA CAGCTGAGTC 1500

ACCCTGGGTA AGTTCTCAGA GTGGTCAGGA TGGCTTGACC TGCAGAAGAT ACCCAAGGTC 1560

CAAAAGCACA AGGTCTGCGG AAAGTTCTGG TTGTCGGCTG GGCACCACGG CTCACACCTA 1620

TAATCGAGCA CTTTGGGAGG CCAAGACAGG AGGATCACTT GAGGCCAGGA GTCTGAGACA 1680

AGCCTAGGCA ACAAAACAAG ACTCTGTCTC TACAAAAAGT TTAAGAAATG AGCCAGACAT 1740

GGTGGTGTAT GCCTGTAGTC CCAGCCACTC AGAAGGCTGA GGCAGGAGGA TCGCTTGAGA 1800

CCAAGAGTTT GAGCCTGCGG TGAGCTGTGA ATGCACCACG GCACTCAAGC CTGGGCAATG 1860

TAGCAAGATC CTGTCTCTAC AAGAAATTTT TTAAAAATGA GCCAAGTGTG GTGGTGCATG 1920

CCTGTAGTTC CAGCTACTCA GGACACTGAC GTAGGAGGGT TGCTTGAGAC TGAGAGTTGG 1980

AGGCTGCGAT GAGCCATGAA TGCCCCACTG CACTCCAGCC TGGGCGACAG AACGAGACCC 2040

CATCTCAAAA AAAATAAGTT CTGGTTGTCA TTGAATTGGG ATAAACAGAG AGCTTGATGC 2100

TTTCTGCCTT CTGTCTCAGG TGATGCATTG CACATTTGGG ATATTTGGAA AGGAAATGAG 2160

GAAAGAAATT AGGGCCTCCT CTGATCTCTC GCTATCTGCG GGTCCTGTCC TTTTCTCAAG 2220

ACCTTCACCA TTACTGGTGT TTTCCTGTCT TCTCTTTAGT ATGATCCCTC AAAACCTCAC 2280

TAACTGGAAG GATGATTTTG TCTCAGTTTG TACTCCTAAA TAAAAAGTAA ACATGACACC 2340

TCTAAAAAAA AAAAAAAAAA AAAA 2364

B：氨基酸序列(SEQ ID NO：11)长度：391

1 MAALTTLFKY IDENQDRYIK KLAKWVAIQS VSAWPEKRGE IRRMMEVAAA

51 DVKQLGGSVE LVDIGKQKEI PVNVRFCLEG MEESGSEGLD ELIFARKDTF

101 FKDVDYVCIS DNYWLGKKKP CITYGLRGIC YFFIEVECSN KDLHSGVYGG

151 SVHEAMTDLI LLMGSLVDKR GNILIPGINE AVAAVTEEEH KLYDDIDFDI

201 EEFAKDVGAQ ILLHSHKKDI LMHRWRYPSL SLHGIEGAFS GSGAKTVIPR

251 KVVGKFSIRL VPNMTPEVVG EQVTSYLTKK FAELRSPNEF KVYMGHGGKP

301 WVSDFSHPHY LAGRRAMKTV FGVEPDLTRE GGSIPVTLTF QEATGKNVML

351 LPVGSADDGA HSQNEKLNRY NYIEGTKMLA AYLYEVSQLK D

克隆号：PP856(SEQ ID NO：12)

起始编码子：115 ATG 终止编码子：1290 TAG 蛋白质分子量：43831.06

1 GGA ACA CGT GCT TTC TGG GCA GGT CGC CCC TCA GTC TCC ACT AGA GAC 48

49 AGG ACT GAC CAG TTG CTC TTC CTT CCA AGA ACC TTC GAG ATC TGC GGT 96

97 CTG GGG TCT GGT TGA AAG ATG GCG GCC CTC ACT ACC CTG TTT AAG TAC 144

1 Met Ala Ala Leu Thr Thr Leu Phe Lys Tyr 10

145 ATA GAT GAA AAT CAG GAT CGC TAC ATT AAG AAA CTC GCA AAA TGG GTG 192

11 Ile Asp Glu Asn Gln Asp Arg Tyr Ile Lys Lys Leu Ala Lys Trp Val 26

193 GCT ATC CAG AGT GTG TCT GCG TGG CCG GAG AAG AGA GGC GAA ATC AGG 240

27 Ala Ile Gln Ser Val Ser Ala Trp Pro Glu Lys Arg Gly Glu Ile Arg 42

241 AGG ATG ATG GAA GTT GCT GCT GCA GAT GTT AAG CAG TTG GGG GGC TCT 288

43 Arg Met Met Glu Val Ala Ala Ala Asp Val Lys Gln Leu Gly Gly Ser 58

289 GTG GAA CTG GTG GAT ATC GGA AAA CAA AAG GAG ATT CCT GTC AAC GTC 336

59 Val Glu Leu Val Asp Ile Gly Lys Gln Lys Glu Ile Pro Val Asn Val 74

337 CGA TTC TGC CTC GAA GGC ATG GAG GAG TCA GGC TCT GAG GGC CTA GAC 384

75 Arg Phe Cys Leu Glu Gly Met Glu Glu Ser Gly Ser Glu Gly Leu Asp 90

385 GAG CTG ATT TTT GCC CGG AAA GAC ACA TTC TTT AAG GAT GTG GAC TAT 432

91 Glu Leu Ile Phe Ala Arg Lys Asp Thr Phe Phe Lys Asp Val Asp Tyr 106

433 GTC TGC ATT TCT GAC AAT TAC TGG CTG GGA AAG AAG AAG CCC TGC ATC 480

107 Val Cys Ile Ser Asp Asn Tyr Trp Leu Gly Lys Lys Lys Pro Cys Ile 122

481 ACC TAC GGC CTC AGG GGC ATT TGC TAC TTT TTC ATC GAG GTG GAG TGC 528

123 Thr Tyr Gly Leu Arg Gly Ile Cys Tyr Phe Phe Ile Glu Val Glu Cys 138

529 AGC AAC AAA GAC CTC CAT TCT GGG GTG TAC GGG GGC TCG GTG CAT GAG 576

139 Ser Asn Lys Asp Leu His Ser Gly Val Tyr Gly Gly Ser Val His Glu 154

577 GCC ATG ACT GAT CTC ATT TTG CTG ATG GGC TCT TTG GTG GAC AAG AGG 624

155 Ala Met Thr Asp Leu Ile Leu Leu Met Gly Ser Leu Val Asp Lys Arg 170

625 GGG AAC ATC CTG ATC CCC GGC ATT AAC GAG GCC GTG GCC GCC GTC ACG 672

171 Gly Asn Ile Leu Ile Pro Gly Ile Asn Glu Ala Val Ala Ala Val Thr 186

673 GAA GAG GAG CAC AAG CTG TAC GAC GAC ATC GAC TTT GAC ATA GAG GAG 720

187 Glu Glu Glu His Lys Leu Tyr Asp Asp Ile Asp Phe Asp Ile Glu Glu 202

721 TTT GCC AAG GAT GTG GGG GCG CAG ATC CTC CTG CAC AGC CAC AAG AAA 768

203 Phe Ala Lys Asp Val Gly Ala Gln Ile Leu Leu His Ser His Lys Lys 218

769 GAC ATC CTC ATG CAC CGA TGG CGG TAC CCG TCT CTG TCC CTC CAT GGC 816

219 Asp Ile Leu Met His Arg Trp Arg Tyr Pro Ser Leu Ser Leu His Gly 234

817 ATC GAA GGC GCC TTC TCT GGG TCT GGG GCC AAG ACC GTG ATT CCC AGG 864

235 Ile Glu Gly Ala Phe Ser Gly Ser Gly Ala Lys Thr Val Ile Pro Arg 250

865 AAG GTG GTT GGC AAG TTC TCC ATC AGG CTC GTG CCG AAC ATG ACT CCT 912

251 Lys Val Val Gly Lys Phe Ser Ile Arg Leu Val Pro Asn Met Thr Pro 266

913 GAA GTC GTC GGC GAG CAG GTC ACA AGC TAC CTA ACT AAG AAG TTT GCT 960

267 Glu Val Val Gly Glu Gln Val Thr Ser Tyr Leu Thr Lys Lys Phe Ala 282

961 GAA CTA CGC AGC CCC AAT GAG TTC AAG GTG TAC ATG GGC CAC GGT GGG 1008

283 Glu Leu Arg Ser Pro Asn Glu Phe Lys Val Tyr Met Gly His Gly Gly 298

1009 AAG CCC TGG GTC TCC GAC TTC AGT CAC CCT CAT TAC CTG GCT GGG AGA 1056

299 Lys Pro Trp Val Ser Asp Phe Ser His Pro His Tyr Leu Ala Gly Arg 314

1057 AGA GCC ATG AAG ACA GTT TTT GGT GTT GAG CCA GAC TTG ACC AGG GAA 1104

315 Arg Ala Met Lys Thr Val Phe Gly Val Glu Pro Asp Leu Thr Arg Glu 330

1105 GGC GGC AGT ATT CCC GTG ACC TTG ACC TTT CAG GAG GCC ACG GGC AAG 1152

331 Gly Gly Ser Ile Pro Val Thr Leu Thr Phe Gln Glu Ala Thr Gly Lys 346

1153 AAC GTC ATG CTG CTG CCT GTG GGG TCA GCG GAT GAC GGA GCC CAC TCC 1200

347 Asn Val Met Leu Leu Pro Val Gly Ser Ala Asp Asp Gly Ala His Ser 362

1201 CAG AAT GAA AAG CTC AAC AGG TAT AAC TAC ATA GAG GGA ACC AAG ATG 1248

363 Gln Asn Glu Lys Leu Asn Arg Tyr Asn Tyr Ile Glu Gly Thr Lys Met 378

1249 CTG GCC GCG TAC CTG TAT GAG GTC TCC CAG CTG AAG GAC TAG GCC AAG 1296

379 Leu Ala Ala Tyr Leu Tyr Glu Val Ser Gln Leu Lys Asp *** 392

1297 CCC TCT GTG TGC CAT CTC CAA TGA GAA GGA ATC CTG CCC TCA CCT CAC 1344

1345 CCT TTT CCA ACT TGC CCA GGG AAG TGG AGG TTC CCT CTT TCC TTT CCC 1392

1393 TCT TGT CAG GTC ATC CAT GAC TTT AGA GAA CAG ACA CAA GTG TAT CCA 1440

144l GCT GTC CAC GGG TGG AGC TAC CCG TTG GGC TTA TGA GTG ACC TGG AGT 1488

1489 GAC AGC TGA GTC ACC CTG GGT AAG TTC TCA GAG TGG TCA GGA TGG CTT 1536

1537 GAC CTG CAG AAG ATA CCC AAG GTC CAA AAG CAC AAG GTC TGC GGA AAG 1584

1585 TTC TGG TTG TCG GCT GGG CAC CAC GGC TCA CAC CTA TAA TCG AGC ACT 1632

1633 TTG GGA GGC CAA GAC AGG AGG ATC ACT TGA GGC CAG GAG TCT GAG ACA 1680

1681 AGC CTA GGC AAC AAA ACA AGA CTC TGT CTC TAC AAA AAG TTT AAG AAA 1728

1729 TGA GCC AGA CAT GGT GGT GTA TGC CTG TAG TCC CAG CCA CTC AGA AGG 1776

1777 CTG AGG CAG GAG GAT CGC TTG AGA CCA AGA GTT TGA GCC TGC GGT GAG 1824

1825 CTG TGA ATG CAC CAC GGC ACT CAA GCC TGG GCA ATG TAG CAA GAT CCT 1872

1873 GTC TCT ACA AGA AAT TTT TTA AAA ATG AGC CAA GTG TGG TGG TGC ATG 1920

1921 CCT GTA GTT CCA GCT ACT CAG GAC ACT GAC GTA GGA GGG TTG CTT GAG 1968

1969 ACT GAG AGT TGG AGG CTG CGA TGA GCC ATG AAT GCC CCA CTG CAC TCC 2016

2017 AGC CTG GGC GAC AGA ACG AGA CCC CAT CTC AAA AAA AAT AAG TTC TGG 2064

2065 TTG TCA TTG AAT TGG GAT AAA CAG AGA GCT TGA TGC TTT CTG CCT TCT 2112

2113 GTC TCA GGT GAT GCA TTG CAC ATT TGG GAT ATT TGG AAA GGA AAT GAG 2160

2161 GAA AGA AAT TAG GGC CTC CTC TGA TCT CTC GCT ATC TGC GGG TCC TGT 2208

2209 CCT TTT CTC AAG ACC TTC ACC ATT ACT GGT GTT TTC CTG TCT TCT CTT 2256

2257 TAG TAT GAT CCC TCA AAA CCT CAC TAA CTG GAA GGA TGA TTT TGT CTC 2304

2305 AGT TTG TAC TCC TAA ATA AAA AGT AAA CAT GAC ACC TCT AAA AAA AAA 2352

2353 AAA AAA AAA AAA 2364

5. PP1065

A：核苷酸序列(SEQ ID NO：13)长度：1910

GGGAAGTAGA AGACAGCGGC GTTGCCATGG CGGCGTCTCT GGGGCAGGTG TTGGCTCTGG 60

TGCTGGTGGC CGCTCTGTGG GGTGGCACGC AGCCGCTGCT GAAGCGGGCC TCCGCCGGCC 120

TGCAGCGGGT TCATGAGCCG ACCTGGGCCC AGCAGTTGCT ACAGGAGATG AAGACCCTCT 180

TCTTGAATAC TGAGTACCTG ATGCCCTTTC TCCTCAACCA GTGTGGATCC CTTCTCTATT 240

ACCTCACCTT GGCATCGACA GATCTGACCC TGGCTGTGCC CATCTGTAAC TCTCTGGCTA 300

TCATCTTCAC ACTGATTGTT GGGAAGGCCC TTGGAGAAGA TATTGGTGGA AAACGAGCAG 360

TTGCTGGCAT GGTGCTCACC GTGATAGGAA TTTCACTCTG CATCACAAGC TCAGTTCCAT 420

GGACTGCAGA ACTCCAGCTG CATGGAAAGG GCCAGCTGCA GACTTTGAGC CAGAAATGCA 480

AACGGGAGGC CTCTGGGACT CAGTCAGAGC GCTTTGGCTG AATGAGGGGT GGAACCGAGG 540

GAAGAAGGTA GAGAGCTGTG AGCCCCAGCC CCACCTGACT CCAGCACACC TGGCGAGTAG 600

TAGCTGTCAA TAAATCTATG GTAAACAGAC AAGAGGAGGT GGAAGGCCAT ACAGAATGGA 660

GCCGTGAGTA TGGCCAGCCT CCAGCTCTCA GCCAGGAGGT CCCCAACCCC AAGGAAGGAA 720

GAAACTGGAA ATTAGGAACT GCTTCCTCAT TTAACAAGGT AGGAAGTTAG GAGATCATTT 780

ACTTTCAATC ACAAGGGAGG AGAACTGTTC CTGGGGCCCA AGGCTGCCAG TTTCCAGCTC 840

AGAGCTCCTC CCACCCCAAC ATACTGTTTC CTGATCCAAC AGCTTACCTG ATCCAAGGGC 900

TCCTCTGTCT GAGTGTCTTC ATCATCTGCT ACTTCCAGGG CCCCCGCTGT CTCCTTCCTT 960

CGGTGGGGAG CTCCATATAC TCCTATAACT CCTAAAGAGG GGAGGCAGCA CTGGGTGATG 1020

CCCAGGCTGA AGAGCCCTCA GCATTCCTGC CCTGGACCTT CATGCTAGCC CCTTTCCCTC 1080

CCCTGAACCT GGTTCTGCAT TCCCCACCAC CTCCCAGGAT GGCAAGGAAG TGAGAGGTGG 1140

GCCTTTGGTC CCACCCCCAT CCCCTCTATA TCCCACCCCT GAAGTCTTAT CGCTTTAAGC 1200

ACTGCCCTTT CCAGGTGCTT CTTTTCATGT GATGAGGCCC TGTGAAGAAG GGACAGGATA 1260

TACAGACGGG GGCAGCTGGA GACAGTTATG ATGAGTGCCG GCTTTGTGTC TGAGCATTCT 1320

GCTCCCATGG ACATCCCCAA CAACAGCAGG GACCAACCTA TGTCACTGTC AAAGGGCAGC 1380

TGAGAAGGGC CTGAGCCCCA GGGACCCCTC ACCTGATGGG AATGAGAGTG TGGGGAGCTT 1440

GCTTCTTGGC TGAATGGTCT GCTGGGGTCT GGCATAGAAA GCAGATGGCT TAATTCGGTC 1500

TGGTTCCTTT GGAGAGGGCT GGGTTACCTG GGCCCTGTGG CCTTGGGCCT AGAGAAGGGA 1560

CACTGGGCTT GGACCCTGAT TGCTGGCCAT TCTTACCTTT CCTACTCCCC AGTTCAGGCT 1620

TCAGAGACCC CCTGACGCCT GCAGGAACAT GGCAGAGGAG ACACCGTCTG TCTTCACAAA 1680

GTACGTCCTC CCTCCTTGCT GCCTCTTCCC ACCAGCCTGA CTTATCCAGG GACAGAGCAG 1740

TAGATGCCTG GCACTCCTCG ATGCCCAGTG AAACCAGACT GTGCTTCCCC ACCCCCACCA 1800

CCATGCCCCA TGCTCACTGG CTCATTTCTT GGGAGGGCTT AGAGCTGGAT AATATAAGTT 1860

CCCTTGGGAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 1910

B：氨基酸序列(SEQ ID NO：14)长度：164

1 MAASLGQVLA LVLVAALWGG TQPLLKRASA GLQRVHEPTW AQQLLQEMKT

51 LFLNTEYLMP FLLNQCGSLL YYLTLASTDL TLAVPICNSL AIIFTLIVGK

101 ALGEDIGGKR AVAGMVLTVI GISLCITSSV PWTAELQLHG KGQLQTLSQK

151 CKREASGTQS ERFG

克隆号：PP1065(SEQ ID NO：15)

起始编码子：27 ATG 终止编码子：521 TGA 蛋白质分子量：17599.78

1 GG GAA GTA GAA GAC AGC GGC GTT GCC ATG GCG GCG TCT CTG GGG CAG 47

1 Met Ala Ala Ser Leu Gly Gln 7

48 GTG TTG GCT CTG GTG CTG GTG GCC GCT CTG TGG GGT GGC ACG CAG CCG 95

8 Val Leu Ala Leu Val Leu Val Ala Ala Leu Trp Gly Gly Thr Gln Pro 23

96 CTG CTG AAG CGG GCC TCC GCC GGC CTG CAG CGG GTT CAT GAG CCG ACC 143

24 Leu Leu Lys Arg Ala Ser Ala Gly Leu Gln Arg Val His Glu Pro Thr 39

144 TGG GCC CAG CAG TTG CTA CAG GAG ATG AAG ACC CTC TTC TTG AAT ACT 191

40 Trp Ala Gln Gln Leu Leu Gln Glu Met Lys Thr Leu Phe Leu Asn Thr 55

192 GAG TAC CTG ATG CCC TTT CTC CTC AAC CAG TGT GGA TCC CTT CTC TAT 239

56 Glu Tyr Leu Met Pro Phe Leu Leu Asn Gln Cys Gly Ser Leu Leu Tyr 71

240 TAC CTC ACC TTG GCA TCG ACA GAT CTG ACC CTG GCT GTG CCC ATC TGT 287

72 Tyr Leu Thr Leu Ala Ser Thr Asp Leu Thr Leu Ala Val Pro Ile Cys 87

288 AAC TCT CTG GCT ATC ATC TTC ACA CTG ATT GTT GGG AAG GCC CTT GGA 335

88 Asn Ser Leu Ala Ile Ile Phe Thr Leu Ile Val Gly Lys Ala Leu Gly 103

336 GAA GAT ATT GGT GGA AAA CGA GCA GTT GCT GGC ATG GTG CTC ACC GTG 383

104 Glu Asp Ile Gly Gly Lys Arg Ala Val Ala Gly Met Val Leu Thr Val 119

384 ATA GGA ATT TCA CTC TGC ATC ACA AGC TCA GTT CCA TGG ACT GCA GAA 431

120 Ile Gly Ile Ser Leu Cys Ile Thr Ser Ser Val Pro Trp Thr Ala Glu 135

432 CTC CAG CTG CAT GGA AAG GGC CAG CTG CAG ACT TTG AGC CAG AAA TGC 479

136 Leu Gln Leu His Gly Lys Gly Gln Leu Gln Thr Leu Ser Gln Lys Cys 151

480 AAA CGG GAG GCC TCT GGG ACT CAG TCA GAG CGC TTT GGC TGA ATG AGG 527

152 Lys Arg Glu Ala Ser Gly Thr Gln Ser Glu Arg Phe Gly *** 165

528 GGT GGA ACC GAG GGA AGA AGG TAG AGA GCT GTG AGC CCC AGC CCC ACC 575

576 TGA CTC CAG CAC ACC TGG CGA GTA GTA GCT GTC AAT AAA TCT ATG GTA 623

624 AAC AGA CAA GAG GAG GTG GAA GGC CAT ACA GAA TGG AGC CGT GAG TAT 671

672 GGC CAG CCT CCA GCT CTC AGC CAG GAG GTC CCC AAC CCC AAG GAA GGA 719

720 AGA AAC TGG AAA TTA GGA ACT GCT TCC TCA TTT AAC AAG GTA GGA AGT 767

768 TAG GAG ATC ATT TAC TTT CAA TCA CAA GGG AGG AGA ACT GTT CCT GGG 815

816 GCC CAA GGC TGC CAG TTT CCA GCT CAG AGC TCC TCC CAC CCC AAC ATA 863

864 CTG TTT CCT GAT CCA ACA GCT TAC CTG ATC CAA GGG CTC CTC TGT CTG 911

912 AGT GTC TTC ATC ATC TGC TAC TTC CAG GGC CCC CGC TGT CTC CTT CCT 959

960 TCG GTG GGG AGC TCC ATA TAC TCC TAT AAC TCC TAA AGA GGG GAG GCA 1007

1008 GCA CTG GGT GAT GCC CAG GCT GAA GAG CCC TCA GCA TTC CTG CCC TGG 1055

1056 ACC TTC ATG CTA GCC CCT TTC CCT CCC CTG AAC CTG GTT CTG CAT TCC 1103

1104 CCA CCA CCT CCC AGG ATG GCA AGG AAG TGA GAG GTG GGC CTT TGG TCC 1151

1152 CAC CCC CAT CCC CTC TAT ATC CCA CCC CTG AAG TCT TAT CGC TTT AAG 1199

1200 CAC TGC CCT TTC CAG GTG CTT CTT TTC ATG TGA TGA GGC CCT GTG AAG 1247

1248 AAG GGA CAG GAT ATA CAG ACG GGG GCA GCT GGA GAC AGT TAT GAT GAG 1295

1296 TGC CGG CTT TGT GTC TGA GCA TTC TGC TCC CAT GGA CAT CCC CAA CAA 1343

1344 CAG CAG GGA CCA ACC TAT GTC ACT GTC AAA GGG CAG CTG AGA AGG GCC 1391

1392 TGA GCC CCA GGG ACC CCT CAC CTG ATG GGA ATG AGA GTG TGG GGA GCT 1439

1440 TGC TTC TTG GCT GAA TGG TCT GCT GGG GTC TGG CAT AGA AAG CAG ATG 1487

1488 GCT TAA TTC GGT CTG GTT CCT TTG GAG AGG GCT GGG TTA CCT GGG CCC 1535

1536 TGT GGC CTT GGG CCT AGA GAA GGG ACA CTG GGC TTG GAC CCT GAT TGC 1583

1584 TGG CCA TTC TTA CCT TTC CTA CTC CCC AGT TCA GGC TTC AGA GAG CCC 1631

1632 CTG ACG CCT GCA GGA ACA TGG CAG AGG AGA CAC CGT CTG TCT TCA CAA 1679

1680 AGT ACG TCC TCC CTC CTT GCT GCC TCT TCC CAC CAG CCT GAC TTA TCC 1727

1728 AGG GAC AGA GCA GTA GAT GCC TGG CAC TCC TCG ATG CCC AGT GAA ACC 1775

1776 AGA CTG TGC TTC CCC ACC CCC ACC ACC ATG CCC CAT GCT CAC T3G CTC 1823

1824 ATT TCT TGG GAG GGC TTA GAG CTG GAT AAT ATA AGT TGC CTT GGG AAA 1871

1872 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 1910

6. PP1221

A：核苷酸序列(SEQ ID NO：16)长度：3657

GGCTGCCAAC GGTTTTGAGC GTAGGGGGAG GCGTGAGAGG GGGATCTCAG GGGAGGAGGT 60

CAATCGCTTG CCCCCCACTT TGGCAAATTG GGGACTGAGG ACTGGAAGGG TGGAGAGTAG 120

GCGGAACCAG GTGGTCGTCG GGGCAGAGGA TCTCGGGCTA GGCTTGAGGG CGGCGTGCTT 180

CTTAGGGACG ACTTAGGGCG TGACTGAGGG TTCACAAGGT TTCTTTTGGG GTGGTCGGGA 240

GGGAGAGATT CTAGGGAACA AGGAAGCTCG CTATGGCTTT CTTGCCAGGA GGGGTCGAAG 300

GGAAAGTACA AGGGAGCTGA CCCTGGGTAG AACGGGTGAA GGGATGGGGG AGCGTGAGGT 360

TCCGCCCTCT CTTGAGACTG GAACCAATTG GAGGGACTAG TAGGGCAGGG GGACAGAAAT 420

TGGGCTCCTA GTGGATTTGG GTCCGTTTCC GTTGGGACGT TTTGGGTGTG AGAACTTAAG 480

AGCTCAGTTG ACCGGGGATA GCCTGTGCCG GAGTTGATCT GCAGCTTCCA GCACTCGTAG 540

TCGGGAAGAG GAGCTTCAGC AGCGCTGTTG TCCCACAGTA GGTCTTCTGT CCGCACCCGC 600

TCTGCGCTGC ACCCTCTTAA CGCTGTTCCC AGGAGCTGGG GAAAGGGATG CTTTTGCCCA 660

CTCCCATGGC CCCTGGAACT GGTGGAAACC TTTCCTCTAA CCAGAAAGCC TCGATATCCT 720

TAATTCACCA AGGATCCTTG GCGTGGAGTC TTCCTCCCTT CTCCCAAGTC TTTCTCCGTG 780

AACTTTTCCT CCTGGACTTT GCTAAAGCAG AACCTCCCAG CTCTTTGCTG TCTCCGGTTG 840

TCTCTTCCCT GTATTCATGG CAACATCAGC TGACAGCCCC AGTTCACCCC TCGGGGCGGA 900

GGATCTCCTG AGTGATTCAT CAGAACCCCC TGGGCTCAAC CAAGTGTCGT CTGAAGTGAC 960

CTCCCAGCTC TATGCTTCTT TGCGCCTCAG CCGGCAGGCG GAGGCCACGG CCCGAGCCCA 1020

GCTGTATTTA CCCTCCACCT CCCCGCCTCA TGAAGGGTTA GACGGCTTCG CCCAAGAATT 1080

GAGTCGAAGC TTGTCAGTCG GATTGGAAAA GAACTTGAAG AAAAAGGATG GTTCTAAGCA 1140

TATCTTTGAG ATGGAAAGTG TTCGGGGTCA GCTCCAGACC ATGCTCCAAA CCTCACGTGA 1200

TACAGCCTAT CGGGATCCTC TCATTCCTGG CGCTGGCTCA GAGAGACGGG AAGAGGACTC 1260

CTTTGACAGT GATAGCACAG CCACCTTGCT CAACACCCGG CCCCTGCAAG ACTTGTCTCC 1320

ATCTAGCTCA GCCCAAGCCC TGGAGGAGCT GTTTCCCCGC TACACCAGCC TTCGGCCAGG 1380

GCCTCCACTC AATCCCCCAG ATTTTCAGGG GCTGAGAGAT GCATTGGATT CAGAGCATAC 1440

CCGCCGCAAG CATTGTGAGC GCCATATTCA GAGCCTGCAG ACCCGAGTGT TAGAGCTACA 1500

GCAACAATTA GCCGTGGCTG TGGCTGCCGA CCGCAAGAAA GATACCATGA TTGAACAACT 1560

GGACAAGACC CTGGCCCGTG TGGTGGAGGG CTGGAACCGG CATGAGGCTG AGCGGACAGA 1620

GGTTCTCAGG GGACTTCAAG AGGAACACCA GGCAGCAGAG CTCACCAGAA GCAAGCAGCA 1680

GGAGACAGTA ACCCGCCTGG AACAAAGCCT TTCTGAGGCC ATGGAGGCCC TGAATCGTGA 1740

GCAGGAAAGT GCCAGACTGC AGCAACGGGA AAGAGAGACA CTGGAGGAGG AAAGGCAAGC 1800

TCTGACTCTG AGGTTGGAGG CAGAACAGCA GCGGTGCTGT GTCCTGCAGG AAGAGCGGGA 1860

TGCAGCTCGG GCTGGGCAAC TGAGTGAGCA TCGAGAGTTG GAGACTCTTC GGGCTGCCCT 1920

AGAAGAAGAA CGGCAGACCT GCGCCCAGCA AGAGCACCAG CTTAAGGAAC ACTACCAGGC 1980

GCTGCAGGAG GAGAGCCAGG CTCAGCTGGA AAGGGAGAAG GAGAAGAGCC AGAGGGAAGC 2040

CCAGGCCGCC TGGGAGACCC AGCACCAGTT GGCATTGGTG CAGTCTGAGG TGCGGCGGCT 2100

GGAAGGAGAG CTGGATACAG CTCGGAGAGA GAGAGATGCC CTGCAGCTGG AAATGAGCTT 2160

GGTGCAGGCC CGGTATGAAA GCCAGCGGAT CCAGCTGGAG TCGGAGCTGG CTGTGCAGCT 2220

GGAGCAGCGG GTGACAGAGC GGCTGGCGCA GGCTCAGGAG AGCAGCCTAC GGCAAGCAGC 2280

CTCCCTCAGG GAACATCACA GGAAGCAGCT GCAGGACCTG AGTGGACAGC ACCAGCAGGA 2340

GCTGGCCAGT CAGCTAGCTC AGTTCAAGGT GGAAATGGCA GAACGAGAGG AACGGCAACA 2400

GCAGGTGGCT GAGGACTACG AGCTCAGACT GGCCCGGGAG CAAGCGCAAG TGTGCGAACT 2460

GCAGAGTGGG AACCAGCAGC TGGAGGAGCA GCGGGTGGAG CTGGTGGAAA GACTGCAGGC 2520

CATGCTGCAG GCCCACTGGG ATGAGGCCAA CCAGCTGCTC AGCACCACTC TCCCGCCGCC 2580

CAACCCTCCA GCTCCTCCTG CTGGACCCTC CAGCCCCGGG CCTCAGGAGC CCGAGAAGGA 2640

GGAGAGGAGG GTCTGGACTA TGCCTCCCAT GGCCGTGGCC CTGAAGCCTG TATTGCAGCA 2700

GAGCCGGGAA GCAAGGGACG AGCTACCTGG AGCGCCTCCT GTTCTTTGCA GTTCCTCCTC 2760

AGATCTTAGC CTCCTGTTGG GCCCCTCTTT TCAGAGCCAG CATTCTTTCC AGCCCCTGGA 2820

GCCCAAACCA GACCTCACTT CATCCACAGC TGGGGCCTTC TCTGCACTTG GGGCCTTCCA 2880

TCCCGATCAT AGGGCAGAAA GGCCATTCCC TGAGGAAGAT CCTGGACCTG ACGGGGAGGG 2940

CCTCCTAAAG CAAGGGCTGC CGCCTGCTCA GCTGGAGGGC CTCAAGAATT TTTTGCACCA 3000

GTTGCTGGAG ACAGTGCCCC AGAACAATGA GAACCCTTCT GTCGACCTGT TGCCCCCTAA 3060

GTCTGGTCCT CTGACTGTCC GATCTTGGGA GGAAGCCCCT CAAGTGCCAC GTATTCCACC 3120

GCCTGTCCAC AAAACCAAAG TTCCCTTAGC CATGGCATCC AGTCTTTTCC GGGTCCCTGA 3180

GCCTCCCTCC TCCCATTCAC AAGGCAGTGG TCCCAGCAGT GGTTCCCCAG AGAGAGGTGG 3240

AGATGGGCTT ACATTCCCAA GGCAGCTGAT GGAGGTGTCT CAACTGTTGC GACTCTACCA 3300

GGCTCGGGGC TGGGGGGCTC TGCCTGCTGA GGATCTCCTG CTCTACCTGA AGAGGCTGGA 3360

ACACAGCGGG ACTGATGGCC GAGGGGATAA TGTCCCCAGA AGGAACACAG ACTCCCGCTT 3420

GGGTGAGATC CCCCGGAAAG AGATTCCCTC CCAGGCTGTC CCTCGCCGCC TTGCTACAGC 3480

CCCCAAGACT GAAAAACCTC CCGCACGGAA GAAAAGTGGG CACCCTGCCC CGAGTAGCAT 3540

GAGGAGCCGG GGGGGAGTCT GGAGATGAGC CCCCCTACCC TCTCTCCTCT TTGTTCTCTC 3600

ATTGTTGTTA TTTTAATAAA TGCTCAGTAG TCTGTAAAAA AAAAAAAAAA AAAAAAA 3657

B：氨基酸序列(SEQ ID NO：17)长度：903

1 MATSADSPSS PLGAEDLLSD SSEPPGLNQV SSEVTSQLYA SLRLSRQAEA

51 TARAQLYLPS TSPPHEGLDG FAQELSRSLS VGLEKNLKKK DGSKHIFEME

101 SVRGQLQTML QTSRDTAYRD PLIPGAGSER REEDSFDSDS TATLLNTRPL

151 QDLSPSSSAQ ALEELFPRYT SLRPGPPLNP PDFQGLRDAL DSEHTRRKHC

201 ERHIQSLQTR VLELQQQLAV AVAADRKKDT MIEQLDKTLA RVVEGWNRHE

251 AERTEVLRGL QEEHQAAELT RSKQQETVTR LEQSLSEAME ALNREQESAR

301 LQQRERETLE EERQALTLRL EAEQQRCCVL QEERDAARAG QLSEHRELET

351 LRAALEEERQ TWAQQEHQLK EHYQALQEES QAQLEREKEK SQREAQAAWE

401 TQHQLALVQS EVRRLEGELD TARRERDALQ LEMSLVQARY ESQRIQLESE

451 LAVQLEQRVT ERLAQAQESS LRQAASLREH HRKQLQDLSG QHQQELASQL

501 AQFKVEMAER EERQQQVAED YELRLAREQA QVCELQSGNQ QLEEQRVELV

551 ERLQAMLQAH WDEANQLLST TLPPPNPPAP PAGPSSPGPQ EPEKEERRVW

601 TMPPMAVALK PVLQQSREAR DELPGAPPVL CSSSSDLSLL LGPSFQSQHS

651 FQPLEPKPDL TSSTAGAFSA LGAFHPDHRA ERPFPEEDPG PDGEGLLKQG

701 LPPAQLEGLK NFLHQLLETV PQNNENPSVD LLPPKSGPLT VPSWEEAPQV

751 PRIPPPVHKT KVPLAMASSL FRVPEPPSSH SQGSGPSSGS PERGGDGLTF

801 PRQLMEVSQL LRLYQARGWG ALPAEDLLLY LKRLEHSGTD GRGDNVPRRN

851 TDSRLGEIPR KEIPSQAVPR RLATAPKTEK PPARKKSGHP APSSMRSRGG

901 VWR

克隆号：PP1221(SEQ ID NO：18)

起始编码子：857 ATG 终止编码子：3568 TGA蛋白质分子量：101219.36

1 G GCT GCC AAC GGT TTT GAG CGT AGG GGG AGG CGT GAG AGG GGG ATC 46

47 TCA GGG GAG GAG GTC AAT CGC TTG CCC CCC ACT TTG GCA AAT TGG GGA 94

95 CTG AGG ACT GGA AGG GTG GAG AGT AGG CGG AAC CAG GTG GTC GTC GGG 142

143 GCA GAG GAT CTC GGG CTA GGC TTG AGG GCG GCG TGC TTC TTA GGG ACG 190

191 ACT TAG GGC GTG ACT GAG GGT TCA CAA GGT TTC TTT TGG GGT GGT CGG 238

239 GAG GGA GAG ATT CTA GGG AAC AAG GAA GCT CGC TAT GGC TTT CTT GCC 286

287 AGG AGG GGT CGA AGG GAA AGT ACA AGG GAG CTG ACC CTG GGT AGA ACG 334

335 GGT GAA GGG ATG GGG GAG CGT GAG GTT CCG CCC TCT CTT GAG ACT GGA 382

383 ACC AAT TGG AGG GAC TAG TAG GGC AGG GGG ACA GAA ATT GGG CTC CTA 430

431 GTG GAT TTG GGT CCG TTT CCG TTG GGA CGT TTT GGG TGT GAG AAC TTA 478

479 AGA GCT CAG TTG ACC GGG GAT AGC CTG TGC CGG AGT TGA TCT GCA GCT 526

527 TCC AGC ACT CGT AGT CGG GAA GAG GAG CTT CAG CAG CGC TGT TGT CCC 574

575 ACA GTA GGT CTT CTG TCC GCA CCC GCT CTG CGC TGC ACC CTC TTA ACG 622

623 CTG TTC CCA GGA GCT GGG GAA AGG GAT GCT TTT GCC CAC TCC CAT GGC 670

671 CCC TGG AAC TGG TGG AAA CCT TTC CTC TAA CCA GAA AGC CTC GAT ATC 718

719 CTT AAT TCA CCA AGG ATC CTT GGC GTG GAG TCT TCC TCC CTT CTC CCA 766

767 AGT CTT TCT CCG TGA ACT TTT CCT CCT GGA CTT TGC TAA AGC AGA ACC 814

815 TCC CAG CTC TTT GCT GTC TCC GGT TGT CTC TTC CCT GTA TTC ATG GCA 862

1 Met Ala 2

863 ACA TCA GCT GAC AGC CCC AGT TCA CCC CTC GGG GCG GAG GAT CTC CTG 910

3 Thr Ser Ala Asp Ser Pro Ser Ser Pro Leu Gly Ala Glu Asp Leu Leu 18

911 AGT GAT TCA TCA GAA CCC CCT GGG CTC AAC CAA GTG TCG TCT GAA GTG 958

19 Ser Asp Ser Ser Glu Pro Pro Gly Leu Asn Gln Val Ser Ser Glu Val 34

959 ACC TCC CAG CTC TAT GCT TCT TTG CGC CTC AGC CGG CAG GCG GAG GCC 1006

35 Thr Ser Gln Leu Tyr Ala Ser Leu Arg Leu Ser Arg Gln Ala Glu Ala 50

1007 ACG GCC CGA GCC CAG CTG TAT TTA CCC TCC ACC TCC CCG CCT CAT GAA 1054

51 Thr Ala Arg Ala Gln Leu Tyr Leu Pro Ser Thr Ser Pro Pro His Glu 66

1055 GGG TTA GAC GGC TTC GCC CAA GAA TTG AGT CGA AGC TTG TCA GTC GGA 1102

67 Gly Leu Asp Gly Phe Ala Gln Glu Leu Ser Arg Ser Leu Ser Val Gly 82

1103 TTG GAA AAG AAC TTG AAG AAA AAG GAT GGT TCT AAG CAT ATC TTT GAG 1150

83 Leu Glu Lys Asn Leu Lys Lys Lys Asp Gly Ser Lys His Ile Phe Glu 98

1151 ATG GAA AGT GTT CGG GGT CAG CTC CAG ACC ATG CTC CAA ACC TCA CGT 1198

99 Met Glu Ser Val Arg Gly Gln Leu Gln Thr Met Leu Gln Thr Ser Arg 114

1199 GAT ACA GCC TAT CGG GAT CCT CTC ATT CCT GGC GCT GGC TCA GAG AGA 1246

115 Asp Thr Ala Tyr Arg Asp Pro Leu Ile Pro Gly Ala Gly Ser Glu Arg 130

1247 CGG GAA GAG GAC TCC TTT GAC AGT GAT AGC ACA GCC ACC TTG CTC AAC 1294

131 Arg Glu Glu Asp Ser Phe Asp Ser Asp Ser Thr Ala Thr Leu Leu Asn 146

1295 ACC CGG CCC CTG CAA GAC TTG TCT CCA TCT AGC TCA GCC CAA GCC CTG 1342

147 Thr Arg Pro Leu Gln Asp Leu Ser Pro Ser Ser Ser Ala Gln Ala Leu 162

1343 GAG GAG CTG TTT CCC CGC TAC ACC AGC CTT CGG CCA GGG CCT CCA CTC 1390

163 Glu Glu Leu Phe Pro Arg Tyr Thr Ser Leu Arg Pro Gly Pro Pro Leu 178

1391 AAT CCC CCA GAT TTT CAG GGG CTG AGA GAT GCA TTG GAT TCA GAG CAT 1438

179 Asn Pro Pro Asp Phe Gln Gly Leu Arg Asp Ala Leu Asp Ser Glu His 194

1439 ACC CGC CGC AAG CAT TGT GAG CGC CAT ATT CAG AGC CTG CAG ACC CGA 1486

195 Thr Arg Arg Lys His Cys Glu Arg His Ile Gln Ser Leu Gln Thr Arg 210

1487 GTG TTA GAG CTA CAG CAA CAA TTA GCC GTG GCT GTG GCT GCC GAC CGC 1534

211 Val Leu Glu Leu Gln Gln Gln Leu Ala Val Ala Val Ala Ala Asp Arg 226

1535 AAG AAA GAT ACC ATG ATT GAA CAA CTG GAC AAG ACC CTG GCC CGT GTG 1582

227 Lys Lys Asp Thr Met Ile Glu Gln Leu Asp Lys Thr Leu Ala Arg Val 242

1583 GTG GAG GGC TGG AAC CGG CAT GAG GCT GAG CGG ACA GAG GTT CTC AGG 1630

243 Val Glu Gly Trp Asn Arg His Glu Ala Glu Arg Thr Glu Val Leu Arg 258

1631 GGA CTT CAA GAG GAA CAC CAG GCA GCA GAG CTC ACC AGA AGC AAG CAG 1678

259 Gly Leu Gln Glu Glu His Gln Ala Ala Glu Leu Thr Arg Ser Lys Gln 274

1679 CAG GAG ACA GTA ACC CGC CTG GAA CAA AGC CTT TCT GAG GCC ATG GAG 1726

275 Gln Glu Thr Val Thr Arg Leu Glu Gln Ser Leu Ser Glu Ala Met Glu 290

1727 GCC CTG AAT CGT GAG CAG GAA AGT GCC AGA CTG CAG CAA CGG GAA AGA 1774

291 Ala Leu Asn Arg Glu Gln Glu Ser Ala Arg Leu Gln Gln Arg Glu Arg 306

1775 GAG ACA CTG GAG GAG GAA AGG CAA GCT CTG ACT CTG AGG TTG GAG GCA 1822

307 Glu Thr Leu Glu Glu Glu Arg Gln Ala Leu Thr Leu Arg Leu Glu Ala 322

1823 GAA CAG CAG CGG TGC TGT GTC CTG CAG GAA GAG CGG GAT GCA GCT CGG 1870

323 Glu Gln Gln Arg Cys Cys Val Leu Gln Glu Glu Arg Asp Ala Ala Arg 338

1871 GCT GGG CAA CTG AGT GAG CAT CGA GAG TTG GAG ACT CTT CGG GCT GCC 1918

339 Ala Gly Gln Leu Ser Glu His Arg Glu Leu Glu Thr Leu Arg Ala Ala 354

1919 CTA GAA GAA GAA CGG CAG ACC TGG GCC CAG CAA GAG CAC CAG CTT AAG 1966

355 Leu Glu Glu Glu Arg Gln Thr Trp Ala Gln Gln Glu His Gln Leu Lys 370

1967 GAA CAC TAC CAG GCG CTG CAG GAG GAG AGC CAG GCT CAG CTG GAA AGG 2014

371 Glu His Tyr Gln Ala Leu Gln Glu Glu Ser Gln Ala Gln Leu Glu Arg 386

2015 GAG AAG GAG AAG AGC CAG AGG GAA GCC CAG GCC GCC TGG GAG ACC CAG 2062

387 Glu Lys Glu Lys Ser Gln Arg Glu Ala Gln Ala Ala Trp Glu Thr Gln 402

2063 CAC CAG TTG GCA TTG GTG CAG TCT GAG GTG CGG CGG CTG GAA GGA GAG 2110

403 His Gln Leu Ala Leu Val Gln Ser Glu Val Arg Arg Leu Glu Gly Glu 418

2111 CTG GAT ACA GCT CGG AGA GAG AGA GAT GCC CTG CAG CTG GAA ATG AGC 2158

419 Leu Asp Thr Ala Arg Arg Glu Arg Asp Ala Leu Gln Leu Glu Met Ser 434

2159 TTG GTG CAG GCC CGG TAT GAA AGC CAG CGG ATC CAG CTG GAG TCG GAG 2206

435 Leu Val Gln Ala Arg Tyr Glu Ser Gln Arg Ile Gln Leu Glu Ser Glu 450

2207 CTG GCT GTG CAG CTG GAG CAG CGG GTG ACA GAG CGG CTG GCG CAG GCT 2254

451 Leu Ala Val Gln Leu Glu Gln Arg Val Thr Glu Arg Leu Ala Gln Ala 466

2255 CAG GAG AGC AGC CTA CGG CAA GCA GCC TCC CTC AGG GAA CAT CAC AGG 2302

467 Gln Glu Ser Ser Leu Arg Gln Ala Ala Ser Leu Arg Glu His His Arg 482

2303 AAG CAG CTG CAG GAC CTG AGT GGA CAG CAC CAG CAG GAG CTG GCC AGT 2350

483 Lys Gln Leu Gln Asp Leu Ser Gly Gln His Gln Gln Glu Leu Ala Ser 498

2351 CAG CTA GCT CAG TTC AAG GTG GAA ATG GCA GAA CGA GAG GAA CGG CAA 2398

499 Gln Leu Ala Gln Phe Lys Val Glu Met Ala Glu Arg Glu Glu Arg Gln 514

2399 CAG CAG GTG GCT GAG GAC TAC GAG CTC AGA CTG GCC CGG GAG CAA GCG 2446

515 Gln Gln Val Ala Glu Asp Tyr Glu Leu Arg Leu Ala Arg Glu Gln Ala 530

2447 CAA GTG TGC GAA CTG CAG AGT GGG AAC CAG CAG CTG GAG GAG CAG CGG 2494

531 Gln Val Cys Glu Leu Gln Ser Gly Asn Gln Gln Leu Glu Glu Gln Arg 546

2495 GTG GAG CTG GTG GAA AGA CTG CAG GCC ATG CTG CAG GCC CAC TGG GAT 2542

547 Val Glu Leu Val Glu Arg Leu Gln Ala Met Leu Gln Ala His Trp Asp 562

2543 GAG GCC AAC CAG CTG CTC AGC ACC ACT CTC CCG CCG CCC AAC CCT CCA 2590

563 Glu Ala Asn Gln Leu Leu Ser Thr Thr Leu Pro Pro Pro Asn Pro Pro 578

259l GCT CCT CCT GCT GGA CCC TCC AGC CCC GGG CCT CAG GAG CCC GAG AAG 2638

579 Ala Pro Pro Ala Gly Pro Ser Ser Pro Gly Pro Gln Glu Pro Glu Lys 594

2639 GAG GAG AGG AGG GTC TGG ACT ATG CCT CCC ATG GCC GTG GCC CTG AAG 2686

595 Glu Glu Arg Arg Val Trp Thr Met Pro Pro Met Ala Val Ala Leu Lys 610

2687 CCT GTA TTG CAG CAG AGC CGG GAA GCA AGG GAC GAG CTA CCT GGA GCG 2734

611 Pro Val Leu Gln Gln Ser Arg Glu Ala Arg Asp Glu Leu Pro Gly Ala 626

2735 CCT CCT GTT CTT TGC AGT TCC TCC TCA GAT CTT AGC CTC CTG TTG GGC 2782

627 Pro Pro Val Leu Cys Ser Ser Ser Ser Asp Leu Ser Leu Leu Leu Gly 642

2783 CCC TCT TTT CAG AGC CAG CAT TCT TTC CAG CCC CTG GAG CCC AAA CCA 2830

643 Pro Ser Phe Gln Ser Gln His Ser Phe Gln Pro Leu Glu Pro Lys Pro 658

2831 GAC CTC ACT TCA TCC ACA GCT GGG GCC TTC TCT GCA CTT GGG GCC TTC 2878

659 Asp Leu Thr Ser Ser Thr Ala Gly Ala Phe Ser Ala Leu Gly Ala Phe 674

2879 CAT CCC GAT CAT AGG GCA GAA AGG CCA TTC CCT GAG GAA GAT CCT GGA 2926

675 His Pro Asp His Arg Ala Glu Arg Pro Phe Pro Glu Glu Asp Pro Gly 690

2927 CCT GAC GGG GAG GGC CTC CTA AAG CAA GGG CTG CCG CCT GCT CAG CTG 2974

691 Pro Asp Gly Glu Gly Leu Leu Lys Gln Gly Leu Pro Pro Ala Gln Leu 706

2975 GAG GGC CTC AAG AAT TTT TTG CAC CAG TTG CTG GAG ACA GTG CCC CAG 3022

707 Glu Gly Leu Lys Asn Phe Leu His Gln Leu Leu Glu Thr Val Pro Gln 722

3023 AAC AAT GAG AAC CCT TCT GTC GAC CTG TTG CCC CCT AAG TCT GGT CCT 3070

723 Asn Asn Glu Asn Pro Ser Val Asp Leu Leu Pro Pro Lys Ser Gly Pro 738

3071 CTG ACT GTC CCA TCT TGG GAG GAA GCC CCT CAA GTG CCA CGT ATT CCA 3118

739 Leu Thr Val Pro Ser Trp Glu Glu Ala Pro Gln Val Pro Arg Ile Pro 754

3119 CCG CCT GTC CAC AAA ACC AAA GTT CCC TTA GCC ATG GCA TCC AGT CTT 3166

755 Pro Pro Val His Lys Thr Lys Val Pro Leu Ala Met Ala Ser Ser Leu 770

3167 TTC CGG GTC CCT GAG CCT CCC TCC TCC CAT TCA CAA GGC AGT GGT CCC 3214

771 Phe Arg Val Pro Glu Pro Pro Ser Ser His Ser Gln Gly Ser Gly Pro 786

3215 AGC AGT GGT TCC CCA GAG AGA GGT GGA GAT GGG CTT ACA TTC CCA AGG 3262

787 Ser Ser Gly Ser Pro Glu Arg Gly Gly Asp Gly Leu Thr Phe Pro Arg 802

3263 CAG CTG ATG GAG GTG TCT CAA CTG TTG CGA CTC TAC CAG GCT CGG GGC 3310

803 Gln Leu Met Glu Val Ser Gln Leu Leu Arg Leu Tyr Gln Ala Arg Gly 818

3311 TGG GGG GCT CTG CCT GCT GAG GAT CTC CTG CTC TAC CTG AAG AGG CTG 3358

819 Trp Gly Ala Leu Pro Ala Glu Asp Leu Leu Leu Tyr Leu Lys Arg Leu 834

3359 GAA CAC AGC GGG ACT GAT GGC CGA GGG GAT AAT GTC CCC AGA AGG AAC 3406

835 Glu His Ser Gly Thr Asp Gly Arg Gly Asp Asn Val Pro Arg Arg Asn 850

3407 ACA GAC TCC CGC TTG GGT GAG ATC CCC CGG AAA GAG ATT CCC TCC CAG 3454

851 Thr Asp Ser Arg Leu Gly Glu Ile Pro Arg Lys Glu Ile Pro Ser Gln 866

3455 GCT GTC CCT CGC CGC CTT GCT ACA GCC CCC AAG ACT GAA AAA CCT CCC 3502

867 Ala Val Pro Arg Arg Leu Ala Thr Ala Pro Lys Thr Glu Lys Pro Pro 882

3503 GCA CGG AAG AAA AGT GGG CAC CCT GCC CCG AGT AGC ATG AGG AGC CGG 3550

883 Ala Arg Lys Lys Ser Gly His Pro Ala Pro Ser Ser Met Arg Ser Arg 898

3551 GGG GGA GTC TGG AGA TGA GCC CCC CTA CCC TCT CTC CTC TTT GTT CTC 3598

899 Gly Gly Val Trp Arg *** 904

3599 TCA TTG TTG TTA TTT TAA TAA ATG CTC AGT AGT CTG TAA AAA AAA AAA 3646

3647 AAA AAA AAA AA 3657

7. PP2250

A：核苷酸序列(SEQ ID NO：19)长度：2745

GCCGCGCTGG CATTTTCTCC TGGACAAGGA GAGAGTGCGG CTGCTGAGAG CCGAGCCCAG 60

CAATCCCGAT CCTCTGAGTC GTGAAGAAGG GAGGCAGCGA GGGGGTTGGG GTTGGGGCCT 120

GAGGCAAGCC CCCAGGCTCC GCTCTTGCCA GAGGGACAGG AGCCATGGCT CAGAAAATGG 180

ACTGTGGTGC GGGCCTCCTC GGCTTCCAGG CTGAGGCCTC CGTAGAAGAC AGCGCCTTGC 240

TTATGCAGAC CTTGATGGAG GCCATCCAGA TCTCAGAGGC TCCACCTACT AACCAGGCCA 300

CCGCAGCTGC TAGTCCCCAG AGTTCACAGC CCCCAACTGC CAATGAGATG GCTGACATTC 360

AGGTTTCAGC AGCTGCCGCT AGGCCTAAGT CAGCCTTTAA AGTCCAGAAT GCCACCACAA 420

AAGGCCCAAA TGGTGTCTAT GATTTCTCTC AGGCTCATAA TGCCAAGGAT GTGCCCAACA 480

CGCAGCCCAA GGCAGCCTTT AAGTCCCAAA ATGCTACCCC AAAGGGTCCA AATGCTGCCT 540

ATGATTTTTC CCAGGCAGCA ACCACTGGTG AGTTAGCTGC TAACAAGTCT GAGATGGCCT 600

TCAAGGCCCA GAATGCCACT ACTAAAGTGG GCCCAAATGC CACCTACAAT TTCTCTCAGT 660

CTCTCAATGC CAATGACCTG GCCAACAGCA GGCCTAAGAC CCCTTTCAAG GCTTGGAATG 720

ATACCACTAA GGCCCCAACA GCTGATACCC AGACCCAGAA TGTAAATCAG GCCAAAATGG 780

CCACTTCCCA GGCTGACATA GAGACCGACC CAGGTATCTC TGAACCTGAC GGTGCAACTG 840

CACAGACATC AGCAGATGGT TCCCAGGCTC AGAATCTGGA GTCCCGGACA ATAATTCGGG 900

GCAAGAGGAC CCGCAAGATT AATAACTTGA ATGTTGAAGA GAACAGCAGT GGGGATCAGA 960

GGCGGGCCCC ACTGGCTGCA GGGACCTGGA GGTCTGCACC AGTTCCAGTG ACCACTCAGA 1020

ACCCACCTGG CGCACCCCCC AATGTGCTCT GGCAGACGCC ATTGGCTTGG CAGAACCCCT 1080

CAGGCTGGCA AAACCAGACA GCCAGGCAGA CCCCACCAGC ACGTCAGAGC CCTCCAGCTA 1140

GGCAGACCCC ACCAGCCTGG CAGAACCCAG TCGCTTGGCA GAACCCAGTG ATTTGGCCAA 1200

ACCCAGTAAT CTGGCAGAAC CCAGTGATCT GGCCAAACCC CATTGTCTGG CCCGGCCCTG 1260

TTGTCTGGCC GAATCCACTG GCCTGGCAGA ATCCACCTGG ATGGCAGACT CCACCTGGAT 1320

GGCAGACCCC ACCGGGCTGG CAGGGTCCTC CAGACTGGCA AGGTCCTCCT GACTGGCCGC 1380

TACCACCCGA CTGGCCACTG CCACCTGATT GGCCACTTCC CACTGACTGG CCACTACCAC 1440

CTGACTGGAT CCCCGCTGAT TGGCCAATTC CACCTGACTG GCAGAACCTG CGCCCCTCGC 1500

CTAACCTGCG CCCTTCTCCC AACTCGCGTG CCTCACAGAA CCCAGGTGCT GCACAGCCCC 1560

GAGATGTGGC CCTTCTTCAG GAAAGAGCAA ATAAGTTGGT CAAGTACTTG ATGCTTAAGG 1620

ACTACACAAA GGTGCCCATC AAGCGCTCAG AAATGCTGAG AGATATCATC CGTGAATACA 1680

CTGATGTTTA TCCAGAAATC ATTGAACGTG CATGCTTTGT CCTAGAGAAG AAATTTGGGA 1740

TTCAACTGAA AGAAATTGAC AAAGAAGAAC ACCTGTATAT TCTCATCAGT ACCCCCGAGT 1800

CCCTGGCTGG CATACTGGGA ACGACCAAAG ACACACCCAA GCTCGGTCTC CTCTTGGTGA 1860

TTCTGGGTGT CATCTTCATG AATGGCAACC GTGCCAGTGA GGCTGTCCTC TGGGAGGCAC 1920

TACGCAAGAT GGGACTGCGT CCTGGGGTGA GACATCCCCT CCTTGGAGAT CTAAGGAAAC 1980

TTCTCACCTA TGAGTTTGTA AAGCAGAAAT ACCTGGACTA CAGACGAGTG CCCAACAGCA 2040

ACCCCCCGGA GTATGAGTTC CTCTGGGGCC TCCGTTCCTA CCATGAGACT AGCAAGATGA 2100

AAGTGCTGAG ATTCATTGCA GAGGTTCAGA AAAGAGACCC TCGTGACTGG ACTGCACAGT 2160

TCATGGAGGC TGCAGATGAG GCCTTGGATG CTCTGGATGC TGCTGCAGCT GAGGCCGAAG 2220

CCAGGGCTGA AGCAAGAACC CGCATGGGAA TTGGAGATGA GGCTGTGTCT GGGCCCTGGA 2280

GCTGGGATGA CATTGAGTTT GAGCTGCTGA CCTGGGATGA GGAAGGAGAT TTTGGAGATC 2340

CCTGGTCCAG AATTCCATTT ACCTTCTGGG CCAGATACCA CCAGAATGCC CGCTCCAGAT 2400

TCCCTCAGAC CTTTGCCGGT CCCATTATTG GTCCTGGTGG TACAGCCAGT GCCAACTTCG 2460

CTGCCAACTT TGGTGCCATT GGTTTCTTCT GGGTTGAGTG AGATGTTGGA TATTGCTATC 2520

AATCGCAGTA GTCTTTCCCC TGTGTGAGGC TGAAGCCTCA GATTCCTTCT AAACACAGCT 2580

ATCTAGAGAG CCACATCCTG TTGACTGAAA GTGGCATGCA AGATAAATTT ATTTGCTGTT 2640

CCTTGTCTAC TGCTTTTTTT CCCCTTGTGT GCTGTCAAGT TTTGGTATCA GAAATAAACA 2700

TTGAAATTGC AAAGTGAAAA AAAAAAAAAA AAAAAAAAAA AAAAA 2745

B：氨基酸序列(SEQ IDNO：20)长度：779

1 MAQKMDCGAG LLGFQAEASV EDSALLMQTL MEAIQISEAP PTNQATAAAS

51 PQSSQPPTAN EMADIQVSAA AARPKSAFKV QNATTKGPNG VYDFSQAHNA

101 KDVPNTQPKA AFKSQNATPK GPNAAYDFSQ AATTGELAAN KSEMAFKAQN

151 ATTKVGPNAT YNFSQSLNAN DLANSRPKTP FKAWNDTTKA PTADTQTQNV

201 NQAKMATSQA DIETDPGISE PDGATAQTSA DGSQAQNLES RTIIRGKRTR

251 KINNLNVEEN SSGDQRRAPL AAGTWRSAPV PVTTQNPPGA PPNVLWQTPL

301 AWQNPSGWQN QTARQTPPAR QSPPARQTPP AWQNPVAWQN PVIWPNPVIW

351 QNPVIWPNPI VWPGPVVWPN PLAWQNPPGW QTPPGWQTPP GWQGPPDWQG

401 PPDWPLPPDW PLPPDWPLPT DWPLPPDWIP ADWPIPPDWQ NLRPSPNLRP

451 SPNSRASQNP GAAQPRDVAL LQERANKLVK YLMLKDYTKV PIKRSEMLRD

501 IIREYTDVYP EIIERACFVL EKKFGIQLKE IDKEEHLYIL ISTPESLAGI

551 LGTTKDTPKL GLLLVILGVI FMNGNRASEA VLWEALRKMG LRPGVRHPLL

601 GDLRKLLTYE FVKQKYLDYR RVPNSNPPEY EFLWGLRSYH ETSKMKVLRF

651 IAEVQKRDPR DWTAQFMEAA DEALDALDAA AAEAEARAEA RTRMGIGDEA

701 VSGPWSWDDI EFELLTWDEE GDFGDPWSRI PFTFWARYHQ NARSRFPQTF

751 AGPIIGPGGT ASANFAANFG AIGFFWVE*

克隆号：PP2250(SEQ ID NO：21)

起始编码子：165 ATG 终止编码子：2501 TGA蛋白质分子量：86156.01

1 GC CGC GCT GGC ATT TTC TCC TGG ACA AGG AGA GAG TGC GGC TGC TGA 47

48 GAG CCG AGC CCA GCA ATC CCG ATC CTC TGA GTC GTG AAG AAG GGA GGC 95

96 AGC GAG GGG GTT GGG GTT GGG GCC TGA GGC AAG CCC CCA GGC TCC GCT 143

144 CTT GCC AGA GGG ACA GGA GCC ATG GCT CAG AAA ATG GAC TGT GGT GCG 191

1 Met ALa Gln Lys Met Asp Cys Gly Ala 9

192 GGC CTC CTC GGC TTC CAG GCT GAG GCC TCC GTA GAA GAC AGC GCC TTG 239

10 Gly Leu Leu Gly Phe Gln Ala Glu Ala Ser Val Glu Asp Ser Ala Leu 25

240 CTT ATG CAG ACC TTG ATG GAG GCC ATC CAG ATC TCA GAG GCT CCA CCT 287

26 Leu Met Gln Thr Leu Met Glu Ala Ile Gln Ile Ser Glu Ala Pro Pro 41

288 ACT AAC CAG GCC ACC GCA GCT GCT AGT CCC CAG AGT TCA CAG CCC CCA 335

42 Thr Asn Gln Ala Thr Ala Ala Ala Ser Pro Gln Ser Ser Gln Pro Pro 57

336 ACT GCC AAT GAG ATG GCT GAC ATT CAG GTT TCA GCA GCT GCC GCT AGG 383

58 Thr Ala Asn Glu Met Ala Asp Ile Gln Val Ser Ala Ala Ala Ala Arg 73

384 CCT AAG TCA GCC TTT AAA GTC CAG AAT GCC ACC ACA AAA GGC CCA AAT 431

74 Pro Lys Ser Ala Phe Lys Val Gln Asn Ala Thr Thr Lys Gly Pro Asn 89

432 GGT GTC TAT GAT TTC TCT CAG GCT CAT AAT GCC AAG GAT GTG CCC AAC 479

90 Gly Val Tyr Asp Phe Ser Gln Ala His Asn Ala Lys Asp Val Pro Asn 105

480 ACG CAG CCC AAG GCA GCC TTT AAG TCC CAA AAT GCT ACC CCA AAG GGT 527

106 Thr Gln Pro Lys Ala Ala Phe Lys Ser Gln Asn Ala Thr Pro Lys Gly 121

528 CCA AAT GCT GCC TAT GAT TTT TCC CAG GCA GCA ACC ACT GGT GAG TTA 575

122 Pro Asn Ala Ala Tyr Asp Phe Ser Gln Ala Ala Thr Thr Gly Glu Leu 137

576 GCT GCT AAC AAG TCT GAG ATG GCC TTC AAG GCC CAG AAT GCC ACT ACT 623

138 Ala Ala Asn Lys Ser Glu Met Ala Phe Lys Ala Gln Asn Ala Thr Thr 153

624 AAA GTG GGC CCA AAT GCC ACC TAC AAT TTC TCT CAG TCT CTC AAT GCC 671

154 Lys Val Gly Pro Asn Ala Thr Tyr Asn Phe Ser Gln Ser Leu Asn Ala 169

672 AAT GAC CTG GCC AAC AGC AGG CCT AAG ACC CCT TTC AAG GCT TGG AAT 719

170 Asn Asp Leu Ala Asn Ser Arg Pro Lys Thr Pro Phe Lys Ala Trp Asn 185

720 GAT ACC ACT AAG GCC CCA ACA GCT GAT ACC CAG ACC CAG AAT GTA AAT 767

186 Asp Thr Thr Lys Ala Pro Thr Ala Asp Thr Gln Thr Gln Asn Val Asn 201

768 CAG GCC AAA ATG GCC ACT TCC CAG GCT GAC ATA GAG ACC GAC CCA GGT 815

202 Gln Ala Lys Met Ala Thr Ser Gln Ala Asp Ile Glu Thr Asp Pro Gly 217

816 ATC TCT GAA CCT GAC GGT GCA ACT GCA CAG ACA TCA GCA GAT GGT TCC 863

218 Ile Ser Glu Pro Asp Gly Ala Thr Ala Gln Thr Ser Ala Asp Gly Ser 233

864 CAG GCT CAG AAT CTG GAG TCC CGG ACA ATA ATT CGG GGC AAG AGG ACC 911

234 Gln Ala Gln Asn Leu Glu Ser Arg Thr Ile Ile Arg Gly Lys Arg Thr 249

912 CGC AAG ATT AAT AAC TTG AAT GTT GAA GAG AAC AGC AGT GGG GAT CAG 959

250 Arg Lys Ile Asn Asn Leu Asn Val Glu Glu Asn Ser Ser Gly Asp Gln 265

960 AGG CGG GCC CCA CTG GCT GCA GGG ACC TGG AGG TCT GCA CCA GTT CCA 1007

266 Arg Arg Ala Pro Leu Ala Ala Gly Thr Trp Arg Ser Ala Pro Val Pro 281

1008 GTG ACC ACT CAG AAC CCA CCT GGC GCA CCC CCC AAT GTG CTC TGG CAG 1055

282 Val Thr Thr Gln Asn Pro Pro Gly Ala Pro Pro Asn Val Leu Trp Gln 297

1056 ACG CCA TTG GCT TGG CAG AAC CCC TCA GGC TGG CAA AAC CAG ACA GCC 1103

298 Thr Pro Leu Ala Trp Gln Asn Pro Ser Gly Trp Gln Asn Gln Thr Ala 313

1104 AGG CAG ACC CCA CCA GCA CGT CAG AGC CCT CCA GCT AGG CAG ACC CCA 1151

314 Arg Gln Thr Pro Pro Ala Arg Gln Ser Pro Pro Ala Arg Gln Thr Pro 329

1152 CCA GCC TGG CAG AAC CCA GTC GCT TGG CAG AAC CCA GTG ATT TGG CCA 1199

330 Pro Ala Trp Gln Asn Pro Val Ala Trp Gln Asn Pro Val Ile Trp Pro 345

1200 AAC CCA GTA ATC TGG CAG AAC CCA GTG ATC TGG CCA AAC CCC ATT GTC 1247

346 Asn Pro Val Ile Trp Gln Asn Pro Val Ile Trp Pro Asn Pro Ile Val 361

1248 TGG CCC GGC CCT GTT GTC TGG CCG AAT CCA CTG GCC TGG CAG AAT CCA 1295

362 Trp Pro Gly Pro Val Val Trp Pro Asn Pro Leu Ala Trp Gln Asn Pro 377

1296 CCT GGA TGG CAG ACT CCA CCT GGA TGG CAG ACC CCA CCG GGC TGG CAG 1343

378 Pro Gly Trp Gln Thr Pro Pro Gly Trp Gln Thr Pro Pro Gly Trp Gln 393

1344 GGT CCT CCA GAC TGG CAA GGT CCT CCT GAC TGG CCG CTA CCA CCC GAC 1391

394 Gly Pro Pro Asp Trp Gln Gly Pro Pro Asp Trp Pro Leu Pro Pro Asp 409

1392 TGG CCA CTG CCA CCT GAT TGG CCA CTT CCC ACT GAC TGG CCA CTA CCA 1439

410 Trp Pro Leu Pro Pro Asp Trp Pro Leu Pro Thr Asp Trp Pro Leu Pro 425

1440 CCT GAC TGG ATC CCC GCT GAT TGG CCA ATT CCA CCT GAC TGG CAG AAC 1487

426 Pro Asp Trp Ile Pro Ala Asp Trp Pro Ile Pro Pro Asp Trp Gln Asn 441

1488 CTG CGC CCC TCG CCT AAC CTG CGC CCT TCT CCC AAC TCG CGT GCC TCA 1535

442 Leu Arg Pro Ser Pro Asn Leu Arg Pro Ser Pro Asn Ser Arg Ala Ser 457

1536 CAG AAC CCA GGT GCT GCA CAG CCC CGA GAT GTG GCC CTT CTT CAG GAA 1583

458 Gln Asn Pro Gly Ala Ala Gln Pro Arg Asp Val Ala Leu Leu Gln Glu 473

1584 AGA GCA AAT AAG TTG GTC AAG TAC TTG ATG CTT AAG GAC TAC ACA AAG 1631

474 Arg Ala Asn Lys Leu Val Lys Tyr Leu Met Leu Lys Asp Tyr Thr Lys 489

1632 GTG CCC ATC AAG CGC TCA GAA ATG CTG AGA GAT ATC ATC CGT GAA TAC 1679

490 Val Pro Ile Lys Arg Ser Glu Met Leu Arg Asp Ile Ile Arg Glu Tyr 505

1680 ACT GAT GTT TAT CCA GAA ATC ATT GAA CGT GCA TGC TTT GTC CTA GAG 1727

506 Thr Asp Val Tyr Pro Glu Ile Ile Glu Arg Ala Cys Phe Val Leu Glu 521

1728 AAG AAA TTT GGG ATT CAA CTG AAA GAA ATT GAC AAA GAA GAA CAC CTG 1775

522 Lys Lys Phe Gly Ile Gln Leu Lys Glu Ile Asp Lys Glu Glu His Leu 537

1776 TAT ATT CTC ATC AGT ACC CCC GAG TCC CTG GCT GGC ATA CTG GGA ACG 1823

538 Tyr Ile Leu Ile Ser Thr Pro Glu Ser Leu Ala Gly Ile Leu Gly Thr 553

1824 ACC AAA GAC ACA CCC AAG CrC GGT CTC CTC TTG GTG ATT CTG GGT GTC 1871

554 Thr Lys Asp Thr Pro Lys Leu Gly Leu Leu Leu Val Ile Leu Gly Val 569

1872 ATC TTC ATG AAT GGC AAC CGT GCC AGT GAG GCT GTC CTC TGG GAG GCA 1919

570 Ile Phe Met Asn Gly Asn Arg Ala Ser Glu Ala Val Leu Trp Glu Ala 585

1920 CTA CGC AAG ATG GGA CTG CGT CCT GGG GTG AGA CAT CCC CTC CTT GGA 1967

586 Leu Arg Lys Met Gly Leu Arg Pro Gly Val Arg His Pro Leu Leu Gly 601

1968 GAT CTA AGG AAA CTT CTC ACC TAT GAG TTT GTA AAG CAG AAA TAC CTG 2015

602 Asp Leu Arg Lys Leu Leu Thr Tyr Glu Phe Val Lys Gln Lys Tyr Leu 617

2016 GAC TAC AGA CGA GTG CCC AAC AGC AAC CCC CCG GAG TAT GAG TTC CTC 2063

618 Asp Tyr Arg Arg Val Pro Asn Ser Asn Pro Pro Glu Tyr Glu Phe Leu 633

2064 TGG GGC CTC CGT TCC TAC CAT GAG ACT AGC AAG ATG AAA GTG CTG AGA 2111

634 Trp Gly Leu Arg Ser Tyr His Glu Thr Ser Lys Met Lys Val Leu Arg 649

2112 TTC ATT GCA GAG GTT CAG AAA AGA GAC CCT CGT GAC TGG ACT GCA CAG 2159

650 Phe Ile Ala Glu Val Gln Lys Arg Asp Pro Arg Asp Trp Thr Ala Gln 665

2160 TTC ATG GAG GCT GCA GAT GAG GCC TTG GAT GCT CTG GAT GCT GCT GCA 2207

666 Phe Met Glu Ala Ala Asp Glu Ala Leu Asp Ala Leu Asp Ala Ala Ala 681

2208 GCT GAG GCC GAA GCC AGG GCT GAA GCA AGA ACC CGC ATG GGA ATT GGA 2255

682 Ala Glu Ala Glu Ala Arg Ala Glu Ala Arg Thr Arg Met Gly Ile Gly 697

2256 GAT GAG GCT GTG TCT GGG CCC TGG AGC TGG GAT GAC ATT GAG TTT GAG 2303

698 Asp Glu Ala Val Ser Gly Pro Trp Ser Trp Asp Asp Ile Glu Phe Glu 713

2304 CTG CTG ACC TGG GAT GAG GAA GGA GAT TTT GGA GAT CCC TGG TCC AGA 2351

714 Leu Leu Thr Trp Asp Glu Glu Gly Asp Phe Gly Asp Pro Trp Ser Arg 729

2352 ATT CCA TTT ACC TTC TGG GCC AGA TAC CAC CAG AAT GCC CGC TCC AGA 2399

730 Ile Pro Phe Thr Phe Trp Ala Arg Tyr His Gln Asn Ala Arg Ser Arg 745

2400 TTC CCT CAG ACC TTT GCC GGT CCC ATT ATT GGT CCT GGT GGT ACA GCC 2447

746 Phe Pro Gln Thr Phe Ala Gly Pro Ile Ile Gly Pro Gly Gly Thr Ala 761

2448 AGT GCC AAC TTC GCT GCC AAC TTT GGT GCC ATT GGT TTC TTC TGG GTT 2495

762 Ser Ala Asn Phe Ala Ala Asn Phe Gly Ala Ile Gly Phe Phe Trp Val 777

2496 GAG TGA GAT GTT GGA TAT TGC TAT CAA TCG CAG TAG TCT TTC CCC TGT 2543

78 Glu *** 779

2544 GTG AGG CTG AAG CCT CAG ATT CCT TCT AAA CAC AGC TAT CTA GAG AGC 2591

2592 CAC ATC CTG TTG ACT GAA AGT GGC ATG CAA GAT AAA TTT ATT TGC TGT 2639

2640 TCC TTG TCT ACT GCT TTT TTT CCC CTT GTG TGC TGT CAA GTT TTG GTA 2687

2688 TCA GAA ATA AAC ATT GAA ATT GCA AAG TGA AAA AAA AAA AAA AAA AAA 2735

2736 AAA AAA AAA A 2745

Claims

1.一种分离的多核苷酸，其特征在于，它包含一核苷酸序列，该核苷酸序列选自下组：

(a)编码以下多肽的多核苷酸，所述的多肽含有选自下组的氨基酸序列的多肽：SEQ IDNO：2、SEQ ID NO：5、SEQ ID NO：8、SEQ ID NO：11、SEQ ID NO：14、SEQ ID NO：17、或SEQ IDNO：20；

(b)与多核苷酸(a)互补的多核苷酸。

2.如权利要求1所述的多核苷酸，其特征在于，该多核苷酸编码的多肽具有选自下组的氨基酸序列：SEQ ID NO：2、SEQ ID NO：5、SEQ ID NO：8、SEQ ID NO：11、SEQ ID NO：14、SEQ IDNO：17、SEQ ID NO：20。

3.如权利要求1所述的多核苷酸，其特征在于，该多核苷酸的序列选自下组：

SEQ ID NO：3、SEQ ID NO：6、SEQ ID NO：9、SEQ ID NO：12、SEQ ID NO：15、SEQ ID NO：18、SEQ ID NO：21的编码区序列或全长序列。

4.一种载体，其特征在于，它含有权利要求1所述的多核苷酸。

5.一种遗传工程化的宿主细胞，其特征在于，它是选自下组的一种宿主细胞：

(a)用权利要求4所述的载体转化或转导的宿主细胞；

(b)用权利要求1所述的多核苷酸转化或转导的宿主细胞。