CN1199999C - 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 - Google Patents

具有促进3t3细胞转化功能的新的人蛋白及其编码序列 Download PDF

Info

Publication number
CN1199999C
CN1199999C CNB011053224A CN01105322A CN1199999C CN 1199999 C CN1199999 C CN 1199999C CN B011053224 A CNB011053224 A CN B011053224A CN 01105322 A CN01105322 A CN 01105322A CN 1199999 C CN1199999 C CN 1199999C
Authority
CN
China
Prior art keywords
ccc
gcc
ctg
gag
cag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB011053224A
Other languages
English (en)
Other versions
CN1369505A (zh
Inventor
顾健人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cancer Institute
Original Assignee
Shanghai Cancer Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cancer Institute filed Critical Shanghai Cancer Institute
Priority to CNB011053224A priority Critical patent/CN1199999C/zh
Publication of CN1369505A publication Critical patent/CN1369505A/zh
Application granted granted Critical
Publication of CN1199999C publication Critical patent/CN1199999C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一类新的具有促进3T3细胞转化功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有促进3T3细胞转化功能的人蛋白的多核苷酸的用途。

Description

具有促进3T3细胞转化功能的新的人蛋白及其编码序列
技术领域
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有促进3T3细胞转化功能的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
背景技术
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究与癌细胞生长相关的人蛋白及其激动剂/抑制剂。
发明内容
本发明的目的是提供一类新的具有促进3T3细胞转化功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有促进3T3细胞转化功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有促进3T3细胞转化功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、6、9、12、15、18、21、24、27、30的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有促进3T3细胞转化功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有促进3T3细胞转化功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有促进3T3细胞转化功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有促进3T3细胞转化功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有促进3T3细胞转化功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可用于促进细胞的生长。本发明还提供了一种药物组合物,它含有安全有效量的针对本发明的具有促进3T3细胞转化功能的蛋白多肽的拮抗剂(如抗体)以及药学上可接受的载体。该药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
3T3细胞是一种小鼠成纤维细胞(J.Cell.Biol.,17:299,1963)。在癌症研究领域中,常将外源基因(尤其是人基因)引入3T3细胞,观察其对3T3细胞生长的影响情况。通常认为,对3T3细胞生长(或恶性转化)有影响的基因是癌症相关基因,其中对3T3细胞生长或转化有抑制作用的基因大多是抑癌基因,而对3T3细胞生长或转化有促进作用的基因大多是(原)癌基因。
本发明采用大规模cDNA克隆转染小鼠胚胎成纤维细胞3T3,在获得具有促进生长作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有促进3T3细胞转化功能的蛋白对3T3细胞具有促进克隆形成的作用,其促进率≥50%。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有促进3T3细胞转化功能的蛋白或多肽”是指具有促进3T3细胞转化功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有促进3T3细胞转化功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有促进3T3细胞转化功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有促进3T3细胞转化功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP3659蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。再以PP6318蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。对于其他具有促进3T3细胞转化功能的蛋白,依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽(以PP3659蛋白为例)有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有促进3T3细胞转化功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有促进3T3细胞转化功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring HarborLaboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有促进3T3细胞转化功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有促进3T3细胞转化功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明多核苷酸的载体,以及用本发明的载体或具有促进3T3细胞转化功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有促进3T3细胞转化功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有促进3T3细胞转化功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有促进3T3细胞转化功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有促进3T3细胞转化功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、早期和晚期SV40启动子和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有促进3T3细胞转化功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有促进3T3细胞转化功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有促进3T3细胞转化功能的蛋白功能的抗体、多肽或其它配体。例如,该抗体可用于治疗癌症或细胞异常增殖。用重组表达的本发明蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有促进3T3细胞转化功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有促进3T3细胞转化功能的人蛋白的药剂的方法。激动剂提高具有促进3T3细胞转化功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。
具有促进3T3细胞转化功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有促进3T3细胞转化功能的人蛋白的拮抗剂可以与具有促进3T3细胞转化功能的人蛋白结合并消除其功能,或是抑制具有促进3T3细胞转化功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有促进3T3细胞转化功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有促进3T3细胞转化功能的蛋白加入生物分析测定中,通过测定化合物影响具有促进3T3细胞转化功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明蛋白的拮抗剂可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有促进3T3细胞转化功能的蛋白或其特异性抗体,可按有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有促进3T3细胞转化功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有促进3T3细胞转化功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有促进3T3细胞转化功能的蛋白的无表达或异常/无活性的具有促进3T3细胞转化功能的蛋白的表达所致的细胞发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有促进3T3细胞转化功能的蛋白,以抑制内源性的具有促进3T3细胞转化功能的蛋白活性。例如,一种变异的具有促进3T3细胞转化功能的蛋白可以是缩短的、缺失了信号传导功能域的具有促进3T3细胞转化功能的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有促进3T3细胞转化功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有促进3T3细胞转化功能的蛋白基因转移至细胞内。构建携带具有促进3T3细胞转化功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有促进3T3细胞转化功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有促进3T3细胞转化功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。由于本发明蛋白具有促进3T3细胞转化的功能,因此本发明蛋白编码序列的反义序列,可被引入细胞以抑制细胞的异常增殖(如癌变)。
本发明还提供了针对具有促进3T3细胞转化功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗具有促进3T3细胞转化功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有促进3T3细胞转化功能的人蛋白。
与具有促进3T3细胞转化功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有促进3T3细胞转化功能的人蛋白相关的疾病。给予适当剂量的抗体可以阻断具有促进3T3细胞转化功能的人蛋白的产生或活性,从而抑制癌细胞的生长和/或细胞的异常增殖。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有促进3T3细胞转化功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭有关的阳性细胞(如癌细胞)。
多克隆抗体的生产可用具有促进3T3细胞转化功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有促进3T3细胞转化功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler andMilstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.Pat No.4946778)也可用于生产抗具有促进3T3细胞转化功能的人蛋白的单链抗体。
能与具有促进3T3细胞转化功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有促进3T3细胞转化功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有促进3T3细胞转化功能的人蛋白水平的诊断试验方法。这些试验为本领域所熟知,且包括FISH测定和放射免疫测定。试验中所检测的具有促进3T3细胞转化功能的蛋白水平,可以用作解释具有促进3T3细胞转化功能的蛋白在各种疾病中的重要性和用于诊断具有促进3T3细胞转化功能的蛋白起作用的疾病。
具有促进3T3细胞转化功能的蛋白的多聚核苷酸可用于具有促进3T3细胞转化功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有促进3T3细胞转化功能的蛋白的多聚核苷酸可用于检测具有促进3T3细胞转化功能的蛋白的表达与否或在疾病状态下具有促进3T3细胞转化功能的蛋白的异常表达。如具有促进3T3细胞转化功能的蛋白DNA序列可用于对活检标本的杂交以判断具有促进3T3细胞转化功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(即基因芯片)上,用于分析组织中基因的差异表达分析和基因诊断。用具有促进3T3细胞转化功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有促进3T3细胞转化功能的蛋白的转录产物。
检测具有促进3T3细胞转化功能的蛋白基因的突变也可用于诊断具有促进3T3细胞转化功能的蛋白相关的疾病。具有促进3T3细胞转化功能的蛋白突变的形式包括与正常野生型具有促进3T3细胞转化功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而现在只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。
本发明的具有促进3T3细胞转化功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有促进3T3细胞转化功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。注意,在核苷酸和氨基酸组合序列中,(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿。
具体实施方式
实施例1:cDNA基因的获得及对3T3细胞克隆形成的促进作用
PP3659、PP6318、PP6425、PP7518、PP9484、PP9964、PP10394、PP10436、PP12613和PP12708是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染小鼠成纤维细胞3T3。100ng DNA酒精沉淀干燥后,加6μlH2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的3T3细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克隆形成,计数。发现以上克隆有促进细胞克隆形成作用,结果如下表所示。
          cDNA克隆转染细胞(3T3)克隆形成情况
cDNA克隆名称 cDNA克隆数(三个重复) 空载体克隆数(三个重复)
    PP3659PP6318PP6425PP7518PP9484PP9964PP10394PP10436PP12613PP12708     59    60    6264    69    6068    62    6162    65    6866    67    6068    59    5463    59    6854    59    6263    62    6558    54    53     27    29    3027    29    3027    29    3027    29    3027    29    3027    29    3027    29    3027    29    3027    29    3027    29    30
对cDNA克隆采用双脱氧终止法,在ABI 377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序。对于仍未获得全长cDNA序列的,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28)。
实施例2:从胎盘cDNA中PCR获得全长基因:
取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表所示),按97℃3分钟、1个循环;94℃30秒→60℃30秒→72℃1分钟,共35个循环;72℃10分钟,1个循环,进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符。随后用常规技术将扩增产物转入宿主细胞,从而获得重组蛋白(SEQ ID NO:2、5、8、11、14、17、20、23、26、29)。
                       基因特异引物
克隆名称     特异引物1(5′→3′)     特异引物2(5′→3′)
  PP3659PP6318PP6425PP7518PP9484PP9964PP10394PP10436PP12613PP12708    AGAGTACCATGCAGATGGGGAGAGGACCCCAGGCTGTTATCAACATCGTCAACTACGGCAGCACGGTTCTACCTGGGTTACTTCCTAAAGGCAACCCTGGCTGTGTGCCAGGAGACATTCTGTTGCTTCTTGACTTCCCCGCTGTGGGGTTGGATGTAAGTGGCTTCAAACAGCATAAACAGAGGGATAAGTAAGAAAAATGGACC   CTGGGAACTCAAGCAGGAAGCCGCTAGAAAGAAGCTCTGCAAGGAGCCGCTGGTGTTCTCAGTGGGACATTTGGTTCTCCTTTTTATTGGCCACGCATCTGAAAAAGAGGCCCACAGTCCTCATGGAGCCATTGTGAGTGGAATTGTGAAGGACTCGGATCCTACCCTGAATAGGGCTGCAACAAGAGCGAAACTCCATC
实施例3:cDNA克隆序列分析
1.PP3659
A:核苷酸序列(SEQ ID NO:1)长度:4715
   1 GTCTCGAGTT TTTTTTTTTT TTTTTTCCGT TTTTAATAAA TAGTTTATTC ATCCAGCAGT
  61 TTCAGCCCTG ATACTGAAGC CTGTTGCGGT GTTTCTTATT TTTCTGGCTG GAGCCTGATT
 121 ATGAGAACAT GGCCTCACCA CGGGGCCAGC GCTCAGATTC CTGCCCTGCC GATCATCCAG
 181 ACATCAGAGG AAATGAGAGT ATTGCTCAAA TGAGGGAGAC TGGAGCTTTA TTAAGGAAAC
 241 AAAAAATACC AGTAAGACTA GAGAGGGGTG GTTAATGTTT CTGGAGGCAG CTGTGGAATT
 301 TCCTGTTTGC TCCCCCTCTC CTGCCTGCCG CAGATGAGGA CACACGGGGA AGACTCGCTG
 361 GAGAGGCTTC TCGCACTTAA TAAGGCCCCC CGTCGGGGTG CTTCTGGAGC CTGCCTCCCA
 421 GGGAGCAGGC TGAGGAGCTG GCGGGAGGGC CGGTGGGCGG CGGCGCGGAC GCTGCTCCCT
 481 TGTGGCCGGC AGGGGGCAGC CTGCAGCCAC TGCGCCTCTC CCGCCGCCAA GAGCCGCGGC
 541 CGGGGTAACA GAAACGCCGG CTGCGCTGAA GTTCTTGTTA AACAGCCCCG CGTCGGGCTG
 601 TGGTCACAGT AAAGCAAGGC GATCTTCGAC ACAGCAAGTG CGAGGCTCTG GGCCCTGACG
 661 CAGGGCTCCC AAGCTCCCGG AATCGGCGTT CTGGCTGCAG GCCTGGTCTA GAGTCGCAGC
 721 TTCTGTGAGA AGCAACACTG AGGCGGGCCC GCCCAGACCC TCCTCTCTGC TCTCAGCCCC
 781 AGTCCCTACT TCGGGATCCT CCCAGGAGGC TGTGCCGGCT GCTCACTCCT CCTGACCTGA
 841 GGGACCGTGT GTCTGGGCCT GGTGTTTCTA GACGGTCCCC CCTACAGTCA CTTGTTCTAA
 901 TTTCTAGCAC CTTCCCTCTT CAGGATAGAG GCCCAGCCAG CCAGAGCACA GGCTTTCTCC
 961 CTTCACCCTG GAGCTCTCAG GTAACAACCC CCTGAAGGCA CATGGACCAA GCTGCTCCCC
1021 ATCCCGCCAC CCGAAACACC ATCCTTGCCC CACCTCCCAG GTGACAGACT CCCTGGCGTG
1081 CCATGCCCCA GCCCACCAGC CCCACGCTTG TCAGCTGGGC CTGACAGCTG CTGCTCTTGT
1141 TTTCTATTCA TGAAAACTCA ACCCTTCTCC CCGTTTCTGC CAGCACAACA GGGCAGAGTC
1201 TGGGCTATCA CCCTGGCTTC TCCCCCTCCC TTTAAAGGAA GCCCACATTT TCCTGCGAGC
1261 CGAACTCCTC TGAAGAGTAT GGCAGACCTT TGGAATCGTG TCAGGACGAG ACTGAAAGTC
1321 AAGGCAAGTG TGAATTCAGC ACCGCAGGCC TGGTGACCCT CCTGTGCCTC TGGAGTGGGC
1381 TGTCCTGGGA CAGGCTGACC AGGAACAAGT CCCCGCCCGG GGCTTATCGC TCTGAGTCAG
1441 AGAAGGAAGA GGGCTTAGTC CATCTCCACA CCAGCATGTC CTCTCCTGCA ACGCGGTGGG
1501 ACTCCGTCTG GATCCGGGAT TCGTTGGAGG CCAGGAACTC CACAGCTCGG TCCCAGACAC
1561 GCTTCATGCG CCTCCGGCTC TGTGGAGGGA TCAAGCTGTC GCGCACGTGC AGGATGCCTA
1621 CATATGGATA GCGCTCCATG TCCTGCTCCC AGTCCACGTA ATGGTCCTGG ACCACGTCTA
1681 TAATCTTCTT CACCATCTCA TACATGGCTT GTTCCTCCTC TTCTAACTTT CGCCACCGAT
1741 ATTTTAGGAG AATTAGGAGC CCCCACAAAA AAAGCCAAGC ACCAGAAGAA GATGAGCACG
1801 TTGGTGACAG CAGTGAGCAA GGCCCGGCTC AGGCGGCAGC CAACACCCAT GCGGGGGTGG
1861 GCAGATTCCA GGCAGACCAC CTTGTCCACA GTCGTCACCA ATTCAGACTG GTCTTCTCCT
1921 TTCAACCAGA TGCCCACGTC CTTGTTACTG CTCAGTATCC AGGTCAGTGC GGCTTCAAAC
1981 TTGGCGGAGG AGCTGCTGGT CACATTGGCT ATATATTCTT GGGCTTCCAT AACAGGAATG
2041 CATTTGCTTT TTAGATTCTC TGGATTTCCA CACTCAAAAT TACCAGCTTG GATGGCCAGG
2101 AAATTGTAGA GTTCATGCAG CAGCTCCAGC AAGGCTGCCT TCTGCTTGGC CTGACAGAAC
2161 TCATCTGTTT TTCTCTCACA GTCCACTGGC AATAACTTCA TGTTGTCCTC CGCCTCCTGC
2221 GGCGCTGAGG GCTTGCCATC TTCACCCAAA GGATGCCCAG GAAGACGAGC AGTAGCCCTA
2281 GGCTGGCCCA GAGCAGAAGC CGAGAGAGCC AGCGCTCCAG CCGGCGCCCC ACCTCAGGCC
2341 GGGCCCTCGC CGCGCCACGA GGGCCCGCTC GAGTCGCCCG CAGCCCGGGC GCGGGTCGGG
2401 ACCGAGGAGG GAGGAAGGCA GCCGCGCCGG GGCGGGAGAC GCTGCCCACC AGCGGCGGGC
2461 CCGGAGACCC GGGCCCTGCG TGGCCCTGTC GGGCGTCCGG GCGTCCTCGT CCTCCTCGGA
2521 GCTGCCCCGG ACCGAGGCGC GGCGCCTGAG TTGCGCCGGG CGGGCAGGAT AGGCGAGGCC
2581 GCGGCTCCCT ACCCAGGAAG CCGCGGAGGG CCGGATATCA CCGTAGCCCC AGGGGTCGCG
2641 TAGGCCGAGC CCGAGGCCGG CTGGGAGAGC CAGGGCTCCG CCGCGGAGAG GCCGCGCGGG
2701 CCGGGCGCGC ACGCGCATCC TCGCGTAACC GGGCCTCTTC CCGTAACCGC TCCTCGCCCC
2761 GCGGCCGGGC CTCCTCCCGC AGCCGCTCCT CGTCGCGCAG CGGGCCTCGC CCGCAGCCTC
2821 GTGCCGAATT CGGCACGAGC TGGTCAAGAG TCCCAACCAT GCAAAATTAC AGACTTCGGG
2881 CTGGCTCGGC TGCTGGACAT TGACGAGACA GAGTACCATG CAGATGGGGG CAAGGTGCCC
2941 ATCAAGTGGA TGGCGCTGGA GTCCATTCTC CGCCGGCGGT TCACCCACCA GAGTGATGTG
3001 TGGAGTTATG GTGTGACTGT GTGGGAGCTG ATGACTTTTG GGGCCAAACC TTACGATGGG
3061 ATCCCAGCCC GGGAGATCCC TGACCTGCTG GAAAAGGGGG AGCGGCTGCC CCAGCCCCCC
3121 ATCTGCACCA TTGATGTCTA CATGATCATG GTCAAATGTT GGATGATTGA CTCTGAATGT
3181 CGGCCAAGAT TCCGGGAGTT GGTGTCTGAA TTCTCCCGCA TGGCCAGGGA CCCCCAGCGC
3241 TTTGTGGTCA TCCAGAATGA GGACTTGGGC CCAGCCAGTC CCTTGGACAG CACCTTCTAC
3301 CGCTCACTGC TGGAGGACGA TGACATGGGG GACCTGGTGG ATGCTGAGGA GTATCTGGTA
3361 CCCCAGCAGG GCTTCTTCTG TCCAGACCCT GCCCCGGGCG CTGGGGGCAT GGTCCACCAC
3421 AGGCACCGCA GCTCATCTAC CAGGAGTGGC GGTGGGGACC TGACACTAGG GCTGGAGCCC
3481 TCTGAAGAGG AGGCCCCCAG GTCTCCACTG GCACCCTCCG AAGGGGCTGG CTCCGATGTA
3541 TTTGATGGTG ACCTGGGAAT GGGGGCAGCC AAGGGGCTGC AAAGCCTCCC CACACATGAC
3601 CCCAGCCCTC TACAGCGGTA CAGTGAGGAC CCCACAGTAC CCCTGCCCTC TGAGACTGAT
3661 GGCTACGTTG CCCCCCTGAC CTGCAGCCCC CAGCCTGAAT ATGTGAACCA GCCAGATGTT
3721 CGGCCCCAGC CCCCTTCGCC CCGAGAGGGC CCTCTGCCTG CTGCCCGACC TGCTGGTGCC
3781 ACTCTGGAAA GGCCCAAGAC TCTCTCCCCA GGGAAGAATG GGGTCGTCAA AGACGTTTTT
3841 GCCTTTGGGG GTGCCGTGGA GAACCCCGAG TACTTGACAC CCCAGGGAGG AGCTGCCCTC
3901 AGCCCCACCC TCCTCCTGCC TTCAGCCCAG CCTTCGACAA CCTCTATTAC TGGGACCAGG
3961 ACCCACCAGA GCGGGGGGCT CCACCCAGCA CCTTCAAAGG GACACCTACG GCAGAGAACC
4021 CAGAGTACCT GGGTCTGGAC GTGCCAGTGT GAACCAGAAG GCCAAGTCCG CAGAAGCCCT
4081 GATGTGTCCT CAGGGAGCAG GGAAGGCCTG ACTTCTGCTG GCATCAAGAG GTGGGAGGGC
4141 CCTCCGACCA CTTCCAGGGG AACCTGCCAT GCCAGGAACC TGTCCTAAGG AACCTTCCTT
4201 CCTGCTTGAG TTCCCAGATG GCTGGAAGGG GTCCAGCCTC GTTGGAAGAG GAACAGCACT
4261 GGGGAGTCTT TGTGGATTCT GAGGCCCTGC CCAATGAGAC TCTAGGGTCC AGTGGATGCC
4321 ACAGCCCAGC TTGGCCCTTT CCTTCCAGAT CCTGGGTACT GAAAGCCTTA GGGAAGCTGG
4381 CCTGAGAGGG GAAGCGGCCC TAAGGGAGTG TCTAAGAACA AAAGCGACCC ATTCAGAGAC
4441 TGTCCCTGAA ACCTAGTACT GCCCCCCATG AGGAAGGAAC AGCAATGGTG TCAGTATCCA
4501 GGCTTTGTAC AGAGTGCTTT TCTGTTTAGT TTTTACTTTT TTTGTTTTGT TTTTTTAAAG
4561 ATGAAATAAA GACCCAGGGG GAGAATGGGT GTTGTATGGG GAGGCAAGTG TGGGGGGTCC
4621 TTCTCCACAC CCACTTTGTC CATTTGCAAA TATATTTTGG AAAACAAAAA AAAAAAAAAA
4681 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAA
B:氨基酸序列(SEQ ID NO:2)长度:412
   1 MALESILRRR FTHQSDVWSY GVTVWELMTF GAKPYDGIPA REIPDLLEKG ERLPQPPICT
  61 IDVYMIMVKC WMIDSECRPR FRELVSEFSR MARDPQRFVV IQNEDLGPAS PLDSTFYRSL
 121 LEDDDMGDLV DAEEYLVPQQ GFFCPDPAPG AGGMVHHRHR SSSTRSGGGD LTLGLEPSEE
 181 EAPRSPLAPS EGAGSDVFDG DLGMGAAKGL QSLPTHDPSP LQRYSEDPTV PLPSETDGYV
 241 APLTCSPQPE YVNQPDVRPQ PPSPREGPLP AARPAGATLE RPKTLSPGKN GVVKDVFAFG
 301 GAVENPEYLT PQGGAALSPT LLLPSAQPST TSITGTRTHQ SGGLHPAPSK GHLRQRTQST
 361 WVWTCQCEPE GQVRRSPDVS SGSREGLTSA GIKRWEGPPT TSRGTCHARN LS
C.核酸及氨基酸组合序列(SEQ ID NO:3)克隆号:PP3659起始编码子:2950 ATG  终止编码子:4186 TAA  蛋白质分子量:44699.63
   1 GTC TCG AGT TTT TTT TTT TTT TTT TTC CGT TTT TAA TAA ATA GTT TAT     48
  49 TCA TCC AGC AGT TTC AGC CCT GAT ACT GAA GCC TGT TGC GGT GTT TCT     96
  97 TAT TTT TCT GGC TGG AGC CTG ATT ATG AGA ACA TGG CCT CAC CAC GGG    144
 145 GCC AGC GCT CAG ATT CCT GCC CTG CCG ATC ATC CAG ACA TCA GAG GAA    192
 193 ATG AGA GTA TTG CTC AAA TGA GGG AGA CTG GAG CTT TAT TAA GGA AAC    240
 241 AAA AAA TAC CAG TAA GAC TAG AGA GGG GTG GTT AAT GTT TCT GCA GGC    288
 289 AGC TGT GGA ATT TCC TGT TTG CTC CCC CTC TCC TGC CTG CCG CAG ATG    336
 337 AGG ACA CAC GGG GAA GAC TCG CTG GAG AGG CTT CTC GCA CTT AAT AAG    384
 385 GCC CCC CGT CGG GGT GCT TCT GGA GCC TGC CTC CCA GGG AGC AGG CTG    432
 433 AGG AGC TGG CGG GAG GGC CGG TGG GCG GCG GCG CGG ACG CTG CTC CCT    480
 481 TGT GGC CGG CAG GGG GCA GCC TGC AGC CAC TGC GCC TCT CCC GCC GCC    528
 529 AAG AGC CGC GGC CGG GGT AAC AGA AAC GCC GGC TGC GCT GAA GTT CTT    576
 577 GTT AAA CAG CCC CGC GTC GGG CTG TGG TCA CAG TAA AGC AAG GCG ATC    624
 625 TTC GAC ACA GCA AGT GCG AGG CTC TGG GCC CTG ACG CAG GGC TCC CAA    672
 673 GCT CCC GGA ATC GGC GTT CTG GCT GCA GGC CTG GTC TAG AGT CGC AGC    720
 721 TTC TGT GAG AAG CAA CAC TGA GGC GGG CCC GCC CAG ACC CTC CTC TCT    768
 769 GCT CTC AGC CCC AGT CCC TAC TTC GGG ATC CTC CCA GGA GGC TGT GCC    816
 817 GGC TGC TCA CTC CTC CTG ACC TGA GGG ACC GTG TGT CTG GGC CTG GTG    864
 865 TTT CTA GAC GGT CCC CCC TAC AGT CAC TTG TTC TAA TTT CTA GCA CCT    912
 913 TCC CTC TTC AGG ATA GAG GCC CAG CCA GCC AGA GCA CAG GCT TTC TCC    960
 961 CTT CAC CCT GGA GCT CTC AGG TAA CAA CCC CCT GAA GGC ACA TGG ACC   1008
1009 AAG CTG CTC CCC ATC CCG CCA CCC GAA ACA CCA TCC TTG CCC CAC CTC   1056
1057 CCA GGT GAC AGA CTC CCT GGC GTG CCA TGC CCC AGC CCA CCA GCC CCA   1104
1105 CGC TTG TCA GCT GGG CCT GAC AGC TGC TGC TCT TGT TTT CTA TTC ATG   1152
1153 AAA ACT CAA CCC TTC TCC CCG TTT CTG CCA GCA CAA CAG GGC AGA GTC   1200
1201 TGG GCT ATC ACC CTG GCT TCT CCC CCT CCC TTT AAA GGA AGC CCA CAT   1248
1249 TTT CCT GCG AGC CGA ACT CCT CTG AAG AGT ATG GCA GAC CTT TGG AAT   1296
1297 CGT GTC AGG ACG AGA CTG AAA GTC AAG GCA AGT GTG AAT TCA GCA CCG   1344
1345 CAG GCC TGG TGA CCC TCC TGT GCC TCT GGA GTG GGC TGT CCT GGG ACA   1392
1393 GGC TGA CCA GGA ACA AGT CCC CGC CCG GGG CTT ATC GCT CTG AGT CAG   1440
1441 AGA AGG AAG AGG GCT TAG TCC ATC TCC ACA CCA GCA TGT CCT CTC CTG   1488
1489 CAA CGC GGT GGG ACT CCG TCT GGA TCC GGG ATT CGT TGG AGG CCA GGA   1536
1537 ACT CCA CAG CTC GGT CCC AGA CAC GCT TCA TGC GCC TCC GGC TCT GTG   1584
1585 GAG GGA TCA AGC TGT CGC GCA CGT GCA GGA TGC CTA CAT ATG GAT AGC   1632
1633 GCT CCA TGT CCT GCT CCC AGT CCA CGT AAT GGT CCT GGA CCA CGT CTA   1680
1681 TAA TCT TCT TCA CCA TCT CAT ACA TGG CTT GTT CCT CCT CTT CTA ACT   1728
1729 TTC GCC ACC GAT ATT TTA GGA GAA TTA GGA GCC CCC ACA AAA AAA GCC   1776
1777 AAG CAC CAG AAG AAG ATG AGC ACG TTG GTG ACA GCA GTG AGC AAG GCC   1824
1825 CGG CTC AGG CGG CAG CCA ACA CCC ATG CGG GGG TGG GC AGAT TCC AGG   1872
1873 CAG ACC ACC TTG TCC ACA GTC GTC ACC AAT TCA GAC TGG TCT TCT CCT   1920
1921 TTC AAC CAG ATG CCC ACG TCC TTG TTA CTG CTC AGT ATC CAG GTC AGT   1968
1969 GCG GCT TCA AAC TTG GCG GAG GAG CTG CTG GTC ACA TTG GCT ATA TAT   2016
2017 TCT TGG GCT TCC ATA ACA GGA ATG CAT TTG CTT TTT AGA TTC TCT GGA   2064
2065 TTT CCA CAC TCA AAA TTA CCA GCT TGG ATG GCC AGG AAA TTG TAG AGT   2112
2113 TCA TGC AGC AGC TCC AGC AAG GCT GCC TTC TGC TTG GCC TGA CAG AAC   2160
2161 TCA TCT GTT TTT CTC TCA CAG TCC ACT GGC AAT AAC TTC ATG TTG TCC   2208
2209 TCC GCC TCC TGC GGC GCT GAG GGC TTG CCA TCT TCA CCC AAA GGA TGC   2256
2257 CCA GGA AGA CGA GCA GTA GCC CTA GGC TGG CCC AGA GCA GAA GCC GAG   2304
2305 AGA GCC AGC GCT CCA GCC GGC GCC CCA CCT CAG GCC GGG CCC TCG CCG   2352
2353 CGC CAC GAG GGC CCG CTC GAG TCG CCC GCA GCC CGG GCG CGG GTC GGG   2400
2401 ACC GAG GAG GGA GGA AGG CAG CCG CGC CGG GGC GGG AGA CGC TGC CCA   2448
2449 CCA GCG GCG GGC CCG GAG ACC CGG GCC CTG CGT GGC CCT GTC GGG CGT   2496
2497 CCG GGC GTC CTC GTC CTC CTC GGA GCT GCC CCG GAC CGA GGC GCG GCG   2544
2545 CCT GAG TTG CGC CGG GCG GGC AGG ATA GGC GAG GCC GCG GCT CCC TAC   2592
2593 CCA GGA AGC CGC GGA GGG CCG GAT ATC ACC GTA GCC CCA GGG GTC GCG   2640
2641 TAG GCC GAG CCC GAG GCC GGC TGG GAG AGC CAG GGC TCC GCC GCG GAG   2688
2689 AGG CCG CGC GGG CCG GGC GCG CAC GCG CAT CCT CGC GTA ACC GGG CCT   2736
2737 CTT CCC GTA ACC GCT CCT CGC CCC GCG GCC GGG CCT CCT CCC GCA GCC   2784
2785 GCT CCT CGT CGC GCA GCG GGC CTC GCC CGC AGC CTC GTG CCG AAT TCG   2832
2833 GCA CGA GCT GGT CAA GAG TCC CAA CCA TGC AAA ATT ACA GAC TTC GGG   2880
2881 CTG GCT CGG CTG CTG GAC ATT GAC GAG ACA GAG TAC CAT GCA GAT GGG   2928
2929 GGC AAG GTG CCC ATC AAG TGG ATG GCG CTG GAG TCC ATT CTC CGC CGG   2976
   1                             Met Ala Leu Glu Ser Ile Leu Arg Arg      9
2977 CGG TTC ACC CAC CAG AGT GAT GTG TGG AGT TAT GGT GTG ACT GTG TGG   3024
  10 Arg Phe Thr His Gln Ser Asp Val Trp Ser Tyr Gly Val Thr Val Trp      25
3025 GAG CTG ATG ACT TTT GGG GCC AAA CCT TAC GAT GGG ATC CCA GCC CGG    3072
  26 Glu Leu Met Thr Phe Gly Ala Lys Pro Tyr Asp Gly Ile Pro Ala Arg      41
3073 GAG ATC CCT GAC CTG CTG GAA AAG GGG GAG CGG CTG CCC CAG CCC CCC    3120
  42 Glu Ile Pro Asp Leu Leu Glu Lys Gly Glu Arg Leu Pro Gln Pro Pro      57
3121 ATC TGC ACC ATT GAT GTC TAC ATG ATC ATG GTC AAA TGT TGG ATG ATT    3168
  58 Ile Cys Thr Ile Asp Val Tyr Met Ile Met Val Lys Cys Trp Met Ile      73
3169 GAC TCT GAA TGT CGG CCA AGA TTC CGG GAG TTG GTG TCT GAA TTC TCC    3216
  74 Asp Ser Glu Cys Arg Pro Arg Phe Arg Glu Leu Val Ser Glu Phe Ser      89
3217 CGC ATG GCC AGG GAC CCC CAG CGC TTT GTG GTC ATC CAG AAT GAG GAC    3264
  90 Arg Met Ala Arg Asp Pro Gln Arg Phe Val Val Ile Gln ASh Glu Asp     105
3265 TTG GGC CCA GCC AGT CCC TTG GAC AGC ACC TTC TAC CGC TCA CTG CTG    3312
 106 Leu Gly Pro Ala Ser Pro Leu Asp Ser Thr Phe Tyr Arg Ser Leu Leu     121
3313 GAG GAC GAT GAC ATG GGG GAC CTG GTG GAT GCT GAG GAG TAT CTG GTA    3360
 122 Glu Asp Asp Asp Met Gly Asp Leu Val Asp Ala Glu Glu Tyr Leu Val     137
3361 CCC CAG CAG GGC TTC TTC TGT CCA GAC CCT GCC CCG GGC GCT GGG GGC    3408
 138 Pro Gln Gln Gly Phe Phe Cys Pro Asp Pro Ala Pro Gly Ala Gly Gly     153
3409 ATG GTC CAC CAC AGG CAC CGC AGC TCA TCT ACC AGG AGT GGC GGT GGG    3456
 154 Met Val His His Arg His Arg Ser Ser Ser Thr Arg Ser Gly Gly Gly     169
3457 GAC CTG ACA CTA GGG CTG GAG CCC TCT GAA GAG GAG GCC CCC AGG TCT    3504
 170 Asp Leu Thr Leu Gly Leu Glu Pro Ser Glu Glu Glu Ala Pro Arg Ser     185
3505 CCA CTG GCA CCC TCC GAA GGG GCT GGC TCC GAT GTA TTT GAT GGT GAC    3552
 186 Pro Leu Ala Pro Ser Glu Gly Ala Gly Ser Asp Val Phe Asp Gly Asp     201
3553 CTG GGA ATG GGG GCA GCC AAG GGG CTG CAA AGC CTC CCC ACA CAT GAC    3600
 202 Leu Gly Met Gly Ala Ala Lys Gly Leu Gln Ser Leu Pro Thr His Asp     217
3601 CCC AGC CCT CTA CAG CGG TAC AGT GAG GAC CCC ACA GTA CCC CTG CCC    3648
 218 Pro Ser Pro Leu Gln Arg Tyr Ser Glu Asp Pro Thr Val Pro Leu Pro     233
3649 TCT GAG ACT GAT GGC TAC GTT GCC CCC CTG ACC TGC AGC CCC CAG CCT    3696
 234 Ser Glu Thr Asp Gly Tyr Val Ala Pro Leu Thr Cys Ser Pro Gln Pro     249
3697 GAA TAT GTG AAC CAG CCA GAT GTT CGG CCC CAG CCC CCT TCG CCC CGA    3744
 250 Glu Tyr Val Asn Gln Pro Asp Val Arg Pro Gln Pro Pro Ser Pro Arg     265
3745 GAG GGC CCT CTG CCT GCT GCC CGA CCT GCT GGT GCC ACT CTG GAA AGG    3792
 266 Glu Gly Pro Leu Pro Ala Ala Arg Pro Ala Gly Ala Thr Leu Glu Arg     281
3793 CCC AAG ACT CTC TCC CCA GGG AAG AAT GGG GTC GTC AAA GAC GTT TTT    3840
 282 Pro Lys Thr Leu Ser Pro Gly Lys Asn Gly Val Val Lys Asp Val Phe     297
3841 GCC TTT GGG GGT GCC GTG GAG AAC CCC GAG TAC TTG ACA CCC CAG GGA    3888
 298 Ala Phe Gly Gly Ala Val Glu Asn Pro Glu Tyr Leu Thr Pro Gln Gly     313
3889 GGA GCT GCC CTC AGC CCC ACC CTC CTC CTG CCT TCA GCC CAG CCT TCG    3936
 314 Gly Ala Ala Leu Ser Pro Thr Leu Leu Leu Pro Ser Ala Gln Pro Ser     329
3937 ACA ACC TCT ATT ACT GGG ACC AGG ACC CAC CAG AGC GGG GGG CTC CAC    3984
 330 Thr Thr Ser Ile Thr Gly Thr Arg Thr His Gln Ser Gly Gly Leu His     345
3985 CCA GCA CCT TCA AAG GGA CAC CTA CGG CAG AGA ACC CAG AGT ACC TGG    4032
 346 Pro Ala Pro Ser Lys Gly His Leu Arg Gln Arg Thr Gln Ser Thr Trp     361
4033 GTC TGG ACG TGC CAG TGT GAA CCA GAA GGC CAA GTC CGC AGA AGC CCT    4080
 362 Val Trp Thr Cys Gln Cys Glu Pro Glu Gly Gln Val Arg Arg Ser Pro     377
4081 GAT GTG TCC TCA GGG AGC AGG GAA GGC CTG ACT TCT GCT GGC ATC AAG    4128
 378 Asp Val Ser Ser Gly Ser Arg Glu Gly Leu Thr Ser Ala Gly Ile Lys     393
4129 AGG TGG GAG GGC CCT CCG ACC ACT TCC AGG GGA ACC TGC CAT GCC AGG    4176
 394 Arg Trp Glu Gly Pro Pro Thr Thr Ser Arg Gly Thr Cys His Ala Arg     409
4177 MC CTG TCC TAA GGA ACC TTC CTT CCT GCT TGA GTT CCC AGA TGG CTG   4224
 410 Asn Leu Ser ***                                                   413
4225 GAA GGG GTC CAG CCT CGT TGG AAG AGG AAC AGC ACT GGG GAG TCT TTG  4272
4273 TGG ATT CTG AGG CCC TGC CCA ATG AGA CTC TAG GGT CCA GTG GAT GCC  4320
4321 ACA GCC CAG CTT GGC CCT TTC CTT CCA GAT CCT GGG TAC TGA AAG CCT  4368
4369 TAG GGA AGC TGG CCT GAG AGG GGA AGC GGC CCT AAG GGA GTG TCT AAG  4416
4417 AAC AAA AGC GAC CCA AAC AGA GAC TGT CCC TGA AAC CTA GTA CTG CCC  4464
4465 CCC ATG AGG AAG GAA CAG CAA TGG TGT CAG TAT CCA GGC TTT GTA CAG  4512
4513 AGT GCT TTT CTG TTT AGT TTT TAC TTT TTT TGT TTT GTT TTT TTA AAG  4560
4561 ATG AAA TAA AGA CCC AGG GGG AGA ATG GGT GTT GTA TGG GGA GGC AAG  4608
4609 TGT GGG GGG TCC TTC TCC ACA CCC ACT TTG TCC ATT TGC AAA TAT ATT  4656
4657 TTG GAA AAC AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA  4704
4705 AAA AAA AAA AA                                                   4715
2.PP6318
A:核苷酸序列(SEQ ID NO:4)长度:3722
   1 GGAACTAGTC TCGAGTTTTT TTTTTTTTTT TTTGCAATTT TAAGCTCATC AGCTATCACT
  61 AGTGTTAGCA TATTTTATAG TGTGGCCCAA GACAATTATT TTCCTAATGT GGTCCAGGGA
 121 AGCCAAAAGA TTGGACACCC TGATATACTT AATTACCAGG GTAATATTCC TAACACCATC
 181 ACTTTTACTT GACAATTCTC CTGCTCTAAA AGTTATGAAC CTGACATTCT TGGTCTTACA
 241 CAATCTGGAC CCAGTCTACT CTTCTATAAC CATCTTCCAC TTAATTTACA AATCTTTATT
 301 AAGGCACAGG TACTCCTACT TATCCCCTAT TGCCTCTCTC ATGCTGAATC AATCATGCCA
 361 AAAGCTAAGA AAACATGAGC ATGCTTGGGA CTAAAGAAAC AGAACTGAGG ATTTCCTACA
 421 CATCCTAACT GCAAGGACAG TCCATCAAAA GCCAGAGATA AGTATTTTTA TTTGCTCTTT
 481 ATTTCTTAAA ATAATTTCCC CAATTTTGTT AACCCCTACC TCAAATGACT TTAGAGGTAT
 541 TTTAAAGGAT ATGTAATATA GTTACTAAGC ATTTCCACTG ATTGTAGCTG AAGGATTTTC
 601 TAATGTCTAT TACATGAAAC TTCTCCTTAA ACTCTCTTTT AACGAAACTG TCATTTTCCT
 661 CTCCAGAACG GTCTTGTCTT TTCTTTCTCC TATATATCGC ATATAAAATC AGCGGCCAAA
 721 TCTTCTAGAT CAAACATATT CATTTCATCC ATTCCTTCAA TTATCCAGTC ATTCAATCAA
 781 CATTATTATG TGTAAAGTAT GACCCACTTG CATTCCTAGA CATGGAAGAT CCAAAATTAA
 841 TGTGAATAAT AATCTAGTGA AAAGATAAGC ATGGACAAAA GTAATTATTA GACAAAATTG
 901 ATGCTATAAT AAATGAACAT TGGAAGGGCT ATGGTTAAGT GATTAAGCTT GACTTGGATC
 961 TCTAAAGGTG AATGGTTCTT TACCAGGCTA AGAAGAAAAG GAAACATTCT AGGAAAAGAG
1021 AACAGCAAGC ATGAAAACCA TAAAAGGGCT GCCGCAGAAG TTCCTCTTCC TCCTCTTCCT
1081 CTCGGGCCTG GTCACCCTGT GCTTCGGGGC CCTCTTCCTG CTGCCCCACT CCTCTCGCCT
1141 CAAGCGCCTC TTCCTGGCCC CCCGGACCCA GCAGCCTGGT CTGGAAGTGG TGGCTGAAAT
1201 CGCCGGCCAT GCCCCGGCCC GCGAGCAGGA GCCGCCTCCC AACCCGGCCC CCGCCGCGCC
1261 GGCCCCGGGC GAGGATGACC CCAGCAGCTG GGCCAGTCCC CGCCGCAGGA AAGGGGGGCT
1321 GCGGCGCACC CGCCCCACTG GACCCCGCGA GGAGGCCACG GCGGCCCGGG GCAATAGCAT
1381 CCCGGCCTCC AGGCCCGGGG ACGAGGGCGT CCCTTTCCGC TTTGACTTCA ACGCATTCCG
1441 GAGCCGTCTC CGCCACCCGG TCCTGGGAAC GAGGGCCGAT GAGAGTCAGG AGCCCCAGAG
1501 CCAAGTGCGA GCCCAGCGCG TAGAAAATCA AGGAGACACA GCGGTCCTGG GGTTGCCTTC
1561 CAGATGAAGA TCTATCAAAG ATTTGAAGTC TTGTGTATGT GGTCCTAGAG GACCCCAGGC
1621 TGTTATACCG ATCCATGAGG CATCTGACCC CTTCCAAAGG ATGATGCAGT TTGCTTGGCA
1681 GAGCTATAAG CGTTATGCAA TCGGGAAAAA CGAACTCCGT CCACTAACAA AAGATGGCTA
1741 CGAGGGTAAC ATGTTCGGAG GCCTCAGCGG GGCAACAGTC ATTGACTCCC TCGATACCCT
1801 CTACCTCATG GAGCTGAAGG AGGAGTTCCA GGAGGCCAAG GCCTGGGTGG GAGAGAGCTT
1861 CCACCTGAAC GTGAGCGGAG AAGCATCCTT GTTTGAGGTG AACATCCGCT ACATCGGGGG
1921 ACTCCTCTCA GCCTTCTACC TGACAGGAGA AGAGGTGTTC CGAATAAAGG CCATCAGGCT
1981 GGGAGAGAAG CTCCTGCCGG CGTTCAACAC CCCCACGGGA ATCCCAAAGG GCGTGGTGAG
2041 CTTCAAAAGT GGGAACTGGG GCTGGGCCAC AGCCGGCAGC AGCAGCATCT TGGCGGAGTT
2101 TGGATCCCTG CACTTGGAAT TCTTACACCT CACTGAACTC TCTGGCAACC AGGTCTTCGC
2161 TGAAAAGGTC AGGAACATCC GCAAGGTCCT CAGGAAGATC GAAAAGCCCT TTGGCCTCTA
2221 CCCCAACTTC CTCAGCCCAG TGAGTGGGAA CTGGGTGCAA CACCATGTCT CAGTTGGAGG
2281 ACTCGGGGAC AGTTTTTATG AATATTTGAT CAAATCCTGG TTGATGTCGG GCAAGACAGA
2341 TATGGAGGCT AAAAATATGT ACTACGAAGC CTTGGAGGCG ATAGAGACCT ACTTGCTGAA
2401 TGTCTCTCCC GGGGGGCTGA CCTACATTGC CGAGTGGCGA GGGGGGATTC TGGACCACAA
2461 GATGGGGCAC CTGGCCTGTT TCTCCGGGGG CATGATCGCC CTTGGCGCCG AGGATGCCAA
2521 GGAAGAAAAG AGGGCCCACT ACCGAGAGCT CGCAGCCCAG ATCACCAAGA CGTGTCACGA
2581 GTCATACGCC CGCTCAGACA CCAAACTTGG GCCTGAGGCC TTCTGGTTTA ACTCCGGCAG
2641 AGAGGCCGTG GCCACCCAGC TGAGCGAGAG CTACTACATC CTCCGGCCAG AGGTGGTGGA
2701 GAGCTACATG TACCTGTGGC GACAGACCCA CAACCCCATC TACAGGGAGT GGGGCTGGGA
2761 AGGTGGTGCT GGCCTTGGAG AAATACTGTC GGACAGAAGC CGGTTTCTCT GGGATCCAAG
2821 ACGTGTACAG TAGCACCCCC AACCACGGAC AACAAGCAGC AGAGCTTCTT TCTAGCGGAG
2881 ACACTAAAGT ATCTCTATCT TCTGTTCTCT GAAGATGACT TGCTCTCCCT GGAAGACTGG
2941 GTGTTCAACA CCGAGGCCCA CCCACTCCCG GTGAACCACT CAGACAGCTC CGGCAGAGCC
3001 TGGGGCAGAC ACTGACCCCA TCTCCTGCCG CCGCCCTGGG GCCGCCGCAG GGATGCCTTG
3061 CCTTTTCAGG ATTTGAGACT GTTCTCAAAG GGATTGGGAA CGAAGGCCCC ATCTCGGGCA
3121 GACCCCCAGC AGATGTGTCG GACAAGCAAC TTCTTTTCCT CTGTGAGGAG ACAAGACTTG
3181 GAGACTCAGC GATGTCAGGC CAGGGCCATG GCCACACTGG CCCACACATT CCTTTCTACA
3241 GAGAATTTCT ATGAAGCCCA CTCACTTGCC ATTCCAGGGC CAAAGGACCG GAGGTTTGCA
3301 TATCCGCCCC TTGTATTTGA TTTGCTTCCT TTTGGTTTCT TGGTTTTTGT TTTTGCTTGA
3361 TTTTGTCTTT TCTCTACAGT TTAGTTTTGT CACAATTACA CATATAGTTT TCAAAATCAT
3421 GCACTTTCTA AAATGGTGTC ATCCTGAAAA ACAAAACCCA GTGTTTGCAC ACACACAAAA
3481 TCTTGACCCC GTTATCTATA TTTTAAATGC TTTTTGCCCA ACACTGACCC TATGTTCAAC
3541 TTTGTGTCAT TTACCTTATA ATTTGAGGAG GGGTTTCCCT TTGGGCCTCA GTGTTACAAA
3601 TTACTAGTGC TATTTTCATT ATTATTGTAA TGGAAAAATC TGTGGACTAG AATAAAAGAG
3661 TTTATTGAAT TAGAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
3721 AA
B:氨基酸序列(SEQ ID NO:5)长度:390
   1 MMQFAWQSYK RYAMGKNELR PLTKDGYEGN MFGGLSGATV IDSLDTLYLM ELKEEFQEAK
  61 AWVGESFHLN VSGEASLFEV NIRYIGGLLS AFYLTGEEVF RIKAIRLGEK LLPAFNTPTG
 121 IPKGVVSFKS GNWGWATAGS SSILAEFGSL HLEFLHLTEL SGNQVFAEKV RNIRKVLRKI
 181 EKPFGLYPNF LSPVSGNWVQ HHVSVGGLGD SFYEYLIKSW LMSGKTDMEA KNMYYEALEA
 241 IETYLLNVSP GGLTYIAEWR GGILDHKMGH LACFSGGMIA LGAEDAKEEK RAHYRELAAQ
 301 ITKTCHESYA RSDTKLGPEA FWFNSGREAV ATQLSESYYI LRPEVVESYM YLWRQTHNPI
 361 YREWGWEGGA GLGEILSDRS RFLWDPRRVQ
 C.核苷酸及氨基酸组合序列(SEQ ID NO:6)克隆号:PP6318起始编码子:1661 ATG  终止编码子:2831 TAG  蛋白质分子量:44107.84
   1   G GAA CTA GTC TCG AGT TTT TTT TTT TTT TTT TTG CAA TTT TAA GCT     46
  47 CAT CAG CTA TCA CTA GTG TTA GCA TAT TTT ATA GTG TGG CCC AAG ACA     94
  95 ATT ATT TTC CTA ATG TGG TCC AGG GAA GCC AAA AGA TTG GAC ACC CTG    142
 143 ATA TAC TTA ATT ACC AGG GTA ATA TTC CTA ACA CCA TCA CTT TTA CTT    190
 191 GAC AAT TCT CCT GCT CTA AAA GTT ATG AAC CTG ACA TTC TTG GTC TTA    238
 239 CAC AAT CTG GAC CCA GTC TAC TCT TCT ATA ACC ATC TTC CAC TTA ATT    286
 287 TAC AAA TCT TTA AAA AGG CAC AGG TAC TCC TAC TTA TCC CCT ATT GCC    334
 335 TCT CTC ATG CTG AAT CAA TCA TGC CAA AAG CTA AGA AAA CAT GAG CAT    382
 383 GCT TGG GAC TAA AGA AAC AGA ACT GAG GAT TTC CTA CAC ATC CTA ACT    430
 431 GCA AGG ACA GTC CAT CAA AAG CCA GAG ATA AGT ATT TTT ATT TGC TCT    478
 479 TTA TTT CTT AAA ATA ATT TCC CCA ATT TTG TTA ACC CCT ACC TCA AAT    526
 527 GAC TTT AGA GGT ATT TTA AAG GAT ATG TAA TAT AGT TAC TAA GCA TTT    574
 575 CCA CTG ATT GTA GCT GAA GGA TTT TCT AAT GTC TAT TAC ATG AAA CTT    622
 623 CTC CTT AAA CTC TCT TTT AAC GAA ACT GTC ATT TTC CTC TCC AGA ACG    670
 671 GTC TTG TCT TTT CTT TCT CCT ATA TAT CGC ATA TAA AAT CAG CGG CCA    718
 719 AAT CTT CTA GAT CAA ACA TAT TCA TTT CAT CCA TTC CTT CAA TTA TCC    766
 767 AGT CAT TCA ATC AAC ATT ATT ATG TGT AAA GTA TGA CCC ACT TGC ATT    814
 815 CCT AGA CAT GGA AGA TCC AAA ATT AAT GTG AAT AAT AAT CTA GTG AAA    862
 863 AGA TAA GCA TGG ACA AAA GTA ATT ATT AGA CAA AAT TGA TGC TAT AAT    910
 911 AAA TGA ACA TTG GAA GGG CTA TGG TTA AGT GAT TAA GCT TGA CTT GGA    958
 959 TCT CTA AAG GTG AAT GGT TCT TTA CCA GGC TAA GAA GAA AAG GAA ACA   1006
1007 TTC TAG GAA AAG AGA ACA GCA AGC ATG AAA ACC ATA AAA GGG CTG CCG   1054
1055 CAG AAG TTC CTC TTC CTC CTC TTC CTC TCG GGC CTG GTC ACC CTG TGC   1102
1103 TTC GGG GCC CTC TTC CTG CTG CCC CAC TCC TCT CGC CTC AAG CGC CTC   1150
1151 TTC CTG GCC CCC CGG ACC CAG CAG CCT GGT CTG GAA GTG GTG GCT GAA   1198
1199 ATC GCC GGC CAT GCC CCG GCC CGC GAG CAG GAG CCG CCT CCC AAC CCG  1246
1247 GCC CCC GCC GCG CCG GCC CCG GGC GAG GAT GAC CCC AGC AGC TGG GCC  1294
1295 AGT CCC CGC CGC AGG AAA GGG GGG CTG CGG CGC ACC CGC CCC ACT GGA  1342
1343 CCC CGC GAG GAG GCC ACG GCG GCC CGG GGC AAT AGC ATC CCG GCC TCC  1390
1391 AGG CCC GGG GAC GAG GGC GTC CCT TTC CGC TTT GAC TTC AAC GCA TTC  1438
1439 CGG AGC CGT CTC CGC CAC CCG GTC CTG GGA ACG AGG GCC GAT GAG AGT  1486
1487 CAG GAG CCC CAG AGC CAA GTG CGA GCC CAG CGG GTA GAA AAT CAA GGA  1534
1535 GAC ACA GCG GTC CTG GGG TTG CCT TCC AGA TGA AGA TCT ATC AAA GAT  1582
1583 TTG AAG TCT TGT GTA TGT GGT CCT AGA GGA CCC CAG GCT GTT ATA CCG  1630
1631 ATC CAT GAG GCA TCT GAC CCC TTC CAA AGG ATG ATG CAG TTT GCT TGG  1678
   1                                         Met Met Gln Phe Ala Trp     6
1679 CAG AGC TAT AAG CGT TAT GCA ATG GGG AAA AAC GAA CTC CGT CCA CTA  1726
   7 Gln Ser Tyr Lys Arg Tyr Ala Met Gly Lys Asn Glu Leu Arg Pro Leu    22
1727 ACA AAA GAT GGC TAC GAG GGT AAC ATG TTC GGA GGC CTC AGC GGG GCA  1774
  23 Thr Lys Asp Gly Tyr Glu Gly Asn Met Phe Gly Gly Leu Ser Gly Ala    38
1775 ACA GTC ATT GAC TCC CTC GAT ACC CTC TAC CTC ATG GAG CTG AAG GAG  1822
  39 Thr Val Ile Asp Ser Leu Asp Thr Leu Tyr Leu Met Glu Leu Lys Glu    54
1823 GAG TTC CAG GAG GCC AAG GCC TGG GTG GGA GAG AGC TTC CAC CTG AAC  1870
  55 Glu Phe Gln Glu Ala Lys Ala Trp Val Gly Glu Ser Phe His Leu Asn    70
1871 GTG AGC GGA GAA GCA TCC TTG TTT GAG GTG AAC ATC CGC TAC ATC GGG  1918
  71 Val Ser Gly Glu Ala Ser Leu Phe Glu Val Asn Ile Arg Tyr Ile Gly    86
1919 GGA CTC CTC TCA GCC TTC TAC CTG ACA GGA GAA GAG GTG TTC CGA ATA  1966
  87 Gly Leu Leu Ser Ala Phe Tyr Leu Thr Gly Glu Glu Val Phe Arg Ile   102
1967 AAG GCC ATC AGG CTG GGA GAG AAG CTC CTG CCG GCG TTC AAC ACC CCC  2014
 103 Lys Ala Ile Arg Leu Gly Glu Lys Leu Leu Pro Ala Phe Asn Thr Pro   118
2015 ACG GGA ATC CCA AAG GGC GTG GTG AGC TTC AAA AGT GGG AAC TGG GGC  2062
 119 Thr Gly Ile Pro Lys Gly Val Val Ser Phe Lys Ser Gly Asn Trp Gly   134
2063 TGG GCC ACA GCC GGC AGC AGC AGC ATC TTG GCG GAG TTT GGA TCC CTG  2110
 135 Trp Ala Thr Ala Gly Ser Ser Ser Ile Leu Ala Glu Phe Gly Ser Leu   150
2111 CAC TTG GAA TTC TTA CAC CTC ACT GAA CTC TCT GGC AAC CAG GTC TTC  2158
 151 His Leu Glu Phe Leu His Leu Thr Glu Leu Ser Gly Asn Gln Val Phe   166
2159 GCT GAA AAG GTC AGG AAC ATC CGC AAG GTC CTC AGG AAG ATC GAA AAG  2206
 167 Ala Glu Lys Val Arg Asn Ile Arg Lys Val Leu Arg Lys Ile Glu Lys   182
2207 CCC TTT GGC CTC TAC CCC AAC TTC CTC AGC CCA GTG AGT GGG AAC TGG  2254
 183 Pro Phe Gly Leu Tyr Pro Asn Phe Leu Ser Pro Val Ser Gly Asn Trp   198
2255 GTG CAA CAC CAT GTC TCA GTT GGA GGA CTC GGG GAC AGT TTT TAT GAA  2302
 199 Val Gln His His Val Ser Val Gly Gly Leu Gly Asp Ser Phe Tyr Glu   214
2303 TAT TTG ATC AAA TCC TGG TTG ATG TCG GGC AAG ACA GAT ATG GAG GCT  2350
 215 Tyr Leu Ile Lys Ser Trp Leu Met Ser Gly Lys Thr Asp Met Glu Ala   230
2351 AAA AAT ATG TAC TAC GAA GCC TTG GAG GCG ATA GAG ACC TAC TTG CTG  2398
 231 Lys Asn Met Tyr Tyr Glu Ala Leu Glu Ala Ile Glu Thr Tyr Leu Leu   246
2399 AAT GTC TCT CCC GGG GGG CTG ACC TAC ATT GCC GAG TGG CGA GGG GGG  2446
 247 Asn Val Ser Pro Gly Gly Leu Thr Tyr Ile Ala Glu Trp Arg Gly Gly   262
2447 ATT CTG GAC CAC AAG ATG GGG CAC CTG GCC TGT TTC TCC GGG GGC ATG  2494
 263 Ile Leu Asp His Lys Met Gly His Leu Ala Cys Phe Ser Gly Gly Met   278
2495 ATC GCC CTT GGC GCC GAG GAT GCC AAG GAA GAA AAG AGG GCC CAC TAC  2542
 279 Ile Ala Leu Gly Ala Glu Asp Ala Lys Glu Glu Lys Arg Ala His Tyr   294
2543 CGA GAG CTC GCA GCC CAG ATC ACC AAG ACG TGT CAC GAG TCA TAC GCC  2590
 295 Arg Glu Leu Ala Ala Gln Ile Thr Lys Thr Cys His Glu Ser Tyr Ala   310
2591 CGC TCA GAC ACC AAA CTT GGG CCT GAG GCC TTC TGG TTT AAC TCC GGC  2638
 311 Arg Ser Asp Thr Lys Leu Gly Pro Glu Ala Phe Trp Phe Asn Ser Gly   326
2639 AGA GAG GCC GTG GCC ACC CAG CTG AGC GAG AGC TAC TAC ATC CTC CGG    2686
 327 Arg Glu Ala Val Ala Thr Gln Leu Ser Glu Ser Tyr Tyr Ile Leu Arg     342
2687 CCA GAG GTG GTG GAG AGC TAC ATG TAC CTG TGG CGA CAG ACC CAC AAC    2734
 343 Pro Glu Val Val Glu Ser Tyr Met Tyr Leu Trp Arg Gln Thr His Asn     358
2735 CCC ATC TAC AGG GAG TGG GGC TGG GAA GGT GGT GCT GGC CTT GGA GAA    2782
 359 Pro Ile Tyr Arg Glu Trp Gly Trp Glu Gly Gly Ala Gly Leu Gly Glu     374
2783 ATA CTG TCG GAC AGA AGC CGG TTT CTC TGG GAT CCA AGA CGT GTA CAG    2830
 375 Ile Leu Ser Asp Arg Ser Arg Phe Leu Trp Asp Pro Arg Arg Val Gln     390
2831 TAG CAC CCC CAA CCA CGG ACA ACA AGC AGC AGA GCT TCT TTC TAG CGG    2878
 391 ***                                                                 391
2879 AGA CAC TAA AGT ATC TCT ATC TTC TGT TCT CTG AAG ATG ACT TGC TCT    2926
2927 CCC TGG AAG ACT GGG TGT TCA ACA CCG AGG CCC ACC CAC TCC CGG TGA    2974
2975 ACC ACT CAG ACA GCT CCG GCA GAG CCT GGG GCA GAC ACT GAC CCC ATC    3022
3023 TCC TGC CGC CGC CCT GGG GCC GCC GCA GGG ATG CCT TGC CTT TTC AGG    3070
3071 ATT TGA GAC TGT TCT CAA AGG GAT TGG GAA CGA AGG CCC CAT CTC GGG    3118
3119 CAG ACC CCC AGC AGA TGT GTC GGA CAA GCA ACT TCT TTT CCT CTG TGA    3166
3167 GGA GAC AAG ACT TGG AGA CTC AGC GAT GTC AGG CCA GGG CCA TGG CCA    3214
3215 CAC TCG CCC ACA CAT TCC TTT CTA CAG AGA ATT TCT ATG AAG CCC ACT    3262
3263 CAC TTG CCA TTC CAG GGC CAA AGG ACC GGA GGT TTG CAT ATC CGC CCC    3310
3311 TTG TAT TTG ATT TGC TTC CTT TTG GTT TCT TGG TTT TTG TTT TTG CTT    3358
3359 GAT TTT GTC TTT TCT CTA CAG TTT AGT TTT GTC ACA ATT ACA CAT ATA    3406
3407 GTT TTC AAA ATC ATG CAC TTT CTA AAA TGG TGT CAT CCT GAA AAA CAA    3454
3455 AAC CCA GTG TTT GCA CAC ACA CAA AAT CTT GAC CCC GTT ATC TAT ATT    3502
3503 TTA AAT GCT TTT TGC CCA ACA CTG ACC CTA TGT TCA ACT TTG TGT CAT    3550
3551 TTA CCT TAT AAT TTG AGG AGG GGT TTC CCT TTG GGC CTC AGT GTT ACA    3598
3599 AAT TAC TAG TGC TAT TTT CAT TAT TAT TGT AAT GGA AAA ATC TGT GGA    3646
3647 CTA GAA TAA AAG AGT TTA TTG AAT TAG AAA AAA AAA AAA AAA AAA AAA    3694
3695 AAA AAA AAA AAA AAA AAA AAA AAA AAA A                              3722
3.PP6425
A:核苷酸序列(SEQ ID NO:7)长度:3750
   1 GCCCGCCCGA GGCCTCAGTC CAGGTGCACC GCATTGAGAG CTCGAACGCC GAGAGCGCAG
  61 CCCCCTCCCA GCACCTGCTG CCGCACCCCA AGCCCTCGCA CCCCCGGCCG CCCACCCAGA
 121 AGCCCCTGGG CCGCTGCTTT CAGGACACTC TGCCCAAGCA GCCGTGTGGC AGCAACCCCC
 181 TCCCCGGCCT CACCAAGCAG GAAGACTGCT GCGGTAGCAT CGGCACTGCC TGGGGCCAGA
 241 GCAAGTGCCA CAAGTGTCCC CAGCTGCAGT ACACAGGAGT GCAGAAGCCA GGGCCTGTAC
 301 GTGGGGAAGT GGGCGCTGAC TGTCCCCAGG GCTACAAGAG GCTTAACAGC ACCCACTGCC
 361 AGGACATCAA CGAGTGCGCA ATGCCGGGCG TGTGTCGCCA TGGTGACTGC CTCAACAACC
 421 CTGGCTCCTA TCGCTGTGTC TGCCCACCTG GCCATAGTTT AGGCCCCTCC CGTACACAGT
 481 GCATTGCAGA CAAACCGGAG GAGAAGAGCC TGTGTTTCCG CCTGGTCGAG CCCTGAGCAC
 541 CAGTGCCAGC ACCCACTGAC CACCCGCCTG ACCCGCCAGC TCTGCTGCTG CAGTGTCGGC
 601 AAGGCCTGGG GCGCGCGGTG TCAGCGCTGC CCAACAGATG GCACCGCTGC GTTCAAGGAG
 661 ATCTGCCCAG CTGGGAAGGG ATACCACATT CTCACCTCCC ACCAGACGCT CACCATTCAG
 721 GGCGAGAGTG ACTTTTCCCT TTTCCTGCAC CCTGACGGGC CACCCAAGCC CCAGCAGCTT
 781 CCGGAGAGCC CTAGCCAGGC TCCACCACCT GAGGACACAG AGGAAGAGAG AGGGGTGACC
 841 ACGGACTCAC CGGTGAGTGA GGAGAGGTCA GTGCAGCAGA GCCACCCAAC TGCCACCACG
 901 ACTCCTGCCC GGCCCTACCC CGAGCTGATC TCCCGTCCCT CGCCCCCGAC CATGCGCTGG
 961 TTCCTGCCGG ACTTGCCTCC TTCCCGCAGC GCCGTAGAGA TCGCTCCCAC TCAGGTCACA
1021 GAGACTGATG AGTGCCGACT GAACCAGAAC ATCTGTGGCC ACGGAGAGTG CGTGCCGGGC
1081 CCCCCTGACT ACTCCTGCCA CTGCAACCCC GGCTACCGGT CACATCCCCA GCACCGCTAC
1141 TGCGTGGATG TGAACGAGTG CGAGGCACGA GCCCTGTGGC CCGGGGAGGG GCATCTGCAT
1201 GAACACCGGC GGCTCCTACA ATTGCCACTG CAACCGCGGC TACCGCCTGC ACGTGGGCGC
1261 CGGGGGGCCT GCGTGCGTGG ACCTGAACGA ATGCGCCAAG CCCCACCTGT GCGGCGACGG
1321 CGGCTTCTGC ATCAACTTTC CCGGTCACTA CAAGTGCAAC TGCTACCCCG GCTACCGGCT
1381 CAAAGCCTCC CGGCCTCCTG TGTGCGAAGA CATCGACGAG TGCCGGGACC CAAGCTCTTG
1441 CCCGGATGGC AAATGCGAGA ACAAGCCCGG GAGCTTCAAG TGCATCGCCT GTCAGCCTGG
1501 CTACCGCAGC CAGGGGGGCG GGGCCTGTCG CGACGTGAAC GAGTGCGCCG AGGGCAGCCC
1561 CTGCTCGCCT GGCTGGTGCG AGAACCTCCC GGGCTCCTTC CGCTGCACCT GTGCCCAGGG
1621 CTACGCGCCC GCGCCCGACG GCCGCAGTTG CTTGGATGTG GACGAGTGTG AGGCTGGGGA
1681 CTGTGTGACA ATGGCATCTG CAGCAACACG CCAGGATCTT TCCAGTGTCA GTGCCTCTCT
1741 GGCTACCATC TGTCCAGGGA CCGGAGCCAC TGCGAGGACA TTGATGAGTG TGACTTCCCT
1801 GCAGCCTGCA TTGGGGGTGA CTGCATCAAT ACCAATGGCT CCTACAGATG TCTTTGCCCC
1861 CAGGGGCATC GGCTGGTGGG TGGCAGGAAA TGCCAAGACA TAGATGAGTG CAGCCAGGAC
1921 CCGAGCCTGT GCCTTCCCCA TGGGGCCTGC AAGAACCTTC AGGGCTCCTA TGTGTGTGTC
1981 TGCGATGAGG GCTTCACTCC CACCCAGGAC CAGCACGGTT GTGAGGAGGT GGAGCAGCCC
2041 CACCACAAGA AGGAGTGCTA CCTGAACTTC GATGACACAG TGTTCTGCGA CAGCGTATTG
2101 GCCACCAACG TGACCCAGCA GGAGTGCTGC TGCTCTCTGG GGGCCGGCTG GGGCGACCAC
2161 TGCGAAATCT ACCCCTGCCC AGTCTACAGC TCAGCCGAGT TCCACAGCCT CTGCCCAGAC
2221 GGAAAGGGCT ACACCCAGGA CAACAACATC GTCAACTACG GCATCCCAGC CCACCGTGAC
2281 ATCGACGAGT GCATGTTGTT CGGGTCGGAG ATTTGCAAGG AGGGCAAGTG CGTGAACACG
2341 CAGCCTGGCT ACGAGTGCTA CTGCAAGCAG GGCTTCTACT ACGACGGGAA CCTGCTGGAA
2401 TGCGTGGACG TGGACGAGTG CCTGGACGAG TCCAACTGCC GGAACGGAGT GTGTGAGAAC
2461 ACGCGCGGCG GCTACCGCTG TGCCTGCACG CCCCCTGCCG AGTACAGTCC CGCGCAGCGC
2521 CAGTCCCTGA GCCCGGAAGA GATGGACGTG GACGAGTGCC AGGACCCGGC AGCCTGCCGC
2581 CCTGGCCGCT GCGTCAACCT GCCGGGCTCC TACCGCTGCG AGTGTCGCCC GCCCTGGGTG
2641 CCCGGGCCCT CCGGCCGCGA TTGCCAGCTC CCCGAGAGCC CGGCCGAGCG TGCCCCGGAG
2701 CGGCGCGACG TGTGCTGGAG CCAGCGCGGA GAGGACGGCA TGTGCGCTGG CCCCCTGGCC
2761 GGGCCTGCCC TCACCTTCGA CGACTGCTGC TGCCGCCAGG GCCGCGGCTG GGGCGCCCAA
2821 TGCCGACCGT GCCCGCCGCG CGGCGCGGGG TCCCATTGCC CGACATCGCA GAGCGAGAGC
2881 AATTCCTTCT GGGACACAAG CCCCCTGCTG TTGGGGAAGC CCCCAAGAGA TGAGGACAGT
2941 TCAGAGGAGG ATTCAGACGA GTGTCGCTGC GTGAGTGCCG CTGCGTGCCG CGGCCGGGCG
3001 GCGCCGTGTG CGAGTGTCCC GGCGGCTTCC AGCTCGACGC CTCCCGCGCC CGCTGCGTGG
3061 ATATCGACGA GTGCCGAGAG CTGAACCAGC GCGGGCTGCT GTGCAAGAGC GAGCGCTGCG
3121 TGAACACCAG CGGCTCCTTC CGCTGCGTCT GCAAAGCCGC GTTCGCGCGC AGCCGCCCGC
3181 ACGGGGCCTG CGTTCCCCAG CGCCGCCTGG ACGCCGCCGA CGCCGCCCTC GGCCCAGACC
3241 TCGGTGATCA CTGAGGGATT TCCGCGAGCT CGGCCTCACT TCTGCCCCGA CTTGTTGCTC
3301 GGACCCAGGG ACCTTCAGGG CCCGCAGACC CTCCCGGCGC CTTGAGACCG AGGCGCCCCT
3361 ACCGGCCCCC CTCCCCGGTT AGCGGGCGGT TGTAAGGTCT CCGGCGGGCG CTGCCTGCCT
3421 TCCTCCCAGA GGGTGTTTCC TAGAAACTGA TAAATCAGAT CGTGCCTCTT TACCCTTGGC
3481 TTTCGAAGCA AATTGATGTT CACGTCTGAC GTGGGCGCGG GCTGCGCAGG GCGGCGCCAG
3541 ACCCCAGCCG CCTCCCAGGG GCTAGACTGA GCCCGGCACA AGGGGTGTGA AATAGAATTT
3601 ATTGTGGCTC TGATTATGTA CACGTTAGAT GGCCTGGCTG GGCCGGCCGG GCTCACATGG
3661 TTTGTACAAT AAATACATCT GTGGGGCGGG CTCTCCGCAG CCGGGAAGGG CCACCGCCAC
3721 GGTTCAGTCC AAAAAAAAAA AAAAAAAAAA
B:氨基酸序列(SEQ ID NO:8)长度:263
   1 MLFGSEICKE GKCVNTQPGY ECYCKQGFYY DGNLLECVDV DECLDESNCR NGVCENTRGG
  61 YRCACTPPAE YSPAQRQSLS PEEMDVDECQ DPAACRPGRC VNLPGSYRCE CRPPWVPGPS
 121 GRDCQLPESP AERAPERRDV CWSQRGEDGM CAGPLAGPAL TFDDCCCRQG RGWGAQCRPC
 181 PPRGAGSHCP TSQSESNSFW DTSPLLLGKP PRDEDSSEED SDECRCVSAA ACRGRAAPCA
 241 SVPAASSSTP PAPAAWISTS AES
C.核苷酸及氨基酸组合序列(SEQ ID NO:9)克隆号:PP6425起始编码子:2293 ATG  终止编码子:3082 TGA  蛋白质分子量:28249.80
   1 GCC CGC CCG AGG CCT CAG TCC AGG TGC ACC GCA TTG AGA GCT CGA ACG     48
  49 CCG AGA GCG CAG CCC CCT CCC AGC ACC TTC TGC CGC ACC CCA AGC CCT     96
  97 CGC ACC CCC GGC CGC CCA CCC AGA AGC CCC TGG GCC GCT GCT TTC AGG    144
 145 ACA CTC TGC CCA AGC AGC CGT GTG GCA GCA ACC CCC TCC CCG GCC TCA    192
 193 CCA AGC AGG AAG ACT GCT GCG GTA GCA TCG GCA CTG CCT GGG GCC AGA    240
 241 GCA AGT GCC ACA AGT GTC CCC AGC TGC AGT ACA CAG GAG TGC AGA AGC    288
 289 CAG GGC CTG TAC GTG GGG AAG TGG GCG CTG ACT GTC CCC AGG GCT ACA    336
 337 AGA GGC TTA ACA GCA CCC ACT GCC AGG ACA TCA ACG AGT GCG CAA TTC    384
 385 CGG GCG TGT GTC GCC ATT GTG ACT GCC TCA ACA ACC CTG GCT CCT ATC    432
 433 GCT GTG TCT GCC CAC CTG GCC ATA GTT TAG GCC CCT CCC GTA CAC AGT    480
 481 GCA TTG CAG ACA AAC CGG AGG AGA AGA GCC TGT GTT TCC GCC TGG TCG    528
 529 AGC CCT GAG CAC CAG TGC CAG CAC CCA CTG ACC ACC CGC CTG ACC CGC    576
 577 CAG CTC TGC TGC TGC AGT GTC GGC AAG GCC TGG GGC GCG CGG TGT CAG    624
 625 CGC TGC CCA ACA GAT GGC ACC GCT GCG TTC AAG GAG ATC TGC CCA GCT    672
 673 GGG AAG GGA TAC CAC ATT CTC ACC TCC CAC CAG ACG CTC ACC ATT CAG    720
 721 GGC GAG AGT GAC TTT TCC CTT TTC CTG CAC CCT GAC GGG CCA CCC AAG    768
 769 CCC CAG CAG CTT CCG GAG AGC CCT AGC CAG GCT CCA CCA CCT GAG GAC    816
 817 ACA GAG GAA GAG AGA GGG GTG ACC ACG GAC TCA CCG GTG AGT GAG GAG    864
 865 AGG TCA GTG CAG CAG AGC CAC CCA ACT GCC ACC ACG ACT CCT GCC CGG    912
 913 CCC TAC CCC GAG CTG ATC TCC CGT CCC TCG CCC CCG ACC ATG CGC TGG    960
 961 TTC CTG CCG GAC TTG CCT CCT TCC CGC AGC GCC GTA GAG ATC GCT CCC   1008
1009 ACT CAG GTC ACA GAG ACT GAT GAG TGC CGA CTG AAC CAG AAC ATC TGT   1056
1057 GGC CAC GGA GAG TGC GTG CCG GGC CCC CCT GAC TAC TCC TGC CAC TGC   1104
1105 AAC CCC GGC TAC CGG TCA CAT CCC CAG CAC CGC TAC TGC GTG GAT GTG   1152
1153 AAC GAG TGC GAG GCA CGA GCC CTG TGG CCC GGG GAG GGG CAT CTG CAT   1200
1201 GAA CAC CGG CGG CTC CTA CAA TTG CCA CTG CAA CCG CGG CTA CCG CCT   1248
1249 GCA CGT GGG CGC CGG GGG GCC TGC GTG CGT GGA CCT GAA CGA ATG CGC   1296
1297 CAA GCC CCA CCT GTG CGG CGA CGG CGG CTT CTG CAT CAA CTT TCC CGG   1344
1345 TCA CTA CAA GTG CAA CTG CTA CCC CGG CTA CCG GCT CAA AGC CTC CCG   1392
1393 GCC TCC TGT GTG CGA AGA CAT CGA CGA GTG CCG GGA CCC AAG CTC TTG   1440
1441 CCC GGA TGG CAA ATG CGA GAA CAA GCC CGG GAG CTT CAA GTG CAT CGC   1488
1489 CTG TCA GCC TGG CTA CCG CAG CCA GGG GGG CGG GGC CTG TCG CGA CGT   1536
1537 GAA CGA GTG CGC CGA GGG CAG CCC CTG CTC GCC TGG CTG GTG CGA GAA   1584
1585 CCT CCC GGG CTC CTT CCG CTG CAC CTG TGC CCA GGG CTA CGC GCC CGC   1632
1633 GCC CGA CGG CCG CAG TTG CTT GGA TGT GGA CGA GTG TGA GGC TGG GGA   1680
1681 CTG TGT GAC AAT GGC ATC TGC AGC AAC ACG CCA GGA TCT TTC CAG TGT   1728
1729 CAG TGC CTC TCT GGC TAC CAT CTG TCC AGG GAC CGG AGC CAC TGC GAG   1776
1777 GAC ATT GAT GAG TGT GAC TTC CCT GCA GCC TGC ATT GGG GGT GAC TGC   1824
1825 ATC AAT ACC AAT GGC TCC TAC AGA TGT CTT TGC CCC CAG GGG CAT CGG   1872
1873 CTG GTG GGT GGC AGG AAA TGC CAA GAC ATA GAT GAG TGC AGC CAG GAC   1920
1921 CCG AGC CTG TGC CTT CCC CAT GGG GCC TGC AAG AAC CTT CAG GGC TCC   1968
1969 TAT GTG TGT GTC TGC GAT GAG GGC TTC ACT CCC ACC CAG GAC CAG CAC   2016
2017 GGT TGT GAG GAG GTG GAG CAG CCC CAC CAC AAG AAG GAG TGC TAC CTG   2064
2065 AAC TTC GAT GAC ACA GTG TTC TGC GAC AGC GTA TTG GCC ACC AAC GTG   2112
2113 ACC CAG CAG GAG TGC TGC TGC TCT CTG GGG GCC GGC TGG GGC GAC CAC   2160
2161 TGC GAA ATC TAC CCC TGC CCA GTC TAC AGC TCA GCC GAG TTC CAC AGC   2208
2209 CTC TGC CCA GAC GGA AAG GGC TAC ACC CAG GAC AAC AAC ATC GTC AAC   2256
2257 TAC GGC ATC CCA GCC CAC CGT GAC ATC GAC GAG TGC ATG TTG TTC GGG   2304
   1                                                 Met Leu Phe Gly      4
2305 TCG GAG ATT TGC AAG GAG GGC AAG TGC GTG AAC ACG CAG CCT GGC TAC   2352
   5 Ser Glu Ile Cys Lys Glu Gly Lys Cys Val Asn Thr Gln Pro Gly Tyr     20
2353 GAG TGC TAC TGC AAG CAG GGC TTC TAC TAC GAC GGG AAC CTG CTG GAA   2400
  21 Glu Cys Tyr Cys Lys Gln Gly Phe Tyr Tyr Asp Gly Asn Leu Leu Glu     36
2401 TGC GTG GAC GTG GAC GAG TGC CTG GAC GAG TCC AAC TGC CGG AAC GGA   2448
  37 Cys Val Asp Val Asp Glu Cys Leu Asp Glu Ser Asn Cys Arg Asn Gly     52
2449 GTG TGT GAG AAC ACG CGC GGC GGC TAC CGC TGT GCC TGC ACG CCC CCT   2496
  53 Val Cys Glu Asn Thr Arg Gly Gly Tyr Arg Cys Ala Cys Thr Pro Pro     68
2497 GCC GAG TAC AGT CCC GCG CAG CGC CAG TCC CTG AGC CCG GAA GAG ATG   2544
  69 Ala Glu Tyr Ser Pro Ala Gln Arg Gln Ser Leu Ser Pro Glu Glu Met     84
2545 GAC GTG GAC GAG TGC CAG GAC CCG GCA GCC TGC CGC CCT GGC CGC TGC   2592
  85 Asp Val Asp Glu Cys Gln Asp Pro Ala Ala Cys Arg Pro Gly Arg Cys    100
2593 GTC AAC CTG CCG GGC TCC TAC CGC TGC GAG TGT CGC CCG CCC TGG GTG   2640
 101 Val Asn Leu Pro Gly Ser Tyr Arg Cys Glu Cys Arg Pro Pro Trp Val    116
2641 CCC GGG CCC TCC GGC CGC GAT TGC CAG CTC CCC GAG AGC CCG GCC GAG   2688
 117 Pro Gly Pro Ser Gly Arg Asp Cys Gln Leu Pro Glu Ser Pro Ala Glu    132
2689 CGT GCC CCG GAG CGG CGC GAC GTG TGC TGG AGC CAG CGC GGA GAG GAC   2736
 133 Arg Ala Pro Glu Arg Arg Asp Val Cys Trp Ser Gln Arg Gly Glu Asp    148
2737 GGC ATG TGC GCT GGC CCC CTG GCC GGG CCT GCC CTC ACC TTC GAC GAC    2784
 149 Gly Met Cys Ala Gly Pro Leu Ala Gly Pro Ala Leu Thr Phe Asp Asp     164
2785 TGC TGC TGC CGC CAG GGC CGC GGC TGG GGC GCC CAA TGC CGA CCG TGC    2832
 165 Cys Cys Cys Arg Gln Gly Arg Gly Trp Gly Ala Gln Cys Arg Pro Cys     180
2833 CCG CCG CGC GGC GCG GGG TCC CAT TGC CCG ACA TCG CAG AGC GAG AGC    2880
 181 Pro Pro Arg Gly Ala Gly Ser His Cys Pro Thr Ser Gln Ser Glu Ser     196
2881 AAT TCC TTC TGG GAC ACA AGC CCC CTG CTG TTG GGG AAG CCC CCA AGA    2928
 197 Asn Ser Phe Trp Asp Thr Ser Pro Leu Leu Leu Gly Lys Pro Pro Arg     212
2929 GAT GAG GAC AGT TCA GAG GAG GAT TCA GAC GAG TGT CGC TGC GTG AGT    2976
 213 Asp Glu Asp Ser Ser Glu Glu Asp Ser Asp Glu Cys Arg Cys Val Ser     228
2977 GCC GCT GCG TGC CGC GGC CGG GCG GCG CCG TGT GCG AGT GTC CCG GCG    3024
 229 Ala Ala Ala Cys Arg Gly Arg Ala Ala Pro Cys Ala Ser Val Pro Ala     244
3025 GCT TCC AGC TCG ACG CCT CCC GCG CCC GCT GCG TGG ATA TCG ACG AGT    3072
 245 Ala Ser Ser Ser Thr Pro Pro Ala Pro Ala Ala Trp Ile Ser Thr Ser     260
3073 GCC GAG AGC TGA ACC AGC GCG GGC TGC TGT GCA AGA GCG AGC GCT GCG    3120
 261 Ala Glu Ser ***                                                     264
3121 TGA ACA CCA GCG GCT CCT TCC GCT GCG TCT GCA AAG CCG CGT TCG CGC    3168
3169 GCA GCC GCC CGC ACG GGG CCT GCG TTC CCC AGC GCC GCC TGG ACG CCG    3216
3217 CCG ACG CCG CCC TCG GCC CAG ACC TCG GTG ATC ACT GAG GGA TTT CCG    3264
3265 CGA GCT CGG CCT CAC TTC TGC CCC GAC TTG TGG CTC GGA CCC AGG GAC    3312
3313 CTT CAG GGC CCG CAG ACC CTC CCG GCG CCT TGA GAC CGA GGC GCC CCT    3360
3361 ACC GGC CCC CCT CCC CGG TTA GCG GGC GGT TGT AAG GTC TCC GGC GGG    3408
3409 CGC TGC CTG CCT TCC TCC CAG AGG GTG TTT CCT AGA AAC TGA TAA ATC    3456
3457 AGA TCG TGC CTC TTT ACC CTT GGC TTT CGA AGC AAA TTG ATG TTC ACG    3504
3505 TCT GAC GTG GGC GCG GGC TGC GCA GGG CGG CGC CAG ACC CCA GCC GCC    3552
3553 TCC CAG GGG CTA GAC TGA GCC CGG CAC AAG GGG TGT GAA ATA GAA TTT    3600
3601 ATT GTG GCT CTG ATT ATG TAC ACG TGA GAT GGC CTG GCT GGG CCG GCC    3648
3649 GGG CTC ACA TGG TTT GTA CAA TAA ATA CAT CTG TGG GGC GGG CTC TCC    3696
3697 GCA GCC GGG AAG GGC CAC CGC CAC GGT TCA GTC CAA AAA AAA AAA AAA    3744
3745 AAA AAA                                                            3750
4.PP7518
A:核苷酸序列(SEQ ID NO:10)长度:2820
   1 GCTGTTCCTG AGGAAAGGAC CTTTGAGCTG AGACCTGCAG GATAAGTCTG GGTGGCACGG
  61 AGCAAAGTGG AGGCCAAGAG CCCAGGGGCA GCCCAGTTTC TCCAGCAGGA GGGAACAGGA
 121 TGCTTTTTGG AAATAAAAGT GAGGCACGGT GGCTTGCACC TGAGTCCCAG CTACGCTACT
 181 CGGGAGGCCA AGGCAGTAAG AGCGCTTGAG CCCAGGGAGT TCGAGGACAG CCTGGGCCAC
 241 AGAGTGCGAC CTCCGTCTCT AAGAACAAAC ACAAACATGG TCAGGAGGCT GTCACTCAGA
 301 GACAGGCAGA ATCAAGAGCT GGTCCTGGAG AGACCAGTGG GGCTGTGTAG ACTGGGAGCT
 361 TTGGTTGTCT TGCTGAGAGC AGGAAGCTGC AGGAAGAAGG CAGTGGTCCC CAGCCAGAAT
 421 ACGGAGTGGC TTGGAGGTGG TCAAAGGTTT GAAGACAGCC ACAGTAAAGT GGACAGAGAC
 481 AAGAAAAATA GGTACCAAAC CGTGCATCCA GGTAGTCACA GAAAGGAAAT GGGTTTAGAT
 541 TGAAGCAATG TGGGTTAAAG TTAGACCCTG GGGAAACCTT GCAGGGGTCT GTAGGCCTGT
 601 GAAGAACTGG ACTAGGTGAG AAGAAGAAGC TTTTGACCCA TGTCACTCCC TGGCCCAGAA
 661 CTATATCCTA CCCACAGGTG GGTTGAGTTC AGGACTGCTG CTTCCAGCCC CCAGCAGCAA
 721 GGTTCAAGTG AGAGCTGACT CACCTAGGGC CCCTTGTTAG AGCCTCAGAG CCAGGTGAAA
 781 AGCCACACAC AGGCTGGGCG CGATGGCTCA CGCCTGTAAT CCCAGCACTT TGGGAGGCCG
 841 AGGCAGGTGG ATCACCTGAG GTCAGGAGTT CAAGACCATC CTGGCCAACA TGGCAAAATC
 901 CCGTCTCTAC TAAAAATACA AAAATTAGTC CTGCCTGGTG GCACATGCCT GTAGTCCCAG
 961 CTACTCGGGA GGCTGAGGCA GGAGAATCGC TTGAACCCGG GAGGCGGAGG TTGCAGTGAG
1021 CCGAGATCAT GCCACTGCAC TCCAGCCTGG GTGACAGAGC GGGACTCTGT CTCCAAAAAA
1081 AGAAAAGCCA CACAGGTGTG TGTGTAGGGG CAAGGGAGTT TCCTACTGTC TTCCTAGCAG
1141 AAAATGGGGA GAAACTGTTA AAGCCAGAAT GAGGGAGGGC TGTGTGTGGC CTGGGACTGG
1201 CAACAGAAGT GTCAAGCTGC CAGGTTTCAG GCCAGTACAG AGCACGGTTC TACCTGGGTT
1261 ATGTGTTGCC GGCACTAATG GTTAGAGACA TCTGTCACTG GTGAGGGCAG AAATGTATGC
1321 AGGAGTGGGT GTGGGAAGCT GGCCTCACTG GTGGGTGGGG TTGGAGACTT TGCCAGGCCT
1381 GGTCAGGAAA AGCTGCTACA AAACAGCAAA ACTGCTCCTA GTGCAGCGAT CCCCAACCTT
1441 TTTGGCAACA GGGAGTATTT TCCTGGAAGA CCATTTTTCC ATGGAGAGGG AGGGCGGGGC
1501 TGGTTTCGGG ATGGAAGTGT TCCATCTCCC ATCATCAGGC ATTAGTCAAA CTCTCCTAAG
1561 GAGCACACAA AACCTACACT CCTGGTGTGC ACAGTTCACA GGAGGGCTTC TGCTTCTGTG
1621 AGAACCAAAT GTCCCACTGA TGTGACAGGA TCAGAGCGCC ATCGCTGCTC ACTTCCTGCA
1681 TGCGGCCCTG TTCCTGACAG GCCACGGACC AGTACCTGGG GTTTGGGGTC CCCCGCCCTA
1741 GGGGATGAAA GAAGGGAAAC CTGGGTCTAA TGGGTTACTG TGATTCTCCC TGCGATGCAG
1801 GGAAGAGACA GGACAGAGGT GGGAAGGAAC ATGGTCACCA GGAGTCGGGA CAGCACTCTT
1861 CCAGGTCCTT CCCCTGGGGC TGAGTAAGCA CCCTGCGCGT AGCTCTTCCT GGCCGCCTGT
1921 GGGCTCTGGG ATCTAAACGG ACTATGCAGC CATTCTCACT TTCATTCACA GCTCGGACAG
1981 GGACAGTGTG TGTTGAGGCG GAAAGACAAA ACATGTATGT GAGAGACTTT GTATGAGCCG
2041 GTTCCTGATG AAGTCCTATC TTTCAGCCTC GTATTTACTG CCCAGGCAGA TGGGGCTCTT
2101 TTCTTCACCC TCCCGCTTTT TTTTTTTGAG ACAGAAAACT TAATAGAAAT TTTGTTTGCA
2161 GTTCTTACAT TCTCAGTGTG AGCCAATCTG TGACCCACCG CCCCACCCAG AAGTGGCCCA
2221 GTCCTGGTGC AGGGTAGGAA GGGAAGGGTG GAGTGAGAAG AGCCCCATTT TTCCTCAGTG
2281 CCAGGGGGCT GGAGACACCA CCCCCTTCTC CTGCCTCTGG GCTCCAGGAA GGAGTGCAGA
2341 TGGACTCTCA GGCCTATGGT TCCTCCTCCA CACCACTGTC CCCCAGGTTG GAGGGGAGTG
2401 AGAGATACAG GGAGAGAAGG GGACAGAGGC AAGAAAAGGT GTTGATCAAG AAAGGCAAGA
2461 ACCAGGGGTG AGGGCTGACA GAGAATCAAA GATAAAACAC TAGTAGGCCG GGCGCGGTGG
2521 CTCATGCCTG TAATCCCAGC ACTTTCGGAA GCCAAGGCGG GCAGATCACC TGAGGTCGGG
2581 AATTCGAGAC CAGCCTGACC AACATGGAGA AACCCTGTCT CTACTACAAA TATAAAATTA
2641 GCCGGGTGTG GTGGCACATG CCTGTAATCC CAGCTGCTCA GGAGGCTGAG GCAGGAGAAT
2701 CGCTTGAACC TGGGAGGCAG AGATTGCAGT GAGCCAAGAT CATGCCACTG CACTCCAGCC
2761 TGGGCAACAA GAGCGAAACT CTGTTGGAAA AAAACAAACA GTAAAAAAAA AAAAAAAAAA
B:氨基酸序列  (SEQ ID NO:11)  长度:102
   1 MYAGVGVGSW PHWWVGLETL PGLVRKSCYK TAKLLLVQRS PTFLATGSIF LEDHFSMERE
  61 GGAGFGMEVF HLPSSGISQT LLRSTQNLHS WCAQFTGGLL LL
C.核苷酸及氨基酸组合序列(SEQ ID NO:12)克隆号:PP7518起始编码子:1313 ATG  终止编码子:1619 TGA  蛋白质分子量:11212.39
   1   G CTG TTC CTG AGG AAA GGA CCT TTG AGC TGA GAC CTG CAG GAT AAG      46
  47 TCT GGG TGG CAC GGA GCA AAG TGG AGG CCA AGA GCC CAG GGG CAG CCC      94
  95 AGT TTC TCC AGC AGG AGG GAA CAG GAT GCT TTT TGG AAA TAA AAG TGA     142
 143 GGC ACG GTG GCT TGC ACC TGA GTC CCA GCT ACG CTA CTC GGG AGG CCA     190
 191 AGG CAG TAA GAG CGC TTG AGC CCA GGG AGT TCG AGG ACA GCC TGG GCC     238
 239 ACA GAG TGC GAC CTC CGT CTC TAA GAA CAA ACA CAA ACA TGG TCA GGA     286
 287 GGC TGT CAC TCA GAG ACA GGC AGA ATC AAG AGC TGG TCC TGG AGA GAC     334
 335 GAG TGG GGC TGT GTA GAC TGG GAG CTT TGG TTG TCT TGC TGA GAG CAG     382
 383 GAA GCT GCA GGA AGA AGG CAG TGG TCC CCA GCC AGA ATA CGG AGT GGC     430
 431 TTG GAG GTG GTC AAA GGT TTG AAG ACA GCC ACA GTA AAG TGG ACA GAG     478
 479 ACA AGA AAA ATA GGT ACC AAA CCG TGC ATC CAG GTA GTC ACA GAA AGG     526
 527 AAA TGG GTT TAG ATT GAA GCA ATG TGG GTT AAA GTT AGA CCC TGG GGA     574
 575 AAC CTT GCA GGG GTC TGT AGG CCT GTG AAG AAC TGG ACT AGG TGA GAA     622
 623 GAA GAA GCT TTT GAC CCA TGT CAC TCC CTG GCC CAG AAC TAT ATC CTA     670
 671 CCC ACA GGT GGG TTG AGT TCA GGA CTG CTG CTT CCA GCC CCC AGC AGC     718
 719 AAG GTT CAA GTG AGA GCT GAC TCA CCT AGG GCC CCT TGT TAG AGC CTC     766
 767 AGA GCC AGG TGA AAA GCC ACA CAC AGG CTG GGC GCG ATG GCT CAC GCC     814
 815 TGT AAT CCC AGC ACT TTG GGA GGC CGA GGC AGG TGG ATC ACC TGA GGT     862
 863 CAG GAG TTC AAG ACC ATC CTG GCC AAC ATG GCA AAA TCC CGT CTC TAC     910
 911 TAA AAA TAC AAA AAT TAG TCC TGC CTG GTG GCA CAT GCC TGT AGT CCC     958
 959 AGC TAC TCG GGA GGC TGA GGC AGG AGA ATC GCT TGA ACC CGG GAG GCG    1006
1007 GAG GTT GCA GTG AGC CGA GAT CAT GCC ACT GCA CTC CAG CCT GGG TGA    1054
1055 CAG AGC GGG ACT CTG TCT CCA AAA AAA GAA AAG CCA CAC AGG TGT GTG    1102
1103 TGT AGG GGC AAG GGA GTT TCC TAC TGT CTT CCT AGC AGA AAA TGG GGA    1150
1151 GAA ACT GTT AAA GCC AGA ATG AGG GAG GGC TGT GTG TGG CCT GGG ACT    1198
1199 GGC AAC AGA AGT GTC AAG CTG CCA GGT TTC AGG CCA GTA CAG AGC ACG    1246
1247 GTT CTA CCT GGG TTA TGT GTT GCC GGC ACT AAT GGT TAG AGA CAT CTG  1294
1295 TCA CTG GTG AGG GCA GAA ATG TAT GCA GGA GTG GGT GTG GGA AGC TGG  1342
   1                         Met Tyr Ala Gly Val Gly Val Gly Ser Trp    10
1343 CCT CAC TGG TGG GTG GGG TTG GAG ACT TTG CCA GGC CTG GTC AGG AAA  1390
  11 Pro His Trp Trp Val Gly Leu Glu Thr Leu Pro Gly Leu Val Arg Lys    26
1391 AGC TGC TAC AAA ACA GCA AAA CTG CTC CTA GTG CAG CGA TCC CCA ACC  1438
  27 Ser Cys Tyr Lys Thr Ala Lys Leu Leu Leu Val Gln Arg Ser Pro Thr    42
1439 TTT TTG GCAA CAG GG AGT ATT TTC CTG GAA GAC CAT TTT TCC ATG GAG  1486
  43 Phe Leu Ala Thr Gly Ser Ile Phe Leu Glu Asp His Phe Ser Met Glu    58
1487 AGG GAG GGC GGG GCT GGT TTC GGG ATG GAA GTG TTC CAT CTC CCA TCA  1534
  59 Arg Glu Gly Gly Ala Gly Phe Gly Met Glu Val Phe His Leu Pro Ser    74
1535 TCA GGC ATT AGT CAA ACT CTC CTA AGG AGC ACA CAA AAC CTA CAC TCC  1582
  75 Ser Gly Ile Ser Gln Thr Leu Leu Arg Ser Thr Gln Asn Leu His Ser    90
1583 TGG TGT GCA CAG TTC ACA GGA GGG CTT CTG CTT CTG TGA GAA CCA AAT  1630
  91 Trp Cys Ala Gln Phe Thr Gly Gly Leu Leu Leu Leu ***               103
1631 GTC CCA CTG ATG TGA CAG GAT CAG AGC GCC ATC GCT GCT CAC TTC CTG  1678
1679 CAT GCG GCC CTG TTC CTG ACA GGC CAC GGA CCA GTA CCT GGG GTT TGG  1726
1727 GGT CCC CCG CCC TAG GGG ATG AAA GAA GGG AAA CCT GGG TCT AAT GGG  1774
1775 TTA CTG TGA TTC TCC CTG CGA TGC AGG GAA GAG ACA GGA CAG AGG TGG  1822
1823 GAA GGA ACA TGG TCA CCA GGA GTC GGG ACA GCA CTC TTC CAG GTC CTT  1870
1871 CCC CTG GGG CTG AGT AAG CAC CCT GCG CGT AGC TCT TCC TGG CCG CCT  1918
1919 GTG GGC TCT GGG ATC TAA ACG GAC TAT GCA GCC ATT CTC ACT TTC ATT  1966
1967 CAC AGC TCG GAC AGG GAC AGT GTG TGT TGA GGC GGA AAG ACA AAA CAT  2014
2015 GTA TGT GAG AGA CTT TGT ATG AGC CGG TTC CTG ATG AAG TCC TAT CTT  2062
2063 TCA GCC TCG TAT TTA CTG CCC AGG CAG ATG GGG CTC TTT TCT TCA CCC   210
2111 TCC CGC TTT TTT TTT TTG AGA CAG AAA ACT TAA TAG AAA TTT TGT TTG  2158
2159 CAG TTC TTA CAT TCT CAG TGT GAG CCA ATC TGT GAC CCA CCG CCC CAC  2206
2207 CCA GAA GTG GCC CAG TCC TGG TGC AGG GTA GGA AGG GAA GGG TGG AGT  2254
2255 GAG AAG AGC CCC ATT TTT CCT CAG TGC CAG GGG GCT GGA GAC ACC ACC  2302
2303 CCC TTC TCC TGC CTC TGG GCT CCA GGA AGG AGT GCA GAT GGA CTC TCA  2350
2351 GGC CTA TGG TTC CTC CTC CAC ACC ACT GTC CCC CAG GTT GGA GGG GAG  2398
2399 TGA GAG ATA CAG GGA GAG AAG GGG ACA GAG GCA AGA AAA GGT GTT GAT  2446
2447 CAA GAA AGG CAA GAA CCA GGG GTG AGG GCT GAC AGA GAA TCA AAG ATA  2494
2495 AAA CAC TAG TAG GCC GGG CGC GGT GGC TCA TGC CTG TAA TCC CAG CAC  2542
2543 TTT CGG AAG CCA AGG CGG GCA GAT CAC CTG AGG TCG GGA ATT CGA GAC  2590
2591 CAG CCT GAC CAA CAT GGA GAA ACC CTG TCT CTA CTA CAA ATA TAA AAT  2638
2639 TAG CCG GGT GTG GTG GCA CAT GCC TGT AAT CCC AGC TGC TCA GGA GGC  2686
2687 TGA GGC AGG AGA ATC GCT TGA ACC TGG GAG GCA GAG ATT GCA GTG AGC  2734
2735 CAA GAT CAT GCC ACT GCA CTC CAG CCT GGG CAA CAA GAG CGA AAC TCT  2782
2783 GTT GGA AAA AAA CAA ACA GTA AAA AAA AAA AAA AAA AA               2820
5.PP9484
A:核苷酸序列(SEQ ID NO:13)长度:1800
   1 GGGAGAACAA GGACCGGAAG GAGCAGGCGG CGAAGGCAGA GAGGAGGAAG CAGCAGCTGG
  61 CGGAGGAGGA GGCGCGGCGG CCTCGGGGAG AGGACGGGAA GCCTGTCAGG AAGGGGCCCG
 121 GGAAGCAGGA GGAGGTGTGT GTCATCGATG CCCTGCTGGC TGACATCAGG AAGGGCTTCC
 181 AGCTGCGGAA GACAGCCCGG GGCCGCGGGG ACACCGACGG GGGCAGCAAG GCAGCCTCCA
 241 TGGATCCCCC AAGAGCCACA GAGCCTGTGG CCACCAGTAA CCCTGCAGGA GACCCCGTGG
 301 GCAGCACGCG CTGTCCCGCC TCTGAGCCCG GCCTTGATGC TACAACAGCC AGCGAGTCCC
 361 GGGGCTGGGA CCTTGTAGAC GCCGTGACCC CCGGCCCTCA CCCACCCTGG AGCAGTTGGA
 421 GGAGGGTGGT CCCCGGCCCC TGGAGAGGCG TTCTTCCTGG TATGTGGATG CCAGCGATGT
 481 CCTAACCACT GAGGATCCCC AGTGCCCCCA GCCCTTGGAG GGGGCCTGGC CGGTGACTCT
 541 GGGAGATGCT CAGGCCCTGA AGCCCCTCAA GTTCTCCAGC AACCAGCCCC CTGCAGCCGG
 601 AAGTTCAAGG CAAGATGCCA AGGATCCCAC GTCCTTGCTG GGCGTCCTCC AGGCCGAGGC
 661 CGACAGCACA AGTGAGGGGC TGGAGGACGC TGTCCACAGC CGTGGTGCCA GACCCCCTGC
 721 AGCAGGCCCA GGTGGGGATG AGGACGAGGA CGAGGAGGAC ACGGCCCCAG AGTCCGCACT
 781 GGACACATCC CTGGACAAGT CCTTCTCCGA GGATGCGGTT GACCGACTCC TCGGGGTCGG
 841 GCACACTCCC CAGGGCCCGG GGCCGGGCCT CAAAGGGGAC CGGGAAGCGA AGGAAGAAGC
 901 GTCCCTCCAG GAGCCAGGAA GAGGTTCCCC CTGATTCTGA TGATAATAAA ACAAAGAAAC
 961 TGTGTGTGAT CCAGTAAGGC CTCAGGCCCA GGCCCAAGGC CAAGTGAGAG AGCCCAGGCC
1021 ACAGGACATG CTGCCATTCT GCCAAGAGAG GCTCTTCTGG GGGCCAGGCT GGGACTGGGC
1081 CCCGGAAACC AAAACTCCGT GCCTTACCCA GCCGGGGCCC TCCTGGAGCC TTCTTGGGGT
1141 GTTGTGGCTG GGAACCCGAC AGGCACCAGT GCCCTGCCAG GCCTGGTGCC CTCCTGGACC
1201 GCCTGCACGT GCCAGCCTCC CACCTGCTTC CTAAAGGCAA CCCTGGCCCA CACCCGCATG
1261 CGCCCGGTGC AGCCTGCCAA GGGCCAGTCG GGGGGTGCTG CGTCCTGCCA GTGTCCACCA
1321 CAGCTCTGCC TGCCCTTCAG CCCAGCAAGG TTTAATCAAA ATGCAATGCT TTGCAAGTCT
1381 TTACTGCTTG GAGGTGGCTG AGTTGGGGGC CCTGGGCAGG GGTAAGCTGG CAGGCAGTGC
1441 CATGGCAGGC CAGGGTCCCC TCCCATGGGG TCTGGCCCCC GTTCCAGCAT GTCCAGCCCC
1501 TGAAGTTGGA GTTGGGGGCG GTCTGCCTTT GCTCCCACTG CCAGGCCTCT GCCCTGCAGC
1561 TGAAACTTGG CCATCACATC AACAGAAAAC CCCTCCCAGT GCCAGCTGCC CAGCGTGGGC
1621 AGGCCCTGGG GACAATACAG GTCCACCTGA GGGGCTGCAG GGTGACACCC AGCAGCCGCT
1681 GCCCCCTCAC TGCCCACCCA GCGAGGGCAG CCTACCCGAG CCTGCCCCCT GCCAGGTGTG
1741 TGCCCTGAGG CTGGCGGCTG GATGCGTGGC CAATAAAAAG CAGACCTAAA AAAAAAAAAA
B:氨基酸序列(SEQ ID NO:14)长度:142
   1 MQCFASLYCL EVAELGALGR GKLAGSAMAG QGPLPWGLAP VPACPAPEVG VGGGLPLLPL
  61 PGLCPAAETW PSHQQKTPPS ASCPAWAGPG DNTGPPEGLQ GDTQQPLPPH CPPSEGSLPE
 121 PAPCQVCALR LAAGCVANKK QT
C.核苷酸及氨基酸组合序列(SEQ ID NO:15)克隆号:PP9484起始编码子:1361 ATG  终止编码子:1789 TAA  蛋白质分子量:14187.57
   1   G GGA GAA CAA GGA CCG GAA GGA GCA GGC GGC GAA GGC AGA GAG GAG      46
  47 GAA GCA GCA GCT GGC GGA GGA GGA GGC GCG GCG GCC TCG GGG AGA GGA      94
  95 CGG GAA GCC TGT CAG GAA GGG GCC CGG GAA GCA GGA GGA GGT GTG TGT     142
 143 CAT CGA TGC CCT GCT GGC TGA CAT CAG GAA GGG CTT CCA GCT GCG GAA     190
 191 GAC AGC CCG GGG CCG CGG GGA CAC CGA CGG GGG CAG CAA GGC AGC CTC     238
 239 CAT GGA TCC CCC AAG AGC CAC AGA GCC TGT GGC CAC CAG TAA CCC TGC     286
 287 AGG AGA CCC CGT GGG CAG CAC GCG CTG TCC CGC CTC TGA GCC CGG CCT     334
 335 TGA TGC TAC AAC AGC CAG CGA GTC CCG GGG CTG GGA CCT TGT AGA CGC     382
 383 CGT GAC CCC CGG CCC TCA CCC ACC CTG GAG CAG TTG GAG GAG GGT GGT     430
 431 CCC CGG CCC CTG GAG AGG CGT TCT TCC TGG TAT GTG GAT GCC AGC GAT     478
 479 GTC CTA ACC ACT GAG GAT CCC CAG TGC CCC CAG CCC TTG GAG GGG GCC     526
 527 TGG CCG GTG ACT CTG GGA GAT GCT CAG GCC CTG AAG CCC CTC AAG TTC     574
 575 TCC AGC AAC CAG CCC CCT GCA GCC GGA AGT TCA AGG CAA GAT GCC AAG     622
 623 GAT CCC ACG TCC TTG CTG GGC GTC CTC CAG GCC GAG GCC GAC AGC ACA     670
 671 AGT GAG GGG CTG GAG GAC GCT GTC CAC AGC CGT GGT GCC AGA CCC CCT     718
 719 GCA GCA GGC CCA GGT GGG GAT GAG GAC GAG GAC GAG GAG GAC ACG GCC     766
 767 CCA GAG TCC GCA CTG GAC ACA TCC CTG GAC AAG TCC TTC TCC GAG GAT     814
 815 GCG GTT GAC CGA CTC GTC GGG GTC GGG CAC ACT CCC CAG GGC CCG GGG     862
 863 CCG GGC CTC AAA GGG GAC CGG GAA GCG AAG GAA GAA GCG TCC CTC CAG     910
 911 GAG CCA GGA AGA GGT TCC CCC TGA TTC TGA TGA TAA TAA AAC AAA GAA     958
 959 ACT GTG TGT GAT CCA GTA AGG CCT CAG GCC CAG GCC CAA GGC CAA GTG    1006
1007 AGA GAG CCC AGG CCA CAG GAC ATG CTG CCA TTC TGC CAA GAG AGG CTC    1054
1055 TTC TGG GGG CCA GGC TGG GAC TGG GCC CCG GAA ACC AAA ACT CCG TGC    1102
1103 CTT ACC CAG CCG GGG CCC TCC TGG AGC CTT CTT GGG GTG TTG TGG CTG    1150
1151 GGA ACC CGA CAG GCA CCA GTG CCC TGC CAG GCC TGG TGC CCT CCT GGA    1198
1199 CCG CCT GCA CGT GCC AGC CTC CCA CCT GCT TCC TAA AGG CAA CCC TGG    1246
1247 CCC ACA CCC GCA TGC GCC CGG TGC AGC CTG CCA AGG GCC AGT CGG GGG    1294
1295 GTG CTG CGT CCT GCC AGT GTC CAC CAC AGC TCT GCC TGC CCT TCA GCC    1342
1343 CAG CAA GGT TTA ATC AAA ATG CAA TGC TTT GCA AGT CTT TAC TGC TTG    1390
   1                         Met Gln Cys Phe Ala Ser Leu Tyr Cys Leu      10
1391 GAG GTG GCT GAG TTG GGG GCC CTG GGC AGG GGT AAG CTG GCA GGC AGT    1438
  11 Glu Val Ala Glu Leu Gly Ala Leu Gly Arg Gly Lys Leu Ala Gly Ser      26
1439 GCC ATG GCA GGC CAG GGT CCC CTC CCA TGG GGT CTG GCC CCC GTT CCA    1486
  27 Ala Met Ala Gly Gln Gly Pro Leu Pro Trp Gly Leu Ala Pro Val Pro     42
1487 GCA TGT CCA GCC CCT GAA GTT GGA GTT GGG GGC GGT CTG CCT TTG CTG   1534
  43 Ala Cys Pro Ala Pro Glu Val Gly Val Gly Gly Gly Leu Pro Leu Leu     58
1535 CCA CTG CCA GGC CTC TGC CCT GCA GCT GAA ACT TGG CCA TCA CAT CAA   1582
  59 Pro Leu Pro Gly Leu Cys Pro Ala Ala Glu Thr Trp Pro Ser His Gln     74
1583 CAG AAA ACC CCT CCC AGT GCC AGC TGC CCA GCG TGG GCA GGC CCT GGG   1630
  75 Gln Lys Thr Pro Pro Ser Ala Ser Cys Pro Ala Trp Ala Gly Pro Gly     90
1631 GAC AAT ACA GGT CCA CCT GAG GGG CTG CAG GGT GAC ACC CAG CAG CCG   1678
  91 Asp Asn Thr Gly Pro Pro Glu Gly Leu Gln Gly Asp Thr Gln Gln Pro    106
1679 CTG CCC CCT CAC TGC CCA CCC AGC GAG GGC AGC CTA CCC GAG CCT GCC   1726
 107 Leu Pro Pro His Cys Pro Pro Ser Glu Gly Ser Leu Pro Glu Pro Ala    122
1727 CCC TGC CAG GTG TGT GCC CTG AGG CTG GCG GCT GGA TGC GTG GCC AAT   1774
 123 Pro Cys Gln Val Cys Ala Leu Arg Leu Ala Ala Gly Cys Val Ala Asn    138
1775 AAA AAG CAG ACC TAA AAA AAA AAA AA                                1800
 139 Lys Lys Gln Thr ***                                                143
 6.PP9964
 A:核苷酸序列(SEQ ID NO:16)长度:2479
   1 GTGAGGGCGG AAGGGACAGG CATAGGAGGG ACTCTGTGGG AGGCATTTGG GGTTGGCTTT
  61 CCTAGGCCCC TGGCCCACCT CCACCTTGGC TTTGGAGAAG GGGAGCCGCT ACAGGGGATG
 121 GCAGCTGGGA AAGGCCCCCT GGCCACCCCC AGCAACCCCA CTGCTGGCTT CTGTGTCAGG
 181 GCCCGCCGAA ACCCAGGCCC ACTCTTCCTA GAGGCCTGTC AGCAGCCACT AGGGCCAGGG
 241 ACTGTGGGTG AGGCCACTCG GACCCTGCCC CCAGTCTGTC TGGGCCTGAG AAGGGCCTGG
 301 TGTGCGGTGG GCTTGCAGCA CTCAGTGATG GTCAGGCCAG GCAGGTTATG TGTTGCCCTC
 361 TCCCACCCTA GCGTCCCCAC CCTCCCCAGG CAGACTCTTC CCAGCAGCAA GCGGAAGCCC
 421 GGGCAGAGGC TGCTGTCATA GGCAGAGGCC CCCGCTGATG CCGGCCCTGC TTGCCCCTCA
 481 CACTGCCAGG TCTTCACGTG CTCTGTGTGC CAGGAGACAT TCCGCCGAAG GATGGAGCTG
 541 CGGGTGCACA TGGTGTCTCA CACAGGGGAG ATGCCCTACA AGGTCAGGCT TGGCCTGTCT
 601 CCAGGGCCAG GGTTGGGTGG CCCCAGGATC CTTCCTGCTG AGCCCTTTAC GTGGGGTGCT
 661 GTCAGGCACC TCCCTCACAG TAGCTGTCAG GGAGCCTGCC TTCCCTGCCT TCCCTGCCTT
 721 TCCAGTGCCC CCTTATCTAG GCAAGGGCTA CTGTCTGCAG CCTCACCTCC AAGGTCCTTA
 781 TTAGGCCCTT GTTTCTTTCC ATGGAGGACA GGCTTGGCAT CCTCTGGGCA GCTGAGCCCT
 841 GAGGCCCTCC TTTGCACCAT CCTTCACACC AGATCAGGGG TCCTCCCAGA ATCATCTCAC
 901 CGGGGCCTCC CTCTAGTTCC TGCCCTATAG CCCAAGGGTG GGTGGCAGGG TTTCATGGGT
 961 GCAGGCCGCC TGGAGGTGAC TGTGGGCCTC TTTTTCAGTG TTCCTCCTGC TCCCAGCAGT
1021 TCATGCAGAA GAAGGACTTG CAGAGCCACA TGATCAAACT TCATGGAGCC CCCAAGCCCC
1081 ATGCATGCCC CACCTGTGCC AAGTGCTTCC TGTCTCGGAC AGAGCTGCAG CTGCATGAAG
1141 CTTTCAAGCA CCGTGGTGAG AAGCTGTTTG TGTGTGAGGA GTGTGGGCAC CGGGCCTCGA
1201 GCCGGAATGG CCTGCAGATG CACATCAAGG CCAAGCACAG GAATGAGAGG CCACACGTAT
1261 GTGAGTTCTG CAGCCACGCC TTCACCCAAA AGGCCAATCT CAACATGCAC CTGCGCACAC
1321 ACACGGGTGA GAAGCCCTTC CAGTGCCACC TCTGTGGCAA CACCTTCCGA ACCCAAGGTG
1381 AGGTACGCCC TGCCCCTCCC CTCGCCTCCC CATCCTGAGG CCAAGGCCAC AGGCTGAGCT
1441 CTTGCCTTGT GCCTGCAGCC AGCCTGGACA AGCACAACCG CACCCACACC GGGGAAAGGC
1501 CCTTCAGTTG CGAGTTCTGT GAACAGCGCT TCACTGAGAA GGGGCCCCTC CTGAGGCACG
1561 TGGCCAGCCG CCATCAGGAG GCCCGGCCCC ACTTCTGCCA GATATGCGGC AAGACCTTCA
1621 AAGGTACCTG GGCGGCCCTG GGAGAGCCAT TTCCTGCTCA TCCGAGTTGG AGGGTCTCTG
1681 AGGAGGAAAC GCTCCTTTCT TGCCTGTGAA CCTCTTTTGT GCCCCACATG GTTAGAGTTG
1741 AGAGTGGACC TGCTTTGAAG GCAGGGGTGT CCTTGTGCAC GTAGTGACCC TGGGTGGCAC
1801 TGCAGAGCCT GGCAGGCCCT GTGCAGCACT TGTAAACCAC TGGTCCCCTC CCTTGCTGCC
1861 TGTCCCAACC TCCTGCTGGG TTTCCTCGAG GGTCCCGGGG CTCCTGCATG ATCCCCCACG
1921 GTGTTCTCCC TCTTGCAGCC GTGGAGCAAC TGCGTGTGCA CGTCAGACGG CACAAGGGGG
1981 TGAGGAAGTT TGAGTGCACC GAGTGTGGCT ACAAGTTTAC CCGACAAGTA GGCCAGGGCC
2041 TGGGCCCTTC CCCTACCCTA GGATCCCCCA AAGTTCTGAG CTCACCCTCC CCGCCAGGCC
2101 CACCTGCGGA GGCACATGGA GATCCACGAC CGGGTAGAGA ACTACAACCC GCGGCAGCGC
2161 AAGCTCCGGC AACCTGATCA TCGAGGACGA GAAGATGGTG GTGGTGGCGC TGCAGCCGCC
2221 TGCAGAGCTG GAGGTGGGCT CGGCGGAGGT CATTGTGGAG TCCCTGGCCC AGGGCGGCCT
2281 GGCCTCCCAG CTCCCCGGCC AGAGACTGTG TGCAGAGGAG AGCTTCACCG GCCCAGGTGT
2341 CCTGGAGCCC TCCCTCATCA TCACAGCTGC TGTCCCCGAG GACTGTGACA CATAGCCCAT
2401 TCTGGCCACC AGAGCCCACT TGGCCCCACC CCTCAATAAA CCGTGTGGCT TTGGAAAAAA
2461 AAAAAAAAAA AACTCTAGG
B:氨基酸序列  (SEQ ID NO:17)长度:132
   1 MELRVHMVSH TGEMPYKVRL GLSPGPGLGG PRILPAEPFT WGAVRHLPHS SCQGACLPCL
  61 PCLSSAPLSR QGLLSAASPP RSLLGPCFFP WRTGLASSGQ LSPEALLCTI LHTRSGVLPE
 121 SSHRGLPLVP AL
C.核苷酸及氨基酸组合序列(SEQ ID NO:18)克隆号:PP9964起始编码子:532 ATG  终止编码子:928 TAG  蛋白质分子量:13902.54
   1 GTG AGG GCG GAA GGG ACA GGC ATA GGA GGG ACT CTG TGG GAG GCA TTT      48
  49 GGG GTT GGC TTT CCT AGG CCC CTG GCC CAC CTC CAC CTT GGC TTT GGA      96
  97 GAA GGG GAG CCG CTA CAG GGG ATG GCA GCT GGG AAA GGC CCC CTG GCC     144
 145 ACC CCC AGC AAC CCC ACT GCT GGC TTC TGT GTC AGG GCC CGC CGA AAC     192
 193 CCA GGC CCA CTC TTC CTA GAG GCC TGT CAG CAG CCA CTA GGG CCA GGG     240
 241 ACT GTG GGT GAG GCC ACT CGG ACC CTG CCC CCA GTC TGT CTG GGC CTG     288
 289 AGA AGG GCC TGG TGT GCG GTG GGC TTG CAG CAC TCA GTG ATG GTC AGG     336
 337 CCA GGC AGG TTA TGT GTT GCC CTC TCC CAC CCT AGC GTC CCC ACC CTC     384
 385 CCC AGG CAG ACT CTT CCC AGC AGC AAG CGG AAG CCC GGG CAG AGG CTG     432
 433 CTG TCA TAG GCA GAG GCC CCC GCT GAT GCC GGC CCT GCT TGC CCC TCA     480
 481 CAC TGC CAG GTC TTC ACG TGC TCT GTG TGC CAG GAG ACA TTC CGC CGA     528
 529 AGG ATG GAG CTG CGG GTG CAC ATG GTG TCT CAC ACA GGG GAG ATG CCC     576
   1     Met Glu Leu Arg Val His Met Val Ser His Thr Gly Glu Met Pro      15
 577 TAC AAG GTC AGG CTT GGC CTG TCT CCA GGG CCA GGG TTG GGT GGC CCC     624
  16 Tyr Lys Val Arg Leu Gly Leu Ser Pro Gly Pro Gly Leu Gly Gly Pro      31
 625 AGG ATC CTT CCT GCT GAG CCC TTT ACG TGG GGT GCT GTC AGG CAC CTC     672
  32 Arg Ile Leu Pro Ala Glu Pro Phe Thr Trp Gly Ala Val Arg His Leu      47
 673 CCT CAC AGT AGC TGT CAG GGA GCC TGC CTT CCC TGC CTT CCC TGC CTT     720
  48 Pro His Ser Ser Cys Gln Gly Ala Cys Leu Pro Cys Leu Pro Cys Leu      63
 721 TCC AGT GCC CCC TTA TCT AGG CAA GGG CTA CTG TCT GCA GCC TCA CCT     768
  64 Ser Ser Ala Pro Leu Ser Arg Gln Gly Leu Leu Ser Ala Ala Ser Pro      79
 769 CCA AGG TCC TTA TTA GGC CCT TGT TTC TTT CCA TGG AGG ACA GGC TTG     816
  80 Pro Arg Ser Leu Leu Gly Pro Cys Phe Phe Pro Trp Arg Thr Gly Leu      95
 817 GCA TCC TCT GGG CAG CTG AGC CCT GAG GCC CTC CTT TGC ACC ATC CTT     864
  96 Ala Ser Ser Gly Gln Leu Ser Pro Glu Ala Leu Leu Cys Thr Ile Leu     111
 865 CAC ACC AGA TCA GGG GTC CTC CCA GAA TCA TCT CAC CGG GGC CTC CCT     912
 112 His Thr Arg Ser Gly Val Leu Pro Glu Ser Ser His Arg Gly Leu Pro     127
 913 CTA GTT CCT GCC CTA TAG CCC AAG GGT GGG TGG CAG GGT TTC ATG GGT     960
 128 Leu Val Pro Ala Leu ***                                             133
 961 GCA GGC CGC CTG GAG GTG ACT GTG GGC CTC TTT TTC AGT GTT CCT CCT    1008
1009 GCT CCC AGC AGT TCA TGC AGA AGA AGG ACT TGC AGA GCC ACA TGA TCA    1056
1057 AAC TTC ATG GAG CCC CCA AGC CCC ATG CAT GCC CCA CCT GTG CCA AGT    1104
1105 GCT TCC TGT CTC GGA CAG AGC TGC AGC TGC ATG AAG CTT TCA AGC ACC    1152
1153 GTG GTG AGA AGC TGT TTG TGT GTG AGG AGT GTG GGC ACC GGG CCT CGA    1200
1201 GCC GGA ATG GCC TGC AGA TGC ACA TCA AGG CCA AGC ACA GGA ATG AGA    1248
1249 GGC CAC ACG TAT GTG AGT TCT GCA GCC ACG CCT TCA CCC AAA AGG CCA    1296
1297 ATC TCA ACA TGC ACC TGC GCA CAC ACA CGG GTG AGA AGC CCT TCC AGT    1344
1345 GCC ACC TCT GTG GCA AGA CCT TCC GAA CCC AAG GTG AGG TAC GCC CTG    1392
1393 CCC CTC CCC TCG CCT CCC CAT CCT GAG GCC AAG GCC ACA GGC TGA GCT    1440
1441 CTT GCC TTG TGC CTG CAG CCA GCC TGG ACA AGC ACA ACC GCA CCC ACA    1488
1489 CCG GGG AAA GGC CCT TCA GTT GCG AGT TCT GTG AAC AGC GCT TCA CTG    1536
1537 AGA AGG GGC CCC TCC TGA GGC ACG TGG CCA GCC GCC ATC AGG AGG GCC    1584
1585 GGC CCC ACT TCT GCC AGA TAT GCG GCA AGA CCT TCA AAG GTA CCT GGG    1632
1633 CGG CCC TGG GAG AGC CAT TTC CTG CTC ATC CGA GTT GGA GGG TCT CTG  1680
1681 AGG AGG AAA CGC TCC TTT CTT GCC TGT GAA CCT CTT TTG TGC CCC ACA  1728
1729 TGG TTA GAG TTG AGA GTG GAC CTG CTT TGA AGG CAG GGG TGT CCT TGT  1776
1777 GCA CGT AGT GAC CCT GGG TGG CAC TGG AGA GCC TGG CAG GGC CTG TGC  1824
1825 AGC ACT TGT AAA CCA CTG GTC CCC TCC CTT GCT GCC TGT CCC AAC CTC  1872
1873 CTG CTG GGT TTC CTC GAG GGT CCC GGG GCT CCT GCA TGA TCC CCC ACG  1920
1921 GTG TTC TCC CTC TTG CAG CCG TGG AGC AAC TGC GTG TGC ACG TCA GAC  1968
1969 GGC ACA AGG GGG TGA GGA AGT TTG AGT GCA CCG AGT GTG GCT ACA AGT  2016
2017 TTA CCC GAC AAG TAG GCC AGG GCC TGG GCC CTT CCC CTA CCC TAG GAT  2064
2065 CCC CCA AAG TTC TGA GCT CAC CCT CCC CGC CAG GCC CAC CTG CGG AGG  2112
2113 CAC ATG GAG ATC CAC GAC CGG GTA GAG AAC TAC AAC CCG CGG CAG CGC  2160
2161 AAG CTC CGG CAA CCT GAT CAT CGA GGA CGA GAA GAT GGT GGT GGT GGC  2208
2209 GCT GCA GCC GCC TGC AGA GCT GGA GGT GGG CTC GGC GGA GGT CAT TGT  2256
2257 GGA GTC CCT GGC CCA GGG CGG CCT GGC CTC CCA GCT CCC CGG CCA GAG  2304
2305 ACT GTG TGC AGA GGA GAG CTT CAC CGG CCC AGG TGT CCT GGA GCC CTC  2352
2353 CCT CAT CAT CAC AGC TGC TGT CCC CGA GGA CTG TGA CAC ATA GCC CAT  2400
2401 TCT GGC CAC CAG AGC CCA CTT GGC CCC ACC CCT CAA TAA ACC GTG TGG  2448
2449 CTT TGG AAA AAA AAA AAA AAA AAA CTC TAG G                        2479
7.PP10394
A:核苷酸序列(SEQ ID NO:19)长度:1916
   1 GTCTAGTTGC TTTATATGTA CTTGCTACGT AGGAGGCAGT GTTCTGGACA TTGGAGATGG
  61 AGTAGTGACT GACACATACC CAAACAGTTA TTTCCCTCAT GAAGAGTATT TTCTTACTTT
 121 CTGTCTCACA GACTTGCTAG TCACTGTTGA TCCTTGGCAA AGACCTGTGA GACACAGAGC
 181 TTGTTTAGAG AAGTTCGCCA TTTCTCCCTG CCAGAGGGAC TCTTCTTCAG ACCCCCAGCG
 241 GGCCCCAATA GTCCTCACTG ATGCTTTGAT TGAGGGGCTA AGAATACTGA TGTGCATAGA
 301 GAGGCTTGTT AGCTTCAGCT GCAGTGAGAT CTGGTAGGTA AATAAACTTA AGGACAAGTG
 361 GATGTGAGGA GGAGCAGGCT AGAGCCTGGT ATTACCAGGG CACATTGCAG AGTCCTCCAG
 421 ATGTAAACAT TTTGCTGATT AAATTGATGA TTTGGCAGGA ACCGTATCTC TAAGGTGCGA
 481 CTCTCAAGAC TTCCCTGATT TATTGCAGGA GATGCTGTTT ACTCTGACAG TCTCAAAAAC
 541 ACCCATTAAT TGTTCCGGGT CCCTTTTGTG CTTCTTGACT TCCCCGTGGG TGTTTCACAT
 601 AGATGTTATT GAGTATGACT GGGGAGAACA TGATAATTTG TTGCTTCTTG ACTTCCCCGT
 661 GGGTGTTTCA CATAGATGTT ATTGAGTATG ACTGGGGAGA ACATGATAAT TTCTTTGACT
 721 GGAGCTGCTT GCTTGCCTCT TAATGCCAGG AGTTGCAAAG TCCAAGGCCA AAAGGATAGC
 781 CCTACAGGTG GTCCCCTCGT GGCAGGTGGT GGACAAATGG GTTGGACTCT GTGTAAGACA
 841 CTTGGGAGTA GAGGGAGTAT GGAGAAATGG AAAGCTAAAG GGCCCACCCA GGGGGACAGT
 901 TGTGTCTGGA AGCTTGCCAG AGTCATGGGC CTCATCTTGG GATGGGCCAG TGTCTTCAGA
 961 ACATTAAACG CTGATTTGCA TGTACTGTTC TAAACACTCT GTGTGTTTTA GCTTGATTAC
1021 TCACAATGGC TCCATGAGTA AAGTAGGTCT GTCTACTACT TCTTCCCCAC CTTTTTCTTA
1081 ATAGACAAGG AAACTGAGGC ATGGAGATGT TACATCAGGT TGCTGGAGCT GGGCAGATCC
1141 TGGAGCCTGT GCACTGCTAC TGCCTTTATA TGTCTCCTCT GATTTCATTT GTTGGTGTCT
1201 AAATCGAATA CCTTACAAAC CAGTGTAGAC CTGATACCCT GTGGCTAAAA CAAAACCTGA
1261 GTGTGCACTG TATTGGGCTT GTGAGCAGTC AGCTTGTGAC CTCTGTTCTG TGGTTTTATT
1321 GGCACGTAGC AGTACAAGGA TGGTGAGGGG TGGGTAGGGG GCAGACAGCT AGGCACTTGA
1381 AAGGAAAGCT CATCTGGAAA GATTGGATCG TCTCAAATGC ACATACTCGT ACACTCGATT
1441 GAAGCGTACT CTGTGCCTAC TAGATCTTTT CACAGCCAAA AACACCTGGC AACCCTTGGA
1501 GAAGTAACTA TTCCTTTTTT TCACAAGTAA GAAAATAGAG CCTCAGAAAA TTTAACAGTT
1561 GTCTAAGCTA GAAAGTAGCA GGACTGGACT TTGAAGTAGT CTTTAGGTTG TGCTGTACAT
1621 TTTGTGGATA TGCTTAAATC ACAGTTTAGC TTGTACACAT TTTCCTTTAT TAGAATTGGA
1681 AGTAAGTATT AATGTTTGAA AAAATATTTT AGCCTGACAA TATTTATTCT ATCTTCATAT
1741 GTTTTTGAAA TTAGATATTT TAAACTAGGC ACGGTGGCTC ACGCATGTAA TCTCAGCAGT
1801 TTGGGAGGCC GAGGCAGGCA GGTCACAAGG TCAGGAGCTC CAGACCAGCC TGACCGACAT
1861 GGTGAAACCC TATTCTTCTA CCAAAAATTC AAAAAAAAAA AAAAAAAAAA AAAAAAB:氨基酸序列(SEQ ID NO:20)长度:105
 1 MLLSMTGENM IISLTGAACL PLNARSCKVQ GQKDSPTGGP LVAGGGQMGW TLCKTLGSRG
 61 SMEKWKAKGPTQGDSCVWKL ARVMGLILGW ASVFRTLNAD LHVLF
C.核苷酸及氨基酸组合序列(SEQ ID NO:21)克隆号:PP10394起始编码子676 ATG  终止编码子:991 TAA  蛋白质分子量:11109.53
   1 GTC TAG TTG CTT TAT ATG TAC TTG CTA CGT AGG AGG CAG TGT TCT GGA     48
  49 CAT TGG AGA TGG AGT AGT GAC TGA CAC ATA CCC AAA CAG TTA TTT CCC     96
  97 TCA TGA AGA GTA TTT TCT TAC TTT CTG TCT CAC AGA CTT GCT AGT CAC    144
 145 TGT TGA TCC TTG GCA AAG ACC TGT GAG ACA CAG AGC TTG TTT AGA GAA    192
 193 GTT CGC CAT TTC TCC CTG CCA GAG GGA CTC TTC TTC AGA CCC CCA GCG    240
 241 GGC CCC AAT AGT CCT CAC TGA TGC TTT GAT TGA GGG GCT AAG AAT ACT    288
 289 GAT GTG CAT AGA GAG GCT TGT TAG CTT CAG CTG CAG TGA GAT CTG GTA    336
 337 GGT AAA TAA ACT TAA GGA CAA GTG GAT GTG AGG AGG AGC AGG CTA GAG    384
 385 CCT GGT ATT ACC AGG GCA CAT TGC AGA GTC CTC CAG ATG TAA ACA TTT    432
 433 TGC TGA TTA AAT TGA TGA TTT GGC AGG AAC CGT ATC TCT AAG GTG CGA    480
 481 CTC TCA AGA CTT CCC TGA TTT ATT GCA GGA GAT GCT GTT TAC TCT GAC    528
 529 AGT CTC AAA AAC ACC CAT TAA TTG TTC CGG GTC CCT TTT GTG CTT CTT    576
 577 GAC TTC CCC GTG GGT GTT TCA CAT AGA TGT TAT TGA GTA TGA CTG GGG    624
 625 AGA ACA TGA TAA TTT GTT GCT TCT TGA CTT CCC CGT GGG TGT TTC ACA    672
 673 TAG ATG TTA TTG AGT ATG ACT GGG GAG AAC ATG ATA ATT TCT TTG ACT    720
   1     Met Leu Leu Ser Met Thr Gly Glu Asn Met Ile Ile Ser Leu Thr     15
 721 GGA GCT GCT TGC TTG CCT CTT AAT GCC AGG AGT TGC AAA GTC CAA GGC    768
  16 Gly Ala Ala Cys Leu Pro Leu Asn Ala Arg Ser Cys Lys Val Gln Gly     31
 769 CAA AAG GAT AGC CCT ACA GGT GGT CCC CTC GTG GCA GGT GGT GGA CAA    816
  32 Gln Lys Asp Ser Pro Thr Gly Gly Pro Leu Val Ala Gly Gly Gly Gln     47
 817 ATG GGT TGG ACT CTG TGT AAG ACA CTT GGG AGT AGA GGG AGT ATG GAG    864
  48 Met Gly Trp Thr Leu Cys Lys Thr Leu Gly Ser Arg Gly Ser Met Glu     63
 865 AAA TGG AAA GCT AAA GGG CCC ACC CAG GGG GAC AGT TGT GTC TGG AAG    912
  64 Lys Trp Lys Ala Lys Gly Pro Thr Gln Gly Asp Ser Cys Val Trp Lys     79
 913 CTT GCC AGA GTC ATG GGC CTC ATC TTG GGA TGG GCC AGT GTC TTC AGA    960
  80 Leu Ala Arg Val Met Gly Leu Ile Leu Gly Trp Ala Ser Val Phe Arg     95
 961 ACA TTA AAC GCT GAT TTG CAT GTA CTG TTC TAA ACA CTC TGT GTG TTT   1008
  96 Thr Leu Asn Ala Asp Leu His Val Leu Phe ***                        106
1009 TAG CTT GAT TAC TCA CAA TGG CTC CAT GAG TAA AGT AGG TCT GTC TAC   1056
1057 TAC TTC TTC CCC ACC TTT TTC TTA ATA GAC AAG GAA ACT GAG GCA TGG   1104
1105 AGA TGT TAC ATC AGG TTG CTG GAG CTG GGC AGA TCC TGG AGC CTG TGC   1152
1153 ACT GCT ACT GCC TTT ATA TGT CTC CTC TGA TTT CAT TTG TTG GTG TCT   1200
1201 AAA TCG AAT ACC TTA CAA ACC AGT GTA GAC CTG ATA CCC TGT GGC TAA   1248
1249 AAC AAA ACC TGA GTG TGC ACT GTA TTG GGC TTG TGA GCA GTC AGC TTG   1296
1297 TGA CCT CTG TTC TGT GGT TTT ATT GGC ACG TAG CAG TAC AAG GAT GGT   1344
1345 GAG GGG TGG GTA GGG GGC AGA CAG CTA GGC ACT TGA AAG GAA AGC TCA   1392
1393 TCT GGA AAG ATT GGA TCG TCT CAA ATG CAC ATA CTC GTA CAC TCG ATT   1440
1441 GAA GCG TAC TCT GTG CCT ACT AGA TCT TTT CAC AGC CAA AAA CAC CTG   1488
1489 GCA ACC CTT GGA GAA GTA ACT ATT CCT TTT TTT CAC AAG TAA GAA AAT   1536
1537 AGA GCC TCA GAA AAT TTA ACA GTT GTC TAA GCT AGA AAG TAG CAG GAC   1584
1585 TGG ACT TTG AAG TAG TCT TTA GGT TGT GCT GTA CAT TTT GTG GAT ATG   1632
1633 CTT AAA TCA CAG TTT AGC TTG TAC ACA TTT TCC TTT ATT AGA ATT GGA   1680
1681 AGT AAG TAT TAA TGT TTG AAA AAA TAT TTT AGC CTG ACA ATA TTT ATT   1728
1729 CTA TCT TCA TAT GTT TTT GAA ATT AGA TAT TTT AAA CTA GGC ACG GTG   1776
1777 GCT CAC GCA TGT AAT CTC AGC AGT TTG GGA GGC CGA GGC AGG CAG GTC   1824
1825 ACA AGG TCA GGA GCT CCA GAC CAG CCT GAC CGA CAT GGT GAA ACC CTA   1872
1873 TTC TTC TAC CAA AAA TTC AAA AAA AAA AAA AAA AAA AAA AAA AA        1916
8.PP10436
A:核苷酸序列(SEQ ID NO:22)长度:2677
   1 GTTCTGGGCT TCGGCGTGCT TTGGAGCAGC TACTAGAGAA TAACACCACC CGTTCTCCCC
  61 GGCACCCGGG AGTCATCTTC AAAGCCCTGA AGGCACTAAG TGACCGCTTC AGCGGTGAGA
 121 TCCCCGATGA CCAGATGGCG CACAGCTCCT TTTTTCCAGA TGAGTATTTC ACCTGCTCCT
 181 CCTTGTGCCT CAGCTGTGGG GTTGGATGTA AGAAAAGCAT GAATCATGGG AAGGAAGGAG
 241 TGCCTCATGA AGCCAAGAGC CGCTGCAGAT ACTCCCACCA GTATGACAAC CGAGTGTATA
 301 CCTGCAAGGC CTGCTATGAG AGAGGCGAGT GAAGTCAGTG TAGTGCCCAA AACATCTGCT
 361 TCCACTGACT CCCCCTGGAT GGGTCTCGCA AAATATGCCT GGTCTGGGTA TGTGATCGAA
 421 TGTCCTAACT GTGGCGTGGT CTATCGTAGT CGGCAGTACT GGTTTGGAAA CCAAGATCCT
 481 GTGGATACGG TGGTGCGGAC AGAGATTGTG CATGTGTGGC CTGGAACTGA TGGGTTTCTG
 541 AAGGACAACA ACAATGCTGC CCAGCGCCTG TTGGACGGGA TGAACTTCAT GGCTCAGTCG
 601 GTGTCCGAGC TTAGCCTTGG ACCCACCAAG GCTGTGACTT CCTGGCTGAC AGACCAGATC
 661 GCCCCTGCCT ACTGGAGGCC CAACTCCCAG ATTCTGAGCT GCAACAAGTG TGCGACGTCC
 721 TTTAAAGATA ACGACACTAA GCATCACTGC CGAGCCTGTG GGGAGGGCTT CTGTGACAGC
 781 TGTTCATCAA AGACTCGGCC AGTGCCTGAG CGGGGCTGGG GCCCTGCGCC AGTGCGGGTC
 841 TGTGACAACT GCTACGAAGC CAGGAACGTC CAGTTAGCTG TTACCGAGGC ACAAGTGGAC
 901 GATGAAGGTG GAACGCTCAT TGCTCGGAAG GTGGGCGAGG CCGTGCAGAA CACTCTGGGA
 961 GCCGTGGTGA CAGCCATTGA CATACCACTA GGTCTGGTAA AGGACGCGGC CAGGCCTGCG
1021 TACTGGGTGC CTGACCACGA AATCCTCCAC TGCCACAACT GCCGGAAGGA GTTCAGCATC
1081 AAGCTCTCCA AGCACCACTG CCGGGCCTGC GGACAGGGCT TCTGTGATGA GTGCTCCCAT
1141 GACCGCCGGG CTGTTCCTTC TCGTGGCTGG GACCATCCCG TCCGAGTCTG CTTCAACTGC
1201 AATAAAAAGC CCGGTGACCT TTAACCCCAG CCCCCTCTCC GAGTCCTTCA CAATTCCTTA
1261 GGTTCTCAGG GTTAGAAACA GTCTTGCGAG GTAGGCCCTC CTCCCAGTCA CCTGCTGTGG
1321 TGTTTGTCCT CTCCTCTCCG CATCCAGGGC CACTTTCCCT CAGTGGGGGT GAGCCTGGCG
1381 GCAGGCCCGA AGGTGTGGAC CCCTCAGGGC AGGGGACCTT GCAACTTATC GCAAAGGGGA
1441 ATGAACCTGA ATCCGTTGCA TTTATTTCAG TTAAAAATAA TGAATATATA TGTGTATATC
1501 TCTCTCTCAT ATATACATAT GAAAGGCACT CGGGGCGTAT CGAGGCTGCT GCTGGCTGTG
1561 AAGACTTCGC ACAGTCTCCT CCGCACAGGG TGAGGTGGCA GTGGCAGCAC GTCTTCCTCA
1621 TGAGCCGAGC CAGGTCCATG GCCACCACGT GGCTGGCCCC TTCCTCTGCT GCTCTTGGAG
1681 CCTTGGAAGC CTCTCCTGTC CTTGGCTCTT CCCTCCATGC CTGTCAGCTG CCTGGGGAGT
1741 GAGCCTCCCT GGTCCTTCCT GCCTGAAACA GCCTGAAGGG AATTCTCCCT AGGTCTCCTG
1801 GGAGTCGAGT CCCAATTCTT GGCTTAAGCC TGTTTTAGTC AGAGACCACC CAACTTAGCG
1861 TGCAGGTCAC CGGAGTGGGT GGAGGGTCAG AGGTCGGGTC TTCGGCCCTG AGAAGTAGAA
1921 ATGCAGGGGC CGTGCTGTCC CTGGTCCCCC AGGAACAGCA AGGAAGGAAC TGAGCCTTCT
1981 TCCAGCAGGC TTCCTGTCCC GATGCTTGTG TCTCCACTCG GCTTTCCCAA AAGGCGGCAC
2041 CCAGCTCCTC AATCGAAGCA TCTGCCTCCC ACCCCTCGGC CCCCTCAAGC CCACCATCTG
2101 CTTCTGAGTG TCGCACTAGG ATTTTCATTG CTTATTTTAA AGTGTCTTAA TCCTTTGTTC
2161 CCAGACACAC AACCCCTCTA GCTCTCGGAG GGGCGATCAT GAGAAACCTT CCAGGGAAAC
2221 TGAGCACAGG ATGAACTGTT AGTTGTTTTT AAAAGTCTAT ATAAATATTT CAACAGATCG
2281 TAAAGAAAAA ATTTATCTCT TTGGTCCTTG CAAGAGAAGT CAAAGGAACT TTTGTTTCTC
2341 CTCAAGAGCC TGGACATCTC TGTCTGTCAT GACTGGAAAG GGCCCGTTGT GCTGAAATCC
2401 TATCATCATG GTGGATTTGA TCTTCAGTGG CCAAACACGA ATTAAAGTAT AATTCTTAAC
2461 TGAACTGGTG GGTGGGTTGA GCTTTAGGGA AGTATATGGC GGTCATTCCT GGTGCGCCTA
2521 TCGGTGTGAC ATGAGCCCTG GAGTGTGTCG TCCCTCTCAG CCCTGCTCCT CCTGCCTCCT
2581 GGGGTCCAGT GACTGGGACC CTACTCTAGA ACTGTGTACC ATCCAATTCG CCATCATAAA
2641 GGAATCTTCC TGCAAAAAAA AAAAAAAAAA AAAAAAA
B:氨基酸序列(SEQ ID NO:23)长度:332
   1 MGRKECLMKP RAAADTPTSM TTECIPARPA MREASEVSVV PKTSASTDSP WMGLAKYAWS
  61 GYVIECPNCG VVYRSRQYWF GNQDPVDTVV RTEIVHVWPG TDGFLKDNNN AAQRLLDGMN
 121 FMAQSVSELS LGPTKAVTSW LTDQIAPAYW RPNSQILSCN KCATSFKDND TKHHCRACGE
 181 GFCDSCSSKT RPVPERGWGP APVRVCDNCY EARNVQLAVT EAQVDDEGGT LIARKVGEAV
 241 QNTLGAVVTA IDIPLGLVKD AARPAYWVPD HEILHCHNCR KEFSIKLSKH HCRACGQGFC
 301 DECSHDRRAV PSRGWDHPVR VCFNCNKKPG DL
C.核苷酸及氨基酸组合序列(SEQ ID NO:24)克隆号:PP10436起始编码子:226 ATG  终止编码子:1222 TAA  蛋白质分子量:36646.74
   1 GTT CTG GGC TTC GGC GTG CTT TGG AGC AGC TAC TAG AGA ATA ACA CCA     48
  49 CCC GTT CTC CCC GGC ACC CGG GAG TCA TCT TCA AAG CCC TGA AGG CAC     96
  97 TAA GTG ACC GCT TCA GCG GTG AGA TCC CCG ATG ACC AGA TGG CGC ACA    144
 145 GCT CCT TTT TTC CAG ATG AGT ATT TCA CCT GCT CCT CCT TGT GCC TCA    192
 193 GCT GTG GGG TTG GAT GTA AGA AAA GCA TGA ATC ATG GGA AGG AAG GAG    240
   1                                            Met Gly Arg Lys Glu       5
 241 TGC CTC ATG AAG CCA AGA GCC GCT GCA GAT ACT CCC ACC AGT ATG ACA    288
   6 Cys Leu Met Lys Pro Arg Ala Ala Ala Asp Thr Pro Thr Ser Met Thr     21
 289 ACC GAG TGT ATA CCT GCA AGG CCT GCT ATG AGA GAG GCG AGT GAA GTC    336
  22 Thr Glu Cys Ile Pro Ala Arg Pro Ala Met Arg Glu Ala Ser Glu Val     37
 337 AGT GTA GTG CCC AAA ACA TCT GCT TCC ACT GAC TCC CCC TGG ATG GGT    384
  38 Ser Val Val Pro Lys Thr Ser Ala Ser Thr Asp Ser Pro Trp Met Gly     53
 385 CTC GCA AAA TAT GCC TGG TCT GGG TAT GTG ATC GAA TGT CCT AAC TGT    432
  54 Leu Ala Lys Tyr Ala Trp Ser Gly Tyr Val Ile Glu Cys Pro Asn Cys     69
 433 GGC GTG GTC TAT CGT AGT CGG CAG TAC TGG TTT GGA AAC CAA GAT CCT    480
  70 Gly Val Val Tyr Arg Ser Arg Gln Tyr Trp Phe Gly Asn Gln Asp Pro     85
 481 GTG GAT ACG GTG GTG CGG ACA GAG ATT GTG CAT GTG TGG CCT GGA ACT    528
  86 Val Asp Thr Val Val Arg Thr Glu Ile Val His Val Trp Pro Gly Thr    101
 529 GAT GGG TTT CTG AAG GAC AAC AAC AAT GCT GCC CAG CGC CTG TTG GAC    576
 102 Asp Gly Phe Leu Lys Asp Asn Asn Asn Ala Ala Gln Arg Leu Leu Asp    117
 577 GGG ATG AAC TTC ATG GCT CAG TCG GTG TCC GAG CTT AGC CTT GGA CCC    624
 118 Gly Met Asn Phe Met Ala Gln Ser Val Ser Glu Leu Ser Leu Gly Pro    133
 625 ACC AAG GCT GTG ACT TCC TGG CTG ACA GAC CAG ATC GCC CCT GCC TAC    672
 134 Thr Lys Ala Val Thr Ser Trp Leu Thr Asp Gln Ile Ala Pro Ala Tyr    149
 673 TGG AGG CCC AAC TCC CAG ATT CTG AGC TGC AAC AAG TGT GCG ACG TCC    720
 150 Trp Arg Pro Asn Ser Gln Ile Leu Ser Cys Asn Lys Cys Ala Thr Ser    165
 721 TTT AAA GAT AAC GAC ACT AAG CAT CAC TGC CGA GCC TGT GGG GAG GGC    768
 166 Phe Lys Asp Asn Asp Thr Lys His His Cys Arg Ala Cys Gly Glu Gly    181
 769 TTC TGT GAC AGC TGT TCA TCA AAG ACT CGG CCA GTG CCT GAG CGG GGC    816
 182 Phe Cys Asp Ser Cys Ser Ser Lys Thr Arg Pro Val Pro Glu Arg Gly    197
 817 TGG GGC CCT GCG CCA GTG CGG GTC TGT GAC AAC TGC TAC GAA GCC AGG    864
 198 Trp Gly Pro Ala Pro Val Arg Val Cys Asp Asn Cys Tyr Glu Ala Arg    213
 865 AAC GTC CAG TTA GCT GTT ACC GAG GCA CAA GTG GAC GAT GAA GGT GGA    912
 214 Asn Val Gln Leu Ala Val Thr Glu Ala Gln Val Asp Asp Glu Gly Gly    229
 913 ACG CTC ATT GCT CGG AAG GTG GGC GAG GCC GTG CAG AAC ACT CTG GGA    960
 230 Thr Leu Ile Ala Arg Lys Val Gly Glu Ala Val Gln Asn Thr Leu Gly    245
 961 GCC GTG GTG ACA GCC ATT GAC ATA CCA CTA GGT CTG GTA AAG GAC GCG   1008
 246 Ala Val Val Thr Ala Ile Asp Ile Pro Leu Gly Leu Val Lys Asp Ala    261
1009 GCC AGG CCT GCG TAC TGG GTG CCT GAC CAC GAA ATC CTC CAC TGC CAC   1056
 262 Ala Arg Pro Ala Tyr Trp Val Pro Asp His Glu Ile Leu His Cys His    277
1057 AAC TGC CGG AAG GAG TTC AGC ATC AAG CTC TCC AAG CAC CAC TGC CGG   1104
 278 Asn Cys Arg Lys Glu Phe Ser Ile Lys Leu Ser Lys His His Cys Arg    293
1105 GCC TGC GGA CAG GGC TTC TGT GAT GAG TGC TCC CAT GAC CGC CGG GCT   1152
 294 Ala Cys Gly Gln Gly Phe Cys Asp Glu Cys Ser His Asp Arg Arg Ala    309
1153 GTT CCT TCT CGT GGC TGG GAC CAT CCC GTC CGA GTC TGC TTC AAC TGC   1200
 310 Val Pro Ser Arg Gly Trp Asp His Pro Val Arg Val Cys Phe Asn Cys    325
1201 AAT AAA AAG CCC GGT GAC CTT TAA CCC CAG CCC CCT CTC CGA GTC CTT   1248
 326 Asn Lys Lys Pro Gly Asp Leu ***                                    333
1249 CAC AAT TCC TTA GGT TCT CAG GGT TAG AAA CAG TCT TGC GAG GTA GGC   1296
1297 CCT CCT CCC AGT CAC CTG CTG TGG TGT TTG TCC TCT CCT CTC CGC ATC   1344
1345 CAG GGC CAC TTT CCC TCA GTG GGG GTG AGC CTG GCG GCA GGC CCG AAG   1392
1393 GTG TGG ACC CCT CAG GGC AGG GGA CCT TGC AAC TTA TCG CAA AGG GGA   1440
1441 ATG AAC CTG AAT CCG TTG CAT TTA TTT CAG TTA AAA ATA ATG AAT ATA   1488
1489 TAT GTG TAT ATC TCT CTC TCA TAT ATA CAT ATG AAA GGC ACT CGG GGC   1536
1537 GTA TCG AGG CTG CTG CTG GCT GTG AAG ACT TCG CAC AGT CTC CTC CGC   1584
1585 ACA GGG TGA GGT GGC AGT GGC AGC ACG TCT TCC TCA TGA GCC GAG CCA    1632
1633 GGT CCA TGG CCA CCA CGT GGC TGG CCC CTT CCT CTG CTG CTC TTG GAG    1680
1681 CCT TGG AAG CCT CTC CTG TCC TTG GCT CTT CCC TCC ATG CCT GTC AGC    1728
1729 TGC CTG GGG AGT GAG CCT CCC TGG TCC TTC CTG CCT GAA ACA GCC TGA    1776
1777 AGG GAA TTC TCC CTA GGT CTC CTG GGA GTC GAG TCC CAA TTC TTG GCT    1824
1825 TAA GCC TGT TTT AGT CAG AGA CCA CCC AAC TTA GCG TGC AGG TCA CCG    1872
1873 GAG TGG GTG GAG GGT CAG AGG TCG GGT CTT CGG CCC TGA GAA GTA GAA    1920
1921 ATG CAG GGG CCG TGC TGT CCC TGG TCC CCC AGG AAC AGC AAG GAA GGA    1968
1969 ACT GAG CCT TCT TCC AGC AGG CTT CCT GTC CCG ATG CTT GTG TCT CCA    2016
2017 CTC GGC TTT CCC AAA AGG CGG CAC CCA GTT CCT CAA TCG AAG CAT CTG    2064
2065 CCT CCC ACC CCT CGG CCC CCT CAA GCC CAC CAT CTG CTT CTG AGT GTC    2112
2113 GCA CTA GGA TTT TCA TTG CTT ATT TTA AAG TGT CTT AAT CCT TTG TTC    2160
2161 CCA GAC ACA CAA CCC CTC TAG CTC TCG GAG GGG CGA TCA TGA GAA ACC    2208
2209 TTC CAG GGA AAC TGA GCA CAG GAT GAA CTG TTA GTT GTT TTT AAA AGT    2256
2257 CTA TAT AAA TAT TTC AAC AGA TCG TAA AGA AAA AAT TTA TCT CTT TGG    2304
2305 TCC TTG CAA GAG AAG TCA AAG GAA CTT TTG TTT CTC CTC AAG AGC CTG    2352
2353 GAC ATC TCT GTC TGT CAT GAC TGG AAA GGG CCC GTT GTG CTG AAA TCC    2400
2401 TAT CAT CAT GGT GGA TTT GAT CTT CAG TGG CCA AAC ACG AAT TAA AGT    2448
2449 ATA ATT CTT AAC TGA ACT GGT GGG TGG GTT GAG CTT TAG GGA AGT ATA    2496
2497 TGG CGG TCA TTC CTG GTG CGC CTA TCG GTG TGA CAT GAG CCC TGG AGT    2544
2545 GTG TCG TCC CTC TCA GCC CTG CTC CTC CTG CCT CCT GGG GTC CAG TGA    2592
2593 CTG GGA CCC TAC TCT AGA ACT GTG TAC CAT CCA ATT CGC CAT CAT AAA    2640
2641 GGA ATC TTC CTG CAA AAA AAA AAA AAA AAA AAA AAA A                  2677
9.PP12613
A:核苷酸序列(SEQ ID NO:25)长度:2242
   1 GGTTGTCCAA AGTCATTCCG GCTCCAAAGG GCGAATTCTC TTTTCGCCAT CTCTCCCAGC
  61 CCTGGAACAG CTTAGGGTCC CTCTCGAAGA GCACAGCGCC AGCCCAGACC CCATACACCC
 121 ACCTTCCCTG GCACCCGAAC GCGCTGCGAG CCCCGGGCCT CCCACAGGAG CGGAGACGCG
 181 GGTCCCTGCG TCTCACGCCG GAACGGACCC GTCAGAGCCG CCGAGCCCCG CACCTGGAAG
 241 CTGGGAGGCC GCGAGGACGG AGAATCGAGG CGGAGACCCA GCCCAGCGCC CGCGCAGCTC
 301 GGTGCCCTCC CGCCAGTGCC CGCACTCGGG TCACACCGCT TGCTCTCGGG AGAAGCCCCA
 361 AGGCTCGCGG TGCACCGAGA GGCGCCCGGG CTGGAGCGCC CCGGCCGTGT TGGCACGGAG
 421 TTCTTCAGCT GCTTGATGAC CACGAAGAGC AGGAGGAAAA GTAAGAAGAG CAGGAAGAAG
 481 AAGAGCGCCA GGTAGAGCAG CAAGTTGAGT TCCCACTCCA TGCTGGAGGC GCCGGCGCTC
 541 GCTGGCCCTG CGCGCTCGGC GCGGGCTGCA GCTGGAGGGC GAGCGCGCCG CCCGCACACC
 601 CACCTCCCGC ACTCCCGCCC CTCGCGAGGG CGTCCCGCTA TGGGCGCCGA CTCCGGGGTC
 661 CGTGCTTTGC CTCCCCCGGC TCCGAGGAAA CGCGCCAAGG AGCTGAGGAA ATCCGGCGCA
 721 GACTCTCCCA GCTGGCACCA AAGCCTTCCG CTTCGCCGAG ATCCTCTCAG GTGCTCTTGA
 781 GGACGCGAGC GACTTCCCTA GGAGCGAACT TCCGCGGGCA CGGACGCCAG AAGAGGTAAC
 841 AGCTCAGTCT CCCAGGGGAG GTCGGGACTG GTGTTTTGTA AATGATTTAA AAGTTCCACC
 901 CCCAACATCC AGTAGGGTCC CTAGCTCCGC TGCGTTCCCA ATTAATTTAT TTCGTTATAT
 961 CCCTCCGTTC CTGCTTTCCG AAAGGACAGG GGATGTCATG GCCCAGAGAC CCAAAAGAAT
1021 GAAAGGTGGC AGTGAAGATG GGGTCTGAAA GGCTATGAGA TGATTTCGTG CTATGAGGTG
1081 TCTGAGTGAA TTCCAGTTCG AGCTGTCTTG CTCTTCAGAG TAGCAGATAC ATTCAGTGTT
1141 GAGTGTACTT TTCTATGGAC AACAGGTCAC TTGGAAACGC ATTAAGAATA CAATGTATTT
1201 CAGAAGTTAT ATAGCACAAA GATTTCAAAT ATTGGCCTCA AATTCAGTTT ATTTGGTGAA
1261 AAGAGGAAAA CAAGTTTACT CAAAGTGTTT CTTGAGTCCC TAAAGCCTTT CTGTATCTGG
1321 TTGACGTGAC CCAAAGCCCA TATCGCGCAG CT1TAAAAGC TGTTCAGTGT ATCTATTACT
1381 GCAGAACAAA TTACCCCCAA ATTTAGTGGC TTCAAACAGC ATAAACATTG ATCATCTCTC
1441 ACAGTTTCTG TGGGTCCGAA ATGTGGGAGC ACTGGCTGGG TGATTCTGGT GTCGGGTTAC
1501 TCATGAGGCT CCGTTCAGAT GTCAGCCAGG TCTGCCTTCA GCTGAATGCT TGTGTAGAGG
1561 TGGAGGATCC ACTTCCAGGG TGGCTCACTC ACTGCTTGCC AGGTAGGGCT GGTTGTTGGT
1621 GGGAGGCCTC AGTTCCCTTC CATGGGTGCT TCCAATACAG CTGCGGGATT CCCCCAGAAC
1681 AAGTGATGAA AGAAAACAAA GCAGAGGCTG CAGTGCTCTT TACCGCCAGC TTCAGAAGTC
1741 ACGTGCCATC ACATCTGTAA TATCCTACTG GTCACACAGG TCAGCCCTAT TCAGGGTAGG
1801 AGTCCAAGGA CACGAACGCC AAGGAGTAAG GATCACTGGG GGCTCATCTT AGAGTCGGCT
1861 ATGACAGCTG TTAATACAGC CAGCTATCAT TGCCCATTTG TAGGCCTAAC TTTATTTTAT
1921 TCTTTATTTG TGAAGATGCA GAATTGCCTC CTGGACTGAA TTCTGGGGAT GAGGGCTGAC
1981 AACATCCCAG ATTGTAATAA GTGGCTGCTC CAGGGATGAC AGGGGTTCAA AGAGACAGGC
2041 TGGTATGAAA ACAGTCTGTG AACTGCAAGT CTCATGGACC CGATTCTAGT GTCAGCTCTG
2101 TCAGTGGTCA CTTTTGCTCA GTGACTCTCA GTCCCCTCAT CTGTAACATG CCTTGCTTAT
2161 CTTTCCCTTG GATTTGTTGT GAGGCTCAAA AATGAGAAAA TGTTAAATAA AAATGTGTTT
2221 TGCTAAAAAA AAAAAAAAAA AA
B:氨基酸序列(SEQ ID NO:26)长度:99
   1 MWEHWLGDSG VGLLMRLRSD VSQVCLQLNA CVEVEDPLPG WLTHCLPGRA GCWWEASVPF
  61 HGCFQYSCGI PPEQVMKENK AEAAVLFTAS FRSHVPSHL
C.核苷酸及氨基酸组合序列(SEQ ID NO:27)克隆号:PP12613起始编码子:1461 ATG  终止编码子:1758 TAA  蛋白质分子量:11052.16
   1  GG TTG TCC AAA GTC ATT CCG GCT CCA AAG GGC GAA TTC TCT TTT CGC      47
  48 CAT CTC TCC CAG CCC TGG AAC AGC TTA GGG TCC CTC TCG AAG AGC ACA      95
  96 GCG CCA GCC CAG ACC CCA TAC ACC CAC CTT CCC TGG CAC CCG AAC GCG     143
 144 CTG CGA GCC CCG GGC CTC CCA CAG GAG CGG AGA CGC GGG TCC CTG CGT     191
 192 CTC ACG CCG GAA CGG ACC CGT CAG AGC CGC CGA GCC CCG CAC CTG GAA     239
 240 GCT GGG AGG CCG CGA GGA CGG AGA ATC GAG GCG GAG ACC CAG CCC AGC     287
 288 GCC CGC GCA GCT CGG TGC CCT CCC GCC AGT GCC CGC ACT CGG GTC ACA     335
 336 CCG CTT GCT CTC GGG AGA AGC CCC AAG GCT CGC GGT GCA CCG AGA GGC     383
 384 GCC CGG GCT GGA GCG CCC CGG CCG TGT TGG CAC GGA GTT CTT CAG CTG     431
 432 CTT GAT GAC CAC GAA GAG CAG GAG GAA AAG TAA GAA GAG CAG GAA GAA     479
 480 GAA GAG CGC CAG GTA GAG CAG CAA GTT GAG TTC CCA CTC CAT GCT GGA     527
 528 GGC GCC GGC GCT CGC TGG CCC TGC GCG CTC GGC GCG GGC TGC AGC TGG     575
 576 AGG GCG AGC GCG CCG CCC GCA CAC CCA CCT CCC GCA CTC CCG CCC CTC     623
 624 GCG AGG GCG TCC CGC TAT GGG CGC CGA CTC CGG GGT CCG TGC TTT GCC     671
 672 TCC CCC GGC TCC GAG GAA ACG CGC CAA GGA GCT GAG GAA ATC CGG CGC     719
 720 AGA CTC TCC CAG CTG GCA CCA AAG CCT TCC GCT TCG CCG AGA TCC TCT     767
 768 CAG GTG CTC TTG AGG ACG CGA GCG ACT TCC CTA GGA GCG AAC TTC CGC     815
 816 GGG CAC GGA CGC CAG AAG AGG TAA CAG CTC AGT CTC CCA GGG GAG GTC     863
 864 GGG ACT GGT GTT TTG TAA ATG ATT TAA AAG TTC CAC CCC CAA CAT CCA     911
 912 GTA GGG TCC CTA GCT CCG CTG CGT TCC CAA TTA ATT TAT TTC GTT ATA     959
 960 TCC CTC CGT TCC TGC TTT CCG AAA GGA CAG GGG ATG TCA TGG CCC AGA    1007
1008 GAC CCA AAA GAA TGA AAG GTG GCA GTG AAG ATG GGG TCT GAA AGG CTA    1055
1056 TGA GAT GAT TTC GTG CTA TGA GGT GTC TGA GTG AAT TCC AGT TCG AGC    1103
1104 TGT CTT GCT CTT CAG AGT AGC AGA TAC ATT CAG TGT TGA GTG TAC TTT    1151
1152 TCT ATG GAC AAC AGG TCA CTT GGA AAC GCA TTA AGA ATA CAA TGT ATT    1199
1200 TCA GAA GTT ATA TAG CAC AAA GAT TTC AAA TAT TGG CCT CAA ATT CAG    1247
1248 TTT ATT TGG TGA AAA GAG GAA AAC AAG TTT ACT CAA AGT GTT TCT TGA    1295
1296 GTC CCT AAA GCC TTT CTG TAT CTG GTT GAC GTG ACC CAA AGC CCA TAT    1343
1344 CGC GCA GCT TTA AAA GCT GTT CAG TGT ATC TAT TAC TGC AGA ACA AAT    1391
1392 TAC CCC CAA ATT TAG TGG CTT CAA ACA GCA TAA ACA TTG ATC ATC TCT    1439
1440 CAC AGT TTC TGT GGG TCC GAA ATG TGG GAG CAC TGG CTG GGT GAT TCT    1487
   1                             Met Trp Glu His Trp Leu Gly Asp Ser       9
1488 GGT GTC GGG TTA CTC ATG AGG CTC CGT TCA GAT GTC AGC CAG GTC TGC    1535
  10 Gly Val Gly Leu Leu Met Arg Leu Arg Ser Asp Val Ser Gln Val Cys      25
1536 CTT CAG CTG AAT GCT TGT GTA GAG GTG GAG GAT CCA CTT CCA GGG TGG    1583
  26 Leu Gln Leu Asn Ala Cys Val Glu Val Glu Asp Pro Leu Pro Gly Trp      41
1584 CTC ACT CAC TGC TTG CCA GGT AGG GCT GGT TGT TGG TGG GAG GCC TCA    1631
  42 Leu Thr His Cys Leu Pro Gly Arg Ala Gly Cys Trp Trp Glu Ala Ser      57
1632 GTT CCC TTC CAT GGG TGC TTC CAA TAC AGC TGC GGG ATT CCC CCA GAA    1679
  58 Val Pro Phe His Gly Cys Phe Gln Tyr Ser Cys Gly Ile Pro Pro Glu      73
1680 CAA GTG ATG AAA GAA AAC AAA GCA GAG GCT GCA GTG CTC TTT ACC GCC    1727
  74 Gln Val Met Lys Glu Asn Lys Ala Glu Ala Ala Val Leu Phe Thr Ala      89
1728 AGC TTC AGA AGT CAC GTG CCA TCA CAT CTG TAA TAT CCT ACT GGT CAC    1775
  90 Ser Phe Arg Ser His Val Pro Ser His Leu ***                         100
1776 ACA GGT CAG CCC TAT TCA GGG TAG GAG TCC AAG GAC ACG AAC GCC AAG    1823
1824 GAG TAA GGA TCA CTG GGG GCT CAT CTT AGA GTC GGC TAT GAC AGC TGT    1871
1872 TAA TAC AGC CAG CTA TCA TTG CCC ATT TGT AGG CCT AAC TTT ATT TTA    1919
1920 TTC TTT ATT TGT GAA GAT GCA GAA TTG CCT CCT GGA CTG AAT TCT GGG    1967
1968 GAT GAG GGC TGA CAA CAT CCC AGA TTG TAA TAA GTG GCT GCT CCA GGG    2015
2016 ATG ACA GGG GTT CAA AGA GAC AGG GTG GTA TGA AAA CAG TCT GTG AAC    2063
2064 TGC AAG TCT CAT GGA CCC GAT TCT AGT GTC AGC TCT GTC AGT GGT CAC    2111
2112 TTT TGC TCA GTG ACT CTC AGT CCC CTC ATC TGT AAC ATG CCT TGC TTA    2159
2160 TCT TTC CCT TGG ATT TGT TGT GAG GCT CAA AAA TGA GAA AAT GTT AAA    2207
2208 TAA AAA TGT GTT TTG CTA AAA AAA AAA AAA AAA AA                     2242
10.PP12708
A:核苷酸序列(SEQ ID NO:28)长度:1941
   1 GTTTCTTCTG GTCAATCCAT CTAGTGTTAA TGGTTCTGAA ACATGGATTT TATTGTGTCG
  61 TATTTCTGCC TGAGTAGTCA AGCATTCTTC TTTGCCTACA GAATAAATTC TGCATTTTTT
 121 TTGACTCATT TTCAGACTCT TTCACCATCT AGTCAGAGGC TGTAAACTAG TGGCCTGTGG
 181 GCCAGTATAA TCCTACATCC CCTTTTCCCC CCATCATTTT CCTTTATCTT CTAGTAGAAA
 241 TCTTCTCGTT CCAGTTAAGT TGTTCCTCTT TATTTTCCCG ATAGGAAATA CTGTATTCTC
 301 CTCTTGAAGC ATGTGCTCTG GCTCTTTCCC TCTATTATTT GTCTTCTGTG TAAATTATCT
 361 TCACTTGTCC TAGAAACCTC CTCATACACA CTGATATTTA ATAAAGATAG CCCTCTTTTG
 421 TGAATTTGCT TGAAAATGGA AGCATTAGAA GTAGGTAAAG TTATGAGCCA AGGAAATAAG
 481 TTATTCATTG AACAAATATT GAGCTGTAAT ATAATATTAT ATCATATTAT GTAACAAAAT
 541 ATTGAGTACC TATTATGTGG TGGACTGTGT TATCTGATTG GGGCTGTTAC AATGATCAAG
 601 AAAGACTATG TTCCTCCCTC ATTGAGCTTA TATCCCATTG CAATCAATAT GCAAAAATAA
 661 GTAGGTTGAC AGCCTGCCTT CAGAGTGCTT TTATAAACAT CTTACTTGAT CTGAACAGCA
 721 ATCCTGAAGT ACTTGAGAAA ACAGAAGTTC AGCTGGTCTC GAACTCCTGG CCTCTAGTGA
 781 TCTGCTTGCC TCAGGCTCCC ATAGTGCTGG GACTACAGGT GTGAGCCACC ACGCCCGGCC
 841 TGGCTTCATT GATTTTTCCA ATTGTAGTAA TAATCATGCT CATTGCTTAT AATTCAACCA
 901 GTACTAGAAA GTTCAAACAA CCCTCATAGT AATATAGATT TGTAAATTCC AAAATTCGTA
 961 TTTTATTATG TCTTTCTTTG CCACCTTCTC TTTTCTCCAC TTGGTATATC AAGAACATCA
1021 TTTTTAAAGG CTAAATAGAC ACTGTATGGC TATTCCATAG CTGAATCAAC CAAACCTCTG
1081 TTGAGAGGCT CTTAAAATGT TTCTTCTTGT ATAAAAAACA ACATTGTTAA ACTTTATTCT
1141 CCATTTATCT TTTTATAATT ATTTCACTCT TAATTCCTTA GAAATAGAAT TCCTTAGTCA
1201 AATTATCAGG TTTATTCAGT AGTCATGGTT TGTGCAAAAC CTGGTCTTCT GGGAGGGATA
1261 AGTAAGAAAA ATGGACCATT TTTCTAATGA AGCTTAAGAG TTTATTTGGG GAAATAACAT
1321 TCACTTTTGG AATTTCAAAA GAAAAGTTAA AAATTCTTGA CGATTTAACT TTGTTACCTT
1381 TGTTAGTAAA ACAATATAAA ATGCTGTGGA GCTATAAGTT ACCAGGATCA GGTATAGTTA
1441 TTTGGTCCAC ATTTCATGCA GTAATGGATT CAGAATGGAG AAGACAAAAT GCAGAACTGA
1501 ACTTAATTAC AAATAAGCAT TTTTTAAAAA ATCTACAATC TAAGCATTTA GATGTAAAAA
1561 TATTAAAAAC CAAGAATAAG CTTGTGGAAG GAATTTAATT ATGAAGTAAA CTACTTGTCT
1621 TTTTTTGAGA TGGAGTTTCG CTCTTGTTGC CCAGGCTGGA GTGCAATGGT GTGATCTTGG
1681 CTCACCGCAA CCTCTGCCCC CCAGGTTCAA GCTATTCTGC CTCGGCCTCC CGAGTAGTTG
1741 GGATTGCAGG CATGCACCAC CACGCCCGGC TAATTTTGTA TTTTTTTAGT AGAGACGAGG
1801 TTTCTCCATG TTGGTCAGGC TGTTCTCAAA CTCCCAACCT CAGGTGATCT GCCCGCCTCG
1861 GCCTCACAAA GTGCTGGAAT TATAGGCGTG AGCAACTGCA CCCAGCAACT ACTTGTTAAA
1921 TTAAAAAAAA AAAAAAAAAA A
B:氨基酸序列(SEQ ID NO:29)长度:103
   1 MKLKSLFGEI TFTFGISKEK LKILDDLTLL PLLVKQYKML WSYKLPGSGI VIWSTFHAVM
  61 DSEWRRQNAE LNLITNKHFL KNLQSKHLDV KILKTKNKLV EGI
C.核苷酸及氨基酸组合序列(SEQ ID NO:30)克隆号:PP12708起始编码子:1287 ATG  终止编码子:1596 TAA  蛋白质分子量:12014.72
   1  GT TTC TTC TGG TCA ATC CAT CTA GTG TTA ATG GTT CTG AAA CAT GGA      47
  48 TTT TAT TGT GTC GTA TTT CTG CCT GAG TAG TCA AGC ATT CTT CTT TGC      95
  96 CTA CAG AAT AAA TTC TGC ATT TTT TTT GAC TCA TTT TCA GAC TCT TTC     143
 144 ACC ATC TAG TCA GAG GCT GTA AAC TAG TGG CCT GTG GGC CAG TAT AAT     191
 192 CCT ACA TCC CCT TTT CCC CCC ATC ATT TTC CTT TAT CTT CTA GTA GAA     239
 240 ATC TTC TCG TTC CAG TTA AGT TGT TCC TCT TTA TTT TCC CGA TAG GAA     287
 288 ATA CTG TAT TCT CCT CTT GAA GCA TGT GCT CTG GCT CTT TCC CTC TAT     335
 336 TAT TTG TCT TCT GTG TAA ATT ATC TTC ACT TGT CCT AGA AAC CTC CTC     383
 384 ATA CAC ACT GAT ATT TAA TAA AGA TAG CCC TCT TTT GTG AAT TTG CTT     431
 432 GAA AAT GGA AGC ATT AGA AGT AGG TAA AGT TAT GAG CCA AGG AAA TAA     479
 480 GTT ATT CAT TGA ACA AAT ATT GAG CTG TAA TAT AAT ATT ATA TCA TAT     527
 528 TAT GTA ACA AAA TAT TGA GTA CCT ATT ATG TGG TGG ACT GTG TTA TCT     575
 576 GAT TGG GGC TGT TAC AAT GAT CAA GAA AGA CTA TGT TCC TCC CTC ATT     623
 624 GAG CTT ATA TCC CAT TGC AAT CAA TAT GCA AAA ATA AGT AGG TTG ACA     671
 672 GCC TGC CTT CAG AGT GCT TTT ATA AAC ATC TTA CTT GAT CTG AAC AGC     719
 720 AAT CCT GAA GTA CTT GAG AAA ACA GAA GTT CAG CTG GTC TCG AAC TCC     767
 768 TGG CCT CTA GTG ATC TGC TTG CCT CAG GCT CCC ATA GTG CTG GGA CTA     815
 816 CAG GTG TGA GCC ACC ACG CCC GGC CTG GCT TCA TTG ATT TTT CCA ATT     863
 864 GTA GTA ATA ATC ATG CTC ATT GCT TAT AAT TCA ACC AGT ACT AGA AAG     911
 912 TTC AAA CAA CCC TCA TAG TAA TAT AGA TTT GTA AAT TCC AAA ATT CGT     959
 960 ATT TTA TTA TGT CTT TCT TTG CCA CCT TCT CTT TTC TCC ACT TGG TAT    1007
1008 ATC AAG AAC ATC ATT TTT AAA GGC TAA ATA GAC ACT GTA TGG CTA TTC    1055
1056 CAT AGC TGA ATC AAC CAA ACC TCT GTT GAG AGG CTC TTA AAA TGT TTC    1103
1104 TTC TTG TAT AAA AAA CAA CAT TGT TAA ACT TTA TTC TCC ATT TAT CTT    1151
1152 TTT ATA ATT ATT TCA CTC TTA ATT CCT TAG AAA TAG AAT TCC TTA GTC    1199
1200 AAA TTA TCA GGT TTA TTC AGT AGT CAT GGT TTG TGC AAA ACC TGG TCT    1247
1248 TCT GCG AGG GAT AAG TAA GAA AAA TGG ACC ATT TTT CTA ATG AAG CTT    1295
   1                                                     Met Lys Leu       3
1296 AAG AGT TTA TTT GGG GAA ATA ACA TTC ACT TTT GGA ATT TCA AAA GAA    1343
   4 Lys Ser Leu Phe Gly Glu Ile Thr Phe Thr Phe Gly Ile Ser Lys Glu      19
1344 AAG TTA AAA ATT CTT GAC GAT TTA ACT TTG TTA CCT TTG TTA GTA AAA    1391
  20 Lys Leu Lys Ile Leu Asp Asp Leu Thr Leu Leu Pro Leu Leu Val Lys      35
1392 CAA TAT AAA ATG CTG TGG AGC TAT AAG TTA CCA GGA TCA GGT ATA GTT    1439
  36 Gln Tyr Lys Met Leu Trp SerTyr Lys Leu Pro Gly Ser Gly Ile Val       51
1440 ATT TGG TCC ACA TTT CAT GCA GTA ATG GAT TCA GAA TGG AGA AGA CAA    1487
  52 Ile Trp Ser Thr Phe His Ala Val Met Asp Ser Glu Trp Arg Arg Gln      67
1488 AAT GCA GAA CTG AAC TTA ATT ACA AAT AAG CAT TTT TTA AAA AAT CTA    1535
  68 Asn Ala Glu Leu Asn Leu Ile Thr Asn Lys His Phe Leu Lys Asn Leu      83
1536 CAA TCT AAG CAT TTA GAT GTA AAA ATA TTA AAA ACC AAG AAT AAG CTT    1583
  84 Gln Ser Lys His Leu Asp Val Lys Ile Leu Lys Thr Lys Asn Lys Leu      99
1584 GTG GAA GGA ATT TAA TTA TGA AGT AAA CTA CTT GTC TTT TTT TGA GAT    1631
 100 Val Glu Gly Ile ***                                                 104
1632 GGA GTT TCG CTC TTG TTG CCC AGG CTG GAG TGC AAT GGT GTG ATC TTG    1679
1680 GCT CAC CGC AAC CTC TGC CCC CCA GGT TCA AGC TAT TCT GCC TCG GCC    1727
1728 TCC CGA GTA GTT GGG ATT GCA GGC ATG CAC CAC CAC GCC CGG CTA ATT    1775
1776 TTG TAT TTT TTT AGT AGA GAC GAG GTT TCT CCA TGT TGG TCA GGC TGT    1823
1824 TCT CAA ACT CCC AAC CTC AGG TGA TCT GCC CGC CTC GGC CTC ACA AAG    1871
1872 TGC TGG AAT TAT AGG CGT GAG CAA CTG CAC CCA GCA ACT ACT TGT TAA    1919
1920 ATT AAA AAA AAA AAA AAA AAA A                                      1941

Claims (9)

1.一种分离的具有促进3T3细胞转化功能的人蛋白多肽,其特征在于,它是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29。
2.如权利要求1所述的多肽,其特征在于,该多肽的氨基酸序列选自下组:SEQ ID NO:2、5、8、11、14、17、20、23、26。
3.一种分离的多核苷酸,其特征在于,选自下组:
(a)编码如权利要求1所述多肽的多核苷酸;
(b)与多核苷酸(a)完全互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、6、9、12、15、18、21、24、27、30的编码区序列或全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求6所述的载体转化或转导的宿主细胞;
(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有促进3T3细胞转化功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含:
(a)在适合表达具有促进3T3细胞转化功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;
(b)从培养物中分离出具有促进3T3细胞转化功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有促进3T3细胞转化功能的人蛋白多肽特异性结合的抗体。
CNB011053224A 2001-02-13 2001-02-13 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 Expired - Fee Related CN1199999C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB011053224A CN1199999C (zh) 2001-02-13 2001-02-13 具有促进3t3细胞转化功能的新的人蛋白及其编码序列

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB011053224A CN1199999C (zh) 2001-02-13 2001-02-13 具有促进3t3细胞转化功能的新的人蛋白及其编码序列

Publications (2)

Publication Number Publication Date
CN1369505A CN1369505A (zh) 2002-09-18
CN1199999C true CN1199999C (zh) 2005-05-04

Family

ID=4654404

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB011053224A Expired - Fee Related CN1199999C (zh) 2001-02-13 2001-02-13 具有促进3t3细胞转化功能的新的人蛋白及其编码序列

Country Status (1)

Country Link
CN (1) CN1199999C (zh)

Also Published As

Publication number Publication date
CN1369505A (zh) 2002-09-18

Similar Documents

Publication Publication Date Title
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1177864C (zh) 在肝癌组织中具有表达差异的新的人蛋白及其编码序列
CN1199999C (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1169954C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1155615C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1209373C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1199998C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1177048C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199997C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1177049C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1169955C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1194989C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1170848C (zh) 新的人肝癌相关蛋白及其编码序列
CN1169956C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1222616C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1199994C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1190446C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1169833C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1169958C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1194010C (zh) 具有抑制癌细胞生长功能的人蛋白及基编码序列
CN1169957C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1155616C (zh) 具有促进癌细胞生长功能的新的人蛋白及其编码序列
CN1193041C (zh) 具有抑制癌细胞生长功能的人蛋白及其编码序列
CN1209374C (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1231496C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee