CN1177050C - 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 - Google Patents

编码具有抑制癌细胞生长功能的人蛋白的多核苷酸

Info

Publication number
CN1177050C
CN1177050C CNB011267283A CN01126728A CN1177050C CN 1177050 C CN1177050 C CN 1177050C CN B011267283 A CNB011267283 A CN B011267283A CN 01126728 A CN01126728 A CN 01126728A CN 1177050 C CN1177050 C CN 1177050C
Authority
CN
China
Prior art keywords
ctg
leu
gcc
cag
ccc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB011267283A
Other languages
English (en)
Other versions
CN1403480A (zh
Inventor
顾健人
杨胜利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd
Original Assignee
SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd filed Critical SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd
Priority to CNB011267283A priority Critical patent/CN1177050C/zh
Publication of CN1403480A publication Critical patent/CN1403480A/zh
Application granted granted Critical
Publication of CN1177050C publication Critical patent/CN1177050C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。

Description

编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
技术领域
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸和此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
背景技术
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
发明内容
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
具体实施方式
本发明采用大规模cDNA克隆转染癌细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对癌细胞(肝癌细胞)具有抑制克隆形成的作用,其抑制率在50%或50%以上。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP2030蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ IDNO:3所示的编码区序列有差别的核酸序列。再以PP2243蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对于本发明的其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽有相同的生物学功能(以PP2030蛋白为例)和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病(如癌症),和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。所述的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将本发明蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,etal.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。这些抗体可用常规方法制备。抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与本发明蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而现在只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:cDNA基因的获得及对癌细胞克隆形成的抑制作用
PP2030、PP2243、PP6569、PP7080、PP7302、PP7759、PP8304、PP8675、PP9455、PP9748、PP9932和PP10141是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、9月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg cDNA滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系7721。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克隆形成,计数。发现上述克隆有抑制癌细胞克隆形成作用,结果如下表所示。
                cDNA克隆转染细胞(7721)克隆形成情况
cDNA克隆名称     cDNA克隆数(三个重复)     空载体克隆数(三个重复)
    PP2030     8     9     8     15     18     1 3
    PP2243     2     12     1     15     18     13
    PP6569     4     10     5     15     18     13
    PP7080     3     2     6     15     18     13
    PP7302     3     4     4     15     18     13
    PP7759     5     2     1     15     18     13
    PP8304     4     2     1     15     18     13
    PP8675     6     4     5     15     18     13
    PP9455     4     0     0     15     18     13
    PP9748     16     6     15     15     18     13
    PP9932     2     0     2     15     18     13
    PP10141     7     5     9     15     18     13
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28、31、34)。
实施例2:从胎盘cDNA中PCR获得全长基因和重组蛋白表达
取3、6、9月龄的人胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的特异引物(如下表所示),按97℃3’1个循环。94℃30″60℃30″72℃1′35个循环,72℃10′1个循环进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,获得重组蛋白(SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35)。
                            基因特异引物
克隆名称 特异引物1(5′→3′)  特异引物2(5′→3′)
PP2030 (573)CAGACCGTGTTCATCTCCAGT  CCGAGCCACGATAAACATTGC(2082)
PP2243 (733)GGGCTGAGGGAGATGACA  GGTTATTTCGTGGGCGGG(1660)
PP6569 (45)CTACACCTTGTCTGCCCACT  TCTCAAACTGGCCGTTCG(1438)
PP7080 (81)AGGAGGAGACGCCGCTGTGA  TGGAGTGAGTGCCGTCGGGT(1305)
PP7302 (2208)GCCATTACTCCTCTTCTTAC  CCTCCTACATCTTGTCCG(3269)
PP7759 (315)GCGAGCCAAGTTTATGGA  AGGACGGAAGGGAGGAGT(2699)
PP8304 (89)CTTCTGAGCTACCAGCCCAATA  ATCTCCGTGGAACCGGGA(1781)
PP8675 (558)GTGAAAGGTTGGACTGGGTG  ATTGGAACGTCGGTTGTGG(1444)
PP9455 (330)TCCACAGTACCCTGTAGCACA  TAGAAGGCCACGATAGGAGG(1675)
PP9748 (120)CGACCAGGCGAAGCAACT  AAAGACCCAGTGTAAACGACG(2148)
PP9932 (505)AGCCCGCTATGATTTCTA  ATCCGTCGAGTACACGTG(1559)
PP10141 (111)CCTACCCTTATCGCTTCTACCC  AAACACGTCTGCCGGACT(1692)
实施例3:cDNA克隆序列分析
1.PP2030
A:核苷酸序列(SEQ ID NO:1)长度:2144个碱基
   1 GCAACATGGC GGCTGCCGTG GTGCAGCGCC CGGGCTGAGC GACAGCAAGT GCAGCGGGCT
  61 CCTACCCCGG GTGAGGGGTG GCCTCCGCGT TGGATCGTGC CCTCTTCAGC CCGCTCCTGT
 121 CCCCGACATC ACGTGTATTC CGCACGTCCC CTCCGCGCTG TGTGTCTACT GAGACGGGGA
 181 GGCGTGACAG GGCCCGGGTC CCTTCTCAGT GGTGCTCTGT GCTTCAGGGC AAGCTCCCCG
 241 TCTCCGGGCG CACTTCCCTC GCCTGTGTTC GGTCCATCCT CCTTTCTCCA GCCTCCTCCC
 301 CTCGCAGGCG GATGACCCGG ACGACGGGCC AGTGCCTGGC ACCCCGGGGT TGCCAGGGTC
 361 CACGGGGAAC CCGAAGTCCG AGGAGCCCGA GGTCCCGGAC CAGGAGGGGC TGCAGCGCAT
 421 CACCGGCCTG TCTCCCGGCC GTTCGGCTCT CATAGTGGCG GTGCTGTGCT ACATCAATCT
 481 CCTGAACTAC ATGGACCGCT TCACCGTGGC TGGCGTCCTT CCCGACATCG AGCAAGTTCT
 541 TCAACATCGG GGACAGTAGC TCTGGGCTCA TCCAGACCGT GTTCATCTCC AGTTACATGG
 601 TGTTGGCACC TGTGTTTGGC TACCTGGGTG ACAGGTACAA TCGGAAGTAT CTCATGTGCG
 661 GGGGCATTGC CTTCTGGTCC CTGGTGACAC TGGGGTCATC CTTCATCCCC GGAGAGCATT
 721 TCTGGCTGCT CCTCCTGACC CGGGGCCTGG TGGGGGTCGG GGAGGCCAGT TATTCCACCA
 781 TCGCGCCCAC TCTCATTGCC GACCTCTTTG TGGCCGACCA GCGGAGCCGG ATGCTCAGCA
 841 TCTTCTACTT TGCCATTCCG GTGGGCAGTG GTCTGGGCTA CATTGCAGGC TCCAAAGTGA
 901 AGGATATGGC TGGAGACTGG CACTGGGCTC TGAGGGTGAC ACCGGGTCTA GGAGTGGTGG
 961 CCGTTCTGCT GCTGTTCCTG GTAGTGCGGG AGCCGCCAAG GGGAGCCGTG GAGCGCCACT
1021 CAGATTTGCC ACCCCTGAAC CCCACCTCGT GGTGGGCAGA TCTGAGGGCT CTGGCAAGAA
1081 ATCCTAGTTT CGTCCTGTCT TCCCTGGGCT TCACTGCTGT GGCCTTTGTC ACGGGCTCCC
1141 TGGCTCTGTG GGCTCCGGCA TTCCTGCTGC GTTCCCGCGT GGTCCTTGGG GAGACCCCAC
1201 CCTGCCTTCC CGGAGACTCC TGCTCTTCCT CTGACAGTCT CATCTTTGGA CTCATCACCT
1261 GCCTGACCGG AGTCCTGGGT GTGGGCCTGG GTGTGGAGAT CAGCCGCCGG CTCCGCCACT
1321 CCAACCCCCG GGCTGATCCC CTGGTCTGTG CCACTGGCCT CCTGGGCTCT GCACCCTTCC
1381 TCTTCCTGTC CCTTGCCTGC GCCCGTGGTA GCATCGTGGC CACTTATATT TTCATCTTCA
1441 TTGGAGAGAC CCTCCTGTCC ATGAACTGGG CCATCGTGGC CGACATTCTG CTGTACGTGG
1501 TGATCCCTAC CCGACGCTCC ACCGCCGAGG CCTTCCAGAT CGTGCTGTCC CACCTGCTGG
1561 GTGATGCTGG GAGCCCCTAC CTCATTGGCC T6ATCTCTGA CCGCCTGCGC CGGAACTGGC
1621 CCCCCTCCTT CTTGTCCGAG TTCCGGGCTC TGCAGTTCTC GCTCATGCTC TGCGCGTTTG
1681 TTGGGGCACT GGGCGGCGCA GCCTTCCTGG GCACCGCCAT CTTCATTGAG GCCGACCGCC
1741 GGCGGGCACA GCTGCACGTG CAGGGCCTGC TGCACGAAGC AGGGTCCACA GACGACCGGA
1801 TTGTGGTGCC CCAGCGGGGC CGCTCCACCC GCGTGCCCGT GGCCAGTGTG CTCATTTGAG
1861 AGGCTGCCGC TCACCTACCT GCACATTTGC CACAGCTGGC CCTGGGCCCA CCCCACGAAG
1921 GGCCTGGGCC TAACCCCTTG GCCTGGCCCA GCTTCCAGAG GACCCTGGGC CGTGTGCCAG
1981 CTCCCAGACA CTACATGGGT AGCTCAGGGG AGGAGGTGGG GGTCCAGGAG GGGGATCCCT
2041 CTCCACAGGG GCAGCCCCAA GGGCTCGGTG CTATTTGTAA CGGAATAAAA TTTGTAGCCA
2101 GAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA
B:核苷酸序列(SEQ ID NO:2)长度:420个氨基酸
  1 MVLAPVFGYL GDRYNRKYLM CGGIAFWSLV TLGSSFIPGE HFWLLLLTRG LVGVGEASYS
 61 TIAPTLIADL FVADQRSRML SIFYFAIPVG SGLGYIAGSK VKDMAGDWHW ALRVTPGLGV
121 VAVLLLFLVV REPPRGAVER HSDLPPLNPT SWWADLRALA RNPSFVLSSL GFTAVAFVTG
181 SLALWAPAFL LRSRVVLGET PPCLPGDSCS SSDSLIFGLI TCLTGVLGVG LGVEISRRLR
241 HSNPRADPLV CATGLLGSAP FLFLSLACAR GSIVATYIFI FIGETLLSMN WAIVADILLY
301 VVIPTRRSTA EAFQIVLSHL LGDAGSPYLI GLISDRLRRN WPPSFLSEFR ALQFSLMLCA
361 FVGALGGAAF LGTAIFIEAD RRRAQLHVQG LLHEAGSTDD RIVVPQRGRS TRVPVASVLI
C.核苷酸及氨基酸组合序列(SEQ ID NO:3)克隆号:PP2030
起始编码子:597ATG终止编码子:1857TGA蛋白质分子量:45299.37
(注:(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿)
  1  GC AAC ATG GCG GCT GCC GTG GTG CAG CGC CCG GGC TGA GCG ACA GCA    47
 48 AGT GCA GCG GGC TCC TAC CCC GGG TGA GGG GTG GCC TCC GCG TTG GAT    95
 96 CGT GCC CTC TTC AGC CCG CTC CTG TCC CCG ACA TCA CGT GTA TTC CGC    143
144 ACG TCC CCT CCG CGC TGT GTG TCT ACT GAG ACG GGG AGG CGT GAC AGG    191
192 GCC CGG GTC CCT TCT CAG TGG TGC TCT GTG CTT CAG GGC AAG CTC CCC    239
240 GTC TCC GGG CGC ACT TCC CTC GCC TGT GTT CGG TCC ATC CTC CTT TCT    287
288 CCA GCC TCC TCC CCT CGC AGG CGG ATG ACC CGG ACG ACG GGC CAG TGC    335
336 CTG GCA CCC CGG GGT TGC CAG GGT CCA CGG GGA ACC CGA AGT CCG AGG    383
384 AGC CCG AGG TCC CGG ACC AGG AGG GGC TGC AGC GCA TCA CCG GCC TGT    431
432 CTC CCG GCC GTT CGG CTC TCA TAG TGG CGG TGC TGT GCT ACA TCA ATC    479
480 TCC TGA ACT ACA TGG ACC GCT TCA CCG TGG CTG GCG TCC TTC CCG ACA    527
528 TCG AGC AAG TTC TTC AAC ATC GGG GAC AGT AGC TCT GGG CTC ATC CAG    575
576 ACC GTG TTC ATC TCC AGT TAC ATG GTG TTG GCA CCT GTG TTT GGC TAC    623
  1                             Met Val Leu Ala Pro Val Phe Gly Tyr    9
624 CTG GGT GAC AGG TAC AAT CGG AAG TAT CTC ATG TGC GGG GGC ATT GCC    671
 10 Leu Gly Asp Arg Tyr Asn Arg Lys Tyr Leu Met Cys Gly Gly Ile Ala    25
672 TTC TGG TCC CTG GTG ACA CTG GGG TCA TCC TTC ATC CCC GGA GAG CAT    719
 26 Phe Trp Ser Leu Val Thr Leu Gly Ser Ser Phe Ile Pro Gly Glu His    41
720 TTC TGG CTG CTC CTC CTG ACC CGG GGC CTG GTG GGG GTC GGG GAG GCC    767
 42 Phe Trp Leu Leu Leu Leu Thr Arg Gly Leu Val Gly Val Gly Glu Ala    57
768 AGT TAT TCC ACC ATC GCG CCC ACT CTC ATT GCC GAC CTC TTT GTG GCC    815
 58 Ser Tyr Ser Thr Ile Ala Pro Thr Leu Ile Ala Asp Leu Phe Val Ala    73
816 GAC CAG CGG AGC CGG ATG CTC AGC ATC TTC TAC TTT GCC ATT CCG GTG    863
 74 Asp Gln Arg Ser Arg Met Leu Ser Ile Phe Tyr Phe Ala Ile Pro Val    89
864 GGC AGT GGT CTG GGC TAC ATT GCA GGC TCC AAA GTG AAG GAT ATG GCT    911
 90 Gly Ser Gly Leu Gly Tyr Ile Ala Gly Ser Lys Val Lys Asp Met Ala    105
912 GGA GAC TGG CAC TGG GCT CTG AGG GTG ACA CCG GGT CTA GGA GTG GTG    959
106 Gly Asp Trp His Trp Ala Leu Arg Val Thr Pro Gly Leu Gly Val Val    121
960 GCC GTT CTG CTG CTG TTC CTG GTA GTG CGG GAG CCG CCA AGG GGA GCC    1007
 122 Ala Val Leu Leu Leu Phe Leu Val Val Arg Glu Pro Pro Arg Gly Ala    137
1008 GTG GAG CGC CAC TCA GAT TTG CCA CCC CTG AAC CCC ACC TCG TGG TGG    1055
 138 Val Glu Arg His Ser Asp Leu Pro Pro Leu Asn Pro Thr Ser Trp Trp    153
1056 GCA GAT CTG AGG GCT CTG GCA AGA AAT CCT AGT TTC GTC CTG TCT TCC    1103
 154 Ala Asp Leu Arg Ala Leu Ala Arg Asn Pro Ser Phe Val Leu Ser Ser    169
1104 CTG GGC TTC ACT GCT GTG GCC TTT GTC ACG GGC TCC CTG GCT CTG TGG    1151
 170 Leu Gly Phe Thr Ala Val Ala Phe Val Thr Gly Ser Leu Ala Leu Trp    185
1152 GCT CCG GCA TTC CTG CTG CGT TCC CGC GTG GTC CTT GGG GAG ACC CCA    1199
 186 Ala Pro Ala Phe Leu Leu Arg Ser Arg Val Val Leu Gly Glu Thr Pro    201
1200 CCC TGC CTT CCC GGA GAC TCC TGC TCT TCC TCT GAC AGT CTC ATC TTT    1247
 202 Pro Cys Leu Pro Gly Asp Ser Cys Ser Ser Ser Asp Ser Leu Ile Phe    217
1248 GGA CTC ATC ACC TGC CTG ACC GGA GTC CTG GGT GTG GGC CTG GGT GTG    1295
 218 Gly Leu Ile Thr Cys Leu Thr Gly Val Leu Gly Val Gly Leu Gly Val    233
1296 GAG ATC AGC CGC CGG CTC CGC CAC TCC AAC CCC CGG GCT GAT CCC CTG    1343
 234 Glu Ile Ser Arg Arg Leu Arg His Ser Asn Pro Arg Ala Asp Pro Leu    249
1344 GTC TGT GCC ACT GGC CTC CTG GGC TCT GCA CCC TTC CTC TTC CTG TCC    1391
 250 Val Cys Ala Thr Gly Leu Leu Gly Ser Ala Pro Phe Leu Phe Leu Ser    265
1392 CTT GCC TGC GCC CGT GGT AGC ATC GTG GCC ACT TAT ATT TTC ATC TTC    1439
 266 Leu Ala Cys Ala Arg Gly Ser Ile Val Ala Thr Tyr Ile Phe Ile Phe    281
1440 ATT GGA GAG ACC CTC CTG TCC ATG AAC TGG GCC ATC GTG GCC GAC ATT    1487
 282 Ile Gly Glu Thr Leu Leu Ser Met Asn Trp Ala Ile Val Ala Asp Ile    297
1488 CTG CTG TAC GTG GTG ATC CCT ACC CGA CGC TCC ACC GCC GAG GCC TTC    1535
 298 Leu Leu Tyr Val Val Ile Pro Thr Arg Arg Ser Thr Ala Glu Ala Phe    313
1536 CAG ATC GTG CTG TCC CAC CTG CTG GGT GAT GCT GGG AGC CCC TAC CTC    1583
 314 Gln Ile Val Leu Ser His Leu Leu Gly Asp Ala Gly Ser Pro Tyr Leu    329
1584 ATT GGC CTG ATC TCT GAC CGC CTG CGC CGG AAC TGG CCC CCC TCC TTC    1631
 330 Ile Gly Leu Ile Ser Asp Arg Leu Arg Arg Asn Trp Pro Pro Ser Phe    345
1632 TTG TCC GAG TTC CGG GCT CTG CAG TTC TCG CTC ATG CTC TGC GCG TTT    1679
 346 Leu Ser Glu Phe Arg Ala Leu Gln Phe Ser Leu Met Leu Cys Ala Phe    361
1680 GTT GGG GCA CTG GGC GGC GCA GCC TTC CTG GGC ACC GCC ATC TTC ATT    1727
 362 Val Gly Ala Leu Gly Gly Ala Ala Phe Leu Gly Thr Ala Ile Phe Ile    377
1728 GAG GCC GAC CGC CGG CGG GCA CAG CTG CAC GTG CAG GGC CTG CTG CAC    1775
 378 Glu Ala Asp Arg Arg Arg Ala Gln Leu His Val Gln Gly Leu Leu His    393
1776 GAA GCA GGG TCC ACA GAC GAC CGG ATT GTG GTG CCC CAG CGG GGC CGC    1823
 394 Glu Ala Gly Ser Thr Asp Asp Arg Ile Val Val Pro Gln Arg Gly Arg    409
1824 TCC ACC CGC GTG CCC GTG GCC AGT GTG CTC ATT TGA GAG GCT GCC GCT    1871
 410 Ser Thr Arg Val Pro Val Ala Ser Val Leu Ile ***                    421
1872 CAC CTA CCT GCA CAT TTG CCA CAG CTG GCC CTG GGC CCA CCC CAC GAA    1919
1920 GGG CCT GGG CCT AAC CCC TTG GCC TGG CCC AGC TTC CAG AGG ACC CTG    1967
1968 GGC CGT GTG CCA GCT CCC AGA CAC TAC ATG GGT AGC TCA GGG GAG GAG    2015
2016 GTG GGG GTC CAG GAG GGG GAT CCC TCT CCA CAG GGG CAG CCC CAA GGG    2063
2064 CTC GGT GCT ATT TGT AAC GGA ATA AAA TTT GTA GCC AGA AAA AAA AAA    2111
2112 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA                        2144
  2.PP2243
  A:核苷酸序列(SEQ ID NO:4)长度:1721个碱基
  1 AGACACCTCC CATTCTGAGG GGAAGCCGCT GCACTCCCTG GGGGACCCCA GTCTGATGCC
  61 CTCCAGGAGG ATAAGTCTGA AGCCGGGCTG GGAAGGGAGC GGAGAGGCCC GAAACAGAGC
 121 AGCAGGCAGC GCCCTCTGCT GGCACCCTGG AGACAGCCTC GGCTGCGGGG CCCCTGCCTT
 181 CTAGTCCTCC CCAGCTTTCA GGACACCTTG ACAACCTGGG GTCCCTGCAG AAGTGGCCCG
 241 GCTGTCCCCC AAGTCTCCTG AAGCTATCTG GGTAGGGTGG GAGGCAGTGC TGTGAGCCAC
 301 AAATGCAAAG CAGAGGGGAC AGATGTTGGG ACTCAAAGAC ATGAGGTAGA GCTGGCCCCA
 361 TGGGTAGGTG CCACCACCAG AGCCCATGAG GCTTCGTGTT CTAGAAGGTG GTGGGTTAGT
 421 GCCGCACTGA GGGCGTGTCC GGGAGGGAGC ATGTGTCACC AGGGCTCAGG AAACAGCATG
 481 AGTCATGACG CGGGGGTGTT TAAGGCATTC GTGCCACAGC GGGGACCTCG GAGCTATGCC
 541 TTGATAAGGC AAGTGAGGTT ACATGTACGA TGATGCGGTT TGTGCTGCAG ACTGGAAAAA
 601 AGCAGGGGCT TTGTCCTCTC CTGACCCCCT CACACTCTGC CTTCACGGTA GGCTCCTGAG
 661 AGGGGGGTCT CCAAGGAGGG TGTCAGTACT GCAGCTTCAG CTGGCGTGGA TGGGGTGCTT
 721 ACAGGAGCAG CAGGGCTGAG GGAGATGACA GCAGTACGAA CCGTGGCTCT CCTGAGGCCT
 781 GGGTTTCCTC ATATGTAAAA TGGGGGTTGC ATTAGACCAT ACCCTTGGCC TGTGTTTAGG
 841 CAAATAGGGA TGAAAGTGGG GCCAAGGGCT GAAGAGCTGG GTCCGCTGCC GTCGTTGCCC
 901 TTCTTTCTTG CCAGGTGAGT GACTTGCGCA ATCAGGTCTA CCTGGAGGAT GGACTGGACC
 961 CCTTCCCAGC GAGGGCCGTG TGGTGGGCAG GCAGCTGATG CACAAGGCCT TGGACAGGTT
1021 GGAGGAGCAC CCAGGCTCCA GGATGACTGC TGAGAAATTT CTGAACAGGC TCCCCAAGTT
1081 TGTGATCCGG CAAGGCGAGG TGATTGACAT CCGGGGCCCC ATCAGGGACA CCTTGCAGAA
1141 CTGCTGCCCA TTGCCTGCCC GGATCCAGGA GATTGTGGTG GAGACGCCCA CCTTGGCCGC
1201 TGAGCGAGAG AGGAGCCAGG AGTCACCCAA CAACGCCGGC ACCCCCGCTC TCCATGCTGC
1261 GCATCAAGTC TGAGAATGGG GAACAGGCCT TCCTACTGAT GATGCAGCCT GACAACACCA
1321 TTGGGGACGT GCGAGCTCTG CTAGCGCAGG CCAGGGTCAT GGATGCCTCT GCCTTTGAGA
1381 TCTTCAGCAC ATTCCCGCCC ACCCTCTACC AGGACGATAC ACTCACGCTG CAGGCTGCAG
1441 GCCTTGTGCC CAAAGCAGCA CTGCTGCTGC GGGCACGCCG AGCCCCGAAG TCCAGCCTGA
1501 AATTCAGTCC TGGTCCCTGT CCCGGTCCCG GTCCCGGCCC CAGTCCCGGT CCCGGTCCCG
1561 GCCCCAGTCC CGGTCCCGGT CCCGGCCCCA GTCCCGGTCC CGGTCCCGGC CCCAGTCCCT
1621 GTCCTGGACC CAGTCCCAGC CCCCAATAAA GCACCCGCCC CCTCAAAAAA AAAAAAAAAA
1681 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA A
B:核苷酸序列(SEQ ID NO:5)长度:131个氨基酸
 1 MLRIKSENGE QAFLLMMQPD NTIGDVRALL AQARVMDASA FEIFSTFPPT LYQDDTLTLQ
61 AAGLVPKAAL LLRARRAPKS SLKFSPGPCP GPGPGPSPGP GPGPSPGPGP GPSPGPGPGP
121 SPCPGPSPSP Q
C.核苷酸及氨基酸组合序列(SEQ ID NO:6)克隆号:PP2243
起始编码子:1254ATG终止编码子:1647TAA蛋白质分子量:13257.45
  1  AG ACA CCT CCC ATT CTG AGG GGA AGC CGC TGC ACT CCC TGG GGG ACC    47
 48 CCA GTC TGA TGC CCT CCA GGA GGA TAA GTC TGA AGC CGG GCT GGG AAG    95
 96 GGA GCG GAG AGG CCC GAA ACA GAG CAG CAG GCA GCG CCC TCT GCT GGC    143
144 ACC CTG GAG ACA GCC TCG GCT GCG GGG CCC CTG CCT TCT AGT CCT CCC    191
192 CAG CTT TCA GGA CAC CTT GAC AAC CTG GGG TCC CTG CAG AAG TGG CCC    239
240 GGC TGT CCC CCA AGT CTC CTG AAG CTA TCT GGG TAG GGT GGG AGG CAG    287
288 TGC TGT GAG CCA CAA ATG CAA AGC AGA GGG GAC AGA TGT TGG GAC TCA    335
336 AAG ACA TGA GGT AGA GCT GGC CCC ATG GGT AGG TGC CAC CAC CAG AGC    383
384 CCA TGA GGC TTC GTG TTC TAG AAG GTG GTG GGT TAG TGC CGC ACT GAG    431
432 GGC GTG TCC GGG AGG GAG CAT GTG TCA CCA GGG CTC AGG AAA CAG CAT    479
480 GAG TCA TGA CGC GGG GGT GTT TAA GGC ATT CGT GCC ACA GCG GGG ACC    527
528 TCG GAG CTA TGC CTT GAT AAG GCA AGT GAG GTT ACA TGT ACG ATG ATG    575
 576 CGG TTT GTG CTG CAG ACT GGA AAA AAG CAG GGG CTT TGT CCT CTC CTG    623
 624 ACC CCC TCA CAC TCT GCC TTC ACG GTA GGC TCC TGA GAG GGG GGT CTC    671
 672 CAA GGA GGG TGT CAG TAC TGC AGC TTC AGC TGG CGT GGA TGG GGT GCT    719
 720 TAC AGG AGC AGC AGG GCT GAG GGA GAT GAC AGC AGT ACG AAC CGT GGC    767
 768 TCT CCT GAG GCC TGG GTT TCC TCA TAT GTA AAA TGG GGG TTG CAT TAG    815
 816 ACC ATA CCC TTG GCC TGT GTT TAG GCA AAT AGG GAT GAA AGT GGG GCC    863
 864 AAG GGC TGA AGA GCT GGG TCC GCT GCC GTC GTT GCC CTT CTT TCT TGC    911
 912 CAG GTG AGT GAC TTG CGC AAT CAG GTC TAC CTG GAG GAT GGA CTG GAC    959
 960 CCC TTC CCA GCG AGG GCC GTG TGG TGG GCA GGC AGC TGA TGC ACA AGG    1007
1008 CCT TGG ACA GGT TGG AGG AGC ACC CAG GCT CCA GGA TGA CTG CTG AGA    1055
1056 AAT TTC TGA ACA GGC TCC CCA AGT TTG TGA TCC GGC AAG GCG AGG TGA    1103
1104 TTG ACA TCC GGG GCC CCA TCA GGG ACA CCT TGC AGA ACT GCT GCC CAT    1151
1152 TGC CTG CCC GGA TCC AGG AGA TTG TGG TGG AGA CGC CCA CCT TGG CCG    1199
1200 CTG AGC GAG AGA GGA GCC AGG AGT CAC CCA ACA ACG CCG GCA CCC CCG    1247
1248 CTC TCC ATG CTG CGC ATC AAG TCT GAG AAT GGG GAA CAG GCC TTC CTA    1295
   1         Met Leu Arg Ile Lys Ser Glu Asn Gly Glu Gln Ala Phe Leu    14
1296 CTG ATG ATG CAG CCT GAC AAC ACC ATT GGG GAC GTG CGA GCT CTG CTA    1343
  15 Leu Met Met Gln Pro Asp Asn Thr Ile Gly Asp Val Arg Ala Leu Leu    30
1344 GCG CAG GCC AGG GTC ATG GAT GCC TCT GCC TTT GAG ATC TTC AGC ACA    1391
  31 Ala Gln Ala Arg Val Met Asp Ala Ser Ala Phe Glu Ile Phe Ser Thr    46
1392 TTC CCG CCC ACC CTC TAC CAG GAC GAT ACA CTC ACG CTG CAG GCT GCA    1439
  47 Phe Pro Pro Thr Leu Tyr Gln Asp Asp Thr Leu Thr Leu Gln Ala Ala    62
1440 GGC CTT GTG CCC AAA GCA GCA CTG CTG CTG CGG GCA CGC CGA GCC CCG    1487
  63 Gly Leu Val Pro Lys Ala Ala Leu Leu Leu Arg Ala Arg Arg Ala Pro    78
1488 AAG TCC AGC CTG AAA TTC AGT CCT GGT CCC TGT CCC GGT CCC GGT CCC    1535
  79 Lys Ser Ser Leu Lys Phe Ser Pro Gly Pro Cys Pro Gly Pro Gly Pro    94
1536 GGC CCC AGT CCC GGT CCC GGT CCC GGC CCC AGT CCC GGT CCC GGT CCC    1583
  95 Gly Pro Ser Pro Gly Pro Gly Pro Gly Pro Ser Pro Gly Pro Gly Pro    110
1584 GGC CCC AGT CCC GGT CCC GGT CCC GGC CCC AGT CCC TGT CCT GGA CCC    1631
 111 Gly Pro Ser Pro Gly Pro Gly Pro Gly Pro Ser Pro Cys Pro Gly Pro    126
1632 AGT CCC AGC CCC CAA TAA AGC ACC CGC CCC CTC AAA AAA AAA AAA AAA    1679
 127 Ser Pro Ser Pro Gln ***                                            132
1680 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA            1721
3.PP6569
A:核苷酸序列(SEQ ID NO:7)长度:2597个碱基
  1 GTTGGGGACT AGGCCACACC TCTCCCTCAT GCTTGTCACC ACTGCTACAC CTTGTCTGCC
 61 CACTTTCTCT CCTTCCCGCC CCTGGAGGTG AGACCCTCAC CTCTCTCGTG AGCATGCTGC
121 CTCATGTCTT CCGTGCCGTC GTTCTGTGGC TGGGTGACTG TCCCTCAGGC CGCCAACCCT
181 AGTTGGCTCT CACAGCAACT TCCAGTGCTC CTGGACGGGG ACTTCCTAAG CAGCATGGGG
241 GCCACACGGG CCGGCCACGC ACACTGGCCT GGGTCCGCAT TCCCTATTTC AGGCTGTTGT
301 CTCGGGTCAG ATCTCCGGAA GCGGCAGGAG CGCTGGGTCT CCTGGTCGTG GCCGGGCAGC
361 GTCTTTCTTC TTCAGGGTCT GGATGCCACT TCCCGCCTCC TCCCTGTGCC CAGTGGAAGG
421 AGAAACATCC TAGAGGGTGG AGACTGCCCT GTTTTTCTTT TGCCATTGAG TCCCAGTGTG
481 ACTCAAGCAC GAGGCCACCT TTCTCTGCCA GAGGACAGAA AGCTTCAGTG ACTGGCCCAG
541 GGTCACACAG TTCTGCCGCC CAGCCCAGCA GCCTGAGCCA GCAGTCAGGA TGGGGTGGGG
601 ACACTCCGTC TCTCTTGAGA CCCCACTCAG AGAATGGGGC TGACACTGTA GGAGAAATAT
661 AAGCAGGACT CCTGCTGGCT GCTCCCCTCC TGCATGAGGC ATGTTAGAGG GACTGGGACC
 721 GCCAGCCCCC AGCTCCCATG CCGGGCCTCG GCCAGTCTCA GCTCCTGTTT GGGAGGGGGG
 781 GCAGAGGGGC AGGGGGGCAG AAGTTGAGTC TGGGAGCTGG GGCAGGGCAC AGGCTCTAGG
 841 GTCCAGCTGT CCTCCTCTCC CCTCCCCTGC TGGCCACTCC TGCTGCCGTC TCCACAGCTC
 901 TGGAATGATG AAGTGGACAA GGTAAGTTGG GGCCTGGGGG GCTGGGCTCG AGGAAGAAGG
 961 GGTGGCGGGG TGCAGGCACA CTTGCTGCTG TGGGGTCTGA TCTGTTTCTC ACTCTGCCCC
1021 ACACCCACTG GGGAGGGGTT ACTGCTTTCC CTCCCTGGGC CTCAGTTTCC CCTCTGTGGG
1081 GAAATGTTTT CTCCACAGTA CCCTGTAGCA CACAGTAGGC CCTCAGGATG CACTTGCTGG
1141 GTGGATTTCT CCGATGGGTG ATGGAGGAAG GGTCTGTCAC TGCAGCTGCC TGTGGGGTCC
1201 TGAGTGGGGC TCTAGCTTCT CTGGGGTTGG GGCTCCAGGT GTGAAGTCAG GCATAGACCC
1261 AGAAGGCTCT CTGTGTTCCC AGGGGAAAGG GACAGGCGGC TCCCAGGTAG GCTCCAGGAG
1321 AAGACTGCGG GGAAGCTGGT GGGTGGTGTG TTGGGGTGCT CATGGCTGCC CTGCCCTGCC
1381 CAGGCCGAGC AGGAGCTCCG CGTGGCCCAG ACAGAGTTTG ACCGGCAAGC AGAAGTGACC
1441 CGTCTCTTGC TGGAGGGAAT CAGTAGCACT CACGTGAACC ACCTGCGCTG CCTCCACGAG
1501 TTCGTCAAGT CTCAGACAAC CTACTACGCA CAGTGCTACC GCCACATGCT GGACTTGCAG
1561 AAGCAGCTGG GCAGATTTCC CGGCACCTTC GTGGGCACCA CAGAGCCCGC CTCCCCACCC
1621 CTGAGCAGCA CCTCACCCAC CACTGCTGCG GCCACTATGC CTGTGGTGCC CTCTGTGGCC
1681 AGCCTGGCCC CTCCGGGGGA GGCCTCGCTC TGCCTGGAAG AGGTGGCCCC CCCTGCCAGT
1741 GGGACCCGCA AAGCTCGGGT GCTCTATGAC TACGAGGCAG CCGACAGCAG TGAGCTGGCC
1801 CTGCTGGCTG ATGAGCTCAT CACTGTCTAC AGCCTGCCTG GCATGGACCC TGACTGGCTC
1861 ATTGGCGAGA GAGGCAACAA GAAGGGCAAG GTCCCTGTCA CCTACTTGGA ACTGCTCAGC
1921 TAGGCAGGTG CCCCCATCCC CCCCGCATTC TGGCCTAGGC AGGAGAGGAT GGGCGCAGCC
1981 CTGCCACTTA ACTTGTTTGT TGGTGACACA GTTGTTCAGA GTGGGGAGAA TTCACCCCAT
2041 TCTGTCCCTG CCCCTAGTCA CCTAGCTGTG AGGGTGCCTG AGGCTGAATG GCTCCACCCC
2101 TCCCCCAGCC CTGCTTCTGA CCTGTGGCTC TGGAGCCCCT GCCCCTGCCT GCATCCCCGA
2161 GCACCCCACC CTCCAGGCTC CACTAAGGAG GGAGGGGCTG TTTGCAGCAG CTGCACTCAG
2221 CACCTAGGCC AGGGTGGGGC CGCCGCAGAT GGGCTCAGGA AGCCCCAGGT GCACTCAGCG
2281 AGAGCCCTGC CTTTCAGTTG CCAAAAGCTG CATCAGGGGA ATGCGGCAAG GCACACAGGG
2341 CTCTGGCAGC CCCTGGGGAC TGGGCGCTGC CCCTGGGAGG GGAGAGCCTG GCCAGGGCTG
2401 GTGTTGGGCC CGGAGCAGCA TCTTCCGGTG CTATCCTCCC CTCCCACCCC TCACAGCTCA
2461 AGCCAAGTCC AGCGGCCGCA GTCTTCACCT CTCCACACTC ACTTTTTATC TGGTGTTTTT
2521 ACTTCTGCCT GCGTTTGCTC TCTAGCCAAT AAACCGTCCT TGTGTGCGAA AAAAAAAAAA
2581 AAAAAAAAAA AAAAAAA
B:核苷酸序列(SEQ ID NO:8)长度:135个氨基酸
  1 MSSVPSFCGW VTVPQAANPS WLSQQLPVLL DGDFLSSMGA TRAGHAHWPG SAFPISGCCL
 61 GSDLRKRQER WVSWSWPGSV FLLQGLDATS RLLPVPSGRR NILEGGDCPV FLLPLSPSVT
121 QARGHLSLPE DRKLQ
C.核苷酸及氨基酸组合序列(SEQ ID NO:9)克隆号:PP6569
起始编码子:124ATG终止编码子:529TGA蛋白质分子量:14634.93
  1 GTT GGG GAC TAG GCC ACA CCT CTC CCT CAT GCT TGT CAC CAC TGC TAC    48
 49 ACC TTG TCT GCC CAC TTT CTC TCC TTC CCG CCC CTG GAG GTG AGA CCC    96
 97 TCA CCT CTC TCG TGA GCA TGC TGC CTC ATG TCT TCC GTG CCG TCG TTC    144
  1                                     Met Ser Ser Val Pro Ser Phe    7
145 TGT GGC TGG GTG ACT GTC CCT CAG GCC GCC AAC CCT AGT TGG CTC TCA    192
  8 Cys Gly Trp Val Thr Val Pro Gln Ala Ala Asn Pro Ser Trp Leu Ser    23
193 CAG CAA CTT CCA GTG CTC CTG GAC GGG GAC TTC CTA AGC AGC ATG GGG    240
 24 Gln Gln Leu Pro Val Leu Leu Asp Gly Asp Phe Leu Ser Ser Met Gly    39
241 GCC ACA CGG GCC GGC CAC GCA CAC TGG CCT GGG TCC GCA TTC CCT ATT    288
 40 Ala Thr Arg Ala Gly His Ala His Trp Pro Gly Ser Ala Phe Pro Ile    55
 289 TCA GGC TGT TGT CTC GGG TCA GAT CTC CGG AAG CGG CAG GAG CGC TGG    336
  56 Ser Gly Cys Cys Leu Gly Ser Asp Leu Arg Lys Arg Gln Glu Arg Trp    71
 337 GTC TCC TGG TCG TGG CCG GGC AGC GTC TTT CTT CTT CAG GGT CTG GAT    384
  72 Val Ser Trp Ser Trp Pro Gly Ser Val Phe Leu Leu Gln Gly Leu Asp    87
 385 GCC ACT TCC CGC CTC CTC CCT GTG CCC AGT GGA AGG AGA AAC ATC CTA    432
  88 Ala Thr Ser Arg Leu Leu Pro Val Pro Ser Gly Arg Arg Asn Ile Leu    103
 433 GAG GGT GGA GAC TGC CCT GTT TTT CTT TTG CCA TTG AGT CCC AGT GTG    480
 104 Glu Gly Gly Asp Cys Pro Val Phe Leu Leu Pro Leu Ser Pro Ser Val    119
 481 ACT CAA GCA CGA GGC CAC CTT TCT CTG CCA GAG GAC AGA AAG CTT CAG    528
 120 Thr Gln Ala Arg Gly His Leu Ser Leu Pro Glu Asp Arg Lys Leu Gln    135
 529 TGA CTG GCC CAG GGT CAC ACA GTT CTG CCG CCC AGC CCA GCA GCC TGA    576
 136 ***                                                                136
 577 GCC AGC AGT CAG GAT GGG GTG GGG ACA CTC CGT CTC TCT TGA GAC CCC    624
 625 ACT CAG AGA ATG GGG CTG ACA CTG TAG GAG AAA TAT AAG CAG GAC TCC    672
 673 TGC TGG CTG CTC CCC TCC TGC ATG AGG CAT GTT AGA GGG ACT GGG ACC    720
 721 GCC AGC CCC CAG CTC CCA TGC CGG GCC TCG GCC AGT CTC AGC TCC TGT    768
 769 TTG GGA GGG GGG GCA GAG GGG CAG GGG GGC AGA AGT TGA GTC TGG GAG    816
 817 CTG GGG CAG GGC ACA GGC TCT AGG GTC CAG CTG TCC TCC TCT CCC CTC    864
 865 CCC TGC TGG CCA CTC CTG CTG CCG TCT CCA CAG CTC TGG AAT GAT GAA    912
 913 GTG GAC AAG GTA AGT TGG GGC CTG GGG GGC TGG GCT CGA GGA AGA AGG    960
 961 GGT GGC GGG GTG CAG GCA CAC TTG CTG CTG TGG GGT CTG ATC TGT TTC    1008
1009 TCA CTC TGC CCC ACA CCC ACT GGG GAG GGG TTA CTG CTT TCC CTC CCT    1056
1057 GGG CCT CAG TTT CCC CTC TGT GGG GAA ATG TTT TCT CCA CAG TAC CCT    1104
1105 GTA GCA CAC AGT AGG CCC TCA GGA TGC ACT TGC TGG GTG GAT TTC TCC    1152
1153 GAT GGG TGA TGG AGG AAG GGT CTG TCA CTG CAG CTG CCT GTG GGG TCC    1200
1201 TGA GTG GGG CTC TAG CTT CTC TGG GGT TGG GGC TCC AGG TGT GAA GTC    1248
1249 AGG CAT AGA CCC AGA AGG CTC TCT GTG TTC CCA GGG GAA AGG GAC AGG    1296
1297 CGG CTC CCA GGT AGG CTC CAG GAG AAG ACT GCG GGG AAG CTG GTG GGT    1344
1345 GGT GTG TTG GGG TGC TCA TGG CTG CCC TGC CCT GCC CAG GCC GAG CAG    1392
1393 GAG CTC CGC GTG GCC CAG ACA GAG TTT GAC CGG CAA GCA GAA GTG ACC    1440
1441 CGT CTC TTG CTG GAG GGA ATC AGT AGC ACT CAC GTG AAC CAC CTG CGC    1488
1489 TGC CTC CAC GAG TTC GTC AAG TCT CAG ACA ACC TAC TAC GCA CAG TGC    1536
1537 TAC CGC CAC ATG CTG GAC TTG CAG AAG CAG CTG GGC AGA TTT CCC GGC    1584
1585 ACC TTC GTG GGC ACC ACA GAG CCC GCC TCC CCA CCC CTG AGC AGC ACC    1632
1633 TCA CCC ACC ACT GCT GCG GCC ACT ATG CCT GTG GTG CCC TCT GTG GCC    1680
1681 AGC CTG GCC CCT CCG GGG GAG GCC TCG CTC TGC CTG GAA GAG GTG GCC    1728
1729 CCC CCT GCC AGT GGG ACC CGC AAA GCT CGG GTG CTC TAT GAC TAC GAG    1776
1777 GCA GCC GAC AGC AGT GAG CTG GCC CTG CTG GCT GAT GAG CTC ATC ACT    1824
1825 GTC TAC AGC CTG CCT GGC ATG GAC CCT GAC TGG CTC ATT GGC GAG AGA    1872
1873 GGC AAC AAG AAG GGC AAG GTC CCT GTC ACC TAC TTG GAA CTG CTC AGC    1920
1921 TAG GCA GGT GCC CCC ATC CCC CCC GCA TTC TGG CCT AGG CAG GAG AGG    1968
1969 ATG GGC GCA GCC CTG CCA CTT AAC TTG TTT GTT GGT GAC ACA GTT GTT    2016
2017 CAG AGT GGG GAG AAT TCA CCC CAT TCT GTC CCT GCC CCT AGT CAC CTA    2064
2065 GCT GTG AGG GTG CCT GAG GCT GAA TGG CTC CAC CCC TCC CCC AGC CCT    2112
2113 GCT TCT GAC CTG TGG CTC TGG AGC CCC TGC CCC TGC CTG CAT CCC CGA    2160
2161 GCA CCC CAC CCT CCA GGC TCC ACT AAG GAG GGA GGG GCT GTT TGC AGC    2208
2209 AGC TGC ACT CAG CAC CTA GGC CAG GGT GGG GCC GCC GCA GAT GGG CTC    2256
2257 AGG AAG CCC CAG GTG CAC TCA GCG AGA GCC CTG CCT TTC AGT TGC CAA    2304
2305 AAG CTG CAT CAG GGG AAT GCG GCA AGG CAC ACA GGG CTC TGG CAG CCC    2352
2353 CTG GGG ACT GGG CGC TGC CCC TGG GAG GGG AGA GCC TGG CCA GGG CTG    2400
2401 GTG TTG GGC CCG GAG CAG CAT CTT CCG GTG CTA TCC TCC CCT CCC ACC    2448
2449 CCT CAC AGC TCA AGC CAA GTC CAG CGG CCG CAG TCT TCA CCT CTC CAC    2496
2497 ACT CAC TTT TTA TCT GGT GTT TTT ACT TCT GCC TGC GTT TGC TCT CTA    2544
2545 GCC AAT AAA CCG TCC TTG TGT GCG AAA AAA AAA AAA AAA AAA AAA AAA    2592
2593 AAA AA                                                             2597
4.PP7080
A:核苷酸序列(SEQ ID NO:10)长度:1861个碱基
   1 GCGCGCGCGC CGCCGCCCCG CGCTGCTGAA GCTGGCGTCG CTGCCGCCCT CGTGCCACGC
  61 ACCGCCGCAC GCGCTGGAGC AGGAGGAGAC GCCGCTGTGA CGCCGCCGGC GGGAAGGGTC
 121 CGCGCGCCAT GGCTGGCCGC TCGCGCCCTT TCCCACCGCT GCCGGGAAAC CGAGGCTCGC
 181 CCCAAACGGA TTTGCGTGAA ACCAGCCCAA GGTTCCGGGC CCCCCCAACC GAGCCCCGCG
 241 CCCGGGGACT GACTCGGGGA CCGACTCAGG GACCTCCCGA GCGCCAGGAC TCAGGGCCCG
 301 ACCTGCAGCG GCTGCAGGCC CAGCGCCCGC AAGCGGCCTG GGCCGAGCGC CGTTTCCAGG
 361 CCCTCGCCAG GTCTTTGAAC TGCAGATCAA GTGTTGACAG TCACCAGTCA GGAGGAGTTC
 421 TTAAAGAGTT TTATGTTGAC TGAATATTGC ACATTGAGTC CCCATTGAGT CCCTGGTGGG
 481 AAAAGTCCAC AATTTCCCAT TGATAGCTTT TTACTGTTGT GAAAAAGGGA AGCGTCAGCC
 541 ACACAAAAGC CTGCATGACC GCTGCTTCGG AGAAGCTCTC GACCCTAACT GCAGTCACTG
 601 TTACTTGGAT CAGATCAAGC GCAGTGACTT TTTGGGATTC AGTGGTTATT CTCCACACTT
 661 CGTAGCCATT TCAACCAACT CTGAGCACAA AATGCAGCCA TCCTCTATGC AGCAAGCCCT
 721 GCCCAGTCAG TGACCCTACT GGACAGATCC AAGGCCAGCC CTGGTTCCCT GCTGCAGCCA
 781 CCGTCCTGAC GTTCATCGGA GCAGGCCGGG GCCTGGCCTT CCCGGCACAA GTGGCTGTTC
 841 TGACAGGCCC CCAGTTTGTC CCATCTGAAC TGCTGGGAGG TTTCCCGGGT GGCCAGAGGA
 901 GCAAAGCTGC CTTCCAAGTG CCTGTCTGTG CCTGGGGAGA ACAGAGCAGG AGCGTCGTGC
 961 GGTCCACCGC GCAATGCATG GCGATTCCAG GCGCTGAACA ACTCCCCTGG ACCCTTGGGC
1021 CTGCATCTGA CTCCCAGCTG CAGAGTCAGA AGCTGAGTCC AGGCAACTGC TTGGCCACTC
1081 CCGATCGCTC CTCCCTGGAC ACCCGGTTAC CAAAGTCAGC AAAGAAGATG CGGTAATCGC
1141 CGCCTGATCT CCACATGGTG AACACAACAC TCCCACCAAC ACCTCCTTGA CTGGTCGGTC
1201 TTCAGCACCG GGGGTGGGCA GGCAGGTGTT CTGTGTTGAC GAGAATTGCA CAGGCTAAAC
1261 ACAAACACGG AACCAGAGTG AGAACACCTC ACTCACGGCA GCCCAGGCTG CTCCCTACCA
1321 GGTGACGGAG CGCGCCGGGG CTGTGGGTGC CAGGGGCTGA GTGCTAGGGA CTCGTCATGA
1381 GTGGGGATCC CCACGGTTCC TGTCACTGCT GTCAAACAGA AGGTAAACAG TCTTATGAAT
1441 GTATTTCCTT AGGAAAACTT GTAAAAACTT TTATTAGGAT ATCTATTTAA TACTGAACTT
1501 TGGCCTACTT TGTGATAGAC TATAAACAAA TTGAGGAAAT CACTATTTCT CACTTCTGTA
1561 TTTTCTCAAA AATAATTTTG TTACAGAGTT CAATATACTG TGTACCATTG ATCTTCTATT
1621 GTGAAAGCAA AGAATTTCAT CAAAATATTT TAAATTATGA GTGAAAATTG TGTATGTTAA
1681 TTTTGCAGCT ATAATATTAA TCAAATTTCG TGTAATTCTA ATCACAAAAT GACGTGCCTT
1741 AAGTGCCCCT CCAGCTGTGG GTTGGCAGTG TCCAGACAGG GAGGGCCCAT CACCGAAATC
1801 CTGAACGATT ACTAGACCAA TTCTATTAAA AACATTTCAA GGCAAAAAAA AAAAAAAAAA
1861 A
B:核苷酸序列(SEQ ID NO:11)长度:104个氨基酸
 1 MAGRSRPFPP LPGNRGSPQT DLRETSPRFR APPTEPRARG LTRGPTQGPP ERQDSGPDLQ
61 RLQAQRPQAA WAERRFQALA RSLNCRSSVD SHQSGGVLKE FYVD
C.核苷酸及氨基酸组合序列(SEQ ID NO:12)克隆号:PP7080
起始编码子:129ATG终止编码子:441TGA蛋白质分子量:11561.25
 1  GC GCG CGC GCC GCC GCC CCG CGC TGC TGA AGC TGG CGT CGC TGC CGC    47
48 CCT CGT GCC ACG CAC CGC CGC ACG CGC TGG AGC AGG AGG AGA CGC CGC    95
 96 TGT GAC GCC GCC GGC GGG AAG GGT CCG CGC GCC ATG GCT GGC CGC TCG     143
  1                                              Met Ala Gly Arg Ser    5
 144 CGC CCT TTC CCA CCG CTG CCG GGA AAC CGA GGC TCG CCC CAA ACG GAT    191
   6 Arg Pro Phe Pro Pro Leu Pro Gly Asn Arg Gly Ser Pro Gln Thr Asp    21
 192 TTG CGT GAA ACC AGC CCA AGG TTC CGG GCC CCC CCA ACC GAG CCC CGC    239
  22 Leu Arg Glu Thr Ser Pro Arg Phe Arg Ala Pro Pro Thr Glu Pro Arg    37
 240 GCC CGG GGA CTG ACT CGG GGA CCG ACT CAG GGA CCT CCC GAG CGC CAG    287
  38 Ala Arg Gly Leu Thr Arg Gly Pro Thr Gln Gly Pro Pro Glu Arg Gln    53
 288 GAC TCA GGG CCC GAC CTG CAG CGG CTG CAG GCC CAG CGC CCG CAA GCG    335
  54 Asp Ser Gly Pro Asp Leu Gln Arg Leu Gln Ala Gln Arg Pro Gln Ala    69
 336 GCC TGG GCC GAG CGC CGT TTC CAG GCC CTC GCC AGG TCT TTG AAC TGC    383
  70 Ala Trp Ala Glu Arg Arg Phe Gln Ala Leu Ala Arg Ser Leu Asn Cys    85
 384 AGA TCA AGT GTT GAC AGT CAC CAG TCA GGA GGA GTT CTT AAA GAG TTT    431
  86 Arg Ser Ser Val Asp Ser His Gln Ser Gly Gly Val Leu Lys Glu Phe    101
 432 TAT GTT GAC TGA ATA TTG CAC ATT GAG TCC CCA TTG AGT CCC TGG TGG    479
 102 Tyr Val Asp ***                                                    105
 480 GAA AAG TCC ACA ATT TCC CAT TGA TAG CTT TTT ACT GTT GTG AAA AAG    527
 528 GGA AGC GTC AGC CAC ACA AAA GCC TGC ATG ACC GCT GCT TCG GAG AAG    575
 576 CTC TCG ACC CTA ACT GCA GTC ACT GTT ACT TGG ATC AGA TCA AGC GCA    623
 624 GTG ACT TTT TGG GAT TCA GTG GTT ATT CTC CAC ACT TCG TAG CCA TTT    671
 672 CAA CCA ACT CTG AGC ACA AAA TGC AGC CAT CCT CTA TGC AGC AAG CCC    719
 720 TGC CCA GTC AGT GAC CCT ACT GGA CAG ATC CAA GGC CAG CCC TGG TTC    767
 768 CCT GCT GCA GCC ACC GTC CTG ACG TTC ATC GGA GCA GGC CGG GGC CTG    815
 816 GCC TTC CCG GCA CAA GTG GCT GTT CTG ACA GGC CCC CAG TTT GTC CCA    863
 864 TCT GAA CTG CTG GGA GGT TTC CCG GGT GGC CAG AGG AGC AAA GCT GCC    911
 912 TTC CAA GTG CCT GTC TGT GCC TGG GGA GAA CAG AGC AGG AGC GTC GTG    959
 960 CGG TCC ACC GCG CAA TGC ATG GCG ATT CCA GGC GCT GAA CAA CTC CCC    1007
1008 TGG ACC CTT GGG CCT CCA TCT GAC TCC CAG CTG CAG AGT CAG AAG CTG    1055
1056 AGT CCA GGC AAC TGC TTG GCC ACT CCC GAT CGC TCC TCC CTG GAC ACC    1103
1104 CGG TTA CCA AAG TCA GCA AAG AAG ATG CGG TAA TCG CCG CCT GAT CTC    1151
1152 CAC ATG GTG AAC ACA ACA CTC CCA CCA ACA CCT CCT TGA CTG GTC GGT    1199
1200 CTT CAG CAC CGG GGG TGG GCA GGC AGG TGT TCT GTG TTG ACG AGA ATT    1247
1248 GCA CAG GCT AAA CAC AAA CAC GGA ACC AGA GTG AGA ACA CCT CAC TCA    1295
1296 CGG CAG CCC AGG CTG CTC CCT ACC AGG TGA CGG AGC GCG CCG GGG CTG    1343
1344 TGG GTG CCA GGG GCT GAG TGC TAG GGA CTC GTC ATG AGT GGG GAT CCC    1391
1392 CAC GGT TCC TGT CAC TGC TGT CAA ACA GAA GGT AAA CAG TCT TAT GAA    1439
1440 TGT ATT TCC TTA GGA AAA CTT GTA AAA ACT TTT ATT AGG ATA TCT ATT    1487
1488 TAA TAC TGA ACT TTG GCC TAC TTT GTG ATA GAC TAT AAA CAA ATT GAG    1535
1536 GAA ATC ACT ATT TCT CAC TTC TGT ATT TTC TCA AAA ATA ATT TTG TTA    1583
1584 CAG AGT TCA ATA TAC TGT GTA CCA TTG ATC TTC TAT TGT GAA AGC AAA    1631
1632 GAA TTT CAT CAA AAT ATT TTA AAT TAT GAG TGA AAA TTG TGT ATG TTA    1679
1680 ATT TTG CAG CTA TAA TAT TAA TCA AAT TTC GTG TAA TTC TAA TCA CAA    1727
1728 AAT GAC GTG CCT TAA GTG CCC CTC CAG CTG TGG GTT GGC AGT GTC CAG    1775
1776 ACA GGG AGG GCC CAT CAC CGA AAT CCT GAA CGA TTA CTA GAC CAA TTC    1823
1824 TAT TAA AAA CAT TTC AAG GCA AAA AAA AAA AAA AAA AA                 1861
5.PP7302
A:核苷酸序列(SEQ ID NO:13)长度:4640个碱基
   1 GTCTTTATCC TCACCTGAAA CTCATAGCTG TAAACCTTGA CAATCCACAG GGGTCCAAAT
  61 ACCTCAGCCA GGTAGGAGGC CTCATTGCTG AGAAAGAATA GAGTTCTTAA GCTGGTTTAG
 121 TTAAATAGGG ATTATCTGGG GGCATTTACT ACCAATTGGT CCATACTGGT AATCCTCAAA
 181 AGGGTACCAT ACTCCCTGTG CCCTTTTCCA CCAAAGATTT AGAATTCTAT TCATGTGAGA
 241 GCCCTAAGGT CTTTGGACAT ATTTTAAATT CTCAAGTCAT TCCCCCCACC CCCTTCATCT
 301 CATACAGATC ATCTGACAAA GTACTATTCT TAGAATTTGT CCCTGTTTGT GGGGAGCTTT
 361 TCTCACTCTA GTCTTGCTCT AAACTTTAAA TAATGGTCCC AGACATTGTC CTGACCATCC
 421 TTCCCTGTCT TGGGCACCCT CCTTTCATAC CTCCACCCTT GACACCTTTA CGCACCAAGC
 481 AAAAAGCACA CAAGCATACA TGATGCTAGC ACTCAGCATT GCTAGAGAGA TATCTGGTGT
 541 TTGGGGTTCC ATTTTACTCA GGCCAGGCAG GCACAGGGTG TGATTCTGTC CTTGAAGGAT
 601 TACTGGGAAG GGACAACAGA AGAGATGGGT ATTAACAATG AGCTAGGTAT TTGGCAGGGG
 661 CAAAAAAAGG TCTTAGCATG GAGAATCCAG GTCCTGTCCC TTACCTCTCT CTGGAGGACG
 721 GCTGGACAGT GCAGAGAAAG TCAGATACAT GATATAGCAG CTGATGACAG AAGCTTGTAG
 781 GAGGCCAGAG CGGGGTTGCT CTGGGGAGTA AGTATAATTG CTTTAGTCTA CAGGCTGGTA
 841 ATTTCCTCCA TTTCTACCCC CACTTGTACT TCTGTCTCCC CATCCTTTGG TGGGGATAGG
 901 GAAGCAGAGA TTCTTTTATC AAATAATTGA GATTAGGGAG GTAATGAAAC TTGCTATGCT
 961 TTTAAGGCCC CCAAAACCTG GAATGCTGTA GGACATGTAC CCACTGAGGC GGATCGAAGG
1021 AGCGATGGAG AGGAAGGAGA TGAGGCCACA GAAGCAAAGG TGCAGACTGA GGAGCATCTT
1081 GTTAAGCAGG CAGCCAGCTG GGTGTGTATA ATAGTGGAAT AGGAGCACAG CTCCCACACC
1141 TGCCATGCTG TAGAATCCTA GGGTGGCCAG CAGGACAGCC AGGAACCAGC TACAGTCTTG
1201 AGCTGCACCT GTCTGCCTAA GGGTGGAAAG TGGGCAATGG CTTGGAGCTC CAGCATTTTT
1261 TTTTTTTTTG AGTTGGGAGT TTTTGCTCTG TTGCCCAGGC TGGAGTGCAA TGGTGTGGTC
1321 TCAGCTCACT GCAACCTCCG CCTCTTGGGT TCAAGTGATT CTCCTACCTC AGCCTCCTGA
1381 GTGGCTGGGA TTACAGGCAC CTACCACCAT GTCCAGCTAA CTTTTATATT TTTACTAGAG
1441 AGGGGGTTTC ACCATGTTGG CCAGGCTGGT CTCAAACTCC TGACCTCATG ATCCACCCAC
1501 CTCGGCCTCC CAAAGTGCTG GGATTACAGG CATGAGCCAC CGTGCCCAGC TGGAGCTCCA
1561 ACTCTTTTAC CCATTACCAA CTACTCCCCT GCTCTCAAAA GACTGGTGTG ACTAGCCATC
1621 CTACTTGGCC CACGCAGTCA TCACATTCCT AAGCTTTTTT GATACTGCTC AGTGGGAAGC
1681 TGTGGGACCA GTGCTCTGCC GTGCCTTTTG CCCAGCCCTT TCCATGTAGT AATACTAGAA
1741 ACCTCCCCAG GAAAAGCCTT TAGGGTTATG TGCCCCTTAC CAGTTCTTGT TCCAGGAATG
1801 GGCAAAAGCT GTAATAAGCA CCAACCTGCA GTAGGATGAA TGCAAAGCCT CCACAGATGC
1861 CAATGTAATG CCATGCTGCA AGATGGGCAC CAGTGGAAAA ATGTCAAATT GTTACTTTTT
1921 TTTTTTTTTG AGACAGAGTC TTGCTCTGTC ACCCAGGCTA GAGTGCAGTG GTGTGATTTC
1981 AGCTCACTGC AACCTCTGCC TCCCGGGTTC AAGTGATTCT TCTGCCTCCA CCTCCTGAGC
2041 AGCTGGGATT ACAGGTGCGT GCCACCATGC CCGGCTAATA TTTTGTATTT TTAGTAGAGA
2101 TGGGGTTTCA CCATGTTAGC CAGGATTGTC TTGATCTCTT GACCTCGTGA TCCGCCCGCC
2161 TCAGCCTCCC AAAGTGCTGG GATTACAGGC GTGAGCCACT GCACCCGGCC ATTACTCCTC
2221 TTCTTACCCA CTTGTTATCT TAGAAAACTT AGCCTACTCC TGCCAAGAGT GTGGGAGGGA
2281 GAGTACCTGG GAAGAGATGC TCATCAGGAA TGCAGAAGGC AATAGCACAG AGACCTAACA
2341 GGAACAGCAG CTTGAGGAGC CAGAAGCTGG TTAGGAGGGA GAAAGAAAAA CAGACTCAGG
2401 AGAAAAGGCA AAGGACAGTG AAGAGTGCCT ATGGGGAAAG GCAAAAGAGA AACCAAAAAT
2461 ATAGGAAAGA GGACAGACGA GACAACTAAG GAGGAACCAA TCCCAAATGA GAGGGGGCTG
2521 GGACAGGCTA CCTGCACCTT ATTCCAAATT CTAACTCAAA GATACTTAAT AGCATCTGGG
2581 CAATGTTTTA CAGTTTATAA AGGATTGTGT TACCAAGATA ACCCCACTGT TACCTCCATT
2641 TTAGATGCTA GAAGCACAAA GTCTGGCTCA AGGTTACACA GCAAGTACAC GAGAAGCAGG
2701 GACTTAAACC TGTTTTCTGT CTTTTTACAG TGCTATTACT TCATCCCGGA ATTTCCTTTA
2761 CCCAGCCTAT GTCTACTTTC CCTCCTCTGT CCCCTCCCCA CCCAGAAAGT ACACACAAAC
2821 CTATTATGCA GCTGTGCCCG CGGGCTGGTG GGGGAGTGGA GGTGGACCAG CAACACAGCC
2881 TGCAGCAGGT GGAAGGTGGC GGTTCCTGCA CATACTCGGT ACACAGCCCC AGAGCCACTG
2941 AGCACTGGAC AGTCAGAGAG GCCAAACAGG TGGGCACACA ACCCCGAGGG CATCTGGATC
3001 TGGGAGTGTG TGTGTGAGAA ATGGCAGGAC AAGTCATAAT GCATGGAAAG GTACCTACTT
3061 GTCACGGGTA TGACCACTCA TTTGTCTCCT GCCCCCAACC GAAACCTTTT CTATCTTAGG
3121 GTTTTTCCTT TTATCTCTTC CCACCTGACA ACCCGACCCC CTCTCACTTA CCCTGTGTGT
3181 CTTGCCCCAC ACCCTTTCCA CTACTGTCCT TGACAGCAGG AGGCAGCAGA TTGCTGAGGC
3241 CCCCACATGG AGGAGGATGT AGAACAGGCG GCTGCAAGTG GATGCGGTGA GAGAGGGCCA
3301 CCTAGAGTGG CAGCAGCTGG CACAAGGAGC AGGCCCACAG CAGCACACCT GGGAGTAGAG
3361 CAGATGCAAG GCAGCGAGGT GGAGACTTGC TGAGGAAAGG CATACGTTAA TGTATGTGTG
3421 AGGTTAACCC AGGAGGTTGA ATTCCAAAAT TTCCCCTTCC CCTTTCTTCC TTTTACTCAG
3481 GTTCTGTTTC AAGCTGATTC CAGCCATTTG GGATTGCCGC CCACTGACAA CTTAGTAGGG
3541 CTTTCATTAT AAGCAGGCTT GAGATATCTG ACCTTTCTCT CGACCTAAAC ACCTGGGGCT
3601 GGAAACATGG CGGGAGAGAT TTACAGATTA TACCTGGGGC AACGAACCAG AACGACATTA
3661 GAGGAGAAAA GAGGCCTGTC GTTTTTATTG GCTTCTGCAC GTCTTCCTCC CCAGCTTCGG
3721 CCACTCTCCC CTTCGCACCC TCTCACCTGA CAGAAGGGAC TTTTCACTAG GACACTGCTG
3781 CCTCCGCTGT GCTGCTGTGC CAGGCCCAGG GAGGTGCCGG GGCTGGGGCC GGCCTTGGCA
3841 CCCACCATCC TTGTCCCAGG GATTAGGCTT AGGTCCACCA GATGGAAGGC AGATGAGAGC
3901 AGCAGTTGCT TCTGTCCTCA GCCCATTGGA CTGCCACTGT GTTGGGGCTG AGCACCCGGT
3961 CCCGGGCAGA ATGGAGACGT CCGGAAGAGA ACACTGACCT CCAGGTTGCG CTTCTAGAAC
4021 TGGAGCAGAA AGAAGGTGTG GCCCAGGGCC AGCCCCGCCT CCTCCCCGGG CGGAAGCTGT
4081 GTCAGTTGCC GGAAGTCGGC GTGAGGTGGG GCTTATGCGG CGGCGTGGTG AAATAGATAT
4141 GGCGACCGAG GGGGATGTGG AGCTGGAGTT GGAGACTGAG ACCAGTGGAC CAGAGCGGCC
4201 TCCGGAGAAG CCACGGAAAC ATGACAGCGG TGCGGCGGAC TTGGAGCGGG TCACCGACTA
4261 TGCAGAGGAG AAGGAGATCC AGAGTTCCAA TCTGGAGACG GCCATGTCTG TGATTGGAGA
4321 CAGAAGGTCC CGGGAGCAGA AAGCCAAACA GGAGCGGGAG AAAGAACTGG CAAAAGTCAC
4381 TATCAAGAAG GAAGATCTGG AGCTAATAAT GACTGAGATG GAGATATCTC GAGCAGCAGC
4441 AGAACGCAGT TTGCGGGAAC ACATGGGCAA CGTGGTAGAG GCGCTTATTG CCCTAACCAA
4501 CTGATGCGTG CTTTCTCAAA TATACCTACT GGATTAATTT ATGGCAATAA AATTTTTTTT
4561 TTGTCTTTTT CAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
4621 AAAAAAAAAA AAAAAAAAAA
B:核苷酸序列(SEQ ID NO:14)长度:202个氨基酸
  1 MGKGKRETKN IGKRTDETTK EEPIPNERGL GQATCTLFQI LTQRYLIASG QCFTVYKGLC
 61 YQDNPTVTSI LDARSTKSGS RLHSKYTRSR DLNLFSVFLQ CYYFIPEFPL PSLCLLSLLC
121 PLPTQKVHTN LLCSCARGLV GEWRWTSNTA CSRWKVAVPA HTRYTAPEPL STGQSERPNR
181 WAHNPEGIWI WECVCEKWQD KS
C.核苷酸及氨基酸组合序列(SEQ ID NO:15)克隆号:PP7302
起始编码子:2431ATG终止编码子:3037TAA蛋白质分子量:23051.24
  1 GTC TTT ATC CTC ACC TGA AAC TCA TAG CTG TAA ACC TTG ACA ATC CAC    48
 49 AGG GGT CCA AAT ACC TCA GCC AGG TAG GAG GCC TCA TTG CTG AGA AAG    96
 97 AAT AGA GTT CTT AAG CTG GTT TAG TTA AAT AGG GAT TAT CTG GGG GCA    144
145 TTT ACT ACC AAT TGG TCC ATA CTG GTA ATC CTC AAA AGG GTA CCA TAC    192
193 TCC CTG TGC CCT TTT CCA CCA AAG ATT TAG AAT TCT ATT CAT GTG AGA    240
241 GCC CTA AGG TCT TTG GAC ATA TTT TAA ATT CTC AAG TCA TTC CCC CCA    288
289 CCC CCT TCA TCT CAT ACA GAT CAT CTG ACA AAG TAC TAT TCT TAG AAT    336
337 TTG TCC CTG TTT GTG GGG AGC TTT TCT CAC TCT AGT CTT GCT CTA AAC    384
385 TTT AAA TAA TGG TCC CAG ACA TTG TCC TGA CCA TCC TTC CCT GTC TTG    432
433 GGC ACC CTC CTT TCA TAC CTC CAC CCT TGA CAC CTT TAC GCA CCA AGC    480
481 AAA AAG CAC ACA AGC ATA CAT GAT GCT AGC ACT CAG CAT TGC TAG AGA    528
529 GAT ATC TGG TGT TTG GGG TTC CAT TTT ACT CAG GCC AGG CAG GCA CAG    576
577 GGT GTG ATT CTG TCC TTG AAG GAT TAC TGG GAA GGG ACA ACA GAA GAG    624
625 ATG GGT ATT AAC AAT GAG CTA GGT ATT TGG CAG GGG CAA AAA AAG GTC    672
673 TTA GCA TGG AGA ATC CAG GTC CTG TCC CTT ACC TCT CTC TGG AGG ACG    720
 721 GCT GGA CAG TGC AGA GAA AGT CAG ATA CAT GAT ATA GCA GCT GAT GAC    768
 769 AGA AGC TTG TAG GAG GCC AGA GCG GGG TTG CTC TGG GGA GTA AGT ATA    816
 817 ATT GCT TTA GTC TAC AGG CTG GTA ATT TCC TCC ATT TCT ACC CCC ACT    864
 865 TGT ACT TCT GTC TCC CCA TCC TTT GGT GGG GAT AGG GAA GCA GAG ATT    912
 913 CTT TTA TCA AAT AAT TGA GAT TAG GGA GGT AAT GAA ACT TGC TAT GCT    960
 961 TTT AAG GCC CCC AAA ACC TGG AAT GCT GTA GGA CAT GTA CCC ACT GAG    1008
1009 GCG GAT CGA AGG AGC GAT GGA GAG GAA GGA GAT GAG GCC ACA GAA GCA    1056
1057 AAG GTG CAG ACT GAG GAG CAT CTT GTT AAG CAG GCA GCC AGC TGG GTG    1104
1105 TGT ATA ATA GTG GAA TAG GAG CAC AGC TCC CAC ACC TGC CAT GCT GTA    1152
1153 GAA TCC TAG GGT GGC CAG CAG GAC AGC CAG GAA CCA GCT ACA GTC TTG    1200
1201 AGC TGC ACC TGT CTG CCT AAG GGT GGA AAG TGG GCA ATG GCT TGG AGC    1248
1249 TCC AGC ATT TTT TTT TTT TTT GAG TTG GGA GTT TTT GCT CTG TTG CCC    1296
1297 AGG CTG GAG TGC AAT GGT GTG GTC TCA GCT CAC TGC AAC CTC CGC CTC    1344
1345 TTG GGT TCA AGT GAT TCT CCT ACC TCA GCC TCC TGA GTG GCT GGG ATT    1392
1393 ACA GGC ACC TAC CAC CAT GTC CAG CTA ACT TTT ATA TTT TTA CTA GAG    1440
1441 AGG GGG TTT CAC CAT GTT GGC CAG GCT GGT CTC AAA CTC CTG ACC TCA    1488
1489 TGA TCC ACC CAC CTC GGC CTC CCA AAG TGC TGG GAT TAC AGG CAT GAG    1536
1537 CCA CCG TGC CCA GCT GGA GCT CCA ACT CTT TTA CCC ATT ACC AAC TAC    1584
1585 TCC CCT GCT CTC AAA AGA CTG GTG TGA CTA GCC ATC CTA CTT GGC CCA    1632
1633 CGC AGT CAT CAC ATT CCT AAG CTT TTT TGA TAC TGC TCA GTG GGA AGC    1680
1681 TGT GGG ACC AGT GCT CTG CCG TGC CTT TTG CCC AGC CCT TTC CAT GTA    1728
1729 GTA ATA CTA GAA ACC TCC CCA GGA AAA GCC TTT AGG GTT ATG TGC CCC    1776
1777 TTA CCA GTT CTT GTT CCA GGA ATG GGC AAA AGC TGT AAT AAG CAC CAA    1824
1825 CCT GCA GTA GGA TGA ATG CAA AGC CTC CAC AGA TGC CAA TGT AAT GCC    1872
1873 ATG CTG CAA GAT GGG CAC CAG TGG AAA AAT GTC AAA TTG TTA CTT TTT    1920
1921 TTT TTT TTT GAG ACA GAG TCT TGC TCT GTC ACC CAG GCT AGA GTG CAG    1968
1969 TGG TGT GAT TTC AGC TCA CTG CAA CCT CTG CCT CCC GGG TTC AAG TGA    2016
2017 TTC TTC TGC CTC CAC CTC CTG AGC AGC TGG GAT TAC AGG TGC GTG CCA    2064
2065 CCA TGC CCG GCT AAT ATT TTG TAT TTT TAG TAG AGA TGG GGT TTC ACC    2112
2113 ATG TTA GCC AGG ATT GTC TTG ATC TCT TGA CCT CGT GAT CCG CCC GCC    2160
2161 TCA GCC TCC CAA AGT GCT GGG ATT ACA GGC GTG AGC CAC TGC ACC CGG    2208
2209 CCA TTA CTC CTC TTC TTA CCC ACT TGT TAT CTT AGA AAA CTT AGC CTA    2256
2257 CTC CTG CCA AGA GTG TGG GAG GGA GAG TAC CTG GGA AGA GAT GCT CAT    2304
2305 CAG GAA TGC AGA AGG CAA TAG CAC AGA GAC CTA ACA GGA ACA GCA GCT    2352
2353 TGA GGA GCC AGA AGC TGG TTA GGA GGG AGA AAG AAA AAC AGA CTC AGG    2400
2401 AGA AAA GGC AAA GGA CAG TGA AGA GTG CCT ATG GGG AAA GGC AAA AGA    2448
   1                                         Met Gly Lys Gly Lys Arg    6
2449 GAA ACC AAA AAT ATA GGA AAG AGG ACA GAC GAG ACA ACT AAG GAG GAA    2496
   7 Glu Thr Lys Asn Ile Gly Lys Arg Thr Asp Glu Thr Thr Lys Glu Glu    22
2497 CCA ATC CCA AAT GAG AGG GGG CTG GGA CAG GCT ACC TGC ACC TTA TTC    2544
  23 Pro Ile Pro Asn Glu Arg Gly Leu Gly Gln Ala Thr Cys Thr Leu Phe    38
2545 CAA ATT CTA ACT CAA AGA TAC TTA ATA GCA TCT GGG CAA TGT TTT ACA    2592
  39 Gln Ile Leu Thr Gln Arg Tyr Leu Ile Ala Ser Gly Gln Cys Phe Thr    54
2593 GTT TAT AAA GGA TTG TGT TAC CAA GAT AAC CCC ACT GTT ACC TCC ATT    2640
  55 Val Tyr Lys Gly Leu Cys Tyr Gln Asp Asn Pro Thr Val Thr Ser Ile    70
2641 TTA GAT GCT AGA AGC ACA AAG TCT GGC TCA AGG TTA CAC AGC AAG TAC    2688
  71 Leu Asp Ala Arg Ser Thr Lys Ser Gly Ser Arg Leu His Ser Lys Tyr    86
2689 ACG AGA AGC AGG GAC TTA AAC CTG TTT TCT GTC TTT TTA CAG TGC TAT    2736
  87 Thr Arg Ser Arg Asp Leu Asn Leu Phe Ser Val Phe Leu Gln Cys Tyr    102
2737 TAC TTC ATC CCG GAA TTT CCT TTA CCC AGC CTA TGT CTA CTT TCC CTC    2784
 103 Tyr Phe Ile Pro Glu Phe Pro Leu Pro Ser Leu Cys Leu Leu Ser Leu    118
2785 CTC TGT CCC CTC CCC ACC CAG AAA GTA CAC ACA AAC CTA TTA TGC AGC    2832
 119 Leu Cys Pro Leu Pro Thr Gln Lys Val His Thr Asn Leu Leu Cys Ser    134
2833 TGT GCC CGC GGG CTG GTG GGG GAG TGG AGG TGG ACC AGC AAC ACA GCC    2880
 135 Cys Ala Arg Gly Leu Val Gly Glu Trp Arg Trp Thr Ser Asn Thr Ala    150
2881 TGC AGC AGG TGG AAG GTG GCG GTT CCT GCA CAT ACT CGG TAC ACA GCC    2928
 151 Cys Ser Arg Trp Lys Val Ala Val Pro Ala His Thr Arg Tyr Thr Ala    166
2929 CCA GAG CCA CTG AGC ACT GGA CAG TCA GAG AGG CCA AAC AGG TGG GCA    2976
 167 Pro Glu Pro Leu Ser Thr Gly Gln Ser Glu Arg Pro Asn Arg Trp Ala    182
2977 CAC AAC CCC GAG GGC ATC TGG ATC TGG GAG TGT GTG TGT GAG AAA TGG    3024
 183 His Asn Pro Glu Gly Ile Trp Ile Trp Glu Cys Val Cys Glu Lys Trp    198
3025 CAG GAC AAG TCA TAA TGC ATG GAA AGG TAC CTA CTT GTC ACG GGT ATG    3072
 199  Gln Asp Lys Ser ***                                               203
3073 ACC ACT CAT TTG TCT CCT GCC CCC AAC CGA AAC CTT TTC TAT CTT AGG    3120
3121 GTT TTT CCT TTT ATC TCT TCC CAC CTG ACA ACC CGA CCC CCT CTC ACT    3168
3169 TAC CCT GTG TGT CTT GCC CCA CAC CCT TTC CAC TAC TGT CCT TGA CAG    3216
3217 CAG GAG GCA GCA GAT TGC TGA GGC CCC CAC ATG GAG GAG GAT GTA GAA    3264
3265 CAG GCG GCT GCA AGT GGA TGC GGT GAG AGA GGG CCA CCT AGA GTG GCA    3312
3313 GCA GCT GGC ACA AGG AGC AGG CCC ACA GCA GCA CAC CTG GGA GTA GAG    3360
3361 CAG ATG CAA GGC AGC GAG GTG GAG ACT TGC TGA GGA AAG GCA TAC GTT    3408
3409 AAT GTA TGT GTG AGG TTA ACC CAG GAG GTT GAA TTC CAA AAT TTC CCC    3456
3457 TTC CCC TTT CTT CCT TTT ACT CAG GTT CTG TTT CAA GCT GAT TCC AGC    3504
3505 CAT TTG GGA TTG CCG CCC ACT GAC AAC TTA GTA GGG CTT TCA TTA TAA    3552
3553 GCA GGC TTG AGA TAT CTG ACC TTT CTC TCG ACC TAA ACA CCT GGG GCT    3600
3601 GGA AAC ATG GCG GGA GAG ATT TAC AGA TTA TAC CTG GGG CAA CGA ACC    3648
3649 AGA ACG ACA TTA GAG GAG AAA AGA GGC CTG TCG TTT TTA TTG GCT TCT    3696
3697 GCA CGT CTT CCT CCC CAG CTT CGG CCA CTC TCC CCT TCG CAC CCT CTC    3744
3745 ACC TGA CAG AAG GGA CTT TTC ACT AGG ACA CTG CTG CCT CCG CTG TGC    3792
3793 TGC TGT GCC AGG CCC AGG GAG GTG CCG GGG CTG GGG CCG GCC TTG GCA    3840
3841 CCC ACC ATC CTT GTC CCA GGG ATT AGG CTT AGG TCC ACC AGA TGG AAG    3888
3889 GCA GAT GAG AGC AGC AGT TGC TTC TGT CCT CAG CCC ATT GGA CTG CCA    3936
3937 CTG TGT TGG GGC TGA GCA CCC GGT CCC GGG CAG AAT GGA GAC GTC CGG    3984
3985 AAG AGA ACA CTG ACC TCC AGG TTG CGC TTC TAG AAC TGG AGC AGA AAG    4032
4033 AAG GTG TGG CCC AGG GCC AGC CCC GCC TCC TCC CCG GGC GGA AGC TGT    4080
4081 GTC AGT TGC CGG AAG TCG GCG TGA GGT GGG GCT TAT GCG GCG GCG TGG    4128
4129 TGA AAT AGA TAT GGC GAC CGA GGG GGA TGT GGA GCT GGA GTT GGA GAC    4176
4177 TGA GAC CAG TGG ACC AGA GCG GCC TCC GGA GAA GCC ACG GAA ACA TGA    4224
4225 CAG CGG TGC GGC GGA CTT GGA GCG GGT CAC CGA CTA TGC AGA GGA GAA    4272
4273 GGA GAT CCA GAG TTC CAA TCT GGA GAC GGC CAT GTC TGT GAT TGG AGA    4320
4321 CAG AAG GTC CCG GGA GCA GAA AGC CAA ACA GGA GCG GGA GAA AGA ACT    4368
4369 GGC AAA AGT CAC TAT CAA GAA GGA AGA TCT GGA GCT AAT AAT GAC TGA    4416
4417 GAT GGA GAT ATC TCG AGC AGC AGC AGA ACG CAG TTT GCG GGA ACA CAT    4464
4465 GGG CAA CGT GGT AGA GGC GCT TAT TGC CCT AAC CAA CTG ATG CGT GCT    4512
4513 TTC TCA AAT ATA CCT ACT GGA TTA ATT TAT GGC AAT AAA ATT TTT TTT    4560
4561 TTG TCT TTT TCA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    4608
4609 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AA                         4640
6.PP7759
A:核苷酸序列(SEQ ID NO:16)长度:2867个碱基
   1 GAACGACCAT GGAGGCCACG TCCCGGGAGG CGGCGCCAGC GAAGAGCTCG GCCTCGGGCC
  61 CCAACGCTCC CCCCGCCCTG TTCGAGCTGT GCGGGCGGGC GGTGAGCAGC CCATATGGGG
 121 GTTCTGGAGA GCGGGGTGTG GGCCCTCCCA GGCCCAATAC TTCAAAGCAT CCTACCTCTG
 181 CTCAATATAT ATTACTTGGA GAGGATTGAG GAAACTGCCC TCAAGAAAGG CCTCTCAACT
 241 CAGGCCATCT GGCGCCGACT CTGGGATGAA CTGATGAAGA CAAGGCCTTC CAGTTTGGAA
 301 AGTGTGACAT GTTGGCGAGC CAAGTTTATG GAGGCCTTTT TTTTCCCATG TTCTACGTGG
 361 GACCATTGAT GTGTCTTCTG ACAGGCGTCT TTGTGATCAG CGGTTCTCAC CTCTTCTGCA
 421 CAGCTCCCGC CATGTCCGAC AGCTCACCAT CTGTAACATG CTGCAGGGTG CAACCGAGCT
 481 GGTGGCTGAG CCCAACCGCA GGGTTCTGGA GACCCTGGCC AGCTCCCTGC ACACTCTGAA
 541 GTTCCGCCAC CTGCTGTTCT CTGATGTGGC TGCTCAGCAG TCACTTCGGC AGCTGTTGCA
 601 TCAGCTCATT CACCATGGGG CTGTCAGTCA AGTGTCGCTA TACTCCTGGC CTGTGCCTGA
 661 GTCAGCCCTT TTCATCCTTA TTCTCACCAT GAGTGCTGGC TTCTGGCAAC CAGGGCCTGG
 721 TGGCCCACCC TGCCGCCTCT GTGGAGAGGC CTCCCGAGGC CGGGCCCCAT CCCGAGATGA
 781 AGGGTCCCTC TTATTGGGCT CACGTCGGCC CCGCCGGGAT GCTGCTGAGC GATGTGCTGC
 841 AGCCCTGATG GCCAGCCGGC GTAAGAGTGA AGCCAAGCAG ATGCCCAGAG CTGCACCTGC
 901 CACTCGGGTA ACACGCCGGA GCACACAGGA GAGCCTGACA GCAGGCGGAA CAGACCTTAA
 961 GAGGGAGCTG CACCCCCCAG CCACCTCCCA TGAGGCTCCT GGCACCAAGC GGTCACCTTC
1021 TGCTCCAGCA GCCACCTCCT CTGCCTCTTC TTCTACATCC TCATACAAAC GGGCACCAGC
1081 TAGCTCAGCC CCACAGCCTA AGCCCCTAAA GCGTTTCAAG CGAGCTGCAG GGAAGAAGGG
1141 TGCTCGCACC CGTCAGGGGC CTGGTGCAGA GTCTGAAGAC CTGTATGACT TCGTTTTTAT
1201 TGTGGCTGGC GAGAAGGAGG ATGGCGAAAA GATGGAGATT GGGGAAGTGG CTTGTGGAGC
1261 TTTGGATGGA TCAGATCCCA GCTGCCTGGG GCTTCCAGCA CTGGAAGCTT CACAAAGATT
1321 CCGCAGCATC TCCACCTTGG AGCTATTCAC AGTTCCACTC TCCACAGAGG CAGCCCTGAC
1381 ACTATGCCAC CTGCTGAGCT CCTGGGTGTC ACTGGAGAGC CTCACACTCT CCTACAATGG
1441 CCTGGGCTCT AACATCTTCC GCCTGCTAGA CAGCCTGCGG GCCCTGTCAG GCCAGGCTGG
1501 ATGTCGCCTC CGTGCCCTGC ATCTCAGTGA CCTGTTCTCA CCACTGCCCA TCCTGGAGCT
1561 GACACGTGCT ATCGTGCGAG CACTGCCCCT GCTACGGGTC CTCTCTATTC GTGTTGACCA
1621 CCCAAGCCAG CGGGACAACC CTGGTGTGCC AGGGAATGCA GGGCCCCCTA GCCACATAAT
1681 AGGCGATGAG GAGATACCAG AAAACTGCCT GGAGCAGTTG GAGATGGGAT TTCCACGGGG
1741 AGCCCAGCCA GCCCCACTGC TGTGCTCCGT TCTGAAGGCC TCGGGTTCTC TGCAGCAGCT
1801 GTCCCTGGAT AGTGCCACCT TTGCCTCTCC CCAGGATTTT GGGCTTGTTT TGCAAACACT
1861 CAAAGAGTAC AACCTAGCCC TGAAAAGACT GAGCTTCCAT GACATGAATC TCGCTGACTG
1921 TCAGAGCGAG GTGCTCTTTT TGCTACAGAA TCTGACTCTG CAAGAGATTA CCTTCTCCTT
1981 CTGCCGTCTG TTTGAGAAGC GCCCAGCCCA ATTTCTGCCT GAGATGGTTG CTGCTATGAA
2041 GGGCAACTCC ACACTGAAGG GCCTCCGGCT GCCAGGGAAC CGCCTGGGGA ATGCTGGCCT
2101 GCTGGCCTTG GCAGATGTTT TCTCAGAGGA TTCATCCTCC TCTCTCTGTC AGCTGGACAT
2161 CAGTTCCAAC TGCATCAAGC CAGATGGGCT TCTGGAGTTC GCCAAGCGGC TGGAGCGCTG
2221 GGGCCGTGGA GCCTTTGGTC ACCTGCGCCT CTTCCAAAAC TGGCTGGACC AGGATGCAGT
2281 CACAGCCAGG GAAGCCATCC GGCGGCTCCG GGCTACCTGC CATGTGGTTA GCGACTCATG
2341 GGACTCATCC CAGGCCTTCG CAGATTATGT TAGCACCATG TGATGGGGCC CGTACCTCAC
2401 AGTCTCATGC TCGGTACCAT CAGCTTGCAG GGGCTGAAGC ATGGGCTGCC CAGAACCCCA
2461 ACCACCAGTT CTATCTTTCT CTTTCTGTCA CCTTTTTTCT CTTTTTTCCT TCTTCCCTTG
2521 CACTGAGGTC CTGGAGGCCT TGATGAGGCC CAGCAAACAG GCATTCTCAC AGCTGGGTTT
2581 ATAGTCTTTG GGCCCCTTAC TCAGTATCCT GGGAACCCTG GGCCAGGAGG TTACAGTGGT
2641 CATCATAATT GCTGAAGAGA TCCCCTCCCC TGCCCCTGGG TTCCTGCCTT CCCTCCTCAA
2701 GCAGGCACCC AGGCTTTAGA GAAGTATAGG GGGCTTCTTC CCTGCTGGGC TTACCACACT
2761 GCTCTCAGGC CTCAAACCCT TTCATACCTT TATTCTTTTT TTTAACCAAA AAAGTTTTTC
2821 TTATAAAATA AATTTTGGGC AAACAAAAAA AAAAAAAAAA AAAAAAA
B:核苷酸序列(SEQ ID N0:17)长度:641个氨基酸
  1 MLQGATELVA EPNRRVLETL ASSLHTLKFR HLLFSDVAAQ QSLRQLLHQL IHHGAVSQVS
 61 LYSWPVPESA LFILILTMSA GFWQPGPGGP PCRLCGEASR GRAPSRDEGS LLLGSRRPRR
121 DAAERCAAAL MASRRKSEAK QMPRAAPATR VTRRSTQESL TAGGTDLKRE LHPPATSHEA
181 PGTKRSPSAP AATSSASSST SSYKRAPASS APQPKPLKRF KRAAGKKGAR TRQGPGAESE
241 DLYDFVFIVA GEKEDGEKME IGEVACGALD GSDPSCLGLP ALEASQRFRS ISTLELFTVP
301 LSTEAALTLC HLLSSWVSLE SLTLSYNGLG SNIFRLLDSL RALSGQAGCR LRALHLSDLF
361 SPLPILELTR AIVRALPLLR VLSIRVDHPS QRDNPGVPGN AGPPSHIIGD EEIPENCLEQ
421 LEMGFPRGAQ PAPLLCSVLK ASGSLQQLSL DSATFASPQD FGLVLQTLKE YNLALKRLSF
481 HDMNLADCQS EVLFLLQNLT LQEITFSFCR LFEKRPAQFL PEMVAAMKGN STLKGLRLPG
541 NRLGNAGLLA LADVFSEDSS SSLCQLDISS NCIKPDGLLE FAKRLERWGR GAFGHLRLFQ
601 NWLDQDAVTA REAIRRLRAT CHVVSDSWDS SQAFADYVST M
C.核苷酸及氨基酸组合序列(SEQ ID NO:18)克隆号:PP7759
起始编码子:458ATG终止编码子:2381TGA蛋白质分子量:69570.47
  1   G AAC GAC CAT GGA GGC CAC GTC CCG GGA GGC GGC GCC AGC GAA GAG    46
 47 CTC GGC CTC GGG CCC CAA CGC TCC CCC CGC CCT GTT CGA GCT GTG CGG    94
 95 GCG GGC GGT GAG CAG CCC ATA TGG GGG TTC TGG AGA GCG GGG TGT GGG    142
143 CCC TCC CAG GCC CAA TAC TTC AAA GCA TCC TAC CTC TGC TCA ATA TAT    190
191 ATT ACT TGG AGA GGA TTG AGG AAA CTG CCC TCA AGA AAG GCC TCT CAA    238
239 CTC AGG CCA TCT GGC GCC GAC TCT GGG ATG AAC TGA TGA AGA CAA GGC    286
287 CTT CCA GTT TGG AAA GTG TGA CAT GTT GGC GAG CCA AGT TTA TGG AGG    334
335 CCT TTT TTT TCC CAT GTT CTA CGT GGG ACC ATT GAT GTG TCT TCT GAC    382
383 AGG CGT CTT TGT GAT CAG CGG TTC TCA CCT CTT CTG CAC AGC TCC CGC    430
431 CAT GTC CGA CAG CTC ACC ATC TGT AAC ATG CTG CAG GGT GCA ACC GAG    478
  1                                     Met Leu Gln Gly Ala Thr Glu    7
479 CTG GTG GCT GAG CCC AAC CGC AGG GTT CTG GAG ACC CTG GCC AGC TCC    526
  8 Leu Val Ala Glu Pro Asn Arg Arg Val Leu Glu Thr Leu Ala Ser Ser    23
527 CTG CAC ACT CTC AAG TTC CGC CAC CTG CTG TTC TCT GAT GTG GCT GCT    574
 24 Leu His Thr Leu Lys Phe Arg His Leu Leu Phe Ser Asp Val Ala Ala    39
575 CAG CAG TCA CTT CGG CAG CTG TTG CAT CAG GTC ATT CAC CAT GGG GCT    622
 40 Gln Gln Ser Leu Arg Gln Leu Leu His Gln Leu Ile His His Gly Ala    55
623 GTC AGT CAA GTG TCG CTA TAC TCC TGG CCT GTG CCT GAG TCA GCC CTT    670
 56 Val Ser Gln Val Ser Leu Tyr Ser Trp Pro Val Pro Glu Ser Ala Leu    71
671 TTC ATC CTT ATT CTC ACC ATG AGT GCT GGC TTC TGG CAA CCA GGG CCT    718
 72 Phe Ile Leu Ile Leu Thr Met Ser Ala Gly Phe Trp Gln Pro Gly Pro    87
719 GGT GGC CCA CCC TGC CGC CTC TGT GGA GAG GCC TCC CGA GGC CGG GCC    766
 88 Gly Gly Pro Pro Cys Arg Leu Cys Gly Glu Ala Ser Arg Gly Arg Ala    103
767 CCA TCC CGA GAT GAA GGG TCC CTC TTA TTG GGC TCA CGT CGG CCC CGC    814
104 Pro Ser Arg Asp Glu Gly Ser Leu Leu Leu Gly Ser Arg Arg Pro Arg    119
815 CGG GAT GCT GCT GAG CGA TGT GCT GCA GCC CTG ATG GCC AGC CGG CGT    862
120 Arg Asp Ala Ala Glu Arg Cys Ala Ala Ala Leu Met Ala Ser Arg Arg    135
863 AAG AGT GAA GCC AAG CAG ATG CCC AGA GCT GCA CCT GCC ACT CGG GTA    910
136 Lys Ser Glu Ala Lys Gln Met Pro Arg Ala Ala Pro Ala Thr Arg Val    151
911 ACA CGC CGG AGC ACA CAG GAG AGC CTG ACA GCA GGC GGA ACA GAC CTT    958
152 Thr Arg Arg Ser Thr Gln Glu Ser Leu Thr Ala Gly Gly Thr Asp Leu    167
959 AAG AGG GAG CTG CAC CCC CCA GCC ACC TCC CAT GAG GCT CCT GGC ACC    1006
 168 Lys Arg Glu Leu His Pro Pro Ala Thr Ser His Glu Ala Pro Gly Thr    183
1007 AAG CGG TCA CCT TCT GCT CCA GCA GCC ACC TCC TCT GCC TCT TCT TCT    1054
 184 Lys Arg Ser Pro Ser Ala Pro Ala Ala Thr Ser Ser Ala Ser Ser Ser    199
1055 ACA TCC TCA TAC AAA CGG GCA CCA GCT AGC TCA GCC CCA CAG CCT AAG    1102
 200 Thr Ser Ser Tyr Lys Arg Ala Pro Ala Ser Ser Ala Pro Gln Pro Lys    215
1103 CCC CTA AAG CGT TTC AAG CGA GCT GCA GGG AAG AAG GGT GCT CGC ACC    1150
 216 Pro Leu Lys Arg Phe Lys Arg Ala Ala Gly Lys Lys Gly Ala Arg Thr    231
1151 CGT CAG GGG CCT GGT GCA GAG TCT GAA GAC CTG TAT GAC TTC GTT TTT    1198
 232 Arg Gln Gly Pro Gly Ala Glu Ser Glu Asp Leu Tyr Asp Phe Val Phe    247
1199 ATT GTG GCT GGC GAG AAG GAG GAT GGC GAA AAG ATG GAG ATT GGG GAA    1246
 248 Ile Val Ala Gly Glu Lys Glu Asp Gly Glu Lys Met Glu Ile Gly Glu    263
1247 GTG GCT TGT GGA GCT TTG GAT GGA TCA GAT CCC AGC TGC CTG GGG CTT    1294
 264 yal Ala Cys Gly Ala Leu Asp Gly Ser Asp Pro Ser Cys Leu Gly Leu    279
1295 CCA GCA CTG GAA GCT TCA CAA AGA TTC CGC AGC ATC TCC ACC TTG GAG    1342
 280 Pro Ala Leu Glu Ala Ser Gln Arg Phe Arg Ser Ile Ser Thr Leu Glu    295
1343 CTA TTC ACA GTT CCA CTC TCC ACA GAG GCA GCC CTG ACA CTA TGC CAC    1390
 296 Leu Phe Thr Val Pro Leu Ser Thr Glu Ala Ala Leu Thr Leu Cys His    311
1391 CTG CTG AGC TCC TGG GTG TCA CTG GAG AGC CTC ACA CTC TCC TAC AAT    1438
 312 Leu Leu Ser Ser Trp Val Ser Leu Glu Ser Leu Thr Leu Ser Tyr Asn    327
1439 GGC CTG GGC TCT AAC ATC TTC CGC CTG CTA GAC AGC CTG CGG GCC CTG    1486
 328 Gly Leu Gly Ser Asn Ile Phe Arg Leu Leu Asp Ser Leu Arg Ala Leu    343
1487 TCA GGC CAG GCT GGA TGT CGC CTC CGT GCC CTG CAT CTC AGT GAC CTG    1534
 344 Ser Gly Gln Ala Gly Cys Arg Leu Arg Ala Leu His Leu Ser Asp Leu    359
1535 TTC TCA CCA CTG CCC ATC CTG GAG CTG ACA CGT GCT ATC GTG CGA GCA    1582
 360 Phe Ser Pro Leu Pro Ile Leu Glu Leu Thr Arg Ala Ile Val Arg Ala    375
1583 CTG CCC CTG CTA CGG GTC CTC TCT ATT CGT GTT GAC CAC CCA AGC CAG    1630
 376 Leu Pro Leu Leu Arg Val Leu Ser Ile Arg Val Asp His Pro Ser Gln    391
1631 CGG GAC AAC CCT GGT GTG CCA GGG AAT GCA GGG CCC CCT AGC CAC ATA    1678
 392 Arg Asp Asn Pro Gly Val Pro Gly Asn Ala Gly Pro Pro Ser His Ile    407
1679 ATA GGC GAT GAG GAG ATA CCA GAA AAC TGC CTG GAG CAG TTG GAG ATG    1726
 408 Ile Gly Asp Glu Glu Ile Pro Glu Asn Cys Leu Glu Gln Leu Glu Met    423
1727 GGA TTT CCA CGG GGA GCC CAG CCA GCC CCA CTG CTG TGC TCC GTT CTG    1774
 424 Gly Phe Pro Arg Gly Ala Gln Pro Ala Pro Leu Leu Cys Ser Val Leu    439
1775 AAG GCC TCG GGT TCT CTG CAG CAG CTG TCC CTG GAT AGT GCC ACC TTT    1822
 440 Lys Ala Ser Gly Ser Leu Gln Gln Leu Ser Leu Asp Ser Ala Thr Phe    455
1823 GCC TCT CCC CAG GAT TTT GGG CTT GTT TTG CAA ACA CTC AAA GAG TAC    1870
 456 Ala Ser Pro Gln Asp Phe Gly Leu Val Leu Gln Thr Leu Lys Glu Tyr    471
1871 AAC CTA GCC CTG AAA AGA CTG AGC TTC CAT GAC ATG AAT CTC GCT GAC    1918
 472 Asn Leu Ala Leu Lys Arg Leu Ser Phe His Asp Met Asn Leu Ala Asp    487
1919 TGT CAG AGC GAG GTG CTC TTT TTG CTA CAG AAT CTG ACT CTG CAA GAG    1966
 488 Cys Gln Ser Glu Val Leu Phe Leu Leu Gln Asn Leu Thr Leu Gln Glu    503
1967 ATT ACC TTC TCC TTC TGC CGT CTG TTT GAG AAG CGC CCA GCC CAA TTT    2014
 504 Ile Thr Phe Ser Phe Cys Arg Leu Phe Glu Lys Arg Pro Ala Gln Phe    519
2015 CTG CCT GAG ATG GTT GCT GCT ATG AAG GGC AAC TCC ACA CTG AAG GGC    2062
 520 Leu Pro Glu Met Val Ala Ala Met Lys Gly Asn Ser Thr Leu Lys Gly    535
2063 CTC CGG CTG CCA GGG AAC CGC CTG GGG AAT GCT GGC CTG CTG GCC TTG    2110
 536 Leu Arg Leu Pro Gly Asn Arg Leu Gly Asn Ala Gly Leu Leu Ala Leu    551
2111 GCA GAT GTT TTC TCA GAG GAT TCA TCC TCC TCT CTC TGT CAG CTG GAC    2158
 552 Ala Asp Val Phe Ser Glu Asp Ser Ser Ser Ser Leu Cys Gln Leu Asp    567
2159 ATC AGT TCC AAC TGC ATC AAG CCA GAT GGG CTT CTG GAG TTC GCC AAG    2206
 568 Ile Ser Ser Asn Cys Ile Lys Pro Asp Gly Leu Leu Glu Phe Ala Lys    583
2207 CGG CTG GAG CGC TGG GGC CGT GGA GCC TTT GGT CAC CTG CGC CTC TTC    2254
 584 Arg Leu Glu Arg Trp Gly Arg Gly Ala Phe Gly His Leu Arg Leu Phe    599
2255 CAA AAC TGG CTG GAC CAG GAT GCA GTC ACA GCC AGG GAA GCC ATC CGG    2302
 600 Gln Asn Trp Leu Asp Gln Asp Ala Val Thr Ala Arg Glu Ala Ile Arg    615
2303 CGG CTC CGG GCT ACC TGC CAT GTG GTT AGC GAC TCA TGG GAC TCA TCC    2350
 616 Arg Leu Arg Ala Thr Cys His Val Val Ser Asp Ser Trp Asp Ser Ser    631
2351 CAG GCC TTC GCA GAT TAT GTT AGC ACC ATG TGA TGG GGC CCG TAC CTC    2398
 632 Gln Ala Phe Ala Asp Tyr Val Ser Thr Met ***                        642
2399 ACA GTC TCA TGC TCG GTA CCA TCA GCT TGC AGG GGC TGA AGC ATG GGC    2446
2447 TGC CCA GAA CCC CAA CCA CCA GTT CTA TCT TTC TCT TTC TGT CAC CTT    2494
2495 TTT TCT CTT TTT TCC TTC TTC CCT TGC ACT GAG GTC CTG GAG GCC TTG    2542
2543 ATG AGG CCC AGC AAA CAG GCA TTC TCA CAG CTG GGT TTA TAG TCT TTG    2590
2591 GGC CCC TTA CTC AGT ATC CTG GGA ACC CTG GGC CAG GAG GTT ACA GTG    2638
2639 GTC ATC ATA ATT GCT GAA GAG ATC CCC TCC CCT GCC CCT GGG TTC CTG    2686
2687 CCT TCC CTC CTC AAG CAG GCA CCC AGG CTT TAG AGA AGT ATA GGG GGC    2734
2735 TTC TTC CCT GCT GGG CTT ACC ACA CTG CTC TCA GGC CTC AAA CCC TTT    2782
2783 CAT ACC TTT ATT CTT TTT TTT AAC CAA AAA AGT TTT TCT TAT AAA ATA    2830
2831 AAT TTT GGG CAA ACA AAA AAA AAA AAA AAA AAA AAA A                  2867
7.PP8304
A:核苷酸序列(SEQ ID NO:19)长度:1888个碱基
   1 GGGAGCCGCG GCTGACGGGC CCGCGGTCTG GGCGTGAGTG CAGGGAAGTG GAGTATTTGC
  61 TGGGCCGGGT ACCATGGACG TGGGCGAACT TCTGAGCTAC CAGCCCAATA GGGGCACAAA
 121 ACGTCCCCGG GATGATGAAG AGGAGGAGCA GAAGATGCGT CGGAAACAAA CTGGTACTCG
 181 AGAACGCGGC CGCTATCGGG AAGAAGAAAT GACTGTGGTG GAGGAAGCGG ATGATGACAA
 241 AAAAAGGCTG CTGCAGATTA TTGACAGAGA TGGGGAAGAG GAAGAGGAAG AGGAGGAGCC
 301 ATTGGATGAA AGCTCAGTGA AGAAAATGAT CCTCACATTT GAAAAGAGAT CATATAAAAA
 361 ACCAAGAATT GCGGATTAAG TTTCCAGACA ATCCAGAGAA GTTCATGGAA TCCGAGCTGG
 421 ACCTAAATGA CATCATTCAG GAGATGCACG TGGTGGCCAC CATGCCAGAC CTGTACCACC
 481 TTCTGGTGGA GCTGAATGCT GTACAGTCGC TTCTCGGCTT GCTCGGACAC GATAATACAG
 541 ATGTGTCCAT AGCTGTGGTC GATTTGCTTC AGGAATTAAC AGATATAGAC ACCCTCCATG
 601 AGAGTGAAGA GGGAGCAGAA GTGCTCATCG ATGCTCTGGT GGATGGGCAG GTGGTAGCAC
 661 TGCTGGTACA GAATCTGGAG CGCCTGGATG AGTCTGTGAA AGAGGAGGCA GATGGCGTCC
 721 ACAACACTCT GGCTATTGTG GAAAACATGG CTGAGTTCCG GCCTGAGATG TGTACAGAGG
 781 GTGCCCAGCA GGGTCTTCTA CAGTGGCTGT TGAAGAGGCT GAAGGCAAAG ATGCCTTTTG
 841 ATGCCAACAA ACTGTATTGC AGTGAAGTGC TGGCCATATT GCTCCAGGAC AATGATGAAA
 901 ACAGGGAATT GCTTGGGGAG CTGGATGGAA TCGATGTGCT TCTTCAGCAG TTATCCGTGT
 961 TTAAAAGACA CAATCCCAGC ACGGCTGAGG AGCAGGAGAT GATGGAGAAT CTGTTTGATT
1021 CCCTCTGCTC CTGTCTAATG CTTAGTTCCA ATCGTGAGCG CTTCCTGAAG GGCGAGGGTC
1081 TTCAGCTGAT GAATCTCATG CTCAGGGAAA AGAAGATCTC CCGGAGCAGT GCCCTGAAAG
1141 TGCTGGACCA TGCCATGATT GGCCCCGAAG GCACAGACAA CTGCCATAAG TTTGTTGACA
1201 TTCTTGGCTT ACGAACCATC TTTCCCCTCT TTATGAAATC TCCCAGGAAG ATCAAGAAAG
1261 TGGGAACCAC TGAGAAGGAA CATGAAGAGC ATGTCTGTTC GATCCTGGCT TCCCTCCTGC
1321 GGAACCTGAG AGGGCAGCAG CGGACCCGGC TTCTGAATAA ATTCACTGAA AATGACAGTG
1381 AGAAGGTTGA CAGACTAATG GAGTTGCATT TTAAATATCT GGGTGCAATG CAGGTGGCGG
1441 ACAAGAAGAT TGAAGGGGAA AAACACGACA TGGTCCGGCG AGGAGAGATC ATCGACAATG
1501 ACACCGAGGA GGAGTTCTAC CTCCGGCGCC TGGATGCGGG GCTCTTTGTT CTCCAGCACA
1561 TCTGCTACAT CATGGCCGAG ATCTGCAATG CCAATGTCCC CCAGATTCGC CAGAGGGTTC
1621 ACCAGATCCT AAACATGCGA GGAAGCTCCA TCAAAATTGT CAGGCATATC ATCAAGGAGT
1681 ATGCAGAGAA CATCGGGGAC GGCCGGAGCC CGGAGTTCCG GGAGAACGAG CAAAAGCGCA
1741 TCCTGGGCTT GCTGGAGAAC TTCTAGAGGC ACCTTGGCCC TGCGCATCAT GGACTCTCTC
1801 AGCTTCCCTC CCAGGATCAG TTTCTACACA ACTCTGTGTG GCTTTTGGAC AAATTAAAGC
1861 TAGTTTTGGT AAAAAAAAAA AAAAAAAA
B:核苷酸序列(SEQ ID NO:20)长度:453个氨基酸
  1 MESELDLNDI IQEMHVVATM PDLYHLLVEL NAVQSLLGLL GHDNTDVSIA VVDLLQELTD
 61 IDTLHESEEG AEVLIDALVD GQVVALLVQN LERLDESVKE EADGVHNTLA IVENMAEFRP
121 EMCTEGAQQG LLQWLLKRLK AKMPFDANKL YCSEVLAILL QDNDENRELL GELDGIDVLL
181 QQLSVFKRHN PSTAEEQEMM ENLFDSLCSC LMLSSNRERF LKGEGLQLMN LMLREKKISR
241 SSALKVLDHA MIGPEGTDNC HKFVDILGLR TIFPLFMKSP RKIKKVGTTE KEHEEHVCSI
301 LASLLRNLRG QQRTRLLNKF TENDSEKVDR LMELHFKYLG AMQVADKKIE GEKHDMVRRG
361 EIIDNDTEEE FYLRRLDAGL FVLQHICYIM AEICNANVPQ IRQRVHQILN MRGSSIKIVR
421 HIIKEYAENI GDGRSPEFRE NEQKRILGLL ENF
C.核苷酸及氨基酸组合序列(SEQ ID NO:21)克隆号:PP8304
起始编码子:405ATG终止编码子:1764TAG蛋白质分子量:51883.97
  1  GG GAG CCG CGG CTG ACG GGC CCG CGG TCT GGG CGT GAG TGC AGG GAA    47
 48 GTG GAG TAT TTG CTG GGC CGG GTA CCA TGG ACG TGG GCG AAC TTC TGA    95
 96 GCT ACC AGC CCA ATA GGG GCA CAA AAC GTC CCC GGG ATG ATG AAG AGG    143
144 AGG AGC AGA AGA TGC GTC GGA AAC AAA CTG GTA CTC GAG AAC GCG GCC    191
192 GCT ATC GGG AAG AAG AAA TGA CTG TGG TGG AGG AAG CGG ATG ATG ACA    239
240 AAA AAA GGC TGC TGC AGA TTA TTG ACA GAG ATG GGG AAG AGG AAG AGG    287
288 AAG AGG AGG AGC CAT TGG ATG AAA GCT CAG TGA AGA AAA TGA TCC TCA    335
336 CAT TTG AAA AGA GAT CAT ATA AAA AAC CAA GAA TTG CGG ATT AAG TTT    383
384 CCA GAC AAT CCA GAG AAG TTC ATG GAA TCC GAG CTG GAC CTA AAT GAC    431
  1                             Met Glu Ser Glu Leu Asp Leu Asn Asp    9
432 ATC ATT CAG GAG ATG CAC GTG GTG GCC ACC ATG CCA GAC CTG TAC CAC    479
 10 Ile Ile Gln Glu Met His Val Val Ala Thr Met Pro Asp Leu Tyr His    25
480 CTT CTG GTG GAG CTG AAT GCT GTA CAG TCG CTT CTC GGC TTG CTC GGA    527
 26 Leu Leu Val Glu Leu Asn Ala Val Gln Ser Leu Leu Gly Leu Leu Gly    41
528 CAC GAT AAT ACA GAT GTG TCC ATA GCT GTG GTC GAT TTG CTT CAG GAA    575
 42 His Asp Asn Thr Asp Val Ser Ile Ala Val Val Asp Leu Leu Gln Glu    57
576 TTA ACA GAT ATA GAC ACC CTC CAT GAG AGT GAA GAG GGA GCA GAA GTG    623
 58 Leu Thr Asp Ile Asp Thr Leu His Glu Ser Glu Glu Gly Ala Glu Val    73
624 CTC ATC GAT GCT CTG GTG GAT GGG CAG GTG GTA GCA CTG CTG GTA CAG    671
 74 Leu Ile Asp Ala Leu Val Asp Gly Gln Val Val Ala Leu Leu Val Gln    89
672 AAT CTG GAG CGC CTG GAT GAG TCT GTG AAA GAG GAG GCA GAT GGC GTC    719
 90 Asn Leu Glu Arg Leu Asp Glu Ser Val Lys Glu Glu Ala Asp Gly Val    105
 720 CAC AAC ACT CTG GCT ATT GTG GAA AAC ATG GCT GAG TTC CGG CCT GAG    767
 106 His Asn Thr Leu Ala Ile Val Glu Asn Met Ala Glu Phe Arg Pro Glu    121
 768 ATG TGT ACA GAG GGT GCC CAG CAG GGT CTT CTA CAG TGG CTG TTG AAG    815
 122 Met Cys Thr Glu Gly Ala Gln Gln Gly Leu Leu Gln Trp Leu Leu Lys    137
 816 AGG CTG AAG GCA AAG ATG CCT TTT GAT GCC AAC AAA CTG TAT TGC AGT    863
 138 Arg Leu Lys Ala Lys Met Pro Phe Asp Ala Asn Lys Leu Tyr Cys Ser    153
 864 GAA GTG CTG GCC ATA TTG CTC CAG GAC AAT GAT GAA AAC AGG GAA TTG    911
 154 Glu Val Leu Ala Ile Leu Leu Gln Asp Asn Asp Glu Asn Arg Glu Leu    169
 912 CTT GGG GAG CTG GAT GGA ATC GAT GTG CTT CTT CAG CAG TTA TCC GTG    959
 170 Leu Gly Glu Leu Asp Gly Ile Asp Val Leu Leu Gln Gln Leu Ser Val    185
 960 TTT AAA AGA CAC AAT CCC AGC ACG GCT GAG GAG CAG GAG ATG ATG GAG    1007
 186 Phe Lys Arg His Asn Pro Ser Thr Ala Glu Glu Gln Glu Met Met Glu    201
1008 AAT CTG TTT GAT TCC CTC TGC TCC TGT CTA ATG CTT AGT TCC AAT CGT    1055
 202 Asn Leu Phe Asp Ser Leu Cys Ser Cys Leu Met Leu Ser Ser Asn Arg    217
1056 GAG CGC TTC CTG AAG GGC GAG GGT CTT CAG CTG ATG AAT CTC ATG CTC    1103
 218 Glu Arg Phe Leu Lys Gly Glu Gly Leu Gln Leu Met Asn Leu Met Leu    233
1104 AGG GAA AAG AAG ATC TCC CGG AGC AGT GCC CTG AAA GTG CTG GAC CAT    1151
 234 Arg Glu Lys Lys Ile Ser Arg Ser Ser Ala Leu Lys Val Leu Asp His    249
1152 GCC ATG ATT GGC CCC GAA GGC ACA GAC AAC TGC CAT AAG TTT GTT GAC    1199
 250 Ala Met Ile Gly Pro Glu Gly Thr Asp Asn Cys His Lys Phe Val Asp    265
1200 ATT CTT GGC TTA CGA ACC ATC TTT CCC CTC TTT ATG AAA TCT CCC AGG    1247
 266 Ile Leu Gly Leu Arg Thr Ile Phe Pro Leu Phe Met Lys Ser Pro Arg    281
1248 AAG ATC AAG AAA GTG GGA ACC ACT GAG AAG GAA CAT GAA GAG CAT GTC    1295
 282 Lys Ile Lys Lys Val Gly Thr Thr Glu Lys Glu His Glu Glu His Val    297
1296 TGT TCG ATC CTG GCT TCC CTC CTG CGG AAC CTG AGA GGG CAG CAG CGG    1343
 298 Cys Ser Ile Leu Ala Ser Leu Leu Arg Asn Leu Arg Gly Gln Gln Arg    313
1344 ACC CGG CTT CTG AAT AAA TTC ACT GAA AAT GAC AGT GAG AAG GTT GAC    1391
 314 Thr Arg Leu Leu Asn Lys Phe Thr Glu Asn Asp Ser Glu Lys Val Asp    329
1392 AGA CTA ATG GAG TTG CAT TTT AAA TAT CTG GGT GCA ATG CAG GTG GCG    1439
 330 Arg Leu Met Glu Leu His Phe Lys Tyr Leu Gly Ala Met Gln Val Ala    345
1440 GAC AAG AAG ATT GAA GGG GAA AAA CAC GAC ATG GTC CGG CGA GGA GAG    1487
 346 Asp Lys Lys Ile Glu Gly Glu Lys His Asp Met Val Arg Arg Gly Glu    361
1488 ATC ATC GAC AAT GAC ACC GAG GAG GAG TTC TAC CTC CGG CGC CTG GAT    1535
 362 Ile Ile Asp Asn Asp Thr Glu Glu Glu Phe Tyr Leu Arg Arg Leu Asp    377
1536 GCG GGG CTC TTT GTT CTC CAG CAC ATC TGC TAC ATC ATG GCC GAG ATC    1583
 378 Ala Gly Leu Phe Val Leu Gln His Ile Cys Tyr Ile Met Ala Glu Ile    393
1584 TGC AAT GCC AAT GTC CCC CAG ATT CGC CAG AGG GTT CAC CAG ATC CTA    1631
 394 Cys Asn Ala Asn Val Pro Gln Ile Arg Gln Arg Val His Gln Ile Leu    409
1632 AAC ATG CGA GGA AGC TCC ATC AAA ATT GTC AGG CAT ATC ATC AAG GAG    1679
 410 Asn Met Arg Gly Ser Ser Ile Lys Ile Val Arg His Ile Ile Lys Glu    425
1680 TAT GCA GAG AAC ATC GGG GAC GGC CGG AGC CCG GAG TTC CGG GAG AAC    1727
 426 Tyr Ala Glu Asn Ile Gly Asp Gly Arg Ser Pro Glu Phe Arg Glu Asn    441
1728 GAG CAA AAG CGC ATC CTG GGC TTG CTG GAG AAC TTC TAG AGG CAC CTT    1775
 442 Glu Gln Lys Arg Ile Leu Gly Leu Leu Glu Asn Phe ***                454
1776 GGC CCT GCG CAT CAT GGA CTC TCT CAG CTT CCC TCC CAG GAT CAG TTT    1823
1824 CTA CAC AAC TCT GTG TGG CTT TTG GAC AAA TTA AAG CTA GTT TTG GTA    1871
1872 AAA AAA AAA AAA AAA AA                                             1888
8.PP8675
A:核苷酸序列(SEQ ID NO:22)长度:1957个碱基
   1 GTTCAGCCCA GGACTCCTGC CTCCCCCCAT TTCAGGTCCC AGGGGGCACA GCCACAGCAG
  61 GTGACTCTCA GACTTGCCTT GCGCCTGGGG AATTTTCCAG TGAGGCATTG AGTCCCAAGC
 121 TGTGCTGAGG ACAGTCTCCA AATGACAGCT GCATGCCTGG ACCACCCCAG CCCTCCCACT
 181 ACACCAGGGC CAGGAGCTCT TCTGAAATGC TGATAGCATG TGTCCAGAGC CCTGTCTCTT
 241 TTCTGGAATG TCCAAGACCT TTGTCTGGAG CTTCCTTATG CATTTTCTGT CCTCTAAGTC
 301 CTCAGTGAGG AGGGCTGGAC AAGAATCCAT TCCTTGGTTT ATTACAGCCA GTGGGGGCCA
 361 GTGAAGGGGT GTCAGGCCAC AGGGCAGCTA TATAGGGGCC AAACAAGTGA GGTTTGACTC
 421 CATCCATGTA GAAAGATATA TAAATCCATT CCACAGTGAA ACAGGTGGCC TCGTGGGTAG
 481 TGACCCTTCT GTCCCTAGAG GTTTATTACT AGAGGCTGGA CTATCACCTG TCCAGGGGAA
 541 AAGGGGATCT GAATAGAGTG AAAGGTTGGA CTGGGTGGCC CCTGAGGTCT CTTCCAGCCC
 601 TCAGTCTGAG GTTCTGTATT GGAAAGTGCA TGGAGCCCAT GGAGACCGCC GAGCCACAGT
 661 CCTCGCCAGC CCACTCCTCG CCAGCCCACT CCTCGCCAGC CCACTCCTCG CCAGTCCAGT
 721 CTCTGCTGAG AGCACAAGGA GCCTCCAGCC TGCCCTGTGG CACATACCAC CCCCCAGCTT
 781 GGCCTCCCCA CCAGCCCGCT GAGCAGGCTG CCACCCCCGA TGCTGAGCCT CACAGCGAGC
 841 CTCCTGATCA CCAGGAGCGC CCTGCCGTCC ACCGTGGGAT CCGCTACCTG TTGTACAGAG
 901 CACAGAGAGC CATCCGCCTT CGCCATGCCC TCCGCTTGCA CCCTCAATTG CATCGGGCCC
 961 CTATTCGGAC TTGGTCTCCC CATGTGGTCC AAGCCAGCAC TCCTGCCATC ACAGGGCCCC
1021 TCAACCATCC TGCCAATGCC CAGGAACATC CTGCCCAGCT GCAAAGGGGC ATCAGCCCAC
1081 CCCACCGGAT ACGAGGGGCT GTGCGATCCC GCAGCCGCTC CCTCCGGGGC TCCTCCCATT
1141 TATCCCAGTG GCTCAACAAC TTTTTTGCCC TCCCCTTCTC CTCCATGGCT TCCCAGCTTG
1201 ACATGTCTTC CGTGGTGGGG GCAGGGGAAG GCAGAGCCCA GACTCTTGGA GCAGGTGTTC
1261 CCCCTGGGGA CTCTGTCAGA GGCTCCATGG AGGCCTCTCA AGTCCAAGTG CCTCTGGAAC
1321 CCTCTCCAAT TACATTCCCA CCACCCTGTG CCCCAGAAAG GCCCCCCATC AGCCCAGTCC
1381 CAGGCGCCCG TCAAGCAGGC CTCTGAGAGT GCTACCCTTC TCTTGTAACC TTGCAGCCAA
1441 CACCCCTGCC CGGCCCCTGA GCTGCCTCCT CCAGCCCATG CTCTTACAGG CCCTGCACAG
1501 AGTAGCACTC ATTAATTCTT GGTTAAGGAA TGAATCAACG AATGAATGGC TATGCATGGA
1561 CCTCTGGGCA GGGAGACCTG GGTCTTCTCT GGCTGAGAGG GGAAGGCTAA GGCATGGCTG
1621 AGATTCAAGC CACCATTCCA GGCCTCTTTG CCCAAGAAAG AAACTTCTGT CACCCTTGCA
1681 CTCTCCTGTG TTCTGAGTCC CTGGCCAATA GCACAGCCTT CCATGCCCCG ACCCCCACCC
1741 CAAGCCTCTC CACTAGGCCT CTGCCAGGAT CTAAGCCCAT GAGCACAGGG ACTGGCTATC
1801 CCAAGACCTG GCAGATGTGG CTGCTCAATA AACACTTGTT GAACCATCAA AAAAAAAAAA
1861 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
1921 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAA
B:核苷酸序列(SEQ ID NO:23)长度:258个氨基酸
  1 MEPMETAEPQ SSPAHSSPAH SSPAHSSPVQ SLLRAQGASS LPCGTYHPPA WPPHQPAEQA
 61 ATPDAEPHSE PPDHQERPAV HRGIRYLLYR AQRAIRLRHA LRLHPQLHRA PIRTWSPHVV
121 QASTPAITGP LNHPANAQEH PAQLQRGISP PHRIRGAVRS RSRSLRGSSH LSQWLNNFFA
181 LPFSSMASQL DMSSVVGAGE GRAQTLGAGV PPGDSVRGSM EASQVQVPLE PSPITFPPPC
241 APERPPISPV PGARQAGL
C.核苷酸及氨基酸组合序列(SEQ ID NO:24)克隆号:PP8675
起始编码子:630ATG终止编码子:1404TGA蛋白质分子量:27672.57
   1  GT TCA GCC CAG GAC TCC TGC CTC CCC CCA TTT CAG GTC CCA GGG GGC    47
  48 ACA GCC ACA GCA GGT GAC TCT CAG ACT TGC CTT GCG CCT GGG GAA TTT    95
  96 TCC AGT GAG GCA TTG AGT CCC AAG CTG TGC TGA GGA CAG TCT CCA AAT    143
 144 GAC AGC TGC ATG CCT GGA CCA CCC CAG CCC TCC CAC TAC ACC AGG GCC    191
 192 AGG AGC TCT TCT GAA ATG CTG ATA GCA TGT GTC CAG AGC CCT GTC TCT    239
 240 TTT CTG GAA TGT CCA AGA CCT TTG TCT GGA GCT TCC TTA TGC ATT TTC    287
 288 TGT CCT CTA AGT CCT CAG TGA GGA GGG CTG GAC AAG AAT CCA TTC CTT    335
 336 GGT TTA TTA CAG CCA GTG GGG GCC AGT GAA GGG GTG TCA GGC CAC AGG    383
 384 GCA GCT ATA TAG GGG CCA AAC AAG TGA GGT TTG ACT CCA TCC ATG TAG    431
 432 AAA GAT ATA TAA ATC CAT TCC ACA GTG AAA CAG GTG GCC TCG TGG GTA    479
 480 GTG ACC CTT CTG TCC CTA GAG GTT TAT TAC TAG AGG CTG GAC TAT CAC    527
 528 CTG TCC AGG GGA AAA GGG GAT CTG AAT AGA GTG AAA GGT TGG ACT GGG    575
 576 TGG CCC CTG AGG TCT CTT CCA GCC CTC AGT CTG AGG TTC TGT ATT GGA    623
 624 AAG TGC ATG GAG CCC ATG GAG ACC GCC GAG CCA CAG TCC TCG CCA GCC    671
   1         Met Glu Pro Met Glu Thr Ala Glu Pro Gln Ser Ser Pro Ala    14
 672 CAC TCC TCG CCA GCC CAC TCC TCG CCA GCC CAC TCC TCG CCA GTC CAG    719
  15 His Ser Ser Pro Ala His Ser Ser Pro Ala His Ser Ser Pro Val Gln    30
 720 TCT CTG CTG AGA GCA CAA GGA GCC TCC AGC CTG CCC TGT GGC ACA TAC    767
  31 Ser Leu Leu Arg Ala Gln Gly Ala Ser Ser Leu Pro Cys Gly Thr Tyr    46
 768 CAC CCC CCA GCT TGG CCT CCC CAC CAG CCC GCT GAG CAG GCT GCC ACC    815
  47 His Pro Pro Ala Trp Pro Pro His Gln Pro Ala Glu Gln Ala Ala Thr    62
 816 CCC GAT GCT GAG CCT CAC AGC GAG CCT CCT GAT CAC CAG GAG CGC CCT    863
  63 Pro Asp Ala Glu Pro His Ser Glu Pro Pro Asp His Gln Glu Arg Pro    78
 864 GCC GTC CAC CGT GGG ATC CGC TAC CTG TTG TAC AGA GCA CAG AGA GCC    911
  79 Ala Val His Arg Gly Ile Arg Tyr Leu Leu Tyr Arg Ala Gln Arg Ala    94
 912 ATC CGC CTT CGC CAT GCC CTC CGC TTG CAC CCT CAA TTG CAT CGG GCC    959
  95 Ile Arg Leu Arg His Ala Leu Arg Leu His Pro Gln Leu His Arg Ala    110
 960 CCT ATT CGG ACT TGG TCT CCC CAT GTG GTC CAA GCC AGC ACT CCT GCC    1007
 111 Pro Ile Arg Thr Trp Ser Pro His Val Val Gln Ala Ser Thr Pro Ala    126
1008 ATC ACA GGG CCC CTC AAC CAT CCT GCC AAT GCC CAG GAA CAT CCT GCC    1055
 127 Ile Thr Gly Pro Leu Asn His Pro Ala Asn Ala Gln Glu His Pro Ala    142
1056 CAG CTG CAA AGG GGC ATC AGC CCA CCC CAC CGG ATA CGA GGG GCT GTG    1103
 143 Gln Leu Gln Arg Gly Ile Ser Pro Pro His Arg Ile Arg Gly Ala Val    158
1104 CGA TCC CGC AGC CGC TCC CTC CGG GGC TCC TCC CAT TTA TCC CAG TGG    1151
 159 Arg Ser Arg Ser Arg Ser Leu Arg Gly Ser Ser His Leu Ser Gln Trp    174
1152 CTC AAC AAC TTT TTT GCC CTC CCC TTC TCC TCC ATG GCT TCC CAG CTT    1199
 175 Leu Asn Asn Phe Phe Ala Leu Pro Phe Ser Ser Met Ala Ser Gln Leu    190
1200 GAC ATG TCT TCC GTG GTG GGG GCA GGG GAA GGC AGA GCC CAG ACT CTT    1247
 191 Asp Met Ser Ser Val Val Gly Ala Gly Glu Gly Arg Ala Gln Thr Leu    206
1248 GGA GCA GGT GTT CCC CCT GGG GAC TCT GTC AGA GGC TCC ATG GAG GCC    1295
 207 Gly Ala Gly Val Pro Pro Gly Asp Ser Val Arg Gly Ser Met Glu Ala    222
1296 TCT CAA GTC CAA GTG CCT CTG GAA CCC TCT CCA ATT ACA TTC CCA CCA    1343
 223 Ser Gln Val Gln Val Pro Leu Glu Pro Ser Pro Ile Thr Phe Pro Pro    238
1344 CCC TGT GCC CCA GAA AGG CCC CCC ATC AGC CCA GTC CCA GGC GCC CGT    1391
 239 Pro Cys Ala Pro Glu Arg Pro Pro Ile Ser Pro Val Pro Gly Ala Arg    254
1392 CAA GCA GGC CTC TGA GAG TGC TAC CCT TCT CTT GTA ACC TTG CAG CCA    1439
 255 Gln Ala Gly Leu ***                                                259
1440 ACA CCC CTG CCC GGC CCC TGA GCT GCC TCC TCC AGC CCA TGC TCT TAC    1487
1488 AGG CCC TGC ACA GAG TAG CAC TCA TTA ATT CTT GGT TAA GGA ATG AAT    1535
1536 CAA CGA ATG AAT GGC TAT GCA TGG ACC TCT GGG CAG GGA GAC CTG GGT    1583
1584 CTT CTC TGG CTG AGA GGG GAA GGC TAA GGC ATG GCT GAG ATT CAA GCC    1631
1632 ACC ATT CCA GGC CTC TTT GCC CAA GAA AGA AAC TTC TGT CAC CCT TGC    1679
1680 ACT CTC CTG TGT TCT GAG TCC CTG GCC AAT AGC ACA GCC TTC CAT GCC    1727
1728 CCG ACC CCC ACC CCA AGC CTC TCC ACT AGG CCT CTG CCA GGA TCT AAG    1775
1776 CCC ATG AGC ACA GGG ACT GGC TAT CCC AAG ACC TGG CAG ATG TGG CTG    1823
1824 CTC AAT AAA CAC TTG TTG AAC CAT CAA AAA AAA AAA AAA AAA AAA AAA    1871
1872 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    1919
1920 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AA                 1957
9.PP9455
A:核苷酸序列(SEQ ID NO:25)长度:1847个碱基
   1 GCCTGTTTGG GAGGGGGGGC AGAGGGGCAG GGGGGCAGAA GTTGAGTCTG GGAGCTGGGG
  61 CAGGGCACAG GCTCTAGGGT CCAGCTGTCC TCCTCTCCCC TCCCCTGCTG GCCACTCCTG
 121 CTGCCGTCTC CACAGCTCTG GAATGATGAA GTGGACAAGG TAAGTTGGGG CCTGGGGGGC
 181 TGGGCTCGAG GAAGAAGGGG TGGCGGGGTG CAGGCACACT TGCTGCTGTG GGGTCTGATC
 241 TGTTTCTCAC TCTGCCCCAC ACCCACTGGG GAGGGGTTAC TGCTTTCCCT CCCTGGGCCT
 301 CAGTTTCCCC TCTGTGGGGA AATGTTTTCT CCACAGTACC CTGTAGCACA CAGTAGGCCC
 361 TCAGGATGCA CTTGCTGGGT GGATTTCTCC GATGGGTGAT GGAGGAAGGG TCTGTCACTG
 421 CAGCTGCCTG TGGGGTCCTG AGTGGGGCTC TAGCTTCTCT GGGGTTGGGG CTCCAGGTGT
 481 GAAGTCAGGC ATAGACCCAG AAGGCTCTCT GTGTTCCCAG GGGAAAGGGA CAGGCGGCTC
 541 CCAGGTAGGC TCCAGGAGAA GACTGCGGGG AAGCTGGTGG GTGGTGTGTG GGTGCTCATG
 601 GCTGCCCTGC CCTGCCCAGG CCGAGCAGGA GCTCCGCGTG GCCCAGACAG AGTTTGACCG
 661 GCAAGCAGAA GTGACCCGTC TCTTGCTGGA GGGAATCAGT AGCACTCACG TGAACCACCT
 721 GCGCTGCCTC CACGAGTTCG TCAAGTCTCA GACAACCTAC TACGCACAGT GCTACCGCCA
 781 CATGCTGGAC TTGCAGAAGC AGCTGGGCAG ATTTCCCGGC ACCTTCGTGG GCACCACAGA
 841 GCCCGCCTCC CCACCCCTGA GCAGCACCTC ACCCACCACT GCTGCGGCCA CTATGCCTGT
 901 GGTGCCCTCT GTGGCCAGCC TGGCCCCTCC GGGGGAGGCC TCGCTCTGCC TGGAAGAGGT
 961 GGCCCCCCCT GCCAGTGGGA CCCGCAAAGC TCGGGTGCTC TATGACTACG AGGCAGCCGA
1021 CAGCAGTGAG CTGGCCCTGC TGGCTGATGA GCTCATCACT GTCTACAGCC TGCCTGGCAT
1081 GGACCCTGAC TGGCTCATTG GCGAGAGAGG CAACAAGAAG GGCAAGGTCC CTGTCACCTA
1141 CTTGGAACTG CTCAGCTAGG CAGGTGCCCC CATCCCCCCC GCATTCTGGC CTAGGCAGGA
1201 GAGGATGGGC GCAGCCCTGC CACTTAACTT GTTTGTTGGT GACACAGTTG TTCAGAGTGG
1261 GGAGAATTCA CCCCATTCTG TCCCTGCCCC TAGTCACCTA GCTGTGAGGG TGCCTGAGGC
1321 TGAATGGCTC CACCCCTCCC CCAGCCCTGC TTCTGACCTG TGGCTCTGGA GCCCCTGCCC
1381 CTGCCTGCAT CCCCGAGCAC CCCACCCTCC AGGCTCCACT AAGGAGGGAG GGGCTGTCTG
1441 CAGCAGCTGC ACTCAGCACC TAGGCCAGGG TGGGGCCGCC GCAGATGGGC TCAGGAAGCC
1501 CCAGGTGCAC TCAGCGAGAG CCCTGCCTTT CAGTTGCCAA AAGCTGCATC AGGGGAATGC
1561 GGCAAGGCAC ACAGGGCTCT GGCAGCCCCT GGGGACTGGG CGCTGCCCCT GGGAGGGGAG
1621 AGCCTGGCCA GGGCTGGTGT TGGGCCCGGA GCAGCATCTT CCGGTGCTAT CCTCCCCTCC
1681 CACCCCTCAC AGCTCAAGCC AAGTCCAGCG GCCGCAGTCT TCACCTCTCC ACACTCACTT
1741 TTTATCTGGT GTTTTTACTT CTGCCTGCGT TTGCTCTCTA GCCAATAAAC CGTCCTTGTG
1801 TGCGAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAA
B:核苷酸序列(SEQ ID NO:26)长度:255个氨基酸
1 MGDGGRVCHC SCLWGPEWGS SFSGVGAPGV KSGIDPEGSL CSQGKGTGGS QVGSRRRLRG
 61 SWWVVCGCSW LPCPAQAEQE LRVAQTEFDR QAEVTRLLLE GISSTHVNHL RCLHEFVKSQ
121 TTYYAQCYRH MLDLQKQLGR FPGTFVGTTE PASPPLSSTS PTTAAATMPV VPSVASLAPP
181 GEASLCLEEV APPASGTRKA RVLYDYEAAD SSELALLADE LITVYSLPGM DPDWLIGERG
241 NKKGKVPVTY LELLS
C.核苷酸及氨基酸组合序列(SEQ ID NO:27)克隆号:PP9455
起始编码子:392ATG终止编码子:1157TAG蛋白质分子量:27286.47
   1   G CCT GTT TGG GAG GGG GGG CAG AGG GGC AGG GGG GCA GAA GTT GAG    46
  47 TCT GGG AGC TGG GGC AGG GCA CAG GCT CTA GGG TCC AGC TGT CCT CCT    94
  95 CTC CCC TCC CCT GCT GGC CAC TCC TGC TGC CGT CTC CAC AGC TCT GGA    142
 143 ATG ATG AAG TGG ACA AGG TAA GTT GGG GCC TGG GGG GCT GGG CTC GAG    190
 191 GAA GAA GGG GTG GCG GGG TGC AGG CAC ACT TGC TGC TGT GGG GTC TGA    238
 239 TCT GTT TCT CAC TCT GCC CCA CAC CCA CTG GGG AGG GGT TAC TGC TTT    286
 287 CCC TCC CTG GGC CTC AGT TTC CCC TCT GTG GGG AAA TGT TTT CTC CAC    334
 335 AGT ACC CTG TAG CAC ACA GTA GGC CCT CAG GAT GCA CTT GCT GGG TGG    382
 383 ATT TCT CCG ATG GGT GAT GGA GGA AGG GTC TGT CAC TGC AGC TGC CTG    430
   1             Met Gly Asp Gly Gly Arg Val Cys His Cys Ser Cys Leu    13
 431 TGG GGT CCT GAG TGG GGC TCT AGC TTC TCT GGG GTT GGG GCT CCA GGT    478
  14 Trp Gly Pro Glu Trp Gly Ser Ser Phe Ser Gly Val Gly Ala Pro Gly    29
 479 GTG AAG TCA GGC ATA GAC CCA GAA GGC TCT CTG TGT TCC CAG GGG AAA    526
  30 Val Lys Ser Gly Ile Asp Pro Glu Gly Ser Leu Cys Ser Gln Gly Lys    45
 527 GGG ACA GGC GGC TCC CAG GTA GGC TCC AGG AGA AGA CTG CGG GGA AGC    574
  46 Gly Thr Gly Gly Ser Gln Val Gly Ser Arg Arg Arg Leu Arg Gly Ser    61
 575 TGG TGG GTG GTG TGT GGG TGC TCA TGG CTG CCC TGC CCT GCC CAG GCC    622
  62 Trp Trp Val Val Cys Gly Cys Ser Trp Leu Pro Cys Pro Ala Gln Ala    77
 623 GAG CAG GAG CTC CGC GTG GCC CAG ACA GAG TTT GAC CGG CAA GCA GAA    670
  78 Glu Gln Glu Leu Arg Val Ala Gln Thr Glu Phe Asp Arg Gln Ala Glu    93
 671 GTG ACC CGT CTC TTG CTG GAG GGA ATC AGT AGC ACT CAC GTG AAC CAC    718
  94 Val Thr Arg Leu Leu Leu Glu Gly Ile Ser Ser Thr His Val Asn His    109
 719 CTG CGC TGC CTC CAC GAG TTC GTC AAG TCT CAG ACA ACC TAC TAC GCA    766
 110 Leu Arg Cys Leu His Glu Phe Val Lys Ser Gln Thr Thr Tyr Tyr Ala    125
 767 CAG TGC TAC CGC CAC ATG CTG GAC TTG CAG AAG CAG CTG GGC AGA TTT    814
 126 Gln Cys Tyr Arg His Met Leu Asp Leu Gln Lys Gln Leu Gly Arg Phe    141
 815 CCC GGC ACC TTC GTG GGC ACC ACA GAG CCC GCC TCC CCA CCC CTG AGC    862
 142 Pro Gly Thr Phe Val Gly Thr Thr Glu Pro Ala Ser Pro Pro Leu Ser    157
 863 AGC ACC TCA CCC ACC ACT GCT GCG GCC ACT ATG CCT GTG GTG CCC TCT    910
 158 Ser Thr Ser Pro Thr Thr Ala Ala Ala Thr Met Pro Val Val Pro Ser    173
 911 GTG GCC AGC CTG GCC CCT CCG GGG GAG GCC TCG CTC TGC CTG GAA GAG    958
 174 Val Ala Ser Leu Ala Pro Pro Gly Glu Ala Ser Leu Cys Leu Glu Glu    189
 959 GTG GCC CCC CCT GCC AGT GGG ACC CGC AAA GCT CGG GTG CTC TAT GAC    1006
 190 Val Ala Pro Pro Ala Ser Gly Thr Arg Lys Ala Arg Val Leu Tyr Asp    205
1007 TAC GAG GCA GCC GAC AGC AGT GAG CTG GCC CTG CTG GCT GAT GAG CTC    1054
 206 Tyr Glu Ala Ala Asp Ser Ser Glu Leu Ala Leu Leu Ala Asp Glu Leu    221
1055 ATC ACT GTC TAC AGC CTG CCT GGC ATG GAC CCT GAC TGG CTC ATT GGC    1102
 222 Ile Thr Val Tyr Ser Leu Pro Gly Met Asp Pro Asp Trp Leu Ile Gly    237
1103 GAG AGA GGC AAC AAG AAG GGC AAG GTC CCT GTC ACC TAC TTG GAA CTG    1150
 238 Glu Arg Gly Asn Lys Lys Gly Lys Val Pro Val Thr Tyr Leu Glu Leu    253
1151 CTC AGC TAG GCA GGT GCC CCC ATC CCC CCC GCA TTC TGG CCT AGG CAG    1198
 254 Leu Ser ***                                                        256
1199 GAG AGG ATG GGC GCA GCC CTG CCA CTT AAC TTG TTT GTT GGT GAC ACA    1246
1247 GTT GTT CAG AGT GGG GAG AAT TCA CCC CAT TCT GTC CCT GCC CCT AGT    1294
1295 CAC CTA GCT GTG AGG GTG CCT GAG GCT GAA TGG CTC CAC CCC TCC CCC    1342
1343 AGC CCT GCT TCT GAC CTG TGG CTC TGG AGC CCC TGC CCC TGC CTG CAT    1390
1391 CCC CGA GCA CCC CAC CCT CCA GGC TCC ACT AAG GAG GGA GGG GCT GTC    1438
1439 TGC AGC AGC TGC ACT CAG CAC CTA GGC CAG GGT GGG GCC GCC GCA GAT    1486
1487 GGG CTC AGG AAG CCC CAG GTG CAC TCA GCG AGA GCC CTG CCT TTC AGT    1534
1535 TGC CAA AAG CTG CAT CAG GGG AAT GCG GCA AGG CAC ACA GGG CTC TGG    1582
1583 CAG CCC CTG GGG ACT GGG CGC TGC CCC TGG GAG GGG AGA GCC TGG CCA    1630
1631 GGG CTG GTG TTG GGC CCG GAG CAG CAT CTT CCG GTG CTA TCC TCC CCT    1678
1679 CCC ACC CCT CAC AGC TCA AGC CAA GTC CAG CGG CCG CAG TCT TCA CCT    1726
1727 CTC CAC ACT CAC TTT TTA TCT GGT GTT TTT ACT TCT GCC TGC GTT TGC    1774
1775 TCT CTA GCC AAT AAA CCG TCC TTG TGT GCG AAA AAA AAA AAA AAA AAA    1822
1823 AAA AAA AAA AAA AAA AAA AAA AAA A                                  1847
10.PP9748
A:核苷酸序列(SEQ ID NO:28)长度:2769个碱基
   1 GCGCGGGCGG CGGAGGGAGG CCGGAGCGGG CAGCGCGGCG GCGCCATGTC CGTGAACATG
  61 GACGAGCTCA AGCACCAGGT CATGATCAAC CAGTTCGTGC TGACGGCGGG CTGCGCGGCC
 121 GACCAGGCGA AGCAACTGCT GCAGGCGGCC CACTGGCAGT TCGAGGTGCG CGGCGCCGGA
 181 GCCGGGCGAG GGCCGGGGCC ACGGGCGGAG TGTGTCCCGC GTGGCCGCCG GGCGGGGGCG
 241 GACGGCGTGG ACGCGTGCCG GCTGTGCGCC CCCTCCGGGC CGCAGACCCG ACCCGCTTTC
 301 CCGACGGCGG TGCCCGGCGT CCGGATCCCA AGGGCTCGCG GCGGGCGGAG GTGGGAACCG
 361 GGCCACCGGT CGGGGATACG CCGCCCCCGC GGCCGCGAGT CCCCCGGGAT CGAGACGGGG
 421 ACCCCCCCCA CCCCTTTTGT CCGGTAACGG CCGAGGCCGG GCGGCCCCGC GGTGCAGACG
 481 GACAGTCGGG CGGGCGGCCG GAAGGAGGAC GCCCCAGGCC TCGGCAGAGC TGGGCCGGAG
 541 GGCGGAGCCG CTCCGGGCGA GTGGTCCGAG GGTCCGCGTG CCTGGTGGGC GGTCGGCGGC
 601 GTGCGCACAC GTCCATGTGC ATTTGTGTTT ACGCACGCAC CGCGCCACGG CGTCGGCCGG
 661 GCACCGGGGA GGTGGCGGAC CTGCGGGCAC GTTGGCGCGC GTGTGAACGC GCAGCCCCCT
 721 GGTGCGTTTG GTGTGTGATC AACGCGTACA CATGTGGCGG GTGTGCAGAT GCCGCCCGTG
 781 CCCGGCACGG TGTGATGTGT GTACACGGCC TGGAGTGTAG GGGTGGCGTG TCGGAGCCCC
 841 ACACTACACC ACAGGGATGA GCGTGTATCC CCTTCAGAGG TGTGCCTGGG GACTCCGTGT
 901 GCGCGACTAG GTGCTCTCCT GGGGCTGGCA GGGGCATCTG TCCCTTTACC GGTGCAATGG
 961 GGAGGGTGCA CACGGTTCAC CAGCTTTCGG GCTAGCTGGG TAGGAGGTGA TGCTGCCCCG
1021 GTCTGGCACC CACTCCCCCG GGCCTCTCCT AACCCATAGG ACAGTAGTGC TCCTGGCTTG
1081 TGCTGCCCAG AGGCTACCTG GCTTTCCCTA ATTCACCGAC CCCAGGATTA ACCCCATGGT
1141 GGTTGGTATC AGGGGATGAG GCCAGAGCCC TTTGAGCTGT GCCCCTCACA GGGGTAGGGT
1201 CATGGCCTCA GCCATCCCGG TACCATCTGT GCCCAGCCGG GGACTGGGAA CCTGGTTTCT
1261 CCATGAGGAG CCATCCCAGG GCCTGCAGGA GGGACTAGAA GCCAGAGGAC TCTGAGGCTC
1321 CGCTTCCTGG GGACTGCAGG GGGATCAGAA TGTCCCAAGC TTGGGACAGT CTGGGAAGGC
1381 AGTGGCCATC CCATCCAGAT GAGTACATCC CTCTCTCCTT GCCTACTTCC CTCCTACCAG
1441 CCGTCGCGGA GGCCACTGAT CCTGTGTGGT GTTCACCCCA GGACGTGGGA GGCTGCTCTG
1501 TCCCTCTGGC CTTAGTTTCC ACATCTGTAT GGTGGGGTTG GGGGGCATGA GTCAGCTTCT
1561 GTTGGCCAGC TTACTGCCCC CTGTGCCCCA AGGCAGCCCC ACCCGGAGGA AGCTCCCTGC
1621 TTCCCTCCTG GTCTCCACAG CCCTCATCAG CCCTGTTTGT GTCAGGGGCT GGATGTGGCA
1681 AAACTTGCAA AACCGCATTC ATGGCAGTCA CACATCTGCA CGCAGGGTTC CCTCCCTGCC
1741 TGGGGCTGGG CAGGTAGGTG TCCGGTGGGA AGCGGGCCCT GCCTGCAGGA CTCAGCCCAG
1801 CCCTCAAAAC CTGGCACCCA GGCCACATCC CTCAGCGGCA CAGTTAATTG AAAATGCAGC
1861 TTTGAGGAGT GCAATGTCTG GGGAAAGACT GTTCCCAGAG GGGCAGGAGC ATCTGGGGCC
1921 TCTGGTGGCT CCCAGGGTCC CCATGGGAGG AGCCCTGTGC CCTCCACTCC CAAGTCTCAG
1981 TTGTGCCATC TGTAAAGTGG GGGCCGCCAG GGAGGCTGGA GGAAGGTGAC GGGACTTCAG
2041 GCCTTGGAAT GGGGCTGAGT GAGGGGTTCA CATGGCCACC CCATCCCTCT CCACGCTCCA
2101 CCCGCTGGCT GCATCCACCA GGCGGTGTTT CTGGGTCACA TTTGCTGCAA TTCAGGTGCT
2161 AATGGGGGCA GGAGGCTGCA GGGGGAGGGG CCGGTGTCTA GTGGGGCAGA TGTTTCTCAA
2221 TGGAGAATGC TCACAGCGGC CTGCAGAGGG GGTCTGGTGT GGCCTGGGGC TCCTGGGGTT
2281 GGGATTTACA CAGTGAGCCT GGGCTTTGGG GCACAGCTGC TGCTGACAGA GGGTCTTGGG
2341 GTCTGGGAAG GTGCTTAAAG CCCGGCCCCC ATGCCTGAGC TCCCACACCC CTGTTTAGGG
2401 ACACCCAGAT AGGGTGTCTC CTGCAGGAAA TTCCCCACAT AATTCATTTA TTTAAAAAAT
2461 ATTTTTTGCC GGGCACGGTG GTTCATGCCT GTAATCCCAG CACTTTGGGA GGCCAAGGTG
2521 GGCGGATCAT GAGGTCAAGA GATCAAGACC ATCCTGGCCA ACATGGTGAA ACCCCATCTC
2581 TACTAAAAAT ACAAAAGTTA GCCAGGTGTG GTGGCACGTG CCTGTAGTCC CAGCTACTCG
2641 GGAGGCTGAG GCAGGAGAAT CACTTGAACT AGAAGGCAAA GGTTGCAGTG AGCCCAGATA
2701 ACGCCACTGC ACTCCAGCCT GGTGACAGAG CGAGACTCCG TCTCAAAAAA AAAAAAAAAA
2761 AAAAAAAAA
B:核苷酸序列(SEQ ID NO:29)长度:166个氨基酸
  1 MVGLGGMSQL LLASLLPPVP QGSPTRRKLP ASLLVSTALI SPVCVRGWMW QNLQNRIHGS
 61 HTSARRVPSL PGAGQVGVRW EAGPACRTQP SPQNLAPRPH PSAAQLIENA ALRSAMSGER
121 LFPEGQEHLG PLVAPRVPMG GALCPPLPSL SCAICKVGAA REAGGR
C.核苷酸及氨基酸组合序列(SEQ ID NO:30)克隆号:PP9748
起始编码子:1529ATG终止编码子:2027TGA蛋白质分子量:17317.26
   1   G CGC GGG CGG CGG AGG GAG GCC GGA GCG GGC AGC GCG GCG GCG CCA    46
  47 TGT CCG TGA ACA TGG ACG AGC TCA AGC ACC AGG TCA TGA TCA ACC AGT    94
  95 TCG TGC TGA CGG CGG GCT GCG CGG CCG ACC AGG CGA AGC AAC TGC TGC    142
 143 AGG CGG CCC ACT GGC AGT TCG AGG TGC GCG GCG CCG GAG CCG GGC GAG    190
 191 GGC CGG GGC CAC GGG CGG AGT GTG TCC CGC GTG GCC GCC GGG CGG GGG    238
 239 CGG ACG GCG TGG ACG CGT GCC GGC TGT GCG CCC CCT CCG GGC CGC AGA    286
 287 CCC GAC CCG CTT TCC CGA CGG CGG TGC CCG GCG TCC GGA TCC CAA GGG    334
 335 CTC GCG GCG GGC GGA GGT GGG AAC CGG GCC ACC GGT CGG GGA TAC GCC    382
 383 GCC CCC GCG GCC GCG AGT CCC CCG GGA TCG AGA CGG GGA CCC CCC CCA    430
 431 CCC CTT TTG TCC GGT AAC GGC CGA GGC CGG GCG GCC CCG CGG TGC AGA    478
 479 CGG ACA GTC GGG CGG GCG GCC GGA AGG AGG ACG CCC CAG GCC TCG GCA    526
 527 GAG CTG GGC CGG AGG GCG GAG CCG CTC CGG GCG AGT GGT CCG AGG GTC    574
 575 CGC GTG CCT GGT GGG CGG TCG GCG GCG TGC GCA CAC GTC CAT GTG CAT    622
 623 TTG TGT TTA CGC ACG CAC CGC GCC ACG GCG TCG GCC GGG CAC CGG GGA    670
 671 GGT GGC GGA CCT GCG GGC ACG TTG GCG CGC GTG TGA ACG CGC AGC CCC    718
 719 CTG GTG CGT TTG GTG TGT GAT CAA CGC GTA CAC ATG TGG CGG GTG TGC    766
 767 AGA TGC CGC CCG TGC CCG GCA CGG TGT GAT GTG TGT ACA CGG CCT GGA    814
 815 GTG TAG GGG TGG CGT GTC GGA GCC CCA CAC TAC ACC ACA GGG ATG AGC    862
 863 GTG TAT CCC CTT CAG AGG TGT GCC TGG GGA CTC CGT GTG CGC GAC TAG    910
 911 GTG CTC TCC TGG GGC TGG CAG GGG CAT CTG TCC CTT TAC CGG TGC AAT    958
 959 GGG GAG GGT GCA CAC GGT TCA CCA GCT TTC GGG CTA GCT GGG TAG GAG    1006
1007 GTG ATG CTG CCC CGG TCT GGC ACC CAC TCC CCC GGG CCT CTC CTA ACC    1054
1055 CAT AGG ACA GTA GTG CTC CTG GCT TGT GCT GCC CAG AGG CTA CCT GGC    1102
1103 TTT CCC TAA TTC ACC GAC CCC AGG ATT AAC CCC ATG GTG GTT GGT ATC    1150
1151 AGG GGA TGA GGC CAG AGC CCT TTG AGC TGT GCC CCT CAC AGG GGT AGG    1198
1199 GTC ATG GCC TCA GCC ATC CCG GTA CCA TCT GTG CCC AGC CGG GGA CTG    1246
1247 GGA ACC TGG TTT CTC CAT GAG GAG CCA TCC CAG GGC CTG CAG GAG GGA    1294
1295 CTA GAA GCC AGA GGA CTC TGA GGC TCC GCT TCC TGG GGA CTG CAG GGG    1342
1343 GAT CAG AAT GTC CCA AGC TTG GGA CAG TCT GGG AAC GCA GTG GCC ATC    1390
1391 CCA TCC AGA TGA GTA CAT CCC TCT CTC CTT GCC TAC TTC CCT CCT ACC    1438
1439 AGC CGT CCC GGA GGC CAC TGA TCC TGT GTG GTG TTC ACC CCA GGA CGT    1486
1487 GGG AGG CTG CTC TGT CCC TCT GGC CTT AGT TTC CAC ATC TGT ATG GTG    1534
   1                                                         Met Val    2
1535 GGG TTG GGG GGC ATG AGT CAG CTT CTG TTG GCC AGC TTA CTG CCC CCT    1582
   3 Gly Leu Gly Gly Met Ser Gln Leu Leu Leu Ala Ser Leu Leu Pro Pro    18
1583 GTG CCC CAA GGC AGC CCC ACC CGG AGG AAG CTC CCT GCT TCC CTC CTG    1630
  19 Val Pro Gln Gly Ser Pro Thr Arg Arg Lys Leu Pro Ala Ser Leu Leu    34
1631 GTC TCC ACA GCC CTC ATC AGC CCT GTT TGT GTC AGG GGC TGG ATG TGG    1678
  35 Val Ser Thr Ala Leu Ile Ser Pro Val Cys Val Arg Gly Trp Met Trp    50
1679 CAA AAC TTG CAA AAC CGC ATT CAT GGC AGT CAC ACA TCT GCA CGC AGG    1726
  51 Gln Asn Leu Gln Asn Arg Ile His Gly Ser His Thr Ser Ala Arg Arg    66
1727 GTT CCC TCC CTG CCT GGG GCT GGG CAG GTA GGT GTC CGG TGG GAA GCG    1774
  67 Val Pro Ser Leu Pro Gly Ala Gly Gln Val Gly Val Arg Trp Glu Ala    82
1775 GGC CCT GCC TGC AGG ACT CAG CCC AGC CCT CAA AAC CTG GCA CCC AGG    1822
  83 Gly Pro Ala Cys Arg Thr Gln Pro Ser Pro Gln Asn Leu Ala Pro Arg    98
1823 CCA CAT CCC TCA GCG GCA CAG TTA ATT GAA AAT GCA GCT TTG AGG AGT    1870
  99 Pro His Pro Ser Ala Ala Gln Leu Ile Glu Asn Ala Ala Leu Arg Ser    114
1871 GCA ATG TCT GGG GAA AGA CTG TTC CCA GAG GGG CAG GAG CAT CTG GGG    1918
 115 Ala Met Ser Gly Glu Arg Leu Phe Pro Glu Gly Gln Glu His Leu Gly    130
1919 CCT CTG GTG GCT CCC AGG GTC CCC ATG GGA GGA GCC CTG TGC CCT CCA    1966
 131 Pro Leu Val Ala Pro Arg Val Pro Met Gly Gly Ala Leu Cys Pro Pro    146
1967 CTC CCA AGT CTC AGT TGT GCC ATC TGT AAA GTG GGG GCC GCC AGG GAG    2014
 147 Leu Pro Ser Leu Ser Cys Ala Ile Cys Lys Val Gly Ala Ala Arg Glu    162
2015 GCT GGA GGA AGG TGA CGG GAC TTC AGG CCT TGG AAT GGG GCT GAG TGA    2062
 163  Ala Gly Gly Arg ***                                               167
2063 GGG GTT CAC ATG GCC ACC CCA TCC CTC TCC ACG CTC CAC CCG CTG GCT    2110
2111 GCA TCC ACC AGG CGG TGT TTC TGG GTC ACA TTT GCT GCA ATT CAG GTG    2158
2159 CTA ATG GGG GCA GGA GGC TGC AGG GGG AGG GGC CGG TGT CTA GTG GGG    2206
2207 CAG ATG TTT CTC AAT GGAGAA TGC TCA CAG CGG CCT GCA GAG GGG GTC     2254
2255 TGG TGT GGC CTG GGG CTC CTG GGG TTG GGA TTT ACA CAG TGA GCC TGG    2302
2303 GCT TTG GGG CAC AGC TGC TGC TGA CAG AGG GTC TTG GGG TCT GGG AAG    2350
2351 GTG CTT AAA GCC CGG CCC CCA TGC CTG AGC TCC CAC ACC CCT GTT TAG    2398
2399 GGA CAC CCA GAT AGG GTG TCT CCT GCA GGA AAT TCC CCA CAT AAT TCA    2446
2447 TTT ATT TAA AAA ATA TTT TTT GCC GGG CAC GGT GGT TCA TGC CTG TAA    2494
2495 TCC CAG CAC TTT GGG AGG CCA AGG TGG GCG GAT CAT GAG GTC AAG AGA    2542
2543 TCA AGA CCA TCC TGG CCA ACA TGG TGA AAC CCC ATC TCT ACT AAA AAT    2590
2591 ACA AAA GTT AGC CAG GTG TGG TGG CAC GTG CCT GTA GTC CCA GCT ACT    2638
2639 CGG GAG GCT GAG GCA GGA GAA TCA CTT GAA CTA GAA GGC AAA GGT TGC    2686
2687 AGT GAG CCC AGA TAA CGC CAC TGC ACT CCA GCC TGG TGA CAG AGC GAG    2734
2735 ACT CCG TCT CAA AAA AAA AAA AAA AAA AAA AAA AA                     2769
11.PP9932
A:核苷酸序列(SEQ ID NO:31)长度:1611个碱基
   1 GGAACTATCT CGAGTTTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT
  61 TTTTTTTTTT TTTGAACATG TGCAAATAAC TTTATTACCA TAAACCTATG AATACTCATG
 121 AATAGTTTCA CAATTCTGGG GCATTCAGAT AGACAGCAAA AGCAAATATT TCAATTTTTG
 181 TTTACAAAAG TATACTTTAC CAATTGCTGA AGAAAAAAAG TTCATAAATC TGGAGAATAA
 241 AACATTCAAA GAATCAGCAC ATTTTCCAAT AAAAAATTAT GAAAACATTA TCCTTTTGAT
 301 TATTTAGTCC AATAACATTG AGTTTTTTTC TTCTTTGTCT TGAATTTCAT GAAGGTATCA
 361 GCCTGTTCTT TTTCTCAGTG TCTCAGTTGT TGCAGTCATG ACTGAGACTC TGTCAGGTCT
 421 CCATGGCAGG GACCAGAGAC TTTGACTGTC ATGGATTTGG AGATTTCCTT GCCAGTGGCT
 481 GAGTTATGAA CAGAGCAAGC ATAGAGCCCG CTATGATTTC TAGTAATTTG GGGGATAAAG
 541 AGCTTTTGTC CTGATTGCTG AAACTTCCCA TTAATTGTCC AAAAATACTC TGCCGGTGGG
 601 TTAGATTCCG TGAAGCAGGA CAAGTCGAGG TTTTCTCCTG AACGGTAATA GGTGAATGAA
 661 GGGTAAATTC TGGGGAGGTC TGGACCATAG AGGACATTCA GGGTGACTGG GTTACTGCGG
 721 AGGCCACCAT ATCGGTCCCG TATTTCACAT TGATAGGGTC CTGTTTCATT TCTCGTGACA
 781 CTGGGTAGAA TGAGTATCCT GTTTTCAATG GGTCGCTTTA CCCCGGGACT GACGGGGAGG
 841 CTCTGACCGT TTAGCCACCA AATGTAGGTG TAGTTCTCAC TCTTAGGTTC ACAGGTGAAG
 901 GCTAAGACAT CCTTATTCTC CCTGGGGTTT AAGTTGTTGA TGGTGATGTA GGGGATGGGC
 961 AGCTTCGAGT ATAAGGTGAA GGTGAAATGT CGAATTTCTT CTCTAGTCTC ATCACCTCGC
1021 TTTATGATGT GTAAGGTGTA GGTTCCTGCA TCCTTCCGGG TGACATTCTG GATCAGCAGG
1081 GATGCGTTGG AATATACTGT TTCTCCGGAG GTGGCAGCCA TCTCCTTCTC GGCATCATGG
1141 CCGCCCTCAG ACCCCTTGTG AAGCCCAAGA TCGTCAAAAA GAGAACCAAG AAGTTCATCC
1201 GGCACCAGTC AGACCGATAT GTCAAAATTA AGCGTAACTG GCGGAAACCC AGAGGCATTG
1261 ACAACAGGGT TCGTAGAAGA TTCAAGGGCC AGATCTTGAT GCCCAACATT GGTTATGGAA
1321 GCAACAAAAA AACAAAGCAC ATGCTGCCCA GTGGCTTCCG GAAGTTCCTG GTCCACAACG
1381 TCAAGGAGCT GGAAGTGCTG CTGATGTGCA ACAAATCTTA CTGTGCCGAG ATCGCTCACA
1441 ATGTTTCCTC CAAGAACCGC AAAGCCATCG TGGAAAGAGC TGCCCAACTG GCCATCAGAG
1501 TCACCAACCC CAATGCCAGG CTGCGCAGTG AAGAAAATGA GTAGGCAGCT CATGTGCACG
1561 TTTTCTGTTT AAATAAATGT AAAAACTGCA AAAAAAAAAA AAAAAAAAAA A
B:核苷酸序列(SEQ ID NO:32)长度:135个氨基酸
  1 MAALRPLVKP KIVKKRTKKF IRHQSDRYVK IKRNWRKPRG IDNRVRRRFK GQILMPNIGY
 61 GSNKKTKHML PSGFRKFLVH NVKELEVLLM CNKSYCAEIA HNVSSKNRKA IVERAAQLAI
121 RVTNPNARLR SEENE
C.核苷酸及氨基酸组合序列(SEQ ID NO:33)克隆号:PP9932
起始编码子:1137ATG终止编码子:1542TAG蛋白质分子量:15859.03
  1  GG AAC TAT CTC GAG TTT TTT TTT TTT TTT TTT TTT TTT TTT TTT TTT    47
 48 TTT TTT TTT TTT TTT TTT TTT TTT TTG AAC ATG TGC AAA TAA CTT TAT    95
 96 TAC CAT AAA CCT ATG AAT ACT CAT GAA TAG TTT CAC AAT TCT GGG GCA    143
144 TTC AGA TAG ACA GCA AAA GCA AAT ATT TCA ATT TTT GTT TAC AAA AGT    191
192 ATA CTT TAC CAA TTG CTG AAG AAA AAA AGT TCA TAA ATC TGG AGA ATA    239
240 AAA CAT TCA AAG AAT CAG CAC ATT TTC CAA TAA AAA ATT ATG AAA ACA    287
288 TTA TCC TTT TGA TTA TTT AGT CCA ATA ACA TTG AGT TTT TTT CTT CTT    335
336 TGT CTT GAA TTT CAT GAA GGT ATC AGC CTG TTC TTT TTC TCA GTG TCT    383
384 CAG TTG TTG CAG TCA TGA CTG AGA CTC TGT CAG GTC TCC ATG GCA GGG    431
432 ACC AGA GAC TTT GAC TGT CAT GGA TTT GGA GAT TTC CTT GCC AGT GGC    479
480 TGA GTT ATG AAC AGA GCA AGC ATA GAG CCC GCT ATG ATT TCT AGT AAT    527
528 TTG GGG GAT AAA GAG CTT TTG TCC TGA TTG CTG AAA CTT CCC ATT AAT    575
576 TGT CCA AAA ATA CTC TGC CGG TGG GTT AGA TTC CGT GAA GCA GGA CAA    623
624 GTC GAG GTT TTC TCC TGA ACG GTA ATA GGT GAA TGA AGG GTA AAT TCT    671
 672 GGG GAG GTC TGG ACC ATA GAG GAC ATT CAG GGT GAC TGG GTT ACT GCG    719
 720 GAG GCC ACC ATA TCG GTC CCG TAT TTC ACA TTG ATA GGG TCC TGT TTC    767
 768 ATT TCT CGT GAC ACT GGG TAG AAT GAG TAT CCT GTT TTC AAT GGG TCG    815
 816 CTT TAC CCC GGG ACT GAC GGG GAG GCT CTG ACC GTT TAG CCA CCA AAT    863
 864 GTA GGT GTA GTT CTC ACT CTT AGG TTC ACA GGT GAA GGC TAA GAC ATC    911
 912 CTT ATT CTC CCT GGG GTT TAA GTT GTT GAT GGT GAT GTA GGG GAT GGG    959
 960 CAG CTT CGA GTA TAA GGT GAA GGT GAA ATG TCG AAT TTC TTC TCT AGT    1007
1008 CTC ATC ACC TCG CTT TAT GAT GTG TAA GGT GTA GGT TCC TGC ATC CTT    1055
1056 CCG GGT GAC ATT CTG GAT CAG CAG GGA TGC GTT GGA ATA TAC TGT TTC    1103
1104 TCC GGA GGT GGC AGC CAT CTC CTT CTC GGC ATC ATG GCC GCC CTC AGA    1151
   1                                             Met Ala Ala Leu Arg    5
1152 CCC CTT GTG AAG CCC AAG ATC GTC AAA AAG AGA ACC AAG AAG TTC ATC    1199
   6 Pro Leu Val Lys Pro Lys Ile Val Lys Lys Arg Thr Lys Lys Phe Ile    21
1200 CGG CAC CAG TCA GAC CGA TAT GTC AAA ATT AAG CGT AAC TGG CGG AAA    1247
  22 Arg His Gln Ser Asp Arg Tyr Val Lys Ile Lys Arg Asn Trp Arg Lys    37
1248 CCC AGA GGC ATT GAC AAC AGG GTT CGT AGA AGA TTC AAG GGC CAG ATC    1295
  38 Pro Arg Gly Ile Asp Asn Arg Val Arg Arg Arg Phe Lys Gly Gln Ile    53
1296 TTG ATG CCC AAC ATT GGT TAT GGA AGC AAC AAA AAA ACA AAG CAC ATG    1343
  54 Leu Met Pro Asn Ile Gly Tyr Gly Ser Asn Lys Lys Thr Lys His Met    69
1344 CTG CCC AGT GGC TTC CGG AAG TTC CTG GTC CAC AAC GTC AAG GAG CTG    1391
  70 Leu Pro Ser Gly Phe Arg Lys Phe Leu Val His Asn Val Lys Glu Leu    85
1392 GAAGTG CTG CTG ATG TGC AAC AAA TCT TAC TGT GCC GAG ATC GCT CAC     1439
  86 Glu Val Leu Leu Met Cys Asn Lys Ser Tyr Cys Ala Glu Ile Ala His    101
1440 AAT GTT TCC TCC AAG AAC CGC AAA GCC ATC GTG GAA AGA GCT GCC CAA    1487
 102 Asn Val Ser Ser Lys Asn Arg Lys Ala Ile Val Glu Arg Ala Ala Gln    117
1488 CTG GCC ATC AGA GTC ACC AAC CCC AAT GCC AGG CTG CGC AGT GAA GAA    1535
 118 Leu Ala Ile Arg Val Thr Asn Pro Asn Ala Arg Leu Arg Ser Glu Glu    133
1536 AAT GAG TAG GCA GCT CAT GTG CAC GTT TTC TGT TTA AAT AAA TGT AAA    1583
 134 Asn Glu ***                                                        136
1584 AAC TGC AAA AAA AAA AAA AAA AAA AAA A                              1611
12.PP10141
A:核苷酸序列(SEQ ID NO:34)长度:1744个碱基
  1 GTGGAAGTTG GCTGTCTTGT TTCTTGTGAC CTTGGGGGTG TAAAGGACAG AGCCCAGGCG
 61 ACCTAGGGCA CTATCTCCCT ACCCCACGCC TTCTCCCTTC CTCGTTCCTC CCTACCCTTA
121 TCGCTTCTAC CCCGCCCACA CCGCCCTAAA CGGCTTCCTG GGGCGGAACT GTTTCGCTTT
181 TCCCCGTCCC AGTGGAGGGT GGGGTGGGGG GGTCGCAGCC CTAAGCCTCT GGGAGACATG
241 GAGCCCAGGA GGGCGGCGCC CGTGGTGCCT TGGCTGGGGG TCTCGGGAGG CCGCGGGGTC
301 GGCATCGGCC GCGGCAGTTT GTGTACCATC TAGCCGGGGC CCTGGGCACT TGAGCTGCAG
361 GATCTGGCGC GCCGTTTCGG GCCGGCAGGC AGGCCGGGCT GGTGCCGCTA GTGGTGCGGG
421 CGCTGGAGCT CTTGGAACAG GCTGCCGTGG GGCCCGCCCC GGACTCGCTG CAGGTGTCGG
481 CGCAGGCCGG ACGCAGGAGC TGCGGCGGCT GCGGGAGGAG AACGAGCGCC TCCGCAGGAG
541 ACTGCGCGCG GGGCCACAGG AGGAGCGCGC GCTGCTGCGG CAGCTCAAGG AGGTCACGGC
601 CGACAGCGGG ACGAACTCCG GGCGCACAAC CGCGACTGCG GCAGCGCGGC CAGGAGACCG
661 AGGCGTTGCA GGAGCAGCTG CAGCGCCTCC TGCTGGTGAA CGCTGAGCTG CGGCACAAGC
721 TGGCGGCCAT GCAGACCCAG NNNGCCGCGC AGGACCGCGA GAGGGAGCGC CAGCAGCCTT
781 ACGAAGCCGC GACTCCGCAG GCTAAAGAGC GAGCGCGGGG GCAGCCGGGC GGCCCGGGCA
 841 CCAGCACGGA CAGGAGCCCG AATGGGCGCC GCCGGCGCAG GCGCCCCAGG GAACCCTGAG
 901 GACCCGGCGG AGGCCGCGCA GCAGCTCGGG CGCCCCTCGG AGGCAGGGCA GTGCCGCTTC
 961 AGTCGGGAGG AGTTTGAGCA GATCCTTCAG GAGCGGAATG AACTCAAAGC CAAAGTGTTC
1021 CTGCTCAAGG AGGAACTGGC CTACTTCCAG CGGGAGCTGC TCACAGACCA CCGGGTCCCC
1081 GGCCTTCTGC TCGAGGCCAT GAAGGTGGCT GTCCGGAAGC AGCGGAAGAA GATCAAGGCC
1141 AAGATGTTAG GGACACCAGA GGAAGCAGAG AGCAGTGAGG ATGAGGCTGG CCCATGGATC
1201 CTGCTCTCCG ATGACAAGGG AGACCATCCC CCACCCCCGG AGTCCAAAAT ACAGAGTTTC
1261 TTTGGCCTAT GGTATCGGGG TAAAGCTGAA TCCTCTGAGG ATGAGACCAG CAGCCCTGCA
1321 CCCAGCAAGC TAGGGGGAGA AGAGGAGGCC CAACCACAGT CTCCAGCTCC TGATCCGCCC
1381 TGTTCTGCCC TCCACGAACA CCTTTGTCTG GGGGCCTCAG CCGCCCCAGA GGCCTGACTT
1441 AGGGGTCTGG CTGTGGAAGG ATGTGTGGCC TCAAATGAGG ACAGGGCTCC CGCCTTCACA
1501 GCCCTCGCCA GGGGTCTGCC CCAATCCTGG CCTGCATCAG GGCAGGACGG GGTCTCAGCC
1561 CGCCTCCCTC TCTACGTCTC TGTACCGAGC CTCTGGGGCC AGATATAAGA GTGCCTCTCT
1621 GAGTCTCAGT TTCCCCATCC ATGAAATGAG AGCTGACTGC CTAGCTCCCA GGGCTTTGTG
1681 CAGACGGCCT GAGCTCATGT AATAAAGAAC TGCCCGTAAT ACACAAAAAA AAAAAAAAAA
1741 AAAA
B:核苷酸序列(SEQ ID NO:35)长度:191个氨基酸
  1 MGAAGAGAPG NPEDPAEAAQ QLGRPSEAGQ CRFSREEFEQ ILQERNELKA KVFLLKEELA
 61 YFQRELLTDH RVPGLLLEAM KVAVRKQRKK IKAKMLGTPE EAESSEDEAG PWILLSDDKG
121 DHPPPPESKI QSFFGLWYRG KAESSEDETS SPAPSKLGGE EEAQPQSPAP DPPCSALHEH
181 LCLGASAAPE A
C.核苷酸及氨基酸组合序列(SEQ ID NO:36)克隆号:PP10141
起始编码子:862ATG终止编码子:1435TGA蛋白质分子量:20725.00
  1 GTG GAA GTT GGC TGT CTT GTT TCT TGT GAC CTT GGG GGT GTA AAG GAC    48
 49 AGA GCC CAG GCG ACC TAG GGC ACT ATC TCC CTA CCC CAC GCC TTC TCC    96
 97 CTT CCT CGT TCC TCC CTA CCC TTA TCG CTT CTA CCC CGC CCA CAC CGC    144
145 CCT AAA CGG CTT CCT GGG GCG GAA CTG TTT CGC TTT TCC CCG TCC CAG    192
193 TGG AGG GTG GGG TGG GGG GGT CGC AGC CCT AAG CCT CTG GGA GAC ATG    240
241 GAG CCC AGG AGG GCG GCG CCC GTG GTG CCT TGG CTG GGG GTC TCG GGA    288
289 GGC CGC GGG GTC GGC ATC GGC CGC GGC AGT TTG TGT ACC ATC TAG CCG    336
337 GGG CCC TGG GCA CTT GAG CTG CAG GAT CTG GCG CGC CGT TTC GGG CCG    384
385 GCA GGC AGG CCG GGC TGG TGC CGC TAG TGG TGC GGG CGC TGG AGC TCT    432
433 TGG AAC AGG CTG CCG TGG GGC CCG CCC CGG ACT CGC TGC AGG TGT CGG    480
481 CGC AGG CCG GAC GCA GGA GCT GCG GCG GCT GCG GGA GGA GAA CGA GCG    528
529 CCT CCG CAG GAG ACT GCG CGC GGG GCC ACA GGA GGA GCG CGC GCT GCT    576
577 GCG GCA GCT CAA GGA GGT CAC GGC CGA CAG CGG GAC GAA CTC CGG GCG    624
625 CAC AAC CGC GAC TGC GGC AGC GCG GCC AGG AGA CCG AGG CGT TGC AGG    672
673 AGC AGC TGC AGC GCC TCC TGC TGG TGA ACG CTG AGC TGC GGC ACA AGC    720
721 TGG CGG CCA TGC AGA CCC AGN NNG CCG CGC AGG ACC GCG AGA GGG AGC    768
769 GCC AGC AGC CTT ACG AAG CCG CGA CTC CGC AGG CTA AAG AGC GAG CGC    816
817 GGG GGC AGC CGG GCG GCC CGG GCA CCA GCA CGG ACA GGA GCC CGA ATG    864
  1                                                             Met    1
865 GGC GCC GCC GGC GCA GGC GCC CCA GGG AAC CCT GAG GAC CCG GCG GAG    912
  2 Gly Ala Ala Gly Ala Gly Ala Pro Gly Asn Pro Glu Asp Pro Ala Glu    17
913 GCC GCG CAG CAG CTC GGG CGC CCC TCG GAG GCA GGG CAG TGC CGC TTC    960
 18 Ala Ala Gln Gln Leu Gly Arg Pro Ser Glu Ala Gly Gln Cys Arg Phe    33
961 AGT CGG GAG GAG TTT GAG CAG ATC CTT CAG GAG CGG AAT GAA CTC AAA    1008
 34 Ser Arg Glu Glu Phe Glu Gln Ile Leu Gln Glu Arg Asn Glu Leu Lys    49
1009 GCC AAA GTG TTC CTG CTC AAG GAG GAA CTG GCC TAC TTC CAG CGG GAG    1056
  50 Ala Lys Val Phe Leu Leu Lys Glu Glu Leu Ala Tyr Phe Gln Arg Glu    65
1057 CTG CTC ACA GAC CAC CGG GTC CCC GGC CTT CTG CTC GAG GCC ATG AAG    1104
  66 Leu Leu Thr Asp His Arg Val Pro Gly Leu Leu Leu Glu Ala Met Lys    81
1105 GTG GCT GTC CGG AAG CAG CGG AAG AAG ATC AAG GCC AAG ATG TTA GGG    1152
  82 Val Ala Val Arg Lys Gln Arg Lys Lys Ile Lys Ala Lys Met Leu Gly    97
1153 ACA CCA GAG GAA GCA GAG AGC AGT GAG GAT GAG GCT GGC CCA TGG ATC    1200
  98 Thr Pro Glu Glu Ala Glu Ser Ser Glu Asp Glu Ala Gly Pro Trp Ile    113
1201 CTG CTC TCC GAT GAC AAG GGA GAC CAT CCC CCA CCC CCG GAG TCC AAA    1248
 114 Leu Leu Ser Asp Asp Lys Gly Asp His Pro Pro Pro Pro Glu Ser Lys    129
1249 ATA CAG AGT TTC TTT GGC CTA TGG TAT CGG GGT AAA GCT GAA TCC TCT    1296
 130 Ile Gln Ser Phe Phe Gly Leu Trp Tyr Arg Gly Lys Ala Glu Ser Ser    145
1297 GAG GAT GAG ACC AGC AGC CCT GCA CCC AGC AAG CTA GGG GGA GAA GAG    1344
 146 Glu Asp Glu Thr Ser Ser Pro Ala Pro Ser Lys Leu Gly Gly Glu Glu    161
1345 GAG GCC CAA CCA CAG TCT CCA GCT CCT GAT CCG CCC TGT TCT GCC CTC    1392
 162 Glu Ala Gln Pro Gln Ser Pro Ala Pro Asp Pro Pro Cys Ser Ala Leu    177
1393 CAC GAA CAC CTT TGT CTG GGG GCC TCA GCC GCC CCA GAG GCC TGA CTT    1440
 178 His Glu His Leu Cys Leu Gly Ala Ser Ala Ala Pro Glu Ala ***        192
1441 AGG GGT CTG GCT GTG GAA GGA TGT GTG GCC TCA AAT GAG GAC AGG GCT    1488
1489 CCC GCC TTC ACA GCC CTC GCC AGG GGT CTG CCC CAA TCC TGG CCT GCA    1536
1537 TCA GGG CAG GAC GGG GTC TCA GCC CGC CTC CCT CTC TAC GTC TCT GTA    1584
1585 CCG AGC CTC TGG GGC CAG ATA TAA GAG TGC CTC TCT GAG TCT CAG TTT    1632
1633 CCC CAT CCA TGA AAT GAG AGC TGA CTG CCT AGC TCC CAG GGC TTT GTG    1680
1681 CAG ACG GCC TGA GCT CAT GTA ATA AAG AAC TGC CCG TAA TAC ACA AAA    1728
1729 AAA AAA AAA AAA AAA A                                              1744

Claims (5)

1.一种分离的多核苷酸,其特征在于,它选自下组:
(a)编码以下多肽的多核苷酸,所述的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35;
(b)与多核苷酸(a)互补的多核苷酸。
2.如权利要求1所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
3.如权利要求1所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
4.一种载体,其特征在于,它含有权利要求1所述的多核苷酸。
5.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求4所述的载体转化或转导的宿主细胞;
(b)用权利要求1所述的多核苷酸转化或转导的宿主细胞。
CNB011267283A 2001-09-12 2001-09-12 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 Expired - Fee Related CN1177050C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB011267283A CN1177050C (zh) 2001-09-12 2001-09-12 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB011267283A CN1177050C (zh) 2001-09-12 2001-09-12 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸

Publications (2)

Publication Number Publication Date
CN1403480A CN1403480A (zh) 2003-03-19
CN1177050C true CN1177050C (zh) 2004-11-24

Family

ID=4666735

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB011267283A Expired - Fee Related CN1177050C (zh) 2001-09-12 2001-09-12 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸

Country Status (1)

Country Link
CN (1) CN1177050C (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050020527A1 (en) * 2003-04-04 2005-01-27 Thomas Peters Spinster-like protein genes, expression products, non-human animal model: uses in human metabolic disorders

Also Published As

Publication number Publication date
CN1403480A (zh) 2003-03-19

Similar Documents

Publication Publication Date Title
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1177050C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1169954C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1177049C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1209373C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1177048C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1155615C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1177864C (zh) 在肝癌组织中具有表达差异的新的人蛋白及其编码序列
CN1199997C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1199998C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1169831C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1177047C (zh) 编码具有抑癌功能的人蛋白的多核苷酸
CN1222616C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1231496C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1205225C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1194010C (zh) 具有抑制癌细胞生长功能的人蛋白及基编码序列
CN1194989C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1169955C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1209370C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1199994C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1231497C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1230445C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1246457C (zh) 人tsc403基因和人ing1l基因
CN1199996C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1155616C (zh) 具有促进癌细胞生长功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee