CN1177047C - 编码具有抑癌功能的人蛋白的多核苷酸 - Google Patents

编码具有抑癌功能的人蛋白的多核苷酸

Info

Publication number
CN1177047C
CN1177047C CNB011267232A CN01126723A CN1177047C CN 1177047 C CN1177047 C CN 1177047C CN B011267232 A CNB011267232 A CN B011267232A CN 01126723 A CN01126723 A CN 01126723A CN 1177047 C CN1177047 C CN 1177047C
Authority
CN
China
Prior art keywords
cag
ctg
leu
gag
cct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB011267232A
Other languages
English (en)
Other versions
CN1403475A (zh
Inventor
顾健人
杨胜利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd
Original Assignee
SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd filed Critical SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd
Priority to CNB011267232A priority Critical patent/CN1177047C/zh
Publication of CN1403475A publication Critical patent/CN1403475A/zh
Application granted granted Critical
Publication of CN1177047C publication Critical patent/CN1177047C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。

Description

编码具有抑癌功能的人蛋白的多核苷酸
技术领域
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸和此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
背景技术
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
发明内容
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36、39的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
具体实施方式
3T3细胞是一种小鼠成纤维细胞(J.Cell.Biol.,17:299,1963)(也称为NIH/3T3细胞)。在癌症研究领域中,常将外源基因(尤其是人基因)引入3T3细胞,观察其对3T3细胞生长的影响情况。通常认为,对3T3细胞生长有影响的基因是癌症相关基因,其中对3T3细胞生长有抑制作用的基因大多是抑癌基因,而对3T3细胞生长有促进作用的基因大多是(原)癌基因。
本发明采用大规模cDNA克隆转染小鼠胚胎成纤维细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对3T3细胞具有抑制克隆形成的作用,其抑制率≥50%。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP10513蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”对于PP10513而言是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。再以PP10764蛋白为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体;“简并的变异体”对于PP10764而言是指编码具有SEQ ID NO:5的蛋白质,但与SEQ IDNO:6所示的编码区序列有差别的核酸序列。对于本发明的其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽有相同的生物学功能(以PP10513蛋白为例)和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold SpringHarbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明多核苷酸的载体,以及用本发明载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将本发明蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,etal.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。这些抗体可用常规方法制备。抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与本发明蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而现在只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:cDNA基因的获得及对小鼠NIH/3T3细胞克隆形成的抑制作用
PP10513、PP10764、PP12100、PP12488、PP12494、PP12901、PP13275、PP13296和PP14214是通过用常规方法构建人胎盘cDNA文库获得的;FP497、FP585、FP588和FP757是通过用常规方法构建人胎儿cDNA文库获得的。取3、6、9月龄的胎盘组织(PP克隆)或胎儿组织(FP克隆),用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXRcDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑制癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染小鼠NIH/3T3细胞。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的小鼠NIH/3T3细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克隆形成,计数。发现上述克隆有抑制细胞克隆形成作用,结果如下表所示。
                   cDNA克隆转染细胞(3T3)克隆形成情况
cDNA克隆名称      cDNA克隆数(三个重复)     空载体克隆数(三个重复)
    PP10513     10     13     16     13     12     15
    PP10764     17     13     19     13     12     15
    PP12100     10     19     13     13     12     15
    PP12488     6     3     5     13     12     15
    PP12494     13     19     15     13     12     15
    PP12901     7     5     3     13     12     15
    PP13275     15     14     16     13     12     15
    PP13296     16     10     18     13     12     15
    PP14214     2     2     2     13     12     15
    FP497     11     8     13     13     12     15
    FP585     5     3     9     13     12     15
    FP588     9     6     7     13     12     15
    FP757     12     10     9     13     12     15
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28、31、34、37)。
实施例2:从胎盘或胎儿cDNA中PCR获得全长基因和重组蛋白的表达
取3、6、9月龄的胎盘组织(PP克隆)或胎儿组织(FP克隆),用Trizol试剂(GIBCOBRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-Superscript II(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘或胎儿cDNA。利用各个基因的特异引物(如下表所示),按97℃3’1个循环。94℃30″60℃30″72℃1’35个循环,72℃10’1个循环进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,获得重组蛋白(SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38)。
                         基因特异引物
克隆名称 特异引物1(5’→3’)  特异引物2(3’→5’)
PP10513 (76)ACCAACGCCTCTTCCCTC  CTCCACCCACCTAGTGCT(1424)
PP10764 (360)GAGCCTATCTACCAACCACC  CACCCAGACAAGGACCAA(1476)
PP12100 (1)GTGGGATTACAGGCGTGAG  GAGTGAGAACCAGAAACCCAG(1415)
PP12488 (3)TGAGCGCCACCCGGAGTC  ATGGTGAGCGTCCCCGTT(1508)
PP12494 (1)GCTTGACCCATCCTCTAC  GCTTTGGACTGAACCTAA(3248)
PP12901 (294)CATTCCCACCTTCCTCAC  AACACCTCCGATTCCGTC(2424)
PP13275 (9)GCTGATCCGTCTGTTGGG  AATGAGGGAGCATGTACGT(3123)
PP13296 (63)TTGGGCTGAGCAGAGGAC  GAAGGGTAATTTGAACTTG(2306)
PP14214 (180)GAGCCCATCCAGGACACT  AACTCTTCAAACAGAACGTT(636)
FP497 (19)GGGGCTGTCATCATCAGA  TTTCGTCCCAAGTTCCTT(2411)
FP585 (82)GACCACCCTTAACTGTCTACCT  TCTAACCCGCCTAAACTC(1228)
FP588 (27)GAAGCATCTTTTCTACATTAC  AATAACTCGTGGATGATACAC(1844)
FP757 (23)GGGTACAGTTTAGTTTTG  CGGATTCAGTAACGAAAA(1726)
实施例3:cDNA克隆序列分析
1.PP10513
A:核苷酸序列(SEQ ID NO:1)长度:1494个碱基
   1 GAGAGAGAGC GAGAGAGAGA GAGAGAGAGA GAGAGAGAGA GAGAGAGAGA GAGAGCCTCC
  61 TTGGCAGACT GGGACACCAA CGCCTCTTCC CTCTTGGGCT GACACCGAGC TGTAAATGTC
 121 AGTGGACATT TAAATACTGC GGTTACACAT TCGATGTCCT GTCTGCAATG GAGCCGGGTT
 181 CTGTAAACAT AAGCTGCATG GCGAAATCGG ATCATCATCG CCCATCAAGC TCTTTGGCAG
 241 CAGTGCTGTA ATCAGTGCAA ACATTTATTT ATATAAATGC TCCCATCCCC TCGGCATGAA
 301 GATATACTTA GGCTCTCTCA ATGGACAGCC ACGCCACAAG CCCAGGAATG AGAGCTTGTC
 361 AGATACTGAG GCTGTTTTCA GAGCCAGTGT TCGGCTGAAG TGGCACAGAA GCTATCATTG
 421 TTTGCAAATC TCTGCTGCTT GTCAAGCCAC AGGGTTAAGT AACCCCGGAT GTTGCGAACA
 481 CTCTGAAGTG CTGACCTGCA GTGTCTTTTT GGATCACTGA GCCCTCAGGC AGACAGGCTG
 541 TACGTGGCCG ACACGTCATG GCTGCTGTCT TGCACTTAAC CCTCTTTATC TTTAGACCTT
 601 GATTGTGCAC CTGTTTCTCA TTGGAAGCTA ATGACAATCC ACGAAGCGGC TTGGCAGTGA
 661 CTTGTCTCTT GATTGTGTAA GGAGGGGTTG CCACATTCAC CCATGTTGTT GACTTTCAAC
 721 TGTACACTTG AAAACGTCAA AAGTCAGAGT AAGCATTGCC TCATGTCTCC GAGTGTAGCA
 781 ATTCTAGGAA AACTCTTCCG AATGGGTTTA AAGTCAAACA AATCCAATCA AAACAGACTT
 841 GCAGGGCCAG GCAGCGGTGG CTCATGCCTG CAATCCCAGC ACTTTGGGAA GCCAAGGTGG
 901 GCAGATCACT TGAGGTCAGG AGTTGGAGAC CAGCCTGGCC AACGTGGTGA GAGCCCATCT
 961 GTACTAAAAA TACAAAAATT TGCTGAGCCT GGTGGCAGGC GCCTGTAGTC TCAGCCTCCC
1021 GAGTGGCTGG GACTACAGGC ACATGCAACC ACACCCGGCT CATGTTTTGC ATTTTTAGTA
1081 CAGACCGGGT TTCACCGTGT TGGCCAGGAT CGTCTTGATA TCGTGACCTC GTGAACCGCC
1141 CGCCTTGGCC TCCCAAAGTG CTGGGATGAC AGGTGTGAGA GTTCAGCAGT ATTAACTACA
1201 TTCATGTTAA TGATGCGACC ATCACCAACA TTCATTTCCA GAACACTCTG TCCCCAGTAA
1261 ACAACATGTC CCCGTTCCTC CCAGCCACTG GTACCTACCA TTCTACTTTC TGTTTGTATA
1321 AACTTGACAA CTCTAGGGTC CTCATATAAG TGGAATCCAG CTGGGCCCAG TGGCTCACAC
1381 CTGTCATCCC GGCACTTTGG GAGGCCGAGG TGGGTGGATC ACGAGGTCAG GAGATTGAGA
1441 CCATCCTGGC CAATATGGGG AAACCCCGTC TCTACTAAAA AAAATAAAAA AAAA
B:核苷酸序列(SEQ ID NO:2)长度:101个氨基酸
 1 MLLTFNCTLE NVKSQSKHCL MSPSVAILGK LFRMGLKSNK SNQNRLAGPG SGGSCLQSQH
61 FGKPRWADHL RSGVGDQPGQ RGESPSVLKI QKFAEPGGRR L
C.核苷酸及氨基酸组合序列(SEQ ID NO:3)克隆号和蛋白名称:PP10513
起始编码子:703 ATG 终止编码子:1006 TAG 蛋白质分子量:10947.08
(注:(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿。)
   1 GAG AGA GAG CGA GAG AGA GAG AGA GAG AGA GAG AGA GAG AGA GAG AGA    48
  49 GAG AGA GCC TCC TTG GCA GAC TGG GAC ACC AAC GCC TCT TCC CTC TTG    96
  97 GGC TGA CAC CGA GCT GTA AAT GTC AGT GGA CAT TTA AAT ACT GCG GTT    144
 145 ACA CAT TCG ATG TCC TGT CTG CAA TGG AGC CGG GTT CTG TAA ACA TAA    192
 193 GCT GCA TGG CGA AAT CGG ATC ATC ATC GCC CAT CAA GCT CTT TGG CAG    240
 241 CAG TGC TGT AAT CAG TGC AAA CAT TTA TTT ATA TAA ATG CTC CCA TCC    288
 289 CCT CGG CAT GAA GAT ATA CTT AGG CTC TCT CAA TGG ACA GCC ACG CCA    336
 337 CAA GCC CAG GAA TGA GAG CTT GTC AGA TAC TGA GGC TGT TTT CAG AGC    384
 385 CAG TGT TCG GCT GAA GTG GCA CAG AAG CTA TCA TTG TTT GCA AAT CTC    432
 433 TGC TGC TTG TCA AGC CAC AGG GTT AAG TAA CCC CGG ATG TTG CGA ACA    480
 481 CTC TGA AGT GCT GAC CTG CAG TGT CTT TTT GGA TCA CTG AGC CCT CAG    528
 529 GCA GAC AGG CTG TAC GTG GCC GAC ACG TCA TGG CTG CTG TCT TGC ACT    576
 577 TAA CCC TCT TTA TCT TTA GAC CTT GAT TGT GCA CCT GTT TCT CAT TGG    624
 625 AAG CTA ATG ACA ATC CAC GAA GCG GCT TGG CAG TGA CTT GTC TCT TGA    672
 673 TTG TGT AAG GAG GGG TTG CCA CAT TCA CCC ATG TTG TTG ACT TTC AAC    720
   1                                         Met Leu Leu Thr Phe Asn    6
 721 TGT ACA CTT GAA AAC GTC AAA AGT CAG AGT AAG CAT TGC CTC ATG TCT    768
   7 Cys Thr Leu Glu Asn Val Lys Ser Gln Ser Lys His Cys Leu Met Ser    22
 769 CCG AGT GTA GCA ATT CTA GGA AAA CTC TTC CGA ATG GGT TTA AAG TCA    816
  23 Pro Ser Val Ala Ile Leu Gly Lys Leu Phe Arg Met Gly Leu Lys Ser    38
 817 AAC AAA TCC AAT CAA AAC AGA CTT GCA GGG CCA GGC AGC GGT GGC TCA    864
  39 Asn Lys Ser Asn Gln Asn Arg Leu Ala Gly Pro Gly Ser Gly Gly Ser    54
 865 TGC CTG CAA TCC CAG CAC TTT GGG AAG CCA AGG TGG GCA GAT CAC TTG    912
  55 Cys Leu Gln Ser Gln His Phe Gly Lys Pro Arg Trp Ala Asp His Leu    70
 913 AGG TCA GGA GTT GGA GAC CAG CCT GGC CAA CGT GGT GAG AGC CCA TCT    960
  71 Arg Ser Gly Val Gly Asp Gln Pro Gly Gln Arg Gly Glu Ser Pro Ser    86
 961 GTA CTA AAA ATA CAA AAA TTT GCT GAG CCT GGT GGC AGG CGC CTG TAG    1008
  87 Val Leu Lys Ile Gln Lys Phe Ala Glu Pro Gly Gly Arg Arg Leu ***    102
1009 TCT CAG CCT CCC GAG TGG CTG GGA CTA CAG GCA CAT GCA ACC ACA CCC    1056
1057 GGC TCA TGT TTT GCA TTT TTA GTA CAG ACC GGG TTT CAC CGT GTT GGC    1104
1105 CAG GAT CGT CTT GAT ATC GTG ACC TCG TGA ACC GCC CGC CTT GGC CTC    1152
1153 CCA AAG TGC TGG GAT GAC AGG TGT GAG AGT TCA GCA GTA TTA ACT ACA    1200
1201 TTC ATG TTA ATG ATG CGA CCA TCA CCA ACA TTC ATT TCC AGA ACA CTC    1248
1249 TGT CCC CAG TAA ACA ACA TGT CCC CGT TCC TCC CAG CCA CTG GTA CCT    1296
1297 ACC ATT CTA CTT TCT GTT TGT ATA AAC TTG ACA ACT CTA GGG TCC TCA    1344
1345 TAT AAG TGG AAT CCA GCT GGG CCC AGT GGC TCA CAC CTG TCA TCC CGG    1392
1393 CAC TTT GGG AGG CCG AGG TGG GTG GAT CAC GAG GTC AGG AGA TTG AGA    1440
1441 CCA TCC TGG CCA ATA TGG GGA AAC CCC GTC TCT ACT AAA AAA AAT AAA    1488
1489 AAA AAA                                                              1494
2.PP10764
A:核苷酸序列(SEQ ID NO:4)长度:1598个碱基
   1 GTGCTCCTGT CTTCTGCTCC TCTAGTGAGC CATTCCTCTC CCTTGGAATT CATCAGAGTC
  61 ATCCCTGTAG AGCCCCCTTC CTGCCTCTCA ATTCCTCCTG CCTCACTTCC CAGGCTACTG
 121 CTGCTTCAAG ACAGTGACGT TTCTCTCCGG TCAGCTGTCA GGAGCGCTGG TGAGCTTCCT
 181 ACTGTGCCAC AAGGTGCGGG TGCTGGAGAC ACAGCTGAGC CTGGAAATGA GAGTGGGCAT
 241 CGCCGTGGTC ATCATGACTC CTCTGCGGCG TGGTCACCAT GTTGGTTCAC TGTGTTGGGC
 301 TCTTATTGAC GGGTCTCCTG CTAGGCCTGA CCTTGGGTGC CGGAGCCCTG CTGGCTTCTG
 361 AGCCTATCTA CCAACCACCT TCAGCCTGGG TGCCAGCTGG GGGGCTGGTG GGGCTGGCGC
 421 TGCTGGGAGC CCTGCTCACA CTTCGGTGGC CACGTCCATT CACAGTTCTG GGCACAACCC
 481 TGCTGGGTTC TGCAGTGCTT GTGGCCTGTG TTGACTACTT CCTGGAGGGG CTGGCACTGG
 541 GGAGTTGGCT GGGCCAACGC CTGCAGACAC TTCCAGCCTT GCCTTCTCTC TGCTGATATA
 601 GCTGGGTCTT ACTGGGGATC TGGCCAGCCT TGGGGGCCCT TGGAGCCCTG GCCCAGTGGA
 661 AGCTCGTGCC TGAGGAACAT GGAGGCCACG CTAATGAGTT ACTTCCAGAG TCTTCAAGAG
 721 TGCCAACTGG GACCAGGACC CCAGACCACA GCCCCCCACA CCGTCCTGGA CCTGGATTCT
 781 GACTGTGGTT CCACTGTACC CCTCACCTTA ATCTCTGGTT CTAACCAGAC CTGAGCCTAG
 841 ACTTCCACTT TTTCCCTTAC CCCTGTGAGG GCCTGGGAAC ACTAGGTGGG CAGGGTTTGA
 901 GCCCACAGGA CCTGCACACA AACTTCCCCA CCTCTTGGAC TTGGGGACAG GATCTGTGCC
 961 TCAACCCAGA CCAGCTTTGT AGGGATATGT TCCAAGAACA GAGAAGAGTC TTATGGGGAA
1021 GGGGGAGGAA GGGAAGTATG AATATTTACC TCTGACCAAT AATAGAGGTG CCCTGGTCCC
1081 CAAAGAAATT GACTCCCGAA TTCCCTCCAA GCCTTACCCA TATAGCTTTT GTTTGTTTGT
1141 TTGTTTTCAG ACAAGGTCTT GTTCTGTCCA GTGCCGTGGC GTGACCACAG CTCATGACAA
1201 CTTTGATTTC CCCGGCCCAA GCGAGCCTCT CATTCAGCCT CCTGAGTGGC TGGGACCACA
1261 GACGCCACAC ACAGCTAATT TTTATGTATT CGTTTTTATT TTTTTGCAGA GACAGGGTCT
1321 CCCTATGTTG CCCAAGCTGG TCTTGAACTC CTGGGCTCAA GTGATCCTCC TGCTTCAGCC
1381 TCCCAAAGTG CTAGGATTAT AGCCACCGCA CCTCGTCTTG AAATAGCCTT TTAAATGTTC
1441 ACCTCAGCTT GCCTCACAGT GGGTCTGTTC CTGGTTTCCC AGATGCATAA AGGAAGACAT
1501 ATCCCTCCCC TGGGCAGCAA GGCTACAATG GGAGGGAGGG AGAACATGGG AGCATGTGAA
1561 TAAAATGGCA TTAAATACTG AAAAAAAAAA AAAAAAAA
B:核苷酸序列(SEQ ID NO:5)长度:129个氨基酸
  1 MGKGEEGKYE YLPLTNNRGA LVPKEIDSRI PSKPYPYSFC LFVCFQTRSC SVQCRGVTTA
 61 HDNFDFPGPS EPLIQPPEWL GPQTPHTANF YVFVFIFLQR QGLPMLPKLV LNSWAQVILL
121 LQPPKVLGL
C.核苷酸及氨基酸组合序列(SEQ ID NO:6)克隆号和蛋白名称:PP10764
起始编码子:1013 ATG 终止编码子:1400 TAG 蛋白质分子量:14581.28
  1   G TGC TCC TGT CTT CTG CTC CTC TAG TGA GCC ATT CCT CTC CCT TGG    46
 47 AAT TCA TCA GAG TCA TCC CTG TAG AGC CCC CTT CCT GCC TCT CAA TTC    94
 95 CTC CTG CCT CAC TTC CCA GGC TAC TGC TGC TTC AAG ACA GTG ACG TTT    142
143 CTC TCC GGT CAG CTG TCA GGA GCG CTG GTG AGC TTC CTA CTG TGC CAC    190
191 AAG GTG CGG GTG CTG GAG ACA CAG CTG AGC CTG GAA ATG AGA GTG GGC    238
239 ATC GCC GTG GTC ATC ATG ACT CCT CTG CGG CGT GGT CAC CAT GTT GGT    286
287 TCA CTG TGT TGG GCT CTT ATT GAC GGG TCT CCT GCT AGG CCT GAC CTT    334
335 GGG TGC CGG AGC CCT GCT GGC TTC TGA GCC TAT CTA CCA ACC ACC TTC    382
383 AGC CTG GGT GCC AGC TGG GGG GCT GGT GGG GCT GGC GCT GCT GGG AGC    430
431 CCT GCT CAC ACT TCG GTG GCC ACG TCC ATT CAC AGT TCT GGG CAC AAC    478
479 CCT GCT GGG TTC TGC AGT GCT TGT GGC CTG TGT TGA CTA CTT CCT GGA    526
527 GGG GCT GGC ACT GGG GAG TTG GCT GGG CCA ACG CCT GCA GAC ACT TCC    574
 575 AGC CTT GCC TTC TCT CTG CTG ATA TAG CTG GGT CTT ACT GGG GAT CTG    622
 623 GCC AGC CTT GGG GGC CCT TGG AGC CCT GGC CCA GTG GAA GCT CGT GCC    670
 671 TGA GGA ACA TGG AGG CCA CGC TAA TGA GTT ACT TCC AGA GTC TTC AAG    718
 719 AGT GCC AAC TGG GAC CAG GAC CCC AGA CCA CAG CCC CCC ACA CCG TCC    766
 767 TGG ACC TGG ATT CTG ACT GTG GTT CCA CTG TAC CCC TCA CCT TAA TCT    814
 815 CTG GTT CTA ACC AGA CCT GAG CCT AGA CTT CCA CTT TTT CCC TTA CCC    862
 863 CTG TGA GGG CCT GGG AAC ACT AGG TGG GCA GGG TTT GAG CCC ACA GGA    910
 911 CCT GCA CAC AAA CTT CCC CAC CTC TTG GAC TTG GGG ACA GGA TCT GTG    958
 959 CCT CAA CCC AGA CCA GCT TTG TAG GGA TAT GTT CCA AGA ACA GAG AAG    1006
1007 AGT CTT ATG GGG AAG GGG GAG GAA GGG AAG TAT GAA TAT TTA CCT CTG    1054
  1          Met Gly Lys Gly Glu Glu Gly Lys Tyr Glu Tyr Leu Pro Leu    14
1055 ACC AAT AAT AGA GGT GCC CTG GTC CCC AAA GAA ATT GAC TCC CGA ATT    1102
  15 Thr Asn Asn Arg Gly Ala Leu Val Pro Lys Glu Ile Asp Ser Arg Ile    30
1103 CCC TCC AAG CCT TAC CCA TAT AGC TTT TGT TTG TTT GTT TGT TTT CAG    1150
  31 Pro Ser Lys Pro Tyr Pro Tyr Ser Phe Cys Leu Phe Val Cys Phe Gln    46
1151 ACA AGG TCT TGT TCT GTC CAG TGC CGT GGC GTG ACC ACA GCT CAT GAC    1198
  47 Thr Arg Ser Cys Ser Val Gln Cys Arg Gly Val Thr Thr Ala His Asp    62
1199 AAC TTT GAT TTC CCC GGC CCA AGC GAG CCT CTC ATT CAG CCT CCT GAG    1246
  63 Asn Phe Asp Phe Pro Gly Pro Ser Glu Pro Leu Ile Gln Pro Pro Glu    78
1247 TGG CTG GGA CCA CAG ACG CCA CAC ACA GCT AAT TTT TAT GTA TTC GTT    1294
  79 Trp Leu Gly Pro Gln Thr Pro His Thr Ala Asn Phe Tyr Val Phe Val    94
1295 TTT ATT TTT TTG CAG AGA CAG GGT CTC CCT ATG TTG CCC AAG CTG GTC    1342
  95 Phe Ile Phe Leu Gln Arg Gln Gly Leu Pro Met Leu Pro Lys Leu Val    110
1343 TTG AAC TCC TGG GCT CAA GTG ATC CTC CTG CTT CAG CCT CCC AAA GTG    1390
 111 Leu Asn Ser Trp Ala Gln Val Ile Leu Leu Leu Gln Pro Pro Lys Val    126
1391 CTA GGA TTA TAG CCA CCG CAC CTC GTC TTG AAA TAG CCT TTT AAA TGT    1438
 127 Leu Gly Leu ***                                                    130
1439 TCA CCT CAG CTT GCC TCA CAG TGG GTC TGT TCC TGG TTT CCC AGA TGC    1486
1487 ATA AAG GAA GAC ATA TCC CTC CCC TGG GCA GCA AGG CTA CAA TGG GAG    1534
1535 GGA GGG AGA ACA TGG GAG CAT GTG AAT AAA ATG GCA TTA AAT ACT GAA    1582
1583 AAA AAA AAA AAA AAA A                                              1598
3. PP12100
A:核苷酸序列(SEQ ID NO:7)长度:1978个碱基
  1 GTGGGATTAC AGGCGTGAGC CACTGCACCC GACCCCAGAT ATGTTTTTAA GTCAGCCATT
 61 CCACATCGCT AAGTGCCCAT TGTGTAGAGA AGACTGATCT GAAATGCCTT GTGCCATGCA
121 CCTGGGGCCA GACCCAGGCT GTGATTAAAG GGCGGCTTCA TATTCACAGT TGTTGGAGTG
181 CTGTTAAATC TGGCTCTAAT CTAAAGTGTC TTTACTTTGA AAACCCCATG AATGTTTAGA
241 GACTCGCCTT TAAACAGTGA ACCTCTGCCC TGGTGAATGT CTTGGCCGTC TGCCTCGAGG
301 CCTAATTCAT GCTGGAGACA TCCTAGACAC TTTCTTTGCT GAATTTCATG ACCATAGCTA
361 TTCCTCTTTA CCAGACACAG CACCTTCTTC CTGGTCTTGG CTAGAGATGC AGCAGTATTT
421 GGGACTGACA TTACCTGAAG AGCACTTCCT ATCTAAGTAA CTGAACTACA GCACTGTCAC
481 AACGCTGGCA TGACATAGAA GGCTCGCCAC ATCCTTCATG TGTTTAGATT TACTCCTAGT
541 GTGCTGTGGG GCCAAATCGT GGACTCTTTT TTCCTATCTC TGTTCTTTCT AGATGATCTT
601 GTTCAGTCCC CTAGCTTTAA ATTCTATCTG TAGGCCAATG ACCTCCAAAT GTATATCCAT
661 AGCCCAGACC GACCCTCCAG ACTCCAGACT CACAGAGCTG ACTCTCTCAT ACAACTTCTC
721 TATTTGGAAT CCTAATGGGC ATCTCAAATC CAACATGAGG CTGCCAATGG CGCTCTTGCT
781 TTTTCCTCTC AAACCTTCCC TCTCTCATTT CCTCAACCCA GAAAATTGCT GCAGCACTTG
 841 ATCAGTGACT CAAGCCAGAA AGCTCAGCAG TCATCATCAG GTTCTCCCTC TTTCTCATGC
 901 CCAGGAGGAT GCGGGGGGCG GCCCCCTGCC CACACTCTGC TCCCTGGGAA GAAACGTGGG
 961 AAGCATGAGC CAGGCGTTGG GACCCAAGCC AAGTGTAGTC CCTGCCACAC CCATTTGCTT
1021 TCCTTCCCAC AAGCTCTCCA GTCAGGCCAC TCTCCCTCTC CACTACTCAC CCTCGGCCAA
1081 GCCGCACCTT GTCTGGCCTG GGTTACCACA GGGCCCTTGG CCTCTGTGGC TCGCATCCCT
1141 CTCCAGCCCA CTTCTATCAC AAAGGCCAGT GGCAGCCCCT GTCCTGCCTC TGCCCAGACC
1201 TTTAATGGCT TCCCACTGCT CTTGCAGCAA AACACATGTT CTTCACTGCC ACCTAGAATC
1261 ATCTCAGCAT TGCCTGCTTG TCCAAACCCA CCTTCTACAC CTCTCTATTT CTCTTACTGG
1321 CCTCCCTTCT GTTCCTTAAA TATACTAAGC CCTCCTGCAG GCCTGTACCT GCCTCCAGCT
1381 CTTTATGCAC CTGGCTCACT CTTGGTCTTT GGGTCCCAGC TCAAACGTCA CCTCTTTAGA
1441 GGGGCTGCCT TGTCTACCTA AATAAGCTCC TGCAAAAAAT GTCCAGCCAT TGGCACATAG
1501 TAGGCCCCCT TATCCATGGG TTCACGTCTG CAGGTTCAGC TACCTGCAGT CAATCACAGT
1561 CTGAAAATTG TGCAGTATTT TGAGAGAGAG ACCACATTGA CATAACTTTT ATTACAGTAT
1621 ATTGTTATAA TTGTCCTATT TTATTGTTAT TGTTGTTACT CTTACTGTGC CTAATTTATA
1681 AATTAGACTT TATCATGCTT TGGGAGGCAG AGGCAGAAGG TATCACTTGA GCCCGGGAGT
1741 TCAGCCAAGA CCAGCCTGGG CCACACAGCA AGACCCCATC TCTACAAAAA AATTAATAAA
1801 AGTAAAAAAT TAACCAAATG TGATGGTGCA CACCTGTGGT CCCAGCTACT CAGGAGGCTG
1861 AGGCAGGAGG ATCACTTGAG CTCAGGAGGT TGAGGCTGCA GGGTGAGCTG TGATTTTGCC
1921 ACAGTTCTAC AGCTTGGGTG AACAGAGGAA GACCCCTTTC AAAAAAAAAA AAAAAAAA
B:核苷酸序列(SEQ ID NO:8)长度:124个氨基酸
  1 MSQALGPKPS VVPATPICFP SHKLSSQATL PLHYSPSAKP HLVWPGLPQG PWPLWLASLS
 61 SPLLSQRPVA APVLPLPRPL MASHCSCSKT HVLHCHLESS QHCLLVQTHL LHLSISLTGL
121 PSVP
C.核苷酸及氨基酸组合序列(SEQ ID NO:9)克隆号和蛋白名称:PP12100
起始编码子:965 ATG 终止编码子:1337 TAA 蛋白质分子量:13279.95
   1   G TGG GAT TAC AGG CGT GAG CCA CTG CAC CCG ACC CCA GAT ATG TTT    46
  47 TTA AGT CAG CCA TTC CAC ATC GCT AAG TGC CCA TTG TGT AGA GAA GAC    94
  95 TGA TCT GAA ATG CCT TGT GCC ATG CAC CTG GGG CCA GAC CCA GGC TGT    142
 143 GAT TAA AGG GCG GCT TCA TAT TCA CAG TTG TTG GAG TGC TGT TAT ATC    190
 191 TGG CTC TAA TCT AAA GTG TCT TTA CTT TGA AAA CCC CAT GAA TGT TTA    238
 239 GAG ACT CGC CTT TAA ACA GTG AAC CTC TGC CCT GGT GAA TGT CTT GGC    286
 287 CGT CTG CCT CGA GGC CTA ATT CAT GCT GGA GAC ATC CTA GAC ACT TTC    334
 335 TTT GCT GAA TTT CAT GAC CAT AGC TAT TCC TCT TTA CCA GAC ACA GCA    382
 383 CCT TCT TCC TGG TCT TGG CTA GAG ATG CAG CAG TAT TTG GGA CTG ACA    430
 431 TTA CCT GAA GAG CAC TTC CTA TCT AAG TAA CTG AAC TAC AGC ACT GTC    478
 479 ACA ACG CTG GCA TGA CAT AGA AGG CTC GCC ACA TCC TTC ATG TGT TTA    526
 527 GAT TTA CTC CTA GTG TGC TGT GGG GCC AAA TCG TGG ACT CTT TTT TCC    574
 575 TAT CTC TGT TCT TTC TAG ATG ATC TTG TTC AGT CCC CTA GCT TTA AAT    622
 623 TCT ATC TGT AGG CCA ATG ACC TCC AAA TGT ATA TCC ATA GCC CAG ACC    670
 671 GAC CCT CCA GAC TCC AGA CTC ACA GAG CTG ACT CTC TCA TAC AAC TTC    718
 719 TCT ATT TGG AAT CCT AAT GGG CAT CTC AAA TCC AAC ATG AGG CTG CCA    766
 767 ATG GCG CTC TTG CTT TTT CCT CTC AAA CCT TCC CTC TCT CAT TTC CTC    814
 815 AAC CCA GAA AAT TGC TGC AGC ACT TGA TCA GTG ACT CAA GCC AGA AAG    862
 863 CTC AGC AGT CAT CAT CAG GTT CTC CCT CTT TCT CAT GCC CAG GAG GAT    910
 911 GCG GGG GGC GGC CCC CTG CCC ACA CTC TGC TCC CTG GGA AGA AAC GTG    958
 959 GGA AGC ATG AGC CAG GCG TTG GGA CCC AAG CCA AGT GTA GTC CCT GCC    1006
   1         Met Ser Gln Ala Leu Gly Pro Lys Pro Ser Val Val Pro Ala    14
1007 ACA CCC ATT TGC TTT CCT TCC CAC AAG CTC TCC AGT CAG GCC ACT CTC    1054
  15 Thr Pro Ile Cys Phe Pro Ser His Lys Leu Ser Ser Gln Ala Thr Leu      30
1055 CCT CTC CAC TAC TCA CCC TCG GCC AAG CCG CAC CTT GTC TGG CCT GGG      1102
  31 Pro Leu His Tyr Ser Pro Ser Ala Lys Pro His Leu Val Trp Pro Gly      46
1103 TTA CCA CAG GGC CCT TGG CCT CTG TGG CTC GCA TCC CTC TCC AGC CCA      1150
  47 Leu Pro Gln Gly Pro Trp Pro Leu Trp Leu Ala Ser Leu Ser Ser Pro      62
1151 CTT CTA TCA CAA AGG CCA GTG GCA GCC CCT GTC CTG CCT CTG CCC AGA      1198
  63 Leu Leu Ser Gln Arg Pro Val Ala Ala Pro Val Leu Pro Leu Pro Arg      78
1199 CCT TTA ATG GCT TCC CAC TGC TCT TGC AGC AAA ACA CAT GTT CTT CAC      1246
  79 Pro Leu Met Ala Ser His Cys Ser Cys Ser Lys Thr His Val Leu His      94
1247 TGC CAC CTA GAA TCA TCT CAG CAT TGC CTG CTT GTC CAA ACC CAC CTT      1294
  95 Cys His Leu Glu Ser Ser Gln His Cys Leu Leu Val Gln Thr His Leu      110
1295 CTA CAC CTC TCT ATT TCT CTT ACT GGC CTC CCT TCT GTT CCT TAA ATA      1342
 111 Leu His Leu Ser Ile Ser Leu Thr Gly Leu Pro Ser Val Pro ***          125
1343 TAC TAA GCC CTC CTG CAG GCC TGT ACC TGC CTC CAG CTC TTT ATG CAC      1390
1391 CTG GCT CAC TCT TGG TCT TTG GGT CCC AGC TCA AAC GTC ACC TCT TTA      1438
1439 GAG GGG CTG CCT TGT CTA CCT AAA TAA GCT CCT GCA AAA AAT GTC CAG      1486
1487 CCA TTG GCA CAT AGT AGG CCC CCT TAT CCA TGG GTT CAC GTC TGC AGG      1534
1535 TTC AGC TAC CTG CAG TCA ATC ACA GTC TGA AAA TTG TGC AGT ATT TTG      1582
1583 AGA GAG AGA CCA CAT TGA CAT AAC TTT TAT TAC AGT ATA TTG TTA TAA      1630
1631 TTG TCC TAT TTT ATT GTT ATT GTT GTT ACT CTT ACT GTG CCT AAT TTA      1678
1679 TAA ATT AGA CTT TAT CAT GCT TTG GGA GGC AGA GGC AGA AGG TAT CAC      1726
1727 TTG AGC CCG GGA GTT CAG CCA AGA CCA GCC TGG GCC ACA CAG CAA GAC      1774
1775 CCC ATC TCT ACA AAA AAA TTA ATA AAA GTA AAA AAT TAA CCA AAT GTG      1822
1823 ATG GTG CAC ACC TGT GGT CCC AGC TAC TCA GGA GGC TGA GGC AGG AGG      1870
1871 ATC ACT TGA GCT CAG GAG GTT GAG GCT GCA GGG TGA GCT GTG ATT TTG      1918
1919 CCA CAG TTC TAC AGC TTG GGT GAA CAG AGG AAG ACC CCT TTC AAA AAA      1966
1967 AAA AAA AAA AAA                                                      1978
4.PP12488
A:核苷酸序列(SEQ ID NO:10)长度:2371个碱基
   1 GGTGAGCGCC ACCCGGAGTC CCGCGCGCAA CTTTCAGGGC GCACTCGGCG GGGCGGCTGC
  61 GCGGCTGCCG GGACTCGGCG CGGGACTGCA TGGAGGCCAA GGAGAAGCAG CATCTGTTGG
 121 ACGCCAGGCC GGCAATCCGG TCATACACGG GATCTCTGTG GCAGGAAGGG GCTGGCTGGA
 181 TTCCTCTGCC CCGACCTGGC CTGGACTTGC AGGCCATTGA GCTGGCTGCC CAGAGCAACC
 241 ATCACTGCCA TGCTCAGAAG GGTCCTGACA GTCACTGTGA CCCCAAGAAG GGGAAGGCCC
 301 AGCGCCAGCT GTATGTAGCC TCTGCCATCT GCCTGTTGTT CATGATCGGA GAAGTCGTTG
 361 GTGGGTACCT GGCACACAGC TTGGCTGTCA TGACTGACGC AGCACACCTG CTCACTGACT
 421 TTGCCAGCAT GCTCATCAGC CTCTTCTCCC TCTGGATGTC CTCCCGGCCA GCCACCAAGA
 481 CCATGAACTT TGGCTGGCAG AGAGCTGAGA TCTTGGGAGC CCTGGTCTCT GTACTGTCCA
 541 TCTGGGTCGT GACGGGGGTA CTGGTGTACC TGGCTGTGGA GCGGCTGATC TCTGGGGACT
 601 ATGAAATTGA CGGGGGGACC ATGCTGATCA CGTCGGGCTG CGCTGTGGCT GTGAACATCA
 661 TAATGGGGTT GACCCTTCAC CAGTCTGGCC ATGGGCACAG CCACGGCACC ACCAACCAGC
  72 AGGAGGAGAA CCCCAGCGTC CGAGCTGCCT TCATCCATGT GATCGGCGAC TTTATGCAGA
 781 GCATGGGTGT CCTAGTGGCA GCCTATATTT TATACTTCAA GCCAGAATAC AAGTATGTAG
 841 ACCCCATCTG CACCTTCGTC TTCTCCATCC TGGTCCTGGG GACAACCTTG ACCATCCTGA
 901 GAGATGTGAT CCTGGTGTTG ATGGAAGGGA CCCCCAAGGG CGTTGACTTC ACAGCTGTTC
 961 GTGATCTGCT GCTGTCGGTG GAGGGGGTAG AAGCCCTGCA CAGCCTGCAT ATCTGGGCAC
1021 TGACGGTGGC CCAGCCTGTT CTGTCTGTCC ACATCGCCAT TGCTCAGAAT ACAGACGCCC
1081 AGGCTGTGCT GAAGACAGCC AGCAGCCGCC TCCAAGGGAA GTTCCACTTC CACACCGTGA
1141 CCATCCAGAT CGAGGACTAC TCGGAGGACA TGAAGGACTG TCAGGCATGC CAGGGCCCCT
1201 CAGACTGACT GCTCAGCCAG GCACCAACTG GGGCATGAAC AGGACCTGCA GGTGGCTGGA
1261 CTGAGTGTCC CCCAGGCCCA GCCAGGACTT TGCCTACCCC AGCTGTGTTA TAAACCAGGT
1321 CCCCCTCCTG ACCTCTGCCC CACTCCAGGA ATGGAGCTCT TCCCAGCCTC CCATCTGACT
1381 ACAGCCAGGG TGGGGACTCA GCGGGTATAA AGCTAGTGTG ACCCTGCTCT TCCAGCTCCT
1441 GGGCCAGCTC TGGAAGGGCT GTATTTGGGC CTAATCCTCA GCAACTGTTC TACCACTCGC
1501 AGGGGCAAAG GTGGTGAGCC ACGGGACGTC CAAGGGGAGG CTGGCCCCAG CGCGCCCATA
1561 CTGCCTGCCT CATGCCCCAT TCTCAGCCTG GCTGGCCTTT GCCTTTATGA ATCTGAGCCC
1621 CTCCATCTGC CTATAGCAAT AGGCACGGGG GTGAGGACCC TCACACTCTC ATTTGAGCCT
1681 CCCTGAGGCA GGGAGCCAGG AGGCACCTGA GGCCTATCTG TGCCTTAGTC ACTTCAGCTA
1741 TGAGCCAAAT GTTCCCTTTC CTGGAGGGGA GAGGCTTCTT ACTAGGTAAG AGACAGGTTT
1801 CCTCTTTCCT TATTTCCTCA GCTGTGCCAA CACAAAAAAC AACTTTGGCA CAGGTGGTGG
1861 GCAGGGGGTA GAGAGATTTC AGCTTGGGTT CTGCACTAAC AGCCTCCAAG CCCCCTGGCA
1921 CTTCTGTTGC CCTGAGAGTG TCCCAGGGGA TTCAGAGTCT CCAGAAAGAT ATGGCTGGGC
1981 CAACTCTGTT GCCTACCTGG CCTGACCCAG TCGGAGCCTG ACATGGTGGA GGGAAAGGGA
2041 GACAAGTGGG GCTGCACTCG GTCCAGAGGC CAGCTAGGAG GGAAACCGCA GCTTCCTGGG
2101 GCTTGTGTGT GAAGATTCCT GACTTAGGGG TGGCTTTTGT TTACAAGATG CAAGAGGGGA
2161 AACCTGTCCC CGACTCATCG AGACAACATG CCCAGTTATC AGGGAGTCCT GTGTCACAAG
2221 GTCTGTCTCT GCCATTGTAA GCAAGTGCCT TGGGCGAGCT GGCCTCTGCC CCACAGTTTC
2281 ATCTGTACAC CGACAGGGTT GATGCCTCCC TCACAGGGTT GAGAACAAGA GCCAGTTGGC
2341 CAAGTAAAAA AAAAAAAAAA AAAAAAAAAA A
B:核苷酸序列  (SEQ ID NO:11)  长度:372个氨基酸
  1 MEAKEKQHLL DARPAIRSYT GSLWQEGAGW IPLPRPGLDL QAIELAAQSN HHCHAQKGPD
 61 SHCDPKKGKA QRQLYVASAI CLLFMIGEVV GGYLAHSLAV MTDAAHLLTD FASMLISLFS
121 LWMSSRPATK TMNFGWQRAE ILGALVSVLS IWVVTGVLVY LAVERLISGD YEIDGGTMLI
181 TSGCAVAVNI IMGLTLHQSG HGHSHGTTNQ QEENPSVRAA FIHVIGDFMQ SMGVLVAAYI
241 LYFKPEYKYV DPICTFVFSI LVLGTTLTIL RDVILVLMEG TPKGVDFTAV RDLLLSVEGV
301 EALHSLHIWA LTVAQPVLSV HIAIAQNTDA QAVLKTASSR LQGKFHFHTV TIQIEDYSED
361 MKDCQACQGP SD
C.核苷酸及氨基酸组合序列(SEQ ID NO:12)克隆号和蛋白名称:PP12488
起始编码子:90 ATG  终止编码子:1206 TGA  蛋白质分子量:40561.73
  1  GG TGA GCG CCA CCC GGA GTC CCG CGC GCA ACT TTC AGG GCG CAC TCG    47
 48 GCG GGG CGG CTG CGC GGC TGC CGG GAC TCG GCG CGG GAC TGC ATG GAG    95
  1                                                         Met Glu    2
 96 GCC AAG GAG AAG CAG CAT CTG TTG GAC GCC AGG CCG GCA ATC CGG TCA    143
  3 Ala Lys Glu Lys Gln His Leu Leu Asp Ala Arg Pro Ala Ile Arg Ser    18
144 TAC ACG GGA TCT CTG TGG CAG GAA GGG GCT GGC TGG ATT CCT CTG CCC    191
 19 Tyr Thr Gly Ser Leu Trp Gln Glu Gly Ala Gly Trp Ile Pro Leu Pro    34
192 CGA CCT GGC CTG GAC TTG CAG GCC ATT GAG CTG GCT GCC CAG AGC AAC    239
 35 Arg Pro Gly Leu Asp Leu Gln Ala Ile Glu Leu Ala Ala Gln Ser Asn    50
240 CAT CAC TGC CAT GCT CAG AAG GGT CCT GAC AGT CAC TGT GAC CCC AAG    287
 51 His His Cys His Ala Gln Lys Gly Pro Asp Ser His Cys Asp Pro Lys    66
288 AAG GGG AAG GCC CAG CGC CAG CTG TAT GTA GCC TCT GCC ATC TGC CTG    335
 67 Lys Gly Lys Ala Gln Arg Gln Leu Tyr Val Ala Ser Ala Ile Cys Leu    82
336 TTG TTC ATG ATC GGA GAA GTC GTT GGT GGG TAC CTG GCA CAC AGC TTG    383
 83 Leu Phe Met Ile Gly Glu Val Val Gly Gly Tyr Leu Ala His Ser Leu    98
384 GCT GTC ATG ACT GAC GCA GCA CAC CTG CTC ACT GAC TTT GCC AGC ATG    431
  99 Ala Val Met Thr Asp Ala Ala His Leu Leu Thr Asp Phe Ala Ser Met    114
 432 CTC ATC AGC CTC TTC TCC CTC TGG ATG TCC TCC CGG CCA GCC ACC AAG    479
 115 Leu Ile Ser Leu Phe Ser Leu Trp Met Ser Ser Arg Pro Ala Thr Lys    130
 480 ACC ATG AAC TTT GGC TGG CAG AGA GCT GAG ATC TTG GGA GCC CTG GTC    527
 131 Thr Met Asn Phe Gly Trp Gln Arg Ala Glu Ile Leu Gly Ala Leu Val    146
 528 TCT GTA CTG TCC ATC TGG GTC GTG ACG GGG GTA CTG GTG TAC CTG GCT    575
 147 Ser Val Leu Ser Ile Trp Val Val Thr Gly Val Leu Val Tyr Leu Ala    162
 576 GTG GAG CGG CTG ATC TCT GGG GAC TAT GAA ATT GAC GGG GGG ACC ATG    623
 163 Val Glu Arg Leu Ile Ser Gly Asp Tyr Glu Ile Asp Gly Gly Thr Met    178
 624 CTG ATC ACG TCG GGC TGC GCT GTG GCT GTG AAC ATC ATA ATG GGG TTG    671
 179 Leu Ile Thr Ser Gly Cys Ala Val Ala Val Asn Ile Ile Met Gly Leu    194
 672 ACC CTT CAC CAG TCT GGC CAT GGG CAC AGC CAC GGC ACC ACC AAC CAG    719
 195 Thr Leu His Gln Ser Gly His Gly His Ser His Gly Thr Thr Asn Gln    210
 720 CAG GAG GAG AAC CCC AGC GTC CGA GCT GCC TTC ATC CAT GTG ATC GGC    767
 211 Gln Glu Glu Asn Pro Ser Val Arg Ala Ala Phe Ile His Val Ile Gly    226
 768 GAC TTT ATG CAG AGC ATG GGT GTC CTA GTG GCA GCC TAT ATT TTA TAC    815
 227 Asp Phe Met Gln Ser Met Gly Val Leu Val Ala Ala Tyr Ile Leu Tyr    242
 816 TTC AAG CCA GAA TAC AAG TAT GTA GAC CCC ATC TGC ACC TTC GTC TTC    863
 243 Phe Lys Pro Glu Tyr Lys Tyr Val Asp Pro Ile Cys Thr Phe Val Phe    258
 864 TCC ATC CTG GTC CTG GGG ACA ACC TTG ACC ATC CTG AGA GAT GTG ATC    911
 259 Ser Ile Leu Val Leu Gly Thr Thr Leu Thr Ile Leu Arg Asp Val Ile    274
 912 CTG GTG TTG ATG GAA GGG ACC CCC AAG GGC GTT GAC TTC ACA GCT GTT    959
 275 Leu Val Leu Met Glu Gly Thr Pro Lys Gly Val Asp Phe Thr Ala Val    290
 960 CGT GAT CTG CTG CTG TCG GTG GAG GGG GTA GAA GCC CTG CAC AGC CTG    1007
 291 Arg Asp Leu Leu Leu Ser Val Glu Gly Val Glu Ala Leu His Ser Leu    306
1008 CAT ATC TGG GCA CTG ACG GTG GCC CAG CCT GTT CTG TCT GTC CAC ATC    1055
 307 His Ile Trp Ala Leu Thr Val Ala Gln Pro Val Leu Ser Val His Ile    322
1056 GCC ATT GCT CAG AAT ACA GAC GCC CAG GCT GTG CTG AAG ACA GCC AGC    1103
 323 Ala Ile Ala Gln Asn Thr Asp Ala Gln Ala Val Leu Lys Thr Ala Ser    338
1104 AGC CGC CTC CAA GGG AAG TTC CAC TTC CAC ACC GTG ACC ATC CAG ATC    1151
 339 Ser Arg Leu Gln Gly Lys Phe His Phe His Thr Val Thr Ile Gln Ile    354
1152 GAG GAC TAC TCG GAG GAC ATG AAG GAC TGT CAG GCA TGC CAG GGC CCC    1199
 355 Glu Asp Tyr Ser Glu Asp Met Lys Asp Cys Gln Ala Cys Gln Gly Pro    370
1200 TCA GAC TGA CTG CTC AGC CAG GCA CCA ACT GGG GCA TGA ACA GGA CCT    1247
 371 Ser Asp ***                                                        373
1248 GCA GGT GGC TGG ACT GAG TGT CCC CCA GGC CCA GCC AGG ACT TTG CCT    1295
1296 ACC CCA GCT GTG TTA TAA ACC AGG TCC CCC TCC TGA CCT CTG CCC CAC    1343
1344 TCC AGG AAT GGA GCT CTT CCC AGC CTC CCA TCT GAC TAC AGC CAG GGT    1391
1392 GGG GAC TCA GCG GGT ATA AAG CTA GTG TGA CCC TGC TCT TCC AGC TCC    1439
1440 TGG GCC AGC TCT GGA AGG GCT GTA TTT GGG CCT AAT CCT CAG CAA CTG    1487
1488 TTC TAC CAC TCG CAG GGG CAA AGG TGG TGA GCC ACG GGA CGT CCA AGG    1535
1536 GGA GGC TGG CCC CAG CGC GCC CAT ACT GCC TGC CTC ATG CCC CAT TCT    1583
1584 CAG CCT GGC TGG CCT TTG CCT TTA TGA ATC TGA GCC CCT CCA TCT GCC    1631
1632 TAT AGC AAT AGG CAC GGG GGT GAG GAC CCT CAC ACT CTC ATT TGA GCC    1679
1680 TCC CTG AGG CAG GGA GCC AGG AGG CAC CTG AGG CCT ATC TGT GCC TTA    1727
1728 GTC ACT TCA GCT ATG AGC CAA ATG TTC CCT TTC CTG GAG GGG AGA GGC    1775
1776 TTC TTA CTA GGT AAG AGA CAG GTT TCC TCT TTC CTT ATT TCC TCA GCT    1823
1824 GTG CCA ACA CAA AAA ACA ACT TTG GCA CAG GTG GTG GGC AGG GGG TAG    1871
1872 AGA GAT TTC AGC TTG GGT TCT GCA CTA ACA GCC TCC AAG CCC CCT GGC    1919
1920 ACT TCT GTT GCC CTG AGA GTG TCC CAG GGG ATT CAG AGT CTC CAG AAA    1967
1968 GAT ATG GCT GGG CCA ACT CTG TTG CCT ACC TGG CCT GAC CCA GTC GGA    2015
2016 GCC TGA CAT GGT GGA GGG AAA GGG AGA CAA GTG GGG CTG CAC TCG GTC    2063
2064 CAG AGG CCA GCT AGG AGG GAA ACC GCA GCT TCC TGG GGC TTG TGT GTG    2111
2112 AAG ATT CCT GAC TTA GGG GTG GCT TTT GTT TAC AAG ATG CAA GAG GGG    2159
2160 AAA CCT GTC CCC GAC TCA TCG AGA CAA CAT GCC CAG TTA TCA GGG AGT    2207
2208 CCT GTG TCA CAA GGT CTG TCT CTG CCA TTG TAA GCA AGT GCC TTG GGC    2255
2256 GAG CTG GCC TCT GCC CCA CAG TTT CAT CTG TAC ACC GAC AGG GTT GAT    2303
2304 GCC TCC CTC ACA GGG TTG AGA ACA AGA GCC AGT TGG CCA AGT AAA AAA    2351
2352 AAA AAA AAA AAA AAA AAA AA                                         2371
5.PP12494
A:核苷酸序列(SEQ ID NO:13)长度:3401个碱基
   1 GCTTGACCCA TCCTCTAC TTAGTCACTCTT ATAGAGCCCT GCATTTTCTT TTGTAGCATT
  61 TATGACATGT GTAATGTTAC ATTTGTTTGT GGGATTATTT AAGGAATGTC TGTCATGTGA
 121 GACAATAAGC TTTATGAGTA CAGGCACCTC TTCTGTCTTA TTTCCTATGC CCCAGCACAG
 181 TCCCTGACAT CTAGTAGACC TTCAAAAAGT TTTATGGAAT GAATGAGTGA ACAAATGATG
 241 CAAAGTGTTG GTTGCAGGAT ATCTCTCTCA GTCTTCCAAT TCTTAGGAGA TCAGAGGCAA
 301 GAGCTGGTGG CCTTTCACCG CCTGGCTACA GTGTACTACT CCCTGCACAT GTATGAGATG
 361 GCTGAGGACT GCTACCTGAA GACCCTGTCC CTCTGTCCAC CATGGCTGCA GAGTCCCAAG
 421 GAGGCCCTGT ACTATGCCAA GGTGTATTAT CGCCTGGGCA GACTCACCTT CTGCCAGCTG
 481 AAGGTAAGAG CCAGACTTCC CAGATTTCCT GACAGCCACC ACCCAACCAT TCTCCTTCCT
 541 GACTCAAAGA CAATGAGGAG CCTTTGTGGT GGAGCTGAGA AAACCAGAGT GCCAAGATGA
 601 GAAGTCTTGT CTCATAGGGT GAGGAGTGGC TTTACAGGGG ACATGGAAGC TCTTTCCACT
 661 TAACCCTGCT GAAGATCTCA AAGGTGCTCC CATCTTCGCT GAGGAGTAGA CCATGGTTCC
 721 TCTTTCTCCT TGCCTTGCCA CCATGTCTGT GGCTTCTTTA TCTGTCAGAT ACTACAGGCA
 781 CATTGCCTGT AAGTCTCTCA AGGGCCTATG GAAATATACA AGACCCCAAA ACAAAAGAAC
 841 TATAAGGTCT AAAATGAAGA TCAAAATGAA TACTTAAGAG TTTGTCCATA AAATGTTACA
 901 GACCAACTAG TCAACTGCAA CTCATTTCTT ATAAAGTAAT GTAAAGCTAC ATTTTATGAG
 961 AAATGTGGGT GCATATTAAC ATGTTTGAGA TAACGAGGTA TGGGGCCTTT AAACTAAGTA
1021 TACTTAGATC TTAAGAAGGT TTTATCCCTG CTTCTCTTGC TTGCTGAATC TAGAACTTCT
1081 TTTTTTGCTT GCTTGCTTTT TTTTTGGGAC AGGGTCTTGC TGTGTAGCCC AGGCTGGAGT
1141 AGCATGGCTC AATCTTGGCT CACTACAGCC TCTGCATCTG GGGCTCAAGC AATCCTTCTA
1201 CTTCAGCCTC CTCAGAAGCT GGGACCACAG GTGCACACCA CCACACCTGG CTAATTTTTG
1261 TATTTTTTTG TAAAGATGGG GTTTCATCAT GTTGCCTGTC TCGAACTGCT GGACTCAAGC
1321 AATCTGCCAA TCTTGGCCTC CCAAAATGGT GGGATTACAG GTGTAGTAGG CCATTATGCC
1381 CACCCCAGAA CTTCTTATTA TTTTGGTGAC TTCTAGAGTT GTGTTGGTTG CAAATCTCTG
1441 TTACAACCCT GACCCCCAAA CTGTGTCCCT AGGATTGGCT TCCTTTTACT AGAGGTCCCT
1501 GTCCCCTGAA GCACAACCCT TAATCTCTTA ATATAGTGGC TTCTGAGTCA CTCCTGTGTT
1561 TGGCCCCCAG GGAACCCTCA GGCAGCTCTG CTGTCCTTTT CTTATTTGCC AGGCTTTGCT
1621 TCTGGCCTGA ATTAATTACT GACTTATGAG GGTTAATGGA AACCAGGCAG CCTTTTTGAG
1681 TCTCACCCAA AGAAGCATCT GTTTCTCATC TTTACCATGT AGGGAGGGCC GGGGGTAGTG
1741 AAGCACCCTC TAGCCATCTT GCCTCTGCCC CATAGCTCCC AGTAAGTGGT TCAGGGACAA
1801 AGTGTGTGAT CTGATCATGT CAACCAAGAA CTCCACGGAT TGTAAAGGGA AAAACTCAGT
1861 TCAAACTTCC TTAAGCAAAA AAGGCAACTT ACTGGCTCAA AGAATGTGAA GGCTGAGCTA
1921 CAAATTTAAC TGCAGATAGC TCTGGATCCT GTTTCTCAAT CATCATCAGG GATTTCCCCA
1981 CCTCTCATTG TATTCCTTGA CTCTGTATGT TTCTACTTTG CTTTGTTTCT TGGCCTTTTC
2041 CCCTTCTAGC TACTGGCAGG TTCAAGTCCA CCTCTGAACC TGCCACTTCA GAGGGACTAT
2101 TTTCCTTATT GAGACACAGT GGAAAGTCCC AGGGAGTGGC AGATGTAGGC CAAGTTTGGG
2161 TCATGTACAC ATCCCTGAAG CACTGTGCCC AGGGCAATGA TGTTTCATGA TTGGCTGAGC
2221 CTCAGTAAGG GACCACCTCT GTGCCTGGAG TGCAGGGCAC TGTGATTAGC AATGTCCCAA
2281 GGACCACAGT GGAGGGAGAG AGGGGCTCCC TAAGGACTCA GGAGATGGGG ATTGGATGTT
2341 GGGCAAACAA ACAAACAAAC AAACAAACAA AAAAAACTAG AGTGGCCAGC ACAGCCTCCT
2401 AGCCTGTCCT GGAAGTGTTT GCTAATGCTG TCTCTTCTTT GCCCCCATAC CACGGGGTTA
2461 GGATGCCCAT GATGCCACTG AGTACTTCCT TCTGGCCCTG GCAGCAGCGG TCCTGCTGGG
2521 TGATGAGGAG CTTCAGGACA CCATTAGGAG CAGGCTGGAC AACATCTGCC AGAGCCCCCT
2581 GTGGCACAGC AGGCCTCCGG GTGCTCCTCA GAGAGGGCGC GGTGGCTGAG TGGTGGTGGC
2641 CTGGCCCTCT GAGGAAAGCT GTCCTGTCTC TGGACATTGT GCATGGCCAG ACTCTGACCC
2701 CACTGCCCTA GGCTCTTAAA TACTCATTGG GAGGGTCCGA GTCCTTACCT GCCTAGCCCC
2761 CTCATTTCAC AAGAAGAAGA ATGAAGTCCA GGAGGAGAAG GGCTCATTGC AGGCCACAGA
2821 AAGATTTGAT GGTGCAGCGA TGAGAATTCC TGGTTCCAGG CTTTGCATCT GGAGCCTTTA
2881 CCGGTTGACT GTTGCCTTCC ACACAAACAG CCTCTGAAAA GCACTTTCTC CATACATAAT
2941 TCTGGAGAAG ATGAGGGATC TTGCCCTCCA GGAGCCTTCC TTCCTCCCCC AATGAGGAAA
3001 TCAGTCACTG CACTGGTGCA AAGGCAAGCA GATTGGAATT TGTGCTCTTC ACCGATTTTC
3061 TCAGGGAAAG ACCCCTTCCC CTTGCCAGCA GAGGAACCTG TAGTTTTTTC CATTTCTTTC
3121 TTCAGAACCA AAGTATGTAT CACTCCTCAT GCTCACAGGG ATTGACAGGA GAGAATTCAC
3181 CAGGATCTTA GCTCAAAAGA CACAGCCTCA GAATGGCCAG ATGGATTGCA CGAAACCTGA
3241 CTTGGATTCA CCATCTTCCT CCTGCCATAA GGCTGTGCTC CCACATAACC TCCCAGAAGC
3301 TCCAGGGAAG CTTTCCAAGA GCAAAGGCTT GGAAATTGAA TGTTAAGAAA ATTATGACAT
3361 AAATTACATG TAAATAGTGA AAAAAAAAAA AAAAAAAAAA A
B:核苷酸序列(SEQ ID NO:14)长度:125个氨基酸
  1 MSEQMMQSVG CRISLSVFQF LGDQRQELVA FHRLATVYYS LHMYEMAEDC YLKTLSLCPP
 61 WLQSPKEALY YAKVYYRLGR LTFCQLKVRA RLPRFPDSHH PTILLPDSKT MRSLCGGAEK
121 TRVPR
C.核苷酸及氨基酸组合序列(SEQ ID NO:15)克隆号和蛋白名称:PP12494
起始编码子:223 ATG 终止编码子:598 TGA 蛋白质分子量:14596.40
  1 GCT TGA CCC ATC CTC TAC TTA GTC ACT CTT ATA GAG CCC TGC ATT TTC    48
 49 TTT TGT AGC ATT TAT GAC ATG TGT AAT GTT ACA TTT GTT TGT GGG ATT    96
 97 ATT TAA GGA ATG TCT GTC ATG TGA GAC AAT AAG CTT TAT GAG TAC AGG    144
145 CAC CTC TTC TGT CTT ATT TCC TAT GCC CCA GCA CAG TCC CTG ACA TCT    192
193 AGT AGA CCT TCA AAA AGT TTT ATG GAA TGA ATG AGT GAA CAA ATG ATG    240
  1                                         Met Ser Glu Gln Met Met    6
241 CAA AGT GTT GGT TGC AGG ATA TCT CTC TCA GTC TTC CAA TTC TTA GGA    288
  7 Gln Ser Val Gly Cys Arg Ile Ser Leu Ser Val Phe Gln Phe Leu Gly    22
289 GAT CAG AGG CAA GAG CTG GTG GCC TTT CAC CGC CTG GCT ACA GTG TAC    336
 23 Asp Gln Arg Gln Glu Leu Val Ala Phe His Arg Leu Ala Thr Val Tyr    38
337 TAC TCC CTG CAC ATG TAT GAG ATG GCT GAG GAC TGC TAC CTG AAG ACC    384
 39 Tyr Ser Leu His Met Tyr Glu Met Ala Glu Asp Cys Tyr Leu Lys Thr    54
385 CTG TCC CTC TGT CCA CCA TGG CTG CAG AGT CCC AAG GAG GCC CTG TAC    432
 55 Leu Ser Leu Cys Pro Pro Trp Leu Gln Ser Pro Lys Glu Ala Leu Tyr    70
433 TAT GCC AAG GTG TAT TAT CGC CTG GGC AGA CTC ACC TTC TGC CAG CTG    480
 71 Tyr Ala Lys Val Tyr Tyr Arg Leu Gly Arg Leu Thr Phe Cys Gln Leu    86
481 AAG GTA AGA GCC AGA CTT CCC AGA TTT CCT GAC AGC CAC CAC CCA ACC    528
 87 Lys Val Arg Ala Arg Leu Pro Arg Phe Pro Asp Ser His His Pro Thr    102
529 ATT CTC CTT CCT GAC TCA AAG ACA ATG AGG AGC CTT TGT GGT GGA GCT    576
 103 Ile Leu Leu Pro Asp Ser Lys Thr Met Arg Ser Leu Cys Gly Gly Ala    118
 577 GAG AAA ACC AGA GTG CCA AGA TGA GAA GTC TTG TCT CAT AGG GTG AGG    624
 119 Glu Lys Thr Arg Val Pro Arg ***                                    126
 625 AGT GGC TTT ACA GGG GAC ATG GAA GCT CTT TCC ACT TAA CCC TGC TGA    672
 673 AGA TCT CAA AGG TGC TCC CAT CTT CGC TGA GGA GTA GAC CAT GGT TCC    720
 721 TCT TTC TCC TTG CCT TGC CAC CAT GTC TGT GGC TTC TTT ATC TGT CAG    768
 769 ATA CTA CAG GCA CAT TGC CTG TAA GTC TCT CAA GGG CCT ATG GAA ATA    816
 817 TAC AAG ACC CCA AAA CAA AAG AAC TAT AAG GTC TAA AAT GAA GAT CAA    864
 865 AAT GAA TAC TTA AGA GTT TGT CCA TAA AAT GTT ACA GAC CAA CTA GTC    912
 913 AAC TGC AAC TCA TTT CTT ATA AAG TAA TGT AAA GCT ACA TTT TAT GAG    960
 961 AAA TGT GGG TGC ATA TTA ACA TGT TTG AGA TAA CGA GGT ATG GGG CCT    1008
1009 TTA AAC TAA GTA TAC TTA GAT CTT AAG AAG GTT TTA TCC CTG CTT CTC    1056
1057 TTG CTT GCT GAA TCT AGA ACT TCT TTT TTT GCT TGC TTG CTT TTT TTT    1104
1105 TGG GAC AGG GTC TTG CTG TGT AGC CCA GGC TGG AGT AGC ATG GCT CAA    1152
1153 TCT TGG CTC ACT ACA GCC TCT GCA TCT GGG GCT CAA GCA ATC CTT CTA    1200
1201 CTT CAG CCT CCT CAG AAG CTG GGA CCA CAG GTG CAC ACC ACC ACA CCT    1248
1249 GGC TAA TTT TTG TAT TTT TTT GTA AAG ATG GGG TTT CAT CAT GTT GCC    1296
1297 TGT CTC GAA CTG CTG GAC TCA AGC AAT CTG CCA ATC TTG GCC TCC CAA    1344
1345 AAT GGT GGG ATT ACA GGT GTA GTA GGC CAT TAT GCC CAC CCC AGA ACT    1392
1393 TCT TAT TAT TTT GGT GAC TTC TAG AGT TGT GTT GGT TGC AAA TCT CTG    1440
1441 TTA CAA CCC TGA CCC CCA AAC TGT GTC CCT AGG ATT GGC TTC CTT TTA    1488
1489 CTA GAG GTC CCT GTC CCC TGA AGC ACA ACC CTT AAT CTC TTA ATA TAG    1536
1537 TGG CTT CTG AGT CAC TCC TGT GTT TGG CCC CCA GGG AAC CCT CAG GCA    1584
1585 GCT CTG CTG TCC TTT TCT TAT TTG CCA GGC TTT GCT TCT GGC CTG AAT    1632
1633 TAA TTA CTG ACT TAT GAG GGT TAA TGG AAA CCA GGC AGC CTT TTT GAG    1680
1681 TCT CAC CCA AAG AAG CAT CTG TTT CTC ATC TTT ACC ATG TAG GGA GGG    1728
1729 CCG GGG GTA GTG AAG CAC CCT CTA GCC ATC TTG CCT CTG CCC CAT AGC    1776
1777 TCC CAG TAA GTG GTT CAG GGA CAA AGT GTG TGA TCT GAT CAT GTC AAC    1824
1825 CAA GAA CTC CAC GGA TTG TAA AGG GAA AAA CTC AGT TCA AAC TTC CTT    1872
1873 AAG CAA AAA AGG CAA CTT ACT GGC TCA AAG AAT GTG AAG GCT GAG CTA    1920
1921 CAA ATT TAA CTG CAG ATA GCT CTG GAT CCT GTT TCT CAA TCA TCA TCA    1968
1969 GGG ATT TCC CCA CCT CTC ATT GTA TTC CTT GAC TCT GTA TGT TTC TAC    2016
2017 TTT GCT TTG TTT CTT GGC CTT TTC CCC TTC TAG CTA CTG GCA GGT TCA    2064
2065 AGT CCA CCT CTG AAC CTG CCA CTT CAG AGG GAC TAT TTT CCT TAT TGA    2112
2113 GAC ACA GTG GAA AGT CCC AGG GAG TGG CAG ATG TAG GCC AAG TTT GGG    2160
2161 TCA TGT ACA CAT CCC TGA AGC ACT GTG CCC AGG GCA ATG ATG TTT CAT    2208
2209 GAT TGG CTG AGC CTC AGT AAG GGA CCA CCT CTG TGC CTG GAG TGC AGG    2256
2257 GCA CTG TGA TTA GCA ATG TCC CAA GGA CCA CAG TGG AGG GAG AGA GGG    2304
2305 GCT CCC TAA GGA CTC AGG AGA TGG GGA TTG GAT GTT GGG CAA ACA AAC    2352
2353 AAA CAA ACA AAC AAA CAA AAA AAA CTA GAG TGG CCA GCA CAG CCT CCT    2400
2401 AGC CTG TCC TGG AAG TGT TTG CTA ATG CTG TCT CTT CTT TGC CCC CAT    2448
2449 ACC ACG GGG TTA GGA TGC CCA TGA TGC CAC TGA GTA CTT CCT TCT GGC    2496
2497 CCT GGC AGC AGC GGT CCT GCT GGG TGA TGA GGA GCT TCA GGA CAC CAT    2544
2545 TAG GAG CAG GCT GGA CAA CAT CTG CCA GAG CCC CCT GTG GCA CAG CAG    2592
2593 GCC TCC GGG TGC TCC TCA GAG AGG GCG CGG TGG CTG AGT GGT GGT GGC    2640
2641 CTG GCC CTC TGA GGA AAG CTG TCC TGT CTC TGG ACA TTG TGC ATG GCC    2688
2689 AGA CTC TGA CCC CAC TGC CCT AGG CTC TTA AAT ACT CAT TGG GAG GGT    2736
2737 CCG AGT CCT TAC CTG CCT AGC CCC CTC ATT TCA CAA GAA GAA GAA TGA    2784
2785 AGT CCA GGA GGA GAA GGG CTC ATT GCA GGC CAC AGA AAG ATT TGA TGG    2832
2833 TGC AGC GAT GAG AAT TCC TGG TTC CAG GCT TTG CAT CTG GAG CCT TTA    2880
2881 CCG GTT GAC TGT TGC CTT CCA CAC AAA CAG CCT CTG AAA AGC ACT TTC    2928
2929 TCC ATA CAT AAT TCT GGA GAA GAT GAG GGA TCT TGC CCT CCA GGA GCC    2976
2977 TTC CTT CCT CCC CCA ATG AGG AAA TCA GTC ACT GCA CTG GTG CAA AGG    3024
3025 CAA GCA GAT TGG AAT TTG TGC TCT TCA CCG ATT TTC TCA GGG AAA GAC    3072
8073 CCC TTC CCC TTG CCA GCA GAG GAA CCT GTA GTT TTT TCC ATT TCT TTC    3120
3121 TTC AGA ACC AAA GTA TGT ATC ACT CCT CAT GCT CAC AGG GAT TGA CAG    3168
3169 GAG AGA ATT CAC CAG GAT CTT AGC TCA AAA GAC ACA GCC TCA GAA TGG    3216
3217 CCA GAT GGA TTG CAC GAA ACC TGA CTT GGA TTC ACC ATC TTC CTC CTG    3264
3265 CCA TAA GGC TGT GCT CCC ACA TAA CCT CCC AGA AGC TCC AGG GAA GCT    3312
3313 TTC CAA GAG CAA AGG CTT GGA AAT TGA ATG TTA AGA AAA TTA TGA CAT    3360
3361 AAA TTA CAT GTA AAT AGT GAA AAA AAA AAA AAA AAA AAA AA             3401
6.PP12901
A:核苷酸序列(SEQ ID NO:16)长度:2505个碱基
   1 GTGAAGAGGA CTTTGTCGGA AGCTCTCCTA AGAAACAAGC AGATGGAGTC AGGACTCCCT
  61 TAAGCTGCTC AGGGCTTGCC ACACCATTGT GTTGCATTCA GCCTGTCGTC TGATAAGCCC
 121 ACTTCTACAT CCCCAGCTGA CCAAGACCTT TGGCCTCAGC TAACATTTTC CATTGACAGT
 181 CTGCCCAAAC CCTTAAGACC CTATGCTAAC ATAGGGTCAG CAGCCTTCCA AGCCTTAAAA
 241 ATCCCCATCA ACAAGGTATC TGTGGGCCAG GGTCCAAAGC CTTCGCTGGG GGTCATTCCC
 301 ACCTTCCTCA CTAATTGTGC AGGATGCTTT TGCAGGGACA CCATTTTTCC ATTCCATACT
 361 GGGGCAGCCA GCCATTGAGT TTCAGCCCTT TAGGTGGAGC TCCCTCCCCG CCAGAACACT
 421 CTAGACAGCC AGCCAGCCCC TTTGTCTTTG GTTCCTGGGT TAGGAGAAAC AGGGCCACAG
 481 GGCGAGAGAG AAGATGTTTT CTCCTCCAGG CAAGAGTTGT CCCCTCCTTC TTGGTCCTCC
 541 CTTTTTGTCT TCTCAGTTGT TATTATTTTG CTGTGGTCAC CGGCAAAGCA GATGGTGGAT
 601 TGATTGCCAC TTATCACTGT CATGGTGCTG TCACTCTGCC TTTCCTCTAG AGGACACCAG
 661 TCCTCTTCCA CAGGGTCCTA CCCTCAGGCT CTTCCTTCCT GGGAGTTCAA GCCCCTGCCT
 721 CCTGTCCAGC GGCATCCTGG TAAGAAGCAA TAGAGCTTGA CCCGTGTTTC GTGGTTTGGA
 781 GCACCTGTTC AGTAGGACAG CCACCATCTT CAGAGTCCTG CGAGGGTCAG GGATATGACC
 841 TTCCTTGTCT TTAGTCACTT TAAGTAATGC TTTAGCTGGC TTAGCACAAG GGTTGGGCAC
 901 AGCAGGTCCC AGCAGCAGAG GTATCGCTCC AGCTGTGCTT AGGAGACCAG CCTTGGCCTG
 961 ATGTCTCTGC CTTGTCAGTT CATTCACCTG CTATCACAGT CTCCAGGGAT GAGGGCATCC
1021 TCTTCTCTAA GAGTTCCCTA AACCAACAGG ACACTGTTAG GGAGTCAGGG GTAGTCTGCT
1081 CTCAGTGCAG GTACATGCCA TCCTCCCCTT TTACTATTCA AGCCCAAATG TCATAATGTC
1141 CAGCAACTGC CTAGTGGAGG ACTCAGGCGG GTGGACTGAC CTCCCTCCTG GGCAACCCCA
1201 AACCTCCCGC CCCAAAGATC AGTTCCAGTG TGTGGGTTCA TTCAAATACT GGTGCTACCA
1261 CTTGCCCAAG CTAATGAGTG TCTGGGGGAA ACCAAACAAA TATAGAGTGC CATAGAGCAC
1321 ACAGCAGTGC TATACAAACT GAGTGGAAAG CTTCCAAATT CTGAGTTCCA ACCACTTGGG
1381 ACTGTCCAGG ATTCTTTTGC CAATTGATTG TCCTACTGGC TGGGCGGCCC CCATATCAAT
1441 TTCTTAACCA TTTCCAAAAC CCTCCCCTTT CTTCACCACC CCTTGTAGCG AGTTCAAGGG
1501 ATTTTGGGAC TGGCTGGGCA CAGTGGCTCA TGCCTGTAAT CAGAGCACTT TGGGAGGCCG
1561 AGGCAGGAGG ATCACTTGAG GTCAGGAGTT CAAGACCACC CTGGCCAACA TGGTGAAACC
1621 CCGTCTCTAC CAAAAATACA AAAATTAGCC AGGCATGGTG GTGCACGCCT GTAATCCCAG
1681 CTACTCAGGA GGCTGAGGCA GGAGAATCGC TTGAACCCAG GAAGCAGAGG TTGCAGCGAG
1741 CTGAGATCAT GTCACGGTAC TCCAGCCTGG GTGACAGAGT GAGACTCTGT CTCAGAAACA
1801 ACAGGGGGAT TTCAGGACTG ACCAAGAAAA AAAGATCTGA CCATTACTTA GCAATAGCAA
1861 ACGATGAGCT TTATTTGGCA ACACTTTGAC AGGGTGGCAT GTAAGGGAAG TCCCATGAGG
1921 GACGAGGCCA TCCAGAGGTT ACAGCCCCAG GATAGCCACT CAGAAGTACC GGAGGGTAGG
1981 GGACTCAAGG AGGAGGGGAC TGCCAGGGAG GGGCTTATGT GTCAGATGAC GTGACTGAGC
2041 AGCACCATGT ATCTGGATCC AATTTCTGAA GGGCAGCTGC GGCTTGGAAT CTTGTACTAC
2101 CAGGTTTATT TTGTCTGTGG CTAGCAGATG TTGGGTGCAG TTTCATGGGG CATGCAAAGC
2161 AGACAGGCTC TAAATGGCTA AAAATTAGTT TATATGGGCT ACGTTTGAAG CTATTGGATG
2221 TGTCAAACTT TGAGTTTGGT GCCTGTGGAT TTTTGCAAAT CTGCCCTGAA GAAGTAAACA
2281 ATAGAGGGGC AACACAGAGA AGCTATCTGA CTCATTAATA CAGCACTGCC TGATCAGGAA
2341 ACAGAGGACA CAAATTAACA ATATCAGGAG GCCGGGCGCA GTGGCTCATG CCTGTAATCC
2401 CAGCACTTGT GGAGGCTAAG GCAGGAGGAT TGCTTGAGTC CAGGAGTTTG AGACCAGCCT
2461 AGGAAACATA GAGAGGTTGA TATCTGCAAA AAAAAAAACA AAAAA
B:核苷酸序列(SEQ ID NO:17)长度:108个氨基酸
 1 MLLQGHHFSI PYWGSQPLSF SPLGGAPSPP EHSRQPASPF VFGSWVRRNR ATGRERRCFL
61 LQARVVPSFL VLPFCLLSCY YFAVVTGKAD GGLIATYHCH GAVTLPFL
C.核苷酸及氨基酸组合序列(SEQ ID NO:18)克隆号和蛋白名称:PP12901
起始编码子:324 ATG  终止编码子:648 TAG  蛋白质分子量:11947.27
   1  GT GAA GAG GAC TTT GTC GGA AGC TCT CCT AAG AAA CAA GCA GAT GGA    47
  48 GTC AGG ACT CCC TTA AGC TGC TCA GGG CTT GCC ACA CCA TTG TGT TGC    95
  96 ATT CAG CCT GTC GTC TGA TAA GCC CAC TTC TAC ATC CCC AGC TGA CCA    143
 144 AGA CCT TTG GCC TCA GCT AAC ATT TTC CAT TGA CAG TCT GCC CAA ACC    191
 192 CTT AAG ACC CTA TGC TAA CAT AGG GTC AGC AGC CTT CCA AGC CTT AAA    239
 240 AAT CCC CAT CAA CAA GGT ATC TGT GGG CCA GGG TCC AAA GCC TTC GCT    287
 288 GGG GGT CAT TCC CAC CTT CCT CAC TAA TTG TGC AGG ATG CTT TTG CAG    335
   1                                                 Met Leu Leu Gln    4
 336 GGA CAC CAT TTT TCC ATT CCA TAC TGG GGC AGC CAG CCA TTG AGT TTC    383
   5 Gly His His Phe Ser Ile Pro Tyr Trp Gly Ser Gln Pro Leu Ser Phe    20
 384 AGC CCT TTA GGT GGA GCT CCC TCC CCG CCA GAA CAC TCT AGA CAG CCA    431
  21 Ser Pro Leu Gly Gly Ala Pro Ser Pro Pro Glu His Ser Arg Gln Pro    36
 432 GCC AGC CCC TTT GTC TTT GGT TCC TGG GTT AGG AGA AAC AGG GCC ACA    479
  37 Ala Ser Pro Phe Val Phe Gly Ser Trp Val Arg Arg Asn Arg Ala Thr    52
 480 GGG CGA GAG AGA AGA TGT TTT CTC CTC CAG GCA AGA GTT GTC CCC TCC    527
  53 Gly Arg Glu Arg Arg Cys Phe Leu Leu Gln Ala Arg Val Val Pro Ser    68
 528 TTC TTG GTC CTC CCT TTT TGT CTT CTC AGT TGT TAT TAT TTT GCT GTG    575
  69 Phe Leu Val Leu Pro Phe Cys Leu Leu Ser Cys Tyr Tyr Phe Ala Val    84
 576 GTC ACC GGC AAA GCA GAT GGT GGA TTG ATT GCC ACT TAT CAC TGT CAT    623
  85 Val Thr Gly Lys Ala Asp Gly Gly Leu Ile Ala Thr Tyr His Cys His    100
 624 GGT GCT GTC ACT CTG CCT TTC CTC TAG AGG ACA CCA GTC CTC TTC CAC    671
 101 Gly Ala Val Thr Leu Pro Phe Leu ***                                109
 672 AGG GTC CTA CCC TCA GGC TCT TCC TTC CTG GGA GTT CAA GCC CCT GCC    719
 720 TCC TGT CCA GCG GCA TCC TGG TAA GAA GCA ATA GAG CTT GAC CCG TGT    767
 768 TTC GTG GTT TGG AGC ACC TGT TCA GTA GGA CAG CCA CCA TCT TCA GAG    815
 816 TCC TGC GAG GGT CAG GGA TAT GAC CTT CCT TGT CTT TAG TCA CTT TAA    863
 864 GTA ATG CTT TAG CTG GCT TAG CAC AAG GGT TGG GCA CAG CAG GTC CCA    911
 912 GCA GCA GAG GTA TCG CTC CAG CTG TGC TTA GGA GAC CAG CCT TGG CCT    959
 960 GAT GTC TCT GCC TTG TCA GTT CAT TCA CCT GCT ATC ACA GTC TCC AGG    1007
1008 GAT GAG GGC ATC CTC TTC TCT AAG AGT TCC CTA AAC CAA CAG GAC ACT    1055
1056 GTT AGG GAG TCA GGG GTA GTC TGC TCT CAG TGC AGG TAC ATG CCA TCC    1103
1104 TCC CCT TTT ACT ATT CAA GCC CAA ATG TCA TAA TGT CCA GCA ACT GCC    1151
1152 TAG TGG AGG ACT CAG GCG GGT GGA CTG ACC TCC CTC CTG GGC AAC CCC    1199
1200 AAA CCT CCC GCC CCA AAG ATC AGT TCC AGT GTG TGG GTT CAT TCA AAT    1247
1248 ACT GGT GCT ACC ACT TGC CCA AGC TAA TGA GTG TCT GGG GGA AAC CAA    1295
1296 ACA AAT ATA GAG TGC CAT AGA GCA CAC AGC AGT GCT ATA CAA ACT GAG    1343
1344 TGG AAA GCT TCC AAA TTC TGA GTT CCA ACC ACT TGG GAC TGT CCA GGA    1391
1392 TTC TTT TGC CAA TTG ATT GTC CTA CTG GCT GGG CGG CCC CCA TAT CAA    1439
1440 TTT CTT AAC CAT TTC CAA AAC CCT CCC CTT TCT TCA CCA CCC CTT GTA    1487
1488 GCG AGT TCA AGG GAT TTT GGG ACT GGC TGG GCA CAG TGG CTC ATG CCT    1535
1536 GTA ATC AGA GCA CTT TGG GAG GCC GAG GCA GGA GGA TCA CTT GAG GTC    1583
1584 AGG AGT TCA AGA CCA CCC TGG CCA ACA TGG TGA AAC CCC GTC TCT ACC    1631
1632 AAA AAT ACA AAA ATT AGC CAG GCA TGG TGG TGC ACG CCT GTA ATC CCA    1679
1680 GCT ACT CAG GAC GCT GAG GCA GGA GAA TCG CTT GAA CCC AGG AAG CAG    1727
1728 AGG TTG CAG CGA GCT GAG ATC ATG TCA CGG TAC TCC AGC CTG GGT GAC    1775
1776 AGA GTG AGA CTC TGT CTC AGA AAC AAC AGG GGG ATT TCA GGA CTG ACC    1823
1824 AAG AAA AAA AGA TCT GAC CAT TAC TTA GCA ATA GCA AAC GAT GAG CTT    1871
1872 TAT TTG GCA ACA CTT TGA CAG GGT GGC ATG TAA GGG AAG TCC CAT GAG    1919
1920 GGA CGA GGC CAT CCA GAG GTT ACA GCC CCA GGA TAG CCA CTC AGA AGT    1967
1968 ACC GGA GGG TAG GGG ACT CAA GGA GGA GGG GAC TGC CAG GGA GGG GCT    2015
2016 TAT GTG TCA GAT GAC GTG ACT GAG CAG CAC CAT GTA TCT GGA TCC AAT    2063
2064 TTC TGA AGG GCA GCT GCG GCT TGG AAT CTT GTA CTA CCA GGT TTA TTT    2111
2112 TGT CTG TGG CTA GCA GAT GTT GGG TGC AGT TTC ATG GGG CAT GCA AAG    2159
2160 CAG ACA GGC TCT AAA TGG CTA AAA ATT AGT TTA TAT GGG CTA CGT TTG    2207
2208 AAG CTA TTG GAT GTG TCA AAC TTT GAG TTT GGT GCC TGT GGA TTT TTG    2255
2256 CAA ATC TGC CCT GAA GAA GTA AAC AAT AGA GGG GCA ACA CAG AGA AGC    2303
2304 TAT CTG ACT CAT TAA TAC AGC ACT GCC TGA TCA GGA AAC AGA GGA CAC    2351
2352 AAA TTA ACA ATA TCA GGA GGC CGG GCG CAG TGG CTC ATG CCT GTA ATC    2399
2400 CCA GCA CTT GTG GAG GCT AAG GCA GGA GGA TTG CTT GAG TCC AGG AGT    2447
2448 TTG AGA CCA GCC TAG GAA ACA TAG AGA GGT TGA TAT CTG CAA AAA AAA    2495
2496 AAA CAA AAA A                                                      2505
7.PP13275
A:核苷酸序列(SEQ ID NO:19)长度:3940个碱基
   1 GGGGAACAGC TGATCCGTCT GTTGGGAGGA CAGATATCTC AAGGCCAGGA TGGAAGAATC
  61 ACCACTAAGC CGGGCACCAT CCCGTGGTGG AGTCAACTTT CTCAATGTAG CCCGGACCTA
 121 CATCCCCAAC ACCAAGGTGG AATGTCACTA CACCCTTCCC CCAGGCACCA TGCCCAGTGC
 181 CAGTGACTGG ATTGGCATCT TCAAGGTGGA GGCTGCCTGT GTTCGGGATT ACCACACATT
 241 TGTGTGGTCT TCCGTGCCTG AAAGTACAAC TGATGGTTCC CCCATTCACA CCAGTGTCCA
 301 GTTCCAAGCC AGCTACCTGC CCAAACCAGG AGCTCAGCTC TACCAGTTCC GATATGTGAA
 361 CCGCCAGGGC CAGGTGTGTG GGCAGAGCCC CCCTTTCCAG TTCCGAGAGC CAAGGCCCAT
 421 GGATGAACTG GTGACCCTGG AGGAGGCTGA TGGGGGCTCT GACATCCTGC TGGTTGTCCC
 481 CAAGGCAACT GTGTTACAGA ACCAGCTCGA TGAGAGCCAG CAAGAACGGA ATGACCTGAT
 541 GCAGCTGAAG CTACAGCTGG AGGGACAGGT GACAGAGCTG AGGAGCCGAG TGCAGGAGCT
 601 CGAGAGGGCT CTGGCAACTG CCAGGCAGGA GCACACGGAG CTGATGGAAC AGTACAAGGG
 661 GATTTCCCGG TCCCATGGGG AGATCACAGA AGAGAGGGAC ATCCTGAGCC GGCAACAGGG
 721 AGACCATGTG GCACGCATCC TGGAGCTAGA GGATGACATC CAGACCATCA GTGAGAAAGT
 781 GCTGACGAAG GAAGTGGAGC TGGACAGGCT TAGAGACACA GTGAAGGCCC TGACTCGGGA
 841 ACAAGAAAAG CTCCTTGGGC AACTGAAAGA AGTACAAGCA GACAAGGAGC AAAGTGAGGC
 901 CGAGCTCCAA GTGGCACAAC AGGAGAACCA TCACTTAAAT TTGGACCTGA AGGAGGCGAA
 961 GAGCTGGCAA GAGGAGCAGA GTGCTCAGGC TCAGCGACTG AAAGACAAGG TGGCCCAGAT
1021 GAAGGACACC CTAGGCCAGG CCCAGCAGCG GGTGGCCGAG CTGGAGCCCT TGAAGGAGCA
1081 GCTTCGAGGG GCCCAGGAGC TTGCAGCCTC AAGCCAGCAG AAAGCCACCC TTCTTGGGGA
1141 GGAGTTGGCC AGTGCAGCAG CAGCCAGGGA CCGCACCATA GCCGAACTAC ACCGCAGCCG
1201 CCTGGAAGTG GCTGAAGTTA ACGGCAGGCT GGCTGAGCTC GGTTTGCACT TGAAGGAAGA
1261 AAAATGCCAA TGGAGCAAGG AGCGGGCAGG GCTGCTGCAG AGTGTGGAGG CAGAGAAGGA
1321 CAAGATCCTG AAGCTGAGTG CAGAGATACT TCGATTGGAG AAGGCAGTTC AGGAGGAGAG
1381 GACCCAAAAC CAAGTGTTCA AGACTGAGCT GGCCCGGGAG AAGGATTCTA GCCTGGTACA
1441 GTTGTCAGAA AGTAAGCGGGA GCTGACAGA GCTGCGGTCA GCCCTGCGTG TGCTCCAGAA
1501 GGAAAAGGAG CAGTTACAGG AGGAGAAACA GGAATTGCTA GAGTACATGA GAAAGCTAGA
1561 GGCCCGCCTG GAGAAGGTGG CAGATGAGAA GTGGAATGAG GATGCCACCA CAGAGGATGA
1621 GGAGGCCGCT GTGGGGCTGA GCTGCCCGGC AGCTCTGACA GACTCAGAGG ACGAGTCCCC
1681 AGAAGACATG AGGCTCCCAC CCTATGGCCT TTGTGAGCGT GGAGACCCAG GCTCCTCTCC
1741 TGCTGGGCCT CGAGAGGCTT CTCCCCTTGT TGTCATCAGC CAGCCGGCTC CCATTTCTCC
1801 TCACCTCTCT GGGCCAGCTG AGGACAGTAG CTCTGACTCG GAGGCTGAAG ATGAGAAGTC
1861 AGTCCTGATG GCAGCTGTGC AGAGTGGGGG TGAGGAGGCC AACTTACTGC TTCCTGAACT
1921 GGGCAGTGCC TTCTATGACA TGGCCAGGTG AGTTCAACCA GCAAGGCCAG GAGGGAGGTG
1981 GGAGGAGGTC AGAGGGAAAG GGCATCTGTG TGGACAGTCA CCAGGCCCTG CTCCCAACCC
2041 CTGCCCTTCT TGGCCTCAGC CAAGAAAAGG AGATACAGGT ATGGTTAACA AGGAAAATGA
2101 CTCACTGCTC CAAATCCCAG ATGCCTTCAG GTAATCCCTA CCCCTATCTT ATCAATGCAC
2161 TCAGAGGTCC TGCCTTTAAC TGGCTTCTAT GTTGTTCTAG CACCATCTTC TGCAGAGCCC
2221 AAATTGCCCT GCTTCCCCTC TCTCCTGCCT CTACCCCTTC CCCAACCACC AGGTAGGTAC
2281 CTAGGGTCCT CCGGGGAGGA AGGGAGGTGA CCATGGCCCC CAGGGATAGG AGCAGAGAGA
2341 AGACTGGGAT CCAGCATCCA TCTGGCTACA ACTGAAATGC TTTCCCTCTT CCCTGACTTC
2401 CCTGGGTAAC CCTTAGGGAA GGGAACCTAT AGAGGTGGGG GTTTCAGGTA TCAGATTGTC
2461 CCCTTCTGCC TTCCCTTTTA TTCCCAGGTT CAAGGGGGCA GGCACAGGGA AGAGAGATTT
2521 GATCATCTAG TCCCGGTTTT GCCTGGATGT GAGATGGGCT CAGGGCAGGG AGGGGGTGAT
2581 GCTGTCATCC TTCTCGGCTG GAGCAGGAAG ATGAAGGACG ATGTCAGACT CATTTTCAGC
2641 CTCATTAGGC AGCAGACGGA GATGGAGGGA GGAGAGCAGG AGGCTGGGGG ATGGGCTCTG
2701 CACTGCAGAG ACCAGCAGGG ACTAAAGAAG AGAGGACATG GGGAACTGGA AAAATAAGCC
2761 TTCCAGGATT GTGGGGAGAA AGACGCTGTG GGAGAGGCCA GGATGCTGCA TTAGGCACAG
2821 GATAACCTGG GAACCCGGCA CATGGGTCCT GCTCTCCGAA GTCTGCAAGT CAAGAAGGGA
2881 ACAGAGCACG CCGACCCTCT CCCTTTCCCC TCTGTCTCTC TTAGTGGCTT TACAGTGGGT
2941 ACCCTGTCAG AAACCAGCAC TGGGGGCCCT GCCACCCCCA CATGGAAGGA GTGTCCTATC
3001 TGTAAGGAGC GCTTTCCTGC TGAGAGTGAC AAGGATGCCC TGGAGGACCA CATGGATGGA
3061 CACTTCTTTT TCAGCACCCA GGACCCCTTC ACCTTTGAGT GATCTTACTC CCTCGTACAT
3121 GCACAAATAC ACACTCATGC ACACACACAC TCACACACAT GCATACACTT AGGTTTCATG
3181 CCCATTTTCT ATCACACTGG GCTCCATGAT ATTCTGTTCC CTAAGAACTG CTTCTGTGTG
3241 CCCTGTTTTC ATCCCAAGAT TTCTCACTTC ATCCTCTCCT ACCTGGCTCT TTTGTCCCAG
3301 GGAAGGGGTG CCTGTTCGGA AGCAGTGGCT GAATTTATCC CCTGAAAGTG GTTTTGGAGG
3361 AACCGGGATG GAGGAGGCCT TCCCCTGTGG GAATAGAATC GTCCACTCCT AGCCCTGGTT
3421 GCTTCTGATA CACAGCCACT GCACACACAC ACTCACACTC ACACTCCCTT GTCTGATGCC
3481 CCAAAGCCAA TTCCTGGGGC ACCCTACCCT CTCTTATTTG GAGTTTCCGT TGGTTTACCT
3541 GAGTTTTCTC TGGGGTCTGC ACAGAGGCAG CAGCATGGAC ATCATGGCCT CTCAGGTCCC
3601 TTTTGGTTCT CAGTTTCATT GGTTCCTCTT TCTGTTCCCC CATTGACTTC TGTGCCCCAC
3661 CCTAGCCTTT TCCATAACCT TAGGTATTCA GTTTGGAGGG GTTTTTTGTA TTTTTGAGGA
3721 TTCCTGTATT CTGTATCCTC TCCTCGCATC TCCTCACATG GAAAGAAATA ATGTATTTGT
3781 GCCTTCTGTG AGGAATGGGG GGAACAAGTG GTCCCAGGTA TCCCCATTTC CAAGGCCCCC
3841 CTCCCTCTCC AGGTCCCCCC ACAGCAATAA AAGCTTCCCC CTGATATCCC CAAAAAAAAA
3901 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
B:核苷酸序列(SEQ ID NO:20)长度:633个氨基酸
  1 MEESPLSRAP SRGGVNFLNV ARTYIPNTKV ECHYTLPPGT MPSASDWIGI FKVEAACVRD
 61 YHTFVWSSVP ESTTDGSPIH TSVQFQASYL PKPGAQLYQF RYVNRQGQVC GQSPPFQFRE
121 PRPMDELVTL EEADGGSDIL LVVPKATVLQ NQLDESQQER NDLMQLKLQL EGQVTELRSR
181 VQELERALAT ARQEHTELME QYKGISRSHG EITEERDILS RQQGDHVARI LELEDDIQTI
241 SEKVLTKEVE LDRLRDTVKA LTREQEKLLG QLKEVQADKE QSEAELQVAQ QENHHLNLDL
301 KEAKSWQEEQ SAQAQRLKDK VAQMKDTLGQ AQQRVAELEP LKEQLRGAQE LAASSQQKAT
361 LLGEELASAA AARDRTIAEL HRSRLEVAEV NGRLAELGLH LKEEKCQWSK ERAGLLQSVE
421 AEKDKILKLS AEILRLEKAV QEERTQNQVF KTELAREKDS SLVQLSESKR ELTELRSALR
481 VLQKEKEQLQ EEKQELLEYM RKLEARLEKV ADEKWNEDAT TEDEEAAVGL SCPAALTDSE
541 DESPEDMRLP PYGLCERGDP GSSPAGPREA SPLVVISQPA PISPHLSGPA EDSSSDSEAE
601 DEKSVLMAAV QSGGEEANLL LPELGSAFYD MAR
C.核苷酸及氨基酸组合序列(SEQ ID NO:21)克隆号和蛋白名称:PP13275
起始编码子:50 ATG  终止编码子:1949 TGA  蛋白质分子量:70974.61
  1   G GGG AAC AGC TGA TCC GTC TGT TGG GAG GAC AGA TAT CTC AAG GCC    46
 47 AGG ATG GAA GAA TCA CCA CTA AGC CGG GCA CCA TCC CGT GGT GGA GTC    94
  1     Met Glu Glu Ser Pro Leu Ser Arg Ala Pro Ser Arg Gly Gly Val    15
 95 AAC TTT CTC AAT GTA GCC CGG ACC TAC ATC CCC AAC ACC AAG GTG GAA    142
 16 Asn Phe Leu Asn Val Ala Arg Thr Tyr Ile Pro Asn Thr Lys Val Glu    31
143 TGT CAC TAC ACC CTT CCC CCA GGC ACC ATG CCC AGT GCC AGT GAC TGG    190
 32 Cys His Tyr Thr Leu Pro Pro Gly Thr Met Pro Ser Ala Ser Asp Trp    47
191 ATT GGC ATC TTC AAG GTG GAG GCT GCC TGT GTT CGG GAT TAC CAC ACA    238
 48 Ile Gly Ile Phe Lys Val Glu Ala Ala Cys Val Arg Asp Tyr His Thr    63
239 TTT GTG TGG TCT TCC GTG CCT GAA AGT ACA ACT GAT GGT TCC CCC ATT    286
 64 Phe Val Trp Ser Ser Val Pro Glu Ser Thr Thr Asp Gly Ser Pro Ile    79
287 CAC ACC AGT GTC CAG TTC CAA GCC AGC TAC CTG CCC AAA CCA GGA GCT    334
 80 His Thr Ser Val Gln Phe Gln Ala Ser Tyr Leu Pro Lys Pro Gly Ala    95
335 CAG CTC TAC CAG TTC CGA TAT GTG AAC CGC CAG GGC CAG GTG TGT GGG    382
 96 Gln Leu Tyr Gln Phe Arg Tyr Val Asn Arg Gln Gly Gln Val Cys Gly    111
383 CAG AGC CCC CCT TTC CAG TTC CGA GAG CCA AGG CCC ATG GAT GAA CTG    430
112 Gln Ser Pro Pro Phe Gln Phe Arg Glu Pro Arg Pro Met Asp Glu Leu    127
431 GTG ACC CTG GAG GAG GCT GAT GGG GGC TCT GAC ATC CTG CTG GTT GTC    478
128 Val Thr Leu Glu Glu Ala Asp Gly Gly Ser Asp Ile Leu Leu Val Val    143
479 CCC AAG GCA ACT GTG TTA CAG AAC CAG CTC GAT GAG AGC CAG CAA GAA    526
144 Pro Lys Ala Thr Val Leu Gln Asn Gln Leu Asp Glu Ser Gln Gln Glu    159
527 CGG AAT GAC CTG ATG CAG CTG AAG CTA CAG CTG GAG GGA CAG GTG ACA    574
160 Arg Asn Asp Leu Met Gln Leu Lys Leu Gln Leu Glu Gly Gln Val Thr    175
575 GAG CTG AGG AGC CGA GTG CAG GAG CTC GAG AGG GCT CTG GCA ACT GCC    622
176 Glu Leu Arg Ser Arg Val Gln Glu Leu Glu Arg Ala Leu Ala Thr Ala    191
623 AGG CAG GAG CAC ACG GAG CTG ATG GAA CAG TAC AAG GGG ATT TCC CGG    670
192 Arg Gln Glu His Thr Glu Leu Met Glu Gln Tyr Lys Gly Ile Ser Arg    207
671 TCC CAT GGG GAG ATC ACA GAA GAG AGG GAC ATC CTG AGC CGG CAA CAG    718
208 Ser His Gly Glu Ile Thr Glu Glu Arg Asp Ile Leu Ser Arg Gln Gln    223
719 GGA GAC CAT GTG GCA CGC ATC CTG GAG CTA GAG GAT GAC ATC CAG ACC    766
224 Gly Asp His Val Ala Arg Ile Leu Glu Leu Glu Asp Asp Ile Gln Thr    239
767 ATC AGT GAG AAA GTG CTG ACG AAG GAA GTG GAG CTG GAC AGG CTT AGA    814
240 Ile Ser Glu Lys Val Leu Thr Lys Glu Val Glu Leu Asp Arg Leu Arg    255
815 GAC ACA GTG AAG GCC CTG ACT CGG GAA CAA GAA AAG CTC CTT GGG CAA    862
256 Asp Thr Val Lys Ala Leu Thr Arg Glu Gln Glu Lys Leu Leu Gly Gln    271
863 CTG AAA GAA GTA CAA GCA GAC AAG GAG CAA AGT GAG GCC GAG CTC CAA    910
272 Leu Lys Glu Val Gln Ala Asp Lys Glu Gln Ser Glu Ala Glu Leu Gln    287
911 GTG GCA CAA CAG GAG AAC CAT CAC TTA AAT TTG GAC CTG AAG GAG GCG    958
288 Val Ala Gln Gln Glu Asn His His Leu Asn Leu Asp Leu Lys Glu Ala    303
 959 AAG AGC TGG CAA GAG GAG CAG AGT GCT CAG GCT CAG CGA CTG AAA GAC    1006
 304 Lys Ser Trp Gln Glu Glu Gln Ser Ala Gln Ala Gln Arg Leu Lys Asp    319
1007 AAG GTG GCC CAG ATG AAG GAC ACC CTA GGC CAG GCC CAG CAG CGG GTG    1054
 320 Lys Val Ala Gln Met Lys Asp Thr Leu Gly Gln Ala Gln Gln Arg Val    335
1055 GCC GAG CTG GAG CCC TTG AAG GAG CAG CTT CGA GGG GCC CAG GAG CTT    1102
 336 Ala Glu Leu Glu Pro Leu Lys Glu Gln Leu Arg Gly Ala Gln Glu Leu    351
1103 GCA GCC TCA AGC CAG CAG AAA GCC ACC CTT CTT GGG GAG GAG TTG GCC    1150
 352 Ala Ala Ser Ser Gln Gln Lys Ala Thr Leu Leu Gly Glu Glu Leu Ala    367
1151 AGT GCA GCA GCA GCC AGG GAC CGC ACC ATA GCC GAA CTA CAC CGC AGC    1198
 368 Ser Ala Ala Ala Ala Arg Asp Arg Thr Ile Ala Glu Leu His Arg Ser    383
1199 CGC CTG GAA GTG GCT GAA GTT AAC GGC AGG CTG GCT GAG CTC GGT TTG    1246
 384 Arg Leu Glu Val Ala Glu Val Asn Gly Arg Leu Ala Glu Leu Gly Leu    399
1247 CAC TTG AAG GAA GAA AAA TGC CAA TGG AGC AAG GAG CGG GCA GGG CTG    1294
 400 His Leu Lys Glu Glu Lys Cys Gln Trp Ser Lys Glu Arg Ala Gly Leu    415
1295 CTG CAG AGT GTG GAG GCA GAG AAG GAC AAG ATC CTG AAG CTG AGT GCA    1342
 416 Leu Gln Ser Val Glu Ala Glu Lys Asp Lys Ile Leu Lys Leu Ser Ala    431
1343 GAG ATA CTT CGA TTG GAG AAG GCA GTT CAG GAG GAG AGG ACC CAA AAC    1390
 432 Glu Ile Leu Arg Leu Glu Lys Ala Val Gln Glu Glu Arg Thr Gln Asn    447
1391 CAA GTG TTC AAG ACT GAG CTG GCC CGG GAG AAG GAT TCT AGC CTG GTA    1438
 448 Gln Val Phe Lys Thr Glu Leu Ala Arg Glu Lys Asp Ser Ser Leu Val    463
1439 CAG TTG TCA GAA AGT AAG CGG GAG CTG ACA GAG CTG CGG TCA GCC CTG    1486
 464 Gln Leu Ser Glu Ser Lys Arg Glu Leu Thr Glu Leu Arg Ser Ala Leu    479
1487 CGT GTG CTC CAG AAG GAA AAG GAG CAG TTA CAG GAG GAG AAA CAG GAA    1534
 480 Arg Val Leu Gln Lys Glu Lys Glu Gln Leu Gln Glu Glu Lys Gln Glu    495
1535 TTG CTA GAG TAC ATG AGA AAG CTA GAG GCC CGC CTG GAG AAG GTG GCA    1582
 496 Leu Leu Glu Tyr Met Arg Lys Leu Glu Ala Arg Leu Glu Lys Val Ala    511
1583 GAT GAG AAG TGG AAT GAG GAT GCC ACC ACA GAG GAT GAG GAG GCC GCT    1630
 512 Asp Glu Lys Trp Asn Glu Asp Ala Thr Thr Glu Asp Glu Glu Ala Ala    527
1631 GTG GGG CTG AGC TGC CCG GCA GCT CTG ACA GAC TCA GAG GAC GAG TCC    1678
 528 Val Gly Leu Ser Cys Pro Ala Ala Leu Thr Asp Ser Glu Asp Glu Ser    543
1679 CCA GAA GAC ATG AGG CTC CCA CCC TAT GGC CTT TGT GAG CGT GGA GAC    1726
 544 Pro Glu Asp Met Arg Leu Pro Pro Tyr Gly Leu Cys Glu Arg Gly Asp    559
1727 CCA GGC TCC TCT CCT GCT GGG CCT CGA GAG GCT TCT CCC CTT GTT GTC    1774
 560 Pro Gly Ser Ser Pro Ala Gly Pro Arg Glu Ala Ser Pro Leu Val Val    575
1775 ATC AGC CAG CCG GCT CCC ATT TCT CCT CAC CTC TCT GGG CCA GCT GAG    1822
 576 Ile Ser Gln Pro Ala Pro Ile Ser Pro His Leu Ser Gly Pro Ala Glu    59l
1823 GAC AGT AGC TCT GAC TCG GAG GCT GAA GAT GAG AAG TCA GTC CTG ATG    1870
 592 Asp Ser Ser Ser Asp Ser Glu Ala Glu Asp Glu Lys Ser Val Leu Met    607
1871 GCA GCT GTG CAG AGT GGG GGT GAG GAG GCC AAC TTA CTG CTT CCT GAA    1918
 608 Ala Ala Val Gln Ser Gly Gly Glu Glu Ala Asn Leu Leu Leu Pro Glu    623
1919 CTG GGC AGT GCC TTC TAT GAC ATG GCC AGG TGA GTT CAA CCA GCA AGG    1966
 624 Leu Gly Ser Ala Phe Tyr Asp Met Ala Arg ***                        634
1967 CCA GGA GGG AGG TGG GAG GAG GTC AGA GGG AAA GGG CAT CTG TGT GGA    2014
2015 CAG TCA CCA GGC CCT GCT CCC AAC CCC TGC CCT TCT TGG CCT CAG CCA    2062
2063 AGA AAA GGA GAT ACA GGT ATG GTT AAC AAG GAA AAT GAC TCA CTG CTC    2110
2111 CAA ATC CCA GAT GCC TTC AGG TAA TCC CTA CCC CTA TCT TAT CAA TGC    2158
2159 ACT CAG AGG TCC TGC CTT TAA CTG GCT TCT ATG TTG TTC TAG CAC CAT    2206
2207 CTT CTG CAG AGC CCA AAT TGC CCT GCT TCC CCT CTC TCC TGC CTC TAC    2254
2255 CCC TTC CCC AAC CAC CAG GTA GGT ACC TAG GGT CCT CCG GGG AGG AAG    2302
2303 GGA GGT GAC CAT GGC CCC CAG GGA TAG GAG CAG AGA GAA GAC TGG GAT    2350
2351 CCA GCA TCC ATC TGG CTA CAA CTG AAA TGC TTT CCC TCT TCC CTG ACT    2398
2399 TCC CTG GGT AAC CCT TAG GGA AGG GAA CCT ATA GAG GTG GGG GTT TCA    2446
2447 GGT ATC AGA TTG TCC CCT TCT GCC TTC CCT TTT ATT CCC AGG TTC AAG    2494
2495 GGG GCA GGC ACA GGG AAG AGA GAT TTG ATC ATC TAG TCC CGG TTT TGC    2542
2543 CTG GAT GTG AGA TGG GCT CAG GGC AGG GAG GGG GTG ATG CTG TCA TCC    2590
2591 TTC TCG GCT GGA GCA GGA AGA TGA AGG ACG ATG TCA GAC TCA TTT TCA    2638
2639 GCC TCA TTA GGC AGC AGA CGG AGA TGG AGG GAG GAG AGC AGG AGG CTG    2686
2687 GGG GAT GGG CTC TGC ACT GCA GAG ACC AGC AGG GAC TAA AGA AGA GAG    2734
2735 GAC ATG GGG AAC TGG AAA AAT AAG CCT TCC AGG ATT GTG GGG AGA AAG    2782
2783 ACG CTG TGG GAG AGG CCA GGA TGC TGC ATT AGG CAC AGG ATA ACC TGG    2830
2831 GAA CCC GGC ACA TGG GTC CTG CTC TCC GAA GTC TGC AAG TCA AGA AGG    2878
2879 GAA CAG AGC ACG CCG ACC CTC TCC CTT TCC CCT CTG TCT CTC TTA GTG    2926
2927 GCT TTA CAG TGG GTA CCC TGT CAG AAA CCA GCA CTG GGG GCC CTG CCA    2974
2975 CCC CCA CAT GGA AGG AGT GTC CTA TCT GTA AGG AGC GCT TTC CTG CTG    3022
3023 AGA GTG ACA AGG ATG CCC TGG AGG ACC ACA TGG ATG GAC ACT TCT TTT    3070
3071 TCA GCA CCC AGG ACC CCT TCA CCT TTG AGT GAT CTT ACT CCC TCG TAC    3118
3119 ATG CAC AAA TAC ACA CTC ATG CAC ACA CAC ACT CAC ACA CAT GCA TAC    3166
3167 ACT TAG GTT TCA TGC CCA TTT TCT ATC ACA CTG GGC TCC ATG ATA TTC    3214
3215 TGT TCC CTA AGA ACT GCT TCT GTG TGC CCT GTT TTC ATC CCA AGA TTT    3262
3263 CTC ACT TCA TCC TCT CCT ACC TGG CTC TTT TGT CCC AGG GAA GGG GTG    3310
3311 CCT GTT CGG AAG CAG TGG CTG AAT TTA TCC CCT GAA AGT GGT TTT GGA    3358
3359 GGA ACC GGG ATG GAG GAG GCC TTC CCC TGT GGG AAT AGA ATC GTC CAC    3406
3407 TCC TAG CCC TGG TTG CTT CTG ATA CAC AGC CAC TGC ACA CAC ACA CTC    3454
3455 ACA CTC ACA CTC CCT TGT CTG ATG CCC CAA AGC CAA TTC CTG GGG CAC    3502
3503 CCT ACC CTC TCT TAT TTG GAG TTT CCG TTG GTT TAC CTG AGT TTT CTC    3550
3551 TGG GGT CTG CAC AGA GGC AGC AGC ATG GAC ATC ATG GCC TCT CAG GTC    3598
3599 CCT TTT GGT TCT CAG TTT CAT TGG TTC CTC TTT CTG TTC CCC CAT TGA    3646
3647 CTT CTG TGC CCC ACC CTA GCC TTT TCC ATA ACC TTA GGT ATT CAG TTT    3694
3695 GGA GGG GTT TTT TGT ATT TTT GAG GAT TCC TGT ATT CTG TAT CCT CTC    3742
3743 CTC GCA TCT CCT CAC ATG GAA AGA AAT AAT GTA TTT GTG CCT TCT GTG    3790
3791 AGG AAT GGG GGG AAC AAG TGG TCC CAG GTA TCC CCA TTT CCA AGG CCC    3838
3839 CCC TCC CTC TCC AGG TCC CCC CAC AGC AAT AAA AGC TTC CCC CTG ATA    3886
3887 TCC CCA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    3934
3935 AAA AAA                                                            3940
8.PP13296
A:核苷酸序列(SEQ ID NO:22)长度:2889个碱基
  1 GCTTATCCTA GCAATTGGGG CGCGGGCCTG TGAGCCAGTT GGAGTTGCGG CGGCGGGAAC
 61 GATTGGGCTG AGCAGAGGAC GACATGTTGC TTTTCGTGGA GGTAGCATCT AAAGGAACTG
121 GTTTAAATCC TAATGCCAAA GTATGGCAAG AAATTGCTCC TGGAAATACT GATGCCACCC
181 CAGTAACTCA TGGAACTGAA AGCTCTTGGC ATGAAATAGC AGCTACATCA GGTGCTCATC
241 CTGAGGGTAA TGCAGAGCTC TCAGAAGATA TATGTAAAGA ATATGAAGTA ATGTATTCTT
301 CATCTTGTGA AACCACAAGA AATACTACAG GCATTGAAGA ATCAACTGAT GGGATGATTT
361 TAGGACCAGA AGATCTGAGT TACCAAATAT ATGATGTTTC CGGAGAAAGC AATTCAGCAG
421 TTTCTACAGA AGACCTAAAA GAATGTCTGA AGAAACAATT AGAATTCTGT TTTTCACGAG
481 AAAATTTGTC AAAGGATCTT TACTTGATAT CTCAAATGGA TAGTGATCAG TTCATCCCAA
 541 TTTGGACAGT TGCCAACATG GAAGAAATAA AAAAGTTGAC TACAGACCCT GATCTAATTC
 601 TTGAAGTGTT AAGATCTTCT CCCATGGTAC AAGTTGATGA GAAGGGTGAG AAAGTGAGAC
 661 CAAGTCATAA GCGTTGTATT GTAATTCTTA GAGAGATTCC TGAAACAACA CCAATAGAGG
 721 AAGTGAAAGG TTTGTTCAAA AGTGAAAACT GCCCCAAAGT GATAAGCTGT GAGTTTGCAC
 781 ACAATAGCAA CTGGTATATC ACTTTCCAGT CAGACACAGA TGCACAACAG GCTTTTAAAT
 841 ACTTAAGAGA AGAAGTTAAA ACATTTCAGG GCAAGCCAAT TATGGCAAGG ATAAAAGCCA
 901 TCAATACATT TTTTGCTAAG AATGGTTATC GATTAATGGA TTCTAGTATC TATAGTCACC
 961 CCATTCAAAC TCAAGCACAG TATGCCTCCC CAGTCTTTAT GCAGCCTGTA TATAATCCTC
1021 ACCAACAGTA CTCGGTCTAT AGTATTGTGC CTCAGTCTTG GTCTCCAAAT CCTACACCTT
1081 ACTTTGAAAC ACCACTGGCT CCCTTTCCCA ATGGTAGTTT TGTGAATGGC TTTAATTCGC
1141 CAGGATCTTA TAAAACAAAT GCTGCTGCTA TGAATATGGG TCGACCATTC CAAAAAAATC
1201 GTGTGAAGCC TCAGTTTAGG TCATCTGGTG GTTCAGAACA CTCAACAGAG GGCTCTGTAT
1261 CCTTGGGGGA TGGACAGTTG AACAGATATA GTTCAAGAAA CTTTCCAGCT GAACGGCATA
1321 ACCCCACAGT AACTGGGCAT CAGGAGCAAA CTTACCTTCA GAAGGAGACT TCCACTTTGC
1381 AGGTGGAACA GAATGGGGAC TATGGTAGGG GCAGGAGAAC TCTCTTCAGA GGTCGAAGAC
1441 GACGAGAAGA TGACAGGATC TCAAGACCTC ATCCTTCAAC AGCTGAATCA AAGGCTCCAA
1501 CACCAAAGTT TGACTTATTA GCCTCAAATT TTCCACCTTT ACCTGGAAGT TCATCAAGAA
1561 TGCCAGGTGA ACTCGTTTTG GAGACTAGGA TGTCTGATGT TGTTAAAGGT GTCTACAAAG
1621 AAAAGGATAA TGAAGAGTTG ACAATTAGTT GCCCAGTGCC TGCAGATGAG CAGACAGAAT
1681 GCACTTCTGC CCAGCAACTC AATATGAGTA CCAGTTCTCC ATGTGCTGCT GAGCTTACTG
1741 CATTAAGCAC AACTCAGCAA GAAAAGGATC TAATAGAAGA TTCCTCTGTT CAGAAGGATG
1801 GTCTCAATCA GACAACTATA CCAGTTTCTC CTCCAAGTAC TACAAAGCCA TCGAGGGCAA
1861 GTACTGCTTC ACCATGTAAT AATAACATAA ATGCAGCTAC AGCTGTGGCT CTACAGGAAC
1921 CCCGAAAGTT AAGTTATGCT GAAGTGTGCC AGAAGCCCCC TAAAGAGCCA TCTTCAGTTC
1981 TTGTGCAGCC ACTACGGGAA CTTCGCTCCA ATGTGGTGTC TCCCACCAAA AATGAAGACA
2041 ATGGAGCTCC TGAGAACTCC GTTGAGAAAC CACATGAGAA GCCAGAAGCA AGGGCTAGTA
2101 AGGATTATTC TGGCTTCCGA GGCAATATAA TCCCCAGGGG AGCAGCAGGA AAAATCAGGG
2161 AACAGAGACG CCAGTTTAGC CATAGGGCTA TACCTCAGGG AGTGACTCGA CGTAATGGCA
2221 AAGAGCAATA TGTGCCACCC AGATCACCAA AGTAAAAAAC AACAAAACTA TTCAAAAACT
2281 TCACTCTCTT CCCATTAAAC TTGAACTGTG GCTATATTGA ACTGTTTTGG AGGGGAGGGG
2341 GTAGCCAGGA AGGAACAAGA GAAAGTACGT CCATTTCATT ATGGATTTTG GAGTTGTGAG
2401 TGATAGGATC CGAAAATTCA TCTCTAATGT GGTTTTTAAA TGCTGGAGGA TTCCAATCAA
2461 TATAAATATA TATATATATA CACACACATA TATAAAAAGT ATAATTTTTC TATTTTTGTT
2521 TTTGGTTTTA ATTTGCAGAG ATTTGCTGCC AGGAATCAAT TTTGAGGGTT CAGATTTAGC
2581 TTGGAAGAAA AAAAAGAAAC ATACATCCTT CAGTATAGGA GATGAGGGAA TGAGAGAAAA
2641 TATTTTTTGA AAAAGCATTT CTGTAAAATT AGAAATTACT TTTTTTAATC TATTTAAAGT
2701 TTGGCTTGAA GAATGCCATC TCTGACTATA TGGCCTTGTA TTGCAAAGCA GATCAGTGGC
2761 TGGGGTGCCT GTTGTGGGTG TGAGTGTGTA CAAGAGCGAT TGAAGCCAAA TCTGTTGTCA
2821 TGTTAGTAAA TGATTTGAAA ACTGAATGTA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
2881 AAAAAAAAA
B:核苷酸序列(SEQ ID NO:23)长度:723个氨基酸
  1 MLLFVEVASK GTGLNPNAKV WQEIAPGNTD ATPVTHGTES SWHEIAATSG AHPEGNAELS
 61 EDICKEYEVM YSSSCETTRN TTGIEESTDG MILGPEDLSY QIYDVSGESN SAVSTEDLKE
121 CLKKQLEFCF SRENLSKDLY LISQMDSDQF IPIWTVANME EIKKLTTDPD LILEVLRSSP
181 MVQVDEKGEK VRPSHKRCIV ILREIPETTP IEEVKGLFKS ENCPKVISCE FAHNSNWYIT
241 FQSDTDAQQA FKYLREEVKT FQGKPIMARI KAINTFFAKN GYRLMDSSIY SHPIQTQAQY
301 ASPVFMQPVY NPHQQYSVYS IVPQSWSPNP TPYFETPLAP FPNGSFVNGF NSPGSYKTNA
361 AAMNMGRPFQ KNRVKPQFRS SGGSEHSTEG SVSLGDGQLN RYSSRNFPAE RHNPTVTGHQ
421 EQTYLQKETS TLQVEQNGDY GRGRRTLFRG RRRREDDRIS RPHPSTAESK APTPKFDLLA
481 SNFPPLPGSS SRMPGELVLE TRMSDVVKGV YKEKDNEELTI SCPVPADEQ TECTSAQQLN
541 MSTSSPCAAE LTALSTTQQE KDLIEDSSVQ KDGLNQTTIP VSPPSTTKPS RASTASPCNN
601 NINAATAVAL QEPRKLSYAE VCQKPPKEPS SVLVQPLREL RSNVVSPTKN EDNGAPENSV
661 EKPHEKPEAR ASKDYSGFRG NIIPRGAAGK IREQRRQFSH RAIPQGVTRR NGKEQYVPPR
721 SPK
C.核苷酸及氨基酸组合序列(SEQ ID NO:24)克隆号和蛋白名称:PP13296
起始编码子:84 ATG   终止编码子:2253 TAA  蛋白质分子量:80450.71
  1  GC TTA TCC TAG CAA TTG GGG CGC GGG CCT GTG AGC CAG TTG GAG TTG    47
 48 CGG CGG CGG GAA CGA TTG GGC TGA GCA GAG GAC GAC ATG TTG CTT TTC    95
  1                                                 Met Leu Leu Phe    4
 96 GTG GAG GTA GCA TCT AAA GGA ACT GGT TTA AAT CCT AAT GCC AAA GTA    143
  5 Val Glu Val Ala Ser Lys Gly Thr Gly Leu Asn Pro Asn Ala Lys Val    20
144 TGG CAA GAA ATT GCT CCT GGA AAT ACT GAT GCC ACC CCA GTA ACT CAT    191
 21 Trp Gln Glu Ile Ala Pro Gly Asn Thr Asp Ala Thr Pro Val Thr His    36
192 GGA ACT GAA AGC TCT TGG CAT GAA ATA GCA GCT ACA TCA GGT GCT CAT    239
 37 Gly Thr Glu Ser Ser Trp His Glu Ile Ala Ala Thr Ser Gly Ala His    52
240 CCT GAG GGT AAT GCA GAG CTC TCA GAA GAT ATA TGT AAA GAA TAT GAA    287
 53 Pro Glu Gly Asn Ala Glu Leu Ser Glu Asp Ile Cys Lys Glu Tyr Glu    68
288 GTA ATG TAT TCT TCA TCT TGT GAA ACC ACA AGA AAT ACT ACA GGC ATT    335
 69 Val Met Tyr Ser Ser Ser Cys Glu Thr Thr Arg Asn Thr Thr Gly Ile    84
336 GAA GAA TCA ACT GAT GGG ATG ATT TTA GGA CCA GAA GAT CTG AGT TAC    383
 85 Glu Glu Ser Thr Asp Gly Met Ile Leu Gly Pro Glu Asp Leu Ser Tyr    100
384 CAA ATA TAT GAT GTT TCC GGA GAA AGC AAT TCA GCA GTT TCT ACA GAA    431
101 Gln Ile Tyr Asp Val Ser Gly Glu Ser Asn Ser Ala Val Ser Thr Glu    116
432 GAC CTA AAA GAA TGT CTG AAG AAA CAA TTA GAA TTC TGT TTT TCA CGA    479
117 Asp Leu Lys Glu Cys Leu Lys Lys Gln Leu Glu Phe Cys Phe Ser Arg    132
480 GAA AAT TTG TCA AAG GAT CTT TAC TTG ATA TCT CAA ATG GAT AGT GAT    527
133 Glu Asn Leu Ser Lys Asp Leu Tyr Leu Ile Ser Gln Met Asp Ser Asp    148
528 CAG TTC ATC CCA ATT TGG ACA GTT GCC AAC ATG GAA GAA ATA AAA AAG    575
149 Gln Phe Ile Pro Ile Trp Thr Val Ala Asn Met Glu Glu Ile Lys Lys    164
576 TTG ACT ACA GAG CCT GAT CTA ATT CTT GAA GTG TTA AGA TCT TCT CCC    623
165 Leu Thr Thr Asp Pro Asp Leu Ile Leu Glu Val Leu Arg Ser Ser Pro    180
624 ATG GTA CAA GTT GAT GAG AAG GGT GAG AAA GTG AGA CCA AGT CAT AAG    671
181 Met Val Gln Val Asp Glu Lys Gly Glu Lys Val Arg Pro Ser His Lys    196
672 CGT TGT ATT GTA ATT CTT AGA GAG ATT CCT GAA ACA ACA CCA ATA GAG    719
197 Arg Cys Ile Val Ile Leu Arg Glu Ile Pro Glu Thr Thr Pro Ile Glu    212
720 GAA GTG AAA GGT TTG TTC AAA AGT GAA AAC TGC CCC AAA GTG ATA AGC    767
213 Glu Val Lys Gly Leu Phe Lys Ser Glu Asn Cys Pro Lys Val Ile Ser    228
768 TGT GAG TTT GCA CAC AAT AGC AAC TGG TAT ATC ACT TTC CAG TCA GAC    815
229 Cys Glu Phe Ala His Asn Ser Asn Trp Tyr Ile Thr Phe Gln Ser Asp    244
816 ACA GAT GCA CAA CAG GCT TTT AAA TAC TTA AGA GAA GAA GTT AAA ACA    863
245 Thr Asp Ala Gln Gln Ala Phe Lys Tyr Leu Arg Glu Glu Val Lys Thr    260
864 TTT CAG GGC AAG CCA ATT ATG GCA AGG ATA AAA GCC ATC AAT ACA TTT    911
261 Phe Gln Gly Lys Pro Ile Met Ala Arg Ile Lys Ala Ile Asn Thr Phe    276
912 TTT GCT AAG AAT GGT TAT CGA TTA ATG GAT TCT AGT ATC TAT AGT CAC    959
277 Phe Ala Lys Asn Gly Tyr Arg Leu Met Asp Ser Ser Ile Tyr Ser His    292
 960 CCC ATT CAA ACT CAA GCA CAG TAT GCC TCC CCA GTC TTT ATG CAG CCT    1007
 293 Pro Ile Gln Thr Gln Ala Gln Tyr Ala Ser Pro Val Phe Met Gln Pro    308
1008 GTA TAT AAT CCT CAC CAA CAG TAC TCG GTC TAT AGT ATT GTG CCT CAG    1055
 309 Val Tyr Asn Pro His Gln Gln Tyr Ser Val Tyr Ser Ile Val Pro Gln    324
1056 TCT TGG TCT CCA AAT CCT ACA CCT TAC TTT GAA ACA CCA CTG GCT CCC    1103
 325 Ser Trp Ser Pro Asn Pro Thr Pro Tyr Phe Glu Thr Pro Leu Ala Pro    340
1104 TTT CCC AAT GGT AGT TTT GTG AAT GGC TTT AAT TCG CCA GGA TCT TAT    1151
 341 Phe Pro Asn Gly Ser Phe Val Asn Gly Phe Asn Ser Pro Gly Ser Tyr    356
1152 AAA ACA AAT GCT GCT GCT ATG AAT ATG GGT CGA CCA TTC CAA AAA AAT    1199
 357 Lys Thr Asn Ala Ala Ala Met Asn Met Gly Arg Pro Phe Gln Lys Asn    372
1200 CGT GTG AAG CCT CAG TTT AGG TCA TCT GGT GGT TCA GAA CAC TCA ACA    1247
 373 Arg Val Lys Pro Gln Phe Arg Ser Ser Gly Gly Ser Glu His Ser Thr    388
1248 GAG GGC TCT GTA TCC TTG GGG GAT GGA CAG TTG AAC AGA TAT AGT TCA    1295
 389 Glu Gly Ser Val Ser Leu Gly Asp Gly Gln Leu Asn Arg Tyr Ser Ser    404
1296 AGA AAC TTT CCA GCT GAA CGG CAT AAC CCC ACA GTA ACT GGG CAT CAG    1343
 405 Arg Asn Phe Pro Ala Glu Arg His Asn Pro Thr Val Thr Gly His Gln    420
1344 GAG CAA ACT TAC CTT CAG AAG GAG ACT TCC ACT TTG CAG GTG GAA CAG    1391
 421 Glu Gln Thr Tyr Leu Gln Lys Glu Thr Ser Thr Leu Gln Val Glu Gln    436
1392 AAT GGG GAC TAT GGT AGG GGC AGG AGA ACT CTC TTC AGA GGT CGA AGA    1439
 437 Asn Gly Asp Tyr Gly Arg Gly Arg Arg Thr Leu Phe Arg Gly Arg Arg    452
1440 CGA CGA GAA GAT GAC AGG ATC TCA AGA CCT CAT CCT TCA ACA GCT GAA    1487
 453 Arg Arg Glu Asp Asp Arg Ile Ser Arg Pro His Pro Ser Thr Ala Glu    468
1488 TCA AAG GCT CCA ACA CCA AAG TTT GAC TTA TTA GCC TCA AAT TTT CCA    1535
 469 Ser Lys Ala Pro Thr Pro Lys Phe Asp Leu Leu Ala Ser Asn Phe Pro    484
1536 CCT TTA CCT GGA AGT TCA TCA AGA ATG CCA GGT GAA CTC GTT TTG GAG    1583
 485 Pro Leu Pro Gly Ser Ser Ser Arg Met Pro Gly Glu Leu Val Leu Glu    500
1584 ACT AGG ATG TCT GAT GTT GTT AAA GGT GTC TAC AAA GAA AAG GAT AAT    1631
 501 Thr Arg Met Ser Asp Val Val Lys Gly Val Tyr Lys Glu Lys Asp Asn    516
1632 GAA GAG TTG ACA ATT AGT TGC CCA GTG CCT GCA GAT GAG CAG ACA GAA    1679
 517 Glu Glu Leu Thr Ile Ser Cys Pro Val Pro Ala Asp Glu Gln Thr Glu    532
1680 TGC ACT TCT GCC CAG CAA CTC AAT ATG AGT ACC AGT TCT CCA TGT GCT    1727
 533 Cys Thr Ser Ala Gln Gln Leu Asn Met Ser Thr Ser Ser Pro Cys Ala    548
1728 GCT GAG CTT ACT GCA TTA AGC ACA ACT CAG CAA GAA AAG GAT CTA ATA    1775
 549 Ala Glu Leu Thr Ala Leu Ser Thr Thr Gln Gln Glu Lys Asp Leu Ile    564
1776 GAA GAT TCC TCT GTT CAG AAG GAT GGT CTC AAT CAG ACA ACT ATA CCA    1823
 565 Glu Asp Ser Ser Val Gln Lys Asp Gly Leu Asn Gln Thr Thr Ile Pro    580
1824 GTT TCT CCT CCA AGT ACT ACA AAG CCA TCG AGG GCA AGT ACT GCT TCA    1871
 581 Val Ser Pro Pro Ser Thr Thr Lys Pro Ser Arg Ala Ser Thr Ala Ser    596
1872 CCA TGT AAT AAT AAC ATA AAT GCA GCT ACA GCT GTG GCT CTA CAG GAA    1919
 597 Pro Cys Asn Asn Asn Ile Asn Ala Ala Thr Ala Val Ala Leu Gln Glu    612
1920 CCC CGA AAG TTA AGT TAT GCT GAA GTG TGC CAG AAG CCC CCT AAA GAG    1967
 613 Pro Arg Lys Leu Ser Tyr Ala Glu Val Cys Gln Lys Pro Pro Lys Glu    628
1968 CCA TCT TCA GTT CTT GTG CAG CCA CTA CGG GAA CTT CGC TCC AAT GTG    2015
 629 Pro Ser Ser Val Leu Val Gln Pro Leu Arg Glu Leu Arg Ser Asn Val    644
2016 GTG TCT CCC ACC AAA AAT GAA GAC AAT GGA GCT CCT GAG AAC TCC GTT    2063
 645 Val Ser Pro Thr Lys Asn Glu Asp Asn Gly Ala Pro Glu Asn Ser Val    660
2064 GAG AAA CCA CAT GAG AAG CCA GAA GCA AGG GCT AGT AAG GAT TAT TCT    2111
 661 Glu Lys Pro His Glu Lys Pro Glu Ala Arg Ala Ser Lys Asp Tyr Ser    676
2112 GGC TTC CGA GGC AAT ATA ATC CCC AGG GGA GCA GCA GGA AAA ATC AGG    2159
 677 Gly Phe Arg Gly Asn Ile Ile Pro Arg Gly Ala Ala Gly Lys Ile Arg    692
2160 GAA CAG AGA CGC CAG TTT AGC CAT AGG GCT ATA CCT CAG GGA GTG ACT    2207
 693 Glu Gln Arg Arg Gln Phe Ser His Arg Ala Ile Pro Gln Gly Val Thr    708
2208 CGA CGT AAT GGC AAA GAG CAA TAT GTG CCA CCC AGA TCA CCA AAG TAA    2255
 709 Arg Arg Asn Gly Lys Glu Gln Tyr Val Pro Pro Arg Ser Pro Lys ***    724
2256 AAA ACA ACA AAA CTA TTC AAA AAC TTC ACT CTC TTC CCA TTA AAC TTG    2303
2304 AAC TGT GGC TAT ATT GAA CTG TTT TGG AGG GGA GGG GGT AGC CAG GAA    2351
2352 GGA ACA AGA GAA AGT ACG TCC ATT TCA TTA TGG ATT TTG GAG TTG TGA    2399
2400 GTG ATA GGA TCC GAA AAT TCA TCT CTA ATG TGG TTT TTA AAT GCT GGA    2447
2448 GGA TTC CAA TCA ATA TAA ATA TAT ATA TAT ATA CAC ACA CAT ATA TAA    2495
2496 AAA GTA TAA TTT TTC TAT TTT TGT TTT TGG TTT TAA TTT GCA GAG ATT    2543
2544 TGC TGC CAG GAA TCA ATT TTG AGG GTT CAG ATT TAG CTT GGA AGA AAA    2591
2592 AAA AGA AAC ATA CAT CCT TCA GTA TAG GAG ATG AGG GAA TGA GAG AAA    2639
2640 ATA TTT TTT GAA AAA GCA TTT CTG TAA AAT TAG AAA TTA CTT TTT TTA    2687
2688 ATC TAT TTA AAG TTT GGC TTG AAG AAT GCC ATC TCT GAC TAT ATG GCC    2735
2736 TTG TAT TGC AAA GCA GAT CAG TGG CTG GGG TGC CTG TTG TGG GTG TGA    2783
2784 GTG TGT ACA AGA GCG ATT GAA GCC AAA TCT GTT GTC ATG TTA GTA AAT    2831
2832 GAT TTG AAA ACT GAA TGT AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    2879
2880 AAA AAA AAA A                                                      2889
9.PP14214
A:核苷酸序列(SEQ ID NO:25)长度:717个碱基
  1 GCTTCGGATG ACTGCAGAAA ATAGTGTTTT GTAGTTCAAC AACTCAAGAC GAAGCTTATT
 61 TCTGAGGATA AGCTCTTTAA AGGCAAAGCT TTATTTTCAT CTCTCATCTT TTGTCCTCCT
121 TAGCACAATG TAAAAAAGAA TAGTAATATC AGAACAGGAA GGAGGAATGG CTTGCTGGGG
181 AGCCCATCCA GGACACTGGG AGCACATAGA GATTCACCCA TGTTTGTTGA ACTTAGAGTC
241 ATTCTCATGC TTTTCTTTAT AATTCACACA TATATGCAGA GAAGATATGT TCTTGTTAAC
301 ATTGTATACA ACATAGCCCC AAATATAGTA AGATCTATAC TAGATAATCC TAGATGAAAT
361 GTTAGAGATG CTATATGATA CAACTGTGGC CATGACTGAG GAAAGGAGCT CACGCCCAGA
421 GACTGGGCTG CTCTCCCGGA GGCCAAACCC AAGAAGGTCT GGCAAAGTCA GGCTCAGGGA
481 GACTCTGCCC TGCTGCAGAC CTCGGTGTGG ACACACGCTG CATAGAGCTC TCCTTGAAAA
541 CAGAGGGGTC TCAAGACATT CTGCCTACCT ATTAGCTTTT CTTTATTTTT TTAACTTTTT
601 GGGGGGAAAA GTATTTTTGA GAAGTTTGTC TTGCAATGTA TTTATAAATA GTAAATAAAG
661 TTTTTACCAT TAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAA
B:核苷酸序列(SEQ ID NO:26)长度:99个氨基酸
 1 MLEMLYDTTV AMTEERSSRP ETGLLSRRPN PRRSGKVRLR ETLPCCRPRC GHTLHRALLE
61 NRGVSRHSAY LLAFLYFFNF LGGKVFLRSL SCNVFINSK
C.核苷酸及氨基酸组合序列(SEQ ID NO:27)克隆号和蛋白名称:PP14214
起始编码子:359 ATG 终止编码子:656 TAA 蛋白质分子量:11447.78
 1   G CTT CGG ATG ACT GCA GAA AAT AGT GTT TTG TAG TTC AAC AAC TCA    46
47 AGA CGA AGC TTA TTT CTG AGG ATA AGC TCT TTA AAG GCA AAG CTT TAT    94
95 TTT CAT CTC TCA TCT TTT GTC CTC CTT AGC ACA ATG TAA AAA AGA ATA    142
143 GTA ATA TCA GAA CAG GAA GGA GGA ATG GCT TGC TGG GGA GCC CAT CCA    190
191 GGA CAC TGG GAG CAC ATA GAG ATT CAC CCA TGT TTG TTG AAC TTA GAG    238
239 TCA TTC TCA TGC TTT TCT TTA TAA TTC ACA CAT ATA TGC AGA GAA GAT    286
287 ATG TTC TTG TTA ACA TTG TAT ACA ACA TAG CCC CAA ATA TAG TAA GAT    334
335 CTA TAC TAG ATA ATC CTA GAT GAA ATG TTA GAG ATG CTA TAT GAT ACA    382
  1                                 Met Leu Glu Met Leu Tyr Asp Thr    8
383 ACT GTG GCC ATG ACT GAG GAA AGG AGC TCA CGC CCA GAG ACT GGG CTG    430
  9 Thr Val Ala Met Thr Glu Glu Arg Ser Ser Arg Pro Glu Thr Gly Leu    24
431 CTC TCC CGG AGG CCA AAC CCA AGA AGG TCT GGC AAA GTC AGG CTC AGG    478
 25 Leu Ser Arg Arg Pro Asn Pro Arg Arg Ser Gly Lys Val Arg Leu Arg    40
479 GAG ACT CTG CCC TGC TGC AGA CCT CGG TGT GGA CAC ACG CTG CAT AGA    526
 41 Glu Thr Leu Pro Cys Cys Arg Pro Arg Cys Gly His Thr Leu His Arg    56
527 GCT CTC CTT GAA AAC AGA GGG GTC TCA AGA CAT TCT GCC TAC CTA TTA    574
 57 Ala Leu Leu Glu Asn Arg Gly Val Ser Arg His Ser Ala Tyr Leu Leu    72
575 GCT TTT CTT TAT TTT TTT AAC TTT TTG GGG GGA AAA GTA TTT TTG AGA    622
 73 Ala Phe Leu Tyr Phe Phe Asn Phe Leu Gly Gly Lys Val Phe Leu Arg    88
623 AGT TTG TCT TGC AAT GTA TTT ATA AAT AGT AAA TAA AGT TTT TAC CAT    670
 89 Ser Leu Ser Cys Asn Val Phe Ile Asn Ser Lys ***                    100
671 TAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AA     717
10.FP497
A:核苷酸序列(SEQ ID NO:28)长度:2444个碱基
   1 GACTGGACGG CAGGGAGTGG GGCTGTCATC ATCAGATGAG AGCTAAGGGG ACCCCCACCA
  61 GGGTGGCGGC AATGGCAGAG GGTAGGCAAA ACGCTTGTAT TTGCAACATA AGGTGAGATT
 121 TGACAGCTGA CCGAGGGTGG GAGCAGCAGC CAAAACCAAA AAAGCCAGAG GGAAGTTGCA
 181 AGCACAGAAA AAATAGAAGA TTTAATGGGA GAAATAACAA TAGCTGGCAT CTATTGAACA
 241 CTTACTGGGA GCTAGGTACA GGGCCCATTC ATTCATTCAT GCAATTAAAA CTTTTTTTAA
 301 GAAACGGGGT CTTGCTCTGT TGCCCAGGCT GGAGTGCAGT GGTGTGATCA CAGCTCACTG
 361 CAGCCTTGAA TTCCTGGCCT CAAGGAGTCC TCCCACCTCG GCCTCCTGTG TAGCTGGGAT
 421 TATAGGTACG TGCGGTACAC CTGGCTCCCT TTAAAAGTTT TTTGTAGAGG CAGGGCACAG
 481 TGGCTCACAC CTGTAATCCC AGCACTTTGG GAGGCCGAGG CAGGAGGATC ACAAGGTCAG
 541 GAGTTCGAGA CCAGCCTGAC CAACATGGTG AAACCCGTCT CTACTTAAAA TACAAAAATT
 601 AGCCGGGTGT GGTGGCGGGC GCCTGTAATC CCAGCTACTC AGGAGGCTGA GGCATGAGAC
 661 TTGCTTGAAC CCAGGAGGCG AAGGTTGCAG TGAGCCGAGA TCGCGCCACT GCACTCCAGC
 721 CTGGGTGACA GAACAAGACT CCGTCTCAAA AAAAAAAAAA AAGTTTCTTG TAGAGGCAGG
 781 GCCTTGCTTT GTTGCTGGTG CAATCACGGC TCACTGCATC CTCTAACTCC TGGCCTTAAG
 841 CAATCTTCTG TCCTCAGCCT CCCAAAGCAC TGGGATTACA GGCATGCATG ACCACACCTG
 901 GTCCCTGCCA TTGTTTATTG AGCACCTACT GAGTGCCATG TATTAAGTGC TGGGTATTTG
 961 TCAGTGGACA AAACAGATTA AAAAAATCAC AGCCCTTAGG AGCTTACCTT CTGGCAGGGG
1021 CGTCAGACAA TAACACAGCA AGTGCTGAGG AAGAAACGGA GGCGGCAGGG AGCGTGGCAG
1081 TTGAGCGTGG CCTTCATGGA GCTGCGACAG TGGTACTCGG GCAGGGGCAG CACGGAGGCT
1141 GTGCGCCAGA GGAGGAGGAC TGAGGGGCAA GGGGGAGAGC TCTGGTTGGA AAGGCAGGGG
1201 AGATTCTCCA GGGCCTTGCC GGTGCCAGTG ACAACTGGGG TTTTCCTGAG ACGGGACTGC
1261 GAGGAATGGG GGCTCTCAGG CTTGAGAGGG CAAAGGTGGG TCTGGGATGC CGTCTGCCCA
1321 CAGAGCCCCT TCCCCAACGG CTGCCCAGGC CAAGCCAACC CTGTTGGGTT GTGTGGTGTG
1381 AGCCATGAAG CCGCTGCCAG GTTTGTACCT CAGGCGTGGT CGTGATGCCC CAGCTTCACC
1441 GGCCCTGCCT GTGGGGACGT GGTGCCTGTG TGCGGGAGCC TGGGCCTCAG CCGAGGCCCT
1501 GAGCTCCGGC ACTGCCCAGA ACCCAGCTCA GCGCTGGTAC TCAGCCCGCC CGCTGTGGCC
1561 CTGGTGGAGT GGAGCACGTG CCCAGTGGGG GCTGGCCTTG TCCCATCGCG GACCTGTCCT
1621 TTCCCGGGGC AGGGTGGTGT GGGAGAGGGT ATCAGGGACA TTTTCTGAGT CTGCTCTGTC
1681 TCTGCCGCCC CTGCCCGAAC ACAGATTCTG AAAGTCAAGA AGACATCATC CGGAATATTG
1741 CCAGGCACCT CGCCCAGGTC GGGGACAGCA TGGACCGTAG CATCCCTCCG GGCCTGGTGA
1801 ACGGCCTGGC CCTGCAGCTC AGGAACACCA GCCGGTCGGA GGAGGACCGG AACAGGGACC
1861 TGGCCACTGC CCTGGAGCAG CTGCTGCAGG CCTACCCTAG AGACATGGAG AAGGAGAAGA
1921 CCATGCTGGT GCTGGCCCTG CTGCTGGCCA AGAAGGTGGC CAGTCACACG CCGTCCTTGC
1981 TCCGTGATGT CTTTCACACA ACAGTGAATT TTATTAACCA GAACCTACGC ACCTACGTGA
2041 GGAGCTTAGC CAGAAATGGG ATGGACTGAA CGGACAGTTC CAGAAGTGTG ACTGGCTAAA
2101 GCTCGATGTG GTCACAGCTG TATAGCTGCT TCCAGTGTAG ACGGAGCCCT GGCATGTCAA
2161 CAGCGTTCCT AAAGAAGACA GGCTGGAAAA TAACTGTGAC TTTTGTTTTA AAGACAATGT
2221 TTAACTTATA ACCCCCTTTA AAATATTTAC ATTAATAAAC TTGAATGAAA ATGTCCCTTT
2281 ACACCGGATT TGAATGGCCT TCATATCATC CCCACATGAA TCTGCACATC TGTAAATCTA
2341 CACACGGGGC CTTTATTTCC CCTGGGCAGG GTCCCCCTTA AAAATTAAAT TGGAAAGCAG
2401 GGTTCAAGGA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA
B:核苷酸序列(SEQ ID NO:29)长度:109个氨基酸
   1 MELRQWYSGR GSTEAVRQRR RTEGQGGELW LERQGRFSRA LPVPVTTGVF LRRDCEEWGL
  61 SGLRGQRWVW DAVCPQSPFP NGCPGQANPV GLCGVSHEAA ARFVPQAWS
C.核苷酸及氨基酸组合序列(SEQ ID NO:30)克隆号和蛋白名称:FP497
起始编码子:1096 ATG 终止编码子:1423 TGA 蛋白质分子量:12226.16
   1 GAC TGG ACG GCA GGG AGT GGG GCT GTC ATC ATC AGA TGA GAG CTA AGG    48
  49 GGA CCC CCA CCA GGG TGG CGG CAA TGG CAG AGG GTA GGC AAA ACG CTT    96
  97 GTA TTT GCA ACA TAA GGT GAG ATT TGA CAG CTG ACC GAG GGT GGG AGC    144
 145 AGC AGC CAA AAC CAA AAA AGC CAG AGG GAA GTT GCA AGC ACA GAA AAA    192
 193 ATA GAA GAT TTA ATG GGA GAA ATA ACA ATA GCT GGC ATC TAT TGA ACA    240
 241 CTT ACT GGG AGC TAG GTA CAG GGC CCA TTC ATT CAT TCA TGC AAT TAA    288
 289 AAC TTT TTT TAA GAA ACG GGG TCT TGC TCT GTT GCC CAG GCT GGA GTG    336
 337 CAG TGG TGT GAT CAC AGC TCA CTG CAG CCT TGA ATT CCT GGC CTC AAG    384
 385 GAG TCC TCC CAC CTC GGC CTC CTG TGT AGC TGG GAT TAT AGG TAC GTG    432
 433 CGG TAC ACC TGG CTC CCT TTA AAA GTT TTT TGT AGA GGC AGG GCA CAG    480
 481 TGG CTC ACA CCT GTA ATC CCA GCA CTT TGG GAG GCC GAG GCA GGA GGA    528
 529 TCA CAA GGT CAG GAG TTC GAG ACC AGC CTG ACC AAC ATG GTG AAA CCC    576
 577 GTC TCT ACT TAA AAT ACA AAA ATT AGC CGG GTG TGG TGG CGG GCG CCT    624
 625 GTA ATC CCA GCT ACT CAG GAG GCT GAG GCA TGA GAC TTG CTT GAA CCC    672
 673 AGG AGG CGA AGG TTG CAG TGA GCC GAG ATC GCG CCA CTG CAC TCC AGC    720
 721 CTG GGT GAC AGA ACA AGA CTC CGT CTC AAA AAA AAA AAA AAA GTT TCT    768
 769 TGT AGA GGC AGG GCC TTG CTT TGT TGC TGG TGC AAT CAC GGC TCA CTG    816
 817 CAT CCT CTA ACT CCT GGC CTT AAG CAA TCT TCT GTC CTC AGC CTC CCA    864
 865 AAG CAC TGG GAT TAC AGG CAT GCA TGA CCA CAC CTG GTC CCT GCC ATT    912
 913 GTT TAT TGA GCA CCT ACT GAG TGC CAT GTA TTA AGT GCT GGG TAT TTG    960
 961 TCA GTG GAC AAA ACA GAT TAA AAA AAT CAC AGC CCT TAG GAG CTT ACC    1008
1009 TTC TGG CAG GGG CGT CAG ACA ATA ACA CAG CAA GTG CTG AGG AAG AAA    1056
1057 CGG AGG CGG CAG GGA GCG TGG CAG TTG AGC GTG GCC TTC ATG GAG CTG    1104
   1                                                     Met Glu Leu    3
1105 CGA CAG TGG TAC TCG GGC AGG GGC AGC ACG GAG GCT GTG CGC CAG AGG    1152
   4 Arg Gln Trp Tyr Ser Gly Arg Gly Ser Thr Glu Ala Val Arg Gln Arg    19
1153 AGG AGG ACT GAG GGG CAA GGG GGA GAG CTC TGG TTG GAA AGG CAG GGG    1200
  20 Arg Arg Thr Glu Gly Gln Gly Gly Glu Leu Trp Leu Glu Arg Gln Gly    35
1201 AGA TTC TCC AGG GCC TTG CCG GTG CCA GTG ACA ACT GGG GTT TTC CTG    1248
  36 Arg Phe Ser Arg Ala Leu Pro Val Pro Val Thr Thr Gly Val Phe Leu    51
1249 AGA CGG GAC TGC GAG GAA TGG GGG CTC TCA GGC TTG AGA GGG CAA AGG    1296
  52 Arg Arg Asp Cys Glu Glu Trp Gly Leu Ser Gly Leu Arg Gly Gln Arg    67
1297 TGG GTC TGG GAT GCC GTC TGC CCA CAG AGC CCC TTC CCC AAC GGC TGC    1344
  68 Trp Val Trp Asp Ala Val Cys Pro Gln Ser Pro Phe Pro Asn Gly Cys    83
1345 CCA GGC CAA GCC AAC CCT GTT GGG TTG TGT GGT GTG AGC CAT GAA GCC    1392
  84 Pro Gly Gln Ala Asn Pro Val Gly Leu Cys Gly Val Ser His Glu Ala    99
1393 GCT GCC AGG TTT GTA CCT CAG GCG TGG TCG TGA TGC CCC AGC TTC ACC    1440
 100 Ala Ala Arg Phe Val Pro Gln Ala Trp Ser ***                        110
1441 GGC CCT GCC TGT GGG GAC GTG GTG CCT GTG TGC GGG AGC CTG GGC CTC    1488
1489 AGC CGA GGC CCT GAG CTC CGG CAC TGC CCA GAA CCC AGC TCA GCG CTG    1536
1537 GTA CTC AGC CCG CCC GCT GTG GCC CTG GTG GAG TGG AGC ACG TGC CCA    1584
1585 GTG GGG GCT GGC CTT GTC CCA TCG CGG ACC TGT CCT TTC CCG GGG CAG    1632
1633 GGT GGT GTG GGA GAG GGT ATC AGG GAC ATT TTC TGA GTC TGC TCT GTC    1680
1681 TCT GCC GCC CCT GCC CGA ACA CAG ATT CTG AAA GTC AAG AAG ACA TCA    1728
1729 TCC GGA ATA TTG CCA GGC ACC TCG CCC AGG TCG GGG ACA GCA TGG ACC    1776
1777 GTA GCA TCC CTC CGG GCC TGG TGA ACG GCC TGG CCC TGC AGC TCA GGA    1824
1825 ACA CCA GCC GGT CGG AGG AGG ACC GGA ACA GGG ACC TGG CCA CTG CCC    1872
1873 TGG AGC AGC TGC TGC AGG CCT ACC CTA GAG ACA TGG AGA AGG AGA AGA    1920
1921 CCA TGC TGG TGC TGG CCC TGC TGC TGG CCA AGA AGG TGG CCA GTC ACA    1968
1969 CGC CGT CCT TGC TCC GTG ATG TCT TTC ACA CAA CAG TGA ATT TTA TTA    2016
2017 ACC AGA ACC TAC GCA CCT ACG TGA GGA GCT TAG CCA GAA ATG GGA TGG    2064
2065 ACT GAA CGG ACA GTT CCA GAA GTG TGA CTG GCT AAA GCT CGA TGT GGT    2112
2113 CAC AGC TGT ATA GCT GCT TCC AGT GTA GAC GGA GCC CTG GCA TGT CAA    2160
2161 CAG CGT TCC TAA AGA AGA CAG GCT GGA AAA TAA CTG TGA CTT TTG TTT    2208
2209 TAA AGA CAA TGT TTA ACT TAT AAC CCC CTT TAA AAT ATT TAC ATT AAT    2256
2257 AAA CTT GAA TGA AAA TGT CCC TTT ACA CCG GAT TTG AAT GGC CTT CAT    2304
2305 ATC ATC CCC ACA TGA ATC TGC ACA TCT GTA AAT CTA CAC ACG GGG CCT    2352
2353 TTA TTT CCC CTG GGC AGG GTC CCC CTT AAA AAT TAA ATT GGA AAG CAG    2400
2401 GGT TCA AGG AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AA         2444
11.FP585
A:核苷酸序列(SEQ ID NO:31)长度:1288个碱基
  1 GTGCTGGGCA GCTTGAGTTT TCCCCAGGCT GCTCTATTGT TGCCTGTAGC TGTGATTTTT
 61 CAGGCAGGCT GCTCCTCTGA GGACCACCCT TAACTGTCTA CCTAACTGGT TTTTCCTTTT
121 CTTCTCCTCA TTTGTATTTA TGTATCAGTG TATTATGTAT TTATATACAC TTGGAGATAC
181 AGTAAAATGT ACCTCTCACT GTGGGTTACC ATAAATACTG TAAATTTGAG AAACACTCTT
241 TCAGGCCTGA GAGGAGCAGT GACAACAGTA GGGATGATCA AGTCAGATGT CCCTGGTACC
301 CAGGAATGGC TGGATGAGAG AAGGAGACAG GGTGACCTGC CCCTGCCTAC AAACTCTAAC
361 CCAGTTCTGT CCCTGGAGCT GTGTGACCCC GGACAAGGCC CTGCCCCTTT CCAGGCTGTC
421 GTTGTCCTCA TCCAGCCTGG GAGAGGGTTG GCGCTGAGGC CCCCACCTTC TTGCCTGTTT
481 CCTCCTGACC CCACCCCTTC CCCTCCTGCT GGGCAGATCC GAGTGAAGCC TGACAGGACC
541 GGTGTGGTCA CGGATGGTGT GAAGCACTCC ATGAACCCCT TCTGTGAGAT CGCGGTGGAG
601 GAGGCTGTGC GGCTCAAGGA GAAGAAGCTG GTGAAGGAGG TCATCGCCGT CAGCTGTGGG
661 CCTGCACAGT GCCAGGAGAC GATTCGTACC GCCCTGGCCA TGGGTGCAGA CCGAGGTATC
721 CACGTGGAGG TGCCCCCAGC AGAAGCAGAA CGCTTGGGTC CCCTGCAGGT GGCTCGGGTC
781 CTGGCCAAGC TGGCAGAGAA GGAGAAGGTG GACCTGGTGC TGCTGGGCAA ACAGGCCATC
841 GATGATGACT GTAACCAGAC AGGGCAGATG ACAGCTGGAT TTCTTGACTG GCCACAGGGC
901 ACATTCGCCT CCCAGGTGAT GCTGGAGGGG GACAAGTTGA AAGTGGAGCG GGAGATCGAT
 961 GGGGGCCTGG AGACCCTGCG CCTGAAGCTG CCAGCTGTGG TGACAGCTGA CCTGAGGCTC
1021 AACGAGCCCC GCTACGCCAC GCTGCCCAAC ATCATGAAAG CCAAGAAGAA GAAGATCGAG
1081 GTGATCAAGC CTGGGGACCT GGGTGTGGAC CTGACCTCCA AGCTCTCTGT GATCAGTGTG
1141 GAGGACCCGC CCCAGCGCAC GGCCGGCGTC AAGGTGGAGA CCACTGAGGA CCTGGTGGCC
1201 AAGCTGAAGG AGATTGGGCG GATTTGAGCC CCTCCCAGAG ATGGCAATAA AACTGACTCT
1261 CAACATCTAA AAAAAAAAAA AAAAAAAA
B:核苷酸序列(SEQ ID NO:32)长度:346个氨基酸
  1 MYLSLWVTIN TVNLRNTLSG LRGAVTTVGM IKSDVPGTQE WLDERRRQGD LPLPTNSNPV
 61 LSLELCDPGQ GPAPFQAVVV LIQPGRGLAL RPPPSCLFPP DPTPSPPAGQ IRVKPDRTGV
121 VTDGVKHSMN PFCEIAVEEA VRLKEKKLVK EVIAVSCGPA QCQETIRTAL AMGADRGIHV
181 EVPPAEAERL GPLQVARVLA KLAEKEKVDL VLLGKQAIDD DCNQTGQMTA GFLDWPQGTF
241 ASQVMLEGDK LKVEREIDGG LETLRLKLPA VVTADLRLNE PRYATLPNIM KAKKKKIEVI
301 KPGDLGVDLT SKLSVISVED PPQRTAGVKV ETTEDLVAKL KEIGRI
C.核苷酸及氨基酸组合序列(SEQ ID NO:33)克隆号和蛋白名称:FP585
起始编码子:187ATG终止编码子:1225TGA蛋白质分子量:37462.56
  1 GTG CTG GGC AGC TTG AGT TTT CCC CAG GCT GCT CTA TTG TTG CCT GTA    48
 49 GCT GTG ATT TTT CAG GCA GGC TGC TCC TCT GAG GAC CAC CCT TAA CTG    96
 97 TCT ACC TAA CTG GTT TTT CCT TTT CTT CTC CTC ATT TGT ATT TAT GTA    144
145 TCA GTG TAT TAT GTA TTT ATA TAC ACT TGG AGA TAC AGT AAA ATG TAC    192
  1                                                         Met Tyr    2
193 CTC TCA CTG TGG GTT ACC ATA AAT ACT GTA AAT TTG AGA AAC ACT CTT    240
  3 Leu Ser Leu Trp Val Thr Ile Asn Thr Val Asn Leu Arg Asn Thr Leu    18
241 TCA GGC CTG AGA GGA GCA GTG ACA ACA GTA GGG ATG ATC AAG TCA GAT    288
 19 Ser Gly Leu Arg Gly Ala Val Thr Thr Val Gly Met Ile Lys Ser Asp    34
289 GTC CCT GGT ACC CAG GAA TGG CTG GAT GAG AGA AGG AGA CAG GGT GAC    336
 35 Val Pro Gly Thr Gln Glu Trp Leu Asp Glu Arg Arg Arg Gln Gly Asp    50
337 CTG CCC CTG CCT ACA AAC TCT AAC CCA GTT CTG TCC CTG GAG CTG TGT    384
 51 Leu Pro Leu Pro Thr Asn Ser Asn Pro Val Leu Ser Leu Glu Leu Cys    66
385 GAC CCC GGA CAA GGC CCT GCC CCT TTC CAG GCT GTC GTT GTC CTC ATC    432
 67 Asp Pro Gly Gln Gly Pro Ala Pro Phe Gln Ala Val Val Val Leu Ile    82
433 CAG CCT GGG AGA GGG TTG GCG CTG AGG CCC CCA CCT TCT TGC CTG TTT    480
 83 Gln Pro Gly Arg Gly Leu Ala Leu Arg Pro Pro Pro Ser Cys Leu Phe    98
481 CCT CCT GAC CCC ACC CCT TCC CCT CCT GCT GGG CAG ATC CGA GTG AAG    528
 99 Pro Pro Asp Pro Thr Pro Ser Pro Pro Ala Gly Gln Ile Arg Val Lys    114
529 CCT GAC AGG ACC GGT GTG GTC ACG GAT GGT GTG AAG CAC TCC ATG AAC    576
115 Pro Asp Arg Thr Gly Val Val Thr Asp Gly Val Lys His Ser Met Asn    130
577 CCC TTC TGT GAG ATC GCG GTG GAG GAG GCT GTG CGG CTC AAG GAG AAG    624
131 Pro Phe Cys Glu Ile Ala Val Glu Glu Ala Val Arg Leu Lys Glu Lys    146
625 AAG CTG GTG AAG GAG GTC ATC GCC GTC AGC TGT GGG CCT GCA CAG TGC    672
147 Lys Leu Val Lys Glu Val Ile Ala Val Ser Cys Gly Pro Ala Gln Cys    162
673 CAG GAG ACG ATT CGT ACC GCC CTG GCC ATG GGT GCA GAC CGA GGT ATC    720
163 Gln Glu Thr Ile Arg Thr Ala Leu Ala Met Gly Ala Asp Arg Gly Ile    178
721 CAC GTG GAG GTG CCC CCA GCA GAA GCA GAA CGC TTG GGT CCC CTG CAG    768
179 His Val Glu Val Pro Pro Ala Glu Ala Glu Arg Leu Gly Pro Leu Gln    194
769 GTG GCT CGG GTC CTG GCC AAG CTG GCA GAG AAG GAG AAG GTG GAC CTG    816
 195 Val Ala Arg Val Leu Ala Lys Leu Ala Glu Lys Glu Lys Val Asp Leu    210
 817 GTG CTG CTG GGC AAA CAG GCC ATC GAT GAT GAC TGT AAC CAG ACA GGG    864
 211 Val Leu Leu Gly Lys Gln Ala Ile Asp Asp Asp Cys Asn Gln Thr Gly    226
 865 CAG ATG ACA GCT GGA TTT CTT GAC TGG CCA CAG GGC ACA TTC GCC TCC    912
 227 Gln Met Thr Ala Gly Phe Leu Asp Trp Pro Gln Gly Thr Phe Ala Ser    242
 913 CAG GTG ATG CTG GAG GGG GAC AAG TTG AAA GTG GAG CGG GAG ATC GAT    960
 243 Gln Val Met Leu Glu Gly Asp Lys Leu Lys Val Glu Arg Glu Ile Asp    258
 961 GGG GGC CTG GAG ACC CTG CGC CTG AAG CTG CCA GCT GTG GTG ACA GCT    1008
 259 Gly Gly Leu Glu Thr Leu Arg Leu Lys Leu Pro Ala Val Val Thr Ala    274
1009 GAC CTG AGG CTC AAC GAG CCC CGC TAC GCC ACG CTG CCC AAC ATC ATG    1056
 275 Asp Leu Arg Leu Asn Glu Pro Arg Tyr Ala Thr Leu Pro Asn Ile Met    290
1057 AAA GCC AAG AAG AAG AAG ATC GAG GTG ATC AAG CCT GGG GAC CTG GGT    1104
 291 Lys Ala Lys Lys Lys Lys Ile Glu Val Ile Lys Pro Gly Asp Leu Gly    306
1105 GTG GAC CTG ACC TCC AAG CTC TCT GTG ATC AGT GTG GAG GAC CCG CCC    1152
 307 Val Asp Leu Thr Ser Lys Leu Ser Val Ile Ser Val Glu Asp Pro Pro    322
1153 CAG CGC ACG GCC GGC GTC AAG GTG GAG ACC ACT GAG GAC CTG GTG GCC    1200
 323 Gln Arg Thr Ala Gly Val Lys Val Glu Thr Thr Glu Asp Leu Val Ala    338
1201 AAG CTG AAG GAG ATT GGG CGG ATT TGA GCC CCT CCC AGA GAT GGC AAT    1248
 339 Lys Leu Lys Glu Ile Gly Arg Ile ***                                347
1249 AAA ACT GAC TCT CAA CAT CTA AAA AAA AAA AAA AAA AAA A              1288
12.  FP588
A:核苷酸序列(SEQ ID NO:34)长度:2057个碱基
   1 GCCAAAGTGT TTTTGGTCAT TAACAGGAAG CATCTTTTCT ACATTACGGT TTCATGTGAC
  61 CAAATTATGG CCATAGTATT TCAGATTTAT TCATCCACTA AGTATTTATT AAGTACCTAT
 121 TCTGTGCTAG GTATCAGGTG CTGGGGCTAT AGCAGTAAGG AAAGTAAGTG GACAAAAGGA
 181 TTCCACACCT GTCACAGGCG CTGCCCCACT CCCTGAGTCA GGTGAGATGA GCTCCGGAAG
 241 GCAGGTGGGT AATGGATGAT GCTCACCTAG TGTTCCTTGG GCCATGAAGA TCAAATATTT
 301 CAGCCCCATA GGATGTGTAA GCTTGATTTC TGGTCATCTC TCCTTAAGGA ATCATGGACC
 361 ATTCATTATT TTGTTTAAAA GGACACATAA GAACGTACAT GTCTCAATAG AGTTACTGGT
  42 CACAGGACTG AACTGTGGTC ATGAAAGCCA AGCAACTTAC TTTCTGGCCT CCATATTGCT
 481 TTGTAGGAGA AATGATACTG ACAATGATGT CACACGAGGA GGGAAGCCAG GCACGAATCT
 541 GGTGGAGGTG CGGTCAGTTG TGACCAGCTT TGCAAAGGGA GCGGTGGGCG AGGCTGTGGT
 601 CTCTCCCAGG TGACCTCCAT CGCCATGCAG AGCTGCTCTC ACTTCTCCTC GGGAAAGGCC
 661 AGCGTCAGGT ATTCCTAGGA GGAAGCCCAG GTGTGTCCAG AGAACAGTAG TCTTGTTAGA
 721 ACTGGAAAAA TGTCTTATGG CCAGGTGGCC CCTGGTCTGA AGGAAAAATA GGAGCTGAGT
 781 GTGAACTTTT ATCACTCAGA AGATATAATC CACCTCTCCC CTCCTGCCCT TCGCTCCTGG
 841 GTTGGTTGTG AGGACAGTGC TTTGTGACAG CAGTGGAGCC CTGTCTGTCC TTCCGGGCTA
 901 GATTTCTTCT TTCTCTTATT CCTCCTGTTT CGTTGTATCC ACGATTTGTC GAGTTGCAGG
 961 GCTCACCCTT TCCTGAAGAA ACCATCTCTT TTCCCAGCTC CGCACCTTTG TCCGAGATGG
1021 AGGCGTGTCC TCCCGCCCAT CCCCAGTGGG GGGTGTTCTG CCCATTCTCC AGAGCCCAGC
1081 ACTGCTCCCA TCTCTTTTCC TCCCTCTCCT TCCCCTTGCT GTTACCTGCT GCCTTCTTGT
1141 GCTCCCACTG CCCTTGGCCA TCCCTCTGTG TCATTGTGCG CTGTGGTGCA CCTGTCTTCT
1201 CTACTACACC TTAAGAGCAG GACTCTGCCT CCTTCCTACC AGCACCTCAT GCAGCAAGTG
1261 CTGCCAATAG CAGGCACCCA GCAGATAGCG AATGCACGAC TCCAAAACCC AGCTTTGCCT
1321 CCTGGCTGTA GTTCAGACTA GCTGTGTGAC ACTGACCAAG ACACTTGACC TCTCTCAGAC
1381 TCAGCTTCCT CCTTGAAGAC TGGGATGCTA TGTAGCTCAG AGGAAACATA CACCTGAAGG
1441 TGCTGCCCCG GGGGGTGCAA TGACCTGTTA CTGAGGCTGG ATGGAGGATG GCATCCATCA
1501 TCAGCTACAG GTGCCTCCTC TATCTACAGG TTCCTGCTCC ATCTATACTA GCCACCTCCT
1561 GGACAAGGGC TCCAGTGTCC TCCATGACAC CAGCTTTCTC CAGAGCCTGT GCAGGATTTC
1621 CTTCCTCTAC CCTGAATCAG GGTGATTCTT AAAGGACAGT TTCAGGAACA TATAGGGGCA
1681 CTTGGGTAAT CTTGGTCAGT AACTGACCTT TAACTATCAT CCATGTGAAC ATCTACAGTT
1741 AGGGATTTTC TTGGTGATGT TTGGCAAAAA GTAAAGAATT CCCCAAGTGT GAAGCCTCAT
1801 TCATTCACTT ATTCAACAAA TAGTTATTGA GCACCTACTA TGTGTTAGGC CCTGGGCCAG
1861 GTGCTGGGAA TACAGCAGAG ACAGACCTGG CTCCTGCCCT CATGGAGTTT GCAGTCATTC
1921 ATTCACTCAC TCGGTGACTT TGGACACCTC CCCCTCCTCT CTCCAGGCTT TAGATCTCTG
1981 AGATTCTCTC TGAGTCTGGG ATGTAAAGAC AAAGTAAAAC CTGAAATCTG GAAAGCAAAA
2041 AAAAAAAAAA AAAAAAA
B:核苷酸序列(SEQ ID NO:35)长度:109个氨基酸
 1 MKIKYFSPIG CVSLISGHLS LRNHGPFIIL FKRTHKNVHV SIELLVTGLN CGHESQATYF
61 LASILLCRRN DTDNDVTRGG KPGTNLVEVR SVVTSFAKGA VGEAVVSPR
C.核苷酸及氨基酸组合序列(SEQ ID NO:36)克隆号和蛋白名称:FP588
起始编码子:284 ATG 终止编码子:611 TGA 蛋白质分子量:11862.16
   1   G CCA AAG TGT TTT TGG TCA TTA ACA GGA AGC ATC TTT TCT ACA TTA    46
  47 CGG TTT CAT GTG ACC AAA TTA TGG CCA TAG TAT TTC AGA TTT ATT CAT    94
  95 CCA CTA AGT ATT TAT TAA GTA CCT ATT CTG TGC TAG GTA TCA GGT GCT    142
 143 GGG GCT ATA GCA GTA AGG AAA GTA AGT GGA CAA AAG GAT TCC ACA CCT    190
 191 GTC ACA GGC GCT GCC CCA CTC CCT GAG TCA GGT GAG ATG AGC TCC GGA    238
 239 AGG CAG GTG GGT AAT GGA TGA TGC TCA CCT AGT GTT CCT TGG GCC ATG    286
   1                                                             Met    1
 287 AAG ATC AAA TAT TTC AGC CCC ATA GGA TGT GTA AGC TTG ATT TCT GGT    334
   2 Lys Ile Lys Tyr Phe Ser Pro Ile Gly Cys Val Ser Leu Ile Ser Gly    17
 335 CAT CTC TCC TTA AGG AAT CAT GGA CCA TTC ATT ATT TTG TTT AAA AGG    382
  18 His Leu Ser Leu Arg Asn His Gly Pro Phe Ile Ile Leu Phe Lys Arg    33
 383 ACA CAT AAG AAC GTA CAT GTC TCA ATA GAG TTA CTG GTC ACA GGA CTG    430
  34 Thr His Lys Asn Val His Val Ser Ile Glu Leu Leu Val Thr Gly Leu    49
 431 AAC TGT GGT CAT GAA AGC CAA GCA ACT TAC TTT CTG GCC TCC ATA TTG    478
  50 Asn Cys Gly His Glu Ser Gln Ala Thr Tyr Phe Leu Ala Ser Ile Leu    65
 479 CTT TGT AGG AGA AAT GAT ACT GAC AAT GAT GTC ACA CGA GGA GGG AAG    526
  66 Leu Cys Arg Arg Asn Asp Thr Asp Asn Asp Val Thr Arg Gly Gly Lys    81
 527 CCA GGC ACG AAT CTG GTG GAG GTG CGG TCA GTT GTG ACC AGC TTT GCA    574
  82 Pro Gly Thr Asn Leu Val Glu Val Arg Ser Val Val Thr Ser Phe Ala    97
 575 AAG GGA GCG GTG GGC GAG GCT GTG GTC TCT CCC AGG TGA CCT CCA TCG    622
  98 Lys Gly Ala Val Gly Glu Ala Val Val Ser Pro Arg ***                110
 623 CCA TGC AGA GCT GCT CTC ACT TCT CCT CGG GAA AGG CCA GCG TCA GGT    670
 671 ATT CCT AGG AGG AAG CCC AGG TGT GTC CAG AGA ACA GTA GTC TTG TTA    718
 719 GAA CTG GAA AAA TGT CTT ATG GCC AGG TGG CCC CTG GTC TGA AGG AAA    766
 767 AAT AGG AGC TGA GTG TGA ACT TTT ATC ACT CAG AAG ATA TAA TCC ACC    814
 815 TCT CCC CTC CTG CCC TTC GCT CCT GGG TTG GTT GTG AGG ACA GTG CTT    862
 863 TGT GAC AGC AGT GGA GCC CTG TCT GTC CTT CCG GGC TAG ATT TCT TCT    910
 911 TTC TCT TAT TCC TCC TGT TTC GTT GTA TCC ACG ATT TGT CGA GTT GCA    958
 959 GGG CTC ACC CTT TCC TGA AGA AAC CAT CTC TTT TCC CAG CTC CGC ACC    1006
1007 TTT GTC CGA GAT GGA GGC GTG TCC TCC CGC CCA TCC CCA GTG GGG GGT    1054
1055 GTT CTG CCC ATT CTC CAG AGC CCA GCA CTG CTC CCA TCT CTT TTC CTC    1102
1103 CCT CTC CTT CCC CTT GCT GTT ACC TGC TGC CTT CTT GTG CTC CCA CTG    1150
1151 CCC TTG GCC ATC CCT CTG TGT CAT TGT GCG CTG TGG TGC ACC TGT CTT    1198
1199 CTC TAC TAC ACC TTA AGA GCA GGA CTC TGC CTC CTT CCT ACC AGC ACC    1246
1247 TCA TGC AGC AAG TGC TGC CAA TAG CAG GCA CCC AGC AGA TAG CGA ATG    1294
1295 CAC GAC TCC AAA ACC CAG CTT TGC CTC CTG GCT GTA GTT CAG ACT AGC    1342
1343 TGT GTG ACA CTG ACC AAG ACA CTT GAC CTC TCT CAG ACT CAG CTT CCT    1390
1391 CCT TGA AGA CTG GGA TGC TAT GTA GCT CAG AGG AAA CAT ACA CCT GAA    1438
1439 GGT GCT GCC CCG GGG GGT GCA ATG ACC TGT TAC TGA GGC TGG ATG GAG    1486
1487 GAT GGC ATC CAT CAT CAG CTA CAG GTG CCT CCT CTA TCT ACA GGT TCC    1534
1535 TGC TCC ATC TAT ACT AGC CAC CTC CTG GAC AAG GGC TCC AGT GTC CTC    1582
1583 CAT GAC ACC AGC TTT CTC CAG AGC CTG TGC AGG ATT TCC TTC CTC TAC    1630
1631 CCT GAA TCA GGG TGA TTC TTA AAG GAC AGT TTC AGG AAC ATA TAG GGG    1678
1679 CAC TTG GGT AAT CTT GGT CAG TAA CTG ACC TTT AAC TAT CAT CCA TGT    1726
1727 GAA CAT CTA CAG TTA GGG ATT TTC TTG GTG ATG TTT GGC AAA AAG TAA    1774
1775 AGA ATT CCC CAA GTG TGA AGC CTC ATT CAT TCA CTT ATT CAA CAA ATA    1822
1823 GTT ATT GAG CAC CTA CTA TGT GTT AGG CCC TGG GCC AGG TGC TGG GAA    1870
1871 TAC AGC AGA GAC AGA CCT GGC TCC TGC CCT CAT GGA GTT TGC AGT CAT    1918
1919 TCA TTC ACT CAC TCG GTG ACT TTG GAC ACC TCC CCC TCC TCT CTC CAG    1966
1967 GCT TTA GAT CTC TGA GAT TCT CTC TGA GTC TGG GAT GTA AAG ACA AAG    2014
2015 TAA AAC CTG AAA TCT GGA AAG CAA AAA AAA AAA AAA AAA AAA A          2057
13.FP757
A:核苷酸序列(SEQ ID NO:37)长度:1932个碱基
   1 GGAATCATTT TTTGAGGAGC GGGGGTACAG TTTAGTTTTG TTTCTACTTT TACCTTTTTT
  61 TTAAAATTAT TTAACTCTTT ATAACATGAT TTTTAAATGT ACACAAAGAT AAAAGGAAAA
 121 TTACAATGAA CACCTGTGTT CTAGTCATTT GGCTTCAACA GCTGTTATTT TCCTTTAATA
 181 GATAAGTATG GAAGAGTGGA AGCTTGCTTT CATCTTACTC CTCTGCCTTT CTCCCTAAAA
 241 CTCTCTCTTC CCACCCTATT ACTCAGAAAT CTTTTCCTCA TTCTTTATGT GTACTGTAAT
 301 ATATTTCATG AATCTCATGT GAAATTTTCT CTGTAATACA TATAGTATTC AATCTGTAAC
 361 CACTAAGAGC ACTTTGCAGA GTTAAAAATC TGGGATTTAT AGCAGTATTA ATTTTATTTA
 421 ATAAACTATG AAGTTAAATA TAAATATCAT CTGGGGTTTA TAGCAGTATT AATTTTAACA
 481 AGTAAGCTTA ATGTCATTGT CTTTTAGCAA ACTGAAACCG TGTCAGTTCA GTCTTCGGTA
 541 TTGGGGAAGG GTGTAAAACA TCGACCCCCA CCAATCAAAC TTCCCTCAAG CTCAGGAAAT
 601 AGTTCCTCAG GTAACTATTT TACACCACAA CAGACAAGCA GCTTTCTCAA ATCTCCAACT
 661 CCTCCTCCTT CTTCTAAGCC ATCAAGTATT CCTCGGAAAT CATCTGTGGA TCTCAATCAA
 721 GTTAGCATGC TTTCTCCAGC TGCCCTATCA CCTGCCAGCT CATCACAAAG AACCACGGCC
 781 ACCCAGGTCA TGGCAAACTC TGCTGGACTT AACTTCATCA ATGTAGTGGG CTCTGTTTGT
 841 GGGGCCCAGG CTTTGATGAG TGGTCAAACC CCATGCTGGG CTGTAACACT GGTGCCATAA
 901 CTCCTGCAGG AATAAACCTG AGCGGCCTTC TACCCTCAGG AGGTCTGCTA CCAAATGCAC
 961 TGCCCAGTGC AATGCAGGCA GCTTCTCAAG CAGGTGTTCC ATTTGGTTTA AAAAATACTT
1021 CAAGTCTCAG GCCCTTAAAT CTACTCCAGC TTCCAGGTGG TTCACTTATT TTTAACACTC
1081 TGCAGCAGCA GCAACAGCAG CTCTCCCAGT TTACACCACA ACAACCTCAG CAGCCCACAA
1141 CTTGTAGTCC TCAACAGCCA GGGGAGCAGG GTTCTGAGCA AGGTTCAACC AGTCAAGAAC
1201 AGGCCTTATC TGCTCAGCAA GCTGCTGTTA TTAACCTTAC TGGAGTAGGA AGTTTTATGC
1261 AGTCACAGGC AGCTGTGTTG TCTCAGCTTG GCTCTGCCGA GAACAGACCT GAGCAAAGCC
1321 TTCCTCAGCA GAGATTCCAG CTCTCCTCTG CCTTTCAACA GCAGCAGCAA CAGATACAAC
1381 AGTTGCGATT CTTGCAGCAT CAAATGGCTA TGGCAGCAGC AGCAGCACAA ACAGCTCAGC
1441 TACATCATCA TCGGCATACA GGCAGCCAGT CAAAAAGTAA AATGAAGAGA GGCATGCCAA
1501 CCACTCCAAA ATTTTGAGTC TTGCATTACT TTTTGTTCCT TTTTTAAAAA CACAAGAGCA
1561 CTGAATCAAA AGAATTGAGT TTCTACTTTT TGTTTTTTTT AATGTGTCAG TATTTTACAT
1621 TGCTAGATGT ACAAACTTTA TACAGAAGCA CAACCTTATC ATTTTTAAAT AAAAACAGGG
1681 AAATGGTTTA ACAAACTAGG GTTGGTTTGC CTAAGTCATT GCTTTTTAAA AATGGTTTCA
1741 CTATACATAA TATATATGGA AGTGACCTAA GAAATAATAG AAACATCTTT CAGAAGAATG
1801 TAGTTTGATA TTTATTTAGT ATAAAACGTT TGTGCACAGT GTTAACAAAT ACAATTTTTA
1861 CAAATCTGTT TTGAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
1921 AAAAAAAAAA AA
B:核苷酸序列(SEQ ID NO:38)长度:214个氨基酸
  1 MLGCNTGAIT PAGINLSGLL PSGGLLPNAL PSAMQAASQA GVPFGLKNTS SLRPLNLLQL
 61 PGGSLIFNTL QQQQQQLSQF TPQQPQQPTT CSPQQPGEQG SEQGSTSQEQ ALSAQQAAVI
121 NLTGVGSFMQ SQAAVLSQLG SAENRPEQSL PQQRFQLSSA FQQQQQQIQQ LRFLQHQMAM
181 AAAAAQTAQL HHHRHTGSQS KSKMKRGMPT TPKF
C.核苷酸及氨基酸组合序列(SEQ ID NO:39)克隆号和蛋白名称:FP757
起始编码子:873 ATG 终止编码子:1519 TGA 蛋白质分子量:22775.56
   1  GG AAT CAT TTT TTG AGG AGC GGG GGTACA GTT TAG TTT TGT TTC TAC     47
  48 TTT TAC CTT TTT TTT AAA ATT ATT TAA CTC TTT ATA ACA TGA TTT TTA    95
  96 AAT GTA CAC AAA GAT AAA AGG AAA ATT ACA ATG AAC ACC TGT GTT CTA    143
 144 GTC ATT TGG CTT CAA CAG CTG TTA TTT TCC TTT AAT AGA TAA GTA TGG    191
 192 AAG AGT GGA AGC TTG CTT TCA TCT TAC TCC TCT GCC TTT CTC CCT AAA    239
 240 ACT CTC TCT TCC CAC CCT ATT ACT CAG AAA TCT TTT CCT CAT TCT TTA    287
 288 TGT GTA CTG TAA TAT ATT TCA TGA ATC TCA TGT GAA ATT TTC TCT GTA    335
 336 ATA CAT ATA GTA TTC AAT CTG TAA CCA CTA AGA GCA CTT TGC AGA GTT    383
 384 AAA AAT CTG GGA TTT ATA GCA GTA TTA ATT TTA TTT AAT AAA CTA TGA    431
 432 AGT TAA ATA TAA ATA TCA TCT GGG GTT TAT AGC AGT ATT AAT TTT AAC    479
 480 AAG TAA GCT TAA TGT CAT TGT CTT TTA GCA AAC TGA AAC CGT GTC AGT    527
 528 TCA GTC TTC GGT ATT GGG GAA GGG TGT AAA ACA TCG ACC CCC ACC AAT    575
 576 CAA ACT TCC CTC AAG CTC AGG AAA TAG TTC CTC AGG TAA CTA TTT TAC    623
 624 ACC ACA ACA GAC AAG CAG CTT TCT CAA ATC TCC AAC TCC TCC TCC TTC    671
 672 TTC TAA GCC ATC AAG TAT TCC TCG GAA ATC ATC TGT GGA TCT CAA TCA    719
 720 AGT TAG CAT GCT TTC TCC AGC TGC CCT ATC ACC TGC CAG CTC ATC ACA    767
 768 AAG AAC CAC GGC CAC CCA GGT CAT GGC AAA CTC TGC TGG ACT TAA CTT    815
 816 CAT CAA TGT AGT GGG CTC TGT TTG TGG GGC CCA GGC TTT GAT GAG TGG    863
 864 TCA AAC CCC ATG CTG GGC TGT AAC ACT GGT GCC ATA ACT CCT GCA GGA    911
   1             Met Leu Gly Cys Asn Thr Gly Ala Ile Thr Pro Ala Gly    13
 912 ATA AAC CTG AGC GGC CTT CTA CCC TCA GGA GGT CTG CTA CCA AAT GCA    959
  14 Ile Asn Leu Ser Gly Leu Leu Pro Ser Gly Gly Leu Leu Pro Asn Ala    29
 960 CTG CCC AGT GCA ATG CAG GCA GCT TCT CAA GCA GGT GTT CCA TTT GGT    1007
  30 Leu Pro Ser Ala Met Gln Ala Ala Ser Gln Ala Gly Val Pro Phe Gly    45
1008 TTA AAA AAT ACT TCA AGT CTC AGG CCC TTA AAT CTA CTC CAG CTT CCA    1055
  46 Leu Lys Asn Thr Ser Ser Leu Arg Pro Leu Asn Leu Leu Gln Leu Pro    61
1056 GGT GGT TCA CTT ATT TTT AAC ACT CTG CAG CAG CAG CAA CAG CAG CTC    1103
  62 Gly Gly Ser Leu Ile Phe Asn Thr Leu Gln Gln Gln Gln Gln Gln Leu    77
1104 TCC CAG TTT ACA CCA CAA CAA CCT CAG CAG CCC ACA ACT TGT AGT CCT    1151
  78 Ser Gln Phe Thr Pro Gln Gln Pro Gln Gln Pro Thr Thr Cys Ser Pro    93
1152 CAA CAG CCA GGG GAG CAG GGT TCT GAG CAA GGT TCA ACC AGT CAA GAA    1199
  94 Gln Gln Pro Gly Glu Gln Gly Ser Glu Gln Gly Ser Thr Ser Gln Glu    109
1200 CAG GCC TTA TCT GCT CAG CAA GCT GCT GTT ATT AAC CTT ACT GGA GTA    1247
 110 Gln Ala Leu Ser Ala Gln Gln Ala Ala Val Ile Asn Leu Thr Gly Val    125
1248 GGA AGT TTT ATG CAG TCA CAG GCA GCT GTG TTG TCT CAG CTT GGC TCT    1295
 126 Gly Ser Phe Met Gln Ser Gln Ala Ala Val Leu Ser Gln Leu Gly Ser    141
1296 GCC GAG AAC AGA CCT GAG CAA AGC CTT CCT CAG CAG AGA TTC CAG CTC    1343
 142 Ala Glu Asn Arg Pro Glu Gln Ser Leu Pro Gln Gln Arg Phe Gln Leu    157
1344 TCC TCT GCC TTT CAA CAG CAG CAG CAA CAG ATA CAA CAG TTG CGA TTC    1391
 158 Ser Ser Ala Phe Gln Gln Gln Gln Gln Gln Ile Gln Gln Leu Arg Phe    173
1392 TTG CAG CAT CAA ATG GCT ATG GCA GCA GCA GCA GCA CAA ACA GCT CAG    1439
 174 Leu Gln His Gln Met Ala Met Ala Ala Ala Ala Ala Gln Thr Ala Gln    189
1440 CTA CAT CAT CAT CGG CAT ACA GGC AGC CAG TCA AAA AGT AAA ATG AAG    1487
 190 Leu His His His Arg His Thr Gly Ser Gln Ser Lys Ser Lys Met Lys    205
1488 AGA GGC ATG CCA ACC ACT CCA AAA TTT TGA GTC TTG CAT TAC TTT TTG    1535
 206 Arg Gly Met Pro Thr Thr Pro Lys Phe ***                            215
1536 TTC CTT TTT TAA AAA CAC AAG AGC ACT GAA TCA AAA GAA TTG AGT TTC    1583
1584 TAC TTT TTG TTT TTT TTA ATG TGT CAG TAT TTT ACA TTG CTA GAT GTA    1631
1632 CAA ACT TTA TAC AGA AGC ACA ACC TTA TCA TTT TTA AAT AAA AAC AGG    1679
1680 GAA ATG GTT TAA CAA ACT AGG GTT GGT TTG CCT AAG TCA TTG CTT TTT    1727
1728 AAA AAT GGT TTC ACT ATA CAT AAT ATA TAT GGA AGT GAC CTA AGA AAT    1775
1776 AAT AGA AAC ATC TTT CAG AAG AAT GTA GTT TGA TAT TTA TTT AGT ATA    1823
1824 AAA CGT TTG TGC ACA GTG TTA ACA AAT ACA ATT TTT ACA AAT CTG TTT    1871
1872 TGA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    1919
1920 AAA AAA AAA AAA A                                                  1932

Claims (5)

1.一种分离的多核苷酸,其特征在于,它选自下组:
(a)编码以下多肽的多核苷酸,所述的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38;
(b)与多核苷酸(a)互补的多核苷酸。
2.如权利要求1所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38。
3.如权利要求1所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36、39的编码区序列或全长序列。
4.一种载体,其特征在于,它含有权利要求1所述的多核苷酸。
5.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求4所述的载体转化或转导的宿主细胞;
(b)用权利要求1所述的多核苷酸转化或转导的宿主细胞。
CNB011267232A 2001-09-12 2001-09-12 编码具有抑癌功能的人蛋白的多核苷酸 Expired - Fee Related CN1177047C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB011267232A CN1177047C (zh) 2001-09-12 2001-09-12 编码具有抑癌功能的人蛋白的多核苷酸

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB011267232A CN1177047C (zh) 2001-09-12 2001-09-12 编码具有抑癌功能的人蛋白的多核苷酸

Publications (2)

Publication Number Publication Date
CN1403475A CN1403475A (zh) 2003-03-19
CN1177047C true CN1177047C (zh) 2004-11-24

Family

ID=4666730

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB011267232A Expired - Fee Related CN1177047C (zh) 2001-09-12 2001-09-12 编码具有抑癌功能的人蛋白的多核苷酸

Country Status (1)

Country Link
CN (1) CN1177047C (zh)

Also Published As

Publication number Publication date
CN1403475A (zh) 2003-03-19

Similar Documents

Publication Publication Date Title
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1177047C (zh) 编码具有抑癌功能的人蛋白的多核苷酸
CN1155615C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1169954C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1177048C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1177864C (zh) 在肝癌组织中具有表达差异的新的人蛋白及其编码序列
CN1209373C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1177050C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199997C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1160370C (zh) 新的人细胞周期控制相关蛋白及其编码序列
CN1199998C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1222616C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1932016A (zh) 影响sre活性的多核苷酸及其编码多肽和用途
CN1246457C (zh) 人tsc403基因和人ing1l基因
CN1231496C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1177049C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199995C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1194989C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1231497C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1155616C (zh) 具有促进癌细胞生长功能的新的人蛋白及其编码序列
CN1169955C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1190446C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1199994C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1230445C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1229386C (zh) 具有抑癌功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee