CN1403475A - 具有抑癌功能的新的人蛋白及其编码序列 - Google Patents

具有抑癌功能的新的人蛋白及其编码序列 Download PDF

Info

Publication number
CN1403475A
CN1403475A CN01126723A CN01126723A CN1403475A CN 1403475 A CN1403475 A CN 1403475A CN 01126723 A CN01126723 A CN 01126723A CN 01126723 A CN01126723 A CN 01126723A CN 1403475 A CN1403475 A CN 1403475A
Authority
CN
China
Prior art keywords
ctg
cag
leu
cct
gag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN01126723A
Other languages
English (en)
Other versions
CN1177047C (zh
Inventor
顾健人
杨胜利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd
Original Assignee
SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd filed Critical SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd
Priority to CNB011267232A priority Critical patent/CN1177047C/zh
Publication of CN1403475A publication Critical patent/CN1403475A/zh
Application granted granted Critical
Publication of CN1177047C publication Critical patent/CN1177047C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。

Description

具有抑癌功能的新的人蛋白及其编码序列
技术领域
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸和此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
背景技术
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
发明内容
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36、39的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
具体实施方式
3T3细胞是一种小鼠成纤维细胞(J.Cell.Biol.,17:299,1963)(也称为NIH/3T3细胞)。在癌症研究领域中,常将外源基因(尤其是人基因)引入3T3细胞,观察其对3T3细胞生长的影响情况。通常认为,对3T3细胞生长有影响的基因是癌症相关基因,其中对3T3细胞生长有抑制作用的基因大多是抑癌基因,而对3T3细胞生长有促进作用的基因大多是(原)癌基因。
本发明采用大规模cDNA克隆转染小鼠胚胎成纤维细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对3T3细胞具有抑制克隆形成的作用,其抑制率≥50%。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP10513蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”对于PP10513而言是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。再以PP10764蛋白为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体;“简并的变异体”对于PP10764而言是指编码具有SEQ ID NO:5的蛋白质,但与SEQ IDNO:6所示的编码区序列有差别的核酸序列。对于本发明的其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽有相同的生物学功能(以PP10513蛋白为例)和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold SpringHarbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明多核苷酸的载体,以及用本发明载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的1ac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将本发明蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,etal.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。这些抗体可用常规方法制备。抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与本发明蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而现在只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:cDNA基因的获得及对小鼠NIH/3T3细胞克隆形成的抑制作用
PP10513、PP10764、PP12100、PP12488、PP12494、PP12901、PP13275、PP13296和PP14214是通过用常规方法构建人胎盘cDNA文库获得的;FP497、FP585、FP588和FP757是通过用常规方法构建人胎儿cDNA文库获得的。取3、6、9月龄的胎盘组织(PP克隆)或胎儿组织(FP克隆),用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXRcDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑制癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染小鼠NIH/3T3细胞。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的小鼠NIH/3T3细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克隆形成,计数。发现上述克隆有抑制细胞克隆形成作用,结果如下表所示。
                 cDNA克隆转染细胞(3T3)克隆形成情况
cDNA克隆名称       cDNA克隆数(三个重复)     空载体克隆数(三个重复)
    PP10513     10     13     16     13     12     15
    PP10764     17     13     19     13     12     15
    PP12100     10     19     13     13     12     15
    PP12488     6     3     5     13     12     15
    PP12494     13     19     15     13     12     15
    PP12901     7     5     3     13     12     15
    PP13275     15     14     16     13     12     15
    PP13296     16     10     18     13     12     15
    PP14214     2     2     2     13     12     15
    FP497     11     8     13     13     12     15
    FP585     5     3     9     13     12     15
    FP588     9     6     7     13     12     15
    FP757     12     10     9     13     12     15
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28、31、34、37)。
实施例2:从胎盘或胎儿cDNA中PCR获得全长基因和重组蛋白的表达
取3、6、9月龄的胎盘组织(PP克隆)或胎儿组织(FP克隆),用Trizol试剂(GIBCOBRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-Superscript II(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘或胎儿cDNA。利用各个基因的特异引物(如下表所示),按97℃3’1个循环。94℃30″ 60℃30″ 72℃1’35个循环,72℃10’1个循环进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,获得重组蛋白(SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38)。
                                 基因特异引物
克隆名称 特异引物1(5’→3’) 特异引物2(3’→5’)
PPl0513 (76)ACCAACGCCTCTTCCCTC  CTCCACCCACCTAGTGCT(1424)
PP10764 (360)GAGCCTATCTACCAACCACC  CACCCAGACAAGGACCAA(1476)
PP12100 (1)GTGGGATTACAGGCGTGAG  GAGTGAGAACCAGAAACCCAG(1415)
PP12488 (3)TGAGCGCCACCCGGAGTC  ATGGTGAGCGTCCCCGTT(1508)
PP12494 (1)GCTTGACCCATCCTCTAC  GCTTTGGACTGAACCTAA(3248)
PP12901 (294)CATTCCCACCTTCCTCAC  AACACCTCCGATTCCGTC(2424)
PP13275 (9)GCTGATCCGTCTGTTGGG  AATGAGGGAGCATGTACGT(3123)
PP13296 (63)TTGGGCTGAGCAGAGGAC  GAAGGGTAATTTGAACTTG(2306)
PP14214 (180)GAGCCCATCCAGGACACT  AACTCTTCAAACAGAACGTT(636)
FP497 (19)GGGGCTGTCATCATCAGA  TTTCGTCCCAAGTTCCTT(2411)
FP585 (82)GACCACCCTTAACTGTCTACCT  TCTAACCCGCCTAAACTC(1228)
FP588 (27)GAAGCATCTTTTCTACATTAC  AATAACTCGTGGATGATACAC(1844)
FP757 (23)GGGTACAGTTTAGTTTTG  CGGATTCAGTAACGAAAA(1726)
实施例3:cDNA克隆序列分析
1.PP10513
A:核苷酸序列(SEQ ID NO:1)长度:1494个碱基1  GAGAGAGAGC  GAGAGAGAGA  GAGAGAGAGA  GAGAGAGAGA  GAGAGAGAGA  GAGAGCCTCC61  TTGGCAGACT  GGGACACCAA  CGCCTCTTCC  CTCTTGGGCT  GACACCGAGC  TGTAAATGTC121  AGTGGACATT  TAAATACTGC  GGTTACACAT  TCGATGTCCT  GTCTGCAATG  GAGCCGGGTT181  CTGTAAACAT  AAGCTGCATG  GCGAAATCGG  ATCATCATCG  CCCATCAAGC  TCTTTGGCAG241  CAGTGCTGTA  ATCAGTGCAA  ACATTTATTT  ATATAAATGC  TCCCATCCCC  TCGGCATGAA301  GATATACTTA  GGCTCTCTCA  ATGGACAGCC  ACGCCACAAG  CCCAGGAATG  AGAGCTTGTC361  AGATACTGAG  GCTGTTTTCA  GAGCCAGTGT  TCGGCTGAAG  TGGCACAGAA  GCTATCATTG421  TTTGCAAATC  TCTGCTGCTT  GTCAAGCCAC  AGGGTTAAGT  AACCCCGGAT  GTTGCGAACA481  CTCTGAAGTG  CTGACCTGCA  GTGTCTTTTT  GGATCACTGA  GCCCTCAGGC  AGACAGGCTG541  TACGTGGCCG  ACACGTCATG  GCTGCTGTCT  TGCACTTAAC  CCTCTTTATC  TTTAGACCTT601  GATTGTGCAC  CTGTTTCTCA  TTGGAAGCTA  ATGACAATCC  ACGAAGCGGC  TTGGCAGTGA661  CTTGTCTCTT  GATTGTGTAA  GGAGGGGTTG  CCACATTCAC  CCATGTTGTT  GACTTTCAAC721  TGTACACTTG  AAAACGTCAA  AAGTCAGAGT  AAGCATTGCC  TCATGTCTCC  GAGTGTAGCA781  ATTCTAGGAA  AACTCTTCCG  AATGGGTTTA  AAGTCAAACA  AATCCAATCA  AAACAGACTT841  GCAGGGCCAG  GCAGCGGTGG  CTCATGCCTG  CAATCCCAGC  ACTTTGGGAA  GCCAAGGTGG901  GCAGATCACT  TGAGGTCAGG  AGTTGGAGAC  CAGCCTGGCC  AACGTGGTGA  GAGCCCATCT961  GTACTAAAAA  TACAAAAATT  TGCTGAGCCT  GGTGGCAGGC  GCCTGTAGTC  TCAGCCTCCC1021  GAGTGGCTGG  GACTACAGGC  ACATGCAACC  ACACCCGGCT  CATGTTTTGC  ATTTTTAGTA1081  CAGACCGGGT  TTCACCGTGT  TGGCCAGGAT  CGTCTTGATA  TCGTGACCTC  GTGAACCGCC1141  CGCCTTGGCC  TCCCAAAGTG  CTGGGATGAC  AGGTGTGAGA  GTTCAGCAGT  ATTAACTACA1201  TTCATGTTAA  TGATGCGACC  ATCACCAACA  TTCATTTCCA  GAACACTCTG  TCCCCAGTAA1261  ACAACATGTC  CCCGTTCCTC  CCAGCCACTG  GTACCTACCA  TTCTACTTTC  TGTTTGTATA
1321  AACTTGACAA  CTCTAGGGTC  CTCATATAAG  TGGAATCCAG  CTGGGCCCAG  TGGCTCACAC
1381  CTGTCATCCC  GGCACTTTGG  GAGGCCGAGG  TGGGTGGATC  ACGAGGTCAG  GAGATTGAGA
1441  CCATCCTGGC  CAATATGGGG  AAACCCCGTC  TCTACTAAAA  AAAATAAAAA  AAAAB:核苷酸序列(SEQ ID NO:2)长度:101个氨基酸
 1  MLLTFNCTLE  NVKSQSKHCL  MSPSVAILGK  LFRMGLKSNK  SNQNRLAGPG  SGGSCLQSQH
61  FGKPRWADHL  RSGVGDQPGQ  RGESPSVLKI  QKFAEPGGRR  LC.核苷酸及氨基酸组合序列(SEQ ID NO:3)克隆号和蛋白名称:PP10513起始编码子:703 ATG  终止编码子:1006 TAG  蛋白质分子量:10947.08(注:(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿。)1  GAG AGA GAG CGA GAG AGA GAG AGA GAG AGA GAG AGA GAG AGA GAG AGA      4849  GAG AGA GCC TCC TTG GCA GAC TGG GAC ACC AAC GCC TCT TCC CTC TTG      9697  GGC TGA CAC CGA GCT GTA AAT GTC AGT GGA CAT TTA AAT ACT GCG GTT     144145  ACA CAT TCG ATG TCC TGT CTG CAA TGG AGC CGG GTT CTG TAA ACA TAA     192193  GCT GCA TGG CGA AAT CGG ATC ATC ATC GCC CAT CAA GCT CTT TGG CAG     240241  CAG TGC TGT AAT CAG TGC AAA CAT TTA TTT ATA TAA ATG CTC CCA TCC     288289  CCT CGG CAT GAA GAT ATA CTT AGG CTC TCT CAA TGG ACA GCC ACG CCA     336337  CAA GCC CAG GAA TGA GAG CTT GTC AGA TAC TGA GGC TGT TTT CAG AGC     384385  CAG TGT TCG GCT GAA GTG GCA CAG AAG CTA TCA TTG TTT GCA AAT CTC     432433  TGC TGC TTG TCA AGC CAC AGG GTT AAG TAA CCC CGG ATG TTG CGA ACA     480481  CTC TGA AGT GCT GAC CTG CAG TGT CTT TTT GGA TCA CTG AGC CCT CAG     528529  GCA GAC AGG CTG TAC GTG GCC GAC ACG TCA TGG CTG CTG TCT TGC ACT     576577  TAA CCC TCT TTA TCT TTA GAC CTT GAT TGT GCA CCT GTT TCT CAT TGG     624625  AAG CTA ATG ACA ATC CAC GAA GCG GCT TGG CAG TGA CTT GTC TCT TGA     672673  TTG TGT AAG GAG GGG TTG CCA CAT TCA CCC ATG TTG TTG ACT TTC AAC     7201                                          Met Leu Leu Thr Phe Asn       6721  TGT ACA CTT GAA AAC GTC AAA AGT CAG AGT AAG CAT TGC CTC ATG TCT     7687  Cys Thr Leu Glu Asn Val Lys Ser Gln Ser Lys His Cys Leu Met Ser      22769  CCG AGT GTA GCA ATT CTA GGA AAA CTC TTC CGA ATG GGT TTA AAG TCA     81623  Pro Ser Val Ala Ile Leu Gly Lys Leu Phe Arg Met Gly Leu Lys Ser      38817  AAC AAA TCC AAT CAA AAC AGA CTT GCA GGG CCA GGC AGC GGT GGC TCA     86439  Asn Lys Ser Asn Gln Asn Arg Leu Ala Gly Pro Gly Ser Gly Gly Ser      54865  TGC CTG CAA TCC CAG CAC TTT GGG AAG CCA AGG TGG GCA GAT CAC TTG     91255  Cys Leu Gln Ser Gln His Phe Gly Lys Pro Arg Trp Ala Asp His Leu      70913  AGG TCA GGA GTT GGA GAC CAG CCT GGC CAA CGT GGT GAG AGC CCA TCT     96071  Arg Ser Gly Val Gly Asp Gln Pro Gly Gln Arg Gly Glu Ser Pro Ser      86961  GTA CTA AAA ATA CAA AAA TTT GCT GAG CCT GGT GGC AGG CGC CTG TAG    100887  Val Leu Lys Ile Gln Lys Phe Ala Glu Pro Gly Gly Arg Arg Leu ***     1021009  TCT CAG CCT CCC GAG TGG CTG GGA CTA CAG GCA CAT GCA ACC ACA CCC    10561057  GGC TCA TGT TTT GCA TTT TTA GTA CAG ACC GGG TTT CAC CGT GTT GGC    11041105  CAG GAT CGT CTT GAT ATC GTG ACC TCG TGA ACC GCC CGC CTT GGC CTC    11521153  CCA AAG TGC TGG GAT GAC AGG TGT GAG AGT TCA GCA GTA TTA ACT ACA    12001201  TTC ATG TTA ATG ATG CGA CCA TCA CCA ACA TTC ATT TCC AGA ACA CTC    12481249  TGT CCC CAG TAA ACA ACA TGT CCC CGT TCC TCC CAG CCA CTG GTA CCT    12961297  ACC ATT CTA CTT TCT GTT TGT ATA AAC TTG ACA ACT CTA GGG TCC TCA    13441345  TAT AAG TGG AAT CCA GCT GGG CCC AGT GGC TCA CAC CTG TCA TCC CGG    13921393  CAC TTT GGG AGG CCG AGG TGG GTG GAT CAC GAG GTC AGG AGA TTG AGA    14401441  CCA TCC TGG CCA ATA TGG GGA AAC CCC GTC TCT ACT AAA AAA AAT AAA    14881489  AAA AAA                                                             14942.PPl0764A:核苷酸序列(SEQ ID NO:4)长度:1598个碱基1  GTGCTCCTGT  CTTCTGCTCC  TCTAGTGAGC  CATTCCTCTC  CCTTGGAATT  CATCAGAGTC61  ATCCCTGTAG  AGCCCCCTTC  CTGCCTCTCA  ATTCCTCCTG  CCTCACTTCC  CAGGCTACTG121  CTGCTTCAAG  ACAGTGACGT  TTCTCTCCGG  TCAGCTGTCA  GGAGCGCTGG  TGAGCTTCCT181  ACTGTGCCAC  AAGGTGCGGG  TGCTGGAGAC  ACAGCTGAGC  CTGGAAATGA  GAGTGGGCAT241  CGCCGTGGTC  ATCATGACTC  CTCTGCGGCG  TGGTCACCAT  GTTGGTTCAC  TGTGTTGGGC301  TCTTATTGAC  GGGTCTCCTG  CTAGGCCTGA  CCTTGGGTGC  CGGAGCCCTG  CTGGCTTCTG361  AGCCTATCTA  CCAACCACCT  TCAGCCTGGG  TGCCAGCTGG  GGGGCTGGTG  GGGCTGGCGC421  TGCTGGGAGC  CCTGCTCACA  CTTCGGTGGC  CACGTCCATT  CACAGTTCTG  GGCACAACCC481  TGCTGGGTTC  TGCAGTGCTT  GTGGCCTGTG  TTGACTACTT  CCTGGAGGGG  CTGGCACTGG541  GGAGTTGGCT  GGGCCAACGC  CTGCAGACAC  TTCCAGCCTT  GCCTTCTCTC  TGCTGATATA601  GCTGGGTCTT  ACTGGGGATC  TGGCCAGCCT  TGGGGGCCCT  TGGAGCCCTG  GCCCAGTGGA661  AGCTCGTGCC  TGAGGAACAT  GGAGGCCACG  CTAATGAGTT  ACTTCCAGAG  TCTTCAAGAG721  TGCCAACTGG  GACCAGGACC  CCAGACCACA  GCCCCCCACA  CCGTCCTGGA  CCTGGATTCT781  GACTGTGGTT  CCACTGTACC  CCTCACCTTA  ATCTCTGGTT  CTAACCAGAC  CTGAGCCTAG841  ACTTCCACTT  TTTCCCTTAC  CCCTGTGAGG  GCCTGGGAAC  AGTAGGTGGG  CAGGGTTTGA901  GCCCACAGGA  CCTGCACACA  AACTTCCCCA  CCTCTTGGAC  TTGGGGACAG  GATCTGTGCC961  TCAACCCAGA  CCAGCTTTGT  AGGGATATGT  TCCAAGAACA  GAGAAGAGTC  TTATGGGGAA1021  GGGGGAGGAA  GGGAAGTATG  AATATTTACC  TCTGACCAAT  AATAGAGGTG  CCCTGGTCCC1081  CAAAGAAATT  GACTCCCGAA  TTCCCTCCAA  GCCTTACCCA  TATAGCTTTT  GTTTGTTTGT1141  TTGTTTTCAG  ACAAGGTCTT  GTTCTGTCCA  GTGCCGTGGC  GTGACCACAG  CTCATGACAA1201  CTTTGATTTC  CCCGGCCCAA  GCGAGCCTCT  CATTCAGCCT  CCTGAGTGGC  TGGGACCACA1261  GACGCCACAC  ACAGCTAATT  TTTATGTATT  CGTTTTTATT  TTTTTGCAGA  GACAGGGTCT1321  CCCTATGTTG  CCCAAGCTGG  TCTTGAACTC  CTGGGCTCAA  GTGATCCTCC  TGCTTCAGCC1381  TCCCAAAGTG  CTAGGATTAT  AGCCACCGCA  CCTCGTCTTG  AAATAGCCTT  TTAAATGTTC1441  ACCTCAGCTT  GCCTCACAGT  GGGTCTGTTC  CTGGTTTCCC  AGATGCATAA  AGGAAGACAT1501  ATCCCTCCCC  TGGGCAGCAA  GGCTACAATG  GGAGGGAGGG  AGAACATGGG  AGCATGTGAA1561  TAAAATGGCA  TTAAATACTG  AAAAAAAAAA  AAAAAAAAB:核苷酸序列(SEQ ID NO:5)长度:129个氨基酸
 1 MGKGEEGKYE  YLPLTNNRGA  LVPKEIDSRI  PSKPYPYSFC  LFVCFQTRSC  SVQCRGVTTA
61 HDNFDFPGPS  EPLIQPPEWL  GPQTPHTANF  YVFVFIFLQR  QGLPMLPKLV  LNSWAQVILL121 LQPPKVLGLC.核苷酸及氨基酸组合序列(SEQ ID NO:6)克隆号和蛋白名称:PP10764起始编码子:1013 ATG  终止编码子:1400 TAG  蛋白质分子量:14581.281    G  TGC  TCC  TGT  CTT  CTG  CTC  CTC  TAG  TGA  GCC  ATT  CCT  CTC  CCT  TGG            4647  AAT  TCA  TCA  GAG  TCA  TCC  CTG  TAG  AGC  CCC  CTT  CCT  GCC  TCT  CAA  TTC            9495  CTC  CTG  CCT  CAC  TTC  CCA  GGC  TAC  TGC  TGC  TTC  AAG  ACA  GTG  ACG  TTT           142143  CTC  TCC  GGT  CAG  CTG  TCA  GGA  GCG  CTG  GTG  AGC  TTC  CTA  CTG  TGC  CAC           190191  AAG  GTG  CGG  GTG  CTG  GAG  ACA  CAG  CTG  AGC  CTG  GAA  ATG  AGA  GTG  GGC           238239  ATC  GCC  GTG  GTC  ATC  ATG  ACT  CCT  CTG  CGG  CGT  GGT  CAC  CAT  GTT  GGT           286287  TCA  CTG  TGT  TGG  GCT  CTT  ATT  GAC  GGG  TCT  CCT  GCT  AGG  CCT  GAC  CTT           334335  GGG  TGC  CGG  AGC  CCT  GCT  GGC  TTC  TGA  GCC  TAT  CTA  CCA  ACC  ACC  TTC           382383  AGC  CTG  GGT  GCC  AGC  TGG  GGG  GCT  GGT  GGG  GCT  GGC  GCT  GCT  GGG  AGC           430431  CCT  GCT  CAC  ACT  TCG  GTG  GCC  ACG  TCC  ATT  CAC  AGT  TCT  GGG  CAC  AAC           478479  CCT  GCT  GGG  TTC  TGC  AGT  GCT  TGT  GGC  CTG  TGT  TGA  CTA  CTT  CCT  GGA           526527  GGG  GCT  GGC  ACT  GGG  GAG  TTG  GCT  GGG  CCA  ACG  CCT  GCA  GAC  ACT  TCC           574 575  AGC CTT GCC TTC TCT CTG CTG ATA TAG CTG GGT CTT ACT GGG GAT CTG     622623  GCC AGC CTT GGG GGC CCT TGG AGC CCT GGC CCA GTG GAA GCT CGT GCC     670671  TGA GGA ACA TGG AGG CCA CGC TAA TGA GTT ACT TCC AGA GTC TTC AAG     718719  AGT GCC AAC TGG GAC CAG GAC CCC AGA CCA CAG CCC CCC ACA CCG TCC     766767  TGG ACC TGG ATT CTG ACT GTG GTT CCA CTG TAC CCC TCA CCT TAA TCT     814815  CTG GTT CTA ACC AGA CCT GAG CCT AGA CTT CCA CTT TTT CCC TTA CCC     862863  CTG TGA GGG CCT GGG AAC ACT AGG TGG GCA GGG TTT GAG CCC ACA GGA     910911  CCT GCA CAC AAA CTT CCC CAC CTC TTG GAC TTG GGG ACA GGA TCT GTG     958959  CCT CAA CCC AGA CCA GCT TTG TAG GGA TAT GTT CCA AGA ACA GAG AAG    10061007  AGT CTT ATG GGG AAG GGG GAG GAA GGG AAG TAT GAA TAT TTA CCT CTG    10541          Met Gly Lys Gly Glu Glu Gly Lys Tyr Glu Tyr Leu Pro Leu      141055  ACC AAT AAT AGA GGT GCC CTG GTC CCC AAA GAA ATT GAC TCC CGA ATT    110215  Thr Asn Asn Arg Gly Ala Leu Val Pro Lys Glu Ile Asp Ser Arg Ile      301103  CCC TCC AAG CCT TAC CCA TAT AGC TTT TGT TTG TTT GTT TGT TTT CAG    115031  Pro Ser Lys Pro Tyr Pro Tyr Ser Phe Cys Leu Phe Val Cys Phe Gln      461151  ACA AGG TCT TGT TCT GTC CAG TGC CGT GGC GTG ACC ACA GCT CAT GAC    119847  Thr Arg Ser Cys Ser Val Gln Cys Arg Gly Val Thr Thr Ala His Asp      621199  AAC TTT GAT TTC CCC GGC CCA AGC GAG CCT CTC ATT CAG CCT CCT GAG    124663  Asn Phe Asp Phe Pro Gly Pro Ser Glu Pro Leu Ile Gln Pro Pro Glu      781247  TGG CTG GGA CCA CAG ACG CCA CAC ACA GCT AAT TTT TAT GTA TTC GTT    129479  Trp Leu Gly Pro Gln Thr Pro His Thr Ala Asn Phe Tyr Val Phe Val      941295  TTT ATT TTT TTG CAG AGA CAG GGT CTC CCT ATG TTG CCC AAG CTG GTC    134295  Phe Ile Phe Leu Gln Arg Gln Gly Leu Pro Met Leu Pro Lys Leu Val     1101343  TTG AAC TCC TGG GCT CAA GTG ATC CTC CTG CTT CAG CCT CCC AAA GTG    1390111  Leu Asn Ser Trp Ala Gln Val Ile Leu Leu Leu Gln Pro Pro Lys Val     1261391  CTA GGA TTA TAG CCA CCG CAC CTC GTC TTG AAA TAG CCT TTT AAA TGT    1438127  Leu Gly Leu ***                                                     1301439  TCA CCT CAG CTT GCC TCA CAG TGG GTC TGT TCC TGG TTT CCC AGA TGC    14861487  ATA AAG GAA GAC ATA TCC CTC CCC TGG GCA GCA AGG CTA CAA TGG GAG    15341535  GGA GGG AGA ACA TGG GAG CAT GTG AAT AAA ATG GCA TTA AAT ACT GAA    15821583  AAA AAA AAA AAA AAA A                                              15983.PP12100A:核苷酸序列(SEQ ID NO:7)长度:1978个碱基1  GTGGGATTAC  AGGCGTGAGC  CACTGCACCC  GACCCCAGAT  ATGTTTTTAA  GTCAGCCATT61  CCACATCGCT  AAGTGCCCAT  TGTGTAGAGA  AGACTGATCT  GAAATGCCTT  GTGCCATGCA121  CCTGGGGCCA  GACCCAGGCT  GTGATTAAAG  GGCGGCTTCA  TATTCACAGT  TGTTGGAGTG181  CTGTTAAATC  TGGCTCTAAT  CTAAAGTGTC  TTTACTTTGA  AAACCCCATG  AATGTTTAGA241  GACTCGCCTT  TAAACAGTGA  ACCTCTGCCC  TGGTGAATGT  CTTGGCCGTC  TGCCTCGAGG301  CCTAATTCAT  GCTGGAGACA  TCCTAGACAC  TTTCTTTGCT  GAATTTCATG  ACCATAGCTA361  TTCCTCTTTA  CCAGACACAG  CACCTTCTTC  CTGGTCTTGG  CTAGAGATGC  AGCAGTATTT421  GGGACTGACA  TTACCTGAAG  AGCACTTCCT  ATCTAAGTAA  CTGAACTACA  GCACTGTCAC481  AACGCTGGCA  TGACATAGAA  GGCTCGCCAC  ATCCTTCATG  TGTTTAGATT  TACTCCTAGT541  GTGCTGTGGG  GCCAAATCGT  GGACTCTTTT  TTCCTATCTC  TGTTCTTTCT  AGATGATCTT601  GTTCAGTCCC  CTAGCTTTAA  ATTCTATCTG  TAGGCCAATG  ACCTCCAAAT  GTATATCCAT661  AGCCCAGACC  GACCCTCCAG  ACTCCAGACT  CACAGAGCTG  ACTCTCTCAT  ACAACTTCTC721  TATTTGGAAT  CCTAATGGGC  ATCTCAAATC  CAACATGAGG  CTGCCAATGG  CGCTCTTGCT781  TTTTCCTCTC  AAACCTTCCC  TCTCTCATTT  CCTCAACCCA  GAAAATTGCT  GCAGCACTTG 841  ATCAGTGACT  CAAGCCAGAA  AGCTCAGCAG  TCATCATCAG  GTTCTCCCTC  TTTCTCATGC901  CCAGGAGGAT  GCGGGGGGCG  GCCCCCTGCC  CACACTCTGC  TCCCTGGGAA  GAAACGTGGG961  AAGCATGAGC  CAGGCGTTGG  GACCCAAGCC  AAGTGTAGTC  CCTGCCACAC  CCATTTGCTT1021  TCCTTCCCAC  AAGCTCTCCA  GTCAGGCCAC  TCTCCCTCTC  CACTACTCAC  CCTCGGCCAA1081  GCCGCACCTT  GTCTGGCCTG  GGTTACCACA  GGGCCCTTGG  CCTCTGTGGC  TCGCATCCCT1141  CTCCAGCCCA  CTTCTATCAC  AAAGGCCAGT  GGCAGCCCCT  GTCCTGCCTC  TGCCCAGACC1201  TTTAATGGCT  TCCCACTGCT  CTTGCAGCAA  AACACATGTT  CTTCACTGCC  ACCTAGAATC1261  ATCTCAGCAT  TGCCTGCTTG  TCCAAACCCA  CCTTCTACAC  CTCTCTATTT  CTCTTACTGG1321  CCTCCCTTCT  GTTCCTTAAA  TATACTAAGC  CCTCCTGCAG  GCCTGTACCT  GCCTCCAGCT1381  CTTTATGCAC  CTGGCTCACT  CTTGGTCTTT  GGGTCCCAGC  TCAAACGTCA  CCTCTTTAGA1441  GGGGCTGCCT  TGTCTACCTA  AATAAGCTCC  TGCAAAAAAT  GTCCAGCCAT  TGGCACATAG1501  TAGGCCCCCT  TATCCATGGG  TTCACGTCTG  CAGGTTCAGC  TACCTGCAGT  CAATCACAGT1561  CTGAAAATTG  TGCAGTATTT  TGAGAGAGAG  ACCACATTGA  CATAACTTTT  ATTACAGTAT1621  ATTGTTATAA  TTGTCCTATT  TTATTGTTAT  TGTTGTTACT  CTTACTGTGC  CTAATTTATA1681  AATTAGACTT  TATCATGCTT  TGGGAGGCAG  AGGCAGAAGG  TATCACTTGA  GCCCGGGAGT1741  TCAGCCAAGA  CCAGCCTGGG  CCACACAGCA  AGACCCCATC  TCTACAAAAA  AATTAATAAA1801  AGTAAAAAAT  TAACCAAATG  TGATGGTGCA  CACCTGTGGT  CCCAGCTACT  CAGGAGGCTG1861  AGGCAGGAGG  ATCACTTGAG  CTCAGGAGGT  TGAGGCTGCA  GGGTGAGCTG  TGATTTTGCC1921  ACAGTTCTAC  AGCTTGGGTG  AACAGAGGAA  GACCCCTTTC  AAAAAAAAAA  AAAAAAAAB:核苷酸序列(SEQ ID NO:8)长度:124个氨基酸
  1  MSQALGPKPS  VVPATPICFP  SHKLSSQATL  PLHYSPSAKP  HLVWPGLPQG  PWPLWLASLS
 61  SPLLSQRPVA  APVLPLPRPL  MASHCSCSKT  HVLHCHLESS  QHCLLVQTHL  LHLSISLTGL
121  PSVPC.核苷酸及氨基酸组合序列(SEQ ID NO:9)克隆号和蛋白名称:PP12100起始编码子:965 ATG  终止编码子:1337 TAA  蛋白质分子量:13279.951    G TGG GAT TAC AGG CGT GAG CCA CTG CAC CCG ACC CCA GAT ATG TTT      4647  TTA AGT CAG CCA TTC CAC ATC GCT AAG TGC CCA TTG TGT AGA GAA GAC      9495  TGA TCT GAA ATG CCT TGT GCC ATG CAC CTG GGG CCA GAC CCA GGC TGT     142143  GAT TAA AGG GCG GCT TCA TAT TCA CAG TTG TTG GAG TGC TGT TAA ATC     190191  TGG CTC TAA TCT AAA GTG TCT TTA CTT TGA AAA CCC CAT GAA TGT TTA     238239  GAG ACT CGC CTT TAA ACA GTG AAC CTC TGC CCT GGT GAA TGT CTT GGC     286287  CGT CTG CCT CGA GGC CTA ATT CAT GCT GGA GAC ATC CTA GAC ACT TTC     334335  TTT GCT GAA TTT CAT GAC CAT AGC TAT TCC TCT TTA CCA GAC ACA GCA     382383  CCT TCT TCC TGG TCT TGG CTA GAG ATG CAG CAG TAT TTG GGA CTG ACA     430431  TTA CCT GAA GAG CAC TTC CTA TCT AAG TAA CTG AAC TAC AGC ACT GTC     478479  ACA ACG CTG GCA TGA CAT AGA AGG CTC GCC ACA TCC TTC ATG TGT TTA     526527  GAT TTA CTC CTA GTG TGC TGT GGG GCC AAA TCG TGG ACT CTT TTT TCC     574575  TAT CTC TGT TCT TTC TAG ATG ATC TTG TTC AGT CCC CTA GCT TTA AAT     622623  TCT ATC TGT AGG CCA ATG ACC TCC AAA TGT ATA TCC ATA GCC CAG ACC     670671  GAC CCT CCA GAC TCC AGA CTC ACA GAG CTG ACT CTC TCA TAC AAC TTC     718719  TCT ATT TGG AAT CCT AAT GGG CAT CTC AAA TCC AAC ATG AGG CTG CCA     766767  ATG GCG CTC TTG CTT TTT CCT CTC AAA CCT TCC CTC TCT CAT TTC CTC     814815  AAC CCA GAA AAT TGC TGC AGC ACT TGA TCA GTG ACT CAA GCC AGA AAG     862863  CTC AGC AGT CAT CAT CAG GTT CTC CCT CTT TCT CAT GCC CAG GAG GAT     910911  GCG GGG GGC GGC CCC CTG CCC ACA CTC TGC TCC CTG GGA AGA AAC GTG     958959  GGA AGC ATG AGC CAG GCG TTG GGA CCC AAG CCA AGT GTA GTC CCT GCC    10061          Met Ser Gln Ala Leu Gly Pro Lys Pro Ser Val Val Pro Ala      141007  ACA CCC ATT TGC TTT CCT TCC CAC AAG CTC TCC AGT CAG GCC ACT CTC    1054  15  Thr Pro Ile Cys Phe Pro Ser His Lys Leu Ser Ser Gln Ala Thr Leu      301055  CCT CTC CAC TAC TCA CCC TCG GCC AAG CCG CAC CTT GTC TGG CCT GGG    110231  Pro Leu His Tyr Ser Pro Ser Ala Lys Pro His Leu Val Trp Pro Gly      461103  TTA CCA CAG GGC CCT TGG CCT CTG TGG CTC GCA TCC CTC TCC AGC CCA    115047  Leu Pro Gln Gly Pro Trp Pro Leu Trp Leu Ala Ser Leu Ser Ser Pro      621151  CTT CTA TCA CAA AGG CCA GTG GCA GCC CCT GTC CTG CCT CTG CCC AGA    119863  Leu Leu Ser Gln Arg Pro Val Ala Ala Pro Val Leu Pro Leu Pro Arg      781199  CCT TTA ATG GCT TCC CAC TGC TCT TGC AGC AAA ACA CAT GTT CTT CAC    124679  Pro Leu Met Ala Ser His Cys Ser Cys Ser Lys Thr His Val Leu His      941247  TGC CAC CTA GAA TCA TCT CAG CAT TGC CTG CTT GTC CAA ACC CAC CTT    129495  Cys His Leu Glu Ser Ser Gln His Cys Leu Leu Val Gln Thr His Leu     1101295  CTA CAC CTC TCT ATT TCT CTT ACT GGC CTC CCT TCT GTT CCT TAA ATA    1342111  Leu His Leu Ser Ile Ser Leu Thr Gly Leu Pro Ser Val Pro ***         1251343  TAC TAA GCC CTC CTG CAG GCC TGT ACC TGC CTC CAG CTC TTT ATG CAC    13901391  CTG GCT CAC TCT TGG TCT TTG GGT CCC AGC TCA AAC GTC ACC TCT TTA    14381439  GAG GGG CTG CCT TGT CTA CCT AAA TAA GCT CCT GCA AAA AAT GTC CAG    14861487  CCA TTG GCA CAT AGT AGG CCC CCT TAT CCA TGG GTT CAC GTC TGC AGG    15341535  TTC AGC TAC CTG CAG TCA ATC ACA GTC TGA AAA TTG TGC AGT ATT TTG    15821583  AGA GAG AGA CCA CAT TGA CAT AAC TTT TAT TAC AGT ATA TTG TTA TAA    16301631  TTG TCC TAT TTT ATT GTT ATT GTT GTT ACT CTT ACT GTG CCT AAT TTA    16781679  TAA ATT AGA CTT TAT CAT GCT TTG GGA GGC AGA GGC AGA AGG TAT CAC    17261727  TTG AGC CCG GGA GTT CAG CCA AGA CCA GCC TGG GCC ACA CAG CAA GAC    17741775  CCC ATC TCT ACA AAA AAA TTA ATA AAA GTA AAA AAT TAA CCA AAT GTG    18221823  ATG GTG CAC ACC TGT GGT CCC AGC TAC TCA GGA GGC TGA GGC AGG AGG    18701871  ATC ACT TGA GCT CAG GAG GTT GAG GCT GCA GGG TGA GCT GTG ATT TTG    19181919  CCA CAG TTC TAC AGC TTG GGT GAA CAG AGG AAG ACC CCT TTC AAA AAA    19661967  AAA AAA AAA AAA                                                    19784. PP12488A:核苷酸序列(SEQ ID NO:10)长度:2371个碱基1  GGTGAGCGCC  ACCCGGAGTC  CCGCGCGCAA  CTTTCAGGGC  GCACTCGGCG  GGGCGGCTGC61  GCGGCTGCCG  GGACTCGGCG  CGGGACTGCA  TGGAGGCCAA  GGAGAAGCAG  CATCTGTTGG121  ACGCCAGGCC  GGCAATCCGG  TCATACACGG  GATCTCTGTG  GCAGGAAGGG  GCTGGCTGGA181  TTCCTCTGCC  CCGACCTGGC  CTGGACTTGC  AGGCCATTGA  GCTGGCTGCC  CAGAGCAACC241  ATCACTGCCA  TGCTCAGAAG  GGTCCTGACA  GTCACTGTGA  CCCCAAGAAG  GGGAAGGCCC301  AGCGCCAGCT  GTATGTAGCC  TCTGCCATCT  GCCTGTTGTT  CATGATCGGA  GAAGTCGTTG361  GTGGGTACCT  GGCACACAGC  TTGGCTGTCA  TGACTGACGC  AGCACACCTG  CTCACTGACT421  TTGCCAGCAT  GCTCATCAGC  CTCTTCTCCC  TCTGGATGTC  CTCCCGGCCA  GCCACCAAGA481  CCATGAACTT  TGGCTGGCAG  AGAGCTGAGA  TCTTGGGAGC  CCTGGTCTCT  GTACTGTCCA541  TCTGGGTCGT  GACGGGGGTA  CTGGTGTACC  TGGCTGTGGA  GCGGCTGATC  TCTGGGGACT601  ATGAAATTGA  CGGGGGGACC  ATGCTGATCA  CGTCGGGCTG  CGCTGTGGCT  GTGAACATCA661  TAATGGGGTT  GACCCTTCAC  CAGTCTGGCC  ATGGGCACAG  CCACGGCACC  ACCAACCAGC721  AGGAGGAGAA  CCCCAGCGTC  CGAGCTGCCT  TCATCCATGT  GATCGGCGAC  TTTATGCAGA781  GCATGGGTGT  CCTAGTGGCA  GCCTATATTT  TATACTTCAA  GCCAGAATAC  AAGTATGTAG841  ACCCCATCTG  CACCTTCGTC  TTCTCCATCC  TGGTCCTGGG  GACAACCTTG  ACCATCCTGA901  GAGATGTGAT  CCTGGTGTTG  ATGGAAGGGA  CCCCCAAGGG  CGTTGACTTC  ACAGCTGTTC961  GTGATCTGCT  GCTGTCGGTG  GAGGGGGTAG  AAGCCCTGCA  CAGCCTGCAT  ATCTGGGCAC1021  TGACGGTGGC  CCAGCCTGTT  CTGTCTGTCC  ACATCGCCAT  TGCTCAGAAT  ACAGACGCCC1081  AGGCTGTGCT  GAAGACAGCC  AGCAGCCGCC  TCCAAGGGAA  GTTCCACTTC  CACACCGTGA1141  CCATCCAGAT  CGAGGACTAC  TCGGAGGACA  TGAAGGACTG  TCAGGCATGC  CAGGGCCCCT1201  CAGACTGACT  GCTCAGCCAG  GCACCAACTG  GGGCATGAAC  AGGACCTGCA  GGTGGCTGGA1261  CTGAGTGTCC  CCCAGGCCCA  GCCAGGACTT  TGCCTACCCC  AGCTGTGTTA  TAAACCAGGT1321  CCCCCTCCTG  ACCTCTGCCC  CACTCCAGGA  ATGGAGCTCT  TCCCAGCCTC  CCATCTGACT1381  ACAGCCAGGG  TGGGGACTCA  GCGGGTATAA  AGCTAGTGTG  ACCCTGCTCT  TCCAGCTCCT1441  GGGCCAGCTC  TGGAAGGGCT  GTATTTGGGC  CTAATCCTCA  GCAACTGTTC  TACCACTCGC1501  AGGGGCAAAG  GTGGTGAGCC  ACGGGACGTC  CAAGGGGAGG  CTGGCCCCAG  CGCGCCCATA1561  CTGCCTGCCT  CATGCCCCAT  TCTCAGCCTG  GCTGGCCTTT  GCCTTTATGA  ATCTGAGCCC1621  CTCCATCTGC  CTATAGCAAT  AGGCACGGGG  GTGAGGACCC  TCACACTCTC  ATTTGAGCCT1681  CCCTGAGGCA  GGGAGCCAGG  AGGCACCTGA  GGCCTATCTG  TGCCTTAGTC  ACTTCAGCTA1741  TGAGCCAAAT  GTTCCCTTTC  CTGGAGGGGA  GAGGCTTCTT  ACTAGGTAAG  AGACAGGTTT1801  CCTCTTTCCT  TATTTCCTCA  GCTGTGCCAA  CACAAAAAAC  AACTTTGGCA  CAGGTGGTGG1861  GCAGGGGGTA  GAGAGATTTC  AGCTTGGGTT  CTGCACTAAC  AGCCTCCAAG  CCCCCTGGCA1921  CTTCTGTTGC  CCTGAGAGTG  TCCCAGGGGA  TTCAGAGTCT  CCAGAAAGAT  ATGGCTGGGC1981  CAACTCTGTT  GCCTACCTGG  CCTGACCCAG  TCGGAGCCTG  ACATGGTGGA  GGGAAAGGGA2041  GACAAGTGGG  GCTGCACTCG  GTCCAGAGGC  CAGCTAGGAG  GGAAACCGCA  GCTTCCTGGG2101  GCTTGTGTGT  GAAGATTCCT  GACTTAGGGG  TGGCTTTTGT  TTACAAGATG  CAAGAGGGGA2161  AACCTGTCCC  CGACTCATCG  AGACAACATG  CCCAGTTATC  AGGGAGTCCT  GTGTCACAAG2221  GTCTGTCTCT  GCCATTGTAA  GCAAGTGCCT  TGGGCGAGCT  GGCCTCTGCC  CCACAGTTTC2281  ATCTGTACAC  CGACAGGGTT  GATGCCTCCC  TCACAGGGTT  GAGAACAAGA  GCCAGTTGGC2341  CAAGTAAAAA  AAAAAAAAAA  AAAAAAAAAA  AB:核苷酸序列(SEQ ID NO:11)长度:372个氨基酸1  MEAKEKQHLL  DARPAIRSYT  GSLWQEGAGW  IPLPRPGLDL  QAIELAAQSN  HHCHAQKGPD61  SHCDPKKGKA  QRQLYVASAI  CLLFMIGEVV  GGYLAHSLAV  MTDAAHLLTD  FASMLISLFS121  LWMSSRPATK  TMNFGWQRAE  ILGALVSVLS  IWVVTGVLVY  LAVERLISGD  YEIDGGTMLI181  TSGCAVAVNI  IMGLTLHQSG  HGHSHGTTNQ  QEENPSVRAA  FIHVIGDFMQ  SMGVLVAAYI241  LYFKPEYKYV  DPICTFVFSI  LVLGTTLTIL  RDVILVLMEG  TPKGVDFTAV  RDLLLSVEGV301  EALHSLHIWA  LTVAQPVLSV  HIAIAQNTDA  QAVLKTASSR  LQGKFHFHTV  TIQIEDYSED361  MKDCQACQGP  SDC.核苷酸及氨基酸组合序列(SEQ ID NO:12)克隆号和蛋白名称:PP12488起始编码子:90 ATG  终止编码子:1206 TGA  蛋白质分子量:40561.731   GG TGA GCG CCA CCC GGA GTC CCG CGC GCA ACT TTC AGG GCG CAC TCG     4748  GCG GGG CGG CTG CGC GGC TGC CGG GAC TCG GCG CGG GAC TGC ATG GAG     951                                                          Met Glu      296  GCC AAG GAG AAG CAG CAT CTG TTG GAC GCC AGG CCG GCA ATC CGG TCA    1433  Ala Lys Glu Lys Gln His Leu Leu Asp Ala Arg Pro Ala Ile Arg Ser     18144  TAC ACG GGA TCT CTG TGG CAG GAA GGG GCT GGC TGG ATT CCT CTG CCC    19119  Tyr Thr Gly Ser Leu Trp Gln Glu Gly Ala Gly Trp Ile Pro Leu Pro     34192  CGA CCT GGC CTG GAC TTG CAG GCC ATT GAG CTG GCT GCC CAG AGC AAC    23935  Arg Pro Gly Leu Asp Leu Gln Ala Ile Glu Leu Ala Ala Gln Ser Asn     50240  CAT CAC TGC CAT GCT CAG AAG GGT CCT GAC AGT CAC TGT GAC CCC AAG    28751  His His Cys His Ala Gln Lys Gly Pro Asp Ser His Cys Asp Pro Lys     66288  AAG GGG AAG GCC CAG CGC CAG CTG TAT GTA GCC TCT GCC ATC TGC CTG    33567  Lys Gly Lys Ala Gln Arg Gln Leu Tyr Val Ala Ser Ala Ile Cys Leu     82336  TTG TTC ATG ATC GGA GAA GTC GTT GGT GGG TAC CTG GCA CAC AGC TTG    38383  Leu Phe Met Ile Gly Glu Val Val Gly Gly Tyr Leu Ala His Ser Leu     98384  GCT GTC ATG ACT GAC GCA GCA CAC CTG CTC ACT GAC TTT GCC AGC ATG    431  99  Ala Val Met Thr Asp Ala Ala His Leu Leu Thr Asp Phe Ala Ser Met     114432  CTC ATC AGC CTC TTC TCC CTC TGG ATG TCC TCC CGG CCA GCC ACC AAG     479115  Leu Ile Ser Leu Phe Ser Leu Trp Met Ser Ser Arg Pro Ala Thr Lys     130480  ACC ATG AAC TTT GGC TGG CAG AGA GCT GAG ATC TTG GGA GCC CTG GTC     527131  Thr Met Asn Phe Gly Trp Gln Arg Ala Glu Ile Leu Gly Ala Leu Val     146528  TCT GTA CTG TCC ATC TGG GTC GTG ACG GGG GTA CTG GTG TAC CTG GCT     575147  Ser Val Leu Ser Ile Trp Val Val Thr Gly Val Leu Val Tyr Leu Ala     162576  GTG GAG CGG CTG ATC TCT GGG GAC TAT GAA ATT GAC GGG GGG ACC ATG     623163  Val Glu Arg Leu Ile Ser Gly Asp Tyr Glu Ile Asp Gly Gly Thr Met     178624  CTG ATC ACG TCG GGC TGC GCT GTG GCT GTG AAC ATC ATA ATG GGG TTG     671179  Leu Ile Thr Ser Gly Cys Ala Val Ala Val Asn Ile Ile Met Gly Leu     194672  ACC CTT CAC CAG TCT GGC CAT GGG CAC AGC CAC GGC ACC ACC AAC CAG     719195  Thr Leu His Gln Ser Gly His Gly His Ser His Gly Thr Thr Asn Gln     210720  CAG GAG GAG AAC CCC AGC GTC CGA GCT GCC TTC ATC CAT GTG ATC GGC     767211  Gln Glu Glu Asn Pro Ser Val Arg Ala Ala Phe Ile His Val Ile Gly     226768  GAC TTT ATG CAG AGC ATG GGT GTC CTA GTG GCA GCC TAT ATT TTA TAC     815227  Asp Phe Met Gln Ser Met Gly Val Leu Val Ala Ala Tyr Ile Leu Tyr     242816  TTC AAG CCA GAA TAC AAG TAT GTA GAC CCC ATC TGC ACC TTC GTC TTC     863243  Phe Lys Pro Glu Tyr Lys Tyr Val Asp Pro Ile Cys Thr Phe Val Phe     258864  TCC ATC CTG GTC CTG GGG ACA ACC TTG ACC ATC CTG AGA GAT GTG ATC     911259  Ser Ile Leu Val Leu Gly Thr Thr Leu Thr Ile Leu Arg Asp Val Ile     274912  CTG GTG TTG ATG GAA GGG ACC CCC AAG GGC GTT GAC TTC ACA GCT GTT     959275  Leu Val Leu Met Glu Gly Thr Pro Lys Gly Val Asp Phe Thr Ala Val     290960  CGT GAT CTG CTG CTG TCG GTG GAG GGG GTA GAA GCC CTG CAC AGC CTG    1007291  Arg Asp Leu Leu Leu Ser Val Glu Gly Val Glu Ala Leu His Ser Leu     3061008  CAT ATC TGG GCA CTG ACG GTG GCC CAG CCT GTT CTG TCT GTC CAC ATC    1055307  His Ile Trp Ala Leu Thr Val Ala Gln Pro Val Leu Ser Val His Ile     3221056  GCC ATT GCT CAG AAT ACA GAC GCC CAG GCT GTG CTG AAG ACA GCC AGC    1103323  Ala Ile Ala Gln Asn Thr Asp Ala Gln Ala Val Leu Lys Thr Ala Ser     3381104  AGC CGC CTC CAA GGG AAG TTC CAC TTC CAC ACC GTG ACC ATC CAG ATC    1151339  Ser Arg Leu Gln Gly Lys Phe His Phe His Thr Val Thr Ile Gln Ile     3541152  GAG GAC TAC TCG GAG GAC ATG AAG GAC TGT CAG GCA TGC CAG GGC CCC    1199355  Glu Asp Tyr Ser Glu Asp Met Lys Asp Cys Gln Ala Cys Gln Gly Pro     3701200  TCA GAC TGA CTG CTC AGC CAG GCA CCA ACT GGG GCA TGA ACA GGA CCT    1247371  Ser Asp ***                                                         3731248  GCA GGT GGC TGG ACT GAG TGT CCC CCA GGC CCA GCC AGG ACT TTG CCT    12951296  ACC CCA GCT GTG TTA TAA ACC AGG TCC CCC TCC TGA CCT CTG CCC CAC    13431344  TCC AGG AAT GGA GCT CTT CCC AGC CTC CCA TCT GAC TAC AGC CAG GGT    13911392  GGG GAC TCA GCG GGT ATA AAG CTA GTG TGA CCC TGC TCT TCC AGC TCC    14391440  TGG GCC AGC TCT GGA AGG GCT GTA TTT GGG CCT AAT CCT CAG CAA CTG    14871488  TTC TAC CAC TCG CAG GGG CAA AGG TGG TGA GCC ACG GGA CGT CCA AGG    15351536  GGA GGC TGG CCC CAG CGC GCC CAT ACT GCC TGC CTC ATG CCC CAT TCT    15831584  CAG CCT GGC TGG CCT TTG CCT TTA TGA ATC TGA GCC CCT CCA TCT GCC    16311632  TAT AGC AAT AGG CAC GGG GGT GAG GAC CCT CAC ACT CTC ATT TGA GCC    16791680  TCC CTG AGG CAG GGA GCC AGG AGG CAC CTG AGG CCT ATC TGT GCC TTA    17271728  GTC ACT TCA GCT ATG AGC CAA ATG TTC CCT TTC CTG GAG GGG AGA GGC    17751776  TTC TTA CTA GGT AAG AGA CAG GTT TCC TCT TTC CTT ATT TCC TCA GCT      18231824  GTG CCA ACA CAA AAA ACA ACT TTG GCA CAG GTG GTG GGC AGG GGG TAG      18711872  AGA GAT TTC AGC TTG GGT TCT GCA CTA ACA GCC TCC AAG CCC CCT GGC      19191920  ACT TCT GTT GCC CTG AGA GTG TCC CAG GGG ATT CAG AGT CTC CAG AAA      19671968  GAT ATG GCT GGG CCA ACT CTG TTG CCT ACC TGG CCT GAC CCA GTC GGA      20152016  GCC TGA CAT GGT GGA GGG AAA GGG AGA CAA GTG GGG CTG CAC TCG GTC      20632064  CAG AGG CCA GCT AGG AGG GAA ACC GCA GCT TCC TGG GGC TTG TGT GTG      21112112  AAG ATT CCT GAC TTA GGG GTG GCT TTT GTT TAC AAG ATG CAA GAG GGG      21592160  AAA CCT GTC CCC GAC TCA TCG AGA CAA CAT GCC CAG TTA TCA GGG AGT      22072208  CCT GTG TCA CAA GGT CTG TCT CTG CCA TTG TAA GCA AGT GCC TTG GGC      22552256  GAG CTG GCC TCT GCC CCA CAG TTT CAT CTG TAC ACC GAC AGG GTT GAT      23032304  GCC TCC CTC ACA GGG TTG AGA ACA AGA GCC AGT TGG CCA AGT AAA AAA      23512352  AAA AAA AAA AAA AAA AAA AA                                           23715.PP12494A:核苷酸序列(SEQ ID NO:13)长度:3401个碱基1  GCTTGACCCA  TCCTCTACTT  AGTCACTCTT  ATAGAGCCCT  GCATTTTCTT  TTGTAGCATT61  TATGACATGT  GTAATGTTAC  ATTTGTTTGT  GGGATTATTT  AAGGAATGTC  TGTCATGTGA121  GACAATAAGC  TTTATGAGTA  CAGGCACCTC  TTCTGTCTTA  TTTCCTATGC  CCCAGCACAG181  TCCCTGACAT  CTAGTAGACC  TTCAAAAAGT  TTTATGGAAT  GAATGAGTGA  ACAAATGATG241  CAAAGTGTTG  GTTGCAGGAT  ATCTCTCTCA  GTCTTCCAAT  TCTTAGGAGA  TCAGAGGCAA301  GAGCTGGTGG  CCTTTCACCG  CCTGGCTACA  GTGTACTACT  CCCTGCACAT  GTATGAGATG361  GCTGAGGACT  GCTACCTGAA  GACCCTGTCC  CTCTGTCCAC  CATGGCTGCA  GAGTCCCAAG421  GAGGCCCTGT  ACTATGCCAA  GGTGTATTAT  CGCCTGGGCA  GACTCACCTT  CTGCCAGCTG481  AAGGTAAGAG  CCAGACTTCC  CAGATTTCCT  GACAGCCACC  ACCCAACCAT  TCTCCTTCCT541  GACTCAAAGA  CAATGAGGAG  CCTTTGTGGT  GGAGCTGAGA  AAACCAGAGT  GCCAAGATGA601  GAAGTCTTGT  CTCATAGGGT  GAGGAGTGGC  TTTACAGGGG  ACATGGAAGC  TCTTTCCACT661  TAACCCTGCT  GAAGATCTCA  AAGGTGCTCC  CATCTTCGCT  GAGGAGTAGA  CCATGGTTCC721  TCTTTCTCCT  TGCCTTGCCA  CCATGTCTGT  GGCTTCTTTA  TCTGTCAGAT  ACTACAGGCA781  CATTGCCTGT  AAGTCTCTCA  AGGGCCTATG  GAAATATACA  AGACCCCAAA  ACAAAAGAAC841  TATAAGGTCT  AAAATGAAGA  TCAAAATGAA  TACTTAAGAG  TTTGTCCATA  AAATGTTACA901  GACCAACTAG  TCAACTGCAA  CTCATTTCTT  ATAAAGTAAT  GTAAAGCTAC  ATTTTATGAG961  AAATGTGGGT  GCATATTAAC  ATGTTTGAGA  TAACGAGGTA  TGGGGCCTTT  AAACTAAGTA1021  TACTTAGATC  TTAAGAAGGT  TTTATCCCTG  CTTCTCTTGC  TTGCTGAATC  TAGAACTTCT1081  TTTTTTGCTT  GCTTGCTTTT  TTTTTGGGAC  AGGGTCTTGC  TGTGTAGCCC  AGGCTGGAGT1141  AGCATGGCTC  AATCTTGGCT  CACTACAGCC  TCTGCATCTG  GGGCTCAAGC  AATCCTTCTA1201  CTTCAGCCTC  CTCAGAAGCT  GGGACCACAG  GTGCACACCA  CCACACCTGG  CTAATTTTTG1261  TATTTTTTTG  TAAAGATGGG  GTTTCATCAT  GTTGCCTGTC  TCGAACTGCT  GGACTCAAGC1321  AATCTGCCAA  TCTTGGCCTC  CCAAAATGGT  GGGATTACAG  GTGTAGTAGG  CCATTATGCC1381  CACCCCAGAA  CTTCTTATTA  TTTTGGTGAC  TTCTAGAGTT  GTGTTGGTTG  CAAATCTCTG1441  TTACAACCCT  GACCCCCAAA  CTGTGTCCCT  AGGATTGGCT  TCCTTTTACT  AGAGGTCCCT1501  GTCCCCTGAA  GCACAACCCT  TAATCTCTTA  ATATAGTGGC  TTCTGAGTCA  CTCCTGTGTT1561  TGGCCCCCAG  GGAACCCTCA  GGCAGCTCTG  CTGTCCTTTT  CTTATTTGCC  AGGCTTTGCT1621  TCTGGCCTGA  ATTAATTACT  GACTTATGAG  GGTTAATGGA  AACCAGGCAG  CCTTTTTGAG1681  TCTCACCCAA  AGAAGCATCT  GTTTCTCATC  TTTACCATGT  AGGGAGGGCC  GGGGGTAGTG1741  AAGCACCCTC  TAGCCATCTT  GCCTCTGCCC  CATAGCTCCC  AGTAAGTGGT  TCAGGGACAA1801  AGTGTGTGAT  CTGATCATGT  CAACCAAGAA  CTCCACGGAT  TGTAAAGGGA  AAAACTCAGT1861  TCAAACTTCC  TTAAGCAAAA  AAGGCAACTT  ACTGGCTCAA  AGAATGTGAA  GGCTGAGCTA1921  CAAATTTAAC  TGCAGATAGC  TCTGGATCCT  GTTTCTCAAT  CATCATCAGG  GATTTCCCCA1981  CCTCTCATTG  TATTCCTTGA  CTCTGTATGT  TTCTACTTTG  CTTTGTTTCT  TGGCCTTTTC2041  CCCTTCTAGC  TACTGGCAGG  TTCAAGTCCA  CCTCTGAACC  TGCCACTTCA  GAGGGACTAT2101  TTTCCTTATT  GAGACACAGT  GGAAAGTCCC  AGGGAGTGGC  AGATGTAGGC  CAAGTTTGGG2161  TCATGTACAC  ATCCCTGAAG  CACTGTGCCC  AGGGCAATGA  TGTTTCATGA  TTGGCTGAGC2221  CTCAGTAAGG  GACCACCTCT  GTGCCTGGAG  TGCAGGGCAC  TGTGATTAGC  AATGTCCCAA2281  GGACCACAGT  GGAGGGAGAG  AGGGGCTCCC  TAAGGACTCA  GGAGATGGGG  ATTGGATGTT2341  GGGCAAACAA  ACAAACAAAC  AAACAAACAA  AAAAAACTAG  AGTGGCCAGC  ACAGCCTCCT2401  AGCCTGTCCT  GGAAGTGTTT  GCTAATGCTG  TCTCTTCTTT  GCCCCCATAC  CACGGGGTTA2461  GGATGCCCAT  GATGCCACTG  AGTACTTCCT  TCTGGCCCTG  GCAGCAGCGG  TCCTGCTGGG2521  TGATGAGGAG  CTTCAGGACA  CCATTAGGAG  CAGGCTGGAC  AACATCTGCC  AGAGCCCCCT2581  GTGGCACAGC  AGGCCTCCGG  GTGCTCCTCA  GAGAGGGCGC  GGTGGCTGAG  TGGTGGTGGC2641  CTGGCCCTCT  GAGGAAAGCT  GTCCTGTCTC  TGGACATTGT  GCATGGCCAG  ACTCTGACCC2701  CACTGCCCTA  GGCTCTTAAA  TACTCATTGG  GAGGGTCCGA  GTCCTTACCT  GCCTAGCCCC2761  CTCATTTCAC  AAGAAGAAGA  ATGAAGTCCA  GGAGGAGAAG  GGCTCATTGC  AGGCCACAGA2821  AAGATTTGAT  GGTGCAGCGA  TGAGAATTCC  TGGTTCCAGG  CTTTGCATCT  GGAGCCTTTA2881  CCGGTTGACT  GTTGCCTTCC  ACACAAACAG  CCTCTGAAAA  GCACTTTCTC  CATACATAAT2941  TCTGGAGAAG  ATGAGGGATC  TTGCCCTCCA  GGAGCCTTCC  TTCCTCCCCC  AATGAGGAAA3001  TCAGTCACTG  CACTGGTGCA  AAGGCAAGCA  GATTGGAATT  TGTGCTCTTC  ACCGATTTTC3061  TCAGGGAAAG  ACCCCTTCCC  CTTGCCAGCA  GAGGAACCTG  TAGTTTTTTC  CATTTCTTTC3121  TTCAGAACCA  AAGTATGTAT  CACTCCTCAT  GCTCACAGGG  ATTGACAGGA  GAGAATTCAC3181  CAGGATCTTA  GCTCAAAAGA  CACAGCCTCA  GAATGGCCAG  ATGGATTGCA  CGAAACCTGA3241  CTTGGATTCA  CCATCTTCCT  CCTGCCATAA  GGCTGTGCTC  CCACATAACC  TCCCAGAAGC3301  TCCAGGGAAG  CTTTCCAAGA  GCAAAGGCTT  GGAAATTGAA  TGTTAAGAAA  ATTATGACAT3361  AAATTACATG  TAAATAGTGA  AAAAAAAAAA  AAAAAAAAAA  AB:核苷酸序列(SEQ ID NO:14)长度:125个氨基酸
  1  MSEQMMQSVG  CRISLSVFQF  LGDQRQELVA  FHRLATVYYS  LHMYEMAEDC  YLKTLSLCPP
 61  WLQSPKEALY  YAKVYYRLGR  LTFCQLKVRA  RLPRFPDSHH  PTILLPDSKT  MRSLCGGAEK
121  TRVPRC.核苷酸及氨基酸组合序列(SEQ ID NO:15)克隆号和蛋白名称:PP12494起始编码子:223 ATG  终止编码子:598 TGA  蛋白质分子量:14596.401  GCT TGA CCC ATC CTC TAC TTA GTC ACT CTT ATA GAG CCC TGC ATT TTC      4849  TTT TGT AGC ATT TAT GAC ATG TGT AAT GTT ACA TTT GTT TGT GGG ATT      9697  ATT TAA GGA ATG TCT GTC ATG TGA GAC AAT AAG CTT TAT GAG TAC AGG     144145  CAC CTC TTC TGT CTT ATT TCC TAT GCC CCA GCA CAG TCC CTG ACA TCT     192193  AGT AGA CCT TCA AAA AGT TTT ATG GAA TGA ATG AGT GAA CAA ATG ATG     2401                                          Met Ser Glu Gln Met Met       6241  CAA AGT GTT GGT TGC AGG ATA TCT CTC TCA GTC TTC CAA TTC TTA GGA     2887  Gln Ser Val Gly Cys Arg Ile Ser Leu Ser Val Phe Gln Phe Leu Gly      22289  GAT CAG AGG CAA GAG CTG GTG GCC TTT CAC CGC CTG GCT ACA GTG TAC     33623  Asp Gln Arg Gln Glu Leu Val Ala Phe His Arg Leu Ala Thr Val Tyr      38337  TAC TCC CTG CAC ATG TAT GAG ATG GCT GAG GAC TGC TAC CTG AAG ACC     38439  Tyr Ser Leu His Met Tyr Glu Met Ala Glu Asp Cys Tyr Leu Lys Thr      54385  CTG TCC CTC TGT CCA CCA TGG CTG CAG AGT CCC AAG GAG GCC CTG TAC     43255  Leu Ser Leu Cys Pro Pro Trp Leu Gln Ser Pro Lys Glu Ala Leu Tyr      70433  TAT GCC AAG GTG TAT TAT CGC CTG GGC AGA CTC ACC TTC TGC CAG CTG     48071  Tyr Ala Lys Val Tyr Tyr Arg Leu Gly Arg Leu Thr Phe Cys Gln Leu      86481  AAG GTA AGA GCC AGA CTT CCC AGA TTT CCT GAC AGC CAC CAC CCA ACC     52887  Lys Val Arg Ala Arg Leu Pro Arg Phe Pro Asp Ser His His Pro Thr     102529  ATT CTC CTT CCT GAC TCA AAG ACA ATG AGG AGC CTT TGT GGT GGA GCT     576 103  Ile  Leu  Leu  Pro  Asp  Ser  Lys  Thr  Met  Arg  Ser  Leu  Cys  Gly  Gly  Ala     118577  GAG  AAA  ACC  AGA  GTG  CCA  AGA  TGA  GAA  GTC  TTG  TCT  CAT  AGG  GTG  AGG     624119  Glu  Lys  Thr  Arg  Val  Pro  Arg  ***                                             126625  AGT  GGC  TTT  ACA  GGG  GAC  ATG  GAA  GCT  CTT  TCC  ACT  TAA  CCC  TGC  TGA     672673  AGA  TCT  CAA  AGG  TGC  TCC  CAT  CTT  CGC  TGA  GGA  GTA  GAC  CAT  GGT  TCC     720721  TCT  TTC  TCC  TTG  CCT  TGC  CAC  CAT  GTC  TGT  GGC  TTC  TTT  ATC  TGT  CAG     768769  ATA  CTA  CAG  GCA  CAT  TGC  CTG  TAA  GTC  TCT  CAA  GGG  CCT  ATG  GAA  ATA     816817  TAC  AAG  ACC  CCA  AAA  CAA  AAG  AAC  TAT  AAG  GTC  TAA  AAT  GAA  GAT  CAA     864865  AAT  GAA  TAC  TTA  AGA  GTT  TGT  CCA  TAA  AAT  GTT  ACA  GAC  CAA  CTA  GTC     912913  AAC  TGC  AAC  TCA  TTT  CTT  ATA  AAG  TAA  TGT  AAA  GCT  ACA  TTT  TAT  GAG     960961  AAA  TGT  GGG  TGC  ATA  TTA  ACA  TGT  TTG  AGA  TAA  CGA  GGT  ATG  GGG  CCT    10081009  TTA  AAC  TAA  GTA  TAC  TTA  GAT  CTT  AAG  AAG  GTT  TTA  TCC  CTG  CTT  CTC    10561057  TTG  CTT  GCT  GAA  TCT  AGA  ACT  TCT  TTT  TTT  GCT  TGC  TTG  CTT  TTT  TTT    11041105  TGG  GAC  AGG  GTC  TTG  CTG  TGT  AGC  CCA  GGC  TGG  AGT  AGC  ATG  GCT  CAA    11521153  TCT  TGG  CTC  ACT  ACA  GCC  TCT  GCA  TCT  GGG  GCT  CAA  GCA  ATC  CTT  CTA    12001201  CTT  CAG  CCT  CCT  CAG  AAG  CTG  GGA  CCA  CAG  GTG  CAC  ACC  ACC  ACA  CCT    12481249  GGC  TAA  TTT  TTG  TAT  TTT  TTT  GTA  AAG  ATG  GGG  TTT  CAT  CAT  GTT  GCC    12961297  TGT  CTC  GAA  CTG  CTG  GAC  TCA  AGC  AAT  CTG  CCA  ATC  TTG  GCC  TCC  CAA    13441345  AAT  GGT  GGG  ATT  ACA  GGT  GTA  GTA  GGC  CAT  TAT  GCC  CAC  CCC  AGA  ACT    13921393  TCT  TAT  TAT  TTT  GGT  GAC  TTC  TAG  AGT  TGT  GTT  GGT  TGC  AAA  TCT  CTG    14401441  TTA  CAA  CCC  TGA  CCC  CCA  AAC  TGT  GTC  CCT  AGG  ATT  GGC  TTC  CTT  TTA    14881489  CTA  GAG  GTC  CCT  GTC  CCC  TGA  AGC  ACA  ACC  CTT  AAT  CTC  TTA  ATA  TAG    15361537  TGG  CTT  CTG  AGT  CAC  TCC  TGT  GTT  TGG  CCC  CCA  GGG  AAC  CCT  CAG  GCA    15841585  GCT  CTG  CTG  TCC  TTT  TCT  TAT  TTG  CCA  GGC  TTT  GCT  TCT  GGC  CTG  AAT    16321633  TAA  TTA  CTG  ACT  TAT  GAG  GGT  TAA  TGG  AAA  CCA  GGC  AGC  CTT  TTT  GAG    16801681  TCT  CAC  CCA  AAG  AAG  CAT  CTG  TTT  CTC  ATC  TTT  ACC  ATG  TAG  GGA  GGG    17281729  CCG  GGG  GTA  GTG  AAG  CAC  CCT  CTA  GCC  ATC  TTG  CCT  CTG  CCC  CAT  AGC    17761777  TCC  CAG  TAA  GTG  GTT  CAG  GGA  CAA  AGT  GTG  TGA  TCT  GAT  CAT  GTC  AAC    18241825  CAA  GAA  CTC  CAC  GGA  TTG  TAA  AGG  GAA  AAA  CTC  AGT  TCA  AAC  TTC  CTT    18721873  AAG  CAA  AAA  AGG  CAA  CTT  ACT  GGC  TCA  AAG  AAT  GTG  AAG  GCT  GAG  CTA    19201921  CAA  ATT  TAA  CTG  CAG  ATA  GCT  CTG  GAT  CCT  GTT  TCT  CAA  TCA  TCA  TCA    19681969  GGG  ATT  TCC  CCA  CCT  CTC  ATT  GTA  TTC  CTT  GAC  TCT  GTA  TGT  TTC  TAC    20162017  TTT  GCT  TTG  TTT  CTT  GGC  CTT  TTC  CCC  TTC  TAG  CTA  CTG  GCA  GGT  TCA    20642065  AGT  CCA  CCT  CTG  AAC  CTG  CCA  CTT  CAG  AGG  GAC  TAT  TTT  CCT  TAT  TGA    21122113  GAC  ACA  GTG  GAA  AGT  CCC  AGG  GAG  TGG  CAG  ATG  TAG  GCC  AAG  TTT  GGG    21602161  TCA  TGT  ACA  CAT  CCC  TGA  AGC  ACT  GTG  CCC  AGG  GCA  ATG  ATG  TTT  CAT    22082209  GAT  TGG  CTG  AGC  CTC  AGT  AAG  GGA  CCA  CCT  CTG  TGC  CTG  GAG  TGC  AGG    22562257  GCA  CTG  TGA  TTA  GCA  ATG  TCC  CAA  GGA  CCA  CAG  TGG  AGG  GAG  AGA  GGG    23042305  GCT  CCC  TAA  GGA  CTC  AGG  AGA  TGG  GGA  TTG  GAT  GTT  GGG  CAA  ACA  AAC    23522353  AAA  CAA  ACA  AAC  AAA  CAA  AAA  AAA  CTA  GAG  TGG  CCA  GCA  CAG  CCT  CCT    24002401  AGC  CTG  TCC  TGG  AAG  TGT  TTG  CTA  ATG  CTG  TCT  CTT  CTT  TGC  CCC  CAT    24482449  ACC  ACG  GGG  TTA  GGA  TGC  CCA  TGA  TGC  CAC  TGA  GTA  CTT  CCT  TCT  GGC    24962497  CCT  GGC  AGC  AGC  GGT  CCT  GCT  GGG  TGA  TGA  GGA  GCT  TCA  GGA  CAC  CAT    25442545  TAG  GAG  CAG  GCT  GGA  CAA  CAT  CTG  CCA  GAG  CCC  CCT  GTG  GCA  CAG  CAG    25922593  GCC  TCC  GGG  TGC  TCC  TCA  GAG  AGG  GCG  CGG  TGG  CTG  AGT  GGT  GGT  GGC    26402641  CTG  GCC  CTC  TGA  GGA  AAG  CTG  TCC  TGT  CTC  TGG  ACA  TTG  TGC  ATG  GCC    26882689  AGA  CTC  TGA  CCC  CAC  TGC  CCT  AGG  CTC  TTA  AAT  ACT  CAT  TGG  GAG  GGT    27362737  CCG  AGT  CCT  TAC  CTG  CCT  AGC  CCC  CTC  ATT  TCA  CAA  GAA  GAA  GAA  TGA    27842785  AGT  CCA  GGA  GGA  GAA  GGG  CTC  ATT  GCA  GGC  CAC  AGA  AAG  ATT  TGA  TGG    28322833  TGC  AGC  GAT  GAG  AAT  TCC  TGG  TTC  CAG  GCT  TTG  CAT  CTG  GAG  CCT  TTA    28802881  CCG  GTT  GAC  TGT  TGC  CTT  CCA  CAC  AAA  CAG  CCT  CTG  AAA  AGC  ACT  TTC       29282929  TCC  ATA  CAT  AAT  TCT  GGA  GAA  GAT  GAG  GGA  TCT  TGC  CCT  CCA  GGA  GCC       29762977  TTC  CTT  CCT  CCC  CCA  ATG  AGG  AAA  TCA  GTC  ACT  GCA  CTG  GTG  CAA  AGG       30243025  CAA  GCA  GAT  TGG  AAT  TTG  TGC  TCT  TCA  CCG  ATT  TTC  TCA  GGG  AAA  GAC       30723073  CCC  TTC  CCC  TTG  CCA  GCA  GAG  GAA  CCT  GTA  GTT  TTT  TCC  ATT  TCT  TTC       31203121  TTC  AGA  ACC  AAA  GTA  TGT  ATC  ACT  CCT  CAT  GCT  CAC  AGG  GAT  TGA  CAG       31683169  GAG  AGA  ATT  CAC  CAG  GAT  CTT  AGC  TCA  AAA  GAC  ACA  GCC  TCA  GAA  TGG       32163217  CCA  GAT  GGA  TTG  CAC  GAA  ACC  TGA  CTT  GGA  TTC  ACC  ATC  TTC  CTC  CTG       32643265  CCA  TAA  GGC  TGT  GCT  CCC  ACA  TAA  CCT  CCC  AGA  AGC  TCC  AGG  GAA  GCT       33123313  TTC  CAA  GAG  CAA  AGG  CTT  GGA  AAT  TGA  ATG  TTA  AGA  AAA  TTA  TGA  CAT       33603361  AAA  TTA  CAT  GTA  AAT  AGT  GAA  AAA  AAA  AAA  AAA  AAA  AAA  AA                  34016.PP12901A:核苷酸序列(SEQ ID NO:16)长度:2505个碱基1  GTGAAGAGGA  CTTTGTCGGA  AGCTCTCCTA  AGAAACAAGC  AGATGGAGTC  AGGACTCCCT61  TAAGCTGCTC  AGGGCTTGCC  ACACCATTGT  GTTGCATTCA  GCCTGTCGTC  TGATAAGCCC121  ACTTCTACAT  CCCCAGCTGA  CCAAGACCTT  TGGCCTCAGC  TAACATTTTC  CATTGACAGT181  CTGCCCAAAC  CCTTAAGACC  CTATGCTAAC  ATAGGGTCAG  CAGCCTTCCA  AGCCTTAAAA241  ATCCCCATCA  ACAAGGTATC  TGTGGGCCAG  GGTCCAAAGC  CTTCGCTGGG  GGTCATTCCC301  ACCTTCCTCA  CTAATTGTGC  AGGATGCTTT  TGCAGGGACA  CCATTTTTCC  ATTCCATACT361  GGGGCAGCCA  GCCATTGAGT  TTCAGCCCTT  TAGGTGGAGC  TCCCTCCCCG  CCAGAACACT421  CTAGACAGCC  AGCCAGCCCC  TTTGTCTTTG  GTTCCTGGGT  TAGGAGAAAC  AGGGCCACAG481  GGCGAGAGAG  AAGATGTTTT  CTCCTCCAGG  CAAGAGTTGT  CCCCTCCTTC  TTGGTCCTCC541  CTTTTTGTCT  TCTCAGTTGT  TATTATTTTG  CTGTGGTCAC  CGGCAAAGCA  GATGGTGGAT601  TGATTGCCAC  TTATCACTGT  CATGGTGCTG  TCACTCTGCC  TTTCCTCTAG  AGGACACCAG661  TCCTCTTCCA  CAGGGTCCTA  CCCTCAGGCT  CTTCCTTCCT  GGGAGTTCAA  GCCCCTGCCT721  CCTGTCCAGC  GGCATCCTGG  TAAGAAGCAA  TAGAGCTTGA  CCCGTGTTTC  GTGGTTTGGA781  GCACCTGTTC  AGTAGGACAG  CCACCATCTT  CAGAGTCCTG  CGAGGGTCAG  GGATATGACC841  TTCCTTGTCT  TTAGTCACTT  TAAGTAATGC  TTTAGCTGGC  TTAGCACAAG  GGTTGGGCAC901  AGCAGGTCCC  AGCAGCAGAG  GTATCGCTCC  AGCTGTGCTT  AGGAGACCAG  CCTTGGCCTG961  ATGTCTCTGC  CTTGTCAGTT  CATTCACCTG  CTATCACAGT  CTCCAGGGAT  GAGGGCATCC1021  TCTTCTCTAA  GAGTTCCCTA  AACCAACAGG  ACACTGTTAG  GGAGTCAGGG  GTAGTCTGCT1081  CTCAGTGCAG  GTACATGCCA  TCCTCCCCTT  TTACTATTCA  AGCCCAAATG  TCATAATGTC1141  CAGCAACTGC  CTAGTGGAGG  ACTCAGGCGG  GTGGACTGAC  CTCCCTCCTG  GGCAACCCCA1201  AACCTCCCGC  CCCAAAGATC  AGTTCCAGTG  TGTGGGTTCA  TTCAAATACT  GGTGCTACCA1261  CTTGCCCAAG  CTAATGAGTG  TCTGGGGGAA  ACCAAACAAA  TATAGAGTGC  CATAGAGCAC1321  ACAGCAGTGC  TATACAAACT  GAGTGGAAAG  CTTCCAAATT  CTGAGTTCCA  ACCACTTGGG1381  ACTGTCCAGG  ATTCTTTTGC  CAATTGATTG  TCCTACTGGC  TGGGCGGCCC  CCATATCAAT1441  TTCTTAACCA  TTTCCAAAAC  CCTCCCCTTT  CTTCACCACC  CCTTGTAGCG  AGTTCAAGGG1501  ATTTTGGGAC  TGGCTGGGCA  CAGTGGCTCA  TGCCTGTAAT  CAGAGCACTT  TGGGAGGCCG1561  AGGCAGGAGG  ATCACTTGAG  GTCAGGAGTT  CAAGACCACC  CTGGCCAACA  TGGTGAAACC1621  CCGTCTCTAC  CAAAAATACA  AAAATTAGCC  AGGCATGGTG  GTGCACGCCT  GTAATCCCAG1681  CTACTCAGGA  GGCTGAGGCA  GGAGAATCGC  TTGAACCCAG  GAAGCAGAGG  TTGCAGCGAG1741  CTGAGATCAT  GTCACGGTAC  TCCAGCCTGG  GTGACAGAGT  GAGACTCTGT  CTCAGAAACA1801  ACAGGGGGAT  TTCAGGACTG  ACCAAGAAAA  AAAGATCTGA  CCATTACTTA  GCAATAGCAA1861  ACGATGAGCT  TTATTTGGCA  ACACTTTGAC  AGGGTGGCAT  GTAAGGGAAG  TCCCATGAGG1921  GACGAGGCCA  TCCAGAGGTT  ACAGCCCCAG  GATAGCCACT  CAGAAGTACC  GGAGGGTAGG1981  GGACTCAAGG  AGGAGGGGAC  TGCCAGGGAG  GGGCTTATGT  GTCAGATGAC  GTGACTGAGC2041  AGCACCATGT  ATCTGGATCC  AATTTCTGAA  GGGCAGCTGC  GGCTTGGAAT  CTTGTACTAC2101  CAGGTTTATT  TTGTCTGTGG  CTAGCAGATG  TTGGGTGCAG  TTTCATGGGG  CATGCAAAGC2161  AGACAGGCTC  TAAATGGCTA  AAAATTAGTT  TATATGGGCT  ACGTTTGAAG  CTATTGGATG2221  TGTCAAACTT  TGAGTTTGGT  GCCTGTGGAT  TTTTGCAAAT  CTGCCCTGAA  GAAGTAAACA2281  ATAGAGGGGC  AACACAGAGA  AGCTATCTGA  CTCATTAATA  CAGCACTGCC  TGATCAGGAA2341  ACAGAGGACA  CAAATTAACA  ATATCAGGAG  GCCGGGCGCA  GTGGCTCATG  CCTGTAATCC2401  CAGCACTTGT  GGAGGCTAAG  GCAGGAGGAT  TGCTTGAGTC  CAGGAGTTTG  AGACCAGCCT2461  AGGAAACATA  GAGAGGTTGA  TATCTGCAAA  AAAAAAAACA  AAAAAB:核苷酸序列(SEQ ID NO:17)长度:108个氨基酸
 1  MLLQGHHFSI  PYWGSQPLSF  SPLGGAPSPP  EHSRQPASPF  VFGSWVRRNR  ATGRERRCFL
61  LQARVVPSFL  VLPFCLLSCY  YFAVVTGKAD  GGLIATYHCH  GAVTLPFLC.核苷酸及氨基酸组合序列(SEQ ID NO:18)克隆号和蛋白名称:PP12901起始编码子:324 ATG  终止编码子:648 TAG  蛋白质分子量:11947.271   GT GAA GAG GAC TTT GTC GGA AGC TCT CCT AAG AAA CAA GCA GAT GGA      4748  GTC AGG ACT CCC TTA AGC TGC TCA GGG CTT GCC ACA CCA TTG TGT TGC      9596  ATT CAG CCT GTC GTC TGA TAA GCC CAC TTC TAC ATC CCC AGC TGA CCA     143144  AGA CCT TTG GCC TCA GCT AAC ATT TTC CAT TGA CAG TCT GCC CAA ACC     191192  CTT AAG ACC CTA TGC TAA CAT AGG GTC AGC AGC CTT CCA AGC CTT AAA     239240  AAT CCC CAT CAA CAA GGT ATC TGT GGG CCA GGG TCC AAA GCC TTC GCT     287288  GGG GGT CAT TCC CAC CTT CCT CAC TAA TTG TGC AGG ATG CTT TTG CAG     3351                                                  Met Leu Leu Gln       4336  GGA CAC CAT TTT TCC ATT CCA TAC TGG GGC AGC CAG CCA TTG AGT TTC     3835  Gly His His Phe Ser Ile Pro Tyr Trp Gly Ser Gln Pro Leu Ser Phe      20384  AGC CCT TTA GGT GGA GCT CCC TCC CCG CCA GAA CAC TCT AGA CAG CCA     43121  Ser Pro Leu Gly Gly Ala Pro Ser Pro Pro Glu His Ser Arg Gln Pro      36432  GCC AGC CCC TTT GTC TTT GGT TCC TGG GTT AGG AGA AAC AGG GCC ACA     47937  Ala Ser Pro Phe Val Phe Gly Ser Trp Val Arg Arg Asn Arg Ala Thr      52480  GGG CGA GAG AGA AGA TGT TTT CTC CTC CAG GCA AGA GTT GTC CCC TCC     52753  Gly Arg Glu Arg Arg Cys Phe Leu Leu Gln Ala Arg Val Val Pro Ser      68528  TTC TTG GTC CTC CCT TTT TGT CTT CTC AGT TGT TAT TAT TTT GCT GTG     57569  Phe Leu Val Leu Pro Phe Cys Leu Leu Ser Cys Tyr Tyr Phe Ala Val      84576  GTC ACC GGC AAA GCA GAT GGT GGA TTG ATT GCC ACT TAT CAC TGT CAT     62385  Val Thr Gly Lys Ala Asp Gly Gly Leu Ile Ala Thr Tyr His Cys His     100624  GGT GCT GTC ACT CTG CCT TTC CTC TAG AGG ACA CCA GTC CTC TTC CAC     671101  Gly Ala Val Thr Leu Pro Phe Leu ***                                 109672  AGG GTC CTA CCC TCA GGC TCT TCC TTC CTG GGA GTT CAA GCC CCT GCC     719720  TCC TGT CCA GCG GCA TCC TGG TAA GAA GCA ATA GAG CTT GAC CCG TGT     767768  TTC GTG GTT TGG AGC ACC TGT TCA GTA GGA CAG CCA CCA TCT TCA GAG     815816  TCC TGC GAG GGT CAG GGA TAT GAC CTT CCT TGT CTT TAG TCA CTT TAA     863864  GTA ATG CTT TAG CTG GCT TAG CAC AAG GGT TGG GCA CAG CAG GTC CCA     911912  GCA GCA GAG GTA TCG CTC CAG CTG TGC TTA GGA GAC CAG CCT TGG CCT     959960  GAT GTC TCT GCC TTG TCA GTT CAT TCA CCT GCT ATC ACA GTC TCC AGG    10071008  GAT GAG GGC ATC CTC TTC TCT AAG AGT TCC CTA AAC CAA CAG GAC ACT    10551056  GTT AGG GAG TCA GGG GTA GTC TGC TCT CAG TGC AGG TAC ATG CCA TCC    11031104  TCC CCT TTT ACT ATT CAA GCC CAA ATG TCA TAA TGT CCA GCA ACT GCC    11511152  TAG TGG AGG ACT CAG GCG GGT GGA CTG ACC TCC CTC CTG GGC AAC CCC    11991200  AAA CCT CCC GCC CCA AAG ATC AGT TCC AGT GTG TGG GTT CAT TCA AAT    12471248  ACT GGT GCT ACC ACT TGC CCA AGC TAA TGA GTG TCT GGG GGA AAC CAA    12951296  ACA AAT ATA GAG TGC CAT AGA GCA CAC AGC AGT GCT ATA CAA ACT GAG    13431344  TGG AAA GCT TCC AAA TTC TGA GTT CCA ACC ACT TGG GAC TGT CCA GGA    13911392  TTC  TTT  TGC  CAA  TTG  ATT  GTC  CTA  CTG  GCT  GGG  CGG  CCC  CCA  TAT  CAA        14391440  TTT  CTT  AAC  CAT  TTC  CAA  AAC  CCT  CCC  CTT  TCT  TCA  CCA  CCC  CTT  GTA        14871488  GCG  AGT  TCA  AGG  GAT  TTT  GGG  ACT  GGC  TGG  GCA  CAG  TGG  CTC  ATG  CCT        15351536  GTA  ATC  AGA  GCA  CTT  TGG  GAG  GCC  GAG  GCA  GGA  GGA  TCA  CTT  GAG  GTC        15831584  AGG  AGT  TCA  AGA  CCA  CCC  TGG  CCA  ACA  TGG  TGA  AAC  CCC  GTC  TCT  ACC        16311632  AAA  AAT  ACA  AAA  ATT  AGC  CAG  GCA  TGG  TGG  TGC  ACG  CCT  GTA  ATC  CCA        16791680  GCT  ACT  CAG  GAG  GCT  GAG  GCA  GGA  GAA  TCG  CTT  GAA  CCC  AGG  AAG  CAG        17271728  AGG  TTG  CAG  CGA  GCT  GAG  ATC  ATG  TCA  CGG  TAC  TCC  AGC  CTG  GGT  GAC        17751776  AGA  GTG  AGA  CTC  TGT  CTC  AGA  AAC  AAC  AGG  GGG  ATT  TCA  GGA  CTG  ACC        18231824  AAG  AAA  AAA  AGA  TCT  GAC  CAT  TAC  TTA  GCA  ATA  GCA  AAC  GAT  GAG  CTT        18711872  TAT  TTG  GCA  ACA  CTT  TGA  CAG  GGT  GGC  ATG  TAA  GGG  AAG  TCC  CAT  GAG        19191920  GGA  CGA  GGC  CAT  CCA  GAG  GTT  ACA  GCC  CCA  GGA  TAG  CCA  CTC  AGA  AGT        19671968  ACC  GGA  GGG  TAG  GGG  ACT  CAA  GGA  GGA  GGG  GAC  TGC  CAG  GGA  GGG  GCT        20152016  TAT  GTG  TCA  GAT  GAC  GTG  ACT  GAG  CAG  CAC  CAT  GTA  TCT  GGA  TCC  AAT        20632064  TTC  TGA  AGG  GCA  GCT  GCG  GCT  TGG  AAT  CTT  GTA  CTA  CCA  GGT  TTA  TTT        21112112  TGT  CTG  TGG  CTA  GCA  GAT  GTT  GGG  TGC  AGT  TTC  ATG  GGG  CAT  GCA  AAG        21592160  CAG  ACA  GGC  TCT  AAA  TGG  CTA  AAA  ATT  AGT  TTA  TAT  GGG  CTA  CGT  TTG        22072208  AAG  CTA  TTG  GAT  GTG  TCA  AAC  TTT  GAG  TTT  GGT  GCC  TGT  GGA  TTT  TTG        22552256  CAA  ATC  TGC  CCT  GAA  GAA  GTA  AAC  AAT  AGA  GGG  GCA  ACA  CAG  AGA  AGC        23032304  TAT  CTG  ACT  CAT  TAA  TAC  AGC  ACT  GCC  TGA  TCA  GGA  AAC  AGA  GGA  CAC        23512352  AAA  TTA  ACA  ATA  TCA  GGA  GGC  CGG  GCG  CAG  TGG  CTC  ATG  CCT  GTA  ATC        23992400  CCA  GCA  CTT  GTG  GAG  GCT  AAG  GCA  GGA  GGA  TTG  CTT  GAG  TCC  AGG  AGT        24472448  TTG  AGA  CCA  GCC  TAG  GAA  ACA  TAG  AGA  GGT  TGA  TAT  CTG  CAA  AAA  AAA        24952496  AAA  CAA  AAA A                                                                       25057.PP13275A:核苷酸序列(SEQ ID NO:19)长度:3940个碱基1  GGGGAACAGC  TGATCCGTCT  GTTGGGAGGA  CAGATATCTC  AAGGCCAGGA  TGGAAGAATC61  ACCACTAAGC  CGGGCACCAT  CCCGTGGTGG  AGTCAACTTT  CTCAATGTAG  CCCGGACCTA121  CATCCCCAAC  ACCAAGGTGG  AATGTCACTA  CACCCTTCCC  CCAGGCACCA  TGCCCAGTGC181  CAGTGACTGG  ATTGGCATCT  TCAAGGTGGA  GGCTGCCTGT  GTTCGGGATT  ACCACACATT241  TGTGTGGTCT  TCCGTGCCTG  AAAGTACAAC  TGATGGTTCC  CCCATTCACA  CCAGTGTCCA301  GTTCCAAGCC  AGCTACCTGC  CCAAACCAGG  AGCTCAGCTC  TACCAGTTCC  GATATGTGAA361  CCGCCAGGGC  CAGGTGTGTG  GGCAGAGCCC  CCCTTTCCAG  TTCCGAGAGC  CAAGGCCCAT421  GGATGAACTG  GTGACCCTGG  AGGAGGCTGA  TGGGGGCTCT  GACATCCTGC  TGGTTGTCCC481  CAAGGCAACT  GTGTTACAGA  ACCAGCTCGA  TGAGAGCCAG  CAAGAACGGA  ATGACCTGAT541  GCAGCTGAAG  CTACAGCTGG  AGGGACAGGT  GACAGAGCTG  AGGAGCCGAG  TGCAGGAGCT601  CGAGAGGGCT  CTGGCAACTG  CCAGGCAGGA  GCACACGGAG  CTGATGGAAC  AGTACAAGGG661  GATTTCCCGG  TCCCATGGGG  AGATCACAGA  AGAGAGGGAC  ATCCTGAGCC  GGCAACAGGG721  AGACCATGTG  GCACGCATCC  TGGAGCTAGA  GGATGACATC  CAGACCATCA  GTGAGAAAGT781  GCTGACGAAG  GAAGTGGAGC  TGGACAGGCT  TAGAGACACA  GTGAAGGCCC  TGACTCGGGA841  ACAAGAAAAG  CTCCTTGGGC  AACTGAAAGA  AGTACAAGCA  GACAAGGAGC  AAAGTGAGGC901  CGAGCTCCAA  GTGGCACAAC  AGGAGAACCA  TCACTTAAAT  TTGGACCTGA  AGGAGGCGAA961  GAGCTGGCAA  GAGGAGCAGA  GTGCTCAGGC  TCAGCGACTG  AAAGACAAGG  TGGCCCAGAT1021  GAAGGACACC  CTAGGCCAGG  CCCAGCAGCG  GGTGGCCGAG  CTGGAGCCCT  TGAAGGAGCA1081  GCTTCGAGGG  GCCCAGGAGC  TTGCAGCCTC  AAGCCAGCAG  AAAGCCACCC  TTCTTGGGGA1141  GGAGTTGGCC  AGTGCAGCAG  CAGCCAGGGA  CCGCACCATA  GCCGAACTAC  ACCGCAGCCG1201  CCTGGAAGTG  GCTGAAGTTA  ACGGCAGGCT  GGCTGAGCTC  GGTTTGCACT  TGAAGGAAGA1261  AAAATGCCAA  TGGAGCAAGG  AGCGGGCAGG  GCTGCTGCAG  AGTGTGGAGG  CAGAGAAGGA1321  CAAGATCCTG  AAGCTGAGTG  CAGAGATACT  TCGATTGGAG  AAGGCAGTTC  AGGAGGAGAG1381  GACCCAAAAC  CAAGTGTTCA  AGACTGAGCT  GGCCCGGGAG  AAGGATTCTA  GCCTGGTACA1441  GTTGTCAGAA  AGTAAGCGGG  AGCTGACAGA  GCTGCGGTCA  GCCCTGCGTG  TGCTCCAGAA1501  GGAAAAGGAG  CAGTTACAGG  AGGAGAAACA  GGAATTGCTA  GAGTACATGA  GAAAGCTAGA1561  GGCCCGCCTG  GAGAAGGTGG  CAGATGAGAA  GTGGAATGAG  GATGCCACCA  CAGAGGATGA1621  GGAGGCCGCT  GTGGGGCTGA  GCTGCCCGGC  AGCTCTGACA  GACTCAGAGG  ACGAGTCCCC1681  AGAAGACATG  AGGCTCCCAC  CCTATGGCCT  TTGTGAGCGT  GGAGACCCAG  GCTCCTCTCC1741  TGCTGGGCCT  CGAGAGGCTT  CTCCCCTTGT  TGTCATCAGC  CAGCCGGCTC  CCATTTCTCC1801  TCACCTCTCT  GGGCCAGCTG  AGGACAGTAG  CTCTGACTCG  GAGGCTGAAG  ATGAGAAGTC1861  AGTCCTGATG  GCAGCTGTGC  AGAGTGGGGG  TGAGGAGGCC  AACTTACTGC  TTCCTGAACT1921  GGGCAGTGCC  TTCTATGACA  TGGCCAGGTG  AGTTCAACCA  GCAAGGCCAG  GAGGGAGGTG1981  GGAGGAGGTC  AGAGGGAAAG  GGCATCTGTG  TGGACAGTCA  CCAGGCCCTG  CTCCCAACCC2041  CTGCCCTTCT  TGGCCTCAGC  CAAGAAAAGG  AGATACAGGT  ATGGTTAACA  AGGAAAATGA2101  CTCACTGCTC  CAAATCCCAG  ATGCCTTCAG  GTAATCCCTA  CCCCTATCTT  ATCAATGCAC2161  TCAGAGGTCC  TGCCTTTAAC  TGGCTTCTAT  GTTGTTCTAG  CACCATCTTC  TGCAGAGCCC2221  AAATTGCCCT  GCTTCCCCTC  TCTCCTGCCT  CTACCCCTTC  CCCAACCACC  AGGTAGGTAC2281  CTAGGGTCCT  CCGGGGAGGA  AGGGAGGTGA  CCATGGCCCC  CAGGGATAGG  AGCAGAGAGA2341  AGACTGGGAT  CCAGCATCCA  TCTGGCTACA  ACTGAAATGC  TTTCCCTCTT  CCCTGACTTC2401  CCTGGGTAAC  CCTTAGGGAA  GGGAACCTAT  AGAGGTGGGG  GTTTCAGGTA  TCAGATTGTC2461  CCCTTCTGCC  TTCCCTTTTA  TTCCCAGGTT  CAAGGGGGCA  GGCACAGGGA  AGAGAGATTT2521  GATCATCTAG  TCCCGGTTTT  GCCTGGATGT  GAGATGGGCT  CAGGGCAGGG  AGGGGGTGAT2581  GCTGTCATCC  TTCTCGGCTG  GAGCAGGAAG  ATGAAGGACG  ATGTCAGACT  CATTTTCAGC2641  CTCATTAGGC  AGCAGACGGA  GATGGAGGGA  GGAGAGCAGG  AGGCTGGGGG  ATGGGCTCTG2701  CACTGCAGAG  ACCAGCAGGG  ACTAAAGAAG  AGAGGACATG  GGGAACTGGA  AAAATAAGCC2761  TTCCAGGATT  GTGGGGAGAA  AGACGCTGTG  GGAGAGGCCA  GGATGCTGCA  TTAGGCACAG2821  GATAACCTGG  GAACCCGGCA  CATGGGTCCT  GCTCTCCGAA  GTCTGCAAGT  CAAGAAGGGA2881  ACAGAGCACG  CCGACCCTCT  CCCTTTCCCC  TCTGTCTCTC  TTAGTGGCTT  TACAGTGGGT2941  ACCCTGTCAG  AAACCAGCAC  TGGGGGCCCT  GCCACCCCCA  CATGGAAGGA  GTGTCCTATC3001  TGTAAGGAGC  GCTTTCCTGC  TGAGAGTGAC  AAGGATGCCC  TGGAGGACCA  CATGGATGGA3061  CACTTCTTTT  TCAGCACCCA  GGACCCCTTC  ACCTTTGAGT  GATCTTACTC  CCTCGTACAT3121  GCACAAATAC  ACACTCATGC  ACACACACAC  TCACACACAT  GCATACACTT  AGGTTTCATG3181  CCCATTTTCT  ATCACACTGG  GCTCCATGAT  ATTCTGTTCC  CTAAGAACTG  CTTCTGTGTG3241  CCCTGTTTTC  ATCCCAAGAT  TTCTCACTTC  ATCCTCTCCT  ACCTGGCTCT  TTTGTCCCAG3301  GGAAGGGGTG  CCTGTTCGGA  AGCAGTGGCT  GAATTTATCC  CCTGAAAGTG  GTTTTGGAGG3361  AACCGGGATG  GAGGAGGCCT  TCCCCTGTGG  GAATAGAATC  GTCCACTCCT  AGCCCTGGTT3421  GCTTCTGATA  CACAGCCACT  GCACACACAC  ACTCACACTC  ACACTCCCTT  GTCTGATGCC3481  CCAAAGCCAA  TTCCTGGGGC  ACCCTACCCT  CTCTTATTTG  GAGTTTCCGT  TGGTTTACCT3541  GAGTTTTCTC  TGGGGTCTGC  ACAGAGGCAG  CAGCATGGAC  ATCATGGCCT  CTCAGGTCCC3601  TTTTGGTTCT  CAGTTTCATT  GGTTCCTCTT  TCTGTTCCCC  CATTGACTTC  TGTGCCCCAC3661  CCTAGCCTTT  TCCATAACCT  TAGGTATTCA  GTTTGGAGGG  GTTTTTTGTA  TTTTTGAGGA3721  TTCCTGTATT  CTGTATCCTC  TCCTCGCATC  TCCTCACATG  GAAAGAAATA  ATGTATTTGT3781  GCCTTCTGTG  AGGAATGGGG  GGAACAAGTG  GTCCCAGGTA  TCCCCATTTC  CAAGGCCCCC3841  CTCCCTCTCC  AGGTCCCCCC  ACAGCAATAA  AAGCTTCCCC  CTGATATCCC  CAAAAAAAAA3901  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAAB:核苷酸序列(SEQ ID NO:20)长度:633个氨基酸1  MEESPLSRAP  SRGGVNFLNV  ARTYIPNTKV  ECHYTLPPGT  MPSASDWIGI  FKVEAACVRD61  YHTFVWSSVP  ESTTDGSPIH  TSVQFQASYL  PKPGAQLYQF  RYVNRQGQVC  GQSPPFQFRE121  PRPMDELVTL  EEADGGSDIL  LVVPKATVLQ  NQLDESQQER  NDLMQLKLQL  EGQVTELRSR181  VQELERALAT  ARQEHTELME  QYKGISRSHG  EITEERDILS  RQQGDHVARI  LELEDDIQTI241  SEKVLTKEVE  LDRLRDTVKA  LTREQEKLLG  QLKEVQADKE  QSEAELQVAQ  QENHHLNLDL301  KEAKSWQEEQ  SAQAQRLKDK  VAQMKDTLGQ  AQQRVAELEP  LKEQLRGAQE  LAASSQQKAT361  LLGEELASAA  AARDRTIAEL  HRSRLEVAEV  NGRLAELGLH  LKEEKCQWSK  ERAGLLQSVE421  AEKDKILKLS  AEILRLEKAV  QEERTQNQVF  KTELAREKDS  SLVQLSESKR  ELTELRSALR481  VLQKEKEQLQ  EEKQELLEYM  RKLEARLEKV  ADEKWNEDAT  TEDEEAAVGL  SCPAALTDSE541  DESPEDMRLP  PYGLCERGDP  GSSPAGPREA  SPLVVISQPA  PISPHLSGPA  EDSSSDSEAE601  DEKSVLMAAV  QSGGEEANLL  LPELGSAFYD  MARC.核苷酸及氨基酸组合序列(SEQ ID NO:21)克隆号和蛋白名称:PP13275起始编码子:50 ATG  终止编码子:1949 TGA  蛋白质分子量:70974.611    G GGG AAC AGC TGA TCC GTC TGT TGG GAG GAC AGA TAT CTC AAG GCC      4647  AGG ATG GAA GAA TCA CCA CTA AGC CGG GCA CCA TCC CGT GGT GGA GTC      941      Met Glu Glu Ser Pro Leu Ser Arg Ala Pro Ser Arg Gly Gly Val      1595  AAC TTT CTC AAT GTA GCC CGG ACC TAC ATC CCC AAC ACC AAG GTG GAA     14216  Asn Phe Leu Asn Val Ala Arg Thr Tyr Ile Pro Asn Thr Lys Val Glu      31143  TGT CAC TAC ACC CTT CCC CCA GGC ACC ATG CCC AGT GCC AGT GAC TGG     19032  Cys His Tyr Thr Leu Pro Pro Gly Thr Met Pro Ser Ala Ser Asp Trp      47191  ATT GGC ATC TTC AAG GTG GAG GCT GCC TGT GTT CGG GAT TAC CAC ACA     23848  Ile Gly Ile Phe Lys Val Glu Ala Ala Cys Val Arg Asp Tyr His Thr      63239  TTT GTG TGG TCT TCC GTG CCT GAA AGT ACA ACT GAT GGT TCC CCC ATT     28664  Phe Val Trp Ser Ser Val Pro Glu Ser Thr Thr Asp Gly Ser Pro Ile      79287  CAC ACC AGT GTC CAG TTC CAA GCC AGC TAC CTG CCC AAA CCA GGA GCT     33480  His Thr Ser Val Gln Phe Gln Ala Ser Tyr Leu Pro Lys Pro Gly Ala      95335  CAG CTC TAC CAG TTC CGA TAT GTG AAC CGC CAG GGC CAG GTG TGT GGG     38296  Gln Leu Tyr Gln Phe Arg Tyr Val Asn Arg Gln Gly Gln Val Cys Gly     111383  CAG AGC CCC CCT TTC CAG TTC CGA GAG CCA AGG CCC ATG GAT GAA CTG     430112  Gln Ser Pro Pro Phe Gln Phe Arg Glu Pro Arg Pro Met Asp Glu Leu     127431  GTG ACC CTG GAG GAG GCT GAT GGG GGC TCT GAC ATC CTG CTG GTT GTC     478128  Val Thr Leu Glu Glu Ala Asp Gly Gly Ser Asp Ile Leu Leu Val Val     143479  CCC AAG GCA ACT GTG TTA CAG AAC CAG CTC GAT GAG AGC CAG CAA GAA     526144  Pro Lys Ala Thr Val Leu Gln Asn Gln Leu Asp Glu Ser Gln Gln Glu     159527  CGG AAT GAC CTG ATG CAG CTG AAG CTA CAG CTG GAG GGA CAG GTG ACA     574160  Arg Asn Asp Leu Met Gln Leu Lys Leu Gln Leu Glu Gly Gln Val Thr     175575  GAG CTG AGG AGC CGA GTG CAG GAG CTC GAG AGG GCT CTG GCA ACT GCC     622176  Glu Leu Arg Ser Arg Val Gln Glu Leu Glu Arg Ala Leu Ala Thr Ala     191623  AGG CAG GAG CAC ACG GAG CTG ATG GAA CAG TAC AAG GGG ATT TCC CGG     670192  Arg Gln Glu His Thr Glu Leu Met Glu Gln Tyr Lys Gly Ile Ser Arg     207671  TCC CAT GGG GAG ATC ACA GAA GAG AGG GAC ATC CTG AGC CGG CAA CAG     718208  Ser His Gly Glu Ile Thr Glu Glu Arg Asp Ile Leu Ser Arg Gln Gln     223719  GGA GAC CAT GTG GCA CGC ATC CTG GAG CTA GAG GAT GAC ATC CAG ACC     766224  Gly Asp His Val Ala Arg Ile Leu Glu Leu Glu Asp Asp Ile Gln Thr     239767  ATC AGT GAG AAA GTG CTG ACG AAG GAA GTG GAG CTG GAC AGG CTT AGA     814240  Ile Ser Glu Lys Val Leu Thr Lys Glu Val Glu Leu Asp Arg Leu Arg     255815  GAC ACA GTG AAG GCC CTG ACT CGG GAA CAA GAA AAG CTC CTT GGG CAA     862256  Asp Thr Val Lys Ala Leu Thr Arg Glu Gln Glu Lys Leu Leu Gly Gln     271863  CTG AAA GAA GTA CAA GCA GAC AAG GAG CAA AGT GAG GCC GAG CTC CAA     910272  Leu Lys Glu Val Gln Ala Asp Lys Glu Gln Ser Glu Ala Glu Leu Gln     287911  GTG GCA CAA CAG GAG AAC CAT CAC TTA AAT TTG GAC CTG AAG GAG GCG     958288  Val Ala Gln Gln Glu Asn His His Leu Asn Leu Asp Leu Lys Glu Ala     303 959  AAG AGC TGG CAA GAG GAG CAG AGT GCT CAG GCT CAG CGA CTG AAA GAC    1006304  Lys Ser Trp Gln Glu Glu Gln Ser Ala Gln Ala Gln Arg Leu Lys Asp     3191007  AAG GTG GCC CAG ATG AAG GAC ACC CTA GGC CAG GCC CAG CAG CGG GTG    1054320  Lys Val Ala Gln Met Lys Asp Thr Leu Gly Gln Ala Gln Gln Arg Val     3351055  GCC GAG CTG GAG CCC TTG AAG GAG CAG CTT CGA GGG GCC CAG GAG CTT    1102336  Ala Glu Leu Glu Pro Leu Lys Glu Gln Leu Arg Gly Ala Gln Glu Leu     3511103  GCA GCC TCA AGC CAG CAG AAA GCC ACC CTT CTT GGG GAG GAG TTG GCC    1150352  Ala Ala Ser Ser Gln Gln Lys Ala Thr Leu Leu Gly Glu Glu Leu Ala     3671151  AGT GCA GCA GCA GCC AGG GAC CGC ACC ATA GCC GAA CTA CAC CGC AGC    1198368  Ser Ala Ala Ala Ala Arg Asp Arg Thr Ile Ala Glu Leu His Arg Ser     3831199  CGC CTG GAA GTG GCT GAA GTT AAC GGC AGG CTG GCT GAG CTC GGT TTG    1246384  Arg Leu Glu Val Ala Glu Val Asn Gly Arg Leu Ala Glu Leu Gly Leu     3991247  CAC TTG AAG GAA GAA AAA TGC CAA TGG AGC AAG GAG CGG GCA GGG CTG    1294400  His Leu Lys Glu Glu Lys Cys Gln Trp Ser Lys Glu Arg Ala Gly Leu     4151295  CTG CAG AGT GTG GAG GCA GAG AAG GAC AAG ATC CTG AAG CTG AGT GCA    1342416  Leu Gln Ser Val Glu Ala Glu Lys Asp Lys Ile Leu Lys Leu Ser Ala     4311343  GAG ATA CTT CGA TTG GAG AAG GCA GTT CAG GAG GAG AGG ACC CAA AAC    1390432  Glu Ile Leu Arg Leu Glu Lys Ala Val Gln Glu Glu Arg Thr Gln Asn     4471391  CAA GTG TTC AAG ACT GAG CTG GCC CGG GAG AAG GAT TCT AGC CTG GTA    1438448  Gln Val Phe Lys Thr Glu Leu Ala Arg Glu Lys Asp Ser Ser Leu Val     4631439  CAG TTG TCA GAA AGT AAG CGG GAG CTG ACA GAG CTG CGG TCA GCC CTG    1486464  Gln Leu Ser Glu Ser Lys Arg Glu Leu Thr Glu Leu Arg Ser Ala Leu     4791487  CGT GTG CTC CAG AAG GAA AAG GAG CAG TTA CAG GAG GAG AAA CAG GAA    1534480  Arg Val Leu Gln Lys Glu Lys Glu Gln Leu Gln Glu Glu Lys Gln Glu     4951535  TTG CTA GAG TAC ATG AGA AAG CTA GAG GCC CGC CTG GAG AAG GTG GCA    1582496  Leu Leu Glu Tyr Met Arg Lys Leu Glu Ala Arg Leu Glu Lys Val Ala     5111583  GAT GAG AAG TGG AAT GAG GAT GCC ACC ACA GAG GAT GAG GAG GCC GCT    1630512  Asp Glu Lys Trp Asn Glu Asp Ala Thr Thr Glu Asp Glu Glu Ala Ala    5271631  GTG GGG CTG AGC TGC CCG GCA GCT CTG ACA GAC TCA GAG GAC GAG TCC    1678528  Val Gly Leu Ser Cys Pro Ala Ala Leu Thr Asp Ser Glu Asp Glu Ser     5431679  CCA GAA GAC ATG AGG CTC CCA CCC TAT GGC CTT TGT GAG CGT GGA GAC    1726544  Pro Glu Asp Met Arg Leu Pro Pro Tyr Gly Leu Cys Glu Arg Gly Asp     5591727  CCA GGC TCC TCT CCT GCT GGG CCT CGA GAG GCT TCT CCC CTT GTT GTC    1774560  Pro Gly Ser Ser Pro Ala Gly Pro Arg Glu Ala Ser Pro Leu Val Val     5751775  ATC AGC CAG CCG GCT CCC ATT TCT CCT CAC CTC TCT GGG CCA GCT GAG    1822576  Ile Ser Gln Pro Ala Pro Ile Ser Pro His Leu Ser Gly Pro Ala Glu     5911823  GAC AGT AGC TCT GAC TCG GAG GCT GAA GAT GAG AAG TCA GTC CTG ATG    1870592  Asp Ser Ser Ser Asp Ser Glu Ala Glu Asp Glu Lys Ser Val Leu Met     6071871  GCA GCT GTG CAG AGT GGG GGT GAG GAG GCC AAC TTA CTG CTT CCT GAA    1918608  Ala Ala Val Gln Ser Gly Gly Glu Glu Ala Asn Leu Leu Leu Pro Glu     6231919  CTG GGC AGT GCC TTC TAT GAC ATG GCC AGG TGA GTT CAA CCA GCA AGG    1966624  Leu Gly Ser Ala Phe Tyr Asp Met Ala Arg ***                         6341967  CCA GGA GGG AGG TGG GAG GAG GTC AGA GGG AAA GGG CAT CTG TGT GGA    20142015  CAG TCA CCA GGC CCT GCT CCC AAC CCC TGC CCT TCT TGG CCT CAG CCA    20622063  AGA AAA GGA GAT ACA GGT ATG GTTAAC AAG GAA AAT GAC TCA CTG CTC     21102111  CAA  ATC  CCA  GAT  GCC  TTC  AGG  TAA  TCC  CTA  CCC  CTA  TCT  TAT  CAA  TGC    21582159  ACT  CAG  AGG  TCC  TGC  CTT  TAA  CTG  GCT  TCT  ATG  TTG  TTC  TAG  CAC  CAT    22062207  CTT  CTG  CAG  AGC  CCA  AAT  TGC  CCT  GCT  TCC  CCT  CTC  TCC  TGC  CTC  TAC    22542255  CCC  TTC  CCC  AAC  CAC  CAG  GTA  GGT  ACC  TAG  GGT  CCT  CCG  GGG  AGG  AAG    23022303  GGA  GGT  GAC  CAT  GGC  CCC  CAG  GGA  TAG  GAG  CAG  AGA  GAA  GAC  TGG  GAT    23502351  CCA  GCA  TCC  ATC  TGG  CTA  CAA  CTG  AAA  TGC  TTT  CCC  TCT  TCC  CTG  ACT    23982399  TCC  CTG  GGT  AAC  CCT  TAG  GGA  AGG  GAA  CCT  ATA  GAG  GTG  GGG  GTT  TCA    24462447  GGT  ATC  AGA  TTG  TCC  CCT  TCT  GCC  TTC  CCT  TTT  ATT  CCC  AGG  TTC  AAG    24942495  GGG  GCA  GGC  ACA  GGG  AAG  AGA  GAT  TTG  ATC  ATC  TAG  TCC  CGG  TTT  TGC    25422543  CTG  GAT  GTG  AGA  TGG  GCT  CAG  GGC  AGG  GAG  GGG  GTG  ATG  CTG  TCA  TCC    25902591  TTC  TCG  GCT  GGA  GCA  GGA  AGA  TGA  AGG  ACG  ATG  TCA  GAC  TCA  TTT  TCA    26382639  GCC  TCA  TTA  GGC  AGC  AGA  CGG  AGA  TGG  AGG  GAG  GAG  AGC  AGG  AGG  CTG    26862687  GGG  GAT  GGG  CTC  TGC  ACT  GCA  GAG  ACC  AGC  AGG  GAC  TAA  AGA  AGA  GAG    27342735  GAC  ATG  GGG  AAC  TGG  AAA  AAT  AAG  CCT  TCC  AGG  ATT  GTG  GGG  AGA  AAG    27822783  ACG  CTG  TGG  GAG  AGG  CCA  GGA  TGC  TGC  ATT  AGG  CAC  AGG  ATA  ACC  TGG    28302831  GAA  CCC  GGC  ACA  TGG  GTC  CTG  CTC  TCC  GAA  GTC  TGC  AAG  TCA  AGA  AGG    28782879  GAA  CAG  AGC  ACG  CCG  ACC  CTC  TCC  CTT  TCC  CCT  CTG  TCT  CTC  TTA  GTG    29262927  GCT  TTA  CAG  TGG  GTA  CCC  TGT  CAG  AAA  CCA  GCA  CTG  GGG  GCC  CTG  CCA    29742975  CCC  CCA  CAT  GGA  AGG  AGT  GTC  CTA  TCT  GTA  AGG  AGC  GCT  TTC  CTG  CTG    30223023  AGA  GTG  ACA  AGG  ATG  CCC  TGG  AGG  ACC  ACA  TGG  ATG  GAC  ACT  TCT  TTT    30703071  TCA  GCA  CCC  AGG  ACC  CCT  TCA  CCT  TTG  AGT  GAT  CTT  ACT  CCC  TCG  TAC    31183119  ATG  CAC  AAA  TAC  ACA  CTC  ATG  CAC  ACA  CAC  ACT  CAC  ACA  CAT  GCA  TAC    31663167  ACT  TAG  GTT  TCA  TGC  CCA  TTT  TCT  ATC  ACA  CTG  GGC  TCC  ATG  ATA  TTC    32143215  TGT  TCC  CTA  AGA  ACT  GCT  TCT  GTG  TGC  CCT  GTT  TTC  ATC  CCA  AGA  TTT    32623263  CTC  ACT  TCA  TCC  TCT  CCT  ACC  TGG  CTC  TTT  TGT  CCC  AGG  GAA  GGG  GTG    33103311  CCT  GTT  CGG  AAG  CAG  TGG  CTG  AAT  TTA  TCC  CCT  GAA  AGT  GGT  TTT  GGA    33583359  GGA  ACC  GGG  ATG  GAG  GAG  GCC  TTC  CCC  TGT  GGG  AAT  AGA  ATC  GTC  CAC    34063407  TCC  TAG  CCC  TGG  TTG  CTT  CTG  ATA  CAC  AGC  CAC  TGC  ACA  CAC  ACA  CTC    34543455  ACA  CTC  ACA  CTC  CCT  TGT  CTG  ATG  CCC  CAA  AGC  CAA  TTC  CTG  GGG  CAC    35023503  CCT  ACC  CTC  TCT  TAT  TTG  GAG  TTT  CCG  TTG  GTT  TAC  CTG  AGT  TTT  CTC    35503551  TGG  GGT  CTG  CAC  AGA  GGC  AGC  AGC  ATG  GAC  ATC  ATG  GCC  TCT  CAG  GTC    35983599  CCT  TTT  GGT  TCT  CAG  TTT  CAT  TGG  TTC  CTC  TTT  CTG  TTC  CCC  CAT  TGA    36463647  CTT  CTG  TGC  CCC  ACC  CTA  GCC  TTT  TCC  ATA  ACC  TTA  GGT  ATT  CAG  TTT    36943695  GGA  GGG  GTT  TTT  TGT  ATT  TTT  GAG  GAT  TCC  TGT  ATT  CTG  TAT  CCT  CTC    37423743  CTC  GCA  TCT  CCT  CAC  ATG  GAA  AGA  AAT  AAT  GTA  TTT  GTG  CCT  TCT  GTG    37903791  AGG  AAT  GGG  GGG  AAC  AAG  TGG  TCC  CAG  GTA  TCC  CCA  TTT  CCA  AGG  CCC    38383839  CCC  TCC  CTC  TCC  AGG  TCC  CCC  CAC  AGC  AAT  AAA  AGC  TTC  CCC  CTG  ATA    38863887  TCC  CCA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA    39343935  AAA  AAA                                                                          39408.PP13296A:核苷酸序列(SEQ ID NO:22)长度:2889个碱基1  GCTTATCCTA  GCAATTGGGG  CGCGGGCCTG  TGAGCCAGTT  GGAGTTGCGG  CGGCGGGAAC61  GATTGGGCTG  AGCAGAGGAC  GACATGTTGC  TTTTCGTGGA  GGTAGCATCT  AAAGGAACTG121  GTTTAAATCC  TAATGCCAAA  GTATGGCAAG  AAATTGCTCC  TGGAAATACT  GATGCCACCC181  CAGTAACTCA  TGGAACTGAA  AGCTCTTGGC  ATGAAATAGC  AGCTACATCA  GGTGCTCATC241  CTGAGGGTAA  TGCAGAGCTC  TCAGAAGATA  TATGTAAAGA  ATATGAAGTA  ATGTATTCTT301  CATCTTGTGA  AACCACAAGA  AATACTACAG  GCATTGAAGA  ATCAACTGAT  GGGATGATTT361  TAGGACCAGA  AGATCTGAGT  TACCAAATAT  ATGATGTTTC  CGGAGAAAGC  AATTCAGCAG421  TTTCTACAGA  AGACCTAAAA  GAATGTCTGA  AGAAACAATT  AGAATTCTGT  TTTTCACGAG481  AAAATTTGTC  AAAGGATCTT  TACTTGATAT  CTCAAATGGA  TAGTGATCAG  TTCATCCCAA 541  TTTGGACAGT  TGCCAACATG  GAAGAAATAA  AAAAGTTGAC  TACAGACCCT  GATCTAATTC601  TTGAAGTGTT  AAGATCTTCT  CCCATGGTAC  AAGTTGATGA  GAAGGGTGAG  AAAGTGAGAC661  CAAGTCATAA  GCGTTGTATT  GTAATTCTTA  GAGAGATTCC  TGAAACAACA  CCAATAGAGG721  AAGTGAAAGG  TTTGTTCAAA  AGTGAAAACT  GCCCCAAAGT  GATAAGCTGT  GAGTTTGCAC781  ACAATAGCAA  CTGGTATATC  ACTTTCCAGT  CAGACACAGA  TGCACAACAG  GCTTTTAAAT841  ACTTAAGAGA  AGAAGTTAAA  ACATTTCAGG  GCAAGCCAAT  TATGGCAAGG  ATAAAAGCCA901  TCAATACATT  TTTTGCTAAG  AATGGTTATC  GATTAATGGA  TTCTAGTATC  TATAGTCACC961  CCATTCAAAC  TCAAGCACAG  TATGCCTCCC  CAGTCTTTAT  GCAGCCTGTA  TATAATCCTC1021  ACCAACAGTA  CTCGGTCTAT  AGTATTGTGC  CTCAGTCTTG  GTCTCCAAAT  CCTACACCTT1081  ACTTTGAAAC  ACCACTGGCT  CCCTTTCCCA  ATGGTAGTTT  TGTGAATGGC  TTTAATTCGC1141  CAGGATCTTA  TAAAACAAAT  GCTGCTGCTA  TGAATATGGG  TCGACCATTC  CAAAAAAATC1201  GTGTGAAGCC  TCAGTTTAGG  TCATCTGGTG  GTTCAGAACA  CTCAACAGAG  GGCTCTGTAT1261  CCTTGGGGGA  TGGACAGTTG  AACAGATATA  GTTCAAGAAA  CTTTCCAGCT  GAACGGCATA1321  ACCCCACAGT  AACTGGGCAT  CAGGAGCAAA  CTTACCTTCA  GAAGGAGACT  TCCACTTTGC1381  AGGTGGAACA  GAATGGGGAC  TATGGTAGGG  GCAGGAGAAC  TCTCTTCAGA  GGTCGAAGAC1441  GACGAGAAGA  TGACAGGATC  TCAAGACCTC  ATCCTTCAAC  AGCTGAATCA  AAGGCTCCAA1501  CACCAAAGTT  TGACTTATTA  GCCTCAAATT  TTCCACCTTT  ACCTGGAAGT  TCATCAAGAA1561  TGCCAGGTGA  ACTCGTTTTG  GAGACTAGGA  TGTCTGATGT  TGTTAAAGGT  GTCTACAAAG1621  AAAAGGATAA  TGAAGAGTTG  ACAATTAGTT  GCCCAGTGCC  TGCAGATGAG  CAGACAGAAT1681  GCACTTCTGC  CCAGCAACTC  AATATGAGTA  CCAGTTCTCC  ATGTGCTGCT  GAGCTTACTG1741  CATTAAGCAC  AACTCAGCAA  GAAAAGGATC  TAATAGAAGA  TTCCTCTGTT  CAGAAGGATG1801  GTCTCAATCA  GACAACTATA  CCAGTTTCTC  CTCCAAGTAC  TACAAAGCCA  TCGAGGGCAA1861  GTACTGCTTC  ACCATGTAAT  AATAACATAA  ATGCAGCTAC  AGCTGTGGCT  CTACAGGAAC1921  CCCGAAAGTT  AAGTTATGCT  GAAGTGTGCC  AGAAGCCCCC  TAAAGAGCCA  TCTTCAGTTC1981  TTGTGCAGCC  ACTACGGGAA  CTTCGCTCCA  ATGTGGTGTC  TCCCACCAAA  AATGAAGACA2041  ATGGAGCTCC  TGAGAACTCC  GTTGAGAAAC  CACATGAGAA  GCCAGAAGCA  AGGGCTAGTA2101  AGGATTATTC  TGGCTTCCGA  GGCAATATAA  TCCCCAGGGG  AGCAGCAGGA  AAAATCAGGG2161  AACAGAGACG  CCAGTTTAGC  CATAGGGCTA  TACCTCAGGG  AGTGACTCGA  CGTAATGGCA2221  AAGAGCAATA  TGTGCCACCC  AGATCACCAA  AGTAAAAAAC  AACAAAACTA  TTCAAAAACT2281  TCACTCTCTT  CCCATTAAAC  TTGAACTGTG  GCTATATTGA  ACTGTTTTGG  AGGGGAGGGG2341  GTAGCCAGGA  AGGAACAAGA  GAAAGTACGT  CCATTTCATT  ATGGATTTTG  GAGTTGTGAG2401  TGATAGGATC  CGAAAATTCA  TCTCTAATGT  GGTTTTTAAA  TGCTGGAGGA  TTCCAATCAA2461  TATAAATATA  TATATATATA  CACACACATA  TATAAAAAGT  ATAATTTTTC  TATTTTTGTT2521  TTTGGTTTTA  ATTTGCAGAG  ATTTGCTGCC  AGGAATCAAT  TTTGAGGGTT  CAGATTTAGC2581  TTGGAAGAAA  AAAAAGAAAC  ATACATCCTT  CAGTATAGGA  GATGAGGGAA  TGAGAGAAAA2641  TATTTTTTGA  AAAAGCATTT  CTGTAAAATT  AGAAATTACT  TTTTTTAATC  TATTTAAAGT2701  TTGGCTTGAA  GAATGCCATC  TCTGACTATA  TGGCCTTGTA  TTGCAAAGCA  GATCAGTGGC2761  TGGGGTGCCT  GTTGTGGGTG  TGAGTGTGTA  CAAGAGCGAT  TGAAGCCAAA  TCTGTTGTCA2821  TGTTAGTAAA  TGATTTGAAA  ACTGAATGTA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA2881  AAAAAAAAAB:核苷酸序列(SEQ ID NO:23)长度:723个氨基酸1  MLLFVEVASK  GTGLNPNAKV  WQEIAPGNTD  ATPVTHGTES  SWHEIAATSG  AHPEGNAELS61  EDICKEYEVM  YSSSCETTRN  TTGIEESTDG  MILGPEDLSY  QIYDVSGESN  SAVSTEDLKE121  CLKKQLEFCF  SRENLSKDLY  LISQMDSDQF  IPIWTVANME  EIKKLTTDPD  LILEVLRSSP181  MVQVDEKGEK  VRPSHKRCIV  ILREIPETTP  IEEVKGLFKS  ENCPKVISCE  FAHNSNWYIT241  FQSDTDAQQA  FKYLREEVKT  FQGKPIMARI  KAINTFFAKN  GYRLMDSSIY  SHPIQTQAQY301  ASPVFMQPVY  NPHQQYSVYS  IVPQSWSPNP  TPYFETPLAP  FPNGSFVNGF  NSPGSYKTNA361  AAMNMGRPFQ  KNRVKPQFRS  SGGSEHSTEG  SVSLGDGQLN  RYSSRNFPAE  RHNPTVTGHQ421  EQTYLQKETS  TLQVEQNGDY  GRGRRTLFRG  RRRREDDRIS  RPHPSTAESK  APTPKFDLLA481  SNFPPLPGSS  SRMPGELVLE  TRMSDVVKGV  YKEKDNEELT  ISCPVPADEQ  TECTSAQQLN541  MSTSSPCAAE  LTALSTTQQE  KDLIEDSSVQ  KDGLNQTTIP  VSPPSTTKPS  RASTASPCNN601  NINAATAVAL  QEPRKLSYAE  VCQKPPKEPS  SVLVQPLREL  RSNVVSPTKN  EDNGAPENSV661  EKPHEKPEAR  ASKDYSGFRG  NIIPRGAAGK  IREQRRQFSH  RAIPQGVTRR  NGKEQYVPPR721  SPKC.核苷酸及氨基酸组合序列(SEQ ID NO:24)克隆号和蛋白名称;PP13296起始编码子:84 ATG  终止编码子:2253 TAA  蛋白质分子量:80450.711   GC TTA TCC TAG CAA TTG GGG CGC GGG CCT GTG AGC CAG TTG GAG TTG      4748  CGG CGG CGG GAA CGA TTG GGC TGA GCA GAG GAC GAC ATG TTG CTT TTC      951                                                  Met Leu Leu Phe       496  GTG GAG GTA GCA TCT AAA GGA ACT GGT TTA AAT CCT AAT GCC AAA GTA     1435  Val Glu Val Ala Ser Lys Gly Thr Gly Leu Asn Pro Asn Ala Lys Val      20144  TGG CAA GAA ATT GCT CCT GGA AAT ACT GAT GCC ACC CCA GTA ACT CAT     19121  Trp Gln Glu Ile Ala Pro Gly Asn Thr Asp Ala Thr Pro Val Thr His      36192  GGA ACT GAA AGC TCT TGG CAT GAA ATA GCA GCT ACA TCA GGT GCT CAT     23937  Gly Thr Glu Ser Ser Trp His Glu Ile Ala Ala Thr Ser Gly Ala His      52240  CCT GAG GGT AAT GCA GAG CTC TCA GAA GAT ATA TGT AAA GAA TAT GAA     28753  Pro Glu Gly Asn Ala Glu Leu Ser Glu Asp Ile Cys Lys Glu Tyr Glu      68288  GTA ATG TAT TCT TCA TCT TGT GAA ACC ACA AGA AAT ACT ACA GGC ATT     33569  Val Met Tyr Ser Ser Ser Cys Glu Thr Thr Arg Asn Thr Thr Gly Ile      84336  GAA GAA TCA ACT GAT GGG ATG ATT TTA GGA CCA GAA GAT CTG AGT TAC     38385  Glu Glu Ser Thr Asp Gly Met Ile Leu Gly Pro Glu Asp Leu Ser Tyr     100384  CAA ATA TAT GAT GTT TCC GGA GAA AGC AAT TCA GCA GTT TCT ACA GAA     431101  Gln Ile Tyr Asp Val Ser Gly Glu Ser Asn Ser Ala Val Ser Thr Glu     116432  GAC CTA AAA GAA TGT CTG AAG AAA CAA TTA GAA TTC TGT TTT TCA CGA     479117  Asp Leu Lys Glu Cys Leu Lys Lys Gln Leu Glu Phe Cys Phe Ser Arg     132480  GAA AAT TTG TCA AAG GAT CTT TAC TTG ATA TCT CAA ATG GAT AGT GAT     527133  Glu Asn Leu Ser Lys Asp Leu Tyr Leu Ile Ser Gln Met Asp Ser Asp     148528  CAG TTC ATC CCA ATT TGG ACA GTT GCC AAC ATG GAA GAA ATA AAA AAG     575149  Gln Phe Ile Pro Ile Trp Thr Val Ala Asn Met Glu Glu Ile Lys Lys     164576  TTG ACT ACA GAC CCT GAT CTA ATT CTT GAA GTG TTA AGA TCT TCT CCC     623165  Leu Thr Thr Asp Pro Asp Leu Ile Leu Glu Val Leu Arg Ser Ser Pro     180624  ATG GTA CAA GTT GAT GAG AAG GGT GAG AAA GTG AGA CCA AGT CAT AAG     671181  Met Val Gln Val Asp Glu Lys Gly Glu Lys Val Arg Pro Ser His Lys     196672  CGT TGT ATT GTA ATT CTT AGA GAG ATT CCT GAA ACA ACA CCA ATA GAG     719197  Arg Cys Ile Val Ile Leu Arg Glu Ile Pro Glu Thr Thr Pro Ile Glu     212720  GAA GTG AAA GGT TTG TTC AAA AGT GAA AAC TGC CCC AAA GTG ATA AGC     767213  Glu Val Lys Gly Leu Phe Lys Ser Glu Asn Cys Pro Lys Val Ile Ser     228768  TGT GAG TTT GCA CAC AAT AGC AAC TGG TAT ATC ACT TTC CAG TCA GAC     815229  Cys Glu Phe Ala His Asn Ser Asn Trp Tyr Ile Thr Phe Gln Ser Asp     244816  ACA GAT GCA CAA CAG GCT TTT AAA TAC TTA AGA GAA GAA GTT AAA ACA     863245  Thr Asp Ala Gln Gln Ala Phe Lys Tyr Leu Arg Glu Glu Val Lys Thr     260864  TTT CAG GGC AAG CCA ATT ATG GCA AGG ATA AAA GCC ATC AAT ACA TTT     911261  Phe Gln Gly Lys Pro Ile Met Ala Arg Ile Lys Ala Ile Asn Thr Phe     276912  TTT GCT AAG AAT GGT TAT CGA TTA ATG GAT TCT AGT ATC TAT AGT CAC     959277  Phe Ala Lys Asn Gly Tyr Arg Leu Met Asp Ser Ser Ile Tyr Ser His     292 960  CCC ATT CAA ACT CAA GCA CAG TAT GCC TCC CCA GTC TTT ATG CAG CCT    1007293  Pro Ile Gln Thr Gln Ala Gln Tyr Ala Ser Pro Val Phe Met Gln Pro     3081008  GTA TAT AAT CCT CAC CAA CAG TAC TCG GTC TAT AGT ATT GTG CCT CAG    1055309  Val Tyr Asn Pro His Gln Gln Tyr Ser Val Tyr Ser Ile Val Pro Gln     3241056  TCT TGG TCT CCA AAT CCT ACA CCT TAC TTT GAA ACA CCA CTG GCT CCC    1103325  Ser Trp Ser Pro Asn Pro Thr Pro Tyr Phe Glu Thr Pro Leu Ala Pro     3401104  TTT CCC AAT GGT AGT TTT GTG AAT GGC TTT AAT TCG CCA GGA TCT TAT    1151341  Phe Pro Asn Gly Ser Phe Val Asn Gly Phe Asn Ser Pro Gly Ser Tyr     3561152  AAA ACA AAT GCT GCT GCT ATG AAT ATG GGT CGA CCA TTC CAA AAA AAT    1199357  Lys Thr Asn Ala Ala Ala Met Asn Met Gly Arg Pro Phe Gln Lys Asn     3721200  CGT GTG AAG CCT CAG TTT AGG TCA TCT GGT GGT TCA GAA CAC TCA ACA    1247373  Arg Val Lys Pro Gln Phe Arg Ser Ser Gly Gly Ser Glu His Ser Thr     3881248  GAG GGC TCT GTA TCC TTG GGG GAT GGA CAG TTG AAC AGA TAT AGT TCA    1295389  Glu Gly Ser Val Ser Leu Gly Asp Gly Gln Leu Asn Arg Tyr Ser Ser     4041296  AGA AAC TTT CCA GCT GAA CGG CAT AAC CCC ACA GTA ACT GGG CAT CAG    1343405  Arg Asn Phe Pro Ala Glu Arg His Asn Pro Thr Val Thr Gly His Gln     4201344  GAG CAA ACT TAC CTT CAG AAG GAG ACT TCC ACT TTG CAG GTG GAA CAG    1391421  Glu Gln Thr Tyr Leu Gln Lys Glu Thr Ser Thr Leu Gln Val Glu Gln     4361392  AAT GGG GAC TAT GGT AGG GGC AGG AGA ACT CTC TTC AGA GGT CGA AGA    1439437  Asn Gly Asp Tyr Gly Arg Gly Arg Arg Thr Leu Phe Arg Gly Arg Arg     4521440  CGA CGA GAA GAT GAC AGG ATC TCA AGA CCT CAT CCT TCA ACA GCT GAA    1487453  Arg Arg Glu Asp Asp Arg Ile Ser Arg Pro His Pro Ser Thr Ala Glu     4681488  TCA AAG GCT CCA ACA CCA AAG TTT GAC TTA TTA GCC TCA AAT TTT CCA    1535469  Ser Lys Ala Pro Thr Pro Lys Phe Asp Leu Leu Ala Ser Asn Phe Pro     4841536  CCT TTA CCT GGA AGT TCA TCA AGA ATG CCA GGT GAA CTC GTT TTG GAG    1583485  Pro Leu Pro Gly Ser Ser Ser Arg Met Pro Gly Glu Leu Val Leu Glu     5001584  ACT AGG ATG TCT GAT GTT GTT AAA GGT GTC TAC AAA GAA AAG GAT AAT    1631501  Thr Arg Met Ser Asp Val Val Lys Gly Val Tyr Lys Glu Lys Asp Asn     5161632  GAA GAG TTG ACA ATT AGT TGC CCA GTG CCT GCA GAT GAG CAG ACA GAA    1679517  Glu Glu Leu Thr Ile Ser Cys Pro Val Pro Ala Asp Glu Gln Thr Glu     5321680  TGC ACT TCT GCC CAG CAA CTC AAT ATG AGT ACC AGT TCT CCA TGT GCT    1727533  Cys Thr Ser Ala Gln Gln Leu Asn Met Ser Thr Ser Ser Pro Cys Ala     5481728  GCT GAG CTT ACT GCA TTA AGC ACA ACT CAG CAA GAA AAG GAT CTA ATA    1775549  Ala Glu Leu Thr Ala Leu Ser Thr Thr Gln Gln Glu Lys Asp Leu Ile     5641776  GAA GAT TCC TCT GTT CAG AAG GAT GGT CTC AAT CAG ACA ACT ATA CCA    1823565  Glu Asp Ser Ser Val Gln Lys Asp Gly Leu Asn Gln Thr Thr Ile Pro     5801824  GTT TCT CCT CCA AGT ACT ACA AAG CCA TCG AGG GCA AGT ACT GCT TCA    1871581  Val Ser Pro Pro Ser Thr Thr Lys Pro Ser Arg Ala Ser Thr Ala Ser     5961872  CCA TGT AAT AAT AAC ATA AAT GCA GCT ACA GCT GTG GCT CTA CAG GAA    1919597  Pro Cys Asn Asn Asn Ile Asn Ala Ala Thr Ala Val Ala Leu Gln Glu     6121920  CCC CGA AAG TTA AGT TAT GCT GAA GTG TGC CAG AAG CCC CCT AAA GAG    1967613  Pro Arg Lys Leu Ser Tyr Ala Glu Val Cys Gln Lys Pro Pro Lys Glu     6281968  CCA TCT TCA GTT CTT GTG CAG CCA CTA CGG GAA CTT CGC TCC AAT GTG    2015629  Pro Ser Ser Val Leu Val Gln Pro Leu Arg Glu Leu Arg Ser Asn Val     6442016  GTG TCT CCC ACC AAA AAT GAA GAC AAT GGA GCT CCT GAG AAC TCC GTT    2063645  Val Ser Pro Thr Lys Asn Glu Asp Asn Gly Ala Pro Glu Asn Ser Val     6602064  GAG AAA CCA CAT GAG AAG CCA GAA GCA AGG GCT AGT AAG GAT TAT TCT    2111661  Glu Lys Pro His Glu Lys Pro Glu Ala Arg Ala Ser Lys Asp Tyr Ser     6762112  GGC TTC CGA GGC AAT ATA ATC CCC AGG GGA GCA GCA GGA AAA ATC AGG    2159677  Gly Phe Arg Gly Asn Ile Ile Pro Arg Gly Ala Ala Gly Lys Ile Arg     6922160  GAA CAG AGA CGC CAG TTT AGC CAT AGG GCT ATA CCT CAG GGA GTG ACT    2207693  Glu Gln Arg Arg Gln Phe Ser His Arg Ala Ile Pro Gln Gly Val Thr     7082208  CGA CGT AAT GGC AAA GAG CAA TAT GTG CCA CCC AGA TCA CCA AAG TAA    2255709  Arg Arg Asn Gly Lys Glu Gln Tyr Val Pro Pro Arg Ser Pro Lys ***     7242256  AAA ACA ACA AAA CTA TTC AAA AAC TTC ACT CTC TTC CCA TTA AAC TTG    23032304  AAC TGT GGC TAT ATT GAA CTG TTT TGG AGG GGA GGG GGT AGC CAG GAA    23512352  GGA ACA AGA GAA AGT ACG TCC ATT TCA TTA TGG ATT TTG GAG TTG TGA    23992400  GTG ATA GGA TCC GAA AAT TCA TCT CTA ATG TGG TTT TTA AAT GCT GGA    24472448  GGA TTC CAA TCA ATA TAA ATA TAT ATA TAT ATA CAC ACA CAT ATA TAA    24952496  AAA GTA TAA TTT TTC TAT TTT TGT TTT TGG TTT TAA TTT GCA GAG ATT    25432544  TGC TGC CAG GAA TCA ATT TTG AGG GTT CAG ATT TAG CTT GGA AGA AAA    25912592  AAA AGA AAC ATA CAT CCT TCA GTA TAG GAG ATG AGG GAA TGA GAG AAA    26392640  ATA TTT TTT GAA AAA GCA TTT CTG TAA AAT TAG AAA TTA CTT TTT TTA    26872688  ATC TAT TTA AAG TTT GGC TTG AAG AAT GCC ATC TCT GAC TAT ATG GCC    27352736  TTG TAT TGC AAA GCA GAT CAG TGG CTG GGG TGC CTG TTG TGG GTG TGA    27832784  GTG TGT ACA AGA GCG ATT GAA GCC AAA TCT GTT GTC ATG TTA GTA AAT    28312832  GAT TTG AAA ACT GAA TGT AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    28792880  AAA AAA AAA A                                                      28899.PPl4214A:核苷酸序列(SEQ ID NO:25)长度:717个碱基1  GCTTCGGATG  ACTGCAGAAA  ATAGTGTTTT  GTAGTTCAAC  AACTCAAGAC  GAAGCTTATT61  TCTGAGGATA  AGCTCTTTAA  AGGCAAAGCT  TTATTTTCAT  CTCTCATCTT  TTGTCCTCCT121  TAGCACAATG  TAAAAAAGAA  TAGTAATATC  AGAACAGGAA  GGAGGAATGG  CTTGCTGGGG181  AGCCCATCCA  GGACACTGGG  AGCACATAGA  GATTCACCCA  TGTTTGTTGA  ACTTAGAGTC241  ATTCTCATGC  TTTTCTTTAT  AATTCACACA  TATATGCAGA  GAAGATATGT  TCTTGTTAAC301  ATTGTATACA  ACATAGCCCC  AAATATAGTA  AGATCTATAC  TAGATAATCC  TAGATGAAAT361  GTTAGAGATG  CTATATGATA  CAACTGTGGC  CATGACTGAG  GAAAGGAGCT  CACGCCCAGA421  GACTGGGCTG  CTCTCCCGGA  GGCCAAACCC  AAGAAGGTCT  GGCAAAGTCA  GGCTCAGGGA481  GACTCTGCCC  TGCTGCAGAC  CTCGGTGTGG  ACACACGCTG  CATAGAGCTC  TCCTTGAAAA541  CAGAGGGGTC  TCAAGACATT  CTGCCTACCT  ATTAGCTTTT  CTTTATTTTT  TTAACTTTTT601  GGGGGGAAAA  GTATTTTTGA  GAAGTTTGTC  TTGCAATGTA  TTTATAAATA  GTAAATAAAG661  TTTTTACCAT  TAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAB:核苷酸序列(SEQ ID NO:26)长度:99个氨基酸1 MLEMLYDTTV  AMTEERSSRP  ETGLLSRRPN  PRRSGKVRLR  ETLPCCRPRC  GHTLHRALLE61 NRGVSRHSAY  LLAFLYFFNF  LGGKVFLRSL  SCNVFINSKC.核苷酸及氨基酸组合序列(SEQ ID NO:27)克隆号和蛋白名称:PPl4214起始编码子:359 ATG  终止编码子:656 TAA  蛋白质分子量:11447.781   G CTT CGG ATG ACT GCA GAA AAT AGT GTT TTG TAG TTC AAC AAC TCA    4647 AGA CGA AGC TTA TTT CTG AGG ATA AGC TCT TTA AAG GCA AAG CTT TAT    9495 TTT CAT CTC TCA TCT TTT GTC CTC CTT AGC ACA ATG TAA AAA AGA ATA   142143  GTA ATA TCA GAA CAG GAA GGA GGA ATG GCT TGC TGG GGA GCC CAT CCA     190191  GGA CAC TGG GAG CAC ATA GAG ATT CAC CCA TGT TTG TTG AAC TTA GAG     238239  TCA TTC TCA TGC TTT TCT TTA TAA TTC ACA CAT ATA TGC AGA GAA GAT     286287  ATG TTC TTG TTA ACA TTG TAT ACA ACA TAG CCC CAA ATA TAG TAA GAT     334335  CTA TAC TAG ATA ATC CTA GAT GAA ATG TTA GAG ATG CTA TAT GAT ACA     3821                                  Met Leu Glu Met Leu Tyr Asp Thr       8383  ACT GTG GCC ATG ACT GAG GAA AGG AGC TCA CGC CCA GAG ACT GGG CTG     4309  Thr Val Ala Met Thr Glu Glu Arg Ser Ser Arg Pro Glu Thr Gly Leu      24431  CTC TCC CGG AGG CCA AAC CCA AGA AGG TCT GGC AAA GTC AGG CTC AGG     47825  Leu Ser Arg Arg Pro Asn Pro Arg Arg Ser Gly Lys Val Arg Leu Arg      40479  GAG ACT CTG CCC TGC TGC AGA CCT CGG TGT GGA CAC ACG CTG CAT AGA     52641  Glu Thr Leu Pro Cys Cys Arg Pro Arg Cys Gly His Thr Leu His Arg      56527  GCT CTC CTT GAA AAC AGA GGG GTC TCA AGA CAT TCT GCC TAC CTA TTA     57457  Ala Leu Leu Glu Asn Arg Gly Val Ser Arg His Ser Ala Tyr Leu Leu      72575  GCT TTT CTT TAT TTT TTT AAC TTT TTG GGG GGA AAA GTA TTT TTG AGA     62273  Ala Phe Leu Tyr Phe Phe Asn Phe Leu Gly Gly Lys Val Phe Leu Arg      88623  AGT TTG TCT TGC AAT GTA TTT ATA AAT AGT AAA TAA AGT TTT TAC CAT     67089  Ser Leu Ser Cys Asn Val Phe Ile Asn Ser Lys ***                     100671  TAA AAA AAA AAA AAA AAA AAA AAA AAAAAA AAA AAA AAA AAA AAA AA      71710.  FP497A:核苷酸序列(SEQ ID NO:28)长度:2444个碱基1  GACTGGACGG  CAGGGAGTGG  GGCTGTCATC  ATCAGATGAG  AGCTAAGGGG  ACCCCCACCA61  GGGTGGCGGC  AATGGCAGAG  GGTAGGCAAA  ACGCTTGTAT  TTGCAACATA  AGGTGAGATT121  TGACAGCTGA  CCGAGGGTGG  GAGCAGCAGC  CAAAACCAAA  AAAGCCAGAG  GGAAGTTGCA181  AGCACAGAAA  AAATAGAAGA  TTTAATGGGA  GAAATAACAA  TAGCTGGCAT  CTATTGAACA241  CTTACTGGGA  GCTAGGTACA  GGGCCCATTC  ATTCATTCAT  GCAATTAAAA  CTTTTTTTAA301  GAAACGGGGT  CTTGCTCTGT  TGCCCAGGCT  GGAGTGCAGT  GGTGTGATCA  CAGCTCACTG361  CAGCCTTGAA  TTCCTGGCCT  CAAGGAGTCC  TCCCACCTCG  GCCTCCTGTG  TAGCTGGGAT421  TATAGGTACG  TGCGGTACAC  CTGGCTCCCT  TTAAAAGTTT  TTTGTAGAGG  CAGGGCACAG481  TGGCTCACAC  CTGTAATCCC  AGCACTTTGG  GAGGCCGAGG  CAGGAGGATC  ACAAGGTCAG541  GAGTTCGAGA  CCAGCCTGAC  CAACATGGTG  AAACCCGTCT  CTACTTAAAA  TACAAAAATT601  AGCCGGGTGT  GGTGGCGGGC  GCCTGTAATC  CCAGCTACTC  AGGAGGCTGA  GGCATGAGAC661  TTGCTTGAAC  CCAGGAGGCG  AAGGTTGCAG  TGAGCCGAGA  TCGCGCCACT  GCACTCCAGC721  CTGGGTGACA  GAACAAGACT  CCGTCTCAAA  AAAAAAAAAA  AAGTTTCTTG  TAGAGGCAGG781  GCCTTGCTTT  GTTGCTGGTG  CAATCACGGC  TCACTGCATC  CTCTAACTCC  TGGCCTTAAG841  CAATCTTCTG  TCCTCAGCCT  CCCAAAGCAC  TGGGATTACA  GGCATGCATG  ACCACACCTG901  GTCCCTGCCA  TTGTTTATTG  AGCACCTACT  GAGTGCCATG  TATTAAGTGC  TGGGTATTTG961  TCAGTGGACA  AAACAGATTA  AAAAAATCAC  AGCCCTTAGG  AGCTTACCTT  CTGGCAGGGG1021  CGTCAGACAA  TAACACAGCA  AGTGCTGAGG  AAGAAACGGA  GGCGGCAGGG  AGCGTGGCAG1081  TTGAGCGTGG  CCTTCATGGA  GCTGCGACAG  TGGTACTCGG  GCAGGGGCAG  CACGGAGGCT1141  GTGCGCCAGA  GGAGGAGGAC  TGAGGGGCAA  GGGGGAGAGC  TCTGGTTGGA  AAGGCAGGGG1201  AGATTCTCCA  GGGCCTTGCC  GGTGCCAGTG  ACAACTGGGG  TTTTCCTGAG  ACGGGACTGC1261  GAGGAATGGG  GGCTCTCAGG  CTTGAGAGGG  CAAAGGTGGG  TCTGGGATGC  CGTCTGCCCA1321  CAGAGCCCCT  TCCCCAACGG  CTGCCCAGGC  CAAGCCAACC  CTGTTGGGTT  GTGTGGTGTG1381  AGCCATGAAG  CCGCTGCCAG  GTTTGTACCT  CAGGCGTGGT  CGTGATGCCC  CAGCTTCACC1441  GGCCCTGCCT  GTGGGGACGT  GGTGCCTGTG  TGCGGGAGCC  TGGGCCTCAG  CCGAGGCCCT1501  GAGCTCCGGC  ACTGCCCAGA  ACCCAGCTCA  GCGCTGGTAC  TCAGCCCGCC  CGCTGTGGCC1561  CTGGTGGAGT  GGAGCACGTG  CCCAGTGGGG  GCTGGCCTTG  TCCCATCGCG  GACCTGTCCT1621  TTCCCGGGGC  AGGGTGGTGT  GGGAGAGGGT  ATCAGGGACA  TTTTCTGAGT  CTGCTCTGTC1681  TCTGCCGCCC  CTGCCCGAAC  ACAGATTCTG  AAAGTCAAGA  AGACATCATC  CGGAATATTG1741  CCAGGCACCT  CGCCCAGGTC  GGGGACAGCA  TGGACCGTAG  CATCCCTCCG  GGCCTGGTGA1801  ACGGCCTGGC  CCTGCAGCTC  AGGAACACCA  GCCGGTCGGA  GGAGGACCGG  AACAGGGACC1861  TGGCCACTGC  CCTGGAGCAG  CTGCTGCAGG  CCTACCCTAG  AGACATGGAG  AAGGAGAAGA1921  CCATGCTGGT  GCTGGCCCTG  CTGCTGGCCA  AGAAGGTGGC  CAGTCACACG  CCGTCCTTGC1981  TCCGTGATGT  CTTTCACACA  ACAGTGAATT  TTATTAACCA  GAACCTACGC  ACCTACGTGA2041  GGAGCTTAGC  CAGAAATGGG  ATGGACTGAA  CGGACAGTTC  CAGAAGTGTG  ACTGGCTAAA2101  GCTCGATGTG  GTCACAGCTG  TATAGCTGCT  TCCAGTGTAG  ACGGAGCCCT  GGCATGTCAA2161  CAGCGTTCCT  AAAGAAGACA  GGCTGGAAAA  TAACTGTGAC  TTTTGTTTTA  AAGACAATGT2221  TTAACTTATA  ACCCCCTTTA  AAATATTTAC  ATTAATAAAC  TTGAATGAAA  ATGTCCCTTT2281  ACACCGGATT  TGAATGGCCT  TCATATCATC  CCCACATGAA  TCTGCACATC  TGTAAATCTA2341  CACACGGGGC  CTTTATTTCC  CCTGGGCAGG  GTCCCCCTTA  AAAATTAAAT  TGGAAAGCAG2401  GGTTCAAGGA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAB:核苷酸序列(SEQ ID NO:29)长度:109个氨基酸
1  MELRQWYSGR  GSTEAVRQRR  RTEGQGGELW  LERQGRFSRA  LPVPVTTGVF  LRRDCEEWGL61  SGLRGQRWVW  DAVCPQSPFP  NGCPGQANPV  GLCGVSHEAA  ARFVPQAWSC.核苷酸及氨基酸组合序列(SEQ ID NO:30)克隆号和蛋白名称:FP497起始编码子:1096 ATG  终止编码子:1423 TGA  蛋白质分子量:12226.161  GAC TGG ACG GCA GGG AGT GGG GCT GTC ATC ATC AGA TGA GAG CTA AGG      4849  GGA CCC CCA CCA GGG TGG CGG CAA TGG CAG AGG GTA GGC AAA ACG CTT      9697  GTA TTT GCA ACA TAA GGT GAG ATT TGA CAG CTG ACC GAG GGT GGG AGC     144145  AGC AGC CAA AAC CAA AAA AGC CAG AGG GAA GTT GCA AGC ACA GAA AAA     192193  ATA GAA GAT TTA ATG GGA GAA ATA ACA ATA GCT GGC ATC TAT TGA ACA     240241  CTT ACT GGG AGC TAG GTA CAG GGC CCA TTC ATT CAT TCA TGC AAT TAA     288289  AAC TTT TTT TAA GAA ACG GGG TCT TGC TCT GTT GCC CAG GCT GGA GTG     336337  CAG TGG TGT GAT CAC AGC TCA CTG CAG CCT TGA ATT CCT GGC CTC AAG     384385  GAG TCC TCC CAC CTC GGC CTC CTG TGT AGC TGG GAT TAT AGG TAC GTG     432433  CGG TAC ACC TGG CTC CCT TTA AAA GTT TTT TGT AGA GGC AGG GCA CAG     480481  TGG CTC ACA CCT GTA ATC CCA GCA CTT TGG GAG GCC GAG GCA GGA GGA     528529  TCA CAA GGT CAG GAG TTC GAG ACC AGC CTG ACC AAC ATG GTG AAA CCC     576577  GTC TCT ACT TAA AAT ACA AAA ATT AGC CGG GTG TGG TGG CGG GCG CCT     624625  GTA ATC CCA GCT ACT CAG GAG GCT GAG GCA TGA GAC TTG CTT GAA CCC     672673  AGG AGG CGA AGG TTG CAG TGA GCC GAG ATC GCG CCA CTG CAC TCC AGC     720721  CTG GGT GAC AGA ACA AGA CTC CGT CTC AAA AAA AAA AAA AAA GTT TCT     768769  TGT AGA GGC AGG GCC TTG CTT TGT TGC TGG TGC AAT CAC GGC TCA CTG     816817  CAT CCT CTA ACT CCT GGC CTT AAG CAA TCT TCT GTC CTC AGC CTC CCA     864865  AAG CAC TGG GAT TAC AGG CAT GCA TGA CCA CAC CTG GTC CCT GCC ATT     912913  GTT TAT TGA GCA CCT ACT GAG TGC CAT GTA TTA AGT GCT GGG TAT TTG     960961  TCA GTG GAC AAA ACA GAT TAA AAA AAT CAC AGC CCT TAG GAG CTT ACC    10081009  TTC TGG CAG GGG CGT CAG ACA ATA ACA CAG CAA GTG CTG AGG AAG AAA    10561057  CGG AGG CGG CAG GGA GCG TGG CAG TTG AGC GTG GCC TTC ATG GAG CTG    11041                                                      Met Glu Leu       31105  CGA CAG TGG TAC TCG GGC AGG GGC AGC ACG GAG GCT GTG CGC CAG AGG    11524  Arg Gln Trp Tyr Ser Gly Arg Gly Ser Thr Glu Ala Val Arg Gln Arg      191153  AGG AGG ACT GAG GGG CAA GGG GGA GAG CTC TGG TTG GAA AGG CAG GGG    120020  Arg Arg Thr Glu Gly Gln Gly Gly Glu Leu Trp Leu Glu Arg Gln Gly      351201  AGA TTC TCC AGG GCC TTG CCG GTG CCA GTG ACA ACT GGG GTT TTC CTG    1248  36  Arg Phe Ser Arg Ala Leu Pro Val Pro Val Thr Thr Gly Val Phe Leu     511249  AGA CGG GAC TGC GAG GAA TGG GGG CTC TCA GGC TTG AGA GGG CAA AGG    129652  Arg Arg Asp Cys Glu Glu Trp Gly Leu Ser Gly Leu Arg Gly Gln Arg      671297  TGG GTC TGG GAT GCC GTC TGC CCA CAG AGC CCC TTC CCC AAC GGC TGC    134468  Trp Val Trp Asp Ala Val Cys Pro Gln Ser Pro Phe Pro Asn Gly Cys      831345  CCA GGC CAA GCC AAC CCT GTT GGG TTG TGT GGT GTG AGC CAT GAA GCC    139284  Pro Gly Gln Ala Asn Pro Val Gly Leu Cys Gly Val Ser His Glu Ala      991393  GCT GCC AGG TTT GTA CCT CAG GCG TGG TCG TGA TGC CCC AGC TTC ACC    1440100  Ala Ala Arg Phe Val Pro Gln Ala Trp Ser ***                         1101441  GGC CCT GCC TGT GGG GAC GTG GTG CCT GTG TGC GGG AGC CTG GGC CTC    14881489  AGC CGA GGC CCT GAG CTC CGG CAC TGC CCA GAA CCC AGC TCA GCG CTG    15361537  GTA CTC AGC CCG CCC GCT GTG GCC CTG GTG GAG TGG AGC ACG TGC CCA    15841585  GTG GGG GCT GGC CTT GTC CCA TCG CGG ACC TGT CCT TTC CCG GGG CAG    16321633  GGT GGT GTG GGA GAG GGT ATC AGG GAC ATT TTC TGA GTC TGC TCT GTC    16801681  TCT GCC GCC CCT GCC CGA ACA CAG ATT CTG AAA GTC AAG AAG ACA TCA    17281729  TCC GGA ATA TTG CCA GGC ACC TCG CCC AGG TCG GGG ACA GCA TGG ACC    17761777  GTA GCA TCC CTC CGG GCC TGG TGA ACG GCC TGG CCC TGC AGC TCA GGA    18241825  ACA CCA GCC GGT CGG AGG AGG ACC GGA ACA GGG ACC TGG CCA CTG CCC    18721873  TGG AGC AGC TGC TGC AGG CCT ACC CTA GAG ACA TGG AGA AGG AGA AGA    19201921  CCA TGC TGG TGC TGG CCC TGC TGC TGG CCA AGA AGG TGG CCA GTC ACA    19681969  CGC CGT CCT TGC TCC GTG ATG TCT TTC ACA CAA CAG TGA ATT TTA TTA    20162017  ACC AGA ACC TAC GCA CCT ACG TGA GGA GCT TAG CCA GAA ATG GGA TGG    20642065  ACT GAA CGG ACA GTT CCA GAA GTG TGA CTG GCT AAA GCT CGA TGT GGT    21122113  CAC AGC TGT ATA GCT GCT TCC AGT GTA GAC GGA GCC CTG GCA TGT CAA    21602161  CAG CGT TCC TAA AGA AGA CAG GCT GGA AAA TAA CTG TGA CTT TTG TTT    22082209  TAA AGA CAA TGT TTA ACT TAT AAC CCC CTT TAA AAT ATT TAC ATT AAT    22562257  AAA CTT GAA TGA AAA TGT CCC TTT ACA CCG GAT TTG AAT GGC CTT CAT    23042305  ATC ATC CCC ACA TGA ATC TGC ACA TCT GTA AAT CTA CAC ACG GGG CCT    23522353  TTA TTT CCC CTG GGC AGG GTC CCC CTT AAA AAT TAA ATT GGA AAG CAG    24002401  GGT TCA AGG AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AA         244411. FP585A:核苷酸序列(SEQ ID NO:31)长度:1288个碱基1  GTGCTGGGCA  GCTTGAGTTT  TCCCCAGGCT  GCTCTATTGT  TGCCTGTAGC  TGTGATTTTT61  CAGGCAGGCT  GCTCCTCTGA  GGACCACCCT  TAACTGTCTA  CCTAACTGGT  TTTTCCTTTT121  CTTCTCCTCA  TTTGTATTTA  TGTATCAGTG  TATTATGTAT  TTATATACAC  TTGGAGATAC181  AGTAAAATGT  ACCTCTCACT  GTGGGTTACC  ATAAATACTG  TAAATTTGAG  AAACACTCTT241  TCAGGCCTGA  GAGGAGCAGT  GACAACAGTA  GGGATGATCA  AGTCAGATGT  CCCTGGTACC301  CAGGAATGGC  TGGATGAGAG  AAGGAGACAG  GGTGACCTGC  CCCTGCCTAC  AAACTCTAAC361  CCAGTTCTGT  CCCTGGAGCT  GTGTGACCCC  GGACAAGGCC  CTGCCCCTTT  CCAGGCTGTC421  GTTGTCCTCA  TCCAGCCTGG  GAGAGGGTTG  GCGCTGAGGC  CCCCACCTTC  TTGCCTGTTT481  CCTCCTGACC  CCACCCCTTC  CCCTCCTGCT  GGGCAGATCC  GAGTGAAGCC  TGACAGGACC541  GGTGTGGTCA  CGGATGGTGT  GAAGCACTCC  ATGAACCCCT  TCTGTGAGAT  CGCGGTGGAG601  GAGGCTGTGC  GGCTCAAGGA  GAAGAAGCTG  GTGAAGGAGG  TCATCGCCGT  CAGCTGTGGG661  CCTGCACAGT  GCCAGGAGAC  GATTCGTACC  GCCCTGGCCA  TGGGTGCAGA  CCGAGGTATC721  CACGTGGAGG  TGCCCCCAGC  AGAAGCAGAA  CGCTTGGGTC  CCCTGCAGGT  GGCTCGGGTC781  CTGGCCAAGC  TGGCAGAGAA  GGAGAAGGTG  GACCTGGTGC  TGCTGGGCAA  ACAGGCCATC841  GATGATGACT  GTAACCAGAC  AGGGCAGATG  ACAGCTGGAT  TTCTTGACTG  GCCACAGGGC901  ACATTCGCCT  CCCAGGTGAT  GCTGGAGGGG  GACAAGTTGA  AAGTGGAGCG  GGAGATCGAT 961  GGGGGCCTGG  AGACCCTGCG  CCTGAAGCTG  CCAGCTGTGG  TGACAGCTGA  CCTGAGGCTC1021  AACGAGCCCC  GCTACGCCAC  GCTGCCCAAC  ATCATGAAAG  CCAAGAAGAA  GAAGATCGAG1081  GTGATCAAGC  CTGGGGACCT  GGGTGTGGAC  CTGACCTCCA  AGCTCTCTGT  GATCAGTGTG1141  GAGGACCCGC  CCCAGCGCAC  GGCCGGCGTC  AAGGTGGAGA  CCACTGAGGA  CCTGGTGGCC1201  AAGCTGAAGG  AGATTGGGCG  GATTTGAGCC  CCTCCCAGAG  ATGGCAATAA  AACTGACTCT1261  CAACATCTAA  AAAAAAAAAA  AAAAAAAAB:核苷酸序列(SEQ ID NO:32)长度:346个氨基酸1  MYLSLWVTIN  TVNLRNTLSG  LRGAVTTVGM  IKSDVPGTQE  WLDERRRQGD  LPLPTNSNPV61  LSLELCDPGQ  GPAPFQAVVV  LIQPGRGLAL  RPPPSCLFPP  DPTPSPPAGQ  IRVKPDRTGV121  VTDGVKHSMN  PFCEIAVEEA  VRLKEKKLVK  EVIAVSCGPA  QCQETIRTAL  AMGADRGIHV181  EVPPAEAERL  GPLQVARVLA  KLAEKEKVDL  VLLGKQAIDD  DCNQTGQMTA  GFLDWPQGTF241  ASQVMLEGDK  LKVEREIDGG  LETLRLKLPA  VVTADLRLNE  PRYATLPNIM  KAKKKKIEVI301  KPGDLGVDLT  SKLSVISVED  PPQRTAGVKV  ETTEDLVAKL  KEIGRIC.核苷酸及氨基酸组合序列(SEQ ID NO:33)克隆号和蛋白名称:FP585起始编码子:187 ATG  终止编码子:1225 TGA  蛋白质分子量:37462.561  GTG CTG GGC AGC TTG AGT TTT CCC CAG GCT GCT CTA TTG TTG CCT GTA      4849  GCT GTG ATT TTT CAG GCA GGC TGC TCC TCT GAG GAC CAC CCT TAA CTG      9697  TCT ACC TAA CTG GTT TTT CCT TTT CTT CTC CTC ATT TGT ATT TAT GTA     144145  TCA GTG TAT TAT GTA TTT ATA TAC ACT TGG AGA TAC AGT AAA ATG TAC     1921                                                          Met Tyr       2193  CTC TCA CTG TGG GTT ACC ATA AAT ACT GTA AAT TTG AGA AAC ACT CTT     2403  Leu Ser Leu Trp Val Thr Ile Asn Thr Val Asn Leu Arg Asn Thr Leu      18241  TCA GGC CTG AGA GGA GCA GTG ACA ACA GTA GGG ATG ATC AAG TCA GAT     28819  Ser Gly Leu Arg Gly Ala Val Thr Thr Val Gly Met Ile Lys Ser Asp      34289  GTC CCT GGT ACC CAG GAA TGG CTG GAT GAG AGA AGG AGA CAG GGT GAC     33635  Val Pro Gly Thr Gln Glu Trp Leu Asp Glu Arg Arg Arg Gln Gly Asp      50337  CTG CCC CTG CCT ACA AAC TCT AAC CCA GTT CTG TCC CTG GAG CTG TGT     38451  Leu Pro Leu Pro Thr Asn Ser Asn Pro Val Leu Ser Leu Glu Leu Cys      66385  GAC CCC GGA CAA GGC CCT GCC CCT TTC CAG GCT GTC GTT GTC CTC ATC     43267  Asp Pro Gly Gln Gly Pro Ala Pro Phe Gln Ala Val Val Val Leu Ile      82433  CAG CCT GGG AGA GGG TTG GCG CTG AGG CCC CCA CCT TCT TGC CTG TTT     48083  Gln Pro Gly Arg Gly Leu Ala Leu Arg Pro Pro Pro Ser Cys Leu Phe      98481  CCT CCT GAC CCC ACC CCT TCC CCT CCT GCT GGG CAG ATC CGA GTG AAG     52899  Pro Pro Asp Pro Thr Pro Ser Pro Pro Ala Gly Gln Ile Arg Val Lys     114529  CCT GAC AGG ACC GGT GTG GTC ACG GAT GGT GTG AAG CAC TCC ATG AAC     576115  Pro Asp Arg Thr Gly Val Val Thr Asp Gly Val Lys His Ser Met Asn     130577  CCC TTC TGT GAG ATC GCG GTG GAG GAG GCT GTG CGG CTC AAG GAG AAG     624131  Pro Phe Cys Glu Ile Ala Val Glu Glu Ala Val Arg Leu Lys Glu Lys     146625  AAG CTG GTG AAG GAG GTC ATC GCC GTC AGC TGT GGG CCT GCA CAG TGC     672147  Lys Leu Val Lys Glu Val Ile Ala Val Ser Cys Gly Pro Ala Gln Cys     162673  CAG GAG ACG ATT CGT ACC GCC CTG GCC ATG GGT GCA GAC CGA GGT ATC     720163  Gln Glu Thr Ile Arg Thr Ala Leu Ala Met Gly Ala Asp Arg Gly Ile     178721  CAC GTG GAG GTG CCC CCA GCA GAA GCA GAA CGC TTG GGT CCC CTG CAG     768179  His Val Glu Val Pro Pro Ala Glu Ala Glu Arg Leu Gly Pro Leu Gln     194769  GTG GCT CGG GTC CTG GCC AAG CTG GCA GAG AAG GAG AAG GTG GAC CTG     816 195  Val Ala Arg Val Leu Ala Lys Leu Ala Glu Lys Glu Lys Val Asp Leu     210817  GTG CTG CTG GGC AAA CAG GCC ATC GAT GAT GAC TGT AAC CAG ACA GGG     864211  Val Leu Leu Gly Lys Gln Ala Ile Asp Asp Asp Cys Asn Gln Thr Gly     226865  CAG ATG ACA GCT GGA TTT CTT GAC TGG CCA CAG GGC ACA TTC GCC TCC     912227  Gln Met Thr Ala Gly Phe Leu Asp Trp Pro Gln Gly Thr Phe Ala Ser     242913  CAG GTG ATG CTG GAG GGG GAC AAG TTG AAA GTG GAG CGG GAG ATC GAT     960243  Gln Val Met Leu Glu Gly Asp Lys Leu Lys Val Glu Arg Glu Ile Asp     258961  GGG GGC CTG GAG ACC CTG CGC CTG AAG CTG CCA GCT GTG GTG ACA GCT    1008259  Gly Gly Leu Glu Thr Leu Arg Leu Lys Leu Pro Ala Val Val Thr Ala     2741009  GAC CTG AGG CTC AAC GAG CCC CGC TAC GCC ACG CTG CCC AAC ATC ATG    1056275  Asp Leu Arg Leu Asn Glu Pro Arg Tyr Ala Thr Leu Pro Asn Ile Met     2901057  AAA GCC AAG AAG AAG AAG ATC GAG GTG ATCAAG CCT GGG GAC CTG GGT     1104291  Lys Ala Lys Lys Lys Lys Ile Glu Val Ile Lys Pro Gly Asp Leu Gly     3061105  GTG GAC CTG ACC TCC AAG CTC TCT GTG ATC AGT GTG GAG GAC CCG CCC    1152307  Val Asp Leu Thr Ser Lys Leu Ser Val Ile Ser Val Glu Asp Pro Pro     3221153  CAG CGC ACG GCC GGC GTC AAG GTG GAG ACC ACT GAG GAC CTG GTG GCC    1200323  Gln Arg Thr Ala Gly ValLys Val Glu Thr Thr Glu Asp Leu Val Ala      3381201  AAG CTG AAG GAG ATT GGG CGG ATT TGA GCC CCT CCC AGA GAT GGC AAT    1248339  Lys Leu Lys Glu Ile Gly Arg Ile ***                                 3471249  AAA ACT GAC TCT CAA CAT CTA AAA AAA AAA AAA AAA AAA A              128812.FP588A:核苷酸序列(SEQ ID NO:34)长度:2057个碱基1  GCCAAAGTGT  TTTTGGTCAT  TAACAGGAAG  CATCTTTTCT  ACATTACGGT  TTCATGTGAC61  CAAATTATGG  CCATAGTATT  TCAGATTTAT  TCATCCACTA  AGTATTTATT  AAGTACCTAT121  TCTGTGCTAG  GTATCAGGTG  CTGGGGCTAT  AGCAGTAAGG  AAAGTAAGTG  GACAAAAGGA181  TTCCACACCT  GTCACAGGCG  CTGCCCCACT  CCCTGAGTCA  GGTGAGATGA  GCTCCGGAAG241  GCAGGTGGGT  AATGGATGAT  GCTCACCTAG  TGTTCCTTGG  GCCATGAAGA  TCAAATATTT301  CAGCCCCATA  GGATGTGTAA  GCTTGATTTC  TGGTCATCTC  TCCTTAAGGA  ATCATGGACC361  ATTCATTATT  TTGTTTAAAA  GGACACATAA  GAACGTACAT  GTCTCAATAG  AGTTACTGGT421  CACAGGACTG  AACTGTGGTC  ATGAAAGCCA  AGCAACTTAC  TTTCTGGCCT  CCATATTGCT481  TTGTAGGAGA  AATGATACTG  ACAATGATGT  CACACGAGGA  GGGAAGCCAG  GCACGAATCT541  GGTGGAGGTG  CGGTCAGTTG  TGACCAGCTT  TGCAAAGGGA  GCGGTGGGCG  AGGCTGTGGT601  CTCTCCCAGG  TGACCTCCAT  CGCCATGCAG  AGCTGCTCTC  ACTTCTCCTC  GGGAAAGGCC661  AGCGTCAGGT  ATTCCTAGGA  GGAAGCCCAG  GTGTGTCCAG  AGAACAGTAG  TCTTGTTAGA721  ACTGGAAAAA  TGTCTTATGG  CCAGGTGGCC  CCTGGTCTGA  AGGAAAAATA  GGAGCTGAGT781  GTGAACTTTT  ATCACTCAGA  AGATATAATC  CACCTCTCCC  CTCCTGCCCT  TCGCTCCTGG841  GTTGGTTGTG  AGGACAGTGC  TTTGTGACAG  CAGTGGAGCC  CTGTCTGTCC  TTCCGGGCTA901  GATTTCTTCT  TTCTCTTATT  CCTCCTGTTT  CGTTGTATCC  ACGATTTGTC  GAGTTGCAGG961  GCTCACCCTT  TCCTGAAGAA  ACCATCTCTT  TTCCCAGCTC  CGCACCTTTG  TCCGAGATGG1021  AGGCGTGTCC  TCCCGCCCAT  CCCCAGTGGG  GGGTGTTCTG  CCCATTCTCC  AGAGCCCAGC1081  ACTGCTCCCA  TCTCTTTTCC  TCCCTCTCCT  TCCCCTTGCT  GTTACCTGCT  GCCTTCTTGT1141  GCTCCCACTG  CCCTTGGCCA  TCCCTCTGTG  TCATTGTGCG  CTGTGGTGCA  CCTGTCTTCT1201  CTACTACACC  TTAAGAGCAG  GACTCTGCCT  CCTTCCTACC  AGCACCTCAT  GCAGCAAGTG1261  CTGCCAATAG  CAGGCACCCA  GCAGATAGCG  AATGCACGAC  TCCAAAACCC  AGCTTTGCCT1321  CCTGGCTGTA  GTTCAGACTA  GCTGTGTGAC  ACTGACCAAG  ACACTTGACC  TCTCTCAGAC1381  TCAGCTTCCT  CCTTGAAGAC  TGGGATGCTA  TGTAGCTCAG  AGGAAACATA  CACCTGAAGG1441  TGCTGCCCCG  GGGGGTGCAA  TGACCTGTTA  CTGAGGCTGG  ATGGAGGATG  GCATCCATCA1501  TCAGCTACAG  GTGCCTCCTC  TATCTACAGG  TTCCTGCTCC  ATCTATACTA  GCCACCTCCT1561  GGACAAGGGC  TCCAGTGTCC  TCCATGACAC  CAGCTTTCTC  CAGAGCCTGT  GCAGGATTTC1621  CTTCCTCTAC  CCTGAATCAG  GGTGATTCTT  AAAGGACAGT  TTCAGGAACA  TATAGGGGCA1681  CTTGGGTAAT  CTTGGTCAGT  AACTGACCTT  TAACTATCAT  CCATGTGAAC  ATCTACAGTT1741  AGGGATTTTC  TTGGTGATGT  TTGGCAAAAA  GTAAAGAATT  CCCCAAGTGT  GAAGCCTCAT1801  TCATTCACTT  ATTCAACAM   TAGTTATTGA  GCACCTACTA  TGTGTTAGGC  CCTGGGCCAG1861  GTGCTGGGAA  TACAGCAGAG  ACAGACCTGG  CTCCTGCCCT  CATGGAGTTT  GCAGTCATTC1921  ATTCACTCAC  TCGGTGACTT  TGGACACCTC  CCCCTCCTCT  CTCCAGGCTT  TAGATCTCTG1981  AGATTCTCTC  TGAGTCTGGG  ATGTAAAGAC  AAAGTAAAAC  CTGAAATCTG  GAAAGCAAAA2041  AAAAAAAAAA  AAAAAAAB:核苷酸序列(SEQ ID NO:35)长度:109个氨基酸
 1  MKIKYFSPIG  CVSLISGHLS  LRNHGPFIIL  FKRTHKNVHV  SIELLVTGLN  CGHESQATYF
61  LASILLCRRN  DTDNDVTRGG  KPGTNLVEVR  SVVTSFAKGA  VGEAVVSPRC.核苷酸及氨基酸组合序列(SEQ ID NO:36)克隆号和蛋白名称:FP588起始编码子:284 ATG 终止编码子:611 TGA  蛋白质分子量:11862.161    G CCA AAG TGT TTT TGG TCA TTA ACA GGA AGC ATC TTT TCT ACA TTA      4647  CGG TTT CAT GTG ACC AAA TTA TGG CCA TAG TAT TTC AGA TTT ATT CAT      9495  CCA CTA AGT ATT TAT TAA GTA CCT ATT CTG TGC TAG GTA TCA GGT GCT     142143  GGG GCT ATA GCA GTA AGG AAA GTA AGT GGA CAA AAG GAT TCC ACA CCT     190191  GTC ACA GGC GCT GCC CCA CTC CCT GAG TCA GGT GAG ATG AGC TCC GGA     238239  AGG CAG GTG GGT AAT GGA TGA TGC TCA CCT AGT GTT CCT TGG GCC ATG     2861                                                              Met       1287  AAG ATC AAA TAT TTC AGC CCC ATA GGA TGT GTA AGC TTG ATT TCT GGT     3342  Lys Ile Lys Tyr Phe Ser Pro Ile Gly Cys Val Ser Leu Ile Ser Gly      17335  CAT CTC TCC TTA AGG AAT CAT GGA CCA TTC ATT ATT TTG TTT AAA AGG     38218  His Leu Ser Leu Arg Asn His Gly Pro Phe Ile Ile Leu Phe Lys Arg      33383  ACA CAT AAG AAC GTA CAT GTC TCA ATA GAG TTA CTG GTC ACA GGA CTG     43034  Thr His Lys Asn Val His Val Ser Ile Glu Leu Leu Val Thr Gly Leu      49431  AAC TGT GGT CAT GAA AGC CAA GCA ACT TAC TTT CTG GCC TCC ATA TTG     47850  Asn Cys Gly His Glu Ser Gln Ala Thr Tyr Phe Leu Ala Ser Ile Leu      65479  CTT TGT AGG AGA AAT GAT ACT GAC AAT GAT GTC ACA CGA GGA GGG AAG     52666  Leu Cys Arg Arg Asn Asp Thr Asp Asn Asp Val Thr Arg Gly Gly Lys      81527  CCA GGC ACG AAT CTG GTG GAG GTG CGG TCA GTT GTG ACC AGC TTT GCA     57482  Pro Gly Thr Asn Leu Val Glu Val Arg Ser Val Val Thr Ser Phe Ala      97575  AAG GGA GCG GTG GGC GAG GCT GTG GTC TCT CCC AGG TGA CCT CCA TCG     62298  Lys Gly Ala Val Gly Glu Ala Val Val Ser Pro Arg ***                 110623  CCA TGC AGA GCT GCT CTC ACT TCT CCT CGG GAA AGG CCA GCG TCA GGT     670671  ATT CCT AGG AGG AAG CCC AGG TGT GTC CAG AGA ACA GTA GTC TTG TTA     718719  GAA CTG GAA AAA TGT CTT ATG GCC AGG TGG CCC CTG GTC TGA AGG AAA     766767  AAT AGG AGC TGA GTG TGA ACT TTT ATC ACT CAG AAG ATA TAA TCC ACC     814815  TCT CCC CTC CTG CCC TTC GCT CCT GGG TTG GTT GTG AGG ACA GTG CTT     862863  TGT GAC AGC AGT GGA GCC CTG TCT GTC CTT CCG GGC TAG ATT TCT TCT     910911  TTC TCT TAT TCC TCC TGT TTC GTT GTA TCC ACG ATT TGT CGA GTT GCA     958959  GGG CTC ACC CTT TCC TGA AGA AAC CAT CTC TTT TCC CAG CTC CGC ACC    10061007  TTT GTC CGA GAT GGA GGC GTG TCC TCC CGC CCA TCC CCA GTG GGG GGT    10541055  GTT CTG CCC ATT CTC CAG AGC CCA GCA CTG CTC CCA TCT CTT TTC CTC    11021103  CCT CTC CTT CCC CTT GCT GTT ACC TGC TGC CTT CTT GTG CTC CCA CTG    11501151  CCC  TTG  GCC  ATC  CCT  CTG  TGT  CAT  TGT  GCG  CTG  TGG  TGC  ACC  TGT  CTT        11981199  CTC  TAC  TAC  ACC  TTA  AGA  GCA  GGA  CTC  TGC  CTC  CTT  CCT  ACC  AGC  ACC        12461247  TCA  TGC  AGC  AAG  TGC  TGC  CAA  TAG  CAG  GCA  CCC  AGC  AGA  TAG  CGA  ATG        12941295  CAC  GAC  TCC  AAA  ACC  CAG  CTT  TGC  CTC  CTG  GCT  GTA  GTT  CAG  ACT  AGC        13421343  TGT  GTG  ACA  CTG  ACC  AAG  ACA  CTT  GAC  CTC  TCl  CAG  ACT  CAG  CTT  CCT        13901391  CCT  TGA  AGA  CTG  GGA  TGC  TAT  GTA  GCT  CAG  AGG  AAA  CAT  ACA  CCT  GAA        14381439  GGT  GCT  GCC  CCG  GGG  GGT  GCA  ATG  ACC  TGT  TAC  TGA  GGC  TGG  ATG  GAG        14861487  GAT  GGC  ATC  CAT  CAT  CAG  CTA  CAG  GTG  CCT  CCT  CTA  TCT  ACA  GGT  TCC        15341535  TGC  TCC  ATC  TAT  ACT  AGC  CAC  CTC  CTG  GAC  AAG  GGC  TCC  AGT  GTC  CTC        15821583  CAT  GAC  ACC  AGC  TTT  CTC  CAG  AGC  CTG  TGC  AGG  ATT  TCC  TTC  CTC  TAC        16301631  CCT  GAA  TCA  GGG  TGA  TTC  TTA  AAG  GAC  AGT  TTC  AGG  AAC  ATA  TAG  GGG        16781679  CAC  TTG  GGT  AAT  CTT  GGT  CAG  TAA  CTG  ACC  TTT  AAC  TAT  CAT  CCA  TGT        17261727  GAA  CAT  CTA  CAG  TTA  GGG  ATT  TTC  TTG  GTG  ATG  TTT  GGC  AAA  AAG  TAA        17741775  AGA  ATT  CCC  CAA  GTG  TGA  AGC  CTC  ATT  CAT  TCA  CTT  ATT  CAA  CAA  ATA        18221823  GTT  ATT  GAG  CAC  CTA  CTA  TGT  GTT  AGG  CCC  TGG  GCC  AGG  TGC  TGG  GAA        18701871  TAC  AGC  AGA  GAC  AGA  CCT  GGC  TCC  TGC  CCT  CAT  GGA  GTT  TGC  AGT  CAT        19181919  TCA  TTC  ACT  CAC  TCG  GTG  ACT  TTG  GAC  ACC  TCC  CCC  TCC  TCT  CTC  CAG        19661967  GCT  TTA  GAT  CTC  TGA  GAT  TCT  CTC  TGA  GTC  TGG  GAT  GTA  AAG  ACA  AAG        20142015  TAA  AAC  CTG  AAA  TCT  GGA  AAG  CAA  AAA  AAA  AAA  AAA  AAA  AAA  A               205713. FP757A:核苷酸序列(SEQ ID NO:37)长度:1932个碱基1  GGAATCATTT  TTTGAGGAGC  GGGGGTACAG  TTTAGTTTTG  TTTCTACTTT  TACCTTTTTT61  TTAAAATTAT  TTAACTCTTT  ATAACATGAT  TTTTAAATGT  ACACAAAGAT  AAAAGGAAAA121  TTACAATGAA  CACCTGTGTT  CTAGTCATTT  GGCTTCAACA  GCTGTTATTT  TCCTTTAATA181  GATAAGTATG  GAAGAGTGGA  AGCTTGCTTT  CATCTTACTC  CTCTGCCTTT  CTCCCTAAAA241  CTCTCTCTTC  CCACCCTATT  ACTCAGAAAT  CTTTTCCTCA  TTCTTTATGT  GTACTGTAAT301  ATATTTCATG  AATCTCATGT  GAAATTTTCT  CTGTAATACA  TATAGTATTC  AATCTGTAAC361  CACTAAGAGC  ACTTTGCAGA  GTTAAAAATC  TGGGATTTAT  AGCAGTATTA  ATTTTATTTA421  ATAAACTATG  AAGTTAAATA  TAAATATCAT  CTGGGGTTTA  TAGCAGTATT  AATTTTAACA481  AGTAAGCTTA  ATGTCATTGT  CTTTTAGCAA  ACTGAAACCG  TGTCAGTTCA  GTCTTCGGTA541  TTGGGGAAGG  GTGTAAAACA  TCGACCCCCA  CCAATCAAAC  TTCCCTCAAG  CTCAGGAAAT601  AGTTCCTCAG  GTAACTATTT  TACACCACAA  CAGACAAGCA  GCTTTCTCAA  ATCTCCAACT661  CCTCCTCCTT  CTTCTAAGCC  ATCAAGTATT  CCTCGGAAAT  CATCTGTGGA  TCTCAATCAA721  GTTAGCATGC  TTTCTCCAGC  TGCCCTATCA  CCTGCCAGCT  CATCACAAAG  AACCACGGCC781  ACCCAGGTCA  TGGCAAACTC  TGCTGGACTT  AACTTCATCA  ATGTAGTGGG  CTCTGTTTGT841  GGGGCCCAGG  CTTTGATGAG  TGGTCAAACC  CCATGCTGGG  CTGTAACACT  GGTGCCATAA901  CTCCTGCAGG  AATAAACCTG  AGCGGCCTTC  TACCCTCAGG  AGGTCTGCTA  CCAAATGCAC961  TGCCCAGTGC  AATGCAGGCA  GCTTCTCAAG  CAGGTGTTCC  ATTTGGTTTA  AAAAATACTT1021  CAAGTCTCAG  GCCCTTAAAT  CTACTCCAGC  TTCCAGGTGG  TTCACTTATT  TTTAACACTC1081  TGCAGCAGCA  GCAACAGCAG  CTCTCCCAGT  TTACACCACA  ACAACCTCAG  CAGCCCACAA1141  CTTGTAGTCC  TCAACAGCCA  GGGGAGCAGG  GTTCTGAGCA  AGGTTCAACC  AGTCAAGAAC1201  AGGCCTTATC  TGCTCAGCAA  GCTGCTGTTA  TTAACCTTAC  TGGAGTAGGA  AGTTTTATGC1261  AGTCACAGGC  AGCTGTGTTG  TCTCAGCTTG  GCTCTGCCGA  GAACAGACCT  GAGCAAAGCC1321  TTCCTCAGCA  GAGATTCCAG  CTCTCCTCTG  CCTTTCAACA  GCAGCAGCAA  CAGATACAAC1381  AGTTGCGATT  CTTGCAGCAT  CAAATGGCTA  TGGCAGCAGC  AGCAGCACAA  ACAGCTCAGC1441  TACATCATCA  TCGGCATACA  GGCAGCCAGT  CAAAAAGTAA  AATGAAGAGA  GGCATGCCAA1501  CCACTCCAAA  ATTTTGAGTC  TTGCATTACT  TTTTGTTCCT  TTTTTAAAAA  CACAAGAGCA1561  CTGAATCAAA  AGAATTGAGT  TTCTACTTTT  TGTTTTTTTT  AATGTGTCAG  TATTTTACAT1621  TGCTAGATGT  ACAAACTTTA  TACAGAAGCA  CAACCTTATC  ATTTTTAAAT  AAAAACAGGG1681  AAATGGTTTA  ACAAACTAGG  GTTGGTTTGC  CTAAGTCATT  GCTTTTTAAA  AATGGTTTCA  1741 CTATACATAA TATATATGGA AGTGACCTAA GAAATAATAG AAACATCTTT CAGAAGAATG1801 TAGTTTGATA TTTATTTAGT ATAAAACGTT TGTGCACAGT GTTAACAAAT ACAATTTTTA1861 CAAATCTGTT TTGAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA1921 AAAAAAAAAA AAB:核苷酸序列(SEQ ID NO:38)长度:214个氨基酸
  1 MLGCNTGAIT PAGINLSGLL PSGGLLPNAL PSAMQAASQA GVPFGLKNTS SLRPLNLLQL
 61 PGGSLIFNTL QQQQQQLSQF TPQQPQQPTT CSPQQPGEQG SEQGSTSQEQ ALSAQQAAVI
121 NLTGVGSFMQ SQAAVLSQLG SAENRPEQSL PQQRFQLSSA FQQQQQQIQQ LRFLQHQMAM
181 AAAAAQTAQL HHHRHTGSQS KSKMKRGMPT TPKFC.核苷酸及氨基酸组合序列(SEQ ID NO:39) 克隆号和蛋白名称:FP757起始编码子:873 ATG  终止编码子:1519 TGA  蛋白质分子量:22775.561   GG AAT CAT TTT TTG AGG AGC GGG GGT ACA GTT TAG TTT TGT TTC TAC       4748  TTT TAC CTT TTT TTT AAA ATT ATT TAA CTC TTT ATA ACA TGA TTT TTA       9596  AAT GTA CAC AAA GAT AAA AGG AAA ATT ACA ATG AAC ACC TGT GTT CTA      143144  GTC ATT TGG CTT CAA CAG CTG TTA TTT TCC TTT AAT AGA TAA GTA TGG      191192  AAG AGT GGA AGC TTG CTT TCA TCT TAC TCC TCT GCC TTT CTC CCT AAA      239240  ACT CTC TCT TCC CAC CCT ATT ACT CAG AAA TCT TTT CCT CAT TCT TTA      287288  TGT GTA CTG TAA TAT ATT TCA TGA ATC TCA TGT GAA ATT TTC TCT GTA      335336  ATA CAT ATA GTA TTC AAT CTG TAA CCA CTA AGA GCA CTT TGC AGA GTT      383384  AAA AAT CTG GGA TTT ATA GCA GTA TTA ATT TTA TTT AAT AAA CTA TGA      431432  AGT TAA ATA TAA ATA TCA TCT GGG GTT TAT AGC AGT ATT AAT TTT AAC      479480  AAG TAA GCT TAA TGT CAT TGT CTT TTA GCA AAC TGA AAC CGT GTC AGT      527528  TCA GTC TTC GGT ATT GGG GAA GGG TGT AAA ACA TCG ACC CCC ACC AAT      575576  CAA ACT TCC CTC AAG CTC AGG AAA TAG TTC CTC AGG TAA CTA TTT TAC      623624  ACC ACA ACA GAC AAG CAG CTT TCT CAA ATC TCC AAC TCC TCC TCC TTC      671672  TTC TAA GCC ATC AAG TAT TCC TCG GAA ATC ATC TGT GGA TCT CAA TCA      719720  AGT TAG CAT GCT TTC TCC AGC TGC CCT ATC ACC TGC CAG CTC ATC ACA      767768  AAG AAC CAC GGC CAC CCA GGT CAT GGC AAA CTC TGC TGG ACT TAA CTT      815816  CAT CAA TGT AGT GGG CTC TGT TTG TGG GGC CCA GGC TTT GAT GAG TGG      863864  TCA AAC CCC ATG CTG GGC TGT AAC ACT GGT GCC ATA ACT CCT GCA GGA      9111              Met Leu Gly Cys Asn Thr Gly Ala Ile Thr Pro Ala Gly       13912  ATA AAC CTG AGC GGC CTT CTA CCC TCA GGA GGT CTG CTA CCA AAT GCA      95914  Ile Asn Leu Ser Gly Leu Leu Pro Ser Gly Gly Leu Leu Pro Asn Ala       29960  CTG CCC AGT GCA ATG CAG GCA GCT TCT CAA GCA GGT GTT CCA TTT GGT     100730  Leu Pro Ser Ala Met Gln Ala Ala Ser Gln Ala Gly Val Pro Phe Gly       451008  TTA AAA AAT ACT TCA AGT CTC AGG CCC TTA AAT CTA CTC CAG CTT CCA     105546  Leu Lys Asn Thr Ser Ser Leu Arg Pro Leu Asn Leu Leu Gln Leu Pro       611056  GGT GGT TCA CTT ATT TTT AAC ACT CTG CAG CAG CAG CAA CAG CAG CTC     110362  Gly Gly Ser Leu Ile Phe Asn Thr Leu Gln Gln Gln Gln Gln Gln Leu       771104  TCC CAG TTT ACA CCA CAA CAA CCT CAG CAG CCC ACA ACT TGT AGT CCT     115178  Ser Gln Phe Thr Pro Gln Gln Pro Gln Gln Pro Thr Thr Cys Ser Pro       931152  CAA CAG CCA GGG GAG CAG GGT TCT GAG CAA GGT TCA ACC AGT CAA GAA     119994  Gln Gln Pro Gly Glu Gln Gly Ser Glu Gln Gly Ser Thr Ser Gln Glu      1091200  CAG GCC TTA TCT GCT CAG CAA GCT GCT GTT ATT AAC CTT ACT GGA GTA     1247110  Gln Ala Leu Ser Ala Gln Gln Ala Ala Val Ile Asn Leu Thr Gly Val      1251248  GGA AGT TTT ATG CAG TCA CAG GCA GCT GTG TTG TCT CAG CTT GGC TCT     1295126  Gly Ser Phe Met Gln Ser Gln Ala Ala Val Leu Ser Gln Leu Gly Ser      1411296  GCC GAG AAC AGA CCT GAG CAA AGC CTT CCT CAG CAG AGA TTC CAG CTC    1343142  Ala Glu Asn Arg Pro Glu Gln Ser Leu Pro Gln Gln Arg Phe Gln Leu     1571344  TCC TCT GCC TTT CAA CAG CAG CAG CAA CAG ATA CAA CAG TTG CGA TTC    1391158  Ser Ser Ala Phe Gln Gln Gln Gln Gln Gln Ile Gln Gln Leu Arg Phe     1731392  TTG CAG CAT CAA ATG GCT ATG GCA GCA GCA GCA GCA CAA ACA GCT CAG    1439174  Leu Gln His Gln Met Ala Met Ala Ala Ala Ala Ala Gln Thr Ala Gln     1891440  CTA CAT CAT CAT CGG CAT ACA GGC AGC CAG TCA AAA AGT AAA ATG AAG    1487190  Leu His His His Arg His Thr Gly Ser Gln Ser Lys Ser Lys Met Lys     2051488  AGA GGC ATG CCA ACC ACT CCA AAA TTT TGA GTC TTG CAT TAC TTT TTG    1535206  Arg Gly Met Pro Thr Thr Pro Lys Phe ***                             2151536  TTC CTT TTT TAA AAA CAC AAG AGC ACT GAA TCA AAA GAA TTG AGT TTC    15831584  TAC TTT TTG TTT TTT TTA ATG TGT CAG TAT TTT ACA TTG CTA GAT GTA    16311632  CAA ACT TTA TAC AGA AGC ACA ACC TTA TCA TTT TTA AAT AAA AAC AGG    16791680  GAA ATG GTT TAA CAA ACT AGG GTT GGT TTG CCT AAG TCA TTG CTT TTT    17271728  AAA AAT GGT TTC ACT ATA CAT AAT ATA TAT GGA AGT GAC CTA AGA AAT    17751776  AAT AGA AAC ATC TTT CAG AAG AAT GTA GTT TGA TAT TTA TTT AGT ATA    18231824  AAA CGT TTG TGC ACA GTG TTA ACA AAT ACA ATT TTT ACA AAT CTG TTT    18711872  TGA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    19191920  AAA AAA AAA AAA A                                                  1932

Claims (10)

1.一种分离的具有抑癌功能的人蛋白,其特征在于,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38;
或其保守性变异多肽、或其活性片段、或其活性衍生物。
2.如权利要求1所述的多肽,其特征在于,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38。
3.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性;
(a)编码如权利要求1和2所述多肽的多核苷酸;
(b)与多核苷酸(a)互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35、38。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36、39的编码区序列或全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
  (a)用权利要求6所述的载体转化或转导的宿主细胞;
  (b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有抑癌功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含:
(a)在适合表达具有抑癌功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;
(b)从培养物中分离出具有抑癌功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有抑癌功能的人蛋白特异性结合的抗体。
10.一种药物组合物,其特征在于,它含有安全有效量的权利要求1所述的多肽以及药学上可接受的载体。
CNB011267232A 2001-09-12 2001-09-12 编码具有抑癌功能的人蛋白的多核苷酸 Expired - Fee Related CN1177047C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB011267232A CN1177047C (zh) 2001-09-12 2001-09-12 编码具有抑癌功能的人蛋白的多核苷酸

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB011267232A CN1177047C (zh) 2001-09-12 2001-09-12 编码具有抑癌功能的人蛋白的多核苷酸

Publications (2)

Publication Number Publication Date
CN1403475A true CN1403475A (zh) 2003-03-19
CN1177047C CN1177047C (zh) 2004-11-24

Family

ID=4666730

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB011267232A Expired - Fee Related CN1177047C (zh) 2001-09-12 2001-09-12 编码具有抑癌功能的人蛋白的多核苷酸

Country Status (1)

Country Link
CN (1) CN1177047C (zh)

Also Published As

Publication number Publication date
CN1177047C (zh) 2004-11-24

Similar Documents

Publication Publication Date Title
US6524799B1 (en) DNA encoding sparc-related proteins
DE69836131T3 (de) Neue menschliche delta3-zusammensetzung und deren therapeutische und diagnostische verwendungen
WO1998022504A1 (fr) Nouveaux genes de semaphorine (i)
CN1403475A (zh) 具有抑癌功能的新的人蛋白及其编码序列
US20030054446A1 (en) Novel retina-specific human proteins C7orf9, C12orf7, MPP4 and F379
CN100478355C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1403478A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1351081A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN100478354C (zh) 具有抑癌功能的新的人蛋白及其编码序列
DE60125569T2 (de) 13245, eine neue, humane protein kinase vom typ myotonische dystrophie protein kinase und anwendungen davon
CN1313297A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1368509A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1368510A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
DE60024862T2 (de) "insulinabhängiges sequenz dna bindendes protein-1" (irsdbp-1), dafür kodierendes gen und ihre verwendungen
US20020064855A1 (en) Genes that regulate hematopoietic blood forming stem cells and uses thereof
CN1323803A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1429841A (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1309135A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1313317A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1369506A (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1351082A (zh) 具有促进癌细胞生长功能的新的人蛋白及其编码序列
CN1351080A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1313298A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1403477A (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1458170A (zh) 具有抑癌功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee