CN1403476A - 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 - Google Patents

具有促进3t3细胞转化功能的新的人蛋白及其编码序列 Download PDF

Info

Publication number
CN1403476A
CN1403476A CN01126724A CN01126724A CN1403476A CN 1403476 A CN1403476 A CN 1403476A CN 01126724 A CN01126724 A CN 01126724A CN 01126724 A CN01126724 A CN 01126724A CN 1403476 A CN1403476 A CN 1403476A
Authority
CN
China
Prior art keywords
ctg
pro
ccc
cct
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN01126724A
Other languages
English (en)
Inventor
顾健人
杨胜利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd
Original Assignee
SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd filed Critical SHANGHAI XINSHIJIE GENE TECHN DEVELOPMENT Co Ltd
Priority to CN01126724A priority Critical patent/CN1403476A/zh
Publication of CN1403476A publication Critical patent/CN1403476A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一类新的具有促进3T3细胞转化功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有促进3T3细胞转化功能的人蛋白的多核苷酸的用途。

Description

具有促进3T3细胞转化功能的新的人蛋白及其编码序列
技术领域
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有促进3T3细胞转化功能的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
背景技术
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究与癌细胞生长相关的人蛋白及其激动剂/抑制剂。
发明内容
本发明的目的是提供一类新的具有促进3T3细胞转化功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有促进3T3细胞转化功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有促进3T3细胞转化功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有促进3T3细胞转化功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有促进3T3细胞转化功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有促进3T3细胞转化功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有促进3T3细胞转化功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有促进3T3细胞转化功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可用于促进细胞的生长。本发明还提供了一种药物组合物,它含有安全有效量的针对本发明的具有促进3T3细胞转化功能的蛋白多肽的拮抗剂(如抗体)以及药学上可接受的载体。该药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
具体实施方式
3T3细胞是一种小鼠成纤维细胞(J.Cell.Biol.,17:299,1963)(也称为NIH/3T3细胞)。在癌症研究领域中,常将外源基因(尤其是人基因)引入3T3细胞,观察其对3T3细胞生长的影响情况。通常认为,对3T3细胞生长(或恶性转化)有影响的基因是癌症相关基因,其中对3T3细胞生长或转化有抑制作用的基因大多是抑癌基因,而对3T3细胞生长或转化有促进作用的基因大多是(原)癌基因。
本发明采用大规模cDNA克隆转染小鼠胚胎成纤维细胞3T3,在获得具有促进生长作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有促进3T3细胞转化功能的蛋白对3T3细胞具有促进克隆形成的作用,其促进率≥50%。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有促进3T3细胞转化功能的蛋白或多肽”是指具有促进3T3细胞转化功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有促进3T3细胞转化功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有促进3T3细胞转化功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有促进3T3细胞转化功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP2121蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”对于PP2121而言是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。再以PP7706蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”对于PP7706而言是指编码具有SEQ ID NO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对于本发明其他具有促进3T3细胞转化功能的蛋白,依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽(以PP2121蛋白为例)有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有促进3T3细胞转化功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有促进3T3细胞转化功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring HarborLaboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有促进3T3细胞转化功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有促进3T3细胞转化功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al. Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明多核苷酸的载体,以及用本发明的载体或具有促进3T3细胞转化功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有促进3T3细胞转化功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有促进3T3细胞转化功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有促进3T3细胞转化功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有促进3T3细胞转化功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的1ac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、早期和晚期SV40启动子和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有促进3T3细胞转化功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有促进3T3细胞转化功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有促进3T3细胞转化功能的蛋白功能的抗体、多肽或其它配体。例如,该抗体可用于治疗癌症或细胞异常增殖。用重组表达的本发明蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有促进3T3细胞转化功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有促进3T3细胞转化功能的人蛋白的药剂的方法。激动剂提高具有促进3T3细胞转化功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。
具有促进3T3细胞转化功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有促进3T3细胞转化功能的人蛋白的拮抗剂可以与具有促进3T3细胞转化功能的人蛋白结合并消除其功能,或是抑制具有促进3T3细胞转化功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有促进3T3细胞转化功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有促进3T3细胞转化功能的蛋白加入生物分析测定中,通过测定化合物影响具有促进3T3细胞转化功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明蛋白的拮抗剂可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有促进3T3细胞转化功能的蛋白或其特异性抗体,可按有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有促进3T3细胞转化功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有促进3T3细胞转化功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有促进3T3细胞转化功能的蛋白的无表达或异常/无活性的具有促进3T3细胞转化功能的蛋白的表达所致的细胞发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有促进3T3细胞转化功能的蛋白,以抑制内源性的具有促进3T3细胞转化功能的蛋白活性。例如,一种变异的具有促进3T3细胞转化功能的蛋白可以是缩短的、缺失了信号传导功能域的具有促进3T3细胞转化功能的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有促进3T3细胞转化功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有促进3T3细胞转化功能的蛋白基因转移至细胞内。构建携带具有促进3T3细胞转化功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有促进3T3细胞转化功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有促进3T3细胞转化功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。由于本发明蛋白具有促进3T3细胞转化的功能,因此本发明蛋白编码序列的反义序列,可被引入细胞以抑制细胞的异常增殖(如癌变)。
本发明还提供了针对具有促进3T3细胞转化功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗具有促进3T3细胞转化功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有促进3T3细胞转化功能的人蛋白。
与具有促进3T3细胞转化功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有促进3T3细胞转化功能的人蛋白相关的疾病。给予适当剂量的抗体可以阻断具有促进3T3细胞转化功能的人蛋白的产生或活性,从而抑制癌细胞的生长和/或细胞的异常增殖。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有促进3T3细胞转化功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭有关的阳性细胞(如癌细胞)。
多克隆抗体的生产可用具有促进3T3细胞转化功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有促进3T3细胞转化功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler andMilstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.Pat No.4946778)也可用于生产抗具有促进3T3细胞转化功能的人蛋白的单链抗体。
能与具有促进3T3细胞转化功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有促进3T3细胞转化功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有促进3T3细胞转化功能的人蛋白水平的诊断试验方法。这些试验为本领域所熟知,且包括FISH测定和放射免疫测定。试验中所检测的具有促进3T3细胞转化功能的蛋白水平,可以用作解释具有促进3T3细胞转化功能的蛋白在各种疾病中的重要性和用于诊断具有促进3T3细胞转化功能的蛋白起作用的疾病。
具有促进3T3细胞转化功能的蛋白的多聚核苷酸可用于具有促进3T3细胞转化功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有促进3T3细胞转化功能的蛋白的多聚核苷酸可用于检测具有促进3T3细胞转化功能的蛋白的表达与否或在疾病状态下具有促进3T3细胞转化功能的蛋白的异常表达。如具有促进3T3细胞转化功能的蛋白DNA序列可用于对活检标本的杂交以判断具有促进3T3细胞转化功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(即基因芯片)上,用于分析组织中基因的差异表达分析和基因诊断。用具有促进3T3细胞转化功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有促进3T3细胞转化功能的蛋白的转录产物。
检测具有促进3T3细胞转化功能的蛋白基因的突变也可用于诊断具有促进3T3细胞转化功能的蛋白相关的疾病。具有促进3T3细胞转化功能的蛋白突变的形式包括与正常野生型具有促进3T3细胞转化功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而现在只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。
本发明的具有促进3T3细胞转化功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有促进3T3细胞转化功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。注意,在核苷酸和氨基酸组合序列中,(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿。
实施例1:cDNA基因的获得及对小鼠NIH/3T3细胞克隆形成的促进作用
PP2121、PP7706、PP10484、PP10566、PP10631、PP10752、PP10881、PP10897、PP10933、PP11246、PP11347和PP11517是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、9月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-scriptTMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染小鼠NIH/3T3细胞。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的小鼠NIH/3T3细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克隆形成,计数。发现上述克隆有促进细胞克隆形成作用,结果如下表所示。
              cDNA克隆转染细胞(3T3)克隆形成情况
  cDNA克隆名称   cDNA克隆数(三个重复)   空载体克隆数(三个重复)
    PP2121     70     76     69     13     12     15
    PP7706     28     25     20     13     12     15
    PP10484     17     31     34     13     12     15
    PP10566     29     32     27     13     12     15
    PP10631     27     29     22     13     12     15
    PP10752     27     24     21     13     12     15
    PP10881     30     25     20     13     12     15
    PP10897     43     42     45     13     12     15
    PP10933     37     35     30     13     12     15
    PP11246     38     40     38     13     12     15
    PP11347     47     48     46     13     12     15
    PP11517     35     39     38     13     12     15
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28、31、34)。
实施例2:从胎盘cDNA中PCR获得全长基因和重组蛋白表达
取3、6、9月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的特异引物(如下表所示),按97℃3’1个循环。94℃30″60℃30″72℃1’35个循环,72℃10’1个循环进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,获得重组蛋白(SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35)。
                            基因特异引物
克隆名称 特异引物1(5’→3’)  特异引物2(5’→3’)
PP2121 (193)CAAGGTGGGCAAGTTCGT  TGGGAGGTGGAGAAGATTTGG(2181)
PP7706 (67)AATGGATGACCCTCCAATAT  GTGTCCTTCGACGGAACA(2744)
PP10484 (478)ATTTGGTTGGACCTTGCG  TCCCTTGACTTCTGAGTTCC(1501)
PP10566 (40)AGCTACCACTCAGCACCATG  TCTCCTAGACCTGACCGACC(2418)
PP10631 (15)GGACGAAGCCGGAGTGTA  AAGACGGAAGGAGAACCC(1783)
PP10752 (148)TGACCCAGTTGTGGTTGATG  TGCAGGAGGTGGCCTTTC(1179)
PP10881 (765)ATTCTTTGAAATTAGGGTGC  GTGTCGCTCTGAGGGAGA(2077)
PP10897 (308)TAGTGGCCTAGCTGGGTA  CCTCTTAGCGAACTTGGG(2261)
PP10933 (371)GTAGTCTGGGTTGGAGGAGG  CCGATGCGTACAGGAGCT(1470)
PP11246 (109)GGGGACATGGGCATTTGG  CTAGCACGGTGACATGAGGT(2011)
PP11347 (733)GGGTGAGGTAAGCAACGC  ATGACCGATGAACCCTCCG(2310)
PP11517 (240)CAACCAACTGGACCGCATCA  AACTAACGAGGGAGGAGCC(2011)
实施例3:cDNA克隆序列分析1.PP2121A:核苷酸序列(SEQ ID NO:1)长度:2244个碱基
  1  CTTGGGGACC  CAGGGCCGGC  TGAGCCGCAC  GCTGCCAGCC  AGCGCGGAGG  AGCGCGATCG
 61  GCTGCTGCGC  CGCATGGAGA  GCATGCGCAA  GGAGAAGCGC  GTGTACAGCC  GCTTCGAGGT
121  CTTCTGCAAG  AAAGAGGAGG  CCAGCAGCCC  TGGGGCAGGG  GAAGGCCCCG  CGGAGGAGGG
181  CACCAGGGAC  AGCAAGGTGG  GCAAGTTCGT  GCCCAAGATC  CTGGGCACGT  TCAAAAGCAA
241  GAAGTGAGTC  TTCTGGCCTG  GCAACCCAGG  CCAGGGTGCC  CGCATCGCTG  CCCCGGTCAT
301  CCAGAAGCCC  CGCGGAACAG  AGAGCCCTGC  TCATGTGCTT  GAGCAGCGGC  TGTCAGGCCA
361  CGGCCGCTTG  GGGCTTGGCT  GAGTGCGCCA  GACCTCGGCT  CCACTGGAGG  CTCACCTGGC
421  AGCTGCCGTC  TCTGCCCCCT  GGCCTCCCCA  ACGCTGGGGC  TGCACCCCTC  GCCACCAGTG
481  CCTTTCTCCC  CTCAGCACCT  TCATCTCTGC  ACCGTCAGCC  TTGCGTGGCG  CAGCGTCTGG
541  CTCCGCCATC  TCTTTGTGCC  TCAGTCCCCC  CGGCCCCCTT  TATTTTTTTG  AGACCTAGGG
601  CTGGAGTGCA  GTTGAGCGGT  CTGGGCTCAC  TGCAACCTCT  GCCTCCCGGG  TTCCAGCGAT
661  TCTCCTGCCT  CAGCCTCCTG  AGTAGCTGGG  ATTACAGATG  TATGCTACCA  CGCCCAGGTA
721  GTTTTTGTAT  TTTTAGTAGA  GACAGGGTTT  CACTATGTTG  GCCAGGCTGG  TCTCCAACTC
781  CTGGCCTCAA  ATGATCAGCC  CGCTTCAGCC  TCCCAAAGTG  GGGGGATTAC  AGGCGTGAGC 841  CTTGCACCCC  GCTAAGTCCC  CTATCCTCTT  GCAAGGGTCT  CGCCTCTGTG  CCTCAATTCC901  TCATTCTCTG  GGCCCTTCTC  CTCCTCAGGG  CCTCCTGTTC  TCAGGGCCTC  CCCCCTCCCC961  GCTCCCTCCC  TCTCTCAAGG  TCTCCTCCTT  CCCTCCCCCC  CCCGTCTCCC  CCCTCCCCCG1021  CCTGGGCTTC  ACTTCCTTTC  CTACTTGGAT  TCTCCTGCTC  GCTGCCTCCC  AGCATCTTTT1081  TTGGAGGCCC  GTCTCTTGCT  GTGGGGAAGA  CTGGGCTGGC  TGCGGGCAGT  TTGCAAGGGG1141  TGGGTGGGGC  GGGGGGGGGA  GCTGGACCAG  AAGATGCCCC  TTGGAGTGGC  AAGGAAGCTG1201  GACAGGGCAG  GCCTCTGGGG  ACGGGACACA  GGGAAGCCCG  AAGGGGCGCC  TTGGCCAGGT1261  CTGCCATCTC  CTCCAGCGAG  GCTCTGGCCA  GCACTGGGTG  AGAGTGGGGA  GGGGGCACTG1321  GCCTTTGCAG  CACAGTAAAA  CATGGTCCAG  ACAACCTGTG  GCCCCGGCCT  CATGAGCACC1381  CCCTGCACAG  GCCCGGCCCA  AGCCAGGCGC  TAGAAGGGCT  GGTTGTGGAG  TGCTTATCCT1441  TGACAGGTAT  GGGGCCAGGT  GAGGGCAGGG  GACAAGGTGC  AGCTGAGGCC  GAGCCCAACT1501  AGGTCCTGGG  CACCCCTGCA  GGTGGGAGTG  GTCCTTGTCC  TCCTGGTATC  CAGCAGACAC1561  CCCCCTCTCC  CCACCAGCCC  CATTCTCAGG  TCCTTTCCTC  TTTGTCACCA  ACACCAAGAA1621  TCTGTCCAGG  GTTCTTGGCT  TATCTTTTAT  CTCTTTTCAC  TCCTAGAGAG  GAATTGCAAT1681  TGACTCAGAA  TGACACATTT  TTGGCACCAC  GTGTGTAGAA  AGCCCCCACT  GTTAGATGAT1741  AGCCTCGTGA  AATTCATGTT  TCTGTATTCT  CCTATTTCTT  TTCAAAAACT  AATTTTTTTT1801  TTAGTGTAAT  AAATCCTAAG  AGGGAACTGA  TTTAAGAAAC  AAGGCCGCCA  AACAAAGGCA1861  GCAGTTCCGA  CTCCAGCAGC  TGGGAAAGGA  AGGAAAGTGA  CCCCACTTTC  ACTCCTGCAC1921  AGCCCACTGG  TTACCAAAAC  CACCGTGCAA  GTCGGGATGA  CAGCAGGGAC  TTCTGGCCAG1981  GTGGGAAAAG  GTGCCTGGAA  GCGGGATGCG  CCTGTGCGTC  TCTTGGCCAT  GATGTTCTTG2041  TGGGCATGTT  ATTCTTGGTG  CTGCCTGGGG  TGTTGCTGAG  CGGACAGGCT  CTCCAGCTGG2101  AGTCCATGGA  GAGGCCAGAG  GCTGGCGGCC  CTGCCTGGGC  CTTCGGAGCC  TCCTGCCTGC2161  ACCCTCCACC  TCTTCTAAAC  CATGATGTGG  CACATTTTGG  TGTTAATAAA  ACACAACACA2221  CAAAGTAAAA  AAAAAAAAAA  AAAAB:核苷酸序列(SEQ ID NO:2)长度:153个氨基酸
  1  MCLSSGCQAT  AAWGLAECAR  PRLHWRLTWQ  LPSLPPGLPN  AGAAPLATSA  FLPSAPSSLH
 61  RQPCVAQRLA  PPSLCASVPP  APFIFLRPRA  GVQLSGLGSL  QPLPPGFQRF  SCLSLLSSWD
121  YRCMLPRPGS  FCIFSRDRVS  LCWPGWSPTP  GLKC.核苷酸及氨基酸组合序列(SEQ ID NO:3)克隆号:PP2121起始编码子:333 ATG  终止编码子:792 TGA  蛋白质分子量:16448.31(注:(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿)1    CT TGG GGA CCC AGG GCC GGC TGA GCC GCA CGC TGC CAG CCA GCG CGG     4748   AGG AGC GCG ATC GGC TGC TGC GCC GCA TGG AGA GCA TGC GCA AGG AGA     9596   AGC GCG TGT ACA GCC GCT TCG AGG TCT TCT GCA AGA AAG AGG AGG CCA    143144   GCA GCC CTG GGG CAG GGG AAG GCC CCG CGG AGG AGG GCA CCA GGG ACA    191192   GCA AGG TGG GCA AGT TCG TGC CCA AGA TCC TGG GCA CGT TCA AAA GCA    239240   AGA AGT GAG TCT TCT GGC CTG GCA ACC CAG GCC AGG GTG CCC GCA TCG    287288   CTG CCC CGG TCA TCC AGA AGC CCC GCG GAA CAG AGA GCC CTG CTC ATG    3351                                                               Met      1336   TGC TTG AGC AGC GGC TGT CAG GCC ACG GCC GCT TGG GGC TTG GCT GAG    3832   Cys Leu Ser Ser Gly Cys Gln Ala Thr Ala Ala Trp Gly Leu Ala Glu     17384   TGC GCC AGA CCT CGG CTC CAC TGG AGG CTC ACC TGG CAG CTG CCG TCT    43118   Cys Ala Arg Pro Arg Leu His Trp Arg Leu Thr Trp Gln Leu Pro Ser     33432   CTG CCC CCT GGC CTC CCC AAC GCT GGG GCT GCA CCC CTC GCC ACC AGT    47934   Leu Pro Pro Gly Leu Pro Asn Ala Gly Ala Ala Pro Leu Ala Thr Ser     49480   GCC TTT CTC CCC TCA GCA CCT TCA TCT CTG CAC CGT CAG CCT TGC GTG    52750   Ala Phe Leu Pro Ser Ala Pro Ser Ser Leu His Arg Gln Pro Cys Val     65 528  GCG CAG CGT CTG GCT CCG CCA TCT CTT TGT GCC TCA GTC CCC CCG GCC     57566  Ala Gln Arg Leu Ala Pro Pro Ser Leu Cys Ala Ser Val Pro Pro Ala      81576  CCC TTT ATT TTT TTG AGA CCT AGG GCT GGA GTG CAG TTG AGC GGT CTG     62382  Pro Phe Ile Phe Leu Arg Pro Arg Ala Gly Val Gln Leu Ser Gly Leu      97624  GGC TCA CTG CAA CCT CTG CCT CCC GGG TTC CAG CGA TTC TCC TGC CTC     67198  Gly Ser Leu Gln Pro Leu Pro Pro Gly Phe Gln Arg Phe Ser Cys Leu     113672  AGC CTC CTG AGT AGC TGG GAT TAC AGA TGT ATG CTA CCA CGC CCA GGT     719114  Ser Leu Leu Ser Ser Trp Asp Tyr Arg Cys Met Leu Pro Arg Pro Gly     129720  AGT TTT TGT ATT TTT AGT AGA GAC AGG GTT TCA CTA TGT TGG CCA GGC     767130  Ser Phe Cys Ile Phe Ser Arg Asp Arg Val Ser Leu Cys Trp Pro Gly     145768  TGG TCT CCA ACT CCT GGC CTC AAA TGA TCA GCC CGC TTC AGC CTC CCA     815146  Trp Ser Pro Thr Pro Gly Leu Lys ***                                   154816  AAG TGG GGG GAT TAC AGG CGT GAG CCT TGC ACC CCG CTA AGT CCC CTA     863864  TCC TCT TGC AAG GGT CTC GCC TCT GTG CCT CAA TTC CTC ATT CTC TGG     911912  GCC CTT CTC CTC CTC AGG GCC TCC TGT TCT CAG GGC CTC CCC CCT CCC     959960  CGC TCC CTC CCT CTC TCA AGG TCT CCT CCT TCC CTC CCC CCC CCG TCT    10071008  CCC CCC TCC CCC GCC TGG GCT TCA CTT CCT TTC CTA CTT GGA TTC TCC    10551056  TGC TCG CTG CCT CCC AGC ATC TTT TTT GGA GGC CCG TCT CTT GCT GTG    11031104  GGG AAG ACT GGG CTG GCT GCG GGC AGT TTG CAA GGG GTG GGT GGG GCG    11511152  GGG GGG GGA GCT GGA CCA GAA GAT GCC CCT TGG AGT GGC AAG GAA GCT    11991200  GGA CAG GGC AGG CCT CTG GGG ACG GGA CAC AGG GAA GCC CGA AGG GGC    12471248  GCC TTG GCC AGG TCT GCC ATC TCC TCC AGC GAG GCT CTG GCC AGC ACT    12951296  GGG TGA GAG TGG GGA GGG GGC ACT GGC CTT TGC AGC ACA GTA AAA CAT    13431344  GGT CCA GAC AAC CTG TGG CCC CGG CCT CAT GAG CAC CCC CTG CAC AGG    13911392  CCC GGC CCA AGC CAG GCG CTA GAA GGG CTG GTT GTG GAG TGC TTA TCC    14391440  TTG ACA GGT ATG GGG CCA GGT GAG GGC AGG GGA CAA GGT GCA GCT GAG    14871488  GCC GAG CCC AAC TAG GTC CTG GGC ACC CCT GCA GGT GGG AGT GGT CCT    15351536  TGT CCT CCT GGT ATC CAG CAG ACA CCC CCC TCT CCC CAC CAG CCC CAT    15831584  TCT CAG GTC CTT TCC TCT TTG TCA CCA ACA CCA AGA ATC TGT CCA GGG    16311632  TTC TTG GCT TAT CTT TTA TCT CTT TTC ACT CCT AGA GAG GAA TTG CAA    16791680  TTG ACT CAG AAT GAC ACA TTT TTG GCA CCA CGT GTG TAG AAA GCC CCC    17271728  ACT GTT AGA TGA TAG CCT CGT GAA ATT CAT GTT TCT GTA TTC TCC TAT    17751776  TTC TTT TCA AAA ACT AAT TTT TTT TTT AGT GTA ATA AAT CCT AAG AGG    18231824  GAA CTG ATT TAA GAA ACA AGG CCG CCA AAC AAA GGC AGC AGT TCC GAC    18711872  TCC AGC AGC TGG GAA AGG AAG GAA AGT GAC CCC ACT TTC ACT CCT GCA    19191920  CAG CCC ACT GGT TAC CAA AAC CAC CGT GCA AGT CGG GAT GAC AGC AGG    19671968  GAC TTC TGG CCA GGT GGG AAA AGG TGC CTG GAA GCG GGA TGC GCC TGT    20152016  GCG TCT CTT GGC CAT GAT GTT CTT GTG GGC ATG TTA TTC TTG GTG CTG    20632064  CCT GGG GTG TTG CTG AGC GGA CAG GCT CTC CAG CTG GAG TCC ATG GAG    21112112  AGG CCA GAG GCT GGC GGC CCT GCC TGG GCC TTC GGA GCC TCC TGC CTG    21592160  CAC CCT CCA CCT CTT CTA AAC CAT GAT GTG GCA CAT TTT GGT GTT AAT    22072208  AAA ACA CAA CAC ACA AAG TAA AAA AAA AAA AAA AAA A                  22442.PP7706A:核苷酸序列(SEQ ID NO:4)长度:2929个碱基1  GGAGAGAGAG  AGCACTAGTC  TCGCGTTTTT  TTTTTTTTTT  TTTGACAACT  TGCTCTTTTA61  ATGTGGAATG  GATGACCCTC  CAATATTTCC  CCAGAGCACC  CCATGCTCTT  CTATCAGGGA121  ACTTATTAAA  ATCATGTAAC  ATGTTTCTTG  GTGACAAGAT  TTAGGTCTTT  TGTTTCTGTA181  ACACATGCCA  GATACTTAGC  CCGGTATCTG  GCATGTGGCA  TGCCCAGTAA  ATGTTTGCTG 241  AATAAGTGAA  TCTATGTCTC  TTGCTTGCCG  CTATTTGCCC  ACTGAATCCA  TGAAGTGAGT301  TTTCATAATG  ATTACCACTG  AAAATTCAAC  CCTGAAAAGA  ATGTCTTCGG  TTGTGGGCCC361  ATAAAGTCTT  AGAAATAGTG  AAGCTCCTAC  TGTCAGTCCT  TGAAAGGGAA  CAGGACAGCT421  GCTGTATGCC  TTGAGAATGG  GCAAAAGACA  AGCGACAAAA  AGAGCAGCGA  AGGCACCTAC481  TTGTCCCTCT  GGGCCAGGGC  CTCAGTGTAT  TGGTCGGGCT  TGACCTGGTC  TCCTGGTACA541  TCTTCCCAGT  TTTTGGTGAC  TCCCTTCAGT  TTCTCTGAGA  GCTCCAGGTT  ACACTCCTTC601  TCTGCTTCCA  CCAGAGCTGC  CATCCGCGCA  GCTTCATTCT  TTGCTAGCCT  GGATTCCTCC661  TGCAGAAGCT  GGATCTTATT  CTCCAAGAGC  TCATAAACAT  GCTCCGTCTC  CTGCTGTCGC721  TCCTCAAACT  GGCGTCGGAG  CTCAGCTTCA  TTCTGACTGT  TGAGATTCTC  CACATCAGCC781  CATGTTTTAT  CCAGATGCTG  TTTCTTGTCC  TGGAGTTCTC  GTTTCAAGCT  CTCCACTTCA841  ACCTTCAGCT  CAGTGTTCCG  CTTGTAGATG  TCCTCCCGGC  TGGCCTCATA  CTTCTGTTGC901  ATGCGCTCCT  CCAGGAAGTA  GATGAGCAGC  TTGAGGCTGA  AGTTCTCCTT  CTTCAGGTCA961  TTGAGGTGCT  TCTCAAAGTC  TCGAAGAGCC  TGGGTCTGTA  CCTGAGGGGG  TTTCTCAAAT1021  GCTCTCAAGG  AATATGTCTG  CACAAACGGG  ACCTTTTCAC  CACTTCTCCA  GATCTGTGAC1081  TGCACTGGAG  GGCCTCGATC  TTTAGTGTCA  CTAAGAAAAG  CTGCTGTGTG  ACTCGTTCTG1141  GGTACCATCT  CCCCATCATC  CTCTGCAAAA  TAATCTCTCG  TCCAGGTCTG  CTCCATTTTC1201  CAGGCTCTTT  CCTTAGTCTC  AGGACGCTCC  TCACCCGGGA  GGGGAAGCAG  CCTGGGAAAA1261  TGAGAAGCCT  TGCCCACGAA  TCTCCAGCGC  AAAAGGCAGC  AGCTTTTTCC  TCCCCAGCTC1321  CTTTCTGCGT  CGGCGGCGAA  GAGAGAGCTC  TGCTCCCTCG  GGAAAGTTTC  TTTGGAGGTC1381  CGGCCCGGAG  CGGCCATGTC  CCACGGCCCC  AAGCAGCCCG  GCGCGGCCGC  CGCGCCGGCG1441  GGCGGCAAGG  CTCCGGGCCA  GCATGGGGGC  TTCGTGGTGA  CTGTCAAGCA  AGAGCGCGGC1501  GAGGGTCCAC  GCGCGGGCGA  GAAGGGGTCC  CACGAGGAGG  AGCCGGTGAA  GAAACGCGGC1561  TGGCCCAAGG  GCAAGAAGCG  GAAGAAGATT  CTGCCGAATG  GGCCCAAGGC  ACCGGTCACG1621  GGCTACGTGC  GCTTCCTGAA  CGAGCGGCGC  GAGCAGATCC  GCACGCGCCA  CCCGGATCTG1681  CCCTTTCCCG  AGATCACCAA  GATGCTGGGC  GCCGAGTGGA  GCAAGCTGCA  GCCAACGGAA1741  AAGCAGCGGT  ACCTGGATGA  GGCCGAGAGA  GAGAAGCAGC  AGTACATGAA  GGAGCTGCGG1801  GCGTACCAGC  AGTCTGAAGC  CTATAAGATG  TGCACGGAGA  AGATCCAGGA  GAAGAAGATC1861  AAGAAAGAAG  ACTCGAGCTC  TGGGCTCATG  AACACTCTCC  TGAATGGACA  CAAGGGTGGG1921  GACTGCGATG  GCTTCTCCAC  CTTCGATGTT  CCCATCTTCA  CTGAAGAGTT  CTTGGACCAA1981  AACAAAGCGC  GTGAGGCGGA  GCTTCGGCGC  TTCGGAAGAT  GAATGTGGCC  TTCGAGGAGC2041  AGAACGCGGT  ACTGCAGAGG  CACACGCAGA  GCATGAGCAG  CGCGCGCGAG  CGTCTGGAGC2101  AGGACGTGGC  GCTGGAGGAG  CGGAGGACGC  TGGCGCTGCA  GCAGCAGCTC  CAGGCCGTGC2161  GCCAGGCGCT  CACCGCCAGC  TTCGCCTCAC  TGCCGGTGCC  GGGCACGGGC  GAAACGCCCA2221  CGCTGGGCAC  TCTGGACTTC  TACATGGCCC  GGCTTCACGG  AGCCATCGAG  CGCGACCCCG2281  CCCAGCACGA  GAAGCTCATC  GTCCGCATCA  AGGAAATCCT  GGCCCAGGTC  GCCAGCGAGC2341  ACCTGTGAGG  AGTGGGCGGG  CCCACGATGC  AGAGGAGAAG  CTGTGGGCGC  GGCCCTGCCA2401  CACCCCACCC  CGTGGACGAG  AGGCTGGGGG  TCCACCTTTG  GGGCCTGGTC  CCATCCTGCA2461  CCTTGGGGGC  TCCAGCCCCC  CTAAAATTAA  ATTTCTGCAG  CATCCCTTTA  GCTTTCAATC2521  TCCCCAGCCC  CCTGAACCCG  GAAAAAGCAC  CGTGCGCGAT  ACACCCAGAA  GAACCTCACA2581  GCCGAGGGTG  CCCCTCCTCG  GAGGACAAGC  CACGCGCTAC  ACTGGCTCTC  CGGGCCACCC2641  CCAGGACACA  GGGCAGACGA  AACCCACCCC  CAGCACACGG  CAGGACCCCC  CAAATTACTC2701  ACTACGGGGG  GCTGTGCCAT  AGGCCACACA  GGAAGCTGCC  TTGTGGGGAC  TTACCTGGGG2761  TGTCCCCCGC  ATGCCTGTAC  CCCAGATGGG  TGGGGGCCGG  CTTTGCCCAT  CCTGCTCTCC2821  TCCAGCCGAG  GGACCCTGGT  GGGGGTGGCT  CCTTCTCACT  GCTGGATCCG  GACTTTTTAA2881  ATAAAAACAA  GTAAAATTTG  TGTTTTAAAA  AAAAAAAAAA  AAAAAAAAAB:核苷酸序列(SEQ ID NO:5)长度:272个氨基酸1  MDTRVGTAMA  SPPSMFPSSL  KSSWTKTKRV  RRSFGASEDE  CGLRGAERGT  AEAHAEHEQR61  ARASGAGRGA  GGAEDAGAAA  AAPGRAPGAH  RQLRLTAGAG  HGRNAHAGHS  GLLHGPASRS121  HRARPRPARE  AHRPHQGNPG  PGRQRAPVRS  GRAHDAEEKL  WARPCHTPPR  GREAGGPPLG181  PGPILHLGGS  SPPKIKFLQH  PFSFQSPQPP  EPGKSTVRDT  PRRTSQPRVP  LLGGQATRYT
241 GSPGHPQDTG QTKPTPSTRQ DPPNYSLRGA VPC.核苷酸及氨基酸组合序列(SEQ ID NO:6)克隆号:PP7706起始编码子:1904 ATG  终止编码子:2720 TAG  蛋白质分子量:28556.181    G GAG AGA GAG AGC ACT AGT CTC GCG TTT TTT TTT TTT TTT TTT GAC      4647  AAC TTG CTC TTT TAA TGT GGA ATG GAT GAC CCT CCA ATA TTT CCC CAG      9495  AGC ACC CCA TGC TCT TCT ATC AGG GAA CTT ATT AAA ATC ATG TAA CAT     142143  GTT TCT TGG TGA CAA GAT TTA GGT CTT TTG TTT CTG TAA CAC ATG CCA     190191  GAT ACT TAG CCC GGT ATC TGG CAT GTG GCA TGC CCA GTA AAT GTT TGC     238239  TGA ATA AGT GAA TCT ATG TCT CTT GCT TGC CGC TAT TTG CCC ACT GAA     286287  TCC ATG AAG TGA GTT TTC ATA ATG ATT ACC ACT GAA AAT TCA ACC CTG     334335  AAA AGA ATG TCT TCG GTT GTG GGC CCA TAA AGT CTT AGA AAT AGT GAA     382383  GCT CCT ACT GTC AGT CCT TGA AAG GGA ACA GGA CAG CTG CTG TAT GCC     430431  TTG AGA ATG GGC AAA AGA CAA GCG ACA AAA AGA GCA GCG AAG GCA CCT     478479  ACT TGT CCC TCT GGG CCA GGG CCT CAG TGT ATT GGT CGG GCT TGA CCT     526527  GGT CTC CTG GTA CAT CTT CCC AGT TTT TGG TGA CTC CCT TCA GTT TCT     574575  CTG AGA GCT CCA GGT TAC ACT CCT TCT CTG CTT CCA CCA GAG CTG CCA     622623  TCC GCG CAG CTT CAT TCT TTG CTA GCC TGG ATT CCT CCT GCA GAA GCT     670671  GGA TCT TAT TCT CCA AGA GCT CAT AAA CAT GCT CCG TCT CCT GCT GTC     718719  GCT CCT CAA ACT GGC GTC GGA GCT CAG CTT CAT TCT GAC TGT TGA GAT     766767  TCT CCA CAT CAG CCC ATG TTT TAT CCA GAT GCT GTT TCT TGT CCT GGA     814815  GTT CTC GTT TCA AGC TCT CCA CTT CAA CCT TCA GCT CAG TGT TCC GCT     862863  TGT AGA TGT CCT CCC GGC TGG CCT CAT ACT TCT GTT GCA TGC GCT CCT     910911  CCA GGA AGT AGA TGA GCA GCT TGA GGC TGA AGT TCT CCT TCT TCA GGT     958959  CAT TGA GGT GCT TCT CAA AGT CTC GAA GAG CCT GGG TCT GTA CCT GAG    10061007  GGG GTT TCT CAA ATG CTC TCA AGG AAT ATG TCT GCA CAA ACG GGA CCT    10541055  TTT CAC CAC TTC TCC AGA TCT GTG ACT GCA CTG GAG GGC CTC GAT CTT    11021103  TAG TGT CAC TAA GAA AAG CTG CTG TGT GAC TCG TTC TGG GTA CCA TCT    11501151  CCC CAT CAT CCT CTG CAA AAT AAT CTC TCG TCC AGG TCT GCT CCA TTT    11981199  TCC AGG CTC TTT CCT TAG TCT CAG GAC GCT CCT CAC CCG GGA GGG GAA    12461247  GCA GCC TGG GAA AAT GAG AAG CCT TGC CCA CGA ATC TCC AGC GCA AAA    12941295  GGC AGC AGC TTT TTC CTC CCC AGC TCC TTT CTG CGT CGG CGG CGA AGA    13421343  GAG AGC TCT GCT CCC TCG GGA AAG TTT CTT TGG AGG TCC GGC CCG GAG    13901391  CGG CCA TGT CCC ACG GCC CCA AGC AGC CCG GCG CGG CCG CCG CGC CGG    14381439  CGG GCG GCA AGG CTC CGG GCC AGC ATG GGG GCT TCG TGG TGA CTG TCA    14861487  AGC AAG AGC GCG GCG AGG GTC CAC GCG CGG GCG AGA AGG GGT CCC ACG    15341535  AGG AGG AGC CGG TGA AGA AAC GCG GCT GGC CCA AGG GCA AGA AGC GGA    15821583  AGA AGA TTC TGC CGA ATG GGC CCA AGG CAC CGG TCA CGG GCT ACG TGC    16301631  GCT TCC TGA ACG AGC GGC GCG AGC AGA TCC GCA CGC GCC ACC CGG ATC    16781679  TGC CCT TTC CCG AGA TCA CCA AGA TGC TGG GCG CCG AGT GGA GCA AGC    17261727  TGC AGC CAA CGG AAA AGC AGC GGT ACC TGG ATG AGG CCG AGA GAG AGA    17741775  AGC AGC AGT ACA TGA AGG AGC TGC GGG CGT ACC AGC AGT CTG AAG CCT    18221823  ATA AGA TGT GCA CGG AGA AGA TCC AGG AGA AGA AGA TCA AGA AAG AAG    18701871  ACT CGA GCT CTG GGC TCA TGA ACA CTC TCC TGA ATG GAC ACA AGG GTG    19181                                              Met Asp Thr Arg Val       51919  GGG ACT GCG ATG GCT TCT CCA CCT TCG ATG TTC CCA TCT TCA CTG AAG    19666  Gly Thr Ala Met Ala Ser Pro Pro Ser Met Phe Pro Ser Ser Leu Lys      211967  AGT TCT TGG ACC AAA ACA AAG CGC GTG AGG CGG AGC TTC GGC GCT TCG    201422  Ser Ser Trp Thr Lys Thr Lys Arg Val Arg Arg Ser Phe Gly Ala Ser      372015  GAA GAT GAA TGT GGC CTT CGA GGA GCA GAA CGC GGT ACT GCA GAG GCA    2062  38  Glu Asp Glu Cys Gly Leu Arg Gly Ala Glu Arg Gly Thr Ala Glu Ala      532063  CAC GCA GAG CAT GAG CAG CGC GCG CGA GCG TCT GGA GCA GGA CGT GGC    211054  His Ala Glu His Glu Gln Arg Ala Arg Ala Ser Gly Ala Gly Arg Gly      692111  GCT GGA GGA GCG GAG GAC GCT GGC GCT GCA GCA GCA GCT CCA GGC CGT    215870  Ala Gly Gly Ala Glu Asp Ala Gly Ala Ala Ala Ala Ala Pro Gly Arg      852159  GCG CCA GGC GCT CAC CGC CAG CTT CGC CTC ACT GCC GGT GCC GGG CAC    220686  Ala Pro Gly Ala His Arg Gln Leu Arg Leu Thr Ala Gly Ala Gly His     1012207  GGG CGA AAC GCC CAC GCT GGG CAC TCT GGA CTT CTA CAT GGC CCG GCT    2254102  Gly Arg Asn Ala His Ala Gly His Ser Gly Leu Leu His Gly Pro Ala     1172255  TCA CGG AGC CAT CGA GCG CGA CCC CGC CCA GCA CGA GAA GCT CAT CGT    2302118  Ser Arg Ser His Arg Ala Arg Pro Arg Pro Ala Arg Glu Ala His Arg     1332303  CCG CAT CAA GGA AAT CCT GGC CCA GGT CGC CAG CGA GCA CCT GTG AGG    2350134  Pro His Gln Gly Asn Pro Gly Pro Gly Arg Gln Arg Ala Pro Val Arg     1492351  AGT GGG CGG GCC CAC GAT GCA GAG GAG AAG CTG TGG GCG CGG CCC TGC    2398150  Ser Gly Arg Ala His Asp Ala Glu Glu Lys Leu Trp Ala Arg Pro Cys     1652399  CAC ACC CCA CCC CGT GGA CGA GAG GCT GGG GGT CCA CCT TTG GGG CCT    2446166  His Thr Pro Pro Arg Gly Arg Glu Ala Gly Gly Pro Pro Leu Gly Pro     1812447  GGT CCC ATC CTG CAC CTT GGG GGC TCC AGC CCC CCT AAA ATT AAA TTT    2494182  Gly Pro Ile Leu His Leu Gly Gly Ser Ser Pro Pro Lys Ile Lys Phe     1972495  CTG CAG CAT CCC TTT AGC TTT CAA TCT CCC CAG CCC CCT GAA CCC GGA    2542198  Leu Gln His Pro Phe Ser Phe Gln Ser Pro Gln Pro Pro Glu Pro Gly     2132543  AAA AGC ACC GTG CGC GAT ACA CCC AGA AGA ACC TCA CAG CCG AGG GTG    2590214  Lys Ser Thr Val Arg Asp Thr Pro Arg Arg Thr Ser Gln Pro Arg Val     2292591  CCC CTC CTC GGA GGA CAA GCC ACG CGC TAC ACT GGC TCT CCG GGC CAC    2638230  Pro Leu Leu Gly Gly Gln Ala Thr Arg Tyr Thr Gly Ser Pro Gly His     2452639  CCC CAG GAC ACA GGG CAG ACG AAA CCC ACC CCC AGC ACA CGG CAG GAC    2686246  Pro Gln Asp Thr Gly Gln Thr Lys Pro Thr Pro Ser Thr Arg Gln Asp     2612687  CCC CCA AAT TAC TCA CTA CGG GGG GCT GTG CCA TAG GCC ACA CAG GAA    2734262  Pro Pro Asn Tyr Ser Leu Arg Gly Ala Val Pro ***                     2732735  GCT GCC TTG TGG GGA CTT ACC TGG GGT GTC CCC CGC ATG CCT GTA CCC    27822783  CAG ATG GGT GGG GGC CGG CTT TGC CCA TCC TGC TCT CCT CCA GCC GAG    28302831  GGA CCC TGG TGG GGG TGG CTC CTT CTC ACT GCT GGA TCC GGA CTT TTT    28782879  AAA TAAAAA CAA GTA AAA TTT GTG TTT TAA AAA AAA AAA AAA AAA AAA     29262927  AAA                                                                29293.PPl0484A:核苷酸序列(SEQ ID NO:7)长度:1788个碱基1  GGCTAAATCA  TATAACAGGG  TCACAGTAAT  GGGGGGTTTC  AAAGTGGAGA  ACCACACGGC61  GTGCCACTGC  AGTACTTGGT  AAAACATTTA  AGATTTGTGA  TAATAACAAG  TACTGCAGTG121  GCACGCCGGG  CCCCCAGAAC  CCTATGAAGC  CCAGCAGTCT  GAGCCAATCG  CCTACTTCCG181  GGGCCTACGG  CTGGTCATGA  GCCACGGCCC  ATACATCAAA  CTTATTACTG  GCTTCCTCTT241  CACCTCCTTG  GCTTTCATGC  TGGTGGAGGG  GAACTTTGTC  TTGTTTTGCA  CCTACACCTT301  GGGCTTCCGC  AATGAATTCC  AGAATCTACT  CCTGGCCATC  ATGGTGAGTG  GGACCTGAGC361  AGGGGCGGGC  AGCCTGGGCT  GAGGTGACAT  AGGCTGTGGA  ATGGTTCTTG  GAATAGGCAG421  AGGATGTTTC  TCAGGCTGGC  CCAAGGTCAT  GAAAGGATGA  GGGAGGCTTC  TCAGGGTATT481  TGGTTGGACC  TTGCGAAGGT  AGGACTGTGA  AAGAAAGAGT  TTGAGGTTAG  ATGTTTGAGT541  AGTGAGCACA  GCAAAAGCAA  GGGCGAGGAC  ACCAGGAACT  TGGCTCAGAG  GTTTGAGAGG 601  GCAGCAGACA  AGGTGGGCCT  GGACCAGCTC  TGAGCTCCCC  TGGGGAGCCG  TCAAAGGTGC661  CTGTCATCTT  CGTTGCTGCC  CACATGATGT  CATCTGGCTG  CTCTTGGGCA  GGGCTGGGAG721  CCACTTTGGG  GTTCTGGGAA  GGGCAGGAGG  GGCTCTGTGG  CTCTAAAGCA  CCTCCCTTTA781  ACCCCCTTTG  TCCATCCACA  GCTCTCGGCC  ACTTTAACCA  TTCCCATCTG  GCAGTGGTTC841  TTGACCCGGT  TTGGCAAGAA  GACAGCTGTA  TATGTTGGGA  TCTCATCAGC  AGTGCCATTT901  CTCATCTTGG  TGGCCCTCAT  GGAGAGTAAC  CTCATCATTA  CATATGCGGT  AGCTGTGGCA961  GCTGGCATCA  GTGTGGCAGC  TGCCTTCTTA  CTACCCTGGT  CCATGCTGCC  TGATGTCATT1021  GACGACTTCC  ATCTGAAGCA  GCCCCACTTC  CATGGAACCG  AGCCCATCTT  CTTCTCCTTC1081  TATGTCTTCT  TCACCAAGTT  TGCCTCTGGA  GTGTCACTGG  GCATTTCTAC  CCTCAGTCTG1141  GACTTTGCAG  GGTACCAGAC  CCGTGGCTGC  TCGCAGCCGG  AACGTGTCAA  GTTTACACTG1201  AACATGCTCG  TGACCATGGC  TCCCATAGTT  CTCATCCTGC  TGGGCCTGCT  GCTCTTCAAA1261  ATGTACCCCA  TTGATGAGGA  GAGGCGGCGG  CAGAATAAGA  AGGCCCTGCA  GGCACTGAGG1321  GACGAGGCCA  GCAGCTCTGG  CTGCTCAGAA  ACAGACTCCA  CAGAGCTGGC  TAGCATCCTC1381  TAGGGCCCGC  CACGTTGCCC  GAAGCCACCA  TGCAGAAGGC  CACAGAAGGG  ATCAGGACCT1441  GTCTGCCGGC  TTGCTGAGCA  GCTGGACTGC  AGGTGCTAGG  AAGGGAACTG  AAGACTCAAG1501  GAGGTGGCCC  AGGACACTTG  CTGTGCTCAC  TGTGGGGCCG  GCTGCTCTGT  GGCCTCCTGC1561  CTCCCCTCTG  CCTGCCTGTG  GGGCCAAGCC  CTGGGGCTGC  CACTGTGAAT  ATGCCAAGGA1621  CTGATCGGGC  CTAGCCCGGA  ACACTAATGT  AGAAACCTTT  TTTTTACAGA  GCCTAATTAA1681  TAACTTAATG  ACTGTGTACA  TAGCAATGTG  TGTGTATGTA  TATGTCTGTG  AGCTATTAAT1741  GTTATTAATT  TTCATAAAAG  CTGGAAAGCA  AAAAAAAAAA  AAAAAAAAB:核苷酸序列(SEQ ID NO:8)长度:154个氨基酸
  1 MESNLIITYA VAVAAGISVA AAFLLPWSML PDVIDDFHLK QPHFHGTEPI FFSFYVFFTK
 61 FASGVSLGIS TLSLDFAGYQ TRGCSQPERV KFTLNMLVTM APIVLILLGL LLFKMYPIDE
121 ERRRQNKKAL QALRDEASSS GCSETDSTEL ASILC.核苷酸及氨基酸组合序列(SEQ ID NO:9)克隆号:PP10484起始编码子:919 ATG  终止编码子:1381 TAG  蛋白质分子量:17057.851  GGC TAA ATC ATA TAA CAG GGT CAC AGT AAT GGG GGG TTT CAA AGT GGA      4849  GAA CCA CAC GGC GTG CCA CTG CAG TAC TTG GTA AAA CAT TTA AGA TTT      9697  GTG ATA ATA ACA AGT ACT GCA GTG GCA CGC CGG GCC CCC AGA ACC CTA     144145  TGA AGC CCA GCA GTC TGA GCC AAT CGC CTA CTT CCG GGG CCT ACG GCT     192192  GGT CAT GAG CCA CGG CCC ATA CAT CAA ACT TAT TAC TGG CTT CCT CTT     240241  CAC CTC CTT GGC TTT CAT GCT GGT GGA GGG GAA CTT TGT CTT GTT TTG     288289  CAC CTA CAC CTT GGG CTT CCG CAA TGA ATT CCA GAA TCT ACT CCT GGC     336337  CAT CAT GGT GAG TGG GAC CTG AGC AGG GGC GGG CAG CCT GGG CTG AGG     384385  TGA CAT AGG CTG TGG AAT GGT TCT TGG AAT AGG CAG AGG ATG TTT CTC     432433  AGG CTG GCC CAA GGT CAT GAA AGG ATG AGG GAG GCT TCT CAG GGT ATT     480481  TGG TTG GAC CTT GCG AAG GTA GGA CTG TGA AAG AAA GAG TTT GAG GTT     528529  AGA TGT TTG AGT AGT GAG CAC AGC AAA AGC AAG GGC GAG GAC ACC AGG     576577  AAC TTG GCT CAG AGG TTT GAG AGG GCA GCA GAC AAG GTG GGC CTG GAC     624625  CAG CTC TGA GCT CCC CTG GGG AGC CGT CAA AGG TGC CTG TCA TCT TCG     672673  TTG CTG CCC ACA TGA TGT CAT CTG GCT GCT CTT GGG CAG GGC TGG GAG     720721  CCA CTT TGG GGT TCT GGG AAG GGC AGG AGG GGC TCT GTG GCT CTA AAG     768769  CAC CTC CCT TTA ACC CCC TTT GTC CAT CCA CAG CTC TCG GCC ACT TTA     816817  ACC ATT CCC ATC TGG CAG TGG TTC TTG ACC CGG TTT GGC AAG AAG ACA     864865  GCT GTA TAT GTT GGG ATC TCA TCA GCA GTG CCA TTT CTC ATC TTG GTG     912913  GCC CTC ATG GAG AGT AAC CTC ATC ATT ACA TAT GCG GTA GCT GTG GCA     9601          Met Glu Ser Asn Leu Ile Ile Thr Tyr Ala Val Ala Val Ala     14961  GCT GGC ATC AGT GTG GCA GCT GCC TTC TTA CTA CCC TGG TCC ATG CTG    1008  15  Ala Gly Ile Ser Val Ala Ala Ala Phe Leu Leu Pro Trp Ser Met Leu      301009  CCT GAT GTC ATT GAC GAC TTC CAT CTG AAG CAG CCC CAC TTC CAT GGA    105631  Pro Asp Val Ile Asp Asp Phe His Leu Lys Gln Pro His Phe His Gly      461057  ACC GAG CCC ATC TTC TTC TCC TTC TAT GTC TTC TTC ACC AAG TTT GCC    110447  Thr Glu Pro Ile Phe Phe Ser Phe Tyr Val Phe Phe Thr Lys Phe Ala      621105  TCT GGA GTG TCA CTG GGC ATT TCT ACC CTC AGT CTG GAC TTT GCA GGG    115263  Ser Gly Val Ser Leu Gly Ile Ser Thr Leu Ser Leu Asp Phe Ala Gly      781153  TAC CAG ACC CGT GGC TGC TCG CAG CCG GAA CGT GTC AAG TTT ACA CTG    120079  Tyr Gln Thr Arg Gly Cys Ser Gln Pro Glu Arg Val Lys Phe Thr Leu      941201  AAC ATG CTC GTG ACC ATG GCT CCC ATA GTT CTC ATC CTG CTG GGC CTG    124895  Asn Met Leu Val Thr Met Ala Pro Ile Val Leu Ile Leu Leu Gly Leu     1101249  CTG CTC TTC AAA ATG TAC CCC ATT GAT GAG GAG AGG CGG CGG CAG AAT    1296111  Leu Leu Phe Lys Met Tyr Pro Ile Asp Glu Glu Arg Arg Arg Gln Asn     1261297  AAG AAG GCC CTG CAG GCA CTG AGG GAC GAG GCC AGC AGC TCT GGC TGC    1344127  Lys Lys Ala Leu Gln Ala Leu Arg Asp Glu Ala Ser Ser Ser Gly Cys     1421345  TCA GAA ACA GAC TCC ACA GAG CTG GCT AGC ATC CTC TAG GGC CCG CCA    1392143  Ser Glu Thr Asp Ser Thr Glu Leu Ala Ser Ile Leu ***                 1551393  CGT TGC CCG AAG CCA CCA TGC AGA AGG CCA CAG AAG GGA TCA GGA CCT    14401441  GTC TGC CGG CTT GCT GAG CAG CTG GAC TGC AGG TGC TAG GAA GGG AAC    14881489  TGA AGA CTC AAG GAG GTG GCC CAG GAC ACT TGC TGT GCT CAC TGT GGG    15361537  GCC GGC TGC TCT GTG GCC TCC TGC CTC CCC TCT GCC TGC CTG TGG GGC    15841585  CAA GCC CTG GGG CTG CCA CTG TGA ATA TGC CAA GGA CTG ATC GGG CCT    16321633  AGC CCG GAA CAC TAA TGT AGA AAC CTT TTT TTT ACA GAG CCT AAT TAA    16801681  TAA CTT AAT GAC TGT GTA CAT AGC AAT GTG TGT GTA TGT ATA TGT CTG    17281729  TGA GCT ATT AAT GTT ATT AAT TTT CAT AAA AGC TGG AAA GCA AAA AAA    17761777  AAA AAA AAA AAA                                                    17884. PP10566A:核苷酸序列(SEQ ID NO:10)长度:2559个碱基1  GCAGAGCCTG  AGCAGGCAGG  GCACCTCCAG  GTGGGCAGGA  GCTACCACTC  AGCACCATGA61  GCACCACCAC  AGGCCCAGAA  GCTGCCCCAA  AGCCAAGCGC  CAAGTCTATC  TATGAGCAGA121  GGAAGCGTTA  CTCCACAGTT  GTTATGGCTG  ATGTATCCCA  GTACCCAGTC  AATCACCTGG181  TGACGTTCTG  CCTGGGTGAG  GACGATGGCG  TGCATACCGT  GGAGGATGCC  TCCAGGAAGT241  TGGCCGTCAT  GGATAGCCAG  GGCCGAGTCT  GGGCACAGGA  GATGCTGCTG  CGAGTGTCTC301  CCGACCATGT  CACGCTGCTC  GACCCGGCCT  CCAAGGAGGA  GCTGGAGTCG  TACCCACTGG361  GCGCCATCGT  GCGCTGTGAC  GCGGTGATGC  CACCCGGCAG  GAGCCGCTCG  TTGCTGCTGC421  TCGTGTGCCA  GGAACCCGAG  CGCGCGCAGC  CCGACGTGCA  CTTCTTCCAG  GGCCTGCGCC481  TCGGGGCGGA  GCTGATCCGA  GAGGACATCC  AGGGGGCTCT  GCACAATTAC  CGCTCGGGCC541  GCGGGGAGCG  CAGGGCGGCG  GCGCTCAGGG  CCACGCAGGA  GGAGTTGCAG  CGCGACCGCT601  CGCCCGCCGC  TGAGACCCCG  CCCCTGCAGC  GCCGCCCGTC  AGTCCGCGCA  GTGATCAGCA661  CCGTAGAGCG  GGGCGCGGGC  CGCGGACGAC  CCCAGGCGAA  GCCCATTCCC  GAGGCAGAGG721  AGGCGCAGAG  GCCTGAGCCG  GTGGGGACCT  CGAGCAACGC  TGACTCGGCC  TCCCCGGACC781  TGGGTCCCCG  GGGTCCTGAC  CTGGCGGTTC  TGCAGGCGGA  GCGGGAAGTG  GACATCCTGA841  ACCACGTGTT  CGACGACGTA  GAGAGCTTTG  TATCGAGGCT  GCAGAAGTCG  GCGGAGGCGG901  CCAGGGTGCT  GGAGCACCGG  GAACGCGGCC  GCAGGAGCCG  GCGCCGGGCG  GCTGGGGAGG961  GCTTGCTGAC  GCTGCGGGCC  AAGCCGCCCT  CGGAGGCCGA  GTACACCGAC  GTGCTGCAGA1021  AGATCAAGTA  CGCCTTCAGC  CTGCTGGCCC  GGCTGCGCGG  CAACATCGCC  GACCCCTCCT1081  CTCCGGAGCT  GTTGCACTTC  CTTTTCGGGC  CTCTGCAGAT  GATTGTGAAC  ACGTCGGGGG1141  GGCCGGAGTT  CGCGAGCAGT  GTGCGGCGGC  CGCATCTGAC  ATCGGATGCC  GTGGCGCTGC1201  TGCGGGACAA  CGTCACTCCA  CGTGAAAACG  AGCTCTGGAC  CTCGCTGGGG  GACTCGTGGA1261  CCCGCCCCGG  GCTGGAGCTG  TCCCCGGAGG  AGGGACCCCC  ATACAGACCC  GAGTTCTTCA1321  GCGGCTGGGA  GCCGCCGGTC  ACTGACCCGC  AGAGCCGCGC  CTGGGAGGAC  CCAGTTGAGA1381  AACAGCTACA  GCACGAGCGG  AGGCGCCGGC  AGCAAAGCGC  CCCCGAGGTC  GCTGTCAATG1441  GTCACCGAGA  CTTGGAGCCA  GAATCTGAGC  CTCAGCTGGA  GTCAGAGACA  GCAGGAAAAT1501  GGGTCCTGTG  TAATTATGAC  TTCCAGGCCC  GCAACAGCAG  TGAGCTGTCG  GTCAAGCAGC1561  GGGACGTACT  GGAGGTCCTG  GATGACAGTC  GTAAGTGGTG  GAAGGTTCGG  GACCCAGCGG1621  GGCAGGAGGG  ATATGTGCCC  TACAACATCC  TGACACCCTA  CCCCGGACCC  CGGCTGCACC1681  ACAGCCAAAG  CCCTGCCCGC  AGCCTGAACA  GCACTCCTCC  TCCACCACCA  GCCCCAGCCC1741  CGGCCCCACC  TCCAGCTCTG  GCTCGGCCCC  GCTGGGACAG  GCCCCGCTGG  GACAGCTGCG1801  ATAGCCTCAA  CGGCTTGGAC  CCCAGCGAGA  AGGAGAAATT  CTCCCAGATG  CTCATCGTCA1861  ACGAGGAACT  GCAGGCGCGC  CTGGCCCAGG  GCCGCTCGGG  ACCGAGCCGC  GCAGTCCCAG1921  GGCCCCGCGC  CCCGGAACCG  CAGCTCAGCC  CGGGCTCGGA  CGCCTCCGAG  GTCCGCGCCT1981  GGCTGCAGGC  CAAGGGCTTT  AGCTCCGGGA  CCGTGGACGC  GCTGGGTGTG  CTGACCGGGG2041  CGCAGCTTTT  CTCGCTGCAG  AGGGAGGAGC  TGCGGGCGGT  GAGCCCCGAG  GAGGGGGCAC2101  GTGTGTACAG  CCAGGTCACC  GTGCAGCGCT  CGCTGCTGGA  GGACAAAGAG  AAAGTGTCAG2161  AGCTGGAGGC  AGTGATGGAG  AAGCAAAAGA  AGAAGGTGGA  AGGCGAGGTG  GAAATGGAGG2221  TCATTTGACC  TGCCAGGCGC  CCTTCGCAAA  GAGTGACGAG  GCCCCGTGGG  AGAACGGACT2281  CCTCAGACTC  TCCCCAATAG  CGGAAGTCGA  TCTTCTGAAG  GATGGCCAAT  CTGCTCCGGC2341  CCTGGTCTTC  CCCCATCCCG  GTGGACAGAC  TTAACGATCC  TTGCTGCAGT  CCCTCCGGAG2401  AGGATCTGGA  CTGGCTGGGA  GTGGGGAGGG  CGTGGAGACA  GTCTACGGAA  AGCGCTAGCA2461  GACCCCCGAG  AGGGTGCAGT  GGAGCCCTGA  GCATTGTAAT  ATGCGGCCCA  GCCTATAAAC2521  AGCCTCCGTG  CTTAGCAAAA  AAAAAAAAAA  AAAAAAAAAB:核苷酸序列(SEQ ID NO:11)长度:723个氨基酸1  MSTTTGPEAA  PKPSAKSIYE  QRKRYSTVVM  ADVSQYPVNH  LVTFCLGEDD  GVHTVEDASR61  KLAVMDSQGR  VWAQEMLLRV  SPDHVTLLDP  ASKEELESYP  LGAIVRCDAV  MPPGRSRSLL121  LLVCQEPERA  QPDVHFFQGL  RLGAELIRED  IQGALHNYRS  GRGERRAAAL  RATQEELQRD181  RSPAAETPPL  QRRPSVRAVI  STVERGAGRG  RPQAKPIPEA  EEAQRPEPVG  TSSNADSASP241  DLGPRGPDLA  VLQAEREVDI  LNHVFDDVES  FVSRLQKSAE  AARVLEHRER  GRRSRRRAAG301  EGLLTLRAKP  PSEAEYTDVL  QKIKYAFSLL  ARLRGNIADP  SSPELLHFLF  GPLQMIVNTS361  GGPEFASSVR  RPHLTSDAVA  LLRDNVTPRE  NELWTSLGDS  WTRPGLELSP  EEGPPYRPEF421  FSGWEPPVTD  PQSRAWEDPV  EKQLQHERRR  RQQSAPEVAV  NGHRDLEPES  EPQLESETAG481  KWLCNYDFQ   ARNSSELSVK  QRDVLEVLDD  SRKWWKVRDP  AGQEGYVPYN  ILTPYPGPRL541  HHSQSPARSL  NSTPPPPPAP  APAPPPALAR  PRWDRPRWDS  CDSLNGLDPS  EKEKFSQMLI601  VNEELQARLA  QGRSGPSRAV  PGPRAPEPQL  SPGSDASEVR  AWLQAKGFSS  GTVDALGVLT661  GAQLFSLQRE  ELRAVSPEEG  ARVYSQVTVQ  RSLLEDKEKV  SELEAVMEKQ  KKKVEGEVEM721  EVIC.核苷酸及氨基酸组合序列(SEQ ID NO:12)克隆号:PP10566起始编码子:57 ATG  终止编码子:2226 TGA  蛋白质分子量:80305.651   GC AGA GCC TGA GCA GGC AGG GCA CCT CCA GGT GGG CAG GAG CTA CCA      4748  CTC AGC ACC ATG AGC ACC ACC ACA GGC CCA GAA GCT GCC CCA AAG CCA      951              Met Ser Thr Thr Thr Gly Pro Glu Ala Ala Pro Lys Pro      1396  AGC GCC AAG TCT ATC TAT GAG CAG AGG AAG CGT TAC TCC ACA GTT GTT     14314  Ser Ala Lys Ser Ile Tyr Glu Gln Arg Lys Arg Tyr Ser Thr Val Val      29144  ATG GCT GAT GTA TCC CAG TAC CCA GTC AAT CAC CTG GTG ACG TTC TGC     19130  Met Ala Asp Val Ser Gln Tyr Pro Val Asn His Leu Val Thr Phe Cys      45192  CTG GGT GAG GAC GAT GGC GTG CAT ACC GTG GAG GAT GCC TCC AGG AAG     239  46  Leu Gly Glu Asp Asp Gly Val His Thr Val Glu Asp Ala Ser Arg Lys      61240  TTG GCC GTC ATG GAT AGC CAG GGC CGA GTC TGG GCA CAG GAG ATG CTG     28762  Leu Ala Val Met Asp Ser Gln Gly Arg Val Trp Ala Gln Glu Met Leu      77288  CTG CGA GTG TCT CCC GAC CAT GTC ACG CTG CTC GAC CCG GCC TCC AAG     33578  Leu Arg Val Ser Pro Asp His Val Thr Leu Leu Asp Pro Ala Ser Lys      93336  GAG GAG CTG GAG TCG TAC CCA CTG GGC GCC ATC GTG CGC TGT GAC GCG     38394  Glu Glu Leu Glu Ser Tyr Pro Leu Gly Ala Ile Val Arg Cys Asp Ala     109384  GTG ATG CCA CCC GGC AGG AGC CGC TCG TTG CTG CTG GTC GTG TGC CAG     431110  Val Met Pro Pro Gly Arg Ser Arg Ser Leu Leu Leu Leu Val Cys Gln     125432  GAA CCC GAG CGC GCG CAG CCC GAC GTG CAC TTC TTC CAG GGC CTG CGC     479126  Glu Pro Glu Arg Ala Gln Pro Asp Val His Phe Phe Gln Gly Leu Arg     141480  CTC GGG GCG GAG CTG ATC CGA GAG GAC ATC CAG GGG GCT CTG CAC AAT     527142  Leu Gly Ala Glu Leu Ile Arg Glu Asp Ile Gln Gly Ala Leu His Asn     157528  TAC CGC TCG GGC CGC GGG GAG CGC AGG GCG GCG GCG CTC AGG GCC ACG     575158  Tyr Arg Ser Gly Arg Gly Glu Arg Arg Ala Ala Ala Leu Arg Ala Thr     173576  CAG GAG GAG TTG CAG CGC GAC CGC TCG CCC GCC GCT GAG ACC CCG CCC     623174  Gln Glu Glu Leu Gln Arg Asp Arg Ser Pro Ala Ala Glu Thr Pro Pro     189624  CTG CAG CGC CGC CCG TCA GTC CGC GCA GTG ATC AGC ACC GTA GAG CGG     671190  Leu Gln Arg Arg Pro Ser Val Arg Ala Val Ile Ser Thr Val Glu Arg     205672  GGC GCG GGC CGC GGA CGA CCC CAG GCG AAG CCC ATT CCC GAG GCA GAG     719206  Gly Ala Gly Arg Gly Arg Pro Gln Ala Lys Pro Ile Pro Glu Ala Glu     221720  GAG GCG CAG AGG CCT GAG CCG GTG GGG ACC TCG AGC AAC GCT GAC TCG     767222  Glu Ala Gln Arg Pro Glu Pro Val Gly Thr Ser Ser Asn Ala Asp Ser     237768  GCC TCC CCG GAG CTG GGT CCC CGG GGT CCT GAC CTG GCG GTT CTG CAG     815238  Ala Ser Pro Asp Leu Gly Pro Arg Gly Pro Asp Leu Ala Val Leu Gln     253816  GCG GAG CGG GAA GTG GAC ATC CTG AAC CAC GTG TTC GAC GAC GTA GAG     863254  Ala Glu Arg Glu Val Asp Ile Leu Asn His Va1 Phe Asp Asp Val Glu     269864  AGC TTT GTA TCG AGG CTG CAG AAG TCG GCG GAG GCG GCC AGG GTG CTG     911270  Ser Phe Val Ser Arg Leu Gln Lys Ser Ala Glu Ala Ala Arg Val Leu     285912  GAG CAC CGG GAA CGC GGC CGC AGG AGC CGG CGC CGG GCG GCT GGG GAG     959286  Glu His Arg Glu Arg Gly Arg Arg Ser Arg Arg Arg Ala Ala Gly Glu     301960  GGC TTG CTG ACG CTG CGG GCC AAG CCG CCC TCG GAG GCC GAG TAC ACC    1007302  Gly Leu Leu Thr Leu Arg Ala Lys Pro Pro Ser Glu Ala Glu Tyr Thr     3171008  GAC GTG CTG CAG AAG ATC AAG TAC GCC TTC AGC CTG CTG GCC CGG CTG    1055318  Asp Val Leu Gln Lys Ile Lys Tyr Ala Phe Ser Leu Leu Ala Arg Leu     3331056  CGC GGC AAC ATC GCC GAC CCC TCC TCT CCG GAG CTG TTG CAC TTC CTT    1103334  Arg Gly Asn Ile Ala Asp Pro Ser Ser Pro Glu Leu Leu His Phe Leu     3491104  TTC GGG CCT CTG CAG ATG ATT GTG AAC ACG TCG GGG GGG CCG GAG TTC    1151350  Phe Gly Pro Leu Gln Met Ile Val Asn Thr Ser Gly Gly Pro Glu Phe     3651152  GCG AGC AGT GTG CGG CGG CCG CAT CTG ACA TCG GAT GCC GTG GCG CTG    1199366  Ala Ser Ser Val Arg Arg Pro His Leu Thr Ser Asp Ala Val Ala Leu     3811200  CTG CGG GAC AAC GTC ACT CCA CGT GAA AAC GAG CTC TGG ACC TCG CTG    1247382  Leu Arg Asp Asn Val Thr Pro Arg Glu Asn Glu Leu Trp Thr Ser Leu     3971248  GGG GAC TCG TGG ACC CGC CCC GGG CTG GAG CTG TCC CCG GAG GAG GGA    1295398  Gly Asp Ser Trp Thr Arg Pro Gly Leu Glu Leu Ser Pro Glu Glu Gly     4131296  CCC CCA TAC AGA CCC GAG TTC TTC AGC GGC TGG GAG CCG CCG GTC ACT    1343414  Pro Pro Tyr Arg Pro G1u Phe Phe Ser Gly Trp Glu Pro Pro Val Thr     4291344  GAC CCG CAG AGC CGC GCC TGG GAG GAC CCA GTT GAG AAA CAG CTA CAG    1391430  Asp Pro Gln Ser Arg Ala Trp Glu Asp Pro Val Glu Lys Gln Leu Gln     4451392  CAC GAG CGG AGG CGC CGG CAG CAA AGC GCC CCC GAG GTC GCT GTC AAT    1439446  His Glu Arg Arg Arg Arg Gln Gln Ser Ala Pro Glu Val Ala Val Asn     4611440  GGT CAC CGA GAC TTG GAG CCA GAA TCT GAG CCT CAG CTG GAG TCA GAG    1487462  Gly His Arg Asp Leu Glu Pro Glu Ser Glu Pro Gln Leu Glu Ser Glu     4771488  ACA GCA GGA AAA TGG GTC CTG TGT AAT TAT GAC TTC CAG GCC CGC AAC    1535478  Thr Ala Gly Lys Trp Val Leu Cys Asn Tyr Asp Phe Gln Ala Arg Asn     4931536  AGC AGT GAG CTG TCG GTC AAG CAG CGG GAC GTA CTG GAG GTC CTG GAT    1583494  Ser Ser Glu Leu Ser Val Lys Gln Arg Asp Val Leu Glu Val Leu Asp     5091584  GAC AGT CGT AAG TGG TGG AAG GTT CGG GAC CCA GCG GGG CAG GAG GGA    1631510  Asp Ser Arg Lys Trp Trp Lys Val Arg Asp Pro Ala Gly Gln Glu Gly     5251632  TAT GTG CCC TAC AAC ATC CTG ACA CCC TAC CCC GGA CCC CGG CTG CAC    1679526  Tyr Val Pro Tyr Asn Ile Leu Thr Pro Tyr Pro Gly Pro Arg Leu His     5411680  CAC AGC CAA AGC CCT GCC CGC AGC CTG AAC AGC ACT CCT CCT CCA CCA    1727542  His Ser Gln Ser Pro Ala Arg Ser Leu Asn Ser Thr Pro Pro Pro Pro     5571728  CCA GCC CCA GCC CCG GCC CCA CCT CCA GCT CTG GCT CGG CCC CGC TGG    1775558  Pro Ala Pro Ala Pro Ala Pro Pro Pro Ala Leu Ala Arg Pro Arg Trp     5731776  GAC AGG CCC CGC TGG GAC AGC TGC GAT AGC CTC AAC GGC TTG GAC CCC    1823574  Asp Arg Pro Arg Trp Asp Ser Cys Asp Ser Leu Asn Gly Leu Asp Pro     5891824  AGC GAG AAG GAG AAA TTC TCC CAG ATG CTC ATC GTC AAC GAG GAA CTG    1871590  Ser Glu Lys Glu Lys Phe Ser Gln Met Leu Ile Val Asn Glu Glu Leu     6051872  CAG GCG CGC CTG GCC CAG GGC CGC TCG GGA CCG AGC CGC GCA GTC CCA    1919606  Gln Ala Arg Leu Ala Gln Gly Arg Ser Gly Pro Ser Arg Ala Val Pro     6211920  GGG CCC CGC GCC CCG GAA CCG CAG CTC AGC CCG GGC TCG GAC GCC TCC    1967622  Gly Pro Arg Ala Pro Glu Pro Gln Leu Ser Pro Gly Ser Asp Ala Ser     6371968  GAG GTC CGC GCC TGG CTG CAG GCC AAG GGC TTT AGC TCC GGG ACC GTG    2015638  Glu Val Arg Ala Trp Leu Gln Ala Lys Gly Phe Ser Ser Gly Thr Val     6532016  GAC GCG CTG GGT GTG CTG ACC GGG GCG CAG CTT TTC TCG CTG CAG AGG    2063654  Asp Ala Leu Gly Val Leu Thr Gly Ala Gln Leu Phe Ser Leu Gln Arg     6692064  GAG GAG CTG CGG GCG GTG AGC CCC GAG GAG GGG GCA CGT GTG TAC AGC    2111670  Glu Glu Leu Arg Ala Val Ser Pro Glu Glu Gly Ala Arg Val Tyr Ser     6852112  CAG GTC ACC GTG CAG CGC TCG CTG CTG GAG GAC AAA GAG AAA GTG TCA    2159686  Gln Val Thr Val Gln Arg Ser Leu Leu Glu Asp Lys Glu Lys Val Ser     7012160  GAG CTG GAG GCA GTG ATG GAG AAG CAA AAG AAG AAG GTG GAA GGC GAG    2207702  Glu Leu Glu Ala Val Met Glu Lys Gln Lys Lys Lys Val Glu Gly Glu     7172208  GTG GAA ATG GAG GTC ATT TGA CCT GCC AGG CGC CCT TCG CAA AGA GTG    2255718  Val Glu Met Glu Val Ile ***                                         7242256  ACG AGG CCC CGT GGG AGA ACG GAC TCC TCA GAC TCT CCC CAA TAG CGG    23032304  AAG TCG ATC TTC TGA AGG ATG GCC AAT CTG CTC CGG CCC TGG TCT TCC    23512352  CCC ATC CCG GTG GAC AGA CTT AAC GAT CCT TGC TGC AGT CCC TCC GGA    23992400  GAG GAT CTG GAC TGG CTG GGA GTG GGG AGG GCG TGG AGA CAG TCT ACG    24472448  GAA AGC GCT AGC AGA CCC CCG AGA GGG TGC AGT GGA GCC CTG AGC ATT    24952496  GTA ATA TGC GGC CCA GCC TAT AAA CAG CCT CCG TGC TTA GCA AAA AAA    25432544  AAA AAA AAA AAA AAA A                                              25595.PP10631A:核苷酸序列(SEQ ID NO:13)长度:3134个碱基1  GGGCGAGCAG  GACAGGACGA  AGCCGGAGTG  TAGGCGGCAG  AGGATTCGCT  CCCAGAGCAG61  CTGCGGCCAG  GTCGGAAAGA  GGCCGGGGCG  GCTGGGTATA  TGAATGACCT  AAAGGTACAA121  ATAAAGACGG  AGAGAGAACA  GTGCCAACTG  GGAGCAGGGC  AAGAATGCCA  ATTCCTCCTC181  CCCCGCCACC  CCCACCTGGT  CCTCCTCCAC  CTCCCACATT  TCATCAGGCA  AACACAGAGC241  AGCCCAAGCT  GAGTAGAGAT  GAGCAGCGGG  GTCGAGGCGC  CCTCTTACAG  GACATTTGCA301  AAGGGACCAA  GCTGAAGAAG  GTGACCAACA  TTAATGATCG  GAGTGCTCCC  ATCCTCGAGA361  AGCCGAAAGG  AAGCAGTGGT  GGCTATGGCT  CTGGAGGAGC  TGCCCTGCAG  CCCAAGGGAG421  GTCTCTTCCA  AGGAGGAGTG  CTGAAGCTTC  GACCTGTGGG  AGCCAAGGAT  GGTTCAGAGA481  ACCTAGCTGG  TAAGCCAGCC  CTGCAAATCC  CCAGTTCTCG  AGCTGCTGCC  CCAAGGCCTC541  CAGTATCTGC  CGCCAGCGGG  CGTCCTCAGG  ATGATACAGA  CAGCAGCCGG  GCCTCACTCC601  CAGAACTGCC  CCGGATGCAG  AGACCCTCTT  TACCGGACCT  CTCTCGGCCT  AATACCACCA661  GCAGTACGGG  CATGAAGCAC  AGCTCCTCTG  CCCCTCCCCC  ACCACCCCCA  GGGCGGCGTG721  CCAACGCACC  CCCCACACCT  CTGCCTATGC  ACAGCAGCAA  AGCCCCCGCC  TACAACAGAG781  AGAAACCCTT  GCCACCGACG  CCTGGACAAA  GGCTTCACCC  TGGTCGAGAG  GGACCTCCTG841  CTCCACCCCC  AGTCAAACCA  CCTCCTTCCC  CTGTGAATAT  CAGAACAGGA  CCAAGTGGCC901  AGTCTCTGGC  TCCTCCTCCT  CCGCCTTACC  GCCAGCCTCC  TGGGGTCCCC  AATGGACCCT961  CTAGCCCCAC  TAATGAGTCA  GCCCCTGAGC  TGCCACAGAG  ACACAATTCT  TTGCATAGGA1021  AGACACCAGG  GCCTGTCAGA  GGCCTAGCAC  CTCCTCCACC  CACCTCGGCC  TCCCCATCTT1081  TACTGAGTAA  TAGGCCACCT  CCCCCAGCCC  GAGACCCTCC  CAGTCGGGGA  GCAGCTCCTC1141  CACCCCCACC  ACCTGTGATC  CGAAATGGTG  CCAGGGATGC  TCCCCCTCCC  CCACCACCAT1201  ACCGAATGCA  TGGGTCAGAA  CCCCCGAGCC  GAGGAAAGCC  CCCACCTCCA  CCCTCAAGGA1261  CGCCAGCTGG  GCCACCCCCC  TCCTCTTCCA  CCGCCCCTGA  GGAATGGCCA  CAGAGATTCT1321  ATCACCACTG  TCCGGTCTTT  CTTGGATGAT  TTTGAGTCAA  AGTATTCCTT  CCATCCAGTA1381  GAAGACTTTC  CTGCTCCAGA  AGAATATAAA  CACTTTCAGA  GGATATATCC  CAGCAAAACA1441  AACCGAGCTG  CCCGTGGAGC  CCCACCTCTG  CCACCCATTC  TCAGGTGAAG  CCTGGCTTGG1501  TCCCGTTCCT  CAGGAAAAGG  ATGGACCTTC  TCTTCTTCTC  AGATGGTCCC  TTCCATTCCC1561  CTGAAACCTG  CATGAGAGCT  CCTAACATGT  TTCTCCAATG  CAATCAAGCC  CTAGACTCCA1621  AATGTCCTCC  CAGCTCACCT  CCATCTATGC  ATCTCATCTC  TGGATTTGGT  GATCAGACTC1681  TATATTGACA  GTAGGATCTC  AAACCCTGCA  TCCATCCTTC  CTCCAGCAAG  CCCTGCTAGC1741  CACATGAGGA  ACAAGTTTCC  GTGTCTTCTG  CCTTCCTCTT  GGGGAAAGGT  GCCTTGTTGT1801  GATGAATTAA  CTCACTGTTA  GGGCAGGGTG  GAGAATGGTA  CTCCTTCCTT  CTCCTGTCCA1861  CTGTGGGGGA  AGCTTGGCAG  GTATATTATA  TTTCATCATT  TAGGAGGCTG  GCATGACCAG1921  GACTTATGGG  TGGGAGGGGA  GCATTTTTAG  TGAAGCAAGA  AAGGAGTTTG  CCAAGAAGTG1981  ATCTGTTTTA  AAGGTCATAT  TTGGAGAAAG  GGCAAGGAAT  TGGGTCTGCT  TTATTTTTGG2041  GGGTATTTTG  TTTTTGTTCT  CACCTGCTGC  CCCCCCACCC  CACCACCCCA  GGGATAAATT2101  GGATATAAAC  ACTAAATACT  AATCAGTTGA  ACTTAACATT  TAATAAAAAG  AAAGGGTGAA2161  ATAAACTGAA  GACCATTTTA  GAACTAGTCA  GTTCTCTGCA  GCAAAGGGAA  CAGGAGCCAT2221  TTGAACCCTC  TGGGACCCCT  CACCCCACTG  CTTCAGGGTG  CTAGGCTGAG  GGATGTTTTT2281  CCTCCCCCTT  ACCGCCCATG  CCCTTGAAAG  AAAAGTCACT  TTTTGTGGAG  GGCATCATTC2341  ATTCCTGATT  CACAAACCCC  AAAAACCTCT  GGTGGGAGAT  AGGAAGATAG  GGCGTGGGCC2401  TGGGCCTTAA  CCTCAATCTT  GTGTCTGCCT  CAGTCTTTTC  TGACTGGCCC  TGAAGTTGTC2461  AGTGGCTCTT  TCTGTCCTTC  AGCCCCTGGA  AGGTGCTCCA  GGATAACAAA  GAAGGGCAGG2521  TTGAAGCCCC  TCATGGAAGG  AGCTGGCTTT  GTGGGGCTGC  AAAGGACTTT  TAAGTCCTGC2581  CTGTACTGAA  GTTCACAGCC  CACCTGACTG  AGCAGACTCT  TCCTGTTCCT  TTCTCTACCA2641  CCCTTGCCTT  CCCAGGACTG  CACGGTTTAA  CACAGCAGAG  TACAGAAGGG  TGAAGAAGTG2701  AGCAGAGGCT  TATGAAGATA  TTCAGATACT  CTTCTATGCC  AGGAAGCACA  AAGACTTTGT2761  TGAGATTTGC  CTCAGTTCAG  TAGATCTTCC  TTGGCAGCCA  GCCATAGGTT  GTTTCTTTGT2821  CTTCCGGGTC  CTAAAGAGCA  CAGAGAAAAT  GGAGGTCCCC  AGTCTAGGTA  GGAAGCTGAT2881  TGGATGAGGA  CTTCTTTTTT  TCCGACAGCA  GGATGGGGCT  CTTGGGCTCC  ACACACCAGA2941  TGCTTTGGTT  TTCTACAACT  GTTGCTATGT  GTAGAGGGTG  CTCAGAGCGT  GGCATGAGAG3001  CAAGGAGACC  ATGGCTACTC  TTTGAAATGG  ATGGGGAAAA  TTAGCTTAAA  AATTTAATCA3061  CGAGATTGCG  CCACTGCACT  CCAGCCTGGG  CGACAGAGCC  AGACTCCGTC  TCAAAAAAAA3121  AAAAAAAAAA  AAAAB:核苷酸序列(SEQ ID NO:14)长度:394个氨基酸1  MPIPPPPPPP  PGPPPPPTFH  QANTEQPKLS  RDEQRGRGAL  LQDICKGTKL  KKVTNINDRS61  APILEKPKGS  SGGYGSGGAA  LQPKGGLFQG  GVLKLRPVGA  KDGSENLAGK  PALQIPSSRA121  AAPRPPVSAA  SGRPQDDTDS  SRASLPELPR  MQRPSLPDLS  RPNTTSSTGM  KHSSSAPPPP181  PPGRRANAPP  TPLPMHSSKA  PAYNREKPLP  PTPGQRLHPG  REGPPAPPPV  KPPPSPVNIR241  TGPSGQSLAP  PPPPYRQPPG  VPNGPSSPTN  ESAPELPQRH  NSLHRKTPGP  VRGLAPPPPT301  SASPSLLSNR  PPPPARDPPS  RGAAPPPPPP  VIRNGARDAP  PPPPPYRMHG  SEPPSRGKPP361  PPPSRTPAGP  PPSSSTAPEE  WPQRFYHHCP  VFLGC.核苷酸及氨基酸组合序列(SEQ ID NO.15)克隆号:PP10631起始编码子:165 ATG  终止编码子:1347 TGA  蛋白质分子量:41006.141   GG GCG AGC AGG ACA GGA CGA AGC CGG AGT GTA GGC GGC AGA GGA TTC      4748  GCT CCC AGA GCA GCT GCG GCC AGG TCG GAA AGA GGC CGG GGC GGC TGG      9596  GTA TAT GAA TGA CCT AAA GGT ACA AAT AAA GAC GGA GAG AGA ACA GTG     143144  CCA ACT GGG AGC AGG GCA AGA ATG CCA ATT CCT CCT CCC CCG CCA CCC     1911                              Met Pro Ile Pro Pro Pro Pro Pro Pro       9192  CCA CCT GGT CCT CCT CCA CCT CCC ACA TTT CAT CAG GCA AAC ACA GAG     23910  Pro Pro Gly Pro Pro Pro Pro Pro Thr Phe His Gln Ala Asn Thr Glu      25240  CAG CCC AAG CTG AGT AGA GAT GAG CAG CGG GGT CGA GGC GCC CTC TTA     28726  Gln Pro Lys Leu Ser Arg Asp Glu Gln Arg Gly Arg Gly Ala Leu Leu      41288  CAG GAC ATT TGC AAA GGG ACC AAG CTG AAG AAG GTG ACC AAC ATT AAT     33542  Gln Asp Ile Cys Lys Gly Thr Lys Leu Lys Lys Val Thr Asn Ile Asn      57336  GAT CGG AGT GCT CCC ATC CTC GAG AAG CCG AAA GGA AGC AGT GGT GGC     38358  Asp Arg Ser Ala Pro Ile Leu Glu Lys Pro Lys Gly Ser Ser Gly Gly      73384  TAT GGC TCT GGA GGA GCT GCC CTG CAG CCC AAG GGA GGT CTC TTC CAA     43174  Tyr Gly Ser Gly Gly Ala Ala Leu Gln Pro Lys Gly Gly Leu Phe Gln      89432  GGA GGA GTG CTG AAG CTT CGA CCT GTG GGA GCC AAG GAT GGT TCA GAG     47990  Gly Gly Val Leu Lys Leu Arg Pro Val Gly Ala Lys Asp Gly Ser Glu     105480  AAC CTA GCT GGT AAG CCA GCC CTG CAA ATC CCC AGT TCT CGA GCT GCT     527106  Asn Leu Ala Gly Lys Pro Ala Leu Gln Ile Pro Ser Ser Arg Ala Ala     121528  GCC CCA AGG CCT CCA GTA TCT GCC GCC AGC GGG CGT CCT CAG GAT GAT     575122  Ala Pro Arg Pro Pro Val Ser Ala Ala Ser Gly Arg Pro Gln Asp Asp     137576  ACA GAC AGC AGC CGG GCC TCA CTC CCA GAA CTG CCC CGG ATG CAG AGA     623138  Thr Asp Ser Ser Arg Ala Ser Leu Pro Glu Leu Pro Arg Met Gln Arg     153624  CCC TCT TTA CCG GAC CTC TCT CGG CCT AAT ACC ACC AGC AGT ACG GGC     671154  Pro Ser Leu Pro Asp Leu Ser Arg Pro Asn Thr Thr Ser Ser Thr Gly     169672  ATG AAG CAC AGC TCC TCT GCC CCT CCC CCA CCA CCC CCA GGG CGG CGT     719170  Met Lys His Ser Ser Ser Ala Pro Pro Pro Pro Pro Pro Gly Arg Arg     185720  GCC AAC GCA CCC CCC ACA CCT CTG CCT ATG CAC AGC AGC AAA GCC CCC     767 186  Ala Asn Ala Pro Pro Thr Pro Leu Pro Met His Ser Ser Lys Ala Pro     201768  GCC TAC AAC AGA GAG AAA CCC TTG CCA CCG ACG CCT GGA CAA AGG CTT     815202  Ala Tyr Asn Arg Glu Lys Pro Leu Pro Pro Thr Pro Gly Gln Arg Leu     217816  CAC CCT GGT CGA GAG GGA CCT CCT GCT CCA CCC CCA GTC AAA CCA CCT     863218  His Pro Gly Arg Glu Gly Pro Pro Ala Pro Pro Pro Val Lys Pro Pro     233864  CCT TCC CCT GTG AAT ATC AGA ACA GGA CCA AGT GGC CAG TCT CTG GCT     911234  Pro Ser Pro Val Asn Ile Arg Thr Gly Pro Ser Gly Gln Ser Leu Ala     249912  CCT CCT CCT CCG CCT TAC CGC CAG CCT CCT GGG GTC CCC AAT GGA CCC     959250  Pro Pro Pro Pro Pro Tyr Arg Gln Pro Pro Gly Val Pro Asn Gly Pro     265960  TCT AGC CCC ACT AAT GAG TCA GCC CCT GAG CTG CCA CAG AGA CAC AAT    1007266  Ser Ser Pro Thr Asn Glu Ser Ala Pro Glu Leu Pro Gln Arg His Asn     2811008  TCT TTG CAT AGG AAG ACA CCA GGG CCT GTC AGA GGC CTA GCA CCT CCT    1055282  Ser Leu His Arg Lys Thr Pro Gly Pro Val Arg Gly Leu Ala Pro Pro     2971056  CCA CCC ACC TCG GCC TCC CCA TCT TTA CTG AGT AAT AGG CCA CCT CCC    1103298  Pro Pro Thr Ser Ala Ser Pro Ser Leu Leu Ser Asn Arg Pro Pro Pro     3131104  CCA GCC CGA GAC CCT CCC AGT CGG GGA GCA GCT CCT CCA CCC CCA CCA    1151314  Pro Ala Arg Asp Pro Pro Ser Arg Gly Ala Ala Pro Pro Pro Pro Pro     3291152  CCT GTG ATC CGA AAT GGT GCC AGG GAT GCT CCC CCT CCC CCA CCA CCA    1199330  Pro Val Ile Arg Asn Gly Ala Arg Asp Ala Pro Pro Pro Pro Pro Pro     3451200  TAC CGA ATG CAT GGG TCA GAA CCC CCG AGC CGA GGA AAG CCC CCA CCT    1247346  Tyr Arg Met His Gly Ser Glu Pro Pro Ser Arg Gly Lys Pro Pro Pro     3611248  CCA CCC TCA AGG ACG CCA GCT GGG CCA CCC CCC TCC TCT TCC ACC GCC    1295362  Pro Pro Ser Arg Thr Pro Ala Gly Pro Pro Pro Ser Ser Ser Thr Ala     3771296  CCT GAG GAA TGG CCA CAG AGA TTC TAT CAC CAC TGT CCG GTC TTT CTT    1343378  Pro Glu Glu Trp Pro Gln Arg Phe Tyr His His Cys Pro Val Phe Leu     3931344  GGA TGA TTT TGA GTC AAA GTA TTC CTT CCA TCC AGT AGA AGA CTT TCC    1391394  Gly ***                                                             3951392  TGC TCC AGA AGA ATA TAA ACA CTT TCA GAG GAT ATA TCC CAG CAA AAC    14391440  AAA CCG AGC TGC CCG TGG AGC CCC ACC TCT GCC ACC CAT TCT CAG GTG    14871488  AAG CCT GGC TTG GTC CCG TTC CTC AGG AAA AGG ATG GAC CTT CTC TTC    15351536  TTC TCA GAT GGT CCC TTC CAT TCC CCT GAA ACC TGC ATG AGA GCT CCT    15831584  AAC ATG TTT CTC CAA TGC AAT CAA GCC CTA GAC TCC AAA TGT CCT CCC    16311632  AGC TCA CCT CCA TCT ATG CAT CTC ATC TCT GGA TTT GGT GAT CAG ACT    16791680  CTA TAT TGA CAG TAG GAT CTC AAA CCC TGC ATC CAT CCT TCC TCC AGC    17271728  AAG CCC TGC TAG CCA CAT GAG GAA CAA GTT TCC GTG TCT TCT GCC TTC    17751776  CTC TTG GGG AAA GGT GCC TTG TTG TGA TGA ATT AAC TCA CTG TTA GGG    18231824  CAG GGT GGA GAA TGG TAC TCC TTC CTT CTC CTG TCC ACT GTG GGG GAA    18711872  GCT TGG CAG GTA TAT TAT ATT TCA TCA TTT AGG AGG CTG GCA TGA CCA    19191920  GGA CTT ATG GGT GGG AGG GGA GCA TTT TTA GTG AAG CAA GAA AGG AGT    19671968  TTG CCA AGA AGT GAT CTG TTT TAA AGG TCA TAT TTG GAG AAA GGG CAA    20152016  GGA ATT GGG TCT GCT TTA TTT TTG GGG GTA TTT TGT TTT TGT TCT CAC    20632064  CTG CTG CCC CCC CAC CCC ACC ACC CCA GGG ATA AAT TGG ATA TAA ACA    21112112  CTA AAT ACT AAT CAG TTG AAC TTA ACA TTT AAT AAA AAG AAA GGG TGA    21592160  AAT AAA CTG AAG ACC ATT TTA GAA CTA GTC AGT TCT CTG CAG CAA AGG    22072208  GAA CAG GAG CCA TTT GAA CCC TCT GGG ACC CCT CAC CCC ACT GCT TCA    22552256  GGG TGC TAG GCT GAG GGA TGT TTT TCC TCC CCC TTA CCG CCC ATG CCC    23032304  TTG AAA GAA AAG TCA CTT TTT GTG GAG GGC ATC ATT CAT TCC TGA TTC    23512352  ACA AAC CCC AAA AAC CTC TGG TGG GAG ATA GGA AGA TAG GGC GTG GGC    23992400  CTG GGC CTT AAC CTC AAT CTT GTG TCT GCC TCA GTC TTT TCT GAC TGG    24472448  CCC TGA AGT TGT CAG TGG CTC TTT CTG TCC TTC AGC CCC TGG AAG GTG    24952496  CTC CAG GAT AAC AAA GAA GGG CAG GTT GAA GCC CCT CAT GGA AGG AGC    25432544  TGG CTT TGT GGG GCT GCA AAG GAC TTT TAA GTC CTG CCT GTA CTG AAG    25912592  TTC ACA GCC CAC CTG ACT GAG CAG ACT CTT CCT GTT CCT TTC TCT ACC    26392640  ACC CTT GCC TTC CCA GGA CTG CAC GGT TTA ACA CAG CAG AGT ACA GAA    26872688  GGG TGA AGA AGT GAG CAG AGG CTT ATG AAG ATA TTC AGA TAC TCT TCT    27352736  ATG CCA GGA AGC ACA AAG ACT TTG TTG AGA TTT GCC TCA GTT CAG TAG    27832784  ATC TTC CTT GGC AGC CAG CCA TAG GTT GTT TCT TTG TCT TCC GGG TCC    28312832  TAA AGA GCA CAG AGA AAA TGG AGG TCC CCA GTC TAG GTA GGA AGC TGA    28792880  TTG GAT GAG GAC TTC TTT TTT TCC GAC AGC AGG ATG GGG CTC TTG GGC    29272928  TCC ACA CAC CAG ATG CTT TGG TTT TCT ACA ACT GTT GCT ATG TGT AGA    29752976  GGG TGC TCA GAG CGT GGC ATG AGA GCA AGG AGA CCA TGG CTA CTC TTT    30233024  GAA ATG GAT GGG GAA AAT TAG CTT AAA AAT TTA ATC ACG AGA TTG CGC    30713072  CAC TGC ACT CCA GCC TGG GCG ACA GAG CCA GAC TCC GTC TCA AAA AAA    31193120  AAA AAA AAA AAA AAA                                                31346.PP10752A:核苷酸序列(SEQ ID NO:16)长度:1528个碱基1  GCAGGAGGGT  AGCCTCCATG  CGTAGCCACC  CCACCTGGCA  GTGGTGGTGC  CAGTCGGGCA61  TGGAGTCCCT  CCACTCGCTG  ACCTCCTCCT  GCACGGCGCA  TAGCTCCTGC  TGCAAGAAGC121  GCCACATGTT  GGCCAGGTTG  AAGCCATTGA  CCCAGTTGTG  GTTGATGGAG  ATGGTGTCAT181  CCTGGAAGGG  GCACAGTGCA  GGCAGGCCTG  AGCCCATGGC  AGGTGCCCCC  TGACCAACCC241  ACATCTCCTG  CGCCAGGAAC  CCACTGTGGG  GTCCAGCCCT  CTGCAGCCAA  GAGGGCCCTC301  CTGTCTCCCA  GCAGGGCTTG  CTCAGCAGGG  AAGTGGGTGG  CGGGCTCGGA  CCACCTCAGG361  CCACAGTGAA  CCCAGAGCAA  GTAGACCCAG  GGACCGGCAG  TGGGTGAAAC  AGAGGCTAGG421  CCTCAGCGAC  ACCACCTTGT  GAAGGGGTCA  GCCTCACCCA  TGAGCCACCC  CATTCCAGCC481  CAGCTCTGGC  TGGGAGAGTG  GGGAGGTGGT  GCTGCCGTCT  TCCTGCAGGA  AGGCCCCTGA541  TAGGGGGCAG  GAGAAGCAGC  ACATTACCAG  GTTGTGCACC  TGGTGGTGCC  AGCCACTGGG601  CACAAACACC  ATCTCGCCCG  CTTCCTGCGT  GATCTCCAAG  GGTGGGCCAG  CAAGCTGGTT661  CCGTGGGTGC  AGGTGTGTGT  CGCAGAGTGC  TGGGGAGGTC  ACGTCGTAGG  GCAGGTTGCC721  GTGGCGGTCC  CGCAGCCTCT  TCCTGCCCTG  GGGGGAAGAG  GAGCCACTTC  TTCCTCCCAC781  AGACATTGAC  AGACCAGCTG  AAGGAGCGGA  AGATGTCAGC  ATGGAACGGG  GACCTGCGGC841  ACAAGAGCGC  CTGGTTCATG  CCTGTAGGGG  CTGGTATGGG  CTTTGCTTGG  CACCCCAGAG901  GCCTGGTCCA  ACTGAAGGAG  GGGTGGCCCC  TTGGTCTCAA  GGGATGGCAC  CCACTGTGAG961  GCCTGTGCCA  AGCAGCCCCC  CTCCTGCCAC  CCTGGGCCTC  CCAGTCTGTT  CTGTCACCAG1021  GCCCCTTCGG  TTCCACTCCC  ACATCCGTGG  CCTCACCAGC  TGCCCGCAGG  CCCCGCGTAG1081  ACAAAGCGGT  AGTCATCCAC  ATCCAGTGCA  TCCCAGAACT  CATTCAGCCA  GTCGGACGAG1141  AAGTACACAG  GCAGGGTGAA  AACGTCCTCC  ACCGGAAAGT  CCCTGTGAGG  AGGGCGCAAG1201  GGCACCACCG  ACAGCACGTG  AGGCACGAGG  AGACTAGGGC  AGCACGAGTG  GGGCAACTGA1261  GACCAATCGG  CTCCAGTGGA  GCTTCCAGAT  GGCTGCAGCC  CCCAAAGAGC  CCCAGACCCT1321  CCTCTGAGCC  AGACGCTGCT  GGCGGGGGAG  GGGGCGGGGC  AGTCTGACTA  CAATGGTTCT1381  GCTTATTAGA  AAGTACTGAT  CATGCCTATA  ATCCCAGTGC  TTTGAGATGC  TGAGGTGGAT1441  GCATCACCTG  AGCTCAGGAG  TTCAAGACCA  GCCTGGGCAA  CATGGTGAAA  CCTAGTCTCT1501  TTAAAAAAAA  AAAAAAAAAA  AAAAAAAAB:核苷酸序列(SEQ ID NO:17)长度:112个氨基酸
 1  MERGPAAQER LVHACRGWYG LCLAPQRPGP TEGGVAPWSQ GMAPTVRPVP SSPPPATLGL
61  PVCSVTRPLR FHSHIRGLTS CPQAPRRQSG SHPHPVHPRT HSASRTRSTQ AGC.核苷酸及氨基酸组合序列(SEQ ID NO:18)克隆号:PP10752起始编码子:821 ATG  终止编码子:1157 TGA  蛋白质分子量:11974.041    G CAG GAG GGT AGC CTC CAT GCG TAG CCA CCC CAC CTG GCA GTG GTG      4647  GTG CCA GTC GGG CAT GGA GTC CCT CCA CTC GCT GAC CTC CTC CTG CAC      9495  GGC GCA TAG CTC CTG CTG CAA GAA GCG CCA CAT GTT GGC CAG GTT GAA     142143  GCC ATT GAC CCA GTT GTG GTT GAT GGA GAT GGT GTC ATC CTG GAA GGG     190191  GCA CAG TGC AGG GAG GCC TGA GCC CAT GGC AGG TGC CCC CTG ACC AAC     238239  CCA CAT CTC CTG CGC CAG GAA CCC ACT GTG GGG TCC AGC CCT CTG CAG     286287  CCA AGA GGG CCC TCC TGT CTC CCA GCA GGG CTT GCT CAG CAG GGA AGT     334335  GGG TGG CGG GCT CGG ACC ACC TCA GGC CAC AGT GAA CCC AGA GCA AGT     382383  AGA CCC AGG GAC CGG CAG TGG GTG AAA CAG AGG CTA GGC CTC AGC GAC     430431  ACC ACC TTG TGA AGG GGT CAG CCT CAC CCA TGA GCC ACC CCA TTC CAG     478479  CCC AGC TCT GGC TGG GAG AGT GGG GAG GTG GTG CTG CCG TCT TCC TGC     526527  AGG AAG GCC CCT GAT AGG GGG CAG GAG AAG CAG CAC ATT ACC AGG TTG     574575  TGC ACC TGG TGG TGC CAG CCA CTG GGC ACA AAC ACC ATC TCG CCC GCT     622623  TCC TGC GTG ATC TCC AAG GGT GGG CCA GCA AGC TGG TTC CGT GGG TGC     670671  AGG TGT GTG TCG CAG AGT GCT GGG GAG GTC ACG TCG TAG GGC AGG TTG     718719  CCG TGG CGG TCC CGC AGC CTC TTC CTG CCC TGG GGG GAA GAG GAG CCA     766767  CTT CTT CCT CCC ACA GAC ATT GAC AGA CCA GCT GAA GGA GCG GAA GAT     814815  GTC AGC ATG GAA CGG GGA CCT GCG GCA CAA GAG CGC CTG GTT CAT GCC     8621          Met Glu Arg Gly Pro Ala Ala Gln Glu Arg Leu Val His Ala      14863  TGT AGG GGC TGG TAT GGG CTT TGC TTG GCA CCC CAG AGG CCT GGT CCA     91015  Cys Arg Gly Trp Tyr Gly Leu Cys Leu Ala Pro Gln Arg Pro Gly Pro      30911  ACT GAA GGA GGG GTG GCC CCT TGG TCT CAA GGG ATG GCA CCC ACT GTG     95831  Thr Glu Gly Gly Val Ala Pro Trp Ser Gln Gly Met Ala Pro Thr Val      46959  AGG CCT GTG CCA AGC AGC CCC CCT CCT GCC ACC CTG GGC CTC CCA GTC    100647  Arg Pro Val Pro Ser Ser Pro Pro Pro Ala Thr Leu Gly Leu Pro Val      621007  TGT TCT GTC ACC AGG CCC CTT CGG TTC CAC TCC CAC ATC CGT GGC CTC    105463  Cys Ser Val Thr Arg Pro Leu Arg Phe His Ser His Ile Arg Gly Leu      781055  ACC AGC TGC CCG CAG GCC CCG CGT AGA CAA AGC GGT AGT CAT CCA CAT    110279  Thr Ser Cys Pro Gln Ala Pro Arg Arg Gln Ser Gly Ser His Pro His      941103  CCA GTG CAT CCC AGA ACT CAT TCA GCC AGT CGG ACG AGA AGT ACA CAG    115095  Pro Val His Pro Arg Thr His Ser Ala Ser Arg Thr Arg Ser Thr Gln     1101151  GCA GGG TGA AAA CGT CCT CCA CCG GAA AGT CCC TGT GAG GAG GGC GCA    1198111  Ala Gly ***                                                         1131199  AGG GCA CCA CCG ACA GCA CGT GAG GCA CGA GGA GAC TAG GGC AGC ACG    12461247  AGT GGG GCA ACT GAG ACC AAT CGG CTC CAG TGG AGC TTC CAG ATG GCT    12941295  GCA GCC CCC AAA GAG CCC CAG ACC CTC CTC TGA GCC AGA CGC TGC TGG    13421343  CGG GGG AGG GGG CGG GGC AGT CTG ACT ACA ATG GTT CTG CTT ATT AGA    13901391  AAG TAC TGA TCA TGC CTA TAA TCC CAG TGC TTT GAG ATG CTG AGG TGG    14381439  ATG CAT CAC CTG AGC TCA GGA GTT CAA GAC CAG CCT GGG CAA CAT GGT    14861487  GAA ACC TAG TCT CTT TAA AAA AAA AAA AAA AAA AAA AAA AAA            15287.PPl0881A:核苷酸序列(SEQ ID NO:19)长度:2100个碱基
  1 GCCACTATGT CTGGCTGAGT ATGTCTCTTT TAGATTGTTT TATTTTGAGA ACTTCTGAAA
 61 CCATGTCAGA GACTGCTGAT GCTGTAGATG ATACTATATT ATTCAAGTCT TGATTATCTG
121 CTGTGAGTTT TCATGAATAA TTCACCTTTT TCATGCACGA CACAGAACTT GTTGGTAACA
181 GCACTCCAGT GTCGAACATG TCATTAATTC ATGTGCTAAA TCTCTTTTGG TCCACCATGA 241  TACTGTTTCA  AATTAACAAC  CTATGTGAGC  TGGGGAAGTT  GCACAGATTC  TCATTTAGCC301  TGTTCTGACT  GAAGGGAAAA  CTAACAAGCT  TTCTGCAGTA  TAGTAGCTGA  AGTTTTCCCT361  GGTCAAACAT  CATATCCTTC  CCCAAAACAT  ATTCAGGTAA  TGTGGATGCA  AGTACTTCCA421  AGATTCATTC  AAACATACTA  ATTTTCATCC  AAATTTTAAT  TTAATCCTAT  CAGCCATTTC481  ATCCTCATAT  CCTGTCTTTC  TAGTTATTGC  CTCTGCTAGG  ATTTTACCAA  TAGGTTTTGG541  AATCAGAGGC  ACTGAATTCT  ATGTCAGGAA  CCCCTGGAAG  GTTTCTTTTT  TACCTTCTAT601  TGTACCTACA  GGTGTGCATA  TGGCCTTCAG  TCCCTACTAG  GAGATTAGTT  AAAAGAAAGC661  CCTGGTTCTG  TGTCAGTCCT  CATCCTGATT  AATTTGGTAG  CCCATCACCT  CTGATGATTT721  GAACTGAGGT  TCTTCATTGT  CATTTTTGCT  TCCCAGCTTG  GTGCATTCTT  TGAAATTAGG781  GTGCATAGAG  TGTTTGTTTA  GGGCCCTTCA  GTGTTGGGGG  ACTAAGAGGC  GCTCCCATTG841  GTAAACCTAA  CTTCTGATAG  TGCAGCATTA  AGACCTTTGT  GTTAACATCA  GTGTCCATTT901  TATTCATCCC  ATCTCTTAGT  AACCGTTTAA  AACTTCATCC  TGCTTGGGAC  TTCGTTGACT961  ATCTGTTTTG  TGTTACCCAT  TCACTTGTGA  TTCAGTCTTA  TTTTCTTAGC  ATCTGTAAGA1021  CCCATATTAA  GAAGCTGAGA  CAACAAATCT  GACACATTTC  TTGGACCATT  GATAGATTTT1081  GCAGCAGTTA  TATCAGATGC  CTGCCTAGCG  GGGCCCCTTC  AGTCACAGTA  TTTACCATGA1141  TTTAAAGGGC  ATATTAAGGA  TGAACAAACA  TCCTGATGAC  CATGAAGTTA  ATCCAGCATG1201  GTTTGCATAT  GCAGCTTACC  AGCTTTGTCA  TCTATGGAGG  AGTGCCACTT  GGCATTTAAA1261  GGAGGGGAAG  GACCATTTCC  CTTTTCAGGG  TAAACAAATT  TTACAGTGGC  TTTTACCCAG1321  TCCACCAGAC  TAGCTGTCCC  TTTAGGAACA  ATCTATTGTG  TGTTTGGATC  ATGTACAACA1381  ATCCATGATT  GTTCAGTAAT  AAGGTTCCTG  CATCAACCCC  AAGCAGACTT  CTTCATTCTG1441  CAACATTCAG  AATCAAAGAT  ACTGCTCCCA  AGTTAGTCAC  TCTCACAATC  TATTTTCTTA1501  AATGTTTTTC  AGGAACCCGA  TGAATACCAG  TTCACAAGGC  AAGATAACTC  CTTCACACAT1561  AACCCCTGCT  TCCAGTACTG  TCTTGGTTTT  GTCACCCACC  ATTTGGACAA  TGTTCCTGGT1621  GGTCAAAGGC  CATAGATATA  CTGTCTGTTT  TTTTCAGCAT  AATTTTCCAT  TGGGTTTATC1681  CTGGAGGCTA  ACAGCCATAG  CTCAAGCTAA  CCAAAATCCA  AGCTTTTTGA  GCATCAGGAT1741  TTCCTTAACA  CTCTCTCTTA  CTTTCATTTT  AGCTGTTTTA  AAATACAGCA  GACTGGGCCA1801  GGCGCAGTGG  CTCACATTGG  TAATCCCAGT  ACGTTGGGAG  GCCAAGTCGG  GCAGATCACT1861  TGAGGCCAGG  AGTTTGAGAC  CAGCCTGACC  AACATGGTGA  AACCCTGTCT  CCACTAAAAA1921  TACAAAAAAT  TAGCTTGGCT  TGGTGGCATG  CGCCTGTAAT  CCCAGCTACT  TGAGGGGCTG1981  AGGCAGGAGA  ATCACTGGAA  CCCAGGAGGC  AGAGGTTGCA  GTGATCTGAG  ATCATGCCAC2041  TGTACTCCAG  CCTGGGAGAC  ACAGCGAGAC  TCCCTCTCAA  AAAAAAAAAA  AAAAAAAAAAB:核苷酸序列(SEQ ID NO:20)长度:128个氨基酸
  1 MFFRNPMNTS SQGKITPSHI TPASSTVLVL SPTIWTMFLV VKGHRYTVCF FQHNFPLGLS
 61 WRLTAIAQAN QNPSFLSIRI SLTLSLTFIL AVLKYSRLGQ AQWLTLVIPV RWEAKSGRSL
121 EARSLRPAC.核苷酸及氨基酸组合序列(SEQ ID NO:21)克隆号:PPl0881起始编码子:1502 ATG  终止编码子:1886 TGA  蛋白质分子量:14432.151    G  CCA  CTA  TGT  CTG  GCT  GAG  TAT  GTC  TCT  TTT  AGA  TTG  TTT  TAT  TTT      4647  GAG  AAC  TTC  TGA  AAC  CAT  GTC  AGA  GAC  TGC  TGA  TGC  TGT  AGA  TGA  TAC      9495  TAT  ATT  ATT  CAA  GTC  TTG  ATT  ATC  TGC  TGT  GAG  TTT  TCA  TGA  ATA  ATT     142143  CAC  CTT  TTT  CAT  GCA  CGA  CAC  AGA  ACT  TGT  TGG  TAA  CAG  CAC  TCC  AGT     190191  GTC  GAA  CAT  GTC  ATT  AAT  TCA  TGT  GCT  AAA  TCT  CTT  TTG  GTC  CAC  CAT     238239  GAT  ACT  GTT  TCA  AAT  TAA  CAA  CCT  ATG  TGA  GCT  GGG  GAA  GTT  GCA  CAG     286287  ATT  CTC  ATT  TAG  CCT  GTT  CTG  ACT  GAA  GGG  AAA  ACT  AAC  AAG  CTT  TCT     334335  GCA  GTA  TAG  TAG  CTG  AAG  TTT  TCC  CTG  GTC  AAA  CAT  CAT  ATC  CTT  CCC     382383  CAA  AAC  ATA  TTC  AGG  TAA  TGT  GGA  TGC  AAG  TAC  TTC  CAA  GAT  TCA  TTC     430431  AAA  CAT  ACT  AAT  TTT  CAT  CCA  AAT  TTT  AAT  TTA  ATC  CTA  TCA  GCC  ATT     478479  TCA  TCC  TCA  TAT  CCT  GTC  TTT  CTA  GTT  ATT  GCC  TCT  GCT  AGG  ATT  TTA     526527  CCA  ATA  GGT  TTT  GGA  ATC  AGA  GGC  ACT  GAA  TTC  TAT  GTC  AGG  AAC  CCC     574 575  TGG AAG GTT TCT TTT TTA CCT TCT ATT GTA CCT ACA GGT GTG CAT ATG     622623  GCC TTC AGT CCC TAC TAG GAG ATT AGT TAA AAG AAA GCC CTG GTT CTG     670671  TGT CAG TCC TCA TCC TGA TTA ATT TGG TAG CCC ATC ACC TCT GAT GAT     718719  TTG AAC TGA GGT TCT TCA TTG TCA TTT TTG CTT CCC AGC TTG GTG CAT     766767  TCT TTG AAA TTA GGG TGC ATA GAG TGT TTG TTT AGG GCC CTT CAG TGT     814815  TGG GGG ACT AAG AGG CGC TCC CAT TGG TAA ACC TAA CTT CTG ATA GTG     862863  CAG CAT TAA GAC CTT TGT GTT AAC ATC AGT GTC CAT TTT ATT CAT CCC     910911  ATC TCT TAG TAA CCG TTT AAA ACT TCA TCC TGC TTG GGA CTT CGT TGA     958959  CTA TCT GTT TTG TGT TAC CCA TTC ACT TGT GAT TCA GTC TTA TTT TCT    10061007  TAG CAT CTG TAA GAC CCA TAT TAA GAA GCT GAG ACA ACA AAT CTG ACA    10541055  CAT TTC TTG GAC CAT TGA TAG ATT TTG CAG CAG TTA TAT CAG ATG CCT    11021103  GCC TAG CGG GGC CCC TTC AGT CAC AGT ATT TAC CAT GAT TTA AAG GGC    11501151  ATA TTA AGG ATG AAC AAA CAT CCT GAT GAC CAT GAA GTT AAT CCA GCA    11981199  TGG TTT GCA TAT GCA GCT TAC CAG CTT TGT CAT CTA TGG AGG AGT GCC    12461247  ACT TGG CAT TTA AAG GAG GGG AAG GAC CAT TTC CCT TTT CAG GGT AAA    12941295  CAA ATT TTA CAG TGG CTT TTA CCC AGT CCA CCA GAC TAG CTG TCC CTT    13421343  TAG GAA CAA TCT ATT GTG TGT TTG GAT CAT GTA CAA CAA TCC ATG ATT    13901391  GTT CAG TAA TAA GGT TCC TGC ATC AAC CCC AAG CAG ACT TCT TCA TTC    14381439  TGC AAC ATT CAG AAT CAA AGA TAC TGC TCC CAA GTT AGT CAC TCT CAC    14861487  AAT CTA TTT TCT TAA ATG TTT TTC AGG AAC CCG ATG AAT ACC AGT TCA    15341                      Met Phe Phe Arg Asn Pro Met Asn Thr Ser Ser      111535  CAA GGC AAG ATA ACT CCT TCA CAC ATA ACC CCT GCT TCC AGT ACT GTC    158212  Gln Gly Lys Ile Thr Pro Ser His Ile Thr Pro Ala Ser Ser Thr Val      271583  TTG GTT TTG TCA CCC ACC ATT TGG ACA ATG TTC CTG GTG GTC AAA GGC    163028  Leu Val Leu Ser Pro Thr Ile Trp Thr Met Phe Leu Val Val Lys Gly      431631  CAT AGA TAT ACT GTC TGT TTT TTT CAG CAT AAT TTT CCA TTG GGT TTA    167844  His Arg Tyr Thr Val Cys Phe Phe Gln His Asn Phe Pro Leu Gly Leu      591679  TCC TGG AGG CTA ACA GCC ATA GCT CAA GCT AAC CAA AAT CCA AGC TTT    172660  Ser Trp Arg Leu Thr Ala Ile Ala Gln Ala Asn Gln Asn Pro Ser Phe      751727  TTG AGC ATC AGG ATT TCC TTA ACA CTC TCT CTT ACT TTC ATT TTA GCT    177476  Leu Ser Ile Arg Ile Ser Leu Thr Leu Ser Leu Thr Phe Ile Leu Ala      911775  GTT TTA AAA TAC AGC AGA CTG GGC CAG GCG CAG TGG CTC ACA TTG GTA    182292  Val Leu Lys Tyr Ser Arg Leu Gly Gln Ala Gln Trp Leu Thr Leu Val     1071823  ATC CCA GTA CGT TGG GAG GCC AAG TCG GGC AGA TCA CTT GAG GCC AGG    1870108  Ile Pro Val Arg Trp Glu Ala Lys Ser Gly Arg Ser Leu Glu Ala Arg     1231871  AGT TTG AGA CCA GCC TGA CCA ACA TGG TGA AAC CCT GTC TCC ACT AAA    1918124  Ser Leu Arg Pro Ala ***                                             1291919  AAT ACA AAA AAT TAG CTT GGC TTG GTG GCA TGC GCC TGT AAT CCC AGC    19661967  TAC TTG AGG GGC TGA GGC AGG AGA ATC ACT GGA ACC CAG GAG GCA GAG    20142015  GTT GCA GTG ATC TGA GAT CAT GCC ACT GTA CTC CAG CCT GGG AGA CAC    20622063  AGC GAG ACT CCC TCT CAA AAA AAA AAA AAA AAA AAA AA                 21008. PP10897A:核苷酸序列(SEQ ID NO:22)长度:2362个碱基
  1  GCATGAATCA  GGTAAGAAGC  CAGACTGCTG  AGGCAGAGTA  GGGGGGAAGG  AGGCACAAGG
 61  GCCTTGCACT  CCAGCAAAGA  TGGTAGAGAT  GGGGAAGCAT  TCGGGCTGGA  CAGGAGAGAC
121  CCAGGTTCCA  GGCGCAGTGT  GAAGCCTCAG  CAGACCCCAG  TTTCAGAGGT  TTGAGGAAGG
181  AAAATCAACA  GACACCCCGG  GTATGAAGTA  GGGGCCAGGT  TGTGGGCTCT  GCCTCTGGGG 241  ACAGGGCAGA  TCCCTTCCTG  CTTTATTTGT  GAGCCACCTC  AACAGGACCC  AGGCCATCTG301  CAGGTACTAG  TGGCCTAGCT  GGGTAGTCTT  TCCTGAGGTC  TCACCTCAGG  CCTTTGTGCT361  GCTGCTGTTG  CTTCTGGCCT  TGAGCCTGAG  AGAGAGGTGA  GAGGAAGGAT  GCTTTCTCTA421  ACTTGGGCTC  CTCCAATCTC  TGGTTGCAAA  GCTGGGGTTG  GGGGAGAGAG  GACCACCCAA481  CCTGCCCTGT  ACAAGCATCA  GTAAGACTCC  AAGTTTCCCA  GGGCCCGAAC  ACTTGGGGGT541  TGTCTCTCAA  CACCCGGCTG  GAAGACAAGT  AGGTAACCAG  GTTCAGCCCC  ACCTGCCAAG601  AACACTGTGT  TTTGGGCCTG  GCAGAGCTGC  TACTCCCCCT  CTCCCTCCTA  AGAATGCCCA661  GAGAATCACT  TGCCAAGGCT  ACTCCTGGAG  CTCAGCTGTG  GGATCAGGGT  TTGGGCTGAG721  GATCAGGTGC  CTGTGTGCAC  ACATGTGCAC  ATTGTGTGTG  CCAATGGGTG  GTAGGGATTG781  AGCCCGTTGT  GAGAACATCC  AGCCAGGTTG  GAAGTGTGTA  CAGGTATCTG  AGGGTGTGCA841  CGTGAGCAAG  AGGGTGTGCA  AGATGTGGGT  GACTGTTGGG  ACCACAGAGC  TGAGGCCTGT901  GGTCAGCTCA  GGTCAGAACT  GGGAGGTCTG  TTTCCCTTGG  GAGGACCTGT  CTGCTCTGAG961  GGGGACCCGG  ACAAGTGCAC  ATATGCATGT  GTGTGTCTAC  ACACACACAC  ACACACACAC1021  ACACACACAC  ACACACATAT  GCTTGCCTCC  CTCTCCAAGG  CAGACTTGCC  TGGGAAGTAC1081  CCCTCCTCAG  CAGGAGCTCG  AAGACCCCTG  CCCAGTGCTG  TTTTCAGTAG  AGGGAGTGGA1141  GCTGAGATGG  GGAGACCGTA  CTGAGCGGTC  CAGGAGTAGG  GAAACAGAGC  TGCTTTGCAG1201  CTTCTGTTCC  AGAAGATGGG  GGTTGGGGGG  CGGGGTTGAG  GGCCAGGGGT  GGGAGCAGGA1261  GCAGAACAGA  AAGCCTCCCT  GCTCACTGGC  CTTTCCCCTT  CCCTCACTGG  CTGCCCATGG1321  AGCCAGGATC  AGCATGGGAA  CAATCAAGGA  GGCAGGGGCT  TATCAGTACT  ATGGACCCCT1381  ACACTGCTCT  GCCTGGTGGT  TCTTCTCTTC  GCATACCAAA  GACAGAAATT  AAGCCTCCAA1441  GAGTGGTAAC  TGACCTCGGT  CACACTTGGT  GGGTGTGGGA  AAGGATTCAA  ATGTAGGTCT1501  GTTCTCTTCT  TCATCTATCA  TGGTCCCTGT  CCTGGAGGCA  AGTCGTCTGG  GGCTCAGAAA1561  ACACCCCTGT  TGCCACTGAT  TGGAATTCCA  AGGGTCTGGG  TGAAGTGGGG  ATGGGCCTCC1621  AGCTTGCCTC  CAGCCTGAAA  AAATAGTAGA  GGGTGTTGAG  GCTGGGAAGG  GAGGTGGGGC1681  TCATGTTGTA  CAGGGCCTGA  GCCAGGGAGC  TTGGGCTTCA  TTCTGAGTAC  TGTGGCAGCC1741  CTGGGAAGGT  TTGTAGCACA  GAGGGATATT  GTCATTTTTG  GAAAGATCCC  TTTGGCTGCT1801  TAGGTAGAGA  AGGGCTTCAA  GAGGGCAGGA  AGGGACAGGA  CTACAGAAGG  GGCTGCTTCA1861  GAGTCCAGAT  TAAGGAAGGA  GAGGCCTGGG  CAGTCAGAAA  GGAAGAGAAG  CCGGATGTGG1921  TGGCTTGTAT  CTTCAATCCC  AGCACTTTGA  GAGGCCAAGG  TGGGAGGATC  ACTTGAGCCC1981  AGGAGTTCAA  AACCAGCTTG  GGCAACATAG  TGAGACTCCC  ATCTCTCCAA  AAAAATTTAA2041  AAACCAGCCA  GGTAGACTGG  GCGCAGTGGC  TCACGCCTGT  AATCCCAGAA  CTTTGGGAGG2101  CCGAGGCAGG  CAGATCACGA  GGTCAAGAGT  TAGAGACCAG  CCTGACCAAC  ATGGTGAAAC2161  CCCGTCTCTA  CTAAAAATAC  AAAACTTAGC  CAGGCCTGTG  GTGATGCGCA  CCTGTAGTCT2221  CAGCTACTCA  GGAGGCTGAG  GCAGGAGAAT  CGCTTGAACC  CGGGAGGCAG  AGGTTGCACT2281  GAGCTGAGAT  CACGCCACTG  CACTCCAGCC  TGGGCAACAG  AGTGAGACTC  CGTCTCAAAC2341  AAAAAAAAAA  AAAAAAAAAA  AAB:核苷酸序列(SEQ ID NO:23)长度:189个氨基酸
  1  MWVTVGTTEL  RPVVSSGQNW  EVCFPWEDLS  ALRGTRTSAH  MHVCVYTHTH  THTHTHTHIC
 61  LPPSPRQTCL  GSTPPQQELE  DPCPVLFSVE  GVELRWGDRT  ERSRSRETEL  LCSFCSRRWG
121  LGGGVEGQGW  EQEQNRKPPC  SLAFPLPSLA  AHGARISMGT  IKEAGAYQYY  GPLHCSAWWF
181  FSSHTKDRNC.核苷酸及氨基酸组合序列(SEQ ID NO:24)克隆号:PP10897起始编码子:863 ATG  终止编码子:1430 TAA  蛋白质分子量:21317.911    G CAT GAA TCA GGT AAG AAG CCA GAC TGC TGA GGC AGA GTA GGG GGG    4647  AAG GAG GCA CAA GGG CCT TGC ACT CCA GCA AAG ATG GTA GAG ATG GGG    9495  AAG CAT TCG GGC TGG ACA GGA GAG ACC CAG GTT CCA GGC GCA GTG TGA    142143  AGC CTC AGC AGA CCC CAG TTT CAG AGG TTT GAG GAA GGA AAA TCA ACA    190191  GAC ACC CCG GGT ATG AAG TAG GGG CCA GGT TGT GGG CTC TGC CTC TGG    238239  GGA CAG GGC AGA TCC CTT CCT GCT TTA TTT GTG AGC CAC CTC AAC AGG    286 287  ACC CAG GCC ATC TGC AGG TAC TAG TGG CCT AGC TGG GTA GTC TTT CCT     334335  GAG GTC TCA CCT CAG GCC TTT GTG CTG CTG CTG TTG CTT CTG GCC TTG     382383  AGC CTG AGA GAG AGG TGA GAG GAA GGA TGC TTT CTC TAA CTT GGG CTC     430431  CTC CAA TCT CTG GTT GCA AAG CTG GGG TTG GGG GAG AGA GGA CCA CCC     478479  AAC CTG CCC TGT ACA AGC ATC AGT AAG ACT CCA AGT TTC CCA GGG CCC     526527  GAA CAC TTG GGG GTT GTC TCT CAA CAC CCG GCT GGA AGA CAA GTA GGT     574575  AAC CAG GTT CAG CCC CAC CTG CCA AGA ACA CTG TGT TTT GGG CCT GGC     622623  AGA GCT GCT ACT CCC CCT CTC CCT CCT AAG AAT GCC CAG AGA ATC ACT     670671  TGC CAA GGC TAC TCC TGG AGC TCA GCT GTG GGA TCA GGG TTT GGG CTG     718719  AGG ATC AGG TGC CTG TGT GCA CAC ATG TGC ACA TTG TGT GTG CCA ATG     766767  GGT GGT AGG GAT TGA GCC CGT TGT GAG AAC ATC CAG CCA GGT TGG AAG     814815  TGT GTA CAG GTA TCT GAG GGT GTG CAC GTG AGC AAG AGG GTG TGC AAG     862863  ATG TGG GTG ACT GTT GGG ACC ACA GAG CTG AGG CCT GTG GTC AGC TCA     9101  Met Trp Val Thr Val Gly Thr Thr Glu Leu Arg Pro Val Val Ser Ser      16911  GGT CAG AAC TGG GAG GTC TGT TTC CCT TGG GAG GAC CTG TCT GCT CTG     95817  Gly Gln Asn Trp Glu Val Cys Phe Pro Trp Glu Asp Leu Ser Ala Leu      32959  AGG GGG ACC CGG ACA AGT GCA CAT ATG CAT GTG TGT GTC TAC ACA CAC    100633  Arg Gly Thr Arg Thr Ser Ala His Met His Val Cys Val Tyr Thr His      481007  ACA CAC ACA CAC ACA CAC ACA CAC ACA CAC ATA TGC TTG CCT CCC TCT    105449  Thr His Thr His Thr His Thr His Thr His Ile Cys Leu Pro Pro Ser      641055  CCA AGG CAG ACT TGC CTG GGA AGT ACC CCT CCT CAG CAG GAG CTC GAA    110265  Pro Arg Gln Thr Cys Leu Gly Ser Thr Pro Pro Gln Gln Glu Leu Glu      801103  GAC CCC TGC CCA GTG CTG TTT TCA GTA GAG GGA GTG GAG CTG AGA TGG    115081  Asp Pro Cys Pro Val Leu Phe Ser Val Glu Gly Val Glu Leu Arg Trp      961151  GGA GAC CGT ACT GAG CGG TCC AGG AGT AGG GAA ACA GAG CTG CTT TGC    119897  Gly Asp Arg Thr Glu Arg Ser Arg Ser Arg Glu Thr Glu Leu Leu Cys     1121199  AGC TTC TGT TCC AGA AGA TGG GGG TTG GGG GGC GGG GTT GAG GGC CAG    1246113  Ser Phe Cys Ser Arg Arg Trp Gly Leu Gly Gly Gly Val Glu Gly Gln     1281247  GGG TGG GAG CAG GAG CAG AAC AGA AAG CCT CCC TGC TCA CTG GCC TTT    1294129  Gly Trp Glu Gln Glu Gln Asn Arg Lys Pro Pro Cys Ser Leu Ala Phe     1441295  CCC CTT CCC TCA CTG GCT GCC CAT GGA GCC AGG ATC AGC ATG GGA ACA    1342145  Pro Leu Pro Ser Leu Ala Ala His Gly Ala Arg Ile Ser Met Gly Thr     1601343  ATC AAG GAG GCA GGG GCT TAT CAG TAC TAT GGA CCC CTA CAC TGC TCT    1390161  Ile Lys Glu Ala Gly Ala Tyr Gln Tyr Tyr Gly Pro Leu His Cys Ser     1761391  GCC TGG TGG TTC TTC TCT TCG CAT ACC AAA GAC AGA AAT TAA GCC TCC    1438177  Ala Trp Trp Phe Phe Ser Ser His Thr Lys Asp Arg Asn ***             1901439  AAG AGT GGT AAC TGA CCT CGG TCA CAC TTG GTG GGT GTG GGA AAG GAT    14861487  TCA AAT GTA GGT CTG TTC TCT TCT TCA TCT ATC ATG GTC CCT GTC CTG    15341535  GAG GCA AGT CGT CTG GGG CTC AGA AAA CAC CCC TGT TGC CAC TGA TTG    15821583  GAA TTC CAA GGG TCT GGG TGA AGT GGG GAT GGG CCT CCA GCT TGC CTC    16301631  CAG CCT GAA AAA ATA GTA GAG GGT GTT GAG GCT GGG AAG GGA GGT GGG    16781679  GCT CAT GTT GTA CAG GGC CTG AGC CAG GGA GCT TGG GCT TCA TTC TGA    17261727  GTA CTG TGG CAG CCC TGG GAA GGT TTG TAG CAC AGA GGG ATA TTG TCA    17741775  TTT TTG GAA AGA TCC CTT TGG CTG CTT AGG TAG AGA AGG GCT TCA AGA    18221823  GGG CAG GAA GGG ACA GGA CTA CAG AAG GGG CTG CTT CAG AGT CCA GAT    18701871  TAA GGA AGG AGA GGC CTG GGC AGT CAG AAA GGA AGA GAA GCC GGA TGT    19181919 GGT GGC TTG TAT CTT CAA TCC CAG CAC TTT GAG AGG CCA AGG TGG GAG     19661967  GAT CAC TTG AGC CCA GGA GTT CAA AAC CAG CTT GGG CAA CAT AGT GAG    20142015  ACT CCC ATC TCT CCA AAA AAA TTT AAA AAC CAG CCA GGT AGA CTG GGC    20622063  GCA GTG GCT CAC GCC TGT AAT CCC AGA ACT TTG GGA GGC CGA GGC AGG    21102111  CAG ATC ACG AGG TCA AGA GTT AGA GAC CAG CCT GAC CAA CAT GGT GAA    21582159  ACC CCG TCT CTA CTA AAA ATA CAA AAC TTA GCC AGG CCT GTG GTG ATG    22062207  CGC ACC TGT AGT CTC AGC TAC TCA GGA GGC TGA GGC AGG AGA ATC GCT    22542255  TGA ACC CGG GAG GCA GAG GTT GCA CTG AGC TGA GAT CAC GCC ACT GCA    23022303  CTC CAG CCT GGG CAA CAG AGT GAG ACT CCG TCT CAA ACA AAA AAA AAA    23502351  AAA AAA AAA AAA                                                    23629.PP10933A:核苷酸序列(SEQ ID NO:25)长度:1680个碱基1  GGGCGGGCGG  AGCGCGGGCG  CGGCGGGGGC  GGGCGGCCAG  GCTAGTCGGG  CGGGTGCGCG61  GGGCGCTCGG  GGCCCGGGGC  CAGAGCTGGA  GCCGGAGCCG  GGCGGGCGCC  ATGGAGGGGC121  TGCGGCGGGG  GCTGTCGCGC  TGGAAGCGCT  ACCACATCAA  GGTGCACCTG  GCGGACGAGG181  CGCTGCTGCT  ACCGCTGACC  GTGCGGCCGC  GGGACACGCT  CAGCGACCTG  CGCGCCCAGC241  TGGTGGGCCA  GGGCGTGAGC  TCCTGGAAGC  GCGCCTTCTA  CTACAACGCG  CGGCGGCTGG301  ACGACCACCA  GACGGTGCGC  GACGCGCGCC  TGCAGGACGG  CTCGGTGCTG  CTGCTCGTCA361  GCGACCCCAG  GTAGTCTGGG  TTGGAGGAGG  CAGAGCCATG  ACCAAGGGGA  CCTGGGTACT421  GGCTGAAGGA  ATAGGCTGGG  GTAGAGGGCA  CTTTTGGAAG  GCACTTCTCC  TGCCTCCTGG481  GAGCCTAGAT  CTCACTCCAG  GGTCTGGGCT  CCCAGGTGGA  CCATGAAACC  CTGGCCTGAC541  CAGCTGATGC  ACACTGCTTC  AGACACTCCT  GCTGGAGCCC  CAGTCCCTGA  CAAGGACCTA601  GGACATTTTT  GCTCCTGCCC  AGCCTATCGG  GAGGGAGCCT  TGAGCCTTTC  AGCTCTGCTG661  TGTGACTTTG  AGGTTGTTGC  TCCCCTCTTG  GGGCCCTGGG  TGCCCTGTCT  TCAGTGGAAA721  GCACTGTGCC  ACCTTGGAAA  GCTCCCATGG  GCAGCCAGAG  GGCATCGCAA  GAAGAGAAGC781  ACAGAAGGGG  CAGGAGAGAC  ACTCAGAGGC  ACTTCCGCTC  TTGCCCAGGA  CATTCTCCCA841  GCCACACCTT  TGCCCAAGCC  GTGCCCCCTG  CCTGGAGCAC  TTTTCAACCT  CTTCTCTGCA901  GCTCCAATAC  ACCTGGGATT  GCAGTCTCCT  CCAGGAAGTC  TTCTCAGATT  CCCTCCTTCC961  CAGCCAGAGA  GCACCTAGCC  TTCTTTGGGG  CCCCCACAGG  CCCTTTGTGC  AGTGAACAGC1021  CCTGGCTGGG  GGTGCAGCCA  GTCGTGTCCG  AACTCTCCAA  TGACTAAGCG  GGGAGATGCG1081  GACATCCTAG  CTCCTTCTCA  GGCCTCCAAC  TGTGCCCCAT  TTCCACCCCC  AAATACCTCC1141  CCAGGAGGCA  CCTGTGCCCA  CCCCCTGGGC  TGTTTCCCCC  TTCCCCTTAA  ATCCGGATGC1201  CTCGTCTTGC  ATAGGGTCTT  GGGGCAGCGG  GGAAGGGGTT  CTGAAGAACT  CTGGCCAAGA1261  GGACGAGGAT  CTGGGGGTGG  GGAACTGGGC  CTAGCTGTGG  GAGGTCATCG  CGGGGCATTG1321  CAGGGAGTGC  GTTGTGGGAA  TTCCGGGTGG  AGACCCTCAG  GGCAGTGTGC  CGGGCCTCCG1381  TTGCACCTCT  GACCTGCAGC  CACGTCATCG  TTGCGCAGCC  CCTGGGGAGG  GTCTTTGGGG1441  AGGGGGTGCC  GAGGCTACGC  ATGTCCTCGA  GGGCCGTGTA  CACTCTCCAG  GCACCATGGG1501  CGGAGGCGCC  AGAGGCTGGG  AAGAAATAAT  GTTTTAGTTA  AGAGTCCTGT  TGGCTGCAGG1561  ACTCAGAGCA  TGGACAGGTG  GATAGTAAAT  CACCACCACG  GGGAAAAAAA  AAAAAAAAAA1621  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAAB:核苷酸序列(SEQ ID NO:26)长度:151个氨基酸
  1  MKPWPDQLMH TASDTPAGAP VPDKDLGHFC SCPAYREGAL SLSALLCDFE VVAPLLGPWV
 61  PCLQWKALCH LGKLPWAARG HRKKRSTEGA GETLRGTSAL AQDILPATPL PKPCPLPGAL
121  FNLFSAAPIH LGLQSPPGSL LRFPPSQPES TC.核苷酸及氨基酸组合序列(SEQ ID NO:27)克隆号:PP10933起始编码子:523 ATG  终止编码子:976 TAG  蛋白质分子量:16073.761 GGG CGG GCG GAG CGC GGG CGC GGC GGG GGC GGG CGG CCA GGC TAG TCG    4849 GGC GGG TGC GCG GGG CGC TCG GGG CCC GGG GCC AGA GCT GGA GCC GGA    9697 GCC GGG CGG GCG CCA TGG AGG GGC TGC GGC GGG GGC TGT CGC GCT GGA   144 145  AGC GCT ACC ACA TCA AGG TGC ACC TGG CGG ACG AGG CGC TGC TGC TAC     192193  CGC TGA CCG TGC GGC CGC GGG ACA CGC TCA GCG ACC TGC GCG CCC AGC     240241  TGG TGG GCC AGG GCG TGA GCT CCT GGA AGC GCG CCT TCT ACT ACA ACG     288289  CGC GGC GGC TGG ACG ACC ACC AGA CGG TGC GCG ACG CGC GCC TGC AGG     336337  ACG GCT CGG TGC TGC TGC TCG TCA GCG ACC CCA GGT AGT CTG GGT TGG     384385  AGG AGG CAG AGC CAT GAC CAA GGG GAC CTG GGT ACT GGC TGA AGG AAT     432433  AGG CTG GGG TAG AGG GCA CTT TTG GAA GGC ACT TCT CCT GCC TCC TGG     480481  GAG CCT AGA TCT CAC TCC AGG GTC TGG GCT CCC AGG TGG ACC ATG AAA     5281                                                          Met Lys       2529  CCC TGG CCT GAC CAG CTG ATG CAC ACT GCT TCA GAC ACT CCT GCT GGA     5763  Pro Trp Pro Asp Gln Leu Met His Thr Ala Ser Asp Thr Pro Ala Gly      18577  GCC CCA GTC CCT GAC AAG GAC CTA GGA CAT TTT TGC TCC TGC CCA GCC     62419  Ala Pro Val Pro Asp Lys Asp Leu Gly His Phe Cys Ser Cys Pro Ala      34625  TAT CGG GAG GGA GCC TTG AGC CTT TCA GCT CTG CTG TGT GAG TTT GAG     67235  Tyr Arg Glu Gly Ala Leu Ser Leu Ser Ala Leu Leu Cys Asp Phe Glu      50673  GTT GTT GCT CCC CTC TTG GGG CCC TGG GTG CCC TGT CTT CAG TGG AAA     72051  Val Val Ala Pro Leu Leu Gly Pro Trp Val Pro Cys Leu Gln Trp Lys      66721  GCA CTG TGC CAC CTT GGA AAG CTC CCA TGG GCA GCC AGA GGG CAT CGC     76867  Ala Leu Cys His Leu Gly Lys Leu Pro Trp Ala Ala Arg Gly His Arg      82769  AAG AAG AGA AGC ACA GAA GGG GCA GGA GAG ACA CTC AGA GGC ACT TCC     81683  Lys Lys Arg Ser Thr Glu Gly Ala Gly Glu Thr Leu Arg Gly Thr Ser      98817  GCT CTT GCC CAG GAC ATT CTC CCA GCC ACA CCT TTG CCC AAG CCG TGC     86499  Ala Leu Ala Gln Asp Ile Leu Pro Ala Thr Pro Leu Pro Lys Pro Cys     114865  CCC CTG CCT GGA GCA CTT TTC AAC CTC TTC TCT GCA GCT CCA ATA CAC     912115  Pro Leu Pro Gly Ala Leu Phe Asn Leu Phe Ser Ala Ala Pro Ile His     130913  CTG GGA TTG CAG TCT CCT CCA GGA AGT CTT CTC AGA TTC CCT CCT TCC     960131  Leu Gly Leu Gln Ser Pro Pro Gly Ser Leu Leu Arg Phe Pro Pro Ser     146961  CAG CCA GAG AGC ACC TAG CCT TCT TTG GGG CCC CCA CAG GCC CTT TGT    1008147  Gln Pro Glu Ser Thr ***                                             1521009  GCA GTG AAC AGC CCT GGC TGG GGG TGC AGC CAG TCG TGT CCG AAC TCT    10561057  CCA ATG ACT AAG CGG GGA GAT GCG GAC ATC CTA GCT CCT TCT CAG GCC    11041105  TCC AAC TGT GCC CCA TTT CCA CCC CCA AAT ACC TCC CCA GGA GGC ACC    11521153  TGT GCC CAC CCC CTG GGC TGT TTC CCC CTT CCC CTT AAA TCC GGA TGC    12001201  CTC GTC TTG CAT AGG GTC TTG GGG CAG CGG GGA AGG GGT TCT GAA GAA    12481249  CTC TGG CCA AGA GGA CGA GGA TCT GGG GGT GGG GAA CTG GGC CTA GCT    12961297  GTG GGA GGT CAT CGC GGG GCA TTG CAG GGA GTG CGT TGT GGG AAT TCC    13441345  GGG TGG AGA CCC TCA GGG CAG TGT GCC GGG CCT CCG TTG CAC CTC TGA    13921393  CCT GCA GCC ACG TCA TCG TTG CGC AGC CCC TGG GGA GGG TCT TTG GGG    14401441  AGG GGG TGC CGA GGC TAC GCA TGT CCT CGA GGG CCG TGT ACA CTC TCC    14881489  AGG CAC CAT GGG CGG AGG CGC CAG AGG CTG GGA AGA AAT AAT GTT TTA    15361537  GTT AAG AGT CCT GTT GGC TGC AGG ACT CAG AGC ATG GAC AGG TGG ATA    15841585  GTA AAT CAC CAC CAC GGG GAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    16321633  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    168010. PP11246A:核苷酸序列(SEQ ID NO:28)长度:2059个碱基
 1 GAGCCTGAGG GACCCGGCGG CTGGTGAGCG CCCGCTGGAG GCTGGAGCTT CCGGGCCCTG
61 GAAAGGGGTC CCCGCGCGCC CCGGGTCGGA GGCAGACCCC TGGGTTTGGG GGACATGGGC 121  ATTTGGGGCG  CCTGAACCCA  AGACCTCTGG  ATGGTAGGGA  TGCCCGGGCG  TCCTGGATAC181  CCTGCGGGAC  TCGGGGCTCC  TGCGGGGAAG  ATGGCACGTT  TTACTGCCCA  AGGAGTGGTC241  AGGGGGGTGG  AGAAGCGCTG  CGGATACCCT  CAGGAGGTCT  GCGACAGAGG  GGGCTAGCTG301  CGCAGCCCAG  GAGTGGTAGT  GGCCCCCCTG  GATGACAGGC  CTGCCCGTAT  CCTCCCCCAG361  AGCTGCCCCG  TTCAGACCAT  GGATCCTGAG  GTGACCTTGC  TTGTGCAGTG  CCCTGGCGGG421  GGCCTGCCCC  AGGAGCAGAT  ACAGGCCGAG  CTGAGCCCCG  CCCATGACCG  TCGCCCACTG481  CCAGGTGGGG  ACGAGGCCAT  CACTGCCATC  TGGGAGACCC  GGCTAAAGGC  CCAACCCTGG541  CTCTTCGACG  CCCCCAAGTT  CCGCCTGCAC  TCAGCCACCC  TGGCGCCTAT  TGGCTCTCGG601  GGGCCACAGC  TGCTCCTGCG  CCTGGGCCTT  ACTTCCTACC  GAGACTTCCT  GGGCACCAAC661  TGGTCCAGCT  CAGCTGCCTG  GCTGCGACAG  CAGGGTGCCA  CCGACTGGGG  TGACACGCAG721  GCCTATCTGG  CGGACCCACT  GGGGGTGGGC  GCTGCACTAG  CCACAGCCGA  TGACTTCCTT781  GTCTTCCTGC  GCCGCTCCCG  GCAGGTGGCT  GAGGCCCCTG  GGCTGGTGGA  CGTACCTGGT841  GGGCACCCTG  AGCCTCAGGT  GAGATTCCAG  GCTGGGCACA  AAGACCCAGA  CAGCTCAAGG901  GAGCTGCAGC  TCTCCACCCT  CCCAATCCTC  CCAGCTTTGG  TTTCCCCATC  CCTTAAAGGA961  AAATTGGCCT  GGTATTTCTC  TGGAAGTTTG  CTCAGGGCAG  TCCACCTGCC  TCCCCACTGA1021  CCCCTGCCCC  AGTCCTGTGA  GAAACTAGAA  AACACGGGAG  GAAAGATTGG  GCACAGGAAG1081  AAGATGCCCT  ACTCCACCCC  TGCCCCCTGT  GTATCTCCTT  TGAAGCTGGA  CCTCTGGTTG1141  TCTGTCAGGG  AAAGGACACC  AGACTCAGGA  TCACTAACTC  TCTTACACTG  TGCCACATCA1201  GACCCTCAAG  GCCAGCAGGT  ATAGGCTTGC  TGGTCCTGAG  ATGGGGCAGG  GGGAAGAGGT1261  GGGGAGCAGG  GGCTGAGCCT  GACCTCTCAC  AGGCCCTGTG  CCCTGGTGGC  AGCCCCCAGC1321  ACCAGGACCT  CGCTGGGCAG  CTGGTGGTAC  ATGAACTCTT  TTCCAGTGTC  CTTCAGGAGA1381  TCTGTGATGA  GGTGAGTGAG  GTTGACCTGG  ACAGGGTGGT  AGACATGAAG  GGAGGGGGTA1441  GGACTTGCCA  GAATTCTACA  GGTCTGGGCT  GGCAGGAGGC  CTGCAGGCAT  CTGGCCAGCA1501  ATGAGGGAAG  AAGTTGGCTT  TGCAGCTATA  CATACTTGGA  GTGGAATTCT  AGCCGTCAGT1561  ACCCTCTGCC  TTGGATTCTT  CTTCTTTTCT  TTTTTCTTTC  TTTTTTTTTT  TTTAGACAGA1621  GTCTCGCTCT  GTTGCCCAGG  AGAATGGCGT  GAACCCGGGA  GGCGGAGGTT  GCAGTGAGCC1681  GAAATCGCGC  CACTGCACTT  CAGCCTGGGC  GACAAAGCGA  GACTCCGTCT  CAAAAAAAAG1741  AAAAAGGAGT  AAGTGTGGCA  GGGTGTGGTG  GCTCACACCT  GTAATCCCAG  CACTTTGGGA1801  GGCCAAGGGC  CAGCGGATCA  CCTGAGGTCA  GGAGTTCGAG  ACCAGCCTGG  CCAACATGGA1861  GAAACCCCAT  CTCTACTAAA  AATACAAAAA  ATTAGCCAGG  CGTTGTGGCG  TGCACCTGTA1921  ATCCCAGCTA  CTCAGGAGGC  TGAGGCAGGA  GAATCACTTT  AACCTGGGAG  GCAGAGGTTG1981  CAGTGAGCTG  AGATCGTGCC  ACTGTACTCC  AGCCTGGGCG  ACAGAGCGAG  ACTCCATCTC2041  AAAAAAAAAA  AAAAAAAAAB:核苷酸序列(SEQ ID NO:29)  长度:213个氨基酸
  1 MDPEVTLLVQ CPGGGLPQEQ IQAELSPAHD RRPLPGGDEA ITAIWETRLK AQPWLFDAPK
 61 FRLHSATLAP IGSRGPQLLL RLGLTSYRDF LGTNWSSSAA WLRQQGATDW GDTQAYLADP
121 LGVGAALATA DDFLVFLRRS RQVAEAPGLV DVPGGHPEPQ VRFQAGHKDP DSSRELQLST
181 LPILPALVSP SLKGKLAWYF SGSLLRAVHL PPHC.核苷酸及氨基酸组合序列(SEQ ID NO:30)克隆号:PP11246起始编码子:379 ATG  终止编码子:1018 TGA  蛋白质分子量:23100.941  GAG CCT GAG GGA CCC GGC GGC TGG TGA GCG CCC GCT GGA GGC TGG AGC     4849  TTC CGG GCC CTG GAA AGG GGT CCC CGC GCG CCC CGG GTC GGA GGC AGA     9697  CCC CTG GGT TTG GGG GAC ATG GGC ATT TGG GGC GCC TGA ACC CAA GAC    144145  CTC TGG ATG GTA GGG ATG CCC GGG CGT CCT GGA TAC CCT GCG GGA CTC    192193  GGG GCT CCT GCG GGG AAG ATG GCA CGT TTT ACT GCC CAA GGA GTG GTC    240241  AGG GGG GTG GAG AAG CGC TGC GGA TAC CCT CAG GAG GTC TGC GAC AGA    288289  GGG GGC TAG CTG CGC AGC CCA GGA GTG GTA GTG GCC CCC CTG GAT GAC    336337  AGG CCT GCC CGT ATC CTC CCC CAG AGC TGC CCC GTT CAG ACC ATG GAT    3841                                                          Met Asp      2 385  CCT GAG GTG ACC TTG CTT GTG CAG TGC CCT GGC GGG GGC CTG CCC CAG    4323  Pro Glu Val Thr Leu Leu Val Gln Cys Pro Gly Gly Gly Leu Pro Gln     18433  GAG CAG ATA CAG GCC GAG CTG AGC CCC GCC CAT GAC CGT CGC CCA CTG    48019  Glu Gln Ile Gln Ala Glu Leu Ser Pro Ala His Asp Arg Arg Pro Leu     34481  CCA GGT GGG GAC GAG GCC ATC ACT GCC ATC TGG GAG ACC CGG CTA AAG    52835  Pro Gly Gly Asp Glu Ala Ile Thr Ala Ile Trp Glu Thr Arg Leu Lys     50529  GCC CAA CCC TGG CTC TTC GAC GCC CCC AAG TTC CGC CTG CAC TCA GCC    57651  Ala Gln Pro Trp Leu Phe Asp Ala Pro Lys Phe Arg Leu His Ser Ala     66577  ACC CTG GCG CCT ATT GGC TCT CGG GGG CCA CAG CTG CTC CTG CGC CTG    62467  Thr Leu Ala Pro Ile Gly Ser Arg Gly Pro Gln Leu Leu Leu Arg Leu     82625  GGC CTT ACT TCC TAC CGA GAC TTC CTG GGC ACC AAC TGG TCC AGC TCA    67283  Gly Leu Thr Ser Tyr Arg Asp Phe Leu Gly Thr Asn Trp Ser Ser Ser     98673  GCT GCC TGG CTG CGA CAG CAG GGT GCC ACC GAC TGG GGT GAC ACG CAG    72099  Ala Ala Trp Leu Arg Gln Gln Gly Ala Thr Asp Trp Gly Asp Thr Gln    114721  GCC TAT CTG GCG GAC CCA CTG GGG GTG GGC GCT GCA CTA GCC ACA GCC    768115  Ala Tyr Leu Ala Asp Pro Leu Gly Val Gly Ala Ala Leu Ala Thr Ala    130769  GAT GAC TTC CTT GTC TTC CTG CGC CGC TCC CGG CAG GTG GCT GAG GCC    816131  Asp Asp Phe Leu Val Phe Leu Arg Arg Ser Arg Gln Val Ala Glu Ala    146817  CCT GGG CTG GTG GAC GTA CCT GGT GGG CAC CCT GAG CCT CAG GTG AGA    864147  Pro Gly Leu Val Asp Val Pro Gly Gly His Pro Glu Pro Gln Val Arg    162865  TTC CAG GCT GGG CAC AAA GAC CCA GAC AGC TCA AGG GAG CTG CAG CTC    912163  Phe Gln Ala Gly His Lys Asp Pro Asp Ser Ser Arg Glu Leu Gln Leu    178913  TCC ACC CTC CCA ATC CTC CCA GCT TTG GTT TCC CCA TCC CTT AAA GGA    960179  Ser Thr Leu Pro Ile Leu Pro Ala Leu Val Ser Pro Ser Leu Lys Gly    194961  AAA TTG GCC TGG TAT TTC TCT GGA AGT TTG CTC AGG GCA GTC CAC CTG   1008195  Lys Leu Ala Trp Tyr Phe Ser Gly Ser Leu Leu Arg Ala Val His Leu    2101009  CCT CCC CAC TGA CCC CTG CCC CAG TCC TGT GAG AAA CTA GAA AAC ACG   1056211  Pro Pro His ***                                                    2141057  GGA GGA AAG ATT GGG CAC AGG AAG AAG ATG CCC TAC TCC ACC CCT GCC   11041105  CCC TGT GTA TCT CCT TTG AAG CTG GAC CTC TGG TTG TCT GTC AGG GAA   11521153  AGG ACA CCA GAC TCA GGA TCA CTA ACT CTC TTA CAC TGT GCC ACA TCA   12001201  GAC CCT CAA GGC CAG CAG GTA TAG GCT TGC TGG TCC TGA GAT GGG GCA   12481249  GGG GGA AGA GGT GGG GAG CAG GGG CTG AGC CTG ACC TCT CAC AGG CCC   12961297  TGT GCC CTG GTG GCA GCC CCC AGC ACC AGG ACC TCG CTG GGC AGC TGG   13441345  TGG TAC ATG AAC TCT TTT CCA GTG TCC TTC AGG AGA TCT GTG ATG AGG   13921393  TGA GTG AGG TTG ACC TGG ACA GGG TGG TAG ACA TGA AGG GAG GGG GTA   14401441  GGA CTT GCC AGA ATT CTA CAG GTC TGG GCT GGC AGG AGG CCT GCA GGC   14881489  ATC TGG CCA GCA ATG AGG GAA GAA GTT GGC TTT GCA GCT ATA CAT ACT   15361537  TGG AGT GGA ATT CTA GCC GTC AGT ACC CTC TGC CTT GGA TTC TTC TTC   15841585  TTT TCT TTT TTC TTT CTT TTT TTT TTT TTA GAC AGA GTC TCG CTC TGT   16321633  TGC CCA GGA GAA TGG CGT GAA CCC GGG AGG CGG AGG TTG CAG TGA GCC   16801681  GAA ATC GCG CCA CTG CAC TTC AGC CTG GGC GAC AAA GCG AGA CTC CGT   17281729  CTC AAA AAA AAG AAA AAG GAG TAA GTG TGG CAG GGT GTG GTG GCT CAC   17761777  ACC TGT AAT CCC AGC ACT TTG GGA GGC CAA GGG CCA GCG GAT CAC CTG   18241825  AGG TCA GGA GTT CGA GAC CAG CCT GGC CAA CAT GGA GAA ACC CCA TCT   18721873  CTA CTA AAA ATA CAA AAA ATT AGC CAG GCG TTG TGG CGT GCA CCT GTA   19201921  ATC CCA GCT ACT CAG GAG GCT GAG GCA GGA GAA TCA CTT TAA CCT GGG   19681969   AGG CAG AGG TTG CAG TGA GCT GAG ATC GTG CCA CTG TAC TCC AGC CTG  20162017   GGC GAC AGA GCG AGA CTC CAT CTC AAA AAA AAA AAA AAA AAA A        205911.PP11347A:核苷酸序列(SEQ ID NO:31)长度:2432个碱基1  GAAACGTCTT  GCATCCTTTT  TGTCACTCAT  CAACCAGAGG  GACAGACCAG  GCCCTGGGGT61  TTGAGTGTAC  TTTGAGAGCA  GAGTGGGATG  TCCCTGTGTT  TCCCACCTGT  TTGCAGAGAC121  AGAATGGGAA  AGGGTGAGTG  TCCTAACTGC  ATGCCCAACT  CATCTCCTGC  ACTCTGCATG181  CCGAGGTGCC  CCCCGAATGC  CAGGAAGGCA  TCTGTGGCTG  GGCATGGTGG  AGCCACCTTG241  ACAGAGCGCA  GAGAGCCGTT  TCCACTAACG  CCTCCCGGTG  CTGTCCTGGT  CGGCCTGCGA301  TGGGGGTCCT  GGCTGAGCCC  AAGCAAGGGG  AGGGAGCTCA  GGGCTGACCC  CTCTGCCAGA361  GATCGGCTCT  GTGCTTGGAA  TATGGAACCC  AAAGACCTTA  ACACTGCCCT  TCTCTCTGCC421  TTCACCACTC  CAGGAGCCCG  GTGGGCACCT  ACCACATCTC  TAGTCTAGCC  AGCACGCGAG481  TCCCGAGGGT  GGGCCTGAAT  TCCTGAGCTT  GCTCTCGCGT  GCCTTTCAGG  CGATGAGAAT541  GATTTATTTG  TTTGTGATGC  ATGTTTGCTG  AAAGATTAAT  AAATCATTTC  TGTGCCTTTA601  GCAAACTTCC  TGTGTTGCTC  TTAAAAAGGG  ATCATCCACC  TTCCCGGACC  ACAAGGTTAA661  GGTAACCCCG  CTAGGTAACC  CTGATAGGCC  TGCTGCGGGG  CAGACCGACA  GAGAGAGAGA721  GAGTGAGGGC  GAGGGTGAGG  TAAGCAACGC  CCCGGGAACC  CCGGGGTCCC  TGGCTCACAT781  CTCCTCGCCA  GCTCAGGCGC  CTTCTGGGAA  AATGAATCCT  TGCATTTTTC  TGTTCTCTAA841  TATGGCTTTT  GAGGTCTTAA  ATTTGAGGAG  CCGGAATCAT  GCCTTCCTCC  TAATCTGCAG901  GGCCTCTTTG  GAGCTGCCCC  CGCCAGCAGT  GAAGGGTGCT  TGTCGGCCAG  GGCGCCTCTC961  CCCGGGCGCC  TGGCTGGAGG  TGGCTGGAGC  TGGGACGGGC  AGGGCCCTGG  CTGGGGTGGT1021  GGTTGGCAGC  TCAGCTCTCC  TCCCTTGGCT  GCCCTTGCTG  AACCCACCCC  TGACCTTTGT1081  GGGCAGCTGC  AGTGTCAGGC  GGGAGCTCGG  GGCTCTTGCT  CCAAGACTCT  TGAGCTCCCA1141  GGAAGACCTG  CCACACCGGC  ATCAGTGGCT  GCTGCTGTGG  CCACGTGAGG  TGGGGCTGTG1201  AGGGGAGGCG  GCTGCTGTGG  ATGATGCCAG  GACCCTGGGG  GCAGAGCCTC  TGAGAAGGTG1261  GGCTCCCTGG  CTGCACAGTG  TCAGGCAGAA  CCCCTGGCTG  CCTGCTGAAA  GCCCCAAGGT1321  CAGGGGCTGC  CCAGCTCCCC  GCGCTGCGGT  CTGTGGTGGC  CCCGTGCATG  CACCGGGTGG1381  CTGGCCCGCT  GAGCTTCCCC  GGCACCAGGT  GCCCTGGACC  TCGAGGTCCT  GAGCCTGACC1441  CAGGGCTGGT  CTGACCGACT  CTCTGCTTCT  GGCTCCTGGG  CACTTCTTCT  CAGCTCAGGG1501  CGTGCTCTGT  CAAAACCAAG  TCCTTTCTTG  GCTCTGTGTC  AGGCGGGGTG  TTCAGCAGGG1561  GTCACCTGGC  TCTTCTGTCT  TTGCAGGGCC  CCCTCGTGCG  CTGGCTCAAG  GTGAACTTCA1621  GTGAAGCCTT  CATTGCCTGG  ATCCACATCA  AGGCCCTGAG  AGTGTTTGTG  GAGTCCGTGC1681  TCAGGTGCGT  GGCAGTGATG  CCCCGGCTGG  GACTGTCCTG  AGGATGGGCA  GGGTCTGGGG1741  GAGCTATCGG  GGCACCCCAG  CTCCTGCCTT  CTCTCCATCC  TCCACCCGTC  TCCTTTCTGA1801  GACTGTGGCT  GTTGGCAACA  CGCTCAATTC  CGAGTCAAGT  ACACCCTCCC  CTCAGCCCTG1861  TGTCCCCTGC  TGTCTGCTCC  CTCCGTTCCT  GCTACACTTG  GGGCAAGTGT  CACCTGGGTT1921  CTCCCCAGCT  GCCCTACCTG  CATGCCCTTG  TGGACCCTCT  GGCTGGCTCC  TGTCCCCACC1981  CTCGTGAAGC  CGCAGGGCCG  AGTGGCTCCT  GGAAGGCGCT  CTCGGGCTGC  CTCCGTCCTC2041  AGCCTGGAAG  CCGCACCCCT  CAAGGCAGTC  CAGAGAGAAA  ACCAAAACCA  CACCAACAAC2101  AACAAAGCTT  ATTTTGCCTT  TTTTTTTTTT  ATTTGAGATG  GAGTTTCACT  CTTGTCGCCC2161  AGGCTAGAGT  GCAATGGCAT  GTTCCTGGCT  CACTGAAACC  TCCACCTCTC  AGGTTCAGGA2221  GATTCTCCTG  TCTCAGCCCA  CCTCTACTAA  AAATACAGAA  ATTAGCCGGG  TGTGGTGGCA2281  TGGGCCTGTA  GTACTGGCTA  CTTGGGAGGC  TGAGGTGGGA  GGATCACTTG  AGCCTCGGAG2341  CCGGAGGTTG  CAGTGAGCCG  AGATCGCGTC  ACTGCACTCG  AGCCTGGGCA  ACAAGAGAAA2401  CTCCGGCTAT  AGAAAAAAAA  AAAAAAAAAA  AAB:核苷酸序列(SEQ ID NO:32)长度:129个氨基酸
  1  MNPCIFLFSN MAFEVLNLRS RNHAFLLICR ASLELPPPAV KGACRPGRLS PGAWLEVAGA
 61  GTGRALAGVV VGSSALLPWL PLLNPPLTFV GSCSVRRELG ALAPRLLSSQ EDLPHRHQWL
121  LLWPREVGLC.核苷酸及氨基酸组合序列(SEQ ID NO:33)克隆号:PP11347起始编码子:812 ATG 终止编码子:1199 TGA  蛋白质分子量:13981.691    G AAA CGT CTT GCA TCC TTT TTG TCA CTC ATC AAC CAG AGG GAC AGA      4647  CCA GGC CCT GGG GTT TGA GTG TAC TTT GAG AGC AGA GTG GGA TGT CCC      9495  TGT GTT TCC CAC CTG TTT GCA GAG ACA GAA TGG GAA AGG GTG AGT GTC     142143  CTA ACT GCA TGC CCA ACT CAT CTC CTG CAC TCT GCA TGC CGA GGT GCC     190191  CCC CGA ATG CCA GGA AGG CAT CTG TGG CTG GGC ATG GTG GAG CCA CCT     238239  TGA CAG AGC GCA GAG AGC CGT TTC CAC TAA CGC CTC CCG GTG CTG TCC     286287  TGG TCG GCC TGC GAT GGG GGT CCT GGC TGA GCC CAA GCA AGG GGA GGG     334335  AGC TCA GGG CTG ACC CCT CTG CCA GAG ATC GGC TCT GTG CTT GGA ATA     382383  TGG AAC CCA AAG ACC TTA ACA CTG CCC TTC TCT CTG CCT TCA CCA CTC     430431  CAG GAG CCC GGT GGG CAC CTA CCA CAT CTC TAG TCT AGC CAG CAC GCG     478479  AGT CCC GAG GGT GGG CCT GAA TTC CTG AGC TTG CTC TCG CGT GCC TTT     526527  CAG GCG ATG AGA ATG ATT TAT TTG TTT GTG ATG CAT GTT TGC TGA AAG     574575  ATT AAT AAA TCA TTT CTG TGC CTT TAG CAA ACT TCC TGT GTT GCT CTT     622623  AAA AAG GGA TCA TCC ACC TTC CCG GAC CAC AAG GTT AAG GTA ACC CCG     670671  CTA GGT AAC CCT GAT AGG CCT GCT GCG GGG CAG ACC GAC AGA GAG AGA     718719  GAG AGT GAG GGC GAG GGT GAG GTA AGC AAC GCC CCG GGA ACC CCG GGG     766767  TCC CTG GCT CAC ATC TCC TCG CCA GCT CAG GCG CCT TCT GGG AAA ATG     8141                                                              Met       1815  AAT CCT TGC ATT TTT CTG TTC TCT AAT ATG GCT TTT GAG GTC TTA AAT     8622  Asn Pro Cys Ile Phe Leu Phe Ser Asn Met Ala Phe Glu Val Leu Asn      17863  TTG AGG AGC CGG AAT CAT GCC TTC CTC CTA ATC TGC AGG GCC TCT TTG     91018  Leu Arg Ser Arg Asn His Ala Phe Leu Leu Ile Cys Arg Ala Ser Leu      33911  GAG CTG CCC CCG CCA GCA GTG AAG GGT GCT TGT CGG CCA GGG CGC CTC     95834  Glu Leu Pro Pro Pro Ala Val Lys Gly Ala Cys Arg Pro Gly Arg Leu     49959  TCC CCG GGC GCC TGG CTG GAG GTG GCT GGA GCT GGG ACG GGC AGG GCC    100650  Ser Pro Gly Ala Trp Leu Glu Val Ala Gly Ala Gly Thr Gly Arg Ala      651007  CTG GCT GGG GTG GTG GTT GGC AGC TCA GCT CTC CTC CCT TGG CTG CCC    105466  Leu Ala Gly Val Val Val Gly Ser Ser Ala Leu Leu Pro Trp Leu Pro      811055  TTG CTG AAC CCA CCC CTG ACC TTT GTG GGC AGC TGC AGT GTC AGG CGG    110282  Leu Leu Asn Pro Pro Leu Thr Phe Val Gly Ser Cys Ser Val Arg Arg      971103  GAG CTC GGG GCT CTT GCT CCA AGA CTC TTG AGC TCC CAG GAA GAC CTG    115098  Glu Leu Gly Ala Leu Ala Pro Arg Leu Leu Ser Ser Gln Glu Asp Leu     1131151  CCA CAC CGG CAT CAG TGG CTG CTG CTG TGG CCA CGT GAG GTG GGG CTG    1198114  Pro His Arg His Gln Trp Leu Leu Leu Trp Pro Arg Glu Val Gly Leu     1291199  TGA GGG GAG GCG GCT GCT GTG GAT GAT GCC AGG ACC CTG GGG GCA GAG    1246130  ***                                                                 1301247  CCT CTG AGA AGG TGG GCT CCC TGG CTG CAC AGT GTC AGG CAG AAC CCC    12941295  TGG CTG CCT GCT GAA AGC CCC AAG GTC AGG GGC TGC CCA GCT CCC CGC    13421343  GCT GCG GTC TGT GGT GGC CCC GTG CAT GCA CCG GGT GGC TGG CCC GCT    13901391  GAG CTT CCC CGG CAC CAG GTG CCC TGG ACC TCG AGG TCC TGA GCC TGA    14381439  CCC AGG GCT GGT CTG ACC GAC TCT CTG CTT CTG GCT CCT GGG CAC TTC    14861487  TTC TCA GCT CAG GGC GTG CTC TGT CAA AAC CAA GTC CTT TCT TGG CTC    15341535  TGT GTC AGG CGG GGT GTT CAG CAG GGG TCA CCT GGC TCT TCT GTC TTT    15821583  GCA GGG CCC CCT CGT GCG CTG GCT CAA GGT GAA CTT CAG TGA AGC CTT    16301631  CAT TGC CTG GAT CCA CAT CAA GGC CCT GAG AGT GTT TGT GGA GTC CGT    16781679  GCT CAG GTG CGT GGC AGT GAT GCC CCG GCT GGG ACT GTC CTG AGG ATG        17261727  GGC AGG GTC TGG GGG AGC TAT CGG GGC ACC CCA GCT CCT GCC TTC TCT        17741775  CCA TCC TCC ACC CGT CTC CTT TCT GAG ACT GTG GCT GTT GGC AAC ACG        18221823  CTC AAT TCC GAG TCA AGT ACA CCC TCC CCT CAG CCC TGT GTC CCC TGC        18701871  TGT CTG CTC CCT CCG TTC CTG CTA CAC TTG GGG CAA GTG TCA CCT GGG        19181919  TTC TCC CCA GCT GCC CTA CCT GCA TGC CCT TGT GGA CCC TCT GGC TGG        19661967  CTC CTG TCC CCA CCC TCG TGA AGC CGC AGG GCC GAG TGG CTC CTG GAA        20142015  GGC GCT CTC GGG CTG CCT CCG TCC TCA GCC TGG AAG CCG CAC CCC TCA        20622063  AGG CAG TCC AGA GAG AAA ACC AAA ACC ACA CCA ACA ACA ACA AAG CTT        21102111  ATT TTG CCT TTT TTT TTT TTA TTT GAG ATG GAG TTT CAC TCT TGT CGC        21582159  CCA GGC TAG AGT GCA ATG GCA TGT TCC TGG CTC ACT GAA ACC TCC ACC        22062207  TCT CAG GTT CAG GAG ATT CTC CTG TCT CAG CCC ACC TCT ACT AAA AAT        22542255  ACA GAA ATT AGC CGG GTG TGG TGG CAT GGG CCT GTA GTA CTG GCT ACT        23022303  TGG GAG GCT GAG GTG GGA GGA TCA CTT GAG CCT CGG AGC CGG AGG TTG        23502351  CAG TGA GCC GAG ATC GCG TCA CTG CAC TCG AGC CTG GGC AAC AAG AGA        23982399  AAC TCC GGC TAT AGA AAA AAA AAA AAA AAA AAA A                          243212.PP11517A:核苷酸序列(SEQ ID NO:34)长度:2169个碱基1  GCCAGTGGGA GCAGGCGCCC CGGCCAGCGC AGACCTGGAG GCGCACGGGC GCCGCACCGC61  ACGATTCGGC TCGGGGTAGA GCGGAGCCGC AGCCCCACGC GCAGCCCAGG ACCCACTCGC121  CACCGCCGCT TCCTCAGCAC CCATGGGGAC CAGGAGACTT TAAAGGAGTT TGGGGTTTCG181  GGAGCAGGGA AATCACGGAT CCCCGCTCCT GGCCCTCGCC TCGCCACCTC ATTGATGGGC241  AACCAACTGG ACCGCATCAC CCACCTCAAC TACAGCGAGT TGCCCACAGG GGACCCGTCG301  GGGATTGAAA AGGACGAACT GCGGGTCGGG GTTGCCTACT TCTTCTCGGA TGATGAGGAA361  GACCTGGACG AACGCGGGCA GCCCGACAAG TTTGGCGTGA AGGCCCCCCC GGTTGCACCC421  CCTGCCCGGA GAGCCCCAGC CGCCACCACC ACCACCTGCT GCACCAGCTG GTCCTCAACG481  AGACTCAGTT TTCCGCCTTT CGGGGCCAGG AATGCATCTT TTCCAAAGTG AGCGGTGGCC541  CTCAGGGCGC CGACCTAAGC GTCTACGCGG TCACCGCGCT GCCAGCCGTC TGCGAACCCG601  GCGACCTGCT GGAGCTGCTG TGGCTGCAGC CCGCGCCGGA GCCGCCCGCG CCCGCCCCGC661  ACTGGGCCGT CTACGTGGGC GGCGGGCAGA TCATCCACCT GCACCAAGGC GAGATCCGCC721  AGACAAGCCG GATGAGGCGG GCGCGGCCAA CGTGGGCCGG GTGGTGAATA GCTGGTACCG781  CTACCGCCCG CTGGTGGCCG AGCTGGTGGT GCAGAACGCC TGCGGCCACC TGGGCCTCAA841  GAGCGAGGAG ATCTGCTGGA CGAACTCGGA GAGCTTCGCC GCCTGGTGCC GCTTTGGCAA901  GCGGGAGTTC AAGGCGGGAG GGGAGGTGCC GGCACGGCTA GCCCCCGCAG CAGCAGTACT961  ATCTCAAGGT GCACCTGGGA GAGAACAAGG TCCACACCGC CAGTTTCACA GCCTGGAAGA1021  CCTCATCCGC GAGAAGCGCC TGTATCGACG CCAGCGGCCG CCTGCGAGTG CTCCAGGAGC1081  TCGCCGACCT CGTGGACGAC AAGGAGTAGC CGCCTAGGGG CTGCCGGCCC CTCTGCCTCC1141  CCCGCACCTC GCTCCCTTCC CTTCCCCGCA CCCGGACTTC GCAGTCAGCG GTTCTAAACC1201  TCTGCCCCGC CCCGCCACGC GCGTCCGCCG CCGGTGGCCC GGGCCCGGGC TTGCACCCCC1261  GCATCCCCAA GCCAGCGGCA GGGAAGTCTC AGGAACTGCC CCAGGCCGAA AGGCGCCGCT1321  GCGAGCGCCT GGCTGACAGC CACAGCGGTG GTGACGGTGC TGGGAGACCC CGCGTGCGCT1381  TTCCCCTTGA GATGTAAACC GGGAACGGGG AAGGGGCTGA GGGGAGAAAG GACATGGCCT1441  TCCCCGCGAG TCCATGGCCA GTGACTGTGG CCCGACTCGA AAACAACCCT CTTCTCAAAA1501  GGGACCATCA CCGCCCCGAG CGTGCGCACA CAGACCGGTC GGAGGCGAGA ACTGGTCTCT1561  ACAGGGCACA GTTCAGCTCC TCTGTGGATG CGTCCCCAGA TCGCAGGATT TCCAAGAAAT1621  CGAGCCTGTC CCTTGTGCAC TTGGGAATAA TTCCCCAAGA CAGCACTTCG GGATTCCGGG1681  TTATCCTGAG GCTGCCCGGG ACTTTTCCAG CTCTCCAGCC CCAGGTCTCC TGACATTGTG1741  TTCCAGGCTG CGGGCTAAGC CAGACAGTGT TTGCCTCCGG TTCTTTCCAC CGTGGGAAGC1801  GAACGCCACC CCCACCCGCC TTTGCCTGCG AGTCTCCCTC GCTGGCAGAA GGGAAGCCGG1861  CCCGGTCCCG GGAGGAAGAT GGCCGCTGCG AATTCGGTGA GGACAGCCGG CCCCGCCCCC  1921  GACAAGGAGC TCGCTCGTTC ACCTGGTGTC TGGGAACTTG AATGTGTGAA GGGCGCTTAT1981  TGTTCTGAAC CCTTGATTGC TCCCTCCTCG GGCTGCATTT CAAAAATAGT CATATTTTTA2041  AAGGAGTTGG AGGAGAGGGA GGGGGAGGAC ATGGCACCAT TCCAGAAACC AGCATTGCTA2101  CAACACCATA GCCAGTATAT TTAGCTTTGG CTTTTCCTAA CATAGAAATC TTCAAAGCTG2161  GGGAAGTGGB:核苷酸序列  (SEQ ID NO:35)长度:201个氨基酸
  1 MHLFQSERWP SGRRPKRLRG HRAASRLRTR RPAGAAVAAA RAGAARARPA LGRLRGRRAD
 61 HPPAPRRDPP DKPDEAGAAN VGRVVNSWYR YRPLVAELVV QNACGHLGLK SEEICWTNSE
121 SFAAWCRFGK REFKAGGEVP ARLAPAAAVL SQGAPGREQG PHRQFHSLED LIREKRLYRR
181 QRPPASAPGA RRPRGRQGVA AC.核苷酸及氨基酸组合序列(SEQ ID NO:36)克隆号:PP11517起始编码子:512 ATG 终止编码子:1115 TAG  蛋白质分子量:22212.071    G CCA GTG GGA GCA GGC GCC CCG GCC AGC GCA GAC CTG GAG GCG CAC      4647  GGG CGC CGC ACC GCA CGA TTC GGC TCG GGG TAG AGC GGA GCC GCA GCC      9495  CCA CGC GCA GCC CAG GAC CCA CTC GCC ACC GCC GCT TCC TCA GCA CCC     142143  ATG GGG ACC AGG AGA CTT TAA AGG AGT TTG GGG TTT CGG GAG CAG GGA     190191  AAT CAC GGA TCC CCG CTC CTG GCC CTC GCC TCG CCA CCT CAT TGA TGG     238239  GCA ACC AAC TGG ACC GCA TCA CCC ACC TCA ACT ACA GCG AGT TGC CCA     286287  CAG GGG ACC CGT CGG GGA TTG AAA AGG ACG AAC TGC GGG TCG GGG TTG     334335  CCT ACT TCT TCT CGG ATG ATG AGG AAG ACC TGG ACG AAC GCG GGC AGC     382383  CCG ACA AGT TTG GCG TGA AGG CCC CCC CGG TTG CAC CCC CTG CCC GGA     430431  GAG CCC CAG CCG CCA CCA CCA CCA CCT GCT GCA CCA GCT GGT CCT CAA     478479  CGA GAC TCA GTT TTC CGC CTT TCG GGG CCA GGA ATG CAT CTT TTC CAA     5261                                              Met His Leu Phe Gln       5527  AGT GAG CGG TGG CCC TCA GGG CGC CGA CCT AAG CGT CTA CGC GGT CAC     5746  Ser Glu Arg Trp Pro Ser Gly Arg Arg Pro Lys Arg Leu Arg Gly His      21575  CGC GCT GCC AGC CGT CTG CGA ACC CGG CGA CCT GCT GGA GCT GCT GTG     62222  Arg Ala Ala Ser Arg Leu Arg Thr Arg Arg Pro Ala Gly Ala Ala Val      37623  GCT GCA GCC CGC GCC GGA GCC GCC CGC GCC CGC CCC GCA CTG GGC CGT     67038  Ala Ala Ala Arg Ala Gly Ala Ala Arg Ala Arg Pro Ala Leu Gly Arg      53671  CTA CGT GGG CGG CGG GCA GAT CAT CCA CCT GCA CCA AGG CGA GAT CCG     71854  Leu Arg Gly Arg Arg Ala Asp His Pro Pro Ala Pro Arg Arg Asp Pro      69719  CCA GAC AAG CCG GAT GAG GCG GGC GCG GCC AAC GTG GGC CGG GTG GTG     76670  Pro Asp Lys Pro Asp Glu Ala Gly Ala Ala Asn Val Gly Arg Val Val      85767  AAT AGC TGG TAC CGC TAC CGC CCG CTG GTG GCC GAG CTG GTG GTG CAG     81486  Asn Ser Trp Tyr Arg Tyr Arg Pro Leu Val Ala Glu Leu Val Val Gln     101815  AAC GCC TGC GGC CAC CTG GGC CTC AAG AGC GAG GAG ATC TGC TGG ACG     862102  Asn Ala Cys Gly His Leu Gly Leu Lys Ser Glu Glu Ile Cys Trp Thr     117863  AAC TCG GAG AGC TTC GCC GCC TGG TGC CGC TTT GGC AAG CGG GAG TTC     910118  Asn Ser Glu Ser Phe Ala Ala Trp Cys Arg Phe Gly Lys Arg Glu Phe     133911  AAG GCG GGA GGG GAG GTG CCG GCA CGG CTA GCC CCC GCA GCA GCA GTA     958134  Lys Ala Gly Gly Glu Val Pro Ala Arg Leu Ala Pro Ala Ala Ala Val     149959  CTA TCT CAA GGT GCA CCT GGG AGA GAA CAA GGT CCA CAC CGC CAG TTT    1006150  Leu Ser Gln Gly Ala Pro Gly Arg Glu Gln Gly Pro His Arg Gln Phe     1651007  CAC AGC CTG GAA GAC CTC ATC CGC GAG AAG CGC CTG TAT CGA CGC CAG    1054166  His Ser Leu Glu Asp Leu Ile Arg Glu Lys Arg Leu Tyr Arg Arg Gln     1811055  CGG CCG CCT GCG AGT GCT CCA GGA GCT CGC CGA CCT CGT GGA CGA CAA    1102182  Arg Pro Pro Ala Ser Ala Pro Gly Ala Arg Arg Pro Arg Gly Arg Gln     1971103  GGA GTA GCC GCC TAG GGG CTG CCG GCC CCT CTG CCT CCC CCG CAC CTC    1150198  Gly Val Ala Ala ***                                                 2021151  GCT CCC TTC CCT TCC CCG CAC CCG GAC TTC GCA GTC AGC GGT TCT AAA    11981199  CCT CTG CCC CGC CCC GCC ACG CGC GTC CGC CGC CGG TGG CCC GGG CCC    12461247  GGG CTT GCA CCC CCG CAT CCC CAA GCC AGC GGC AGG GAA GTC TCA GGA    12941295  ACT GCC CCA GGC CGA AAG GCG CCG CTG CGA GCG CCT GGC TGA CAG CCA    13421343  CAG CGG TGG TGA CGG TGC TGG GAG ACC CCG CGT GCG CTT TCC CCT TGA    13901391  GAT GTA AAC CGG GAA CGG GGA AGG GGC TGA GGG GAG AAA GGA CAT GGC    14381439  CTT CCC CGC GAG TCC ATG GCC AGT GAC TGT GGC CCG ACT CGA AAA CAA    14861487  CCC TCT TCT CAA AAG GGA CCA TCA CCG CCC CGA GCG TGC GCA CAC AGA    15341535  CCG GTC GGA GGC GAG AAC TGG TCT CTA CAG GGC ACA GTT CAG CTC CTC    15821583  TGT GGA TGC GTC CCC AGA TCG CAG GAT TTC CAA GAA ATC GAG CCT GTC    16301631  CCT TGT GCA CTT GGG AAT AAT TCC CCA AGA CAG CAC TTC GGG ATT CCG    16781679  GGT TAT CCT GAG GCT GCC CGG GAC TTT TCC AGC TCT CCA GCC CCA GGT    17261727  CTC CTG ACA TTG TGT TCC AGG CTG CGG GCT AAG CCA GAC AGT GTT TGC    17741775  CTC CGG TTC TTT CCA CCG TGG GAA GCG AAC GCC ACC CCC ACC CGC CTT    18221823  TGC CTG CGA GTC TCC CTC GCT GGC AGA AGG GAA GCC GGC CCG GTC CCG    18701871  GGA GGA AGA TGG CCG CTG CGA ATT CGG TGA GGA CAG CCG GCC CCG CCC    19181919  CCG ACA AGG AGC TCG CTC GTT CAC CTG GTG TCT GGG AAC TTG AAT GTG    19661967  TGA AGG GCG CTT ATT GTT CTG AAC CCT TGA TTG CTC CCT CCT CGG GCT    20142015  GCA TTT CAA AAA TAG TCA TAT TTT TAA AGG AGT TGG AGG AGA GGG AGG    20622063  GGG AGG ACA TGG CAC CAT TCC AGA AAC CAG CAT TGC TAC AAC ACC ATA    21102111  GCC AGT ATA TTT AGC TTT GGC TTT TCC TAA CAT AGA AAT CTT CAA AGC    21582159  TGG GGA AGT GG                                                     2169

Claims (10)

1.一种分离的具有促进3T3细胞转化功能的人蛋白,其特征在于,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35;
或其保守性变异多肽、或其活性片段、或其活性衍生物。
2.如权利要求1所述的多肽,其特征在于,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
3.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:
(a)编码如权利要求1和2所述多肽的多核苷酸;
(b)与多核苷酸(a)互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
  (a)用权利要求6所述的载体转化或转导的宿主细胞;
  (b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有促进3T3细胞转化功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含:
(a)在适合表达具有促进3T3细胞转化功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;
(b)从培养物中分离出具有促进3T3细胞转化功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有促进3T3细胞转化功能的人蛋白特异性结合的抗体。
10.一种核酸分子,它含有权利要求3所述的多核苷酸中连续的10-800个核苷酸。
CN01126724A 2001-09-12 2001-09-12 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 Pending CN1403476A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN01126724A CN1403476A (zh) 2001-09-12 2001-09-12 具有促进3t3细胞转化功能的新的人蛋白及其编码序列

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN01126724A CN1403476A (zh) 2001-09-12 2001-09-12 具有促进3t3细胞转化功能的新的人蛋白及其编码序列

Publications (1)

Publication Number Publication Date
CN1403476A true CN1403476A (zh) 2003-03-19

Family

ID=4666731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN01126724A Pending CN1403476A (zh) 2001-09-12 2001-09-12 具有促进3t3细胞转化功能的新的人蛋白及其编码序列

Country Status (1)

Country Link
CN (1) CN1403476A (zh)

Similar Documents

Publication Publication Date Title
Hamada et al. Isolation and characterization of a novel secretory protein, stromal cell-derived factor-2 (SDF-2) using the signal sequence trap method
US5686598A (en) Genes associated with retinal dystrophies
CN1403476A (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1343725A (zh) 人血管生成素样蛋白和编码序列及其用途
CN1313297A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN100478355C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1309135A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1351081A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1368509A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1403478A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN100478354C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1313317A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1403477A (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1368510A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1313298A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1952134A (zh) 促进人体转录因子NF-κB活化的多核苷酸及其编码多肽和用途
CN1313315A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1369505A (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN100552027C (zh) 与癌症相关的基因家族
CN1323803A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1313316A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1458169A (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1429841A (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1351079A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1368508A (zh) 具有抑癌功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication