CN1351082A - 具有促进癌细胞生长功能的新的人蛋白及其编码序列 - Google Patents

具有促进癌细胞生长功能的新的人蛋白及其编码序列 Download PDF

Info

Publication number
CN1351082A
CN1351082A CN 00127103 CN00127103A CN1351082A CN 1351082 A CN1351082 A CN 1351082A CN 00127103 CN00127103 CN 00127103 CN 00127103 A CN00127103 A CN 00127103A CN 1351082 A CN1351082 A CN 1351082A
Authority
CN
China
Prior art keywords
seq
ctg
polypeptide
sequence
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 00127103
Other languages
English (en)
Other versions
CN1155616C (zh
Inventor
顾健人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cancer Institute
Original Assignee
Shanghai Cancer Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cancer Institute filed Critical Shanghai Cancer Institute
Priority to CNB001271032A priority Critical patent/CN1155616C/zh
Publication of CN1351082A publication Critical patent/CN1351082A/zh
Application granted granted Critical
Publication of CN1155616C publication Critical patent/CN1155616C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了一类新的具有促进癌细胞生长功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有促进癌细胞生长功能的人蛋白的多核苷酸的用途。

Description

具有促进癌细胞生长功能的新的人蛋白及其编码序列
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有促进癌细胞生长功能的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究与癌细胞生长相关的人蛋白及其激动剂/抑制剂。
本发明的目的是提供一类新的具有促进癌细胞生长功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有促进癌细胞生长功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有促进癌细胞生长功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、SEQ ID NO:6、SEQID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有促进癌细胞生长功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有促进癌细胞生长功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有促进癌细胞生长功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有促进癌细胞生长功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有促进癌细胞生长功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可用于促进细胞的生长。本发明还提供了一种药物组合物,它含有安全有效量的针对本发明的具有促进癌细胞生长功能的蛋白多肽的拮抗剂(如抗体)以及药学上可接受的载体。该药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
本发明采用大规模cDNA克隆转染癌细胞,在获得具有促进癌细胞生长作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有促进癌细胞生长功能的蛋白对癌细胞(肝癌细胞)具有促进克隆形成的作用,其促进作用在50%或50%以上。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有促进癌细胞生长功能的蛋白或多肽”是指具有促进癌细胞生长功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有促进癌细胞生长功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。具有促进癌细胞生长功能的蛋白多肽的纯度能用氨基酸序列分析。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有促进癌细胞生长功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有促进癌细胞生长功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP6414蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。以PP6968蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对于其他具有促进癌细胞生长功能的蛋白,
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽(以PP6414蛋白为例)有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有促进癌细胞生长功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有促进癌细胞生长功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,MolecularClóning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有促进癌细胞生长功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有促进癌细胞生长功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或具有促进癌细胞生长功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有促进癌细胞生长功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有促进癌细胞生长功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有促进癌细胞生长功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有促进癌细胞生长功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.Molecular Cloning,a LaboratoryManual,cold Spring Harbor Laboratory.New York,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有促进癌细胞生长功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有促进癌细胞生长功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有促进癌细胞生长功能的蛋白功能的抗体、多肽或其它配体。例如,该抗体可用于治疗癌症或细胞异常增殖。用表达的重组具有促进癌细胞生长功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有促进癌细胞生长功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有促进癌细胞生长功能的人蛋白的药剂的方法。激动剂提高具有促进癌细胞生长功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有促进癌细胞生长功能的人蛋白的膜制剂与标记的具有促进癌细胞生长功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有促进癌细胞生长功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有促进癌细胞生长功能的人蛋白的拮抗剂可以与具有促进癌细胞生长功能的人蛋白结合并消除其功能,或是抑制具有促进癌细胞生长功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有促进癌细胞生长功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有促进癌细胞生长功能的蛋白加入生物分析测定中,通过测定化合物影响具有促进癌细胞生长功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有促进癌细胞生长功能的蛋白或其特异性抗体,可按有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有促进癌细胞生长功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有促进癌细胞生长功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有促进癌细胞生长功能的蛋白的无表达或异常/无活性的具有促进癌细胞生长功能的蛋白的表达所致的细胞发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有促进癌细胞生长功能的蛋白,以抑制内源性的具有促进癌细胞生长功能的蛋白活性。例如,一种变异的具有促进癌细胞生长功能的蛋白可以是缩短的、缺失了信号传导功能域的具有促进癌细胞生长功能的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有促进癌细胞生长功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有促进癌细胞生长功能的蛋白基因转移至细胞内。构建携带具有促进癌细胞生长功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有促进癌细胞生长功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有促进癌细胞生长功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。由于本发明蛋白具有促进癌细胞生长的功能,因此本发明蛋白编码序列的反义序列,可被引入细胞以抑制细胞的异常增殖(如癌变)。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有促进癌细胞生长功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗具有促进癌细胞生长功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有促进癌细胞生长功能的人蛋白。
与具有促进癌细胞生长功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有促进癌细胞生长功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有促进癌细胞生长功能的人蛋白的产生或活性,从而抑制癌细胞的生长和/或细胞的异常增殖。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有促进癌细胞生长功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭具有促进癌细胞生长功能的人蛋白阳性的细胞。
多克隆抗体的生产可用具有促进癌细胞生长功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有促进癌细胞生长功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler andMilstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.Pat No.4946778)也可用于生产抗具有促进癌细胞生长功能的人蛋白的单链抗体。
能与具有促进癌细胞生长功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有促进癌细胞生长功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有促进癌细胞生长功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有促进癌细胞生长功能的人蛋白水平,可以用作解释具有促进癌细胞生长功能的人蛋白在各种疾病中的重要性和用于诊断具有促进癌细胞生长功能的蛋白起作用的疾病。
具有促进癌细胞生长功能的蛋白的多聚核苷酸可用于具有促进癌细胞生长功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有促进癌细胞生长功能的蛋白的多聚核苷酸可用于检测具有促进癌细胞生长功能的蛋白的表达与否或在疾病状态下具有促进癌细胞生长功能的蛋白的异常表达。如具有促进癌细胞生长功能的蛋白DNA序列可用于对活检标本的杂交以判断具有促进癌细胞生长功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有促进癌细胞生长功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有促进癌细胞生长功能的蛋白的转录产物。
检测具有促进癌细胞生长功能的蛋白基因的突变也可用于诊断具有促进癌细胞生长功能的蛋白相关的疾病。具有促进癌细胞生长功能的蛋白突变的形式包括与正常野生型具有促进癌细胞生长功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。现在,只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。根据本发明,为了将这些序列与疾病相关基因相关联,其重要的第一步就是将这些DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力,被精确定位至与疾病有关的染色体区域的cDNA,可以是50至500个潜在致病基因间之一种(假定1兆碱基作图分辨能力和每20kb对应于一个基因)。
本发明的具有促进癌细胞生长功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有促进癌细胞生长功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:cDNA基因的获得及对癌细胞克隆形成的促进作用
SP2114b来自于从GIBCO BRL公司购得的肝cDNA文库(目录号:10422-012),PP6414、PP6968、PP7122、PP7157、PP7517、PP7683、PP7879、PP8376和PP10029是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系3T3。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克隆形成,计数。发现以上2个克隆有促进细胞克隆形成作用,结果如下表所示。
                  cDNA克隆转染细胞(3T3)克隆形成情况
cDNA克隆名称 cDNA克隆数(三个重复) 空载体克隆数(三个重复)
    PP6414PP6968PP7122PP7157PP7517PP7683PP7879PP8376PP10029SP2114b     24    17    1040    41    5010    44    2045    42    4971    65    5050    45    6070    50    2045    58    5347    49    5088    80    68     8    0    27    6    57    6    67    6    67    6    67    6    617   15   2114   3    716   14   1060   50   65
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28)。
实施例2:从胎盘cDNA中PCR获得全长基因:
取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表所示),按97℃3分钟、1个循环;94℃30秒→60℃30秒→72℃1分钟,共35个循环;72℃10分钟,1个循环,进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符。(注:对于SP2114b,可使用从GIBCO BRL公司购得的肝cDNA文库(目录号:10422-012)作为模板)。随后用常规技术将扩增产物转入宿主细胞,从而获得重组蛋白。
                 基因特异引物
克隆名称 特异引物1(5′→3′) 特异引物2(5′→3′)
 PP6414  TGGGTGGTCGATGGGACT  CTACCGTGCCCAGCCTAAT
 PP6968  GGCTCCATCTCTCTGTCACC  ATGGCTGCTCTTCCACCTAA
 PP7122  CAGCAAGACTGTCAGGGTGA  AGACCAACTCAGAAGGCAGC
 PP7157  CCATGGGGTGCTGCTACA  GTCCAAGGACCCCTCTCTTC
 PP7517  GGAGGTGAATAAGCTGGCTG  CAGCTGATACTGGGTGCGTA
 PP7683  GGCTGTGGCTCAACATAGAA  GACTCCATCGCAAACAAACA
 PP7879  CCCTCTGAATGAAAGCCAAG  CCACCCTGACAGTCCTGTTT
 PP8376  ACCTCGGCTTCCCAGTTTAT  GCAGAGGAGTCAATTCAGGC
 PP10029  GCTTGCTCCAATGAGGTAGG  GAAAAGACAGCGTAACCCCA
 SP2114b  AGCTCTGTCAGAACCTCCCA  GCAAGGTTTCTTCAACTGGC
实施例3:cDNA克隆序列分析
1.PP6414
A:核苷酸序列(SEQ ID NO:1)长度:1914bp1    GCCGGGGACC  ACACAGAGAA  TAACTTGTCT  GACTACCAGT  ATTCTTGGAT  GCAGAAGTGC61    TGAAGATGAG  CACACACACG  TACGGAGAAT  TTCTGGAGAA  TTCAGCTGCT  CAGAACAAGA121    ACTGAGATCC  AGAGAGATGA  TGACTTTGCC  CATAGACCAA  ACAAAGAAAT  ACATGTTTCA181    GTCCTGTGTC  CTCCTGCTAT  GTGTGTCCGG  AATTGGTGGG  TTCTTGGTCT  CACTGACTTC241    AAGAATGAAG  CTGCGGACCC  TCGCGGTGAG  TGTTACAGTT  CTTAAAGGCA  GTGTGTCCAG301    AGTTTGTTCC  TACTGATGTG  TGGATGTGTT  CGGAGTATCT  TCCTTCTGGT  GGGTTCGTGG361    TCTCGCTGGC  TCAGGAGTGA  AGCTGCAGAC  CTTCGTGGTG  AGTGTTACAG  CTCTTAAGGT421    GGTGCGTCTG  GAGTTGTTCA  TTCCTCCCAG  CGGGCTCGTG  GTCTCACTGG  CTTCAGGAGT481    GAAGCTGCAG  ACCTTCGCGG  TGAGTGTTAC  AGCTCATAAA  GGCAGCGTGG  ACCCAAAGAG541    TGAGAAGTAG  CAAGATTTAT  TGCGAAGAGC  GAAAGAACAA  AGCTTCCACG  ATGTGGAAGG601    AGACCCCAGC  AGATTGCCAC  TGCTGGCTTG  GGCAGCCTGC  TTTTATTCTC  TTATTTGGCC661    CCCACCCACA  TCCTGGTGAT  TGGTAGAGCC  CAGTGGTCTG  TTTTGACAGG  GCGCTGATTG721    GTGCGTTTAC  AATCACTGAG  CCAGATACAA  AGGTTCTCCA  GGTCCCCACT  AGATTAGCTA781    GATACAGAGT  GTCTATTGGT  GCATTCACAA  ACCCTGAGCT  AGACACAGGG  TGTTGATTGG841    TGTGTTTACA  AACCTTGAGC  TAGAGACAGA  GTGCCGATTG  GTGTATTTAC  AATCCCTGAG901    CTAGACACAA  AGGTTCTCCA  CGTCCGCACC  AGACTCAGGA  GCCCAGCTGG  CTTCACCCAG961    TGGATCCCGC  ACTGCCCCTG  CAGGTGGAGC  TGCCTGCCAG  TCCCTCGCGG  TGCGCCCGCA1021    CTCCTCAGCC  CTTGGGTGGT  CGATGGGACT  GGGCGCTGTG  GAGCAGGAGG  CGGCGCTTGC1081    TGGGGAGGCT  CCTGCGGCAC  AGGTGCCCAC  GGAGGGGGTG  GGAGGCTCAG  GCATGGCGGG1141    CTGCAGGTCC  CGAGCCCTGC  CCCTTGGGAA  GGCAGCTAGG  GCCCCGGGAG  AAATCGAGCG1201    CAGCGCCGGT  GGGTCAGCAC  TGCTGGGGGA  CCCAGTACAC  CCTCCACAGC  CACTGGCTCG1261    GGTGCTAAGC  CCCTCATTGC  CTGGGGCCGG  CAGGGCCTGC  CGGCTGCTCC  GAGTGCGGGC1321    CGCCAAGCTC  ACACCCACCC  AGAACTCCAG  CTGGCCTGCA  AGCGTCGCGT  GCAGCCCCGG1381    TTCCTGCTCG  CACCTCTCCC  TCCACACCTC  CCTGCAAGCT  GAGGGAGCCG  GCTCCGGCCT1441    TGGCAAGCCC  AGAAAGGGGC  TCCCACAGTG  CAGCGGTGGG  CTGAAGGGCT  CCTCAAGTGC1501    CGCCAAAGTG  GGAGCCCAGG  CAGAGGAGGC  ACCGAGAGCG  AGTGAGGGCT  CTGAGGACTG1561    CCAGCACGCT  GTCACCTCTC  ACTAGTAGCT  ATCCTACTTT  TAAATAAAGA  ATTAGGCTGG1621    GCACGGTAGC  TCACGCCTGT  AATCCCAGCA  CTTCGGGAGG  CCAAGGGGGG  TGGATCACCT1681    GAGGTCAGGA  ATTCGAGACC  AGCCTGGCCA  ACATGGCAAA  ACCCCATCTC  TACTAAGAAT1741    ACAAAAATTT  GCCAGGCATG  GTGGCGGGTG  CCTGTAATCC  CAGCTGCTTG  AGAGACTGAG1801    GTGGGAGAAT  CACTTGAACC  CGGGAGGCGA  AGGTTGCGGT  AAGCCGAGAT  TGCACCACGG1861    TGCTTCGGCC  TGGGCGGCAG  AGTGAGACTC  TGTTTCAAAA  AAAAAAAAAA  AAAA
B:氨基酸序列(SEQ ID NO:2)  长度:180个氨基酸1 MGLGAVEQEA ALAGEAPAAQ VPTEGVGGSG MAGCRSRALP LGKAARAPGE IERSAGGSAL61 LGDPVHPPQP LARVLSPSLP GAGRACRLLR VRAAKLTPTQ NSSWPASVAC SPGSCSHLSL121 HTSLQAEGAG SGLGKPRKGL PQCSGGLKGS SSAAKVGAQA EEAPRASEGS EDCQHAVTSH
C.核苷酸及氨基酸组合序列(SEQ ID NO:3)
克隆号:PP6414
起始编码子:1043 ATG    终止编码子:1583 TAG
蛋白质分子量:17679.871    G CCG GGG ACC ACA CAG AGA ATA ACT TGT CTG ACT ACC AGT ATT CTT      4647  GGA TGC AGA AGT GCT GAA GAT GAG CAC ACA CAC GTA CGG AGA ATT TCT      9495  GGA GAA TTC AGC TGC TCA GAA CAA GAA CTG AGA TCC AGA GAG ATG ATG     142143  ACT TTG CCC ATA GAC CAA ACA AAG AAA TAC ATG TTT CAG TCC TGT GTC     190191  CTC CTG CTA TGT GTG TCC GGA ATT GGT GGG TTC TTG GTC TCA CTG ACT     238239  TCA AGA ATG AAG CTG CGG ACC CTC GCG GTG AGT GTT ACA GTT CTT AAA     286287  GGC AGT GTG TCC AGA GTT TGT TCC TAC TGA TGT GTG GAT GTG TTC GGA     334335  GTA TCT TCC TTC TGG TGG GTT CGT GGT CTC GCT GGC TCA GGA GTG AAG     382383  CTG CAG ACC TTC GTG GTG AGT GTT ACA GCT CTT AAG GTG GTG CGT CTG     430431  GAG TTG TTC ATT CCT CCC AGC GGG CTC GTG GTC TCA CTG GCT TCA GGA     478479  GTG AAG CTG CAG ACC TTC GCG GTG AGT GTT ACA GCT CAT AAA GGC AGC     526527  GTG GAC CCA AAG AGT GAG AAG TAG CAA GAT TTA TTG CGA AGA GCG AAA     574575  GAA CAA AGC TTC CAC GAT GTG GAA GGA GAC CCC AGC AGA TTG CCA CTG     622623  CTG GCT TGG GCA GCC TGC TTT TAT TCT CTT ATT TGG CCC CCA CCC ACA     670671  TCC TGG TGA TTG GTA GAG CCC AGT GGT CTG TTT TGA CAG GGC GCT GAT     718719  TGG TGC GTT TAC AAT CAC TGA GCC AGA TAC AAA GGT TCT CCA GGT CCC     766767  CAC TAG ATT AGC TAG ATA CAG AGT GTC TAT TGG TGC ATT CAC AAA CCC     814815  TGA GCT AGA CAC AGG GTG TTG ATT GGT GTG TTT ACA AAC CTT GAG CTA     862863  GAG ACA GAG TGC CGA TTG GTG TAT TTA CAA TCC CTG AGC TAG ACA CAA     910911  AGG TTC TCC ACG TCC GCA CCA GAC TCA GGA GCC CAG CTG GCT TCA CCC     958959  AGT GGA TCC CGC ACT GCC CCT GCA GGT GGA GCT GCC TGC CAG TCC CTC    10061007  GCG GTG CGC CCG CAC TCC TCA GCC CTT GGG TGG TCG ATG GGA CTG GGC    10541                                                  Met Gly Leu Gly       41055  GCT GTG GAG CAG GAG GCG GCG CTT GCT GGG GAG GCT CCT GCG GCA CAG    11025  Ala Val Glu Gln Glu Ala Ala Leu Ala Gly Glu Ala Pro Ala Ala Gln      201103  GTG CCC ACG GAG GGG GTG GGA GGC TCA GGC ATG GCG GGC TGC AGG TCC    115021  Val Pro Thr Glu Gly Val Gly Gly Ser Gly Met Ala Gly Cys Arg Ser      361151  CGA GCC CTG CCC CTT GGG AAG GCA GCT AGG GCC CCG GGA GAA ATC GAG    119837  Arg Ala Leu Pro Leu Gly Lys Ala Ala Arg Ala Pro Gly Glu Ile Glu      521199  CGC AGC GCC GGT GGG TCA GCA CTG CTG GGG GAC CCA GTA CAC CCT CCA    124653  Arg Ser Ala Gly Gly Ser Ala Leu Leu Gly Asp Pro Val His Pro Pro      681247  CAG CCA CTG GCT CGG GTG CTA AGC CCC TCA TTG CCT GGG GCC GGC AGG    129469  Gln Pro Leu Ala Arg Val Leu Ser Pro Ser Leu Pro Gly Ala Gly Arg      841295  GCC TGC CGG CTG CTC CGA GTG CGG GCC GCC AAG CTC ACA CCC ACC CAG    134285  Ala Cys Arg Leu Leu Arg Val Arg Ala Ala Lys Leu Thr Pro Thr Gln     1001343  AAC TCC AGC TGG CCT GCA AGC GTC GCG TGC AGC CCC GGT TCC TGC TCG    1390101  Asn Ser Ser Trp Pro Ala Ser Val Ala Cys Ser Pro Gly Ser Cys Ser     1161391  CAC CTC TCC CTC CAC ACC TCC CTG CAA GCT GAG GGA GCC GGC TCC GGC    1438117  His Leu Ser Leu His Thr Ser Leu Gln Ala Glu Gly Ala Gly Ser Gly     1321439  CTT GGC AAG CCC AGA AAG GGG CTC CCA CAG TGC AGC GGT GGG CTG AAG    1486133  Leu Gly Lys Pro Arg Lys Gly Leu Pro Gln Cys Ser Gly Gly Leu Lys     1481487  GGC TCC TCA AGT GCC GCC AAA GTG GGA GCC CAG GCA GAG GAG GCA CCG    1534149  Gly Ser Ser Ser Ala Ala Lys Val Gly Ala Gln Ala Glu Glu Ala Pro     1641535  AGA GCG AGT GAG GGC TCT GAG GAC TGC CAG CAC GCT GTC ACC TCT CAC    1582165  Arg Ala Ser Glu Gly Ser Glu Asp Cys Gln His Ala Val Thr Ser His     1801583  TAG TAG CTA TCC TAC TTT TAA ATA AAG AAT TAG GCT GGG CAC GGT AGC    1630181  ***                                                                 1811631  TCA CGC CTG TAA TCC CAG CAC TTC GGG AGG CCA AGG GGG GTG GAT CAC    16781679  CTG AGG TCA GGA ATT CGA GAC CAG CCT GGC CAA CAT GGC AAA ACC CCA    17261727  TCT CTA CTA AGA ATA CAA AAA TTT GCC AGG CAT GGT GGC GGG TGC CTG    17741775  TAA TCC CAG CTG CTT GAG AGA CTG AGG TGG GAG AAT CAC TTG AAC CCG    18221823  GGA GGC GAA GGT TGC GGT AAG CCG AGA TTG CAC CAC GGT GCT TCG GCC    18701871  TGG GCG GCA GAG TGA GAC TCT GTT TCA AAA AAA AAA AAA AAA AA         1914
2.PP6968
A:核苷酸序列(SEQ ID NO:4)长度:2361bp1    GCGCTGACAG  AGGCAAAAAT  CTGCTAACTC  AGGGGGCAGA  CTCAACCAAG  ACTGTGAGCA61    GGCCTGGGGA  ATGACCCCCC  GATCTCCAAC  CAGTGCCTTC  CGCAGCTGCA  CGGCTGTCTC121    CAGCTGTCTC  TGCCCCTCTT  CCTGGCCCTG  GCTCCATCTC  TCTGTCACCT  CACCCTTCCC181    TGTGCCACAT  GGGCCCTCTC  TCTCCTGCCA  GGACGCTGCG  GCTCTGGGGA  CCTCGGAGCC241    TGGGGGTGGC  TCTGGGAGTC  TTCATGACCA  TTGGCTTTGC  ACTCCAGCTC  TTGGGAGGGC301    CCTTCCAGAG  GAGGCTACCT  GGGCTACAGC  TCCGACAGCC  CTCGGCCCCA  TCCCTACGAC361    CAGCCCTTCC  GTCCTGCCCA  CCCCGGCAGC  GACTGGTGTT  CCTGAAGACA  CATAAATCCG421    GGAGCAGCTC  TGTGCTGAGC  CTGCTTCACC  GCTATGGGGA  CCAGCACGGG  CTGCGCTTCG481    CCCTCCCTGC  CCGCTACCAG  TTTGGCTACC  CAAAGCTCTT  CCAGGCCTCT  AGGGTAAAAG541    GCTACCGCCC  ACAGGGTGGA  GGCACCCAGC  TCCCCTTCCA  CATCCTCTGT  CACCACATGA601    GGTTCAACCT  GAAAGAGGTA  CTTCAGGTCA  TGCCTTCTGA  CAGCTTCTTT  TTTTCCATTG661    TCCGAGACCC  AGCGGCTCTG  GCTCGCTCTG  CCTTCTCCTA  CTATAAATCC  ACCTCATCAG721    CCTTCCGCAA  GTCACCATCT  TTGGCTGCCT  TCCTGGCCAA  TCCTCGAGGC  TTCTACAGGC781    CTGGGGCCGT  GGGGACCACT  TACGCTCGCA  ACTTACTATG  GTTTGACTTT  GGCCTGCCCT841    TTCCCCCAGA  GAAGAGGGCC  AAGAGAGGGA  ATATTCATCC  CCCCAGAGAC  CCCAACCCCC901    CACAGCTGCA  GGTCTTGCCT  TCTGGTGCTG  GCCCTCGAGC  CCAAACCCTC  AATCCCAATG961    CCCTCATCCA  TCCTGTTTCC  ACTGTTACTG  ATCATCGCAG  CCAGATATCA  AGCCCTGCCT1021    CTTTCGATTT  GGGGTCTTCA  TCCTTCATCC  AGTGGGGTCT  GGCCTGGCTG  GACTCTGTCT1081    TTGACCTGGT  CATGGTGGCT  GAGTACTTCG  ATGAGTCATT  GGTTCTGCTG  GCAGATGCCC1141    TGTGCTGGGG  TCTAGATGAC  GTGGTGGGCT  TCATGCACAA  TGCCCAGGCT  GGACATAAGC1201    AGGGCCTCAG  CACTGTCAGC  AACAGTGGAC  TGACTGCGGA  GGACCGGCAG  CTGACTGCAC1261    GGGCCCGAGC  CTGGAACAAC  CTGGACTGGG  CTCTCTATGT  CCACTTCAAC  CGCAGTCTCT1321    GGGCACGGAT  AGAGAAATAC  GGCCAGGGCC  GGCTGCAGAC  AGCTGTGGCC  GAGCTCCGGG1381    CTCGCCGAGA  GGCCCTAGCG  AAACATTGTC  TGGTAGGGGG  TGAGGCTTCT  GACCCCAAAT1441    ACATCACTGA  TCGCCGGTTC  CGCCCCTTCC  AGTTTGGGTC  AGCTAAGGTT  TTGGGCTATA1501    TACTTCGGAG  TGGATTGAGC  CCCCAAGACC  AAGAGGAATG  TGAGCGCCTA  GCTACCCCTG1561    AGCTCCAGTA  CAAGGACAAG  CTGGATGTCA  AGCAGTTCCC  CCCTACCGTC  TCACTGCCCC1621    TCAAGACTTC  AAGGCCACTC  TCCCCATAAA  CATCAGACTA  CAGATTTAGG  TGGAAGAGCA1681    GCCATGTTTG  AAGGGCACAT  GTGATGAGTG  GGGGGCAGCA  AGATGCCATT  TCTGCATCTC1741    CCAGAAGGGA  TGAGTCTTTG  TCCCGATGCA  AGCCCCCTCT  TCGCTGGGCT  CCCAGCAGTG1801    CTTCCCTCCT  CCACCCTCCA  CTCATTTTGT  TCTTTCCCCC  CAACTTTTTT  TTTTTTTGAA1861    ACGGAGTCTT  GCTCTGTCCC  CCAGGCTGGA  GTGCAGTGGC  ATGATCTCGG  CTCACTGCAA1921    CCTCTGCCTC  CCAGGTTCAA  GCGATTCTCC  TGCCTCAGCC  TCCAGAGTAG  CTAGGATTAC1981    AGATACGTGC  CACCATACCC  GGCTAATTTT  TATATTTTTA  GAGACAGGGA  TTCAACATGT2041    TGGTTAGGCT  GGCCTTGAAC  TCCTCACCTC  AGGTGATCCA  CATGACTCTG  CCTCCCAAAG2101    TGCTGCCATT  ACAGGCGTGA  GCCACTAGGC  CTGACCTCCC  CTTCCCCTTT  CCTGCCCCAA2161    GGCAGATCCA  CATCACCGAA  GCTCCCTAGA  GGGGCAAAAG  ATGGAGTGAG  CCACAGGAAG2221    TTTGGGGCGT  GGTGAGTTGG  AATGATACGT  CCATTTCTCT  ATGAAATATT  TGCTACTAGA2281    CTGTTCATTT  CTCTCTGACA  TGTTTGTTGA  ATGAATAAAT  AATTTGAAAC  TTCAAAAAAA2341    AAAAAAAAAA  AAAAAAAAAA  A
B:氨基酸序列(SEQ ID NO:5)  长度:486个氨基酸1    MGPLSPARTL  RLWGPRSLGV  ALGVFMTIGF  ALQLLGGPFQ  RRLPGLQLRQ  PSAPSLRPAL61    PSCPPRQRLV  FLKTHKSGSS  SVLSLLHRYG  DQHGLRFALP  ARYQFGYPKL  FQASRVKGYR121    PQGGGTQLPF  HILCHHMRFN  LKEVLQVMPS  DSFFFSIVRD  PAALARSAFS  YYKSTSSAFR181    KSPSLAAFLA  NPRGFYRPGA  VGTTYARNLL  WFDFGLPFPP  EKRAKRGNIH  PPRDPNPPQL241    QVLPSGAGPR  AQTLNPNALI  HPVSTVTDHR  SQISSPASFD  LGSSSFIQWG  LAWLDSVFDL301    AMVAEYFDES  LVLLADALCW  GLDDVVGFMH  NAQAGHKQGL  STVSNSGLTA  EDRQLTARAR361    AWNNLDWALY  VHFNRSLWAR  IEKYGQGRLQ  TAVAELRARR  EALAKHCLVG  GEASDPKYIT421    DRRFRPFQFG  SAKVLGYILR  SGLSPQDQEE  CERLATPELQ  YKDKLDVKQF  PPTVSLPLKT481    SRPLSP
C.核苷酸及氨基酸组合序列(SEQ ID NO:6)
克隆号:  PP6968
起始编码子:189 ATG    终止编码子:1647 TAA
蛋白质分子量:54084.131   GC GCT GAC AGA GGC AAA AAT CTG CTA ACT CAG GGG GCA GAC TCA ACC      4748  AAG ACT GTG AGC AGG CCT GGG GAA TGA CCC CCC GAT CTC CAA CCA GTG      9596  CCT TCC GCA GCT GCA CGG CTG TCT CCA GCT GTC TCT GCC CCC CTT CCT     143144  GGC CCT GGC TCC ATC TCT CTG TCA CCT CAC CCT TCC CTG TGC CAC ATG     1911                                                              Met       1192  GGC CCT CTC TCT CCT GCC AGG ACG CTG CGG CTC TGG GGA CCT CGG AGC     2392  Gly Pro Leu Ser Pro Ala Arg Thr Leu Arg Leu Trp Gly Pro Arg Ser      17240  CTG GGG GTG GCT CTG GGA GTC TTC ATG ACC ATT GGC TTT GCA CTC CAG     28718  Leu Gly Val Ala Leu Gly Val Phe Met Thr Ile Gly Phe Ala Leu Gln      33288  CTC TTG GGA GGG CCC TTC CAG AGG AGG CTA CCT GGG CTA CAG CTC CGA     33534  Leu Leu Gly Gly Pro Phe Gln Arg Arg Leu Pro Gly Leu Gln Leu Arg      49336  CAG CCC TCG GCC CCA TCC CTA CGA CCA GCC CTT CCG TCC TGC CCA CCC     38350  Gln Pro Ser Ala Pro Ser Leu Arg Pro Ala Leu Pro Ser Cys Pro Pro      65384  CGG CAG CGA CTG GTG TTC CTG AAG ACA CAT AAA TCC GGG AGC AGC TCT     43166  Arg Gln Arg Leu Val Phe Leu Lys Thr His Lys Ser Gly Ser Ser Ser      81432  GTG CTG AGC CTG CTT CAC CGC TAT GGG GAC CAG CAC GGG CTG CGC TTC     47982  Val Leu Ser Leu Leu His Arg Tyr Gly Asp Gln His Gly Leu Arg Phe      97480  GCC CTC CCT GCC CGC TAC CAG TTT GGC TAC CCA AAG CTC TTC CAG GCC     52798  Ala Leu Pro Ala Arg Tyr Gln Phe Gly Tyr Pro Lys Leu Phe Gln Ala     113528  TCT AGG GTA AAA GGC TAC CGC CCA CAG GGT GGA GGC ACC CAG CTC CCC     575114  Ser Arg Val Lys Gly Tyr Arg Pro Gln Gly Gly Gly Thr Gln Leu Pro     129576  TTC CAC ATC CTC TGT CAC CAC ATG AGG TTC AAC CTG AAA GAG GTA CTT     623 130  Phe His Ile Leu Cys His His Met Arg Phe Asn Leu Lys Glu Val Leu     145624  CAG GTC ATG CCT TCT GAC AGC TTC TTT TTT TCC ATT GTC CGA GAC CCA     671146  Gln Val Met Pro Ser Asp Ser Phe Phe Phe Ser Ile Val Arg Asp Pro     161672  GCG GCT CTG GCT CGC TCT GCC TTC TCC TAC TAT AAA TCC ACC TCA TCA     719162  Ala Ala Leu Ala Arg Ser Ala Phe Ser Tyr Tyr Lys Ser Thr Ser Ser     177720  GCC TTC CGC AAG TCA CCA TCT TTG GCT GCC TTC CTG GCC AAT CCT CGA     767178  Ala Phe Arg Lys Ser Pro Ser Leu Ala Ala Phe Leu Ala Asn Pro Arg     193768  GGC TTC TAC AGG CCT GGG GCC GTG GGG ACC ACT TAC GCT CGC AAC TTA     815194  Gly Phe Tyr Arg Pro Gly Ala Val Gly Thr Thr Tyr Ala Arg Asn Leu     209816  CTA TGG TTT GAC TTT GGC CTG CCC TTT CCC CCA GAG AAG AGG GCC AAG     863210  Leu Trp Phe Asp Phe Gly Leu Pro Phe Pro Pro Glu Lys Arg Ala Lys     225864  AGA GGG AAT ATT CAT CCC CCC AGA GAC CCC AAC CCC CCA CAG CTG CAG     911226  Arg Gly Asn Ile His Pro Pro Arg Asp Pro Asn Pro Pro Gln Leu Gln     241912  GTC TTG CCT TCT GGT GCT GGC CCT CGA GCC CAA ACC CTC AAT CCC AAT     959242  Val Leu Pro Ser Gly Ala Gly Pro Arg Ala Gln Thr Leu Asn Pro Asn     257960  GCC CTC ATC CAT CCT GTT TCC ACT GTT ACT GAT CAT CGC AGC CAG ATA    1007258  Ala Leu Ile His Pro Val Ser Thr Val Thr Asp His Arg Ser Gln Ile     2731008  TCA AGC CCT GCC TCT TTC GAT TTG GGG TCT TCA TCC TTC ATC CAG TGG    1055274  Ser Ser Pro Ala Ser Phe Asp Leu Gly Ser Ser Ser Phe Ile Gln Trp     2891056  GGT CTG GCC TGG CTG GAC TCT GTC TTT GAC CTG GTC ATG GTG GCT GAG    1103290  Gly Leu Ala Trp Leu Asp Ser Val Phe Asp Leu Val Met Val Ala Glu     3051104  TAC TTC GAT GAG TCA TTG GTT CTG CTG GCA GAT GCC CTG TGC TGG GGT    1151306  Tyr Phe Asp Glu Ser Leu Val Leu Leu Ala Asp Ala Leu Cys Trp Gly     3211152  CTA GAT GAC GTG GTG GGC TTC ATG CAC AAT GCC CAG GCT GGA CAT AAG    1199322  Leu Asp Asp Val Val Gly Phe Met His Asn Ala Gln Ala Gly His Lys     3371200  CAG GGC CTC AGC ACT GTC AGC AAC AGT GGA CTG ACT GCG GAG GAC CGG    1247338  Gln Gly Leu Ser Thr Val Ser Asn Ser Gly Leu Thr Ala Glu Asp Arg     3531248  CAG CTG ACT GCA CGG GCC CGA GCC TGG AAC AAC CTG GAC TGG GCT CTC    1295354  Gln Leu Thr Ala Arg Ala Arg Ala Trp Asn Asn Leu Asp Trp Ala Leu     3691296  TAT GTC CAC TTC AAC CGC AGT CTC TGG GCA CGG ATA GAG AAA TAC GGC    1343370  Tyr Val His Phe Asn Arg Ser Leu Trp Ala Arg Ile Glu Lys Tyr Gly     3851344  CAG GGC CGG CTG CAG ACA GCT GTG GCC GAG CTC CGG GCT CGC CGA GAG    1391386  Gln Gly Arg Leu Gln Thr Ala Val Ala Glu Leu Arg Ala Arg Arg Glu     4011392  GCC CTA GCG AAA CAT TGT CTG GTA GGG GGT GAG GCT TCT GAC CCC AAA    1439402  Ala Leu Ala Lys His Cys Leu Val Gly Gly Glu Ala Ser Asp Pro Lys     4171440  TAC ATC ACT GAT CGC CGG TTC CGC CCC TTC CAG TTT GGG TCA GCT AAG     1487418  Tyr Ile Thr Asp Arg Arg Phe Arg Pro Phe Gln Phe Gly Ser Ala Lys      4331488  GTT TTG GGC TAT ATA CTT CGG AGT GGA TTG AGC CCC CAA GAC CAA GAG     1535434  Val Leu Gly Tyr Ile Leu Arg Ser Gly Leu Ser Pro Gln Asp Gln Glu      4491536  GAA TGT GAG CGC CTA GCT ACC CCT GAG CTC CAG TAC AAG GAC AAG CTG     1583450  Glu Cys Glu Arg Leu Ala Thr Pro Glu Leu Gln Tyr Lys Asp Lys Leu      4651584  GAT GTC AAG CAG TTC CCC CCT ACC GTC TCA CTG CCC CTC AAG ACT TCA     1631466  Asp Val Lys Gln Phe Pro Pro Thr Val Ser Leu Pro Leu Lys Thr Ser      4811632  AGG CCA CTC TCC CCA TAA ACA TCA GAC TAC AGA TTT AGG TGG AAG AGC     1679482  Arg Pro Leu Ser Pro ***                                              4871680  AGC CAT GTT TGA AGG GCA CAT GTG ATG AGT GGG GGG CAG CAA GAT GCC     17271728  ATT TCT GCA TCT CCC AGA AGG GAT GAG TCT TTG TCC CGA TGC ACG CCC     17751776  CCT CTT CGC TGG GCT CCC AGC AGT GCT TCC CTC CTC CAC CCT CCA CTC     18231824  ATT TTG TTC TTT CCC CCC AAC TTT TTT TTT TTT TGA AAC GGA GGTC TTG    18711872  CTC TGT CCC CCA GGC TGG AGT GCA GTG GCA TGA TCT CGG CTC ACT GCA     19191920  ACC TCT GCC TCC CAG GTT CAA GCG ATT CTC CTG CCT CAG CCT CCA GAG     19671968  TAG CTA GGA TTA CAG ATA CGT GCC ACC ATA CCC GGC TAA TTT TTA TAT     20152016  TTT TAG AGA CAG GGA TTC AAC ATG TTG GTT AGG CTG GCC TTG AAC TCC     20632064  TCA CCT CAG GTG ATC CAC ATG ACT CTG CCT CCC AAA GTG CTG CCA TTA     21112112  CAG GCG TGA GCC ACT AGG CCT GAC CTC CCC TTC CCC TTT CCT GCC CCA     21592160  AGG CAG ATC CAC ATC ACC GAA GCT CCC TAG AGG GGC AAA AGA TGG AGT     22072208  GAG CCA CAG GAA GTT TGG GGC GTG GTG AGT TGG AAT GAT ACG TCC ATT     22552256  TCT CTA TGA AAT ATT TGC TAC TAG ACT GTT CAT TTC TCT CTG ACA TGT     23032304  TTG TTG AAT GAA TAA ATA ATT TGA AAC TTC AAA AAA AAA AAA AAA AAA     23512352  AAA AAA AAA A                                                       2361
 3.PP7122
 A:核苷酸序列(SEQ ID NO:7)长度:1987bp1  GGTACATTTG  CCCAGCTTCC  CTGCCAGCCT  TTAACCCCAG  GAACCTCTCA  GTCTACCTCC61  TCTTTTCTGC  CTCTGAATCC  CTACCTTTAA  AGTCAGAACA  GGCCAGGCCC  GGTGGCTCAC121  GCCTGTAATC  CCAGCACTTT  GGGAGGCTGA  GGTGGGTGGA  TCACTTGACA  TCAGTAGTTC181  AAGACCAGCC  TGGCCAACAT  GGTGAAACCC  CATCCTTACT  AAAAATACAA  AAATTAGCCA241  GGTGTGGTGG  CGGGCACCTG  TAATCCCAGC  TACTCAGGAG  GCTGAGGCAG  GAGAATCACT301  TGAACCCAGG  AGGCAGAGTT  TGCAGTCAGC  CAAGATCACG  CCACTGTACT  CCAGCCTGGA361  TGACACAGCG  AGACTCCGTC  TCAAAATAAA  TAAATAAAAA  TAAAGTCAGA  ACACCTGGCT421  TAATAGGCCT  CACTGTGCAG  ATGAGGAAAC  TGAGGCCCAG  GGAGGAAGAG  CGATCTGTGG481  AGATATTTCT  AGAACCCCTG  CAAGCTGACC  CCAGTGAAGG  AGAGAAGGTC  CAGTAGGAGC541  TTGCTAAGCT  CAAAATCGAA  GAAAGGTTCA  GCAAGACTGT  CAGGGTGACC  TCAAAGCAAT601  GGCAGCCATC  AGAGGAGCCC  CATTGCTATT  AGGAGGCTCC  TATTGCCCTC  CCCTTCAGCC661  TCTGACTTTC  ACCTGTGCTA  CCCAATTCTG  GTTCCTTCAC  TCCCATTCAA  AAATGGACCC721  CAGAAAAGCC  TTATTTTGTG  GAGTACCTAG  TTCCCTTTTG  GGTTTGTCTC  TTGACTGCTA781  CGGGCATTGC  CCCAGGGCAA  CCATGACAGT  GAAGATGACT  GGCCAAGCTT  GTGGACTGGC841  CAGCAAGCTT  GGGCTGCCTG  AGACGCTTTG  AAATGGCTGC  CTTCTGAGTT  GGTCTTGAGG901  GTGAAGACTG  ACCACCCTTC  TCACCTGCAC  AGTCACAGTC  CCTCTCCTGC  TGGCCTGACT961  GCAGCTGTCC  TCCCAGCTGG  CCACCTGACC  AGAGACCAGG  AGAGAGGCCA  CAGCCTCCAG1021  ACCCTCCAGA  GTCCCACGGA  GGAAGAAGGC  TTACCAGAGA  GACCCTCTGA  TGCATGAGCC1081  AGGCCCCAGC  CCTTCTCCCT  GCATCCAGGT  GTGTTTCCAC  CGCAAAATGC  CTCCACACAA1141    TGAGCGACTT  TGGCCCTGCG  TGGGTCAGCA  TGTGGTCTGA  GGTAACCCTC  AAATGCCTCC1201    ACCACACATC  TGTCCACCTG  CACGGGTTCA  AGGTGAGCAC  TTGCCCCCTT  CTCTCCTCCA1261    GACCAGTCGC  CTGAAATTCT  GAGCAACATT  CCTTCAAGAC  TATCATGTAA  CCCTTGGTGA1321    TGCTGAGTCC  AGACAGGAAA  TGCAGACTTG  GGACCCACCT  GTATCAGCAG  AAAGAGGCCT1381    TGTGCCCCGT  TTGTCCGAGT  CCCAGAACGG  AGCAAATGAG  AAAACCGGCG  AGCTGTCCCC1441    CGAGGAGCTG  TAGGGAGATT  GGTTTTTAGT  ATAAATTACA  ATAAAATTTT  GTGTATGTGT1501    ACAGCTGTGT  TCACATCCAC  AGTGTAAGCT  GTGATATGGT  TTGGATGTTT  GTCCCCTCCA1561    AATCTCATGT  TGAAATGTGA  TCCCCAGCAT  TGGAGGTGGG  GCCTGATGGG  AGGTGATTGG1621    GTGATGGGGG  AAGTTGCCTC  ATGAATGACT  TGGTGCCCTC  CTGGAAGTGA  TGAGTGAGTT1681    CTCGCTGAGC  TCACTCAAGA  TGTGGTTGTT  TAAAAGAGTG  TGGCACGTCC  CTCCCCCAAC1741    TCTCCCTCTC  ACTCCCGCTC  TCACCATGTG  ACACACCTGC  TCCCCCTTCA  CCTTCCACCA1801    TGATTGGAAG  CTTCCTGAAG  CCCTTACCAG  AAGCAGATGC  CAGCCCCACA  CTTCCTGTAC1861    CACCTGCAGA  ACCATAAACC  AAAATAAAGC  TCTTTTCTTT  ATCAATTAAAA AAAAAAAAAA1921    AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAAA AAAAAAAAAA1981    AAAAAAAB:氨基酸序列(SEQ ID NO:8)  长度:90个氨基酸1 MAAIRGAPLL LGGSYCPPLQ PLTFTCATQF WFLHSHSKCMD PRKALFCGVP SSLLGLSLDC61 YGHCPRATMT VKMTGQACGL ASKLGLPETLC.核苷酸及氨基酸组合序列(SEQ ID NO:9)克隆号:    PP7122起始编码子:599 ATG    终止编码子:869 TGA蛋白质分子量:9583.881    G GTA CAT TTG CCC AGC TTC CCT GCC AGC CTT TAA CCC CAG GAA CCT      4647  CTC AGT CTA CCT CCT CTT TTC TGC CTC TGA ATC CCT ACC TTT AAA GTC      9495  AGA ACA GGC CAG GCC CGG TGG CTC ACG CCT GTA ATC CCA GCA CTT TGG     142143  GAG GCT GAG GTG GGT GGA TCA CTT GAC ATC AGT AGT TCA AGA CCA GCC     190191  TGG CCA ACA TGG TGA AAC CCC ATC CTT ACT AAA AAT ACA AAA ATT AGC     238239  CAG GTG TGG TGG CGG GCA CCT GTA ATC CCA GCT ACT CAG GAG GCT GAG     286287  GCA GGA GAA TCA CTT GAA CCC AGG AGG CAG AGT TTG CAG TCA GCC AAG     334335  ATC ACG CCA CTG TAC TCC AGC CTG GAT GAC ACA GCG AGA CTC CGT CTC     382383  AAA ATA AAT AAA TAA AAA TAA AGT CAG AAC ACC TGG CTT AAT AGG CCT     430431  CAC TGT GCA GAT GAG GAA ACT GAG GCC CAG GGA GGA AGA GCG ATC TGT     478479  GGA GAT ATT TCT AGA ACC CCT GCA AGC TGA CCC CAG TGA AGG AGA GAA     526527  GGT CCA GTA GGA GCT TGC TAA GCT CAA AAT CGA AGA AAG GTT CAG CAA     574575  GAC TGT CAG GGT GAC CTC AAA GCA ATG GCA GCC ATC AGA GGA GCC CCA     6221                                  Met Ala Ala Ile Arg Gly Ala Pro       8623  TTG CTA TTA GGA GGC TCC TAT TGC CCT CCC CTT CAG CCT CTG ACT TTC     6709  Leu Leu Leu Gly Gly Ser Tyr Cys Pro Pro Leu Gln Pro Leu Thr Phe      24671  ACC TGT GCT ACC CAA TTC TGG TTC CTT CAC TCC CAT TCA AAA ATG GAC     71825  Thr Cys Ala Thr Gln Phe Trp Phe Leu His Ser His Ser Lys Met Asp      40719  CCC AGA AAA GCC TTA TTT TGT GGA GTA CCT AGT TCC CTT TTG GGT TTG     76641  Pro Arg Lys Ala Leu Phe Cys Gly Val Pro Ser Ser Leu Leu Gly Leu      56767  TCT CTT GAC TGC TAC GGG CAT TGC CCC AGG GCA ACC ATG ACA GTG AAG     81457  Ser Leu Asp Cys Tyr Gly His Cys Pro Arg Ala Thr Met Thr Val Lys      72815  ATG ACT GGC CAA GCT TGT GGA CTG GCC AGC AAG CTT GGG CTG CCT GAG     86273  Met Thr Gly Gln Ala Cys Gly Leu Ala Ser Lys Leu Gly Leu Pro Glu      88 863  ACG CTT TGA AAT GGC TGC CTT CTG AGT TGG TCT TGA GGG TGA AGA CTG     91089  Thr Leu ***                                                          91911  ACC ACC CTT CTC ACC TGC ACA GTC ACA GTC CCT CTC CTG CTG GCC TGA     958959  CTG CAG CTG TCC TCC CAG CCG GCC ACC TGA CCA GAG ACC AGG AGA GAG    10061007  GCC ACA GCC TCC AGA CCC TCC AGA GTC CCA CGG AGG AAG AAG GCT TAG    10541055  CAG AGA GAC CCT CTG ATG CAT GAG CCA GGC CCC AGC CCT TCT CCC TGC    11021103  ATC CAG GTG TGT TTC CAC CGC AAA ATG CCT CCA CAC AAT GAG CGA CTT    11501151  TGG CCC TGC GTG GGT CAG CAT GTG GTC TGA GGT AAC CCT CAA ATG CCT    11981199  CCA CCA CAC ATC TGT CCA CCT GCA CGG GTT CAA GGT GAG CAC TTG CCC    12461247  CCT TCT CTC CTC CAG ACC AGT CGC CTG AAA TTC TGA GCA ACA TTC CTT    12941295  CAA GAC TAT CAT GTA ACC CTT GGT GAT GCT GAG TCC AGA CAG GAA ATG    13421343  CAG ACT TGG GAC CCA CCT GTA TCA GCA GAA AGA GGC CTT GTG CCC CGT    13901391  TTG TCC GAG TCC CAG AAC GGA GCA AAT GAG AAA ACC GGC GAG CTG TCC    14381439  CCC GAG GAG CTG TAG GGA GAT TGG TTT TTA GTA TAA ATT ACA ATA AAA    14861487  TTT TGT GTA TGT GTA CAG CTG TGT TCA CAT CCA CAG TGT AAG CTG TGA    15341535  TAT GGT TTG GAT GTT TGT CCC CTC CAA ATC TCA TGT TGA AAT GTG ATC    15821583  CCC AGC ATT GGA GGT GGG GCC TGA TGG GAG GTG ATT GGG TGA TGG GGG    16301631  AAG TTG CCT CAT GAA TGA CTT GGT GCC CTC CTG GAA GTG ATG AGT GAG    16781679  TTC TCG CTG AGC TCA CTC AAG ATG TGG TTG TTT AAA AGA GTG TGG CAC    17261727  GTC CCT CCC CCA ACT CTC CCT CTC ACT CCC GCT CTC ACC ATG TGA CAC    17741775  ACC TGC TCC CCC TTC ACC TTC CAC CAT GAT TGG AAG CTT CCT GAA GCC    18221823  CTT ACC AGA AGC AGA TGC CAG CCC CAC ACT TCC TGT ACC ACC TGC AGA    18701871  ACC ATA AAC CAA AAT AAA GCT CTT TTC TTT ATC AAT TAA AAA AAA AAA    19181919  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    19661967  AAA AAA AAA AAA AAA AAA AAA                                        19874.PP7157A:核苷酸序列(SEQ ID NO:10)长度:1017bp1  GCACGGACGC CGTCCCTCCT CGGCGCGGCC TGAGCGCCCG GCCCGACCCC GGCCATGGGG61  TGCTGCTACA GCAGCGAGAA CGAGGACTCG GACCAGGACC GAGAGGAGCG GAAGCTGCTG121  CTGGACCCTA GCAGCCCCCC TACCAAAGCT CTCAATGGAG CCGAGCCCAA CTACCACAGC181  CTGCCTTCCG CTCGCACTGA TGAGCAGGCC CTGCTCTCTT CCATCCTTGC CAGGACAGCC241  AGCAACATCA TTGATGTGTC TGCTGCAGAC TCACAGGGCA TGGAGCAGCA TGAGTACATG301  GACCGTGCCA GGCAGTACAG CACCCGCTTG GCTGTGCTGA GCAGCAGCCT GACCCATTGG361  AAGAAGCTGC CACCGCTGCC GTCTCTTACC AGCCAGCCCC ACCAAGTGCT GGCCAGTGAG421  CCCATCCCGT TCTCTGATTT GCAGCAGGTC TCCAGGATAG CTGCTTATGC CTACAGTGCA481  CTTTCTCAGA TCCGTGTGGA CGCAAAAGAG GAGCTGGTTG TACAGTTTGG GATCCCATGA541  AGAGAGGGGT CCTTGGACAG CTCTTCTCCT CTCTTCATCC CATCTCTACC CCACCCCCTT601  GGCCCCCAGC CTCACTGCGG CTTATACAGT ACCCTAACCT GCTACTAATC ACAGAGAAAA661  ATGTGAAGAA GGAGGAGAAG AGGAAGGCTA GAAGCCTGAG CAAGTGAGGG TAGAACCTTT721  TGGGACTGGC CTTTGAAGCT CTGGCCAGGG ATGGGGTTGG GGCCAAAAGG ACAGAGCCTG781  GTATGTCTTC ATAGTCATTG AGAATGTGGA GATACCAGTT TGGGTGGGGG GTGATCACCA841  GGGGACCTAG GGAGATCCCC TTCCCACCCT CTCTGTTGGC CTCAGAGTCA CTCCTGCCCC901  CCCTCCCTGA CTTGGTGCTC ACATGCACCC CACTAGGGTT TGTGACCAGG GTCTGGATGA961  GCTTGAATTT GAATGAATTG AGTTTGTATT TCTAGAAAAA AAAAAAAAAA AAAAAAAB:氨基酸序列(SEQ ID NO:11)  长度:161个氨基酸1    MGCCYSSENE  DSDQDREERK  LLLDPSSPPT  KALNGAEPNY  HSLPSARTDE  QALLSSILAR61    TASNIIDVSA  ADSQGMEQHE  YMDRARQYST  RLAVLSSSLT  HWKKLPPLPS  LTSQPHQVLA121    SEPIPFSDLQ  QVSRIAAYAY  SALSQIRVDA  KEELVVQFGI  PC.核苷酸及氨基酸组合序列(SEQ ID NO:12)克隆号:PP7157起始编码子:55 ATG    终止编码子:538 TGA蛋白质分子量:17771.811  GCA CGG ACG CCG TCC CTC CTC GGC GCG GCC TGA GCG CCC GGC CCG ACC      4849  CCG GCC ATG GGG TGC TGC TAC AGC AGC GAG AAC GAG GAC TCG GAC CAG      961          Met Gly Cys Cys Tyr Ser Ser Glu Asn Glu Asp Ser Asp Gln      1497  GAC CGA GAG GAG CGG AAG CTG CTG CTG GAC CCT AGC AGC CCC CCT ACC     14415  Asp Arg Glu Glu Arg Lys Leu Leu Leu Asp Pro Ser Ser Pro Pro Thr      30145  AAA GCT CTC AAT GGA GCC GAG CCC AAC TAC CAC AGC CTG CCT TCC GCT     19231  Lys Ala Leu Asn Gly Ala Glu Pro Asn Tyr His Ser Leu Pro Ser Ala      46193  CGC ACT GAT GAG CAG GCC CTG CTC TCT TCC ATC CTT GCC AGG ACA GCC     24047  Arg Thr Asp Glu Gln Ala Leu Leu Ser Ser Ile Leu Ala Arg Thr Ala      62241  AGC AAC ATC ATT GAT GTG TCT GCT GCA GAC TCA CAG GGC ATG GAG CAG     28863  Ser Asn Ile Ile Asp Val Ser Ala Ala Asp Ser Gln Gly Met Glu Gln      78289  CAT GAG TAC ATG GAC CGT GCC AGG CAG TAC AGC ACC CGC TTG GCT GTG     33679  His Glu Tyr Met Asp Arg Ala Arg Gln Tyr Ser Thr Arg Leu Ala Val      94337  CTG AGC AGC AGC CTG ACC CAT TGG AAG AAG CTG CCA CCG CTG CCG TCT     38495  Leu Ser Ser Ser Leu Thr His Trp Lys Lys Leu Pro Pro Leu Pro Ser     110385  CTT ACC AGC CAG CCC CAC CAA GTG CTG GCC AGT GAG CCC ATC CCG TTC     432111  Leu Thr Ser Gln Pro His Gln Val Leu Ala Ser Glu Pro Ile Pro Phe     126433  TCT GAT TTG CAG CAG GTC TCC AGG ATA GCT GCT TAT GCC TAC AGT GCA     480127  Ser Asp Leu Gln Gln Val Ser Arg Ile Ala Ala Tyr Ala Tyr Ser Ala     142481  CTT TCT CAG ATC CGT GTG GAC GCA AAA GAG GAG CTG GTT GTA CAG TTT     528143  Leu Ser Gln Ile Arg Val Asp Ala Lys Glu Glu Leu Val Val Gln Phe     158529  GGG ATC CCA TGA AGA GAG GGG TCC TTG GAC AGC TCT TCT CCT CTC TTC     576159  Gly Ile Pro ***                                                     162577  ATC CCA TCT CTA CCC CAC CCC CTT GGC CCC CAG CCT CAC TGC GGC TTA     624625  TAC AGT ACC CTA ACC TGC TAC TAA TCA CAG AGA AAA ATG TGA AGA AGG     672673  AGG AGA AGA GGA AGG CTA GAA GCC TGA GCA AGT GAG GGT AGA ACC TTT     720721  TGG GAC TGG CCT TTG AAG CTC TGG CCA GGG ATG GGG TGG GGG CCA AAA     768769  GGA CAG AGC CTG GTA TGT CTT CAT AGT CAT TGA GAA TGT GGA GAT ACC     816817  AGT TTG GGT GGG GGG TGA TCA CCA GGG GAC CTA GGG AGA TCC CCT TCC     864865  CAC CCT CTC TGT TGG CCT CAG AGT CAC TCC TGC CCC CTC TCC CTG ACT     912913  TGG TGC TCA CAT GCA CCT CAC TAG GGT TTG TGA CCA GGG TCT GGA TGA     960961  GCT TGA ATT TGA ATG AAT TGA GTT TGT ATT TCT AGA AAA AAA AAA AAA    10081009  AAA AAA AAA                                                        10175.PP7517A:核苷酸序列(SEQ ID NO:13)长度:2712bp   1  GTTCACGGCA  ACAGCATCCA  GCGCCTGGGG  GAGGTGAATA  AGCTGGCTGT  CCTTCCTCGG61  CTCCGTAGCC  TGACACTCCA  TGGGAACCCC  ATGGAGGAAG  AGAAAGGGTA  TAGCAGGCCC121  TGGACTCCCC  GACCTGTCCT  GTGCTCTGGT  CCTCCAGCCC  AGCCTCCGAG  ACTGCCTGTC181  AGGGCTGCGG  ATCGAGGAGC  GGGCCTTCAG  CTACGTGCTC  ACCCATGCCC  TGCCCGGTGA241  CCCTGGTCAC  ATCCTCACCA  CCCTGGACCA  CTGGAGCAGC  CGCTGCGAGT  ACTTGAGCCA301  CATGGGGCCT  GTCAAAGGTC  AGATCCTGAT  GCGGCTGGTG  GAGGAGAAGC  CCCTGCTTGT361  GTGCTGGAAT  TGGGAACCTA  CTGTGGATAC  TCTACCCTGC  TTATTGCCCG  AGCCCTGCCC421  CCTGGGGGTC  GCCTTCTTAC  TGTGGAGCGG  GACCCACGCA  CGGCAGCAGT  GGCTGAAAAA481  CTCATCCGCC  TGGCCGGCTT  TGATGAGCAC  ATGGTGGAGC  TCATCGTGGG  CAGCTCAGAG541  GACGTGATCC  CGTGCCTACG  CACCCAGTAT  CAGCTGAGTC  GGGCAGACCT  GGTGCTCCTG601  GCACACCGGC  CACGATGTTA  CCTGAGGGAC  CTGCAGCTGC  TGGAGGCCCA  TGCCCTACTG661  CCAGCAGGTG  CCACCGTGCT  GGCTGACCAT  GTGCTCTTCC  CTGGTGCACC  CCGCTTCTTG721  CAGTATGCTA  AGAGCTGTGG  CCGCTACCGC  TGCCGCCTCC  ACCACACTGG  CCTTCCAGAC781  TTCCCTGCCA  TCAAGGATGG  AATAGCTCAG  CTCACCTATG  CTGGACCAGG  CTGAGGTCCA841  GGCCCAGGGG  TACTTACTGA  TGCCCACCCC  CACCCCCACC  CAAGCAGGGA  CCTCAAAATC901  CCCTCCCTTT  CCTGTTTGGG  GCCTTGACAC  ACGCTGGGCT  CAGGGCTAGG  GAGTCTCTCT961  TCCCACCTCT  GACCTCTTTC  AGCCTCTACA  CTGACCTCAA  GTGTCAAGTT  CTATCAGGCT1021  GCTTGGTCTC  ACTAGGCCCC  CTCTTTCCAG  AGAGAACCAT  GGACTGACAG  CAAGAAGCCT1081  GAGCTCCCGA  CCCAGCTCTG  TCACTGATTT  GCTGAGTGAC  TCCAAGGGAA  TCCCCACCTT1141  GCTCTGAGAT  TTAATCTTCT  CTCTTAACAC  GAAGGAAGCT  GGATGGGAGA  GCTCCAGGGG1201  CCTCCCAGTT  CTCGGCCTCA  GAAAGCCTCC  CATCCTCAGC  CCATGCCATT  CTGGGTGGGA1261  TCAGAGGAAG  TGGCAATGAG  TTAGACGCCC  TGCAGGAATA  GCTGGATGCA  AGCTGGGCCA1321  GAGAAAATGG  CACAGAACCC  TGGACCCAGG  GCCAGGGATG  CCCTGGCCTT  CCCTAACTCT1381  GGCCCACCTA  GCCAATTAGG  TGTGGCTGAT  GTCCCTTGAG  TGCCCTCTTC  CTAAAGCCCA1441  AAAGAAGATG  CTGGACTCCT  CTGGGCCCCA  CCAACAAATA  GGGAATAGAC  ATGGGTGGAA1501  AATCACTCCT  TTGTCTTTAT  TAAAGAAACT  TAGACCAGAC  CTGGCAATCA  AGGGGTGAGG1561  TACTGGCCAG  GAAGGTGGAG  TAGGTTTCAG  GCCCTGGGGA  TTTCAAGTGC  AGACTGATGG1621  CCTGGGAGGG  GCCAAAGAGA  CCAGATCCTG  GCAGCAGCTG  AGGAGGTGCC  CAAGGGCACT1681  TTCAGGCACT  GGGGCCATCA  GCTGGTTCTG  TGGGCAGGGG  TTGGGGGTTG  GGATGCAGGG1741  TAGTTTGGGC  TGGCCTGGAA  TCTCCCTGAG  GCCACCCTGC  CTTGTCTACC  TAGATCATCC1801  ACTGGTCCTG  ATCCTGTTCG  TTGCCTTCCA  TGTCCACCTG  GAGAGGAGGC  TGGGTGTGGG1861  TGGGGAGGGG  CCTCAGCCAG  CCTCAGCCCC  AGATCCTGCC  CCTGGCTGGA  TCCAGGGTTT1921  CTGTACCCCT  TGCCATCAAC  TGGGTCAGGA  GCAAGGGTCC  AGGAACAGAG  GCCCTCCCCC1981  ATACCCCTTG  CCTACCTCAT  TGACCTCTCC  ATCATCCGGT  GACTCATTGT  AGTCATTCAT2041  CTCGTCCATG  TCCTGCATAT  CCTCATCATC  CTCTGAGTCC  TCTTTCACTA  TCCTCATCGT2101  CTTCATCATC  TTCTTCTTCC  TCGTCATCAT  AGTGCTGGTG  GGCAGGACAG  AGCCTGTAAG2161  CCCTACAGGC  CTGCATGGAC  CAGTTCAAGA  ACTGACCCAC  TTGAGCCTCT  CTCTAGGGCC2221  AATGAATGAC  CCCCTACCCC  GACACTCCCT  CCTTGAGTCT  AGCAGGCTGG  TGCATGTTCT2281  GCAGGACCTT  AATGCTAGGC  CCAATGCCCA  CCCCTTCTAT  CTCCCCTTTT  AGGCTTTTAC2341  CCAGATCTGA  GAACCACAAC  TGCTCTGGGT  CAGAGACAGG  ACATTCAGAA  TTAGAGCAGA2401  GCCTCGGTCC  ACTGCGGCCC  CCACACAGGC  CCCACCTGCT  AGAGCCACTC  ACCTCTGAGG2461  CTGGCTTGCC  AATAGGAACC  AGGTTGTTGT  CTTTCTCCGC  GATGCTTTGG  AGCTGTGGGC2521  AAAGGCACAG  AGGAACAAGG  CCAGAGCCCA  AGTAGGGCAG  GTCAGGGGCA  TGGGACTGGC2581  CCATTCTGCC  CAGAAGACAA  CCCACACGTG  TTGGGGAGAA  GCTTCCTCCC  AGTTCTCAGG2641  GAGATACAAT  CCCTTTCTTG  TCATCTGCCA  TTTATGAACT  TGATCCAAAT  AAAAAAAAAA2701  AAAAAAAAAA  AAB:氨基酸序列(SEQ ID NO:14)长度:155个氨基酸1 MGTPWRKRKG IAGPGLPDLS CALVLQPSLR DCLSGLRIEE RAFSYVLTHA LPGDPGHILT61 TLDHWSSRCE YLSHMGPVKG QILMRLVEEK PLLVCWNWEP TVDTLPCLLP EPCPLGVAFL121 LWSGTHARQQ WLKNSSAWPA LMSTWWSSSW AAQRTC.核苷酸及氨基酸组合序列(SEQ ID NO:15)克隆号:  PP7517起始编码子:80 ATG    终止编码子:545 TGA蛋白质分子量:17413.271    G TTC ACG GCA ACA GCA TCC AGC GCC TGG GGG AGG TGA ATA AGC TGG      4647  CTG TCC TTC CTC GGC TCC GTA GCC TGA CAC TCC ATG GGA ACC CCA TGG      941                                              Met Gly Thr Pro Trp       595  AGG AAG AGA AAG GGT ATA GCA GGC CCT GGA CTC CCC GAC CTG TCC TGT     1426  Arg Lys Arg Lys Gly Ile Ala Gly Pro Gly Leu Pro Asp Leu Ser Cys      21143  GCT CTG GTC CTC CAG CCC AGC CTC CGA GAC TGC CTG TCA GGG CTG CGG     19022  Ala Leu Val Leu Gln Pro Ser Leu Arg Asp Cys Leu Ser Gly Leu Arg      37191  ATC GAG GAG CGG GCC TTC AGC TAC GTG CTC ACC CAT GCC CTG CCC GGT     23838  Ile Glu Glu Arg Ala Phe Ser Tyr Val Leu Thr His Ala Leu Pro Gly      53239  GAC CCT GGT CAC ATC CTC ACC ACC CTG GAC CAC TGG AGC AGC CGC TGC     28654  Asp Pro Gly His Ile Leu Thr Thr Leu Asp His Trp Ser Ser Arg Cys      69287  GAG TAC TTG AGC CAC ATG GGG CCT GTC AAA GGT CAG ATC CTG ATG CGG     33470  Glu Tyr Leu Ser His Met Gly Pro Val Lys Gly Gln Ile Leu Met Arg      85335  CTG GTG GAG GAG AAG CCC CTG CTT GTG TGC TGG AAT TGG GAA CCT ACT     38286  Leu Val Glu Glu Lys Pro Leu Leu Val Cys Trp Asn Trp Glu Pro Thr     101383  GTG GAT ACT CTA CCC TGC TTA TTG CCC GAG CCC TGC CCC CTG GGG GTC     430102  Val Asp Thr Leu Pro Cys Leu Leu Pro Glu Pro Cys Pro Leu Gly Val     117431  GCC TTC TTA CTG TGG AGC GGG ACC CAC GCA CGG CAG CAG TGG CTG AAA     478118  Ala Phe Leu Leu Trp Ser Gly Thr His Ala Arg Gln Gln Trp Leu Lys     133479  AAC TCA TCC GCC TGG CCG GCT TTG ATG AGC ACA TGG TGG AGC TCA TCG     526134  Asn Ser Ser Ala Trp Pro Ala Leu Met Ser Thr Trp Trp Ser Ser Ser     149527  TGG GCA GCT CAG AGG ACG TGA TCC CGT GCC TAC GCA CCC AGT ATC AGC     574150  Trp Ala Ala Gln Arg Thr ***                                         156575  TGA GTC GGG CAG ACC TGG TGC TCC TGG CAC ACC GGC CAC GAT GTT ACC     622623  TGA GGG ACC TGC AGC TGC TGG AGG CCC ATG CCC TAC TGC CAG CAG GTG     670671  CCA CCG TGC TGG CTG ACC ATG TGC TCT TCC CTG GTG CAC CCC GCT TCT     718719  TGC AGT ATG CTA AGA GCT GTG GCC GCT ACC GCT GCC GCC TCC ACC ACA     766767  CTG GCC TTC CAG ACT TCC CTG CCA TCA AGG ATG GAA TAG CTC AGC TCA     814815  CCT ATG CTG GAC CAG GCT GAG GTC CAG GCC CAG GGG TAC TTA CTG ATG     862863  CCC ACC CCC ACC CCC ACC CAA GCA GGG ACC TCA AAA TCC CCT CCC TTT     910911  CCT GTT TGG GGC CTT GAC ACA CGC TGG GCT CAG GGC TAG GGA GTC TCT     958959  CTT CCC ACC TCT GAC CTC TTT CAG CCT CTA CAC TGA CCT CAA GTG TCA    10061007  AGT TCT ATC AGG CTG CTT GGT CTC ACT AGG CCC CCT CTT TCC AGA GAG    10541055  AAC CAT GGA CTG ACA GCA AGA AGC CTG AGC TCC CGA CCC AGC TCT GTC    11021103  ACT GAT TTG CTG AGT GAC TCC AAG GGA ATC CCC ACC TTG CTC TGA GAT    11501151  TTA ATC TTC TCT CTT AAC ACG AAG GAA GCT GGA TGG GAG AGC TCC AGG    11981199  GGC CTC CCA GTT CTC GGC CTC AGA AAG CCT CCC ATC CTC AGC CCA TGC    12461247  CAT TCT GGG TGG GAT CAG AGG AAG TGG CAA TGA GTT AGA CGC CCT GCA    12941295  GGA ATA GCT GGA TGC AAG CTG GGC CAG AGA AAA TGG CAC AGA ACC CTG    13421343  GAC CCA GGG CCA GGG ATG CCC TGG CCT TCC CTA ACT CTG GCC CAC CTA    13901391    GCC  AAT  TAG  GTG  TGG  CTG  ATG  TCC  CTT  GAG  TGC  CCT  CTT  CCT  AAA  GCC        14381439    CAA  AAG  AAG  ATG  CTG  GAC  TCC  TCT  GGG  CCC  CAC  CAA  CAA  ATA  GGG  AAT        14861487    AGA  CAT  GGG  TGG  AAA  ATC  ACT  CCT  TTG  TCT  TTA  TTA  AAG  AAA  CTT  AGA        15341535    CCA  GAC  CTG  GCA  ATC  AAG  GGG  TGA  GGT  ACT  GGC  CAG  GAA  GGT  GGA  GTA        15821583    GGT  TTC  AGG  CCC  TGG  GGA  TTT  CAA  GTG  CAG  ACT  GAT  GGC  CTG  GGA  GGG        16301631    GCC  AAA  GAG  ACC  AGA  TCC  TGG  CAG  CAG  CTG  AGG  AGG  TGC  CCA  AGG  GCA        16781679    CTT  TCA  GGC  ACT  GGG  GCC  ATC  AGC  TGG  TTC  TGT  GGG  CAG  GGG  TTG  GGG        17261727    GTT  GGG  ATG  CAG  GGT  AGT  TTG  GGC  TGG  CCT  GGA  ATC  TCC  CTG  AGG  CCA        17741775    CCC  TGC  CTT  GTC  TAC  CTA  GAT  CAT  CCA  CTG  GTC  CTG  ATC  CTG  TTC  GTT        18221823    GCC  TTC  CAT  GTC  CAC  CTG  GAG  AGG  AGG  CTG  GGT  GTG  GGT  GGG  GAG  GGG        18701871    CCT  CAG  CCA  GCC  TCA  GCC  CCA  GAT  CCT  GCC  CCT  GGC  TGG  ATC  CAG  GGT        19181919    TTC  TGT  ACC  CCT  TGC  CAT  CAA  CTG  GGT  CAG  GAG  CAA  GGG  TCC  AGG  AAC        19661967    AGA  GGC  CCT  CCC  CCA  TAC  CCC  TTG  CCT  ACC  TCA  TTG  ACC  TCT  CCA  TCA        20142015    TCC  GGT  GAC  TCA  TTG  TAG  TCA  TTC  ATC  TCG  TCC  ATG  TCC  TGC  ATA  TCC        20622063    TCA  TCA  TCC  TCT  GAG  TCC  TCT  TTC  ACT  ATC  CTC  ATC  GTC  TTC  ATC  ATC        21102111    TTC  TTC  TTC  CTC  GTC  ATC  ATA  GTG  CTG  GTG  GGC  AGG  ACA  GAG  CCT  GTA        21582159    AGC  CCT  ACA  GGC  CTG  CAT  GGA  CCA  GTT  CAA  GAA  CTG  ACC  CAC  TTG  AGC        22062207    CTC  TCT  CTA  GGG  CCA  ATG  AAT  GAC  CCC  CTA  CCC  CGA  CAC  TCC  CTC  CTT        22542255    GAG  TCT  AGC  AGG  CTG  GTG  CAT  GTT  CTG  CAG  GAC  CTT  AAT  GCT  AGG  CCC        23022303    AAT  GCC  CAC  CCC  TTC  TAT  CTC  CCC  TTT  TAG  GCT  TTT  ACC  CAG  ATC  TGA        23502351    GAA  CCA  CAA  CTG  CTC  TGG  GTC  AGA  GAC  AGG  ACA  TTC  AGA  ATT  AGA  GCA        23982399    GAG  CCT  CGG  TCC  ACT  GCG  GCC  CCC  ACA  CAG  GCC  CCA  CCT  GCT  AGA  GCC        24462447    ACT  CAC  CTC  TGA  GGC  TGG  CTT  GCC  AAT  AGG  AAC  CAG  GTT  GTT  GTC  TTT        24942495    CTC  CGC  GAT  GCT  TTG  GAG  CTG  TGG  GCA  AAG  GCA  CAG  AGG  AAC  AAG  GCC        25422543    AGA  GCC  CAA  GTA  GGG  CAG  GTC  AGG  GGC  ATG  GGA  CTG  GCC  CAT  TCT  GCC        25902591    CAG  AAG  ACA  ACC  CAC  ACG  TGT  TGG  GGA  GAA  GCT  TCC  TCC  CAG  TTC  TCA        26382639    GGG  AGA  TAC  AAT  CCC  TTT  CTT  GTC  ATC  TGC  CAT  TTA  TGA  ACT  TGA  TCC        26862687    AAA  TAA  AAA  AAA  AAA  AAA  AAA  AAA  AA                                            27126.PP7283A:核苷酸序列(SEQ ID NO:16)长度:1937bp1  GGGAGTGGAG  AACTGGAGTC  ATATTTCTGG  GTTTTATGGC  AGGGTTTGGG  GAAGCCTCTC61  AGAGGAGGAG  GAGCTGGAGA  CAGGAGGGTG  GGAGCAGGAC  AGAGAAACTT  TTGTTTCTGA121  GGCTTCCACG  TTGGGGTGTT  GTTTTTTGAG  CCCCGGCACT  TACCAAACCC  AAATCACCCA181  CAGGGCTTAG  ACGGCACAAA  GGCTCCTGGG  ACTCTGGGCA  GAGTCAGGGA  CAGTCACACC241  CCTCCCCGTC  TCTATAGCGG  AGGTACTCAG  AGGGTCTGTG  CTTGGGAGGC  TGAGCGAGTC301  CTGGAGAGCA  TGGAGGTAGG  GGCCTGTGTT  CACATCCTGC  CCCGGTCAAA  GTAGGCCCAC361  ACTCAAAGGC  CTCTCTCTCA  GCAGAGATCT  TCCAGAGTGT  CAGCCTCCAG  CAAGTTCCCT421  AACCTCTCCC  AACACAGCCT  TCACCAGCAC  ATGGGCCGAG  ACTCTCCCCA  CGGGGCTGTG481  GCTCAACATA  GAAAAACCTT  GGTGCACGAT  GGCAGCAGCA  GGTCTCACAA  GAGCCGGCTT541  TCTCAGAACA  CACTGCCTCT  GCCCAGGTGT  CCTGCAGTGG  AGGCTCAGAC  TGGCCCCACT601  GGTGACCCCT  TGGGGAGCAG  GGACAGGTCC  ATTCTGCTCA  CTCCTGAGCT  GGGCAGTTCC661  CTCTTGGGAT  AAGGTCGCAC  AGCACAGGCC  ACCATCATAC  CACCCCAGCC  AGAGAAGTGG721  GAGAGACAAG  GAGGCTCCCT  ACCCCAGAGG  CAGTGCTCCT  CAGGAAGGGC  ATTCACTGCG781  TTATATAGAT  ATATACACAC  ACACACACAC  ACACACATAT  ATATACACAT  ATATACACAT841  ATATGTATAC  ACACATATAT  ACACACACAC  ATATATACAC  ACACACATAT  GTATATACAC901  ACACATATAT  ATATAGATAT  ACACACACAT  ATATTTTTTG  TTTGTTTGTT  TGTTTGTTTG961  CGATGGAGTC  TCACTCCAGC  CTGGCCGACA  GAGCAAGACT  CCGTCTCAAA  AAAAAAAAAG1021  ATTGCAGTGA  GCCACGATAG  CACCACTGCA  TTCCAGACTG  GGTGACAGGG  CAAGGCCGTC1081  TCTCAAAGAA  AAAAAGAAAC  AAAGATTTCC  ATTCTGGCAG  TCCACCCCTT  TTGTTTCCCC1141  CATTATTAAC  TTTACTTCTC  CCTCATTATT  AGTTTTTACT  TTATTTAAAT  GTGTGTATCT1201  GCTCCCATCT  AACCTAACAC  GACTCTCTCT  CTAGCAAAAA  TATTTGCAAT  CTGCAGTCCC1261  TTCCCCAAAG  AGGGATCCAC  CCAAGCCTCG  TATTGTTGTG  TCCACCTCCA  AGTTCAGGAT1321     CTTTTGGTGA  TAGATCTTCT  CTAGTGAAAA  TGTCTTCAAA  CATAGCAAGA  GGCTTTAAAT1381     ACTGGGTATC  CAAAAAATGA  TAGGGGTCCT  AAAACCAGAT  CCAGTTACCT  ACCTATCATC1441     CAAGACCTCG  CTTGAGTCCT  TTTGGGTGCT  CCCAACATTA  GTGTCGTAAA  ACTAAATACA1501     GGTGATGTGA  GCAGTTGTTC  ACTGATGATT  CTAATGCTCT  CTTGGAATTC  ATTGTTTCTC1561     TGTTAGGGTG  TTTCATAGTC  TTTGTGGCAA  AAATAGCATT  GCATCATTAA  AAGTATGTTA1621     CTGTCTGGGC  GTGGTGGCTG  AAGCCTGTAA  TCCCAGCACT  TTGGGAGGCC  GAGGTGGGTG1681     GATCACGAGC  TCAGGAGATC  GAGACCATCC  TGGCTAACAC  GGTGAAACCC  TGTCTCTACT1741     AAAAATACAA  AAAATTAGCC  GGGCGTGGTG  GTGGGCACCT  GTAGTCCCAG  CTACTCAGGA1801     GGTTGAGGCA  GGAGAATGGC  GTGAACCTGG  GAGGCGGAGC  TGGCAGTGAG  CCAAGATCGC1861     ACCATTGCAC  TCCAGCCTGG  GCAACACAGT  GAGACTCCGT  CTCAAAAAAA  AAAAAAAAAA1921     AAAAAAAAAA  AAAAAAAB:氨基酸序列(SEQ ID NO:17)  长度:135个氨基酸1  MAAAGLTRAG FLRTHCLCPG VLQWRLRLAP LVTPWGAGTG PFCSLLSWAV PSWDKVAQHR61  PPSYHPSQRS GRDKEAPYPR GSAPQEGHSL RYIDIYTHTH THTYIYTYIH IYVYTHIYTH121  TYIHTHICIY THIYIC.核苷酸及氨基酸组合序列(SEQ ID NO:18)克隆号:  PP7683起始编码子:509 ATG    终止编码子:914 TAG蛋白质分子量:15559.001    G GGA GTG GAG AAC TGG AGT CAT ATT TCT GGG TTT TAT GGC AGG GTT      4647  TGG GGA AGC CTC TCA GAG GAG GAG GAG CTG GAG ACA GGA GGG TGG GAG      9495  CAG GAC AGA GAA ACT TTT GTT TCT GAG GCT TCC ACG TTG GGG TGT TGT     142143  TTT TTG AGC CCC GGC ACT TAC CAA ACC CAA ATC ACC CAC AGG GCT TAG     190191  ACG GCA CAA AGG CTC CTG GGA CTC TGG GCA GAG TCA GGG ACA GTC ACA     238239  CCC CTC CCC GTC TCT ATA GCG GAG GTA CTC AGA GGG TCT GTG CTT GGG     286287  AGG CTG AGC GAG TCC TGG AGA GCA TGG AGG TAG GGG CCT GTG TTC ACA     334335  TCC TGC CCC GGT CAA AGT AGG CCC ACA CTC AAA GGC CTC TCT CTC AGC     382383  AGA GAT CTT CCA GAG TGT CAG CCT CCA GCA AGT TCC CTA ACC TCT CCC     430431  AAC ACA GCC TTC ACC AGC ACA TGG GCC GAG ACT CTC CCC ACG GGG CTG     478479  TGG CTC AAC ATA GAA AAA CCT TGG TGC ACG ATG GCA GCA GCA GGT CTC     5261                                          Met Ala Ala Ala Gly Leu       6527  ACA AGA GCC GGC TTT CTC AGA ACA CAC TGC CTC TGC CCA GGT GTC CTG     5747  Thr Arg Ala Gly Phe Leu Arg Thr His Cys Leu Cys Pro Gly Val Leu      22575  CAG TGG AGG CTC AGA CTG GCC CCA CTG GTG ACC CCT TGG GGA GCA GGG     62223  Gln Trp Arg Leu Arg Leu Ala Pro Leu Val Thr Pro Trp Gly Ala Gly      38623  ACA GGT CCA TTC TGC TCA CTC CTG AGC TGG GCA GTT CCC TCT TGG GAT     67039  Thr Gly Pro Phe Cys Ser Leu Leu Ser Trp Ala Val Pro Ser Trp Asp      54671  AAG GTC GCA CAG CAC AGG CCA CCA TCA TAC CAC CCC AGC CAG AGA AGT     71855  Lys Val Ala Gln His Arg Pro Pro Ser Tyr His Pro Ser Gln Arg Ser      70719  GGG AGA GAC AAG GAG GCT CCC TAC CCC AGA GGC AGT GCT CCT CAG GAA     76671  Gly Arg Asp Lys Glu Ala Pro Tyr Pro Arg Gly Ser Ala Pro Gln Glu      86767  GGG CAT TCA CTG CGT TAT ATA GAT ATA TAC ACA CAC ACA CAC ACA CAC     81487  Gly His Ser Leu Arg Tyr Ile Asp Ile Tyr Thr His Thr His Thr His     102 815  ACA TAT ATA TAC ACA TAT ATA CAC ATA TAT GTA TAC ACA CAT ATA TAC     862103  Thr Tyr Ile Tyr Thr Tyr Ile His Ile Tyr Val Tyr Thr His Ile Tyr     118863  ACA CAC ACA TAT ATA CAC ACA CAC ATA TGT ATA TAC ACA CAC ATA TAT     910119  Thr His Thr Tyr Ile His Thr His Ile Cys Ile Tyr Thr His Ile Tyr     134911  ATA TAG ATA TAC ACA CAC ATA TAT TTT TTG TTT GTT TGT TTG TTT GTT     958135  Ile ***                                                             136959  TGC GAT GGA GTC TCA CTC CAG CCT GGC CGA CAG AGC AAG ACT CCG TCT    10061007  CAA AAA AAA AAA AGA TTG CAG TGA GCC ACG ATA GCA CCA CTG CAT TCC    10541055  AGA CTG GGT GAC AGG GCA AGG CCG TCT CTC AAA GAA AAA AAG AAA CAA    11021103  AGA TTT CCA TTC TGG CAG TCC ACC CCT TTT GTT TCC CCC ATT ATT AAC    11501151  TTT ACT TCT CCC TCA TTA TTA GTT TTT ACT TTA TTT AAA TGT GTG TAT    11981199  CTG CTC CCA TCT AAC CTA ACA CGA CTC TCT CTC TAG CAA AAA TAT TTG    12461247  CAA TCT GCA GTC CCT TCC CCA AAG AGG GAT CCA CCC AAG CCT CGT ATT    12941295  GTT GTG TCC ACC TCC AAG TTC AGG ATC TTT TGG TGA TAG ATC TTC TCT    13421343  AGT GAA AAT GTC TTC AAA CAT AGC AAG AGG CTT TAA ATA CTG GGT ATC    13901391  CAA AAA ATG ATA GGG GTC CTA AAA CCA GAT CCA GTT ACC TAC CTA TCA    14381439  TCC AAG ACC TCG CTT GAG TCC TTT TGG GTG CTC CCA ACA TTA GTG TCG    14861487  TAA AAC TAA ATA CAG GTG ATG TGA GCA GTT GTT CAC TGA TGA TTC TAA    15341535  TGC TCT CTT GGA ATT CAT TGT TTC TCT GTT AGG GTG TTT CAT AGT CTT    15821583  TGT GGC AAA AAT AGC ATT GCA TCA TTA AAA GTA TGT TAC TGT CTG GGC    16301631  GTG GTG GCT GAA GCC TGT AAT CCC AGC ACT TTG GGA GGC CGA GGT GGG    16781679  TGG ATC ACG AGC TCA GGA GAT CGA GAC CAT CCT GGC TAA CAC GGT GAA    17261727  ACC CTG TCT CTA CTA AAA ATA CAA AAA ATT AGC CGG GCG TGG TGG TGG    17741775  GCA CCT GTA GTC CCA GCT ACT CAG GAG GTT GAG GCA GGA GAA TGG CGT    18221823  GAA CCT GGG AGG CGG AGC TGG CAG TGA GCC AAG ATC GCA CCA TTG CAC    18701871  TCC AGC CTG GGC AAC ACA GTG AGA CTC CGT CTC AAA AAA AAA AAA AAA    19181919  AAA AAA AAA AAA AAA AAA A                                          19377.PP7879A:核苷酸序列(SEQ ID NO:19)长度:1545bp1     GGTGGAAGAG  AGTATGTGTA  TGTGTGTTCC  TGTACATAGC  ATGGGTGCAG  CTGTGGATGT61     GTGCAAAAGA  GTGTGAGTGT  GTGTGTGTGT  GTGTGTGTGT  AAAGGGGTCT  GTCCTAGAGC121     CCACATCAGT  TTGTTGTGAA  TCTGGAAAAA  GGGTCGGTGA  GGGCCGGGAG  ATGTTGACCC181     TGGTGGGAGC  AGGCTGAGGC  TGCCCCGTTC  TCCACATCCT  CTGGTTTGCC  CAGTCTCTGA241     TTCCATTAGG  GGGAGTGTGC  TGAAGCCATT  CTCGGATGCT  TCCCAGACCA  GGCTCCCTCT301     GCCAGAGTCA  CATGCATCCG  AGCTGCTGGT  CTCCATTGTC  CAGCAGGAAG  GCGGAAAGGC361     AGGCAAGATG  GTGTGAAGCT  TAAAGCTTGT  ATTTGATGGA  AAAGGTCTCC  CCTGTTCATC421     TGAGAGGCCA  AGCCTGGCCA  CCCCAGGCTC  AGAACCTGGG  CTTCAAGAAA  TGTGCTGGGA481     GCTCCTAACT  TACACATCCC  TCCAGCCTTC  CTTGAATCCT  CCCACCACCC  CCTATTTTCC541     TTTAATTTCT  CAGGTCTGCT  CCCTCCTCCC  CCAACCCCAC  AGCTGGGCAA  GAAGTCTGCA601     AAAGCTGCAT  CTGCAGCTGT  CTCTAACTCT  TCCCAGCCAT  CTCCCGTATT  TTTTGGTACC661     TTGATTCCTT  GACTCTTAAT  AAGCCAAGCC  ACCTTATCTC  TGTAGTTCTT  ATTTTTTTGT721     TGACTAAATT  TGGGGGGTTC  TTTTTTATGG  TCATGTCACT  GACCTATTAA  ATTGGGGCTT781     GGTGCTTTTC  CACCTTCCCC  CTCTGAATGA  AAGCCAAGGA  ATGGGGGAAG  AGCGGGAACT841     CTGCCACGGA  GGTGGAGCAA  GAACGGTGAA  GGGCCCTGGT  CCCAGAGAGG  CTGGTGGGTC901     CCTCTCCCAA  AGGAAGGCAG  ACAGTCTCTG  CTTTGCCTTG  GACCTTGGTG  CTTGGGGGTG961     GGGAGGCCCT  GGGGGGGACA  CTCCCCACTC  CCATTCCCCT  TCCTTTGTCC  TAATCCTGGA1021     ATTAAGTACA  GGGGTTTATA  GGTTCTATTT  CTTCCCAAGA  GCCCTGCAAA  GAACCCCAGT1081     TTCCTATTTG  GATGCCCCTA  CACTGTTGTG  TTTCAGTGGA  ATGTATTTTC  ATTTAAAAAC1141     AACTTTGAAT  GGGGCACTTT  TTCTTTCCTG  TTTTAAAAAT  TGAAAAATTC  TTACAGTACA1201    AACAGGACTG  TCAGGGTGGG  GGTGTTGGTG  CTGTAAGAGG  TCACTCTTGA  GTGCATTTTG1261    GCACTGGGAT  GGGATGGCTG  GGGTGGGAAG  ACCCCCATCC  CCACCCCCAA  CTTCTTTTCT1321    AATATTTAAG  GAGTGTTTTG  TAGGATTCAA  CAACCACCAC  AACTTGAATT  TGTATCATGG1381    GAGGTGGGAG  GGAGTGGCTT  AGAGGTGTCT  GCCTATGCTT  AAAGCCAACT  GTGGAAGTTT1441    TGTTTTCCCT  TTTTTGTATA  ATAAAGTGAA  AAACAAAGGT  TTAAAAAAAA  AAAAAAAAAA1501    AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAB:氨基酸序列(SEQ ID NO:20)  长度:120个氨基酸1  MGEERELCHG GGARTVKGPG PRFAGGSLSQ RKADSLCFAL DLGAWGWGGP GGDTPHSHSP61  SFVLILELST GVYRFYFFPR ALQRTPVSYL DAPTLLCFSG MYFHLKTTLN GALFLSCFKNC.核苷酸及氨基酸组合序列(SEQ ID NO:21)克隆号:  PP7879起始编码子:821 ATG    终止编码子:1181 TGA蛋白质分子量:13001.161     G GTG GAA GAG AGT ATG TGT ATG TGT GTT CCT GTA CAT AGC ATG GGT      4647  GCA GCT GTG GAT GTG TGC AAA AGA GTG TGA GTG TGT GTG TGT GTG TGT      9495  GTG TGT AAA GGG GTC TGT CCT AGA GCC CAC ATC AGT TTG TTG TGA ATC     142143  TGG AAA AAG GGT CGG TGA GGG CCG GGA GAT GTT GAC CCT GGT GGG AGC     190191  AGG CTG AGG CTG CCC CGT TCT CCA CAT CCT CTG GTT TGC CCA GTC TCT     238239  GAT TCC ATT AGG GGG AGT GTG CTG AAG CCA TTC TCG GAT GCT TCC CAG     286287  ACC AGG CTC CCT CTG CCA GAG TCA CAT GCA TCC GAG CTG CTG GTC TCC     334335  ATT GTC CAG CAG GAA GGC GGA AAG GCA GGC AAG ATG GTG TGA AGC TTA     382383  AAG CTT GTA TTT GAT GGA AAA GGT CTC CCC TGT TCA TCT GAG AGG CCA     430431  AGC CTG GCC ACC CCA GGC TCA GAA CCT GGG CTT CAA GAA ATG TGC TGG     478479  GAG CTC CTA ACT TAC ACA TCC CTC CAG CCT TCC TTG AAT CCT CCC ACC     526527  ACC CCC TAT TTT CCT TTA ATT TCT CAG GTC TGC TCC CTC CTC CCC CAA     574575  CCC CAC AGC TGG GCA AGA AGT CTG CAA AAG CTG CAT CTG CAG CTG TCT     622623  CTA ACT CTT CCC AGC CAT CTC CCG TAT TTT TTG GTA CCT TGA TTC CTT     670671  GAC TCT TAA TAA GCC AAG CCA CCT TAT CTC TGT AGT TCT TAT TTT TTT     718719  GTT GAC TAA ATT TGG GGG GTT CTT TTT TAT GGT CAT GTC ACT GAC CTA     766767  TTA AAT TGG GGC TTG GTG CTT TTC CAC CTT CCC CCT CTG AAT GAA AGC     814815  CAA GGA ATG GGG GAA GAG CGG GAA CTC TGC CAC GGA GGT GGA GCA AGA     8621          Met Gly Glu Glu Arg Glu Leu Cys His Gly Gly Gly Ala Arg      14863  ACG GTG AAG GGC CCT GGT CCC AGA GAG GCT GGT GGG TCC CTC TCC CAA     91015  Thr Val Lys Gly Pro Gly Pro Arg Glu Ala Gly Gly Ser Leu Ser Gln      30911  AGG AAG GCA GAC AGT CTC TGC TTT GCC TTG GAC CTT GGT GCT TGG GGG     95831  Arg Lys Ala Asp Ser Leu Cys Phe Ala Leu Asp Leu Gly Ala Trp Gly      46959  TGG GGA GGC CCT GGG GGG GAC ACT CCC CAC TCC CAT TCC CCT TCC TTT    100647  Trp Gly Gly Pro Gly Gly Asp Thr Pro His Ser His Ser Pro Ser Phe      621007  GTC CTA ATC CTG GAA TTA AGT ACA GGG GTT TAT AGG TTC TAT TTC TTC    105463  Val Leu Ile Leu Glu Leu Ser Thr Gly Val Tyr Arg Phe Tyr Phe Phe      781055  CCA AGA GCC CTG CAA AGA ACC CCA GTT TCC TAT TTG GAT GCC CCT ACA    110279  Pro Arg Ala Leu Gln Arg Thr Pro Val Ser Tyr Leu Asp Ala Pro Thr      941103  CTG TTG TGT TTC AGT GGA ATG TAT TTT CAT TTA AAA ACA ACT TTG AAT    115095  Leu Leu Cys Phe Ser Gly Met Tyr Phe His Leu Lys Thr Thr Leu Asn     1101151  GGG GCA CTT TTT CTT TCC TGT TTT AAA AAT TGA AAA ATT CTT ACA GTA    1198111  Gly Ala Leu Phe Leu Ser Cys Phe Lys Asn ***                         1211199  CAA ACA GGA CTG TCA GGG TGG GGG TGT TGG TGC TGT AAG AGG TCA CTC    12461247  TTG AGT GCA TTT TGG CAC TGG GAT GGG ATG GCT GGG GTG GGA AGA CCC    12941295  CCA TCC CCA CCC CCA ACT TCT TTT CTA ATA TTT AAG GAG TGT TTT GTA    13421343  GGA TTC AAC AAC CAC CAC AAC TTG AAT TTG TAT CAT GGG AGG TGG GAG    13901391  GGA GTG GCT TAG AGG TGT CTG CCT ATG CTT AAA GCC AAC TGT GGA AGT    14381439  TTT GTT TTC CCT TTT TTG TAT AAT AAA GTG AAA AAC AAA GGT TTA AAA    14861487  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    15341535  AAA AAA AAA AA                                                     15458.PP8376A:核苷酸序列(SEQ ID NO:22)长度:1841bp1    GTCTGATTGG  GTGGTGTGGC  GCAATGCGCG  CGACCCTCAA  GATACCAAAC  TGTACGCATC61    TCTGACCCTT  TCCTCTCCTT  GCTCCTGCTG  GTAAACCGAA  GCCCAGGAGA  CTTCCAGGTT121    TGGGCATCTG  CAGAGGGCGA  GGAACTGGTC  ACGGCGCCGG  GTGGGCTTGC  AGCTGTGACG181    CTTATGTGGA  CACCTCAGTG  TCGCTGGTGG  TTCACCTCGG  CTTCCCAGTT  TATTTATTGA241    CGTCAACAAA  TAAATGTTGA  ATAAGGAAGA  AGAGTTAGAA  TTGCTTGAAG  CCCTCTGGAG301    TTTTAGCACT  AGTCCCGCCC  ACTCCCTTCT  ACTTCCAGGT  CGGGGGGGGG  CGGGTCCAAT361    AGAAAGGCGG  AAGCCAGTGT  CCCAGGCGTT  CTCACGCCCG  CAACAATTCC  TGAGTAGGGC421    CTTGCTTGAG  TTCTTCGGAA  AGTCTCATCC  ACCCCCACAT  CGCCTCTTTA  GGAAGTCACT481    TAATGTTGGG  CTTCATTATT  CCCACATCCC  TTTCCTTACT  ACTTGCCTGC  ACTTCTTGAG541    AAAAAGACTG  CAGAAAGGAG  AGGTGGGGCT  TTCAGTAGAA  ACAAGCAAAC  CGCAGGTCCC601    TGTGGGGGGA  CTCTCCAGGA  AGAAGGTTCC  GCAAGAACCG  TGGGCGACAG  TTATGGAGAA661    GCGTCTGCAG  GAGGCTCAGC  TGTACAAGGA  GGAAGGGAAC  CAGCGCTACC  GGGAAGGGAA721    GTACCGAGAT  GCTGTGAGTA  GGTACCATCG  AGCTCTGCTT  CAGCTGCGGG  GTCTGGATCC781    GAGTCTGCCC  TCTCCGTTAC  CTAATCTCGG  ACCTCAGGGC  CCGGCCCTCA  CGCCTGAACA841    AGAAAACATA  TTGCATACCA  CCCAGACAGA  CTGCTATAAC  AATCTAGCTG  TTGTGAAATA901    GGGAGTGTTT  CCCTTCTTAA  TCATAAAAAG  GCAGAACATT  GACCTGAATT  GCCTGAATTG961    ACTCCTCTGC  AGCTTGTCTC  CTTCAGATGG  AGCCCGTGAA  CTACGAACGA  GTGAGAGAAT1021    ATAGTCAGAA  AGTCCTGGAA  CGACAGCCTG  ATAATGCCAA  GGCCTTGTAT  CGGGCCGGAG1081    TGGCCTTTTT  CCATCTGCAG  GACTATGACC  AGGCCCGCCA  CTACCTCCTG  GCTGCCGTGA1141    ATAGGCAGCC  TAAAGGTAAG  CAAGAAGGGC  TTTGAAATGG  TAAAGACAAA  ATTGTCTTGC1201    TGGGGTGGAT  CTGTGGAAAG  GGGGTTTTAT  TTTACTTTGC  CAATGTATTA  TTTTCAATAA1261    GTAATACATT  CACATGGTTG  AGAATTCGAA  CTGAAAAAGT  ATACGATGAA  CAGACCTTTT1321    TCCACTCTTG  TGTTCTTGTC  TCCACAGAAA  AGCAGTATTA  TTAGTTTCAT  GTGTAGGGGG1381    TTGATGCTTA  ATCAGACATA  CACAATATAT  ATGTTGGTAT  GTCTGTTTCA  TATATGTATG1441    TATGCCTATT  CTAATATATA  AATATATGTA  TATCAACGTG  CTTTTATTTA  TAAATATACA1501    GTGTATATAT  TTATACATAT  ACATGAATAT  ATATATAAAA  TAGGCAGGCC  AGGTGGGGTG1561    GCTCACATCT  GTTATCTCAG  CACTTTGGGA  GACCAAAGTG  GGTGGATCAC  CTGAGGTCAG1621    GAGTTTGAGA  CCAGCCTGAC  CAACATGGAG  AAACCCCATC  TCTACTAAAA  ATACAAAATT1681    AGCCAGGCAT  GGTGGCGCAT  GCCTGTAAAC  CCAGCTACTC  GGGAGGCTGA  GGCAGGAGAA1741    TTGCTTGAAC  CCAGGAGGCG  GAGGTTGCGG  TGAGCCGAGA  TCCTGGGCAA  CAAGAACGAG1801    ATTCTGTCTC  CAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AB:氨基酸序列(SEQ ID NO:23)  长度:215个氨基酸1    MLNKEEELEL  LEALWSFSTS  PAHSLLLPGR  GGAGPIERRK  PVSQAFSRPQ  QFLSRALLEF61    FGKSHPPPHR  LFRKSLNVGL  HYSHIPFLTT  CLHFLRKRLQ  KGEVGLSVET  SKPQVPVGGL121    SRKKVPQEPW  ATVMEKRLQE  AQLYKEEGNQ  RYREGKYRDA  VSRYHRALLQ  LRGLDPSLPS181    PLPNLGPQGP  ALTPEQENIL  HTTQTDCYNN  LAVVKC.核苷酸及氨基酸组合序列(SEQ ID NO:24)克隆号:PP8376起始编码子:254 ATG    终止编码子:899 TAG蛋白质分子量:24371.771    G TCT GAT TGG GTG GTG TGG CGC AAT GCG CGC GAC CCT CAA GAT ACC      4647  AAA CTG TAC GCA TCT CTG ACC CTT TCC TCT CCT TGC TCC TGC TGG TAA      9495  ACC GAA GCC CAG GAG ACT TCC AGG TTT GGG CAT CTG CAG AGG GCG AGG     142143  AAC TGG TCA CGG CGC CGG GTG GGC TTG CAG CTG TGA CGC TTA TGT GGA     190191  CAC CTC AGT GTC GCT GGT GGT TCA CCT CGG CTT CCC AGT TTA TTT ATT     238239  GAC GTC AAC AAA TAA ATG TTG AAT AAG GAA GAA GAG TTA GAA TTG CTT     2861                      Met Leu Asn Lys Glu Glu Glu Leu Glu Leu Leu      11287  GAA GCC CTC TGG AGT TTT AGC ACT AGT CCC GCC CAC TCC CTT CTA CTT     33412  Glu Ala Leu Trp Ser Phe Ser Thr Ser Pro Ala His Ser Leu Leu Leu      27335  CCA GGT CGG GGG GGG GCG GGT CCA ATA GAA AGG CGG AAG CCA GTG TCC     38228  Pro Gly Arg Gly Gly Ala Gly Pro Ile Glu Arg Arg Lys Pro Val Ser      43383  CAG GCG TTC TCA CGC CCG CAA CAA TTC CTG AGT AGG GCC TTG CTT GAG     43044  Gln Ala Phe Ser Arg Pro Gln Gln Phe Leu Ser Arg Ala Leu Leu Glu      59431  TTC TTC GGA AAG TCT CAT CCA CCC CCA CAT CGC CTC TTT AGG AAG TCA     47860  Phe Phe Gly Lys Ser His Pro Pro Pro His Arg Leu Phe Arg Lys Ser      75479  CTT AAT GTT GGG CTT CAT TAT TCC CAC ATC CCT TTC CTT ACT ACT TGC     52676  Leu Asn Val Gly Leu His Tyr Ser His Ile Pro Phe Leu Thr Thr Cys      91527  CTG CAC TTC TTG AGA AAA AGA CTG CAG AAA GGA GAG GTG GGG CTT TCA     57492  Leu His Phe Leu Arg Lys Arg Leu Gln Lys Gly Glu Val Gly Leu Ser     107575  GTA GAA ACA AGC AAA CCG CAG GTC CCT GTG GGG GGA CTC TCC AGG AAG     622108  Val Glu Thr Ser Lys Pro Gln Val Pro Val Gly Gly Leu Ser Arg Lys     123623  AAG GTT CCG CAA GAA CCG TGG GCG ACA GTT ATG GAG AAG CGT CTG CAG     670124  Lys Val Pro Gln Glu Pro Trp Ala Thr Val Met Glu Lys Arg Leu Gln     139671  GAG GCT CAG CTG TAC AAG GAG GAA GGG AAC CAG CGC TAC CGG GAA GGG     718140  Glu Ala Gln Leu Tyr Lys Glu Glu Gly Asn Gln Arg Tyr Arg Glu Gly     155719  AAG TAC CGA GAT GCT GTG AGT AGG TAC CAT CGA GCT CTG CTT CAG CTG     766156  Lys Tyr Arg Asp Ala Val Ser Arg Tyr His Arg Ala Leu Leu Gln Leu     171767  CGG GGT CTG GAT CCG AGT CTG CCC TCT CCG TTA CCT AAT CTC GGA CCT     814172  Arg Gly Leu Asp Pro Ser Leu Pro Ser Pro Leu Pro Asn Leu Gly Pro     187815  CAG GGC CCG GCC CTC ACG CCT GAA CAA GAA AAC ATA TTG CAT ACC ACC     862188  Gln Gly Pro Ala Leu Thr Pro Glu Gln Glu Asn Ile Leu His Thr Thr     203863  CAG ACA GAC TGC TAT AAC AAT CTA GCT GTT GTG AAA TAG GGA GTG TTT     910204  Gln Thr Asp Cys Tyr Asn Asn Leu Ala Val Val Lys ***                 216911  CCC TTC TTA ATC ATA AAA AGG CAG AAC ATT GAC CTG AAT TGC CTG AAT     958959  TGA CTC CTC TGC AGC TTG TCT CCT TCA GAT GGA GCC CGT GAA CTA CGA    10061007    ACG  AGT  GAG  AGA  ATA  TAG  TCA  GAA  AGT  CCT  GGA  ACG  ACA  GCC  TGA  TAA        10541055    TGC  CAA  GGC  CTT  GTA  TCG  GGC  CGG  AGT  GGC  CTT  TTT  CCA  TCT  GCA  GGA        11021103    CTA  TGA  CCA  GGC  CCG  CCA  CTA  CCT  CCT  GGC  TGC  CGT  GAA  TAG  GCA  GCC        11501151    TAA  AGG  TAA  GCA  AGA  AGG  GCT  TTG  AAA  TGG  TAA  AGA  CAA  AAT  TGT  CTT        11981199    GCT  GGG  GTG  GAT  CTG  TGG  AAA  GGG  GGT  TTT  ATT  TTA  CTT  TGC  CAA  TGT        12461247    ATT  ATT  TTC  AAT  AAG  TAA  TAC  ATT  CAC  ATG  GTT  GAG  AAT  TCG  AAC  TGA        12941295    AAA  AGT  ATA  CGA  TGA  ACA  GAC  CTT  TTT  CCA  CTC  TTG  TGT  TCT  TGT  CTC        13421343    CAC  AGA  AAA  GCA  GTA  TTA  TTA  GTT  TCA  TGT  GTA  GGG  GGT  TGA  TGC  TTA        13901391    ATC  AGA  CAT  ACA  CAA  TAT  ATA  TGT  TGG  TAT  GTC  TGT  TTC  ATA  TAT  GTA        14381439    TGT  ATG  CCT  ATT  CTA  ATA  TAT  AAA  TAT  ATG  TAT  ATC  AAC  GTG  CTT  TTA        14861487    TTT  ATA  AAT  ATA  CAG  TGT  ATA  TAT  TTA  TAC  ATA  TAC  ATG  AAT  ATA  TAT        15341535    ATA  AAA  TAG  GCA  GGC  CAG  GTG  GGG  TGG  CTC  ACA  TCT  GTT  ATC  TCA  GCA        15821583    CTT  TGG  GAG  ACC  AAA  GTG  GGT  GGA  TCA  CCT  GAG  GTC  AGG  AGT  TTG  AGA        16301631    CCA  GCC  TGA  CCA  ACA  TGG  AGA  AAC  CCC  ATC  TCT  ACT  AAA  AAT  ACA  AAA        16781679    TTA  GCC  AGG  CAT  GGT  GGC  GCA  TGC  CTG  TAA  ACC  CAG  CTA  CTC  GGG  AGG        17261727    CTG  AGG  CAG  GAG  AAT  TGC  TTG  AAC  CCA  GGA  GGC  GGA  GGT  TGC  GGT  GAG        17741775    CCG  AGA  TCC  TGG  GCA  ACA  AGA  ACG  AGA  TTC  TGT  CTC  CAA  AAA  AAA  AAA        18221823    AAA  AAA  AAA  AAA  AAA  AAA  A                                                       18419.PP10029A:核苷酸序列(SEQ ID NO:25)长度:1738bp1    GGGTGGGTGC  CTGATGAGCG  GTGCTTCCCT  CATATGATAT  GTGGGCACCC  TGAAGCTCTC61    ACGTAATGGT  TCTGCTGTGC  CGGGTTGTGA  CCCAGCTGTC  CTTGGTAGGC  TCTCCTGTTT121    AATGAGCAAC  TGCTATATGC  CAGGCCCTGT  TCTAGAAACA  GATGAGGCCC  CTGTTCCCAT181    GGAACTTAGA  TCTGAGTATG  TGGACAGAGT  GAGTAGGTTG  CCAGATAATG  TCAGAGGTAA241    GAAAAAAGCC  AGGCAGAGGA  CAGCAGTGCT  GGTTTAGACA  AGGGTTGGCA  AGGCCTCCCT301    GATAAGGGGA  CGTATTTGCG  CAGACACGGA  AGCAGTCTGA  TGGAAGGCTT  GCCCTGTAGG361    GACCTGGGGT  GCAGACTGAG  CTGGGAGGGC  TCTTGGCTTG  CTCCAATGAG  GTAGGGGCGA421    AGAGAGGGCA  GAATGGCCCC  CGTGCTGGTC  CAGATGTGGC  CAGCGCCAGA  TCGTATAGAG481    CCGTGGAGGC  ACGGTAAGGA  CTTGGGGTTT  GAGGGAGATG  AGGGCCCTGA  GCAGGGGTGC541    CATGATCTAG  CCTCTGCTCC  AGAAGGATCT  GTCTGGCTGC  CATGTGGGGG  ACACGGAGTG601    GAGCAAAGAC  GGGAGCCCAG  TGAGAGTCGA  GGGAGAGGTG  ACCTCAGCTT  GGGCTGCGGT661    GCAGGCCATG  GGACTGGCAG  GAGGTGGCTG  GGGTTACGCT  GTCTTTTCTA  ACATTCAGCA721    TTGGCTCAGG  GGCCAGGTCA  GGGCTCACAG  ACTGTTGCTA  TAAAGGGCTG  GGTGGCTTTC781    TTCCCCACAG  CTACTCAGCC  TAATGCCATT  GCAGAGCACA  TGTAGCCATG  GACAACACAA841    GGGGCGTATC  CGTGTTCCAG  GACAGCCATA  TTGACAGGAA  TAGGCAGGAG  GCCAGATTTG901    GTCCTCAGGC  TGTAATTTCT  TGGCCCCTTG  TCTAGGGAGA  GGTAAACGAG  GGGAGGAGAG961    ATCAGTCAAG  GATGACGTGA  GGGTTTGCTG  GGAGCACCAG  GAATCCTGGA  GAAGGTAGTG1021    GCAAGAGGGT  GCAGCAAGCT  CAGCTGGGCG  GGGATCAAGT  CTGAGGACTT  AATGTCTCCT1081    CTGATCTCCA  GACCCATAAG  GGAGATGCTG  AGTAGACAAC  TGGGGCTTAT  GGGTCTGGAG1141    TTCAGAGGAG  AGATCGGGAA  GGTGTCCATT  TGGAGTCATC  CACGCAGAGA  TGTGTGAAGG1201    CTGCTCAATG  ATTTTGAGGT  TTAAAGAAAA  AAAGAGATGT  GAAACCAGGG  GCCCTGATGA1261    GGCTGCCCAG  GTGGTAAGGA  AGACAGAAGA  GAAGCCATGG  GACAGCTGAG  CCCGGGCACC1321    CTCAAGCCTT  GGAGGCATGA  AGTTTGGTGG  GGATCTGGCA  AAGAACACCT  GGGAGCAGCC1381    AGCGGGCAGC  AGACCCCAGA  GTAGCAGGGA  AGACAAGCAC  TTCAAAGAGG  CAGCGTCAGC1441    CAGGGGCAGT  GGCTCAGCTG  TAATCCTAGC  ACTTTGGGAG  GCCAAGGATG  GCAGATCACC1501    TGAGGTTAGG  GGTTCGAGAC  TAGCCTGGCC  AACATGGTGA  AACCCTGTCT  CTACTAAAAA1561    TAAAAAATTA  GCCAGGCATT  GGTGGTATGT  GCCTGTAATC  CCAGCTACTC  GAGAGGCTGA1621    GGCAGGAGAA  TCTCTTGAAC  CCGGGAGGCA  GAGGTTGCAG  TGAGCCGAGA  TCATGCCATT1681    GCACTCCAGC  CTGGGCAACA  AGAGCGAAAC  TCCGTCTCAA  AAAAAAAAAA  AAAAAAAAB:氨基酸序列(SEQ ID NO:26)  长度:92个氨基酸1   MAPVLVQMWP APDRIEPWRH GKDLGFEGDE GPEQGCHDLA SAPEGSVWLP CGGHGVEQRR61  EPSESRGRGD LSLGCGAGHG TGRRWLGLRC LFC.核苷酸及氨基酸组合序列(SEQ ID NO:27)克隆号:PP10029起始编码子:433 ATG    终止编码子:709 TAA蛋白质分子量:9973.671  GGG TGG GTG CCT GAT GAG CGG TGC TTC CCT CAT ATG ATA TGT GGG CAC      4849  CCT GAA GCT CTC ACG TAA TGG TTC TGC TGT GCC GGG TTG TGA CCC AGC      9697  TGT CCT TGG TAG GCT CTC CTG TTT AAT GAG CAA CTG CTA TAT GCC AGG     144145  CCC TGT TCT AGA AAC AGA TGA GGC CCC TGT TCC CAT GGA ACT TAG ATC     192193  TGA GTA TGT GGA CAG AGT GAG TAG GTT GCC AGA TAA TGT CAG AGG TAA     240241  GAA AAA AGC CAG GCA GAG GAC AGC AGT GCT GGT TTA GAC AAG GGT TGG     288289  CAA GGC CTC CCT GAT AAG GGG ACG TAT TTG CGC AGA CAC GGA AGC AGT     336337  CTG ATG GAA GGC TTG CCC TGT AGG GAC CTG GGG TGC AGA CTG AGC TGG     384385  GAG GGC TCT TGG CTT GCT CCA ATG AGG TAG GGG CGA AGA GAG GGC AGA     432433  ATG GCC CCC GTG CTG GTC CAG ATG TGG CCA GCG CCA GAT CGT ATA GAG     4801  Met Ala Pro Val Leu Val Gln Met Trp Pro Ala Pro Asp Arg Ile Glu      16481  CCG TGG AGG CAC GGT AAG GAC TTG GGG TTT GAG GGA GAT GAG GGC CCT     52817  Pro Trp Arg His Gly Lys Asp Leu Gly Phe Glu Gly Asp Glu Gly Pro      32529  GAG CAG GGG TGC CAT GAT CTA GCC TCT GCT CCA GAA GGA TCT GTC TGG     57633  Glu Gln Gly Cys His Asp Leu Ala Ser Ala Pro Glu Gly Ser Val Trp      48577  CTG CCA TGT GGG GGA CAC GGA GTG GAG CAA AGA CGG GAG CCC AGT GAG     62449  Leu Pro Cys Gly Gly His Gly Val Glu Gln Arg Arg Glu Pro Ser Glu      64625  AGT CGA GGG AGA GGT GAC CTC AGC TTG GGC TGC GGT GCA GGC CAT GGG     67265  Ser Arg Gly Arg Gly Asp Leu Ser Leu Gly Cys Gly Ala Gly His Gly      80673  ACT GGC AGG AGG TGG CTG GGG TTA CGC TGT CTT TTC TAA CAT TCA GCA     72081  Thr Gly Arg Arg Trp Leu Gly Leu Arg Cys Leu Phe ***                  93721  TTG GCT CAG GGG CCA GGT CAG GGC TCA CAG ACT GTT GCT ATA AAG GGC     768769  TGG GTG GCT TTC TTC CCC ACA GCT ACT CAG CCT AAT GCC ATT GCA GAG     816817  CAC ATG TAG CCA TGG ACA ACA CAA GGG GCG TAT CCG TGT TCC AGG ACA     864865  GCC ATA TTG ACA GGA ATA GGC AGG AGG CCA GAT TTG GTC CTC AGG CTG     912913  TAA TTT CTT GGC CCC TTG TCT AGG GAG AGG TAA ACG AGG GGA GGA GAG     960961  ATC AGT CAA GGA TGA CGT GAG GGT TTG CTG GGA GCA CCA GGA ATC CTG    10081009  GAG AAG GTA GTG GCA AGA GGG TGC AGC AAG CTC AGC TGG GCG GGG ATC    10561057  AAG TCT GAG GAC TTA ATG TCT CCT CTG ATC TCC AGA CCC ATA AGG GAG    11041105  ATG CTG AGT AGA CAA CTG GGG CTT ATG GGT CTG GAG TTC AGA GGA GAG    11521153  ATC GGG AAG GTG TCC ATT TGG AGT CAT CCA CGC AGA GAT GTG TGA AGG    12001201  CTG CTC AAT GAT TTT GAG GTT TAA AGA AAA AAA GAG ATG TGA AAC CAG    12481249  GGG CCC TGA TGA GGC TGC CCA GGT GGT AAG GAA GAC AGA AGA GAA GCC    12961297  ATG GGA CAG CTG AGC CCG GGC ACC CTC AAG CCT TGG AGG CAT GAA GTT    13441345  TGG TGG GGA TCT GGC AAA GAA CAC CTG GGA GCA GCC AGC GGG CAG CAG    13921393  ACC CCA GAG TAG CAG GGA AGA CAA GCA CTT CAA AGA GGC AGC GTC AGC    14401441  CAG GGG CAG TGG CTC AGC TGT AAT CCT AGC ACT TTG GGA GGC CAA GGA    14881489  TGG CAG ATC ACC TGA GGT TAG GGG TTC GAG ACT AGC CTG GCC AAC ATG    15361537  GTG AAA CCC TGT CTC TAC TAA AAA TAA AAA ATT AGC CAG GCA TTG GTG    15841585  GTA TGT GCC TGT AAT CCC AGC TAC TCG AGA GGC TGA GGC AGG AGA ATC    16321633  TCT TGA ACC CGG GAG GCA GAG GTT GCA GTG AGC CGA GAT CAT GCC ATT    16801681 GCA CTC CAG CCT GGG CAA CAA GAG CGA AAC TCC GTC TCA AAA AAA AAA   17281729 AAA AAA AAA A                                                     173810.SP2114bA:核苷酸序列(SEQ ID NO:28)长度:1980bp1    CTCTTCTTCC  CAAAGTCCTG  GTCAGTTCCC  CAGAAAGGAC  CAGTCATGGC  TGTGCAGGGT61    GACTGCCCTC  CCCCAGGTCA  GCCCTGTCGA  CAAAGGCAGG  GGCTTGGTTG  TCATTTCCAC121    CAAGTGGGAA  GACAGTATTA  ATAGATGGAG  AACCCTCTGC  AGTGGGAAGA  TTTCAGCAAT181    GGGCAAGCTG  GATAGAGCCG  TGGTTAGGAT  GGAGTTGTTT  GCTTGTTGCA  CTTGGAGCTC241    TTTATGAAGC  AAGGGCTCTG  CCTCCCAGCC  TGAGACCCAG  ACCCTGGTTT  GGACCCAGTA301    GAACTCTTGT  GGGCCCTGGG  TTGGTGTCTC  TGAGCAAATC  CCCAAAGCAG  GAGAGTCCCT361    AGCACCGTGA  GCTCTGTCAG  AACCTCCCAG  CTGGCCTTCC  TTCTGCCCTC  ATTGACAACC421    CTCTGACCCT  CTTGCTGAGC  ATAGACACAT  ATGTGATGTT  ACAGGAGCCA  GTGACCTTCC481    AGGATGTGGC  TGTGGACTTC  AGCCGGGAGG  AGTGGGGGCT  GCTGGGCCCG  ACACAGAGGA541    CCGAGTACCG  CGATGTGATG  CTGGAGACCT  TTGGGCACCT  GGTCTCTGTG  GGGTGGGAGA601    CTACACTGGA  AAATAAAGAG  TTAGCTCCAA  ATTCTGACAT  TCCTGAGGAA  GAACCAGCCC661    CCAGCCTGAA  AGTACAAGAA  TCCTCAAGGG  ATTGTGCCTT  GTCCTCTACA  TTAGAAGATA721    CCTTGCAGGG  TGGGGTCCAG  GAAGTCCAAG  ACACAGTGTT  GAAGCAGATG  GAGTCTGCTC781    AGGAAAAAGA  CCTTCCTCAG  AAGAAGCACT  TTGACAACCG  TGAGTCCCAG  GCAAACAGTG841    GTGCTCTTGA  CACAAACCAA  GTTTCGCTCC  AGAAAATTGA  CAACCCTGAG  TCCCAGGCAA901    ACAGTGGCGC  TCTTGACACA  AACCAAGTTT  TGCTCCACAA  AATTCCTCCT  AGAAAACGAT961    TGCGCAAACG  TGACTCACAA  GTTAAAAGTA  TGAAACATAA  TTCACGTGTA  AAAATTCATC1021    AGAAGAGCTG  TGAAAGGCAA  AAGGCCAAGG  AAGGCAATGG  TTGTAGGAAA  ACCTTCAGTC1081    GGAGTACTAA  ACAGATTACG  TTTATAAGAA  TTCACAAGGG  GAGCCAAGTT  TGCCGATGCA1141    GTGAATGTGG  TAAAATATTC  CGGAACCCAA  GATACTTTTC  TGTGCATAAG  AAAATCCATA1201    CCGGAGAGAG  GCCCTATGTG  TGTCAAGACT  GTGGGAAAGG  ATTTGTTCAG  AGCTCTTCCC1261    TCACACAGCA  TCAGAGAGTT  CATTCTGGAG  AGAGACCATT  TGAATGTCAG  GAGTGTGGGA1321    GGACCTTCAA  TGATCGCTCA  GCCATCTCCC  AGCACCTGAG  GACTCACACT  GGCGCTAAGC1381    CCTACAAGTG  TCAGGACTGT  GGAAAAGCCT  TCCGCCAGAG  TTCCCACCTC  ATCAGACATC1441    AGAGGACTCA  CACCGGGGAG  CGCCCATATG  CATGCAACAA  ATGTGGAAAG  GCCTTCACCC1501    AGAGCTCACA  CCTTATTGGG  CACCAGAGAA  CCCACAATAG  GACAAAGCGA  AAGAAGAAAC1561    AGCCTACCTC  ATAGCTCTCA  AGCCAGTTGA  AGAAACCTTG  CCTTTTCAGC  TTGACCCTGC1621    AATATAACAT  GCACAGGCCT  GCTTGTGAAT  CAGGACTGAA  TGTGAAAGGG  AAGTATTGAG1681    TGAGGACATT  CCCAAAACCA  AAGGACAACT  GAGGAGACTG  CCCAGCACAT  AATGAATAAA1741    TAAGAAAATG  AGTGAGGAGT  TATTAACATC  ATTTGGAAAA  AAGATTTCCC  ATTCACTTGA1801    TATTGTTTGT  TCACTCATTT  AGTCATTAAA  AGTGAGATTA  ATAAAATCTG  AAAATGTTAT1861    ATAATAACTT  TAAAAAGCCA  GGTAATTAAT  AATCTGCACT  GATATTACAT  CCACAGTACC1921    ACAGTATTTA  TGTGTATGAA  TTAAGGATTA  AAAGATAATG  TGGATAAAAA  AAAAAAAAAAB:氨基酸序列(SEQ ID NO:29)    长度:372个氨基酸1    MLQEPVTFQD  VAVDFSREEW  GLLGPTQRTE  YRDVMLETFG  HLVSVGWETT  LENKELAPNS61    DIPEEEPAPS  LKVQESSRDC  ALSSTLEDTL  QGGVQEVQDT  VLKQMESAQE  KDLPQKKHFD121    NRESQANSGA  LDTNQVSLQK  IDNPESQANS  GALDTNQVLL  HKIPPRKRLR  KRDSQVKSMK181    HNSRVKIHQK  SCERQKAKEG  NGCRKTFSRS  TKQITFIRIH  KGSQVCRCSE  CGKIFRNPRY241    FSVHKKIHTG  ERPYVCQDCG  KGFVQSSSLT  QHQRVHSGER  PFECQECGRT  FNDRSAISQH301    LRTHTGAKPY  KCQDCGKAFR  QSSHLIRHQR  THTGERPYAC  NKCGKAFTQS  SHLIGHQRTH361    NRTKRKKKQP  TSC.核苷酸及氨基酸组合序列(SEQ ID NO:30)克隆号:  SP2114b起始编码子:456 ATG    终止编码子:1572 TAG蛋白质分子量:42445.771   CT CTT CTT CCC AAA GTC CTG GTC AGT TCC CCA GAA AGG ACC AGT CAT      4748  GGC TGT GCA GGG TGA CTG CCC TCC CCC AGG TCA GCC CTG TCG ACA AAG      9596  GCA GGG GCT TGG TTG TCA TTT CCA CCA AGT GGG AAG ACA GTA TTA ATA     143144  GAT GGA GAA CCC TCT GCA GTG GGA AGA TTT CAG CAA TGG GCA AGC TGG     191192  ATA GAG CCG TGG TTA GGA TGG AGT TGT TTG CTT GTT GCA CTT GGA GCT     239240  CTT TAT GAA GCA AGG GCT CTG CCT CCC AGC CTG AGA CCC AGA CCC TGG     287288  TTT GGA CCC AGT AGA ACT CTT GTG GGC CCT GGG TTG GTG TCT CTG AGC     335336  AAA TCC CCA AAG CAG GAG AGT CCC TAG CAC CGT GAG CTC TGT CAG AAC     383384  CTC CCA GCT GGC CTT CCT TCT GCC CTC ATT GAC AAC CCT CTG ACC CTC     431432  TTG CTG AGC ATA GAC ACA TAT GTG ATG TTA CAG GAG CCA GTG ACC TTC     4791                                  Met Leu Gln Glu Pro Val Thr Phe       8480  CAG GAT GTG GCT GTG GAC TTC AGC CGG GAG GAG TGG GGG CTG CTG GGC     5279  Gln Asp Val Ala Val Asp Phe Ser Arg Glu Glu Trp Gly Leu Leu Gly      24528  CCG ACA CAG AGG ACC GAG TAC CGC GAT GTG ATG CTG GAG ACC TTT GGG     57525  Pro Thr Gln Arg Thr Glu Tyr Arg Asp Val Met Leu Glu Thr Phe Gly      40576  CAC CTG GTC TCT GTG GGG TGG GAG ACT ACA CTG GAA AAT AAA GAG TTA     62341  His Leu Val Ser Val Gly Trp Glu Thr Thr Leu Glu Asn Lys Glu Leu      56624  GCT CCA AAT TCT GAC ATT CCT GAG GAA GAA CCA GCC CCC AGC CTG AAA     67157  Ala Pro Asn Ser Asp Ile Pro Glu Glu Glu Pro Ala Pro Ser Leu Lys      72672  GTA CAA GAA TCC TCA AGG GAT TGT GCC TTG TCC TCT ACA TTA GAA GAT     71973  Val Gln Glu Ser Ser Arg Asp Cys Ala Leu Ser Ser Thr Leu Glu Asp      88720  ACC TTG CAG GGT GGG GTC CAG GAA GTC CAA GAC ACA GTG TTG AAG CAG     76789  Thr Leu Gln Gly Gly Val Gln Glu Val Gln Asp Thr Val Leu Lys Gln     104768  ATG GAG TCT GCT CAG GAA AAA GAC CTT CCT CAG AAG AAG CAC TTT GAC     815105  Met Glu Ser Ala Gln Glu Lys Asp Leu Pro Gln Lys Lys His Phe Asp     120816  AAC CGT GAG TCC CAG GCA AAC AGT GGT GCT CTT GAC ACA AAC CAA GTT     863121  Asn Arg Glu Ser Gln Ala Asn Ser Gly Ala Leu Asp Thr Asn Gln Val     136864  TCG CTC CAG AAA ATT GAC AAC CCT GAG TCC CAG GCA AAC AGT GGC GCT     911137  Ser Leu Gln Lys Ile Asp Asn Pro Glu Ser Gln Ala Asn Ser Gly Ala     152912  CTT GAC ACA AAC CAA GTT TTG CTC CAC AAA ATT CCT CCT AGA AAA CGA     959153  Leu Asp Thr Asn Gln Val Leu Leu His Lys Ile Pro Pro Arg Lys Arg     168960  TTG CGC AAA CGT GAC TCA CAA GTT AAA AGT ATG AAA CAT AAT TCA CGT    1007169  Leu Arg Lys Arg Asp Ser Gln Val Lys Ser Met Lys His Asn Ser Arg     1841008  GTA AAA ATT CAT CAG AAG AGC TGT GAA AGG CAA AAG GCC AAG GAA GGC    1055185  Val Lys Ile His Gln Lys Ser Cys Glu Arg Gln Lys Ala Lys Glu Gly     2001056  AAT GGT TGT AGG AAA ACC TTC AGT CGG AGT ACT AAA CAG ATT ACG TTT    1103201  Asn Gly Cys Arg Lys Thr Phe Ser Arg Ser Thr Lys Gln Ile Thr Phe     2161104  ATA AGA ATT CAC AAG GGG AGC CAA GTT TGC CGA TGC AGT GAA TGT GGT    1151217  Ile Arg Ile His Lys Gly Ser Gln Val Cys Arg Cys Ser Glu Cys Gly     2321152  AAA ATA TTC CGG AAC CCA AGA TAC TTT TCT GTG CAT AAG AAA ATC CAT    1199233  Lys Ile Phe Arg Asn Pro Arg Tyr Phe Ser Val His Lys Lys Ile His     2481200  ACC GGA GAG AGG CCC TAT GTG TGT CAA GAC TGT GGG AAA GGA TTT GTT    1247249  Thr Gly Glu Arg Pro Tyr Val Cys Gln Asp Cys Gly Lys Gly Phe Val     2641248  CAG AGC TCT TCC CTC ACA CAG CAT CAG AGA GTT CAT TCT GGA GAG AGA    1295265  Gln Ser Ser Ser Leu Thr Gln His Gln Arg Val His Ser Gly Glu Arg     2801296  CCA TTT GAA TGT CAG GAG TGT GGG AGG ACC TTC AAT GAT CGC TCA GCC    1343281  Pro Phe Glu Cys Gln Glu Cys Gly Arg Thr Phe Asn Asp Arg Ser Ala     2961344  ATC TCC CAG CAC CTG AGG ACT CAC ACT GGC GCT AAG CCC TAC AAG TGT    1391297  Ile Ser Gln His Leu Arg Thr His Thr Gly Ala Lys Pro Tyr Lys Cys     3121392  CAG GAC TGT GGA AAA GCC TTC CGC CAG AGT TCC CAC CTC ATC AGA CAT    1439313  Gln Asp Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu Ile Arg His     3281440  CAG AGG ACT CAC ACC GGG GAG CGC CCA TAT GCA TGC AAC AAA TGT GGA    1487329  Gln Arg Thr His Thr Gly Glu Arg Pro Tyr Ala Cys Asn Lys Cys Gly     3441488  AAG GCC TTC ACC CAG AGC TCA CAC CTT ATT GGG CAC CAG AGA ACC CAC    1535345  Lys Ala Phe Thr Gln Ser Ser His Leu Ile Gly His Gln Arg Thr His     3601536  AAT AGG ACA AAG CGA AAG AAG AAA CAG CCT ACC TCA TAG CTC TCA AGC    1583361  Asn Arg Thr Lys Arg Lys Lys Lys Gln Pro Thr Ser ***                 3731584  CAG TTG AAG AAA CCT TGC CTT TTC AGC TTG ACC CTG CAA TAT AAC ATG    16311632  CAC AGG CCT GCT TGT GAA TCA GGA CTG AAT GTG AAA GGG AAG TAT TGA    16791680  GTG AGG ACA TTC CCA AAA CCA AAG GAC AAC TGA GGA GAC TGC CCA GCA    17271728  CAT AAT GAA TAA ATA AGA AAA TGA GTG AGG AGT TAT TAA CAT CAT TTG    17751776  GAA AAA AGA TTT CCC ATT CAC TTG ATA TTG TTT GTT CAC TCA TTT AGT    18231824  CAT TAA AAG TGA GAT TAA TAA AAT CTG AAA ATG TTA TAT AAT AAC TTT    18711872  AAA AAG CCA GGT AAT TAA TAA TCT GCA CTG ATA TTA CAT CCA CAG TAC    19191920  CAC AGT ATT TAT GTG TAT GAA TTA AGG ATT AAA AGA TAA TGT GGA TAA    19671968  AAA AAA AAA AAA A                                                  1980
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims (10)

1.一种分离的具有促进癌细胞生长功能的人蛋白,其特征在于,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ IDNO:29;
或其保守性变异多肽、或其活性片段、或其活性衍生物。
2.如权利要求1所述的多肽,其特征在于,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29。
3.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:
(a)编码如权利要求1和2所述多肽的多核苷酸;
(b)与多核苷酸(a)互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ IDNO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30的编码区序列或全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求6所述的载体转化或转导的宿主细胞;
(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有促进癌细胞生长功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含:
(a)在适合表达具有促进癌细胞生长功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;
(b)从培养物中分离出具有促进癌细胞生长功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有促进癌细胞生长功能的人蛋白特异性结合的抗体。
10.一种核酸分子,它含有权利要求3所述的多核苷酸中连续的10-800个核苷酸。
CNB001271032A 2000-10-31 2000-10-31 具有促进癌细胞生长功能的新的人蛋白及其编码序列 Expired - Fee Related CN1155616C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB001271032A CN1155616C (zh) 2000-10-31 2000-10-31 具有促进癌细胞生长功能的新的人蛋白及其编码序列

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB001271032A CN1155616C (zh) 2000-10-31 2000-10-31 具有促进癌细胞生长功能的新的人蛋白及其编码序列

Publications (2)

Publication Number Publication Date
CN1351082A true CN1351082A (zh) 2002-05-29
CN1155616C CN1155616C (zh) 2004-06-30

Family

ID=4592123

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB001271032A Expired - Fee Related CN1155616C (zh) 2000-10-31 2000-10-31 具有促进癌细胞生长功能的新的人蛋白及其编码序列

Country Status (1)

Country Link
CN (1) CN1155616C (zh)

Also Published As

Publication number Publication date
CN1155616C (zh) 2004-06-30

Similar Documents

Publication Publication Date Title
CN1343725A (zh) 人血管生成素样蛋白和编码序列及其用途
CN1351082A (zh) 具有促进癌细胞生长功能的新的人蛋白及其编码序列
CN1368509A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1313297A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1368510A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1403478A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1351081A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1323803A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1309135A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN100478354C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1313298A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN100478355C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1329065A (zh) 具有促进癌细胞生长功能的新的人蛋白及其编码序列
CN1351079A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1313317A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1369505A (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1323802A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1351080A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1369506A (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1368511A (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1421457A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1313316A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1324820A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1313315A (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1458169A (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee