CN1155616C - 具有促进癌细胞生长功能的新的人蛋白及其编码序列 - Google Patents
具有促进癌细胞生长功能的新的人蛋白及其编码序列 Download PDFInfo
- Publication number
- CN1155616C CN1155616C CNB001271032A CN00127103A CN1155616C CN 1155616 C CN1155616 C CN 1155616C CN B001271032 A CNB001271032 A CN B001271032A CN 00127103 A CN00127103 A CN 00127103A CN 1155616 C CN1155616 C CN 1155616C
- Authority
- CN
- China
- Prior art keywords
- seq
- ctg
- cag
- leu
- aaa
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明公开了一类新的具有促进癌细胞生长功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有促进癌细胞生长功能的人蛋白的多核苷酸的用途。
Description
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有促进癌细胞生长功能的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究与癌细胞生长相关的人蛋白及其激动剂/抑制剂。
本发明的目的是提供一类新的具有促进癌细胞生长功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有促进癌细胞生长功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有促进癌细胞生长功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、SEQ ID NO:6、SEQID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有促进癌细胞生长功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有促进癌细胞生长功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有促进癌细胞生长功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有促进癌细胞生长功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有促进癌细胞生长功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可用于促进细胞的生长。本发明还提供了一种药物组合物,它含有安全有效量的针对本发明的具有促进癌细胞生长功能的蛋白多肽的拮抗剂(如抗体)以及药学上可接受的载体。该药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
本发明采用大规模cDNA克隆转染癌细胞,在获得具有促进癌细胞生长作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有促进癌细胞生长功能的蛋白对癌细胞(肝癌细胞)具有促进克隆形成的作用,其促进作用在50%或50%以上。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有促进癌细胞生长功能的蛋白或多肽”是指具有促进癌细胞生长功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有促进癌细胞生长功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。具有促进癌细胞生长功能的蛋白多肽的纯度能用氨基酸序列分析。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有促进癌细胞生长功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有促进癌细胞生长功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP6414蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。以PP6968蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对于其他具有促进癌细胞生长功能的蛋白,
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽(以PP6414蛋白为例)有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有促进癌细胞生长功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有促进癌细胞生长功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,MolecularCloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有促进癌细胞生长功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有促进癌细胞生长功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或具有促进癌细胞生长功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有促进癌细胞生长功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有促进癌细胞生长功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有促进癌细胞生长功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有促进癌细胞生长功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.Molecular Cloning,a LaboratoryManual,cold Spring Harbor Laboratory.New York,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有促进癌细胞生长功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有促进癌细胞生长功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有促进癌细胞生长功能的蛋白功能的抗体、多肽或其它配体。例如,该抗体可用于治疗癌症或细胞异常增殖。用表达的重组具有促进癌细胞生长功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有促进癌细胞生长功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有促进癌细胞生长功能的人蛋白的药剂的方法。激动剂提高具有促进癌细胞生长功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有促进癌细胞生长功能的人蛋白的膜制剂与标记的具有促进癌细胞生长功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有促进癌细胞生长功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有促进癌细胞生长功能的人蛋白的拮抗剂可以与具有促进癌细胞生长功能的人蛋白结合并消除其功能,或是抑制具有促进癌细胞生长功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有促进癌细胞生长功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有促进癌细胞生长功能的蛋白加入生物分析测定中,通过测定化合物影响具有促进癌细胞生长功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有促进癌细胞生长功能的蛋白或其特异性抗体,可按有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有促进癌细胞生长功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有促进癌细胞生长功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有促进癌细胞生长功能的蛋白的无表达或异常/无活性的具有促进癌细胞生长功能的蛋白的表达所致的细胞发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有促进癌细胞生长功能的蛋白,以抑制内源性的具有促进癌细胞生长功能的蛋白活性。例如,一种变异的具有促进癌细胞生长功能的蛋白可以是缩短的、缺失了信号传导功能域的具有促进癌细胞生长功能的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有促进癌细胞生长功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有促进癌细胞生长功能的蛋白基因转移至细胞内。构建携带具有促进癌细胞生长功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有促进癌细胞生长功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有促进癌细胞生长功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。由于本发明蛋白具有促进癌细胞生长的功能,因此本发明蛋白编码序列的反义序列,可被引入细胞以抑制细胞的异常增殖(如癌变)。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有促进癌细胞生长功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗具有促进癌细胞生长功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有促进癌细胞生长功能的人蛋白。
与具有促进癌细胞生长功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有促进癌细胞生长功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有促进癌细胞生长功能的人蛋白的产生或活性,从而抑制癌细胞的生长和/或细胞的异常增殖。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有促进癌细胞生长功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭具有促进癌细胞生长功能的人蛋白阳性的细胞。
多克隆抗体的生产可用具有促进癌细胞生长功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有促进癌细胞生长功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler andMilstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.Pat No.4946778)也可用于生产抗具有促进癌细胞生长功能的人蛋白的单链抗体。
能与具有促进癌细胞生长功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有促进癌细胞生长功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有促进癌细胞生长功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有促进癌细胞生长功能的人蛋白水平,可以用作解释具有促进癌细胞生长功能的人蛋白在各种疾病中的重要性和用于诊断具有促进癌细胞生长功能的蛋白起作用的疾病。
具有促进癌细胞生长功能的蛋白的多聚核苷酸可用于具有促进癌细胞生长功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有促进癌细胞生长功能的蛋白的多聚核苷酸可用于检测具有促进癌细胞生长功能的蛋白的表达与否或在疾病状态下具有促进癌细胞生长功能的蛋白的异常表达。如具有促进癌细胞生长功能的蛋白DNA序列可用于对活检标本的杂交以判断具有促进癌细胞生长功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有促进癌细胞生长功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有促进癌细胞生长功能的蛋白的转录产物。
检测具有促进癌细胞生长功能的蛋白基因的突变也可用于诊断具有促进癌细胞生长功能的蛋白相关的疾病。具有促进癌细胞生长功能的蛋白突变的形式包括与正常野生型具有促进癌细胞生长功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。现在,只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。根据本发明,为了将这些序列与疾病相关基因相关联,其重要的第一步就是将这些DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力,被精确定位至与疾病有关的染色体区域的cDNA,可以是50至500个潜在致病基因间之一种(假定1兆碱基作图分辨能力和每20kb对应于一个基因)。
本发明的具有促进癌细胞生长功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有促进癌细胞生长功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:cDNA基因的获得及对癌细胞克隆形成的促进作用
SP2114b来自于从GIBCO BRL公司购得的肝cDNA文库(目录号:10422-012),PP6414、PP6968、PP7122、PP7157、PP7517、PP7683、PP7879、PP8376和PP10029是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系3T3。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克隆形成,计数。发现以上2个克隆有促进细胞克隆形成作用,结果如下表所示。
cDNA克隆转染细胞(3T3)克隆形成情况
cDNA克隆名称 | cDNA克隆数(三个重复) | 空载体克隆数(三个重复) |
PP6414PP6968PP7122PP7157PP7517PP7683PP7879PP8376PP10029SP2114b | 24 17 1040 41 5010 44 2045 42 4971 65 5050 45 6070 50 2045 58 5347 49 5088 80 68 | 8 0 27 6 57 6 67 6 67 6 67 6 617 15 2114 3 716 14 1060 50 65 |
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28)。
实施例2:从胎盘cDNA中PCR获得全长基因:
取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表所示),按97℃ 3分钟、1个循环;94℃ 30秒→60℃ 30秒→72℃ 1分钟,共35个循环;72℃ 10分钟,1个循环,进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符。(注:对于SP2114b,可使用从GIBCO BRL公司购得的肝cDNA文库(目录号:10422-012)作为模板)。随后用常规技术将扩增产物转入宿主细胞,从而获得重组蛋白。
基因特异引物
克隆名称 | 特异引物1(5′→3′) | 特异引物2(5′→3′) |
PP6414 | TGGGTGGTCGATGGGACT | CTACCGTGCCCAGCCTAAT |
PP6968 | GGCTCCATCTCTCTGTCACC | ATGGCTGCTCTTCCACCTAA |
PP7122 | CAGCAAGACTGTCAGGGTGA | AGACCAACTCAGAAGGCAGC |
PP7157 | CCATGGGGTGCTGCTACA | GTCCAAGGACCCCTCTCTTC |
PP7517 | GGAGGTGAATAAGCTGGCTG | CAGCTGATACTGGGTGCGTA |
PP7683 | GGCTGTGGCTCAACATAGAA | GACTCCATCGCAAACAAACA |
PP7879 | CCCTCTGAATGAAAGCCAAG | CCACCCTGACAGTCCTGTTT |
PP8376 | ACCTCGGCTTCCCAGTTTAT | GCAGAGGAGTCAATTCAGGC |
PP10029 | GCTTGCTCCAATGAGGTAGG | GAAAAGACAGCCTAACCCCA |
SP2114b | AGCTCTGTCAGAACCTCCCA | GCAAGGTTTCTTCAACTGGC |
实施例3:cDNA克隆序列分析
1.PP6414
A:核苷酸序列(SEQ ID NO:1)长度:1914bp
1 GCCGGGGACC ACACAGAGAA TAACTTGTCT GACTACCAGT ATTCTTGGAT GCAGAAGTGC
61 TGAAGATGAG CACACACACG TACGGAGAAT TTCTGGAGAA TTCAGCTGCT CAGAACAAGA
121 ACTGAGATCC AGAGAGATGA TGACTTTGCC CATAGACCAA ACAAAGAAAT ACATGTTTCA
181 GTCCTGTGTC CTCCTGCTAT GTGTGTCCGG AATTGGTGGG TTCTTGGTCT CACTGACTTC
241 AAGAATGAAG CTGCGGACCC TCGCGGTGAG TGTTACAGTT CTTAAAGGCA GTGTGTCCAG
301 AGTTTGTTCC TACTGATGTG TGGATGTGTT CGGAGTATCT TCCTTCTGGT GGGTTCGTGG
361 TCTCGCTGGC TCAGGAGTGA AGCTGCAGAC CTTCGTGGTG AGTGTTACAG CTCTTAAGGT
421 GGTGCGTCTG GAGTTGTTCA TTCCTCCCAG CGGGCTCGTG GTCTCACTGG CTTCAGGAGT
481 GAAGCTGCAG ACCTTCGCGG TGAGTGTTAC AGCTCATAAA GGCAGCGTGG ACCCAAAGAG
541 TGAGAAGTAG CAAGATTTAT TGCGAAGAGC GAAAGAACAA AGCTTCCACG ATGTGGAAGG
601 AGACCCCAGC AGATTGCCAC TGCTGGCTTG GGCAGCCTGC TTTTATTCTC TTATTTGGCC
661 CCCACCCACA TCCTGGTGAT TGGTAGAGCC CAGTGGTCTG TTTTGACAGG GCGCTGATTG
721 GTGCGTTTAC AATCACTGAG CCAGATACAA AGGTTCTCCA GGTCCCCACT AGATTAGCTA
781 GATACAGAGT GTCTATTGGT GCATTCACAA ACCCTGAGCT AGACACAGGG TGTTGATTGG
841 TGTGTTTACA AACCTTGAGC TAGAGACAGA GTGCCGATTG GTGTATTTAC AATCCCTGAG
901 CTAGACACAA AGGTTCTCCA CGTCCGCACC AGACTCAGGA GCCCAGCTGG CTTCACCCAG
961 TGGATCCCGC ACTGCCCCTG CAGGTGGAGC TGCCTGCCAG TCCCTCGCGG TGCGCCCGCA
1021 CTCCTCAGCC CTTGGGTGGT CGATGGGACT GGGCGCTGTG GAGCAGGAGG CGGCGCTTGC
1081 TGGGGAGGCT CCTGCGGCAC AGGTGCCCAC GGAGGGGGTG GGAGGCTCAG GCATGGCGGG
1141 CTGCAGGTCC CGAGCCCTGC CCCTTGGGAA GGCAGCTAGG GCCCCGGGAG AAATCGAGCG
1201 CAGCGCCGGT GGGTCAGCAC TGCTGGGGGA CCCAGTACAC CCTCCACAGC CACTGGCTCG
1261 GGTGCTAAGC CCCTCATTGC CTGGGGCCGG CAGGGCCTGC CGGCTGCTCC GAGTGCGGGC
1321 CGCCAAGCTC ACACCCACCC AGAACTCCAG CTGGCCTGCA AGCGTCGCGT GCAGCCCCGG
1381 TTCCTGCTCG CACCTCTCCC TCCACACCTC CCTGCAAGCT GAGGGAGCCG GCTCCGGCCT
1441 TGGCAAGCCC AGAAAGGGGC TCCCACAGTG CAGCGGTGGG CTGAAGGGCT CCTCAAGTGC
1501 CGCCAAAGTG GGAGCCCAGG CAGAGGAGGC ACCGAGAGCG AGTGAGGGCT CTGAGGACTG
1561 CCAGCACGCT GTCACCTCTC ACTAGTAGCT ATCCTACTTT TAAATAAAGA ATTAGGCTGG
1621 GCACGGTAGC TCACGCCTGT AATCCCAGCA CTTCGGGAGG CCAAGGGGGG TGGATCACCT
1681 GAGGTCAGGA ATTCGAGACC AGCCTGGCCA ACATGGCAAA ACCCCATCTC TACTAAGAAT
1741 ACAAAAATTT GCCAGGCATG GTGGCGGGTG CCTGTAATCC CAGCTGCTTG AGAGACTGAG
1801 GTGGGAGAAT CACTTGAACC CGGGAGGCGA AGGTTGCGGT AAGCCGAGAT TGCACCACGG
1861 TGCTTCGGCC TGGGCGGCAG AGTGAGACTC TGTTTCAAAA AAAAAAAAAA AAAA
B:氨基酸序列(SEQ ID NO:2)长度:180个氨基酸
1 MGLGAVEQEA ALAGEAPAAQ VPTEGVGGSG MAGCRSRALP LGKAARAPGE IERSAGGSAL
61 LGDPVHPPQP LARVLSPSLP GAGRACRLLR VRAAKLTPTQ NSSWPASVAC SPGSCSHLSL
121 HTSLQAEGAG SGLGKPRKGL PQCSGGLKGS SSAAKVGAQA EEAPRASEGS EDCQHAVTSH
C.核苷酸及氨基酸组合序列(SEQ ID NO:3)
克隆号:PP6414
起始编码子:1043 ATG 终止编码子:1583 TAG
蛋白质分子量:17679.87
1 G CCG GGG ACC ACA CAG AGA ATA ACT TGT CTG ACT ACC AGT ATT CTT 46
47 GGA TGC AGA AGT GCT GAA GAT GAG CAC ACA CAC GTA CGG AGA ATT TCT 94
95 GGA GAA TTC AGC TGC TCA GAA CAA GAA CTG AGA TCC AGA GAG ATG ATG 142
143 ACT TTG CCC ATA GAC CAA ACA AAG AAA TAC ATG TTT CAG TCC TGT GTC 190
191 CTC CTG CTA TGT GTG TCC GGA ATT GGT GGG TTC TTG GTC TCA CTG ACT 238
239 TCA AGA ATG AAG CTG CGG ACC CTC GCG GTG AGT GTT ACA GTT CTT AAA 286
287 GGC AGT GTG TCC AGA GTT TGT TCC TAC TGA TGT GTG GAT GTG TTC GGA 334
335 GTA TCT TCC TTC TGG TGG GTT CGT GGT CTC GCT GGC TCA GGA GTG AAG 382
383 CTG CAG ACC TTC GTG GTG AGT GTT ACA GCT CTT AAG GTG GTG CGT CTG 430
431 GAG TTG TTC ATT CCT CCC AGC GGG CTC GTG GTC TCA CTG GCT TCA GGA 478
479 GTG AAG CTG CAG ACC TTC GCG GTG AGT GTT ACA GCT CAT AAA GGC AGC 526
527 GTG GAC CCA AAG AGT GAG AAG TAG CAA GAT TTA TTG CGA AGA GCG AAA 574
575 GAA CAA AGC TTC CAC GAT GTG GAA GGA GAC CCC AGC AGA TTG CCA CTG 622
623 CTG GCT TGG GCA GCC TGC TTT TAT TCT CTT ATT TGG CCC CCA CCC ACA 670
671 TCC TGG TGA TTG GTA GAG CCC AGT GGT CTG TTT TGA CAG GGC GCT GAT 718
719 TGG TGC GTT TAC AAT CAC TGA GCC AGA TAC AAA GGT TCT CCA GGT CCC 766
767 CAC TAG ATT AGC TAG ATA CAG AGT GTC TAT TGG TGC ATT CAC AAA CCC 814
815 TGA GCT AGA CAC AGG GTG TTG ATT GGT GTG TTT ACA AAC CTT GAG CTA 862
863 GAG ACA GAG TGC CGA TTG GTG TAT TTA CAA TCC CTG AGC TAG ACA CAA 910
911 AGG TTC TCC ACG TCC GCA CCA GAC TCA GGA GCC CAG CTG GCT TCA CCC 958
959 AGT GGA TCC CGC ACT GCC CCT GCA GGT GGA GCT GCC TGC CAG TCC CTC 1006
1007 GCG GTG CGC CCG CAC TCC TCA GCC CTT GGG TGG TCG ATG GGA CTG GGC 1054
1 Met Gly Leu Gly 4
1055 GCT GTG GAG CAG GAG GCG GCG CTT GCT GGG GAG GCT CCT GCG GCA CAG 1102
5 Ala Val Glu Gln Glu Ala Ala Leu Ala Gly Glu Ala Pro Ala Ala Gln 20
1103 GTG CCC ACG GAG GGG GTG GGA GGC TCA GGC ATG GCG GGC TGC AGG TCC 1150
21 Val Pro Thr Glu Gly Val Gly Gly Ser Gly Met Ala Gly Cys Arg Ser 36
1151 CGA GCC CTG CCC CTT GGG AAG GCA GCT AGG GCC CCG GGA GAA ATC GAG 1198
37 Arg Ala Leu Pro Leu Gly Lys Ala Ala Arg Ala Pro Gly Glu Ile Glu 52
1199 CGC AGC GCC GGT GGG TCA GCA CTG CTG GGG GAC CCA GTA CAC CCT CCA 1246
53 Arg Ser Ala Gly Gly Ser Ala Leu Leu Gly Asp Pro Val His Pro Pro 68
1247 CAG CCA CTG GCT CGG GTG CTA AGC CCC TCA TTG CCT GGG GCC GGC AGG 1294
69 Gln Pro Leu Ala Arg Val Leu Ser Pro Ser Leu Pro Gly Ala Gly Arg 84
1295 GCC TGC CGG CTG CTC CGA GTG CGG GCC GCC AAG CTC ACA CCC ACC CAG 1342
85 Ala Cys Arg Leu Leu Arg Val Arg Ala Ala Lys Leu Thr Pro Thr Gln 100
1343 AAC TCC AGC TGG CCT GCA AGC GTC GCG TGC AGC CCC GGT TCC TGC TCG 1390
101 Asn Ser Ser Trp Pro Ala Ser Val Ala Cys Ser Pro Gly Ser Cys Ser 116
1391 CAC CTC TCC CTC CAC ACC TCC CTG CAA GCT GAG GGA GCC GGC TCC GGC 1438
117 His Leu Ser Leu His Thr Ser Leu Gln Ala Glu Gly Ala Gly Ser Gly 132
1439 CTT GGC AAG CCC AGA AAG GGG CTC CCA CAG TGC AGC GGT GGG CTG AAG 1486
133 Leu Gly Lys Pro Arg Lys Gly Leu Pro Gln Cys Ser Gly Gly Leu Lys 148
1487 GGC TCC TCA AGT GCC GCC AAA GTG GGA GCC CAG GCA GAG GAG GCA CCG 1534
149 Gly Ser Ser Ser Ala Ala Lys Val Gly Ala Gln Ala Glu Glu Ala Pro 164
1535 AGA GCG AGT GAG GGC TCT GAG GAC TGC CAG CAC GCT GTC ACC TCT CAC 1582
165 Arg Ala Ser Glu Gly Ser Glu Asp Cys Gln His Ala Val Thr Ser His 180
1583 TAG TAG CTA TCC TAC TTT TAA ATA AAG AAT TAG GCT GGG CAC GGT AGC 1630
181 *** 181
1631 TCA CGC CTG TAA TCC CAG CAC TTC GGG AGG CCA AGG GGG GTG GAT CAC 1678
1679 CTG AGG TCA GGA ATT CGA GAC CAG CCT GGC CAA CAT GGC AAA ACC CCA 1726
1727 TCT CTA CTA AGA ATA CAA AAA TTT GCC AGG CAT GGT GGC GGG TGC CTG 1774
1775 TAA TCC CAG CTG CTT GAG AGA CTG AGG TGG GAG AAT CAC TTG AAC CCG 1822
1823 GGA GGC GAA GGT TGC GGT AAG CCG AGA TTG CAC CAC GGT GCT TCG GCC 1870
1871 TGG GCG GCA GAG TGA GAC TCT GTT TCA AAA AAA AAA AAA AAA AA 1914
2.PP6968
A:核苷酸序列(SEQ ID NO:4)长度:2361bp
1 GCGCTGACAG AGGCAAAAAT CTGCTAACTC AGGGGGCAGA CTCAACCAAG ACTGTGAGCA
61 GGCCTGGGGA ATGACCCCCC GATCTCCAAC CAGTGCCTTC CGCAGCTGCA CGGCTGTCTC
121 CAGCTGTCTC TGCCCCTCTT CCTGGCCCTG GCTCCATCTC TCTGTCACCT CACCCTTCCC
181 TGTGCCACAT GGGCCCTCTC TCTCCTGCCA GGACGCTGCG GCTCTGGGGA CCTCGGAGCC
241 TGGGGGTGGC TCTGGGAGTC TTCATGACCA TTGGCTTTGC ACTCCAGCTC TTGGGAGGGC
301 CCTTCCAGAG GAGGCTACCT GGGCTACAGC TCCGACAGCC CTCGGCCCCA TCCCTACGAC
361 CAGCCCTTCC GTCCTGCCCA CCCCGGCAGC GACTGGTGTT CCTGAAGACA CATAAATCCG
421 GGAGCAGCTC TGTGCTGAGC CTGCTTCACC GCTATGGGGA CCAGCACGGG CTGCGCTTCG
481 CCCTCCCTGC CCGCTACCAG TTTGGCTACC CAAAGCTCTT CCAGGCCTCT AGGGTAAAAG
541 GCTACCGCCC ACAGGGTGGA GGCACCCAGC TCCCCTTCCA CATCCTCTGT CACCACATGA
601 GGTTCAACCT GAAAGAGGTA CTTCAGGTCA TGCCTTCTGA CAGCTTCTTT TTTTCCATTG
661 TCCGAGACCC AGCGGCTCTG GCTCGCTCTG CCTTCTCCTA CTATAAATCC ACCTCATCAG
721 CCTTCCGCAA GTCACCATCT TTGGCTGCCT TCCTGGCCAA TCCTCGAGGC TTCTACAGGC
781 CTGGGGCCGT GGGGACCACT TACGCTCGCA ACTTACTATG GTTTGACTTT GGCCTGCCCT
841 TTCCCCCAGA GAAGAGGGCC AAGAGAGGGA ATATTCATCC CCCCAGAGAC CCCAACCCCC
901 CACAGCTGCA GGTCTTGCCT TCTGGTGCTG GCCCTCGAGC CCAAACCCTC AATCCCAATG
961 CCCTCATCCA TCCTGTTTCC ACTGTTACTG ATCATCGCAG CCAGATATCA AGCCCTGCCT
1021 CTTTCGATTT GGGGTCTTCA TCCTTCATCC AGTGGGGTCT GGCCTGGCTG GACTCTGTCT
1081 TTGACCTGGT CATGGTGGCT GAGTACTTCG ATGAGTCATT GGTTCTGCTG GCAGATGCCC
1141 TGTGCTGGGG TCTAGATGAC GTGGTGGGCT TCATGCACAA TGCCCAGGCT GGACATAAGC
1201 AGGGCCTCAG CACTGTCAGC AACAGTGGAC TGACTGCGGA GGACCGGCAG CTGACTGCAC
1261 GGGCCCGAGC CTGGAACAAC CTGGACTGGG CTCTCTATGT CCACTTCAAC CGCAGTCTCT
1321 GGGCACGGAT AGAGAAATAC GGCCAGGGCC GGCTGCAGAC AGCTGTGGCC GAGCTCCGGG
1381 CTCGCCGAGA GGCCCTAGCG AAACATTGTC TGGTAGGGGG TGAGGCTTCT GACCCCAAAT
1441 ACATCACTGA TCGCCGGTTC CGCCCCTTCC AGTTTGGGTC AGCTAAGGTT TTGGGCTATA
1501 TACTTCGGAG TGGATTGAGC CCCCAAGACC AAGAGGAATG TGAGCGCCTA GCTACCCCTG
1561 AGCTCCAGTA CAAGGACAAG CTGGATGTCA AGCAGTTCCC CCCTACCGTC TCACTGCCCC
1621 TCAAGACTTC AAGGCCACTC TCCCCATAAA CATCAGACTA CAGATTTAGG TGGAAGAGCA
1681 GCCATGTTTG AAGGGCACAT GTGATGAGTG GGGGGCAGCA AGATGCCATT TCTGCATCTC
1741 CCAGAAGGGA TGAGTCTTTG TCCCGATGCA AGCCCCCTCT TCGCTGGGCT CCCAGCAGTG
1801 CTTCCCTCCT CCACCCTCCA CTCATTTTGT TCTTTCCCCC CAACTTTTTT TTTTTTTGAA
1861 ACGGAGTCTT GCTCTGTCCC CCAGGCTGGA GTGCAGTGGC ATGATCTCGG CTCACTGCAA
1921 CCTCTGCCTC CCAGGTTCAA GCGATTCTCC TGCCTCAGCC TCCAGAGTAG CTAGGATTAC
1981 AGATACGTGC CACCATACCC GGCTAATTTT TATATTTTTA GAGACAGGGA TTCAACATGT
2041 TGGTTAGGCT GGCCTTGAAC TCCTCACCTC AGGTGATCCA CATGACTCTG CCTCCCAAAG
2101 TGCTGCCATT ACAGGCGTGA GCCACTAGGC CTGACCTCCC CTTCCCCTTT CCTGCCCCAA
2161 GGCAGATCCA CATCACCGAA GCTCCCTAGA GGGGCAAAAG ATGGAGTGAG CCACAGGAAG
2221 TTTGGGGCGT GGTGAGTTGG AATGATACGT CCATTTCTCT ATGAAATATT TGCTACTAGA
2281 CTGTTCATTT CTCTCTGACA TGTTTGTTGA ATGAATAAAT AATTTGAAAC TTCAAAAAAA
2341 AAAAAAAAAA AAAAAAAAAA A
B:氨基酸序列(SEQ ID NO:5) 长度:486个氨基酸
1 MGPLSPARTL RLWGPRSLGV ALGVFMTIGF ALQLLGGPFQ RRLPGLQLRQ PSAPSLRPAL
61 PSCPPRQRLV FLKTHKSGSS SVLSLLHRYG DQHGLRFALP ARYQFGYPKL FQASRVKGYR
121 PQGGGTQLPF HILCHHMRFN LKEVLQVMPS DSFFFSIVRD PAALARSAFS YYKSTSSAFR
181 KSPSLAAFLA NPRGFYRPGA VGTTYARNLL WFDFGLPFPP EKRAKRGNIH PPRDPNPPQL
241 QVLPSGAGPR AQTLNPNALI HPVSTVTDHR SQISSPASFD LGSSSFIQWG LAWLDSVFDL
301 VMVAEYFDES LVLLADALCW GLDDVVGFMH NAQAGHKQGL STVSNSGLTA EDRQLTARAR
361 AWNNLDWALY VHFNRSLWAR IEKYGQGRLQ TAVAELRARR EALAKHCLVG GEASDPKYIT
421 DRRFRPFQFG SAKVLGYILR SGLSPQDQEE CERLATPELQ YKDKLDVKQF PPTVSLPLKT
481 SRPLSP
C.核苷酸及氨基酸组合序列(SEQ ID NO:6)
克隆号:PP6968
起始编码子:189 ATG 终止编码子:1647 TAA
蛋白质分子量:54084.13
1 GC GCT GAC AGA GGC AAA AAT CTG CTA ACT CAG GGG GCA GAC TCA ACC 47
48 AAG ACT GTG AGC AGG CCT GGG GAA TGA CCC CCC GAT CTC CAA CCA GTG 95
96 CCT TCC GCA GCT GCA CGG CTG TCT CCA GCT GTC TCT GCC CCT CTT CCT 143
144 GGC CCT GGC TCC ATC TCT CTG TCA CCT CAC CCT TCC CTG TGC CAC ATG 191
1 Met 1
192 GGC CCT CTC TCT CCT GCC AGG ACG CTG CGG CTC TGG GGA CCT CGG AGC 239
2 Gly Pro Leu Ser Pro Ala Arg Thr Leu Arg Leu Trp Gly Pro Arg Ser 17
240 CTG GGG GTG GCT CTG GGA GTC TTC ATG ACC ATT GGC TTT GCA CTC CAG 287
18 Leu Gly Val Ala Leu Gly Val Phe Met Thr Ile Gly Phe Ala Leu Gln 33
288 CTC TTG GGA GGG CCC TTC CAG AGG AGG CTA CCT GGG CTA CAG CTC CGA 335
34 Leu Leu Gly Gly Pro Phe Gln Arg Arg Leu Pro Gly Leu Gln Leu Arg 49
336 CAG CCC TCG GCC CCA TCC CTA CGA CCA GCC CTT CCG TCC TGC CCA CCC 383
50 Gln Pro Ser Ala Pro Ser Leu Arg Pro Ala Leu Pro Ser Cys Pro Pro 65
384 CGG CAG CGA CTG GTG TTC CTG AAG ACA CAT AAA TCC GGG AGC AGC TCT 431
66 Arg Gln Arg Leu Val Phe Leu Lys Thr His Lys Ser Gly Ser Ser Ser 81
432 GTG CTG AGC CTG CTT CAC CGC TAT GGG GAC CAG CAC GGG CTG CGC TTC 479
82 Val Leu Ser Leu Leu His Arg Tyr Gly Asp Gln His Gly Leu Arg Phe 97
480 GCC CTC CCT GCC CGC TAC CAG TTT GGC TAC CCA AAG CTC TTC CAG GCC 527
98 Ala Leu Pro Ala Arg Tyr Gln Phe Gly Tyr Pro Lys Leu Phe Gln Ala 113
528 TCT AGG GTA AAA GGC TAC CGC CCA CAG GGT GGA GGC ACC CAG CTC CCC 575
114 Ser Arg Val Lys Gly Tyr Arg Pro Gln Gly Gly Gly Thr Gln Leu Pro 129
576 TTC CAC ATC CTC TGT CAC CAC ATG AGG TTC AAC CTG AAA GAG GTA CTT 623
130 Phe His Ile Leu Cys His His Met Arg Phe Asn Leu Lys Glu Val Leu 145
624 CAG GTC ATG CCT TCT GAC AGC TTC TTT TTT TCC ATT GTC CGA GAC CCA 671
146 Gln Val Met Pro Ser Asp Ser Phe Phe Phe Ser Ile Val Arg Asp Pro 161
672 GCG GCT CTG GCT CGC TCT GCC TTC TCC TAC TAT AAA TCC ACC TCA TCA 719
162 Ala Ala Leu Ala Arg Ser Ala Phe Ser Tyr Tyr Lys Ser Thr Ser Ser 177
720 GCC TTC CGC AAG TCA CCA TCT TTG GCT GCC TTC CTG GCC AAT CCT CGA 767
178 Ala Phe Arg Lys Ser Pro Ser Leu Ala Ala Phe Leu Ala Asn Pro Arg 193
768 GGC TTC TAC AGG CCT GGG GCC GTG GGG ACC ACT TAC GCT CGC AAC TTA 815
194 Gly Phe Tyr Arg Pro Gly Ala Val Gly Thr Thr Tyr Ala Arg Asn Leu 209
816 CTA TGG TTT GAC TTT GGC CTG CCC TTT CCC CCA GAG AAG AGG GCC AAG 863
210 Leu Trp Phe Asp Phe Gly Leu Pro Phe Pro Pro Glu Lys Arg Ala Lys 225
864 AGA GGG AAT ATT CAT CCC CCC AGA GAC CCC AAC CCC CCA CAG CTG CAG 911
226 Arg Gly Asn Ile His Pro Pro Arg Asp Pro Asn Pro Pro Gln Leu Gln 241
912 GTC TTG CCT TCT GGT GCT GGC CCT CGA GCC CAA ACC CTC AAT CCC AAT 959
242 Val Leu Pro Ser Gly Ala Gly Pro Arg Ala Gln Thr Leu Asn Pro Asn 257
960 GCC CTC ATC CAT CCT GTT TCC ACT GTT ACT GAT CAT CGC AGC CAG ATA 1007
258 Ala Leu Ile His Pro Val Ser Thr Val Thr Asp His Arg Ser Gln Ile 273
1008 TCA AGC CCT GCC TCT TTC GAT TTG GGG TCT TCA TCC TTC ATC CAG TGG 1055
274 Ser Ser Pro Ala Ser Phe Asp Leu Gly Ser Ser Ser Phe Ile Gln Trp 289
1056 GGT CTG GCC TGG CTG GAC TCT GTC TTT GAC CTG GTC ATG GTG GCT GAG 1103
290 Gly Leu Ala Trp Leu Asp Ser Val Phe Asp Leu Val Met Val Ala Glu 305
1104 TAC TTC GAT GAG TCA TTG GTT CTG CTG GCA GAT GCC CTG TGC TGG GGT 1151
306 Tyr Phe Asp Glu Ser Leu Val Leu Leu Ala Asp Ala Leu Cys Trp Gly 321
1152 CTA GAT GAC GTG GTG GGC TTC ATG CAC AAT GCC CAG GCT GGA CAT AAG 1199
322 Leu Asp Asp Val Val Gly Phe Met His Asn Ala Gln Ala Gly His Lys 337
1200 CAG GGC CTC AGC ACT GTC AGC AAC AGT GGA CTG ACT GCG GAG GAC CGG 1247
338 Gln Gly Leu Ser Thr Val Ser Asn Ser Gly Leu Thr Ala Glu Asp Arg 353
1248 CAG CTG ACT GCA CGG GCC CGA GCC TGG AAC AAC CTG GAC TGG GCT CTC 1295
354 Gln Leu Thr Ala Arg Ala Arg Ala Trp Asn Asn Leu Asp Trp Ala Leu 369
1296 TAT GTC CAC TTC AAC CGC AGT CTC TGG GCA CGG ATA GAG AAA TAC GGC 1343
370 Tyr Val His Phe Asn Arg Ser Leu Trp Ala Arg Ile Glu Lys Tyr Gly 385
1344 CAG GGC CGG CTG CAG ACA GCT GTG GCC GAG CTC CGG GCT CGC CGA GAG 1391
386 Gln Gly Arg Leu Gln Thr Ala Val Ala Glu Leu Arg Ala Arg Arg Glu 401
1392 GCC CTA GCG AAA CAT TGT CTG GTA GGG GGT GAG GCT TCT GAC CCC AAA 1439
402 Ala Leu Ala Lys His Cys Leu Val Gly Gly Glu Ala Ser Asp Pro Lys 417
1440 TAC ATC ACT GAT CGC CGG TTC CGC CCC TTC CAG TTT GGG TCA GCT AAG 1487
418 Tyr Ile Thr Asp Arg Arg Phe Arg Pro Phe Gln Phe Gly Ser Ala Lys 433
1488 GTT TTG GGC TAT ATA CTT CGG AGT GGA TTG AGC CCC CAA GAC CAA GAG 1535
434 Val Leu Gly Tyr Ile Leu Arg Ser Gly Leu Ser Pro Gln Asp Gln Glu 449
1536 GAA TGT GAG CGC CTA GCT ACC CCT GAG CTC CAG TAC AAG GAC AAG CTG 1583
450 Glu Cys Glu Arg Leu Ala Thr Pro Glu Leu Gln Tyr Lys Asp Lys Leu 465
1584 GAT GTC AAG CAG TTC CCC CCT ACC GTC TCA CTG CCC CTC AAG ACT TCA 1631
466 Asp Val Lys Gln Phe Pro Pro Thr Val Ser Leu Pro Leu Lys Thr Ser 481
1632 AGG CCA CTC TCC CCA TAA ACA TCA GAC TAC AGA TTT AGG TGG AAG AGC 1679
482 Arg Pro Leu Ser Pro *** 487
1680 AGC CAT GTT TGA AGG GCA CAT GTG ATG AGT GGG GGG CAG CAA GAT GCC 1727
1728 ATT TCT GCA TCT CCC AGA AGG GAT GAG TCT TTG TCC CGA TGC AAG CCC 1775
1776 CCT CTT CGC TGG GCT CCC AGC AGT GCT TCC CTC CTC CAC CCT CCA CTC 1823
1824 ATT TTG TTC TTT CCC CCC AAC TTT TTT TTT TTT TGA AAC GGA GTC TTG 1871
1872 CTC TGT CCC CCA GGC TGG AGT GCA GTG GCA TGA TCT CGG CTC ACT GCA 1919
1920 ACC TCT GCC TCC CAG GTT CAA GCG ATT CTC CTG CCT CAG CCT CCA GAG 1967
1968 TAG CTA GGA TTA CAG ATA CGT GCC ACC ATA CCC GGC TAA TTT TTA TAT 2015
2016 TTT TAG AGA CAG GGA TTC AAC ATG TTG GTT AGG CTG GCC TTG AAC TCC 2063
2064 TCA CCT CAG GTG ATC CAC ATG ACT CTG CCT CCC AAA GTG CTG CCA TTA 2111
2112 CAG GCG TGA GCC ACT AGG CCT GAC CTC CCC TTC CCC TTT CCT GCC CCA 2159
2160 AGG CAG ATC CAC ATC ACC GAA GCT CCC TAG AGG GGC AAA AGA TGG AGT 2207
2208 GAG CCA CAG GAA GTT TGG GGC GTG GTG AGT TGG AAT GAT ACG TCC ATT 2255
2256 TCT CTA TGA AAT ATT TGC TAC TAG ACT GTT CAT TTC TCT CTG ACA TGT 2303
2304 TTG TTG AAT GAA TAA ATA ATT TGA AAC TTC AAA AAA AAA AAA AAA AAA 2351
2352 AAA AAA AAA A 2361
3.PP7122
A:核苷酸序列(SEQ ID N0:7)长度:1987bp
1 GGTACATTTG CCCAGCTTCC CTGCCAGCCT TTAACCCCAG GAACCTCTCA GTCTACCTCC
61 TCTTTTCTGC CTCTGAATCC CTACCTTTAA AGTCAGAACA GGCCAGGCCC GGTGGCTCAC
121 GCCTGTAATC CCAGCACTTT GGGAGGCTGA GGTGGGTGGA TCACTTGACA TCAGTAGTTC
181 AAGACCAGCC TGGCCAACAT GGTGAAACCC CATCCTTACT AAAAATACAA AAATTAGCCA
241 GGTGTGGTGG CGGGCACCTG TAATCCCAGC TACTCAGGAG GCTGAGGCAG GAGAATCACT
301 TGAACCCAGG AGGCAGAGTT TGCAGTCAGC CAAGATCACG CCACTGTACT CCAGCCTGGA
361 TGACACAGCG AGACTCCGTC TCAAAATAAA TAAATAAAAA TAAAGTCAGA ACACCTGGCT
421 TAATAGGCCT CACTGTGCAG ATGAGGAAAC TGAGGCCCAG GGAGGAAGAG CGATCTGTGG
481 AGATATTTCT AGAACCCCTG CAAGCTGACC CCAGTGAAGG AGAGAAGGTC CAGTAGGAGC
541 TTGCTAAGCT CAAAATCGAA GAAAGGTTCA GCAAGACTGT CAGGGTGACC TCAAAGCAAT
601 GGCAGCCATC AGAGGAGCCC CATTGCTATT AGGAGGCTCC TATTGCCCTC CCCTTCAGCC
661 TCTGACTTTC ACCTGTGCTA CCCAATTCTG GTTCCTTCAC TCCCATTCAA AAATGGACCC
721 CAGAAAAGCC TTATTTTGTG GAGTACCTAG TTCCCTTTTG GGTTTGTCTC TTGACTGCTA
781 CGGGCATTGC CCCAGGGCAA CCATGACAGT GAAGATGACT GGCCAAGCTT GTGGACTGGC
841 CAGCAAGCTT GGGCTGCCTG AGACGCTTTG AAATGGCTGC CTTCTGAGTT GGTCTTGAGG
901 GTGAAGACTG ACCACCCTTC TCACCTGCAC AGTCACAGTC CCTCTCCTGC TGGCCTGACT
961 GCAGCTGTCC TCCCAGCTGG CCACCTGACC AGAGACCAGG AGAGAGGCCA CAGCCTCCAG
1021 ACCCTCCAGA GTCCCACGGA GGAAGAAGGC TTACCAGAGA GACCCTCTGA TGCATGAGCC
1081 AGGCCCCAGC CCTTCTCCCT GCATCCAGGT GTGTTTCCAC CGCAAAATGC CTCCACACAA
1141 TGAGCGACTT TGGCCCTGCG TGGGTCAGCA TGTGGTCTGA GGTAACCCTC AAATGCCTCC
1201 ACCACACATC TGTCCACCTG CACGGGTTCA AGGTGAGCAC TTGCCCCCTT CTCTCCTCCA
1261 GACCAGTCGC CTGAAATTCT GAGCAACATT CCTTCAAGAC TATCATGTAA CCCTTGGTGA
1321 TGCTGAGTCC AGACAGGAAA TGCAGACTTG GGACCCACCT GTATCAGCAG AAAGAGGCCT
1381 TGTGCCCCGT TTGTCCGAGT CCCAGAACGG AGCAAATGAG AAAACCGGCG AGCTGTCCCC
1441 CGAGGAGCTG TAGGGAGATT GGTTTTTAGT ATAAATTACA ATAAAATTTT GTGTATGTGT
1501 ACAGCTGTGT TCACATCCAC AGTGTAAGCT GTGATATGGT TTGGATGTTT GTCCCCTCCA
1561 AATCTCATGT TGAAATGTGA TCCCCAGCAT TGGAGGTGGG GCCTGATGGG AGGTGATTGG
1621 GTGATGGGGG AAGTTGCCTC ATGAATGACT TGGTGCCCTC CTGGAAGTGA TGAGTGAGTT
1681 CTCGCTGAGC TCACTCAAGA TGTGGTTGTT TAAAAGAGTG TGGCACGTCC CTCCCCCAAC
1741 TCTCCCTCTC ACTCCCGCTC TCACCATGTG ACACACCTGC TCCCCCTTCA CCTTCCACCA
1801 TGATTGGAAG CTTCCTGAAG CCCTTACCAG AAGCAGATGC CAGCCCCACA CTTCCTGTAC
1861 CACCTGCAGA ACCATAAACC AAAATAAAGC TCTTTTCTTT ATCAATTAAA AAAAAAAAAA
1921 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
1981 AAAAAAA
B:氨基酸序列(SEQ ID NO:8)长度:90个氨基酸
1 MAAIRGAPLL LGGSYCPPLQ PLTFTCATQF WFLHSHSKMD PRKALFCGVP SSLLGLSLDC
61 YGHCPRATMT VKMTGQACGL ASKLGLPETL
C.核苷酸及氨基酸组合序列(SEQ ID NO:9)
克隆号:PP7122
起始编码子:599 ATG 终止编码子:869 TGA
蛋白质分子量:9583.88
1 G GTA CAT TTG CCC AGC TTC CCT GCC AGC CTT TAA CCC CAG GAA CCT 46
47 CTC AGT CTA CCT CCT CTT TTC TGC CTC TGA ATC CCT ACC TTT AAA GTC 94
95 AGA ACA GGC CAG GCC CGG TGG CCC ACG CCC GTA ATC CCA GCA CTT TGG 142
143 GAG GCT GAG GTG GGT GGA TCA CTT GAC ATC AGT AGT TCA AGA CCA GCC 190
191 TGG CCA ACA TGG TGA AAC CCC ATC CCT ACC AAA AAT ACA AAA ATT AGC 238
239 CAG GTG TGG TGG CGG GCA CCC GTA ATC CCA GCC ACT CAG GAG GCT GAG 286
287 GCA GGA GAA TCA CTT GAA CCC AGG AGG CAG AGT TTG CAG TCA GCC AAG 334
335 ATC ACG CCA CTG TAC TCC AGC CTG GAT GAC ACA GCG AGA CCC CGT CCC 382
383 AAA ATA AAT AAA TAA AAA TAA AGT CAG AAC ACC TGG CTT AAT AGG CCC 430
431 CAC TGT GCA GAT GAG GAA ACT GAG GCC CAG GGA GGA AGA GCG ATC TGT 478
479 GGA GAT ATT TCC AGA ACC CCT GCA AGC TGA CCC CAG TGA AGG AGA GAA 526
527 GGT CCA GTA GGA GCT TGC TAA GCT CAA AAT CGA AGA AAG GTT CAG CAA 574
575 GAC TGT CAG GGT GAC CCC AAA GCA ATG GCA GCC ATC AGA GGA GCC CCA 622
1 Met Ala Ala Ile Arg Gly Ala Pro 8
623 TTG CTA TTA GGA GGC TCC TAT TGC CCC CCC CCT CAG CCC CTG ACT TTC 670
9 Leu Leu Leu Gly Gly Ser Tyr Cys Pro Pro Leu Gln Pro Leu Thr Phe 24
671 ACC TGT GCC ACC CAA TTC TGG TTC CCT CAC TCC CAT TCA AAA ATG GAC 718
25 Thr Cys Ala Thr Gln Phe Trp Phe Leu His Ser His Ser Lys Met Asp 40
719 CCC AGA AAA GCC TTA TTT TGT GGA GTA CCC AGT TCC CTT TTG GGT TTG 766
41 Pro Arg Lys Ala Leu Phe Cys Gly Val Pro Ser Ser Leu Leu Gly Leu 56
767 TCT CTT GAC TGC TAC GGG CAT TGC CCC AGG GCA ACC ATG ACA GTG AAG 814
57 Ser Leu Asp Cys Tyr Gly His Cys Pro Arg Ala Thr Met Thr Val Lys 72
815 ATG ACT GGC CAA GCT TGT GGA CTG GCC AGC AAG CTT GGG CTG CCT GAG 862
73 Met Thr Gly Gln Ala Cys Gly Leu Ala Ser Lys Leu Gly Leu Pro Glu 88
863 ACG CTT TGA AAT GGC TGC CTT CTG AGT TGG TCT TGA GGG TGA AGA CTG 910
89 Thr Leu *** 91
911 ACC ACC CTT CTC ACC TGC ACA GTC ACA GTC CCT CTC CTG CTG GCC TGA 958
959 CTG CAG CTG TCC TCC CAG CTG GCC ACC TGA CCA GAG ACC AGG AGA GAG 1006
1007 GCC ACA GCC TCC AGA CCC TCC AGA GTC CCA CGG AGG AAG AAG GCT TAC 1054
1055 CAG AGA GAC CCT CTG ATG CAT GAG CCA GGC CCC AGC CCT TCT CCC TGC 1102
1103 ATC CAG GTG TGT TTC CAC CGC AAA ATG CCT CCA CAC AAT GAG CGA CTT 1150
1151 TGG CCC TGC GTG GGT CAG CAT GTG GTC TGA GGT AAC CCT CAA ATG CCT 1198
1199 CCA CCA CAC ATC TGT CCA CCT GCA CGG GTT CAA GGT GAG CAC TTG CCC 1246
1247 CCT TCT CTC CTC CAG ACC AGT CGC CTG AAA TTC TGA GCA ACA TTC CTT 1294
1295 CAA GAC TAT CAT GTA ACC CTT GGT GAT GCT GAG TCC AGA CAG GAA ATG 1342
1343 CAG ACT TGG GAC CCA CCT GTA TCA GCA GAA AGA GGC CTT GTG CCC CGT 1390
1391 TTG TCC GAG TCC CAG AAC GGA GCA AAT GAG AAA ACC GGC GAG CTG TCC 1438
1439 CCC GAG GAG CTG TAG GGA GAT TGG TTT TTA GTA TAA ATT ACA ATA AAA 1486
1487 TTT TGT GTA TGT GTA CAG CTG TGT TCA CAT CCA CAG TGT AAG CTG TGA 1534
1535 TAT GGT TTG GAT GTT TGT CCC CTC CAA ATC TCA TGT TGA AAT GTG ATC 1582
1583 CCC AGC ATT GGA GGT GGG GCC TGA TGG GAG GTG ATT GGG TGA TGG GGG 1630
1631 AAG TTG CCT CAT GAA TGA CTT GGT GCC CTC CTG GAA GTG ATG AGT GAG 1678
1679 TTC TCG CTG AGC TCA CTC AAG ATG TGG TTG TTT AAA AGA GTG TGG CAC 1726
1727 GTC CCT CCC CCA ACT CTC CCT CTC ACT CCC GCT CTC ACC ATG TGA CAC 1774
1775 ACC TGC TCC CCC TTC ACC TTC CAC CAT GAT TGG AAG CTT CCT GAA GCC 1822
1823 CTT ACC AGA AGC AGA TGC CAG CCC CAC ACT TCC TGT ACC ACC TGC AGA 1870
1871 ACC ATA AAC CAA AAT AAA GCT CTT TTC TTT ATC AAT TAA AAA AAA AAA 1918
1919 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 1966
1967 AAA AAA AAA AAA AAA AAA AAA 1987
4.PP7157
A:核苷酸序列(SEQ ID NO:10)长度:1017bp
1 GCACGGACGC CGTCCCTCCT CGGCGCGGCC TGAGCGCCCG GCCCGACCCC GGCCATGGGG
61 TGCTGCTACA GCAGCGAGAA CGAGGACTCG GACCAGGACC GAGAGGAGCG GAAGCTGCTG
121 CTGGACCCTA GCAGCCCCCC TACCAAAGCT CTCAATGGAG CCGAGCCCAA CTACCACAGC
181 CTGCCTTCCG CTCGCACTGA TGAGCAGGCC CTGCTCTCTT CCATCCTTGC CAGGACAGCC
241 AGCAACATCA TTGATGTGTC TGCTGCAGAC TCACAGGGCA TGGAGCAGCA TGAGTACATG
301 GACCGTGCCA GGCAGTACAG CACCCGCTTG GCTGTGCTGA GCAGCAGCCT GACCCATTGG
361 AAGAAGCTGC CACCGCTGCC GTCTCTTACC AGCCAGCCCC ACCAAGTGCT GGCCAGTGAG
421 CCCATCCCGT TCTCTGATTT GCAGCAGGTC TCCAGGATAG CTGCTTATGC CTACAGTGCA
481 CTTTCTCAGA TCCGTGTGGA CGCAAAAGAG GAGCTGGTTG TACAGTTTGG GATCCCATGA
541 AGAGAGGGGT CCTTGGACAG CTCTTCTCCT CTCTTCATCC CATCTCTACC CCACCCCCTT
601 GGCCCCCAGC CTCACTGCGG CTTATACAGT ACCCTAACCT GCTACTAATC ACAGAGAAAA
661 ATGTGAAGAA GGAGGAGAAG AGGAAGGCTA GAAGCCTGAG CAAGTGAGGG TAGAACCTTT
721 TGGGACTGGC CTTTGAAGCT CTGGCCAGGG ATGGGGTGGG GGCCAAAAGG ACAGAGCCTG
781 GTATGTCTTC ATAGTCATTG AGAATGTGGA GATACCAGTT TGGGTGGGGG GTGATCACCA
841 GGGGACCTAG GGAGATCCCC TTCCCACCCT CTCTGTTGGC CTCAGAGTCA CTCCTGCCCC
901 CTCTCCCTGA CTTGGTGCTC ACATGCACCT CACTAGGGTT TGTGACCAGG GTCTGGATGA
961 GCTTGAATTT GAATGAATTG AGTTTGTATT TCTAGAAAAA AAAAAAAAAA AAAAAAA
B:氨基酸序列(SEQ ID NO:11) 长度:161个氨基酸
1 MGCCYSSENE DSDQDREERK LLLDPSSPPT KALNGAEPNY HSLPSARTDE QALLSSILAR
61 TASNIIDVSA ADSQGMEQHE YMDRARQYST RLAVLSSSLT HWKKLPPLPS LTSQPHQVLA
121 SEPIPFSDLQ QVSRIAAYAY SALSQIRVDA KEELVVQFGI P
C.核苷酸及氨基酸组合序列(SEQ ID NO:12)
克隆号:PP7157
起始编码子:55 ATG 终止编码子:538 TGA
蛋白质分子量:17771.81
1 GCA CGG ACG CCG TCC CTC CTC GGC GCG GCC TGA GCG CCC GGC CCG ACC 48
49 CCG GCC ATG GGG TGC TGC TAC AGC AGC GAG AAC GAG GAC TCG GAC CAG 96
1 Met Gly Cys Cys Tyr Ser Ser Glu Asn Glu Asp Ser Asp Gln 14
97 GAC CGA GAG GAG CGG AAG CTG CTG CTG GAC CCT AGC AGC CCC CCT ACC 144
15 Asp Arg Glu Glu Arg Lys Leu Leu Leu Asp Pro Ser Ser Pro Pro Thr 30
145 AAA GCT CTC AAT GGA GCC GAG CCC AAC TAC CAC AGC CTG CCT TCC GCT 192
31 Lys Ala Leu Asn Gly Ala Glu Pro Asn Tyr His Ser Leu Pro Ser Ala 46
193 CGC ACT GAT GAG CAG GCC CTG CTC TCT TCC ATC CTT GCC AGG ACA GCC 240
47 Arg Thr Asp Glu Gln Ala Leu Leu Ser Ser Ile Leu Ala Arg Thr Ala 62
241 AGC AAC ATC ATT GAT GTG TCT GCT GCA GAC TCA CAG GGC ATG GAG CAG 288
63 Ser Asn Ile Ile Asp Val Ser Ala Ala Asp Ser Gln Gly Met Glu Gln 78
289 CAT GAG TAC ATG GAC CGT GCC AGG CAG TAC AGC ACC CGC TTG GCT GTG 336
79 His Glu Tyr Met Asp Arg Ala Arg Gln Tyr Ser Thr Arg Leu Ala Val 94
337 CTG AGC AGC AGC CTG ACC CAT TGG AAG AAG CTG CCA CCG CTG CCG TCT 384
95 Leu Ser Ser Ser Leu Thr His Trp Lys Lys Leu Pro Pro Leu Pro Ser 110
385 CTT ACC AGC CAG CCC CAC CAA GTG CTG GCC AGT GAG CCC ATC CCG TTC 432
111 Leu Thr Ser Gln Pro His Gln Val Leu Ala Ser Glu Pro Ile Pro Phe 126
433 TCT GAT TTG CAG CAG GTC TCC AGG ATA GCT GCT TAT GCC TAC AGT GCA 480
127 Ser Asp Leu Gln Gln Val Ser Arg Ile Ala Ala Tyr Ala Tyr Ser Ala 142
481 CTT TCT CAG ATC CGT GTG GAC GCA AAA GAG GAG CTG GTT GTA CAG TTT 528
143 Leu Ser Gln Ile Arg Val Asp Ala Lys Glu Glu Leu Val Val Gln Phe 158
529 GGG ATC CCA TGA AGA GAG GGG TCC TTG GAC AGC TCT TCT CCT CTC TTC 576
159 Gly Ile Pro *** 162
577 ATC CCA TCT CTA CCC CAC CCC CTT GGC CCC CAG CCT CAC TGC GGC TTA 624
625 TAC AGT ACC CTA ACC TGC TAC TAA TCA CAG AGA AAA ATG TGA AGA AGG 672
673 AGG AGA AGA GGA AGG CTA GAA GCC TGA GCA AGT GAG GGT AGA ACC TTT 720
721 TGG GAC TGG CCT TTG AAG CTC TGG CCA GGG ATG GGG TGG GGG CCA AAA 768
769 GGA CAG AGC CTG GTA TGT CTT CAT AGT CAT TGA GAA TGT GGA GAT ACC 816
817 AGT TTG GGT GGG GGG TGA TCA CCA GGG GAC CTA GGG AGA TCC CCT TCC 864
865 CAC CCT CTC TGT TGG CCT CAG AGT CAC TCC TGC CCC CTC TCC CTG ACT 912
913 TGG TGC TCA CAT GCA CCT CAC TAG GGT TTG TGA CCA GGG TCT GGA TGA 960
961 GCT TGA ATT TGA ATG AAT TGA GTT TGT ATT TCT AGA AAA AAA AAA AAA 1008
1009 AAA AAA AAA 1017
5.PP7517
A:核苷酸序列(SEQ ID NO:13)长度:2712bp
1 GTTCACGGCA ACAGCATCCA GCGCCTGGGG GAGGTGAATA AGCTGGCTGT CCTTCCTCGG
61 CTCCGTAGCC TGACACTCCA TGGGAACCCC ATGGAGGAAG AGAAAGGGTA TAGCAGGCCC
121 TGGACTCCCC GACCTGTCCT GTGCTCTGGT CCTCCAGCCC AGCCTCCGAG ACTGCCTGTC
181 AGGGCTGCGG ATCGAGGAGC GGGCCTTCAG CTACGTGCTC ACCCATGCCC TGCCCGGTGA
241 CCCTGGTCAC ATCCTCACCA CCCTGGACCA CTGGAGCAGC CGCTGCGAGT ACTTGAGCCA
301 CATGGGGCCT GTCAAAGGTC AGATCCTGAT GCGGCTGGTG GAGGAGAAGC CCCTGCTTGT
361 GTGCTGGAAT TGGGAACCTA CTGTGGATAC TCTACCCTGC TTATTGCCCG AGCCCTGCCC
421 CCTGGGGGTC GCCTTCTTAC TGTGGAGCGG GACCCACGCA CGGCAGCAGT GGCTGAAAAA
481 CTCATCCGCC TGGCCGGCTT TGATGAGCAC ATGGTGGAGC TCATCGTGGG CAGCTCAGAG
541 GACGTGATCC CGTGCCTACG CACCCAGTAT CAGCTGAGTC GGGCAGACCT GGTGCTCCTG
601 GCACACCGGC CACGATGTTA CCTGAGGGAC CTGCAGCTGC TGGAGGCCCA TGCCCTACTG
661 CCAGCAGGTG CCACCGTGCT GGCTGACCAT GTGCTCTTCC CTGGTGCACC CCGCTTCTTG
721 CAGTATGCTA AGAGCTGTGG CCGCTACCGC TGCCGCCTCC ACCACACTGG CCTTCCAGAC
781 TTCCCTGCCA TCAAGGATGG AATAGCTCAG CTCACCTATG CTGGACCAGG CTGAGGTCCA
841 GGCCCAGGGG TACTTACTGA TGCCCACCCC CACCCCCACC CAAGCAGGGA CCTCAAAATC
901 CCCTCCCTTT CCTGTTTGGG GCCTTGACAC ACGCTGGGCT CAGGGCTAGG GAGTCTCTCT
961 TCCCACCTCT GACCTCTTTC AGCCTCTACA CTGACCTCAA GTGTCAAGTT CTATCAGGCT
1021 GCTTGGTCTC ACTAGGCCCC CTCTTTCCAG AGAGAACCAT GGACTGACAG CAAGAAGCCT
1081 GAGCTCCCGA CCCAGCTCTG TCACTGATTT GCTGAGTGAC TCCAAGGGAA TCCCCACCTT
1141 GCTCTGAGAT TTAATCTTCT CTCTTAACAC GAAGGAAGCT GGATGGGAGA GCTCCAGGGG
1201 CCTCCCAGTT CTCGGCCTCA GAAAGCCTCC CATCCTCAGC CCATGCCATT CTGGGTGGGA
1261 TCAGAGGAAG TGGCAATGAG TTAGACGCCC TGCAGGAATA GCTGGATGCA AGCTGGGCCA
1321 GAGAAAATGG CACAGAACCC TGGACCCAGG GCCAGGGATG CCCTGGCCTT CCCTAACTCT
1381 GGCCCACCTA GCCAATTAGG TGTGGCTGAT GTCCCTTGAG TGCCCTCTTC CTAAAGCCCA
1441 AAAGAAGATG CTGGACTCCT CTGGGCCCCA CCAACAAATA GGGAATAGAC ATGGGTGGAA
1501 AATCACTCCT TTGTCTTTAT TAAAGAAACT TAGACCAGAC CTGGCAATCA AGGGGTGAGG
1561 TACTGGCCAG GAAGGTGGAG TAGGTTTCAG GCCCTGGGGA TTTCAAGTGC AGACTGATGG
1621 CCTGGGAGGG GCCAAAGAGA CCAGATCCTG GCAGCAGCTG AGGAGGTGCC CAAGGGCACT
1681 TTCAGGCACT GGGGCCATCA GCTGGTTCTG TGGGCAGGGG TTGGGGGTTG GGATGCAGGG
1741 TAGTTTGGGC TGGCCTGGAA TCTCCCTGAG GCCACCCTGC CTTGTCTACC TAGATCATCC
1801 ACTGGTCCTG ATCCTGTTCG TTGCCTTCCA TGTCCACCTG GAGAGGAGGC TGGGTGTGGG
1861 TGGGGAGGGG CCTCAGCCAG CCTCAGCCCC AGATCCTGCC CCTGGCTGGA TCCAGGGTTT
1921 CTGTACCCCT TGCCATCAAC TGGGTCAGGA GCAAGGGTCC AGGAACAGAG GCCCTCCCCC
1981 ATACCCCTTG CCTACCTCAT TGACCTCTCC ATCATCCGGT GACTCATTGT AGTCATTCAT
2041 CTCGTCCATG TCCTGCATAT CCTCATCATC CTCTGAGTCC TCTTTCACTA TCCTCATCGT
2101 CTTCATCATC TTCTTCTTCC TCGTCATCAT AGTGCTGGTG GGCAGGACAG AGCCTGTAAG
2161 CCCTACAGGC CTGCATGGAC CAGTTCAAGA ACTGACCCAC TTGAGCCTCT CTCTAGGGCC
2221 AATGAATGAC CCCCTACCCC GACACTCCCT CCTTGAGTCT AGCAGGCTGG TGCATGTTCT
2281 GCAGGACCTT AATGCTAGGC CCAATGCCCA CCCCTTCTAT CTCCCCTTTT AGGCTTTTAC
2341 CCAGATCTGA GAACCACAAC TGCTCTGGGT CAGAGACAGG ACATTCAGAA TTAGAGCAGA
2401 GCCTCGGTCC ACTGCGGCCC CCACACAGGC CCCACCTGCT AGAGCCACTC ACCTCTGAGG
2461 CTGGCTTGCC AATAGGAACC AGGTTGTTGT CTTTCTCCGC GATGCTTTGG AGCTGTGGGC
2521 AAAGGCACAG AGGAACAAGG CCAGAGCCCA AGTAGGGCAG GTCAGGGGCA TGGGACTGGC
2581 CCATTCTGCC CAGAAGACAA CCCACACGTG TTGGGGAGAA GCTTCCTCCC AGTTCTCAGG
2641 GAGATACAAT CCCTTTCTTG TCATCTGCCA TTTATGAACT TGATCCAAAT AAAAAAAAAA
2701 AAAAAAAAAA AA
B:氨基酸序列(SEQ ID NO:14) 长度:155个氨基酸
1 MGTPWRKRKG IAGPGLPDLS CALVLQPSLR DCLSGLRIEE RAFSYVLTHA LPGDPGHILT
61 TLDHWSSRCE YLSHMGPVKG QILMRLVEEK PLLVCWNWEP TVDTLPCLLP EPCPLGVAFL
121 LWSGTHARQQ WLKNSSAWPA LMSTWWSSSW AAQRT
C.核苷酸及氨基酸组合序列(SEQ ID NO:15)
克隆号:PP7517
起始编码子:80 ATG 终止编码子:545 TGA
蛋白质分子量:17413.27
1 G TTC ACG GCA ACA GCA TCC AGC GCC TGG GGG AGG TGA ATA AGC TGG 46
47 CTG TCC TTC CTC GGC TCC GTA GCC TGA CAC TCC ATG GGA ACC CCA TGG 94
1 Met Gly Thr Pro Trp 5
95 AGG AAG AGA AAG GGT ATA GCA GGC CCT GGA CTC CCC GAC CTG TCC TGT 142
6 Arg Lys Arg Lys Gly Ile Ala Gly Pro Gly Leu Pro Asp Leu Ser Cys 21
143 GCT CTG GTC CTC CAG CCC AGC CTC CGA GAC TGC CTG TCA GGG CTG CGG 190
22 Ala Leu Val Leu Gln Pro Ser Leu Arg Asp Cys Leu Ser Gly Leu Arg 37
191 ATC GAG GAG CGG GCC TTC AGC TAC GTG CTC ACC CAT GCC CTG CCC GGT 238
38 Ile Glu Glu Arg Ala Phe Ser Tyr Val Leu Thr His Ala Leu Pro Gly 53
239 GAC CCT GGT CAC ATC CTC ACC ACC CTG GAC CAC TGG AGC AGC CGC TGC 286
54 Asp Pro Gly His Ile Leu Thr Thr Leu Asp His Trp Ser Ser Arg Cys 69
287 GAG TAC TTG AGC CAC ATG GGG CCT GTC AAA GGT CAG ATC CTG ATG CGG 334
70 Glu Tyr Leu Ser His Met Gly Pro Val Lys Gly Gln Ile Leu Met Arg 85
335 CTG GTG GAG GAG AAG CCC CTG CTT GTG TGC TGG AAT TGG GAA CCT ACT 382
86 Leu Val Glu Glu Lys Pro Leu Leu Val Cys Trp Asn Trp Glu Pro Thr 101
383 GTG GAT ACT CTA CCC TGC TTA TTG CCC GAG CCC TGC CCC CTG GGG GTC 430
102 Val Asp Thr Leu Pro Cys Leu Leu Pro Glu Pro Cys Pro Leu Gly Val 117
431 GCC TTC TTA CTG TGG AGC GGG ACC CAC GCA CGG CAG CAG TGG CTG AAA 478
118 Ala Phe Leu Leu Trp Ser Gly Thr His Ala Arg Gln Gln Trp Leu Lys 133
479 AAC TCA TCC GCC TGG CCG GCT TTG ATG AGC ACA TGG TGG AGC TCA TCG 526
134 Asn Ser Ser Ala Trp Pro Ala Leu Met Ser Thr Trp Trp Ser Ser Ser 149
527 TGG GCA GCT CAG AGG ACG TGA TCC CGT GCC TAC GCA CCC AGT ATC AGC 574
150 Trp Ala Ala Gln Arg Thr *** 156
575 TGA GTC GGG CAG ACC TGG TGC TCC TGG CAC ACC GGC CAC GAT GTT ACC 622
623 TGA GGG ACC TGC AGC TGC TGG AGG CCC ATG CCC TAC TGC CAG CAG GTG 670
671 CCA CCG TGC TGG CTG ACC ATG TGC TCT TCC CTG GTG CAC CCC GCT TCT 718
719 TGC AGT ATG CTA AGA GCT GTG GCC GCT ACC GCT GCC GCC TCC ACC ACA 766
767 CTG GCC TTC CAG ACT TCC CTG CCA TCA AGG ATG GAA TAG CTC AGC TCA 814
815 CCT ATG CTG GAC CAG GCT GAG GTC CAG GCC CAG GGG TAC TTA CTG ATG 862
863 CCC ACC CCC ACC CCC ACC CAA GCA GGG ACC TCA AAA TCC CCT CCC TTT 910
911 CCT GTT TGG GGC CTT GAC ACA CGC TGG GCT CAG GGC TAG GGA GTC TCT 958
959 CTT CCC ACC TCT GAC CTC TTT CAG CCT CTA CAC TGA CCT CAA GTG TCA 1006
1007 AGT TCT ATC AGG CTG CTT GGT CTC ACT AGG CCC CCT CTT TCC AGA GAG 1054
1055 AAC CAT GGA CTG ACA GCA AGA AGC CTG AGC TCC CGA CCC AGC TCT GTC 1102
1103 ACT GAT TTG CTG AGT GAC TCC AAG GGA ATC CCC ACC TTG CTC TGA GAT 1150
1151 TTA ATC TTC TCT CTT AAC ACG AAG GAA GCT GGA TGG GAG AGC TCC AGG 1198
1199 GGC CTC CCA GTT CTC GGC CTC AGA AAG CCT CCC ATC CTC AGC CCA TGC 1246
1247 CAT TCT GGG TGG GAT CAG AGG AAG TGG CAA TGA GTT AGA CGC CCT GCA 1294
1295 GGA ATA GCT GGA TGC AAG CTG GGC CAG AGA AAA TGG CAC AGA ACC CTG 1342
1343 GAC CCA GGG CCA GGG ATG CCC TGG CCT TCC CTA ACT CTG GCC CAC CTA 1390
1391 GCC AAT TAG GTG TGG CTG ATG TCC CTT GAG TGC CCT CTT CCT AAA GCC 1438
1439 CAA AAG AAG ATG CTG GAC TCC TCT GGG CCC CAC CAA CAA ATA GGG AAT 1486
1487 AGA CAT GGG TGG AAA ATC ACT CCT TTG TCT TTA TTA AAG AAA CTT AGA 1534
1535 CCA GAC CTG GCA ATC AAG GGG TGA GGT ACT GGC CAG GAA GGT GGA GTA 1582
1583 GGT TTC AGG CCC TGG GGA TTT CAA GTG CAG ACT GAT GGC CTG GGA GGG 1630
1631 GCC AAA GAG ACC AGA TCC TGG CAG CAG CTG AGG AGG TGC CCA AGG GCA 1678
1679 CTT TCA GGC ACT GGG GCC ATC AGC TGG TTC TGT GGG CAG GGG TTG GGG 1726
1727 GTT GGG ATG CAG GGT AGT TTG GGC TGG CCT GGA ATC TCC CTG AGG CCA 1774
1775 CCC TGC CTT GTC TAC CTA GAT CAT CCA CTG GTC CTG ATC CTG TTC GTT 1822
1823 GCC TTC CAT GTC CAC CTG GAG AGG AGG CTG GGT GTG GGT GGG GAG GGG 1870
1871 CCT CAG CCA GCC TCA GCC CCA GAT CCT GCC CCT GGC TGG ATC CAG GGT 1918
1919 TTC TGT ACC CCT TGC CAT CAA CTG GGT CAG GAG CAA GGG TCC AGG AAC 1966
1967 AGA GGC CCT CCC CCA TAC CCC TTG CCT ACC TCA TTG ACC TCT CCA TCA 2014
2015 TCC GGT GAC TCA TTG TAG TCA TTC ATC TCG TCC ATG TCC TGC ATA TCC 2062
2063 TCA TCA TCC TCT GAG TCC TCT TTC ACT ATC CTC ATC GTC TTC ATC ATC 2110
2111 TTC TTC TTC CTC GTC ATC ATA GTG CTG GTG GGC AGG ACA GAG CCT GTA 2158
2159 AGC CCT ACA GGC CTG CAT GGA CCA GTT CAA GAA CTG ACC CAC TTG AGC 2206
2207 CTC TCT CTA GGG CCA ATG AAT GAC CCC CTA CCC CGA CAC TCC CTC CTT 2254
2255 GAG TCT AGC AGG CTG GTG CAT GTT CTG CAG GAC CTT AAT GCT AGG CCC 2302
2303 AAT GCC CAC CCC TTC TAT CTC CCC TTT TAG GCT TTT ACC CAG ATC TGA 2350
2351 GAA CCA CAA CTG CTC TGG GTC AGA GAC AGG ACA TTC AGA ATT AGA GCA 2398
2399 GAG CCT CGG TCC ACT GCG GCC CCC ACA CAG GCC CCA CCT GCT AGA GCC 2446
2447 ACT CAC CTC TGA GGC TGG CTT GCC AAT AGG AAC CAG GTT GTT GTC TTT 2494
2495 CTC CGC GAT GCT TTG GAG CTG TGG GCA AAG GCA CAG AGG AAC AAG GCC 2542
2543 AGA GCC CAA GTA GGG CAG GTC AGG GGC ATG GGA CTG GCC CAT TCT GCC 2590
2591 CAG AAG ACA ACC CAC ACG TGT TGG GGA GAA GCT TCC TCC CAG TTC TCA 2638
2639 GGG AGA TAC AAT CCC TTT CTT GTC ATC TGC CAT TTA TGA ACT TGA TCC 2686
2687 AAA TAA AAA AAA AAA AAA AAA AAA AA 2712
6.PP7683
A:核苷酸序列(SEQ ID NO:16)长度:1937bp
1 GGGAGTGGAG AACTGGAGTC ATATTTCTGG GTTTTATGGC AGGGTTTGGG GAAGCCTCTC
61 AGAGGAGGAG GAGCTGGAGA CAGGAGGGTG GGAGCAGGAC AGAGAAACTT TTGTTTCTGA
121 GGCTTCCACG TTGGGGTGTT GTTTTTTGAG CCCCGGCACT TACCAAACCC AAATCACCCA
181 CAGGGCTTAG ACGGCACAAA GGCTCCTGGG ACTCTGGGCA GAGTCAGGGA CAGTCACACC
241 CCTCCCCGTC TCTATAGCGG AGGTACTCAG AGGGTCTGTG CTTGGGAGGC TGAGCGAGTC
301 CTGGAGAGCA TGGAGGTAGG GGCCTGTGTT CACATCCTGC CCCGGTCAAA GTAGGCCCAC
361 ACTCAAAGGC CTCTCTCTCA GCAGAGATCT TCCAGAGTGT CAGCCTCCAG CAAGTTCCCT
421 AACCTCTCCC AACACAGCCT TCACCAGCAC ATGGGCCGAG ACTCTCCCCA CGGGGCTGTG
481 GCTCAACATA GAAAAACCTT GGTGCACGAT GGCAGCAGCA GGTCTCACAA GAGCCGGCTT
541 TCTCAGAACA CACTGCCTCT GCCCAGGTGT CCTGCAGTGG AGGCTCAGAC TGGCCCCACT
601 GGTGACCCCT TGGGGAGCAG GGACAGGTCC ATTCTGCTCA CTCCTGAGCT GGGCAGTTCC
661 CTCTTGGGAT AAGGTCGCAC AGCACAGGCC ACCATCATAC CACCCCAGCC AGAGAAGTGG
721 GAGAGACAAG GAGGCTCCCT ACCCCAGAGG CAGTGCTCCT CAGGAAGGGC ATTCACTGCG
781 TTATATAGAT ATATACACAC ACACACACAC ACACACATAT ATATACACAT ATATACACAT
841 ATATGTATAC ACACATATAT ACACACACAC ATATATACAC ACACACATAT GTATATACAC
901 ACACATATAT ATATAGATAT ACACACACAT ATATTTTTTG TTTGTTTGTT TGTTTGTTTG
961 CGATGGAGTC TCACTCCAGC CTGGCCGACA GAGCAAGACT CCGTCTCAAA AAAAAAAAAG
1021 ATTGCAGTGA GCCACGATAG CACCACTGCA TTCCAGACTG GGTGACAGGG CAAGGCCGTC
1081 TCTCAAAGAA AAAAAGAAAC AAAGATTTCC ATTCTGGCAG TCCACCCCTT TTGTTTCCCC
1141 CATTATTAAC TTTACTTCTC CCTCATTATT AGTTTTTACT TTATTTAAAT GTGTGTATCT
1201 GCTCCCATCT AACCTAACAC GACTCTCTCT CTAGCAAAAA TATTTGCAAT CTGCAGTCCC
1261 TTCCCCAAAG AGGGATCCAC CCAAGCCTCG TATTGTTGTG TCCACCTCCA AGTTCAGGAT
1321 CTTTTGGTGA TAGATCTTCT CTAGTGAAAA TGTCTTCAAA CATAGCAAGA GGCTTTAAAT
1381 ACTGGGTATC CAAAAAATGA TAGGGGTCCT AAAACCAGAT CCAGTTACCT ACCTATCATC
1441 CAAGACCTCG CTTGAGTCCT TTTGGGTGCT CCCAACATTA GTGTCGTAAA ACTAAATACA
1501 GGTGATGTGA GCAGTTGTTC ACTGATGATT CTAATGCTCT CTTGGAATTC ATTGTTTCTC
1561 TGTTAGGGTG TTTCATAGTC TTTGTGGCAA AAATAGCATT GCATCATTAA AAGTATGTTA
1621 CTGTCTGGGC GTGGTGGCTG AAGCCTGTAA TCCCAGCACT TTGGGAGGCC GAGGTGGGTG
1681 GATCACGAGC TCAGGAGATC GAGACCATCC TGGCTAACAC GGTGAAACCC TGTCTCTACT
1741 AAAAATACAA AAAATTAGCC GGGCGTGGTG GTGGGCACCT GTAGTCCCAG CTACTCAGGA
1801 GGTTGAGGCA GGAGAATGGC GTGAACCTGG GAGGCGGAGC TGGCAGTGAG CCAAGATCGC
1861 ACCATTGCAC TCCAGCCTGG GCAACACAGT GAGACTCCGT CTCAAAAAAA AAAAAAAAAA
1921 AAAAAAAAAA AAAAAAA
B:氨基酸序列(SEQ ID NO:17)长度:135个氨基酸
1 MAAAGLTRAG FLRTHCLCPG VLQWRLRLAP LVTPWGAGTG PFCSLLSWAV PSWDKVAQHR
61 PPSYHPSQRS GRDKEAPYPR GSAPQEGHSL RYIDIYTHTH THTYIYTYIH IYVYTHIYTH
121 TYIHTHICIY THIYI
C.核苷酸及氨基酸组合序列(SEQ ID NO:18)
克隆号:PP7683
起始编码子:509 ATG 终止编码子:914 TAG
蛋白质分子量:15559.00
1 G GGA GTG GAG AAC TGG AGT CAT ATT TCT GGG TTT TAT GGC AGG GTT 46
47 TGG GGA AGC CTC TCA GAG GAG GAG GAG CTG GAG ACA GGA GGG TGG GAG 94
95 CAG GAC AGA GAA ACT TTT GTT TCT GAG GCT TCC ACG TTG GGG TGT TGT 142
143 TTT TTG AGC CCC GGC ACT TAC CAA ACC CAA ATC ACC CAC AGG GCT TAG 190
191 ACG GCA CAA AGG CTC CTG GGA CTC TGG GCA GAG TCA GGG ACA GTC ACA 238
239 CCC CTC CCC GTC TCT ATA GCG GAG GTA CTC AGA GGG TCT GTG CTT GGG 286
287 AGG CTG AGC GAG TCC TGG AGA GCA TGG AGG TAG GGG CCT GTG TTC ACA 334
335 TCC TGC CCC GGT CAA AGT AGG CCC ACA CTC AAA GGC CTC TCT CTC AGC 382
383 AGA GAT CTT CCA GAG TGT CAG CCT CCA GCA AGT TCC CTA ACC TCT CCC 430
431 AAC ACA GCC TTC ACC AGC ACA TGG GCC GAG ACT CTC CCC ACG GGG CTG 478
479 TGG CTC AAC ATA GAA AAA CCT TGG TGC ACG ATG GCA GCA GCA GGT CTC 526
1 Met Ala Ala Ala Gly Leu 6
527 ACA AGA GCC GGC TTT CTC AGA ACA CAC TGC CTC TGC CCA GGT GTC CTG 574
7 Thr Arg Ala Gly Phe Leu Arg Thr His Cys Leu Cys Pro Gly Val Leu 22
575 CAG TGG AGG CTC AGA CTG GCC CCA CTG GTG ACC CCT TGG GGA GCA GGG 622
23 Gln Trp Arg Leu Arg Leu Ala Pro Leu Val Thr Pro Trp Gly Ala Gly 38
623 ACA GGT CCA TTC TGC TCA CTC CTG AGC TGG GCA GTT CCC TCT TGG GAT 670
39 Thr Gly Pro Phe Cys Ser Leu Leu Ser Trp Ala Val Pro Ser Trp Asp 54
671 AAG GTC GCA CAG CAC AGG CCA CCA TCA TAC CAC CCC AGC CAG AGA AGT 718
55 Lys Val Ala Gln His Arg Pro Pro Ser Tyr His Pro Ser Gln Arg Ser 70
719 GGG AGA GAC AAG GAG GCT CCC TAC CCC AGA GGC AGT GCT CCT CAG GAA 766
71 Gly Arg Asp Lys Glu Ala Pro Tyr Pro Arg Gly Ser Ala Pro Gln Glu 86
767 GGG CAT TCA CTG CGT TAT ATA GAT ATA TAC ACA CAC ACA CAC ACA CAC 814
87 Gly His Ser Leu Arg Tyr Ile Asp Ile Tyr Thr His Thr His Thr His 102
815 ACA TAT ATA TAC ACA TAT ATA CAC ATA TAT GTA TAC ACA CAT ATA TAC 862
103 Thr Tyr Ile Tyr Thr Tyr Ile His Ile Tyr Val Tyr Thr His Ile Tyr 118
863 ACA CAC ACA TAT ATA CAC ACA CAC ATA TGT ATA TAC ACA CAC ATA TAT 910
119 Thr His Thr Tyr Ile His Thr His Ile Cys Ile Tyr Thr His Ile Tyr 134
911 ATA TAG ATA TAC ACA CAC ATA TAT TTT TTG TTT GTT TGT TTG TTT GTT 958
135 Ile *** 136
959 TGC GAT GGA GTC TCA CTC CAG CCT GGC CGA CAG AGC AAG ACT GCG TCT 1006
1007 CAA AAA AAA AAA AGA TTG CAG TGA GCC ACG ATA GCA CCA CTG CAT TCC 1054
1055 AGA CTG GGT GAC AGG GCA AGG CCG TCT CTC AAA GAA AAA AAG AAA CAA 1102
1103 AGA TTT CCA TTC TGG CAG TCC ACC CCT TTT GTT TCC CCC ATT ATT AAC 1150
1151 TTT ACT TCT CCC TCA TTA TTA GTT TTT ACT TTA TTT AAA TGT GTG TAT 1198
1199 CTG CTC CCA TCT AAC CTA ACA CGA CTC TCT CTC TAG CAA AAA TAT TTG 1246
1247 CAA TCT GCA GTC CCT TCC CCA AAG AGG GAT CCA CCC AAG CCT CGT ATT 1294
1295 GTT GTG TCC ACC TCC AAG TTC AGG ATC TTT TGG TGA TAG ATC TTC TCT 1342
1343 AGT GAA AAT GTC TTC AAA CAT AGC AAG AGG CTT TAA ATA CTG GGT ATC 1390
1391 CAA AAA ATG ATA GGG GTC CTA AAA CCA GAT CCA GTT ACC TAC CTA TCA 1438
1439 TCC AAG ACC TCG CTT GAG TCC TTT TGG GTG CTC CCA ACA TTA GTG TCG 1486
1487 TAA AAC TAA ATA CAG GTG ATG TGA GCA GTT GTT CAC TGA TGA TTC TAA 1534
1535 TGC TCT CTT GGA ATT CAT TGT TTC TCT GTT AGG GTG TTT CAT AGT CTT 1582
1583 TGT GGC AAA AAT AGC ATT GCA TCA TTA AAA GTA TGT TAC TGT CTG GGC 1630
1631 GTG GTG GCT GAA GCC TGT AAT CCC AGC ACT TTG GGA GGC CGA GGT GGG 1678
1679 TGG ATC ACG AGC TCA GGA GAT CGA GAC CAT CCT GGC TAA CAC GGT GAA 1726
1727 ACC CTG TCT CTA CTA AAA ATA CAA AAA ATT AGC CGG GCG TGG TGG TGG 1774
1775 GCA CCT GTA GTC CCA GCT ACT CAG GAG GTT GAG GCA GGA GAA TGG CGT 1822
1823 GAA CCT GGG AGG CGG AGC TGG CAG TGA GCC AAG ATC GCA CCA TTG CAC 1870
1871 TCC AGC CTG GGC AAC ACA GTG AGA CTC CGT CTC AAA AAA AAA AAA AAA 1918
1919 AAA AAA AAA AAA AAA AAA A 1937
7.PP7879
A:核苷酸序列(SEQ ID NO:19)长度:1545bp
1 GGTGGAAGAG AGTATGTGTA TGTGTGTTCC TGTACATAGC ATGGGTGCAG CTGTGGATGT
61 GTGCAAAAGA GTGTGAGTGT GTGTGTGTGT GTGTGTGTGT AAAGGGGTCT GTCCTAGAGC
121 CCACATCAGT TTGTTGTGAA TCTGGAAAAA GGGTCGGTGA GGGCCGGGAG ATGTTGACCC
181 TGGTGGGAGC AGGCTGAGGC TGCCCCGTTC TCCACATCCT CTGGTTTGCC CAGTCTCTGA
241 TTCCATTAGG GGGAGTGTGC TGAAGCCATT CTCGGATGCT TCCCAGACCA GGCTCCCTCT
301 GCCAGAGTCA CATGCATCCG AGCTGCTGGT CTCCATTGTC CAGCAGGAAG GCGGAAAGGC
361 AGGCAAGATG GTGTGAAGCT TAAAGCTTGT ATTTGATGGA AAAGGTCTCC CCTGTTCATC
421 TGAGAGGCCA AGCCTGGCCA CCCCAGGCTC AGAACCTGGG CTTCAAGAAA TGTGCTGGGA
481 GCTCCTAACT TACACATCCC TCCAGCCTTC CTTGAATCCT CCCACCACCC CCTATTTTCC
541 TTTAATTTCT CAGGTCTGCT CCCTCCTCCC CCAACCCCAC AGCTGGGCAA GAAGTCTGCA
601 AAAGCTGCAT CTGCAGCTGT CTCTAACTCT TCCCAGCCAT CTCCCGTATT TTTTGGTACC
661 TTGATTCCTT GACTCTTAAT AAGCCAAGCC ACCTTATCTC TGTAGTTCTT ATTTTTTTGT
721 TGACTAAATT TGGGGGGTTC TTTTTTATGG TCATGTCACT GACCTATTAA ATTGGGGCTT
781 GGTGCTTTTC CACCTTCCCC CTCTGAATGA AAGCCAAGGA ATGGGGGAAG AGCGGGAACT
841 CTGCCACGGA GGTGGAGCAA GAACGGTGAA GGGCCCTGGT CCCAGAGAGG CTGGTGGGTC
901 CCTCTCCCAA AGGAAGGCAG ACAGTCTCTG CTTTGCCTTG GACCTTGGTG CTTGGGGGTG
961 GGGAGGCCCT GGGGGGGACA CTCCCCACTC CCATTCCCCT TCCTTTGTCC TAATCCTGGA
1021 ATTAAGTACA GGGGTTTATA GGTTCTATTT CTTCCCAAGA GCCCTGCAAA GAACCCCAGT
1081 TTCCTATTTG GATGCCCCTA CACTGTTGTG TTTCAGTGGA ATGTATTTTC ATTTAAAAAC
1141 AACTTTGAAT GGGGCACTTT TTCTTTCCTG TTTTAAAAAT TGAAAAATTC TTACAGTACA
1201 AACAGGACTG TCAGGGTGGG GGTGTTGGTG CTGTAAGAGG TCACTCTTGA GTGCATTTTG
1261 GCACTGGGAT GGGATGGCTG GGGTGGGAAG ACCCCCATCC CCACCCCCAA CTTCTTTTCT
1321 AATATTTAAG GAGTGTTTTG TAGGATTCAA CAACCACCAC AACTTGAATT TGTATCATGG
1381 GAGGTGGGAG GGAGTGGCTT AGAGGTGTCT GCCTATGCTT AAAGCCAACT GTGGAAGTTT
1441 TGTTTTCCCT TTTTTGTATA ATAAAGTGAA AAACAAAGGT TTAAAAAAAA AAAAAAAAAA
1501 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAA
B:氨基酸序列(SEQ ID NO:20)长度:120个氨基酸
1 MGEERELCHG GGARTVKGPG PREAGGSLSQ RKADSLCFAL DLGAWGWGGP GGDTPHSHSP
61 SFVLILELST GVYRFYFFPR ALQRTPVSYL DAPTLLCFSG MYFHLKTTLN GALFLSCFKN
C.核苷酸及氨基酸组合序列(SEQ ID NO:21)
克隆号:PP7879
起始编码子:821 ATG 终止编码子:1181 TGA
蛋白质分子量:13001.16
1 G GTG GAA GAG AGT ATG TGT ATG TGT GTT CCT GTA CAT AGC ATG GGT 46
47 GCA GCT GTG GAT GTG TGC AAA AGA GTG TGA GTG TGT GTG TGT GTG TGT 94
95 GTG TGT AAA GGG GTC TGT CCT AGA GCC CAC ATC AGT TTG TTG TGA ATC 142
143 TGG AAA AAG GGT CGG TGA GGG CCG GGA GAT GTT GAC CCT GGT GGG AGC 190
191 AGG CTG AGG CTG CCC CGT TCT CCA CAT CCT CTG GTT TGC CCA GTC TCT 238
239 GAT TCC ATT AGG GGG AGT GTG CTG AAG CCA TTC TCG GAT GCT TCC CAG 286
287 ACC AGG CTC CCT CTG CCA GAG TCA CAT GCA TCC GAG CTG CTG GTC TCC 334
335 ATT GTC CAG CAG GAA GGC GGA AAG GCA GGC AAG ATG GTG TGA AGC TTA 382
383 AAG CTT GTA TTT GAT GGA AAA GGT CTC CCC TGT TCA TCT GAG AGG CCA 430
431 AGC CTG GCC ACC CCA GGC TCA GAA CCT GGG CTT CAA GAA ATG TGC TGG 478
479 GAG CTC CTA ACT TAC ACA TCC CTC CAG CCT TCC TTG AAT CCT CCC ACC 526
527 ACC CCC TAT TTT CCT TTA ATT TCT CAG GTC TGC TCC CTC CTC CCC CAA 574
575 CCC CAC AGC TGG GCA AGA AGT CTG CAA AAG CTG CAT CTG CAG CTG TCT 622
623 CTA ACT CTT CCC AGC CAT CTC CCG TAT TTT TTG GTA CCT TGA TTC CTT 670
671 GAC TCT TAA TAA GCC AAG CCA CCT TAT CTC TGT AGT TCT TAT TTT TTT 718
719 GTT GAC TAA ATT TGG GGG GTT CTT TTT TAT GGT CAT GTC ACT GAC CTA 766
767 TTA AAT TGG GGC TTG GTG CTT TTC CAC CTT CCC CCT CTG AAT GAA AGC 814
815 CAA GGA ATG GGG GAA GAG CGG GAA CTC TGC CAC GGA GGT GGA GCA AGA 862
1 Met Gly Glu Glu Arg Glu Leu Cys His Gly Gly Gly Ala Arg 14
863 ACG GTG AAG GGC CCT GGT CCC AGA GAG GCT GGT GGG TCC CTC TCC CAA 910
15 Thr Val Lys Gly Pro Gly Pro Arg Glu Ala Gly Gly Ser Leu Ser Gln 30
911 AGG AAG GCA GAC AGT CTC TGC TTT GCC TTG GAC CTT GGT GCT TGG GGG 958
3l Arg Lys Ala Asp Ser Leu Cys Phe Ala Leu Asp Leu Gly Ala Trp Gly 46
959 TGG GGA GGC CCT GGG GGG GAC ACT CCC CAC TCC CAT TCC CCT TCC TTT 1006
47 Trp Gly Gly Pro Gly Gly Asp Thr Pro His Ser His Ser Pro Ser Phe 62
1007 GTC CTA ATC CTG GAA TTA AGT ACA GGG GTT TAT AGG TTC TAT TTC TTC 1054
63 Val Leu Ile Leu Glu Leu Ser Thr Gly Val Tyr Arg Phe Tyr Phe Phe 78
1055 CCA AGA GCC CTG CAA AGA ACC CCA GTT TCC TAT TTG GAT GCC CCT ACA 1102
79 Pro Arg Ala Leu Gln Arg Thr Pro Val Ser Tyr Leu Asp Ala Pro Thr 94
1103 CTG TTG TGT TTC AGT GGA ATG TAT TTT CAT TTA AAA ACA ACT TTG AAT 1150
95 Leu Leu Cys Phe Ser Gly Met Tyr Phe His Leu Lys Thr Thr Leu Asn 110
1151 GGG GCA CTT TTT CTT TCC TGT TTT AAA AAT TGA AAA ATT CTT ACA GTA 1198
111 Gly Ala Leu Phe Leu Ser Cys Phe Lys Asn *** 121
1199 CAA ACA GGA CTG TCA GGG TGG GGG TGT TGG TGC TGT AAG AGG TCA CTC 1246
1247 TTG AGT GCA TTT TGG CAC TGG GAT GGG ATG GCT GGG GTG GGA AGA CCC 1294
1295 CCA TCC CCA CCC CCA ACT TCT TTT CTA ATA TTT AAG GAG TGT TTT GTA 1342
1343 GGA TTC AAC AAC CAC CAC AAC TTG AAT TTG TAT CAT GGG AGG TGG GAG 1390
1391 GGA GTG GCT TAG AGG TGT CTG CCT ATG CTT AAA GCC AAC TGT GGA AGT 1438
1439 TTT GTT TTC CCT TTT TTG TAT AAT AAA GTG AAA AAC AAA GGT TTA AAA 1486
1487 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 1534
1535 AAA AAA AAA AA 1545
8.PP8376
A:核苷酸序列(SEQ ID NO:22)长度:1841bp
1 GTCTGATTGG GTGGTGTGGC GCAATGCGCG CGACCCTCAA GATACCAAAC TGTACGCATC
61 TCTGACCCTT TCCTCTCCTT GCTCCTGCTG GTAAACCGAA GCCCAGGAGA CTTCCAGGTT
121 TGGGCATCTG CAGAGGGCGA GGAACTGGTC ACGGCGCCGG GTGGGCTTGC AGCTGTGACG
181 CTTATGTGGA CACCTCAGTG TCGCTGGTGG TTCACCTCGG CTTCCCAGTT TATTTATTGA
241 CGTCAACAAA TAAATGTTGA ATAAGGAAGA AGAGTTAGAA TTGCTTGAAG CCCTCTGGAG
301 TTTTAGCACT AGTCCCGCCC ACTCCCTTCT ACTTCCAGGT CGGGGGGGGG CGGGTCCAAT
361 AGAAAGGCGG AAGCCAGTGT CCCAGGCGTT CTCACGCCCG CAACAATTCC TGAGTAGGGC
421 CTTGCTTGAG TTCTTCGGAA AGTCTCATCC ACCCCCACAT CGCCTCTTTA GGAAGTCACT
481 TAATGTTGGG CTTCATTATT CCCACATCCC TTTCCTTACT ACTTGCCTGC ACTTCTTGAG
541 AAAAAGACTG CAGAAAGGAG AGGTGGGGCT TTCAGTAGAA ACAAGCAAAC CGCAGGTCCC
601 TGTGGGGGGA CTCTCCAGGA AGAAGGTTCC GCAAGAACCG TGGGCGACAG TTATGGAGAA
661 GCGTCTGCAG GAGGCTCAGC TGTACAAGGA GGAAGGGAAC CAGCGCTACC GGGAAGGGAA
721 GTACCGAGAT GCTGTGAGTA GGTACCATCG AGCTCTGCTT CAGCTGCGGG GTCTGGATCC
781 GAGTCTGCCC TCTCCGTTAC CTAATCTCGG ACCTCAGGGC CCGGCCCTCA CGCCTGAACA
841 AGAAAACATA TTGCATACCA CCCAGACAGA CTGCTATAAC AATCTAGCTG TTGTGAAATA
901 GGGAGTGTTT CCCTTCTTAA TCATAAAAAG GCAGAACATT GACCTGAATT GCCTGAATTG
961 ACTCCTCTGC AGCTTGTCTC CTTCAGATGG AGCCCGTGAA CTACGAACGA GTGAGAGAAT
1021 ATAGTCAGAA AGTCCTGGAA CGACAGCCTG ATAATGCCAA GGCCTTGTAT CGGGCCGGAG
1081 TGGCCTTTTT CCATCTGCAG GACTATGACC AGGCCCGCCA CTACCTCCTG GCTGCCGTGA
1141 ATAGGCAGCC TAAAGGTAAG CAAGAAGGGC TTTGAAATGG TAAAGACAAA ATTGTCTTGC
1201 TGGGGTGGAT CTGTGGAAAG GGGGTTTTAT TTTACTTTGC CAATGTATTA TTTTCAATAA
1261 GTAATACATT CACATGGTTG AGAATTCGAA CTGAAAAAGT ATACGATGAA CAGACCTTTT
1321 TCCACTCTTG TGTTCTTGTC TCCACAGAAA AGCAGTATTA TTAGTTTCAT GTGTAGGGGG
1381 TTGATGCTTA ATCAGACATA CACAATATAT ATGTTGGTAT GTCTGTTTCA TATATGTATG
1441 TATGCCTATT CTAATATATA AATATATGTA TATCAACGTG CTTTTATTTA TAAATATACA
1501 GTGTATATAT TTATACATAT ACATGAATAT ATATATAAAA TAGGCAGGCC AGGTGGGGTG
1561 GCTCACATCT GTTATCTCAG CACTTTGGGA GACCAAAGTG GGTGGATCAC CTGAGGTCAG
1621 GAGTTTGAGA CCAGCCTGAC CAACATGGAG AAACCCCATC TCTACTAAAA ATACAAAATT
1681 AGCCAGGCAT GGTGGCGCAT GCCTGTAAAC CCAGCTACTC GGGAGGCTGA GGCAGGAGAA
1741 TTGCTTGAAC CCAGGAGGCG GAGGTTGCGG TGAGCCGAGA TCCTGGGCAA CAAGAACGAG
1801 ATTCTGTCTC CAAAAAAAAA AAAAAAAAAA AAAAAAAAAA A
B:氨基酸序列(SEQ ID NO:23) 长度:215个氨基酸
1 MLNKEEELEL LEALWSFSTS PAHSLLLPGR GGAGPIERRK PVSQAFSRPQ QFLSRALLEF
61 FGKSHPPPHR LFRKSLNWGL HYSHIPFLTT CLHFLRKRLQ KGEVGLSVET SKPQVPVGGL
121 SRKKVPQEPW ATVMEKRLQE AQLYKEEGNQ RYREGKYRDA VSRYHRALLQ LRGLDPSLPS
181 PLPNLGPQGP ALTPEQENIL HTTQTDCYNN LAVVK
C.核苷酸及氨基酸组合序列(SEQ ID NO:24)
克隆号:PP8376
起始编码子:254 ATG 终止编码子:899 TAG
蛋白质分子量:24371.77
1 G TCT GAT TGG GTG GTG TGG CGC AAT GCG CGC GAC CCT CAA GAT ACC 46
47 AAA CTG TAC GCA TCT CTG ACC CTT TCC TCT CCT TGC TCC TGC TGG TAA 94
95 ACC GAA GCC CAG GAG ACT TCC AGG TTT GGG CAT CTG CAG AGG GCG AGG 142
143 AAC TGG TCA CGG CGC CGG GTG GGC TTG CAG CTG TGA CGC TTA TGT GGA 190
191 CAC CTC AGT GTC GCT GGT GGT TCA CCT CGG CTT CCC AGT TTA TTT ATT 238
239 GAC GTC AAC AAA TAA ATG TTG AAT AAG GAA GAA GAG TTA GAA TTG CTT 286
1 Met Leu Asn Lys Glu Glu Glu Leu Glu Leu Leu 11
287 GAA GCC CTC TGG AGT TTT AGC ACT AGT CCC GCC CAC TCC CTT CTA CTT 334
12 Glu Ala Leu Trp Ser Phe Ser Thr Ser Pro Ala His Ser Leu Leu Leu 27
335 CCA GGT CGG GGG GGG GCG GGT CCA ATA GAA AGG CGG AAG CCA GTG TCC 382
28 Pro Gly Arg Gly Gly Ala Gly Pro Ile Glu Arg Arg Lys Pro Val Ser 43
383 CAG GCG TTC TCA CGC CCG CAA CAA TTC CTG AGT AGG GCC TTG CTT GAG 430
44 Gln Ala Phe Ser Arg Pro Gln Gln Phe Leu Ser Arg Ala Leu Leu Glu 59
431 TTC TTC GGA AAG TCT CAT CCA CCC CCA CAT CGC CTC TTT AGG AAG TCA 478
60 Phe Phe Gly Lys Ser His Pro Pro Pro His Arg Leu Phe Arg Lys Ser 75
479 CTT AAT GTT GGG CTT CAT TAT TCC CAC ATC CCT TTC CTT ACT ACT TGC 526
76 Leu Asn Val Gly Leu His Tyr Ser His Ile Pro Phe Leu Thr Thr Cys 91
527 CTG CAC TTC TTG AGA AAA AGA CTG CAG AAA GGA GAG GTG GGG CTT TCA 574
92 Leu His Phe Leu Arg Lys Arg Leu Gln Lys Gly Glu Val Gly Leu Ser 107
575 GTA GAA ACA AGC AAA CCG CAG GTC CCT GTG GGG GGA CTC TCC AGG AAG 622
108 Val Glu Thr Ser Lys Pro Gln Val Pro Val Gly Gly Leu Ser Arg Lys 123
623 AAG GTT CCG CAA GAA CCG TGG GCG ACA GTT ATG GAG AAG CGT CTG CAG 670
124 Lys Val Pro Gln Glu Pro Trp Ala Thr Val Met Glu Lys Arg Leu Gln 139
671 GAG GCT CAG CTG TAC AAG GAG GAA GGG AAC CAG CGC TAC CGG GAA GGG 718
140 Glu Ala Gln Leu Tyr Lys Glu Glu Gly Asn Gln Arg Tyr Arg Glu Gly 155
719 AAG TAC CGA GAT GCT GTG AGT AGG TAC CAT CGA GCT CTG CTT CAG CTG 766
156 Lys Tyr Arg Asp Ala Val Ser Arg Tyr His Arg Ala Leu Leu Gln Leu 171
767 CGG GGT CTG GAT CCG AGT CTG CCC TCT CCG TTA CCT AAT CTC GGA CCT 814
172 Arg Gly Leu Asp Pro Ser Leu Pro Ser Pro Leu Pro Asn Leu Gly Pro 187
815 CAG GGC CCG GCC CTC ACG CCT GAA CAA GAA AAC ATA TTG CAT ACC ACC 862
188 Gln Gly Pro Ala Leu Thr Pro Glu Gln Glu Asn Ile Leu His Thr Thr 203
863 CAG ACA GAC TGC TAT AAC AAT CTA GCT GTT GTG AAA TAG GGA GTG TTT 910
204 Gln Thr Asp Cys Tyr Asn Asn Leu Ala Val Val Lys *** 216
911 CCC TTC TTA ATC ATA AAA AGG CAG AAC ATT GAC CTG AAT TGC CTG AAT 958
959 TGA CTC CTC TGC AGC TTG TCT CCT TCA GAT GGA GCC CGT GAA CTA CGA 1006
1007 ACG AGT GAG AGA ATA TAG TCA GAA AGT CCT GGA ACG ACA GCC TGA TAA 1054
1055 TGC CAA GGC CTT GTA TCG GGC CGG AGT GGC CTT TTT CCA TCT GCA GGA 1102
1103 CTA TGA CCA GGC CCG CCA CTA CCT CCT GGC TGC CGT GAA TAG GCA GCC 1150
1151 TAA AGG TAA GCA AGA AGG GCT TTG AAA TGG TAA AGA CAA AAT TGT CTT 1198
1199 GCT GGG GTG GAT CTG TGG AAA GGG GGT TTT ATT TTA CTT TGC CAA TGT 1246
1247 ATT ATT TTC AAT AAG TAA TAC ATT CAC ATG GTT GAG AAT TCG AAC TGA 1294
1295 AAA AGT ATA CGA TGA ACA GAC CTT TTT CCA CTC TTG TGT TCT TGT CTC 1342
1343 CAC AGA AAA GCA GTA TTA TTA GTT TCA TGT GTA GGG GGT TGA TGC TTA 1390
1391 ATC AGA CAT ACA CAA TAT ATA TGT TGG TAT GTC TGT TTC ATA TAT GTA 1438
1439 TGT ATG CCT ATT CTA ATA TAT AAA TAT ATG TAT ATC AAC GTG CTT TTA 1486
1487 TTT ATA AAT ATA CAG TGT ATA TAT TTA TAC ATA TAC ATG AAT ATA TAT 1534
1535 ATA AAA TAG GCA GGC CAG GTG GGG TGG CTC ACA TCT GTT ATC TCA GCA 1582
1583 CTT TGG GAG ACC AAA GTG GGT GGA TCA CCT GAG GTC AGG AGT TTG AGA 1630
1631 CCA GCC TGA CCA ACA TGG AGA AAC CCC ATC TCT ACT AAA AAT ACA AAA 1678
1679 TTA GCC AGG CAT GGT GGC GCA TGC CTG TAA ACC CAG CTA CTC GGG AGG 1726
1727 CTG AGG CAG GAG AAT TGC TTG AAC CCA GGA GGC GGA GGT TGC GGT GAG 1774
1775 CCG AGA TCC TGG GCA ACA AGA ACG AGA TTC TGT CTC CAA AAA AAA AAA 1822
1823 AAA AAA AAA AAA AAA AAA A 1841
9.PP10029
A:核苷酸序列(SEQ ID NO:25)长度:1738bp
1 GGGTGGGTGC CTGATGAGCG GTGCTTCCCT CATATGATAT GTGGGCACCC TGAAGCTCTC
61 ACGTAATGGT TCTGCTGTGC CGGGTTGTGA CCCAGCTGTC CTTGGTAGGC TCTCCTGTTT
121 AATGAGCAAC TGCTATATGC CAGGCCCTGT TCTAGAAACA GATGAGGCCC CTGTTCCCAT
181 GGAACTTAGA TCTGAGTATG TGGACAGAGT GAGTAGGTTG CCAGATAATG TCAGAGGTAA
241 GAAAAAAGCC AGGCAGAGGA CAGCAGTGCT GGTTTAGACA AGGGTTGGCA AGGCCTCCCT
301 GATAAGGGGA CGTATTTGCG CAGACACGGA AGCAGTCTGA TGGAAGGCTT GCCCTGTAGG
361 GACCTGGGGT GCAGACTGAG CTGGGAGGGC TCTTGGCTTG CTCCAATGAG GTAGGGGCGA
421 AGAGAGGGCA GAATGGCCCC CGTGCTGGTC CAGATGTGGC CAGCGCCAGA TCGTATAGAG
481 CCGTGGAGGC ACGGTAAGGA CTTGGGGTTT GAGGGAGATG AGGGCCCTGA GCAGGGGTGC
541 CATGATCTAG CCTCTGCTCC AGAAGGATCT GTCTGGCTGC CATGTGGGGG ACACGGAGTG
601 GAGCAAAGAC GGGAGCCCAG TGAGAGTCGA GGGAGAGGTG ACCTCAGCTT GGGCTGCGGT
661 GCAGGCCATG GGACTGGCAG GAGGTGGCTG GGGTTACGCT GTCTTTTCTA ACATTCAGCA
721 TTGGCTCAGG GGCCAGGTCA GGGCTCACAG ACTGTTGCTA TAAAGGGCTG GGTGGCTTTC
781 TTCCCCACAG CTACTCAGCC TAATGCCATT GCAGAGCACA TGTAGCCATG GACAACACAA
841 GGGGCGTATC CGTGTTCCAG GACAGCCATA TTGACAGGAA TAGGCAGGAG GCCAGATTTG
901 GTCCTCAGGC TGTAATTTCT TGGCCCCTTG TCTAGGGAGA GGTAAACGAG GGGAGGAGAG
961 ATCAGTCAAG GATGACGTGA GGGTTTGCTG GGAGCACCAG GAATCCTGGA GAAGGTAGTG
1021 GCAAGAGGGT GCAGCAAGCT CAGCTGGGCG GGGATCAAGT CTGAGGACTT AATGTCTCCT
1081 CTGATCTCCA GACCCATAAG GGAGATGCTG AGTAGACAAC TGGGGCTTAT GGGTCTGGAG
1141 TTCAGAGGAG AGATCGGGAA GGTGTCCATT TGGAGTCATC CACGCAGAGA TGTGTGAAGG
1201 CTGCTCAATG ATTTTGAGGT TTAAAGAAAA AAAGAGATGT GAAACCAGGG GCCCTGATGA
1261 GGCTGCCCAG GTGGTAAGGA AGACAGAAGA GAAGCCATGG GACAGCTGAG CCCGGGCACC
1321 CTCAAGCCTT GGAGGCATGA AGTTTGGTGG GGATCTGGCA AAGAACACCT GGGAGCAGCC
1381 AGCGGGCAGC AGACCCCAGA GTAGCAGGGA AGACAAGCAC TTCAAAGAGG CAGCGTCAGC
1441 CAGGGGCAGT GGCTCAGCTG TAATCCTAGC ACTTTGGGAG GCCAAGGATG GCAGATCACC
1501 TGAGGTTAGG GGTTCGAGAC TAGCCTGGCC AACATGGTGA AACCCTGTCT CTACTAAAAA
1561 TAAAAAATTA GCCAGGCATT GGTGGTATGT GCCTGTAATC CCAGCTACTC GAGAGGCTGA
1621 GGCAGGAGAA TCTCTTGAAC CCGGGAGGCA GAGGTTGCAG TGAGCCGAGA TCATGCCATT
1681 GCACTCCAGC CTGGGCAACA AGAGCGAAAC TCCGTCTCAA AAAAAAAAAA AAAAAAAA
B:氨基酸序列(SEQ ID NO:26)长度:92个氨基酸
1 MAPVLVQMWP APDRIEPWRH GKDLGFEGDE GPEQGCHDLA SAPEGSVWLP CGGHGVEQRR
61 EPSESRGRGD LSLGCGAGHG TGRRWLGLRC LF
C.核苷酸及氨基酸组合序列(SEQ ID NO:27)
克隆号:PP10029
起始编码子:433 ATG 终止编码子:709 TAA
蛋白质分子量:9973.67
1 GGG TGG GTG CCT GAT GAG CGG TGC TTC CCT CAT ATG ATA TGT GGG CAC 48
49 CCT GAA GCT CTC ACG TAA TGG TTC TGC TGT GCC GGG TTG TGA CCC AGC 96
97 TGT CCT TGG TAG GCT CTC CTG TTT AAT GAG CAA CTG CTA TAT GCC AGG 144
145 CCC TGT TCT AGA AAC AGA TGA GGC CCC TGT TCC CAT GGA ACT TAG ATC 192
193 TGA GTA TGT GGA CAG AGT GAG TAG GTT GCC AGA TAA TGT CAG AGG TAA 240
241 GAA AAA AGC CAG GCA GAG GAC AGC AGT GCT GGT TTA GAC AAG GGT TGG 288
289 CAA GGC CTC CCT GAT AAG GGG ACG TAT TTG CGC AGA CAC GGA AGC AGT 336
337 CTG ATG GAA GGC TTG CCC TGT AGG GAC CTG GGG TGC AGA CTG AGC TGG 384
385 GAG GGC TCT TGG CTT GCT CCA ATG AGG TAG GGG CGA AGA GAG GGC AGA 432
433 ATG GCC CCC GTG CTG GTC CAG ATG TGG CCA GCG CCA GAT CGT ATA GAG 480
1 Met Ala Pro Val Leu Val Gln Met Trp Pro Ala Pro Asp Arg Ile Glu 16
481 CCG TGG AGG CAC GGT AAG GAC TTG GGG TTT GAG GGA GAT GAG GGC CCT 528
17 Pro Trp Arg His Gly Lys Asp Leu Gly Phe Glu Gly Asp Glu Gly Pro 32
529 GAG CAG GGG TGC CAT GAT CTA GCC TCT GCT CCA GAA GGA TCT GTC TGG 576
33 Glu Gln Gly Cys His Asp Leu Ala Ser Ala Pro Glu Gly Ser Val Trp 48
577 CTG CCA TGT GGG GGA CAC GGA GTG GAG CAA AGA CGG GAG CCC AGT GAG 624
49 Leu Pro Cys Gly Gly His Gly Val Glu Gln Arg Arg Glu Pro Ser Glu 64
625 AGT CGA GGG AGA GGT GAC CTC AGC TTG GGC TGC GGT GCA GGC CAT GGG 672
65 Ser Arg Gly Arg Gly Asp Leu Ser Leu Gly Cys Gly Ala Gly His Gly 80
673 ACT GGC AGG AGG TGG CTG GGG TTA CGC TGT CTT TTC TAA CAT TCA GCA 720
81 Thr Gly Arg Arg Trp Leu Gly Leu Arg Cys Leu Phe *** 93
721 TTG GCT CAG GGG CCA GGT CAG GGC TCA CAG ACT GTT GCT ATA AAG GGC 768
769 TGG GTG GCT TTC TTC CCC ACA GCT ACT CAG CCT AAT GCC ATT GCA GAG 816
817 CAC ATG TAG CCA TGG ACA ACA CAA GGG GCG TAT CCG TGT TCC AGG ACA 864
865 GCC ATA TTG ACA GGA ATA GGC AGG AGG CCA GAT TTG GTC CTC AGG CTG 912
913 TAA TTT CTT GGC CCC TTG TCT AGG GAG AGG TAA ACG AGG GGA GGA GAG 960
961 ATC AGT CAA GGA TGA CGT GAG GGT TTG CTG GGA GCA CCA GGA ATC CTG 1008
1009 GAG AAG GTA GTG GCA AGA GGG TGC AGC AAG CTC AGC TGG GCG GGG ATC 1056
1057 AAG TCT GAG GAC TTA ATG TCT CCT CTG ATC TCC AGA CCC ATA AGG GAG 1104
1105 ATG CTG AGT AGA CAA CTG GGG CTT ATG GGT CTG GAG TTC AGA GGA GAG 1152
1153 ATC GGG AAG GTG TCC ATT TGG AGT CAT CCA CGC AGA GAT GTG TGA AGG 1200
1201 CTG CTC AAT GAT TTT GAG GTT TAA AGA AAA AAA GAG ATG TGA AAC CAG 1248
1249 GGG CCC TGA TGA GGC TGC CCA GGT GGT AAG GAA GAC AGA AGA GAA GCC 1296
1297 ATG GGA CAG CTG AGC CCG GGC ACC CTC AAG CCT TGG AGG CAT GAA GTT 1344
1345 TGG TGG GGA TCT GGC AAA GAA CAC CTG GGA GCA GCC AGC GGG CAG CAG 1392
1393 ACC CCA GAG TAG CAG GGA AGA CAA GCA CTT CAA AGA GGC AGC GTC AGC 1440
1441 CAG GGG CAG TGG CTC AGC TGT AAT CCT AGC ACT TTG GGA GGC CAA GGA 1488
1489 TGG CAG ATC ACC TGA GGT TAG GGG TTC GAG ACT AGC CTG GCC AAC ATG 1536
1537 GTG AAA CCC TGT CTC TAC TAA AAA TAA AAA ATT AGC CAG GCA TTG GTG 1584
1585 GTA TGT GCC TGT AAT CCC AGC TAC TCG AGA GGC TGA GGC AGG AGA ATC 1632
1633 TCT TGA ACC CGG GAG GCA GAG GTT GCA GTG AGC CGA GAT CAT GCC ATT 1680
1681 GCA CTC CAG CCT GGG CAA CAA GAG CGA AAC TCC GTC TCA AAA AAA AAA 1728
1729 AAA AAA AAA A 1738
10.SP2114b
A:核苷酸序列(SEQ ID NO:28)长度:1980bp
1 CTCTTCTTCC CAAAGTCCTG GTCAGTTCCC CAGAAAGGAC CAGTCATGGC TGTGCAGGGT
61 GACTGCCCTC CCCCAGGTCA GCCCTGTCGA CAAAGGCAGG GGCTTGGTTG TCATTTCCAC
121 CAAGTGGGAA GACAGTATTA ATAGATGGAG AACCCTCTGC AGTGGGAAGA TTTCAGCAAT
181 GGGCAAGCTG GATAGAGCCG TGGTTAGGAT GGAGTTGTTT GCTTGTTGCA CTTGGAGCTC
241 TTTATGAAGC AAGGGCTCTG CCTCCCAGCC TGAGACCCAG ACCCTGGTTT GGACCCAGTA
301 GAACTCTTGT GGGCCCTGGG TTGGTGTCTC TGAGCAAATC CCCAAAGCAG GAGAGTCCCT
361 AGCACCGTGA GCTCTGTCAG AACCTCCCAG CTGGCCTTCC TTCTGCCCTC ATTGACAACC
421 CTCTGACCCT CTTGCTGAGC ATAGACACAT ATGTGATGTT ACAGGAGCCA GTGACCTTCC
481 AGGATGTGGC TGTGGACTTC AGCCGGGAGG AGTGGGGGCT GCTGGGCCCG ACACAGAGGA
541 CCGAGTACCG CGATGTGATG CTGGAGACCT TTGGGCACCT GGTCTCTGTG GGGTGGGAGA
601 CTACACTGGA AAATAAAGAG TTAGCTCCAA ATTCTGACAT TCCTGAGGAA GAACCAGCCC
661 CCAGCCTGAA AGTACAAGAA TCCTCAAGGG ATTGTGCCTT GTCCTCTACA TTAGAAGATA
721 CCTTGCAGGG TGGGGTCCAG GAAGTCCAAG ACACAGTGTT GAAGCAGATG GAGTCTGCTC
781 AGGAAAAAGA CCTTCCTCAG AAGAAGCACT TTGACAACCG TGAGTCCCAG GCAAACAGTG
841 GTGCTCTTGA CACAAACCAA GTTTCGCTCC AGAAAATTGA CAACCCTGAG TCCCAGGCAA
901 ACAGTGGCGC TCTTGACACA AACCAAGTTT TGCTCCACAA AATTCCTCCT AGAAAACGAT
961 TGCGCAAACG TGACTCACAA GTTAAAAGTA TGAAACATAA TTCACGTGTA AAAATTCATC
1021 AGAAGAGCTG TGAAAGGCAA AAGGCCAAGG AAGGCAATGG TTGTAGGAAA ACCTTCAGTC
1081 GGAGTACTAA ACAGATTACG TTTATAAGAA TTCACAAGGG GAGCCAAGTT TGCCGATGCA
1141 GTGAATGTGG TAAAATATTC CGGAACCCAA GATACTTTTC TGTGCATAAG AAAATCCATA
1201 CCGGAGAGAG GCCCTATGTG TGTCAAGACT GTGGGAAAGG ATTTGTTCAG AGCTCTTCCC
1261 TCACACAGCA TCAGAGAGTT CATTCTGGAG AGAGACCATT TGAATGTCAG GAGTGTGGGA
1321 GGACCTTCAA TGATCGCTCA GCCATCTCCC AGCACCTGAG GACTCACACT GGCGCTAAGC
1381 CCTACAAGTG TCAGGACTGT GGAAAAGCCT TCCGCCAGAG TTCCCACCTC ATCAGACATC
1441 AGAGGACTCA CACCGGGGAG CGCCCATATG CATGCAACAA ATGTGGAAAG GCCTTCACCC
1501 AGAGCTCACA CCTTATTGGG CACCAGAGAA CCCACAATAG GACAAAGCGA AAGAAGAAAC
1561 AGCCTACCTC ATAGCTCTCA AGCCAGTTGA AGAAACCTTG CCTTTTCAGC TTGACCCTGC
1621 AATATAACAT GCACAGGCCT GCTTGTGAAT CAGGACTGAA TGTGAAAGGG AAGTATTGAG
1681 TGAGGACATT CCCAAAACCA AAGGACAACT GAGGAGACTG CCCAGCACAT AATGAATAAA
1741 TAAGAAAATG AGTGAGGAGT TATTAACATC ATTTGGAAAA AAGATTTCCC ATTCACTTGA
1801 TATTGTTTGT TCACTCATTT AGTCATTAAA AGTGAGATTA ATAAA TCTG AAAATGTTAT
1861 ATAATAACTT TAAAAAGCCA GGTAATTAAT AATCTGCACT GATATTACAT CCACAGTACC
1921 ACAGTATTTA TGTGTATGAA TTAAGGATTA AAAGATAATG TGGATAAAAA AAAAAAAAAA
B:氨基酸序列(SEQ ID NO:29)长度:372个氨基酸
1 MLQEPVTFQD VAVDFSREEW GLLGPTQRTE YRDVMLETFG HLVSVGWETT LENKELAPNS
61 DIPEEEPAPS LKVQESSRDC ALSSTLEDTL QGGVQEVQDT VLKQMESAQE KDLPQKKHFD
121 NRESQANSGA LDTNQVSLQK IDNPESQANS GALDTNQVLL HKIPPRKRLR KRDSQVKSMK
181 HNSRVKIHQK SCERQKAKEG NGCRKTFSRS TKQITFIRIH KGSQVCRCSE CGKIFRNPRY
241 FSVHKKIHTG ERPYVCQDCG KGFVQSSSLT QHQRVHSGER PFECQECGRT FNDRSAISQH
301 LRTHTGAKPY KCQDCGKAFR QSSHLIRHQR THTGERPYAC NKCGKAFTQS SHLIGHQRTH
361 NRTKRKKKQP TS
C.核苷酸及氨基酸组合序列(SEQ ID NO:30)
克隆号:SP2114b
起始编码子:456 ATG 终止编码子:1572 TAG
蛋白质分子量:42445.77
1 CT CTT CTT CCC AAA GTC CTG GTC AGT TCC CCA GAA AGG ACC AGT CAT 47
48 GGC TGT GCA GGG TGA CTG CCC TCC CCC AGG TCA GCC CTG TCG ACA AAG 95
96 GCA GGG GCT TGG TTG TCA TTT CCA CCA AGT GGG AAG ACA GTA TTA ATA 143
144 GAT GGA GAA CCC TCT GCA GTG GGA AGA TTT CAG CAA TGG GCA AGC TGG 191
192 ATA GAG CCG TGG TTA GGA TGG AGT TGT TTG CTT GTT GCA CTT GGA GCT 239
240 CTT TAT GAA GCA AGG GCT CTG CCT CCC AGC CTG AGA CCC AGA CCC TGG 287
288 TTT GGA CCC AGT AGA ACT CTT GTG GGC CCT GGG TTG GTG TCT CTG AGC 335
336 AAA TCC CCA AAG CAG GAG AGT CCC TAG CAC CGT GAG CTC TGT CAG AAC 383
384 CTC CCA GCT GGC CTT CCT TCT GCC CTC ATT GAC AAC CCT CTG ACC CTC 431
432 TTG CTG AGC ATA GAC ACA TAT GTG ATG TTA CAG GAG CCA GTG ACC TTC 479
1 Met Leu Gln Glu Pro Val Thr Phe 8
480 CAG GAT GTG GCT GTG GAC TTC AGC CGG GAG GAG TGG GGG CTG CTG GGC 527
9 Gln Asp Val Ala Val Asp Phe Ser Arg Glu Glu Trp Gly Leu Leu Gly 24
528 CCG ACA CAG AGG ACC GAG TAC CGC GAT GTG ATG CTG GAG ACC TTT GGG 575
25 Pro Thr Gln Arg Thr Glu Tyr Arg Asp Val Met Leu Glu Thr Phe Gly 40
576 CAC CTG GTC TCT GTG GGG TGG GAG ACT ACA CTG GAA AAT AAA GAG TTA 623
41 His Leu Val Ser Val Gly Trp Glu Thr Thr Leu Glu Asn Lys Glu Leu 56
624 GCT CCA AAT TCT GAC ATT CCT GAG GAA GAA CCA GCC CCC AGC CTG AAA 671
57 Ala Pro Asn Ser Asp Ile Pro Glu Glu Glu Pro Ala Pro Ser Leu Lys 72
672 GTA CAA GAA TCC TCA AGG GAT TGT GCC TTG TCC TCT ACA TTA GAA GAT 719
73 Val Gln Glu Ser Ser Arg Asp Cys Ala Leu Ser Ser Thr Leu Glu Asp 88
720 ACC TTG CAG GGT GGG GTC CAG GAA GTC CAA GAC ACA GTG TTG AAG CAG 767
89 Thr Leu Gln Gly Gly Val Gln Glu Val Gln Asp Thr Val Leu Lys Gln 104
768 ATG GAG TCT GCT CAG GAA AAA GAC CTT CCT CAG AAG AAG CAC TTT GAC 815
105 Met Glu Ser Ala Gln Glu Lys Asp Leu Pro Gln Lys Lys His Phe Asp 120
816 AAC CGT GAG TCC CAG GCA AAC AGT GGT GCT CTT GAC ACA AAC CAA GTT 863
121 Asn Arg Glu Ser Gln Ala Asn Ser Gly Ala Leu Asp Thr Asn Gln Val 136
864 TCG CTC CAG AAA ATT GAC AAC CCT GAG TCC CAG GCA AAC AGT GGC GCT 911
137 Ser Leu Gln Lys Ile Asp Asn Pro Glu Ser Gln Ala Asn Ser Gly Ala 152
912 CTT GAC ACA AAC CAA GTT TTG CTC CAC AAA ATT CCT CCT AGA AAA CGA 959
153 Leu Asp Thr Asn Gln Val Leu Leu His Lys Ile Pro Pro Arg Lys Arg 168
960 TTG CGC AAA CGT GAC TCA CAA GTT AAA AGT ATG AAA CAT AAT TCA CGT 1007
169 Leu Arg Lys Arg Asp Ser Gln Val Lys Ser Met Lys His Asn Ser Arg 184
1008 GTA AAA ATT CAT CAG AAG AGC TGT GAA AGG CAA AAG GCC AAG GAA GGC 1055
185 Val Lys Ile His GAn Lys Ser Cys Glu Arg Gln Lys Ala Lys Glu Gly 200
1056 AAT GGT TGT AGG AAA ACC TTC AGT CGG AGT ACT AAA CAG ATT ACG TTT 1103
201 Asn Gly Cys Arg Lys Thr Phe Ser Arg Ser Thr Lys Gln Ile Thr Phe 216
1104 ATA AGA ATT CAC AAG GGG AGC CAA GTT TGC CGA TGC AGT GAA TGT GGT 1151
217 Ile Arg Ile His Lys Gly Ser Gln Val Cys Arg Cys Ser Glu Cys Gly 232
1152 AAA ATA TTC CGG AAC CCA AGA TAC TTT TCT GTG CAT AAG AAA ATC CAT 1199
233 Lys Ile Phe Arg Asn Pro Arg Tyr Phe Ser Val His Lys Lys Ile His 248
1200 ACC GGA GAG AGG CCC TAT GTG TGT CAA GAC TGT GGG AAA GGA TTT GTT 1247
249 Thr Gly Glu Arg Pro Tyr Val Cys Gln Asp Cys Gly Lys Gly Phe Val 264
1248 CAG AGC TCT TCC CTC ACA CAG CAT CAG AGA GTT CAT TCT GGA GAG AGA 1295
265 Gln Ser Ser Ser Leu Thr Gln His Gln Arg Val His Ser Gly Glu Arg 280
1296 CCA TTT GAA TGT CAG GAG TGT GGG AGG ACC TTC AAT GAT CGC TCA GCC 1343
281 Pro Phe Glu Cys Gln Glu Cys Gly Arg Thr Phe Asn Asp Arg Ser Ala 296
1344 ATC TCC CAG CAC CTG AGG ACT CAC ACT GGC GCT AAG CCC TAC AAG TGT 1391
297 Ile Ser Gln His Leu Arg Thr His Thr Gly Ala Lys Pro Tyr Lys Cys 312
1392 CAG GAC TGT GGA AAA GCC TTC CGC CAG AGT TCC CAC CTC ATC AGA CAT 1439
313 Gln Asp Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu Ile Arg His 328
1440 CAG AGG ACT CAC ACC GGG GAG CGC CCA TAT GCA TGC AAC AAA TGT GGA 1487
329 Gln Arg Thr His Thr Gly Glu Arg Pro Tyr Ala Cys Asn Lys Cys Gly 344
1488 AAG GCC TTC ACC CAG AGC TCA CAC CTT ATT GGG CAC CAG AGA ACC CAC 1535
345 Lys Ala Phe Thr Gln Ser Ser His Leu Ile Gly His Gln Arg Thr His 360
1536 AAT AGG ACA AAG CGA AAG AAG AAA CAG CCT ACC TCA TAG CTC TCA AGC 1583
36l Asn Arg Thr Lys Arg Lys Lys Lys Gln Pro Thr Ser *** 373
1584 CAG TTG AAG AAA CCT TGC CTT TTC AGC TTG ACC CTG CAA TAT AAC ATG 1631
1632 CAC AGG CCT GCT TGT GAA TCA GGA CTG AAT GTG AAA GGG AAG TAT TGA 1679
1680 GTG AGG ACA TTC CCA AAA CCA AAG GAC AAC TGA GGA GAC TGC CCA GCA 1727
1728 CAT AAT GAA TAA ATA AGA AAA TGA GTG AGG AGT TAT TAA CAT CAT TTG 1775
1776 GAA AAA AGA TTT CCC ATT CAC TTG ATA TTG TTT GTT CAC TCA TTT AGT 1823
1824 CAT TAA AAG TGA GAT TAA TAA AAT CTG AAA ATG TTA TAT AAT AAC TTT 1871
1872 AAA AAG CCA GGT AAT TAA TAA TCT GCA CTG ATA TTA CAT CCA CAG TAC 1919
1920 CAC AGT ATT TAT GTG TAT GAA TTA AGG ATT AAA AGA TAA TGT GGA TAA 1967
1968 AAA AAA AAA AAA A 1980
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
Claims (9)
1.一种分离的具有促进癌细胞生长功能的人蛋白,其特征在于,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ IDNO:29。
2.如权利要求1所述的蛋白,其特征在于,该蛋白的氨基酸序列选自下组:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ IDNO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29。
3.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列选自下组:
(a)编码如权利要求1所述蛋白的多核苷酸;
(b)与多核苷酸(a)互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30的编码区序列。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30的全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求6所述的载体转化或转导的宿主细胞;
(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有促进癌细胞生长功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含:
(a)在适合表达具有促进癌细胞生长功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;
(b)从培养物中分离出具有促进癌细胞生长功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有促进癌细胞生长功能的人蛋白特异性结合的抗体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB001271032A CN1155616C (zh) | 2000-10-31 | 2000-10-31 | 具有促进癌细胞生长功能的新的人蛋白及其编码序列 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB001271032A CN1155616C (zh) | 2000-10-31 | 2000-10-31 | 具有促进癌细胞生长功能的新的人蛋白及其编码序列 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1351082A CN1351082A (zh) | 2002-05-29 |
CN1155616C true CN1155616C (zh) | 2004-06-30 |
Family
ID=4592123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB001271032A Expired - Fee Related CN1155616C (zh) | 2000-10-31 | 2000-10-31 | 具有促进癌细胞生长功能的新的人蛋白及其编码序列 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1155616C (zh) |
-
2000
- 2000-10-31 CN CNB001271032A patent/CN1155616C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1351082A (zh) | 2002-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1170850C (zh) | 人血管生成素样蛋白和编码序列及其用途 | |
CN1169954C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1155616C (zh) | 具有促进癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1177048C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1199998C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1177864C (zh) | 在肝癌组织中具有表达差异的新的人蛋白及其编码序列 | |
CN1155615C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1177049C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1209373C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1170848C (zh) | 新的人肝癌相关蛋白及其编码序列 | |
CN1199997C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1169958C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1194010C (zh) | 具有抑制癌细胞生长功能的人蛋白及基编码序列 | |
CN1209370C (zh) | 具有抑癌功能的新的人蛋白及其编码序列 | |
CN1194989C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1199996C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1155614C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1199994C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1169831C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1169955C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1177050C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1190446C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1193041C (zh) | 具有抑制癌细胞生长功能的人蛋白及其编码序列 | |
CN1209374C (zh) | 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1199999C (zh) | 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |