CN1205225C - 具有抑癌功能的新的人蛋白及其编码序列 - Google Patents
具有抑癌功能的新的人蛋白及其编码序列 Download PDFInfo
- Publication number
- CN1205225C CN1205225C CNB011053127A CN01105312A CN1205225C CN 1205225 C CN1205225 C CN 1205225C CN B011053127 A CNB011053127 A CN B011053127A CN 01105312 A CN01105312 A CN 01105312A CN 1205225 C CN1205225 C CN 1205225C
- Authority
- CN
- China
- Prior art keywords
- ctg
- ccc
- leu
- gcc
- cag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。
Description
技术领域
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸和此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
背景技术
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
发明内容
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
3T3细胞是一种小鼠成纤维细胞(J.Cell.Biol.,17:299,1963)。在癌症研究领域中,常将外源基因(尤其是人基因)引入3T3细胞,观察其对3T3细胞生长的影响情况。通常认为,对3T3细胞生长有影响的基因是癌症相关基因,其中对3T3细胞生长有抑制作用的基因大多是抑癌基因,而对3T3细胞生长有促进作用的基因大多是(原)癌基因。
本发明采用大规模cDNA克隆转染小鼠胚胎成纤维细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对3T3细胞具有抑制克隆形成的作用,其抑制率≥50%。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP239蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ IDNO:3所示的编码区序列有差别的核酸序列。再以PP446蛋白为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。对于其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽有相同的生物学功能(以PP239蛋白为例)和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold SpringHarbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明多核苷酸的载体,以及用本发明载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将本发明蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,etal.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。这些抗体可用常规方法制备。抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与本发明蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而现在只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
具体实施方式
实施例1:cDNA基因的获得及对3T3细胞克隆形成的抑制作用
PP239、PP446、PP5715、PP6977、PP8482、PP8607、PP8857、PP8875、PP8997、PP9012、PP9286和PP9363是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染细胞系3T3。100ngDNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克隆形成,计数。发现以上12个克隆有抑制细胞克隆形成作用,结果如下表所示。
cDNA克隆转染细胞(3T3)的克隆形成情况
cDNA克隆名称 | cDNA克隆数(三个重复) | 空载体克隆数(三个重复) |
PP239PP446PP5715PP6977PP8482PP8607PP8857PP8875PP8997PP9012PP9286PP9363 | 6 5 38 6 310 12 1414 15 1913 14 1811 15 1710 12 1411 15 1710 21 1413 15 197 6 33 2 4 | 50 36 2550 36 2527 29 3027 29 3027 29 3027 29 3027 29 3027 29 3027 29 3027 29 3027 29 3027 29 30 |
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28、31、34)。
实施例2:从胎盘cDNA中PCR获得全长基因:
取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表所示),按97℃3′1个循环;94℃30″→60℃30″→72℃1′,共35个循环;72℃10′,1个循环进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,获得重组蛋白(SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35)。
基因特异引物
克隆名称 | 特异引物1(5′→3′) | 特异引物2(5′→3′) |
PP239PP446PP5715PP6977PP8482PP8607PP8857PP8875PP8997PP9012PP9286PP9363 | TAGTGATTGAGGCCATGCTGTTTGCCATCACATACCTGGACTTTGGACTGAGGTCCCTGTAGGACCTGTGTGAGCTGCATGGGGGTATGATAAGCTGGGACCTCCCGCTGAGTGTATTTCAGATGAATGTGGCCTTCGAGAGGGGTTAACGTTAGCATGGCTCGTCCCTCCGCAGTCTGAGACGCAGCTGTGTGAAATCCGTCCTGAATGTCTTGGAGCCTTCTTCCAGGACAAGCTG | AGAGGCACAAGGAGGCAGTAGCTGCAGTCTTGGATGGTCTCAGCATTTGTGCTTCTGAGCCAGGTAGCCCCGTAGCAGTTCGTCACTCTCCATGTCCAGGCTCTGGGATGAACTTGGAGGGATCCAGCAGTGAGAAGGACAAACCTGAGTCCTCCTCCAGGAAGGGGTTCATGTCATTGTTTGGAGAAAGCTGCAAAAGCAGGCTCGCCTTCTCAATAGTGTGTCAGGTACAGGTGGGA |
实施例3:cDNA克隆序列分析
1.PP239
A:核苷酸序列(SEQ ID NO:1)长度:2453
1 GGCCATTTTG CGGGAAGAGG AGGCGCTGTA CCTGCAGTGC TGCTTTTCTT GCCTAGACTC
61 TAGGAACTAT CCGAGCTCCA CTCCCCACAA CATACTCAAA GGAACGGAGA GAACCGGGAC
121 CCCCCTGCGG GGACCCGGAA CTGATCTGAC AGGATGGCAT CTGATGACTT TGACATAGTG
181 ATTGAGGCCA TGCTGGAAGC TCCCTATAAA AAAGAAGAGG ATGAGCAACA AAGGAAAGAA
241 GTTAAAAAGG ATTATCCTAG CAATACCACC AGCAGCACCA GCAACAGTGG CAATGAGACC
301 AGTGGAAGCA GCACCATCGG GGAGACAAGC AAGAAGAAGA GGAGTCGGAG CCATAATAAA
361 AGCAGGGATA GAAAGCGCAG TCGTAGTCGA GATCGGGATC GGTATAGACG GAGAAATAGT
421 CGGAGCCGAA GTCCAGGTCG GCAGTGTCGT CACCCGTAGC CGTAGCTGGG ATCGTCGACA
481 TGGTAGTGAG TCGCGAAGTC GGGACCATCG TCGTGAGGAT CGTGTGCATT ACAGGAGTCC
541 TCCACTTACC ACTGGTTATA GATATGGACA CAGTAAGAGT CCTCATTTCA GAGAGAAGAG
601 CCCAGTCAGG GAGCCAGTTG ATAATCTGAG TCCTGAGGAG CGTGATGCCC GCACAGTTTT
661 CTGTATGCAG TTAGCTGCCC GAATTCGGCC TCGAGATCTG GAGGACTTTT TCTCTGCTGT
721 AGGCAAGGTT CGCGATGTAC GTATCATTTC AGATCGGAAC TCACGTCGTT CTAAGGGCAT
781 TGCCTACGTG GAATTCTGTG AAATCCAGTC TGTGCCACTG GCCATTGGGC TGACTGGGCA
841 GCGGTTGCTG GGAGTGCCTA TCATTGTACA GGCTTCACAG GCAGAGAAAA ACCGACTGGC
901 AGCCATGGCC AACAACCTGC AAAAGGGCAA TGGTGGACCA ATGCGCCTCT ATGTGGGTTC
961 CCTGCACTTC AATATCACTG AAGACATGCT CCGGGGCATC TTTGAGCCCT TTGGTAAAAT
1021 TGATAATATT GTCCTGATGA AGGACTCAGA TACAGGCCGC TCTAAAGGTT ATGGTTTCAT
1081 CACGTTCTCT GATTCTGAGT GTGCCCGGCG GGCCCTGGAA CAGTTGAATG GGTTTGAGCT
1141 TGCTGGTCGA CCTATGAGGG TTGGCCATGT GACTGAGCGA CTGGATGGTG GCACAGACAT
1201 CACTTTTCCT GATGGGGACC AGGAGCTGGA TCTGGGATCA GCAGGTGGAC GTTTTCAGCT
1261 CATGGCAAAA CTGGCAGAAG GCGCTGGAAT CCAACTGCCA AGCACTGCTG CTGCTGCTGC
1321 TGCCGCCGCC GCCGCCCAGG CTGCTGCCTT GCAACTGAAT GGAGCAGTTC CCTTGGGGGC
1381 CCTGAATCCA GCAGCTCTGA CTGCTCTGAG TCCAGCCCTG AACCTTGCCT CCCAGTGTTT
1441 CCAGCTCTCC AGCCTCTTTA CCCCCCAGAC CATGTAAATC AGTGGCACAG TATACTGCCT
1501 CCTTGTGCCT CTGGATCCTG CCACTTCACA TCTACTCTTC CATGGCCCCA TTTCTCCATT
1561 TTGTGGACCA AGCCATCCTG AGGGCATGGA CATTGTCTCT GAGGAAATTG GGGCCACCCT
1621 TAAGATACCA AGAAAAGCTC CTGCCCATGG TCCCACTGGA AATGGACTCT GCTGAGCAAA
1681 GCCACCAGTT GAAGAGAACA GAATCCACAC CTGCATTGAA TACCTGTTTC TCCATGTGTA
1741 TCGTCTCTGA GATTACCTTC TTGCCCTTTC CAACACCTTA GTGATTCCTC AATTTCTCCC
1801 CCATTGGGAA GGCCATAGGG CATTAACTGA AGGAACTGAC CTCTCTCCTT TTCCTGTACC
1861 TTTAACCTTT AGTCTGTCAA GGAAAACCCT TAGGACCTCT GAATCAAGAG GACTGAGTTT
1921 GTGGGTGAAC CTTGAAGGTG CTCTTTCTGC TACAAGGGCC CTGGGAGATA GCATGGACGT
1981 GCATTGAGAA GCCAGCCTCA GACCTTAGCT TGAAGCAGCT TGAGGCCAGA CCTACTGTAG
2041 CCTCAGCATC TTGCTAGGAG GCATGGAAGT GATCTATCCT GCCAGGAGGC CTCAGAGTGA
2101 TCTGTCCTGC CAGGAGGTGT GAGAGTGATC TGTCCTGTGA GGCATTTAGG GGCTTTCAGG
2161 AATTTAGTAA AAGGTGGAGT ATGCCTTTCC AGTATCTTCC ATCTTCCTTT GTATACTTGT
2221 CCTTCCTCCC ATTTCCTCCC TTTGGCCCGA GGTAGGAGGA TGGAGGGAGG CTGCTACTCT
2281 ACCACTTCCT GTGTGCCTCT ACTGTGGCCT CAACCCTGGC AATTATAGCT ACTCCCATCC
2341 CTTACCTGGG CATGTGTGAG CCCTTCTCAC TGGATTTTAT ACCCTTGTGT CTGTGTACAT
2401 AAATATATAT ACATATATAT ATCCATAAAA AAAAAAAAAA AAAAAAAAAA AAA
B:氨基酸序列(SEQ ID NO:2)长度:418
1 MSNKGKKLKR IILAIPPAAP ATVAMRPVEA APSGRQARRR GVGAIIKAGI ESAVVVEIGI
61 GIDGEIVGAE VQVGSVVTRS RSWDRRHGSE SRSRDHRRED RVHYRSPPLT TGYRYGHSKS
121 PHFREKSPVR EPVDNLSPEE RDARTVFCMQ LAARIRPRDL EDFFSAVGKV RDVRIISDRN
181 SRRSKGIAYV EFCEIQSVPL AIGLTGQRLL GVPIIVQASQ AEKNRLAAMA NNLQKGNGGP
241 MRLYVGSLHF NITEDMLRGI FEPFGKIDNI VLMKDSDTGR SKGYGFITFS DSECARRALE
301 QLNGFELAGR PMRVGHVTER LDGGTDITFP DGDQELDLGS AGGRFQLMAK LAEGAGIQLP
361 STAAAAAAAA AAQAAALQLN GAVPLGALNP AALTALSPAL NLASQCFQLS SLFTPQTM
C.核苷酸及氨基酸组合序列(SEQ ID NO:3)克隆号:PP239
起始编码子:221 ATG 终止编码子:1475 TAA 蛋白质分子量:45028.93
(注:(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿。)
1 G GCC ATT TTG CGG GAA GAG GAG GCG CTG TAC CTG CAG TGC TGC TTT 46
47 TCT TGC CTA GAC TCT AGG AAC TAT CCG AGC TCC ACT CCC CAC AAC ATA 94
95 CTC AAA GGA ACG GAG AGA ACC GGG ACC CCC CTG CGG GGA CCC GGA ACT 142
143 GAT CTG ACA GGA TGG CAT CTG ATG ACT TTG ACA TAG TGA TTG AGG CCA 190
191 TGC TGG AAG CTC CCT ATA AAA AAG AAG AGG ATG AGC AAC AAA GGA AAG 238
1 Met Ser Asn Lys Gly Lys 6
239 AAG TTA AAA AGG ATT ATC CTA GCA ATA CCA CCA GCA GCA CCA GCA ACA 286
7 Lys Leu Lys Arg Ile I1e Leu Ala Ile Pro Pro Ala Ala Pro Ala Thr 22
287 GTG GCA ATG AGA CCA GTG GAA GCA GCA CCA TCG GGG AGA CAA GCA AGA 334
23 Val Ala Met Arg Pro Val Glu Ala Ala Pro Ser Gly Arg Gln Ala Arg 38
335 AGA AGA GGA GTC GGA GCC ATA ATA AAA GCA GGG ATA GAA AGC GCA GTC 382
39 Arg Arg Gly Val Gly Ala Ile Ile Lys Ala Gly Ile Glu Ser Ala Val 54
383 GTA GTC GAG ATC GGG ATC GGT ATA GAC GGA GAA ATA GTC GGA GCC GAA 430
55 Val Val Glu Ile Gly Ile Gly Ile Asp Gly Glu Ile Val Gly Ala Glu 70
431 GTC CAG GTC GGC AGT GTC GTC ACC CGT AGC CGT AGC TGG GAT CGT CGA 478
71 Val Gln Val Gly Ser Val Val Thr Arg Ser Arg Ser Trp Asp Arg Arg 86
479 CAT GGT AGT GAG TCG CGA AGT CGG GAC CAT CGT CGT GAG GAT CGT GTG 526
87 His Gly Ser Glu Ser Arg Ser Arg Asp His Arg Arg Glu Asp Arg Val 102
527 CAT TAC AGG AGT CCT CCA CTT ACC ACT GGT TAT AGA TAT GGA CAC AGT 574
103 His Tyr Arg Ser Pro Pro Leu Thr Thr Gly Tyr Arg Tyr Gly His Ser 118
575 AAG AGT CCT CAT TTC AGA GAG AAG AGC CCA GTC AGG GAG CCA GTT GAT 622
119 Lys Ser Pro His Phe Arg Glu Lys Ser Pro Val Arg Glu Pro Val Asp 134
623 AAT CTG AGT CCT GAG GAG CGT GAT GCC CGC ACA GTT TTC TGT ATG CAG 670
135 Asn Leu Ser Pro Glu Glu Arg Asp Ala Arg Thr Val Phe Cys Met Gln 150
671 TTA GCT GCC CGA ATT CGG CCT CGA GAT CTG GAG GAC TTT TTC TCT GCT 718
151 Leu Ala Ala Arg Ile Arg Pro Arg Asp Leu Glu Asp Phe Phe Ser Ala 166
719 GTA GGC AAG GTT CGC GAT GTA CGT ATC ATT TCA GAT CGG AAC TCA CGT 766
167 Val Gly Lys Val Arg Asp Val Arg Ile Ile Ser Asp Arg Asn Ser Arg 182
767 CGT TCT AAG GGC ATT GCC TAC GTG GAA TTC TGT GAA ATC CAG TCT GTG 814
183 Arg Ser Lys Gly Ile Ala Tyr Val Glu Phe Cys Glu Ile Gln Ser Val 198
815 CCA CTG GCC ATT GGG CTG ACT GGG CAG CGG TTG CTG GGA GTG CCT ATC 862
199 Pro Leu Ala Ile Gly Leu Thr Gly Gln Arg Leu Leu Gly Val Pro Ile 214
863 ATT GTA CAG GCT TCA CAG GCA GAG AAA AAC CGA CTG GCA GCC ATG GCC 910
215 Ile Val Gln Ala Ser Gln Ala Glu Lys Asn Arg Leu Ala Ala Met Ala 230
911 AAC AAC CTG CAA AAG GGC AAT GGT GGA CCA ATG CGC CTC TAT GTG GGT 958
231 Asn Asn Leu Gln Lys Gly Asn Gly Gly Pro Met Arg Leu Tyr Val Gly 246
959 TCC CTG CAC TTC AAT ATC ACT GAA GAC ATG CTC CGG GGC ATC TTT GAG 1006
247 Ser Leu His Phe Asn Ile Thr Glu Asp Met Leu Arg Gly Ile Phe Glu 262
1007 CCC TTT GGT AAA ATT GAT AAT ATT GTC CTG ATG AAG GAC TCA GAT ACA 1054
263 Pro Phe Gly Lys Ile Asp Asn Ile Val Leu Met Lys Asp Ser Asp Thr 278
1055 GGC CGC TCT AAA GGT TAT GGT TTC ATC ACG TTC TCT GAT TCT GAG TGT 1102
279 Gly Arg Ser Lys Gly Tyr Gly Phe Ile Thr Phe Ser Asp Ser Glu Cys 294
1103 GCC CGG CGG GCC CTG GAA CAG TTG AAT GGG TTT GAG CTT GCT GGT CGA 1150
295 Ala Arg Arg Ala Leu Glu Gln Leu Asn Gly Phe Glu Leu Ala Gly Arg 310
1151 CCT ATG AGG GTT GGC CAT GTG ACT GAG CGA CTG GAT GGT GGC ACA GAC 1198
311 Pro Met Arg Val Gly His Val Thr Glu Arg Leu Asp Gly Gly Thr Asp 326
1199 ATC ACT TTT CCT GAT GGG GAC CAG GAG CTG GAT CTG GGA TCA GCA GGT 1246
327 Ile Thr Phe Pro Asp Gly Asp Gln Glu Leu Asp Leu Gly Ser Ala Gly 342
1247 GGA CGT TTT CAG CTC ATG GCA AAA CTG GCA GAA GGC GCT GGA ATC CAA 1294
343 Gly Arg Phe Gln Leu Met Ala Lys Leu Ala Glu Gly Ala Gly Ile Gln 358
1295 CTG CCA AGC ACT GCT GCT GCT GCT GCT GCC GCC GCC GCC GCC CAG GCT 1342
359 Leu Pro Ser Thr Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Gln Ala 374
1343 GCT GCC TTG CAA CTG AAT GGA GCA GTT CCC TTG GGG GCC CTG AAT CCA 1390
375 Ala Ala Leu Gln Leu Asn Gly Ala Val Pro Leu Gly Ala Leu Asn Pro 390
1391 GCA GCT CTG ACT GCT CTG AGT CCA GCC CTG AAC CTT GCC TCC CAG TGT 1438
391 Ala Ala Leu Thr Ala Leu Ser Pro Ala Leu Asn Leu Ala Ser Gln Cys 406
1439 TTC CAG CTC TCC AGC CTC TTT ACC CCC CAG ACC ATG TAA ATC AGT GGC 1486
407 Phe Gln Leu Ser Ser Leu Phe Thr Pro Gln Thr Met *** 419
1487 ACA GTA TAC TGC CTC CTT GTG CCT CTG GAT CCT GCC ACT TCA CAT CTA 1534
1535 CTC TTC CAT GGC CCC ATT TCT CCA TTT TGT GGA CCA AGC CAT CCT GAG 1582
1583 GGC ATG GAC ATT GTC TCT GAG GAA ATT GGG GCC ACC CTT AAG ATA CCA 1630
1631 AGA AAA GCT CCT GCC CAT GGT CCC ACT GGA AAT GGA CTC TGC TGA GCA 1678
1679 AAG CCA CCA GTT GAA GAG AAC AGA ATC CAC ACC TGC ATT GAA TAC CTG 1726
1727 TTT CTC CAT GTG TAT CGT CTC TGA GAT TAC CTT CTT GCC CTT TCC AAC 1774
1775 ACC TTA GTG ATT CCT CAA TTT CTC CCC CAT TGG GAA GGC CAT AGG GCA 1822
1823 TTA ACT GAA GGA ACT GAC CTC TCT CCT TTT CCT GTA CCT TTA ACC TTT 1870
1871 AGT CTG TCA AGG AAA ACC CTT AGG ACC TCT GAA TCA AGA GGA CTG AGT 1918
1919 TTG TGG GTG AAC CTT GAA GGT GCT CTT TCT GCT ACA AGG GCC CTG GGA 1966
1967 GAT AGC ATG GAC GTG CAT TGA GAA GCC AGC CTC AGA CCT TAG CTT GAA 2014
2015 GCA GCT TGA GGC CAG ACC TAC TGT AGC CTC AGC ATC TTG CTA GGA GGC 2062
2063 ATG GAA GTG ATC TAT CCT GCC AGG AGG CCT CAG AGT GAT CTG TCC TGC 2110
2111 CAG GAG GTG TGA GAG TGA TCT GTC CTG TGA GGC ATT TAG GGG CTT TCA 2158
2159 GGA ATT TAG TAA AAG GTG GAG TAT GCC TTT CCA GTA TCT TCC ATC TTC 2206
2207 CTT TGT ATA CTT GTC CTT CCT CCC ATT TCC TCC CTT TGG CCC GAG GTA 2254
2255 GGA GGA TGG AGG GAG GCT GCT ACT CTA CCA CTT CCT GTG TGC CTC TAC 2302
2303 TGT GGC CTC AAC CCT GGC AAT TAT AGC TAC TCC CAT CCC TTA CCT GGG 2350
2351 CAT GTG TGA GCC CTT CTC ACT GGA TTT TAT ACC CTT GTG TCT GTG TAC 2398
2399 ATA AAT ATA TAT ACA TAT ATA TAT CCA TAA AAA AAA AAA AAA AAA AAA 2446
2447 AAA AAA A 2453
2.PP446
A:核苷酸序列(SEQ ID NO:4)长度:2086
1 GGGCATCAAG TCTCTGTCTC CCTTTGCCAT CACATACCTG GATCGGCTGC TCCTGATGCA
61 TCCCAACCTT ACCAAGGGCT TCGGCATGAT TGGCCCCAAG GACTTCTTCC CACTTCTGGA
121 CTTTGCCTAT ATGCCGAACA ACTCCCTGAC ACCCAGCCTG CAGGAGCAGC TGTGTCAGCT
181 CTACCCCCGA CTGAAAGTGC TGGCATTTGG AGCAAAGCCG GATTCCACCC TGCATACCTA
241 CTTCCCTTCT TTCCTGTCCA GAGCCACCCC TAGCTGTCCC CCTGAGATGA AGAAAGAGCT
301 CCTGAGCAGC CTGACTGAGT GCCTGACGGT GGACCCCCTC AGTGCCAGCG TCTGGAGGCA
361 GTTGTACCCT AAGCACCTGT CACAGTCCAG CCTTCTGCTG GAGCACTTGC TCAGCTCCTG
421 GGAGCAGATT CCCAAGAAGG TACAGAAGTC TTTGCAAGAA ACCATTCAGT CCCTCAAGCT
481 TACCAACCAG GAGCTGCTGA GGAAGGGTAG CAGTAACAAC CAGGATGTCG TCACCTGTGA
541 CATGGCCTGC AAGGGCCTGT TGCAGCAGGT TCAGGGTCCT CGGCTGCCCT GGACGCGGCT
601 CCTCCTGTTG CTGCTGGTCT TCGCTGTAGG CTTCCTGTGC CATGACCTCT GGTCACACAG
661 CTCCTTCCAG GCCTCCCTTA CTGGCCGGTT GCTTCGATCA TCTGGCTTCT TACCTGCTAG
721 CCAACAAGCG TGTGCCAAGC TCTACTCCTA CAGTCTGCAA GGCTACAGCT GGCTGGGGGA
781 GACACTGCCG CTCTGGGGCT CCCACCTGCT CACCGTGGTG CGGCCCAGCT TGCAGCTGGC
841 CTGGGCTCAC ACCAATGCCA CAGTCAGCTT CCTTTCTGCC CACTGTGCCT CTCACCTTGC
901 GTGGTTTGGT GACAGTCTCA CCAGTCTCTC TCAGAGGCTG CAGATCCAGC TCCCCGATTC
961 CGTGAATCAG CTACTCCGCT ATCTGAGAGA GCTGCCCCTG CTTTTCCACC AGAATGTGCT
1021 GCTGCCACTG TGGCACCTCT TGCTTGAGGC CCTGGCCTGG GCCCAGGAGC ACTGCCATGA
1081 GGCATGCAGA GGTGAGGTGA CCTGGGACTG CATGAAGACA CAGCTCAGTG AGGCTGTCCA
1141 CTGGACCTGG CTTTGCCTAC AGGACATTAC AGTGGCTTTC TTGGACTGGG CACTTGCCCT
1201 GATATCCCAG CAGTAGGCCC TGCCTTCCTG GCCACTGATT TCTGCATGGG TAGACCATCC
1261 AAGACTGCAG CGGGTAGAAG GTGGCAGTTC TTCATGGGAG TCTTTTTAAC TTGGTGCCTG
1321 AGTTCTCTCC TAGGCAAGTG GCCAGTTGCC TCCACCTCAG TTCTTCCATC TTTGGTGGGG
1381 ACAGGGCCCA GCAGCATCTC AGCCTCCTAC CCACAATTCC ACTGAACACT TTTCTGGCCC
1441 TACTGCACAT GGCCCCCAGC CTCCATCCTT GTGCTGGTAG CCTCTCACAA CTCCGCCCTT
1501 GCCCTCTGCC TTCCACTTCC TTCCATCTCA TTTCTAAACC CCAAACAGCT CATCTCTAAA
1561 AAGATAGAAC TCCCAGCAGG TGGCTTCTGT GTTCTTCTGA CAAATGATTC CTGCTTCTCC
1621 AGACTTTAGC AGCCTCCTGT TCCCATTCTT GGTCACAGCT CTAGCCACAG CAGAAGGAAA
1681 GGGGCTTCCA GAAGAATATA GCACCGCATT GGGAAACAGC AGCCTCACCT CCACCTGAAG
1741 CCTGGGTGTG GCTGTCAGTG GACATGGGGA GCTGGATGGA AATGCCTCTC ACTTCAAAAT
1801 GCCCAGCCTG CCCCAAATGC CTCTAAGCCC CTCCCTGTCC CCTCCCTTGT AGTCCTACTT
1861 CTTCCAACTT TCCATTCCCC ATCATGCTGG GGGTCTTGGT CACAAGGCTC AGCTTCTCTC
1921 CACTGTCCAT CCCTCCTATC ATCTGTAGAG CAGAGCACAG GCAGTTGTGT GCCTTGGGCC
1981 CAGGGAACCC TCCATCAACC TGAGACAGGA CTCAGTATAT GGTTCTTGGG TATGCCCTAC
2041 CAGGTGGAAT AAAGGACACA GATTTGAAAA AAAAAAAAAA AAAAAA
B:氨基酸序列(SEQ ID NO:5)长度:386
1 MHPNLTKGFG MIGPKDFFPL LDFAYMPNNS LTPSLQEQLC QLYPRLKVLA FGAKPDSTLH
61 TYFPSFLSRA TPSCPPEMKK ELLSSLTECL TVDPLSASVW RQLYPKHLSQ SSLLLEHLLS
121 SWEQIPKKVQ KSLQETIQSL KLTNQELLRK GSSNNQDVVT CDMACKGLLQ QVQGPRLPWT
181 RLLLLLLVFA VGFLCHDLWS HSSFQASLTG RLLRSSGFLP ASQQACAKLY SYSLQGYSWL
241 GETLPLWGSH LLTVVRPSLQ LAWAHTNATV SFLSAHCASH LAWFGDSLTS LSQRLQIQLP
301 DSVNQLLRYL RELPLLFHQN VLLPLWHLLL EALAWAQEHC HEACRGEVTW DCMKTQLSEA
361 VHWTWLCLQD ITVAFLDWAL ALISQQ
C.核苷酸及氨基酸组合序列(SEQ ID NO:6)克隆号:PP446
起始编码子:56 ATG 终止编码子:1214 TAG 蛋白质分子量:43684.30
1 G GGC ATC AAG TCT CTG TCT CCC TTT GCC ATC ACA TAC CTG GAT CGG 46
47 CTG CTC CTG ATG CAT CCC AAC CTT ACC AAG GGC TTC GGC ATG ATT GGC 94
1 Met His Pro Asn Leu Thr Lys Gly Phe Gly Met Ile Gly 13
95 CCC AAG GAC TTC TTC CCA CTT CTG GAC TTT GCC TAT ATG CCG AAC AAC 142
14 Pro Lys Asp Phe Phe Pro Leu Leu Asp Phe Ala Tyr Met Pro Asn Asn 29
143 TCC CTG ACA CCC AGC CTG CAG GAG CAG CTG TGT CAG CTC TAC CCC CGA 190
30 Ser Leu Thr Pro Ser Leu Gln Glu Gln Leu Cys Gln Leu Tyr Pro Arg 45
191 CTG AAA GTG CTG GCA TTT GGA GCA AAG CCG GAT TCC ACC CTG CAT ACC 238
46 Leu Lys Val Leu Ala Phe Gly Ala Lys Pro Asp Ser Thr Leu His Thr 61
239 TAC TTC CCT TCT TTC CTG TCC AGA GCC ACC CCT AGC TGT CCC CCT GAG 286
62 Tyr Phe Pro Ser Phe Leu Ser Arg Ala Thr Pro Ser Cys Pro Pro Glu 77
287 ATG AAG AAA GAG CTC CTG AGC AGC CTG ACT GAG TGC CTG ACG GTG GAC 334
78 Met Lys Lys Glu Leu Leu Ser Ser Leu Thr Glu Cys Leu Thr Val Asp 93
335 CCC CTC AGT GCC AGC GTC TGG AGG CAG TTG TAC CCT AAG CAC CTG TCA 382
94 Pro Leu Ser Ala Ser Val Trp Arg Gln Leu Tyr Pro Lys His Leu Ser 109
383 CAG TCC AGC CTT CTG CTG GAG CAC TTG CTC AGC TCC TGG GAG CAG ATT 430
110 Gln Ser Ser Leu Leu Leu Glu His Leu Leu Ser Ser Trp Glu Gln Ile 125
431 CCC AAG AAG GTA CAG AAG TCT TTG CAA GAA ACC ATT CAG TCC CTC AAG 478
126 Pro Lys Lys Val Gln Lys Ser Leu Gln Glu Thr Ile Gln Ser Leu Lys 141
479 CTT ACC AAC CAG GAG CTG CTG AGG AAG GGT AGC AGT AAC AAC CAG GAT 526
142 Leu Thr Asn Gln Glu Leu Leu Arg Lys Gly Ser Ser Asn Asn Gln Asp 157
527 GTC GTC ACC TGT GAC ATG GCC TGC AAG GGC CTG TTG CAG CAG GTT CAG 574
158 Val Val Thr Cys Asp Met Ala Cys Lys Gly Leu Leu Gln Gln Val Gln 173
575 GGT CCT CGG CTG CCC TGG ACG CGG CTC CTC CTG TTG CTG CTG GTC TTC 622
174 Gly Pro Arg Leu Pro Trp Thr Arg Leu Leu Leu Leu Leu Leu Val Phe 189
623 GCT GTA GGC TTC CTG TGC CAT GAC CTC TGG TCA CAC AGC TCC TTC CAG 670
190 Ala Val Gly Phe Leu Cys His Asp Leu Trp Ser His Ser Ser Phe Gln 205
671 GCC TCC CTT ACT GGC CGG TTG CTT CGA TCA TCT GGC TTC TTA CCT GCT 718
206 Ala Ser Leu Thr Gly Arg Leu Leu Arg Ser Ser Gly Phe Leu Pro Ala 221
719 AGC CAA CAA GCG TGT GCC AAG CTC TAC TCC TAC AGT CTG CAA GGC TAC 766
222 Ser Gln Gln Ala Cys Ala Lys Leu Tyr Ser Tyr Ser Leu Gln Gly Tyr 237
767 AGC TGG CTG GGG GAG ACA CTG CCG CTC TGG GGC TCC CAC CTG CTC ACC 814
238 Ser Trp Leu Gly Glu Thr Leu Pro Leu Trp Gly Ser His Leu Leu Thr 253
815 GTG GTG CGG CCC AGC TTG CAG CTG GCC TGG GCT CAC ACC AAT GCC ACA 862
254 Val Val Arg Pro Ser Leu Gln Leu Ala Trp Ala His Thr Asn Ala Thr 269
863 GTC AGC TTC CTT TCT GCC CAC TGT GCC TCT CAC CTT GCG TGG TTT GGT 910
270 Val Ser Phe Leu Ser Ala His Cys Ala Ser His Leu Ala Trp Phe Gly 285
911 GAC AGT GTC ACC AGT CTC TCT CAG AGG CTG CAG ATC CAG CTC CCC GAT 958
286 Asp Ser Leu Thr Ser Leu Ser Gln Arg Leu Gln Ile Gln Leu Pro Asp 301
959 TCC GTG AAT CAG CTA CTC CGC TAT CTG AGA GAG CTG CCC CTG CTT TTC 1006
302 Ser Val Asn Gln Leu Leu Arg Tyr Leu Arg Glu Leu Pro Leu Leu Phe 317
1007 CAC CAG AAT GTG CTG CTG CCA CTG TGG CAC CTC TTG CTT GAG GCC CTG 1054
318 His Gln Asn Val Leu Leu Pro Leu Trp His Leu Leu Leu Glu Ala Leu 333
1055 GCC TGG GCC CAG GAG CAC TGC CAT GAG GCA TGC AGA GGT GAG GTG ACC 1102
334 Ala Trp Ala Gln Glu His Cys His Glu Ala Cys Arg Gly Glu Val Thr 349
1103 TGG GAC TGC ATG AAG ACA CAG CTC AGT GAG GCT GTC CAC TGG ACC TGG 1150
350 Trp Asp Cys Met Lys Thr Gln Leu Ser Glu Ala Val His Trp Thr Trp 365
1151 CTT TGC CTA CAG GAC ATT ACA GTG GCT TTC TTG GAC TGG GCA CTT GCC 1198
366 Leu Cys Leu Gln Asp Ile Thr Val Ala Phe Leu Asp Trp Ala Leu Ala 381
1199 CTG ATA TCC CAG CAG TAG GCC CTG CCT TCC TGG CCA CTG ATT TCT GCA 1246
382 Leu Ile Ser Gln Gln *** 387
1247 TGG GTA GAC CAT CCA AGA CTG CAG CGG GTA GAA GGT GGC AGT TCT TCA 1294
1295 TGG GAG TCT TTT TAA CTT GGT GCC TGA GTT CTC TCC TAG GCA AGT GGC 1342
1343 CAG TTG CCT CCA CCT CAG TTC TTC CAT CTT TGG TGG GGA CAG GGC CCA 1390
1391 GCA GCA TCT CAG CCT CCT ACC CAC AAT TCC ACT GAA CAC TTT TCT GGC 1438
1439 CCT ACT GCA CAT GGC CCC CAG CCT CCA TCC TTG TGC TGG TAG CCT CTC 1486
1487 ACA ACT CCG CCC TTG CCC TCT GCC TTC CAC TTC CTT CCA TCT CAT TTC 1534
1535 TAA ACC CCA AAC AGC TCA TCT CTA AAA AGA TAG AAC TCC CAG CAG GTG 1582
1583 GCT TCT GTG TTC TTC TGA CAA ATG ATT CCT GCT TCT CCA GAC TTT AGC 1630
1631 AGC CTC CTG TTC CCA TTC TTG GTC ACA GCT CTA GCC ACA GCA GAA GGA 1678
1679 AAG GGG CTT CCA GAA GAA TAT AGC ACC GCA TTG GGA AAC AGC AGC CTC 1726
1727 ACC TCC ACC TGA AGC CTG GGT GTG GCT GTC AGT GGA CAT GGG GAG CTG 1774
1775 GAT GGA AAT GCC TCT CAC TTC AAA ATG CCC AGC CTG CCC CAA ATG CCT 1822
1823 CTA AGC CCC TCC CTG TCC CCT CCC TTG TAG TCC TAC TTC TTC CAA CTT 1870
1871 TCC ATT CCC CAT CAT GCT GGG GGT CTT GGT CAC AAG GCT CAG CTT CTC 1918
1919 TCC ACT GTC CAT CCC TCC TAT CAT CTG TAG AGC AGA GCA CAG GCA GTT 1966
1967 GTG TGC CTT GGG CCC AGG GAA CCC TCC ATC AAC CTG AGA CAG GAC TCA 2014
2015 GTA TAT GGT TCT TGG GTA TGC CCT ACC AGG TGG AAT AAA GGA CAC AGA 2062
2063 TTT GAA AAA AAA AAA AAA AAA AAA 2086
3.PP5715
A:核苷酸序列(SEQ ID NO:7)长度:3178
1 GCCTGGCCCT CTTCTCCTTC GTCACAGCCC TCATGTTCAG CTCCATCGTC TGCAGCGTCC
61 CGCACACCTG GCAGCAAAAG AGAGGCCCTG ATGAGGACGG GGAGGAGGAG GCCGCTCCAG
121 GGCCGCGGCA GGCGCACGAC AGCCTCTACC GCGTCCACAT GCCCAGCCTG TACAGCTGTG
181 GCAGCAGCTA CGGCAGTGAG ACCAGCATCC CGGCCGCGGC CCACACCGTC AGCAACGCCC
241 CGGGCACTGA GTACATGAGC CAGAACGCTA ATTTCCAGAA CCCCCGCTGT GAGAACACCC
301 CACTCATTGG GCGCGAGTCC CCGCCGCCTC ATACACCTCC AGCATGAGAG CCAAATACCT
361 CGCCACGAGC CAGCCTCGCC CTGACTCCAG CGGCAGCCAC TAGACCGGCC CGGCAGCCAC
421 CCACCCCACG TGCCAACTTC CCCTCCCCGT GCCAGCACTG CCGCTTCCAC CTGGGCCACC
481 CACCGGACCC TCGCACGCCG TGCCAGGCCT GCCCCAGACG CGTCTGCAGG CCGCTTGCCC
541 TCCTGTCCCC TCCCCGCAGG GGCACAGTGG AGACGCAGGG GCTCTGGGCC CGTACCGCCA
601 ACTCGGGTCA CACCTGAACG CTGCTGCCAG CCGATGCCCC AGCCCTGCAC GCCACCCACT
661 ATCCCGGCAC GCTCCCTCTG CAGATGGTCG CCTGCACCTA CAAGCCCTGG CCGCACCCAA
721 CCTGTGTTGT TGCCGCCCGG CCCTTCCCTC CACAGCTCTC CTTCCTCCCG CCCGGCACTT
781 CTGTGGACCC CTTCTTAGTT CACAGGCACG GCTGGGGCCG CTCTGTGCTG GCGCCTGCTG
841 GCCACTGAGG GACAGAGACA CGTGCCACCT GCTCATCTCT GCCCTGAGGT CACCCCGTGG
901 TCCCTCCACG TGCCCATCTC TCTGCAGTGC CCTCCTCGCC TGTGGAGCCC GCCCACCCAC
961 AGGCTCACCC CTCCTGCCGG CTGCCAGAGG CCCCCTCCAG CAGGGCCTCT CTCCGTTGCC
1021 CCAGCTTCAC TCTCTCCCTC AGCACCTGCC CTGCTGGAGG CCCCAGCCCT CCGTGGACAG
1081 CAGGGGCCAC GTGGAGCCCG GGCCGCTCAC CCGCCACCCA GTGCTGGCCG CCTTCTTGGT
1141 GCCAAACCCC CTTCCCCCAC CCAGAGACTG GGCAGCTGTG TCTGGTTCGT TCTTTGCACT
1201 AACCACATTT GTCATCTCTA GGACAGGCTG GGGCTGCGGG CTGAGGGGGA CCGCTGGCAC
1261 CCCCCTTCCC TCCCTTCTTG GTTCCATTTC CATCCATGAC AGGTACAGCA TTCCAGGAGC
1321 CCGGCCTGAG GGGCTGGACC CGAGCCGGCT GTGAACATCC CTCAGCCCCT GCTGTCCCCC
1381 CTTGGGACTA ACCACTAACC TCACCCCCAA ACTCCACGGG TGCCCCTAGC TGGCCCAGAG
1441 CCGGCAGTGT GAGCCCAAGT CCGGGCTGGA GCCGAGGCCG GAGCAGCTGT CTGGGAGTCA
1501 AGGCTGCAGT AGCGTTTCTT CATGGGGTGC TCAGGGGGTG CCACAGACCG ACAGGCAGCC
1561 CAAGGGCCTG GACACCCCTC CCCAGGCAGG TGCTGCCCCA GGAGGACTGT CCTCGGGAAT
1621 GAACCTCCCG CGGGCTTTGG ACTGAGGTCC CTGTGGCCTC GGTCTCCTCC CCATGAAGTG
1681 GGAGCGAGGC TCCCCAATGG TGCTTTTGGC TTTAGTGTAC GATGTTTGCT GTGCTTCCCG
1741 CCGTGGAGGG CAGAGCCACC CCACATCAGG ATCGGACGTG CTACCCCTCC CGGTCCCGGC
1801 CCTGGCCCAG CCAGCCCAGC CCTCGAGGCT CGATGCCTGT GCCAGGGCCA GGGGCAGCCA
1861 GAGGGCAGCT GGATGGCCAC GTGCAGGGGT CAAGGCTGGG CCCCGCAGTG GGGCGGGCCG
1921 CCAGCCCCAG CAGTTTACAG ACGCATGGCT CTTCCTCCCA GAGCAGCCGG CAGCTACCTG
1981 GACCGGAAAT GTCCTCATCC CCTCCCTGGG GCCAGGCTCT GCCCTGGCCT TCCTCTGTGA
2041 ACCCCTCCTT TCTTTGTGCT GGTGTCTGGG ACCAAAAAGG GGGAATATGG GAGGGCAGAG
2101 TGGGGAGGGG AGTCCATGGG CCTGGGGCCC CAAGCCGGGG CGTCTGAGCT CCCCAGGCAT
2161 GACCAAACCT CAGTGGAGGG GCCTCTGCTT CAGGCCCCGC CTGGCTGACA TTCTGAGCCC
2221 CCCTCGGAGG CCCCGCCACA GCCAACCTGC CCAGTCTTTC CTCTGGGCTT GACCCGCCAG
2281 GGGAGTTCTC CAGGCCTAGG GCCAGGAGAG AGGCCCTGGC ACCCTGGCGT GGGTGCCCGC
2341 CAAACGCCCT GCGACCGCTC AGAAGCACAA ATGCTGTCCA TGGCCGTGAG GCTGCCTGCC
2401 AGGTGAATGG ACATAGCGTG AGAGGCGGTG AGGCCAGGGC TTCCAGCCTC GTGCTGTCTC
2461 GGGACTCCTG ACCGTGGTGT GCGTGTGTGC CCATCTGTGA CTTTCTACTC ACCAAGGTTG
2521 AAGAAAGGAA ACGGGGAAAA TCAAAAGGGG TTCAAACCCC ACCTCAGTAG GTGGAGGGGA
2581 GCGCCTGCCA TTGGTTGTAT TTTTGTTCTG AGTTTTCGGT GCCGTGTTCC TAACTACTCC
2641 ATCCCATGAC CTCGCCACAC CTACTGGGGC ATCTGGCTGG CGCCTGCTGC CATGGCCAGC
2701 CCCCACTCTC ACCCTGCACA GGGGGTCTTG CAGCCCCCAG GCCCACAGCC TCGTTGGGAG
2761 GACAGGGTGG CCCTGGGGAC AAGAGGGAGG AGCCCAGGGG CTTACCTCAC TGAGAGTGCT
2821 CCCCAGCAGG CATCCACTAC CCCAGGGCCC CCCACATGTC ATGGCAAGGT TGGTAGTGAA
2881 TGGGCCTGGT TGGGAGCAGC CCCTGGCCCA TTGCCCACCC ACCCATCTCA CTATGCAATT
2941 CGAGTTCCAA GCAACATTTG CTCCTGCCCT GGGGCCAGCT CTGCCCCAGC CCTGAGAGGG
3001 GTGGTGAAGC AGCCCCCTGG ACCCCAGAAC CCCAGACAAG GGGGCAGGCG GGGGACCAGG
3061 GCCTCTCCTG TGGGATCTTT GTTTTGTGTT TAACCATAAT GGTTGTGTAC TGAACCACTT
3121 CATATTTGTT ATATATAATA TATATATATA TAATCTCAAA AAAAAAAAAA AAAAAAAA
B:氨基酸序列(SEQ ID NO:8)长度:199
1 MKWERGSPMV LLALVYDVCC ASRRGGQSHP TSGSDVLPLP VPALAQPAQP SRLDACARAR
61 GSQRAAGWPR AGYKAGPRSG AGRQPQQFTD AWLFLPEQPA ATWTGNVLIP SLGPGSALAF
121 LCEPLLSLCW CLGPKRGNMG GQSGEGSPWA WGPKPGRLSS PGMTKPQWRG LCFRPRLADI
181 LSPPRRPRHS QPAQSFLWA
C.核苷酸及氨基酸组合序列(SEQ ID NO:9)克隆号:PP5715
起始编码子:1673 ATG 终止编码子:2270 TGA 蛋白质分子量:21306.37
1 G CCT GGC CCT CTT CTC CTT CGT CAC AGC CCT CAT GTT CAG CTC CAT 46
47 CGT CTG CAG CGT CCC GCA CAC CTG GCA GCA AAA GAG AGG CCC TGA TGA 94
95 GGA CGG GGA GGA GGA GGC CGC TCC AGG GCC GCG GCA GGC GCA CGA CAG 142
143 CCT CTA CCG CGT CCA CAT GCC CAG CCT GTA CAG CTG TGG CAG CAG CTA 190
191 CGG CAG TGA GAC CAG CAT CCC GGC CGC GGC CCA CAC CGT CAG CAA CGC 238
239 CCC GGG CAC TGA GTA CAT GAG CCA GAA CGC TAA TTT CCA GAA CCC CCG 286
287 CTG TGA GAA CAC CCC ACT CAT TGG GCG CGA GTC CCC GCC GCC TCA TAC 334
335 ACC TCC AGC ATG AGA GCC AAA TAC CTC GCC ACG AGC CAG CCT CGC CCT 382
383 GAC TCC AGC GGC AGC CAC TAG ACC GGC CCG GCA GCC ACC CAC CCC ACG 430
431 TGC CAA CTT CCC CTC CCC GTG CCA GCA CTG CCG CTT CCA CCT GGG CCA 478
479 CCC ACC GGA CCC TCG CAC GCC GTG CCA GGC CTG CCC CAG ACG CGT CTG 526
527 CAG GCC GCT TGC CCT CCT GTC CCC TCC CCG CAG GGG CAC AGT GGA GAC 574
575 GCA GGG GCT CTG GGC CCG TAC CGC CAA CTC GGG TCA CAC CTG AAC GCT 622
623 GCT GCC AGC CGA TGC CCC AGC CCT GCA CGC CAC CCA CTA TCC CGG CAC 670
671 GCT CCC TCT GCA GAT GGT CGC CTG CAC CTA CAA GCC CTG GCC GCA CCC 718
719 AAC CTG TGT TGT TGC CGC CCG GCC CTT CCC TCC ACA GCT CTC CTT CCT 766
767 CCC GCC CGG CAC TTC TGT GGA CCC CTT CTT AGT TCA CAG GCA CGG CTG 814
815 GGG CCG CTC TGT GCT GGC GCC TGC TGG CCA CTG AGG GAC AGA GAC ACG 862
863 TGC CAC CTG CTC ATC TCT GCC CTG AGG TCA CCC CGT GGT CCC TCC ACG 910
911 TGC CCA TCT CTC TGC AGT GCC CTC CTC GCC TGT GCA GCC CGC CCA CCC 958
959 ACA GGC TCA CCC CTC CTG CCG GCT GCC AGA GGC CCC CTC CAG CAG GGC 1006
1007 CTC TCT CCG TTG CCC CAG CTT CAC TCT CTC CCT CAG CAC CTG CCC TGC 1054
1055 TGG AGG CCC CAG CCC TCC GTG GAC AGC AGG GGC CAC GTG GAG CCC GGG 1102
1103 CCG CTC ACC CGC CAC CCA GTG CTG GCC GCC TTC TTG GTG CCA AAC CCC 1150
1151 CTT CCC CCA CCC AGA GAC TGG GCA GCT GTG TCT GGT TCG TTC TTT GCA 1198
1199 CTA ACC ACA TTT GTC ATC TCT AGG ACA GGC TGG GGC TGC GGG CTG AGG 1246
1247 GGG ACC GCT GGC ACC CCC CTT CCC TCC CTT CTT GGT TCC ATT TCC ATC 1294
1295 CAT GAC AGG TAC AGC ATT CCA GGA GCC CGG CCT GAG GGG CTG GAC CCG 1342
1343 AGC CGG CTG TGA ACA TCC CTC AGC CCC TGC TGT CCC CCC TTG GGA CTA 1390
1391 ACC ACT AAC CTC ACC CCC AAA CTC CAC GGG TGC CCC TAG CTG GCC CAG 1438
1439 AGC CGG CAG TGT GAG CCC AAG TCC GGG CTG GAG CCG AGG CCG GAG CAG 1486
1487 CTG TCT GGG AGT CAA GGC TGC AGT AGC GTT TCT TCA TGG GGT GCT CAG 1534
1535 GGG GTG CCA CAG ACC GAC AGG CAG CCC AAG GGC CTG GAC ACC CCT CCC 1582
1583 CAG GCA GGT GCT GCC CCA GGA GGA CTG TCC TCG GGA ATG AAC CTC CCG 1630
1631 CGG GCT TTG GAC TGA GGT CCC TGT GGC CTC GGT CTC CTC CCC ATG AAG 1678
1 Met Lys 2
1679 TGG GAG CGA GGC TCC CCA ATG GTG CTT TTG GCT TTA GTG TAC GAT GTT 1726
3 Trp Glu Arg Gly Ser Pro Met Val Leu Leu Ala Leu Val Tyr Asp Val 18
1727 TGC TGT GCT TCC CGC CGT GGA GGG CAG AGC CAC CCC ACA TCA GGA TCG 1774
19 Cys Cys Ala Ser Arg Arg Gly Gly Gln Ser His Pro Thr Ser Gly Ser 34
1775 GAC GTG CTA CCC CTC CCG GTC CCG GCC CTG GCC CAG CCA GCC CAG CCC 1822
35 Asp Val Leu Pro Leu Pro Val Pro Ala Leu Ala Gln Pro Ala Gln Pro 50
1823 TCG AGG CTC GAT GCC TGT GCC AGG GCC AGG GGC AGC CAG AGG GCA GCT 1870
51 Ser Arg Leu Asp Ala Cys Ala Arg Ala Arg Gly Ser Gln Arg Ala Ala 66
1871 GGA TGG CCA CGT GCA GGG GTC AAG GCT GGG CCC CGC AGT GGG GCG GGC 1918
67 Gly Trp Pro Arg Ala Gly Val Lys Ala Gly Pro Arg Ser Gly Ala Gly 82
1919 CGC CAG CCC CAG CAG TTT ACA GAC GCA TGG CTC TTC CTC CCA GAG CAG 1966
83 Arg Gln Pro Gln Gln Phe Thr Asp Ala Trp Leu Phe Leu Pro Glu Gln 98
1967 CCG GCA GCT ACC TGG ACC GGA AAT GTC CTC ATC CCC TCC CTG GGG CCA 2014
99 Pro Ala Ala Thr Trp Thr Gly Asn Val Leu Ile Pro Ser Leu Gly Pro 114
2015 GGC TCT GCC CTG GCC TTC CTC TGT GAA CCC CTC CTT TCT TTG TGC TGG 2062
115 Gly Ser Ala Leu Ala Phe Leu Cys Glu Pro Leu Leu Ser Leu Cys Trp 130
2063 TGT CTG GGA CCA AAA AGG GGG AAT ATG GGA GGG CAG AGT GGG GAG GGG 2110
131 Cys Leu Gly Pro Lys Arg Gly Asn Met Gly Gly Gln Ser Gly Glu Gly 146
2111 AGT CCA TGG GCC TGG GGC CCC AAG CCG GGG CGT CTG AGC TCC CCA GGC 2158
147 Ser Pro Trp Ala Trp Gly Pro Lys Pro Gly Arg Leu Ser Ser Pro Gly 162
2159 ATG ACC AAA CCT CAG TGG AGG GGC CTC TGC TTC AGG CCC CGC CTG GCT 2206
163 Met Thr Lys Pro Gln Trp Arg Gly Leu Cys Phe Arg Pro Arg Leu Ala 178
2207 GAC ATT CTG AGC CCC CCT CGG AGG CCC CGC CAC AGC CAA CCT GCC CAG 2254
179 Asp Ile Leu Ser Pro Pro Arg Arg Pro Arg His Ser Gln Pro Ala Gln 194
2255 TCT TTC CTC TGG GCT TGA CCC GCC AGG GGA GTT CTC CAG GCC TAG GGC 2302
195 Ser Phe Leu Trp Ala *** 200
2303 CAG GAG AGA GGC CCT GGC ACC CTG GCG TGG GTG CCC GCC AAA CGC CCT 2350
2351 GCG ACC GCT CAG AAG CAC AAA TGC TGT CCA TGG CCG TGA GGC TGC CTG 2398
2399 CCA GGT GAA TGG ACA TAG CGT GAG AGG CGG TGA GGC CAG GGC TTC CAG 2446
2447 CCT CGT GCT GTC TCG GGA CTC CTG ACC GTG GTG TGC GTG TGT GCC CAT 2494
2495 CTG TGA CTT TCT ACT CAC CAA GGT TGA AGA AAG GAA ACG GGG AAA ATC 2542
2543 AAA AGG GGT TCA AAC CCC ACC TCA GTA GGT GGA GGG GAG CGC CTG CCA 2590
2591 TTG GTT GTA TTT TTG TTC TGA GTT TTC GGT GCC GTG TTC CTA ACT ACT 2638
2639 CCA TCC CAT GAC CTC GCC ACA CCT ACT GGG GCA TCT GGC TGG CGC CTG 2686
2687 CTG CCA TGG CCA GCC CCC ACT CTC ACC CTG CAC AGG GGG TCT TGC AGC 2734
2735 CCC CAG GCC CAC AGC CTC GTT GGG AGG ACA GGG TGG CCC TGG GGA CAA 2782
2783 GAG GGA GGA GCC CAG GGG CTT ACC TCA CTG AGA GTG CTC CCC AGC AGG 2830
2831 CAT CCA CTA CCC CAG GGC CCC CCA CAT GTC ATG GCA AGG TTG GTA GTG 2878
2879 AAT GGG CCT GGT TGG GAG CAG CCC CTG GCC CAT TGC CCA CCC ACC CAT 2926
2927 CTC ACT ATG CAA TTC GAG TTC CAA GCA ACA TTT GCT CCT GCC CTG GGG 2974
2975 CCA GCT CTG CCC CAG CCC TGA GAG GGG TGG TGA AGC AGC CCC CTG GAC 3022
3023 CCC AGA ACC CCA GAC AAG GGG GCA GGC GGG GGA CCA GGG CCT CTC CTG 3070
3071 TGG GAT CTT TGT TTT GTG TTT AAC CAT AAT GGT TGT GTA CTG AAC CAC 3118
3119 TTC ATA TTT GTT ATA TAT AAT ATA TAT ATA TAT AAT CTC AAA AAA AAA 3166
3167 AAA AAA AAA AAA 3178
4.PP6977
A:核苷酸序列(SEQ ID NO:10)长度:2469
1 GGGCCGCGGC CTGTCCTCCT GCCTCAGCCT GGGGAAGGCT GGGCCGGGCC GAAGAGGGAG
61 GCCAAGTCCT TGGGACAGGA GGAGACCCAC ACCTGAGATT AGTGGAAACC CAGCCAGAAG
121 CTGCCATGCA GGTGTGGCTC TGGGCATCAG GATCTGTCGT GAGAGCCCCC ATGAGTGCCC
181 AGTGCAGAAT GGCTGGCAGC CCGCCCTGAC GGGGAGCAGA GGGGCTGGAC GCGGTGCCCT
241 TCACGGGATG ACACCCAGCT GTTTGCCCTG TGTCCAGGGG GTTGCTTCTC TGACAGAGGC
301 CCTATGGCTC GTGTCTGACT CCTGTCCAGG TTCTGCCAGC CTGACCATCC ATCGCTCTGG
361 CACCAAGAGC CCACCCTTTT GTTCTTCCTG GCGTCCCAGG GAAAGCCCTG CCTGGGTGGG
421 GCAGCTCCTG GCCCTTCAGA TGGAAGACGC AGTCCAGTCA GCACCATCAT AGGAAACAAG
481 TTCAGAAATG TCTCACTTAC TATTCCGGGC AGGGAGGGCG CCATGAGTCA GGGGGTGCAT
541 CCTCCCTCCT GGCGTCACCC GAGGCAGGAA TGAAGAGTCA GGCAGAGAGC GCGCGTGTGG
601 CAGCTGGTGG TGTAGATATT AGGGACTAGT GTGAATTCTA GTTCACCGGC CAATGCCTGG
661 ATGGTCCAGA GCTGGGTCGG CTGGGCGGAG AGCTGCCTCC AGGTTCCTGC CTCTGGCCCT
721 GGCGTGGGGT CGACACTGGG TGTGGTGTGT GTCTCATGTC CAGGCAGTGG CCTTTGCTGT
781 GCCGTCCTGT TACAGGAGCC AGGATGGTGG GGACGGGACC GGACCGGAGG GTTGGCGGGG
841 CTGCCCCTGC AGCCGACAGC CCCATCCTGC AGCCACCAAT GGCATGACCC AGGGCCCCGG
901 CACTGCCTGT GTGAGGGGCT GGCAGCTTTC CAACTGCAGC AAGTGGAGGC CCCTGCCAGC
961 TTCGGGCCTG TGGGCAGGGG CTCAGTGGGG CAGGGGTGTG GCTGCCCCGC CCGGCACGCC
1021 TGCACCTGTC TCCTCAGTGT GACCAGTACC GCAAGGGGAT CATCTCGGGC TCCGTCTGCC
1081 AGGACCTGTG TGAGCTGCAT ATGGTGGAGT GGAGGACCTG CCTCTCGGTG GCCCCGGGCC
1141 AGCAGGTGTA CAGCGGGCTC TGGCGGGACA AGGATGTAAC CATCAAGTGT GGCATTGAGG
1201 AGACCCTCGA CTCCAAGGCC CGGTCGGATG CGGCCCCCCG GCGGGAGCTG GTACTGTTTG
1261 ACAAGCCCAC CCGGGGCACC TCCATCAAGG AATTCCGGGA GATGACCCTC GGCTTCCTCA
1321 AGGCGAACCT GGGAGACCTG CCTTCCCTGC CGGCGCTGGT TGGCCAGGTC CTGCTCATGG
1381 CTGACTTCAA CAAGGACAAC CGGGTGTCCC TGGCGGAAGC CAAGTCCGTG TGGGCCCTGC
1441 TGCAGCGTAA CGAGTTCCTG CTGCTGCTGT CCCTGCAGGA GAAGGAGCAC GCCTCCAGAC
1501 TGCTGGGCTA CTGTGGGGAC CTCTACCTCA CCGAGGGCGT GCCGCATGGC GCCTGGCACG
1561 CGGCCGCCCT TCCACCCCTG TTGCGCCCAC TGCTGCCGCC TGCCCTGCAG GGTGCTCTCC
1621 AGCAGTGGCT GGGGCCTGCG TGGCCTTGGC GGGCCAAGAT CGCCATCGGC CTGCTGGAGT
1681 TCGTGGAGGA GCTCTTCCAC GGCTCTTACG GGACTTTCTA CATGTGTGAG ACCACACTGG
1741 CCAACGTGGG CTACACAGCC ACCTACGACT TCAAGATGGC CGACCTGCAG CAGGTGGCAC
1801 CCGAGGCCAC CGTGCGCCGC TTCCTGCAGG GCCGCCGCTG CGAGCACAGC ACCGACTGCA
1861 CTACGGGCGC GACTGCAGGG CCCCGTGTGA CAGGCTCATG AGGCAGTGCA AGGGCGACCT
1921 CATCCAGCCC AACCTGGCCA AGGTGTGCGC ACTGCTACGG GGCTACCTGC TGCCTTGCGC
1981 GCCCGCCGAC CTCCGCGAGG AGCTGGGCAC ACACTGCGCA CCTGTACCAC GCTGAGCGGG
2041 CTGGCCAGCC AGGTGGAGGC CCATCACTCG CTGGTGCTCA GCCACCTCAA GACTCTGCTC
2101 TGGAAGAAGA TCTCCAACAC CAAGTACTCT TGATGGGGCA GTGAGGGGCC TGGCCACCCT
2161 TCCTGGAGCT GGCCAGGTGC CAGGGTCCAA CCCTCCCTCA AGGAATCCTG TCAGAAGATG
2221 TGAAATGCAA CTGTGTTGCA AAATCACTCC CCTACCGTCA GGGCTCTGGA TTCCAGCACC
2281 ACAGACATGA GACCCCAGCT CGGAGCAAAG GCGGACATGG ACATCCCGGC AGGAGAGTCC
2341 TCCAAGGGGG TTTGTTACTC TGAAGAACGT AATGTCAATA AACAGCTTTT ATGTAAAAAA
2401 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
2461 AAAAAAAAA
B:氨基酸序列(SEQ ID NO:11)长度:266
1 MVEWRTCLSV APGQQVYSGL WRDKDVTIKC GIEETLDSKA RSDAAPRREL VLFDKPTRGT
61 SIKEFREMTL GFLKANLGDL PSLPALVGQV LLMADFNKDN RVSLAEAKSV WALLQRNEFL
121 LLLSLQEKEH ASRLLGYCGD LYLTEGVPHG AWHAAALPPL LRPLLPPALQ GALQQWLGPA
181 WPWRAKIAIG LLEFVEELFH GSYGTFYMCE TTLANVGYTA TYDFKMADLQ QVAPEATVRR
241 FLQGRRCEHS TDCTTGATAG PRVTGS
C.核苷酸及氨基酸组合序列(SEQ ID NO:12)克隆号:PP6977
起始编码子:1101 ATG 终止编码子:1899 TGA 蛋白质分子量:29507.34
1 GG GCC GCG GCC TGT CCT CCT GCC TCA GCC TGG GGA AGG CTG GGC CGG 47
48 GCC GAA GAG GGA GGC CAA GTC CTT GGG ACA GGA GGA GAC CCA CAC CTG 95
96 AGA TTA GTG GAA ACC CAG CCA GAA GCT GCC ATG CAG GTG TGG CTC TGG 143
144 GCA TCA GGA TCT GTC GTG AGA GCC CCC ATG AGT GCC CAG TGC AGA ATG 191
192 GCT GGC AGC CCG CCC TGA CGG GGA GCA GAG GGG CTG GAC GCG GTG CCC 239
240 TTC ACG GGA TGA CAC CCA GCT GTT TGC CCT GTG TCC AGG GGG TTG CTT 287
288 CTC TGA CAG AGG CCC TAT GGC TCG TGT CTG ACT CCT GTC CAG GTT CTG 335
336 CCA GCC TGA CCA TCC ATC GCT CTG GCA CCA AGA GCC CAC CCT TTT GTT 383
384 CTT CCT GGC GTC CCA GGG AAA GCC CTG CCT GGG TGG GGC AGC TCC TGG 431
432 CCC TTC AGA TGG AAG ACG CAG TCC AGT CAG CAC CAT CAT AGG AAA CAA 479
480 GTT CAG AAA TGT CTC ACT TAC TAT TCC GGG CAG GGA GGG CGC CAT GAG 527
528 TCA GGG GGT GCA TCC TCC CTC CTG GCG TCA CCC GAG GCA GGA ATG AAG 575
576 AGT CAG GCA GAG AGC GCG CGT GTG GCA GCT GGT GGT GTA GAT ATT AGG 623
624 GAC TAG TGT GAA TTC TAG TTC ACC GGC CAA TGC CTG GAT GGT CCA GAG 671
672 CTG GGT CGG CTG GGC GGA GAG CTG CCT CCA GGT TCC TGC CTC TGG CCC 719
720 TGG CGT GGG GTC GAC ACT GGG TGT GGT GTG TGT CTC ATG TCC AGG CAG 767
768 TGG CCT TTG CTG TGC CGT CCT GTT ACA GGA GCC AGG ATG GTG GGG ACG 815
816 GGA CCG GAC CGG AGG GTT GGC GGG GCT GCC CCT GCA GCC GAC AGC CCC 863
864 ATC CTG CAG CCA CCA ATG GCA TGA CCC AGG GCC CCG GCA CTG CCT GTG 911
912 TGA GGG GCT GGC AGC TTT CCA ACT GCA GCA AGT GGA GGC CCC TGC CAG 959
960 CTT CGG GCC TGT GGG CAG GGG CTC AGT GGG GCA GGG GTG TGG CTG CCC 1007
1008 CGC CCG GCA CGC CTG CAC CTG TCT CCT CAG TGT GAC CAG TAC CGC AAG 1055
1056 GGG ATC ATC TCG GGC TCC GTC TGC CAG GAC CTG TGT GAG CTG CAT ATG 1103
1 Met 1
1104 GTG GAG TGG AGG ACC TGC CTC TCG GTG GCC CCG GGC CAG CAG GTG TAC 1151
2 Val Glu Trp Arg Thr Cys Leu Ser Val Ala Pro Gly Gln Gln Val Tyr 17
1152 AGC GGG CTC TGG CGG GAC AAG GAT GTA ACC ATC AAG TGT GGC ATT GAG 1199
18 Ser Gly Leu Trp Arg Asp Lys Asp Val Thr Ile Lys Cys Gly Ile Glu 33
1200 GAG ACC CTC GAC TCC AAG GCC CGG TCG GAT GCG GCC CCC CGG CGG GAG 1247
34 Glu Thr Leu Asp Ser Lys Ala Arg Ser Asp Ala Ala Pro Arg Arg Glu 49
1248 CTG GTA CTG TTT GAC AAG CCC ACC CGG GGC ACC TCC ATC AAG GAA TTC 1295
50 Leu Val Leu Phe Asp Lys Pro Thr Arg Gly Thr Ser Ile Lys Glu Phe 65
1296 CGG GAG ATG ACC CTC GGC TTC CTC AAG GCG AAC CTG GGA GAC CTG CCT 1343
66 Arg Glu Met Thr Leu Gly Phe Leu Lys Ala Asn Leu Gly Asp Leu Pro 81
1344 TCC CTG CCG GCG CTG GTT GGC CAG GTC CTG CTC ATG GCT GAC TTC AAC 1391
82 Ser Leu Pro Ala Leu Val Gly Gln Val Leu Leu Met Ala Asp Phe Asn 97
1392 AAG GAC AAC CGG GTG TCC CTG GCG GAA GCC AAG TCC GTG TGG GCC CTG 1439
98 Lys Asp Asn Arg Val Ser Leu Ala Glu Ala Lys Ser Val Trp Ala Leu 113
1440 CTG CAG CGT AAC GAG TTC CTG CTG CTG CTG TCC CTG CAG GAG AAG GAG 1487
114 Leu Gln Arg Asn Glu Phe Leu Leu Leu Leu Ser Leu Gln Glu Lys Glu 129
1488 CAC GCC TCC AGA CTG CTG GGC TAC TGT GGG GAC CTC TAC CTC ACC GAG 1535
130 His Ala Ser Arg Leu Leu Gly Tyr Cys Gly Asp Leu Tyr Leu Thr Glu 145
1536 GGC GTG CCG CAT GGC GCC TGG CAC GCG GCC GCC CTT CCA CCC CTG TTG 1583
146 Gly Val Pro His Gly Ala Trp His Ala Ala Ala Leu Pro Pro Leu Leu 161
1584 CGC CCA CTG CTG CCG CCT GCC CTG CAG GGT GCT CTC CAG CAG TGG CTG 1631
162 Arg Pro Leu Leu Pro Pro Ala Leu Gln Gly Ala Leu Gln Gln Trp Leu 177
1632 GGG CCT GCG TGG CCT TGG CGG GCC AAG ATC GCC ATC GGC CTG CTG GAG 1679
178 Gly Pro Ala Trp Pro Trp Arg Ala Lys Ile Ala Ile Gly Leu Leu Glu 193
1680 TTC GTG GAG GAG CTC TTC CAC GGC TCT TAC GGG ACT TTC TAC ATG TGT 1727
194 Phe Val Glu Glu Leu Phe His Gly Ser Tyr Gly Thr Phe Tyr Met Cys 209
1728 GAG ACC ACA CTG GCC AAC GTG GGC TAC ACA GCC ACC TAC GAC TTC AAG 1775
210 Glu Thr Thr Leu Ala Asn Val Gly Tyr Thr Ala Thr Tyr Asp Phe Lys 225
1776 ATG GCC GAC CTG CAG CAG GTG GCA CCC GAG GCC ACC GTG CGC CGC TTC 1823
226 Met Ala Asp Leu Gln Gln Val Ala Pro Glu Ala Thr Val Arg Arg Phe 241
1824 CTG CAG GGC CGC CGC TGC GAG CAC AGC ACC GAC TGC ACT ACG GGC GCG 1871
242 Leu Gln Gly Arg Arg Cys Glu His Ser Thr Asp Cys Thr Thr Gly Ala 257
1872 ACT GCA GGG CCC CGT GTG ACA GGC TCA TGA GGC AGT GCA AGG GCG ACC 1919
258 Thr Ala Gly Pro Arg Val Thr Gly Ser *** 267
1920 TCA TCC AGC CCA ACC TGG CCA AGG TGT GCG CAC TGC TAC GGG GCT ACC 1967
1968 TGC TGC CTT GCG CGC CCG CCG ACC TCC GCG AGG AGC TGG GCA CAC ACT 2015
2016 GCG CAC CTG TAC CAC GCT GAG CGG GCT GGC CAG CCA GGT GGA GGC CCA 2063
2064 TCA CTC GCT GGT GCT CAG CCA CCT CAA GAC TCT GCT CTG GAA GAA GAT 2111
2112 CTC CAA CAC CAA GTA CTC TTG ATG GGG CAG TGA GGG GCC TGG CCA CCC 2159
2160 TTC CTG GAG CTG GCC AGG TGC CAG GGT CCA ACC CTC CCT CAA GGA ATC 2207
2208 CTG TCA GAA GAT GTG AAA TGC AAC TGT GTT GCA AAA TCA CTC CCC TAC 2255
2256 CGT CAG GGC TCT GGA TTC CAG CAC CAC AGA CAT GAG ACC CCA GCT CGG 2303
2304 AGC AAA GGC GGA CAT GGA CAT CCC GGC AGG AGA GTC CTC CAA GGG GGT 2351
2352 TTG TTA CTC TGA AGA ACG TAA TGT CAA TAA ACA GCT TTT ATG TAA AAA 2399
2400 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 2447
2448 AAA AAA AAA AAA AAA AAA AAA A 2469
5.PP8482
A:核苷酸序列(SEQ ID NO:13)长度:939
1 GGGCTTCCTG GGGAGGGTGT GGCAGGGTGG TGGGCATCCC CTCCCTCACC AAAGCATGGG
61 CTCTTTGTTT CCTCTTTGCC AGGCCTGGGT CCTTCCCAGT GACCCCTCAG CCTTCACTTC
121 CTCCTCACTC CCGGGGAGCT GTGACAGGTG TTTGGGGGAG GGGAGGGGGG TATGATAAGC
181 TGGGACAGCT GCACCCACCG GTGCTCTGGT GAGATGGGGG GCCCGGATGT TGGGGAGACA
241 CATCTGCTGG GTTCCCAGCC CAAGGTCCCC AACCCTGGCT GTCTGGCCTT GTCTGTCACC
301 CCCCGTGCCC ACTGGCAGGG ACAGGAAGCT CCCCCCCCAC CCCGCTTTGG GCAGTTTGCC
361 TTGGCACGGG CCTGATGTGT TTTCCTCCCC AGAGCAGCTG CTGTTCTGTC TGCTGGGCAG
421 AGGGCTGGGT TCCTCCGAGG TAGGCAGGGG CCTCAACCCA GAGCCCCTCT CACACCCTCT
481 TTCAACTCAG GCTTATGTCT CTCCCTCCTC CCCCACCCCC ACCCCAGGAA GAGGAGATCC
541 CAGAACTGGA GATTGACGTG GATGAGCTCC TGGACATGGA GAGTGACGAT GCCCGGGCTG
601 CCAGGGTCAA GGAGCTGCTG GTTGACTGTT ACAAACCCAC AGAGGCCTTC ATTTCTGGCC
661 TGCTGGACAA GATCCGGGGC ATGCAGAAGC TGAGCACACC CCAGAAGAAG TGAGGGTCCC
721 CGACCCAGGA GAACGGTGGC TCCCACAGGA CAATCGCTGC CCCCCAACCT CGTAGCAACA
781 GCAATACCGG GGGACCCTGC GGCCAGGCCT GGTGCCATGA GCAGGGCTCC TCGTGCCCCT
841 GGCCCAGGGG TCTCTTCCCC TGCCCCCTCA GTTTTCCACT TTTGGGGTTT TTTATTGTTA
901 TTAAACTGAT GGGACTTTAA AAAAAAAAAA AAAAAAAAA
B:氨基酸序列(SEQ ID NO:14)长度:109
1 MLGRHICWVP SPRSPTLAVW PCLSPPVPTG RDRKLPPHPA LGSLPWHGPD LFSSPEQLLF
61 CLLGRGLGSS EVGRGLNPEP LSHPLSTQAY VSPSSPTPTP GRGDPRTGD
C.核苷酸及氨基酸组合序列(SEQ ID NO:15)克隆号:PP8482
起始编码子:227 ATG 终止编码子:554 TGA 蛋白质分子量:11600.60
1 G GGC TTC CTG GGG AGG GTG TGG CAG GGT GGT GGG CAT CCC CTC CCT 46
47 CAC CAA AGC ATG GGC TCT TTG TTT CCT CTT TGC CAG GCC TGG GTC CTT 94
95 CCC AGT GAC CCC TCA GCC TTC ACT TCC TCC TCA CTC CCG GGG AGC TGT 142
143 GAC AGG TGT TTG GGG GAG GGG AGG GGG GTA TGA TAA GCT GGG ACA GCT 190
191 GCA CCC ACC GGT GCT CTG GTG AGA TGG GGG GCC CGG ATG TTG GGG AGA 238
1 Met Leu Gly Arg 4
239 CAC ATC TGC TGG GTT CCC AGC CCA AGG TCC CCA ACC CTG GCT GTC TGG 286
5 His Ile Cys Trp Val Pro Ser Pro Arg Ser Pro Thr Leu Ala Val Trp 20
287 CCT TGT CTG TCA CCC CCC GTG CCC ACT GGC AGG GAC AGG AAG CTC CCC 334
21 Pro Cys Leu Ser Pro Pro Val Pro Thr Gly Arg Asp Arg Lys Leu Pro 36
335 CCC CAC CCC GCT TTG GGC AGT TTG CCT TGG CAC GGG CCT GAT CTG TTT 382
37 Pro His Pro Ala Leu Gly Ser Leu Pro Trp His Gly Pro Asp Leu Phe 52
383 TCC TCC CCA GAG CAG CTG CTG TTC TGT CTG CTG GGC AGA GGG CTG GGT 430
53 Ser Ser Pro Glu Gln Leu Leu Phe Cys Leu Leu Gly Arg Gly Leu Gly 68
431 TCC TCC GAG GTA GGC AGG GGC CTC AAC CCA GAG CCC CTC TCA CAC CCT 478
69 Ser Ser Glu Val Gly Arg Gly Leu Asn Pro Glu Pro Leu Ser His Pro 84
479 CTT TCA ACT CAG GCT TAT GTC TCT CCC TCC TCC CCC ACC CCC ACC CCA 526
85 Leu Ser Thr Gln Ala Tyr Val Ser Pro Ser Ser Pro Thr Pro Thr Pro 100
527 GGA AGA GGA GAT CCC AGA ACT GGA GAT TGA CGT GGA TGA GCT CCT GGA 574
101 Gly Arg Gly Asp Pro Arg Thr Gly Asp *** 110
575 CAT GGA GAG TGA CGA TGC CCG GGC TGC CAG GGT CAA GGA GCT GCT GGT 622
623 TGA CTG TTA CAA ACC CAC AGA GGC CTT CAT TTC TGG CCT GCT GGA CAA 670
671 GAT CCG GGG CAT GCA GAA GCT GAG CAC ACC CCA GAA GAA GTG AGG GTC 718
719 CCC GAC CCA GGA GAA CGG TGG CTC CCA CAG GAC AAT CGC TGC CCC CCA 766
767 ACC TCG TAG CAA CAG CAA TAC CGG GGG ACC CTG CGG CCA GGC CTG GTG 814
815 CCA TGA GCA GGG CTC CTC GTG CCC CTG GCC CAG GGG TCT CTT CCC CTG 862
863 CCC CCT CAG TTT TCC ACT TTT GGG GTT TTT TAT TGT TAT TAA ACT GAT 910
911 GGG ACT TTA AAA AAA AAA AAA AAA AAA AA 939
6.PP8607
A:核苷酸序列(SEQ ID NO:16)长度:2316
1 GCCGCTGCCC GCCGGAAGCC TGCCCCCGTA CCCTCCCTAC TTCGAAGGCG CCCCCTTCCC
61 TCACCCGCTG TGGCTCCGGG ACACGTACAA GCTGTGGGTG CCCCAGCCGC CGCCCAGGAC
121 CATCAAGCGC ACGCGGCGGC GTCTGTCCCG CAACCGCGAC CCGGGGCGCC TCATCCTCAG
181 CACCATCCGC CTGCGGCCGC GCCAGGTCCT CTGTGAGAAG TGCAAGAGCA CGCTGAGCCC
241 CCCGGAGGCC AGCCCCGGAC CCCCAGCCGC GCCCAGGGCC CGCAGGAGGC TGGGCAGCGG
301 CCCGGACAGG GAGCTCCGCA AGCCGGAGGA GCCGGAGAAC GGCGAGCCCA CGGCTGCGGC
361 CACCGCCAGG AGGAGCAAGA GGGAGAGGCG CGAGGAGGAC AGGGCCCCGG CAGAGCAGGT
421 CCCGCGGAGC CCGGTCATCA AGATCTCCTA CAGCACGCCC CAGGGCAAGG GAGAGGTGGT
481 CAAGATCCCC TCCCGCGTGC ACGGCTCTCT GGAGCCCTTC CGTCCCCAGC AGGCCCCGCA
541 GGACGACGGC AGCCAGGACC CCGAGGTGCT GGACAGAGAG TCCCGGGACC GGCCGTCCTG
601 CGCGCCCTCG GCCTCCATCC CCAAGTTGAA ACTGACACGG CCTGTGCCGG CCGGCGCGGA
661 CCTGCCGCCC CCTAAGATCC GCCTGAAGCC CCACCGTCTG GGGGACAGCG AGCACGAGCC
721 CGTGTACCGG GCCGAGCTGG TGGGGGAGCT GAACGGGTAC CTGCGGGACA GCTCGCCGGC
781 GCCCTGTGCG GACGGCCCTG CCGGTGGGCT GGCGGACTTG TCTTCTGGAA GTTCGGGTGA
841 GGACGATGAC TTCAAGAGCT GTCCCCAGGG TCCACAGGGA CGCGAGGGCT TGGCTTTTCT
901 CGTCAGCTGC CCTGAGGGGA GAGCGGACTG TGCCAGTGAG TCGGCGTGCA GCAGCGACAG
961 CCTGGACGAG GCCAGATCGT CCGGCTCGGA AGGGACGCCG GCAGACACGG GTGACCTCTC
1021 GCCTGGCCAC GGCGCGTCAG CGCCCTCGGT GTCCAGAGAG GCTCGCCAAA CGGTGCCGCC
1081 CCTGACGGTC AGGCTGCACA CACAGAGCGT GTCGGAGTGC ATCACGGAGG ACGGCAGGAC
1141 TGTGGCCGTG GGGGACATCG TCTGGGGTAA GATCCATGGT TTTCCTTGGT GGCCGGCGCG
1201 TGTTCTTGAC ATCAGTCTCG GCCAGAAGGA GGACGGAGAG CCGTCTTGGC GAGAAGCGAA
1261 GGTCTCGTGG TTTGGTTCTC CGACTACGTC GTTCTTGTCT ATTTCAAAAC TCTCCCCTTT
1321 CTCTGAATTT TTCAAACTGA GATTTAATCG TAAGAAGAAG GGGATGTATC GGAAAGCTAT
1381 AACCGAGGCT GCAAATGCCG CAAGACACGT GGCCCCGGAA ATCAGGGAGC TCTTAACCCA
1441 GTTTGAAACG TAACTGGTTC CCTGACCAGG TCACCGACGA TGAGGGCGCA CCTGCTGTCC
1501 TGGAGCTTCC GATCTCTGTT CGGGGACCCT GTGAGCCTTC TGGCCGGCTG CGTGCAGAGC
1561 CCACTGGGCA CGGTGGTCGG CCTGGTGTGA GGCCCCCCGG GGACCGGCAG TGTGTCCAGG
1621 GAGGGGATGG CCCTGAGCCC AGCGGCTCCT CCCGCTGAGT GTATTTCTTC CCACCACTCA
1681 GCGCATGGCT GCCCTGGCTC ACGAGGCAGT CGGGACTCGT GACTTGCTGG CTGCTGGCTG
1741 CTGCTGCCTC GCGCGCTGGG GTTCCATGGA GGAACTGGGC CTGCCGCCCC GGCCTCACCT
1801 GCTGCCCGCA TGCTGGGGTC CCATGGAGGA ACCAGGCCTG GCGCCCCGGC CTCGCCCAGC
1861 GGCTGGTGTG GGCAGCTGTT CCCTGCCTCG CAGTGTCCTG GAGGCAGCTG TCTCGCAGAC
1921 TCAGCTTGGT CTCCCGCAGG CTTCAGAAAA ACCCAATTGC ACGTGTGGGA TTCTTCCCCA
1981 GCCCTTGGGT GCGGGGTCTC TGTGCACTTG AGAGCTGGGG GACCCACCCA CCGTCTCCCA
2041 CTCCAAGTTC ATCCCAGAGC GTGGGGCCCG CTGGGCACCT GGCACCTGGC CTGCAGATGC
2101 TGCTACGAGT GACCAGTGCT GTGTGGAGGA GGCCAAGGGC GGCCCCTGGG AAACCGGGCT
2161 TCAACAAGTA CAAGGAAAAG AAACTTGCTC TGTTTTGTAA GAAGCGTGTT CCTTTTCCTC
2221 TTTTTTGTCA CTTTAAAGAC CCAAAAGAAT AAAGAAAGAA AAGAAAAAAT TTTAAAAAAA
2281 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAA
B:氨基酸序列(SEQ ID NO:17)长度:108
1 MAALAHEAVG TRDLLAAGCC CLARWGSMEE LGLPPRPHLL PACWGPMEEP GLAPRPRPAA
61 GVGSCSLPRS VLEAAVSQTQ LGLPQASEKP NCTCGILPQP LGAGSLCT
C.核苷酸及氨基酸组合序列(SEQ ID NO:18)克隆号:PP8607
起始编码子:1685 ATG 终止编码子:2009 TGA 蛋白质分子量:11038.26
1 G CCG CTG CCC GCC GGA AGC CTG CCC CCG TAC CCT CCC TAC TTC GAA 46
47 GGC GCC CCC TTC CCT CAC CCG CTG TGG CTC CGG GAC ACG TAC AAG CTG 94
95 TGG GTG CCC CAG CCG CCG CCC AGG ACC ATC AAG CGC ACG CGG CGG CGT 142
143 CTG TCC CGC AAC CGC GAC CCG GGG CGC CTC ATC CTC AGC ACC ATC CGC 190
191 CTG CGG CCG CGC CAG GTC CTC TGT GAG AAG TGC AAG AGC ACG CTG AGC 238
239 CCC CCG GAG GCC AGC CCC GGA CCC CCA GCC GCG CCC AGG GCC CGC AGG 286
287 AGG CTG GGC AGC GGC CCG GAC AGG GAG CTC CGC AAG CCG GAG GAG CCG 334
335 GAG AAC GGC GAG CCC ACG GCT GCG GCC ACC GCC AGG AGG AGC AAG AGG 382
383 GAG AGG CGC GAG GAG GAC AGG GCC CCG GCA GAG CAG GTC CCG CGG AGC 430
431 CCG GTC ATC AAG ATC TCC TAC AGC ACG CCC CAG GGC AAG GGA GAG GTG 478
479 GTC AAG ATC CCC TCC CGC GTG CAC GGC TCT CTG GAG CCC TTC CGT CCC 526
527 CAG CAG GCC CCG CAG GAC GAC GGC AGC CAG GAC CCC GAG GTG CTG GAC 574
575 AGA GAG TCC CGG GAC CGG CCG TCC TGC GCG CCC TCG GCC TCC ATC CCC 622
623 AAG TTG AAA CTG ACA CGG CCT GTG CCG GCC GGC GCG GAC CTG CCG CCC 670
671 CCT AAG ATC CGC CTG AAG CCC CAC CGT CTG GGG GAC AGC GAG CAC GAG 718
719 CCC GTG TAC CGG GCC GAG CTG GTG GGG GAG CTG AAC GGG TAC CTG CGG 766
767 GAC AGC TCG CCG GCG CCC TGT GCG GAC GGC CCT GCC GGT GGG CTG GCG 814
815 GAC TTG TCT TCT GGA AGT TCG GGT GAG GAC GAT GAC TTC AAG AGC TGT 862
863 CCC CAG GGT CCA CAG GGA CGC GAG GGC TTG GCT TTT CTC GTC AGC TGC 910
911 CCT GAG GGG AGA GCG GAC TGT GCC AGT GAG TCG GCG TGC AGC AGC GAC 958
959 AGC CTG GAC GAG GCC AGA TCG TCC GGC TCG GAA GGG ACG CCG GCA GAC 1006
1007 ACG GGT GAC CTC TCG CCT GGC CAC GGC GCG TCA GCG CCC TCG GTG TCC 1054
1055 AGA GAG GCT CGC CAA ACG GTG CCG CCC CTG ACG GTC AGG CTG CAC ACA 1102
1103 CAG AGC GTG TCG GAG TGC ATC AC6 GAG GAC GGC AGG ACT GTG GCC GTG 1150
1151 GGG GAC ATC GTC TGG GGT AAG ATC CAT GGT TTT CCT TGG TGG CCG GCG 1198
1199 CGT GTT CTT GAC ATC AGT CTC GGC CAG AAG GAG GAC GGA GAG CCG TCT 1246
1247 TGG CGA GAA GCG AAG GTC TCG TGG TTT GGT TCT CCG ACT ACG TCG TTC 1294
1295 TTG TCT ATT TCA AAA CTC TCC CCT TTC TCT GAA TTT TTC AAA CTG AGA 1342
1343 TTT AAT CGT AAG AAG AAG GGG ATG TAT CGG AAA GCT ATA ACC GAG GCT 1390
1391 GCA AAT GCC GCA AGA CAC GTG GCC CCG GAA ATC AGG GAG CTC TTA ACC 1438
1439 CAG TTT GAA ACG TAA CTG GTT CCC TGA CCA GGT CAC CGA CGA TGA GGG 1486
1487 CGC ACC TGC TGT CCT GGA GCT TCC GAT CTC TGT TCG GGG ACC CTG TGA 1534
1535 GCC TTC TGG CCG GCT GCG TGC AGA GCC CAC TGG GCA CGG TGG TCG GCC 1582
1583 TGG TGT GAG GCC CCC CGG GGA CCG GCA GTG TGT CCA GGG AGG GGA TGG 1630
1631 CCC TGA GCC CAG CGG CTC CTC CCG CTG AGT GTA TTT CTT CCC ACC ACT 1678
1679 CAG CGC ATG GCT GCC CTG GCT CAC GAG GCA GTC GGG ACT CGT GAC TTG 1726
1 Met Ala Ala Leu Ala His Glu Ala Val Gly Thr Arg Asp Leu 14
1727 CTG GCT GCT GGC TGC TGC TGC CTC GCG CGC TGG GGT TCC ATG GAG GAA 1774
15 Leu Ala Ala Gly Cys Cys Cys Leu Ala Arg Trp Gly Ser Met Glu Glu 30
1775 CTG GGC CTG CCG CCC CGG CCT CAC CTG CTG CCC GCA TGC TGG GGT CCC 1822
31 Leu Gly Leu Pro Pro Arg Pro His Leu Leu Pro Ala Cys Trp Gly Pro 46
1823 ATG GAG GAA CCA GGC CTG GCG CCC CGG CCT CGC CCA GCG GCT GGT GTG 1870
47 Met Glu Glu Pro Gly Leu Ala Pro Arg Pro Arg Pro Ala Ala Gly Val 62
1871 GGC AGC TGT TCC CTG CCT CGC AGT GTC CTG GAG GCA GCT GTC TCG CAG 1918
63 Gly Ser Cys Ser Leu Pro Arg Ser Val Leu Glu Ala Ala Val Ser Gln 78
1919 ACT CAG CTT GGT CTC CCG CAG GCT TCA GAA AAA CCC AAT TGC ACG TGT 1966
79 Thr Gln Leu Gly Leu Pro Gln Ala Ser Glu Lys Pro Asn Cys Thr Cys 94
1967 GGG ATT CTT CCC CAG CCC TTG GGT GCG GGG TCT CTG TGC ACT TGA GAG 2014
95 Gly Ile Leu Pro Gln Pro Leu Gly Ala Gly Ser Leu Cys Thr *** 109
2015 CTG GGG GAC CCA CCC ACC GTC TCC CAC TCC AAG TTC ATC CCA GAG CGT 2062
2063 GGG GCC CGC TGG GCA CCT GGC ACC TGG CCT GCA GAT GCT GCT ACG AGT 2110
2111 GAC CAG TGC TGT GTG GAG GAG GCC AAG GGC GGC CCC TGG GAA ACC GGG 2158
2159 CTT CAA CAA GTA CAA GGA AAA GAA ACT TGC TCT GTT TTG TAA GAA GCG 2206
2207 TGT TCC TTT TCC TCT TTT TTG TCA CTT TAA AGA CCC AAA AGA ATA AAG 2254
2255 AAA GAA AAG AAA AAA TTT TAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 2302
2303 AAA AAA AAA AAA AA 2316
7.PP8857
A:核苷酸序列(SEQ ID NO:19)长度:2423
1 GCAGCCGCGG AACTCCGGGC CCTGAGAGGG GGCGGGGGTG CAGGGGTCCC AGGGCCGGGC
61 CGGGGTCTTT CCTGGCCCGG GGGAAACCGG CCCAGGCCTC CCGGGGGGGG CAATCGCCCA
121 ACAAAGGATT CTTGGGGCGC CCGCCCTCGA GGACTTCCCT GCCCCTGGAT CCGGCCCCCC
181 CAGCGCTCCG GGCCCGGCAT CCCGGGGCTC TCCATCGCGG GGTACCCCAG TTCGCGGTCT
241 GCCATCGGGC AGCCCGGGCG CTACTCACCT CCGCCCGCGT CCGTGTTCCA GGTCCGGCCC
301 GGAGCGGCCA TGTCCCACGG CCCCAAGCAG CCCGGCGCGG CCGCCGCGCC GGCGGGCGGC
361 AAGGCTCCGG GCCAGCATGG GGGCTTCGTG GTGACTGTCA AGCAAGAGCG CGGCGAGGGT
421 CCACGCGCGG GCGAGAAGGG GTCCCACGAG GAGGAGGTGA GAGTCCCTGC GCTGAGCTGG
481 GGGAGGCCCC GGGCTCCCGC CCCAGCCTCG AAGCCCCGCC CCAGGCTGGA TTTGAATTGC
541 TTGTGGCTCC GCCCACAGCC CATTTTCCTC TGGAAGCTGA GACCCCGCCC CGTGCCAGCT
601 GCCACGCCCC TGACAGGTCC TCTGCCACTC TAAGTCCAGG CCCCGCCCAC CGCACAATGC
661 CAGCTCTGCC CACTCTAAGG TCCCGCCCAC TTCCACTCCT TGGGGGCGGC ACCCTCCCCT
721 TGGTCCTGTG GGCCCGTTCT CCAGCAGAAA ACCACGCCCA CCAAGCAGAG GCCACGCCCA
781 CAACCGAAGT CAACGCCAAC CCTGTACTCA AACCTCGGCC CATAGTTCCT CAGATCCCCT
841 CACCCCTGGC CAGGGATCCC TCTAACCCAC CGTGTCCCGA CTGCTGACCG GGCCCTACCT
901 CCATCTTTTC CGGGTTCTTC CTCCCAGCTA GGCCCCGCCC CCATCCCCGC CCATACGCGT
961 TAGGCCCCGC CCATGCCCCT CTGAGCCCTG CCCCAGTACG CCAGGCCCCC CTCCCAACGA
1021 CGCAGCCCGG TTCTGCAGCC GGTGAAGAAA CGCGGCTGGC CCAAGGGCAA GAAGCGGAAG
1081 AAGATTCTGC CGAATGGGCC CAAGGCACCG GTCACGGGCT ACGTGCGCTT CCTGAACGAG
1141 CGGCGCGAGC AGATCCGCAC GCGCCACCCG GATCTGCCCT TTCCCGAGAT CACCAAGATG
1201 CTGGGCCCCG AGTGGAGCAA GCTGCAGCCA ACGGAAAAGC AGCGGTACCT GGATGAGGCC
1261 GAGAGAGAGA AGCAGCAGTA CATGAAGGAG CTGCGGGCGT ACCAGCAGTC TGAAGCCTAT
1321 AAGATGTGCA CGGAGAAGAT CCAGGAGAAG AAGATCAAGA AAGAAGACTG AGCTCTGGGC
1381 TCATGAACAC TCTCCTGAAT GGACACAAGG GTGGGGACTG CGATGGCTTC TCCACCTTCG
1441 ATGTTCCCAT CTTCACTGAA GAGTTCTTGG ACCAAAACAA AGCGCGTGAG GCGGAGCTTC
1501 GGCGCTTGCG GAAGATGAAT GTGGCCTTCG AGGAGCAGAA CGCGGTACTG CAGAGGCACA
1561 CGCAGAGCAT GAGCAGCGCG CGCGAGCGTC TGGAGCAGGA GCTGGCGCTG GAGGAGCGGA
1621 GGACGCTGGC GCTGCAGCAG CAGCTCCAGG CCGTGCGCCA GGCGCTCACC GCCAGCTTCG
1681 CCTCACTGCC GGTGCCGGGC ACGGGCGAAA CGCCCACGCT GGGCACTCTG GACTTCTACA
1741 TGGCCCGGCT TCACGGAGCC ATCGAGCGCG ACCCCGCCCA GCACGAGAAG CTCATCGTCC
1801 GCATCAAGGA AATCCTGGCC CAGGTCGCCA GCGAGCACCT GTGAGGAGTG GGCGGGCCCA
1861 CGATGCAGAG GAGAAGCTGT GGGCGCGGCC CTGCCACACC CCACCCCGTG GACGAGAGGC
1921 TGGGGGTCCA CCCTTTGGGG CCTGGTCCCA TCCTGCACCT TGGGGGCTCC AGCCCCCCTA
1981 AAATTAAATT TCTGCAGCAT CCCTTTAGCT TTCAATCTCC CCAGCCCCCT GAACCCGGAA
2041 AAAGCACTCG CTGCGCGATA CACCCAGAAG AACCTCACAG CCGAGGGTGC CCCTCCTCGG
2101 AGGACAGCCA CGCGCTACAC TGGCTCTCCG GGCCACCCCC AGGACACAGG GCAGACGAAA
2161 CCCACCCCCA GCACACGGCA GGACCCCCCA AATTACTCAC TACGGGGGGC TGTGCCATAG
2221 GCCACACAGG AAGCTGCCTT GTGGGGACTT ACCTGGGGTG TCCCCCGCAT GCCTGTACCC
2281 CAGATGGGTG GGGGCCGGCT TTGCCCATCC TGCTCTCCTC CAGCCGAGGG ACCCTGGTGG
2341 GGGTGGCTCC TTCTCACTGC TGGATCCGGA CTTTTTAAAT AAAAACAAGT AAAATTTGTG
2401 TTTTAAAAAA AAAAAAAAAA AAA
B:氨基酸序列(SEQ ID NO:20)长度:171
1 MQRRSCGRGP ATPHPVDERL GVHPLGPGPI LHLGGSSPPK IKFLQHPFSF QSPQPPEPGK
61 STRCAIHPEE PHSRGCPSSE DSHALHWLSG PPPGHRADET HPQHTAGPPK LLTTGGCAIG
121 HTGSCLVGTY LGCPPHACTP DGWGPALPIL LSSSRGTLVG VAPSHCWIRT F
C.核苷酸及氨基酸组合序列(SEQ ID NO:21)克隆号:PP8857
起始编码子:1863 ATG 终止编码子:2376 TAA 蛋白质分子量:17989.50
1 GC AGC CGC GGA ACT CCG GGC CCT GAG AGG GGG CGG GGG TGC AGG GGT 47
48 CCC AGG GCC GGG CCG GGG TCT TTC CTG GCC CGG GGG AAA CCG GCC CAG 95
96 GCC TCC CGG GGG GGG CAA TCG CCC AAC AAA GGA TTC TTG GGG CGC CCG 143
144 CCC TCG AGG ACT TCC CTG CCC CTG GAT CCG GCC CCC CCA GCG CTC CGG 191
192 GCC CGG CAT CCC GGG GCT CTC CAT CGC GGG GTA CCC CAG TTC GCG GTC 239
240 TGC CAT CGG GCA GCC CGG GCG CTA CTC ACC TCC GCC CGC GTC CGT GTT 287
288 CCA GGT CCG GCC CGG AGC GGC CAT GTC CCA CGG CCC CAA GCA GCC CGG 335
336 CGC GGC CGC CGC GCC GGC GGG CGG CAA GGC TCC GGG CCA GCA TGG GGG 383
384 CTT CGT GGT GAC TGT CAA GCA AGA GCG CGG CGA GGG TCC ACG CGC GGG 431
432 CGA GAA GGG GTC CCA CGA GGA GGA GGT GAG AGT CCC TGC GCT GAG CTG 479
480 GGG GAG GCC CCG GGC TCC CGC CCC AGC CTC GAA GCC CCG CCC CAG GCT 527
528 GGA TTT GAA TTG CTT GTG GCT CCG CCC ACA GCC CAT TTT CCT CTG GAA 575
576 GCT GAG ACC CCG CCC CGT GCC AGC TGC CAC GCC CCT GAC AGG TCC TCT 623
624 GCC ACT CTA AGT CCA GGC CCC GCC CAC CGC ACA ATG CCA GCT CTG CCC 671
672 ACT CTA AGG TCC CGC CCA CTT CCA CTC CTT GGG GGC GGC ACC CTC CCC 719
720 TTG GTC CTG TGG GCC CGT TCT CCA GCA GAA AAC CAC GCC CAC CAA GCA 767
768 GAG GCC ACG CCC ACA ACC GAA GTC AAC GCC AAC CCT GTA CTC AAA CCT 815
816 CGG CCC ATA GTT CCT CAG ATC CCC TCA CCC CTG GCC AGG GAT CCC TCT 863
864 AAC CCA CCG TGT CCC GAC TGC TGA CCG GGC CCT ACC TCC ATC TTT TCC 911
912 GGG TTC TTC CTC CCA GCT AGG CCC CGC CCC CAT CCC CGC CCA TAC GCG 959
960 TTA GGC CCC GCC CAT GCC CCT CTG AGC CCT GCC CCA GTA CGC CAG GCC 1007
1008 CCC CTC CCA ACG ACG CAG CCC GGT TCT GCA GCC GGT GAA GAA ACG CGG 1055
1056 CTG GCC CAA GGG CAA GAA GCG GAA GAA GAT TCT GCC GAA TGG GCC CAA 1103
1104 GGC ACC GGT CAC GGG CTA CGT GCG CTT CCT GAA CGA GCG GCG CGA GCA 1151
1152 GAT CCG CAC GCG CCA CCC GGA TCT GCC CTT TCC CGA GAT CAC CAA GAT 1199
1200 GCT GGG CCC CGA GTG GAG CAA GCT GCA GCC AAC GGA AAA GCA GCG GTA 1247
1248 CCT GGA TGA GGC CGA GAG AGA GAA GCA GCA GTA CAT GAA GGA GCT GCG 1295
1296 GGC GTA CCA GCA GTC TGA AGC CTA TAA GAT GTG CAC GGA GAA GAT CCA 1343
1344 GGA GAA GAA GAT CAA GAA AGA AGA CTG AGC TCT GGG CTC ATG AAC ACT 1391
1392 CTC CTG AAT GGA CAC AAG GGT GGG GAC TGC GAT GGC TTC TCC ACC TTC 1439
1440 GAT GTT CCC ATC TTC ACT GAA GAG TTC TTG GAC CAA AAC AAA GCG CGT 1487
1488 GAG GCG GAG CTT CGG CGC TTG CGG AAG ATG AAT GTG GCC TTC GAG GAG 1535
1536 CAG AAC GCG GTA CTG CAG AGG CAC ACG CAG AGC ATG AGC AGC GCG CGC 1583
1584 GAG CGT CTG GAG CAG GAG CTG GCG CTG GAG GAG CGG AGG ACG CTG GCG 1631
1632 CTG CAG CAG CAG CTC CAG GCC GTG CGC CAG GCG CTC ACC GCC AGC TTC 1679
1680 GCC TCA CTG CCG GTG CCG GGC ACG GGC GAA ACG CCC ACG CTG GGC ACT 1727
1728 CTG GAC TTC TAC ATG GCC CGG CTT CAC GGA GCC ATC GAG CGC GAC CCC 1775
1776 GCC CAG CAC GAG AAG CTC ATC GTC CGC ATC AAG GAA ATC CTG GCC CAG 1823
1824 GTC GCC AGC GAG CAC CTG TGA GGA GTG GGC GGG CCC ACG ATG CAG AGG 1871
1 Met Gln Arg 3
1872 AGA AGC TGT GGG CGC GGC CCT GCC ACA CCC CAC CCC GTG GAC GAG AGG 1919
4 Arg Ser Cys Gly Arg Gly Pro Ala Thr Pro His Pro Val Asp Glu Arg 19
1920 CTG GGG GTC CAC CCT TTG GGG CCT GGT CCC ATC CTG CAC CTT GGG GGC 1967
20 Leu Gly Val His Pro Leu Gly Pro Gly Pro Ile Leu His Leu Gly Gly 35
1968 TCC AGC CCC CCT AAA ATT AAA TTT CTG CAG CAT CCC TTT AGC TTT CAA 2015
36 Ser Ser Pro Pro Lys Ile Lys Phe Leu Gln His Pro Phe Ser Phe Gln 51
2016 TCT CCC CAG CCC CCT GAA CCC GGA AAA AGC ACT CGC TGC GCG ATA CAC 2063
52 Ser Pro Gln Pro Pro Glu Pro Gly Lys Ser Thr Arg Cys Ala Ile His 67
2064 CCA GAA GAA CCT CAC AGC CGA GGG TGC CCC TCC TCG GAG GAC AGC CAC 2111
68 Pro Glu Glu Pro His Ser Arg Gly Cys Pro Ser Ser Glu Asp Ser His 83
2112 GCG CTA CAC TGG CTC TCC GGG CCA CCC CCA GGA CAC AGG GCA GAC GAA 2159
84 Ala Leu His Trp Leu Ser Gly Pro Pro Pro Gly His Arg Ala Asp Glu 99
2160 ACC CAC CCC CAG CAC ACG GCA GGA CCC CCC AAA TTA CTC ACT ACG GGG 2207
100 Thr His Pro Gln His Thr Ala Gly Pro Pro Lys Leu Leu Thr Thr Gly 115
2208 GGC TGT GCC ATA GGC CAC ACA GGA AGC TGC CTT GTG GGG ACT TAC CTG 2255
116 Gly Cys Ala Ile Gly His Thr Gly Ser Cys Leu Val Gly Thr Tyr Leu 131
2256 GGG TGT CCC CCG CAT GCC TGT ACC CCA GAT GGG TGG GGG CCG GCT TTG 2303
132 Gly Cys Pro Pro His Ala Cys Thr Pro Asp Gly Trp Gly Pro Ala Leu 147
2304 CCC ATC CTG CTC TCC TCC AGC CGA GGG ACC CTG GTG GGG GTG GCT CCT 2351
148 Pro Ile Leu Leu Ser Ser Ser Arg Gly Thr Leu Val Gly Val Ala Pro 163
2352 TCT CAC TGC TGG ATC CGG ACT TTT TAA ATA AAA ACA AGT AAA ATT TGT 2399
164 Ser His Cys Trp Ile Arg Thr Phe *** 172
2400 GTT TTA AAA AAA AAA AAA AAA AAA 2423
8.PP8875
A:核苷酸序列(SEQ ID NO:22)长度:4109
1 GTTCCCGCAG GGGTGCTGGG CCCCTGCGGC TCCCACCACA TTGCGCTGGA CTCTTGTGGC
61 CCGTGCTGAC CTGGTGTTCC AGATGCTGTC TCTGCAGAGC TCTGCGTGGT CTCTGGTGTT
121 AGAGAGGTGG CCACCCACCG CCCTATCATT GTCCTCATCC CCACTGTGAG GAGAAGCTAT
181 CAGATCTGCC TGTGGCCCCC AGGTGGCTCA GGAAGGGCCG TCCTGACCCC CATCCTGGCC
241 CCTTTCGGAG CTGCAGAGAT TTCCTGTGCC TCCAGCTCTG GCTTCCTGGG TCTGTCCTTG
301 GCGTGGAGCG GGCACAGGCT TCCCGTAGAC ACGGTTGCCC AGAGTGGGGT TCATAACTGG
361 GCACTGTAAA GGGTGTGGTC TCCACGGCTT AGGATGGGCC CCCCCTTCCT GGTGGCCTGC
421 TGTGCCCGGG GCTGGTGTGG AGGCCTGTGG GGGTGCAGAG GCCGCCCGGC CCTGGGCTTC
481 CTCTGGGGTT ACATGTGTAC CCTTGCACCC ACCTGTTAGC ACCCACCGGG AGAGTCTCAC
541 TCAGCCTAAA CCAGGGCCCC TCAGGAGGAA AAGGTCCCCA GCTTCATGAT GGGGCCCAGT
601 GTGCCTTCCA TCCCCGCCCT GACTCAGTGC CCACTGTGCG AGGTGTGAGC ACTGTCCACA
661 GCAGCCAGGG CGGCCGGTGG GGAGTGCATT GGAGGGGGTT GAGGTCTCTT GGGCACCTGG
721 TGAGTTCTCA AGGGTGAGAG GAAGCCGAGG CCATCAGGCT TAGCTGACGC TGCATGGGGC
781 AGGCTGCCAA GAGGGAGGCT GAATGGAGCA GCCTCAGGTG AGCCGACAAT CCTCACCTCC
841 GCCTGGTCAG CCAGGACCCG GCTCCCCTCC AGTCCCGCCT GCTTTCCCCA AAGCAGATCC
901 AGCCAGTCTC AATGGCTCGC CCGGGGGGTG CTGGTTAGGC TGTGAGCATC CTTCCTGGGT
961 GCAGGCCCCC GACAGCCAGC AGTGCTGTGC TGTGTGTGTG TTGGGGACTC TGCTGAGCCC
1021 TTTGTGGCCA GACTGGGGAG GCTCCTCCGG GCTGGCTCTG TCCCCTGTAC CTTGTGAGGG
1081 AGGGGCTGAC CCCCTGACTG GGTTACATCG TGGTGAGCAG TTCAGAAACA AGCTGTGGAA
1141 TGAAGTGGAC GTGGCGTTTT AAACACATGA GCCCCATCTG TTCTTAGGGG TTTTGTTTGT
1201 TGTCCCAGTC CGTGACTCCA AGACTGGGAC CCCCAGAGTT CCCAGGATGG TCTGGAGCCT
1261 TTATCCTCAG GTCAGCATTG TGGAGTTAAA GGGAGGGGAC CACGGCCCCT CATTCTCAGG
1321 AGAGCCATGG TGACCTTGAT GGCGGAGGCT CAGGGGGACC TGGACCGTGG ACACCACACA
1381 GCTGCCCTCC TCCCTCCCGA GGCCATTTCA GGGCTGGAAT CCCTGCCCCC CTCTCCTTTC
1441 CTCCCGGGCT GGTTGTTGCC TTGAGAGTCC GTGCGCTCAT CTCCCCACTT TTACCCCAGG
1501 GGGAGGCCCC TCACCTTCCC ACCATATCCC TTGTACTTCC TCCCACCCTG GACTTGGGGG
1561 AGCTGGGGGG AGGGGGCCCT TCCTTCAGCA GCAAACCCTC CTGGTGTAGG GCTGTAGGCC
1621 ATCCCACCGC AGCCTGTCCA GGAGCTGCTG AGCCTGTCAG CCCCAACTAG CACCTCCTGT
1681 CCAGGCCCGG CCCAGCCCTG CCTCCAGAGC CTACAGAGGG GCCTCGCCCA GGTCCTGCTG
1741 CTCCAGAGCT TGTGGGTGCC CACGCTGCAG GCTGTTTGGG GTGGTGGAGT AGAGCACCCG
1801 CTGGAGCTGG GGGCTGAGTG GCCATGGGGG GACCATGCTC CTCCTATGGC CCAAGGCCCA
1861 GGGGTTCCAC CTCGTAATTT TTGTTTGTTT TTAAATAAGG AAAATGCAAA AAGCGAGGCG
1921 ACGGCTTAAA GATGGAGAAC GACCCCCAGG AGGCGGAGTC TGAAATGGCC CTGGATGCTG
1981 AGTTCCTGGA CGTGTACAAG AACTGCAACG GGGTGGTCAT GATGTTCGAC ATTACCAAGC
2041 AGTGGACCTT CAATTACATT CTCCGGGAGC TTCCAAAAGT GCCCACCCAC GTGCCAGTGT
2101 GCGTGCTGGG GAACTACCGG GACATGGGCG AGCACCGAGT CATCCTGCCG GACGACGTGC
2161 GTGACTTCAT CGACAACCTG GACAGGTGGG TGCGGTGGCC CTGCTCCCGA GGGACCCTGC
2221 CCGGTGCTCC GGTGTGCGGG GGAGGGTGCT GAGGCAGAGG CCCAGGGAGG GGTTAACGTT
2281 AGCATGGGGC CCGGCGGATG TGGGTCTCGC CGCTGAGTGG GGCTCACTGA AGCCTGGGTC
2341 TCCCCGATGG CAGGGCCGGG AACTGTGTGC TGGGGAACTG TGTGCCAGGG TGAAGTGCTG
2401 GCACTGTGGG GTCACCTGCA GAAGGGCACT CGGCTTAGCT GCTTAGCAGG GCTCAGCAGG
2461 GTCCTGTGGC CTCAGGAGCC TGCAGGAGGA GGGAGGGCAG TGCGGACCCA CAGCTGTGGG
2521 CCCAGGGGTG ATCCTTGGCA CCAGGGCAAG GGTCTTTCTC TTGCATCTTT TTTCCTTTCT
2581 GAAAGCAGAC CTCCAGGTTC CTCCTACTTC CGCTATGCTG AGTCTTCCAT GAAGAACAGC
2641 TTCGGCCTAA AGTACCTTCA TAAGTTCTTC AATATCCCAT TTTTGCAGCT TCAGAGGGAG
2701 ACGCTGTTGC GGCAGCTGGA GACGAACCAG CTGGACATGG ACGCCACGCT GGAGGAGCTG
2761 TCGGTGCAGC AGGAGACGGA GGACCAGAAC TACGGCATGT ATGTGGCGGG ACCCGCCCGT
2821 GCGGGCGGTG TGGGGGCTGC GGGCGTGGCC GTGGTGCAGG GCCATGGGCT GCACCAAGGA
2881 GACAGCAGAG GGGAGTGTCC CCTGTTTGGG GTAAATTAGT CACCTTTGGG CACGGGTGGA
2941 GGAGGACTCA GGTTTGCACT GCCCCCAGCA GCCCCCCCAC AGTCACCCCT GGCGTGGACT
3001 CCTCATACAG GTCATGCTGT GCCTGCCACT CTGAGTACCG CTGACCGTGG CCAGGTGCTG
3061 GTGCTCATGG AGTGCTGCTG GGGCTGCCTG CCCATCAGGG GCTTGGCCTC CCAGATTGAT
3121 GCCAGCATGG GGTGTGCTTT CTGGGGAGCT GCTTGACTTT GGGAAGCTCC CTGTGTTGAA
3181 GAGGCATACA GGCCAGGACA TGGAGGTCTC TGGTCCTCGA CAGCAGAGGG AGGCTCAGAG
3241 CATCCTCCTG AGTGGGCCTG GGCAGTGCAT AGCCCCGGGG TTGCGGCCAG TGGGACAGCT
3301 GGCCCGTTCT CTGCCTCAGG CTCCTGTACA GCTAGGGGCT TGGTGCCTCC CCTGGGACCC
3361 AGGCAGGGAC CACGGAATCA GTGGCCCTCC TGAGGCCCCC CAGGAGGTCT CTGTTTCCAG
3421 AAGGAGAGCC CTGTGGGTCA CCTTGGATCT GGCTGTTGGC TCAGACACAG CAAGAGACCG
3481 AGAGGGAAGG CAGTTTGATG CCTGGAGAGG GACCCGTGGC TTCCAGCTGC CAGGCCAGCC
3541 CCAGAATGGA GCCCCCCGCA TGGGCGCTTC TCTGTTGAAC CAATCCTGGC ATTTCCTGGG
3601 CCTGAGAGTT GGGTCAAGCT GAATGCTGCG ATGGCCGCAC GTGCTCCACC AAGCCCCAGC
3661 CCCCTCCTCT TCCCAGAAAC CCCCGCTCAC GGGAAGGTCC AGTTGCTTGC CATCTGGCCA
3721 CCTCTGCATG GAGCCCCCAA CAGCTGTGCC TCAGAACAGA TCCGAAGTGA CTTTCAGGGG
3781 AGCTGGACAC ATGTACGCTG GTGCCTGCTG TCCCCACCCT TTGGCACTGC TGCTCTTTCT
3841 TTTTCTGAGA TGGAGTCTCG CTCTGTCGCC CAGGCTGGAG CGCAGTGGTG TGATCTCGGC
3901 TCACCGCAAG CTCCGCCTCC CGGGTTCACG CCATTCTCCT GCCTCAGCCT CCCAGCTACT
3961 GGGGAGGCTG AGGCAGGGGA ATTGCTTGAA CCCGGGAGGC AGAGGTTATC GTGAGCTGAC
4021 ATTGCGCCAC TGCACTCCAG CGCGGAAGAC AGAGTGAGCA AAAAAAAAAA AAAAAAAAGA
4081 AAAAGTGACC AAAAAAAAAA AAAAAAAAA
B:氨基酸序列(SEQ ID NO:23)长度:190
1 MAGPGTVCWG TVCQGEVLAL WGHLQKGTRL SCLAGLSRVL WPQEPAGGGR AVRTHSCGPR
61 GDPWHQGKGL SLASFFLSES RPPGSSYFRY AESSMKNSFG LKYLHKFFNI PFLQLQRETL
121 LRQLETNQLD MDATLEELSV QQETEDQNYG MYVAGPARAG GVGAAGVAVV QGHGLHQGDS
181 RGECPLFGVN
C.核苷酸及氨基酸组合序列(SEQ ID NO:24)克隆号:PP8875
起始编码子:2347 ATG 终止编码子:2917 TAG 蛋白质分子量:20536.18
1 GTT CCC GCA GGG GTG CTG GGC CCC TGC GGC TCC CAC CAC ATT GCG CTG 48
49 GAC TCT TGT GGC CCG TGC TGA CCT GGT GTT CCA GAT GCT GTC TCT GCA 96
97 GAG CTC TGC GTG GTC TCT GGT GTT AGA GAG GTG GCC ACC CAC CGC CCT 144
145 ATC ATT GTC CTC ATC CCC ACT GTG AGG AGA AGC TAT CAG ATC TGC CTG 192
193 TGG CCC CCA GGT GGC TCA GGA AGG GCC GTC CTG ACC CCC ATC CTG GCC 240
241 CCT TTC GGA GCT GCA GAG ATT TCC TGT GCC TCC AGC TCT GGC TTC CTG 288
289 GGT CTG TCC TTG GCG TGG AGC GGG CAC AGG CTT CCC GTA GAC ACG GTT 336
337 GCC CAG AGT GGG GTT CAT AAC TGG GCA CTG TAA AGG GTG TGG TCT CCA 384
385 CGG CTT AGG ATG GGC CCC CCC TTC CTG GTG GCC TGC TGT GCC CGG GGC 432
433 TGG TGT GGA GGC CTG TGG GGG TGG AGA GGC CGC CCG GCC CTG GGC TTC 480
481 CTC TGG GGT TAC ATG TGT ACC CTT GCA CCC ACC TGT TAG CAC CCA CCG 528
529 GGA GAG TCT CAC TCA GCC TAA ACC AGG GCC CCT CAG GAG GAA AAG GTC 576
577 CCC AGC TTC ATG ATG GGG CCC AGT GTG CCT TCC ATC CCC GCC CTG ACT 624
625 CAG TGC CCA CTG TGC GAG GTG TGA GCA CTG TCC ACA GCA GCC AGG GCG 672
673 GCC GGT GGG GAG TGC ATT GGA GGG GGT TGA GGT CTC TTG GGC ACC TGG 720
721 TGA GTT CTC AAG GGT GAG AGG AAG CCG AGG CCA TCA GGC TTA GCT GAC 768
769 GCT GCA TGG GGC AGG CTG CCA AGA GGG AGG CTG AAT GGA GCA GCC TCA 816
817 GGT GAG CCG ACA ATC CTC ACC TCC GCC TGG TCA GCC AGG ACC CGG CTC 864
865 CCC TCC AGT CCC GCC TGC TTT CCC CAA AGC AGA TCC AGC CAG TCT CAA 912
913 TGG CTC GCC CGG GGG GTG CTG GTT AGG CTG TGA GCA TCC TTC CTG GGT 960
961 GCA GGC CCC CGA CAG CCA GCA GTG CTG TGC TGT GTG TGT GTT GGG GAC 1008
1009 TCT GCT GAG CCC TTT GTG GCC AGA CTG GGG AGG CTC CTC CGG GCT GGC 1056
1057 TCT GTC CCC TGT ACC TTG TGA GGG AGG GGC TGA CCC CCT GAC TGG GTT 1104
1105 ACA TCG TGG TGA GCA GTT CAG AAA CAA GCT GTG GAA TGA AGT GGA CGT 1152
1153 GGC GTT TTA AAC ACA TGA GCC CCA TCT GTT CTT AGG GGT TTT GTT TGT 1200
1201 TGT CCC AGT CCG TGA CTC CAA GAC TGG GAC CCC CAG AGT TCC CAG GAT 1248
1249 GGT CTG GAG CCT TTA TCC TCA GGT CAG CAT TGT GGA GTT AAA GGG AGG 1296
1297 GGA CCA CGG CCC CTC ATT CTC AGG AGA GCC ATG GTG ACC TTG ATG GCG 1344
1345 GAG GCT CAG GGG GAC CTG GAC CGT GGA CAC CAC ACA GCT GCC CTC CTC 1392
1393 CCT CCC GAG GCC ATT TCA GGG CTG GAA TCC CTG CCC CCC TCT CCT TTC 1440
1441 CTC CCG GGC TGG TTG TTG CCT TGA GAG TCC GTG CGC TCA TCT CCC CAC 1488
1489 TTT TAC CCC AGG GGG AGG CCC CTC ACC TTC CCA CCA TAT CCC TTG TAC 1536
1537 TTC CTC CCA CCC TGG ACT TGG GGG AGC TGG GGG GAG GGG GCC CTT CCT 1584
1585 TCA GCA GCA AAC CCT CCT GGT GTA GGG CTG TAG GCC ATC CCA CCG CAG 1632
1633 CCT GTC CAG GAG CTG CTG AGC CTG TCA GCC CCA ACT AGC ACC TCC TGT 1680
1681 CCA GGC CCG GCC CAG CCC TGC CTC CAG AGC CTA CAG AGG GGC CTC GCC 1728
1729 CAG GTC CTG CTG CTC CAG AGC TTG TGG GTG CCC ACG CTG CAG GCT GTT 1776
1777 TGG GGT GGT GGA GTA GAG CAC CCG CTG GAG CTG GGG GCT GAG TGG CCA 1824
1825 TGG GGG GAC CAT GCT CCT CCT ATG GCC CAA GGC CCA GGG GTT CCA CCT 1872
1873 CGT AAT TTT TGT TTG TTT TTA AAT AAG GAA AAT GCA AAA AGC GAG GCG 1920
1921 ACG GCT TAA AGA TGG AGA ACG ACC CCC AGG AGG CGG AGT CTG AAA TGG 1968
1969 CCC TGG ATG CTG AGT TCC TGG ACG TGT ACA AGA ACT GCA ACG GGG TGG 2016
2017 TCA TGA TGT TCG ACA TTA CCA AGC AGT GGA CCT TCA ATT ACA TTC TCC 2064
2065 GGG AGC TTC CAA AAG TGC CCA CCC ACG TGC CAG TGT GCG TGC TGG GGA 2112
2113 ACT ACC GGG ACA TGG GCG AGC ACC GAG TCA TCC TGC CGG ACG ACG TGC 2160
2161 GTG ACT TCA TCG ACA ACC TGG ACA GGT GGG TGC GGT GGC CCT GCT CCC 2208
2209 GAG GGA CCC TGC CCG GTG CTC CGG TGT GCG GGG GAG GGT GCT GAG GCA 2256
2257 GAG GCC CAG GGA GGG GTT AAC GTT AGC ATG GGG CCC GGC GGA TGT GGG 2304
2305 TCT CGC CGC TGA GTG GGG CTC ACT GAA GCC TGG GTC TCC CCG ATG GCA 2352
1 Met Ala 2
2353 GGG CCG GGA ACT GTG TGC TGG GGA ACT GTG TGC CAG GGT GAA GTG CTG 2400
3 Gly Pro Gly Thr Val Cys Trp Gly Thr Val Cys Gln Gly Glu Val Leu 18
2401 GCA CTG TGG GGT CAC CTG CAG AAG GGC ACT CGG CTT AGC TGC TTA GCA 2448
19 Ala Leu Trp Gly His Leu Gln Lys Gly Thr Arg Leu Ser Cys Leu Ala 34
2449 GGG CTC AGC AGG GTC CTG TGG CCT CAG GAG CCT GCA GGA GGA GGG AGG 2496
35 Gly Leu Ser Arg Val Leu Trp Pro Gln Glu Pro Ala Gly Gly Gly Arg 50
2497 GCA GTG CGG ACC CAC AGC TGT GGG CCC AGG GGT GAT CCT TGG CAC CAG 2544
51 Ala Val Arg Thr His Ser Cys Gly Pro Arg Gly Asp Pro Trp His Gln 66
2545 GGC AAG GGT CTT TCT CTT GCA TCT TTT TTC CTT TCT GAA AGC AGA CCT 2592
67 Gly Lys Gly Leu Ser Leu Ala Ser Phe Phe Leu Ser Glu Ser Arg Pro 82
2593 CCA GGT TCC TCC TAC TTC CGC TAT GCT GAG TCT TCC ATG AAG AAC AGC 2640
83 Pro Gly Ser Ser Tyr Phe Arg Tyr Ala Glu Ser Ser Met Lys Asn Ser 98
2641 TTC GGC CTA AAG TAC CTT CAT AAG TTC TTC AAT ATC CCA TTT TTG CAG 2688
99 Phe Gly Leu Lys Tyr Leu His Lys Phe Phe Asn Ile Pro Phe Leu Gln 114
2689 CTT CAG AGG GAG ACG CTG TTG CGG CAG CTG GAG ACG AAC CAG CTG GAC 2736
115 Leu Gln Arg Glu Thr Leu Leu Arg Gln Leu Glu Thr Asn Gln Leu Asp 130
2737 ATG GAC GCC ACG CTG GAG GAG CTG TCG GTG CAG CAG GAG ACG GAG GAC 2784
131 Met Asp Ala Thr Leu Glu Glu Leu Ser Val Gln Gln Glu Thr Glu Asp 146
2785 CAG AAC TAC GGC ATG TAT GTG GCG GGA CCC GCC CGT GCG GGC GGT GTG 2832
147 Gln Asn Tyr Gly Met Tyr Val Ala Gly Pro Ala Arg Ala Gly Gly Val 162
2833 GGG GCT GCG GGC GTG GCC GTG GTG CAG GGC CAT GGG CTG CAC CAA GGA 2880
163 Gly Ala Ala Gly Val Ala Val Val Gln Gly His Gly Leu His Gln Gly 178
2881 GAC AGC AGA GGG GAG TGT CCC CTG TTT GGG GTA AAT TAG TCA CCT TTG 2928
179 Asp Ser Arg Gly Glu Cys Pro Leu Phe Gly Val Asn *** 191
2929 GGC ACG GGT GGA GGA GGA CTC AGG TTT GCA CTG CCC CCA GCA GCC CCC 2976
2977 CCA CAG TCA CCC CTG GCG TGG ACT CCT CAT ACA GGT CAT GCT GTG CCT 3024
3025 GCC ACT CTG AGT ACC GCT GAC CGT GGC CAG GTG CTG GTG CTC ATG GAG 3072
3073 TGC TGC TGG GGC TGC CTG CCC ATC AGG GGC TTG GCC TCC CAG ATT GAT 3120
3121 GCC AGC ATG GGG TGT GCT TTC TGG GGA GCT GCT TGA CTT TGG GAA GCT 3168
3169 CCC TGT GTT GAA GAG GCA TAC AGG CCA GGA CAT GGA GGT CTC TGG TCC 3216
3217 TCG ACA GCA GAG GGA GGC TCA GAG CAT CCT CCT GAG TGG GCC TGG GCA 3264
3265 GTG CAT AGC CCC GGG GTT GCG GCC AGT GGG ACA GCT GGC CCG TTC TCT 3312
3313 GCC TCA GGC TCC TGT ACA GCT AGG GGC TTG GTG CCT CCC CTG GGA CCC 3360
3361 AGG CAG GGA CCA CGG AAT CAG TGG CCC TCC TGA GGC CCC CCA GGA GGT 3408
3409 CTC TGT TTC CAG AAG GAG AGC CCT GTG GGT CAC CTT GGA TCT GGC TGT 3456
3457 TGG CTC AGA CAC AGC AAG AGA CCG AGA GGG AAG GCA GTT TGA TGC CTG 3504
3505 GAG AGG GAC CCG TGG CTT CCA GCT GCC AGG CCA GCC CCA GAA TGG AGC 3552
3553 CCC CCG CAT GGG CGC TTC TCT GTT GAA CCA ATC CTG GCA TTT CCT GGG 3600
3601 CCT GAG AGT TGG GTC AAG CTG AAT GCT GCG ATG GCC GCA CGT GCT CCA 3648
3649 CCA AGC CCC AGC CCC CTC CTC TTC CCA GAA ACC CCC GCT CAC GGG AAG 3696
3697 GTC CAG TTG CTT GCC ATC TGG CCA CCT CTG CAT GGA GCC CCC AAC AGC 3744
3745 TGT GCC TCA GAA CAG ATC CGA AGT GAC TTT CAG GGG AGC TGG ACA CAT 3792
3793 GTA CGC TGG TGC CTG CTG TCC CCA CCC TTT GGC ACT GCT GCT CTT TCT 3840
3841 TTT TCT GAG ATG GAG TCT CGC TCT GTC GCC CAG GCT GGA GCG CAG TGG 3888
3889 TGT GAT CTC GGC TCA CCG CAA GCT CCG CCT CCC GGG TTC ACG CCA TTC 3936
3937 TCC TGC CTC AGC CTC CCA GCT ACT GGG GAG GCT GAG GCA GGG GAA TTG 3984
3985 CTT GAA CCC GGG AGG CAG AGG TTA TCG TGA GCT GAC ATT GCG CCA CTG 4032
4033 CAC TCC AGC GCG GAA GAC AGA GTG AGC AAA AAA AAA AAA AAA AAA AGA 4080
4081 AAA AGT GAC CAA AAA AAA AAA AAA AAA AA 4109
9.PP8997
A:核苷酸序列(SEQ ID NO:25)长度:3191
1 GCGGACCCCT CGTCCCTCCG CAGTCTCCGG CTGGCAGCGA TGGAGGGCGC TGGGGAGAAC
61 GCCCCGGAGT CCAGCTCCTC TGCCCCTGGG TCCGAAGAGT CTGCCAGGGA TCCACAGGTG
121 CCCCCTCCGG AGGAAGAATC GGGGGACTGC GCCCGGTCCC TGGAGGCGGT CCCCAAGAAA
181 CTCTGTGGGT ATTTAAGTAA GTTCGGCGGC AAAGGGCCCA TCCGGGGCTG GAAATCCCGC
241 TGGTTCTTCT ACGACGAAAG GAAATGTCAG CTGTATTACT CGCGGACCGC TCAGGATGCC
301 AATCCCTTGG ACAGCATCGA CCTCTCCAGT GCAGTGTTTG ACTGTAAGGC GGACGCTGAG
361 GAGGGGATCT TCGAAATCAA GACTCCCAGC CGGGTTATTA CCCTGAAGGC CGCCACCAAG
421 CAAGCGATGC TGTACTGGCT GCAGCAGCTG CAGATGAAGC GCTGGGAATT CCACAACAGC
481 CCGCCGGCAC CTCCTGCCAC CCCTGATGCC GCCCTGGCTG GGAATGGGCC CGTCCTGCAC
541 CTCGAGCTAG GGCAAGAAGA GGCAGAGCTG GAGGAGTTCC TGTGCCCTGT GAAAACACCC
601 CCTGGGCTAG TGGGCGTGGC AGCTGCCTTG CAGCCCTTCC CTGCCCTTCA GAATATTTCC
661 CTCAAGCACC TGGGGACTGA AATACAGAAC ACAATGCACA ACATCCGTGG CAACAAGCAG
721 GCCCAGGGAA CAGGCCATGA ACCTCCAGGG GAAGATTCTC CACAGAGTGG GGAGCCTCAG
781 AGGGAGGAGC AGCCCTTGGC CTCTGACGCC AGCACCCCAG GGAGAGAGCC AGAGGATTCT
841 CCAAAGCCTG CACCCAAGCC TTCTCTGACC ATCAGTTTCG CTCAGAAAGC CAAGCGCCAG
901 AACAACACCT TCCCATTCTT TTCTGAAGGA ATCACACGGA ACCGAACTGC CCAGGAGAAA
961 GTGGCAGCCT TGGAGCAACA GGTTCTGATG CTCACCAAGG AGTTAAAGTC TCAGAAGGAG
1021 CTAGTGAAGA TCCTGCACAA GGCACTGGAG GCCGCCCAGC AGGAGAAGCG GGCGTCCAGC
1081 GCATACCTGG CGGCGGCTGA GGACAAGGAC CGGCTGGAGC TGGTGCGGCA CAAAGTGCGG
1141 CAGATCGCGG AGCTGGGCCG GCGGGTGGAG GCCCTGGAGC AGGAGCGGGA GAGCCTGGCG
1201 CACACAGCGA GCCTGCGGGA GCAGCAGGTG CAGGAGCTAC AGCAGCACGT GCAGCTGCTT
1261 ATGGACAAGA ACCACGCCAA GCAGCAGGTC ATCTGCAAGC TCTCTGAGAA GGTCACCCAG
1321 GACTTCACGC ACCCCCCTGA CCAGTCTCCT TTGCGCCCCG ACGCTGCCAA CAGGGACTTC
1381 CTGAGCCAGC AGGGGAAGAT AGAGCACCTG AAGGATGACA TGGAAGCTTA CCGGACCCAG
1441 AACTGCTTCC TCAACTCCGA GATCCACCAG GTCACAAAGA TCTGGAGAAA GGTGGCTGAG
1501 AAGGAGAAGG CCCTTCTGAC GAAGTGCGCC TACCTCCAAG CCAGAAACTG CCAGGTGGAA
1561 AGCAAGTACC TGGCCGGTCT GAGAAGGCTG CAGGAGGCCC TGGGGGACGA AGCCAGCGAG
1621 TGCTCAGAGC TGCTGAGGCA GCTTGTCCAG GAGGCACTGC AGTGGGAAGC TGGGGAGGCC
1681 TCATCTGACA GCATCGAGCT GAGCCCCATC AGTAAGTATG ATGAGTACGG CTTCCTGACG
1741 GTGCCCGACT ATGAGGTGGA AGACCTGAAG CTGCTGGCCA AGATCCAGGC GTTGGAGTCA
1801 CGATCCCACC ACCTGCTGGG CCTCGAGGCT GTGGATCGGC CGCTGAGGGA GCGCTGGGCT
1861 GCCCTGGGCG ATCTTGTGCC CTCAGCCGAG CTCAAGCAGC TACTGCGGGC AGGAGTACCC
1921 CGTGAACACC GGCCTCGTGT CTGGAGGTGG CTGGTCCACC TCCGTGTCCA GCACCTGCAC
1981 ACTCCAGGCT GCTACCAGGA ACTGCTGAGC CGGGGCCAGG CCCGCGAGCA CCCTGCTGCC
2041 CGCCAGATTG AGCTGGACCT GAACCGGACC TTCCCCAACA ACAAACACTT CACCTGCCCC
2101 ACCTCCAGCT TCCCCGACAA GCTCCGCCGG GTGCTGCTGG CCTTCTCCTG GCAGAACCCC
2161 ACCATCGGCT ACTGCCAGGG CCTGAACAGG CTGGCGGCCA TTGCCCTGCT GGTCCTAGAG
2221 GAGGAGGAGA GCGCCTTCTG GTGCCTGGTG GCCATTGTGG AGACCATCAT GCCCGCTGAT
2281 TACTACTGCA ACACGCTGAC GGCATCCCAG GTGGACCAGC GGGTGCTCCA GGACCTGCTC
2341 TCGGAGAAGC TGCCCAGGCT GATGGCCCAT CTGGGGCAGC ACCACGTGGA TCTCTCCCTC
2401 GTCACCTTCA ACTGGTTCCT CGTGGTCTTT GCGGACAGTC TCATTAGCAA CATCCTCCTT
2461 CGGGTCTGGG ATGCCTTCCT GTACGAGGGG ACGAAGGTGG TGTTTCGCTA TGCCTTGGCC
2521 ATTTTCAAGT ACAACGAGAA GGAGATCTTG AGGCTACACA ATGGCCTGGA AATCTACCAG
2581 TACCTGCGCT TCTTCACCAA GACCATCTCC AACAGCCGCT GATGAACATC GCCTTCAATG
2641 ACATGAACCC CTTCCGCATG AAACAGCTGC GGCAGCTGCG CATGGTCCAC CGGGAGCGGC
2701 TGGAGGCTGA GCTGCGGGAG CTGGAGCAGC TTAAGGCAGA GTACCTGGAG AGGCGGGCAT
2761 CCCGGCGCAG AGCTGTGTCC GAGGGCTGTG CCAGCGAGGA CGAGGTGGAG GGGGAAGCCT
2821 GACTTGGCCA CCTCCCCTCC CCACAGCCTT CCTCACCCTT GGCTGGCAGA CCCACTGGAG
2881 GTCAGGCACG GACCAGTGGC CCAGCCCTGG GTGTCCCATC ACCATGTGAC CTTGGACATG
2941 TCCCTTCCCC TCTCTGGCCC TCAGTTTCCC CACTGGGACA TTGTGTGCTG CAAAGCCATT
3001 GGTTGGGCTA CTTCTTCATA GGCACTTACT TACCCAGGGA TGCCACCCTT TCGTCACCTC
3061 TTCCACAGAG CACTTTGGCA TGTAAACAAG CAAGAGCACT GCCTCTATAG GGTAACCTGG
3121 AACATTCTCT AGGTTATATC AATATAAAAC AATGTAAATG GTGGAAATCA TTCAAAAAAA
3181 AAAAAAAAAA A
B:氨基酸序列(SEQ ID NO:26)长度:860
1 MEGAGENAPE SSSSAPGSEE SARDPQVPPP EEESGDCARS LEAVPKKLCG YLSKFGGKGP
61 IRGWKSRWFF YDERKCQLYY SRTAQDANPL DSIDLSSAVF DCKADAEEGI FEIKTPSRVI
121 TLKAATKQAM LYWLQQLQMK RWEFHNSPPA PPATPDAALA GNGPVLHLEL GQEEAELEEF
181 LCPVKTPPGL VGVAAALQPF PALQNISLKH LGTEIQNTMH NIRGNKQAQG TGHEPPGEDS
241 PQSGEPQREE QPLASDASTP GREPEDSPKP APKPSLTISF AQKAKRQNNT FPFFSEGITR
301 NRTAQEKVAA LEQQVLMLTK ELKSQKELVK ILHKALEAAQ QEKRASSAYL AAAEDKDRLE
361 LVRHKVRQIA ELGRRVEALE QERESLAHTA SLREQQVQEL QQHVQLLMDK NHAKQQVICK
421 LSEKVTQDFT HPPDQSPLRP DAANRDFLSQ QGKIEHLKDD MEAYRTQNCF LNSEIHQVTK
481 IWRKVAEKEK ALLTKCAYLQ ARNCQVESKY LAGLRRLQEA LGDEASECSE LLRQLVQEAL
541 QWEAGEASSD SIELSPISKY DEYGFLTVPD YEVEDLKLLA KIQALESRSH HLLGLEAVDR
601 PLRERWAALG DLVPSAELKQ LLRAGVPREH RPRVWRWLVH LRVQHLHTPG CYQELLSRGQ
661 AREHPAARQI ELDLNRTFPN NKHFTCPTSS FPDKLRRVLL AFSWQNPTIG YCQGLNRLAA
721 IALLVLEEEE SAFWCLVAIV ETIMPADYYC NTLTASQVDQ RVLQDLLSEK LPRLMAHLGQ
781 HHVDLSLVTF NWFLVVFADS LISNILLRVW DAFLYEGTKV VFRYALAIFK YNEKEILRLH
841 NGLEIYQYLR FFTKTISNSR
C.核苷酸及氨基酸组合序列(SEQ ID NO:27)克隆号:PP8997
起始编码子:40 ATG 终止编码子:2620 TGA 蛋白质分子量:97300.38
1 GCG GAC CCC TCG TCC CTC CGC AGT CTC CGG CTG GCA GCG ATG GAG GGC 48
1 Met Glu Gly 3
49 GCT GGG GAG AAC GCC CCG GAG TCC AGC TCC TCT GCC CCT GGG TCC GAA 96
4 Ala Gly Glu Asn Ala Pro Glu Ser Ser Ser Ser Ala Pro Gly Ser Glu 19
97 GAG TCT GCC AGG GAT CCA CAG GTG CCG CCT CCG GAG GAA GAA TCG GGG 144
20 Glu Ser Ala Arg Asp Pro Gln Val Pro Pro Pro Glu Glu Glu Ser Gly 35
145 GAC TGC GCC CGG TCC CTG GAG GCG GTC CCC AAG AAA CTC TGT GGG TAT 192
36 Asp Cys Ala Arg Ser Leu Glu Ala Val Pro Lys Lys Leu Cys Gly Tyr 51
193 TTA AGT AAG TTC GGC GGC AAA GGG CCC ATC CGG GGC TGG AAA TCC CGC 240
52 Leu Ser Lys Phe Gly Gly Lys Gly Pro Ile Arg Gly Trp Lys Ser Arg 67
241 TGG TTC TTC TAC GAC GAA AGG AAA TGT CAG CTG TAT TAC TCG CGG ACC 288
68 Trp Phe Phe Tyr Asp Glu Arg Lys Cys Gln Leu Tyr Tyr Ser Arg Thr 83
289 GCT CAG GAT GCC AAT CCC TTG GAC AGC ATC GAC CTC TCC AGT GCA GTG 336
84 Ala Gln Asp Ala Asn Pro Leu Asp Ser Ile Asp Leu Ser Ser Ala Val 99
337 TTT GAC TGT AAG GCG GAC GCT GAG GAG GGG ATC TTC GAA ATC AAG ACT 384
100 Phe Asp Cys Lys Ala Asp Ala Glu Glu Gly Ile Phe Glu Ile Lys Thr 115
385 CCC AGC CGG GTT ATT ACC CTG AAG GCC GCC ACC AAG CAA GCG ATG CTG 432
116 Pro Ser Arg Val Ile Thr Leu Lys Ala Ala Thr Lys Gln Ala Met Leu 131
433 TAC TGG CTG CAG CAG CTG CAG ATG AAG CGC TGG GAA TTC CAC AAC AGC 480
132 Tyr Trp Leu Gln Gln Leu Gln Met Lys Arg Trp Glu Phe His Asn Ser 147
481 CCG CCG GCA CCT CCT GCC ACC CCT GAT GCC GCC CTG GCT GGG AAT GGG 528
148 Pro Pro Ala Pro Pro Ala Thr Pro Asp Ala Ala Leu Ala Gly Asn Gly 163
529 CCC GTC CTG CAC CTC GAG CTA GGG CAA GAA GAG GCA GAG CTG GAG GAG 576
164 Pro Val Leu His Leu Glu Leu Gly Gln Glu Glu Ala Glu Leu Glu Glu 179
577 TTC CTG TGC CCT GTG AAA ACA CCC CCT GGG CTA GTG GGC GTG GCA GCT 624
180 Phe Leu Cys Pro Val Lys Thr Pro Pro Gly Leu Val Gly Val Ala Ala 195
625 GCC TTG CAG CCC TTC CCT GCC CTT CAG AAT ATT TCC CTC AAG CAC CTG 672
196 Ala Leu Gln Pro Phe Pro Ala Leu Gln Asn Ile Ser Leu Lys His Leu 211
673 GGG ACT GAA ATA CAG AAC ACA ATG CAC AAC ATC CGT GGC AAC AAG CAG 720
212 Gly Thr Glu Ile Gln Asn Thr Met His Asn Ile Arg Gly Asn Lys Gln 227
721 GCC CAG GGA ACA GGC CAT GAA CCT CCA GGG GAA GAT TCT CCA CAG AGT 768
228 Ala Gln Gly Thr Gly His Glu Pro Pro Gly Glu Asp Ser Pro Gln Ser 243
769 GGG GAG CCT CAG AGG GAG GAG CAG CCC TTG GCC TCT GAC GCC AGC ACC 816
244 Gly Glu Pro Gln Arg Glu Glu Gln Pro Leu Ala Ser Asp Ala Ser Thr 259
817 CCA GGG AGA GAG CCA GAG GAT TCT CCA AAG CCT GCA CCC AAG CCT TCT 864
260 Pro Gly Arg Glu Pro Glu Asp Ser Pro Lys Pro Ala Pro Lys Pro Ser 275
865 CTG ACC ATC AGT TTC GCT CAG AAA GCC AAG CGC CAG AAC AAC ACC TTC 912
276 Leu Thr Ile Ser Phe Ala Gln Lys Ala Lys Arg Gln Asn Asn Thr Phe 291
913 CCA TTC TTT TCT GAA GGA ATC ACA CGG AAC CGA ACT GCC CAG GAG AAA 960
292 Pro Phe Phe Ser Glu Gly Ile Thr Arg Asn Arg Thr Ala Gln Glu Lys 307
961 GTG GCA GCC TTG GAG CAA CAG GTT CTG ATG CTC ACC AAG GAG TTA AAG 1008
308 Val Ala Ala Leu Glu Gln Gln Val Leu Met Leu Thr Lys Glu Leu Lys 323
1009 TCT CAG AAG GAG CTA GTG AAG ATC CTG CAC AAG GCA CTG GAG GCC GCC 1056
324 Ser Gln Lys Glu Leu Val Lys Ile Leu His Lys Ala Leu Glu Ala Ala 339
1057 CAG CAG GAG AAG CGG GCG TCC AGC GCA TAC CTG GCG GCG GCT GAG GAC 1104
340 Gln Gln Glu Lys Arg Ala Ser Ser Ala Tyr Leu Ala Ala Ala Glu Asp 355
1105 AAG GAC CGG CTG GAG CTG GTG CGG CAC AAA GTG CGG CAG ATC GCG GAG 1152
356 Lys Asp Arg Leu Glu Leu Val Arg His Lys Val Arg Gln Ile Ala Glu 371
1153 CTG GGC CGG CGG GTG GAG GCC CTG GAG CAG GAG CGG GAG AGC CTG GCG 1200
372 Leu Gly Arg Arg Val Glu Ala Leu Glu Gln Glu Arg Glu Ser Leu Ala 387
1201 CAC ACA GCG AGC CTG CGG GAG CAG CAG GTG CAG GAG CTA CAG CAG CAC 1248
388 His Thr Ala Ser Leu Arg Glu Gln Gln Val Gln Glu Leu Gln Gln His 403
1249 GTG CAG CTG CTT ATG GAC AAG AAC CAC GCC AAG CAG CAG GTC ATC TGC 1296
404 Val Gln Leu Leu Met Asp Lys Asn His Ala Lys Gln Gln Val Ile Cys 419
1297 AAG CTC TCT GAG AAG GTC ACC CAG GAC TTC ACG CAC CCC CCT GAC CAG 1344
420 Lys Leu Ser Glu Lys Val Thr Gln Asp Phe Thr His Pro Pro Asp Gln 435
1345 TCT CCT TTG CGC CCC GAC GCT GCC AAC AGG GAC TTC CTG AGC CAG CAG 1392
436 Ser Pro Leu Arg Pro Asp Ala Ala Asn Arg Asp Phe Leu Ser Gln Gln 451
1393 GGG AAG ATA GAG CAC CTG AAG GAT GAC ATG GAA GCT TAC CGG ACC CAG 1440
452 Gly Lys Ile Glu His Leu Lys Asp Asp Met Glu Ala Tyr Arg Thr Gln 467
1441 AAC TGC TTC CTC AAC TCC GAG ATC CAC CAG GTC ACA AAG ATC TGG AGA 1488
468 Asn Cys Phe Leu Asn Ser Glu Ile His Gln Val Thr Lys Ile Trp Arg 483
1489 AAG GTG GCT GAG AAG GAG AAG GCC CTT CTG ACG AAG TGC GCC TAC CTC 1536
484 Lys Val Ala Glu Lys Glu Lys Ala Leu Leu Thr Lys Cys Ala Tyr Leu 499
1537 CAA GCC AGA AAC TGC CAG GTG GAA AGC AAG TAC CTG GCC GGT CTG AGA 1584
500 Gln Ala Arg Asn Cys Gln Val Glu Ser Lys Tyr Leu Ala Gly Leu Arg 515
1585 AGG CTG CAG GAG GCC CTG GGG GAC GAA GCC AGC GAG TGC TCA GAG CTG 1632
516 Arg Leu Gln Glu Ala Leu Gly Asp Glu Ala Ser Glu Cys Ser Glu Leu 531
1633 CTG AGG CAG CTT GTC CAG GAG GCA CTG CAG TGG GAA GCT GGG GAG GCC 1680
532 Leu Arg Gln Leu Val Gln Glu Ala Leu Gln Trp Glu Ala Gly Glu Ala 547
1681 TCA TCT GAC AGC ATC GAG CTG AGC CCC ATC AGT AAG TAT GAT GAG TAC 1728
548 Ser Ser Asp Ser Ile Glu Leu Ser Pro Ile Ser Lys Tyr Asp Glu Tyr 563
1729 GGC TTC CTG ACG GTG CCC GAC TAT GAG GTG GAA GAC CTG AAG CTG CTG 1776
564 Gly Phe Leu Thr Val Pro Asp Tyr Glu Val Glu Asp Leu Lys Leu Leu 579
1777 GCC AAG ATC CAG GCG TTG GAG TCA CGA TCC CAC CAC CTG CTG GGC CTC 1824
580 Ala Lys Ile Gln Ala Leu Glu Ser Arg Ser His His Leu Leu Gly Leu 595
1825 GAG GCT GTG GAT CGG CCG CTG AGG GAG CGC TGG GCT GCC CTG GGC GAT 1872
596 Glu Ala Val Asp Arg Pro Leu Arg Glu Arg Trp Ala Ala Leu Gly Asp 611
1873 CTT GTG CCC TCA GCC GAG CTC AAG CAG CTA CTG CGG GCA GGA GTA CCC 1920
612 Leu Val Pro Ser Ala Glu Leu Lys Gln Leu Leu Arg Ala Gly Val Pro 627
1921 CGT GAA CAC CGG CCT CGT GTC TGG AGG TGG CTG GTC CAC CTC CGT GTC 1968
628 Arg Glu His Arg Pro Arg Val Trp Arg Trp Leu Val His Leu Arg Val 643
1969 CAG CAC CTG CAC ACT CCA GGC TGC TAC CAG GAA CTG CTG AGC CGG GGC 2016
644 Gln His Leu His Thr Pro Gly Cys Tyr Gln Glu Leu Leu Ser Arg Gly 659
2017 CAG GCC CGC GAG CAC CCT GCT GCC CGC CAG ATT GAG CTG GAC CTG AAC 2064
660 Gln Ala Arg Glu His Pro Ala Ala Arg Gln Ile Glu Leu Asp Leu Asn 675
2065 CGG ACC TTC CCC AAC AAC AAA CAC TTC ACC TGC CCC ACC TCC AGC TTC 2112
676 Arg Thr Phe Pro Asn Asn Lys His Phe Thr Cys Pro Thr Ser Ser Phe 691
2113 CCC GAC AAG CTC CGC CGG GTG CTG CTG GCC TTC TCC TGG CAG AAC CCC 2160
692 Pro Asp Lys Leu Arg Arg Val Leu Leu Ala Phe Ser Trp Gln Asn Pro 707
2161 ACC ATC GGC TAC TGC CAG GGC CTG AAC AGG CTG GCG GCC ATT GCC CTG 2208
708 Thr Ile Gly Tyr Cys Gln Gly Leu Asn Arg Leu Ala Ala Ile Ala Leu 723
2209 CTG GTC CTA GAG GAG GAG GAG AGC GCC TTC TGG TGC CTG GTG GCC ATT 2256
724 Leu Val Leu Glu Glu Glu Glu Ser Ala Phe Trp Cys Leu Val Ala Ile 739
2257 GTG GAG ACC ATC ATG CCC GCT GAT TAC TAC TGC AAC ACG CTG ACG GCA 2304
740 Val Glu Thr Ile Met Pro Ala Asp Tyr Tyr Cys Asn Thr Leu Thr Ala 755
2305 TCC CAG GTG GAC CAG CGG GTG CTC CAG GAC CTG CTC TCG GAG AAG CTG 2352
756 Ser Gln Val Asp Gln Arg Val Leu Gln Asp Leu Leu Ser Glu Lys Leu 771
2353 CCC AGG CTG ATG GCC CAT CTG GGG CAG CAC CAC GTG GAT CTC TCC CTC 2400
772 Pro Arg Leu Met Ala His Leu Gly Gln His His Val Asp Leu Ser Leu 787
2401 GTC ACC TTC AAC TGG TTC CTC GTG GTC TTT GCG GAC AGT CTC ATT AGC 2448
788 Val Thr Phe Asn Trp Phe Leu Val Val Phe Ala Asp Ser Leu Ile Ser 803
2449 AAC ATC CTC CTT CGG GTC TGG GAT GCC TTC CTG TAC GAG GGG ACG AAG 2496
804 Asn Ile Leu Leu Arg Val Trp Asp Ala Phe Leu Tyr Glu Gly Thr Lys 819
2497 GTG GTG TTT CGC TAT GCC TTG GCC ATT TTC AAG TAC AAC GAG AAG GAG 2544
820 Val Val Phe Arg Tyr Ala Leu Ala Ile Phe Lys Tyr Asn Glu Lys Glu 835
2545 ATC TTG AGG CTA CAC AAT GGC CTG GAA ATC TAC CAG TAC CTG CGC TTC 2592
836 Ile Leu Arg Leu His Asn Gly Leu Glu Ile Tyr Gln Tyr Leu Arg Phe 851
2593 TTC ACC AAG ACC ATC TCC AAC AGC CGC TGA TGA ACA TCG CCT TCA ATG 2640
852 Phe Thr Lys Thr Ile Ser Asn Ser Arg *** 861
2641 ACA TGA ACC CCT TCC GCA TGA AAC AGC TGC GGC AGC TGC GCA TGG TCC 2688
2689 ACC GGG AGC GGC TGG AGG CTG AGC TGC GGG AGC TGG AGC AGC TTA AGG 2736
2737 CAG AGT ACC TGG AGA GGC GGG CAT CCC GGC GCA GAG CTG TGT CCG AGG 2784
2785 GCT GTG CCA GCG AGG ACG AGG TGG AGG GGG AAG CCT GAC TTG GCC ACC 2832
2833 TCC CCT CCC CAC AGC CTT CCT CAC CCT TGG CTG GCA GAC CCA CTG GAG 2880
2881 GTC AGG CAC GGA CCA GTG GCC CAG CCC TGG GTG TCC CAT CAC CAT GTG 2928
2929 ACC TTG GAC ATG TCC CTT CCC CTC TCT GGC CCT CAG TTT CCC CAC TGG 2976
2977 GAC ATT GTG TGC TGC AAA GCC ATT GGT TGG GCT ACT TCT TCA TAG GCA 3024
3025 CTT ACT TAC CCA GGG ATG CCA CCC TTT CGT CAC CTC TTC CAC AGA GCA 3072
3073 CTT TGG CAT GTA AAC AAG CAA GAG CAC TGC CTC TAT AGG GTA ACC TGG 3120
3121 AAC ATT CTC TAG GTT ATA TCA ATA TAA AAC AAT GTA AAT GGT GGA AAT 3168
3169 CAT TCA AAA AAA AAA AAA AAA AA 3191
10.PP9012
A:核苷酸序列(SEQ ID NO:28)长度:524
1 GGTGAGGGTG TGAGGGTCGC GTTCCTGCTG TCTGGACTTT TTCTGTCCCA CTGAGACGCA
61 GCTGTGTGAA ATATGATTTG GCGAGGAAGA TCAACATATA GGCATAGGCC GAGGAGAAGT
121 GTACCACCTC CTGAGCTGAT TGGGCCTATG CTGGAGCCCG GTGATGAGGA GCCTCAGCAA
181 GAGGAACCAC CAACTGAAAG TCGGGATCCT GCACCTGGTC AGGAGAGAGA AGAAGATCAG
241 GGTGCAGCTG AGACTCAAGT GCCTGACCTG GAAGCTGATC TCCAGGAGCT GTCTCAGTCA
301 AAGACTGGGG GTGAATGTGG AAATGGTCCT GATGACCAGG GGAAGATTCT GCCAAAATCA
361 GAACAATTTA AAATGCCAGA AGGAGGTGAC AGGCAACCAC AGGTTTAAAT GAAGACAAGC
421 TGAAACAACA CAAAACTGTT TTTATCTAAG ATATTTGACT TAAAAATATC AAAATAAACT
481 TTTGCAGCTT TCTCCAAAAA AAAAAAAAAA AAAAAAAAAA AAAA
B:氨基酸序列(SEQ ID NO:29)长度:111
1 MIWRGRSTYR HRPRRSVPPP ELIGPMLEPG DEEPQQEEPP TESRDPAPGQ EREEDQGAAE
61 TQVPDLEADL QELSQSKTGG ECGNGPDDQG KILPKSEQFK MPEGGDRQPQ V
C.核苷酸及氨基酸组合序列(SEQ ID NO:30)克隆号:PP9012
起始编码子:73 ATG 终止编码子:406 TAA 蛋白质分子量:12341.84
1 GGT GAG GGT GTC AGG GTC GCG TTC CTG CTG TCT GGA CTT TTT CTG TCC 48
49 CAC TGA GAC GCA GCT GTG TGA AAT ATG ATT TGG CGA GGA AGA TCA ACA 96
1 Met Ile Trp Arg Gly Arg Ser Thr 8
97 TAT AGG CAT AGG CCG AGG AGA AGT GTA CCA CCT CCT GAG CTG ATT GGG 144
9 Tyr Arg His Arg Pro Arg Arg Ser Val Pro Pro Pro Glu Leu Ile Gly 24
145 CCT ATG CTG GAG CCC GGT GAT GAG GAG CCT CAG CAA GAG GAA CCA CCA 192
25 Pro Met Leu Glu Pro Gly Asp Glu Glu Pro Gln Gln Glu Glu Pro Pro 40
193 ACT GAA AGT CGG GAT CCT GCA CCT GGT CAG GAG AGA GAA GAA GAT CAG 240
41 Thr Glu Ser Arg Asp Pro Ala Pro Gly Gln Glu Arg Glu Glu Asp Gln 56
241 GGT GCA GCT GAG ACT CAA GTG CCT GAC CTG GAA GCT GAT CTC CAG GAG 288
57 Gly Ala Ala Glu Thr Gln Val Pro Asp Leu Glu Ala Asp Leu Gln Glu 72
289 CTG TCT CAG TCA AAG ACT GGG GGT GAA TGT GGA AAT GGT CCT GAT GAC 336
73 Leu Ser Gln Ser Lys Thr Gly Gly Glu Cys Gly Asn Gly Pro Asp Asp 88
337 CAG GGG AAG ATT CTG CCA AAA TCA GAA CAA TTT AAA ATG CCA GAA GGA 384
89 Gln Gly Lys Ile Leu Pro Lys Ser Glu Gln Phe Lys Met Pro Glu Gly 104
385 GGT GAC AGG CAA CCA CAG GTT TAA ATG AAG ACA AGC TGA AAC AAC ACA 432
105 Gly Asp Arg Gln Pro Gln Val *** 112
433 AAA CTG TTT TTA TCT AAG ATA TTT GAC TTA AAA ATA TCA AAA TAA ACT 480
481 TTT GCA GCT TTC TCC AAA AAA AAA AAA AAA AAA AAA AAA AAA AA 524
11.PP9286
A:核苷酸序列(SEQ ID NO:31)长度:2943
1 GCTGAAGGCT GCAAATCTAA GATCAGGGCA ACATAATGAG ACCTTGTCTC TACCAAAAAA
61 AAACTTAAAA ATTAGCCAGG CATGGTGACT GGTGTCTATA GCCCCACCTG CTCAGGAGGC
121 TGAGGTGGGA GGACCACTTG AGCCCAGGAG TGTGAGGATG CAGTGAATGC CATGATCACA
181 CCATACACTC CAGCCTGGGT GACAGAGTAA GGCCCTGTTA AAAAAAAAAA AAAAGCAGAG
241 ACTCTAGTCT TAGACTGCTT GGGCTCAAAT CCCTGTCCCC TACTTACTAA CTTGTGATCT
301 CGGGCAAGTT ACTTAATTCT CAGTGCCTCA GTTTGCTTAT CTGTGAAAGA CATAATGATA
361 CTAGGTACCC ACTTTAAGGT GTTTGGAGAA TTAAGTGTGT TAATTTATGT AGCTTGCTCT
421 GAATGTGCCT GGCACATGGT GAGCTCTCAG TACATATTCA CTGTTATTAT CCTTGGCCTT
481 TGACAATCAA GATTACCACC AGCCCCCTTG GCTGGTGAAG TGAAACCAGT TGACAGTCAC
541 CCCCCACCCC ACCTTTGTCA TACAAGCCTC AAAAGGCTGG AGTCTTGGCT CACTGCAGCT
601 TCAGCCTCTG GAGCTCAAGT GATCCTCCTG CCTCACCCCG CAAGCAGCTG GGAGTACACA
661 CATGTGCCAC CACGCCTGGC TATTTTTATT TTTTGTAGAG ATGGGGTTTC ACCATGCTGC
721 CCAGGCTGGT CTCGAACTCC TCACCTTAGG CAACCCACCC ATCTTGGCCT CCCAAAGTGC
781 TGGGATTACA GGCATGGGCC ACTGCACCCA GCTAACATGT TTGTAACATC TGATTTAAAG
841 TCTTTATCCA GTAAGGTCAG TGTCAGCTTC CTCGGGCGCA GTTTGCATTG ATTGCTTTTT
901 TTCCTCCCGT GTCTGGGCCA TGCTTCTTTG CATGTTTCAG AATTTTGTTA AAAGCTGGAC
961 ATTTTAAGTA ACATAATGTG GCAACTGTGG AAATCATATT CTCCTCCCTC CCCATGGTGG
1021 TTCCTTTTTC TTGTTTAATG TCTTTTCTGA ACTAATTATG TAAAGTTGTG TTCTTTGTCA
1081 TGTGTGGCCA CTATAGTCTC TGCTTGATTA GCTTAGTGGT CCTCTAACCA TTAGATCTCC
1141 TTAATTGCCT GGAACCCGTA AGTCACTCAG CCAAGAGTTT ATAACTGCCT TAGACTTTAC
1201 TTCCTCATTC TGCAGAGGCT CAAGGTAGCC AGTGGTGAGA GCTTAGGGCT TTCTAGATCT
1261 TACCTGAGCA TGCACACAGC ACTGGGCATA AGCACATCCC TATGCATATG AATGGCCTTC
1321 TAGACTCCCA GGAGTACGTC ACAGCCTTTC AAAGCCCCCT GTAGCCATCT CATAGTAACA
1381 GAAAGCAGAT CAGTGGATGC CTGGGTCCAG TAGTAGCGGG ACGGTTGCAC AGGAAGTGAT
1441 GAAAATGTTC TGCAACTTCA CTGCGAGGGA GGTTACACAG GTACATACAT TTGTCACCTC
1501 ACGTTGAACT TTATACTTTA AACACAGTTT ATATATAAAT TATACCTCAA CAAAGCTGAT
1561 GTTTTTAAAG ATGTAGTTTA AAAACGAAAC AAAAAACGTG GTTTGCAGGA GACACCTTGC
1621 TCGTGATCCT CTAAAACACA GGTCTCCACT CAGATACCTG CAGGATGAGG ACAGGGTGGG
1681 CGAGGGAAAG GAGCCAGAGC CCTCCAGGGG TGTGAAGCAG CTTTTCCTGG GTGGGGCTTG
1741 GCGTGCTGCG CTCACTCTCC CTGGAGGAGG AAGTGCCTAA TCCAGTCCTC TGGGTCTGGG
1801 CCCAGGAGAT GGGGCCTTAA AGCCTCTCTT GGTAAAGACT AGCCCTGTGG GAACAAACAG
1861 GACACCCTCT CCTCTGATTC TGTATCTTCT AGGGGCTCCT ACTGTACTTC AGGGATACCT
1921 GACCTGAGTT GCAGTCACAT TAGCTCCTGG AAAGCCAGGA CAGCCCATGT TGAACCCCAC
1981 TTACTACTGC TGAGGACTGT GCGCCCTAAG GGGTTTGGGG CCTCTGCTCT TGCCACTGGC
2041 CTTGGAACAT GTGTGGCAGT TCTTCTGCCT CACCCTCACT CTGGGGCATG GCCCACTCTG
2101 CCAGGGCATC TGACATGTTC TTTGTCCCTG GCTCAGTTTG GGGGCAGCCC AGTGTCCTGC
2161 GCTGTGGGGC TGGCCGTCCT GAATGTCTTG GAGAAGGAGC AGCTCCAGGA TCATGCCACC
2221 AGTGTAGGCA GCTTCCTGAT GCAGCTCCTC GGGCAGCAAA AAATCAAACA TCCCATCGTC
2281 GGGGATGTCA GGGGTGTTGG GCTCTTCATT GGTGTGGATC TGATCAAAGA TGAGGCCACA
2341 AGGACACCAG CAACTGAAGA GGCTGCCTAC TTGGTATCAA GGCTGAAGGA GAACTACGTT
2401 TTGCTGAGCA CTGATGGCCC TGGGAGGAAC ATCCTGAAGT TTAAGCCCCC AATGTGCTTC
2461 AGCCTGGACA ATGCACGGCA GGTGGTGGCA AAGCTGGATG CCATTCTGAC TGACATGGAA
2521 GAGAAGGTGA GAAGTTGTGA AACGCTGAGG CTCCAGCCCT AAGCCAGCCC TGCTCTGCCT
2581 AAGTGTACTC CAGAAGAAAC TCATCTCATC CAAATACACG CTATTGAGAA GGCGAGCCTG
2641 ACCTCCCTCT TACAGATAAA GTCAGCTTTC AGAGGCTCAG GGTGGGGGGG CCTGCCCGAG
2701 GCCATAATGC TACCCACCCC CTCCTCCTAA CCACTGGTCT GTTGGAATAA CCCAGATGTC
2761 TGCATCCCCT CAAGTCAGTC AATTTCCTTT CTGTCCACTG GGGGTGGAAT GGGGTAGGGT
2821 GGGATACTTT AAAGTGCTCC TGCTTAAATA AATTAGACCA GACCAGTGTA TTTCTAAAGA
2881 AAATCCTGAC ATGCACACCC ATTAAAAATA GTACATTTTA CAGTGAAAAA AAAAAAAAAA
2941 AAA
B:氨基酸序列(SEQ ID NO:32)长度:107
1 MQLLGQQKIK HPIVGDVRGV GLFIGVDLIK DEATRTPATE EAAYLVSRLK ENYVLLSTDG
61 PGRNILKFKP PMCFSLDNAR QVVAKLDAIL TDMEEKVRSC ETLRLQP
C.核苷酸及氨基酸组合序列(SEQ ID NO:33)克隆号:PP9286
起始编码子:2239 ATG 终止编码子:2560 TAA 蛋白质分子量:11923.31
1 GCT GAA GGC TGC AAA TCT AAG ATC AGG GCA ACA TAA TGA GAC CTT GTC 48
49 TCT ACC AAA AAA AAA CTT AAA AAT TAG CCA GGC ATG GTG ACT GGT GTC 96
97 TAT AGC CCC ACC TGC TCA GGA GGC TGA GGT GGG AGG ACC ACT TGA GCC 144
145 CAG GAG TGT GAG GAT GCA GTG AAT GCC ATG ATC ACA CCA TAC ACT CCA 192
193 GCC TGG GTG ACA GAG TAA GGC CCT GTT AAA AAA AAA AAA AAA GCA GAG 240
241 ACT CTA GTC TTA GAC TGC TTG GGC TCA AAT CCC TGT CCC CTA CTT ACT 288
289 AAC TTG TGA TCT CGG GCA AGT TAC TTA ATT CTC AGT GCC TCA GTT TGC 336
337 TTA TCT GTG AAA GAC ATA ATG ATA CTA GGT ACC CAC TTT AAG GTG TTT 384
385 GGA GAA TTA AGT GTG TTA ATT TAT GTA GCT TGC TCT GAA TGT GCC TGG 432
433 CAC ATG GTG AGC TCT CAG TAC ATA TTC ACT GTT ATT ATC CTT GGC CTT 480
481 TGA CAA TCA AGA TTA CCA CCA GCC CCC TTG GCT GGT GAA GTG AAA CCA 528
529 GTT GAC AGT CAC CCC CCA CCC CAC CTT TGT CAT ACA AGC CTC AAA AGG 576
577 CTG GAG TCT TGG CTC ACT GCA GCT TCA GCC TCT GGA GCT CAA GTG ATC 624
625 CTC CTG CCT CAC CCC GCA AGC AGC TGG GAG TAC ACA CAT GTG CCA CCA 672
673 CGC CTG GCT ATT TTT ATT TTT TGT AGA GAT GGG GTT TCA CCA TGC TGC 720
721 CCA GGC TGG TCT CGA ACT CCT CAC CTT AGG CAA CCC ACC CAT CTT GGC 768
769 CTC CCA AAG TGC TGG GAT TAC AGG CAT GGG CCA CTG CAC CCA GCT AAC 816
817 ATG TTT GTA ACA TCT GAT TTA AAG TCT TTA TCC AGT AAG GTC AGT GTC 864
865 AGC TTC CTC GGG CGC AGT TTG CAT TGA TTG CTT TTT TTC CTC CCG TGT 912
913 CTG GGC CAT GCT TCT TTG CAT GTT TCA GAA TTT TGT TAA AAG CTG GAC 960
961 ATT TTA AGT AAC ATA ATG TGG CAA CTG TGG AAA TCA TAT TCT CCT CCC 1008
1009 TCC CCA TGG TGG TTC CTT TTT CTT GTT TAA TGT CTT TTC TGA ACT AAT 1056
1057 TAT GTA AAG TTG TGT TCT TTG TCA TGT GTG GCC ACT ATA GTC TCT GCT 1104
1105 TGA TTA GCT TAG TGG TCC TCT AAC CAT TAG ATC TCC TTA ATT GCC TGG 1152
1153 AAC CCG TAA GTC ACT CAG CCA AGA GTT TAT AAC TGC CTT AGA CTT TAC 1200
1201 TTC CTC ATT CTG CAG AGG CTC AAG GTA GCC AGT GGT GAG AGC TTA GGG 1248
1249 CTT TCT AGA TCT TAC CTG AGC ATG CAC ACA GCA CTG GGC ATA AGC ACA 1296
1297 TCC CTA TGC ATA TGA ATG GCC TTC TAG ACT CCC AGG AGT ACG TCA CAG 1344
1345 CCT TTC AAA GCC CCC TGT AGC CAT CTC ATA GTA ACA GAA AGC AGA TCA 1392
1393 GTG GAT GCC TGG GTC CAG TAG TAG CGG GAC GGT TGC ACA GGA AGT GAT 1440
1441 GAA AAT GTT CTG CAA CTT CAC TGC GAG GGA GGT TAC ACA GGT ACA TAC 1488
1489 ATT TGT CAC CTC ACG TTG AAC TTT ATA CTT TAA ACA CAG TTT ATA TAT 1536
1537 AAA TTA TAC CTC AAC AAA GCT GAT GTT TTT AAA GAT GTA GTT TAA AAA 1584
1585 CGA AAC AAA AAA CGT GGT TTG CAG GAG ACA CCT TGC TCG TGA TCC TCT 1632
1633 AAA ACA CAG GTC TCC ACT CAG ATA CCT GCA GGA TGA GGA CAG GGT GGG 1680
1681 CGA GGG AAA GGA GCC AGA GCC CTC CAG GGG TGT GAA GCA GCT TTT CCT 1728
1729 GGG TGG GGC TTG GCG TGC TGC GCT CAC TCT CCC TGG AGG AGG AAG TGC 1776
1777 CTA ATC CAG TCC TCT GGG TCT GGG CCC AGG AGA TGG GGC CTT AAA GCC 1824
1825 TCT CTT GGT AAA GAC TAG CCC TGT GGG AAC AAA CAG GAC ACC CTC TCC 1872
1873 TCT GAT TCT GTA TCT TCT AGG GGC TCC TAC TGT ACT TCA GGG ATA CCT 1920
1921 GAC CTG AGT TGC AGT CAC ATT AGC TCC TGG AAA GCC AGG ACA GCC CAT 1968
1969 GTT GAA CCC CAC TTA CTA CTG CTG AGG ACT GTG CGC CCT AAG GGG TTT 2016
2017 GGG GCC TCT GCT CTT GCC ACT GGC CTT GGA ACA TGT GTG GCA GTT CTT 2064
2065 CTG CCT CAC CCT CAC TCT GGG GCA TGG CCC ACT CTG CCA GGG CAT CTG 2112
2113 ACA TGT TCT TTG TCC CTG GCT CAG TTT GGG GGC AGC CCA GTG TCC TGC 2160
2161 GCT GTG GGG CTG GCC GTC CTG AAT GTC TTG GAG AAG GAG CAG CTC CAG 2208
2209 GAT CAT GCC ACC AGT GTA GGC AGC TTC CTG ATG CAG CTC CTC GGG CAG 2256
1 Met Gln Leu Leu Gly Gln 6
2257 CAA AAA ATC AAA CAT CCC ATC GTC GGG GAT GTC AGG GGT GTT GGG CTC 2304
7 Gln Lys Ile Lys His Pro Ile Val Gly Asp Val Arg Gly Val Gly Leu 22
2305 TTC ATT GGT GTG GAT CTG ATC AAA GAT GAG GCC ACA AGG ACA CCA GCA 2352
23 Phe Ile Gly Val Asp Leu Ile Lys Asp Glu Ala Thr Arg Thr Pro Ala 38
2353 ACT GAA GAG GCT GCC TAC TTG GTA TCA AGG CTG AAG GAG AAC TAC GTT 2400
39 Thr Glu Glu Ala Ala Tyr Leu Val Ser Arg Leu Lys Glu Asn Tyr Val 54
2401 TTG CTG AGC ACT GAT GGC CCT GGG AGG AAC ATC CTG AAG TTT AAG CCC 2448
55 Leu Leu Ser Thr Asp Gly Pro Gly Arg Asn Ile Leu Lys Phe Lys Pro 70
2449 CCA ATG TGC TTC AGC CTG GAC AAT GCA CGG CAG GTG GTG GCA AAG CTG 2496
71 Pro Met Cys Phe Ser Leu Asp Asn Ala Arg Gln Val Val Ala Lys Leu 86
2497 GAT GCC ATT CTG ACT GAC ATG GAA GAG AAG GTG AGA AGT TGT GAA ACG 2544
87 Asp Ala Ile Leu Thr Asp Met Glu Glu Lys Val Arg Ser Cys Glu Thr 102
2545 CTG AGG CTC CAG CCC TAA GCC AGC CCT GCT CTG CCT AAG TGT ACT CCA 2592
103 Leu Arg Leu Gln Pro *** 108
2593 GAA GAA ACT CAT CTC ATC CAA ATA CAC GCT ATT GAG AAG GCG AGC CTG 2640
2641 ACC TCC CTC TTA CAG ATA AAG TCA GCT TTC AGA GGC TCA GGG TGG GGG 2688
2689 GGC CTG CCC GAG GCC ATA ATG CTA CCC ACC CCC TCC TCC TAA CCA CTG 2736
2737 GTC TGT TGG AAT AAC CCA GAT GTC TGC ATC CCC TCA AGT CAG TCA ATT 2784
2785 TCC TTT CTG TCC ACT GGG GGT GGA ATG GGG TAG GGT GGG ATA CTT TAA 2832
2833 AGT GCT CCT GCT TAA ATA AAT TAG ACC AGA CCA GTG TAT TTC TAA AGA 2880
2881 AAA TCC TGA CAT GCA CAC CCA TTA AAA ATA GTA CAT TTT ACA GTG AAA 2928
2929 AAA AAA AAA AAA AAA 2943
12.PP9363
A:核苷酸序列(SEQ ID NO:34)长度:3503
1 GGCCGGGAGC TCGGGAGTCG GCCGCCGCGC CGAGGTTCGC CCCGTTTTGC AGAGAGAGCC
61 GAGTCGGGAC CTGGAAAGAC GTCCCCGCGG GGCTCCGGCC GCCGCGCCTC CCCGCCGGCG
121 CCTGCCCTGC CCTGCCCGTC CCAGCCCCGC GGTTCGGGGC GTGCGGCCGG GACGCGCGGA
181 GCCCCGGCCC TGACCCGCTG CGCCGGGACG GGACGCTCCT AACGCCGCCG TACCGGTCCG
241 TGGTTGCAGG GTCGCTCCGC GCCTTTCCGT CAGTGAGGGT CGGAACCCCA GCTCCAGGGC
301 TAGCGCAGTG TGGCCCCAGG CCCTCGCCTC CGGTGCACGG GACCCCGGAC CCCCCCAAGC
361 CTCTGGCTTC ACGAGACCCC AACCTTCAGT TGGAACAGCT TGGAACAGCG CGAGCGCCCG
421 GGAAGCCCTG GCCGGGTCGT GCGCTCCGTG AGGGGTCCTA GGCGGGCAGG ACAGTCGGAC
481 CGAACCGCCG GGCTGGTGCC GCGAGCCCAG GCTGTCACCT TCGTCCCGCC TCAGGCGAGG
541 GGTTCAGCGC CTGCCCCGAA GATAACACAG GGGTCCCCTT CTGTCCCGGC GGCCCGCGAG
601 AGCCAAGGCT GCAGCTCTCC CAGTGAAGTG ATATCACTGC CTCTGTGGAC AAGACACCTC
661 CAGGAGCCCA GCTCACAGCC ACCGGTACCT TCTTCCAGGA CAAGCTGGGG GCCTCCATGG
721 GCGCCTGAGG GCCAGGCGCC AGGGCCGTGG GCACGAGTAT GGTGAGACAC CAGCCCCTGC
781 AGTACTACGA GCCACAGCTG TGCCTCTCCT GCCTCACGGG CATCTACGGC TGCCGTTGGA
841 AGCGCTACCA GCGCTCCCAT GATGATACCA CACCGTGGGA GCGCCTCTGG TTCCTGCTCC
901 TCACCTTCAC CTTTGGCCTC ACGCTCACCT GGCTTTACTT CTGGTGGGAA GTCCACAATG
961 ACTATGATGA ATTCAACTGG TACCTCTACA ACCGCATGGG CTACTGGAGC GACTGGCCCG
1021 TACCCATCCT TGTGACCACA GCTGCTGCCT TCGCATACAT CGCTGGCCTC CTGGTCCTGG
1081 CACTATGTCA CATTGCCGTG GGGCAGCAGA TGAACCTGCA CTGGCTGCAC AAGATCGGGC
1141 TGGTGGTCAT CCTGGCTTCC ACGGTGGTGG CCATGTCGGC CGTGGCCCAG CTGTGGGAGG
1201 ACGAGTGGGA GGTGCTGCTG ATCTCCCTGC AGGGCACAGC GCCATTCCTG CATGTGGGGG
1261 CTGTGGCAGC AGTCACCATG CTCTCCTGGA TCGTGGCAGG ACAGTTCGCC CGTGCAGAGC
1321 GGACCTCCTC CCAGGTGACC ATTCTCTGTA CCTTCTTCAC CGTGGTGTTT GCCCTCTACC
1381 TGGCCCCTCT CACCATCTCC TCTCCCTGCA TCATGGAGAA GAAAGACCTC GGCCCCAAGC
1441 CTGCTCTCAT TGGCCACCGC GGGGCCCCCA TGCTGGCTCC AGAGCACACG CTCATGTCCT
1501 TCCGGAAGGC CCTCGAGCAG AAGCTGTACG GGCTCCAGGC TGACATTACC ATCAGCCTGG
1561 ACGGCGTGCC CTTCCTCATG CATGACACCA CCCTGCGGCG CACCACCAAC GTGGAGGAGG
1621 AGTTCCCGGA GCTGGCCCGC AGGCCTGCCT CCATGCTTAA CTGGACCACC CTGCAGAGAC
1681 TCAACGCTGG CCAGTGGTTC CTGAAGACTG ACCCCTTCTG GACAGCCAGC TCCCTGTCAC
1741 CCTCCGACCA CAGAGAGGCC CAGAACCAGT CCATCTGCAG CCTGGCAGAG CTCCTGGAGC
1801 TGGCCAAGGG CAATGCCACA CTGCTGCTCA ACCTGCGTGA CCCGCCCCGG GAGCACCCCT
1861 ACCGCAGCAG TTTTATCAAC GTGACTCTGG AGGCCGTGCT GCACTCCGGC TTCCCCCAGC
1921 ACCAGGTCAT GTGGCTGCCT AGCAGGCAGA GGCCCCTGGT GCGGAAGGTG GCTCCCGGCT
1981 TCCAACAGAC ATCAGGCTCC AAGGAGGCAG TCGCCAGCCT GCGGAGAGGC CACATCCAGC
2041 GGCTGAACCT GCGCTACACT CAGGTGTCCC GCCAGGAGCT CAGGGACTAC GCGTCCTGGA
2101 ACCTGAGTGT GAACCTCTAC ACAGTCAACG CACCGTGGCT CTTCTCCCTG CTGTGGTGTG
2161 CGGGGGTCCC ATCCGTCACC TCTGACAACT CCCACACCCT GTCCCAGGTG CCTTCCCCCC
2221 TCTGGATCAT GCCCCCGGAC GAGTACTGTC TCATGTGGGT CACTGCCGAC CTGGTCTCCT
2281 TCACCCTCAT CGTGGGCATC TTCGTGCTCC AGAAGTGGCG CCTGGGTGGC ATACGGAGCT
2341 ACAACCCTGA GCAGATCATG CTGAGTGCTG CGGTGCGCCG GACCAGCCGG GACGTCAGCA
2401 TCATGAAGGA GAAGCTTATT TTCTCAGAGA TCAGCGATGG TGTAGAGGTC TCCGATGTGC
2461 TCTCCGTATG TTCAGACAAC AGTTATGACA CATATGCCAA CAGCACCGCC ACCCCTGTGG
2521 GCCCCCGAGG GGGTGGCAGC CACACCAAGA CCCTCATAGA GCGGAGTGGG CGTTAGCTGA
2581 AGACATGTCT GTCCCACCTG TACCTGACAC AGAAGCTGGG GAGCCTAGGA GAGCTGGTGG
2641 AAGTGTGTCT GAACTCGGAG TGCTCTGGGA GCGGGCTCCA CAGCCTCCTT GTGGGCTCCA
2701 GCCCCTTGTC AGCCGCAGCC TCTCTTGAGG GGGACTCCCT GTCTCCTGAG GCCCAGCTGG
2761 GCCAGGACTC CATCCTTTCA GATGCCCCTG CAGGCCTGGG GCTCCTTCTG GGAAGTATGG
2821 GGCCTAGGGC TTGGTCCCCC TCTTCTGAGG CCCTCTCCTG TATCCCGACC TGGAAGCTTT
2881 GATGGGTCAT GGGCCATGCC ATACCCCCTG TGGCAATGGA GTGTGTGGAT GCTCACCTGT
2941 GCCATCTGTC CTCCTGTCTG TGCCAGGAGG CACCTGAGTT CTCTGCTGTT ATCCTGCCCC
3001 AAGGGCCTGG GCCGAGCCTC TACCTGAAGC AACTCTGCTC TTCCTGTCAG TCTCAAAGCA
3061 CAAGGAGGTT CAGCCCAGGA GGAAGCCAGC TGCAATGTGG AGACACGTCC TCCTCCCCAA
3121 CCCACCTCAT GCCACCGCCA ACCCCCTGCC CCAGGAGCGG GCCTGAGCCA CGTCCCCTAG
3181 GAGCAGCTGG AGATGGCCAA AAGAGTGAGC TCAGGACTAC TGGATCCCAT GCCCAGGTGT
3241 CCAGCAGACC TCAAGGCAGA AGGGTCACCT AACCCAGGAG TCCACAGACT GATGTGACCT
3301 CAGGTTCCCA CATCAGTGGC CACAGGGCAG GGCCCACCTG GTAGAAGTGT TCTGGATATG
3361 GCCAGGGTGG GTGTGTGGCT AAGTGGGCCT GAACAGAGGG AACCTAGGGC CCTTGGCAAT
3421 GTGATTTAAA GCTGCCATCT TGCGGAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
3481 AAAAAAAAAA AAAAAAAAAA AAA
B:氨基酸序列(SEQ ID NO:35)长度:605
1 MVRHQPLQYY EPQLCLSCLT GIYGCRWKRY QRSHDDTTPW ERLWFLLLTF TFGLTLTWLY
61 FWWEVHNDYD EFNWYLYNRM GYWSDWPVPI LVTTAAAFAY IAGLLVLALC HIAVGQQMNL
121 HWLHKIGLVV ILASTVVAMS AVAQLWEDEW EVLLISLQGT APFLHVGAVA AVTMLSWIVA
181 GQFARAERTS SQVTILCTFF TVVFALYLAP LTISSPCIME KKDLGPKPAL IGHRGAPMLA
241 PEHTLMSFRK ALEQKLYGLQ ADITISLDGV PFLMHDTTLR RTTNVEEEFP ELARRPASML
301 NWTTLQRLNA GQWFLKTDPF WTASSLSPSD HREAQNQSIC SLAELLELAK GNATLLLNLR
361 DPPREHPYRS SFINVTLEAV LHSGFPQHQV MWLPSRQRPL VRKVAPGFQQ TSGSKEAVAS
421 LRRGHIQRLN LRYTQVSRQE LRDYASWNLS VNLYTVNAPW LFSLLWCAGV PSVTSDNSHT
481 LSQVPSPLWI MPPDEYCLMW VTADLVSFTL IVGIFVLQKW RLGGIRSYNP EQIMLSAAVR
541 RTSRDVSIMK EKLIFSEISD GVEVSDVLSV CSDNSYDTYA NSTATPVGPR GGGSHTKTLI
601 ERSGR
C.核苷酸及氨基酸组合序列(SEQ ID NO:36)克隆号:PP9363
起始编码子:759 ATG 终止编码子:2574 TAG 蛋白质分子量:68612.34
1 GG CCG GGA GCT CGG GAG TCG GCC GCC GCG CCG AGG TTC GCC CCG TTT 47
48 TGC AGA GAG AGC CGA GTC GGG ACC TGG AAA GAC GTC CCC GCG GGG CTC 95
96 CGG CCG CCG CGC CTC CCC GCC GGC GCC TGC CCT GCC CTG CCC GTC CCA 143
144 GCC CCG CGG TTC GGG GCG TGC GGC CGG GAC GCG CGG AGC CCC GGC CCT 191
192 GAC CCG CTG CGC CGG GAC GGG ACG CTC CTA ACG CCG CCG TAC CGG TCC 239
240 GTG GTT GCA GGG TCG CTC CGC GCC TTT CCG TCA GTG AGG GTC GGA ACC 287
288 CCA GCT CCA GGG CTA GCG CAG TGT GGC CCC AGG CCC TCG CCT CCG GTG 335
336 CAC GGG ACC CCG GAC CCC CCC AAG CCT CTG GCT TCA CGA GAC CCC AAC 383
384 CTT CAG TTG GAA CAG CTT GGA ACA GCG CGA GCG CCC GGG AAG CCC TGG 431
432 CCG GGT CGT GCG CTC CGT GAG GGG TCC TAG GCG GGC AGG ACA GTC GGA 479
480 CCG AAC CGC CGG GCT GGT GCC GCG AGC CCA GGC TGT CAC CTT CGT CCC 527
528 GCC TCA GGC GAG GGG TTC AGC GCC TGC CCC GAA GAT AAC ACA GGG GTC 575
576 CCC TTC TGT CCC GGC GGC CCG CGA GAG CCA AGG CTG CAG CTC TCC CAG 623
624 TGA AGT GAT ATC ACT GCC TCT GTG GAC AAG ACA CCT CCA GGA GCC CAG 671
672 CTC ACA GCC ACC GGT ACC TTC TTC CAG GAC AAG CTG GGG GCC TCC ATG 719
720 GGC GCC TGA GGG CCA GGC GCC AGG GCC GTG GGC ACG AGT ATG GTG AGA 767
1 Met Val Arg 3
768 CAC CAG CCC CTG CAG TAC TAC GAG CCA CAG CTG TGC CTC TCC TGC CTC 815
4 His Gln Pro Leu Gln Tyr Tyr Glu Pro Gln Leu Cys Leu Ser Cys Leu 19
816 ACG GGC ATC TAC GGC TGC CGT TGG AAG CGC TAC CAG CGC TCC CAT GAT 863
20 Thr Gly Ile Tyr Gly Cys Arg Trp Lys Arg Tyr Gln Arg Ser His Asp 35
864 GAT ACC ACA CCG TGG GAG CGC CTC TGG TTC CTG CTC CTC ACC TTC ACC 911
36 Asp Thr Thr Pro Trp Glu Arg Leu Trp Phe Leu Leu Leu Thr Phe Thr 51
912 TTT GGC CTC ACG CTC ACC TGG CTT TAC TTC TGG TGG GAA GTC CAC AAT 959
52 Phe Gly Leu Thr Leu Thr Trp Leu Tyr Phe Trp Trp Glu Val His Asn 67
960 GAC TAT GAT GAA TTC AAC TGG TAC CTC TAC AAC CGC ATG GGC TAC TGG 1007
68 Asp Tyr Asp Glu Phe Asn Trp Tyr Leu Tyr Asn Arg Met Gly Tyr Trp 83
1008 AGC GAC TGG CCC GTA CCC ATC CTT GTG ACC ACA GCT GCT GCC TTC GCA 1055
84 Ser Asp Trp Pro Val Pro Ile Leu Val Thr Thr Ala Ala Ala Phe Ala 99
1056 TAC ATC GCT GGC CTC CTG GTC CTG GCA CTA TGT CAC ATT GCC GTG GGG 1103
100 Tyr Ile Ala Gly Leu Leu Val Leu Ala Leu Cys His Ile Ala yal Gly 115
1104 CAG CAG ATG AAC CTG CAC TGG CTG CAC AAG ATC GGG CTG GTG GTC ATC 1151
116 Gln Gln Met Asn Leu His Trp Leu His Lys Ile Gly Leu Val Val Ile 131
1152 CTG GCT TCC ACG GTG GTG GCC ATG TCG GCC GTG GCC CAG CTG TGG GAG 1199
132 Leu Ala Ser Thr Val Val Ala Met Ser Ala Val Ala Gln Leu Trp Glu 147
1200 GAC GAG TGG GAG GTG CTG CTG ATC TCC CTG CAG GGC ACA GCG CCA TTC 1247
148 Asp Glu Trp Glu Val Leu Leu Ile Ser Leu Gln Gly Thr Ala Pro Phe 163
1248 CTG CAT GTG GGG GCT GTG GCA GCA GTC ACC ATG CTC TCC TGG ATC GTG 1295
164 Leu His Val Gly Ala Val Ala Ala Val Thr Met Leu Ser Trp Ile Val 179
1296 GCA GGA CAG TTC GCC CGT GCA GAG CGG ACC TCC TCC CAG GTG ACC ATT 1343
180 Ala Gly Gln Phe Ala Arg Ala Glu Arg Thr Ser Ser Gln Val Thr Ile 195
1344 CTC TGT ACC TTC TTC ACC GTG GTG TTT GCC CTC TAC CTG GCC CCT CTC 1391
196 Leu Cys Thr Phe Phe Thr Val Val Phe Ala Leu Tyr Leu Ala Pro Leu 211
1392 ACC ATC TCC TCT CCC TGC ATC ATG GAG AAG AAA GAC CTC GGC CCC AAG 1439
212 Thr Ile Ser Ser Pro Cys Ile Met Glu Lys Lys Asp Leu Gly Pro Lys 227
1440 CCT GCT CTC ATT GGC CAC CGC GGG GCC CCC ATG CTG GCT CCA GAG CAC 1487
228 Pro Ala Leu Ile Gly His Arg Gly Ala Pro Met Leu Ala Pro Glu His 243
1488 ACG CTC ATG TCC TTC CGG AAG GCC CTC GAG CAG AAG CTG TAC GGG CTC 1535
244 Thr Leu Met Ser Phe Arg Lys Ala Leu Glu Gln Lys Leu Tyr Gly Leu 259
1536 CAG GCT GAC ATT ACC ATC AGC CTG GAC GGC GTG CCC TTC CTC ATG CAT 1583
260 Gln Ala Asp Ile Thr Ile Ser Leu Asp Gly Val Pro Phe Leu Met His 275
1584 GAC ACC ACC CTG CGG CGC ACC ACC AAC GTG GAG GAG GAG TTC CCG GAG 1631
276 Asp Thr Thr Leu Arg Arg Thr Thr Asn Val Glu Glu Glu Phe Pro Glu 291
1632 CTG GCC CGC AGG CCT GCC TCC ATG CTT AAC TGG ACC ACC CTG CAG AGA 1679
292 Leu Ala Arg Arg Pro Ala Ser Met Leu Asn Trp Thr Thr Leu Gln Arg 307
1680 CTC AAC GCT GGC CAG TGG TTC CTG AAG ACT GAC CCC TTC TGG ACA GCC 1727
308 Leu Asn Ala Gly Gln Trp Phe Leu Lys Thr Asp Pro Phe Trp Thr Ala 323
1728 AGC TCC CTG TCA CCC TCC GAC CAC AGA GAG GCC CAG AAC CAG TCC ATC 1775
324 Ser Ser Leu Ser Pro Ser Asp His Arg Glu Ala Gln Asn Gln Ser Ile 339
1776 TGC AGC CTG GCA GAG CTC CTG GAG CTG GCC AAG GGC AAT GCC ACA CTG 1823
340 Cys Ser Leu Ala Glu Leu Leu Glu Leu Ala Lys Gly Asn Ala Thr Leu 355
1824 CTG CTC AAC CTG CGT GAC CCG CCC CGG GAG CAC CCC TAC CGC AGC AGT 1871
356 Leu Leu Asn Leu Arg Asp Pro Pro Arg Glu His Pro Tyr Arg Ser Ser 371
1872 TTT ATC AAC GTG ACT CTG GAG GCC GTG CTG CAC TCC GGC TTC CCC CAG 1919
372 Phe Ile Asn Val Thr Leu Glu Ala Val Leu His Ser Gly Phe Pro Gln 387
1920 CAC CAG GTC ATG TGG CTG CCT AGC AGG CAG AGG CCC CTG GTG CGG AAG 1967
388 His Gln Val Met Trp Leu Pro Ser Arg Gln Arg Pro Leu Val Arg Lys 403
1968 GTG GCT CCC GGC TTC CAA CAG ACA TCA GGC TCC AAG GAG GCA GTC GCC 2015
404 Val Ala Pro Gly Phe Gln Gln Thr Ser Gly Ser Lys Glu Ala Val Ala 419
2016 AGC CTG CGG AGA GGC CAC ATC CAG CGG CTG AAC CTG CGC TAC ACT CAG 2063
420 Ser Leu Arg Arg Gly His Ile Gln Arg Leu Asn Leu Arg Tyr Thr Gln 435
2064 GTG TCC CGC CAG GAG CTC AGG GAC TAC GCG TCC TGG AAC CTG AGT GTG 2111
436 Val Ser Arg Gln Glu Leu Arg Asp Tyr Ala Ser Trp Asn Leu Ser Val 451
2112 AAC CTC TAC ACA GTC AAC GCA CCG TGG CTC TTC TCC CTG CTG TGG TGT 2159
452 Asn Leu Tyr Thr Val Asn Ala Pro Trp Leu Phe Ser Leu Leu Trp Cys 467
2160 GCG GGG GTC CCA TCC GTC ACC TCT GAC AAC TCC CAC ACC CTG TCC CAG 2207
468 Ala Gly Val Pro Ser Val Thr Ser Asp Asn Ser His Thr Leu Ser Gln 483
2208 GTG CCT TCC CCC CTC TGG ATC ATG CCC CCG GAC GAG TAC TGT CTC ATG 2255
484 Val Pro Ser Pro Leu Trp Ile Met Pro Pro Asp Glu Tyr Cys Leu Met 499
2256 TGG GTC ACT GCC GAC CTG GTC TCC TTC ACC CTC ATC GTG GGC ATC TTC 2303
500 Trp Val Thr Ala Asp Leu Val Ser Phe Thr Leu Ile Val Gly Ile Phe 515
2304 GTG CTC CAG AAG TGG CGC CTG GGT GGC ATA CGG AGC TAC AAC CCT GAG 2351
516 Val Leu Gln Lys Trp Arg Leu Gly Gly Ile Arg Ser Tyr Asn Pro Glu 531
2352 CAG ATC ATG CTG AGT GCT GCG GTG CGC CGG ACC AGC CGG GAC GTC AGC 2399
532 Gln Ile Met Leu Ser Ala Ala Val Arg Arg Thr Ser Arg Asp Val Ser 547
2400 ATC ATG AAG GAG AAG CTT ATT TTC TCA GAG ATC AGC GAT GGT GTA GAG 2447
548 Ile Met Lys Glu Lys Leu Ile Phe Ser Glu Ile Ser Asp Gly Val Glu 563
2448 GTC TCC GAT GTG CTC TCC GTA TGT TCA GAC AAC AGT TAT GAC ACA TAT 2495
564 Val Ser Asp Val Leu Ser Val Cys Ser Asp Asn Ser Tyr Asp Thr Tyr 579
2496 GCC AAC AGC ACC GCC ACC CCT GTG GGC CCC CGA GGG GGT GGC AGC CAC 2543
580 Ala Asn Ser Thr Ala Thr Pro Val Gly Pro Arg Gly Gly Gly Ser His 595
2544 ACC AAG ACC CTC ATA GAG CGG AGT GGG CGT TAG CTG AAG ACA TGT CTG 2591
596 Thr Lys Thr Leu Ile Glu Arg Ser Gly Arg *** 606
2592 TCC CAC CTG TAC CTG ACA CAG AAG CTG GGG AGC CTA GGA GAG CTG GTG 2639
2640 GAA GTG TGT CTG AAC TCG GAG TGC TCT GGG AGC GGG CTC CAC AGC CTC 2687
2688 CTT GTG GGC TCC AGC CCC TTG TCA GCC GCA GCC TCT CTT GAG GGG GAC 2735
2736 TCC CTG TCT CCT GAG GCC CAG CTG GGC CAG GAC TCC ATC CTT TCA GAT 2783
2784 GCC CCT GCA GGC CTG GGG CTC CTT CTG GGA AGT ATG GGG CCT AGG GCT 2831
2832 TGG TCC CCC TCT TCT GAG GCC CTC TCC TGT ATC CCG ACC TGG AAG CTT 2879
2880 TGA TGG GTC ATG GGC CAT GCC ATA CCC CCT GTG GCA ATG GAG TGT GTG 2927
2928 GAT GCT CAC CTG TGC CAT CTG TCC TCC TGT CTG TGC CAG GAG GCA CCT 2975
2976 GAG TTC TCT GCT GTT ATC CTG CCC CAA GGG CCT GGG CCG AGC CTC TAC 3023
3024 CTG AAG CAA CTC TGC TCT TCC TGT CAG TCT CAA AGC ACA AGG AGG TTC 3071
3072 AGC CCA GGA GGA AGC CAG CTG CAA TGT GGA GAC ACG TCC TCC TCC CCA 3119
3120 ACC CAC CTC ATG CCA CCG CCA ACC CCC TGC CCC AGG AGC GGG CCT GAG 3167
3168 CCA CGT CCC CTA GGA GCA GCT GGA GAT GGC CAA AAG AGT GAG CTC AGG 3215
3216 ACT ACT GGA TCC CAT GCC CAG GTG TCC AGC AGA CCT CAA GGC AGA AGG 3263
3264 GTC ACC TAA CCC AGG AGT CCA CAG ACT GAT GTG ACC TCA GGT TCC CAC 3311
3312 ATC AGT GGC CAC AGG GCA GGG CCC ACC TGG TAG AAG TGT TCT GGA TAT 3359
3360 GGC CAG GGT GGG TGT GTG GCT AAG TGG GCC TGA ACA GAG GGA ACC TAG 3407
3408 GGC CCT TGG CAA TGT GAT TTA AAG CTG CCA TCT TGC GGA AAA AAA AAA 3455
3456 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 3503
Claims (10)
1.一种分离的具有抑癌功能的人蛋白多肽,其特征在于,它是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
2.如权利要求1所述的多肽,其特征在于,该多肽的氨基酸序列选自下组:SEQ ID NO:2、5、32、35。
3.一种分离的多核苷酸,其特征在于,选自下组:
(a)编码如权利要求1所述多肽的多核苷酸;
(b)与多核苷酸(a)完全互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求6所述的载体转化或转导的宿主细胞;
(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有抑癌功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含:
(a)在适合表达具有抑癌功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;
(b)从培养物中分离出具有抑癌功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有抑癌功能的人蛋白多肽特异性结合的抗体。
10.一种药物组合物,其特征在于,它含有安全有效量的权利要求1所述的多肽以及药学上可接受的载体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB011053127A CN1205225C (zh) | 2001-02-08 | 2001-02-08 | 具有抑癌功能的新的人蛋白及其编码序列 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB011053127A CN1205225C (zh) | 2001-02-08 | 2001-02-08 | 具有抑癌功能的新的人蛋白及其编码序列 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1368511A CN1368511A (zh) | 2002-09-11 |
CN1205225C true CN1205225C (zh) | 2005-06-08 |
Family
ID=4654395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB011053127A Expired - Fee Related CN1205225C (zh) | 2001-02-08 | 2001-02-08 | 具有抑癌功能的新的人蛋白及其编码序列 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1205225C (zh) |
-
2001
- 2001-02-08 CN CNB011053127A patent/CN1205225C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1368511A (zh) | 2002-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1170850C (zh) | 人血管生成素样蛋白和编码序列及其用途 | |
CN1169954C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1205225C (zh) | 具有抑癌功能的新的人蛋白及其编码序列 | |
CN1177049C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1177048C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1199998C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1177050C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1177864C (zh) | 在肝癌组织中具有表达差异的新的人蛋白及其编码序列 | |
CN1169831C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1932016A (zh) | 影响sre活性的多核苷酸及其编码多肽和用途 | |
CN1209373C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1230445C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1194989C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1169955C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1155615C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1231496C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1199997C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1169833C (zh) | 具有抑癌功能的新的人蛋白及其编码序列 | |
CN1199996C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1199994C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1222616C (zh) | 具有抑癌功能的新的人蛋白及其编码序列 | |
CN1169956C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1194010C (zh) | 具有抑制癌细胞生长功能的人蛋白及基编码序列 | |
CN1169958C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1209370C (zh) | 具有抑癌功能的新的人蛋白及其编码序列 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |