CN1209373C - 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 - Google Patents
具有抑制癌细胞生长功能的新的人蛋白及其编码序列 Download PDFInfo
- Publication number
- CN1209373C CN1209373C CNB011053119A CN01105311A CN1209373C CN 1209373 C CN1209373 C CN 1209373C CN B011053119 A CNB011053119 A CN B011053119A CN 01105311 A CN01105311 A CN 01105311A CN 1209373 C CN1209373 C CN 1209373C
- Authority
- CN
- China
- Prior art keywords
- leu
- gly
- cag
- ser
- ctg
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。
Description
技术领域
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸和此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
背景技术
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
发明内容
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
本发明采用大规模cDNA克隆转染癌细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对癌细胞(肝癌细胞)具有抑制克隆形成的作用,其抑制率在50%或50%以上。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP579蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。再以PP730蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对于其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ ID NO:2所示的成熟多肽有相同的生物学功能(以PP579蛋白为例)和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将本发明蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。这些抗体可用常规方法制备。抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与本发明蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而现在只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
具体实施方式
实施例1:cDNA基因的获得及对癌细胞克隆形成的抑制作用
PP579、PP730、PP791、PP1494、PP2386、PP6170、PP7684、PP7704、PP8407、PP8961、PP8985和PP9003是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXRcDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg cDNA滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系7721。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃ 24小时。每孔换100μl全培液,37℃ 24小时,换含G418的全培液100μl,37℃ 24~48小时,边观察,边换G418浓度不等的培液。约2~3次后,直到镜检细胞有克隆形成,计数。发现以上克隆有抑制细胞克隆形成作用,结果如下表所示。
cDNA克隆转染细胞(7721)克隆形成情况
cDNA克隆名称 | cDNA克隆数(三个重复) | 空载体克隆数(三个重复) |
PP579PP730PP791PP1494PP2386PP6170PP7684PP7704PP8407PP8961PP8985PP9003 | 0 0 19 7 60 1 07 2 38 3 55 4 65 4 716 18 198 12 1411 9 1210 8 1117 16 18 | 37 38 4237 38 4237 38 4237 38 4223 28 2523 28 2523 28 2523 28 2523 28 2523 28 2523 28 2523 28 25 |
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28、31、34)。
实施例2:从胎盘cDNA中PCR获得全长基因:
取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表所示),按97℃ 3′1个循环。94℃ 30″,60℃ 30″,72℃ 1′,35个循环,72℃ 10′1个循环进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,获得重组蛋白(SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35)。
基因特异引物
克隆名称 | 特异引物1(5′→3′) | 特异引物2(5′→3′) |
PP579PP730PP791PP1494PP2386PP6170PP7684PP7704PP8407PP8961 | TCTGCAGTTTTCTCGTGGTGTCCCATGACTTGACTCTGGACGTGTACTGGTTCTGCCTGTCGGGCTTTTAGGACACACTCCACGTCTGTCGCGTTATGAGTACTTTGAGCTGGAGGTGCGCATCCATTCTCCACGGATTCGCGTCTGTTTCCTTCGATTCAGCTCCTGTGGAAGTTGCTCAGCTACAGGGCTCTCATCCA | GGAGGGAAAGGTGTCTTCCTTTCAGCGATGTGTTTGGTGTTTGCAGCCCAGTCACAGTAGTCATCAGTGCTTTGACTGCCGGCTGTACAGGCTGAAGGATGCGTCCTGTTCCAATGACTTATAGGAGATGGTGTCCGGTGTCAATCATTGGTTTCGGGATTGAAGCACACTATGTTCTGGAAGGTGCTCATGACGCAAAGGT |
PP8985PP9003 | GGTCGGGTGCACTGGTAGTTCTGTTACACAGGGCGGAT | CTCAGAGGCACTCTGGTGGCCTCCAGTTTGGCAACATCT |
实施例3:cDNA克隆序列分析
1.PP579
A:核苷酸序列(SEQ ID NO:1)长度:2435
1 GGCAGTTCCC GGGTCCCTCG GCCACCGAAG CCACCCTGCC CTGGTGAAAG GGCTCCCGCA
61 CCGCCCGGTG CTCCCCATCT GCCTGGCGTT GTGCGCAGAG CTGGAAAGCA TGGCTGTTAT
121 AAATGAATTC TGATTTTGGG GAGCAGATGC CAACTTAGAG CCTCGTACCA ATCTCTCTGT
181 CTTTAAAAGA TGAGGTGACT TGGTGATTTT CCTGGAAAAT TATAGGTGCC CAGCTAAGAC
241 CTGAATGCCA TCACCCTCCC CAGGGCTCTG CAGTTTTCTC GTGGTGAACC CTTGATGGAT
301 TTGTTGTTGC TTGAGAAATG GCGATGATCG AATTGGGGTT TGGAAGACAG AATTTTCATC
361 CATTAAAGAG GAAGAGTTCA TTGCTGTTGA AACTCATAGC TGTTGTCTTT GCTGTGCTTC
421 TATTTTGTGA ATTTTTAATC TATTACTTAG CGATCTTTCA GTGTAATTGG CCTGAAGTGA
481 AAACCACAGC CTCTGATGGT GAACAGACCA CACGTGAGCC TGTGCTCAAA GCCATGTTTT
541 TGGCTGACAC CCATTTGCTT GGGGAATTCC TAGGCCACTG GCTGGACAAA TTACGAAGGG
601 AATGGCGGAT GGAGAGAGCG TTCCAGACAG CTCTGTGGTT GCTGCAGCCG GAAGTCGTCT
661 TCATCCTGGG GGATATCTTT GATGAAGGGA AGTGGAGCAC CCCTGAGGCC TGGGCGCATG
721 ATGTGGAGCG GTTTCAGAAA ATGTTCAGAC ACCCAAGTCA TGTACAGCTG AAGGTAGTTG
781 CTGGAAACCA TGACATTGGC TTCCATTATG AGATGAACAC ATACAAAGTA GAACGCTTTG
841 AGAAAGTGTT CAGCTCTGAA AGACTGTTTT CTTGGAAAGG CATTAACTTT GTGATGGTCA
901 ACAGCGTGGC GCTGAACGGG GATGGCTGTG GCATCTGCTC TGAAACAGAA GCAGAGCTCA
961 TTGAAGTTTC TCACAGACTG AACTGCTCCC GAGAGGCACG TGGCTCCAGC CGGTGTGGAC
1021 CTGGGCCTCT GCTGCCCACG TCTGCCCCTG TCCTCCTGCA GCATTATCCT CTGTATCGGA
1081 GAAGTGATGC TAACTGTTCT GGGGAAGACG CTGCTCCTCC AGAGGAAAGG GACATCCCAT
1141 TTAAGGAGAA CTATGACGTG CTTTCACGGG AGGCATCACA AAAGCTGCTG TGGTGGCTCC
1201 AGCCGCGCCT GGTTCTCAGT GGCCACACGC ACAGCGCCTG CGAGGTGCAC CACGGGGGCC
1261 GAGTCCCCGA GCTCAGCGTC CCATCTTTCA GTTGGAGGAA CAGAAACAAC CCCAGTTTCA
1321 TCATGGGAAC AGATGCTTAG TTGAGCATCA AGGGGCAGGA AGACACCTTT CCCTCCTTGT
1381 TCCTCGCTGA CCGATGACCC TGGAACTCCA CGGTGCCTCT CTGAATCTCT GTTATGGATC
1441 CCCCACTATA TTTGATGGGA ACCCAGTGAG CCAGGGGCCA GTTTTGACAG GGTAGCATCA
1501 CGCCCACAGA CTACACCCTC TCCAAGTGCT ACCTCCCACG TGAGGATGTG GTTTTGATCA
1561 TCTACTGTGG AGTGGTGGGC TTCCTTGTGG TCCTCACACT CACTCACTTT GGGCTTCTAG
1621 CCTCACCTTT TCTTTCTGGT TTGAACTTGC TCGGAAAGCG TAAGACAAGA TGAAGAGCAG
1681 GCGCCATTAT AAATATCAAA GCCCAAGAAA TGGAACTTTG GGCAGAGATC ATGTTAGAAT
1741 CAAGTGGATG ATGAGACCAA TTACAGGCCG TCTCTCTGCA CAGCACAGAA ATTCTCAATC
1801 ACTGAAATGA GTAACTGCAA AATAAATAGT TGATTGTACT GTTCTCATGC TATAAAAGTG
1861 GACAGGTACT CTACAACAAA TCTGTTTTCT CATTTTTATC AAATATATGT ATCATCAAAG
1921 GTTGCATCTG TACAGTATGT AAATGCTATT AATGTCGTCA CTCACATGCA CGACAGTCCT
1981 TGTTCCCCCA GGAACGGCCT GGTGGCCCCA GCACACACTT GGGATTATGT GTATACATAA
2041 ATAAATATTG GGCTGTTTCC CTCTTCCTGT GAAGTGGTTC TCAAATTCCT ATGTACTGTA
2101 AAGCTGTACC CTTAAAAGTA CAGATGTGGC CGGGCACAGT GGCTCACACC TGTAATCCCA
2161 GCACTTTGGG AGGCTGAGGC GGGTGGATCA CTTGAGGTCA GGAGTTCAAG ACCAGCCTGG
2221 CCAACATGGT GAAACCTCGT CTCCGCTAGA AATACAAAAA TTAGCCAAGC ATGGTAGCAA
2281 GTGCCTATAA TACCAGCTGA GGCTGAGGCA GGAGAATCCC TTGAGCCCGG GAGGCGGAGG
2341 TTGCAGTGAG CCAAGATCAT GCCACTGCAC TCTAGCCTGG GCAACAGAGT GAGACTCCGT
2401 CTCAAAAAAA TATATTTAAA AAAAAAAAAA AAAAA
B:氨基酸序列(SEQ ID NO:2) 长度:340
1 MAMIELGFGR QNFHPLKRKS SLLLKLIAVV FAVLLFCEFL IYYLAIFQCN WPEVKTTASD
61 GEQTTREPVL KAMFLADTHL LGEFLGHWLD KLRREWRMER AFQTALWLLQ PEVVFILGDI
121 FDEGKWSTPE AWADDVERFQ KMFRHPSHVQ LKVVAGNHDI GFHYEMNTYK VERFEKVFSS
181 ERLFSWKGIN FVMVNSVALN GDGCGICSET EAELIEVSHR LNCSREARGS SRCGPGPLLP
241 TSAPVLLQHY PLYRRSDANC SGEDAAPPEE RDIPFKENYD VLSREASQKL LWWLQPRLVL
301 SGHTHSACEV HHGGRVPELS VPSFSWRNRN NPSFIMGTDA
C.核苷酸及氨基酸组合序列(SEQ ID NO:3) 克隆号:PP579
起始编码子:318 ATG 终止编码子:1338 TAG 蛋白质分子量:38984.57
(注:(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿。)
1 GG CAG TTC CCG GGT CCC TCG GCC ACC GAA GCC ACC CTG CCC TGG TGA 47
48 AAG GGC TCC CGC ACC GCC CGG TGC TCC CCA TCT GCC TGG CGT TGT GCG 95
96 CAG AGC TGG AAA GCA TGG CTG TTA TAA ATG AAT TCT GAT TTT GGG GAG 143
144 CAG ATG CCA ACT TAG AGC CTC GTA CCA ATC TCT CTG TCT TTA AAA GAT 191
192 GAG GTG ACT TGG TGA TTT TCC TGG AAA ATT ATA GGT GCC CAG CTA AGA 239
240 CCT GAA TGC CAT CAC CCT CCC CAG GGC TCT GCA GTT TTC TCG TGG TGA 287
288 ACC CTT GAT GGA TTT GTT GTT GCT TGA GAA ATG GCG ATG ATC GAA TTG 335
1 Met Ala Met Ile Glu Leu 6
336 GGG TTT GGA AGA CAG AAT TTT CAT CCA TTA AAG AGG AAG AGT TCA TTG 383
7 Gly Phe Gly Arg Gln Asn Phe His Pro Leu Lys Arg Lys Ser Ser Leu 22
384 CTG TTG AAA CTC ATA GCT GTT GTC TTT GCT GTG CTT CTA TTT TGT GAA 431
23 Leu Leu Lys Leu Ile Ala Val Val Phe Ala Val Leu Leu Phe Cys Glu 38
432 TTT TTA ATC TAT TAC TTA GCG ATC TTT CAG TGT AAT TGG CCT GAA GTG 479
39 Phe Leu Ile Tyr Tyr Leu Ala Ile Phe Gln Cys Asn Trp Pro Glu Val 54
480 AAA ACC ACA GCC TCT GAT GGT GAA CAG ACC ACA CGT GAG CCT GTG CTC 527
55 Lys Thr Thr Ala Ser Asp Gly Glu Gln Thr Thr Arg Glu Pro Val Leu 70
528 AAA GCC ATG TTT TTG GCT GAC ACC CAT TTG CTT GGG GAA TTC CTA GGC 575
71 Lys Ala Met Phe Leu Ala Asp Thr His Leu Leu Gly Glu Phe Leu Gly 86
576 CAC TGG CTG GAC AAA TTA CGA AGG GAA TGG CGG ATG GAG AGA GCG TTC 623
87 His Trp Leu Asp Lys Leu Arg Arg Glu Trp Arg Met Glu Arg Ala Phe 102
624 CAG ACA GCT CTG TGG TTG CTG CAG CCG GAA GTC GTC TTC ATC CTG GGG 671
103 Gln Thr Ala Leu Trp Leu Leu Gln Pro Glu Val Val Phe Ile Leu Gly 118
672 GAT ATC TTT GAT GAA GGG AAG TGG AGC ACC CCT GAG GCC TGG GCG GAT 719
119 Asp Ile Phe Asp Glu Gly Lys Trp Ser Thr Pro Glu Ala Trp Ala Asp 134
720 GAT GTG GAG CGG TTT CAG AAA ATG TTC AGA CAC CCA AGT CAT GTA CAG 767
135 Asp Val Glu Arg Phe Gln Lys Met Phe Arg His Pro Ser His Val Gln 150
768 CTG AAG GTA GTT GCT GGA AAC CAT GAC ATT GGC TTC CAT TAT GAG ATG 815
151 Leu Lys Val Val Ala Gly Asn His Asp Ile Gly Phe His Tyr Glu Met 166
816 AAC ACA TAC AAA GTA GAA CGC TTT GAG AAA GTG TTC AGC TCT GAA AGA 863
167 Asn Thr Tyr Lys Val Glu Arg Phe Glu Lys Val Phe Ser Ser Glu Arg 182
864 CTG TTT TCT TGG AAA GGC ATT AAC TTT GTG ATG GTC AAC AGC GTG GCG 911
183 Leu Phe Ser Trp Lys Gly Ile Asn Phe Val Met Val Asn Ser Val Ala 198
912 CTG AAC GGG GAT GGC TGT GGC ATC TGC TCT GAA ACA GAA GCA GAG CTC 959
199 Leu Asn Gly Asp Gly Cys Gly Ile Cys Ser Glu Thr Glu Ala Glu Leu 214
960 ATT GAA GTT TCT CAC AGA CTG AAC TGC TCC CGA GAG GCA CGT GGC TCC 1007
215 Ile Glu Val Ser His Arg Leu Asn Cys Ser Arg Glu Ala Arg Gly Ser 230
1008 AGC CGG TGT GGA CCT GGG CCT CTG CTG CCC ACG TCT GCC CCT GTC CTC 1055
231 Ser Arg Cys Gly Pro Gly Pro Leu Leu Pro Thr Ser Ala Pro Val Leu 246
1056 CTG CAG CAT TAT CCT CTG TAT CGG AGA AGT GAT GCT AAC TGT TCT GGG 1103
247 Leu Gln His Tyr Pro Leu Tyr Arg Arg Ser Asp Ala Asn Cys Ser Gly 262
1104 GAA GAC GCT GCT CCT CCA GAG GAA AGG GAC ATC CCA TTT AAG GAG AAC 1151
263 Glu Asp Ala Ala Pro Pro Glu Glu Arg Asp Ile Pro Phe Lys Glu Asn 278
1152 TAT GAC GTG CTT TCA CGG GAG GCA TCA CAA AAG CTG CTG TGG TGG CTC 1199
279 Tyr Asp Val Leu Ser Arg Glu Ala Ser Gln Lys Leu Leu Trp Trp Leu 294
1200 CAG CCG CGC CTG GTT CTC AGT GGC CAC ACG CAC AGC GCC TGC GAG GTG 1247
295 Gln Pro Arg Leu Val Leu Ser Gly His Thr His Ser Ala Cys Glu Val 310
1248 CAC CAC GGG GGC CGA GTC CCC GAG CTC AGC GTC CCA TCT TTC AGT TGG 1295
311 His His Gly Gly Arg Val Pro Glu Leu Ser Val Pro Ser Phe Ser Trp 326
1296 AGG AAC AGA AAC AAC CCC AGT TTC ATC ATG GGA ACA GAT GCT TAG TTG 1343
327 Arg Asn Arg Asn Asn Pro Ser Phe Ile Met Gly Thr Asp Ala *** 341
1344 AGC ATC AAG GGG CAG GAA GAC ACC TTT CCC TCC TTG TTC CTC GCT GAC 1391
1392 CGA TGA CCC TGG AAC TCC ACG GTG CCT CTC TGA ATC TCT GTT ATG GAT 1439
1440 CCC CCA CTA TAT TTG ATG GGA ACC CAG TGA GCC AGG GGC CAG TTT TGA 1487
1488 CAG GGT AGC ATC ACG CCC ACA GAC TAC ACC CTC TCC AAG TGC TAC CTC 1535
1536 CCA CGT GAG GAT GTG GTT TTG ATC ATC TAC TGT GGA GTG GTG GGC TTC 1583
1584 CTT GTG GTC CTC ACA CTC ACT CAC TTT GGG CTT CTA GCC TCA CCT TTT 1631
1632 CTT TCT GGT TTG AAC TTG CTC GGA AAG CGT AAG ACA AGA TGA AGA GCA 1679
1680 GGC GCC ATT ATA AAT ATC AAA GCC CAA GAA ATG GAA CTT TGG GCA GAG 1727
1728 ATC ATG TTA GAA TCA AGT GGA TGA TGA GAC CAA TTA CAG GCC GTC TCT 1775
1776 CTG CAC AGC ACA GAA ATT CTC AAT CAC TGA AAT GAG TAA CTG CAA AAT 1823
1824 AAA TAG TTG ATT GTA CTG TTC TCA TGC TAT AAA AGT GGA CAG GTA CTC 1871
1872 TAC AAC AAA TCT GTT TTC TCA TTT TTA TCA AAT ATA TGT ATC ATC AAA 1919
1920 GGT TGC ATC TGT ACA GTA TGT AAA TGC TAT TAA TGT CGT CAC TCA CAT 1967
1968 GCA CGA CAG TCC TTG TTC CCC CAG GAA GGG CCT GGT GGC CCC AGC ACA 2015
2016 CAC TTG GGA TTA TGT GTA TAC ATA AAT AAA TAT TGG GCT GTT TCC CTC 2063
2064 TTC CTG TGA AGT GGT TCT CAA ATT CCT ATG TAC TGT AAA GCT GTA CCC 2111
2112 TTA AAA GTA CAG ATG TGG CCG GGC ACA GTG GCT CAC ACC TGT AAT CCC 2159
2160 AGC ACT TTG GGA GGC TGA GGC GGG TGG ATC ACT TGA GGT CAG GAG TTC 2207
2208 AAG ACC AGC CTG GCC AAC ATG GTG AAA CCT CGT CTC CGC TAG AAA TAC 2255
2256 AAA AAT TAG CCA AGC ATG GTA GCA AGT GCC TAT AAT ACC AGC TGA GGC 2303
2304 TGA GGC AGG AGA ATC CCT TGA GCC CGG GAG GCG GAG GTT GCA GTG AGC 2351
2352 CAA GAT CAT GCC ACT GCA CTC TAG CCT GGG CAA CAG AGT GAG ACT CCG 2399
2400 TCT CAA AAA AAT ATA TTT AAA AAA AAA AAA AAA AAA 2435
2.PP730
A:核苷酸序列(SEQ ID NO:4)长度:2057
1 GGACTCGCTT TCCGTGCGGT GCGGCGAGTG AGGCCCCGGT CTTCCTCCTC GTCCTGCCGC
61 AGGGCCAGAA CCCCTGACGG TATTCAGCTG CGCGTAAGTC TGGCCGGTGC CATCTGTCTC
121 CGCAATGCCC CCCAAGAAAC AGGCTCAGGC CAGGGGCAGC AAAAAGGCGG AGCAAAAAAA
181 GAAGGAGAAG ATTATCGAAG GCAAAACTTT CGGTTTGAAG AATAAGAAAG GAACAAAGCA
241 ACAGAAGTTT ATCAAGGCTG TCACACATCA AGTTAAATTT GGTCAACAAA ATCCACGTCA
301 GGTAGCACAG AGTGAAGCTG AAAAGAAATT GAAGAAGGAT GACAAGAAGA AAGAATTGCA
361 GGAGCTAAAT GAGCTGTTCA AACCTGTAGT TGCTGCTCAA AAAAATAAGT AAAGGTGCAG
421 ATCCCAAGTC TGTAGTATGT GCATTCTTCA AGCAAGGACA GTGTACTAAA GGAGATAAGT
481 GTAAGTTCTC CCATGACTTG ACTCTGGAGA GAAAATGTGA AAAGCGAAGT GTTTACATTG
541 ATGCAAGAGA TGAAGAACTT GAAAAAGATA CTATGGATAA TTGGGATGAG AAAAAGCTGG
601 AAGAAGTAGT GAACAAGAAG CACGGTGAGG CGGAAAAGAA AAAACCAAAA ACTCAAATAG
661 TGTGCAAGCA TTTCCTGGAA GCTATTGAAA ACAACAAGTA TGGCTGGTTT TGGGTATGCC
721 CTGGAGGGGG TGATATTTGC ATGTATCGTC ATGCACTTCC TCCTGGATTT GTGTTGAAAA
781 AAGATAAAAA GAAAGAAGAG AAAGAAGATG AAATTTCATT AGAAGATCTA ATTGAGAGAG
841 AGCGTTCTGC CCTAGGTCCA AATGTTACCA AAATCACTCT AGAATCTTTT CTTGCCTGGA
901 AGAAAAGGAA AAGACAAGAA AAGATTGATA AACTTGAACA AGATATGGAA AGAAGGAAAG
961 CTGACTTCAA AGCAGGGAAA GCACTAGTGA TCAGTGGTCG TGAAGTGTTT GAATTTCGTC
1021 CTGAACTGGT CAATGATGAT GATGAGGAAG CAGATGATAC ACGCTACACC CAGGGAACAG
1081 GTGGTGATGA GGTTGATGAT TCAGTGAGTG TAAATGACAT AGATTTAAGC CTGTACATCC
1141 CAAGAGATGT AGATGAAACA GGTATTACTG TAGCCAGTCT TGAAAGATTC AGCACATATA
1201 CTTCAGATAA AGATGAAAAC AAATTAAGTG AAGCTTCTGG AGGTAGGGCT GAAAATGGCG
1261 AAAGAAGTGA CTTGGAAGAG GACAACGAGA GGGAGGGAAC GGAAAATGGA GCCATTGATG
1321 CTGTTCCTGT TGATGAAAAT CTTTTCACTG GAGAGGATTT GGATGAACTA GAAGAAGAAT
1381 TAAATACACT TGATTTAGAA GAATGACACC AAACACATCG CTGAAAAAAT TAAGTCAGCT
1441 CAGCACGAGT TGGAATTGAC TACATTAATT TCTTTCCACC TAGAATCAAC AGGATGTTTA
1501 TTTCCTATGC TGATTCTGGA GGAGTTAACC TCCTGCAAAA AAGGCATCTT GTCCCTACAT
1561 CTTCTCTTCT GACTTTGGCT ACATCTCATA GTAAGTTCAG AGTAGTTCAT GATAAATTGA
1621 AAATATAATG GTCATTGCAG AAAATGATTG ATGTTGTAAC TGTCCACCCA AGTAAGAAGT
1681 GTATCTGCCT TTCCATCTTT TGGTTTTCAT TTGGGCATGT GCTATTACCA GAAACAACAA
1741 ACTTATATTT AAAATACCCT TCATTTGACA CAGTTTTTAA TGAGTGATTT AATTTCCTCT
1801 GTATTTGTAT GTTTAGAAGA CTGCCTAAAA CATGAGCACT GTACTTCATA AAGGAAACTG
1861 CGTATGCAGA TTCAGTATTG TGTATCTTTG GACAATTAGA TGGACATTTA AAATGGAACT
1921 TCTTTTATCT GACAGGATCA GCTACAATGC CCTGTGTTAA ATTGTTTAAA AGTTTCCCTT
1981 TTCTTTTTTG CCAATAAAGT TGTAAATAAA GACCATCATA CATTAAAATC CCAAAAAAAA
2041 AAAAAAAAAA AAAAAAA
B:氨基酸序列(SEQ ID NO:5) 长度:277
1 MDNWDEKKLE EVVNKKHGEA EKKKPKTQIV CKHFLEAIEN NKYGWFWVCP GGGDICMYRH
61 ALPPGFVLKK DKKKEEKEDE ISLEDLIERE RSALGPNVTK ITLESFLAWK KRKRQEKIDK
121 LEQDMERRKA DFKAGKALVI SGREVFEFRP ELVNDDDEEA DDTRYTQGTG GDEVDDSVSV
181 NDIDLSLYIP RDVDETGITV ASLERFSTYT SDKDENKLSE ASGGRAENGE RSDLEEDNER
241 EGTENGAIDA VPVDENLFTG EDLDELEEEL NTLDLEE
C.核苷酸及氨基酸组合序列(SEQ ID NO:6) 克隆号:PP730
起始编码子:573 ATG 终止编码子:1404 TGA 蛋白质分子量:31669.20
1 GG ACT CGC TTT CCG TGC GGT GCG GCG AGT GAG GCC CCG GTC TTC CTC 47
48 CTC GTC CTG CCG CAG GGC CAG AAC CCC TGA CGG TAT TCA GCT GCG CGT 95
96 AAG TCT GGC CGG TGC CAT CTG TCT CCG CAA TGC CCC CCA AGA AAC AGG 143
144 CTC AGG CCA GGG GCA GCA AAA AGG CGG AGC AAA AAA AGA AGG AGA AGA 191
192 TTA TCG AAG GCA AAA CTT TCG GTT TGA AGA ATA AGA AAG GAA CAA AGC 239
240 AAC AGA AGT TTA TCA AGG CTG TCA CAC ATC AAG TTA AAT TTG GTC AAC 287
288 AAA ATC CAC GTC AGG TAG CAC AGA GTG AAG CTG AAA AGA AAT TGA AGA 335
336 AGG ATG ACA AGA AGA AAG AAT TGC AGG AGC TAA ATG AGC TGT TCA AAC 383
384 CTG TAG TTG CTG CTC AAA AAA ATA AGT AAA GGT GCA GAT CCC AAG TCT 431
432 GTA GTA TGT GCA TTC TTC AAG CAA GGA CAG TGT ACT AAA GGA GAT AAG 479
480 TGT AAG TTC TCC CAT GAC TTG ACT CTG GAG AGA AAA TGT GAA AAG CGA 527
528 AGT GTT TAC ATT GAT GCA AGA GAT GAA GAA CTT GAA AAA GAT ACT ATG 575
1 Met 1
576 GAT AAT TGG GAT GAG AAA AAG CTG GAA GAA GTA GTG AAC AAG AAG CAC 623
2 Asp Asn Trp Asp Glu Lys Lys Leu Glu Glu Val Val Asn Lys Lys His 17
624 GGT GAG GCG GAA AAG AAA AAA CCA AAA ACT CAA ATA GTG TGC AAG CAT 671
18 Gly Glu Ala Glu Lys Lys Lys Pro Lys Thr Gln Ile Val Cys Lys His 33
672 TTC CTG GAA GCT ATT GAA AAC AAC AAG TAT GGC TGG TTT TGG GTA TGC 719
34 Phe Leu Glu Ala Ile Glu Asn Asn Lys Tyr Gly Trp Phe Trp Val Cys 49
720 CCT GGA GGG GGT GAT ATT TGC ATG TAT CGT CAT GCA CTT CCT CCT GGA 767
50 Pro Gly Gly Gly Asp Ile Cys Met Tyr Arg His Ala Leu Pro Pro Gly 65
768 TTT GTG TTG AAA AAA GAT AAA AAG AAA GAA GAG AAA GAA GAT GAA ATT 815
66 Phe Val Leu Lys Lys Asp Lys Lys Lys Glu Glu Lys Glu Asp Glu Ile 81
816 TCA TTA GAA GAT CTA ATT GAG AGA GAG CGT TCT GCC CTA GGT CCA AAT 863
82 Ser Leu Glu Asp Leu Ile Glu Arg Glu Arg Ser Ala Leu Gly Pro Asn 97
864 GTT ACC AAA ATC ACT CTA GAA TCT TTT CTT GCC TGG AAG AAA AGG AAA 911
98 Val Thr Lys Ile Thr Leu Glu Ser Phe Leu Ala Trp Lys Lys Arg Lys 113
912 AGA CAA GAA AAG ATT GAT AAA CTT GAA CAA GAT ATG GAA AGA AGG AAA 959
114 Arg Gln Glu Lys Ile Asp Lys Leu Glu Gln Asp Met Glu Arg Arg Lys 129
960 GCT GAC TTC AAA GCA GGG AAA GCA CTA GTG ATC AGT GGT CGT GAA GTG 1007
130 Ala Asp Phe Lys Ala Gly Lys Ala Leu Val Ile Ser Gly Arg Glu Val 145
1008 TTT GAA TTT CGT CCT GAA CTG GTC AAT GAT GAT GAT GAG GAA GCA GAT 1055
146 Phe Glu Phe Arg Pro Glu Leu Val Asn Asp Asp Asp Glu Glu Ala Asp 161
1056 GAT ACA CGC TAC ACC CAG GGA ACA GGT GGT GAT GAG GTT GAT GAT TCA 1103
162 Asp Thr Arg Tyr Thr Gln Gly Thr Gly Gly Asp Glu Val Asp Asp Ser 177
1104 GTG AGT GTA AAT GAC ATA GAT TTA AGC CTG TAC ATC CCA AGA GAT GTA 1151
178 Val Ser Val Asn Asp Ile Asp Leu Ser Leu Tyr Ile Pro Arg Asp Val 193
1152 GAT GAA ACA GGT ATT ACT GTA GCC AGT CTT GAA AGA TTC AGC ACA TAT 1199
194 Asp Glu Thr Gly Ile Thr Val Ala Ser Leu Glu Arg Phe Ser Thr Tyr 209
1200 ACT TCA GAT AAA GAT GAA AAC AAA TTA AGT GAA GCT TCT GGA GGT AGG 1247
210 Thr Ser Asp Lys Asp Glu Asn Lys Leu Ser Glu Ala Ser Gly Gly Arg 225
1248 GCT GAA AAT GGC GAA AGA AGT GAC TTG GAA GAG GAC AAC GAG AGG GAG 1295
226 Ala Glu Asn Gly Glu Arg Ser Asp Leu Glu Glu Asp Asn Glu Arg Glu 241
1296 GGA ACG GAA AAT GGA GCC ATT GAT GCT GTT CCT GTT GAT GAA AAT CTT 1343
242 Gly Thr Glu Asn Gly Ala Ile Asp Ala Val Pro Val Asp Glu Asn Leu 257
1344 TTC ACT GGA GAG GAT TTG GAT GAA CTA GAA GAA GAA TTA AAT ACA CTT 1391
258 Phe Thr Gly Glu Asp Leu Asp Glu Leu Glu Glu Glu Leu Asn Thr Leu 273
1392 GAT TTA GAA GAA TGA CAC CAA ACA CAT CGC TGA AAA AAT TAA GTC AGC 1439
274 Asp Leu Glu Glu *** 278
1440 TCA GCA CGA GTT GGA ATT GAC TAC ATT AAT TTC TTT CCA CCT AGA ATC 1487
1488 AAC AGG ATG TTT ATT TCC TAT GCT GAT TCT GGA GGA GTT AAC CTC CTG 1535
1536 CAA AAA AGG CAT CTT GTC CCT ACA TCT TCT CTT CTG ACT TTG GCT ACA 1583
1584 TCT CAT AGT AAG TTC AGA GTA GTT CAT GAT AAA TTG AAA ATA TAA TGG 1631
1632 TCA TTG CAG AAA ATG ATT GAT GTT GTA ACT GTC CAC CCA AGT AAG AAG 1679
1680 TGT ATC TGC CTT TCC ATC TTT TGG TTT TCA TTT GGG CAT GTG CTA TTA 1727
1728 CCA GAA ACA ACA AAC TTA TAT TTA AAA TAC CCT TCA TTT GAC ACA GTT 1775
1776 TTT AAT GAG TGA TTT AAT TTC CTC TGT ATT TGT ATG TTT AGA AGA CTG 1823
1824 CCT AAA ACA TGA GCA CTG TAC TTC ATA AAG GAA ACT GCG TAT GCA GAT 1871
1872 TCA GTA TTG TGT ATC TTT GGA CAA TTA GAT GGA CAT TTA AAA TGG AAC 1919
1920 TTC TTT TAT CTG ACA GGA TCA GCT ACA ATG CCC TGT GTT AAA TTG TTT 1967
1968 AAA AGT TTC CCT TTT CTT TTT TGC CAA TAA AGT TGT AAA TAA AGA CCA 2015
2016 TCA TAC ATT AAA ATC CCA AAA AAA AAA AAA AAA AAA AAA AAA 2057
3.PP791
A:核苷酸序列(SEQ ID NO:7)长度:4001
1 GGCTGTCCAG GGAGGCTGAG GCGAGAGGTA GCTGTCCGGG TGGGGAGCCC GCACTACCTT
61 CTTCCTCTTC CTCCTCCTCC GGGTGAGGGG AGCGAAGGTT GGGGGTCCCC GAGCCCATGG
121 ACCAGGAAGA GGCGGAGGCC GCCGAGAGCC GGGGCCCCGC TATGTGGCCC TGAGCCCCGT
181 GTACTGGTTC TGCCTGTCTG GAGGGCCATG GAGAAGAGGC TGGGAGTCAA GCCAAATCCT
241 GCTTCCTGGA TTTTATCAGG ATATTATTGG CAGACATCTG CGAAGTGGTT GAGAAGCCTG
301 TACCTGTTTT ATACTTACTT TTGCTTCAGC GTTCTGTGGT TGTCAACAGA TGCCAGTGAG
361 AGCAGGTGCC AGCAGGGGAA GACACAATTT GGAGTTGGCC TGAGATCTGG GGGAGAAAAT
421 CACCTCTGGC TTCTTGAAGG AACCCCCTCT CTCCAGTCAT GTTGGGCTGC CTGCTGCCAG
481 GACTCTGCCT GCCATGTCTT TTGGTGGCTA GAAGGGATGT GCATTCAGGC AGACTGCAGC
541 AGGCCCCAGA GCTGCCGGGC TTTTAGGACA CACTCCTCCA ATTCCATGCT GGTGTTTTTA
601 AAAAAATTCC AAACTGCAGA TGATTTGGGC TTTCTACCTG AAGATGATGT ACCACATCTT
661 CTGGGGCTAG GTTGGAACTG GGCATCTTGG AGGCAGAGCC CACCCAGAGC TGCACTCAGA
721 CCTGCTGTAT CTTCCAGTGA CCAGCAGAGC TTAATCAGGA AGCTTCAGAA GAGAGGTAGT
781 CCCAGTGACG TAGTTACACC TATAGTGACA CAGTATTCTA AAGTGAATGA CTCCAACGAA
841 TTAGGTGGTC TGACTACCAG TGGCTCTGCA GAGGTCCACA AGGCGATTAC AATTTCCAGT
901 CCCCTAACCA CAGACTTGAC TGCAGAGCTG TCTGGTGGGC CAAAGAATGT ATCAGTGCAA
961 CCTGAAATAT CAGAGGGTCT TGCTACTACG CCCAGCACTC AACAAGTAAA AAGTTCTGAG
1021 AAAACCCAGA TTGCTGTCCC CCAGCCAGTG GCTCCCTCCT ACAGTTATGC TACCCCTACC
1081 CCCCAGGCCT CTTTCCAGAG CACCTCAGCA CCATACCCAG TTATAAAGGA ACTGGTGGTA
1141 TCTGCTGGAG AGAGTGTCCA GATAACCCTG CCTAAGAATG AAGTTCAATT AAATGCATAT
1201 GTTCTCCAAG AACCACCTAA AGGAGAAACC TACACCTACG ACTGGCAGCT GATTACTCAT
1261 CCTAGAGACT ACAGTGGAGA AATGGAAGGG AAACATTCCC AGATCCTCAA ACTATCGAAG
1321 CTCACTCCAG GCCTGTATGA ATTCAAAGTG ATTGTAGAGG GTCAAAATGC CCATGGGGAA
1381 GGCTATGTGA ACGTGACAGT CAAGCCAGAG CCCCGTAAGA ATCGGCCCCC CATTGCTATT
1441 GTGTCACCTC AGTTCCAGGA GATCTCTTTG CCAACCACTT CTACAGTCAT TGATGGCAGT
1501 CAAAGCACTG ATGATGATAA AATCGTTCAG TACCATTGGG AAGAACTTAA GGGGCCTCTA
1561 AGAGAAGAGA AGATTTCTGA AGATACAGCC ATATTAAAAC TAAGTAAACT CGTCCCTGGG
1621 AACTACACTT TCAGCTTGAC TGTAGTAGAC TCTGATGGAG CTACCAACTC TACTACTGCA
1681 AACCTGACAG TGAACAAAGC TGTGGATTAC CCCCCTGTGG CCAACGCAGG CCCCAACCAA
1741 GTGATCACCC TGCCCCAAAA CTCCACCACC CTCTTTGGGA ACCAGAGCAC TGATGATCAT
1801 GGCATCACCA GCTATGAGTG GTCACTCAGC CCAAGCAGCA AAGGGAAAGT GGTGGAGATG
1861 CAGGGTGTTA GAACACCAAC CTTACAGCTC TCTGCGATGC AAGAAGGAGA CTACACTTAC
1921 CAGCTCACAG TGACTGACAC AATAGGACAG CAGGCCACTG CTCAAGTGAC CGTTATTGTG
1981 CAACCTGAAA ACAATAAGCC TCCTCAGGCA GATGCAGGCC CAGATAAAGA GCTGACCCTT
2041 CCTGTGGATA GCACAACCCT GGATGGCAGC AAGAGCTCAG ATGATCAGAA AATTATCTCA
2101 TATCTCTGGG AAAAAAACAC AGGGACCTGA TGGGGTGCAG CTCGAGAATG CTAACAGCAG
2161 TGTTGCTACT GTGACTGGGC TGCAAGTGGG GACCTATGTG TTCACCTTGA CTGTCAAAGA
2221 TGAGAGGAAC CTGCAAAGCC AGAGCTCTGT GAATGTCATT GTCAAAGAAG AAATAAACAA
2281 ACCACCTATA GCCAAGATAA CTGGGAATGT GGTGATTACC CTACCCACGA GCACAGCAGA
2341 GCTGGATGGC TCTAAGTCCT CAGATGACAA GGGAATAGTC AGCTACCTCT GGACTCGAGA
2401 TGAGGGGAGC CCAGCAGCAG GGGAGGTGTT AAATCACTCT GACCATCACC CTATCCTTTT
2461 TCTTTCAAAC CTGGTTGAGG GAACCTACAC TTTTCACCTG AAAGTGACCG ATGCAAAGGG
2521 TGAGAGTGAC ACAGACCGGA CCACTGTGGA GGTGAAACCT GATCCCAGGA AAAACAACCT
2581 GGTGGAGATC ATCTTGGATA TCAACGTCAG TCAGCTAACT GAGAGGCTGA AGGGGATGTT
2641 CATCCGCCAG ATTGGGGTCC TCCTGGGGGT GCTGGATTCC GACATCATTG TGCAAAAGAT
2701 TCAGCCGTAC ACGGAGCAGA GCACCAAAAT GGTATTTTTT GTTCAAAACG AGCCTCCCCA
2761 CCAGATCTTC AAAGGCCATG AGGTGGCAGC GATGCTCAAG AGTGAGCTGC GGAAGCAAAA
2821 GGCAGACTTT TTGATATTCA GAGCCTTGGA AGTCAACACT GTCACATGTC AGCTGAACTG
2881 TTCCGACCAT GGCCACTGTG ACTCGTTCAC CAAACGCTGT ATCTGTGACC CTTTTTGGAT
2941 GGAGAATTTC ATCAAGGTGC AGCTGAGGGA TGGAGACAGC AACTGTGAGT GGAGCGTGTT
3001 ATATGTTATC ATTGCTACCT TTGTCATTGT TGTTGCCTTG GGAATCCTGT CTTGGACTGT
3061 GATCTGTTGT TGTAAGAGGC AAAAAGGAAA ACCCAAGAGG AAAAGCAAGT ACAAGATCCT
3121 GGATGCCACG GATCAGGAAA GCCTGGAGCT GAAGCCAACC TCCCGAGCAG GCATCAAACA
3181 GAAAGGCCTT TTGCTAAGTA GCAGCCTGAT GCACTCCGAG TCAGAGCTGG ACAGCGACGA
3241 TGCCATCTTT ACATGGCCAG ACCGAGAGAA GGGCAAACTC CTGCATGGTC AGAATGGCTC
3301 TGTACCCAAC GGGCAGACCC CTCTGAAGGC CAGGAGCCCG CGGGAGGAGA TCCTGTAGCC
3361 ACCTGGTCTG TCTCCTCAGG GCAGGGCCCA GCACACTGCC CGGCCAGTCC TCCTACCTCC
3421 CGAGTCTGCG GGCAGCTGCT GTCCCAGCAT CTGCTGGTCA TTTCGCCCTG ACAGTCCCAA
3481 CCAGAACCCC TGGGACTTGA ATCCAGAGAC GTCCTCCAGG AACCCCTCAA CGAAGCTGTG
3541 AATGAAGAGG TTTCCTCTTT AAACCTGTCT GGTGGGCCCC CAGATATCCT CACCTCAGGG
3601 CCTCCTTTTT TTGCAAACTC CTCCCCTCCC CCGAGGGCAG ACCCAGCCAG CTGCTAAGCT
3661 CTGCAGCTCC CCAGTGGACA GTGTCATTGT GCCCAGAGTG CTGCAAGGTG AGGCCTGCTG
3721 TGCTGCCCGC ACACCTGAGT GCAAAACCAA GCACTGTGGG CATGGTGTTT CCCTCTCTGG
3781 GGTAGAGTAC GCCCTCTCGC TGGGCAAAGA GGAAGTGGCA CCCCTCCCCT CACCACAGAT
3841 GCTGAGATGG TAGCATAGAA ATGATGGCCG GGCGCGGTGG CTCACGCCTG TAATCCCAGC
3901 ACTTTGGGAG GCCGAGGCGG GCGGATCATG AGGTCAGGAG ATCAAGACCA CCCTGGCTAA
3961 CACGGTGAAA CCCCATCTCT ACTAAAAAAA AAAAAAAAAA A
B:氨基酸序列(SEQ ID NO:8) 长度:640
1 MEKRLGVKPN PASWILSGYY WQTSAKWLRS LYLFYTYFCF SVLWLSTDAS ESRCQQGKTQ
61 FGVGLRSGGE NHLWLLEGTP SLQSCWAACC QDSACHVFWW LEGMCIQADC SRPQSCRAFR
121 THSSNSMLVF LKKFQTADDL GFLPEDDVPH LLGLGWNWAS WRQSPPRAAL RPAVSSSDQQ
181 SLIRKLQKRG SPSDVVTPIV TQYSKVNDSN ELGGLTTSGS AEVHKAITIS SPLTTDLTAE
241 LSGGPKNVSV QPEISEGLAT TPSTQQVKSS EKTQIAVPQP VAPSYSYATP TPQASFQSTS
301 APYPVIKELV VSAGESVQIT LPKNEVQLNA YVLQEPPKGE TYTYDWQLIT HPRDYSGEME
361 GKHSQILKLS KLTPGLYEFK VIVEGQNAHG EGYVNVTVKP EPRKNRPPIA IVSPQFQEIS
421 LPTTSTyIDG SQSTDDDKIV QYHWEELKGP LREEKISEDT AILKLSKLyP GNYTFSLTyV
481 DSDGATNSTT ANLTVNKAVD YPPVANAGPN QVITLPQNST TLFGNQSTDD HGITSYEWSL
541 SPSSKGKVVE MQGVRTPTLQ LSAMQEGDYT YQLTVTDTIG QQATAQVTVI VQPENNKPPQ
601 ADAGPDKELT LPVDSTTLDG SKSSDDQKII SYLWEKNTGT
C.核苷酸及氨基酸组合序列(SEQ ID NO:9) 克隆号:PP791
起始编码子:208 ATG 终止编码子:2128 TGA 蛋白质分子量:70168.88
1 GGC TGT CCA GGG AGG CTG AGG CGA GAG GTA GCT GTC CGG GTG GGG AGC 48
49 CCG CAC TAC CTT CTT CCT CTT CCT CCT CCT CCG GGT GAG GGG AGC GAA 96
97 GGT TGG GGG TCC CCG AGC CCA TGG ACC AGG AAG AGG CGG AGG CCG CCG 144
145 AGA GCC GGG GCC CCG CTA TGT GGC CCT GAG CCC CGT GTA CTG GTT CTG 192
193 CCT GTC TGG AGG GCC ATG GAG AAG AGG CTG GGA GTC AAG CCA AAT CCT 240
1 Met Glu Lys Arg Leu Gly Val Lys Pro Asn Pro 11
241 GCT TCC TGG ATT TTA TCA GGA TAT TAT TGG CAG ACA TCT GCG AAG TGG 288
12 Ala Ser Trp Ile Leu Ser Gly Tyr Tyr Trp Gln Thr Ser Ala Lys Trp 27
289 TTG AGA AGC CTG TAC CTG TTT TAT ACT TAC TTT TGC TTC AGC GTT CTG 336
28 Leu Arg Ser Leu Tyr Leu Phe Tyr Thr Tyr Phe Cys Phe Ser Val Leu 43
337 TGG TTG TCA ACA GAT GCC AGT GAG AGC AGG TGC CAG CAG GGG AAG ACA 384
44 Trp Leu Ser Thr Asp Ala Ser Glu Ser Arg Cys Gln Gln Gly Lys Thr 59
385 CAA TTT GGA GTT GGC CTG AGA TCT GGG GGA GAA AAT CAC CTC TGG CTT 432
60 Gln Phe Gly yal Gly Leu Arg Ser Gly Gly Glu Asn His Leu Trp Leu 75
433 CTT GAA GGA ACC CCC TCT CTC CAG TCA TGT TGG GCT GCC TGC TGC CAG 480
76 Leu Glu Gly Thr Pro Ser Leu Gln Ser Cys Trp Ala Ala Cys Cys Gln 91
481 GAC TCT GCC TGC CAT GTC TTT TGG TGG CTA GAA GGG ATG TGC ATT CAG 528
92 Asp Ser Ala Cys His Val Phe Trp Trp Leu Glu Gly Met Cys Ile Gln 107
529 GCA GAC TGC AGC AGG CCC CAG AGC TGC CGG GCT TTT AGG ACA CAC TCC 576
108 Ala Asp Cys Ser Arg Pro Gln Ser Cys Arg Ala Phe Arg Thr His Ser 123
577 TCC AAT TCC ATG CTG GTG TTT TTA AAA AAA TTC CAA ACT GCA GAT GAT 624
124 Ser Asn Ser Met Leu Val Phe Leu Lys Lys Phe Gln Thr Ala Asp Asp 139
625 TTG GGC TTT CTA CCT GAA GAT GAT GTA CCA CAT CTT CTG GGG CTA GGT 672
140 Leu Gly Phe Leu Pro Glu Asp Asp Val Pro His Leu Leu Gly Leu Gly 155
673 TGG AAC TGG GCA TCT TGG AGG CAG AGC CCA CCC AGA GCT GCA CTC AGA 720
156 Trp Asn Trp Ala Ser Trp Arg Gln Ser Pro Pro Arg Ala Ala Leu Arg 171
721 CCT GCT GTA TCT TCC AGT GAC CAG CAG AGC TTA ATC AGG AAG CTT CAG 768
172 Pro Ala Val Ser Ser Ser Asp Gln Gln Ser Leu Ile Arg Lys Leu Gln 187
769 AAG AGA GGT AGT CCC AGT GAC GTA GTT ACA CCT ATA GTG ACA CAG TAT 816
188 Lys Arg Gly Ser Pro Ser Asp Val Val Thr Pro Ile Val Thr Gln Tyr 203
817 TCT AAA GTG AAT GAC TCC AAC GAA TTA GGT GGT CTG ACT ACC AGT GGC 864
204 Ser Lys Val Asn Asp Ser Asn Glu Leu Gly Gly Leu Thr Thr Ser Gly 219
865 TCT GCA GAG GTC CAC AAG GCG ATT ACA ATT TCC AGT CCC CTA ACC ACA 912
220 Ser Ala Glu Val His Lys Ala Ile Thr Ile Ser Ser Pro Leu Thr Thr 235
913 GAC TTG ACT GCA GAG CTG TCT GGT GGG CCA AAG AAT GTA TCA GTG CAA 960
236 Asp Leu Thr Ala Glu Leu Ser Gly Gly Pro Lys Asn Val Ser Val Gln 251
961 CCT GAA ATA TCA GAG GGT CTT GCT ACT ACG CCC AGC ACT CAA CAA GTA 1008
252 Pro Glu Ile Ser Glu Gly Leu Ala Thr Thr Pro Ser Thr Gln Gln Val 267
1009 AAA AGT TCT GAG AAA ACC CAG ATT GCT GTC CCC CAG CCA GTG GCT CCC 1056
268 Lys Ser Ser Glu LYs Thr Gln Ile Ala Val Pro Gln Pro Val Ala Pro 283
1057 TCC TAC AGT TAT GCT ACC CCT ACC CCC CAG GCC TCT TTC CAG AGC ACC 1104
284 Ser Tyr Ser Tyr Ala Thr Pro Thr Pro Gln Ala Ser Phe Gln Ser Thr 299
1105 TCA GCA CCA TAC CCA GTT ATA AAG GAA CTG GTG GTA TCT GCT GGA GAG 1152
300 Ser Ala Pro Tyr Pro Val Ile Lys Glu Leu Val Val Ser Ala Gly Glu 315
1153 AGT GTC CAG ATA ACC CTG CCT AAG AAT GAA GTT CAA TTA AAT GCA TAT 1200
316 Ser Val Gln Ile Thr Leu Pro Lys Asn Glu Val Gln Leu Asn Ala Tyr 331
1201 GTT CTC CAA GAA CCA CCT AAA GGA GAA ACC TAC ACC TAC GAC TGG CAG 1248
332 Val Leu Gln Glu Pro Pro Lys Gly Glu Thr Tyr Thr Tyr Asp Trp Gln 347
1249 CTG ATT ACT CAT CCT AGA GAC TAC AGT GGA GAA ATG GAA GGG AAA CAT 1296
348 Leu Ile Thr His Pro Arg Asp Tyr Ser Gly Glu Met Glu Gly Lys His 363
1297 TCC CAG ATC CTC AAA CTA TCG AAG CTC ACT CCA GGC CTG TAT GAA TTC 1344
364 Ser Gln Ile Leu Lys Leu Ser Lys Leu Thr Pro Gly Leu Tyr Glu Phe 379
1345 AAA GTG ATT GTA GAG GGT CAA AAT GCC CAT GGG GAA GGC TAT GTG AAC 1392
380 Lys Val Ile Val Glu Gly Gln Asn Ala His Gly Glu Gly Tyr Val Asn 395
1393 GTG ACA GTC AAG CCA GAG CCC CGT AAG AAT CGG CCC CCC ATT GCT ATT 1440
396 Val Thr Val Lys Pro Glu Pro Arg Lys Asn Arg Pro Pro Ile Ala Ile 411
1441 GTG TCA CCT CAG TTC CAG GAG ATC TCT TTG CCA ACC ACT TCT ACA GTC 1488
412 Val Ser Pro Gln Phe Gln Glu Ile Ser Leu Pro Thr Thr Ser Thr Val 427
1489 ATT GAT GGC AGT CAA AGC ACT GAT GAT GAT AAA ATC GTT CAG TAC CAT 1536
428 Ile Asp Gly Ser Gln Ser Thr Asp Asp Asp Lys Ile Val Gln Tyr His 443
1537 TGG GAA GAA CTT AAG GGG CCT CTA AGA GAA GAG AAG ATT TCT GAA GAT 1584
444 Trp Glu Glu Leu Lys Gly Pro Leu Arg Glu Glu Lys Ile Ser Glu Asp 459
1585 ACA GCC ATA TTA AAA CTA AGT AAA CTC GTC CCT GGG AAC TAC ACT TTC 1632
460 Thr Ala Ile Leu Lys Leu Ser Lys Leu Val Pro Gly Asn Tyr Thr Phe 475
1633 AGC TTG ACT GTA GTA GAC TCT GAT GGA GCT ACC AAC TCT ACT ACT GCA 1680
476 Ser Leu Thr Val Val Asp Ser Asp Gly Ala Thr Asn Ser Thr Thr Ala 491
1681 AAC CTG ACA GTG AAC AAA GCT GTG GAT TAC CCC CCT GTG GCC AAC GCA 1728
492 Asn Leu Thr Val Asn Lys Ala Val Asp Tyr Pro Pro Val Ala Asn Ala 507
1729 GGC CCC AAC CAA GTG ATC ACC CTG CCC CAA AAC TCC ACC ACC CTC TTT 1776
508 Gly Pro Asn Gln Val Ile Thr Leu Pro Gln Asn Ser Thr Thr Leu Phe 523
1777 GGG AAC CAG AGC ACT GAT GAT CAT GGC ATC ACC AGC TAT GAG TGG TCA 1824
524 Gly Asn Gln Ser Thr Asp Asp His Gly Ile Thr Ser Tyr Glu Trp Ser 539
1825 CTC AGC CCA AGC AGC AAA GGG AAA GTG GTG GAG ATG CAG GGT GTT AGA 1872
540 Leu Ser Pro Ser Ser Lys Gly Lys Val Val Glu Met Gln Gly Val Arg 555
1873 ACA CCA ACC TTA CAG CTC TCT GCG ATG CAA GAA GGA GAC TAC ACT TAC 1920
556 Thr Pro Thr Leu Gln Leu Ser Ala Met Gln Glu Gly Asp Tyr Thr Tyr 571
1921 CAG CTC ACA GTG ACT GAC ACA ATA GGA CAG CAG GCC ACT GCT CAA GTG 1968
572 Gln Leu Thr Val Thr Asp Thr Ile Gly Gln Gln Ala Thr Ala Gln Val 587
1969 ACC GTT ATT GTG CAA CCT GAA AAC AAT AAG CCT CCT CAG CCA GAT GCA 2016
588 Thr Val Ile Val Gln Pro Glu Asn Asn Lys Pro Pro Gln Ala Asp Ala 603
2017 GGC CCA GAT AAA GAG CTG ACC CTT CCT GTG GAT AGC ACA ACC CTG GAT 2064
604 Gly Pro Asp Lys Glu Leu Thr Leu Pro Val Asp Ser Thr Thr Leu Asp 619
2065 GGC AGC AAG AGC TCA GAT GAT CAG AAA ATT ATC TCA TAT CTC TGG GAA 2112
620 Gly Ser Lys Ser Ser Asp Asp Gln Lys Ile Ile Ser Tyr Leu Trp Glu 635
2113 AAA AAC ACA GGG ACC TGA TGG GGT GCA GCT CGA GAA TGC TAA CAG CAG 2160
636 Lys Asn Thr Gly Thr *** 641
2161 TGT TGC TAC TGT GAC TGG GCT GCA AGT GGG GAC CTA TGT GTT CAC CTT 2208
2209 GAC TGT CAA AGA TGA GAG GAA CCT GCA AAG CCA GAG CTC TGT GAA TGT 2256
2257 CAT TGT CAA AGA AGA AAT AAA CAA ACC ACC TAT AGC CAA GAT AAC TGG 2304
2305 GAA TGT GGT GAT TAC CCT ACC CAC GAG CAC AGC AGA GCT GGA TGG CTC 2352
2353 TAA GTC CTC AGA TGA CAA GGG AAT AGT CAG CTA CCT CTG GAC TCG AGA 2400
2401 TGA GGG GAG CCC AGC AGC AGG GGA GGT GTT AAA TCA CTC TGA CCA TCA 2448
2449 CCC TAT CCT TTT TCT TTC AAA CCT GGT TGA GGG AAC CTA CAC TTT TCA 2496
2497 CCT GAA AGT GAC CGA TGC AAA GGG TGA GAG TGA CAC AGA CCG GAC CAC 2544
2545 TGT GGA GGT GAA ACC TGA TCC CAG GAA AAA CAA CCT GGT GGA GAT CAT 2592
2593 CTT GGA TAT CAA CGT CAG TCA GCT AAC TGA GAG GCT GAA GGG GAT GTT 2640
2641 CAT CCG CCA GAT TGG GGT CCT CCT GGG GGT GCT GGA TTC CGA CAT CAT 2688
2689 TGT GCA AAA GAT TCA GCC GTA CAC GGA GCA GAG CAC CAA AAT GGT ATT 2736
2737 TTT TGT TCA AAA CGA GCC TCC CCA CCA GAT CTT CAA AGG CCA TGA GGT 2784
2785 GGC AGC GAT GCT CAA GAG TGA GCT GCG GAA GCA AAA GGC AGA CTT TTT 2832
2833 GAT ATT CAG AGC CTT GGA AGT CAA CAC TGT CAC ATG TCA GCT GAA CTG 2880
2881 TTC CGA CCA TGG CCA CTG TGA CTC GTT CAC CAA ACG CTG TAT CTG TGA 2928
2929 CCC TTT TTG GAT GGA GAA TTT CAT CAA GGT GCA GCT GAG GGA TGG AGA 2976
2977 CAG CAA CTG TGA GTG GAG CGT GTT ATA TGT TAT CAT TGC TAC CTT TGT 3024
3025 CAT TGT TGT TGC CTT GGG AAT CCT GTC TTG GAC TGT GAT CTG TTG TTG 3072
3073 TAA GAG GCA AAA AGG AAA ACC CAA GAG GAA AAG CAA GTA CAA GAT CCT 3120
3121 GGA TGC CAC GGA TCA GGA AAG CCT GGA GCT GAA GCC AAC CTC CCG AGC 3168
3169 AGG CAT CAA ACA GAA AGG CCT TTT GCT AAG TAG CAG CCT GAT GCA CTC 3216
3217 CGA GTC AGA GCT GGA CAG CGA CGA TGC CAT CTT TAC ATG GCC AGA CCG 3264
3265 AGA GAA GGG CAA ACT CCT GCA TGG TCA GAA TGG CTC TGT ACC CAA CGG 3312
3313 GCA GAC CCC TCT GAA GGC CAG GAG CCC GCG GGA GGA GAT CCT GTA GCC 3360
3361 ACC TGG TCT GTC TCC TCA GGG CAG GGC CCA GCA CAC TGC CCG GCC AGT 3408
3409 CCT CCT ACC TCC CGA GTC TGC GGG CAG CTG CTG TCC CAG CAT CTG CTG 3456
3457 GTC ATT TCG CCC TGA CAG TCC CAA CCA GAA CCC CTG GGA CTT GAA TCC 3504
3505 AGA GAC GTC CTC CAG GAA CCC CTC AAC GAA GCT GTG AAT GAA GAG GTT 3552
3553 TCC TCT TTA AAC CTG TCT GGT GGG CCC CCA GAT ATC CTC ACC TCA GGG 3600
3601 CCT CCT TTT TTT GCA AAC TCC TCC CCT CCC CCG AGG GCA GAC CCA GCC 3648
3649 AGC TGC TAA GCT CTG CAG CTC CCC AGT GGA CAG TGT CAT TGT GCC CAG 3696
3697 AGT GCT GCA AGG TGA GGC CTG CTG TGC TGC CCG CAC ACC TGA GTG CAA 3744
3745 AAC CAA GCA CTG TGG GCA TGG TGT TTC CCT CTC TGG GGT AGA GTA CGC 3792
3793 CCT CTC GCT GGG CAA AGA GGA AGT GGC ACC CCT CCC CTC ACC ACA GAT 3840
3841 GCT GAG ATG GTA GCA TAG AAA TGA TGG CCG GGC GCG GTG GCT CAC GCC 3888
3889 TGT AAT CCC AGC ACT TTG GGA GGC CGA GGC GGG CGG ATC ATG AGG TCA 3936
3937 GGA GAT CAA GAC CAC CCT GGC TAA CAC GGT GAA ACC CCA TCT CTA CTA 3984
3985 AAA AAA AAA AAA AAA AA 4001
4.PP1494
A:核苷酸序列(SEQ ID NO:10) 长度:1648
1 GAGTACGGAC TGGGCCTGGC CTGGGGCGTC CCCGCGAAGC CTGGGCCTGT CAGGCGGTTC
61 CGTCCGGGTC TCGGCCACCG TCGAGTTCCG TCGAGTTCCG TCCCGGCCCT GCTCACAGCA
121 GCGCCCTCGG AGCGCCCAGC ACCTGCGGCC GGCCAGGCAG CGCGATCCTG CGGCGTCTGG
181 CCATCCCGAA TGCTATGGCC GCCGTCGCCG TCTTGCGGGC CTTCGGGGCA AGTGGGCCCA
241 TGTGTCTCCG GCGCGGCCCC TGGGCCCAGC TCCCCGCCCG CTTCTGCAGC CGGGACCCGG
301 CCGGGGCGGG GCGGCGGGAG TCGGAGCCGC GGCCCACCAG CGCGCGGCAG CTGGACGGCA
361 TAAGGAACAT CGTCTTGAGC AATCCCAAGA AGAGGAACAC GTTGTCACTT GCAATGCTGA
421 AATCTCTCCA AAGTGACATT CTTCATGACG CTGACAGCAA CGATCTGAAA GTCATTATCA
481 TCTCGGCTGA GGGGCCTGTG TTTTCTTCTG GGCATGACTT AAAGGAGCTG ACAGAGGAGC
541 AAGGCCGTGA TTACCATGCC GAAGTATTTC AGACCTGTTC CAAGGTCATG ATGCACATCC
601 GGAACCACCC CGTCCCCGTC ATTGCCATGG TCAATGGCCT GGCCACGGCT GCCGGCTGTC
661 AACTGGTTGC CAGCTGCGAC ATTGCCGTGG CGAGCGACAA GTCCTCTTTT GCCACTCCTG
721 GGGTGAACGT CGGGCTCTTC TGTTCTACCC CTGGGGTTGC CTTGGCAAGA GCAGTGCCTA
781 GAAAGGTGGC CTTGGAGATG CTCTTTACTG GTGAGCCCAT TTCTGCCCAG GAGGCCCTGC
841 TCCACGGGCT GCTTAGCAAG GTGGTGCCAG AGGCGGAGCT GCAGGAGGAG ACCATGCGGA
901 TCGCTAGGAA GATCGCATCG CTGAGCCGTC CGGTGGTATC CCTGGGCAAA GCCACCTTCT
961 ACAAGCAGCT GCCCCAGGAC CTGGGGACAG CTTACTACCT CACCTCCCAG GCCATGGTGG
1021 ACAACCTGGC CCTGCGGGAC GGGCAGGAGG GCATCACGGC CTTCCTCCAG AAGAGAAAAC
1081 CTGTCTGGTC ACACGAGCCA GTGTGAGTGG AGGCAGAGGA GTGAGGCCCA CGGGCAGCGC
1141 CCAGGAGCCC ACCTTCCCCT CTGGCCCAGC CACCACTGCC TCTCAGCTTA AACAGGTGAC
1201 AGGCTGCTTT CGTGACTTGA TATTGGTGTC ATAGCATTTG GCCTACATTA AAAGCCACAA
1261 TTTCATGGGG AAAGGACAAA ATGGAGGGTG ACTGAGGTGC TGACCTCAAT GCAAGGCTGG
1321 TGAACCCTGC AGCGGGCCAG CTATGGTGGG AAGCCTGGCA TTTGGGGTGC TCCTTGCAAC
1381 GTCTTAAGCA AGCGACCCCC CTGACATAGC AAAAGGTGGC AACCCATGGA GGCAGAAAGA
1441 AGGACGCCAG CCTGACCCTT ATCTGAAACG TCCTAAGCAG AGTTAATCCT GGCTGCTCAG
1501 GAGAGGCGAC ACATTTCAAA TCTCCACGAG ATATTCTCCA CACAGAAAAT CTTCTTGATT
1561 CTATAGAGAC TTAATCATGC CTATGGCTTT GAATAATCTT ATGTGATTTA AATAAATTAA
1621 ATCTTTATAA AAAAAAAAAA AAAAAAAA
B:氨基酸序列(SEQ ID NO:11) 长度:303
1 MAAVAVLRAF GASGPMCLRR GPWAQLPARF CSRDPAGAGR RESEPRPTSA RQLDGIRNIV
61 LSNPKKRNTL SLAMLKSLQS DILHDADSND LKVIIISAEG PVFSSGHDLK ELTEEQGRDY
121 HAEVFQTCSK VMMHIRNHPV PVIAMVNGLA TAAGCQLVAS CDIAVASDKS SFATPGVNVG
181 LFCSTPGVAL ARAVPRKVAL EMLFTGEPIS AQEALLHGLL SKVVPEAELQ EETMRIARKI
241 ASLSRPVVSL GKATFYKQLP QDLGTAYYLT SQAMVDNLAL RDGQEGITAF LQKRKPVWSH
301 EPV
C.核苷酸及氨基酸组合序列(SEQ ID NO:12) 克隆号:PP1494
起始编码子:195 ATG 终止编码子:1104 TGA 蛋白质分子量:32691.96
1 GA GTA CGG ACT GGG CCT GGC CTG GGG CGT CCC CGC GAA GCC TGG GCC 47
48 TGT CAG GCG GTT CCG TCC GGG TCT CGG CCA CCG TCG AGT TCC GTC GAG 95
96 TTC CGT CCC GGC CCT GCT CAC AGC AGC GCC CTC GGA GCG CCC AGC ACC 143
144 TGC GGC CGG CCA GGC AGC GCG ATC CTG CGG CGT CTG GCC ATC CCG AAT 191
192 GCT ATG GCC GCC GTC GCC GTC TTG CGG GCC TTC GGG GCA AGT GGG CCC 239
1 Met Ala Ala Val Ala Val Leu Arg Ala Phe Gly Ala Ser Gly Pro 15
240 ATG TGT CTC CGG CGC GGC CCC TGG GCC CAG CTC CCC GCC CGC TTC TGC 287
16 Met Cys Leu Arg Arg Gly Pro Trp Ala Gln Leu Pro Ala Arg Phe Cys 31
288 AGC CGG GAC CCG GCC GGG GCG GGG CGG CGG GAG TCG GAG CCG CGG CCC 335
32 Ser Arg Asp Pro Ala Gly Ala Gly Arg Arg Glu Ser Glu Pro Arg Pro 47
336 ACC AGC GCG CGG CAG CTG GAC GGC ATA AGG AAC ATC GTC TTG AGC AAT 383
48 Thr Ser Ala Arg Gln Leu Asp Gly Ile Arg Asn Ile Val Leu Ser Asn 63
384 CCC AAG AAG AGG AAC ACG TTG TCA CTT GCA ATG CTG AAA TCT CTC CAA 431
64 Pro Lys Lys Arg Asn Thr Leu Ser Leu Ala Met Leu Lys Ser Leu Gln 79
432 AGT GAC ATT CTT CAT GAC GCT GAC AGC AAC GAT CTG AAA GTC ATT ATC 479
80 Ser Asp Ile Leu His Asp Ala Asp Ser Asn Asp Leu Lys Val Ile Ile 95
480 ATC TCG GCT GAG GGG CCT GTG TTT TCT TCT GGG CAT GAC TTA AAG GAG 527
96 Ile Ser Ala Glu Gly Pro Val Phe Ser Ser Gly His Asp Leu Lys Glu 111
528 CTG ACA GAG GAG CAA GGC CGT GAT TAC CAT GCC GAA GTA TTT CAG ACC 575
112 Leu Thr Glu Glu Gln Gly Arg Asp Tyr His Ala Glu Val Phe Gln Thr 127
576 TGT TCC AAG GTC ATG ATG CAC ATC CGG AAC CAC CCC GTC CCC GTC ATT 623
128 Cys Ser Lys Val Met Met His Ile Arg Asn His Pro Val Pro Val Ile 143
624 GCC ATG GTC AAT GGC CTG GCC ACG GCT GCC GGC TGT CAA CTG GTT GCC 671
144 Ala Met Val Asn Gly Leu Ala Thr Ala Ala Gly Cys Gln Leu Val Ala 159
672 AGC TGC GAC ATT GCC GTG GCG AGC GAC AAG TCC TCT TTT GCC ACT CCT 719
160 Ser Cys Asp Ile Ala Val Ala Ser Asp Lys Ser Ser Phe Ala Thr Pro 175
720 GGG GTG AAC GTC GGG CTC TTC TGT TCT ACC CCT GGG GTT GCC TTG GCA 767
176 Gly Val Asn Val Gly Leu Phe Cys Ser Thr Pro Gly Val Ala Leu Ala 191
768 AGA GCA GTG CCT AGA AAG GTG GCC TTG GAG ATG CTC TTT ACT GGT GAG 815
192 Arg Ala Val Pro Arg Lys Val Ala Leu Glu Met Leu Phe Thr Gly Glu 207
816 CCC ATT TCT GCC CAG GAG GCC CTG CTC CAC GGG CTG CTT AGC AAG GTG 863
208 Pro Ile Ser Ala Gln Glu Ala Leu Leu His Gly Leu Leu Ser Lys Val 223
864 GTG CCA GAG GCG GAG CTG CAG GAG GAG ACC ATG CGG ATC GCT AGG AAG 911
224 Val Pro Glu Ala Glu Leu Gln Glu Glu Thr Met Arg Ile Ala Arg Lys 239
912 ATC GCA TCG CTG AGC CGT CCG GTG GTA TCC CTG GGC AAA GCC ACC TTC 959
240 Ile Ala Ser Leu Ser Arg Pro Val Val Ser Leu Gly Lys Ala Thr Phe 255
960 TAC AAG CAG CTG CCC CAG GAC CTG GGG ACA GCT TAC TAC CTC ACC TCC 1007
256 Tyr Lys Gln Leu Pro Gln Asp Leu Gly Thr Ala Tyr Tyr Leu Thr Ser 271
1008 CAG GCC ATG GTG GAC AAC CTG GCC CTG CGG GAC GGG CAG GAG GGC ATC 1055
272 Gln Ala Met Val Asp Asn Leu Ala Leu Arg Asp Gly Gln Glu Gly Ile 287
1056 ACG GCC TTC CTC CAG AAG AGA AAA CCT GTC TGG TCA CAC GAG CCA GTG 1103
288 Thr Ala Phe Leu Gln Lys Arg Lys Pro Val Trp Ser His Glu Pro Val 303
1104 TGA GTG GAG GCA GAG GAG TGA GGC CCA CGG GCA GCG CCC AGG AGC CCA 1151
304 *** 304
1152 CCT TCC CCT CTG GCC CAG CCA CCA CTG CCT CTC AGC TTA AAC AGG TGA 1199
1200 CAG GCT GCT TTC GTG ACT TGA TAT TGG TGT CAT AGC ATT TGG CCT ACA 1247
1248 TTA AAA GCC ACA ATT TCA TGG GGA AAG GAC AAA ATG GAG GGT GAC TGA 1295
1296 GGT GCT GAC CTC AAT GCA AGG CTG GTG AAC CCT GCA GCG GGC CAG CTA 1343
1344 TGG TGG GAA GCC TGG CAT TTG GGG TGC TCC TTG CAA CGT CTT AAG CAA 1391
1392 GCG ACC CCC CTG ACA TAG CAA AAG GTG GCA ACC CAT GGA GGC AGA AAG 1439
1440 AAG GAC GCC AGC CTG ACC CTT ATC TGA AAC GTC CTA AGC AGA GTT AAT 1487
1488 CCT GGC TGC TCA GGA GAG GCG ACA CAT TTC AAA TCT CCA CGA GAT ATT 1535
1536 CTC CAC ACA GAA AAT CTT CTT GAT TCT ATA GAG ACT TAA TCA TGC CTA 1583
1584 TGG CTT TGA ATA ATC TTA TGT GAT TTA AAT AAA TTA AAT CTT TAT AAA 1631
1632 AAA AAA AAA AAA AAA AA 1648
5.PP2386
A:核苷酸序列(SEQ ID NO:13) 长度:3835
1 CAGCAGGTGA GGGTGTGAGG ACAGGGGTTG CGGGAGGTGT CCAGGGCCCT GCACTGGGCC
61 CTGGCCAAGC CTAGCCAGTG GAGAAGGGAC AATGTTCACC CCTTCCCCCA TGTCTTGCAC
121 GGTCCCCTCT TGGCCTTGGG CTGAGTTGAA CACACAGGCA GCACAGGGAA GTACACGGGG
181 TGGACTGGCC TCTGGCACTG TCTGAACCCT AACACCAGTG GTGAATTTGT TTCCATGGAA
241 ACATGGCACT GTGTCCAGAC AACTGAATTC TGCCTCACCT TGTTCATAAA CTAGGGATTG
301 TCTGATATTG GTTTGTGTGG TTAGGCTTCT AGAGCTTATT AGAATAGACA TTGCAGATTA
361 TTATTTTGTA AAGGGTGACA TTGACTAAAA TAGAATAATG TCTTCATCGG TGAACAAGGG
421 TGTTTACTGA ATGTGGAGAA GTCAGTGAAA TCTCCACAGT GACAGATGCA CTCTGGAGAT
481 GGGGCTGAGG CTAGGTGTGC ACCTCCCCTG CCAGCCATCA GCAGCCTGCC CACGTCTGTC
541 GCGAAATGAG TTGTTGATCT TAAATTTCTG CAAATGTTTC TTGTTACAGA GTATGGTGTT
601 TGCGAAAACT TGCGGAAGCT GGAGATCACA GGCGTGTCTT GTCGGGACGT CTATGCGAAG
661 CTGCTTCACC GATATAGACA CATTTTGGGA TTGTGGCAGC CAGATATCGG GCCATACGGA
721 GGACTGCTGA ACGTGGTGGT GGACGGCCTG TTCATCATCG GGTGGATGTA CCTGCCTCCC
781 CATGACCCCC ACGTCGATGA CCCTATGAGA TTCAAGCCTC TGTTCAGGAT CCACCTGATG
841 GAGAGGAAGG CTGCCACAGT GGAGTGCATG TACGGCCACA AAGGGCCCCA CCACGGCCAC
901 ATCCAGATTG TGAAGAAGGA TGAGTTCTCC ACCAAGTGCA ACCAGACGGA CCACCACAGG
961 ATGTCCGGCG GGAGGCAGGA GGAGTTTCGG ACGTGGCTGA GGGAGGAATG GGGGCGCACG
1021 CTGGAGGACA TCTTCCACGA GCACATGCAG GAGCTCATCC TGATGAAGTT CATCTACACC
1081 AGTCAGTACG ACAACTGCCT GACCTACCGC CGCATCTACC TGCCGCCCAG CCGCCCCGAC
1141 GACCTCATCA AGCCTGGCCT CTTCAAAGGT ACCTATGGCA GCCACGGCCT GGAGATTGTG
1201 ATGCTCAGCT TCCACGGCCG GCGTGCCAGG GGCACCAAGA TCACGGGCGA CCCCAACATC
1261 CCCGCTGGGC AGCAGACAGT GGAGATCGAC CTGAGGCATC GGATCCAGCT GCCCGACCTC
1321 GAGAACCAGC GCAACTTCAA TGAGCTCTCC CGCATCGTCC TGGAGGTGCG CGAGAGGGTG
1381 CGCCAGGAGC AGCAGGAAGG CGGGCACGAG GCGGGCGAGG GTCGTGGCCG GCAGGGCCCC
1441 CGGGAGTCCG AGCCAAGCCC TGCCCAGCCC AGGGCAGAGG CGCCCAGCAA GGGCCCAGAT
1501 GGGACACCTG GTGAGGATGG TGGCGAGCCT GGGGATGCCG TAGCTGCGGC CGAGCAGCCT
1561 GCCCAGTGTG GGCAGGGGCA GCCGTTCGTG CTGCCCGTGG GCGTGAGCTC CAGGAATGAG
1621 GACTACCCCC GAACCTGCAG GATGTGTTTT TATGGCACAG GCCTCATCGC GGGCCACGGC
1681 TTCACCAGCC CTGAACGCAC CCCCGGGGTC TTCATCCTCT TCGATGAGGA CCGTTCGGGT
1741 TCGTCTGGCT GGAGCTGAAA TCCTTCAGCC TGTACAGCCG GGTCCAGGCC ACCTTCCGGA
1801 ACGCAGATGC GCCGTCCCCA CAGGCCTTCG ATGAGATGCT CAAGAACATT CAGTCCCTCA
1861 CCTCCTGACC GGCCACATCC TTGCCGCCAC ATCCCGGGTG GCTCTGGGGC TCTGAACTCT
1921 GACCTGTGAA TAGAAGCAGC ATGCACTTTG GAAATCCGGC CTTTTGACCA GAACGCACAC
1981 CTCGTCGGGG GGCCCAGTCC AGCCACCCCC CAGCACTTTA TGTAGAGAGT GTGACATAGA
2041 CCTGCATATT TGTCAGTGCC ATGATGGAAG AAGCTGAGCA TGTCTTACCA AAAACAGAGA
2101 GAACGAGCCT GAATACAGCA GATGTAGGGG ACAGCCGTGG GACCGCGTGA GAATTGAAGC
2161 GGTGGGGTTC CCGCACCCTG GGCTGGCTGG TGGTTTTCTC GGGAAGCAGG ACCCTCCTGA
2221 CTGGTGCTCT TCCTGTGAGC GGATAGAGTG ATAGACTGGG TCGTGTGTGA GACGCATGTG
2281 CTCCACCCCA CTCCTTTTGG GGGAAGCCAG GCAACAGTGG CCTCTGGGAG GGGGTCAGGA
2341 AGAGGCGAAC AGCTCAGGCA GCGCAGGTGT GATGGGCACA GTACGCAGAG CAAGCTCGGG
2401 AAGTTGGTAG GATCTCAGGC TTGGGGCCGG GACTCTGGAG TGAATCCCCA TTTCTCTACC
2461 GGCTTGCTTG GAGTTTGGAC AGAAGCATTT CACCTCTGAT CTCAGCTTCC CCACCTGTGG
2521 AGTGGGTTTA GTGACCTGAG TCACTAGGGA ATGTCACCTG AATGCACAGC CCAGCCCATG
2581 CACCTGCCCC AGCCCCTCCA GCTTTGGAGC CAAGGCCATC GTTCCAGCCA CTTGACTGTC
2641 CTCGACGGCC TGTTCCAGAC AGGGCGTTTG TTTTGTCCAT GCCTTCCTCC CTGCACGCAC
2701 ACGGCGTCAA AACCAAGCTG CCGGCCACTG TCTCCAGAAC GCAAGGCTCC AGGCCCGTGT
2761 GTCTGAAGCA GTGAGTGGTC CACACATGTG CCAGGAGTGC CCATATGAGA TGACGAGGAA
2821 ACCCCTTTGC AGGTGAGGGG ACAGCTTTCT AGAAAAGCCA CACCTGCATC TGGGGACACA
2881 CTTTGGAAAG TGGGACCCTC CAGCCTGGAG ACCCCATGGA CTGATGCCTC CACTGCTGTG
2941 TGCCCCATGT TGTGTTAACA CCTGCGTGTG GGGACCCCAT CTGAGGTCTT GCCTGACCTT
3001 GGCATCTCCT GAAGAACAGA GAGCACGGTG TCCAGAGCTG GCCCTTCCCC CAGCCCACAG
3061 CCAGCTCCGT GCCCGAGTGG GCGTCCCCAG CGAGCCTTCC CTCTCTGCCG CTTGTCCTTG
3121 TGTCTGGGCT GCTCCAAGTC CTTGTGCTGG GCACCCTGGA CACGTCCTGC TGGTGAGGGA
3181 CCTCGGGAAG GTGACAGTCT GTGTGCCTTG GTGTGGAGAC CAACCTGAGG ATGTCCTGGG
3241 AAATGTTTTC CTGATGAATT TCTCCTTGAC TGGCCTTTAA AGAACATAAG AATTCCCATT
3301 GCCCAGCCTC AGTGCATTTG GCAAATGCTT ACTTTGCTTC CCAGAGTCAG AGAATTGGCA
3361 AAGGTTCCTA AATGGTAATC TGGCCGGCCT GGGAGAAAGA CTCACGAGAA AAGCCAGTGG
3421 AGAAAGCGCC CTTCCAGGCG GCAGCAGCGG GAGCCACGCA GACCCCGAGG CGCACCTGCT
3481 GGCTCTTGTG TGTGGCCCCA GTTTCTAGCG GCTTTTGCAG CATTAGCCTA CAAGCTTTGT
3541 CACTCCCTGC CCTCTGTGGT GGTCACTGTT TTTCTCTCTT GCCAAATGAG GCAGTCTCTG
3601 AGTGACGGTG ACTGTGGCCT TGAAGCCTGG AGGACTGTTG GGCATGTAGA CTGGCACCTT
3661 GAAGATTCAC CATTGTTTAA ATAAAATCAA GCAAATGCTT TTTTACCAAG AGCCCGAGCC
3721 TCGCTCTAAG GGACGCAGTC CTAGAGGCGT GCCCTTTGGG GCTTGAAGAG CACACTGTGG
3781 GACGCACGTG CTTCTGATTA AAGGAATCTC AGATCTCAAA AAAAAAAAAA AAAAA
B:氨基酸序列(SEQ ID NO:14) 长度:394
1 MFLVTEYGVC ENLRKLEITG VSCRDVYAKL LHRYRHILGL WQPDIGPYGG LLNVVVDGLF
61 IIGWMYLPPH DPHVDDPMRF KPLFRIHLME RKAATVECMY GHKGPHHGHI QIVKKDEFST
121 KCNQTDHHRM SGGRQEEFRT WLREEWGRTL EDIFHEHMQE LILMKFIYTS QYDNCLTYRR
181 IYLPPSRPDD LIKPGLFKGT YGSHGLEIVM LSFHGRRARG TKITGDPNIP AGQQTVEIDL
241 RHRIQLPDLE NQRNFNELSR IVLEVRERVR QEQQEGGHEA GEGRGRQGPR ESEPSPAQPR
301 AEAPSKGPDG TPGEDGGEPG DAVAAAEQPA QCGQGQPFVL PVGVSSRNED YPRTCRMCFY
361 GTGLIAGHGF TSPERTPGVF ILFDEDRSGS SGWS
C.核苷酸及氨基酸组合序列(SEQ ID NO:15) 克隆号:PP2386
起始编码子:574 ATG 终止编码子:1756 TGA 蛋白质分子量:44662.29
1 CAG CAG GTG AGG GTG TGA GGA CAG GGG TTG CGG GAG GTG TCC AGG GCC 48
49 CTG CAC TGG GCC CTG GCC AAG CCT AGC CAG TGG AGA AGG GAC AAT GTT 96
97 CAC CCC TTC CCC CAT GTC TTG CAC GGT CCC CTC TTG GCC TTG GGC TGA 144
145 GTT GAA CAC ACA GGC AGC ACA GGG AAG TAC ACG GGG TGG ACT GGC CTC 192
193 TGG CAC TGT CTG AAC CCT AAC ACC AGT GGT GAA TTT GTT TCC ATG GAA 240
241 ACA TGG CAC TGT GTC CAG ACA ACT GAA TTC TGC CTC ACC TTG TTC ATA 288
289 AAC TAG GGA TTG TCT GAT ATT GGT TTG TGT GGT TAG GCT TCT AGA GCT 336
337 TAT TAG AAT AGA CAT TGC AGA TTA TTA TTT TGT AAA GGG TGA CAT TGA 384
385 CTA AAA TAG AAT AAT GTC TTC ATC GGT GAA CAA GGG TGT TTA CTG AAT 432
433 GTG GAG AAG TCA GTG AAA TCT CCA CAG TGA CAG ATG CAC TCT GGA GAT 480
481 GGG GCT GAG GCT AGG TGT GCA CCT CCC CTG CCA GCC ATC AGC AGC CTG 528
529 CCC ACG TCT GTC GCG TTA TGA GTT GTT GAT CTT AAA TTT CTG CAA ATG 576
1 Met 1
577 TTT CTT GTT ACA GAG TAT GGT GTT TGC GAA AAC TTG CGG AAG CTG GAG 624
2 Phe Leu Val Thr Glu Tyr Gly Val Cys Glu Asn Leu Arg Lys Leu Glu 17
625 ATC ACA GGC GTG TCT TGT CGG GAC GTC TAT GCG AAG CTG CTT CAC CGA 672
18 Ile Thr Gly Val Ser Cys Arg Asp Val Tyr Ala Lys Leu Leu His Arg 33
673 TAT AGA CAC ATT TTG GGA TTG TGG CAG CCA GAT ATC GGG CCA TAC GGA 720
34 Tyr Arg His Ile Leu Gly Leu Trp Gln Pro Asp Ile Gly Pro Tyr Gly 49
721 GGA CTG CTG AAC GTG GTG GTG GAC GGC CTG TTC ATC ATC GGG TGG ATG 768
50 Gly Leu Leu Asn Val Val Val Asp Gly Leu Phe Ile Ile Gly Trp Met 65
769 TAC CTG CCT CCC CAT GAC CCC CAC GTC GAT GAC CCT ATG AGA TTC AAG 816
66 Tyr Leu Pro Pro His Asp Pro His Val Asp Asp Pro Met Arg Phe Lys 81
817 CCT CTG TTC AGG ATC CAC CTG ATG GAG AGG AAG GCT GCC ACA GTG GAG 864
82 Pro Leu Phe Arg Ile His Leu Met Glu Arg Lys Ala Ala Thr Val Glu 97
865 TGC ATG TAC GGC CAC AAA GGG CCC CAC CAC GGC CAC ATC CAG ATT GTG 912
98 Cys Met Tyr Gly His Lys Gly Pro His His Gly His Ile Gln Ile Val 113
913 AAG AAG GAT GAG TTC TCC ACC AAG TGC AAC CAG ACG GAC CAC CAC AGG 960
114 Lys Lys Asp Glu Phe Ser Thr Lys Cys Asn Gln Thr Asp His His Arg 129
961 ATG TCC GGC GGG AGG CAG GAG GAG TTT CGG ACG TGG CTG AGG GAG GAA 1008
130 Met Ser Gly Gly Arg Gln Glu Glu Phe Arg Thr Trp Leu Arg Glu Glu 145
1009 TGG GGG CGC ACG CTG GAG GAC ATC TTC CAC GAG CAC ATG CAG GAG CTC 1056
146 Trp Gly Arg Thr Leu Glu Asp Ile Phe His Glu His Met Gln Glu Leu 161
1057 ATC CTG ATG AAG TTC ATC TAC ACC AGT CAG TAC GAC AAC TGC CTG ACC 1104
162 Ile Leu Met Lys Phe Ile Tyr Thr Ser Gln Tyr Asp Asn Cys Leu Thr 177
1105 TAC CGC CGC ATC TAC CTG CCG CCC AGC CGC CCC GAC GAC CTC ATC AAG 1152
178 Tyr Arg Arg Ile Tyr Leu Pro Pro Ser Arg Pro Asp Asp Leu Ile Lys 193
1153 CCT GGC CTC TTC AAA GGT ACC TAT GGC AGC CAC GGC CTG GAG ATT GTG 1200
194 Pro Gly Leu Phe Lys Gly Thr Tyr Gly Ser His Gly Leu Glu Ile Val 209
1201 ATG CTC AGC TTC CAC GGC CGG CGT GCC AGG GGC ACC AAG ATC ACG GGC 1248
210 Met Leu Ser Phe His Gly Arg Arg Ala Arg Gly Thr Lys Ile Thr Gly 225
1249 GAC CCC AAC ATC CCC GCT GGG CAG CAG ACA GTG GAG ATC GAC CTG AGG 1296
226 Asp Pro Asn Ile Pro Ala Gly Gln Gln Thr Val Glu Ile Asp Leu Arg 241
1297 CAT CGG ATC CAG CTG CCC GAC CTC GAG AAC CAG CGC AAC TTC AAT GAG 1344
242 His Arg Ile Gln Leu Pro Asp Leu Glu Asn Gln Arg Asn Phe Asn Glu 257
1345 CTC TCC CGC ATC GTC CTG GAG GTG CGC GAG AGG GTG CGC CAG GAG CAG 1392
258 Leu Ser Arg Ile Val Leu Glu Val Arg Glu Arg Val Arg Gln Glu Gln 273
1393 CAG GAA GGC GGG CAC GAG GCG GGC GAG GGT CGT GGC CGG CAG GGC CCC 1440
274 Gln Glu Gly Gly His Glu Ala Gly Glu Gly Arg Gly Arg Gln Gly Pro 289
1441 CGG GAG TCC GAG CCA AGC CCT GCC CAG CCC AGG GCA GAG GCG CCC AGC 1488
290 Arg Glu Ser Glu Pro Ser Pro Ala Gln Pro Arg Ala Glu Ala Pro Ser 305
1489 AAG GGC CCA GAT GGG ACA CCT GGT GAG GAT GGT GGC GAG CCT GGG GAT 1536
306 Lys Gly Pro Asp Gly Thr Pro Gly Glu Asp Gly Gly Glu Pro Gly Asp 321
1537 GCC GTA GCT GCG GCC GAG CAG CCT GCC CAG TGT GGG CAG GGG CAG CCG 1584
322 Ala Val Ala Ala Ala Glu Gln Pro Ala Gln Cys Gly Gln Gly Gln Pro 337
1585 TTC GTG CTG CCC GTG GGC GTG AGC TCC AGG AAT GAG GAC TAC CCC CGA 1632
338 Phe Val Leu Pro Val Gly Val Ser Ser Arg Asn Glu Asp Tyr Pro Arg 353
1633 ACC TGC AGG ATG TGT TTT TAT GGC ACA GGC CTC ATC GCG GGC CAC GGC 1680
354 Thr Cys Arg Met Cys Phe Tyr Gly Thr Gly Leu Ile Ala Gly His Gly 369
1681 TTC ACC AGC CCT GAA CGC ACC CCC CGG GTC TTC ATC CTC TTC GAT GAG 1728
370 Phe Thr Ser Pro Glu Arg Thr Pro Gly Val Phe Ile Leu Phe Asp Glu 385
1729 GAC CGT TCG GGT TCG TCT GGC TGG AGC TGA AAT CCT TCA GCC TGT ACA 1776
386 Asp Arg Ser Gly Ser Ser Gly Trp Ser *** 395
1777 GCC GGG TCC AGG CCA CCT TCC GGA ACG CAG ATG CGC CGT CCC CAC AGG 1824
1825 CCT TCG ATG AGA TGC TCA AGA ACA TTC AGT CCC TCA CCT CCT GAC CGG 1872
1873 CCA CAT CCT TGC CGC CAC ATC CCG GGT GGC TCT GGG GCT CTG AAC TCT 1920
1921 GAC CTG TGA ATA GAA GCA GCA TGC ACT TTG GAA ATC CGG CCT TTT GAC 1968
1969 CAG AAC GCA CAC CTC GTC GGG GGG CCC AGT CCA GCC ACC CCC CAG CAC 2016
2017 TTT ATG TAG AGA GTG TGA CAT AGA CCT GCA TAT TTG TCA GTG CCA TGA 2064
2065 TGG AAG AAG CTG AGC ATG TCT TAC CAA AAA CAG AGA GAA CGA GCC TGA 2112
2113 ATA CAG CAG ATG TAG GGG ACA GCC GTG GGA CCG CGT GAG AAT TGA AGC 2160
2161 GGT GGG GTT CCC GCA CCC TGG GCT GGC TGG TGG TTT TCT CGG GAA GCA 2208
2209 GGA CCC TCC TGA CTG GTG CTC TTC CTG TGA GCG GAT AGA GTG ATA GAC 2256
2257 TGG GTC GTG TGT GAG ACG CAT GTG CTC CAC CCC ACT CCT TTT GGG GGA 2304
2305 AGC CAG GCA ACA GTG GCC TCT GGG AGG GGG TCA GGA AGA GGC GAA CAG 2352
2353 CTC AGG CAG CGC AGG TGT GAT GGG CAC AGT ACG CAG AGC AAG CTC GGG 2400
2401 AAG TTG GTA GGA TCT CAG GCT TGG GGC CGG GAC TCT GGA GTG AAT CCC 2448
2449 CAT TTC TCT ACC GGC TTG CTT GGA GTT TGG ACA GAA GCA TTT CAC CTC 2496
2497 TGA TCT CAG CTT CCC CAC CTG TGG AGT GGG TTT AGT GAC CTG AGT CAC 2544
2545 TAG GGA ATG TCA CCT GAA TGC ACA GCC CAG CCC ATG CAC CTG CCC CAG 2592
2593 CCC CTC CAG CTT TGG AGC CAA GGC CAT CGT TCC AGC CAC TTG ACT GTC 2640
2641 CTC GAC GGC CTG TTC CAG ACA GGG CGT TTG TTT TGT CCA TGC CTT CCT 2688
2689 CCC TGC ACG CAC ACG GCG TCA AAA CCA AGC TGC CGG CCA CTG TCT CCA 2736
2737 GAA CGC AAG GCT CCA GGC CCG TGT GTC TGA AGC AGT GAG TGG TCC ACA 2784
2785 CAT GTG CCA GGA GTG CCC ATA TGA GAT GAC GAG GAA ACC CCT TTG CAG 2832
2833 GTG AGG GGA CAG CTT TCT AGA AAA GCC ACA CCT GCA TCT GGG GAC ACA 2880
2881 CTT TGG AAA GTG GGA CCC TCC AGC CTG GAG ACC CCA TGG ACT GAT GCC 2928
2929 TCC ACT GCT GTG TGC CCC ATG TTG TGT TAA CAC CTG CGT GTG GGG ACC 2976
2977 CCA TCT GAG GTC TTG GCT GAG GTT GGC ATC TCC TGA AGA ACA GAG AGC 3024
3025 ACG GTG TCC AGA GCT GGC CCT TCC CCC AGC CCA CAG CCA GCT CCG TGC 3072
3073 CCG AGT GGG CGT CCC CAG CGA GCC TTC CCT CTC TGC CGC TTG TCC TTG 3120
3121 TGT CTG GGC TGC TCC AAG TCC TTG TGC TGG GCA CCC TGG ACA CGT CCT 3168
3169 GCT GGT GAG GGA CCT CGG GAA GGT GAC AGT CTG TGT GCC TTG GTG TGG 3216
3217 AGA CCA ACC TGA GGA TGT CCT GGG AAA TGT TTT CCT GAT GAA TTT CTC 3264
3265 CTT GAC TGG CCT TTA AAG AAC ATA AGA ATT CCC ATT GCC CAG CCT CAG 3312
3313 TGC ATT TGG CAA ATG CTT ACT TTG CTT CCC AGA GTC AGA GAA TTG GCA 3360
3361 AAG GTT CCT AAA TGG TAA TCT GGC CGG CCT GGG AGA AAG ACT CAC GAG 3408
3409 AAA AGC CAG TGG AGA AAG CGC CCT TCC AGG CGG CAG CAG CGG GAG CCA 3456
3457 CGC AGA CCC CGA GGC GCA CCT GCT GGC TCT TGT GTG TGG CCC CAG TTT 3504
3505 CTA GCG GCT TTT GCA GCA TTA GCC TAC AAG CTT TGT CAC TCC CTG CCC 3552
3553 TCT GTG GTG GTC ACT GTT TTT CTC TCT TGC CAA ATG AGG CAG TCT CTG 3600
3601 AGT GAC GGT GAC TGT GGC CTT GAA GCC TGG AGG ACT GTT GGG CAT GTA 3648
3649 GAC TGG CAC CTT GAA GAT TCA CCA TTG TTT AAA TAA AAT CAA GCA AAT 3696
3697 GCT TTT TTA CCA AGA GCC CGA GCC TCG CTC TAA GGG ACG CAG TCC TAG 3744
3745 AGG CGT GCC CTT TGG GGC TTG AAG AGC ACA CTG TGG GAC GCA CGT GCT 3792
3793 TCT GAT TAA AGG AAT CTC AGA TCT CAA AAA AAA AAA AAA AAA A 3835
6.PP6170
A:核苷酸序列(SEQ ID NO:16) 长度:1715
1 GTTTTGTCTG GGGGTCGTTG CCCCCCCACT GTTGGCACCT CCCAACACAC TGCCACGTGG
61 GGGTGGAGGT GGCAGCCCCC ATGAGACCCA GCCCCAGCTC AGCCCCTCAC AGGCAAGATG
121 TCAGCCCCAC CCAGGTTGGT CGGTCTCTCT CTCTCTGTCT CTCCCACCCC CTTCTCTACC
181 CCCGTCCCTT GCCTTAAACC CCTGATCCTG CTCTCCTCTG CCCCTGCCGC CCCCACCTGC
241 CTTTTTTAGA CAAAACCAGG GGTGATCCAG CCATTGGCTC AGGCCTGGCC AAGGGGCTCC
301 CCAGCCCCCA GGGGCAGAGG TTGTCCCCAC TCCGTGAGTG CTCTGTCCCG TGGGTGGGGG
361 TGGCAGAGCC TCCTTCCCCA GCAGGATGGT GGGTGGGGAT CAAAGGCAGG CGGGGGGACA
421 GGCGGGGGGA CAGCCGGTGG TGAGTTGCAC ACAGCTGCAG CCCCGACAGC TGCCCCAGCA
481 TAGCTCACAA GAGCCCCACC CCCCAGCCGC CCTCCCCGCC TTCTCCGGAT GAGCTGCCCG
541 CCAATGTGAA GCAGGCCTAC AGGGCCTTCG CGGCCGTGCC CACTTCTCAC CCGCCTGAGG
601 ATGCCCCTGC CCAGCCCCCC ACGCCTGGGC CTGCAGCCTC CCCGGAGCAG CTGTCCTTCC
661 GGGAGCGGCA GAAGTACTTT GAGCTGGAGG TGCGCGTGCC CCAGGCCGAG GGCCCCCCTA
721 AGCGCGTGTC CCTGGTGGGT GCTGCGACCT GCGGAAGATG CAGGAGGAGG AAGCCAGAAA
781 ACTACAGCAG AAGAGAGCGC AGATGCTGCG GGAGGCGGCA GAGGCTGGGG CCGAAGCGAG
841 GCTCGCCCTG GACGGGGAGA CGCTGGGCGA GGAGGAACAG GAGGATGAGC AGCCACCCTG
901 GGCCAGCCCG AGCCCCACCT CAAGAGCCCG GCGTCCCCCC CGCCCCTGGG AGGTGGCGCC
961 CCGGTGCGGA CGGCCAAAGC TGAACGGCGC CACCAGGAGC GGCTGCGCGT GCAGAGTCCG
1021 GAGCCACCGG CACCCGAGCG TGCCCTGTCC CCTGCCGAGC TCCGGGCCCT GGAGGCCGAG
1081 AAGCGTGCGC TGTGGAGGGC AGCCAGGATG AAGTCATTGG AACAGGACGC TCTCCGAGCA
1141 CAGATGGTCC TCAGCAGGTC CCAGGAAGGC CGGGGCACGC GGGGGCCCCT GGAGCGACTG
1201 GCCGAGGCCC CTTCCCCTGC GCCCACCCCG TCGCCCACCC CTGTGGAAGT CACCGGACTT
1261 TGCTGAGGAG TTGAGGTCCC TGGAACCATC TCCCAGCCCT GGCCCGCAGG AGGAGGATGG
1321 AGAAGTGGCT CTGGTGCTTC TGGGCAGGCC CTCACCCGGC GCTGTGGGCC CTGAAGATGT
1381 GGCACTGTGC AGCAGCCGCC GCCCCGTAAG GCCTGGGCGC CGTGGCCTGG GCCCTGTGCC
1441 CTCCTAGAGG AGCAGGCACC TCCCCCAGAC TTGGGGTGGG GGCCCTGCCA GCTCCAGCAC
1501 CACCCTTGCC CCAAGTCTTT TAACCTGGGT GTTAGCATTT TAAAGAGACC CCACAGGAGT
1561 TCTGGCCTGT GACTAACTAA CTGCCCCACC CCAGCCGAGA CCTCGGCGAG ACTGTAACTA
1621 GTGATGTTTG TACAACCAAA GACTCTATTT TGTGGTTTAA GGAGAATAAA GTTGACTACA
1681 TTTTAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAA
B:氨基酸序列(SEQ ID NO:17) 长度:117
1 MQEEEARKLQ QKRAQMLREA AEAGAEARLA LDGETLGEEE QEDEQPPWAS PSPTSRARRP
61 PRPWEVAPRC GRPKLNGATR SGCACRVRSH RHPSVPCPLP SSGPWRPRSV RCGGQPG
C.核苷酸及氨基酸组合序列(SEQ ID NO:18) 克隆号:PP6170
起始编码子:758 ATG 终止编码子:1109 TGA 蛋白质分子量:12911.82
1 G TTT TGT CTG GGG GTC GTT GCC CCC CCA CTG TTG GCA CCT CCC AAC 46
47 ACA CTG CCA CGT GGG GGT GGA GGT GGC AGC CCC CAT GAG ACC CAG CCC 94
95 CAG CTC AGC CCC TCA CAG GCA AGA TGT CAG CCC CAC CCA GGT TGG TCG 142
143 GTC TCT CTC TCT CTG TCT CTC CCA CCC CCT TCT CTA CCC CCG TCC CTT 190
191 GCC TTA AAC CCC TGA TCC TGC TCT CCT CTG CCC CTG CCG CCC CCA CCT 238
239 GCC TTT TTT AGA CAA AAC CAG GGG TGA TCC AGC CAT TGG CTC AGG CCT 286
287 GGC CAA GGG GCT CCC CAG CCC CCA GGG GCA GAG GTT GTC CCC ACT CCG 334
335 TGA GTG CTC TGT CCC GTG GGT GGG GGT GGC AGA GCC TCC TTC CCC AGC 382
383 AGG ATG GTG GGT GGG GAT CAA AGG CAG GCG GGG GGA CAG GCG GGG GGA 430
431 CAG CCG GTG GTG AGT TGC ACA CAG CTG CAG CCC CGA CAG CTG CCC CAG 478
479 CAT AGC TCA CAA GAG CCC CAC CCC CCA GCC GCC CTC CCC GCC TTC TCC 526
527 GGA TGA GCT GCC CGC CAA TGT GAA GCA GGC CTA CAG GGC CTT CGC GGC 574
575 CGT GCC CAC TTC TCA CCC GCC TGA GGA TGC CCC TGC CCA GCC CCC CAC 622
623 GCC TGG GCC TGC AGC CTC CCC GGA GCA GCT GTC CTT CCG GGA GCG GCA 670
671 GAA GTA CTT TGA GCT GGA GGT GCG CGT GCC CCA GGC CGA GGG CCC CCC 718
719 TAA GCG CGT GTC CCT GGT GGG TGC TGC GAC CTG CGG AAG ATG CAG GAG 766
1 Met Gln Glu 3
767 GAG GAA GCC AGA AAA CTA CAG CAG AAG AGA GCG CAG ATG CTG CGG GAG 814
4 Glu Glu Ala Arg Lys Leu Gln Gln Lys Arg Ala Gln Met Leu Arg Glu 19
815 GCG GCA GAG GCT GGG GCC GAA GCG AGG CTC GCC CTG GAC GGG GAG ACG 862
20 Ala Ala Glu Ala Gly Ala Glu Ala Arg Leu Ala Leu Asp Gly Glu Thr 35
863 CTG GGC GAG GAG GAA CAG GAG GAT GAG CAG CCA CCC TGG GCC AGC CCG 910
36 Leu Gly Glu Glu Glu Gln Glu Asp Glu Gln Pro Pro Trp Ala Ser Pro 51
911 AGC CCC ACC TCA AGA GCC CGG CGT CCC CCC CGC CCC TGG GAG GTG GCG 958
52 Ser Pro Thr Ser Arg Ala Arg Arg Pro Pro Arg Pro Trp Glu Val Ala 67
959 CCC CGG TGC GGA CGG CCA AAG CTG AAC GGC GCC ACC AGG AGC GGC TGC 1006
68 Pro Arg Cys Gly Arg Pro Lys Leu Asn Gly Ala Thr Arg Ser Gly Cys 83
1007 GCG TGC AGA GTC CGG AGC CAC CGG CAC CCG AGC GTG CCC TGT CCC CTG 1054
84 Ala Cys Arg yal Arg Ser His Arg His Pro Ser Val Pro Cys Pro Leu 99
1055 CCG AGC TCC GGG CCC TGG AGG CCG AGA AGC GTG CGC TGT GGA GGG CAG 1102
100 Pro Ser Ser Gly Pro Trp Arg Pro Arg Ser Val Arg Cys Gly Gly Gln 115
1103 CCA GGA TGA AGT CAT TGG AAC AGG ACG CTC TCC GAG CAC AGA TGG TCC 1150
116 Pro Gly *** 118
1151 TCA GCA GGT CCC AGG AAG GCC GGG GCA CGC GGG GGC CCC TGG AGC GAC 1198
1199 TGG CCG AGG CCC CTT CCC CTG CGC CCA CCC CGT CGC CCA CCC CTG TGG 1246
1247 AAG TCA CCG GAC TTT GCT GAG GAG TTG AGG TCC CTG GAA CCA TCT CCC 1294
1295 AGC CCT GGC CCG CAG GAG GAG GAT GGA GAA GTG GCT CTG GTG CTT CTG 1342
1343 GGC AGG CCC TCA CCC GGC GCT GTG GGC CCT GAA GAT GTG GCA CTG TGC 1390
1391 AGC AGC CGC CGC CCC GTA AGG CCT GGG CGC CGT GGC CTG GGC CCT GTG 1438
1439 CCC TCC TAG AGG AGC AGG CAC CTC CCC CAG ACT TGG GGT GGG GGC CCT 1486
1487 GCC AGC TCC AGC ACC ACC CTT GCC CCA AGT CTT TTA ACC TGG GTG TTA 1534
1535 GCA TTT TAA AGA GAC CCC ACA GGA GTT CTG GCC TGT GAC TAA CTA ACT 1582
1583 GCC CCA CCC CAG CCG AGA CCT CGG CGA GAC TGT AAC TAG TGA TGT TTG 1630
1631 TAC AAC CAA AGA CTC TAT TTT GTG GTT TAA GGA GAA TAA AGT TGA CTA 1678
1679 CAT TTT AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA A 1715
7.PP7684
A:核苷酸序列 (SEQ ID NO:19) 长度:1534
1 GCAGGCACTA AGCTGGGCAC TGGGAATGTA ATAAAATAGT CAAGGTCCCA CCTTCTAAGA
61 CTGTCCGACA GGGAAACGAA CAAGAGTCAA ATAAGGCAGA AGATGTGATG TAATACACCT
121 ACGAAATCTC AGAGGGTTGT AGGGTCGTGG GAGCTCAAGT GAGACACTTA ACCTGGCCTG
181 AGACATTCCA GAAGGCCTCC TGAAGAACTG ACATCTGAAC TGAGAACTGA AGGAAGATGA
241 GTACTAGTGA GGCTACCGGA CGTGAATGTG GAGATTGTGC AGGGCAATGC AAGAGGAGGC
301 TGTAGAAGTC AACCTGGCTA GATCACAGCG GGGTGTATGT GGGGCAGGAG CTTCTTTGTT
361 TGAATTTGCT CCTGAGAGGA TGAGGCCTCC TAGAGCACTG GCTCCTGGAC AGCAACCTCC
421 TTTGGTGCCT TGTGACCAGG GCCCTGATGG TTCATTAGAT GGAGCCTTCG AGTCTTAGGG
481 AGTTGCCGCA GGGTCCCCAC AGCGGCTCCC GACGGTTGTG AACCAGCATC CATTCTCCAC
541 GGATTCCGGC AACCCGCCTG GCCCTGGACG TGTCTCAACT GGCCCGCGTG AGGGGCCGCC
601 CCGGAAATGA CGCGCTGCCC CGCTGGCCAA GCGGAAGTGG AGATGGCGGA GCTGTACGTG
661 AAGCCGGGCA ACAAGGAACG CGGCTGGAAC GACCCGCCGC AGTTCTCATA CGGGCTGCAG
721 ACCCAGGCCG GCGGACCCAG GCGCTCGCTG CTTACCAAGA GGGTAGCCGC ACCCCAGGAT
781 GGATCCCCCA GAGTCCCCGC ATCAGAGACT TCTCCTGGGC CTCCCCCAAT GGGGCCTCCA
841 CCTCCTTCAA GTAAGGCTCC CAGGTCCCCA CCTGTGGGGA GTGGTCCTGC CTCTGGCGTG
901 GAGCCCACAA GTTTCCCAGT CGAGTCTGAG GCTCGACTGA TGGAGGATGT GCTGAGACCT
961 TTGGAACAGG CATTGGAAGA CTGCCGTGGC CACACAAGGA AGCAGGTATG TGATGACATC
1021 AGCCGACGCC TGGCACTGCT GCAGGAACAG TGGGCTGGAG GAAAGTTGTC AATACCTGTA
1081 AAGAAGAGAA TGGCTCTACT GGTGCAAGAG CTTTCAAGCC ACCGGTGGGA CGCAGCAGAT
1141 GACATCCACC GCTCCCTCAT GGTTGACCAT GTGACTGAGG TCAGTCAGTG GATGGTAGGA
1201 GTTAAAAGAT TAATTGCAGA AAAGAGGAGT CTGTTTTCAG AGGAGGCAGC CAATGAAGAG
1261 AAATCTGCAG CCACAGCTGA GAAGAACCAT ACCATACCAG GCTTCCAGCA GGCTTCATAA
1321 TCCTCGGTTC CCCAGACTCA CCGGACACCA TCTCCTATGC CTTGGAGACC TTCTGTCACT
1381 TGGCTCCCTT CTTACCACCA CCAAGACTGT CCCACTGGGC CTGACCCACC TATGAGGGAA
1441 GAAGTCCCAC CTGGGCCAGA GGGAGTTCAT GTGTTACTCA TAACATGCAT TTCAATAAAA
1501 ACATCTCTGC GGTGGAAAAA AAAAAAAAAA AAAA
B:氨基酸序列(SEQ ID NO:20) 长度:237
1 MTRCPAGQAE VEMAELYVKP GNKERGWNDP PQFSYGLQTQ AGGPRRSLLT KRVAAPQDGS
61 PRVPASETSP GPPPMGPPPP SSKAPRSPPV GSGPASGVEP TSFPVESEAR LMEDVLRPLE
121 QALEDCRGHT RKQVCDDISR RLALLQEQWA GGKLSIPVKK RMALLVQELS SHRWDAADDI
181 HRSLMVDHVT EVSQWMVGVK RLIAEKRSLF SEEAANEEKS AATAEKNHTI PGFQQAS
C.核苷酸及氨基酸组合序列(SEQ ID NO:21) 克隆号:PP7684
起始编码子:607 ATG 终止编码子:1318 TAA 蛋白质分子量:25841.84
1 GCA GGC ACT AAG CTG GGC ACT GGG AAT GTA ATA AAA TAG TCA AGG TCC 48
49 CAC CTT CTA AGA CTG TCC GAC AGG GAA ACG AAC AAG AGT CAA ATA AGG 96
97 CAG AAG ATG TGA TGT AAT ACA CCT ACG AAA TCT CAG AGG GTT GTA GGG 144
145 TCG TGG GAG CTC AAG TGA GAC ACT TAA CCT GGC CTG AGA CAT TCC AGA 192
193 AGG CCT CCT GAA GAA CTG ACA TCT GAA CTG AGA ACT GAA GGA AGA TGA 240
241 GTA CTA GTG AGG CTA CCG GAC GTG AAT GTG GAG ATT GTG CAG GGC AAT 288
289 GCA AGA GGA GGC TGT AGA AGT CAA CCT GGC TAG ATC ACA GCG GGG TGT 336
337 ATG TGG GGC AGG AGC TTC TTT GTT TGA ATT TGC TCC TGA GAG GAT GAG 384
385 GCC TCC TAG AGC ACT GGC TCC TGG ACA GCA ACC TCC TTT GGT GCC TTG 432
433 TGA CCA GGG CCC TGA TGG TTC ATT AGA TGG AGC CTT CGA GTC TTA GGG 480
481 AGT TGC CGC AGG GTC CCC ACA GCG GCT CCC GAC GGT TGT GAA CCA GCA 528
529 TCC ATT CTC CAC GGA TTC CGG CAA CCC GCC TGG CCC TGG ACG TGT CTC 576
577 AAC TGG CCC GCG TGA GGG GCC GCC CCG GAA ATG ACG CGC TGC CCC GCT 624
1 Met Thr Arg Cys Pro Ala 6
625 GGC CAA GCG GAA GTG GAG ATG GCG GAG CTG TAC GTG AAG CCG GGC AAC 672
7 Gly Gln Ala Glu Val Glu Met Ala Glu Leu Tyr Val Lys Pro Gly Asn 22
673 AAG GAA CGC GGC TGG AAC GAC CCG CCG CAG TTC TCA TAC GGG CTG CAG 720
23 Lys Glu Arg Gly Trp Asn Asp Pro Pro Gln Phe Ser Tyr Gly Leu Gln 38
721 ACC GAG GCC GGC GGA CCC AGG CGC TCG CTG CTT ACC AAG AGG GTA GCC 768
39 Thr Gln Ala Gly Gly Pro Arg Arg Ser Leu Leu Thr Lys Arg Val Ala 54
769 GCA CCC CAG GAT GGA TCC CCC AGA GTC CCC GCA TCA GAG ACT TCT CCT 816
55 Ala Pro Gln Asp Gly Ser Pro Arg Val Pro Ala Ser Glu Thr Ser Pro 70
817 GGG CCT CCC CCA ATG GGG CCT CCA CCT CCT TCA AGT AAG GCT CCC AGG 864
71 Gly Pro Pro Pro Met Gly Pro Pro Pro Pro Ser Ser Lys Ala Pro Arg 86
865 TCC CCA CCT GTG GGG AGT GGT CCT GCC TCT GGC GTG GAG CCC ACA AGT 912
87 Ser Pro Pro Val Gly Ser Gly Pro Ala Ser Gly Val Glu Pro Thr Ser 102
913 TTC CCA GTC GAG TCT GAG GCT CGA CTG ATG GAG GAT GTG CTG AGA CCT 960
103 Phe Pro Val Glu Ser Glu Ala Arg Leu Met Glu Asp Val Leu Arg Pro 118
961 TTG GAA CAG GCA TTG GAA GAC TGC CGT GGC CAC ACA AGG AAG CAG GTA 1008
119 Leu Glu Gln Ala Leu Glu Asp Cys Arg Gly His Thr Arg Lys Gln Val 134
1009 TGT GAT GAC ATC AGC CGA CGC CTG GCA CTG CTG CAG GAA CAG TGG GCT 1056
135 Cys Asp Asp Ile Ser Arg Arg Leu Ala Leu Leu Gln Glu Gln Trp Ala 150
1057 GGA GGA AAG TTG TCA ATA CCT GTA AAG AAG AGA ATG GCT CTA CTG GTG 1104
151 Gly Gly Lys Leu Ser Ile Pro Val Lys Lys Arg Met Ala Leu Leu Val 166
1105 CAA GAG CTT TCA AGC CAC CGG TGG GAC GCA GCA GAT GAC ATC CAC CGC 1152
167 Gln Glu Leu Ser Ser His Arg Trp Asp Ala Ala Asp Asp Ile His Arg 182
1153 TCC CTC ATG GTT GAC CAT GTG ACT GAG GTC AGT CAG TGG ATG GTA GGA 1200
183 Ser Leu Met Val Asp His Val Thr Glu Val Ser Gln Trp Met Val Gly 98
1201 GTT AAA AGA TTA ATT GCA GAA AAG AGG AGT CTG TTT TCA GAG GAG GCA 1248
199 Val Lys Arg Leu Ile Ala Glu Lys Arg Ser Leu Phe Ser Glu Glu Ala 214
1249 GCC AAT GAA GAG AAA TCT GCA GCC ACA GCT GAG AAG AAC CAT ACC ATA 1296
215 Ala Asn Glu Glu Lys Ser Ala Ala Thr Ala Glu Lys Asn His Thr Ile 230
1297 CCA GGC TTC CAG CAG GCT TCA TAA TCC TCG GTT CCC CAG ACT CAC CGG 1344
231 Pro Gly Phe Gln Gln Ala Ser *** 238
1345 ACA CCA TCT CCT ATG CCT TGG AGA CCT TCT GTC ACT TGG CTC CCT TCT 1392
1393 TAC CAC CAC CAA GAC TGT CCC ACT GGG CCT GAC CCA CCT ATG AGG GAA 1440
1441 GAA GTC CCA CCT GGG CCA GAG GGA GTT CAT GTG TTA CTC ATA ACA TGC 1488
1489 ATT TCA ATA AAA ACA TCT CTG CGG TGG AAA AAA AAA AAA AAA AAA A 1534
8.PP7704
A:核苷酸序列(SEQ ID NO:22) 长度:2101
1 GATTTTGTTT TGGACACCGA GCAGGAGCTG GCGGCCGCTG CAGACGAAAG GCAGGAAAGG
61 GCAGGCCGGG TGAGCAGACG GATCGGCCGA CTAGACAGCC AACCAGCAAC AACGAACTGA
121 GCTCGCATAC TACCGCTTAC GCATCTAACC AACCGCCCAT CTAGCTAACC CGAGCCCCTC
181 CACCGTCAAC TCAGGTTCGG CCGGTCCCCG GCCCGCCTGC CGGAGCCGTG GTGGCAGCCC
241 CGGGAGGAGC ACTGGCGTCT GTTTCCTTCG ATTCTCGGGA TTCGAAGATG GCTGCACAGT
301 CAGCGCCGAA AGTTGTGCTA AAAAGCACCA CCAAGATGTC TCTAAATGAG CGCTTTACTA
361 ATATGCTGAA GAACAAACAG CCGACGCCAG TGAATATTCG GGCTTCGATG CAGCAACAAC
421 AGCAGCTAGC CAGTGCCAGA AACAGAAGAC TGGCCCAGCA GATGGAGAAT AGACCCTCTG
481 TCCAGGCAGC ATTAAAACTT AAGCAGAGCT TAAAGCAGCG CCTGGGTAAG AGTAACATCC
541 AGGCACGGTT AGGCCGACCC ATAGGGGCCC TGGCCAGGGG AGCAATCGGA GGACGAGGCC
601 TACCCATAAT CCAGAGAGGC TTGCCCAGAG GAGGACTACG TGGGGGACGT GCCACCAGAA
661 CCCTACTTAG GGGCGGGATG TCACTCCGAG GTCAAAACCT GCTCCGAGGT GGACGAGCCG
721 TAGCTCCCCG AATGGGCTTA AGAAGAGGTG GTGTTCGAGG TCGTGGAGGT CCTGGGAGAG
781 GGGGCCTAGG GCGTGGAGCT ATGGGTCGTG GCGGAATCGG TGGTAGAGGG TCGGGGTATG
841 ATAGGTCGGG GAAGAGGGGG CTTTGGAGGC CGAGGCCGAG GGCGTGGACG AGGGAGAGGT
901 GCCCTTGCTC GCCCTGTATT GACCAAGGAG CAGCTGGACA ACCAATTGGA TGCATATATG
961 TCGAAAACAA AAGGACACCT GGATGCTGAG TTGGATGCCT ACATGGCGCA GACAGATCCC
1021 GAAACCAATG ATTGAAGCCT GCCCATCCTC CCATGAGAGA CTCTTGTTAG TCAACACATC
1081 TGTAAATAAC CTTGAGATAA CAGATGAGAA GAAATCTGAT TGATGCTGGA TGGACCTATC
1141 ACAATAGGCT GTGGACTTAC TTGCCACCAG CTTGTGCATT TAGTGTGTTC CTTTTACTTT
1201 TTGATACTGT GTTGTATGAA ACCCTTTTGT CCTTTGATTT GGTTTTTGTT TTTGTTTTTT
1261 TAGGGGGGAG GGGGGGTTTC CCTCCTTTGC CCAGACTTCT CTTTGAACAC AAATGCATTA
1321 GCCTTGTGGC TAGAACACCC TCTTCCTACC TCTGTCTCCC CTCACTTGTC ATATGCTCTG
1381 ACATGCTAAC ATTTCTTTTG TTCATCCCTG TTGCCCCCAC AGAAACATCC CAGAAAAACC
1441 GGTCAGTGTT CCTTCCTCCC TGATCCTTAG GTTTCTGAAA TAGGGTTCTG TTACATCCTC
1501 TTCGATAGCC TGTTTAAAAT GTTTAGAAGG TCTGGAGCTC AAAAATGCGT TCTTCCACAT
1561 TGATAATTTA GTAAACTGAG AACATTGACA TCACTACAGG GCAGCATAAG AGGTTGCTTA
1621 CATGTCGTAG CAGCTCTGGT TTGATTCAAG TTGCTACCAT GTACATTGAC AGCACATATA
1681 CCATAACCAG CGTGTTGGGT TGAATTGCAC TTTCTACCTT TGTATGAGAT TTACAGACTT
1741 TCCTTCTGGG TTTGTATCAT GACCAGAGGG GTACTATAGG GTTGGTTTAT ACTGCAATAT
1801 AGAGGATCAG AAGCCATTTG ATTTGGTAGG TGTGTCAGAA GGGAGAATGA TGGCAGACGA
1861 ACTGCTGGAA GAGGTCAGAA GATAGCCATG CTAAAATGCA ATTATATCCT CATGTTTATC
1921 CCAAACTAAT CTTGGACTTT TCCACTCATT AGCTTTGTTT TGCCCTTGTT TCCCTTGAAG
1981 GTTTAAGTTC AACCATATTC TGTCAACTGT TCAGTTTCAG TGGAATCTTG TATTTCTGGT
2041 TCATTATAAC AAATTGTTCG CTTAAATCCA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
2101 A
B:氨基酸序列(SEQ ID NO:23) 长度:233
1 MAAQSAPKVV LKSTTKMSLN ERFTNMLKNK QPTPVNIRAS MQQQQQLASA RNRRLAQQME
61 NRPSVQAALK LKQSLKQRLG KSNIQARLGR PIGALARGAI GGRGLPIIQR GLPRGGLRGG
121 RATRTLLRGG MSLRGQNLLR GGRAVAPRMG LRRGGVRGRG GPGRGGLGRG AMGRGGIGGR
181 GSGYDRSGKR GLWRPRPRAW TRERCPCSPC IDQGAAGQPI GCIYVENKRT PGC
C.核苷酸及氨基酸组合序列(SEQ ID NO:24) 克隆号:PP7704
起始编码子:288 ATG 终止编码子:987 TGA 蛋白质分子量:24954.84
1 GA TTT TGT TTT GGA CAC CGA GCA GGA GCT GGC GGC CGC TGC AGA CGA 47
48 AAG GCA GGA AAG GGC AGG CCG GGT GAG CAG ACG GAT CGG CCG ACT AGA 95
96 CAG CCA ACC AGC AAC AAC GAA CTG AGC TCG CAT ACT ACC GCT TAC GCA 143
144 TCT AAC CAA CCG CCC ATC TAG CTA ACC CGA GCC CCT CCA CCG TCA ACT 191
192 CAG GTT CGG CCG GTC CCC GGC CCG CCT GCC GGA GCC GTG GTG GCA GCC 239
240 CCG GGA GGA GCA CTG GCG TCT GTT TCC TTC GAT TCT CGG GAT TCG AAG 287
288 ATG GCT GCA CAG TCA GCG CCG AAA GTT GTG CTA AAA AGC ACC ACC AAG 335
1 Met Ala Ala Gln Ser Ala Pro Lys Val Val Leu Lys Ser Thr Thr Lys 16
336 ATG TCT CTA AAT GAG CGC TTT ACT AAT ATG CTG AAG AAC AAA CAG CCG 383
17 Met Ser Leu Asn Glu Arg Phe Thr Asn Met Leu Lys Asn Lys Gln Pro 32
384 ACG CCA GTG AAT ATT CGG GCT TCG ATG CAG CAA CAA CAG CAG CTA GCC 431
33 Thr Pro Val Asn Ile Arg Ala Ser Met Gln Gln Gln Gln Gln Leu Ala 48
432 AGT GCC AGA AAC AGA AGA CTG GCC GAG CAG ATG GAG AAT AGA CCC TCT 479
49 Ser Ala Arg Asn Arg Arg Leu Ala Gln Gln Met Glu Asn Arg Pro Ser 64
480 GTC CAG GCA GCA TTA AAA CTT AAG CAG AGC TTA AAG CAG CGC CTG GGT 527
65 Val Gln Ala Ala Leu Lys Leu Lys Gln Ser Leu Lys Gln Arg Leu Gly 80
528 AAG AGT AAC ATC CAG GCA CGG TTA GGC CGA CCC ATA GGG GCC CTG GCC 575
81 Lys Ser Asn Ile Gln Ala Arg Leu Gly Arg Pro Ile Gly Ala Leu Ala 96
576 AGG GGA GCA ATC GGA GGA CGA GGC CTA CCC ATA ATC CAG AGA GGC TTG 623
97 Arg Gly Ala Ile Gly Gly Arg Gly Leu Pro Ile Ile Gln Arg Gly Leu 112
624 CCC AGA GGA GGA CTA CGT GGG GGA CGT GCC ACC AGA ACC CTA CTT AGG 671
113 Pro Arg Gly Gly Leu Arg Gly Gly Arg Ala Thr Arg Thr Leu Leu Arg 128
672 GGC GGG ATG TCA CTC CGA GGT CAA AAC CTG CTC CGA GGT GGA CGA GCC 719
129 Gly Gly Met Ser Leu Arg Gly Gln Asn Leu Leu Arg Gly Gly Arg Ala 144
720 GTA GCT CCC CGA ATG GGC TTA AGA AGA GGT GGT GTT CGA GGT CGT GGA 767
145 Val Ala Pro Arg Met Gly Leu Arg Arg Gly Gly Val Arg Gly Arg Gly 160
768 GGT CCT GGG AGA GGG GGC CTA GGG CGT GGA GCT ATG GGT CGT GGC GGA 815
161 Gly Pro Gly Arg Gly Gly Leu Gly Arg Gly Ala Met Gly Arg Gly Gly 176
816 ATC GGT GGT AGA GGG TCG GGG TAT GAT AGG TCG GGG AAG AGG GGG CTT 863
177 Ile Gly Gly Arg Gly Ser Gly Tyr Asp Arg Ser Gly Lys Arg Gly Leu 192
864 TGG AGG CCG AGG CCG AGG GCG TGG ACG AGG GAG AGG TGC CCT TGC TCG 911
193 Trp Arg Pro Arg Pro Arg Ala Trp Thr Arg Glu Arg Cys Pro Cys Ser 208
912 CCC TGT ATT GAC CAA GGA GCA GCT GGA CAA CCA ATT GGA TGC ATA TAT 959
209 Pro Cys Ile Asp Gln Gly Ala Ala Gly Gln Pro Ile Gly Cys Ile Tyr 224
960 GTC GAA AAC AAA AGG ACA CCT GGA TGC TGA GTT GGA TGC CTA CAT GGC 1007
225 Val Glu Asn Lys Arg Thr Pro Gly Cys *** 234
1008 GCA GAC AGA TCC CGA AAC CAA TGA TTG AAG CCT GCC CAT CCT CCC ATG 1055
1056 AGA GAC TCT TGT TAG TCA ACA CAT CTG TAA ATA ACC TTG AGA TAA CAG 1103
1104 ATG AGA AGA AAT CTG ATT GAT GCT GGA TGG ACC TAT CAC AAT AGG CTG 1151
1152 TGG ACT TAC TTG CCA CCA GCT TGT GCA TTT AGT GTG TTC CTT TTA CTT 1199
1200 TTT GAT ACT GTG TTG TAT GAA ACC CTT TTG TCC TTT GAT TTG GTT TTT 1247
1248 GTT TTT GTT TTT TTA GGG GGG AGG GGG GGT TTC CCT CCT TTG CCC AGA 1295
1296 CTT CTC TTT GAA CAC AAA TGC ATT AGC CTT GTG GCT AGA ACA CCC TCT 1343
1344 TCC TAC CTC TGT CTC CCC TCA CTT GTC ATA TGC TCT GAC ATG CTA ACA 1391
1392 TTT CTT TTG TTC ATC CCT GTT GCC CCC ACA GAA ACA TCC CAG AAA AAC 1439
1440 CGG TCA GTG TTC CTT CCT CCC TGA TCC TTA GGT TTC TGA AAT AGG GTT 1487
1488 CTG TTA CAT CCT CTT CGA TAG CCT GTT TAA AAT GTT TAG AAG GTC TGG 1535
1536 AGC TCA AAA ATG CGT TCT TCC ACA TTG ATA ATT TAG TAA ACT GAG AAC 1583
1584 ATT GAC ATC ACT ACA GGG CAG CAT AAG AGG TTG CTT ACA TGT GGT AGC 1631
1632 AGC TCT GGT TTG ATT CAA GTT GCT ACC ATG TAC ATT GAC AGC ACA TAT 1679
1680 ACC ATA ACC AGC GTG TTG GGT TGA ATT GCA CTT TCT ACC TTT GTA TGA 1727
1728 GAT TTA CAG ACT TTC CTT CTG GGT TTG TAT CAT GAC CAG AGG GGT ACT 1775
1776 ATA GGG TTG GTT TAT ACT GCA ATA TAG AGG ATC AGA AGC CAT TTG ATT 1823
1824 TGG TAG GTG TGT CAG AAG GGA GAA TGA TGG CAG ACG AAC TGC TGG AAG 1871
1872 AGG TCA GAA GAT AGC CAT GCT AAA ATG CAA TTA TAT CCT CAT GTT TAT 1919
1920 CCC AAA CTA ATC TTG GAC TTT TCC ACT CAT TAG CTT TGT TTT GCC CTT 1967
1968 GTT TCC CTT GAA GGT TTA AGT TCA ACC ATA TTC TGT CAA CTG TTC AGT 2015
2016 TTC AGT GGA ATC TTG TAT TTC TGG TTC ATT ATA ACA AAT TGT TCG CTT 2063
2064 AAA TCC AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AA 2101
9.PP8407
A:核苷酸序列(SEQ ID NO:25) 长度:3305
1 GCTGGGGTTT TCAGATGCAC ATTCAGTGTT GCTTCTTGGC CATGTTCGAC AGATGCTGAG
61 ACCATCGTAC AGGCAGAAGC TTTGGCCAGC ACCGTCACTC TCACTGCCAT TGCCGAGAGT
121 CCTGTTATTG AGGTAGAAAC AGAAAAGAAA GACGTTCTTG ATTTTGGTGA CTTGACTTAT
181 GGAGGCTGGA AAGCCCTCCC ACTAAAATTG ATAAACCGAA CGCATGCCAC TGTGCCAATT
241 AGACTGATTA TTAATGCTAA CGCTGTAGCC TGGCACTGTT TCACGTTTTC CAAGGAACCC
301 GTCCGAGCTC CTGTGGAAGT TGCTCCTTGC GCTGATGTGG TCACTCGGCT AGCAGGCCCT
361 TCTGTGGTCA ACCACATGAT GCCTGCTAGT TATGATGGAC AGGATCCAGA ATTTCTGATG
421 ATTTGGGTTC TTTTCCATAG TCCAAAGAAA CAGATCAGCT CTTCAGATAT TCTGGACTCA
481 GCAGAAGAAT TCTCGGCAAA AGTTGATATC GAAGTTGACA GCCCAAACCC TACGCCCGTT
541 CTTAGAAGTG TGAGTCTCCG AGCAAGAGCA GGAATAGCTA GGATCCATGC TCCCAGGGAC
601 TTGCAGACGA TGCATTTCTT GGCCAAAGTG GCTTCCTCAA GAAAGCAGCA CTTACCTTTG
661 AAAAATGCTG GGAACATTGA AGTTTATTTG GATATCAAGG TCCCAGAACA AGGAAGTCAC
721 TTTTCAGTGG ATCCAAAGAA TCTATTCCTT AAACCTGGAG AAGAACATGA GGTTATTGTT
781 TCATTTACTC CAAAGGATCC TGAAGCCTGC GAGGAAAGGA TCTTGAAAAT ATTTGTGCAG
841 CCATTTGGAC CTCAGTATGA GGTAGTGTTA AAAGGCGAAG TCATTTCTTC AGGAAGTAAA
901 CCTCTGTCAC CTGGACCTTG CTTAGATATT CCATCGATTT TGTCCAACAA ACAATTTCTG
961 GCTTGGGGAG GAGTCCCTCT AGGTAGAACA CAGCTTCAGA AACTAGCTTT AAGAAATAAT
1021 TCTGCATCTA CAACTCAACA TTTACGACTG CTTATTAGAG GACAAGATCA GGACTGCTTT
1081 CAGCTTCAGA ACACTTTTGG TTCAGAACAG CGATTGACCA GTAACTGTGA GATCAGAATT
1141 CACCCAAAGG AAGACATTTT CATCTCTGTA TTATTTGCAC CTACTCGATT ATCTTGCATG
1201 TTGGCTAGAC TAGAAATCAA ACAACTTGGA AATCGATCAC AACCAGGCAT TAAGTTCACA
1261 ATACCTTTGT CTGGATATGG AGGAACAAGC AATCTTATTT TGGAAGGCGT TAAAAAATTA
1321 TCTGACAGTT ACATGGTAAC AGTGAATGGC TTAGTACCTG GCAAAGAAAG TAAAATTGTT
1381 TTTTCTGTCC GCAACACTGG CTCCCGAGCA GCTTTTGTTA AAGCAGTAGG TTTTAAGGAT
1441 TCTCAGAAAA AAGTTTTGCT GGATCCTAAA GTATTGAGGA TTTTTCCAGA TAAATTTGTA
1501 CTCAAGGAAA GAACACAAGA AAATGTTACT TTAATATATA ATCCATCAGA CAGAGGAATC
1561 AATAATAAAA CTGCAACAGA ACTATCAACT GTATACTTAT TTGGTGGAGA TGAAATTTCA
1621 AGACAGCAGT ATCGCAGGCA GGGCCCTGCT ACATAAACCA GAGATGATAA AACAGATACT
1681 TCCAGAACAT AGTGTGCTTC AAAACATTAA TTTTGTTGAA GCATTTCAAG ATGAGCTATT
1741 AGTAACTGAA GTATATGATC TTCCCCAACG ACCTAATGAT GTTCAGCTCT TTTATGGAAG
1801 CATGTGTAAA ATTATACTTT CAGTAATTGG AGAATTCAGA GATTGCATTT CTAGCAGAGA
1861 ATTCCTTCAG CCTTCTTCCA AAGCTAGCTT GGAATCTACA AGCGACTTGG GAGCTTCTGG
1921 GAAACATGGT GGCAACGTCT CTTTGGATGT TTTACCAGTC AAAGGTCCTC AGGGTTCTCC
1981 TCTTCTCTCA CAGGCGGCTC GCCCGCCTCC GGATCAGCTG GCCTCCGAAG AGCCGTGGAC
2041 TGTCCTACCC GAGCACTTGA TTCTGGTAGC TCCTTCTCCT TGTGACATGG CAAAAACTGG
2101 ACGTTTCCAG ATTGTGAATA ACTCTGTGAG GTTACTGAGA TTTGAGCTGT GCTGGCCAGC
2161 GCATTGCCTC ACAGTCACGC CGCAGCATGG ATGTGTCGCG CCAGAGAGTA AACTACAAAT
2221 TCTTGTGAGT CCTAATTCCT CCTTATCCAC AAAACAGTCA ATGTTCCCGT GGAGTGGTTT
2281 GATCTATATA CACTGTGACG ATGGACAGAA GAAAATTGTG AAAGTTCAAA TTCGAGAAGA
2341 TTTAACTCAA GTGGAACTTT TAACTCGTTT GACCTCCAAA CCATTTGGAA TTCTTTCCCC
2401 AGTATCTGAG CCTTCAGTTA GTCATTTGGT CAAACCAATG ACAAAACCGC CTTCCACAAA
2461 AGTTGAAATA AGAAACAAGA GTATTACTTT TCCTACAACA GAACCTGGTG AAACTTCAGA
2521 GAGCTGTCTA GAACTCGAGA ATCATGGCAC CACAGACGTG AAATGGCATC TGTCATCTTT
2581 AGCGCCACCT TATGTCAAGG GAGTTGATGA AAGTGGAGAT GTTTTTAGAG CTACCTATGC
2641 AGCATTCAGA TGTTCTCCTA TTTCTGGTCT GCTGGAAAGC CATGGGATCC AAAAACAGGC
2701 AGCTTGATGT GACTGCTCGT GGAGTTTATG CCCCAGAGGA TGTGTACAGG TTCCTGCCGA
2761 CTAGTGTGGG GGAATCACGG ACACTTAAAG TCAATCTGCG AAATAATTCT TTTATTACAC
2821 ACTCACTGAA GTTTTTGAGT CCCAGAGAGC CATTCTATGT CAAACATTCC AAGTACTCTT
2881 TGAGAGCCCA GCATTACATC AACATGCCCG TGCAGTTCAA ACCGAAGTCC GCAGGCAAAT
2941 TTGAAGCTTT GCTTGTCATT CAAACAGATG AAGGCAAGAG TATTGCTATT CGACTAATTG
3001 GTGAAGCTCT TGGAAAAAAT TAACTAGAAT ACATTTTTGT GTAAAGTAAA TTACATAAGT
3061 TGTATTTTGT TAACTTTATC TTTCTACACT ACAATTATGC TTTTGTATAT ATATTTTGTA
3121 TGATGGATAT CTATAATTGT AGATTTTGTT TTTACAAGCT AATACTGAAG ACTCGACTGA
3181 AATATTATGT ATCTAGCCCA TAGTATTGTA CTTAACTTTT ACAGGTGAGA AGAGAGTTCT
3241 GTGTTTGCAT TGATTATGAT ATTCTGAATA AATATGGAAT ATATTTTAAA AAAAAAAAAA
3301 AAAAA
B:氨基酸序列(SEQ ID NO:26) 长度:426
1 MMPASYDGQD PEFLMIWVLF HSPKKQISSS DILDSAEEFS AKVDIEVDSP NPTPVLRSVS
61 LRARAGIARI HAPRDLQTMH FLAKVASSRK QHLPLKNAGN IEVYLDIKVP EQGSHFSVDP
121 KNLFLKPGEE HEVIVSFTPK DPEACEERIL KIFVQPFGPQ YEVVLKGEVI SSGSKPLSPG
181 PCLDIPSILS NKQFLAWGGV PLGRTQLQKL ALRNNSASTT QHLRLLIRGQ DQDCFQLQNT
241 FGSEQRLTSN CEIRIHPKED IFISVLFAPT RLSCMLARLE IKQLGNRSQP GIKFTIPLSG
301 YGGTSNLILE GVKKLSDSYM VTVNGLVPGK ESKIVFSVRN TGSRAAFVKA VGFKDSQKKV
361 LLDPKVLRIF PDKFVLKERT QENVTLIYNP SDRGINNKTA TELSTVYLFG GDEISRQQYR
421 RQGPAT
C.核苷酸及氨基酸组合序列(SEQ ID NO:27) 克隆号:PP8407
起始编码子:376 ATG 终止编码子:1654 TAA 蛋白质分子量:47410.05
1 GCT GGG GTT TTC AGA TGC ACA TTC AGT GTT GCT TCT TGG CCA TGT TCG 48
49 ACA GAT GCT GAG ACC ATC GTA CAG GCA GAA GCT TTG GCC AGC ACC GTC 96
97 ACT CTC ACT GCC ATT GCC GAG AGT CCT GTT ATT GAG GTA GAA ACA GAA 144
145 AAG AAA GAC GTT CTT GAT TTT GGT GAC TTG ACT TAT GGA GGC TGG AAA 192
193 GCC CTC CCA CTA AAA TTG ATA AAC CGA ACG CAT GCC ACT GTG CCA ATT 240
241 AGA CTG ATT ATT AAT GCT AAC GCT GTA GCC TGG CAC TGT TTC ACG TTT 288
289 TCC AAG GAA CCC GTC CGA GCT CCT GTG GAA GTT GCT CCT TGC GCT GAT 336
337 GTG GTC ACT CGG CTA GCA GGC CCT TCT GTG GTC AAC CAC ATG ATG CCT 384
1 Met Met Pro 3
385 GCT AGT TAT GAT GGA CAG GAT CCA GAA TTT CTG ATG ATT TGG GTT CTT 432
4 Ala Ser Tyr Asp Gly Gln Asp Pro Glu Phe Leu Met Ile Trp Val Leu 19
433 TTC CAT AGT CCA AAG AAA CAG ATC AGC TCT TCA GAT ATT CTG GAC TCA 480
20 Phe His Ser Pro Lys Lys Gln Ile Ser Ser Ser Asp Ile Leu Asp Ser 35
481 GCA GAA GAA TTC TCG GCA AAA GTT GAT ATC GAA GTT GAC AGC CCA AAC 528
36 Ala Glu Glu Phe Ser Ala Lys Val Asp Ile Glu Val Asp Ser Pro Asn 51
529 CCT ACG CCC GTT CTT AGA AGT GTG AGT CTC CGA GCA AGA GCA GGA ATA 576
52 Pro Thr Pro Val Leu Arg Ser Val Ser Leu Arg Ala Arg Ala Gly Ile 67
577 GCT AGG ATC CAT GCT CCC AGG GAG TTG CAG ACG ATG CAT TTC TTG GCC 624
68 Ala Arg Ile His Ala Pro Arg Asp Leu Gln Thr Met His Phe Leu Ala 83
625 AAA GTG GCT TCC TCA AGA AAG CAG CAC TTA CCT TTG AAA AAT GCT GGG 672
84 Lys Val Ala Ser Ser Arg Lys Gln His Leu Pro Leu Lys Asn Ala Gly 99
673 AAC ATT GAA GTT TAT TTG GAT ATC AAG GTC CCA GAA CAA GGA AGT CAC 720
100 Asn Ile Glu Val Tyr Leu Asp Ile Lys Val Pro Glu Gln Gly Ser His 115
721 TTT TCA GTG GAT CCA AAG AAT CTA TTC CTT AAA CCT GGA GAA GAA CAT 768
116 Phe Ser Val Asp Pro Lys Asn Leu Phe Leu Lys Pro Gly Glu Glu His 131
769 GAG GTT ATT GTT TCA TTT ACT CCA AAG GAT CCT GAA GCC TGC GAG GAA 816
132 Glu Val Ile Val Ser Phe Thr Pro Lys Asp Pro Glu Ala Cys Glu Glu 147
817 AGG ATC TTG AAA ATA TTT GTG CAG CCA TTT GGA CCT CAG TAT GAG GTA 864
148 Arg Ile Leu Lys Ile Phe Val Gln Pro Phe Gly Pro Gln Tyr Glu Val 163
865 GTG TTA AAA GGC GAA GTC ATT TCT TCA GGA AGT AAA CCT CTG TCA CCT 912
164 Val Leu Lys Gly Glu Val Ile Ser Ser Gly Ser Lys Pro Leu Ser Pro 179
913 GGA CCT TGC TTA GAT ATT CCA TCG ATT TTG TCC AAC AAA CAA TTT CTG 960
180 Gly Pro Cys Leu Asp Ile Pro Ser Ile Leu Ser Asn Lys Gln Phe Leu 195
961 GCT TGG GGA GGA GTC CCT CTA GGT AGA ACA CAG CTT CAG AAA CTA GCT 1008
196 Ala Trp Gly Gly Val Pro Leu Gly Arg Thr Gln Leu Gln Lys Leu Ala 211
1009 TTA AGA AAT AAT TCT GCA TCT ACA ACT CAA CAT TTA CGA CTG CTT ATT 1056
212 Leu Arg Asn Asn Ser Ala Ser Thr Thr Gln His Leu Arg Leu Leu Ile 227
1057 AGA GGA CAA GAT CAG GAC TGC TTT CAG CTT CAG AAC ACT TTT GGT TCA 1104
228 Arg Gly Gln Asp Gln Asp Cys Phe Gln Leu Gln Asn Thr Phe Gly Ser 243
1105 GAA CAG CGA TTG ACC AGT AAC TGT GAG ATC AGA ATT CAC CCA AAG GAA 1152
244 Glu Gln Arg Leu Thr Ser Asn Cys Glu Ile Arg Ile His Pro Lys Glu 259
1153 GAC ATT TTC ATC TCT GTA TTA TTT GCA CCT ACT CGA TTA TCT TGC ATG 1200
260 Asp Ile Phe Ile Ser Val Leu Phe Ala Pro Thr Arg Leu Ser Cys Met 275
1201 TTG GCT AGA CTA GAA ATC AAA CAA CTT GGA AAT CGA TCA CAA CCA GGC 1248
276 Leu Ala Arg Leu Glu Ile Lys Gln Leu Gly Asn Arg Ser Gln Pro Gly 291
1249 ATT AAG TTC ACA ATA CCT TTG TCT GGA TAT GGA GGA ACA AGC AAT CTT 1296
292 Ile Lys Phe Thr Ile Pro Leu Ser Gly Tyr Gly Gly Thr Ser Asn Leu 307
1297 ATT TTG GAA GGC GTT AAA AAA TTA TCT GAC AGT TAC ATG GTA ACA GTG 1344
308 Ile Leu Glu Gly Val Lys Lys Leu Ser Asp Ser Tyr Met Val Thr Val 323
1345 AAT GGC TTA GTA CCT GGC AAA GAA AGT AAA ATT GTT TTT TCT GTC CGC 1392
324 Asn Gly Leu Val Pro Gly Lys Glu Ser Lys Ile Val Phe Ser Val Arg 339
1393 AAC ACT GGC TCC CGA GCA GCT TTT GTT AAA GCA GTA GGT TTT AAG GAT 1440
340 Asn Thr Gly Ser Arg Ala Ala Phe Val Lys Ala Val Gly Phe Lys Asp 355
1441 TCT CAG AAA AAA GTT TTG CTG GAT CCT AAA GTA TTG AGG ATT TTT CCA 1488
356 Ser Gln Lys Lys Val Leu Leu Asp Pro Lys Val Leu Arg Ile Phe Pro 371
1489 GAT AAA TTT GTA CTC AAG GAA AGA ACA CAA GAA AAT GTT ACT TTA ATA 1536
372 Asp Lys Phe Val Leu Lys Glu Arg Thr Gln Glu Asn Val Thr Leu Ile 387
1537 TAT AAT CCA TCA GAC AGA GGA ATC AAT AAT AAA ACT GCA ACA GAA CTA 1584
388 Tyr Asn Pro Ser Asp Arg Gly Ile Asn Asn Lys Thr Ala Thr Glu Leu 403
1585 TCA ACT GTA TAC TTA TTT GGT GGA GAT GAA ATT TCA AGA CAG CAG TAT 1632
404 Ser Thr Val Tyr Leu Phe Gly Gly Asp Glu Ile Ser Arg Gln Gln Tyr 419
1633 CGC AGG CAG GGC CCT GCT ACA TAA ACC AGA GAT GAT AAA ACA GAT ACT 1680
420 Arg Arg Gln Gly Pro Ala Thr *** 427
1681 TCC AGA ACA TAG TGT GCT TCA AAA CAT TTT TTT TGT TGA AGC ATT TCA 1728
1729 AGA TGA GCT ATT AGT AAC TGA AGT ATA TGA TCT TCC CCA ACG ACC TAA 1776
1777 TGA TGT TCA GCT CTT TTA TGG AAG CAT GTG TAA AAT TAT ACT TTC AGT 1824
1825 AAT TGG AGA ATT CAG AGA TTG CAT TTC TAG CAG AGA ATT CCT TCA GCC 1872
1873 TTC TTC CAA AGC TAG CTT GGA ATC TAC AAG CGA CTT GGG AGC TTC TGG 1920
1921 GAA ACA TGG TGG CAA CGT CTC TTT GGA TGT TTT ACC AGT CAA AGG TCC 1968
1969 TCA GGG TTC TCC TCT TCT CTC ACA GGC GGC TCG CCC GCC TCC GGA TCA 2016
2017 GCT GGC CTC CGA AGA GCC GTG GAC TGT CCT ACC CGA GCA CTT GAT TCT 2064
2065 GGT AGC TCC TTC TCC TTG TGA CAT GGC AAA AAC TGG ACG TTT CCA GAT 2112
2113 TGT GAA TAA CTC TGT GAG GTT ACT GAG ATT TGA GCT GTG CTG GCC AGC 2160
2161 GCA TTG CCT CAC AGT CAC GCC GCA GCA TGG ATG TGT CGC GCC AGA GAG 2208
2209 TAA ACT ACA AAT TCT TGT GAG TCC TAA TTC CTC CTT ATC CAC AAA ACA 2256
2257 GTC AAT GTT CCC GTG GAG TGG TTT GAT CTA TAT ACA CTG TGA CGA TGG 2304
2305 ACA GAA GAA AAT TGT GAA AGT TCA AAT TCG AGA AGA TTT AAC TCA AGT 2352
2353 GGA ACT TTT AAC TCG TTT GAC CTC CAA ACC ATT TGG AAT TCT TTC CCC 2400
2401 AGT ATC TGA GCC TTC AGT TAG TCA TTT GGT CAA ACC AAT GAC AAA ACC 2448
2449 GCC TTC CAC AAA AGT TGA AAT AAG AAA CAA GAG TAT TAC TTT TCC TAC 2496
2497 AAC AGA ACC TGG TGA AAC TTC AGA GAG CTG TCT AGA ACT CGA GAA TCA 2544
2545 TGG CAC CAC AGA CGT GAA ATG GCA TCT GTC ATC TTT AGC GCC ACC TTA 2592
2593 TGT CAA GGG AGT TGA TGA AAG TGG AGA TGT TTT TAG AGC TAC CTA TGC 2640
2641 AGC ATT CAG ATG TTC TCC TAT TTC TGG TCT GCT GGA AAG CCA TGG GAT 2688
2689 CCA AAA ACA GGC AGC TTG ATG TGA CTG CTC GTG GAG TTT ATG CCC CAG 2736
2737 AGG ATG TGT ACA GGT TCC TGC CGA CTA GTG TGG GGG AAT CAC GGA CAC 2784
2785 TTA AAG TCA ATC TGC GAA ATA ATT CTT TTA TTA CAC ACT CAC TGA AGT 2832
2833 TTT TGA GTC CCA GAG AGC CAT TCT ATG TCA AAC ATT CCA AGT ACT CTT 2880
2881 TGA GAG CCC AGC ATT ACA TCA ACA TGC CCG TGC AGT TCA AAC CGA AGT 2928
2929 CCG CAG GCA AAT TTG AAG CTT TGC TTG TCA TTC AAA CAG ATG AAG GCA 2976
2977 AGA GTA TTG CTA TTC GAC TAA TTG GTG AAG CTC TTG GAA AAA ATT AAC 3024
3025 TAG AAT ACA TTT TTG TGT AAA GTA AAT TAC ATA AGT TGT ATT TTG TTA 3072
3073 ACT TTA TCT TTC TAC ACT ACA ATT ATG CTT TTG TAT ATA TAT TTT GTA 3120
3121 TGA TGG ATA TCT ATA ATT GTA GAT TTT GTT TTT ACA AGC TAA TAC TGA 3168
3169 AGA CTC GAC TGA AAT ATT ATG TAT CTA GCC CAT AGT ATT GTA CTT AAC 3216
3217 TTT TAC AGG TGA GAA GAG AGT TCT GTG TTT GCA TTG ATT ATG ATA TTC 3264
3265 TGA ATA AAT ATG GAA TAT ATT TTA AAA AAA AAA AAA AAA AA 3305
10.PP8961
A:核苷酸序列(SEQ ID NO:28) 长度:1971
1 GATGTCACCT CTGCCTCATT CTACTATCAA GGTGGTTGCA GGGACAGCCC AGGTTCAAAG
61 GAAGGAGAAG TAGACTCCCC CTCTTTTGAC TGGCAAGGGG ACATTGCAAA AAATCCTGTC
121 GTTTGGGGGG GATTGTTGTA GTCATCTTTG GAAACACAAT CTGCAACTTT GATGTTCATC
181 AAAGAAATCT GCTTGAGCTG TGAGCTCAAC TGGTATTCGA CTTAAGAAAT CCACAAAATC
241 GGTTCTGAAC TGCATTTTCA TCTCAGCGTT TGGCCACGGG CAATGAGAGC TTCATTCAGA
301 AGAGTCACAA AATCGTTCTG ACCAAGACCA TTTTGTCTAG ATCAGTAATT TGGGGATTTG
361 CCTGTCTCAG TGCCATCAGA AGCAACCACC TAACCCAGAA ATGCTAACAT TCCTCTTCTT
421 TCAGCAGTCA CTGACTACCT ACATCCCTCA GCTCCCTCCC CATCTCACAT CACCCTCAGG
481 GGCCTCCTGA GCACAGCATC ACCGAGGGGG CCACAGCAGC AGAACCTCCT ACCCAGATCT
541 CTCTAGGCAC TGCCATCATG TGACTAAACT CCCCTCTCAA CCACAACCTC CAGCTACAGG
601 GCTCTCATCC AAGTCAAAAA TCCAAAGACA GGCGTCTGGC TGGCTGCAGG AGTCCAGAGC
661 CATGAGTGTC CCTAAATTAG TCAACCATGG CTGGGAGACA GAGCCATGCA ATCCAGACCC
721 AGCTCTTCTG CTCACTGGGG CCGTTCCCGG AGAAGGAGAA ACCACGCTGG AGCGGGCACT
781 CCCACGAGTT GTCGGGGAAC AAGAACTCGG ATCCTGGCGG GAGACAGCGA ACAGTACACC
841 CGAGCGGCGG CTGTCACCCG CTTTGAAACA CGTAAGTGCC CGGCCAACCA GCATCCCAGA
901 AACGCCTGGG GAGCGGGGCG CGCGGACGAG GAGAGACCGC GCTGGGAGGG CGCGGAAGGG
961 CGAGGGCGCT GCCGCCTCCA CGCTGAGCTC ACTGCGCGGG GCGGCCCCCG AGGCAGGGCG
1021 CGGGGCGGAG GCGCCCGAGT GGTCCGTCTC GGGAGGCGCA GACGCGGTTC CTCTCGAGGG
1081 CGCTCCCGCT GTGAGGAGCA AATCCTAGGG ACCTTTGCGT CATGAGCACC CAACGGGGCC
1141 CGCCCCCTTA GGACCTGCAC CTGCCTGAGG GGAAAACCCG CCCACCACCC ACGGTCGCCC
1201 GCAGCGCTTG CCTGCCAGCC TTCTCATCTG CAAGCCGCCT CCTCCCTGCC AACCTCCTCC
1261 TCCCTGCCCA GCCTCTTTCT CTCTGCCAGC CTCCTCCTCC CCCATCGGCC GCCTCCTCTC
1321 CTGCCAGCCT CCTCCTCCCT GCCAACCTCC TCCTCTCCTG CCAGCCTCCT CCTCCCTGCC
1381 AACCTCCTCC TCTCCTGCCA GCCTCCTCCT CCCTGCAAGC CTCCTCCTTC CTGCCAGCCT
1441 CTTTCTCCCT GCCAACCTCC TCCTCTCCTG CCAGCCTCCT GCTCCCTGCA AGCCTCCTCC
1501 TTCCTGCCAG CCTCTTTCTC CCTACCAACC TCCTCCTCTC CTGTCAGCTT CCTCCTCCCT
1561 GCCAACCTTT CTGTCCTGCC ACCCCCCTCT TCCCTGCCAG TCTCCCCCTC TTCTGCCAGC
1621 CTCCTCCTCC CCTGCCAGCC TCTTCCTTCT CACCAGCCCC CTCCTCCCTT TTCATCTAAG
1681 ATCATTTGAC CTGTCATTCA AGGCCTAGTT GAAATGTCAC CTCTGTAGAA AAGTTTCTCC
1741 CCAGTTCTCT CTGATAGTTA GTTCTTTCTC TCCTTTGAGT GGGGTAGCAT GGTGCACATT
1801 TCTATATCAA GCTTCTTGGC CCGGTTTTGG TATTTACATG CTTATCTCTC CCCTGCAATA
1861 GGGACAGTGC TAACTTTCTG TCACATTTCT TTTTAATGCC TTCCTAAAAG AGTGACCAAC
1921 ACATGGGTGA TATTCAACAA ATGATTGAAA AAGAAAAAAA AAAAAAAAAA A
B:氨基酸序列(SEQ ID NO:29) 长度:148
1 MSVPKLVNHG WETEPCNPDP ALLLTGAVPG EGETTLERAL PRVVGEQELG SWRETANSTP
61 ERRLSPALKH VSARPTSIPE TPGERGARTR RDRAGRARKG EGAAASTLSS LRGAAPEAGR
121 GAEAPEWSVS GGADAVPLEG APAVRSKS
C.核苷酸及氨基酸组合序列(SEQ ID NO:30) 克隆号:PP8961
起始编码子:662 ATG 终止编码子:1106 TAG 蛋白质分子量:15403.22
1 G ATG TCA CCT CTG CCT CAT TCT ACT ATC AAG GTG GTT GCA GGG ACA 46
47 GCC CAG GTT CAA AGG AAG GAG AAG TAG ACT CCC CCT CTT TTG ACT GGC 94
95 AAG GGG ACA TTG CAA AAA ATC CTG TCG TTT GGG GGG GAT TGT TGT AGT 142
143 CAT CTT TGG AAA CAC AAT CTG CAA CTT TGA TGT TCA TCA AAG AAA TCT 190
191 GCT TGA GCT GTG AGC TCA ACT GGT ATT CGA CTT AAG AAA TCC ACA AAA 238
239 TCG GTT CTG AAC TGC ATT TTC ATC TCA GCG TTT GGC CAC GGG CAA TGA 286
287 GAG CTT CAT TCA GAA GAG TCA CAA AAT CGT TCT GAC CAA GAC CAT TTT 334
335 GTC TAG ATC AGT AAT TTG GGG ATT TGC CTG TCT CAG TGC CAT CAG AAG 382
383 CAA CCA CCT AAC CCA GAA ATG CTA ACA TTC CTC TTC TTT CAG CAG TCA 430
431 CTG ACT ACC TAC ATC CCT CAG CTC CCT CCC CAT CTC ACA TCA CCC TCA 478
479 GGG GCC TCC TGA GCA CAG CAT CAC CGA GGG GGC CAC AGC AGC AGA ACC 526
527 TCC TAC CCA GAT CTC TCT AGG CAC TGC CAT CAT GTG ACT AAA CTC CCC 574
575 TCT CAA CCA CAA CCT CCA GCT ACA GGG CTC TCA TCC AAG TCA AAA ATC 622
623 CAA AGA CAG GCG TCT GGC TGG CTG CAG GAG TCC AGA GCC ATG AGT GTC 670
1 Met Ser Val 3
671 CCT AAA TTA GTC AAC CAT GGC TGG GAG ACA GAG CCA TGC AAT CCA GAC 718
4 Pro Lys Leu Val Asn His Gly Trp Glu Thr Glu Pro Cys Asn Pro Asp 19
719 CCA GCT CTT CTG CTC ACT GGG GCC GTT CCC GGA GAA GGA GAA ACC ACG 766
20 Pro Ala Leu Leu Leu Thr Gly Ala Val Pro Gly Glu Gly Glu Thr Thr 35
767 CTG GAG CGG GCA CTC CCA CGA GTT GTC GGG GAA CAA GAA CTC GGA TCC 814
36 Leu Glu Arg Ala Leu Pro Arg Val Val Gly Glu Gln Glu Leu Gly Ser 51
815 TGG CGG GAG ACA GCG AAC AGT ACA CCC GAG CGG CGG CTG TCA CCC GCT 862
52 Trp Arg Glu Thr Ala Asn Ser Thr Pro Glu Arg Arg Leu Ser Pro Ala 67
863 TTG AAA CAC GTA AGT GCC CGG CCA ACC AGC ATC CCA GAA ACG CCT GGG 910
68 Leu Lys His Val Ser Ala Arg Pro Thr Ser Ile Pro Glu Thr Pro Gly 83
911 GAG CGG GGC GCG CGG ACG AGG AGA GAC CGC GCT GGG AGG GCG CGG AAG 958
84 Glu Arg Gly Ala Arg Thr Arg Arg Asp Arg Ala Gly Arg Ala Arg Lys 99
959 GGC GAG GGC GCT GCC GCC TCC ACG CTG AGC TCA CTG CGC GGG GCG GCC 1006
100 Gly Glu Gly Ala Ala Ala Ser Thr Leu Ser Ser Leu Arg Gly Ala Ala 115
1007 CCC GAG GCA GGG CGC GGG GCG GAG GCG CCC GAG TGG TCC GTC TCG GGA 1054
116 Pro Glu Ala Gly Arg Gly Ala Glu Ala Pro Glu Trp Ser Val Ser Gly 13l
1055 GGC GCA GAC GCG GTT CCT CTC GAG GGC GCT CCC GCT GTG AGG AGC AAA 1102
132 Gly Ala Asp Ala Val Pro Leu Glu Gly Ala Pro Ala Val Arg Ser Lys 147
1103 TCC TAG GGA CCT TTG CGT CAT GAG CAC CCA ACG GGG CCC GCC CCC TTA 1150
148 Ser *** 149
1151 GGA CCT GCA CCT GCC TGA GGG GAA AAC CCG CCC ACC ACC CAC GGT CGC 1198
1199 CCG CAG CGC TTG CCT GCC AGC CTT CTC ATC TGC AAG CCG CCT CCT CCC 1246
1247 TGC CAA CCT CCT CCT CCC TGC CCA GCC TCT TTC TCT CTG CCA GCC TCC 1294
1295 TCC TCC CCC ATC GGC CGC CTC CTC TCC TGC CAG CCT CCT CCT CCC TGC 1342
1343 CAA CCT CCT CCT CTC CTG CCA GCC TCC TCC TCC CTG CCA ACC TCC TCC 1390
1391 TCT CCT GCC AGC CTC CTC CTC CCT GCA AGC CTC CTC CTT CCT GCC AGC 1438
1439 CTC TTT CTC CCT GCC AAC CTC CTC CTC TCC TGC CAG CCT CCT GCT CCC 1486
1487 TGC AAG CCT CCT CCT TCC TGC CAG CCT CTT TCT CCC TAC CAA CCT CCT 1534
1535 CCT CTC CTG TCA GCT TCC TCC TCC CTG CCA ACC TTT CTG TCC TGC CAC 1582
1583 CCC CCT CTT CCC TGC CAG TCT CCC CCT CTT CTG CCA GCC TCC TCC TCC 1630
1631 CCT GCC AGC CTC TTC CTT CTC ACC AGC CCC CTC CTC CCT TTT CAT CTA 1678
1679 AGA TCA TTT GAC CTG TCA TTC AAG GCC TAG TTG AAA TGT CAC CTC TGT 1726
1727 AGA AAA GTT TCT CCC CAG TTC TCT CTG ATA GTT AGT TCT TTC TCT CCT 1774
1775 TTG AGT GGG GTA GCA TGG TGC ACA TTT CTA TAT CAA GCT TCT TGG CCC 1822
1823 GGT TTT GGT ATT TAC ATG CTT ATC TCT CCC CTG CAA TAG GGA CAG TGC 1870
1871 TAA CTT TCT GTC ACA TTT CTT TTT AAT GCC TTC CTA AAA GAG TGA CCA 1918
1919 ACA CAT GGG TGA TAT TCA ACA AAT GAT TGA AAA AGA AAA AAA AAA AAA 1966
1967 AAA AA 1971
11.PP8985
A:核苷酸序列(SEQ ID NO:31) 长度:2020
1 GGTCAGCCGC GTCGCGAATG GGGCAGGAGC GAGCCTCTCT GGTCCCGACG CGGGTGGCCC
61 GGGTCTCCTC GACTCCTGAG GAAAGCCCAC CGGGCGGGCC GGGAGGTGAA GAGGCTGGGG
121 AAGTCAGAGG TTAACCTGGG CGTCAGGGGA CGTTGGAGTT GATCCGTCAG GGTCCCGGGG
181 CGGTCTGGGG GCAGTAGAGA CGGGGCTTGG GCGCGGGGCC TGAGAGGTCA GGGGTCAGCA
241 GGAGTGAGGC TGGGGCGTCC AGGTCCGAGA GGTCAGGGGT CAGCTGGAGA GGGGCTGGGG
301 CGCCGGTTTC CCGGAGGTCA GGGGTCAGAA GGAACAGGGC TGCAGCGTCA GGGTCCGAGA
361 GGTTAGGGGT CGGCAGAGGC GGAGCTGGGG CACTGGGGGT CAGGGGTCGG GGATCAGGGC
421 GGGGTCGGGT GCACTGGTAG CCTGCGCATG GGCCTCCAGC TTCGCGCGCT GTTGGGAGCC
481 TTCGGACGGT GGACCCTGCG CCTGGGACCG CGTCCGTCCT GCTCGCCGCG CATGGCCGGG
541 AACGCGGAGC CGCCGCCCGC CGGAGCCGCA TGCCCCCAGG ACCGGAGGTC CTGCAGCGGC
601 CGGGCCGGGG GCGACCGCGT CTGGGAGGAC GGAGAACATC CGGCGAAGAA GCTCAAGAGC
661 GGTGGCGACG AGGAGCGGCG CGAGAAGCCG CCCAAGCGGA AGATCGTGCT GCTCATGGCC
721 TATTCGGGCA AGGGCTACCA CGGCATGCAG AGGAATGTCG GGTCCTCACA ATTCAAAACA
781 ATTGAAGATG ACTTGGTGTC CGCCCTCGTC CGGTCAGGCT GTATTCCTGA AAATCATGGT
841 GAGGACATGA GGAAAATGTC CTTCCAGCGC TGCGCCCGGA CAGACAAGGG TGTGTCCGCA
901 GCCGGCCAGG TGGTATCCCT GAAGGTGTGG CTGATTGACG ACATTCTAGA AAAGATCAAC
961 AGCCACCTTC CCTCTCACAT TCGGATTCTG GGACTGAAGC GGGTCACGGG CGGGTTTAAC
1021 TCCAAGAACA GATGTGATGC CAGGACCTAT TGCTACCTGC TGCCCACGTT TGCCTTTGCG
1081 CACAAGGACC GGGACGTTCA GGATGAGACC TACCGCCTGA GCGCCGAGAC GCTGCAGCAG
1141 GTCAACAGGC TCCTGGCCTG CTACAAGGGC ACGCACAACT TCCACAATTT CACCTCGCAG
1201 AAGGGGCCGC AGGATCCCAG TGCCTGCCGC TACATCCTGG AGATGTACTG CGAGGAACCC
1261 TTTGTGCGGG AGGGCCTGGA GTTTGCGGTG ATCAGGGTGA AGGGCCAGAG CTTCATGATG
1321 CATCAGATCC GGAAGATGGT CGGCCTGGTG GTGGCCATTG TGAAGGGTTA TGCCCCTGAG
1381 AGCGTGCTGG AGCGCAGCTG GGGCACAGAG AAGGTGGACG TGCCCAAGGG GCCCGGACTC
1441 GGCCTGGTCC TGGAGAGGGT GCACTTCGAG AAGTACAACC AGCGCTTTGG CAACGATGGG
1501 CTGCATGAGC CGCTGGACTG GGCGCAGGAG GAAGGAAAGG TCGCAGCCTT CAAGGAGGAG
1561 CACATCTACC CCACCATCAT CGGCACCGAG CGGGACGAAC GCTCCATGGC CCAGTGGCTG
1621 AGCACCTTGC CCATCCACAA CTTCAGTGCC ACCGCTCTCA CGGCAGGTGG CACGGGCGCC
1681 AAGGTGCCCA GTCCCCTGGA AGGCAGTGAA GGGGACGGAG ACACTGACTG AGGCGATGGG
1741 AGCTGCCCAC CAGAGTGCCT CTGAGCAGCT CACAGTGTGT GCCCAGATGT GCCACCCTCT
1801 GTGGGCAGCA AGAAGCTGGG ATCGCTGCAG CCATGTTTTC CCGGCCATGC CGGCGTTGTA
1861 ACCTCAGGAC CTTCCCTTGT AGGAACAGCC TTTCTCGAAT CTGTTTTCAG CTCTTGCATT
1921 GCATAGATGA ACCTCAGCAT GTAAAGAACT ATTTTTTTAA AGAAGTGATT TTCTTATTAA
1981 ACAAGTACAA ATTTTGCTTA GTCAAAAAAA AAAAAAAAAA
B:氨基酸序列(SEQ ID NO:32) 长度:427
1 MGLQLRALLG AFGRWTLRLG PRPSCSPRMA GNAEPPPAGA ACPQDRRSCS GRAGGDRVWE
61 DGEHPAKKLK SGGDEERREK PPKRKIVLLM AYSGKGYHGM QRNVGSSQFK TIEDDLVSAL
121 VRSGCIPENH GEDMRKMSFQ RCARTDKGVS AAGQVVSLKV WLIDDILEKI NSHLPSHIRI
181 LGLKRVTGGF NSKNRCDART YCYLLPTFAF AHKDRDVQDE TYRLSAETLQ QVNRLLACYK
241 GTHNFHNFTS QKGPQDPSAC RYILEMYCEE PFVREGLEFA VIRVKGQSFM MHQIRKMVGL
301 VVAIVKGYAP ESVLERSWGT EKVDVPKAPG LGLVLERVHF EKYNQRFGND GLHEPLDWAQ
361 EEGKVAAFKE EHIYPTIIGT ERDERSMAQW LSTLPIHNFS ATALTAGGTG AKVPSPLEGS
421 EGDGDTD
C.核苷酸及氨基酸组合序列(SEQ ID NO:33) 克隆号:PP8985
起始编码子:448 ATG 终止编码子:1729 TGA 蛋白质分子量:47467.61
1 GGT CAG CCG CGT CGC GAA TGG GGC AGG AGC GAG CCT CTC TGG TCC CGA 48
49 CGC GGG TGG CCC GGG TCT CCT CGA CTC CTG AGG AAA GCC CAC CGG GCG 96
97 GGG CGG GAG GTG AAG AGG CTG GGG AAG TCA GAG GTT AAC CTG GGC GTC 144
145 AGG GGA CGT TGG AGT TGA TCC GTC AGG GTC CCG GGG CGG TCT GGG GGC 192
193 AGT AGA GAC GGG GCT TGG GCG CGG GGC CTG AGA GGT CAG GGG TCA GCA 240
241 GGA GTG AGG CTG GGG GGT CCA GGT CCG AGA GGT CAG GGG TCA GCT GGA 288
289 GAG GGG CTG GGG CGC CGG TTT CCC GGA GGT CAG GGG TCA GAA GGA ACA 336
337 GGG CTG CAG CGT CAG GGT CCG AGA GGT TAG GGG TCG GCA GAG GCG GAG 384
385 CTG GGG CAC TGG GGG TCA GGG GTC GGG GAT CAG GGC GGG GTC GGG TGC 432
433 ACT GGT AGC CTG CGC ATG GGC CTC CAG CTT CGC GCG CTG TTG GGA GCC 480
1 Met Gly Leu Gln Leu Arg Ala Leu Leu Gly Ala 11
481 TTC GGA CGG TGG ACC CTG CGC CTG GGA CCG CGT CCG TCC TGC TCG CCG 528
12 Phe Gly Arg Trp Thr Leu Arg Leu Gly Pro Arg Pro Ser Cys Ser Pro 27
529 CGC ATG GCC GGG AAC GCG GAG CCG CCG CCC GCC GGA GCC GCA TGC CCC 576
28 Arg Met Ala Gly Asn Ala Glu Pro Pro Pro Ala Gly Ala Ala Cys Pro 43
577 CAG GAC CGG AGG TCC TGC AGC GGC CGG GCC GGG GGC GAC CGC GTC TGG 624
44 Gln Asp Arg Arg Ser Cys Ser Gly Arg Ala Gly Gly Asp Arg Val Trp 59
625 GAG GAC GGA GAA CAT CCG GCG AAG AAG CTC AAG AGG GGT GGC GAC GAG 672
60 Glu Asp Gly Glu His Pro Ala Lys Lys Leu Lys Ser Gly Gly Asp Glu 75
673 GAG CGG CGC GAG AAG CCG CCC AAG CGG AAG ATC GTG CTG CTC ATG GCC 720
76 Glu Arg Arg Glu Lys Pro Pro Lys Arg Lys Ile Val Leu Leu Met Ala 91
721 TAT TCG GGC AAG GGC TAC CAC GGC ATG CAG AGG AAT GTC GGG TCC TCA 768
92 Tyr Ser Gly Lys Gly Tyr His Gly Met Gln Arg Asn Val Gly Ser Ser 107
769 CAA TTC AAA ACA ATT GAA GAT GAC TTG GTG TCC GCC CTC GTC CGG TCA 816
108 Gln Phe Lys Thr Ile Glu Asp Asp Leu Val Ser Ala Leu Val Arg Ser 123
817 GGC TGT ATT CCT GAA AAT CAT GGT GAG GAC ATG AGG AAA ATG TCC TTC 864
124 Gly Cys Ile Pro Glu Asn His Gly Glu Asp Met Arg Lys Met Ser Phe 139
865 CAG CGC TGC GCC CGG ACA GAC AAG GGT GTG TCC GCA GCC GGC CAG GTG 912
140 Gln Arg Cys Ala Arg Thr Asp Lys Gly Val Ser Ala Ala Gly Gln Val 155
913 GTA TCC CTG AAG GTG TGG CTG ATT GAC GAC ATT CTA GAA AAG ATC AAC 960
156 Val Ser Leu Lys Val Trp Leu Ile Asp Asp Ile Leu Glu Lys Ile Asn 171
961 AGC CAC CTT CCC TCT CAC ATT CGG ATT CTG GGA CTG AAG CGG GTC ACG 1008
172 Ser His Leu Pro Ser His Ile Arg Ile Leu Gly Leu Lys Arg Val Thr 187
1009 GGC GGG TTT AAC TCC AAG AAC AGA TGT GAT GCC AGG ACC TAT TGC TAC 1056
188 Gly Gly Phe Asn Ser Lys Asn Arg Cys Asp Ala Arg Thr Tyr Cys Tyr 203
1057 CTG CTG CCC ACG TTT GCC TTT GCG CAC AAG GAC CGG GAC GTT CAG GAT 1104
204 Leu Leu Pro Thr Phe Ala Phe Ala His Lys Asp Arg Asp Val Gln Asp 219
1105 GAG ACC TAC CGC CTG AGC GCC GAG ACG CTG CAG CAG GTC AAC AGG CTC 1152
220 Glu Thr Tyr Arg Leu Ser Ala Glu Thr Leu Gln Gln Val Asn Arg Leu 235
1153 CTG GCC TGC TAC AAG GGC ACG CAC TTC TTC CAC AAT TTC ACC TCG CAG 1200
236 Leu Ala Cys Tyr Lys Gly Thr His Asn Phe His Asn Phe Thr Ser Gln 251
1201 AAG GGG CCG CAG GAT CCC AGT GCC TGC CGC TAC ATC CTG GAG ATG TAC 1248
252 Lys Gly Pro Gln Asp Pro Ser Ala Cys Arg Tyr Ile Leu Glu Met Tyr 267
1249 TGC GAG GAA CCC TTT GTG CGG GAG GGC CTG GAG TTT GCG GTG ATC AGG 1296
268 Cys Glu Glu Pro Phe Val Arg Glu Gly Leu Glu Phe Ala Val Ile Arg 283
1297 GTG AAG GGC CAG AGC TTC ATG ATG CAT CAG ATC CGG AAG ATG GTC GGC 1344
284 Val Lys Gly Gln Ser Phe Met Met His Gln Ile Arg Lys Met Val Gly 299
1345 CTG GTG GTG GCC ATT GTG AAG GGT TAT GCC CCT GAG AGC GTG CTG GAG 1392
300 Leu Val Val Ala Ile Val Lys Gly Tyr Ala Pro Glu Ser Val Leu Glu 315
1393 CGC AGC TGG GGC ACA GAG AAG GTG GAC GTG CCC AAG GCG CCC GGA CTC 1440
316 Arg Ser Trp Gly Thr Glu Lys Val Asp Val Pro Lys Ala Pro Gly Leu 331
1441 GGC CTG GTC CTG GAG AGG GTG CAC TTC GAG AAG TAC AAC CAG CGC TTT 1488
332 Gly Leu Val Leu Glu Arg Val His Phe Glu Lys Tyr Asn Gln Arg Phe 347
1489 GGC AAC GAT GGG CTG CAT GAG CCG CTG GAC TGG GCG CAG GAG GAA GGA 1536
348 Gly Asn Asp Gly Leu His Glu Pro Leu Asp Trp Ala Gln Glu Glu Gly 363
1537 AAG GTC GCA GCC TTC AAG GAG GAG CAC ATC TAC CCC ACC ATC ATC GGC 1584
364 Lys Val Ala Ala Phe Lys Glu Glu His Ile Tyr Pro Thr Ile Ile Gly 379
1585 ACC GAG CGG GAC GAA CGC TCC ATG GCC CAG TGG CTG AGC ACC TTG CCC 1632
380 Thr Glu Arg Asp Glu Arg Ser Met Ala Gln Trp Leu Ser Thr Leu Pro 395
1633 ATC CAC AAC TTC AGT GCC ACC GCT CTC ACG GCA GGT GGC ACG GGC GCC 1680
396 Ile His Asn Phe Ser Ala Thr Ala Leu Thr Ala Gly Gly Thr Gly Ala 411
1681 AAG GTG CCC AGT CCC CTG GAA GGC AGT GAA GGG GAC GGA GAC ACT GAC 1728
412 Lys Val Pro Ser Pro Leu Glu Gly Ser Glu Gly Asp Gly Asp Thr Asp 427
1729 TGA GGC GAT GGG AGC TGC CCA CCA GAG TGC CTC TGA GCA GCT CAC AGT 1776
428 *** 428
1777 GTG TGC CCA GAT GTG CCA CCC TCT GTG GGC AGC AAG AAG CTG GGA TCG 1824
1825 CTG CAG CCA TGT TTT CCC GGC CAT GCC GGC GTT GTA ACC TCA GGA CCT 1872
1873 TCC CTT GTA GGA ACA GCC TTT CTC GAA TCT GTT TTC AGC TCT TGC ATT 1920
1921 GCA TAG ATG AAC CTC AGC ATG TAA AGA ACT ATT TTT TTA AAG AAG TGA 1968
1969 TTT TCT TAT TAA ACA AGT ACA AAT TTT GCT TAG TCA AAA AAA AAA AAA 2016
2017 AAA A 2020
12.PP9003
A:核苷酸序列(SEQ ID NO:34) 长度:2056
1 GAGACTTTCC TCCAGGGGCT TCCTCACTGG GGAATTGCCG GAAAGAGCAA ACAAAAAAGG
61 CGCTGGTGTA GGCTCCAAAA TAAACACATC TGAATTCATG ATGGCATCGA CAGAGGCTCT
121 TATTGGATTA AAAGTTTCAA AACAAACAAT AACGCTTTGG AAAAAGGGTT GAATGCACCC
181 TCAGGCACGA CCATGGAGAA AGGTGGGAAC ATACAATTGG AGATTCCTGA CTTCAGCAAC
241 TCTGTCCTGA GCCATCTAAA CCAGTTGCGC ATGCAGGGCC GTCTCTGTGA TATTGTGGTC
301 AATGTGCAAG GACAAGCTTT TCGGGCTCAC AAAGTGGTGC TGGCTGCCAG CTCCCCCTAT
361 TTCCGGGATC ACATGTCCTT GAATGAGATG AGTACAGTCT CCATTTCAGT CATCAAGAAC
421 CCTACTGTTT TTGAACAGCT CCTTTCTTTC TGTTACACAG GGCGGATATG CCTGCAACTG
481 GCAGATATCA TCAGCTACCT AACAGCTGCC AGTTTTCTGC AAATGCAGCA TATTATAGAC
541 AAATGTACAC AGATCCTGGA GGGCATTCAT TTTCAAAAAT TAATGTGGCT GAGGTTGAAG
601 CAGAATTAAG TCAAACAAGG ACAAAGCATC AAGAGAGACC TCCAGAGTCT CACAGGGTTA
661 CACCAAATCT CAACCGCTCC CTTAGCCCAC GACATAATAC CCCAAAGGGA AACCGGCGAG
721 GTCAGGTTAG TGCTGTGCTG GATATCAGAG AGCTAAGTCC TCCTGAGGAG TCCACCAGCC
781 CTCAGATCAT TGAACCAAGT TCTGATGTAG AGAGCCGG(A GCCCATTCTT CGGATCAACC
841 GAGCAGGACA GTGGTATGTG GAGACAGGAG TGGCGGACCG TGGGGGTCGG AGTGATGATG
901 AAGTTAGAGT TCTTGGAGCA GTACACATCA AAACTGAAAA TCTGGAGGAG TGGCTTGGGC
961 CTGAGAATCA GCCTTCTGGA GAAGATGGGA GTAGTGCAGA GGAAGTAACA GCCATGGTGA
1021 TTGATACCAC AGGCCATGGT TCTGTAGGAC AGGAAAATTA TACTTTAGGG TCTTCAGGAG
1081 CCAAGGTGGC TCGGCCAACA AGCAGTGAAG TTGACAGATT TAGCCCCTCC GGCAGTGTTG
1141 TTCCCTTGAC AGAGAGACAC AGAGCCAGAA GTGAGTCTRC TGGGAGAATG GATGAGCCTA
1201 AGCAACCCAG CTCCCAGGTA GAAGAGTCAG CAATGATGGG AGTAAGTGGC TATGTGGAGT
1261 ATCTCCGAGA GCAGGAAGTA TCTGAGCGGT GGTTCCGGTA CAACCCTCGT CTCACCTGCA
1321 TCTATTGCGC CAAATCTTTC AACCAGAAGG GAAGCCTGGA CCGCCACATG CGCCTACACA
1381 TGGGGATCAC ACCATTCGTC TGCCGCATGT GTGGCAAGAA GTATACCCGG AAAGATCAGC
1441 TGGAGTATCA TATCCGCAAG CACACAGGCA ACAAGCCCTT TCACTGTCAT GTCTGTGGCA
1501 AAAGTTTCCC CTTCCAGGCC ATCTTGAATC AGCACTTTCG CAAAAACCAC CCTGGCTGTA
1561 TACCCCTGGA GGGGCCTCAC AGCATCTCCC CTGAAACAAC TGTCACATCT CGAGGACAAG
1621 CTGAGGAAGA GTCACCTTCA CAGGAAGAGA CAGTTGCTCC TGGGGAAGCT GTCCAGGGCT
1681 CTGTGTCCAC CACTGGGCCA GACTGAAACA TCCAGGGGGA GGGGGCTGAC CCTCTTCCCC
1741 TTTGAGCCAT AAGCAGCCAG CATCAGAGCC ATGGGCTGAT ACTTAGATTC ACAAAATGCC
1801 ACATCACTAG GCCAGAAGAT GCTCCCAAGA TGTTGCCAAA CTGGAGGATC AGCAACTTAC
1861 ACAAAAGCAC TAAAGGCTCC TCCCTTCTTA TTGCCCGCCT CACACTTTGG AAAATAATCA
1921 AGCAAATCAA CTTTCTAATT CAGGGATCAA CAGCCTTGGT TTGTTAACTT TATAAGAAAA
1981 AAGGTTTTTT TAACAAAACG ATGATGATAA ATGGTCATTT ATCTATCAAA AAAAAAAAAA
2041 AAAAAAAAAA AAAAAA
B:氨基酸序列(SEQ ID NO:35) 长度:412
1 MPATGRYHQL PNSCQFSANA AYYRQMYTDP GGHSFSKINV AEVEAELSQT RTKHQERPPE
61 SHRVTPNLNR SLSPRHNTPK GNRRGQVSAV LDIRELSPPE ESTSPQIIEP SSDVESREPI
121 LRINRAGQWY VETGVADRGG RSDDEVRVLG AVHIKTENLE EWLGPENQPS GEDGSSAEEV
181 TAMVIDTTGH GSVGQENYTL GSSGAKVARP TSSEVDRFSP SGSVVPLTER HRARSESXGR
241 MDEPKQPSSQ VEESAMMGVS GYVEYLREQE VSERWFRYNP RLTCIYCAKS FNQKGSLDRH
301 MRLHMGITPF VCRMCGKKYT RKDQLEYHIR KHTGNKPFHC HVCGKSFPFQ AILNQHFRKN
361 HPGCIPLEGP HSISPETTVT SRGQAEEESP SQEETVAPGE AVQGSVSTTG PD
C.核苷酸及氨基酸组合序列(SEQ ID NO:36) 克隆号:PP9003
起始编码子:468 ATG 终止编码子:1704 TGA 蛋白质分子量:45841.28
1 GA GAC TTT CCT CCA GGG GCT TCC TCA CTG GGG AAT TGC CGG AAA GAG 47
48 CAA ACA AAA AAG GCG CTG GTG TAG GCT CCA AAA TAA ACA CAT CTG AAT 95
96 TCA TGA TGG CAT CGA CAG AGG CTC TTA TTG GAT TAA AAG TTT CAA AAC 143
144 AAA CAA TAA CGC TTT GGA AAA AGG GTT GAA TGC ACC CTC AGG CAC GAC 191
192 CAT GGA GAA AGG TGG GAA CAT ACA ATT GGA GAT TCC TGA CTT CAG CAA 239
240 CTC TGT CCT GAG CCA TCT AAA CCA GTT GCG CAT GCA GGG CCG TCT CTG 287
288 TGA TAT TGT GGT CAA TGT GCA AGG ACA AGC TTT TCG GGC TCA CAA AGT 335
336 GGT GCT GGC TGC CAG CTC CCC CTA TTT CCG CGA TCA CAT GTC CTT GAA 383
384 TGA GAT GAG TAC AGT CTC CAT TTC AGT CAT CAA GAA CCC TAC TGT TTT 431
432 TGA ACA GCT CCT TTC TTT CTG TTA CAC AGG GCG GAT ATG CCT GCA ACT 479
1 Met Pro Ala Thr 4
480 GGC AGA TAT CAT CAG CTA CCT AAC AGC TGC GAG TTT TCT GCA AAT GCA 527
5 Gly Arg Tyr His Gln Leu Pro Asn Ser Cys Gln Phe Ser Ala Asn Ala 20
528 GCA TAT TAT AGA CAA ATG TAC ACA GAT CCT GGA GGG CAT TCA TTT TCA 575
21 Ala Tyr Tyr Arg Gln Met Tyr Thr Asp Pro Gly Gly His Ser Phe Ser 36
576 AAA ATT AAT GTG GCT GAG GTT GAA GCA GAA TTA AGT CAA ACA AGG ACA 623
37 Lys Ile Asn Val Ala Glu Val Glu Ala Glu Leu Ser Gln Thr Arg Thr 52
624 AAG CAT CAA GAG AGA CCT CCA GAG TCT CAC AGG GTT ACA CCA AAT CTC 671
53 Lys His Gln Glu Arg Pro Pro Glu Ser His Arg Val Thr Pro Asn Leu 68
672 AAC CGC TCC CTT AGC CCA CGA CAT AAT ACC CCA AAG GGA AAC CGG CGA 719
69 Asn Arg Ser Leu Ser Pro Arg His Asn Thr Pro Lys Gly Asn Arg Arg 84
720 GGT CAG GTT AGT GCT GTG CTG GAT ATC AGA GAG CTA AGT CCT CCT GAG 767
85 Gly Gln Val Ser Ala Val Leu Asp Ile Arg Glu Leu Ser Pro Pro Glu 100
768 GAG TCC ACC AGC CCT CAG ATC ATT GAA CCA AGT TCT GAT GTA GAG AGC 815
101 Glu Ser Thr Ser Pro Gln Ile Ile Glu Pro Ser Ser Asp Val Glu Ser 116
816 CGG GAG CCC ATT CTT CGG ATC AAC CGA GCA GGA CAG TGG TAT GTG GAG 863
117 Arg Glu Pro Ile Leu Arg Ile Asn Arg Ala Gly Gln Trp Tyr Val Glu 132
864 ACA GGA GTG GCG GAC CGT GGG GGT CGG AGT GAT GAT GAA GTT AGA GTT 911
133 Thr Gly Val Ala Asp Arg Gly Gly Arg Ser Asp Asp Glu Val Arg Val 148
912 CTT GGA GCA GTA CAC ATC AAA ACT GAA AAT CTG GAG GAG TGG CTT GGG 959
149 Leu Gly Ala Val His Ile Lys Thr Glu Asn Leu Glu Glu Trp Leu Gly 164
960 CCT GAG AAT CAG CCT TCT GGA GAA GAT GGG AGT AGT GCA GAG GAA GTA 1007
165 Pro Glu Asn Gin Pro Ser Gly Glu Asp Gly Ser Ser Ala Glu Glu Val 180
1008 ACA GCC ATG GTG ATT GAT ACC ACA GGC CAT GGT TCT GTA GGA CAG GAA 1055
181 Thr Ala Met Val Ile Asp Thr Thr Gly His Gly Ser Val Gly Gln Glu 196
1056 AAT TAT ACT TTA GGG TCT TCA GGA GCC AAG GTG GCT CGG CCA ACA AGC 1103
197 Asn Tyr Thr Leu Gly Ser Ser Gly Ala Lys Val Ala Arg Pro Thr Ser 212
1104 AGT GAA GTT GAC AGA TTT AGC CCC TCC GGC AGT GTT GTT CCC TTG ACA 1151
213 Ser Glu Val Asp Arg Phe Ser Pro Ser Gly Ser Val Val Pro Leu Thr 228
1152 GAG AGA CAC AGA GCC AGA AGT GAG TCT RCT GGG AGA ATG GAT GAG CCT 1199
229 Glu Arg His Arg Ala Arg Ser Glu Ser Xxx Gly Arg Met Asp Glu Pro 244
1200 AAG CAA CCC AGC TCC CAG GTA GAA GAG TCA GCA ATG ATG GGA GTA AGT 1247
245 Lys Gln Pro Ser Ser Gln Val Glu Glu Ser Ala Met Met Gly Val Ser 260
1248 GGC TAT GTG GAG TAT CTC CGA GAG CAG GAA GTA TCT GAG CGG TGG TTC 1295
261 Gly Tyr Val Glu Tyr Leu Arg Glu Gln Glu Val Ser Glu Arg Trp Phe 276
1296 CGG TAC AAC CCT CGT CTC ACC TGC ATC TAT TGC GCC AAA TCT TTC AAC 1343
277 Arg Tyr Asn Pro Arg Leu Thr Cys Ile Tyr Cys Ala Lys Ser Phe Asn 292
1344 CAG AAG GGA AGC CTG GAC CGC CAC ATG CGC CTA CAC ATG GGG ATC ACA 1391
293 Gln Lys Gly Ser Leu Asp Arg His Met Arg Leu His Met Gly Ile Thr 308
1392 CCA TTC GTC TGC CGC ATG TGT GGC AAG AAG TAT ACC CGG AAA GAT CAG 1439
309 Pro Phe Val Cys Arg Met Cys Gly Lys Lys Tyr Thr Arg Lys Asp Gln 324
1440 CTG GAG TAT CAT ATC CGC AAG CAC ACA GGC AAC AAG CCC TTT CAC TGT 1487
325 Leu Glu Tyr His Ile Arg Lys His Thr Gly Asn Lys Pro Phe His Cys 340
1488 CAT GTC TGT GGC AAA AGT TTC CCC TTC CAG GCC ATC TTG AAT CAG CAC 1535
341 His Val Cys Gly Lys Ser Phe Pro Phe Gln Ala Ile Leu Asn Gln His 356
1536 TTT CGC AAA AAC CAC CCT GGC TGT ATA CCC CTG GAG GGG CCT CAC AGC 1583
357 Phe Arg Lys Asn His Pro Gly Cys Ile Pro Leu Glu Gly Pro His Ser 372
1584 ATC TCC CCT GAA ACA ACT GTC ACA TCT CGA GGA CAA GCT GAG GAA GAG 1631
373 Ile Ser Pro Glu Thr Thr Val Thr Ser Arg Gly Gln Ala Glu Glu Glu 388
1632 TCA CCT TCA CAG GAA GAG ACA GTT GCT CCT GGG GAA GCT GTC CAG GGC 1679
389 Ser Pro Ser Gln Glu Glu Thr Val Ala Pro Gly Glu Ala Val Gln Gly 404
1680 TCT GTG TCC ACC ACT GGG CCA GAC TGA AAC ATC CAG GGG GAG GGG GCT 1727
405 Ser Val Ser Thr Thr Gly Pro Asp *** 413
1728 GAC CCT CTT CCC CTT TGA GCC ATA AGC AGC CAG CAT CAG AGC CAT GGG 1775
1776 CTG ATA CTT AGA TTC ACA AAA TGC CAC ATC ACT AGG CCA GAA GAT GCT 1823
1824 CCC AAG ATG TTG CCA AAC TGG AGG ATC AGC AAC TTA CAC AAA AGC ACT 1871
1872 AAA GGC TCC TCC CTT CTT ATT GCC CGC CTC ACA CTT TGG AAA ATA ATC 1919
1920 AAG CAA ATC AAC TTT CTA ATT CAG GGA TCA ACA GCC TTG GTT TGT TAA 1967
1968 CTT TAT AAG AAA AAA GGT TTT TTT AAC AAA ACG ATG ATG ATA AAT GGT 2015
2016 CAT TTA TCT ATC AAA AAA AAA AAA AAA AAA AAA AAA AAA AA 2056
Claims (10)
1.一种分离的具有抑癌功能的人蛋白多肽,其特征在于,它是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、23、26、29、32、35。
2.如权利要求1所述的多肽,其特征在于,该多肽的氨基酸序列选自下组:SEQ ID NO:2、5、8、11、14、17。
3.一种分离的多核苷酸,其特征在于,选自下组:
(a)编码如权利要求1所述多肽的多核苷酸;
(b)与多核苷酸(a)完全互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、23、26、29、32、35。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、6、9、12、15、18、24、27、30、33、36的编码区序列或全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求6所述的载体转化或转导的宿主细胞;
(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有抑癌功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含:
(a)在适合表达具有抑癌功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;
(b)从培养物中分离出具有抑癌功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有抑癌功能的人蛋白多肽特异性结合的抗体。
10.一种药物组合物,其特征在于,它含有安全有效量的权利要求1所述的多肽以及药学上可接受的载体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB011053119A CN1209373C (zh) | 2001-02-08 | 2001-02-08 | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB011053119A CN1209373C (zh) | 2001-02-08 | 2001-02-08 | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1368510A CN1368510A (zh) | 2002-09-11 |
CN1209373C true CN1209373C (zh) | 2005-07-06 |
Family
ID=4654394
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB011053119A Expired - Fee Related CN1209373C (zh) | 2001-02-08 | 2001-02-08 | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1209373C (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2514058C (en) | 2003-01-24 | 2014-05-13 | Agensys, Inc. | Nucleic acids and corresponding proteins entitled 254p1d6b useful in treatment and detection of cancer |
CN113430232A (zh) * | 2021-06-29 | 2021-09-24 | 四川大学 | 一种腺相关病毒中和抗体含量的检测方法及细胞系的构建方法 |
-
2001
- 2001-02-08 CN CNB011053119A patent/CN1209373C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1368510A (zh) | 2002-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1048731C (zh) | 编码细胞因子抑制性抗炎药物结合蛋白质的多核苷酸 | |
CN1170850C (zh) | 人血管生成素样蛋白和编码序列及其用途 | |
CN1209373C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1169954C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1155615C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1177049C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1160370C (zh) | 新的人细胞周期控制相关蛋白及其编码序列 | |
CN1177048C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1177864C (zh) | 在肝癌组织中具有表达差异的新的人蛋白及其编码序列 | |
CN1199998C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1177050C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1194010C (zh) | 具有抑制癌细胞生长功能的人蛋白及基编码序列 | |
CN1199997C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1222616C (zh) | 具有抑癌功能的新的人蛋白及其编码序列 | |
CN1169955C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1199999C (zh) | 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1155614C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1194989C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1229387C (zh) | 具有抑癌功能的新的人蛋白及其编码序列 | |
CN1231496C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1199994C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1169956C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1169831C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1169958C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1177047C (zh) | 编码具有抑癌功能的人蛋白的多核苷酸 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |