CN1194989C - 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 - Google Patents
具有抑制癌细胞生长功能的新的人蛋白及其编码序列 Download PDFInfo
- Publication number
- CN1194989C CN1194989C CNB011045450A CN01104545A CN1194989C CN 1194989 C CN1194989 C CN 1194989C CN B011045450 A CNB011045450 A CN B011045450A CN 01104545 A CN01104545 A CN 01104545A CN 1194989 C CN1194989 C CN 1194989C
- Authority
- CN
- China
- Prior art keywords
- leu
- ser
- ala
- pro
- glu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。
Description
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ IDNO:14、SEQ ID NO:17、SEQ ID NO:20。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续的10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
本发明采用大规模cDNA克隆转染癌细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对癌细胞(肝癌细胞)具有抑制克隆形成的作用,其抑制率在50%或50%以上。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。具有抑癌功能的蛋白多肽的纯度能用氨基酸序列分析。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以SP329蛋白为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。对于其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ ID NO:2所示的成熟多肽有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,ALaboratory Manual,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽(Science,1984;224:1431)。一般来说有以下步骤:
(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.Molecular Cloning,a Laboratory Manual,cold Spring HarborLaboratory.New York,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
上述方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。其例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有抑癌功能的蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有抑癌功能的蛋白,以抑制内源性的具有抑癌功能的蛋白活性。例如,一种变异的具有抑癌功能的蛋白可以是缩短的、缺失了信号传导功能域的具有抑癌功能的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭具有抑癌功能的人蛋白阳性的细胞。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.Pat No.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与具有抑癌功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具体位置且并可与其杂交。现在,只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。根据本发明,为了将这些序列与疾病相关基因相关联,其重要的第一步就是将这些DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与JohnsHopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力,被精确定位至与疾病有关的染色体区域的cDNA,可以是50至500个潜在致病基因间之一种(假定l兆碱基作图分辨能力和每20kb对应于一个基因)。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:cDNA基因的获得及对癌细胞克隆形成的抑制作用
SP329来自于从GIBCO BRL公司购得肝cDNA文库(cat,No.10422-012),PP203,PP238,PP856,PP1065,PP1221,PP2250来自于按常规方法构建的人胎盘cDNA文库。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Seratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg cDNA滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系7721。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24~48小时,边观察,边换G418浓度不等的培液。约2~3次后,直到镜检细胞有克隆形成,计数。发现SP329,PP203,PP238,PP856,PP1065,PP1221,PP2250和PP3898有抑制细胞克隆形成作用(抑制率在50%或50%以上),结果如下表1所示。
cDNA克隆转染细胞(7721)克隆形成情况
cDNA克隆 CDNA克隆数 空载体克隆数
名称 (三个重复) (三个重复)
SP329 2 0 0 18 24 23
PP203 6 8 13 27 31 26
PP238 0 0 0 20 17 16
PP856 0 1 0 30 13 15
PP1065 2 0 1 32 39 37
PP1221 0 0 1 30 20 22
PP2250 0 0 1 32 31 34
PP3898 2 0 0 33 34 38
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列。
对SP329、PP203、PP238、PP856、PP1065、PP1221、PP2250、PP3898 cDNA克隆序列分析后发现基因尚不完整,采用Clontech公司SMART RACE cDNA扩增试剂盒(Cat.No.K1811-1),设计基因特异引物(如下表2所示),按说明书进行操作,获得全长克隆。
表2
克隆名称 | 特异引物1 | 特异引物2 |
SP329 | 5′GCTTCGCTCAAGAAGAAAAAGGCAC 3′ | 5′AGGACCTCCCAACTGCATGCCTC 3′ |
PP203 | 5′ACCCCTGGGATCCAACTCTTTGGTG 3′ | 5′CTGGGTATAGGCCACAGCGATCCAA 3′ |
PP238 | 5′TGTTCTGCCGGGAGGAGAAGCAGTA 3′ | 5′CCGTTCTTCTTCTCCACCTGCTCCC 3′ |
PP856 | 5′CCAGGGTGACTCAGCTGTCACTCCA 3′ | 5′CCAGAACTTTCCGCAGACCTTGTGC 3′ |
PP1065 | 5′GGAAAGGGGCTAGCATGAAGGTCCA 3′ | 5′TATGTTGGGGTGGGAGGAGCTCTGA 3′ |
PP1221 | 5′TATGGCTTTCTTGCCAGGAGGGGTC 3′ | 5′CCCTGGGTAGAACGGGTGAAGGGAT 3′ |
PP2250 | 5′GTCTGGGTATCAGCTGTTGGGGCCT 3′ | 5′ACAAGGAGAGAGTGCGGCTGCTGAG 3′ |
PP3898 | 5′TCATCCAGCCGGTCACTTGACTTGA 3′ | 5′GCCACAGCTGGTAGTTGGACTTGCC 3′ |
具体而言,对各克隆使用如下引物:
PP203克隆
通用引物mix(UPM)Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3′
巢式通用引物(NUP) 5′AAGCAGTGGTAACAACGCAGAGT 3′
pp203-NB 5′ACCCCTGGGATCCAACTCTTTGGTG 3′
pp203-B 5′CTGGGTATAGGCCACAGCGATCCAA 3′
PP238克隆
通用引物mix(UPM)Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3″
巢式通用引物(NUP) 5′AAGCAGTGGTAACAACGCAGAGT 3′
pp238-NB 5′TGTTCTGCCGGGAGGAGAAGCAGTA 3′
pp238-B 5′CCGTTCTTCTTCTCCACCTGCTCCC 3′
PP856克隆
通用引物mix(UPM)Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3′
巢式通用引物(NUP) 5′AAGCAGTGGTAACAACGCAGAGT 3′
pp856-NB 5′CCAGGGTGACTCAGCTGTCACTCCA3′
pp856-B 5′CCAGAACTTTCCGCAGACCTTGTGC 3′
PP1065克隆
通用引物mix(UPM)Long 5′CTAATACGACTCACTATAGGGCAAGCAGTGGTAACAACGCAGAGT 3′
巢式通用引物(NUP) 5′AAGCAGTGGTAACAACGCAGAGT 3′
PP1065-B: 5′GGAAAGGGGCTAGCATGAAGGTCCA 3′
PP1065-NB 5′TATGTTGGGGTGGGAGGAGCTCTGA 3′
PP1221克隆
衔接引物1(AP1) 5′CCATCCTAATACGACTCACTATAGGGC3′ 27
衔接引物2(AP2) 5′ACTCACTATAGGGCTCGAGCGGC 3′ 23
pp1221-C 5′TATGGCTTTCTTGCCAGGAGGGGTC 3′ 25
pp1221-NC 5′CCCTGGGTAGAACGGGTGAAGGGAT 3′ 25
pp2250-C 5′ACAAGGAGAGAGTGCGGCTGCTGAG 3′
pp2250-D 5′TGCATGCCACTTTCAGTCAACAGGA 3′
PP329克隆
衔接引物1(AP1) 5′CCATCCTAATACGACTCACTATAGGGC 3′27
衔接引物2(AP2) 5′ACTCACTATAGGGCTCGAGCGGC 3′ 23
sp329-B 5′gcttcgctcaagaagaaaaaggcac 3′ 25
sp329-NB 5′aggacctcccaactgcatgcctc 3′ 23
其中,对使用通用引物的克隆,获得全长基因按如下操作。用人胎盘组织mRNA为起始材料,按Clontech公司SM ART RACE cDNA扩增试剂盒(cat # 1811-1)说明书获得cDNA.然后分别次UPM引物和基因特异的X-B进行第一软PCR,再以NUP引物和基因特异的X-NB进行第二轮PCR,获得基因片段(注:X为基因克隆号码)。
反应条件为:94℃3′一个循环
(第一轮) 94℃1′58℃1′72℃2′35个循环
72℃10′一个循环
(第二轮) 同上,但退火温度为60℃
对使用衔接引物的克隆,以Clonteoh公司Marathon-Ready人肝cDNA(cat # 7407-1)为样板,分别以Apl和X-C引物进行第一轮PCR,再以Apl和X-NC进行第二轮PCR获得基因片段(注:X为基因克隆号码)。反应条件同上。
PP2250以人胎盘cDNA为样板,PP2250-C,PP2250-D为引物按94℃3′1个循环,94℃1′60℃1′1 70℃2′35个循环,72℃10′一个循环进行PCR,获得基因片段。
实施例2:cDNA克隆序列分析
1. SP329
A:核苷酸序列(SEQ ID NO:1)长度:2360
TGTCAGTAAG TGGAAAAGGC AAGACTCCAC TTCGAAAGAG GTACAACTCC CATCAGATGG 60
GCCAGTCGAA GCAGTTTCCC CTCGAGGAAA GCAGCTGTGA GAAAGGCTGT CAGGTCACCA 120
GTGAGCAGAT CAAAGCCGAT ATGAAAGCAG CTAGGGATAT TCCTGAAAAG AAAAAAAACA 180
AGGATGTTTA TCCCAGCTGC AGCAGCACCA CCGCCAGCAC AGTGGGAAAC TCCAGCTCAC 240
ACAACACTGC TTCTCAAAGC CCCGACTTTG TAAGGACGGT GAACAGCGGC GGCTCTTCCG 300
AGCCTAGCCC TACAGAAGTG GATGTGTCCA GGCAGTGTGC CTGCTCCCCC GGTGGGTCAG 360
AGGACTCTGA GGCCATGGAG GAGGGAGATG CAGAGAGTTC TGTCTGCCCA GATGCTTGCT 420
GTCACAGGCC CCAGGAATTC CCAAAGGAGA ACTAGCAGGT GTTCTGATGA GGAACGTCCT 480
TCAACCAGCC GAGCCTGTGT TGTGAATGGC CCGGATGGTA CGAGATCCGC CTTTTCCTTT 540
AGGACTCTGC CACAAGGGGG GTCTTCAGGC CCAGCACATG ATGAGAGGAC TAATGGGAGT 600
GGCTCTGGGG CTACAGGTGA GGACAGGAGG GGGAGCTCCC AGCCTGAGAG TTGTGACGTG 660
CAGTCTAATG AAGACTACCC TCGGAGGCCC CTAACCAGGG CCAGGAGCAG ACTGTCCCAT 720
GTACTGCTGG TATCTGAGTC AGAAGTAGCC AAAACAAAGC CACGTCACGC CATGAAACGG 780
AAGCGGACAG CAGATAAATC CACTAGTACA AGTGATCCTG TGATCGAGGA TGACCATGTG 840
CAGGTTCTTG TATTAAAATC CAAGAATCTT GTTGGAGTCA CTATGACCAA TTGTGGAATC 900
ACAGATCTAG TGCTAAAAGA CTGTCCAAAG ATGATGTTCA TCCATGCTAC CAGGTGCAGG 960
GTACTAAAAC ATTTAAAGGT AGAAAATGCA CCAATTGTAA ACCGATTTGA CTATGCACAG 1020
TGCAAGAAAC TGAACATGGA TCAGGTACTA GACCAGATAC TAAGAATGCC ACCCGAGAGA 1080
AACCGCATCA TATACCTACG CCCAATGCAG CAGGTGGACA CTCTAACTTT GGAGCAGAAG 1140
CTATTTAGTG GTCCCTACCC CTATCACATC TGTATTATCC ATGAATTCAG TAACCCTCCC 1200
AATGTCCGGA ATAAGGTGCG CATTCGCAGC TGGATGGACA CTATAGCAAA CATCAATCAA 1260
GAGCTCATTA AATATGAATT CTTCCCTGAA GCCACTCGAA GTGAAGAAGA CTTAAAGAAA 1320
TACCCCAAGT ACCCCTGGGG GAGAGAAATC TATACTTTAG AAGGTGTTGT GGATGGAGCT 1380
CCATATTCCA TGATTTCTGA CTTCCCTTGG CTGAGGTCAT TACGAGCTGC AGAGCCCAAC 1440
AGCTTCGCTC GATACGACTT TGAAGACGAT GAAGAAAGCA CTATCTATGC TCCTAGAAGG 1500
AAAGGACAGC TGTCTGCAGA CATCTGTATG GAAACAATAG GAGAGGAAAT TTCAGAGATG 1560
CGTCAGATGA AGAAGGGTGT ATTTCAGCGA GTAGTGGCAA TTTTTATCCA CTATTGTGAT 1620
GTCAATGGAG AGCCAGTTGA AGATGACTAC ATTTAATTGG TCCCTCCTCC TTTCCAGCTA 1680
TTTTGTCAGA AAGCAAGTAG GGCCATCCAG CTGCCAGAGT GCTCCACAGG GACTTGAGGC 1740
ATGCAGTTGG GAGGTCCTGG CTCGGTTTGC TATATAGGGA ATATATAAGG AACATCGAAA 1800
TTGTATACAA AGATTTGTAC ATAAAAAATA TACAAAGACG CTTCCTAAAG TACCAACTTT 1860
ATATCATATG TTTATACAAT TTAATTTAAA AATTCATTTT AAGGAAGACA GATAATTTGA 1920
AAGACTTTTG TTTTTCTTGA CTTAATTCAT GAAGTATCAT TTTTTGACTG AGTCTCCATT 1980
TACTTCATTC TTAATGATTA TTGTCATCCC TTTAAATCTG TGCCTTTTTC TTCTTGAGCG 2040
AAGCTGTTTG AGTAAACCTG TTGAAGAGTG TTTGTGTCTT GTGTGCTTTT TTGTTGTTAT 2100
TAAAACACCA ACTAAACCTT ATAGTCAAGA CAAGGCTCTA TGTTTCTGTA CAAAGCTGTA 2160
GTTCTTTCTT AGTATTATAG TTGCCATGTT TCTTAAAATC AAGTAAAAAG ACTTATGAGC 2220
TTAAAAAAAA GTGAGTTTGA GAGGGAAATG GAAAAGTTTC CAGAGTATTT CTAGTAATTA 2280
TTTCCACATT GAATTGTGTA TATGCTTTAT CTTGAATATA AAATAAAAGT TTATTAAAAA 2340
CTTTAAAAAA AAAAAAAAAA 2360
B:氨基酸序列(SEQ ID NO:2)长度:444
1 MCPGSVPAPP VGQRTLRPWR REMQRVLSAQ MLAVTGPRNS QRRTSRCSDE
51 ERPSTSRACV VNGPDGTRSA FSFRTLPQGG SSGPAHDERT NGSGSGATGE
101 DRRGSSQPES CDVQSNEDYP RRPLTRARSR LSHVLLVSES EVAKTKPRHA
151 MKRKRTADKS TSTSDPVIED DHVQVLVLKS KNLVGVTMTN CGITDLVLKD
201 CPKMMFIHAT RCRVLKHLKV ENAPIVNRFD YAQCKKLNMD QVLDQILRMP
251 PERNRIIYLR PMQQVDTLTL EQKLFSGPYP YHICIIHEFS NPPNVRNKVR
301 IRSWMDTIAN INQELIKYEF FPEATRSEED LKKYPKYPWG REIYTLEGVV
351 DGAPYSMISD FPWLRSLRAA EPNSFARYDF EDDEESTIYA PRRKGQLSAD
401 ICMETIGEEI SEMRQMKKGV FQRVVAIFIH YCDVNGEPVE DDYI
克隆号:SP329(SEQ ID NO:3)
起始编码子:322 ATG 终止编码子:1656 TAA 蛋白质分子量:50647.03
1 TGT CAG TAA GTG GAA AAG GCA AGA CTC CAC TTC GAA AGA GGT ACA ACT 48
49 CCC ATC AGA TGG GCC AGT CGA AGC AGT TTC CCC TCG AGG AAA GCA GCT 96
97 GTG AGA AAG GCT GTC AGG TCA CCA GTG AGC AGA TCA AAG CCG ATA TGA 144
145 AAG CAG CTA GGG ATA TTC CTG AAA AGA AAA AAA ACA AGG ATG TTT ATC 192
193 CCA GCT GCA GCA GCA CCA CCG CCA GCA CAG TGG GAA ACT CCA GCT CAC 240
241 ACA ACA CTG CTT CTC AAA GCC CCG ACT TTG TAA GGA CGG TGA ACA GCG 288
289 GCG GCT CTT CCG AGC CTA GCC CTA CAG AAG TGG ATG TGT CCA GGC AGT 336
1 Met Cys Pro Gly Ser 5
337 GTG CCT GCT CCC CCG GTG GGT CAG AGG ACT CTG AGG CCA TGG AGG AGG 384
6 Val Pro Ala Pro Pro Val Gly Gln Arg Thr Leu Arg Pro Trp Arg Arg 21
385 GAG ATG CAG AGA GTT CTG TCT GCC CAG ATG CTT GCT GTC ACA GGC CCC 432
22 Glu Met Gln Arg Val Leu Ser Ala Gln Met Leu Ala Val Thr Gly Pro 37
433 AGG AAT TCC CAA AGG AGA ACT AGC AGG TGT TCT GAT GAG GAA CGT CCT 480
38 Arg Asn Ser Gln Arg Arg Thr Ser Arg Cys Ser Asp Glu Glu Arg Pro 53
481 TCA ACC AGC CGA GCC TGT GTT GTG AAT GGC CCG GAT GGT ACG AGA TCC 528
54 Ser Thr Ser Arg Ala Cys Val Val Asn Gly Pro Asp Gly Thr Arg Ser 69
529 GCC TTT TCC TTT AGG ACT CTG CCA CAA GGG GGG TCT TCA GGC CCA GCA 576
70 Ala Phe Ser Phe Arg Thr Leu Pro Gln Gly Gly Ser Ser Gly Pro Ala 85
577 CAT GAT GAG AGG ACT AAT GGG AGT GGC TCT GGG GCT ACA GGT GAG GAC 624
86 His Asp Glu Arg Thr Asn Gly Ser Gly Ser Gly Ala Thr Gly Glu Asp 101
625 AGG AGG GGG AGC TCC CAG CCT GAG AGT TGT GAC GTG CAG TCT AAT GAA 672
102 Arg Arg Gly Ser Ser Gln Pro Glu Ser Cys Asp Val Gln Ser Asn Glu 117
673 GAC TAC CCT CGG AGG CCC CTA ACC AGG GCC AGG AGC AGA CTG TCC CAT 720
118 Asp Tyr Pro Arg Arg Pro Leu Thr Arg Ala Arg Ser Arg Leu Ser His 133
721 GTA CTG CTG GTA TCT GAG TCA GAA GTA GCC AAA ACA AAG CCA CGT CAC 768
134 Val Leu Leu Val Ser Glu Ser Glu Val Ala Lys Thr Lys Pro Arg His 149
769 GCC ATG AAA CGG AAG CGG ACA GCA GAT AAA TCC ACT AGT ACA AGT GAT 816
150 Ala Met Lys Arg Lys Arg Thr Ala Asp Lys Ser Thr Ser Thr Ser Asp 165
817 CCT GTG ATC GAG GAT GAC CAT GTG CAG GTT CTT GTA TTA AAA TCC AAG 864
166 Pro Val Ile Glu Asp Asp His Val Gln Val Leu Val Leu Lys Ser Lys 181
865 AAT CTT GTT GGA GTC ACT ATG ACC AAT TGT GGA ATC ACA GAT CTA GTG 912
182 Asn Leu Val Gly Val Thr Met Thr Asn Cys Gly Ile Thr Asp Leu Val 197
913 CTA AAA GAC TGT CCA AAG ATG ATG TTC ATC CAT GCT ACC AGG TGC AGG 960
198 Leu Lys Asp Cys Pro Lys Met Met Phe Ile His Ala Thr Arg Cys Arg 213
961 GTA CTA AAA CAT TTA AAG GTA GAA AAT GCA CCA ATT GTA AAC CGA TTT 1008
214 Val Leu Lys His Leu Lys Val Glu Asn Ala Pro Ile Val Asn Arg Phe 229
1009 GAC TAT GCA CAG TGC AAG AAA CTG AAC ATG GAT CAG GTA CTA GAC CAG 1056
230 Asp Tyr Ala Gln Cys Lys Lys Leu Asn Met Asp Gln Val Leu Asp Gln 245
1057 ATA CTA AGA ATG CCA CCC GAG AGA AAC CGC ATC ATA TAC CTA CGC CCA 1104
246 Ile Leu Arg Met Pro Pro Glu Arg Asn Arg Ile Ile Tyr Leu Arg Pro 261
1105 ATG CAG CAG GTG GAC ACT CTA ACT TTG GAG CAG AAG CTA TTT AGT GGT 1152
262 Met Gln Gln Val Asp Thr Leu Thr Leu Glu Gln Lys Leu Phe Ser Gly 277
1153 CCC TAC CCC TAT CAC ATC TGT ATT ATC CAT GAA TTC AGT AAC CCT CCC 1200
278 Pro Tyr Pro Tyr His Ile Cys Ile Ile His Glu Phe Ser Asn Pro Pro 293
1201 AAT GTC CGG AAT AAG GTG CGC ATT CGC AGC TGG ATG GAC ACT ATA GCA 1248
294 Asn Val Arg Asn Lys Val Arg Ile Arg Ser Trp Met Asp Thr Ile Ala 309
1249 AAC ATC AAT CAA GAG CTC ATT AAA TAT GAA TTC TTC CCT GAA GCC ACT 1296
310 Asn Ile Asn Gln Glu Leu Ile Lys Tyr Glu Phe Phe Pro Glu Ala Thr 325
1297 CGA AGT GAA GAA GAC TTA AAG AAA TAC CCC AAG TAC CCC TGG GGG AGA 1344
326 Arg Ser Glu Glu Asp Leu Lys Lys Tyr Pro Lys Tyr Pro Trp Gly Arg 341
1345 GAA ATC TAT ACT TTA GAA GGT GTT GTG GAT GGA GCT CCA TAT TCC ATG 1392
342 Glu Ile Tyr Thr Leu Glu Gly Val Val Asp Gly Ala Pro Tyr Ser Met 357
1393 ATT TCT GAC TTC CCT TGG CTG AGG TCA TTA CGA GCT GCA GAG CCC AAC 1440
358 Ile Ser Asp Phe Pro Trp Leu Arg Ser Leu Arg Ala Ala Glu Pro Asn 373
1441 AGC TTC GCT CGA TAC GAC TTT GAA GAC GAT GAA GAA AGC ACT ATC TAT 1488
374 Ser Phe Ala Arg Tyr Asp Phe Glu Asp Asp Glu Glu Ser Thr Ile Tyr 389
1489 GCT CCT AGA AGG AAA GGA CAG CTG TCT GCA GAC ATC TGT ATG GAA ACA 1536
390 Ala Pro Arg Arg Lys Gly Gln Leu Ser Ala Asp Ile Cys Met Glu Thr 405
1537 ATA GGA GAG GAA ATT TCA GAG ATG CGT CAG ATG AAG AAG GGT GTA TTT 1584
406 Ile Gly Glu Glu Ile Ser Glu Met Arg Gln Met Lys Lys Gly Val Phe 421
1585 CAG CGA GTA GTG GCA ATT TTT ATC CAC TAT TGT GAT GTC AAT GGA GAG 1632
422 Gln Arg Val Val Ala Ile Phe Ile His Tyr Cys Asp Val Asn Gly Glu 437
1633 CCA GTT GAA GAT GAC TAC ATT TAA TTG GTC CCT CCT CCT TTC CAG CTA 1680
438 Pro Val Glu Asp Asp Tyr Ile *** 445
1681 TTT TGT CAG AAA GCA AGT AGG GCC ATC CAG CTG CCA GAG TGC TCC ACA 1728
1729 GGG ACT TGA GGC ATG CAG TTG GGA GGT CCT GGC TCG GTT TGC TAT ATA 1776
1777 GGG AAT ATA TAA GGA ACA TCG AAA TTG TAT ACA AAG ATT TGT ACA TAA 1824
1825 AAA ATA TAC AAA GAC GCT TCC TAA AGT ACC AAC TTT ATA TCA TAT GTT 1872
1873 TAT ACA ATT TAA TTT AAA AAT TCA TTT TAA GGA AGA CAG ATA ATT TGA 1920
1921 AAG ACT TTT GTT TTT CTT GAC TTA ATT CAT GAA GTA TCA TTT TTT GAC 1968
1969 TGA GTC TCC ATT TAC TTC ATT CTT AAT GAT TAT TGT CAT CCC TTT AAA 2016
2017 TCT GTG CCT TTT TCT TCT TGA GCG AAG CTG TTT GAG TAA ACC TGT TGA 2064
2065 AGA GTG TTT GTG TCT TGT GTG CTT TTT TGT TGT TAT TAA AAC ACC AAC 2112
2113 TAA ACC TTA TAG TCA AGA CAA GGC TCT ATG TTT CTG TAC AAA GCT GTA 2160
2161 GTT CTT TCT TAG TAT TAT AGT TGC CAT GTT TCT TAA AAT CAA GTA AAA 2208
2209 AGA CTT ATG AGC TTA AAA AAA AGT GAG TTT GAG AGG GAA ATG GAA AAG 2256
2257 TTT CCA GAG TAT TTC TAG TAA TTA TTT CCA CAT TGA ATT GTG TAT ATG 2304
2305 CTT TAT CTT GAA TAT AAA ATA AAA GTT TAT TAA AAA CTT TAA AAA AAA 2352
2353 AAA AAA AA 2360
2. PP203
A:核苷酸序列(SEQ ID NO:4)长度:2379
GGTGCACACC CGGAAGTGGG TGCGGGCCAG CCGGCTCGCC CGGGGGCCAT GGCAGCAGCG 60
GCTACTGCAG CCGAGGGGGT CCCCAGTCGG GGGCCTCCCG GGGAAGTCAT TCATCTGAAT 120
GTGGGAGGCA AGAGATTCAG TACCTCTCGC CAGACTCTCA CCTGGATCCC AGACTCCTTC 180
TTCTCCAGTC TTCTGAGCGG ACGCATCTCG ACGCTGAAAG ATGAGACCGG AGCAATCTTC 240
ATCGACAGGG ACCCTACAGT CTTCGCCCCC ATCCTCAACT TCCTGCGCAC CAAAGAGTTG 300
GATCCCAGGG GTGTCCACGG TTCCAGCCTC CTCCATGAAG CCCAGTTCTA TGGGCTCACT 360
CCTCTGGTTC GTCGCCTGCA GCTTCGAGAG GAGTTGGATC GATCTTCTTG TGGAAACGTC 420
CTCTTCAATG GTTACCTGCC GCCACCAGTG TTCCCAGTGA AGCGGCGGAA CCGGCACAGC 480
CTAGTGGGGC CTCAGCAGCT AGGAGGACGG CCAGCCCCTG TCCGACGGAG CAACACGATG 540
CCCCCCAACC TTGGCAATGC AGGGCTGCTG GGCCGAATGC TGGATGAGAA AACCCCTCCC 600
TCACCCTCAG GACAACCTGA GGAGCCGGGG ATGGTGCGCC TGGTGTGTGG ACACCATAAT 660
TGGATCGCTG TGGCCTATAC CCAGTTTCTA GTCTGCTACA GGTTGAAGGA AGCCTCTGGC 720
TGGCAGCTGG TGTTTTCCAG CCCCCGCCTG GACTGGCCCA TCGAACGACT GGCGCTCACA 780
GCCCGGGTGC ATGGTGGGGC TTTGGGTGAA CATGACAAGA TGGTGGCAGC AGCCACCGGC 840
AGCGAGATCC TGCTATGGGC TCTGCAGGCG GAAGGCGGTG GCTCCGAGAT AGGGGTCTTT 900
CATCTGGGGG TGCCTGTGGA GGCCTTGTTC TTCGTCGGGA ACCAGCTCAT TGCTACAAGC 960
CACACAGGGC GCATCGGGGT GTGGAATGCC GTCACCAAGC ACTGGCAGGT CCAGGAGGTG 1020
CAGCCCATCA CCAGTTATGA CGCGGCAGGC TCCTTCCTCC TCCTGGGCTG CAACAACGGC 1080
TCCATTTACT ACGTGGATGT GCAGAAGTTC CCCTTGCGCA TGAAAGACAA CGACCTCCTT 1140
GTCAGCGAGC TCTATCGGGA CCCAGCGGAG GATGGGGTCA CCGCCCTCAG TGTCTACCTC 1200
ACCCCCAAGA CCAGTGACAG TGGGAACTGG ATCGAGATCG CCTATGGCAC CAGCTCAGGG 1260
GGCGTGCGGG TCATCGTGCA GCACCCGGAG ACTGTGGGCT CGGGGCCTCA GCTCTTCCAG 1320
ACCTTCACTG TGCACCGCAG CCCTGTCACC AAGATCATGC TGTCGGAGAA GCACCTCATC 1380
TCAGTCTGTG CCGACAACAA CCACGTGCGG ACATGGTCTG TGACTCGCTT CCGCGGCATG 1440
ATTTCCACCC AGCCCGGCTC CACCCCACTC GCTTCCTTTA AGATCCTGGC TCTGGAGTCG 1500
GCAGATGGGC ATGGCGGCTG CAGTGCTGGC AATGACATTG GCCCCTACGG TGAGCGGGAC 1560
GACCAGCAAG TGTTCATCCA GAAGGTGGTG CCCAGTGCCA GCCAGCTCTT CGTGCGTCTC 1620
TCATCTACTG GGCAGCGGGT GTGCTCCGTG CGCTCCGTGG ACGGCTCACC CACGACGGCC 1680
TTCACAGTGC TGGAGTGCGA GGGCTCCCGG CGGCTCGGCT CTCGGCCCCG GCGCTACCTG 1740
CTCACTGGCC AGGCCAACGG CAGCTTGGCC ATGTGGGACC TAACCACCGC CATGGACGGC 1800
CTCGGCCAGG CCCCTGCAGG TGGCCTGACG GAGCAAGAGC TGATGGAACA GCTGGAACAC 1860
TGTGAGCTGG CCCCGCCGGC TCCTTCAGCT CCCTCATGGG GCTGTCTCCC CAGCCCCTCA 1920
CCCCGCATCT CCCTCACCAG CCTCCACTCA GCCTCCAGCA ACACCTCCTT GTCTGGCCAC 1980
CGTGGGAGCC CAAGCCCCCC GCAGGCTGAG GCCCGGCGCC GTGGTGGGGG CAGCTTTGTG 2040
GAACGCTGCC AGGAACTGGT GCGGAGTGGG CCAGACCTCC GACGGCCACC CACACCAGCC 2100
CCGTGGCCCT CCAGCGGTCT CGGCACTCCC CTCACACCTC CCAAGATGAA GCTCAATGAA 2160
ACTTCCTTTT GAACAACGCA GCTGCCATGA TGCCTTGGGA TGCCCTGGTC CTGGGGGACT 2220
CAGGTGCCTC CCTGATTCCT GTGGGAACCC CGGGTTCAGG GCCAGGGCCT CCTTGGAATA 2280
AATGGTTATT GTTACTAGGT CCCCACCTTC CCTCTTTTCT GGAAGCCAAA GTCAGCCTCC 2340
CCAATAAAGT CCTCACTGCC AAAAAAAAAA AAAAAAAAA 2379
B:氨基酸序列(SEQ ID NO:5)长度:707
1 MAAAATAAEG VPSRGPPGEV IHLNVGGKRF STSRQTLTWI PDSFFSSLLS
51 GRISTLKDET GAIFIDRDPT VFAPILNFLR TKELDPRGVH GSSLLHEAQF
101 YGLTPLVRRL QLREELDRSS CGNVLFNGYL PPPVFPVKRR NRHSLVGPQQ
151 LGGRPAPVRR SNTMPPNLGN AGLLGRMLDE KTPPSPSGQP EEPGMVRLVC
201 GHHNWIAVAY TQFLVCYRLK EASGWQLVFS SPRLDWPIER LALTARVHGG
251 ALGEHDKMVA AATGSEILLW ALQAEGGGSE IGVFHLGVPV EALFFVGNQL
301 IATSHTGRIG VWNAVTKHWQ VQEVQPITSY DAAGSFLLLG CNNGSIYYVD
351 VQKFPLRMKD NDLLVSELYR DPAEDGVTAL SVYLTPKTSD SGNWIEIAYG
401 TSSGGVRVIV QHPETVGSGP QLFQTFTVHR SPVTKIMLSE KHLISVCADN
451 NHVRTWSVTR FRGMISTQPG STPLASFKIL ALESADGHGG CSAGNDIGPY
501 GERDDQQVFI QKVVPSASQL FVRLSSTGQR VCSVRSVDGS PTTAFTVLEC
551 EGSRRLGSRP RRYLLTGQAN GSLAMWDLTT AMDGLGQAPA GGLTEQELME
601 QLEHCELAPP APSAPSWGCL PSPSPRISLT SLHSASSNTS LSGHRGSPSP
651 PQAEARRRGG GSFVERCQEL VRSGPDLRRP PTPAPWPSSG LGTPLTPPKM
701 KLNETSF
克隆号:PP203(SEQ ID NO:6)
起始编码子:49 ATG 终止编码子:2172 TGA 蛋白质分子量:76339.52
1 GGT GCA CAC CCG GAA GTG GGT GCG GGC CAG CCG GCT CGC CCG GGG GCC 48
49 ATG GCA GCA GCG GCT ACT GCA GCC GAG GGG GTC CCC AGT CGG GGG CCT 96
1 Met Ala Ala Ala Ala Thr Ala Ala Glu Gly Val Pro Ser Arg Gly Pro 16
97 CCC GGG GAA GTC ATT CAT CTG AAT GTG GGA GGC AAG AGA TTC AGT ACC 144
17 Pro Gly Glu Val Ile His Leu Asn Val Gly GLy Lys Arg Phe Ser Thr 32
145 TCT CGC CAG ACT CTC ACC TGG ATC CCA GAC TCC TTC TTC TCC AGT CTT 192
33 Ser Arg Gln Thr Leu Thr Trp Ile Pro Asp Ser Phe Phe Ser Ser Leu 48
193 CTG AGC GGA CGC ATC TCG ACG CTG AAA GAT GAG ACC GGA GCA ATC TTC 240
49 Leu Ser Gly Arg Ile Ser Thr Leu Lys Asp Glu Thr Gly Ala Ile Phe 64
241 ATC GAC AGG GAC CCT ACA GTC TTC GCC CCC ATC CTC AAC TTC CTG CGC 288
65 Ile Asp Arg Asp Pro Thr Val Phe Ala Pro Ile Leu Asn Phe Leu Arg 80
289 ACC AAA GAG TTG GAT CCC AGG GGT GTC CAC GGT TCC AGC CTC CTC CAT 336
81 Thr Lys Glu Leu Asp Pro Arg Gly Val His Gly Ser Ser Leu Leu His 96
337 GAA GCC CAG TTC TAT GGG CTC ACT CCT CTG GTT CGT CGC CTG CAG CTT 384
97 Glu Ala Gln Phe Tyr Gly Leu Thr Pro Leu Val Arg Arg Leu Gln Leu 112
385 CGA GAG GAG TTG GAT CGA TCT TCT TGT GGA AAC GTC CTC TTC AAT GGT 432
113 Arg Glu Glu Leu Asp Arg Ser Ser Cys Gly Asn Val Leu Phe Asn Gly 128
433 TAC CTG CCG CCA CCA GTG TTC CCA GTG AAG CGG CGG AAC CGG CAC AGC 480
129 Tyr Leu Pro Pro Pro Val Phe Pro Val Lys Arg Arg Asn Arg His Ser 144
481 CTA GTG GGG CCT CAG CAG CTA GGA GGA CGG CCA GCC CCT GTC CGA CGG 528
145 Leu Val Gly Pro Gln Gln Leu Gly Gly Arg Pro Ala Pro Val Arg Arg 160
529 AGC AAC ACG ATG CCC CCC AAC CTT GGC AAT GCA GGG CTG CTG GGC CGA 576
161 Ser Asn Thr Met Pro Pro Asn Leu Gly Asn Ala Gly Leu Leu Gly Arg 176
577 ATG CTG GAT GAG AAA ACC CCT CCC TCA CCC TCA GGA CAA CCT GAG GAG 624
177 Met Leu Asp Glu Lys Thr Pro Pro Ser Pro Ser Gly Gln Pro Glu Glu 192
625 CCG GGG ATG GTG CGC CTG GTG TGT GGA CAC CAT AAT TGG ATC GCT GTG 672
193 Pro Gly Met Val Arg Leu Val Cys Gly His His Asn Trp Ile Al8 Val 208
673 GCC TAT ACC CAG TTT CTA GTC TGC TAC AGG TTG AAG GAA GCC TCT GGC 720
209 Ala Tyr Thr Gln Phe Leu Val Cys Tyr Arg Leu Lys Glu Ala Ser Gly 224
721 TGG CAG CTG GTG TTT TCC AGC CCC CGC CTG GAC TGG CCC ATC GAA CGA 768
225 Trp Gln Leu Val Phe Ser Ser Pro Arg Leu Asp Trp Pro Ile Glu Arg 240
769 CTG GCG CTC ACA GCC CGG GTG CAT GGT GGG GCT TTG GGT GAA CAT GAC 816
241 Leu Ala Leu Thr Ala Arg Val His Gly Gly Ala Leu Gly Glu His Asp 256
817 AAG ATG GTG GCA GCA GCC ACC GGC AGC GAG ATC CTG CTA TGG GCT CTG 864
257 Lys Met Val Ala Ala Ala Thr Gly Ser Glu Ile Leu Leu Trp Ala Leu 272
865 CAG GCG GAA GGC GGT GGC TCC GAG ATA GGG GTC TTT CAT CTG GGG GTG 912
273 Gln Ala Glu Gly Gly Gly Ser Glu Ile Gly Val Phe His Leu Gly Val 288
913 CCT GTG GAG GCC TTG TTC TTC GTC GGG AAC CAG CTC ATT GCT ACA AGC 960
289 Pro Val Glu Ala Leu Phe Phe Val Gly Asn Gln Leu Ile Ala Thr Ser 304
961 CAC ACA GGG CGC ATC GGG GTG TGG AAT GCC GTC ACC AAG CAC TGG CAG 1008
305 His Thr Gly Arg Ile Gly Val Trp Asn Ala Val Thr Lys His Trp Gln 320
1009 GTC CAG GAG GTG CAG CCC ATC ACC AGT TAT GAC GCG GCA GGC TCC TTC 1056
321 Val Gln Glu Val Gln Pro Ile Thr Ser Tyr Asp Ala Ala Gly Ser Phe 336
1057 CTC CTC CTG GGC TGC AAC AAC GGC TCC ATT TAC TAC GTG GAT GTG CAG 1104
337 Leu Leu Leu Gly Cys Asn Asn Gly Ser Ile Tyr Tyr Val Asp Val Gln 352
1105 AAG TTC CCC TTG CGC ATG AAA GAC AAC GAC CTC CTT GTC AGC GAG CTC 1152
353 Lys Phe Pro Leu Arg Met Lys Asp Asn Asp Leu Leu Val Ser Glu Leu 368
1153 TAT CGG GAC CCA GCG GAG GAT GGG GTC ACC GCC CTC AGT GTC TAC CTC 1200
369 Tyr Arg Asp Pro Ala Glu Asp Gly Val Thr Ala Leu Ser Val Tyr Leu 384
1201 ACC CCC AAG ACC AGT GAC AGT GGG AAC TGG ATC GAG ATC GCC TAT GGC 1248
385 Thr Pro Lys Thr Ser Asp Ser Gly Asn Trp Ile Glu Ile Ala Tyr Gly 400
1249 ACC AGC TCA GGG GGC GTG CGG GTC ATC GTG CAG CAC CCG GAG ACT GTG 1296
401 Thr Ser Ser Gly Gly Val Arg Val Ile Val Gln His Pro Glu Thr Val 416
1297 GGC TCG GGG CCT CAG CTC TTC CAG ACC TTC ACT GTG CAC CGC AGC CCT 1344
417 Gly Ser Gly Pro Gln Leu Phe Gln Thr Phe Thr Val His Arg Ser Pro 432
1345 GTC ACC AAG ATC ATG CTG TCG GAG AAG CAC CTC ATC TCA GTC TGT GCC 1392
433 Val Thr Lys Ile Met Leu Ser Glu Lys His Leu Ile Ser Val Cys Ala 448
1393 GAC AAC AAC CAC GTG CGG ACA TGG TCT GTG ACT CGC TTC CGC GGC ATG 1440
449 Asp Asn Asn His Val Arg Thr Trp Ser Val Thr Arg Phe Arg Gly Met 464
1441 ATT TCC ACC CAG CCC GGC TCC ACC CCA CTC GCT TCC TTT AAG ATC CTG 1488
465 Ile Ser Thr Gln Pro Gly Ser Thr Pro Leu Ala Ser Phe Lys Ile Leu 480
1489 GCT CTG GAG TCG GCA GAT GGG CAT GGC GGC TGC AGT GCT GGC AAT GAC 1536
481 Ala Leu Glu Ser Ala Asp Gly His Gly Gly Cys Ser Ala Gly Asn Asp 496
1537 ATT GGC CCC TAC GGT GAG CGG GAC GAC CAG CAA GTG TTC ATC CAG AAG 1584
497 Ile Gly Pro Tyr Gly Glu Arg Asp Asp Gln Gln Val Phe Ile Gln Lys 512
1585 GTG GTG CCC AGT GCC AGC CAG CTC TTC GTG CGT CTC TCA TCT ACT GGG 1632
513 Val Val Pro Ser Ala Ser Gln Leu Phe Val Arg Leu Ser Ser Thr Gly 528
1633 CAG CGG GTG TGC TCC GTG CGC TCC GTG GAC GGC TCA CCC ACG ACG GCC 1680
529 Gln Arg Val Cys Ser Val Arg Ser Val Asp Gly Ser Pro Thr Thr Ala 544
1681 TTC ACA GTG CTG GAG TGC GAG GGC TCC CGG CGG CTC GGC TCT CGG CCC 1728
545 Phe Thr Val Leu Glu Cys Glu Gly Ser Arg Arg Leu Gly Ser Arg Pro 560
1729 CGG CGC TAC CTG CTC ACT GGC CAG GCC AAC GGC AGC TTG GCC ATG TGG 1776
561 Arg Arg Tyr Leu Leu Thr Gly Gln Ala Asn Gly Ser Leu Ala Met Trp 576
1777 GAC CTA ACC ACC GCC ATG GAC GGC CTC GGC CAG GCC CCT GCA GGT GGC 1824
577 Asp Leu Thr Thr Ala Met Asp Gly Leu Gly Gln Ala Pro Ala Gly Gly 592
1825 CTG ACG GAG CAA GAG CTG ATG GAA CAG CTG GAA CAC TGT GAG CTG GCC 1872
593 Leu Thr Glu Gln Glu Leu Met Glu Gln Leu Glu His Cys Glu Leu Ala 608
1873 CCG CCG GCT CCT TCA GCT CCC TCA TGG GGC TGT CTC CCC AGC CCC TCA 1920
609 Pro Pro Ala Pro Ser Ala Pro Ser Trp Gly Cys Leu Pro Ser Pro Ser 624
1921 CCC CGC ATC TCC CTC ACC AGC CTC CAC TCA GCC TCC AGC AAC ACC TCC 1968
625 Pro Arg Ile Ser Leu Thr Ser Leu His Ser Ala Ser Ser Asn Thr Ser 640
1969 TTG TCT GGC CAC CGT GGG AGC CCA AGC CCC CCG CAG GCT GAG GCC CGG 2016
641 Leu Ser Gly His Arg Gly Ser Pro Ser Pro Pro Gln Ala Glu Ala Arg 656
2017 CGC CGT GGT GGG GGC AGC TTT GTG GAA CGC TGC CAG GAA CTG GTG CGG 2064
657 Arg Arg Gly Gly Gly Ser Phe Val Glu Arg Cys Gln Glu Leu Val Arg 672
2065 AGT GGG CCA GAC CTC CGA CGG CCA CCC ACA CCA GCC CCG TGG CCC TCC 2112
673 Ser Gly Pro Asp Leu Arg Arg Pro Pro Thr Pro Ala Pro Trp Pro Ser 688
2113 AGC GGT CTC GGC ACT CCC CTC ACA CCT CCC AAG ATG AAG CTC AAT GAA 2160
689 Ser Gly Leu Gly Thr Pro Leu Thr Pro Pro Lys Met Lys Leu Asn Glu 704
2161 ACT TCC TTT TGA ACA ACG CAG CTG CCA TGA TGC CTT GGG ATG CCC TGG 2208
705 Thr Ser Phe *** 708
2209 TCC TGG GGG ACT CAG GTG CCT CCC TGA TTC CTG TGG GAA CCC CGG GTT 2256
2257 CAG GGC CAG GGC CTC CTT GGA ATA AAT GGT TAT TGT TAC TAG GTC CCC 2304
2305 ACC TTC CCT CTT TTC TGG AAG CCA AAG TCA GCC TCC CCA ATA AAG TCC 2352
2353 TCA CTG CCA AAA AAA AAA AAA AAA AAA 2379
3. PP238
A:核苷酸序列(SEQ ID NO:7)长度:2023
GGGCTAGGGC CGGGGCCTGG CTGCGCGGCT GGGCCAAGGC CCGCGATGGT GATCTGCTGT 60
GCGGCCGTGA ACTGCTCCAA CCGGCAGGGA AAGGGCGAGA AGCGCGCCGT CTCCTTCCAC 120
AGGTTCCCCC TAAAGGACTC AAAACGTCTA ATCCAATGGT TAAAAGCTGT TCAGAGGGAT 180
AACTGGACTC CCACTAAGTA TTCATTTCTC TGTAGTGAGC ATTTCACCAA AGACAGCTTC 240
TCCAAGAGGC TGGAGGACCA GCATCGCCTG CTGAAGCCCA CGGCCGTGCC ATCCATCTTC 300
CACCTGACCG AGAAGAAGAG GGGGGCTGGA GGCCATGGCC GCACCCGGAG AAAAGATGCC 360
AGCAAGGCCA CAGGGGGTGT GAGGGGACAC TCGAGTGCCG CCACCGGCAG AGGAGCTGCA 420
GGTTGGTCAC CGTCCTCGAG TGGAAACCCG ATGGCCAAGC CAGAGTCCCG CAGGTTGAAG 480
CAAGCTGCTC TGCAAGGTGA AGCCACACCC AGGGCGGCCC AGGAGGCCGC CAGCCAGGAG 540
CAGGCCCAGC AAGCTCTGGA ACGGACTCCA GGAGATGGAC TGGCCACCAT GGTGGCAGGC 600
AGTCAGGGAA AAGCAGAAGC GTCTGCCACA GATGCTGGCG ATGAGAGCGC CACTTCCTCC 660
ATCGAAGGGG GCGTGACAGA TAAGAGTGGC ATTTCTATGG ATGACTTTAC GCCCCCAGGA 720
TCTGGGGCGT GCAAATTTAT CGGCTCACTT CATTCGTACA GTTTCTCCTC TAAGCACACC 780
CGAGAAAGGC CATCTGTCCC CCGAGAGCCC ATTGACCGCA AGAGGCTGAA GAAAGATGTG 840
GAACCAAGCT GCAGTGGGAG CAGCCTGGGA CCCGACAAGG GCCTGGCCCA GAGCCCTCCC 900
AGCTCATCAC TTACCGCGAC ACCGCAGAAG CCTTCCCAGA GCCCCTCTGC CCCTCCTGCC 960
GACGTCACCC CAAAGCCAGC CACGGAAGCC GTGCAGAGCG AGCACAGCGA CGCCAGCCCC 1020
ATGTCCATCA ACGAGGTCAT CCTGTCGGCG TCAGGGGCCT GCAAGCTCAT CGACTCACTG 1080
CACTCCTACT GCTTCTCCTC CCGGCAGAAC AAGAGCCAGG TGTGCTGCCT GCGGGAGCAG 1140
GTGGAGAAGA AGAACGGCGA GCTGAAGAGC CTGCGGCAGA GGGTCAGCCG CTCCGACAGC 1200
CAGGTGCGGA AGCTACAGGA GAAGCTGGAT GAGCTGAGGA GAGTGAGCGT CCCCTATCCA 1260
AGTAGCCTGC TGTCGCCCAG CCGCGAGCCC CCCAAGATGA ACCCAGTGGT GGAGCCACTG 1320
TCCTGGATGC TGGGCACCTG GCTGTCGGAC CCACCTGGAG CCGGGACCTA CCCCACACTG 1380
CAGCCCTTCC AGTACCTGGA GGAGGTTCAC ATCTCCCACG TGGGCCAGCC CATGCTGAAC 1440
TTCTCGTTCA ACTCCTTCCA CCCGGACACG CGCAAGCCGA TGCACAGAGA GTGTGGCTTC 1500
ATTCGCCTCA AGCCCGACAC CAACAAGGTG GCCTTTGTCA GCGCCCAGAA CACAGGCGTG 1560
GTGGAAGTGG AGGAGGGCGA GGTGAACGGG CAGGAGCTGT GCATCGCATC CCACTCCATC 1620
GCCAGGATCT CCTTCGCCAA GGAGCCCCAC GTAGAGCAGA TCACCCGGAA GTTCAGGCTG 1680
AATTCTGAAG GCAAACTTGA GCAGACGGTC TCCATGGCAA CCACGACACA GCCAATGACT 1740
CAGCATCTTC ACGTCACCTA CAAGAAGGTG ACCCCGTAAA CCTAGAGCTT CTGGAGCCCT 1800
CGGGAGGGCC TGGCTACTGT GCCTCAACGG TTCGGCTCCT CAACAGACAG TCCCTGCGGC 1860
AAAAGTGGGT GTGGCCGTGA GCCTCTGCAG GCTCAAGAGT GTTGTCCAGA TGTTTCTGTA 1920
CTGGCATAGA AAAACCAAAT AAAAGGCCTT TATTTTTATG GCTGAGGATT TTGAATATTA 1980
AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAA 2023
B:氨基酸序列(SEQ ID NO:8)长度:577
1 MVICCAAVNC SNRQGKGEKR AVSFHRFPLK DSKRLIQWLK AVQRDNWTPT
51 KYSFLCSEHF TKDSFSKRLE DQHRLLKPTA VPSIFHLTEK KRGAGGHGRT
101 RRKDASKATG GVRGHSSAAT GRGAAGWSPS SSGNPMAKPE SRRLKQAALQ
151 GEATPRAAQE AASQEQAQQA LERTPGDGLA TMVAGSQGKA EASATDAGDE
201 SATSSIEGGV TDKSGISMDD FTPPGSGACK FIGSLHSYSF SSKHTRERPS
251 VPREPIDRKR LKKDVEPSCS GSSLGPDKGL AQSPPSSSLT ATPQKPSQSP
301 SAPPADVTPK PATEAVQSEH SDASPMSINE VILSASGACK LIDSLHSYCF
351 SSRQNKSQVC CLREQVEKKN GELKSLRQRV SRSDSQVRKL QEKLDELRRV
401 SVPYPSSLLS PSREPPKMNP VVEPLSWMLG TWLSDPPGAG TYPTLQPFQY
451 LEEVHISHVG QPMLNFSFNS FHPDTRKPMH RECGFIRLKP DTNKVAFVSA
501 QNTGVVEVEE GEVNGQELCI ASHSIARISF AKEPHVEQIT RKFRLNSEGK
551 LEQTVSMATT TQPMTQHLHV TYKKVTP
克隆号:PP238(SEQ ID NO:9)
起始编码子:46 ATG 终止编码子:1779 TAA蛋白质分子量:62856.51
1 GGG CTA GGG CCG GGG CCT GGC TGC GCG GCT GGG CCA AGG CCC GCG ATG 48
1 Met 1
49 GTG ATC TGC TGT GCG GCC GTG AAC TGC TCC AAC CGG CAG GGA AAG GGC 96
2 Val Ile Cys Cys Ala Ala Val Asn Cys Ser Asn Arg Gln Gly Lys Gly 17
97 GAG AAG CGC GCC GTC TCC TTC CAC AGG TTC CCC CTA AAG GAC TCA AAA 144
18 Glu Lys Arg Ala Val Ser Phe His Arg Phe Pro Leu Lys Asp Ser Lys 33
145 CGT CTA ATC CAA TGG TTA AAA GCT GTT CAG AGG GAT AAC TGG ACT CCC 192
34 Arg Leu Ile Gln Trp Leu Lys Ala Val Gln Arg Asp Asn Trp Thr Pro 49
193 ACT AAG TAT TCA TTT CTC TGT AGT GAG CAT TTC ACC AAA GAC AGC TTC 240
50 Thr Lys Tyr Ser Phe Leu Cys Ser Glu His Phe Thr Lys Asp Ser Phe 65
241 TCC AAG AGG CTG GAG GAC CAG CAT CGC CTG CTG AAG CCC ACG GCC GTG 288
66 Ser Lys Arg Leu Glu Asp Gln His Arg Leu Leu Lys Pro Thr Ala Val 81
289 CCA TCC ATC TTC CAC CTG ACC GAG AAG AAG AGG GGG GCT GGA GGC CAT 336
82 Pro Ser Ile Phe His Leu Thr Glu Lys Lys Arg Gly Ala Gly Gly His 97
337 GGC CGC ACC CGG AGA AAA GAT GCC AGC AAG GCC ACA GGG GGT GTG AGG 384
98 Gly Arg Thr Arg Arg Lys Asp Ala Ser Lys Ala Thr Gly Gly Val Arg 113
385 GGA CAC TCG AGT GCC GCC ACC GGC AGA GGA GCT GCA GGT TGG TCA CCG 432
114 Gly His Ser Ser Ala Ala Thr Gly Arg Gly Ala Ala Gly Trp Ser Pro 129
433 TCC TCG AGT GGA AAC CCG ATG GCC AAG CCA GAG TCC CGC AGG TTG AAG 480
130 Ser Ser Ser Gly Asn Pro Met Ala Lys Pro Glu Ser Arg Arg Leu Lys 145
481 CAA GCT GCT CTG CAA GGT GAA GCC ACA CCC AGG GCG GCC CAG GAG GCC 528
146 Gln Ala Ala Leu Gln Gly Glu Ala Thr Pro Arg Ala Ala Gln Glu Ala 161
529 GCC AGC CAG GAG CAG GCC CAG CAA GCT CTG GAA CGG ACT CCA GGA GAT 576
162 Ala Ser Gln Glu Gln Ala Gln Gln Ala Leu Glu Arg Thr Pro Gly Asp 177
577 GGA CTG GCC ACC ATG GTG GCA GGC AGT CAG GGA AAA GCA GAA GCG TCT 624
178 Gly Leu Ala Thr Met Val Ala Gly Ser Gln Gly Lys Ala Glu Ala Ser 193
625 GCC ACA GAT GCT GGC GAT GAG AGC GCC ACT TCC TCC ATC GAA GGG GGC 672
194 Ala Thr Asp Ala Gly Asp Glu Ser Ala Thr Ser Ser Ile Glu Gly Gly 209
673 GTG ACA GAT AAG AGT GGC ATT TCT ATG GAT GAC TTT ACG CCC CCA GGA 720
210 Val Thr Asp Lys Ser Gly Ile Ser Met Asp Asp Phe Thr Pro Pro Gly 225
721 TCT GGG GCG TGC AAA TTT ATC GGC TCA CTT CAT TCG TAC AGT TTC TCC 768
226 Ser Gly Ala Cys Lys Phe Ile Gly Ser Leu His Ser Tyr Ser Phe Ser 241
769 TCT AAG CAC ACC CGA GAA AGG CCA TCT GTC CCC CGA GAG CCC ATT GAC 816
242 Ser Lys His Thr Arg Glu Arg Pro Ser Val Pro Arg Glu Pro Ile Asp 257
817 CGC AAG AGG CTG AAG AAA GAT GTG GAA CCA AGC TGC AGT GGG AGC AGC 864
258 Arg Lys Arg Leu Lys Lys Asp Val Glu Pro Ser Cys Ser Gly Ser Ser 273
865 CTG GGA CCC GAC AAG GGC CTG GCC CAG AGC CCT CCC AGC TCA TCA CTT 912
274 Leu Gly Pro Asp Lys Gly Leu Ala Gln Ser Pro Pro Ser Ser Ser Leu 289
913 ACC GCG ACA CCG CAG AAG CCT TCC CAG AGC CCC TCT GCC CCT CCT GCC 960
290 Thr Ala Thr Pro Gln Lys Pro Ser Gln Ser Pro Ser Ala Pro Pro Ala 305
961 GAC GTC ACC CCA AAG CCA GCC ACG GAA GCC GTG CAG AGC GAG CAC AGC 1008
306 Asp Val Thr Pro Lys Pro Ala Thr Glu Ala Val Gln Ser Glu His Ser 321
1009 GAC GCC AGC CCC ATG TCC ATC AAC GAG GTC ATC CTG TCG GCG TCA GGG 1056
322 Asp Ala Ser Pro Met Ser Ile Asn Glu Val Ile Leu Ser Ala Ser Gly 337
1057 GCC TGC AAG CTC ATC GAC TCA CTG CAC TCC TAC TGC TTC TCC TCC CGG 1104
338 Ala Cys Lys Leu Ile Asp Ser Leu His Ser Tyr Cys Phe Ser Ser Arg 353
1105 CAG AAC AAG AGC CAG GTG TGC TGC CTG CGG GAG CAG GTG GAG AAG AAG 1152
354 Gln Asn Lys Ser Gln Val Cys Cys Leu Arg Glu Gln Val Glu Lys Lys 369
1153 AAC GGC GAG CTG AAG AGC CTG CGG CAG AGG GTC AGC CGC TCC GAC AGC 1200
370 Asn Gly Glu Leu Lys Ser Leu Arg Gln Arg Val Ser Arg Ser Asp Ser 385
1201 CAG GTG CGG AAG CTA CAG GAG AAG CTG GAT GAG CTG AGG AGA GTG AGC 1248
386 Gln Val Arg Lys Leu Gln Glu Lys Leu Asp Glu Leu Arg Arg Val Ser 401
1249 GTC CCC TAT CCA AGT AGC CTG CTG TCG CCC AGC CGC GAG CCC CCC AAG 1296
402 Val Pro Tyr Pro Ser Ser Leu Leu Ser Pro Ser Arg Glu Pro Pro Lys 417
1297 ATG AAC CCA GTG GTG GAG CCA CTG TCC TGG ATG CTG GGC ACC TGG CTG 1344
418 Met Asn Pro Val Val Glu Pro Leu Ser Trp Met Leu Gly Thr Trp Leu 433
1345 TCG GAC CCA CCT GGA GCC GGG ACC TAC CCC ACA CTG CAG CCC TTC CAG 1392
434 Ser Asp Pro Pro Gly Ala Gly Thr Tyr Pro Thr Leu Gln Pro Phe Gln 449
1393 TAC CTG GAG GAG GTT CAC ATC TCC CAC GTG GGC CAG CCC ATG CTG AAC 1440
450 Tyr Leu Glu Glu Val His Ile Ser His Val Gly Gln Pro Met Leu Asn 465
1441 TTC TCG TTC AAC TCC TTC CAC CCG GAC ACG CGC AAG CCG ATG CAC AGA 1488
466 Phe Ser Phe Asn Ser Phe His Pro Asp Thr Arg Lys Pro Met His Arg 481
1489 GAG TGT GGC TTC ATT CGC CTC AAG CCC GAC ACC AAC AAG GTG GCC TTT 1536
482 Glu Cys Gly Phe Ile Arg Leu Lys Pro Asp Thr Asn Lys Val Ala Phe 497
1537 GTC AGC GCC CAG AAC ACA GGC GTG GTG GAA GTG GAG GAG GGC GAG GTG 1584
498 Val Ser Ala Gln Asn Thr Gly Val Val Glu Val Glu Glu Gly Glu Val 513
1585 AAC GGG CAG GAG CTG TGC ATC GCA TCC CAC TCC ATC GCC AGG ATC TCC 1632
514 Asn Gly Gln Glu Leu Cys Ile Ala Ser His Ser Ile Ala Arg Ile Ser 529
1633 TTC GCC AAG GAG CCC CAC GTA GAG CAG ATC ACC CGG AAG TTC AGG CTG 1680
530 Phe Ala Lys Glu Pro His Val Glu Gln Ile Thr Arg Lys Phe Arg Leu 545
1681 AAT TCT GAA GGC AAA CTT GAG CAG ACG GTC TCC ATG GCA ACC ACG ACA 1728
546 Asn Ser Glu Gly Lys Leu Glu Gln Thr Val Ser Met Ala Thr Thr Thr 561
1729 CAG CCA ATG ACT CAG CAT CTT CAC GTC ACC TAC AAG AAG GTG ACC CCG 1776
562 Gln Pro Met Thr Gln His Leu His Val Thr Tyr Lys Lys Val Thr Pro 577
1777 TAA ACC TAG AGC TTC TGG AGC CCT CGG GAG GGC CTG GCT ACT GTG CCT 1824
578 *** 578
1825 CAA CGG TTC GGC TCC TCA ACA GAC AGT CCC TGC GGC AAA AGT GGG TGT 1872
1873 GGC CGT GAG CCT CTG CAG GCT CAA GAG TGT TGT CCA GAT GTT TCT GTA 1920
1921 CTG GCA TAG AAA AAC CAA ATA AAA GGC CTT TAT TTT TAT GGC TGA GGA 1968
1969 TTT TGA ATA TTA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 2016
2017 AAA AAA A 2023
4. PP856
A:核苷酸序列(SEQ ID NO:10)长度:2364
GGAACACGTG CTTTCTGGGC AGGTCGCCCC TCAGTCTCCA CTAGAGACAG GACTGACCAG 60
TTGCTCTTCC TTCCAAGAAC CTTCGAGATC TGCGGTCTGG GGTCTGGTTG AAAGATGGCG 120
GCCCTCACTA CCCTGTTTAA GTACATAGAT GAAAATCAGG ATCGCTACAT TAAGAAACTC 180
GCAAAATGGG TGGCTATCCA GAGTGTGTCT GCGTGGCCGG AGAAGAGAGG CGAAATCAGG 240
AGGATGATGG AAGTTGCTGC TGCAGATGTT AAGCAGTTGG GGGGCTCTGT GGAACTGGTG 300
GATATCGGAA AACAAAAGGA GATTCCTGTC AACGTCCGAT TCTGCCTCGA AGGCATGGAG 360
GAGTCAGGCT CTGAGGGCCT AGACGAGCTG ATTTTTGCCC GGAAAGACAC ATTCTTTAAG 420
GATGTGGACT ATGTCTGCAT TTCTGACAAT TACTGGCTGG GAAAGAAGAA GCCCTGCATC 480
ACCTACGGCC TCAGGGGCAT TTGCTACTTT TTCATCGAGG TGGAGTGCAG CAACAAAGAC 540
CTCCATTCTG GCGTGTACGG GGGCTCGGTG CATGAGGCCA TGACTGATCT CATTTTGCTG 600
ATGGGCTCTT TGGTGGACAA GAGGGGGAAC ATCCTGATCC CCGGCATTAA CGAGGCCGTG 660
GCCGCCGTCA CGGAAGAGGA GCACAAGCTG TACGACGACA TCGACTTTGA CATAGAGGAG 720
TTTGCCAAGG ATGTGGGGGC GCAGATCCTC CTGCACAGCC ACAAGAAAGA CATCCTCATG 780
CACCGATGGC GGTACCCGTC TCTGTCCCTC CATGGCATCG AAGGCGCCTT CTCTGGGTCT 840
GGGGCCAAGA CCGTGATTCC CAGGAAGGTG GTTGGCAAGT TCTCCATCAG GCTCGTGCCG 900
AACATGACTC CTGAAGTCGT CGGCGAGCAG GTCACAAGCT ACCTAACTAA GAAGTTTGCT 960
GAACTACGCA GCCCCAATGA GTTCAAGGTG TACATGGGCC ACGGTGGGAA GCCCTGGGTC 1020
TCCGACTTCA GTCACCCTCA TTACCTGGCT GGGAGAAGAG CCATGAAGAC AGTTTTTGGT 1080
GTTGAGCCAG ACTTGACCAG GGAAGGCGGC AGTATTCCCG TGACCTTGAC CTTTCAGGAG 1140
GCCACGGGCA AGAACGTCAT GCTGCTGCCT GTGGGGTCAG CGGATGACGG AGCCCACTCC 1200
CAGAATGAAA AGCTCAACAG GTATAACTAC ATAGAGGGAA CCAAGATGCT GGCCGCGTAC 1260
CTGTATGAGG TCTCCCAGCT GAAGGACTAG GCCAAGCCCT CTGTGTGCCA TCTCCAATGA 1320
GAAGGAATCC TGCCCTCACC TCACCCTTTT CCAACTTGCC CAGGGAAGTG GAGGTTCCCT 1380
CTTTCCTTTC CCTCTTGTCA GGTCATCCAT GACTTTAGAG AACAGACACA AGTGTATCCA 1440
GCTGTCCACG GGTGGAGCTA CCCGTTGGGC TTATGAGTGA CCTGGAGTGA CAGCTGAGTC 1500
ACCCTGGGTA AGTTCTCAGA GTGGTCAGGA TGGCTTGACC TGCAGAAGAT ACCCAAGGTC 1560
CAAAAGCACA AGGTCTGCGG AAAGTTCTGG TTGTCGGCTG GGCACCACGG CTCACACCTA 1620
TAATCGAGCA CTTTGGGAGG CCAAGACAGG AGGATCACTT GAGGCCAGGA GTCTGAGACA 1680
AGCCTAGGCA ACAAAACAAG ACTCTGTCTC TACAAAAAGT TTAAGAAATG AGCCAGACAT 1740
GGTGGTGTAT GCCTGTAGTC CCAGCCACTC AGAAGGCTGA GGCAGGAGGA TCGCTTGAGA 1800
CCAAGAGTTT GAGCCTGCGG TGAGCTGTGA ATGCACCACG GCACTCAAGC CTGGGCAATG 1860
TAGCAAGATC CTGTCTCTAC AAGAAATTTT TTAAAAATGA GCCAAGTGTG GTGGTGCATG 1920
CCTGTAGTTC CAGCTACTCA GGACACTGAC GTAGGAGGGT TGCTTGAGAC TGAGAGTTGG 1980
AGGCTGCGAT GAGCCATGAA TGCCCCACTG CACTCCAGCC TGGGCGACAG AACGAGACCC 2040
CATCTCAAAA AAAATAAGTT CTGGTTGTCA TTGAATTGGG ATAAACAGAG AGCTTGATGC 2100
TTTCTGCCTT CTGTCTCAGG TGATGCATTG CACATTTGGG ATATTTGGAA AGGAAATGAG 2160
GAAAGAAATT AGGGCCTCCT CTGATCTCTC GCTATCTGCG GGTCCTGTCC TTTTCTCAAG 2220
ACCTTCACCA TTACTGGTGT TTTCCTGTCT TCTCTTTAGT ATGATCCCTC AAAACCTCAC 2280
TAACTGGAAG GATGATTTTG TCTCAGTTTG TACTCCTAAA TAAAAAGTAA ACATGACACC 2340
TCTAAAAAAA AAAAAAAAAA AAAA 2364
B:氨基酸序列(SEQ ID NO:11)长度:391
1 MAALTTLFKY IDENQDRYIK KLAKWVAIQS VSAWPEKRGE IRRMMEVAAA
51 DVKQLGGSVE LVDIGKQKEI PVNVRFCLEG MEESGSEGLD ELIFARKDTF
101 FKDVDYVCIS DNYWLGKKKP CITYGLRGIC YFFIEVECSN KDLHSGVYGG
151 SVHEAMTDLI LLMGSLVDKR GNILIPGINE AVAAVTEEEH KLYDDIDFDI
201 EEFAKDVGAQ ILLHSHKKDI LMHRWRYPSL SLHGIEGAFS GSGAKTVIPR
251 KVVGKFSIRL VPNMTPEVVG EQVTSYLTKK FAELRSPNEF KVYMGHGGKP
301 WVSDFSHPHY LAGRRAMKTV FGVEPDLTRE GGSIPVTLTF QEATGKNVML
351 LPVGSADDGA HSQNEKLNRY NYIEGTKMLA AYLYEVSQLK D
克隆号:PP856(SEQ ID NO:12)
起始编码子:115 ATG 终止编码子:1290 TAG 蛋白质分子量:43831.06
1 GGA ACA CGT GCT TTC TGG GCA GGT CGC CCC TCA GTC TCC ACT AGA GAC 48
49 AGG ACT GAC CAG TTG CTC TTC CTT CCA AGA ACC TTC GAG ATC TGC GGT 96
97 CTG GGG TCT GGT TGA AAG ATG GCG GCC CTC ACT ACC CTG TTT AAG TAC 144
1 Met Ala Ala Leu Thr Thr Leu Phe Lys Tyr 10
145 ATA GAT GAA AAT CAG GAT CGC TAC ATT AAG AAA CTC GCA AAA TGG GTG 192
11 Ile Asp Glu Asn Gln Asp Arg Tyr Ile Lys Lys Leu Ala Lys Trp Val 26
193 GCT ATC CAG AGT GTG TCT GCG TGG CCG GAG AAG AGA GGC GAA ATC AGG 240
27 Ala Ile Gln Ser Val Ser Ala Trp Pro Glu Lys Arg Gly Glu Ile Arg 42
241 AGG ATG ATG GAA GTT GCT GCT GCA GAT GTT AAG CAG TTG GGG GGC TCT 288
43 Arg Met Met Glu Val Ala Ala Ala Asp Val Lys Gln Leu Gly Gly Ser 58
289 GTG GAA CTG GTG GAT ATC GGA AAA CAA AAG GAG ATT CCT GTC AAC GTC 336
59 Val Glu Leu Val Asp Ile Gly Lys Gln Lys Glu Ile Pro Val Asn Val 74
337 CGA TTC TGC CTC GAA GGC ATG GAG GAG TCA GGC TCT GAG GGC CTA GAC 384
75 Arg Phe Cys Leu Glu Gly Met Glu Glu Ser Gly Ser Glu Gly Leu Asp 90
385 GAG CTG ATT TTT GCC CGG AAA GAC ACA TTC TTT AAG GAT GTG GAC TAT 432
91 Glu Leu Ile Phe Ala Arg Lys Asp Thr Phe Phe Lys Asp Val Asp Tyr 106
433 GTC TGC ATT TCT GAC AAT TAC TGG CTG GGA AAG AAG AAG CCC TGC ATC 480
107 Val Cys Ile Ser Asp Asn Tyr Trp Leu Gly Lys Lys Lys Pro Cys Ile 122
481 ACC TAC GGC CTC AGG GGC ATT TGC TAC TTT TTC ATC GAG GTG GAG TGC 528
123 Thr Tyr Gly Leu Arg Gly Ile Cys Tyr Phe Phe Ile Glu Val Glu Cys 138
529 AGC AAC AAA GAC CTC CAT TCT GGG GTG TAC GGG GGC TCG GTG CAT GAG 576
139 Ser Asn Lys Asp Leu His Ser Gly Val Tyr Gly Gly Ser Val His Glu 154
577 GCC ATG ACT GAT CTC ATT TTG CTG ATG GGC TCT TTG GTG GAC AAG AGG 624
155 Ala Met Thr Asp Leu Ile Leu Leu Met Gly Ser Leu Val Asp Lys Arg 170
625 GGG AAC ATC CTG ATC CCC GGC ATT AAC GAG GCC GTG GCC GCC GTC ACG 672
171 Gly Asn Ile Leu Ile Pro Gly Ile Asn Glu Ala Val Ala Ala Val Thr 186
673 GAA GAG GAG CAC AAG CTG TAC GAC GAC ATC GAC TTT GAC ATA GAG GAG 720
187 Glu Glu Glu His Lys Leu Tyr Asp Asp Ile Asp Phe Asp Ile Glu Glu 202
721 TTT GCC AAG GAT GTG GGG GCG CAG ATC CTC CTG CAC AGC CAC AAG AAA 768
203 Phe Ala Lys Asp Val Gly Ala Gln Ile Leu Leu His Ser His Lys Lys 218
769 GAC ATC CTC ATG CAC CGA TGG CGG TAC CCG TCT CTG TCC CTC CAT GGC 816
219 Asp Ile Leu Met His Arg Trp Arg Tyr Pro Ser Leu Ser Leu His Gly 234
817 ATC GAA GGC GCC TTC TCT GGG TCT GGG GCC AAG ACC GTG ATT CCC AGG 864
235 Ile Glu Gly Ala Phe Ser Gly Ser Gly Ala Lys Thr Val Ile Pro Arg 250
865 AAG GTG GTT GGC AAG TTC TCC ATC AGG CTC GTG CCG AAC ATG ACT CCT 912
251 Lys Val Val Gly Lys Phe Ser Ile Arg Leu Val Pro Asn Met Thr Pro 266
913 GAA GTC GTC GGC GAG CAG GTC ACA AGC TAC CTA ACT AAG AAG TTT GCT 960
267 Glu Val Val Gly Glu Gln Val Thr Ser Tyr Leu Thr Lys Lys Phe Ala 282
961 GAA CTA CGC AGC CCC AAT GAG TTC AAG GTG TAC ATG GGC CAC GGT GGG 1008
283 Glu Leu Arg Ser Pro Asn Glu Phe Lys Val Tyr Met Gly His Gly Gly 298
1009 AAG CCC TGG GTC TCC GAC TTC AGT CAC CCT CAT TAC CTG GCT GGG AGA 1056
299 Lys Pro Trp Val Ser Asp Phe Ser His Pro His Tyr Leu Ala Gly Arg 314
1057 AGA GCC ATG AAG ACA GTT TTT GGT GTT GAG CCA GAC TTG ACC AGG GAA 1104
315 Arg Ala Met Lys Thr Val Phe Gly Val Glu Pro Asp Leu Thr Arg Glu 330
1105 GGC GGC AGT ATT CCC GTG ACC TTG ACC TTT CAG GAG GCC ACG GGC AAG 1152
331 Gly Gly Ser Ile Pro Val Thr Leu Thr Phe Gln Glu Ala Thr Gly Lys 346
1153 AAC GTC ATG CTG CTG CCT GTG GGG TCA GCG GAT GAC GGA GCC CAC TCC 1200
347 Asn Val Met Leu Leu Pro Val Gly Ser Ala Asp Asp Gly Ala His Ser 362
1201 CAG AAT GAA AAG CTC AAC AGG TAT AAC TAC ATA GAG GGA ACC AAG ATG 1248
363 Gln Asn Glu Lys Leu Asn Arg Tyr Asn Tyr Ile Glu Gly Thr Lys Met 378
1249 CTG GCC GCG TAC CTG TAT GAG GTC TCC CAG CTG AAG GAC TAG GCC AAG 1296
379 Leu Ala Ala Tyr Leu Tyr Glu Val Ser Gln Leu Lys Asp *** 392
1297 CCC TCT GTG TGC CAT CTC CAA TGA GAA GGA ATC CTG CCC TCA CCT CAC 1344
1345 CCT TTT CCA ACT TGC CCA GGG AAG TGG AGG TTC CCT CTT TCC TTT CCC 1392
1393 TCT TGT CAG GTC ATC CAT GAC TTT AGA GAA CAG ACA CAA GTG TAT CCA 1440
144l GCT GTC CAC GGG TGG AGC TAC CCG TTG GGC TTA TGA GTG ACC TGG AGT 1488
1489 GAC AGC TGA GTC ACC CTG GGT AAG TTC TCA GAG TGG TCA GGA TGG CTT 1536
1537 GAC CTG CAG AAG ATA CCC AAG GTC CAA AAG CAC AAG GTC TGC GGA AAG 1584
1585 TTC TGG TTG TCG GCT GGG CAC CAC GGC TCA CAC CTA TAA TCG AGC ACT 1632
1633 TTG GGA GGC CAA GAC AGG AGG ATC ACT TGA GGC CAG GAG TCT GAG ACA 1680
1681 AGC CTA GGC AAC AAA ACA AGA CTC TGT CTC TAC AAA AAG TTT AAG AAA 1728
1729 TGA GCC AGA CAT GGT GGT GTA TGC CTG TAG TCC CAG CCA CTC AGA AGG 1776
1777 CTG AGG CAG GAG GAT CGC TTG AGA CCA AGA GTT TGA GCC TGC GGT GAG 1824
1825 CTG TGA ATG CAC CAC GGC ACT CAA GCC TGG GCA ATG TAG CAA GAT CCT 1872
1873 GTC TCT ACA AGA AAT TTT TTA AAA ATG AGC CAA GTG TGG TGG TGC ATG 1920
1921 CCT GTA GTT CCA GCT ACT CAG GAC ACT GAC GTA GGA GGG TTG CTT GAG 1968
1969 ACT GAG AGT TGG AGG CTG CGA TGA GCC ATG AAT GCC CCA CTG CAC TCC 2016
2017 AGC CTG GGC GAC AGA ACG AGA CCC CAT CTC AAA AAA AAT AAG TTC TGG 2064
2065 TTG TCA TTG AAT TGG GAT AAA CAG AGA GCT TGA TGC TTT CTG CCT TCT 2112
2113 GTC TCA GGT GAT GCA TTG CAC ATT TGG GAT ATT TGG AAA GGA AAT GAG 2160
2161 GAA AGA AAT TAG GGC CTC CTC TGA TCT CTC GCT ATC TGC GGG TCC TGT 2208
2209 CCT TTT CTC AAG ACC TTC ACC ATT ACT GGT GTT TTC CTG TCT TCT CTT 2256
2257 TAG TAT GAT CCC TCA AAA CCT CAC TAA CTG GAA GGA TGA TTT TGT CTC 2304
2305 AGT TTG TAC TCC TAA ATA AAA AGT AAA CAT GAC ACC TCT AAA AAA AAA 2352
2353 AAA AAA AAA AAA 2364
5. PP1065
A:核苷酸序列(SEQ ID NO:13)长度:1910
GGGAAGTAGA AGACAGCGGC GTTGCCATGG CGGCGTCTCT GGGGCAGGTG TTGGCTCTGG 60
TGCTGGTGGC CGCTCTGTGG GGTGGCACGC AGCCGCTGCT GAAGCGGGCC TCCGCCGGCC 120
TGCAGCGGGT TCATGAGCCG ACCTGGGCCC AGCAGTTGCT ACAGGAGATG AAGACCCTCT 180
TCTTGAATAC TGAGTACCTG ATGCCCTTTC TCCTCAACCA GTGTGGATCC CTTCTCTATT 240
ACCTCACCTT GGCATCGACA GATCTGACCC TGGCTGTGCC CATCTGTAAC TCTCTGGCTA 300
TCATCTTCAC ACTGATTGTT GGGAAGGCCC TTGGAGAAGA TATTGGTGGA AAACGAGCAG 360
TTGCTGGCAT GGTGCTCACC GTGATAGGAA TTTCACTCTG CATCACAAGC TCAGTTCCAT 420
GGACTGCAGA ACTCCAGCTG CATGGAAAGG GCCAGCTGCA GACTTTGAGC CAGAAATGCA 480
AACGGGAGGC CTCTGGGACT CAGTCAGAGC GCTTTGGCTG AATGAGGGGT GGAACCGAGG 540
GAAGAAGGTA GAGAGCTGTG AGCCCCAGCC CCACCTGACT CCAGCACACC TGGCGAGTAG 600
TAGCTGTCAA TAAATCTATG GTAAACAGAC AAGAGGAGGT GGAAGGCCAT ACAGAATGGA 660
GCCGTGAGTA TGGCCAGCCT CCAGCTCTCA GCCAGGAGGT CCCCAACCCC AAGGAAGGAA 720
GAAACTGGAA ATTAGGAACT GCTTCCTCAT TTAACAAGGT AGGAAGTTAG GAGATCATTT 780
ACTTTCAATC ACAAGGGAGG AGAACTGTTC CTGGGGCCCA AGGCTGCCAG TTTCCAGCTC 840
AGAGCTCCTC CCACCCCAAC ATACTGTTTC CTGATCCAAC AGCTTACCTG ATCCAAGGGC 900
TCCTCTGTCT GAGTGTCTTC ATCATCTGCT ACTTCCAGGG CCCCCGCTGT CTCCTTCCTT 960
CGGTGGGGAG CTCCATATAC TCCTATAACT CCTAAAGAGG GGAGGCAGCA CTGGGTGATG 1020
CCCAGGCTGA AGAGCCCTCA GCATTCCTGC CCTGGACCTT CATGCTAGCC CCTTTCCCTC 1080
CCCTGAACCT GGTTCTGCAT TCCCCACCAC CTCCCAGGAT GGCAAGGAAG TGAGAGGTGG 1140
GCCTTTGGTC CCACCCCCAT CCCCTCTATA TCCCACCCCT GAAGTCTTAT CGCTTTAAGC 1200
ACTGCCCTTT CCAGGTGCTT CTTTTCATGT GATGAGGCCC TGTGAAGAAG GGACAGGATA 1260
TACAGACGGG GGCAGCTGGA GACAGTTATG ATGAGTGCCG GCTTTGTGTC TGAGCATTCT 1320
GCTCCCATGG ACATCCCCAA CAACAGCAGG GACCAACCTA TGTCACTGTC AAAGGGCAGC 1380
TGAGAAGGGC CTGAGCCCCA GGGACCCCTC ACCTGATGGG AATGAGAGTG TGGGGAGCTT 1440
GCTTCTTGGC TGAATGGTCT GCTGGGGTCT GGCATAGAAA GCAGATGGCT TAATTCGGTC 1500
TGGTTCCTTT GGAGAGGGCT GGGTTACCTG GGCCCTGTGG CCTTGGGCCT AGAGAAGGGA 1560
CACTGGGCTT GGACCCTGAT TGCTGGCCAT TCTTACCTTT CCTACTCCCC AGTTCAGGCT 1620
TCAGAGACCC CCTGACGCCT GCAGGAACAT GGCAGAGGAG ACACCGTCTG TCTTCACAAA 1680
GTACGTCCTC CCTCCTTGCT GCCTCTTCCC ACCAGCCTGA CTTATCCAGG GACAGAGCAG 1740
TAGATGCCTG GCACTCCTCG ATGCCCAGTG AAACCAGACT GTGCTTCCCC ACCCCCACCA 1800
CCATGCCCCA TGCTCACTGG CTCATTTCTT GGGAGGGCTT AGAGCTGGAT AATATAAGTT 1860
CCCTTGGGAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 1910
B:氨基酸序列(SEQ ID NO:14)长度:164
1 MAASLGQVLA LVLVAALWGG TQPLLKRASA GLQRVHEPTW AQQLLQEMKT
51 LFLNTEYLMP FLLNQCGSLL YYLTLASTDL TLAVPICNSL AIIFTLIVGK
101 ALGEDIGGKR AVAGMVLTVI GISLCITSSV PWTAELQLHG KGQLQTLSQK
151 CKREASGTQS ERFG
克隆号:PP1065(SEQ ID NO:15)
起始编码子:27 ATG 终止编码子:521 TGA 蛋白质分子量:17599.78
1 GG GAA GTA GAA GAC AGC GGC GTT GCC ATG GCG GCG TCT CTG GGG CAG 47
1 Met Ala Ala Ser Leu Gly Gln 7
48 GTG TTG GCT CTG GTG CTG GTG GCC GCT CTG TGG GGT GGC ACG CAG CCG 95
8 Val Leu Ala Leu Val Leu Val Ala Ala Leu Trp Gly Gly Thr Gln Pro 23
96 CTG CTG AAG CGG GCC TCC GCC GGC CTG CAG CGG GTT CAT GAG CCG ACC 143
24 Leu Leu Lys Arg Ala Ser Ala Gly Leu Gln Arg Val His Glu Pro Thr 39
144 TGG GCC CAG CAG TTG CTA CAG GAG ATG AAG ACC CTC TTC TTG AAT ACT 191
40 Trp Ala Gln Gln Leu Leu Gln Glu Met Lys Thr Leu Phe Leu Asn Thr 55
192 GAG TAC CTG ATG CCC TTT CTC CTC AAC CAG TGT GGA TCC CTT CTC TAT 239
56 Glu Tyr Leu Met Pro Phe Leu Leu Asn Gln Cys Gly Ser Leu Leu Tyr 71
240 TAC CTC ACC TTG GCA TCG ACA GAT CTG ACC CTG GCT GTG CCC ATC TGT 287
72 Tyr Leu Thr Leu Ala Ser Thr Asp Leu Thr Leu Ala Val Pro Ile Cys 87
288 AAC TCT CTG GCT ATC ATC TTC ACA CTG ATT GTT GGG AAG GCC CTT GGA 335
88 Asn Ser Leu Ala Ile Ile Phe Thr Leu Ile Val Gly Lys Ala Leu Gly 103
336 GAA GAT ATT GGT GGA AAA CGA GCA GTT GCT GGC ATG GTG CTC ACC GTG 383
104 Glu Asp Ile Gly Gly Lys Arg Ala Val Ala Gly Met Val Leu Thr Val 119
384 ATA GGA ATT TCA CTC TGC ATC ACA AGC TCA GTT CCA TGG ACT GCA GAA 431
120 Ile Gly Ile Ser Leu Cys Ile Thr Ser Ser Val Pro Trp Thr Ala Glu 135
432 CTC CAG CTG CAT GGA AAG GGC CAG CTG CAG ACT TTG AGC CAG AAA TGC 479
136 Leu Gln Leu His Gly Lys Gly Gln Leu Gln Thr Leu Ser Gln Lys Cys 151
480 AAA CGG GAG GCC TCT GGG ACT CAG TCA GAG CGC TTT GGC TGA ATG AGG 527
152 Lys Arg Glu Ala Ser Gly Thr Gln Ser Glu Arg Phe Gly *** 165
528 GGT GGA ACC GAG GGA AGA AGG TAG AGA GCT GTG AGC CCC AGC CCC ACC 575
576 TGA CTC CAG CAC ACC TGG CGA GTA GTA GCT GTC AAT AAA TCT ATG GTA 623
624 AAC AGA CAA GAG GAG GTG GAA GGC CAT ACA GAA TGG AGC CGT GAG TAT 671
672 GGC CAG CCT CCA GCT CTC AGC CAG GAG GTC CCC AAC CCC AAG GAA GGA 719
720 AGA AAC TGG AAA TTA GGA ACT GCT TCC TCA TTT AAC AAG GTA GGA AGT 767
768 TAG GAG ATC ATT TAC TTT CAA TCA CAA GGG AGG AGA ACT GTT CCT GGG 815
816 GCC CAA GGC TGC CAG TTT CCA GCT CAG AGC TCC TCC CAC CCC AAC ATA 863
864 CTG TTT CCT GAT CCA ACA GCT TAC CTG ATC CAA GGG CTC CTC TGT CTG 911
912 AGT GTC TTC ATC ATC TGC TAC TTC CAG GGC CCC CGC TGT CTC CTT CCT 959
960 TCG GTG GGG AGC TCC ATA TAC TCC TAT AAC TCC TAA AGA GGG GAG GCA 1007
1008 GCA CTG GGT GAT GCC CAG GCT GAA GAG CCC TCA GCA TTC CTG CCC TGG 1055
1056 ACC TTC ATG CTA GCC CCT TTC CCT CCC CTG AAC CTG GTT CTG CAT TCC 1103
1104 CCA CCA CCT CCC AGG ATG GCA AGG AAG TGA GAG GTG GGC CTT TGG TCC 1151
1152 CAC CCC CAT CCC CTC TAT ATC CCA CCC CTG AAG TCT TAT CGC TTT AAG 1199
1200 CAC TGC CCT TTC CAG GTG CTT CTT TTC ATG TGA TGA GGC CCT GTG AAG 1247
1248 AAG GGA CAG GAT ATA CAG ACG GGG GCA GCT GGA GAC AGT TAT GAT GAG 1295
1296 TGC CGG CTT TGT GTC TGA GCA TTC TGC TCC CAT GGA CAT CCC CAA CAA 1343
1344 CAG CAG GGA CCA ACC TAT GTC ACT GTC AAA GGG CAG CTG AGA AGG GCC 1391
1392 TGA GCC CCA GGG ACC CCT CAC CTG ATG GGA ATG AGA GTG TGG GGA GCT 1439
1440 TGC TTC TTG GCT GAA TGG TCT GCT GGG GTC TGG CAT AGA AAG CAG ATG 1487
1488 GCT TAA TTC GGT CTG GTT CCT TTG GAG AGG GCT GGG TTA CCT GGG CCC 1535
1536 TGT GGC CTT GGG CCT AGA GAA GGG ACA CTG GGC TTG GAC CCT GAT TGC 1583
1584 TGG CCA TTC TTA CCT TTC CTA CTC CCC AGT TCA GGC TTC AGA GAG CCC 1631
1632 CTG ACG CCT GCA GGA ACA TGG CAG AGG AGA CAC CGT CTG TCT TCA CAA 1679
1680 AGT ACG TCC TCC CTC CTT GCT GCC TCT TCC CAC CAG CCT GAC TTA TCC 1727
1728 AGG GAC AGA GCA GTA GAT GCC TGG CAC TCC TCG ATG CCC AGT GAA ACC 1775
1776 AGA CTG TGC TTC CCC ACC CCC ACC ACC ATG CCC CAT GCT CAC T3G CTC 1823
1824 ATT TCT TGG GAG GGC TTA GAG CTG GAT AAT ATA AGT TGC CTT GGG AAA 1871
1872 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 1910
6. PP1221
A:核苷酸序列(SEQ ID NO:16)长度:3657
GGCTGCCAAC GGTTTTGAGC GTAGGGGGAG GCGTGAGAGG GGGATCTCAG GGGAGGAGGT 60
CAATCGCTTG CCCCCCACTT TGGCAAATTG GGGACTGAGG ACTGGAAGGG TGGAGAGTAG 120
GCGGAACCAG GTGGTCGTCG GGGCAGAGGA TCTCGGGCTA GGCTTGAGGG CGGCGTGCTT 180
CTTAGGGACG ACTTAGGGCG TGACTGAGGG TTCACAAGGT TTCTTTTGGG GTGGTCGGGA 240
GGGAGAGATT CTAGGGAACA AGGAAGCTCG CTATGGCTTT CTTGCCAGGA GGGGTCGAAG 300
GGAAAGTACA AGGGAGCTGA CCCTGGGTAG AACGGGTGAA GGGATGGGGG AGCGTGAGGT 360
TCCGCCCTCT CTTGAGACTG GAACCAATTG GAGGGACTAG TAGGGCAGGG GGACAGAAAT 420
TGGGCTCCTA GTGGATTTGG GTCCGTTTCC GTTGGGACGT TTTGGGTGTG AGAACTTAAG 480
AGCTCAGTTG ACCGGGGATA GCCTGTGCCG GAGTTGATCT GCAGCTTCCA GCACTCGTAG 540
TCGGGAAGAG GAGCTTCAGC AGCGCTGTTG TCCCACAGTA GGTCTTCTGT CCGCACCCGC 600
TCTGCGCTGC ACCCTCTTAA CGCTGTTCCC AGGAGCTGGG GAAAGGGATG CTTTTGCCCA 660
CTCCCATGGC CCCTGGAACT GGTGGAAACC TTTCCTCTAA CCAGAAAGCC TCGATATCCT 720
TAATTCACCA AGGATCCTTG GCGTGGAGTC TTCCTCCCTT CTCCCAAGTC TTTCTCCGTG 780
AACTTTTCCT CCTGGACTTT GCTAAAGCAG AACCTCCCAG CTCTTTGCTG TCTCCGGTTG 840
TCTCTTCCCT GTATTCATGG CAACATCAGC TGACAGCCCC AGTTCACCCC TCGGGGCGGA 900
GGATCTCCTG AGTGATTCAT CAGAACCCCC TGGGCTCAAC CAAGTGTCGT CTGAAGTGAC 960
CTCCCAGCTC TATGCTTCTT TGCGCCTCAG CCGGCAGGCG GAGGCCACGG CCCGAGCCCA 1020
GCTGTATTTA CCCTCCACCT CCCCGCCTCA TGAAGGGTTA GACGGCTTCG CCCAAGAATT 1080
GAGTCGAAGC TTGTCAGTCG GATTGGAAAA GAACTTGAAG AAAAAGGATG GTTCTAAGCA 1140
TATCTTTGAG ATGGAAAGTG TTCGGGGTCA GCTCCAGACC ATGCTCCAAA CCTCACGTGA 1200
TACAGCCTAT CGGGATCCTC TCATTCCTGG CGCTGGCTCA GAGAGACGGG AAGAGGACTC 1260
CTTTGACAGT GATAGCACAG CCACCTTGCT CAACACCCGG CCCCTGCAAG ACTTGTCTCC 1320
ATCTAGCTCA GCCCAAGCCC TGGAGGAGCT GTTTCCCCGC TACACCAGCC TTCGGCCAGG 1380
GCCTCCACTC AATCCCCCAG ATTTTCAGGG GCTGAGAGAT GCATTGGATT CAGAGCATAC 1440
CCGCCGCAAG CATTGTGAGC GCCATATTCA GAGCCTGCAG ACCCGAGTGT TAGAGCTACA 1500
GCAACAATTA GCCGTGGCTG TGGCTGCCGA CCGCAAGAAA GATACCATGA TTGAACAACT 1560
GGACAAGACC CTGGCCCGTG TGGTGGAGGG CTGGAACCGG CATGAGGCTG AGCGGACAGA 1620
GGTTCTCAGG GGACTTCAAG AGGAACACCA GGCAGCAGAG CTCACCAGAA GCAAGCAGCA 1680
GGAGACAGTA ACCCGCCTGG AACAAAGCCT TTCTGAGGCC ATGGAGGCCC TGAATCGTGA 1740
GCAGGAAAGT GCCAGACTGC AGCAACGGGA AAGAGAGACA CTGGAGGAGG AAAGGCAAGC 1800
TCTGACTCTG AGGTTGGAGG CAGAACAGCA GCGGTGCTGT GTCCTGCAGG AAGAGCGGGA 1860
TGCAGCTCGG GCTGGGCAAC TGAGTGAGCA TCGAGAGTTG GAGACTCTTC GGGCTGCCCT 1920
AGAAGAAGAA CGGCAGACCT GCGCCCAGCA AGAGCACCAG CTTAAGGAAC ACTACCAGGC 1980
GCTGCAGGAG GAGAGCCAGG CTCAGCTGGA AAGGGAGAAG GAGAAGAGCC AGAGGGAAGC 2040
CCAGGCCGCC TGGGAGACCC AGCACCAGTT GGCATTGGTG CAGTCTGAGG TGCGGCGGCT 2100
GGAAGGAGAG CTGGATACAG CTCGGAGAGA GAGAGATGCC CTGCAGCTGG AAATGAGCTT 2160
GGTGCAGGCC CGGTATGAAA GCCAGCGGAT CCAGCTGGAG TCGGAGCTGG CTGTGCAGCT 2220
GGAGCAGCGG GTGACAGAGC GGCTGGCGCA GGCTCAGGAG AGCAGCCTAC GGCAAGCAGC 2280
CTCCCTCAGG GAACATCACA GGAAGCAGCT GCAGGACCTG AGTGGACAGC ACCAGCAGGA 2340
GCTGGCCAGT CAGCTAGCTC AGTTCAAGGT GGAAATGGCA GAACGAGAGG AACGGCAACA 2400
GCAGGTGGCT GAGGACTACG AGCTCAGACT GGCCCGGGAG CAAGCGCAAG TGTGCGAACT 2460
GCAGAGTGGG AACCAGCAGC TGGAGGAGCA GCGGGTGGAG CTGGTGGAAA GACTGCAGGC 2520
CATGCTGCAG GCCCACTGGG ATGAGGCCAA CCAGCTGCTC AGCACCACTC TCCCGCCGCC 2580
CAACCCTCCA GCTCCTCCTG CTGGACCCTC CAGCCCCGGG CCTCAGGAGC CCGAGAAGGA 2640
GGAGAGGAGG GTCTGGACTA TGCCTCCCAT GGCCGTGGCC CTGAAGCCTG TATTGCAGCA 2700
GAGCCGGGAA GCAAGGGACG AGCTACCTGG AGCGCCTCCT GTTCTTTGCA GTTCCTCCTC 2760
AGATCTTAGC CTCCTGTTGG GCCCCTCTTT TCAGAGCCAG CATTCTTTCC AGCCCCTGGA 2820
GCCCAAACCA GACCTCACTT CATCCACAGC TGGGGCCTTC TCTGCACTTG GGGCCTTCCA 2880
TCCCGATCAT AGGGCAGAAA GGCCATTCCC TGAGGAAGAT CCTGGACCTG ACGGGGAGGG 2940
CCTCCTAAAG CAAGGGCTGC CGCCTGCTCA GCTGGAGGGC CTCAAGAATT TTTTGCACCA 3000
GTTGCTGGAG ACAGTGCCCC AGAACAATGA GAACCCTTCT GTCGACCTGT TGCCCCCTAA 3060
GTCTGGTCCT CTGACTGTCC GATCTTGGGA GGAAGCCCCT CAAGTGCCAC GTATTCCACC 3120
GCCTGTCCAC AAAACCAAAG TTCCCTTAGC CATGGCATCC AGTCTTTTCC GGGTCCCTGA 3180
GCCTCCCTCC TCCCATTCAC AAGGCAGTGG TCCCAGCAGT GGTTCCCCAG AGAGAGGTGG 3240
AGATGGGCTT ACATTCCCAA GGCAGCTGAT GGAGGTGTCT CAACTGTTGC GACTCTACCA 3300
GGCTCGGGGC TGGGGGGCTC TGCCTGCTGA GGATCTCCTG CTCTACCTGA AGAGGCTGGA 3360
ACACAGCGGG ACTGATGGCC GAGGGGATAA TGTCCCCAGA AGGAACACAG ACTCCCGCTT 3420
GGGTGAGATC CCCCGGAAAG AGATTCCCTC CCAGGCTGTC CCTCGCCGCC TTGCTACAGC 3480
CCCCAAGACT GAAAAACCTC CCGCACGGAA GAAAAGTGGG CACCCTGCCC CGAGTAGCAT 3540
GAGGAGCCGG GGGGGAGTCT GGAGATGAGC CCCCCTACCC TCTCTCCTCT TTGTTCTCTC 3600
ATTGTTGTTA TTTTAATAAA TGCTCAGTAG TCTGTAAAAA AAAAAAAAAA AAAAAAA 3657
B:氨基酸序列(SEQ ID NO:17)长度:903
1 MATSADSPSS PLGAEDLLSD SSEPPGLNQV SSEVTSQLYA SLRLSRQAEA
51 TARAQLYLPS TSPPHEGLDG FAQELSRSLS VGLEKNLKKK DGSKHIFEME
101 SVRGQLQTML QTSRDTAYRD PLIPGAGSER REEDSFDSDS TATLLNTRPL
151 QDLSPSSSAQ ALEELFPRYT SLRPGPPLNP PDFQGLRDAL DSEHTRRKHC
201 ERHIQSLQTR VLELQQQLAV AVAADRKKDT MIEQLDKTLA RVVEGWNRHE
251 AERTEVLRGL QEEHQAAELT RSKQQETVTR LEQSLSEAME ALNREQESAR
301 LQQRERETLE EERQALTLRL EAEQQRCCVL QEERDAARAG QLSEHRELET
351 LRAALEEERQ TWAQQEHQLK EHYQALQEES QAQLEREKEK SQREAQAAWE
401 TQHQLALVQS EVRRLEGELD TARRERDALQ LEMSLVQARY ESQRIQLESE
451 LAVQLEQRVT ERLAQAQESS LRQAASLREH HRKQLQDLSG QHQQELASQL
501 AQFKVEMAER EERQQQVAED YELRLAREQA QVCELQSGNQ QLEEQRVELV
551 ERLQAMLQAH WDEANQLLST TLPPPNPPAP PAGPSSPGPQ EPEKEERRVW
601 TMPPMAVALK PVLQQSREAR DELPGAPPVL CSSSSDLSLL LGPSFQSQHS
651 FQPLEPKPDL TSSTAGAFSA LGAFHPDHRA ERPFPEEDPG PDGEGLLKQG
701 LPPAQLEGLK NFLHQLLETV PQNNENPSVD LLPPKSGPLT VPSWEEAPQV
751 PRIPPPVHKT KVPLAMASSL FRVPEPPSSH SQGSGPSSGS PERGGDGLTF
801 PRQLMEVSQL LRLYQARGWG ALPAEDLLLY LKRLEHSGTD GRGDNVPRRN
851 TDSRLGEIPR KEIPSQAVPR RLATAPKTEK PPARKKSGHP APSSMRSRGG
901 VWR
克隆号:PP1221(SEQ ID NO:18)
起始编码子:857 ATG 终止编码子:3568 TGA蛋白质分子量:101219.36
1 G GCT GCC AAC GGT TTT GAG CGT AGG GGG AGG CGT GAG AGG GGG ATC 46
47 TCA GGG GAG GAG GTC AAT CGC TTG CCC CCC ACT TTG GCA AAT TGG GGA 94
95 CTG AGG ACT GGA AGG GTG GAG AGT AGG CGG AAC CAG GTG GTC GTC GGG 142
143 GCA GAG GAT CTC GGG CTA GGC TTG AGG GCG GCG TGC TTC TTA GGG ACG 190
191 ACT TAG GGC GTG ACT GAG GGT TCA CAA GGT TTC TTT TGG GGT GGT CGG 238
239 GAG GGA GAG ATT CTA GGG AAC AAG GAA GCT CGC TAT GGC TTT CTT GCC 286
287 AGG AGG GGT CGA AGG GAA AGT ACA AGG GAG CTG ACC CTG GGT AGA ACG 334
335 GGT GAA GGG ATG GGG GAG CGT GAG GTT CCG CCC TCT CTT GAG ACT GGA 382
383 ACC AAT TGG AGG GAC TAG TAG GGC AGG GGG ACA GAA ATT GGG CTC CTA 430
431 GTG GAT TTG GGT CCG TTT CCG TTG GGA CGT TTT GGG TGT GAG AAC TTA 478
479 AGA GCT CAG TTG ACC GGG GAT AGC CTG TGC CGG AGT TGA TCT GCA GCT 526
527 TCC AGC ACT CGT AGT CGG GAA GAG GAG CTT CAG CAG CGC TGT TGT CCC 574
575 ACA GTA GGT CTT CTG TCC GCA CCC GCT CTG CGC TGC ACC CTC TTA ACG 622
623 CTG TTC CCA GGA GCT GGG GAA AGG GAT GCT TTT GCC CAC TCC CAT GGC 670
671 CCC TGG AAC TGG TGG AAA CCT TTC CTC TAA CCA GAA AGC CTC GAT ATC 718
719 CTT AAT TCA CCA AGG ATC CTT GGC GTG GAG TCT TCC TCC CTT CTC CCA 766
767 AGT CTT TCT CCG TGA ACT TTT CCT CCT GGA CTT TGC TAA AGC AGA ACC 814
815 TCC CAG CTC TTT GCT GTC TCC GGT TGT CTC TTC CCT GTA TTC ATG GCA 862
1 Met Ala 2
863 ACA TCA GCT GAC AGC CCC AGT TCA CCC CTC GGG GCG GAG GAT CTC CTG 910
3 Thr Ser Ala Asp Ser Pro Ser Ser Pro Leu Gly Ala Glu Asp Leu Leu 18
911 AGT GAT TCA TCA GAA CCC CCT GGG CTC AAC CAA GTG TCG TCT GAA GTG 958
19 Ser Asp Ser Ser Glu Pro Pro Gly Leu Asn Gln Val Ser Ser Glu Val 34
959 ACC TCC CAG CTC TAT GCT TCT TTG CGC CTC AGC CGG CAG GCG GAG GCC 1006
35 Thr Ser Gln Leu Tyr Ala Ser Leu Arg Leu Ser Arg Gln Ala Glu Ala 50
1007 ACG GCC CGA GCC CAG CTG TAT TTA CCC TCC ACC TCC CCG CCT CAT GAA 1054
51 Thr Ala Arg Ala Gln Leu Tyr Leu Pro Ser Thr Ser Pro Pro His Glu 66
1055 GGG TTA GAC GGC TTC GCC CAA GAA TTG AGT CGA AGC TTG TCA GTC GGA 1102
67 Gly Leu Asp Gly Phe Ala Gln Glu Leu Ser Arg Ser Leu Ser Val Gly 82
1103 TTG GAA AAG AAC TTG AAG AAA AAG GAT GGT TCT AAG CAT ATC TTT GAG 1150
83 Leu Glu Lys Asn Leu Lys Lys Lys Asp Gly Ser Lys His Ile Phe Glu 98
1151 ATG GAA AGT GTT CGG GGT CAG CTC CAG ACC ATG CTC CAA ACC TCA CGT 1198
99 Met Glu Ser Val Arg Gly Gln Leu Gln Thr Met Leu Gln Thr Ser Arg 114
1199 GAT ACA GCC TAT CGG GAT CCT CTC ATT CCT GGC GCT GGC TCA GAG AGA 1246
115 Asp Thr Ala Tyr Arg Asp Pro Leu Ile Pro Gly Ala Gly Ser Glu Arg 130
1247 CGG GAA GAG GAC TCC TTT GAC AGT GAT AGC ACA GCC ACC TTG CTC AAC 1294
131 Arg Glu Glu Asp Ser Phe Asp Ser Asp Ser Thr Ala Thr Leu Leu Asn 146
1295 ACC CGG CCC CTG CAA GAC TTG TCT CCA TCT AGC TCA GCC CAA GCC CTG 1342
147 Thr Arg Pro Leu Gln Asp Leu Ser Pro Ser Ser Ser Ala Gln Ala Leu 162
1343 GAG GAG CTG TTT CCC CGC TAC ACC AGC CTT CGG CCA GGG CCT CCA CTC 1390
163 Glu Glu Leu Phe Pro Arg Tyr Thr Ser Leu Arg Pro Gly Pro Pro Leu 178
1391 AAT CCC CCA GAT TTT CAG GGG CTG AGA GAT GCA TTG GAT TCA GAG CAT 1438
179 Asn Pro Pro Asp Phe Gln Gly Leu Arg Asp Ala Leu Asp Ser Glu His 194
1439 ACC CGC CGC AAG CAT TGT GAG CGC CAT ATT CAG AGC CTG CAG ACC CGA 1486
195 Thr Arg Arg Lys His Cys Glu Arg His Ile Gln Ser Leu Gln Thr Arg 210
1487 GTG TTA GAG CTA CAG CAA CAA TTA GCC GTG GCT GTG GCT GCC GAC CGC 1534
211 Val Leu Glu Leu Gln Gln Gln Leu Ala Val Ala Val Ala Ala Asp Arg 226
1535 AAG AAA GAT ACC ATG ATT GAA CAA CTG GAC AAG ACC CTG GCC CGT GTG 1582
227 Lys Lys Asp Thr Met Ile Glu Gln Leu Asp Lys Thr Leu Ala Arg Val 242
1583 GTG GAG GGC TGG AAC CGG CAT GAG GCT GAG CGG ACA GAG GTT CTC AGG 1630
243 Val Glu Gly Trp Asn Arg His Glu Ala Glu Arg Thr Glu Val Leu Arg 258
1631 GGA CTT CAA GAG GAA CAC CAG GCA GCA GAG CTC ACC AGA AGC AAG CAG 1678
259 Gly Leu Gln Glu Glu His Gln Ala Ala Glu Leu Thr Arg Ser Lys Gln 274
1679 CAG GAG ACA GTA ACC CGC CTG GAA CAA AGC CTT TCT GAG GCC ATG GAG 1726
275 Gln Glu Thr Val Thr Arg Leu Glu Gln Ser Leu Ser Glu Ala Met Glu 290
1727 GCC CTG AAT CGT GAG CAG GAA AGT GCC AGA CTG CAG CAA CGG GAA AGA 1774
291 Ala Leu Asn Arg Glu Gln Glu Ser Ala Arg Leu Gln Gln Arg Glu Arg 306
1775 GAG ACA CTG GAG GAG GAA AGG CAA GCT CTG ACT CTG AGG TTG GAG GCA 1822
307 Glu Thr Leu Glu Glu Glu Arg Gln Ala Leu Thr Leu Arg Leu Glu Ala 322
1823 GAA CAG CAG CGG TGC TGT GTC CTG CAG GAA GAG CGG GAT GCA GCT CGG 1870
323 Glu Gln Gln Arg Cys Cys Val Leu Gln Glu Glu Arg Asp Ala Ala Arg 338
1871 GCT GGG CAA CTG AGT GAG CAT CGA GAG TTG GAG ACT CTT CGG GCT GCC 1918
339 Ala Gly Gln Leu Ser Glu His Arg Glu Leu Glu Thr Leu Arg Ala Ala 354
1919 CTA GAA GAA GAA CGG CAG ACC TGG GCC CAG CAA GAG CAC CAG CTT AAG 1966
355 Leu Glu Glu Glu Arg Gln Thr Trp Ala Gln Gln Glu His Gln Leu Lys 370
1967 GAA CAC TAC CAG GCG CTG CAG GAG GAG AGC CAG GCT CAG CTG GAA AGG 2014
371 Glu His Tyr Gln Ala Leu Gln Glu Glu Ser Gln Ala Gln Leu Glu Arg 386
2015 GAG AAG GAG AAG AGC CAG AGG GAA GCC CAG GCC GCC TGG GAG ACC CAG 2062
387 Glu Lys Glu Lys Ser Gln Arg Glu Ala Gln Ala Ala Trp Glu Thr Gln 402
2063 CAC CAG TTG GCA TTG GTG CAG TCT GAG GTG CGG CGG CTG GAA GGA GAG 2110
403 His Gln Leu Ala Leu Val Gln Ser Glu Val Arg Arg Leu Glu Gly Glu 418
2111 CTG GAT ACA GCT CGG AGA GAG AGA GAT GCC CTG CAG CTG GAA ATG AGC 2158
419 Leu Asp Thr Ala Arg Arg Glu Arg Asp Ala Leu Gln Leu Glu Met Ser 434
2159 TTG GTG CAG GCC CGG TAT GAA AGC CAG CGG ATC CAG CTG GAG TCG GAG 2206
435 Leu Val Gln Ala Arg Tyr Glu Ser Gln Arg Ile Gln Leu Glu Ser Glu 450
2207 CTG GCT GTG CAG CTG GAG CAG CGG GTG ACA GAG CGG CTG GCG CAG GCT 2254
451 Leu Ala Val Gln Leu Glu Gln Arg Val Thr Glu Arg Leu Ala Gln Ala 466
2255 CAG GAG AGC AGC CTA CGG CAA GCA GCC TCC CTC AGG GAA CAT CAC AGG 2302
467 Gln Glu Ser Ser Leu Arg Gln Ala Ala Ser Leu Arg Glu His His Arg 482
2303 AAG CAG CTG CAG GAC CTG AGT GGA CAG CAC CAG CAG GAG CTG GCC AGT 2350
483 Lys Gln Leu Gln Asp Leu Ser Gly Gln His Gln Gln Glu Leu Ala Ser 498
2351 CAG CTA GCT CAG TTC AAG GTG GAA ATG GCA GAA CGA GAG GAA CGG CAA 2398
499 Gln Leu Ala Gln Phe Lys Val Glu Met Ala Glu Arg Glu Glu Arg Gln 514
2399 CAG CAG GTG GCT GAG GAC TAC GAG CTC AGA CTG GCC CGG GAG CAA GCG 2446
515 Gln Gln Val Ala Glu Asp Tyr Glu Leu Arg Leu Ala Arg Glu Gln Ala 530
2447 CAA GTG TGC GAA CTG CAG AGT GGG AAC CAG CAG CTG GAG GAG CAG CGG 2494
531 Gln Val Cys Glu Leu Gln Ser Gly Asn Gln Gln Leu Glu Glu Gln Arg 546
2495 GTG GAG CTG GTG GAA AGA CTG CAG GCC ATG CTG CAG GCC CAC TGG GAT 2542
547 Val Glu Leu Val Glu Arg Leu Gln Ala Met Leu Gln Ala His Trp Asp 562
2543 GAG GCC AAC CAG CTG CTC AGC ACC ACT CTC CCG CCG CCC AAC CCT CCA 2590
563 Glu Ala Asn Gln Leu Leu Ser Thr Thr Leu Pro Pro Pro Asn Pro Pro 578
259l GCT CCT CCT GCT GGA CCC TCC AGC CCC GGG CCT CAG GAG CCC GAG AAG 2638
579 Ala Pro Pro Ala Gly Pro Ser Ser Pro Gly Pro Gln Glu Pro Glu Lys 594
2639 GAG GAG AGG AGG GTC TGG ACT ATG CCT CCC ATG GCC GTG GCC CTG AAG 2686
595 Glu Glu Arg Arg Val Trp Thr Met Pro Pro Met Ala Val Ala Leu Lys 610
2687 CCT GTA TTG CAG CAG AGC CGG GAA GCA AGG GAC GAG CTA CCT GGA GCG 2734
611 Pro Val Leu Gln Gln Ser Arg Glu Ala Arg Asp Glu Leu Pro Gly Ala 626
2735 CCT CCT GTT CTT TGC AGT TCC TCC TCA GAT CTT AGC CTC CTG TTG GGC 2782
627 Pro Pro Val Leu Cys Ser Ser Ser Ser Asp Leu Ser Leu Leu Leu Gly 642
2783 CCC TCT TTT CAG AGC CAG CAT TCT TTC CAG CCC CTG GAG CCC AAA CCA 2830
643 Pro Ser Phe Gln Ser Gln His Ser Phe Gln Pro Leu Glu Pro Lys Pro 658
2831 GAC CTC ACT TCA TCC ACA GCT GGG GCC TTC TCT GCA CTT GGG GCC TTC 2878
659 Asp Leu Thr Ser Ser Thr Ala Gly Ala Phe Ser Ala Leu Gly Ala Phe 674
2879 CAT CCC GAT CAT AGG GCA GAA AGG CCA TTC CCT GAG GAA GAT CCT GGA 2926
675 His Pro Asp His Arg Ala Glu Arg Pro Phe Pro Glu Glu Asp Pro Gly 690
2927 CCT GAC GGG GAG GGC CTC CTA AAG CAA GGG CTG CCG CCT GCT CAG CTG 2974
691 Pro Asp Gly Glu Gly Leu Leu Lys Gln Gly Leu Pro Pro Ala Gln Leu 706
2975 GAG GGC CTC AAG AAT TTT TTG CAC CAG TTG CTG GAG ACA GTG CCC CAG 3022
707 Glu Gly Leu Lys Asn Phe Leu His Gln Leu Leu Glu Thr Val Pro Gln 722
3023 AAC AAT GAG AAC CCT TCT GTC GAC CTG TTG CCC CCT AAG TCT GGT CCT 3070
723 Asn Asn Glu Asn Pro Ser Val Asp Leu Leu Pro Pro Lys Ser Gly Pro 738
3071 CTG ACT GTC CCA TCT TGG GAG GAA GCC CCT CAA GTG CCA CGT ATT CCA 3118
739 Leu Thr Val Pro Ser Trp Glu Glu Ala Pro Gln Val Pro Arg Ile Pro 754
3119 CCG CCT GTC CAC AAA ACC AAA GTT CCC TTA GCC ATG GCA TCC AGT CTT 3166
755 Pro Pro Val His Lys Thr Lys Val Pro Leu Ala Met Ala Ser Ser Leu 770
3167 TTC CGG GTC CCT GAG CCT CCC TCC TCC CAT TCA CAA GGC AGT GGT CCC 3214
771 Phe Arg Val Pro Glu Pro Pro Ser Ser His Ser Gln Gly Ser Gly Pro 786
3215 AGC AGT GGT TCC CCA GAG AGA GGT GGA GAT GGG CTT ACA TTC CCA AGG 3262
787 Ser Ser Gly Ser Pro Glu Arg Gly Gly Asp Gly Leu Thr Phe Pro Arg 802
3263 CAG CTG ATG GAG GTG TCT CAA CTG TTG CGA CTC TAC CAG GCT CGG GGC 3310
803 Gln Leu Met Glu Val Ser Gln Leu Leu Arg Leu Tyr Gln Ala Arg Gly 818
3311 TGG GGG GCT CTG CCT GCT GAG GAT CTC CTG CTC TAC CTG AAG AGG CTG 3358
819 Trp Gly Ala Leu Pro Ala Glu Asp Leu Leu Leu Tyr Leu Lys Arg Leu 834
3359 GAA CAC AGC GGG ACT GAT GGC CGA GGG GAT AAT GTC CCC AGA AGG AAC 3406
835 Glu His Ser Gly Thr Asp Gly Arg Gly Asp Asn Val Pro Arg Arg Asn 850
3407 ACA GAC TCC CGC TTG GGT GAG ATC CCC CGG AAA GAG ATT CCC TCC CAG 3454
851 Thr Asp Ser Arg Leu Gly Glu Ile Pro Arg Lys Glu Ile Pro Ser Gln 866
3455 GCT GTC CCT CGC CGC CTT GCT ACA GCC CCC AAG ACT GAA AAA CCT CCC 3502
867 Ala Val Pro Arg Arg Leu Ala Thr Ala Pro Lys Thr Glu Lys Pro Pro 882
3503 GCA CGG AAG AAA AGT GGG CAC CCT GCC CCG AGT AGC ATG AGG AGC CGG 3550
883 Ala Arg Lys Lys Ser Gly His Pro Ala Pro Ser Ser Met Arg Ser Arg 898
3551 GGG GGA GTC TGG AGA TGA GCC CCC CTA CCC TCT CTC CTC TTT GTT CTC 3598
899 Gly Gly Val Trp Arg *** 904
3599 TCA TTG TTG TTA TTT TAA TAA ATG CTC AGT AGT CTG TAA AAA AAA AAA 3646
3647 AAA AAA AAA AA 3657
7. PP2250
A:核苷酸序列(SEQ ID NO:19)长度:2745
GCCGCGCTGG CATTTTCTCC TGGACAAGGA GAGAGTGCGG CTGCTGAGAG CCGAGCCCAG 60
CAATCCCGAT CCTCTGAGTC GTGAAGAAGG GAGGCAGCGA GGGGGTTGGG GTTGGGGCCT 120
GAGGCAAGCC CCCAGGCTCC GCTCTTGCCA GAGGGACAGG AGCCATGGCT CAGAAAATGG 180
ACTGTGGTGC GGGCCTCCTC GGCTTCCAGG CTGAGGCCTC CGTAGAAGAC AGCGCCTTGC 240
TTATGCAGAC CTTGATGGAG GCCATCCAGA TCTCAGAGGC TCCACCTACT AACCAGGCCA 300
CCGCAGCTGC TAGTCCCCAG AGTTCACAGC CCCCAACTGC CAATGAGATG GCTGACATTC 360
AGGTTTCAGC AGCTGCCGCT AGGCCTAAGT CAGCCTTTAA AGTCCAGAAT GCCACCACAA 420
AAGGCCCAAA TGGTGTCTAT GATTTCTCTC AGGCTCATAA TGCCAAGGAT GTGCCCAACA 480
CGCAGCCCAA GGCAGCCTTT AAGTCCCAAA ATGCTACCCC AAAGGGTCCA AATGCTGCCT 540
ATGATTTTTC CCAGGCAGCA ACCACTGGTG AGTTAGCTGC TAACAAGTCT GAGATGGCCT 600
TCAAGGCCCA GAATGCCACT ACTAAAGTGG GCCCAAATGC CACCTACAAT TTCTCTCAGT 660
CTCTCAATGC CAATGACCTG GCCAACAGCA GGCCTAAGAC CCCTTTCAAG GCTTGGAATG 720
ATACCACTAA GGCCCCAACA GCTGATACCC AGACCCAGAA TGTAAATCAG GCCAAAATGG 780
CCACTTCCCA GGCTGACATA GAGACCGACC CAGGTATCTC TGAACCTGAC GGTGCAACTG 840
CACAGACATC AGCAGATGGT TCCCAGGCTC AGAATCTGGA GTCCCGGACA ATAATTCGGG 900
GCAAGAGGAC CCGCAAGATT AATAACTTGA ATGTTGAAGA GAACAGCAGT GGGGATCAGA 960
GGCGGGCCCC ACTGGCTGCA GGGACCTGGA GGTCTGCACC AGTTCCAGTG ACCACTCAGA 1020
ACCCACCTGG CGCACCCCCC AATGTGCTCT GGCAGACGCC ATTGGCTTGG CAGAACCCCT 1080
CAGGCTGGCA AAACCAGACA GCCAGGCAGA CCCCACCAGC ACGTCAGAGC CCTCCAGCTA 1140
GGCAGACCCC ACCAGCCTGG CAGAACCCAG TCGCTTGGCA GAACCCAGTG ATTTGGCCAA 1200
ACCCAGTAAT CTGGCAGAAC CCAGTGATCT GGCCAAACCC CATTGTCTGG CCCGGCCCTG 1260
TTGTCTGGCC GAATCCACTG GCCTGGCAGA ATCCACCTGG ATGGCAGACT CCACCTGGAT 1320
GGCAGACCCC ACCGGGCTGG CAGGGTCCTC CAGACTGGCA AGGTCCTCCT GACTGGCCGC 1380
TACCACCCGA CTGGCCACTG CCACCTGATT GGCCACTTCC CACTGACTGG CCACTACCAC 1440
CTGACTGGAT CCCCGCTGAT TGGCCAATTC CACCTGACTG GCAGAACCTG CGCCCCTCGC 1500
CTAACCTGCG CCCTTCTCCC AACTCGCGTG CCTCACAGAA CCCAGGTGCT GCACAGCCCC 1560
GAGATGTGGC CCTTCTTCAG GAAAGAGCAA ATAAGTTGGT CAAGTACTTG ATGCTTAAGG 1620
ACTACACAAA GGTGCCCATC AAGCGCTCAG AAATGCTGAG AGATATCATC CGTGAATACA 1680
CTGATGTTTA TCCAGAAATC ATTGAACGTG CATGCTTTGT CCTAGAGAAG AAATTTGGGA 1740
TTCAACTGAA AGAAATTGAC AAAGAAGAAC ACCTGTATAT TCTCATCAGT ACCCCCGAGT 1800
CCCTGGCTGG CATACTGGGA ACGACCAAAG ACACACCCAA GCTCGGTCTC CTCTTGGTGA 1860
TTCTGGGTGT CATCTTCATG AATGGCAACC GTGCCAGTGA GGCTGTCCTC TGGGAGGCAC 1920
TACGCAAGAT GGGACTGCGT CCTGGGGTGA GACATCCCCT CCTTGGAGAT CTAAGGAAAC 1980
TTCTCACCTA TGAGTTTGTA AAGCAGAAAT ACCTGGACTA CAGACGAGTG CCCAACAGCA 2040
ACCCCCCGGA GTATGAGTTC CTCTGGGGCC TCCGTTCCTA CCATGAGACT AGCAAGATGA 2100
AAGTGCTGAG ATTCATTGCA GAGGTTCAGA AAAGAGACCC TCGTGACTGG ACTGCACAGT 2160
TCATGGAGGC TGCAGATGAG GCCTTGGATG CTCTGGATGC TGCTGCAGCT GAGGCCGAAG 2220
CCAGGGCTGA AGCAAGAACC CGCATGGGAA TTGGAGATGA GGCTGTGTCT GGGCCCTGGA 2280
GCTGGGATGA CATTGAGTTT GAGCTGCTGA CCTGGGATGA GGAAGGAGAT TTTGGAGATC 2340
CCTGGTCCAG AATTCCATTT ACCTTCTGGG CCAGATACCA CCAGAATGCC CGCTCCAGAT 2400
TCCCTCAGAC CTTTGCCGGT CCCATTATTG GTCCTGGTGG TACAGCCAGT GCCAACTTCG 2460
CTGCCAACTT TGGTGCCATT GGTTTCTTCT GGGTTGAGTG AGATGTTGGA TATTGCTATC 2520
AATCGCAGTA GTCTTTCCCC TGTGTGAGGC TGAAGCCTCA GATTCCTTCT AAACACAGCT 2580
ATCTAGAGAG CCACATCCTG TTGACTGAAA GTGGCATGCA AGATAAATTT ATTTGCTGTT 2640
CCTTGTCTAC TGCTTTTTTT CCCCTTGTGT GCTGTCAAGT TTTGGTATCA GAAATAAACA 2700
TTGAAATTGC AAAGTGAAAA AAAAAAAAAA AAAAAAAAAA AAAAA 2745
B:氨基酸序列(SEQ IDNO:20)长度:779
1 MAQKMDCGAG LLGFQAEASV EDSALLMQTL MEAIQISEAP PTNQATAAAS
51 PQSSQPPTAN EMADIQVSAA AARPKSAFKV QNATTKGPNG VYDFSQAHNA
101 KDVPNTQPKA AFKSQNATPK GPNAAYDFSQ AATTGELAAN KSEMAFKAQN
151 ATTKVGPNAT YNFSQSLNAN DLANSRPKTP FKAWNDTTKA PTADTQTQNV
201 NQAKMATSQA DIETDPGISE PDGATAQTSA DGSQAQNLES RTIIRGKRTR
251 KINNLNVEEN SSGDQRRAPL AAGTWRSAPV PVTTQNPPGA PPNVLWQTPL
301 AWQNPSGWQN QTARQTPPAR QSPPARQTPP AWQNPVAWQN PVIWPNPVIW
351 QNPVIWPNPI VWPGPVVWPN PLAWQNPPGW QTPPGWQTPP GWQGPPDWQG
401 PPDWPLPPDW PLPPDWPLPT DWPLPPDWIP ADWPIPPDWQ NLRPSPNLRP
451 SPNSRASQNP GAAQPRDVAL LQERANKLVK YLMLKDYTKV PIKRSEMLRD
501 IIREYTDVYP EIIERACFVL EKKFGIQLKE IDKEEHLYIL ISTPESLAGI
551 LGTTKDTPKL GLLLVILGVI FMNGNRASEA VLWEALRKMG LRPGVRHPLL
601 GDLRKLLTYE FVKQKYLDYR RVPNSNPPEY EFLWGLRSYH ETSKMKVLRF
651 IAEVQKRDPR DWTAQFMEAA DEALDALDAA AAEAEARAEA RTRMGIGDEA
701 VSGPWSWDDI EFELLTWDEE GDFGDPWSRI PFTFWARYHQ NARSRFPQTF
751 AGPIIGPGGT ASANFAANFG AIGFFWVE*
克隆号:PP2250(SEQ ID NO:21)
起始编码子:165 ATG 终止编码子:2501 TGA蛋白质分子量:86156.01
1 GC CGC GCT GGC ATT TTC TCC TGG ACA AGG AGA GAG TGC GGC TGC TGA 47
48 GAG CCG AGC CCA GCA ATC CCG ATC CTC TGA GTC GTG AAG AAG GGA GGC 95
96 AGC GAG GGG GTT GGG GTT GGG GCC TGA GGC AAG CCC CCA GGC TCC GCT 143
144 CTT GCC AGA GGG ACA GGA GCC ATG GCT CAG AAA ATG GAC TGT GGT GCG 191
1 Met ALa Gln Lys Met Asp Cys Gly Ala 9
192 GGC CTC CTC GGC TTC CAG GCT GAG GCC TCC GTA GAA GAC AGC GCC TTG 239
10 Gly Leu Leu Gly Phe Gln Ala Glu Ala Ser Val Glu Asp Ser Ala Leu 25
240 CTT ATG CAG ACC TTG ATG GAG GCC ATC CAG ATC TCA GAG GCT CCA CCT 287
26 Leu Met Gln Thr Leu Met Glu Ala Ile Gln Ile Ser Glu Ala Pro Pro 41
288 ACT AAC CAG GCC ACC GCA GCT GCT AGT CCC CAG AGT TCA CAG CCC CCA 335
42 Thr Asn Gln Ala Thr Ala Ala Ala Ser Pro Gln Ser Ser Gln Pro Pro 57
336 ACT GCC AAT GAG ATG GCT GAC ATT CAG GTT TCA GCA GCT GCC GCT AGG 383
58 Thr Ala Asn Glu Met Ala Asp Ile Gln Val Ser Ala Ala Ala Ala Arg 73
384 CCT AAG TCA GCC TTT AAA GTC CAG AAT GCC ACC ACA AAA GGC CCA AAT 431
74 Pro Lys Ser Ala Phe Lys Val Gln Asn Ala Thr Thr Lys Gly Pro Asn 89
432 GGT GTC TAT GAT TTC TCT CAG GCT CAT AAT GCC AAG GAT GTG CCC AAC 479
90 Gly Val Tyr Asp Phe Ser Gln Ala His Asn Ala Lys Asp Val Pro Asn 105
480 ACG CAG CCC AAG GCA GCC TTT AAG TCC CAA AAT GCT ACC CCA AAG GGT 527
106 Thr Gln Pro Lys Ala Ala Phe Lys Ser Gln Asn Ala Thr Pro Lys Gly 121
528 CCA AAT GCT GCC TAT GAT TTT TCC CAG GCA GCA ACC ACT GGT GAG TTA 575
122 Pro Asn Ala Ala Tyr Asp Phe Ser Gln Ala Ala Thr Thr Gly Glu Leu 137
576 GCT GCT AAC AAG TCT GAG ATG GCC TTC AAG GCC CAG AAT GCC ACT ACT 623
138 Ala Ala Asn Lys Ser Glu Met Ala Phe Lys Ala Gln Asn Ala Thr Thr 153
624 AAA GTG GGC CCA AAT GCC ACC TAC AAT TTC TCT CAG TCT CTC AAT GCC 671
154 Lys Val Gly Pro Asn Ala Thr Tyr Asn Phe Ser Gln Ser Leu Asn Ala 169
672 AAT GAC CTG GCC AAC AGC AGG CCT AAG ACC CCT TTC AAG GCT TGG AAT 719
170 Asn Asp Leu Ala Asn Ser Arg Pro Lys Thr Pro Phe Lys Ala Trp Asn 185
720 GAT ACC ACT AAG GCC CCA ACA GCT GAT ACC CAG ACC CAG AAT GTA AAT 767
186 Asp Thr Thr Lys Ala Pro Thr Ala Asp Thr Gln Thr Gln Asn Val Asn 201
768 CAG GCC AAA ATG GCC ACT TCC CAG GCT GAC ATA GAG ACC GAC CCA GGT 815
202 Gln Ala Lys Met Ala Thr Ser Gln Ala Asp Ile Glu Thr Asp Pro Gly 217
816 ATC TCT GAA CCT GAC GGT GCA ACT GCA CAG ACA TCA GCA GAT GGT TCC 863
218 Ile Ser Glu Pro Asp Gly Ala Thr Ala Gln Thr Ser Ala Asp Gly Ser 233
864 CAG GCT CAG AAT CTG GAG TCC CGG ACA ATA ATT CGG GGC AAG AGG ACC 911
234 Gln Ala Gln Asn Leu Glu Ser Arg Thr Ile Ile Arg Gly Lys Arg Thr 249
912 CGC AAG ATT AAT AAC TTG AAT GTT GAA GAG AAC AGC AGT GGG GAT CAG 959
250 Arg Lys Ile Asn Asn Leu Asn Val Glu Glu Asn Ser Ser Gly Asp Gln 265
960 AGG CGG GCC CCA CTG GCT GCA GGG ACC TGG AGG TCT GCA CCA GTT CCA 1007
266 Arg Arg Ala Pro Leu Ala Ala Gly Thr Trp Arg Ser Ala Pro Val Pro 281
1008 GTG ACC ACT CAG AAC CCA CCT GGC GCA CCC CCC AAT GTG CTC TGG CAG 1055
282 Val Thr Thr Gln Asn Pro Pro Gly Ala Pro Pro Asn Val Leu Trp Gln 297
1056 ACG CCA TTG GCT TGG CAG AAC CCC TCA GGC TGG CAA AAC CAG ACA GCC 1103
298 Thr Pro Leu Ala Trp Gln Asn Pro Ser Gly Trp Gln Asn Gln Thr Ala 313
1104 AGG CAG ACC CCA CCA GCA CGT CAG AGC CCT CCA GCT AGG CAG ACC CCA 1151
314 Arg Gln Thr Pro Pro Ala Arg Gln Ser Pro Pro Ala Arg Gln Thr Pro 329
1152 CCA GCC TGG CAG AAC CCA GTC GCT TGG CAG AAC CCA GTG ATT TGG CCA 1199
330 Pro Ala Trp Gln Asn Pro Val Ala Trp Gln Asn Pro Val Ile Trp Pro 345
1200 AAC CCA GTA ATC TGG CAG AAC CCA GTG ATC TGG CCA AAC CCC ATT GTC 1247
346 Asn Pro Val Ile Trp Gln Asn Pro Val Ile Trp Pro Asn Pro Ile Val 361
1248 TGG CCC GGC CCT GTT GTC TGG CCG AAT CCA CTG GCC TGG CAG AAT CCA 1295
362 Trp Pro Gly Pro Val Val Trp Pro Asn Pro Leu Ala Trp Gln Asn Pro 377
1296 CCT GGA TGG CAG ACT CCA CCT GGA TGG CAG ACC CCA CCG GGC TGG CAG 1343
378 Pro Gly Trp Gln Thr Pro Pro Gly Trp Gln Thr Pro Pro Gly Trp Gln 393
1344 GGT CCT CCA GAC TGG CAA GGT CCT CCT GAC TGG CCG CTA CCA CCC GAC 1391
394 Gly Pro Pro Asp Trp Gln Gly Pro Pro Asp Trp Pro Leu Pro Pro Asp 409
1392 TGG CCA CTG CCA CCT GAT TGG CCA CTT CCC ACT GAC TGG CCA CTA CCA 1439
410 Trp Pro Leu Pro Pro Asp Trp Pro Leu Pro Thr Asp Trp Pro Leu Pro 425
1440 CCT GAC TGG ATC CCC GCT GAT TGG CCA ATT CCA CCT GAC TGG CAG AAC 1487
426 Pro Asp Trp Ile Pro Ala Asp Trp Pro Ile Pro Pro Asp Trp Gln Asn 441
1488 CTG CGC CCC TCG CCT AAC CTG CGC CCT TCT CCC AAC TCG CGT GCC TCA 1535
442 Leu Arg Pro Ser Pro Asn Leu Arg Pro Ser Pro Asn Ser Arg Ala Ser 457
1536 CAG AAC CCA GGT GCT GCA CAG CCC CGA GAT GTG GCC CTT CTT CAG GAA 1583
458 Gln Asn Pro Gly Ala Ala Gln Pro Arg Asp Val Ala Leu Leu Gln Glu 473
1584 AGA GCA AAT AAG TTG GTC AAG TAC TTG ATG CTT AAG GAC TAC ACA AAG 1631
474 Arg Ala Asn Lys Leu Val Lys Tyr Leu Met Leu Lys Asp Tyr Thr Lys 489
1632 GTG CCC ATC AAG CGC TCA GAA ATG CTG AGA GAT ATC ATC CGT GAA TAC 1679
490 Val Pro Ile Lys Arg Ser Glu Met Leu Arg Asp Ile Ile Arg Glu Tyr 505
1680 ACT GAT GTT TAT CCA GAA ATC ATT GAA CGT GCA TGC TTT GTC CTA GAG 1727
506 Thr Asp Val Tyr Pro Glu Ile Ile Glu Arg Ala Cys Phe Val Leu Glu 521
1728 AAG AAA TTT GGG ATT CAA CTG AAA GAA ATT GAC AAA GAA GAA CAC CTG 1775
522 Lys Lys Phe Gly Ile Gln Leu Lys Glu Ile Asp Lys Glu Glu His Leu 537
1776 TAT ATT CTC ATC AGT ACC CCC GAG TCC CTG GCT GGC ATA CTG GGA ACG 1823
538 Tyr Ile Leu Ile Ser Thr Pro Glu Ser Leu Ala Gly Ile Leu Gly Thr 553
1824 ACC AAA GAC ACA CCC AAG CrC GGT CTC CTC TTG GTG ATT CTG GGT GTC 1871
554 Thr Lys Asp Thr Pro Lys Leu Gly Leu Leu Leu Val Ile Leu Gly Val 569
1872 ATC TTC ATG AAT GGC AAC CGT GCC AGT GAG GCT GTC CTC TGG GAG GCA 1919
570 Ile Phe Met Asn Gly Asn Arg Ala Ser Glu Ala Val Leu Trp Glu Ala 585
1920 CTA CGC AAG ATG GGA CTG CGT CCT GGG GTG AGA CAT CCC CTC CTT GGA 1967
586 Leu Arg Lys Met Gly Leu Arg Pro Gly Val Arg His Pro Leu Leu Gly 601
1968 GAT CTA AGG AAA CTT CTC ACC TAT GAG TTT GTA AAG CAG AAA TAC CTG 2015
602 Asp Leu Arg Lys Leu Leu Thr Tyr Glu Phe Val Lys Gln Lys Tyr Leu 617
2016 GAC TAC AGA CGA GTG CCC AAC AGC AAC CCC CCG GAG TAT GAG TTC CTC 2063
618 Asp Tyr Arg Arg Val Pro Asn Ser Asn Pro Pro Glu Tyr Glu Phe Leu 633
2064 TGG GGC CTC CGT TCC TAC CAT GAG ACT AGC AAG ATG AAA GTG CTG AGA 2111
634 Trp Gly Leu Arg Ser Tyr His Glu Thr Ser Lys Met Lys Val Leu Arg 649
2112 TTC ATT GCA GAG GTT CAG AAA AGA GAC CCT CGT GAC TGG ACT GCA CAG 2159
650 Phe Ile Ala Glu Val Gln Lys Arg Asp Pro Arg Asp Trp Thr Ala Gln 665
2160 TTC ATG GAG GCT GCA GAT GAG GCC TTG GAT GCT CTG GAT GCT GCT GCA 2207
666 Phe Met Glu Ala Ala Asp Glu Ala Leu Asp Ala Leu Asp Ala Ala Ala 681
2208 GCT GAG GCC GAA GCC AGG GCT GAA GCA AGA ACC CGC ATG GGA ATT GGA 2255
682 Ala Glu Ala Glu Ala Arg Ala Glu Ala Arg Thr Arg Met Gly Ile Gly 697
2256 GAT GAG GCT GTG TCT GGG CCC TGG AGC TGG GAT GAC ATT GAG TTT GAG 2303
698 Asp Glu Ala Val Ser Gly Pro Trp Ser Trp Asp Asp Ile Glu Phe Glu 713
2304 CTG CTG ACC TGG GAT GAG GAA GGA GAT TTT GGA GAT CCC TGG TCC AGA 2351
714 Leu Leu Thr Trp Asp Glu Glu Gly Asp Phe Gly Asp Pro Trp Ser Arg 729
2352 ATT CCA TTT ACC TTC TGG GCC AGA TAC CAC CAG AAT GCC CGC TCC AGA 2399
730 Ile Pro Phe Thr Phe Trp Ala Arg Tyr His Gln Asn Ala Arg Ser Arg 745
2400 TTC CCT CAG ACC TTT GCC GGT CCC ATT ATT GGT CCT GGT GGT ACA GCC 2447
746 Phe Pro Gln Thr Phe Ala Gly Pro Ile Ile Gly Pro Gly Gly Thr Ala 761
2448 AGT GCC AAC TTC GCT GCC AAC TTT GGT GCC ATT GGT TTC TTC TGG GTT 2495
762 Ser Ala Asn Phe Ala Ala Asn Phe Gly Ala Ile Gly Phe Phe Trp Val 777
2496 GAG TGA GAT GTT GGA TAT TGC TAT CAA TCG CAG TAG TCT TTC CCC TGT 2543
78 Glu *** 779
2544 GTG AGG CTG AAG CCT CAG ATT CCT TCT AAA CAC AGC TAT CTA GAG AGC 2591
2592 CAC ATC CTG TTG ACT GAA AGT GGC ATG CAA GAT AAA TTT ATT TGC TGT 2639
2640 TCC TTG TCT ACT GCT TTT TTT CCC CTT GTG TGC TGT CAA GTT TTG GTA 2687
2688 TCA GAA ATA AAC ATT GAA ATT GCA AAG TGA AAA AAA AAA AAA AAA AAA 2735
2736 AAA AAA AAA A 2745
Claims (5)
1.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列选自下组:
(a)编码以下多肽的多核苷酸,所述的多肽含有选自下组的氨基酸序列的多肽:SEQ IDNO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、或SEQ IDNO:20;
(b)与多核苷酸(a)互补的多核苷酸。
2.如权利要求1所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ IDNO:17、SEQ ID NO:20。
3.如权利要求1所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21的编码区序列或全长序列。
4.一种载体,其特征在于,它含有权利要求1所述的多核苷酸。
5.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求4所述的载体转化或转导的宿主细胞;
(b)用权利要求1所述的多核苷酸转化或转导的宿主细胞。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB011045450A CN1194989C (zh) | 2000-02-17 | 2001-02-13 | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN00111697.5 | 2000-02-17 | ||
CN00111697 | 2000-02-17 | ||
CNB011045450A CN1194989C (zh) | 2000-02-17 | 2001-02-13 | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1309135A CN1309135A (zh) | 2001-08-22 |
CN1194989C true CN1194989C (zh) | 2005-03-30 |
Family
ID=25739364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB011045450A Expired - Fee Related CN1194989C (zh) | 2000-02-17 | 2001-02-13 | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1194989C (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1671843B (zh) * | 2002-07-25 | 2010-07-14 | 索尼株式会社 | 参与转录调控的因子 |
-
2001
- 2001-02-13 CN CNB011045450A patent/CN1194989C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1309135A (zh) | 2001-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1170850C (zh) | 人血管生成素样蛋白和编码序列及其用途 | |
CN1194989C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1169954C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1160370C (zh) | 新的人细胞周期控制相关蛋白及其编码序列 | |
CN1177864C (zh) | 在肝癌组织中具有表达差异的新的人蛋白及其编码序列 | |
CN1169955C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1177048C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1932016A (zh) | 影响sre活性的多核苷酸及其编码多肽和用途 | |
CN1155615C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1199998C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1194010C (zh) | 具有抑制癌细胞生长功能的人蛋白及基编码序列 | |
CN1177049C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1169958C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1209373C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1199997C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1170848C (zh) | 新的人肝癌相关蛋白及其编码序列 | |
CN1166686C (zh) | 具有抑制癌细胞生长功能的人蛋白及其编码序列 | |
CN1193041C (zh) | 具有抑制癌细胞生长功能的人蛋白及其编码序列 | |
CN1169957C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1169831C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1209374C (zh) | 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1230445C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1177050C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1193040C (zh) | 具有抑制癌细胞生长功能的人蛋白及其编码序列 | |
CN1199996C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |