CN1177864C - 在肝癌组织中具有表达差异的新的人蛋白及其编码序列 - Google Patents

在肝癌组织中具有表达差异的新的人蛋白及其编码序列 Download PDF

Info

Publication number
CN1177864C
CN1177864C CNB001166166A CN00116616A CN1177864C CN 1177864 C CN1177864 C CN 1177864C CN B001166166 A CNB001166166 A CN B001166166A CN 00116616 A CN00116616 A CN 00116616A CN 1177864 C CN1177864 C CN 1177864C
Authority
CN
China
Prior art keywords
ctg
cag
leu
gag
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB001166166A
Other languages
English (en)
Other versions
CN1329064A (zh
Inventor
顾健人
杨胜利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cancer Institute
Original Assignee
Shanghai Cancer Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cancer Institute filed Critical Shanghai Cancer Institute
Priority to CNB001166166A priority Critical patent/CN1177864C/zh
Publication of CN1329064A publication Critical patent/CN1329064A/zh
Application granted granted Critical
Publication of CN1177864C publication Critical patent/CN1177864C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一类新的在肝癌组织中具有表达差异的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于检测癌症如肝癌的方法。本发明还公开了抗此多肽的拮抗剂。本发明还公开了编码这类新的在肝癌组织中具有表达差异的人蛋白的多核苷酸的用途。

Description

在肝癌组织中具有表达差异的新的人蛋白及其编码序列
技术领域
本发明属于生物技术领域,具体地说,本发明涉及新的编码在肝癌组织中具有表达差异的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
背景技术
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗和检测。因此,本领域迫切需要开发研究在肝癌组织中具有表达差异的人蛋白及其激动剂/抑制剂。
发明内容
本发明的目的是提供一类新的在肝癌组织中具有表达差异的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的在肝癌组织中具有表达差异的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ IDNO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ IDNO:23、SEQ ID NO:26、SEQ ID NO:29。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的在肝癌组织中具有表达差异的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ IDNO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ IDNO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备在肝癌组织中具有表达差异的蛋白多肽的制备方法,该方法包括(a)在适合表达在肝癌组织中具有表达差异的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出在肝癌组织中具有表达差异的蛋白多肽。
在本发明的第五方面,提供了与上述的在肝癌组织中具有表达差异的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续的10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的针对本发明的在肝癌组织中具有表达差异的蛋白多肽的抗体以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文技术的公开,对本领域的技术人员而言是显而易见的。
本发明采用大规模cDNA克隆转染癌细胞,在获得具有表达差异的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的在肝癌组织中具有表达差异的蛋白或多肽”是指在肝癌组织中具有表达差异的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化在肝癌组织中具有表达差异的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。在肝癌组织中具有表达差异的蛋白多肽的纯度能用氨基酸序列分析。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括在肝癌组织中具有表达差异的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然在肝癌组织中具有表达差异的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP367蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。以PP1597蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ IDNO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对于其他在肝癌组织中具有表达差异的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ ID NO:2所示的成熟多肽有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码在肝癌组织中具有表达差异的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码在肝癌组织中具有表达差异的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定在肝癌组织中具有表达差异的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测在肝癌组织中具有表达差异的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al. Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或本发明蛋白的编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的在肝癌组织中具有表达差异的蛋白多肽(Science,1984;224:1431)。一般来说有以下步骤:
(1).用本发明的编码在肝癌组织中具有表达差异的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,在肝癌组织中具有表达差异的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法,能用于构建含在肝癌组织中具有表达差异的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.Molecular Cloning,a LaboratoryManual,cold Spring Harbor Laboratory.New York,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的在肝癌组织中具有表达差异的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):用于肝癌的检测,和用于筛选针对在肝癌组织中具有表达差异的蛋白功能的抗体、多肽或其它配体。由于本发明的PP367,PP1597,PP1729,PP3476,PP3731,PP3856,PP3958,PP3971,PP4519,PP5241蛋白,在肝癌组织中的表达远高于其至正常肝组织中的表达,因此本发明蛋白可作为肝癌检测中待检测对象。以PP367蛋白为例,当用抗PP367的抗体检测样品时,如果发现PP367蛋白的表达量高于阴性对照(正常肝组织样品),那么就表明受检测的样品中存在癌变。
本发明还提供了一种检测肝组织样品是否发生癌变的方法,它包括步骤:(1)用抗本发明蛋白(PP367,PP1597,PP1729,PP3476,PP3731,PP3856,PP3958,PP3971,PP4519,PP5241)的抗体与待检测样品接触,以形成抗原-抗体复合物;(2)检测该抗原-抗体复合物的存在与否,该复合物的存在表示该受检测的肝组织发生了癌变。将本发明方法与其他检测肝癌的方法相结合,可以更准确地检测肝癌。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)在肝癌组织中具有表达差异的人蛋白的药剂的方法。激动剂提高在肝癌组织中具有表达差异的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达在肝癌组织中具有表达差异的人蛋白的膜制剂与标记的在肝癌组织中具有表达差异的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
在肝癌组织中具有表达差异的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。在肝癌组织中具有表达差异的人蛋白的拮抗剂可以与在肝癌组织中具有表达差异的人蛋白结合并消除其功能,或是抑制在肝癌组织中具有表达差异的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。在肝癌组织中具有表达差异的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将在肝癌组织中具有表达差异的蛋白加入生物分析测定中,通过测定化合物影响在肝癌组织中具有表达差异的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物如TNF等结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。针对本发明蛋白的拮抗剂以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的有效成分的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
在肝癌组织中具有表达差异的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于在肝癌组织中具有表达差异的蛋白的表达异常所致的细胞增殖、发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的在肝癌组织中具有表达差异的蛋白,以抑制内源性的在肝癌组织中具有表达差异的蛋白活性。例如,一种变异的在肝癌组织中具有表达差异的蛋白可以是缩短的、缺失了信号传导功能域的在肝癌组织中具有表达差异的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗在肝癌组织中具有表达差异的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将在肝癌组织中具有表达差异的蛋白基因转移至细胞内。构建携带所需蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组的本发明蛋白基因可包装到脂质体中转移至细胞内。
抑制在肝癌组织中具有表达差异的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对在肝癌组织中具有表达差异的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗在肝癌组织中具有表达差异的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的在肝癌组织中具有表达差异的人蛋白。
与在肝癌组织中具有表达差异的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与在肝癌组织中具有表达差异的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断在肝癌组织中具有表达差异的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如在肝癌组织中具有表达差异的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭在肝癌组织中具有表达差异的人蛋白阳性的细胞(如肝癌细胞)。
多克隆抗体的生产可用在肝癌组织中具有表达差异的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
在肝癌组织中具有表达差异的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler andMilstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.Pat No.4946778)也可用于生产抗在肝癌组织中具有表达差异的人蛋白的单链抗体。
能与在肝癌组织中具有表达差异的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对在肝癌组织中具有表达差异的人蛋白分子进行标记。
本发明还涉及定量和定位检测在肝癌组织中具有表达差异的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的在肝癌组织中具有表达差异的人蛋白水平,可以用作解释在肝癌组织中具有表达差异的人蛋白在各种疾病中的重要性和用于诊断诸如肝癌之类的疾病。
在肝癌组织中具有表达差异的蛋白的多聚核苷酸可用于在肝癌组织中具有表达差异的蛋白相关疾病的诊断和治疗。在诊断方面,在肝癌组织中具有表达差异的蛋白的多聚核苷酸可用于检测在肝癌组织中具有表达差异的蛋白的表达与否或在疾病状态下在肝癌组织中具有表达差异的蛋白的异常表达。如在肝癌组织中具有表达差异的蛋白DNA序列可用于对活检标本的杂交以判断在肝癌组织中具有表达差异的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用在肝癌组织中具有表达差异的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测在肝癌组织中具有表达差异的蛋白的转录产物。
检测在肝癌组织中具有表达差异的蛋白基因的突变也可用于诊断在肝癌组织中具有表达差异的蛋白相关的疾病。在肝癌组织中具有表达差异的蛋白突变的形式包括与正常野生型在肝癌组织中具有表达差异的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。现在,只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。根据本发明,为了将这些序列与疾病相关基因相关联,其重要的第一步就是将这些DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力,被精确定位至与疾病有关的染色体区域的cDNA,可以是50至500个潜在致病基因间之一种(假定1兆碱基作图分辨能力和每20kb对应于一个基因)。
本发明的在肝癌组织中具有表达差异的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的在肝癌组织中具有表达差异的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
具体实施方式
实施例1:cDNA基因的获得及对癌细胞克隆形成的抑制作用
PP367,PP1597,PP1729,PP3476,PP3731,PP3856,PP3958,PP3971,PP4519,PP5241是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL10-Gold感受细胞,获得了1×106cfu/μg cDNA滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。
实施例2:原位杂交表达差异的筛选
一、杂交探针的制备
原位杂交DNA处理
DNA       10μl
10×Buf   2μl
BamH I    1μl
H2O     7μl
      →37℃2小时
      →加1 lvol酚/氯仿=1∶1
          →Vortex,离心13,000rpm×5分钟
          →取上清,加2μl 3M NaAC
                    加40μl无水乙醇
          →-20℃0/N
          →取出离心13,000rpm×10分钟
          →取沉淀+100μl 70%酒精
          →离心13,000rpm×5分钟
          →取沉淀,加10μl DEPC,H2O溶解
          →取1μl电泳定量
*所有实验材料及试剂用0.1%DEPC H2O处理
用已酶切为线性的质粒DNA为模板,在T7RNA聚合酶的催化下,用ATP、CTP、GTP地戈辛标记的UTP体外转录,制备地戈辛标记的mRNA探针:
          →2μl线性质粒DNA
          →2μl DIG RNA标记混合物
            (10mM ATP、CTP、GTP,6.5mMUTP,3.5mM DIGUTP)
            购自Boehringer公司
          →2μl 10×转录缓冲液
          →2μl T7 RNA聚合酶(购自Boehriger公司)
          →1μl RNase抑制剂(购自Boehriger公司)
          加DEPC H2O至总体积20μl
混匀,稍离心一下,37℃反应2小时,取出后加2μl 0.2M EDTA终止反应,取1μl电泳鉴定,于-70℃保存备用。
二、切片制备
1.清洁载玻片,硫酸洗涤液浸泡,蒸馏水洗,180℃干烤3h.;
2.2%APES(丙酮)浸泡40sec,丙酮洗10sec,过DEPC水,晾干;硅化
3.新鲜组织(正常肝,肝癌及癌旁配对组织各2例),OCT包埋,液氮速冻,-70℃保存;
4.冰冻组织以恒冷切片机制作6μm厚冰冻切片,附贴于硅化的载玻片,37℃干燥1~2小时后行下述操作,或-20℃密封保存,1周内使用。
三、杂交前处理
         4%PFA(在DEPC-PBS pH 7.4)  37℃  1h    前固定
              ↓
             PBS  RT    5min×2
              ↓
             PBS(含0.3%体积比TritonX-100)  37℃  15min
              ↓
             PBS  RT  5min×2
              ↓
      2μg/ml Proteinase K在TE缓冲液  37℃  10min  消化
          ↓
      0.2%Glycin在PBS中  RT  5min×2
          ↓
      4%PFA在PBS    RT    15min                  后固定
          ↓
         PBS  RT  3min×2
          ↓
0.1M三乙醇胺(TEA)/0.25%乙酸酐    RT 5min×2      乙酰化
          ↓
       PBS  RT    5min×2
          ↓
四、预杂交
       预杂交液50℃2h  (预杂交液:50%甲酰胺,5×SSC,0.02%SDS,
          ↓                   5×Danhard’s,0.1mg/ml tRNA)
五、杂交
       杂交液50℃  16-18h过夜(含2μg/ml DIG标记RNA探针)
          ↓
六、杂交后处理
     50%甲酰胺2×SSC 50℃ 脱去盖膜          脱膜、洗片
          ↓
      2×SSC清洗37℃  5min×3
          ↓
20μg/ml RNase A在RNase缓冲液  37℃  30min   RNA酶后处理
          ↓    (RNase缓冲液:0.01M Tris,1mMEDTA,0.2MNaCl,pH8.0)
         RNase缓冲液37℃    15min×2
          ↓
        2×SSC  37℃  10min×2
          ↓
        1×SSC(含0.02%SDS)  37℃  10min×2
          ↓
        0.1×SSC  37℃    10min×2
          ↓
   缓冲液I 37℃ 5min×2(缓冲液I:0.1MTris-HCl pH7.6,0.15MNaCl)
          ↓
   0.5%抗体阻断液,在缓冲液1中(含0.2%Tween 20)20min    封闭
          ↓
   抗-DIG-AP(用抗体阻断液稀释抗体成1∶500)2h          抗体
          ↓
          缓冲液I  RT  5min×4
             ↓
 缓冲液II  RT  10min(缓冲液II:0.1Mtris,0.1MNaCl,50mMMgCl2,pH9.5)
             ↓
NBT/BCIP(1∶50在缓冲液II)RT 0.5-1.5h(湿盒、避光)
             ↓
          缓冲液III  RT  5min×2        
             ↓    (缓冲液III:10mMTris-HCl pH8.0,1mMEDTA)
           蒸馏水  5min×4
             ↓
      1%甲基绿复染10~15min,                
Figure C0011661600153
             ↓
       蒸馏水充分洗,晾干,封固               
通过上述杂交筛选,发现cDNA克隆PP367,PP1597,PP1729,PP3476,PP3731,PP3856,PP3958,PP3971,PP4519,PP5241在肝与肝癌中有表达差异,结果如下表所示:
                                                                                                表1肝与肝癌表达差异克隆
ID               正常肝                                 病例A                                 病例B
  N   胆   内   单   梭   L   胆   内   单   梭   K   内   单   梭   L   胆   内   单   梭   K   内   单   梭   比较-A   比较-B
367   0   A1   +   B2   B1   +   +   B1   +   N<L<K   N<L=K
1597   A1   B2   B2   A1   B2   N<L=K   N=L<K
1729   A1   B3   B3   B2   B3   N<L=K   N<L<K
3476   0   +   +   A1   +   +   B1   +   C1   +   +   C1   +   N<L<K   N<L=K
3731   0   A1   +   B1   B1   +   B1   N<L<K   N<L=K
3856   A1   +   +   B1   +   +   C1   +   C1   +   +   C1   +   N<L<K   N<L=K
3958   B1   +   +   C1   +   +   C1   +   C1   +   +   C1   +   N<L=K   N<L=K
3971   A1   +   +   B1   +   +   C1   +   C1   +   +   C1   +   N<L<K   N<L=K
4519   A1   +   +   B1   +   +   C1   +   C1   +   +   C1   +   N<L<K   N<L=K
5241   A1   +   +   A1   B2   B1   +   +   C2   N=L<K   N<L<K
N:肝细胞  L:癌旁肝细胞  K:癌细胞  胆:胆管细胞  内:内皮细胞  单:单核细胞
梭:梭形细胞  A、B、C:信号面积大小,依次递增  1、2、3:信号强度大小,依次递增
对上述cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序。如仍未获得全长cDNA序列,则设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28)。
实施例3:从胎盘cDNA中PCR获得基因克隆:
取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表2所示),按97℃3’1个循环。94℃30″60℃30″72℃1′,35个循环,72℃10′1个循环进行PCR扩增,获得各个基因的扩增产物。扩增产物经测序验证,与实施例2测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,从而获得重组蛋白。
                       表2基因特异引物序列
 克隆名称     特异引物1(5′→3′)     特异引物2(5′→3′)
 PP367     AGGGGGACAACAGCATGAGGACC     GGTGACAGAGCCAGCAGTCACCA
 PP1597     GCATGAGCCACTGCACTTAGCCC     GTGTCAACTCAGGGTTAAATGCC
 PP1729     CGTGGGCCTCATCTTCGTGGTCT     GGGTTCACGCCATTGCCATTCTC
 PP3476     CAAAGGAGACATCACCCGGGACC     GAGCAAGGACCCAAGCACAGCCT
 PP3731     TCTCTCCCAGACTCCAGTCGCCC     CAGAGTGCCATCAGGACAGGGGA
 PP3856     GGCCTCCTGGACACCTACAGCGT     ACTGCCCCGCACACAGACTGTTC
 PP3958     CCCGTGTGGGGGCTGTAGAGAAG     GTGCCCATCACCACACCCAGCTA
 PP3971     ACGTGGTGAAGCGGCTGTTCAAG     ACAACCACAGCCAGGAGCAGCC
 PP4519     AGCAGGAGGCAGAGCTGTGGGAT     TGTTTCTGTAACAGCGGCCACGC
 PP5241     GGCACGGGGTGGATCACTTGAG     TGAGATGCAGTTTTGCTCTTGTTGCCT
实施例3:cDNA克隆序列分析
1.PP367蛋白
A:核苷酸序列(SEQ ID NO:1)长度:1883bp
   1  CTGAGACCCA CTGGCCTCTG GGAAGAGCAT AGGAGAGGGG GACAACAGCA
  51  TGAGGACCAT ATGTTTGCCA TCTTGCTGAA GGAATTTCAG CCAACATAAT
 101  AAGACATGAA AATGGCATTC GAGGTGTATT AGACAGACAA GGGGATGTTA
 151  GTGTTTGCAG GAGACTTGGT CTGCCTCAGT GATGTCAGTC AGCAGTGATT
 201  GTGATTCCCC AGGGGACACT CGGCAGCATC TGGAGACATT TTAGTTTAAA
 251  CTTCCCCAGT GATCTGTGAT GTACAGGAGA CACTTTCGGT TGTCACACTG
 301  GGGGAGGAGG CTGCATGTCA CTGGCATCTG TTGGGTGACA CCTACAATGC
 351  ACAGGACAAC CACAACAAAT AATTCAGGCC CAAATGTTGC TGGTGCTGAG
 401  GGTGAGGTCC TAGTGTTAGT AACAGGAGGA AAACCCAGCA GTCTGGAGGA
 451  GAGACCTCTT CCCAGGGCAG CCCAGGGGCC ATCAGGAGGG TTCATCTCAT
 501  GCATTAGAGG TCTTGGGAAG AATGAGGCTT CCTTTCCTCC ATCAAAGCAA
 551  GCAAATCCTT TAAAAGCTGC ATCTCCAAGG GCTGCTCCGG GCTCATAGCA
 601  AGCAACGTCG GAGCCCAGAG GCAAGGCTGT GCTACTCAGC TGCCCTCTGG
 651  GGTCACAAAG GCTTCACTTG GCTTCTAAGA GCTGATGAGG CCTCTCGCAA
 701  GGGACCCTGT GTGCATGGGC TGACCCTGAA ACTTCCCAGC CTCTCTTCTT
 751  CTCAGAGCAC CCTCAGGTGG CCTCTCGGGG GTTACCCCTC ATTGATACCA
 801  TGTCTCCTCG TGTTTTTGTC CAGACTCCAA TTCCAGGGTT TCAGAACCGC
 851  ATCGCAGCAT CTTTCCTGAA ATGCACTCAG ACTCAGCCAG CAAAGACGTG
 901  CCTGGCCGCA TCCTGCTGGA TATAGACAAT GATACCGAGA GCACTGCCCT
 951  GTGAAGAAAG CCCTTTCCCA GCCCTCCACC ACTTCCACCC TGGCGAGTGG
1001  AGCAGGGGCA GGCGAACCTC TTTCTTTGCA GACCGAACAG TGAAAAGCTT
1051  TCAGTGGAGG ACAAAGGAGG GCCTCACTGT GCGGGACCTG GCCTTCTGCA
1101  CGGCCCAAGG AGAACCTGGA GGCCACCACT AAAGCTGAAT GACCTGTGTC
1151  TTGAAGAAGT TGGCTTTCTT TACATGGGAA GGAAATCATG CCAAAAAAAT
1201  CCAAAACAAA GAAGTACCTG GAGTGGAGAG AGTATTCCTG CTGAAACGCG
1251  CATAGGAAGC TTTTGTCCCT GCTGTTAATG CGGGCAGCAC CTACAGCAAC
1301  TTGGAATGAG TAAGAAGCAG TGCGTTAACT ATCTATTTAA TAAAATGCGC
1351  TCATTATGCA AGTCGCCTAC TCTCTGCTAC CTGGACGTTC ATTCTTATGT
1401  ATTAGGAGGG AGGCTGCGCT CCTTCAGACT TGCTGCAGTG AGCTGAGATT
1451  GCACGACTGC ACTCCAGCCT GGGCAAAAGA GCAAGACCCC ATCTCAAAAA
1501  AAAAATTTTT TTTTTTAATG TTAGCTACTG TGATGAAGTC TCTTTCTGAA
1551  AACTGGTTCT GTACAGGTTG CCGTAATTCT TTCTACTTTT TGTGTGTAAA
1601  CAAAGTCATT GTTTCTTTCA GGGACTGATT CATGTAGGAA TAGAGAGGGG
1651  CTGGGGAAAC CAGATGGGGC AGGTGGGCGG CAGAGTAAGG GATTTCCTTT
1701  ATGCCCCAAA ACACATTTTT TCCCATGGAT GGTGACTGCT GGCTCTGTCA
1751  CCTCATCAAA CTGGATGTGA CCCATGCCGC CTCGTTGGAT TGTCGGAATG
1801  TAGACAGAAA TGTACTGTTC TTTTTTTTTT TTAAACAATG TAATTGCTAC
1851  TTGATAAGGA CCGAAAAAAA AAAAAAAAAA AAA
B:氨基酸序列(SEQ ID NO:2)  长度:109个氨基酸
 1  MYRRHFRLSH WGRRLHVTGI CWVTPTMHRT TTTNNSGPNV AGAEGEVLVL VTGGKPSSLE
61  ERPLPRAAQG PSGGFISCIR GLGKNEASFP PSKQANPLKA ASPRAAPGS
C.核苷酸及氨基酸组合序列(SEQ ID NO:3)
克隆号:PP367
起始编码子:269ATG    终止编码子:598TAG
蛋白质分子量:11599
  1    C TGA GAC CCA CTG GCC TCT GGG AAG AGC ATA GGA GAG GGG GAC AAC     46
 47  AGC ATG AGG ACC ATA TGT TTG CCA TCT TGC TGA AGG AAT TTC AGC CAA     94
 95  CAT AAT AAG ACA TGA AAA TGG CAT TCG AGG TGT ATT AGA CAG ACA AGG    142
143  GGA TGT TAG TGT TTG CAG GAG ACT TGG TCT GCC TCA GTG ATG TCA GTC    190
191  AGC AGT GAT TGT GAT TCC CCA GGG GAC ACT CGG CAG CAT CTG GAG ACA    238
239  TTT TAG TTT AAA CTT CCC CAG TGA TCT GTG ATG TAC AGG AGA CAC TTT    286
  1                                          Met Tyr Arg Arg His Phe      6
287  CGG TTG TCA CAC TGG GGG AGG AGG CTG CAT GTC ACT GGC ATC TGT TGG    334
  7  Arg Leu Ser His Trp Gly Arg Arg Leu His Val Thr Gly Ile Cys Trp     22
335  GTG ACA CCT ACA ATG CAC AGG ACA ACC ACA ACA AAT AAT TCA GGC CCA    382
 23  Val Thr Pro Thr Met His Arg Thr Thr Thr Thr Asn Asn Ser Gly Pro     38
383  AAT GTT GCT GGT GCT GAG GGT GAG GTC CTA GTG TTA GTA ACA GGA GGA    430
 39  Asn Val Ala Gly Ala Glu Gly Glu Val Leu Val Leu Val Thr Gly Gly     54
431  AAA CCC AGC AGT CTG GAG GAG AGA CCT CTT CCC AGG GCA GCC CAG GGG    478
 55  Lys Pro Ser Ser Leu Glu Glu Arg Pro Leu Pro Arg Ala Ala Gln Gly     70
479  CCA TCA GGA GGG TTC ATC TCA TGC ATT AGA GGT CTT GGG AAG AAT GAG    526
 71  Pro Ser Gly Gly Phe Ile Ser Cys Ile Arg Gly Leu Gly Lys Ash Glu     86
527  GCT TCC TTT CCT CCA TCA AAG CAA GCA AAT CCT TTA AAA GCT GCA TCT    574
 87  Ala Ser Phe Pro Pro Ser Lys Gln Ala Asn Pro Leu Lys Ala Ala Ser    102
575  CCA AGG GCT GCT CCG GGC TCA TAG CAA GCA ACG TCG GAG CCC AGA GGC    622
103  Pro Arg Ala Ala Pro Gly Ser ***                                    110
 623  AAG GCT GTG CTA CTC AGC TGC CCT CTG GGG TCA CAA AGG CTT CAC TTG     670
 671  GCT TCT AAG AGC TGA TGA GGC CTC TCG CAA GGG ACC CTG TGT GCA TGG     718
 719  GCT GAC CCT GAA ACT TCC CAG CCT CTC TTC TTC TCA GAG CAC CCT CAG     766
 767  GTG GCC TCT CGG GGG TTA CCC CTC ATT GAT ACC ATG TCT CCT CGT GTT     814
 815  TTT GTC CAG ACT CCA ATT CCA GGG TTT CAG AAC CGC ATC GCA GCA TCT     862
 863  TTC CTG AAA TGC ACT CAG ACT CAG CCA GCA AAG ACG TGC CTG GCC GCA     910
 911  TCC TGC TGG ATA TAG ACA ATG ATA CCG AGA GCA CTG CCC TGT GAA GAA     958
 959  AGC CCT TTC CCA GCC CTC CAC CAC TTC CAC CCT GGC GAG TGG AGC AGG    1006
1007  GGC AGG CGA ACC TCT TTC TTT GCA GAC CGA ACA GTG AAA AGC TTT CAG    1054
1055  TGG AGG ACA AAG GAG GGC CTC ACT GTG CGG GAC CTG GCC TTC TGC ACG    1102
1103  GCC CAA GGA GAA CCT GGA GGC CAC CAC TAA AGC TGA ATG ACC TGT GTC    1150
1151  TTG AAG AAG TTG GCT TTC TTT ACA TGG GAA GGA AAT CAT GCC AAA AAA    1198
1199  ATC CAA AAC AAA GAA GTA CCT GGA GTG GAG AGA GTA TTC CTG CTG AAA    1246
1247  CGC GCA TAG GAA GCT TTT GTC CCT GCT GTT AAT GCG GGC AGC ACC TAC    1294
1295  AGC AAC TTG GAA TGA GTA AGA AGC AGT GCG TTA ACT ATC TAT TTA ATA    1342
1343  AAA TGC GCT CAT TAT GCA AGT CGC CTA CTC TCT GCT ACC TGG ACG TTG    1390
1391  ATT CTT ATG TAT TAG GAG GGA GGC TGC GCT CCT TCA GAC TTG CTG CAG    1438
1439  TGA GCT GAG ATT GCA CGA CTG CAC TCC AGC CTG GGC AAA AGA GCA AGA    1486
1487  CCC CAT CTC AAA AAA AAA ATT TTT TTT TTT AAT GTT AGC TAC TGT GAT    1534
1535  GAA GTC TCT TTC TGA AAA CTG GTT CTG TAC AGG TTG CCG TAA TTC TTT    1582
1583  CTA CTT TTT GTG TGT AAA CAA AGT CAT TGT TTC TTT CAG GGA CTG ATT    1630
1631  CAT GTA GGA ATA GAG AGG GGC TGG GGA AAC CAG ATG GGG CAG GTG GGC    1678
1679  GGC AGA GTA AGG GAT TTC CTT TAT GCC CCA AAA CAC ATT TTT TCC CAT    1726
1727  GGA TGG TGA CTG CTG GCT CTG TCA CCT CAT CAA ACT GGA TGT GAC CCA    1774
1775  TGC CGC CTC GTT GGA TTG TCG GAA TGT AGA CAG AAA TGT ACT GTT CTT    1822
1823  TTT TTT TTT TAA ACA ATG TAA TTG CTA CTT GAT AAG GAC CGA AAA AAA    1870
1871  AAA AAA AAA AAA A                                                  1883
2.PP1597蛋白
A:核苷酸序列(SEQ ID NO:4)长度:1412bp
   1  TAGGGATTAC AGGCATGAGC CACTGCACTT AGCCCAATAA AGTTGATTTT
  51  TAAAAAAAAA ACATAACAGC TCCCTCCCCC TCCCCCATCC CCCTCCCCCT
 101  CCCCCTCACC CGCTCCCTCT TTCTTTCTTC GGTCTCCTTC TGTTGCCAAG
 151  GCTGGACTGT ACTGCCGTGG TCTCGGCTCG CTGCAGCCTC CCTGCCCCGG
 201  GCTCCCCTGG TTCTCCTGCC TTGGCCTGCC GAGTGCCTGG GATTGCGGGC
 251  ACGCGCCGCC ACGCCTGACT GGTTTTTGTA TATTTGGAGG AGACACGGTT
 301  TCGCCCTGTT GACTGGGCTG GTCTCTGGCT CCTGACCTCG AGTGGTCTGC
 351  CCGCCTCGGC CTCCTGGGGT ACTGGGATTG CAGACGGAGC TCGGTCACTC
 401  AGTGCTCAGT GTTGCCCAGG CTGGAATGCA GTGGCGTGAT CTCGGCTCGC
 451  TGCAACCTCC ACCTTCCAGC CGCCTGCCTT GGCCTCCCAA AGTGCTAAGA
 501  TTACAGCCTC TGCCCGGCCG CCCCGTCTGG GAAGCGAGGA GCACCTCTGC
 551  CTGGCCGCCC CGTCTGGGAA GCGAGGAGCC CCTCTGCCCG GCTGCCACCC
 601  TGTCTGGGAG GCGAGGAGCG CCTCTGCCCT GCCGCCACCC CGTCTGGGAG
 651  GTGAGGAGCG CTTCTGCCCG GCCACCACCC CGTCTGGGAG GTGAGGAGCG
 701  CCTCTGCCTG GCCGCCACCC TGTCTGGGAT GTGAGGAGCA CCTCTGCCCG
 751  GCCGCCACCC CATCTGGGAG GAGTGCCTCT ACCCGGGCGC CCCGTCTGTG
 801  AAGTGGGCGC CTCTGCCCAG CCACCCCGTC TGGGAGGTGA GGGGCGTCTC
 851  TGCCCGGCTC CCCCGTCTGG GAGGTGGGGA GCACCTCTGC CTGGCCGCCC
 901  TTCATCTGGG AGGTGGGGGG CGCCTCTGCC CGGACACCCC GTCTGGGAGG
 951  TGGGGGGCGT TTCTGCCCGG CTGCCCCATC AGGGAGGTGG GGGGCGCCTC
1001  TGCCCGGCTG CCCATCGTTT GGGATGTGAG GGGCGCCTCT GCCCAGCCAC
1051  CACCCCTTCT GGGAGGTGAG GAGCGCCTCT GCCAGGCCGC CCCGCCTGGG
1101  AAGTGTACCC AACAGCTCCG AAAAGACAGC GACCATCGAG AAAGGGCCAT
1151  GATGACGATG GCGGTTTTGT CGAAAAAAAA AGGGGGAAAT GTGGGGAAAA
1201  GAAAGAGAGA TCAGATTGTT ACTGTGTCTG TGTAGAAAGA AGTAGACATA
1251  GGAGACCCCA TTTTGTTCTG TACTAAGAAA AATTCTTCTG CCTTGGGATG
1301  CTGTTAATCT ATAACCTTAC CCCCAACCCC GTACTCTCTG AAACATGTGC
1351  TGTGTCAACT CAGGGTTAAA TGCCAAAAAA AAAAAAAAAA AAAAAAAAAA
1401  AAAAAAAAAA AA
B:氨基酸序列(SEQ ID NO:5)  长度:102个氨基酸
 1  MQWRDLGSLQ PPPSSRLPWP PKVLRLQPLP GRPVWEARST SAWPPRLGSE EPLCPAATLS
61  GRRGAPLPCR HPVWEVRSAS ARPPPRLGGE ERLCLAATLS GM
C.核苷酸及氨基酸组合序列(SEQ ID NO:6)
克隆号:PP1597
起始编码子:426ATG    终止编码子:734TAG
蛋白质分子量:11186
  1   TA GGG ATT ACA GGC ATG AGC CAC TGC ACT TAG CCC AAT AAA GTT GAT     47
 48  TTT TAA AAA AAA AAC ATA ACA GCT CCC TCC CCC TCC CCC ATC CCC CTC     95
 96  CCC CTC CCC CTC ACC CGC TCC CTC TTT CTT TCT TCG GTC TCC TTC TGT    143
144  TGC CAA GGC TGG ACT GTA CTG CCG TGG TCT CGG CTC GCT GCA GCC TCC    191
192  CTG CCC CGG GCT CCC CTG GTT CTC CTG CCT TGG CCT GCC GAG TGC CTG    239
240  GGA TTG CGG GCA CGC GCC GCC ACG CCT GAC TGG TTT TTG TAT ATT TGG    287
288  AGG AGA CAC GGT TTC GCC CTG TTG ACT GGG CTG GTC TCT GGC TCC TGA    335
336  CCT CGA GTG GTC TGC CCG CCT CGG CCT CCT GGG GTA CTG GGA TTG CAG    383
384  ACG GAG CTC GGT CAC TCA GTG CTC AGT GTT GCC CAG GCT GGA ATG CAG    431
  1                                                          Met Gln      2
432  TGG CGT GAT CTC GGC TCG CTG CAA CCT CCA CCT TCC AGC CGC CTG CCT    479
  3  Trp Arg Asp Leu Gly Ser Leu Gln Pro Pro Pro Ser Ser Arg Leu Pro     18
480  TGG CCT CCC AAA GTG CTA AGA TTA CAG CCT CTG CCC GGC CGC CCC GTC    527
 19  Trp Pro Pro Lys Val Leu Arg Leu Gln Pro Leu Pro Gly Arg Pro Val     34
528  TGG GAA GCG AGG AGC ACC TCT GCC TGG CCG CCC CGT CTG GGA AGC GAG    575
 35  Trp Glu Ala Arg Ser Thr Ser Ala Trp Pro Pro Arg Leu Gly Ser Glu     50
576  GAG CCC GTC TGC CCG GCT GCC ACC CTG TCT GGG AGG CGA GGA GCG CCT    623
 51  Glu Pro Leu Cys Pro Ala Ala Thr Leu Ser Gly Arg Arg Gly Ala Pro     66
624  CTG CCC TGC CGC CAC CCC GTC TGG GAG GTG AGG AGC GCT TCT GCC CGG    671
 67  Leu Pro Cys Arg His Pro Val Trp Glu Val Arg Ser Ala Ser Ala Arg     82
672  CCA CCA CCC CGT CTG GGA GGT GAG GAG CGC CTC TGC CTG GCC GCC ACC    719
 83  Pro Pro Pro Arg Leu Gly Gly Glu Glu Arg Leu Cys Leu Ala Ala Thr     98
720  CTG TCT GGG ATG TGA GGA GCA CCT CTG CCC GGC CGC CAC CCC ATC TGG    767
 99  Leu Ser Gly Met ***                                                103
768  GAG GAG TGC CTC TAC CCG GCC GCC CCG TCT GTG AAG TGG GCG CCT CTG    815
816  CCC AGC CAC CCC GTC TGG GAG GTG AGG GGC GTC TCT GCC CGG CTC CCC    863
864  CGT CTG GGA GGT GGG GAG CAC CTC TGC CTG GCC GCC CTT CAT CTG GGA    911
 912  GGT GGG GGG CGC CTC TGC CCG GAC ACC CCG TCT GGG AGG TGG GGG GCG     959
 960  TTT CTG CCC GGC TGC CCC ATC AGG GAG GTG GGG GGC GCC TCT GCC CGG    1007
1008  CTG CCC ATC GTT TGG GAT GTG AGG GGC GCC TCT GCC CAG CCA CCA CCC    1055
1056  CTT CTG GGA GGT GAG GAG CGC CTC TGC CAG GCC GCC CCG CCT GGG AAG    1103
1104  TGT ACC CAA CAG CTC CGA AAA GAC AGC GAC CAT CGA GAA AGG GCC ATG    1151
1152  ATG ACG ATG GCG GTT TTG TCG AAA AAA AAA GGG GGA AAT GTG GGG AAA    1199
1200  AGA AAG AGA GAT CAG ATT GTT ACT GTG TCT GTG TAG AAA GAA GTA GAC    1247
1248  ATA GGA GAC CCC ATT TTG TTC TGT ACT AAG AAA AAT TCT TCT GCC TTG    1295
1296  GGA TGC TGT TAA TCT ATA ACC TTA CCC CCA ACC CCG TAC TCT CTG AAA    1343
1344  CAT GTG CTG TGT CAA CTC AGG GTT AAA TGC CAA AAA AAA AAA AAA AAA    1391
1392  AAA AAA AAA AAA AAA AAA AAA                                        1412
3.PP1729蛋白
A:核苷酸序列(SEQ ID NO:7)长度:1880bp
   1  GTCACACGGG CTGGCAGGCC GCCCTGGTGT CCACCATCAT CATGGTGCCC
  51  GTGGGCCTCA TCTTCGTGGT CTTCACCATC CACTTCTACC GCTCCCTGGT
 101  GCGCCACAAA ACGGAGCGCC ACAACCGCGA GATCGAGGAG CTCCACAAGC
 151  TCAAGGTCCA GCTGGACGGG CATGAGCGCA GCCTGCAGGT CTTGTGAGGG
 201  GCCGAGGGCC GGGGCTGGGA GCGGCCCTGT GCCCGGGAGT CCGCAGAGGC
 251  GGGGATTTGT CAGATGCAGA CATTTTGCAA GGCTGCCGGG TAGTTCAAGA
 301  CCAAAGTTTT CCTCTTGTCT TAATACCATA AGGACTGGAT GACTTCTCCT
 351  GAGATAGAAC CGTTTGGTTC AATGAGGGAC TGTGTTGCTA AGAGCGTTGG
 401  GGGCAAAGCC AGGCTGGTTC CTTGGCCTCG GGGTTTCCTG GGTCGGGGAC
 451  ACGGTGAAGA GGCTCCAGCG GGACCTGCCC ATCAGTCCTG GGCCAGGAGG
 501  GGCTCCAAGC AGCACCCAGC GGTCCGGGGG AGTCTCAGAC CCGGCATGCG
 551  TGGCTGGCAG ACCTGGGAGA GCCAGGGCAG GGTTTTGCGT TCAGAGAAGG
 601  ATTGCCCCAG AGACCCGTGG TTGACTTCAT GGGTGCTGAG TGGCCCGTGT
 651  GACAGTGATG ACACGAAGGC TTCGGCGTTT GAGTGGGTGC AGGTGCACGC
 701  CAGGGCTTGG TGCTTCCCTG CCTGGCCCTG GAGGGAAGCT GGGTGGCCTG
 751  GCTTCAGGGG AAGACAGGAG CCAGGACACA CGTCAGCCCA GCAGGTGTGG
 801  GGGGTGCTGC AGCCCTCGGC AGTGGGGTCA GGCCCTGGGG GATGTTTCCA
 851  ATGGTGGGCA GCCTGGCCAG GCCGGAGAAG ACATGTTCAC GGGCATCTAT
 901  CAGATGCCCC CTTGAGGAGG CTGAGTTATT TGAGGGCTGC TGCAAAGTAC
 951  GCTAGGCTCA AATTCTCTTT TCCCAGCCAG AGCCCTGGCC ACACGGACTC
1001  AGAGGGGCCA CCGGGGTGGG GAAAGGACCC CTCCCCGACC CCCCGCAGCC
1051  ACTGGCCTCC AGCTCTCGGC CACAGAATGG CCTCTAAGGC TGACTCAGCC
1101  GCTCCCTTGG GCTGTGGCAG CAGGAGGCGG GGGCTCTGGC TCAGGCCCCG
1151  GAGCCTGTGC AGCTTGCCCA TGGCCCTAGG CAGCGAGGGG ACAGCCTGGG
1201  GGACTTCCTG CCTAGGCAAG GTCATTGGCC GGGCCTGGCC TGTGGATAGT
1251  GGGGCCAGGG GCCGGCCCAG GCCAAATGAG TGCCCTCCTT GTTATGACAC
1301  CAAGTGACTA CAAGGGAGGC AAGACCCCTC CAGGCCTCTC AGCCGACACT
1351  GGGTCCCACC ACACACAGTG ACTGTGCCGT GCAGTGCAGG TTCTGGCCTT
1401  TTCCTTGAAG GCATCTGGTA GACCCGAAGC CACGCTCTCG GGCCGCACAT
1451  GCACGCCGCA GCACCAGCTG CCCTGAGCTG CTTGTACAAC CAAACACCTT
1501  TCCCCTCTTC TCCAGCTGTA ACCTGGAGAG TCAGCCATGC CTTGTCTTTT
1551  GTTCTCATAA ATAGTCACTG GGGCCGGGCG CAGTGACTCA CGCCTGTAAT
1601  CCCAGCACTT TGGGAGGCCT AGGTGGGCGG ATCACTTGAG GTCAGGAGTT
1651  CGAGACCAGC CTGGCCAACA TGGTGAAACC CTGTCTCTAC TAAAAAAATA
1701  CAGAAAATTA GCTGGGCGTG GTGGCGGGCG CCTGTAGCCC CAGCTACTTG
1751  GGAGGCTGAG GCGGGAGAAT GGCAATGGCG TGAACCCGGG AGGCAGAGCT
1801  TGCAGTGAGC TGAGATGGCG CCACTGCACT CCAGCCTGGG CGACAGAGCC
1851  AGACTCAATC TCAAAAAAAA AAAAAAAAAA
B:氨基酸序列(SEQ ID NO:8)  长度:322个氨基酸
  1  MTSPEIEPFG SMRDCVAKSV GGKARLVPWP RGFLGRGHGE EAPAGPAHQS WARRGSKQHP
161  AVRGSLRPGM RGWQTWESQG RVLRSEKDCP RDPWLTSWVL SGPCDSDDTK ASAFEWVQVH
121  ARAWCFPAWP WREAGWPGFR GRQEPGHTSA QQVWGVLQPS AVGSGPGGCF QWWAAWPGRR
181  RHVHGHLSDA PLRRLSYLRA AAKYARLKFS FPSQSPGHTD SEGPPGWGKD PSPTPRSHWP
241  PALGHRMASK ADSAAPLGCG SRRRGLWLRP RSLCSLPMAL GSEGTAWGTS CLGKVIGRAW
301  PVDSGARGRP RPNECPPCYD TK
C.核苷酸及氨基酸组合序列(SEQ ID NO:9)
克隆号:PP1729
起始编码子:339ATG    终止编码子:1307TGA
蛋白质分子量:35347
  1   GT CAC ACG GGC TGG CAG GCC GCC CTG GTG TCC ACC ATC ATC ATG GTG     47
 48  CCC GTG GGC CTC ATC TTC GTG GTC TTC ACC ATC CAC TTC TAC CGC TCC     95
 96  CTG GTG CGC CAC AAA ACG GAG CGC CAC AAC CGC GAG ATC GAG GAG CTC    143
144  CAC AAG CTC AAG GTC CAG CTG GAC GGG CAT GAG CGC AGC CTG CAG GTC    191
192  TTG TGA GGG GCC GAG GGC CGG GGC TGG GAG CGG CCC TGT GCC CGG GAG    239
240  TCC GCA GAG GCG GGG ATT TGT CAG ATG CAG ACA TTT TGC AAG GCT GCC    287
288  GGG TAG TTC AAG ACC AAA GTT TTC CTC TTG TCT TAA TAC CAT AAG GAC    335
336  TGG ATG ACT TCT CCT GAG ATA GAA CCC TTT GGT TCA ATG AGG GAC TGT    383
  1      Met Thr Ser Pro Glu Ile Glu Pro Phe Gly Ser Met Arg Asp Cys     15
384  GTT GCT AAG AGC GTT GGG GGC AAA GCC AGG CTG GTT CCT TGG CCT CGG    431
 16  Val Ala Lys Ser Val Gly Gly Lys Ala Arg Leu Val Pro Trp Pro Arg     31
432  GGT TTC CTG GGT CGG GGA CAC GGT GAA GAG GCT CCA GCG GGA CCT GCC    479
 32  Gly Phe Leu Gly Arg Gly His Gly Glu Glu Ala Pro Ala Gly Pro Ala     47
480  CAT CAG TCC TGG GCC AGG AGG GGC TCC AAG CAG CAC CCA GCG GTC CGG    527
 48  His Gln Ser Trp Ala Arg Arg Gly Ser Lys Gln His Pro Ala Val Arg     63
528  GGG AGT CTC AGA CCC GGC ATG CGT GGC TGG CAG ACC TGG GAG AGC CAG    575
 64  Gly Ser Leu Arg Pro Gly Met Arg Gly Trp Gln Thr Trp Glu Ser Gln     79
576  GGC AGG GTT TTG CGT TCA GAG AAG GAT TGC CCC AGA GAC CCG TGG TTG    623
 80  Gly Arg Val Leu Arg Ser Glu Lys Asp Cys Pro Arg Asp Pro Trp Leu     95
624  ACT TCA TGG GTG CTG AGT GGC CCG TGT GAC AGT GAT GAC ACG AAG GCT    671
 96  Thr Ser Trp Val Leu Ser Gly Pro Cys Asp Ser Asp Asp Thr Lys Ala    111
672  TCG GCG TTT GAG TGG GTG CAG GTG CAC GCC AGG GCT TGG TGC TTC CCT    719
112  Ser Ala Phe Glu Trp Val Gln Val His Ala Arg Ala Trp Cys Phe Pro    127
720  GCC TGG CCC TGG AGG GAA GCT GGG TGG CCT GGC TTC AGG GGA AGA CAG    767
128  Ala Trp Pro Trp Arg Glu Ala Gly Trp Pro Gly Phe Arg Gly Arg Gln    143
768  GAG CCA GGA CAC ACG TCA GCC CAG CAG GTG TGG GGG GTG CTG CAG CCC    815
144  Glu Pro Gly His Thr Ser Ala Gln Gln Val Trp Gly Val Leu Gln Pro    159
 816  TCG GCA GTG GGG TCA GGC CCT GGG GGA TGT TTC CAA TGG TGG GCA GCC     863
 160  Ser Ala Val Gly Ser Gly Pro Gly Gly Cys Phe Gln Trp Trp Ala Ala     175
 864  TGG CCA GGC CGG AGA AGA CAT GTT CAC GGG CAT CTA TCA GAT GCC CCC     911
 176  Trp Pro Gly Arg Arg Arg His Val His Gly His Leu Ser Asp Ala Pro     191
 912  TTG AGG AGG CTG AGT TAT TTG AGG GCT GCT GCA AAG TAC GCT AGG CTC     959
 192  Leu Arg Arg Leu Ser Tyr Leu Arg Ala Ala Ala Lys Tyr Ala Arg Leu     207
 960  AAA TTC TCT TTT CCC AGC CAG AGC CCT GGC CAC ACG GAC TCA GAG GGG    1007
 208  Lys Phe Ser Phe Pro Ser Gln Ser Pro Gly His Thr Asp Ser Glu Gly     223
1008  CCA CCG GGG TGG GGA AAG GAC CCC TCC CCG ACC CCC CGC AGC CAC TGG    1055
 224  Pro Pro Gly Trp Gly Lys Asp Pro Ser Pro Thr Pro Arg Ser His Trp     239
1056  CCT CCA GCT CTC GGC CAC AGA ATG GCC TCT AAG GCT GAC TCA GCC GCT    1103
 240  Pro Pro Ala Leu Gly His Arg Met Ala Ser Lys Ala Asp Ser Ala Ala     255
1104  CCC TTG GGC TGT GGC AGC AGG AGG CGG GGG CTC TGG CTC AGG CCC CGG    1151
 256  Pro Leu Gly Cys Gly Ser Arg Arg Arg Gly Leu Trp Leu Arg Pro Arg     271
1152  AGC CTG TGC AGC TTG CCC ATG GCC CTA GGC AGC GAG GGG ACA GCC TGG    1199
 272  Ser Leu Cys Ser Leu Pro Met Ala Leu Gly Ser Glu Gly Thr Ala Trp     287
1200  GGG ACT TCC TGC CTA GGC AAG GTC ATT GGC CGG GCC TGG CCT GTG GAT    1247
 288  Gly Thr Ser Cys Leu Gly Lys Val Ile Gly Arg Ala Trp Pro Val Asp     303
1248  AGT GGG GCC AGG GGC CGG CCC AGG CCA AAT GAG TGC CCT CCT TGT TAT    1295
 304  Ser Gly Ala Arg Gly Arg Pro Arg Pro Ash Glu Cys Pro Pro Cys Tyr     319
1296  GAC ACC AAG TGA CTA CAA GGG AGG CAA GAC CCC TCC AGG CCT CTC AGC    1343
 320  Asp Thr Lys ***                                                     323
1344  CGA CAC TGG GTC CCA CCA CAC ACA GTG ACT GTG CCG TGC AGT GCA GGT    1391
1392  TCT GGC CTT TTC CTT GAA GGC ATC TGG TAG ACC CGA AGC CAC GCT CTC    1439
1440  GGG CCG CAC ATG CAC GCC GCA GCA CCA GCT GCC CTG AGC TGC TTG TAC    1487
1488  AAC CAA ACA CCT TTC CCC TCT TCT CCA GCT GTA ACC TGG AGA GTC AGC    1535
1536  CAT GCC TTG TCT TTT GTT CTC ATA AAT AGT CAC TGG GGC CGG GCG CAG    1583
1584  TGA CTC ACG CCT GTA ATC CCA GCA CTT TGG GAG GCC TAG GTG GGC GGA    1631
1632  TCA CTT GAG GTC AGG AGT TCG AGA CCA GCC TGG CCA ACA TGG TGA AAC    1679
1680  CCT GTC TCT ACT AAA AAA ATA CAG AAA ATT AGC TGG GCG TGG TGG CGG    1727
1728  GCG CCT GTA GCC CCA GCT ACT TGG GAG GCT GAG GCG GGA GAA TGG CAA    1775
1776  TGG CGT GAA CCC GGG AGG CAG AGC TTG CAG TGA GCT GAG ATG GCG CCA    1823
1824  CTG CAC TCC AGC CTG GGC GAC AGA GCC AGA CTC AAT CTC AAA AAA AAA    1871
1872  AAA AAA AAA                                                        1880
D.Blastp
Query=PP1729(322个氨基酸)
>SW:HMBP_DROME P22809 drosophila melanogaster(fruit fly).homeobox
             protein bagpipe(nk-3).7/1998
             长度=382个氨基酸
分值=31.7bits(70),预计值=6.9
相同性=24/99(24%),相似性=37/99(37%),缺口=6/99(6%)
Query:157 LQPSAVGSGPGGCFQWWAAWPGRRRHVHGHLSDAPLRRLSYLRAAAKYARLKFSFPSQ-- 214
           +QPSA    P    Q++AA      H H     +      Y++    Y     + P
Sbjct:84  IQPSA--RQPSNYLQYYAAAMDNNNHHHQATGTSNSSAADYMQRKLAYFGSTLAAPLDMR 141
Query:215 --SPGHTDSEGPPGWGKDPSPTPRSHWPPALGHRMASKA 251
             +   +D + PP     PS +P SH    L  +  S+A
Sbjct:142 RCTSNDSDCDSPPPLSSSPSESPLSHDGSGLSRKKRSRA 180
4.PP3476蛋白
A:核苷酸序列(SEQ ID NO:10)  长度:2756bp
   1  TATCTTGTTT GACTGTCCAT GAAAATCTCA ACTTTATGGC CATTGGTTTC
  51  ACAGATGGCA GTGTTACATT GAACAAAGGA GACATCACCC GGGACCGGCA
 101  TAGCAAGACC CAGATTTTGC ACAAGGGCAA CTATCCTGTA ACTGGATTGG
 151  CCTTTCGCCA AGCAGGAAAG ACCACTCACT TGTTTGTTGT GACAACAGAG
 201  AACGTCCAGT CCTATATAGT TTCTGGAAAA GACTACCCTC GCGTGGAGTT
 251  GGACACCCAT GGTTGTGGCC TGCGCTGCTC AGCCCTAAGT GACCCTTCTC
 301  AGGACCTGCA GTTCATTGTG GCCGGGGATG AGTGTGTCTA CTTGTACCAG
 351  CCTGATGAAC GTGGGCCCTG CTTCGCCTTT GAGGGCCATA AGCTCATTGC
 401  CCACTGGTTT AGAGGCTACC TTATCATTGT CTCCCGTGAC CGGAAGGTTT
 451  CTCCCAAGTC AGAGTTTACC AGCAGGGATT CACAGAGCTC CGACAAGCAG
 501  ATTCTAAACA TCTATGACCT GTGCAACAAG TTCATAGCCT ATAGCACCGT
 551  CTTTGAGGAT GTAGTGGATG TGCTTGCTGA GTGGGGCTCC CTGTACGTGC
 601  TGACGCGGGA TGGGCGGGTC CACGCACTGC AGGAGAAGGA CACACAGACC
 651  AAACTGGAGA TGCTGTTTAA GAAGAACCTA TTTGAGATGG CGATTAACCT
 701  TGCCAAGAGC CAGCATCTGG ACAGTGATGG GCTGGCCCAG ATTTTCATGC
 751  AGTATGGAGA CCATCTCTAC AGCAAGGGCA ACCACGATGG GGCTGTCCAG
 801  CAATATATCC GAACCATTGG AAAGTTGGAG CCATCCTATG TGATCCGCAA
 851  GTTTCTGGAT GCCCAGCGCA TTCACAACCT GACTGCTACC TGCAGACCCT
 901  GCACCGACAA TCCCTGGCCA ATGCCGACCA TACCACCCTG CTCCTCAACT
 951  GCTATACCAA GCTCAAGGAC AGCTCGAAGC TGGAGGAGTT CATCAAGAAA
1001  AAGAGTGAGA GTGAAGTCCA CTTTGATGTG GAGACAGCCA TCAAGGTCCT
1051  CCGGCAGGCT GGCTACTACT CCCATGCCCT GTATCTGGCG GAGAACCATG
1101  CACATCATGA GTGGTACCTG AAGATCCAGC TAGAAGACAT TAAGAATTAT
1151  CAGGAAGCCC TTCGATACAT CGGCAAGCTG CCTTTTGAGC AGGCAGAGAG
1201  CAACATGAAG CGCTACGGCA AGATCCTCAT GCACCACATA CCAGAGCAGA
1251  CAACTCAGTT GCTGAAGGGA CTTTGTACTG ATTATCGGCC CAGCCTCGAA
1301  GGCCGCAGCG ATAGGGAGGC CCCAGGCTGC AGGGCCAACT CTGAGGAGTT
1351  CATCCCCATC TTTGCCAATA ACCCGCGAGA GCTGAAAGCC TTCCTAGAGC
1401  ACATGAGTGA AGTGCAGCCA GACTCACCCC AGGGGATCTA CGACACACTC
1451  CTTGAGCTGC GACTGCAGAA CTGGGCCCAC GAGAAGGATC CACAGGTCAA
1501  AGAGAAGCTT CACGCAGAGG CCATTTCCCT GCTGAAGAGT GGTCGCTTCT
1551  GCGACGTCTT TGACAAGGCC CTGGTCCTGT GCCAGATGCA CGACTTCCAG
1601  GATGGTGTCC TTTACCTTTA TGAGCAGGGG AAGCTGTTCC AGCAGATCAT
1651  GCACTACCAC ATGCAGCACG AGCAGTACCG GCAGGTCATC AGCGTGTGTG
1701  AGCGCCATGG GGAGCAGGAC CCCTCCTTGT GGGAGCAGGC CCTCAGCTAC
1751  TTCGCTCGCA AGGAGGAGGA CTGCAAGGAG TATGTGGCAG CTGTCCTCAA
1801  GCATATCGAG AACAAGAACC TCATGCCACC TCTTCTAGTG GTGCAGACCC
1851  TGGCCCACAA CTCCACAGCC ACACTCTCCG TCATCAGGGA CTACCTGGTC
1901  CAAAAACTAC AGAAACAGAG CCAGCAGATT GCACAGGATG AGCTGCGGGT
1951  GCGGCGGTAC CGAGAGGAGA CCACCCGTAT CCGCCAGGAG ATCCAAGAGC
2001  TCAAGGCCAG TCCTAAGATT TTCCAAAAGA CCAAGTGCAG CATCTGTAAC
2051  AGTGCCTTGG AGTTGCCCTC AGTCCACTTC CTGTGTGGCC ACTCCTTCCA
2101  CCAACACTGC TTTGAGAGTT ACTCGGAAAG TGATGCTGAC TGCCCCACCT
2151  GCCTCCCTGA AAACCGGAAG GTCATGGATA TGATCCGGGC CCAGGAACAG
2201  AAACGAGATC TCCATGATCA ATTCCAGCAT CAGCTCAAGT GCTCCAATGA
2251  CAGCTTTTCT GTGATTGCTG ACTACTTTGG CAGAGGTGTT TTCAACAAAT
2301  TGACTCTGCT GACCGACCCT CCCACAGCCA GACTGACCTC AGCCTGGAGG
2351  CTGGGCTGCA ACGCGACCTA CTCATGCACT CCAGGAGGGG CACTTAAGCA
2401  GCCTGGAGGA AGATGTGGGC AACAGTGGAG GACCAAGAGA ACAGACACAA
2451  TGGGACCTGG GCGGGCGTTA CACAGAAGGC TGGCTGACAT GCCCAGGGCT
2501  CCACTCTCAT CTAATGTCAC AGCCCTCAGA ACTAAAGCGG ACTTTCTTTC
2551  CCTGCCTTCT TATTTAGTCA GCTTGCCATC CCTCCTCTTC ACTAGCAGTG
2601  TAGATCATTC CAGATCAGTG GGGGAGGGCA CCTCAGCAAC CTCTGAGTGT
2651  GGACAATAGC TGCTTTCTTC TCTATCCAAG AGCACCAGGC TGTGCTTGGG
2701  TCCTTGCTCT CAGAGTCTAT AAATAAAAGA ATATAATGAA AAAAAAAAAA
2751  AAAAAA
B:氨基酸序列(SEQ ID NO:11)  长度:484个氨基酸
  1  MKRYGKILMH HIPEQTTQLL KGLCTDYRPS LEGRSDREAP GCRANSEEFI PIFANNPREL
 61  KAFLEHMSEV QPDSPQGIYD TLLELRLQNW AHEKDPQVKE KLHAEAISLL KSGRFCDVFD
121  KALVLCQMHD FQDGVLYLYE QGKLFQQIMH YHMQHEQYRQ VISVCERHGE QDPSLWEQAL
181  SYFARKEEDC KEYVAAVLKH IENKNLMPPL LVVQTLAHNS TATLSVIRDY LVQKLQKQSQ
241  QIAQDELRVR RYREETTRIR QEIQELKASP KIFQKTKCSI CNSALELPSV HFLCGHSFHQ
301  HCFESYSESD ADCPTCLPEN RKVMDMIRAQ EQKRDLHDQF QHQLKCSNDS FSVIADYFGR
361  GVFNKLTLLT DPPTARLTSA WRLGCNATYS CTPGGALKQP GGRCGQQWRT KRTDTMGPGR
421  ALHRRLADMP RAPLSSNVTA LRTKADFLSL PSYLVSLPSL LFTSSVDHSR SVGEGTSATS
481  ECGQ
C.核苷酸及氨基酸组合序列(SEQ ID NO:12)
克隆号:PP3476
起始编码子:1205ATG    终止编码子:2659TAG
蛋白质分子量:55359
  1    T ATC TTG TTT GAC TGT CCA TGA AAA TCT CAA CTT TAT GGC CAT TGG     46
 47  TTT CAC AGA TGG CAG TGT TAC ATT GAA CAA AGG AGA CAT CAC CCG GGA     94
 95  CCG GCA TAG CAA GAC CCA GAT TTT GCA CAA GGG CAA CTA TCC TGT AAC    142
143  TGG ATT GGC CTT TCG CCA AGC AGG AAA GAC CAC TCA CTT GTT TGT TGT    190
191  GAC AAC AGA GAA CGT CCA GTC CTA TAT AGT TTC TGG AAA AGA CTA CCC    238
239  TCG CGT GGA GTT GGA CAC CCA TGG TTG TGG CCT GCG CTG CTC AGC CCT    286
287  AAG TGA CCC TTC TCA GGA CCT GCA GTT CAT TGT GGC CGG GGA TGA GTG    334
335  TGT CTA CTT GTA CCA GCC TGA TGA ACG TGG GCC CTG CTT CGC CTT TGA    382
383  GGG CCA TAA GCT CAT TGC CCA CTG GTT TAG AGG CTA CCT TAT CAT TGT    430
431  CTC CCG TGA CCG GAA GGT TTC TCC CAA GTC AGA GTT TAC CAG CAG GGA    478
479  TTC ACA GAG CTC CGA CAA GCA GAT TCT AAA CAT CTA TGA CCT GTG CAA    526
527  CAA GTT CAT AGC CTA TAG CAC CGT CTT TGA GGA TGT AGT GGA TGT GCT    574
575  TGC TGA GTG GGG CTC CCT GTA CGT GCT GAC GCG GGA TGG GCG GGT CCA    622
623  CGC ACT GCA GGA GAA GGA CAC ACA GAC CAA ACT GGA GAT GCT GTT TAA    670
671  GAA GAA CCT ATT TGA GAT GGC GAT TAA CCT TGC CAA GAG CCA GCA TCT    718
719  GGA CAG TGA TGG GCT GGC CCA GAT TTT CAT GCA GTA TGG AGA CCA TCT    766
 767  CTA CAG CAA GGG CAA CCA CGA TGG GGC TGT CCA GCA ATA TAT CCG AAC     814
 815  CAT TGG AAA GTT GGA GCC ATC CTA TGT GAT CCG CAA GTT TCT GGA TGC     862
 863  CCA GCG CAT TCA CAA CCT GAC TGC TAC CTG CAG ACC CTG CAC CGA CAA     910
 911  TCC CTG GCC AAT GCC GAC CAT ACC ACC CTG CTC CTC AAC TGC TAT ACC     958
 959  AAG CTC AAG GAC AGC TCG AAG CTG GAG GAG TTC ATC AAG AAA AAG AGT    1006
1007  GAG AGT GAA GTC CAC TTT GAT GTG GAG ACA GCC ATC AAG GTC CTC CGG    1054
1055  CAG GCT GGC TAC TAC TCC CAT GCC CTG TAT CTG GCG GAG AAC CAT GCA    1102
1103  CAT CAT GAG TGG TAC CTG AAG ATC CAG CTA GAA GAC ATT AAG AAT TAT    1150
1151  CAG GAA GCC CTT CGA TAC ATC GGC AAG CTG CCT TTT GAG CAG GCA GAG    1198
1199  AGC AAC ATG AAG CGC TAC GGC AAG ATC CTC ATG CAC CAC ATA CCA GAG    1246
   1          Met Lys Arg Tyr Gly Lys Ile Leu Met His His Ile Pro Glu      14
1247  CAG ACA ACT CAG TTG CTG AAG GGA CTT TGT ACT GAT TAT CGG CCC AGC    1294
  15  Gln Thr Thr Gln Leu Leu Lys Gly Leu Cys Thr Asp Tyr Arg Pro Ser      30
1295  CTC GAA GGC CGC AGC GAT AGG GAG GCC CCA GGC TGC AGG GCC AAC TCT    1342
  31  Leu Glu Gly Arg Ser Asp Arg Glu Ala Pro Gly Cys Arg Ala Asn Ser      46
1343  GAG GAG TTC ATC CCC ATC TTT GCC AAT AAC CCG CGA GAG CTG AAA GCC    1390
  47  Glu Glu Phe Ile Pro Ile Phe Ala Asn Asn Pro Arg Glu Leu Lys Ala      62
1391  TTC CTA GAG CAC ATG AGT GAA GTG CAG CCA GAC TCA CCC CAG GGG ATC    1438
  63  Phe Leu Glu His Met Ser Glu Val Gln Pro Asp Ser Pro Gln Gly Ile      78
1439  TAC GAC ACA CTC CTT GAG CTG CGA CTG CAG AAC TGG GCC CAC GAG AAG    1486
  79  Tyr Asp Thr Leu Leu Glu Leu Arg Leu Gln Asn Trp Ala His Glu Lys      94
1487  GAT CCA CAG GTC AAA GAG AAG CTT CAC GCA GAG GCC ATT TCC CTG CTG    1534
  95  Asp Pro Gln Val Lys Glu Lys Leu His Ala Glu Ala Ile Ser Leu Leu     110
1535  AAG AGT GGT CGC TTC TGC GAC GTC TTT GAC AAG GCC CTG GTC CTG TGC    1582
 111  Lys Ser Gly Arg Phe Cys Asp Val Phe Asp Lys Ala Leu Val Leu Cys     126
1583  CAG ATG CAC GAC TTC CAG GAT GGT GTC CTT TAC CTT TAT GAG CAG GGG    1630
 127  Gln Met His Asp Phe Gln Asp Gly Val Leu Tyr Leu Tyr Glu Gln Gly     142
1631  AAG CTG TTC CAG CAG ATC ATG CAC TAC CAC ATG CAG CAC GAG CAG TAC    1678
 143  Lys Leu Phe Gln Gln Ile Met His Tyr His Met Gln His Glu Gln Tyr     158
1679  CGG CAG GTC ATC AGC GTG TGT GAG CGC CAT GGG GAG CAG GAC CCC TCC    1726
 159  Arg Gln Val Ile Ser Val Cys Glu Arg His Gly Glu Gln Asp Pro Ser     174
1727  TTG TGG GAG CAG GCC CTC AGC TAC TTC GCT CGC AAG GAG GAG GAC TGC    1774
 175  Leu Trp Glu Gln Ala Leu Ser Tyr Phe Ala Arg Lys Glu Glu Asp Cys     190
1775  AAG GAG TAT GTG GCA GCT GTC CTC AAG CAT ATC GAG AAC AAG AAC CTC    1822
 191  Lys Glu Tyr Val Ala Ala Val Leu Lys His Ile Glu Asn Lys Asn Leu     206
1823  ATG CCA CCT CTT CTA GTG GTG CAG ACC CTG GCC CAC AAC TCC ACA GCC    1870
 207  Met Pro Pro Leu Leu Val Val Gln Thr Leu Ala His Asn Ser Thr Ala     222
1871  ACA CTC TCC GTC ATC AGG GAC TAC CTG GTC CAA AAA CTA CAG AAA CAG    1918
 223  Thr Leu Ser Val Ile Arg Asp Tyr Leu Val Gln Lys Leu Gln Lys Gln     238
1919  AGC CAG CAG ATT GCA CAG GAT GAG CTG CGG GTG CGG CGG TAC CGA GAG    1966
 239  Ser Gln Gln Ile Ala Gln Asp Glu Leu Arg Val Arg Arg Tyr Arg Glu     254
1967  GAG ACC ACC CGT ATC CGC CAG GAG ATC CAA GAG CTC AAG GCC AGT CCT    2014
 255  Glu Thr Thr Arg Ile Arg Gln Glu Ile Gln Glu Leu Lys Ala Ser Pro     270
2015  AAG ATT TTC CAA AAG ACC AAG TGC AGC ATC TGT AAC AGT GCC TTG GAG    2062
 271  Lys Ile Phe Gln Lys Thr Lys Cys Ser Ile Cys Asn Ser Ala Leu Glu     286
2063  TTG CCC TCA GTC CAC TTC CTG TGT GGC CAC TCC TTC CAC CAA CAC TGC    2110
 287  Leu Pro Ser Val His Phe Leu Cys Gly His Ser Phe His Gln His Cys     302
2111  TTT GAG AGT TAC TCG GAA AGT GAT GCT GAC TGC CCC ACC TGC CTC CCT    2158
 303  Phe Glu Ser Tyr Ser Glu Ser Asp Ala Asp Cys Pro Thr Cys Leu Pro     318
2159  GAA AAC CGG AAG GTC ATG GAT ATG ATC CGG GCC CAG GAA CAG AAA CGA    2206
 319  Glu Asn Arg Lys Val Met Asp Met Ile Arg Ala Gln Glu Gln Lys Arg     334
2207  GAT CTC CAT GAT CAA TTC CAG CAT CAG CTC AAG TGC TCC AAT GAC AGC    2254
 335  Asp Leu His Asp Gln Phe Gln His Gln Leu Lys Cys Ser Asn Asp Ser     350
2255  TTT TCT GTG ATT GCT GAC TAC TTT GGC AGA GGT GTT TTC AAC AAA TTG    2302
 351  Phe Ser Val Ile Ala Asp Tyr Phe Gly Arg Gly Val Phe Asn Lys Leu     366
2303  ACT CTG CTG ACC GAC CCT CCC ACA GCC AGA CTG ACC TCA GCC TGG AGG    2350
 367  Thr Leu Leu Thr Asp Pro Pro Thr Ala Arg Leu Thr Ser Ala Trp Arg     382
2351  CTG GGC TGC AAC GCG ACC TAC TCA TGC ACT CCA GGA GGG GCA CTT AAG    2398
 383  Leu Gly Cys Asn Ala Thr Tyr Ser Cys Thr Pro Gly Gly Ala Leu Lys     398
2399  CAG CCT GGA GGA AGA TGT GGG CAA CAG TGG AGG ACC AAG AGA ACA GAC    2446
 399  Gln Pro Gly Gly Arg Cys Gly Gln Gln Trp Arg Thr Lys Arg Thr Asp     414
2447  ACA ATG GGA CCT GGG CGG GCG TTA CAC AGA AGG CTG GCT GAC ATG CCC    2494
 415  Thr Met Gly Pro Gly Arg Ala Leu His Arg Arg Leu Ala Asp Met Pro     430
2495  AGG GCT CCA CTC TCA TCT AAT GTC ACA GCC CTC AGA ACT AAA GCG GAC    2542
 431  Arg Ala Pro Leu Ser Ser Asn Val Thr Ala Leu Arg Thr Lys Ala Asp     446
2543  TTT CTT TCC CTG CCT TCT TAT TTA GTC AGC TTG CCA TCC CTC CTC TTC    2590
 447  Phe Leu Ser Leu Pro Ser Tyr Leu Val Ser Leu Pro Ser Leu Leu Phe     462
2591  ACT AGC AGT GTA GAT CAT TCC AGA TCA GTG GGG GAG GGC ACC TCA GCA    2638
 463  Thr Ser Ser Val Asp His Ser Arg Ser Val Gly Glu Gly Thr Ser Ala     478
2639  ACC TCT GAG TGT GGA CAA TAG CTG CTT TCT TCT CTA TCC AAG AGC ACC    2686
 479  Thr Ser Glu Cys Gly Gln ***                                         485
2687  AGG CTG TGC TTG GGT CCT TGC TCT CAG AGT CTA TAA ATA AAA GAA TAT    2734
2735  AAT GAA AAA AAA AAA AAA AAA A                                      2756
D.Blastp结果
Query=PP3476(484个氨基酸)
>SW:YRM2_CAEEL Q09600 caenorhabditis elegans.hypothetical 108.5 kd
             protein r06f6.2 in chromosome ii.2/1996
             长度=950个氨基酸
分值=111bits(276),预计值=7e-24
相同性=71/258(27%),相似性=121/258(46%),缺口=36/258(13%)
Query:120 DKALVLCQMHDFQDGVLYLYEQGKLFQQIMHYHMQHEQYRQVISVCERHGEQDPSLWEQA 179
           D AL + Q+ D    + ++  +    +++M YH +      +I +C+
Sbjct:643 DAALQMAQLFDCTPVIEHILMRCHKSKELMMYHQKKRDLEAIIRLCQS------------ 690
Query:180 LSYFARKEEDCKEYVAAVLKHIENKNLMPPLLVVQTLAHNSTATLSVIRDYLVXXXXXXX 239
                 KEE            IE    + PL+V++ LA N   T+S +RDY++
Sbjct:691 ----CSKEE------------IEASEQIHPLVVLELLAKNEHLTISSVRDYIIAWLRKQQ 734
Query:240 XXXXXDELRVRRYREETTRIRQEIQELKASPKIFQKTKCSICNSALELPSVHFLCGHSFH 299
                D   ++   +    +   ++ LK + +I Q TKCS C++ L+LP+VHFLC H++H
Sbjct:735 IIIEEDRNTIKENNKAMGELDGTVESLKFNAQIMQVTKCSACDTPLQLPTVHFLCKHAYH 794
Query:300 QHCFESYSESDAD-CPTCLPENRKVMDMIRAQEQKRDLHDQFQHQLKCSNDSFSVIADYF 358
            HCFESY+   +D CP C    +   D  R +E     + +FQ +L  +++   +IA Y
Sbjct:795 VHCFESYNMDGSDKCPAC----QTTRDTTRDEEIS---YHKFQKELAEASNGMELIAMYL 847
Query:359 GRGVFNKLTLLTDPPTAR 376
            RG+F++ T  T    A+
Sbjct:848 QRGLFDEKTKKTKKSEAK 865
>SW:END1_YEAST P12868 saccharomyces cerevisiae(baker′s yeast).
              vacuolar biogenesis protein end1(pep5 protein).7/1998
              长度=1029个氨基酸
分值=83.9bits(204),预计值=2e-15
相同性=59/229(25%),相似性=101/229(43%),缺口=19/229(8%)
Query:155 HEQYRQVISVCERHGEQDPSLWEQALSYFARKEEDCKEYVA------AVLKHIENKNLMP 208
           +E+    +   E++G ++P L + ALSYF   +   KE          VL+ I     MP
Sbjct:795 NEEPSTCLKFLEKYGTEEPKLLQVALSYFVSNKLIFKEMGGNEVLKEKVLRPIIEGERMP 854
Query:209 PLLVVQTLAHNSTATLSVIRDYLVXXXXXXXXXXXXDELRVRRY----REETTRIRQEIQ 264
            L +++ L+  + A   +I+D ++            +E  +  Y    +E+  +++  I
Sbjct:855 LLDIIKALSRTNVAHFGLIQDIIIDHVKTEDTEIKRNEKLIESYDKELKEKNKKLKNTIN 914
Query:265 ELKASPKIFQKTKCSICNSALELPSVHFLCGHSFHQHCF---ESYSESDA---DCPTCLP 318
             +      +   C +C   L++P V F CGH +HQHC    E   ES+     CP CL
Sbjct:915 SDQPLHVPLKNQTCFMCRLTLDIPVVFFKCGHIYHQHCLNEEEDTLESERKLFKCPKCLV 974
Query:319 ENRKVMDMIRAQE---QKRDLHDQFQHQLKCSNDSFSVIADYFGRGVFN 364
           +      +  AQ    +K DL +   +  + S D F VI ++ GRG  +
Sbjct:975 DLETSNKLFEAQHEVVEKNDLLNFALNSEEGSRDRFKVITEFLGRGAIS 1023
>SP_IN:076248 076248 drosophila melanogaster(fruit fly).light
             protein.11/1998
             长度=841个氨基酸
分值=44.9bits(104),预计值=0.001
相同性=39/222(17%),相似性=90/222(39%),缺口=27/222(12%)
Query:107 ISLLKSGRFCDVFDKALVLCQMHDFQDGVLYL------YEQGKLFQQIMHYHMQHEQYRQ 160
           +  LK  +  D+  +ALV+C+  +F   ++YL       E  +    I+H   +
Sbjct:626 LPFLKRSKDYDI-QEALVICKQENFYPEIVYLLGCMGGVEASEALNIIIH---RIRDIEM 681
Query:161 VISVCERHGEQDPSLWEQALSYFARKEEDCKEYVAAVLKHIENKNLMPPLLVVQTLAHNS 220
            I  C+ H + D  LW   ++ F++  E   + +  ++ +     ++  + + Q + +
Sbjct:682 AIEFCKEHDDSD--LWNALINEFSKHPEIVTKVLDGIVDYFSPAVVVGKIKMGQNIPNLR 739
Query:221 TATLSVIRDYLVXXXXXXXXXXXXDELRVRRYREETTRIRQEIQELKASPKIFQKTKCSI 280
            + + ++R Y               ++++  Y E  + I   +   +   ++  +  CS+
Sbjct:740 QSLIKMLRHY----NLQGEILSSAQQIQLNDYFEIHSEI---VTTQRRGQQVSYEQLCSL 792
Query:281 CNSALELPSVHFL------CGHSFHQHCFESYSESDADCPTC 316
           C+  + +   H        CGH +H+ C +   E   +C  C
Sbjct:793 CHRPVLMAGTHLYCIIRLECGHVYHKPCIQ--GELLKNCNEC 832
5.PP3731蛋白
A:核苷酸序列(SEQ ID NO:13)  长度:1946bp
   1  TGGCCGCCTC TGCTCCTCCC GACCGCAGCC CCTACCTCTC TCCCAGACTC
  51  CAGTCGCCCG TGCCCACCGC TGCCCACGTG GCCTCTTTCC AGGCAGCAGC
 101  CAGGGCTTCT GGCACGTCGG GCGCCAGCAC TGTCGCTTGT GGCCACGGCC
 151  CGCAGAGCTT CAGTCCCTTG AGCTCCTCCT CCAGAGCAGG GCCGAGGGTC
 201  TCGCCCCAGC CCGACTGGCT GTGCCTGCAG ATGATGCTGG TCACGCAGCT
 251  TTTCGTTTCC CGGAACGCAG GTGGGATAGC AGTGCCCTTT TCTGGCAGTG
 301  CGGCATTCTC TCTGGCAGTC ATTCCGCCCG GAGAGGCTCA TCTTGGGCGG
 351  TTCTGGGCGA CAGCTGTGTG GCTGCACAGT GGCCAGTGAG AGGCATCTGG
 401  GAAGGTGGCC CTTGTGTAGG GAGTCACTCT CCTTCCGTCA CGGTCACACC
 451  TCATGAAATG GTTAGATTCT TCCAAGTGCC TTCTACGCCC CTGGCAGATT
 501  TTCTAGAATT TGCCGTCCCA GAAGCTTGAG AAGTGTCCAG TGCCACCCGA
 551  CAGCAGAAGC CGGGATGCCG CTGAGACGCC AGCGCTTCTG AGTCCCTCTC
 601  ACTGCCTGCC TTCTGGTGGA GAGAAGGCTG TCCTGCGGGC TTATGCCCTC
 651  CCCACGCTCC TCGCACCGTT CACGCCATTG TGCAGCACAG CTGTTAGGAC
 701  CAAATTCATC TTCCCCGCAA GGACGAGTCA GGCCCAGTGT TGCACTGGTC
 751  CTGCTGTCTG GCTTCTGCTG CGGAACTTCC TCACCTTCCA GGCAGGGCCC
 801  AGGAGCCACA GGAGCGTGGG CGGGGCAGGG TCTGCCCTCT GTGCTTCCGA
 851  CTCGCCGCTT GTGAGCTGGA GGGACAGTCA CCTCGACCTG GTGGGCTGGG
 901  TGGGCCTGGC TGTGCTGTGG GCTGTGCCTC ACTCCTGCAA GTGGGCACTC
 951  AGCGGGGTTG GGGTCACGAG GCTGAGGTCG GCTTAAAGCA GGAGTGGGCA
1001  GTTGGCACGT CATGTTTCTC CTGCATCAGG GCTGTGGCAG GAATGCCGGG
1051  TGACTACCGT AGACACTTGT CAAGGCTGAG GTTCAGAGAA AGGTGTGGGG
1101  TATCCCGGAG GTCACCACAG TGTGCCAGGA GGTTCAGGTT GGCCTTCCAG
1151  AGCCCGGCCT GTGTGAAATC CCCACGAGCA CAGAGGACAG AACGAAACAT
1201  GGTGTTGTTT TGAGACAGGG TGTTACTGTG TCACCCAGGC TGGAGTAGAG
1251  TGGTGCCACA TTTTTTGTAG AGACGGGGTG TCCCTGTGTA GCCCAGGCTG
1301  GTCTTGAACT CCTGGGTACA AGCAGTCCTC CCTCGTGGGC CTCCCAAAGT
1351  GCTGGGATTA CAGGCGTGGG CTCCCGTGAC CAGCCTGGAA CGTGCTGATG
1401  AGCCTCTTTT TCTCCTGAAA CCCCGGTGGG AACAGATGGT GGATGCTTCC
1451  AAAAGCATCG AAGCTGTCCA TGAGGACATC CGCGTGCTCT CTGAGGACGC
1501  CATCCGCACT GCCACAGAGA AGCCGCTGGG GGAGCTATGG AAGTGACCCA
1551  AGGCTGCCAC TGGAGACGCC TCTCCCTGCA GTCCCCCGAG AGGTGGGAGA
1601  CTCGCGGAAG GCCCTGTCCC CAGCGGAGTC CAGACCCCAC AACTTCAGGA
1651  GCTCTTTCCC GGCAGCAGAG ATCTGCAGGC TGCCTCTTCT GCCCCGGAGC
1701  TGGGGTGCAC TGGGGACCCC CGTGGTGGGG ACCTTGGCAG TGTGGACATG
1751  AGCAGAGCGA TGGAGCAGTC TCCTGCCCTC TCCCCTGTCC TGATGGCACT
1801  CTGTTGTATT TTCTTACTGA AGTTCAGTGA TAACTCTGAG CAGTTTCATT
1851  GTGATCACTG TAAATGGTAA TCAGTTGGAA TTCTCCTAAA TGTCTTCCAG
1901  ACACTAGTAA AAAACGACCT GAAAATTGAA AAAAAAAAAA AAAA
B:氨基酸序列(SEQ ID NO:14)  长度:102个氨基酸
 1  MLPKASKLSM RTSACSLRTP SALPQRSRWG SYGSDPRLPL ETPLPAVPRE VGDSRKALSP
61  AESRPHNFRS SFPAAEICRL PLLPRSWGAL GTPVVGTLAV WT
C.核苷酸及氨基酸组合序列(SEQ ID NO:15)
克隆号:PP3731
起始编码子:1443ATG    终止编码子:1751TGA
蛋白质分子量:11049
   1   TG GCC GCC TCT GCT CCT CCC GAC CGC AGC CCC TAC CTC TCT CCC AGA      47
  48  CTC CAG TCG CCC GTG CCC ACC GCT GCC CAC GTG GCC TCT TTC CAG GCA      95
  96  GCA GCC AGG GCT TCT GGC ACG TCG GGC GCC AGC ACT GTC GCT TGT GGC     143
 144  CAC GGC CCG CAG AGC TTC AGT CCC TTG AGC TCC TCC TCC AGA GCA GGG     191
 192  CCG AGG GTC TCG CCC CAG CCC GAC TGG CTG TGC CTG CAG ATG ATG CTG     239
 240  GTC ACG CAG CTT TTC GTT TCC CGG AAC GCA GGT GGG ATA GCA GTG CCC     287
 288  TTT TCT GGC AGT GCG GCA TTC TCT CTG GCA GTC ATT CCG CCC GGA GAG     335
 336  GCT CAT CTT GGG CGG TTC TGG GCG ACA GCT GTG TGG CTG CAC AGT GGC     383
 384  GAG TGA GAG GCA TCT GGG AAG GTG GCC CTT GTG TAG GGA GTC ACT CTC     431
 432  CTT CCG TCA CGG TCA CAC CTC ATG AAA TGG TTA GAT TCT TCC AAG TGC     479
 480  CTT CTA CGC CCC TGG CAG ATT TTC TAG AAT TTG CCG TCC CAG AAG CTT     527
 528  GAG AAG TGT CCA GTG CCA CCC GAC AGC AGA AGC CGG GAT GCC GCT GAG     575
 576  ACG CCA GCG CTT CTG AGT CCC TCT CAC TGC CTG CCT TCT GGT GGA GAG     623
 624  AAG GCT GTC CTG CGG GCT TAT GCC CTC CCC ACG CTC CTC GCA CCG TTC     671
 672  ACG CCA TTG TGC AGC ACA GCT GTT AGG ACC AAA TTC ATC TTC CCC GCA     719
 720  AGG ACG AGT CAG GCC CAG TGT TGC ACT GGT CCT GCT GTC TGG CTT CTG     767
 768  CTG CGG AAC TTC CTC ACC TTC CAG GCA GGG CCC AGG AGC CAC AGG AGC     815
 816  GTG GGC GGG GCA GGG TCT GCC CTC TGT GCT TCC GAC TCG CCG CTT GTG     863
 864  AGC TGG AGG GAC AGT CAC CTC GAC CTG GTG GGC TGG GTG GGC CTG GCT     911
 912  GTG CTG TGG GCT GTG CCT CAC TCC TGC AAG TGG GCA CTC AGC GGG GTT     959
 960  GGG GTC ACG AGG CTG AGG TCG GCT TAA AGC AGG AGT GGG CAG TTG GCA    1007
1008  CGT CAT GTT TCT CCT GCA TCA GGG CTG TGG CAG GAA TGC CGG GTG ACT    1055
1056  ACC GTA GAC ACT TGT CAA GGC TGA GGT TCA GAG AAA GGT GTG GGG TAT    1103
1104  CCC GGA GGT CAC CAC AGT GTG CCA GGA GGT TCA GGT TGG CCT TCC AGA    1151
1152  GCC CGG CCT GTG TGA AAT CCC CAC GAG CAC AGA GGA CAG AAC GAA ACA    1199
1200  TGG TGT TGT TTT GAG ACA GGG TGT TAC TGT GTC ACC CAG GCT GGA GTA    1247
1248  GAG TGG TGC CAC ATT TTT TGT AGA GAC GGG GTG TCC CTG TGT AGC CCA    1295
1296  GGC TGG TCT TGA ACT CCT GGG TAC AAG CAG TCC TCC CTC GTG GGC CTC    1343
1344  CCA AAG TGC TGG GAT TAC AGG CGT GGG CTC CCG TGA CCA GCC TGG AAC    1391
1392  GTG CTG ATG AGC CTC TTT TTC TCC TGA AAC CCC GGT GGG AAC AGA TGG    1439
1440  TGG ATG CTT CCA AAA GCA TCG AAG CTG TCC ATG AGG ACA TCC GCG TGC    1487
   1      Met Leu Pro Lys Ala Ser Lys Leu Ser Met Arg Thr Ser Ala Cys      15
1488  TCT CTG AGG ACG CCA TCC GCA CTG CCA CAG AGA AGC CGC TGG GGG AGC    1535
  16  Ser Leu Arg Thr Pro Ser Ala Leu Pro Gln Arg Ser Arg Trp Gly Ser      31
1536  TAT GGA AGT GAC CCA AGG CTG CCA CTG GAG ACG CCT CTC CCT GCA GTC    1583
  32  Tyr Gly Ser Asp Pro Arg Leu Pro Leu Glu Thr Pro Leu Pro Ala Val      47
1584  CCC CGA GAG GTG GGA GAC TCG CGG AAG GCC CTG TCC CCA GCG GAG TCC    1631
  48  Pro Arg Glu Val Gly Asp Ser Arg Lys Ala Leu Ser Pro Ala Glu Ser      63
1632  AGA CCC CAC AAC TTC AGG AGC TCT TTC CCG GCA GCA GAG ATC TGC AGG    1679
  64  Arg Pro His Asn Phe Arg Ser Ser Phe Pro Ala Ala Glu Ile Cys Arg      79
1680  CTG CCT CTT CTG CCC CGG AGC TGG GGT GCA CTG GGG ACC CCC GTG GTG    1727
  80  Leu Pro Leu Leu Pro Arg Ser Trp Gly Ala Leu Gly Thr Pro Val Val      95
1728  GGG ACC TTG GCA GTG TGG ACA TGA GCA GAG CGA TGG AGC AGT CTC CTG    1775
  96  Gly Thr Leu Ala Val Trp Thr ***                                     103
1776  CCC TCT CCC CTG TCC TGA TGG CAC TCT GTT GTA TTT TCT TAC TGA AGT    1823
1824  TCA GTG ATA ACT CTG AGC AGT TTC ATT GTG ATC ACT GTA AAT GGT AAT    1871
1872  CAG TTG GAA TTC TCC TAA ATG TCT TCC AGA CAC TAG TAA AAA ACG ACC    1919
1920  TGA AAA TTG AAA AAA AAA AAA AAA AAA                                1946
6.PP3856蛋白
A:核苷酸序列(SEQ ID NO:16)长度:1198bp
   1  GCCGCATCCA GGCGAGCGGG CAGCCTTTGT GGCCTATGCC TTGGCTTTTC
  51  CCCGGGCCTT CCAGGGCCTC CTGGACACCT ACAGCGTGTG GAGGAGTGGT
 101  CTCCCCAACT TCCTAGCAGT CGCCCTGGCC CTGGGAGAGC TGGGCTACCG
 151  GGCAGTGGGC GTGAGGCTGG ACAGTGGTGA CCTGCTACAG CAGGCTCAGG
 201  AGATCCGCAA GGTCTTCCGA GCTGCTGCAG CCCAGTGAGT TTCCCGGGGA
 251  GGAGGTGTGC CTGGTGGGAG ATCCCCGGGG TTTGGGAATG GGCAGGGAAG
 301  GACAGTGAGG TACTCTGCTG AAGTTTCAGC GGTGATACTG TAGGCCGTGG
 351  CAGGGAAGTA AGTGGTGGGG CTCCCTAGGA GCTCCCAAGC AGAAGGTGAG
 401  CACAGGTGTC CTTGACTGAG GCGGGGCGGG GAGCAGGGGG ACACCAGGGT
 451  GAATCAGGAA GACCCGAGGG GTGGCCCCCA CCCTTTCTCC ACCCACGCGG
 501  CAGGTTCCAG GTGCCCTGGC TGGAGTCAGT CCTCATCGTA GTCAGCAACA
 551  ACATTGACGA GGAGGCGCTG GCCCGACTGG CCCAGGAGGG CAGTGAGGTG
 601  AATGTCATTG GCATTGGCAC CAGTGTGGTC ACCTGCCCCC AACAGCCTTC
 651  CCTGGGTGGT GTCTATAAGC TGGTGGCCGT GGGGGGCCAG CCACGAATGA
 701  AGCTGACCGA GGACCCCGAG AAGCAGACGT TGCCTGGGAG CAAGGCTGCT
 751  TTCCGGCTCC TGGGCTCTGA CGGGTCTCCA CTCATGGACA TGCTGCAGTT
 801  AGCAGAAGAG CCAGTGCCAC AGGCTGGGCA GGAGCTGAGG GTGTGGCCTC
 851  CAGGGGCCCA GGAGCCCTGC ACCGTGAGGC CAGCCCAGGT GGAGCCACTA
 901  CTGCGGCTCT GCCTCCAGCA GGGACAGCTG TGTGAGCCGC TCCCATCCCT
 951  GGCAGAGTAT AGAGCCTTGG CCCAGCTGTC CCTGAGCCGA CTCAGCCCTG
1001  AGCACAGGCG GCTGCGGAGC CCTGCCCAGT ACCAGGTGGT GCTGTCCGAA
1051  AGGCTGCAGG CCCTGGTGAA CAGTCTGTGT GCGGGGCAGT CCCCCTGAGA
1101  CTCGGAGCGG GGCTGACTGG AAACAACACG AATCACTCAC TTTTCCCCAA
1151  AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAA
B:氨基酸序列(SEQ ID NO:17)  长度:133个氨基酸
  1  MKLTEDPEKQ TLPGSKAAFR LLGSDGSPLM DMLQLAEEPV PQAGQELRVW PPGAQEPCTV
 61  RPAQVEPLLR LCLQQGQLCE PLPSLAEYRA LAQLSLSRLS PEHRRLRSPA QYQVVLSERL
121  QALVNSLCAG QSP
C.核苷酸及氨基酸组合序列(SEQ ID NO:18)
克隆号:PP3856
起始编码子:697ATG    终止编码子:1098TGA
蛋白质分子量:14620
   1  GCC GCA TCC AGG CGA GCG GGC AGC CTT TGT GGC CTA TGC CTT GGC TTT      48
  49  TCC CCG GGC CTT CCA GGG CCT CCI GGA CAC CTA CAG CGT GTG GAG GAG      96
  97  TGG TCT CCC CAA CTT CCT AGC AGT CGC CCT GGC CCT GGG AGA GCT GGG     144
 145  CTA CCG GGC AGT GGG CGT GAG GCT GGA CAG TGG TGA CCT GCT ACA GCA     192
 193  GGC TCA GGA GAT CCG CAA GGT CTT CCG AGC TGC TGC AGC CCA GTG AGT     240
 241  TTC CCG GGG AGG AGG TGT GCC TGG TGG GAG ATC CCC GGG GTT TGG GAA     288
 289  TGG GCA GGG AAG GAC AGT GAG GTA CTC TGC TGA AGT TTC AGC GGT GAT     336
 337  ACT GTA GGC CGT GGC AGG GAA GTA AGT GGT GGG GCT CCC TAG GAG CTC     384
 385  CCA AGC AGA AGG TGA GCA CAG GTG TCC TTG ACT GAG GCG GGG CGG GGA     432
 433  GCA GGG GGA CAC CAG GGT GAA TCA GGA AGA CCC GAG GGG TGG CCC CCA     480
 481  CCC TTT CTC CAC CCA CCC GGC AGG TTC CAG GTG CCC TGG CTG GAG TCA     528
 529  GTC CTC ATC GTA GTC AGC AAC AAC ATT GAC GAG GAG GCG CTG GCC CGA     576
 577  CTG GCC CAG GAG GGC AGT GAG GTG AAT GTC ATT GGC ATT GGC ACC AGT     624
 625  GTG GTC ACC TGC CCC CAA CAG CCT TCC CTG GGT GGT GTC TAT AAG CTG     672
 673  GTG GCC GTG GGG GGC CAG CCA CGA ATG AAG CTG ACC GAG GAC CCC GAG     720
   1                                  Met Lys Leu Thr Glu Asp Pro Glu       8
 721  AAG CAG ACG TTG CCT GGG AGC AAG GCT GCT TTC CGG CTC CTG GGC TCT     768
   9  Lys Gln Thr Leu Pro Gly Ser Lys Ala Ala Phe Arg Leu Leu Gly Ser      24
 769  GAC GGG TCT CCA CTC ATG GAC ATG CTG CAG TTA GCA GAA GAG CCA GTG     816
  25  Asp Gly Ser Pro Leu Met Asp Met Leu Gln Leu Ala Glu Glu Pro Val      40
 817  CCA CAG GCT GGG CAG GAG CTG AGG GTG TGG CCT CCA GGG GCC CAG GAG     864
  41  Pro Gln Ala Gly Gln Glu Leu Arg Val Trp Pro Pro Gly Ala Gln Glu      56
 865  CCC TGC ACC GTG AGG CCA GCC CAG GTG GAG CCA CTA CTG CGG CTC TGC     912
  57  Pro Cys Thr Val Arg Pro Ala Gln Val Glu Pro Leu Leu Arg Leu Cys      72
 913  CTC CAG CAG GGA CAG CTG TGT GAG CCG CTC CCA TCC CTG GCA GAG TAT     960
  73  Leu Gln Gln Gly Gln Leu Cys Glu Pro Leu Pro Ser Leu Ala Glu Tyr      88
 961  AGA GCC TTG GCC CAG CTG TCC CTG AGC CGA CTC AGC CCT GAG CAC AGG    1008
  89  Arg Ala Leu Ala Gln Leu Ser Leu Ser Arg Leu Ser Pro Glu His Arg     104
1009  CGG CTG CGG AGC CCT GCC CAG TAC CAG GTG GTG CTG TCC GAA AGG CTG    1056
 105  Arg Leu Arg Ser Pro Ala Gln Tyr Gln Val Val Leu Ser Glu Arg Leu     120
1057  CAG GCC CTG GTG AAC AGT CTG TGT GCG GGG CAG TCC CCC TGA GAC TCG    1104
 121  Gln Ala Leu Val Asn Ser Leu Cys Ala Gly Gln Ser Pro ***             134
1105  GAG CGG GGC TGA CTG GAA ACA ACA CGA ATC ACT CAC TTT TCC CCA AAA    1152
1153  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA A      1198
7.PP3958蛋白
A:核苷酸序列(SEQ ID NO:19)  长度:1643bp
   1  GAAAGTTTTA AGCCCTTTTA GAAACCTAAT CATCACCAGT GGAGGTGATC
  51  TTGAGAAGGG GTGAGCATCC CGAGAATGGC CACGATTCAG AATGAGCCAG
 101  TCCCGTGTGG GGGCTGTAGA GAAGCGTGAT CAGAGCATAG TGTCCCTGGA
 151  TGGATGGGCT ATGGAGGCTT TCCCTGCCTC TTTCTAGGCC CGCCTTTCTT
 201  CCTCCCAACT CTTGACTCTG CAGCTCTTGG GGTGAAGCCT TATTCCTGAT
 251  GCTCCAGACG ATCACCATCT GCTTCCTGGT CATGCACTAC AGAGGACAGA
 301  CTGTGAAAGG TGCTGGGGAC TTACCCAAGA GCAGGCTGTG TGGTTCCTGG
 351  GAACCCTGCT GGGAACTCAG GTCTGGGAAA GCCAAATGAT GTGGAGAGAT
 401  TGACAAGGAC TCCTGTCTCC CCACCCCTAG GTGTCGCTTT CCTCGCTTGC
 451  TACGGCCTGG TCCTGCTGGT GCTTCTCTCA CCTCTGACGC CCTTGACTGT
 501  AGTCACCCTG CTCCAGGCCT CCAATGTGCC TGCTGTGGTG GTGGGGAGGG
 551  TGGGTACCAG GAGCAAGGGA CAAGATGTTG TGGGGGCAGG GTCGGGGGGA
 601  AGAGTAGAAG ATCAAAGTGT GGGGGTGTTG TACTTGGGGG AGCATGGGAA
 651  GAGCTCAGGT GACAGAGCCA AAGGTCTCAA CTCCTCCCCT AGCTTCTCCA
 701  GGCAGCCACC AACTACCACA ACGGGCACAC AGGCCAGCTC TCAGCCATCA
 751  CAGTCTTCCT GCTGTTTGGG GGCTCCCTGG CCCGAATCTT CACTTCCATT
 801  CAGGAAACCG GAGATCCCCT GATGGCTGGG ACCTTTGTGG TCTCCTCTCT
 851  CTGCAACGGC CTCATCGCCG CCCAGCTGCT CTTCTACTGG AATGCAAAGC
 901  CTCCCCACAA GCAGAAAAAG GCGCAGTAGA GCCAGCTACT GGAGTCATTC
 951  CGTTTCCACT CATTCACCCA ACCTCAGGGT TCTCCCCATC TGAGCCAGCC
1001  TGCTGGTGTG ACTTACTCAT CCTCCATTCC TCTGCACTTG CAGACTTTCT
1051  GAGCCAGGGT TTTCTTTTAG TGGAAACAAA TGGTTGATGG ATCCAGATCC
1101  TTAGAAAAGG AGAGGATGGG GGTAGAGTCT CCCAAGCCAA AATTTTGACA
1151  TTTGAGTGCT TTCGTAAGCC CTGTACATGT ACTATTAATT CAGTCTGTAA
1201  TGCTGGAGCT AGTGGCATTG ACTGGGACCA TGGTCTACAG CATCACTAAC
1251  AACTTCCCAT TCAGGTGAGG GGCCCACCCT TCCACCCCAA GGGTAATACC
1301  CACAACTCTA ATGGGGATTA AGGTGAAGGA GGTTACAAGG CAGCAAAGTG
1351  GCCGGGCCCA GTGGCTTGCA CCTGTAACCC CAGCACTTTG GGAGGCCGAG
1401  GCGGGTGGAT CACCTGAGGT CAGGAGTTCG AACTGGCCAA CATGGTGAAA
1451  CCCCGTCTCT ACTAAAAATA CAAAATTAGC TGGGTGTGGT GATGGGCACC
1501  TGTAATCCCA GCTACTTGGG AGGCTGAGGC AGGAGAATCA CTTGAACCTG
1551  GGAGGCAGAG GTTGCAGTGA GCCAAGATTG CGCCACTGCA CTCCAGCCTG
1601  GGCAACAAGA GCGAAACTCA GTCTTAAAAA AAAAAAAAAA AAA
B:氨基酸序列(SEQ ID NO:20)  长度:147个氨基酸
  1  MGRAQVTEPK VSTPPLASPG SHQLPQRAHR PALSHHSLPA VWGLPGPNLH FHSGNRRSPD
 61  GWDLCGLLSL QRPHRRPAAL LLECKASPQA EKGAVEPATG VIPFPLIHPT SGFSPSEPAC
121  WCDLLILHSS ALADFLSQGF LLVETNG
C.核苷酸及氨基酸组合序列(SEQ ID NO:21)
克隆号:PP3958
起始编码子:644ATG    终止编码子:1087TGA
蛋白质分子量:15717
   1    G AAA GTT TTA AGC CCT TTT AGA AAC CTA ATC ATC ACC AGT GGA GGT      46
  47  GAT CTT GAG AAG GGG TGA GCA TCC CGA GAA TGG CCA CGA TTC AGA ATG      94
  95  AGC CAG TCC CGT GTG GGG GCT GTA GAG AAG CGT GAT CAG AGC ATA GTG     142
 143  TCC CTG GAT GGA TGG GCT ATG GAG GCT TTC CCT GCC TCT TTC TAG GCC     190
 191  CGC CTT TCT TCC TCC CAA CTC TTG ACT CTG CAG CTC TTG GGG TGA AGC     238
 239  CTT ATT CCT GAT GCT CCA GAC GAT CAC CAT CTG CTT CCT GGT CAT GCA     286
 287  CTA CAG AGG ACA GAC TGT GAA AGG TGC TGG GGA CTT ACC CAA GAG CAG     334
 335  GCT GTG TGG TTC CTG GGA ACC CTG CTG GGA ACT CAG GTC TGG GAA AGC     382
 383  CAA ATG ATG TGG AGA GAT TGA CAA GGA CTC CTG TCT CCC CAC CCC TAG     430
 431  GTG TCG CTT TCC TCG CTT GCT ACG GCC TGG TCC TGC TGG TGC TTC TCT     478
 479  CAC CTC TGA CGC CCT TGA CTG TAG TCA CCC TGC TCC AGG CCT CCA ATG     526
 527  TGC CTG CTG TGG TGG TGG GGA GGG TGG GTA CCA GGA GCA AGG GAC AAG     574
 575  ATG TTG TGG GGG CAG GGT CGG GGG GAA GAG TAG AAG ATC AAA GTG TGG     622
 623  GGG TGT TGT ACT TGG GGG AGC ATG GGA AGA GCT CAG GTG ACA GAG CCA     670
   1                              Met Gly Arg Ala Gln Val Thr Glu Pro       9
 671  AAG GTC TCA ACT CCT CCC CTA GCT TCT CCA GGC AGC CAC CAA CTA CCA     718
  10  Lys Val Ser Thr Pro Pro Leu Ala Ser Pro Gly Ser His Gln Leu Pro      25
 719  CAA CGG GCA CAC AGG CCA GCT CTC AGC CAT CAC AGT CTT CCT GCT GTT     766
  26  Gln Arg Ala His Arg Pro Ala Leu Ser His His Ser Leu Pro Ala Val      41
 767  TGG GGG CTC CCT GGC CCG AAT CTT CAC TTC CAT TCA GGA AAC CGG AGA     814
  42  Trp Gly Leu Pro Gly Pro Asn Leu His Phe His Ser Gly Asn Arg Arg      57
 815  TCC CCT GAT GGC TGG GAC CTT TGT GGT CTC CTC TCT CTG CAA CGG CCT     862
  58  Ser Pro Asp Gly Trp Asp Leu Cys Gly Leu Leu Ser Leu Gln Arg Pro      73
 863  CAT CGC CGC CCA GCT GCT CTT CTA CTG GAA TGC AAA GCC TCC CCA CAA     910
  74  His Arg Arg Pro Ala Ala Leu Leu Leu Glu Cys Lys Ala Ser Pro Gln      89
 911  GCA GAA AAA GGC GCA GTA GAG CCA GCT ACT GGA GTC ATT CCG TTT CCA     958
  90  Ala Glu Lys Gly Ala Val Glu Pro Ala Thr Gly Val Ile Pro Phe Pro     105
 959  CTC ATT CAC CCA ACC TCA GGG TTC TCC CCA TCT GAG CCA GCC TGC TGG    1006
 106  Leu Ile His Pro Thr Ser Gly Phe Ser Pro Ser Glu Pro Ala Cys Trp     121
1007  TGT GAC TTA CTC ATC CTC CAT TCC TCT GCA CTT GCA GAC TTT CTG AGC    1054
 122  Cys Asp Leu Leu Ile Leu His Ser Ser Ala Leu Ala Asp Phe Leu Ser     137
1055  CAG GGT TTT CTT TTA GTG GAA ACA AAT GGT TGA TGG ATC CAG ATC CTT    1102
 138  Gln Gly Phe Leu Leu Val Glu Thr Asn Gly ***                         148
1103  AGA AAA GGA GAG GAT GGG GGT AGA GTC TCC CAA GCC AAA ATT TTG ACA    1150
1151  TTT GAG TGC TTT CGT AAG CCC TGT ACA TGT ACT ATT AAT TCA GTC TGT    1198
1199  AAT GCT GGA GCT AGT GGC ATT GAC TGG GAC CAT GGT CTA CAG CAT CAC    1246
1247  TAA CAA CTT CCC ATT CAG GTG AGG GGC CCA CCC TTC CAC CCC AAG GGT    1294
1295  AAT ACC CAC AAC TCT AAT GGG GAT TAA GGT GAA GGA GGT TAC AAG GCA    1342
1343  GCA AAG TGG CCG GGC CCA GTG GCT TGC ACC TGT AAC CCC AGC ACT TTG    1390
1391  GGA GGC CGA GGC GGG TGG ATC ACC TGA GGT CAG GAG TTC GAA CTG GCC    1438
1439  AAC ATG GTG AAA CCC CGT CTC TAC TAA AAA TAC AAA ATT AGC TGG GTG    1486
1487  TGG TGA TGG GCA CCT GTA ATC CCA GCT ACT TGG GAG GCT GAG GCA GGA    1534
1535  GAA TCA CTT GAA CCT GGG AGG CAG AGG TTG CAG TGA GCC AAG ATT GCG    1582
1583  CCA CTG CAC TCC AGC CTG GGC AAC AAG AGC GAA ACT CAG TCT TAA AAA    1630
1631  AAA AAA AAA AAA A                                                  1643
8.PP3971蛋白
A:核苷酸序列(SEQ ID NO:22)  长度:1588bp
   1  TGGCTCAACA ATGCCTTCCA GGATGTGGAG TCAGAGAACG TCAACGTGGT
  51  GAAGCGGCTG TTCAAGATCC AGAACCTCAA TGCCAGCACC GTCCGCACGG
 101  TGATGGTGGC CGACTGCAGC CGCTTCGACA GCCCTGACCT GCTGCTGGAA
 151  GCCGGTGACC CGCCACGTCC CCCTGCCGCA TCTTTGACCT GGGCAGCGAC
 201  AACGAGGAGG TGGTGGCTGG CCCGGCCCCC GCCCACGCCA AGGAGGGCTT
 251  GCGGCACTTT CTGGACCGCG TGCTGGAGGG GCGGGCGCAC AGCAGCTGTC
 301  GGAGCGCATC TAGAGACCAA GGTGGCCGAG CTGCTGGCCC AGGGCACACC
 351  AAGCCACCCG AGCGCAGTGC CACAGGCGCC AAGAGCAAGT ACCTCATCTT
 401  CACCACTGGC TGCCTCACCT ACTCCCCACA CCAGATCGGC ATCAAGCAGA
 451  TCCTGCCACA CCAGATGACC ACGGCAGGGC CCGTGCTGGG TGAGGGCCGG
 501  GGCTCCGATG CCTTCTTCGA CGCGCTGGAC CACGTCATAG ACATACACGG
 551  ACACATCATC GGCATGGGCC TGTCGCCCGA CAACAGGTAC CTGTACGTGA
 601  ACAGCCGCGC CTGGCCCAAC GGTGCGGTGG TGGCCGACCC CATGCAGCCG
 651  CCACCAATCG CGGAGGAGAT TGACCTGCTG GTGTTCGACC TCAAGACCAT
 701  GCGGGAGGTG AGGCGGGCTC TGCGTGCGCA CCGCGCCTAC ACGCCCAACG
 751  ACGAGTGCTT CTTCATCTTC CTGGACGTCA GCAGGGACTT CGTGGCCAGC
 801  GGGGCGGAGG ACCGGCACGG CTACATCTGG GACCGCCACT ACAACATCTG
 851  TCTGGCCAGG CTGCGGCACG AGGATGTGGT CAACTCAGTG GTCTTCAGTC
 901  CCCAGGAGCA GGAGCTGCTG CTCACGGCCA GCGACGACGC CACCATCAAA
 951  GCCTGGCGCT CCCCACGCAC CATGCGCGTC CTCCAGGCAC CTCGCCCACG
1001  GCCTCGCACC TTCTTCTCCT GGCTTGCCAG CCAGAGGCGC TTGAGGTGTG
1051  CTGGGTGCAC TGGAGCCACC GGGACCCCTT GAGGACATCG CCAGGCTCTG
1101  TGGCTTTTTC CCGAGCGGGA GAGGTGGAGA TGCTTATAGC AGTTACGCCT
1151  TAGGAAGGGG ACAACCAGGC CCCGCCACAC GCTCACACAC AAACCTGCTC
1201  ACGCAGCTGT GATGCTTGGC ACGGGGTGGC CAGTGCAGAT GGAGCCCAAG
1251  GCCCCCTCGG CCTCCTGGGC AACTTGGGGT ACACAGGATA CTGGGGGTGC
1301  CGCTCCTCAC TCAACCCCAG GCTAGGGGTA CACCTTGACC CAGCTGGCCT
1351  CGGCCCGGGG CACCTTCGGC TGGTCCTGTG GGGCCCTGGA CGGTGGCCCA
1401  GTGGTGGCAG GGGCTGCTCC TGGCTGTGGT TGTGCGCCCG GGGCTTGGGA
1451  GCGGCCGGTC ACGCTGCTGT GGGCCCGAGT GTGTTGCATG TCCACGCACC
1501  ACCCGTTCAG GGCCCTGAAT AAACAGTTGG CAACAGCAAA AAAAAAAAAA
1551  AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAA
B:氨基酸序列(SEQ ID NO:23)  长度:205个氨基酸
  1  MTTAGPVLGE GRGSDAFFDA LDHVIDIHGH IIGMGLSPDN RYLYVNSRAW PNGAVVADPM
 61  QPPPIAEEID LLVFDLKTMR EVRRALRAHR AYTPNDECFF IFLDVSRDFV ASGAEDRHGY
121  IWDRHYNICL ARLRHEDVVN SVVFSPQEQE LLLTASDDAT IKAWRSPRTM RVLQAPRPRP
181  RTFFSWLASQ RRLRCAGCTG ATGTP
C.核苷酸及氨基酸组合序列(SEQ ID NO:24)
克隆号:PP3971
起始编码子:465ATG    终止编码子:1082TGA
蛋白质分子量:23135
   1   TG GCT CAA CAA TGC CTT CCA GGA TGT GGA GTC AGA GAA CGT CAA CGT      47
  48  GGT GAA GCG GCT GTT CAA GAT CCA GAA CCT CAA TGC CAG CAC CGT CCG      95
  96  CAC GGT GAT GGT GGC CGA CTG CAG CCG CTT CGA CAG CCC TGA CCT GCT     143
 144  GCT GGA AGC CGG TGA CCC GCC ACG TCC CCC TGC CGC ATC TTT GAC CTG     191
 192  GGC AGC GAC AAC GAG GAG GTG GTG GCT GGC CCG GCC CCC GCC CAC GCC     239
 240  AAG GAG GGC TTG CGG CAC TTT CTG GAC CGC GTG CTG GAG GGG CGG GCG     287
 288  CAC AGC AGC TGT CGG AGC GCA TCT AGA GAC CAA GGT GGC CGA GCT GCT     335
 336  GGC CCA GGG CAC ACC AAG CCA CCC GAG CGC AGT GCC ACA GGC GCC AAG     383
 384  AGC AAG TAC CTC ATC TTC ACC ACT GGC TGC CTC ACC TAC TCC CCA CAC     431
 432  CAG ATC GGC ATC AAG CAG ATC CTG CCA CAC CAG ATG ACC ACG GCA GGG     479
   1                                              Met Thr Thr Ala Gly       5
 480  CCC GTG CTG GGT GAG GGC CGG GGC TCC GAT GCC TTC TTC GAC GCG CTG     527
   6  Pro Val Leu Gly Glu Gly Arg Gly Ser Asp Ala Phe Phe Asp Ala Leu      21
 528  GAC CAC GTC ATA GAC ATA CAC GGA CAC ATC ATC GGC ATG GGC CTG TCG     575
  22  Asp His Val Ile Asp Ile His Gly His Ile Ile Gly Met Gly Leu Ser      37
 576  CCC GAC AAC AGG TAC CTG TAC GTG AAC AGC CGC GCC TGG CCC AAC GGT     623
  38  Pro Asp Asn Arg Tyr Leu Tyr Val Asn Ser Arg Ala Trp Pro Asn Gly      53
 624  GCG GTG GTG GCC GAC CCC ATG CAG CCG CCA CCA ATC GCG GAG GAG ATT     671
  54  Ala Val Val Ala Asp Pro Met Gln Pro Pro Pro Ile Ala Glu Glu Ile      69
 672  GAC CTG CTG GTG TTC GAC CTC AAG ACC ATG CGG GAG GTG AGG CGG GCT     719
  70  Asp Leu Leu Val Phe Asp Leu Lys Thr Met Arg Glu Val Arg Arg Ala      85
 720  CTG CGT GCG CAC CGC GCC TAC ACG CCC AAC GAC GAG TGC TTC TTC ATC     767
  86  Leu Arg Ala His Arg Ala Tyr Thr Pro Asn Asp Glu Cys Phe Phe Ile     101
 768  TTC CTG GAC GTC AGC AGG GAC TTC GTG GCC AGC GGG GCG GAG GAC CGG     815
 102  Phe Leu Asp Val Ser Arg Asp Phe Val Ala Ser Gly Ala Glu Asp Arg     117
 816  CAC GGC TAC ATC TGG GAC CGC CAC TAC AAC ATC TGT CTG GCC AGG CTG     863
 118  His Gly Tyr Ile Trp Asp Arg His Tyr Asn Ile Cys Leu Ala Arg Leu     133
 864  CGG CAC GAG GAT GTG GTC AAC TCA GTG GTC TTC AGT CCC CAG GAG CAG     911
 134  Arg His Glu Asp Val Val Asn Ser Val Val Phe Ser Pro Gln Glu Gln     149
 912  GAG CTG CTG CTC ACG GCC AGC GAC GAC GCC ACC ATC AAA GCC TGG CGC     959
 150  Glu Leu Leu Leu Thr Ala Ser Asp Asp Ala Thr Ile Lys Ala Trp Arg     165
 960  TCC CCA CGC ACC ATG CGC GTC CTC CAG GCA CCT CGC CCA CGG CCT CGC    1007
 166  Ser Pro Arg Thr Met Arg Val Leu Gln Ala Pro Arg Pro Arg Pro Arg     181
1008  ACC TTC TTC TCC TGG CTT GCC AGC CAG AGG CGC TTG AGG TGT GCT GGG    1055
 182  Thr Phe Phe Ser Trp Leu Ala Ser Gln Arg Arg Leu Arg Cys Ala Gly     197
1056  TGC ACT GGA GCC ACC GGG ACC CCT TGA GGA CAT CGC CAG GCT CTG TGG    1103
 198  Cys Thr Gly Ala Thr Gly Thr Pro ***                                 206
1104  CTT TTT CCC GAG CGG GAG AGG TGG AGA TGC TTA TAG CAG TTA CGC CTT    1151
1152  AGG AAG GGG ACA ACC AGG CCC CGC CAC ACG CTC ACA CAC AAA CCT GCT    1199
1200  CAC GCA GCT GTG ATG CTT GGC ACG GGG TGG CCA GTG CAG ATG GAG CCC    1247
1248  AAG GCC CCC TCG GCC TCC TGG GCA ACT TGG GGT ACA CAG GAT ACT GGG    1295
1296  GGT GCC GCT CCT CAC TCA ACC CCA GGC TAG GGG TAC ACC TTG ACC CAG    1343
1344  CTG GCC TCG GCC CGG GGC ACC TTC GGC TGG TCC TGT GGG GCC CTG GAC    1391
1392  GGT GGC CCA GTG GTG GCA GGG GCT GCT CCT GGC TGT GGT TGT GCG CCC    1439
1440  GGG GCT TGG GAG CGG CCG GTC ACG CTG CTG TGG GCC CGA GTG TGT TGC    1487
1488  ATG TCC ACG CAC CAC CCG TTC AGG GCC CTG AAT AAA CAG TTG GCA ACA    1535
1536  GCA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    1583
1584  AAA AA                                                             1588
9.PP4519蛋白
A:核苷酸序列(SEQ ID NO:25)  长度:1353bp
   1  GTGCCAGTCC ATCTGACATC AAAGCCAGTG TCTCTAATGG TGACACCACC
  51  CTCCTCTGCA GCAGGAGGCA GAGCTGTGGG ATGAATGAGG TTCGCCAGGT
 101  CTCCCTTACC TATCCTGGGT CCCCAGCTCC TTCTCACTCT CTTCCCTTGC
 151  AGCCTCGAAG CGGAGGATCC CTGTGTCCCA GCCGGGCATG GCCGACCCCC
 201  ACCAGCTTTT CGATGACACA AGTTCAGCCC AGAGCCGGGG CTATGGGGCC
 251  CAGCGGGCAC CTGGTGGCCT GAGTTATCCT GCAGCCTCTC CCACGCCCCA
 301  TGCAGCCTTC CTGGCTGACC CGGTGTCCAA CATGGCCATG GCCTATGGGA
 351  GCAGCCTGGC CGCGCAGGGC AAGGAGCTGG TGGATAAGAA CATCGACCGC
 401  TTCATCCCCA TCACCAAGCT CAAGTATTAC TTTGCTGTGG ACACCATGTA
 451  TGTGGGCAGA AAGCTGGGCC TGCTGTTCTT CCCCTACCTA CACCAGGACT
 501  GGGAAGTGCA GTACCAACAG GACACCCCGG TGGCCCCCCG CTTTGACGTC
 551  AATGCCCCGG ACCTCTACAT TCCAGCAATG GCTTTCATCA CCTACGTTTT
 601  GGTGGCTGGT CTTGCGCTGG GGACCCAGGA TAGGTTCTCC CCAGACCTCC
 651  TGGGGCTGCA AGCGAGCTCA GCCCTGGCCT GGCTGACCCT GGAGGTGCTG
 701  GCCATCCTGC TCAGCCTCTA TCTGGTCACT GTCAACACCG ACCTCACCAC
 751  CATCGACCTG GTGGCCTTCT TGGGCTACAA ATATGTCGGG ATGATTGGCG
 801  GGGTCCTCAT GGGCCTGCTC TTCGGGAAGA TTGGCTACTA CCTGGTGCTG
 851  GGCTGGTGCT GCGTAGCCAT CTTTGTGTTC ATGATCCGGA CGCTGCGGCT
 901  GAAGATCTTG GCAGACGCAG CAGCTGAGGG GGTCCCGGTG CGTGGGGCCC
 951  GGAACCAGCT GCGCATGTAC CTGACCATGG CGGTGGCGGC GGCGCAGCCT
1001  ATGCTCATGT ACTGGCTCAC CTTCCACCTG GTGCGGTGAG CGCGCCCGCT
1051  GAACCTCCCG CTGCTGCTGC TGCTGCTGGG GGCCACTGTG GCCGCCGAAC
1101  TCATCTCCTG CCTGCAGGCC CCAAGGTCCA CCCTGTCTGG CCACAGGCAC
1151  CGCCTCCATC CCATGTCCCG CCCAGCCCCG CCCCCAACCC AAGGTGCTGA
1201  GAGATCTCCA GCTGCACAGG CCACCGCCCC AGGGCGTGGC CGCTGTTACA
1251  GAAACAATAA ACCCTGATGG GCATGGAAAA AAAAAAAAAA AAAAAAAAAA
1301  AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
1351  AAA
B:氨基酸序列(SEQ ID NO:26)  长度:283个氨基酸
  1  MADPHQLFDD TSSAQSRGYG AQRAPGGLSY PAASPTPHAA FLADPVSNMA MAYGSSLAAQ
 61  GKELVDKNID RFIPITKLKY YFAVDTMYVG RKLGLLFFPY LHQDWEVQYQ QDTPVAPRFD
121  VNAPDLYIPA MAFITYVLVA GLALGTQDRF SPDLLGLQAS SALAWLTLEV LAILLSLYLV
181  TVNTDLTTID LVAFLGYKYV GMIGGVLMGL LFGKIGYYLV LGWCCVAIFV FMIRTLRLKI
241  LADAAAEGVP VRGARNQLRM YLTMAVAAAQ PMLMYWLTFH LVR
C.核苷酸及氨基酸组合序列(SEQ ID NO:27)
克隆号:PP4519
起始编码子:188ATG    终止编码子:1039TGA
蛋白质分子量:31173
  1    G TGC CAG TCC ATC TGA CAT CAA AGC CAG TGT CTC TAA TGG TGA CAC     46
 47  CAC CCT CCT CTG CAG CAG GAG GCA GAG CTG TGG GAT GAA TGA GGT TCG     94
 95  CCA GGT CTC CCT TAC CTA TCC TGG GTC CCC AGC TCC TTC TCA CTC TCT    142
143  TCC CTT GCA GCC TCG AAG CGG AGG ATC CCT GTG TCC CAG CCG GGC ATG    190
  1                                                              Met      1
191  GCC GAC CCC CAC CAG CTT TTC GAT GAC ACA AGT TCA GCC CAG AGC CGG    238
  2  Ala Asp Pro His Gln Leu Phe Asp Asp Thr Ser Ser Ala Gln Ser Arg     17
239  GGC TAT GGG GCC CAG CGG GCA CCT GGT GGC CTG AGT TAT CCT GCA GCC    286
 18  Gly Tyr Gly Ala Gln Arg Ala Pro Gly Gly Leu Ser Tyr Pro Ala Ala     33
287  TCT CCC ACG CCC CAT GCA GCC TTC CTG GCT GAC CCG GTG TCC AAC ATG    334
 34  Ser Pro Thr Pro His Ala Ala Phe Leu Ala Asp Pro Val Ser Asn Met     49
335  GCC ATG GCC TAT GGG AGC AGC CTG GCC GCG CAG GGC AAG GAG CTG GTG    382
 50  Ala Met Ala Tyr Gly Ser Ser Leu Ala Ala Gln Gly Lys Glu Leu Val     65
383  GAT AAG AAC ATC GAC CGC TTC ATC CCC ATC ACC AAG CTC AAG TAT TAC    430
 66  Asp Lys Asn Ile Asp Arg Phe Ile Pro Ile Thr Lys Leu Lys Tyr Tyr     81
431  TTT GCT GTG GAC ACC ATG TAT GTG GGC AGA AAG CTG GGC CTG CTG TTC    478
 82  Phe Ala Val Asp Thr Met Tyr Val Gly Arg Lys Leu Gly Leu Leu Phe     97
479  TTC CCC TAC CTA CAC CAG GAC TGG GAA GTG CAG TAC CAA CAG GAC ACC    526
 98  Phe Pro Tyr Leu His Gln Asp Trp Glu Val Gln Tyr Gln Gln Asp Thr    113
527  CCG GTG GCC CCC CGC TTT GAC GTC AAT GCC CCG GAC CTC TAC ATT CCA    574
114  Pro Val Ala Pro Arg Phe Asp Val Asn Ala Pro Asp Leu Tyr Ile Pro    129
575  GCA ATG GCT TTC ATC ACC TAC GTT TTG GTG GCT GGT CTT GCG CTG GGG    622
130  Ala Met Ala Phe Ile Thr Tyr Val Leu Val Ala Gly Leu Ala Leu Gly    145
623  ACC CAG GAT AGG TTC TCC CCA GAC CTC CTG GGG CTG CAA GCG AGC TCA    670
146  Thr Gln Asp Arg Phe Ser Pro Asp Leu Leu Gly Leu Gln Ala Ser Ser    161
671  GCC CTG GCC TGG CTG ACC CTG GAG GTG CTG GCC ATC CTG CTC AGC CTC    718
162  Ala Leu Ala Trp Leu Thr Leu Glu Val Leu Ala Ile Leu Leu Ser Leu    177
719  TAT CTG GTC ACT GTC AAC ACC GAC CTC ACC ACC ATC GAC CTG GTG GCC    766
178  Tyr Leu Val Thr Val Asn Thr Asp Leu Thr Thr Ile Asp Leu Val Ala    193
767  TTC TTG GGC TAC AAA TAT GTC GGG ATG ATT GGC GGG GTC CTC ATG GGC    814
194  Phe Leu Gly Tyr Lys Tyr Val Gly Met lle Gly Gly Val Leu Met Gly    209
815  CTG CTC TTC GGG AAG ATT GGC TAC TAC CTG GTG CTG GGC TGG TGC TGC    862
210  Leu Leu Phe Gly Lys Ile Gly Tyr Tyr Leu Val Leu Gly Trp Cys Cys    225
863  GTA GCC ATC TTT GTG TTC ATG ATC CGG ACG CTG CGG CTG AAG ATC TTG    910
226  Val Ala Ile Phe Val Phe Met Ile Arg Thr Leu Arg Leu Lys Ile Leu    241
 911  GCA GAC GCA GCA GCT GAG GGG GTC CCG GTG CGT GGG GCC CGG AAC CAG     958
 242  Ala Asp Ala Ala Ala Glu Gly Val Pro Val Arg Gly Ala Arg Asn Gln     257
 959  CTG CGC ATG TAC CTG ACC ATG GCG GTG GCG GCG GCG CAG CCT ATG CTC    1006
 258  Leu Arg Met Tyr Leu Thr Met Ala Val Ala Ala Ala Gln Pro Met Leu     273
1007  ATG TAC TGG CTC ACC TTC CAC CTG GTG CGG TGA GCG CGC CCG CTG AAC    1054
 274  Met Tyr Trp Leu Thr Phe His Leu Val Arg ***                         284
1055  CTC CCG CTG CTG CTG CTG CTG CTG GGG GCC ACT GTG GCC GCC GAA CTC    1102
1103  ATC TCC TGC CTG CAG GCC CCA AGG TCC ACC CTG TCT GGC CAC AGG CAC    1150
1151  CGC CTC CAT CCC ATG TCC CGC CCA GCC CCG CCC CCA ACC CAA GGT GCT    1198
1199  GAG AGA TCT CCA GCT GCA CAG GCC ACC GCC CCA GGG CGT GGC CGC TGT    1246
1247  TAC AGA AAC AAT AAA CCC TGA TGG GCA TGG AAA AAA AAA AAA AAA AAA    1294
1295  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    1342
1343  AAA AAA AAA AA                                                     1353
D.Blastp结果
Query=PP4519(283个氨基酸)
>SP_IN:Q20913 Q20913 caenorhabditis elegans.f57a8.2 protein.1/1999
             长度=251个氨基酸
分值=158bits(395),预计值=4e-38
相同性=80/186(43%),相似性=113/186(60%),缺口=13/186(6%)
Query:15  QSRGYGAQRAPGGLSYPAASPTPHAAFLADPVSNMAMAYGSSLAAQGKELVDKNIDRFIP 74
           Q+YG       GG              ++DP+ N A  +G   A Q KE + K +  F
Sbjct:76  QQQSYGQNNGFGGFQ--------PQQLMSDPMLNAAKQFGGQFAEQQKEKLTKYLGTF-- 125
Query:75  ITKLKYYFAVDTMYVGRKLGLLFFPYLHQDWEVQYQQDTPVAP-RFDVNAPDLYIPAMAF 133
              LKYYFAVD  YVG+KLG+LFFP+ H+DW +++      AP R DVNAPDLYIP M+F
Sbjct:126 --NLKYYFAVDNAYVGKKLGILFFPFFHKDWSLKFAGSADPAPAREDVNAPDLYIPLMSF 183
Query:134 ITYVLVAGLALGTQDRFSPDLLGLQASSALAWLTLEVLAILLSLYLVTVNTDLTTIDLVA 193
           +TY+LV+G  LGTQ RFSP++LG+  S+AL W+ LE + I +S Y++ ++  L+    +A
Sbjct:184 LTYILVSGFVLGTQGRFSPEILGILTSNALIWVILENIVIFISKYILNISQSLSVWHSLA 243
Query:194 FLGYKY 199
           +  YK+
Sbjct:244 YSTYKF 249
10.PP5241蛋白
A:核苷酸序(SEQ ID NO:28)  长度:1891bp
  1  GGCACGGGGT GGATCACTTG AGGTCAGGAG TTCGAGACCA GCCTGACCAA
 51  CACGATGAAA CCCTGTCTCT ACTGAAAATA CAAAAATTAG CTGGGTGTAG
101  TGGCAGGCAC CTGTAATCCC AGCTACTCAG GAGGCTGAGG CAGGAGAATT
151  GCTTGAACCC AGAAGGTTGC AGGGAGCCAA GATCACACCA CTGCACTCTG
201  TCTTAAAAAA AAATAATAAA TTAAAATAGA AAGTTAAAAC ATAGGAATAT
251  ATAAGCACAT ATTTCCTTAG CTATCAGAAA TGTGAGTGTG AAAAAGACAA
301  ATAATATGCT GGTGTCATAA TGAAAATAAT TTTAACCTTG CAGAGCCCCC
351  CAAGACCTTT AAAAACCTCT GGGCTGCGTG TCAGGATACA GTGGTCTCCA
 401  AGCTAGGCAC AGTTCTTGCC TTTGTTGTAC TGGATGCTGT GGTGCTGTGG
 451  AAGCCCATGG TGGGGGGTTG GGTCTAACAG ACTTGTGGCA TCAGGAAGGG
 501  TACTTGGAGA GACAGACCTG AAGTGGAGAC TAGCCTGGGA CAACAGGTGT
 551  AGTGGTGGAT GGAGCAGCAT GTGGGAGGCC CAGAGGCCTC ACCTGAAAAC
 601  GTCAACGAAG CTCATAATGG CTGCGTGTTA ATATTGCATA TGCTGGGATG
 651  ATACCAGCAG TTTGAGTTCT CTGGCTTCAG CGTGATATGA TTTTATCCAC
 701  TTGTTTATTT TCAGAGGCAC ATGTAGCTGT TCTCAATTCC CTTCTCTGTA
 751  TGACTTATAG GAAGCTAAAG GCTTCCTTGT GTTAGAGAGC TTCCTATTTC
 801  AAGTGCTGAG CTGGGTTTGT CAAGCTTTGA AAATGCAGAC AGAGCCATGA
 851  AACCTAAGGG GGACTCAGAG GAAGTGTCCA TGTGCAGGAG AGACAAGGCT
 901  GAATTAAAAG GCATGATTAA TCACAAAAGA GTGGAAGAGT GATGCTTGAG
 951  AGTTGAGGAC GTGAGTAAAA CAGAAGTAGA ACTGCTCATT TGATGTCATC
1001  ACGTTATCTC AAGATGAGCC CTCTTGGCCT CAGACAGTGG GTAGCATTAC
1051  ATTATATGTT AGCTCCGCGC CCCCACGCCC ACCCTCCTTC TTTGAAATGA
1101  TGTCTAAATT AGAGGTGTAA CTATCCCACC AGGTGCAACT TGAGCCTTCC
1151  TTTGCCCTCC TGTAGCTGTC GTGGGAGGGG GGCCTGCTTT CTTGGGCACA
1201  GACTGTTTGG TCAGCTGAGC CACAGAAATG AGGCCAGGCC TGTTTTGCTC
1251  TCTGTCTATG CTTGATTGCA AGGAACACTG ATGATATCAG AGGGCTTTCT
1301  TACCTCAAGC CCTTCTGGCT TAAGGACAAG GTTATTTCTT TCATTTCTGT
1351  CTGCAAACTG TGGTAGTGTA TTCGATTTCA AGGATTCTGG GATGAATTCT
1401  TCAATGATAA GAACCTGCTA TTATTGTCCC TGCTTTACAG CTCCAGGGAT
1451  TGGCAGCCTC ATTCTTCAAA AGTTGCACAC CTTTAGGGCC TTGGGAGGTA
1501  CAGGCACCAG CAAGGAGTCA GAAGGAATGA AAGCTGGAGA GATGCGGCCC
1551  ACACTGGAAA GACAGGAGGA AAGGAGAGAG AAAGCGCCTC GGCCAGGCAC
1601  AGTGGCTCAT GCCTGTAATC CCAGCACTTT GGGAGGCTGA GGCGGGAGAT
1651  CACCTGAGGT CAGGAGACTG AGACCAGCTT GACCAACATG GTGAAACCCC
1701  ATCTCTACTA AAAATACAAA ACTAGCCGGG CATGGTGGCG AGTGCCTGTA
1751  ATCTCCGCTA CTTAGGAGGC TGAGGCAGGA GAATTGCTTG AACCAGGAGG
1801  CGGAGGTTGC AGTGAGCTGA GATCGTGCCA TTGCACTCCA GCCTAGGCAA
1851  CAAGAGCAAA ACTGCATCTC AAAAAAAAAA AAAAAAAAAA A
B:氨基酸序列(SEQ ID NO:29)长度:119个氨基酸
 1 MISEGFLTSS PSGLRTRLFL SFLSANCGSV FDFKDSGMNS SMIRTCYYCP CFTAPGIGSL
61 ILQKLHTFRA LGGTGTSKES EGMKAGEMRP TLERQEERRE KAPRPGTVAH ACNPSTLGG
C.核苷酸及氨基酸组合序列(SFQ ID NO:30)
克隆号:PP5241
起始编码子:1281ATG    终止编码子:1640TGA
蛋白质分子量:12830
   1  GG CAC GGG GTG GAT CAC TTG AGG TCA GGA GTT CGA GAC CAG CCT GAC      47
 48  CAA CAC GAT GAA ACC CTG TCT CTA CTG AAA ATA CAA AAA TTA GCT GGG      95
 96  TGT AGT GGC AGG CAC CTG TAA TCC CAG CTA CTC AGG AGG CTG AGG CAG     143
144  GAG AAT TGC TTG AAC CCA GAA GGT TGC AGG GAG CCA AGA TCA CAC CAC     191
192  TGC ACT CTG TCT TAA AAA AAA ATA ATA AAT TAA AAT AGA AAG TTA AAA     239
240  CAT AGG AAT ATA TAA GCA CAT ATT TCC TTA GCT ATC AGA AAT GTG AGT     287
288  GTG AAA AAG ACA AAT AAT ATG CTG GTG TCA TAA TGA AAA TAA TTT TAA     335
336  CCT TGC AGA GCC CCC CAA GAC CTT TAA AAA CCT CTG GGC TGC GTG TCA     383
384  GGA TAC AGT GGT CTC CAA GCT AGG CAC AGT TCT TGC CTT TGT TGT ACT     431
432  GGA TGC TGT GGT GCT GTG GAA GCC CAT GGT GGG GGG TTG GGT CTA ACA     479
480  GAC TTG TGG CAT CAG GAA GGG TAC TTG GAG AGA CAG ACC TGA AGT GGA     527
528  GAC TAG CCT GGG ACA ACA GGT GTA GTG GTG GAT GGA GCA GCA TGT GGG     575
 576  AGG CCC AGA GGC CTC ACC TGA AAA CCT CAA CGA AGC TCA TAA TGG CTG     623
 624  CGT GTT AAT ATT GCA TAT GCT GGG ATG ATA CCA GCA GTT TGA GTT CTC     671
 672  TGG CTT CAG CGT GAT ATG ATT TTA TCC ACT TGT TTA TTT TCA GAG GCA     719
 720  CAT GTA GCT GTT CTC AAT TCC CTT CTC TGT ATG ACT TAT AGG AAG CTA     767
 768  AAG GCT TCC TTG TGT TAG AGA GCT TCC TAT TTC AAG TGC TGA GCT GGG     815
 816  TTT GTC AAG CTT TGA AAA TGC AGA CAG AGC CAT GAA ACC TAA GGG GGA     863
 864  CTC AGA GGA AGT GTC CAT GTG CAG GAG AGA CAA GGC TGA ATT AAA AGG     911
 912  CAT GAT TAA TCA CAA AAG AGT GGA AGA GTG ATG CTT GAG AGT TGA GGA     959
 960  CGT GAG TAA AAC AGA AGT AGA ACT GCT CAT TTG ATG TCA TCA CGT TAT    1007
1008  CTC AAG ATG AGC CCT CTT GGC CTC AGA CAG TGG GTA GCA TTA CAT TAT    1055
1056  ATG TTA GCT CCG CGC CCC CAC GCC CAC CCT CCT TCT TTG AAA TGA TGT    1103
1104  CTA AAT TAG AGG TGT AAC TAT CCC ACC AGG TGC AAC TTG AGC CTT CCT    1151
1152  TTG CCC TCC TGT AGC TGT CGT GGG AGG GGG GCC TGC TTT CTT GGG CAC    1199
1200  AGA CTG TTT GGT CAG CTG AGC CAC AGA AAT GAG GCC AGG CCT GTT TTG    1247
1248  CTC TCT GTC TAT GCT TGA TTG CAA GGA ACA CTG ATG ATA TCA GAG GGC    1295
   1                                              Met Ile Ser Glu Gly       5
1296  TTT CTT ACC TCA AGC CCT TCT GGC TTA AGG ACA AGG TTA TTT CTT TCA    1343
   6  Phe Leu Thr Ser Ser Pro Ser Gly Leu Arg Thr Arg Leu Phe Leu Ser      21
1344  TTT CTG TCT GCA AAC TGT GGT AGT GTA TTC GAT TTC AAG GAT TCT GGG    1391
  22  Phe Leu Ser Ala Asn Cys Gly Ser Val Phe Asp Phe Lys Asp Ser Gly      37
1392  ATG AAT TCT TCA ATG ATA AGA ACC TGC TAT TAT TGT CCC TGC TTT ACA    1439
  38  Met Asn Ser Ser Met Ile Arg Thr Cys Tyr Tyr Cys Pro Cys Phe Thr      53
1440  GCT CCA GGG ATT GGC AGC CTC ATT CTT CAA AAG TTG CAC ACC TTT AGG    1487
  54  Ala Pro Gly Ile GIy Ser Leu Ile Leu Gln Lys Leu His Thr Phe Arg      69
1488  GCC TTG GGA GGT ACA GGC ACC AGC AAG GAG TCA GAA GGA ATG AAA GCT    1535
  70  Ala Leu Gly Gly Thr Gly Thr Ser Lys Glu Ser Glu Gly Met Lys Ala      85
1536  GGA GAG ATG CGG CCC ACA CTG GAA AGA CAG GAG GAA AGG AGA GAG AAA    1583
  86  Gly Glu Met Arg Pro Thr Leu Glu Arg Gln Glu Glu Arg Arg Glu Lys     101
1584  GCG CCT CGG CCA GGC ACA GTG GCT CAT GCC TGT AAT CCC AGC ACT TTG    1631
 102  Ala Pro Arg Pro Gly Thr Val Ala His Ala Cys Asn Pro Ser Thr Leu     117
1632  GGA GGC TGA GGC GGG AGA TCA CCT GAG GTC AGG AGA CTG AGA CCA GCT    1679
 118  Gly Gly ***                                                         120
1680  TGA CCA ACA TGG TGA AAC CCC ATC TCT ACT AAA AAT ACA AAA CTA GCC    1727
1728  GGG CAT GGT GGC GAG TGC CTG TAA TCT CCG CTA CTT AGG AGG CTG AGG    1775
1776  CAG GAG AAT TGC TTG AAC CAG GAG GCG GAG GTT GCA GTG AGC TGA GAT    1823
1824  CGT GCC ATT GCA CTC CAG CCT AGG CAA CAA GAG CAA AAC TGC ATC TCA    1871
1872  AAA AAA AAA AAA AAA AAA AA                                         1891
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims (6)

1.一种分离的多核苷酸,其特征在于,它选自下组:
(a)编码在肝癌组织中具有表达差异的多肽的多核苷酸,所述的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29;
(b)与多核苷酸(a)互补的多核苷酸。
2.如权利要求1所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29。
3.如权利要求1所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30的编码区序列或全长序列。
4.一种载体,其特征在于,它含有权利要求1所述的多核苷酸。
5.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求4所述的载体转化或转导的宿主细胞;
(b)用权利要求1所述的多核苷酸转化或转导的宿主细胞。
6.如权利要求1所述的多核苷酸的用途,其特征在于,用于制备检测肝癌的试剂。
CNB001166166A 2000-06-20 2000-06-20 在肝癌组织中具有表达差异的新的人蛋白及其编码序列 Expired - Fee Related CN1177864C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB001166166A CN1177864C (zh) 2000-06-20 2000-06-20 在肝癌组织中具有表达差异的新的人蛋白及其编码序列

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB001166166A CN1177864C (zh) 2000-06-20 2000-06-20 在肝癌组织中具有表达差异的新的人蛋白及其编码序列

Publications (2)

Publication Number Publication Date
CN1329064A CN1329064A (zh) 2002-01-02
CN1177864C true CN1177864C (zh) 2004-12-01

Family

ID=4586018

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB001166166A Expired - Fee Related CN1177864C (zh) 2000-06-20 2000-06-20 在肝癌组织中具有表达差异的新的人蛋白及其编码序列

Country Status (1)

Country Link
CN (1) CN1177864C (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2636417C (en) 2006-01-05 2020-08-25 Immune Disease Institute, Inc. Regulators of nfat
US8394778B1 (en) 2009-10-08 2013-03-12 Immune Disease Institute, Inc. Regulators of NFAT and/or store-operated calcium entry
US9567580B2 (en) 2010-10-08 2017-02-14 Anjana Rao Regulators of NFAT and/or store-operated calcium entry

Also Published As

Publication number Publication date
CN1329064A (zh) 2002-01-02

Similar Documents

Publication Publication Date Title
CN1177864C (zh) 在肝癌组织中具有表达差异的新的人蛋白及其编码序列
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1169954C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199997C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1177048C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1177049C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1155615C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1199998C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1169958C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1194989C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1170848C (zh) 新的人肝癌相关蛋白及其编码序列
CN1169955C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1209373C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1199999C (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1222616C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1199994C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1169956C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1209374C (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1169957C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199996C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1169831C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1166686C (zh) 具有抑制癌细胞生长功能的人蛋白及其编码序列
CN1169833C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1177050C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1194010C (zh) 具有抑制癌细胞生长功能的人蛋白及基编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee