CN1170929C - 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 - Google Patents

编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 Download PDF

Info

Publication number
CN1170929C
CN1170929C CNB001119974A CN00111997A CN1170929C CN 1170929 C CN1170929 C CN 1170929C CN B001119974 A CNB001119974 A CN B001119974A CN 00111997 A CN00111997 A CN 00111997A CN 1170929 C CN1170929 C CN 1170929C
Authority
CN
China
Prior art keywords
ctg
ccc
leu
ser
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB001119974A
Other languages
English (en)
Other versions
CN1313318A (zh
Inventor
顾健人
杨胜利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cancer Institute
Original Assignee
Shanghai Cancer Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cancer Institute filed Critical Shanghai Cancer Institute
Priority to CNB001119974A priority Critical patent/CN1170929C/zh
Publication of CN1313318A publication Critical patent/CN1313318A/zh
Application granted granted Critical
Publication of CN1170929C publication Critical patent/CN1170929C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。

Description

编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能(即抑制癌细胞生长)的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ IDNO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:32、SEQ ID NO:35、SEQ ID NO:38、SEQ ID NO:41、SEQ IDNO:44、SEQ ID NO:47;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ IDNO:23、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:32、SEQ ID NO:35、SEQ ID NO:38、SEQ ID NO:41、SEQ ID NO:44、SEQ ID NO:47。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ IDNO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:32、SEQ ID NO:35、SEQ ID NO:38、SEQ ID NO:41、SEQ IDNO:44、SEQ ID NO:47。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、SEQ IDNO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ IDNO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续的10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
本发明采用大规模cDNA克隆转染癌细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对癌细胞(肝癌细胞)具有抑制克隆形成的作用,其抑制率在50%或50%以上。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。具有抑癌功能的蛋白多肽的纯度能用氨基酸序列分析。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP1224蛋白(在本申请中,蛋白质的命名采用其克隆编号)(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。以PP265蛋白(在本申请中,蛋白质的命名采用其克隆编号)(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对于其他具有抑癌功能的蛋白,可依此类推。对于其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列:成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽(Science,1984;224:1431)。一般来说有以下步骤:
(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.Molecular Cloning,a Laboratory Manual,coldSpring Harbor Laboratory.New York,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有抑癌功能的蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有抑癌功能的蛋白,以抑制内源性的具有抑癌功能的蛋白活性。例如,一种变异的具有抑癌功能的蛋白可以是缩短的、缺失了信号传导功能域的具有抑癌功能的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭具有抑癌功能的人蛋白阳性的细胞。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与具有抑癌功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。现在,只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。根据本发明,为了将这些序列与疾病相关基因相关联,其重要的第一步就是将这些DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力,被精确定位至与疾病有关的染色体区域的cDNA,可以是50至500个潜在致病基因间之一种(假定1兆碱基作图分辨能力和每20kb对应于一个基因)。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:cDNA基因的获得及对癌细胞克隆形成的抑制作用
SP1224来自于从GIBCO BRL公司购得的肝cDNA文库(cat,No.10422-012),PP265,PP384,PP432,PP552,PP591,PP603,PP632,PP844,PP928,PP1200,PP1226,PP1292,PP1396,PP1563和PP1746是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg cDNA滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系7721。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃ 24小时。每孔换100μl全培液,37℃ 24小时,换含G418的全培液100μl,37℃ 24~48小时,边观察,边换G418浓度不等的培液。约2~3次后,直到镜检细胞有克隆形成,计数。发现上述克隆有抑制细胞克隆形成作用,结果如下表所示。
            cDNA克隆转染细胞(7721)克隆形成情况
 cDNA克隆名称     cDNA克隆数       对照克隆数
    SP1224     1    2    1     15     10    8
    PP265     13   9    8     20     17    16
    PP384     12   7    8     45     52    31
    PP432     25   29   21     31     33    30
    PP552     4    1    3     20    17    16
    PP591     8    1    2     21    30    42
    PP603     2    1    0     21    30    42
    PP632     0    3    2     22    19    13
    PP844     0    0    0     31    38    32
    PP928     32   34   21     57    54    40
    PP1200     0    0    0     30    37    41
    PP1226     0    4    3     30    20    22
    PP1292     2    2    4     16    14    17
    PP1396     7    8    2     26    23    32
    PP1563     11   6    3     27    25    26
    PP1746     1    0    0     10    18    9
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28、31、34、37、40、43、46)。
实施例2:从胎盘cDNA中PCR获得基因克隆:
取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL)反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表所示),按90℃ 3分钟1个循环;94℃ 30秒,60℃ 30秒,72℃ 1分钟,共35个循环;72℃ 10分钟,1个循环进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,以获得重组蛋白。
                            基因特异引物
克隆名称  特异引物1(5′→3′)  特异引物2(5′→3′)
 SP1224  CACGCGTCCGGGAATCCAGTC  GCATCAACAGATCAAGCAAAGCCATGA
 PP265  GCGAGGTGGCCATGAAGATCCAG  GCTCAGCACCTCTCCCAGCTCCA
 PP384  TCAGAATGGGAAGGCCTGGAAGA  CGAGCCTCAGCTCAGGGGAAACA
 PP432  TCGGGTCTCCCCATTCTCCAGGT  GTCCCACAACCGGGGAAGGAGAG
 PP552  AACTCCCTCCCGCCAGCCCTTTA  TTTACAGGCAGTGCGTGGCTGCT
 PP591  GAACAGGCAGGTTCCCTCGACCC  TGCCCTCTCAGGGATTTGCAGGA
 PP603  CTTAGTTGCCGGAGCTGAACGGC  AAGACCCAATTTCCACAGCGCCC
 PP632  CCCCCAGGCCACTAACAGCAACA  TAGGGTGAGGCCCATGTCAACGG
 PP844  AGTGGTCGGCTTGGTGTGGTGTG  CAAACTTGCAGCCAAAGGGCGAG
 PP928  CGAGAACAGCAAAGGCCAAAGCC  GGAAAGCTGTGTCCCTCCCCAGA
 PP1200  TGCTAACCCTGAGACAGCAAGAC  GCAAGCATTTATCACTTCGACGCC
 PP1226  CTAGCTTCGCGAGGGTGCCTGTC  ACCCCTGTAAAACCTCGTGCCCA
 PP1292  CCGACCTCCACAAGCTCCCTCAT  TGGAATGCAGTTACACGCAGGGG
 PP1396  AAGGTGTCTGGCGCCCCATTTTC  ATCACACCACCACATGGGCCTGA
 PP1563  AGGAAGGCCAGCGATCACCTTGA  GCTGCTTTTGGAGACCAGCAGGC
 PP1746  ACCCTGGCGACGTGCTACTGAGC  TTATTGCGGGATCCTCACACGGC
实施例3:cDNA克隆序列分析
1.SP1224
A:核苷酸序列:(SEQ ID NO:1)  长度:2492bp
   1  CCCACGCGTC CGGGAATCCA GTCCGGGGGC CGAGCTGGCT GCGCCCTCCG
  51  CCAAGCGCCG GCAGCGCGGG GCGAGCTCCG GACGGCGCGC GGCCCAGGCA
 101  GCGGCTCCCG CTCGGCCCGC CCTCCGAGCC GCAGGGGCCG CCACCGCCGC
 151  GGCGCCTCCC CTGGCGACCG CGCCCCCGGG CCCCGGCTCC GGCCCGGGAC
 201  GGAGGAGCCG GCGCTCGACA CAGAGAGCTC TTCAGAAACC AGGCTGCTTT
 251  CAGGAACATT GCTGTGGATT CCCAGGGCCT ATTCCACTAG AAGCAAGATG
 301  GCTGAACTCA ATACTCATGT GAATGTCAAG GAAAAGATCT ATGCAGTTAG
 351  ATCAGTTGTT CCCAACAAAA GCAATAATGA AATAGTCCTG GTGCTCCAAC
 401  AGTTTGATTT TAATGTGGAT AAAGCCGTGC AAGCCTTTGT GGATGGCAGT
 451  GCAATTCAAG TTCTAAAAGA ATGGAATATG ACAGGAAAAA AGAAGAACAA
 501  TAAAAGAAAA AGAAGCAAGT CCAAGCAGCA TCAAGGCAAC AAAGATGCTA
 551  AAGACAAGGT GGAGAGGCCT TGAGGCAGGG CCCCTGCAGC CGCAGCCACC
 601  ACAGATTCAA AACGGCCCCA TGAATGGCTG CGAGAAGGAC AGCTCGTCCA
 651  CAGATTCTGC TAACGAAAAA CCAGCCCTTA TCCCTCGTGA GAAAAAGATC
 701  TCGATACTTG AGGAACCTTC AAAGGCACTT CGTGGGGTCA CAGAAGGCAA
 751  CAGACTACTG CAACAGAAAC TATCCTTAGA TGGGAACCCC AAACCTATAC
 801  ATGGAACAAC AGAGAGGTCA GATGGCCTAC AGTGGTCAGC TGAGCAGCCT
 851  TGTAACCCAA GCAAGCCTAA GGCAAAAACA TCTCCTGTTA AGTCCAATAC
 901  CCCTGCAGCT CATCTTGAAA TAAAGCCAGA TGAGTTGGCA AAGAAAAGAG
 951  GCCCAAATAT TGAGAAATCA GTGAAGGATT TGCAACGCTG CACCGTTTCT
1001  CTAACTAGAT ATCGCGTCAT GATTAAGGAA GAAGTGGATA GTTCCGTGAA
1051  GAAGATCAAA GCTGCCTTTG CTGAATTACA CAACTGCATC ATTGACAAAG
1101  AAGTTTCATT AATGGCAGAA ATGGATAAAG TTAAAGAAGA AGCCATGGAA
1151  ATCCTGACTG CTCGTCAGAA GAAAGCAGAA GAACTAAAGA GACTCACTGA
1201  CCTTGCCAGT CAGATGGCAG AGATGCAGCT GGCCGAACTC AGGGCAGAAA
1251  TTAAGCACTT TGTCAGCGAG CGTAAATATG ACGAGGAGCT CGGGAAAGCT
1301  GCCCGGTTTT CCTGTGACAT CGAACAGCTG AAGGCCCAAA TCATGCTCTG
1351  CGGAGAAATT ACACATCCAA AGAACAACTA TTCCTCAAGA ACTCCCTGCA
1401  GCTCCCTGCT GCCTCTGCTG AATGCGCACG CAGCAACCTC TGGGAAACAG
1451  AGTAACTTTT CCCGAAAATC ATCCACTCAC AATAAGCCCT CTGAAGGCAA
1501  AGCGGCAAAC CCCAAAATGG TGAGCAGTCT CCCCAGCACC GCCGACCCCT
1551  CTCACCAGAC CATGCCGGCC AACAAGCAGA ATGGATCTTC TAACCAAAGA
1601  CGGAGATTTA ATCCACAGTA TCATAACAAC AGGCTAAATG GGCCTGCCAA
1651  GTCGCAGGGC AGTGGGAATG AAGCCGAGCC ACTGGGAAAG GGCAACAGCC
1701  GCCACGAACA CAGAAGACAG CCGCACAACG GCTTCCGGCC CAAAAACAAA
1751  GGCGGTGCCA AAAATCAAGA GGCTTCCTTG GGGATGAAGA CCCCCGAGGC
1801  CCCGGCCCAT TCTGAAAAGC CCCGGCGAAG GCAGCACGCT GCAGACACCT
1851  CGGAGGCCAG GCCCTTCCGG GGTAGTGTCG GTAGGGTTTC ACAGTGCAAT
1901  CTCTGCCCCA CGAGAATAGA AGTTTCCACA GATGCAGCAG TTCTCTCAGT
1951  CCCGGCTGTG ACGTTGGTGG CCTGAGCTAG GAGGAAAAAG AGCAGTTTTC
2001  ACTCAGTTTT GGTTCCCTGC CCGAGGTGCT GACCCAATTC GCTGCCAAAA
2051  GAGTGTCAAT CAGAATATAC AAATCCCGTA TGGTTGTGTC ATCCTCTCTT
2101  AATCATTTTT ACTAATTCTA ATAATCAGCT CTAGCTTGCT TCATAATTTT
2151  CATGGCTTTG CTTGATCTGT TGATGCTTTC TCTCATCAAG ACTTTGCAGC
2201  ATTTTAGCCA GGCAGTATTT ACTCATTATT AGGAAAATCA AGATGTGGCT
2251  GAAGATCAGA GGCTCAGTTA GCAACCTGTG TTGTAGCAGT GATGTCAGTC
2301  CATTGATTGT CTTTAGAGAG TTAATGTTAC AAAAAAGAAT TCTTAATAAT
2351  CAGACAAACA TGATCTGCTG AGGACACATG CGCTTTTGTA GAATTTAACA
2401  TCTGGTGTTT TTCTGAAAAA ATATATATAC ATATATTGCT TTATTTGAAA
2451  CAAATTAAAA TATGCTGCAT TTGAAAAAAA AAAAAAAAAA AA
B:氨基酸序列:(SEQ ID NO:2)长度:476个氨基酸
  1  MLKTRWRGLE AGPLQPQPPQ IQNGPMNGCE KDSSSTDSAN EKPALIPREK
 51  KISILEEPSK ALRGVTEGNR LLQQKLSLDG NPKPIHGTTE RSDGLQWSAE
101  QPCNPSKPKA KTSPVKSNTP AAHLEIKPDE LAKKRGPNIE KSVKDLQRCT
151  VSLTRYRVMI KEEVDSSVKK IKAAFAELHN CIIDKEVSLM AEMDKVKEEA
201  MEILTARQKK AEELKRLTDL ASQMAEMQLA ELRAEIKHFV SERKYDEELG
251  KAARFSCDIE QLKAQIMLCG EITHPKNNYS SRTPCSSLLP LLNAHAATSG
301  KQSNFSRKSS THNKPSEGKA ANPKMVSSLP STADPSHQTM PANKQNGSSN
351  QRRRFNPQYH NNRLNGPAKS QGSGNEAEPL GKGNSRHEHR RQPHNGFRPK
401  NKGGAKNQEA SLGMKTPEAP AHSEKPRRRQ HAADTSEARP FRGSVGRVSQ
451  CNLCPTRIEV STDAAVLSVP AVTLVA
C:核苷酸及氨基酸组合序列(SEQ ID NO:3)
克隆号和蛋白名称:SP1224
起始编码子:545 ATG  终止编码子:1975 TGA
蛋白质分子量:52451.74
  1    C CCA CGC GTC CGG GAA TCC AGT CCG GGG GCC GAG CTG GCT GCG CCC     46
 47  TCC GCC AAG CGC CGG CAG CGC GGG GCG AGC TCC GGA CGG CGC GCG GCC     94
 95  CAG GCA GCG GCT CCC GCT CGG CCC GCC CTC CGA GCC GCA GGG GCC GCC    142
143  ACC GCC GCG GCG CCT CCC CTG GCG ACC GCG CCC CCG GGC CCC GGC TCC    190
191  GGC CCG GGA CGG AGG AGC CGG CGC TCG ACA CAG AGA GCT CTT CAG AAA    238
239  CCA GGC TGC TTT CAG GAA CAT TGC TGT GGA TTC CCA GGG CCT ATT CCA    286
287  CTA GAA GCA AGA TGG CTG AAC TCA ATA CTC ATG TGA ATG TCA AGG AAA    334
335  AGA TCT ATG CAG TTA GAT CAG TTG TTC CCA ACA AAA GCA ATA ATG AAA    382
383  TAG TCC TGG TGC TCC AAC AGT TTG ATT TTA ATG TGG ATA AAG CCG TGC    430
431  AAG CCT TTG TGG ATG GCA GTG CAA TTC AAG TTC TAA AAG AAT GGA ATA    478
479  TGA CAG GAA AAA AGA AGA ACA ATA AAA GAA AAA GAA GCA AGT CCA AGC    526
 527  AGC ATC AAG GCA ACA AAG ATG CTA AAG ACA AGG TGG AGA GGC CTT GAG    574
   1                          Met Leu Lys Thr Arg Trp Arg Gly Leu Glu     10
 575  GCA GGG CCC CTG CAG CCG CAG CCA CCA CAG ATT CAA AAC GGC CCC ATG    622
  11  Ala Gly Pro Leu Gln Pro Gln Pro Pro Gln Ile Gln Asn Gly Pro Met     26
 623  AAT GGC TGC GAG AAG GAC AGC TCG TCC ACA GAT TCT GCT AAC GAA AAA    670
  27  Asn Gly Cys Glu Lys Asp Ser Ser Ser Thr Asp Ser Ala Asn Glu Lys     42
 671  CCA GCC CTT ATC CCT CGT GAG AAA AAG ATC TCG ATA CTT GAG GAA CCT    718
  43  Pro Ala Leu Ile Pro Arg Glu Lys Lys Ile Ser Ile Leu Glu Glu Pro     58
 719  TCA AAG GCA CTT CGT GGG GTC ACA GAA GGC AAC AGA CTA CTG CAA CAG    766
  59  Ser Lys Ala Leu Arg Gly Val Thr Glu Gly Asn Arg Leu Leu Gln Gln     74
 767  AAA CTA TCC TTA GAT GGG AAC CCC AAA CCT ATA CAT GGA ACA ACA GAG    814
  75  Lys Leu Ser Leu Asp Gly Asn Pro Lys Pro Ile His Gly Thr Thr Glu     90
 815  AGG TCA GAT GGC CTA CAG TGG TCA GCT GAG CAG CCT TGT AAC CCA AGC    862
  91  Arg Ser Asp Gly Leu Gln Trp Ser Ala Glu Gln Pro Cys Asn Pro Ser    106
 863  AAG CCT AAG GCA AAA ACA TCT CCT GTT AAG TCC AAT ACC CCT GCA GCT    910
 107  Lys Pro Lys Ala Lys Thr Ser Pro Val Lys Ser Asn Thr Pro Ala Ala    122
 911  CAT CTT GAA ATA AAG CCA GAT GAG TTG GCA AAG AAA AGA GGC CCA AAT    958
 123  His Leu Glu Ile Lys Pro Asp Glu Leu Ala Lys Lys Arg Gly Pro Asn    138
 959  ATT GAG AAA TCA GTG AAG GAT TTG CAA CGC TGC ACC GTT TCT CTA ACT   1006
 139  Ile Glu Lys Ser Val Lys Asp Leu Gln Arg Cys Thr Val Ser Leu Thr    154
1007  AGA TAT CGC GTC ATG ATT AAG GAA GAA GTG GAT AGT TCC GTG AAG AAG   1054
 155  Arg Tyr Arg Val Met Ile Lys Glu Glu Val Asp Ser Ser Val Lys Lys    170
1055  ATC AAA GCT GCC TTT GCT GAA TTA CAC AAC TGC ATC ATT GAC AAA GAA   1102
 171  Ile Lys Ala Ala Phe Ala Glu Leu His Asn Cys Ile Ile Asp Lys Glu    186
1103  GTT TCA TTA ATG GCA GAA ATG GAT AAA GTT AAA GAA GAA GCC ATG GAA   1150
 187  Val Ser Leu Met Ala Glu Met Asp Lys Val Lys Glu Glu Ala Met Glu    202
1151  ATC CTG ACT GCT CGT CAG AAG AAA GCA GAA GAA CTA AAG AGA CTC ACT   1198
 203  Ile Leu Thr Ala Arg Gln Lys Lys Ala Glu Glu Leu Lys Arg Leu Thr    218
1199  GAC CTT GCC AGT CAG ATG GCA GAG ATG CAG CTG GCC GAA CTC AGG GCA   1246
 219  Asp Leu Ala Ser Gln Met Ala Glu Met Gln Leu Ala Glu Leu Arg Ala    234
1247  GAA ATT AAG CAC TTT GTC AGC GAG CGT AAA TAT GAC GAG GAG CTC GGG   1294
 235  Glu Ile Lys His Phe Val Ser Glu Arg Lys Tyr Asp Glu Glu Leu Gly    250
1295  AAA GCT GCC CGG TTT TCC TGT GAC ATC GAA CAG CTG AAG GCC CAA ATC   1342
 251  Lys Ala Ala Arg Phe Ser Cys Asp Ile Glu Gln Leu Lys Ala Gln Ile    266
1343  ATG CTC TGC GGA GAA ATT ACA CAT CCA AAG AAC AAC TAT TCC TCA AGA   1390
 267  Met Leu Cys Gly Glu Ile Thr His Pro Lys Asn Asn Tyr Ser Ser Arg    282
1391  ACT CCC TGC AGC TCC CTG CTG CCT CTG CTG AAT GCG CAC GCA GCA ACC    1438
 283  Thr Pro Cys Ser Ser Leu Leu Pro Leu Leu Asn Ala His Ala Ala Thr     298
1439  TCT GGG AAA CAG AGT AAC TTT TCC CGA AAA TCA TCC ACT CAC AAT AAG    1486
 299  Ser Gly Lys Gln Ser Asn Phe Ser Arg Lys Ser Ser Thr His Asn Lys     314
1487  CCC TCT GAA GGC AAA GCG GCA AAC CCC AAA ATG GTG AGC AGT CTC CCC    1534
 315  Pro Ser Glu Gly Lys Ala Ala Asn Pro Lys Met Val Ser Ser Leu Pro     330
1535  AGC ACC GCC GAC CCC TCT CAC CAG ACC ATG CCG GCC AAC AAG CAG AAT    1582
 331  Ser Thr Ala Asp Pro Ser His Gln Thr Met Pro Ala Asn Lys Gln Asn     346
1583  GGA TCT TCT AAC CAA AGA CGG AGA TTT AAT CCA CAG TAT CAT AAC AAC    1630
 347  Gly Ser Ser Asn Gln Arg Arg Arg Phe Asn Pro Gln Tyr His Asn Asn     362
1631  AGG CTA AAT GGG CCT GCC AAG TCG CAG GGC AGT GGG AAT GAA GCC GAG    1678
 363  Arg Leu Asn Gly Pro Ala Lys Ser Gln Gly Ser Gly Asn Glu Ala Glu     378
1679  CCA CTG GGA AAG GGC AAC AGC CGC CAC GAA CAC AGA AGA CAG CCG CAC    1726
 379  Pro Leu Gly Lys Gly Asn Ser Arg His Glu His Arg Arg Gln Pro His     394
1727  AAC GGC TTC CGG CCC AAA AAC AAA GGC GGT GCC AAA AAT CAA GAG GCT    1774
 395  Asn Gly Phe Arg Pro Lys Asn Lys Gly Gly Ala Lys Asn Gln Glu Ala     410
1775  TCC TTG GGG ATG AAG ACC CCC GAG GCC CCG GCC CAT TCT GAA AAG CCC    1822
 411  Ser Leu Gly Met Lys Thr Pro Glu Ala Pro Ala His Ser Glu Lys Pro     426
1823  CGG CGA AGG CAG CAC GCT GCA GAC ACC TCG GAG GCC AGG CCC TTC CGG    1870
 427  Arg Arg Arg Gln His Ala Ala Asp Thr Ser Glu Ala Arg Pro Phe Arg     442
1871  GGT AGT GTC GGT AGG GTT TCA GAG TGC AAT CTC TGC CCC ACG AGA ATA    1918
 443  Gly Ser Val Gly Arg Val Ser Gln Cys Asn Leu Cys Pro Thr Arg Ile     458
1919  GAA GTT TCC ACA GAT GCA GCA GTT CTC TCA GTC CCG GCT GTG ACG TTG    1966
 459  Glu Val Ser Thr Asp Ala Ala Val Leu Ser Val Pro Ala Val Thr Leu     474
1967  GTG GCC TGA GCT AGG AGG AAA AAG AGC AGT TTT CAC TCA GTT TTG GTT    2014
 475  Val Ala ***                                                         477
2015  CCC TGC CCG AGG TGC TGA CCC AAT TCG CTG CCA AAA GAG TGT CAA TCA    2062
2063  GAA TAT ACA AAT CCC GTA TGG TTG TGT CAT CCT CTC TTA ATC ATT TTT    2110
2111  ACT AAT TCT AAT AAT CAG CTC TAG CTT GCT TCA TAA TTT TCA TGG CTT    2158
2159  TGC TTG ATC TGT TGA TGC TTT CTC TCA TCA AGA CTT TGC AGC ATT TTA    2206
2207  GCC AGG CAG TAT TTA CTC ATT ATT AGG AAA ATC AAG ATG TGG CTG AAG    2254
2255  ATC AGA GGC TCA GTT AGC AAC CTG TGT TGT AGC AGT GAT GTC AGT CCA    2302
2303  TTG ATT GTC TTT AGA GAG TTA ATG TTA CAA AAA AGA ATT CTT AAT AAT    2350
2351  CAG ACA AAC ATG ATC TGC TGA GGA CAC ATG CGC TTT TGT AGA ATT TAA    2398
2399  CAT CTG GTG TTT TTC TGA AAA AAT ATA TAT ACA TAT ATT GCT TTA TTT    2446
2447  GAA ACA AAT TAA AAT ATG CTG CAT TTG AAA AAA AAA AAA AAA AAA A      2492
D:Blastp结果
Query=SP1224[基因=SP1224](476个氨基酸)
>SP_IN:046309 046309 drosophila melanogaster(fruit fly).eg:8d8.6
            protein.5/1999
长度=402
分值=45.7 bits(106),预计值=8e-04
相同性=42/186(22%),相似性=80/186(42%),缺口=16/186(8%)
Query:291 LLNAHAATSGKQSNFSRKSSTHNKPSEGKAANPKMVSSLPSTADPSHQTMPANKQNGSSN 350
           ++ A AA +GK+   ++K+S    P+    ++ ++ +  PS     HQ   A +    +
Sbjct:1   MADAQAAAAGKKKYKNKKNSAEKNPNHNPNSSGQVEAQTPSNGHVQHQEEEATEDQEPAQ 60
Query:351 QRRRFNPQYHNNRLNGPAKSQGSGNEAEPLGKGNSRHEHRRQPHNGFRPKNKGGAKNQEA 410
           +R     + H    NG    +    EA PLG+  + H H    +N  R    G + N  +
Sbjct:61  ELRGLLKKMH--LCNGHGHKE---QEARPLGEVVNGHAHGHSNNNHIR-CTSGSSNNNNS 114
Query:411 SLGMKTPEAPAHSEKPRRR---QHAADTSEARPFRGSVGRVSQ--CNLCPT-----RIEV 460
           +    + ++  ++ K RR       +D++  +P    +   S+   N+ PT     + +V
Sbjct:115 THNNNSVDSSNNNRKQRREGGDGGGSDSNSLKPEEKPITATSKTTANIHPTTTTDPKPKV 174
Query:461 STDAAV 466
           S D AV
Sbjct:175 SEDVAV 180
>SW:YG6P_CAEEL P90970 caenorhabditis elegans.hypothetical 60.7 kd
             protein t23g11.8 in chromosome i.11/1997
长度=530
分值=44.9 bits(104),预计值=0.001
相同性=51/201(25%),相似性=98/201(48%),缺口=18/201(8%)
Query:115 VKSNTPAAHLEIKPDELAKKRGPNIEKSVKDLQRCTVSLTRYRVMIKEEVDSSVKKIKAA 174
           V++   ++H      EL   R    ++  K ++ C +   R  V ++EE+ + V++++ A
Sbjct:180 VENQKVSSHEMDSLQELKLARQKAQDQKEKAVEECNMH-KRKIVGLEEEIRAMVEQLRLA 238
Query:175 FAELHNCIIDKEVSLMAEMDKVKEEAMEILTARQKKAEELKRLTDLASQMAEMQLAELRA 234
              L+    +K+     E D+ K +A +ILTA++K  E LK    + S    + L  L+A
Sbjct:239 KFNLNE---NKK-----EFDEYKNKAQKILTAKEKLVESLKSEQGIGSSDRPVHL--LQA 288
Query:235 EIKHFVSER---KYDEELGKAARFS--CDIEQLKAQIM-LCGEITHPKNNY-SSRTPCSS 287
           E++    ER   K D E  +   ++   D+E+L+AQI  L  +++  K  +   +    S
Sbjct:289 EVEEIRVERDLTKADLESAQLQVYTLRSDMEELEAQIRDLQSQLSDQKRTHLEEKQTWDS 348
Query:288 LLPLLNAHAATSGKQSNFSRK 308
            +LLN      S  ++F+++
Sbjct:349 TIGLLNEKVECSRIENEFTKQ 369
2.  PP265
A:核苷酸序列:(SEQ ID NO:4)长度:1969bp
1  CGGCCGCGAG GTGGCCATGA AGATCCAGTA CCCTGGCGTG GCCCAGAGCA
  51  TCAACAGTGA TGTCAACAAC CTCATGGCCG TGTTGAACAT GAGCAACATG
 101  CTTCCAGAAG GCCTGTTCCC CGAGCACCTG ATCGACGTGC TGAGGCGGGA
 151  GCTGGCCCTG GAGTGTGACT ACCAGCGAGA GGCCGCCTGT GCCCGCAAGT
 201  TCAGGTGTGG CCCCCGGCCG GGCCCCTTGC GTGTTTGCAC CAGGGAGGCA
 251  GAAGGGACCA TGTTCAGCAG CTGGTGAAGG CCCCTCCAGC TCTGAGGGGC
 301  AGAGGGCTGG GGTTGCAGCC TGGGCCGAGG CCATATCCTG CCTGGGGTGA
 351  AGGAGGGCCC TCTGCCTGGT TGGGGGGTGT GTGTGGGGGG GGGGACGGTG
 401  TGGAGGGCCT GTGGCTAGGG CGTGACCTCC CTCCCCTACC CAGGGACCTG
 451  CTGAAGGGCC ACCCCTTCTT CTATGTGCCT GAGATTGTGG ATGAGCTCTG
 501  CAGCCCACAT GTGCTGACCA CAGAGCTGGT GTCTGGCTTC CCCCTGGACC
 551  AGGCCGAAGG GCTCAGCCAG GAGATTCGGA ACGAGATCTG CTACAACATC
 601  CTGGTTCTGT GCCTGAGGGA GCTGTTCGAG TTCCACTTCA TGCAAACAGA
 651  CCCCAACTGG TCCAACTTCT TCTATGACCC CCAGCAGCAC AAGGTGGCTC
 701  TTTTGGATTT TGGGGCAACG CGGGAATATG ACAGATCCTT CACCGACCTC
 751  TACATTCAGA TCATCAGGGC TGCTGCCGAC AGGGACAGGG AGACTGTGCG
 801  GGCGAAATCC ATAGAGATGA AGTTCCTCAC CGGCTACGAG GTCAAGGTCA
 851  TGGAAGACGC CCACTTGGAT GCCATCCTCA TCCTGGGGGA GGCCTTCGCC
 901  TCTGATGAGC CTTTTGATTT TGGCACTCAG AGCACCACCG AGAAGATCCA
 951  CAACCTGATT CCCGTCATGC TGAGGCACCG TCTCGTCCCC CCACCCGAGG
1001  AAACCTACTC CCTGCACAGG AAGATGGGGG GCTCCTTCCT CATCTGCTCC
1051  AAGCTGAAGG CCCGCTTCCC CTGCAAGGCC ATGTTCGAGG AGGCCTACAG
1101  CAACTACTGC AAGAGGCAGG CCCAGCAGTA GGGCTGCGGG CCACGCCCAG
1151  GCCGGCTCCG CGGGAACTCT CTCCCTCAGA CAGGCCAAAA ACCAGTAGCG
1201  AGGTCGTGGT GATGCTCTTT TTAACTCCTT TGCCCAATAA GGGGGGTGGC
1251  TGCCTGGAGC CCCGTAGCCA GCGCTTTCCA CGGTTTCTGT TGCTAAATGG
1301  TTGTAGGGTG AGAAGTGCAA GAATGAAGAT GAAGCCCCAC TGCTCGGTCA
1351  GTCTGCCTCC GTGTGTCCTC TGAAATAAGC AGATGAAGAT GAAAGGGCAA
1401  CTTTGTTTTC TTCTTTTTCC TGATGTGAAT GTTAAGCAGA AGGGAGAGAG
1451  TCCTTACTCC CTTCCAATCT CTGTTCAGTG CAAAACCCAG AAACATGACA
1501  GATACGATTG TGGGATTTTA TCATCTGTGT AGTAGGTGTG TGTATGTGTT
1551  TCTAGAGTGA GATTTGTGTT TTCTGCCCTT TTCCTCTCCA GCCAATGGGC
1601  TGGAGCTGGG AGAGGTGCTG AGCTAACAGT GCCAACAAGT GCTCCTTAAG
1651  CCTGCGAGGC CCAGGCCTGT GGGGCTGGTT CTCACCTTTG ACAGCTGAAT
1701  GTTCCTAAAG AACTGCTGCC CCACAGTGAG GGTGGGAGCA GCGGAACAGG
1751  GAATGCCAGA CACAGGCTCG CTGCTGCTGG AAGGCGGGGT GGGACTTCCT
1801  TCCTCTGTCC AGAGAGGCAC AGGTGTCACC AGTTCCAGCC AAAGGCTCCT
1851  CACAGGCGCT GTGAATTTTT GTACAAGTCT TGTAATTATC GAATCAACAA
1901  CTTGTTTCAA TTTAATAAAA ATGCTCATGG GAAGTGCAAA AAAAAAAAAA
1951  AAAAAAAAAA AAAAAAAAA
B:氨基酸序列:(SEQ ID NO:5)长度:163个氨基酸
  1  MQTDPNWSNF  FYDPQQHKVA  LLDFGATREY  DRSFTDLYIQ  IIRAAADRDR
 51  ETVRAKSIEM  KFLTGYEVKV  MEDAHLDAIL  ILGEAFASDE  PFDFGTQSTT
101  EKIHNLIPVM  LRHRLVPPPE  ETYSLHRKMG  GSFLICSKLK  ARFPCKAMFE
151  EAYSNYCKRQ  AQQ
C:核苷酸及氨基酸组合序列(SEQ ID NO:6)
克隆号和蛋白名称:PP265
起始编码子:640 ATG终止编码子:1131 TAG
蛋白质分子量:18935.63
   1  CGG CCG CGA GGT GGC CAT GAA GAT CCA GTA CCC TGG CGT GGC CCA GAG    48
  49  CAT CAA CAG TGA TGT CAA CAA CCT CAT GGC CGT GTT GAA CAT GAG CAA    96
  97  CAT GCT TCC AGA AGG CCT GTT CCC CGA GCA CCT GAT CGA CGT GCT GAG    144
 145  GCG GGA GCT GGC CCT GGA GTG TGA CTA CCA GCG AGA GGC CGC CTG TGC    192
 193  CCG CAA GTT CAG GTG TGG CCC CCG GCC GGG CCC CTT GCG TGT TTG CAC    240
 241  CAG GGA GGC AGA AGG GAC CAT GTT CAG CAG CTG GTG AAG GCC CCT CCA    288
 289  GCT CTG AGG GGC AGA GGG CTG GGG TTG CAG CCT GGG CCG AGG CCA TAT    336
 337  CCT GCC TGG GGT GAA GGA GGG CCC TCT GCC TGG TTG GGG GGT GTG TGT    384
 385  GGG GGG GGG GAC GGT GTG GAG GGC CTG TGG CTA GGG CGT GAC CTC CCT    432
 433  CCC CTA CCC AGG GAC CTG CTG AAG GGC CAC CCC TTC TTC TAT GTG CCT    480
 481  GAG ATT GTG GAT GAG CTC TGC AGC CCA CAT GTG CTG ACC ACA GAG CTG    528
 529  GTG TCT GGC TTC CCC CTG GAC CAG GCC GAA GGG CTC AGC CAG GAG ATT    576
 577  CGG AAC GAG ATC TGC TAC AAC ATC CTG GTT CTG TGC CTG AGG GAG CTG    624
 625  TTC GAG TTC CAC TTC ATG CAA ACA GAC CCC AAC TGG TCC AAC TTC TTC    672
   1                      Met Gln Thr Asp Pro Asn Trp Ser Asn Phe Phe     11
 673  TAT GAC CCC CAG CAG CAC AAG GTG GCT CTT TTG GAT TTT GGG GCA ACG    720
  12  Tyr Asp Pro Gln Gln His Lys Val Ala Leu Leu Asp Phe Gly Ala Thr     27
 721  CGG GAA TAT GAC AGA TCC TTC ACC GAC CTC TAC ATT CAG ATC ATC AGG    768
  28  Arg Glu Tyr Asp Arg Ser Phe Thr Asp Leu Tyr Ile Gln Ile Ile Arg     43
 769  GCT GCT GCC GAC AGG GAC AGG GAG ACT GTG CGG GCG AAA TCC ATA GAG    816
  44  Ala Ala Ala Asp Arg Asp Arg Glu Thr Val Arg Ala Lys Ser Ile Glu     59
 817  ATG AAG TTC CTC ACC GGC TAC GAG GTC AAG GTC ATG GAA GAC GCC CAC    864
  60  Met Lys Phe Leu Thr Gly Tyr Glu Val Lys Val Met Glu Asp Ala His     75
 865  TTG GAT GCC ATC CTC ATC CTG GGG GAG GCC TTC GCC TCT GAT GAG CCT    912
  76  Leu Asp Ala Ile Leu Ile Leu Gly Glu Ala Phe Ala Ser Asp Glu Pro     91
 913  TTT GAT TTT GGC ACT CAG AGC ACC ACC GAG AAG ATC CAC AAC CTG ATT    960
  92  Phe Asp Phe Gly Thr Gln Ser Thr Thr Glu Lys Ile His Asn Leu Ile    107
 961  CCC GTC ATG CTG AGG CAC CGT CTC GTC CCC CCA CCC GAG GAA ACC TAC   1008
 108  Pro Val Met Leu Arg His Arg Leu Val Pro Pro Pro Glu Glu Thr Tyr    123
1009  TCC CTG CAC AGG AAG ATG GGG GGC TCC TTC CTC ATC TGC TCC AAG CTG   1056
 124  Ser Leu His Arg Lys Met Gly Gly Ser Phe Leu Ile Cys Ser Lys Leu    139
1057  AAG GCC CGC TTC CCC TGC AAG GCC ATG TTC GAG GAG GCC TAC AGC AAC   1104
 140  Lys Ala Arg Phe Pro Cys Lys Ala Met Phe Glu Glu Ala Tyr Ser Asn    155
1105  TAC TGC AAG AGG CAG GCC CAG CAG TAG GGC TGC GGG CCA CGC CCA GGC   1152
 156  Tyr Cys Lys Arg Gln Ala Gln Gln ***                                164
1153  CGG CTC CGC GGG AAC TCT CTC CCT CAG ACA GGC CAA AAA CCA GTA GCG   1200
1201  AGG TCG TGG TGA TGC TCT TTT TAA CTC CTT TGC CCA ATA AGG GGG GTG   1248
1249  GCT GCC TGG AGC CCC GTA GCC AGC GCT TTC CAC GGT TTC TGT TGC TAA   1296
1297  ATG GTT GTA GGG TGA GAA GTG CAA GAA TGA AGA TGA AGC CCC ACT GCT   1344
1345  CGG TCA GTC TGC CTC CGT GTG TCC TCT GAA ATA AGC AGA TGA AGA TGA    1392
1393  AAG GGC AAC TTT GTT TTC TTC TTT TTC CTG ATG TGA ATG TTA AGC AGA    1440
1441  AGG GAG AGA GTC CTT ACT CCC TTC CAA TCT CTG TTC AGT GCA AAA CCC    1488
1489  AGA AAC ATG ACA GAT ACG ATT GTG GGA TTT TAT CAT CTG TGT AGT AGG    1536
1537  TGT GTG TAT GTG TTT CTA GAG TGA GAT TTG TGT TTT CTG CCC TTT TCC    1584
1585  TCT CCA GCC AAT GGG CTG GAG CTG GGA GAG GTG CTG AGC TAA CAG TGC    1632
1633  CAA CAA GTG CTC CTT AAG CCT GCG AGG CCC AGG CCT GTG GGG CTG GTT    1680
1681  CTC ACC TTT GAC AGC TGA ATG TTC CTA AAG AAC TGC TGC CCC ACA GTG    1728
1729  AGG GTG GGA GCA GCG GAA CAG GGA ATG CCA GAC ACA GGC TCG CTG CTG    1776
1777  CTG GAA GGC GGG GTG GGA CTT CCT TCC TCT GTC CAG AGA GGC ACA GGT    1824
1825  GTC ACC AGT TCC AGC CAA AGG CTC CTC ACA GGC GCT GTG AAT TTT TGT    1872
1873  ACA AGT CTT GTA ATT ATC GAA TCA ACA ACT TGT TTC AAT TTA ATA AAA    1920
1921  ATG CTC ATG GGA AGT GCA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    1968
1969  A                                                                  1969
  D:Blastp结果
Query=PP265[基因=PP265](163个氨基酸)
>SW:YLC4_CAEEL Q18486 caenorhabditis elegans.hypothetical 81.0 kd
            protein c35d10.4 in chromosomeiii.7/1998
长度=733
分值=176 bits(441),预计值=1e-43
相同性=81/160(50%),相似性=110/160(68%),缺口=4/160(2%)
Query:1   MQTDPNWSNFFYDPQ----QHKVALLDFGATREYDRSFTDLYIQIIRAAADRDRETVRAK 56
           MQTDPNWSNFF        + ++ LLDFGA+R Y + F D+Y+ II++A D D++ +
Sbjct:562 MQTDPNWSNFFLGKHPKTGEPRLVLLDFGASRAYGKKFVDIYMNIIKSAYDGDKKKIIEY 621
Query:57  SIEMKFLTGYEVKVMEDAHLDAILILGEAFASDEPFDFGTQSTTEKIHNLIPVMLRHRLV 116
           S E+ FLTGYE  VMEDAH+++++I+GE  AS+ P++F  Q  T +I  LIPVML HRL
Sbjct:622 SREIGFLTGYETSVMEDAHVESVMIMGETLASNHPYNFANQDVTMRIQKLIPVMLEHRLT 681
Query:117 PPPEETYSLHRKMGGSFLICSKLKARFPCKAMFEEAYSNY 156
            PPEE YSLHRK+ G +L+ +KLKA   C  +F E + NY
Sbjct:682 SPPEEIYSLHRKLSGCYLLAAKLKATVSCGGLFHEIHENY 721
>PIR2:S71110 abc1 protein-fission yeast(Schizosaccharomyces
            pombe)
长度=610
分值=161 bits(404),预计值=3e-39
相同性=78/158(49%),相似性=105/158(66%),缺口=2/158(1%)
Query:1   MQTDPNWSNFFYDPQQHKVALLDFGATREYDRSFTDLYIQIIRAAADRDRETVRAKSIEM  60
           MQTDPNWSNF Y+ +  K+ LLDFGA+ EYD  F   Y +++ AAA R+RE  +  S+E+
Sbjct:451 MQTDPNWSNFLYNGKTKKIELLDFGASIEYDEKFIKKYCRLLLAAAHRNREKCKKLSVEL 510
Query:61  KFLTGYEVKVMEDAHLDAILILGEAFASDEP--FDFGTQSTTEKIHNLIPVMLRHRLVPP 118
            +L  +E   M DAH+++I  L E FA D P  +DFG Q+ T ++   IPVML  RL PP
Sbjct:511 GYLNNHESAQMIDAHINSIFTLAEPFAFDAPDVYDFGDQTITARVKQQIPVMLDLRLQPP 570
Query:119 PEETYSLHRKMGGSFLICSKLKARFPCKAMFEEAYSNY 156
           PEETYSLHR++ G FL+C+KL A+  CK +F     +Y
Sbjct:571 PEETYSLHRRLSGHFLLCAKLGAKVRCKELFSGMLKHY 608
>SW:ABCI_SCHPO Q92338 schizosaccharomyces pombe(fission yeast).
            abc1 protein homolog precursor.12/1998
长度=610
分值=161bits(404),预计值=3e-39
相同性=78/158(49%),相似性=105/158(66%),缺口=2/158(1%)
Query:1   MQTDPNWSNFFYDPQQHKVALLDFGATREYDRSFTDLYIQIIRAAADRDRETVRAKSIEM  60
           MQTDPNWSNF Y+ +  K+ LLDFGA+ EYD  F   Y +++ AAA R+RE  +  S+E+
Sbjct:451 MQTDPNWSNFLYNGKTKKIELLDFGASIEYDEKFIKKYCRLLLAAAHRNREKCKKLSVEL 510
Query:61  KFLTGYEVKVMEDAHLDAILILGEAFASDEP--FDFGTQSTTEKIHNLIPVMLRHRLVPP 118
            +L  +E   M DAH+++I  L E FA D P  +DFG Q+ T ++    IPVML RL PP
Sbjct:511 GYLNNHESAQMIDAHINSIFTLAEPFAFDAPDVYDFGDQTITARVKQQIPVMLDLRLQPP 570
Query:119 PEETYSLHRKMGGSFLICSKLKARFPCKAMFEEAYSNY 156
           PEETYSLHR++ G FL+C+KL A+  CK+F      +Y
Sbjct:571 PEETYSLHRRLSGHFLLCAKLGAKVRCKELFSGMLKHY 608
3.PP384
A:核苷酸序列:(SEQ ID NO:7)  长度:2357bp
   1  CAAAGGGCTG TTGCTGACAG TTAATACCAG TAGTCAGAAT GGGAAGGCCT
  51  GGAAGAACAC TTATTAAAGA AATCCAGAGT CCTCTGTCTA GTATCTGTGA
 101  TGGCTCCATA GCTCTAGATG CTGAGCCTGT TACCCAGCCA GCATCGCTGC
 151  CCAGACACAG CAGCACACCA GACCACACCA GCACACTGGA GCCTCCTCGT
 201  TTGCCTCAAA GAAAGAACTT ACAAAGTGAA AAGGAAACTT ATCAGCTGTC
 251  TAAGGAAGTG GAAATTTTAT CTAGGAACCT GGTTGAAATG CAACGGTGTC
 301  TTTCTGAACT TACAAACCGT CTGCATAATG GGAAGAAATC CTCTTCAGTG
 351  TATCCACTCT CTCAAGATCT TCCTTATGTT CACATCATTT ACCAGAAACC
 401  TTATTATCTA GGTCCTGTTG TTGAAAAAAG AGCGGTGCTT CTCTGTGATG
 451  GTAAACTAAG GCTCAGTACA GTTCAGCAGA CTTTTGGCCT TTCTCTCATT
 501  GAAATGCTAC ATGATTCCCA CTGGATTCTT CTCTCTGCTG ACAGTGAGGG
 551  CTTTATCCCG TTAACCTTCA CAGCCACACA GGAAATAATC ATAAGAGATG
 601  GCAGCCTGTC CAGGTCAGAT GTCTTCAGAG ACTCTTTTTC TCACAGTCCA
 651  GGTGCTGTTT CTTCTCTTAA AGTCTTTACA GGCCTTGCTG CCCCCAGTTT
 701  AGATACCACT GGCTGTTGTA ACCATGTAGA TGGCATGGCT TGATATCTGC
 751  AGTGTCCTTG CTGTGTAGCT CTTCAGATGA GACCATTACA AACAAGGCCT
 801  GCTTGACACT GGACACTCGC CAATGAGACT CCCACTGCAC TCAGGCGAAG
 851  CGCTTGCCAT GGTCGGCTCT CCTGGTTTCC CCCTGTTTCC CCTGAGCTGA
 901  GGCTCGCTGC TGTGTAGCAG AGCTCAGTCT TTATTAGATG GCTCCGAAAG
 951  TGGTGTTTAT GTATTCATGA CTGTGTGGTT TTGACTAAGG GCAGAATTCT
1001  CAGAACAAAA CAATATTATG GTGCCATATG GATGGTGTTT TATGGTTTCT
1051  CTGAGGCTTT GTGTCCCTTG TCCAAAGCTG CATTGAAGCT GTCTTAGGAG
1101  CACTTAAAAG ATACCTTGGC ATTGTTATAG GTCTTTTTCT TGGCTTCAAG
1151  AGGAGGTTGA GGAGTCTGCT GGGGGGCATG TGCTCTAGCA TATTAACCTC
1201  AAACCAGCAA AGAATTAGCA GAGCTCCAAG GAGGACCAAG AGACCCACTG
1251  GCTTCTGCTC TCAGGAACAG GAAGTGGCTC TGATGTTGCC TGGACCTCCC
1301  AGAATTTAAA CCAAACCCTC TTGCTTCCTT AACAAATTCT GGCTGACGAA
1351  GGTCCAGGTA CTCTTAAAAA CTGGCCCTGG GAAAATTTTG AATGAAATTT
1401  CAAGGGAATT TGTCCCCTCT GGGTTCCACT TGAGGTTGTG CCGATGCTGC
1451  TACCACACTG TCGAGCCCAG GTAAGTCCTA CTGCAGGATT TTGTGCTGTG
1501  GCCACTCATG AGTGTCCCTG AAATAACTTT TTTTTTTTTT AAATCCAGTT
1551  TTGGGATCAC GCAACTTTCC TATTTTTCTC CCAGTAGTCA GCTCCCTTAG
1601  TTAACTTGTC ACTTTAATTT GATATTTTTA TTTTCTCTCC TTTTAAGTCT
1651  TAGAGACCAG CAGAGAATCT GTGAGAGAAA GTATTTCAGG AAGTTAGAAA
1701  TTCAACCGAA TCTGAGGTAG TCCTAAAAAG TGCCATTTTG TTTCACTTAT
1751  GGGCTAAAGT ACCAGCTTAG TCAGGTAAGA GCCCTGACCC ACTTCAGATG
1801  GTAACACCAC TTCTCACTGC CTTCAGATGG AATCACAGAT TTCAGTCACG
1851  GCGCATAACA AATTGATCAG TGAGTGGCTA GGCATCTGCA GATAAATTGT
1901  TTCAGCCATA GAAGCTCCAT TAGCACATAT GCTTCCTTTT CCCCCCTTCC
1951  TTTAAAATCA TCTGGAAAGA AACTATTTTG TGCCCTTGGG GACTCCTGTC
2001  TGTCTGTTAC AGTTTACCAA GATGGAGCTG GGTTAGGAAA GAAGTGAGGG
2051  CCCATTTTGT GGTTCAAGTG CACTAGACAG CTGCTGGGGT AGGAAGCACA
2101  GGCAATGTCT GCAATCAGCT GTGGGAGAGC GGTGACTGAG AACAGTCTGA
2151  GGCCTGGCTC CACTTGGAAG TATCTGGGGT GCGATGAAAT CACAATTATC
2201  TTGAAGCCTA AAGAGGGAAC TACAAGACTG TTAACTAAGA TCAATGTGGG
2251  CACCTAAAAG GGTATGTTAA AATCACCATT TCTCAGGTCA AAATACTGTG
2301  AATAAGTCTT CAATAAAATC ACTAATGGTT AAAAAAAAAA AAAAAAAAAA
2351  AAAAAAA
B:氨基酸序列:(SEQ ID NO:8)长度:234个氨基酸
 1   MGRPGRTLIK EIQSPLSSIC DGSIALDAEP VTQPASLPRH SSTPDHTSTL
 51  EPPRLPQRKN LQSEKETYQL SKEVEILSRN LVEMQRCLSE LTNRLHNGKK
101  SSSVYPLSQD LPYVHIIYQK PYYLGPVVEK RAVLLCDGKL RLSTVQQTFG
151  LSLIEMLHDS HWILLSADSE GFIPLTFTAT QEIIIRDGSL SRSDVFRDSF
201  SHSPGAVSSL KVFTGLAAPS LDTTGCCNHV DGMA
C:核苷酸及氨基酸组合序列(SEQ ID NO:9)
克隆号和蛋白名称:PP384
起始编码子:39 ATG     终止编码子:743 TGA
蛋白质分子量:25844.05
  1  CA AAG GGC TGT TGC TGA CAG TTA ATA CCA GTA GTC AGA ATG GGA AGG      47
  1                                                     Met Gly Arg       3
 48  CCT GGA AGA ACA CTT ATT AAA GAA ATC CAG AGT CCT CTG TCT AGT ATC     95
  4  Pro Gly Arg Thr Leu Ile Lys Glu Ile Gln Ser Pro Leu Ser Ser Ile     19
 96  TGT GAT GGC TCC ATA GCT CTA GAT GCT GAG CCT GTT ACC CAG CCA GCA    143
 20  Cys Asp Gly Ser Ile Ala Leu Asp Ala Glu Pro Val Thr Gln Pro Ala     35
144  TCG CTG CCC AGA CAC AGC AGC ACA CCA GAC CAC ACC AGC ACA CTG GAG    191
 36  Ser Leu Pro Arg His Ser Ser Thr Pro Asp His Thr Ser Thr Leu Glu     51
192  CCT CCT CGT TTG CCT CAA AGA AAG AAC TTA CAA AGT GAA AAG GAA ACT    239
 52  Pro Pro Arg Leu Pro Gln Arg Lys Asn Leu Gln Ser Glu Lys Glu Thr     67
240  TAT CAG CTG TCT AAG GAA GTG GAA ATT TTA TCT AGG AAC CTG GTT GAA    287
 68  Tyr Gln Leu Ser Lys Glu Val Glu Ile Leu Ser Arg Asn Leu Val Glu     83
 288  ATG CAA CGG TGT CTT TCT GAA CTT ACA AAC CGT CTG CAT AAT GGG AAG    335
  84  Met Gln Arg Cys Leu Ser Glu Leu Thr Asn Arg Leu His Asn Gly Lys     99
 336  AAA TCC TCT TCA GTG TAT CCA CTC TCT CAA GAT CTT CCT TAT GTT CAC    383
 100  Lys Ser Ser Ser Val Tyr Pro Leu Ser Gln Asp Leu Pro Tyr Val His    115
 384  ATC ATT TAC CAG AAA CCT TAT TAT CTA GGT CCT GTT GTT GAA AAA AGA    431
 116  Ile Ile Tyr Gln Lys Pro Tyr Tyr Leu Gly Pro Val Val Glu Lys Arg    131
 432  GCG GTG CTT CTC TGT GAT GGT AAA CTA AGG CTC AGT ACA GTT CAG CAG    479
 132  Ala Val Leu Leu Cys Asp Gly Lys Leu Arg Leu Ser Thr Val Gln Gln    147
 480  ACT TTT GGC CTT TCT CTC ATT GAA ATG CTA CAT GAT TCC CAC TGG ATT    527
 148  Thr Phe Gly Leu Ser Leu Ile Glu Met Leu His Asp Ser His Trp Ile    163
 528  CTT CTC TCT GCT GAC AGT GAG GGC TTT ATC CCG TTA ACC TTC ACA GCC    575
 164  Leu Leu Ser Ala Asp Ser Glu Gly Phe Ile Pro Leu Thr Phe Thr Ala    179
 576  ACA CAG GAA ATA ATC ATA AGA GAT GGC AGC CTG TCC AGG TCA GAT GTC    623
 180  Thr Gln Glu Ile Ile Ile Arg Asp Gly Ser Leu Ser Arg Ser Asp Val    195
 624  TTC AGA GAC TCT TTT TCT CAC AGT CCA GGT GCT GTT TCT TCT CTT AAA    671
 196  Phe Arg Asp Ser Phe Ser His Ser Pro Gly Ala Val Ser Ser Leu Lys    211
 672  GTC TTT ACA GGC CTT GCT GCC CCC AGT TTA GAT ACC ACT GGC TGT TGT    719
 212  Val Phe Thr Gly Leu Ala Ala Pro Ser Leu Asp Thr Thr Gly Cys Cys    227
 720  AAC CAT GTA GAT GGC ATG GCT TGA TAT CTG CAG TGT CCT TGC TGT GTA    767
 228  Asn His Val Asp Gly Met Ala ***                                    235
 768  GCT CTT CAG ATG AGA CCA TTA CAA ACA AGG CCT GCT TGA CAC TGG ACA    815
 816  CTC GCC AAT GAG ACT CCC ACT GCA CTC AGG CGA AGC GCT TGC CAT GGT    863
 864  CGG CTC TCC TGG TTT CCC CCT GTT TCC CCT GAG CTG AGG CTC GCT GCT    911
 912  GTG TAG CAG AGC TCA GTC TTT ATT AGA TGG CTC CGA AAG TGG TGT TTA    959
 960  TGT ATT CAT GAC TGT GTG GTT TTG ACT AAG GGC AGA ATT CTC AGA ACA   1007
1008  AAA CAA TAT TAT GGT GCC ATA TGG ATG GTG TTT TAT GGT TTC TCT GAG   1055
1056  GCT TTG TGT CCC TTG TCC AAA GCT GCA TTG AAG CTG TCT TAG GAG CAC   1103
1104  TTA AAA GAT ACC TTG GCA TTG TTA TAG GTC TTT TTC TTG GCT TCA AGA   1151
1152  GGA GGT TGA GGA GTC TGC TGG GGG GCA TGT GCT CTA GCA TAT TAA CCT   1199
1200  CAA ACC AGC AAA GAA TTA GCA GAG CTC CAA GGA GGA CCA AGA GAC CCA   1247
1248  CTG GCT TCT GCT CTC AGG AAC AGG AAG TGG CTC TGA TGT TGC CTG GAC   1295
1296  CTC CCA GAA TTT AAA CCA AAC CCT CTT GCT TCC TTA ACA AAT TCT GGC   1343
1344  TGA CGA AGG TCC AGG TAC TCT TAA AAA CTG GCC CTG GGA AAA TTT TGA   1391
1392  ATG AAA TTT CAA GGG AAT TTG TCC CCT CTG GGT TCC ACT TGA GGT TGT   1439
1440  GCC GAT GCT GCT ACC ACA CTG TCG AGC CCA GGT AAG TCC TAC TGC AGG   1487
1488  ATT TTG TGC TGT GGC CAC TCA TGA GTG TCC CTG AAA TAA CTT TTT TTT   1535
1536  TTT TTA AAT CCA GTT TTG GGA TCA CGC AAC TTT CCT ATT TTT CTC CCA   1583
1584  GTA GTC AGC TCC CTT AGT TAA CTT GTC ACT TTA ATT TGA TAT TTT TAT   1631
1632  TTT CTC TCC TTT TAA GTC TTA GAG ACC AGC AGA GAA TCT GTG AGA GAA   1679
1680  AGT ATT TCA GGA AGT TAG AAA TTC AAC CGA ATC TGA GGT AGT CCT AAA   1727
1728  AAG TGC CAT TTT GTT TCA CTT ATG GGC TAA AGT ACC AGC TTA GTC AGG   1775
1776  TAA GAG CCC TGA CCC ACT TCA GAT GGT AAC ACC ACT TCT CAC TGC CTT    1823
1824  CAG ATG GAA TCA CAG ATT TCA GTC ACG GCG CAT AAC AAA TTG ATC AGT    1871
1872  GAG TGG CTA GGC ATC TGC AGA TAA ATT GTT TCA GCC ATA GAA GCT CCA    1919
1920  TTA GCA CAT ATG CTT CCT TTT CCC CCC TTC CTT TAA AAT CAT CTG GAA    1967
1968  AGA AAC TAT TTT GTG CCC TTG GGG ACT CCT GTC TGT CTG TTA CAG TTT    2015
2016  ACC AAG ATG GAG CTG GGT TAG GAA AGA AGT GAG GGC CCA TTT TGT GGT    2063
2064  TCA AGT GCA CTA GAC AGC TGC TGG GGT AGG AAG CAC AGG CAA TGT CTG    2111
2112  CAA TCA GCT GTG GGA GAG CGG TGA CTG AGA ACA GTC TGA GGC CTG GCT    2159
2160  CCA CTT GGA AGT ATC TGG GGT GCG ATG AAA TCA CAA TTA TCT TGA AGC    2207
2208  CTA AAG AGG GAA CTA CAA GAC TGT TAA CTA AGA TCA ATG TGG GCA CCT    2255
2256  AAA AGG GTA TGT TAA AAT CAC CAT TTC TCA GGT CAA AAT ACT GTG AAT    2303
2304  AAG TCT TCA ATA AAA TCA CTA ATG GTT AAA AAA AAA AAA AAA AAA AAA    2351
2352  AAA AAA                                                            2357
D:Blastp结果
Query=PP384[基因=PP384](234个氨基酸)
>PIR2:S06286 major merozoite surface antigen precursor-Plasmodium
            falciparum(strain RO-33Ghana)(fragment)
长度=1060
分值=34.8 bits(78),预计值=0.68
相同性=20/70(28%),相似性=36/70(50%),缺口=3/70(4%)
Query:55  LPQRKNLQSE---KETYQLSKEVEILSRNLVEMQRCLSELTNRLHNGKKSSSVYPLSQDL 111
           + Q KN  +E   K+ YQ   ++ I ++ L E    +S L  R+   KK+ ++  L +D+
Sbjct:251 IDQNKNADNEEGKKKLYQAQYDLFIYNKQLQEAHNLISVLEKRIDTLKKNENIKKLLEDI 310
Query:112 PYVHIIYQKP 121
              +I  +KP
Sbjct:311 DKIKIDAEKP 320
>SP_IN:P90922 P90922 caenorhabditis elegans.k07a12.4 protein.
             5/1999
长度=936
分值=32.8bits(73),预计值=2.6
相同性=22/56(39%),相似性=31/56(55%),缺口=4/56(7%)
Query:34  PASLPRHSSTPDHTSTLEPP-RLPQRKNLQSEKETYQLSK---EVEILSRNLVEMQ  85
           P +L    STP  +S L  P R PQ KNLQ+E  T  +S+   EV++ S    ++Q
Sbjct:421 PKNLNSRPSTPQTSSNLNTPKRTPQVKNLQAESTTPTVSRPSSEVDLTSFRRNQLQ 476
>SW:YQU3_CAEEL Q09550 caenorhabditis elegans.hypothetical 133.5kd
            protein f26c11.3 in chromosome ii.11/1995
长度=1251
分值=32.5bits(72),预计值=3.4
相同性=27/108(25%),相似性=47/108(43%),缺口=18/108(16%)
Query:8   LIKEIQSPLSSICDGSIALDAEPVTQPASLPRHSSTPDHTSTLEPP--------------- 53
           L++ I +P +      I  DAE   + +S P  SST  H++T  P
Sbjct:462 LMQLIYNPRTKETRTEITSDAEGCKKTSSTPTPSSTSVHSTTATPSTTPGTTTYNWPTGG 521
Query:54  ---RLPQRKNLQSEKETY-QLSKEVEILSRNLVEMQRCLSELTNRLHN 97
               LP  + +  +   Y Q+ K+++ILS +L+    C + L   ++N
Sbjct:522 TTRMLPSGEIVGFDLHLYAQVRKKLQILSESLIAYPNCTTVLMQLIYN 569
  4.PP432
  A:核苷酸序列:(SEQ ID NO:10)  长度:1615bp
   1  GGCGCGCCCG CTCCCAAGTC GGCTTCCTCC CCGCCGGGGC CGCTTTGCCT
  51  CGGGTCTCCC CATTCTCCAG GTCCCCTGAA CTGCACAGTC GGAGGCCGTG
 101  GGCGGCGGGC TCTGCCTCCG CCGAGGGACA GCCGGATCGC CCCTCTGCTT
 151  CCCGCAACTG CCCTGATCAC CCCCCGTCCC AGCCCTTGAG TGAACGTCCT
 201  TCTGAGCGGC TTCCTGGGGT CCTCCCCACG TCCCAAAGGC CGGCAAGATG
 251  GTGTCCTGGA TGATCTGTCG CCTGGTGGTG CTGGTGTTTG GGATGCTGTG
 301  TCCAGCTTAT GCTTCCTATA AGGCTGTGAA GACCAAGAAC ATTCGTGAAT
 351  ATGTGCGGTG GATGATGTAC TGGATTGTTT TTGCACTCTT CATGGCAGCA
 401  GAGATCGTTA CAGACATTTT TATCTCCTGG TTCCCTTTCT ACTATGAGAT
 451  CAAGATGGCC TTCGTGCTGT GGCTGCTCTC ACCCTACACC AAGGGCGCCA
 501  GCCTGCTTTA CCGCAAGTTT GTCCACCCGT CCCTGTCCCG CCATGAGAAG
 551  GAGATCGACG CGTACATCGT GCAGGCCAAG GAGCGCAGCT ACGAGACCGT
 601  GCTCAGCTTC GGGAAGCGGG GCCTCAACAT TGCCGCCTCC GCTGCTGTGC
 651  AGGCTGCCAC CAAGAGTCAG GGGGCGCTGG CCGGCAGGCT GCAGAGCTTC
 701  TCCATGCAGG ACCTGCGCTC CATCTCTGAC GCACCTGCCC CTGCCTACCA
 751  TGACCCCCTC TACCTGGAGG ACCAGGTGTC CCACCGGAGG CCACCCATTG
 801  GGTACCGGGC CGGGGGCCTG CAGGACAGCG ACACCGAGGA TGAGTGTTGG
 851  TCAGATACTG AGGCAGTCCC CCGGGCGCCA GCCCGGCCCC GAGAGAAGCC
 901  CCTAATCCGC AGCCAGAGCC TGCGTGTGGT CAAGAGGAAG CCACCGGTGC
 951  GGGAGGGCAC CTCGCGCTCC CTGAAGGTTC GGACGAGGAA AAAGACTGTG
1001  CCCTCAGACG TGGACAGCTA GGGTCTGCTG CATCTGCCCC CTTCTTACCT
1051  CGTGCCCTGC AGGGCTCCAG GGCTATTTGG AGGGACCTTG GGCTGCACAT
1101  CTGGCCTGCC TGCACCAGCT GCCTGGGCCC CACCCTCCTG ACTCCTGCTG
1151  ATGGTTAAGG CCCGGAAGCA GAATGCTGCC AAGGCCACAA TGCAGGAATG
1201  CACCCACATT GACCAAAGCA GCTGGGCCCA GGGTTCTATT TATTGCCTTG
1251  CTCTGCCTCT CCTTCCCCGG TTGTGGGACA AGAACCCTCC CTTAACCCCT
1301  GCAACCCTTC CTGAACCCCT GCAAATGAAA CCAAACGTCC ACCTGGGTGT
1351  GTTCATTCCT TCCTGTCCTT CAAAAGTACT TGATAGCCTT TCATAAGGCC
1401  TGGCACATGT GTCCTGGTTG TGTGTGTGTG TGTTGGTGAG TGAGGTCAGG
1451  TTTGCGAGTG TTTTGATAAA TAAATACATA AAGGGGCAAA AAAAAAAAAA
1501  AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
1551  AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
1601  AAAAAAAAAA AAAAA
  B:氨基酸序列:(SEQ ID NO:11)  长度:257个氨基酸
  1  MVSWMICRLV VLVFGMLCPA YASYKAVKTK NIREYVRWMM YWIVFALFMA
 51  AEIVTDIFIS WFPFYYEIKM AFVLWLLSPY TKGASLLYRK FVHPSLSRHE
101  KEIDAYIVQA KERSYETVLS FGKRGLNIAA SAAVQAATKS QGALAGRLQS
151  FSMQDLRSIS DAPAPAYHDP LYLEDQVSHR RPPIGYRAGG LQDSDTEDEC
201  WSDTEAVPRA PARPREKPLI RSQSLRVVKR KPPVREGTSR SLKVRTRKKT
251  VPSDVDS
C:核苷酸及氨基酸组合序列(SEQ ID NO:12)
克隆号和蛋白名称:PP432
起始编码子:248ATG终止编码子:1021TAG
蛋白质分子量:29365.46
  1    G GCG CGC CCG CTC CCA AGT CGG CTT CCT CCC CGC CGG GGC CGC TTT     46
 47  GCC TCG GGT CTC CCC ATT CTC CAG GTC CCC TGA ACT GCA CAG TCG GAG     94
 95  GCC GTG GGC GGC GGG CTC TGC CTC CGC CGA GGG ACA GCC GGA TCG CCC    142
143  CTC TGC TTC CCG CAA CTG CCC TGA TCA CCC CCC GTC CCA GCC CTT GAG    190
191  TGA ACG TCC TTC TGA GCG GCT TCC TGG GGT CCT CCC CAC GTC CCA AAG    238
239  GCC GGC AAG ATG GTG TCC TGG ATG ATC TGT CGC CTG GTG GTG CTG GTG    286
  1              Met Val Ser Trp Met Ile Cys Arg Leu Val Val Leu Val     13
287  TTT GGG ATG CTG TGT CCA GCT TAT GCT TCC TAT AAG GCT GTG AAG ACC    334
 14  Phe Gly Met Leu Cys Pro Ala Tyr Ala Ser Tyr Lys Ala Val Lys Thr     29
335  AAG AAC ATT CGT GAA TAT GTG CGG TGG ATG ATG TAC TGG ATT GTT TTT    382
 30  Lys Asn Ile Arg Glu Tyr Val Arg Trp Met Met Tyr Trp Ile Val Phe     45
383  GCA CTC TTC ATG GCA GCA GAG ATC GTT ACA GAC ATT TTT ATC TCC TGG    430
 46  Ala Leu Phe Met Ala Ala Glu Ile Val Thr Asp Ile Phe Ile Ser Trp     61
431  TTC CCT TTC TAC TAT GAG ATC AAG ATG GCC TTC GTG CTG TGG CTG CTC    478
 62  Phe Pro Phe Tyr Tyr Glu Ile Lys Met Ala Phe Val Leu Trp Leu Leu     77
479  TCA CCC TAC ACC AAG GGC GCC AGC CTG CTT TAC CGC AAG TTT GTC CAC    526
 78  Ser Pro Tyr Thr Lys Gly Ala Ser Leu Leu Tyr Arg Lys Phe Val His     93
527  CCG TCC CTG TCC CGC CAT GAG AAG GAG ATC GAC GCG TAC ATC GTG CAG    574
 94  Pro Ser Leu Ser Arg His Glu Lys Glu Ile Asp Ala Tyr Ile Val Gln    109
575  GCC AAG GAG CGC AGC TAC GAG ACC GTG CTC AGC TTC GGG AAG CGG GGC    622
110  Ala Lys Glu Arg Ser Tyr Glu Thr Val Leu Ser Phe Gly Lys Arg Gly    125
623  CTC AAC ATT GCC GCC TCC GCT GCT GTG CAG GCT GCC ACC AAG AGT CAG    670
126  Leu Asn Ile Ala Ala Ser Ala Ala Val Gln Ala Ala Thr Lys Ser Gln    141
671  GGG GCG CTG GCC GGC AGG CTG CAG AGC TTC TCC ATG CAG GAC CTG CGC    718
142  Gly Ala Leu Ala Gly Arg Leu Gln Ser Phe Ser Met Gln Asp Leu Arg    157
719  TCC ATC TCT GAC GCA CCT GCC CCT GCC TAC CAT GAC CCC CTC TAC CTG    766
158  Ser Ile Ser Asp Ala Pro Ala Pro Ala Tyr His Asp Pro Leu Tyr Leu    173
767  GAG GAC CAG GTG TCC CAC CGG AGG CCA CCC ATT GGG TAC CGG GCC GGG    814
174  Glu Asp Gln Val Ser His Arg Arg Pro Pro Ile Gly Tyr Arg Ala Gly    189
815  GGC CTG CAG GAC AGC GAC ACC GAG GAT GAG TGT TGG TCA GAT ACT GAG    862
190  Gly Leu Gln Asp Ser Asp Thr Glu Asp Glu Cys Trp Ser Asp Thr Glu    205
863  GCA GTC CCC CGG GCG CCA GCC CGG CCC CGA GAG AAG CCC CTA ATC CGC    910
206  Ala Val Pro Arg Ala Pro Ala Arg Pro Arg Glu Lys Pro Leu Ile Arg    221
 911  AGC CAG AGC CTG CGT GTG GTC AAG AGG AAG CCA CCG GTG CGG GAG GGC     958
 222  Ser Gln Ser Leu Arg Val Val Lys Arg Lys Pro Pro Val Arg Glu Gly     237
 959  ACC TCG CGC TCC CTG AAG GTT CGG ACG AGG AAA AAG ACT GTG CCC TCA    1006
 238  Thr Ser Arg Ser Leu Lys Val Arg Thr Arg Lys Lys Thr Val Pro Ser     253
1007  GAC GTG GAC AGC TAG GGT CTG CTG CAT CTG CCC CCT TCT TAC CTC GTG    1054
 254  Asp Val Asp Ser ***                                                 258
1055  CCC TGC AGG GCT CCA GGG CTA TTT GGA GGG ACC TTG GGC TGC ACA TCT    1102
1103  GGC CTG CCT GCA CCA GCT GCC TGG GCC CCA CCC TCC TGA CTC CTG CTG    1150
1151  ATG GTT AAG GCC CGG AAG CAG AAT GCT GCC AAG GCC ACA ATG CAG GAA    1198
1199  TGC ACC CAC ATT GAC CAA AGC AGC TGG GCC CAG GGT TCT ATT TAT TGC    1246
1247  CTT GCT CTG CCT CTC CTT CCC CGG TTG TGG GAC AAG AAC CCT CCC TTA    1294
1295  ACC CCT GCA ACC CTT CCT GAA CCC CTG CAA ATG AAA CCA AAC GTC CAC    1342
1343  CTG GGT GTG TTC ATT CCT TCC TGT CCT TCA AAA GTA CTT GAT AGC CTT    1390
1391  TCA TAA GGC CTG GCA CAT GTG TCC TGG TTG TGT GTG TGT GTG TTG GTG    1438
1439  AGT GAG GTC AGG TTT GCG AGT GTT TTG ATA AAT AAA TAC ATA AAG GGG    1486
1487  CAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    1534
1535  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    1582
1583  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA                        1615
D:Blastp结果
Query=PP432[基因=PP432](257个氨基酸)
>SW:YSV4_CAEEL Q10010 caenorhabditis elegans.hypothetical 26.6kd
            protein t19c3.4 in chromosome iii.11/1997
长度=229
分值=163bits(409),预计值=1e-39
相同性=77/163(47%),相似性=111/163(67%),缺口=2/163(1%)
Query:2   VSWMICRLVVLVFGMLCPAYASYKAVKTKNIREYVRWMMYWIVFALFMAAEIVTDIFIS-  60
            +S + RL+++  G L PAY SYKAV+TK+ REYV+WMMYWIVFA++   E + D+ ++
Sbjct:1   MSETLSRLLIITAGTLYPAYRSYKAVRTKDTREYVKWMMYWIVFAIYSFLENLLDLVLAF  60
Query:61  WFPFYYEIKMAFVLWLLSPYTKGASLLYRKFVHPSLSRHEKEIDAYIVQAKERSYETVLS 120
           WFPFY+++K+ F+ WLLSP+TKGAS+LYRK+VHP+L+RHEK+IDA +  AK  SY  ++
Sbjct:61  WFPFYFQLKIVFIFWLLSPWTKGASILYRKWVHPTLNRHEKDIDALLESAKSESYNQLMR 120
Query:121 FGKRGLNIXXXXXXXXXTKSQGALAGRLQ-SFSMQDLRSISDA 162
            G + L            + Q  L  +LQ S+S  D+ S  +A
Sbjct:121 IGSKSLVYAKDVVAEAAVRGQQQLVNQLQRSYSANDVGSEREA 163
>PIR2:T16888 hypothetical protein T19C3.4-Caenorhabditis elegans
长度=229
分值=163bits(409),预计值=1e-39
相同性=77/163(47%),相似性=111/163(67%),缺口=2/163(1%)
Query:2  VSWMICRLVVLVFGMLCPAYASYKAVKTKNIREYVRWMMYWIVFALFMAAEIVTDIFIS- 60
          +S  + RL+++  G L PAY SYKAV+TK+ REYV+WMMYWIVFA++   E + D+ ++
Sbjct:1  MSETLSRLLIITAGTLYPAYRSYKAVRTKDTREYVKWMMYWIVFAIYSFLENLLDLVLAF 60
Query:61  WFPFYYEIKMAFVLWLLSPYTKGASLLYRKFVHPSLSRHEKEIDAYIVQAKERSYETVLS 120
           WFPFY+++K+ F+ WLLSP+TKGAS+LYRK+VHP+L+RHEK+IDA +  AK  SY  ++
Sbjct:61  WFPFYFQLKIVFIFWLLSPWTKGASILYRKWVHPTLNRHEKDIDALLESAKSESYNQLMR 120
Query:121 FGKRGLNIXXXXXXXXXTKSQGALAGRLQ-SFSMQDLRSISDA 162
            G + L            + Q  L  +LQ S+S  D+ S  +A
Sbjct:121 IGSKSLVYAKDVVAEAAVRGQQQLVNQLQRSYSANDVGSEREA 163
5.PP552
A:核苷酸序列:(SEQ ID NO:13)  长度:1786bp
   1  TGGTGGCGCA TGTCTGTAAT CCCAGCTACT CGGGAAGCTG AGGCAGGAGA
  51  ATCGCTTGAA CCCAGGAAGC GGAGGTTGCA GTGAGCCGAG ATCGCGCCAC
 101  TGCACTCCAA CCTGGGCAAC AATACAAGAC TCCATCTGAA AAAAAAAAGA
 151  TCACACAGGA AAACAGAAGT TCGATTTTAC GTCGTACACT GCTGTAATTT
 201  CAGCACATGT GGACTCGTGT AACCAACACC ATAACCTTCC ATCACCCCTG
 251  AAACTCCCTC CCGCCAGCCC TTTAGGGTTG CCCCTCCCCC CGAACCCCAC
 301  CAGCCCCTGG TGACCACTGA TCTGTCCTCC AACCCATAGT GTTTTTCCGG
 351  GAATGTCACA AAAACAGAAG CCGACCATGG GTCACCTTTC TGGCGCCTTT
 401  CTCCCCGCAC AAAGTCTTTG TCCTTGTGAA GTTGTCACGT GCCAAACGCT
 451  TGTCCCTTTT TCCTGCTGGG TAATACTCCC GGTGCCGCCC TTGCTGTTCG
 501  TCGATGCACA TCTGGCTGCT TTTCGCTGGC TGCGAGCGGA GCTGCTAGGG
 551  ACATGGCCAC GGGGCTGTGA GAGCGGAGTT TCCTCTCTCC GGTGACCCTG
 601  AGCTGCGCCT TTCTCAGCCG CCTCCCGAGG CCCCAGGCGC TCTGCGGGGG
 651  CTCTGGCGGG GTTGGTGGGG GTGGGCGTTC TCGTTGTTTC AGCGGCGCTG
 701  CCCCAGGCCC TGCGGGAGGG ACCGTGGGAC CCGAGACATC CCCGCCTGGC
 751  CTCCGCTCCC CACCCGGGAG TGGGGCTCGC ACCCCCCCAA CCTCGGGTAA
 801  AGACGCTTCT GGAAGGAAGG GCGCCCCGCG GACCCCGCCC AACCCTGCCC
 851  AGCCCAGCCC AGCCCAGCCC AGCCCTTCCC GGGGCGGCGG CGCGGGAAGC
 901  AGGCGGCGGC GCACGGGCGT CGTCATGGCA ACCCCACCGG CTCCGGGGGC
 951  CGGGACCGCT GCCCCCTCCG CCCCTCGACC CCCGCCCCCC CGCCCTTCCT
1001  GGCTGCGGCT GGACCCGGCT GCGCGGGGCG CGAGGCTGCC TTTCCCGGGA
1051  TCACCAGGGA CCACCCGGCG CGCTCCCCGG GAATCCGCAC CCCTGGCCCC
1101  AGCGCTCCGG AGCGACCCGG GTCAGCCCCT GGCTGCCTGC AATGGGCCCC
1151  CGGGCGAACC CCGGGCGGAC CCAGGAGTGA GCACCCGGTG CGCGGCAACG
1201  ATGATCCCGC AAGGGAAGCT CACGGGAGGC AGGAGCTGTG GCAGCCGCCC
1251  CAGGATGGGG CGCGGGGAGC GCGCTGAGCT GTCCTTTCCC GCAGCGGCCC
1301  CGCGGTTGAA GCGTGGGCTT GGGTTTTGGT TTTTCTTCTG TGGCAACAGT
1351  TCTGTTGAGA TATTACTCGC CTGCCATACA ACTCACCCAT TTTAAAAGTA
1401  CACCTCAGGG GTCCTGCGTG TATTGACAAA CCCGCCGCCG TCACCACAGC
1451  CAATTTCAGA ACATTTTCAT CTCTTCAAAA GAAACCCTGT ACCCTTCAGC
1501  TGTCACCCTC CTGGTCCCCA TCCGGTCCTC GTCCCGCCCT CAGCAGCCAC
1551  GCACTGCCTG TAAAGTCCCC TGTCCTGCCC TGTAGGTGGA ATCTATACCT
1601  TGGGGTCTGT TCTGACGTTC ACCTAACAGC CTTTCCAGGC TCAGCTGTGC
1651  TATTGTATGG ACCAGGGGGT TGTTTTGTTT TTGTTGTTTG TTGATTGTGT
1701  GTGTGTGTGT GTGTGTGTGT GTGAGCCTGG CGTGGTTGCG GGCGCCTATA
1751  ATCCCAGCTG CTCAGGAGGC TGAGGCAGGA GGATCA
B:氨基酸序列:(SEQ ID NO:14)  长度:156个氨基酸
1  MATPPAPGAG TAAPSAPRPP PPRPSWLRLD PAARGARLPF PGSPGTTRRA
 51  PRESAPLAPA LRSDPGQPLA ACNGPPGEPR ADPGVSTRCA ATMI PQGKLT
101  GGRSCGSRPR MGRGERAELS FPAAAPRLKR GLGFWFFFCG NSSVEILLAC
151  HTTHPF
C:核苷酸及氨基酸组合序列(SEQ ID NO:15)
克隆号和蛋白名称:PP552
起始编码子:925 ATG        终止编码子:1395 TAA
蛋白质分子量:16177.61
   1  TGG TGG CGC ATG TCT GTA ATC CCA GCT ACT CGG GAA GCT GAG GCA GGA     48
  49  GAA TCG CTT GAA CCC AGG AAG CGG AGG TTG CAG TGA GCC GAG ATC GCG     96
  97  CCA CTG CAC TCC AAC CTG GGC AAC AAT ACA AGA CTC CAT CTG AAA AAA    144
 145  AAA AGA TCA CAC AGG AAA ACA GAA GTT CGA TTT TAC GTC GTA CAC TGC    192
 193  TGT AAT TTC AGC ACA TGT GGA CTC GTG TAA CCA ACA CCA TAA CCT TCC    240
 241  ATC ACC CCT GAA ACT CCC TCC CGC CAG CCC TTT AGG GTT GCC CCT CCC    288
 289  CCC GAA CCC CAC CAG CCC CTG GTG ACC ACT GAT CTG TCC TCC AAC CCA    336
 337  TAG TGT TTT TCC GGG AAT GTC ACA AAA ACA GAA GCC GAC CAT GGG TCA    384
 385  CCT TTC TGG CGC CTT TCT CCC CGC ACA AAG TCT TTG TCC TTG TGA AGT    432
 433  TGT CAC GTG CCA AAC GCT TGT CCC TTT TTC CTG CTG GGT AAT ACT CCC    480
 481  GGT GCC GCC CTT GCT GTT CGT CGA TGC ACA TCT GGC TGC TTT TCG CTG    528
 529  GCT GCG AGC GGA GCT GCT AGG GAC ATG GCC ACG GGG CTG TGA GAG CGG    576
 577  AGT TTC CTC TCT CCG GTG ACC CTG AGC TGC GCC TTT CTC AGC CGC CTC    624
 625  CCG AGG CCC CAG GCG CTC TGC GGG GGC TCT GGC GGG GTT GGT GGG GGT    672
 673  GGG CGT TCT CGT TGT TTC AGC GGC GCT GCC CCA GGC CCT GCG GGA GGG    720
 721  ACC GTG GGA CCC GAG ACA TCC CCG CCT GGC CTC CGC TCC CCA CCC GGG    768
 769  AGT GGG GCT CGC ACC CCC CCA ACC TCG GGT AAA GAC GCT TCT GGA AGG    816
 817  AAG GGC GCC CCG CGG ACC CCG CCC AAC CCT GCC CAG CCC AGC CCA GCC    864
 865  CAG CCC AGC CCT TCC CGG GGC GGC GGC GCG GGA AGC AGG CGG CGG CGC    912
 913  ACG GGC GTC GTC ATG GCA ACC CCA CCG GCT CCG GGG GCC GGG ACC GCT    960
   1                  Met Ala Thr Pro Pro Ala Pro Gly Ala Gly Thr Ala     12
 961  GCC CCC TCC GCC CCT CGA CCC CCG CCC CCC CGC CCT TCC TGG CTG CGG   1008
  13  Ala Pro Ser Ala Pro Arg Pro Pro Pro Pro Arg Pro Ser Trp Leu Arg     28
1009  CTG GAC CCG GCT GCG CGG GGC GCG AGG CTG CCT TTC CCG GGA TCA CCA   1056
  29  Leu Asp Pro Ala Ala Arg Gly Ala Arg Leu Pro Phe Pro Gly Ser Pro     44
1057  GGG ACC ACC CGG CGC GCT CCC CGG GAA TCC GCA CCC CTG GCC CCA GCG   1104
  45  Gly Thr Thr Arg Arg Ala Pro Arg Glu Ser Ala Pro Leu Ala Pro Ala     60
1105  CTC CGG AGC GAC CCG GGT CAG CCC CTG GCT GCC TGC AAT GGG CCC CCG   1152
  61  Leu Arg Ser Asp Pro Gly Gln Pro Leu Ala Ala Cys Asn Gly Pro Pro     76
1153  GGC GAA CCC CGG GCG GAC CCA GGA GTG AGC ACC CGG TGC GCG GCA ACG   1200
  77  Gly Glu Pro Arg Ala Asp Pro Gly Val Ser Thr Arg Cys Ala Ala Thr     92
1201  ATG ATC CCG CAA GGG AAG CTC ACG GGA GGC AGG AGC TGT GGC AGC CGC   1248
  93  Met Ile Pro Gln Gly Lys Leu Thr Gly Gly Arg Ser Cys Gly Ser Arg    108
1249  CCC AGG ATG GGG CGC GGG GAG CGC GCT GAG CTG TCC TTT CCC GCA GCG   1296
 109  Pro Arg Met Gly Arg Gly Glu Arg Ala Glu Leu Ser Phe Pro Ala Ala     124
1297  GCC CCG CGG TTG AAG CGT GGG CTT GGG TTT TGG TTT TTC TTC TGT GGC    1344
 125  Ala Pro Arg Leu Lys Arg Gly Leu Gly Phe Trp Phe Phe Phe Cys Gly     140
1345  AAC AGT TCT GTT GAG ATA TTA CTC GCC TGC CAT ACA ACT CAC CCA TTT    1392
 141  Asn Ser Ser Val Glu Ile Leu Leu Ala Cys His Thr Thr His Pro Phe     156
1393  TAA AAG TAC ACC TCA GGG GTC CTG CGT GTA TTG ACA AAC CCG CCG CCG    1440
 157  ***                                                                 157
1441  TCA CCA CAG CCA ATT TCA GAA CAT TTT CAT CTC TTC AAA AGA AAC CCT    1488
1489  GTA CCC TTC AGC TGT CAC CCT CCT GGT CCC CAT CCG GTC CTC GTC CCG    1536
1537  CCC TCA GCA GCC ACG CAC TGC CTG TAA AGT CCC CTG TCC TGC CCT GTA    1584
1585  GGT GGA ATC TAT ACC TTG GGG TCT GTT CTG ACG TTC ACC TAA CAG CCT    1632
1633  TTC CAG GCT CAG CTG TGC TAT TGT ATG GAC CAG GGG GTT GTT TTG TTT    1680
1681  TTG TTG TTT GTT GAT TGT GTG TGT GTG TGT GTG TGT GTG TGT GAG CCT    1728
1729  GGC GTG GTT GCG GGC GCC TAT AAT CCC AGC TGC TCA GGA GGC TGA GGC    1776
1777  AGG AGG ATC A                                                      1786
6.PP591
A:核苷酸序列:(SEQ ID NO:16)  长度:1838bp
   1  GAAAGAGCCG GTGAAGGGGC AGAACAGGCA GGTTCCCTCG ACCCAGGACC
  51  CCCTGTTCCC AGGCTATGGC CCCCAGTGCC CTGTAGACCT GGCAGGCCCC
 101  CCGTGCTTGC GACCCCTATT TGGGGGTCTG GGTGGCTACT GGAGGGCCTT
 151  GCAGAGGGGC AGAGAAGGCA GGACCATGAC ATCTAGGGCC TCTGAACTTT
 201  CTCCGGGGCG CAGCGTGACG GCTGGCATCA TCATTGTTGG AGATGAGATC
 251  CTTAAGTTGG AAACAACAAA TGGCTTTTGA GTCCAAGAGT GATGCAATCA
 301  CAGTGACGCA TTAAAACGGT TACTCCGGAG ACATCAGAGC ACTGTGGCTG
 351  GAGGCTGGGA GCCTGGCCAG GAAGCTGTCG CCATTGTCCA GGTGAAAGGT
 401  GCTAAGGACC TGCTTGGTGG CAGTGGGGAC AGAAAGAAGA AAGCAGGCCA
 451  GGCGTGGTGG CTCACACCTA TAATTCCAGC ACTTTGGGAG GCTGAGGCAG
 501  GAGGATCACT TGAGACCAGG AATTCAACAC CAGCCTGGGC AACATGGCAA
 551  GACCCCATTT CTACAAAAAA AATTTAAAAT GAGCTGAATG TGGTGGCACG
 601  CGCCTGTAGT CCCAGCTACT CGGAAGGCTG GGGTGGCCCT TGAAGCCAGG
 651  AGGTTGAGGC TGCAGTGAAC TGTGACTGAG CCACTATACT CCAGCCTGGG
 701  TGACAGAGAC CCAGCTTTAA AACCAAACAA ATGGATTTTC CCACTCTTGT
 751  GTCCAGTCCA GGCCCCTCAG CAGCCTGAGG TGGTGTCCTT CAAAGAGCAG
 801  AGCACTGCAT CATCAGGTGG ATGCAGCCAT CATCTTCAAC CCCTCCCCTT
 851  CATCCCTACA GTACTGATGG CCTCATCTTC CCCTTCAACC CCCAGGGACA
 901  CACTCAGGAC ACCAACACCT TCTTTCTGTG CCGGACACTG CGCTCCCTAG
 951  GGGTCCAGGT TTGCCGAGTC TCAGTTGTAC CTGATGAGGT AGCCACCATT
1001  GCAGCTGAGG TCACTTCTTT CTCCAACCGC TTCACCCATG TCCTCACAGC
1051  AGGGGGCATC GGCCCCACTC ATGATGATGT GACCTTTGAG GCAGTGGCAC
1101  AGGCCTTTGG AGATGAGCTG AAGCCACACC CCAAGTTGGA AGCAGCCACC
1151  AAAGCCCTAG GAGGGGAAGG CTGGGAGAAG CTATCATTGG TGCCCTCCTC
1201  TGCCCGCCTG CATTATGGCA CAGATCCTTG CACTGGTCAA CCTTTCAGAT
1251  TCCCTCTGGT CTCCGTCCGA AACGTCTACC TCTTCCCAGG CATTCCAGAG
1301  CTGCTGCGGC GGGTGCTGGA GGGGATGAAG GGACTATTCC AAAACCCAGC
1351  TGTTCAGTTC CACTCAAAGG AGCTATATGT GGCTGCTGAT GAAGCCTCCA
1401  TCGCCCCCAT TCTGGCTGAG GCCCAGGCCC ACTTTGGACG TAGGCTTGGC
1451  CTGGGTTCCT ACCCTGACTG GGGCAGCAAC TACTATCAGG TGAAGCTGAC
1501  TCTAGACTCA GAGGAAGAAG GACCCCTGGA GGAATGCTTG GCCTACCTGA
1551  CTGCCCGTTT GCCCCAGGGA TCGCTGGTCC CCTACATGCC CAACGCTGTG
1601  GAGCAGGCCA GTGAGGCTGT ATACAAACTC GCTGAATCAG GTAGGGACCT
1651  TATGGAGGAG GGGCATTATG CCCAAAGCCA TTGGTGGCAC CCCAGATCTC
1701  AGTAATGCAG GGGCTGTTGG GTGCTTCCTG CAAATCCCTG AGAGGGCAGA
1751  AGATAGCTTC TGTTAATTCA TTATTCTTCC AATAAATGTT GATTGAGTAC
1801  CTAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAA
B:氨基酸序列:(SEQ ID NO:17)  长度:294个氨基酸
  1  MQPSSSTPPL HPYSTDGLIF PFNPQGHTQD TNTFFLCRTL RSLGVQVCRV
 51  SVVPDEVATI AAEVTSFSNR FTHVLTAGGI GPTHDDVTFE AVAQAFGDEL
101  KPHPKLEAAT KALGGEGWEK LSLVPSSARL HYGTDPCTGQ PFRFPLVSVR
151  NVYLFPGIPE LLRRVLEGMK GLFQNPAVQF HSKELYVAAD EASIAPILAE
201  AQAHFGRRLG LGSYPDWGSN YYQVKLTLDS EEEGPLEECL AYLTARLPQG
251  SLVPYMPNAV EQASEAVYKL AESGRDLMEE GHYAQSHWWH PRSQ
C:核苷酸及氨基酸组合序列(SEQ ID NO:18)
克隆号和蛋白名称:PP591
起始编码子:821 ATG      终止编码子:1705 TAA
蛋白质分子量:32367.76
  1    G AAA GAG CCG GTG AAG GGG CAG AAC AGG CAG GTT CCC TCG ACC CAG     46
 47  GAC CCC CTG TTC CCA GGC TAT GGC CCC CAG TGC CCT GTA GAC CTG GCA     94
 95  GGC CCC CCG TGC TTG CGA CCC CTA TTT GGG GGT CTG GGT GGC TAC TGG    142
143  AGG GCC TTG CAG AGG GGC AGA GAA GGC AGG ACC ATG ACA TCT AGG GCC    190
191  TCT GAA CTT TCT CCG GGG CGC AGC GTG ACG GCT GGC ATC ATC ATT GTT    238
239  GGA GAT GAG ATC CTT AAG TTG GAA ACA ACA AAT GGC TTT TGA GTC CAA    286
287  GAG TGA TGC AAT CAC AGT GAC GCA TTA AAA CGG TTA CTC CGG AGA CAT    334
335  CAG AGC ACT GTG GCT GGA GGC TGG GAG CCT GGC CAG GAA GCT GTC GCC    382
383  ATT GTC CAG GTG AAA GGT GCT AAG GAC CTG CTT GGT GGC AGT GGG GAC    430
431  AGA AAG AAG AAA GCA GGC CAG GCG TGG TGG CTC ACA CCT ATA ATT CCA    478
479  GCA CTT TGG GAG GCT GAG GCA GGA GGA TCA CTT GAG ACC AGG AAT TCA    526
527  ACA CCA GCC TGG GCA ACA TGG CAA GAC CCC ATT TCT ACA AAA AAA ATT    574
575  TAA AAT GAG CTG AAT GTG GTG GCA CGC GCC TGT AGT CCC AGC TAC TCG    622
623  GAA GGC TGG GGT GGC CCT TGA AGC CAG GAG GTT GAG GCT GCA GTG AAC    670
671  TGT GAC TGA GCC ACT ATA CTC CAG CCT GGG TGA CAG AGA CCC AGC TTT    718
719  AAA ACC AAA CAA ATG GAT TTT CCC ACT CTT GTG TCC AGT CCA GGC CCC    766
767  TCA GCA GCC TGA GGT GGT GTC CTT CAA AGA GCA GAG CAC TGC ATC ATC    814
815  AGG TGG ATG CAG CCA TCA TCT TCA ACC CCT CCC CTT CAT CCC TAC AGT    862
  1          Met Gln Pro Ser Ser Ser Thr Pro Pro Leu His Pro Tyr Ser     14
863  ACT GAT GGC CTC ATC TTC CCC TTC AAC CCC CAG GGA CAC ACT CAG GAC    910
 15  Thr Asp Gly Leu Ile Phe Pro Phe Asn Pro Gln Gly His Thr Gln Asp     30
911  ACC AAC ACC TTC TTT CTG TGC CGG ACA CTG CGC TCC CTA GGG GTC CAG    958
 31  Thr Asn Thr Phe Phe Leu Cys Arg Thr Leu Arg Ser Leu Gly Val Gln     46
959  GTT TGC CGA GTC TCA GTT GTA CCT GAT GAG GTA GCC ACC ATT GCA GCT   1006
  47  Val Cys Arg Val Ser Val Val Pro Asp Glu Val Ala Thr Ile Ala Ala      62
1007  GAG GTC ACT TCT TTC TCC AAC CGC TTC ACC CAT GTC CTC ACA GCA GGG    1054
  63  Glu Val Thr Ser Phe Ser Asn Arg Phe Thr His Val Leu Thr Ala Gly      78
1055  GGC ATC GGC CCC ACT CAT GAT GAT GTG ACC TTT GAG GCA GTG GCA CAG    1102
  79  Gly Ile Gly Pro Thr His Asp Asp Val Thr Phe Glu Ala Val Ala Gln      94
1103  GCC TTT GGA GAT GAG CTG AAG CCA CAC CCC AAG TTG GAA GCA GCC ACC    1150
  95  Ala Phe Gly Asp Glu Leu Lys Pro His Pro Lys Leu Glu Ala Ala Thr     110
1151  AAA GCC CTA GGA GGG GAA GGC TGG GAG AAG CTA TCA TTG GTG CCC TCC    1198
 111  Lys Ala Leu Gly Gly Glu Gly Trp Glu Lys Leu Ser Leu Val Pro Ser     126
1199  TCT GCC CGC CTG CAT TAT GGC ACA GAT CCT TGC ACT GGT CAA CCT TTC    1246
 127  Ser Ala Arg Leu His Tyr Gly Thr Asp Pro Cys Thr Gly Gln Pro Phe     142
1247  AGA TTC CCT CTG GTC TCC GTC CGA AAC GTC TAC CTC TTC CCA GGC ATT    1294
 143  Arg Phe Pro Leu Val Ser Val Arg Asn Val Tyr Leu Phe Pro Gly Ile     158
1295  CCA GAG CTG CTG CGG CGG GTG CTG GAG GGG ATG AAG GGA CTA TTC CAA    1342
 159  Pro Glu Leu Leu Arg Arg Val Leu Glu Gly Met Lys Gly Leu Phe Gln     174
1343  AAC CCA GCT GTT CAG TTC CAC TCA AAG GAG CTA TAT GTG GCT GCT GAT    1390
 175  Asn Pro Ala Val Gln Phe His Ser Lys Glu Leu Tyr Val Ala Ala Asp     190
1391  GAA GCC TCC ATC GCC CCC ATT CTG GCT GAG GCC CAG GCC CAC TTT GGA    1438
 191  Glu Ala Ser Ile Ala Pro Ile Leu Ala Glu Ala Gln Ala Hi s Phe Gly    206
1439  CGT AGG CTT GGC CTG GGT TCC TAC CCT GAC TGG GGC AGC AAC TAC TAT    1486
 207  Arg Arg Leu Gly Leu Gly Ser Tyr Pro Asp Trp Gly Ser Asn Tyr Tyr     222
1487  CAG GTG AAG CTG ACT CTA GAC TCA GAG GAA GAA GGA CCC CTG GAG GAA    1534
 223  Gln Val Lys Leu Thr Leu Asp Ser Glu Glu Glu Gly Pro Leu Glu Glu     238
1535  TGC TTG GCC TAC CTG ACT GCC CGT TTG CCC CAG GGA TCG CTG GTC CCC    1582
 239  Cys Leu Ala Tyr Leu Thr Ala Arg Leu Pro Gln Gly Ser Leu Val Pro     254
1583  TAC ATG CCC AAC GCT GTG GAG CAG GCC AGT GAG GCT GTA TAC AAA CTC    1630
 255  Tyr Met Pro Asn Ala Val Glu Gln Ala Ser Glu Ala Val Tyr Lys Leu     270
1631  GCT GAA TCA GGT AGG GAC CTT ATG GAG GAG GGG CAT TAT GCC CAA AGC    1678
 271  Ala Glu Ser Gly Arg Asp Leu Met Glu Glu Gly His Tyr Ala Gln Ser     286
1679  CAT TGG TGG CAC CCC AGA TCT CAG TAA TGC AGG GGC TGT TGG GTG CTT    1726
 287  His Trp Trp His Pro Arg Ser Gln ***                                 295
1727  CCT GCA AAT CCC TGA GAG GGC AGA AGA TAG CTT CTG TTA ATT CAT TAT    1774
1775  TCT TCC AAT AAA TGT TGA TTG AGT ACC TAA AAA AAA AAA AAA AAA AAA    1822
1823  AAA AAA AAA AAA AAA A                                              1838
D:Blastp结果
Query=PP591[基因=PP591](294个氨基酸)
>SP_IN:Q22017 Q22017 caenorhabditis elegans.r53.1 protein.1/1999
长度=519
分值=132 bits(329),预计值=3e-30
相同性=86/260(33%),相似性=138/260(53%),缺口=28/260(10%)
Query:25  QGHTQDTNTFFLCRTLRSLGVQVCRVSVVPDEVATIAAEVTSFSNRFTHVLTAGGIGPTH  84
           +G T+DTN+ FLC+ L  LGV + ++SV+ D+++ I+ EV S S  + +V+T+GG+GPTH
Sbjct:27  KGTTRDTNSHFLCKRLHKLGVNIRKISVIGDDISEISREVQSASGAYDYVITSGGVGPTH  86
Query:85  DDVTFEAVAQAFGDELKPH-----------PKLEAATKALG-GEG--------WEKLSLV 124
           DD T+  +A AF D+++             P   A  +A G GEG         EKL  +
Sbjct:87  DDKTYLGLAHAFTDQMQFSDEIRQAVNRFLPTYTAKKRAEGVGEGLEEAVRLATEKLCTI 146
Query:125 PSSARLHYGTDPCTGQPFRFPLVSVRNVYLFPGIPELLRRVLEGMKG-LFQNPAVQFHS- 182
           P  ++L +GT    G    FP+V + NV   PG+P+   R  + ++  LF  P  +  S
Sbjct:147 PKMSQLLWGTQKINGSLSTFPVVRISNVVALPGVPKFCERAFDELQDQLF--PIEERQSL 204
Query:183 --KELYVAADEASIAPILAEAQAHF-GRRLGLGSYPDWGSNYYQVKLTLDSEEEGPLEEC 239
               +LY   DE   +  L + A F  R + +GSYP+  + +++ KLT+++E    +E
Sbjct:205 CFETLYTDLDEFDFSKKLTDLAAQFEDRNVQIGSYPELKNKFFKTKLTIETESSETMEAV 264
Query:240 LAYLTARLPQGSLVPYMPNA 259
           +  L   L  G +V Y  +A
Sbjct:265 VTSL-RELLAGHIVYYDSHA 283
>SW:YM44_YEAST Q03219 saccharomyces cerevisiae(baker′s yeast).
            hypothetical 31.1 kd protein in sip18-spt21 intergenic
            region.11/1997
长度=274
分值=67.9bits(163),预计值=1e-10
相同性=49/234(20%),相似性=106/234(44%),缺口=27/234(11%)
Query:26  GHTQDTNTFFLCRTLRSLGVQVCRVSVVPDEVATIAAEVTSFSNRFTHVLTAGGIGPTHD  85
           G   DTN+ F  +     G+Q+  ++ + D+   I   V      +  +++ GGIGPTHD
Sbjct:18  GKVVDTNSTFFAKYCFDHGIQLKEIATIGDDETQIVDTVRRLVKNYDFIISTGGIGPTHD  77
Query:86  DVTFEAVAQAFG----------DELKPHPKLEAATKALGGEGWEKLSLVP--SSARLHYG 133
           D+T+E +A++F           + ++     EA   A   +   +++ +P  ++ + +Y
Sbjct:78  DITYECMAKSFNLPCELDEECKERMRHKSDPEARLDADALKAHYQMATMPKGTNVKNYYV 137
Query:134 TDPCTGQPFRFPLVSV-RNVYLFPGIPELLRRVLEG-------MKGLFQNPA--VQFHSK 183
            D         P+ S+   +Y+ PGIP+L  R+L+        +  L ++P   V++  +
Sbjct:138 CD-----DLWVPICSISHKMYILPGIPQLFARMLKAFTPTLKKIYNLDKDPREYVRYFVR 192
Query:184 ELYVAADEASIAPILAEAQAHFGRRLGLGSYPDWGSNYYQVKLTLDSEEEGPLE 237
                +  +    ++ +        + +GSYP +G  +  V +  + +++  L+
Sbjct:193 THLTESQISKELKLIQDESTKVSEAIKIGSYPHFGMGFNTVSILGEKKDDSYLK 246
7.PP603
A:核苷酸序列:(SEQ ID NO:19)  长度:1619bp
   1  GCGCGGCGCG CTTAGTTGCC GGAGCTGAAC GGCGCGGAGC TGGTCTGAGG
  51  CGAGCCGAGC CGAGCGAGCG CGGCGGTGGG GCCGAGAGGA CGCGCAGGTG
 101  GCGGCGTTGC CATGTCGCAC GGTCACAGCC ACGGCGGGGG TGGCTGCCGC
 151  TGCGCCGCCG AACGGGAGGA GCCGCCCGAG CAGCGCGGCC TGGCCTACGG
 201  CCTGTACCTG CGCATCGACC TGGAGCGGCT GCAATGCCTT AACGAGAGCC
 251  GCGAGGGCAG CGGCCGCGGC GTCTTCAAGC CGTGGGAGGA GCGGACCGAC
 301  CGCTCCAAGT TTGTTGAAAG TGATGCAGAT GAAGAGCTTC TGTTTAATAT
 351  TCCATTTACG GGCAATGTCA AGCTCAAAGG CATCATTATA ATGGGAGAGG
 401  ATGATGACTC ACACCCCTCT GAGATGAGAC TGTACAAGAA TATTCCACAG
 451  ATGTCCTTTG ATGATACAGA AAGGGAGCCA GATCAGACCT TTAGTCTGAA
 501  CCGGGATCTT ACAGGAGAAT TAGAGTATGC TACAAAAATT TCTCGTTTTT
 551  CAAATGTCTA TCATCTCTCA ATTCATATTT CAAAAAACTT CGGAGCAGAT
 601  ACGACAAAGG TCTTTTATAT TGGCCTGAGA GGAGAGTGGA CTGAGCTTCG
 651  CCGACACGAG GTGACCATCT GCAATTACGA AGCATCTGCC AACCCAGCAG
 701  ACCATAGGGT CCATCAGGTT ACCCCACAGA CACACTTTAT TTCCTAAGGG
 751  CTGGCCAAGG CTCCCATAGA GGCGCTGTGT CAGTGAAGAT GTACGACTAC
 801  CTGTTGGGAA GGACAAAGGG ATGAGGCTCC AGAGAGAGTT GGCTGCCACA
 851  GCCTCTGCCA AGCTTTGTCT TTGGGGCTTG CTGCAGAAAC CTGGCCTACG
 901  GAAGATACGA CACCACTGGG AGGGTTGTGT AGGTGCCAGG GGACCATCGT
 951  GGTTCTCTAG GGCGCTGTGG AAATTGGGTC TTGGGCTGGG TGGCATCTGG
1001  CAGTCATGGA TAACACTTGC TTTTCCAGTT AATGTGGCCA TGTGATTCCA
1051  AGTGTCATGT TGCTTTGTGG CAAGATTGTT GTGTGACTTG TTTTTTTGTT
1101  TTTGTTTTTG TTTTTTTAAA GGAAACTATT TGTGGGCTAT AGGAAACTTT
1151  CTGATGCCTC CGGATTGTGT TAGTAGTAGC CATCAGGAGG GTCTCCAACT
1201  AAAACACTTG TTCCTGCTTG CTCCTTTCCC CTCTCATTGT TCAGCATTCT
1251  TGTCAAGTTG CCCAGCTTGG AGTTGTCTGT CACGCACATG TGTCCTGTGG
1301  TTATAGCTAG AAGGACAGGA GTCTCCTGCT GATGCGTGAT AGCTTAAGCT
1351  TGGGGAGAAG GTCTTTTCCA CTGCCTAGCT AAGCAGTCTG GGGAGAGCAT
1401  GGGGATCATT TCTATGTGTG TGGGTAATCT GGTCAGTAAG ATTGAGACTT
1451  AGTTAAGATT CCCCTTGGAA ATTCCTTAAT GTTTATTAGC TTCTAACTAG
1501  TGTTGTAAGT CCGATGCCAG AATTTGGAGA TTTGAGTTCT TCTTTTCATG
1551  GCTTTTATTC ACTGTGACTA ATAAGCTTCC TAATAAATCC TTGCCAGACT
1601  TAAAAAAAAA AAAAAAAAA
B:氨基酸序列:(SEQ ID NO:20)长度:211个氨基酸
  1  MSHGHSHGGG GCRCAAEREE PPEQRGLAYG LYLRIDLERL QCLNESREGS
 51  GRGVFKPWEE RTDRSKFVES DADEELLFNI PFTGNVKLKG IIIMGEDDDS
101  HPSEMRLYKN IPQMSFDDTE REPDQTFSLN RDLTGELEYA TKISRFSNVY
151  HLSIHISKNF GADTTKVFYI GLRGEWTELR RHEVTICNYE ASANPADHRV
201  HQVTPQTHFI S
C:核苷酸及氨基酸组合序列(SEQ ID NO:21)
克隆号和蛋白名称:PP603
起始编码子:112 ATG     终止编码子:747 TAA
蛋白质分子量:24176.62
   1  GCG CGG CGC GCT TAG TTG CCG GAG CTG AAC GGC GCG GAG CTG GTC TGA     48
  49  GGC GAG CCG AGC CGA GCG AGC GCG GCG GTG GGG CCG AGA GGA CGC GCA     96
  97  GGT GGC GGC GTT GCC ATG TCG CAC GGT CAC AGC CAC GGC GGG GGT GGC    144
   1                      Met Ser His Gly His Ser His Gly Gly Gly Gly     11
 145  TGC CGC TGC GCC GCC GAA CGG GAG GAG CCG CCC GAG CAG CGC GGC CTG    192
  12  Cys Arg Cys Ala Ala Glu Arg Glu Glu Pro Pro Glu Gln Arg Gly Leu     27
 193  GCC TAC GGC CTG TAC CTG CGC ATC GAC CTG GAG CGG CTG CAA TGC CTT    240
  28  Ala Tyr Gly Leu Tyr Leu Arg Ile Asp Leu Glu Arg Leu Gln Cys Leu     43
 241  AAC GAG AGC CGC GAG GGC AGC GGC CGC GGC GTC TTC AAG CCG TGG GAG    288
  44  Asn Glu Ser Arg Glu Gly Ser Gly Arg Gly Val Phe Lys Pro Trp Glu     59
 289  GAG CGG ACC GAC CGC TCC AAG TTT GTT GAA AGT GAT GCA GAT GAA GAG    336
  60  Glu Arg Thr Asp Arg Ser Lys Phe Val Glu Ser Asp Ala Asp Glu Glu     75
 337  CTT CTG TTT AAT ATT CCA TTT ACG GGC AAT GTC AAG CTC AAA GGC ATC    384
  76  Leu Leu Phe Asn Ile Pro Phe Thr Gly Asn Val Lys Leu Lys Gly Ile     91
 385  ATT ATA ATG GGA GAG GAT GAT GAC TCA CAC CCC TCT GAG ATG AGA CTG    432
  92  Ile Ile Met Gly Glu Asp Asp Asp Ser His Pro Ser Glu Met Arg Leu    107
 433  TAC AAG AAT ATT CCA CAG ATG TCC TTT GAT GAT ACA GAA AGG GAG CCA    480
 108  Tyr Lys Asn Ile Pro Gln Met Ser Phe Asp Asp Thr Glu Arg Glu Pro    123
 481  GAT CAG ACC TTT AGT CTG AAC CGG GAT CTT ACA GGA GAA TTA GAG TAT    528
 124  Asp Gln Thr Phe Ser Leu Asn Arg Asp Leu Thr Gly Glu Leu Glu Tyr    139
 529  GCT ACA AAA ATT TCT CGT TTT TCA AAT GTC TAT CAT CTC TCA ATT CAT    576
 140  Ala Thr Lys Ile Ser Arg Phe Ser Asn Val Tyr His Leu Ser Ile His    155
 577  ATT TCA AAA AAC TTC GGA GCA GAT ACG ACA AAG GTC TTT TAT ATT GGC    624
 156  Ile Ser Lys Asn Phe Gly Ala Asp Thr Thr Lys Val Phe Tyr Ile Gly    171
 625  CTG AGA GGA GAG TGG ACT GAG CTT CGC CGA CAC GAG GTG ACC ATC TGC    672
 172  Leu Arg Gly Glu Trp Thr Glu Leu Arg Arg His Glu Val Thr Ile Cys    187
 673  AAT TAC GAA GCA TCT GCC AAC CCA GCA GAC CAT AGG GTC CAT CAG GTT    720
 188  Asn Tyr Glu Ala Ser Ala Asn Pro Ala Asp His Arg Val His Gln Val    203
 721  ACC CCA CAG ACA CAC TTT ATT TCC TAA GGG CTG GCC AAG GCT CCC ATA    768
 204  Thr Pro Gln Thr His Phe Ile Ser ***                                212
 769  GAG GCG CTG TGT CAG TGA AGA TGT ACG ACT ACC TGT TGG GAA GGA CAA    816
 817  AGG GAT GAG GCT CCA GAG AGA GTT GGC TGC CAC AGC CTC TGC CAA GCT    864
 865  TTG TCT TTG GGG CTT GCT GCA GAA ACC TGG CCT ACG GAA GAT ACG ACA    912
 913  CCA CTG GGA GGG TTG TGT AGG TGC CAG GGG ACC ATC GTG GTT CTC TAG    960
 961  GGC GCT GTG GAA ATT GGG TCT TGG GCT GGG TGG CAT CTG GCA GTC ATG   1008
1009  GAT AAC ACT TGC TTT TCC AGT TAA TGT GGC CAT GTG ATT CCA AGT GTC   1056
1057  ATG TTG CTT TGT GGC AAG ATT GTT GTG TGA CTT GTT TTT TTG TTT TTG  1104
1105  TTT TTG TTT TTT TAA AGG AAA CTA TTT GTG GGC TAT AGG AAA CTT TCT  1152
1153  GAT GCC TCC GGA TTG TGT TAG TAG TAG CCA TCA GGA GGG TCT CCA ACT  1200
1201  AAA ACA CTT GTT CCT GCT TGC TCC TTT CCC CTC TCA TTG TTC AGC ATT  1248
1249  CTT GTC AAG TTG CCC AGC TTG GAG TTG TCT GTC ACG CAC ATG TGT CCT  1296
1297  GTG GTT ATA GCT AGA AGG ACA GGA GTC TCC TGC TGA TGC GTG ATA GCT  1344
1345  TAA GCT TGG GGA GAA GGT CTT TTC CAC TGC CTA GCT AAG CAG TCT GGG  1392
1393  GAG AGC ATG GGG ATC ATT TCT ATG TGT GTG GGT AAT CTG GTC AGT AAG  1440
1441  ATT GAG ACT TAG TTA AGA TTC CCC TTG GAA ATT CCT TAA TGT TTA TTA  1488
1489  GCT TCT AAC TAG TGT TGT AAG TCC GAT GCC AGA ATT TGG AGA TTT GAG  1536
1537  TTC TTC TTT TCA TGG CTT TTA TTC ACT GTG ACT AAT AAG CTT CCT AAT  1584
1585  AAA TCC TTG CCA GAC TTA AAA AAA AAA AAA AAA AA                   1619
D:Blastp结果
Query=PP603[基因=PP603](211个氨基酸)
>SW:YOJ1_CAEEL P34624 caenorhabditis elegans.hypothetical 63.5kd
            protein zk353.1 in chromosome iii.6/1994
长度=548
分值=179 bits(449),预计值=2e-44
相同性=89/187(47%),相似性=124/187(65%),缺口=1/187(0%)
Query:14  CAAER-EEPPEQRGLAYGLYLRIDLERLQCLNESREGSGRGVFKPWEERTDRSKFVESDA  72
           CAAE   E P      Y +   ID+E++  LNES +G+G+ VFK  E+R DR ++VESD
Sbjct:350 CAAEHIPEVPGDDVYRYDMVSYIDMEKVTTLNESVDGAGKKVFKVMEKRDDRLEYVESDC 409
Query:73  DEELLFNIPFTGNVKLKGIIIMGEDDDSHPSEMRLYKNIPQMSFDDTEREPDQTFSLNRD 132
           D ELLFNIPFTG+V+L G+ I+G++D SHP+++RL+K+   MSFDD   E DQ   L +D
Sbjct:410 DHELLFNIPFTGHVRLTGLSIIGDEDGSHPAKIRLFKDREAMSFDDCSIEADQEIDLKQD 469
Query:133 LTGELEYATKISRFSNVYHLSIHISKNFGADTTKVFYIGLRGEWTELRRHEVTICNYEAS 192
             G ++Y  K S+F N+++LSI+   NFG D TK++YIGLRGE+    R  + I  YE+
Sbjct:470 PQGLVDYPLKASKFGNIHNLSILVDANFGEDETKIYYIGLRGEFQHEFRQRIAIATYESR 529
Query:193 ANPADHR 199
            A  DH+
Sbjct:530 AQLKDHK 536
8.PP632
A:核苷酸序列:(SEQ ID NO:22)  长度:1854bp
 1   GGAGAGCCCG GCCCGCGGGC CGTCCGTCCC CCACAGGAAA CCGCCGGGGA
 51  GGCCGCGGCA GGGACCCGCC CCCAGGCCAC TAACAGCAAC AACAGAGAGG
101  CTGGAGCTCT GCCTGCGTGC GGGCCAAGGG CTAAACCTTG GACAGGTTCT
151  TTCACTTACT CCGCCTGACA ACCCTGCGAC GTGATACCAT TATCCCCACT
201  TCGCAGATCA AATAAACGGA GTCTTGGAGA GATTGAATTG ACTTTACCAA
251  AACCGTCAGG ATTTGAATCT GCTGCTCTCT GATCCTAAAG CCTGAGCTAG
301  AAACCACCGC TCCCCCTCCT AGGAGGCCCC TTCCAGGGGC TTGCCGTGGC
351  CAAGCCAGGC CAGGTGGGAG AAGCGGCAGC CTTGCCCTGG AGGGTTTTGA
401  GAAGCACTGC TCCTGGAGGC CCTGGGGAAG GTCCCTGAAA CCTTTGGCCA
451  ATGTGGCTGT CCCCATGGTC CACATGCCCT CCCCACCCCC TGCCTAGCTG
 501  CTTGACTGCC TGCTGCTCCC CAGCCCACCA GCCTGTCCGT GGGTCAGCCC
 551  AGCCACCCGC TTCGGATCTC TGCACGTGTG TCACCTGCTG TTCTGGCCCT
 601  CATCCCAACT ATCCACCTGC CCATCTCCTC CCTACCTCCT CGCTGCCTAT
 651  CTGCCCAGGA CTTATCTGCT GTCTGCTCAC CTGCCTGCTT GTTGACTGCT
 701  TCTCTGCCCT CCTATCTGCC TGTGAGACTA GAGATTTGTC ACCTTGGAAA
 751  GCACGGAGAG TACTGCTAAG ATGAAACACA GGAAGGACAG GCCTTGATGG
 801  AAGGTTGGGG GGCCGAGAGA TCCAGAGCCT ATGGGAGGGG ACTTGTGAGT
 851  GCTGGCATAT TCAGGACCCA GTGCAAACCC AAGCACAGCT CTGCTCCCGG
 901  CCCCAGTGGC CAAACTGAAG GCTTGCCCTG GCTATTCTGC CGTTGACATG
 951  GGCCTCACCC TACCACGGGG ATAGGTCTTG GATGGAGGGA AGAGGGAGAC
1001  TCACCGGGGG CCTCCTGAGT CCTTTGAGTG TCCCCATGAC CCCAGCACCT
1051  GGGACAGCTG CTGGAAAGAG GGTACTGGCA AAAATTTGCT AAATGGACAA
1101  TCATAGGCCC AGTGTGGTGG CTCACGTCTG TAATCCCAGC ACTTTGGGAG
1151  GCCGAGGTGT GCAGATCACT GAAGTCCAGG AGTTTGAGAC CAGCCTGGGC
1201  AACATGGTGA AACCCCATTT CTACAGAAAA CTACAAAAAT TAGCTGGACA
1251  CGGTAGCACA CACCTATAGT TCCTGCTACT CAGGAGGCTA AGGTGGGAGG
1301  ATCGCTTGAG CCCAGGAGAT CAAGGCTATG GTGAGCCGTG ATCGTGCCAC
1351  TGTACTCCAG CCTGGATGAC AGAGGAAGAC CCTGTCTCAA AACAAACAAA
1401  ACAACAGCAA CAACAAGAAA ACAATAATAG GGACATTGAG TACCCTTTCT
1451  GGCACCTGGC ACTCTGCCAA ATGCTATGCA CACTCCGCCC TTCAGTCTTC
1501  CCAGGAACCC TGTGCAGTTT GTAGCGTGGC TCACATTTGC CAAGAAGGAA
1551  GTGAGGCTCA GCGAGGTTAA GCAGTGCCTG TGGAGTCACA TGGCTGCAAG
1601  TAGTGGCCTG GACTGGACTG CAGAGCCCAT GCTCCCCACC GCTTTCCATG
1651  GGGCAACTCT AGGCCATCAT TCTCCACCCC TCAGACCCAA AGCTGCCTTT
1701  TCATAATGCT TGCTGTTGCT CCCTTTATGC TCCTGAAATG AAATTTATGG
1751  CTAATATGCC AGCCTTTACA TCTAATTAAA AATCATCCAA TGGTTTTTTT
1801  GTCCTTATTA ATATATAAGA AATAAAAGGT AATGATAAAA AAAAAAAAAA
1851  AAAA
B:氨基酸序列:(SEQ ID NO:23)长度:107个氨基酸
  1  MWLSPWSTCP PHPLPSCLTA CCSPAHQPVR GSAQPPASDL CTCVTCCSGP
 51  HPNYPPAHLL PTSSLPICPG LICCLLTCLL VDCFSALLSA CETRDLSPWK
101  ARRVLLR
C.核苷酸及氨基酸组合序列(SEQ ID NO:24)
克隆号和蛋白名称:PP632
起始编码子:451 ATG     终止编码子:774 TGA
蛋白质分子量:11453.94
  1  GGA GAG CCC GGC CCG CGG GCC GTC CGT CCC CCA CAG GAA ACC GCC GGG     48
 49  GAG GCC GCG GCA GGG ACC CGC CCC CAG GCC ACT AAC AGC AAC AAC AGA     96
 97  GAG GCT GGA GCT CTG CCT GCG TGC GGG CCA AGG GCT AAA CCT TGG ACA    144
145  GGT TCT TTC ACT TAC TCC GCC TGA CAA CCC TGC GAC GTG ATA CCA TTA    192
193  TCC CCA CTT CGC AGA TCA AAT AAA CGG AGT CTT GGA GAG ATT GAA TTG    240
241  ACT TTA CCA AAA CCG TCA GGA TTT GAA TCT GCT GCT CTC TGA TCC TAA    288
289  AGC CTG AGC TAG AAA CCA CCG CTC CCC CTC CTA GGA GGC CCC TTC CAG    336
337  GGG CTT GCC GTG GCC AAG CCA GGC CAG GTG GGA GAA GCG GCA GCC TTG    384
385  CCC TGG AGG GTT TTG AGA AGC ACT GCT CCT GGA GGC CCT GGG GAA GGT    432
433  CCC TGA AAC CTT TGG CCA ATG TGG CTG TCC CCA TGG TCC ACA TGC CCT    480
  1                          Met Trp Leu Ser Pro Trp Ser Thr Cys Pro     10
 481  CCC CAC CCC CTG CCT AGC TGC TTG ACT GCC TGC TGC TCC CCA GCC CAC    528
  11  Pro His Pro Leu Pro Ser Cys Leu Thr Ala Cys Cys Ser Pro Ala His     26
 529  CAG CCT GTC CGT GGG TCA GCC CAG CCA CCC GCT TCG GAT CTC TGC ACG    576
  27  Gln Pro Val Arg Gly Ser Ala Gln Pro Pro Ala Ser Asp Leu Cys Thr     42
 577  TGT GTC ACC TGC TGT TCT GGC CCT CAT CCC AAC TAT CCA CCT GCC CAT    624
  43  Cys Val Thr Cys Cys Ser Gly Pro His Pro Asn Tyr Pro Pro Ala His     58
 625  CTC CTC CCT ACC TCC TCG CTG CCT ATC TGC CCA GGA CTT ATC TGC TGT    672
  59  Leu Leu Pro Thr Ser Ser Leu Pro Ile Cys Pro Gly Leu Ile Cys Cys     74
 673  CTG CTC ACC TGC CTG CTT GTT GAC TGC TTC TCT GCC CTC CTA TCT GCC    720
  75  Leu Leu Thr Cys Leu Leu Val Asp Cys Phe Ser Ala Leu Leu Ser Ala     90
 721  TGT GAG ACT AGA GAT TTG TCA CCT TGG AAA GCA CGG AGA GTA CTG CTA    768
  91  Cys Glu Thr Arg Asp Leu Ser Pro Trp Lys Ala Arg Arg Val Leu Leu    106
 769  AGA TGA AAC ACA GGA AGG ACA GGC CTT GAT GGA AGG TTG GGG GGC CGA    816
 107  Arg ***                                                            108
 817  GAG ATC CAG AGC CTA TGG GAG GGG ACT TGT GAG TGC TGG CAT ATT CAG    864
 865  GAC CCA GTG CAA ACC CAA GCA CAG CTC TGC TCC CGG CCC CAG TGG CCA    912
 913  AAC TGA AGG CTT GCC CTG GCT ATT CTG CCG TTG ACA TGG GCC TCA CCC    960
 961  TAC CAC GGG GAT AGG TCT TGG ATG GAG GGA AGA GGG AGA CTC ACC GGG   1008
1009  GGC CTC CTG AGT CCT TTG AGT GTC CCC ATG ACC CCA GCA CCT GGG ACA   1056
1057  GCT GCT GGA AAG AGG GTA CTG GCA AAA ATT TGC TAA ATG GAC AAT CAT   1104
1105  AGG CCC AGT GTG GTG GCT CAC GTC TGT AAT CCC AGC ACT TTG GGA GGC   1152
1153  CGA GGT GTG CAG ATC ACT GAA GTC CAG GAG TTT GAG ACC AGC CTG GGC   1200
1201  AAC ATG GTG AAA CCC CAT TTC TAC AGA AAA CTA CAA AAA TTA GCT GGA   1248
1249  CAC GGT AGC ACA CAC CTA TAG TTC CTG CTA CTC AGG AGG CTA AGG TGG   1296
1297  GAG GAT CGC TTG AGC CCA GGA GAT CAA GGC TAT GGT GAG CCG TGA TCG   1344
1345  TGC CAC TGT ACT CCA GCC TGG ATG ACA GAG GAA GAC CCT GTC TCA AAA   1392
1393  CAA ACA AAA CAA CAG CAA CAA CAA GAA AAC AAT AAT AGG GAC ATT GAG   1440
1441  TAC CCT TTC TGG CAC CTG GCA CTC TGC CAA ATG CTA TGC ACA CTC CGC   1488
1489  CCT TCA GTC TTC CCA GGA ACC CTG TGC AGT TTG TAG CGT GGC TCA CAT   1536
1537  TTG CCA AGA AGG AAG TGA GGC TCA GCG AGG TTA AGC AGT GCC TGT GGA   1584
1585  GTC ACA TGG CTG CAA GTA GTG GCC TGG ACT GGA CTG CAG AGC CCA TGC   1632
1633  TCC CCA CCG CTT TCC ATG GGG CAA CTC TAG GCC ATC ATT CTC CAC CCC   1680
1681  TCA GAC CCA AAG CTG CCT TTT CAT AAT GCT TGC TGT TGC TCC CTT TAT   1728
1729  GCT CCT GAA ATG AAA TTT ATG GCT AAT ATG CCA GCC TTT ACA TCT AAT   1776
1777  TAA AAA TCA TCC AAT GGT TTT TTT GTC CTT ATT AAT ATA TAA GAA ATA   1824
1825  AAA GGT AAT GAT AAA AAA AAA AAA AAA AAA                           1854
D:Blastp结果
Query=PP632AA(107个氨基酸)
>SP_IN:045021 045021 caenorhabditis elegans.zc123.1 protein.
            11/1998
长度=768
分值=35.6 bits(80),预计值=0.16
相同性=19/50(38%),相似性=21/50(42%),缺口=8/50(16%)
Query:5   PWSTCPPHPLPSCLTACCSPAHQPVRGSAQPPASDLCTCVTCCSGPHPNY  54
           P + CPP P P     CC PA  P       PA+  C    CC G  P Y
Sbjct:106 PLACCPPPPPPK---PCCQPAFGPCC-----PATPNCCPKPCCRGRRPEY 147
>SP_IN:Q17982 Q17982 caenorhabditis elegans.similarity to erbb-3
            receptor protein-tyrosine kinase.11/1998
长度=654
分值=31.7bits(70),预计值=2.3
相同性=24/99(24%),相似性=32/99(32%),缺口=15/99(15%)
Query:7   STCPPHPLPSCLTACCSPAHQPVRGS------------AQPPASDLCTCVTCCSGPHPNY  54
           S+C P    SC+   C+PA QP   S             QPP S    C + C    P
Sbjct:352 SSCMPACQSSCVQQACAPACQPKCSSQCVEQQQAQIVVVQPPTSSSNNCASSCM---PQC 408
Query:55  PPAHLLPTSSXXXXXXXXXXXXXXXXVDCFSALLSACET 93
            P  +   +                   C  A L+CE+
Sbjct:409 TPQCVQQQTICAAACQPSCQSSCSSNAQCVQACLPSCES 447
>PIR2:A60533 tumor-associated antigen DF3-human
长度=256
分值=30.5bits(67),预计值=5.2
相同性=19/56(33%),相似性=25/56(43%),缺口=7/56(12%)
Query:4   SPWSTCPP-HPLPSCLTACCSPAHQPVRGSAQPPASDLCTCVTCCSGPHPNYPPAH  58
           +P ST PP H + S      +P  +P  GS  PPA  + +       P    PPAH
Sbjct:130 APGSTAPPAHRVTS------APESRPAPGSTAPPAHRVTSAPESRPAPGSTAPPAH 179
9.PP844
A:核苷酸序列:(SEQ ID NO:25)  长度:1843bp
 1   TGAAGGCCGA TGCTGTGGGG GTGGGCGTGG AGAGAATTCT TCTGTGGGTC
 51  CTCTGGTGTT GAGTGGTCGG CTTGGTGTGG TGTGCGGAGG AGCTCCAGGC
101  CCGTCGGCGC GGAGGGTCTT GCTGTGTTGC CCAGCCTGGT CTTGAATTCC
151  TGGACTCAAG TGATGCTCCT GCCTTGGCTT CCCAAACTCC TGGAATTACA
201  ACTTGGTCTC ACGTGTGAAA CATGGCTACA GATTGGCTGG GAAGTATTGT
251  GTCCATCAAT TGTGGAGATA GCTTGGGTGT CTATCAGGGA AGAGTGTCAG
301  CTGTGGATCA GGTCAGCCAG ACCATTTCTC TCACCCGGCC TTTCCATAAT
351  GGAGTGAAGT GTCTTGTTCC AGAAGTCACC TTCAGGGCAG GTGACATTAC
401  GGAGTTAAAA ATTCTGGAGA TACCAGGACC TGGAGACAAC CAACATTTTG
451  GAGACCTTCA TCAAACAGAA TTAGGCCCCT CTGGTGCTGG CTGCCAAGTG
501  GGCATCAATC AGAATGGCAC AGGCAAGTTT GTCAAGAAGC CAGCCTCTTC
551  CAGCAGTGCC CCTCAGAATA TCCCTAAGAG GACAGATGTG AAGAGCCAGG
601  ATGTTGCCGT TTCCCCGCAG CAGCAACAGT GCTCAAAGAG CTATGTCGAC
651  AGGCACATGG AATCCTTGAG TCAGTCCAAA AGTTTCCGTC GTCGGCACAA
701  CTCCTGGTCA TCTAGTAGCA GGCACCCAAA TCAGGCAACT CCCAAGAAAA
751  GTGGTTTAAA GAATGGCCAG ATGAAGAATA AAGATGACGA GTGCTTCGGG
801  GATGATATTG AGGAGATCCC AGACACAGAT TTTGATTTTG AAGGGAACCT
851  GGCTCTTTTT GACAAGGCAG CTGTGTTTGA GGAGATTGAT ACCTATGAAA
901  GGAGAAGTGG TACCCGTTCC CGGGGCATCC CAAATGAAAG GCCCACTCGG
951  TACCGCCATG ATGAGAACAT CTTGGAGTCC GAGCCCATTG TCTATCGACG
1001  GATCATAGTG CCCCACAACG TGAGCAAGGA GTTCTGCACG GACTCTGGCC
1051  TGGTTGTCCC AAGTATTTCC TATGAGCTGC ATAAAAAGCT GTTGTCCGTG
1101  GCTGAGAAGC ATGGGCTGAC CCTTGAGCGG AGACTGGAGA TGACAGGTGT
1151  GTGTGCCAGT CAGATGGCAC TGACCCTCCT CGGAGGACCT AACAGGTTGA
1201  ATCCCAAAAA TGTTCACCAG AGGCCTACAG TGGCTCTACT GTGTGGACCT
1251  CATGTGAAGG GGGCTCAGGG TATCAGCTGT GGAAGGCACC TAGCCAACCA
1301  TGATGTCCAG GTCATCCTTT TCCTGCCCAA TTTTGTCAAG ATGTTGGAAT
1351  CTATCACCAA TGAGCTGTCG CTCTTCAGCA AGACCCAAGG CCAACAAGTG
1401  TCTAGCCTCA AAGATCTGCC CACTAGCCCT GTGGACCTGG TCATCAACTG
1451  CCTGGATTGC CCTGAGAACG TCTTCCTGCG CGATCAACCC TGGTACAAGG
1501  CAGCTGTGGC CTGGGCCAAC CAGAACCGGG CACCAGTACT CAGCATAGAC
1551  CCTCCTGTGC ATGAAGTCGA ACAGGGCATT GATGCCAAAT GGTCACTGGC
1601  ACTGGGCCTG CCTCTGCCAC TGGGGGAGCA CGCAGGCCGT ATCTATTTGT
1651  GCGACATTGG CATTCCCCAG CAGGTCTTCC AGGAGGTGGG CATCAACTAC
1701  CACTCGCCCT TTGGCTGCAA GTTTGTTATC CCACTGCACT CTGCTTAAAG
1751  GGTTCCTGCG CAGGCAGGAC TCTGCTGTCC CCTGCTGCTC CTGATAACAA
1801  ACGCCTTAAG GTTTTGTAAA AAAAAAAAAA AAAAAAAAAA AAA
B:氨基酸序列:(SEQ ID NO:26)长度:508个氨基酸
  1  MATDWLGSIV SINCGDSLGV YQGRVSAVDQ VSQTISLTRP FHNGVKCLVP
 51  EVTFRAGDIT ELKILEIPGP GDNQHFGDLH QTELGPSGAG CQVGINQNGT
101  GKFVKKPASS SSAPQNIPKR TDVKSQDVAV SPQQQQCSKS YVDRHMESLS
151  QSKSFRRRHN SWSSSSRHPN QATPKKSGLK NGQMKNKDDE CFGDDIEEIP
201  DTDFDFEGNL ALFDKAAVFE EIDTYERRSG TRSRGIPNER PTRYRHDENI
251  LESEPIVYRR IIVPHNVSKE FCTDSGLVVP SISYELHKKL LSVAEKHGLT
301  LERRLEMTGV CASQMALTLL GGPNRLNPKN VHQRPTVALL CGPHVKGAQG
351  ISCGRHLANH DVQVILFLPN FVKMLESITN ELSLFSKTQG QQVSSLKDLP
401  TSPVDLVINC LDCPENVFLR DQPWYKAAVA WANQNRAPVL SIDPPVHEVE
451  QGIDAKWSLA LGLPLPLGEH AGRIYLCDIG IPQQVFQEVG INYHSPFGCK
501  FVIPLHSA
C:核苷酸及氨基酸组合序列(SEQ ID NO:27)
克隆号和蛋白名称:PP844
起始编码子:222 ATG        终止编码子:1748 TAA
蛋白质分子量:56074.68
  1   TG AAG GCC GAT GCT GTG GGG GTG GGC GTG GAG AGA ATT CTT CTG TGG     47
 48  GTC CTC TGG TGT TGA GTG GTC GGC TTG GTG TGG TGT GCG GAG GAG CTC     95
 96  CAG GCC CGT CGG CGC GGA GGG TCT TGC TGT GTT GCC CAG CCT GGT CTT    143
144  GAA TTC CTG GAC TCA AGT GAT GCT CCT GCC TTG GCT TCC CAA ACT CCT    191
192  GGA ATT ACA ACT TGG TCT CAC GTG TGA AAC ATG GCT ACA GAT TGG CTG    239
  1                                          Met Ala Thr Asp Trp Leu      6
240  GGA AGT ATT GTG TCC ATC AAT TGT GGA GAT AGC TTG GGT GTC TAT CAG    287
  7  Gly Ser Ile Val Ser Ile Asn Cys Gly Asp Ser Leu Gly Val Tyr Gln     22
288  GGA AGA GTG TCA GCT GTG GAT CAG GTC AGC CAG ACC ATT TCT CTC ACC    335
 23  Gly Arg Val Ser Ala Val Asp Gln Val Ser Gln Thr Ile Ser Leu Thr     38
336  CGG CCT TTC CAT AAT GGA GTG AAG TGT CTT GTT CCA GAA GTC ACC TTC    383
  39  Arg Pro Phe His Asn Gly Val Lys Cys Leu Val Pro Glu Val Thr Phe     54
 384  AGG GCA GGT GAC ATT ACG GAG TTA AAA ATT CTG GAG ATA CCA GGA CCT    431
  55  Arg Ala Gly Asp Ile Thr Glu Leu Lys Ile Leu Glu Ile Pro Gly Pro     70
 432  GGA GAC AAC CAA CAT TTT GGA GAC CTT CAT CAA ACA GAA TTA GGC CCC    479
  71  Gly Asp Asn Gln His Phe Gly Asp Leu His Gln Thr Glu Leu Gly Pro     86
 480  TCT GGT GCT GGC TGC CAA GTG GGC ATC AAT CAG AAT GGC ACA GGC AAG    527
  87  Ser Gly Ala Gly Cys Gln Val Gly Ile Asn Gln Asn Gly Thr Gly Lys    102
 528  TTT GTC AAG AAG CCA GCC TCT TCC AGC AGT GCC CCT CAG AAT ATC CCT    575
 103  Phe Val Lys Lys Pro Ala Ser Ser Ser Ser Ala Pro Gln Asn Ile Pro    118
 576  AAG AGG ACA GAT GTG AAG AGC CAG GAT GTT GCC GTT TCC CCG CAG CAG    623
 119  Lys Arg Thr Asp Val Lys Ser Gln Asp Val Ala Val Ser Pro Gln Gln    134
 624  CAA CAG TGC TCA AAG AGC TAT GTC GAC AGG CAC ATG GAA TCC TTG AGT    671
 135  Gln Gln Cys Ser Lys Ser Tyr Val Asp Arg His Met Glu Ser Leu Ser    150
 672  CAG TCC AAA AGT TTC CGT CGT CGG CAC AAC TCC TGG TCA TCT AGT AGC    719
 151  Gln Ser Lys Ser Phe Arg Arg Arg His Asn Ser Trp Ser Ser Ser Ser    166
 720  AGG CAC CCA AAT CAG GCA ACT CCC AAG AAA AGT GGT TTA AAG AAT GGC    767
 167  Arg His Pro Asn Gln Ala Thr Pro Lys Lys Ser Gly Leu Lys Asn Gly    182
 768  CAG ATG AAG AAT AAA GAT GAC GAG TGC TTC GGG GAT GAT ATT GAG GAG    815
 183  Gln Met Lys Asn Lys Asp Asp Glu Cys Phe Gly Asp Asp Ile Glu Glu    198
 816  ATC CCA GAC ACA GAT TTT GAT TTT GAA GGG AAC CTG GCT CTT TTT GAC    863
 199  Ile Pro Asp Thr Asp Phe Asp Phe Glu Gly Asn Leu Ala Leu Phe Asp    214
 864  AAG GCA GCT GTG TTT GAG GAG ATT GAT ACC TAT GAA AGG AGA AGT GGT    911
 215  Lys Ala Ala Val Phe Glu Glu Ile Asp Thr Tyr Glu Arg Arg Ser Gly    230
 912  ACC CGT TCC CGG GGC ATC CCA AAT GAA AGG CCC ACT CGG TAC CGC CAT    959
 231  Thr Arg Ser Arg Gly Ile Pro Asn Glu Arg Pro Thr Arg Tyr Arg His    246
 960  GAT GAG AAC ATC TTG GAG TCC GAG CCC ATT GTC TAT CGA CGG ATC ATA   1007
 247  Asp Glu Asn Ile Leu Glu Ser Glu Pro Ile Val Tyr Arg Arg Ile Ile    262
1008  GTG CCC CAC AAC GTG AGC AAG GAG TTC TGC ACG GAC TCT GGC CTG GTT   1055
 263  Val Pro His Asn Val Ser Lys Glu Phe Cys Thr Asp Ser Gly Leu Val    278
1056  GTC CCA AGT ATT TCC TAT GAG CTG CAT AAA AAG CTG TTG TCC GTG GCT   1103
 279  Val Pro Ser Ile Ser Tyr Glu Leu His Lys Lys Leu Leu Ser Val Ala    294
1104  GAG AAG CAT GGG CTG ACC CTT GAG CGG AGA CTG GAG ATG ACA GGT GTG   1151
 295  Glu Lys His Gly Leu Thr Leu Glu Arg Arg Leu Glu Met Thr Gly Val    310
1152  TGT GCC AGT CAG ATG GCA CTG ACC CTC CTC GGA GGA CCT AAC AGG TTG   1199
 311  Cys Ala Ser Gln Met Ala Leu Thr Leu Leu Gly Gly Pro Asn Arg Leu    326
1200  AAT CCC AAA AAT GTT CAC CAG AGG CCT ACA GTG GCT CTA CTG TGT GGA    1247
 327  Asn Pro Lys Asn Val His Gln Arg Pro Thr Val Ala Leu Leu Cys Gly     342
1248  CCT CAT GTG AAG GGG GCT CAG GGT ATC AGC TGT GGA AGG CAC CTA GCC    1295
 343  Pro His Val Lys Gly Ala Gln Gly Ile Ser Cys Gly Arg His Leu Ala     358
1296  AAC CAT GAT GTC CAG GTC ATC CTT TTC CTG CCC AAT TTT GTC AAG ATG    1343
 359  Asn His Asp Val Gln Val Ile Leu Phe Leu Pro Asn Phe Val Lys Met     374
1344  TTG GAA TCT ATC ACC AAT GAG CTG TCG CTC TTC AGC AAG ACC CAA GGC    1391
 375  Leu Glu Ser Ile Thr Asn Glu Leu Ser Leu Phe Ser Lys Thr Gln Gly     390
1392  CAA CAA GTG TCT AGC CTC AAA GAT CTG CCC ACT AGC CCT GTG GAC CTG    1439
 391  Gln Gln Val Ser Ser Leu Lys Asp Leu Pro Thr Ser Pro Val Asp Leu     406
1440  GTC ATC AAC TGC CTG GAT TGC CCT GAG AAC GTC TTC CTG CGC GAT CAA    1487
 407  Val Ile Asn Cys Leu Asp Cys Pro Glu Asn Val Phe Leu Arg Asp Gln     422
1488  CCC TGG TAC AAG GCA GCT GTG GCC TGG GCC AAC CAG AAC CGG GCA CCA    1535
 423  Pro Trp Tyr Lys Ala Ala Val Ala Trp Ala Asn Gln Asn Arg Ala Pro     438
1536  GTA CTC AGC ATA GAC CCT CCT GTG CAT GAA GTC GAA CAG GGC ATT GAT    1583
 439  Val Leu Ser Ile Asp Pro Pro Val His Glu Val Glu Gln Gly Ile Asp     454
1584  GCC AAA TGG TCA CTG GCA CTG GGC CTG CCT CTG CCA CTG GGG GAG CAC    1631
 455  Ala Lys Trp Ser Leu Ala Leu Gly Leu Pro Leu Pro Leu Gly Glu His     470
1632  GCA GGC CGT ATC TAT TTG TGC GAC ATT GGC ATT CCC CAG CAG GTC TTC    1679
 471  Ala Gly Arg Ile Tyr Leu Cys Asp Ile Gly Ile Pro Gln Gln Val Phe     486
1680  CAG GAG GTG GGC ATC AAC TAC CAC TCG CCC TTT GGC TGC AAG TTT GTT    1727
 487  Gln Glu Val Gly Ile Asn Tyr His Ser Pro Phe Gly Cys Lys Phe Val     502
1728  ATC CCA CTG CAC TCT GCT TAA AGG GTT CCT GCG CAG GCA GGA CTC TGC    1775
 503  Ile Pro Leu His Ser Ala ***                                         509
1776  TGT CCC CTG CTG CTC CTG ATA ACA AAC GCC TTA AGG TTT TGT AAA AAA    1823
1824  AAA AAA AAA AAA AAA AAA AA                                         1843
D:Blastp结果
Query=PP844[基因=PP844](508个氨基酸)
>SP_FUN:094752 094752 schizosaccharomyces pombe(fission yeast).
            hypothet ical 49.2kd protein.5/1999
长度=454
分值=77.6 bits(188),预计值=2e-13
相同性=80/347(23%),相似性=138/347(39%),缺口=63/347(18%)
Query:201 DTDFDFEGNLALFDKAAVFEEIDTYERRSGTRSRGIPNERPTR-YRHDENILE------- 252
           D +FDF  NL  FDK  VF E    +++   +     N+ P R Y H +N+L
Sbjct:96  DEEFDFAANLEKFDKKQVFAEFREKDKKDPAKLLVSHNKSPNRNYHHKQNVLGPSVKDEF 155
Query:253 --------------------------------SEPIVYRRIIVPHNVSKEFCTDSGLVVP 280
                                            S  + ++  V  N+  E  T +G ++
Sbjct:156 VDLPSAGSQINGIDAVLSSSSNGHVTPGSKKGSRETLKKKPFVDENIPAELHTTTGDILK 215
Query:281 SISYELHKKLLSVAEKHGLTLERRLEMTGVCASQMALTLLGGPNRLNPKNVHQRPTVALL 340
            I+ E   + +++A     T +  +E      SQ   ++LGG  RL+ +N + +P V +L
Sbjct:216 PITPEQLSQGIALAIAKTST-DIVVENAAQLLSQFVFSVLGGHKRLSSRNHNSQPLVCIL 274
Query:341 CGPHVKGAQGISCGRHLANHDVQVILFLPNFVKMLESITNELSLFSKTQG----QQVSSL 396
            G H   +  ++ GR L    ++V+L L   +        +L +F    G    +
Sbjct:275 VGSHDHASAAVAAGRRLCAIGIKVVLRL---LTPFNVDNRQLLMFQAAGGYIPTENFDQF 331
Query:397 KDLPTSPVDLVINCLDCPENVFLRDQPWYKAAVAWANQNRAPVLSIDPP----VHEVEQG 452
            +  TSP++LV++ L        ++     A + WAN     +LS+D P    V +
Sbjct:332 LNKLTSPIELVVDVLTGFHPSIDKNS---HALIQWANDLNVLILSVDIPSGYTVQKKNTA 388
Query:453 IDAKWSLALGLPLPLGEHAG--------RIYLCDIGIPQQVFQEVGI 491
           I  KW+LALG        A          +++ ++G   Q + E+GI
Sbjct:389 ILPKWTLALGAVTTTLAQAALVKQAAGVSVFVGNLGTGSQTWAELGI 435
>SW:YNUO_YEAST P40165 saccharomyces cerevisiae(baker′s yeast).
            hypothetical 27.5kd protein in spx19-gcr2 intergenic
            region.7/1998
长度=246
分值=35.6 bits(80),预计值=1.0
相同性=51/212(24%),相似性=89/212(41%),缺口=28/212(13%)
Query:277 LVVPSISYELHKKLLSVAEKHGLTLERRLEMTGVCASQMALTLLGGPNRLNPKNVHQRPT 336
           +V   ++ E+ K+L+    + G TL++ +E+ G   +Q        P R       +
Sbjct:6   VVSSKLAAEIDKELMG--PQIGFTLQQLMELAGFSVAQAVCRQF--PLR-GKTETEKGKH  60
Query:337 VALLCGPHVKGAQGISCGRHLANHDVQVILFLP------NFVKMLESITN--ELSLFSKT 388
           V ++ GP   G  G+ C RHL       ++F P       F K L    N  ++ + S+
Sbjct:61  VFVIAGPGNNGGDGLVCARHLKLFGYNPVVFYPKRSERTEFYKQLVHQLNFFKVPVLSQD 120
Query:389 QGQQVSSLKDLPT-SPVDLVINCLDCPENVFLRDQPWYKAAV--AWANQNRAPVLSIDPP 445
           +G  +  LK   T   VD +      P    +R+   +K  V      QN  P++S+D P
Sbjct:121 EGNWLEYLKPEKTLCIVDAIFGFSFKPP---MREP--FKGIVEELCKVQNIIPIVSVDVP 175
Query:446 V-HEVEQG------IDAKWSLALGLPLPLGEH 470
              +V++G      I+    ++L +P P   H
Sbjct:176 TGWDVDKGPISQPSINPAVLVSLTVPKPCSSH 207
>SP_IN:P91255 P91255 caenorhabditis elegans.f12f3.2 protein.5/1999
             长度=2783
分值=35.2bits(79),预计值=1.3
相同性=25/92(27%),相似性=39/92(42%),缺口=8/92(8%)
Query:48   LVPEVTFRAGDITELKILEIPGPGDNQHFGDLHQTELGPSGAGCQVGINQNGTGKFVKKP  107
            +VP+        +   IL +    +N  F  L + ELG + A CQV I          KP
Sbjct:1536 IVPDEKIDVATTSTSSILNLKSQEENGTFNCLIENELGQASASCQVTI--------FNKP  1587
Query:108  ASSSSAPQNIPKRTDVKSQDVAVSPQQQQCSK 139
            AS  S P +  +R  V +   A++ +  Q  +
Sbjct:1588 ASLQSTPDHSLERNLVPTLQKALNNESAQAGQ 1619
>SP_IN:Q21740 Q21740 caenorhabditis elegans.r05d11.8 protein.
            1/1999
长度=566
分值=34.4bits(77),预计值=2.3
相同性=31/138(22%),相似性=64/138(45%),缺口=13/138(9%)
Query:6   LGSIVSINCGDSLGVYQGRVSAVDQVSQTISLTRPFHNGV---KCLVPEVTFRAGDITEL  62
           +GS++S    D   VYQG+++  D  +  +++     NG+   +C     T  + DI+ L
Sbjct:6   IGSVISTETKDG-NVYQGKLTTYDTNNGNLTMANVIKNGLPLHRCF----TLSSSDISRL  60
Query:63  KILEIPGPGDNQHFGDLHQTELGPSGAGCQVGINQNGTGKFVKKPASSSSAPQNIPKRTD 122
           K+  I G   +         +   +    Q +  ++     V   +++SS+  ++P  +
Sbjct:61  KV--IRGATQSTQKSQPLPVQNSSNSVNKQRPLKKSAEST-VSSTSTASSSASSVPDSS- 116
Query:123 VKSQDVAVSPQQQQCSKS  140
            +++ VAVSPQ+    +S
Sbjct:117 -RNRSVAVSPQKSAKGRS  133
10.PP928
A:核苷酸序列:(SEQ ID NO:28)  长度:1964bp
   1  GTCCAGCCCA GCCACTCACC CACCGAGAAC AGCAAAGGCC AAAGCCCACC
  51  CTCGAAGGAT GGGAGTGGTG ACTACCAGTC TCGTGGGCTG GTAAAGGCCC
 101  CTGGCAAGAG CTCGTTCACG ATGTTTGTGG ATCTAGGGAT CTACCAGCCT
 151  GGAGGCAGTG GGGACAGCAT CCCCATCACA GCCCTAGTGG GTGGAGAGGG
 201  CACTCGGCTC GACCAGCTGC AGTACGACGT GAGGAAGGGT TCTGTGGTCA
 251  ACGTGAATCC CACCAACACC CGGCCCACAG TGAGACCCCT GAGATCCGGA
 301  AGTACAAGAA GCGATTCAAC TCCGAGATCC TCTGTGCAGC CCTTTGGGGG
 351  GTCAACCTGC TGGTGGGCAC GGAGAACGGC TGATGTTGCT GGACCGAAGT
 401  GGGCAAGGCA AGGTGTATGG ACTCATTGGG CGGCGACGCT TCCAGCAGAT
 451  GGATGTGCTG GAGGGGCTCA ACCTGCTCAT CACCATCTCA GGGAAAAGGA
 501  ACAAACTGCG GGTGTATTAC CTGTCCTGGC TCCGGAACAA GATTCTGCAC
 551  AATGACCCAG AAGTGGAGAA GAAGCAGGGC TGGACCACCG TGGGGGACAT
 601  GGAGGGCTGC GGGCACTACC GTGTTGTGAA ATACGAGCGG ATTAAGTTCC
 651  TGGTCATCGC CCTCAAGAGC TCCGTGGAGG TGTATGCCTG GGCCCCCAAA
 701  CCCTACCACA AATTCATGGC CTTCAAGTCC TTTGCCGACC TCCCCCACCG
 751  CCCTCTGCTG GTCGACCTGA CAGTAGAGGA GGGGCAGCGG CTCAAGGTCA
 801  TCTATGGCTC CAGTGCTGGC TTCCATGCTG TGGATGTCGA CTCGGGGAAC
 851  AGCTATGACA TCTACATCCC TGTGCACATC CAGAGCCAGA TCACGCCCCA
 901  TGCCATCATC TTCCTCCCCA ACACCGACGG CATGGAGATG CTGCTGTGCT
 951  ACGAGGACGA GGGTGTCTAC GTCAACACGT ACGGGCGCAT CATTAAGGAT
1001  GTGGTGCTGC AGTGGGGGGA GATGCCTACT TCTGTGGCCT ACATCTGCTC
1051  CAACCAGATA ATGGGCTGGG GTGAGAAAGC CATTGAGATC CGCTCTGTGG
1101  AGACGGGCCA CCTCGACGGG GTCTTCATGC ACAAACGAGC TCAGAGGCTC
1151  AAGTTCCTGT GTGAGCGGAA TGACAAGGTG TTTTTTGCCT CAGTCCGCTC
1201  TGGGGGCAGC AGCCAAGTTT ACTTCATGAC TCTGAACCGT AACTGCATCA
1251  TGAACTGGTG ACGGGGCCCT GGGCTGGGGC TGTCCCACAC TGGACCCAGC
1301  TCTCCCCCTG CAGCCAGGCT TCCCGGGCCG CCCCTCTTTC CCCTCCCTGG
1351  GCTTTTGCTT TTACTGGTTT GATTTCACTG GAGCCTGCTG GGAACGTGAC
1401  CTCTGACCCC TGATGCTTTC GTGATCACGT GACCATCCTC TTCCCCAACA
1451  TGTCCTCTTC CCAAAACTGT GCCTGTCCCC AGCTTCTGGG GAGGGACACA
1501  GCTTTCCCTT CCCAGGAATT GAGTGGGCCT AGCCCCTCCC CCCTTTTCTC
1551  CATTTGAGAG GAGAGTGCTT GGGGCTTGAA CCCCTTACCC CACTCCAGGG
1601  GCAGGGACCA TTTCTTCATT TTCTGAAAGC ACTTTAATGA TTCCCCTTCC
1651  CCCAAACTCC AGGGAATGGA GGGGGGACCC CGCCAGCCAA AACATTCCCC
1701  CCATTCCCGA CCCCCATCTC CTCTTCTAGC CCATGCCCTT CCCCGGCGGA
1751  GGGAGGGAGC AGGGAGCCCT CACTCTCCAC GCCCCTTGCT TGCATCTGTA
1801  TATAGTGTGA GCAGCAAGTA ACCCTTCTTC TCCCTTCCCC CTCACCCCTT
1851  CTCAATGTAG TGGCCTTGGA TATCCCTGTT TGTTAATAAA GACAATTTAA
1901  CCAGCTCCCA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
1951  AAAAAAAAAA AAAA
B:氨基酸序列:(SEQ ID NO:29)  长度:292个氨基酸
  1  MLLDRSGQGK VYGLIGRRRF QQMDVLEGLN LLITISGKRN KLRVYYLSWL
 51  RNKILHNDPE VEKKQGWTTV GDMEGCGHYR VVKYERIKFL VIALKSSVEV
101  YAWAPKPYHK FMAFKSFADL PHRPLLVDLT VEEGQRLKVI YGSSAGFHAV
151  DVDSGNSYDI YIPVHIQSQI TPHAIIFLPN TDGMEMLLCY EDEGVYVNTY
201  GRIIKDVVLQ WGEMPTSVAY ICSNQIMGWG EKAIEIRSVE TGHLDGVFMH
251  KRAQRLKFLC ERNDKVFFAS VRSGGSSQVY FMTLNRNCIM NW
C:核苷酸及氨基酸组合序列(SEQ ID NO:30)
克隆号和蛋白名称:PP928
起始编码子:383 ATG        终止编码子:1261 TGA
蛋白质分子量:33572.24
  1    G TCC AGC CCA GCC ACT CAC CCA CCG AGA ACA GCA AAG GCC AAA GCC     46
 47  CAC CCT CGA AGG ATG GGA GTG GTG ACT ACC AGT CTC GTG GGC TGG TAA     94
 95  AGG CCC CTG GCA AGA GCT CGT TCA CGA TGT TTG TGG ATC TAG GGA TCT    142
143  ACC AGC CTG GAG GCA GTG GGG ACA GCA TCC CCA TCA CAG CCC TAG TGG    190
191  GTG GAG AGG GCA CTC GGC TCG ACC AGC TGC AGT ACG ACG TGA GGA AGG    238
239  GTT CTG TGG TCA ACG TGA ATC CCA CCA ACA CCC GGC CCA CAG TGA GAC    286
287  CCC TGA GAT CCG GAA GTA CAA GAA GCG ATT CAA CTC CGA GAT CCT CTG    334
335  TGC AGC CCT TTG GGG GGT CAA CCT GCT GGT GGG CAC GGA GAA CGG CTG    382
383  ATG TTG CTG GAC CGA AGT GGG CAA GGC AAG GTG TAT GGA CTC ATT GGG    430
  1  Met Leu Leu Asp Arg Ser Gly Gln Gly Lys Val Tyr Gly Leu Ile Gly     16
431  CGG CGA CGC TTC CAG CAG ATG GAT GTG CTG GAG GGG CTC AAC CTG CTC    478
 17  Arg Arg Arg Phe Gln Gln Met Asp Val Leu Glu Gly Leu Asn Leu Leu     32
479  ATC ACC ATC TCA GGG AAA AGG AAC AAA CTG CGG GTG TAT TAC CTG TCC    526
 33  Ile Thr Ile Ser Gly Lys Arg Asn Lys Leu Arg Val Tyr Tyr Leu Ser     48
527  TGG CTC CGG AAC AAG ATT CTG CAC AAT GAC CCA GAA GTG GAG AAG AAG    574
 49  Trp Leu Arg Asn Lys Ile Leu His Asn Asp Pro Glu Val Glu Lys Lys     64
575  CAG GGC TGG ACC ACC GTG GGG GAC ATG GAG GGC TGC GGG CAC TAC CGT    622
 65  Gln Gly Trp Thr Thr Val Gly Asp Met Glu Gly Cys Gly His Tyr Arg     80
 623  GTT GTG AAA TAC GAG CGG ATT AAG TTC CTG GTC ATC GCC CTC AAG AGC    670
  81  Val Val Lys Tyr Glu Arg Ile Lys Phe Leu Val Ile Ala Leu Lys Ser     96
 671  TCC GTG GAG GTG TAT GCC TGG GCC CCC AAA CCC TAC CAC AAA TTC ATG    718
  97  Ser Val Glu Val Tyr Ala Trp Ala Pro Lys Pro Tyr His Lys Phe Met    112
 719  GCC TTC AAG TCC TTT GCC GAC CTC CCC CAC CGC CCT CTG CTG GTC GAC    766
 113  Ala Phe Lys Ser Phe Ala Asp Leu Pro His Arg Pro Leu Leu Val Asp    128
 767  CTG ACA GTA GAG GAG GGG CAG CGG CTC AAG GTC ATC TAT GGC TCC AGT    814
 129  Leu Thr Val Glu Glu Gly Gln Arg Leu Lys Val Ile Tyr Gly Ser Ser    144
 815  GCT GGC TTC CAT GCT GTG GAT GTC GAC TCG GGG AAC AGC TAT GAC ATC    862
 145  Ala Gly Phe His Ala Val Asp Val Asp Ser Gly Asn Ser Tyr Asp Ile    160
 863  TAC ATC CCT GTG CAC ATC CAG AGC CAG ATC ACG CCC CAT GCC ATC ATC    910
 161  Tyr Ile Pro Val His Ile Gln Ser Gln Ile Thr Pro His Ala Ile Ile    176
 911  TTC CTC CCC AAC ACC GAC GGC ATG GAG ATG CTG CTG TGC TAC GAG GAC    958
 177  Phe Leu Pro Asn Thr Asp Gly Met Glu Met Leu Leu Cys Tyr Glu Asp    192
 959  GAG GGT GTC TAC GTC AAC ACG TAC GGG CGC ATC ATT AAG GAT GTG GTG   1006
 193  Glu Gly Val Tyr Val Asn Thr Tyr Gly Arg Ile Ile Lys Asp Val Val    208
1007  CTG CAG TGG GGG GAG ATG CCT ACT TCT GTG GCC TAC ATC TGC TCC AAC   1054
 209  Leu Gln Trp Gly Glu Met Pro Thr Ser Val Ala Tyr Ile Cys Ser Asn    224
1055  CAG ATA ATG GGC TGG GGT GAG AAA GCC ATT GAG ATC CGC TCT GTG GAG   1102
 225  Gln Ile Met Gly Trp Gly Glu Lys Ala Ile Glu Ile Arg Ser Val Glu    240
1103  ACG GGC CAC CTC GAC GGG GTC TTC ATG CAC AAA CGA GCT CAG AGG CTC   1150
 241  Thr Gly His Leu Asp Gly Val Phe Met His Lys Arg Ala Gln Arg Leu    256
1151  AAG TTC CTG TGT GAG CGG AAT GAC AAG GTG TTT TTT GCC TCA GTC CGC   1198
 257  Lys Phe Leu Cys Glu Arg Asn Asp Lys Val Phe Phe Ala Ser Val Arg    272
1199  TCT GGG GGC AGC AGC CAA GTT TAC TTC ATG ACT CTG AAC CGT AAC TGC   1246
 273  Ser Gly Gly Ser Ser Gln Val Tyr Phe Met Thr Leu Asn Arg Asn Cys    288
1247  ATC ATG AAC TGG TGA CGG GGC CCT GGG CTG GGG CTG TCC CAC ACT GGA   1294
 289  Ile Met Asn Trp ***                                                293
1295  CCC AGC TCT CCC CCT GCA GCC AGG CTT CCC GGG CCG CCC CTC TTT CCC   1342
1343  CTC CCT GGG CTT TTG CTT TTA CTG GTT TGA TTT CAC TGG AGC CTG CTG   1390
1391  GGA ACG TGA CCT CTG ACC CCT GAT GCT TTC GTG ATC ACG TGA CCA TCC   1438
1439  TCT TCC CCA ACA TGT CCT CTT CCC AAA ACT GTG CCT GTC CCC AGC TTC   1486
1487  TGG GGA GGG ACA CAG CTT TCC CTT CCC AGG AAT TGA GTG GGC CTA GCC   1534
1535  CCT CCC CCC TTT TCT CCA TTT GAG AGG AGA GTG CTT GGG GCT TGA ACC   1582
1583  CCT TAC CCC ACT CCA GGG GCA GGG ACC ATT TCT TCA TTT TCT GAA AGC   1630
1631  ACT TTA ATG ATT CCC CTT CCC CCA AAC TCC AGG GAA TGG AGG GGG GAC   1678
1679  CCC GCC AGC CAA AAC ATT CCC CCC ATT CCC GAC CCC CAT CTC CTC TTC   1726
1727  TAG CCC ATG CCC TTC CCC GGC GGA GGG AGG GAG CAG GGA GCC CTC ACT    1774
1775  CTC CAC GCC CCT TGC TTG CAT CTG TAT ATA GTG TGA GCA GCA AGT AAC    1822
1823  CCT TCT TCT CCC TTC CCC CTC ACC CCT TCT CAA TGT AGT GGC CTT GGA    1870
1871  TAT CCC TGT TTG TTA ATA AAG ACA ATT TAA CCA GCT CCC AAA AAA AAA    1918
1919  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA A      1964
11.PP1200
A:核苷酸序列:(SEQ ID NO:31)  长度:2146bp
   1  AAAAAGGCAT ACTATGATTC AAGAAAAAGT GAAGTCATTA TATCACAGCT
  51  TTTAGATTCT AAAGCTGGAG ACTTTAATGC CAGCAAAGGA TGGTGTTTTT
 101  TTTTGTTTGT TTGTTTTTTG TTTTTTTTTT TGAAATGGAG TCTTGCTCTG
 151  TCATCCAGAC TGGAGTACAG TGGCACTATC TCGGCTCACT GTAACCTCCG
 201  CCTCCTGGGT TCAAGCAATT CTCCTGCCCC AGCCTCCCAA GTAGTTGTGA
 251  TTACAGGTGT GTGCCACCAT GCCCGGCTAA TTTTTGTATT TCTTTAGTAG
 301  AGATGGGGTT TCACCACGTT GGCCAGGCTG CTCTCAAACT CCTGACCTCA
 351  GGTGATCCAC CCACCTCAGC CTCCCAAAGT GCTGGGATTA TAGAGTGGAA
 401  CCGCCACACC TGGCCGGTTT GGTAATTTTA GAAAAAGGTT TGGCTTTGAA
 451  AAAGTCAAGA TAACAGGAGA AACAGCTTCT GCCAGAAAAG AGGCAGTAGG
 501  TTCCCAAACT ACATTAAGAA AGTTCCCAAA CTATATTAAG TTGTTGGAGA
 551  AAGAGTATCT GCCTGAACAA GTTTTTAATG CAGACAAAAG TGCCCTATTC
 601  TGGAAGAAAA AGGTCACAAA GATCTAAGGA AGAAAAGTGA ATACTAGGAC
 651  TTAAGGCAGG AGGAGATCGT CTAACTTTAC TGTTTTGCGC AAATGCAGTT
 701  GGGTTTATGA TCAGAACTGC CATTACCTAT AAAGCTGCTA ACCCGAGTCT
 751  TGAAGGGAAA AAGATAAACA CCAGCTGCCA GTCTTTTGGT TGTACAACAG
 801  GAACGCTTAA ACAATATGAA CCCTTTTTCG TGATCGGTTA CATTAATGCT
 851  TTGTCCCTGA AATCAGAAAG TATCTTGCTA GTAAGGGACT GCCTTTTAAA
 901  GTTGTTGGGT TTTTTTTTTT TTTTTTTTGA GATGGAGTTT CACTCTTTTC
 951  GCCTAGGCTG GAGTGCAGTG GCGCACTCTC CACTCACTGC AACCTCCTCC
1001  TCCTGGGTTC TAGCGATTCT CCTGCCTCAG CCTCCCTAGT AGCTGGGATT
1051  ACAGGCGTAC TCCACCATGC CCAACTTAAT TTCTTTGTAT CTTTAGTAGA
1101  GACGGGGTTT CGCCCTGTTG GCCAAGCTGG TCCCAAACTC CTGATCGCAG
1151  GTGATCCGTC CACCTCAGCC TCCCAAAGTG CTGGGATTAC AGGCACGAGC
1201  CACAGCTCCT GGCCTAAAGT TGTTTTGATA TTGGACAATG CCCCTGGCCA
1251  CCCAGAACCT CATGAGTTCA GCACTGAAGG CGTCGAAGTG ATAAATGCTT
1301  GCTCCCAGAG AAGCATCTCT AATTCAGCCT CTAGGTCAGG GGTCGTAAAG
1351  ACCTTTCAGG CTCATTACAC ATGGTACTCT TTGGAAAAGA TTGTCAGTGC
1401  TATGGAAGAG AACCCCAATA GAGGGAACAT CATATCATTG AAGATACCAT
1451  TATTGTTTAG AAAAAGATGT GAAAGCTCTC AAGCCTGAAA CAACAAATTT
1501  TTGCAGGAGA AAACTCCAGA TGTTGTGTGA CTTCACAGGA TGGAAATCAT
1551  GATAGAGATT GTGGATATGG CAAGAAAGGT TGGGGGTTAA GGATTTCAAG
1601  ATAGGGATCT TGGAGATATT CAGGAGCTAA TAGACACCAA ACCAGAAGAA
1651  TTAACAGAAG ATGACTTGAT GGAGATGACT GCTTCCAAAC CACTGCCAGA
1701  CAGTGAGGAA GAAGACATAG AAAAAGAGAA AAAGCGTGCA AGAAAACAGA
1751  TTGACACTAG ACAGTCTGAC AGAAGGGGTC TGATTATTCA AGACTGCTTT
1801  TCACTTCGTT TGCAACGTGG ACCGTTTGGT GATATGAGAA CTGAAACTAA
1851  AGCAAATGGT GGAAGAAGGA TTGGTACCAT ATGGAAACAA TTTAGAGAAC
1901  AAAAAAGCAG AAAAGTCAGA AATTACATTG TATTTCCATA AAGTTACACC
1951  AAGTATGCCT GCCTCTCCAG CCTCCCCTTT TACCTTCTCC ACCTCTGCTA
2001  ACCCTGAGAC AGCAAGACCA ACCCCTCTTC TACCTATTCA ATGTAAAGAC
2051  AAGGATGAAG ACTTTTATGA TGATCGACTT TCACTTAATG AATAGTAAAT
2101  ATATTTTCTC TTCCTTGTGA TTTTCTGAAA AAAAAAAAAA AAAAAA
B:氨基酸序列:(SEQ ID NO:32)  长度:110个氨基酸
 1   MIRTAITYKA ANPSLEGKKI NTSCQSFGCT TGTLKQYEPF FVIGYINALS
 51  LKSESILLVR DCLLKLLGFF FFFFEMEFHS FRLGWSAVAH SPLTATSSSW
101  VLAILLPQPP
C.核苷酸及氨基酸组合序列(SEQ ID NO:33)
克隆号和蛋白名称:PP1200
起始编码子:707 ATG        终止编码子:1039 TAG
蛋白质分子量:12302.74
  1    A AAA AGG CAT ACT ATG ATT CAA GAA AAA GTG AAG TCA TTA TAT CAC     46
 47  AGC TTT TAG ATT CTA AAG CTG GAG ACT TTA ATG CCA GCA AAG GAT GGT     94
 95  GTT TTT TTT TGT TTG TTT GTT TTT TGT TTT TTT TTT TGA AAT GGA GTC    142
143  TTG CTC TGT CAT CCA GAC TGG AGT ACA GTG GCA CTA TCT CGG CTC ACT    190
191  GTA ACC TCC GCC TCC TGG GTT CAA GCA ATT CTC CTG CCC CAG CCT CCC    238
239  AAG TAG TTG TGA TTA CAG GTG TGT GCC ACC ATG CCC GGC TAA TTT TTG    286
287  TAT TTC TTT AGT AGA GAT GGG GTT TCA CCA CGT TGG CCA GGC TGC TCT    334
335  CAA ACT CCT GAC CTC AGG TGA TCC ACC CAC CTC AGC CTC CCA AAG TGC    382
383  TGG GAT TAT AGA GTG GAA CCG CCA CAC CTG GCC GGT TTG GTA ATT TTA    430
431  GAA AAA GGT TTG GCT TTG AAA AAG TCA AGA TAA CAG GAG AAA CAG CTT    478
479  CTG CCA GAA AAG AGG CAG TAG GTT CCC AAA CTA CAT TAA GAA AGT TCC    526
527  CAA ACT ATA TTA AGT TGT TGG AGA AAG AGT ATC TGC CTG AAC AAG TTT    574
575  TTA ATG CAG ACA AAA GTG CCC TAT TCT GGA AGA AAA AGG TCA CAA AGA    622
623  TCT AAG GAA GAA AAG TGA ATA CTA GGA CTT AAG GCA GGA GGA GAT CGT    670
671  CTA ACT TTA CTG TTT TGC GCA AAT GCA GTT GGG TTT ATG ATC AGA ACT    718
  1                                                  Met Ile Arg Thr      4
719  GCC ATT ACC TAT AAA GCT GCT AAC CCG AGT CTT GAA GGG AAA AAG ATA    766
  5  Ala Ile Thr Tyr Lys Ala Ala Asn Pro Ser Leu Glu Gly Lys Lys Ile     20
767  AAC ACC AGC TGC CAG TCT TTT GGT TGT ACA ACA GGA ACG CTT AAA CAA    814
 21  Asn Thr Ser Cys Gln Ser Phe Gly Cys Thr Thr Gly Thr Leu Lys Gln     36
815  TAT GAA CCC TTT TTC GTG ATC GGT TAC ATT AAT GCT TTG TCC CTG AAA    862
 37  Tyr Glu Pro Phe Phe Val Ile Gly Tyr Ile Asn Ala Leu Ser Leu Lys     52
863  TCA GAA AGT ATC TTG CTA GTA AGG GAC TGC CTT TTA AAG TTG TTG GGT    910
 53  Ser Glu Ser Ile Leu Leu Val Arg Asp Cys Leu Leu Lys Leu Leu Gly     68
911  TTT TTT TTT TTT TTT TTT GAG ATG GAG TTT CAC TCT TTT CGC CTA GGC    958
 69  Phe Phe Phe Phe Phe Phe Glu Met Glu Phe His Ser Phe Arg Leu Gly     84
959  TGG AGT GCA GTG GCG CAC TCT CCA CTC ACT GCA ACC TCC TCC TCC TGG   1006
 85  Trp Ser Ala Val Ala His Ser Pro Leu Thr Ala Thr Ser Ser Ser Trp    1001007  GTT CTA GCG ATT CTC CTG CCT CAG CCT CCC TAG TAG CTG GGA TTA CAG   1054
101  Val Leu Ala Ile Leu Leu Pro Gln Pro Pro ***                        111
1055  GCG TAC TCC ACC ATG CCC AAC TTA ATT TCT TTG TAT CTT TAG TAG AGA   1102
1103  CGG GGT TTC GCC CTG TTG GCC AAG CTG GTC CCA AAC TCC TGA TCG CAG   1150
1151  GTG ATC CGT CCA CCT CAG CCT CCC AAA GTG CTG GGA TTA CAG GCA CGA   1198
1199  GCC ACA GCT CCT GGC CTA AAG TTG TTT TGA TAT TGG ACA ATG CCC CTG    1246
1247  GCC ACC CAG AAC CTC ATG AGT TCA GCA CTG AAG GCG TCG AAG TGA TAA    1294
1295  ATG CTT GCT CCC AGA GAA GCA TCT CTA ATT CAG CCT CTA GGT CAG GGG    1342
1343  TCG TAA AGA CCT TTC AGG CTC ATT ACA CAT GGT ACT CTT TGG AAA AGA    1390
1391  TTG TCA GTG CTA TGG AAG AGA ACC CCA ATA GAG GGA ACA TCA TAT CAT    1438
1439  TGA AGA TAC CAT TAT TGT TTA GAA AAA GAT GTG AAA GCT CTC AAG CCT    1486
1487  GAA ACA ACA AAT TTT TGC AGG AGA AAA CTC CAG ATG TTG TGT GAC TTC    1534
1535  ACA GGA TGG AAA TCA TGA TAG AGA TTG TGG ATA TGG CAA GAA AGG TTG    1582
1583  GGG GTT AAG GAT TTC AAG ATA GGG ATC TTG GAG ATA TTC AGG AGC TAA    1630
1631  TAG ACA CCA AAC CAG AAG AAT TAA CAG AAG ATG ACT TGA TGG AGA TGA    1678
1679  CTG CTT CCA AAC CAC TGC CAG ACA GTG AGG AAG AAG ACA TAG AAA AAG    1726
1727  AGA AAA AGC GTG CAA GAA AAC AGA TTG ACA CTA GAC AGT CTG ACA GAA    1774
1775  GGG GTC TGA TTA TTC AAG ACT GCT TTT CAC TTC GTT TGC AAC GTG GAC    1822
1823  CGT TTG GTG ATA TGA GAA CTG AAA CTA AAG CAA ATG GTG GAA GAA GGA    1870
1871  TTG GTA CCA TAT GGA AAC AAT TTA GAG AAC AAA AAA GCA GAA AAG TCA    1918
1919  GAA ATT ACA TTG TAT TTC CAT AAA GTT ACA CCA AGT ATG CCT GCC TCT    1966
1967  CCA GCC TCC CCT TTT ACC TTC TCC ACC TCT GCT AAC CCT GAG ACA GCA    2014
2015  AGA CCA ACC CCT CTT CTA CCT ATT CAA TGT AAA GAC AAG GAT GAA GAC    2062
2063  TTT TAT GAT GAT CGA CTT TCA CTT AAT GAA TAG TAA ATA TAT TTT CTC    2110
2111  TTC CTT GTG ATT TTC TGA AAA AAA AAA AAA AAA AAA                    2146
12.PP1226
A:核苷酸序列:(SEQ ID NO:34)  长度:1588bp
   1  AGCTTGCAAG CATGCTCCGC TGGACCCGAG CCTGGAGGCT CCCGCGTGAG
  51  GGACTCGGCC CCCACGGCCC TAGCTTCGCG AGGGTGCCTG TCGCACCCAG
 101  CAGCAGCAGC GGCGGCCGAG GGGGCGCCGA GCCGAGGCCG CTTCCGCTTT
 151  CCTACAGGCT TCTGGACGGG GAGGCAGCCC TCCCGGCCGT CGTCTTTTTG
 201  CACGGGCTCT TCGGCAGCAA AACTAACTTC AACTCCATCG CCAAGATCTT
 251  GGCCCAGCAG ACAGGCCGTG CTGACGGTGG ATGCTCGTAA CCACGGTGAC
 301  AGCCCCCACA GCCCAGACAT GAGCTACGAG ATCATGAGCC AGGACCTGCA
 351  GGACCTTCTG CCCCAGCTGG GCCTGGTGCC CTGCGTCGTC GTTGGCCACA
 401  GCATGGGAGG AAAGACAGCC ATGCTGCTGG CACTACAGAG GGTGAGCCGC
 451  CCATGTCTGG GGCCTCCTCC CATTCAGTAT ATACCCTGAG GGCCCTGCAG
 501  GCAACCTGGG ACTCACATGA TCGTTGGATG ACCAAGTTCA GGCTCCAGGA
 551  GCCATGCCTG AGACTCCCTA TGTCTGCCTA AGACTGGTCC CAGTTCGGTT
 601  CTCTCCCACA GCCAGAGCTG GTGGAACGTC TCATTGCTGT AGATATCAGC
 651  CCAGTGGAAA GCACAGGTGT CTCCCACTTT GCAACCTATG TGGCAGCCAT
 701  GAGGGCCATC AACATCGCAG ATGAGCTGCC CCGCTCCCGT GCCCGAAAAC
 751  TGGCGGATGA ACAGCTCAGT TCTGTCATCC AGGACATGGC CGTGCGGCAG
 801  CACCTGCTCA CTAACCTGGT AGAGGTAGAC GGGCGCTTCG TGTGGAGGGT
 851  GAACTTGGAT GCCCTGACCC AGCACCTAGA CAAGATCTTG GCTTTCCCAC
 901  AGAGGCAGGA GTCCTACCTC GGGCCAACAC TCTTTCTCCT TGGTGGAAAC
 951  TCCCAGTTCG TGCATCCCAG CCACCACCCT GAGATTATGC GGCTCTTCCC
1001  TCGGGCCCAG ATGCAGACGG TGCCGAACGC TGGCCACTGG ATCCACGCTG
1051  ACCGCCCACA GGACTTCATA GCTGCCATCC GAGGCTTCCT GGTCTAAGAG
1101  TTGCTGGCAA GAAGATGGCC GGGCGTGGTG GCTCATGCCT GTAATTCCAG
1151  CACTTTGGGA GGCTAAGGCG GGAGGATGAC TTGAGGCCAG GAGTTGGAGA
1201  CCAGCCTGGC CAACATGGTG AAACCCTGTC TCTACTAAAA ATACAAAAAT
1251  TAGCCTGGCG TGGTGGTGCA CACCTGTAAT CCCAGCTACT CTGGAGGCTG
1301  AGGCAGGAGA ATCACTTGAA CCCTGGAGGC AGAGGTTGCA ATGAGCCGAG
1351  ATCACACCAC TACACTCCAG CCTAGGCAAC AGAGCAAGAC TCTGTCTCAA
1401  AAAAAACAAA ACAAAAAGGA GGCACAAAAC CCCAGGCTTC AAGTCTCTGC
1451  AGCCTGCTCC ACATTTGGGC ACAGAAGGAC TCAGACAGGC ACTGTGTGGG
1501  CACGAGGTTT TACAGGGGTG GTCAGACCTC AGGCTTTAAT GAATAAAGAC
1551  ACTACTCCCC AAAAAAAAAA AAAAAAAAAA AAAAAAAA
B:氨基酸序列:(SEQ ID NO:35)长度:132个氨基酸
  1  MRAINIADEL PRSRARKLAD EQLSSVIQDM AVRQHLLTNL VEVDGRFVWR
 51  VNLDALTQHL DKILAFPQRQ ESYLGPTLFL LGGNSQFVHP SHHPEIMRLF
101  PRAQMQTVPN AGHWIHADRP QDFIAAIRGF LV
C:核苷酸及氨基酸组合序列(SEQ ID NO:36)
克隆号和蛋白名称:PP1226
起始编码子:699 ATG        终止编码子:1097 TAA
蛋白质分子量:15123.62
  1   AG CTT GCA AGC ATG CTC CGC TGG ACC CGA GCC TGG AGG CTC CCG CGT     47
 48  GAG GGA CTC GGC CCC CAC GGC CCT AGC TTC GCG AGG GTG CCT GTC GCA     95
 96  CCC AGC AGC AGC AGC GGC GGC CGA GGG GGC GCC GAG CCG AGG CCG CTT    143
144  CCG CTT TCC TAC AGG CTT CTG GAC GGG GAG GCA GCC CTC CCG GCC GTC    191
192  GTC TTT TTG CAC GGG CTC TTC GGC AGC AAA ACT AAC TTC AAC TCC ATC    239
240  GCC AAG ATC TTG GCC CAG CAG ACA GGC CGT GCT GAC GGT GGA TGC TCG    287
288  TAA CCA CGG TGA CAG CCC CCA CAG CCC AGA CAT GAG CTA CGA GAT CAT    335
336  GAG CCA GGA CCT GCA GGA CCT TCT GCC CCA GCT GGG CCT GGT GCC CTG    383
384  CGT CGT CGT TGG CCA CAG CAT GGG AGG AAA GAC AGC CAT GCT GCT GGC    431
432  ACT ACA GAG GGT GAG CCG CCC ATG TCT GGG GCC TCC TCC CAT TCA GTA    479
480  TAT ACC CTG AGG GCC CTG CAG GCA ACC TGG GAC TCA CAT GAT CGT TGG    527
528  ATG ACC AAG TTC AGG CTC CAG GAG CCA TGC CTG AGA CTC CCT ATG TCT    575
576  GCC TAA GAC TGG TCC CAG TTC GGT TCT CTC CCA CAG CCA GAG CTG GTG    623
624  GAA CGT CTC ATT GCT GTA GAT ATC AGC CCA GTG GAA AGC ACA GGT GTC    671
672  TCC CAC TTT GCA ACC TAT GTG GCA GCC ATG AGG GCC ATC AAC ATC GCA    719
  1                                      Met Arg Ala Ile Asn Ile Ala      7
720  GAT GAG CTG CCC CGC TCC CGT GCC CGA AAA CTG GCG GAT GAA CAG CTC    767
  8  Asp Glu Leu Pro Arg Ser Arg Ala Arg Lys Leu Ala Asp Glu Gln Leu     23
768  AGT TCT GTC ATC CAG GAC ATG GCC GTG CGG CAG CAC CTG CTC ACT AAC    815
 24  Ser Ser Val Ile Gln Asp Met Ala Val Arg Gln His Leu Leu Thr Asn     39
816  CTG GTA GAG GTA GAC GGG CGC TTC GTG TGG AGG GTG AAC TTG GAT GCC    863
 40  Leu Val Glu Val Asp Gly Arg Phe Val Trp Arg Val Asn Leu Asp Ala     55
864  CTG ACC CAG CAC CTA GAC AAG ATC TTG GCT TTC CCA CAG AGG CAG GAG    911
 56  Leu Thr Gln His Leu Asp Lys Ile Leu Ala Phe Pro Gln Arg Gln Glu     71
912  TCC TAC CTC GGG CCA ACA CTC TTT CTC CTT GGT GGA AAC TCC CAG TTC    959
 72  Ser Tyr Leu Gly Pro Thr Leu Phe Leu Leu Gly Gly Asn Ser Gln Phe     87
960  GTG CAT CCC AGC CAC CAC CCT GAG ATT ATG CGG CTC TTC CCT CGG GCC   1007
 88  Val His Pro Ser His His Pro Glu Ile Met Arg Leu Phe Pro Arg Ala    103
1008  CAG ATG CAG ACG GTG CCG AAC GCT GGC CAC TGG ATC CAC GCT GAC CGC    1055
 104  Gln Met Gln Thr Val Pro Asn Ala Gly His Trp Ile His Ala Asp Arg     119
1056  CCA CAG GAC TTC ATA GCT GCC ATC CGA GGC TTC CTG GTC TAA GAG TTG    1103
 120  Pro Gln Asp Phe Ile Ala Ala Ile Arg Gly Phe Leu Val ***             133
1104  CTG GCA AGA AGA TGG CCG GGC GTG GTG GCT CAT GCC TGT AAT TCC AGC    1151
1152  ACT TTG GGA GGC TAA GGC GGG AGG ATG ACT TGA GGC CAG GAG TTG GAG    1199
1200  ACC AGC CTG GCC AAC ATG GTG AAA CCC TGT CTC TAC TAA AAA TAC AAA    1247
1248  AAT TAG CCT GGC GTG GTG GTG CAC ACC TGT AAT CCC AGC TAC TCT GGA    1295
1296  GGC TGA GGC AGG AGA ATC ACT TGA ACC CTG GAG GCA GAG GTT GCA ATG    1343
1344  AGC CGA GAT CAC ACC ACT ACA CTC CAG CCT AGG CAA CAG AGC AAG ACT    1391
1392  CTG TCT CAA AAA AAA CAA AAC AAA AAG GAG GCA CAA AAC CCC AGG CTT    1439
1440  CAA GTC TCT GCA GCC TGC TCC ACA TTT GGG CAC AGA AGG ACT CAG ACA    1487
1488  GGC ACT GTG TGG GCA CGA GGT TTT ACA GGG GTG GTC AGA CCT CAG GCT    1535
1536  TTA ATG AAT AAA GAC ACT ACT CCC CAA AAA AAA AAA AAA AAA AAA AAA    1583
1584  AAA AA                                                             1588
D:Blastp结果
Query=PP1226[基因=PP1226](132个氨基酸)
>SP_IN:O45707 O45707 caenorhabditis elegans.r05d7.4 protein.5/1999
长度=299
分值=110 bits(272),预计值=6e-24
相同性=52/121(42%),相似性=78/121(63%),缺口=3/121(2%)
Query:14  RARKLADEQLSSVIQDMAVRQHLLTNLV---EVDGRFVWRVNLDALTQHLDKILAFPQRQ  70
           R RK   + L S I D+A+RQ +LTNL    E +G+  W++N++ +  H+D+IL +
Sbjct:177 RTRKEILKDLESAIPDLAMRQFILTNLQPSSENEGQMEWKININTIDSHVDEILGYTLPV 236
Query:71  ESYLGPTLFLLGGNSQFVHPSHHPEIMRLFPRAQMQTVPNAGHWIHADRPQDFIAAIRGF 130
            S+ GPTLFL G NS +V   H P+I  LFP+ Q   +P++GHW+HA++PQ FI ++  F
Sbjct:237 GSFRGPTLFLHGANSGYVPDDHKPDIKCLFPQVQFDAIPDSGHWVHAEKPQLFINSVYKF 296
Query:131 L 131
           L
Sbjct:297 L 297
>SP_FUN:O94437 O94437 schizosaccharomyces pombe(fission yeast).
            putative abhydrolase.5/1999
长度=270
分值=61.3 bits(146),预计值=3e-09
相同性=36/118(30%),相似性=65/118(54%),缺口=6/118(5%)
Query:19  ADEQLSSVIQDMAVRQHLLTNLVEVDGR---FVWRVNLDALTQHLDKILAFPQRQES--Y  73
           AD+ +S+V +D+ VR  LL+NL +       F +RV ++ +++ L  I  FP       Y
Sbjct:152 ADKMMSTVEKDILVRSFLLSNLKKDSNNSNTFKFRVPIELISKSLKTIEGFPASLNDLVY 211
Query:74  LGPTLFLLGGNSQFVHPSHHPEIMRLFPRAQMQTVPNAGHWIHADRPQDFIAAIRGFL   131
             PTL +    + F+  S  P   + FP+ ++ ++ + GHW+H ++P++F  +I  FL
Sbjct:212 DSPTLVIRALKAPFIPDSALPVFKKFFPKYELVSL-DCGHWVHFEKPKEFSESIINFL   268
>SW:YG1L_YEAST P53219 saccharomyces cerevisiae(baker′s yeast).
            hypothetical 38.5 kd protein in erv1-gls2 intergenic
            region.11/1997
长度=342
分值=45.7 bits(106),预计值=2e-04
相同性=42/132(31%),相似性=66/132(49%),缺口=15/132(11%)
Query:14  RARKLADEQLSSVIQ-DMAVRQHLLTNL--VEVDGR-------FVWRVNLDALTQHLDK-  62
           R  K ADE L+  I  +  VR+ LLT L  V++D         F  R+ L  L   + K
Sbjct:207 RTLKQADEHLAERIGGNELVRRFLLTALKKVKMDNSSSVSSYTFEERIPLATLKDAIVKG 266
Query:63  -ILAFP--QRQESYLGPTLFLLGGNSQFVHPSHHPEIMRLFPRAQMQTVPNAGHWIHADR 119
            I A+P    +E +  P LF+    S +V   + P I   FPR + + + +AGHW++A++
Sbjct:267 EIAAWPLDPARERWTRPALFIRATQSHYVVDEYLPIIGAFFPRFETRDI-DAGHWVNAEK 325
Query:120 PQDFIAAIRGFL 131
           P +   +I  F+
Sbjct:326 PGECAESIVDFV 337
13.PP1292
A:核苷酸序列:(SEQ ID NO:37)  长度:966bp
  1  GATGTCTGGG ATGGCACGTG GCCCGACCTC CACAAGCTCC CTCATGCTTC
 51  CTGTCCCCCG CTTACACGAC AACGGGCCAG ACCACGGGAA GGACGGTGTT
101  TGTGTCTGAG GGAGCTGCTG GCCACAGTGA ACACCCACGT TTATTCCTGC
151  CTGCTCCGGC CAGGACTGAA CCCCTTCTCC ACACCTGAAC AGTTGGCTCA
201  AGGGCCACCA GAAGCATTTC TTTATTATTA TTATTTTTTA ACCTGGACAT
251  GCATTAAAGG GTCTATTAGC TTTCTTTCCG TCTGTCTCAA CAGCTGAGAT
301  GGGGCCGCCA AGGAGTGCCT TCCTTTTGCT CCCTCCTAGC TGGGAGTGAC
351  GGGTGGGAGT GTGTGTGCCC AGGTGGGGGT GTCTCCTGGC TGGGAAGGAG
401  GGAAAGGGAG GGAGAGTTTT GCGGGGGTTG GCAGTGAAGA GCAGGCTGGA
451  AAGGAGATGG CTAATAGCTG TTTAATGGAA ACCTGCTGGG CTGGAGGGAG
501  TTAGGCTGAA TTTCCCGACT TCCTCTGCCA GTTATTGACA CAGCTCTCTT
551  TGTAAGAGAG GAAAGAAACT AAACCCACCC AAGGGATGAT TTCAGGGGGA
601  GAGGTGGAGG GCAGATGTCC TGGGCAAACC GGGCCCCTTT GCCCACACAC
651  CTCACTTGAT CCTTTTGCCA AACTTGTCAA ACTCAGGGGA ACTGGCTTCC
701  CAGTTGCCCC TTTGCCATAT TCCAAGTCCC CCTCAGACTT CATGTCTCTG
751  CTCATCAGCA CTGTCCCAGG ATCCTGGAGA GGGAGAACCC CTGGCCCCAG
801  GGGAAAGAGG GGGGGGTCTC CCGTTTCCTG TGCCTGCACC AGCCCTGCCC
851  CCATTGCGTC TGCACACCCC TGCGTGTAAC TGCATTCCAA CCACTAATAA
901  AGTGCCTATT GTACAGGTCC AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
951  AAAAAAAAAA AAAAAA
B:氨基酸序列:(SEQ ID NO:38)  长度:97个氨基酸
1  MISGGEVEGR CPGQTGPLCP HTSLDPFAKL VKLRGTGFPV APLPYSKSPS
51 DFMSLLISTV PGSWRGRTPG PRGKRGGSPV SCACTSPAPI ASAHPCV
C.核苷酸及氨基酸组合序列(SEQ ID NO:39)
克隆号和蛋白名称:PP1292
起始编码子:586 ATG终止编码子:879 TAA
蛋白质分子量:9929.97
  1  GAT GTC TGG GAT GGC ACG TGG CCC GAC CTC CAC AAG CTC CCT CAT GCT     48
 49  TCC TGT CCC CCG CTT ACA CGA CAA CGG GCC AGA CCA CGG GAA GGA CGG     96
 97  TGT TTG TGT CTG AGG GAG CTG CTG GCC ACA GTG AAC ACC CAC GTT TAT    144
145  TCC TGC CTG CTC CGG CCA GGA CTG AAC CCC TTC TCC ACA CCT GAA CAG    192
193  TTG GCT CAA GGG CCA CCA GAA GCA TTT CTT TAT TAT TAT TAT TTT TTA    240
241  ACC TGG ACA TGC ATT AAA GGG TCT ATT AGC TTT CTT TCC GTC TGT CTC    288
289  AAC AGC TGA GAT GGG GCC GCC AAG GAG TGC CTT CCT TTT GCT CCC TCC    336
337  TAG CTG GGA GTG ACG GGT GGG AGT GTG TGT GCC CAG GTG GGG GTG TCT    384
385  CCT GGC TGG GAA GGA GGG AAA GGG AGG GAG AGT TTT GCG GGG GTT GGC    432
433  AGT GAA GAG CAG GCT GGA AAG GAG ATG GCT AAT AGC TGT TTA ATG GAA    480
481  ACC TGC TGG GCT GGA GGG AGT TAG GCT GAA TTT CCC GAC TTC CTC TGC    528
529  CAG TTA TTG ACA CAG CTC TCT TTG TAA GAG AGG AAA GAA ACT AAA CCC    576
577  ACC CAA GGG ATG ATT TCA GGG GGA GAG GTG GAG GGC AGA TGT CCT GGG    624
  1              Met Ile Ser Gly Gly Glu Val Glu Gly Arg Cys Pro Gly     13
625  CAA ACC GGG CCC CTT TGC CCA CAC ACC TCA CTT GAT CCT TTT GCC AAA    672
 14  Gln Thr Gly Pro Leu Cys Pro His Thr Ser Leu Asp Pro Phe Ala Lys     29
673  CTT GTC AAA CTC AGG GGA ACT GGC TTC CCA GTT GCC CCT TTG CCA TAT    720
 30  Leu Val Lys Leu Arg Gly Thr Gly Phe Pro Val Ala Pro Leu Pro Tyr     45
721  TCC AAG TCC CCC TCA GAC TTC ATG TCT CTG CTC ATC AGC ACT GTC CCA    768
 46  Ser Lys Ser Pro Ser Asp Phe Met Ser Leu Leu Ile Ser Thr Val Pro     61
769  GGA TCC TGG AGA GGG AGA ACC CCT GGC CCC AGG GGA AAG AGG GGG GGG    816
 62  Gly Ser Trp Arg Gly Arg Thr Pro Gly Pro Arg Gly Lys Arg Gly Gly     77
817  TCT CCC GTT TCC TGT GCC TGC ACC AGC CCT GCC CCC ATT GCG TCT GCA    864
 78  Ser Pro Val Ser Cys Ala Cys Thr Ser Pro Ala Pro Ile Ala Ser Ala     93
865  CAC CCC TGC GTG TAA CTG CAT TCC AAC CAC TAA TAA AGT GCC TAT TGT    912
 94  His Pro Cys Val ***                                                 98
913  ACA GGT CCA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    960
961  AAA AAA                                                            966
14.PP1396
A:核苷酸序列:(SEQ ID NO:40)长度:2070bp
 1   GGACCCCAGG CACCCTCCAG CGTCAGGTGC GGATCCCCCA GATGCCCGCC
51   CCGCCCCATC CCAGGACACC CCTGGGGTCT CCAGCTGCGT ACTGGAAACG
101  AGTGGGACAC TCTGCATGCT CAGCGTCCTG CGGGAAAGGT GTCTGGCGCC
151  CCATTTTCCT CTGCATCTCC CGTGAGTCGG GAGAGGAACT GGATGAACGC
201  AGCTGTGCCG CGGGTGCCAG GCCCCCAGCC TCCCCTGAAC CCTGCACGGC
251  ACCCCATGCC CCCCATACTG GGAGGCTGGC GAGTGGACAT CCTGCAGCCG
301  CTCCTGTGGC CCCGGCACCC AGCACCGCCA GCTGCAGTGC CGGCAGGAAT
351  TTGGGGGGGG TGGCTCCTCG GTGCCCCCGG AGCGCTGTGG ACATCTCCCC
 401  CGGCCCAACA TCACCCAGTC TTGCCAGCTG CGCCTCTGTG GCCATTGGGA
 451  AGTTGGCTCT CCTTGGAGCC AGTGCTCCGT GCGGTGCGGC CGGGGCCAGA
 501  GAAGCCGGCA GGTTCGCTGT GTTGGGAACA ACGGTGATGA AGTGAGCGAG
 551  CAGGAGTGTG CGTCAGGCCC CCCACAGCCC CCCAGCAGAG AGGCCTGTGA
 601  CATGGGGCCC TGTACTACTG CCTGGTTCCA CAGCGACTGG AGCTCCAAGT
 651  GCTCAGCCGA GTGTGGGACG GGAATCCAGC GGCGCTCTGT GGTCTGCCTT
 701  GGGAGTGGGG CAGCCCTCGG GCCAGGCCAG GGGGAAGCAG GAGCAGGAAC
 751  TGGGCAGAGC TGTCCAACAG GAAGCCGGCC CCCTGACATG CGCGCCTGCA
 801  GCCTGGGGCC CTGTGAGAGA ACTTGGCGCT GGTACACAGG GCCCTGGGGT
 851  GAGTGCTCCT CCGAATGTGG CTCTGGCACA CAGCGTAGAG ACATCATCTG
 901  TGTATCCAAA CTGGGGACGG AGTTCAACGT GACTTCTCCG AGCAACTGTT
 951  CTCACCTCCC CAGGCCCCCT GCCCTGCAGC CCTGTCAAGG GCAGGCCTGC
1001  CAGGACCGAT GGTTTTCCAC GCCCTGGAGC CCATGTTCTC GCTCCTGCCA
1051  AGGGGGAACG CAGACACGGG AGGTCCAGTG CCTGAGCACC AACCAGACCC
1101  TCAGCACCCG ATGCCCTCCT CAACTGCGGC CCTCCAGGAA GCGCCCCTGT
1151  AACAGCCAAC CCTGCAGCCA GCGCCCTGAT GATCAATGCA AGGACAGCTC
1201  TCCACATTGC CCCCTGGTGG TACAGGCCCG GCTCTGCGTC TACCCCTACT
1251  ACACAGCCAC CTGTTGCCGC TCTTGCGCAC ATGTCCTGGA GCGGTCTCCC
1301  CAGGATCCCT CCTGAAAGGG GTCCGGGGCA CCTTCACGGT TTTCTGTGCC
1351  ACCATCGGTC ACCCATTGAT CGGCCCACTC TGAACCCCCT GGCTCTCCAG
1401  CCTGTCCCAG TCTCAGCAGG GATGTCCTCC AGGTGACAGA GGGTGGCAAG
1451  GTGACTGACA CAAAGTGACT TTCAGGGCTG TGGTCAGGCC CATGTGGTGG
1501  TGTGATGGGT GTGTGCACAT ATGCCTCAGG TGTGCTTTTG GGACTGCATG
1551  GATATGTGTG TGCTCAAACG TGTATCACTT TTCAAAAAGA GGTTACACAG
1601  ACTGAGAAGG ACAAGACCTG TTTCCTTGAG ACTTTCCTAG GTGGAAAGGA
1651  AAGCAAGTCT GCAGTTCCTT GCTAATCTGA GCTACTTAGA GTGTGGTCTC
1701  CCCACCAACT CCAGTTTTGT GCCCTAAGCC TCATTTCTCA TGTTCAGACC
1751  TCACATCTTT TAAGCCGCCC TGTGTCTCTG ACCCCTTCTC ATTTGCCTAG
1801  TATCTCTGCC CCTGCCTCCC TAATTAGCTA GGGCTGGGGT CAGCCACTGC
1851  CAATCCTGCC TTACTCAGGA AGGCAGGAGG AAAGAGACTG CCTCTCCAGA
1901  GCAAGGCCCA GCTGGGCAGA GGGTGAAAAA GAGAAATGTG AGCATCCGCT
1951  CCCCCACCAC CCCGCCCAGC CCCTAGCCCC ACTCCCTGCC TCCTGAAATG
2001  GTTCCCACCC AGAACTAATT TATTTTTTAT TAAAGATGGT CATGACAAAT
2051  GAAAAAAAAA AAAAAAAAAA
B:氨基酸序列:(SEQ ID NO:41)  长度:237个氨基酸
  1  MGPCTTAWFH SDWSSKCSAE CGTGIQRRSV VCLGSGAALG PGQGEAGAGT
 51  GQSCPTGSRP PDMRACSLGP CERTWRWYTG PWGECSSECG SGTQRRDIIC
101  VSKLGTEFNV TSPSNCSHLP RPPALQPCQG QACQDRWFST PWSPCSRSCQ
151  GGTQTREVQC LSTNQTLSTR CPPQLRPSRK RPCNSQPCSQ RPDDQCKDSS
201  PHCPLVVQAR LCVYPYYTAT CCRSCAHVLE RSPQDPS
C:核苷酸及氨基酸组合序列(SEQ ID NO:42)
克隆号和蛋白名称:PP1396
起始编码子:602 ATG        终止编码子:1315 TGA
蛋白质分子量:25657.55
 1    G GAC CCC AGG CAC CCT CCA GCG TCA GGT GCG GAT CCC CCA GAT GCC     46
47  CGC CCC GCC CCA TCC CAG GAC ACC CCT GGG GTC TCC AGC TGC GTA CTG     94
95  GAA ACG AGT GGG ACA CTC TGC ATG CTC AGC GTC CTG CGG GAA AGG TGT    142
 143  CTG GCG CCC CAT TTT CCT CTG CAT CTC CCG TGA GTC GGG AGA GGA ACT    190
 191  GGA TGA ACG CAG CTG TGC CGC GGG TGC CAG GCC CCC AGC CTC CCC TGA    238
 239  ACC CTG CAC GGC ACC CCA TGC CCC CCA TAC TGG GAG GCT GGC GAG TGG    286
 287  ACA TCC TGC AGC CGC TCC TGT GGC CCC GGC ACC CAG CAC CGC CAG CTG    334
 335  CAG TGC CGG CAG GAA TTT GGG GGG GGT GGC TCC TCG GTG CCC CCG GAG    382
 383  CGC TGT GGA CAT CTC CCC CGG CCC AAC ATC ACC CAG TCT TGC CAG CTG    430
 431  CGC CTC TGT GGC CAT TGG GAA GTT GGC TCT CCT TGG AGC CAG TGC TCC    478
 479  GTG CGG TGC GGC CGG GGC CAG AGA AGC CGG CAG GTT CGC TGT GTT GGG    526
 527  AAC AAC GGT GAT GAA GTG AGC GAG CAG GAG TGT GCG TCA GGC CCC CCA    574
 575  CAG CCC CCC AGC AGA GAG GCC TGT GAC ATG GGG CCC TGT ACT ACT GCC    622
   1                                      Met Gly Pro Cys Thr Thr Ala      7
 623  TGG TTC CAC AGC GAC TGG AGC TCC AAG TGC TCA GCC GAG TGT GGG ACG    670
   8  Trp Phe His Ser Asp Trp Ser Ser Lys Cys Ser Ala Glu Cys Gly Thr     23
 671  GGA ATC CAG CGG CGC TCT GTG GTC TGC CTT GGG AGT GGG GCA GCC CTC    718
  24  Gly Ile Gln Arg Arg Ser Val Val Cys Leu Gly Ser Gly Ala Ala Leu     39
 719  GGG CCA GGC CAG GGG GAA GCA GGA GCA GGA ACT GGG CAG AGC TGT CCA    766
  40  Gly Pro Gly Gln Gly Glu Ala Gly Ala Gly Thr Gly Gln Ser Cys Pro     55
 767  ACA GGA AGC CGG CCC CCT GAC ATG CGC GCC TGC AGC CTG GGG CCC TGT    814
  56  Thr Gly Ser Arg Pro Pro Asp Met Arg Ala Cys Ser Leu Gly Pro Cys     71
 815  GAG AGA ACT TGG CGC TGG TAC ACA GGG CCC TGG GGT GAG TGC TCC TCC    862
  72  Glu Arg Thr Trp Arg Trp Tyr Thr Gly Pro Trp Gly Glu Cys Ser Ser     87
 863  GAA TGT GGC TCT GGC ACA CAG CGT AGA GAC ATC ATC TGT GTA TCC AAA    910
  88  Glu Cys Gly Ser Gly Thr Gln Arg Arg Asp Ile Ile Cys Val Ser Lys    103
 911  CTG GGG ACG GAG TTC AAC GTG ACT TCT CCG AGC AAC TGT TCT CAC CTC    958
 104  Leu Gly Thr Glu Phe Asn Val Thr Ser Pro Ser Asn Cys Ser His Leu    119
 959  CCC AGG CCC CCT GCC CTG CAG CCC TGT CAA GGG CAG GCC TGC CAG GAC   1006
 120  Pro Arg Pro Pro Ala Leu Gln Pro Cys Gln Gly Gln Ala Cys Gln Asp    135
1007  CGA TGG TTT TCC ACG CCC TGG AGC CCA TGT TCT CGC TCC TGC CAA GGG   1054
 136  Arg Trp Phe Ser Thr Pro Trp Ser Pro Cys Ser Arg Ser Cys Gln Gly    151
1055  GGA ACG CAG ACA CGG GAG GTC CAG TGC CTG AGC ACC AAC CAG ACC CTC   1102
 152  Gly Thr Gln Thr Arg Glu Val Gln Cys Leu Ser Thr Asn Gln Thr Leu    167
1103  AGC ACC CGA TGC CCT CCT CAA CTG CGG CCC TCC AGG AAG CGC CCC TGT   1150
 168  Ser Thr Arg Cys Pro Pro Gln Leu Arg Pro Ser Arg Lys Arg Pro Cys    183
1151  AAC AGC CAA CCC TGC AGC CAG CGC CCT GAT GAT CAA TGC AAG GAC AGC   1198
 184  Asn Ser Gln Pro Cys Ser Gln Arg Pro Asp Asp Gln Cys Lys Asp Ser    199
1199  TCT CCA CAT TGC CCC CTG GTG GTA CAG GCC CGG CTC TGC GTC TAC CCC   1246
 200  Ser Pro His Cys Pro Leu Val Val Gln Ala Arg Leu Cys Val Tyr Pro    215
1247  TAC TAC ACA GCC ACC TGT TGC CGC TCT TGC GCA CAT GTC CTG GAG CGG   1294
 216  Tyr Tyr Thr Ala Thr Cys Cys Arg Ser Cys Ala His Val Leu Glu Arg     231
1295  TCT CCC CAG GAT CCC TCC TGA AAG GGG TCC GGG GCA CCT TCA CGG TTT    1342
 232  Ser Pro Gln Asp Pro Ser ***                                         238
1343  TCT GTG CCA CCA TCG GTC ACC CAT TGA TCG GCC CAC TCT GAACCC CCT     1390
1391  GGC TCT CCA GCC TGT CCC AGT CTC AGC AGG GAT GTC CTC CAG GTG ACA    1438
1439  GAG GGT GGC AAG GTG ACT GAC ACA AAG TGA CTT TCA GGG CTG TGG TCA    1486
1487  GGC CCA TGT GGT GGT GTG ATG GGT GTG TGC ACA TAT GCC TCA GGT GTG    1534
1535  CTT TTG GGA CTG CAT GGA TAT GTG TGT GCT CAA ACG TGT ATC ACT TTT    1582
1583  CAA AAA GAG GTT ACA CAG ACT GAG AAG GAC AAG ACC TGT TTC CTT GAG    1630
1631  ACT TTC CTA GGT GGA AAG GAA AGC AAG TCT GCA GTT CCT TGC TAA TCT    1678
1679  GAG CTA CTT AGA GTG TGG TCT CCC CAC CAA CTC CAG TTT TGT GCC CTA    1726
1727  AGC CTC ATT TCT CAT GTT CAG ACC TCA CAT CTT TTA AGC CGC CCT GTG    1774
1775  TCT CTG ACC CCT TCT CAT TTG CCT AGT ATC TCT GCC CCT GCC TCC CTA    1822
1823  ATT AGC TAG GGC TGG GGT CAG CCA CTG CCA ATC CTG CCT TAC TCA GGA    1870
1871  AGG CAG GAG GAA AGA GAC TGC CTC TCC AGA GCA AGG CCC AGC TGG GCA    1918
1919  GAG GGT GAA AAA GAG AAA TGT GAG CAT CCG CTC CCC CAC CAC CCC GCC    1966
1967  CAG CCC CTA GCC CCA CTC CCT GCC TCC TGA AAT GGT TCC CAC CCA GAA    2014
2015  CTA ATT TAT TTT TTA TTA AAG ATG GTC ATG ACA AAT GAA AAA AAA AAA    2062
2063  AAA AAA AA                                                         2070
D:Blastp结果
Query=PP1396[基因=PP1396](237个氨基酸)
>SP_IN:Q19791 Q19791 caenorhabditis elegans.f25h8.3 protein.5/1999
             长度=2165
分值=98.7 bits(242),预计值=4e-20
相同性=58/205(28%),相似性=86/205(41%),缺口=31/205(15%)
Query:8    WFHSDWSSKCSAECGTGIQR-RSVVCLGSXXXXXXXXXXXXXXXXQSCPTGSRPPDMRAC   66
            W  ++W  +C A CGT +Q+ R+V C+ +                  C     RP  R C
Sbjct:1426 WKMAEWE-ECPATCGTHVQQSRNVTCVSAEDGGRTILKDV------DCDVQKRPTSARNC 1478
Query:67   SLGPC----ERTWRWYTGPWGECSSECGSGTQRRDIICVSKLGTEFNVTSPSNCSHLPRP  122
             L PC    E    W  G W +CS+ CG G +RR + C S           S+C    +P
Sbjct:1479 RLEPCPKGEEHIGSWIIGDWSKCSASCGGGWRRRSVSCTS-----------SSCDETRKP 1527
Query:123  PALQPCQGQAC----QDRWFSTPWSPCSRSCQGGTQTREVQC---LSTNQTLSTRCPPQL  175
                 C  + C     + W  +PW+ CS SC GG Q R++ C   LS  +     C  ++
Sbjct:1528 KMFDKCNEELCPPLTNNSWQISPWTHCSVSCGGGVQRRKIWCEDVLSGRKQDDIEC-SEI 1586
Query:176  RPSRKRPCNSQPCSQRPDDQCKDSS 200
            +P  +R C   PC     ++   +S
Sbjct:1587 KPREQRDCEMPPCRSHYHNKTSSAS 1611
分值=93.6 bits(229),预计值=2e-18
相同性=67/219(30%),相似性=88/219(39%),缺口=37/219(16%)
Query:4   CTTAWFHSDWSSKCSAECGTGIQRRSVVCLGSXXXXXXXXXXXXXXXXQSCPTGSRPPDM   63
           C+T W   D SS CSA+CG+G +R+ V C+                    C   S+P D+
Sbjct:958 CSTRWITEDVSS-CSAKCGSGQKRQRVSCV------KMEGDRQTPASEHLCDRNSKPSDI   1010
Query:64   RACSLGPCERTWRWYTGPWGECSSECGS-GTQRRDIICV---------SKLGTEFNVTSP 113
             +C +    R W +  G W  CS  CGS G   R   CV         S  G E    +
Sbjct:1011 ASCYIDCSGRKWNY--GEWTSCSETCGSNGKMHRKSYCVDDSNRRVDESLCGREQKEATE 1068
Query:114  SNCSHLPRPPALQPCQGQACQDRWFSTPWSPCSRSCQGGTQTREVQCL--STNQTLSTRC 171
              C+ +P P             RW    WS CSRSC GG + R  QCL  +  +T ++RC
Sbjct:1069 RECNRIPCP-------------RWVYGHWSECSRSCDGGVKMRHAQCLDAADRETHTSRC 1115
Query:172  PPQLRPSRKRPCNSQPCSQRPDDQCKDSSPHCPLVVQAR 210
             P      +  CN   C+        D S  C   VQ R
Sbjct:1116 GP---AQTQEHCNEHACTWWQFGVWSDCSAKCGDGVQYR 1151
15.PP1563
A:核苷酸序列:(SEQ ID NO:43)长度:1664bp
   1  TCGAGTTTTT TTTTTTTTTT TTTAATTAGA GCAGGTATGC TTTTGATGGT
  51  AGGGAAGGGA TGGAAAAAAG GAAAAGCAAT AGAAACTGTC CAATTCACAT
 101  CAGTTATCCG TCTGCTTTTT CTTGAGAGCT TGTGGAAGGT GTTAACGTGG
 151  CTGGGAACAT CAACACCTTG GCATGCATGA ATGTTAAGTC AGGAAGGCCA
 201  GCGATCACCT TGATAGCTTC TTCACTTAGG TGCTCTTCTC TTTTCGGTTT
 251  CCTACTGGTA GATGTGCTTG TCTTCTCTAC TGTAGACATG AGTCTTGCAA
 301  ATGCATCAGT CACTTTGAGG CTTGAGGTGG AGATTTCCAG CTTAGAAGTT
 351  GTTAACTCAT ACAACTCCGG ATCCACACCT GGGATTGTGG TGCTGCTGCT
 401  AGAGCTACTG TCATCCACGG GCCCAAAGAA ATCAAGGTTC AGAAGAGTGG
 451  AACCTCCACT AGCATCTAAA GGGTTAGTAA GGCCACTGCT ACTCCAGTCA
 501  AACTGGACGG GTGGTAGAGA CTCCTGGAAC TGATCAGATG TACATGTGTT
 551  CATATCTGGT GACATGGTGG CTGTCTGACC GATGGAAGCT ATTTTTTCTG
 601  CAGCAGAAAG TGGTTTCAGT GGTTCCTTGG TGGGCTCTAA CATACCCAAT
 651  CCTGCTGCAT ACATGGGCAC TATAACAGGC TGCTTCTTAT TGCCCGTGAA
 701  GAGAATGTTT CGGGTGTCTA TTCCCAAGGA GGACAAAAGC TTCTTGTTGC
 751  TATGGGAGCC GCCCCACTGG TATCTCAAGC CATGTGCATC ATGGATATCC
 801  TGTAGCTCAG TCCACACATC TAGCAATTCC CCACTTTCAG GTAAGGCCTC
 851  TCTCGTTTTT ATTGGCAAAG TGCTTGTTTC CAGCAAGTGC TTCAGGGAAG
 901  TAACTTCCTC TTCAGCATCA GGGACAAGTA TGGAAGGAAA ACATGCTTCG
 951  AAAATTCGCT CCAGGCGGTT TAATAAAGCT GTCTGAACTG AAGTGGCTGA
1001  TTCCTGTAAA TGGCCACTAG CAACTGCTCC TTTGGAAGTT GCTGAAGGTA
1051  CACTGTGCGT TTTGGGGGTT CCTGGAGTAT CAATATTTTC ATCTGTCCTA
1101  TGTGACTGCC AGGCTTCCTT TCGATGATGA GATTCAGTAG CCTGCTGGTC
1151  TCCAAAAGCA GCCCAAGAAC AACTATCTTT TTGTTCATCC TCAAAAGCAT
1201  TCCAATCTAC AACTTGGCTA GGACCAGCTG AACTGAAGTC TGCAAAATCA
1251  TCAGAGTCTT GAAAACCATT GCAGTCATCC TGAATATTTG GCACAGAATC
1301  AAAATGTCCA ATCTCACCTT CTTGCCCATT TTTAAGTTTT GCAACAGGTT
1351  CAGTGCCTGT TCCACTAGAT TTTCTTGCCA ATTGACATTC TTCTGATAAA
1401  TTATCAGAAG TCTGTTTTAG GTCTGACTTT GTTAATATTG TCTCCTCTTG
1451  GCAAGAAACA GCATTTATAT CCCCAAATTC TCCAAAGTCA TCACCTGGTT
1501  CACTAAAATG TGGAAAGTGC TCTGAAGACT CTTCAAAAGT GGCATCACTC
1551  ATTGAATCTT GAGTACCAGT AACAAAAGGT GGAGTTGAGC CACTGGCAGA
1601  GCCAAAGTCA CCAAAATCCC CCAAAAAAAA AAAAAAAAAA AAAAAAAAAA
1651  AAAAAAAAAA AAAA
B:氨基酸序列:(SEQ ID NO:44)  长度:134个氨基酸
 1   MEAIFSAAES GFSGSLVGSN IPNPAAYMGT ITGCFLLPVK RMFRVSIPKE
 51  DKSFLLLWEP PHWYLKPCAS WISCSSVHTS SNSPLSGKAS LVFIGKVLVS
101  SKCFREVTSS SASGTSMEGK HASKIRSRRF NKAV
C:核苷酸及氨基酸组合序列(SEQ ID NO:45)
克隆号和蛋白名称:PP1563
起始编码子:582 ATG        终止编码子:986 TGA
蛋白质分子量:14492.98
  1   TC GAG TTT TTT TTT TTT TTT TTT AAT TAG AGC AGG TAT GCT TTT GAT     47
 48  GGT AGG GAA GGG ATG GAA AAA AGG AAA AGC AAT AGA AAC TGT CCA ATT     95
 96  CAC ATC AGT TAT CCG TCT GCT TTT TCT TGA GAG CTT GTG GAA GGT GTT    143
144  AAC GTG GCT GGG AAC ATC AAC ACC TTG GCA TGC ATG AAT GTT AAG TCA    191
192  GGA AGG CCA GCG ATC ACC TTG ATA GCT TCT TCA CTT AGG TGC TCT TCT    239
240  CTT TTC GGT TTC CTA CTG GTA GAT GTG CTT GTC TTC TCT ACT GTA GAC    287
288  ATG AGT CTT GCA AAT GCA TCA GTC ACT TTG AGG CTT GAG GTG GAG ATT    335
336  TCC AGC TTA GAA GTT GTT AAC TCA TAC AAC TCC GGA TCC ACA CCT GGG    383
384  ATT GTG GTG CTG CTG CTA GAG CTA CTG TCA TCC ACG GGC CCA AAG AAA    431
432  TCA AGG TTC AGA AGA GTG GAA CCT CCA CTA GCA TCT AAA GGG TTA GTA    479
480  AGG CCA CTG CTA CTC CAG TCA AAC TGG ACG GGT GGT AGA GAC TCC TGG    527
528  AAC TGA TCA GAT GTA CAT GTG TTC ATA TCT GGT GAC ATG GTG GCT GTC    575
576  TGA CCG ATG GAA GCT ATT TTT TCT GCA GCA GAA AGT GGT TTC AGT GGT    623
  1          Met Glu Ala Ile Phe Ser Ala Ala Glu Ser Gly Phe Ser Gly     14
624  TCC TTG GTG GGC TCT AAC ATA CCC AAT CCT GCT GCA TAC ATG GGC ACT    671
 15  Ser Leu Val Gly Ser Asn Ile Pro Asn Pro Ala Ala Tyr Met Gly Thr     30
672  ATA ACA GGC TGC TTC TTA TTG CCC GTG AAG AGA ATG TTT CGG GTG TCT    719
 31  Ile Thr Gly Cys Phe Leu Leu Pro Val Lys Arg Met Phe Arg Val Ser     46
720  ATT CCC AAG GAG GAC AAA AGC TTC TTG TTG CTA TGG GAG CCG CCC CAC    767
 47  Ile Pro Lys Glu Asp Lys Ser Phe Leu Leu Leu Trp Glu Pro Pro His     62
768  TGG TAT CTC AAG CCA TGT GCA TCA TGG ATA TCC TGT AGC TCA GTC CAC    815
 63  Trp Tyr Leu Lys Pro Cys Ala Ser Trp Ile Ser Cys Ser Ser Val His     78
816  ACA TCT AGC AAT TCC CCA CTT TCA GGT AAG GCC TCT CTC GTTITT ATT     863
 79  Thr Ser Ser Asn Ser Pro Leu Ser Gly Lys Ala Ser Leu Val Phe Ile     94
864  GGC AAA GTG CTT GTT TCC AGC AAG TGC TTC AGG GAA GTA ACT TCC TCT    911
 95  Gly Lys Val Leu Val Ser Ser Lys Cys Phe Arg Glu Val Thr Ser Ser    110
912  TCA GCA TCA GGG ACA AGT ATG GAA GGA AAA CATGCT TCG AAA ATT CGC     959
111  Ser Ala Ser Gly Thr Ser Met Glu Gly Lys His Ala Ser Lys Ile Arg    126
960  TCC AGG CGG TTT AAT AAA GCT GTC TGA ACT GAA GTG GCT GAT TCC TGT   1007
127  Ser Arg Arg Phe Asn Lys Ala Val ***                                1351008  AAA TGG CCA CTA GCA ACT GCT CCT TTG GAA GTT GCT GAA GGT ACA CTG   10551056  TGC GTT TTG GGG GTT CCT GGA GTA TCA ATA TTT TCA TCT GTC CTA TGT   1103   1104  GAC TGC CAG GCT TCC TTT CGA TGA TGA GAT TCA GTA GCC TGC TGG TCT    11511152  CCA AAA GCA GCC CAA GAA CAA CTA TCT TTT TGT TCA TCC TCA AAA GCA    11991200  TTC CAA TCT ACA ACT TGG CTA GGA CCA GCT GAA CTG AAG TCT GCA AAA    12471248  TCA TCA GAG TCT TGA AAA CCA TTG CAG TCA TCC TGA ATA TTT GGC ACA    12951296  GAA TCA AAA TGT CCA ATC TCA CCT TCT TGC CCA TTT TTA AGT TTT GCA    13431344  ACA GGT TCA GTG CCT GTT CCA CTA GAT TTT CTT GCC AAT TGA CAT TCT    13911392  TCT GAT AAA TTA TCA GAA GTC TGT TTT AGG TCT GAC TTT GTT AAT ATT    14391440  GTC TCC TCT TGG CAA GAA ACA GCA TTT ATA TCC CCA AAT TCT CCA AAG    14871488  TCA TCA CCT GGT TCA CTA AAA TGT GGA AAG TGC TCT GAA GAC TCT TCA    15351536  AAA GTG GCA TCA CTC ATT GAA TCT TGA GTA CCA GTA ACA AAA GGT GGA    15831584  GTT GAG CCA CTG GCA GAG CCA AAG TCA CCA AAA TCC CCC AAA AAA AAA    16311632  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA                        1664
D:Blastp结果Query=PP1563[基因=PP1563](134个氨基酸)>SP_FUN:Q05164 Q05164 saccharomyces cerevisiae(baker′s yeast).
           aob567,aof1001,aoe110,aoe264 and aoe130 genes.8/1998长度=1001分值=31.3 bits(69),预计值=3.6相同性=22/61(36%),相似性=31/61(50%),缺口=1/61(1%)Query:65  LKPCASWISCSSVHTSSNSPLSGKASLVFIGKVLVSSKCFREVTSSSASGTSMEGKHASK 124
          + P  S    SS  TSS S+ SG +S+   G  + SS    E + SSASG+S   +  SSbjct:81  IAPSTSSSEVSSSITSSGSSVSGSSSITSSGSSVSSSSSATE-SGSSASGSSSATESGSS 139Query:125 I 125
          +Sbjct:140 V 140>SP_FUN:Q08294 Q08294 saccharomyces cerevisiae(baker′s yeast).
           chromosome xv reading frame orf yol155c.11/1996长度=967分值=31.3 bits(69),预计值=3.6相同性=22/61(36%),相似性=31/61(50%),缺口=1/61(1%)Query:65  LKPCASWISCSSVHTSSNSPLSGKASLVFIGKVLVSSKCFREVTSSSASGTSMEGKHASK 124
          + P  S    SS  TSS S +SG +S+   G  + SS    E + SSASG+S   +  SSbjct:81  IAPSTSSSEVSSSITSSGSSVSGSSSITSSGSSVSSSSSATE-SGSSASGSSSATESGSS 139Query:125 I 125
          +Sbjct:140 V 140>SW:YAO6_CAEEL Q20762 caenorhabditis elegans.hypothetical 167.7kd
           protein f54d1.6 in chromosome iv.7/1998长度=1462分值=30.1 bits(66),预计值=8.0相同性=14/56(25%),相似性=29/56(51%),缺口=3/56(5%)Query:63  WYLKPCASWISCSSVHTSSNSPLSGKASLVFIGKVLVSSKC---FREVTSSSASGT 115
          WY +  A W       T+S+ P   +++   IG+ +   +C   FR++T +++ G+   Sbjct:673 WYDEDGAQWNFIRDTETNSSCPCIERQAIADIGRFMPHPRCSQAFRDITCTTSIGS 72816. PP1746A:核苷酸序列:(SEQ ID NO:46)  长度:1977bp
   1  GTCCAATGCC CCCCACATCC CTGTGCACCT GGGTGCCATG CAGGAGACGG
  51  TGCAGTTCCA GATTCAGCAC CTGGGGGCCG ATCTCCACCC TGGCGACGTG
 101  CTACTGAGCA ACCATCCCAG TGCCGGGGGC AGCCACCTGC CAGACCTGAC
 151  TGTTATCACA CCGGTGAGGG GTGCTGCCCG CCTGCCTCTG CTGGGGCAGT
 201  GGTGGCCGAT GCAGCTGACC GTGGCTCTCC ACCCGCTAGG TGTTTTGGCC
 251  GGGTCAGACG CGGCCTGTGT TCTATGTGGC CAGCCGAGGG CACCACGCAG
 301  ACATCGGGGG CATCACACCA GGCTCCATGC CCCCCCACTC CACCATGCTG
 351  CAACAGGAGG GTGCCGTCTT TCTGTCCTTC AAACTTGTCC AGGGGGGCGT
 401  CTTCCAGGAG GAGGCGGTGA CGGAGGCCCT GCGGGCGCCA GGCAAGGTCC
 451  CCAACTGCAG CGGAACCAGA AACCTGCACG ACACCTGGAA GATAAACTGA
 501  AATGCACCAA AGAGGAGCAC CTCTGTACAC AAAGGATGCT GGACCAGACC
 551  CTGCTTGACC TGAATGAGAT GTAGAACGCC CCAGTCCCAC CCTGCTGCTG
 601  CTCCTCCCTC TGACCCAGAC TCCGCCTGAG GCCAGCCTGC GGGAAGCTGA
 651  CCTTTAATTG AGGGCTGATC TTTAACTGGA AGGCTGCTTT CTCCTTTCAC
 701  CACCCCCTCC TTCCCTGTGT CTTTTTCGCC AAACTGTCTC TGCCTCTTCC
 751  CGGAGAATCC AGCTGGGCTA GAGGCTGAGC ACCTTTGGAA ACAACATTTA
 801  AGGGAATGTG AGCACAATGC ATAATGTCTT TAAAAAGCAT GTTGTGATGT
 851  ACACATTTTG TAATTACCTT TTTTGTTGTT TTGTAGCAAC CATTTGTAAA
 901  ACATTCCAAA TGGTTGCTCC AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
 951  AAAAAAAAAA AAAAAAAACT CGAGGGGGGG CCCGGTACCA GGTAATCTAC
1001  TGCCTGCGCT GTCTGGTGGG CCGCGACATC CCACTCAACC AGGGCTGCCT
1051  GGCGCCAGTG CGCGTGGTCA TTCCCCGAGG CTCCATCCTG GACCCGTCGC
1101  CCGAGGCGGC GGTGGTGGGC GGCAACGTGC TCACGTCGCA GCGCGTGGTG
1151  GATGTCATCC TGGGGGCCTT TGGGGCCTGC GCCGCCTCCC AGGTGCGGGG
1201  GCGGGGTGGG CGCAGCTCGG GGGCGGACTG GGTGGGCAGG CTGGAGTAGG
1251  AGCGGGAGGG CGAGGTGGGG ACGCCCTGCC CCAGCCCAGC GCAGCGACCA
1301  GGTGCCCTCA CCAGGGCTGC ATGAACAACG TGACCCTGGG CAACGCCCAC
1351  ATGGGCTACT ACGAGACGGT GGCGGGCGGC GCGGGCGCGG GTCCCAGCTG
1401  GCACGGGCGC AGCGGTGTGC ACAGCCACAT GACCAACACA CGCATCACCG
1451  ACCCTGAGAT CCTGGAGAGC CGGTACCCGG TCATCCTGCG CCGCTTCGAG
1501  CTGCGGCGGG GCTCGGGGGG CAGAGGCCGC TTCCGAGGCG GCGACGGCGT
1551  CACCCGCGAG CTGCTCTTTC GTGAGGAGGC GCTGCTGTCA GTGCTGACCG
1601  AGCGCCGCGC CTTCCGGCCA TACGGGCTCC ACGGGGGCGA GCCTGGCGCC
1651  CGCGGCCTAA ACCTGCTGAT CCGCAAAAAC GGCCGGACGG TGAATCTGGG
1701  CGGCAAGACG TCGGTGACCG TGTACCCCGG GGATGTGTTC TGTCTCCACA
1751  CGCCCGGCGG CGGTGGCTAT GGGGACCCGG AGGACCCCGC CCCACCGCCG
1801  GGGTCGCCCC CGCAAGCACT GGCCTTTCCC GAGCACGGCA GCGTCTATGA
1851  GTATCGCCGG GCCCAGAAGG CCGTGTGAGG ATCCCGCAAT AAAAATGCCT
1901  TAAGTCTCCC GGTTCTGGGG ACGCAGCTAC GGCGCCTTAA AAAAAAAAAA
1951  AAAAAAAAAA AAAAAAAAAA AAAAAAA
B:氨基酸序列:(SEQ ID NO:47)  长度:353个氨基酸
  1  MHNVFKKHVV MYTFCNYLFC CFVATICKTF QMVAPKKKKK KKKKKKKKKK
 51  NSRGGPVPGN LLPALSGGPR HPTQPGLPGA SARGHSPRLH PGPVARGGGG
101  GRQRAHVAAR GGCHPGGLWG LRRLPGAGAG WAQLGGGLGG QAGVGAGGRG
151  GDALPQPSAA TRCPHQGCMN NVTLGNAHMG YYETVAGGAG AGPSWHGRSG
201  VHSHMTNTRI TDPEILESRY PVILRRFELR RGSGGRGRFR GGDGVTRELL
251  FREEALLSVL TERRAFRPYG LHGGEPGARG LNLLIRKNGR TVNLGGKTSV
301  TVYPGDVFCL HTPGGGGYGD PEDPAPPPGS PPQALAFPEH GSVYEYRRAQ
351  KAV
C:核苷酸及氨基酸组合序列(SEQ ID NO:48)
克隆号和蛋白名称:PP1746
起始编码子:817 ATG    终止编码子:1878 TGA
蛋白质分子量:37265.90
   1  GTC CAA TGC CCC CCA CAT CCC TGT GCA CCT GGG TGC CAT GCA GGA GAC     48
  49  GGT GCA GTT CCA GAT TCA GCA CCT GGG GGC CGA TCT CCA CCC TGG CGA     96
  97  CGT GCT ACT GAG CAA CCA TCC CAG TGC CGG GGG CAG CCA CCT GCC AGA    144
 145  CCT GAC TGT TAT CAC ACC GGT GAG GGG TGC TGC CCG CCT GCC TCT GCT    192
 193  GGG GCA GTG GTG GCC GAT GCA GCT GAC CGT GGC TCT CCA CCC GCT AGG    240
 241  TGT TTT GGC CGG GTC AGA CGC GGC CTG TGT TCT ATG TGG CCA GCC GAG    288
 289  GGC ACC ACG CAG ACA TCG GGG GCA TCA CAC CAG GCT CCA TGC CCC CCC    336
 337  ACT CCA CCA TGC TGC AAC AGG AGG GTG CCG TCT TTC TGT CCT TCA AAC    384
 385  TTG TCC AGG GGG GCG TCT TCC AGG AGG AGG CGG TGA CGG AGG CCC TGC    432
 433  GGG CGC CAG GCA AGG TCC CCA ACT GCA GCG GAA CCA GAA ACC TGC ACG    480
 481  ACA CCT GGA AGA TAA ACT GAA ATG CAC CAA AGA GGA GCA CCT CTG TAC    528
 529  ACA AAG GAT GCT GGA CCA GAC CCT GCT TGA CCT GAA TGA GAT GTA GAA    576
 577  CGC CCC AGT CCC ACC CTG CTG CTG CTC CTC CCT CTG ACC CAG ACT CCG    624
 625  CCT GAG GCC AGC CTG CGG GAA GCT GAC CTT TAA TTG AGG GCT GAT CTT    672
 673  TAA CTG GAA GGC TGC TTT CTC CTT TCA CCA CCC CCT CCT TCC CTG TGT    720
 721  CTT TTT CGC CAA ACT GTC TCT GCC TCT TCC CGG AGA ATC CAG CTG GGC    768
 769  TAG AGG CTG AGC ACC TTT GGA AAC AAC ATT TAA GGG AAT GTG AGC ACA    816
 817  ATG CAT AAT GTC TTT AAA AAG CAT GTT GTG ATG TAC ACA TTT TGT AAT    864
   1  Met His Asn Val Phe Lys Lys His Val Val Met Tyr Thr Phe Cys Asn     16
 865  TAC CTT TTT TGT TGT TTT GTA GCA ACC ATT TGT AAA ACA TTC CAA ATG    912
  17  Tyr Leu Phe Cys Cys Phe Val Ala Thr Ile Cys Lys Thr Phe Gln Met     32
 913  GTT GCT CCA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    960
  33  Val Ala Pro Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys Lys     48
 961  AAA AAA AAC TCG AGG GGG GGC CCG GTA CCA GGT AAT CTA CTG CCT GCG   1008
  49  Lys Lys Asn Ser Arg Gly Gly Pro Val Pro Gly Asn Leu Leu Pro Ala     64
1009  CTG TCT GGT GGG CCG CGA CAT CCC ACT CAA CCA GGG CTG CCT GGC GCC   1056
  65  Leu Ser Gly Gly Pro Arg His Pro Thr Gln Pro Gly Leu Pro Gly Ala     80
1057  AGT GCG CGT GGT CAT TCC CCG AGG CTC CAT CCT GGA CCC GTC GCC CGA   1104
  81  Ser Ala Arg Gly His Ser Pro Arg Leu His Pro Gly Pro Val Ala Arg     96
1105  GGC GGC GGT GGT GGG CGG CAA CGT GCT CAC GTC GCA GCG CGT GGT GGA   1152
  97  Gly Gly Gly Gly Gly Arg Gln Arg Ala His Val Ala Ala Arg Gly Gly    112
1153  TGT CAT CCT GGG GGC CTT TGG GGC CTG CGC CGC CTC CCA GGT GCG GGG   1200
 113  Cys His Pro Gly Gly Leu Trp Gly Leu Arg Arg Leu Pro Gly Ala Gly    128
1201  GCG GGG TGG GCG CAG CTC GGG GGC GGA CTG GGT GGG CAG GCT GGA GTA    1248
 129  Ala Gly Trp Ala Gln Leu Gly Gly Gly Leu Gly Gly Gln Ala Gly Val     144
1249  GGA GCG GGA GGG CGA GGT GGG GAC GCC CTG CCC CAG CCC AGC GCA GCG    1296
 145  Gly Ala Gly Gly Arg Gly Gly Asp Ala Leu Pro Gln Pro Ser Ala Ala     160
1297  ACC AGG TGC CCT CAC CAG GGC TGC ATG AAC AAC GTG ACC CTG GGC AAC    1344
 161  Thr Arg Cys Pro His Gln Gly Cys Met Asn Asn Val Thr Leu Gly Asn     176
1345  GCC CAC ATG GGC TAC TAC GAG ACG GTG GCG GGC GGC GCG GGC GCG GGT    1392
 177  Ala His Met Gly Tyr Tyr Glu Thr Val Ala Gly Gly Ala Gly Ala Gly     192
1393  CCC AGC TGG CAC GGG CGC AGC GGT GTG CAC AGC CAC ATG ACC AAC ACA    1440
 193  Pro Ser Trp His Gly Arg Ser Gly Val His Ser His Met Thr Asn Thr     208
1441  CGC ATC ACC GAC CCT GAG ATC CTG GAG AGC CGG TAC CCG GTC ATC CTG    1488
 209  Arg Ile Thr Asp Pro Glu Ile Leu Glu Ser Arg Tyr Pro Val Ile Leu     224
1489  CGC CGC TTC GAG CTG CGG CGG GGC TCG GGG GGC AGA GGC CGC TTC CGA    1536
 225  Arg Arg Phe Glu Leu Arg Arg Gly Ser Gly Gly Arg Gly Arg Phe Arg     240
1537  GGC GGC GAC GGC GTC ACC CGC GAG CTG CTC TTT CGT GAG GAG GCG CTG    1584
 241  Gly Gly Asp Gly Val Thr Arg Glu Leu Leu Phe Arg Glu Glu Ala Leu     256
1585  CTG TCA GTG CTG ACC GAG CGC CGC GCC TTC CGG CCA TAC GGG CTC CAC    1632
 257  Leu Ser Val Leu Thr Glu Arg Arg Ala Phe Arg Pro Tyr Gly Leu His     272
1633  GGG GGC GAG CCT GGC GCC CGC GGC CTA AAC CTG CTG ATC CGC AAA AAC    1680
 273  Gly Gly Glu Pro Gly Ala Arg Gly Leu Asn Leu Leu Ile Arg Lys Asn     288
1681  GGC CGG ACG GTG AAT CTG GGC GGC AAG ACG TCG GTG ACC GTG TAC CCC    1728
 289  Gly Arg Thr Val Asn Leu Gly Gly Lys Thr Ser Val Thr Val Tyr Pro     304
1729  GGG GAT GTG TTC TGT CTC CAC ACG CCC GGC GGC GGT GGC TAT GGG GAC    1776
 305  Gly Asp Val Phe Cys Leu His Thr Pro Gly Gly Gly Gly Tyr Gly Asp     320
1777  CCG GAG GAC CCC GCC CCA CCG CCG GGG TCG CCC CCG CAA GCA CTG GCC    1824
 321  Pro Glu Asp Pro Ala Pro Pro Pro Gly Ser Pro Pro Gln Ala Leu Ala     336
1825  TTT CCC GAG CAC GGC AGC GTC TAT GAG TAT CGC CGG GCC CAG AAG GCC    1872
 337  Phe Pro Glu His Gly Ser Val Tyr Glu Tyr Arg Arg Ala Gln Lys Ala     352
1873  GTG TGA GGA TCC CGC AAT AAA AAT GCC TTA AGT CTC CCG GTT CTG GGG    1920
 353  Val ***                                                             354
1921  ACG CAG CTA CGG CGC CTT AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    1968
1969  AAA AAA AAA                                                        1977
D:Blastp结果
Query=PP1746[基因=PP1746](353个氨基酸)
>SW:YAOE_SCHPO Q10093 schizosaccharomyces pombe(fission yeast).
          hypothetical 138.8 kd protein clld3.14c in chromosome i.
          12/1998
长度=1260
分值=134 bits(335),预计值=9e-31
相同性=75/157(47%),相似性=92/157(57%),缺口=10/157(6%)
Query:166  QGCMNNVTLG----NAHMGY--YETVAGGAGAGPSWHGRSGVHSHMTNTRITDPEILESR  219
            QGCMNN+T G    N   G+  YET+AGGAGAGP+W+G SGVH+HMTNTRITDPE++E R
Sbjct:1093 QGCMNNLTFGYDGENGEEGFAMYETIAGGAGAGPTWNGTSGVHTHMTNTRITDPEVVERR 1152
Query:220  YPVILXXXXXXXXXXXXXXXXXXXXVTRELLFREEALLSVLTERRAFRPYGLHGGEPGAR  279
             PVIL                    V R   FR     S+L+ERR+  PYG++GGE GA
Sbjct:1153 APVILRRFCLRENSGGKGEYHGGDGVIRHFEFRRSMHCSILSERRSRAPYGMNGGEDGAM 1212
Query:280  GLNLLIRKNG----RTVNLGGKTSVTVYPGDVFCLHT 312
            G+N  I  +     R VNLGGK  V +  GD   + T
Sbjct:1213 GVNTWIDCSNPDFPRYVNLGGKNHVLMGKGDHIVIET 1249
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims (5)

1.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列选自下组:
(a)编码具有抑癌功能的人蛋白的多核苷酸,所述蛋白具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:32、SEQ ID NO:35、SEQ ID NO:38、SEQ ID NO:41、SEQ ID NO:44、SEQ ID NO:47;
(b)与多核苷酸(a)互补的多核苷酸。
2.如权利要求1所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:32、SEQ ID NO:35、SEQ ID NO:38、SEQ ID NO:41、SEQ ID NO:44、SEQ ID NO:47。
3.如权利要求1所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48的编码区序列或全长序列。
4.一种载体,其特征在于,它含有权利要求1所述的多核苷酸。
5.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求4所述的载体转化或转导的宿主细胞;
(b)用权利要求1所述的多核苷酸转化或转导的宿主细胞。
CNB001119974A 2000-03-14 2000-03-14 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 Expired - Fee Related CN1170929C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB001119974A CN1170929C (zh) 2000-03-14 2000-03-14 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB001119974A CN1170929C (zh) 2000-03-14 2000-03-14 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸

Publications (2)

Publication Number Publication Date
CN1313318A CN1313318A (zh) 2001-09-19
CN1170929C true CN1170929C (zh) 2004-10-13

Family

ID=4581893

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB001119974A Expired - Fee Related CN1170929C (zh) 2000-03-14 2000-03-14 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸

Country Status (1)

Country Link
CN (1) CN1170929C (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001073056A2 (en) * 2000-03-27 2001-10-04 Bayer Aktiengesellschaft Regulation of human oxoprolinase-like enzyme

Also Published As

Publication number Publication date
CN1313318A (zh) 2001-09-19

Similar Documents

Publication Publication Date Title
CN1170929C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1865440A (zh) 肥厚型心肌病致病基因的新突变及其用途
CN1177864C (zh) 在肝癌组织中具有表达差异的新的人蛋白及其编码序列
CN1169954C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1177048C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1177049C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199998C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1246457C (zh) 人tsc403基因和人ing1l基因
CN1209373C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1155615C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1199997C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1177050C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199994C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1169956C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1194989C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1222616C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1194010C (zh) 具有抑制癌细胞生长功能的人蛋白及基编码序列
CN1169958C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199999C (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1230445C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1169955C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1169833C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1155616C (zh) 具有促进癌细胞生长功能的新的人蛋白及其编码序列
CN1177047C (zh) 编码具有抑癌功能的人蛋白的多核苷酸

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee