CN1329064A - 在肝癌组织中具有表达差异的新的人蛋白及其编码序列 - Google Patents

在肝癌组织中具有表达差异的新的人蛋白及其编码序列 Download PDF

Info

Publication number
CN1329064A
CN1329064A CN00116616A CN00116616A CN1329064A CN 1329064 A CN1329064 A CN 1329064A CN 00116616 A CN00116616 A CN 00116616A CN 00116616 A CN00116616 A CN 00116616A CN 1329064 A CN1329064 A CN 1329064A
Authority
CN
China
Prior art keywords
seq
polypeptide
liver cancer
sequence
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN00116616A
Other languages
English (en)
Other versions
CN1177864C (zh
Inventor
顾健人
杨胜利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Cancer Institute
Original Assignee
Shanghai Cancer Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Cancer Institute filed Critical Shanghai Cancer Institute
Priority to CNB001166166A priority Critical patent/CN1177864C/zh
Publication of CN1329064A publication Critical patent/CN1329064A/zh
Application granted granted Critical
Publication of CN1177864C publication Critical patent/CN1177864C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

本发明公开了一类新的在肝癌组织中具有表达差异的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于检测癌症如肝癌的方法。本发明还公开了抗此多肽的拮抗剂。本发明还公开了编码这类新的在肝癌组织中具有表达差异的人蛋白的多核苷酸的用途。

Description

在肝癌组织中具有表达差异的新的人蛋白及其编码序列
本发明属于生物技术领域,具体地说,本发明涉及新的编码在肝癌组织中具有表达差异的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗和检测。因此,本领域迫切需要开发研究在肝癌组织中具有表达差异的人蛋白及其激动剂/抑制剂。
本发明的目的是提供一类新的在肝癌组织中具有表达差异的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的在肝癌组织中具有表达差异的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ IDNO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ IDNO:23、SEQ ID NO:26、SEQ ID NO:29。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的在肝癌组织中具有表达差异的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ IDNO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29。更佳地,该多核苷酸的序列选自下组:SEQID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ IDNO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备在肝癌组织中具有表达差异的蛋白多肽的制备方法,该方法包括(a)在适合表达在肝癌组织中具有表达差异的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出在肝癌组织中具有表达差异的蛋白多肽。
在本发明的第五方面,提供了与上述的在肝癌组织中具有表达差异的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续的10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的针对本发明的在肝癌组织中具有表达差异的蛋白多肽的抗体以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文技术的公开,对本领域的技术人员而言是显而易见的。
本发明采用大规模cDNA克隆转染癌细胞,在获得具有表达差异的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的在肝癌组织中具有表达差异的蛋白或多肽”是指在肝癌组织中具有表达差异的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化在肝癌组织中具有表达差异的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。在肝癌组织中具有表达差异的蛋白多肽的纯度能用氨基酸序列分析。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括在肝癌组织中具有表达差异的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然在肝癌组织中具有表达差异的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP367蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。以PP1597蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ IDNO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对于其他在肝癌组织中具有表达差异的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQID NO:2所示的成熟多肽有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码在肝癌组织中具有表达差异的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码在肝癌组织中具有表达差异的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定在肝癌组织中具有表达差异的蛋白的转录本的水平:(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测在肝癌组织中具有表达差异的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或本发明蛋白的编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列可用来表达或生产重组的在肝癌组织中具有表达差异的蛋白多肽(Science,1984;224:1431)。一般来说有以下步骤:
(1).用本发明的编码在肝癌组织中具有表达差异的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,在肝癌组织中具有表达差异的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法,能用于构建含在肝癌组织中具有表达差异的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.Molecular Cloning,a LaboratoryManual,cold Spring Harbor Laboratory.New York,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的在肝癌组织中具有表达差异的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):用于肝癌的检测,和用于筛选针对在肝癌组织中具有表达差异的蛋白功能的抗体、多肽或其它配体。由于本发明的PP367,PP1597,PP1729,PP3476,PP3731,PP3856,PP3958,PP3971,PP4519,PP5241蛋白,在肝癌组织中的表达远高于其至正常肝组织中的表达,因此本发明蛋白可作为肝癌检测中待检测对象。以PP367蛋白为例,当用抗PP367的抗体检测样品时,如果发现PP367蛋白的表达量高于阴性对照(正常肝组织样品),那么就表明受检测的样品中存在癌变。
本发明还提供了一种检测肝组织样品是否发生癌变的方法,它包括步骤:(1)用抗本发明蛋白(PP367,PP1597,PP1729,PP3476,PP3731,PP3856,PP3958,PP3971,PP4519,PP5241)的抗体与待检测样品接触,以形成抗原-抗体复合物;(2)检测该抗原-抗体复合物的存在与否,该复合物的存在表示该受检测的肝组织发生了癌变。将本发明方法与其他检测肝癌的方法相结合,可以更准确地检测肝癌。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)在肝癌组织中具有表达差异的人蛋白的药剂的方法。激动剂提高在肝癌组织中具有表达差异的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达在肝癌组织中具有表达差异的人蛋白的膜制剂与标记的在肝癌组织中具有表达差异的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
在肝癌组织中具有表达差异的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。在肝癌组织中具有表达差异的人蛋白的拮抗剂可以与在肝癌组织中具有表达差异的人蛋白结合并消除其功能,或是抑制在肝癌组织中具有表达差异的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。在肝癌组织中具有表达差异的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将在肝癌组织中具有表达差异的蛋白加入生物分析测定中,通过测定化合物影响在肝癌组织中具有表达差异的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物如TNF等结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。针对本发明蛋白的拮抗剂以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的有效成分的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
在肝癌组织中具有表达差异的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于在肝癌组织中具有表达差异的蛋白的表达异常所致的细胞增殖、发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的在肝癌组织中具有表达差异的蛋白,以抑制内源性的在肝癌组织中具有表达差异的蛋白活性。例如,一种变异的在肝癌组织中具有表达差异的蛋白可以是缩短的、缺失了信号传导功能域的在肝癌组织中具有表达差异的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗在肝癌组织中具有表达差异的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将在肝癌组织中具有表达差异的蛋白基因转移至细胞内。构建携带所需蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组的本发明蛋白基因可包装到脂质体中转移至细胞内。
抑制在肝癌组织中具有表达差异的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对在肝癌组织中具有表达差异的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗在肝癌组织中具有表达差异的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的在肝癌组织中具有表达差异的人蛋白。
与在肝癌组织中具有表达差异的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与在肝癌组织中具有表达差异的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断在肝癌组织中具有表达差异的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如在肝癌组织中具有表达差异的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭在肝癌组织中具有表达差异的人蛋白阳性的细胞(如肝癌细胞)。
多克隆抗体的生产可用在肝癌组织中具有表达差异的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
在肝癌组织中具有表达差异的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler andMilstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.Pat No.4946778)也可用于生产抗在肝癌组织中具有表达差异的人蛋白的单链抗体。
能与在肝癌组织中具有表达差异的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对在肝癌组织中具有表达差异的人蛋白分子进行标记。
本发明还涉及定量和定位检测在肝癌组织中具有表达差异的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的在肝癌组织中具有表达差异的人蛋白水平,可以用作解释在肝癌组织中具有表达差异的人蛋白在各种疾病中的重要性和用于诊断诸如肝癌之类的疾病。
在肝癌组织中具有表达差异的蛋白的多聚核苷酸可用于在肝癌组织中具有表达差异的蛋白相关疾病的诊断和治疗。在诊断方面,在肝癌组织中具有表达差异的蛋白的多聚核苷酸可用于检测在肝癌组织中具有表达差异的蛋白的表达与否或在疾病状态下在肝癌组织中具有表达差异的蛋白的异常表达。如在肝癌组织中具有表达差异的蛋白DNA序列可用于对活检标本的杂交以判断在肝癌组织中具有表达差异的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用在肝癌组织中具有表达差异的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测在肝癌组织中具有表达差异的蛋白的转录产物。
检测在肝癌组织中具有表达差异的蛋白基因的突变也可用于诊断在肝癌组织中具有表达差异的蛋白相关的疾病。在肝癌组织中具有表达差异的蛋白突变的形式包括与正常野生型在肝癌组织中具有表达差异的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。现在,只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。根据本发明,为了将这些序列与疾病相关基因相关联,其重要的第一步就是将这些DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,MendelianInheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力,被精确定位至与疾病有关的染色体区域的cDNA,可以是50至500个潜在致病基因间之一种(假定1兆碱基作图分辨能力和每20kb对应于一个基因)。
本发明的在肝癌组织中具有表达差异的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的在肝癌组织中具有表达差异的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(NeW York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1:cDNA基因的获得及对癌细胞克隆形成的抑制作用
PP367,PP1597,PP1729,PP3476,PP3731,PP3856,PP3958,PP3971,PP4519,PP5241是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL10-Gold感受细胞,获得了1×106cfu/μg cDNA滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。
实施例2:原位杂交表达差异的筛选
一、杂交探针的制备
原位杂交DNA处理
DNA        10μl
10×Buf    2μl
BamH I     1μl
H2O       7μl
       →37℃2小时
      →加1 1vol酚/氯仿=1∶1
        →Vortex,离心13,000rpm×5分钟
        →取上清,加2μl 3M NaAC
                  加40μl无水乙醇
        →-20℃ O/N
        →取出离心13,000rpm×10分钟
        →取沉淀+100μl 70%酒精
        →离心13,000rpm×5分钟
        →取沉淀,加10μl DEPC,H2O溶解
        →取1μl电泳定量
★所有实验材料及试剂用0.1%DEPC H2O处理
用已酶切为线性的质粒DNA为模板,在T7RNA聚合酶的催化下,用ATP、CTP、GTP地戈辛标记的UTP体外转录,制备地戈辛标记的mRNA探针:
        →2μl线性质粒DNA
        →2μl DIG RNA标记混合物
          (10mM ATP、CTP、GTP,6.5mMUTP,3.5mM DIGUTP)
          购自Boehringer公司
        →2μl 10×转录缓冲液
        →2μl T7RNA聚合酶(购自Boehriger公司)
        →1μl RNase抑制剂(购自Boehriger公司)
        加DEPC H2O至总体积20μl
混匀,稍离心一下,37C反应2小时,取出后加2μl 0.2M EDTA终止反应,取1Bl电泳鉴定,于-70℃保存备用。二、切片制备1.清洁载玻片,硫酸洗涤液浸泡,蒸馏水洗,180℃干烤3h.;2. 2%APES(丙酮)浸泡40sec,丙酮洗10sec,过DEPC水,晾干;硅化3.新鲜组织(正常肝,肝癌及癌旁配对组织各2例),OCT包埋,液氮速冻,-70℃保存;4.冰冻组织以恒冷切片机制作6μm厚冰冻切片,附贴于硅化的载玻片,37℃干燥1~2小时后行下述操作,或-20℃密封保存,1周内使用。三、杂交前处理
 4%PFA(在DEPC-PBS pH7.4)37℃ 1h    前固定
      ↓
     PBS RT    5min×2
      ↓
     PBS(含0.3%体积比TritonX-100)37℃ 15min
      ↓
     PBS RT    5min×2
      ↓
     2μg/ml Proteinase K在TE缓冲液37℃ 10min  消化
          ↓
     0.2%Glycin在PBS中  RT  5min×2
          ↓
      4%PFA在PBS  RT  15min  后固定
          ↓
         PBS  RT  3min×2
          ↓0.1M三乙醇胺(TEA)/0.25%乙酸酐  RT 5min×2  乙酰化
          ↓
       PBS  RT  5min×2
          ↓四、预杂交
       预杂交液  50℃ 2h(预杂交液:50%甲酰胺,5×SSC,0.02%SDS,
          ↓                  5×Danhard’s,0.1mg/mltRNA)五、杂交
       杂交液  50℃ 16-18h过夜(含2μg/ml DIG标记RNA探针)
          ↓六、杂交后处理
    50%甲酰胺2×SSC 50℃  脱去盖膜    脱膜、洗片
          ↓
      2×SSC清洗  37℃ 5min×3
          ↓
20μg/ml RNase A在RNase缓冲液 37℃ 30min    RNA酶后处理
          ↓    (RNase缓冲液:0.01M Tris,lmMEDTA,0.2MNaCl,pH8.0)
         RNase缓冲液37℃  15min×2
          ↓
        2×SSC 37℃ 10min×2
          ↓
        1×SSC(含0.02%SDS)  37℃ 10min×2
          ↓
        0.1×SSC  37℃  10min×2
          ↓
  缓冲液I 37℃ 5min×2(缓冲液I:0.1MTris-HCl pH7.6,0.15MNaCl)
          ↓
  0.5%抗体阻断液,在缓冲液1中(含0.2%Tween 20)20min    封闭
          ↓
  抗-DIG-AP(用抗体阻断液稀释抗体成1∶500)2h    抗体
          ↓
        缓冲液I RT 5min×4
          ↓
   缓冲液II RT 10min(缓冲液II:0.1Mtris,0.1MNaCl,50mMMgCl2,pH9.5)
          ↓
NBT/BCIP(1∶50在缓冲液II)RT 0.5-1.5h(湿盒、避光)    显色
          ↓
       缓冲液III RT   5min×2                        终止反应:
          ↓          (缓冲液III:10mMTris-HCl pH8.0,1mMEDTA)
        蒸馏水 5min×4
          ↓
    1%甲基绿复染10~15min,                           复染
          ↓
    蒸馏水充分洗,晾干,封固                          封片
 通过上述杂交筛选,发现cDNA克隆PP367,PP1597,PP1729,PP3476,PP3731,PP3856,PP3958,PP3971,PP4519,PP5241在肝与肝癌中有表达差异,结果如下表所示:
               表1肝与肝癌表达差异克隆
ID           正常肝                      病例A                     病例B
 N  L K L K  比较-A  比较-B
367  O  A1 + B2  B1 + + B1 +  N=L<K  N=L=K
1597  A1  B2 B2  A1 B2  N<L=K  N=L<K
1729  A1  B3 B3  B2 B3  N<L=K  N<L<K
3476  O + +  A1 + + B1 + C1 + + C1 +  N<L<K  N<L=K
3731  O  A1 + + B1  B1 + B1  N<L<K  N<L=K
3856  A1 + +  B1 + + C1 + C1 + + C1 +  N<L<K  N<L=K
3958  B1 + +  C1 + + C1 + C1 + + C1 +  N<L=K  N<L=K
3971  A1 + +  B1 + + C1 + C1 + + C1 +  N<L<K  N<L=K
4519  A1 + +  B1 + + C1 + C1 + + C1 +  N<L<K  N<L=K
5241  A1 + +  A1 B2 B1 + + C2  N=L<K  N<L<K
N:肝细胞    L:癌旁肝细胞    K:癌细胞    胆:胆管细胞    内:内皮细胞    单:单核细胞梭:梭形细胞    A、B、C:信号面积大小,依次递增    1、2、3:信号强度大小,依次递增
对上述cDNA克隆采用双脱氧终止法,在AB1377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序。如仍未获得全长cDNA序列,则设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28)。
实施例3:从胎盘cDNA中PCR获得基因克隆:
取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表2所示),按97℃3′1个循环。94℃ 30″60℃ 30″72℃ 1′,35个循环,72℃ 10′1个循环进行PCR扩增,获得各个基因的扩增产物。扩增产物经测序验证,与实施例2测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,从而获得重组蛋白。
                     表2基因特异引物序列
克隆名称     特异引物1(5′→3′)     特异引物2(5′→3′)
 PP367     AGGGGGACAACAGCATGAGGACC     GGTGACAGAGCCAGCAGTCACCA
 PP1597     GCATGAGCCACTGCACTTAGCCC     GTGTCAACTCAGGGTTAAATGCC
 PP1729     CGTGGGCCTCATCTTCGTGGTCT     GGGTTCACGCCATTGCCATTCTC
 PP3476     CAAAGGAGACATCACCCGGGACC     GAGCAAGGACCCAAGCACAGCCT
 PP3731     TCTCTCCCAGACTCCAGTCGCCC     CAGAGTGCCATCAGGACAGGGGA
 PP3856     GGCCTCCTGGACACCTACAGCGT     ACTGCCCCGCACACAGACTGTTC
 PP3958     CCCGTGTGGGGGCTGTAGAGAAG     GTGCCCATCACCACACCCAGCTA
 PP3971     ACGTGGTGAAGCGGCTGTTCAAG     ACAACCACAGCCAGGAGCAGCC
 PP4519     AGCAGGAGGCAGAGCTGTGGGAT     TGTTTCTGTAACAGCGGCCACGC
 PP5241     GGCACGGGGTGGATCACTTGAG     TGAGATGCAGTTTTGCTCTTGTTGCCT
实施例3:cDNA克隆序列分析
1.PP367蛋白A:核苷酸序列(SEQ ID NO:1)长度:1883bp
   1    CTGAGACCCA  CTGGCCTCTG  GGAAGAGCAT  AGGAGAGGGG  GACAACAGCA
  51    TGAGGACCAT  ATGTTTGCCA  TCTTGCTGAA  GGAATTTCAG  CCAACATAAT
 101    AAGACATGAA  AATGGCATTC  GAGGTGTATT  AGACAGACAA  GGGGATGTTA
 151    GTGTTTGCAG  GAGACTTGGT  CTGCCTCAGT  GATGTCAGTC  AGCAGTGATT
 201    GTGATTCCCC  AGGGGACACT  CGGCAGCATC  TGGAGACATT  TTAGTTTAAA
 251    CTTCCCCAGT  GATCTGTGAT  GTACAGGAGA  CACTTTCGGT  TGTCACACTG
 301    GGGGAGGAGG  CTGCATGTCA  CTGGCATCTG  TTGGGTGACA  CCTACAATGC
 351    ACAGGACAAC  CACAACAAAT  AATTCAGGCC  CAAATGTTGC  TGGTGCTGAG
 401    GGTGAGGTCC  TAGTGTTAGT  AACAGGAGGA  AAACCCAGCA  GTCTGGAGGA
 451    GAGACCTCTT  CCCAGGGCAG  CCCAGGGGCC  ATCAGGAGGG  TTCATCTCAT
 501    GCATTAGAGG  TCTTGGGAAG  AATGAGGCTT  CCTTTCCTCC  ATCAAAGCAA
 551    GCAAATCCTT  TAAAAGCTGC  ATCTCCAAGG  GCTGCTCCGG  GCTCATAGCA
 601    AGCAACGTCG  GAGCCCAGAG  GCAAGGCTGT  GCTACTCAGC  TGCCCTCTGG
 651    GGTCACAAAG  GCTTCACTTG  GCTTCTAAGA  GCTGATGAGG  CCTCTCGCAA
 701    GGGACCCTGT  GTGCATGGGC  TGACCCTGAA  ACTTCCCAGC  CTCTCTTCTT
 751    CTCAGAGCAC  CCTCAGGTGG  CCTCTCGGGG  GTTACCCCTC  ATTGATACCA
 801    TGTCTCCTCG  TGTTTTTGTC  CAGACTCCAA  TTCCAGGGTT  TCAGAACCGC
 851    ATCGCAGCAT  CTTTCCTGAA  ATGCACTCAG  ACTCAGCCAG  CAAAGACGTG
 901    CCTGGCCGCA  TCCTGCTGGA  TATAGACAAT  GATACCGAGA  GCACTGCCCT
 951    GTGAAGAAAG  CCCTTTCCCA  GCCCTCCACC  ACTTCCACCC  TGGCGAGTGG
1001    AGCAGGGGCA  GGCGAACCTC  TTTCTTTGCA  GACCGAACAG  TGAAAAGCTT
1051    TCAGTGGAGG  ACAAAGGAGG  GCCTCACTGT  GCGGGACCTG  GCCTTCTGCA
1101    CGGCCCAAGG  AGAACCTGGA  GGCCACCACT  AAAGCTGAAT  GACCTGTGTC
1151    TTGAAGAAGT  TGGCTTTCTT  TACATGGGAA  GGAAATCATG  CCAAAAAAAT
1201    CCAAAACAAA GAAGTACCTG GAGTGGAGAG AGTATTCCTG CTGAAACGCG
1251    CATAGGAAGC TTTTGTCCCT GCTGTTAATG CGGGCAGCAC CTACAGCAAC
1301    TTGGAATGAG TAAGAAGCAG TGCGTTAACT ATCTATTTAA TAAAATGCGC
1351    TCATTATGCA AGTCGCCTAC TCTCTGCTAC CTGGACGTTC ATTCTTATGT
1401    ATTAGGAGGG AGGCTGCGCT CCTTCAGACT TGCTGCAGTG AGCTGAGATT
1451    GCACGACTGC ACTCCAGCCT GGGCAAAAGA GCAAGACCCC ATCTCAAAAA
1501    AAAAATTTTT TTTTTTAATG TTAGCTACTG TGATGAAGTC TCTTTCTGAA
1551    AACTGGTTCT GTACAGGTTG CCGTAATTCT TTCTACTTTT TGTGTGTAAA
1601    CAAAGTCATT GTTTCTTTCA GGGACTGATT CATGTAGGAA TAGAGAGGGG
1651    CTGGGGAAAC CAGATGGGGC AGGTGGGCGG CAGAGTAAGG GATTTCCTTT
1701    ATGCCCCAAA ACACATTTTT TCCCATGGAT GGTGACTGCT GGCTCTGTCA
1751    CCTCATCAAA CTGGATGTGA CCCATGCCGC CTCGTTGGAT TGTCGGAATG
1801    TAGACAGAAA TGTACTGTTC TTTTTTTTTT TTAAACAATG TAATTGCTAC
1851    TTGATAAGGA CCGAAAAAAA AAAAAAAAAA AAAB:氨基酸序列(SEQ ID NO:2)    长度:109个氨基酸
 1     MYRRHFRLSH  WGRRLHVTGI  CWVTPTMHRT  TTTNNSGPNV  AGAEGEVLVL  VTGGKPSSLE
61     ERPLPRAAQG  PSGGFISCIR  GLGKNEASFP  PSKQANPLKA  ASPRAAPGSC.核苷酸及氨基酸组合序列(SEQ ID NO:3)
克隆号:PP367
起始编码子:269 ATG    终止编码子:598 TAG
蛋白质分子量:11599
  1    C TGA GAC CCA CTG GCC TCT GGG AAG AGC ATA GGA GAG GGG GAC AAC      46
 47  AGC ATG AGG ACC ATA TGT TTG CCA TCT TGC TGA AGG AAT TTC AGC CAA      94
 95  CAT AAT AAG ACA TGA AAA TGG CAT TCG AGG TGT ATT AGA CAG ACA AGG     142
143  GGA TGT TAG TGT TTG CAG GAG ACT TGG TCT GCC TCA GTG ATG TCA GTC     190
191  AGC AGT GAT TGT GAT TCC CCA GGG GAC ACT CGG CAG CAT CTG GAG ACA     238
239  TTT TAG TTT AAA CTT CCC CAG TGA TCT GTG ATG TAC AGG AGA CAC TTT     286
  1                                          Met Tyr Arg Arg His Phe       6
287  CGG TTG TCA CAC TGG GGG AGG AGG CTG CAT GTC ACT GGC ATC TGT TGG     334
  7  Arg Leu Ser His Trp Gly Arg Arg Leu His Val Thr Gly Ile Cys Trp      22
335  GTG ACA CCT ACA ATG CAC AGG ACA ACC ACA ACA AAT AAT TCA GGC CCA     382
 23  Val Thr Pro Thr Met His Arg Thr Thr Thr Thr Asn Asn Ser Gly Pro      38
383  AAT GTT GCT GGT GCT GAG GGT GAG GTC CTA GTG TTA GTA ACA GGA GGA     430
 39  Asn Val Ala Gly Ala Glu Gly Glu Val Leu Val Leu Val Thr Gly Gly      54
431  AAA CCC AGC AGT CTG GAG GAG AGA CCT CTT CCC AGG GCA GCC CAG GGG     478
 55  Lys Pro Ser Ser Leu Glu Glu Arg Pro Leu Pro Arg Ala Ala Gln Gly      70
479  CCA TCA GGA GGG TTC ATC TCA TGC ATT AGA GGT CTT GGG AAG AAT GAG     526
 71  Pro Ser Gly Gly Phe Ile Ser Cys Ile Arg Gly Leu Gly Lys Asn Glu      86
527  GCT TCC TTT CCT CCA TCA AAG CAA GCA AAT CCT TTA AAA GCT GCA TCT     574
 87  Ala Ser Phe Pro Pro Ser Lys Gln Ala Asn Pro Leu Lys Ala Ala Ser     102
575  CCA AGG GCT GCT CCG GGC TCA TAG CAA GCA ACG TCG GAG CCC AGA GGC     622
103  Pro Arg Ala Ala Pro Gly Ser ***                                     110
 623    AAG GCT GTG CTA CTC AGC TGC CCT CTG GGG TCA CAA AGG CTT CAC TTG     670
 671    GCT TCT AAG AGC TGA TGA GGC CTC TCG CAA GGG ACC CTG TGT GCA TGG     718
 719    GCT GAC CCT GAA ACT TCC CAG CCT CTC TTC TTC TCA GAG CAC CCT CAG     766
 767    GTG GCC TCT CGG GGG TTA CCC CTC ATT GAT ACC ATG TCT CCT CGT GTT     814
 815    TTT GTC CAG ACT CCA ATT CCA GGG TTT CAG AAC CGC ATC GCA GCA TCT     862
 863    TTC CTG AAA TGC ACT CAG ACT CAG CCA GCA AAG ACG TGC CTG GCC GCA     910
 911    TCC TGC TGG ATA TAG ACA ATG ATA CCG AGA GCA CTG CCC TGT GAA GAA     958
 959    AGC CCT TTC CCA GCC CTC CAC CAC TTC CAC CCT GGC GAG TGG AGC AGG    1006
1007    GGC AGG CGA ACC TCT TTC TTT GCA GAC CGA ACA GTG AAA AGC TTT CAG    1054
1055    TGG AGG ACA AAG GAG GGC CTC ACT GTG CGG GAC CTG GCC TTC TGC ACG    1102
1103    GCC CAA GGA GAA CCT GGA GGC CAC CAC TAA AGC TGA ATG ACC TGT GTC    1150
1151    TTG AAG AAG TTG GCT TTC TTT ACA TGG GAA GGA AAT CAT GCC AAA AAA    1198
1199    ATC CAA AAC AAA GAA GTA CCT GGA GTG GAG AGA GTA TTC CTG CTG AAA    1246
1247    CGC GCA TAG GAA GCT TTT GTC CCT GCT GTT AAT GCG GGC AGC ACC TAC    1294
1295    AGC AAC TTG GAA TGA GTA AGA AGC AGT GCG TTA ACT ATC TAT TTA ATA    1342
1343    AAA TGC GCT CAT TAT GCA AGT CGC CTA CTC TCT GCT ACC TGG ACG TTC    1390
1391    ATT CTT ATG TAT TAG GAG GGA GGC TGC GCT CCT TCA GAC TTG CTG CAG    1438
1439    TGA GCT GAG ATT GCA CGA CTG CAC TCC AGC CTG GGC AAA AGA GCA AGA    1486
1487    CCC CAT CTC AAA AAA AAA ATT TTT TTT TTT AAT GTT AGC TAC TGT GAT    1534
1535    GAA GTC TCT TTC TGA AAA CTG GTT CTG TAC AGG TTG CCG TAA TTC TTT    1582
1583    CTA CTT TTT GTG TGT AAA CAA AGT CAT TGT TTC TTT CAG GGA CTG ATT    1630
1631    CAT GTA GGA ATA GAG AGG GGC TGG GGA AAC CAG ATG GGG CAG GTG GGC    1678
1679    GGC AGA GTA AGG GAT TTC CTT TAT GCC CCA AAA CAC ATT TTT TCC CAT    1726
1727    GGA TGG TGA CTG CTG GCT CTG TCA CCT CAT CAA ACT GGA TGT GAC CCA    1774
1775    TGC CGC CTC GTT GGA TTG TCG GAA TGT AGA CAG AAA TGT ACT GTT CTT    1822
1823    TTT TTT TTT TAA ACA ATG TAA TTG CTA CTT GAT AAG GAC CGA AAA AAA    1870
1871    AAA AAA AAA AAA A                                                  1883
2.PP1597蛋白A:核苷酸序列(SEQ ID NO:4)长度:1412bp
   1    TAGGGATTAC  AGGCATGAGC  CACTGCACTT  AGCCCAATAA  AGTTGATTTT
  51    TAAAAAAAAA  ACATAACAGC  TCCCTCCCCC  TCCCCCATCC  CCCTCCCCCT
 101    CCCCCTCACC  CGCTCCCTCT  TTCTTTCTTC  GGTCTCCTTC  TGTTGCCAAG
 151    GCTGGACTGT  ACTGCCGTGG  TCTCGGCTCG  CTGCAGCCTC  CCTGCCCCGG
 201    GCTCCCCTGG  TTCTCCTGCC  TTGGCCTGCC  GAGTGCCTGG  GATTGCGGGC
 251    ACGCGCCGCC  ACGCCTGACT  GGTTTTTGTA  TATTTGGAGG  AGACACGGTT
 301    TCGCCCTGTT  GACTGGGCTG  GTCTCTGGCT  CCTGACCTCG  AGTGGTCTGC
 351    CCGCCTCGGC  CTCCTGGGGT  ACTGGGATTG  CAGACGGAGC  TCGGTCACTC
 401    AGTGCTCAGT  GTTGCCCAGG  CTGGAATGCA  GTGGCGTGAT  CTCGGCTCGC
 451    TGCAACCTCC  ACCTTCCAGC  CGCCTGCCTT  GGCCTCCCAA  AGTGCTAAGA
 501    TTACAGCCTC  TGCCCGGCCG  CCCCGTCTGG  GAAGCGAGGA  GCACCTCTGC
 551    CTGGCCGCCC  CGTCTGGGAA  GCGAGGAGCC  CCTCTGCCCG  GCTGCCACCC
 601    TGTCTGGGAG  GCGAGGAGCG  CCTCTGCCCT  GCCGCCACCC  CGTCTGGGAG
 651    GTGAGGAGCG  CTTCTGCCCG  GCCACCACCC  CGTCTGGGAG  GTGAGGAGCG
 701    CCTCTGCCTG  GCCGCCACCC  TGTCTGGGAT  GTGAGGAGCA  CCTCTGCCCG
 751    GCCGCCACCC  CATCTGGGAG  GAGTGCCTCT  ACCCGGCCGC  CCCGTCTGTG
 801    AAGTGGGCGC  CTCTGCCCAG  CCACCCCGTC  TGGGAGGTGA  GGGGCGTCTC
 851    TGCCCGGCTC  CCCCGTCTGG  GAGGTGGGGA  GCACCTCTGC  CTGGCCGCCC
 901    TTCATCTGGG  AGGTGGGGGG  CGCCTCTGCC  CGGACACCCC  GTCTGGGAGG
 951    TGGGGGGCGT  TTCTGCCCGG  CTGCCCCATC  AGGGAGGTGG  GGGGCGCCTC
1001    TGCCCGGCTG  CCCATCGTTT  GGGATGTGAG  GGGCGCCTCT  GCCCAGCCAC
1051  CACCCCTTCT GGGAGGTGAG GAGCGCCTCT GCCAGGCCGC CCCGCCTGGG
1101  AAGTGTACCC AACAGCTCCG AAAAGACAGC GACCATCGAG AAAGGGCCAT
1151  GATGACGATG GCGGTTTTGT CGAAAAAAAA AGGGGGAAAT GTGGGGAAAA
1201  GAAAGAGAGA TCAGATTGTT ACTGTGTCTG TGTAGAAAGA AGTAGACATA
1251  GGAGACCCCA TTTTGTTCTG TACTAAGAAA AATTCTTCTG CCTTGGGATG
1301  CTGTTAATCT ATAACCTTAC CCCCAACCCC GTACTCTCTG AAACATGTGC
1351  TGTGTCAACT CAGGGTTAAA TGCCAAAAAA AAAAAAAAAA AAAAAAAAAA
1401  AAAAAAAAAA AAB:氨基酸序列(SEQ ID NO:5)长度:102个氨基酸
1     MQWRDLGSLQ PPPSSRLPWP PKVLRLQPLP GRPVWEARST SAWPPRLGSE EPLCPAATLS
61    GRRGAPLPCR HPVWEVRSAS ARPPPRLGGE ERLCLAATLS GMC.核苷酸及氨基酸组合序列(SEQ ID NO:6)
克隆号:PP1597
起始编码子:426 ATG    终止编码子:734 TAG
蛋白质分子量:11186
  1   TA GGG ATT ACA GGC ATG AGC CAC TGC ACT TAG CCC AAT AAA GTT GAT       47
 48   TTT TAA AAA AAA AAC ATA ACA GCT CCC TCC CCC TCC CCC ATC CCC CTC      95
 96   CCC CTC CCC CTC ACC CGC TCC CTC TTT CTT TCT TCG GTC TCC TTC TGT     143
144   TGC CAA GGC TGG ACT GTA CTG CCG TGG TCT CGG CTC GCT GCA GCC TCC     191
192   CTG CCC CGG GCT CCC CTG GTT CTC CTG CCT TGG CCT GCC GAG TGC CTG     239
240   GGA TTG CGG GCA CGC GCC GCC ACG CCT GAC TGG TTT TTG TAT ATT TGG     287
288   AGG AGA CAC GGT TTC GCC CTG TTG ACT GGG CTG GTC TCT GGC TCC TGA     335
336   CCT CGA GTG GTC TGC CCG CCT CGG CCT CCT GGG GTA CTG GGA TTG CAG     383
384   ACG GAG CTC GGT CAC TCA GTG CTC AGT GTT GCC CAG GCT GGA ATG CAG     431
  1                                                           Met Gln       2
432   TGG CGT GAT CTC GGC TCG CTG CAA CCT CCA CCT TCC AGC CGC CTG CCT     479
  3   Trp Arg Asp Leu Gly Ser Leu Gln Pro Pro Pro Ser Ser Arg Leu Pro      18
480   TGG CCT CCC AAA GTG CTA AGA TTA CAG CCT CTG CCC GGC CGC CCC GTC     527
 19   Trp Pro Pro Lys Val Leu Arg Leu Gln Pro Leu Pro Gly Arg Pro Val      34
528   TGG GAA GCG AGG AGC ACC TCT GCC TGG CCG CCC CGT CTG GGA AGC GAG     575
 35   Trp Glu Ala Arg Ser Thr Ser Ala Trp Pro Pro Arg Leu Gly Ser Glu      50
576   GAG CCC CTC TGC CCG GCT GCC ACC CTG TCT GGG AGG CGA GGA GCG CCT     623
 51   Glu Pro Leu Cys Pro Ala Ala Thr Leu Ser Gly Arg Arg Gly Ala Pro      66
624   CTG CCC TGC CGC CAC CCC GTC TGG GAG GTG AGG AGC GCT TCT GCC CGG     671
 67   Leu Pro Cys Arg His Pro Val Trp Glu Val Arg Ser Ala Ser Ala Arg      82
672   CCA CCA CCC CGT CTG GGA GGT GAG GAG CGC CTC TGC CTG GCC GCC ACC     719
 83   Pro Pro Pro Arg Leu Gly Gly Glu Glu Arg Leu Cys Leu Ala Ala Thr      98
720   CTG TCT GGG ATG TGA GGA GCA CCT CTG CCC GGC CGC CAC CCC ATC TGG     767
 99   Leu Ser Gly Met ***                                                 103
768   GAG GAG TGC CTC TAC CCG GCC GCC CCG TCT GTG AAG TGG GCG CCT CTG     815
816   CCC AGC CAC CCC GTC TGG GAG GTG AGG GGC GTC TCT GCC CGG CTC CCC     863
864   CGT CTG GGA GGT GGG GAG CAC CTC TGC CTG GCC GCC CTT CAT CTG GGA     911
 912  GGT GGG GGG CGC CTC TGC CCG GAC ACC CCG TCT GGG AGG TGG GGG GCG     959
 960  TTT CTG CCC GGC TGC CCC ATC AGG GAG GTG GGG GGC GCC TCT GCC CGG    1007
1008  CTG CCC ATC GTT TGG GAT GTG AGG GGC GCC TCT GCC CAG CCA CCA CCC    1055
1056  CTT CTG GGA GGT GAG GAG CGC CTC TGC CAG GCC GCC CCG CCT GGG AAG    1103
1104  TGT ACC CAA CAG CTC CGA AAA GAC AGC GAC CAT CGA GAA AGG GCC ATG    1151
1152  ATG ACG ATG GCG GTT TTG TCG AAA AAA AAA GGG GGA AAT GTG GGG AAA    1199
1200  AGA AAG AGA GAT CAG ATT GTT ACT GTG TCT GTG TAG AAA GAA GTA GAC    1247
1248  ATA GGA GAC CCC ATT TTG TTC TGT ACT AAG AAA AAT TCT TCT GCC TTG    1295
1296  GGA TGC TGT TAA TCT ATA ACC TTA CCC CCA ACC CCG TAC TCT CTG AAA    1343
1344  CAT GTG CTG TGT CAA CTC AGG GTT AAA TGC CAA AAA AAA AAA AAA AAA    1391
1392  AAA AAA AAA AAA AAA AAA AAA                                        1412
3.PP1729蛋白A:核苷酸序列(SEQ ID NO:7)长度:1880 bp
   1  GTCACACGGG CTGGCAGGCC GCCCTGGTGT CCACCATCAT CATGGTGCCC
  51  GTGGGCCTCA TCTTCGTGGT CTTCACCATC CACTTCTACC GCTCCCTGGT
 101  GCGCCACAAA ACGGAGCGCC ACAACCGCGA GATCGAGGAG CTCCACAAGC
 151  TCAAGGTCCA GCTGGACGGG CATGAGCGCA GCCTGCAGGT CTTGTGAGGG
 201  GCCGAGGGCC GGGGCTGGGA GCGGCCCTGT GCCCGGGAGT CCGCAGAGGC
 251  GGGGATTTGT CAGATGCAGA CATTTTGCAA GGCTGCCGGG TAGTTCAAGA
 301  CCAAAGTTTT CCTCTTGTCT TAATACCATA AGGACTGGAT GACTTCTCCT
 351  GAGATAGAAC CGTTTGGTTC AATGAGGGAC TGTGTTGCTA AGAGCGTTGG
 401  GGGCAAAGCC AGGCTGGTTC CTTGGCCTCG GGGTTTCCTG GGTCGGGGAC
 451  ACGGTGAAGA GGCTCCAGCG GGACCTGCCC ATCAGTCCTG GGCCAGGAGG
 501  GGCTCCAAGC AGCACCCAGC GGTCCGGGGG AGTCTCAGAC CCGGCATGCG
 551  TGGCTGGCAG ACCTGGGAGA GCCAGGGCAG GGTTTTGCGT TCAGAGAAGG
 601  ATTGCCCCAG AGACCCGTGG TTGACTTCAT GGGTGCTGAG TGGCCCGTGT
 651  GACAGTGATG ACACGAAGGC TTCGGCGTTT GAGTGGGTGC AGGTGCACGC
 701  CAGGGCTTGG TGCTTCCCTG CCTGGCCCTG GAGGGAAGCT GGGTGGCCTG
 751  GCTTCAGGGG AAGACAGGAG CCAGGACACA CGTCAGCCCA GCAGGTGTGG
 801  GGGGTGCTGC AGCCCTCGGC AGTGGGGTCA GGCCCTGGGG GATGTTTCCA
 851  ATGGTGGGCA GCGTGGCCAG GCCGGAGAAG AGATGTTCAC GGGCATGTAT
 901  CAGATGCCCC CTTGAGGAGG CTGAGTTATT TGAGGGCTGC TGCAAAGTAC
 951  GCTAGGCTCA AATTCTCTTT TCCCAGCCAG AGCCCTGGCC ACACGGACTC
1001  AGAGGGGCCA CCGGGGTGGG GAAAGGACCC CTCCCCGACC CCCCGCAGCC
1051  ACTGGCCTCC AGCTCTCGGC CACAGAATGG CCTCTAAGGC TGACTCAGCC
1101  GCTCCCTTGG GCTGTGGCAG CAGGAGGCGG GGGCTCTGGC TCAGGCCCCG
1161  GAGCCTGTGC AGCTTGCCCA TGGCCCTAGG CAGCGAGGGG ACAGCCTGGG
1201  GGACTTCCTG CCTAGGCAAG GTCATTGGCC GGGCCTGGCC TGTGGATAGT
1251  GGGGCCAGGG GCCGGCCCAG GCCAAATGAG TGCCCTCCTT GTTATGACAC
1301  CAAGTGACTA CAAGGGAGGC AAGACCCCTC CAGGCCTCTC AGCCGACACT
1351  GGGTCCCACC ACACACAGTG ACTGTGCCGT GCAGTGCAGG TTCTGGCCTT
1401  TTCCTTGAAG GCATCTGGTA GACCCGAAGC CACGCTCTCG GGCCGCACAT
1451  GCACGCCGCA GCACCAGCTG CCCTGAGCTG CTTGTACAAC CAAACACCTT
1501  TCCCCTCTTC TCCAGCTGTA ACCTGGAGAG TCAGCCATGC CTTGTCTTTT
1551  GTTCTCATAA ATAGTCACTG GGGCCGGGCG CAGTGACTCA CGCCTGTAAT
1601  CCCAGCACTT TGGGAGGCCT AGGTGGGCGG ATCACTTGAG GTCAGGAGTT
1651  CGAGACCAGC CTGGCCAACA TGGTGAAACC CTGTCTCTAC TAAAAAAATA
1701  CAGAAAATTA GCTGGGCGTG GTGGCGGGCG CCTGTAGCCC CAGCTACTTG
1751  GGAGGCTGAG GCGGGAGAAT GGCAATGGCG TGAACCCGGG AGGCAGAGCT
1801  TGCAGTGAGC TGAGATGGCG CCACTGCACT CCAGCCTGGG CGACAGAGCC
1851    AGACTCAATC  TCAAAAAAAA  AAAAAAAAAAB:氨基酸序列(SEQ ID NO:8)长度:322个氨基酸
 1     MTSPEIEPFG SMRDCVAKSV GGKARLVPWP RGFLGRGHGE EAPAGPAHQS WARRGSKQHP
 61     AVRGSLRPGM RGWQTWESQG RVLRSEKDCP RDPWLTSWVL SGPCDSDDTK ASAFEWVQVH
121     ARAWCFPAWP WREAGWPGFR GRQEPGHTSA QQVWGVLQPS AVGSGPGGCF QWWAAWPGRR
181     RHVHGHLSDA PLRRLSYLRA AAKYARLKFS FPSQSPGHTD SEGPPGWGKD PSPTPRSHWP
241     PALGHRMASK ADSAAPLGCG SRRRGLWLRP RSLCSLPMAL GSEGTAWGTS CLGKVIGRAW
301     PVDSGARGRP RPNECPPCYD TKC.核苷酸及氨基酸组合序列(SEQ ID NO:9)克隆号:PP1729起始编码子:339 ATG    终止编码子:1307 TGA蛋白质分子量:353471   GT CAC ACG GGC TGG CAG GCC GCC CTG GTG TCC ACC ATC ATC ATG GTG      4748  CCC GTG GGC CTC ATC TTC GTG GTC TTC ACC ATC CAC TTC TAC CGC TCC      9596  CTG GTG CGC CAC AAA ACG GAG CGC CAC AAC CGC GAG ATC GAG GAG CTC     143144  CAC AAG CTC AAG GTC CAG CTG GAC GGG CAT GAG CGC AGC CTG CAG GTC     191192  TTG TGA GGG GCC GAG GGC CGG GGC TGG GAG CGG CCC TGT GCC CGG GAG     239240  TCC GCA GAG GCG GGG ATT TGT CAG ATG CAG ACA TTT TGC AAG GCT GCC     287288  GGG TAG TTC AAG ACC AAA GTT TTC CTC TTG TCT TAA TAC CAT AAG GAC     335336  TGG ATG ACT TCT CCT GAG ATA GAA CCG TTT GGT TCA ATG AGG GAC TGT     3831      Met Thr Ser Pro Glu Ile Glu Pro Phe Gly Ser Met Arg Asp Cys      15384  GTT GCT AAG AGC GTT GGG GGC AAA GCC AGG CTG GTT CCT TGG CCT CGG     43116  Val Ala Lys Ser Val Gly Gly Lys Ala Arg Leu Val Pro Trp Pro Arg      31432  GGT TTC CTG GGT CGG GGA CAC GGT GAA GAG GCT CCA GCG GGA CCT GCC     47932  Gly Phe Leu Gly Arg Gly His Gly Glu Glu Ala Pro Ala Gly Pro Ala      47480  CAT CAG TCC TGG GCC AGG AGG GGC TCC AAG CAG CAC CCA GCG GTC CGG     52748  His Gln Ser Trp Ala Arg Arg Gly Ser Lys Gln His Pro Ala Val Arg      63528  GGG AGT CTC AGA CCC GGC ATG CGT GGC TGG CAG ACC TGG GAG AGC CAG     57564  Gly Ser Leu Arg Pro Gly Met Arg Gly Trp Gln Thr Trp Glu Ser Gln      79576  GGC AGG GTT TTG CGT TCA GAG AAG GAT TGC CCC AGA GAC CCG TGG TTG     62380  Gly Arg Val Leu Arg Ser Glu Lys Asp Cys Pro Arg Asp Pro Trp Leu      95624  ACT TCA TGG GTG CTG AGT GGC CCG TGT GAC AGT GAT GAC ACG AAG GCT     67196  Thr Ser Trp Val Leu Ser Gly Pro Cys Asp Ser Asp Asp Thr Lys Ala     111672  TCG GCG TTT GAG TGG GTG CAG GTG CAC GCC AGG GCT TGG TGC TTC CCT     719112  Ser Ala Phe Glu Trp Val Gln Val His Ala Arg Ala Trp Cys Phe Pro     127720  GCC TGG CCC TGG AGG GAA GCT GGG TGG CCT GGC TTC AGG GGA AGA CAG     767128  Ala Trp Pro Trp Arg Glu Ala Gly Trp Pro GIy Phe Arg Gly Arg Gln     143768  GAG CCA GGA CAC ACG TCA GCC CAG CAG GTG TGG GGG GTG CTG CAG CCC     815144  Glu Pro Gly His Thr Ser Ala Gln Gln Val Trp Gly Val Leu Gln Pro     159 816  TCG GCA GTG GGG TCA GGC CCT GGG GGA TGT TTC CAA TGG TGG GCA GCC     863160  Ser Ala Val Gly Ser Gly Pro Gly Gly Cys Phe Gln Trp Trp Ala Ala     175864  TGG CCA GGC CGG AGA AGA CAT GTT CAC GGG CAT CTA TCA GAT GCC CCC     911176  Trp Pro Gly Arg Arg Arg His Val His Gly His Leu Ser Asp Ala Pro     191912  TTG AGG AGG CTG AGT TAT TTG AGG GCT GCT GCA AAG TAC GCT AGG CTC     959192  Leu Arg Arg Leu Ser Tyr Leu Arg Ala Ala Ala Lys Tyr Ala Arg Leu     207960  AAA TTC TCT TTT CCC AGC CAG AGC CCT GGC CAC ACG GAC TCA GAG GGG    1007208  Lys Phe Ser Phe Pro Ser Gln Ser Pro Gly His Thr Asp Ser Glu Gly     2231008  CCA CCG GGG TGG GGA AAG GAC CCC TCC CCG ACC CCC CGC AGC CAC TGG    1055224  Pro Pro Gly Trp Gly Lys Asp Pro Ser Pro Thr Pro Arg Ser His Trp     2391056  CCT CCA GCT CTC GGC CAC AGA ATG GCC TCT AAG GCT GAC TCA GCC GCT    1103240  Pro Pro Ala Leu Gly His Arg Met Ala Ser Lys Ala Asp Ser Ala Ala     2551104  CCC TTG GGC TGT GGC AGC AGG AGG CGG GGG CTC TGG CTC AGG CCC CGG    1151256  Pro Leu Gly Cys Gly Ser Arg Arg Arg Gly Leu Trp Leu Arg Pro Arg     2711152  AGC CTG TGC AGC TTG CCC ATG GCC CTA GGC AGC GAG GGG ACA GCC TGG    1199272  Ser Leu Cys Ser Leu Pro Met Ala Leu Gly Ser Glu Gly Thr Ala Trp     2871200  GGG ACT TCC TGC CTA GGC AAG GTC ATT GGC CGG GCC TGG CCT GTG GAT    1247288  Gly Thr Ser Cys Leu Gly Lys Val Ile Gly Arg Ala Trp Pro Val Asp     3031248  AGT GGG GCC AGG GGC CGG CCC AGG CCA AAT GAG TGC CCT CCT TGT TAT    1295304  Ser Gly Ala Arg Gly Arg Pro Arg Pro Asn Glu Cys Pro Pro Cys Tyr     3191296  GAC ACC AAG TGA CTA CAA GGG AGG CAA GAC CCC TCC AGG CCT CTC AGC    1343320  Asp Thr Lys ***                                                     3231344  CGA CAC TGG GTC CCA CCA CAC ACA GTG ACT GTG CCG TGC AGT GCA GGT    13911392  TCT GGC CTT TTC CTT GAA GGC ATC TGG TAG ACC CGA AGC CAC GCT CTC    14391440  GGG CCG CAC ATG CAC GCC GCA GCA CCA GCT GCC CTG AGC TGC TTG TAC    14871488  AAC CAA ACA CCT TTC CCC TCT TCT CCA GCT GTA ACC TGG AGA GTC AGC    15351536  CAT GCC TTG TCT TTT GTT CTC ATA AAT AGT CAC TGG GGC CGG GCG CAG    15831584  TGA CTC ACG CCT GTA ATC CCA GCA CTT TGG GAG GCC TAG GTG GGC GGA    16311632  TCA CTT GAG GTC AGG AGT TCG AGA CCA GCC TGG CCA ACA TGG TGA AAC    16791680  CCT GTC TCT ACT AAA AAA ATA CAG AAA ATT AGC TGG GCG TGG TGG CGG    17271728  GCG CCT GTA GCC CCA GCT ACT TGG GAG GCT GAG GCG GGA GAA TGG CAA    17751776  TGG CGT GAA CCC GGG AGG CAG AGC TTG CAG TGA GCT GAG ATG GCG CCA    18231824  CTG CAC TCC AGC CTG GGC GAC AGA GCC AGA CTC AAT CTC AAA AAA AAA    18711872  AAA AAA AAA                                                        1880D.BlastpQuery=PPl729(322个氨基酸)>SW:HMBP_DROME P22809 drosophila melanogaster(fruit fly).homeobox
        protein bagpipe(nk-3).7/1998
        长度=382个氨基酸分值=31.7bits(70),预计值=6.9相同性=24/99(24%),相似性=37/99(37%),缺口=6/99(6%)Query:157 LQPSAVGSGPGGCFQWWAAWPGRRRHVHGHLSDAPLRRLSYLRAAAKYARLKFSFPSQ-- 214
       +QPSA    P    Q++AA      H H     +      Y++    Y     + PSbjct:84  IQPSA--RQPSNYLQYYAAAMDNNNHHHQATGTSNSSAADYMQRKLAYFGSTLAAPLDMR 141Query:215 --SPGHTDSEGPPGWGKDPSPTPRSHWPPALGHRMASKA 251
         +   +D + PP     PS +P SH    L  +  S+ASbjct:142 RCTSNDSDCDSPPPLSSSPSESPLSHDGSGLSRKKRSRA 180
4.PP3476蛋白A:核苷酸序列(SEQ ID NO:10)长度:2756bp1  TATCTTGTTT GACTGTCCAT GAAAATCTCA ACTTTATGGC CATTGGTTTC51  ACAGATGGCA GTGTTACATT GAACAAAGGA GACATCAGCC GGGACCGGCA101  TAGCAAGACC CAGATTTTGC ACAAGGGCAA CTATCCTGTA ACTGGATTGG151  CCTTTCGCCA AGCAGGAAAG ACCACTCACT TGTTTGTTGT GACAACAGAG201  AACGTCCAGT CCTATATAGT TTCTGGAAAA GACTAGGCTC GCGTGGAGTT251  GGACACCCAT GGTTGTGGCC TGCGCTGCTC AGCCCTAAGT GACCCTTCTC301  AGGACCTGCA GTTCATTGTG GCCGGGGATG AGTGTGTCTA CTTGTACCAG351  CCTGATGAAC GTGGGCCCTG CTTCCCCTTT GAGGGCCATA AGCTCATTGC401  CCACTGGTTT AGAGGCTACC TTATCATTGT CTCCCGTGAC CGGAAGGTTT451  CTCCCAAGTC AGAGTTTACC AGCAGGGATT CACAGAGCTC CGACAAGCAG501  ATTCTAAACA TCTATGACCT GTGCAACAAG TTCATAGCCT ATAGCACCGT551  CTTTGAGGAT GTAGTGGATG TGCTTGCTGA GTGGGGCTCC CTGTACGTGC601  TGACGCGGGA TGGGCGGGTC CACGCACTGC AGGAGAAGGA CACACAGACC651  AAACTGGAGA TGCTGTTTAA GAAGAACCTA TTTGAGATGG CGATTAACCT701  TGCCAAGAGC CAGCATCTGG ACAGTGATGG GCTGGCCCAG ATTTTCATGC751  AGTATGGAGA CCATCTCTAC AGCAAGGGCA ACCACGATGG GGCTGTCCAG801  CAATATATCC GAACCATTGG AAAGTTGGAG CCATCCTATG TGATCCGCAA851  GTTTCTGGAT GCCCAGCGCA TTCACAACCT GACTGCTACC TGCAGACCCT901  GCACCGACAA TCCCTGGCCA ATGCCGACCA TACCACCCTG CTCCTCAACT951  GCTATACCAA GCTCAAGGAC AGCTCGAAGC TGGAGGAGTT CATCAAGAAA1001  AAGAGTGAGA GTGAAGTCCA CTTTGATGTG GAGACAGCCA TCAAGGTCCT1051  CCGGCAGGCT GGCTACTACT CCCATGCCCT GTATCTGGCG GAGAACCATG1101  CACATCATGA GTGGTACCTG AAGATCCAGC TAGAAGACAT TAAGAATTAT1151  CAGGAAGCCC TTCGATACAT CGGCAAGCTG CCTTTTGAGC AGGCAGAGAG1201  CAACATGAAG CGCTACGGCA AGATCCTCAT GCACCACATA CCAGAGCAGA1251  CAACTCAGTT GCTGAAGGGA CTTTGTACTG ATTATCGGCC CAGCCTCGAA1301  GGCCGCAGCG ATAGGGAGGC CCCAGGCTGC AGGGCCAACT CTGAGGAGTT1351  CATCCCCATC TTTGCCAATA ACCCGCGAGA GCTGAAAGCC TTCCTAGAGC1401  ACATGAGTGA AGTGCAGCCA GACTCACCCC AGGGGATCTA CGACACACTC1451  CTTGAGCTGC GACTGCAGAA CTGGGCCCAC GAGAAGGATC CACAGGTCAA1501  AGAGAAGCTT CACGCAGAGG CCATTTCCCT GCTGAAGAGT GGTCGCTTCT1551  GCGACGTCTT TGACAAGGCC CTGGTCCTGT GCCAGATGCA CGACTTCCAG1601  GATGGTGTCC TTTACCTTTA TGAGCAGGGG AAGCTGTTCC AGCAGATCAT1651  GCACTACCAC ATGCAGCACG AGCAGTACCG GCAGGTCATC AGCGTGTGTG1701  AGCGCCATGG GGAGCAGGAC CCCTCCTTGT GGGAGCAGGC CCTCAGCTAC1751  TTCGCTCGCA AGGAGGAGGA CTGCAAGGAG TATGTGGCAG CTGTCCTCAA1801  GCATATCGAG AACAAGAACC TGATGCCACC TCTTCTAGTG GTGCAGACCC1851  TGGCCCACAA CTCCACAGCC ACACTCTCCG TCATCAGGGA CTACCTGGTC1901  CAAAAACTAC AGAAACAGAG CCAGCAGATT GCACAGGATG AGCTGCGGGT1951  GCGGCGGTAC  CGAGAGGAGA  CCACCCGTAT  CCGCCAGGAG  ATCCAAGAGC2001  TCAAGGCCAG  TCCTAAGATT  TTCCAAAAGA  CCAAGTGCAG  CATCTGTAAC2051  AGTGCCTTGG  AGTTGCCCTC  AGTCCACTTC  CTGTGTGGCC  ACTCCTTCCA2101  CCAACACTGC  TTTGAGAGTT  ACTCGGAAAG  TGATGCTGAC  TGCCCCACCT2151  GCCTCCCTGA  AAACCGGAAG  GTCATGGATA  TGATCCGGGC  CCAGGAACAG2201  AAACGAGATC  TCCATGATCA  ATTCCAGCAT  CAGCTCAAGT  GCTCCAATGA2251  CAGCTTTTCT  GTGATTGCTG  ACTACTTTGG  CAGAGGTGTT  TTCAACAAAT2301  TGACTCTGCT  GACCGACCCT  CCCACAGCCA  GACTGACCTC  AGCCTGGAGG2351  CTGGGCTGCA  ACGCGACCTA  CTCATGCACT  CCAGGAGGGG  CACTTAAGCA2401  GCCTGGAGGA  AGATGTGGGC  AACAGTGGAG  GACCAAGAGA  ACAGACACAA2451  TGGGACCTGG  GCGGGCGTTA  CACAGAAGGC  TGGCTGACAT  GCCCAGGGCT2501  CCACTCTCAT  CTAATGTCAC  AGCCCTCAGA  ACTAAAGCGG  ACTTTCTTTC2551  CCTGCCTTCT  TATTTAGTCA  GCTTGCCATC  CCTCCTCTTC  ACTAGCAGTG2601  TAGATCATTC  CAGATCAGTG  GGGGAGGGCA  CCTCAGCAAC  CTCTGAGTGT2651  GGACAATAGC  TGCTTTCTTC  TCTATCCAAG  AGCACCAGGC  TGTGCTTGGG2701  TCCTTGCTCT  CAGAGTCTAT  AAATAAAAGA  ATATAATGAA  AAAAAAAAAA2751  AAAAAAB:氨基酸序列(SEQ ID NO:11)长度:484个氨基酸1   MKRYGKILMH HIPEQTTQLL KGLCTDYRPS LEGRSDREAP GCRANSEEFI PIFANNPREL61   KAFLEHMSEV QPDSPQGIYD TLLELRLQNW AHEKDPQVKE KLHAEAISLL KSGRFCDVFD121   KALVLCQMHD FQDGVLYLYE QGKLFQQIMH YHMQHEQYRQ VISVCERHGE QDPSLWEQAL181   SYFARKEEDC KEYVAAVLKH IENKNLMPPL LVVQTLAHNS TATLSVIRDY LVQKLQKQSQ241   QIAQDELRVR RYREETTRIR QEIQELKASP KIFQKTKCSI CNSALELPSV HFLCGHSFHQ301   HCFESYSESD ADCPTCLPEN RKVMDMIRAQ EQKRDLHDQF QHQLKCSNDS FSVIADYFGR361   GVFNKLTLLT DPPTARLTSA WRLGCNATYS CTPGGALKQP GGRCGQQWRT KRTDTMGPGR421   ALHRRLADMP RAPLSSNVTA LRTKADFLSL PSYLVSLPSL LFTSSVDHSR SVGEGTSATS481   ECGQC.核苷酸及氨基酸组合序列(SBQ ID NO:12)克隆号:PP3476起始编码子:1205 ATG    终止编码子:2659 TAG蛋白质分子量:553591    T  ATC  TTG  TTT  GAC  TGT  CCA  TGA  AAA  TCT  CAA  CTT  TAT  GGC  CAT  TGG      4647  TTT  CAC  AGA  TGG  CAG  TGT  TAC  ATT  GAA  CAA  AGG  AGA  CAT  CAC  CCG  GGA      9495  CCG  GCA  TAG  CAA  GAC  CCA  GAT  TTT  GCA  CAA  GGG  CAA  CTA  TCC  TGT  AAC     142143  TGG  ATT  GGC  CTT  TCG  CCA  AGC  AGG  AAA  GAC  CAC  TCA  CTT  GTT  TGT  TGT     190191  GAC  AAC  AGA  GAA  CGT  CCA  GTC  CTA  TAT  AGT  TTC  TGG  AAA  AGA  CTA  CCC     238239  TCG  CGT  GGA  GTT  GGA  CAC  CCA  TGG  TTG  TGG  CCT  GCG  CTG  CTC  AGC  CCT     286287  AAG  TGA  CCC  TTC  TCA  GGA  CCT  GCA  GTT  CAT  TGT  GGC  CGG  GGA  TGA  GTG     334335  TGT  CTA  CTT  GTA  CCA  GCC  TGA  TGA  ACG  TGG  GCC  CTG  CTT  CGC  CTT  TGA     382383  GGG  CCA  TAA  GCT  CAT  TGC  CCA  CTG  GTT  TAG  AGG  CTA  CCT  TAT  CAT  TGT     430431  CTC  CCG  TGA  CCG  GAA  GGT  TTC  TCC  CAA  GTC  AGA  GTT  TAC  CAG  CAG  GGA     478479  TTC  ACA  GAG  CTC  CGA  CAA  GCA  GAT  TCT  AAA  CAT  CTA  TGA  CCT  GTG  CAA     526527  CAA  GTT  CAT  AGC  CTA  TAG  CAC  CGT  CTT  TGA  GGA  TGT  AGT  GGA  TGT  GCT     574575  TGC  TGA  GTG  GGG  CTC  CCT  GTA  CGT  GCT  GAC  GCG  GGA  TGG  GCG  GGT  CCA     622623  CGC  ACT  GCA  GGA  GAA  GGA  CAC  ACA  GAC  CAA  ACT  GGA  GAT  GCT  GTT  TAA     670671  GAA  GAA  CCT  ATT  TGA  GAT  GGC  GAT  TAA  CCT  TGC  CAA  GAG  CCA  GCA  TCT     718719  GGA  CAG  TGA  TGG  GCT  GGC  CCA  GAT  TTT  CAT  GCA  GTA  TGG  AGA  CCA  TCT     766 767  CTA CAG CAA GGG CAA CCA CGA TGG GGC TGT CCA GCA ATA TAT CCG AAC     814815  CAT TGG AAA GTT GGA GCC ATC CTA TGT GAT CCG CAA GTT TCT GGA TGC     862863  CCA GCG CAT TCA CAA CCT GAC TGC TAC CTG CAG ACC CTG CAC CGA CAA     910911  TCC CTG GCC AAT GCC GAC CAT ACC ACC CTG CTC CTC AAC TGC TAT ACC     958959  AAG CTC AAG GAC AGC TCG AAG CTG GAG GAG TTC ATC AAG AAA AAG AGT    10061007  GAG AGT GAA GTC CAC TTT GAT GTG GAG ACA GCC ATC AAG GTC CTC CGG    10541055  CAG GCT GGC TAC TAC TCC CAT GCC CTG TAT CTG GCG GAG AAC CAT GCA    11021103  CAT CAT GAG TGG TAC CTG AAG ATC CAG CTA GAA GAC ATT AAG A4T TAT    11501151  CAG GAA GCC CTT CGA TAC ATC GGC AAG CTG CCT TTT GAG CAG GCA GAG    11981199  AGC AAC ATG AAG CGC TAC GGC AAG ATC CTC ATG CAC CAC ATA CCA GAG    12461          Met Lys Arg Tyr Gly Lys Ile Leu Met His His Ile Pro Glu      141247  CAG ACA ACT CAG TTG CTG AAG GGA CTT TGT ACT GAT TAT CGG CCC AGC    129415  Gln Thr Thr Gln Leu Leu Lys Gly Leu Cys Thr Asp Tyr Arg Pro Ser      301295  CTC GAA GGC CGC AGC GAT AGG GAG GCC CCA GGC TGC AGG GCC AAC TCT    134231  Leu Glu Gly Arg Ser Asp Arg Glu Ala Pro Gly Cys Arg Ala Asn Ser      461343  GAG GAG TTC ATC CCC ATC TTT GCC AAT AAC CCG CGA GAG CTG AAA GCC    139047  Glu Glu Phe Ile Pro Ile Phe Ala Asn Asn Pro Arg Glu Leu Lys Ala      621391  TTC CTA GAG CAC ATG AGT GAA GTG CAG CCA GAC TCA CCC CAG GGG ATC    143863  Phe Leu Glu His Met Ser Glu Val Gln Pro Asp Ser Pro Gln Gly Ile      781439  TAC GAC ACA CTC CTT GAG CTG CGA CTG CAG AAC TGG GCC CAC GAG AAG    148679  Tyr Asp Thr Leu Leu Glu Leu Arg Leu Gln Asn Trp Ala His Glu Lys      941487  GAT CCA CAG GTC AAA GAG AAG CTT CAC GCA GAG GCC ATT TCC CTG CTG    153495  Asp Pro Gln Val Lys Glu Lys Leu His Ala Glu Ala Ile Ser Leu Leu     1101535  AAG AGT GGT CGC TTC TGC GAC GTC TTT GAC AAG GCC CTG GTC CTG TGC    1582111  Lys Ser Gly Arg Phe Cys Asp Val Phe Asp Lys Ala Leu Val Leu Cys     1261583  CAG ATG CAC GAC TTC CAG GAT GGT GTC CTT TAC CTT TAT GAG CAG GGG    1630127  Gln Met His Asp Phe Gln Asp Gly Val Leu Tyr Leu Tyr Glu Gln Gly     1421631  AAG CTG TTC CAG CAG ATC ATG CAC TAC CAC ATG CAG CAC GAG CAG TAC    1678143  Lys Leu Phe Gln Gln Ile Met His Tyr His Met Gln His Glu Gln Tyr     1581679  CGG CAG GTC ATC AGC GTG TGT GAG CGC CAT GGG GAG CAG GAC CCC TCC    1726159  Arg Gln Val Ile Ser Val Cys Glu Arg His Gly Glu Gln Asp Pro Ser     1741727  TTG TGG GAG CAG GCC CTC AGC TAC TTC GCT CGC AAG GAG GAG GAC TGC    1774175  Leu Trp Glu Gln Ala Leu Ser Tyr Phe Ala Arg Lys Glu Glu Asp Cys     1901775  AAG GAG TAT GTG GCA GCT GTC CTC AAG CAT ATC GAG AAC AAG AAC CTC    1822191  Lys Glu Tyr Val Ala Ala Val Leu Lys His Ile Glu Asn Lys Asn Leu     2061823  ATG CCA CCT CTT CTA GTG GTG CAG ACC CTG GCC CAC AAC TCC ACA GCC    1870207  Met Pro Pro Leu Leu Val Val Gln Thr Leu Ala His Asn Ser Thr Ala     2221871  ACA CTC TCC GTC ATC AGG GAC TAC CTG GTC CAA AAA CTA CAG AAA CAG    1918 223  Thr Leu Ser Val Ile Arg Asp Tyr Leu Val Gln Lys Leu Gln Lys Gln     2381919  AGC CAG CAG ATT GCA CAG GAT GAG CTG CGG GTG CGG CGG TAC CGA GAG    1966239  Ser Gln Gln Ile Ala Gln Asp Glu Leu Arg Val Arg Arg Tyr Arg Glu     2541967  GAG ACC ACC CGT ATC CGC CAG GAG ATC CAA GAG CTC AAG GCC AGT CCT    2014255  Glu Thr Thr Arg Ile Arg Gln Glu Ile Gln Glu Leu Lys Ala Ser Pro     2702015  AAG ATT TTC CAA AAG ACC AAG TGC AGC ATC TGT AAC AGT GCC TTG GAG    2062271  Lys Ile Phe Gln Lys Thr Lys Cys Ser Ile Cys Asn Ser Ala Leu Glu     2862063  TTG CCC TCA GTC CAC TTC CTG TGT GGC CAC TCC TTC CAC CAA CAC TGC    2110287  Leu Pro Ser Val His Phe Leu Cys Gly His Ser Phe His Gln His Cys     3022111  TTT GAG AGT TAC TCG GAA AGT GAT GCT GAC TGC CCC ACC TGC CTC CCT    2158303  Phe Glu Ser Tyr Ser Glu Ser Asp Ala Asp Cys Pro Thr Cys Leu Pro     3182159  GAA AAC CGG AAG GTC ATG GAT ATG ATC CGG GCC CAG GAA CAG AAA CGA    2206319  Glu Asn Arg Lys Val Met Asp Met Ile Arg Ala Gln Glu Gln Lys Arg     3342207  GAT CTC CAT GAT CAA TTC CAG CAT CAG CTC AAG TGC TCC AAT GAC AGC    2254335  Asp Leu His Asp Gln Phe Gln His Gln Leu Lys Cys Ser Asn Asp Ser     3502255  TTT TCT GTG ATT GCT GAC TAC TTT GGC AGA GGT GTT TTC AAC AAA TTG    2302351  Phe Ser Val Ile Ala Asp Tyr Phe Gly Arg Gly Val Phe Asn Lys Leu     3662303  ACT CTG CTG ACC GAC CCT CCC ACA GCC AGA CTG ACC TCA GCC TGG AGG    2350367  Thr Leu Leu Thr Asp Pro Pro Thr Ala Arg Leu Thr Ser Ala Trp Arg     3822351  CTG GGC TGC AAC GCG ACC TAC TCA TGC ACT CCA GGA GGG GCA CTT AAG    2398383  Leu Gly Cys Asn Ala Thr Tyr Ser Cys Thr Pro Gly Gly Ala Leu Lys     3982399  CAG CCT GGA GGA AGA TGT GGG CAA CAG TGG AGG ACC AAG AGA ACA GAC    2446399  Gln Pro Gly Gly Arg Cys Gly Gln Gln Trp Arg Thr Lys Arg Thr Asp     4142447  ACA ATG GGA CCT GGG CGG GCG TTA CAC AGA AGG CTG GCT GAC ATG CCC    2494415  Thr Met Gly Pro Gly Arg Ala Leu His Arg Arg Leu Ala Asp Met Pro     4302495  AGG GCT CCA CTC TCA TCT AAT GTC ACA GCC CTC AGA ACT AAA GCG GAC    2542431  Arg Ala Pro Leu Ser Ser Asn Val Thr Ala Leu Arg Thr Lys Ala Asp     4462543  TTT CTT TCC CTG CCT TCT TAT TTA GTC AGC TTG CCA TCC CTC CTC TTC    2590447  Phe Leu Ser Leu Pro Ser Tyr Leu Val Ser Leu Pro Ser Leu Leu Phe     4622591  ACT AGC AGT GTA GAT CAT TCC AGA TCA GTG GGG GAG GGC ACC TCA GCA    2638463  Thr Ser Ser Val Asp His Ser Arg Ser Val Gly Glu Gly Thr Ser Ala     4782639  ACC TCT GAG TGT GGA CAA TAG CTG CTT TCT TCT CTA TCC AAG ACC ACC    2686479  Thr Ser Glu Cys Gly Gln ***                                         4852687  AGG CTG TGC TTG GGT CCT TGC TCT CAG AGT CTA TAA ATA AAA GAA TAT    27342735  AAT GAA AAA AAA AAA AAA AAA A                                      2756D.Blastp结果Query=PP3476(484个氨基酸)>SW:YRM2_CAEEL Q09600 caenorhabditis elegans.hypothetical 108.5 kd
         protein r06f6.2 in chromosome ii.2/1996
         长度=950个氨基酸分值=111bits(276),预计值=7e-24相同性=71/258(27%),相似性=121/258(46%),缺口=36/258(13%)Query:120  DKALVLCQMHDFQDGVLYLYEQGKLFQQIMHYHMQHEQYRQVISVCERHGEQDPSLWEQA 179
        D AL  +Q +D    + ++  +    +++M YH+       +I +C+Sbjct:643  DAALQMAQLFDCTPVIEHILMRCHKSKELMMYHQKKRDLEAIIRLCQS------------ 690Query:180  LSYFARKEEDCKEYVAAVLKHIENKNLMPPLLVVQTLAHNSTATLSVIRDYLVXXXXXXX 239
              KEE            IE    + PL+V++ LA N T+S   +RDY++Sbjct:691  ----CSKEE------------IEASEQIHPLVVLELLAKNEHLTISSVRDYIIAWLRKQQ 734Query:240  XXXXXDELRVRRYREETTRIRQEIQELKASPKIFQKTKCSICNSALELPSVHFLCGHSFH 299
             D   ++   +    +   ++ LK + +I Q TKCS C++ L+LP+VHFLC H++HSbjct:735  IIIEEDRNTIKENNKAMGELDGTVESLKFNAQIMQVTKCSACDTPLQLPTVHFLCKHAYH 794Query:300  QHCFESYSESDAD-CPTCLPENRKVMDMIRAQEQKRDLHDQFQHQLKCSNDSFSVIADYF 358
         HCFESY+   +D CP C    +   D  R +E     + +FQ +L  +++   +IA YSbjct:795  VHCFESYNMDGSDKCPAC----QTTRDTTRDEEIS---YHKFQKELAEASNGMELIAMYL 847Query:359  GRGVFNKLTLLTDPPTAR 376
         RG+F++ T  T    A+Sbjct:848 QRGLFDEKTKKTKKSEAK 865>SW:END1_YEAST P12868 saccharomyces cerevisiae(baker′s yeast).
          vacuolar biogenesis protein end1(pep5 protein).7/1998
          长度=1029个氨基酸分值=83.9bits(204),预计值=2e-15相同性=59/229(25%),相似性=101/229(43%),缺口=19/229(8%)Query:155 HEQYRQVISVCERHGEQDPSLWEQALSYFARKEEDCKEYVA------AVLKHIENKNLMP 208
       +E+    +   E++G ++P L + ALSYF   +   KE          VL+ I     MPSbjct:795 NEEPSTCLKFLEKYGTEEPKLLQVALSYFVSNKLIFKEMGGNEVLKEKVLRPIIEGERMP 854Query:209 PLLVVQTLAHNSTATLSVIRDYLVXXXXXXXXXXXXDELRVRRY----REETTRIRQEIQ 264
        L +++ L+  + A   +I+D ++            +E  +  Y    +E+  +++  ISbjct:855 LLDIIKALSRTNVAHFGLIQDIIIDHVKTEDTEIKRNEKLIESYDKELKEKNKKLKNTIN 914Query:265 ELKASPKIFQKTKCSICNSALELPSVHFLCGHSFHQHCF---ESYSESDA---DCPTCLP 318
         +      +   C +C   L++P V F CGH +HQHC    E   ES+     CP CLSbjct:915 SDQPLHVPLKNQTCFMCRLTLDIPVVFFKCGHIYHQHCLNEEEDTLESERKLFKCPKCLV 974Sbjct:319 ENRKVMDMIRAQE---QKRDLHDQFQHQLKCSNDSFSVIADYFGRGVFN 364
       +      +  AQ    +K DL +   +  + S D F VI ++ GRG  +Sbjct:975 DLETSNKLFEAQHEVVEKNDLLNFALNSEEGSRDRFKVITEFLGRGAIS 1023>SP_IN:076248 076248 drosophila melanogaster(fruit fly).light
         protein.11/1998
        长度=841个氨基酸分值=44.9 bits(104),预计值=0.001相同性=39/222(17%),相似性=90/222(39%),缺口=27/222(12%)Query:107 ISLLKSGRFCDVFDKALVLCQMHDFQDGVLYL------YEQGKLFQQIMHYHMQHEQYRQ 160
       +  LK  +  D+  +ALV+C+  +F   ++YL       E+      I+H   +Sbjct:626 LPFLKRSKDYDI-QEALVICKQENFYPEIVYLLGCMGGVEASEALNIIIH---RIRDIEM 681Query:161 VISVCERHGEQDPSLWEQALSYFARKEEDCKEYVAAVLKHIENKNLMPPLLVVQTLAHNS 220
        I  C+ H + D  LW   ++ F++  E   + +  ++ +     ++  + + Q + +Sbjct:682 AIEFCKEHDDSD--LWNALINEFSKHPEIVTKVLDGIVDYFSPAVVVGKIKMGQNIPNLR 739Query:221 TATLSVIRDYLVXXXXXXXXXXXXDELRVRRYREETTRIRQEIQELKASPKIFQKTKCSI 280
        + + ++R Y               ++++  Y E  + I   +   +   ++  +  CS+Sbjct:740 QSLIKMLRHY----NLQGEILSSAQQIQLNDYFEIHSEI---VTTQRRGQQVSYEQLCSL 792Query:281 CNSALELPSVHFL------CGHSFHQHCFESYSESDADCPTC 316
       C+  + +   H        CGH +H+ C +   E   +C  CSbjct:793 CHRPVLMAGTHLYCIIRLECGHVYHKPCIQ--GELLKNCNEC 832
5.PP3731蛋白A:核苷酸序列(SEQ ID NO:13)长度:1946bp1  TGGCCGCCTC  TGCTCCTCCC  GACCGCAGCC  CCTACCTCTC  TCCCAGACTC51  CAGTCGCCCG  TGCCCACCGC  TGCCCACGTG  GCCTCTTTCC  AGGCAGCAGC101  CAGGGCTTCT  GGCACGTCGG  GCGCCAGCAC  TGTCGCTTGT  GGCCACGGCC151  CGCAGAGCTT  CAGTCCCTTG  AGCTCCTCCT  CCAGAGCAGG  GCCGAGGGTC201  TCGCCCCAGC  CCGACTGGCT  GTGCCTGCAG  ATGATGCTGG  TCACGCAGCT251  TTTCGTTTCC  CGGAACGCAG  GTGGGATAGC  AGTGCCCTTT  TCTGGCAGTG301  CGGCATTCTC  TCTGGCAGTC  ATTCCGCCCG  GAGAGGCTCA  TCTTGGGCGG351  TTCTGGGCGA  CAGCTGTGTG  GCTGCACAGT  GGCCAGTGAG  AGGCATCTGG401  GAAGGTGGCC  CTTGTGTAGG  GAGTCACTCT  CCTTCCGTCA  CGGTCACACC451  TCATGAAATG  GTTAGATTCT  TCCAAGTGCC  TTCTACGCCC  CTGGCAGATT501  TTCTAGAATT  TGCCGTCCCA  GAAGCTTGAG  AAGTGTCCAG  TGCCACCCGA551  CAGCAGAAGC  CGGGATGCCG  CTGAGACGCC  AGCGCTTCTG  AGTCCCTCTC601  ACTGCCTGCC  TTCTGGTGGA  GAGAAGGCTG  TCCTGCGGGC  TTATGCCCTC651  CCCACGCTCC  TCGCACCGTT  CACGCCATTG  TGCAGCACAG  CTGTTAGGAC701  CAAATTCATC  TTCCCCGCAA  GGACGAGTCA  GGCCCAGTGT  TGCACTGGTC751  CTGCTGTCTG  GCTTCTGCTG  CGGAACTTCC  TCACCTTCCA  GGCAGGGCCC801  AGGAGCCACA  GGAGCGTGGG  CGGGGCAGGG  TCTGCCCTCT  GTGCTTCCGA851  CTCGCCGCTT  GTGAGCTGGA  GGGACAGTCA  CCTCGACCTG  GTGGGCTGGG901  TGGGCCTGGC  TGTGCTGTGG  GCTGTGCCTC  ACTCCTGCAA  GTGGGCACTC951  AGCGGGGTTG  GGGTCACGAG  GCTGAGGTCG  GCTTAAAGCA  GGAGTGGGCA1001  GTTGGCACGT  CATGTTTCTC  CTGCATCAGG  GCTGTGGCAG  GAATGCCGGG1051  TGACTACCGT  AGACACTTGT  CAAGGCTGAG  GTTCAGAGAA  AGGTGTGGGG1101  TATCCCGGAG  GTCACCACAG  TGTGCCAGGA  GGTTCAGGTT  GGCCTTCCAG1151  AGCCCGGCCT  GTGTGAAATC  CCCACGAGCA  CAGAGGACAG  AACGAAACAT1201  GGTGTTGTTT  TGAGACAGGG  TGTTACTGTG  TCACCCAGGC  TGGAGTAGAG1251  TGGTGCCACA  TTTTTTGTAG  AGACGGGGTG  TCCCTGTGTA  GCCCAGGCTG1301  GTCTTGAACT  CCTGGGTACA  AGCAGTCCTC  CCTCGTGGGC  CTCCCAAAGT1351  GCTGGGATTA  CAGGCGTGGG  CTCCCGTGAC  CAGCCTGGAA  CGTGCTGATG1401  AGCCTCTTTT  TCTCCTGAAA  CCCCGGTGGG  AACAGATGGT  GGATGCTTCC1451  AAAAGCATCG  AAGCTGTCCA  TGAGGACATC  CGCGTGCTCT  CTGAGGACGC1501  CATCCGCACT  GCCACAGAGA  AGCCGCTGGG  GGAGCTATGG  AAGTGACCCA1551  AGGCTGCCAC  TGGAGACGCC  TCTCCCTGCA  GTCCCCCGAG  AGGTGGGAGA1601  CTCGCGGAAG  GCCCTGTCCC  CAGCGGAGTC  CAGACCCCAC  AACTTCAGGA1651  GCTCTTTCCC  GGCAGCAGAG  ATCTGCAGGC  TGCCTCTTCT  GCCCCGGAGC1701  TGGGGTGCAC  TGGGGACCCC  CGTGGTGGGG  ACCTTGGCAG  TGTGGACATG1751  AGCAGAGCGA  TGGAGCAGTC  TCCTGCCCTC  TCCCCTGTCC  TGATGGCACT1801  CTGTTGTATT  TTCTTACTGA  AGTTCAGTGA  TAACTCTGAG  CAGTTTCATT1851  GTGATCACTG  TAAATGGTAA  TCAGTTGGAA  TTCTCCTAAA  TGTCTTCCAG1901  ACACTAGTAA  AAAACGACCT  GAAAATTGAA  AAAAAAAAAA  AAAAAAB:氨基酸序列(SEQ ID NO:14)长度:102个氨基酸1  MLPKASKLSM RTSACSLRTP SALPQRSRWG SYGSDPRLPL ETPLPAVPRE VGDSRKALSP61  AESRPHNFRS SFPAAEICRL PLLPRSWGAL GTPVVGTLAV WTC.核苷酸及氨基酸组合序列(SEQ ID NO:15)克隆号:PP3731起始编码子:1443 ATG    终止编码子:1751 TGA蛋白质分子量:110491     TG  GCC  GCC  TCT  GCT  CCT  CCC  GAC  CGC  AGC  CCC  TAC  CTC  TCT  CCC  AGA      4748    CTC  CAG  TCG  CCC  GTG  CCC  ACC  GCT  GCC  CAC  GTG  GCC  TCT  TTC  CAG  GCA      9596    GCA  GCC  AGG  GCT  TCT  GGC  ACG  TCG  GGC  GCC  AGC  ACT  GTC  GCT  TGT  GGC     143144    CAC  GGC  CCG  CAG  AGC  TTC  AGT  CCC  TTG  AGC  TCC  TCC  TCC  AGA  GCA  GGG     191192    CCG  AGG  GTC  TCG  CCC  CAG  CCC  GAC  TGG  CTG  TGC  CTG  CAG  ATG  ATG  CTG     239240    GTC  ACG  CAG  CTT  TTC  GTT  TCC  CGG  AAC  GCA  GGT  GGG  ATA  GCA  GTG  CCC     287288    TTT  TCT  GGC  AGT  GCG  GCA  TTC  TCT  CTG  GCA  GTC  ATT  CCG  CCC  GGA  GAG     335336    GCT  CAT  CTT  GGG  CGG  TTC  TGG  GCG  ACA  GCT  GTG  TGG  CTG  CAC  AGT  GGC     383384    CAG  TGA  GAG  GCA  TCT  GGG  AAG  GTG  GCC  CTT  GTG  TAG  GGA  GTC  ACT  CTC     431432    CTT  CCG  TCA  CGG  TCA  CAC  CTC  ATG  AAA  TGG  TTA  GAT  TCT  TCC  AAG  TGC     479480    CTT  CTA  CGC  CCC  TGG  CAG  ATT  TTC  TAG  AAT  TTG  CCG  TCC  CAG  AAG  CTT     527528    GAG  AAG  TGT  CCA  GTG  CCA  CCC  GAC  AGC  AGA  AGC  CGG  GAT  GCC  GCT  GAG     575576    ACG  CCA  GCG  CTT  CTG  AGT  CCC  TCT  CAC  TGC  CTG  CCT  TCT  GGT  GGA  GAG     623624    AAG  GCT  GTC  CTG  CGG  GCT  TAT  GCC  CTC  CCC  ACG  CTC  CTC  GCA  GCG  TTC     671672    ACG  CCA  TTG  TGC  AGC  ACA  GCT  GTT  AGG  ACC  AAA  TTC  ATC  TTC  CCC  GCA     719720    AGG  ACG  AGT  CAG  GCC  CAG  TGT  TGC  ACT  GGT  CCT  GCT  GTC  TGG  CTT  CTG     767768    CTG  CGG  AAC  TTC  CTC  ACC  TTC  CAG  GCA  GGG  CCC  AGG  AGC  CAC  AGG  AGC     815816    GTG  GGC  GGG  GCA  GGG  TCT  GCC  CTC  TGT  GCT  TCC  GAC  TCG  CCG  CTT  GTG     863864    AGC  TGG  AGG  GAC  AGT  CAC  CTC  GAC  CTG  GTG  GGC  TGG  GTG  GGC  CTG  GCT     911912    GTG  CTG  TGG  GCT  GTG  CCT  CAC  TCC  TGC  AAG  TGG  GCA  CTC  AGC  GGG  GTT     959960    GGG  GTC  ACG  AGG  CTG  AGG  TCG  GCT  TAA  AGC  AGG  AGT  GGG  CAG  TTG  GCA    10071008    CGT  CAT  GTT  TCT  CCT  GCA  TCA  GGG  CTG  TGG  CAG  GAA  TGC  CGG  GTG  ACT    10551056    ACC  GTA  GAC  ACT  TGT  CAA  GGC  TGA  GGT  TCA  GAG  AAA  GGT  GTG  GGG  TAT    11031104    CCC  GGA  GGT  CAC  CAC  AGT  GTG  CCA  GGA  GGT  TCA  GGT  TGG  CCT  TCC  AGA    11511152    GCC  CGG  CCT  GTG  TGA  AAT  CCC  CAC  GAG  CAC  AGA  GGA  CAG  AAC  GAA  ACA    11991200    TGG  TGT  TGT  TTT  GAG  ACA  GGG  TGT  TAC  TGT  GTC  ACC  CAG  GCT  GGA  GTA    12471248    GAG  TGG  TGC  CAC  ATT  TTT  TGT  AGA  GAC  GGG  GTG  TCC  CTG  TGT  AGC  CCA    12951296    GGC  TGG  TCT  TGA  ACT  CCT  GGG  TAC  AAG  CAG  TCC  TCC  CTC  GTG  GGC  CTC    13431344    CCA  AAG  TGC  TGG  GAT  TAC  AGG  CGT  GGG  CTC  CCG  TGA  CCA  GCC  TGG  AAC    13911392    GTG  CTG  ATG  AGC  CTC  TTT  TTC  TCC  TGA  AAC  CCC  GGT  GGG  AAC  AGA  TGG    14391440    TGG  ATG  CTT  CCA  AAA  GCA  TCG  AAG  CTG  TCC  ATG  AGG  ACA  TCC  GCG  TGC    1487   1      Met Leu Pro Lys Ala Ser Lys Leu Ser Met Arg Thr Ser Ala Cys      151488  TCT CTG AGG ACG CCA TCC GCA CTG CCA CAG AGA AGC CGC TGG GGG AGC    153516  Ser Leu Arg Thr Pro Ser Ala Leu Pro Gln Arg Ser Arg Trp Gly Ser      311536  TAT GGA AGT GAC CCA AGG CTG CCA CTG GAG ACG CCT CTC CCT GCA GTC    158332  Tyr Gly Ser Asp Pro Arg Leu Fro Leu Glu Thr Pro Leu Pro Ala Val      471584  CCC CGA GAG GTG GGA GAC TCG CGG AAG GCC CTG TCC CCA GCG GAG TCC    163148  Pro Arg Glu Val Gly Asp Ser Arg Lys Ala Leu Ser Pro Ala Glu Ser      631632  AGA CCC CAC AAC TTC AGG AGC TCT TTC CCG GCA GCA GAG ATC TGC AGG    167964  Arg Pro His Asn Phe Arg Ser Ser Phe Pro Ala Ala Glu Ile Cys Arg      791680  CTG CCT CTT CTG CCC CGG AGC TGG GGT GCA CTG GGG ACC CCC GTG GTG    172780  Leu Pro Leu Leu Pro Arg Ser Trp Gly Ala Leu Gly Thr Pro Val Val      951728  GGG ACC TTG GCA GTG TGG ACA TGA GCA GAG CGA TGG AGC AGT CTC CTG    177596  Gly Thr Leu AIa Val Trp Thr ***                                     1031776  CCC TCT CCC CTG TCC TGA TGG CAC TCT GTT GTA TTT TCT TAC TGA AGT    18231824  TCA GTG ATA ACT CTG AGC AGT TTC ATT GTG ATC ACT GTA AAT GGT AAT    18711872  CAG TTG GAA TTC TCC TAA ATG TCT TCC AGA CAC TAG TAA AAA ACG ACC    19191920  TGA AAA TTG AAA AAA AAA AAA AAA AAA                                19466.PP3856蛋白A:核苷酸序列(SEQ ID NO:16)长度:1198bp1  GCCGCATCCA  GGCGAGCGGG  CAGCCTTTGT  GGCCTATGCC  TTGGCTTTTC51  CCCGGGCCTT  CCAGGGCCTC  CTGGACACCT  ACAGCGTGTG  GAGGAGTGGT101  CTCCCCAACT  TCCTAGCAGT  CGCCCTGGCC  CTGGGAGAGC  TGGGCTACCG151  GGCAGTGGGC  GTGAGGCTGG  ACAGTGGTGA  CCTGCTACAG  CAGGCTCAGG201  AGATCCGCAA  GGTCTTCCGA  GCTGCTGCAG  CCCAGTGAGT  TTCCCGGGGA251  GGAGGTGTGC  CTGGTGGGAG  ATCCCCGGGG  TTTGGGAATG  GGCAGGGAAG301  GACAGTGAGG  TACTCTGCTG  AAGTTTCAGC  GGTGATACTG  TAGGCCGTGG351  CAGGGAAGTA  AGTGGTGGGG  CTCCCTAGGA  GCTCCCAAGC  AGAAGGTGAG401  CACAGGTGTC  CTTGACTGAG  GCGGGGCGGG  GAGCAGGGGG  ACACCAGGGT451  GAATCAGGAA  GACCCGAGGG  GTGGCCCCCA  CCCTTTCTCC  ACCCACGCGG501  CAGGTTCCAG  GTGCCCTGGC  TGGAGTCAGT  CCTCATCGTA  GTCAGCAACA551  ACATTGACGA  GGAGGCGCTG  GCCCGACTGG  CCCAGGAGGG  CAGTGAGGTG601  AATGTCATTG  GCATTGGCAC  CAGTGTGGTC  ACCTGCCCCC  AACAGCCTTC651  CCTGGGTGGT  GTCTATAAGC  TGGTGGCCGT  GGGGGGCCAG  CCACGAATGA701  AGCTGACCGA  GGACCCCGAG  AAGCAGACGT  TGCCTGGGAG  CAAGGCTGCT751  TTCCGGCTCC  TGGGCTCTGA  CGGGTCTCCA  CTCATGGACA  TGCTGCAGTT801  AGCAGAAGAG  CCAGTGCCAC  AGGCTGGGCA  GGAGCTGAGG  GTGTGGCCTC851  CAGGGGCCCA  GGAGCCCTGC  ACCGTGAGGC  CAGCCCAGGT  GGAGCCACTA901  CTGCGGCTCT  GCCTCCAGCA  GGGACAGCTG  TGTGAGCCGC  TCCCATCCCT951  GGCAGAGTAT  AGAGCCTTGG  CCCAGCTGTC  CCTGAGCCGA  CTCAGCCCTG1001  AGCACAGGCG  GCTGCGGAGC  CCTGCCCAGT  ACCAGGTGGT  GCTGTCCGAA1051  AGGCTGCAGG  CCCTGGTGAA  CAGTCTGTGT  GCGGGGCAGT  CCCCCTGAGA1101  CTCGGAGCGG  GGCTGACTGG  AAACAACACG  AATCACTCAC  TTTTCCCCAA1151  AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAB:氨基酸序列(SEQ ID NO:17)长度:133个氨基酸1     MKLTEDPEKQ TLPGSKAAFR LLGSDGSPLM DMLQLAEEPV PQAGQELRVW PPGAQEPCTV61     RPAQVEPLLR LCLQQGQLCE PLPSLAEYRA LAQLSLSRLS PEHRRLRSPA QYQVVLSERL121     QALVNSLCAG QSPC.核苷酸及氨基酸组合序列(SRQ ID NO:18)克隆号:PP3856起始编码子:697 ATG    终止编码子:1098 TGA蛋白质分子量:146201  GCC GCA TCC AGG CGA GCG GGC AGC CTT TGT GGC CTA TGC CTT GGC TTT      4849  TCC CCG GGC CTT CCA GGG CCT CCT GGA CAC CTA CAG CGT GTG GAG GAG      9697  TGG TCT CCC CAA CTT CCT AGC AGT CGC CCT GGC CCT GGG AGA GCT GGG     144145  CTA CCG GGC AGT GGG CGT GAG GCT GGA CAG TGG TGA CCT GCT ACA GCA     192193  GGC TCA GGA GAT CCG CAA GGT CTT CCG AGC TGC TGC AGC CCA GTG AGT     240241  TTC CCG GGG AGG AGG TGT GCC TGG TGG GAG ATC CCC GGG GTT TGG GAA     288289  TGG GCA GGG AAG GAC AGT GAG GTA CTC TGC TGA AGT TTC AGC GGT GAT     336337  ACT GTA GGC CGT GGC AGG GAA GTA AGT GGT GGG GCT CCC TAG GAG CTC     384385  CCA AGC AGA AGG TGA GCA CAG GTG TCC TTG ACT GAG GCG GGG CGG GGA     432433  GCA GGG GGA CAC CAG GGT GAA TCA GGA AGA CCC GAG GGG TGG CCC CCA     480481  CCC TTT CTC CAC CCA CGC GGC AGG TTC CAG GTG CCC TGG CTG GAG TCA     528529  GTC CTC ATC GTA GTC AGC AAC AAC ATT GAC GAG GAG GCG CTG GCC CGA     576577  CTG GCC CAG GAG GGC AGT GAG GTG AAT GTC ATT GGC ATT GGC ACC AGT     624625  GTG GTC ACC TGC CCC CAA CAG CCT TCC CTG GGT GGT GTC TAT AAG CTG     672673  GTG GCC GTG GGG GGC CAG CCA CGA ATG AAG CTG ACC GAG GAC CCC GAG     7201                                  Met Lys Leu Thr Glu Asp Pro Glu       8721  AAG CAG ACG TTG CCT GGG AGC AAG GCT GCT TTC CGG CTC CTG GGC TCT     7689  Lys Gln Thr Leu Pro Gly Ser Lys Ala Ala Phe Arg Leu Leu Gly Ser      24769  GAC GGG TCT CCA CTC ATG GAC ATG CTG CAG TTA GCA GAA GAG CCA GTG     81625  Asp Gly Ser Pro Leu Met Asp Met Leu Gln Leu Ala Glu Glu Pro Val      40817  CCA CAG GCT GGG CAG GAG CTG AGG GTG TGG CCT CCA GGG GCC CAG GAG     86441  Pro Gln Ala Gly Gln Glu Leu Arg Val Trp Pro Pro Gly Ala Gln Glu      56865  CCC TGC ACC GTG AGG CCA GCC CAG GTG GAG CCA CTA CTG CGG CTC TGC     91257  Pro Cys Thr Val Arg Pro Ala Gln Val Glu Pro Leu Leu Arg Leu Cys      72913  CTC CAG CAG GGA CAG CTG TGT GAG CCG CTC CCA TCC CTG GCA GAG TAT     96073  Leu Gln Gln Gly Gln Leu Cys Glu Pro Leu Pro Ser Leu Ala Glu Tyr      88961  AGA GCC TTG GCC CAG CTG TCC CTG AGC CGA CTC AGC CCT GAG CAC AGG    100889  Arg Ala Leu Ala Gln Leu Ser Leu Ser Arg Leu Ser Pro Glu His Arg     1041009  CGG CTG CGG AGC CCT GCC CAG TAC CAG GTG GTG CTG TCC GAA AGG CTG    1056105  Arg Leu Arg Ser Pro Ala Gln Tyr Gln Val Val Leu Ser Glu Arg Leu     1201057  CAG GCC CTG GTG AAC AGT CTG TGT GCG GGG CAG TCC CCC TGA GAC TCG    1104121  Gln Ala Leu Val Asn Ser Leu Cys Ala Gly Gln Ser Pro ***             1341105    GAG  CGG  GGC  TGA  CTG  GAA  ACA  ACA  CGA  ATC  ACT  CAC  TTT  TCC  CCA  AAA         11521153    AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  A           1198
7.PP3958蛋白A:核苷酸序列(SEQ ID NO:19)长度:1643bp1  GAAAGTTTTA  AGCCCTTTTA  GAAACCTAAT  CATCACCAGT  GGAGGTGATC51  TTGAGAAGGG  GTGAGCATCC  CGAGAATGGC  CACGATTCAG  AATGAGCCAG101  TCCCGTGTGG  GGGCTGTAGA  GAAGCGTGAT  CAGAGCATAG  TGTCCCTGGA151  TGGATGGGCT  ATGGAGGCTT  TCCCTGCCTC  TTTCTAGGCC  CGCCTTTCTT201  CCTCCCAACT  CTTGACTCTG  CAGCTCTTGG  GGTGAAGCCT  TATTCCTGAT251  GCTCCAGACG  ATCACCATCT  GCTTCCTGGT  CATGCACTAC  AGAGGACAGA301  CTGTGAAAGG  TGCTGGGGAC  TTACCCAAGA  GCAGGCTGTG  TGGTTCCTGG351  GAACCCTGCT  GGGAACTCAG  GTCTGGGAAA  GCCAAATGAT  GTGGAGAGAT401  TGACAAGGAC  TCCTGTCTCC  CCACCCCTAG  GTGTCGCTTT  CCTCGCTTGC451  TACGGCCTGG  TCCTGCTGGT  GCTTCTCTCA  CCTCTGACGC  CCTTGACTGT501  AGTCACCCTG  CTCCAGGCCT  CCAATGTGCC  TGCTGTGGTG  GTGGGGAGGG551  TGGGTACCAG  GAGCAAGGGA  CAAGATGTTG  TGGGGGCAGG  GTCGGGGGGA501  AGAGTAGAAG  ATCAAAGTGT  GGGGGTGTTG  TACTTGGGGG  AGCATGGGAA651  GAGCTCAGGT  GACAGAGCCA  AAGGTCTCAA  CTCCTCCCCT  AGCTTCTCCA701  GGCAGCCACC  AACTACCACA  ACGGGCACAC  AGGCCAGCTC  TCAGCCATCA751  CAGTCTTCCT  GCTGTTTGGG  GGCTCCCTGG  CCCGAATCTT  CACTTCCATT801  CAGGAAACCG  GAGATCCCCT  GATGGCTGGG  ACCTTTGTGG  TCTCCTCTCT851  CTGCAACGGC  CTCATCGCCG  CCCAGCTGCT  CTTCTACTGG  AATGCAAAGC901  CTCCCCACAA  GCAGAAAAAG  GCGCAGTAGA  GCCAGCTACT  GGAGTCATTC951  CGTTTCCACT  CATTCACCCA  ACCTCAGGGT  TCTCCCCATC  TGAGCCAGCC1001  TGCTGGTGTG  ACTTACTCAT  CCTCCATTCC  TCTGCACTTG  CAGACTTTCT1051  GAGCCAGGGT  TTTCTTTTAG  TGGAAACAAA  TGGTTGATGG  ATCCAGATCC1101  TTAGAAAAGG  AGAGGATGGG  GGTAGAGTCT  CCCAAGCCAA  AATTTTGACA1151  TTTGAGTGCT  TTCGTAAGCC  CTGTACATGT  ACTATTAATT  CAGTCTGTAA1201  TGCTGGAGCT  AGTGGCATTG  ACTGGGACCA  TGGTCTACAG  CATCACTAAC1251  AACTTCCCAT  TCAGGTGAGG  GGCCCACCCT  TCCACCCCAA  GGGTAATACC1301  CACAACTCTA  ATGGGGATTA  AGGTGAAGGA  GGTTACAAGG  CAGCAAAGTG1351  GCCGGGCCCA  GTGGCTTGCA  CCTGTAACCC  CAGCACTTTG  GGAGGCCGAG1401  GCGGGTGGAT  CACCTGAGGT  CAGGAGTTCG  AACTGGCCAA  CATGGTGAAA1451  CCCCGTCTCT  ACTAAAAATA  CAAAATTAGC  TGGGTGTGGT  GATGGGCACC1501  TGTAATCCCA  GCTACTTGGG  AGGCTGAGGC  AGGAGAATCA  CTTGAACCTG1551  GGAGGCAGAG  GTTGCAGTGA  GCCAAGATTG  CGCCACTGCA  CTCCAGCCTG1601  GGCAACAAGA  GCGAAACTCA  GTCTTAAAAA  AAAAAAAAAA  AAAB:氨基酸序列(SEQ ID NO:20)长度:147个氨基酸1     MGRAQVTEPK VSTPPLASPG SHQLPQRAHR PALSHHSLPA VWGLPGPNLH FHSGNRRSPD61     GWDLCGLLSL QRPHRRPAAL LLECKASPQA EKGAVEPATG VIPFPLIHPT SGFSPSEPAC121     WCDLLILHSS  ALADFLSQGF  LLVETNGC.核苷酸及氨基酸组合序列(SEQ ID NO:21)克隆号:PP3958起始编码子:644 ATG    终止编码子:1087 TGA蛋白质分子量:15717   1    G AAA GTT TTA AGC CCT TTT AGA AAC CTA ATC ATC ACC AGT GGA GGT      4647  GAT CTT GAG AAG GGG TGA GCA TCC CGA GAA TGG CCA CGA TTC AGA ATG      9495  AGC CAG TCC CGT GTG GGG GCT GTA GAG AAG CGT GAT CAG AGC ATA GTG     142143  TCC CTG GAT GGA TGG GCT ATG GAG GCT TTC CCT GCC TCT TTC TAG GCC     190191  CGC CTT TCT TCC TCC CAA CTC TTG ACT CTG CAG CTC TTG GGG TGA AGC     238239  CTT ATT CCT GAT GCT CCA GAC GAT CAC CAT CTG CTT CCT GGT CAT GCA     286287  CTA CAG AGG ACA GAC TGT GAA AGG TGC TGG GGA CTT ACC CAA GAG CAG     334335  GCT GTG TGG TTC CTG GGA ACC CTG CTG GGA ACT CAG GTC TGG GAA AGC     382383  CAA ATG ATG TGG AGA GAT TGA CAA GGA CTC CTG TCT CCC CAC CCC TAG     430431  GTG TCG CTT TCC TCG CTT GCT ACG GCC TGG TCC TGC TGG TGC TTC TCT     478479  CAC CTC TGA CGC CCT TGA CTG TAG TCA CCC TGC TCC AGG CCT CCA ATG     526527  TGC CTG CTG TGG TGG TGG GGA GGG TGG GTA CCA GGA GCA AGG GAC AAG     574575  ATG TTG TGG GGG CAG GGT CGG GGG GAA GAG TAG AAG ATC AAA GTG TGG     622623  GGG TGT TGT ACT TGG GGG AGC ATG GGA AGA GCT CAG GTG ACA GAG CCA     6701                              Met Gly Arg Ala Gln Val Thr GlH Pro       9671  AAG GTC TCA ACT CCT CCC CTA GCT TCT CCA GGC AGC CAC CAA CTA CCA     71810  Lys Val Ser Thr Pro Pro Leu Ala Ser Pro Gly Ser His Gln Leu Pro      25719  CAA CGG GCA CAC AGG CCA GCT CTC AGC CAT CAC AGT CTT CCT GCT GTT     76626  Gln Arg Ala His Arg Pro Ala Leu Ser His His Ser Leu Pro Ala Val      41767  TGG GGG CTC CCT GGC CCG AAT CTT CAC TTC CAT TCA GGA AAC CGG AGA     81442  Trp Gly Leu Pro Gly Pro Asn Leu His Phe His Ser Gly Asn Arg Arg      57815  TCC CCT GAT GGC TGG GAC CTT TGT GGT CTC CTC TCT CTG CAA CGG CCT     86258  Ser Pro Asp Gly Trp Asp Leu Cys Gly Leu Leu Ser Leu Gln Arg Pro      73863  CAT CGC CGC CCA GCT GCT CTT CTA CTG GAA TGC AAA GCC TCC CCA CAA     91074  His Arg Arg Pro Ala Ala Leu Leu Leu Glu Cys Lys Ala Ser Pro Gln      89911  GCA GAA AAA GGC GCA GTA GAG CCA GCT ACT GGA GTC ATT CCG TTT CCA     95890  Ala Glu Lys Gly Ala Val Glu Pro Ala Thr Gly Val Ile Pro Phe Pro     105959  CTC ATT CAC CCA ACC TCA GGG TTC TCC CCA TCT GAG CCA GCC TGC TGG    1006106  Leu Ile His Pro Thr Ser Gly Phe Ser Pro Ser Glu Pro Ala Cys Trp     1211007  TGT GAC TTA CTC ATC CTC CAT TCC TCT GCA CTT GCA GAC TTT CTG AGC    1054122  Cys Asp Leu Leu Ile Leu His Ser Ser Ala Leu Ala Asp Phe Leu Ser     1371055  CAG GGT TTT CTT TTA GTG GAA ACA AAT GGT TGA TGG ATC CAG ATC CTT    1102138  Gln Gly Phe Leu Leu Val Glu Thr Asn Gly ***                         1481103  AGA AAA GGA GAG GAT GGG GGT AGA GTC TCC CAA GCC AAA ATT TTG ACA    11501151  TTT GAG TGC TTT CGT AAG CCC TGT ACA TGT ACT ATT AAT TCA GTC TGT    11981199  AAT GCT GGA GCT AGT GGC ATT GAC TGG GAC CAT GGT CTA CAG CAT CAC    12461247  TAA CAA CTT CCC ATT CAG GTG AGG GGC CCA CCC TTC CAC CCC AAG GGT    12941295  AAT ACC CAC AAC TCT AAT GGG GAT TAA GGT GAA GGA GGT TAC AAG GCA    13421343  GCA AAG TGG CCG GGC CCA GTG GCT TGC ACC TGT AAC CCC AGC ACT TTG    13901391  GGA GGC CGA GGC GGG TGG ATC ACC TGA GGT CAG GAG TTC GAA CTG GCC    14381439  AAC ATG GTG AAA CCC CGT CTC TAC TAA AAA TAC AAA ATT AGC TGG GTG    14861487  TGG TGA TGG GCA CCT GTA ATC CCA GCT ACT TGG GAG GCT GAG GCA GGA    15341535  GAA TCA CTT GAA CCT GGG AGG CAG AGG TTG CAG TGA GCC AAG ATT GCG    15821583  CCA CTG CAC TCC AGC CTG GGC AAC AAG AGC GAA ACT CAG TCT TAA AAA    16301631  AAA AAA AAA AAA A                                                  1643
8.PP3971蛋白A:核苷酸序列(SEQ ID NO:22)长度:1588bp1   TGGCTCAACA  ATGCCTTCCA  GGATGTGGAG  TCAGAGAACG  TCAACGTGGT51   GAAGCGGCTG  TTCAAGATCC  AGAACCTCAA  TGCCAGCACC  GTCCGCACGG101   TGATGGTGGC  CGACTGCAGC  CGCTTCGACA  GCCCTGACCT  GCTGCTGGAA151   GCCGGTGACC  CGCCACGTCC  CCCTGCCGCA  TCTTTGACCT  GGGCAGCGAC201   AACGAGGAGG  TGGTGGCTGG  CCCGGCCCCC  GCCCACGCCA  AGGAGGGCTT251   GCGGCACTTT  CTGGACCGCG  TGCTGGAGGG  GCGGGCGCAC  AGCAGCTGTC301   GGAGCGCATC  TAGAGACCAA  GGTGGCCGAG  CTGCTGGCCC  AGGGCACACC351   AAGCCACCCG  AGCGCAGTGC  CACAGGCGCC  AAGAGCAAGT  ACCTCATCTT401   CACCACTGGC  TGCCTCACCT  ACTCCCCACA  CCAGATCGGC  ATCAAGCAGA451   TCCTGCCACA  CCAGATGACC  ACGGCAGGGC  CCGTGCTGGG  TGAGGGCCGG501   GGCTCCGATG  CCTTCTTCGA  CGCGCTGGAC  CACGTCATAG  ACATACACGG551   ACACATCATC  GGCATGGGCC  TGTCGCCCGA  CAACAGGTAC  CTGTACGTGA601   ACAGCCGCGC  CTGGCCCAAC  GGTGCGGTGG  TGGCCGACCC  CATGCAGCCG651   CCACCAATCG  CGGAGGAGAT  TGACCTGCTG  GTGTTCGACC  TCAAGACCAT701   GCGGGAGGTG  AGGCGGGCTC  TGCGTGCGCA  CCGCGCCTAC  ACGCCCAACG751   ACGAGTGCTT  CTTCATCTTC  CTGGACGTCA  GCAGGGACTT  CGTGGCCAGC801   GGGGCGGAGG  ACCGGCACGG  CTACATCTGG  GACCGCCACT  ACAACATCTG851   TCTGGCCAGG  CTGCGGCACG  AGGATGTGGT  CAACTCAGTG  GTCTTCAGTC901   CCCAGGAGCA  GGAGCTGCTG  CTCACGGCCA  GCGACGACGC  CACCATCAAA951   GCCTGGCGCT  CCCCACGCAC  CATGCGCGTC  CTCCAGGCAC  CTCGCCCACG1001   GCCTCGCACC  TTCTTCTCCT  GGCTTGCCAG  CCAGAGGCGC  TTGAGGTGTG1051   CTGGGTGCAC  TGGAGCCACC  GGGACCCCTT  GAGGACATCG  CCAGGCTCTG1101   TGGCTTTTTC  CCGAGCGGGA  GAGGTGGAGA  TGCTTATAGC  AGTTACGCCT1151   TAGGAAGGGG  ACAACCAGGC  CCCGCCACAC  GCTCACACAC  AAACCTGCTC1201   ACGCAGCTGT  GATGCTTGGC  ACGGGGTGGC  CAGTGCAGAT  GGAGCCCAAG1251   GCCCCCTCGG  CCTCCTGGGC  AACTTGGGGT  ACACAGGATA  CTGGGGGTGC1301   CGCTCCTCAC  TCAACCCCAG  GCTAGGGGTA  CACCTTGACC  CAGCTGGCCT1351   CGGCCCGGGG  CACCTTCGGC  TGGTCCTGTG  GGGCCCTGGA  CGGTGGCCCA1401   GTGGTGGCAG  GGGCTGCTCC  TGGCTGTGGT  TGTGCCCCCG  GGGCTTGGGA1451   GCGGCCGGTC  ACGCTGCTGT  GGGCCCGAGT  GTGTTGCATG  TCCACGCACC1501   ACCCGTTCAG  GGCCCTGAAT  AAACAGTTGG  CAACAGCAAA  AAAAAAAAAA1551   AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAB:氨基酸序列(SEQ ID NO:23)长度:205个氨基酸1     MTTAGPVLGE GRGSDAFFDA LDHVIDIHGH IIGMGLSPDN RYLYVNSRAW PNGAVVADPM61     QPPPIAEEID LLVFDLKTMR EVRRALRAHR AYTPNDECFF IFLDVSRDFV ASGAEDRHGY121     IWDRHYNICL ARLRHEDVVN SVVFSPQEQE LLLTASDDAT IKAWRSPRTM RVLQAPRPRP181     RTFFSWLASQ RRLRCAGCTG ATGTPC.核苷酸及氨基酸组合序列(SEQ ID NO:24)克隆号:PP3971起始编码子:465 ATG    终止编码子:1082 TGA蛋白质分子量:23135   1   TG GCT CAA CAA TGC CTT CCA GGA TGT GGA GTC AGA GAA CGT CAA CGT      4748  GGT GAA GCG GCT GTT CAA GAT CCA GAA CCT CAA TGC CAG CAC CGT CCG      9596  CAC GGT GAT GGT GGC CGA CTG CAG CCG CTT CGA CAG CCC TGA CCT GCT     143144  GCT GGA AGC CGG TGA CCC GCC ACG TCC CCC TGC CGC ATC TTT GAC CTG     191192  GGC AGC GAC AAC GAG GAG GTG GTG GCT GGC CCG GCC CCC GCC CAC GCC     239240  AAG GAG GGC TTG CGG CAC TTT CTG GAC CGC GTG CTG GAG GGG CGG GCG     287288  CAC AGC AGC TGT CGG AGC GCA TCT AGA GAC CAA GGT GGC CGA GCT GCT     335336  GGC CCA GGG CAC ACC AAG CCA CCC GAG CGC AGT GCC ACA GGC GCC AAG     383384  AGC AAG TAC CTC ATC TTC ACC ACT GGC TGC CTC ACC TAC TCC CCA CAC     431432  CAG ATC GGC ATC AAG CAG ATC CTG CCA CAC CAG ATG ACC ACG GCA GGG     4791                                              Met Thr Thr Ala Gly       5480  CCC GTG CTG GGT GAG GGC CGG GGC TCC GAT GCC TTC TTC GAC GCG CTG     5276  Pro Val Leu Gly Glu Gly Arg Gly Ser Asp Ala Phe Phe Asp Ala Leu      21528  GAC CAC GTC ATA GAC ATA CAC GGA CAC ATC ATC GGC ATG GGC CTG TCG     57522  Asp His Val Ile Asp Ile His Gly His Ile Ile Gly Met Gly Leu Ser      37576  CCC GAC AAC AGG TAC CTG TAC GTG AAC AGC CGC GCC TGG CCC AAC GGT     62338  Pro Asp Asn Arg Tyr Leu Tyr Val Asn Ser Arg Ala Trp Pro Asn Gly      53624  GCG GTG GTG GCC GAC CCC ATG CAG CCG CCA CCA ATC GCG GAG GAG ATT     67154  Ala Val Val Ala Asp Pro Met Gln Pro Pro Pro Ile Ala Glu Glu Ile      69672  GAC CTG CTG GTG TTC GAC CTC AAG ACC ATG CGG GAG GTG AGG CGG GCT     71970  Asp Leu Leu Val Phe Asp Leu Lys Thr Met Arg Glu Val Arg Arg Ala      85720  CTG CGT GCG CAC CGC GCC TAC ACG CCC AAC GAC GAG TGC TTC TTC ATC     76786  Leu Arg Ala His Arg Ala Tyr Thr Pro Asn Asp Glu Cys Phe Phe Ile     101768  TTC CTG GAC GTC AGC AGG GAC TTC GTG GCC AGC GGG GCG GAG GAC CGG     815102  Phe Leu Asp Val Ser Arg Asp Phe Val Ala Ser Gly Ala Glu Asp Arg     117816  CAC GGC TAC ATC TGG GAC CGC CAC TAC AAC ATC TGT CTG GCC AGG CTG     863118  His Gly Tyr Ile Trp Asp Arg His Tyr Asn Ile Cys Leu Ala Arg Leu     133864  CGG CAC GAG GAT GTG GTC AAC TCA GTG GTC TTC AGT CCC CAG GAG CAG     911134  Arg His Glu Asp Val Val Asn Ser Val Val Phe Ser Pro Gln Glu Gln     149912  GAG CTG CTG CTC ACG GCC AGC GAC GAC GCC ACC ATC AAA GCC TGG CGC     959150  Glu Leu Leu Leu Thr Ala Ser Asp Asp Ala Thr Ile Lys Ala Trp Arg     165960  TCC CCA CGC ACC ATG CGC GTC CTC CAG GCA CCT CGC CCA CGG CCT CGC    1007166  Ser Pro Arg Thr Met Arg Val Leu Gln Ala Pro Arg Pro Arg Pro Arg     1811008  ACC TTC TTC TCC TGG CTT GCC AGC CAG AGG CGC TTG AGG TGT GCT GGG    1055182  Thr Phe Phe Ser Trp Leu Ala Ser Gln Arg Arg Leu Arg Cys Ala Gly     1971056  TGC ACT GGA GCC ACC GGG ACC CCT TGA GGA CAT CGC CAG GCT CTG TGG    1103198  Cys Thr Gly Ala Thr Gly Thr Pro ***                                 2061104  CTT TTT CCC GAG CGG GAG AGG TGG AGA TGC TTA TAG CAG TTA CGC CTT    11511152  AGG  AAG  GGG  ACA  ACC  AGG  CCC  CGC  CAC  ACG  CTC  ACA  CAC  AAA  CCT  GCT    11991200  CAC  GCA  GCT  GTG  ATG  CTT  GGC  ACG  GGG  TGG  CCA  GTG  CAG  ATG  GAG  CCC    12471248  AAG  GCC  CCC  TCG  GCC  TCC  TGG  GCA  ACT  TGG  GGT  ACA  CAG  GAT  ACT  GGG    12951296  GGT  GCC  GCT  CCT  CAC  TCA  ACC  CCA  GGC  TAG  GGG  TAC  ACC  TTG  ACC  CAG    13431344  CTG  GCC  TCG  GCC  CGG  GGC  ACC  TTC  GGC  TGG  TCC  TGT  GGG  GCC  CTG  GAC    13911392  GGT  GGC  CCA  GTG  GTG  GCA  GGG  GCT  GCT  CCT  GGC  TGT  GGT  TGT  GCG  CCC    14391440  GGG  GCT  TGG  GAG  CGG  CCG  GTC  ACG  CTG  CTG  TGG  GCC  CGA  GTG  TGT  TGC    14871488  ATG  TCC  ACG  CAC  CAC  CCG  TTC  AGG  GCC  CTG  AAT  AAA  CAG  TTG  GCA  ACA    15351536  GCA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA  AAA    158315R4  AAA  AA                                                                           1588
9.PP4519蛋白A:核苷酸序列(SEQ ID NO:25)长度:1353bp1  GTGCCAGTCC  ATCTGACATC  AAAGCCAGTG  TCTCTAATGG  TGACACCACC51  CTCCTCTGCA  GCAGGAGGCA  GAGCTGTGGG  ATGAATGAGG  TTCGCCAGGT101  CTCCCTTACC  TATCCTGGGT  CCCCAGCTCC  TTCTCACTCT  CTTCCCTTGC151  AGCCTCGAAG  CGGAGGATCC  CTGTGTCCCA  GCCGGGCATG  GCCGACCCCC201  ACCAGCTTTT  CGATGACACA  AGTTCAGCCC  AGAGCCGGGG  CTATGGGGCC251  CAGCGGGCAC  CTGGTGGCCT  GAGTTATCCT  GCAGCCTCTC  CCACGCCCCA301  TGCAGCCTTC  CTGGCTGACC  CGGTGTCCAA  CATGGCCATG  GCCTATGGGA351  GCAGCCTGGC  CGCGCAGGGC  AAGGAGCTGG  TGGATAAGAA  CATCGACCGC401  TTCATCCCCA  TCACCAAGCT  CAAGTATTAC  TTTGCTGTGG  ACACCATGTA451  TGTGGGCAGA  AAGCTGGGCC  TGCTGTTCTT  CCCCTACCTA  CACCAGGACT501  GGGAAGTGCA  GTACCAACAG  GACACCCCGG  TGGCCCCCCG  CTTTGACGTC551  AATGCCCCGG  ACCTCTACAT  TCCAGCAATG  GCTTTCATCA  CCTACGTTTT601  GGTGGCTGGT  CTTGCGCTGG  GGACCCAGGA  TAGGTTCTCC  CCAGACCTCC651  TGGGGCTGCA  AGCGAGCTCA  GCCCTGGCCT  GGCTGACCCT  GGAGGTGCTG701  GCCATCCTGC  TCAGCCTCTA  TCTGGTCACT  GTCAACACCG  ACCTCACCAC751  CATCGACCTG  GTGGCCTTCT  TGGGCTACAA  ATATGTCGGG  ATGATTGGCG801  GGGTCCTCAT  GGGCCTGCTC  TTCGGGAAGA  TTGGCTACTA  CCTGGTGCTG851  GGCTGGTGCT  GCGTAGCCAT  CTTTGTGTTC  ATGATCCGGA  CGCTGCGGCT901  GAAGATCTTG  GCAGACGCAG  CAGCTGAGGG  GGTCCCGGTG  CGTGGGGCCC951  GGAACCAGCT  GCGCATGTAC  CTGACCATGG  CGGTGGCGGC  GGCGCAGCCT1001  ATGCTCATGT  ACTGGCTCAC  CTTCCACCTG  GTGCGGTGAG  CGCGCCCGCT1051  GAACCTCCCG  CTGCTGCTGC  TGCTGCTGGG  GGCCACTGTG  GCCGCCGAAC1101  TCATCTCCTG  CCTGCAGGCC  CCAAGGTCCA  CCCTGTCTGG  CCACAGGCAC1151  CGCCTCCATC  CCATGTCCCG  CCCAGCCCCG  CCCCCAACCC  AAGGTGCTGA1201  GAGATCTCCA  GCTGCACAGG  CCACCGCCCC  AGGGCGTGGC  CGCTGTTACA1251  GAAACAATAA  ACCCTGATGG  GCATGGAAAA  AAAAAAAAAA  AAAAAAAAAA1301  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA1351  AAAB:氨基酸序列(SEQ ID NO:26)长度:283个氨基酸1  MADPHQLFDD TSSAQSRGYG AQRAPGGLSY PAASPTPHAA FLADPVSNMA MAYGSSLAAQ61  GKELVDKNID RFIPITKLKY YFAVDTMYVG RKLGLLFFPY LHQDWEVQYQ QDTPVAPRFD121  VNAPDLYIPA MAFITYVLVA GLALGTQDRF SPDLLGLQAS SALAWLTLEV LAILLSLYLV181  TVNTDLTTID LVAFLGYKYV GMIGGVLMGL LFGKIGYYLV LGWCCVAIFV FMIRTLRLKI241  LADAAAEGVP VRGARNQLRM YLTMAVAAAQ PMLMYWLTFH LVRC.核苷酸及氨基酸组合序列(SEQ ID NO:27)克隆号:PP4519起始编码子:    188 ATG    终止编码子:1039 TGA蛋白质分子量:311731    G TGC CAG TCC ATC TGA CAT CAA AGC CAG TGT CTC TAA TGG TGA CAC      4647  CAC CCT CCT CTG CAG CAG GAG GCA GAG CTG TGG GAT GAA TGA GGT TCG      9495  CCA GGT CTC CCT TAC CTA TCC TGG GTC CCC AGC TCC TTC TCA CTC TCT     142143  TCC CTT GCA GCC TCG AAG CGG AGG ATC CCT GTG TCC CAG CCG GGC ATG     1901                                                              Met       1191  GCC GAC CCC CAC CAG CTT TTC GAT GAC ACA AGT TCA GCC CAG AGC CGG     2382  Ala Asp Pro His Gln Leu Phe Asp Asp Thr Ser Ser Ala Gln Ser Arg      17239  GGC TAT GGG GCC CAG CGG GCA CCT GGT GGC CTG AGT TAT CCT GCA GCC     28618  Gly Tyr Gly Ala Gln Arg Ala Pro Gly Gly Leu Ser Tyr Pro Ala Ala      33287  TCT CCC ACG CCC CAT GCA GCC TTC CTG GCT GAC CCG GTG TCC AAC ATG     33434  Ser Pro Thr Pro His Ala Ala Phe Leu Ala Asp Pro Val Ser Asn Met      49335  GCC ATG GCC TAT GGG AGC AGC CTG GCC GCG CAG GGC AAG GAG CTG GTG     38250  Ala Met Ala Tyr Gly Ser Ser Leu Ala Ala Gln Gly Lys Glu Leu Val      65383  GAT AAG AAC ATC GAC CGC TTC ATC CCC ATC ACC AAG CTC AAG TAT TAC     43066  Asp Lys Asn Ile Asp Arg Phe Ile Pro Ile Thr Lys Leu Lys Tyr Tyr      81431  TTT GCT GTG GAC ACC ATG TAT GTG GGC AGA AAG CTG GGC CTG CTG TTC     47882  Phe Ala Val Asp Thr Met Tyr Val Gly Arg Lys Leu Gly Leu Leu Phe      97479  TTC CCC TAC CTA CAC CAG GAC TGG GAA GTG CAG TAC CAA CAG GAC ACC     52698  Phe Pro Tyr Leu His Gln Asp Trp Glu Val Gln Tyr Gln Gln Asp Thr     113527  CCG GTG GCC CCC CGC TTT GAC GTC AAT GCC CCG GAC CTC TAC ATT CCA     574114  Pro Val Ala Pro Arg Phe Asp Val Asn Ala Pro Asp Leu Tyr Ile Pro     129575  GCA ATG GCT TTC ATC ACC TAC GTT TTG GTG GCT GGT CTT GCG CTG GGG     622130  Ala Met Ala Phe Ile Thr Tyr Val Leu Val Ala Gly Leu Ala Leu Gly     145623  ACC CAG GAT AGG TTC TCC CCA GAC CTC CTG GGG CTG CAA GCG AGC TCA     670146  Thr Gln Asp Arg Phe Ser Pro Asp Leu Leu Gly Leu Gln Ala Ser Ser     161671  GCC CTG GCC TGG CTG ACC CTG GAG GTG CTG GCC ATC CTG CTC AGC CTC     718162  Ala Leu Ala Trp Leu Thr Leu Glu Val Leu Ala Ile Leu Leu Ser Leu     177719  TAT CTG GTC ACT GTC AAC ACC GAC CTC ACC ACC ATC GAC CTG GTG GCC     766178  Tyr Leu Val Thr Val Asn Thr Asp Leu Thr Thr Ile Asp Leu Val Ala     193767  TTC TTG GGC TAC AAA TAT GTC GGG ATG ATT GGC GGG GTC CTC ATG GGC     814194  Phe Leu Gly Tyr Lys Tyr Val Gly Met Ile Gly Gly Val Leu Met Gly     209815  CTG CTC TTC GGG AAG ATT GGC TAC TAC CTG GTG CTG GGC TGG TGC TGC     862210  Leu Leu Phe Gly Lys Ile Gly Tyr Tyr Leu Val Leu Gly Trp Cys Cys     225863  GTA GCC ATC TTT GTG TTC ATG ATC CGG ACG CTG CGG CTG AAG ATC TTG     910226  Val Ala Ile Phe Val Phe Met Ile Arg Thr Leu Arg Leu Lys Ile Leu     241 911  GCA GAC GCA GCA GCT GAG GGG GTC CCG GTG CGT GGG GCC CGG AAC CAG     958242  Ala Asp Ala Ala Ala Glu Gly Val Pro Val Arg Gly Ala Arg Asn Gln     257959  CTG CGC ATG TAC CTG ACC ATG GCG GTG GCG GCG GCG CAG CCT ATG CTC    1006258  Leu Arg Met Tyr Leu Thr Met Ala Val Ala Ala Ala Gln Pro Met Leu     2731007  ATG TAC TGG CTC ACC TTC CAC CTG GTG CGG TGA GCG CGC CCG CTG AAC    1054274  Met Tyr Trp Leu Thr Phe His Leu Val Arg ***                         2841055  CTC CCG CTG CTG CTG CTG CTG CTG GGG GCC ACT GTG GCC GCC GAA CTC    11021103  ATC TCC TGC CTG CAG GCC CCA AGG TCC ACC CTG TCT GGC CAC AGG CAC    11501151  CGC CTC CAT CCC ATG TCC CGC CCA GCC CCG CCC CCA ACC CAA GGT GCT    11981199  GAG AGA TCT CCA GCT GCA CAG GCC ACC GCC CCA GGG CGT GGC CGC TGT    12461247  TAC AGA AAC AAT AAA CCC TGA TGG GCA TGG AAA AAA AAA AAA AAA AAA    12941295  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    13421343  AAA AAA AAA AA                                                     1353D.Blastp结果Query=PP4519(283个氨基酸)>SP_IN:Q20913 Q20913 caenorhabditis elegans.f57a8.2 protein.1/1999
         长度=251个氨基酸分值=158bits(395),预计值=4e-38相同性=80/186(43%),相似性=113/186(60%6),缺口=13/186(6%)Query: 15 QSRGYGAQRAPGGLSYPAASPTPHAAFLADPVSNMAMAYGSSLAAQGKELVDKNIDRFIP 74
       Q+  YG     GG              ++DP+ N A  +G   A Q KE + K +  FSbjct: 76 QQQSYGQNNGFGGFQ--------PQQLMSDPMLNAAKQFGGQFAEQQKEKLTKYLGTF-- 125Query : 75 ITKLKYYFAVDTMYVGRKLGLLFFPYLHQDWEVQYQQDTPVAP-RFDVNAPDLYIPAMAF 133
          LKYYFAVD  YVG+KLG+LFFP+ H+DW +++      AP R DVNAPDLYIP M+FSbjct:126 --NLKYYFAVDNAYVGKKLGILFFPFFHKDWSLKFAGSADPAPAREDVNAPDLYIPLMSF 183Query:134 ITYVLVAGLALGTQDRFSPDLLGLQASSALAWLTLEVLAILLSLYLVTVNTDLTTIDLVA 193
       +TY+LV+G  LGTQ RFSP++LG+  S+AL W+ LE + I +S Y++ ++  L+    +ASbjct:184 LTYILVSGFVLGTQGRFSPEILGILTSNALIWVILENIVIFISKYILNISQSLSVWHSLA 243Query:194 FLGYKY 199
       +  YK+Sbjct:244 YSTYKF 249
10.PP5241蛋白A:核苷酸序(SEQ ID NO:28)长度:1891bp1    GGCACGGGGT  GGATCACTTG  AGGTCAGGAG  TTCGAGACCA  GCCTGACCAA51    CACGATGAAA  CCCTGTCTCT  ACTGAAAATA  CAAAAATTAG  CTGGGTGTAG101    TGGCAGGCAC  CTGTAATCCC  AGCTACTCAG  GAGGCTGAGG  CAGGAGAATT151    GCTTGAACCC  AGAAGGTTGC  AGGGAGCCAA  GATCACACCA  CTGCACTCTG201    TCTTAAAAAA  AAATAATAAA  TTAAAATAGA  AAGTTAAAAC  ATAGGAATAT251    ATAAGCACAT  ATTTCCTTAG  CTATCAGAAA  TGTGAGTGTG  AAAAAGACAA301    ATAATATGCT  GGTGTCATAA  TGAAAATAAT  TTTAACCTTG  CAGAGCCCCC351    CAAGACCTTT  AAAAACCTCT  GGGCTGCGTG  TCAGGATACA  GTGGTCTCCA 401   AGCTAGGCAC  AGTTCTTGCC  TTTGTTGTAC  TGGATGCTGT  GGTGCTGTGG451   AAGCCCATGG  TGGGGGGTTG  GGTCTAACAG  ACTTGTGGCA  TCAGGAAGGG501   TACTTGGAGA  GACAGACCTG  AAGTGGAGAC  TAGCCTGGGA  CAACAGGTGT551   AGTGGTGGAT  GGAGCAGCAT  GTGGGAGGCC  CAGAGGCCTC  ACCTGAAAAC601   CTCAACGAAG  CTCATAATGG  CTGCGTGTTA  ATATTGCATA  TGCTGGGATG651   ATACCAGCAG  TTTGAGTTCT  CTGGCTTCAG  CGTGATATGA  TTTTATCCAC701   TTGTTTATTT  TCAGAGGCAC  ATGTAGCTGT  TCTCAATTCC  CTTCTCTGTA751   TGACTTATAG  GAAGCTAAAG  GCTTCCTTGT  GTTAGAGAGC  TTCCTATTTC801   AAGTGCTGAG  CTGGGTTTGT  CAAGCTTTGA  AAATGCAGAC  AGAGCCATGA851   AACCTAAGGG  GGACTCAGAG  GAAGTGTCCA  TGTGCAGGAG  AGACAAGGCT901   GAATTAAAAG  GCATGATTAA  TCACAAAAGA  GTGGA4GAGT  GATGCTTGAG951   AGTTGAGGAC  GTGAGTAAAA  CAGAAGTAGA  ACTGCTCATT  TGATGTCATC1001   ACGTTATCTC  AAGATGAGCC  CTCTTGGCCT  CAGACAGTGG  GTAGCATTAC1051   ATTATATGTT  AGCTCCGCGC  CCCCACGCCC  ACCCTCCTTC  TTTGAAATGA1101   TGTCTAAATT  AGAGGTGTAA  CTATCCCACC  AGGTGCAACT  TGAGCCTTCC1151   TTTGCCCTCC  TGTAGCTGTC  GTGGGAGGGG  GGCCTGCTTT  CTTGGGCACA1201   GACTGTTTGG  TCAGCTGAGC  CACAGAAATG  AGGCCAGGCC  TGTTTTGCTC1251   TCTGTCTATG  CTTGATTGCA  AGGAACACTG  ATGATATCAG  AGGGCTTTCT1301   TACCTCAAGC  CCTTCTGGCT  TAAGGACAAG  GTTATTTCTT  TCATTTCTGT1351   CTGCAAACTG  TGGTAGTGTA  TTCGATTTCA  AGGATTCTGG  GATGAATTCT1401   TCAATGATAA  GAACCTGCTA  TTATTGTCCC  TGCTTTACAG  CTCCAGGGAT1451   TGGCAGCCTC  ATTCTTCAAA  AGTTGCACAC  CTTTAGGGCC  TTGGGAGGTA1501   CAGGCACCAG  CAAGGAGTCA  GAAGGAATGA  AAGCTGGAGA  GATGCGGCCC1551   ACACTGGAAA  GACAGGAGGA  AAGGAGAGAG  AAAGCGCCTC  GGCCAGGCAC1601   AGTGGCTCAT  GCCTGTAATC  CCAGCACTTT  GGGAGGCTGA  GGCGGGAGAT1651   CACCTGAGGT  CAGGAGACTG  AGACCAGCTT  GACCAACATG  GTGAAACCCC1701   ATCTCTACTA  AAAATACAAA  ACTAGCCGGG  CATGGTGGCG  AGTGCCTGTA1751   ATCTCCGCTA  CTTAGGAGGC  TGAGGCAGGA  GAATTGCTTG  AACCAGGAGG1801   CGGAGGTTGC  AGTGAGCTGA  GATCGTGCCA  TTGCACTCCA  GCCTAGGCAA1851   CAAGAGCAAA  ACTGCATCTC  AAAAAAAAAA  AAAAAAAAAA  AB:氨基酸序列(SEQIDNO:29)长度:119个氨基酸1  MISEGFLTSS PSGLRTRLFL SFLSANCGSV FDFKDSGMNS SMIRTCYYCP CFTAPGIGSL61  ILQKLHTFRA LGGTGTSKES EGMKAGEMRP TLERQEERRE KAPRPGTVAH ACNPSTLGGC.核苷酸及氨基酸组合序列(SEQ ID NO:30)克隆号:PP5241起始编码子:1281 ATG    终止编码子:1640 TGA蛋白质分子量:128301   GG  CAC  GGG  GTG  GAT  CAC  TTG  AGG  TCA  GGA  GTT  CGA  GAC  CAG  CCT  GAC     4748  CAA  CAC  GAT  GAA  ACC  CTG  TCT  CTA  CTG  AAA  ATA  CAA  AAA  TTA  GCT  GGG     9596  TGT  AGT  GGC  AGG  CAC  CTG  TAA  TCC  CAG  CTA  CTC  AGG  AGG  CTG  AGG  CAG    143144  GAG  AAT  TGC  TTG  AAC  CCA  GAA  GGT  TGC  AGG  GAG  CCA  AGA  TCA  CAC  CAC    191192  TGC  ACT  CTG  TCT  TAA  AAA  AAA  ATA  ATA  AAT  TAA  AAT  AGA  AAG  TTA  AAA    239240  CAT  AGG  AAT  ATA  TAA  GCA  CAT  ATT  TCC  TTA  GCT  ATC  AGA  AAT  GTG  AGT    287288  GTG  AAA  AAG  ACA  AAT  AAT  ATG  CTG  GTG  TCA  TAA  TGA  AAA  TAA  TTT  TAA    335336  CCT  TGC  AGA  GCC  CCC  CAA  GAC  CTT  TAA  AAA  CCT  CTG  GGC  TGC  GTG  TCA    383384  GGA  TAC  AGT  GGT  CTC  CAA  GCT  AGG  CAC  AGT  TCT  TGC  CTT  TGT  TGT  ACT    431432  GGA  TGC  TGT  GGT  GCT  GTG  GAA  GCC  CAT  GGT  GGG  GGG  TTG  GGT  CTA  ACA    479480  GAC  TTG  TGG  CAT  CAG  GAA  GGG  TAC  TTG  GAG  AGA  CAG  ACC  TGA  AGT  GGA    527528  GAC  TAG  CCT  GGG  ACA  ACA  GGT  GTA  GTG  GTG  GAT  GGA  GCA  GCA  TGT  GGG    575 576  AGG CCC AGA GGC CTC ACC TGA AAA CCT CAA CGA AGC TCA TAA TGG CTG     623624  CGT GTT AAT ATT GCA TAT GCT GGG ATG ATA CCA GCA GTT TGA GTT CTC     671672  TGG CTT CAG CGT GAT ATG ATT TTA TCC ACT TGT TTA TTT TCA GAG GCA     719720  CAT GTA GCT GTT CTC AAT TCC CTT CTC TGT ATG ACT TAT AGG AAG CTA     767768  AAG GCT TCC TTG TGT TAG AGA GCT TCC TAT TTC AAG TGC TGA GCT GGG     815816  TTT GTC AAG CTT TGA AAA TGC AGA CAG AGC CAT GAA ACC TAA GGG GGA     863864  CTC AGA GGA AGT GTC CAT GTG CAG GAG AGA CAA GGC TGA ATT AAA AGG     911912  CAT GAT TAA TCA CAA AAG AGT GGA AGA GTG ATG CTT GAG AGT TGA GGA     959950  CGT GAG TAA AAC AGA AGT AGA ACT GCT CAT TTG ATG TCA TCA CGT TAT    10071008  CTC AAG ATG AGC CCT CTT GGC CTC AGA CAG TGG GTA GCA TTA CAT TAT    10551056  ATG TTA GCT CCG CGC CCC CAC GCC CAC CCT CCT TCT TTG AAA TGA TGT    11031104  CTA AAT TAG AGG TGT AAC TAT CCC ACC AGG TGC AAC TTG AGC CTT CCT    11511152  TTG CCC TCC TGT AGC TGT CGT GGG AGG GGG GCC TGC TTT CTT GGG CAC    11991200  AGA CTG TTT GGT CAG CTG AGC CAC AGA AAT GAG GCC AGG CCT GTT TTG    12471248  CTC TCT GTC TAT GCT TGA TTG CAA GGA ACA CTG ATG ATA TCA GAG GGC    12951                                              Met Ile Ser Glu Gly       51296  TTT CTT ACC TCA AGC CCT TCT GGC TTA AGG ACA AGG TTA TTT CTT TCA    13436  Phe Leu Thr Ser Ser Pro Ser Gly Leu Arg Thr Arg Leu Phe Leu Ser      211344  TTT CTG TCT GCA AAC TGT GGT AGT GTA TTC GAT TTC AAG GAT TCT GGG    139122  Phe Leu Ser Ala Asn Cys Gly Ser Val Phe Asp Phe Lys Asp Ser Gly      371392  ATG AAT TCT TCA ATG ATA AGA ACC TGC TAT TAT TGT CCC TGC TTT ACA    143938  Met Asn Ser Ser Met Ile Arg Thr Cys Tyr Tyr Cys Pro Cys Phe Thr      531440  GCT CCA GGG ATT GGC AGC CTC ATT CTT CAA AAG TTG CAC ACC TTT AGG    148754  Ala Pro Gly Ile Gly Ser Leu Ile Leu Gln Lys Leu His Thr Phe Arg      691488  GCC TTG GGA GGT ACA GGC ACC AGC AAG GAG TCA GAA GGA ATG AAA GCT    153576  Ala Leu Gly Gly Thr Gly Thr Ser Lys Glu Ser Glu Gly Met Lys Ala      851536  GGA GAG ATG CGG CCC ACA CTG GAA AGA CAG GAG GAA AGG AGA GAG AAA    158386  Gly Glu Met Arg Pro Thr Leu Glu Arg Gln Glu Glu Arg Arg Glu Lys     1011584  GCG CCT CGG CCA GGC ACA GTG GCT CAT GCC TGT AAT CCC AGC ACT TTG    1631102  Ala Pro Arg Pro Gly Thr Val Ala His Ala Cys Asn Pro Ser Thr Leu     1171632  GGA GGC TGA GGC GGG AGA TCA CCT GAG GTC AGG AGA CTG AGA CCA GCT    1679118  Gly Gly ***                                                         1201680  TGA CCA ACA TGG TGA AAC CCC ATC TCT ACT AAA AAT ACA AAA CTA GCC    17271728  GGG CAT GGT GGC GAG TGC CTG TAA TCT CCG CTA CTT AGG AGG CTG AGG    17751775  CAG GAG AAT TGC TTG AAC CAG GAG GCG GAG GTT GCA GTG AGC TGA GAT    18231824  CGT GCC ATT GCA CTC CAG CCT AGG CAA CAA GAG CAA AAC TGC ATC TCA    18711872  AAA AAA AAA AAA AAA AAA AA                                         1891
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

Claims (10)

1.一种分离的在肝癌组织中具有表达差异的人蛋白,其特征在于,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29;
或其保守性变异多肽、或其活性片段、或其活性衍生物。
2.如权利要求1所述的多肽,其特征在于,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29。
3.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:
(a)编码如权利要求1和2所述多肽的多核苷酸;
(b)与多核苷酸(a)互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30的编码区序列或全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求6所述的载体转化或转导的宿主细胞;
(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种在肝癌组织中具有表达差异的人蛋白多肽的制备方法,其特征在于,该方法包含:
(a)在适合表达在肝癌组织中具有表达差异的人蛋白的条件下,培养权利要求7所述的宿主细胞;
(b)从培养物中分离出在肝癌组织中具有表达差异的人蛋白多肽。
9.一种能与权利要求1所述的在肝癌组织中具有表达差异的人蛋白特异性结合的抗体。
10.一种核酸分子,它含有权利要求3所述的多核苷酸中连续的10-800个核苷酸。
CNB001166166A 2000-06-20 2000-06-20 在肝癌组织中具有表达差异的新的人蛋白及其编码序列 Expired - Fee Related CN1177864C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB001166166A CN1177864C (zh) 2000-06-20 2000-06-20 在肝癌组织中具有表达差异的新的人蛋白及其编码序列

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB001166166A CN1177864C (zh) 2000-06-20 2000-06-20 在肝癌组织中具有表达差异的新的人蛋白及其编码序列

Publications (2)

Publication Number Publication Date
CN1329064A true CN1329064A (zh) 2002-01-02
CN1177864C CN1177864C (zh) 2004-12-01

Family

ID=4586018

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB001166166A Expired - Fee Related CN1177864C (zh) 2000-06-20 2000-06-20 在肝癌组织中具有表达差异的新的人蛋白及其编码序列

Country Status (1)

Country Link
CN (1) CN1177864C (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009522579A (ja) * 2006-01-05 2009-06-11 イミューン ディズィーズ インスティテュート インコーポレイテッド Nfatの制御因子
US9271997B2 (en) 2009-10-08 2016-03-01 The Children's Hospital Corporation Regulators of NFAT and/or store-operated calcium entry
US9567580B2 (en) 2010-10-08 2017-02-14 Anjana Rao Regulators of NFAT and/or store-operated calcium entry

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009522579A (ja) * 2006-01-05 2009-06-11 イミューン ディズィーズ インスティテュート インコーポレイテッド Nfatの制御因子
US8399185B2 (en) 2006-01-05 2013-03-19 Immune Disease Institute, Inc. Regulators of NFAT
JP2014121327A (ja) * 2006-01-05 2014-07-03 Childrens Medical Center Corp Nfatの制御因子
US9163078B2 (en) 2006-01-05 2015-10-20 Children's Medical Center Corporation Regulators of NFAT
US9932378B2 (en) 2006-01-05 2018-04-03 Children's Medical Center Corporation Regulators of NFAT
US9271997B2 (en) 2009-10-08 2016-03-01 The Children's Hospital Corporation Regulators of NFAT and/or store-operated calcium entry
US9567580B2 (en) 2010-10-08 2017-02-14 Anjana Rao Regulators of NFAT and/or store-operated calcium entry

Also Published As

Publication number Publication date
CN1177864C (zh) 2004-12-01

Similar Documents

Publication Publication Date Title
CN1048731C (zh) 编码细胞因子抑制性抗炎药物结合蛋白质的多核苷酸
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1177864C (zh) 在肝癌组织中具有表达差异的新的人蛋白及其编码序列
CN1160370C (zh) 新的人细胞周期控制相关蛋白及其编码序列
CN1170848C (zh) 新的人肝癌相关蛋白及其编码序列
CN1303102C (zh) 利用人和鼠Rhor基因及其编码产物诊断和治疗秃发的方法
CN1169954C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1169958C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199998C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1194010C (zh) 具有抑制癌细胞生长功能的人蛋白及基编码序列
CN1199997C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1177048C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1194989C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1170844C (zh) 人长寿保障蛋白和编码序列及其用途
CN1166686C (zh) 具有抑制癌细胞生长功能的人蛋白及其编码序列
CN1155615C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1193040C (zh) 具有抑制癌细胞生长功能的人蛋白及其编码序列
CN1169955C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1169957C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1155613C (zh) 人类17号染色体短臂1区3带3亚带区域内人肿瘤相关基因和编码蛋白
CN1190446C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1209372C (zh) 人类17p13.3区域内人肿瘤相关基因CT120及其编码蛋白
CN1169833C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1199999C (zh) 具有促进3t3细胞转化功能的新的人蛋白及其编码序列
CN1199994C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee