CN1403476A - 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 - Google Patents
具有促进3t3细胞转化功能的新的人蛋白及其编码序列 Download PDFInfo
- Publication number
- CN1403476A CN1403476A CN01126724A CN01126724A CN1403476A CN 1403476 A CN1403476 A CN 1403476A CN 01126724 A CN01126724 A CN 01126724A CN 01126724 A CN01126724 A CN 01126724A CN 1403476 A CN1403476 A CN 1403476A
- Authority
- CN
- China
- Prior art keywords
- ctg
- pro
- ccc
- cct
- leu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明公开了一类新的具有促进3T3细胞转化功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有促进3T3细胞转化功能的人蛋白的多核苷酸的用途。
Description
技术领域
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有促进3T3细胞转化功能的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
背景技术
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究与癌细胞生长相关的人蛋白及其激动剂/抑制剂。
发明内容
本发明的目的是提供一类新的具有促进3T3细胞转化功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有促进3T3细胞转化功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有促进3T3细胞转化功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有促进3T3细胞转化功能的蛋白活性的多肽的制备方法,该方法包含:(a)在适合表达具有促进3T3细胞转化功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有促进3T3细胞转化功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有促进3T3细胞转化功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有促进3T3细胞转化功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可用于促进细胞的生长。本发明还提供了一种药物组合物,它含有安全有效量的针对本发明的具有促进3T3细胞转化功能的蛋白多肽的拮抗剂(如抗体)以及药学上可接受的载体。该药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
具体实施方式
3T3细胞是一种小鼠成纤维细胞(J.Cell.Biol.,17:299,1963)(也称为NIH/3T3细胞)。在癌症研究领域中,常将外源基因(尤其是人基因)引入3T3细胞,观察其对3T3细胞生长的影响情况。通常认为,对3T3细胞生长(或恶性转化)有影响的基因是癌症相关基因,其中对3T3细胞生长或转化有抑制作用的基因大多是抑癌基因,而对3T3细胞生长或转化有促进作用的基因大多是(原)癌基因。
本发明采用大规模cDNA克隆转染小鼠胚胎成纤维细胞3T3,在获得具有促进生长作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有促进3T3细胞转化功能的蛋白对3T3细胞具有促进克隆形成的作用,其促进率≥50%。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有促进3T3细胞转化功能的蛋白或多肽”是指具有促进3T3细胞转化功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有促进3T3细胞转化功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有促进3T3细胞转化功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有促进3T3细胞转化功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP2121蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”对于PP2121而言是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3所示的编码区序列有差别的核酸序列。再以PP7706蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”对于PP7706而言是指编码具有SEQ ID NO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对于本发明其他具有促进3T3细胞转化功能的蛋白,依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO:2所示的成熟多肽(以PP2121蛋白为例)有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有促进3T3细胞转化功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有促进3T3细胞转化功能的蛋白的特异DNA片段序列产生也能用下列方法获得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring HarborLaboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有促进3T3细胞转化功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有促进3T3细胞转化功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al. Science 1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明多核苷酸的载体,以及用本发明的载体或具有促进3T3细胞转化功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有促进3T3细胞转化功能的蛋白多肽。一般来说有以下步骤:
(1).用本发明的编码具有促进3T3细胞转化功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有促进3T3细胞转化功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有促进3T3细胞转化功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的1ac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、早期和晚期SV40启动子和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有促进3T3细胞转化功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于):直接做为药物治疗具有促进3T3细胞转化功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有促进3T3细胞转化功能的蛋白功能的抗体、多肽或其它配体。例如,该抗体可用于治疗癌症或细胞异常增殖。用重组表达的本发明蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有促进3T3细胞转化功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有促进3T3细胞转化功能的人蛋白的药剂的方法。激动剂提高具有促进3T3细胞转化功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。
具有促进3T3细胞转化功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有促进3T3细胞转化功能的人蛋白的拮抗剂可以与具有促进3T3细胞转化功能的人蛋白结合并消除其功能,或是抑制具有促进3T3细胞转化功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有促进3T3细胞转化功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有促进3T3细胞转化功能的蛋白加入生物分析测定中,通过测定化合物影响具有促进3T3细胞转化功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明蛋白的拮抗剂可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有促进3T3细胞转化功能的蛋白或其特异性抗体,可按有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有促进3T3细胞转化功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有促进3T3细胞转化功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有促进3T3细胞转化功能的蛋白的无表达或异常/无活性的具有促进3T3细胞转化功能的蛋白的表达所致的细胞发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有促进3T3细胞转化功能的蛋白,以抑制内源性的具有促进3T3细胞转化功能的蛋白活性。例如,一种变异的具有促进3T3细胞转化功能的蛋白可以是缩短的、缺失了信号传导功能域的具有促进3T3细胞转化功能的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有促进3T3细胞转化功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有促进3T3细胞转化功能的蛋白基因转移至细胞内。构建携带具有促进3T3细胞转化功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有促进3T3细胞转化功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有促进3T3细胞转化功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。由于本发明蛋白具有促进3T3细胞转化的功能,因此本发明蛋白编码序列的反义序列,可被引入细胞以抑制细胞的异常增殖(如癌变)。
本发明还提供了针对具有促进3T3细胞转化功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗具有促进3T3细胞转化功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有促进3T3细胞转化功能的人蛋白。
与具有促进3T3细胞转化功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有促进3T3细胞转化功能的人蛋白相关的疾病。给予适当剂量的抗体可以阻断具有促进3T3细胞转化功能的人蛋白的产生或活性,从而抑制癌细胞的生长和/或细胞的异常增殖。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有促进3T3细胞转化功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭有关的阳性细胞(如癌细胞)。
多克隆抗体的生产可用具有促进3T3细胞转化功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有促进3T3细胞转化功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler andMilstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.Pat No.4946778)也可用于生产抗具有促进3T3细胞转化功能的人蛋白的单链抗体。
能与具有促进3T3细胞转化功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有促进3T3细胞转化功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有促进3T3细胞转化功能的人蛋白水平的诊断试验方法。这些试验为本领域所熟知,且包括FISH测定和放射免疫测定。试验中所检测的具有促进3T3细胞转化功能的蛋白水平,可以用作解释具有促进3T3细胞转化功能的蛋白在各种疾病中的重要性和用于诊断具有促进3T3细胞转化功能的蛋白起作用的疾病。
具有促进3T3细胞转化功能的蛋白的多聚核苷酸可用于具有促进3T3细胞转化功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有促进3T3细胞转化功能的蛋白的多聚核苷酸可用于检测具有促进3T3细胞转化功能的蛋白的表达与否或在疾病状态下具有促进3T3细胞转化功能的蛋白的异常表达。如具有促进3T3细胞转化功能的蛋白DNA序列可用于对活检标本的杂交以判断具有促进3T3细胞转化功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(即基因芯片)上,用于分析组织中基因的差异表达分析和基因诊断。用具有促进3T3细胞转化功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有促进3T3细胞转化功能的蛋白的转录产物。
检测具有促进3T3细胞转化功能的蛋白基因的突变也可用于诊断具有促进3T3细胞转化功能的蛋白相关的疾病。具有促进3T3细胞转化功能的蛋白突变的形式包括与正常野生型具有促进3T3细胞转化功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而现在只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。
本发明的具有促进3T3细胞转化功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有促进3T3细胞转化功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。注意,在核苷酸和氨基酸组合序列中,(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿。
实施例1:cDNA基因的获得及对小鼠NIH/3T3细胞克隆形成的促进作用
PP2121、PP7706、PP10484、PP10566、PP10631、PP10752、PP10881、PP10897、PP10933、PP11246、PP11347和PP11517是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、9月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-scriptTMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染小鼠NIH/3T3细胞。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的小鼠NIH/3T3细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克隆形成,计数。发现上述克隆有促进细胞克隆形成作用,结果如下表所示。
cDNA克隆转染细胞(3T3)克隆形成情况
cDNA克隆名称 | cDNA克隆数(三个重复) | 空载体克隆数(三个重复) | ||||
PP2121 | 70 | 76 | 69 | 13 | 12 | 15 |
PP7706 | 28 | 25 | 20 | 13 | 12 | 15 |
PP10484 | 17 | 31 | 34 | 13 | 12 | 15 |
PP10566 | 29 | 32 | 27 | 13 | 12 | 15 |
PP10631 | 27 | 29 | 22 | 13 | 12 | 15 |
PP10752 | 27 | 24 | 21 | 13 | 12 | 15 |
PP10881 | 30 | 25 | 20 | 13 | 12 | 15 |
PP10897 | 43 | 42 | 45 | 13 | 12 | 15 |
PP10933 | 37 | 35 | 30 | 13 | 12 | 15 |
PP11246 | 38 | 40 | 38 | 13 | 12 | 15 |
PP11347 | 47 | 48 | 46 | 13 | 12 | 15 |
PP11517 | 35 | 39 | 38 | 13 | 12 | 15 |
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、16、19、22、25、28、31、34)。
实施例2:从胎盘cDNA中PCR获得全长基因和重组蛋白表达
取3、6、9月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的特异引物(如下表所示),按97℃3’1个循环。94℃30″60℃30″72℃1’35个循环,72℃10’1个循环进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,获得重组蛋白(SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35)。
基因特异引物
实施例3:cDNA克隆序列分析1.PP2121A:核苷酸序列(SEQ ID NO:1)长度:2244个碱基
克隆名称 | 特异引物1(5’→3’) | 特异引物2(5’→3’) |
PP2121 | (193)CAAGGTGGGCAAGTTCGT | TGGGAGGTGGAGAAGATTTGG(2181) |
PP7706 | (67)AATGGATGACCCTCCAATAT | GTGTCCTTCGACGGAACA(2744) |
PP10484 | (478)ATTTGGTTGGACCTTGCG | TCCCTTGACTTCTGAGTTCC(1501) |
PP10566 | (40)AGCTACCACTCAGCACCATG | TCTCCTAGACCTGACCGACC(2418) |
PP10631 | (15)GGACGAAGCCGGAGTGTA | AAGACGGAAGGAGAACCC(1783) |
PP10752 | (148)TGACCCAGTTGTGGTTGATG | TGCAGGAGGTGGCCTTTC(1179) |
PP10881 | (765)ATTCTTTGAAATTAGGGTGC | GTGTCGCTCTGAGGGAGA(2077) |
PP10897 | (308)TAGTGGCCTAGCTGGGTA | CCTCTTAGCGAACTTGGG(2261) |
PP10933 | (371)GTAGTCTGGGTTGGAGGAGG | CCGATGCGTACAGGAGCT(1470) |
PP11246 | (109)GGGGACATGGGCATTTGG | CTAGCACGGTGACATGAGGT(2011) |
PP11347 | (733)GGGTGAGGTAAGCAACGC | ATGACCGATGAACCCTCCG(2310) |
PP11517 | (240)CAACCAACTGGACCGCATCA | AACTAACGAGGGAGGAGCC(2011) |
1 CTTGGGGACC CAGGGCCGGC TGAGCCGCAC GCTGCCAGCC AGCGCGGAGG AGCGCGATCG
61 GCTGCTGCGC CGCATGGAGA GCATGCGCAA GGAGAAGCGC GTGTACAGCC GCTTCGAGGT
121 CTTCTGCAAG AAAGAGGAGG CCAGCAGCCC TGGGGCAGGG GAAGGCCCCG CGGAGGAGGG
181 CACCAGGGAC AGCAAGGTGG GCAAGTTCGT GCCCAAGATC CTGGGCACGT TCAAAAGCAA
241 GAAGTGAGTC TTCTGGCCTG GCAACCCAGG CCAGGGTGCC CGCATCGCTG CCCCGGTCAT
301 CCAGAAGCCC CGCGGAACAG AGAGCCCTGC TCATGTGCTT GAGCAGCGGC TGTCAGGCCA
361 CGGCCGCTTG GGGCTTGGCT GAGTGCGCCA GACCTCGGCT CCACTGGAGG CTCACCTGGC
421 AGCTGCCGTC TCTGCCCCCT GGCCTCCCCA ACGCTGGGGC TGCACCCCTC GCCACCAGTG
481 CCTTTCTCCC CTCAGCACCT TCATCTCTGC ACCGTCAGCC TTGCGTGGCG CAGCGTCTGG
541 CTCCGCCATC TCTTTGTGCC TCAGTCCCCC CGGCCCCCTT TATTTTTTTG AGACCTAGGG
601 CTGGAGTGCA GTTGAGCGGT CTGGGCTCAC TGCAACCTCT GCCTCCCGGG TTCCAGCGAT
661 TCTCCTGCCT CAGCCTCCTG AGTAGCTGGG ATTACAGATG TATGCTACCA CGCCCAGGTA
721 GTTTTTGTAT TTTTAGTAGA GACAGGGTTT CACTATGTTG GCCAGGCTGG TCTCCAACTC
781 CTGGCCTCAA ATGATCAGCC CGCTTCAGCC TCCCAAAGTG GGGGGATTAC AGGCGTGAGC 841 CTTGCACCCC GCTAAGTCCC CTATCCTCTT GCAAGGGTCT CGCCTCTGTG CCTCAATTCC901 TCATTCTCTG GGCCCTTCTC CTCCTCAGGG CCTCCTGTTC TCAGGGCCTC CCCCCTCCCC961 GCTCCCTCCC TCTCTCAAGG TCTCCTCCTT CCCTCCCCCC CCCGTCTCCC CCCTCCCCCG1021 CCTGGGCTTC ACTTCCTTTC CTACTTGGAT TCTCCTGCTC GCTGCCTCCC AGCATCTTTT1081 TTGGAGGCCC GTCTCTTGCT GTGGGGAAGA CTGGGCTGGC TGCGGGCAGT TTGCAAGGGG1141 TGGGTGGGGC GGGGGGGGGA GCTGGACCAG AAGATGCCCC TTGGAGTGGC AAGGAAGCTG1201 GACAGGGCAG GCCTCTGGGG ACGGGACACA GGGAAGCCCG AAGGGGCGCC TTGGCCAGGT1261 CTGCCATCTC CTCCAGCGAG GCTCTGGCCA GCACTGGGTG AGAGTGGGGA GGGGGCACTG1321 GCCTTTGCAG CACAGTAAAA CATGGTCCAG ACAACCTGTG GCCCCGGCCT CATGAGCACC1381 CCCTGCACAG GCCCGGCCCA AGCCAGGCGC TAGAAGGGCT GGTTGTGGAG TGCTTATCCT1441 TGACAGGTAT GGGGCCAGGT GAGGGCAGGG GACAAGGTGC AGCTGAGGCC GAGCCCAACT1501 AGGTCCTGGG CACCCCTGCA GGTGGGAGTG GTCCTTGTCC TCCTGGTATC CAGCAGACAC1561 CCCCCTCTCC CCACCAGCCC CATTCTCAGG TCCTTTCCTC TTTGTCACCA ACACCAAGAA1621 TCTGTCCAGG GTTCTTGGCT TATCTTTTAT CTCTTTTCAC TCCTAGAGAG GAATTGCAAT1681 TGACTCAGAA TGACACATTT TTGGCACCAC GTGTGTAGAA AGCCCCCACT GTTAGATGAT1741 AGCCTCGTGA AATTCATGTT TCTGTATTCT CCTATTTCTT TTCAAAAACT AATTTTTTTT1801 TTAGTGTAAT AAATCCTAAG AGGGAACTGA TTTAAGAAAC AAGGCCGCCA AACAAAGGCA1861 GCAGTTCCGA CTCCAGCAGC TGGGAAAGGA AGGAAAGTGA CCCCACTTTC ACTCCTGCAC1921 AGCCCACTGG TTACCAAAAC CACCGTGCAA GTCGGGATGA CAGCAGGGAC TTCTGGCCAG1981 GTGGGAAAAG GTGCCTGGAA GCGGGATGCG CCTGTGCGTC TCTTGGCCAT GATGTTCTTG2041 TGGGCATGTT ATTCTTGGTG CTGCCTGGGG TGTTGCTGAG CGGACAGGCT CTCCAGCTGG2101 AGTCCATGGA GAGGCCAGAG GCTGGCGGCC CTGCCTGGGC CTTCGGAGCC TCCTGCCTGC2161 ACCCTCCACC TCTTCTAAAC CATGATGTGG CACATTTTGG TGTTAATAAA ACACAACACA2221 CAAAGTAAAA AAAAAAAAAA AAAAB:核苷酸序列(SEQ ID NO:2)长度:153个氨基酸
1 MCLSSGCQAT AAWGLAECAR PRLHWRLTWQ LPSLPPGLPN AGAAPLATSA FLPSAPSSLH
61 RQPCVAQRLA PPSLCASVPP APFIFLRPRA GVQLSGLGSL QPLPPGFQRF SCLSLLSSWD
121 YRCMLPRPGS FCIFSRDRVS LCWPGWSPTP GLKC.核苷酸及氨基酸组合序列(SEQ ID NO:3)克隆号:PP2121起始编码子:333 ATG 终止编码子:792 TGA 蛋白质分子量:16448.31(注:(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿)1 CT TGG GGA CCC AGG GCC GGC TGA GCC GCA CGC TGC CAG CCA GCG CGG 4748 AGG AGC GCG ATC GGC TGC TGC GCC GCA TGG AGA GCA TGC GCA AGG AGA 9596 AGC GCG TGT ACA GCC GCT TCG AGG TCT TCT GCA AGA AAG AGG AGG CCA 143144 GCA GCC CTG GGG CAG GGG AAG GCC CCG CGG AGG AGG GCA CCA GGG ACA 191192 GCA AGG TGG GCA AGT TCG TGC CCA AGA TCC TGG GCA CGT TCA AAA GCA 239240 AGA AGT GAG TCT TCT GGC CTG GCA ACC CAG GCC AGG GTG CCC GCA TCG 287288 CTG CCC CGG TCA TCC AGA AGC CCC GCG GAA CAG AGA GCC CTG CTC ATG 3351 Met 1336 TGC TTG AGC AGC GGC TGT CAG GCC ACG GCC GCT TGG GGC TTG GCT GAG 3832 Cys Leu Ser Ser Gly Cys Gln Ala Thr Ala Ala Trp Gly Leu Ala Glu 17384 TGC GCC AGA CCT CGG CTC CAC TGG AGG CTC ACC TGG CAG CTG CCG TCT 43118 Cys Ala Arg Pro Arg Leu His Trp Arg Leu Thr Trp Gln Leu Pro Ser 33432 CTG CCC CCT GGC CTC CCC AAC GCT GGG GCT GCA CCC CTC GCC ACC AGT 47934 Leu Pro Pro Gly Leu Pro Asn Ala Gly Ala Ala Pro Leu Ala Thr Ser 49480 GCC TTT CTC CCC TCA GCA CCT TCA TCT CTG CAC CGT CAG CCT TGC GTG 52750 Ala Phe Leu Pro Ser Ala Pro Ser Ser Leu His Arg Gln Pro Cys Val 65 528 GCG CAG CGT CTG GCT CCG CCA TCT CTT TGT GCC TCA GTC CCC CCG GCC 57566 Ala Gln Arg Leu Ala Pro Pro Ser Leu Cys Ala Ser Val Pro Pro Ala 81576 CCC TTT ATT TTT TTG AGA CCT AGG GCT GGA GTG CAG TTG AGC GGT CTG 62382 Pro Phe Ile Phe Leu Arg Pro Arg Ala Gly Val Gln Leu Ser Gly Leu 97624 GGC TCA CTG CAA CCT CTG CCT CCC GGG TTC CAG CGA TTC TCC TGC CTC 67198 Gly Ser Leu Gln Pro Leu Pro Pro Gly Phe Gln Arg Phe Ser Cys Leu 113672 AGC CTC CTG AGT AGC TGG GAT TAC AGA TGT ATG CTA CCA CGC CCA GGT 719114 Ser Leu Leu Ser Ser Trp Asp Tyr Arg Cys Met Leu Pro Arg Pro Gly 129720 AGT TTT TGT ATT TTT AGT AGA GAC AGG GTT TCA CTA TGT TGG CCA GGC 767130 Ser Phe Cys Ile Phe Ser Arg Asp Arg Val Ser Leu Cys Trp Pro Gly 145768 TGG TCT CCA ACT CCT GGC CTC AAA TGA TCA GCC CGC TTC AGC CTC CCA 815146 Trp Ser Pro Thr Pro Gly Leu Lys *** 154816 AAG TGG GGG GAT TAC AGG CGT GAG CCT TGC ACC CCG CTA AGT CCC CTA 863864 TCC TCT TGC AAG GGT CTC GCC TCT GTG CCT CAA TTC CTC ATT CTC TGG 911912 GCC CTT CTC CTC CTC AGG GCC TCC TGT TCT CAG GGC CTC CCC CCT CCC 959960 CGC TCC CTC CCT CTC TCA AGG TCT CCT CCT TCC CTC CCC CCC CCG TCT 10071008 CCC CCC TCC CCC GCC TGG GCT TCA CTT CCT TTC CTA CTT GGA TTC TCC 10551056 TGC TCG CTG CCT CCC AGC ATC TTT TTT GGA GGC CCG TCT CTT GCT GTG 11031104 GGG AAG ACT GGG CTG GCT GCG GGC AGT TTG CAA GGG GTG GGT GGG GCG 11511152 GGG GGG GGA GCT GGA CCA GAA GAT GCC CCT TGG AGT GGC AAG GAA GCT 11991200 GGA CAG GGC AGG CCT CTG GGG ACG GGA CAC AGG GAA GCC CGA AGG GGC 12471248 GCC TTG GCC AGG TCT GCC ATC TCC TCC AGC GAG GCT CTG GCC AGC ACT 12951296 GGG TGA GAG TGG GGA GGG GGC ACT GGC CTT TGC AGC ACA GTA AAA CAT 13431344 GGT CCA GAC AAC CTG TGG CCC CGG CCT CAT GAG CAC CCC CTG CAC AGG 13911392 CCC GGC CCA AGC CAG GCG CTA GAA GGG CTG GTT GTG GAG TGC TTA TCC 14391440 TTG ACA GGT ATG GGG CCA GGT GAG GGC AGG GGA CAA GGT GCA GCT GAG 14871488 GCC GAG CCC AAC TAG GTC CTG GGC ACC CCT GCA GGT GGG AGT GGT CCT 15351536 TGT CCT CCT GGT ATC CAG CAG ACA CCC CCC TCT CCC CAC CAG CCC CAT 15831584 TCT CAG GTC CTT TCC TCT TTG TCA CCA ACA CCA AGA ATC TGT CCA GGG 16311632 TTC TTG GCT TAT CTT TTA TCT CTT TTC ACT CCT AGA GAG GAA TTG CAA 16791680 TTG ACT CAG AAT GAC ACA TTT TTG GCA CCA CGT GTG TAG AAA GCC CCC 17271728 ACT GTT AGA TGA TAG CCT CGT GAA ATT CAT GTT TCT GTA TTC TCC TAT 17751776 TTC TTT TCA AAA ACT AAT TTT TTT TTT AGT GTA ATA AAT CCT AAG AGG 18231824 GAA CTG ATT TAA GAA ACA AGG CCG CCA AAC AAA GGC AGC AGT TCC GAC 18711872 TCC AGC AGC TGG GAA AGG AAG GAA AGT GAC CCC ACT TTC ACT CCT GCA 19191920 CAG CCC ACT GGT TAC CAA AAC CAC CGT GCA AGT CGG GAT GAC AGC AGG 19671968 GAC TTC TGG CCA GGT GGG AAA AGG TGC CTG GAA GCG GGA TGC GCC TGT 20152016 GCG TCT CTT GGC CAT GAT GTT CTT GTG GGC ATG TTA TTC TTG GTG CTG 20632064 CCT GGG GTG TTG CTG AGC GGA CAG GCT CTC CAG CTG GAG TCC ATG GAG 21112112 AGG CCA GAG GCT GGC GGC CCT GCC TGG GCC TTC GGA GCC TCC TGC CTG 21592160 CAC CCT CCA CCT CTT CTA AAC CAT GAT GTG GCA CAT TTT GGT GTT AAT 22072208 AAA ACA CAA CAC ACA AAG TAA AAA AAA AAA AAA AAA A 22442.PP7706A:核苷酸序列(SEQ ID NO:4)长度:2929个碱基1 GGAGAGAGAG AGCACTAGTC TCGCGTTTTT TTTTTTTTTT TTTGACAACT TGCTCTTTTA61 ATGTGGAATG GATGACCCTC CAATATTTCC CCAGAGCACC CCATGCTCTT CTATCAGGGA121 ACTTATTAAA ATCATGTAAC ATGTTTCTTG GTGACAAGAT TTAGGTCTTT TGTTTCTGTA181 ACACATGCCA GATACTTAGC CCGGTATCTG GCATGTGGCA TGCCCAGTAA ATGTTTGCTG 241 AATAAGTGAA TCTATGTCTC TTGCTTGCCG CTATTTGCCC ACTGAATCCA TGAAGTGAGT301 TTTCATAATG ATTACCACTG AAAATTCAAC CCTGAAAAGA ATGTCTTCGG TTGTGGGCCC361 ATAAAGTCTT AGAAATAGTG AAGCTCCTAC TGTCAGTCCT TGAAAGGGAA CAGGACAGCT421 GCTGTATGCC TTGAGAATGG GCAAAAGACA AGCGACAAAA AGAGCAGCGA AGGCACCTAC481 TTGTCCCTCT GGGCCAGGGC CTCAGTGTAT TGGTCGGGCT TGACCTGGTC TCCTGGTACA541 TCTTCCCAGT TTTTGGTGAC TCCCTTCAGT TTCTCTGAGA GCTCCAGGTT ACACTCCTTC601 TCTGCTTCCA CCAGAGCTGC CATCCGCGCA GCTTCATTCT TTGCTAGCCT GGATTCCTCC661 TGCAGAAGCT GGATCTTATT CTCCAAGAGC TCATAAACAT GCTCCGTCTC CTGCTGTCGC721 TCCTCAAACT GGCGTCGGAG CTCAGCTTCA TTCTGACTGT TGAGATTCTC CACATCAGCC781 CATGTTTTAT CCAGATGCTG TTTCTTGTCC TGGAGTTCTC GTTTCAAGCT CTCCACTTCA841 ACCTTCAGCT CAGTGTTCCG CTTGTAGATG TCCTCCCGGC TGGCCTCATA CTTCTGTTGC901 ATGCGCTCCT CCAGGAAGTA GATGAGCAGC TTGAGGCTGA AGTTCTCCTT CTTCAGGTCA961 TTGAGGTGCT TCTCAAAGTC TCGAAGAGCC TGGGTCTGTA CCTGAGGGGG TTTCTCAAAT1021 GCTCTCAAGG AATATGTCTG CACAAACGGG ACCTTTTCAC CACTTCTCCA GATCTGTGAC1081 TGCACTGGAG GGCCTCGATC TTTAGTGTCA CTAAGAAAAG CTGCTGTGTG ACTCGTTCTG1141 GGTACCATCT CCCCATCATC CTCTGCAAAA TAATCTCTCG TCCAGGTCTG CTCCATTTTC1201 CAGGCTCTTT CCTTAGTCTC AGGACGCTCC TCACCCGGGA GGGGAAGCAG CCTGGGAAAA1261 TGAGAAGCCT TGCCCACGAA TCTCCAGCGC AAAAGGCAGC AGCTTTTTCC TCCCCAGCTC1321 CTTTCTGCGT CGGCGGCGAA GAGAGAGCTC TGCTCCCTCG GGAAAGTTTC TTTGGAGGTC1381 CGGCCCGGAG CGGCCATGTC CCACGGCCCC AAGCAGCCCG GCGCGGCCGC CGCGCCGGCG1441 GGCGGCAAGG CTCCGGGCCA GCATGGGGGC TTCGTGGTGA CTGTCAAGCA AGAGCGCGGC1501 GAGGGTCCAC GCGCGGGCGA GAAGGGGTCC CACGAGGAGG AGCCGGTGAA GAAACGCGGC1561 TGGCCCAAGG GCAAGAAGCG GAAGAAGATT CTGCCGAATG GGCCCAAGGC ACCGGTCACG1621 GGCTACGTGC GCTTCCTGAA CGAGCGGCGC GAGCAGATCC GCACGCGCCA CCCGGATCTG1681 CCCTTTCCCG AGATCACCAA GATGCTGGGC GCCGAGTGGA GCAAGCTGCA GCCAACGGAA1741 AAGCAGCGGT ACCTGGATGA GGCCGAGAGA GAGAAGCAGC AGTACATGAA GGAGCTGCGG1801 GCGTACCAGC AGTCTGAAGC CTATAAGATG TGCACGGAGA AGATCCAGGA GAAGAAGATC1861 AAGAAAGAAG ACTCGAGCTC TGGGCTCATG AACACTCTCC TGAATGGACA CAAGGGTGGG1921 GACTGCGATG GCTTCTCCAC CTTCGATGTT CCCATCTTCA CTGAAGAGTT CTTGGACCAA1981 AACAAAGCGC GTGAGGCGGA GCTTCGGCGC TTCGGAAGAT GAATGTGGCC TTCGAGGAGC2041 AGAACGCGGT ACTGCAGAGG CACACGCAGA GCATGAGCAG CGCGCGCGAG CGTCTGGAGC2101 AGGACGTGGC GCTGGAGGAG CGGAGGACGC TGGCGCTGCA GCAGCAGCTC CAGGCCGTGC2161 GCCAGGCGCT CACCGCCAGC TTCGCCTCAC TGCCGGTGCC GGGCACGGGC GAAACGCCCA2221 CGCTGGGCAC TCTGGACTTC TACATGGCCC GGCTTCACGG AGCCATCGAG CGCGACCCCG2281 CCCAGCACGA GAAGCTCATC GTCCGCATCA AGGAAATCCT GGCCCAGGTC GCCAGCGAGC2341 ACCTGTGAGG AGTGGGCGGG CCCACGATGC AGAGGAGAAG CTGTGGGCGC GGCCCTGCCA2401 CACCCCACCC CGTGGACGAG AGGCTGGGGG TCCACCTTTG GGGCCTGGTC CCATCCTGCA2461 CCTTGGGGGC TCCAGCCCCC CTAAAATTAA ATTTCTGCAG CATCCCTTTA GCTTTCAATC2521 TCCCCAGCCC CCTGAACCCG GAAAAAGCAC CGTGCGCGAT ACACCCAGAA GAACCTCACA2581 GCCGAGGGTG CCCCTCCTCG GAGGACAAGC CACGCGCTAC ACTGGCTCTC CGGGCCACCC2641 CCAGGACACA GGGCAGACGA AACCCACCCC CAGCACACGG CAGGACCCCC CAAATTACTC2701 ACTACGGGGG GCTGTGCCAT AGGCCACACA GGAAGCTGCC TTGTGGGGAC TTACCTGGGG2761 TGTCCCCCGC ATGCCTGTAC CCCAGATGGG TGGGGGCCGG CTTTGCCCAT CCTGCTCTCC2821 TCCAGCCGAG GGACCCTGGT GGGGGTGGCT CCTTCTCACT GCTGGATCCG GACTTTTTAA2881 ATAAAAACAA GTAAAATTTG TGTTTTAAAA AAAAAAAAAA AAAAAAAAAB:核苷酸序列(SEQ ID NO:5)长度:272个氨基酸1 MDTRVGTAMA SPPSMFPSSL KSSWTKTKRV RRSFGASEDE CGLRGAERGT AEAHAEHEQR61 ARASGAGRGA GGAEDAGAAA AAPGRAPGAH RQLRLTAGAG HGRNAHAGHS GLLHGPASRS121 HRARPRPARE AHRPHQGNPG PGRQRAPVRS GRAHDAEEKL WARPCHTPPR GREAGGPPLG181 PGPILHLGGS SPPKIKFLQH PFSFQSPQPP EPGKSTVRDT PRRTSQPRVP LLGGQATRYT
241 GSPGHPQDTG QTKPTPSTRQ DPPNYSLRGA VPC.核苷酸及氨基酸组合序列(SEQ ID NO:6)克隆号:PP7706起始编码子:1904 ATG 终止编码子:2720 TAG 蛋白质分子量:28556.181 G GAG AGA GAG AGC ACT AGT CTC GCG TTT TTT TTT TTT TTT TTT GAC 4647 AAC TTG CTC TTT TAA TGT GGA ATG GAT GAC CCT CCA ATA TTT CCC CAG 9495 AGC ACC CCA TGC TCT TCT ATC AGG GAA CTT ATT AAA ATC ATG TAA CAT 142143 GTT TCT TGG TGA CAA GAT TTA GGT CTT TTG TTT CTG TAA CAC ATG CCA 190191 GAT ACT TAG CCC GGT ATC TGG CAT GTG GCA TGC CCA GTA AAT GTT TGC 238239 TGA ATA AGT GAA TCT ATG TCT CTT GCT TGC CGC TAT TTG CCC ACT GAA 286287 TCC ATG AAG TGA GTT TTC ATA ATG ATT ACC ACT GAA AAT TCA ACC CTG 334335 AAA AGA ATG TCT TCG GTT GTG GGC CCA TAA AGT CTT AGA AAT AGT GAA 382383 GCT CCT ACT GTC AGT CCT TGA AAG GGA ACA GGA CAG CTG CTG TAT GCC 430431 TTG AGA ATG GGC AAA AGA CAA GCG ACA AAA AGA GCA GCG AAG GCA CCT 478479 ACT TGT CCC TCT GGG CCA GGG CCT CAG TGT ATT GGT CGG GCT TGA CCT 526527 GGT CTC CTG GTA CAT CTT CCC AGT TTT TGG TGA CTC CCT TCA GTT TCT 574575 CTG AGA GCT CCA GGT TAC ACT CCT TCT CTG CTT CCA CCA GAG CTG CCA 622623 TCC GCG CAG CTT CAT TCT TTG CTA GCC TGG ATT CCT CCT GCA GAA GCT 670671 GGA TCT TAT TCT CCA AGA GCT CAT AAA CAT GCT CCG TCT CCT GCT GTC 718719 GCT CCT CAA ACT GGC GTC GGA GCT CAG CTT CAT TCT GAC TGT TGA GAT 766767 TCT CCA CAT CAG CCC ATG TTT TAT CCA GAT GCT GTT TCT TGT CCT GGA 814815 GTT CTC GTT TCA AGC TCT CCA CTT CAA CCT TCA GCT CAG TGT TCC GCT 862863 TGT AGA TGT CCT CCC GGC TGG CCT CAT ACT TCT GTT GCA TGC GCT CCT 910911 CCA GGA AGT AGA TGA GCA GCT TGA GGC TGA AGT TCT CCT TCT TCA GGT 958959 CAT TGA GGT GCT TCT CAA AGT CTC GAA GAG CCT GGG TCT GTA CCT GAG 10061007 GGG GTT TCT CAA ATG CTC TCA AGG AAT ATG TCT GCA CAA ACG GGA CCT 10541055 TTT CAC CAC TTC TCC AGA TCT GTG ACT GCA CTG GAG GGC CTC GAT CTT 11021103 TAG TGT CAC TAA GAA AAG CTG CTG TGT GAC TCG TTC TGG GTA CCA TCT 11501151 CCC CAT CAT CCT CTG CAA AAT AAT CTC TCG TCC AGG TCT GCT CCA TTT 11981199 TCC AGG CTC TTT CCT TAG TCT CAG GAC GCT CCT CAC CCG GGA GGG GAA 12461247 GCA GCC TGG GAA AAT GAG AAG CCT TGC CCA CGA ATC TCC AGC GCA AAA 12941295 GGC AGC AGC TTT TTC CTC CCC AGC TCC TTT CTG CGT CGG CGG CGA AGA 13421343 GAG AGC TCT GCT CCC TCG GGA AAG TTT CTT TGG AGG TCC GGC CCG GAG 13901391 CGG CCA TGT CCC ACG GCC CCA AGC AGC CCG GCG CGG CCG CCG CGC CGG 14381439 CGG GCG GCA AGG CTC CGG GCC AGC ATG GGG GCT TCG TGG TGA CTG TCA 14861487 AGC AAG AGC GCG GCG AGG GTC CAC GCG CGG GCG AGA AGG GGT CCC ACG 15341535 AGG AGG AGC CGG TGA AGA AAC GCG GCT GGC CCA AGG GCA AGA AGC GGA 15821583 AGA AGA TTC TGC CGA ATG GGC CCA AGG CAC CGG TCA CGG GCT ACG TGC 16301631 GCT TCC TGA ACG AGC GGC GCG AGC AGA TCC GCA CGC GCC ACC CGG ATC 16781679 TGC CCT TTC CCG AGA TCA CCA AGA TGC TGG GCG CCG AGT GGA GCA AGC 17261727 TGC AGC CAA CGG AAA AGC AGC GGT ACC TGG ATG AGG CCG AGA GAG AGA 17741775 AGC AGC AGT ACA TGA AGG AGC TGC GGG CGT ACC AGC AGT CTG AAG CCT 18221823 ATA AGA TGT GCA CGG AGA AGA TCC AGG AGA AGA AGA TCA AGA AAG AAG 18701871 ACT CGA GCT CTG GGC TCA TGA ACA CTC TCC TGA ATG GAC ACA AGG GTG 19181 Met Asp Thr Arg Val 51919 GGG ACT GCG ATG GCT TCT CCA CCT TCG ATG TTC CCA TCT TCA CTG AAG 19666 Gly Thr Ala Met Ala Ser Pro Pro Ser Met Phe Pro Ser Ser Leu Lys 211967 AGT TCT TGG ACC AAA ACA AAG CGC GTG AGG CGG AGC TTC GGC GCT TCG 201422 Ser Ser Trp Thr Lys Thr Lys Arg Val Arg Arg Ser Phe Gly Ala Ser 372015 GAA GAT GAA TGT GGC CTT CGA GGA GCA GAA CGC GGT ACT GCA GAG GCA 2062 38 Glu Asp Glu Cys Gly Leu Arg Gly Ala Glu Arg Gly Thr Ala Glu Ala 532063 CAC GCA GAG CAT GAG CAG CGC GCG CGA GCG TCT GGA GCA GGA CGT GGC 211054 His Ala Glu His Glu Gln Arg Ala Arg Ala Ser Gly Ala Gly Arg Gly 692111 GCT GGA GGA GCG GAG GAC GCT GGC GCT GCA GCA GCA GCT CCA GGC CGT 215870 Ala Gly Gly Ala Glu Asp Ala Gly Ala Ala Ala Ala Ala Pro Gly Arg 852159 GCG CCA GGC GCT CAC CGC CAG CTT CGC CTC ACT GCC GGT GCC GGG CAC 220686 Ala Pro Gly Ala His Arg Gln Leu Arg Leu Thr Ala Gly Ala Gly His 1012207 GGG CGA AAC GCC CAC GCT GGG CAC TCT GGA CTT CTA CAT GGC CCG GCT 2254102 Gly Arg Asn Ala His Ala Gly His Ser Gly Leu Leu His Gly Pro Ala 1172255 TCA CGG AGC CAT CGA GCG CGA CCC CGC CCA GCA CGA GAA GCT CAT CGT 2302118 Ser Arg Ser His Arg Ala Arg Pro Arg Pro Ala Arg Glu Ala His Arg 1332303 CCG CAT CAA GGA AAT CCT GGC CCA GGT CGC CAG CGA GCA CCT GTG AGG 2350134 Pro His Gln Gly Asn Pro Gly Pro Gly Arg Gln Arg Ala Pro Val Arg 1492351 AGT GGG CGG GCC CAC GAT GCA GAG GAG AAG CTG TGG GCG CGG CCC TGC 2398150 Ser Gly Arg Ala His Asp Ala Glu Glu Lys Leu Trp Ala Arg Pro Cys 1652399 CAC ACC CCA CCC CGT GGA CGA GAG GCT GGG GGT CCA CCT TTG GGG CCT 2446166 His Thr Pro Pro Arg Gly Arg Glu Ala Gly Gly Pro Pro Leu Gly Pro 1812447 GGT CCC ATC CTG CAC CTT GGG GGC TCC AGC CCC CCT AAA ATT AAA TTT 2494182 Gly Pro Ile Leu His Leu Gly Gly Ser Ser Pro Pro Lys Ile Lys Phe 1972495 CTG CAG CAT CCC TTT AGC TTT CAA TCT CCC CAG CCC CCT GAA CCC GGA 2542198 Leu Gln His Pro Phe Ser Phe Gln Ser Pro Gln Pro Pro Glu Pro Gly 2132543 AAA AGC ACC GTG CGC GAT ACA CCC AGA AGA ACC TCA CAG CCG AGG GTG 2590214 Lys Ser Thr Val Arg Asp Thr Pro Arg Arg Thr Ser Gln Pro Arg Val 2292591 CCC CTC CTC GGA GGA CAA GCC ACG CGC TAC ACT GGC TCT CCG GGC CAC 2638230 Pro Leu Leu Gly Gly Gln Ala Thr Arg Tyr Thr Gly Ser Pro Gly His 2452639 CCC CAG GAC ACA GGG CAG ACG AAA CCC ACC CCC AGC ACA CGG CAG GAC 2686246 Pro Gln Asp Thr Gly Gln Thr Lys Pro Thr Pro Ser Thr Arg Gln Asp 2612687 CCC CCA AAT TAC TCA CTA CGG GGG GCT GTG CCA TAG GCC ACA CAG GAA 2734262 Pro Pro Asn Tyr Ser Leu Arg Gly Ala Val Pro *** 2732735 GCT GCC TTG TGG GGA CTT ACC TGG GGT GTC CCC CGC ATG CCT GTA CCC 27822783 CAG ATG GGT GGG GGC CGG CTT TGC CCA TCC TGC TCT CCT CCA GCC GAG 28302831 GGA CCC TGG TGG GGG TGG CTC CTT CTC ACT GCT GGA TCC GGA CTT TTT 28782879 AAA TAAAAA CAA GTA AAA TTT GTG TTT TAA AAA AAA AAA AAA AAA AAA 29262927 AAA 29293.PPl0484A:核苷酸序列(SEQ ID NO:7)长度:1788个碱基1 GGCTAAATCA TATAACAGGG TCACAGTAAT GGGGGGTTTC AAAGTGGAGA ACCACACGGC61 GTGCCACTGC AGTACTTGGT AAAACATTTA AGATTTGTGA TAATAACAAG TACTGCAGTG121 GCACGCCGGG CCCCCAGAAC CCTATGAAGC CCAGCAGTCT GAGCCAATCG CCTACTTCCG181 GGGCCTACGG CTGGTCATGA GCCACGGCCC ATACATCAAA CTTATTACTG GCTTCCTCTT241 CACCTCCTTG GCTTTCATGC TGGTGGAGGG GAACTTTGTC TTGTTTTGCA CCTACACCTT301 GGGCTTCCGC AATGAATTCC AGAATCTACT CCTGGCCATC ATGGTGAGTG GGACCTGAGC361 AGGGGCGGGC AGCCTGGGCT GAGGTGACAT AGGCTGTGGA ATGGTTCTTG GAATAGGCAG421 AGGATGTTTC TCAGGCTGGC CCAAGGTCAT GAAAGGATGA GGGAGGCTTC TCAGGGTATT481 TGGTTGGACC TTGCGAAGGT AGGACTGTGA AAGAAAGAGT TTGAGGTTAG ATGTTTGAGT541 AGTGAGCACA GCAAAAGCAA GGGCGAGGAC ACCAGGAACT TGGCTCAGAG GTTTGAGAGG 601 GCAGCAGACA AGGTGGGCCT GGACCAGCTC TGAGCTCCCC TGGGGAGCCG TCAAAGGTGC661 CTGTCATCTT CGTTGCTGCC CACATGATGT CATCTGGCTG CTCTTGGGCA GGGCTGGGAG721 CCACTTTGGG GTTCTGGGAA GGGCAGGAGG GGCTCTGTGG CTCTAAAGCA CCTCCCTTTA781 ACCCCCTTTG TCCATCCACA GCTCTCGGCC ACTTTAACCA TTCCCATCTG GCAGTGGTTC841 TTGACCCGGT TTGGCAAGAA GACAGCTGTA TATGTTGGGA TCTCATCAGC AGTGCCATTT901 CTCATCTTGG TGGCCCTCAT GGAGAGTAAC CTCATCATTA CATATGCGGT AGCTGTGGCA961 GCTGGCATCA GTGTGGCAGC TGCCTTCTTA CTACCCTGGT CCATGCTGCC TGATGTCATT1021 GACGACTTCC ATCTGAAGCA GCCCCACTTC CATGGAACCG AGCCCATCTT CTTCTCCTTC1081 TATGTCTTCT TCACCAAGTT TGCCTCTGGA GTGTCACTGG GCATTTCTAC CCTCAGTCTG1141 GACTTTGCAG GGTACCAGAC CCGTGGCTGC TCGCAGCCGG AACGTGTCAA GTTTACACTG1201 AACATGCTCG TGACCATGGC TCCCATAGTT CTCATCCTGC TGGGCCTGCT GCTCTTCAAA1261 ATGTACCCCA TTGATGAGGA GAGGCGGCGG CAGAATAAGA AGGCCCTGCA GGCACTGAGG1321 GACGAGGCCA GCAGCTCTGG CTGCTCAGAA ACAGACTCCA CAGAGCTGGC TAGCATCCTC1381 TAGGGCCCGC CACGTTGCCC GAAGCCACCA TGCAGAAGGC CACAGAAGGG ATCAGGACCT1441 GTCTGCCGGC TTGCTGAGCA GCTGGACTGC AGGTGCTAGG AAGGGAACTG AAGACTCAAG1501 GAGGTGGCCC AGGACACTTG CTGTGCTCAC TGTGGGGCCG GCTGCTCTGT GGCCTCCTGC1561 CTCCCCTCTG CCTGCCTGTG GGGCCAAGCC CTGGGGCTGC CACTGTGAAT ATGCCAAGGA1621 CTGATCGGGC CTAGCCCGGA ACACTAATGT AGAAACCTTT TTTTTACAGA GCCTAATTAA1681 TAACTTAATG ACTGTGTACA TAGCAATGTG TGTGTATGTA TATGTCTGTG AGCTATTAAT1741 GTTATTAATT TTCATAAAAG CTGGAAAGCA AAAAAAAAAA AAAAAAAAB:核苷酸序列(SEQ ID NO:8)长度:154个氨基酸
1 MESNLIITYA VAVAAGISVA AAFLLPWSML PDVIDDFHLK QPHFHGTEPI FFSFYVFFTK
61 FASGVSLGIS TLSLDFAGYQ TRGCSQPERV KFTLNMLVTM APIVLILLGL LLFKMYPIDE
121 ERRRQNKKAL QALRDEASSS GCSETDSTEL ASILC.核苷酸及氨基酸组合序列(SEQ ID NO:9)克隆号:PP10484起始编码子:919 ATG 终止编码子:1381 TAG 蛋白质分子量:17057.851 GGC TAA ATC ATA TAA CAG GGT CAC AGT AAT GGG GGG TTT CAA AGT GGA 4849 GAA CCA CAC GGC GTG CCA CTG CAG TAC TTG GTA AAA CAT TTA AGA TTT 9697 GTG ATA ATA ACA AGT ACT GCA GTG GCA CGC CGG GCC CCC AGA ACC CTA 144145 TGA AGC CCA GCA GTC TGA GCC AAT CGC CTA CTT CCG GGG CCT ACG GCT 192192 GGT CAT GAG CCA CGG CCC ATA CAT CAA ACT TAT TAC TGG CTT CCT CTT 240241 CAC CTC CTT GGC TTT CAT GCT GGT GGA GGG GAA CTT TGT CTT GTT TTG 288289 CAC CTA CAC CTT GGG CTT CCG CAA TGA ATT CCA GAA TCT ACT CCT GGC 336337 CAT CAT GGT GAG TGG GAC CTG AGC AGG GGC GGG CAG CCT GGG CTG AGG 384385 TGA CAT AGG CTG TGG AAT GGT TCT TGG AAT AGG CAG AGG ATG TTT CTC 432433 AGG CTG GCC CAA GGT CAT GAA AGG ATG AGG GAG GCT TCT CAG GGT ATT 480481 TGG TTG GAC CTT GCG AAG GTA GGA CTG TGA AAG AAA GAG TTT GAG GTT 528529 AGA TGT TTG AGT AGT GAG CAC AGC AAA AGC AAG GGC GAG GAC ACC AGG 576577 AAC TTG GCT CAG AGG TTT GAG AGG GCA GCA GAC AAG GTG GGC CTG GAC 624625 CAG CTC TGA GCT CCC CTG GGG AGC CGT CAA AGG TGC CTG TCA TCT TCG 672673 TTG CTG CCC ACA TGA TGT CAT CTG GCT GCT CTT GGG CAG GGC TGG GAG 720721 CCA CTT TGG GGT TCT GGG AAG GGC AGG AGG GGC TCT GTG GCT CTA AAG 768769 CAC CTC CCT TTA ACC CCC TTT GTC CAT CCA CAG CTC TCG GCC ACT TTA 816817 ACC ATT CCC ATC TGG CAG TGG TTC TTG ACC CGG TTT GGC AAG AAG ACA 864865 GCT GTA TAT GTT GGG ATC TCA TCA GCA GTG CCA TTT CTC ATC TTG GTG 912913 GCC CTC ATG GAG AGT AAC CTC ATC ATT ACA TAT GCG GTA GCT GTG GCA 9601 Met Glu Ser Asn Leu Ile Ile Thr Tyr Ala Val Ala Val Ala 14961 GCT GGC ATC AGT GTG GCA GCT GCC TTC TTA CTA CCC TGG TCC ATG CTG 1008 15 Ala Gly Ile Ser Val Ala Ala Ala Phe Leu Leu Pro Trp Ser Met Leu 301009 CCT GAT GTC ATT GAC GAC TTC CAT CTG AAG CAG CCC CAC TTC CAT GGA 105631 Pro Asp Val Ile Asp Asp Phe His Leu Lys Gln Pro His Phe His Gly 461057 ACC GAG CCC ATC TTC TTC TCC TTC TAT GTC TTC TTC ACC AAG TTT GCC 110447 Thr Glu Pro Ile Phe Phe Ser Phe Tyr Val Phe Phe Thr Lys Phe Ala 621105 TCT GGA GTG TCA CTG GGC ATT TCT ACC CTC AGT CTG GAC TTT GCA GGG 115263 Ser Gly Val Ser Leu Gly Ile Ser Thr Leu Ser Leu Asp Phe Ala Gly 781153 TAC CAG ACC CGT GGC TGC TCG CAG CCG GAA CGT GTC AAG TTT ACA CTG 120079 Tyr Gln Thr Arg Gly Cys Ser Gln Pro Glu Arg Val Lys Phe Thr Leu 941201 AAC ATG CTC GTG ACC ATG GCT CCC ATA GTT CTC ATC CTG CTG GGC CTG 124895 Asn Met Leu Val Thr Met Ala Pro Ile Val Leu Ile Leu Leu Gly Leu 1101249 CTG CTC TTC AAA ATG TAC CCC ATT GAT GAG GAG AGG CGG CGG CAG AAT 1296111 Leu Leu Phe Lys Met Tyr Pro Ile Asp Glu Glu Arg Arg Arg Gln Asn 1261297 AAG AAG GCC CTG CAG GCA CTG AGG GAC GAG GCC AGC AGC TCT GGC TGC 1344127 Lys Lys Ala Leu Gln Ala Leu Arg Asp Glu Ala Ser Ser Ser Gly Cys 1421345 TCA GAA ACA GAC TCC ACA GAG CTG GCT AGC ATC CTC TAG GGC CCG CCA 1392143 Ser Glu Thr Asp Ser Thr Glu Leu Ala Ser Ile Leu *** 1551393 CGT TGC CCG AAG CCA CCA TGC AGA AGG CCA CAG AAG GGA TCA GGA CCT 14401441 GTC TGC CGG CTT GCT GAG CAG CTG GAC TGC AGG TGC TAG GAA GGG AAC 14881489 TGA AGA CTC AAG GAG GTG GCC CAG GAC ACT TGC TGT GCT CAC TGT GGG 15361537 GCC GGC TGC TCT GTG GCC TCC TGC CTC CCC TCT GCC TGC CTG TGG GGC 15841585 CAA GCC CTG GGG CTG CCA CTG TGA ATA TGC CAA GGA CTG ATC GGG CCT 16321633 AGC CCG GAA CAC TAA TGT AGA AAC CTT TTT TTT ACA GAG CCT AAT TAA 16801681 TAA CTT AAT GAC TGT GTA CAT AGC AAT GTG TGT GTA TGT ATA TGT CTG 17281729 TGA GCT ATT AAT GTT ATT AAT TTT CAT AAA AGC TGG AAA GCA AAA AAA 17761777 AAA AAA AAA AAA 17884. PP10566A:核苷酸序列(SEQ ID NO:10)长度:2559个碱基1 GCAGAGCCTG AGCAGGCAGG GCACCTCCAG GTGGGCAGGA GCTACCACTC AGCACCATGA61 GCACCACCAC AGGCCCAGAA GCTGCCCCAA AGCCAAGCGC CAAGTCTATC TATGAGCAGA121 GGAAGCGTTA CTCCACAGTT GTTATGGCTG ATGTATCCCA GTACCCAGTC AATCACCTGG181 TGACGTTCTG CCTGGGTGAG GACGATGGCG TGCATACCGT GGAGGATGCC TCCAGGAAGT241 TGGCCGTCAT GGATAGCCAG GGCCGAGTCT GGGCACAGGA GATGCTGCTG CGAGTGTCTC301 CCGACCATGT CACGCTGCTC GACCCGGCCT CCAAGGAGGA GCTGGAGTCG TACCCACTGG361 GCGCCATCGT GCGCTGTGAC GCGGTGATGC CACCCGGCAG GAGCCGCTCG TTGCTGCTGC421 TCGTGTGCCA GGAACCCGAG CGCGCGCAGC CCGACGTGCA CTTCTTCCAG GGCCTGCGCC481 TCGGGGCGGA GCTGATCCGA GAGGACATCC AGGGGGCTCT GCACAATTAC CGCTCGGGCC541 GCGGGGAGCG CAGGGCGGCG GCGCTCAGGG CCACGCAGGA GGAGTTGCAG CGCGACCGCT601 CGCCCGCCGC TGAGACCCCG CCCCTGCAGC GCCGCCCGTC AGTCCGCGCA GTGATCAGCA661 CCGTAGAGCG GGGCGCGGGC CGCGGACGAC CCCAGGCGAA GCCCATTCCC GAGGCAGAGG721 AGGCGCAGAG GCCTGAGCCG GTGGGGACCT CGAGCAACGC TGACTCGGCC TCCCCGGACC781 TGGGTCCCCG GGGTCCTGAC CTGGCGGTTC TGCAGGCGGA GCGGGAAGTG GACATCCTGA841 ACCACGTGTT CGACGACGTA GAGAGCTTTG TATCGAGGCT GCAGAAGTCG GCGGAGGCGG901 CCAGGGTGCT GGAGCACCGG GAACGCGGCC GCAGGAGCCG GCGCCGGGCG GCTGGGGAGG961 GCTTGCTGAC GCTGCGGGCC AAGCCGCCCT CGGAGGCCGA GTACACCGAC GTGCTGCAGA1021 AGATCAAGTA CGCCTTCAGC CTGCTGGCCC GGCTGCGCGG CAACATCGCC GACCCCTCCT1081 CTCCGGAGCT GTTGCACTTC CTTTTCGGGC CTCTGCAGAT GATTGTGAAC ACGTCGGGGG1141 GGCCGGAGTT CGCGAGCAGT GTGCGGCGGC CGCATCTGAC ATCGGATGCC GTGGCGCTGC1201 TGCGGGACAA CGTCACTCCA CGTGAAAACG AGCTCTGGAC CTCGCTGGGG GACTCGTGGA1261 CCCGCCCCGG GCTGGAGCTG TCCCCGGAGG AGGGACCCCC ATACAGACCC GAGTTCTTCA1321 GCGGCTGGGA GCCGCCGGTC ACTGACCCGC AGAGCCGCGC CTGGGAGGAC CCAGTTGAGA1381 AACAGCTACA GCACGAGCGG AGGCGCCGGC AGCAAAGCGC CCCCGAGGTC GCTGTCAATG1441 GTCACCGAGA CTTGGAGCCA GAATCTGAGC CTCAGCTGGA GTCAGAGACA GCAGGAAAAT1501 GGGTCCTGTG TAATTATGAC TTCCAGGCCC GCAACAGCAG TGAGCTGTCG GTCAAGCAGC1561 GGGACGTACT GGAGGTCCTG GATGACAGTC GTAAGTGGTG GAAGGTTCGG GACCCAGCGG1621 GGCAGGAGGG ATATGTGCCC TACAACATCC TGACACCCTA CCCCGGACCC CGGCTGCACC1681 ACAGCCAAAG CCCTGCCCGC AGCCTGAACA GCACTCCTCC TCCACCACCA GCCCCAGCCC1741 CGGCCCCACC TCCAGCTCTG GCTCGGCCCC GCTGGGACAG GCCCCGCTGG GACAGCTGCG1801 ATAGCCTCAA CGGCTTGGAC CCCAGCGAGA AGGAGAAATT CTCCCAGATG CTCATCGTCA1861 ACGAGGAACT GCAGGCGCGC CTGGCCCAGG GCCGCTCGGG ACCGAGCCGC GCAGTCCCAG1921 GGCCCCGCGC CCCGGAACCG CAGCTCAGCC CGGGCTCGGA CGCCTCCGAG GTCCGCGCCT1981 GGCTGCAGGC CAAGGGCTTT AGCTCCGGGA CCGTGGACGC GCTGGGTGTG CTGACCGGGG2041 CGCAGCTTTT CTCGCTGCAG AGGGAGGAGC TGCGGGCGGT GAGCCCCGAG GAGGGGGCAC2101 GTGTGTACAG CCAGGTCACC GTGCAGCGCT CGCTGCTGGA GGACAAAGAG AAAGTGTCAG2161 AGCTGGAGGC AGTGATGGAG AAGCAAAAGA AGAAGGTGGA AGGCGAGGTG GAAATGGAGG2221 TCATTTGACC TGCCAGGCGC CCTTCGCAAA GAGTGACGAG GCCCCGTGGG AGAACGGACT2281 CCTCAGACTC TCCCCAATAG CGGAAGTCGA TCTTCTGAAG GATGGCCAAT CTGCTCCGGC2341 CCTGGTCTTC CCCCATCCCG GTGGACAGAC TTAACGATCC TTGCTGCAGT CCCTCCGGAG2401 AGGATCTGGA CTGGCTGGGA GTGGGGAGGG CGTGGAGACA GTCTACGGAA AGCGCTAGCA2461 GACCCCCGAG AGGGTGCAGT GGAGCCCTGA GCATTGTAAT ATGCGGCCCA GCCTATAAAC2521 AGCCTCCGTG CTTAGCAAAA AAAAAAAAAA AAAAAAAAAB:核苷酸序列(SEQ ID NO:11)长度:723个氨基酸1 MSTTTGPEAA PKPSAKSIYE QRKRYSTVVM ADVSQYPVNH LVTFCLGEDD GVHTVEDASR61 KLAVMDSQGR VWAQEMLLRV SPDHVTLLDP ASKEELESYP LGAIVRCDAV MPPGRSRSLL121 LLVCQEPERA QPDVHFFQGL RLGAELIRED IQGALHNYRS GRGERRAAAL RATQEELQRD181 RSPAAETPPL QRRPSVRAVI STVERGAGRG RPQAKPIPEA EEAQRPEPVG TSSNADSASP241 DLGPRGPDLA VLQAEREVDI LNHVFDDVES FVSRLQKSAE AARVLEHRER GRRSRRRAAG301 EGLLTLRAKP PSEAEYTDVL QKIKYAFSLL ARLRGNIADP SSPELLHFLF GPLQMIVNTS361 GGPEFASSVR RPHLTSDAVA LLRDNVTPRE NELWTSLGDS WTRPGLELSP EEGPPYRPEF421 FSGWEPPVTD PQSRAWEDPV EKQLQHERRR RQQSAPEVAV NGHRDLEPES EPQLESETAG481 KWLCNYDFQ ARNSSELSVK QRDVLEVLDD SRKWWKVRDP AGQEGYVPYN ILTPYPGPRL541 HHSQSPARSL NSTPPPPPAP APAPPPALAR PRWDRPRWDS CDSLNGLDPS EKEKFSQMLI601 VNEELQARLA QGRSGPSRAV PGPRAPEPQL SPGSDASEVR AWLQAKGFSS GTVDALGVLT661 GAQLFSLQRE ELRAVSPEEG ARVYSQVTVQ RSLLEDKEKV SELEAVMEKQ KKKVEGEVEM721 EVIC.核苷酸及氨基酸组合序列(SEQ ID NO:12)克隆号:PP10566起始编码子:57 ATG 终止编码子:2226 TGA 蛋白质分子量:80305.651 GC AGA GCC TGA GCA GGC AGG GCA CCT CCA GGT GGG CAG GAG CTA CCA 4748 CTC AGC ACC ATG AGC ACC ACC ACA GGC CCA GAA GCT GCC CCA AAG CCA 951 Met Ser Thr Thr Thr Gly Pro Glu Ala Ala Pro Lys Pro 1396 AGC GCC AAG TCT ATC TAT GAG CAG AGG AAG CGT TAC TCC ACA GTT GTT 14314 Ser Ala Lys Ser Ile Tyr Glu Gln Arg Lys Arg Tyr Ser Thr Val Val 29144 ATG GCT GAT GTA TCC CAG TAC CCA GTC AAT CAC CTG GTG ACG TTC TGC 19130 Met Ala Asp Val Ser Gln Tyr Pro Val Asn His Leu Val Thr Phe Cys 45192 CTG GGT GAG GAC GAT GGC GTG CAT ACC GTG GAG GAT GCC TCC AGG AAG 239 46 Leu Gly Glu Asp Asp Gly Val His Thr Val Glu Asp Ala Ser Arg Lys 61240 TTG GCC GTC ATG GAT AGC CAG GGC CGA GTC TGG GCA CAG GAG ATG CTG 28762 Leu Ala Val Met Asp Ser Gln Gly Arg Val Trp Ala Gln Glu Met Leu 77288 CTG CGA GTG TCT CCC GAC CAT GTC ACG CTG CTC GAC CCG GCC TCC AAG 33578 Leu Arg Val Ser Pro Asp His Val Thr Leu Leu Asp Pro Ala Ser Lys 93336 GAG GAG CTG GAG TCG TAC CCA CTG GGC GCC ATC GTG CGC TGT GAC GCG 38394 Glu Glu Leu Glu Ser Tyr Pro Leu Gly Ala Ile Val Arg Cys Asp Ala 109384 GTG ATG CCA CCC GGC AGG AGC CGC TCG TTG CTG CTG GTC GTG TGC CAG 431110 Val Met Pro Pro Gly Arg Ser Arg Ser Leu Leu Leu Leu Val Cys Gln 125432 GAA CCC GAG CGC GCG CAG CCC GAC GTG CAC TTC TTC CAG GGC CTG CGC 479126 Glu Pro Glu Arg Ala Gln Pro Asp Val His Phe Phe Gln Gly Leu Arg 141480 CTC GGG GCG GAG CTG ATC CGA GAG GAC ATC CAG GGG GCT CTG CAC AAT 527142 Leu Gly Ala Glu Leu Ile Arg Glu Asp Ile Gln Gly Ala Leu His Asn 157528 TAC CGC TCG GGC CGC GGG GAG CGC AGG GCG GCG GCG CTC AGG GCC ACG 575158 Tyr Arg Ser Gly Arg Gly Glu Arg Arg Ala Ala Ala Leu Arg Ala Thr 173576 CAG GAG GAG TTG CAG CGC GAC CGC TCG CCC GCC GCT GAG ACC CCG CCC 623174 Gln Glu Glu Leu Gln Arg Asp Arg Ser Pro Ala Ala Glu Thr Pro Pro 189624 CTG CAG CGC CGC CCG TCA GTC CGC GCA GTG ATC AGC ACC GTA GAG CGG 671190 Leu Gln Arg Arg Pro Ser Val Arg Ala Val Ile Ser Thr Val Glu Arg 205672 GGC GCG GGC CGC GGA CGA CCC CAG GCG AAG CCC ATT CCC GAG GCA GAG 719206 Gly Ala Gly Arg Gly Arg Pro Gln Ala Lys Pro Ile Pro Glu Ala Glu 221720 GAG GCG CAG AGG CCT GAG CCG GTG GGG ACC TCG AGC AAC GCT GAC TCG 767222 Glu Ala Gln Arg Pro Glu Pro Val Gly Thr Ser Ser Asn Ala Asp Ser 237768 GCC TCC CCG GAG CTG GGT CCC CGG GGT CCT GAC CTG GCG GTT CTG CAG 815238 Ala Ser Pro Asp Leu Gly Pro Arg Gly Pro Asp Leu Ala Val Leu Gln 253816 GCG GAG CGG GAA GTG GAC ATC CTG AAC CAC GTG TTC GAC GAC GTA GAG 863254 Ala Glu Arg Glu Val Asp Ile Leu Asn His Va1 Phe Asp Asp Val Glu 269864 AGC TTT GTA TCG AGG CTG CAG AAG TCG GCG GAG GCG GCC AGG GTG CTG 911270 Ser Phe Val Ser Arg Leu Gln Lys Ser Ala Glu Ala Ala Arg Val Leu 285912 GAG CAC CGG GAA CGC GGC CGC AGG AGC CGG CGC CGG GCG GCT GGG GAG 959286 Glu His Arg Glu Arg Gly Arg Arg Ser Arg Arg Arg Ala Ala Gly Glu 301960 GGC TTG CTG ACG CTG CGG GCC AAG CCG CCC TCG GAG GCC GAG TAC ACC 1007302 Gly Leu Leu Thr Leu Arg Ala Lys Pro Pro Ser Glu Ala Glu Tyr Thr 3171008 GAC GTG CTG CAG AAG ATC AAG TAC GCC TTC AGC CTG CTG GCC CGG CTG 1055318 Asp Val Leu Gln Lys Ile Lys Tyr Ala Phe Ser Leu Leu Ala Arg Leu 3331056 CGC GGC AAC ATC GCC GAC CCC TCC TCT CCG GAG CTG TTG CAC TTC CTT 1103334 Arg Gly Asn Ile Ala Asp Pro Ser Ser Pro Glu Leu Leu His Phe Leu 3491104 TTC GGG CCT CTG CAG ATG ATT GTG AAC ACG TCG GGG GGG CCG GAG TTC 1151350 Phe Gly Pro Leu Gln Met Ile Val Asn Thr Ser Gly Gly Pro Glu Phe 3651152 GCG AGC AGT GTG CGG CGG CCG CAT CTG ACA TCG GAT GCC GTG GCG CTG 1199366 Ala Ser Ser Val Arg Arg Pro His Leu Thr Ser Asp Ala Val Ala Leu 3811200 CTG CGG GAC AAC GTC ACT CCA CGT GAA AAC GAG CTC TGG ACC TCG CTG 1247382 Leu Arg Asp Asn Val Thr Pro Arg Glu Asn Glu Leu Trp Thr Ser Leu 3971248 GGG GAC TCG TGG ACC CGC CCC GGG CTG GAG CTG TCC CCG GAG GAG GGA 1295398 Gly Asp Ser Trp Thr Arg Pro Gly Leu Glu Leu Ser Pro Glu Glu Gly 4131296 CCC CCA TAC AGA CCC GAG TTC TTC AGC GGC TGG GAG CCG CCG GTC ACT 1343414 Pro Pro Tyr Arg Pro G1u Phe Phe Ser Gly Trp Glu Pro Pro Val Thr 4291344 GAC CCG CAG AGC CGC GCC TGG GAG GAC CCA GTT GAG AAA CAG CTA CAG 1391430 Asp Pro Gln Ser Arg Ala Trp Glu Asp Pro Val Glu Lys Gln Leu Gln 4451392 CAC GAG CGG AGG CGC CGG CAG CAA AGC GCC CCC GAG GTC GCT GTC AAT 1439446 His Glu Arg Arg Arg Arg Gln Gln Ser Ala Pro Glu Val Ala Val Asn 4611440 GGT CAC CGA GAC TTG GAG CCA GAA TCT GAG CCT CAG CTG GAG TCA GAG 1487462 Gly His Arg Asp Leu Glu Pro Glu Ser Glu Pro Gln Leu Glu Ser Glu 4771488 ACA GCA GGA AAA TGG GTC CTG TGT AAT TAT GAC TTC CAG GCC CGC AAC 1535478 Thr Ala Gly Lys Trp Val Leu Cys Asn Tyr Asp Phe Gln Ala Arg Asn 4931536 AGC AGT GAG CTG TCG GTC AAG CAG CGG GAC GTA CTG GAG GTC CTG GAT 1583494 Ser Ser Glu Leu Ser Val Lys Gln Arg Asp Val Leu Glu Val Leu Asp 5091584 GAC AGT CGT AAG TGG TGG AAG GTT CGG GAC CCA GCG GGG CAG GAG GGA 1631510 Asp Ser Arg Lys Trp Trp Lys Val Arg Asp Pro Ala Gly Gln Glu Gly 5251632 TAT GTG CCC TAC AAC ATC CTG ACA CCC TAC CCC GGA CCC CGG CTG CAC 1679526 Tyr Val Pro Tyr Asn Ile Leu Thr Pro Tyr Pro Gly Pro Arg Leu His 5411680 CAC AGC CAA AGC CCT GCC CGC AGC CTG AAC AGC ACT CCT CCT CCA CCA 1727542 His Ser Gln Ser Pro Ala Arg Ser Leu Asn Ser Thr Pro Pro Pro Pro 5571728 CCA GCC CCA GCC CCG GCC CCA CCT CCA GCT CTG GCT CGG CCC CGC TGG 1775558 Pro Ala Pro Ala Pro Ala Pro Pro Pro Ala Leu Ala Arg Pro Arg Trp 5731776 GAC AGG CCC CGC TGG GAC AGC TGC GAT AGC CTC AAC GGC TTG GAC CCC 1823574 Asp Arg Pro Arg Trp Asp Ser Cys Asp Ser Leu Asn Gly Leu Asp Pro 5891824 AGC GAG AAG GAG AAA TTC TCC CAG ATG CTC ATC GTC AAC GAG GAA CTG 1871590 Ser Glu Lys Glu Lys Phe Ser Gln Met Leu Ile Val Asn Glu Glu Leu 6051872 CAG GCG CGC CTG GCC CAG GGC CGC TCG GGA CCG AGC CGC GCA GTC CCA 1919606 Gln Ala Arg Leu Ala Gln Gly Arg Ser Gly Pro Ser Arg Ala Val Pro 6211920 GGG CCC CGC GCC CCG GAA CCG CAG CTC AGC CCG GGC TCG GAC GCC TCC 1967622 Gly Pro Arg Ala Pro Glu Pro Gln Leu Ser Pro Gly Ser Asp Ala Ser 6371968 GAG GTC CGC GCC TGG CTG CAG GCC AAG GGC TTT AGC TCC GGG ACC GTG 2015638 Glu Val Arg Ala Trp Leu Gln Ala Lys Gly Phe Ser Ser Gly Thr Val 6532016 GAC GCG CTG GGT GTG CTG ACC GGG GCG CAG CTT TTC TCG CTG CAG AGG 2063654 Asp Ala Leu Gly Val Leu Thr Gly Ala Gln Leu Phe Ser Leu Gln Arg 6692064 GAG GAG CTG CGG GCG GTG AGC CCC GAG GAG GGG GCA CGT GTG TAC AGC 2111670 Glu Glu Leu Arg Ala Val Ser Pro Glu Glu Gly Ala Arg Val Tyr Ser 6852112 CAG GTC ACC GTG CAG CGC TCG CTG CTG GAG GAC AAA GAG AAA GTG TCA 2159686 Gln Val Thr Val Gln Arg Ser Leu Leu Glu Asp Lys Glu Lys Val Ser 7012160 GAG CTG GAG GCA GTG ATG GAG AAG CAA AAG AAG AAG GTG GAA GGC GAG 2207702 Glu Leu Glu Ala Val Met Glu Lys Gln Lys Lys Lys Val Glu Gly Glu 7172208 GTG GAA ATG GAG GTC ATT TGA CCT GCC AGG CGC CCT TCG CAA AGA GTG 2255718 Val Glu Met Glu Val Ile *** 7242256 ACG AGG CCC CGT GGG AGA ACG GAC TCC TCA GAC TCT CCC CAA TAG CGG 23032304 AAG TCG ATC TTC TGA AGG ATG GCC AAT CTG CTC CGG CCC TGG TCT TCC 23512352 CCC ATC CCG GTG GAC AGA CTT AAC GAT CCT TGC TGC AGT CCC TCC GGA 23992400 GAG GAT CTG GAC TGG CTG GGA GTG GGG AGG GCG TGG AGA CAG TCT ACG 24472448 GAA AGC GCT AGC AGA CCC CCG AGA GGG TGC AGT GGA GCC CTG AGC ATT 24952496 GTA ATA TGC GGC CCA GCC TAT AAA CAG CCT CCG TGC TTA GCA AAA AAA 25432544 AAA AAA AAA AAA AAA A 25595.PP10631A:核苷酸序列(SEQ ID NO:13)长度:3134个碱基1 GGGCGAGCAG GACAGGACGA AGCCGGAGTG TAGGCGGCAG AGGATTCGCT CCCAGAGCAG61 CTGCGGCCAG GTCGGAAAGA GGCCGGGGCG GCTGGGTATA TGAATGACCT AAAGGTACAA121 ATAAAGACGG AGAGAGAACA GTGCCAACTG GGAGCAGGGC AAGAATGCCA ATTCCTCCTC181 CCCCGCCACC CCCACCTGGT CCTCCTCCAC CTCCCACATT TCATCAGGCA AACACAGAGC241 AGCCCAAGCT GAGTAGAGAT GAGCAGCGGG GTCGAGGCGC CCTCTTACAG GACATTTGCA301 AAGGGACCAA GCTGAAGAAG GTGACCAACA TTAATGATCG GAGTGCTCCC ATCCTCGAGA361 AGCCGAAAGG AAGCAGTGGT GGCTATGGCT CTGGAGGAGC TGCCCTGCAG CCCAAGGGAG421 GTCTCTTCCA AGGAGGAGTG CTGAAGCTTC GACCTGTGGG AGCCAAGGAT GGTTCAGAGA481 ACCTAGCTGG TAAGCCAGCC CTGCAAATCC CCAGTTCTCG AGCTGCTGCC CCAAGGCCTC541 CAGTATCTGC CGCCAGCGGG CGTCCTCAGG ATGATACAGA CAGCAGCCGG GCCTCACTCC601 CAGAACTGCC CCGGATGCAG AGACCCTCTT TACCGGACCT CTCTCGGCCT AATACCACCA661 GCAGTACGGG CATGAAGCAC AGCTCCTCTG CCCCTCCCCC ACCACCCCCA GGGCGGCGTG721 CCAACGCACC CCCCACACCT CTGCCTATGC ACAGCAGCAA AGCCCCCGCC TACAACAGAG781 AGAAACCCTT GCCACCGACG CCTGGACAAA GGCTTCACCC TGGTCGAGAG GGACCTCCTG841 CTCCACCCCC AGTCAAACCA CCTCCTTCCC CTGTGAATAT CAGAACAGGA CCAAGTGGCC901 AGTCTCTGGC TCCTCCTCCT CCGCCTTACC GCCAGCCTCC TGGGGTCCCC AATGGACCCT961 CTAGCCCCAC TAATGAGTCA GCCCCTGAGC TGCCACAGAG ACACAATTCT TTGCATAGGA1021 AGACACCAGG GCCTGTCAGA GGCCTAGCAC CTCCTCCACC CACCTCGGCC TCCCCATCTT1081 TACTGAGTAA TAGGCCACCT CCCCCAGCCC GAGACCCTCC CAGTCGGGGA GCAGCTCCTC1141 CACCCCCACC ACCTGTGATC CGAAATGGTG CCAGGGATGC TCCCCCTCCC CCACCACCAT1201 ACCGAATGCA TGGGTCAGAA CCCCCGAGCC GAGGAAAGCC CCCACCTCCA CCCTCAAGGA1261 CGCCAGCTGG GCCACCCCCC TCCTCTTCCA CCGCCCCTGA GGAATGGCCA CAGAGATTCT1321 ATCACCACTG TCCGGTCTTT CTTGGATGAT TTTGAGTCAA AGTATTCCTT CCATCCAGTA1381 GAAGACTTTC CTGCTCCAGA AGAATATAAA CACTTTCAGA GGATATATCC CAGCAAAACA1441 AACCGAGCTG CCCGTGGAGC CCCACCTCTG CCACCCATTC TCAGGTGAAG CCTGGCTTGG1501 TCCCGTTCCT CAGGAAAAGG ATGGACCTTC TCTTCTTCTC AGATGGTCCC TTCCATTCCC1561 CTGAAACCTG CATGAGAGCT CCTAACATGT TTCTCCAATG CAATCAAGCC CTAGACTCCA1621 AATGTCCTCC CAGCTCACCT CCATCTATGC ATCTCATCTC TGGATTTGGT GATCAGACTC1681 TATATTGACA GTAGGATCTC AAACCCTGCA TCCATCCTTC CTCCAGCAAG CCCTGCTAGC1741 CACATGAGGA ACAAGTTTCC GTGTCTTCTG CCTTCCTCTT GGGGAAAGGT GCCTTGTTGT1801 GATGAATTAA CTCACTGTTA GGGCAGGGTG GAGAATGGTA CTCCTTCCTT CTCCTGTCCA1861 CTGTGGGGGA AGCTTGGCAG GTATATTATA TTTCATCATT TAGGAGGCTG GCATGACCAG1921 GACTTATGGG TGGGAGGGGA GCATTTTTAG TGAAGCAAGA AAGGAGTTTG CCAAGAAGTG1981 ATCTGTTTTA AAGGTCATAT TTGGAGAAAG GGCAAGGAAT TGGGTCTGCT TTATTTTTGG2041 GGGTATTTTG TTTTTGTTCT CACCTGCTGC CCCCCCACCC CACCACCCCA GGGATAAATT2101 GGATATAAAC ACTAAATACT AATCAGTTGA ACTTAACATT TAATAAAAAG AAAGGGTGAA2161 ATAAACTGAA GACCATTTTA GAACTAGTCA GTTCTCTGCA GCAAAGGGAA CAGGAGCCAT2221 TTGAACCCTC TGGGACCCCT CACCCCACTG CTTCAGGGTG CTAGGCTGAG GGATGTTTTT2281 CCTCCCCCTT ACCGCCCATG CCCTTGAAAG AAAAGTCACT TTTTGTGGAG GGCATCATTC2341 ATTCCTGATT CACAAACCCC AAAAACCTCT GGTGGGAGAT AGGAAGATAG GGCGTGGGCC2401 TGGGCCTTAA CCTCAATCTT GTGTCTGCCT CAGTCTTTTC TGACTGGCCC TGAAGTTGTC2461 AGTGGCTCTT TCTGTCCTTC AGCCCCTGGA AGGTGCTCCA GGATAACAAA GAAGGGCAGG2521 TTGAAGCCCC TCATGGAAGG AGCTGGCTTT GTGGGGCTGC AAAGGACTTT TAAGTCCTGC2581 CTGTACTGAA GTTCACAGCC CACCTGACTG AGCAGACTCT TCCTGTTCCT TTCTCTACCA2641 CCCTTGCCTT CCCAGGACTG CACGGTTTAA CACAGCAGAG TACAGAAGGG TGAAGAAGTG2701 AGCAGAGGCT TATGAAGATA TTCAGATACT CTTCTATGCC AGGAAGCACA AAGACTTTGT2761 TGAGATTTGC CTCAGTTCAG TAGATCTTCC TTGGCAGCCA GCCATAGGTT GTTTCTTTGT2821 CTTCCGGGTC CTAAAGAGCA CAGAGAAAAT GGAGGTCCCC AGTCTAGGTA GGAAGCTGAT2881 TGGATGAGGA CTTCTTTTTT TCCGACAGCA GGATGGGGCT CTTGGGCTCC ACACACCAGA2941 TGCTTTGGTT TTCTACAACT GTTGCTATGT GTAGAGGGTG CTCAGAGCGT GGCATGAGAG3001 CAAGGAGACC ATGGCTACTC TTTGAAATGG ATGGGGAAAA TTAGCTTAAA AATTTAATCA3061 CGAGATTGCG CCACTGCACT CCAGCCTGGG CGACAGAGCC AGACTCCGTC TCAAAAAAAA3121 AAAAAAAAAA AAAAB:核苷酸序列(SEQ ID NO:14)长度:394个氨基酸1 MPIPPPPPPP PGPPPPPTFH QANTEQPKLS RDEQRGRGAL LQDICKGTKL KKVTNINDRS61 APILEKPKGS SGGYGSGGAA LQPKGGLFQG GVLKLRPVGA KDGSENLAGK PALQIPSSRA121 AAPRPPVSAA SGRPQDDTDS SRASLPELPR MQRPSLPDLS RPNTTSSTGM KHSSSAPPPP181 PPGRRANAPP TPLPMHSSKA PAYNREKPLP PTPGQRLHPG REGPPAPPPV KPPPSPVNIR241 TGPSGQSLAP PPPPYRQPPG VPNGPSSPTN ESAPELPQRH NSLHRKTPGP VRGLAPPPPT301 SASPSLLSNR PPPPARDPPS RGAAPPPPPP VIRNGARDAP PPPPPYRMHG SEPPSRGKPP361 PPPSRTPAGP PPSSSTAPEE WPQRFYHHCP VFLGC.核苷酸及氨基酸组合序列(SEQ ID NO.15)克隆号:PP10631起始编码子:165 ATG 终止编码子:1347 TGA 蛋白质分子量:41006.141 GG GCG AGC AGG ACA GGA CGA AGC CGG AGT GTA GGC GGC AGA GGA TTC 4748 GCT CCC AGA GCA GCT GCG GCC AGG TCG GAA AGA GGC CGG GGC GGC TGG 9596 GTA TAT GAA TGA CCT AAA GGT ACA AAT AAA GAC GGA GAG AGA ACA GTG 143144 CCA ACT GGG AGC AGG GCA AGA ATG CCA ATT CCT CCT CCC CCG CCA CCC 1911 Met Pro Ile Pro Pro Pro Pro Pro Pro 9192 CCA CCT GGT CCT CCT CCA CCT CCC ACA TTT CAT CAG GCA AAC ACA GAG 23910 Pro Pro Gly Pro Pro Pro Pro Pro Thr Phe His Gln Ala Asn Thr Glu 25240 CAG CCC AAG CTG AGT AGA GAT GAG CAG CGG GGT CGA GGC GCC CTC TTA 28726 Gln Pro Lys Leu Ser Arg Asp Glu Gln Arg Gly Arg Gly Ala Leu Leu 41288 CAG GAC ATT TGC AAA GGG ACC AAG CTG AAG AAG GTG ACC AAC ATT AAT 33542 Gln Asp Ile Cys Lys Gly Thr Lys Leu Lys Lys Val Thr Asn Ile Asn 57336 GAT CGG AGT GCT CCC ATC CTC GAG AAG CCG AAA GGA AGC AGT GGT GGC 38358 Asp Arg Ser Ala Pro Ile Leu Glu Lys Pro Lys Gly Ser Ser Gly Gly 73384 TAT GGC TCT GGA GGA GCT GCC CTG CAG CCC AAG GGA GGT CTC TTC CAA 43174 Tyr Gly Ser Gly Gly Ala Ala Leu Gln Pro Lys Gly Gly Leu Phe Gln 89432 GGA GGA GTG CTG AAG CTT CGA CCT GTG GGA GCC AAG GAT GGT TCA GAG 47990 Gly Gly Val Leu Lys Leu Arg Pro Val Gly Ala Lys Asp Gly Ser Glu 105480 AAC CTA GCT GGT AAG CCA GCC CTG CAA ATC CCC AGT TCT CGA GCT GCT 527106 Asn Leu Ala Gly Lys Pro Ala Leu Gln Ile Pro Ser Ser Arg Ala Ala 121528 GCC CCA AGG CCT CCA GTA TCT GCC GCC AGC GGG CGT CCT CAG GAT GAT 575122 Ala Pro Arg Pro Pro Val Ser Ala Ala Ser Gly Arg Pro Gln Asp Asp 137576 ACA GAC AGC AGC CGG GCC TCA CTC CCA GAA CTG CCC CGG ATG CAG AGA 623138 Thr Asp Ser Ser Arg Ala Ser Leu Pro Glu Leu Pro Arg Met Gln Arg 153624 CCC TCT TTA CCG GAC CTC TCT CGG CCT AAT ACC ACC AGC AGT ACG GGC 671154 Pro Ser Leu Pro Asp Leu Ser Arg Pro Asn Thr Thr Ser Ser Thr Gly 169672 ATG AAG CAC AGC TCC TCT GCC CCT CCC CCA CCA CCC CCA GGG CGG CGT 719170 Met Lys His Ser Ser Ser Ala Pro Pro Pro Pro Pro Pro Gly Arg Arg 185720 GCC AAC GCA CCC CCC ACA CCT CTG CCT ATG CAC AGC AGC AAA GCC CCC 767 186 Ala Asn Ala Pro Pro Thr Pro Leu Pro Met His Ser Ser Lys Ala Pro 201768 GCC TAC AAC AGA GAG AAA CCC TTG CCA CCG ACG CCT GGA CAA AGG CTT 815202 Ala Tyr Asn Arg Glu Lys Pro Leu Pro Pro Thr Pro Gly Gln Arg Leu 217816 CAC CCT GGT CGA GAG GGA CCT CCT GCT CCA CCC CCA GTC AAA CCA CCT 863218 His Pro Gly Arg Glu Gly Pro Pro Ala Pro Pro Pro Val Lys Pro Pro 233864 CCT TCC CCT GTG AAT ATC AGA ACA GGA CCA AGT GGC CAG TCT CTG GCT 911234 Pro Ser Pro Val Asn Ile Arg Thr Gly Pro Ser Gly Gln Ser Leu Ala 249912 CCT CCT CCT CCG CCT TAC CGC CAG CCT CCT GGG GTC CCC AAT GGA CCC 959250 Pro Pro Pro Pro Pro Tyr Arg Gln Pro Pro Gly Val Pro Asn Gly Pro 265960 TCT AGC CCC ACT AAT GAG TCA GCC CCT GAG CTG CCA CAG AGA CAC AAT 1007266 Ser Ser Pro Thr Asn Glu Ser Ala Pro Glu Leu Pro Gln Arg His Asn 2811008 TCT TTG CAT AGG AAG ACA CCA GGG CCT GTC AGA GGC CTA GCA CCT CCT 1055282 Ser Leu His Arg Lys Thr Pro Gly Pro Val Arg Gly Leu Ala Pro Pro 2971056 CCA CCC ACC TCG GCC TCC CCA TCT TTA CTG AGT AAT AGG CCA CCT CCC 1103298 Pro Pro Thr Ser Ala Ser Pro Ser Leu Leu Ser Asn Arg Pro Pro Pro 3131104 CCA GCC CGA GAC CCT CCC AGT CGG GGA GCA GCT CCT CCA CCC CCA CCA 1151314 Pro Ala Arg Asp Pro Pro Ser Arg Gly Ala Ala Pro Pro Pro Pro Pro 3291152 CCT GTG ATC CGA AAT GGT GCC AGG GAT GCT CCC CCT CCC CCA CCA CCA 1199330 Pro Val Ile Arg Asn Gly Ala Arg Asp Ala Pro Pro Pro Pro Pro Pro 3451200 TAC CGA ATG CAT GGG TCA GAA CCC CCG AGC CGA GGA AAG CCC CCA CCT 1247346 Tyr Arg Met His Gly Ser Glu Pro Pro Ser Arg Gly Lys Pro Pro Pro 3611248 CCA CCC TCA AGG ACG CCA GCT GGG CCA CCC CCC TCC TCT TCC ACC GCC 1295362 Pro Pro Ser Arg Thr Pro Ala Gly Pro Pro Pro Ser Ser Ser Thr Ala 3771296 CCT GAG GAA TGG CCA CAG AGA TTC TAT CAC CAC TGT CCG GTC TTT CTT 1343378 Pro Glu Glu Trp Pro Gln Arg Phe Tyr His His Cys Pro Val Phe Leu 3931344 GGA TGA TTT TGA GTC AAA GTA TTC CTT CCA TCC AGT AGA AGA CTT TCC 1391394 Gly *** 3951392 TGC TCC AGA AGA ATA TAA ACA CTT TCA GAG GAT ATA TCC CAG CAA AAC 14391440 AAA CCG AGC TGC CCG TGG AGC CCC ACC TCT GCC ACC CAT TCT CAG GTG 14871488 AAG CCT GGC TTG GTC CCG TTC CTC AGG AAA AGG ATG GAC CTT CTC TTC 15351536 TTC TCA GAT GGT CCC TTC CAT TCC CCT GAA ACC TGC ATG AGA GCT CCT 15831584 AAC ATG TTT CTC CAA TGC AAT CAA GCC CTA GAC TCC AAA TGT CCT CCC 16311632 AGC TCA CCT CCA TCT ATG CAT CTC ATC TCT GGA TTT GGT GAT CAG ACT 16791680 CTA TAT TGA CAG TAG GAT CTC AAA CCC TGC ATC CAT CCT TCC TCC AGC 17271728 AAG CCC TGC TAG CCA CAT GAG GAA CAA GTT TCC GTG TCT TCT GCC TTC 17751776 CTC TTG GGG AAA GGT GCC TTG TTG TGA TGA ATT AAC TCA CTG TTA GGG 18231824 CAG GGT GGA GAA TGG TAC TCC TTC CTT CTC CTG TCC ACT GTG GGG GAA 18711872 GCT TGG CAG GTA TAT TAT ATT TCA TCA TTT AGG AGG CTG GCA TGA CCA 19191920 GGA CTT ATG GGT GGG AGG GGA GCA TTT TTA GTG AAG CAA GAA AGG AGT 19671968 TTG CCA AGA AGT GAT CTG TTT TAA AGG TCA TAT TTG GAG AAA GGG CAA 20152016 GGA ATT GGG TCT GCT TTA TTT TTG GGG GTA TTT TGT TTT TGT TCT CAC 20632064 CTG CTG CCC CCC CAC CCC ACC ACC CCA GGG ATA AAT TGG ATA TAA ACA 21112112 CTA AAT ACT AAT CAG TTG AAC TTA ACA TTT AAT AAA AAG AAA GGG TGA 21592160 AAT AAA CTG AAG ACC ATT TTA GAA CTA GTC AGT TCT CTG CAG CAA AGG 22072208 GAA CAG GAG CCA TTT GAA CCC TCT GGG ACC CCT CAC CCC ACT GCT TCA 22552256 GGG TGC TAG GCT GAG GGA TGT TTT TCC TCC CCC TTA CCG CCC ATG CCC 23032304 TTG AAA GAA AAG TCA CTT TTT GTG GAG GGC ATC ATT CAT TCC TGA TTC 23512352 ACA AAC CCC AAA AAC CTC TGG TGG GAG ATA GGA AGA TAG GGC GTG GGC 23992400 CTG GGC CTT AAC CTC AAT CTT GTG TCT GCC TCA GTC TTT TCT GAC TGG 24472448 CCC TGA AGT TGT CAG TGG CTC TTT CTG TCC TTC AGC CCC TGG AAG GTG 24952496 CTC CAG GAT AAC AAA GAA GGG CAG GTT GAA GCC CCT CAT GGA AGG AGC 25432544 TGG CTT TGT GGG GCT GCA AAG GAC TTT TAA GTC CTG CCT GTA CTG AAG 25912592 TTC ACA GCC CAC CTG ACT GAG CAG ACT CTT CCT GTT CCT TTC TCT ACC 26392640 ACC CTT GCC TTC CCA GGA CTG CAC GGT TTA ACA CAG CAG AGT ACA GAA 26872688 GGG TGA AGA AGT GAG CAG AGG CTT ATG AAG ATA TTC AGA TAC TCT TCT 27352736 ATG CCA GGA AGC ACA AAG ACT TTG TTG AGA TTT GCC TCA GTT CAG TAG 27832784 ATC TTC CTT GGC AGC CAG CCA TAG GTT GTT TCT TTG TCT TCC GGG TCC 28312832 TAA AGA GCA CAG AGA AAA TGG AGG TCC CCA GTC TAG GTA GGA AGC TGA 28792880 TTG GAT GAG GAC TTC TTT TTT TCC GAC AGC AGG ATG GGG CTC TTG GGC 29272928 TCC ACA CAC CAG ATG CTT TGG TTT TCT ACA ACT GTT GCT ATG TGT AGA 29752976 GGG TGC TCA GAG CGT GGC ATG AGA GCA AGG AGA CCA TGG CTA CTC TTT 30233024 GAA ATG GAT GGG GAA AAT TAG CTT AAA AAT TTA ATC ACG AGA TTG CGC 30713072 CAC TGC ACT CCA GCC TGG GCG ACA GAG CCA GAC TCC GTC TCA AAA AAA 31193120 AAA AAA AAA AAA AAA 31346.PP10752A:核苷酸序列(SEQ ID NO:16)长度:1528个碱基1 GCAGGAGGGT AGCCTCCATG CGTAGCCACC CCACCTGGCA GTGGTGGTGC CAGTCGGGCA61 TGGAGTCCCT CCACTCGCTG ACCTCCTCCT GCACGGCGCA TAGCTCCTGC TGCAAGAAGC121 GCCACATGTT GGCCAGGTTG AAGCCATTGA CCCAGTTGTG GTTGATGGAG ATGGTGTCAT181 CCTGGAAGGG GCACAGTGCA GGCAGGCCTG AGCCCATGGC AGGTGCCCCC TGACCAACCC241 ACATCTCCTG CGCCAGGAAC CCACTGTGGG GTCCAGCCCT CTGCAGCCAA GAGGGCCCTC301 CTGTCTCCCA GCAGGGCTTG CTCAGCAGGG AAGTGGGTGG CGGGCTCGGA CCACCTCAGG361 CCACAGTGAA CCCAGAGCAA GTAGACCCAG GGACCGGCAG TGGGTGAAAC AGAGGCTAGG421 CCTCAGCGAC ACCACCTTGT GAAGGGGTCA GCCTCACCCA TGAGCCACCC CATTCCAGCC481 CAGCTCTGGC TGGGAGAGTG GGGAGGTGGT GCTGCCGTCT TCCTGCAGGA AGGCCCCTGA541 TAGGGGGCAG GAGAAGCAGC ACATTACCAG GTTGTGCACC TGGTGGTGCC AGCCACTGGG601 CACAAACACC ATCTCGCCCG CTTCCTGCGT GATCTCCAAG GGTGGGCCAG CAAGCTGGTT661 CCGTGGGTGC AGGTGTGTGT CGCAGAGTGC TGGGGAGGTC ACGTCGTAGG GCAGGTTGCC721 GTGGCGGTCC CGCAGCCTCT TCCTGCCCTG GGGGGAAGAG GAGCCACTTC TTCCTCCCAC781 AGACATTGAC AGACCAGCTG AAGGAGCGGA AGATGTCAGC ATGGAACGGG GACCTGCGGC841 ACAAGAGCGC CTGGTTCATG CCTGTAGGGG CTGGTATGGG CTTTGCTTGG CACCCCAGAG901 GCCTGGTCCA ACTGAAGGAG GGGTGGCCCC TTGGTCTCAA GGGATGGCAC CCACTGTGAG961 GCCTGTGCCA AGCAGCCCCC CTCCTGCCAC CCTGGGCCTC CCAGTCTGTT CTGTCACCAG1021 GCCCCTTCGG TTCCACTCCC ACATCCGTGG CCTCACCAGC TGCCCGCAGG CCCCGCGTAG1081 ACAAAGCGGT AGTCATCCAC ATCCAGTGCA TCCCAGAACT CATTCAGCCA GTCGGACGAG1141 AAGTACACAG GCAGGGTGAA AACGTCCTCC ACCGGAAAGT CCCTGTGAGG AGGGCGCAAG1201 GGCACCACCG ACAGCACGTG AGGCACGAGG AGACTAGGGC AGCACGAGTG GGGCAACTGA1261 GACCAATCGG CTCCAGTGGA GCTTCCAGAT GGCTGCAGCC CCCAAAGAGC CCCAGACCCT1321 CCTCTGAGCC AGACGCTGCT GGCGGGGGAG GGGGCGGGGC AGTCTGACTA CAATGGTTCT1381 GCTTATTAGA AAGTACTGAT CATGCCTATA ATCCCAGTGC TTTGAGATGC TGAGGTGGAT1441 GCATCACCTG AGCTCAGGAG TTCAAGACCA GCCTGGGCAA CATGGTGAAA CCTAGTCTCT1501 TTAAAAAAAA AAAAAAAAAA AAAAAAAAB:核苷酸序列(SEQ ID NO:17)长度:112个氨基酸
1 MERGPAAQER LVHACRGWYG LCLAPQRPGP TEGGVAPWSQ GMAPTVRPVP SSPPPATLGL
61 PVCSVTRPLR FHSHIRGLTS CPQAPRRQSG SHPHPVHPRT HSASRTRSTQ AGC.核苷酸及氨基酸组合序列(SEQ ID NO:18)克隆号:PP10752起始编码子:821 ATG 终止编码子:1157 TGA 蛋白质分子量:11974.041 G CAG GAG GGT AGC CTC CAT GCG TAG CCA CCC CAC CTG GCA GTG GTG 4647 GTG CCA GTC GGG CAT GGA GTC CCT CCA CTC GCT GAC CTC CTC CTG CAC 9495 GGC GCA TAG CTC CTG CTG CAA GAA GCG CCA CAT GTT GGC CAG GTT GAA 142143 GCC ATT GAC CCA GTT GTG GTT GAT GGA GAT GGT GTC ATC CTG GAA GGG 190191 GCA CAG TGC AGG GAG GCC TGA GCC CAT GGC AGG TGC CCC CTG ACC AAC 238239 CCA CAT CTC CTG CGC CAG GAA CCC ACT GTG GGG TCC AGC CCT CTG CAG 286287 CCA AGA GGG CCC TCC TGT CTC CCA GCA GGG CTT GCT CAG CAG GGA AGT 334335 GGG TGG CGG GCT CGG ACC ACC TCA GGC CAC AGT GAA CCC AGA GCA AGT 382383 AGA CCC AGG GAC CGG CAG TGG GTG AAA CAG AGG CTA GGC CTC AGC GAC 430431 ACC ACC TTG TGA AGG GGT CAG CCT CAC CCA TGA GCC ACC CCA TTC CAG 478479 CCC AGC TCT GGC TGG GAG AGT GGG GAG GTG GTG CTG CCG TCT TCC TGC 526527 AGG AAG GCC CCT GAT AGG GGG CAG GAG AAG CAG CAC ATT ACC AGG TTG 574575 TGC ACC TGG TGG TGC CAG CCA CTG GGC ACA AAC ACC ATC TCG CCC GCT 622623 TCC TGC GTG ATC TCC AAG GGT GGG CCA GCA AGC TGG TTC CGT GGG TGC 670671 AGG TGT GTG TCG CAG AGT GCT GGG GAG GTC ACG TCG TAG GGC AGG TTG 718719 CCG TGG CGG TCC CGC AGC CTC TTC CTG CCC TGG GGG GAA GAG GAG CCA 766767 CTT CTT CCT CCC ACA GAC ATT GAC AGA CCA GCT GAA GGA GCG GAA GAT 814815 GTC AGC ATG GAA CGG GGA CCT GCG GCA CAA GAG CGC CTG GTT CAT GCC 8621 Met Glu Arg Gly Pro Ala Ala Gln Glu Arg Leu Val His Ala 14863 TGT AGG GGC TGG TAT GGG CTT TGC TTG GCA CCC CAG AGG CCT GGT CCA 91015 Cys Arg Gly Trp Tyr Gly Leu Cys Leu Ala Pro Gln Arg Pro Gly Pro 30911 ACT GAA GGA GGG GTG GCC CCT TGG TCT CAA GGG ATG GCA CCC ACT GTG 95831 Thr Glu Gly Gly Val Ala Pro Trp Ser Gln Gly Met Ala Pro Thr Val 46959 AGG CCT GTG CCA AGC AGC CCC CCT CCT GCC ACC CTG GGC CTC CCA GTC 100647 Arg Pro Val Pro Ser Ser Pro Pro Pro Ala Thr Leu Gly Leu Pro Val 621007 TGT TCT GTC ACC AGG CCC CTT CGG TTC CAC TCC CAC ATC CGT GGC CTC 105463 Cys Ser Val Thr Arg Pro Leu Arg Phe His Ser His Ile Arg Gly Leu 781055 ACC AGC TGC CCG CAG GCC CCG CGT AGA CAA AGC GGT AGT CAT CCA CAT 110279 Thr Ser Cys Pro Gln Ala Pro Arg Arg Gln Ser Gly Ser His Pro His 941103 CCA GTG CAT CCC AGA ACT CAT TCA GCC AGT CGG ACG AGA AGT ACA CAG 115095 Pro Val His Pro Arg Thr His Ser Ala Ser Arg Thr Arg Ser Thr Gln 1101151 GCA GGG TGA AAA CGT CCT CCA CCG GAA AGT CCC TGT GAG GAG GGC GCA 1198111 Ala Gly *** 1131199 AGG GCA CCA CCG ACA GCA CGT GAG GCA CGA GGA GAC TAG GGC AGC ACG 12461247 AGT GGG GCA ACT GAG ACC AAT CGG CTC CAG TGG AGC TTC CAG ATG GCT 12941295 GCA GCC CCC AAA GAG CCC CAG ACC CTC CTC TGA GCC AGA CGC TGC TGG 13421343 CGG GGG AGG GGG CGG GGC AGT CTG ACT ACA ATG GTT CTG CTT ATT AGA 13901391 AAG TAC TGA TCA TGC CTA TAA TCC CAG TGC TTT GAG ATG CTG AGG TGG 14381439 ATG CAT CAC CTG AGC TCA GGA GTT CAA GAC CAG CCT GGG CAA CAT GGT 14861487 GAA ACC TAG TCT CTT TAA AAA AAA AAA AAA AAA AAA AAA AAA 15287.PPl0881A:核苷酸序列(SEQ ID NO:19)长度:2100个碱基
1 GCCACTATGT CTGGCTGAGT ATGTCTCTTT TAGATTGTTT TATTTTGAGA ACTTCTGAAA
61 CCATGTCAGA GACTGCTGAT GCTGTAGATG ATACTATATT ATTCAAGTCT TGATTATCTG
121 CTGTGAGTTT TCATGAATAA TTCACCTTTT TCATGCACGA CACAGAACTT GTTGGTAACA
181 GCACTCCAGT GTCGAACATG TCATTAATTC ATGTGCTAAA TCTCTTTTGG TCCACCATGA 241 TACTGTTTCA AATTAACAAC CTATGTGAGC TGGGGAAGTT GCACAGATTC TCATTTAGCC301 TGTTCTGACT GAAGGGAAAA CTAACAAGCT TTCTGCAGTA TAGTAGCTGA AGTTTTCCCT361 GGTCAAACAT CATATCCTTC CCCAAAACAT ATTCAGGTAA TGTGGATGCA AGTACTTCCA421 AGATTCATTC AAACATACTA ATTTTCATCC AAATTTTAAT TTAATCCTAT CAGCCATTTC481 ATCCTCATAT CCTGTCTTTC TAGTTATTGC CTCTGCTAGG ATTTTACCAA TAGGTTTTGG541 AATCAGAGGC ACTGAATTCT ATGTCAGGAA CCCCTGGAAG GTTTCTTTTT TACCTTCTAT601 TGTACCTACA GGTGTGCATA TGGCCTTCAG TCCCTACTAG GAGATTAGTT AAAAGAAAGC661 CCTGGTTCTG TGTCAGTCCT CATCCTGATT AATTTGGTAG CCCATCACCT CTGATGATTT721 GAACTGAGGT TCTTCATTGT CATTTTTGCT TCCCAGCTTG GTGCATTCTT TGAAATTAGG781 GTGCATAGAG TGTTTGTTTA GGGCCCTTCA GTGTTGGGGG ACTAAGAGGC GCTCCCATTG841 GTAAACCTAA CTTCTGATAG TGCAGCATTA AGACCTTTGT GTTAACATCA GTGTCCATTT901 TATTCATCCC ATCTCTTAGT AACCGTTTAA AACTTCATCC TGCTTGGGAC TTCGTTGACT961 ATCTGTTTTG TGTTACCCAT TCACTTGTGA TTCAGTCTTA TTTTCTTAGC ATCTGTAAGA1021 CCCATATTAA GAAGCTGAGA CAACAAATCT GACACATTTC TTGGACCATT GATAGATTTT1081 GCAGCAGTTA TATCAGATGC CTGCCTAGCG GGGCCCCTTC AGTCACAGTA TTTACCATGA1141 TTTAAAGGGC ATATTAAGGA TGAACAAACA TCCTGATGAC CATGAAGTTA ATCCAGCATG1201 GTTTGCATAT GCAGCTTACC AGCTTTGTCA TCTATGGAGG AGTGCCACTT GGCATTTAAA1261 GGAGGGGAAG GACCATTTCC CTTTTCAGGG TAAACAAATT TTACAGTGGC TTTTACCCAG1321 TCCACCAGAC TAGCTGTCCC TTTAGGAACA ATCTATTGTG TGTTTGGATC ATGTACAACA1381 ATCCATGATT GTTCAGTAAT AAGGTTCCTG CATCAACCCC AAGCAGACTT CTTCATTCTG1441 CAACATTCAG AATCAAAGAT ACTGCTCCCA AGTTAGTCAC TCTCACAATC TATTTTCTTA1501 AATGTTTTTC AGGAACCCGA TGAATACCAG TTCACAAGGC AAGATAACTC CTTCACACAT1561 AACCCCTGCT TCCAGTACTG TCTTGGTTTT GTCACCCACC ATTTGGACAA TGTTCCTGGT1621 GGTCAAAGGC CATAGATATA CTGTCTGTTT TTTTCAGCAT AATTTTCCAT TGGGTTTATC1681 CTGGAGGCTA ACAGCCATAG CTCAAGCTAA CCAAAATCCA AGCTTTTTGA GCATCAGGAT1741 TTCCTTAACA CTCTCTCTTA CTTTCATTTT AGCTGTTTTA AAATACAGCA GACTGGGCCA1801 GGCGCAGTGG CTCACATTGG TAATCCCAGT ACGTTGGGAG GCCAAGTCGG GCAGATCACT1861 TGAGGCCAGG AGTTTGAGAC CAGCCTGACC AACATGGTGA AACCCTGTCT CCACTAAAAA1921 TACAAAAAAT TAGCTTGGCT TGGTGGCATG CGCCTGTAAT CCCAGCTACT TGAGGGGCTG1981 AGGCAGGAGA ATCACTGGAA CCCAGGAGGC AGAGGTTGCA GTGATCTGAG ATCATGCCAC2041 TGTACTCCAG CCTGGGAGAC ACAGCGAGAC TCCCTCTCAA AAAAAAAAAA AAAAAAAAAAB:核苷酸序列(SEQ ID NO:20)长度:128个氨基酸
1 MFFRNPMNTS SQGKITPSHI TPASSTVLVL SPTIWTMFLV VKGHRYTVCF FQHNFPLGLS
61 WRLTAIAQAN QNPSFLSIRI SLTLSLTFIL AVLKYSRLGQ AQWLTLVIPV RWEAKSGRSL
121 EARSLRPAC.核苷酸及氨基酸组合序列(SEQ ID NO:21)克隆号:PPl0881起始编码子:1502 ATG 终止编码子:1886 TGA 蛋白质分子量:14432.151 G CCA CTA TGT CTG GCT GAG TAT GTC TCT TTT AGA TTG TTT TAT TTT 4647 GAG AAC TTC TGA AAC CAT GTC AGA GAC TGC TGA TGC TGT AGA TGA TAC 9495 TAT ATT ATT CAA GTC TTG ATT ATC TGC TGT GAG TTT TCA TGA ATA ATT 142143 CAC CTT TTT CAT GCA CGA CAC AGA ACT TGT TGG TAA CAG CAC TCC AGT 190191 GTC GAA CAT GTC ATT AAT TCA TGT GCT AAA TCT CTT TTG GTC CAC CAT 238239 GAT ACT GTT TCA AAT TAA CAA CCT ATG TGA GCT GGG GAA GTT GCA CAG 286287 ATT CTC ATT TAG CCT GTT CTG ACT GAA GGG AAA ACT AAC AAG CTT TCT 334335 GCA GTA TAG TAG CTG AAG TTT TCC CTG GTC AAA CAT CAT ATC CTT CCC 382383 CAA AAC ATA TTC AGG TAA TGT GGA TGC AAG TAC TTC CAA GAT TCA TTC 430431 AAA CAT ACT AAT TTT CAT CCA AAT TTT AAT TTA ATC CTA TCA GCC ATT 478479 TCA TCC TCA TAT CCT GTC TTT CTA GTT ATT GCC TCT GCT AGG ATT TTA 526527 CCA ATA GGT TTT GGA ATC AGA GGC ACT GAA TTC TAT GTC AGG AAC CCC 574 575 TGG AAG GTT TCT TTT TTA CCT TCT ATT GTA CCT ACA GGT GTG CAT ATG 622623 GCC TTC AGT CCC TAC TAG GAG ATT AGT TAA AAG AAA GCC CTG GTT CTG 670671 TGT CAG TCC TCA TCC TGA TTA ATT TGG TAG CCC ATC ACC TCT GAT GAT 718719 TTG AAC TGA GGT TCT TCA TTG TCA TTT TTG CTT CCC AGC TTG GTG CAT 766767 TCT TTG AAA TTA GGG TGC ATA GAG TGT TTG TTT AGG GCC CTT CAG TGT 814815 TGG GGG ACT AAG AGG CGC TCC CAT TGG TAA ACC TAA CTT CTG ATA GTG 862863 CAG CAT TAA GAC CTT TGT GTT AAC ATC AGT GTC CAT TTT ATT CAT CCC 910911 ATC TCT TAG TAA CCG TTT AAA ACT TCA TCC TGC TTG GGA CTT CGT TGA 958959 CTA TCT GTT TTG TGT TAC CCA TTC ACT TGT GAT TCA GTC TTA TTT TCT 10061007 TAG CAT CTG TAA GAC CCA TAT TAA GAA GCT GAG ACA ACA AAT CTG ACA 10541055 CAT TTC TTG GAC CAT TGA TAG ATT TTG CAG CAG TTA TAT CAG ATG CCT 11021103 GCC TAG CGG GGC CCC TTC AGT CAC AGT ATT TAC CAT GAT TTA AAG GGC 11501151 ATA TTA AGG ATG AAC AAA CAT CCT GAT GAC CAT GAA GTT AAT CCA GCA 11981199 TGG TTT GCA TAT GCA GCT TAC CAG CTT TGT CAT CTA TGG AGG AGT GCC 12461247 ACT TGG CAT TTA AAG GAG GGG AAG GAC CAT TTC CCT TTT CAG GGT AAA 12941295 CAA ATT TTA CAG TGG CTT TTA CCC AGT CCA CCA GAC TAG CTG TCC CTT 13421343 TAG GAA CAA TCT ATT GTG TGT TTG GAT CAT GTA CAA CAA TCC ATG ATT 13901391 GTT CAG TAA TAA GGT TCC TGC ATC AAC CCC AAG CAG ACT TCT TCA TTC 14381439 TGC AAC ATT CAG AAT CAA AGA TAC TGC TCC CAA GTT AGT CAC TCT CAC 14861487 AAT CTA TTT TCT TAA ATG TTT TTC AGG AAC CCG ATG AAT ACC AGT TCA 15341 Met Phe Phe Arg Asn Pro Met Asn Thr Ser Ser 111535 CAA GGC AAG ATA ACT CCT TCA CAC ATA ACC CCT GCT TCC AGT ACT GTC 158212 Gln Gly Lys Ile Thr Pro Ser His Ile Thr Pro Ala Ser Ser Thr Val 271583 TTG GTT TTG TCA CCC ACC ATT TGG ACA ATG TTC CTG GTG GTC AAA GGC 163028 Leu Val Leu Ser Pro Thr Ile Trp Thr Met Phe Leu Val Val Lys Gly 431631 CAT AGA TAT ACT GTC TGT TTT TTT CAG CAT AAT TTT CCA TTG GGT TTA 167844 His Arg Tyr Thr Val Cys Phe Phe Gln His Asn Phe Pro Leu Gly Leu 591679 TCC TGG AGG CTA ACA GCC ATA GCT CAA GCT AAC CAA AAT CCA AGC TTT 172660 Ser Trp Arg Leu Thr Ala Ile Ala Gln Ala Asn Gln Asn Pro Ser Phe 751727 TTG AGC ATC AGG ATT TCC TTA ACA CTC TCT CTT ACT TTC ATT TTA GCT 177476 Leu Ser Ile Arg Ile Ser Leu Thr Leu Ser Leu Thr Phe Ile Leu Ala 911775 GTT TTA AAA TAC AGC AGA CTG GGC CAG GCG CAG TGG CTC ACA TTG GTA 182292 Val Leu Lys Tyr Ser Arg Leu Gly Gln Ala Gln Trp Leu Thr Leu Val 1071823 ATC CCA GTA CGT TGG GAG GCC AAG TCG GGC AGA TCA CTT GAG GCC AGG 1870108 Ile Pro Val Arg Trp Glu Ala Lys Ser Gly Arg Ser Leu Glu Ala Arg 1231871 AGT TTG AGA CCA GCC TGA CCA ACA TGG TGA AAC CCT GTC TCC ACT AAA 1918124 Ser Leu Arg Pro Ala *** 1291919 AAT ACA AAA AAT TAG CTT GGC TTG GTG GCA TGC GCC TGT AAT CCC AGC 19661967 TAC TTG AGG GGC TGA GGC AGG AGA ATC ACT GGA ACC CAG GAG GCA GAG 20142015 GTT GCA GTG ATC TGA GAT CAT GCC ACT GTA CTC CAG CCT GGG AGA CAC 20622063 AGC GAG ACT CCC TCT CAA AAA AAA AAA AAA AAA AAA AA 21008. PP10897A:核苷酸序列(SEQ ID NO:22)长度:2362个碱基
1 GCATGAATCA GGTAAGAAGC CAGACTGCTG AGGCAGAGTA GGGGGGAAGG AGGCACAAGG
61 GCCTTGCACT CCAGCAAAGA TGGTAGAGAT GGGGAAGCAT TCGGGCTGGA CAGGAGAGAC
121 CCAGGTTCCA GGCGCAGTGT GAAGCCTCAG CAGACCCCAG TTTCAGAGGT TTGAGGAAGG
181 AAAATCAACA GACACCCCGG GTATGAAGTA GGGGCCAGGT TGTGGGCTCT GCCTCTGGGG 241 ACAGGGCAGA TCCCTTCCTG CTTTATTTGT GAGCCACCTC AACAGGACCC AGGCCATCTG301 CAGGTACTAG TGGCCTAGCT GGGTAGTCTT TCCTGAGGTC TCACCTCAGG CCTTTGTGCT361 GCTGCTGTTG CTTCTGGCCT TGAGCCTGAG AGAGAGGTGA GAGGAAGGAT GCTTTCTCTA421 ACTTGGGCTC CTCCAATCTC TGGTTGCAAA GCTGGGGTTG GGGGAGAGAG GACCACCCAA481 CCTGCCCTGT ACAAGCATCA GTAAGACTCC AAGTTTCCCA GGGCCCGAAC ACTTGGGGGT541 TGTCTCTCAA CACCCGGCTG GAAGACAAGT AGGTAACCAG GTTCAGCCCC ACCTGCCAAG601 AACACTGTGT TTTGGGCCTG GCAGAGCTGC TACTCCCCCT CTCCCTCCTA AGAATGCCCA661 GAGAATCACT TGCCAAGGCT ACTCCTGGAG CTCAGCTGTG GGATCAGGGT TTGGGCTGAG721 GATCAGGTGC CTGTGTGCAC ACATGTGCAC ATTGTGTGTG CCAATGGGTG GTAGGGATTG781 AGCCCGTTGT GAGAACATCC AGCCAGGTTG GAAGTGTGTA CAGGTATCTG AGGGTGTGCA841 CGTGAGCAAG AGGGTGTGCA AGATGTGGGT GACTGTTGGG ACCACAGAGC TGAGGCCTGT901 GGTCAGCTCA GGTCAGAACT GGGAGGTCTG TTTCCCTTGG GAGGACCTGT CTGCTCTGAG961 GGGGACCCGG ACAAGTGCAC ATATGCATGT GTGTGTCTAC ACACACACAC ACACACACAC1021 ACACACACAC ACACACATAT GCTTGCCTCC CTCTCCAAGG CAGACTTGCC TGGGAAGTAC1081 CCCTCCTCAG CAGGAGCTCG AAGACCCCTG CCCAGTGCTG TTTTCAGTAG AGGGAGTGGA1141 GCTGAGATGG GGAGACCGTA CTGAGCGGTC CAGGAGTAGG GAAACAGAGC TGCTTTGCAG1201 CTTCTGTTCC AGAAGATGGG GGTTGGGGGG CGGGGTTGAG GGCCAGGGGT GGGAGCAGGA1261 GCAGAACAGA AAGCCTCCCT GCTCACTGGC CTTTCCCCTT CCCTCACTGG CTGCCCATGG1321 AGCCAGGATC AGCATGGGAA CAATCAAGGA GGCAGGGGCT TATCAGTACT ATGGACCCCT1381 ACACTGCTCT GCCTGGTGGT TCTTCTCTTC GCATACCAAA GACAGAAATT AAGCCTCCAA1441 GAGTGGTAAC TGACCTCGGT CACACTTGGT GGGTGTGGGA AAGGATTCAA ATGTAGGTCT1501 GTTCTCTTCT TCATCTATCA TGGTCCCTGT CCTGGAGGCA AGTCGTCTGG GGCTCAGAAA1561 ACACCCCTGT TGCCACTGAT TGGAATTCCA AGGGTCTGGG TGAAGTGGGG ATGGGCCTCC1621 AGCTTGCCTC CAGCCTGAAA AAATAGTAGA GGGTGTTGAG GCTGGGAAGG GAGGTGGGGC1681 TCATGTTGTA CAGGGCCTGA GCCAGGGAGC TTGGGCTTCA TTCTGAGTAC TGTGGCAGCC1741 CTGGGAAGGT TTGTAGCACA GAGGGATATT GTCATTTTTG GAAAGATCCC TTTGGCTGCT1801 TAGGTAGAGA AGGGCTTCAA GAGGGCAGGA AGGGACAGGA CTACAGAAGG GGCTGCTTCA1861 GAGTCCAGAT TAAGGAAGGA GAGGCCTGGG CAGTCAGAAA GGAAGAGAAG CCGGATGTGG1921 TGGCTTGTAT CTTCAATCCC AGCACTTTGA GAGGCCAAGG TGGGAGGATC ACTTGAGCCC1981 AGGAGTTCAA AACCAGCTTG GGCAACATAG TGAGACTCCC ATCTCTCCAA AAAAATTTAA2041 AAACCAGCCA GGTAGACTGG GCGCAGTGGC TCACGCCTGT AATCCCAGAA CTTTGGGAGG2101 CCGAGGCAGG CAGATCACGA GGTCAAGAGT TAGAGACCAG CCTGACCAAC ATGGTGAAAC2161 CCCGTCTCTA CTAAAAATAC AAAACTTAGC CAGGCCTGTG GTGATGCGCA CCTGTAGTCT2221 CAGCTACTCA GGAGGCTGAG GCAGGAGAAT CGCTTGAACC CGGGAGGCAG AGGTTGCACT2281 GAGCTGAGAT CACGCCACTG CACTCCAGCC TGGGCAACAG AGTGAGACTC CGTCTCAAAC2341 AAAAAAAAAA AAAAAAAAAA AAB:核苷酸序列(SEQ ID NO:23)长度:189个氨基酸
1 MWVTVGTTEL RPVVSSGQNW EVCFPWEDLS ALRGTRTSAH MHVCVYTHTH THTHTHTHIC
61 LPPSPRQTCL GSTPPQQELE DPCPVLFSVE GVELRWGDRT ERSRSRETEL LCSFCSRRWG
121 LGGGVEGQGW EQEQNRKPPC SLAFPLPSLA AHGARISMGT IKEAGAYQYY GPLHCSAWWF
181 FSSHTKDRNC.核苷酸及氨基酸组合序列(SEQ ID NO:24)克隆号:PP10897起始编码子:863 ATG 终止编码子:1430 TAA 蛋白质分子量:21317.911 G CAT GAA TCA GGT AAG AAG CCA GAC TGC TGA GGC AGA GTA GGG GGG 4647 AAG GAG GCA CAA GGG CCT TGC ACT CCA GCA AAG ATG GTA GAG ATG GGG 9495 AAG CAT TCG GGC TGG ACA GGA GAG ACC CAG GTT CCA GGC GCA GTG TGA 142143 AGC CTC AGC AGA CCC CAG TTT CAG AGG TTT GAG GAA GGA AAA TCA ACA 190191 GAC ACC CCG GGT ATG AAG TAG GGG CCA GGT TGT GGG CTC TGC CTC TGG 238239 GGA CAG GGC AGA TCC CTT CCT GCT TTA TTT GTG AGC CAC CTC AAC AGG 286 287 ACC CAG GCC ATC TGC AGG TAC TAG TGG CCT AGC TGG GTA GTC TTT CCT 334335 GAG GTC TCA CCT CAG GCC TTT GTG CTG CTG CTG TTG CTT CTG GCC TTG 382383 AGC CTG AGA GAG AGG TGA GAG GAA GGA TGC TTT CTC TAA CTT GGG CTC 430431 CTC CAA TCT CTG GTT GCA AAG CTG GGG TTG GGG GAG AGA GGA CCA CCC 478479 AAC CTG CCC TGT ACA AGC ATC AGT AAG ACT CCA AGT TTC CCA GGG CCC 526527 GAA CAC TTG GGG GTT GTC TCT CAA CAC CCG GCT GGA AGA CAA GTA GGT 574575 AAC CAG GTT CAG CCC CAC CTG CCA AGA ACA CTG TGT TTT GGG CCT GGC 622623 AGA GCT GCT ACT CCC CCT CTC CCT CCT AAG AAT GCC CAG AGA ATC ACT 670671 TGC CAA GGC TAC TCC TGG AGC TCA GCT GTG GGA TCA GGG TTT GGG CTG 718719 AGG ATC AGG TGC CTG TGT GCA CAC ATG TGC ACA TTG TGT GTG CCA ATG 766767 GGT GGT AGG GAT TGA GCC CGT TGT GAG AAC ATC CAG CCA GGT TGG AAG 814815 TGT GTA CAG GTA TCT GAG GGT GTG CAC GTG AGC AAG AGG GTG TGC AAG 862863 ATG TGG GTG ACT GTT GGG ACC ACA GAG CTG AGG CCT GTG GTC AGC TCA 9101 Met Trp Val Thr Val Gly Thr Thr Glu Leu Arg Pro Val Val Ser Ser 16911 GGT CAG AAC TGG GAG GTC TGT TTC CCT TGG GAG GAC CTG TCT GCT CTG 95817 Gly Gln Asn Trp Glu Val Cys Phe Pro Trp Glu Asp Leu Ser Ala Leu 32959 AGG GGG ACC CGG ACA AGT GCA CAT ATG CAT GTG TGT GTC TAC ACA CAC 100633 Arg Gly Thr Arg Thr Ser Ala His Met His Val Cys Val Tyr Thr His 481007 ACA CAC ACA CAC ACA CAC ACA CAC ACA CAC ATA TGC TTG CCT CCC TCT 105449 Thr His Thr His Thr His Thr His Thr His Ile Cys Leu Pro Pro Ser 641055 CCA AGG CAG ACT TGC CTG GGA AGT ACC CCT CCT CAG CAG GAG CTC GAA 110265 Pro Arg Gln Thr Cys Leu Gly Ser Thr Pro Pro Gln Gln Glu Leu Glu 801103 GAC CCC TGC CCA GTG CTG TTT TCA GTA GAG GGA GTG GAG CTG AGA TGG 115081 Asp Pro Cys Pro Val Leu Phe Ser Val Glu Gly Val Glu Leu Arg Trp 961151 GGA GAC CGT ACT GAG CGG TCC AGG AGT AGG GAA ACA GAG CTG CTT TGC 119897 Gly Asp Arg Thr Glu Arg Ser Arg Ser Arg Glu Thr Glu Leu Leu Cys 1121199 AGC TTC TGT TCC AGA AGA TGG GGG TTG GGG GGC GGG GTT GAG GGC CAG 1246113 Ser Phe Cys Ser Arg Arg Trp Gly Leu Gly Gly Gly Val Glu Gly Gln 1281247 GGG TGG GAG CAG GAG CAG AAC AGA AAG CCT CCC TGC TCA CTG GCC TTT 1294129 Gly Trp Glu Gln Glu Gln Asn Arg Lys Pro Pro Cys Ser Leu Ala Phe 1441295 CCC CTT CCC TCA CTG GCT GCC CAT GGA GCC AGG ATC AGC ATG GGA ACA 1342145 Pro Leu Pro Ser Leu Ala Ala His Gly Ala Arg Ile Ser Met Gly Thr 1601343 ATC AAG GAG GCA GGG GCT TAT CAG TAC TAT GGA CCC CTA CAC TGC TCT 1390161 Ile Lys Glu Ala Gly Ala Tyr Gln Tyr Tyr Gly Pro Leu His Cys Ser 1761391 GCC TGG TGG TTC TTC TCT TCG CAT ACC AAA GAC AGA AAT TAA GCC TCC 1438177 Ala Trp Trp Phe Phe Ser Ser His Thr Lys Asp Arg Asn *** 1901439 AAG AGT GGT AAC TGA CCT CGG TCA CAC TTG GTG GGT GTG GGA AAG GAT 14861487 TCA AAT GTA GGT CTG TTC TCT TCT TCA TCT ATC ATG GTC CCT GTC CTG 15341535 GAG GCA AGT CGT CTG GGG CTC AGA AAA CAC CCC TGT TGC CAC TGA TTG 15821583 GAA TTC CAA GGG TCT GGG TGA AGT GGG GAT GGG CCT CCA GCT TGC CTC 16301631 CAG CCT GAA AAA ATA GTA GAG GGT GTT GAG GCT GGG AAG GGA GGT GGG 16781679 GCT CAT GTT GTA CAG GGC CTG AGC CAG GGA GCT TGG GCT TCA TTC TGA 17261727 GTA CTG TGG CAG CCC TGG GAA GGT TTG TAG CAC AGA GGG ATA TTG TCA 17741775 TTT TTG GAA AGA TCC CTT TGG CTG CTT AGG TAG AGA AGG GCT TCA AGA 18221823 GGG CAG GAA GGG ACA GGA CTA CAG AAG GGG CTG CTT CAG AGT CCA GAT 18701871 TAA GGA AGG AGA GGC CTG GGC AGT CAG AAA GGA AGA GAA GCC GGA TGT 19181919 GGT GGC TTG TAT CTT CAA TCC CAG CAC TTT GAG AGG CCA AGG TGG GAG 19661967 GAT CAC TTG AGC CCA GGA GTT CAA AAC CAG CTT GGG CAA CAT AGT GAG 20142015 ACT CCC ATC TCT CCA AAA AAA TTT AAA AAC CAG CCA GGT AGA CTG GGC 20622063 GCA GTG GCT CAC GCC TGT AAT CCC AGA ACT TTG GGA GGC CGA GGC AGG 21102111 CAG ATC ACG AGG TCA AGA GTT AGA GAC CAG CCT GAC CAA CAT GGT GAA 21582159 ACC CCG TCT CTA CTA AAA ATA CAA AAC TTA GCC AGG CCT GTG GTG ATG 22062207 CGC ACC TGT AGT CTC AGC TAC TCA GGA GGC TGA GGC AGG AGA ATC GCT 22542255 TGA ACC CGG GAG GCA GAG GTT GCA CTG AGC TGA GAT CAC GCC ACT GCA 23022303 CTC CAG CCT GGG CAA CAG AGT GAG ACT CCG TCT CAA ACA AAA AAA AAA 23502351 AAA AAA AAA AAA 23629.PP10933A:核苷酸序列(SEQ ID NO:25)长度:1680个碱基1 GGGCGGGCGG AGCGCGGGCG CGGCGGGGGC GGGCGGCCAG GCTAGTCGGG CGGGTGCGCG61 GGGCGCTCGG GGCCCGGGGC CAGAGCTGGA GCCGGAGCCG GGCGGGCGCC ATGGAGGGGC121 TGCGGCGGGG GCTGTCGCGC TGGAAGCGCT ACCACATCAA GGTGCACCTG GCGGACGAGG181 CGCTGCTGCT ACCGCTGACC GTGCGGCCGC GGGACACGCT CAGCGACCTG CGCGCCCAGC241 TGGTGGGCCA GGGCGTGAGC TCCTGGAAGC GCGCCTTCTA CTACAACGCG CGGCGGCTGG301 ACGACCACCA GACGGTGCGC GACGCGCGCC TGCAGGACGG CTCGGTGCTG CTGCTCGTCA361 GCGACCCCAG GTAGTCTGGG TTGGAGGAGG CAGAGCCATG ACCAAGGGGA CCTGGGTACT421 GGCTGAAGGA ATAGGCTGGG GTAGAGGGCA CTTTTGGAAG GCACTTCTCC TGCCTCCTGG481 GAGCCTAGAT CTCACTCCAG GGTCTGGGCT CCCAGGTGGA CCATGAAACC CTGGCCTGAC541 CAGCTGATGC ACACTGCTTC AGACACTCCT GCTGGAGCCC CAGTCCCTGA CAAGGACCTA601 GGACATTTTT GCTCCTGCCC AGCCTATCGG GAGGGAGCCT TGAGCCTTTC AGCTCTGCTG661 TGTGACTTTG AGGTTGTTGC TCCCCTCTTG GGGCCCTGGG TGCCCTGTCT TCAGTGGAAA721 GCACTGTGCC ACCTTGGAAA GCTCCCATGG GCAGCCAGAG GGCATCGCAA GAAGAGAAGC781 ACAGAAGGGG CAGGAGAGAC ACTCAGAGGC ACTTCCGCTC TTGCCCAGGA CATTCTCCCA841 GCCACACCTT TGCCCAAGCC GTGCCCCCTG CCTGGAGCAC TTTTCAACCT CTTCTCTGCA901 GCTCCAATAC ACCTGGGATT GCAGTCTCCT CCAGGAAGTC TTCTCAGATT CCCTCCTTCC961 CAGCCAGAGA GCACCTAGCC TTCTTTGGGG CCCCCACAGG CCCTTTGTGC AGTGAACAGC1021 CCTGGCTGGG GGTGCAGCCA GTCGTGTCCG AACTCTCCAA TGACTAAGCG GGGAGATGCG1081 GACATCCTAG CTCCTTCTCA GGCCTCCAAC TGTGCCCCAT TTCCACCCCC AAATACCTCC1141 CCAGGAGGCA CCTGTGCCCA CCCCCTGGGC TGTTTCCCCC TTCCCCTTAA ATCCGGATGC1201 CTCGTCTTGC ATAGGGTCTT GGGGCAGCGG GGAAGGGGTT CTGAAGAACT CTGGCCAAGA1261 GGACGAGGAT CTGGGGGTGG GGAACTGGGC CTAGCTGTGG GAGGTCATCG CGGGGCATTG1321 CAGGGAGTGC GTTGTGGGAA TTCCGGGTGG AGACCCTCAG GGCAGTGTGC CGGGCCTCCG1381 TTGCACCTCT GACCTGCAGC CACGTCATCG TTGCGCAGCC CCTGGGGAGG GTCTTTGGGG1441 AGGGGGTGCC GAGGCTACGC ATGTCCTCGA GGGCCGTGTA CACTCTCCAG GCACCATGGG1501 CGGAGGCGCC AGAGGCTGGG AAGAAATAAT GTTTTAGTTA AGAGTCCTGT TGGCTGCAGG1561 ACTCAGAGCA TGGACAGGTG GATAGTAAAT CACCACCACG GGGAAAAAAA AAAAAAAAAA1621 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAAB:核苷酸序列(SEQ ID NO:26)长度:151个氨基酸
1 MKPWPDQLMH TASDTPAGAP VPDKDLGHFC SCPAYREGAL SLSALLCDFE VVAPLLGPWV
61 PCLQWKALCH LGKLPWAARG HRKKRSTEGA GETLRGTSAL AQDILPATPL PKPCPLPGAL
121 FNLFSAAPIH LGLQSPPGSL LRFPPSQPES TC.核苷酸及氨基酸组合序列(SEQ ID NO:27)克隆号:PP10933起始编码子:523 ATG 终止编码子:976 TAG 蛋白质分子量:16073.761 GGG CGG GCG GAG CGC GGG CGC GGC GGG GGC GGG CGG CCA GGC TAG TCG 4849 GGC GGG TGC GCG GGG CGC TCG GGG CCC GGG GCC AGA GCT GGA GCC GGA 9697 GCC GGG CGG GCG CCA TGG AGG GGC TGC GGC GGG GGC TGT CGC GCT GGA 144 145 AGC GCT ACC ACA TCA AGG TGC ACC TGG CGG ACG AGG CGC TGC TGC TAC 192193 CGC TGA CCG TGC GGC CGC GGG ACA CGC TCA GCG ACC TGC GCG CCC AGC 240241 TGG TGG GCC AGG GCG TGA GCT CCT GGA AGC GCG CCT TCT ACT ACA ACG 288289 CGC GGC GGC TGG ACG ACC ACC AGA CGG TGC GCG ACG CGC GCC TGC AGG 336337 ACG GCT CGG TGC TGC TGC TCG TCA GCG ACC CCA GGT AGT CTG GGT TGG 384385 AGG AGG CAG AGC CAT GAC CAA GGG GAC CTG GGT ACT GGC TGA AGG AAT 432433 AGG CTG GGG TAG AGG GCA CTT TTG GAA GGC ACT TCT CCT GCC TCC TGG 480481 GAG CCT AGA TCT CAC TCC AGG GTC TGG GCT CCC AGG TGG ACC ATG AAA 5281 Met Lys 2529 CCC TGG CCT GAC CAG CTG ATG CAC ACT GCT TCA GAC ACT CCT GCT GGA 5763 Pro Trp Pro Asp Gln Leu Met His Thr Ala Ser Asp Thr Pro Ala Gly 18577 GCC CCA GTC CCT GAC AAG GAC CTA GGA CAT TTT TGC TCC TGC CCA GCC 62419 Ala Pro Val Pro Asp Lys Asp Leu Gly His Phe Cys Ser Cys Pro Ala 34625 TAT CGG GAG GGA GCC TTG AGC CTT TCA GCT CTG CTG TGT GAG TTT GAG 67235 Tyr Arg Glu Gly Ala Leu Ser Leu Ser Ala Leu Leu Cys Asp Phe Glu 50673 GTT GTT GCT CCC CTC TTG GGG CCC TGG GTG CCC TGT CTT CAG TGG AAA 72051 Val Val Ala Pro Leu Leu Gly Pro Trp Val Pro Cys Leu Gln Trp Lys 66721 GCA CTG TGC CAC CTT GGA AAG CTC CCA TGG GCA GCC AGA GGG CAT CGC 76867 Ala Leu Cys His Leu Gly Lys Leu Pro Trp Ala Ala Arg Gly His Arg 82769 AAG AAG AGA AGC ACA GAA GGG GCA GGA GAG ACA CTC AGA GGC ACT TCC 81683 Lys Lys Arg Ser Thr Glu Gly Ala Gly Glu Thr Leu Arg Gly Thr Ser 98817 GCT CTT GCC CAG GAC ATT CTC CCA GCC ACA CCT TTG CCC AAG CCG TGC 86499 Ala Leu Ala Gln Asp Ile Leu Pro Ala Thr Pro Leu Pro Lys Pro Cys 114865 CCC CTG CCT GGA GCA CTT TTC AAC CTC TTC TCT GCA GCT CCA ATA CAC 912115 Pro Leu Pro Gly Ala Leu Phe Asn Leu Phe Ser Ala Ala Pro Ile His 130913 CTG GGA TTG CAG TCT CCT CCA GGA AGT CTT CTC AGA TTC CCT CCT TCC 960131 Leu Gly Leu Gln Ser Pro Pro Gly Ser Leu Leu Arg Phe Pro Pro Ser 146961 CAG CCA GAG AGC ACC TAG CCT TCT TTG GGG CCC CCA CAG GCC CTT TGT 1008147 Gln Pro Glu Ser Thr *** 1521009 GCA GTG AAC AGC CCT GGC TGG GGG TGC AGC CAG TCG TGT CCG AAC TCT 10561057 CCA ATG ACT AAG CGG GGA GAT GCG GAC ATC CTA GCT CCT TCT CAG GCC 11041105 TCC AAC TGT GCC CCA TTT CCA CCC CCA AAT ACC TCC CCA GGA GGC ACC 11521153 TGT GCC CAC CCC CTG GGC TGT TTC CCC CTT CCC CTT AAA TCC GGA TGC 12001201 CTC GTC TTG CAT AGG GTC TTG GGG CAG CGG GGA AGG GGT TCT GAA GAA 12481249 CTC TGG CCA AGA GGA CGA GGA TCT GGG GGT GGG GAA CTG GGC CTA GCT 12961297 GTG GGA GGT CAT CGC GGG GCA TTG CAG GGA GTG CGT TGT GGG AAT TCC 13441345 GGG TGG AGA CCC TCA GGG CAG TGT GCC GGG CCT CCG TTG CAC CTC TGA 13921393 CCT GCA GCC ACG TCA TCG TTG CGC AGC CCC TGG GGA GGG TCT TTG GGG 14401441 AGG GGG TGC CGA GGC TAC GCA TGT CCT CGA GGG CCG TGT ACA CTC TCC 14881489 AGG CAC CAT GGG CGG AGG CGC CAG AGG CTG GGA AGA AAT AAT GTT TTA 15361537 GTT AAG AGT CCT GTT GGC TGC AGG ACT CAG AGC ATG GAC AGG TGG ATA 15841585 GTA AAT CAC CAC CAC GGG GAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 16321633 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 168010. PP11246A:核苷酸序列(SEQ ID NO:28)长度:2059个碱基
1 GAGCCTGAGG GACCCGGCGG CTGGTGAGCG CCCGCTGGAG GCTGGAGCTT CCGGGCCCTG
61 GAAAGGGGTC CCCGCGCGCC CCGGGTCGGA GGCAGACCCC TGGGTTTGGG GGACATGGGC 121 ATTTGGGGCG CCTGAACCCA AGACCTCTGG ATGGTAGGGA TGCCCGGGCG TCCTGGATAC181 CCTGCGGGAC TCGGGGCTCC TGCGGGGAAG ATGGCACGTT TTACTGCCCA AGGAGTGGTC241 AGGGGGGTGG AGAAGCGCTG CGGATACCCT CAGGAGGTCT GCGACAGAGG GGGCTAGCTG301 CGCAGCCCAG GAGTGGTAGT GGCCCCCCTG GATGACAGGC CTGCCCGTAT CCTCCCCCAG361 AGCTGCCCCG TTCAGACCAT GGATCCTGAG GTGACCTTGC TTGTGCAGTG CCCTGGCGGG421 GGCCTGCCCC AGGAGCAGAT ACAGGCCGAG CTGAGCCCCG CCCATGACCG TCGCCCACTG481 CCAGGTGGGG ACGAGGCCAT CACTGCCATC TGGGAGACCC GGCTAAAGGC CCAACCCTGG541 CTCTTCGACG CCCCCAAGTT CCGCCTGCAC TCAGCCACCC TGGCGCCTAT TGGCTCTCGG601 GGGCCACAGC TGCTCCTGCG CCTGGGCCTT ACTTCCTACC GAGACTTCCT GGGCACCAAC661 TGGTCCAGCT CAGCTGCCTG GCTGCGACAG CAGGGTGCCA CCGACTGGGG TGACACGCAG721 GCCTATCTGG CGGACCCACT GGGGGTGGGC GCTGCACTAG CCACAGCCGA TGACTTCCTT781 GTCTTCCTGC GCCGCTCCCG GCAGGTGGCT GAGGCCCCTG GGCTGGTGGA CGTACCTGGT841 GGGCACCCTG AGCCTCAGGT GAGATTCCAG GCTGGGCACA AAGACCCAGA CAGCTCAAGG901 GAGCTGCAGC TCTCCACCCT CCCAATCCTC CCAGCTTTGG TTTCCCCATC CCTTAAAGGA961 AAATTGGCCT GGTATTTCTC TGGAAGTTTG CTCAGGGCAG TCCACCTGCC TCCCCACTGA1021 CCCCTGCCCC AGTCCTGTGA GAAACTAGAA AACACGGGAG GAAAGATTGG GCACAGGAAG1081 AAGATGCCCT ACTCCACCCC TGCCCCCTGT GTATCTCCTT TGAAGCTGGA CCTCTGGTTG1141 TCTGTCAGGG AAAGGACACC AGACTCAGGA TCACTAACTC TCTTACACTG TGCCACATCA1201 GACCCTCAAG GCCAGCAGGT ATAGGCTTGC TGGTCCTGAG ATGGGGCAGG GGGAAGAGGT1261 GGGGAGCAGG GGCTGAGCCT GACCTCTCAC AGGCCCTGTG CCCTGGTGGC AGCCCCCAGC1321 ACCAGGACCT CGCTGGGCAG CTGGTGGTAC ATGAACTCTT TTCCAGTGTC CTTCAGGAGA1381 TCTGTGATGA GGTGAGTGAG GTTGACCTGG ACAGGGTGGT AGACATGAAG GGAGGGGGTA1441 GGACTTGCCA GAATTCTACA GGTCTGGGCT GGCAGGAGGC CTGCAGGCAT CTGGCCAGCA1501 ATGAGGGAAG AAGTTGGCTT TGCAGCTATA CATACTTGGA GTGGAATTCT AGCCGTCAGT1561 ACCCTCTGCC TTGGATTCTT CTTCTTTTCT TTTTTCTTTC TTTTTTTTTT TTTAGACAGA1621 GTCTCGCTCT GTTGCCCAGG AGAATGGCGT GAACCCGGGA GGCGGAGGTT GCAGTGAGCC1681 GAAATCGCGC CACTGCACTT CAGCCTGGGC GACAAAGCGA GACTCCGTCT CAAAAAAAAG1741 AAAAAGGAGT AAGTGTGGCA GGGTGTGGTG GCTCACACCT GTAATCCCAG CACTTTGGGA1801 GGCCAAGGGC CAGCGGATCA CCTGAGGTCA GGAGTTCGAG ACCAGCCTGG CCAACATGGA1861 GAAACCCCAT CTCTACTAAA AATACAAAAA ATTAGCCAGG CGTTGTGGCG TGCACCTGTA1921 ATCCCAGCTA CTCAGGAGGC TGAGGCAGGA GAATCACTTT AACCTGGGAG GCAGAGGTTG1981 CAGTGAGCTG AGATCGTGCC ACTGTACTCC AGCCTGGGCG ACAGAGCGAG ACTCCATCTC2041 AAAAAAAAAA AAAAAAAAAB:核苷酸序列(SEQ ID NO:29) 长度:213个氨基酸
1 MDPEVTLLVQ CPGGGLPQEQ IQAELSPAHD RRPLPGGDEA ITAIWETRLK AQPWLFDAPK
61 FRLHSATLAP IGSRGPQLLL RLGLTSYRDF LGTNWSSSAA WLRQQGATDW GDTQAYLADP
121 LGVGAALATA DDFLVFLRRS RQVAEAPGLV DVPGGHPEPQ VRFQAGHKDP DSSRELQLST
181 LPILPALVSP SLKGKLAWYF SGSLLRAVHL PPHC.核苷酸及氨基酸组合序列(SEQ ID NO:30)克隆号:PP11246起始编码子:379 ATG 终止编码子:1018 TGA 蛋白质分子量:23100.941 GAG CCT GAG GGA CCC GGC GGC TGG TGA GCG CCC GCT GGA GGC TGG AGC 4849 TTC CGG GCC CTG GAA AGG GGT CCC CGC GCG CCC CGG GTC GGA GGC AGA 9697 CCC CTG GGT TTG GGG GAC ATG GGC ATT TGG GGC GCC TGA ACC CAA GAC 144145 CTC TGG ATG GTA GGG ATG CCC GGG CGT CCT GGA TAC CCT GCG GGA CTC 192193 GGG GCT CCT GCG GGG AAG ATG GCA CGT TTT ACT GCC CAA GGA GTG GTC 240241 AGG GGG GTG GAG AAG CGC TGC GGA TAC CCT CAG GAG GTC TGC GAC AGA 288289 GGG GGC TAG CTG CGC AGC CCA GGA GTG GTA GTG GCC CCC CTG GAT GAC 336337 AGG CCT GCC CGT ATC CTC CCC CAG AGC TGC CCC GTT CAG ACC ATG GAT 3841 Met Asp 2 385 CCT GAG GTG ACC TTG CTT GTG CAG TGC CCT GGC GGG GGC CTG CCC CAG 4323 Pro Glu Val Thr Leu Leu Val Gln Cys Pro Gly Gly Gly Leu Pro Gln 18433 GAG CAG ATA CAG GCC GAG CTG AGC CCC GCC CAT GAC CGT CGC CCA CTG 48019 Glu Gln Ile Gln Ala Glu Leu Ser Pro Ala His Asp Arg Arg Pro Leu 34481 CCA GGT GGG GAC GAG GCC ATC ACT GCC ATC TGG GAG ACC CGG CTA AAG 52835 Pro Gly Gly Asp Glu Ala Ile Thr Ala Ile Trp Glu Thr Arg Leu Lys 50529 GCC CAA CCC TGG CTC TTC GAC GCC CCC AAG TTC CGC CTG CAC TCA GCC 57651 Ala Gln Pro Trp Leu Phe Asp Ala Pro Lys Phe Arg Leu His Ser Ala 66577 ACC CTG GCG CCT ATT GGC TCT CGG GGG CCA CAG CTG CTC CTG CGC CTG 62467 Thr Leu Ala Pro Ile Gly Ser Arg Gly Pro Gln Leu Leu Leu Arg Leu 82625 GGC CTT ACT TCC TAC CGA GAC TTC CTG GGC ACC AAC TGG TCC AGC TCA 67283 Gly Leu Thr Ser Tyr Arg Asp Phe Leu Gly Thr Asn Trp Ser Ser Ser 98673 GCT GCC TGG CTG CGA CAG CAG GGT GCC ACC GAC TGG GGT GAC ACG CAG 72099 Ala Ala Trp Leu Arg Gln Gln Gly Ala Thr Asp Trp Gly Asp Thr Gln 114721 GCC TAT CTG GCG GAC CCA CTG GGG GTG GGC GCT GCA CTA GCC ACA GCC 768115 Ala Tyr Leu Ala Asp Pro Leu Gly Val Gly Ala Ala Leu Ala Thr Ala 130769 GAT GAC TTC CTT GTC TTC CTG CGC CGC TCC CGG CAG GTG GCT GAG GCC 816131 Asp Asp Phe Leu Val Phe Leu Arg Arg Ser Arg Gln Val Ala Glu Ala 146817 CCT GGG CTG GTG GAC GTA CCT GGT GGG CAC CCT GAG CCT CAG GTG AGA 864147 Pro Gly Leu Val Asp Val Pro Gly Gly His Pro Glu Pro Gln Val Arg 162865 TTC CAG GCT GGG CAC AAA GAC CCA GAC AGC TCA AGG GAG CTG CAG CTC 912163 Phe Gln Ala Gly His Lys Asp Pro Asp Ser Ser Arg Glu Leu Gln Leu 178913 TCC ACC CTC CCA ATC CTC CCA GCT TTG GTT TCC CCA TCC CTT AAA GGA 960179 Ser Thr Leu Pro Ile Leu Pro Ala Leu Val Ser Pro Ser Leu Lys Gly 194961 AAA TTG GCC TGG TAT TTC TCT GGA AGT TTG CTC AGG GCA GTC CAC CTG 1008195 Lys Leu Ala Trp Tyr Phe Ser Gly Ser Leu Leu Arg Ala Val His Leu 2101009 CCT CCC CAC TGA CCC CTG CCC CAG TCC TGT GAG AAA CTA GAA AAC ACG 1056211 Pro Pro His *** 2141057 GGA GGA AAG ATT GGG CAC AGG AAG AAG ATG CCC TAC TCC ACC CCT GCC 11041105 CCC TGT GTA TCT CCT TTG AAG CTG GAC CTC TGG TTG TCT GTC AGG GAA 11521153 AGG ACA CCA GAC TCA GGA TCA CTA ACT CTC TTA CAC TGT GCC ACA TCA 12001201 GAC CCT CAA GGC CAG CAG GTA TAG GCT TGC TGG TCC TGA GAT GGG GCA 12481249 GGG GGA AGA GGT GGG GAG CAG GGG CTG AGC CTG ACC TCT CAC AGG CCC 12961297 TGT GCC CTG GTG GCA GCC CCC AGC ACC AGG ACC TCG CTG GGC AGC TGG 13441345 TGG TAC ATG AAC TCT TTT CCA GTG TCC TTC AGG AGA TCT GTG ATG AGG 13921393 TGA GTG AGG TTG ACC TGG ACA GGG TGG TAG ACA TGA AGG GAG GGG GTA 14401441 GGA CTT GCC AGA ATT CTA CAG GTC TGG GCT GGC AGG AGG CCT GCA GGC 14881489 ATC TGG CCA GCA ATG AGG GAA GAA GTT GGC TTT GCA GCT ATA CAT ACT 15361537 TGG AGT GGA ATT CTA GCC GTC AGT ACC CTC TGC CTT GGA TTC TTC TTC 15841585 TTT TCT TTT TTC TTT CTT TTT TTT TTT TTA GAC AGA GTC TCG CTC TGT 16321633 TGC CCA GGA GAA TGG CGT GAA CCC GGG AGG CGG AGG TTG CAG TGA GCC 16801681 GAA ATC GCG CCA CTG CAC TTC AGC CTG GGC GAC AAA GCG AGA CTC CGT 17281729 CTC AAA AAA AAG AAA AAG GAG TAA GTG TGG CAG GGT GTG GTG GCT CAC 17761777 ACC TGT AAT CCC AGC ACT TTG GGA GGC CAA GGG CCA GCG GAT CAC CTG 18241825 AGG TCA GGA GTT CGA GAC CAG CCT GGC CAA CAT GGA GAA ACC CCA TCT 18721873 CTA CTA AAA ATA CAA AAA ATT AGC CAG GCG TTG TGG CGT GCA CCT GTA 19201921 ATC CCA GCT ACT CAG GAG GCT GAG GCA GGA GAA TCA CTT TAA CCT GGG 19681969 AGG CAG AGG TTG CAG TGA GCT GAG ATC GTG CCA CTG TAC TCC AGC CTG 20162017 GGC GAC AGA GCG AGA CTC CAT CTC AAA AAA AAA AAA AAA AAA A 205911.PP11347A:核苷酸序列(SEQ ID NO:31)长度:2432个碱基1 GAAACGTCTT GCATCCTTTT TGTCACTCAT CAACCAGAGG GACAGACCAG GCCCTGGGGT61 TTGAGTGTAC TTTGAGAGCA GAGTGGGATG TCCCTGTGTT TCCCACCTGT TTGCAGAGAC121 AGAATGGGAA AGGGTGAGTG TCCTAACTGC ATGCCCAACT CATCTCCTGC ACTCTGCATG181 CCGAGGTGCC CCCCGAATGC CAGGAAGGCA TCTGTGGCTG GGCATGGTGG AGCCACCTTG241 ACAGAGCGCA GAGAGCCGTT TCCACTAACG CCTCCCGGTG CTGTCCTGGT CGGCCTGCGA301 TGGGGGTCCT GGCTGAGCCC AAGCAAGGGG AGGGAGCTCA GGGCTGACCC CTCTGCCAGA361 GATCGGCTCT GTGCTTGGAA TATGGAACCC AAAGACCTTA ACACTGCCCT TCTCTCTGCC421 TTCACCACTC CAGGAGCCCG GTGGGCACCT ACCACATCTC TAGTCTAGCC AGCACGCGAG481 TCCCGAGGGT GGGCCTGAAT TCCTGAGCTT GCTCTCGCGT GCCTTTCAGG CGATGAGAAT541 GATTTATTTG TTTGTGATGC ATGTTTGCTG AAAGATTAAT AAATCATTTC TGTGCCTTTA601 GCAAACTTCC TGTGTTGCTC TTAAAAAGGG ATCATCCACC TTCCCGGACC ACAAGGTTAA661 GGTAACCCCG CTAGGTAACC CTGATAGGCC TGCTGCGGGG CAGACCGACA GAGAGAGAGA721 GAGTGAGGGC GAGGGTGAGG TAAGCAACGC CCCGGGAACC CCGGGGTCCC TGGCTCACAT781 CTCCTCGCCA GCTCAGGCGC CTTCTGGGAA AATGAATCCT TGCATTTTTC TGTTCTCTAA841 TATGGCTTTT GAGGTCTTAA ATTTGAGGAG CCGGAATCAT GCCTTCCTCC TAATCTGCAG901 GGCCTCTTTG GAGCTGCCCC CGCCAGCAGT GAAGGGTGCT TGTCGGCCAG GGCGCCTCTC961 CCCGGGCGCC TGGCTGGAGG TGGCTGGAGC TGGGACGGGC AGGGCCCTGG CTGGGGTGGT1021 GGTTGGCAGC TCAGCTCTCC TCCCTTGGCT GCCCTTGCTG AACCCACCCC TGACCTTTGT1081 GGGCAGCTGC AGTGTCAGGC GGGAGCTCGG GGCTCTTGCT CCAAGACTCT TGAGCTCCCA1141 GGAAGACCTG CCACACCGGC ATCAGTGGCT GCTGCTGTGG CCACGTGAGG TGGGGCTGTG1201 AGGGGAGGCG GCTGCTGTGG ATGATGCCAG GACCCTGGGG GCAGAGCCTC TGAGAAGGTG1261 GGCTCCCTGG CTGCACAGTG TCAGGCAGAA CCCCTGGCTG CCTGCTGAAA GCCCCAAGGT1321 CAGGGGCTGC CCAGCTCCCC GCGCTGCGGT CTGTGGTGGC CCCGTGCATG CACCGGGTGG1381 CTGGCCCGCT GAGCTTCCCC GGCACCAGGT GCCCTGGACC TCGAGGTCCT GAGCCTGACC1441 CAGGGCTGGT CTGACCGACT CTCTGCTTCT GGCTCCTGGG CACTTCTTCT CAGCTCAGGG1501 CGTGCTCTGT CAAAACCAAG TCCTTTCTTG GCTCTGTGTC AGGCGGGGTG TTCAGCAGGG1561 GTCACCTGGC TCTTCTGTCT TTGCAGGGCC CCCTCGTGCG CTGGCTCAAG GTGAACTTCA1621 GTGAAGCCTT CATTGCCTGG ATCCACATCA AGGCCCTGAG AGTGTTTGTG GAGTCCGTGC1681 TCAGGTGCGT GGCAGTGATG CCCCGGCTGG GACTGTCCTG AGGATGGGCA GGGTCTGGGG1741 GAGCTATCGG GGCACCCCAG CTCCTGCCTT CTCTCCATCC TCCACCCGTC TCCTTTCTGA1801 GACTGTGGCT GTTGGCAACA CGCTCAATTC CGAGTCAAGT ACACCCTCCC CTCAGCCCTG1861 TGTCCCCTGC TGTCTGCTCC CTCCGTTCCT GCTACACTTG GGGCAAGTGT CACCTGGGTT1921 CTCCCCAGCT GCCCTACCTG CATGCCCTTG TGGACCCTCT GGCTGGCTCC TGTCCCCACC1981 CTCGTGAAGC CGCAGGGCCG AGTGGCTCCT GGAAGGCGCT CTCGGGCTGC CTCCGTCCTC2041 AGCCTGGAAG CCGCACCCCT CAAGGCAGTC CAGAGAGAAA ACCAAAACCA CACCAACAAC2101 AACAAAGCTT ATTTTGCCTT TTTTTTTTTT ATTTGAGATG GAGTTTCACT CTTGTCGCCC2161 AGGCTAGAGT GCAATGGCAT GTTCCTGGCT CACTGAAACC TCCACCTCTC AGGTTCAGGA2221 GATTCTCCTG TCTCAGCCCA CCTCTACTAA AAATACAGAA ATTAGCCGGG TGTGGTGGCA2281 TGGGCCTGTA GTACTGGCTA CTTGGGAGGC TGAGGTGGGA GGATCACTTG AGCCTCGGAG2341 CCGGAGGTTG CAGTGAGCCG AGATCGCGTC ACTGCACTCG AGCCTGGGCA ACAAGAGAAA2401 CTCCGGCTAT AGAAAAAAAA AAAAAAAAAA AAB:核苷酸序列(SEQ ID NO:32)长度:129个氨基酸
1 MNPCIFLFSN MAFEVLNLRS RNHAFLLICR ASLELPPPAV KGACRPGRLS PGAWLEVAGA
61 GTGRALAGVV VGSSALLPWL PLLNPPLTFV GSCSVRRELG ALAPRLLSSQ EDLPHRHQWL
121 LLWPREVGLC.核苷酸及氨基酸组合序列(SEQ ID NO:33)克隆号:PP11347起始编码子:812 ATG 终止编码子:1199 TGA 蛋白质分子量:13981.691 G AAA CGT CTT GCA TCC TTT TTG TCA CTC ATC AAC CAG AGG GAC AGA 4647 CCA GGC CCT GGG GTT TGA GTG TAC TTT GAG AGC AGA GTG GGA TGT CCC 9495 TGT GTT TCC CAC CTG TTT GCA GAG ACA GAA TGG GAA AGG GTG AGT GTC 142143 CTA ACT GCA TGC CCA ACT CAT CTC CTG CAC TCT GCA TGC CGA GGT GCC 190191 CCC CGA ATG CCA GGA AGG CAT CTG TGG CTG GGC ATG GTG GAG CCA CCT 238239 TGA CAG AGC GCA GAG AGC CGT TTC CAC TAA CGC CTC CCG GTG CTG TCC 286287 TGG TCG GCC TGC GAT GGG GGT CCT GGC TGA GCC CAA GCA AGG GGA GGG 334335 AGC TCA GGG CTG ACC CCT CTG CCA GAG ATC GGC TCT GTG CTT GGA ATA 382383 TGG AAC CCA AAG ACC TTA ACA CTG CCC TTC TCT CTG CCT TCA CCA CTC 430431 CAG GAG CCC GGT GGG CAC CTA CCA CAT CTC TAG TCT AGC CAG CAC GCG 478479 AGT CCC GAG GGT GGG CCT GAA TTC CTG AGC TTG CTC TCG CGT GCC TTT 526527 CAG GCG ATG AGA ATG ATT TAT TTG TTT GTG ATG CAT GTT TGC TGA AAG 574575 ATT AAT AAA TCA TTT CTG TGC CTT TAG CAA ACT TCC TGT GTT GCT CTT 622623 AAA AAG GGA TCA TCC ACC TTC CCG GAC CAC AAG GTT AAG GTA ACC CCG 670671 CTA GGT AAC CCT GAT AGG CCT GCT GCG GGG CAG ACC GAC AGA GAG AGA 718719 GAG AGT GAG GGC GAG GGT GAG GTA AGC AAC GCC CCG GGA ACC CCG GGG 766767 TCC CTG GCT CAC ATC TCC TCG CCA GCT CAG GCG CCT TCT GGG AAA ATG 8141 Met 1815 AAT CCT TGC ATT TTT CTG TTC TCT AAT ATG GCT TTT GAG GTC TTA AAT 8622 Asn Pro Cys Ile Phe Leu Phe Ser Asn Met Ala Phe Glu Val Leu Asn 17863 TTG AGG AGC CGG AAT CAT GCC TTC CTC CTA ATC TGC AGG GCC TCT TTG 91018 Leu Arg Ser Arg Asn His Ala Phe Leu Leu Ile Cys Arg Ala Ser Leu 33911 GAG CTG CCC CCG CCA GCA GTG AAG GGT GCT TGT CGG CCA GGG CGC CTC 95834 Glu Leu Pro Pro Pro Ala Val Lys Gly Ala Cys Arg Pro Gly Arg Leu 49959 TCC CCG GGC GCC TGG CTG GAG GTG GCT GGA GCT GGG ACG GGC AGG GCC 100650 Ser Pro Gly Ala Trp Leu Glu Val Ala Gly Ala Gly Thr Gly Arg Ala 651007 CTG GCT GGG GTG GTG GTT GGC AGC TCA GCT CTC CTC CCT TGG CTG CCC 105466 Leu Ala Gly Val Val Val Gly Ser Ser Ala Leu Leu Pro Trp Leu Pro 811055 TTG CTG AAC CCA CCC CTG ACC TTT GTG GGC AGC TGC AGT GTC AGG CGG 110282 Leu Leu Asn Pro Pro Leu Thr Phe Val Gly Ser Cys Ser Val Arg Arg 971103 GAG CTC GGG GCT CTT GCT CCA AGA CTC TTG AGC TCC CAG GAA GAC CTG 115098 Glu Leu Gly Ala Leu Ala Pro Arg Leu Leu Ser Ser Gln Glu Asp Leu 1131151 CCA CAC CGG CAT CAG TGG CTG CTG CTG TGG CCA CGT GAG GTG GGG CTG 1198114 Pro His Arg His Gln Trp Leu Leu Leu Trp Pro Arg Glu Val Gly Leu 1291199 TGA GGG GAG GCG GCT GCT GTG GAT GAT GCC AGG ACC CTG GGG GCA GAG 1246130 *** 1301247 CCT CTG AGA AGG TGG GCT CCC TGG CTG CAC AGT GTC AGG CAG AAC CCC 12941295 TGG CTG CCT GCT GAA AGC CCC AAG GTC AGG GGC TGC CCA GCT CCC CGC 13421343 GCT GCG GTC TGT GGT GGC CCC GTG CAT GCA CCG GGT GGC TGG CCC GCT 13901391 GAG CTT CCC CGG CAC CAG GTG CCC TGG ACC TCG AGG TCC TGA GCC TGA 14381439 CCC AGG GCT GGT CTG ACC GAC TCT CTG CTT CTG GCT CCT GGG CAC TTC 14861487 TTC TCA GCT CAG GGC GTG CTC TGT CAA AAC CAA GTC CTT TCT TGG CTC 15341535 TGT GTC AGG CGG GGT GTT CAG CAG GGG TCA CCT GGC TCT TCT GTC TTT 15821583 GCA GGG CCC CCT CGT GCG CTG GCT CAA GGT GAA CTT CAG TGA AGC CTT 16301631 CAT TGC CTG GAT CCA CAT CAA GGC CCT GAG AGT GTT TGT GGA GTC CGT 16781679 GCT CAG GTG CGT GGC AGT GAT GCC CCG GCT GGG ACT GTC CTG AGG ATG 17261727 GGC AGG GTC TGG GGG AGC TAT CGG GGC ACC CCA GCT CCT GCC TTC TCT 17741775 CCA TCC TCC ACC CGT CTC CTT TCT GAG ACT GTG GCT GTT GGC AAC ACG 18221823 CTC AAT TCC GAG TCA AGT ACA CCC TCC CCT CAG CCC TGT GTC CCC TGC 18701871 TGT CTG CTC CCT CCG TTC CTG CTA CAC TTG GGG CAA GTG TCA CCT GGG 19181919 TTC TCC CCA GCT GCC CTA CCT GCA TGC CCT TGT GGA CCC TCT GGC TGG 19661967 CTC CTG TCC CCA CCC TCG TGA AGC CGC AGG GCC GAG TGG CTC CTG GAA 20142015 GGC GCT CTC GGG CTG CCT CCG TCC TCA GCC TGG AAG CCG CAC CCC TCA 20622063 AGG CAG TCC AGA GAG AAA ACC AAA ACC ACA CCA ACA ACA ACA AAG CTT 21102111 ATT TTG CCT TTT TTT TTT TTA TTT GAG ATG GAG TTT CAC TCT TGT CGC 21582159 CCA GGC TAG AGT GCA ATG GCA TGT TCC TGG CTC ACT GAA ACC TCC ACC 22062207 TCT CAG GTT CAG GAG ATT CTC CTG TCT CAG CCC ACC TCT ACT AAA AAT 22542255 ACA GAA ATT AGC CGG GTG TGG TGG CAT GGG CCT GTA GTA CTG GCT ACT 23022303 TGG GAG GCT GAG GTG GGA GGA TCA CTT GAG CCT CGG AGC CGG AGG TTG 23502351 CAG TGA GCC GAG ATC GCG TCA CTG CAC TCG AGC CTG GGC AAC AAG AGA 23982399 AAC TCC GGC TAT AGA AAA AAA AAA AAA AAA AAA A 243212.PP11517A:核苷酸序列(SEQ ID NO:34)长度:2169个碱基1 GCCAGTGGGA GCAGGCGCCC CGGCCAGCGC AGACCTGGAG GCGCACGGGC GCCGCACCGC61 ACGATTCGGC TCGGGGTAGA GCGGAGCCGC AGCCCCACGC GCAGCCCAGG ACCCACTCGC121 CACCGCCGCT TCCTCAGCAC CCATGGGGAC CAGGAGACTT TAAAGGAGTT TGGGGTTTCG181 GGAGCAGGGA AATCACGGAT CCCCGCTCCT GGCCCTCGCC TCGCCACCTC ATTGATGGGC241 AACCAACTGG ACCGCATCAC CCACCTCAAC TACAGCGAGT TGCCCACAGG GGACCCGTCG301 GGGATTGAAA AGGACGAACT GCGGGTCGGG GTTGCCTACT TCTTCTCGGA TGATGAGGAA361 GACCTGGACG AACGCGGGCA GCCCGACAAG TTTGGCGTGA AGGCCCCCCC GGTTGCACCC421 CCTGCCCGGA GAGCCCCAGC CGCCACCACC ACCACCTGCT GCACCAGCTG GTCCTCAACG481 AGACTCAGTT TTCCGCCTTT CGGGGCCAGG AATGCATCTT TTCCAAAGTG AGCGGTGGCC541 CTCAGGGCGC CGACCTAAGC GTCTACGCGG TCACCGCGCT GCCAGCCGTC TGCGAACCCG601 GCGACCTGCT GGAGCTGCTG TGGCTGCAGC CCGCGCCGGA GCCGCCCGCG CCCGCCCCGC661 ACTGGGCCGT CTACGTGGGC GGCGGGCAGA TCATCCACCT GCACCAAGGC GAGATCCGCC721 AGACAAGCCG GATGAGGCGG GCGCGGCCAA CGTGGGCCGG GTGGTGAATA GCTGGTACCG781 CTACCGCCCG CTGGTGGCCG AGCTGGTGGT GCAGAACGCC TGCGGCCACC TGGGCCTCAA841 GAGCGAGGAG ATCTGCTGGA CGAACTCGGA GAGCTTCGCC GCCTGGTGCC GCTTTGGCAA901 GCGGGAGTTC AAGGCGGGAG GGGAGGTGCC GGCACGGCTA GCCCCCGCAG CAGCAGTACT961 ATCTCAAGGT GCACCTGGGA GAGAACAAGG TCCACACCGC CAGTTTCACA GCCTGGAAGA1021 CCTCATCCGC GAGAAGCGCC TGTATCGACG CCAGCGGCCG CCTGCGAGTG CTCCAGGAGC1081 TCGCCGACCT CGTGGACGAC AAGGAGTAGC CGCCTAGGGG CTGCCGGCCC CTCTGCCTCC1141 CCCGCACCTC GCTCCCTTCC CTTCCCCGCA CCCGGACTTC GCAGTCAGCG GTTCTAAACC1201 TCTGCCCCGC CCCGCCACGC GCGTCCGCCG CCGGTGGCCC GGGCCCGGGC TTGCACCCCC1261 GCATCCCCAA GCCAGCGGCA GGGAAGTCTC AGGAACTGCC CCAGGCCGAA AGGCGCCGCT1321 GCGAGCGCCT GGCTGACAGC CACAGCGGTG GTGACGGTGC TGGGAGACCC CGCGTGCGCT1381 TTCCCCTTGA GATGTAAACC GGGAACGGGG AAGGGGCTGA GGGGAGAAAG GACATGGCCT1441 TCCCCGCGAG TCCATGGCCA GTGACTGTGG CCCGACTCGA AAACAACCCT CTTCTCAAAA1501 GGGACCATCA CCGCCCCGAG CGTGCGCACA CAGACCGGTC GGAGGCGAGA ACTGGTCTCT1561 ACAGGGCACA GTTCAGCTCC TCTGTGGATG CGTCCCCAGA TCGCAGGATT TCCAAGAAAT1621 CGAGCCTGTC CCTTGTGCAC TTGGGAATAA TTCCCCAAGA CAGCACTTCG GGATTCCGGG1681 TTATCCTGAG GCTGCCCGGG ACTTTTCCAG CTCTCCAGCC CCAGGTCTCC TGACATTGTG1741 TTCCAGGCTG CGGGCTAAGC CAGACAGTGT TTGCCTCCGG TTCTTTCCAC CGTGGGAAGC1801 GAACGCCACC CCCACCCGCC TTTGCCTGCG AGTCTCCCTC GCTGGCAGAA GGGAAGCCGG1861 CCCGGTCCCG GGAGGAAGAT GGCCGCTGCG AATTCGGTGA GGACAGCCGG CCCCGCCCCC 1921 GACAAGGAGC TCGCTCGTTC ACCTGGTGTC TGGGAACTTG AATGTGTGAA GGGCGCTTAT1981 TGTTCTGAAC CCTTGATTGC TCCCTCCTCG GGCTGCATTT CAAAAATAGT CATATTTTTA2041 AAGGAGTTGG AGGAGAGGGA GGGGGAGGAC ATGGCACCAT TCCAGAAACC AGCATTGCTA2101 CAACACCATA GCCAGTATAT TTAGCTTTGG CTTTTCCTAA CATAGAAATC TTCAAAGCTG2161 GGGAAGTGGB:核苷酸序列 (SEQ ID NO:35)长度:201个氨基酸
1 MHLFQSERWP SGRRPKRLRG HRAASRLRTR RPAGAAVAAA RAGAARARPA LGRLRGRRAD
61 HPPAPRRDPP DKPDEAGAAN VGRVVNSWYR YRPLVAELVV QNACGHLGLK SEEICWTNSE
121 SFAAWCRFGK REFKAGGEVP ARLAPAAAVL SQGAPGREQG PHRQFHSLED LIREKRLYRR
181 QRPPASAPGA RRPRGRQGVA AC.核苷酸及氨基酸组合序列(SEQ ID NO:36)克隆号:PP11517起始编码子:512 ATG 终止编码子:1115 TAG 蛋白质分子量:22212.071 G CCA GTG GGA GCA GGC GCC CCG GCC AGC GCA GAC CTG GAG GCG CAC 4647 GGG CGC CGC ACC GCA CGA TTC GGC TCG GGG TAG AGC GGA GCC GCA GCC 9495 CCA CGC GCA GCC CAG GAC CCA CTC GCC ACC GCC GCT TCC TCA GCA CCC 142143 ATG GGG ACC AGG AGA CTT TAA AGG AGT TTG GGG TTT CGG GAG CAG GGA 190191 AAT CAC GGA TCC CCG CTC CTG GCC CTC GCC TCG CCA CCT CAT TGA TGG 238239 GCA ACC AAC TGG ACC GCA TCA CCC ACC TCA ACT ACA GCG AGT TGC CCA 286287 CAG GGG ACC CGT CGG GGA TTG AAA AGG ACG AAC TGC GGG TCG GGG TTG 334335 CCT ACT TCT TCT CGG ATG ATG AGG AAG ACC TGG ACG AAC GCG GGC AGC 382383 CCG ACA AGT TTG GCG TGA AGG CCC CCC CGG TTG CAC CCC CTG CCC GGA 430431 GAG CCC CAG CCG CCA CCA CCA CCA CCT GCT GCA CCA GCT GGT CCT CAA 478479 CGA GAC TCA GTT TTC CGC CTT TCG GGG CCA GGA ATG CAT CTT TTC CAA 5261 Met His Leu Phe Gln 5527 AGT GAG CGG TGG CCC TCA GGG CGC CGA CCT AAG CGT CTA CGC GGT CAC 5746 Ser Glu Arg Trp Pro Ser Gly Arg Arg Pro Lys Arg Leu Arg Gly His 21575 CGC GCT GCC AGC CGT CTG CGA ACC CGG CGA CCT GCT GGA GCT GCT GTG 62222 Arg Ala Ala Ser Arg Leu Arg Thr Arg Arg Pro Ala Gly Ala Ala Val 37623 GCT GCA GCC CGC GCC GGA GCC GCC CGC GCC CGC CCC GCA CTG GGC CGT 67038 Ala Ala Ala Arg Ala Gly Ala Ala Arg Ala Arg Pro Ala Leu Gly Arg 53671 CTA CGT GGG CGG CGG GCA GAT CAT CCA CCT GCA CCA AGG CGA GAT CCG 71854 Leu Arg Gly Arg Arg Ala Asp His Pro Pro Ala Pro Arg Arg Asp Pro 69719 CCA GAC AAG CCG GAT GAG GCG GGC GCG GCC AAC GTG GGC CGG GTG GTG 76670 Pro Asp Lys Pro Asp Glu Ala Gly Ala Ala Asn Val Gly Arg Val Val 85767 AAT AGC TGG TAC CGC TAC CGC CCG CTG GTG GCC GAG CTG GTG GTG CAG 81486 Asn Ser Trp Tyr Arg Tyr Arg Pro Leu Val Ala Glu Leu Val Val Gln 101815 AAC GCC TGC GGC CAC CTG GGC CTC AAG AGC GAG GAG ATC TGC TGG ACG 862102 Asn Ala Cys Gly His Leu Gly Leu Lys Ser Glu Glu Ile Cys Trp Thr 117863 AAC TCG GAG AGC TTC GCC GCC TGG TGC CGC TTT GGC AAG CGG GAG TTC 910118 Asn Ser Glu Ser Phe Ala Ala Trp Cys Arg Phe Gly Lys Arg Glu Phe 133911 AAG GCG GGA GGG GAG GTG CCG GCA CGG CTA GCC CCC GCA GCA GCA GTA 958134 Lys Ala Gly Gly Glu Val Pro Ala Arg Leu Ala Pro Ala Ala Ala Val 149959 CTA TCT CAA GGT GCA CCT GGG AGA GAA CAA GGT CCA CAC CGC CAG TTT 1006150 Leu Ser Gln Gly Ala Pro Gly Arg Glu Gln Gly Pro His Arg Gln Phe 1651007 CAC AGC CTG GAA GAC CTC ATC CGC GAG AAG CGC CTG TAT CGA CGC CAG 1054166 His Ser Leu Glu Asp Leu Ile Arg Glu Lys Arg Leu Tyr Arg Arg Gln 1811055 CGG CCG CCT GCG AGT GCT CCA GGA GCT CGC CGA CCT CGT GGA CGA CAA 1102182 Arg Pro Pro Ala Ser Ala Pro Gly Ala Arg Arg Pro Arg Gly Arg Gln 1971103 GGA GTA GCC GCC TAG GGG CTG CCG GCC CCT CTG CCT CCC CCG CAC CTC 1150198 Gly Val Ala Ala *** 2021151 GCT CCC TTC CCT TCC CCG CAC CCG GAC TTC GCA GTC AGC GGT TCT AAA 11981199 CCT CTG CCC CGC CCC GCC ACG CGC GTC CGC CGC CGG TGG CCC GGG CCC 12461247 GGG CTT GCA CCC CCG CAT CCC CAA GCC AGC GGC AGG GAA GTC TCA GGA 12941295 ACT GCC CCA GGC CGA AAG GCG CCG CTG CGA GCG CCT GGC TGA CAG CCA 13421343 CAG CGG TGG TGA CGG TGC TGG GAG ACC CCG CGT GCG CTT TCC CCT TGA 13901391 GAT GTA AAC CGG GAA CGG GGA AGG GGC TGA GGG GAG AAA GGA CAT GGC 14381439 CTT CCC CGC GAG TCC ATG GCC AGT GAC TGT GGC CCG ACT CGA AAA CAA 14861487 CCC TCT TCT CAA AAG GGA CCA TCA CCG CCC CGA GCG TGC GCA CAC AGA 15341535 CCG GTC GGA GGC GAG AAC TGG TCT CTA CAG GGC ACA GTT CAG CTC CTC 15821583 TGT GGA TGC GTC CCC AGA TCG CAG GAT TTC CAA GAA ATC GAG CCT GTC 16301631 CCT TGT GCA CTT GGG AAT AAT TCC CCA AGA CAG CAC TTC GGG ATT CCG 16781679 GGT TAT CCT GAG GCT GCC CGG GAC TTT TCC AGC TCT CCA GCC CCA GGT 17261727 CTC CTG ACA TTG TGT TCC AGG CTG CGG GCT AAG CCA GAC AGT GTT TGC 17741775 CTC CGG TTC TTT CCA CCG TGG GAA GCG AAC GCC ACC CCC ACC CGC CTT 18221823 TGC CTG CGA GTC TCC CTC GCT GGC AGA AGG GAA GCC GGC CCG GTC CCG 18701871 GGA GGA AGA TGG CCG CTG CGA ATT CGG TGA GGA CAG CCG GCC CCG CCC 19181919 CCG ACA AGG AGC TCG CTC GTT CAC CTG GTG TCT GGG AAC TTG AAT GTG 19661967 TGA AGG GCG CTT ATT GTT CTG AAC CCT TGA TTG CTC CCT CCT CGG GCT 20142015 GCA TTT CAA AAA TAG TCA TAT TTT TAA AGG AGT TGG AGG AGA GGG AGG 20622063 GGG AGG ACA TGG CAC CAT TCC AGA AAC CAG CAT TGC TAC AAC ACC ATA 21102111 GCC AGT ATA TTT AGC TTT GGC TTT TCC TAA CAT AGA AAT CTT CAA AGC 21582159 TGG GGA AGT GG 2169
Claims (10)
1.一种分离的具有促进3T3细胞转化功能的人蛋白,其特征在于,它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35;
或其保守性变异多肽、或其活性片段、或其活性衍生物。
2.如权利要求1所述的多肽,其特征在于,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
3.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性:
(a)编码如权利要求1和2所述多肽的多核苷酸;
(b)与多核苷酸(a)互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
(a)用权利要求6所述的载体转化或转导的宿主细胞;
(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有促进3T3细胞转化功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含:
(a)在适合表达具有促进3T3细胞转化功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;
(b)从培养物中分离出具有促进3T3细胞转化功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有促进3T3细胞转化功能的人蛋白特异性结合的抗体。
10.一种核酸分子,它含有权利要求3所述的多核苷酸中连续的10-800个核苷酸。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN01126724A CN1403476A (zh) | 2001-09-12 | 2001-09-12 | 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN01126724A CN1403476A (zh) | 2001-09-12 | 2001-09-12 | 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1403476A true CN1403476A (zh) | 2003-03-19 |
Family
ID=4666731
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN01126724A Pending CN1403476A (zh) | 2001-09-12 | 2001-09-12 | 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1403476A (zh) |
-
2001
- 2001-09-12 CN CN01126724A patent/CN1403476A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hamada et al. | Isolation and characterization of a novel secretory protein, stromal cell-derived factor-2 (SDF-2) using the signal sequence trap method | |
US5686598A (en) | Genes associated with retinal dystrophies | |
CN1403476A (zh) | 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1343725A (zh) | 人血管生成素样蛋白和编码序列及其用途 | |
CN1313297A (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN100478355C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1309135A (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1351081A (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1368509A (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1403478A (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN100478354C (zh) | 具有抑癌功能的新的人蛋白及其编码序列 | |
CN1313317A (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1403477A (zh) | 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1368510A (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1313298A (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1952134A (zh) | 促进人体转录因子NF-κB活化的多核苷酸及其编码多肽和用途 | |
CN1313315A (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1369505A (zh) | 具有促进3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN100552027C (zh) | 与癌症相关的基因家族 | |
CN1323803A (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1313316A (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1458169A (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1429841A (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1351079A (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1368508A (zh) | 具有抑癌功能的新的人蛋白及其编码序列 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |