CN1705745A - 与癌症相关的基因家族 - Google Patents
与癌症相关的基因家族 Download PDFInfo
- Publication number
- CN1705745A CN1705745A CN 200380101640 CN200380101640A CN1705745A CN 1705745 A CN1705745 A CN 1705745A CN 200380101640 CN200380101640 CN 200380101640 CN 200380101640 A CN200380101640 A CN 200380101640A CN 1705745 A CN1705745 A CN 1705745A
- Authority
- CN
- China
- Prior art keywords
- seq
- leu
- ala
- nucleic acid
- gln
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明总地涉及来自癌症病人的人组织中基因表达的变化。具体来说,本发明涉及在乳腺、结肠、食管、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、直肠和/或胃的癌症组织与相应的正常组织相比差异表达的人基因家族。
Description
发明领域
本发明涉及来自癌症病人的人组织中基因表达的变化。具体来说,本发明涉及那些在乳腺、结肠、食管、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、直肠和/或胃的癌组织中与相应的正常组织相比差异表达的人基因。
发明背景
在美国,有超过100万新发的癌症病例被诊断,大约有50万人死于癌症。癌症的原因是多种多样的,包括遗传倾向、环境影响、传染因素和衰老。这些因素通过脱开广泛的调节和下游效应器途径将正常细胞转化为癌变细胞。有几种基本的细胞生理学变化合在一起共同支配了恶性的生长:生长信号的自给自足、对生长抑制信号的不敏感性、程序性细胞死亡的规避、无限的复制潜力、持续的血管生成以及组织侵害和转移(Hanahan和Weinberg(2000),Cell 100:57-70)。
到目前为止,研究人员已经能够鉴定许多据信是肿瘤发生的原因的遗传变化。这些遗传变化包括致癌基因的扩增和导致肿瘤抑制基因丧失的突变。致癌基因起初被鉴定为病毒携带的能够引起它们的靶细胞转化的基因。一类主要的病毒致癌基因在细胞中有其对应物,它们参与正常的细胞功能。细胞中的基因被称为原癌基因,在某些病例中,它们在细胞中的突变或畸变与肿瘤的形成相关。致癌基因的产生代表功能的获得,其中细胞内的原癌基因被不适当地激活了。这可以包括蛋白的突变变化、或组成性的活化、过量表达、或不能在适当的时间关闭表达。已经鉴定了大约100个致癌基因。致癌基因的例子包括但不限于ras、fos、myc、abl和myb(Ponder(2001),Nature 411:336-341)。肿瘤抑制基因在其野生型等位基因中表达能够抑制异常的细胞增殖的蛋白。当为肿瘤抑制蛋白编码的基因被突变或缺失时,产生的突变蛋白或肿瘤抑制蛋白表达的完全缺失可能不能正确地调控细胞增殖,异常的增殖可能发生,特别是当细胞的调控机制已经存在损伤时。许多已经深入研究的人类肿瘤和肿瘤细胞系失去了或具有无功能的肿瘤抑制基因。肿瘤抑制基因的例子包括但不限于成视网膜细胞瘤易感性基因或RB基因、p53基因、结肠癌缺失(DCC)基因和神经纤维瘤I型(NF-1)肿瘤抑制基因(Weinberg(1991),Science 254:1138-1146)。肿瘤抑制基因失去活性或钝化可能在大量人类癌症的起始和/或发展中扮演中心的角色。
利用基因组范围内的表达图谱对肿瘤分类、鉴定药物的靶、鉴定诊断标记物和/或对化疗结果获得进一步的了解,可以便于设计更有效的治疗多种癌症的策略。早期的利用基因表达模式鉴定癌症亚型的研究产生了相当吸引人的结果(参见Perou等(1999),Proc Natl Acad Sci USA 96:9212-9217;Golub等(1999),Science 286:531-537;Alizadeh等(2000),Nature 403:503-511;Alon等(1999),Proc Natl Acad Sci USA96:6745-6750;以及Bittner等(2000),Nature 406:536-540;Perou等(2000),Nature 406:747-752)。通过基因表达图谱对B细胞淋巴瘤进行分子分类,在临床上阐明了截然不同的弥散性大B细胞淋巴瘤亚类(参见Alizadeh等,同上)。在乳腺癌中,利用有限数量的基因(8102个基因)进行的研究已经基于基因表达图谱将肿瘤分为亚型,这个研究指出了多种与乳腺癌相关的分子表型(参见Perou等,同上)。此外,基因表达图谱已经使研究者能够对数千个基因的组织特异性表达水平作图(Alon等(1999),Proc Natl Acad Sci USA 96:6745-6750;Iyer等(1999),Science 283:83-87;Khan等(1998),Cancer Res 58:5009-5013;Lee等(1999),Science 285:1390-1393;Wang等(1999),Gene 229:101-108;Whitney等(1999),Ann Neurol 46:425-428)。尽管这些研究已经表明基因表达图谱可以被用于在诊断人类疾病如癌症、以及开发改良的治疗策略方面产生进展,仍然需要进一步的研究。
尽管癌症由于源自于多种组织和具有多种发病因素而具有多样性和异源性,现已提出导致这些可变性的原因只在于相对少量的关键事件,这些事件的聚集是任何和所有癌症发展所必需的(Evan和Vousden(2001),Nature 411:342-348)。因此,需要广泛地研究许多不同类型癌症中整体基因表达水平的变化,以鉴定与癌症发生和发展相关的关键分子标记。在本领域还需要能够更准确地诊断癌症的材料与方法。此外,在本领域中对治疗的方法和鉴定能够有效治疗疾病的药剂的方法还存在需要。本发明满足了这些以及其它的需要。
发明概述
本发明是基于与正常组织相比在癌症组织中差异表达的新基因,分别称为LFG1、LFG2、LFG3、LFG4、LFG5、LFG6。本发明包括含有SEQ ID NO:1、3、5、7、9、11、13或15所示序列或其互补序列的分离的核酸分子。
本发明还包括与一个或多个表达控制元件可操作连接的核酸分子,包括含有分离的核酸分子的载体。本发明还包括转化后含有本发明核酸的宿主细胞,以及生产蛋白的方法,该方法包括在蛋白能够表达的条件下培养用本发明的核酸分子转化的宿主细胞的步骤。
本发明还提供了分离的多肽,选自:含有SEQ ID NO:2、4、6、8、10、12、14或16中氨基酸序列的分离的多肽、含有SEQ ID NO:2、4、6、8、10、12、14或16中至少10个氨基酸片段的分离的多肽、含有SEQ ID NO:2、4、6、8、10、12、14或16中保守氨基酸置换的分离的多肽、以及含有SEQ ID NO:2、4、6、8、10、12、14或16中自然发生氨基酸序列变体的分离的多肽。本发明的多肽还包括这样的一些多肽,它们的氨基酸序列与SEQ ID NO:2、4、6、8、10、12、14或16中的所述序列有至少大约50%、60%、70%或75%氨基酸序列同一性,与SEQ ID NO:2、4、6、8、10、12、14或16中的所述序列优选有至少大约80%、更优选至少大约90-95%,而最优选至少大约95-98%的序列同一性。
本发明还提供了鉴定本发明的多肽家族的其它成员的方法。具体来说,SEQ ID NO:1、3、5、7、9、11、13或15的核酸序列,在鉴定编码LFG1、LFG2、LFG3、LFG4、LFG5或LFG6蛋白家族的其它成员的核酸分子的方法中,可以用作探针或用来产生PCR引物。
本发明还提供了能够特异性地与本发明的多肽结合的分离的抗体或抗原结合的抗体片段,包括单克隆抗体和多克隆抗体。
本发明还提供了试剂的鉴定方法,所述试剂调节编码本发明蛋白的核酸分子表达,包括:将表达核酸分子的细胞暴露于试剂;以及确定试剂是否调节该核酸分子的表达,从而鉴定能够调节编码蛋白的核酸分子表达的试剂。
本发明还提供了试剂的鉴定方法,所述试剂调节本发明蛋白的水平或至少一种活性,包括:将表达蛋白的细胞暴露于试剂;以及确定试剂是否调节该蛋白的水平或至少一种活性,从而鉴定能够调节蛋白的水平或至少一种活性的试剂。
本发明还提供了调节编码本发明蛋白的核酸分子表达的方法,其中包括施用有效量的调节编码蛋白的核酸分子表达的试剂的步骤。本发明还提供了调节本发明蛋白的至少一种活性的方法,其中包括了施用有效量的能够调节本发明蛋白的至少一种活性的试剂的步骤。
本发明还提供了鉴定本发明蛋白的结合配体的方法,其步骤包括将该蛋白暴露于潜在的结合配体;以及确定潜在的结合配体是否与该蛋白结合,从而鉴定蛋白的结合配体。
本发明还提供了能够阻断或调节本发明蛋白与结合配体结合的试剂的鉴定方法。具体来说,通过将本发明蛋白或其片段以及结合配体与待测试剂接触,然后确定待测试剂是否阻断或减少本发明蛋白与结合配体的结合,可以检测该试剂阻断、减少或调节该蛋白与结合配体的结合的能力。
本发明还提供了减少或阻断本发明蛋白与一个或多个结合配体结合的方法,其中包括施用有效量的能够减少或阻断该蛋白与结合配体结合的试剂的步骤。该方法可以利用能够与本发明的蛋白或结合配体结合的试剂。
在本发明的另一方面,本发明的蛋白可以用作合理的药物设计的起始点,以提供配体、治疗药物或其它类型的小化学分子。此外,通过上述筛选方法鉴定的小分子或其它化合物可以在合理的药物设计中作为“前导化合物”。
本发明还涉及了治疗癌症的方法,包括将核酸构建物导入到癌细胞中,该构建物含有与启动子或增强子元件可操作地连接的本发明的核酸分子,以使该核酸分子的表达导致该癌症的抑制。
本发明还包括了经修饰以包含本发明的核酸分子的非人的转基因动物,或经修饰以包含突变的核酸分子的非人的转基因动物,以便编码的本发明多肽的表达被阻止。
本发明也包括非人的转基因动物,其中含有SEQ ID NO:1、3、5、7、9、11、13或15中所有或部分的基因的所有或一部分已经从动物的基因组中被敲除或缺失了。
本发明还提供了诊断癌症的方法,其步骤包括从对象获得组织、血液、尿液或其它样品,然后确定本发明的核酸分子或本发明的多肽的表达水平。
本发明还包括了含有稀释剂和多肽或蛋白的组合物,其中的多肽或蛋白选自:含有SEQ ID NO:2、4、6、8、10、12、14或16中氨基酸序列的分离的多肽、含有SEQ ID NO:2、4、6、8、10、12、14或16中至少10个氨基酸片段的分离的多肽、含有SEQ ID NO:2、4、6、8、10、12、14或16中保守氨基酸置换的分离的多肽、以及含有SEQ IDNO:2、4、6、8、10、12、14或16中自然发生的氨基酸序列变体的分离的多肽,以及氨基酸序列与SEQ ID NO:2、4、6、8、10、12、14或16中的所述序列有至少大约50%、60%、70%或75%同一性的分离的多肽,与SEQ ID NO:2、4、6、8、10、12、14或16中的所述序列优选至少大约80%,更优选至少大约90-95%,而最优选至少大约95-98%的序列同一性。
附图简述
图1显示两个LFG1克隆的相对比对位置。
图2是LFG1-克隆A(SEQ ID NO:2)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图3是LFG1-克隆B(SEQ ID NO:4)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图4是LFG2(SEQ ID NO:6)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图5是LFG3(SEQ ID NO:8)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图6是LFG4(SEQ ID NO:10)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图7是ALFG5(SEQ ID NO:12)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图8显示了两个LFG6克隆的相对比对位置。
图9是LFG6-#20(SEQ ID NO:14)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图10是LFG6-#46(SEQ ID NO:16)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
优选实施方案的详细描述
I.一般说明
本发明部分基于鉴定的新基因家族,它们在癌变人组织中的表达与在正常的人组织中的表达不同。这些基因家族对应于SEQ IDNOS:1、3、5、7、9、11、13和15中的人cDNA。
本发明的基因和蛋白可以用做诊断试剂或标记物来检测癌症,或用来将样品中的癌组织与正常组织区别开来。它们也可以用做调节基因表达或活性的试剂的靶。例如,可以鉴定调节与肿瘤生长相关的生物过程,包括癌症的增生过程的试剂。
II.具体的实施方案
A.与癌症相关的蛋白
本发明提供分离的蛋白、蛋白的等位基因变体、以及发生保守的氨基酸置换的蛋白。本文中使用的“蛋白”或“多肽”部分是指具有SEQ ID NO:2、4、6、8、10、12、14或16中描述人的氨基酸序列的蛋白。该术语也指自然发生的等位基因变体以及与上述序列相比具有轻微不同的氨基酸序列的蛋白。等位基因变体,尽管具有与上述序列相比轻微不同的氨基酸序列,它们仍然具有同样或相似的与这些蛋白相关的生物学功能。
本文中使用的与SEQ ID NO:2、4、6、8、10、12、14或16中人的氨基酸序列相关的蛋白家族是指已经从人和其它生物体中被分离出来的蛋白。用来鉴定和分离与这些蛋白相关的蛋白家族的其它成员的方法将在下面描述。
本发明的蛋白优选为分离的形式。用于本文中时,当使用物理、机械或化学的方法将蛋白从通常与蛋白结合的细胞成分中取出时,该蛋白被称为分离的。专业技术人员可以容易地使用标准的纯化方法获得被分离的蛋白。
本发明的蛋白还包括SEQ ID NO:2、4、6、8、10、12、14或16的插入、缺失或保守氨基酸置换的变体。用于本文中时,保守的变体是指氨基酸序列的改变对蛋白的生物学功能没有负面的影响。当改变的序列阻止或破坏了与蛋白相关的生物学功能时,置换、插入或缺失被称为是有负面影响的。例如,蛋白的总电荷、结构或疏水/亲水性质,在某些情况下可以被改变而对生物学活性没有负面的影响。因此,氨基酸序列可以被改变,例如赋予肽链更高的疏水性或亲水性,而对蛋白的生物学活性没有负面的影响。
一般来说,等位基因变体、保守置换变体和蛋白家族的其它成员,它们含有的氨基酸序列与SEQ ID NO:2、4、6、8、10、12、14或16中的所述序列有至少大约50%、60%、70%或75%的氨基酸序列同一性,优选至少大约80%、更优选至少大约90-95%、而最优选至少大约95-98%的序列同一性。这些序列的同一性或同源性在此处定义为在将序列进行比对,并且如果需要就插入空隙(gap)以获得最高的同源性百分数后,候选序列中与SEQ ID NO:2、4、6、8、10、12、14或16中的氨基酸残基相同的百分数,保守置换不被当作序列同一性的一部分(相关的参数参见B部分)。融合蛋白、或肽序列中的N-端、C-端或内部延伸、缺失或插入不应被视为影响同源性。
因此,本发明的蛋白包括具有SEQ ID NO:2、4、6、8、10、12、14或16中所公开的氨基酸序列的分子;具有这些蛋白的至少大约3、4、5、6、10、15、20、25、30、35或更多的氨基酸残基的连续序列的片段;其中一个或多个氨基酸残基已经被插入到公开的编码序列的N-端或C-端或内部的氨基酸序列变体;以及上述公开序列至少一个氨基酸残基置换的序列变体,或其如前所述的片段。这些片段,也被称为肽或多肽,可以含有抗原区,被鉴定为对应于已知蛋白结构域氨基酸序列区的蛋白功能区,以及具有显著的亲水性的区域。通过使用通常可以获得的序列分析软件例如MacVector(Oxford Molecular)可以容易地鉴定所有这些区域。
预期的变体还包括那些含有预定的突变,例如由同源重组、定点突变或PCR突变引起的变体,以及其它动物中的相应蛋白,其它的动物包括但不限于兔、大鼠、小鼠、猪、牛、羊、马和人以外的灵长类,以及蛋白家族的等位基因或其它自然发生的变体;以及一些衍生物,其中的蛋白已经通过置换、化学、酶学或其它适当的方法用自然存在的氨基酸之外的部分(例如可检测的部分,如酶或放射性同位素)进行了共价修饰。
本发明还提供了含有本发明的蛋白或多肽以及稀释剂的组合物。适合的稀释剂可以是水性或非水性溶剂或它们的组合,并可以含有附加的对蛋白或多肽的稳定性、溶解性、活性和/或储存有利的成分,如水溶性盐或甘油。
正如下面所描述的,蛋白家族的成员可以被用来:(1)鉴定调节蛋白的水平或至少一种活性的试剂,(2)鉴定蛋白的结合配体,(3)作为抗原制备多克隆或单克隆抗体,(4)作为治疗药剂或靶,以及(5)作为癌症的诊断试剂或标记物。
B.核酸分子
本发明还提供为SEQ ID NO:2、4、6、8、10、12、14或16序列的蛋白和本文描述的相关蛋白编码的核酸分子,优选为分离的形式。本文使用的“核酸”被定义为编码前面定义的蛋白或肽的RNA或DNA,与编码这些肽的核酸序列互补的RNA或DNA,在适当的严紧条件下与SEQ ID NO:1、3、5、7、9、11、13或15的核酸杂交并与其保持稳定的结合的RNA或DNA,编码的多肽与SEQ ID NO:2、4、6、8、10、12、14或16的肽序列具有至少大约50%、60%、70%或75%,优选至少大约80%,更优选至少大约90-95%,最优选至少大约95-98%或更高的同一性的RNA或DNA,或与SEQ ID NO:1、3、5、7、9、11、13或15的可读框表现出至少大约50%、60%、70%或75%,优选至少大约80%,更优选至少大约90-95%,最优选至少大约95-98%或更高的核苷酸序列同一性的RNA或DNA。
本发明还包括与SEQ ID NO:1、3、5、7、9、11、13或15的互补序列特异性杂交的分离的核酸分子,特别是在可读框内特异性杂交的分子。这样的分子与SEQ ID NO:1、3、5、7、9、11、13或15的互补序列一般在严紧的杂交条件下进行特异性杂交。
特别关注的是基因组DNA、cDNA、mRNA和反义分子,以及基于可选择的骨架的核酸或包括可选择碱基的核酸,不论它们是天然来源的还是合成的。但是这些杂交或互补的核酸,也被确定为对于任何现有技术的核酸来说是新的和非显而易见的,包括编码本发明蛋白的核酸,在适当的严紧条件下杂交,或者互补于编码本发明蛋白的核酸的核酸。
核苷酸或氨基酸水平上的同源性或同一性由BLAST(基本局部对比搜索工具)分析来确定,使用专门用于序列相似性检索而制作的程序blastp、blastn,blastx、tblastn和tblastx(Altschul等(1997),Nucleic AcidsRes.25:3389-3402,以及Karlin等(1990),Proc.Natl.Acad.Sci.USA87:2264-2268,两者以其全文引入参考)使用的算法来计算。BLAST程序使用的方法首先考虑一个待检索序列和一个数据库序列之间的相似区段,两区段可以存在空隙也可以没有,然后评估所有等同的配对在统计上的显著性,最后只概括出那些显著性满足了预先选定的阈值的配对。对于序列数据库相似性检索的基本论点的讨论参见Altschul等(1994),Nat.Genet.6:119-129,以其全文引为参考。用于直方图、描述、比对、预期值(即用于报告与数据库序列配对的统计学重要性的阈值)、截止(点)、矩阵和过滤(低复杂性的检索参数)采用缺省设定。blastp、blastn,blastx、tblastn和tblastx使用的缺省评分矩阵是BLOSUM62矩阵(Henikoff等(1992),Proc.Natl.Acad.Sci.USA 89:10915-10919,以其全文引为参考),推荐的待检索序列长度超过85个核苷酸或氨基酸。
对于blastn来说,评分矩阵由M(即一对匹配的残基的奖励分数)与N(即误配残基的处罚分数)的比率来设定,其中M和N的缺省值分别为5和-4。Blastn的四个参数被调整如下:Q=10(产生空隙的处罚);R=10(延长空隙的处罚);wink=1(在待检索序列中每个winkth位点产生的字码碰撞);以及gapw=16(设定其内产生带有空隙的比对的窗口宽度)。相应的Blastp的参数设置为Q=9;R=2;wink=1;以及gapw=32。在GCG软件包10.0版中所用的序列间的最优比较,使用了DNA参数GAP=50(产生空隙的处罚)和LEN=3(延长空隙的处罚),在蛋白比较中相应的设置是GAP=8和LEN=2。
“严紧条件”是指(1)洗涤时使用低离子强度和高温,例如0.015MNaCl/0.0015M柠檬酸钠/0.1%SDS,温度为50℃或(2)在杂交过程中使用甲酰胺等变性试剂,例如50%(体积比)的甲酰胺,和0.1%牛血清白蛋白/0.1% Ficoll/0.1%聚乙烯吡咯烷酮/50mM pH6.5的磷酸钠缓冲液,以及750mM NaCl、75mM柠檬酸钠,温度为42□。另一个例子是在50%甲酰胺、5×SSC(0.75M NaCl,0.075M柠檬酸钠)、50mM磷酸钠(pH6.8)、0.1%焦磷酸钠、5×Denhardt氏溶液、超声处理的鲑鱼精子DNA(50μg/ml)、0.1%SDS和10%硫酸葡聚糖中于42□进行杂交,于42□在0.2×SSC和0.1%SDS中洗涤。专业技术人员可以容易地确定和改变严紧条件,使其适合于获得清晰和可检测的杂交信号。优选的分子是那些能够在上述条件下与SEQ ID NO:1、3、5、7、9、11、13或15的互补序列杂交、并且编码功能蛋白或全长蛋白的分子。更优选的杂交分子是那些在上述条件下与SEQ ID NO:1、3、5、7、9、11、13或15的可读框的互补链杂交的分子。
在本文中使用时,核酸分子,当它与编码其它多肽的污染核酸分子基本上分开时,被称为是“分离的”。
本发明还提供了公开的核酸分子的片段。本文中使用的核酸的片段是指编码或非编码序列的一小部分。片段的大小取决于使用的目的。例如,如果希望选择的片段能够编码蛋白的活性部分,则片段必须足够大到编码蛋白的功能区。例如,可以准备出这样的片段,它们编码的肽对应于预测的抗原区域。如果片段被用做核酸探针或PCR引物,那么片段的长度可以选择在探测/引发获得相对小量的假阳性(参见G部分的讨论)。
用作探针或特异性引物进行聚合酶链反应(PCR)、或用来合成编码本发明蛋白的基因序列的本发明核酸分子的片段(即合成的寡核苷酸),可以容易地通过化学技术合成,例如Matteucci等((1981)J.Am.Chem.Soc.103:3185-3191)的亚磷酰胺方法或使用自动化合成方法。此外,较大的DNA片段可以通过众所周知的方法容易地制备,例如合成一组代表基因的不同模块区段的寡核苷酸,然后将寡核苷酸进行连接来构建完整的被修饰的基因。
本发明的核酸分子还可以被修饰,使其包含可检测的标记,用于诊断和探测目的。各种这样的标记在本技术领域内是广为人知的,可以容易地与本文描述的编码分子一起使用。合适的标记包括但不限于生物素、放射性标记或荧光标记的核苷酸等。专业技术人员可以容易地使用任何这样的标记以获得本发明核酸分子的标记的变体。
C.其它相关核酸分子的分离
如上所述,具有SEQ ID NO:1、3、5、7、9、11、13或15的核酸分子的鉴定和表征,可以使专业技术人员分离出编码除本文所述序列之外的其他蛋白家族成员的核酸分子。此外,本文公开的核酸分子使得专业技术人员可以分离出编码除SEQ ID NO:2、4、6、8、10、12、14或16蛋白之外的其他蛋白家族成员的核酸分子。
例如,专业技术人员可以容易地使用SEQ ID NO:2、4、6、8、10、12、14或16的氨基酸序列来产生抗体探针,以筛选从适当的细胞制备的表达文库。一般来说,来自用纯化的蛋白免疫(如下文描述)的哺乳动物例如兔的多克隆抗血清或单克隆抗体,可以被用来探测哺乳动物的cDNA或基因组表达文库,例如λgtll文库,以获得适合的为蛋白家族的其它成员编码的序列。克隆的cDNA序列可以表达成融合蛋白,使用自身的控制序列直接表达,或通过使用适合表达酶的特定宿主的控制序列的构建物表达。
另外,本文描述的编码序列的一部分可以被合成并用作探针从任何哺乳动物中找到编码该蛋白家族的成员的DNA。制备含有大约18-20个核苷酸的寡聚体(编码大约6-7个氨基酸跨度)并用来筛选基因组DNA或cDNA文库,在严紧条件或足够消除过度的假阳性水平的严紧条件下获得杂交。
此外,寡核苷酸引物对可以被制备,用在PCR中以选择性地克隆编码的核酸分子。使用这样的PCR引物的PCR变性/退火/延伸循环在本领域内是众所周知的,并可以容易地被调整而适用于分离其它的编码核酸分子。
编码蛋白家族的其它成员的核酸分子也可以使用任何可获得的计算方法在现有的基因组或其它序列信息中鉴定,这些方法包括但不限于:PSI-BLAST(Altschul等(1997),Nucl.Acids Res.25:3389-3402),PHI-BLAST(Zhang等(1998),Nucl.Acids Res.26:3986-3990),3D-PSSM(Kelly等(2000),J.Mol.Biol.299:499-520),以及其它的计算分析方法(Shi等(1999),Biochem.Biophys.Res.Commun.262:132-138和Matsunami等(2000),Nature 404:601-604)。
D.含有核酸分子的rDNA分子
本发明还提供含有编码序列的重组DNA分子(rDNAs)。本文中使用的rDNA分子是指已经在原位进行分子操作的DNA分子。产生rDNA分子的方法在本领域是众所周知的,例如参见Sambrook等,
分子克隆 实验指南(第三版),冷泉港实验室出版社,冷泉港,NY,2001。在优选的rDNA分子中,编码的DNA序列与表达控制序列和/或载体序列是可操作地连接的。
正如本领域内所熟知的,选择本发明的蛋白家族编码序列可操作地连接的载体和/或表达控制序列,直接依赖于所需的功能性质,如蛋白表达,以及待转化的宿主细胞。本发明考虑的载体至少能够指导rDNA分子中包含的结构基因复制或插入到宿主染色体中,优选也能够表达。
用于调控可操作地连接的蛋白编码序列表达的表达控制元件在本领域内是广为人知的,包括但不限于诱导型启动子、组成型启动子、分泌信号和其它调控元件。在优选情况下,诱导型启动子容易控制,例如对于宿主细胞培养基中的营养具有反应性。
在一个实施方案中,含有编码核酸分子的载体将包括原核的复制子、即能够指导转化的原核宿主细胞如细菌宿主细胞中染色体之外的重组DNA分子自主复制和维持的DNA序列,这样的复制子在本领域内是众所周知的。此外,包含了原核复制子的载体也可以包含基因,该基因的表达产生可检测的标记,例如药物抗性。典型的细菌药物抗性基因是对氨苄青霉素、卡那霉素、氯霉素或四环素产生抗性的基因。
包含原核复制子的载体还可以包括原核的或噬菌体的启动子,它能够指导编码基因序列在细菌宿主细胞如大肠杆菌中的表达(转录和翻译)。启动子是由DNA序列形成的表达控制元件,它允许RNA聚合酶结合并转录。与细菌宿主相容的启动子序列一般在质粒载体中提供,这些载体含有方便的限制性酶切位点用于插入本发明的DNA区段。典型的这种载体质粒是来自BioRad实验室(Richmond,CA)的pUC8、pUC9、pBR322和pBR329以及来自Pharmacia(Piscataway,NJ)的pPL和pKK223。
与真核细胞相容,优选与脊椎动物细胞相容的表达载体也可以用于形成含有编码序列的rDNA分子。真核细胞表达载体,包括病毒载体,在本领域内是广为人知的,可以从几个商业来源获得。一般来说,这些载体都含有方便的限制性酶切位点用于插入所需的DNA区段。这些载体中典型的是pSVL和pKSV-10(Pharmacia)、pBPV-1/pML2d(International Biotechnologies,Inc.)、pTDT1(ATCC,#31255),本文描述的pCDM8等真核表达载体。如果需要,载体可以被修饰,以包含组织特异性的启动子。
用于构建本发明的rDNA分子的真核细胞表达载体还可以包含在真核细胞中有效的选择性标记,优选为药物抗性选择标记。优选的药物抗性标记是基因表达后产生新霉素抗性的基因,即新霉素磷酸转移酶(neo)基因(Southern等(1982),J.Mol.Anal.Genet.1:327-341)。另外,选择性标记可以存在于不同的质粒上,两个载体通过对宿主细胞的共转染被导入,并通过在适当的选择性标记的药物中培养来筛选。
E.含有外部提供的编码核酸分子的宿主细胞
本发明还提供用编码本发明蛋白的核酸分子转化的宿主细胞。宿主细胞可以是原核的也可以是真核的。对可用于表达本发明蛋白的真核细胞没有限制,只要细胞系与细胞培养方法相容,及与表达载体的增殖和基因产物的表达相容。优选的真核宿主细胞包括但不限于酵母、昆虫和哺乳动物细胞,优选脊椎动物细胞,例如来自小鼠、大鼠、猴子或人类细胞系的细胞。优选的真核宿主细胞包括可从ATCC以CCL61编号获得的中国仓鼠卵巢(CHO)细胞、可从ATCC以CRL1658编号获得的NIH瑞士小鼠胚胎细胞(NIH/3T3)、幼仓鼠肾细胞(BHK)等真核组织培养细胞系。
任何原核的宿主都可以被用来表达编码本发明蛋白的rDNA分子。优选的原核宿主是大肠杆菌。
适当的细胞宿主用本发明rDNA分子转化可以通过众所周知的方法来完成,这些方法一般依赖于使用的载体类型和所用的宿主系统。对于原核宿主细胞的转化,通常使用电穿孔和盐处理的方法(参见,例如,Cohen等(1972),Proc.Natl.Acad.Sci.USA 69:2110;和Sambrook等,同上)。对于用含有rDNAs的载体转化脊椎动物细胞,典型地使用电穿孔、阳离子脂或盐处理的方法,参见,例如,Graham等(1973),Virol.52:456;Wigler等(1979),Proc.Natl.Acad.Sci.USA 76:1373-1376。
成功转化的细胞,即含有本发明rDNA分子的细胞,可以用众所周知的包含用选择性标记进行筛选的技术来鉴定。例如,导入了本发明rDNA后获得的细胞可以被克隆以产生单菌落。从那些菌落获得的细胞可以被收获、裂解,其DNA内含物可以使用例如Southern,(1975)J.Mol.Biol.98:503或Berent等,(1985)Biotech.3:208中描述的方法来检测rDNA的存在,或通过免疫的方法分析细胞产生的蛋白。
F.使用rDNA分子生产重组蛋白
本发明还提供了使用本文描述的核酸分子生产本发明蛋白的方法。一般来说,生产重组形式的蛋白通常包括下面的步骤:
首先,获得编码本发明蛋白的核酸分子,诸如包括,基本上组成或组成为下列序列的核酸分子:SEQ ID NO:1、3、5、7、9、11、13或15,或SEQ ID NO:1的390-4883或390-4880位核苷酸,SEQ ID NO:3的12-4907或12-4904位核苷酸,或SEQ ID NO:5的424-1911或424-1908位核苷酸,或SEQ ID NO:7的405-1838或405-1835位核苷酸,或SEQ ID NO:9的89-1153或89-1150位核苷酸,或SEQ ID NO:11的223-1572或223-1569位核苷酸,或SEQ ID NO:13的418-1395或418-1392位核苷酸,或SEQ ID NO:15的271-1434或271-1431位核苷酸。如果编码序列没有被内含子打断,正如这些可读框,它直接适合于在任何宿主中表达。
然后,在优选情况下,如上所述,将核酸分子与适当的控制序列可操作地连接,以形成含有蛋白可读框的表达单位。表达单位被用来转化适当的宿主,转化的宿主在允许重组蛋白生产的条件下进行培养。任选地,重组蛋白也可以从培养基或细胞中分离出来;在某些情况下,当一些杂质可以被允许时,蛋白可以不必回收和纯化。
前面的每个步骤都可以以各种多种方式进行。例如,所需的编码序列可以从基因组片段获得,并直接在适当的宿主中使用。使用前面提到的适当的复制子和控制序列,可以构建出在各种不同宿主中可以操作的表达载体。控制序列、表达载体和转化方法依赖于用于表达基因的宿主细胞的类型,在前面已经详细讨论过。适当的限制性酶切位点,如果不能正常获得,可以加到编码序列的末端从而提供可切割的基因以插入到这些载体中。专业技术人员可以容易地调整任何本领域所熟知的宿主/表达系统,以使用本发明核酸分子生产重组蛋白。
G.调节编码与癌症相关基因的核酸表达的试剂的鉴定方法
本发明的另一个实施方案提供了鉴定试剂的方法,所述试剂调节编码本发明的蛋白,例如具有SEQ ID NO:2、4、6、8、10、12、14或16的氨基酸序列的蛋白的核酸表达。这样的检测可以利用任何可用的监测本发明核酸的表达水平变化的方法。如本文所述,如果试剂能够在细胞中上或下调节本发明核酸的表达,则它就被称为调节核酸的表达。
在一种分析方法中,可以制备含有报告基因融合体的细胞系,这些融合体是在SEQ ID NO:1的390-4883位核苷酸、SEQ ID NO:3的12-4907位核苷酸、SEQ ID NO:5的424-1911位核苷酸、SEQ ID NO:7的405-1838位核苷酸、SEQ ID NO:9的89-1153位核苷酸、SEQ IDNO:11的223-1572位核苷酸、SEQ ID NO:13的418-1395位核苷酸、SEQ ID NO:15的271-1434位核苷酸所确定的可读框中的核苷酸和/或5’和/或3’调控元件与任何可检测的融合配体之间进行融合的。有大量可检测的融合配体是已知的并容易获得,包括萤火虫荧光素酶基因和编码氯霉素乙酰转移酶的基因(Alam等(1990),Anal.Biochem.188:245-254)。含有报告基因融合体的细胞系然后在适当的条件和时间下暴露于测试试剂。暴露于试剂的样品和对照样品之间报告基因的差异表达,可以鉴定能够调节本发明的核酸表达的试剂。
其它的分析方法可以用来监测试剂调节编码本发明蛋白的核酸表达的能力,例如具有SEQ ID NO:2、4、6、8、10、12、14或16的蛋白。例如,mRNA表达可以通过与本发明的核酸进行杂交来直接监测。细胞系在适当的条件和时间下暴露于测试试剂,通过标准的程序,例如那些在Sambrook等,
分子克隆实验指南(第三版),冷泉港实验室出版社,冷泉港,NY,2001中公开的程序,分离出总RNA或mRNA。
优选的细胞是来自人组织的细胞,例如活检组织或来自癌症病人的培养细胞。可以使用的细胞系例如ATCC胸导管癌细胞系(目录号CRL-2320,CRL-2338和CRL-7345)、ATCC结肠直肠腺癌细胞系(目录号CCL-222、CCL-224、CCL-225、CCL-234、CRL-7159和CRL-7184)、ATCC肾透明细胞癌细胞系(目录号HTB-46和HTB-47)、ATCC肾细胞腺癌细胞系(目录号CRL-1611、CRL-1932和CRL-1933)、ATCC肝细胞癌细胞系(目录号CRL-2233、CRL-2234和HB-8065)、ATCC肺腺癌细胞系(目录号CRL-5944、CRL-7380和CRL-5907)、ATCC淋巴细胞系(目录号CRL-7936、CRL-7264和CRL-7507)、ATCC卵巢腺癌细胞系(目录号HTB-161、HTB-75和HTB-76)、ATCC胰腺腺癌细胞系(目录号CRL-1687、CRL-2119和HTP-79)、前列腺腺癌细胞系(目录号CRL-1435、CRL-2422和CRL-2220)以及ATCC胃腺癌细胞系(目录号CRL-1739、CRL-1863和CRL-1864)。此外,其它可以获得的细胞或细胞系也可以使用。
可以从本发明的核酸制备用于检测暴露于试剂的细胞和对照细胞之间RNA表达水平的差异的探针。优选的但不是必需的,设计在高度严紧的条件下只与靶核酸杂交的探针。在高度严紧的条件下只有高度互补的核酸杂交体才能形成。因此,分析条件的严紧性决定了两个核酸链之间为了形成杂交体应该存在的互补性的程度。应该选择使探针:靶杂交体和探针:非靶杂交体之间的稳定性差异最大的严紧条件。
探针可以通过本领域现有的方法根据本发明的核酸来设计。例如,探针的G+C含量和探针的长度可以影响探针与它的靶序列的结合。优化探针特异性的方法一般可以从Sambrook等,同上或Ausubel等,Short Protocols in Molecular Biology,第四版,John Wiley & Sons,Inc.,New York,1999中获得。
针对每个探针的需要可以使用现有的方法对杂交条件进行修改,例如Sambrook等和Ausubel等中描述的方法。总细胞RNA或富集polyARNA的RNA的杂交可以通过任何可用的方式来进行。例如,总细胞RNA或富集polyA RNA的RNA可以被固定到固相支持物上,然后在探针可以特异性杂交的条件下将固相支持物暴露于至少一个含有至少一个或部分本发明的序列的探针。此外,含有至少一个或部分本发明的序列的核酸片段可以被固定到固相支持物上,例如硅片、多孔玻璃片或膜上。然后在固定的序列可以特异性杂交的条件下将固相支持物暴露于来自样品的总细胞RNA或polyA RNA。这样的固相支持物和杂交方法可以广泛获得,例如Beattie,(1995)WO 95/11755中所公开的那些。通过测定给定的探针与来自未处理的细胞群的RNA样品和暴露于试剂的细胞群的RNA样品之间特异性杂交的能力,可以鉴定能够对编码SEQ ID NO:2、4、6、8、10、12、14或16序列蛋白的核酸的表达具有上或下调控的试剂。
用于mRNAs的定性和定量分析的杂交也可以通过使用RNA酶保护分析方法(即RPA,参见Ma等(1996),Methods 10:273-238)来进行。简单地说,含有编码基因产物的cDNA和噬菌体特异的DNA依赖性RNA聚合酶启动子(例如T7、T3或SP6 RNA聚合酶)的表达载体在cDNA的3’末端、噬菌体启动子的下游被线性化,其中这样的线性化分子随后被用做模板通过体外转录合成标记的cDNA反义转录本。标记的转录本然后与分离的RNA(即总的或分级的mRNA)的混合物杂交,杂交条件为在含有80%甲酰胺、40mM PIPES、pH6.4、0.4M NaCl和1mM EDTA的缓冲液中于45℃保温过夜。然后在含有40μg/ml核糖核酸酶A和2μg/ml核糖核酸酶的缓冲液中将得到的杂交体消化。在外源的蛋白失活并抽提之后,样品在尿素/聚丙烯酰胺凝胶上上样分析。
在另一种分析方法中,为了鉴定影响即时基因产物表达的试剂,首先鉴定在生理学上表达本发明的基因产物的细胞或细胞系。这样鉴定的细胞和/或细胞系预测含有必需的细胞机制,以至于对通过适当的表面转导机制和/或胞质级联接触外源的试剂而言,都能够维持转录元件的调节忠实性。此外,将这样的细胞或细胞系用表达载体(例如质粒或病毒载体)构建物转导或转染,该构建物含有结构基因的可操作的含有启动子的5’非翻译末端,所述结构基因编码融合到一个或多个抗原性片段的即时基因产物,所述抗原片段对即时基因产物是特异性的,其中该片段处于该启动子的转录控制之下,表达为其分子量可以与天然存在的多肽区别开的多肽,该多肽也可以含有具有免疫性的可以区别的标记或其它可检测的标记。这样的方法在本领域内是公知的(参见Sambrook等,同上)。
通过上述方法转导或转染的细胞或细胞系然后在适当的条件下与试剂接触。例如,存在于可药用的赋形剂中的试剂与细胞在水性生理缓冲液中接触,例如生理pH的磷酸盐缓冲液(PBS)、生理pH的Eagles平衡盐缓冲液(BSS)、含有血清的PBS或BSS、或含有PBS或BBS和/或血清的条件培养基,在37℃保温。本领域的专业技术人员可以根据需要对该条件进行调整。在细胞与试剂接触后,将该细胞破碎,对裂解液中的多肽进行分级,以便使多肽级分合并,并与抗体接触,通过免疫分析方法(例如ELISA、免疫沉淀或Western印迹)进行进一步处理。从“接触了试剂”的样品中分离到的蛋白合并液将与只用赋形剂接触细胞的对照样品进行比较,“接触了试剂”的样品与对照相比通过免疫技术产生的信号的增加或减少将被用来辨别试剂的效果。
H.调节癌症相关蛋白的水平或至少一种活性的试剂的鉴定方法
本发明的另一个实施方案提供了试剂的鉴定方法,所述试剂调节本发明的蛋白,例如具有SEQ ID NO:2、4、6、8、10、12、14或16氨基酸序列的蛋白的水平或至少一种活性。这样的方法或分析可以使用任何监测或检测所需活性的手段,并对于鉴定治疗癌症的试剂特别有用。
在一种方法中,可以分析已经暴露于待测试剂的细胞群落与未暴露的对照细胞群落之间本发明蛋白的相对量。在这种方法中,探针例如特异性抗体被用来监测蛋白在不同细胞群落中的差异表达。细胞系或群落在适当的条件和时间下被暴露于待测试剂。从暴露的细胞系或群落和对照的未暴露的细胞系或群落制备细胞裂解液。然后用探针分析细胞裂解液。
抗体探针通过适当的免疫方案免疫适当的哺乳动物宿主而制备,免疫使用本发明的肽、多肽或蛋白,只要它们有足够的长度,或者如果希望或如果需要增强免疫原性,可以与适当的载体相连。制备带有载体如BSA、KLH或其它载体蛋白的免疫连接物(conjugate)的方法在本技术领域是现成的。在某些情况下,使用例如碳二亚胺试剂进行直接连接可能是有效的;在其它的情况下,连接试剂例如那些PierceChemical Co.(Rockford,IL)所提供的试剂,在提供对半抗原的可接近性方面可能是令人满意的。例如,半抗原肽可以在氨基或羧基末端用半胱氨酸残基延伸,或用半胱氨酸残基间插其中,以方便载体的连接。免疫原的给药一般通过在一段适当的时期内注射来进行,并使用适当的佐剂,正如本领域所通常理解的那样。在免疫计划期间,测定抗体的滴度以确定抗体的形成是足够的。
尽管对于某些应用来说,通过这种方法生产的多克隆抗血清是令人满意的,但对于药物组合物来说,使用单克隆的制备物是优选的。分泌所需的单克隆抗体的无限增殖的细胞系可以使用Kohler和Milstein((1975)Nature 256:495-497)的标准方法或造成淋巴细胞或脾细胞无限增殖的修饰方案来制备,正如通常所公知的那样。分泌所需抗体的无限增殖细胞系通过免疫分析进行筛选,其中的抗原是肽半抗原、多肽或蛋白。当分泌所需抗体的适当的无限增殖细胞培养物被鉴别后,细胞可以在体外培养或在腹水中生产。
然后从培养液上清液或腹水上清液中回收所需的单克隆抗体。含有具有免疫重要(抗原结合的)部分的单克隆抗体片段或多克隆抗血清可以被用做拮抗剂,完整的抗体也可以。通常情况下,使用免疫反应性(抗原结合)的抗体片段,例如Fab、Fab’或F(ab’)2片段是优选的,特别是在治疗过程中,因为这些片段一般比完整的免疫球蛋白具有更少的免疫原性。
抗体或抗原结合片段也可以使用现有的技术通过重组的方法生产。与蛋白所需区域特异性结合的抗体区域也可以以具有多个物种来源的嵌合体的方式来生产,例如人源化抗体。
在上述方法中分析的试剂可以随机选择或合理选择或设计。用于本文中时,当试剂是被随机地选择而不考虑参与单独结合本发明的蛋白或与其相关底物、结合配体等一起结合的特定序列时,被称为是随机选择的。随机选择试剂的例子是使用化学文库或肽组合文库,或生物体的生长培养液。
在本文中使用时,当试剂的选择是在非随机的基础上进行,考虑其与试剂作用的靶位点序列和/或其构象时,被称为是合理选择或设计的。试剂可以通过利用组成这些位点的肽序列来合理选择或合理设计。例如,合理选择的肽试剂可以是一个氨基酸序列与任何功能性保守位点一致或从其衍生的肽。
本发明的试剂可以是,例如肽、小分子、维生素衍生物以及碳水化合物。显性负调节蛋白(dominant negative proteins),编码这些蛋白的DNA,针对这些蛋白的抗体,这些蛋白的肽片段或这些蛋白的模拟物,都可以导入到细胞中以影响功能。此处使用的“模拟”是指对肽分子的一个或几个区域进行修饰,以提供与亲本肽在化学上不同但在拓扑学和功能上相似的结构(参见Grant:
分子生物学和生物技术, Meyers编辑,659-664页,VCH Publishers,Inc.,New York,1995)。专业技术人员可以容易地认识到对本发明的试剂的结构特性没有限制。
本发明的肽试剂可以使用标准的固相(或液相)肽合成方法来制备,这在本领域内是公知的。此外,编码这些肽的DNA可以使用可商业获得的寡核苷酸合成仪合成,并可以使用标准的重组子生产系统重组地生产。如果要包括非基因编码的氨基酸,就必须使用固相肽合成来生产。
本发明的另一类试剂是与本发明蛋白的关键位置,例如细胞质结构域、间隔区结构域、α-螺旋卷曲-卷曲结构域或受体结构域具有免疫反应性的抗体,正如本文描述的那样。通过用含有预计被抗体靶向的那些蛋白部分作为抗原区的肽免疫适当的哺乳动物对象,可以获得抗体试剂。
I.调节与癌症相关的蛋白的表达或至少一种活性的试剂的应用
正如实施例中提供的那样,本发明的蛋白和核酸,例如具有SEQID NO:2、4、6、8、10、12、14或16氨基酸序列的蛋白,在癌组织中是差异表达的。上调或下调或调整蛋白的表达或蛋白的至少一种活性的试剂,例如激动剂或拮抗剂,可以用来调节与蛋白的功能和活性相关的生物或病理过程。这包括鉴定的使用本发明的同源物或类似物试剂。
本文中使用的对象可以是任何哺乳动物,只要该哺乳动物需要调整由本发明蛋白介导的病理或生物过程。术语“哺乳动物”被定义为属于哺乳动物纲的个体。本发明在治疗人类对象中特别有用。
病理过程是指一类产生有害影响的生物过程。例如,本发明蛋白的表达可能与细胞生长或异常增生相关。在本文中使用时,当试剂降低病理过程的程度或严重性时,它被称为缓解该病理过程。例如,通过施用以某种方式上调或下调或缓解本发明蛋白的表达或至少一种活性的试剂,可以防止癌症或缓解疾病的发展。
本发明的试剂可以单独提供,也可以与其它缓解特定病理过程的试剂组合在一起。例如,本发明的试剂可以与其它现有的药物共同给药。在本文中,当两种试剂同时给药或以一种使试剂在同一时间发生作用的方式独立地给药时,它们被称为组合给药。
本发明的试剂可以通过肠胃外、皮下、静脉内、肌内、腹膜内、透皮或含服的途径给药。另外或同时地,给药也可以通过口服。给药的剂量依赖于接受者的年龄、健康状况和体重,同时治疗的种类,如果有的话,治疗的频率和所希望的效果。
本发明还提供了含有一种或多种调整本发明蛋白的表达或至少一种活性的组合物。因为个体的需要是不同的,确定每个成分的有效量的最适范围属于本领域的技术。通常的剂量包括每公斤体重0.1到100μg。优选的剂量为每公斤体重0.1到10μg。最优选的剂量为每公斤体重0.1到1μg。
除了药理活性试剂外,本发明的组合物还可以含有适当的可药用的载体,包括可以方便使活性化合物加工成制剂的赋形剂和辅助剂,该制剂在药学上可用于将活性成分投送到作用位点。适合的肠胃外给药的剂型包括水溶形式的活性化合物的水溶液,例如水溶性的盐。此外,活性化合物的悬浮液也可以适当的油状注射悬浮液形式给药。适合的亲脂溶剂或载体包括脂肪油,例如芝麻油,或合成的脂肪酸酯,例如油酸乙基酯或甘油三酯。水性注射悬浮液可以含有增加悬浮液粘度的物质,包括例如羧甲基纤维素钠、山梨醇和/或葡聚糖。任选地,悬浮液也可以含有稳定剂。脂质体也可以用来封装试剂以投送到细胞内。
本发明用于全身给药的药物剂型可以为肠内、非肠胃或局部给药。事实上,所有三种类型的剂型可以同时使用以完成活性成分的全身给药。
合适的口服剂型包括硬的或软的胶囊、药丸、药片、包括糖衣片、酏剂、悬浮液、糖浆或其吸入剂和可控制释放的形式。
在实施本发明的方法时,本发明的化合物可以单独使用或组合使用,或与其它的治疗或诊断试剂结合使用。在某些优选实施方案中,本发明的化合物可以与按照一般接受的医学规范(generally acceptedmedical practice)为这些疾病开出的其它化合物共同给药。本发明的化合物可以在体内使用,一般在哺乳动物中,例如人、绵羊、马、牛、猪、狗、猫、大鼠和小鼠,也可以在体外使用。
J.鉴定结合配体的方法
本发明的另一个实施方案提供了分离和鉴定本发明蛋白的结合配体的方法。一般来说,在允许潜在的结合配体与本发明的蛋白结合的条件下,将本发明的蛋白与潜在的结合配体或细胞的提取液或级分混合。混合后,从混合物中分离出已经与本发明的蛋白结合的肽、多肽、蛋白或其它分子。然后取出与本发明的蛋白结合的结合配体并进行进一步分析。为了鉴定和分离结合配体,可以使用完整的蛋白,例如含有SEQ ID NO:2、4、6、8、10、12、14或16完整氨基酸序列的蛋白。此外,蛋白的片段也可以使用。
本文使用的细胞提取液是指从裂解或破碎的细胞制成的制备液或级分。优选的细胞提取液的来源是从人类肿瘤或转化的细胞衍生的细胞,例如癌的活检组织或组织培养细胞。此外,细胞提取液也可以从正常的组织或可获得的细胞系制备。
有多种方法可用于获得细胞的提取液。细胞可以使用物理或化学的破碎方法破碎。物理破碎方法的实施例包括但不限于超声和机械剪切。化学裂解方法的实例包括但不限于去污剂裂解和酶法裂解。专业技术人员可以容易地调整制备细胞提取液的方法,以获得用于本方法的提取液。
一旦制备了细胞的提取液,将提取液在蛋白可以与结合配体结合的条件下与本发明的蛋白混合。可以使用多种不同的条件,最优选的条件是近似人细胞细胞质中的条件。例如所用的细胞提取液的渗透性、pH、温度和浓度等一些特性,可以被改变以使蛋白与结合配体的结合最优化。
在适当的条件下混合后,结合的复合物与混合物分开。有多种技术可用于分离混合物。例如,特异性针对本发明蛋白的抗体可以被用来对结合配体复合物进行免疫沉淀。此外,标准的化学分离技术例如层析技术和密度/沉降离心也可以使用。
在除去了提取液中发现的不结合的细胞成分后,可以使用常规的技术将结合配体从复合物上解离。例如,可以通过改变混合物的盐浓度或pH来实现解离。
为了帮助从混合的提取液中分离结合的结合配体,可以将本发明的蛋白固定化在固相支持物上。例如,蛋白可以连接在硝酸纤维素基质或丙烯酸珠子上。将蛋白连接在固相支持物上有助于使肽/结合配体对与提取液中发现的其它成分分离开来。鉴定的结合配体可以是单一的蛋白,也可以是由两个或多个蛋白组成的复合物。此外,结合配体也可以按照Takayama等(1997),Methods Mol.Biol.69:171-184或Sauder等(1996),J.Gen.Virol.77:991-996的程序使用Far-Western分析方法鉴定,或通过使用抗原决定簇标记的蛋白或GST融合蛋白来鉴定。
此外,本发明的核酸分子可以用在酵母双杂交系统或其它的体内蛋白-蛋白检测系统中。酵母双杂交系统已经被用来鉴定其它的蛋白配体对,并可以被容易地调整以利用本文描述的核酸分子。
K.癌症相关蛋白的结合配体的应用
使用上述的方法获得的本发明蛋白的结合配体及其同源物和类似物,一旦分离后,可以用于各种不同的目的。使用本领域的现有技术,结合配体可以用于生产与结合配体结合的抗体。与结合配体结合的抗体可用于分析本发明的蛋白的活性,作为治疗试剂缓解由本发明的蛋白介导的生物或病理过程,或用于纯化结合配体。这些应用将在后面详细描述。
L.阻断结合配体和癌症相关蛋白之间结合的试剂的鉴定方法
本发明的另一个实施方案提供鉴定减小或阻断本发明蛋白与结合配体结合的试剂的方法。具体来说,本发明的蛋白在存在或不存在待测试剂的情况下与结合配体混合。在允许蛋白结合的条件下混合后,两种混合物被分析和比较,以确定试剂是否减小或阻断了本发明的蛋白与结合配体的结合。当存在于含有待测试剂的样品中的结合量减少时,就鉴定到了减小或阻断本发明的蛋白与结合配体结合的试剂。
在本文中,当试剂的存在减小结合配体与本发明蛋白结合的程度或阻止了该结合时,该试剂被称为减小或阻断了本发明的蛋白与结合配体之间的结合。一类试剂通过与结合配体结合减小或阻断了该结合,而另一类试剂通过与本发明的蛋白结合减小或阻断了该结合。
用于上述分析方法的结合配体可以是与本发明蛋白结合的分离和充分表征的蛋白或部分表征的蛋白,也可以是已经被鉴定存在于细胞提取液中的结合配体。对于本领域的专业人员来说,显然只要结合配体的特征是可鉴定的性质,例如分子量,现有分析方法就可以使用。
上述方法中分析的试剂可以随机选择或合理选择或设计。这里所说的试剂随机选择是指试剂被随机地选择,不考虑参与本发明的蛋白与结合配体结合的具体序列。随机选择的试剂的例子是使用化学文库或肽组合文库,或生物体的生长培养液。
这里所说的试剂合理选择或设计是指试剂在非随机的基础上选择,考虑与试剂作用相关的靶位点的序列和/或其构象。利用组成结合配体和本发明蛋白的接触位点的肽序列可以合理选择或合理设计试剂。例如,合理选择的肽试剂可以是其氨基酸序列与本发明的蛋白在结合配体上的接触位点一致的肽。这样的试剂通过与结合配体的结合将减小或阻断本发明的蛋白与结合配体的结合。
本发明的试剂可以是例如肽、小分子、维生素衍生物以及碳水化合物。本领域的专业人员可以容易地认识到对本发明的试剂的结构特性没有限制。
本发明的一类试剂是肽试剂,其氨基酸序列在本发明蛋白的氨基酸序列的基础上选择。本发明的肽试剂可以使用本领域现有的标准固相(或液相)肽合成方法来制备。此外,编码这些肽的DNA可以使用商用的寡核苷酸合成仪合成,或使用标准的重组子生产系统重组地生产。如果要包括非基因编码的氨基酸,就必须使用固相肽合成来生产。
本发明的另一类试剂是与本发明的蛋白或结合配体的关键位置具有免疫反应性的抗体。如上所述,通过用含有预测被抗体靶向的那些本发明的蛋白部分或结合配体作为抗原区免疫适当的哺乳动物对象,可以获得抗体。关键区域包括参与本发明的蛋白与结合配体结合的接触位点。
正如下面讨论的,涉及本发明蛋白活性的重要的最小残基序列定义了功能性线性结构域,可以有效地用做诱饵,用于双杂交筛选和潜在结合分子的鉴定。与使用全长分子相反,使用这样的片段将显著地增加筛选的特异性,因此是优选的。同样地,线性序列也可以用作亲和基质,使用生物化学亲和纯化策略来分离结合的蛋白。
M.阻断结合配体与癌症相关蛋白之间结合的试剂的应用
如同在实施例中提供的那样,本发明的蛋白和核酸,例如具有SEQID NO:2、4、6、8、10、12、14或16的氨基酸序列的蛋白,在癌组织中是差异表达的。减小或阻断本发明蛋白与结合配体的相互作用的试剂,包括那些使用本发明蛋白的同源物和类似物而得以鉴定的试剂,可以用来调节与蛋白的功能和活性相关的生物或病理过程。
本文中使用的对象可以是任何哺乳动物,只要该哺乳动物需要调节由本发明的蛋白介导的病理或生物过程。术语“哺乳动物”是指属于哺乳动物纲的个体。本发明在治疗人对象中特别有用。
病理过程是指一类产生有害影响的生物过程。例如,本发明蛋白的表达可能与细胞生长或异常增生相关。在本文中使用时,当试剂减少病理过程的程度或严重性时,该试剂被称为缓解了该病理过程。例如,通过施用减小或阻断本发明蛋白与结合配体的相互作用的试剂,可以防止癌症或缓解疾病的发展。
本发明的试剂可以通过肠胃外、皮下、静脉内、肌内、腹膜内、透皮或含服的途径给药。另外或同时地,给药也可以通过口服。给药的剂量依赖于接受者的年龄、健康状况和体重,同时治疗的种类,如果有的话,以及治疗的频率和所希望的效果。
本发明还提供了含有一种或多种阻断本发明蛋白与结合配体结合的试剂的组合物。因为个体的需要是不同的,确定每个成分的有效量的最适范围属于本领域的技术。典型的剂量包括每公斤体重0.1到100μg。优选的剂量为每公斤体重0.1到10μg。最优选的剂量为每公斤体重0.1到1μg。
除了药理活性试剂外,本发明的组合物还可以含有适当的可药用的载体,包括可以方便使活性成分加工成制剂的赋形剂和辅助剂,该制剂在药学上可用于将活性成分投送到作用位点。适合的肠胃外给药的剂型包括水溶形式的活性化合物的水溶液,例如水溶性的盐。此外,活性化合物的悬浮液也可以适当的油状注射悬浮液形式给药。适合的亲脂溶剂或载体包括脂肪油,例如芝麻油,或合成的脂肪酸酯,例如油酸乙基酯或甘油三酯。水性注射悬浮液可以含有增加悬浮液粘度的物质,包括例如羧甲基纤维素钠、山梨醇和/或葡聚糖。任选地,悬浮液也可以含有稳定剂。脂质体也可以用来封装试剂以投送到细胞中。
本发明用于全身给药的药物剂型可以为肠内、非肠胃或局部给药剂型。事实上,所有三种类型的剂型可以同时使用以完成活性成分的全身给药。
合适的口服剂型包括硬的或软的胶囊、药丸、药片(包括糖衣片)、酏剂、悬浮液、糖浆或其吸入剂和可控制释放的形式。
在实施本发明的方法时,本发明的化合物可以单独使用或组合使用,或与其它的治疗或诊断试剂结合使用。在某些优选实施方案中,本发明的化合物可以与按照一般接受的医学规范为这些疾病开出的其它化合物共同给药。本发明的化合物可以在体内使用,一般在哺乳动物中,例如人、绵羊、马、牛、猪、狗、猫、大鼠和小鼠,也可以在体外使用。
N.合理的药物设计和组合化学
本发明还包括了合理的药物设计和组合化学。专业人员会认可适当的方法,以使用和实施本发明的方面来鉴定可以开发用于治疗癌症的化合物。涉及多肽的合理的药物设计需要鉴定和限定与设计的药物相互作用的第一个肽,然后使用第一个靶肽确定第二个肽的必要条件。在限定了这些必要条件后,人们可以发现或制备出满足所有或基本上所有的限定的必要条件的适当的肽或非肽。因此,合理药物设计的一个目标是生产目的生物活性多肽的结构或功能类似物,或与它们相互作用的小分子(激动剂、拮抗剂、无效化合物(null compound)),以便形成具有,例如更多或更少的潜在配基形式的药物(参见例如Hodgson(1991),Bio.Technology 9:19-21)。组合化学是一门整体地而不是一个一个地合成和测试化合物生物活性的科学,其目的在于比以前所能做到地更快和更廉价地发现药物和物质。近年来,由于计算机辅助蛋白模拟和药物发现中方法的改进,合理药物设计和组合化学已经变得更密切相关了。(参见例如美国专利No.4,908,773、5,884,230、5,873,052、5,331,573和5,888,738)。
由于计算机图形学的出现,将分子模拟用做合理药物设计和组合化学的工具已经极大地发展了。它不仅有可能在计算机屏幕上以三维的方式看见分子,而且有可能研究酶和受体等大分子和待测的合理设计的衍生物分子的相互作用(参见Boorman(1992),Chem.Eng.News70:18-26)。现在有大量用户友好的软件和硬件可用,实际上所有的制药公司都有计算机模拟研究组致力于合理药物设计。例如,分子模拟公司(Molecular Simulations Inc.(
www.msi.com))销售几种复杂精致的程序,可以使用户从氨基酸序列开始,构建出蛋白或多肽的二维或三维模型,将它与其它的二维和三维模型进行比较,并用三维模型实时地分析化合物、药物和肽的相互作用。因此,在本发明的某些实施方案中,软件被用来比较本发明蛋白的区域和与其相互作用的分子(统称为“结合配体”,例如抗蛋白抗体),以及这些分子的片段或衍生物与其它分子,例如肽、肽模拟物和化学物质,以便能预测和设计治疗的相互作用(参见Schneider(1998),Genetic Engineering News December,第20页;Tempczyk等(1997),Molecular Simulations Inc.SolutionsApril;以及Butenhof(1998),分子模拟公司,分子模拟讨论的案例注解(1998年8月))。
O.基因治疗
在另一个实施方案中,基因治疗可以用做调节与蛋白的功能和活性相关的生物和病理过程的手段。这包括在癌细胞中插入基因构建物,其编码含有SEQ ID NO:2、4、6、8、10、12、14或16的全部或至少部分序列的蛋白,或者该基因构建物也可以含有SEQ ID NO:1、3、5、7、9、11、13或15的全部或部分非编码区,它们与启动子或增强子元件可操作地连接,以便该蛋白的表达导致所述癌症的抑制,以及其中该启动子或增强子元件是调节该基因构建物的启动子或增强子元件。
在描述的构建物中,该蛋白的表达可以由任何适当的启动子指导(例如人巨细胞病毒(CMV)、猴病毒(SV40)或金属硫蛋白的启动子),并且可以被任何适当的哺乳动物调控元件调控。例如,如果需要,已知优先在神经细胞、T细胞或B细胞中指导基因表达的增强子可以被用来指导表达。可以使用的增强子包括但不限于那些其表达被表征为组织或细胞特异性的增强子。另外,如果LFG1、LFG2、LFG3、LFG4、LFG5或LFG6的基因组克隆被用作治疗构建物(例如,在如上述用本发明的核酸分子通过杂交将其分离后),调控可以通过同源调控序列介导,或者如果需要,通过来自异源的调控序列,包括上述的任何启动子或调控元件来介导。
将构建物插入到癌细胞中是在体内完成的,例如使用病毒或质粒载体。这样的方法也可以适用于体外使用。因此,本发明的方法可以容易地应用于不同形式的基因治疗中,不论细胞是在离体进行遗传修饰然后施用给宿主中,还是在体内使用包括特别适合于这些治疗的载体的任何多种适当方法进行遗传修饰。
逆转录病毒载体、腺病毒载体、腺相关病毒载体、或对可能参与癌症的细胞(例如上皮细胞)具有适当向性的其它病毒载体,都可以用做治疗基因构建物的基因转移投送系统。有多种用于这种目的的载体已经广为人知(Cozzi PJ等(2002)Prostate,53(2):95-100;Bitzer M,LauerU.,(2002)Dtsch Med Wochenschr.127(31-32):1623-1624;Mezzina和Danos(2002),Trends Genet.8:241-256;Loser等(2002)Curr.Gene Ther.2:161-171;Pfeifer和Verma(2001),Annu.Rev.Genomics Hum.Genet.2:177-211)。逆转录病毒载体发展得特别完善,已经用于临床(Anderson等(1995),美国专利No.5,399,346)。非病毒的方法也可以用于将治疗DNA导入预计将遭受癌症的细胞(Jeschke等(20002)Curr.Gene Ther.1:267-278;Wu等(1988),J.Biol.Chem.263:14621-14624;Wu等(1989),J.Biol.Chem.264:16985-16987)。例如,基因可以通过脂转染、asialorosonucoid多聚赖氨酸交联、或者较不优选的在外科条件下的显微注射的方法导入到神经元或T细胞中。
对于上述的任何应用方法来说,治疗性核酸构建物优选施加在癌症事件的位点(例如通过注射)。然而,它也可以施加在癌症事件附近的组织中,或施加到为预计将遭受癌症的细胞提供供应的血管上。
P.转基因动物
含有突变、敲除或修饰的基因的转基因动物也包括在本发明中,这些基因对应于SEQ ID NO:1、3、5、7、9、11、13或15的cDNA序列,或编码SEQ ID NO:2、4、6、8、10、12、14或16的多肽序列的可读框,或其具有至少大约3、4、5、6、10、15、20、25、30、35或更多氨基酸残基的连续序列的片段。转基因动物是遗传修饰的动物,其已经通过实验转入了重组、外源或克隆的遗传物质。这样的遗传物质通常被称为“转基因”。转基因的核酸序列,在这种情况下是SEQ ID NO:1、3、5、7、9、11、13或15的形式,可以被整合在基因组中该特定的核酸序列在正常情况下不会被发现的位置,也可以整合在转移基因的正常位置上。转基因的组成为来自同物种的基因组或靶动物物种之外不同物种的基因组的核酸序列。
在某些实施方案中,构建了这样的转基因动物,其中包含SEQ IDNO:1、3、5、7、9、11、13或15的基因的全部或部分被删除。在对应于SEQ ID NO:1、3、5、7、9、11、13或15的基因含有一个或多个内含子的情况下,完整的基因——所有外显子、内含子和调控序列——可以被删除。此外,也可以删除比完整的基因小的部分。例如,可以删除单个的外显子和/或内含子,以产生表达修饰的本发明蛋白的动物。
术语“生殖细胞系转基因动物”是指这样的转基因动物,其中遗传变化或遗传信息被导入了生殖系细胞,从而赋予了转基因动物将遗传信息转移给后代的能力。如果这样的后代事实上具有某些或全部的这种改变或遗传信息,那么它们也是转基因动物。
变化或遗传信息对于受体所属的动物物种可以是外源的,只对受体这个特定的个体是外源的,或者遗传信息也可能已经被受体拥有。在最后这种情况下,改变的或导入的基因可以与天然的基因有不同的表达。
转基因动物可以通过各种不同的方法来产生,包括转染、电穿孔、显微注射、在胚胎干细胞中的基因靶向和重组病毒和逆转录病毒感染(参见例如美国专利No.4,736,866;美国专利5,602,307;Mullins等(1993),Hypertension 22:630-633;Brenin等(1997),Surg.Oncol.6:99-110;Recombinant Gene Expression Protocols(Methods in MolecularBiology,第62卷),Tuan主编,Humana Press,Totowa,NJ,1997)。
许多重组或转基因小鼠可以产生,包括那些表达活化的致癌基因序列(美国专利4,736,866)、表达猴SV40 T-抗原(美国专利No.5,728,915)、缺乏干扰素调控因子1(IRF-1)(美国专利No.5,731,490)、表现出多巴胺能功能障碍(美国专利No.5,723,719)、表达至少一种参与血压控制的人类基因(美国专利No.5,731,489)、表现出与在自然发生的阿茨海默氏病中存在的病症有较高的相似性(美国专利No.5,720,936)、具有降低的介导细胞附着能力(美国专利No.5,602,307)、拥有牛生长激素基因(Clutter等(1996),Genetics 143:1753-1760)、或能够产生完全的人类抗体反应(McCarthy(1997),Lancet 349:405)的小鼠。
尽管小鼠和大鼠仍然是大多数转基因实验所选择的动物,在某些情况下优选甚至必须使用另外的动物物种。转基因步骤已经成功地应用在各种非鼠科的动物中,包括绵羊、山羊、猪、狗、猫、猴、黑猩猩、仓鼠、兔、奶牛和豚鼠(参见例如Kim等(1997),Mol.Reprod.Dev.46:515-526;Houdebine(1995),Reprod.Nutr.Dev.35:609-617;Petters(1994),Reprod.Fertil.Dev.6:643-645;Schnieke等(1997),Science 2782130-2133;和Amoah(1997),J.Animal Sci.75:578-585)。
将核酸片段导入重组的哺乳动物感受态细胞的方法可以是任何利于多种核酸分子共转化的方法。本领域的专业人员可以容易地获得产生转基因动物的详细步骤,包括在美国专利No.5,489,743和美国专利No.5,602,307中所公开的那些。
Q.诊断方法
因为本发明的基因和蛋白在癌细胞和非癌组织中表达不同,本发明的基因和蛋白可以用于诊断或监测癌症、追踪疾病的进展、或者将癌组织与非癌组织样品区分开来。一种使用本发明的核酸分子或蛋白诊断癌症的方法包括从活的对象中获得组织。
检测本发明的核酸或蛋白分子的分析方法可以采用任何可用的形式。通常分析核酸分子的方法包括基于杂交或PCR的方法。通常检测本发明的蛋白、多肽或肽的分析方法包括使用任何可用形式的抗体探针,例如原位结合分析等(参见Harlow和Lane,
抗体-实验室手册,冷泉港实验室出版社,冷泉港,NY,1988)。在优选的实施方案中,分析的进行使用了适当的对照。
一般来说,本发明的诊断可以按照实施方案是基于核酸还是基于蛋白的分析而进行分类。某些诊断分析方法检测促进癌变的本发明的核酸或蛋白的突变或多态性。其它的诊断分析方法鉴定和辨别蛋白活性的缺陷,这是通过检测到待测生物体中本发明的RNA或蛋白水平类似于患有疾病例如癌症的生物体中本发明的RNA或蛋白水平,或检测到待测生物体中本发明的RNA或蛋白水平不同于未患疾病的生物体来进行的。
此外,还考虑到了生产含有下面实施方案中描述的试剂和方法的试剂盒,以便允许快速地检测和鉴定蛋白活性或水平的畸变。诊断试剂盒可以包含核酸探针或抗体或其组合,它们能够特异性检测本发明的蛋白或核酸探针或抗体或其组合的突变形式,可以用于测定一个或多个本发明蛋白的RNA或蛋白表达水平。这些试剂盒的检测成分一般与一种或多种下列试剂共同提供。通常提供能够吸附或结合DNA、RNA或蛋白的支持物。可用的支持物包括硝酸纤维素膜、尼龙膜或衍生的尼龙膜,其特征携有带正电荷的取代基的阵列。在这些试剂盒中也可以提供一种或多种限制性酶、对照试剂、缓冲液、扩增酶、以及非人类的多核苷酸,如小牛胸腺或鲑鱼精子DNA。
有用的基于核酸的诊断技术包括但不限于直接的DNA测序、梯度凝胶电泳、Southern印迹分析、单链确认分析(SSCA)、RNA酶保护分析、斑点印迹分析、核酸扩增、等位基因特异性PCR以及这些方法的组合。这些分析的起始点是从生物样品中分离或纯化核酸。可以预期活检组织将提供良好的样品源。核酸从样品中提取出来,并且可以使用引物通过DNA扩增技术如聚合酶链反应(PCR)得到扩增。本领域的专业人员将会容易地确认可用于证实多态性存在的方法。此外,本领域内现有的任何可寻址的阵列技术都可用于本发明的这个方面。多核苷酸阵列的一个具体的实施方案被称为GenechipsTM,已经在美国专利5,143,854、PCT申请WO 90/15070和92/10092中进行了广泛的描述。
各种各样的标记物和交联技术已为本领域的专业技术人员所熟知,可以用于各种核酸分析方法中。有几种途径可以产生用于杂交或PCR的标记的核酸,包括但不限于寡核苷酸标记、缺刻翻译、末端标记或使用标记核苷酸的PCR扩增。此外,编码本发明蛋白的核酸也可以被克隆到载体中以生产mRNA探针。这样的载体在本领域内是广为人知的,可商业获得的,并可以通过加入适当的RNA聚合酶,例如T7、T3或SP6和标记的核苷酸用来在体外合成RNA探针。许多公司例如Pharmacia Biotech(Piscataway,NJ)、Promega(Madison,WI)和U.S.Biochemical Corp(Cleveland,OH)都为这些方案提供商用试剂盒和方案。适合的报告分子或标记物包括放射性核素、酶、荧光、化学发光或产色素的试剂,以及底物、辅助因子、抑制剂、磁性微粒等。
在优选的基于蛋白的诊断中,本发明的抗体以有序阵列方式连接在支持物上,其中大量的抗体被连接在支持物的不同区域,彼此之间不重叠。本领域专业技术人员会容易地确认可用的基于蛋白的诊断的分析方法。蛋白从生物样品中获得,使用常规的方法标记(例如放射性、化学发光或荧光)。利用标记的已知浓度的本发明蛋白的突变体或野生型标准品,研究人员可以准确地确定样品中本发明的蛋白的浓度,根据这个信息可以评估特定形式蛋白的表达水平。常规的光密度测定方法也可以用来更准确地测定这样的蛋白的浓度或表达水平。这些方法也容易使用本领域的专业技术人员熟知的高通量诊断分析技术进行自动化。正如上面详细描述的那样,本领域任何已知的可寻址的阵列技术也可以用于本发明的这个方面,并且在芯片上显示蛋白阵列以试图最大化抗体结合样式和诊断信息。
如上面所讨论的,在本发明的基因或蛋白中多态性的存在或检测可以对生物体中的癌症或相似疾病提供诊断。其它的实施方案包括含有检测成分的诊断试剂盒的制备,所述成分例如特异性针对本发明基因或蛋白的具体多态性突变体的抗体。检测成分一般与一种或多种下列试剂组合提供。能够吸附或结合RNA或蛋白的支持物通常被提供。可用于这种目的的支持物包括但不限于硝酸纤维素膜、尼龙膜或衍生的尼龙膜,其特征为携有带正电荷的取代基的阵列,以及GenechipsTM或其等价物。在这些试剂盒中也可以包括一种或多种酶,例如反转录酶和/或Taq聚合酶,以及dNTP、缓冲液或非人类的多核苷酸,如小牛胸腺或鲑鱼精子DNA。试剂盒分析的结果可以由保健提供者或诊断实验室进行解释。此外,诊断试剂盒也可以生产并销售给个人用于自我诊断。
除了根据多态性的存在或不存在诊断疾病之外,一些与癌症相关的疾病是来自特定的组织中本发明的蛋白或基因的水平偏离,或本发明蛋白表达的方式异常。例如,通过监测各种组织中的表达水平,可以进行诊断或可以鉴定疾病的状态。同样地,通过确定在特定组织中各种不同的本发明蛋白的表达水平的比率(例如表达模式),可以作出健康或疾病的预测。来自健康的个体以及患有癌症的个体的不同组织中本发明蛋白的表达水平被测定。这些数值可以记录在数据库中,并与从测试个体获得的数值进行比较。此外,来自健康的和患病的个体的各种组织中的比率或表达方式都被记录在数据库中。这些分析被称为“疾病状态图谱”,通过比较一个疾病状态图谱(例如来自健康的或患病的个体)与一个来自测试个体的疾病状态图谱,临床医师可以快速地诊断是否存在疾病。
上述的基于核酸和蛋白的诊断技术可用于检测组织中本发明的基因或蛋白表达的水平或量或比率。例如通过定量的Northern印迹、原位分析、免疫组织化学、ELISA、基因芯片阵列技术、PCR和Western印迹,特定的本发明蛋白(野生型或突变体)的RNA或蛋白的表达量或水平可以被快速地测定,并根据这些信息表达的比率可以确定。此外,被分析的本发明的蛋白可以是现在未知的,但是基于它们拥有上述的一个或多个同源区域而被鉴定的家族成员。
可以相信,不用进一步的描述,本领域的普通技术人员就可以使用前面的描述和后面的说明性实施例,制造和使用本发明的化合物并实施被权利要求保护的方法。因此,下面的工作实施例只是具体地指出了本发明的优选实施方案,并不被推论为以任何方式对本公开的剩余部分进行限制。
实施例
实施例1:鉴定癌症中差异表达的mRNA-1
对肿瘤活检和正常组织之间基因表达的整体变化使用Gene Logic,Inc.(Gaithersburg,MD)的GeneExpress Oncology DatasuiteTM进行检测。数据库包括了使用Affymetrix人基因组U95阵列产生的来自不同器官的正常和癌组织样品的基因表达图谱。在数据库的这些组织样品中,分析正常和癌组织组的表达图谱,所述组织组来自乳腺、结肠、食道、肾、肝、肺、淋巴结、卵巢、胰腺、前列腺、直肠和胃。
Affymetrix人基因组U95阵列含有63,175个探针组。探针组是检测一个转录本(基因或cDNA克隆)的一组探针,通常由16-20个寡核苷酸探针对组成。这些探针对包括了完全匹配的组和错配的组,二者对于计算平均差都是必需的。平均差用作转录本表达水平的相对指示器(indicator),并且是对每个探针对的强度差的度量,通过用完全匹配的强度减去错配的强度而计算。这考虑到了探针对之间杂交的可变性以及能够影响荧光强度的其它杂交假象。使用计算出的平均差值,对每个基因建立了绝对信号(absolute call):“不存在”(=没有检测到)、“存在”(=检测到)或“处于边缘”(=不清楚是否存在)。
使用下面的统计方法确定癌组织和正常组织样品之间基因的差异表达。(1)对于每个探针组,使用Affymetrix微阵列组(MicroarraySuite)(v4.0)确定平均差值和绝对信号;(2)在一个给定的样品组中,使用MatLab程序(The MathWorks,Inc.,Natick,MA)通过基本成分分析(PCA)检测组织样品中的无关项。在PCA中使用的数据点是随机选择的探针组(5,000~6,000个探针组)的平均差。无关项被排除出进一步的分析;(3)通过使用GeneExpress程序的倍率变化分析工具分析基因表达的变化。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中每个基因的平均差的平均值和正常组织样品组中该基因的平均差的平均值而计算的。获得在表达水平上有至少3倍的增加或减少的基因。如果基因通过方差测试分析(Steel等,Principles and Procedures ofStatistics:A Biometrical Approach(
统计学原理和程序:生物测量方法), 第三版,McGraw-Hill,1997)测定显示出的p-值少于或等于0.05,它们就被包括在分析中;(4)选择至少在5种不同类型癌症中表现出差异表达的基因。
对芯片数据的分析显示出标记物LFG1的表达在癌组织样品中与正常组织样品中相比显著上调了。LFG1(SEQ ID NO:1或3)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.91875_s_at测定。91875_s_at序列来自EST AI053741。91875_s_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,显示在表1中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.15:1359-1367)。表1中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-1的上调可以诊断癌症。
表1
组织 | 病理学/形态学 | 几何平均值 | 样品数量 | 倍率变化 | 方向 | p-值 | |||
总数 | 存在 | 处于边缘 | 不存在 | ||||||
乳腺 | 正常组织,NOS | 22.71 | 34 | 8 | 4 | 22 | |||
渗透性导管癌 | 184.04 | 61 | 61 | 0 | 0 | 8.11 | 上调 | 0 | |
渗透性小叶癌 | 104.36. | 10 | 9 | 0 | 1 | 4.60 | 上调 | 0.00456 | |
结肠 | 正常组织,NOS | 76.46 | 24 | 23 | 0 | 1 | |||
腺癌,NOS | 244.76 | 36 | 35 | 0 | 1 | 3.20 | 上调 | 0.00001 | |
食管 | 正常组织,NOS | 50.47 | 18 | 16 | 1 | 1 | |||
腺癌,NOS | 297.56 | 8 | 8 | 0 | 0 | 5.90 | 上调 | 0.00367 | |
肾 | 正常组织,NOS | 20.00 | 25 | 1 | 0 | 24 | |||
透明细胞癌 | 60.48 | 11 | 10 | 1 | 0 | 3.02 | 上调 | 0.00082 | |
肾细胞癌 | 65.01 | 16 | 13 | 0 | 3 | 3.25 | 上调 | 0.00011 | |
肝 | 正常组织,NOS | 22.06 | 19 | 3 | 0 | 16 | |||
肝细胞癌,NOS | 86.74 | 23 | 21 | 0 | 2 | 3.93 | 上调 | 0 | |
肺 | 正常组织,NOS | 21.27 | 32 | 6 | 0 | 26 | |||
腺癌,NOS | 122.81 | 39 | 38 | 0 | 1 | 5.77 | 上调 | 0 | |
卵巢 | 正常组织,NOS | 20.21 | 23 | 0 | 0 | 23 | |||
乳头状浆液性腺癌 | 112.80 | 23 | 21 | 0 | 2 | 5.58 | 上调 | 0 | |
胰腺 | 正常组织,NOS | 20.02 | 20 | 1 | 0 | 19 | |||
腺癌,NOS | 72.55 | 25 | 22 | 0 | 3 | 3.62 | 上调 | 0 | |
直肠 | 正常组织,NOS | 78.86 | 20 | 20 | 0 | 0 | |||
腺癌,NOS | 259.95 | 22 | 22 | 0 | 0 | 3.30 | 上调 | 0.00008 | |
胃 | 正常组织,NOS | 36.06 | 18 | 7 | 0 | 11 | |||
腺癌,NOS | 218.74 | 38 | 36 | 0 | 2 | 6.07 | 上调 | 0 |
通过测定结合到芯片序列片段no.91875_s_at的样品得到的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。分析中使用的PCR引物(5’-GCTGAAGCAGGAAAATCGCTT-3’(SEQ ID NO:17)和5’-TGAGACGGAGTCTCACTCGGT-3’(SEQ ID NO:18))是基于特定的Affymetrix片段(91875_s_at)的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO:19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO:20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肾、肝、肺、卵巢、胃和胰腺的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-1的上调。
实施例2:与差异表达的mRNA对应的全长人cDNA(LFG1)的克隆
使用来自人心脏的cDNA文库(ResGen,Huntsville,AL)通过聚合酶链反应(PCR)和cDNA末端的快速扩增(RACE)获得了具有SEQ IDNO:1或3的全长cDNA。使用人基因组浏览器程序(Human GenomeBrowser(University of California,Santa Cruz))在预测的含有91875_s_at序列的基因的基础上设计了用于PCR的基因特异性的寡核苷酸(5’-CACCCTTTGCCTCTGTCACTTCCGCA-3’(SEQ ID NO:21)、5-GCTGGAGCACCAGGACTGCATTG-3’(SEQ ID NO:22)、5’-GGAGCTGAGCAGCAGTGTAATGAA-3’(SEQ ID NO:23)、5’-GAGGCCTGCCTGAAGGAGGAGCTTC-3’(SEQ ID NO:24)、5’-TCTGGAAGTAGTGCAGACGCCTCAGG-3’(SEQ ID NO:25)、5’-AGCCAACGTCGGCTTTGTTATCCAGC-3’(SEQ ID NO:26)、5’-GCTGTCAGATATGATGGTTCTGGAC-3’(SEQ ID NO:27)、5’-CCAGCCTCACCACTGTTGGGTTGC-3’(SEQ ID NO:28)、5’-CATTCTCTGAGCTGTATTAGTGT-3’(SEQ ID NO:29)、5’-CCTGAGCTGGAATGACCTGCA-3’(SEQ ID NO:30)、5’-CTTTGTGTTGGCTGCAGCCACA-3’(SEQ ID NO:31)、5’-TGAGGAGAGACTTTGCTGACTGGT-3’(SEQ ID NO:32)、5’-GTCCTGTCTGGCGGTGCCGA-3’(SEQ ID NO:33)、5’-GCTCCAGGATCCCCTGTCACCTGGGCCTTCTGCCTTTTGGCT-3’(SEQ ID NO:34)、5’-CCATATGGAGAGGAGAGCAGCGGGCCCA-3’(SEQ ID NO:35)、5’-GAAGGAGGAACATGGAGAGGAGA-3’(SEQ IDNO:36)、5’-CCATATGCCCCGGGTAGTCTACTGCAT-3’(SEQ IDNO:37)、和5’-GTCGACTCGAGTCACTTCCGCAAAAACTTCTTG-3’(SEQ ID NO:38)),以及用于RACE的寡核苷酸(5’-TCCATTCCGAAGGCTCTCCTCC-3’(SEQ ID NO:39)、5’-GTCTGTGTGACGGAAATGTAAGC-3’(SEQ ID NO:40)和5’-GAAGGTCGAAGGCAGACCGATGT-3’(SEQ ID NO:41))。带有引物序列的扩增产物使用Topo克隆系统(Topo Cloning System(Invitrogen,Carlsbad,CA))被整合到PCR4-Topo载体中,然后测序。
对应于上面检测到的差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO:1和3中。前者中,cDNA含有5293个碱基对。后者中cDNA含有5317个碱基对。
SEQ ID NO:1的cDNA核苷酸序列中的可读框,位于390-4880位核苷酸(包括终止密码子为390-4883位核苷酸),编码了1497个氨基酸的蛋白。对应于SEQ ID NO:1所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:2中。图2显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:2的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
SEQ ID NO:3的cDNA核苷酸序列中的可读框,位于12-4904位核苷酸(包括终止密码子为12-4907位核苷酸),编码了1631个氨基酸的蛋白。对应于SEQ ID NO:3所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:4中。图3显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:4的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
SEQ ID NO:2的蛋白序列与SEQ ID NO:4的蛋白序列相同,除了SEQ ID NO:2缺失SEQ ID NO:4 N-端的前134个氨基酸之外。
SEQ ID NOS:2和4含有Calponin同源结构域(SEQ ID NO:4的38-145位氨基酸)、用于结合钙调蛋白的IQ结构域(SEQ ID NO:2的629-646位氨基酸和SEQ ID NO:4的763-780位氨基酸)、RasGAP结构域(SEQ ID NO:2的858-1195位氨基酸和SEQ ID NO:4的992-1329位氨基酸)以及RasGAP C-末端结构域(SEQ ID NO:2的1298-1421位氨基酸和SEQ ID NO:4的1432-1555位氨基酸)。SEQ ID NOS:2和4与IQGAP蛋白类似(Weissbach等(1994),J Biol Chem 269:20517-20521;Brill等(1996),Mol Cell Biol 16:4869-4878)。IQGAP结合到参与细胞骨架结构、细胞-细胞附着和增殖信号传导的蛋白上并调节这些蛋白的功能(Fukada等(2002),Cell 109:1-20;Briggs等(2002),J Biol Chem277:7453-7465;McCallum等(1998),J Biol Chem 273:22537-22544)。IQGAP1缺陷的小鼠相对于野生型表现出显著增加的晚期发作的胃增生(Li等(2000),Mol Cell Biol 20:697-701)。
进行了Northern印迹分析以测定对应于LFG1的mRNA转录本的大小。使用包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹,Clontech,Palo Alto,CA),含有91875_s_at序列的EST通过随机引物方法进行放射性标记,并被用作印迹探针。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,并用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有3个转录本,大小大约为7.2kb和6.3kb。这与LFG1克隆(SEQ ID NO:1和3)的大小一致。
实施例3:鉴定癌症中差异表达的mRNA-2
重复实施例1中的过程,除了以标记物LFG2代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG2的表达在癌组织样品中与正常组织样品中相比显著地下调了。LFG2(SEQ ID NO:5)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.82941_at测定。82941_at序列来自EST AI277612。82941_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表2中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.15:1359-1367)。表2中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-2的下调可以诊断癌症。
表2
组织 | 病理学/形态学 | 几何平均值 | 样品数量 | 倍率变化 | 方向 | p-值 | |||
总数 | 存在 | 处于边缘 | 不存在 | ||||||
乳腺 | 正常组织,NOS | 1147.66 | 34 | 34 | 0 | 0 | |||
渗透性导管癌 | 129.77 | 61 | 26 | 3 | 32 | 8.71 | 下调 | 0 | |
渗透性小叶癌 | 183.37 | 10 | 6 | 1 | 3 | 5.48 | 下调 | 0.00002 | |
结肠 | 正常组织,NOS | 890.06 | 24 | 23 | 1 | 0 | |||
腺癌,NOS | 163.35 | 36 | 17 | 1 | 18 | 5.39 | 下调 | 0 | |
食管 | 正常组织,NOS | 612.34 | 18 | 18 | 0 | 0 | |||
腺癌,NOS | 265.11 | 8 | 7 | 1 | 0 | 2.31 | 下调 | 0.02218 | |
肝 | 正常组织,NOS | 182.73 | 19 | 11 | 1 | 7 | |||
肝细胞癌,NOS | 114.69 | 23 | 7 | 1 | 15 | 1.51 | 下调 | 0.01211 | |
肺 | 正常组织,NOS | 535.64 | 32 | 30 | 2 | 0 | |||
腺癌,NOS | 119.36 | 39 | 17 | 3 | 19 | 4.27 | 下调 | 0 | |
淋巴结 | 正常组织,NOS | 454.08 | 9 | 7 | 0 | 2 | |||
恶性淋巴瘤,NOS | 123.13 | 12 | 5 | 0 | 7 | 3.24 | 下调 | 0.02245 | |
卵巢 | 正常组织,NOS | 279.99 | 23 | 21 | 0 | 2 | |||
乳头状浆液性腺癌 | 85.45 | 23 | 7 | 1 | 15 | 3.5 | 下调 | 0 | |
前列腺 | 正常组织,NOS | 195.77 | 19 | 13 | 1 | 5 | |||
腺癌,NOS | 80.06 | 19 | 2 | 2 | 15 | 2.57 | 下调 | 0.00011 | |
直肠 | 正常组织,NOS | 943.86 | 20 | 19 | 0 | 1 | |||
腺癌,NOS | 176.45 | 22 | 13 | 2 | 7 | 5.2 | 下调 | 0 | |
胃 | 正常组织,NOS | 414.40 | 18 | 16 | 0 | 2 | |||
腺癌,NOS | 125.39 | 38 | 17 | 2 | 19 | 3.21 | 下调 | 0 |
通过结合到芯片序列片段no.82941_at的样品测定得到的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-GAATGTGTCAGAGACAAGTGCAGC-3’(SEQ ID NO:42)和5’-TGTAGAAACTCTTGGACTAATGGAGG-3’(SEQ ID NO:43))是基于分析中使用的含有Affymetrix片段(82941_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO:19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO:20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肝、肺、卵巢和胃的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-2的下调。
实施例4:与差异表达的mRNA对应的全长人cDNA(LFG2)的克隆
具有SEQ ID NO:5的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies,Rockville,MD)获得。简单地说,基于含有82941_at序列的EST的序列设计了基因特异的寡聚物(5’-GAATGTGTCAGAGACAAGTGCAGC-3’(SEQ IDNO:42))。这个寡聚物用生物素标记,并用来与来自分化很少的胃腺癌文库(NCI CGAP Gas4)(ResGen,Huntsville,AL)的5μg单链质粒DNA(cDNA重组子)杂交,采用Sambrook等描述的步骤。杂交的cDNAs通过结合了链亲和素的珠子进行分离,以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA,用于转化大肠杆菌(E.coli)细胞(DH10B),筛选出最长的cDNA。阳性的选择使用基因特异性的引物通过PCR进行确认后,对cDNA克隆进行DNA测序。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO:5中。该cDNA含有3608个碱基对。
SEQ ID NO:5的cDNA核苷酸序列中的可读框,位于424-1908位核苷酸(包括终止密码子为424-1911位核苷酸),编码了495个氨基酸的蛋白。对应于SEQ ID NO:5所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:6中。
SEQ ID NO:6与清除受体具有同源性,该受体参与选定的多聚阴离子配体的胞吞作用、凋亡细胞和细菌的吞噬作用、细胞附着以及动脉粥样硬化的发展(Peiser等(2002),Curr.Opin.Immunol.14:123-128;Resnick等(1994),Trends Biol.Sci.19:5-8)。基于已出版的清除受体的研究工作,SEQ ID NO:6含有细胞质结构域(1-35位氨基酸)、跨膜结构域(36-58位氨基酸)、α-螺旋卷曲的结构域(90-301位氨基酸)、胶原蛋白样结构域(305-380位氨基酸)以及清除受体的富含半胱氨酸(SRCR)的结构域(393-493位氨基酸)。SRCR结构域含有6个半胱氨酸残基(418、431、462、472、482和492位氨基酸),其可以参与结构域内二硫键的形成。SEQ ID NO:6也显示出与小鼠同系物(GenBank登录No.BC016096)的同源性。它在整个连续的序列中显示出70%的同一性。
图4显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:6的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
进行了Northern印迹分析以测定对应于LFG2的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人MTN印迹,Clontech,Palo Alto,CA),含有82941_at序列的EST通过随机引物方法进行放射性标记,并被用来作印迹探针。印迹在含有50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,并用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有单一的转录本,大小大约为3.7kb。这与LFG2克隆(SEQ ID NO:5)的大小一致。
实施例5:鉴定癌症中差异表达的mRNA-3
重复实施例1中的过程,除了以标记物LFG3代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG3的表达在癌组织样品中与正常组织样品中相比显著地下调了。LFG3(SEQ ID NO:7)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.46104_at测定。46104_at序列来自EST AA772055。46104_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表3中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.15:1359-1367)。表3中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-3的下调可以诊断癌症。
表3
组织 | 病理学/形态学 | 几何平均值 | 样品数量 | 倍率变化 | 方向 | p-值 | |||
总数 | 存在 | 处于边缘 | 不存在 | ||||||
乳腺 | 正常组织,NOS | 64.52 | 34 | 31 | 0 | 3 | |||
渗透性导管癌 | 27.24 | 61 | 18 | 1 | 42 | 2.25 | 下调 | 0 | |
渗透性小叶癌 | 29.52 | 10 | 4 | 0 | 6 | 2.21 | 下调 | 0.00004 | |
结肠 | 正常组织,NOS | 315.46 | 24 | 24 | 0 | 0 | |||
腺癌,NOS | 102.99 | 36 | 31 | 0 | 5 | 3.02 | 下调 | 0.00016 | |
食管 | 正常组织,NOS | 272.48 | 18 | 17 | 0 | 1 | |||
腺癌,NOS | 41.25 | 8 | 6 | 0 | 2 | 6.60 | 下调 | 0.00001 | |
肾 | 正常组织,NOS | 2626.88 | 25 | 25 | 0 | 0 | |||
透明细胞腺癌 | 344.66 | 11 | 11 | 0 | 0 | 7.62 | 下调 | 0.00003 | |
肾细胞癌 | 355.71 | 16 | 14 | 0 | 2 | 7.38 | 下调 | 0.00005 | |
卵巢 | 正常组织,NOS | 1098.41 | 23 | 23 | 0 | 0 | |||
乳头状浆液性腺癌 | 178.15 | 23 | 22 | 0 | 1 | 6.17 | 下调 | 0 | |
前列腺 | 正常组织,NOS | 274.49 | 19 | 19 | 0 | 0 | |||
腺癌,NOS | 117.26 | 19 | 18 | 0 | 1 | 2.34 | 下调 | 0.00016 | |
直肠 | 正常组织,NOS | 410.22 | 20 | 20 | 0 | 0 | |||
腺癌,NOS | 72.98 | 22 | 16 | 0 | 6 | 5.38 | 下调 | 0 | |
胃 | 正常组织,NOS | 71.10 | 18 | 10 | 0 | 8 | |||
腺癌,NOS | 35.49 | 38 | 15 | 1 | 22 | 1.98 | 下调 | 0.00459 |
通过样品结合到芯片序列片段no.46104_at测定的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-GTATGCATCAGAATTCCCTATAGATCTTT-3’(SEQ ID NO:44)和5’-TAGATGTTTGGGCAACAGCCT-3’(SEQ IDNO:45)是基于分析中使用的含有Affymetrix片段(46104_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO:19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO:20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肾、卵巢、胰腺和胃的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-3的下调。
实施例6:与差异表达的mRNA对应的全长人cDNA(LFG3)的克隆
具有SEQ ID NO:7的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies,Rockville,MD)获得。简单地说,基于含有46104_at序列的EST的序列设计了基因特异的寡聚物(5’-GTATGCATCAGAATTCCCTATAGATCTTT-3’(SEQID NO:44))。这个寡聚物用生物素标记,并用来与来自人胎肾(ResGen,Huntsville,AL)的5μg单链质粒DNA(cDNA重组子)杂交,采用Sambrook等描述的步骤。杂交的cDNAs通过结合有链亲和素的珠子进行分离,以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA,用于转化大肠杆菌(E.coli)细胞(DH10B),并筛选出最长的cDNA。阳性选择通过使用基因特异性的引物进行PCR确认后,对cDNA克隆进行DNA测序。LFG3的5’-末端通过cDNA末端的快速扩增(RACE)来鉴定,使用了从人胎肾制备的cDNA(Clontech,Palo Alto,CA)和基因特异性的引物(5’-TTCCTTCACCAAAGGCATCCAGCCATTCTATG-3’(SEQ ID NO:46))。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO:7中。该cDNA含有3162个碱基对。
SEQ ID NO:7的cDNA核苷酸序列中的可读框,位于405-1835位核苷酸(包括终止密码子为405-1838位核苷酸),编码了477个氨基酸的蛋白。对应于SEQ ID NO:7所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:8中。
SEQ ID NO:8与单羧酸转运蛋白(MCTs)相似,含有10个预测的跨膜结构域(10-29、80-99、107-128、140-160、274-295、312-332、339-360、363-384、396-416和433-451位氨基酸)。MCT蛋白催化单羧酸例如乳酸、丙酮酸、支链酮酸、酮体、β-羟基丁酸和乙酸的易化运输(Halestrap和Price(1999),Biochem.J.343:281-299)。表4总结了SEQ ID NO:4与8个已知的单羧酸转运蛋白的相似性比例。
表4.LFG3与MCT蛋白的同源性
蛋白 | 大小(氨基酸) | 同一性(%) | 阳性(%) |
MCT1 | 500 | 17.5 | 34.3 |
MCT2 | 478 | 19.5 | 35.5 |
MCT3 | 504 | 19.5 | 34.1 |
MCT4 | 465 | 19.0 | 33.2 |
MCT5 | 487 | 22.1 | 36.9 |
MCT6 | 505 | 16.4 | 31.5 |
MCT7 | 523 | 20.1 | 35.2 |
MCT8 | 613 | 15.9 | 27.9 |
图5显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:8的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
进行了Northern印迹分析以测定对应于LFG3的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹,Clontech,Palo Alto,CA),含有46104_at序列的EST通过随机引物方法进行放射性标记,并被用来探测印迹。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,并用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有单一的转录本,大小大约为4.2kb。这与LFG3克隆(SEQ ID NO:7)的大小一致。
实施例7:鉴定癌症中差异表达的mRNA-4
重复实施例1中的过程,除了以标记物LFG4代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG4的表达在癌组织样品中与正常组织样品中相比显著地下调了。LFG4(SEQ ID NO:9)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.62158_at测定。62158_at序列来自EST AI123532。62158_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表5中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.15:1359-1367)。表5中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-4的下调可以诊断癌症。
表5
组织 | 病理学/形态学 | 几何平均值 | 样品数量 | 倍率变化 | 方向 | p-值 | |||
总数 | 存在 | 处于边缘 | 不存在 | ||||||
乳腺 | 正常组织,NOS | 156.75 | 34 | 33 | 0 | 1 | |||
渗透性导管癌 | 90.09 | 61 | 51 | 0 | 10 | 1.74 | 下调 | 0.00001 | |
结肠 | 正常组织,NOS | 234.06 | 24 | 22 | 2 | 0 | |||
腺癌,NOS | 64.02 | 36 | 24 | 0 | 12 | 3.66 | 下调 | 0 | |
肾 | 正常组织,NOS | 134.17 | 25 | 23 | 0 | 2 | |||
透明细胞腺癌 | 78.59 | 11 | 7 | 1 | 3 | 1.71 | 下调 | 0.08272 | |
肾细胞癌 | 55.31 | 16 | 9 | 0 | 7 | 2.43 | 下调 | 0.0021 | |
肺 | 正常组织,NOS | 179.71 | 32 | 32 | 0 | 0 | |||
腺癌,NOS | 47.39 | 39 | 17 | 3 | 19 | 3.79 | 下调 | 0 | |
淋巴结 | 正常组织,NOS | 140.51 | 9 | 7 | 1 | 1 | |||
恶性淋巴瘤,NOS | 41.43 | 12 | 5 | 1 | 6 | 3.39 | 下调 | 0.00207 | |
卵巢 | 正常组织,NOS | 125.19 | 23 | 21 | 0 | 2 | |||
乳头状浆液性腺癌 | 37.23 | 23 | 4 | 0 | 19 | 3.36 | 下调 | 0 | |
前列腺 | 正常组织,NOS | 191.94 | 19 | 18 | 0 | 1 | |||
腺癌,NOS | 103.47 | 19 | 16 | 0 | 3 | 1.86 | 下调 | 0.00185 | |
直肠 | 正常组织,NOS | 317.95 | 20 | 20 | 0 | 0 | |||
腺癌,NOS | 74.28 | 22 | 16 | 1 | 5 | 4.28 | 下调 | 0 | |
胃 | 正常组织,NOS | 161.77 | 18 | 17 | 0 | 1 | |||
腺癌,NOS | 84.55 | 38 | 27 | 2 | 9 | 1.91 | 下调 | 0.0062 |
通过样品结合到芯片序列片段no.62158_at所测定的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-AAATGTCTGATTACCCCATTTTATCAGT-3’(SEQ ID NO:47)和5’-TAATCCTGAAATGAACAGCTAACA-3’)(SEQ ID NO:48))是基于分析中使用的含有Affymetrix片段(62158_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO:19)和5′-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO:20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肝、肺、卵巢、胰腺和胃的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-4的下调。
实施例8:与差异表达的mRNA对应的全长人cDNA(LFG4)的克隆
具有SEQ ID NO:9的全长cDNA通过cDNA末端的快速扩增(RACE)获得。简单地说,基于含有62158_at序列的EST的序列设计了基因特异性的寡聚物((5’-TAATGTTAGAGTAACAGCATTTTCCTTCAA-3’(SEQ ID NO:49)和5’-TGCCCCACACTAACTCAGTTCTTGTGATG-3’(SEQ ID NO:50))。这个寡聚物被用来对从人脑制备的cDNAs(Clontech,Palo Alto,CA)进行PCR扩增。带引物的扩增产物使用Topo克隆系统(Invitrogen,Carlsbad,CA)整合到PCR4-Topo载体中,然后测序。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO:9中。该cDNA含有4891个碱基对。
SEQ ID NO:9的cDNA核苷酸序列中的可读框,位于89-1150位核苷酸(包括终止密码子为89-1153位核苷酸),编码了354个氨基酸的蛋白。对应于SEQ ID NO:9所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:10中。
SEQ ID NO:10与大鼠的Kilon和鸡的Neurotractin(Funatsu等(1999),J Biol Chem 274:8224-8230;Marg等(1999),J Cell Biol 145:865-876)相似。蛋白序列分析发现了分泌信号肽(1-33位氨基酸)、3个免疫球蛋白结构域(47-136、145-208和231-312位氨基酸)以及6个推断的N-连接糖基化位点(73、155、275、286、294和307位氨基酸)。Kilon/Neurotractin是免疫球蛋白超家族的IgLON亚家族的一个成员。IgLONs是一族糖基化磷脂酰肌醇(GPI)连接的细胞附着分子,被认为修饰了轴突的突起(outgrowth),可能在细胞-细胞附着和识别中发挥作用(Miyate等(2000),J Comparative Neurol 424:74-85)。
图6显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:10的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。这个亲水性图显示出在C末端存在疏水区域。在GPI锚定蛋白的情况下,已知GPI锚的添加发生在切除C末端的疏水区域之后。推断的GPI锚连接位点被发现(324位氨基酸处的甘氨酸)。
进行了Northern印迹分析以测定对应于LFG4的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹,Clontech,Palo Alto,CA),含有62158_at序列的EST通过随机引物方法进行放射性标记,并被用来探测印迹。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,并用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有单一的转录本,大小大约为5.4kb。这与LFG4克隆(SEQ ID NO:9)的大小一致。
实施例9:鉴定癌症中差异表达的mRNA-5
重复实施例1中的过程,除了以标记物LFG5代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG5的表达在癌组织样品中与正常组织样品中相比显著下调了。LFG5(SEQ ID NO:11)的表达水平可以在Affymetrix GeneChipsU95上通过芯片序列片段no.46659_at测定。46659_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表6中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。表6中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-5的差异表达可以诊断癌症。
表6
组织 | 病理学/形态学 | 几何平均值 | 样品数量 | 倍率变化 | 方向 | p-值 | |||
总数 | 存在 | 处于边缘 | 不存在 | ||||||
乳腺 | 正常组织,NOS | 152.75 | 34 | 31 | 0 | 3 | |||
渗透性导管癌 | 404.58 | 61 | 60 | 0 | 1 | 2.65 | 上调 | 0 | |
渗透性小叶癌 | 277.71 | 10 | 10 | 0 | 0 | 1.82 | 上调 | 0.07445 | |
食管 | 正常组织,NOS | 85.47 | 18 | 15 | 0 | 2 | |||
腺癌,NOS | 373.97 | 8 | 8 | 0 | 0 | 4.38 | 上调 | 0.0009 | |
肾 | 正常组织,NOS | 53.58 | 25 | 17 | 0 | 8 | |||
透明细胞腺癌 | 161.36 | 11 | 11 | 0 | 0 | 3.01 | 上调 | 0.00011 | |
肾细胞癌 | 249.37 | 16 | 16 | 0 | 0 | 4.65 | 上调 | 0 | |
肺 | 正常组织,NOS | 330.65 | 32 | 31 | 0 | 1 | |||
腺癌,NOS | 195.43 | 39 | 35 | 0 | 4 | 1.69 | 下调 | 0.00538 | |
淋巴结 | 正常组织,NOS | 219.77 | 9 | 9 | 0 | 0 | |||
恶性淋巴瘤,NOS | 142.09 | 12 | 11 | 0 | 1 | 1.55 | 下调 | 0.25114 | |
卵巢 | 正常组织,NOS | 90.40 | 23 | 19 | 0 | 4 | |||
乳头状浆液性腺癌 | 418.81 | 23 | 23 | 0 | 0 | 4.63 | 上调 | 0 | |
胰腺 | 正常组织,NOS | 38.53 | 20 | 12 | 0 | 8 | |||
腺癌,NOS | 344.37 | 25 | 25 | 0 | 0 | 8.94 | 上调 | 0 | |
胃 | 正常组织,NOS | 185.50 | 18 | 17 | 0 | 1 | |||
腺癌,NOS | 279.62 | 38 | 35 | 0 | 3 | 1.51 | 上调 | 0.12664 |
通过结合到芯片序列片段no.46659_at的样品测定的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-AAGGCTTTATCAGGTCTGCATATAGAATC-3’(SEQ ID NO:51)和5’-GCAAAGAACCCTAATGCTATTTATCAGC-3’(SEQ ID NO:52))是基于分析中使用的特异性Affymetrix片段(46659_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ IDNO:19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO:20))被用作对照引物。这种方法提供以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自肾、肺、卵巢和胰腺的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-5的差异表达。
实施例10:与差异表达的mRNA对应的全长人cDNA(LFG5)的克隆
具有SEQ ID NO:11的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies,Rockville,MD)获得。简单地说,基于含有46659_at序列的EST的序列设计了基因特异的寡聚物(5’-GAGAAGACCAGGGAAGAAGCAG-3’(SEQ IDNO:53))。这个寡聚物用生物素标记,用来与来自人心脏文库(ResGen,Huntsville,AL)的5μg单链质粒DNA(cDNA重组子)杂交,采用Sambrook等描述的步骤。杂交的cDNAs通过结合链亲和素的珠子进行分离,以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA,用于转化大肠杆菌细胞(DH10B),筛选出最长的cDNA。阳性的选择通过PCR使用基因特异的引物进行确认后,对cDNA克隆进行DNA测序。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO:11中。该cDNA含有3098个碱基对。
SEQ ID NO:11的cDNA核苷酸序列中的可读框,位于223-1569位核苷酸(包括终止密码子为223-1572位核苷酸),编码了449个氨基酸的蛋白。对应于SEQ ID NO:11所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:12中。
SEQ ID NO:12含有胸苷酸激酶结构域(257-438位氨基酸)。胸苷酸激酶是核苷酸单磷酸激酶(NMPKs)的成员,在用于RNA和DNA合成的核苷酸的合成中发挥作用,为治疗性核苷和核苷酸类似物的药物活化所需要(Van Rompay等(2000),Pharmacology & Therapeutics87:189-198)。SEQ ID NO:12与在巨噬细胞活化的过程中被诱导(Lee和O’Brien(1995),J Immunol.154:6094-6102)的小鼠胸苷酸激酶(GenBank Accession No.NM_020557)显示出同源性。它在整个连续的序列上显示出63%的同一性。
图7显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:12的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
进行了Northern印迹分析以测定对应于LFG5的mRNA转录本的大小。使用了包含来自不同人组织的总RNAs进行Northern印迹(人MTN印迹,Clontech,Palo Alto,CA),含有82941_at序列的EST通过随机引物方法进行放射性标记,并被用来探测印迹。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有一个单一的转录本,大小大约为3.0kb。这与LFG5克隆(SEQ ID NO:11)的大小一致。
实施例11:鉴定癌症中差异表达的mRNA-6
重复实施例1中的过程,除了以标记物LFG6代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG6的表达在癌组织样品中与正常组织样品中相比显著地上调了。LFG6(SEQ ID NO:13或15)的表达水平可以在Affymetrix GeneChipsU95上通过芯片序列片段no.44103_at测定。44103_at序列来自EST AA865614。44103_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表7中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.15:1359-1367)。表7中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-6的上调可以诊断癌症。
表7
组织 | 病理学/形态学 | 几何平均值 | 样品数量 | 倍率变化 | 方向白 | p-值 | |||
总数 | 存在 | 处于边缘 | 不存在 | ||||||
肾 | 正常组织,NOS | 337.71 | 25 | 25 | 0 | 0 | |||
透明细胞腺癌 | 556.82 | 11 | 11 | 0 | 0 | 1.65 | 上调 | 0.00314 | |
肝 | 正常组织,NOS | 406.93 | 19 | 18 | 0 | 1 | |||
肝细胞癌,NOS | 619.40 | 23 | 22 | 0 | 1 | 1.52 | 上调 | 0.00303 | |
卵巢 | 正常组织,NOS | 380.10 | 23 | 23 | 0 | 0 | |||
乳头状浆液性腺癌 | 578.60 | 23 | 23 | 0 | 0 | 1.52 | 上调 | 0.00013 | |
胰腺 | 正常组织,NOS | 138.75 | 20 | 11 | 1 | 8 | |||
腺癌,NOS | 453.01 | 25 | 25 | 0 | 0 | 3.26 | 上调 | 0.00002 |
对通过结合到芯片序列片段no.44103_at的样品测定的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-GGACGGGGAACTTGGACGC-3’(SEQ IDNO:54)and 5’-AAGTGCAGGGCCTCTGGGTG-3’(SEQ ID NO:55))是基于分析中使用的含有Affymetrix片段(44103_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ IDNO:19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO:20))被用作对照引物。这种方法提供以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自肝和卵巢(Ambion,Inc.,Austin,TX)的正常和肿瘤组织的总RNA对。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-6的上调。
实施例12.与差异表达的mRNA对应的全长人cDNA(LFG6)的克隆
具有SEQ ID NO:13或15的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies,Rockville,MD)获得。简单地说,基于含有44103_at序列的EST的序列设计了基因特异性的寡聚物(5’-CGCTGGGTCATCGGACGGT-3’(SEQ ID NO:56))。这个寡聚物用生物素标记,用来与来自完全分化的人胃腺癌文库(ResGen,Huntsville,AL)的5μg单链质粒DNA(cDNA重组子)杂交,采用Sambrook等描述的步骤。杂交的cDNAs通过结合链亲和素的珠子进行分离,以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA,用于转化大肠杆菌细胞(DH10B),筛选出最长的cDNA。阳性选择通过PCR使用基因特异性的引物进行确认后,对cDNA克隆进行DNA测序。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO:13和15中。前者中cDNA含有1893个碱基对。后者中cDNA含有1597个碱基对。
SEQ ID NO:13的cDNA核苷酸序列中的可读框,位于418-1392位核苷酸(包括终止密码子为418-1395位核苷酸),编码了325个氨基酸的蛋白。对应于SEQ ID NO:13所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:14中。图9显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:14的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
SEQ ID NO:15的cDNA核苷酸序列中的可读框,位于271-1431位核苷酸(包括终止密码子为271-1434位核苷酸),编码了387个氨基酸的蛋白。对应于SEQ ID NO:15所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:16中。图10显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:16的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
SEQ ID NO:14和16含有泛素蛋白同源(UBQ)结构域(239-300位氨基酸)。SEQ ID NOS:14和16与大鼠的Sharpin蛋白相似(Lim等(2001),Mol Cell Neurosci 17:385-397)。Sharpin直接与Shank蛋白的锚蛋白重复序列相互作用,Shank蛋白在的细胞骨架复合物的结构和特化细胞连接处的细胞内信号传导中起作用(Sheng和Kim(2000),J Cell Sci113:1851-1856)。
进行了Northern印迹分析以测定对应于LFG6的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹,Clontech,Palo Alto,CA),含有44103_at序列的EST通过随机引物方法进行放射性标记,被用来探测印迹。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有三个转录本,大小大约为3.0kb、1.5kb和1.2kb。这与LFG6克隆(SEQ ID NO:13和15)的大小一致。
尽管参考上述的实施例,本发明已经被描述得很详细,应该理解的是在不偏离本发明实质的情况下可对发明进行各种不同的修饰。因此,本发明只受到后面的权利要求的限制。所有在本申请中引用的专利、专利申请和出版物,在此以其全文引为参考。
序列表
<110>株式会社LG生命科学(LG Life sciences Ltd.)
<120>与癌症相关的基因家族(Gene Famililies Associated With Cancers)
<130>SCT051353-47
<150>US60/419911
<151>2002-10-18
<150>US60/419912
<151>2002-10-18
<150>US60/420088
<151>2002-10-18
<150>US60/434243
<151>2002-12-16
<150>US60/434278
<151>2002-12-16
<150>US60/438278
<151>2003-01-03
<160>56
<170>KopatentIn 1.71
<210>1
<211>5293
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(390)..(4880)
<223>LBFL109 Clone A
<400>1
gtcctgtctg gcggtgccga cggtgagggg cggtggccca acggcgggag attcaaacct 60
ggaagaagga ggaacatgga gaggagagca gcgggcccag gctgggcagc ctctggatcg 120
aggcctgcct gaaggaggag cttccttccc cggtggagct ggaggagagc cttcggaatg 180
gagtgctgct ggccaagctg ggccactgtt ttgcaccctc cgtggttccg ttgaagaaga 240
tctacgatgt ggagcagctg cggtaccagg caactggctt acatttccgt cacacagaca 300
acatcaactt ttggctatct gcaatagccc acatcggtct gccttcgacc ttcttcccag 360
agaccacgga catctatgac aaaaagaac atg ccc cgg gta gtc tac tgc atc 413
Met Pro Arg Val Val Tyr Cys Ile
1 5
cat gct ctc agt ctc ttc ctc ttc cgg ctg gga ttg gcc cct cag ata 461
His Ala Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala Pro Gln Ile
10 15 20
cat gat cta tac ggg aaa gtg aaa ttc aca gct gag gaa ctc agc aac 509
His Asp Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu Leu Ser Asn
25 30 35 40
atg gcg tcc gaa ctg gcc aaa tat ggc ctc cag ctg cct gcc ttc agc 557
Met Ala Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro Ala Phe Ser
45 50 55
aag atc ggg ggc atc ttg gcc aat gag ctc tcg gtg gat gag gct gca 605
Lys Ile Gly Gly Ile Leu Ala Asn Glu Leu Ser Val Asp Glu Ala Ala
60 65 70
gtc cat gca gct gtt ctt gcc atc aat gaa gca gtg gag cga ggg gtg 653
Val His Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu Arg Gly Val
75 80 85
gtg gag gac acc ctg gct gcc ttg cag aat ccc agt gct ctt ctg gag 701
Val Glu Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala Leu Leu Glu
90 95 100
aat ctc cga gag cct ctg gca gcc gtc tac cag gag atg ctg gcc cag 749
Asn Leu Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met Leu Ala Gln
105 110 115 120
gcc aag atg gag aag gca gcc aat gcc agg aac cat gat gac aga gaa 797
Ala Lys Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp Asp Arg Glu
125 130 135
agc cag gac atc tat gac cac tac cta act cag gct gaa atc cag ggc 845
Ser Gln Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu Ile Gln Gly
140 145 150
aat atc aac cat gtc aac gtc cat ggg gct cta gaa gtt gtt gat gat 893
Asn Ile Asn His Val Asn Val His Gly Ala Leu Glu Val Val Asp Asp
155 160 165
gcc ctg gaa aga cag agc cct gaa gcc ttg ctc aag gcc ctt caa gac 941
Ala Leu Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala Leu Gln Asp
170 175 180
cct gcc ctg gcc ctg cga ggg gtg agg aga gac ttt gct gac tgg tac 989
Pro Ala Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala Asp Trp Tyr
185 190 195 200
ctg gag cag ctg aac tca gac aga gag cag aag gca cag gag ctg ggc 1037
Leu Glu Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln Glu Leu Gly
205 210 215
ctg gtg gag ctt ctg gaa aag gag gaa gtc cag gct ggt gtg gct gca 1085
Leu Val Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly Val Ala Ala
220 225 230
gcc aac aca aag ggt gat cag gaa caa gcc atg ctc cac gct gtg cag 1133
Ala Asn Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His Ala Val Gln
235 240 245
cgg atc aac aaa gcc atc cgg agg gga gtg gcg gct gac act gtg aag 1181
Arg Ile Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp Thr Val Lys
250 255 260
gag ctg atg tgc cct gag gcc cag ctg cct cca gtg tac cct gtt gca 1229
Glu Leu Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr Pro Val Ala
265 270 275 280
tcg tct atg tac cag ctg gag ctg gca gtg ctc cag cag cag cag ggg 1277
Ser Ser Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln Gln Gln Gly
285 290 295
gag ctt ggc cag gag gag ctc ttc gtg gct gtg gag atg ctc tca gct 1325
Glu Leu Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met Leu Ser Ala
300 305 310
gtg gtc ctg att aac cgg gcc ctg gag gcc cgg gat gcc agt ggc ttc 1373
Val Val Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala Ser Gly Phe
315 320 325
tgg agc agc ctg gtg aac cct gcc aca ggc ctg gct gag gtg gaa gga 1421
Trp Ser Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu Val Glu Gly
330 335 340
gaa aat gcc cag cgt tac ttc gat gcc ctg ctg aaa ttg cga cag gag 1469
Glu Asn Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu Arg Gln Glu
345 350 355 360
cgt ggg atg ggt gag gac ttc ctg agc tgg aat gac ctg cag gcc acc 1517
Arg Gly Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu Gln Ala Thr
365 370 375
gtg agc cag gtc aat gca cag acc cag gaa gag act gac cgg gtc ctt 1565
Val Ser Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp Arg Val Leu
380 385 390
gca gtc agc ctc atc aat gag gct ctg gac aaa ggc agc cct gag aag 1613
Ala Val Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser Pro Glu Lys
395 400 405
act ctg tct gcc cta ctg ctt cct gca gct ggc cta gat gat gtc agc 1661
Thr Leu Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp Asp Val Ser
410 415 420
ctc cct gtc gcc cct cgg tac cat ctc ctc ctt gtg gca gcc aaa agg 1709
Leu Pro Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala Ala Lys Arg
425 430 435 440
cag aag gcc cag gtg aca ggg gat cct gga gct gtg ctg tgg ctt gag 1757
Gln Lys Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu Trp Leu Glu
445 450 455
gag atc cgc cag gga gtg gtc aga gcc aac cag gac act aat aca gct 1805
Glu Ile Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr Asn Thr Ala
460 465 470
cag aga atg gct ctt ggt gtg gct gcc atc aat caa gcc atc aag gag 1853
Gln Arg Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala Ile Lys Glu
475 480 485
ggc aag gca gcc cag act gag cgg gtg ttg agg aac ccc gca gtg gcc 1901
Gly Lys Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro Ala Val Ala
490 495 500
ctt cga ggg gta gtt ccc gac tgt gcc aac ggc tac cag cga gcc ctg 1949
Leu Arg Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln Arg Ala Leu
505 510 515 520
gaa agt gcc atg gca aag aaa cag cgt cca gca gac aca gct ttc tgg 1997
Glu Ser Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr Ala Phe Trp
525 530 535
gtt caa cat gac atg aag gat ggc act gcc tac tac ttc cat ctg cag 2045
Val Gln His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe His Leu Gln
540 545 550
acc ttc cag ggg atc tgg gag caa cct cct ggc tgc ccc ctc aac acc 2093
Thr Phe Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro Leu Asn Thr
555 560 565
tct cac ctg acc cgg gag gag atc cag tca gct gtc acc aag gtc act 2141
Ser His Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr Lys Val Thr
570 575 580
gct gcc tat gac cgc caa cag ctc tgg aaa gcc aac gtc ggc ttt gtt 2189
Ala Ala Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val Gly Phe Val
585 590 595 600
atc cag ctc cag gcc cgc ctc cgt ggc ttc cta gtt cgg cag aag ttt 2237
Ile Gln Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg Gln Lys Phe
605 610 615
gct gag cat tcc cac ttt ctg agg acc tgg ctc cca gca gtc atc aag 2285
Ala Glu His Ser His Phe Leu Arg Thr Trp Leu Pro Ala Val Ile Lys
620 625 630
atc cag gct cat tgg cgg ggt tat agg cag cgg aag att tac ctg gag 2333
Ile Gln Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile Tyr Leu Glu
635 640 645
tgg ttg cag tat ttt aaa gca aac ctg gat gcc ata atc aag atc cag 2381
Trp Leu Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile Lys Ile Gln
650 655 660
gcc tgg gcc cgg atg tgg gca gct cgg agg caa tac ctg agg cgt ctg 2429
Ala Trp Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu Arg Arg Leu
665 670 675 680
cac tac ttc cag aag aat gtt aac tcc att gtg aag atc cag gca ttt 2477
His Tyr Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile Gln Ala Phe
685 690 695
ttc cga gcc agg aaa gcc caa gat gac tac agg ata tta gtg cat gca 2525
Phe Arg Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu Val His Ala
700 705 710
ccc cac cct cct ctc agt gtg gta cgc aga ttt gcc cat ctc ttg aat 2573
Pro His Pro Pro Leu Ser Val Val Arg Arg Phe Ala His Leu Leu Asn
715 720 725
caa agc cag caa gac ttc ttg gct gag gca gag ctg ctg aag ctc cag 2621
Gln Ser Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu Lys Leu Gln
730 735 740
gaa gag gta gtt agg aag atc cga tcc aat cag cag ctg gag cag gac 2669
Glu Glu Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu Glu Gln Asp
745 750 755 760
ctc aac atc atg gac atc aag att ggc ctg ctg gtg aag aac cgg atc 2717
Leu Asn Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys Asn Arg Ile
765 770 775
act ctg cag gaa gtg gtc tcc cac tgc aag aag ctg acc aag agg aat 2765
Thr Leu Gln Glu Val Val Ser His Cys Lys Lys Leu Thr Lys Arg Asn
780 785 790
aag gaa cag ctg tca gat atg atg gtt ctg gac aag cag aag ggt tta 2813
Lys Glu Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln Lys Gly Leu
795 800 805
aag tcg ctg agc aaa gag aaa cgg cag aaa cta gaa gca tac caa cac 2861
Lys Ser Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala Tyr Gln His
810 815 820
ctc ttc tac ctg ctc cag act cag ccc atc tac ctg gcc aag ctg atc 2909
Leu Phe Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala Lys Leu Ile
825 830 835 840
ttt cag atg cca cag aac aaa acc acc aag ttc atg gag gca gtg att 2957
Phe Gln Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu Ala Val Ile
845 850 855
ttc agc ctg tac aac tat gcc tcc agc cgc cga gag gcc tat ctc ctg 3005
Phe Ser Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala Tyr Leu Leu
860 865 870
ctc cag ctg ttc aag aca gca ctc cag gag gaa atc aag tca aag gtg 3053
Leu Gln Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys Ser Lys Val
875 880 885
gag cag ccc cag gac gtg gtg aca ggc aac cca aca gtg gtg agg ctg 3101
Glu Gln Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val Val Arg Leu
890 895 900
gtg gtg aga ttc tac cgt aat ggg cgg gga cag agt gcc ctg cag gag 3149
Val Val Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala Leu Gln Glu
905 910 915 920
att ctg ggc aag gtt atc cag gat gtg cta gaa gac aaa gtg ctc agc 3197
Ile Leu Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys Val Leu Ser
925 930 935
gtc cac aca gac cct gtc cac ctc tat aag aac tgg atc aac cag act 3245
Val His Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile Asn Gln Thr
940 945 950
gag gcc cag aca ggg cag cgc agc cat ctc cca tat gat gtc acc ccg 3293
Glu Ala Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp Val Thr Pro
955 960 965
gag cag gcc ttg agc cac ccc gag gtc cag aga cga ctg gac atc gcc 3341
Glu Gln Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu Asp Ile Ala
970 975 980
cta cgc aac ctc ctc gcc atg act gat aag ttc ctt tta gcc atc acc 3389
Leu Arg Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu Ala Ile Thr
985 990 995 1000
tca tct gtg gac caa att ccg tat ggg atg cga tat gtg gcc aaa gtc 3437
Ser Ser Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val Ala Lys Val
1005 1010 1015
ctg aag gca act ctg gca gag aaa ttc cct gac gcc aca gac agc gag 3485
Leu Lys Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr Asp Ser Glu
1020 1025 1030
gtc tat aag gtg gtc ggg aac ctc ctg tac tac cgc ttc ctg aac cca 3533
Val Tyr Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe Leu Asn Pro
1035 1040 1045
gct gtg gtg gct cct gac gcc ttc gac att gtg gcc atg gca gct ggt 3581
Ala Val Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met Ala Ala Gly
1050 1055 1060
gga gcc ctg gct gcc ccc cag cgc cat gcc ctg ggg gct gtg gct cag 3629
Gly Ala Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala Val Ala Gln
1065 1070 1075 1080
ctc cta cag cac gct gcg gct ggc aag gcc ttc tct ggg cag agc cag 3677
Leu Leu Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly Gln Ser Gln
1085 1090 1095
cac cta cgg gtc ctg aat gac tat ctg gag gaa aca cac ctc aag ttc 3725
His Leu Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His Leu Lys Phe
1100 1105 1110
agg aag ttc atc cat aga gcc tgc cag gtg cca gag cca gag gag cgt 3773
Arg Lys Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro Glu Glu Arg
1115 1120 1125
ttt gca gtg gac gag tac tca gac atg gtg gct gtg gcc aaa ccc atg 3821
Phe Ala Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala Lys Pro Met
1130 1135 1140
gtg tac atc acc gtg ggg gag ctg gtc aac acg cac agg ctg ttg ctg 3869
Val Tyr Ile Thr Val Gly Glu Leu Val Asn Thr His Arg Leu Leu Leu
1145 1150 1155 1160
gag cac cag gac tgc att gcc cct gat cac caa gac ccc ctg cat gag 3917
Glu His Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro Leu His Glu
1165 1170 1175
ctc ctg gag gat ctt ggg gag ctg ccc acc atc cct gac ctt att ggt 3965
Leu Leu Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp Leu Ile Gly
1180 1185 1190
gag agc atc gct gca gat ggg cac aca gac ctg agc aag cta gaa gtg 4013
Glu Ser Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys Leu Glu Val
1195 1200 1205
tcc ctg acg ctg acc aac aag ttt gaa gga cta gag gca gat gct gat 4061
Ser Leu Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala Asp Ala Asp
1210 1215 1220
gac tcc aac acc cgt agc ctg ctt ctg agc acc aag cag ctg ttg gcc 4109
Asp Ser Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln Leu Leu Ala
1225 1230 1235 1240
gat atc ata cag ttc cat cct ggg gac acc ctc aag gag atc ctg tcc 4157
Asp Ile Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu Ile Leu Ser
1245 1250 1255
ctc tcg gct tcc aga gag caa gaa gca gcc cac aag cag ctg atg agc 4205
Leu Ser Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln Leu Met Ser
1260 1265 1270
cga cgc cag gcc tgt aca gcc cag aca ccg gag cca ctg cga cga cac 4253
Arg Arg Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu Arg Arg His
1275 1280 1285
cgc tca ctg aca gct cac tcc ctc ctg cca ctg gca gag aag cag cgg 4301
Arg Ser Leu Thr Ala His Ser Leu Leu Pro Leu Ala Glu Lys Gln Arg
1290 1295 1300
cgc gtc ctg cgg aac ctg cgc cga ctt gaa gcc ctg ggg ttg gtc agc 4349
Arg Val Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly Leu Val Ser
1305 1310 1315 1320
gcc aga aat ggc tac cag ggg cta gtg gac gag ctg gcc aag gac atc 4397
Ala Arg Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala Lys Asp Ile
1325 1330 1335
cgc aac cag cac aga cac agg cac agg cgg aag gca gag ctg gtg aag 4445
Arg Asn Gln His Arg His Arg His Arg Arg Lys Ala G1u Leu Val Lys
1340 1345 1350
ctg cag gcc aca tta cag ggc ctg agc act aag acc acc ttc tat gag 4493
Leu Gln Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr Phe Tyr Glu
1355 1360 1365
gag cag ggt gac tac tac agc cag tac atc cgg gcc tgc ctg gac cac 4541
Glu Gln Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys Leu Asp His
1370 1375 1380
ctg gcc cec gac tcc aag agt tct ggg aag ggg aag aag cag cct tct 4589
Leu Ala Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys Gln Pro Ser
1385 1390 1395 1400
ctt cat tac act gct gct cag ctc ctg gaa aag ggt gtc ttg gtg gaa 4637
Leu His Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val Leu Val Glu
1405 1410 1415
att gaa gat ctt ccc gcc tct cac ttc aga aac gtc atc ttt gac atc 4685
Ile Glu Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile Phe Asp Ile
1420 1425 1430
acg ccg gga gat gag gca gga aag ttt gaa gta aat gcc aag ttc ctg 4733
Thr Pro Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala Lys Phe Leu
1435 1440 1445
ggt gtg gac atg gag cga ttt cag ctt cac tat cag gat ctc ctg cag 4781
Gly Val Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp Leu Leu Gln
1450 1455 1460
ctc cag tat gag ggt gtg gct gtc atg aaa ctc ttc aac aag gcc aaa 4829
Leu Gln Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn Lys Ala Lys
1465 1470 1475 1480
gtc aat gtc aac ctt ctc atc ttc ctc ctc aac aag aag ttt ttg cgg 4877
Val Asn Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys Phe Leu Arg
1485 1490 1495
aag tgacagaggc aaagggtgct acccaagccc ctcttacctc tctggatgct 4930
Lys
ttctttaaca ctaactcacc actgtgcttc cctgcagaca cccagagctc aggactgggc 4990
aaggcccagg gattctcacc ccttccccag ctgggaggag cttgcctgcc tggccacaga 5050
cagtgtatct tctaattggc taaagtgggc cttgcccaga gtccagctgt gtggctttta 5110
tcatgcatga caaacccctg gctttcctgc cagatggatt ctcatccctt acagctgact 5170
cttccaggca atttccatag atctgcagtc ctgcctctgc cacagtctct ctgttgtccc 5230
cacatctacc caacttcctg tactgttgcc cttctgatgt taataaaagc agctgttact 5290
ccc 5293
<210>2
<211>1497
<212>PRT
<213>智人(Homo sapiens)
<400>2
Met Pro Arg Val Val Tyr Cys Ile His Ala Leu Ser Leu Phe Leu Phe
1 5 10 15
Arg Leu Gly Leu Ala Pro Gln Ile His Asp Leu Tyr Gly Lys Val Lys
20 25 30
Phe Thr Ala Glu Glu Leu Ser Asn Met Ala Ser Glu Leu Ala Lys Tyr
35 40 45
Gly Leu Gin Leu Pro Ala Phe Ser Lys Ile Gly Gly Ile Leu Ala Asn
50 55 60
Glu Leu Ser Val Asp Glu Ala Ala Val His Ala Ala Val Leu Ala Ile
65 70 75 80
Asn Glu Ala Val Glu Arg Gly Val Val Glu Asp Thr Leu Ala Ala Leu
85 90 95
Gln Asn Pro Ser Ala Leu Leu Glu Asn Leu Arg Glu Pro Leu Ala Ala
100 105 110
Val Tyr Gln Glu Met Leu Ala Gln Ala Lys Met Glu Lys Ala Ala Asn
115 120 125
Ala Arg Asn His Asp Asp Arg Glu Ser Gln Asp Ile Tyr Asp His Tyr
130 135 140
Leu Thr Gln Ala Glu Ile Gln Gly Asn Ile Asn His Val Asn Val His
145 150 155 160
Gly Ala Leu Glu Val Val Asp Asp Ala Leu Glu Arg Gln Ser Pro Glu
165 170 175
Ala Leu Leu Lys Ala Leu Gln Asp Pro Ala Leu Ala Leu Arg Gly Val
180 185 190
Arg Arg Asp Phe Ala Asp Trp Tyr Leu Glu Gln Leu Asn Ser Asp Arg
195 200 205
Glu Gln Lys Ala Gln Glu Leu Gly Leu Val Glu Leu Leu Glu Lys Glu
210 215 220
Glu Val Gln Ala Gly Val Ala Ala Ala Asn Thr Lys Gly Asp Gln Glu
225 230 235 240
Gln Ala Met Leu His Ala Val Gln Arg Ile Asn Lys Ala Ile Arg Arg
245 250 255
Gly Val Ala Ala Asp Thr Val Lys Glu Leu Met Cys Pro Glu Ala Gln
260 265 270
Leu Pro Pro Val Tyr Pro Val Ala Ser Ser Met Tyr Gln Leu Glu Leu
275 280 285
Ala Val Leu Gln Gln Gln Gln Gly Glu Leu Gly Gln Glu Glu Leu Phe
290 295 300
Val Ala Val Glu Met Leu Ser Ala Val Val Leu Ile Asn Arg Ala Leu
305 310 315 320
Glu Ala Arg Asp Ala Ser Gly Phe Trp Ser Ser Leu Val Asn Pro Ala
325 330 335
Thr Gly Leu Ala Glu Val Glu Gly Glu Asn Ala Gln Arg Tyr Phe Asp
340 345 350
Ala Leu Leu Lys Leu Arg Gln Glu Arg Gly Met Gly Glu Asp Phe Leu
355 360 365
Ser Trp Asn Asp Leu Gln Ala Thr Val Ser Gln Val Asn Ala Gln Thr
370 375 380
Gln Glu Glu Thr Asp Arg Val Leu Ala Val Ser Leu Ile Asn Glu Ala
385 390 395 400
Leu Asp Lys Gly Ser Pro Glu Lys Thr Leu Ser Ala Leu Leu Leu Pro
405 410 415
Ala Ala Gly Leu Asp Asp Val Ser Leu Pro Val Ala Pro Arg Tyr His
420 425 430
Leu Leu Leu Val Ala Ala Lys Arg Gln Lys Ala Gln Val Thr Gly Asp
435 440 445
Pro Gly Ala Val Leu Trp Leu Glu Glu Ile Arg Gln Gly Val Val Arg
450 455 460
Ala Asn Gln Asp Thr Asn Thr Ala Gln Arg Met Ala Leu Gly Val Ala
465 470 475 480
Ala Ile Asn Gln Ala Ile Lys Glu Gly Lys Ala Ala Gln Thr Glu Arg
485 490 495
Val Leu Arg Asn Pro Ala Val Ala Leu Arg Gly Val Val Pro Asp Cys
500 505 510
Ala Asn Gly Tyr Gln Arg Ala Leu Glu Ser Ala Met Ala Lys Lys Gln
515 520 525
Arg Pro Ala Asp Thr Ala Phe Trp Val Gln His Asp Met Lys Asp Gly
530 535 540
Thr Ala Tyr Tyr Phe His Leu Gln Thr Phe Gln Gly Ile Trp Glu Gln
545 550 555 560
Pro Pro Gly Cys Pro Leu Asn Thr Ser His Leu Thr Arg Glu Glu Ile
565 570 575
Gln Ser Ala Val Thr Lys Val Thr Ala Ala Tyr Asp Arg Gln Gln Leu
580 585 590
Trp Lys Ala Asn Val Gly Phe Val Ile Gln Leu Gln Ala Arg Leu Arg
595 600 605
Gly Phe Leu Val Arg Gln Lys Phe Ala Glu His Ser His Phe Leu Arg
610 615 620
Thr Trp Leu Pro Ala Val Ile Lys Ile Gln Ala His Trp Arg Gly Tyr
625 630 635 640
Arg Gln Arg Lys Ile Tyr Leu Glu Trp Leu Gln Tyr Phe Lys Ala Asn
645 650 655
Leu Asp Ala Ile Ile Lys Ile Gln Ala Trp Ala Arg Met Trp Ala Ala
660 665 670
Arg Arg Gln Tyr Leu Arg Arg Leu His Tyr Phe Gln Lys Asn Val Asn
675 680 685
Ser Ile Val Lys Ile Gln Ala Phe Phe Arg Ala Arg Lys Ala Gln Asp
690 695 700
Asp Tyr Arg Ile Leu Val His Ala Pro His Pro Pro Leu Ser Val Val
705 710 715 720
Arg Arg Phe Ala His Leu Leu Asn Gln Ser Gln Gln Asp Phe Leu Ala
725 730 735
Glu Ala Glu Leu Leu Lys Leu Gln Glu Glu Val Val Arg Lys Ile Arg
740 745 750
Ser Asn Gln Gln Leu Glu Gln Asp Leu Asn Ile Met Asp Ile Lys Ile
755 760 765
Gly Leu Leu Val Lys Asn Arg Ile Thr Leu Gln Glu Val Val Ser His
770 775 780
Cys Lys Lys Leu Thr Lys Arg Asn Lys Glu Gln Leu Ser Asp Met Met
785 790 795 800
Val Leu Asp Lys Gln Lys Gly Leu Lys Ser Leu Ser Lys Glu Lys Arg
805 810 815
Gln Lys Leu Glu Ala Tyr Gln His Leu Phe Tyr Leu Leu Gln Thr Gln
820 825 830
Pro Ile Tyr Leu Ala Lys Leu Ile Phe Gln Met Pro Gln Asn Lys Thr
835 840 845
Thr Lys Phe Met Glu Ala Val Ile Phe Ser Leu Tyr Asn Tyr Ala Ser
850 855 860
Ser Arg Arg Glu Ala Tyr Leu Leu Leu Gln Leu Phe Lys Thr Ala Leu
865 870 875 880
Gln Glu Glu Ile Lys Ser Lys Val Glu Gln Pro Gln Asp Val Val Thr
885 890 895
Gly Asn Pro Thr Val Val Arg Leu Val Val Arg Phe Tyr Arg Asn Gly
900 905 910
Arg Gly Gln Ser Ala Leu Gln Glu Ile Leu Gly Lys Val Ile Gln Asp
915 920 925
Val Leu Glu Asp Lys Val Leu Ser Val His Thr Asp Pro Val His Leu
930 935 940
Tyr Lys Asn Trp Ile Asn Gln Thr Glu Ala Gln Thr Gly Gln Arg Ser
945 950 955 960
His Leu Pro Tyr Asp Val Thr Pro Glu Gln Ala Leu Ser His Pro Glu
965 970 975
Val Gln Arg Arg Leu Asp Ile Ala Leu Arg Asn Leu Leu Ala Met Thr
980 985 990
Asp Lys Phe Leu Leu Ala Ile Thr Ser Ser Val Asp Gln Ile Pro Tyr
995 1000 1005
Gly Met Arg Tyr Val Ala Lys Val Leu Lys Ala Thr Leu Ala Glu Lys
1010 1015 1020
Phe Pro Asp Ala Thr Asp Ser Glu Val Tyr Lys Val Val Gly Asn Leu
1025 1030 1035 1040
Leu Tyr Tyr Arg Phe Leu Asn Pro Ala Val Val Ala Pro Asp Ala Phe
1045 1050 1055
Asp Ile Val Ala Met Ala Ala Gly Gly Ala Leu Ala Ala Pro Gln Arg
1060 1065 1070
His Ala Leu Gly Ala Val Ala Gln Leu Leu Gln His Ala Ala Ala Gly
1075 1080 1085
Lys Ala Phe Ser Gly Gln Ser Gln His Leu Arg Val Leu Asn Asp Tyr
1090 1095 1100
Leu Glu Glu Thr His Leu Lys Phe Arg Lys Phe Ile His Arg Ala Cys
1105 1110 1115 1120
Gln Val Pro Glu Pro Glu Glu Arg Phe Ala Val Asp Glu Tyr Ser Asp
1125 1130 1135
Met Val Ala Val Ala Lys Pro Met Val Tyr Ile Thr Val Gly Glu Leu
1140 1145 1150
Val Asn Thr His Arg Leu Leu Leu Glu His Gln Asp Cys Ile Ala Pro
1155 1160 1165
Asp His Gln Asp Pro Leu His Glu Leu Leu Glu Asp Leu Gly Glu Leu
1170 1175 1180
Pro Thr Ile Pro Asp Leu Ile Gly Glu Ser Ile Ala Ala Asp Gly His
1185 1190 1195 1200
Thr Asp Leu Ser Lys Leu Glu Val Ser Leu Thr Leu Thr Asn Lys Phe
1205 1210 1215
Glu Gly Leu Glu Ala Asp Ala Asp Asp Ser Asn Thr Arg Ser Leu Leu
1220 1225 1230
Leu Ser Thr Lys Gln Leu Leu Ala Asp Ile Ile Gln Phe His Pro Gly
1235 1240 1245
Asp Thr Leu Lys Glu Ile Leu Ser Leu Ser Ala Ser Arg Glu Gln Glu
1250 1255 1260
Ala Ala His Lys Gln Leu Met Ser Arg Arg Gln Ala Cys Thr Ala Gln
1265 1270 1275 1280
Thr Pro Glu Pro Leu Arg Arg His Arg Ser Leu Thr Ala His Ser Leu
1285 1290 1295
Leu Pro Leu Ala Glu Lys Gln Arg Arg Val Leu Arg Asn Leu Arg Arg
1300 1305 1310
Leu Glu Ala Leu Gly Leu Val Ser Ala Arg Asn Gly Tyr Gln Gly Leu
1315 1320 1325
Val Asp Glu Leu Ala Lys Asp Ile Arg Asn Gln His Arg His Arg His
1330 1335 1340
Arg Arg Lys Ala Glu Leu Val Lys Leu Gln Ala Thr Leu Gln Gly Leu
1345 1350 1355 1360
Ser Thr Lys Thr Thr Phe Tyr Glu Glu Gln Gly Asp Tyr Tyr Ser Gln
1365 1370 1375
Tyr Ile Arg Ala Cys Leu Asp His Leu Ala Pro Asp Ser Lys Ser Ser
1380 1385 1390
Gly Lys Gly Lys Lys Gln Pro Ser Leu His Tyr Thr Ala Ala Gln Leu
1395 1400 1405
Leu Glu Lys Gly Val Leu Val Glu Ile Glu Asp Leu Pro Ala Ser His
1410 1415 1420
Phe Arg Asn Val Ile Phe Asp Ile Thr Pro Gly Asp Glu Ala Gly Lys
1425 1430 1435 1440
Phe Glu Val Asn Ala Lys Phe Leu Gly Val Asp Met Glu Arg Phe Gln
1445 1450 1455
Leu His Tyr Gln Asp Leu Leu Gln Leu Gln Tyr Glu Gly Val Ala Val
1460 1465 1470
Met Lys Leu Phe Asn Lys Ala Lys Val Asn Val Asn Leu Leu Ile Phe
1475 1480 1485
Leu Leu Asn Lys Lys Phe Leu Arg Lys
1490 1495
<210>3
<211>5317
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(12)..(4904)
<223>LBFL109 Clone B
<400>3
gaaggaggaa c atg gag agg aga gca gcg ggc cca ggc tgg gca 44
Met Glu Arg Arg Ala Ala Gly Pro Gly Trp Ala
1 5 10
gcc tat gaa cgc ctc aca gct gag gag atg gat gag cag agg cgg cag 92
Ala Tyr Glu Arg Leu Thr Ala Glu Glu Met Asp Glu Gln Arg Arg Gln
15 20 25
aat gtt gcc tat cag tac ctg tgc cgg ctg gag gag gcc aag cgc tgg 140
Asn Val Ala Tyr Gln Tyr Leu Cys Arg Leu Glu Glu Ala Lys Arg Trp
30 35 40
atg gag gcc tgc ctg aag gag gag ctt cct tcc ccg gtg gag ctg gag 188
Met Glu Ala Cys Leu Lys Glu Glu Leu Pro Ser Pro Val Glu Leu Glu
45 50 55
gag agc ctt cgg aat gga gtg ctg ctg gcc aag ctg ggc cac tgt ttt 236
Glu Ser Leu Arg Asn Gly Val Leu Leu Ala Lys Leu Gly His Cys Phe
60 65 70 75
gca ccc tcc gtg gtt ccg ttg aag aag atc tac gat gtg gag cag ctg 284
Ala Pro Ser Val Val Pro Leu Lys Lys Ile Tyr Asp Val Glu Gln Leu
80 85 90
cgg tac cag gca act ggc tta cat ttc cgt cac aca gac aac atc aac 332
Arg Tyr Gln Ala Thr Gly Leu His Phe Arg His Thr Asp Asn Ile Asn
95 100 105
ttt tgg cta tct gca ata gcc cac atc ggt ctg cct tcg acc ttc ttc 380
Phe Trp Leu Ser Ala Ile Ala His Ile Gly Leu Pro Ser Thr Phe Phe
110 115 120
cca gag acc acg gac atc tat gac aaa aag aac atg ccc cgg gta gtc 428
Pro Glu Thr Thr Asp Ile Tyr Asp Lys Lys Asn Met Pro Arg Val Val
125 130 135
tac tgc atc cat gct ctc agt ctc ttc ctc ttc cgg ctg gga ttg gcc 476
Tyr Cys Ile His Ala Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala
140 145 150 155
cct cag ata cat gat cta tac ggg aaa gtg aaa ttc aca gct gag gaa 524
Pro Gln Ile His Asp Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu
160 165 170
ctc agc aac atg gcg tcc gaa ctg gcc aaa tat ggc ctc cag ctg cct 572
Leu Ser Asn Met Ala Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro
175 180 185
gcc ttc agc aag atc ggg ggc atc ttg gcc aat gag ctc tcg gtg gat 620
Ala Phe Ser Lys Ile Gly Gly lle Leu Ala Asn Glu Leu Ser Val Asp
190 195 200
gag gct gca gtc cat gca gct gtt ctt gcc atc aat gaa gca gtg gag 668
Glu Ala Ala Val His Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu
205 210 215
cga ggg gtg gtg gag gac acc ctg gct gcc ttg cag aat ccc agt gct 716
Arg Gly Val Val Glu Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala
220 225 230 235
ctt ctg gag aat ctc cga gag cct ctg gca gcc gtc tac cag gag atg 764
Leu Leu Glu Asn Leu Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met
240 245 250
ctg gcc cag gcc aag atg gag aag gca gcc aat gcc agg aac cat gat 812
Leu Ala Gln Ala Lys Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp
255 260 265
gac aga gaa agc cag gac atc tat gac cac tac cta act cag gct gaa 860
Asp Arg Glu Ser Gln Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu
270 275 280
atc cag ggc aat atc aac cat gtc aac gtc cat ggg gct cta gaa gtt 908
Ile Gln Gly Asn Ile Asn His Val Asn Val His Gly Ala Leu Glu Val
285 290 295
gtt gat gat gcc ctg gaa aga cag agc cct gaa gcc ttg ctc aag gcc 956
Val Asp Asp Ala Leu Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala
300 305 310 315
ctt caa gac cct gcc ctg gcc ctg cga ggg gtg agg aga gac ttt gct 1004
Leu Gln Asp Pro Ala Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala
320 325 330
gac tgg tac ctg gag cag ctg aac tca gac aga gag cag aag gca cag 1052
Asp Trp Tyr Leu Glu Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln
335 340 345
gag ctg ggc ctg gtg gag ctt ctg gaa aag gag gaa gtc cag gct ggt 1100
Glu Leu Gly Leu Val Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly
350 355 360
gtg gct gca gcc aac aca aag ggt gat cag gaa caa gcc atg ctc cac 1148
Val Ala Ala Ala Asn Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His
365 370 375
gct gtg cag cgg atc aac aaa gcc atc cgg agg gga gtg gcg gct gac 1196
Ala Val Gln Arg Ile Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp
380 385 390 395
act gtg aag gag ctg atg tgc cct gag gcc cag ctg cct cca gtg tac 1244
Thr Val Lys Glu Leu Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr
400 405 410
cct gtt gca tcg tct atg tac cag ctg gag ctg gca gtg ctc cag cag 1292
Pro Val Ala Ser Ser Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln
415 420 425
cag cag ggg gag ctt ggc cag gag gag ctc ttc gtg gct gtg gag atg 1340
Gln Gln Gly Glu Leu Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met
430 435 440
ctc tca gct gtg gtc ctg att aac cgg gcc ctg gag gcc cgg gat gcc 1388
Leu Ser Ala Val Val Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala
445 450 455
agt ggc ttc tgg agc agc ctg gtg aac cct gcc aca ggc ctg gct gag 1436
Ser Gly Phe Trp Ser Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu
460 465 470 475
gtg gaa gga gaa aat gcc cag cgt tac ttc gat gcc ctg ctg aaa ttg 1484
Val Glu Gly Glu Asn Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu
480 485 490
cga cag gag cgt ggg atg ggt gag gac ttc ctg agc tgg aat gac ctg 1532
Arg Gln Glu Arg Gly Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu
495 500 505
cag gcc acc gtg agc cag gtc aat gca cag acc cag gaa gag act gac 1580
Gln Ala Thr Val Ser Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp
510 515 520
cgg gtc ctt gca gtc agc ctc atc aat gag gct ctg gac aaa ggc agc 1628
Arg Val Leu Ala Val Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser
525 530 535
cct gag aag act ctg tct gcc cta ctg ctt cct gca gct ggc cta gat 1676
Pro Glu Lys Thr Leu Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp
540 545 550 555
gat gtc agc ctc cct gtc gcc cct cgg tac cat ctc ctc ctt gtg gca 1724
Asp Val Ser Leu Pro Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala
560 565 570
gcc aaa agg cag aag gcc cag gtg aca ggg gat cct gga gct gtg ctg 1772
Ala Lys Arg Gln Lys Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu
575 580 585
tgg ctt gag gag atc cgc cag gga gtg gtc aga gcc aac cag gac act 1820
Trp Leu Glu Glu Ile Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr
590 595 600
aat aca gct cag aga atg gct ctt ggt gtg gct gcc atc aat caa gcc 1868
Asn Thr Ala Gln Arg Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala
605 610 615
atc aag gag ggc aag gca gcc cag act gag cgg gtg ttg agg aac ccc 1916
Ile Lys Glu Gly Lys Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro
620 625 630 635
gca gtg gcc ctt cga ggg gta gtt ccc gac tgt gcc aac ggc tac cag 1964
Ala Val Ala Leu Arg Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln
640 645 650
cga gcc ctg gaa agt gcc atg gca aag aaa cag cgt cca gca gac aca 2012
Arg Ala Leu Glu Ser Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr
655 660 665
gct ttc tgg gtt caa cat gac atg aag gat ggc act gcc tac tac ttc 2060
Ala Phe Trp Val Gln His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe
670 675 680
cat ctg cag acc ttc cag ggg atc tgg gag caa cct cct ggc tgc ccc 2108
His Leu Gln Thr Phe Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro
685 690 695
ctc aac acc tct cac ctg acc cgg gag gag atc cag tca gct gtc acc 2156
Leu Asn Thr Ser His Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr
700 705 710 715
aag gtc act gct gcc tat gac cgc caa cag ctc tgg aaa gcc aac gtc 2204
Lys Val Thr Ala Ala Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val
720 725 730
ggc ttt gtt atc cag ctc cag gcc cgc ctc cgt ggc ttc cta gtt cgg 2252
Gly Phe Val Ile Gln Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg
735 740 745
cag aag ttt gct gag cat tcc cac ttt ctg agg acc tgg ctc cca gca 2300
Gln Lys Phe Ala Glu His Ser His Phe Leu Arg Thr Trp Leu Pro Ala
750 755 760
gtc atc aag atc cag gct cat tgg cgg ggt tat agg cag cgg aag att 2348
Val Ile Lys Ile Gln Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile
765 770 775
tac ctg gag tgg ttg cag tat ttt aaa gca aac ctg gat gcc ata atc 2396
Tyr Leu Glu Trp Leu Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile
780 785 790 795
aag atc cag gcc tgg gcc cgg atg tgg gca gct cgg agg caa tac ctg 2444
Lys Ile Gln Ala Trp Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu
800 805 810
agg cgt ctg cac tac ttc cag aag aat gtt aac tcc att gtg aag atc 2492
Arg Arg Leu His Tyr Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile
815 820 825
cag gca ttt ttc cga gcc agg aaa gcc caa gat gac tac agg ata tta 2540
Gln Ala Phe Phe Arg Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu
830 835 840
gtg cat gca ccc cac cct cct ctc agt gtg gta cgc aga ttt gcc cat 2588
Val His Ala Pro His Pro Pro Leu Ser Val Val Arg Arg Phe Ala His
845 850 855
ctc ttg aat caa agc cag caa gac ttc ttg gct gag gca gag ctg ctg 2636
Leu Leu Asn Gln Ser Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu
860 865 870 875
aag ctc cag gaa gag gta gtt agg aag atc cga tcc aat cag cag ctg 2684
Lys Leu Gln Glu Glu Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu
880 885 890
gag cag gac ctc aac atc atg gac atc aag att ggc ctg ctg gtg aag 2732
Glu Gln Asp Leu Asn Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys
895 900 905
aac cgg atc act ctg cag gaa gtg gtc tcc cac tgc aag aag ctg acc 2780
Asn Arg Ile Thr Leu Gln Glu Val Val Ser His Cys Lys Lys Leu Thr
910 915 920
aag agg aat aag gaa cag ctg tca gat atg atg gtt ctg gac aag cag 2828
Lys Arg Asn Lys Glu Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln
925 930 935
aag ggt tta aag tcg ctg agc aaa gag aaa cgg cag aaa cta gaa gca 2876
Lys Gly Leu Lys Ser Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala
940 945 950 955
tac caa cac ctc ttc tac ctg ctc cag act cag ccc atc tac ctg gcc 2924
Tyr Gln His Leu Phe Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala
960 965 970
aag ctg atc ttt cag atg cca cag aac aaa acc acc aag ttc atg gag 2972
Lys Leu Ile Phe Gln Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu
975 980 985
gca gtg att ttc agc ctg tac aac tat gcc tcc agc cgc cga gag gcc 3020
Ala Val Ile Phe Ser Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala
990 995 1000
tat ctc ctg ctc cag ctg ttc aag aca gca ctc cag gag gaa atc aag 3068
Tyr Leu Leu Leu Gln Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys
1005 1010 1015
tca aag gtg gag cag ccc cag gac gtg gtg aca ggc aac cca aca gtg 3116
Ser Lys Val Glu Gln Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val
1020 1025 1030 1035
gtg agg ctg gtg gtg aga ttc tac cgt aat ggg cgg gga cag agt gcc 3164
Val Arg Leu Val Val Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala
1040 1045 1050
ctg cag gag att ctg ggc aag gtt atc cag gat gtg cta gaa gac aaa 3212
Leu Gln Glu Ile Leu Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys
1055 1060 1065
gtg ctc agc gtc cac aca gac cct gtc cac ctc tat aag aac tgg atc 3260
Val Leu Ser Val His Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile
1070 1075 1080
aac cag act gag gcc cag aca ggg cag cgc agc cat ctc cca tat gat 3308
Asn Gln Thr Glu Ala Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp
1085 1090 1095
gtc acc ccg gag cag gcc ttg agc cac ccc gag gtc cag aga cga ctg 3356
Val Thr Pro Glu Gln Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu
1100 1105 1110 1115
gac atc gcc cta cgc aac ctc ctc gcc atg act gat aag ttc ctt tta 3404
Asp Ile Ala Leu Arg Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu
1120 1125 1130
gcc atc acc tca tct gtg gac caa att ccg tat ggg atg cga tat gtg 3452
Ala Ile Thr Ser Ser Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val
1135 1140 1145
gcc aaa gtc ctg aag gca act ctg gca gag aaa ttc cct gac gcc aca 3500
Ala Lys Val Leu Lys Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr
1150 1155 1160
gac agc gag gtc tat aag gtg gtc ggg aac ctc ctg tac tac cgc ttc 3548
Asp Ser Glu Val Tyr Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe
1165 1170 1175
ctg aac cca gct gtg gtg gct cct gac gcc ttc gac att gtg gcc atg 3596
Leu Asn Pro Ala Val Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met
1180 1185 1190 1195
gca gct ggt gga gcc ctg gct gcc ccc cag cgc cat gcc ctg ggg gct 3644
Ala Ala Gly Gly Ala Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala
1200 1205 1210
gtg gct cag ctc cta cag cac gct gcg gct ggc aag gcc ttc tct ggg 3692
Val Ala Gln Leu Leu Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly
1215 1220 1225
cag agc cag cac cta cgg gtc ctg aat gac tat ctg gag gaa aca cac 3740
Gln Ser Gln His Leu Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His
1230 1235 1240
ctc aag ttc agg aag ttc atc cat aga gcc tgc cag gtg cca gag cca 3788
Leu Lys Phe Arg Lys Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro
1245 1250 1255
gag gag cgt ttt gca gtg gac gag tac tca gac atg gtg gct gtg gcc 3836
Glu Glu Arg Phe Ala Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala
1260 1265 1270 1275
aaa ccc atg gtg tac atc acc gtg ggg gag ctg gtc aac acg cac agg 3884
Lys Pro Met Val Tyr Ile Thr Val Gly Glu Leu Val Asn Thr His Arg
1280 1285 1290
ctg ttg ctg gag cac cag gac tgc att gcc cct gat cac caa gac ccc 3932
Leu Leu Leu Glu His Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro
1295 1300 1305
ctg cat gag ctc ctg gag gat ctt ggg gag ctg ccc acc atc cct gac 3980
Leu His Glu Leu Leu Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp
1310 1315 1320
ctt att ggt gag agc atc gct gca gat ggg cac aca gac ctg agc aag 4028
Leu Ile Gly Glu Ser Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys
1325 1330 1335
cta gaa gtg tcc ctg acg ctg acc aac aag ttt gaa gga cta gag gca 4076
Leu Glu Val Ser Leu Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala
1340 1345 1350 1355
gat gct gat gac tcc aac acc cgt agc ctg ctt ctg agc acc aag cag 4124
Asp Ala Asp Asp Ser Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln
1360 1365 1370
ctg ttg gcc gat atc ata cag ttc cat cct ggg gac acc ctc aag gag 4172
Leu Leu Ala Asp Ile Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu
1375 1380 1385
atc ctg tcc ctc tcg gct tcc aga gag caa gaa gca gcc cac aag cag 4220
Ile Leu Ser Leu Ser Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln
1390 1395 1400
ctg atg agc cga cgc cag gcc tgt aca gcc cag aca ccg gag cca ctg 4268
Leu Met Ser Arg Arg Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu
1405 1410 1415
cga cga cac cgc tca ctg aca gct cac tcc ctc ctg cca ctg gca gag 4316
Arg Arg His Arg Ser Leu Thr Ala His Ser Leu Leu Pro Leu A1a Glu
1420 1425 1430 1435
aag cag cgg cgc gtc ctg cgg aac ctg cgc cga ctt gaa gcc ctg ggg 4364
Lys Gln Arg Arg Val Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly
1440 1445 1450
ttg gtc agc gcc aga aat ggc tac cag ggg cta gtg gac gag ctg gcc 4412
Leu Val Ser Ala Arg Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala
1455 1460 1465
aag gac atc cgc aac cag cac aga cac agg cac agg cgg aag gca gag 4460
Lys Asp Ile Arg Asn Gln His Arg His Arg His Arg Arg Lys Ala Glu
1470 1475 1480
ctg gtg aag ctg cag gcc aca tta cag ggc ctg agc act aag acc acc 4508
Leu Val Lys Leu Gln Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr
1485 1490 1495
ttc tat gag gag cag ggt gac tac tac agc cag tac atc cgg gcc tgc 4556
Phe Tyr Glu Glu Gln Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys
1500 1505 1510 1515
ctg gac cac ctg gcc ccc gac tcc aag agt tct ggg aag ggg aag aag 4604
Leu Asp His Leu Ala Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys
1520 1525 1530
cag cct tct ctt cat tac act gct gct cag ctc ctg gaa aag ggt gtc 4652
Gln Pro Ser Leu His Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val
1535 1540 1545
ttg gtg gaa att gaa gat ctt ccc gcc tct cac ttc aga aac gtc atc 4700
Leu Val Glu Ile Glu Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile
1550 1555 1560
ttt gac atc acg ccg gga gat gag gca gga aag ttt gaa gta aat gcc 4748
Phe Asp Ile Thr Pro Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala
1565 1570 1575
aag ttc ctg ggt gtg gac atg gag cga ttt cag ctt cac tat cag gat 4796
Lys Phe Leu Gly Val Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp
1580 1585 1590 1595
crc ctg cag ctc cag tat gag ggt gtg gct gtc atg aaa crc ttc aac 4844
Leu Leu Gln Leu Gln Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn
1600 1605 1610
aag gcc aaa gtc aat gtc aac ctt ctc arc ttc crc ctc aac aag aag 4892
Lys Ala Lys Val Asn Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys
1615 1620 1625
ttt ttg cgg aag tgacag aggcaaaggg tgctacccaa gcccctctta 4940
Phe Leu Arg Lys
1630
cctctctgga tgctttcttt aacactaact caccactgtg cttccctgca gacacccaga 5000
gctcaggact gggcaaggcc cagggattct caccccttcc ccagctggga ggagcttgcc 5060
tgcctggcca cagacagtgt atcttctaat tggctaaagt gggccttgcc cagagtccag 5120
ctgtgtggct tttatcatgc atgacaaacc cctggctttc ctgccagatg gattctcatc 5180
ccttacagct gactcttcca ggcaatttcc atagatctgc agtcctgcct ctgccacagt 5240
ctctctgttg tccccacatc tacccaactt cctgtactgt tgcccttctg atgttaataa 5300
aagcagctgt tactccc 5317
<210>4
<211>1631
<212>PRT
<213>智人(Homo sapiens)
<400>4
Met Glu Arg Arg Ala Ala Gly Pro Gly Trp Ala Ala Tyr Glu Arg Leu
1 5 10 15
Thr Ala Glu Glu Met Asp Glu Gln Arg Arg Gln Ash Val Ala Tyr Gln
20 25 30
Tyr Leu Cys Arg Leu Glu Glu Ala Lys Arg Trp Met Glu Ala Cys Leu
35 40 45
Lys Glu Glu Leu Pro Ser Pro Val Glu Leu Glu Glu Ser Leu Arg Asn
50 55 60
Gly Val Leu Leu Ala Lys Leu Gly His Cys Phe Ala Pro Ser Val Val
65 70 75 80
Pro Leu Lys Lys Ile Tyr Asp Val Glu Gln Leu Arg Tyr Gln Ala Thr
85 90 95
Gly Leu His Phe Arg His Thr Asp Asn Ile Asn Phe Trp Leu Ser Ala
100 105 110
Ile Ala His Ile Gly Leu Pro Ser Thr Phe Phe Pro Glu Thr Thr Asp
115 120 125
Ile Tyr Asp Lys Lys Asn Met Pro Arg Val Val Tyr Cys Ile His Ala
130 135 140
Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala Pro Gln Ile His Asp
145 150 155 160
Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu Leu Ser Asn Met Ala
165 170 175
Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro Ala Phe Ser Lys Ile
180 185 190
Gly Gly Ile Leu Ala Asn Glu Leu Ser Val Asp Glu Ala Ala Val His
195 200 205
Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu Arg Gly Val Val Glu
210 215 220
Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala Leu Leu Glu Asn Leu
225 230 235 240
Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met Leu Ala Gln Ala Lys
245 250 255
Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp Asp Arg Glu Ser Gln
260 265 270
Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu Ile Gln Gly Asn Ile
275 280 285
Asn His Val Asn Val His Gly Ala Leu Glu Val Val Asp Asp Ala Leu
290 295 300
Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala Leu Gln Asp Pro Ala
305 310 315 320
Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala Asp Trp Tyr Leu Glu
325 330 335
Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln Glu Leu Gly Leu Val
340 345 350
Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly Val Ala Ala Ala Asn
355 360 365
Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His Ala Val Gln Arg Ile
370 375 380
Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp Thr Val Lys Glu Leu
385 390 395 400
Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr Pro Val Ala Ser Ser
405 410 415
Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln Gln Gln Gly Glu Leu
420 425 430
Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met Leu Ser Ala Val Val
435 440 445
Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala Ser Gly Phe Trp Ser
450 455 460
Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu Val Glu Gly Glu Asn
465 470 475 480
Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu Arg Gln Glu Arg Gly
485 490 495
Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu Gln Ala Thr Val Ser
500 505 510
Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp Arg Val Leu Ala Val
515 520 525
Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser Pro Glu Lys Thr Leu
530 535 540
Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp Asp Val Ser Leu Pro
545 550 555 560
Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala Ala Lys Arg Gln Lys
565 570 575
Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu Trp Leu Glu Glu Ile
580 585 590
Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr Asn Thr Ala Gln Arg
595 600 605
Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala Ile Lys Glu Gly Lys
610 615 620
Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro Ala Val Ala Leu Arg
625 630 635 640
Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln Arg Ala Leu Glu Ser
645 650 655
Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr Ala Phe Trp Val Gln
660 665 670
His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe His Leu Gln Thr Phe
675 680 685
Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro Leu Asn Thr Ser His
690 695 700
Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr Lys Val Thr Ala Ala
705 710 715 720
Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val Gly Phe Val Ile Gln
725 730 735
Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg Gln Lys Phe Ala Glu
740 745 750
His Ser His Phe Leu Arg Thr Trp Leu Pro Ala Val Ile Lys Ile Gln
755 760 765
Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile Tyr Leu Glu Trp Leu
770 775 780
Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile Lys Ile Gln Ala Trp
785 790 795 800
Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu Arg Arg Leu His Tyr
805 810 815
Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile Gln Ala Phe Phe Arg
820 825 830
Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu Val His Ala Pro His
835 840 845
Pro Pro Leu Ser Val Val Arg Arg Phe Ala His Leu Leu Asn Gln Ser
850 855 860
Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu Lys Leu Gln Glu Glu
865 870 875 880
Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu Glu Gln Asp Leu Asn
885 890 895
Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys Asn Arg Ile Thr Leu
900 905 910
Gln Glu Val Val Ser His Cys Lys Lys Leu Thr Lys Arg Asn Lys Glu
915 920 925
Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln Lys Gly Leu Lys Ser
930 935 940
Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala Tyr Gln His Leu Phe
945 950 955 960
Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala Lys Leu Ile Phe Gln
965 970 975
Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu Ala Val Ile Phe Ser
980 985 990
Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala Tyr Leu Leu Leu Gln
995 1000 1005
Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys Ser Lys Val Glu Gln
1010 1015 1020
Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val Val Arg Leu Val Val
1025 1030 1035 1040
Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala Leu Gln Glu Ile Leu
1045 1050 1055
Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys Val Leu Ser Val His
1060 1065 1070
Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile Asn Gln Thr Glu Ala
1075 1080 1085
Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp Val Thr Pro Glu Gln
1090 1095 1100
Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu Asp Ile Ala Leu Arg
l105 1110 1115 1120
Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu Ala Ile Thr Ser Ser
1125 1130 1135
Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val Ala Lys Val Leu Lys
1140 1145 1150
Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr Asp Ser Glu Val Tyr
1155 1160 1165
Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe Leu Asn Pro Ala Val
1170 1175 1180
Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met Ala Ala Gly Gly Ala
1185 1190 1195 1200
Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala Val Ala Gln Leu Leu
1205 1210 1215
Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly Gln Ser Gln His Leu
1220 1225 1230
Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His Leu Lys Phe Arg Lys
1235 1240 1245
Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro Glu Glu Arg Phe Ala
1250 1255 1260
Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala Lys Pro Met Val Tyr
1265 1270 1275 1280
Ile Thr Val Gly Glu Leu Val Asn Thr His Arg Leu Leu Leu Glu His
1285 1290 1295
Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro Leu His Glu Leu Leu
1300 1305 1310
Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp Leu Ile Gly Glu Ser
1315 1320 1325
Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys Leu Glu Val Ser Leu
1330 1335 1340
Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala Asp Ala Asp Asp Ser
1345 1350 1355 1360
Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln Leu Leu Ala Asp Ile
1365 1370 1375
Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu Ile Leu Ser Leu Ser
1380 1385 1390
Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln Leu Met Ser Arg Arg
1395 1400 1405
Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu Arg Arg His Arg Ser
1410 1415 1420
Leu Thr Ala His Ser Leu Leu Pro Leu Ala Glu Lys Gln Arg Arg Val
1425 1430 1435 1440
Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly Leu Val Ser Ala Arg
1445 1450 1455
Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala Lys Asp Ile Arg Asn
1460 1465 1470
Gln His Arg His Arg His Arg Arg Lys Ala Glu Leu Val Lys Leu Gln
1475 1480 1485
Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr Phe Tyr Glu Glu Gln
1490 1495 1500
Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys Leu Asp His Leu Ala
1505 1510 1515 1520
Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys Gln Pro Ser Leu His
1525 1530 1535
Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val Leu Val Glu Ile Glu
1540 1545 1550
Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile Phe Asp Ile Thr Pro
1555 1560 1565
Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala Lys Phe Leu Gly Val
1570 1575 1580
Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp Leu Leu Gln Leu Gln
1585 1590 1595 1600
Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn Lys Ala Lys Val Asn
1605 1610 1615
Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys Phe Leu Arg Lys
1620 1625 1630
<210>5
<211>3608
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(424)..(1908)
<223>Clone LBFL110
<400>5
ggcggcgaga gcagctgcag ctcgcatctc aggcagtacc tagaggagct gccggtgcct 60
cctcagaaca tctcctgatc gctacccagg accaggcacc aaggacaggg agtcccaggc 120
gcacaccccc cattctgggt cccccaggcc cagaccccca ctctgccaca ggttgcatct 180
tgacctggtc ctcctgcaga agtggcccct gtggtcctgc tctgagactc gtccctgggc 240
gcccctgcag cccctttcta tgactccatc tggatttggc tggctgtggg gacgcggtcc 300
gaggggcggc ctggctctca gcgtggtggc agccagctct ctggccacca tggcaaatgc 360
tgagatctga ggggacaagg ctctacagcc tcagccaggg gcactcagct gttgcagggt 420
gtg atg gag aac aaa gct atg tac cta cac acc gtc agc gac tgt 465
Met Glu Asn Lys Ala Met Tyr Leu His Thr Val Ser Asp Cys
1 5 10
gac acc agc tcc atc tgt gag gat tcc ttt gat ggc agg agc ctg tcc 513
Asp Thr Ser Ser Ile Cys Glu Asp Ser Phe Asp Gly Arg Ser Leu Ser
15 20 25 30
aag ctg aac ctg tgt gag gat ggt cca tgt cac aaa cgg cgg gca agc 561
Lys Leu Asn Leu Cys Glu Asp Gly Pro Cys His Lys Arg Arg Ala Ser
35 40 45
atc tgc tgt acc cag ctg ggg tcc ctg tcg gcc ctg aag cat gct gtc 609
Ile Cys Cys Thr Gln Leu Gly Ser Leu Ser Ala Leu Lys His Ala Val
50 55 60
ctg ggg ctc tac ctg ctg gtc ttc ctg att ctt gtg ggc atc ttc atc 657
Leu Gly Leu Tyr Leu Leu Val Phe Leu Ile Leu Val Gly Ile Phe Ile
65 70 75
tta gca gtg tcc agg ccg cgc agc tcc cct gac gac ctg aag gcc ctg 705
Leu Ala yal Ser Arg Pro Arg Ser Ser Pro Asp Asp Leu Lys Ala Leu
80 85 90
act cgc aat gtg aac cgg ctg aat gag agc ttc cgg gac ttg cag ctg 753
Thr Arg Asn Val Asn Arg Leu Asn Glu Ser Phe Arg Asp Leu Gln Leu
95 100 105 110
cgg ctg ctg cag gct ccg ctg caa gcg gac ctg acg gag cag gtg tgg 801
Arg Leu Leu Gln Ala Pro Leu Gln Ala Asp Leu Thr Glu Gln Val Trp
115 120 125
aag gtg cag gac gcg ctg cag aac cag tca gac tcg ttg ctg gcg ctg 849
Lys Val Gln Asp Ala Leu Gln Asn Gln Ser Asp Ser Leu Leu Ala Leu
130 135 140
gcg ggc gca gtg cag cgg ctg gag ggc gcg ctg tgg ggg ctg cag gcg 897
Ala Gly Ala Val Gln Arg Leu Glu Gly Ala Leu Trp Gly Leu Gln Ala
145 150 155
cag gcg gtg cag acc gag cag gcg gtg gcc ctg ctg cgg gac cgc acg 945
Gln Ala Val Gln Thr Glu Gln Ala Val Ala Leu Leu Arg Asp Arg Thr
160 165 170
ggc cag cag agc gac acg gcg cag ctg gag ctc tac cag ctg cag gtg 993
Gly Gln Gln Ser Asp Thr Ala Gln Leu Glu Leu Tyr Gln Leu Gln Val
175 180 185 190
gag agc aac agt agc cag ctg ctg ctg agg cgc cac gcg ggc ctg ctg 1041
Glu Ser Asn Ser Ser Gln Leu Leu Leu Arg Arg His Ala Gly Leu Leu
195 200 205
gac ggg ctg gcg cgc agg gtg ggc atc ctg ggc gag gag ctg gcc gac 1089
Asp Gly Leu Ala Arg Arg Val Gly Ile Leu Gly Glu Glu Leu Ala Asp
210 215 220
gtg ggc ggc gtg ctg cgc ggc ctc aac cac agc ctg tcc tac gac gtg 1137
Val Gly Gly Val Leu Arg Gly Leu Asn His Ser Leu Ser Tyr Asp Val
225 230 235
gcc ctc cac cgc acg cgg ctg cag gac ctg cgg gtg ctg gtg agc aac 1185
Ala Leu His Arg Thr Arg Leu Gln Asp Leu Arg Val Leu Val Ser Asn
240 245 250
gcc agc gag gac acg cgc cgc ctg cgc ctg gcg cac gta ggc atg gag 1233
Ala Ser Glu Asp Thr Arg Arg Leu Arg Leu Ala His Val Gly Met Glu
255 260 265 270
ctg cag ctg aag cag gag ctg gcc atg ctc aac gcg gtc acc gag gac 1281
Leu Gln Leu Lys Gln Glu Leu Ala Met Leu Asn Ala Val Thr Glu Asp
275 280 285
ctg cgc ctc aag gac tgg gag cac tcc atc gca ctg cgg aac atc tcc 1329
Leu Arg Leu Lys Asp Trp Glu His Ser Ile Ala Leu Arg Asn Ile Ser
290 295 300
ctc gcg aaa ggg cca ccg gga ccc aaa ggt gat cag ggg cat gaa gga 1377
Leu Ala Lys Gly Pro Pro Gly Pro Lys Gly Asp Gln Gly His Glu Gly
305 310 315
aag gaa ggc agg cct ggc atc cct gga ttg cct gga ctt cga ggt ctg 1425
Lys Glu Gly Arg Pro Gly Ile Pro Gly Leu Pro Gly Leu Arg Gly Leu
320 325 330
ccc ggg gag aga ggt acc cca gga ttg ccc ggg ccc aag ggc gat gat 1473
Pro Gly Glu Arg Gly Thr Pro Gly Leu Pro Gly Pro Lys Gly Asp Asp
335 340 345 350
ggg aag ctg ggg gcc aca gga cca atg ggc atg cgt ggg ttc aaa ggt 1521
Gly Lys Leu Gly Ala Thr Gly Pro Met Gly Met Arg Gly Phe Lys Gly
355 360 365
gac cga ggc cca aaa gga gag aaa gga gag aaa gga gac aga gct ggg 1569
Asp Arg Gly Pro Lys Gly Glu Lys Gly Glu Lys Gly Asp Arg Ala Gly
370 375 380
gat gcc agt ggc gtg gag gcc ccg atg atg atc cgc ctg gtg aat ggc 1617
Asp Ala Ser Gly Val Glu Ala Pro Met Met Ile Arg Leu Val Asn Gly
385 390 395
tca ggt ccg cac gag ggc cgc gtg gaa gtg tac cac gac cgg cgt tgg 1665
Ser Gly Pro His Glu Gly Arg Val G1u Val Tyr His Asp Arg Arg Trp
400 405 410
ggc acc gtg tgt gac gac ggc tgg gac aag aag gac gga gac gtg gtg 1713
Gly Thr Val Cys Asp Asp Gly Trp Asp Lys Lys Asp Gly Asp Val Val
415 420 425 430
tgc cgc atg ctc ggc ttc cgc ggt gtg gag gag gtg tac cgc aca gct 1761
Cys Arg Met Leu Gly Phe Arg Gly Val Glu Glu Val Tyr Arg Thr Ala
435 440 445
cga ttc ggg caa ggc act ggg agg atc tgg atg gat gac gtt gcc tgc 1809
Arg Phe Gly Gln Gly Thr Gly Arg Ile Trp Met Asp Asp Val Ala Cys
450 455 460
aag ggc aca gag gaa acc atc ttc cgc tgc agc ttc tcc aaa tgg ggg 1857
Lys Gly Thr Glu Glu Thr Ile Phe Arg Cys Ser Phe Ser Lys Trp Gly
465 470 475
gtg aca aac tgt gga cat gcc gaa gat gcc agc gtg aca tgc aac aga 1905
Val Thr Asn Cys Gly His Ala Glu Asp Ala Ser Val Thr Cys Asn Arg
480 485 490
cac tg aaagtgggca gagcccaagt tcggggtcct gcacagagca cccttcctgc 1960
His
495
atccctgggg tggggcacag ctcggggcca ccctgaccat gcctcgacca caccccgtcc 2020
agcattctca gtcctcacac ctgcatccca ggaccgtggg ggccggtcgt catttccctc 2080
ttgaacatgt gctccgaagt ataactctgg gacctactgc ccgtctctct cttccaccag 2140
gttcctgcat gaggagccct gatcaactgg atcaccactt tgcccagcct ctgaacacca 2200
tgcaccaggc ctcaatatcc cagttccctt tggcctttta gttacaggtg aatgctgaga 2260
atgtgtcaga gacaagtgca gcagcagcga tggttggtag tatagatcat ttactcttca 2320
gacaattccc aaacctccat tagtccaaga gtttctacat cttcctcccc agcaagaggc 2380
aacgtcaagt gatgaatttc ccccctttac tctgcctctg ctccccattt gctagtttga 2440
ggaagtgaca tagaggagaa gccagctgta ggggcaagag ggaaatgcaa gtcacctgca 2500
ggaatccagc tagatttgga gaagggaatg aaactaacat tgaatgacta ccatggcacg 2560
ctaaatagta tcttgggtgc caaattcatg tatccactta gctgcattgg tccagggcat 2620
gtcagtctgg atacagcctt acctccaggt agcacttaac tggtccattc acctagactg 2680
caagtaagaa gacaaaatga ctgagaccgt gtgcccacct gaacttattg tctttacttg 2740
gcctgagcta aaagcttggg tgcaggacct gtgtaactag aaagttgcct acttcagaac 2800
ctccagggcg tgagtgcaag gtcaaacatg actggcttcc aggccgacca tcaatgtagg 2860
aggagagctg atgtggaggg tgacatgggg gctgcccatg ttaaacctga gtccagtgct 2920
ctggcattgg gcagtcacgg ttaaagccaa gtcatgtgtg tctcagctgt ttggaggtga 2980
tgattttgca tcttccaagc ctcttcaggt gtgaatctgt ggtcaggaaa acacaagtcc 3040
taatggaacc cttagggggg aaggaaatga agattcccta taacctctgg gggtggggag 3100
taggaataag gggcttgggc ctccataaat ctgcaatctg caccctcctc ctagagacag 3160
ggagatcgtg ttctgctttt tacatgagga gcagaactgg gccatacaca tgttcaagaa 3220
ctaggggagc tacctggtag caagtgagtg cagacccacc tcaccttggg ggaatctcaa 3280
actcataggc ctcagataca cgatcacctg tcatatcagg tgagcactgg cctgcttggg 3340
gagagacctg ggcccctcca ggtgtaggaa cagcaacact cctggctgac aactaagcca 3400
atatggccct aggtcattct tgcttccaat atgcttgcca ctccttaaat gtcctaatga 3460
tgagaaactc tctttctgac caattgctat gtttacataa cacgcatgta ctcatgcatc 3520
ccttgccaga gcccatatat gtatgcatat ataaacatag cactttttac tacatagctc 3580
agcacattgc aaggtttgca tttaagtt 3608
<210>6
<211>495
<212>PRT
<213>智人(Homo sapiens)
<400>6
Met Glu Asn Lys Ala Met Tyr Leu His Thr Val Ser Asp Cys Asp Thr
1 5 10 15
Ser Ser Ile Cys Glu Asp Ser Phe Asp Gly Arg Ser Leu Ser Lys Leu
20 25 30
Asn Leu Cys Glu Asp Gly Pro Cys His Lys Arg Arg Ala Ser Ile Cys
35 40 45
Cys Thr Gln Leu Gly Ser Leu Ser Ala Leu Lys His Ala Val Leu Gly
50 55 60
Leu Tyr Leu Leu Val Phe Leu Ile Leu Val Gly Ile Phe Ile Leu Ala
65 70 75 80
Val Ser Arg Pro Arg Ser Ser Pro Asp Asp Leu Lys Ala Leu Thr Arg
85 90 95
Asn Val Asn Arg Leu Asn Glu Ser Phe Arg Asp Leu Gln Leu Arg Leu
100 105 110
Leu Gln Ala Pro Leu Gln Ala Asp Leu Thr Glu Gln Val Trp Lys Val
115 120 125
Gln Asp Ala Leu Gln Asn Gln Ser Asp Ser Leu Leu Ala Leu Ala Gly
130 135 140
Ala Val Gln Arg Leu Glu Gly Ala Leu Trp Gly Leu Gln Ala Gln Ala
145 150 155 160
Val Gln Thr Glu Gln Ala Val Ala Leu Leu Arg Asp Arg Thr Gly Gln
165 170 175
Gln Ser Asp Thr Ala Gln Leu Glu Leu Tyr Gln Leu Gln Val Glu Ser
180 185 190
Asn Ser Ser Gln Leu Leu Leu Arg Arg His Ala Gly Leu Leu Asp Gly
195 200 205
Leu Ala Arg Arg Val Gly Ile Leu Gly Glu Glu Leu Ala Asp Val Gly
210 215 220
Gly Val Leu Arg Gly Leu Asn His Ser Leu Ser Tyr Asp Val Ala Leu
225 230 235 240
His Arg Thr Arg Leu Gln Asp Leu Arg Val Leu Val Ser Asn Ala Ser
245 250 255
Glu Asp Thr Arg Arg Leu Arg Leu Ala His Val Gly Met Glu Leu Gln
260 265 270
Leu Lys Gln Glu Leu Ala Met Leu Asn Ala Val Thr Glu Asp Leu Arg
275 280 285
Leu Lys Asp Trp Glu His Ser Ile Ala Leu Arg Asn Ile Ser Leu Ala
290 295 300
Lys Gly Pro Pro Gly Pro Lys Gly Asp Gln Gly His Glu Gly Lys Glu
305 310 315 320
Gly Arg Pro Gly Ile Pro Gly Leu Pro Gly Leu Arg Gly Leu Pro Gly
325 330 335
Glu Arg Gly Thr Pro Gly Leu Pro Gly Pro Lys Gly Asp Asp Gly Lys
340 345 350
Leu Gly Ala Thr Gly Pro Met Gly Met Arg Gly Phe Lys Gly Asp Arg
355 360 365
Gly Pro Lys Gly Glu Lys Gly Glu Lys Gly Asp Arg Ala Gly Asp Ala
370 375 380
Ser Gly Val Glu Ala Pro Met Met Ile Arg Leu Val Asn Gly Ser Gly
385 390 395 400
Pro His Glu Gly Arg Val Glu Val Tyr His Asp Arg Arg Trp Gly Thr
405 410 415
Val Cys Asp Asp Gly Trp Asp Lys Lys Asp Gly Asp Val Val Cys Arg
420 425 430
Met Leu Gly Phe Arg Gly Val Glu Glu Val Tyr Arg Thr Ala Arg Phe
435 440 445
Gly Gln Gly Thr Gly Arg Ile Trp Met Asp Asp Val Ala Cys Lys Gly
450 455 460
Thr Glu Glu Thr Ile Phe Arg Cys Ser Phe Ser Lys Trp Gly Val Thr
465 470 475 480
Asn Cys Gly His Ala Glu Asp Ala Ser Val Thr Cys Asn Arg His
485 490 495
<210>7
<211>3162
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(405)..(1835)
<223>Clone LBFLl23
<400>7
tggccggggt gccccgcaaa gagagacaag ggagaaaaag acagcaggga aaaccccggg 60
gaggagaagg cgaaagagaa ggtggagctc agagaagggg gccggctccc cagctccatg 120
tggccgccgc cgctgcgggt ctgtgggggc agagggcggc ggctcccagg gcagcgcgta 180
gcgggaccga ttgcctaata ctccggcagg ggccggggcc gcagctggct cggataaata 240
gccgcccggc tggcccggag ctgcagggga gagcggcggc cgcgatcccc accacaccac 300
cagcccggcc gcacggggca ctgagccggg tgctgagcac cggaggcccc gccgaggccg 360
ggactcagga cctgcagaga aacgcctcct gattttgtct taca atg gaa ctt 413
Met Glu Leu
1
aaa aag tcg cct gac ggt gga tgg ggc tgg gtg att gtg ttt gtc tcc 461
Lys Lys Ser Pro Asp Gly Gly Trp Gly Trp Val Ile Val Phe Val Ser
5 10 15
ttc ctt act cag ttt ttg tgt tac gga tcc cca cta gct gtt gga gtc 509
Phe Leu Thr Gln Phe Leu Cys Tyr Gly Ser Pro Leu Ala Val Gly Val
20 25 30 35
ctg tac ata gaa tgg ctg gat gcc ttt ggt gaa gga aaa gga aaa aca 557
Leu Tyr Ile Glu Trp Leu Asp Ala Phe Gly Glu Gly Lys Gly Lys Thr
40 45 50
gcc tgg gtt gga tcc ctg gca agt gga gtt ggc ttg ctt gca agt cct 605
Ala Trp Val Gly Ser Leu Ala Ser Gly Val Gly Leu Leu Ala Ser Pro
55 60 65
gtc tgc agt ctc tgt gtc rca tct ttt gga gca aga cct gtc aca arc 653
Val Cys Ser Leu Cys Val Ser Ser Phe Gly Ala Arg Pro Val Thr Ile
70 75 80
ttc agt ggc ttc atg gtg gct gga ggc ctg atg ttg agc agt ttt gct 701
Phe Ser Gly Phe Met Val Ala Gly Gly Leu Met Leu Ser Ser Phe Ala
85 90 95
ccc aat atc tac ttt ctg ttt ttt tcc tat ggc att gtt gta ggt tca 749
Pro Asn Ile Tyr Phe Leu Phe Phe Ser Tyr Gly Ile Val Val Gly Ser
100 105 110 115
agc gtt ggc ctt ttc ata tat gct gct ctg cag agg atg ctg gtt gag 797
Ser Val Gly Leu Phe Ile Tyr Ala Ala Leu Gln Arg Met Leu Val Glu
120 125 130
ttc tat gga ctg gat gga tgc ttg ctg att gtg ggt gct tta gct tta 845
Phe Tyr Gly Leu Asp Gly Cys Leu Leu Ile Val Gly Ala Leu Ala Leu
135 140 145
aat ata tta gcc tgt ggc agt ctg atg aga ccc ctc caa tct tct gat 893
Asn Ile Leu Ala Cys Gly Ser Leu Met Arg Pro Leu Gln Ser Ser Asp
150 155 160
tgt cct ttg cct aaa aaa ata gct cca gaa gat cta cca gat aaa tac 941
Cys Pro Leu Pro Lys Lys Ile Ala Pro Glu Asp Leu Pro Asp Lys Tyr
165 170 175
tcc att tac aat gaa aaa gga aag aat ctg gaa gaa aac ata aac att 989
Ser Ile Tyr Asn Glu Lys Gly Lys Asn Leu Glu Glu Asn Ile Asn Ile
180 185 190 195
ctt gac aag agc tac agt agt gag gaa aaa tgc agg atc acg tta gcc 1037
Leu Asp Lys Ser Tyr Ser Ser Glu Glu Lys Cys Arg Ile Thr Leu Ala
200 205 210
aat ggt gac tgg aaa caa gac agc cta ctt cat aaa aac ccc aca gtg 1085
Asn Gly Asp Trp Lys Gln Asp Ser Leu Leu His Lys Asn Pro Thr Val
215 220 225
aca cac aca aaa gag cct gaa acg tac aaa aag aaa gtt gca gaa cag 1133
Thr His Thr Lys Glu Pro Glu Thr Tyr Lys Lys Lys Val Ala Glu Gln
230 235 240
aca tat ttt tgc aaa cag ctt gcc aag agg aag tgg cag tta tat aaa 1181
Thr Tyr Phe Cys Lys Gln Leu Ala Lys Arg Lys Trp Gln Leu Tyr Lys
245 250 255
aac tac tgt ggt gaa act gtg gct ctt ttt aaa aac aaa gta ttt tca 1229
Asn Tyr Cys Gly Glu Thr Val Ala Leu Phe Lys Asn Lys Val Phe Ser
260 265 270 275
gcc ctt ttc att gct atc tta ctc ttt gac atc gga ggg ttt cca cct 1277
Ala Leu Phe Ile Ala Ile Leu Leu Phe Asp Ile Gly Gly Phe Pro Pro
280 285 290
tca tta ctt atg gaa gat gta gca aga agt tca aac gtg aaa gaa gaa 1325
Ser Leu Leu Met Glu Asp Val Ala Arg Ser Ser Asn Val Lys Glu Glu
295 300 305
gag ttt att atg cca ctt att tcc att ata ggc att atg aca gca gtt 1373
Glu Phe Ile Met Pro Leu Ile Ser Ile Ile Gly Ile Met Thr Ala Val
310 315 320
ggt aaa ctg ctt tta ggg ata ctg gct gac ttc aag tgg att aat acc 1421
Gly Lys Leu Leu Leu Gly Ile Leu Ala Asp Phe Lys Trp Ile Asn Thr
325 330 335
ttg tat ctt tat gtt gct acc tta atc atc atg ggc cta gcc ttg tgt 1469
Leu Tyr Leu Tyr Val Ala Thr Leu Ile Ile Met Gly Leu Ala Leu Cys
340 345 350 355
gca att cca ttt gcc aaa agc tat gtc aca ttg gcg ttg ctt tct ggg 1517
Ala Ile Pro Phe Ala Lys Ser Tyr Val Thr Leu Ala Leu Leu Ser Gly
360 365 370
atc cta ggg ttt ctt act ggt aat tgg tcc atc ttt cca tat gtg acc 1565
Ile Leu Gly Phe Leu Thr Gly Asn Trp Ser Ile Phe Pro Tyr Val Thr
375 380 385
acg aag act gtg gga att gaa aaa tta gcc cat gcc tat ggg ata tta 1613
Thr Lys Thr Val Gly Ile Glu Lys Leu Ala His Ala Tyr Gly Ile Leu
390 395 400
atg ttc ttt gct gga ctt gga aat agc cta gga cca ccc atc gtt ggt 1661
Met Phe Phe Ala Gly Leu Gly Asn Ser Leu Gly Pro Pro Ile Val Gly
405 410 415
tgg ttt tat gac tgg acc cag acc tat gat att gca ttt tat ttt agt 1709
Trp Phe Tyr Asp Trp Thr Gln Thr Tyr Asp Ile Ala Phe Tyr Phe Ser
420 425 430 435
ggc ttc tgc gtc ctg ctg gga ggt ttt att ctg ctg ctg gca gcc ttg 1757
Gly Phe Cys Val Leu Leu Gly Gly Phe Ile Leu Leu Leu Ala Ala Leu
440 445 450
ccc tct tgg gat aca tgc aac aag caa ctc ccc aag cca gct cca aca 1805
Pro Ser Trp Asp Thr Cys Asn Lys Gln Leu Pro Lys Pro Ala Pro Thr
455 460 465
act ttc ttg tac aaa gtt gcc tct aat gtt tagaa gaatattgga 1850
Thr Phe Leu Tyr Lys Val Ala Ser Asn Val
470 475
agacactatt tttgctattt tataccatat agcaacgata ttttaacaga tctcaagcaa 1910
attttctaga gtcaagacta ttttctcata gcaaaatttc acaatgactg actctgaatg 1970
aattattttt ttttttttat atatcctatt ttttatgtag tgtatgcgta gcctctatct 2030
cgtatttttt tctatttctc ctccccacac catcaatggg actattctgt tttgctgtta 2090
ttcactagtt cttaacattg taaaaagttt gaccagcctc agaaggcttt ctctgtgtaa 2150
agaagtataa tttctctgct gactccattt aatccactgc aaggcaccta gagagactgc 2210
tcctatttta aaagtgatgc aagcatcatg ataagatatg tgtgaagccc actaggaaat 2270
aaatcattct cttctctatg tttgacttgc tagtaaacag aagacttcaa gccagccagg 2330
aaattaaagt ggcgactaaa acagccttaa gaattgcagt ggagcaaatt ggtcattttt 2390
taaaaaaata tattttaacc tacagtcacc agttttcatt attctattta cctcactgaa 2450
gtactcgcat gttgtttggt acccactgag caactgtttc agttcctaag gtatttgctg 2510
agatgtgggt gaactccaaa tggagaagta gtcactgtag actttcttca tggttgacca 2570
ctccaacctt gctcactttt gcttcttggc catccactca gctgatgttt cctgggaagt 2630
gctaatttta cctgtttcca aattggaaac acatttctca atcattccgt tctggcaaat 2690
gggaaacatc catttgcttt gggcacagtg gggatgggct gcaagttctt gcatatcctc 2750
ccagtgaagc atttatttgc tactatcaga ttttaccact atcaaatata attcaagggc 2810
agaattaaac gtgagtgtgt gtgtgtgtgt gtgtgtgtgt gctatgcatg ctctaagtct 2870
gcatgggata tgggaatgga aaagggcaat aagaaattaa tacccttatg cagttgcatt 2930
taaccttaag aaaaatgtcc ttgggataaa ctccaatgtt taatacattg attttttttc 2990
taaagaaatg ggttttaaac tttggtatgc atcagaattc cctatagatc tttttgaaaa 3050
tataggtacc tgggtatcac acatagaact tttaattctg ctggtgtagg ctgttgccca 3110
aacatctata attttactga gctcttcaag tgattctgat aacacagcct gg 3162
<210>8
<211>477
<212>PRT
<213>智人(Homo sapiens)
<400>8
Met Glu Leu Lys Lys Ser Pro Asp Gly Gly Trp Gly Trp Val Ile Val
1 5 10 15
Phe Val Ser Phe Leu Thr Gln Phe Leu Cys Tyr Gly Ser Pro Leu Ala
20 25 30
Val Gly Val Leu Tyr Ile Glu Trp Leu Asp Ala Phe Gly Glu Gly Lys
35 40 45
Gly Lys Thr Ala Trp Val Gly Ser Leu Ala Ser Gly Val Gly Leu Leu
50 55 60
Ala Ser Pro Val Cys Ser Leu Cys Val Ser Ser Phe Gly Ala Arg Pro
65 70 75 80
Val Thr Ile Phe Ser Gly Phe Met Val Ala Gly Gly Leu Met Leu Ser
85 90 95
Ser Phe Ala Pro Asn Ile Tyr Phe Leu Phe Phe Ser Tyr Gly Ile Val
100 105 110
Val Gly Ser Ser Val Gly Leu Phe Ile Tyr Ala Ala Leu Gln Arg Met
115 120 125
Leu Val Glu Phe Tyr Gly Leu Asp Gly Cys Leu Leu Ile Val Gly Ala
130 135 140
Leu Ala Leu Asn Ile Leu Ala Cys Gly Ser Leu Met Arg Pro Leu Gln
145 150 155 160
Ser Ser Asp Cys Pro Leu Pro Lys Lys Ile Ala Pro Glu Asp Leu Pro
165 170 175
Asp Lys Tyr Ser Ile Tyr Asn Glu Lys Gly Lys Asn Leu Glu Glu Asn
180 185 190
Ile Asn Ile Leu Asp Lys Ser Tyr Ser Ser Glu Glu Lys Cys Arg Ile
195 200 205
Thr Leu Ala Asn Gly Asp Trp Lys Gln Asp Ser Leu Leu His Lys Asn
210 215 220
Pro Thr Val Thr His Thr Lys Glu Pro Glu Thr Tyr Lys Lys Lys Val
225 230 235 240
Ala Glu Gln Thr Tyr Phe Cys Lys Gln Leu Ala Lys Arg Lys Trp Gln
245 250 255
Leu Tyr Lys Asn Tyr Cys Gly Glu Thr Val Ala Leu Phe Lys Asn Lys
260 265 270
Val Phe Ser Ala Leu Phe Ile Ala Ile Leu Leu Phe Asp Ile Gly Gly
275 280 285
Phe Pro Pro Ser Leu Leu Met Glu Asp Val Ala Arg Ser Ser Asn Val
290 295 300
Lys Glu Glu Glu Phe Ile Met Pro Leu Ile Ser Ile Ile Gly Ile Met
305 310 315 320
Thr Ala Val Gly Lys Leu Leu Leu Gly Ile Leu Ala Asp Phe Lys Trp
325 330 335
Ile Asn Thr Leu Tyr Leu Tyr Val Ala Thr Leu Ile Ile Met Gly Leu
340 345 350
Ala Leu Cys Ala Ile Pro Phe Ala Lys Ser Tyr Val Thr Leu A1a Leu
355 360 365
Leu Ser Gly Ile Leu Gly Phe Leu Thr Gly Asn Trp Ser Ile Phe Pro
370 375 380
Tyr Val Thr Thr Lys Thr Val Gly Ile Glu Lys Leu Ala His Ala Tyr
385 390 395 400
Gly Ile Leu Met Phe Phe Ala Gly Leu Gly Asn Ser Leu Gly Pro Pro
405 410 415
Ile Val Gly Trp Phe Tyr Asp Trp Thr Gln Thr Tyr Asp Ile Ala Phe
420 425 430
Tyr Phe Ser Gly Phe Cys Val Leu Leu Gly 61y Phe Ile Leu Leu Leu
435 440 445
Ala Ala Leu Pro Ser Trp Asp Thr Cys Asn Lys Gln Leu Pro Lys Pro
450 455 460
Ala Pro Thr Thr Phe Leu Tyr Lys Val Ala Ser Asn Val
465 470 475
<210>9
<211>4891
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(89)..(1150)
<223>Clone LBFLl31
<400>9
acgcctggtt cccgggaaga ctcgccagca ccagggggtg ggggagtgcg agctgaaagc 60
tgctggagag tgagcagccc tagcaggg atg gac atg atg ctg ttg gtg cag 112
Met Asp Met Met Leu Leu Val Gln
1 5
ggt gct tgt tgc tcg aac cag tgg ctg gcg gcg gtg ctc ctc agc ctg 160
Gly Ala Cys Cys Ser Asn Gln Trp Leu Ala Ala Val Leu Leu Ser Leu
10 15 20
tgc tgc ctg cta ccc tcc tgc ctc ccg gct gga cag agt gtg gac ttc 208
Cys Cys Leu Leu Pro Ser Cys Leu Pro Ala Gly Gln Ser Val Asp Phe
25 30 35 40
ccc tgg gcg gcc gtg gac aac atg atg gtc aga aaa ggg gac acg gcg 256
Pro Trp Ala Ala Val Asp Asn Met Met Val Arg Lys Gly Asp Thr Ala
45 50 55
gtg ctt agg tgt tat ttg gaa gat gga gct tca aag ggt gcc tgg ctg 304
Val Leu Arg Cys Tyr Leu Glu Asp Gly Ala Ser Lys Gly Ala Trp Leu
60 65 70
aac cgg tca agt att att ttt gcg gga ggt gat aag tgg tca gtg gat 352
Asn Arg Ser Ser Ile Ile Phe Ala Gly Gly Asp Lys Trp Ser Val Asp
75 80 85
cct cga gtt tca att tca aca ttg aat aaa agg gac tac agc ctc cag 400
Pro Arg Val Ser Ile Ser Thr Leu Asn Lys Arg Asp Tyr Ser Leu Gln
90 95 100
ata cag aat gta gat gtg aca gat gat ggc cca tac acg tgt tct gtt 448
Ile Gln Asn Val Asp Val Thr Asp Asp Gly Pro Tyr Thr Cys Ser Val
105 110 115 120
cag act caa cat aca ccc aga aca atg cag gtg cat cta act gtg caa 496
Gln Thr Gln His Thr Pro Arg Thr Met Gln Val His Leu Thr Val Gln
125 130 135
gtt cct cct aag ata tat gac atc tca aat gat atg acc gtc aat gaa 544
Val Pro Pro Lys Ile Tyr Asp Ile Ser Asn Asp Met Thr Val Asn Glu
140 145 150
gga acc aac gtc act ctt act tgt ttg gcc act ggg aaa cca gag cct 592
Gly Thr Asn Val Thr Leu Thr Cys Leu Ala Thr Gly Lys Pro Glu Pro
155 160 165
tcc att tct tgg cga cac atc tcc cca tca gcg aaa cca ttt gaa aat 640
Ser Ile Ser Trp Arg His Ile Ser Pro Ser Ala Lys Pro Phe Glu Asn
170 175 180
gga caa tat ttg gac att tat gga att aca agg gac cag gct ggg gaa 688
Gly Gln Tyr Leu Asp Ile Tyr Gly Ile Thr Arg Asp Gln Ala Gly Glu
185 190 195 200
tat gaa tgc agt gcg gaa aat gat gtg tca ttc cca gat gtg agg aaa 736
Tyr Glu Cys Ser Ala Glu Asn Asp Val Ser Phe Pro Asp Val Arg Lys
205 210 215
gta aaa gtt gtt gtc aac ttt gct cct act att cag gaa att aaa tct 784
Val Lys Val Val Val Asn Phe Ala Pro Thr Ile Gln Glu Ile Lys Ser
220 225 230
ggc acc gtg acc ccc gga cgc agt ggc ctg ata aga tgt gaa ggt gca 832
Gly Thr Val Thr Pro Gly Arg Ser Gly Leu Ile Arg Cys Glu Gly Ala
235 240 245
ggt gtg ccg cct cca gcc ttt gaa tgg tac aaa gga gag aag aag ctc 880
Gly Val Pro Pro Pro Ala Phe Glu Trp Tyr Lys Gly Glu Lys Lys Leu
250 255 260
ttc aat ggc caa caa gga att att att caa aat ttt agc aca aga tcc 928
Phe Asn Gly Gln Gln Gly Ile Ile Ile Gln Asn Phe Ser Thr Arg Ser
265 270 275 280
att ctc act gtt acc aac gtg aca cag gag cac ttc ggc aat tat act 976
Ile Leu Thr Val Thr Asn Val Thr Gln Glu His Phe Gly Asn Tyr Thr
285 290 295
tgt gtg gct gcc aac aag cta ggc aca acc aat gcg agc ctg cct ctt 1024
Cys Val Ala Ala Asn Lys Leu Gly Thr Thr Asn Ala Ser Leu Pro Leu
300 305 310
aac cct cca agt aca gcc cag tat gga att acc ggg agc gct gat gtt 1072
Asn Pro Pro Ser Thr Ala Gln Tyr Gly Ile Thr Gly Ser Ala Asp Val
315 320 325
ctt ttc tcc tgc tgg tac ctt gtg ttg aca ctg tcc tct ttc acc agc 1120
Leu Phe Ser Cys Trp Tyr Leu Val Leu Thr Leu Ser Ser Phe Thr Ser
330 335 340
ata ttc tac ctg aag aat gcc att cta caa taaattcaaa gacccataaa 1170
Ile Phe Tyr Leu Lys Asn Ala Ile Leu Gln
345 350
aggcttttaa ggattctctg aaagtgctga tggctggatc caatctggta cagtttgtta 1230
aaagcagcgt gggatataat cagcagtgct tacatgggga tgatcgcctt ctgtagaatt 1290
gctcattatg taaatacttt aattctactc ttttttgatt agctacatta ccttgtgaag 1350
cagtacacat tgtccttttt ttaagacgtg aaagctctga aattactttt agaggatatt 1410
aattgtgatt tcatgtttgt aatctacaac ttttcaaaag cattcagtca tggtctgcta 1470
ggttgcaggc tgtagtttac aaaaacgaat attgcagtga atatgtgatt ctttaaggct 1530
gcaatacaag cattcagttc cctgtttcaa taagagtcaa tccacattta caaagatgca 1590
tttttttctt ttttgataaa aaagcaaata atattgcctt cagattattt cttcaaaata 1650
taacacatat ctagattttt ctgctcgcat gatattcagg tttcaggaat gagccttgta 1710
atataactgg ctgtgcagct ctgcttctct ttcctgtaag ttcagcatgg gtgtgccttc 1770
atacaataat atttttctct ttgtctccaa ctaatataaa atgttttgct aaatcttaca 1830
atttgaaagt aaaaataaac cagagtgatc aagttaaacc atacactatc tctaagtaac 1890
gaaggagcta ttggactgta aaaatctctt cctgcactga caatggggtt tgagaatttt 1950
gccccacact aactcagttc ttgtgatgag agacaattta ataacagtat agtaaatata 2010
ccatatgatt tctttagttg tagctaaatg ttagatccac cgtgggaaat tattcccttt 2070
aaaatgacag cacagtccac tcaaaggatt gcctagcaat acagcatctt ttcctttcac 2130
tagtccaagc caaaaatttt aagatgattt gtcagaaagg gcacaaagtc ctatcaccta 2190
atattacaag agttggtaag cgctcatcat taattttatt ttgtggcagc taagttagta 2250
tgacagaggc agtgctcctg tggacaggag cattttgcat attttccatc tgaaagtatc 2310
actcagttga tagtctggaa tgcatgttat atattttaaa acttccaaaa tatattataa 2370
caaacattct atatcggtat gtagcagacc aatctctaaa atagctaatt cttcaataaa 2430
atctttctat atagccattt cagtgcaaac aagtaaaatc aaaaaagacc atcctttatt 2490
tttccttaca tgatatatgt aagatgcgat caaataaaga caaaacacca gtgatgagaa 2550
tatcttaaga taagtaatta tcaaattatt gtgaatgtta aattatttct actataaaga 2610
agcaaaacta catttttgaa ggaaaatgct gttactctaa cattaattta caggaatagt 2670
ttgatggttt cactctttac taaagaaagg ccatcacctt gaaagccatt ttacaggttt 2730
gatgaagtta ccaatttcag tacacctaaa tttctacaaa tagtcccctt ttacaagttg 2790
taacaacaaa gaccctataa taaaattaga tacaagaaat tttgcagtgg ttatacatat 2850
ttgagatatc tagtatgttg ccctagcagg gatggcttaa aaactgtgat tttttttctt 2910
caagtaaaac ttagtcccaa agtacatcat aaatcaattt taactagaaa aatgaatctt 2970
aaatgagggg acataagtat actctttcca caaaatggca ataataaggc ataaagctag 3030
taaatctact aactgtaata aatgtatgac attattttga ttgatacatt aaaaaagagt 3090
ttttagaaca aatatggcat ttaactttat tatttatttg cttttaagaa atattctttg 3150
tggaattgtt gaataaacta taaaatatta ttttgtattg cagctttaaa gtggcacact 3210
ccataataat ctacctacta gaaatagtgg tgctaccaca aaaaatgtta accatcagta 3270
ccattgtttg ggagaaagaa acaggtcaag aatgcatatt attcagtgac cgctttccta 3330
gagttaaaat acctcctctt tgtaaggttt gtaggtaaat tgaggtataa actatggatg 3390
aaccaaataa ttagttcaaa gtgttgtcat gattccaaat ttgtggagtc tggtgttttt 3450
accatagaat gtgacagaag tacagtcata gctcagtagc tatatgtatt tgcctttatg 3510
ttagaagaga ctttcttgag tgacattttt aaatagagga ggtattcact atgtttttct 3570
gtatcacagc agcattccta gtccttaggc cctcggacag agtgaaatca tgagtattta 3630
tgagttcaat attgtcaaat aaggctacag tatttgcttt tttgtgtgaa tgtattgcat 3690
ataatgttca agtagatgat tttacattta tggacatata aaacgtctga ttaccccatt 3750
ttatcagtcc tgactgtaca agattgttgc aatttcagaa tagcagtttt ataaattgat 3810
ttatctttta atctataaca atttgtgtta gctgttcatt tcaggattat attttctaca 3870
agttccactt gtgggactcc ttttgttgcc cctatttttt tttaaagaag gaagaaagaa 3930
aaatgagtag cagtttaaaa atgagaatgg agagaaaaga aaaagaatga aaaggaaagg 3990
cagtaaagag ggaaaaaaaa ggaaggatgg aaggaatgaa ggaaggaagg gaggaagggg 4050
agaaggtagg aagaaagaaa ggatgagagg gaaggaagaa tcagagtatt agggtagtta 4110
acttacacat ttgcattctt agttatactg caagtggtgt aactatgttt ttcaatgatc 4170
gcatttgaaa cataagtcct attataccat taagttccta ttatgcagca attatataat 4230
aaaaagtact gcccaagtta tagtaatgtg ggtgtttttg agacactaaa agatttgaga 4290
gggagaattt caaacttaaa gccacttttg gggggtttat aacttaactg aaaaattaat 4350
gcttcatcat aacatttaag ctatatctag aaagtagact ggagaactga gaaaattacc 4410
caggtaattc agggaaaaaa aaaaaatata tatatatata aataccccta catttgaagt 4470
cagaaaactc tgaaaaactg aattatcaaa gtcaatcatc tataatgatc aaatttactg 4530
aacaattgtt aatttatcca ttgtgcttag ctttgtgaca cagccaaaag ttacctattt 4590
aatcttttca ataaaaattg ttttttgaaa tccagaaatg atttaaaaag aggtcaggtt 4650
tttaactatt tattgaagta tgtggatgtc cagtatttca atagatatga atatgaataa 4710
atggtatgcc ttaagattct ttgaatatgt atttacttta aagactggaa aaagctcttc 4770
ctgtctttta gtaaacatcc atatttcata acctgatgta aaatatgttg tactgtttcc 4830
aataggggaa tataaactca gtttatcaat taaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4890
a 4891
<210>10
<211>354
<212>PRT
<213>智人(Homo sapiens)
<400>10
Met Asp Met Met Leu Leu Val Gln Gly Ala Cys Cys Ser Asn Gln Trp
1 5 10 15
Leu Ala Ala Val Leu Leu Ser Leu Cys Cys Leu Leu Pro Ser Cys Leu
20 25 30
Pro Ala Gly Gln Ser Val Asp Phe Pro Trp Ala Ala Val Asp Asn Met
35 40 45
Met Val Arg Lys Gly Asp Thr Ala Val Leu Arg Cys Tyr Leu Glu Asp
50 55 60
Gly Ala Ser Lys Gly Ala Trp Leu Asn Arg Ser Ser Ile Ile Phe Ala
65 70 75 80
Gly Gly Asp Lys Trp Ser Val Asp Pro Arg Val Ser Ile Ser Thr Leu
85 90 95
Asn Lys Arg Asp Tyr Ser Leu Gln Ile Gln Asn Val Asp Val Thr Asp
100 105 110
Asp Gly Pro Tyr Thr Cys Ser Val Gln Thr Gln His Thr Pro Arg Thr
115 120 125
Met Gln Val His Leu Thr Val Gln Val Pro Pro Lys Ile Tyr Asp Ile
130 135 140
Ser Asn Asp Met Thr Val Asn Glu Gly Thr Asn Val Thr Leu Thr Cys
145 150 155 160
Leu Ala Thr Gly Lys Pro Glu Pro Ser Ile Ser Trp Arg His Ile Ser
165 170 175
Pro Ser Ala Lys Pro Phe Glu Asn Gly Gln Tyr Leu Asp Ile Tyr Gly
180 185 190
Ile Thr Arg Asp Gln Ala Gly Glu Tyr Glu Cys Ser Ala Glu Asn Asp
195 200 205
Val Ser Phe Pro Asp Val Arg Lys Val Lys Val Val Val Asn Phe Ala
210 215 220
Pro Thr Ile Gln Glu Ile Lys Ser Gly Thr Val Thr Pro Gly Arg Ser
225 230 235 240
Gly Leu Ile Arg Cys Glu Gly Ala Gly Val Pro Pro Pro Ala Phe Glu
245 250 255
Trp Tyr Lys Gly Glu Lys Lys Leu Phe Asn Gly Gln Gln Gly Ile Ile
260 265 270
Ile Gln Asn Phe Ser Thr Arg Ser Ile Leu Thr Val Thr Asn Val Thr
275 280 285
Gln Glu His Phe Gly Asn Tyr Thr Cys Val Ala Ala Asn Lys Leu Gly
290 295 300
Thr Thr Asn Ala Ser Leu Pro Leu Asn Pro Pro Ser Thr Ala Gln Tyr
305 310 315 320
Gly Ile Thr Gly Ser Ala Asp Val Leu Phe Ser Cys Trp Tyr Leu Val
325 330 335
Leu Thr Leu Ser Ser Phe Thr Ser Ile Phe Tyr Leu Lys Asn Ala Ile
340 345 350
Leu Gln
<210>11
<211>3098
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(223)..(1569)
<223>LBFL164
<400>11
gtttatcgcg cacatctcgc ggcgaggagg agaggccgga agggcgcccc agccccaagg 60
ctcctgcccc gcctgggcct ccggctttcg tttccccgca acgcttcgct ttcgtttccc 120
gctggcgcct ggctccctcc gggtttcgtt tcccgccggc gcctggctcc cgccaggttt 180
cgtttccgag gcggggccga gggcggcgtc gctgaggcgc cc atg gcc ttc 231
Met Ala Phe
1
gcc cgc cgg ctc ctg cgc ggg cca ctg tcg ggg ccg ctg ctc ggg cgg 279
Ala Arg Arg Leu Leu Arg Gly Pro Leu Ser Gly Pro Leu Leu Gly Arg
5 10 15
cgc ggg gtc tgc gct ggg gcc atg gct ccg ccg cgc cgc ttc gtc ctg 327
Arg Gly Val Cys Ala Gly Ala Met Ala Pro Pro Arg Arg Phe Val Leu
20 25 30 35
gag ctt ccc gac tgc acc ctg gct cac ttc gcc cta ggc gcc gac gcc 375
Glu Leu Pro Asp Cys Thr Leu Ala His Phe Ala Leu Gly Ala Asp Ala
40 45 50
ccc ggc gac gca gac gcc ccc gac ccc cgc ctg gcg gcg ctg ctg ggg 423
Pro Gly Asp Ala Asp Ala Pro Asp Pro Arg Leu Ala Ala Leu Leu Gly
55 60 65
ccc ccg gag cgc agc tac tcg ctg tgc gtg ccc gtg acc ccg gac gcc 471
Pro Pro Glu Arg Ser Tyr Ser Leu Cys Val Pro Val Thr Pro Asp Ala
70 75 80
ggc tgc ggg gcc cgg gtc cgg gcg gcg cgg ctg cac cag cgc ctg ctg 519
Gly Cys Gly Ala Arg Val Arg Ala Ala Arg Leu His Gln Arg Leu Leu
85 90 95
cac cag ctg cgc cgc ggc ccc ttc cag cgg tgc cag ctg ctc agg ctg 567
His Gln Leu Arg Arg Gly Pro Phe Gln Arg Cys Gln Leu Leu Arg Leu
100 105 110 115
ctc tgc tac tgc ccg ggc ggc cag gcc ggc ggc gca cag caa ggc ttc 615
Leu Cys Tyr Cys Pro Gly Gly Gln Ala Gly Gly Ala Gln Gln Gly Phe
120 125 130
ctg ctg cgc gac ccc ctg gat gac cct gac acc cgg caa gcg ctg ctc 663
Leu Leu Arg Asp Pro Leu Asp Asp Pro Asp Thr Arg Gln Ala Leu Leu
135 140 145
gag ctg ctg ggc gcc tgc cag gag gca cca cgc ccg cac ttg ggc gag 711
Glu Leu Leu Gly Ala Cys Gln Glu Ala Pro Arg Pro His Leu Gly Glu
150 155 160
ttc gag gcc gac ccg cgc ggc cag ctg tgg cag cgc ctc tgg gag gtg 759
Phe Glu Ala Asp Pro Arg Gly Gln Leu Trp Gln Arg Leu Trp Glu Val
165 170 175
caa gac ggc agg cgg ctg cag gtg ggc tgc gca cag gtc gtg ccc gtc 807
Gln Asp Gly Arg Arg Leu Gln Val Gly Cys Ala Gln Val Val Pro Val
180 185 190 195
ccg gag ccc ccg ctg cac ccg gtg gtg cca gac ttg ccc agt tcc gtg 855
Pro Glu Pro Pro Leu His Pro Val Val Pro Asp Leu Pro Ser Ser Val
200 205 210
gtc ttc ccg gac cgg gaa gcc gcc cgg gcc gtt ttg gag gag tgt acc 903
Val Phe Pro Asp Arg Glu Ala Ala Arg Ala Val Leu Glu Glu Cys Thr
215 220 225
tcc ttt att cct gaa gcc cgg gca gtg ctt gac ctg gtc gac cag tgc 951
Ser Phe Ile Pro Glu Ala Arg Ala Val Leu Asp Leu Val Asp Gln Cys
230 235 240
cca aaa cag atc cag aaa gga aag ttc cag gtt gtt gcc atc gaa gga 999
Pro Lys Gln Ile Gln Lys Gly Lys Phe Gln Val Val Ala Ile Glu Gly
245 250 255
ctg gat gcc acg ggt aaa acc acg gtg acc cag tca gtg gca gat tca 1047
Leu Asp Ala Thr Gly Lys Thr Thr Val Thr Gln Ser Val Ala Asp Ser
260 265 270 275
ctt aag gct gtc ctc tta aag tca cca ccc tct tgc att ggc cag tgg 1095
Leu Lys Ala Val Leu Leu Lys Ser Pro Pro Ser Cys Ile Gly Gln Trp
280 285 290
agg aag atc ttt gat gat gaa cca act atc att aga aga gct ttt tac 1143
Arg Lys Ile Phe Asp Asp Glu Pro Thr Ile Ile Arg Arg Ala Phe Tyr
295 300 305
tct ttg ggc aat tat att gtg gcc tcc gaa ata gct aaa gaa tct gcc 1191
Ser Leu Gly Asn Tyr Ile Val Ala Ser Glu Ile Ala Lys Glu Ser Ala
310 315 320
aaa tct cct gtg att gta gac agg tac tgg cac agc acg gcc acc tat 1239
Lys Ser Pro Val Ile Val Asp Arg Tyr Trp His Ser Thr Ala Thr Tyr
325 330 335
gct ata gcc act gag gtg agt ggg ggt ctc cag cac ctg ccc cca gcc 1287
Ala Ile Ala Thr Glu Val Ser Gly Gly Leu Gln His Leu Pro Pro Ala
340 345 350 355
cat cac cct gtg tac cag tgg cca gag gac ctg ctc aaa cct gac ctt 1335
His His Pro Val Tyr Gln Trp Pro Glu Asp Leu Leu Lys Pro Asp Leu
360 365 370
atc ctg ctg ctc act gtg agt cct gag gag agg ttg cag agg ctg cag 1383
Ile Leu Leu Leu Thr Val Ser Pro Glu Glu Arg Leu Gln Arg Leu Gln
375 380 385
ggc cgg ggc atg gag aag acc agg gaa gaa gca gaa ctt gag gcc aac 1431
Gly Arg Gly Met Glu Lys Thr Arg Glu Glu Ala Glu Leu Glu Ala Asn
390 395 400
agt gtg ttt cgt caa aag gta gaa atg tcc tac cag cgg atg gag aat 1479
Ser Val Phe Arg Gln Lys Val Glu Met Ser Tyr Gln Arg Met Glu Asn
405 410 415
cct ggc tgc cat gtg gtt gat gcc agc ccc tcc aga gaa agg gtc ctg 1527
Pro Gly Cys His Val Val Asp Ala Ser Pro Ser Arg Glu Arg Val Leu
420 425 430 435
cag acg gta tta agc cta atc cag aat agt ttt agt gaa ccg t 1570
Gln Thr Val Leu Ser Leu Ile Gln Asn Ser Phe Ser Glu Pro
440 445
agttactctg gccaggtgcc acgtctaact agattagatg ttgtttgaaa catctacatc 1630
caccatttgt tatgcagtgt tcccaaattt ctgttctaca agcatgttgt gtggcagaaa 1690
actggagacc aggcatctta attttacttc agccatcgta ccctcttctg actgatggac 1750
ccgtcatcac aaaggtccct ctcatcatgt tccagtgaga ggccagcgat tgctttcttc 1810
ctggcatagt aaacattttc ttggaacata tgtttcactt aatcactacc aaatatctgg 1870
aagacctgtc ttactcagac agcaccaggt gtacagaagc agcagacaag atcttccaga 1930
tcagcaggga gaccccggag cctctgcttc tcctacactg gcatgctgat gagatcgtga 1990
catgcccaca ttggcttctt ccacatctgg ttgcactcgt catgatgggc tcgctgcatc 2050
tccctcagtc ccaaattcta gagccaagtg ttcctgcaga ggctgtctat gtgtcctggc 2110
tgcccaagga cactcctgca gagccatttt tgggtaagga acacttacaa agaaggcatt 2170
gatcttgtgt ctgaggctca gagccctttt gataggcttc tgagtcatat ataaagacat 2230
tcaagccaag atgctccaac tgcaaatata ccaaccttct ctgaattata ttttgcttat 2290
ttatatttct tttctttttt tctaaagtat ggctctgaat agaatgcaca ttttccattg 2350
aactggatgc atttcattta gccaatccag taatttattt atattaatct atacaatatg 2410
tttcctcagc ataggagcta tgattcatta attaaaagtg gagtcaaaac gctaaatgca 2470
atgtttgttg tgtattttca ttacacaaac ttaatttgtc ttgttaaata agtacagtgg 2530
atcttggagt gggatttctt ggtaaattat cttgcacttg aatgtctcat gattacatat 2590
gaaatcgctt tgacatatct ttagacagaa aaaagtagct gagtgagggg gaaattatag 2650
agctgtgtga ctttagggag taggttgaac caggtgatta cctaaaattc cttccagttc 2710
aaaggcagat aaatctgtaa attattttat cctatctacc atttcttaag aagacattac 2770
tccaaaataa ttaaatttaa ggctttatca ggtctgcata tagaatctta aattctaata 2830
aagtttcatg ttaatgtcat aggattttta aaagagctat aggtaatttc tatataatat 2890
gtgtatatta aaatgtaatt gatttcagtt gaaagtattt taaagctgat aaatagcatt 2950
agggttcttt gcaatgtggt atctagctgt attattggtt ttatttactt taaacatttt 3010
gaaaagctta tactggcagc ctagaaaaac aaacaattaa tgtatcttta tgtccctggc 3070
acatgaataa actttgctgt ggtttact 3098
<210>12
<211>449
<212>PRT
<213>智人(Homo sapiens)
<400>12
Met Ala Phe Ala Arg Arg Leu Leu Arg Gly Pro Leu Ser Gly Pro Leu
1 5 10 15
Leu Gly Arg Arg Gly Val Cys Ala Gly Ala Met Ala Pro Pro Arg Arg
20 25 30
Phe Val Leu Glu Leu Pro Asp Cys Thr Leu Ala His Phe Ala Leu Gly
35 40 45
Ala Asp Ala Pro Gly Asp Ala Asp Ala Pro Asp Pro Arg Leu Ala Ala
50 55 60
Leu Leu Gly Pro Pro Glu Arg Ser Tyr Ser Leu Cys Val Pro Val Thr
65 70 75 80
Pro Asp Ala Gly Cys Gly Ala Arg Val Arg Ala Ala Arg Leu His Gln
85 90 95
Arg Leu Leu His Gln Leu Arg Arg Gly Pro Phe Gln Arg Cys Gln Leu
100 105 110
Leu Arg Leu Leu Cys Tyr Cys Pro Gly Gly Gln Ala Gly Gly Ala Gln
115 120 125
G1n Gly Phe Leu Leu Arg Asp Pro Leu Asp Asp Pro Asp Thr Arg Gln
130 135 140
Ala Leu Leu Glu Leu Leu Gly Ala Cys Gln Glu Ala Pro Arg Pro His
145 150 155 160
Leu Gly Glu Phe Glu Ala Asp Pro Arg Gly Gln Leu Trp Gln Arg Leu
165 170 175
Trp Glu Val Gln Asp Gly Arg Arg Leu Gln Val Gly Cys Ala Gln Val
180 185 190
Val Pro Val Pro Glu Pro Pro Leu His Pro Val Val Pro Asp Leu Pro
195 200 205
Ser Ser Val Val Phe Pro Asp Arg Glu Ala Ala Arg Ala Val Leu Glu
210 215 220
Glu Cys Thr Ser Phe Ile Pro Glu Ala Arg Ala Val Leu Asp Leu Val
225 230 235 240
Asp Gln Cys Pro Lys Gln Ile Gln Lys Gly Lys Phe Gln Val Val Ala
245 250 255
Ile Glu Gly Leu Asp Ala Thr Gly Lys Thr Thr Val Thr Gln Ser Val
260 265 270
Ala Asp Ser Leu Lys Ala Val Leu Leu Lys Ser Pro Pro Ser Cys Ile
275 280 285
Gly Gln Trp Arg Lys Ile Phe Asp Asp Glu Pro Thr Ile Ile Arg Arg
290 295 300
Ala Phe Tyr Ser Leu Gly Asn Tyr Ile Val Ala Ser Glu Ile Ala Lys
305 310 315 320
Glu Ser Ala Lys Ser Pro Val Ile Val Asp Arg Tyr Trp His Ser Thr
325 330 335
Ala Thr Tyr Ala Ile Ala Thr Glu Val Ser Gly Gly Leu Gln His Leu
340 345 350
Pro Pro Ala His His Pro Val Tyr Gln Trp Pro Glu Asp Leu Leu Lys
355 360 365
Pro Asp Leu Ile Leu Leu Leu Thr Val Ser Pro Glu Glu Arg Leu Gln
370 375 380
Arg Leu Gln Gly Arg Gly Met Glu Lys Thr Arg Glu Glu Ala Glu Leu
385 390 395 400
Glu Ala Asn Ser Val Phe Arg Gln Lys Val Glu Met Ser Tyr Gln Arg
405 410 415
Met Glu Asn Pro Gly Cys His Val Val Asp Ala Ser Pro Ser Arg Glu
420 425 430
Arg Val Leu Gln Thr Val Leu Ser Leu Ile Gln Asn Ser Phe Ser Glu
435 440 445
Pro
<210>13
<211>1893
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(418)..(1392)
<223>LBFLl67 Clone #20
<400>13
agtccagctg ccgttaggcg ctgggatagt cgcacgctgg atgcatctac gtccgccgag 60
cccctggggc gaagaggccg cgtccgcctt catttgtggc cggtgcttcg ccccctgacc 120
cttcgccccc aaagaccagc tctaacgtga gcgcctcggc cgccctgccc cagcctcgta 180
cacgccgcca gcctcgccca gccggtgtcc ggagaccctc gggccgtgtc catttgtggg 240
caaagccagc ggggcaggct tggccagagt gcaccactcg gcgccgtccc aggcccgacg 300
ctctgggcgc gcccggaacc ccaggttcgc ggcccgtgtt tccgaccggc ggagggggct 360
cagcggcccg atcccacgga agcgcgctcg gaggggtggg acccggccgg accggag 417
atg gcg ccg cca gcg ggc ggg gcg gcg gcg gcg gcc tcg gac ttg ggc 465
Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly
1 5 10 15
tcc gcc gca gtg crc ttg gct gtg cac gcc gcg gtg agg ccg ctg ggc 513
Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly
20 25 30
gcc ggg cca gac gcc gag gca cag ctg cgg agg ctg cag ctg agc gcg 561
Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala
35 40 45
gac cct gag cgg cct ggg cgc ttc cgg ctg gag ctg ctg ggc gcg gga 609
Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly
50 55 60
cct ggg gcg gtt aat ttg gag tgg ccc ctg gag tca gtt tcc tac acc 657
Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr
65 70 75 80
atc cga ggc ccc acc cag cac gag cta cag cct cca cca gga ggg cct 705
Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro
85 90 95
gga acc ctc agc ctg cac ttc ctc aac cct cag gaa gct cag cgg tgg 753
Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp
100 105 110
gca gtc cta gtc cga ggt gcc acc gtg gaa gga cag aat ggc agc aag 801
Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys
115 120 125
agc aac tca cca cca gcc ttg ggc cca gaa gca tgc cct gtc tcc ctg 849
Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu
130 135 140
ccc agt ccc ccg gaa gcc tcc aca ctc aag ggc cct cca cct gag gca 897
Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala
145 150 155 160
gat ctt cct agg agc cct gga aac ttg acg gag aga gaa gag ctg gca 945
Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala
165 170 175
ggg agc ctg gcc cgg gct att gca ggt gga gac gag aag ggg gca gcc 993
Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala
180 185 190
caa gtg gca gcc gtc ctg gcc cag cat cgt gtg gcc ctg agt gtt cag 1041
G1n Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln
195 200 205
ctt cag gag gcc tgc ttc cca cct ggc ccc atc agg ctg cag gtc aca 1089
Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr
210 215 220
ctt gaa gac gct gcc tct gcc gca tcc gcc gcg tcc tct gca cac gtt 1137
Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val
225 230 235 240
gcc ctg cag gtc cac ccc cac tgc act gtt gca gct ctc cag gag cag 1185
Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln
245 250 255
gtg ttc tca gag ctc ggt ttc cog cca gcc gtg caa cgc tgg gtc atc 1233
Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile
260 265 270
gga cgg tgc ctg tgt gtg cct gag cgc agc crt gcc tct tac ggg gtt 1281
Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val
275 280 285
cgg cag gat ggg gac cct gct ttc ctc tac ttg ctg tca gct cct cga 1329
Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg
290 295 300
gaa gcc cca ggt cag tcc tcg atg ggg gtg ggg tgt ggg agg tgg ggt 1377
Glu Ala Pro Gly Gln Ser Ser Met Gly Val Gly Cys Gly Arg Trp Gly
305 310 315 320
gca gcc cca cag tcc tgagctcc accccctcag ccacaggacc tagccctcag 1430
Ala Ala Pro Gln Ser
325
cacccccaga agatggacgg ggaacttgga cgcttgtttc ccccatcatt ggggctaccc 1490
ccaggccccc agccagctgc ctccagcctg cccagtccac tccagcccag ctggtcctgt 1550
ccttcctgca ccttcatcaa tgccccagac cgccctggct gtgagatgtg tagcacccag 1610
aggccctgca cttgggaccc ccttgctgca gcttccacct agcagccacc agaggtacca 1670
gaggtggcac aggcagggga ggtggggggc cagggcagaa tccacaggaa tgacccagct 1730
cctcccccac aggttacaag gggagagtgg cccttccctc acaagtccga catctccagg 1790
cccccactga actccgggga cctctactga ctgcttgctg ggacagtcac cagggttggg 1850
gggaagggcc acaaaatgaa accattaaag acccttaaga gcc 1893
<210>14
<211>325
<212>PRT
<213>智人(Homo sapiens)
<400>14
Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly
1 5 10 15
Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly
20 25 30
Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala
35 40 45
Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly
50 55 60
Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr
65 70 75 80
Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro
85 90 95
Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp
100 105 110
Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys
115 120 125
Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu
130 135 140
Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala
145 150 155 160
Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala
165 170 175
Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala
180 185 190
Gln Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln
195 200 205
Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr
210 215 220
Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val
225 230 235 240
Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln
245 250 255
Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile
260 265 270
Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val
275 280 285
Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg
290 295 300
Glu Ala Pro Gly Gln Ser Ser Met Gly Val Gly Cys Gly Arg Trp Gly
305 310 315 320
Ala Ala Pro Gln Ser
325
<210>15
<211>1597
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(271)..(1431)
<223>LBFLl67 Clone #46
<400>15
gtgagcgcct cggccgccct gccccagcct cgtacacgcc gccagctcgc ccagccggtg 60
tccggagacc ctcgggccgt gtccatttgt gggcaaagcc agcggggcag gcttggccag 120
agtgcaccac tcggcgccgt cccaggcccg acgctctggg cgcgcccgga accccaggtt 180
cgcggcccgt gtttccgacc ggcggagggg gctcagcggc ccgatcccac ggaagcgcgc 240
tcggaggggt gggacccggc cggaccggag atg gcg ccg cca gcg ggc ggg gcg 294
Met Ala Pro Pro Ala Gly Gly Ala
1 5
gcg gcg gcg gcc tcg gac ttg ggc tcc gcc gca gtg ctc ttg gct gtg 342
Ala Ala Ala Ala Ser Asp Leu Gly Ser Ala Ala Val Leu Leu Ala Val
10 15 20
cac gcc gcg gtg agg ccg ctg ggc gcc ggg cca gac gcc gag gca cag 390
His Ala Ala Val Arg Pro Leu Gly Ala Gly Pro Asp Ala Glu Ala Gln
25 30 35 40
ctg cgg agg ctg cag ctg agc gcg gac cct gag agg cct ggg cgc ttc 438
Leu Arg Arg Leu Gln Leu Ser Ala Asp Pro Glu Arg Pro Gly Arg Phe
45 50 55
cgg ctg gag ctg ctg ggc gcg gga cct ggg gcg gtt aat ttg gag tgg 486
Arg Leu Glu Leu Leu Gly Ala Gly Pro Gly Ala Val Asn Leu Glu Trp
60 65 70
ccc ctg gag tca gtt tcc tac acc atc cga ggc ccc acc cag cac gag 534
Pro Leu Glu Ser Val Ser Tyr Thr Ile Arg Gly Pro Thr Gln His Glu
75 80 85
cta cag cct cca cca gga ggg cct gga acc ctc agc ctg cac ttc ctc 582
Leu Gln Pro Pro Pro Gly Gly Pro Gly Thr Leu Ser Leu His Phe Leu
90 95 100
aac cct cag gaa gct cag cgg tgg gca gtc cta gtc cga ggt gcc acc 630
Asn Pro Gln Glu Ala Gln Arg Trp Ala Val Leu Val Arg Gly Ala Thr
105 110 115 120
gtg gaa gga cag aat ggc agc aag agc aac tca cca cca gcc ttg ggc 678
Val Glu Gly Gln Asn Gly Ser Lys Ser Asn Ser Pro Pro Ala Leu Gly
125 130 135
cca gaa gca tgc cct gtc tcc ctg ccc agt ccc ccg gaa gcc tcc aca 726
Pro Glu Ala Cys Pro Val Ser Leu Pro Ser Pro Pro Glu Ala Ser Thr
140 145 150
ctc aag ggc cct cca cct gag gca gat ctt cct agg agc cct gga aac 774
Leu Lys Gly Pro Pro Pro Glu Ala Asp Leu Pro Arg Ser Pro Gly Asn
155 l60 165
ttg acg gag aga gaa gag ctg gca ggg agc ctg gcc cgg gct att gca 822
Leu Thr Glu Arg Glu Glu Leu Ala Gly Ser Leu Ala Arg Ala Ile Ala
170 175 180
ggt gga gac gag aag ggg gca gcc caa gtg gca gcc gtc ctg gcc cag 870
Gly Gly Asp Glu Lys Gly Ala Ala Gln Val Ala Ala Val Leu Ala Gln
185 190 195 200
cat cgt gtg gcc ctg agt gtt cag ctt cag gag gcc tgc ttc cca cct 918
His Arg Val Ala Leu Ser Val Gln Leu Gln Glu Ala Cys Phe Pro Pro
205 210 215
ggc ccc atc agg ctg cag gtc aca ctt gaa gac gct gcc tct gcc gca 966
Gly Pro Ile Arg Leu Gln Val Thr Leu Glu Asp Ala Ala Ser Ala Ala
220 225 230
tcc gcc gcg tcc tct gca cac gtt gcc ctg cag gtc cac ccc cac tgc 1014
Ser Ala Ala Ser Ser Ala His Val Ala Leu Gln Val His Pro His Cys
235 240 245
act gtt gca gct ctc cag gag cag gtg ttc tca gag ctc ggt ttc ccg 1062
Thr Val Ala Ala Leu Gln Glu Gln Val Phe Ser Glu Leu Gly Phe Pro
250 255 260
cca gcc gtg caa cgc tgg gtc atc gga cgg tgc ctg tgt gtg cct gag 1110
Pro Ala Val Gln Arg Trp Val Ile G1y Arg Cys Leu Cys Val Pro Glu
265 270 275 280
cgc agc ctt gcc tct tac ggg gtt cgg cag gat ggg gac cct gct ttc 1158
Arg Ser Leu Ala Ser Tyr Gly Val Arg Gln Asp Gly Asp Pro Ala Phe
285 290 295
ctc tac ttg ctg tca gct cct cga gaa gcc cca gcc aca gga cct agc 1206
Leu Tyr Leu Leu Ser Ala Pro Arg Glu Ala Pro Ala Thr Gly Pro Ser
300 305 310
cct cag cac ccc cag aag atg gac ggg gaa ctt gga cgc ttg ttt ccc 1254
Pro Gln His Pro Gln Lys Met Asp Gly Glu Leu Gly Arg Leu Phe Pro
315 320 325
cca tca ttg ggg cta ccc cca ggc ccc cag cca gct gcc tcc agc ctg 1302
Pro Ser Leu Gly Leu Pro Pro Gly Pro Gln Pro Ala Ala Ser Ser Leu
330 335 340
ccc agt cca ctc cag ccc agc tgg tcc tgt cct tcc tgc acc ttc atc 1350
Pro Ser Pro Leu Gln Pro Ser Trp Ser Cys Pro Ser Cys Thr Phe Ile
345 350 355 360
aat gcc cca gac cgc cct ggc tgt gag atg tgt agc acc cag agg ccc 1398
Asn Ala Pro Asp Arg Pro Gly Cys Glu Met Cys Ser Thr Gln Arg Pro
365 370 375
tgc act tgg gac ccc ctt gct gca gct tcc acc tagcagcca ccagaggtta 1450
Cys Thr Trp Asp Pro Leu Ala Ala Ala Ser Thr
380 385
caaggggaga gtggcccttc cctcacaagt ccgacatctc caggccccca ctgaactccg 1510
gggacctcta ctgactgctt gctgggacag tcaccagggt tggggggaag ggccacaaaa 1570
tgaaaccatt aaagaccctt aagagcc 1597
<210>16
<211>387
<212>PRT
<213>智人(Homo sapiens)
<400>16
Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly
1 5 10 15
Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly
20 25 30
Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala
35 40 45
Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly
50 55 60
Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr
65 70 75 80
Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro
85 90 95
Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp
100 105 110
Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys
115 120 125
Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu
130 135 140
Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala
1451 50 155 160
Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala
165 170 175
Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala
180 185 190
Gln Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln
195 200 205
Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr
210 215 220
Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val
225 230 235 240
Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln
245 250 255
Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile
260 265 270
Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val
275 280 285
Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg
290 295 300
Glu Ala Pro Ala Thr Gly Pro Ser Pro Gln His Pro Gln Lys Met Asp
305 310 315 320
Gly Glu Leu Gly Arg Leu Phe Pro Pro Ser Leu Gly Leu Pro Pro Gly
325 330 335
Pro Gln Pro Ala Ala Ser Ser Leu Pro Ser Pro Leu Gln Pro Ser Trp
340 345 350
Ser Cys Pro Ser Cys Thr Phe Ile Asn Ala Pro Asp Arg Pro Gly Cys
355 360 365
Glu Met Cys Ser Thr Gln Arg Pro Cys Thr Trp Asp Pro Leu Ala Ala
370 375 380
Ala Ser Thr
385
<210>17
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>17
gctgaagcag gaaaatcgct t 21
<210>18
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>18
tgagacggag tctcactcgg t 21
<210>19
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>19
gtttttccta attttggcat gaac 24
<210>20
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>20
cgcccaagct tttcctttt 19
<210>21
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>21
caccctttgc ctctgtcact tccgca 26
<210>22
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>22
gctggagcac caggactgca ttg 23
<210>23
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>23
ggagctgagc agcagtgtaa tgaa 24
<210>24
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>24
gaggcctgcc tgaaggagga gcttc 25
<210>25
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>25
tctggaagta gtgcagacgc ctcagg 26
<210>26
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>26
agccaacgtc ggctttgtta tccagc 26
<210>27
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>27
gctgtcagat atgatggttc tggac 25
<210>28
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>28
ccagcctcac cactgttggg ttgc 24
<210>29
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>29
cattctctga gctgtattag tgt 23
<210>30
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>30
cctgagctgg aatgacctgc a 21
<210>31
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>31
ctttgtgttg gctgcagcca ca 22
<210>32
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>32
tgaggagaga ctttgctgac tggt 24
<210>33
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>33
gtcctgtctg gcggtgccga 20
<210>34
<211>42
<212>DNA
<213>人工序列
<220>
<223>引物
<400>34
gctccaggat cccctgtcac ctgggccttc tgccttttgg ct 42
<210>35
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物
<400>35
ccatatggag aggagagcag cgggccca 28
<210>36
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>36
gaaggaggaa catggagagg aga 23
<210>37
<211>27
<212>DNA
<213>人工序列
<220>
<223>引物
<400>37
ccatatgccc cgggtagtct actgcat 27
<210>38
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>38
gtcgactcga gtcacttccg caaaaacttc ttg 33
<210>39
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>39
tccattccga aggctctcct cc 22
<210>40
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>40
gtctgtgtga cggaaatgta agc 23
<210>41
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>41
gaaggtcgaa ggcagaccga tgt 23
<210>42
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>42
gaatgtgtca gagacaagtg cagc 24
<210>43
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>43
tgtagaaact cttggactaa tggagg 26
<210>44
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>44
gtatgcatca gaattcccta tagatcttt 29
<210>45
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>45
tagatgtttg ggcaacagcc t 21
<210>46
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物
<400>46
ttccttcacc aaaggcatcc agccattcta tg 32
<210>47
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物
<400>47
aaatgtctga ttaccccatt ttatcagt 28
<210>48
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>48
taatcctgaa atgaacagct aaca 24
<210>49
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>49
taatgttaga gtaacagcat tttccttcaa 30
<210>50
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>50
tgccccacac taactcagtt cttgtgatg 29
<210>51
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>51
aaggctttat caggtctgca tatagaatc 29
<210>52
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物
<400>52
gcaaagaacc ctaatgctat ttatcagc 28
<210>53
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>53
gagaagacca gggaagaagc ag 22
<210>54
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>54
ggacggggaa cttggacgc 19
<210>55
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>55
aagtgcaggg cctctgggtg 20
<210>56
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>56
cgctgggtca tcggacggt 19
Claims (33)
1.分离的核酸分子,选自:(a)包括SEQ ID NO:1、3、5、7、9、11、13或15的分离的核酸分子,(b)编码SEQ ID NO:2、4、6、8、10、12、14或16的分离的核酸分子,(c)分离的核酸分子,其编码的蛋白在癌症中表达,并与SEQ ID NO:1、3、5、7、9、11、13或15中的全部连续的序列表现出至少大约75%的核苷酸序列同一性,以及(d)包括与(a)、(b)或(c)中核酸分子互补的序列的分离的核酸分子。
2.权利要求1的分离的核酸分子,其中的核酸分子包括SEQ IDNO:1的390-4880位核苷酸,SEQ ID NO:3的12-4904位核苷酸,SEQ IDNO:5的424-1908位核苷酸,SEQ ID NO:7的405-1835位核苷酸,SEQID NO:9的89-1150位核苷酸,SEQ ID NO:11的223-1569位核苷酸,SEQ ID NO:13的418-1392位核苷酸,或SEQ ID NO:15的271-1431位核苷酸。
3.权利要求1的分离的核酸分子,其中核酸分子包括SEQ IDNO:1的390-4883位核苷酸,SEQ ID NO:3的12-4907位核苷酸,SEQ IDNO:5的424-1911位核苷酸,SEQ ID NO:7的405-1838位核苷酸,SEQID NO:9的89-1153位核苷酸,SEQ ID NO:11的223-1572位核苷酸,SEQ ID NO:13的418-1395位核苷酸,或SEQ ID NO:15的271-1434位核苷酸。
4.权利要求1的分离的核酸分子,其中核酸分子的组成为SEQ IDNO:1的390-4883位核苷酸,SEQ ID NO:3的12-4907位核苷酸,SEQ IDNO:5的424-1908位核苷酸,SEQ ID NO:7的405-1835位核苷酸,SEQID NO:9的89-1153位核苷酸,SEQ ID NO:11的223-1569位核苷酸,SEQ ID NO:13的418-1395位核苷酸,或SEQ ID NO:15的271-1434位核苷酸。
5.权利要求1-4任一项的分离的核酸分子,其中该核酸分子与一个或多个表达控制元件可操作地连接。
6.含有权利要求1-4任一项的分离的核酸分子的载体。
7.被转化以含有权利要求1-4任一项的核酸分子的宿主细胞。
8.含有权利要求6的载体的宿主细胞。
9.权利要求8的宿主细胞,其中该宿主细胞选自原核宿主细胞和真核宿主细胞。
10.一种生产多肽的方法,包括培养以权利要求1-4任一项的核酸分子转化的宿主细胞,培养条件为由所述核酸分子编码的蛋白被表达。
11.权利要求10的方法,其中该宿主细胞选自原核宿主细胞和真核宿主细胞。
12.通过权利要求10的方法生产的分离的多肽。
13.分离的多肽或蛋白,选自包括SEQ ID NO:2、4、6、8、10、12、14或16的氨基酸序列的蛋白和与SEQ ID NO:2、4、6、8、10、12、14或16具有至少大约75%氨基酸序列同一性的蛋白。
14.与权利要求13的多肽结合的分离的抗体或抗原结合的抗体片段。
15.权利要求14的抗体,其中该抗体是单克隆或多克隆抗体。
16.一种鉴定试剂的方法,所述试剂能够调节编码权利要求13的蛋白的核酸表达,包括:
将表达核酸的细胞暴露于试剂;以及
确定试剂是否调节该核酸的表达,从而鉴定调节编码蛋白的核酸表达的试剂。
17.一种鉴定试剂的方法,所述试剂调节权利要求13的蛋白的水平或至少一种活性,包括:
将表达蛋白的细胞暴露于试剂;
确定试剂是否调节该蛋白的水平或至少一种活性,从而鉴定调节蛋白的水平或至少一种活性的试剂。
18.权利要求17的方法,其中的试剂调节蛋白的一种活性。
19.一种调节编码权利要求13的蛋白的核酸表达的方法,包括:
施用有效量的调节编码所述蛋白的核酸表达的试剂。
20.一种调节权利要求13的蛋白的至少一种活性的方法,包括:
施用有效量的调节所述蛋白的至少一种活性的试剂。
21.一种鉴定权利要求13的蛋白的结合配体的方法,包括:
将该蛋白暴露于潜在的结合配体;以及
确定潜在的结合配体是否与该蛋白结合,从而鉴定蛋白的结合配体。
22.一种鉴定试剂的方法,所述试剂调节权利要求21的结合配体和权利要求13的蛋白之间的相互作用,包括:
将该蛋白和该配体暴露于试剂;以及
确定该试剂是否调节结合配体与该蛋白的结合,从而鉴定调节结合配体与该蛋白的结合的试剂。
23.一种调节权利要求21的结合配体和权利要求13的蛋白之间的相互作用的方法,包括:
施用有效量的调节结合配体与该蛋白的结合的试剂。
24.一种非人的转基因动物,被修饰以含有权利要求1-4任一项的核酸分子。
25.权利要求24的转基因动物,其中的核酸分子含有阻止编码的蛋白表达的突变。
26.一种治疗对象疾病状态的方法,包括:
在患病的细胞中插入基因构建物,该构建物中含有与启动子或增强子元件连接的权利要求1-4任一项的分离的核酸分子,以便该核酸分子的表达抑制该疾病。
27.权利要求26的方法,其中在患病的细胞中插入基因构建物是在体内完成的。
28.权利要求26的方法,其中在患病的细胞中插入基因构建物还包括病毒或质粒因子的使用,并且在体外或体内完成。
29.一种诊断对象疾病状态的方法,包括:
确定权利要求1-4或13任一项的核酸分子或蛋白的表达水平。
30.权利要求26和29的方法,其中的疾病状态是癌症。
31.权利要求26和29的方法,其中的疾病状态是恶性肿瘤。
32.权利要求31的方法,其中的恶性肿瘤发生在乳腺、结肠、食管、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、直肠和/或胃。
33.一种含有稀释剂和多肽或蛋白的组合物,其中该多肽或蛋白选自:含有SEQ ID NO:2、4、6、8、10、12、14或16氨基酸序列的分离的多肽;含有SEQ ID NO:2、4、6、8、10、12、14或16的至少10个氨基酸片段的分离的多肽;含有SEQ ID NO:2、4、6、8、10、12、14或16的保守氨基酸置换的分离的多肽;含有SEQ ID NO:2、4、6、8、10、12、14或16的自然存在的氨基酸序列变体的分离的多肽;以及与SEQ ID NO:2、4、6、8、10、12、14或16表现出至少大约75%氨基酸序列同一性的分离的多肽。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US41991102P | 2002-10-18 | 2002-10-18 | |
US60/419,912 | 2002-10-18 | ||
US60/420,088 | 2002-10-18 | ||
US60/419,911 | 2002-10-18 | ||
US60/434,243 | 2002-12-16 | ||
US60/434,278 | 2002-12-16 | ||
US60/438,278 | 2003-01-03 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1705745A true CN1705745A (zh) | 2005-12-07 |
CN100552027C CN100552027C (zh) | 2009-10-21 |
Family
ID=35578307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2003801016401A Expired - Fee Related CN100552027C (zh) | 2002-10-18 | 2003-10-16 | 与癌症相关的基因家族 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100552027C (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109072229A (zh) * | 2016-04-06 | 2018-12-21 | 定制药品研究株式会社 | 使用了抗mct5抗体的癌症治疗用药物组合物 |
-
2003
- 2003-10-16 CN CNB2003801016401A patent/CN100552027C/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109072229A (zh) * | 2016-04-06 | 2018-12-21 | 定制药品研究株式会社 | 使用了抗mct5抗体的癌症治疗用药物组合物 |
Also Published As
Publication number | Publication date |
---|---|
CN100552027C (zh) | 2009-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1592793A (zh) | 肝细胞癌-相关基因和多肽,以及检测肝细胞癌的方法 | |
CN1264980C (zh) | 新型肿瘤抗原蛋白sart-3及其肿瘤抗原肽 | |
CN1170850C (zh) | 人血管生成素样蛋白和编码序列及其用途 | |
CN1705745A (zh) | 与癌症相关的基因家族 | |
CN1932016A (zh) | 影响sre活性的多核苷酸及其编码多肽和用途 | |
CN1169954C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1246457C (zh) | 人tsc403基因和人ing1l基因 | |
CN1209373C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1900279A (zh) | 诱导细胞凋亡的多核苷酸及其编码的多肽和用途 | |
CN1177048C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1199998C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1194989C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 | |
CN1281962C (zh) | 作为肝癌标志物的肿瘤相关分泌蛋白及其用途 | |
CN1199997C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1169955C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1249082C (zh) | 促凋亡基因bnipl及其编码蛋白和用途 | |
CN1177050C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1169958C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1169957C (zh) | 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸 | |
CN1194010C (zh) | 具有抑制癌细胞生长功能的人蛋白及基编码序列 | |
CN1230445C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1708511A (zh) | 对促肾上腺皮质激素释放激素刺激的应答而表达增加的基因 | |
CN1231497C (zh) | 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列 | |
CN1243017C (zh) | 肿瘤抑制基因及其编码蛋白和应用 | |
CN1199994C (zh) | 具有抑制癌细胞生长功能的新的人蛋白及其编码序列 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20091021 Termination date: 20111016 |