CN1705745A

CN1705745A - 与癌症相关的基因家族

Info

Publication number: CN1705745A
Application number: CN 200380101640
Authority: CN
Inventors: 李寿振; 高尚锡; 李福万; 郑铉浩; 赵成浩; 梁斗锡
Original assignee: LG Life Sciences Ltd
Current assignee: LG Chem Ltd
Priority date: 2002-10-18
Filing date: 2003-10-16
Publication date: 2005-12-07
Anticipated expiration: 2023-10-16
Also published as: CN100552027C

Abstract

本发明总地涉及来自癌症病人的人组织中基因表达的变化。具体来说，本发明涉及在乳腺、结肠、食管、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、直肠和/或胃的癌症组织与相应的正常组织相比差异表达的人基因家族。

Description

与癌症相关的基因家族

发明领域

本发明涉及来自癌症病人的人组织中基因表达的变化。具体来说，本发明涉及那些在乳腺、结肠、食管、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、直肠和/或胃的癌组织中与相应的正常组织相比差异表达的人基因。

发明背景

在美国，有超过100万新发的癌症病例被诊断，大约有50万人死于癌症。癌症的原因是多种多样的，包括遗传倾向、环境影响、传染因素和衰老。这些因素通过脱开广泛的调节和下游效应器途径将正常细胞转化为癌变细胞。有几种基本的细胞生理学变化合在一起共同支配了恶性的生长：生长信号的自给自足、对生长抑制信号的不敏感性、程序性细胞死亡的规避、无限的复制潜力、持续的血管生成以及组织侵害和转移(Hanahan和Weinberg(2000)，Cell 100：57-70)。

到目前为止，研究人员已经能够鉴定许多据信是肿瘤发生的原因的遗传变化。这些遗传变化包括致癌基因的扩增和导致肿瘤抑制基因丧失的突变。致癌基因起初被鉴定为病毒携带的能够引起它们的靶细胞转化的基因。一类主要的病毒致癌基因在细胞中有其对应物，它们参与正常的细胞功能。细胞中的基因被称为原癌基因，在某些病例中，它们在细胞中的突变或畸变与肿瘤的形成相关。致癌基因的产生代表功能的获得，其中细胞内的原癌基因被不适当地激活了。这可以包括蛋白的突变变化、或组成性的活化、过量表达、或不能在适当的时间关闭表达。已经鉴定了大约100个致癌基因。致癌基因的例子包括但不限于ras、fos、myc、abl和myb(Ponder(2001)，Nature 411：336-341)。肿瘤抑制基因在其野生型等位基因中表达能够抑制异常的细胞增殖的蛋白。当为肿瘤抑制蛋白编码的基因被突变或缺失时，产生的突变蛋白或肿瘤抑制蛋白表达的完全缺失可能不能正确地调控细胞增殖，异常的增殖可能发生，特别是当细胞的调控机制已经存在损伤时。许多已经深入研究的人类肿瘤和肿瘤细胞系失去了或具有无功能的肿瘤抑制基因。肿瘤抑制基因的例子包括但不限于成视网膜细胞瘤易感性基因或RB基因、p53基因、结肠癌缺失(DCC)基因和神经纤维瘤I型(NF-1)肿瘤抑制基因(Weinberg(1991)，Science 254：1138-1146)。肿瘤抑制基因失去活性或钝化可能在大量人类癌症的起始和/或发展中扮演中心的角色。

利用基因组范围内的表达图谱对肿瘤分类、鉴定药物的靶、鉴定诊断标记物和/或对化疗结果获得进一步的了解，可以便于设计更有效的治疗多种癌症的策略。早期的利用基因表达模式鉴定癌症亚型的研究产生了相当吸引人的结果(参见Perou等(1999)，Proc Natl Acad Sci USA 96：9212-9217；Golub等(1999)，Science 286：531-537；Alizadeh等(2000)，Nature 403：503-511；Alon等(1999)，Proc Natl Acad Sci USA96：6745-6750；以及Bittner等(2000)，Nature 406：536-540；Perou等(2000)，Nature 406：747-752)。通过基因表达图谱对B细胞淋巴瘤进行分子分类，在临床上阐明了截然不同的弥散性大B细胞淋巴瘤亚类(参见Alizadeh等，同上)。在乳腺癌中，利用有限数量的基因(8102个基因)进行的研究已经基于基因表达图谱将肿瘤分为亚型，这个研究指出了多种与乳腺癌相关的分子表型(参见Perou等，同上)。此外，基因表达图谱已经使研究者能够对数千个基因的组织特异性表达水平作图(Alon等(1999)，Proc Natl Acad Sci USA 96：6745-6750；Iyer等(1999)，Science 283：83-87；Khan等(1998)，Cancer Res 58：5009-5013；Lee等(1999)，Science 285：1390-1393；Wang等(1999)，Gene 229：101-108；Whitney等(1999)，Ann Neurol 46：425-428)。尽管这些研究已经表明基因表达图谱可以被用于在诊断人类疾病如癌症、以及开发改良的治疗策略方面产生进展，仍然需要进一步的研究。

尽管癌症由于源自于多种组织和具有多种发病因素而具有多样性和异源性，现已提出导致这些可变性的原因只在于相对少量的关键事件，这些事件的聚集是任何和所有癌症发展所必需的(Evan和Vousden(2001)，Nature 411：342-348)。因此，需要广泛地研究许多不同类型癌症中整体基因表达水平的变化，以鉴定与癌症发生和发展相关的关键分子标记。在本领域还需要能够更准确地诊断癌症的材料与方法。此外，在本领域中对治疗的方法和鉴定能够有效治疗疾病的药剂的方法还存在需要。本发明满足了这些以及其它的需要。

发明概述

本发明是基于与正常组织相比在癌症组织中差异表达的新基因，分别称为LFG1、LFG2、LFG3、LFG4、LFG5、LFG6。本发明包括含有SEQ ID NO：1、3、5、7、9、11、13或15所示序列或其互补序列的分离的核酸分子。

本发明还包括与一个或多个表达控制元件可操作连接的核酸分子，包括含有分离的核酸分子的载体。本发明还包括转化后含有本发明核酸的宿主细胞，以及生产蛋白的方法，该方法包括在蛋白能够表达的条件下培养用本发明的核酸分子转化的宿主细胞的步骤。

本发明还提供了分离的多肽，选自：含有SEQ ID NO：2、4、6、8、10、12、14或16中氨基酸序列的分离的多肽、含有SEQ ID NO：2、4、6、8、10、12、14或16中至少10个氨基酸片段的分离的多肽、含有SEQ ID NO：2、4、6、8、10、12、14或16中保守氨基酸置换的分离的多肽、以及含有SEQ ID NO：2、4、6、8、10、12、14或16中自然发生氨基酸序列变体的分离的多肽。本发明的多肽还包括这样的一些多肽，它们的氨基酸序列与SEQ ID NO：2、4、6、8、10、12、14或16中的所述序列有至少大约50％、60％、70％或75％氨基酸序列同一性，与SEQ ID NO：2、4、6、8、10、12、14或16中的所述序列优选有至少大约80％、更优选至少大约90-95％，而最优选至少大约95-98％的序列同一性。

本发明还提供了鉴定本发明的多肽家族的其它成员的方法。具体来说，SEQ ID NO：1、3、5、7、9、11、13或15的核酸序列，在鉴定编码LFG1、LFG2、LFG3、LFG4、LFG5或LFG6蛋白家族的其它成员的核酸分子的方法中，可以用作探针或用来产生PCR引物。

本发明还提供了能够特异性地与本发明的多肽结合的分离的抗体或抗原结合的抗体片段，包括单克隆抗体和多克隆抗体。

本发明还提供了试剂的鉴定方法，所述试剂调节编码本发明蛋白的核酸分子表达，包括：将表达核酸分子的细胞暴露于试剂；以及确定试剂是否调节该核酸分子的表达，从而鉴定能够调节编码蛋白的核酸分子表达的试剂。

本发明还提供了试剂的鉴定方法，所述试剂调节本发明蛋白的水平或至少一种活性，包括：将表达蛋白的细胞暴露于试剂；以及确定试剂是否调节该蛋白的水平或至少一种活性，从而鉴定能够调节蛋白的水平或至少一种活性的试剂。

本发明还提供了调节编码本发明蛋白的核酸分子表达的方法，其中包括施用有效量的调节编码蛋白的核酸分子表达的试剂的步骤。本发明还提供了调节本发明蛋白的至少一种活性的方法，其中包括了施用有效量的能够调节本发明蛋白的至少一种活性的试剂的步骤。

本发明还提供了鉴定本发明蛋白的结合配体的方法，其步骤包括将该蛋白暴露于潜在的结合配体；以及确定潜在的结合配体是否与该蛋白结合，从而鉴定蛋白的结合配体。

本发明还提供了能够阻断或调节本发明蛋白与结合配体结合的试剂的鉴定方法。具体来说，通过将本发明蛋白或其片段以及结合配体与待测试剂接触，然后确定待测试剂是否阻断或减少本发明蛋白与结合配体的结合，可以检测该试剂阻断、减少或调节该蛋白与结合配体的结合的能力。

本发明还提供了减少或阻断本发明蛋白与一个或多个结合配体结合的方法，其中包括施用有效量的能够减少或阻断该蛋白与结合配体结合的试剂的步骤。该方法可以利用能够与本发明的蛋白或结合配体结合的试剂。

在本发明的另一方面，本发明的蛋白可以用作合理的药物设计的起始点，以提供配体、治疗药物或其它类型的小化学分子。此外，通过上述筛选方法鉴定的小分子或其它化合物可以在合理的药物设计中作为“前导化合物”。

本发明还涉及了治疗癌症的方法，包括将核酸构建物导入到癌细胞中，该构建物含有与启动子或增强子元件可操作地连接的本发明的核酸分子，以使该核酸分子的表达导致该癌症的抑制。

本发明还包括了经修饰以包含本发明的核酸分子的非人的转基因动物，或经修饰以包含突变的核酸分子的非人的转基因动物，以便编码的本发明多肽的表达被阻止。

本发明也包括非人的转基因动物，其中含有SEQ ID NO：1、3、5、7、9、11、13或15中所有或部分的基因的所有或一部分已经从动物的基因组中被敲除或缺失了。

本发明还提供了诊断癌症的方法，其步骤包括从对象获得组织、血液、尿液或其它样品，然后确定本发明的核酸分子或本发明的多肽的表达水平。

本发明还包括了含有稀释剂和多肽或蛋白的组合物，其中的多肽或蛋白选自：含有SEQ ID NO：2、4、6、8、10、12、14或16中氨基酸序列的分离的多肽、含有SEQ ID NO：2、4、6、8、10、12、14或16中至少10个氨基酸片段的分离的多肽、含有SEQ ID NO：2、4、6、8、10、12、14或16中保守氨基酸置换的分离的多肽、以及含有SEQ IDNO：2、4、6、8、10、12、14或16中自然发生的氨基酸序列变体的分离的多肽，以及氨基酸序列与SEQ ID NO：2、4、6、8、10、12、14或16中的所述序列有至少大约50％、60％、70％或75％同一性的分离的多肽，与SEQ ID NO：2、4、6、8、10、12、14或16中的所述序列优选至少大约80％，更优选至少大约90-95％，而最优选至少大约95-98％的序列同一性。

附图简述

图1显示两个LFG1克隆的相对比对位置。

图2是LFG1-克隆A(SEQ ID NO：2)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。

图3是LFG1-克隆B(SEQ ID NO：4)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。

图4是LFG2(SEQ ID NO：6)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。

图5是LFG3(SEQ ID NO：8)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。

图6是LFG4(SEQ ID NO：10)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。

图7是ALFG5(SEQ ID NO：12)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。

图8显示了两个LFG6克隆的相对比对位置。

图9是LFG6-#20(SEQ ID NO：14)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。

图10是LFG6-#46(SEQ ID NO：16)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。

优选实施方案的详细描述

I.一般说明

本发明部分基于鉴定的新基因家族，它们在癌变人组织中的表达与在正常的人组织中的表达不同。这些基因家族对应于SEQ IDNOS：1、3、5、7、9、11、13和15中的人cDNA。

本发明的基因和蛋白可以用做诊断试剂或标记物来检测癌症，或用来将样品中的癌组织与正常组织区别开来。它们也可以用做调节基因表达或活性的试剂的靶。例如，可以鉴定调节与肿瘤生长相关的生物过程，包括癌症的增生过程的试剂。

II.具体的实施方案

A.与癌症相关的蛋白

本发明提供分离的蛋白、蛋白的等位基因变体、以及发生保守的氨基酸置换的蛋白。本文中使用的“蛋白”或“多肽”部分是指具有SEQ ID NO：2、4、6、8、10、12、14或16中描述人的氨基酸序列的蛋白。该术语也指自然发生的等位基因变体以及与上述序列相比具有轻微不同的氨基酸序列的蛋白。等位基因变体，尽管具有与上述序列相比轻微不同的氨基酸序列，它们仍然具有同样或相似的与这些蛋白相关的生物学功能。

本文中使用的与SEQ ID NO：2、4、6、8、10、12、14或16中人的氨基酸序列相关的蛋白家族是指已经从人和其它生物体中被分离出来的蛋白。用来鉴定和分离与这些蛋白相关的蛋白家族的其它成员的方法将在下面描述。

本发明的蛋白优选为分离的形式。用于本文中时，当使用物理、机械或化学的方法将蛋白从通常与蛋白结合的细胞成分中取出时，该蛋白被称为分离的。专业技术人员可以容易地使用标准的纯化方法获得被分离的蛋白。

本发明的蛋白还包括SEQ ID NO：2、4、6、8、10、12、14或16的插入、缺失或保守氨基酸置换的变体。用于本文中时，保守的变体是指氨基酸序列的改变对蛋白的生物学功能没有负面的影响。当改变的序列阻止或破坏了与蛋白相关的生物学功能时，置换、插入或缺失被称为是有负面影响的。例如，蛋白的总电荷、结构或疏水/亲水性质，在某些情况下可以被改变而对生物学活性没有负面的影响。因此，氨基酸序列可以被改变，例如赋予肽链更高的疏水性或亲水性，而对蛋白的生物学活性没有负面的影响。

一般来说，等位基因变体、保守置换变体和蛋白家族的其它成员，它们含有的氨基酸序列与SEQ ID NO：2、4、6、8、10、12、14或16中的所述序列有至少大约50％、60％、70％或75％的氨基酸序列同一性，优选至少大约80％、更优选至少大约90-95％、而最优选至少大约95-98％的序列同一性。这些序列的同一性或同源性在此处定义为在将序列进行比对，并且如果需要就插入空隙(gap)以获得最高的同源性百分数后，候选序列中与SEQ ID NO：2、4、6、8、10、12、14或16中的氨基酸残基相同的百分数，保守置换不被当作序列同一性的一部分(相关的参数参见B部分)。融合蛋白、或肽序列中的N-端、C-端或内部延伸、缺失或插入不应被视为影响同源性。

因此，本发明的蛋白包括具有SEQ ID NO：2、4、6、8、10、12、14或16中所公开的氨基酸序列的分子；具有这些蛋白的至少大约3、4、5、6、10、15、20、25、30、35或更多的氨基酸残基的连续序列的片段；其中一个或多个氨基酸残基已经被插入到公开的编码序列的N-端或C-端或内部的氨基酸序列变体；以及上述公开序列至少一个氨基酸残基置换的序列变体，或其如前所述的片段。这些片段，也被称为肽或多肽，可以含有抗原区，被鉴定为对应于已知蛋白结构域氨基酸序列区的蛋白功能区，以及具有显著的亲水性的区域。通过使用通常可以获得的序列分析软件例如MacVector(Oxford Molecular)可以容易地鉴定所有这些区域。

预期的变体还包括那些含有预定的突变，例如由同源重组、定点突变或PCR突变引起的变体，以及其它动物中的相应蛋白，其它的动物包括但不限于兔、大鼠、小鼠、猪、牛、羊、马和人以外的灵长类，以及蛋白家族的等位基因或其它自然发生的变体；以及一些衍生物，其中的蛋白已经通过置换、化学、酶学或其它适当的方法用自然存在的氨基酸之外的部分(例如可检测的部分，如酶或放射性同位素)进行了共价修饰。

本发明还提供了含有本发明的蛋白或多肽以及稀释剂的组合物。适合的稀释剂可以是水性或非水性溶剂或它们的组合，并可以含有附加的对蛋白或多肽的稳定性、溶解性、活性和/或储存有利的成分，如水溶性盐或甘油。

正如下面所描述的，蛋白家族的成员可以被用来：(1)鉴定调节蛋白的水平或至少一种活性的试剂，(2)鉴定蛋白的结合配体，(3)作为抗原制备多克隆或单克隆抗体，(4)作为治疗药剂或靶，以及(5)作为癌症的诊断试剂或标记物。

B.核酸分子

本发明还提供为SEQ ID NO：2、4、6、8、10、12、14或16序列的蛋白和本文描述的相关蛋白编码的核酸分子，优选为分离的形式。本文使用的“核酸”被定义为编码前面定义的蛋白或肽的RNA或DNA，与编码这些肽的核酸序列互补的RNA或DNA，在适当的严紧条件下与SEQ ID NO：1、3、5、7、9、11、13或15的核酸杂交并与其保持稳定的结合的RNA或DNA，编码的多肽与SEQ ID NO：2、4、6、8、10、12、14或16的肽序列具有至少大约50％、60％、70％或75％，优选至少大约80％，更优选至少大约90-95％，最优选至少大约95-98％或更高的同一性的RNA或DNA，或与SEQ ID NO：1、3、5、7、9、11、13或15的可读框表现出至少大约50％、60％、70％或75％，优选至少大约80％，更优选至少大约90-95％，最优选至少大约95-98％或更高的核苷酸序列同一性的RNA或DNA。

本发明还包括与SEQ ID NO：1、3、5、7、9、11、13或15的互补序列特异性杂交的分离的核酸分子，特别是在可读框内特异性杂交的分子。这样的分子与SEQ ID NO：1、3、5、7、9、11、13或15的互补序列一般在严紧的杂交条件下进行特异性杂交。

特别关注的是基因组DNA、cDNA、mRNA和反义分子，以及基于可选择的骨架的核酸或包括可选择碱基的核酸，不论它们是天然来源的还是合成的。但是这些杂交或互补的核酸，也被确定为对于任何现有技术的核酸来说是新的和非显而易见的，包括编码本发明蛋白的核酸，在适当的严紧条件下杂交，或者互补于编码本发明蛋白的核酸的核酸。

核苷酸或氨基酸水平上的同源性或同一性由BLAST(基本局部对比搜索工具)分析来确定，使用专门用于序列相似性检索而制作的程序blastp、blastn，blastx、tblastn和tblastx(Altschul等(1997)，Nucleic AcidsRes.25：3389-3402，以及Karlin等(1990)，Proc.Natl.Acad.Sci.USA87：2264-2268，两者以其全文引入参考)使用的算法来计算。BLAST程序使用的方法首先考虑一个待检索序列和一个数据库序列之间的相似区段，两区段可以存在空隙也可以没有，然后评估所有等同的配对在统计上的显著性，最后只概括出那些显著性满足了预先选定的阈值的配对。对于序列数据库相似性检索的基本论点的讨论参见Altschul等(1994)，Nat.Genet.6：119-129，以其全文引为参考。用于直方图、描述、比对、预期值(即用于报告与数据库序列配对的统计学重要性的阈值)、截止(点)、矩阵和过滤(低复杂性的检索参数)采用缺省设定。blastp、blastn，blastx、tblastn和tblastx使用的缺省评分矩阵是BLOSUM62矩阵(Henikoff等(1992)，Proc.Natl.Acad.Sci.USA 89：10915-10919，以其全文引为参考)，推荐的待检索序列长度超过85个核苷酸或氨基酸。

对于blastn来说，评分矩阵由M(即一对匹配的残基的奖励分数)与N(即误配残基的处罚分数)的比率来设定，其中M和N的缺省值分别为5和-4。Blastn的四个参数被调整如下：Q＝10(产生空隙的处罚)；R＝10(延长空隙的处罚)；wink＝1(在待检索序列中每个wink^th位点产生的字码碰撞)；以及gapw＝16(设定其内产生带有空隙的比对的窗口宽度)。相应的Blastp的参数设置为Q＝9；R＝2；wink＝1；以及gapw＝32。在GCG软件包10.0版中所用的序列间的最优比较，使用了DNA参数GAP＝50(产生空隙的处罚)和LEN＝3(延长空隙的处罚)，在蛋白比较中相应的设置是GAP＝8和LEN＝2。

“严紧条件”是指(1)洗涤时使用低离子强度和高温，例如0.015MNaCl/0.0015M柠檬酸钠/0.1％SDS，温度为50℃或(2)在杂交过程中使用甲酰胺等变性试剂，例如50％(体积比)的甲酰胺，和0.1％牛血清白蛋白/0.1％ Ficoll/0.1％聚乙烯吡咯烷酮/50mM pH6.5的磷酸钠缓冲液，以及750mM NaCl、75mM柠檬酸钠，温度为42□。另一个例子是在50％甲酰胺、5×SSC(0.75M NaCl，0.075M柠檬酸钠)、50mM磷酸钠(pH6.8)、0.1％焦磷酸钠、5×Denhardt氏溶液、超声处理的鲑鱼精子DNA(50μg/ml)、0.1％SDS和10％硫酸葡聚糖中于42□进行杂交，于42□在0.2×SSC和0.1％SDS中洗涤。专业技术人员可以容易地确定和改变严紧条件，使其适合于获得清晰和可检测的杂交信号。优选的分子是那些能够在上述条件下与SEQ ID NO：1、3、5、7、9、11、13或15的互补序列杂交、并且编码功能蛋白或全长蛋白的分子。更优选的杂交分子是那些在上述条件下与SEQ ID NO：1、3、5、7、9、11、13或15的可读框的互补链杂交的分子。

在本文中使用时，核酸分子，当它与编码其它多肽的污染核酸分子基本上分开时，被称为是“分离的”。

本发明还提供了公开的核酸分子的片段。本文中使用的核酸的片段是指编码或非编码序列的一小部分。片段的大小取决于使用的目的。例如，如果希望选择的片段能够编码蛋白的活性部分，则片段必须足够大到编码蛋白的功能区。例如，可以准备出这样的片段，它们编码的肽对应于预测的抗原区域。如果片段被用做核酸探针或PCR引物，那么片段的长度可以选择在探测/引发获得相对小量的假阳性(参见G部分的讨论)。

用作探针或特异性引物进行聚合酶链反应(PCR)、或用来合成编码本发明蛋白的基因序列的本发明核酸分子的片段(即合成的寡核苷酸)，可以容易地通过化学技术合成，例如Matteucci等((1981)J.Am.Chem.Soc.103：3185-3191)的亚磷酰胺方法或使用自动化合成方法。此外，较大的DNA片段可以通过众所周知的方法容易地制备，例如合成一组代表基因的不同模块区段的寡核苷酸，然后将寡核苷酸进行连接来构建完整的被修饰的基因。

本发明的核酸分子还可以被修饰，使其包含可检测的标记，用于诊断和探测目的。各种这样的标记在本技术领域内是广为人知的，可以容易地与本文描述的编码分子一起使用。合适的标记包括但不限于生物素、放射性标记或荧光标记的核苷酸等。专业技术人员可以容易地使用任何这样的标记以获得本发明核酸分子的标记的变体。

C.其它相关核酸分子的分离

如上所述，具有SEQ ID NO：1、3、5、7、9、11、13或15的核酸分子的鉴定和表征，可以使专业技术人员分离出编码除本文所述序列之外的其他蛋白家族成员的核酸分子。此外，本文公开的核酸分子使得专业技术人员可以分离出编码除SEQ ID NO：2、4、6、8、10、12、14或16蛋白之外的其他蛋白家族成员的核酸分子。

例如，专业技术人员可以容易地使用SEQ ID NO：2、4、6、8、10、12、14或16的氨基酸序列来产生抗体探针，以筛选从适当的细胞制备的表达文库。一般来说，来自用纯化的蛋白免疫(如下文描述)的哺乳动物例如兔的多克隆抗血清或单克隆抗体，可以被用来探测哺乳动物的cDNA或基因组表达文库，例如λgtll文库，以获得适合的为蛋白家族的其它成员编码的序列。克隆的cDNA序列可以表达成融合蛋白，使用自身的控制序列直接表达，或通过使用适合表达酶的特定宿主的控制序列的构建物表达。

另外，本文描述的编码序列的一部分可以被合成并用作探针从任何哺乳动物中找到编码该蛋白家族的成员的DNA。制备含有大约18-20个核苷酸的寡聚体(编码大约6-7个氨基酸跨度)并用来筛选基因组DNA或cDNA文库，在严紧条件或足够消除过度的假阳性水平的严紧条件下获得杂交。

此外，寡核苷酸引物对可以被制备，用在PCR中以选择性地克隆编码的核酸分子。使用这样的PCR引物的PCR变性/退火/延伸循环在本领域内是众所周知的，并可以容易地被调整而适用于分离其它的编码核酸分子。

编码蛋白家族的其它成员的核酸分子也可以使用任何可获得的计算方法在现有的基因组或其它序列信息中鉴定，这些方法包括但不限于：PSI-BLAST(Altschul等(1997)，Nucl.Acids Res.25：3389-3402)，PHI-BLAST(Zhang等(1998)，Nucl.Acids Res.26：3986-3990)，3D-PSSM(Kelly等(2000)，J.Mol.Biol.299：499-520)，以及其它的计算分析方法(Shi等(1999)，Biochem.Biophys.Res.Commun.262：132-138和Matsunami等(2000)，Nature 404：601-604)。

D.含有核酸分子的rDNA分子

本发明还提供含有编码序列的重组DNA分子(rDNAs)。本文中使用的rDNA分子是指已经在原位进行分子操作的DNA分子。产生rDNA分子的方法在本领域是众所周知的，例如参见Sambrook等，分子克隆实验指南(第三版)，冷泉港实验室出版社，冷泉港，NY，2001。在优选的rDNA分子中，编码的DNA序列与表达控制序列和/或载体序列是可操作地连接的。

正如本领域内所熟知的，选择本发明的蛋白家族编码序列可操作地连接的载体和/或表达控制序列，直接依赖于所需的功能性质，如蛋白表达，以及待转化的宿主细胞。本发明考虑的载体至少能够指导rDNA分子中包含的结构基因复制或插入到宿主染色体中，优选也能够表达。

用于调控可操作地连接的蛋白编码序列表达的表达控制元件在本领域内是广为人知的，包括但不限于诱导型启动子、组成型启动子、分泌信号和其它调控元件。在优选情况下，诱导型启动子容易控制，例如对于宿主细胞培养基中的营养具有反应性。

在一个实施方案中，含有编码核酸分子的载体将包括原核的复制子、即能够指导转化的原核宿主细胞如细菌宿主细胞中染色体之外的重组DNA分子自主复制和维持的DNA序列，这样的复制子在本领域内是众所周知的。此外，包含了原核复制子的载体也可以包含基因，该基因的表达产生可检测的标记，例如药物抗性。典型的细菌药物抗性基因是对氨苄青霉素、卡那霉素、氯霉素或四环素产生抗性的基因。

包含原核复制子的载体还可以包括原核的或噬菌体的启动子，它能够指导编码基因序列在细菌宿主细胞如大肠杆菌中的表达(转录和翻译)。启动子是由DNA序列形成的表达控制元件，它允许RNA聚合酶结合并转录。与细菌宿主相容的启动子序列一般在质粒载体中提供，这些载体含有方便的限制性酶切位点用于插入本发明的DNA区段。典型的这种载体质粒是来自BioRad实验室(Richmond，CA)的pUC8、pUC9、pBR322和pBR329以及来自Pharmacia(Piscataway，NJ)的pPL和pKK223。

与真核细胞相容，优选与脊椎动物细胞相容的表达载体也可以用于形成含有编码序列的rDNA分子。真核细胞表达载体，包括病毒载体，在本领域内是广为人知的，可以从几个商业来源获得。一般来说，这些载体都含有方便的限制性酶切位点用于插入所需的DNA区段。这些载体中典型的是pSVL和pKSV-10(Pharmacia)、pBPV-1/pML2d(International Biotechnologies，Inc.)、pTDT1(ATCC，#31255)，本文描述的pCDM8等真核表达载体。如果需要，载体可以被修饰，以包含组织特异性的启动子。

用于构建本发明的rDNA分子的真核细胞表达载体还可以包含在真核细胞中有效的选择性标记，优选为药物抗性选择标记。优选的药物抗性标记是基因表达后产生新霉素抗性的基因，即新霉素磷酸转移酶(neo)基因(Southern等(1982)，J.Mol.Anal.Genet.1：327-341)。另外，选择性标记可以存在于不同的质粒上，两个载体通过对宿主细胞的共转染被导入，并通过在适当的选择性标记的药物中培养来筛选。

E.含有外部提供的编码核酸分子的宿主细胞

本发明还提供用编码本发明蛋白的核酸分子转化的宿主细胞。宿主细胞可以是原核的也可以是真核的。对可用于表达本发明蛋白的真核细胞没有限制，只要细胞系与细胞培养方法相容，及与表达载体的增殖和基因产物的表达相容。优选的真核宿主细胞包括但不限于酵母、昆虫和哺乳动物细胞，优选脊椎动物细胞，例如来自小鼠、大鼠、猴子或人类细胞系的细胞。优选的真核宿主细胞包括可从ATCC以CCL61编号获得的中国仓鼠卵巢(CHO)细胞、可从ATCC以CRL1658编号获得的NIH瑞士小鼠胚胎细胞(NIH/3T3)、幼仓鼠肾细胞(BHK)等真核组织培养细胞系。

任何原核的宿主都可以被用来表达编码本发明蛋白的rDNA分子。优选的原核宿主是大肠杆菌。

适当的细胞宿主用本发明rDNA分子转化可以通过众所周知的方法来完成，这些方法一般依赖于使用的载体类型和所用的宿主系统。对于原核宿主细胞的转化，通常使用电穿孔和盐处理的方法(参见，例如，Cohen等(1972)，Proc.Natl.Acad.Sci.USA 69：2110；和Sambrook等，同上)。对于用含有rDNAs的载体转化脊椎动物细胞，典型地使用电穿孔、阳离子脂或盐处理的方法，参见，例如，Graham等(1973)，Virol.52：456；Wigler等(1979)，Proc.Natl.Acad.Sci.USA 76：1373-1376。

成功转化的细胞，即含有本发明rDNA分子的细胞，可以用众所周知的包含用选择性标记进行筛选的技术来鉴定。例如，导入了本发明rDNA后获得的细胞可以被克隆以产生单菌落。从那些菌落获得的细胞可以被收获、裂解，其DNA内含物可以使用例如Southern，(1975)J.Mol.Biol.98：503或Berent等，(1985)Biotech.3：208中描述的方法来检测rDNA的存在，或通过免疫的方法分析细胞产生的蛋白。

F.使用rDNA分子生产重组蛋白

本发明还提供了使用本文描述的核酸分子生产本发明蛋白的方法。一般来说，生产重组形式的蛋白通常包括下面的步骤：

首先，获得编码本发明蛋白的核酸分子，诸如包括，基本上组成或组成为下列序列的核酸分子：SEQ ID NO：1、3、5、7、9、11、13或15，或SEQ ID NO：1的390-4883或390-4880位核苷酸，SEQ ID NO：3的12-4907或12-4904位核苷酸，或SEQ ID NO：5的424-1911或424-1908位核苷酸，或SEQ ID NO：7的405-1838或405-1835位核苷酸，或SEQ ID NO：9的89-1153或89-1150位核苷酸，或SEQ ID NO：11的223-1572或223-1569位核苷酸，或SEQ ID NO：13的418-1395或418-1392位核苷酸，或SEQ ID NO：15的271-1434或271-1431位核苷酸。如果编码序列没有被内含子打断，正如这些可读框，它直接适合于在任何宿主中表达。

然后，在优选情况下，如上所述，将核酸分子与适当的控制序列可操作地连接，以形成含有蛋白可读框的表达单位。表达单位被用来转化适当的宿主，转化的宿主在允许重组蛋白生产的条件下进行培养。任选地，重组蛋白也可以从培养基或细胞中分离出来；在某些情况下，当一些杂质可以被允许时，蛋白可以不必回收和纯化。

前面的每个步骤都可以以各种多种方式进行。例如，所需的编码序列可以从基因组片段获得，并直接在适当的宿主中使用。使用前面提到的适当的复制子和控制序列，可以构建出在各种不同宿主中可以操作的表达载体。控制序列、表达载体和转化方法依赖于用于表达基因的宿主细胞的类型，在前面已经详细讨论过。适当的限制性酶切位点，如果不能正常获得，可以加到编码序列的末端从而提供可切割的基因以插入到这些载体中。专业技术人员可以容易地调整任何本领域所熟知的宿主/表达系统，以使用本发明核酸分子生产重组蛋白。

G.调节编码与癌症相关基因的核酸表达的试剂的鉴定方法

本发明的另一个实施方案提供了鉴定试剂的方法，所述试剂调节编码本发明的蛋白，例如具有SEQ ID NO：2、4、6、8、10、12、14或16的氨基酸序列的蛋白的核酸表达。这样的检测可以利用任何可用的监测本发明核酸的表达水平变化的方法。如本文所述，如果试剂能够在细胞中上或下调节本发明核酸的表达，则它就被称为调节核酸的表达。

在一种分析方法中，可以制备含有报告基因融合体的细胞系，这些融合体是在SEQ ID NO：1的390-4883位核苷酸、SEQ ID NO：3的12-4907位核苷酸、SEQ ID NO：5的424-1911位核苷酸、SEQ ID NO：7的405-1838位核苷酸、SEQ ID NO：9的89-1153位核苷酸、SEQ IDNO：11的223-1572位核苷酸、SEQ ID NO：13的418-1395位核苷酸、SEQ ID NO：15的271-1434位核苷酸所确定的可读框中的核苷酸和/或5’和/或3’调控元件与任何可检测的融合配体之间进行融合的。有大量可检测的融合配体是已知的并容易获得，包括萤火虫荧光素酶基因和编码氯霉素乙酰转移酶的基因(Alam等(1990)，Anal.Biochem.188：245-254)。含有报告基因融合体的细胞系然后在适当的条件和时间下暴露于测试试剂。暴露于试剂的样品和对照样品之间报告基因的差异表达，可以鉴定能够调节本发明的核酸表达的试剂。

其它的分析方法可以用来监测试剂调节编码本发明蛋白的核酸表达的能力，例如具有SEQ ID NO：2、4、6、8、10、12、14或16的蛋白。例如，mRNA表达可以通过与本发明的核酸进行杂交来直接监测。细胞系在适当的条件和时间下暴露于测试试剂，通过标准的程序，例如那些在Sambrook等，分子克隆实验指南(第三版)，冷泉港实验室出版社，冷泉港，NY，2001中公开的程序，分离出总RNA或mRNA。

优选的细胞是来自人组织的细胞，例如活检组织或来自癌症病人的培养细胞。可以使用的细胞系例如ATCC胸导管癌细胞系(目录号CRL-2320，CRL-2338和CRL-7345)、ATCC结肠直肠腺癌细胞系(目录号CCL-222、CCL-224、CCL-225、CCL-234、CRL-7159和CRL-7184)、ATCC肾透明细胞癌细胞系(目录号HTB-46和HTB-47)、ATCC肾细胞腺癌细胞系(目录号CRL-1611、CRL-1932和CRL-1933)、ATCC肝细胞癌细胞系(目录号CRL-2233、CRL-2234和HB-8065)、ATCC肺腺癌细胞系(目录号CRL-5944、CRL-7380和CRL-5907)、ATCC淋巴细胞系(目录号CRL-7936、CRL-7264和CRL-7507)、ATCC卵巢腺癌细胞系(目录号HTB-161、HTB-75和HTB-76)、ATCC胰腺腺癌细胞系(目录号CRL-1687、CRL-2119和HTP-79)、前列腺腺癌细胞系(目录号CRL-1435、CRL-2422和CRL-2220)以及ATCC胃腺癌细胞系(目录号CRL-1739、CRL-1863和CRL-1864)。此外，其它可以获得的细胞或细胞系也可以使用。

可以从本发明的核酸制备用于检测暴露于试剂的细胞和对照细胞之间RNA表达水平的差异的探针。优选的但不是必需的，设计在高度严紧的条件下只与靶核酸杂交的探针。在高度严紧的条件下只有高度互补的核酸杂交体才能形成。因此，分析条件的严紧性决定了两个核酸链之间为了形成杂交体应该存在的互补性的程度。应该选择使探针：靶杂交体和探针：非靶杂交体之间的稳定性差异最大的严紧条件。

探针可以通过本领域现有的方法根据本发明的核酸来设计。例如，探针的G+C含量和探针的长度可以影响探针与它的靶序列的结合。优化探针特异性的方法一般可以从Sambrook等，同上或Ausubel等，Short Protocols in Molecular Biology，第四版，John Wiley & Sons，Inc.，New York，1999中获得。

针对每个探针的需要可以使用现有的方法对杂交条件进行修改，例如Sambrook等和Ausubel等中描述的方法。总细胞RNA或富集polyARNA的RNA的杂交可以通过任何可用的方式来进行。例如，总细胞RNA或富集polyA RNA的RNA可以被固定到固相支持物上，然后在探针可以特异性杂交的条件下将固相支持物暴露于至少一个含有至少一个或部分本发明的序列的探针。此外，含有至少一个或部分本发明的序列的核酸片段可以被固定到固相支持物上，例如硅片、多孔玻璃片或膜上。然后在固定的序列可以特异性杂交的条件下将固相支持物暴露于来自样品的总细胞RNA或polyA RNA。这样的固相支持物和杂交方法可以广泛获得，例如Beattie，(1995)WO 95/11755中所公开的那些。通过测定给定的探针与来自未处理的细胞群的RNA样品和暴露于试剂的细胞群的RNA样品之间特异性杂交的能力，可以鉴定能够对编码SEQ ID NO：2、4、6、8、10、12、14或16序列蛋白的核酸的表达具有上或下调控的试剂。

用于mRNAs的定性和定量分析的杂交也可以通过使用RNA酶保护分析方法(即RPA，参见Ma等(1996)，Methods 10：273-238)来进行。简单地说，含有编码基因产物的cDNA和噬菌体特异的DNA依赖性RNA聚合酶启动子(例如T7、T3或SP6 RNA聚合酶)的表达载体在cDNA的3’末端、噬菌体启动子的下游被线性化，其中这样的线性化分子随后被用做模板通过体外转录合成标记的cDNA反义转录本。标记的转录本然后与分离的RNA(即总的或分级的mRNA)的混合物杂交，杂交条件为在含有80％甲酰胺、40mM PIPES、pH6.4、0.4M NaCl和1mM EDTA的缓冲液中于45℃保温过夜。然后在含有40μg/ml核糖核酸酶A和2μg/ml核糖核酸酶的缓冲液中将得到的杂交体消化。在外源的蛋白失活并抽提之后，样品在尿素/聚丙烯酰胺凝胶上上样分析。

在另一种分析方法中，为了鉴定影响即时基因产物表达的试剂，首先鉴定在生理学上表达本发明的基因产物的细胞或细胞系。这样鉴定的细胞和/或细胞系预测含有必需的细胞机制，以至于对通过适当的表面转导机制和/或胞质级联接触外源的试剂而言，都能够维持转录元件的调节忠实性。此外，将这样的细胞或细胞系用表达载体(例如质粒或病毒载体)构建物转导或转染，该构建物含有结构基因的可操作的含有启动子的5’非翻译末端，所述结构基因编码融合到一个或多个抗原性片段的即时基因产物，所述抗原片段对即时基因产物是特异性的，其中该片段处于该启动子的转录控制之下，表达为其分子量可以与天然存在的多肽区别开的多肽，该多肽也可以含有具有免疫性的可以区别的标记或其它可检测的标记。这样的方法在本领域内是公知的(参见Sambrook等，同上)。

通过上述方法转导或转染的细胞或细胞系然后在适当的条件下与试剂接触。例如，存在于可药用的赋形剂中的试剂与细胞在水性生理缓冲液中接触，例如生理pH的磷酸盐缓冲液(PBS)、生理pH的Eagles平衡盐缓冲液(BSS)、含有血清的PBS或BSS、或含有PBS或BBS和/或血清的条件培养基，在37℃保温。本领域的专业技术人员可以根据需要对该条件进行调整。在细胞与试剂接触后，将该细胞破碎，对裂解液中的多肽进行分级，以便使多肽级分合并，并与抗体接触，通过免疫分析方法(例如ELISA、免疫沉淀或Western印迹)进行进一步处理。从“接触了试剂”的样品中分离到的蛋白合并液将与只用赋形剂接触细胞的对照样品进行比较，“接触了试剂”的样品与对照相比通过免疫技术产生的信号的增加或减少将被用来辨别试剂的效果。

H.调节癌症相关蛋白的水平或至少一种活性的试剂的鉴定方法

本发明的另一个实施方案提供了试剂的鉴定方法，所述试剂调节本发明的蛋白，例如具有SEQ ID NO：2、4、6、8、10、12、14或16氨基酸序列的蛋白的水平或至少一种活性。这样的方法或分析可以使用任何监测或检测所需活性的手段，并对于鉴定治疗癌症的试剂特别有用。

在一种方法中，可以分析已经暴露于待测试剂的细胞群落与未暴露的对照细胞群落之间本发明蛋白的相对量。在这种方法中，探针例如特异性抗体被用来监测蛋白在不同细胞群落中的差异表达。细胞系或群落在适当的条件和时间下被暴露于待测试剂。从暴露的细胞系或群落和对照的未暴露的细胞系或群落制备细胞裂解液。然后用探针分析细胞裂解液。

抗体探针通过适当的免疫方案免疫适当的哺乳动物宿主而制备，免疫使用本发明的肽、多肽或蛋白，只要它们有足够的长度，或者如果希望或如果需要增强免疫原性，可以与适当的载体相连。制备带有载体如BSA、KLH或其它载体蛋白的免疫连接物(conjugate)的方法在本技术领域是现成的。在某些情况下，使用例如碳二亚胺试剂进行直接连接可能是有效的；在其它的情况下，连接试剂例如那些PierceChemical Co.(Rockford，IL)所提供的试剂，在提供对半抗原的可接近性方面可能是令人满意的。例如，半抗原肽可以在氨基或羧基末端用半胱氨酸残基延伸，或用半胱氨酸残基间插其中，以方便载体的连接。免疫原的给药一般通过在一段适当的时期内注射来进行，并使用适当的佐剂，正如本领域所通常理解的那样。在免疫计划期间，测定抗体的滴度以确定抗体的形成是足够的。

尽管对于某些应用来说，通过这种方法生产的多克隆抗血清是令人满意的，但对于药物组合物来说，使用单克隆的制备物是优选的。分泌所需的单克隆抗体的无限增殖的细胞系可以使用Kohler和Milstein((1975)Nature 256：495-497)的标准方法或造成淋巴细胞或脾细胞无限增殖的修饰方案来制备，正如通常所公知的那样。分泌所需抗体的无限增殖细胞系通过免疫分析进行筛选，其中的抗原是肽半抗原、多肽或蛋白。当分泌所需抗体的适当的无限增殖细胞培养物被鉴别后，细胞可以在体外培养或在腹水中生产。

然后从培养液上清液或腹水上清液中回收所需的单克隆抗体。含有具有免疫重要(抗原结合的)部分的单克隆抗体片段或多克隆抗血清可以被用做拮抗剂，完整的抗体也可以。通常情况下，使用免疫反应性(抗原结合)的抗体片段，例如Fab、Fab’或F(ab’)₂片段是优选的，特别是在治疗过程中，因为这些片段一般比完整的免疫球蛋白具有更少的免疫原性。

抗体或抗原结合片段也可以使用现有的技术通过重组的方法生产。与蛋白所需区域特异性结合的抗体区域也可以以具有多个物种来源的嵌合体的方式来生产，例如人源化抗体。

在上述方法中分析的试剂可以随机选择或合理选择或设计。用于本文中时，当试剂是被随机地选择而不考虑参与单独结合本发明的蛋白或与其相关底物、结合配体等一起结合的特定序列时，被称为是随机选择的。随机选择试剂的例子是使用化学文库或肽组合文库，或生物体的生长培养液。

在本文中使用时，当试剂的选择是在非随机的基础上进行，考虑其与试剂作用的靶位点序列和/或其构象时，被称为是合理选择或设计的。试剂可以通过利用组成这些位点的肽序列来合理选择或合理设计。例如，合理选择的肽试剂可以是一个氨基酸序列与任何功能性保守位点一致或从其衍生的肽。

本发明的试剂可以是，例如肽、小分子、维生素衍生物以及碳水化合物。显性负调节蛋白(dominant negative proteins)，编码这些蛋白的DNA，针对这些蛋白的抗体，这些蛋白的肽片段或这些蛋白的模拟物，都可以导入到细胞中以影响功能。此处使用的“模拟”是指对肽分子的一个或几个区域进行修饰，以提供与亲本肽在化学上不同但在拓扑学和功能上相似的结构(参见Grant：分子生物学和生物技术， Meyers编辑，659-664页，VCH Publishers，Inc.，New York，1995)。专业技术人员可以容易地认识到对本发明的试剂的结构特性没有限制。

本发明的肽试剂可以使用标准的固相(或液相)肽合成方法来制备，这在本领域内是公知的。此外，编码这些肽的DNA可以使用可商业获得的寡核苷酸合成仪合成，并可以使用标准的重组子生产系统重组地生产。如果要包括非基因编码的氨基酸，就必须使用固相肽合成来生产。

本发明的另一类试剂是与本发明蛋白的关键位置，例如细胞质结构域、间隔区结构域、α-螺旋卷曲-卷曲结构域或受体结构域具有免疫反应性的抗体，正如本文描述的那样。通过用含有预计被抗体靶向的那些蛋白部分作为抗原区的肽免疫适当的哺乳动物对象，可以获得抗体试剂。

I.调节与癌症相关的蛋白的表达或至少一种活性的试剂的应用

正如实施例中提供的那样，本发明的蛋白和核酸，例如具有SEQID NO：2、4、6、8、10、12、14或16氨基酸序列的蛋白，在癌组织中是差异表达的。上调或下调或调整蛋白的表达或蛋白的至少一种活性的试剂，例如激动剂或拮抗剂，可以用来调节与蛋白的功能和活性相关的生物或病理过程。这包括鉴定的使用本发明的同源物或类似物试剂。

本文中使用的对象可以是任何哺乳动物，只要该哺乳动物需要调整由本发明蛋白介导的病理或生物过程。术语“哺乳动物”被定义为属于哺乳动物纲的个体。本发明在治疗人类对象中特别有用。

病理过程是指一类产生有害影响的生物过程。例如，本发明蛋白的表达可能与细胞生长或异常增生相关。在本文中使用时，当试剂降低病理过程的程度或严重性时，它被称为缓解该病理过程。例如，通过施用以某种方式上调或下调或缓解本发明蛋白的表达或至少一种活性的试剂，可以防止癌症或缓解疾病的发展。

本发明的试剂可以单独提供，也可以与其它缓解特定病理过程的试剂组合在一起。例如，本发明的试剂可以与其它现有的药物共同给药。在本文中，当两种试剂同时给药或以一种使试剂在同一时间发生作用的方式独立地给药时，它们被称为组合给药。

本发明的试剂可以通过肠胃外、皮下、静脉内、肌内、腹膜内、透皮或含服的途径给药。另外或同时地，给药也可以通过口服。给药的剂量依赖于接受者的年龄、健康状况和体重，同时治疗的种类，如果有的话，治疗的频率和所希望的效果。

本发明还提供了含有一种或多种调整本发明蛋白的表达或至少一种活性的组合物。因为个体的需要是不同的，确定每个成分的有效量的最适范围属于本领域的技术。通常的剂量包括每公斤体重0.1到100μg。优选的剂量为每公斤体重0.1到10μg。最优选的剂量为每公斤体重0.1到1μg。

除了药理活性试剂外，本发明的组合物还可以含有适当的可药用的载体，包括可以方便使活性化合物加工成制剂的赋形剂和辅助剂，该制剂在药学上可用于将活性成分投送到作用位点。适合的肠胃外给药的剂型包括水溶形式的活性化合物的水溶液，例如水溶性的盐。此外，活性化合物的悬浮液也可以适当的油状注射悬浮液形式给药。适合的亲脂溶剂或载体包括脂肪油，例如芝麻油，或合成的脂肪酸酯，例如油酸乙基酯或甘油三酯。水性注射悬浮液可以含有增加悬浮液粘度的物质，包括例如羧甲基纤维素钠、山梨醇和/或葡聚糖。任选地，悬浮液也可以含有稳定剂。脂质体也可以用来封装试剂以投送到细胞内。

本发明用于全身给药的药物剂型可以为肠内、非肠胃或局部给药。事实上，所有三种类型的剂型可以同时使用以完成活性成分的全身给药。

合适的口服剂型包括硬的或软的胶囊、药丸、药片、包括糖衣片、酏剂、悬浮液、糖浆或其吸入剂和可控制释放的形式。

在实施本发明的方法时，本发明的化合物可以单独使用或组合使用，或与其它的治疗或诊断试剂结合使用。在某些优选实施方案中，本发明的化合物可以与按照一般接受的医学规范(generally acceptedmedical practice)为这些疾病开出的其它化合物共同给药。本发明的化合物可以在体内使用，一般在哺乳动物中，例如人、绵羊、马、牛、猪、狗、猫、大鼠和小鼠，也可以在体外使用。

J.鉴定结合配体的方法

本发明的另一个实施方案提供了分离和鉴定本发明蛋白的结合配体的方法。一般来说，在允许潜在的结合配体与本发明的蛋白结合的条件下，将本发明的蛋白与潜在的结合配体或细胞的提取液或级分混合。混合后，从混合物中分离出已经与本发明的蛋白结合的肽、多肽、蛋白或其它分子。然后取出与本发明的蛋白结合的结合配体并进行进一步分析。为了鉴定和分离结合配体，可以使用完整的蛋白，例如含有SEQ ID NO：2、4、6、8、10、12、14或16完整氨基酸序列的蛋白。此外，蛋白的片段也可以使用。

本文使用的细胞提取液是指从裂解或破碎的细胞制成的制备液或级分。优选的细胞提取液的来源是从人类肿瘤或转化的细胞衍生的细胞，例如癌的活检组织或组织培养细胞。此外，细胞提取液也可以从正常的组织或可获得的细胞系制备。

有多种方法可用于获得细胞的提取液。细胞可以使用物理或化学的破碎方法破碎。物理破碎方法的实施例包括但不限于超声和机械剪切。化学裂解方法的实例包括但不限于去污剂裂解和酶法裂解。专业技术人员可以容易地调整制备细胞提取液的方法，以获得用于本方法的提取液。

一旦制备了细胞的提取液，将提取液在蛋白可以与结合配体结合的条件下与本发明的蛋白混合。可以使用多种不同的条件，最优选的条件是近似人细胞细胞质中的条件。例如所用的细胞提取液的渗透性、pH、温度和浓度等一些特性，可以被改变以使蛋白与结合配体的结合最优化。

在适当的条件下混合后，结合的复合物与混合物分开。有多种技术可用于分离混合物。例如，特异性针对本发明蛋白的抗体可以被用来对结合配体复合物进行免疫沉淀。此外，标准的化学分离技术例如层析技术和密度/沉降离心也可以使用。

在除去了提取液中发现的不结合的细胞成分后，可以使用常规的技术将结合配体从复合物上解离。例如，可以通过改变混合物的盐浓度或pH来实现解离。

为了帮助从混合的提取液中分离结合的结合配体，可以将本发明的蛋白固定化在固相支持物上。例如，蛋白可以连接在硝酸纤维素基质或丙烯酸珠子上。将蛋白连接在固相支持物上有助于使肽/结合配体对与提取液中发现的其它成分分离开来。鉴定的结合配体可以是单一的蛋白，也可以是由两个或多个蛋白组成的复合物。此外，结合配体也可以按照Takayama等(1997)，Methods Mol.Biol.69：171-184或Sauder等(1996)，J.Gen.Virol.77：991-996的程序使用Far-Western分析方法鉴定，或通过使用抗原决定簇标记的蛋白或GST融合蛋白来鉴定。

此外，本发明的核酸分子可以用在酵母双杂交系统或其它的体内蛋白-蛋白检测系统中。酵母双杂交系统已经被用来鉴定其它的蛋白配体对，并可以被容易地调整以利用本文描述的核酸分子。

K.癌症相关蛋白的结合配体的应用

使用上述的方法获得的本发明蛋白的结合配体及其同源物和类似物，一旦分离后，可以用于各种不同的目的。使用本领域的现有技术，结合配体可以用于生产与结合配体结合的抗体。与结合配体结合的抗体可用于分析本发明的蛋白的活性，作为治疗试剂缓解由本发明的蛋白介导的生物或病理过程，或用于纯化结合配体。这些应用将在后面详细描述。

L.阻断结合配体和癌症相关蛋白之间结合的试剂的鉴定方法

本发明的另一个实施方案提供鉴定减小或阻断本发明蛋白与结合配体结合的试剂的方法。具体来说，本发明的蛋白在存在或不存在待测试剂的情况下与结合配体混合。在允许蛋白结合的条件下混合后，两种混合物被分析和比较，以确定试剂是否减小或阻断了本发明的蛋白与结合配体的结合。当存在于含有待测试剂的样品中的结合量减少时，就鉴定到了减小或阻断本发明的蛋白与结合配体结合的试剂。

在本文中，当试剂的存在减小结合配体与本发明蛋白结合的程度或阻止了该结合时，该试剂被称为减小或阻断了本发明的蛋白与结合配体之间的结合。一类试剂通过与结合配体结合减小或阻断了该结合，而另一类试剂通过与本发明的蛋白结合减小或阻断了该结合。

用于上述分析方法的结合配体可以是与本发明蛋白结合的分离和充分表征的蛋白或部分表征的蛋白，也可以是已经被鉴定存在于细胞提取液中的结合配体。对于本领域的专业人员来说，显然只要结合配体的特征是可鉴定的性质，例如分子量，现有分析方法就可以使用。

上述方法中分析的试剂可以随机选择或合理选择或设计。这里所说的试剂随机选择是指试剂被随机地选择，不考虑参与本发明的蛋白与结合配体结合的具体序列。随机选择的试剂的例子是使用化学文库或肽组合文库，或生物体的生长培养液。

这里所说的试剂合理选择或设计是指试剂在非随机的基础上选择，考虑与试剂作用相关的靶位点的序列和/或其构象。利用组成结合配体和本发明蛋白的接触位点的肽序列可以合理选择或合理设计试剂。例如，合理选择的肽试剂可以是其氨基酸序列与本发明的蛋白在结合配体上的接触位点一致的肽。这样的试剂通过与结合配体的结合将减小或阻断本发明的蛋白与结合配体的结合。

本发明的试剂可以是例如肽、小分子、维生素衍生物以及碳水化合物。本领域的专业人员可以容易地认识到对本发明的试剂的结构特性没有限制。

本发明的一类试剂是肽试剂，其氨基酸序列在本发明蛋白的氨基酸序列的基础上选择。本发明的肽试剂可以使用本领域现有的标准固相(或液相)肽合成方法来制备。此外，编码这些肽的DNA可以使用商用的寡核苷酸合成仪合成，或使用标准的重组子生产系统重组地生产。如果要包括非基因编码的氨基酸，就必须使用固相肽合成来生产。

本发明的另一类试剂是与本发明的蛋白或结合配体的关键位置具有免疫反应性的抗体。如上所述，通过用含有预测被抗体靶向的那些本发明的蛋白部分或结合配体作为抗原区免疫适当的哺乳动物对象，可以获得抗体。关键区域包括参与本发明的蛋白与结合配体结合的接触位点。

正如下面讨论的，涉及本发明蛋白活性的重要的最小残基序列定义了功能性线性结构域，可以有效地用做诱饵，用于双杂交筛选和潜在结合分子的鉴定。与使用全长分子相反，使用这样的片段将显著地增加筛选的特异性，因此是优选的。同样地，线性序列也可以用作亲和基质，使用生物化学亲和纯化策略来分离结合的蛋白。

M.阻断结合配体与癌症相关蛋白之间结合的试剂的应用

如同在实施例中提供的那样，本发明的蛋白和核酸，例如具有SEQID NO：2、4、6、8、10、12、14或16的氨基酸序列的蛋白，在癌组织中是差异表达的。减小或阻断本发明蛋白与结合配体的相互作用的试剂，包括那些使用本发明蛋白的同源物和类似物而得以鉴定的试剂，可以用来调节与蛋白的功能和活性相关的生物或病理过程。

本文中使用的对象可以是任何哺乳动物，只要该哺乳动物需要调节由本发明的蛋白介导的病理或生物过程。术语“哺乳动物”是指属于哺乳动物纲的个体。本发明在治疗人对象中特别有用。

病理过程是指一类产生有害影响的生物过程。例如，本发明蛋白的表达可能与细胞生长或异常增生相关。在本文中使用时，当试剂减少病理过程的程度或严重性时，该试剂被称为缓解了该病理过程。例如，通过施用减小或阻断本发明蛋白与结合配体的相互作用的试剂，可以防止癌症或缓解疾病的发展。

本发明的试剂可以通过肠胃外、皮下、静脉内、肌内、腹膜内、透皮或含服的途径给药。另外或同时地，给药也可以通过口服。给药的剂量依赖于接受者的年龄、健康状况和体重，同时治疗的种类，如果有的话，以及治疗的频率和所希望的效果。

本发明还提供了含有一种或多种阻断本发明蛋白与结合配体结合的试剂的组合物。因为个体的需要是不同的，确定每个成分的有效量的最适范围属于本领域的技术。典型的剂量包括每公斤体重0.1到100μg。优选的剂量为每公斤体重0.1到10μg。最优选的剂量为每公斤体重0.1到1μg。

除了药理活性试剂外，本发明的组合物还可以含有适当的可药用的载体，包括可以方便使活性成分加工成制剂的赋形剂和辅助剂，该制剂在药学上可用于将活性成分投送到作用位点。适合的肠胃外给药的剂型包括水溶形式的活性化合物的水溶液，例如水溶性的盐。此外，活性化合物的悬浮液也可以适当的油状注射悬浮液形式给药。适合的亲脂溶剂或载体包括脂肪油，例如芝麻油，或合成的脂肪酸酯，例如油酸乙基酯或甘油三酯。水性注射悬浮液可以含有增加悬浮液粘度的物质，包括例如羧甲基纤维素钠、山梨醇和/或葡聚糖。任选地，悬浮液也可以含有稳定剂。脂质体也可以用来封装试剂以投送到细胞中。

本发明用于全身给药的药物剂型可以为肠内、非肠胃或局部给药剂型。事实上，所有三种类型的剂型可以同时使用以完成活性成分的全身给药。

合适的口服剂型包括硬的或软的胶囊、药丸、药片(包括糖衣片)、酏剂、悬浮液、糖浆或其吸入剂和可控制释放的形式。

在实施本发明的方法时，本发明的化合物可以单独使用或组合使用，或与其它的治疗或诊断试剂结合使用。在某些优选实施方案中，本发明的化合物可以与按照一般接受的医学规范为这些疾病开出的其它化合物共同给药。本发明的化合物可以在体内使用，一般在哺乳动物中，例如人、绵羊、马、牛、猪、狗、猫、大鼠和小鼠，也可以在体外使用。

N.合理的药物设计和组合化学

本发明还包括了合理的药物设计和组合化学。专业人员会认可适当的方法，以使用和实施本发明的方面来鉴定可以开发用于治疗癌症的化合物。涉及多肽的合理的药物设计需要鉴定和限定与设计的药物相互作用的第一个肽，然后使用第一个靶肽确定第二个肽的必要条件。在限定了这些必要条件后，人们可以发现或制备出满足所有或基本上所有的限定的必要条件的适当的肽或非肽。因此，合理药物设计的一个目标是生产目的生物活性多肽的结构或功能类似物，或与它们相互作用的小分子(激动剂、拮抗剂、无效化合物(null compound))，以便形成具有，例如更多或更少的潜在配基形式的药物(参见例如Hodgson(1991)，Bio.Technology 9：19-21)。组合化学是一门整体地而不是一个一个地合成和测试化合物生物活性的科学，其目的在于比以前所能做到地更快和更廉价地发现药物和物质。近年来，由于计算机辅助蛋白模拟和药物发现中方法的改进，合理药物设计和组合化学已经变得更密切相关了。(参见例如美国专利No.4,908,773、5,884,230、5,873,052、5,331,573和5,888,738)。

由于计算机图形学的出现，将分子模拟用做合理药物设计和组合化学的工具已经极大地发展了。它不仅有可能在计算机屏幕上以三维的方式看见分子，而且有可能研究酶和受体等大分子和待测的合理设计的衍生物分子的相互作用(参见Boorman(1992)，Chem.Eng.News70：18-26)。现在有大量用户友好的软件和硬件可用，实际上所有的制药公司都有计算机模拟研究组致力于合理药物设计。例如，分子模拟公司(Molecular Simulations Inc.( www.msi.com))销售几种复杂精致的程序，可以使用户从氨基酸序列开始，构建出蛋白或多肽的二维或三维模型，将它与其它的二维和三维模型进行比较，并用三维模型实时地分析化合物、药物和肽的相互作用。因此，在本发明的某些实施方案中，软件被用来比较本发明蛋白的区域和与其相互作用的分子(统称为“结合配体”，例如抗蛋白抗体)，以及这些分子的片段或衍生物与其它分子，例如肽、肽模拟物和化学物质，以便能预测和设计治疗的相互作用(参见Schneider(1998)，Genetic Engineering News December，第20页；Tempczyk等(1997)，Molecular Simulations Inc.SolutionsApril；以及Butenhof(1998)，分子模拟公司，分子模拟讨论的案例注解(1998年8月))。

O.基因治疗

在另一个实施方案中，基因治疗可以用做调节与蛋白的功能和活性相关的生物和病理过程的手段。这包括在癌细胞中插入基因构建物，其编码含有SEQ ID NO：2、4、6、8、10、12、14或16的全部或至少部分序列的蛋白，或者该基因构建物也可以含有SEQ ID NO：1、3、5、7、9、11、13或15的全部或部分非编码区，它们与启动子或增强子元件可操作地连接，以便该蛋白的表达导致所述癌症的抑制，以及其中该启动子或增强子元件是调节该基因构建物的启动子或增强子元件。

在描述的构建物中，该蛋白的表达可以由任何适当的启动子指导(例如人巨细胞病毒(CMV)、猴病毒(SV40)或金属硫蛋白的启动子)，并且可以被任何适当的哺乳动物调控元件调控。例如，如果需要，已知优先在神经细胞、T细胞或B细胞中指导基因表达的增强子可以被用来指导表达。可以使用的增强子包括但不限于那些其表达被表征为组织或细胞特异性的增强子。另外，如果LFG1、LFG2、LFG3、LFG4、LFG5或LFG6的基因组克隆被用作治疗构建物(例如，在如上述用本发明的核酸分子通过杂交将其分离后)，调控可以通过同源调控序列介导，或者如果需要，通过来自异源的调控序列，包括上述的任何启动子或调控元件来介导。

将构建物插入到癌细胞中是在体内完成的，例如使用病毒或质粒载体。这样的方法也可以适用于体外使用。因此，本发明的方法可以容易地应用于不同形式的基因治疗中，不论细胞是在离体进行遗传修饰然后施用给宿主中，还是在体内使用包括特别适合于这些治疗的载体的任何多种适当方法进行遗传修饰。

逆转录病毒载体、腺病毒载体、腺相关病毒载体、或对可能参与癌症的细胞(例如上皮细胞)具有适当向性的其它病毒载体，都可以用做治疗基因构建物的基因转移投送系统。有多种用于这种目的的载体已经广为人知(Cozzi PJ等(2002)Prostate，53(2)：95-100；Bitzer M，LauerU.，(2002)Dtsch Med Wochenschr.127(31-32)：1623-1624；Mezzina和Danos(2002)，Trends Genet.8：241-256；Loser等(2002)Curr.Gene Ther.2：161-171；Pfeifer和Verma(2001)，Annu.Rev.Genomics Hum.Genet.2：177-211)。逆转录病毒载体发展得特别完善，已经用于临床(Anderson等(1995)，美国专利No.5,399,346)。非病毒的方法也可以用于将治疗DNA导入预计将遭受癌症的细胞(Jeschke等(20002)Curr.Gene Ther.1：267-278；Wu等(1988)，J.Biol.Chem.263：14621-14624；Wu等(1989)，J.Biol.Chem.264：16985-16987)。例如，基因可以通过脂转染、asialorosonucoid多聚赖氨酸交联、或者较不优选的在外科条件下的显微注射的方法导入到神经元或T细胞中。

对于上述的任何应用方法来说，治疗性核酸构建物优选施加在癌症事件的位点(例如通过注射)。然而，它也可以施加在癌症事件附近的组织中，或施加到为预计将遭受癌症的细胞提供供应的血管上。

P.转基因动物

含有突变、敲除或修饰的基因的转基因动物也包括在本发明中，这些基因对应于SEQ ID NO：1、3、5、7、9、11、13或15的cDNA序列，或编码SEQ ID NO：2、4、6、8、10、12、14或16的多肽序列的可读框，或其具有至少大约3、4、5、6、10、15、20、25、30、35或更多氨基酸残基的连续序列的片段。转基因动物是遗传修饰的动物，其已经通过实验转入了重组、外源或克隆的遗传物质。这样的遗传物质通常被称为“转基因”。转基因的核酸序列，在这种情况下是SEQ ID NO：1、3、5、7、9、11、13或15的形式，可以被整合在基因组中该特定的核酸序列在正常情况下不会被发现的位置，也可以整合在转移基因的正常位置上。转基因的组成为来自同物种的基因组或靶动物物种之外不同物种的基因组的核酸序列。

在某些实施方案中，构建了这样的转基因动物，其中包含SEQ IDNO：1、3、5、7、9、11、13或15的基因的全部或部分被删除。在对应于SEQ ID NO：1、3、5、7、9、11、13或15的基因含有一个或多个内含子的情况下，完整的基因——所有外显子、内含子和调控序列——可以被删除。此外，也可以删除比完整的基因小的部分。例如，可以删除单个的外显子和/或内含子，以产生表达修饰的本发明蛋白的动物。

术语“生殖细胞系转基因动物”是指这样的转基因动物，其中遗传变化或遗传信息被导入了生殖系细胞，从而赋予了转基因动物将遗传信息转移给后代的能力。如果这样的后代事实上具有某些或全部的这种改变或遗传信息，那么它们也是转基因动物。

变化或遗传信息对于受体所属的动物物种可以是外源的，只对受体这个特定的个体是外源的，或者遗传信息也可能已经被受体拥有。在最后这种情况下，改变的或导入的基因可以与天然的基因有不同的表达。

转基因动物可以通过各种不同的方法来产生，包括转染、电穿孔、显微注射、在胚胎干细胞中的基因靶向和重组病毒和逆转录病毒感染(参见例如美国专利No.4,736,866；美国专利5,602,307；Mullins等(1993)，Hypertension 22：630-633；Brenin等(1997)，Surg.Oncol.6：99-110；Recombinant Gene Expression Protocols(Methods in MolecularBiology，第62卷)，Tuan主编，Humana Press，Totowa，NJ，1997)。

许多重组或转基因小鼠可以产生，包括那些表达活化的致癌基因序列(美国专利4,736,866)、表达猴SV40 T-抗原(美国专利No.5,728,915)、缺乏干扰素调控因子1(IRF-1)(美国专利No.5,731,490)、表现出多巴胺能功能障碍(美国专利No.5,723,719)、表达至少一种参与血压控制的人类基因(美国专利No.5,731,489)、表现出与在自然发生的阿茨海默氏病中存在的病症有较高的相似性(美国专利No.5,720,936)、具有降低的介导细胞附着能力(美国专利No.5,602,307)、拥有牛生长激素基因(Clutter等(1996)，Genetics 143：1753-1760)、或能够产生完全的人类抗体反应(McCarthy(1997)，Lancet 349：405)的小鼠。

尽管小鼠和大鼠仍然是大多数转基因实验所选择的动物，在某些情况下优选甚至必须使用另外的动物物种。转基因步骤已经成功地应用在各种非鼠科的动物中，包括绵羊、山羊、猪、狗、猫、猴、黑猩猩、仓鼠、兔、奶牛和豚鼠(参见例如Kim等(1997)，Mol.Reprod.Dev.46：515-526；Houdebine(1995)，Reprod.Nutr.Dev.35：609-617；Petters(1994)，Reprod.Fertil.Dev.6：643-645；Schnieke等(1997)，Science 2782130-2133；和Amoah(1997)，J.Animal Sci.75：578-585)。

将核酸片段导入重组的哺乳动物感受态细胞的方法可以是任何利于多种核酸分子共转化的方法。本领域的专业人员可以容易地获得产生转基因动物的详细步骤，包括在美国专利No.5,489,743和美国专利No.5,602,307中所公开的那些。

Q.诊断方法

因为本发明的基因和蛋白在癌细胞和非癌组织中表达不同，本发明的基因和蛋白可以用于诊断或监测癌症、追踪疾病的进展、或者将癌组织与非癌组织样品区分开来。一种使用本发明的核酸分子或蛋白诊断癌症的方法包括从活的对象中获得组织。

检测本发明的核酸或蛋白分子的分析方法可以采用任何可用的形式。通常分析核酸分子的方法包括基于杂交或PCR的方法。通常检测本发明的蛋白、多肽或肽的分析方法包括使用任何可用形式的抗体探针，例如原位结合分析等(参见Harlow和Lane，抗体-实验室手册，冷泉港实验室出版社，冷泉港，NY，1988)。在优选的实施方案中，分析的进行使用了适当的对照。

一般来说，本发明的诊断可以按照实施方案是基于核酸还是基于蛋白的分析而进行分类。某些诊断分析方法检测促进癌变的本发明的核酸或蛋白的突变或多态性。其它的诊断分析方法鉴定和辨别蛋白活性的缺陷，这是通过检测到待测生物体中本发明的RNA或蛋白水平类似于患有疾病例如癌症的生物体中本发明的RNA或蛋白水平，或检测到待测生物体中本发明的RNA或蛋白水平不同于未患疾病的生物体来进行的。

此外，还考虑到了生产含有下面实施方案中描述的试剂和方法的试剂盒，以便允许快速地检测和鉴定蛋白活性或水平的畸变。诊断试剂盒可以包含核酸探针或抗体或其组合，它们能够特异性检测本发明的蛋白或核酸探针或抗体或其组合的突变形式，可以用于测定一个或多个本发明蛋白的RNA或蛋白表达水平。这些试剂盒的检测成分一般与一种或多种下列试剂共同提供。通常提供能够吸附或结合DNA、RNA或蛋白的支持物。可用的支持物包括硝酸纤维素膜、尼龙膜或衍生的尼龙膜，其特征携有带正电荷的取代基的阵列。在这些试剂盒中也可以提供一种或多种限制性酶、对照试剂、缓冲液、扩增酶、以及非人类的多核苷酸，如小牛胸腺或鲑鱼精子DNA。

有用的基于核酸的诊断技术包括但不限于直接的DNA测序、梯度凝胶电泳、Southern印迹分析、单链确认分析(SSCA)、RNA酶保护分析、斑点印迹分析、核酸扩增、等位基因特异性PCR以及这些方法的组合。这些分析的起始点是从生物样品中分离或纯化核酸。可以预期活检组织将提供良好的样品源。核酸从样品中提取出来，并且可以使用引物通过DNA扩增技术如聚合酶链反应(PCR)得到扩增。本领域的专业人员将会容易地确认可用于证实多态性存在的方法。此外，本领域内现有的任何可寻址的阵列技术都可用于本发明的这个方面。多核苷酸阵列的一个具体的实施方案被称为Genechips^TM，已经在美国专利5,143,854、PCT申请WO 90/15070和92/10092中进行了广泛的描述。

各种各样的标记物和交联技术已为本领域的专业技术人员所熟知，可以用于各种核酸分析方法中。有几种途径可以产生用于杂交或PCR的标记的核酸，包括但不限于寡核苷酸标记、缺刻翻译、末端标记或使用标记核苷酸的PCR扩增。此外，编码本发明蛋白的核酸也可以被克隆到载体中以生产mRNA探针。这样的载体在本领域内是广为人知的，可商业获得的，并可以通过加入适当的RNA聚合酶，例如T7、T3或SP6和标记的核苷酸用来在体外合成RNA探针。许多公司例如Pharmacia Biotech(Piscataway，NJ)、Promega(Madison，WI)和U.S.Biochemical Corp(Cleveland，OH)都为这些方案提供商用试剂盒和方案。适合的报告分子或标记物包括放射性核素、酶、荧光、化学发光或产色素的试剂，以及底物、辅助因子、抑制剂、磁性微粒等。

在优选的基于蛋白的诊断中，本发明的抗体以有序阵列方式连接在支持物上，其中大量的抗体被连接在支持物的不同区域，彼此之间不重叠。本领域专业技术人员会容易地确认可用的基于蛋白的诊断的分析方法。蛋白从生物样品中获得，使用常规的方法标记(例如放射性、化学发光或荧光)。利用标记的已知浓度的本发明蛋白的突变体或野生型标准品，研究人员可以准确地确定样品中本发明的蛋白的浓度，根据这个信息可以评估特定形式蛋白的表达水平。常规的光密度测定方法也可以用来更准确地测定这样的蛋白的浓度或表达水平。这些方法也容易使用本领域的专业技术人员熟知的高通量诊断分析技术进行自动化。正如上面详细描述的那样，本领域任何已知的可寻址的阵列技术也可以用于本发明的这个方面，并且在芯片上显示蛋白阵列以试图最大化抗体结合样式和诊断信息。

如上面所讨论的，在本发明的基因或蛋白中多态性的存在或检测可以对生物体中的癌症或相似疾病提供诊断。其它的实施方案包括含有检测成分的诊断试剂盒的制备，所述成分例如特异性针对本发明基因或蛋白的具体多态性突变体的抗体。检测成分一般与一种或多种下列试剂组合提供。能够吸附或结合RNA或蛋白的支持物通常被提供。可用于这种目的的支持物包括但不限于硝酸纤维素膜、尼龙膜或衍生的尼龙膜，其特征为携有带正电荷的取代基的阵列，以及Genechips^TM或其等价物。在这些试剂盒中也可以包括一种或多种酶，例如反转录酶和/或Taq聚合酶，以及dNTP、缓冲液或非人类的多核苷酸，如小牛胸腺或鲑鱼精子DNA。试剂盒分析的结果可以由保健提供者或诊断实验室进行解释。此外，诊断试剂盒也可以生产并销售给个人用于自我诊断。

除了根据多态性的存在或不存在诊断疾病之外，一些与癌症相关的疾病是来自特定的组织中本发明的蛋白或基因的水平偏离，或本发明蛋白表达的方式异常。例如，通过监测各种组织中的表达水平，可以进行诊断或可以鉴定疾病的状态。同样地，通过确定在特定组织中各种不同的本发明蛋白的表达水平的比率(例如表达模式)，可以作出健康或疾病的预测。来自健康的个体以及患有癌症的个体的不同组织中本发明蛋白的表达水平被测定。这些数值可以记录在数据库中，并与从测试个体获得的数值进行比较。此外，来自健康的和患病的个体的各种组织中的比率或表达方式都被记录在数据库中。这些分析被称为“疾病状态图谱”，通过比较一个疾病状态图谱(例如来自健康的或患病的个体)与一个来自测试个体的疾病状态图谱，临床医师可以快速地诊断是否存在疾病。

上述的基于核酸和蛋白的诊断技术可用于检测组织中本发明的基因或蛋白表达的水平或量或比率。例如通过定量的Northern印迹、原位分析、免疫组织化学、ELISA、基因芯片阵列技术、PCR和Western印迹，特定的本发明蛋白(野生型或突变体)的RNA或蛋白的表达量或水平可以被快速地测定，并根据这些信息表达的比率可以确定。此外，被分析的本发明的蛋白可以是现在未知的，但是基于它们拥有上述的一个或多个同源区域而被鉴定的家族成员。

可以相信，不用进一步的描述，本领域的普通技术人员就可以使用前面的描述和后面的说明性实施例，制造和使用本发明的化合物并实施被权利要求保护的方法。因此，下面的工作实施例只是具体地指出了本发明的优选实施方案，并不被推论为以任何方式对本公开的剩余部分进行限制。

实施例

实施例1：鉴定癌症中差异表达的mRNA-1

对肿瘤活检和正常组织之间基因表达的整体变化使用Gene Logic，Inc.(Gaithersburg，MD)的GeneExpress Oncology Datasuite^TM进行检测。数据库包括了使用Affymetrix人基因组U95阵列产生的来自不同器官的正常和癌组织样品的基因表达图谱。在数据库的这些组织样品中，分析正常和癌组织组的表达图谱，所述组织组来自乳腺、结肠、食道、肾、肝、肺、淋巴结、卵巢、胰腺、前列腺、直肠和胃。

Affymetrix人基因组U95阵列含有63,175个探针组。探针组是检测一个转录本(基因或cDNA克隆)的一组探针，通常由16-20个寡核苷酸探针对组成。这些探针对包括了完全匹配的组和错配的组，二者对于计算平均差都是必需的。平均差用作转录本表达水平的相对指示器(indicator)，并且是对每个探针对的强度差的度量，通过用完全匹配的强度减去错配的强度而计算。这考虑到了探针对之间杂交的可变性以及能够影响荧光强度的其它杂交假象。使用计算出的平均差值，对每个基因建立了绝对信号(absolute call)：“不存在”(＝没有检测到)、“存在”(＝检测到)或“处于边缘”(＝不清楚是否存在)。

使用下面的统计方法确定癌组织和正常组织样品之间基因的差异表达。(1)对于每个探针组，使用Affymetrix微阵列组(MicroarraySuite)(v4.0)确定平均差值和绝对信号；(2)在一个给定的样品组中，使用MatLab程序(The MathWorks，Inc.，Natick，MA)通过基本成分分析(PCA)检测组织样品中的无关项。在PCA中使用的数据点是随机选择的探针组(5,000～6,000个探针组)的平均差。无关项被排除出进一步的分析；(3)通过使用GeneExpress程序的倍率变化分析工具分析基因表达的变化。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中每个基因的平均差的平均值和正常组织样品组中该基因的平均差的平均值而计算的。获得在表达水平上有至少3倍的增加或减少的基因。如果基因通过方差测试分析(Steel等，Principles and Procedures ofStatistics：A Biometrical Approach( 统计学原理和程序：生物测量方法)，第三版，McGraw-Hill，1997)测定显示出的p-值少于或等于0.05，它们就被包括在分析中；(4)选择至少在5种不同类型癌症中表现出差异表达的基因。

对芯片数据的分析显示出标记物LFG1的表达在癌组织样品中与正常组织样品中相比显著上调了。LFG1(SEQ ID NO：1或3)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.91875_s_at测定。91875_s_at序列来自EST AI053741。91875_s_at在各种不同恶性肿瘤中的表达水平，与正常对照组织的比较，显示在表1中，其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997)，Nature Biotech.15：1359-1367)。表1中也标明了每个组织类型中，被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-1的上调可以诊断癌症。

表1

组织	病理学/形态学	几何平均值	样品数量				倍率变化	方向	p-值
			样品数量							总数	存在	处于边缘	不存在
			乳腺	正常组织，NOS	22.71	34				总数	存在	处于边缘	不存在	8	4	22
渗透性导管癌	184.04	61		正常组织，NOS	22.71	34	61	0	0	8.11	上调	0		8	4	22
渗透性导管癌	184.04	61		渗透性小叶癌	104.36.	10	61	0	0	8.11	上调	0	9	0	1	4.60	上调	0.00456
结肠	正常组织，NOS	76.46		渗透性小叶癌	104.36.	10	24	23	0	1				0	1	4.60	上调	0.00456
	正常组织，NOS	76.46	腺癌，NOS	244.76	36	35	24	23	0	1				0	1	3.20	上调	0.00001
	食管	正常组织，NOS	腺癌，NOS	244.76	36	35	50.47	18	16	1	1				1	3.20	上调	0.00001
腺癌，NOS		正常组织，NOS	297.56	8	8	0	50.47	18	16	1	1				0	5.90	上调	0.00367
腺癌，NOS		肾	297.56	8	8	0	正常组织，NOS	20.00	25	1	0	24				5.90	上调	0.00367
透明细胞癌	60.48		11	10	1	0	正常组织，NOS	20.00	25	1	0	24				3.02	上调	0.00082
透明细胞癌	60.48		11	10	1	0	肾细胞癌	65.01	16	13	0	3	3.25	上调	0.00011	3.02	上调	0.00082
肝	正常组织，NOS		22.06	19	3	0	肾细胞癌	65.01	16	13	0	3	3.25	上调	0.00011	16
	正常组织，NOS	肝细胞癌，NOS	22.06	19	3	0	86.74	23	21	0	2	3.93	上调	0		16
	肺	肝细胞癌，NOS	正常组织，NOS	21.27	32	6	86.74	23	21	0	2	3.93	上调	0	0	26
腺癌，NOS		122.81	正常组织，NOS	21.27	32	6	39	38	0	1	5.77	上调	0		0	26
腺癌，NOS		122.81	卵巢	正常组织，NOS	20.21	23	39	38	0	1	5.77	上调	0	0	0	23
乳头状浆液性腺癌	112.80	23		正常组织，NOS	20.21	23	21	0	2	5.58	上调	0		0	0	23
乳头状浆液性腺癌	112.80	23		胰腺	正常组织，NOS	20.02	21	0	2	5.58	上调	0	20	1	0	19
腺癌，NOS	72.55	25	22		正常组织，NOS	20.02	0	3	3.62	上调	0		20	1	0	19
腺癌，NOS	72.55	25	22		直肠	正常组织，NOS	0	3	3.62	上调	0	78.86	20	20	0	0
腺癌，NOS	259.95	22	22	0		正常组织，NOS	0	3.30	上调	0.00008		78.86	20	20	0	0
腺癌，NOS	259.95	22	22	0		胃	0	3.30	上调	0.00008	正常组织，NOS	36.06	18	7	0	11
腺癌，NOS	218.74	38	36	0	2		6.07	上调	0		正常组织，NOS	36.06	18	7	0	11

通过测定结合到芯片序列片段no.91875_s_at的样品得到的基因芯片表达结果，使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。分析中使用的PCR引物(5’-GCTGAAGCAGGAAAATCGCTT-3’(SEQ ID NO：17)和5’-TGAGACGGAGTCTCACTCGGT-3’(SEQ ID NO：18))是基于特定的Affymetrix片段(91875_s_at)的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的，特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO：19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO：20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肾、肝、肺、卵巢、胃和胰腺的正常和肿瘤组织的总RNA对(Ambion，Inc.，Austin，TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-1的上调。

实施例2：与差异表达的mRNA对应的全长人cDNA(LFG1)的克隆

使用来自人心脏的cDNA文库(ResGen，Huntsville，AL)通过聚合酶链反应(PCR)和cDNA末端的快速扩增(RACE)获得了具有SEQ IDNO：1或3的全长cDNA。使用人基因组浏览器程序(Human GenomeBrowser(University of California，Santa Cruz))在预测的含有91875_s_at序列的基因的基础上设计了用于PCR的基因特异性的寡核苷酸(5’-CACCCTTTGCCTCTGTCACTTCCGCA-3’(SEQ ID NO：21)、5-GCTGGAGCACCAGGACTGCATTG-3’(SEQ ID NO：22)、5’-GGAGCTGAGCAGCAGTGTAATGAA-3’(SEQ ID NO：23)、5’-GAGGCCTGCCTGAAGGAGGAGCTTC-3’(SEQ ID NO：24)、5’-TCTGGAAGTAGTGCAGACGCCTCAGG-3’(SEQ ID NO：25)、5’-AGCCAACGTCGGCTTTGTTATCCAGC-3’(SEQ ID NO：26)、5’-GCTGTCAGATATGATGGTTCTGGAC-3’(SEQ ID NO：27)、5’-CCAGCCTCACCACTGTTGGGTTGC-3’(SEQ ID NO：28)、5’-CATTCTCTGAGCTGTATTAGTGT-3’(SEQ ID NO：29)、5’-CCTGAGCTGGAATGACCTGCA-3’(SEQ ID NO：30)、5’-CTTTGTGTTGGCTGCAGCCACA-3’(SEQ ID NO：31)、5’-TGAGGAGAGACTTTGCTGACTGGT-3’(SEQ ID NO：32)、5’-GTCCTGTCTGGCGGTGCCGA-3’(SEQ ID NO：33)、5’-GCTCCAGGATCCCCTGTCACCTGGGCCTTCTGCCTTTTGGCT-3’(SEQ ID NO：34)、5’-CCATATGGAGAGGAGAGCAGCGGGCCCA-3’(SEQ ID NO：35)、5’-GAAGGAGGAACATGGAGAGGAGA-3’(SEQ IDNO：36)、5’-CCATATGCCCCGGGTAGTCTACTGCAT-3’(SEQ IDNO：37)、和5’-GTCGACTCGAGTCACTTCCGCAAAAACTTCTTG-3’(SEQ ID NO：38))，以及用于RACE的寡核苷酸(5’-TCCATTCCGAAGGCTCTCCTCC-3’(SEQ ID NO：39)、5’-GTCTGTGTGACGGAAATGTAAGC-3’(SEQ ID NO：40)和5’-GAAGGTCGAAGGCAGACCGATGT-3’(SEQ ID NO：41))。带有引物序列的扩增产物使用Topo克隆系统(Topo Cloning System(Invitrogen，Carlsbad，CA))被整合到PCR4-Topo载体中，然后测序。

对应于上面检测到的差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO：1和3中。前者中，cDNA含有5293个碱基对。后者中cDNA含有5317个碱基对。

SEQ ID NO：1的cDNA核苷酸序列中的可读框，位于390-4880位核苷酸(包括终止密码子为390-4883位核苷酸)，编码了1497个氨基酸的蛋白。对应于SEQ ID NO：1所编码的预测蛋白的氨基酸序列显示在SEQ ID NO：2中。图2显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982)，J.Mol.Biol.157：105-142)对SEQ ID NO：2的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。

SEQ ID NO：3的cDNA核苷酸序列中的可读框，位于12-4904位核苷酸(包括终止密码子为12-4907位核苷酸)，编码了1631个氨基酸的蛋白。对应于SEQ ID NO：3所编码的预测蛋白的氨基酸序列显示在SEQ ID NO：4中。图3显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982)，J.Mol.Biol.157：105-142)对SEQ ID NO：4的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。

SEQ ID NO：2的蛋白序列与SEQ ID NO：4的蛋白序列相同，除了SEQ ID NO：2缺失SEQ ID NO：4 N-端的前134个氨基酸之外。

SEQ ID NOS：2和4含有Calponin同源结构域(SEQ ID NO：4的38-145位氨基酸)、用于结合钙调蛋白的IQ结构域(SEQ ID NO：2的629-646位氨基酸和SEQ ID NO：4的763-780位氨基酸)、RasGAP结构域(SEQ ID NO：2的858-1195位氨基酸和SEQ ID NO：4的992-1329位氨基酸)以及RasGAP C-末端结构域(SEQ ID NO：2的1298-1421位氨基酸和SEQ ID NO：4的1432-1555位氨基酸)。SEQ ID NOS：2和4与IQGAP蛋白类似(Weissbach等(1994)，J Biol Chem 269：20517-20521；Brill等(1996)，Mol Cell Biol 16：4869-4878)。IQGAP结合到参与细胞骨架结构、细胞-细胞附着和增殖信号传导的蛋白上并调节这些蛋白的功能(Fukada等(2002)，Cell 109：1-20；Briggs等(2002)，J Biol Chem277：7453-7465；McCallum等(1998)，J Biol Chem 273：22537-22544)。IQGAP1缺陷的小鼠相对于野生型表现出显著增加的晚期发作的胃增生(Li等(2000)，Mol Cell Biol 20：697-701)。

进行了Northern印迹分析以测定对应于LFG1的mRNA转录本的大小。使用包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹，Clontech，Palo Alto，CA)，含有91875_s_at序列的EST通过随机引物方法进行放射性标记，并被用作印迹探针。印迹在50％甲酰胺、5×SSPE、0.1％SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行，并用含有0.1％SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有3个转录本，大小大约为7.2kb和6.3kb。这与LFG1克隆(SEQ ID NO：1和3)的大小一致。

实施例3：鉴定癌症中差异表达的mRNA-2

重复实施例1中的过程，除了以标记物LFG2代替标记物LFG1之外。

对芯片数据的分析显示出标记物LFG2的表达在癌组织样品中与正常组织样品中相比显著地下调了。LFG2(SEQ ID NO：5)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.82941_at测定。82941_at序列来自EST AI277612。82941_at在各种不同恶性肿瘤中的表达水平，与正常对照组织的比较，被显示在表2中，其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997)，Nature Biotech.15：1359-1367)。表2中也标明了每个组织类型中，被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-2的下调可以诊断癌症。

表2

组织	病理学/形态学	几何平均值	样品数量				倍率变化	方向	p-值
			样品数量							总数	存在	处于边缘	不存在
			乳腺	正常组织，NOS	1147.66	34				总数	存在	处于边缘	不存在	34	0	0
渗透性导管癌	129.77	61		正常组织，NOS	1147.66	34	26	3	32	8.71	下调	0		34	0	0
渗透性导管癌	129.77	61		渗透性小叶癌	183.37	10	26	3	32	8.71	下调	0	6	1	3	5.48	下调	0.00002
结肠	正常组织，NOS	890.06		渗透性小叶癌	183.37	10	24	23	1	0				1	3	5.48	下调	0.00002
	正常组织，NOS	890.06	腺癌，NOS	163.35	36	17	24	23	1	0				1	18	5.39	下调	0
	食管	正常组织，NOS	腺癌，NOS	163.35	36	17	612.34	18	18	0	0				18	5.39	下调	0
腺癌，NOS		正常组织，NOS	265.11	8	7	1	612.34	18	18	0	0				0	2.31	下调	0.02218
腺癌，NOS		肝	265.11	8	7	1	正常组织，NOS	182.73	19	11	1	7				2.31	下调	0.02218
肝细胞癌，NOS	114.69		23	7	1	15	正常组织，NOS	182.73	19	11	1	7				1.51	下调	0.01211
肝细胞癌，NOS	114.69		23	7	1	15	肺	正常组织，NOS	535.64	32	30	2	0				下调	0.01211
腺癌，NOS	119.36	39	17	3	19	4.27		正常组织，NOS	535.64	32	30	2	0				下调	0
腺癌，NOS	119.36	39	17	3	19	4.27		淋巴结	正常组织，NOS	454.08	9	7	0	2				0
恶性淋巴瘤，NOS	123.13	12	5	0	7	3.24	下调		正常组织，NOS	454.08	9	7	0	2				0.02245
恶性淋巴瘤，NOS	123.13	12	5	0	7	3.24	下调		卵巢	正常组织，NOS	279.99	23	21	0	2
乳头状浆液性腺癌	85.45	23	7	1	15	3.5	下调	0		正常组织，NOS	279.99	23	21	0	2
乳头状浆液性腺癌	85.45	23	7	1	15	3.5	下调	0		前列腺	正常组织，NOS	195.77	19	13	1	5
腺癌，NOS	80.06	19	2	2	15	2.57	下调	0.00011			正常组织，NOS	195.77	19	13	1	5
腺癌，NOS	80.06	19	2	2	15	2.57	下调	0.00011	直肠		正常组织，NOS	943.86	20	19	0	1
腺癌，NOS	176.45	22	13	2	7	5.2	下调	0			正常组织，NOS	943.86	20	19	0	1
腺癌，NOS	176.45	22	13	2	7	5.2	下调	0		胃	正常组织，NOS	414.40	18	16	0	2
腺癌，NOS	125.39	38	17	2	19	3.21	下调	0			正常组织，NOS	414.40	18	16	0	2

通过结合到芯片序列片段no.82941_at的样品测定得到的基因芯片表达结果，使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-GAATGTGTCAGAGACAAGTGCAGC-3’(SEQ ID NO：42)和5’-TGTAGAAACTCTTGGACTAATGGAGG-3’(SEQ ID NO：43))是基于分析中使用的含有Affymetrix片段(82941_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的，特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO：19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO：20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肝、肺、卵巢和胃的正常和肿瘤组织的总RNA对(Ambion，Inc.，Austin，TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-2的下调。

实施例4：与差异表达的mRNA对应的全长人cDNA(LFG2)的克隆

具有SEQ ID NO：5的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies，Rockville，MD)获得。简单地说，基于含有82941_at序列的EST的序列设计了基因特异的寡聚物(5’-GAATGTGTCAGAGACAAGTGCAGC-3’(SEQ IDNO：42))。这个寡聚物用生物素标记，并用来与来自分化很少的胃腺癌文库(NCI CGAP Gas4)(ResGen，Huntsville，AL)的5μg单链质粒DNA(cDNA重组子)杂交，采用Sambrook等描述的步骤。杂交的cDNAs通过结合了链亲和素的珠子进行分离，以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA，用于转化大肠杆菌(E.coli)细胞(DH10B)，筛选出最长的cDNA。阳性的选择使用基因特异性的引物通过PCR进行确认后，对cDNA克隆进行DNA测序。

上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO：5中。该cDNA含有3608个碱基对。

SEQ ID NO：5的cDNA核苷酸序列中的可读框，位于424-1908位核苷酸(包括终止密码子为424-1911位核苷酸)，编码了495个氨基酸的蛋白。对应于SEQ ID NO：5所编码的预测蛋白的氨基酸序列显示在SEQ ID NO：6中。

SEQ ID NO：6与清除受体具有同源性，该受体参与选定的多聚阴离子配体的胞吞作用、凋亡细胞和细菌的吞噬作用、细胞附着以及动脉粥样硬化的发展(Peiser等(2002)，Curr.Opin.Immunol.14：123-128；Resnick等(1994)，Trends Biol.Sci.19：5-8)。基于已出版的清除受体的研究工作，SEQ ID NO：6含有细胞质结构域(1-35位氨基酸)、跨膜结构域(36-58位氨基酸)、α-螺旋卷曲的结构域(90-301位氨基酸)、胶原蛋白样结构域(305-380位氨基酸)以及清除受体的富含半胱氨酸(SRCR)的结构域(393-493位氨基酸)。SRCR结构域含有6个半胱氨酸残基(418、431、462、472、482和492位氨基酸)，其可以参与结构域内二硫键的形成。SEQ ID NO：6也显示出与小鼠同系物(GenBank登录No.BC016096)的同源性。它在整个连续的序列中显示出70％的同一性。

图4显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982)，J.Mol.Biol.157：105-142)对SEQ ID NO：6的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。

进行了Northern印迹分析以测定对应于LFG2的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人MTN印迹，Clontech，Palo Alto，CA)，含有82941_at序列的EST通过随机引物方法进行放射性标记，并被用来作印迹探针。印迹在含有50％甲酰胺、5×SSPE、0.1％SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行，并用含有0.1％SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有单一的转录本，大小大约为3.7kb。这与LFG2克隆(SEQ ID NO：5)的大小一致。

实施例5：鉴定癌症中差异表达的mRNA-3

重复实施例1中的过程，除了以标记物LFG3代替标记物LFG1之外。

对芯片数据的分析显示出标记物LFG3的表达在癌组织样品中与正常组织样品中相比显著地下调了。LFG3(SEQ ID NO：7)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.46104_at测定。46104_at序列来自EST AA772055。46104_at在各种不同恶性肿瘤中的表达水平，与正常对照组织的比较，被显示在表3中，其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997)，Nature Biotech.15：1359-1367)。表3中也标明了每个组织类型中，被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-3的下调可以诊断癌症。

表3

组织	病理学/形态学	几何平均值	样品数量				倍率变化	方向	p-值
			样品数量							总数	存在	处于边缘	不存在
			乳腺	正常组织，NOS	64.52	34				总数	存在	处于边缘	不存在	31	0	3
渗透性导管癌	27.24	61		正常组织，NOS	64.52	34	18	1	42	2.25	下调	0		31	0	3
渗透性导管癌	27.24	61		渗透性小叶癌	29.52	10	18	1	42	2.25	下调	0	4	0	6	2.21	下调	0.00004
结肠	正常组织，NOS	315.46		渗透性小叶癌	29.52	10	24	24	0	0				0	6	2.21	下调	0.00004
	正常组织，NOS	315.46	腺癌，NOS	102.99	36	31	24	24	0	0				0	5	3.02	下调	0.00016
	食管	正常组织，NOS	腺癌，NOS	102.99	36	31	272.48	18	17	0	1				5	3.02	下调	0.00016
腺癌，NOS		正常组织，NOS	41.25	8	6	0	272.48	18	17	0	1				2	6.60	下调	0.00001
腺癌，NOS		肾	41.25	8	6	0	正常组织，NOS	2626.88	25	25	0	0				6.60	下调	0.00001
透明细胞腺癌	344.66		11	11	0	0	正常组织，NOS	2626.88	25	25	0	0				7.62	下调	0.00003
透明细胞腺癌	344.66		11	11	0	0	肾细胞癌	355.71	16	14	0	2	7.38	下调	0.00005	7.62	下调	0.00003
卵巢	正常组织，NOS		1098.41	23	23	0	肾细胞癌	355.71	16	14	0	2	7.38	下调	0.00005	0
	正常组织，NOS	乳头状浆液性腺癌	1098.41	23	23	0	178.15	23	22	0	1	6.17	下调	0		0
	前列腺	乳头状浆液性腺癌	正常组织，NOS	274.49	19	19	178.15	23	22	0	1	6.17	下调	0	0	0
腺癌，NOS		117.26	正常组织，NOS	274.49	19	19	19	18	0	1	2.34	下调	0.00016		0	0
腺癌，NOS		117.26	直肠	正常组织，NOS	410.22	20	19	18	0	1	2.34	下调	0.00016	20	0	0
腺癌，NOS	72.98	22		正常组织，NOS	410.22	20	16	0	6	5.38	下调	0		20	0	0
腺癌，NOS	72.98	22		胃	正常组织，NOS	71.10	16	0	6	5.38	下调	0	18	10	0	8
腺癌，NOS	35.49	38	15		正常组织，NOS	71.10	1	22	1.98	下调	0.00459		18	10	0	8

通过样品结合到芯片序列片段no.46104_at测定的基因芯片表达结果，使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-GTATGCATCAGAATTCCCTATAGATCTTT-3’(SEQ ID NO：44)和5’-TAGATGTTTGGGCAACAGCCT-3’(SEQ IDNO：45)是基于分析中使用的含有Affymetrix片段(46104_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的，特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO：19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO：20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肾、卵巢、胰腺和胃的正常和肿瘤组织的总RNA对(Ambion，Inc.，Austin，TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-3的下调。

实施例6：与差异表达的mRNA对应的全长人cDNA(LFG3)的克隆

具有SEQ ID NO：7的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies，Rockville，MD)获得。简单地说，基于含有46104_at序列的EST的序列设计了基因特异的寡聚物(5’-GTATGCATCAGAATTCCCTATAGATCTTT-3’(SEQID NO：44))。这个寡聚物用生物素标记，并用来与来自人胎肾(ResGen，Huntsville，AL)的5μg单链质粒DNA(cDNA重组子)杂交，采用Sambrook等描述的步骤。杂交的cDNAs通过结合有链亲和素的珠子进行分离，以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA，用于转化大肠杆菌(E.coli)细胞(DH10B)，并筛选出最长的cDNA。阳性选择通过使用基因特异性的引物进行PCR确认后，对cDNA克隆进行DNA测序。LFG3的5’-末端通过cDNA末端的快速扩增(RACE)来鉴定，使用了从人胎肾制备的cDNA(Clontech，Palo Alto，CA)和基因特异性的引物(5’-TTCCTTCACCAAAGGCATCCAGCCATTCTATG-3’(SEQ ID NO：46))。

上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO：7中。该cDNA含有3162个碱基对。

SEQ ID NO：7的cDNA核苷酸序列中的可读框，位于405-1835位核苷酸(包括终止密码子为405-1838位核苷酸)，编码了477个氨基酸的蛋白。对应于SEQ ID NO：7所编码的预测蛋白的氨基酸序列显示在SEQ ID NO：8中。

SEQ ID NO：8与单羧酸转运蛋白(MCTs)相似，含有10个预测的跨膜结构域(10-29、80-99、107-128、140-160、274-295、312-332、339-360、363-384、396-416和433-451位氨基酸)。MCT蛋白催化单羧酸例如乳酸、丙酮酸、支链酮酸、酮体、β-羟基丁酸和乙酸的易化运输(Halestrap和Price(1999)，Biochem.J.343：281-299)。表4总结了SEQ ID NO：4与8个已知的单羧酸转运蛋白的相似性比例。

表4.LFG3与MCT蛋白的同源性

蛋白	大小(氨基酸)	同一性(％)	阳性(％)
蛋白	大小(氨基酸)	同一性(％)	阳性(％)	MCT1	500	17.5	34.3
MCT2	478	19.5	35.5	MCT1	500	17.5	34.3
MCT2	478	19.5	35.5	MCT3	504	19.5	34.1
MCT4	465	19.0	33.2	MCT3	504	19.5	34.1
MCT4	465	19.0	33.2	MCT5	487	22.1	36.9
MCT6	505	16.4	31.5	MCT5	487	22.1	36.9
MCT6	505	16.4	31.5	MCT7	523	20.1	35.2
MCT8	613	15.9	27.9	MCT7	523	20.1	35.2

图5显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982)，J.Mol.Biol.157：105-142)对SEQ ID NO：8的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。

进行了Northern印迹分析以测定对应于LFG3的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹，Clontech，Palo Alto，CA)，含有46104_at序列的EST通过随机引物方法进行放射性标记，并被用来探测印迹。印迹在50％甲酰胺、5×SSPE、0.1％SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行，并用含有0.1％SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有单一的转录本，大小大约为4.2kb。这与LFG3克隆(SEQ ID NO：7)的大小一致。

实施例7：鉴定癌症中差异表达的mRNA-4

重复实施例1中的过程，除了以标记物LFG4代替标记物LFG1之外。

对芯片数据的分析显示出标记物LFG4的表达在癌组织样品中与正常组织样品中相比显著地下调了。LFG4(SEQ ID NO：9)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.62158_at测定。62158_at序列来自EST AI123532。62158_at在各种不同恶性肿瘤中的表达水平，与正常对照组织的比较，被显示在表5中，其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997)，Nature Biotech.15：1359-1367)。表5中也标明了每个组织类型中，被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-4的下调可以诊断癌症。

表5

组织	病理学/形态学	几何平均值	样品数量				倍率变化	方向	p-值
			样品数量							总数	存在	处于边缘	不存在
			乳腺	正常组织，NOS	156.75	34				总数	存在	处于边缘	不存在	33	0	1
渗透性导管癌	90.09	61		正常组织，NOS	156.75	34	51	0	10	1.74	下调	0.00001		33	0	1
渗透性导管癌	90.09	61		结肠	正常组织，NOS	234.06	51	0	10	1.74	下调	0.00001	24	22	2	0
腺癌，NOS	64.02	36	24		正常组织，NOS	234.06	0	12	3.66	下调	0		24	22	2	0
腺癌，NOS	64.02	36	24		肾	正常组织，NOS	0	12	3.66	下调	0	134.17	25	23	0	2
透明细胞腺癌	78.59	11	7	1		正常组织，NOS	3	1.71	下调	0.08272		134.17	25	23	0	2
透明细胞腺癌	78.59	11	7	1		肾细胞癌	3	1.71	下调	0.08272	55.31	16	9	0	7	2.43	下调	0.0021
肺	正常组织，NOS	179.71	32	32		肾细胞癌	0	0				16	9	0	7	2.43	下调	0.0021
	正常组织，NOS	179.71	32	32	腺癌，NOS	47.39	0	0				39	17	3	19	3.79	下调	0
	淋巴结	正常组织，NOS	140.51	9	腺癌，NOS	47.39	7	1	1				17	3	19	3.79	下调	0
恶性淋巴瘤，NOS		正常组织，NOS	140.51	9	41.43	12	7	1	1				5	1	6	3.39	下调	0.00207
恶性淋巴瘤，NOS		卵巢	正常组织，NOS	125.19	41.43	12	23	21	0	2				1	6	3.39	下调	0.00207
乳头状浆液性腺癌	37.23		正常组织，NOS	125.19	23	4	23	21	0	2				0	19	3.36	下调	0
乳头状浆液性腺癌	37.23		前列腺	正常组织，NOS	23	4	191.94	19	18	0	1				19	3.36	下调	0
腺癌，NOS	103.47	19		正常组织，NOS	16	0	191.94	19	18	0	1				3	1.86	下调	0.00185
腺癌，NOS	103.47	19		直肠	16	0	正常组织，NOS	317.95	20	20	0	0				1.86	下调	0.00185
腺癌，NOS	74.28	22	16		1	5	正常组织，NOS	317.95	20	20	0	0				4.28	下调	0
腺癌，NOS	74.28	22	16		1	5	胃	正常组织，NOS	161.77	18	17	0	1				下调	0
腺癌，NOS	84.55	38	27	2	9	1.91		正常组织，NOS	161.77	18	17	0	1				下调	0.0062

通过样品结合到芯片序列片段no.62158_at所测定的基因芯片表达结果，使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-AAATGTCTGATTACCCCATTTTATCAGT-3’(SEQ ID NO：47)和5’-TAATCCTGAAATGAACAGCTAACA-3’)(SEQ ID NO：48))是基于分析中使用的含有Affymetrix片段(62158_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的，特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO：19)和5′-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO：20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肝、肺、卵巢、胰腺和胃的正常和肿瘤组织的总RNA对(Ambion，Inc.，Austin，TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-4的下调。

实施例8：与差异表达的mRNA对应的全长人cDNA(LFG4)的克隆

具有SEQ ID NO：9的全长cDNA通过cDNA末端的快速扩增(RACE)获得。简单地说，基于含有62158_at序列的EST的序列设计了基因特异性的寡聚物((5’-TAATGTTAGAGTAACAGCATTTTCCTTCAA-3’(SEQ ID NO：49)和5’-TGCCCCACACTAACTCAGTTCTTGTGATG-3’(SEQ ID NO：50))。这个寡聚物被用来对从人脑制备的cDNAs(Clontech，Palo Alto，CA)进行PCR扩增。带引物的扩增产物使用Topo克隆系统(Invitrogen，Carlsbad，CA)整合到PCR4-Topo载体中，然后测序。

上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO：9中。该cDNA含有4891个碱基对。

SEQ ID NO：9的cDNA核苷酸序列中的可读框，位于89-1150位核苷酸(包括终止密码子为89-1153位核苷酸)，编码了354个氨基酸的蛋白。对应于SEQ ID NO：9所编码的预测蛋白的氨基酸序列显示在SEQ ID NO：10中。

SEQ ID NO：10与大鼠的Kilon和鸡的Neurotractin(Funatsu等(1999)，J Biol Chem 274：8224-8230；Marg等(1999)，J Cell Biol 145：865-876)相似。蛋白序列分析发现了分泌信号肽(1-33位氨基酸)、3个免疫球蛋白结构域(47-136、145-208和231-312位氨基酸)以及6个推断的N-连接糖基化位点(73、155、275、286、294和307位氨基酸)。Kilon/Neurotractin是免疫球蛋白超家族的IgLON亚家族的一个成员。IgLONs是一族糖基化磷脂酰肌醇(GPI)连接的细胞附着分子，被认为修饰了轴突的突起(outgrowth)，可能在细胞-细胞附着和识别中发挥作用(Miyate等(2000)，J Comparative Neurol 424：74-85)。

图6显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982)，J.Mol.Biol.157：105-142)对SEQ ID NO：10的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。这个亲水性图显示出在C末端存在疏水区域。在GPI锚定蛋白的情况下，已知GPI锚的添加发生在切除C末端的疏水区域之后。推断的GPI锚连接位点被发现(324位氨基酸处的甘氨酸)。

进行了Northern印迹分析以测定对应于LFG4的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹，Clontech，Palo Alto，CA)，含有62158_at序列的EST通过随机引物方法进行放射性标记，并被用来探测印迹。印迹在50％甲酰胺、5×SSPE、0.1％SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行，并用含有0.1％SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有单一的转录本，大小大约为5.4kb。这与LFG4克隆(SEQ ID NO：9)的大小一致。

实施例9：鉴定癌症中差异表达的mRNA-5

重复实施例1中的过程，除了以标记物LFG5代替标记物LFG1之外。

对芯片数据的分析显示出标记物LFG5的表达在癌组织样品中与正常组织样品中相比显著下调了。LFG5(SEQ ID NO：11)的表达水平可以在Affymetrix GeneChipsU95上通过芯片序列片段no.46659_at测定。46659_at在各种不同恶性肿瘤中的表达水平，与正常对照组织的比较，被显示在表6中，其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。表6中也标明了每个组织类型中，被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-5的差异表达可以诊断癌症。

表6

组织	病理学/形态学	几何平均值	样品数量				倍率变化	方向	p-值
			样品数量							总数	存在	处于边缘	不存在
			乳腺	正常组织，NOS	152.75	34				总数	存在	处于边缘	不存在	31	0	3
渗透性导管癌	404.58	61		正常组织，NOS	152.75	34	60	0	1	2.65	上调	0		31	0	3
渗透性导管癌	404.58	61		渗透性小叶癌	277.71	10	60	0	1	2.65	上调	0	10	0	0	1.82	上调	0.07445
食管	正常组织，NOS	85.47		渗透性小叶癌	277.71	10	18	15	0	2				0	0	1.82	上调	0.07445
	正常组织，NOS	85.47	腺癌，NOS	373.97	8	8	18	15	0	2				0	0	4.38	上调	0.0009
	肾	正常组织，NOS	腺癌，NOS	373.97	8	8	53.58	25	17	0	8				0	4.38	上调	0.0009
透明细胞腺癌		正常组织，NOS	161.36	11	11	0	53.58	25	17	0	8				0	3.01	上调	0.00011
透明细胞腺癌		肾细胞癌	161.36	11	11	0	249.37	16	16	0	0	4.65	上调	0	0	3.01	上调	0.00011
肺		肾细胞癌	正常组织，NOS	330.65	32	31	249.37	16	16	0	0	4.65	上调	0	0	1
	腺癌，NOS	195.43	正常组织，NOS	330.65	32	31	39	35	0	4	1.69	下调	0.00538		0	1
	腺癌，NOS	195.43	淋巴结	正常组织，NOS	219.77	9	39	35	0	4	1.69	下调	0.00538	9	0	0
恶性淋巴瘤，NOS	142.09	12		正常组织，NOS	219.77	9	11	0	1	1.55	下调	0.25114		9	0	0
恶性淋巴瘤，NOS	142.09	12		卵巢	正常组织，NOS	90.40	11	0	1	1.55	下调	0.25114	23	19	0	4
乳头状浆液性腺癌	418.81	23	23		正常组织，NOS	90.40	0	0	4.63	上调	0		23	19	0	4
乳头状浆液性腺癌	418.81	23	23		胰腺	正常组织，NOS	0	0	4.63	上调	0	38.53	20	12	0	8
腺癌，NOS	344.37	25	25	0		正常组织，NOS	0	8.94	上调	0		38.53	20	12	0	8
腺癌，NOS	344.37	25	25	0		胃	0	8.94	上调	0	正常组织，NOS	185.50	18	17	0	1
腺癌，NOS	279.62	38	35	0	3		1.51	上调	0.12664		正常组织，NOS	185.50	18	17	0	1

通过结合到芯片序列片段no.46659_at的样品测定的基因芯片表达结果，使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-AAGGCTTTATCAGGTCTGCATATAGAATC-3’(SEQ ID NO：51)和5’-GCAAAGAACCCTAATGCTATTTATCAGC-3’(SEQ ID NO：52))是基于分析中使用的特异性Affymetrix片段(46659_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的，特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ IDNO：19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO：20))被用作对照引物。这种方法提供以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自肾、肺、卵巢和胰腺的正常和肿瘤组织的总RNA对(Ambion，Inc.，Austin，TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-5的差异表达。

实施例10：与差异表达的mRNA对应的全长人cDNA(LFG5)的克隆

具有SEQ ID NO：11的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies，Rockville，MD)获得。简单地说，基于含有46659_at序列的EST的序列设计了基因特异的寡聚物(5’-GAGAAGACCAGGGAAGAAGCAG-3’(SEQ IDNO：53))。这个寡聚物用生物素标记，用来与来自人心脏文库(ResGen，Huntsville，AL)的5μg单链质粒DNA(cDNA重组子)杂交，采用Sambrook等描述的步骤。杂交的cDNAs通过结合链亲和素的珠子进行分离，以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA，用于转化大肠杆菌细胞(DH10B)，筛选出最长的cDNA。阳性的选择通过PCR使用基因特异的引物进行确认后，对cDNA克隆进行DNA测序。

上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO：11中。该cDNA含有3098个碱基对。

SEQ ID NO：11的cDNA核苷酸序列中的可读框，位于223-1569位核苷酸(包括终止密码子为223-1572位核苷酸)，编码了449个氨基酸的蛋白。对应于SEQ ID NO：11所编码的预测蛋白的氨基酸序列显示在SEQ ID NO：12中。

SEQ ID NO：12含有胸苷酸激酶结构域(257-438位氨基酸)。胸苷酸激酶是核苷酸单磷酸激酶(NMPKs)的成员，在用于RNA和DNA合成的核苷酸的合成中发挥作用，为治疗性核苷和核苷酸类似物的药物活化所需要(Van Rompay等(2000)，Pharmacology & Therapeutics87：189-198)。SEQ ID NO：12与在巨噬细胞活化的过程中被诱导(Lee和O’Brien(1995)，J Immunol.154：6094-6102)的小鼠胸苷酸激酶(GenBank Accession No.NM_020557)显示出同源性。它在整个连续的序列上显示出63％的同一性。

图7显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982)，J.Mol.Biol.157：105-142)对SEQ ID NO：12的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。

进行了Northern印迹分析以测定对应于LFG5的mRNA转录本的大小。使用了包含来自不同人组织的总RNAs进行Northern印迹(人MTN印迹，Clontech，Palo Alto，CA)，含有82941_at序列的EST通过随机引物方法进行放射性标记，并被用来探测印迹。印迹在50％甲酰胺、5×SSPE、0.1％SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行，用含有0.1％SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有一个单一的转录本，大小大约为3.0kb。这与LFG5克隆(SEQ ID NO：11)的大小一致。

实施例11：鉴定癌症中差异表达的mRNA-6

重复实施例1中的过程，除了以标记物LFG6代替标记物LFG1之外。

对芯片数据的分析显示出标记物LFG6的表达在癌组织样品中与正常组织样品中相比显著地上调了。LFG6(SEQ ID NO：13或15)的表达水平可以在Affymetrix GeneChipsU95上通过芯片序列片段no.44103_at测定。44103_at序列来自EST AA865614。44103_at在各种不同恶性肿瘤中的表达水平，与正常对照组织的比较，被显示在表7中，其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997)，Nature Biotech.15：1359-1367)。表7中也标明了每个组织类型中，被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-6的上调可以诊断癌症。

表7

组织	病理学/形态学	几何平均值	样品数量				倍率变化	方向白	p-值
			样品数量							总数	存在	处于边缘	不存在
			肾	正常组织，NOS	337.71	25				总数	存在	处于边缘	不存在	25	0	0
透明细胞腺癌	556.82	11		正常组织，NOS	337.71	25	11	0	0	1.65	上调	0.00314		25	0	0
透明细胞腺癌	556.82	11		肝	正常组织，NOS	406.93	11	0	0	1.65	上调	0.00314	19	18	0	1
肝细胞癌，NOS	619.40	23	22		正常组织，NOS	406.93	0	1	1.52	上调	0.00303		19	18	0	1
肝细胞癌，NOS	619.40	23	22		卵巢	正常组织，NOS	0	1	1.52	上调	0.00303	380.10	23	23	0	0
乳头状浆液性腺癌	578.60	23	23	0		正常组织，NOS	0	1.52	上调	0.00013		380.10	23	23	0	0
乳头状浆液性腺癌	578.60	23	23	0		胰腺	0	1.52	上调	0.00013	正常组织，NOS	138.75	20	11	1	8
腺癌，NOS	453.01	25	25	0	0		3.26	上调	0.00002		正常组织，NOS	138.75	20	11	1	8

对通过结合到芯片序列片段no.44103_at的样品测定的基因芯片表达结果，使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-GGACGGGGAACTTGGACGC-3’(SEQ IDNO：54)and 5’-AAGTGCAGGGCCTCTGGGTG-3’(SEQ ID NO：55))是基于分析中使用的含有Affymetrix片段(44103_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的，特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ IDNO：19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO：20))被用作对照引物。这种方法提供以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自肝和卵巢(Ambion，Inc.，Austin，TX)的正常和肿瘤组织的总RNA对。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-6的上调。

实施例12.与差异表达的mRNA对应的全长人cDNA(LFG6)的克隆

具有SEQ ID NO：13或15的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies，Rockville，MD)获得。简单地说，基于含有44103_at序列的EST的序列设计了基因特异性的寡聚物(5’-CGCTGGGTCATCGGACGGT-3’(SEQ ID NO：56))。这个寡聚物用生物素标记，用来与来自完全分化的人胃腺癌文库(ResGen，Huntsville，AL)的5μg单链质粒DNA(cDNA重组子)杂交，采用Sambrook等描述的步骤。杂交的cDNAs通过结合链亲和素的珠子进行分离，以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA，用于转化大肠杆菌细胞(DH10B)，筛选出最长的cDNA。阳性选择通过PCR使用基因特异性的引物进行确认后，对cDNA克隆进行DNA测序。

上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO：13和15中。前者中cDNA含有1893个碱基对。后者中cDNA含有1597个碱基对。

SEQ ID NO：13的cDNA核苷酸序列中的可读框，位于418-1392位核苷酸(包括终止密码子为418-1395位核苷酸)，编码了325个氨基酸的蛋白。对应于SEQ ID NO：13所编码的预测蛋白的氨基酸序列显示在SEQ ID NO：14中。图9显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982)，J.Mol.Biol.157：105-142)对SEQ ID NO：14的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。

SEQ ID NO：15的cDNA核苷酸序列中的可读框，位于271-1431位核苷酸(包括终止密码子为271-1434位核苷酸)，编码了387个氨基酸的蛋白。对应于SEQ ID NO：15所编码的预测蛋白的氨基酸序列显示在SEQ ID NO：16中。图10显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982)，J.Mol.Biol.157：105-142)对SEQ ID NO：16的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。

SEQ ID NO：14和16含有泛素蛋白同源(UBQ)结构域(239-300位氨基酸)。SEQ ID NOS：14和16与大鼠的Sharpin蛋白相似(Lim等(2001)，Mol Cell Neurosci 17：385-397)。Sharpin直接与Shank蛋白的锚蛋白重复序列相互作用，Shank蛋白在的细胞骨架复合物的结构和特化细胞连接处的细胞内信号传导中起作用(Sheng和Kim(2000)，J Cell Sci113：1851-1856)。

进行了Northern印迹分析以测定对应于LFG6的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹，Clontech，Palo Alto，CA)，含有44103_at序列的EST通过随机引物方法进行放射性标记，被用来探测印迹。印迹在50％甲酰胺、5×SSPE、0.1％SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行，用含有0.1％SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有三个转录本，大小大约为3.0kb、1.5kb和1.2kb。这与LFG6克隆(SEQ ID NO：13和15)的大小一致。

尽管参考上述的实施例，本发明已经被描述得很详细，应该理解的是在不偏离本发明实质的情况下可对发明进行各种不同的修饰。因此，本发明只受到后面的权利要求的限制。所有在本申请中引用的专利、专利申请和出版物，在此以其全文引为参考。

序列表

<110>株式会社LG生命科学(LG Life sciences Ltd.)

<120>与癌症相关的基因家族(Gene Famililies Associated With Cancers)

<130>SCT051353-47

<150>US60/419911

<151>2002-10-18

<150>US60/419912

<151>2002-10-18

<150>US60/420088

<151>2002-10-18

<150>US60/434243

<151>2002-12-16

<150>US60/434278

<151>2002-12-16

<150>US60/438278

<151>2003-01-03

<160>56

<170>KopatentIn 1.71

<210>1

<211>5293

<212>DNA

<213>智人(Homo sapiens)

<220>

<221>CDS

<222>(390)..(4880)

<223>LBFL109 Clone A

<400>1

gtcctgtctg gcggtgccga cggtgagggg cggtggccca acggcgggag attcaaacct 60

ggaagaagga ggaacatgga gaggagagca gcgggcccag gctgggcagc ctctggatcg 120

aggcctgcct gaaggaggag cttccttccc cggtggagct ggaggagagc cttcggaatg 180

gagtgctgct ggccaagctg ggccactgtt ttgcaccctc cgtggttccg ttgaagaaga 240

tctacgatgt ggagcagctg cggtaccagg caactggctt acatttccgt cacacagaca 300

acatcaactt ttggctatct gcaatagccc acatcggtct gccttcgacc ttcttcccag 360

agaccacgga catctatgac aaaaagaac atg ccc cgg gta gtc tac tgc atc 413

Met Pro Arg Val Val Tyr Cys Ile

1 5

cat gct ctc agt ctc ttc ctc ttc cgg ctg gga ttg gcc cct cag ata 461

His Ala Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala Pro Gln Ile

10 15 20

cat gat cta tac ggg aaa gtg aaa ttc aca gct gag gaa ctc agc aac 509

His Asp Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu Leu Ser Asn

25 30 35 40

atg gcg tcc gaa ctg gcc aaa tat ggc ctc cag ctg cct gcc ttc agc 557

Met Ala Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro Ala Phe Ser

45 50 55

aag atc ggg ggc atc ttg gcc aat gag ctc tcg gtg gat gag gct gca 605

Lys Ile Gly Gly Ile Leu Ala Asn Glu Leu Ser Val Asp Glu Ala Ala

60 65 70

gtc cat gca gct gtt ctt gcc atc aat gaa gca gtg gag cga ggg gtg 653

Val His Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu Arg Gly Val

75 80 85

gtg gag gac acc ctg gct gcc ttg cag aat ccc agt gct ctt ctg gag 701

Val Glu Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala Leu Leu Glu

90 95 100

aat ctc cga gag cct ctg gca gcc gtc tac cag gag atg ctg gcc cag 749

Asn Leu Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met Leu Ala Gln

105 110 115 120

gcc aag atg gag aag gca gcc aat gcc agg aac cat gat gac aga gaa 797

Ala Lys Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp Asp Arg Glu

125 130 135

agc cag gac atc tat gac cac tac cta act cag gct gaa atc cag ggc 845

Ser Gln Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu Ile Gln Gly

140 145 150

aat atc aac cat gtc aac gtc cat ggg gct cta gaa gtt gtt gat gat 893

Asn Ile Asn His Val Asn Val His Gly Ala Leu Glu Val Val Asp Asp

155 160 165

gcc ctg gaa aga cag agc cct gaa gcc ttg ctc aag gcc ctt caa gac 941

Ala Leu Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala Leu Gln Asp

170 175 180

cct gcc ctg gcc ctg cga ggg gtg agg aga gac ttt gct gac tgg tac 989

Pro Ala Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala Asp Trp Tyr

185 190 195 200

ctg gag cag ctg aac tca gac aga gag cag aag gca cag gag ctg ggc 1037

Leu Glu Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln Glu Leu Gly

205 210 215

ctg gtg gag ctt ctg gaa aag gag gaa gtc cag gct ggt gtg gct gca 1085

Leu Val Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly Val Ala Ala

220 225 230

gcc aac aca aag ggt gat cag gaa caa gcc atg ctc cac gct gtg cag 1133

Ala Asn Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His Ala Val Gln

235 240 245

cgg atc aac aaa gcc atc cgg agg gga gtg gcg gct gac act gtg aag 1181

Arg Ile Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp Thr Val Lys

250 255 260

gag ctg atg tgc cct gag gcc cag ctg cct cca gtg tac cct gtt gca 1229

Glu Leu Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr Pro Val Ala

265 270 275 280

tcg tct atg tac cag ctg gag ctg gca gtg ctc cag cag cag cag ggg 1277

Ser Ser Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln Gln Gln Gly

285 290 295

gag ctt ggc cag gag gag ctc ttc gtg gct gtg gag atg ctc tca gct 1325

Glu Leu Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met Leu Ser Ala

300 305 310

gtg gtc ctg att aac cgg gcc ctg gag gcc cgg gat gcc agt ggc ttc 1373

Val Val Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala Ser Gly Phe

315 320 325

tgg agc agc ctg gtg aac cct gcc aca ggc ctg gct gag gtg gaa gga 1421

Trp Ser Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu Val Glu Gly

330 335 340

gaa aat gcc cag cgt tac ttc gat gcc ctg ctg aaa ttg cga cag gag 1469

Glu Asn Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu Arg Gln Glu

345 350 355 360

cgt ggg atg ggt gag gac ttc ctg agc tgg aat gac ctg cag gcc acc 1517

Arg Gly Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu Gln Ala Thr

365 370 375

gtg agc cag gtc aat gca cag acc cag gaa gag act gac cgg gtc ctt 1565

Val Ser Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp Arg Val Leu

380 385 390

gca gtc agc ctc atc aat gag gct ctg gac aaa ggc agc cct gag aag 1613

Ala Val Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser Pro Glu Lys

395 400 405

act ctg tct gcc cta ctg ctt cct gca gct ggc cta gat gat gtc agc 1661

Thr Leu Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp Asp Val Ser

410 415 420

ctc cct gtc gcc cct cgg tac cat ctc ctc ctt gtg gca gcc aaa agg 1709

Leu Pro Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala Ala Lys Arg

425 430 435 440

cag aag gcc cag gtg aca ggg gat cct gga gct gtg ctg tgg ctt gag 1757

Gln Lys Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu Trp Leu Glu

445 450 455

gag atc cgc cag gga gtg gtc aga gcc aac cag gac act aat aca gct 1805

Glu Ile Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr Asn Thr Ala

460 465 470

cag aga atg gct ctt ggt gtg gct gcc atc aat caa gcc atc aag gag 1853

Gln Arg Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala Ile Lys Glu

475 480 485

ggc aag gca gcc cag act gag cgg gtg ttg agg aac ccc gca gtg gcc 1901

Gly Lys Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro Ala Val Ala

490 495 500

ctt cga ggg gta gtt ccc gac tgt gcc aac ggc tac cag cga gcc ctg 1949

Leu Arg Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln Arg Ala Leu

505 510 515 520

gaa agt gcc atg gca aag aaa cag cgt cca gca gac aca gct ttc tgg 1997

Glu Ser Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr Ala Phe Trp

525 530 535

gtt caa cat gac atg aag gat ggc act gcc tac tac ttc cat ctg cag 2045

Val Gln His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe His Leu Gln

540 545 550

acc ttc cag ggg atc tgg gag caa cct cct ggc tgc ccc ctc aac acc 2093

Thr Phe Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro Leu Asn Thr

555 560 565

tct cac ctg acc cgg gag gag atc cag tca gct gtc acc aag gtc act 2141

Ser His Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr Lys Val Thr

570 575 580

gct gcc tat gac cgc caa cag ctc tgg aaa gcc aac gtc ggc ttt gtt 2189

Ala Ala Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val Gly Phe Val

585 590 595 600

atc cag ctc cag gcc cgc ctc cgt ggc ttc cta gtt cgg cag aag ttt 2237

Ile Gln Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg Gln Lys Phe

605 610 615

gct gag cat tcc cac ttt ctg agg acc tgg ctc cca gca gtc atc aag 2285

Ala Glu His Ser His Phe Leu Arg Thr Trp Leu Pro Ala Val Ile Lys

620 625 630

atc cag gct cat tgg cgg ggt tat agg cag cgg aag att tac ctg gag 2333

Ile Gln Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile Tyr Leu Glu

635 640 645

tgg ttg cag tat ttt aaa gca aac ctg gat gcc ata atc aag atc cag 2381

Trp Leu Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile Lys Ile Gln

650 655 660

gcc tgg gcc cgg atg tgg gca gct cgg agg caa tac ctg agg cgt ctg 2429

Ala Trp Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu Arg Arg Leu

665 670 675 680

cac tac ttc cag aag aat gtt aac tcc att gtg aag atc cag gca ttt 2477

His Tyr Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile Gln Ala Phe

685 690 695

ttc cga gcc agg aaa gcc caa gat gac tac agg ata tta gtg cat gca 2525

Phe Arg Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu Val His Ala

700 705 710

ccc cac cct cct ctc agt gtg gta cgc aga ttt gcc cat ctc ttg aat 2573

Pro His Pro Pro Leu Ser Val Val Arg Arg Phe Ala His Leu Leu Asn

715 720 725

caa agc cag caa gac ttc ttg gct gag gca gag ctg ctg aag ctc cag 2621

Gln Ser Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu Lys Leu Gln

730 735 740

gaa gag gta gtt agg aag atc cga tcc aat cag cag ctg gag cag gac 2669

Glu Glu Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu Glu Gln Asp

745 750 755 760

ctc aac atc atg gac atc aag att ggc ctg ctg gtg aag aac cgg atc 2717

Leu Asn Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys Asn Arg Ile

765 770 775

act ctg cag gaa gtg gtc tcc cac tgc aag aag ctg acc aag agg aat 2765

Thr Leu Gln Glu Val Val Ser His Cys Lys Lys Leu Thr Lys Arg Asn

780 785 790

aag gaa cag ctg tca gat atg atg gtt ctg gac aag cag aag ggt tta 2813

Lys Glu Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln Lys Gly Leu

795 800 805

aag tcg ctg agc aaa gag aaa cgg cag aaa cta gaa gca tac caa cac 2861

Lys Ser Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala Tyr Gln His

810 815 820

ctc ttc tac ctg ctc cag act cag ccc atc tac ctg gcc aag ctg atc 2909

Leu Phe Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala Lys Leu Ile

825 830 835 840

ttt cag atg cca cag aac aaa acc acc aag ttc atg gag gca gtg att 2957

Phe Gln Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu Ala Val Ile

845 850 855

ttc agc ctg tac aac tat gcc tcc agc cgc cga gag gcc tat ctc ctg 3005

Phe Ser Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala Tyr Leu Leu

860 865 870

ctc cag ctg ttc aag aca gca ctc cag gag gaa atc aag tca aag gtg 3053

Leu Gln Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys Ser Lys Val

875 880 885

gag cag ccc cag gac gtg gtg aca ggc aac cca aca gtg gtg agg ctg 3101

Glu Gln Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val Val Arg Leu

890 895 900

gtg gtg aga ttc tac cgt aat ggg cgg gga cag agt gcc ctg cag gag 3149

Val Val Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala Leu Gln Glu

905 910 915 920

att ctg ggc aag gtt atc cag gat gtg cta gaa gac aaa gtg ctc agc 3197

Ile Leu Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys Val Leu Ser

925 930 935

gtc cac aca gac cct gtc cac ctc tat aag aac tgg atc aac cag act 3245

Val His Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile Asn Gln Thr

940 945 950

gag gcc cag aca ggg cag cgc agc cat ctc cca tat gat gtc acc ccg 3293

Glu Ala Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp Val Thr Pro

955 960 965

gag cag gcc ttg agc cac ccc gag gtc cag aga cga ctg gac atc gcc 3341

Glu Gln Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu Asp Ile Ala

970 975 980

cta cgc aac ctc ctc gcc atg act gat aag ttc ctt tta gcc atc acc 3389

Leu Arg Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu Ala Ile Thr

985 990 995 1000

tca tct gtg gac caa att ccg tat ggg atg cga tat gtg gcc aaa gtc 3437

Ser Ser Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val Ala Lys Val

1005 1010 1015

ctg aag gca act ctg gca gag aaa ttc cct gac gcc aca gac agc gag 3485

Leu Lys Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr Asp Ser Glu

1020 1025 1030

gtc tat aag gtg gtc ggg aac ctc ctg tac tac cgc ttc ctg aac cca 3533

Val Tyr Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe Leu Asn Pro

1035 1040 1045

gct gtg gtg gct cct gac gcc ttc gac att gtg gcc atg gca gct ggt 3581

Ala Val Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met Ala Ala Gly

1050 1055 1060

gga gcc ctg gct gcc ccc cag cgc cat gcc ctg ggg gct gtg gct cag 3629

Gly Ala Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala Val Ala Gln

1065 1070 1075 1080

ctc cta cag cac gct gcg gct ggc aag gcc ttc tct ggg cag agc cag 3677

Leu Leu Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly Gln Ser Gln

1085 1090 1095

cac cta cgg gtc ctg aat gac tat ctg gag gaa aca cac ctc aag ttc 3725

His Leu Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His Leu Lys Phe

1100 1105 1110

agg aag ttc atc cat aga gcc tgc cag gtg cca gag cca gag gag cgt 3773

Arg Lys Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro Glu Glu Arg

1115 1120 1125

ttt gca gtg gac gag tac tca gac atg gtg gct gtg gcc aaa ccc atg 3821

Phe Ala Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala Lys Pro Met

1130 1135 1140

gtg tac atc acc gtg ggg gag ctg gtc aac acg cac agg ctg ttg ctg 3869

Val Tyr Ile Thr Val Gly Glu Leu Val Asn Thr His Arg Leu Leu Leu

1145 1150 1155 1160

gag cac cag gac tgc att gcc cct gat cac caa gac ccc ctg cat gag 3917

Glu His Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro Leu His Glu

1165 1170 1175

ctc ctg gag gat ctt ggg gag ctg ccc acc atc cct gac ctt att ggt 3965

Leu Leu Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp Leu Ile Gly

1180 1185 1190

gag agc atc gct gca gat ggg cac aca gac ctg agc aag cta gaa gtg 4013

Glu Ser Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys Leu Glu Val

1195 1200 1205

tcc ctg acg ctg acc aac aag ttt gaa gga cta gag gca gat gct gat 4061

Ser Leu Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala Asp Ala Asp

1210 1215 1220

gac tcc aac acc cgt agc ctg ctt ctg agc acc aag cag ctg ttg gcc 4109

Asp Ser Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln Leu Leu Ala

1225 1230 1235 1240

gat atc ata cag ttc cat cct ggg gac acc ctc aag gag atc ctg tcc 4157

Asp Ile Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu Ile Leu Ser

1245 1250 1255

ctc tcg gct tcc aga gag caa gaa gca gcc cac aag cag ctg atg agc 4205

Leu Ser Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln Leu Met Ser

1260 1265 1270

cga cgc cag gcc tgt aca gcc cag aca ccg gag cca ctg cga cga cac 4253

Arg Arg Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu Arg Arg His

1275 1280 1285

cgc tca ctg aca gct cac tcc ctc ctg cca ctg gca gag aag cag cgg 4301

Arg Ser Leu Thr Ala His Ser Leu Leu Pro Leu Ala Glu Lys Gln Arg

1290 1295 1300

cgc gtc ctg cgg aac ctg cgc cga ctt gaa gcc ctg ggg ttg gtc agc 4349

Arg Val Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly Leu Val Ser

1305 1310 1315 1320

gcc aga aat ggc tac cag ggg cta gtg gac gag ctg gcc aag gac atc 4397

Ala Arg Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala Lys Asp Ile

1325 1330 1335

cgc aac cag cac aga cac agg cac agg cgg aag gca gag ctg gtg aag 4445

Arg Asn Gln His Arg His Arg His Arg Arg Lys Ala G1u Leu Val Lys

1340 1345 1350

ctg cag gcc aca tta cag ggc ctg agc act aag acc acc ttc tat gag 4493

Leu Gln Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr Phe Tyr Glu

1355 1360 1365

gag cag ggt gac tac tac agc cag tac atc cgg gcc tgc ctg gac cac 4541

Glu Gln Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys Leu Asp His

1370 1375 1380

ctg gcc cec gac tcc aag agt tct ggg aag ggg aag aag cag cct tct 4589

Leu Ala Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys Gln Pro Ser

1385 1390 1395 1400

ctt cat tac act gct gct cag ctc ctg gaa aag ggt gtc ttg gtg gaa 4637

Leu His Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val Leu Val Glu

1405 1410 1415

att gaa gat ctt ccc gcc tct cac ttc aga aac gtc atc ttt gac atc 4685

Ile Glu Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile Phe Asp Ile

1420 1425 1430

acg ccg gga gat gag gca gga aag ttt gaa gta aat gcc aag ttc ctg 4733

Thr Pro Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala Lys Phe Leu

1435 1440 1445

ggt gtg gac atg gag cga ttt cag ctt cac tat cag gat ctc ctg cag 4781

Gly Val Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp Leu Leu Gln

1450 1455 1460

ctc cag tat gag ggt gtg gct gtc atg aaa ctc ttc aac aag gcc aaa 4829

Leu Gln Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn Lys Ala Lys

1465 1470 1475 1480

gtc aat gtc aac ctt ctc atc ttc ctc ctc aac aag aag ttt ttg cgg 4877

Val Asn Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys Phe Leu Arg

1485 1490 1495

aag tgacagaggc aaagggtgct acccaagccc ctcttacctc tctggatgct 4930

Lys

ttctttaaca ctaactcacc actgtgcttc cctgcagaca cccagagctc aggactgggc 4990

aaggcccagg gattctcacc ccttccccag ctgggaggag cttgcctgcc tggccacaga 5050

cagtgtatct tctaattggc taaagtgggc cttgcccaga gtccagctgt gtggctttta 5110

tcatgcatga caaacccctg gctttcctgc cagatggatt ctcatccctt acagctgact 5170

cttccaggca atttccatag atctgcagtc ctgcctctgc cacagtctct ctgttgtccc 5230

cacatctacc caacttcctg tactgttgcc cttctgatgt taataaaagc agctgttact 5290

ccc 5293

<210>2

<211>1497

<212>PRT

<213>智人(Homo sapiens)

<400>2

Met Pro Arg Val Val Tyr Cys Ile His Ala Leu Ser Leu Phe Leu Phe

1 5 10 15

Arg Leu Gly Leu Ala Pro Gln Ile His Asp Leu Tyr Gly Lys Val Lys

20 25 30

Phe Thr Ala Glu Glu Leu Ser Asn Met Ala Ser Glu Leu Ala Lys Tyr

35 40 45

Gly Leu Gin Leu Pro Ala Phe Ser Lys Ile Gly Gly Ile Leu Ala Asn

50 55 60

Glu Leu Ser Val Asp Glu Ala Ala Val His Ala Ala Val Leu Ala Ile

65 70 75 80

Asn Glu Ala Val Glu Arg Gly Val Val Glu Asp Thr Leu Ala Ala Leu

85 90 95

Gln Asn Pro Ser Ala Leu Leu Glu Asn Leu Arg Glu Pro Leu Ala Ala

100 105 110

Val Tyr Gln Glu Met Leu Ala Gln Ala Lys Met Glu Lys Ala Ala Asn

115 120 125

Ala Arg Asn His Asp Asp Arg Glu Ser Gln Asp Ile Tyr Asp His Tyr

130 135 140

Leu Thr Gln Ala Glu Ile Gln Gly Asn Ile Asn His Val Asn Val His

145 150 155 160

Gly Ala Leu Glu Val Val Asp Asp Ala Leu Glu Arg Gln Ser Pro Glu

165 170 175

Ala Leu Leu Lys Ala Leu Gln Asp Pro Ala Leu Ala Leu Arg Gly Val

180 185 190

Arg Arg Asp Phe Ala Asp Trp Tyr Leu Glu Gln Leu Asn Ser Asp Arg

195 200 205

Glu Gln Lys Ala Gln Glu Leu Gly Leu Val Glu Leu Leu Glu Lys Glu

210 215 220

Glu Val Gln Ala Gly Val Ala Ala Ala Asn Thr Lys Gly Asp Gln Glu

225 230 235 240

Gln Ala Met Leu His Ala Val Gln Arg Ile Asn Lys Ala Ile Arg Arg

245 250 255

Gly Val Ala Ala Asp Thr Val Lys Glu Leu Met Cys Pro Glu Ala Gln

260 265 270

Leu Pro Pro Val Tyr Pro Val Ala Ser Ser Met Tyr Gln Leu Glu Leu

275 280 285

Ala Val Leu Gln Gln Gln Gln Gly Glu Leu Gly Gln Glu Glu Leu Phe

290 295 300

Val Ala Val Glu Met Leu Ser Ala Val Val Leu Ile Asn Arg Ala Leu

305 310 315 320

Glu Ala Arg Asp Ala Ser Gly Phe Trp Ser Ser Leu Val Asn Pro Ala

325 330 335

Thr Gly Leu Ala Glu Val Glu Gly Glu Asn Ala Gln Arg Tyr Phe Asp

340 345 350

Ala Leu Leu Lys Leu Arg Gln Glu Arg Gly Met Gly Glu Asp Phe Leu

355 360 365

Ser Trp Asn Asp Leu Gln Ala Thr Val Ser Gln Val Asn Ala Gln Thr

370 375 380

Gln Glu Glu Thr Asp Arg Val Leu Ala Val Ser Leu Ile Asn Glu Ala

385 390 395 400

Leu Asp Lys Gly Ser Pro Glu Lys Thr Leu Ser Ala Leu Leu Leu Pro

405 410 415

Ala Ala Gly Leu Asp Asp Val Ser Leu Pro Val Ala Pro Arg Tyr His

420 425 430

Leu Leu Leu Val Ala Ala Lys Arg Gln Lys Ala Gln Val Thr Gly Asp

435 440 445

Pro Gly Ala Val Leu Trp Leu Glu Glu Ile Arg Gln Gly Val Val Arg

450 455 460

Ala Asn Gln Asp Thr Asn Thr Ala Gln Arg Met Ala Leu Gly Val Ala

465 470 475 480

Ala Ile Asn Gln Ala Ile Lys Glu Gly Lys Ala Ala Gln Thr Glu Arg

485 490 495

Val Leu Arg Asn Pro Ala Val Ala Leu Arg Gly Val Val Pro Asp Cys

500 505 510

Ala Asn Gly Tyr Gln Arg Ala Leu Glu Ser Ala Met Ala Lys Lys Gln

515 520 525

Arg Pro Ala Asp Thr Ala Phe Trp Val Gln His Asp Met Lys Asp Gly

530 535 540

Thr Ala Tyr Tyr Phe His Leu Gln Thr Phe Gln Gly Ile Trp Glu Gln

545 550 555 560

Pro Pro Gly Cys Pro Leu Asn Thr Ser His Leu Thr Arg Glu Glu Ile

565 570 575

Gln Ser Ala Val Thr Lys Val Thr Ala Ala Tyr Asp Arg Gln Gln Leu

580 585 590

Trp Lys Ala Asn Val Gly Phe Val Ile Gln Leu Gln Ala Arg Leu Arg

595 600 605

Gly Phe Leu Val Arg Gln Lys Phe Ala Glu His Ser His Phe Leu Arg

610 615 620

Thr Trp Leu Pro Ala Val Ile Lys Ile Gln Ala His Trp Arg Gly Tyr

625 630 635 640

Arg Gln Arg Lys Ile Tyr Leu Glu Trp Leu Gln Tyr Phe Lys Ala Asn

645 650 655

Leu Asp Ala Ile Ile Lys Ile Gln Ala Trp Ala Arg Met Trp Ala Ala

660 665 670

Arg Arg Gln Tyr Leu Arg Arg Leu His Tyr Phe Gln Lys Asn Val Asn

675 680 685

Ser Ile Val Lys Ile Gln Ala Phe Phe Arg Ala Arg Lys Ala Gln Asp

690 695 700

Asp Tyr Arg Ile Leu Val His Ala Pro His Pro Pro Leu Ser Val Val

705 710 715 720

Arg Arg Phe Ala His Leu Leu Asn Gln Ser Gln Gln Asp Phe Leu Ala

725 730 735

Glu Ala Glu Leu Leu Lys Leu Gln Glu Glu Val Val Arg Lys Ile Arg

740 745 750

Ser Asn Gln Gln Leu Glu Gln Asp Leu Asn Ile Met Asp Ile Lys Ile

755 760 765

Gly Leu Leu Val Lys Asn Arg Ile Thr Leu Gln Glu Val Val Ser His

770 775 780

Cys Lys Lys Leu Thr Lys Arg Asn Lys Glu Gln Leu Ser Asp Met Met

785 790 795 800

Val Leu Asp Lys Gln Lys Gly Leu Lys Ser Leu Ser Lys Glu Lys Arg

805 810 815

Gln Lys Leu Glu Ala Tyr Gln His Leu Phe Tyr Leu Leu Gln Thr Gln

820 825 830

Pro Ile Tyr Leu Ala Lys Leu Ile Phe Gln Met Pro Gln Asn Lys Thr

835 840 845

Thr Lys Phe Met Glu Ala Val Ile Phe Ser Leu Tyr Asn Tyr Ala Ser

850 855 860

Ser Arg Arg Glu Ala Tyr Leu Leu Leu Gln Leu Phe Lys Thr Ala Leu

865 870 875 880

Gln Glu Glu Ile Lys Ser Lys Val Glu Gln Pro Gln Asp Val Val Thr

885 890 895

Gly Asn Pro Thr Val Val Arg Leu Val Val Arg Phe Tyr Arg Asn Gly

900 905 910

Arg Gly Gln Ser Ala Leu Gln Glu Ile Leu Gly Lys Val Ile Gln Asp

915 920 925

Val Leu Glu Asp Lys Val Leu Ser Val His Thr Asp Pro Val His Leu

930 935 940

Tyr Lys Asn Trp Ile Asn Gln Thr Glu Ala Gln Thr Gly Gln Arg Ser

945 950 955 960

His Leu Pro Tyr Asp Val Thr Pro Glu Gln Ala Leu Ser His Pro Glu

965 970 975

Val Gln Arg Arg Leu Asp Ile Ala Leu Arg Asn Leu Leu Ala Met Thr

980 985 990

Asp Lys Phe Leu Leu Ala Ile Thr Ser Ser Val Asp Gln Ile Pro Tyr

995 1000 1005

Gly Met Arg Tyr Val Ala Lys Val Leu Lys Ala Thr Leu Ala Glu Lys

1010 1015 1020

Phe Pro Asp Ala Thr Asp Ser Glu Val Tyr Lys Val Val Gly Asn Leu

1025 1030 1035 1040

Leu Tyr Tyr Arg Phe Leu Asn Pro Ala Val Val Ala Pro Asp Ala Phe

1045 1050 1055

Asp Ile Val Ala Met Ala Ala Gly Gly Ala Leu Ala Ala Pro Gln Arg

1060 1065 1070

His Ala Leu Gly Ala Val Ala Gln Leu Leu Gln His Ala Ala Ala Gly

1075 1080 1085

Lys Ala Phe Ser Gly Gln Ser Gln His Leu Arg Val Leu Asn Asp Tyr

1090 1095 1100

Leu Glu Glu Thr His Leu Lys Phe Arg Lys Phe Ile His Arg Ala Cys

1105 1110 1115 1120

Gln Val Pro Glu Pro Glu Glu Arg Phe Ala Val Asp Glu Tyr Ser Asp

1125 1130 1135

Met Val Ala Val Ala Lys Pro Met Val Tyr Ile Thr Val Gly Glu Leu

1140 1145 1150

Val Asn Thr His Arg Leu Leu Leu Glu His Gln Asp Cys Ile Ala Pro

1155 1160 1165

Asp His Gln Asp Pro Leu His Glu Leu Leu Glu Asp Leu Gly Glu Leu

1170 1175 1180

Pro Thr Ile Pro Asp Leu Ile Gly Glu Ser Ile Ala Ala Asp Gly His

1185 1190 1195 1200

Thr Asp Leu Ser Lys Leu Glu Val Ser Leu Thr Leu Thr Asn Lys Phe

1205 1210 1215

Glu Gly Leu Glu Ala Asp Ala Asp Asp Ser Asn Thr Arg Ser Leu Leu

1220 1225 1230

Leu Ser Thr Lys Gln Leu Leu Ala Asp Ile Ile Gln Phe His Pro Gly

1235 1240 1245

Asp Thr Leu Lys Glu Ile Leu Ser Leu Ser Ala Ser Arg Glu Gln Glu

1250 1255 1260

Ala Ala His Lys Gln Leu Met Ser Arg Arg Gln Ala Cys Thr Ala Gln

1265 1270 1275 1280

Thr Pro Glu Pro Leu Arg Arg His Arg Ser Leu Thr Ala His Ser Leu

1285 1290 1295

Leu Pro Leu Ala Glu Lys Gln Arg Arg Val Leu Arg Asn Leu Arg Arg

1300 1305 1310

Leu Glu Ala Leu Gly Leu Val Ser Ala Arg Asn Gly Tyr Gln Gly Leu

1315 1320 1325

Val Asp Glu Leu Ala Lys Asp Ile Arg Asn Gln His Arg His Arg His

1330 1335 1340

Arg Arg Lys Ala Glu Leu Val Lys Leu Gln Ala Thr Leu Gln Gly Leu

1345 1350 1355 1360

Ser Thr Lys Thr Thr Phe Tyr Glu Glu Gln Gly Asp Tyr Tyr Ser Gln

1365 1370 1375

Tyr Ile Arg Ala Cys Leu Asp His Leu Ala Pro Asp Ser Lys Ser Ser

1380 1385 1390

Gly Lys Gly Lys Lys Gln Pro Ser Leu His Tyr Thr Ala Ala Gln Leu

1395 1400 1405

Leu Glu Lys Gly Val Leu Val Glu Ile Glu Asp Leu Pro Ala Ser His

1410 1415 1420

Phe Arg Asn Val Ile Phe Asp Ile Thr Pro Gly Asp Glu Ala Gly Lys

1425 1430 1435 1440

Phe Glu Val Asn Ala Lys Phe Leu Gly Val Asp Met Glu Arg Phe Gln

1445 1450 1455

Leu His Tyr Gln Asp Leu Leu Gln Leu Gln Tyr Glu Gly Val Ala Val

1460 1465 1470

Met Lys Leu Phe Asn Lys Ala Lys Val Asn Val Asn Leu Leu Ile Phe

1475 1480 1485

Leu Leu Asn Lys Lys Phe Leu Arg Lys

1490 1495

<210>3

<211>5317

<212>DNA

<213>智人(Homo sapiens)

<220>

<221>CDS

<222>(12)..(4904)

<223>LBFL109 Clone B

<400>3

gaaggaggaa c atg gag agg aga gca gcg ggc cca ggc tgg gca 44

Met Glu Arg Arg Ala Ala Gly Pro Gly Trp Ala

1 5 10

gcc tat gaa cgc ctc aca gct gag gag atg gat gag cag agg cgg cag 92

Ala Tyr Glu Arg Leu Thr Ala Glu Glu Met Asp Glu Gln Arg Arg Gln

15 20 25

aat gtt gcc tat cag tac ctg tgc cgg ctg gag gag gcc aag cgc tgg 140

Asn Val Ala Tyr Gln Tyr Leu Cys Arg Leu Glu Glu Ala Lys Arg Trp

30 35 40

atg gag gcc tgc ctg aag gag gag ctt cct tcc ccg gtg gag ctg gag 188

Met Glu Ala Cys Leu Lys Glu Glu Leu Pro Ser Pro Val Glu Leu Glu

45 50 55

gag agc ctt cgg aat gga gtg ctg ctg gcc aag ctg ggc cac tgt ttt 236

Glu Ser Leu Arg Asn Gly Val Leu Leu Ala Lys Leu Gly His Cys Phe

60 65 70 75

gca ccc tcc gtg gtt ccg ttg aag aag atc tac gat gtg gag cag ctg 284

Ala Pro Ser Val Val Pro Leu Lys Lys Ile Tyr Asp Val Glu Gln Leu

80 85 90

cgg tac cag gca act ggc tta cat ttc cgt cac aca gac aac atc aac 332

Arg Tyr Gln Ala Thr Gly Leu His Phe Arg His Thr Asp Asn Ile Asn

95 100 105

ttt tgg cta tct gca ata gcc cac atc ggt ctg cct tcg acc ttc ttc 380

Phe Trp Leu Ser Ala Ile Ala His Ile Gly Leu Pro Ser Thr Phe Phe

110 115 120

cca gag acc acg gac atc tat gac aaa aag aac atg ccc cgg gta gtc 428

Pro Glu Thr Thr Asp Ile Tyr Asp Lys Lys Asn Met Pro Arg Val Val

125 130 135

tac tgc atc cat gct ctc agt ctc ttc ctc ttc cgg ctg gga ttg gcc 476

Tyr Cys Ile His Ala Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala

140 145 150 155

cct cag ata cat gat cta tac ggg aaa gtg aaa ttc aca gct gag gaa 524

Pro Gln Ile His Asp Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu

160 165 170

ctc agc aac atg gcg tcc gaa ctg gcc aaa tat ggc ctc cag ctg cct 572

Leu Ser Asn Met Ala Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro

175 180 185

gcc ttc agc aag atc ggg ggc atc ttg gcc aat gag ctc tcg gtg gat 620

Ala Phe Ser Lys Ile Gly Gly lle Leu Ala Asn Glu Leu Ser Val Asp

190 195 200

gag gct gca gtc cat gca gct gtt ctt gcc atc aat gaa gca gtg gag 668

Glu Ala Ala Val His Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu

205 210 215

cga ggg gtg gtg gag gac acc ctg gct gcc ttg cag aat ccc agt gct 716

Arg Gly Val Val Glu Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala

220 225 230 235

ctt ctg gag aat ctc cga gag cct ctg gca gcc gtc tac cag gag atg 764

Leu Leu Glu Asn Leu Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met

240 245 250

ctg gcc cag gcc aag atg gag aag gca gcc aat gcc agg aac cat gat 812

Leu Ala Gln Ala Lys Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp

255 260 265

gac aga gaa agc cag gac atc tat gac cac tac cta act cag gct gaa 860

Asp Arg Glu Ser Gln Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu

270 275 280

atc cag ggc aat atc aac cat gtc aac gtc cat ggg gct cta gaa gtt 908

Ile Gln Gly Asn Ile Asn His Val Asn Val His Gly Ala Leu Glu Val

285 290 295

gtt gat gat gcc ctg gaa aga cag agc cct gaa gcc ttg ctc aag gcc 956

Val Asp Asp Ala Leu Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala

300 305 310 315

ctt caa gac cct gcc ctg gcc ctg cga ggg gtg agg aga gac ttt gct 1004

Leu Gln Asp Pro Ala Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala

320 325 330

gac tgg tac ctg gag cag ctg aac tca gac aga gag cag aag gca cag 1052

Asp Trp Tyr Leu Glu Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln

335 340 345

gag ctg ggc ctg gtg gag ctt ctg gaa aag gag gaa gtc cag gct ggt 1100

Glu Leu Gly Leu Val Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly

350 355 360

gtg gct gca gcc aac aca aag ggt gat cag gaa caa gcc atg ctc cac 1148

Val Ala Ala Ala Asn Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His

365 370 375

gct gtg cag cgg atc aac aaa gcc atc cgg agg gga gtg gcg gct gac 1196

Ala Val Gln Arg Ile Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp

380 385 390 395

act gtg aag gag ctg atg tgc cct gag gcc cag ctg cct cca gtg tac 1244

Thr Val Lys Glu Leu Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr

400 405 410

cct gtt gca tcg tct atg tac cag ctg gag ctg gca gtg ctc cag cag 1292

Pro Val Ala Ser Ser Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln

415 420 425

cag cag ggg gag ctt ggc cag gag gag ctc ttc gtg gct gtg gag atg 1340

Gln Gln Gly Glu Leu Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met

430 435 440

ctc tca gct gtg gtc ctg att aac cgg gcc ctg gag gcc cgg gat gcc 1388

Leu Ser Ala Val Val Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala

445 450 455

agt ggc ttc tgg agc agc ctg gtg aac cct gcc aca ggc ctg gct gag 1436

Ser Gly Phe Trp Ser Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu

460 465 470 475

gtg gaa gga gaa aat gcc cag cgt tac ttc gat gcc ctg ctg aaa ttg 1484

Val Glu Gly Glu Asn Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu

480 485 490

cga cag gag cgt ggg atg ggt gag gac ttc ctg agc tgg aat gac ctg 1532

Arg Gln Glu Arg Gly Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu

495 500 505

cag gcc acc gtg agc cag gtc aat gca cag acc cag gaa gag act gac 1580

Gln Ala Thr Val Ser Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp

510 515 520

cgg gtc ctt gca gtc agc ctc atc aat gag gct ctg gac aaa ggc agc 1628

Arg Val Leu Ala Val Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser

525 530 535

cct gag aag act ctg tct gcc cta ctg ctt cct gca gct ggc cta gat 1676

Pro Glu Lys Thr Leu Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp

540 545 550 555

gat gtc agc ctc cct gtc gcc cct cgg tac cat ctc ctc ctt gtg gca 1724

Asp Val Ser Leu Pro Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala

560 565 570

gcc aaa agg cag aag gcc cag gtg aca ggg gat cct gga gct gtg ctg 1772

Ala Lys Arg Gln Lys Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu

575 580 585

tgg ctt gag gag atc cgc cag gga gtg gtc aga gcc aac cag gac act 1820

Trp Leu Glu Glu Ile Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr

590 595 600

aat aca gct cag aga atg gct ctt ggt gtg gct gcc atc aat caa gcc 1868

Asn Thr Ala Gln Arg Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala

605 610 615

atc aag gag ggc aag gca gcc cag act gag cgg gtg ttg agg aac ccc 1916

Ile Lys Glu Gly Lys Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro

620 625 630 635

gca gtg gcc ctt cga ggg gta gtt ccc gac tgt gcc aac ggc tac cag 1964

Ala Val Ala Leu Arg Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln

640 645 650

cga gcc ctg gaa agt gcc atg gca aag aaa cag cgt cca gca gac aca 2012

Arg Ala Leu Glu Ser Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr

655 660 665

gct ttc tgg gtt caa cat gac atg aag gat ggc act gcc tac tac ttc 2060

Ala Phe Trp Val Gln His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe

670 675 680

cat ctg cag acc ttc cag ggg atc tgg gag caa cct cct ggc tgc ccc 2108

His Leu Gln Thr Phe Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro

685 690 695

ctc aac acc tct cac ctg acc cgg gag gag atc cag tca gct gtc acc 2156

Leu Asn Thr Ser His Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr

700 705 710 715

aag gtc act gct gcc tat gac cgc caa cag ctc tgg aaa gcc aac gtc 2204

Lys Val Thr Ala Ala Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val

720 725 730

ggc ttt gtt atc cag ctc cag gcc cgc ctc cgt ggc ttc cta gtt cgg 2252

Gly Phe Val Ile Gln Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg

735 740 745

cag aag ttt gct gag cat tcc cac ttt ctg agg acc tgg ctc cca gca 2300

Gln Lys Phe Ala Glu His Ser His Phe Leu Arg Thr Trp Leu Pro Ala

750 755 760

gtc atc aag atc cag gct cat tgg cgg ggt tat agg cag cgg aag att 2348

Val Ile Lys Ile Gln Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile

765 770 775

tac ctg gag tgg ttg cag tat ttt aaa gca aac ctg gat gcc ata atc 2396

Tyr Leu Glu Trp Leu Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile

780 785 790 795

aag atc cag gcc tgg gcc cgg atg tgg gca gct cgg agg caa tac ctg 2444

Lys Ile Gln Ala Trp Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu

800 805 810

agg cgt ctg cac tac ttc cag aag aat gtt aac tcc att gtg aag atc 2492

Arg Arg Leu His Tyr Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile

815 820 825

cag gca ttt ttc cga gcc agg aaa gcc caa gat gac tac agg ata tta 2540

Gln Ala Phe Phe Arg Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu

830 835 840

gtg cat gca ccc cac cct cct ctc agt gtg gta cgc aga ttt gcc cat 2588

Val His Ala Pro His Pro Pro Leu Ser Val Val Arg Arg Phe Ala His

845 850 855

ctc ttg aat caa agc cag caa gac ttc ttg gct gag gca gag ctg ctg 2636

Leu Leu Asn Gln Ser Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu

860 865 870 875

aag ctc cag gaa gag gta gtt agg aag atc cga tcc aat cag cag ctg 2684

Lys Leu Gln Glu Glu Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu

880 885 890

gag cag gac ctc aac atc atg gac atc aag att ggc ctg ctg gtg aag 2732

Glu Gln Asp Leu Asn Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys

895 900 905

aac cgg atc act ctg cag gaa gtg gtc tcc cac tgc aag aag ctg acc 2780

Asn Arg Ile Thr Leu Gln Glu Val Val Ser His Cys Lys Lys Leu Thr

910 915 920

aag agg aat aag gaa cag ctg tca gat atg atg gtt ctg gac aag cag 2828

Lys Arg Asn Lys Glu Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln

925 930 935

aag ggt tta aag tcg ctg agc aaa gag aaa cgg cag aaa cta gaa gca 2876

Lys Gly Leu Lys Ser Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala

940 945 950 955

tac caa cac ctc ttc tac ctg ctc cag act cag ccc atc tac ctg gcc 2924

Tyr Gln His Leu Phe Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala

960 965 970

aag ctg atc ttt cag atg cca cag aac aaa acc acc aag ttc atg gag 2972

Lys Leu Ile Phe Gln Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu

975 980 985

gca gtg att ttc agc ctg tac aac tat gcc tcc agc cgc cga gag gcc 3020

Ala Val Ile Phe Ser Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala

990 995 1000

tat ctc ctg ctc cag ctg ttc aag aca gca ctc cag gag gaa atc aag 3068

Tyr Leu Leu Leu Gln Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys

1005 1010 1015

tca aag gtg gag cag ccc cag gac gtg gtg aca ggc aac cca aca gtg 3116

Ser Lys Val Glu Gln Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val

1020 1025 1030 1035

gtg agg ctg gtg gtg aga ttc tac cgt aat ggg cgg gga cag agt gcc 3164

Val Arg Leu Val Val Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala

1040 1045 1050

ctg cag gag att ctg ggc aag gtt atc cag gat gtg cta gaa gac aaa 3212

Leu Gln Glu Ile Leu Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys

1055 1060 1065

gtg ctc agc gtc cac aca gac cct gtc cac ctc tat aag aac tgg atc 3260

Val Leu Ser Val His Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile

1070 1075 1080

aac cag act gag gcc cag aca ggg cag cgc agc cat ctc cca tat gat 3308

Asn Gln Thr Glu Ala Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp

1085 1090 1095

gtc acc ccg gag cag gcc ttg agc cac ccc gag gtc cag aga cga ctg 3356

Val Thr Pro Glu Gln Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu

1100 1105 1110 1115

gac atc gcc cta cgc aac ctc ctc gcc atg act gat aag ttc ctt tta 3404

Asp Ile Ala Leu Arg Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu

1120 1125 1130

gcc atc acc tca tct gtg gac caa att ccg tat ggg atg cga tat gtg 3452

Ala Ile Thr Ser Ser Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val

1135 1140 1145

gcc aaa gtc ctg aag gca act ctg gca gag aaa ttc cct gac gcc aca 3500

Ala Lys Val Leu Lys Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr

1150 1155 1160

gac agc gag gtc tat aag gtg gtc ggg aac ctc ctg tac tac cgc ttc 3548

Asp Ser Glu Val Tyr Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe

1165 1170 1175

ctg aac cca gct gtg gtg gct cct gac gcc ttc gac att gtg gcc atg 3596

Leu Asn Pro Ala Val Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met

1180 1185 1190 1195

gca gct ggt gga gcc ctg gct gcc ccc cag cgc cat gcc ctg ggg gct 3644

Ala Ala Gly Gly Ala Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala

1200 1205 1210

gtg gct cag ctc cta cag cac gct gcg gct ggc aag gcc ttc tct ggg 3692

Val Ala Gln Leu Leu Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly

1215 1220 1225

cag agc cag cac cta cgg gtc ctg aat gac tat ctg gag gaa aca cac 3740

Gln Ser Gln His Leu Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His

1230 1235 1240

ctc aag ttc agg aag ttc atc cat aga gcc tgc cag gtg cca gag cca 3788

Leu Lys Phe Arg Lys Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro

1245 1250 1255

gag gag cgt ttt gca gtg gac gag tac tca gac atg gtg gct gtg gcc 3836

Glu Glu Arg Phe Ala Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala

1260 1265 1270 1275

aaa ccc atg gtg tac atc acc gtg ggg gag ctg gtc aac acg cac agg 3884

Lys Pro Met Val Tyr Ile Thr Val Gly Glu Leu Val Asn Thr His Arg

1280 1285 1290

ctg ttg ctg gag cac cag gac tgc att gcc cct gat cac caa gac ccc 3932

Leu Leu Leu Glu His Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro

1295 1300 1305

ctg cat gag ctc ctg gag gat ctt ggg gag ctg ccc acc atc cct gac 3980

Leu His Glu Leu Leu Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp

1310 1315 1320

ctt att ggt gag agc atc gct gca gat ggg cac aca gac ctg agc aag 4028

Leu Ile Gly Glu Ser Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys

1325 1330 1335

cta gaa gtg tcc ctg acg ctg acc aac aag ttt gaa gga cta gag gca 4076

Leu Glu Val Ser Leu Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala

1340 1345 1350 1355

gat gct gat gac tcc aac acc cgt agc ctg ctt ctg agc acc aag cag 4124

Asp Ala Asp Asp Ser Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln

1360 1365 1370

ctg ttg gcc gat atc ata cag ttc cat cct ggg gac acc ctc aag gag 4172

Leu Leu Ala Asp Ile Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu

1375 1380 1385

atc ctg tcc ctc tcg gct tcc aga gag caa gaa gca gcc cac aag cag 4220

Ile Leu Ser Leu Ser Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln

1390 1395 1400

ctg atg agc cga cgc cag gcc tgt aca gcc cag aca ccg gag cca ctg 4268

Leu Met Ser Arg Arg Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu

1405 1410 1415

cga cga cac cgc tca ctg aca gct cac tcc ctc ctg cca ctg gca gag 4316

Arg Arg His Arg Ser Leu Thr Ala His Ser Leu Leu Pro Leu A1a Glu

1420 1425 1430 1435

aag cag cgg cgc gtc ctg cgg aac ctg cgc cga ctt gaa gcc ctg ggg 4364

Lys Gln Arg Arg Val Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly

1440 1445 1450

ttg gtc agc gcc aga aat ggc tac cag ggg cta gtg gac gag ctg gcc 4412

Leu Val Ser Ala Arg Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala

1455 1460 1465

aag gac atc cgc aac cag cac aga cac agg cac agg cgg aag gca gag 4460

Lys Asp Ile Arg Asn Gln His Arg His Arg His Arg Arg Lys Ala Glu

1470 1475 1480

ctg gtg aag ctg cag gcc aca tta cag ggc ctg agc act aag acc acc 4508

Leu Val Lys Leu Gln Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr

1485 1490 1495

ttc tat gag gag cag ggt gac tac tac agc cag tac atc cgg gcc tgc 4556

Phe Tyr Glu Glu Gln Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys

1500 1505 1510 1515

ctg gac cac ctg gcc ccc gac tcc aag agt tct ggg aag ggg aag aag 4604

Leu Asp His Leu Ala Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys

1520 1525 1530

cag cct tct ctt cat tac act gct gct cag ctc ctg gaa aag ggt gtc 4652

Gln Pro Ser Leu His Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val

1535 1540 1545

ttg gtg gaa att gaa gat ctt ccc gcc tct cac ttc aga aac gtc atc 4700

Leu Val Glu Ile Glu Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile

1550 1555 1560

ttt gac atc acg ccg gga gat gag gca gga aag ttt gaa gta aat gcc 4748

Phe Asp Ile Thr Pro Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala

1565 1570 1575

aag ttc ctg ggt gtg gac atg gag cga ttt cag ctt cac tat cag gat 4796

Lys Phe Leu Gly Val Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp

1580 1585 1590 1595

crc ctg cag ctc cag tat gag ggt gtg gct gtc atg aaa crc ttc aac 4844

Leu Leu Gln Leu Gln Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn

1600 1605 1610

aag gcc aaa gtc aat gtc aac ctt ctc arc ttc crc ctc aac aag aag 4892

Lys Ala Lys Val Asn Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys

1615 1620 1625

ttt ttg cgg aag tgacag aggcaaaggg tgctacccaa gcccctctta 4940

Phe Leu Arg Lys

1630

cctctctgga tgctttcttt aacactaact caccactgtg cttccctgca gacacccaga 5000

gctcaggact gggcaaggcc cagggattct caccccttcc ccagctggga ggagcttgcc 5060

tgcctggcca cagacagtgt atcttctaat tggctaaagt gggccttgcc cagagtccag 5120

ctgtgtggct tttatcatgc atgacaaacc cctggctttc ctgccagatg gattctcatc 5180

ccttacagct gactcttcca ggcaatttcc atagatctgc agtcctgcct ctgccacagt 5240

ctctctgttg tccccacatc tacccaactt cctgtactgt tgcccttctg atgttaataa 5300

aagcagctgt tactccc 5317

<210>4

<211>1631

<212>PRT

<213>智人(Homo sapiens)

<400>4

Met Glu Arg Arg Ala Ala Gly Pro Gly Trp Ala Ala Tyr Glu Arg Leu

1 5 10 15

Thr Ala Glu Glu Met Asp Glu Gln Arg Arg Gln Ash Val Ala Tyr Gln

20 25 30

Tyr Leu Cys Arg Leu Glu Glu Ala Lys Arg Trp Met Glu Ala Cys Leu

35 40 45

Lys Glu Glu Leu Pro Ser Pro Val Glu Leu Glu Glu Ser Leu Arg Asn

50 55 60

Gly Val Leu Leu Ala Lys Leu Gly His Cys Phe Ala Pro Ser Val Val

65 70 75 80

Pro Leu Lys Lys Ile Tyr Asp Val Glu Gln Leu Arg Tyr Gln Ala Thr

85 90 95

Gly Leu His Phe Arg His Thr Asp Asn Ile Asn Phe Trp Leu Ser Ala

100 105 110

Ile Ala His Ile Gly Leu Pro Ser Thr Phe Phe Pro Glu Thr Thr Asp

115 120 125

Ile Tyr Asp Lys Lys Asn Met Pro Arg Val Val Tyr Cys Ile His Ala

130 135 140

Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala Pro Gln Ile His Asp

145 150 155 160

Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu Leu Ser Asn Met Ala

165 170 175

Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro Ala Phe Ser Lys Ile

180 185 190

Gly Gly Ile Leu Ala Asn Glu Leu Ser Val Asp Glu Ala Ala Val His

195 200 205

Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu Arg Gly Val Val Glu

210 215 220

Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala Leu Leu Glu Asn Leu

225 230 235 240

Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met Leu Ala Gln Ala Lys

245 250 255

Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp Asp Arg Glu Ser Gln

260 265 270

Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu Ile Gln Gly Asn Ile

275 280 285

Asn His Val Asn Val His Gly Ala Leu Glu Val Val Asp Asp Ala Leu

290 295 300

Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala Leu Gln Asp Pro Ala

305 310 315 320

Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala Asp Trp Tyr Leu Glu

325 330 335

Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln Glu Leu Gly Leu Val

340 345 350

Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly Val Ala Ala Ala Asn

355 360 365

Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His Ala Val Gln Arg Ile

370 375 380

Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp Thr Val Lys Glu Leu

385 390 395 400

Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr Pro Val Ala Ser Ser

405 410 415

Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln Gln Gln Gly Glu Leu

420 425 430

Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met Leu Ser Ala Val Val

435 440 445

Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala Ser Gly Phe Trp Ser

450 455 460

Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu Val Glu Gly Glu Asn

465 470 475 480

Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu Arg Gln Glu Arg Gly

485 490 495

Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu Gln Ala Thr Val Ser

500 505 510

Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp Arg Val Leu Ala Val

515 520 525

Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser Pro Glu Lys Thr Leu

530 535 540

Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp Asp Val Ser Leu Pro

545 550 555 560

Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala Ala Lys Arg Gln Lys

565 570 575

Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu Trp Leu Glu Glu Ile

580 585 590

Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr Asn Thr Ala Gln Arg

595 600 605

Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala Ile Lys Glu Gly Lys

610 615 620

Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro Ala Val Ala Leu Arg

625 630 635 640

Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln Arg Ala Leu Glu Ser

645 650 655

Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr Ala Phe Trp Val Gln

660 665 670

His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe His Leu Gln Thr Phe

675 680 685

Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro Leu Asn Thr Ser His

690 695 700

Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr Lys Val Thr Ala Ala

705 710 715 720

Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val Gly Phe Val Ile Gln

725 730 735

Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg Gln Lys Phe Ala Glu

740 745 750

His Ser His Phe Leu Arg Thr Trp Leu Pro Ala Val Ile Lys Ile Gln

755 760 765

Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile Tyr Leu Glu Trp Leu

770 775 780

Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile Lys Ile Gln Ala Trp

785 790 795 800

Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu Arg Arg Leu His Tyr

805 810 815

Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile Gln Ala Phe Phe Arg

820 825 830

Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu Val His Ala Pro His

835 840 845

Pro Pro Leu Ser Val Val Arg Arg Phe Ala His Leu Leu Asn Gln Ser

850 855 860

Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu Lys Leu Gln Glu Glu

865 870 875 880

Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu Glu Gln Asp Leu Asn

885 890 895

Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys Asn Arg Ile Thr Leu

900 905 910

Gln Glu Val Val Ser His Cys Lys Lys Leu Thr Lys Arg Asn Lys Glu

915 920 925

Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln Lys Gly Leu Lys Ser

930 935 940

Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala Tyr Gln His Leu Phe

945 950 955 960

Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala Lys Leu Ile Phe Gln

965 970 975

Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu Ala Val Ile Phe Ser

980 985 990

Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala Tyr Leu Leu Leu Gln

995 1000 1005

Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys Ser Lys Val Glu Gln

1010 1015 1020

Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val Val Arg Leu Val Val

1025 1030 1035 1040

Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala Leu Gln Glu Ile Leu

1045 1050 1055

Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys Val Leu Ser Val His

1060 1065 1070

Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile Asn Gln Thr Glu Ala

1075 1080 1085

Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp Val Thr Pro Glu Gln

1090 1095 1100

Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu Asp Ile Ala Leu Arg

l105 1110 1115 1120

Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu Ala Ile Thr Ser Ser

1125 1130 1135

Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val Ala Lys Val Leu Lys

1140 1145 1150

Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr Asp Ser Glu Val Tyr

1155 1160 1165

Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe Leu Asn Pro Ala Val

1170 1175 1180

Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met Ala Ala Gly Gly Ala

1185 1190 1195 1200

Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala Val Ala Gln Leu Leu

1205 1210 1215

Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly Gln Ser Gln His Leu

1220 1225 1230

Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His Leu Lys Phe Arg Lys

1235 1240 1245

Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro Glu Glu Arg Phe Ala

1250 1255 1260

Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala Lys Pro Met Val Tyr

1265 1270 1275 1280

Ile Thr Val Gly Glu Leu Val Asn Thr His Arg Leu Leu Leu Glu His

1285 1290 1295

Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro Leu His Glu Leu Leu

1300 1305 1310

Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp Leu Ile Gly Glu Ser

1315 1320 1325

Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys Leu Glu Val Ser Leu

1330 1335 1340

Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala Asp Ala Asp Asp Ser

1345 1350 1355 1360

Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln Leu Leu Ala Asp Ile

1365 1370 1375

Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu Ile Leu Ser Leu Ser

1380 1385 1390

Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln Leu Met Ser Arg Arg

1395 1400 1405

Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu Arg Arg His Arg Ser

1410 1415 1420

Leu Thr Ala His Ser Leu Leu Pro Leu Ala Glu Lys Gln Arg Arg Val

1425 1430 1435 1440

Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly Leu Val Ser Ala Arg

1445 1450 1455

Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala Lys Asp Ile Arg Asn

1460 1465 1470

Gln His Arg His Arg His Arg Arg Lys Ala Glu Leu Val Lys Leu Gln

1475 1480 1485

Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr Phe Tyr Glu Glu Gln

1490 1495 1500

Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys Leu Asp His Leu Ala

1505 1510 1515 1520

Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys Gln Pro Ser Leu His

1525 1530 1535

Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val Leu Val Glu Ile Glu

1540 1545 1550

Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile Phe Asp Ile Thr Pro

1555 1560 1565

Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala Lys Phe Leu Gly Val

1570 1575 1580

Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp Leu Leu Gln Leu Gln

1585 1590 1595 1600

Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn Lys Ala Lys Val Asn

1605 1610 1615

Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys Phe Leu Arg Lys

1620 1625 1630

<210>5

<211>3608

<212>DNA

<213>智人(Homo sapiens)

<220>

<221>CDS

<222>(424)..(1908)

<223>Clone LBFL110

<400>5

ggcggcgaga gcagctgcag ctcgcatctc aggcagtacc tagaggagct gccggtgcct 60

cctcagaaca tctcctgatc gctacccagg accaggcacc aaggacaggg agtcccaggc 120

gcacaccccc cattctgggt cccccaggcc cagaccccca ctctgccaca ggttgcatct 180

tgacctggtc ctcctgcaga agtggcccct gtggtcctgc tctgagactc gtccctgggc 240

gcccctgcag cccctttcta tgactccatc tggatttggc tggctgtggg gacgcggtcc 300

gaggggcggc ctggctctca gcgtggtggc agccagctct ctggccacca tggcaaatgc 360

tgagatctga ggggacaagg ctctacagcc tcagccaggg gcactcagct gttgcagggt 420

gtg atg gag aac aaa gct atg tac cta cac acc gtc agc gac tgt 465

Met Glu Asn Lys Ala Met Tyr Leu His Thr Val Ser Asp Cys

1 5 10

gac acc agc tcc atc tgt gag gat tcc ttt gat ggc agg agc ctg tcc 513

Asp Thr Ser Ser Ile Cys Glu Asp Ser Phe Asp Gly Arg Ser Leu Ser

15 20 25 30

aag ctg aac ctg tgt gag gat ggt cca tgt cac aaa cgg cgg gca agc 561

Lys Leu Asn Leu Cys Glu Asp Gly Pro Cys His Lys Arg Arg Ala Ser

35 40 45

atc tgc tgt acc cag ctg ggg tcc ctg tcg gcc ctg aag cat gct gtc 609

Ile Cys Cys Thr Gln Leu Gly Ser Leu Ser Ala Leu Lys His Ala Val

50 55 60

ctg ggg ctc tac ctg ctg gtc ttc ctg att ctt gtg ggc atc ttc atc 657

Leu Gly Leu Tyr Leu Leu Val Phe Leu Ile Leu Val Gly Ile Phe Ile

65 70 75

tta gca gtg tcc agg ccg cgc agc tcc cct gac gac ctg aag gcc ctg 705

Leu Ala yal Ser Arg Pro Arg Ser Ser Pro Asp Asp Leu Lys Ala Leu

80 85 90

act cgc aat gtg aac cgg ctg aat gag agc ttc cgg gac ttg cag ctg 753

Thr Arg Asn Val Asn Arg Leu Asn Glu Ser Phe Arg Asp Leu Gln Leu

95 100 105 110

cgg ctg ctg cag gct ccg ctg caa gcg gac ctg acg gag cag gtg tgg 801

Arg Leu Leu Gln Ala Pro Leu Gln Ala Asp Leu Thr Glu Gln Val Trp

115 120 125

aag gtg cag gac gcg ctg cag aac cag tca gac tcg ttg ctg gcg ctg 849

Lys Val Gln Asp Ala Leu Gln Asn Gln Ser Asp Ser Leu Leu Ala Leu

130 135 140

gcg ggc gca gtg cag cgg ctg gag ggc gcg ctg tgg ggg ctg cag gcg 897

Ala Gly Ala Val Gln Arg Leu Glu Gly Ala Leu Trp Gly Leu Gln Ala

145 150 155

cag gcg gtg cag acc gag cag gcg gtg gcc ctg ctg cgg gac cgc acg 945

Gln Ala Val Gln Thr Glu Gln Ala Val Ala Leu Leu Arg Asp Arg Thr

160 165 170

ggc cag cag agc gac acg gcg cag ctg gag ctc tac cag ctg cag gtg 993

Gly Gln Gln Ser Asp Thr Ala Gln Leu Glu Leu Tyr Gln Leu Gln Val

175 180 185 190

gag agc aac agt agc cag ctg ctg ctg agg cgc cac gcg ggc ctg ctg 1041

Glu Ser Asn Ser Ser Gln Leu Leu Leu Arg Arg His Ala Gly Leu Leu

195 200 205

gac ggg ctg gcg cgc agg gtg ggc atc ctg ggc gag gag ctg gcc gac 1089

Asp Gly Leu Ala Arg Arg Val Gly Ile Leu Gly Glu Glu Leu Ala Asp

210 215 220

gtg ggc ggc gtg ctg cgc ggc ctc aac cac agc ctg tcc tac gac gtg 1137

Val Gly Gly Val Leu Arg Gly Leu Asn His Ser Leu Ser Tyr Asp Val

225 230 235

gcc ctc cac cgc acg cgg ctg cag gac ctg cgg gtg ctg gtg agc aac 1185

Ala Leu His Arg Thr Arg Leu Gln Asp Leu Arg Val Leu Val Ser Asn

240 245 250

gcc agc gag gac acg cgc cgc ctg cgc ctg gcg cac gta ggc atg gag 1233

Ala Ser Glu Asp Thr Arg Arg Leu Arg Leu Ala His Val Gly Met Glu

255 260 265 270

ctg cag ctg aag cag gag ctg gcc atg ctc aac gcg gtc acc gag gac 1281

Leu Gln Leu Lys Gln Glu Leu Ala Met Leu Asn Ala Val Thr Glu Asp

275 280 285

ctg cgc ctc aag gac tgg gag cac tcc atc gca ctg cgg aac atc tcc 1329

Leu Arg Leu Lys Asp Trp Glu His Ser Ile Ala Leu Arg Asn Ile Ser

290 295 300

ctc gcg aaa ggg cca ccg gga ccc aaa ggt gat cag ggg cat gaa gga 1377

Leu Ala Lys Gly Pro Pro Gly Pro Lys Gly Asp Gln Gly His Glu Gly

305 310 315

aag gaa ggc agg cct ggc atc cct gga ttg cct gga ctt cga ggt ctg 1425

Lys Glu Gly Arg Pro Gly Ile Pro Gly Leu Pro Gly Leu Arg Gly Leu

320 325 330

ccc ggg gag aga ggt acc cca gga ttg ccc ggg ccc aag ggc gat gat 1473

Pro Gly Glu Arg Gly Thr Pro Gly Leu Pro Gly Pro Lys Gly Asp Asp

335 340 345 350

ggg aag ctg ggg gcc aca gga cca atg ggc atg cgt ggg ttc aaa ggt 1521

Gly Lys Leu Gly Ala Thr Gly Pro Met Gly Met Arg Gly Phe Lys Gly

355 360 365

gac cga ggc cca aaa gga gag aaa gga gag aaa gga gac aga gct ggg 1569

Asp Arg Gly Pro Lys Gly Glu Lys Gly Glu Lys Gly Asp Arg Ala Gly

370 375 380

gat gcc agt ggc gtg gag gcc ccg atg atg atc cgc ctg gtg aat ggc 1617

Asp Ala Ser Gly Val Glu Ala Pro Met Met Ile Arg Leu Val Asn Gly

385 390 395

tca ggt ccg cac gag ggc cgc gtg gaa gtg tac cac gac cgg cgt tgg 1665

Ser Gly Pro His Glu Gly Arg Val G1u Val Tyr His Asp Arg Arg Trp

400 405 410

ggc acc gtg tgt gac gac ggc tgg gac aag aag gac gga gac gtg gtg 1713

Gly Thr Val Cys Asp Asp Gly Trp Asp Lys Lys Asp Gly Asp Val Val

415 420 425 430

tgc cgc atg ctc ggc ttc cgc ggt gtg gag gag gtg tac cgc aca gct 1761

Cys Arg Met Leu Gly Phe Arg Gly Val Glu Glu Val Tyr Arg Thr Ala

435 440 445

cga ttc ggg caa ggc act ggg agg atc tgg atg gat gac gtt gcc tgc 1809

Arg Phe Gly Gln Gly Thr Gly Arg Ile Trp Met Asp Asp Val Ala Cys

450 455 460

aag ggc aca gag gaa acc atc ttc cgc tgc agc ttc tcc aaa tgg ggg 1857

Lys Gly Thr Glu Glu Thr Ile Phe Arg Cys Ser Phe Ser Lys Trp Gly

465 470 475

gtg aca aac tgt gga cat gcc gaa gat gcc agc gtg aca tgc aac aga 1905

Val Thr Asn Cys Gly His Ala Glu Asp Ala Ser Val Thr Cys Asn Arg

480 485 490

cac tg aaagtgggca gagcccaagt tcggggtcct gcacagagca cccttcctgc 1960

His

495

atccctgggg tggggcacag ctcggggcca ccctgaccat gcctcgacca caccccgtcc 2020

agcattctca gtcctcacac ctgcatccca ggaccgtggg ggccggtcgt catttccctc 2080

ttgaacatgt gctccgaagt ataactctgg gacctactgc ccgtctctct cttccaccag 2140

gttcctgcat gaggagccct gatcaactgg atcaccactt tgcccagcct ctgaacacca 2200

tgcaccaggc ctcaatatcc cagttccctt tggcctttta gttacaggtg aatgctgaga 2260

atgtgtcaga gacaagtgca gcagcagcga tggttggtag tatagatcat ttactcttca 2320

gacaattccc aaacctccat tagtccaaga gtttctacat cttcctcccc agcaagaggc 2380

aacgtcaagt gatgaatttc ccccctttac tctgcctctg ctccccattt gctagtttga 2440

ggaagtgaca tagaggagaa gccagctgta ggggcaagag ggaaatgcaa gtcacctgca 2500

ggaatccagc tagatttgga gaagggaatg aaactaacat tgaatgacta ccatggcacg 2560

ctaaatagta tcttgggtgc caaattcatg tatccactta gctgcattgg tccagggcat 2620

gtcagtctgg atacagcctt acctccaggt agcacttaac tggtccattc acctagactg 2680

caagtaagaa gacaaaatga ctgagaccgt gtgcccacct gaacttattg tctttacttg 2740

gcctgagcta aaagcttggg tgcaggacct gtgtaactag aaagttgcct acttcagaac 2800

ctccagggcg tgagtgcaag gtcaaacatg actggcttcc aggccgacca tcaatgtagg 2860

aggagagctg atgtggaggg tgacatgggg gctgcccatg ttaaacctga gtccagtgct 2920

ctggcattgg gcagtcacgg ttaaagccaa gtcatgtgtg tctcagctgt ttggaggtga 2980

tgattttgca tcttccaagc ctcttcaggt gtgaatctgt ggtcaggaaa acacaagtcc 3040

taatggaacc cttagggggg aaggaaatga agattcccta taacctctgg gggtggggag 3100

taggaataag gggcttgggc ctccataaat ctgcaatctg caccctcctc ctagagacag 3160

ggagatcgtg ttctgctttt tacatgagga gcagaactgg gccatacaca tgttcaagaa 3220

ctaggggagc tacctggtag caagtgagtg cagacccacc tcaccttggg ggaatctcaa 3280

actcataggc ctcagataca cgatcacctg tcatatcagg tgagcactgg cctgcttggg 3340

gagagacctg ggcccctcca ggtgtaggaa cagcaacact cctggctgac aactaagcca 3400

atatggccct aggtcattct tgcttccaat atgcttgcca ctccttaaat gtcctaatga 3460

tgagaaactc tctttctgac caattgctat gtttacataa cacgcatgta ctcatgcatc 3520

ccttgccaga gcccatatat gtatgcatat ataaacatag cactttttac tacatagctc 3580

agcacattgc aaggtttgca tttaagtt 3608

<210>6

<211>495

<212>PRT

<213>智人(Homo sapiens)

<400>6

Met Glu Asn Lys Ala Met Tyr Leu His Thr Val Ser Asp Cys Asp Thr

1 5 10 15

Ser Ser Ile Cys Glu Asp Ser Phe Asp Gly Arg Ser Leu Ser Lys Leu

20 25 30

Asn Leu Cys Glu Asp Gly Pro Cys His Lys Arg Arg Ala Ser Ile Cys

35 40 45

Cys Thr Gln Leu Gly Ser Leu Ser Ala Leu Lys His Ala Val Leu Gly

50 55 60

Leu Tyr Leu Leu Val Phe Leu Ile Leu Val Gly Ile Phe Ile Leu Ala

65 70 75 80

Val Ser Arg Pro Arg Ser Ser Pro Asp Asp Leu Lys Ala Leu Thr Arg

85 90 95

Asn Val Asn Arg Leu Asn Glu Ser Phe Arg Asp Leu Gln Leu Arg Leu

100 105 110

Leu Gln Ala Pro Leu Gln Ala Asp Leu Thr Glu Gln Val Trp Lys Val

115 120 125

Gln Asp Ala Leu Gln Asn Gln Ser Asp Ser Leu Leu Ala Leu Ala Gly

130 135 140

Ala Val Gln Arg Leu Glu Gly Ala Leu Trp Gly Leu Gln Ala Gln Ala

145 150 155 160

Val Gln Thr Glu Gln Ala Val Ala Leu Leu Arg Asp Arg Thr Gly Gln

165 170 175

Gln Ser Asp Thr Ala Gln Leu Glu Leu Tyr Gln Leu Gln Val Glu Ser

180 185 190

Asn Ser Ser Gln Leu Leu Leu Arg Arg His Ala Gly Leu Leu Asp Gly

195 200 205

Leu Ala Arg Arg Val Gly Ile Leu Gly Glu Glu Leu Ala Asp Val Gly

210 215 220

Gly Val Leu Arg Gly Leu Asn His Ser Leu Ser Tyr Asp Val Ala Leu

225 230 235 240

His Arg Thr Arg Leu Gln Asp Leu Arg Val Leu Val Ser Asn Ala Ser

245 250 255

Glu Asp Thr Arg Arg Leu Arg Leu Ala His Val Gly Met Glu Leu Gln

260 265 270

Leu Lys Gln Glu Leu Ala Met Leu Asn Ala Val Thr Glu Asp Leu Arg

275 280 285

Leu Lys Asp Trp Glu His Ser Ile Ala Leu Arg Asn Ile Ser Leu Ala

290 295 300

Lys Gly Pro Pro Gly Pro Lys Gly Asp Gln Gly His Glu Gly Lys Glu

305 310 315 320

Gly Arg Pro Gly Ile Pro Gly Leu Pro Gly Leu Arg Gly Leu Pro Gly

325 330 335

Glu Arg Gly Thr Pro Gly Leu Pro Gly Pro Lys Gly Asp Asp Gly Lys

340 345 350

Leu Gly Ala Thr Gly Pro Met Gly Met Arg Gly Phe Lys Gly Asp Arg

355 360 365

Gly Pro Lys Gly Glu Lys Gly Glu Lys Gly Asp Arg Ala Gly Asp Ala

370 375 380

Ser Gly Val Glu Ala Pro Met Met Ile Arg Leu Val Asn Gly Ser Gly

385 390 395 400

Pro His Glu Gly Arg Val Glu Val Tyr His Asp Arg Arg Trp Gly Thr

405 410 415

Val Cys Asp Asp Gly Trp Asp Lys Lys Asp Gly Asp Val Val Cys Arg

420 425 430

Met Leu Gly Phe Arg Gly Val Glu Glu Val Tyr Arg Thr Ala Arg Phe

435 440 445

Gly Gln Gly Thr Gly Arg Ile Trp Met Asp Asp Val Ala Cys Lys Gly

450 455 460

Thr Glu Glu Thr Ile Phe Arg Cys Ser Phe Ser Lys Trp Gly Val Thr

465 470 475 480

Asn Cys Gly His Ala Glu Asp Ala Ser Val Thr Cys Asn Arg His

485 490 495

<210>7

<211>3162

<212>DNA

<213>智人(Homo sapiens)

<220>

<221>CDS

<222>(405)..(1835)

<223>Clone LBFLl23

<400>7

tggccggggt gccccgcaaa gagagacaag ggagaaaaag acagcaggga aaaccccggg 60

gaggagaagg cgaaagagaa ggtggagctc agagaagggg gccggctccc cagctccatg 120

tggccgccgc cgctgcgggt ctgtgggggc agagggcggc ggctcccagg gcagcgcgta 180

gcgggaccga ttgcctaata ctccggcagg ggccggggcc gcagctggct cggataaata 240

gccgcccggc tggcccggag ctgcagggga gagcggcggc cgcgatcccc accacaccac 300

cagcccggcc gcacggggca ctgagccggg tgctgagcac cggaggcccc gccgaggccg 360

ggactcagga cctgcagaga aacgcctcct gattttgtct taca atg gaa ctt 413

Met Glu Leu

1

aaa aag tcg cct gac ggt gga tgg ggc tgg gtg att gtg ttt gtc tcc 461

Lys Lys Ser Pro Asp Gly Gly Trp Gly Trp Val Ile Val Phe Val Ser

5 10 15

ttc ctt act cag ttt ttg tgt tac gga tcc cca cta gct gtt gga gtc 509

Phe Leu Thr Gln Phe Leu Cys Tyr Gly Ser Pro Leu Ala Val Gly Val

20 25 30 35

ctg tac ata gaa tgg ctg gat gcc ttt ggt gaa gga aaa gga aaa aca 557

Leu Tyr Ile Glu Trp Leu Asp Ala Phe Gly Glu Gly Lys Gly Lys Thr

40 45 50

gcc tgg gtt gga tcc ctg gca agt gga gtt ggc ttg ctt gca agt cct 605

Ala Trp Val Gly Ser Leu Ala Ser Gly Val Gly Leu Leu Ala Ser Pro

55 60 65

gtc tgc agt ctc tgt gtc rca tct ttt gga gca aga cct gtc aca arc 653

Val Cys Ser Leu Cys Val Ser Ser Phe Gly Ala Arg Pro Val Thr Ile

70 75 80

ttc agt ggc ttc atg gtg gct gga ggc ctg atg ttg agc agt ttt gct 701

Phe Ser Gly Phe Met Val Ala Gly Gly Leu Met Leu Ser Ser Phe Ala

85 90 95

ccc aat atc tac ttt ctg ttt ttt tcc tat ggc att gtt gta ggt tca 749

Pro Asn Ile Tyr Phe Leu Phe Phe Ser Tyr Gly Ile Val Val Gly Ser

100 105 110 115

agc gtt ggc ctt ttc ata tat gct gct ctg cag agg atg ctg gtt gag 797

Ser Val Gly Leu Phe Ile Tyr Ala Ala Leu Gln Arg Met Leu Val Glu

120 125 130

ttc tat gga ctg gat gga tgc ttg ctg att gtg ggt gct tta gct tta 845

Phe Tyr Gly Leu Asp Gly Cys Leu Leu Ile Val Gly Ala Leu Ala Leu

135 140 145

aat ata tta gcc tgt ggc agt ctg atg aga ccc ctc caa tct tct gat 893

Asn Ile Leu Ala Cys Gly Ser Leu Met Arg Pro Leu Gln Ser Ser Asp

150 155 160

tgt cct ttg cct aaa aaa ata gct cca gaa gat cta cca gat aaa tac 941

Cys Pro Leu Pro Lys Lys Ile Ala Pro Glu Asp Leu Pro Asp Lys Tyr

165 170 175

tcc att tac aat gaa aaa gga aag aat ctg gaa gaa aac ata aac att 989

Ser Ile Tyr Asn Glu Lys Gly Lys Asn Leu Glu Glu Asn Ile Asn Ile

180 185 190 195

ctt gac aag agc tac agt agt gag gaa aaa tgc agg atc acg tta gcc 1037

Leu Asp Lys Ser Tyr Ser Ser Glu Glu Lys Cys Arg Ile Thr Leu Ala

200 205 210

aat ggt gac tgg aaa caa gac agc cta ctt cat aaa aac ccc aca gtg 1085

Asn Gly Asp Trp Lys Gln Asp Ser Leu Leu His Lys Asn Pro Thr Val

215 220 225

aca cac aca aaa gag cct gaa acg tac aaa aag aaa gtt gca gaa cag 1133

Thr His Thr Lys Glu Pro Glu Thr Tyr Lys Lys Lys Val Ala Glu Gln

230 235 240

aca tat ttt tgc aaa cag ctt gcc aag agg aag tgg cag tta tat aaa 1181

Thr Tyr Phe Cys Lys Gln Leu Ala Lys Arg Lys Trp Gln Leu Tyr Lys

245 250 255

aac tac tgt ggt gaa act gtg gct ctt ttt aaa aac aaa gta ttt tca 1229

Asn Tyr Cys Gly Glu Thr Val Ala Leu Phe Lys Asn Lys Val Phe Ser

260 265 270 275

gcc ctt ttc att gct atc tta ctc ttt gac atc gga ggg ttt cca cct 1277

Ala Leu Phe Ile Ala Ile Leu Leu Phe Asp Ile Gly Gly Phe Pro Pro

280 285 290

tca tta ctt atg gaa gat gta gca aga agt tca aac gtg aaa gaa gaa 1325

Ser Leu Leu Met Glu Asp Val Ala Arg Ser Ser Asn Val Lys Glu Glu

295 300 305

gag ttt att atg cca ctt att tcc att ata ggc att atg aca gca gtt 1373

Glu Phe Ile Met Pro Leu Ile Ser Ile Ile Gly Ile Met Thr Ala Val

310 315 320

ggt aaa ctg ctt tta ggg ata ctg gct gac ttc aag tgg att aat acc 1421

Gly Lys Leu Leu Leu Gly Ile Leu Ala Asp Phe Lys Trp Ile Asn Thr

325 330 335

ttg tat ctt tat gtt gct acc tta atc atc atg ggc cta gcc ttg tgt 1469

Leu Tyr Leu Tyr Val Ala Thr Leu Ile Ile Met Gly Leu Ala Leu Cys

340 345 350 355

gca att cca ttt gcc aaa agc tat gtc aca ttg gcg ttg ctt tct ggg 1517

Ala Ile Pro Phe Ala Lys Ser Tyr Val Thr Leu Ala Leu Leu Ser Gly

360 365 370

atc cta ggg ttt ctt act ggt aat tgg tcc atc ttt cca tat gtg acc 1565

Ile Leu Gly Phe Leu Thr Gly Asn Trp Ser Ile Phe Pro Tyr Val Thr

375 380 385

acg aag act gtg gga att gaa aaa tta gcc cat gcc tat ggg ata tta 1613

Thr Lys Thr Val Gly Ile Glu Lys Leu Ala His Ala Tyr Gly Ile Leu

390 395 400

atg ttc ttt gct gga ctt gga aat agc cta gga cca ccc atc gtt ggt 1661

Met Phe Phe Ala Gly Leu Gly Asn Ser Leu Gly Pro Pro Ile Val Gly

405 410 415

tgg ttt tat gac tgg acc cag acc tat gat att gca ttt tat ttt agt 1709

Trp Phe Tyr Asp Trp Thr Gln Thr Tyr Asp Ile Ala Phe Tyr Phe Ser

420 425 430 435

ggc ttc tgc gtc ctg ctg gga ggt ttt att ctg ctg ctg gca gcc ttg 1757

Gly Phe Cys Val Leu Leu Gly Gly Phe Ile Leu Leu Leu Ala Ala Leu

440 445 450

ccc tct tgg gat aca tgc aac aag caa ctc ccc aag cca gct cca aca 1805

Pro Ser Trp Asp Thr Cys Asn Lys Gln Leu Pro Lys Pro Ala Pro Thr

455 460 465

act ttc ttg tac aaa gtt gcc tct aat gtt tagaa gaatattgga 1850

Thr Phe Leu Tyr Lys Val Ala Ser Asn Val

470 475

agacactatt tttgctattt tataccatat agcaacgata ttttaacaga tctcaagcaa 1910

attttctaga gtcaagacta ttttctcata gcaaaatttc acaatgactg actctgaatg 1970

aattattttt ttttttttat atatcctatt ttttatgtag tgtatgcgta gcctctatct 2030

cgtatttttt tctatttctc ctccccacac catcaatggg actattctgt tttgctgtta 2090

ttcactagtt cttaacattg taaaaagttt gaccagcctc agaaggcttt ctctgtgtaa 2150

agaagtataa tttctctgct gactccattt aatccactgc aaggcaccta gagagactgc 2210

tcctatttta aaagtgatgc aagcatcatg ataagatatg tgtgaagccc actaggaaat 2270

aaatcattct cttctctatg tttgacttgc tagtaaacag aagacttcaa gccagccagg 2330

aaattaaagt ggcgactaaa acagccttaa gaattgcagt ggagcaaatt ggtcattttt 2390

taaaaaaata tattttaacc tacagtcacc agttttcatt attctattta cctcactgaa 2450

gtactcgcat gttgtttggt acccactgag caactgtttc agttcctaag gtatttgctg 2510

agatgtgggt gaactccaaa tggagaagta gtcactgtag actttcttca tggttgacca 2570

ctccaacctt gctcactttt gcttcttggc catccactca gctgatgttt cctgggaagt 2630

gctaatttta cctgtttcca aattggaaac acatttctca atcattccgt tctggcaaat 2690

gggaaacatc catttgcttt gggcacagtg gggatgggct gcaagttctt gcatatcctc 2750

ccagtgaagc atttatttgc tactatcaga ttttaccact atcaaatata attcaagggc 2810

agaattaaac gtgagtgtgt gtgtgtgtgt gtgtgtgtgt gctatgcatg ctctaagtct 2870

gcatgggata tgggaatgga aaagggcaat aagaaattaa tacccttatg cagttgcatt 2930

taaccttaag aaaaatgtcc ttgggataaa ctccaatgtt taatacattg attttttttc 2990

taaagaaatg ggttttaaac tttggtatgc atcagaattc cctatagatc tttttgaaaa 3050

tataggtacc tgggtatcac acatagaact tttaattctg ctggtgtagg ctgttgccca 3110

aacatctata attttactga gctcttcaag tgattctgat aacacagcct gg 3162

<210>8

<211>477

<212>PRT

<213>智人(Homo sapiens)

<400>8

Met Glu Leu Lys Lys Ser Pro Asp Gly Gly Trp Gly Trp Val Ile Val

1 5 10 15

Phe Val Ser Phe Leu Thr Gln Phe Leu Cys Tyr Gly Ser Pro Leu Ala

20 25 30

Val Gly Val Leu Tyr Ile Glu Trp Leu Asp Ala Phe Gly Glu Gly Lys

35 40 45

Gly Lys Thr Ala Trp Val Gly Ser Leu Ala Ser Gly Val Gly Leu Leu

50 55 60

Ala Ser Pro Val Cys Ser Leu Cys Val Ser Ser Phe Gly Ala Arg Pro

65 70 75 80

Val Thr Ile Phe Ser Gly Phe Met Val Ala Gly Gly Leu Met Leu Ser

85 90 95

Ser Phe Ala Pro Asn Ile Tyr Phe Leu Phe Phe Ser Tyr Gly Ile Val

100 105 110

Val Gly Ser Ser Val Gly Leu Phe Ile Tyr Ala Ala Leu Gln Arg Met

115 120 125

Leu Val Glu Phe Tyr Gly Leu Asp Gly Cys Leu Leu Ile Val Gly Ala

130 135 140

Leu Ala Leu Asn Ile Leu Ala Cys Gly Ser Leu Met Arg Pro Leu Gln

145 150 155 160

Ser Ser Asp Cys Pro Leu Pro Lys Lys Ile Ala Pro Glu Asp Leu Pro

165 170 175

Asp Lys Tyr Ser Ile Tyr Asn Glu Lys Gly Lys Asn Leu Glu Glu Asn

180 185 190

Ile Asn Ile Leu Asp Lys Ser Tyr Ser Ser Glu Glu Lys Cys Arg Ile

195 200 205

Thr Leu Ala Asn Gly Asp Trp Lys Gln Asp Ser Leu Leu His Lys Asn

210 215 220

Pro Thr Val Thr His Thr Lys Glu Pro Glu Thr Tyr Lys Lys Lys Val

225 230 235 240

Ala Glu Gln Thr Tyr Phe Cys Lys Gln Leu Ala Lys Arg Lys Trp Gln

245 250 255

Leu Tyr Lys Asn Tyr Cys Gly Glu Thr Val Ala Leu Phe Lys Asn Lys

260 265 270

Val Phe Ser Ala Leu Phe Ile Ala Ile Leu Leu Phe Asp Ile Gly Gly

275 280 285

Phe Pro Pro Ser Leu Leu Met Glu Asp Val Ala Arg Ser Ser Asn Val

290 295 300

Lys Glu Glu Glu Phe Ile Met Pro Leu Ile Ser Ile Ile Gly Ile Met

305 310 315 320

Thr Ala Val Gly Lys Leu Leu Leu Gly Ile Leu Ala Asp Phe Lys Trp

325 330 335

Ile Asn Thr Leu Tyr Leu Tyr Val Ala Thr Leu Ile Ile Met Gly Leu

340 345 350

Ala Leu Cys Ala Ile Pro Phe Ala Lys Ser Tyr Val Thr Leu A1a Leu

355 360 365

Leu Ser Gly Ile Leu Gly Phe Leu Thr Gly Asn Trp Ser Ile Phe Pro

370 375 380

Tyr Val Thr Thr Lys Thr Val Gly Ile Glu Lys Leu Ala His Ala Tyr

385 390 395 400

Gly Ile Leu Met Phe Phe Ala Gly Leu Gly Asn Ser Leu Gly Pro Pro

405 410 415

Ile Val Gly Trp Phe Tyr Asp Trp Thr Gln Thr Tyr Asp Ile Ala Phe

420 425 430

Tyr Phe Ser Gly Phe Cys Val Leu Leu Gly 61y Phe Ile Leu Leu Leu

435 440 445

Ala Ala Leu Pro Ser Trp Asp Thr Cys Asn Lys Gln Leu Pro Lys Pro

450 455 460

Ala Pro Thr Thr Phe Leu Tyr Lys Val Ala Ser Asn Val

465 470 475

<210>9

<211>4891

<212>DNA

<213>智人(Homo sapiens)

<220>

<221>CDS

<222>(89)..(1150)

<223>Clone LBFLl31

<400>9

acgcctggtt cccgggaaga ctcgccagca ccagggggtg ggggagtgcg agctgaaagc 60

tgctggagag tgagcagccc tagcaggg atg gac atg atg ctg ttg gtg cag 112

Met Asp Met Met Leu Leu Val Gln

1 5

ggt gct tgt tgc tcg aac cag tgg ctg gcg gcg gtg ctc ctc agc ctg 160

Gly Ala Cys Cys Ser Asn Gln Trp Leu Ala Ala Val Leu Leu Ser Leu

10 15 20

tgc tgc ctg cta ccc tcc tgc ctc ccg gct gga cag agt gtg gac ttc 208

Cys Cys Leu Leu Pro Ser Cys Leu Pro Ala Gly Gln Ser Val Asp Phe

25 30 35 40

ccc tgg gcg gcc gtg gac aac atg atg gtc aga aaa ggg gac acg gcg 256

Pro Trp Ala Ala Val Asp Asn Met Met Val Arg Lys Gly Asp Thr Ala

45 50 55

gtg ctt agg tgt tat ttg gaa gat gga gct tca aag ggt gcc tgg ctg 304

Val Leu Arg Cys Tyr Leu Glu Asp Gly Ala Ser Lys Gly Ala Trp Leu

60 65 70

aac cgg tca agt att att ttt gcg gga ggt gat aag tgg tca gtg gat 352

Asn Arg Ser Ser Ile Ile Phe Ala Gly Gly Asp Lys Trp Ser Val Asp

75 80 85

cct cga gtt tca att tca aca ttg aat aaa agg gac tac agc ctc cag 400

Pro Arg Val Ser Ile Ser Thr Leu Asn Lys Arg Asp Tyr Ser Leu Gln

90 95 100

ata cag aat gta gat gtg aca gat gat ggc cca tac acg tgt tct gtt 448

Ile Gln Asn Val Asp Val Thr Asp Asp Gly Pro Tyr Thr Cys Ser Val

105 110 115 120

cag act caa cat aca ccc aga aca atg cag gtg cat cta act gtg caa 496

Gln Thr Gln His Thr Pro Arg Thr Met Gln Val His Leu Thr Val Gln

125 130 135

gtt cct cct aag ata tat gac atc tca aat gat atg acc gtc aat gaa 544

Val Pro Pro Lys Ile Tyr Asp Ile Ser Asn Asp Met Thr Val Asn Glu

140 145 150

gga acc aac gtc act ctt act tgt ttg gcc act ggg aaa cca gag cct 592

Gly Thr Asn Val Thr Leu Thr Cys Leu Ala Thr Gly Lys Pro Glu Pro

155 160 165

tcc att tct tgg cga cac atc tcc cca tca gcg aaa cca ttt gaa aat 640

Ser Ile Ser Trp Arg His Ile Ser Pro Ser Ala Lys Pro Phe Glu Asn

170 175 180

gga caa tat ttg gac att tat gga att aca agg gac cag gct ggg gaa 688

Gly Gln Tyr Leu Asp Ile Tyr Gly Ile Thr Arg Asp Gln Ala Gly Glu

185 190 195 200

tat gaa tgc agt gcg gaa aat gat gtg tca ttc cca gat gtg agg aaa 736

Tyr Glu Cys Ser Ala Glu Asn Asp Val Ser Phe Pro Asp Val Arg Lys

205 210 215

gta aaa gtt gtt gtc aac ttt gct cct act att cag gaa att aaa tct 784

Val Lys Val Val Val Asn Phe Ala Pro Thr Ile Gln Glu Ile Lys Ser

220 225 230

ggc acc gtg acc ccc gga cgc agt ggc ctg ata aga tgt gaa ggt gca 832

Gly Thr Val Thr Pro Gly Arg Ser Gly Leu Ile Arg Cys Glu Gly Ala

235 240 245

ggt gtg ccg cct cca gcc ttt gaa tgg tac aaa gga gag aag aag ctc 880

Gly Val Pro Pro Pro Ala Phe Glu Trp Tyr Lys Gly Glu Lys Lys Leu

250 255 260

ttc aat ggc caa caa gga att att att caa aat ttt agc aca aga tcc 928

Phe Asn Gly Gln Gln Gly Ile Ile Ile Gln Asn Phe Ser Thr Arg Ser

265 270 275 280

att ctc act gtt acc aac gtg aca cag gag cac ttc ggc aat tat act 976

Ile Leu Thr Val Thr Asn Val Thr Gln Glu His Phe Gly Asn Tyr Thr

285 290 295

tgt gtg gct gcc aac aag cta ggc aca acc aat gcg agc ctg cct ctt 1024

Cys Val Ala Ala Asn Lys Leu Gly Thr Thr Asn Ala Ser Leu Pro Leu

300 305 310

aac cct cca agt aca gcc cag tat gga att acc ggg agc gct gat gtt 1072

Asn Pro Pro Ser Thr Ala Gln Tyr Gly Ile Thr Gly Ser Ala Asp Val

315 320 325

ctt ttc tcc tgc tgg tac ctt gtg ttg aca ctg tcc tct ttc acc agc 1120

Leu Phe Ser Cys Trp Tyr Leu Val Leu Thr Leu Ser Ser Phe Thr Ser

330 335 340

ata ttc tac ctg aag aat gcc att cta caa taaattcaaa gacccataaa 1170

Ile Phe Tyr Leu Lys Asn Ala Ile Leu Gln

345 350

aggcttttaa ggattctctg aaagtgctga tggctggatc caatctggta cagtttgtta 1230

aaagcagcgt gggatataat cagcagtgct tacatgggga tgatcgcctt ctgtagaatt 1290

gctcattatg taaatacttt aattctactc ttttttgatt agctacatta ccttgtgaag 1350

cagtacacat tgtccttttt ttaagacgtg aaagctctga aattactttt agaggatatt 1410

aattgtgatt tcatgtttgt aatctacaac ttttcaaaag cattcagtca tggtctgcta 1470

ggttgcaggc tgtagtttac aaaaacgaat attgcagtga atatgtgatt ctttaaggct 1530

gcaatacaag cattcagttc cctgtttcaa taagagtcaa tccacattta caaagatgca 1590

tttttttctt ttttgataaa aaagcaaata atattgcctt cagattattt cttcaaaata 1650

taacacatat ctagattttt ctgctcgcat gatattcagg tttcaggaat gagccttgta 1710

atataactgg ctgtgcagct ctgcttctct ttcctgtaag ttcagcatgg gtgtgccttc 1770

atacaataat atttttctct ttgtctccaa ctaatataaa atgttttgct aaatcttaca 1830

atttgaaagt aaaaataaac cagagtgatc aagttaaacc atacactatc tctaagtaac 1890

gaaggagcta ttggactgta aaaatctctt cctgcactga caatggggtt tgagaatttt 1950

gccccacact aactcagttc ttgtgatgag agacaattta ataacagtat agtaaatata 2010

ccatatgatt tctttagttg tagctaaatg ttagatccac cgtgggaaat tattcccttt 2070

aaaatgacag cacagtccac tcaaaggatt gcctagcaat acagcatctt ttcctttcac 2130

tagtccaagc caaaaatttt aagatgattt gtcagaaagg gcacaaagtc ctatcaccta 2190

atattacaag agttggtaag cgctcatcat taattttatt ttgtggcagc taagttagta 2250

tgacagaggc agtgctcctg tggacaggag cattttgcat attttccatc tgaaagtatc 2310

actcagttga tagtctggaa tgcatgttat atattttaaa acttccaaaa tatattataa 2370

caaacattct atatcggtat gtagcagacc aatctctaaa atagctaatt cttcaataaa 2430

atctttctat atagccattt cagtgcaaac aagtaaaatc aaaaaagacc atcctttatt 2490

tttccttaca tgatatatgt aagatgcgat caaataaaga caaaacacca gtgatgagaa 2550

tatcttaaga taagtaatta tcaaattatt gtgaatgtta aattatttct actataaaga 2610

agcaaaacta catttttgaa ggaaaatgct gttactctaa cattaattta caggaatagt 2670

ttgatggttt cactctttac taaagaaagg ccatcacctt gaaagccatt ttacaggttt 2730

gatgaagtta ccaatttcag tacacctaaa tttctacaaa tagtcccctt ttacaagttg 2790

taacaacaaa gaccctataa taaaattaga tacaagaaat tttgcagtgg ttatacatat 2850

ttgagatatc tagtatgttg ccctagcagg gatggcttaa aaactgtgat tttttttctt 2910

caagtaaaac ttagtcccaa agtacatcat aaatcaattt taactagaaa aatgaatctt 2970

aaatgagggg acataagtat actctttcca caaaatggca ataataaggc ataaagctag 3030

taaatctact aactgtaata aatgtatgac attattttga ttgatacatt aaaaaagagt 3090

ttttagaaca aatatggcat ttaactttat tatttatttg cttttaagaa atattctttg 3150

tggaattgtt gaataaacta taaaatatta ttttgtattg cagctttaaa gtggcacact 3210

ccataataat ctacctacta gaaatagtgg tgctaccaca aaaaatgtta accatcagta 3270

ccattgtttg ggagaaagaa acaggtcaag aatgcatatt attcagtgac cgctttccta 3330

gagttaaaat acctcctctt tgtaaggttt gtaggtaaat tgaggtataa actatggatg 3390

aaccaaataa ttagttcaaa gtgttgtcat gattccaaat ttgtggagtc tggtgttttt 3450

accatagaat gtgacagaag tacagtcata gctcagtagc tatatgtatt tgcctttatg 3510

ttagaagaga ctttcttgag tgacattttt aaatagagga ggtattcact atgtttttct 3570

gtatcacagc agcattccta gtccttaggc cctcggacag agtgaaatca tgagtattta 3630

tgagttcaat attgtcaaat aaggctacag tatttgcttt tttgtgtgaa tgtattgcat 3690

ataatgttca agtagatgat tttacattta tggacatata aaacgtctga ttaccccatt 3750

ttatcagtcc tgactgtaca agattgttgc aatttcagaa tagcagtttt ataaattgat 3810

ttatctttta atctataaca atttgtgtta gctgttcatt tcaggattat attttctaca 3870

agttccactt gtgggactcc ttttgttgcc cctatttttt tttaaagaag gaagaaagaa 3930

aaatgagtag cagtttaaaa atgagaatgg agagaaaaga aaaagaatga aaaggaaagg 3990

cagtaaagag ggaaaaaaaa ggaaggatgg aaggaatgaa ggaaggaagg gaggaagggg 4050

agaaggtagg aagaaagaaa ggatgagagg gaaggaagaa tcagagtatt agggtagtta 4110

acttacacat ttgcattctt agttatactg caagtggtgt aactatgttt ttcaatgatc 4170

gcatttgaaa cataagtcct attataccat taagttccta ttatgcagca attatataat 4230

aaaaagtact gcccaagtta tagtaatgtg ggtgtttttg agacactaaa agatttgaga 4290

gggagaattt caaacttaaa gccacttttg gggggtttat aacttaactg aaaaattaat 4350

gcttcatcat aacatttaag ctatatctag aaagtagact ggagaactga gaaaattacc 4410

caggtaattc agggaaaaaa aaaaaatata tatatatata aataccccta catttgaagt 4470

cagaaaactc tgaaaaactg aattatcaaa gtcaatcatc tataatgatc aaatttactg 4530

aacaattgtt aatttatcca ttgtgcttag ctttgtgaca cagccaaaag ttacctattt 4590

aatcttttca ataaaaattg ttttttgaaa tccagaaatg atttaaaaag aggtcaggtt 4650

tttaactatt tattgaagta tgtggatgtc cagtatttca atagatatga atatgaataa 4710

atggtatgcc ttaagattct ttgaatatgt atttacttta aagactggaa aaagctcttc 4770

ctgtctttta gtaaacatcc atatttcata acctgatgta aaatatgttg tactgtttcc 4830

aataggggaa tataaactca gtttatcaat taaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4890

a 4891

<210>10

<211>354

<212>PRT

<213>智人(Homo sapiens)

<400>10

Met Asp Met Met Leu Leu Val Gln Gly Ala Cys Cys Ser Asn Gln Trp

1 5 10 15

Leu Ala Ala Val Leu Leu Ser Leu Cys Cys Leu Leu Pro Ser Cys Leu

20 25 30

Pro Ala Gly Gln Ser Val Asp Phe Pro Trp Ala Ala Val Asp Asn Met

35 40 45

Met Val Arg Lys Gly Asp Thr Ala Val Leu Arg Cys Tyr Leu Glu Asp

50 55 60

Gly Ala Ser Lys Gly Ala Trp Leu Asn Arg Ser Ser Ile Ile Phe Ala

65 70 75 80

Gly Gly Asp Lys Trp Ser Val Asp Pro Arg Val Ser Ile Ser Thr Leu

85 90 95

Asn Lys Arg Asp Tyr Ser Leu Gln Ile Gln Asn Val Asp Val Thr Asp

100 105 110

Asp Gly Pro Tyr Thr Cys Ser Val Gln Thr Gln His Thr Pro Arg Thr

115 120 125

Met Gln Val His Leu Thr Val Gln Val Pro Pro Lys Ile Tyr Asp Ile

130 135 140

Ser Asn Asp Met Thr Val Asn Glu Gly Thr Asn Val Thr Leu Thr Cys

145 150 155 160

Leu Ala Thr Gly Lys Pro Glu Pro Ser Ile Ser Trp Arg His Ile Ser

165 170 175

Pro Ser Ala Lys Pro Phe Glu Asn Gly Gln Tyr Leu Asp Ile Tyr Gly

180 185 190

Ile Thr Arg Asp Gln Ala Gly Glu Tyr Glu Cys Ser Ala Glu Asn Asp

195 200 205

Val Ser Phe Pro Asp Val Arg Lys Val Lys Val Val Val Asn Phe Ala

210 215 220

Pro Thr Ile Gln Glu Ile Lys Ser Gly Thr Val Thr Pro Gly Arg Ser

225 230 235 240

Gly Leu Ile Arg Cys Glu Gly Ala Gly Val Pro Pro Pro Ala Phe Glu

245 250 255

Trp Tyr Lys Gly Glu Lys Lys Leu Phe Asn Gly Gln Gln Gly Ile Ile

260 265 270

Ile Gln Asn Phe Ser Thr Arg Ser Ile Leu Thr Val Thr Asn Val Thr

275 280 285

Gln Glu His Phe Gly Asn Tyr Thr Cys Val Ala Ala Asn Lys Leu Gly

290 295 300

Thr Thr Asn Ala Ser Leu Pro Leu Asn Pro Pro Ser Thr Ala Gln Tyr

305 310 315 320

Gly Ile Thr Gly Ser Ala Asp Val Leu Phe Ser Cys Trp Tyr Leu Val

325 330 335

Leu Thr Leu Ser Ser Phe Thr Ser Ile Phe Tyr Leu Lys Asn Ala Ile

340 345 350

Leu Gln

<210>11

<211>3098

<212>DNA

<213>智人(Homo sapiens)

<220>

<221>CDS

<222>(223)..(1569)

<223>LBFL164

<400>11

gtttatcgcg cacatctcgc ggcgaggagg agaggccgga agggcgcccc agccccaagg 60

ctcctgcccc gcctgggcct ccggctttcg tttccccgca acgcttcgct ttcgtttccc 120

gctggcgcct ggctccctcc gggtttcgtt tcccgccggc gcctggctcc cgccaggttt 180

cgtttccgag gcggggccga gggcggcgtc gctgaggcgc cc atg gcc ttc 231

Met Ala Phe

1

gcc cgc cgg ctc ctg cgc ggg cca ctg tcg ggg ccg ctg ctc ggg cgg 279

Ala Arg Arg Leu Leu Arg Gly Pro Leu Ser Gly Pro Leu Leu Gly Arg

5 10 15

cgc ggg gtc tgc gct ggg gcc atg gct ccg ccg cgc cgc ttc gtc ctg 327

Arg Gly Val Cys Ala Gly Ala Met Ala Pro Pro Arg Arg Phe Val Leu

20 25 30 35

gag ctt ccc gac tgc acc ctg gct cac ttc gcc cta ggc gcc gac gcc 375

Glu Leu Pro Asp Cys Thr Leu Ala His Phe Ala Leu Gly Ala Asp Ala

40 45 50

ccc ggc gac gca gac gcc ccc gac ccc cgc ctg gcg gcg ctg ctg ggg 423

Pro Gly Asp Ala Asp Ala Pro Asp Pro Arg Leu Ala Ala Leu Leu Gly

55 60 65

ccc ccg gag cgc agc tac tcg ctg tgc gtg ccc gtg acc ccg gac gcc 471

Pro Pro Glu Arg Ser Tyr Ser Leu Cys Val Pro Val Thr Pro Asp Ala

70 75 80

ggc tgc ggg gcc cgg gtc cgg gcg gcg cgg ctg cac cag cgc ctg ctg 519

Gly Cys Gly Ala Arg Val Arg Ala Ala Arg Leu His Gln Arg Leu Leu

85 90 95

cac cag ctg cgc cgc ggc ccc ttc cag cgg tgc cag ctg ctc agg ctg 567

His Gln Leu Arg Arg Gly Pro Phe Gln Arg Cys Gln Leu Leu Arg Leu

100 105 110 115

ctc tgc tac tgc ccg ggc ggc cag gcc ggc ggc gca cag caa ggc ttc 615

Leu Cys Tyr Cys Pro Gly Gly Gln Ala Gly Gly Ala Gln Gln Gly Phe

120 125 130

ctg ctg cgc gac ccc ctg gat gac cct gac acc cgg caa gcg ctg ctc 663

Leu Leu Arg Asp Pro Leu Asp Asp Pro Asp Thr Arg Gln Ala Leu Leu

135 140 145

gag ctg ctg ggc gcc tgc cag gag gca cca cgc ccg cac ttg ggc gag 711

Glu Leu Leu Gly Ala Cys Gln Glu Ala Pro Arg Pro His Leu Gly Glu

150 155 160

ttc gag gcc gac ccg cgc ggc cag ctg tgg cag cgc ctc tgg gag gtg 759

Phe Glu Ala Asp Pro Arg Gly Gln Leu Trp Gln Arg Leu Trp Glu Val

165 170 175

caa gac ggc agg cgg ctg cag gtg ggc tgc gca cag gtc gtg ccc gtc 807

Gln Asp Gly Arg Arg Leu Gln Val Gly Cys Ala Gln Val Val Pro Val

180 185 190 195

ccg gag ccc ccg ctg cac ccg gtg gtg cca gac ttg ccc agt tcc gtg 855

Pro Glu Pro Pro Leu His Pro Val Val Pro Asp Leu Pro Ser Ser Val

200 205 210

gtc ttc ccg gac cgg gaa gcc gcc cgg gcc gtt ttg gag gag tgt acc 903

Val Phe Pro Asp Arg Glu Ala Ala Arg Ala Val Leu Glu Glu Cys Thr

215 220 225

tcc ttt att cct gaa gcc cgg gca gtg ctt gac ctg gtc gac cag tgc 951

Ser Phe Ile Pro Glu Ala Arg Ala Val Leu Asp Leu Val Asp Gln Cys

230 235 240

cca aaa cag atc cag aaa gga aag ttc cag gtt gtt gcc atc gaa gga 999

Pro Lys Gln Ile Gln Lys Gly Lys Phe Gln Val Val Ala Ile Glu Gly

245 250 255

ctg gat gcc acg ggt aaa acc acg gtg acc cag tca gtg gca gat tca 1047

Leu Asp Ala Thr Gly Lys Thr Thr Val Thr Gln Ser Val Ala Asp Ser

260 265 270 275

ctt aag gct gtc ctc tta aag tca cca ccc tct tgc att ggc cag tgg 1095

Leu Lys Ala Val Leu Leu Lys Ser Pro Pro Ser Cys Ile Gly Gln Trp

280 285 290

agg aag atc ttt gat gat gaa cca act atc att aga aga gct ttt tac 1143

Arg Lys Ile Phe Asp Asp Glu Pro Thr Ile Ile Arg Arg Ala Phe Tyr

295 300 305

tct ttg ggc aat tat att gtg gcc tcc gaa ata gct aaa gaa tct gcc 1191

Ser Leu Gly Asn Tyr Ile Val Ala Ser Glu Ile Ala Lys Glu Ser Ala

310 315 320

aaa tct cct gtg att gta gac agg tac tgg cac agc acg gcc acc tat 1239

Lys Ser Pro Val Ile Val Asp Arg Tyr Trp His Ser Thr Ala Thr Tyr

325 330 335

gct ata gcc act gag gtg agt ggg ggt ctc cag cac ctg ccc cca gcc 1287

Ala Ile Ala Thr Glu Val Ser Gly Gly Leu Gln His Leu Pro Pro Ala

340 345 350 355

cat cac cct gtg tac cag tgg cca gag gac ctg ctc aaa cct gac ctt 1335

His His Pro Val Tyr Gln Trp Pro Glu Asp Leu Leu Lys Pro Asp Leu

360 365 370

atc ctg ctg ctc act gtg agt cct gag gag agg ttg cag agg ctg cag 1383

Ile Leu Leu Leu Thr Val Ser Pro Glu Glu Arg Leu Gln Arg Leu Gln

375 380 385

ggc cgg ggc atg gag aag acc agg gaa gaa gca gaa ctt gag gcc aac 1431

Gly Arg Gly Met Glu Lys Thr Arg Glu Glu Ala Glu Leu Glu Ala Asn

390 395 400

agt gtg ttt cgt caa aag gta gaa atg tcc tac cag cgg atg gag aat 1479

Ser Val Phe Arg Gln Lys Val Glu Met Ser Tyr Gln Arg Met Glu Asn

405 410 415

cct ggc tgc cat gtg gtt gat gcc agc ccc tcc aga gaa agg gtc ctg 1527

Pro Gly Cys His Val Val Asp Ala Ser Pro Ser Arg Glu Arg Val Leu

420 425 430 435

cag acg gta tta agc cta atc cag aat agt ttt agt gaa ccg t 1570

Gln Thr Val Leu Ser Leu Ile Gln Asn Ser Phe Ser Glu Pro

440 445

agttactctg gccaggtgcc acgtctaact agattagatg ttgtttgaaa catctacatc 1630

caccatttgt tatgcagtgt tcccaaattt ctgttctaca agcatgttgt gtggcagaaa 1690

actggagacc aggcatctta attttacttc agccatcgta ccctcttctg actgatggac 1750

ccgtcatcac aaaggtccct ctcatcatgt tccagtgaga ggccagcgat tgctttcttc 1810

ctggcatagt aaacattttc ttggaacata tgtttcactt aatcactacc aaatatctgg 1870

aagacctgtc ttactcagac agcaccaggt gtacagaagc agcagacaag atcttccaga 1930

tcagcaggga gaccccggag cctctgcttc tcctacactg gcatgctgat gagatcgtga 1990

catgcccaca ttggcttctt ccacatctgg ttgcactcgt catgatgggc tcgctgcatc 2050

tccctcagtc ccaaattcta gagccaagtg ttcctgcaga ggctgtctat gtgtcctggc 2110

tgcccaagga cactcctgca gagccatttt tgggtaagga acacttacaa agaaggcatt 2170

gatcttgtgt ctgaggctca gagccctttt gataggcttc tgagtcatat ataaagacat 2230

tcaagccaag atgctccaac tgcaaatata ccaaccttct ctgaattata ttttgcttat 2290

ttatatttct tttctttttt tctaaagtat ggctctgaat agaatgcaca ttttccattg 2350

aactggatgc atttcattta gccaatccag taatttattt atattaatct atacaatatg 2410

tttcctcagc ataggagcta tgattcatta attaaaagtg gagtcaaaac gctaaatgca 2470

atgtttgttg tgtattttca ttacacaaac ttaatttgtc ttgttaaata agtacagtgg 2530

atcttggagt gggatttctt ggtaaattat cttgcacttg aatgtctcat gattacatat 2590

gaaatcgctt tgacatatct ttagacagaa aaaagtagct gagtgagggg gaaattatag 2650

agctgtgtga ctttagggag taggttgaac caggtgatta cctaaaattc cttccagttc 2710

aaaggcagat aaatctgtaa attattttat cctatctacc atttcttaag aagacattac 2770

tccaaaataa ttaaatttaa ggctttatca ggtctgcata tagaatctta aattctaata 2830

aagtttcatg ttaatgtcat aggattttta aaagagctat aggtaatttc tatataatat 2890

gtgtatatta aaatgtaatt gatttcagtt gaaagtattt taaagctgat aaatagcatt 2950

agggttcttt gcaatgtggt atctagctgt attattggtt ttatttactt taaacatttt 3010

gaaaagctta tactggcagc ctagaaaaac aaacaattaa tgtatcttta tgtccctggc 3070

acatgaataa actttgctgt ggtttact 3098

<210>12

<211>449

<212>PRT

<213>智人(Homo sapiens)

<400>12

Met Ala Phe Ala Arg Arg Leu Leu Arg Gly Pro Leu Ser Gly Pro Leu

1 5 10 15

Leu Gly Arg Arg Gly Val Cys Ala Gly Ala Met Ala Pro Pro Arg Arg

20 25 30

Phe Val Leu Glu Leu Pro Asp Cys Thr Leu Ala His Phe Ala Leu Gly

35 40 45

Ala Asp Ala Pro Gly Asp Ala Asp Ala Pro Asp Pro Arg Leu Ala Ala

50 55 60

Leu Leu Gly Pro Pro Glu Arg Ser Tyr Ser Leu Cys Val Pro Val Thr

65 70 75 80

Pro Asp Ala Gly Cys Gly Ala Arg Val Arg Ala Ala Arg Leu His Gln

85 90 95

Arg Leu Leu His Gln Leu Arg Arg Gly Pro Phe Gln Arg Cys Gln Leu

100 105 110

Leu Arg Leu Leu Cys Tyr Cys Pro Gly Gly Gln Ala Gly Gly Ala Gln

115 120 125

G1n Gly Phe Leu Leu Arg Asp Pro Leu Asp Asp Pro Asp Thr Arg Gln

130 135 140

Ala Leu Leu Glu Leu Leu Gly Ala Cys Gln Glu Ala Pro Arg Pro His

145 150 155 160

Leu Gly Glu Phe Glu Ala Asp Pro Arg Gly Gln Leu Trp Gln Arg Leu

165 170 175

Trp Glu Val Gln Asp Gly Arg Arg Leu Gln Val Gly Cys Ala Gln Val

180 185 190

Val Pro Val Pro Glu Pro Pro Leu His Pro Val Val Pro Asp Leu Pro

195 200 205

Ser Ser Val Val Phe Pro Asp Arg Glu Ala Ala Arg Ala Val Leu Glu

210 215 220

Glu Cys Thr Ser Phe Ile Pro Glu Ala Arg Ala Val Leu Asp Leu Val

225 230 235 240

Asp Gln Cys Pro Lys Gln Ile Gln Lys Gly Lys Phe Gln Val Val Ala

245 250 255

Ile Glu Gly Leu Asp Ala Thr Gly Lys Thr Thr Val Thr Gln Ser Val

260 265 270

Ala Asp Ser Leu Lys Ala Val Leu Leu Lys Ser Pro Pro Ser Cys Ile

275 280 285

Gly Gln Trp Arg Lys Ile Phe Asp Asp Glu Pro Thr Ile Ile Arg Arg

290 295 300

Ala Phe Tyr Ser Leu Gly Asn Tyr Ile Val Ala Ser Glu Ile Ala Lys

305 310 315 320

Glu Ser Ala Lys Ser Pro Val Ile Val Asp Arg Tyr Trp His Ser Thr

325 330 335

Ala Thr Tyr Ala Ile Ala Thr Glu Val Ser Gly Gly Leu Gln His Leu

340 345 350

Pro Pro Ala His His Pro Val Tyr Gln Trp Pro Glu Asp Leu Leu Lys

355 360 365

Pro Asp Leu Ile Leu Leu Leu Thr Val Ser Pro Glu Glu Arg Leu Gln

370 375 380

Arg Leu Gln Gly Arg Gly Met Glu Lys Thr Arg Glu Glu Ala Glu Leu

385 390 395 400

Glu Ala Asn Ser Val Phe Arg Gln Lys Val Glu Met Ser Tyr Gln Arg

405 410 415

Met Glu Asn Pro Gly Cys His Val Val Asp Ala Ser Pro Ser Arg Glu

420 425 430

Arg Val Leu Gln Thr Val Leu Ser Leu Ile Gln Asn Ser Phe Ser Glu

435 440 445

Pro

<210>13

<211>1893

<212>DNA

<213>智人(Homo sapiens)

<220>

<221>CDS

<222>(418)..(1392)

<223>LBFLl67 Clone #20

<400>13

agtccagctg ccgttaggcg ctgggatagt cgcacgctgg atgcatctac gtccgccgag 60

cccctggggc gaagaggccg cgtccgcctt catttgtggc cggtgcttcg ccccctgacc 120

cttcgccccc aaagaccagc tctaacgtga gcgcctcggc cgccctgccc cagcctcgta 180

cacgccgcca gcctcgccca gccggtgtcc ggagaccctc gggccgtgtc catttgtggg 240

caaagccagc ggggcaggct tggccagagt gcaccactcg gcgccgtccc aggcccgacg 300

ctctgggcgc gcccggaacc ccaggttcgc ggcccgtgtt tccgaccggc ggagggggct 360

cagcggcccg atcccacgga agcgcgctcg gaggggtggg acccggccgg accggag 417

atg gcg ccg cca gcg ggc ggg gcg gcg gcg gcg gcc tcg gac ttg ggc 465

Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly

1 5 10 15

tcc gcc gca gtg crc ttg gct gtg cac gcc gcg gtg agg ccg ctg ggc 513

Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly

20 25 30

gcc ggg cca gac gcc gag gca cag ctg cgg agg ctg cag ctg agc gcg 561

Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala

35 40 45

gac cct gag cgg cct ggg cgc ttc cgg ctg gag ctg ctg ggc gcg gga 609

Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly

50 55 60

cct ggg gcg gtt aat ttg gag tgg ccc ctg gag tca gtt tcc tac acc 657

Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr

65 70 75 80

atc cga ggc ccc acc cag cac gag cta cag cct cca cca gga ggg cct 705

Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro

85 90 95

gga acc ctc agc ctg cac ttc ctc aac cct cag gaa gct cag cgg tgg 753

Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp

100 105 110

gca gtc cta gtc cga ggt gcc acc gtg gaa gga cag aat ggc agc aag 801

Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys

115 120 125

agc aac tca cca cca gcc ttg ggc cca gaa gca tgc cct gtc tcc ctg 849

Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu

130 135 140

ccc agt ccc ccg gaa gcc tcc aca ctc aag ggc cct cca cct gag gca 897

Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala

145 150 155 160

gat ctt cct agg agc cct gga aac ttg acg gag aga gaa gag ctg gca 945

Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala

165 170 175

ggg agc ctg gcc cgg gct att gca ggt gga gac gag aag ggg gca gcc 993

Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala

180 185 190

caa gtg gca gcc gtc ctg gcc cag cat cgt gtg gcc ctg agt gtt cag 1041

G1n Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln

195 200 205

ctt cag gag gcc tgc ttc cca cct ggc ccc atc agg ctg cag gtc aca 1089

Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr

210 215 220

ctt gaa gac gct gcc tct gcc gca tcc gcc gcg tcc tct gca cac gtt 1137

Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val

225 230 235 240

gcc ctg cag gtc cac ccc cac tgc act gtt gca gct ctc cag gag cag 1185

Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln

245 250 255

gtg ttc tca gag ctc ggt ttc cog cca gcc gtg caa cgc tgg gtc atc 1233

Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile

260 265 270

gga cgg tgc ctg tgt gtg cct gag cgc agc crt gcc tct tac ggg gtt 1281

Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val

275 280 285

cgg cag gat ggg gac cct gct ttc ctc tac ttg ctg tca gct cct cga 1329

Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg

290 295 300

gaa gcc cca ggt cag tcc tcg atg ggg gtg ggg tgt ggg agg tgg ggt 1377

Glu Ala Pro Gly Gln Ser Ser Met Gly Val Gly Cys Gly Arg Trp Gly

305 310 315 320

gca gcc cca cag tcc tgagctcc accccctcag ccacaggacc tagccctcag 1430

Ala Ala Pro Gln Ser

325

cacccccaga agatggacgg ggaacttgga cgcttgtttc ccccatcatt ggggctaccc 1490

ccaggccccc agccagctgc ctccagcctg cccagtccac tccagcccag ctggtcctgt 1550

ccttcctgca ccttcatcaa tgccccagac cgccctggct gtgagatgtg tagcacccag 1610

aggccctgca cttgggaccc ccttgctgca gcttccacct agcagccacc agaggtacca 1670

gaggtggcac aggcagggga ggtggggggc cagggcagaa tccacaggaa tgacccagct 1730

cctcccccac aggttacaag gggagagtgg cccttccctc acaagtccga catctccagg 1790

cccccactga actccgggga cctctactga ctgcttgctg ggacagtcac cagggttggg 1850

gggaagggcc acaaaatgaa accattaaag acccttaaga gcc 1893

<210>14

<211>325

<212>PRT

<213>智人(Homo sapiens)

<400>14

Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly

1 5 10 15

Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly

20 25 30

Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala

35 40 45

Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly

50 55 60

Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr

65 70 75 80

Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro

85 90 95

Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp

100 105 110

Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys

115 120 125

Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu

130 135 140

Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala

145 150 155 160

Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala

165 170 175

Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala

180 185 190

Gln Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln

195 200 205

Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr

210 215 220

Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val

225 230 235 240

Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln

245 250 255

Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile

260 265 270

Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val

275 280 285

Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg

290 295 300

Glu Ala Pro Gly Gln Ser Ser Met Gly Val Gly Cys Gly Arg Trp Gly

305 310 315 320

Ala Ala Pro Gln Ser

325

<210>15

<211>1597

<212>DNA

<213>智人(Homo sapiens)

<220>

<221>CDS

<222>(271)..(1431)

<223>LBFLl67 Clone #46

<400>15

gtgagcgcct cggccgccct gccccagcct cgtacacgcc gccagctcgc ccagccggtg 60

tccggagacc ctcgggccgt gtccatttgt gggcaaagcc agcggggcag gcttggccag 120

agtgcaccac tcggcgccgt cccaggcccg acgctctggg cgcgcccgga accccaggtt 180

cgcggcccgt gtttccgacc ggcggagggg gctcagcggc ccgatcccac ggaagcgcgc 240

tcggaggggt gggacccggc cggaccggag atg gcg ccg cca gcg ggc ggg gcg 294

Met Ala Pro Pro Ala Gly Gly Ala

1 5

gcg gcg gcg gcc tcg gac ttg ggc tcc gcc gca gtg ctc ttg gct gtg 342

Ala Ala Ala Ala Ser Asp Leu Gly Ser Ala Ala Val Leu Leu Ala Val

10 15 20

cac gcc gcg gtg agg ccg ctg ggc gcc ggg cca gac gcc gag gca cag 390

His Ala Ala Val Arg Pro Leu Gly Ala Gly Pro Asp Ala Glu Ala Gln

25 30 35 40

ctg cgg agg ctg cag ctg agc gcg gac cct gag agg cct ggg cgc ttc 438

Leu Arg Arg Leu Gln Leu Ser Ala Asp Pro Glu Arg Pro Gly Arg Phe

45 50 55

cgg ctg gag ctg ctg ggc gcg gga cct ggg gcg gtt aat ttg gag tgg 486

Arg Leu Glu Leu Leu Gly Ala Gly Pro Gly Ala Val Asn Leu Glu Trp

60 65 70

ccc ctg gag tca gtt tcc tac acc atc cga ggc ccc acc cag cac gag 534

Pro Leu Glu Ser Val Ser Tyr Thr Ile Arg Gly Pro Thr Gln His Glu

75 80 85

cta cag cct cca cca gga ggg cct gga acc ctc agc ctg cac ttc ctc 582

Leu Gln Pro Pro Pro Gly Gly Pro Gly Thr Leu Ser Leu His Phe Leu

90 95 100

aac cct cag gaa gct cag cgg tgg gca gtc cta gtc cga ggt gcc acc 630

Asn Pro Gln Glu Ala Gln Arg Trp Ala Val Leu Val Arg Gly Ala Thr

105 110 115 120

gtg gaa gga cag aat ggc agc aag agc aac tca cca cca gcc ttg ggc 678

Val Glu Gly Gln Asn Gly Ser Lys Ser Asn Ser Pro Pro Ala Leu Gly

125 130 135

cca gaa gca tgc cct gtc tcc ctg ccc agt ccc ccg gaa gcc tcc aca 726

Pro Glu Ala Cys Pro Val Ser Leu Pro Ser Pro Pro Glu Ala Ser Thr

140 145 150

ctc aag ggc cct cca cct gag gca gat ctt cct agg agc cct gga aac 774

Leu Lys Gly Pro Pro Pro Glu Ala Asp Leu Pro Arg Ser Pro Gly Asn

155 l60 165

ttg acg gag aga gaa gag ctg gca ggg agc ctg gcc cgg gct att gca 822

Leu Thr Glu Arg Glu Glu Leu Ala Gly Ser Leu Ala Arg Ala Ile Ala

170 175 180

ggt gga gac gag aag ggg gca gcc caa gtg gca gcc gtc ctg gcc cag 870

Gly Gly Asp Glu Lys Gly Ala Ala Gln Val Ala Ala Val Leu Ala Gln

185 190 195 200

cat cgt gtg gcc ctg agt gtt cag ctt cag gag gcc tgc ttc cca cct 918

His Arg Val Ala Leu Ser Val Gln Leu Gln Glu Ala Cys Phe Pro Pro

205 210 215

ggc ccc atc agg ctg cag gtc aca ctt gaa gac gct gcc tct gcc gca 966

Gly Pro Ile Arg Leu Gln Val Thr Leu Glu Asp Ala Ala Ser Ala Ala

220 225 230

tcc gcc gcg tcc tct gca cac gtt gcc ctg cag gtc cac ccc cac tgc 1014

Ser Ala Ala Ser Ser Ala His Val Ala Leu Gln Val His Pro His Cys

235 240 245

act gtt gca gct ctc cag gag cag gtg ttc tca gag ctc ggt ttc ccg 1062

Thr Val Ala Ala Leu Gln Glu Gln Val Phe Ser Glu Leu Gly Phe Pro

250 255 260

cca gcc gtg caa cgc tgg gtc atc gga cgg tgc ctg tgt gtg cct gag 1110

Pro Ala Val Gln Arg Trp Val Ile G1y Arg Cys Leu Cys Val Pro Glu

265 270 275 280

cgc agc ctt gcc tct tac ggg gtt cgg cag gat ggg gac cct gct ttc 1158

Arg Ser Leu Ala Ser Tyr Gly Val Arg Gln Asp Gly Asp Pro Ala Phe

285 290 295

ctc tac ttg ctg tca gct cct cga gaa gcc cca gcc aca gga cct agc 1206

Leu Tyr Leu Leu Ser Ala Pro Arg Glu Ala Pro Ala Thr Gly Pro Ser

300 305 310

cct cag cac ccc cag aag atg gac ggg gaa ctt gga cgc ttg ttt ccc 1254

Pro Gln His Pro Gln Lys Met Asp Gly Glu Leu Gly Arg Leu Phe Pro

315 320 325

cca tca ttg ggg cta ccc cca ggc ccc cag cca gct gcc tcc agc ctg 1302

Pro Ser Leu Gly Leu Pro Pro Gly Pro Gln Pro Ala Ala Ser Ser Leu

330 335 340

ccc agt cca ctc cag ccc agc tgg tcc tgt cct tcc tgc acc ttc atc 1350

Pro Ser Pro Leu Gln Pro Ser Trp Ser Cys Pro Ser Cys Thr Phe Ile

345 350 355 360

aat gcc cca gac cgc cct ggc tgt gag atg tgt agc acc cag agg ccc 1398

Asn Ala Pro Asp Arg Pro Gly Cys Glu Met Cys Ser Thr Gln Arg Pro

365 370 375

tgc act tgg gac ccc ctt gct gca gct tcc acc tagcagcca ccagaggtta 1450

Cys Thr Trp Asp Pro Leu Ala Ala Ala Ser Thr

380 385

caaggggaga gtggcccttc cctcacaagt ccgacatctc caggccccca ctgaactccg 1510

gggacctcta ctgactgctt gctgggacag tcaccagggt tggggggaag ggccacaaaa 1570

tgaaaccatt aaagaccctt aagagcc 1597

<210>16

<211>387

<212>PRT

<213>智人(Homo sapiens)

<400>16

Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly

1 5 10 15

Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly

20 25 30

Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala

35 40 45

Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly

50 55 60

Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr

65 70 75 80

Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro

85 90 95

Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp

100 105 110

Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys

115 120 125

Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu

130 135 140

Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala

1451 50 155 160

Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala

165 170 175

Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala

180 185 190

Gln Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln

195 200 205

Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr

210 215 220

Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val

225 230 235 240

Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln

245 250 255

Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile

260 265 270

Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val

275 280 285

Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg

290 295 300

Glu Ala Pro Ala Thr Gly Pro Ser Pro Gln His Pro Gln Lys Met Asp

305 310 315 320

Gly Glu Leu Gly Arg Leu Phe Pro Pro Ser Leu Gly Leu Pro Pro Gly

325 330 335

Pro Gln Pro Ala Ala Ser Ser Leu Pro Ser Pro Leu Gln Pro Ser Trp

340 345 350

Ser Cys Pro Ser Cys Thr Phe Ile Asn Ala Pro Asp Arg Pro Gly Cys

355 360 365

Glu Met Cys Ser Thr Gln Arg Pro Cys Thr Trp Asp Pro Leu Ala Ala

370 375 380

Ala Ser Thr

385

<210>17

<211>21

<212>DNA

<213>人工序列

<220>

<223>引物

<400>17

gctgaagcag gaaaatcgct t 21

<210>18

<211>21

<212>DNA

<213>人工序列

<220>

<223>引物

<400>18

tgagacggag tctcactcgg t 21

<210>19

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物

<400>19

gtttttccta attttggcat gaac 24

<210>20

<211>19

<212>DNA

<213>人工序列

<220>

<223>引物

<400>20

cgcccaagct tttcctttt 19

<210>21

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物

<400>21

caccctttgc ctctgtcact tccgca 26

<210>22

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物

<400>22

gctggagcac caggactgca ttg 23

<210>23

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物

<400>23

ggagctgagc agcagtgtaa tgaa 24

<210>24

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物

<400>24

gaggcctgcc tgaaggagga gcttc 25

<210>25

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物

<400>25

tctggaagta gtgcagacgc ctcagg 26

<210>26

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物

<400>26

agccaacgtc ggctttgtta tccagc 26

<210>27

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物

<400>27

gctgtcagat atgatggttc tggac 25

<210>28

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物

<400>28

ccagcctcac cactgttggg ttgc 24

<210>29

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物

<400>29

cattctctga gctgtattag tgt 23

<210>30

<211>21

<212>DNA

<213>人工序列

<220>

<223>引物

<400>30

cctgagctgg aatgacctgc a 21

<210>31

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物

<400>31

ctttgtgttg gctgcagcca ca 22

<210>32

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物

<400>32

tgaggagaga ctttgctgac tggt 24

<210>33

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>33

gtcctgtctg gcggtgccga 20

<210>34

<211>42

<212>DNA

<213>人工序列

<220>

<223>引物

<400>34

gctccaggat cccctgtcac ctgggccttc tgccttttgg ct 42

<210>35

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>35

ccatatggag aggagagcag cgggccca 28

<210>36

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物

<400>36

gaaggaggaa catggagagg aga 23

<210>37

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物

<400>37

ccatatgccc cgggtagtct actgcat 27

<210>38

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>38

gtcgactcga gtcacttccg caaaaacttc ttg 33

<210>39

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物

<400>39

tccattccga aggctctcct cc 22

<210>40

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物

<400>40

gtctgtgtga cggaaatgta agc 23

<210>41

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物

<400>41

gaaggtcgaa ggcagaccga tgt 23

<210>42

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物

<400>42

gaatgtgtca gagacaagtg cagc 24

<210>43

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物

<400>43

tgtagaaact cttggactaa tggagg 26

<210>44

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物

<400>44

gtatgcatca gaattcccta tagatcttt 29

<210>45

<211>21

<212>DNA

<213>人工序列

<220>

<223>引物

<400>45

tagatgtttg ggcaacagcc t 21

<210>46

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物

<400>46

ttccttcacc aaaggcatcc agccattcta tg 32

<210>47

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>47

aaatgtctga ttaccccatt ttatcagt 28

<210>48

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物

<400>48

taatcctgaa atgaacagct aaca 24

<210>49

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>49

taatgttaga gtaacagcat tttccttcaa 30

<210>50

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物

<400>50

tgccccacac taactcagtt cttgtgatg 29

<210>51

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物

<400>51

aaggctttat caggtctgca tatagaatc 29

<210>52

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>52

gcaaagaacc ctaatgctat ttatcagc 28

<210>53

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物

<400>53

gagaagacca gggaagaagc ag 22

<210>54

<211>19

<212>DNA

<213>人工序列

<220>

<223>引物

<400>54

ggacggggaa cttggacgc 19

<210>55

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>55

aagtgcaggg cctctgggtg 20

<210>56

<211>19

<212>DNA

<213>人工序列

<220>

<223>引物

<400>56

cgctgggtca tcggacggt 19

Claims

1.分离的核酸分子，选自：(a)包括SEQ ID NO：1、3、5、7、9、11、13或15的分离的核酸分子，(b)编码SEQ ID NO：2、4、6、8、10、12、14或16的分离的核酸分子，(c)分离的核酸分子，其编码的蛋白在癌症中表达，并与SEQ ID NO：1、3、5、7、9、11、13或15中的全部连续的序列表现出至少大约75％的核苷酸序列同一性，以及(d)包括与(a)、(b)或(c)中核酸分子互补的序列的分离的核酸分子。

2.权利要求1的分离的核酸分子，其中的核酸分子包括SEQ IDNO：1的390-4880位核苷酸，SEQ ID NO：3的12-4904位核苷酸，SEQ IDNO：5的424-1908位核苷酸，SEQ ID NO：7的405-1835位核苷酸，SEQID NO：9的89-1150位核苷酸，SEQ ID NO：11的223-1569位核苷酸，SEQ ID NO：13的418-1392位核苷酸，或SEQ ID NO：15的271-1431位核苷酸。

3.权利要求1的分离的核酸分子，其中核酸分子包括SEQ IDNO：1的390-4883位核苷酸，SEQ ID NO：3的12-4907位核苷酸，SEQ IDNO：5的424-1911位核苷酸，SEQ ID NO：7的405-1838位核苷酸，SEQID NO：9的89-1153位核苷酸，SEQ ID NO：11的223-1572位核苷酸，SEQ ID NO：13的418-1395位核苷酸，或SEQ ID NO：15的271-1434位核苷酸。

4.权利要求1的分离的核酸分子，其中核酸分子的组成为SEQ IDNO：1的390-4883位核苷酸，SEQ ID NO：3的12-4907位核苷酸，SEQ IDNO：5的424-1908位核苷酸，SEQ ID NO：7的405-1835位核苷酸，SEQID NO：9的89-1153位核苷酸，SEQ ID NO：11的223-1569位核苷酸，SEQ ID NO：13的418-1395位核苷酸，或SEQ ID NO：15的271-1434位核苷酸。

5.权利要求1-4任一项的分离的核酸分子，其中该核酸分子与一个或多个表达控制元件可操作地连接。

6.含有权利要求1-4任一项的分离的核酸分子的载体。

7.被转化以含有权利要求1-4任一项的核酸分子的宿主细胞。

8.含有权利要求6的载体的宿主细胞。

9.权利要求8的宿主细胞，其中该宿主细胞选自原核宿主细胞和真核宿主细胞。

10.一种生产多肽的方法，包括培养以权利要求1-4任一项的核酸分子转化的宿主细胞，培养条件为由所述核酸分子编码的蛋白被表达。

11.权利要求10的方法，其中该宿主细胞选自原核宿主细胞和真核宿主细胞。

12.通过权利要求10的方法生产的分离的多肽。

13.分离的多肽或蛋白，选自包括SEQ ID NO：2、4、6、8、10、12、14或16的氨基酸序列的蛋白和与SEQ ID NO：2、4、6、8、10、12、14或16具有至少大约75％氨基酸序列同一性的蛋白。

14.与权利要求13的多肽结合的分离的抗体或抗原结合的抗体片段。

15.权利要求14的抗体，其中该抗体是单克隆或多克隆抗体。

16.一种鉴定试剂的方法，所述试剂能够调节编码权利要求13的蛋白的核酸表达，包括：

将表达核酸的细胞暴露于试剂；以及

确定试剂是否调节该核酸的表达，从而鉴定调节编码蛋白的核酸表达的试剂。

17.一种鉴定试剂的方法，所述试剂调节权利要求13的蛋白的水平或至少一种活性，包括：

将表达蛋白的细胞暴露于试剂；

确定试剂是否调节该蛋白的水平或至少一种活性，从而鉴定调节蛋白的水平或至少一种活性的试剂。

18.权利要求17的方法，其中的试剂调节蛋白的一种活性。

19.一种调节编码权利要求13的蛋白的核酸表达的方法，包括：

施用有效量的调节编码所述蛋白的核酸表达的试剂。

20.一种调节权利要求13的蛋白的至少一种活性的方法，包括：

施用有效量的调节所述蛋白的至少一种活性的试剂。

21.一种鉴定权利要求13的蛋白的结合配体的方法，包括：

将该蛋白暴露于潜在的结合配体；以及

确定潜在的结合配体是否与该蛋白结合，从而鉴定蛋白的结合配体。

22.一种鉴定试剂的方法，所述试剂调节权利要求21的结合配体和权利要求13的蛋白之间的相互作用，包括：

将该蛋白和该配体暴露于试剂；以及

确定该试剂是否调节结合配体与该蛋白的结合，从而鉴定调节结合配体与该蛋白的结合的试剂。

23.一种调节权利要求21的结合配体和权利要求13的蛋白之间的相互作用的方法，包括：

施用有效量的调节结合配体与该蛋白的结合的试剂。

24.一种非人的转基因动物，被修饰以含有权利要求1-4任一项的核酸分子。

25.权利要求24的转基因动物，其中的核酸分子含有阻止编码的蛋白表达的突变。

26.一种治疗对象疾病状态的方法，包括：

在患病的细胞中插入基因构建物，该构建物中含有与启动子或增强子元件连接的权利要求1-4任一项的分离的核酸分子，以便该核酸分子的表达抑制该疾病。

27.权利要求26的方法，其中在患病的细胞中插入基因构建物是在体内完成的。

28.权利要求26的方法，其中在患病的细胞中插入基因构建物还包括病毒或质粒因子的使用，并且在体外或体内完成。

29.一种诊断对象疾病状态的方法，包括：

确定权利要求1-4或13任一项的核酸分子或蛋白的表达水平。

30.权利要求26和29的方法，其中的疾病状态是癌症。

31.权利要求26和29的方法，其中的疾病状态是恶性肿瘤。

32.权利要求31的方法，其中的恶性肿瘤发生在乳腺、结肠、食管、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、直肠和/或胃。

33.一种含有稀释剂和多肽或蛋白的组合物，其中该多肽或蛋白选自：含有SEQ ID NO：2、4、6、8、10、12、14或16氨基酸序列的分离的多肽；含有SEQ ID NO：2、4、6、8、10、12、14或16的至少10个氨基酸片段的分离的多肽；含有SEQ ID NO：2、4、6、8、10、12、14或16的保守氨基酸置换的分离的多肽；含有SEQ ID NO：2、4、6、8、10、12、14或16的自然存在的氨基酸序列变体的分离的多肽；以及与SEQ ID NO：2、4、6、8、10、12、14或16表现出至少大约75％氨基酸序列同一性的分离的多肽。