CN1705745A - 与癌症相关的基因家族 - Google Patents

与癌症相关的基因家族 Download PDF

Info

Publication number
CN1705745A
CN1705745A CN 200380101640 CN200380101640A CN1705745A CN 1705745 A CN1705745 A CN 1705745A CN 200380101640 CN200380101640 CN 200380101640 CN 200380101640 A CN200380101640 A CN 200380101640A CN 1705745 A CN1705745 A CN 1705745A
Authority
CN
China
Prior art keywords
seq
leu
ala
nucleic acid
gln
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200380101640
Other languages
English (en)
Other versions
CN100552027C (zh
Inventor
李寿振
高尚锡
李福万
郑铉浩
赵成浩
梁斗锡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Chem Ltd
Original Assignee
LG Life Sciences Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Life Sciences Ltd filed Critical LG Life Sciences Ltd
Publication of CN1705745A publication Critical patent/CN1705745A/zh
Application granted granted Critical
Publication of CN100552027C publication Critical patent/CN100552027C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明总地涉及来自癌症病人的人组织中基因表达的变化。具体来说,本发明涉及在乳腺、结肠、食管、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、直肠和/或胃的癌症组织与相应的正常组织相比差异表达的人基因家族。

Description

与癌症相关的基因家族
发明领域
本发明涉及来自癌症病人的人组织中基因表达的变化。具体来说,本发明涉及那些在乳腺、结肠、食管、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、直肠和/或胃的癌组织中与相应的正常组织相比差异表达的人基因。
发明背景
在美国,有超过100万新发的癌症病例被诊断,大约有50万人死于癌症。癌症的原因是多种多样的,包括遗传倾向、环境影响、传染因素和衰老。这些因素通过脱开广泛的调节和下游效应器途径将正常细胞转化为癌变细胞。有几种基本的细胞生理学变化合在一起共同支配了恶性的生长:生长信号的自给自足、对生长抑制信号的不敏感性、程序性细胞死亡的规避、无限的复制潜力、持续的血管生成以及组织侵害和转移(Hanahan和Weinberg(2000),Cell 100:57-70)。
到目前为止,研究人员已经能够鉴定许多据信是肿瘤发生的原因的遗传变化。这些遗传变化包括致癌基因的扩增和导致肿瘤抑制基因丧失的突变。致癌基因起初被鉴定为病毒携带的能够引起它们的靶细胞转化的基因。一类主要的病毒致癌基因在细胞中有其对应物,它们参与正常的细胞功能。细胞中的基因被称为原癌基因,在某些病例中,它们在细胞中的突变或畸变与肿瘤的形成相关。致癌基因的产生代表功能的获得,其中细胞内的原癌基因被不适当地激活了。这可以包括蛋白的突变变化、或组成性的活化、过量表达、或不能在适当的时间关闭表达。已经鉴定了大约100个致癌基因。致癌基因的例子包括但不限于ras、fos、myc、abl和myb(Ponder(2001),Nature 411:336-341)。肿瘤抑制基因在其野生型等位基因中表达能够抑制异常的细胞增殖的蛋白。当为肿瘤抑制蛋白编码的基因被突变或缺失时,产生的突变蛋白或肿瘤抑制蛋白表达的完全缺失可能不能正确地调控细胞增殖,异常的增殖可能发生,特别是当细胞的调控机制已经存在损伤时。许多已经深入研究的人类肿瘤和肿瘤细胞系失去了或具有无功能的肿瘤抑制基因。肿瘤抑制基因的例子包括但不限于成视网膜细胞瘤易感性基因或RB基因、p53基因、结肠癌缺失(DCC)基因和神经纤维瘤I型(NF-1)肿瘤抑制基因(Weinberg(1991),Science 254:1138-1146)。肿瘤抑制基因失去活性或钝化可能在大量人类癌症的起始和/或发展中扮演中心的角色。
利用基因组范围内的表达图谱对肿瘤分类、鉴定药物的靶、鉴定诊断标记物和/或对化疗结果获得进一步的了解,可以便于设计更有效的治疗多种癌症的策略。早期的利用基因表达模式鉴定癌症亚型的研究产生了相当吸引人的结果(参见Perou等(1999),Proc Natl Acad Sci USA 96:9212-9217;Golub等(1999),Science 286:531-537;Alizadeh等(2000),Nature 403:503-511;Alon等(1999),Proc Natl Acad Sci USA96:6745-6750;以及Bittner等(2000),Nature 406:536-540;Perou等(2000),Nature 406:747-752)。通过基因表达图谱对B细胞淋巴瘤进行分子分类,在临床上阐明了截然不同的弥散性大B细胞淋巴瘤亚类(参见Alizadeh等,同上)。在乳腺癌中,利用有限数量的基因(8102个基因)进行的研究已经基于基因表达图谱将肿瘤分为亚型,这个研究指出了多种与乳腺癌相关的分子表型(参见Perou等,同上)。此外,基因表达图谱已经使研究者能够对数千个基因的组织特异性表达水平作图(Alon等(1999),Proc Natl Acad Sci USA 96:6745-6750;Iyer等(1999),Science 283:83-87;Khan等(1998),Cancer Res 58:5009-5013;Lee等(1999),Science 285:1390-1393;Wang等(1999),Gene 229:101-108;Whitney等(1999),Ann Neurol 46:425-428)。尽管这些研究已经表明基因表达图谱可以被用于在诊断人类疾病如癌症、以及开发改良的治疗策略方面产生进展,仍然需要进一步的研究。
尽管癌症由于源自于多种组织和具有多种发病因素而具有多样性和异源性,现已提出导致这些可变性的原因只在于相对少量的关键事件,这些事件的聚集是任何和所有癌症发展所必需的(Evan和Vousden(2001),Nature 411:342-348)。因此,需要广泛地研究许多不同类型癌症中整体基因表达水平的变化,以鉴定与癌症发生和发展相关的关键分子标记。在本领域还需要能够更准确地诊断癌症的材料与方法。此外,在本领域中对治疗的方法和鉴定能够有效治疗疾病的药剂的方法还存在需要。本发明满足了这些以及其它的需要。
发明概述
本发明是基于与正常组织相比在癌症组织中差异表达的新基因,分别称为LFG1、LFG2、LFG3、LFG4、LFG5、LFG6。本发明包括含有SEQ ID NO:1、3、5、7、9、11、13或15所示序列或其互补序列的分离的核酸分子。
本发明还包括与一个或多个表达控制元件可操作连接的核酸分子,包括含有分离的核酸分子的载体。本发明还包括转化后含有本发明核酸的宿主细胞,以及生产蛋白的方法,该方法包括在蛋白能够表达的条件下培养用本发明的核酸分子转化的宿主细胞的步骤。
本发明还提供了分离的多肽,选自:含有SEQ ID NO:2、4、6、8、10、12、14或16中氨基酸序列的分离的多肽、含有SEQ ID NO:2、4、6、8、10、12、14或16中至少10个氨基酸片段的分离的多肽、含有SEQ ID NO:2、4、6、8、10、12、14或16中保守氨基酸置换的分离的多肽、以及含有SEQ ID NO:2、4、6、8、10、12、14或16中自然发生氨基酸序列变体的分离的多肽。本发明的多肽还包括这样的一些多肽,它们的氨基酸序列与SEQ ID NO:2、4、6、8、10、12、14或16中的所述序列有至少大约50%、60%、70%或75%氨基酸序列同一性,与SEQ ID NO:2、4、6、8、10、12、14或16中的所述序列优选有至少大约80%、更优选至少大约90-95%,而最优选至少大约95-98%的序列同一性。
本发明还提供了鉴定本发明的多肽家族的其它成员的方法。具体来说,SEQ ID NO:1、3、5、7、9、11、13或15的核酸序列,在鉴定编码LFG1、LFG2、LFG3、LFG4、LFG5或LFG6蛋白家族的其它成员的核酸分子的方法中,可以用作探针或用来产生PCR引物。
本发明还提供了能够特异性地与本发明的多肽结合的分离的抗体或抗原结合的抗体片段,包括单克隆抗体和多克隆抗体。
本发明还提供了试剂的鉴定方法,所述试剂调节编码本发明蛋白的核酸分子表达,包括:将表达核酸分子的细胞暴露于试剂;以及确定试剂是否调节该核酸分子的表达,从而鉴定能够调节编码蛋白的核酸分子表达的试剂。
本发明还提供了试剂的鉴定方法,所述试剂调节本发明蛋白的水平或至少一种活性,包括:将表达蛋白的细胞暴露于试剂;以及确定试剂是否调节该蛋白的水平或至少一种活性,从而鉴定能够调节蛋白的水平或至少一种活性的试剂。
本发明还提供了调节编码本发明蛋白的核酸分子表达的方法,其中包括施用有效量的调节编码蛋白的核酸分子表达的试剂的步骤。本发明还提供了调节本发明蛋白的至少一种活性的方法,其中包括了施用有效量的能够调节本发明蛋白的至少一种活性的试剂的步骤。
本发明还提供了鉴定本发明蛋白的结合配体的方法,其步骤包括将该蛋白暴露于潜在的结合配体;以及确定潜在的结合配体是否与该蛋白结合,从而鉴定蛋白的结合配体。
本发明还提供了能够阻断或调节本发明蛋白与结合配体结合的试剂的鉴定方法。具体来说,通过将本发明蛋白或其片段以及结合配体与待测试剂接触,然后确定待测试剂是否阻断或减少本发明蛋白与结合配体的结合,可以检测该试剂阻断、减少或调节该蛋白与结合配体的结合的能力。
本发明还提供了减少或阻断本发明蛋白与一个或多个结合配体结合的方法,其中包括施用有效量的能够减少或阻断该蛋白与结合配体结合的试剂的步骤。该方法可以利用能够与本发明的蛋白或结合配体结合的试剂。
在本发明的另一方面,本发明的蛋白可以用作合理的药物设计的起始点,以提供配体、治疗药物或其它类型的小化学分子。此外,通过上述筛选方法鉴定的小分子或其它化合物可以在合理的药物设计中作为“前导化合物”。
本发明还涉及了治疗癌症的方法,包括将核酸构建物导入到癌细胞中,该构建物含有与启动子或增强子元件可操作地连接的本发明的核酸分子,以使该核酸分子的表达导致该癌症的抑制。
本发明还包括了经修饰以包含本发明的核酸分子的非人的转基因动物,或经修饰以包含突变的核酸分子的非人的转基因动物,以便编码的本发明多肽的表达被阻止。
本发明也包括非人的转基因动物,其中含有SEQ ID NO:1、3、5、7、9、11、13或15中所有或部分的基因的所有或一部分已经从动物的基因组中被敲除或缺失了。
本发明还提供了诊断癌症的方法,其步骤包括从对象获得组织、血液、尿液或其它样品,然后确定本发明的核酸分子或本发明的多肽的表达水平。
本发明还包括了含有稀释剂和多肽或蛋白的组合物,其中的多肽或蛋白选自:含有SEQ ID NO:2、4、6、8、10、12、14或16中氨基酸序列的分离的多肽、含有SEQ ID NO:2、4、6、8、10、12、14或16中至少10个氨基酸片段的分离的多肽、含有SEQ ID NO:2、4、6、8、10、12、14或16中保守氨基酸置换的分离的多肽、以及含有SEQ IDNO:2、4、6、8、10、12、14或16中自然发生的氨基酸序列变体的分离的多肽,以及氨基酸序列与SEQ ID NO:2、4、6、8、10、12、14或16中的所述序列有至少大约50%、60%、70%或75%同一性的分离的多肽,与SEQ ID NO:2、4、6、8、10、12、14或16中的所述序列优选至少大约80%,更优选至少大约90-95%,而最优选至少大约95-98%的序列同一性。
附图简述
图1显示两个LFG1克隆的相对比对位置。
图2是LFG1-克隆A(SEQ ID NO:2)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图3是LFG1-克隆B(SEQ ID NO:4)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图4是LFG2(SEQ ID NO:6)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图5是LFG3(SEQ ID NO:8)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图6是LFG4(SEQ ID NO:10)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图7是ALFG5(SEQ ID NO:12)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图8显示了两个LFG6克隆的相对比对位置。
图9是LFG6-#20(SEQ ID NO:14)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图10是LFG6-#46(SEQ ID NO:16)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
优选实施方案的详细描述
I.一般说明
本发明部分基于鉴定的新基因家族,它们在癌变人组织中的表达与在正常的人组织中的表达不同。这些基因家族对应于SEQ IDNOS:1、3、5、7、9、11、13和15中的人cDNA。
本发明的基因和蛋白可以用做诊断试剂或标记物来检测癌症,或用来将样品中的癌组织与正常组织区别开来。它们也可以用做调节基因表达或活性的试剂的靶。例如,可以鉴定调节与肿瘤生长相关的生物过程,包括癌症的增生过程的试剂。
II.具体的实施方案
A.与癌症相关的蛋白
本发明提供分离的蛋白、蛋白的等位基因变体、以及发生保守的氨基酸置换的蛋白。本文中使用的“蛋白”或“多肽”部分是指具有SEQ ID NO:2、4、6、8、10、12、14或16中描述人的氨基酸序列的蛋白。该术语也指自然发生的等位基因变体以及与上述序列相比具有轻微不同的氨基酸序列的蛋白。等位基因变体,尽管具有与上述序列相比轻微不同的氨基酸序列,它们仍然具有同样或相似的与这些蛋白相关的生物学功能。
本文中使用的与SEQ ID NO:2、4、6、8、10、12、14或16中人的氨基酸序列相关的蛋白家族是指已经从人和其它生物体中被分离出来的蛋白。用来鉴定和分离与这些蛋白相关的蛋白家族的其它成员的方法将在下面描述。
本发明的蛋白优选为分离的形式。用于本文中时,当使用物理、机械或化学的方法将蛋白从通常与蛋白结合的细胞成分中取出时,该蛋白被称为分离的。专业技术人员可以容易地使用标准的纯化方法获得被分离的蛋白。
本发明的蛋白还包括SEQ ID NO:2、4、6、8、10、12、14或16的插入、缺失或保守氨基酸置换的变体。用于本文中时,保守的变体是指氨基酸序列的改变对蛋白的生物学功能没有负面的影响。当改变的序列阻止或破坏了与蛋白相关的生物学功能时,置换、插入或缺失被称为是有负面影响的。例如,蛋白的总电荷、结构或疏水/亲水性质,在某些情况下可以被改变而对生物学活性没有负面的影响。因此,氨基酸序列可以被改变,例如赋予肽链更高的疏水性或亲水性,而对蛋白的生物学活性没有负面的影响。
一般来说,等位基因变体、保守置换变体和蛋白家族的其它成员,它们含有的氨基酸序列与SEQ ID NO:2、4、6、8、10、12、14或16中的所述序列有至少大约50%、60%、70%或75%的氨基酸序列同一性,优选至少大约80%、更优选至少大约90-95%、而最优选至少大约95-98%的序列同一性。这些序列的同一性或同源性在此处定义为在将序列进行比对,并且如果需要就插入空隙(gap)以获得最高的同源性百分数后,候选序列中与SEQ ID NO:2、4、6、8、10、12、14或16中的氨基酸残基相同的百分数,保守置换不被当作序列同一性的一部分(相关的参数参见B部分)。融合蛋白、或肽序列中的N-端、C-端或内部延伸、缺失或插入不应被视为影响同源性。
因此,本发明的蛋白包括具有SEQ ID NO:2、4、6、8、10、12、14或16中所公开的氨基酸序列的分子;具有这些蛋白的至少大约3、4、5、6、10、15、20、25、30、35或更多的氨基酸残基的连续序列的片段;其中一个或多个氨基酸残基已经被插入到公开的编码序列的N-端或C-端或内部的氨基酸序列变体;以及上述公开序列至少一个氨基酸残基置换的序列变体,或其如前所述的片段。这些片段,也被称为肽或多肽,可以含有抗原区,被鉴定为对应于已知蛋白结构域氨基酸序列区的蛋白功能区,以及具有显著的亲水性的区域。通过使用通常可以获得的序列分析软件例如MacVector(Oxford Molecular)可以容易地鉴定所有这些区域。
预期的变体还包括那些含有预定的突变,例如由同源重组、定点突变或PCR突变引起的变体,以及其它动物中的相应蛋白,其它的动物包括但不限于兔、大鼠、小鼠、猪、牛、羊、马和人以外的灵长类,以及蛋白家族的等位基因或其它自然发生的变体;以及一些衍生物,其中的蛋白已经通过置换、化学、酶学或其它适当的方法用自然存在的氨基酸之外的部分(例如可检测的部分,如酶或放射性同位素)进行了共价修饰。
本发明还提供了含有本发明的蛋白或多肽以及稀释剂的组合物。适合的稀释剂可以是水性或非水性溶剂或它们的组合,并可以含有附加的对蛋白或多肽的稳定性、溶解性、活性和/或储存有利的成分,如水溶性盐或甘油。
正如下面所描述的,蛋白家族的成员可以被用来:(1)鉴定调节蛋白的水平或至少一种活性的试剂,(2)鉴定蛋白的结合配体,(3)作为抗原制备多克隆或单克隆抗体,(4)作为治疗药剂或靶,以及(5)作为癌症的诊断试剂或标记物。
B.核酸分子
本发明还提供为SEQ ID NO:2、4、6、8、10、12、14或16序列的蛋白和本文描述的相关蛋白编码的核酸分子,优选为分离的形式。本文使用的“核酸”被定义为编码前面定义的蛋白或肽的RNA或DNA,与编码这些肽的核酸序列互补的RNA或DNA,在适当的严紧条件下与SEQ ID NO:1、3、5、7、9、11、13或15的核酸杂交并与其保持稳定的结合的RNA或DNA,编码的多肽与SEQ ID NO:2、4、6、8、10、12、14或16的肽序列具有至少大约50%、60%、70%或75%,优选至少大约80%,更优选至少大约90-95%,最优选至少大约95-98%或更高的同一性的RNA或DNA,或与SEQ ID NO:1、3、5、7、9、11、13或15的可读框表现出至少大约50%、60%、70%或75%,优选至少大约80%,更优选至少大约90-95%,最优选至少大约95-98%或更高的核苷酸序列同一性的RNA或DNA。
本发明还包括与SEQ ID NO:1、3、5、7、9、11、13或15的互补序列特异性杂交的分离的核酸分子,特别是在可读框内特异性杂交的分子。这样的分子与SEQ ID NO:1、3、5、7、9、11、13或15的互补序列一般在严紧的杂交条件下进行特异性杂交。
特别关注的是基因组DNA、cDNA、mRNA和反义分子,以及基于可选择的骨架的核酸或包括可选择碱基的核酸,不论它们是天然来源的还是合成的。但是这些杂交或互补的核酸,也被确定为对于任何现有技术的核酸来说是新的和非显而易见的,包括编码本发明蛋白的核酸,在适当的严紧条件下杂交,或者互补于编码本发明蛋白的核酸的核酸。
核苷酸或氨基酸水平上的同源性或同一性由BLAST(基本局部对比搜索工具)分析来确定,使用专门用于序列相似性检索而制作的程序blastp、blastn,blastx、tblastn和tblastx(Altschul等(1997),Nucleic AcidsRes.25:3389-3402,以及Karlin等(1990),Proc.Natl.Acad.Sci.USA87:2264-2268,两者以其全文引入参考)使用的算法来计算。BLAST程序使用的方法首先考虑一个待检索序列和一个数据库序列之间的相似区段,两区段可以存在空隙也可以没有,然后评估所有等同的配对在统计上的显著性,最后只概括出那些显著性满足了预先选定的阈值的配对。对于序列数据库相似性检索的基本论点的讨论参见Altschul等(1994),Nat.Genet.6:119-129,以其全文引为参考。用于直方图、描述、比对、预期值(即用于报告与数据库序列配对的统计学重要性的阈值)、截止(点)、矩阵和过滤(低复杂性的检索参数)采用缺省设定。blastp、blastn,blastx、tblastn和tblastx使用的缺省评分矩阵是BLOSUM62矩阵(Henikoff等(1992),Proc.Natl.Acad.Sci.USA 89:10915-10919,以其全文引为参考),推荐的待检索序列长度超过85个核苷酸或氨基酸。
对于blastn来说,评分矩阵由M(即一对匹配的残基的奖励分数)与N(即误配残基的处罚分数)的比率来设定,其中M和N的缺省值分别为5和-4。Blastn的四个参数被调整如下:Q=10(产生空隙的处罚);R=10(延长空隙的处罚);wink=1(在待检索序列中每个winkth位点产生的字码碰撞);以及gapw=16(设定其内产生带有空隙的比对的窗口宽度)。相应的Blastp的参数设置为Q=9;R=2;wink=1;以及gapw=32。在GCG软件包10.0版中所用的序列间的最优比较,使用了DNA参数GAP=50(产生空隙的处罚)和LEN=3(延长空隙的处罚),在蛋白比较中相应的设置是GAP=8和LEN=2。
“严紧条件”是指(1)洗涤时使用低离子强度和高温,例如0.015MNaCl/0.0015M柠檬酸钠/0.1%SDS,温度为50℃或(2)在杂交过程中使用甲酰胺等变性试剂,例如50%(体积比)的甲酰胺,和0.1%牛血清白蛋白/0.1% Ficoll/0.1%聚乙烯吡咯烷酮/50mM pH6.5的磷酸钠缓冲液,以及750mM NaCl、75mM柠檬酸钠,温度为42□。另一个例子是在50%甲酰胺、5×SSC(0.75M NaCl,0.075M柠檬酸钠)、50mM磷酸钠(pH6.8)、0.1%焦磷酸钠、5×Denhardt氏溶液、超声处理的鲑鱼精子DNA(50μg/ml)、0.1%SDS和10%硫酸葡聚糖中于42□进行杂交,于42□在0.2×SSC和0.1%SDS中洗涤。专业技术人员可以容易地确定和改变严紧条件,使其适合于获得清晰和可检测的杂交信号。优选的分子是那些能够在上述条件下与SEQ ID NO:1、3、5、7、9、11、13或15的互补序列杂交、并且编码功能蛋白或全长蛋白的分子。更优选的杂交分子是那些在上述条件下与SEQ ID NO:1、3、5、7、9、11、13或15的可读框的互补链杂交的分子。
在本文中使用时,核酸分子,当它与编码其它多肽的污染核酸分子基本上分开时,被称为是“分离的”。
本发明还提供了公开的核酸分子的片段。本文中使用的核酸的片段是指编码或非编码序列的一小部分。片段的大小取决于使用的目的。例如,如果希望选择的片段能够编码蛋白的活性部分,则片段必须足够大到编码蛋白的功能区。例如,可以准备出这样的片段,它们编码的肽对应于预测的抗原区域。如果片段被用做核酸探针或PCR引物,那么片段的长度可以选择在探测/引发获得相对小量的假阳性(参见G部分的讨论)。
用作探针或特异性引物进行聚合酶链反应(PCR)、或用来合成编码本发明蛋白的基因序列的本发明核酸分子的片段(即合成的寡核苷酸),可以容易地通过化学技术合成,例如Matteucci等((1981)J.Am.Chem.Soc.103:3185-3191)的亚磷酰胺方法或使用自动化合成方法。此外,较大的DNA片段可以通过众所周知的方法容易地制备,例如合成一组代表基因的不同模块区段的寡核苷酸,然后将寡核苷酸进行连接来构建完整的被修饰的基因。
本发明的核酸分子还可以被修饰,使其包含可检测的标记,用于诊断和探测目的。各种这样的标记在本技术领域内是广为人知的,可以容易地与本文描述的编码分子一起使用。合适的标记包括但不限于生物素、放射性标记或荧光标记的核苷酸等。专业技术人员可以容易地使用任何这样的标记以获得本发明核酸分子的标记的变体。
C.其它相关核酸分子的分离
如上所述,具有SEQ ID NO:1、3、5、7、9、11、13或15的核酸分子的鉴定和表征,可以使专业技术人员分离出编码除本文所述序列之外的其他蛋白家族成员的核酸分子。此外,本文公开的核酸分子使得专业技术人员可以分离出编码除SEQ ID NO:2、4、6、8、10、12、14或16蛋白之外的其他蛋白家族成员的核酸分子。
例如,专业技术人员可以容易地使用SEQ ID NO:2、4、6、8、10、12、14或16的氨基酸序列来产生抗体探针,以筛选从适当的细胞制备的表达文库。一般来说,来自用纯化的蛋白免疫(如下文描述)的哺乳动物例如兔的多克隆抗血清或单克隆抗体,可以被用来探测哺乳动物的cDNA或基因组表达文库,例如λgtll文库,以获得适合的为蛋白家族的其它成员编码的序列。克隆的cDNA序列可以表达成融合蛋白,使用自身的控制序列直接表达,或通过使用适合表达酶的特定宿主的控制序列的构建物表达。
另外,本文描述的编码序列的一部分可以被合成并用作探针从任何哺乳动物中找到编码该蛋白家族的成员的DNA。制备含有大约18-20个核苷酸的寡聚体(编码大约6-7个氨基酸跨度)并用来筛选基因组DNA或cDNA文库,在严紧条件或足够消除过度的假阳性水平的严紧条件下获得杂交。
此外,寡核苷酸引物对可以被制备,用在PCR中以选择性地克隆编码的核酸分子。使用这样的PCR引物的PCR变性/退火/延伸循环在本领域内是众所周知的,并可以容易地被调整而适用于分离其它的编码核酸分子。
编码蛋白家族的其它成员的核酸分子也可以使用任何可获得的计算方法在现有的基因组或其它序列信息中鉴定,这些方法包括但不限于:PSI-BLAST(Altschul等(1997),Nucl.Acids Res.25:3389-3402),PHI-BLAST(Zhang等(1998),Nucl.Acids Res.26:3986-3990),3D-PSSM(Kelly等(2000),J.Mol.Biol.299:499-520),以及其它的计算分析方法(Shi等(1999),Biochem.Biophys.Res.Commun.262:132-138和Matsunami等(2000),Nature 404:601-604)。
D.含有核酸分子的rDNA分子
本发明还提供含有编码序列的重组DNA分子(rDNAs)。本文中使用的rDNA分子是指已经在原位进行分子操作的DNA分子。产生rDNA分子的方法在本领域是众所周知的,例如参见Sambrook等, 分子克隆 实验指南(第三版),冷泉港实验室出版社,冷泉港,NY,2001。在优选的rDNA分子中,编码的DNA序列与表达控制序列和/或载体序列是可操作地连接的。
正如本领域内所熟知的,选择本发明的蛋白家族编码序列可操作地连接的载体和/或表达控制序列,直接依赖于所需的功能性质,如蛋白表达,以及待转化的宿主细胞。本发明考虑的载体至少能够指导rDNA分子中包含的结构基因复制或插入到宿主染色体中,优选也能够表达。
用于调控可操作地连接的蛋白编码序列表达的表达控制元件在本领域内是广为人知的,包括但不限于诱导型启动子、组成型启动子、分泌信号和其它调控元件。在优选情况下,诱导型启动子容易控制,例如对于宿主细胞培养基中的营养具有反应性。
在一个实施方案中,含有编码核酸分子的载体将包括原核的复制子、即能够指导转化的原核宿主细胞如细菌宿主细胞中染色体之外的重组DNA分子自主复制和维持的DNA序列,这样的复制子在本领域内是众所周知的。此外,包含了原核复制子的载体也可以包含基因,该基因的表达产生可检测的标记,例如药物抗性。典型的细菌药物抗性基因是对氨苄青霉素、卡那霉素、氯霉素或四环素产生抗性的基因。
包含原核复制子的载体还可以包括原核的或噬菌体的启动子,它能够指导编码基因序列在细菌宿主细胞如大肠杆菌中的表达(转录和翻译)。启动子是由DNA序列形成的表达控制元件,它允许RNA聚合酶结合并转录。与细菌宿主相容的启动子序列一般在质粒载体中提供,这些载体含有方便的限制性酶切位点用于插入本发明的DNA区段。典型的这种载体质粒是来自BioRad实验室(Richmond,CA)的pUC8、pUC9、pBR322和pBR329以及来自Pharmacia(Piscataway,NJ)的pPL和pKK223。
与真核细胞相容,优选与脊椎动物细胞相容的表达载体也可以用于形成含有编码序列的rDNA分子。真核细胞表达载体,包括病毒载体,在本领域内是广为人知的,可以从几个商业来源获得。一般来说,这些载体都含有方便的限制性酶切位点用于插入所需的DNA区段。这些载体中典型的是pSVL和pKSV-10(Pharmacia)、pBPV-1/pML2d(International Biotechnologies,Inc.)、pTDT1(ATCC,#31255),本文描述的pCDM8等真核表达载体。如果需要,载体可以被修饰,以包含组织特异性的启动子。
用于构建本发明的rDNA分子的真核细胞表达载体还可以包含在真核细胞中有效的选择性标记,优选为药物抗性选择标记。优选的药物抗性标记是基因表达后产生新霉素抗性的基因,即新霉素磷酸转移酶(neo)基因(Southern等(1982),J.Mol.Anal.Genet.1:327-341)。另外,选择性标记可以存在于不同的质粒上,两个载体通过对宿主细胞的共转染被导入,并通过在适当的选择性标记的药物中培养来筛选。
E.含有外部提供的编码核酸分子的宿主细胞
本发明还提供用编码本发明蛋白的核酸分子转化的宿主细胞。宿主细胞可以是原核的也可以是真核的。对可用于表达本发明蛋白的真核细胞没有限制,只要细胞系与细胞培养方法相容,及与表达载体的增殖和基因产物的表达相容。优选的真核宿主细胞包括但不限于酵母、昆虫和哺乳动物细胞,优选脊椎动物细胞,例如来自小鼠、大鼠、猴子或人类细胞系的细胞。优选的真核宿主细胞包括可从ATCC以CCL61编号获得的中国仓鼠卵巢(CHO)细胞、可从ATCC以CRL1658编号获得的NIH瑞士小鼠胚胎细胞(NIH/3T3)、幼仓鼠肾细胞(BHK)等真核组织培养细胞系。
任何原核的宿主都可以被用来表达编码本发明蛋白的rDNA分子。优选的原核宿主是大肠杆菌。
适当的细胞宿主用本发明rDNA分子转化可以通过众所周知的方法来完成,这些方法一般依赖于使用的载体类型和所用的宿主系统。对于原核宿主细胞的转化,通常使用电穿孔和盐处理的方法(参见,例如,Cohen等(1972),Proc.Natl.Acad.Sci.USA 69:2110;和Sambrook等,同上)。对于用含有rDNAs的载体转化脊椎动物细胞,典型地使用电穿孔、阳离子脂或盐处理的方法,参见,例如,Graham等(1973),Virol.52:456;Wigler等(1979),Proc.Natl.Acad.Sci.USA 76:1373-1376。
成功转化的细胞,即含有本发明rDNA分子的细胞,可以用众所周知的包含用选择性标记进行筛选的技术来鉴定。例如,导入了本发明rDNA后获得的细胞可以被克隆以产生单菌落。从那些菌落获得的细胞可以被收获、裂解,其DNA内含物可以使用例如Southern,(1975)J.Mol.Biol.98:503或Berent等,(1985)Biotech.3:208中描述的方法来检测rDNA的存在,或通过免疫的方法分析细胞产生的蛋白。
F.使用rDNA分子生产重组蛋白
本发明还提供了使用本文描述的核酸分子生产本发明蛋白的方法。一般来说,生产重组形式的蛋白通常包括下面的步骤:
首先,获得编码本发明蛋白的核酸分子,诸如包括,基本上组成或组成为下列序列的核酸分子:SEQ ID NO:1、3、5、7、9、11、13或15,或SEQ ID NO:1的390-4883或390-4880位核苷酸,SEQ ID NO:3的12-4907或12-4904位核苷酸,或SEQ ID NO:5的424-1911或424-1908位核苷酸,或SEQ ID NO:7的405-1838或405-1835位核苷酸,或SEQ ID NO:9的89-1153或89-1150位核苷酸,或SEQ ID NO:11的223-1572或223-1569位核苷酸,或SEQ ID NO:13的418-1395或418-1392位核苷酸,或SEQ ID NO:15的271-1434或271-1431位核苷酸。如果编码序列没有被内含子打断,正如这些可读框,它直接适合于在任何宿主中表达。
然后,在优选情况下,如上所述,将核酸分子与适当的控制序列可操作地连接,以形成含有蛋白可读框的表达单位。表达单位被用来转化适当的宿主,转化的宿主在允许重组蛋白生产的条件下进行培养。任选地,重组蛋白也可以从培养基或细胞中分离出来;在某些情况下,当一些杂质可以被允许时,蛋白可以不必回收和纯化。
前面的每个步骤都可以以各种多种方式进行。例如,所需的编码序列可以从基因组片段获得,并直接在适当的宿主中使用。使用前面提到的适当的复制子和控制序列,可以构建出在各种不同宿主中可以操作的表达载体。控制序列、表达载体和转化方法依赖于用于表达基因的宿主细胞的类型,在前面已经详细讨论过。适当的限制性酶切位点,如果不能正常获得,可以加到编码序列的末端从而提供可切割的基因以插入到这些载体中。专业技术人员可以容易地调整任何本领域所熟知的宿主/表达系统,以使用本发明核酸分子生产重组蛋白。
G.调节编码与癌症相关基因的核酸表达的试剂的鉴定方法
本发明的另一个实施方案提供了鉴定试剂的方法,所述试剂调节编码本发明的蛋白,例如具有SEQ ID NO:2、4、6、8、10、12、14或16的氨基酸序列的蛋白的核酸表达。这样的检测可以利用任何可用的监测本发明核酸的表达水平变化的方法。如本文所述,如果试剂能够在细胞中上或下调节本发明核酸的表达,则它就被称为调节核酸的表达。
在一种分析方法中,可以制备含有报告基因融合体的细胞系,这些融合体是在SEQ ID NO:1的390-4883位核苷酸、SEQ ID NO:3的12-4907位核苷酸、SEQ ID NO:5的424-1911位核苷酸、SEQ ID NO:7的405-1838位核苷酸、SEQ ID NO:9的89-1153位核苷酸、SEQ IDNO:11的223-1572位核苷酸、SEQ ID NO:13的418-1395位核苷酸、SEQ ID NO:15的271-1434位核苷酸所确定的可读框中的核苷酸和/或5’和/或3’调控元件与任何可检测的融合配体之间进行融合的。有大量可检测的融合配体是已知的并容易获得,包括萤火虫荧光素酶基因和编码氯霉素乙酰转移酶的基因(Alam等(1990),Anal.Biochem.188:245-254)。含有报告基因融合体的细胞系然后在适当的条件和时间下暴露于测试试剂。暴露于试剂的样品和对照样品之间报告基因的差异表达,可以鉴定能够调节本发明的核酸表达的试剂。
其它的分析方法可以用来监测试剂调节编码本发明蛋白的核酸表达的能力,例如具有SEQ ID NO:2、4、6、8、10、12、14或16的蛋白。例如,mRNA表达可以通过与本发明的核酸进行杂交来直接监测。细胞系在适当的条件和时间下暴露于测试试剂,通过标准的程序,例如那些在Sambrook等, 分子克隆实验指南(第三版),冷泉港实验室出版社,冷泉港,NY,2001中公开的程序,分离出总RNA或mRNA。
优选的细胞是来自人组织的细胞,例如活检组织或来自癌症病人的培养细胞。可以使用的细胞系例如ATCC胸导管癌细胞系(目录号CRL-2320,CRL-2338和CRL-7345)、ATCC结肠直肠腺癌细胞系(目录号CCL-222、CCL-224、CCL-225、CCL-234、CRL-7159和CRL-7184)、ATCC肾透明细胞癌细胞系(目录号HTB-46和HTB-47)、ATCC肾细胞腺癌细胞系(目录号CRL-1611、CRL-1932和CRL-1933)、ATCC肝细胞癌细胞系(目录号CRL-2233、CRL-2234和HB-8065)、ATCC肺腺癌细胞系(目录号CRL-5944、CRL-7380和CRL-5907)、ATCC淋巴细胞系(目录号CRL-7936、CRL-7264和CRL-7507)、ATCC卵巢腺癌细胞系(目录号HTB-161、HTB-75和HTB-76)、ATCC胰腺腺癌细胞系(目录号CRL-1687、CRL-2119和HTP-79)、前列腺腺癌细胞系(目录号CRL-1435、CRL-2422和CRL-2220)以及ATCC胃腺癌细胞系(目录号CRL-1739、CRL-1863和CRL-1864)。此外,其它可以获得的细胞或细胞系也可以使用。
可以从本发明的核酸制备用于检测暴露于试剂的细胞和对照细胞之间RNA表达水平的差异的探针。优选的但不是必需的,设计在高度严紧的条件下只与靶核酸杂交的探针。在高度严紧的条件下只有高度互补的核酸杂交体才能形成。因此,分析条件的严紧性决定了两个核酸链之间为了形成杂交体应该存在的互补性的程度。应该选择使探针:靶杂交体和探针:非靶杂交体之间的稳定性差异最大的严紧条件。
探针可以通过本领域现有的方法根据本发明的核酸来设计。例如,探针的G+C含量和探针的长度可以影响探针与它的靶序列的结合。优化探针特异性的方法一般可以从Sambrook等,同上或Ausubel等,Short Protocols in Molecular Biology,第四版,John Wiley & Sons,Inc.,New York,1999中获得。
针对每个探针的需要可以使用现有的方法对杂交条件进行修改,例如Sambrook等和Ausubel等中描述的方法。总细胞RNA或富集polyARNA的RNA的杂交可以通过任何可用的方式来进行。例如,总细胞RNA或富集polyA RNA的RNA可以被固定到固相支持物上,然后在探针可以特异性杂交的条件下将固相支持物暴露于至少一个含有至少一个或部分本发明的序列的探针。此外,含有至少一个或部分本发明的序列的核酸片段可以被固定到固相支持物上,例如硅片、多孔玻璃片或膜上。然后在固定的序列可以特异性杂交的条件下将固相支持物暴露于来自样品的总细胞RNA或polyA RNA。这样的固相支持物和杂交方法可以广泛获得,例如Beattie,(1995)WO 95/11755中所公开的那些。通过测定给定的探针与来自未处理的细胞群的RNA样品和暴露于试剂的细胞群的RNA样品之间特异性杂交的能力,可以鉴定能够对编码SEQ ID NO:2、4、6、8、10、12、14或16序列蛋白的核酸的表达具有上或下调控的试剂。
用于mRNAs的定性和定量分析的杂交也可以通过使用RNA酶保护分析方法(即RPA,参见Ma等(1996),Methods 10:273-238)来进行。简单地说,含有编码基因产物的cDNA和噬菌体特异的DNA依赖性RNA聚合酶启动子(例如T7、T3或SP6 RNA聚合酶)的表达载体在cDNA的3’末端、噬菌体启动子的下游被线性化,其中这样的线性化分子随后被用做模板通过体外转录合成标记的cDNA反义转录本。标记的转录本然后与分离的RNA(即总的或分级的mRNA)的混合物杂交,杂交条件为在含有80%甲酰胺、40mM PIPES、pH6.4、0.4M NaCl和1mM EDTA的缓冲液中于45℃保温过夜。然后在含有40μg/ml核糖核酸酶A和2μg/ml核糖核酸酶的缓冲液中将得到的杂交体消化。在外源的蛋白失活并抽提之后,样品在尿素/聚丙烯酰胺凝胶上上样分析。
在另一种分析方法中,为了鉴定影响即时基因产物表达的试剂,首先鉴定在生理学上表达本发明的基因产物的细胞或细胞系。这样鉴定的细胞和/或细胞系预测含有必需的细胞机制,以至于对通过适当的表面转导机制和/或胞质级联接触外源的试剂而言,都能够维持转录元件的调节忠实性。此外,将这样的细胞或细胞系用表达载体(例如质粒或病毒载体)构建物转导或转染,该构建物含有结构基因的可操作的含有启动子的5’非翻译末端,所述结构基因编码融合到一个或多个抗原性片段的即时基因产物,所述抗原片段对即时基因产物是特异性的,其中该片段处于该启动子的转录控制之下,表达为其分子量可以与天然存在的多肽区别开的多肽,该多肽也可以含有具有免疫性的可以区别的标记或其它可检测的标记。这样的方法在本领域内是公知的(参见Sambrook等,同上)。
通过上述方法转导或转染的细胞或细胞系然后在适当的条件下与试剂接触。例如,存在于可药用的赋形剂中的试剂与细胞在水性生理缓冲液中接触,例如生理pH的磷酸盐缓冲液(PBS)、生理pH的Eagles平衡盐缓冲液(BSS)、含有血清的PBS或BSS、或含有PBS或BBS和/或血清的条件培养基,在37℃保温。本领域的专业技术人员可以根据需要对该条件进行调整。在细胞与试剂接触后,将该细胞破碎,对裂解液中的多肽进行分级,以便使多肽级分合并,并与抗体接触,通过免疫分析方法(例如ELISA、免疫沉淀或Western印迹)进行进一步处理。从“接触了试剂”的样品中分离到的蛋白合并液将与只用赋形剂接触细胞的对照样品进行比较,“接触了试剂”的样品与对照相比通过免疫技术产生的信号的增加或减少将被用来辨别试剂的效果。
H.调节癌症相关蛋白的水平或至少一种活性的试剂的鉴定方法
本发明的另一个实施方案提供了试剂的鉴定方法,所述试剂调节本发明的蛋白,例如具有SEQ ID NO:2、4、6、8、10、12、14或16氨基酸序列的蛋白的水平或至少一种活性。这样的方法或分析可以使用任何监测或检测所需活性的手段,并对于鉴定治疗癌症的试剂特别有用。
在一种方法中,可以分析已经暴露于待测试剂的细胞群落与未暴露的对照细胞群落之间本发明蛋白的相对量。在这种方法中,探针例如特异性抗体被用来监测蛋白在不同细胞群落中的差异表达。细胞系或群落在适当的条件和时间下被暴露于待测试剂。从暴露的细胞系或群落和对照的未暴露的细胞系或群落制备细胞裂解液。然后用探针分析细胞裂解液。
抗体探针通过适当的免疫方案免疫适当的哺乳动物宿主而制备,免疫使用本发明的肽、多肽或蛋白,只要它们有足够的长度,或者如果希望或如果需要增强免疫原性,可以与适当的载体相连。制备带有载体如BSA、KLH或其它载体蛋白的免疫连接物(conjugate)的方法在本技术领域是现成的。在某些情况下,使用例如碳二亚胺试剂进行直接连接可能是有效的;在其它的情况下,连接试剂例如那些PierceChemical Co.(Rockford,IL)所提供的试剂,在提供对半抗原的可接近性方面可能是令人满意的。例如,半抗原肽可以在氨基或羧基末端用半胱氨酸残基延伸,或用半胱氨酸残基间插其中,以方便载体的连接。免疫原的给药一般通过在一段适当的时期内注射来进行,并使用适当的佐剂,正如本领域所通常理解的那样。在免疫计划期间,测定抗体的滴度以确定抗体的形成是足够的。
尽管对于某些应用来说,通过这种方法生产的多克隆抗血清是令人满意的,但对于药物组合物来说,使用单克隆的制备物是优选的。分泌所需的单克隆抗体的无限增殖的细胞系可以使用Kohler和Milstein((1975)Nature 256:495-497)的标准方法或造成淋巴细胞或脾细胞无限增殖的修饰方案来制备,正如通常所公知的那样。分泌所需抗体的无限增殖细胞系通过免疫分析进行筛选,其中的抗原是肽半抗原、多肽或蛋白。当分泌所需抗体的适当的无限增殖细胞培养物被鉴别后,细胞可以在体外培养或在腹水中生产。
然后从培养液上清液或腹水上清液中回收所需的单克隆抗体。含有具有免疫重要(抗原结合的)部分的单克隆抗体片段或多克隆抗血清可以被用做拮抗剂,完整的抗体也可以。通常情况下,使用免疫反应性(抗原结合)的抗体片段,例如Fab、Fab’或F(ab’)2片段是优选的,特别是在治疗过程中,因为这些片段一般比完整的免疫球蛋白具有更少的免疫原性。
抗体或抗原结合片段也可以使用现有的技术通过重组的方法生产。与蛋白所需区域特异性结合的抗体区域也可以以具有多个物种来源的嵌合体的方式来生产,例如人源化抗体。
在上述方法中分析的试剂可以随机选择或合理选择或设计。用于本文中时,当试剂是被随机地选择而不考虑参与单独结合本发明的蛋白或与其相关底物、结合配体等一起结合的特定序列时,被称为是随机选择的。随机选择试剂的例子是使用化学文库或肽组合文库,或生物体的生长培养液。
在本文中使用时,当试剂的选择是在非随机的基础上进行,考虑其与试剂作用的靶位点序列和/或其构象时,被称为是合理选择或设计的。试剂可以通过利用组成这些位点的肽序列来合理选择或合理设计。例如,合理选择的肽试剂可以是一个氨基酸序列与任何功能性保守位点一致或从其衍生的肽。
本发明的试剂可以是,例如肽、小分子、维生素衍生物以及碳水化合物。显性负调节蛋白(dominant negative proteins),编码这些蛋白的DNA,针对这些蛋白的抗体,这些蛋白的肽片段或这些蛋白的模拟物,都可以导入到细胞中以影响功能。此处使用的“模拟”是指对肽分子的一个或几个区域进行修饰,以提供与亲本肽在化学上不同但在拓扑学和功能上相似的结构(参见Grant: 分子生物学和生物技术, Meyers编辑,659-664页,VCH Publishers,Inc.,New York,1995)。专业技术人员可以容易地认识到对本发明的试剂的结构特性没有限制。
本发明的肽试剂可以使用标准的固相(或液相)肽合成方法来制备,这在本领域内是公知的。此外,编码这些肽的DNA可以使用可商业获得的寡核苷酸合成仪合成,并可以使用标准的重组子生产系统重组地生产。如果要包括非基因编码的氨基酸,就必须使用固相肽合成来生产。
本发明的另一类试剂是与本发明蛋白的关键位置,例如细胞质结构域、间隔区结构域、α-螺旋卷曲-卷曲结构域或受体结构域具有免疫反应性的抗体,正如本文描述的那样。通过用含有预计被抗体靶向的那些蛋白部分作为抗原区的肽免疫适当的哺乳动物对象,可以获得抗体试剂。
I.调节与癌症相关的蛋白的表达或至少一种活性的试剂的应用
正如实施例中提供的那样,本发明的蛋白和核酸,例如具有SEQID NO:2、4、6、8、10、12、14或16氨基酸序列的蛋白,在癌组织中是差异表达的。上调或下调或调整蛋白的表达或蛋白的至少一种活性的试剂,例如激动剂或拮抗剂,可以用来调节与蛋白的功能和活性相关的生物或病理过程。这包括鉴定的使用本发明的同源物或类似物试剂。
本文中使用的对象可以是任何哺乳动物,只要该哺乳动物需要调整由本发明蛋白介导的病理或生物过程。术语“哺乳动物”被定义为属于哺乳动物纲的个体。本发明在治疗人类对象中特别有用。
病理过程是指一类产生有害影响的生物过程。例如,本发明蛋白的表达可能与细胞生长或异常增生相关。在本文中使用时,当试剂降低病理过程的程度或严重性时,它被称为缓解该病理过程。例如,通过施用以某种方式上调或下调或缓解本发明蛋白的表达或至少一种活性的试剂,可以防止癌症或缓解疾病的发展。
本发明的试剂可以单独提供,也可以与其它缓解特定病理过程的试剂组合在一起。例如,本发明的试剂可以与其它现有的药物共同给药。在本文中,当两种试剂同时给药或以一种使试剂在同一时间发生作用的方式独立地给药时,它们被称为组合给药。
本发明的试剂可以通过肠胃外、皮下、静脉内、肌内、腹膜内、透皮或含服的途径给药。另外或同时地,给药也可以通过口服。给药的剂量依赖于接受者的年龄、健康状况和体重,同时治疗的种类,如果有的话,治疗的频率和所希望的效果。
本发明还提供了含有一种或多种调整本发明蛋白的表达或至少一种活性的组合物。因为个体的需要是不同的,确定每个成分的有效量的最适范围属于本领域的技术。通常的剂量包括每公斤体重0.1到100μg。优选的剂量为每公斤体重0.1到10μg。最优选的剂量为每公斤体重0.1到1μg。
除了药理活性试剂外,本发明的组合物还可以含有适当的可药用的载体,包括可以方便使活性化合物加工成制剂的赋形剂和辅助剂,该制剂在药学上可用于将活性成分投送到作用位点。适合的肠胃外给药的剂型包括水溶形式的活性化合物的水溶液,例如水溶性的盐。此外,活性化合物的悬浮液也可以适当的油状注射悬浮液形式给药。适合的亲脂溶剂或载体包括脂肪油,例如芝麻油,或合成的脂肪酸酯,例如油酸乙基酯或甘油三酯。水性注射悬浮液可以含有增加悬浮液粘度的物质,包括例如羧甲基纤维素钠、山梨醇和/或葡聚糖。任选地,悬浮液也可以含有稳定剂。脂质体也可以用来封装试剂以投送到细胞内。
本发明用于全身给药的药物剂型可以为肠内、非肠胃或局部给药。事实上,所有三种类型的剂型可以同时使用以完成活性成分的全身给药。
合适的口服剂型包括硬的或软的胶囊、药丸、药片、包括糖衣片、酏剂、悬浮液、糖浆或其吸入剂和可控制释放的形式。
在实施本发明的方法时,本发明的化合物可以单独使用或组合使用,或与其它的治疗或诊断试剂结合使用。在某些优选实施方案中,本发明的化合物可以与按照一般接受的医学规范(generally acceptedmedical practice)为这些疾病开出的其它化合物共同给药。本发明的化合物可以在体内使用,一般在哺乳动物中,例如人、绵羊、马、牛、猪、狗、猫、大鼠和小鼠,也可以在体外使用。
J.鉴定结合配体的方法
本发明的另一个实施方案提供了分离和鉴定本发明蛋白的结合配体的方法。一般来说,在允许潜在的结合配体与本发明的蛋白结合的条件下,将本发明的蛋白与潜在的结合配体或细胞的提取液或级分混合。混合后,从混合物中分离出已经与本发明的蛋白结合的肽、多肽、蛋白或其它分子。然后取出与本发明的蛋白结合的结合配体并进行进一步分析。为了鉴定和分离结合配体,可以使用完整的蛋白,例如含有SEQ ID NO:2、4、6、8、10、12、14或16完整氨基酸序列的蛋白。此外,蛋白的片段也可以使用。
本文使用的细胞提取液是指从裂解或破碎的细胞制成的制备液或级分。优选的细胞提取液的来源是从人类肿瘤或转化的细胞衍生的细胞,例如癌的活检组织或组织培养细胞。此外,细胞提取液也可以从正常的组织或可获得的细胞系制备。
有多种方法可用于获得细胞的提取液。细胞可以使用物理或化学的破碎方法破碎。物理破碎方法的实施例包括但不限于超声和机械剪切。化学裂解方法的实例包括但不限于去污剂裂解和酶法裂解。专业技术人员可以容易地调整制备细胞提取液的方法,以获得用于本方法的提取液。
一旦制备了细胞的提取液,将提取液在蛋白可以与结合配体结合的条件下与本发明的蛋白混合。可以使用多种不同的条件,最优选的条件是近似人细胞细胞质中的条件。例如所用的细胞提取液的渗透性、pH、温度和浓度等一些特性,可以被改变以使蛋白与结合配体的结合最优化。
在适当的条件下混合后,结合的复合物与混合物分开。有多种技术可用于分离混合物。例如,特异性针对本发明蛋白的抗体可以被用来对结合配体复合物进行免疫沉淀。此外,标准的化学分离技术例如层析技术和密度/沉降离心也可以使用。
在除去了提取液中发现的不结合的细胞成分后,可以使用常规的技术将结合配体从复合物上解离。例如,可以通过改变混合物的盐浓度或pH来实现解离。
为了帮助从混合的提取液中分离结合的结合配体,可以将本发明的蛋白固定化在固相支持物上。例如,蛋白可以连接在硝酸纤维素基质或丙烯酸珠子上。将蛋白连接在固相支持物上有助于使肽/结合配体对与提取液中发现的其它成分分离开来。鉴定的结合配体可以是单一的蛋白,也可以是由两个或多个蛋白组成的复合物。此外,结合配体也可以按照Takayama等(1997),Methods Mol.Biol.69:171-184或Sauder等(1996),J.Gen.Virol.77:991-996的程序使用Far-Western分析方法鉴定,或通过使用抗原决定簇标记的蛋白或GST融合蛋白来鉴定。
此外,本发明的核酸分子可以用在酵母双杂交系统或其它的体内蛋白-蛋白检测系统中。酵母双杂交系统已经被用来鉴定其它的蛋白配体对,并可以被容易地调整以利用本文描述的核酸分子。
K.癌症相关蛋白的结合配体的应用
使用上述的方法获得的本发明蛋白的结合配体及其同源物和类似物,一旦分离后,可以用于各种不同的目的。使用本领域的现有技术,结合配体可以用于生产与结合配体结合的抗体。与结合配体结合的抗体可用于分析本发明的蛋白的活性,作为治疗试剂缓解由本发明的蛋白介导的生物或病理过程,或用于纯化结合配体。这些应用将在后面详细描述。
L.阻断结合配体和癌症相关蛋白之间结合的试剂的鉴定方法
本发明的另一个实施方案提供鉴定减小或阻断本发明蛋白与结合配体结合的试剂的方法。具体来说,本发明的蛋白在存在或不存在待测试剂的情况下与结合配体混合。在允许蛋白结合的条件下混合后,两种混合物被分析和比较,以确定试剂是否减小或阻断了本发明的蛋白与结合配体的结合。当存在于含有待测试剂的样品中的结合量减少时,就鉴定到了减小或阻断本发明的蛋白与结合配体结合的试剂。
在本文中,当试剂的存在减小结合配体与本发明蛋白结合的程度或阻止了该结合时,该试剂被称为减小或阻断了本发明的蛋白与结合配体之间的结合。一类试剂通过与结合配体结合减小或阻断了该结合,而另一类试剂通过与本发明的蛋白结合减小或阻断了该结合。
用于上述分析方法的结合配体可以是与本发明蛋白结合的分离和充分表征的蛋白或部分表征的蛋白,也可以是已经被鉴定存在于细胞提取液中的结合配体。对于本领域的专业人员来说,显然只要结合配体的特征是可鉴定的性质,例如分子量,现有分析方法就可以使用。
上述方法中分析的试剂可以随机选择或合理选择或设计。这里所说的试剂随机选择是指试剂被随机地选择,不考虑参与本发明的蛋白与结合配体结合的具体序列。随机选择的试剂的例子是使用化学文库或肽组合文库,或生物体的生长培养液。
这里所说的试剂合理选择或设计是指试剂在非随机的基础上选择,考虑与试剂作用相关的靶位点的序列和/或其构象。利用组成结合配体和本发明蛋白的接触位点的肽序列可以合理选择或合理设计试剂。例如,合理选择的肽试剂可以是其氨基酸序列与本发明的蛋白在结合配体上的接触位点一致的肽。这样的试剂通过与结合配体的结合将减小或阻断本发明的蛋白与结合配体的结合。
本发明的试剂可以是例如肽、小分子、维生素衍生物以及碳水化合物。本领域的专业人员可以容易地认识到对本发明的试剂的结构特性没有限制。
本发明的一类试剂是肽试剂,其氨基酸序列在本发明蛋白的氨基酸序列的基础上选择。本发明的肽试剂可以使用本领域现有的标准固相(或液相)肽合成方法来制备。此外,编码这些肽的DNA可以使用商用的寡核苷酸合成仪合成,或使用标准的重组子生产系统重组地生产。如果要包括非基因编码的氨基酸,就必须使用固相肽合成来生产。
本发明的另一类试剂是与本发明的蛋白或结合配体的关键位置具有免疫反应性的抗体。如上所述,通过用含有预测被抗体靶向的那些本发明的蛋白部分或结合配体作为抗原区免疫适当的哺乳动物对象,可以获得抗体。关键区域包括参与本发明的蛋白与结合配体结合的接触位点。
正如下面讨论的,涉及本发明蛋白活性的重要的最小残基序列定义了功能性线性结构域,可以有效地用做诱饵,用于双杂交筛选和潜在结合分子的鉴定。与使用全长分子相反,使用这样的片段将显著地增加筛选的特异性,因此是优选的。同样地,线性序列也可以用作亲和基质,使用生物化学亲和纯化策略来分离结合的蛋白。
M.阻断结合配体与癌症相关蛋白之间结合的试剂的应用
如同在实施例中提供的那样,本发明的蛋白和核酸,例如具有SEQID NO:2、4、6、8、10、12、14或16的氨基酸序列的蛋白,在癌组织中是差异表达的。减小或阻断本发明蛋白与结合配体的相互作用的试剂,包括那些使用本发明蛋白的同源物和类似物而得以鉴定的试剂,可以用来调节与蛋白的功能和活性相关的生物或病理过程。
本文中使用的对象可以是任何哺乳动物,只要该哺乳动物需要调节由本发明的蛋白介导的病理或生物过程。术语“哺乳动物”是指属于哺乳动物纲的个体。本发明在治疗人对象中特别有用。
病理过程是指一类产生有害影响的生物过程。例如,本发明蛋白的表达可能与细胞生长或异常增生相关。在本文中使用时,当试剂减少病理过程的程度或严重性时,该试剂被称为缓解了该病理过程。例如,通过施用减小或阻断本发明蛋白与结合配体的相互作用的试剂,可以防止癌症或缓解疾病的发展。
本发明的试剂可以通过肠胃外、皮下、静脉内、肌内、腹膜内、透皮或含服的途径给药。另外或同时地,给药也可以通过口服。给药的剂量依赖于接受者的年龄、健康状况和体重,同时治疗的种类,如果有的话,以及治疗的频率和所希望的效果。
本发明还提供了含有一种或多种阻断本发明蛋白与结合配体结合的试剂的组合物。因为个体的需要是不同的,确定每个成分的有效量的最适范围属于本领域的技术。典型的剂量包括每公斤体重0.1到100μg。优选的剂量为每公斤体重0.1到10μg。最优选的剂量为每公斤体重0.1到1μg。
除了药理活性试剂外,本发明的组合物还可以含有适当的可药用的载体,包括可以方便使活性成分加工成制剂的赋形剂和辅助剂,该制剂在药学上可用于将活性成分投送到作用位点。适合的肠胃外给药的剂型包括水溶形式的活性化合物的水溶液,例如水溶性的盐。此外,活性化合物的悬浮液也可以适当的油状注射悬浮液形式给药。适合的亲脂溶剂或载体包括脂肪油,例如芝麻油,或合成的脂肪酸酯,例如油酸乙基酯或甘油三酯。水性注射悬浮液可以含有增加悬浮液粘度的物质,包括例如羧甲基纤维素钠、山梨醇和/或葡聚糖。任选地,悬浮液也可以含有稳定剂。脂质体也可以用来封装试剂以投送到细胞中。
本发明用于全身给药的药物剂型可以为肠内、非肠胃或局部给药剂型。事实上,所有三种类型的剂型可以同时使用以完成活性成分的全身给药。
合适的口服剂型包括硬的或软的胶囊、药丸、药片(包括糖衣片)、酏剂、悬浮液、糖浆或其吸入剂和可控制释放的形式。
在实施本发明的方法时,本发明的化合物可以单独使用或组合使用,或与其它的治疗或诊断试剂结合使用。在某些优选实施方案中,本发明的化合物可以与按照一般接受的医学规范为这些疾病开出的其它化合物共同给药。本发明的化合物可以在体内使用,一般在哺乳动物中,例如人、绵羊、马、牛、猪、狗、猫、大鼠和小鼠,也可以在体外使用。
N.合理的药物设计和组合化学
本发明还包括了合理的药物设计和组合化学。专业人员会认可适当的方法,以使用和实施本发明的方面来鉴定可以开发用于治疗癌症的化合物。涉及多肽的合理的药物设计需要鉴定和限定与设计的药物相互作用的第一个肽,然后使用第一个靶肽确定第二个肽的必要条件。在限定了这些必要条件后,人们可以发现或制备出满足所有或基本上所有的限定的必要条件的适当的肽或非肽。因此,合理药物设计的一个目标是生产目的生物活性多肽的结构或功能类似物,或与它们相互作用的小分子(激动剂、拮抗剂、无效化合物(null compound)),以便形成具有,例如更多或更少的潜在配基形式的药物(参见例如Hodgson(1991),Bio.Technology 9:19-21)。组合化学是一门整体地而不是一个一个地合成和测试化合物生物活性的科学,其目的在于比以前所能做到地更快和更廉价地发现药物和物质。近年来,由于计算机辅助蛋白模拟和药物发现中方法的改进,合理药物设计和组合化学已经变得更密切相关了。(参见例如美国专利No.4,908,773、5,884,230、5,873,052、5,331,573和5,888,738)。
由于计算机图形学的出现,将分子模拟用做合理药物设计和组合化学的工具已经极大地发展了。它不仅有可能在计算机屏幕上以三维的方式看见分子,而且有可能研究酶和受体等大分子和待测的合理设计的衍生物分子的相互作用(参见Boorman(1992),Chem.Eng.News70:18-26)。现在有大量用户友好的软件和硬件可用,实际上所有的制药公司都有计算机模拟研究组致力于合理药物设计。例如,分子模拟公司(Molecular Simulations Inc.( www.msi.com))销售几种复杂精致的程序,可以使用户从氨基酸序列开始,构建出蛋白或多肽的二维或三维模型,将它与其它的二维和三维模型进行比较,并用三维模型实时地分析化合物、药物和肽的相互作用。因此,在本发明的某些实施方案中,软件被用来比较本发明蛋白的区域和与其相互作用的分子(统称为“结合配体”,例如抗蛋白抗体),以及这些分子的片段或衍生物与其它分子,例如肽、肽模拟物和化学物质,以便能预测和设计治疗的相互作用(参见Schneider(1998),Genetic Engineering News December,第20页;Tempczyk等(1997),Molecular Simulations Inc.SolutionsApril;以及Butenhof(1998),分子模拟公司,分子模拟讨论的案例注解(1998年8月))。
O.基因治疗
在另一个实施方案中,基因治疗可以用做调节与蛋白的功能和活性相关的生物和病理过程的手段。这包括在癌细胞中插入基因构建物,其编码含有SEQ ID NO:2、4、6、8、10、12、14或16的全部或至少部分序列的蛋白,或者该基因构建物也可以含有SEQ ID NO:1、3、5、7、9、11、13或15的全部或部分非编码区,它们与启动子或增强子元件可操作地连接,以便该蛋白的表达导致所述癌症的抑制,以及其中该启动子或增强子元件是调节该基因构建物的启动子或增强子元件。
在描述的构建物中,该蛋白的表达可以由任何适当的启动子指导(例如人巨细胞病毒(CMV)、猴病毒(SV40)或金属硫蛋白的启动子),并且可以被任何适当的哺乳动物调控元件调控。例如,如果需要,已知优先在神经细胞、T细胞或B细胞中指导基因表达的增强子可以被用来指导表达。可以使用的增强子包括但不限于那些其表达被表征为组织或细胞特异性的增强子。另外,如果LFG1、LFG2、LFG3、LFG4、LFG5或LFG6的基因组克隆被用作治疗构建物(例如,在如上述用本发明的核酸分子通过杂交将其分离后),调控可以通过同源调控序列介导,或者如果需要,通过来自异源的调控序列,包括上述的任何启动子或调控元件来介导。
将构建物插入到癌细胞中是在体内完成的,例如使用病毒或质粒载体。这样的方法也可以适用于体外使用。因此,本发明的方法可以容易地应用于不同形式的基因治疗中,不论细胞是在离体进行遗传修饰然后施用给宿主中,还是在体内使用包括特别适合于这些治疗的载体的任何多种适当方法进行遗传修饰。
逆转录病毒载体、腺病毒载体、腺相关病毒载体、或对可能参与癌症的细胞(例如上皮细胞)具有适当向性的其它病毒载体,都可以用做治疗基因构建物的基因转移投送系统。有多种用于这种目的的载体已经广为人知(Cozzi PJ等(2002)Prostate,53(2):95-100;Bitzer M,LauerU.,(2002)Dtsch Med Wochenschr.127(31-32):1623-1624;Mezzina和Danos(2002),Trends Genet.8:241-256;Loser等(2002)Curr.Gene Ther.2:161-171;Pfeifer和Verma(2001),Annu.Rev.Genomics Hum.Genet.2:177-211)。逆转录病毒载体发展得特别完善,已经用于临床(Anderson等(1995),美国专利No.5,399,346)。非病毒的方法也可以用于将治疗DNA导入预计将遭受癌症的细胞(Jeschke等(20002)Curr.Gene Ther.1:267-278;Wu等(1988),J.Biol.Chem.263:14621-14624;Wu等(1989),J.Biol.Chem.264:16985-16987)。例如,基因可以通过脂转染、asialorosonucoid多聚赖氨酸交联、或者较不优选的在外科条件下的显微注射的方法导入到神经元或T细胞中。
对于上述的任何应用方法来说,治疗性核酸构建物优选施加在癌症事件的位点(例如通过注射)。然而,它也可以施加在癌症事件附近的组织中,或施加到为预计将遭受癌症的细胞提供供应的血管上。
P.转基因动物
含有突变、敲除或修饰的基因的转基因动物也包括在本发明中,这些基因对应于SEQ ID NO:1、3、5、7、9、11、13或15的cDNA序列,或编码SEQ ID NO:2、4、6、8、10、12、14或16的多肽序列的可读框,或其具有至少大约3、4、5、6、10、15、20、25、30、35或更多氨基酸残基的连续序列的片段。转基因动物是遗传修饰的动物,其已经通过实验转入了重组、外源或克隆的遗传物质。这样的遗传物质通常被称为“转基因”。转基因的核酸序列,在这种情况下是SEQ ID NO:1、3、5、7、9、11、13或15的形式,可以被整合在基因组中该特定的核酸序列在正常情况下不会被发现的位置,也可以整合在转移基因的正常位置上。转基因的组成为来自同物种的基因组或靶动物物种之外不同物种的基因组的核酸序列。
在某些实施方案中,构建了这样的转基因动物,其中包含SEQ IDNO:1、3、5、7、9、11、13或15的基因的全部或部分被删除。在对应于SEQ ID NO:1、3、5、7、9、11、13或15的基因含有一个或多个内含子的情况下,完整的基因——所有外显子、内含子和调控序列——可以被删除。此外,也可以删除比完整的基因小的部分。例如,可以删除单个的外显子和/或内含子,以产生表达修饰的本发明蛋白的动物。
术语“生殖细胞系转基因动物”是指这样的转基因动物,其中遗传变化或遗传信息被导入了生殖系细胞,从而赋予了转基因动物将遗传信息转移给后代的能力。如果这样的后代事实上具有某些或全部的这种改变或遗传信息,那么它们也是转基因动物。
变化或遗传信息对于受体所属的动物物种可以是外源的,只对受体这个特定的个体是外源的,或者遗传信息也可能已经被受体拥有。在最后这种情况下,改变的或导入的基因可以与天然的基因有不同的表达。
转基因动物可以通过各种不同的方法来产生,包括转染、电穿孔、显微注射、在胚胎干细胞中的基因靶向和重组病毒和逆转录病毒感染(参见例如美国专利No.4,736,866;美国专利5,602,307;Mullins等(1993),Hypertension 22:630-633;Brenin等(1997),Surg.Oncol.6:99-110;Recombinant Gene Expression Protocols(Methods in MolecularBiology,第62卷),Tuan主编,Humana Press,Totowa,NJ,1997)。
许多重组或转基因小鼠可以产生,包括那些表达活化的致癌基因序列(美国专利4,736,866)、表达猴SV40 T-抗原(美国专利No.5,728,915)、缺乏干扰素调控因子1(IRF-1)(美国专利No.5,731,490)、表现出多巴胺能功能障碍(美国专利No.5,723,719)、表达至少一种参与血压控制的人类基因(美国专利No.5,731,489)、表现出与在自然发生的阿茨海默氏病中存在的病症有较高的相似性(美国专利No.5,720,936)、具有降低的介导细胞附着能力(美国专利No.5,602,307)、拥有牛生长激素基因(Clutter等(1996),Genetics 143:1753-1760)、或能够产生完全的人类抗体反应(McCarthy(1997),Lancet 349:405)的小鼠。
尽管小鼠和大鼠仍然是大多数转基因实验所选择的动物,在某些情况下优选甚至必须使用另外的动物物种。转基因步骤已经成功地应用在各种非鼠科的动物中,包括绵羊、山羊、猪、狗、猫、猴、黑猩猩、仓鼠、兔、奶牛和豚鼠(参见例如Kim等(1997),Mol.Reprod.Dev.46:515-526;Houdebine(1995),Reprod.Nutr.Dev.35:609-617;Petters(1994),Reprod.Fertil.Dev.6:643-645;Schnieke等(1997),Science 2782130-2133;和Amoah(1997),J.Animal Sci.75:578-585)。
将核酸片段导入重组的哺乳动物感受态细胞的方法可以是任何利于多种核酸分子共转化的方法。本领域的专业人员可以容易地获得产生转基因动物的详细步骤,包括在美国专利No.5,489,743和美国专利No.5,602,307中所公开的那些。
Q.诊断方法
因为本发明的基因和蛋白在癌细胞和非癌组织中表达不同,本发明的基因和蛋白可以用于诊断或监测癌症、追踪疾病的进展、或者将癌组织与非癌组织样品区分开来。一种使用本发明的核酸分子或蛋白诊断癌症的方法包括从活的对象中获得组织。
检测本发明的核酸或蛋白分子的分析方法可以采用任何可用的形式。通常分析核酸分子的方法包括基于杂交或PCR的方法。通常检测本发明的蛋白、多肽或肽的分析方法包括使用任何可用形式的抗体探针,例如原位结合分析等(参见Harlow和Lane, 抗体-实验室手册,冷泉港实验室出版社,冷泉港,NY,1988)。在优选的实施方案中,分析的进行使用了适当的对照。
一般来说,本发明的诊断可以按照实施方案是基于核酸还是基于蛋白的分析而进行分类。某些诊断分析方法检测促进癌变的本发明的核酸或蛋白的突变或多态性。其它的诊断分析方法鉴定和辨别蛋白活性的缺陷,这是通过检测到待测生物体中本发明的RNA或蛋白水平类似于患有疾病例如癌症的生物体中本发明的RNA或蛋白水平,或检测到待测生物体中本发明的RNA或蛋白水平不同于未患疾病的生物体来进行的。
此外,还考虑到了生产含有下面实施方案中描述的试剂和方法的试剂盒,以便允许快速地检测和鉴定蛋白活性或水平的畸变。诊断试剂盒可以包含核酸探针或抗体或其组合,它们能够特异性检测本发明的蛋白或核酸探针或抗体或其组合的突变形式,可以用于测定一个或多个本发明蛋白的RNA或蛋白表达水平。这些试剂盒的检测成分一般与一种或多种下列试剂共同提供。通常提供能够吸附或结合DNA、RNA或蛋白的支持物。可用的支持物包括硝酸纤维素膜、尼龙膜或衍生的尼龙膜,其特征携有带正电荷的取代基的阵列。在这些试剂盒中也可以提供一种或多种限制性酶、对照试剂、缓冲液、扩增酶、以及非人类的多核苷酸,如小牛胸腺或鲑鱼精子DNA。
有用的基于核酸的诊断技术包括但不限于直接的DNA测序、梯度凝胶电泳、Southern印迹分析、单链确认分析(SSCA)、RNA酶保护分析、斑点印迹分析、核酸扩增、等位基因特异性PCR以及这些方法的组合。这些分析的起始点是从生物样品中分离或纯化核酸。可以预期活检组织将提供良好的样品源。核酸从样品中提取出来,并且可以使用引物通过DNA扩增技术如聚合酶链反应(PCR)得到扩增。本领域的专业人员将会容易地确认可用于证实多态性存在的方法。此外,本领域内现有的任何可寻址的阵列技术都可用于本发明的这个方面。多核苷酸阵列的一个具体的实施方案被称为GenechipsTM,已经在美国专利5,143,854、PCT申请WO 90/15070和92/10092中进行了广泛的描述。
各种各样的标记物和交联技术已为本领域的专业技术人员所熟知,可以用于各种核酸分析方法中。有几种途径可以产生用于杂交或PCR的标记的核酸,包括但不限于寡核苷酸标记、缺刻翻译、末端标记或使用标记核苷酸的PCR扩增。此外,编码本发明蛋白的核酸也可以被克隆到载体中以生产mRNA探针。这样的载体在本领域内是广为人知的,可商业获得的,并可以通过加入适当的RNA聚合酶,例如T7、T3或SP6和标记的核苷酸用来在体外合成RNA探针。许多公司例如Pharmacia Biotech(Piscataway,NJ)、Promega(Madison,WI)和U.S.Biochemical Corp(Cleveland,OH)都为这些方案提供商用试剂盒和方案。适合的报告分子或标记物包括放射性核素、酶、荧光、化学发光或产色素的试剂,以及底物、辅助因子、抑制剂、磁性微粒等。
在优选的基于蛋白的诊断中,本发明的抗体以有序阵列方式连接在支持物上,其中大量的抗体被连接在支持物的不同区域,彼此之间不重叠。本领域专业技术人员会容易地确认可用的基于蛋白的诊断的分析方法。蛋白从生物样品中获得,使用常规的方法标记(例如放射性、化学发光或荧光)。利用标记的已知浓度的本发明蛋白的突变体或野生型标准品,研究人员可以准确地确定样品中本发明的蛋白的浓度,根据这个信息可以评估特定形式蛋白的表达水平。常规的光密度测定方法也可以用来更准确地测定这样的蛋白的浓度或表达水平。这些方法也容易使用本领域的专业技术人员熟知的高通量诊断分析技术进行自动化。正如上面详细描述的那样,本领域任何已知的可寻址的阵列技术也可以用于本发明的这个方面,并且在芯片上显示蛋白阵列以试图最大化抗体结合样式和诊断信息。
如上面所讨论的,在本发明的基因或蛋白中多态性的存在或检测可以对生物体中的癌症或相似疾病提供诊断。其它的实施方案包括含有检测成分的诊断试剂盒的制备,所述成分例如特异性针对本发明基因或蛋白的具体多态性突变体的抗体。检测成分一般与一种或多种下列试剂组合提供。能够吸附或结合RNA或蛋白的支持物通常被提供。可用于这种目的的支持物包括但不限于硝酸纤维素膜、尼龙膜或衍生的尼龙膜,其特征为携有带正电荷的取代基的阵列,以及GenechipsTM或其等价物。在这些试剂盒中也可以包括一种或多种酶,例如反转录酶和/或Taq聚合酶,以及dNTP、缓冲液或非人类的多核苷酸,如小牛胸腺或鲑鱼精子DNA。试剂盒分析的结果可以由保健提供者或诊断实验室进行解释。此外,诊断试剂盒也可以生产并销售给个人用于自我诊断。
除了根据多态性的存在或不存在诊断疾病之外,一些与癌症相关的疾病是来自特定的组织中本发明的蛋白或基因的水平偏离,或本发明蛋白表达的方式异常。例如,通过监测各种组织中的表达水平,可以进行诊断或可以鉴定疾病的状态。同样地,通过确定在特定组织中各种不同的本发明蛋白的表达水平的比率(例如表达模式),可以作出健康或疾病的预测。来自健康的个体以及患有癌症的个体的不同组织中本发明蛋白的表达水平被测定。这些数值可以记录在数据库中,并与从测试个体获得的数值进行比较。此外,来自健康的和患病的个体的各种组织中的比率或表达方式都被记录在数据库中。这些分析被称为“疾病状态图谱”,通过比较一个疾病状态图谱(例如来自健康的或患病的个体)与一个来自测试个体的疾病状态图谱,临床医师可以快速地诊断是否存在疾病。
上述的基于核酸和蛋白的诊断技术可用于检测组织中本发明的基因或蛋白表达的水平或量或比率。例如通过定量的Northern印迹、原位分析、免疫组织化学、ELISA、基因芯片阵列技术、PCR和Western印迹,特定的本发明蛋白(野生型或突变体)的RNA或蛋白的表达量或水平可以被快速地测定,并根据这些信息表达的比率可以确定。此外,被分析的本发明的蛋白可以是现在未知的,但是基于它们拥有上述的一个或多个同源区域而被鉴定的家族成员。
可以相信,不用进一步的描述,本领域的普通技术人员就可以使用前面的描述和后面的说明性实施例,制造和使用本发明的化合物并实施被权利要求保护的方法。因此,下面的工作实施例只是具体地指出了本发明的优选实施方案,并不被推论为以任何方式对本公开的剩余部分进行限制。
实施例
实施例1:鉴定癌症中差异表达的mRNA-1
对肿瘤活检和正常组织之间基因表达的整体变化使用Gene Logic,Inc.(Gaithersburg,MD)的GeneExpress Oncology DatasuiteTM进行检测。数据库包括了使用Affymetrix人基因组U95阵列产生的来自不同器官的正常和癌组织样品的基因表达图谱。在数据库的这些组织样品中,分析正常和癌组织组的表达图谱,所述组织组来自乳腺、结肠、食道、肾、肝、肺、淋巴结、卵巢、胰腺、前列腺、直肠和胃。
Affymetrix人基因组U95阵列含有63,175个探针组。探针组是检测一个转录本(基因或cDNA克隆)的一组探针,通常由16-20个寡核苷酸探针对组成。这些探针对包括了完全匹配的组和错配的组,二者对于计算平均差都是必需的。平均差用作转录本表达水平的相对指示器(indicator),并且是对每个探针对的强度差的度量,通过用完全匹配的强度减去错配的强度而计算。这考虑到了探针对之间杂交的可变性以及能够影响荧光强度的其它杂交假象。使用计算出的平均差值,对每个基因建立了绝对信号(absolute call):“不存在”(=没有检测到)、“存在”(=检测到)或“处于边缘”(=不清楚是否存在)。
使用下面的统计方法确定癌组织和正常组织样品之间基因的差异表达。(1)对于每个探针组,使用Affymetrix微阵列组(MicroarraySuite)(v4.0)确定平均差值和绝对信号;(2)在一个给定的样品组中,使用MatLab程序(The MathWorks,Inc.,Natick,MA)通过基本成分分析(PCA)检测组织样品中的无关项。在PCA中使用的数据点是随机选择的探针组(5,000~6,000个探针组)的平均差。无关项被排除出进一步的分析;(3)通过使用GeneExpress程序的倍率变化分析工具分析基因表达的变化。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中每个基因的平均差的平均值和正常组织样品组中该基因的平均差的平均值而计算的。获得在表达水平上有至少3倍的增加或减少的基因。如果基因通过方差测试分析(Steel等,Principles and Procedures ofStatistics:A Biometrical Approach( 统计学原理和程序:生物测量方法), 第三版,McGraw-Hill,1997)测定显示出的p-值少于或等于0.05,它们就被包括在分析中;(4)选择至少在5种不同类型癌症中表现出差异表达的基因。
对芯片数据的分析显示出标记物LFG1的表达在癌组织样品中与正常组织样品中相比显著上调了。LFG1(SEQ ID NO:1或3)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.91875_s_at测定。91875_s_at序列来自EST AI053741。91875_s_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,显示在表1中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.15:1359-1367)。表1中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-1的上调可以诊断癌症。
表1
  组织   病理学/形态学   几何平均值               样品数量   倍率变化   方向   p-值
总数 存在   处于边缘 不存在
  乳腺   正常组织,NOS   22.71   34   8   4   22
  渗透性导管癌   184.04   61   61   0   0   8.11   上调   0
  渗透性小叶癌   104.36.   10   9   0   1   4.60   上调   0.00456
结肠   正常组织,NOS   76.46   24   23   0   1
  腺癌,NOS   244.76   36   35   0   1   3.20   上调   0.00001
食管   正常组织,NOS   50.47   18   16   1   1
  腺癌,NOS   297.56   8   8   0   0   5.90   上调   0.00367
  肾   正常组织,NOS   20.00   25   1   0   24
  透明细胞癌   60.48   11   10   1   0   3.02   上调   0.00082
  肾细胞癌   65.01   16   13   0   3   3.25   上调   0.00011
  正常组织,NOS   22.06   19   3   0   16
  肝细胞癌,NOS   86.74   23   21   0   2   3.93   上调   0
  正常组织,NOS   21.27   32   6   0   26
  腺癌,NOS   122.81   39   38   0   1   5.77   上调   0
卵巢   正常组织,NOS   20.21   23   0   0   23
  乳头状浆液性腺癌   112.80   23   21   0   2   5.58   上调   0
胰腺   正常组织,NOS   20.02   20   1   0   19
  腺癌,NOS   72.55   25   22   0   3   3.62   上调   0
直肠   正常组织,NOS   78.86   20   20   0   0
  腺癌,NOS   259.95   22   22   0   0   3.30   上调   0.00008
  正常组织,NOS   36.06   18   7   0   11
  腺癌,NOS   218.74   38   36   0   2   6.07   上调   0
通过测定结合到芯片序列片段no.91875_s_at的样品得到的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。分析中使用的PCR引物(5’-GCTGAAGCAGGAAAATCGCTT-3’(SEQ ID NO:17)和5’-TGAGACGGAGTCTCACTCGGT-3’(SEQ ID NO:18))是基于特定的Affymetrix片段(91875_s_at)的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO:19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO:20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肾、肝、肺、卵巢、胃和胰腺的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-1的上调。
实施例2:与差异表达的mRNA对应的全长人cDNA(LFG1)的克隆
使用来自人心脏的cDNA文库(ResGen,Huntsville,AL)通过聚合酶链反应(PCR)和cDNA末端的快速扩增(RACE)获得了具有SEQ IDNO:1或3的全长cDNA。使用人基因组浏览器程序(Human GenomeBrowser(University of California,Santa Cruz))在预测的含有91875_s_at序列的基因的基础上设计了用于PCR的基因特异性的寡核苷酸(5’-CACCCTTTGCCTCTGTCACTTCCGCA-3’(SEQ ID NO:21)、5-GCTGGAGCACCAGGACTGCATTG-3’(SEQ ID NO:22)、5’-GGAGCTGAGCAGCAGTGTAATGAA-3’(SEQ ID NO:23)、5’-GAGGCCTGCCTGAAGGAGGAGCTTC-3’(SEQ ID NO:24)、5’-TCTGGAAGTAGTGCAGACGCCTCAGG-3’(SEQ ID NO:25)、5’-AGCCAACGTCGGCTTTGTTATCCAGC-3’(SEQ ID NO:26)、5’-GCTGTCAGATATGATGGTTCTGGAC-3’(SEQ ID NO:27)、5’-CCAGCCTCACCACTGTTGGGTTGC-3’(SEQ ID NO:28)、5’-CATTCTCTGAGCTGTATTAGTGT-3’(SEQ ID NO:29)、5’-CCTGAGCTGGAATGACCTGCA-3’(SEQ ID NO:30)、5’-CTTTGTGTTGGCTGCAGCCACA-3’(SEQ ID NO:31)、5’-TGAGGAGAGACTTTGCTGACTGGT-3’(SEQ ID NO:32)、5’-GTCCTGTCTGGCGGTGCCGA-3’(SEQ ID NO:33)、5’-GCTCCAGGATCCCCTGTCACCTGGGCCTTCTGCCTTTTGGCT-3’(SEQ ID NO:34)、5’-CCATATGGAGAGGAGAGCAGCGGGCCCA-3’(SEQ ID NO:35)、5’-GAAGGAGGAACATGGAGAGGAGA-3’(SEQ IDNO:36)、5’-CCATATGCCCCGGGTAGTCTACTGCAT-3’(SEQ IDNO:37)、和5’-GTCGACTCGAGTCACTTCCGCAAAAACTTCTTG-3’(SEQ ID NO:38)),以及用于RACE的寡核苷酸(5’-TCCATTCCGAAGGCTCTCCTCC-3’(SEQ ID NO:39)、5’-GTCTGTGTGACGGAAATGTAAGC-3’(SEQ ID NO:40)和5’-GAAGGTCGAAGGCAGACCGATGT-3’(SEQ ID NO:41))。带有引物序列的扩增产物使用Topo克隆系统(Topo Cloning System(Invitrogen,Carlsbad,CA))被整合到PCR4-Topo载体中,然后测序。
对应于上面检测到的差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO:1和3中。前者中,cDNA含有5293个碱基对。后者中cDNA含有5317个碱基对。
SEQ ID NO:1的cDNA核苷酸序列中的可读框,位于390-4880位核苷酸(包括终止密码子为390-4883位核苷酸),编码了1497个氨基酸的蛋白。对应于SEQ ID NO:1所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:2中。图2显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:2的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
SEQ ID NO:3的cDNA核苷酸序列中的可读框,位于12-4904位核苷酸(包括终止密码子为12-4907位核苷酸),编码了1631个氨基酸的蛋白。对应于SEQ ID NO:3所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:4中。图3显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:4的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
SEQ ID NO:2的蛋白序列与SEQ ID NO:4的蛋白序列相同,除了SEQ ID NO:2缺失SEQ ID NO:4 N-端的前134个氨基酸之外。
SEQ ID NOS:2和4含有Calponin同源结构域(SEQ ID NO:4的38-145位氨基酸)、用于结合钙调蛋白的IQ结构域(SEQ ID NO:2的629-646位氨基酸和SEQ ID NO:4的763-780位氨基酸)、RasGAP结构域(SEQ ID NO:2的858-1195位氨基酸和SEQ ID NO:4的992-1329位氨基酸)以及RasGAP C-末端结构域(SEQ ID NO:2的1298-1421位氨基酸和SEQ ID NO:4的1432-1555位氨基酸)。SEQ ID NOS:2和4与IQGAP蛋白类似(Weissbach等(1994),J Biol Chem 269:20517-20521;Brill等(1996),Mol Cell Biol 16:4869-4878)。IQGAP结合到参与细胞骨架结构、细胞-细胞附着和增殖信号传导的蛋白上并调节这些蛋白的功能(Fukada等(2002),Cell 109:1-20;Briggs等(2002),J Biol Chem277:7453-7465;McCallum等(1998),J Biol Chem 273:22537-22544)。IQGAP1缺陷的小鼠相对于野生型表现出显著增加的晚期发作的胃增生(Li等(2000),Mol Cell Biol 20:697-701)。
进行了Northern印迹分析以测定对应于LFG1的mRNA转录本的大小。使用包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹,Clontech,Palo Alto,CA),含有91875_s_at序列的EST通过随机引物方法进行放射性标记,并被用作印迹探针。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,并用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有3个转录本,大小大约为7.2kb和6.3kb。这与LFG1克隆(SEQ ID NO:1和3)的大小一致。
实施例3:鉴定癌症中差异表达的mRNA-2
重复实施例1中的过程,除了以标记物LFG2代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG2的表达在癌组织样品中与正常组织样品中相比显著地下调了。LFG2(SEQ ID NO:5)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.82941_at测定。82941_at序列来自EST AI277612。82941_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表2中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.15:1359-1367)。表2中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-2的下调可以诊断癌症。
表2
组织 病理学/形态学 几何平均值                    样品数量 倍率变化 方向 p-值
  总数   存在   处于边缘   不存在
  乳腺   正常组织,NOS   1147.66   34   34   0   0
  渗透性导管癌   129.77   61   26   3   32   8.71   下调   0
  渗透性小叶癌   183.37   10   6   1   3   5.48   下调   0.00002
结肠   正常组织,NOS   890.06   24   23   1   0
  腺癌,NOS   163.35   36   17   1   18   5.39   下调   0
食管   正常组织,NOS   612.34   18   18   0   0
  腺癌,NOS   265.11   8   7   1   0   2.31   下调   0.02218
  正常组织,NOS   182.73   19   11   1   7
  肝细胞癌,NOS   114.69   23   7   1   15   1.51   下调   0.01211
  正常组织,NOS   535.64   32   30   2   0
  腺癌,NOS   119.36   39   17   3   19   4.27   下调   0
淋巴结   正常组织,NOS   454.08   9   7   0   2
  恶性淋巴瘤,NOS   123.13   12   5   0   7   3.24   下调   0.02245
卵巢   正常组织,NOS   279.99   23   21   0   2
  乳头状浆液性腺癌   85.45   23   7   1   15   3.5   下调   0
前列腺   正常组织,NOS   195.77   19   13   1   5
  腺癌,NOS   80.06   19   2   2   15   2.57   下调   0.00011
直肠   正常组织,NOS   943.86   20   19   0   1
  腺癌,NOS   176.45   22   13   2   7   5.2   下调   0
  正常组织,NOS   414.40   18   16   0   2
  腺癌,NOS   125.39   38   17   2   19   3.21   下调   0
通过结合到芯片序列片段no.82941_at的样品测定得到的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-GAATGTGTCAGAGACAAGTGCAGC-3’(SEQ ID NO:42)和5’-TGTAGAAACTCTTGGACTAATGGAGG-3’(SEQ ID NO:43))是基于分析中使用的含有Affymetrix片段(82941_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO:19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO:20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肝、肺、卵巢和胃的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-2的下调。
实施例4:与差异表达的mRNA对应的全长人cDNA(LFG2)的克隆
具有SEQ ID NO:5的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies,Rockville,MD)获得。简单地说,基于含有82941_at序列的EST的序列设计了基因特异的寡聚物(5’-GAATGTGTCAGAGACAAGTGCAGC-3’(SEQ IDNO:42))。这个寡聚物用生物素标记,并用来与来自分化很少的胃腺癌文库(NCI CGAP Gas4)(ResGen,Huntsville,AL)的5μg单链质粒DNA(cDNA重组子)杂交,采用Sambrook等描述的步骤。杂交的cDNAs通过结合了链亲和素的珠子进行分离,以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA,用于转化大肠杆菌(E.coli)细胞(DH10B),筛选出最长的cDNA。阳性的选择使用基因特异性的引物通过PCR进行确认后,对cDNA克隆进行DNA测序。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO:5中。该cDNA含有3608个碱基对。
SEQ ID NO:5的cDNA核苷酸序列中的可读框,位于424-1908位核苷酸(包括终止密码子为424-1911位核苷酸),编码了495个氨基酸的蛋白。对应于SEQ ID NO:5所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:6中。
SEQ ID NO:6与清除受体具有同源性,该受体参与选定的多聚阴离子配体的胞吞作用、凋亡细胞和细菌的吞噬作用、细胞附着以及动脉粥样硬化的发展(Peiser等(2002),Curr.Opin.Immunol.14:123-128;Resnick等(1994),Trends Biol.Sci.19:5-8)。基于已出版的清除受体的研究工作,SEQ ID NO:6含有细胞质结构域(1-35位氨基酸)、跨膜结构域(36-58位氨基酸)、α-螺旋卷曲的结构域(90-301位氨基酸)、胶原蛋白样结构域(305-380位氨基酸)以及清除受体的富含半胱氨酸(SRCR)的结构域(393-493位氨基酸)。SRCR结构域含有6个半胱氨酸残基(418、431、462、472、482和492位氨基酸),其可以参与结构域内二硫键的形成。SEQ ID NO:6也显示出与小鼠同系物(GenBank登录No.BC016096)的同源性。它在整个连续的序列中显示出70%的同一性。
图4显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:6的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
进行了Northern印迹分析以测定对应于LFG2的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人MTN印迹,Clontech,Palo Alto,CA),含有82941_at序列的EST通过随机引物方法进行放射性标记,并被用来作印迹探针。印迹在含有50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,并用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有单一的转录本,大小大约为3.7kb。这与LFG2克隆(SEQ ID NO:5)的大小一致。
实施例5:鉴定癌症中差异表达的mRNA-3
重复实施例1中的过程,除了以标记物LFG3代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG3的表达在癌组织样品中与正常组织样品中相比显著地下调了。LFG3(SEQ ID NO:7)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.46104_at测定。46104_at序列来自EST AA772055。46104_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表3中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.15:1359-1367)。表3中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-3的下调可以诊断癌症。
表3
  组织   病理学/形态学   几何平均值               样品数量   倍率变化   方向   p-值
总数 存在   处于边缘 不存在
  乳腺   正常组织,NOS   64.52   34   31   0   3
  渗透性导管癌   27.24   61   18   1   42   2.25   下调   0
  渗透性小叶癌   29.52   10   4   0   6   2.21   下调   0.00004
结肠   正常组织,NOS   315.46   24   24   0   0
  腺癌,NOS   102.99   36   31   0   5   3.02   下调   0.00016
食管   正常组织,NOS   272.48   18   17   0   1
  腺癌,NOS   41.25   8   6   0   2   6.60   下调   0.00001
  肾   正常组织,NOS   2626.88   25   25   0   0
  透明细胞腺癌   344.66   11   11   0   0   7.62   下调   0.00003
  肾细胞癌   355.71   16   14   0   2   7.38   下调   0.00005
卵巢   正常组织,NOS   1098.41   23   23   0   0
  乳头状浆液性腺癌   178.15   23   22   0   1   6.17   下调   0
前列腺   正常组织,NOS   274.49   19   19   0   0
  腺癌,NOS   117.26   19   18   0   1   2.34   下调   0.00016
直肠   正常组织,NOS   410.22   20   20   0   0
  腺癌,NOS   72.98   22   16   0   6   5.38   下调   0
  正常组织,NOS   71.10   18   10   0   8
  腺癌,NOS   35.49   38   15   1   22   1.98   下调   0.00459
通过样品结合到芯片序列片段no.46104_at测定的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-GTATGCATCAGAATTCCCTATAGATCTTT-3’(SEQ ID NO:44)和5’-TAGATGTTTGGGCAACAGCCT-3’(SEQ IDNO:45)是基于分析中使用的含有Affymetrix片段(46104_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO:19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO:20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肾、卵巢、胰腺和胃的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-3的下调。
实施例6:与差异表达的mRNA对应的全长人cDNA(LFG3)的克隆
具有SEQ ID NO:7的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies,Rockville,MD)获得。简单地说,基于含有46104_at序列的EST的序列设计了基因特异的寡聚物(5’-GTATGCATCAGAATTCCCTATAGATCTTT-3’(SEQID NO:44))。这个寡聚物用生物素标记,并用来与来自人胎肾(ResGen,Huntsville,AL)的5μg单链质粒DNA(cDNA重组子)杂交,采用Sambrook等描述的步骤。杂交的cDNAs通过结合有链亲和素的珠子进行分离,以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA,用于转化大肠杆菌(E.coli)细胞(DH10B),并筛选出最长的cDNA。阳性选择通过使用基因特异性的引物进行PCR确认后,对cDNA克隆进行DNA测序。LFG3的5’-末端通过cDNA末端的快速扩增(RACE)来鉴定,使用了从人胎肾制备的cDNA(Clontech,Palo Alto,CA)和基因特异性的引物(5’-TTCCTTCACCAAAGGCATCCAGCCATTCTATG-3’(SEQ ID NO:46))。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO:7中。该cDNA含有3162个碱基对。
SEQ ID NO:7的cDNA核苷酸序列中的可读框,位于405-1835位核苷酸(包括终止密码子为405-1838位核苷酸),编码了477个氨基酸的蛋白。对应于SEQ ID NO:7所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:8中。
SEQ ID NO:8与单羧酸转运蛋白(MCTs)相似,含有10个预测的跨膜结构域(10-29、80-99、107-128、140-160、274-295、312-332、339-360、363-384、396-416和433-451位氨基酸)。MCT蛋白催化单羧酸例如乳酸、丙酮酸、支链酮酸、酮体、β-羟基丁酸和乙酸的易化运输(Halestrap和Price(1999),Biochem.J.343:281-299)。表4总结了SEQ ID NO:4与8个已知的单羧酸转运蛋白的相似性比例。
                表4.LFG3与MCT蛋白的同源性
  蛋白   大小(氨基酸)   同一性(%)   阳性(%)
  MCT1   500   17.5   34.3
  MCT2   478   19.5   35.5
  MCT3   504   19.5   34.1
  MCT4   465   19.0   33.2
  MCT5   487   22.1   36.9
  MCT6   505   16.4   31.5
  MCT7   523   20.1   35.2
  MCT8   613   15.9   27.9
图5显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:8的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
进行了Northern印迹分析以测定对应于LFG3的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹,Clontech,Palo Alto,CA),含有46104_at序列的EST通过随机引物方法进行放射性标记,并被用来探测印迹。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,并用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有单一的转录本,大小大约为4.2kb。这与LFG3克隆(SEQ ID NO:7)的大小一致。
实施例7:鉴定癌症中差异表达的mRNA-4
重复实施例1中的过程,除了以标记物LFG4代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG4的表达在癌组织样品中与正常组织样品中相比显著地下调了。LFG4(SEQ ID NO:9)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.62158_at测定。62158_at序列来自EST AI123532。62158_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表5中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.15:1359-1367)。表5中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-4的下调可以诊断癌症。
表5
  组织   病理学/形态学   几何平均值                样品数量   倍率变化   方向   p-值
总数 存在   处于边缘 不存在
乳腺   正常组织,NOS   156.75   34   33   0   1
  渗透性导管癌   90.09   61   51   0   10   1.74   下调   0.00001
结肠   正常组织,NOS   234.06   24   22   2   0
  腺癌,NOS   64.02   36   24   0   12   3.66   下调   0
  肾   正常组织,NOS   134.17   25   23   0   2
  透明细胞腺癌   78.59   11   7   1   3   1.71   下调   0.08272
  肾细胞癌   55.31   16   9   0   7   2.43   下调   0.0021
  正常组织,NOS   179.71   32   32   0   0
  腺癌,NOS   47.39   39   17   3   19   3.79   下调   0
淋巴结   正常组织,NOS   140.51   9   7   1   1
  恶性淋巴瘤,NOS   41.43   12   5   1   6   3.39   下调   0.00207
卵巢   正常组织,NOS   125.19   23   21   0   2
  乳头状浆液性腺癌   37.23   23   4   0   19   3.36   下调   0
前列腺   正常组织,NOS   191.94   19   18   0   1
  腺癌,NOS   103.47   19   16   0   3   1.86   下调   0.00185
直肠   正常组织,NOS   317.95   20   20   0   0
  腺癌,NOS   74.28   22   16   1   5   4.28   下调   0
  正常组织,NOS   161.77   18   17   0   1
  腺癌,NOS   84.55   38   27   2   9   1.91   下调   0.0062
通过样品结合到芯片序列片段no.62158_at所测定的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-AAATGTCTGATTACCCCATTTTATCAGT-3’(SEQ ID NO:47)和5’-TAATCCTGAAATGAACAGCTAACA-3’)(SEQ ID NO:48))是基于分析中使用的含有Affymetrix片段(62158_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO:19)和5′-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO:20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肝、肺、卵巢、胰腺和胃的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-4的下调。
实施例8:与差异表达的mRNA对应的全长人cDNA(LFG4)的克隆
具有SEQ ID NO:9的全长cDNA通过cDNA末端的快速扩增(RACE)获得。简单地说,基于含有62158_at序列的EST的序列设计了基因特异性的寡聚物((5’-TAATGTTAGAGTAACAGCATTTTCCTTCAA-3’(SEQ ID NO:49)和5’-TGCCCCACACTAACTCAGTTCTTGTGATG-3’(SEQ ID NO:50))。这个寡聚物被用来对从人脑制备的cDNAs(Clontech,Palo Alto,CA)进行PCR扩增。带引物的扩增产物使用Topo克隆系统(Invitrogen,Carlsbad,CA)整合到PCR4-Topo载体中,然后测序。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO:9中。该cDNA含有4891个碱基对。
SEQ ID NO:9的cDNA核苷酸序列中的可读框,位于89-1150位核苷酸(包括终止密码子为89-1153位核苷酸),编码了354个氨基酸的蛋白。对应于SEQ ID NO:9所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:10中。
SEQ ID NO:10与大鼠的Kilon和鸡的Neurotractin(Funatsu等(1999),J Biol Chem 274:8224-8230;Marg等(1999),J Cell Biol 145:865-876)相似。蛋白序列分析发现了分泌信号肽(1-33位氨基酸)、3个免疫球蛋白结构域(47-136、145-208和231-312位氨基酸)以及6个推断的N-连接糖基化位点(73、155、275、286、294和307位氨基酸)。Kilon/Neurotractin是免疫球蛋白超家族的IgLON亚家族的一个成员。IgLONs是一族糖基化磷脂酰肌醇(GPI)连接的细胞附着分子,被认为修饰了轴突的突起(outgrowth),可能在细胞-细胞附着和识别中发挥作用(Miyate等(2000),J Comparative Neurol 424:74-85)。
图6显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:10的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。这个亲水性图显示出在C末端存在疏水区域。在GPI锚定蛋白的情况下,已知GPI锚的添加发生在切除C末端的疏水区域之后。推断的GPI锚连接位点被发现(324位氨基酸处的甘氨酸)。
进行了Northern印迹分析以测定对应于LFG4的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹,Clontech,Palo Alto,CA),含有62158_at序列的EST通过随机引物方法进行放射性标记,并被用来探测印迹。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,并用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有单一的转录本,大小大约为5.4kb。这与LFG4克隆(SEQ ID NO:9)的大小一致。
实施例9:鉴定癌症中差异表达的mRNA-5
重复实施例1中的过程,除了以标记物LFG5代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG5的表达在癌组织样品中与正常组织样品中相比显著下调了。LFG5(SEQ ID NO:11)的表达水平可以在Affymetrix GeneChipsU95上通过芯片序列片段no.46659_at测定。46659_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表6中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。表6中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-5的差异表达可以诊断癌症。
表6
  组织   病理学/形态学   几何平均值                样品数量   倍率变化   方向   p-值
总数 存在   处于边缘 不存在
  乳腺   正常组织,NOS   152.75   34   31   0   3
  渗透性导管癌   404.58   61   60   0   1   2.65   上调   0
  渗透性小叶癌   277.71   10   10   0   0   1.82   上调   0.07445
食管   正常组织,NOS   85.47   18   15   0   2
  腺癌,NOS   373.97   8   8   0   0   4.38   上调   0.0009
  肾   正常组织,NOS   53.58   25   17   0   8
  透明细胞腺癌   161.36   11   11   0   0   3.01   上调   0.00011
  肾细胞癌   249.37   16   16   0   0   4.65   上调   0
  正常组织,NOS   330.65   32   31   0   1
  腺癌,NOS   195.43   39   35   0   4   1.69   下调   0.00538
淋巴结   正常组织,NOS   219.77   9   9   0   0
  恶性淋巴瘤,NOS   142.09   12   11   0   1   1.55   下调   0.25114
卵巢   正常组织,NOS   90.40   23   19   0   4
  乳头状浆液性腺癌   418.81   23   23   0   0   4.63   上调   0
胰腺   正常组织,NOS   38.53   20   12   0   8
  腺癌,NOS   344.37   25   25   0   0   8.94   上调   0
  正常组织,NOS   185.50   18   17   0   1
  腺癌,NOS   279.62   38   35   0   3   1.51   上调   0.12664
通过结合到芯片序列片段no.46659_at的样品测定的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-AAGGCTTTATCAGGTCTGCATATAGAATC-3’(SEQ ID NO:51)和5’-GCAAAGAACCCTAATGCTATTTATCAGC-3’(SEQ ID NO:52))是基于分析中使用的特异性Affymetrix片段(46659_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ IDNO:19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO:20))被用作对照引物。这种方法提供以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自肾、肺、卵巢和胰腺的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-5的差异表达。
实施例10:与差异表达的mRNA对应的全长人cDNA(LFG5)的克隆
具有SEQ ID NO:11的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies,Rockville,MD)获得。简单地说,基于含有46659_at序列的EST的序列设计了基因特异的寡聚物(5’-GAGAAGACCAGGGAAGAAGCAG-3’(SEQ IDNO:53))。这个寡聚物用生物素标记,用来与来自人心脏文库(ResGen,Huntsville,AL)的5μg单链质粒DNA(cDNA重组子)杂交,采用Sambrook等描述的步骤。杂交的cDNAs通过结合链亲和素的珠子进行分离,以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA,用于转化大肠杆菌细胞(DH10B),筛选出最长的cDNA。阳性的选择通过PCR使用基因特异的引物进行确认后,对cDNA克隆进行DNA测序。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO:11中。该cDNA含有3098个碱基对。
SEQ ID NO:11的cDNA核苷酸序列中的可读框,位于223-1569位核苷酸(包括终止密码子为223-1572位核苷酸),编码了449个氨基酸的蛋白。对应于SEQ ID NO:11所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:12中。
SEQ ID NO:12含有胸苷酸激酶结构域(257-438位氨基酸)。胸苷酸激酶是核苷酸单磷酸激酶(NMPKs)的成员,在用于RNA和DNA合成的核苷酸的合成中发挥作用,为治疗性核苷和核苷酸类似物的药物活化所需要(Van Rompay等(2000),Pharmacology & Therapeutics87:189-198)。SEQ ID NO:12与在巨噬细胞活化的过程中被诱导(Lee和O’Brien(1995),J Immunol.154:6094-6102)的小鼠胸苷酸激酶(GenBank Accession No.NM_020557)显示出同源性。它在整个连续的序列上显示出63%的同一性。
图7显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:12的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
进行了Northern印迹分析以测定对应于LFG5的mRNA转录本的大小。使用了包含来自不同人组织的总RNAs进行Northern印迹(人MTN印迹,Clontech,Palo Alto,CA),含有82941_at序列的EST通过随机引物方法进行放射性标记,并被用来探测印迹。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有一个单一的转录本,大小大约为3.0kb。这与LFG5克隆(SEQ ID NO:11)的大小一致。
实施例11:鉴定癌症中差异表达的mRNA-6
重复实施例1中的过程,除了以标记物LFG6代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG6的表达在癌组织样品中与正常组织样品中相比显著地上调了。LFG6(SEQ ID NO:13或15)的表达水平可以在Affymetrix GeneChipsU95上通过芯片序列片段no.44103_at测定。44103_at序列来自EST AA865614。44103_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表7中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.15:1359-1367)。表7中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-6的上调可以诊断癌症。
表7
  组织   病理学/形态学   几何平均值                样品数量   倍率变化   方向白   p-值
总数 存在   处于边缘 不存在
  正常组织,NOS   337.71   25   25   0   0
  透明细胞腺癌   556.82   11   11   0   0   1.65   上调   0.00314
  正常组织,NOS   406.93   19   18   0   1
  肝细胞癌,NOS   619.40   23   22   0   1   1.52   上调   0.00303
卵巢   正常组织,NOS   380.10   23   23   0   0
  乳头状浆液性腺癌   578.60   23   23   0   0   1.52   上调   0.00013
胰腺   正常组织,NOS   138.75   20   11   1   8
  腺癌,NOS   453.01   25   25   0   0   3.26   上调   0.00002
对通过结合到芯片序列片段no.44103_at的样品测定的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-GGACGGGGAACTTGGACGC-3’(SEQ IDNO:54)and 5’-AAGTGCAGGGCCTCTGGGTG-3’(SEQ ID NO:55))是基于分析中使用的含有Affymetrix片段(44103_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ IDNO:19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO:20))被用作对照引物。这种方法提供以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自肝和卵巢(Ambion,Inc.,Austin,TX)的正常和肿瘤组织的总RNA对。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-6的上调。
实施例12.与差异表达的mRNA对应的全长人cDNA(LFG6)的克隆
具有SEQ ID NO:13或15的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies,Rockville,MD)获得。简单地说,基于含有44103_at序列的EST的序列设计了基因特异性的寡聚物(5’-CGCTGGGTCATCGGACGGT-3’(SEQ ID NO:56))。这个寡聚物用生物素标记,用来与来自完全分化的人胃腺癌文库(ResGen,Huntsville,AL)的5μg单链质粒DNA(cDNA重组子)杂交,采用Sambrook等描述的步骤。杂交的cDNAs通过结合链亲和素的珠子进行分离,以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA,用于转化大肠杆菌细胞(DH10B),筛选出最长的cDNA。阳性选择通过PCR使用基因特异性的引物进行确认后,对cDNA克隆进行DNA测序。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO:13和15中。前者中cDNA含有1893个碱基对。后者中cDNA含有1597个碱基对。
SEQ ID NO:13的cDNA核苷酸序列中的可读框,位于418-1392位核苷酸(包括终止密码子为418-1395位核苷酸),编码了325个氨基酸的蛋白。对应于SEQ ID NO:13所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:14中。图9显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:14的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
SEQ ID NO:15的cDNA核苷酸序列中的可读框,位于271-1431位核苷酸(包括终止密码子为271-1434位核苷酸),编码了387个氨基酸的蛋白。对应于SEQ ID NO:15所编码的预测蛋白的氨基酸序列显示在SEQ ID NO:16中。图10显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157:105-142)对SEQ ID NO:16的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
SEQ ID NO:14和16含有泛素蛋白同源(UBQ)结构域(239-300位氨基酸)。SEQ ID NOS:14和16与大鼠的Sharpin蛋白相似(Lim等(2001),Mol Cell Neurosci 17:385-397)。Sharpin直接与Shank蛋白的锚蛋白重复序列相互作用,Shank蛋白在的细胞骨架复合物的结构和特化细胞连接处的细胞内信号传导中起作用(Sheng和Kim(2000),J Cell Sci113:1851-1856)。
进行了Northern印迹分析以测定对应于LFG6的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹,Clontech,Palo Alto,CA),含有44103_at序列的EST通过随机引物方法进行放射性标记,被用来探测印迹。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有三个转录本,大小大约为3.0kb、1.5kb和1.2kb。这与LFG6克隆(SEQ ID NO:13和15)的大小一致。
尽管参考上述的实施例,本发明已经被描述得很详细,应该理解的是在不偏离本发明实质的情况下可对发明进行各种不同的修饰。因此,本发明只受到后面的权利要求的限制。所有在本申请中引用的专利、专利申请和出版物,在此以其全文引为参考。
                           序列表
<110>株式会社LG生命科学(LG Life sciences Ltd.)
<120>与癌症相关的基因家族(Gene Famililies Associated With Cancers)
<130>SCT051353-47
<150>US60/419911
<151>2002-10-18
<150>US60/419912
<151>2002-10-18
<150>US60/420088
<151>2002-10-18
<150>US60/434243
<151>2002-12-16
<150>US60/434278
<151>2002-12-16
<150>US60/438278
<151>2003-01-03
<160>56
<170>KopatentIn 1.71
<210>1
<211>5293
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(390)..(4880)
<223>LBFL109 Clone A
<400>1
gtcctgtctg gcggtgccga cggtgagggg cggtggccca acggcgggag attcaaacct         60
ggaagaagga ggaacatgga gaggagagca gcgggcccag gctgggcagc ctctggatcg       120
aggcctgcct gaaggaggag cttccttccc cggtggagct ggaggagagc cttcggaatg        180
gagtgctgct ggccaagctg ggccactgtt ttgcaccctc cgtggttccg ttgaagaaga        240
tctacgatgt ggagcagctg cggtaccagg caactggctt acatttccgt cacacagaca        300
acatcaactt ttggctatct gcaatagccc acatcggtct gccttcgacc ttcttcccag        360
agaccacgga catctatgac aaaaagaac  atg ccc cgg gta gtc tac tgc atc         413
                                 Met Pro Arg Val Val Tyr Cys Ile
                                   1               5
cat gct ctc agt ctc ttc ctc ttc cgg ctg gga ttg gcc cct cag ata          461
His Ala Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala Pro Gln Ile
     10                  15                  20
cat gat cta tac ggg aaa gtg aaa ttc aca gct gag gaa ctc agc aac          509
His Asp Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu Leu Ser Asn
 25                  30                  35                  40
atg gcg tcc gaa ctg gcc aaa tat ggc ctc cag ctg cct gcc ttc agc          557
Met Ala Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro Ala Phe Ser
                 45                  50                  55
aag atc ggg ggc atc ttg gcc aat gag ctc tcg gtg gat gag gct gca          605
Lys Ile Gly Gly Ile Leu Ala Asn Glu Leu Ser Val Asp Glu Ala Ala
             60                  65                  70
gtc cat gca gct gtt ctt gcc atc aat gaa gca gtg gag cga ggg gtg          653
Val His Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu Arg Gly Val
         75                  80                  85
gtg gag gac acc ctg gct gcc ttg cag aat ccc agt gct ctt ctg gag          701
Val Glu Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala Leu Leu Glu
     90                  95                 100
aat ctc cga gag cct ctg gca gcc gtc tac cag gag atg ctg gcc cag          749
Asn Leu Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met Leu Ala Gln
105                 110                 115                 120
gcc aag atg gag aag gca gcc aat gcc agg aac cat gat  gac aga gaa         797
Ala Lys Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp Asp Arg Glu
                125                 130                 135
agc cag gac atc tat gac cac tac cta act cag gct gaa atc cag ggc          845
Ser Gln Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu Ile Gln Gly
            140                 145                 150
aat atc aac cat gtc aac gtc cat ggg gct cta gaa gtt gtt gat gat          893
Asn Ile Asn His Val Asn Val His Gly Ala Leu Glu Val Val Asp Asp
        155                 160                 165
gcc ctg gaa aga cag agc cct gaa gcc ttg ctc aag gcc ctt caa gac          941
Ala Leu Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala Leu Gln Asp
    170                 175                 180
cct gcc ctg gcc ctg cga ggg gtg agg aga gac ttt gct gac tgg tac          989
Pro Ala Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala Asp Trp Tyr
185                 190                 195                 200
ctg gag cag ctg aac tca gac aga gag cag aag gca cag gag ctg ggc         1037
Leu Glu Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln Glu Leu Gly
                205                 210                 215
ctg gtg gag ctt ctg gaa aag gag gaa gtc cag gct ggt gtg gct gca         1085
Leu Val Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly Val Ala Ala
            220                 225                 230
gcc aac aca aag ggt gat cag gaa caa gcc atg ctc cac gct gtg cag         1133
Ala Asn Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His Ala Val Gln
        235                 240                 245
cgg atc aac aaa gcc atc cgg agg gga gtg gcg gct gac act gtg aag         1181
Arg Ile Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp Thr Val Lys
    250                 255                 260
gag ctg atg tgc cct gag gcc cag ctg cct cca gtg tac cct gtt gca         1229
Glu Leu Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr Pro Val Ala
265                 270                 275                 280
tcg tct atg tac cag ctg gag ctg gca gtg ctc cag cag cag cag ggg         1277
Ser Ser Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln Gln Gln Gly
                285                 290                 295
gag ctt ggc cag gag gag ctc ttc gtg gct gtg gag atg ctc tca gct         1325
Glu Leu Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met Leu Ser Ala
            300                 305                 310
gtg gtc ctg att aac cgg gcc ctg gag gcc cgg gat gcc agt ggc ttc         1373
Val Val Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala Ser Gly Phe
        315                 320                 325
tgg agc agc ctg gtg aac cct gcc aca ggc ctg gct gag gtg gaa gga         1421
Trp Ser Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu Val Glu Gly
    330                 335                 340
gaa aat gcc cag cgt tac ttc gat gcc ctg ctg aaa ttg cga cag gag         1469
Glu Asn Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu Arg Gln Glu
345                 350                 355                 360
cgt ggg atg ggt gag gac ttc ctg agc tgg aat gac ctg cag gcc acc         1517
Arg Gly Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu Gln Ala Thr
                365                 370                 375
gtg agc cag gtc aat gca cag acc cag gaa gag act gac cgg gtc ctt         1565
Val Ser Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp Arg Val Leu
            380                 385                 390
gca gtc agc ctc atc aat gag gct ctg gac aaa ggc agc cct gag aag         1613
Ala Val Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser Pro Glu Lys
        395                 400                 405
act ctg tct gcc cta ctg ctt cct gca gct ggc cta gat gat gtc agc         1661
Thr Leu Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp Asp Val Ser
    410                 415                 420
ctc cct gtc gcc cct cgg tac cat ctc ctc ctt gtg gca gcc aaa agg         1709
Leu Pro Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala Ala Lys Arg
425                 430                 435                 440
cag aag gcc cag gtg aca ggg gat cct gga gct gtg ctg tgg ctt gag         1757
Gln Lys Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu Trp Leu Glu
                445                 450                 455
gag atc cgc cag gga gtg gtc aga gcc aac cag gac act aat aca gct         1805
Glu Ile Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr Asn Thr Ala
            460                 465                 470
cag aga atg gct ctt ggt gtg gct gcc atc aat caa gcc atc aag gag         1853
Gln Arg Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala Ile Lys Glu
        475                 480                 485
ggc aag gca gcc cag act gag cgg gtg ttg agg aac ccc gca gtg gcc         1901
Gly Lys Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro Ala Val Ala
    490                 495                 500
ctt cga ggg gta gtt ccc gac tgt gcc aac ggc tac cag cga gcc ctg         1949
Leu Arg Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln Arg Ala Leu
505                 510                 515                 520
gaa agt gcc atg gca aag aaa cag cgt cca gca gac aca gct ttc tgg         1997
Glu Ser Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr Ala Phe Trp
                525                 530                 535
gtt caa cat gac atg aag gat ggc act gcc tac tac ttc cat ctg cag         2045
Val Gln His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe His Leu Gln
            540                 545                 550
acc ttc cag ggg atc tgg gag caa cct cct ggc tgc ccc ctc aac acc         2093
Thr Phe Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro Leu Asn Thr
        555                 560                 565
tct cac ctg acc cgg gag gag atc cag tca gct gtc acc aag gtc act         2141
Ser His Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr Lys Val Thr
    570                 575                 580
gct gcc tat gac cgc caa cag ctc tgg aaa gcc aac gtc ggc ttt gtt         2189
Ala Ala Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val Gly Phe Val
585                 590                 595                 600
atc cag ctc cag gcc cgc ctc cgt ggc ttc cta gtt cgg cag aag ttt         2237
Ile Gln Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg Gln Lys Phe
                605                 610                 615
gct gag cat tcc cac ttt ctg agg acc tgg ctc cca gca gtc atc aag         2285
Ala Glu His Ser His Phe Leu Arg Thr Trp Leu Pro Ala Val Ile Lys
            620                 625                 630
atc cag gct cat tgg cgg ggt tat agg cag cgg aag att tac ctg gag         2333
Ile Gln Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile Tyr Leu Glu
        635                 640                 645
tgg ttg cag tat ttt aaa gca aac ctg gat gcc ata atc aag atc cag         2381
Trp Leu Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile Lys Ile Gln
    650                 655                 660
gcc tgg gcc cgg atg tgg gca gct cgg agg caa tac ctg agg cgt ctg         2429
Ala Trp Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu Arg Arg Leu
665                 670                 675                 680
cac tac ttc cag aag aat gtt aac tcc att gtg aag atc cag gca ttt         2477
His Tyr Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile Gln Ala Phe
                685                 690                 695
ttc cga gcc agg aaa gcc caa gat gac tac agg ata tta gtg cat gca         2525
Phe Arg Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu Val His Ala
            700                 705                 710
ccc cac cct cct ctc agt gtg gta cgc aga ttt gcc cat ctc ttg aat         2573
Pro His Pro Pro Leu Ser Val Val Arg Arg Phe Ala His Leu Leu Asn
        715                 720                 725
caa agc cag caa gac ttc ttg gct gag gca gag ctg ctg aag ctc cag         2621
Gln Ser Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu Lys Leu Gln
    730                 735                 740
gaa gag gta gtt agg aag atc cga tcc aat cag cag ctg gag cag gac         2669
Glu Glu Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu Glu Gln Asp
745                 750                 755                 760
ctc aac atc atg gac atc aag att ggc ctg ctg gtg aag aac cgg atc         2717
Leu Asn Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys Asn Arg Ile
                765                 770                 775
act ctg cag gaa gtg gtc tcc cac tgc aag aag ctg acc aag agg aat         2765
Thr Leu Gln Glu Val Val Ser His Cys Lys Lys Leu Thr Lys Arg Asn
            780                 785                 790
aag gaa cag ctg tca gat atg atg gtt ctg gac aag cag aag ggt tta         2813
Lys Glu Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln Lys Gly Leu
        795                 800                 805
aag tcg ctg agc aaa gag aaa cgg cag aaa cta gaa gca tac caa cac         2861
Lys Ser Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala Tyr Gln His
    810                 815                 820
ctc ttc tac ctg ctc cag act cag ccc atc tac ctg gcc aag ctg atc         2909
Leu Phe Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala Lys Leu Ile
825                 830                 835                 840
ttt cag atg cca cag aac aaa acc acc aag ttc atg gag gca gtg att         2957
Phe Gln Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu Ala Val Ile
                845                 850                 855
ttc agc ctg tac aac tat gcc tcc agc cgc cga gag gcc tat ctc ctg         3005
Phe Ser Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala Tyr Leu Leu
            860                 865                 870
ctc cag ctg ttc aag aca gca ctc cag gag gaa atc aag tca aag gtg         3053
Leu Gln Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys Ser Lys Val
        875                 880                 885
gag cag ccc cag gac gtg gtg aca ggc aac cca aca gtg gtg agg ctg         3101
Glu Gln Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val Val Arg Leu
    890                 895                 900
gtg gtg aga ttc tac cgt aat ggg cgg gga cag agt gcc ctg cag gag         3149
Val Val Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala Leu Gln Glu
905                 910                 915                 920
att ctg ggc aag gtt atc cag gat gtg cta gaa gac aaa gtg ctc agc         3197
Ile Leu Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys Val Leu Ser
                925                 930                 935
gtc cac aca gac cct gtc cac ctc tat aag aac tgg atc aac cag act         3245
Val His Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile Asn Gln Thr
            940                 945                 950
gag gcc cag aca ggg cag cgc agc cat ctc cca tat gat gtc acc ccg         3293
Glu Ala Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp Val Thr Pro
        955                 960                 965
gag cag gcc ttg agc cac ccc gag gtc cag aga cga ctg gac atc gcc         3341
Glu Gln Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu Asp Ile Ala
    970                 975                 980
cta cgc aac ctc ctc gcc atg act gat aag ttc ctt tta gcc atc acc         3389
Leu Arg Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu Ala Ile Thr
985                 990                 995                1000
tca tct gtg gac caa att ccg tat ggg atg cga tat gtg gcc aaa gtc         3437
Ser Ser Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val Ala Lys Val
               1005                1010                1015
ctg aag gca act ctg gca gag aaa ttc cct gac gcc aca gac agc gag         3485
Leu Lys Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr Asp Ser Glu
           1020                1025                1030
gtc tat aag gtg gtc ggg aac ctc ctg tac tac cgc ttc ctg aac cca         3533
Val Tyr Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe Leu Asn Pro
       1035                1040                1045
gct gtg gtg gct cct gac gcc ttc gac att gtg gcc atg gca gct ggt         3581
Ala Val Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met Ala Ala Gly
   1050                1055                1060
gga gcc ctg gct gcc ccc cag cgc cat gcc ctg ggg gct gtg gct cag         3629
Gly Ala Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala Val Ala Gln
1065               1070                1075                1080
ctc cta cag cac gct gcg gct ggc aag gcc ttc tct ggg cag agc cag         3677
Leu Leu Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly Gln Ser Gln
               1085                1090                1095
cac cta cgg gtc ctg aat gac tat ctg gag gaa aca cac ctc aag ttc         3725
His Leu Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His Leu Lys Phe
           1100                1105                1110
agg aag ttc atc cat aga gcc tgc cag gtg cca gag cca gag gag cgt         3773
Arg Lys Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro Glu Glu Arg
       1115                1120                1125
ttt gca gtg gac gag tac tca gac atg gtg gct gtg gcc aaa ccc atg         3821
Phe Ala Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala Lys Pro Met
   1130                1135                1140
gtg tac atc acc gtg ggg gag ctg gtc aac acg cac agg ctg ttg ctg         3869
Val Tyr Ile Thr Val Gly Glu Leu Val Asn Thr His Arg Leu Leu Leu
1145               1150                1155                1160
gag cac cag gac tgc att gcc cct gat cac caa gac ccc ctg cat gag         3917
Glu His Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro Leu His Glu
               1165                1170                1175
ctc ctg gag gat ctt ggg gag ctg ccc acc atc cct gac ctt att ggt         3965
Leu Leu Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp Leu Ile Gly
           1180                1185                1190
gag agc atc gct gca gat ggg cac aca gac ctg agc aag cta gaa gtg         4013
Glu Ser Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys Leu Glu Val
       1195                1200                1205
tcc ctg acg ctg acc aac aag ttt gaa gga cta gag gca gat gct gat         4061
Ser Leu Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala Asp Ala Asp
   1210                1215                1220
gac tcc aac acc cgt agc ctg ctt ctg agc acc aag cag ctg ttg gcc         4109
Asp Ser Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln Leu Leu Ala
1225               1230                1235                1240
gat atc ata cag ttc cat cct ggg gac acc ctc aag gag atc ctg tcc         4157
Asp Ile Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu Ile Leu Ser
               1245                1250                1255
ctc tcg gct tcc aga gag caa gaa gca gcc cac aag cag ctg atg agc         4205
Leu Ser Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln Leu Met Ser
           1260                1265                1270
cga cgc cag gcc tgt aca gcc cag aca ccg gag cca ctg cga cga cac         4253
Arg Arg Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu Arg Arg His
       1275                1280                1285
cgc tca ctg aca gct cac tcc ctc ctg cca ctg gca gag aag cag cgg         4301
Arg Ser Leu Thr Ala His Ser Leu Leu Pro Leu Ala Glu Lys Gln Arg
   1290                1295                1300
cgc gtc ctg cgg aac ctg cgc cga ctt gaa gcc ctg ggg ttg gtc agc         4349
Arg Val Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly Leu Val Ser
1305               1310                1315                1320
gcc aga aat ggc tac cag ggg cta gtg gac gag ctg gcc aag gac atc         4397
Ala Arg Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala Lys Asp Ile
               1325                1330                1335
cgc aac cag cac aga cac agg cac agg cgg aag gca gag ctg gtg aag         4445
Arg Asn Gln His Arg His Arg His Arg Arg Lys Ala G1u Leu Val Lys
           1340                1345                1350
ctg cag gcc aca tta cag ggc ctg agc act aag acc acc ttc tat gag         4493
Leu Gln Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr Phe Tyr Glu
       1355                1360                1365
gag cag ggt gac tac tac agc cag tac atc cgg gcc tgc ctg gac cac         4541
Glu Gln Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys Leu Asp His
   1370                1375                1380
ctg gcc cec gac tcc aag agt tct ggg aag ggg aag aag cag cct tct         4589
Leu Ala Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys Gln Pro Ser
1385               1390                1395                1400
ctt cat tac act gct gct cag ctc ctg gaa aag ggt gtc ttg gtg gaa         4637
Leu His Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val Leu Val Glu
               1405                1410                1415
att gaa gat ctt ccc gcc tct cac ttc aga aac gtc atc ttt gac atc         4685
Ile Glu Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile Phe Asp Ile
           1420                1425                1430
acg ccg gga gat gag gca gga aag ttt gaa gta aat gcc aag ttc ctg         4733
Thr Pro Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala Lys Phe Leu
       1435                1440                1445
ggt gtg gac atg gag cga ttt cag ctt cac tat cag gat ctc ctg cag         4781
Gly Val Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp Leu Leu Gln
   1450                1455                1460
ctc cag tat gag ggt gtg gct gtc atg aaa ctc ttc aac aag gcc aaa         4829
Leu Gln Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn Lys Ala Lys
1465               1470                1475                1480
gtc aat gtc aac ctt ctc atc ttc ctc ctc aac aag aag ttt ttg cgg         4877
Val Asn Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys Phe Leu Arg
               1485                1490                1495
aag        tgacagaggc aaagggtgct acccaagccc ctcttacctc tctggatgct       4930
Lys
ttctttaaca ctaactcacc actgtgcttc cctgcagaca cccagagctc aggactgggc       4990
aaggcccagg gattctcacc ccttccccag ctgggaggag cttgcctgcc tggccacaga       5050
cagtgtatct tctaattggc taaagtgggc cttgcccaga gtccagctgt gtggctttta       5110
tcatgcatga caaacccctg gctttcctgc cagatggatt ctcatccctt acagctgact       5170
cttccaggca atttccatag atctgcagtc ctgcctctgc cacagtctct ctgttgtccc       5230
cacatctacc caacttcctg tactgttgcc cttctgatgt taataaaagc agctgttact       5290
ccc                                                                     5293
<210>2
<211>1497
<212>PRT
<213>智人(Homo sapiens)
<400>2
Met Pro Arg Val Val Tyr Cys Ile His Ala Leu Ser Leu Phe Leu Phe
  1               5                  10                  15
Arg Leu Gly Leu Ala Pro Gln Ile His Asp Leu Tyr Gly Lys Val Lys
             20                  25                  30
Phe Thr Ala Glu Glu Leu Ser Asn Met Ala Ser Glu Leu Ala Lys Tyr
         35                  40                  45
Gly Leu Gin Leu Pro Ala Phe Ser Lys Ile Gly Gly Ile Leu Ala Asn
     50                  55                  60
Glu Leu Ser Val Asp Glu Ala Ala Val His Ala Ala Val Leu Ala Ile
 65                  70                  75                  80
Asn Glu Ala Val Glu Arg Gly Val Val Glu Asp Thr Leu Ala Ala Leu
                 85                  90                  95
Gln Asn Pro Ser Ala Leu Leu Glu Asn Leu Arg Glu Pro Leu Ala Ala
            100                 105                 110
Val Tyr Gln Glu Met Leu Ala Gln Ala Lys Met Glu Lys Ala Ala Asn
        115                 120                 125
Ala Arg Asn His Asp Asp Arg Glu Ser Gln Asp Ile Tyr Asp His Tyr
    130                 135                 140
Leu Thr Gln Ala Glu Ile Gln Gly Asn Ile Asn His Val Asn Val His
145                 150                 155                 160
Gly Ala Leu Glu Val Val Asp Asp Ala Leu Glu Arg Gln Ser Pro Glu
                165                 170                 175
Ala Leu Leu Lys Ala Leu Gln Asp Pro Ala Leu Ala Leu Arg Gly Val
            180                 185                 190
Arg Arg Asp Phe Ala Asp Trp Tyr Leu Glu Gln Leu Asn Ser Asp Arg
        195                 200                 205
Glu Gln Lys Ala Gln Glu Leu Gly Leu Val Glu Leu Leu Glu Lys Glu
    210                 215                 220
Glu Val Gln Ala Gly Val Ala Ala Ala Asn Thr Lys Gly Asp Gln Glu
225                 230                 235                 240
Gln Ala Met Leu His Ala Val Gln Arg Ile Asn Lys Ala Ile Arg Arg
                245                 250                 255
Gly Val Ala Ala Asp Thr Val Lys Glu Leu Met Cys Pro Glu Ala Gln
            260                 265                 270
Leu Pro Pro Val Tyr Pro Val Ala Ser Ser Met Tyr Gln Leu Glu Leu
        275                 280                 285
Ala Val Leu Gln Gln Gln Gln Gly Glu Leu Gly Gln Glu Glu Leu Phe
    290                 295                 300
Val Ala Val Glu Met Leu Ser Ala Val Val Leu Ile Asn Arg Ala Leu
305                 310                 315                 320
Glu Ala Arg Asp Ala Ser Gly Phe Trp Ser Ser Leu Val Asn Pro Ala
                325                 330                 335
Thr Gly Leu Ala Glu Val Glu Gly Glu Asn Ala Gln Arg Tyr Phe Asp
            340                 345                 350
Ala Leu Leu Lys Leu Arg Gln Glu Arg Gly Met Gly Glu Asp Phe Leu
        355                 360                 365
Ser Trp Asn Asp Leu Gln Ala Thr Val Ser Gln Val Asn Ala Gln Thr
    370                 375                 380
Gln Glu Glu Thr Asp Arg Val Leu Ala Val Ser Leu Ile Asn Glu Ala
385                 390                 395                 400
Leu Asp Lys Gly Ser Pro Glu Lys Thr Leu Ser Ala Leu Leu Leu Pro
                405                 410                 415
Ala Ala Gly Leu Asp Asp Val Ser Leu Pro Val Ala Pro Arg Tyr His
            420                 425                 430
Leu Leu Leu Val Ala Ala Lys Arg Gln Lys Ala Gln Val Thr Gly Asp
        435                 440                 445
Pro Gly Ala Val Leu Trp Leu Glu Glu Ile Arg Gln Gly Val Val Arg
    450                 455                 460
Ala Asn Gln Asp Thr Asn Thr Ala Gln Arg Met Ala Leu Gly Val Ala
465                 470                 475                 480
Ala Ile Asn Gln Ala Ile Lys Glu Gly Lys Ala Ala Gln Thr Glu Arg
                485                 490                 495
Val Leu Arg Asn Pro Ala Val Ala Leu Arg Gly Val Val Pro Asp Cys
            500                 505                 510
Ala Asn Gly Tyr Gln Arg Ala Leu Glu Ser Ala Met Ala Lys Lys Gln
        515                 520                 525
Arg Pro Ala Asp Thr Ala Phe Trp Val Gln His Asp Met Lys Asp Gly
    530                 535                 540
Thr Ala Tyr Tyr Phe His Leu Gln Thr Phe Gln Gly Ile Trp Glu Gln
545                 550                 555                 560
Pro Pro Gly Cys Pro Leu Asn Thr Ser His Leu Thr Arg Glu Glu Ile
                565                 570                 575
Gln Ser Ala Val Thr Lys Val Thr Ala Ala Tyr Asp Arg Gln Gln Leu
            580                 585                 590
Trp Lys Ala Asn Val Gly Phe Val Ile Gln Leu Gln Ala Arg Leu Arg
        595                 600                 605
Gly Phe Leu Val Arg Gln Lys Phe Ala Glu His Ser His Phe Leu Arg
    610                 615                 620
Thr Trp Leu Pro Ala Val Ile Lys Ile Gln Ala His Trp Arg Gly Tyr
625                 630                 635                 640
Arg Gln Arg Lys Ile Tyr Leu Glu Trp Leu Gln Tyr Phe Lys Ala Asn
                645                 650                 655
Leu Asp Ala Ile Ile Lys Ile Gln Ala Trp Ala Arg Met Trp Ala Ala
            660                 665                 670
Arg Arg Gln Tyr Leu Arg Arg Leu His Tyr Phe Gln Lys Asn Val Asn
        675                 680                 685
Ser Ile Val Lys Ile Gln Ala Phe Phe Arg Ala Arg Lys Ala Gln Asp
    690                 695                 700
Asp Tyr Arg Ile Leu Val His Ala Pro His Pro Pro Leu Ser Val Val
705                 710                 715                 720
Arg Arg Phe Ala His Leu Leu Asn Gln Ser Gln Gln Asp Phe Leu Ala
                725                 730                 735
Glu Ala Glu Leu Leu Lys Leu Gln Glu Glu Val Val Arg Lys Ile Arg
            740                 745                 750
Ser Asn Gln Gln Leu Glu Gln Asp Leu Asn Ile Met Asp Ile Lys Ile
        755                 760                 765
Gly Leu Leu Val Lys Asn Arg Ile Thr Leu Gln Glu Val Val Ser His
    770                 775                 780
Cys Lys Lys Leu Thr Lys Arg Asn Lys Glu Gln Leu Ser Asp Met Met
785                 790                 795                 800
Val Leu Asp Lys Gln Lys Gly Leu Lys Ser Leu Ser Lys Glu Lys Arg
                805                 810                 815
Gln Lys Leu Glu Ala Tyr Gln His Leu Phe Tyr Leu Leu Gln Thr Gln
            820                 825                 830
Pro Ile Tyr Leu Ala Lys Leu Ile Phe Gln Met Pro Gln Asn Lys Thr
        835                 840                 845
Thr Lys Phe Met Glu Ala Val Ile Phe Ser Leu Tyr Asn Tyr Ala Ser
    850                 855                 860
Ser Arg Arg Glu Ala Tyr Leu Leu Leu Gln Leu Phe Lys Thr Ala Leu
865                 870                 875                 880
Gln Glu Glu Ile Lys Ser Lys Val Glu Gln Pro Gln Asp Val Val Thr
                885                 890                 895
Gly Asn Pro Thr Val Val Arg Leu Val Val Arg Phe Tyr Arg Asn Gly
            900                 905                 910
Arg Gly Gln Ser Ala Leu Gln Glu Ile Leu Gly Lys Val Ile Gln Asp
        915                 920                 925
Val Leu Glu Asp Lys Val Leu Ser Val His Thr Asp Pro Val His Leu
    930                 935                 940
Tyr Lys Asn Trp Ile Asn Gln Thr Glu Ala Gln Thr Gly Gln Arg Ser
945                 950                 955                 960
His Leu Pro Tyr Asp Val Thr Pro Glu Gln Ala Leu Ser His Pro Glu
                965                 970                 975
Val Gln Arg Arg Leu Asp Ile Ala Leu Arg Asn Leu Leu Ala Met Thr
            980                 985                 990
Asp Lys Phe Leu Leu Ala Ile Thr Ser Ser Val Asp Gln Ile Pro Tyr
        995                1000                1005
Gly Met Arg Tyr Val Ala Lys Val Leu Lys Ala Thr Leu Ala Glu Lys
   1010                1015                1020
Phe Pro Asp Ala Thr Asp Ser Glu Val Tyr Lys Val Val Gly Asn Leu
1025               1030                1035                1040
Leu Tyr Tyr Arg Phe Leu Asn Pro Ala Val Val Ala Pro Asp Ala Phe
               1045                1050                1055
Asp Ile Val Ala Met Ala Ala Gly Gly Ala Leu Ala Ala Pro Gln Arg
           1060                1065                1070
His Ala Leu Gly Ala Val Ala Gln Leu Leu Gln His Ala Ala Ala Gly
       1075                1080                1085
Lys Ala Phe Ser Gly Gln Ser Gln His Leu Arg Val Leu Asn Asp Tyr
   1090                1095                1100
Leu Glu Glu Thr His Leu Lys Phe Arg Lys Phe Ile His Arg Ala Cys
1105               1110                1115                1120
Gln Val Pro Glu Pro Glu Glu Arg Phe Ala Val Asp Glu Tyr Ser Asp
               1125                1130                1135
Met Val Ala Val Ala Lys Pro Met Val Tyr Ile Thr Val Gly Glu Leu
           1140                1145                1150
Val Asn Thr His Arg Leu Leu Leu Glu His Gln Asp Cys Ile Ala Pro
       1155                1160                1165
Asp His Gln Asp Pro Leu His Glu Leu Leu Glu Asp Leu Gly Glu Leu
   1170                1175                1180
Pro Thr Ile Pro Asp Leu Ile Gly Glu Ser Ile Ala Ala Asp Gly His
1185               1190                1195                1200
Thr Asp Leu Ser Lys Leu Glu Val Ser Leu Thr Leu Thr Asn Lys Phe
               1205                1210                1215
Glu Gly Leu Glu Ala Asp Ala Asp Asp Ser Asn Thr Arg Ser Leu Leu
           1220                1225                1230
Leu Ser Thr Lys Gln Leu Leu Ala Asp Ile Ile Gln Phe His Pro Gly
       1235                1240                1245
Asp Thr Leu Lys Glu Ile Leu Ser Leu Ser Ala Ser Arg Glu Gln Glu
   1250                1255                1260
Ala Ala His Lys Gln Leu Met Ser Arg Arg Gln Ala Cys Thr Ala Gln
1265               1270                1275                1280
Thr Pro Glu Pro Leu Arg Arg His Arg Ser Leu Thr Ala His Ser Leu
               1285                1290                1295
Leu Pro Leu Ala Glu Lys Gln Arg Arg Val Leu Arg Asn Leu Arg Arg
           1300                1305                1310
Leu Glu Ala Leu Gly Leu Val Ser Ala Arg Asn Gly Tyr Gln Gly Leu
       1315                1320                1325
Val Asp Glu Leu Ala Lys Asp Ile Arg Asn Gln His Arg His Arg His
   1330                1335                1340
Arg Arg Lys Ala Glu Leu Val Lys Leu Gln Ala Thr Leu Gln Gly Leu
1345               1350                1355                1360
Ser Thr Lys Thr Thr Phe Tyr Glu Glu Gln Gly Asp Tyr Tyr Ser Gln
               1365                1370                1375
Tyr Ile Arg Ala Cys Leu Asp His Leu Ala Pro Asp Ser Lys Ser Ser
           1380                1385                1390
Gly Lys Gly Lys Lys Gln Pro Ser Leu His Tyr Thr Ala Ala Gln Leu
       1395                1400                1405
Leu Glu Lys Gly Val Leu Val Glu Ile Glu Asp Leu Pro Ala Ser His
   1410                1415                1420
Phe Arg Asn Val Ile Phe Asp Ile Thr Pro Gly Asp Glu Ala Gly Lys
1425               1430                1435                1440
Phe Glu Val Asn Ala Lys Phe Leu Gly Val Asp Met Glu Arg Phe Gln
               1445                1450                1455
Leu His Tyr Gln Asp Leu Leu Gln Leu Gln Tyr Glu Gly Val Ala Val
           1460                1465                1470
Met Lys Leu Phe Asn Lys Ala Lys Val Asn Val Asn Leu Leu Ile Phe
       1475                1480                1485
Leu Leu Asn Lys Lys Phe Leu Arg Lys
   1490                1495
<210>3
<211>5317
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(12)..(4904)
<223>LBFL109 Clone B
<400>3
gaaggaggaa c        atg gag agg aga gca gcg ggc cca ggc tgg gca           44
                    Met Glu Arg Arg Ala Ala Gly Pro Gly Trp Ala
                      1               5                  10
gcc tat gaa cgc ctc aca gct gag gag atg gat gag cag agg cgg cag           92
Ala Tyr Glu Arg Leu Thr Ala Glu Glu Met Asp Glu Gln Arg Arg Gln
             15                  20                  25
aat gtt gcc tat cag tac ctg tgc cgg ctg gag gag gcc aag cgc tgg          140
Asn Val Ala Tyr Gln Tyr Leu Cys Arg Leu Glu Glu Ala Lys Arg Trp
         30                  35                  40
atg gag gcc tgc ctg aag gag gag ctt cct tcc ccg gtg gag ctg gag          188
Met Glu Ala Cys Leu Lys Glu Glu Leu Pro Ser Pro Val Glu Leu Glu
     45                  50                  55
gag agc ctt cgg aat gga gtg ctg ctg gcc aag ctg ggc cac tgt ttt          236
Glu Ser Leu Arg Asn Gly Val Leu Leu Ala Lys Leu Gly His Cys Phe
 60                  65                  70                  75
gca ccc tcc gtg gtt ccg ttg aag aag atc tac gat gtg gag cag ctg          284
Ala Pro Ser Val Val Pro Leu Lys Lys Ile Tyr Asp Val Glu Gln Leu
                 80                  85                  90
cgg tac cag gca act ggc tta cat ttc cgt cac aca gac aac atc aac          332
Arg Tyr Gln Ala Thr Gly Leu His Phe Arg His Thr Asp Asn Ile Asn
             95                 100                 105
ttt tgg cta tct gca ata gcc cac atc ggt ctg cct tcg acc ttc ttc          380
Phe Trp Leu Ser Ala Ile Ala His Ile Gly Leu Pro Ser Thr Phe Phe
        110                 115                 120
cca gag acc acg gac atc tat gac aaa aag aac atg ccc cgg gta gtc          428
Pro Glu Thr Thr Asp Ile Tyr Asp Lys Lys Asn Met Pro Arg Val Val
    125                 130                 135
tac tgc atc cat gct ctc agt ctc ttc ctc ttc cgg ctg gga ttg gcc          476
Tyr Cys Ile His Ala Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala
140                 145                 150                 155
cct cag ata cat gat cta tac ggg aaa gtg aaa ttc aca gct gag gaa          524
Pro Gln Ile His Asp Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu
                160                 165                 170
ctc agc aac atg gcg tcc gaa ctg gcc aaa tat ggc ctc cag ctg cct          572
Leu Ser Asn Met Ala Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro
            175                 180                 185
gcc ttc agc aag atc ggg ggc atc ttg gcc aat gag ctc tcg gtg gat          620
Ala Phe Ser Lys Ile Gly Gly lle Leu Ala Asn Glu Leu Ser Val Asp
        190                 195                 200
gag gct gca gtc cat gca gct gtt ctt gcc atc aat gaa gca gtg gag          668
Glu Ala Ala Val His Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu
    205                 210                 215
cga ggg gtg gtg gag gac acc ctg gct gcc ttg cag aat ccc agt gct          716
Arg Gly Val Val Glu Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala
220                 225                 230                 235
ctt ctg gag aat ctc cga gag cct ctg gca gcc gtc tac cag gag atg          764
Leu Leu Glu Asn Leu Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met
                240                 245                 250
ctg gcc cag gcc aag atg gag aag gca gcc aat gcc agg aac cat gat          812
Leu Ala Gln Ala Lys Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp
            255                 260                 265
gac aga gaa agc cag gac atc tat gac cac tac cta act cag gct gaa          860
Asp Arg Glu Ser Gln Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu
        270                 275                 280
atc cag ggc aat atc aac cat gtc aac gtc cat ggg gct cta gaa gtt          908
Ile Gln Gly Asn Ile Asn His Val Asn Val His Gly Ala Leu Glu Val
    285                 290                 295
gtt gat gat gcc ctg gaa aga cag agc cct gaa gcc ttg ctc aag gcc          956
Val Asp Asp Ala Leu Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala
300                 305                 310                 315
ctt caa gac cct gcc ctg gcc ctg cga ggg gtg agg aga gac ttt gct         1004
Leu Gln Asp Pro Ala Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala
                320                 325                 330
gac tgg tac ctg gag cag ctg aac tca gac aga gag cag aag gca cag         1052
Asp Trp Tyr Leu Glu Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln
            335                 340                 345
gag ctg ggc ctg gtg gag ctt ctg gaa aag gag gaa gtc cag gct ggt         1100
Glu Leu Gly Leu Val Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly
        350                 355                 360
gtg gct gca gcc aac aca aag ggt gat cag gaa caa gcc atg ctc cac         1148
Val Ala Ala Ala Asn Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His
    365                 370                 375
gct gtg cag cgg atc aac aaa gcc atc cgg agg gga gtg gcg gct gac         1196
Ala Val Gln Arg Ile Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp
380                 385                 390                 395
act gtg aag gag ctg atg tgc cct gag gcc cag ctg cct cca gtg tac         1244
Thr Val Lys Glu Leu Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr
                400                 405                 410
cct gtt gca tcg tct atg tac cag ctg gag ctg gca gtg ctc cag cag         1292
Pro Val Ala Ser Ser Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln
            415                 420                 425
cag cag ggg gag ctt ggc cag gag gag ctc ttc gtg gct gtg gag atg         1340
Gln Gln Gly Glu Leu Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met
        430                 435                 440
ctc tca gct gtg gtc ctg att aac cgg gcc ctg gag gcc cgg gat gcc         1388
Leu Ser Ala Val Val Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala
    445                 450                 455
agt ggc ttc tgg agc agc ctg gtg aac cct gcc aca ggc ctg gct gag         1436
Ser Gly Phe Trp Ser Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu
460                 465                 470                 475
gtg gaa gga gaa aat gcc cag cgt tac ttc gat gcc ctg ctg aaa ttg         1484
Val Glu Gly Glu Asn Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu
                480                 485                 490
cga cag gag cgt ggg atg ggt gag gac ttc ctg agc tgg aat gac ctg         1532
Arg Gln Glu Arg Gly Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu
            495                 500                 505
cag gcc acc gtg agc cag gtc aat gca cag acc cag gaa gag act gac         1580
Gln Ala Thr Val Ser Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp
        510                 515                 520
cgg gtc ctt gca gtc agc ctc atc aat gag gct ctg gac aaa ggc agc         1628
Arg Val Leu Ala Val Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser
    525                 530                 535
cct gag aag act ctg tct gcc cta ctg ctt cct gca gct ggc cta gat         1676
Pro Glu Lys Thr Leu Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp
540                 545                 550                 555
gat gtc agc ctc cct gtc gcc cct cgg tac cat ctc ctc ctt gtg gca         1724
Asp Val Ser Leu Pro Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala
                560                 565                 570
gcc aaa agg cag aag gcc cag gtg aca ggg gat cct gga gct gtg ctg         1772
Ala Lys Arg Gln Lys Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu
            575                 580                 585
tgg ctt gag gag atc cgc cag gga gtg gtc aga gcc aac cag gac act         1820
Trp Leu Glu Glu Ile Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr
        590                 595                 600
aat aca gct cag aga atg gct ctt ggt gtg gct gcc atc aat caa gcc         1868
Asn Thr Ala Gln Arg Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala
    605                 610                 615
atc aag gag ggc aag gca gcc cag act gag cgg gtg ttg agg aac ccc         1916
Ile Lys Glu Gly Lys Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro
620                 625                 630                 635
gca gtg gcc ctt cga ggg gta gtt ccc gac tgt gcc aac ggc tac cag         1964
Ala Val Ala Leu Arg Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln
                640                 645                 650
cga gcc ctg gaa agt gcc atg gca aag aaa cag cgt cca gca gac aca         2012
Arg Ala Leu Glu Ser Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr
            655                 660                 665
gct ttc tgg gtt caa cat gac atg aag gat ggc act gcc tac tac ttc         2060
Ala Phe Trp Val Gln His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe
        670                 675                 680
cat ctg cag acc ttc cag ggg atc tgg gag caa cct cct ggc tgc ccc         2108
His Leu Gln Thr Phe Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro
    685                 690                 695
ctc aac acc tct cac ctg acc cgg gag gag atc cag tca gct gtc acc         2156
Leu Asn Thr Ser His Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr
700                 705                 710                 715
aag gtc act gct gcc tat gac cgc caa cag ctc tgg aaa gcc aac gtc         2204
Lys Val Thr Ala Ala Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val
                720                 725                 730
ggc ttt gtt atc cag ctc cag gcc cgc ctc cgt ggc ttc cta gtt cgg         2252
Gly Phe Val Ile Gln Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg
            735                 740                 745
cag aag ttt gct gag cat tcc cac ttt ctg agg acc tgg ctc cca gca         2300
Gln Lys Phe Ala Glu His Ser His Phe Leu Arg Thr Trp Leu Pro Ala
        750                 755                 760
gtc atc aag atc cag gct cat tgg cgg ggt tat agg cag cgg aag att         2348
Val Ile Lys Ile Gln Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile
    765                 770                 775
tac ctg gag tgg ttg cag tat ttt aaa gca aac ctg gat gcc ata atc         2396
Tyr Leu Glu Trp Leu Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile
780                 785                 790                 795
aag atc cag gcc tgg gcc cgg atg tgg gca gct cgg agg caa tac ctg         2444
Lys Ile Gln Ala Trp Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu
                800                 805                 810
agg cgt ctg cac tac ttc cag aag aat gtt aac tcc att gtg aag atc         2492
Arg Arg Leu His Tyr Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile
            815                 820                 825
cag gca ttt ttc cga gcc agg aaa gcc caa gat gac tac agg ata tta         2540
Gln Ala Phe Phe Arg Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu
        830                 835                 840
gtg cat gca ccc cac cct cct ctc agt gtg gta cgc aga ttt gcc cat         2588
Val His Ala Pro His Pro Pro Leu Ser Val Val Arg Arg Phe Ala His
    845                 850                 855
ctc ttg aat caa agc cag caa gac ttc ttg gct gag gca gag ctg ctg         2636
Leu Leu Asn Gln Ser Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu
860                 865                 870                 875
aag ctc cag gaa gag gta gtt agg aag atc cga tcc aat cag cag ctg         2684
Lys Leu Gln Glu Glu Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu
                880                 885                 890
gag cag gac ctc aac atc atg gac atc aag att ggc ctg ctg gtg aag         2732
Glu Gln Asp Leu Asn Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys
            895                 900                 905
aac cgg atc act ctg cag gaa gtg gtc tcc cac tgc aag aag ctg acc         2780
Asn Arg Ile Thr Leu Gln Glu Val Val Ser His Cys Lys Lys Leu Thr
        910                 915                 920
aag agg aat aag gaa cag ctg tca gat atg atg gtt ctg gac aag cag         2828
Lys Arg Asn Lys Glu Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln
    925                 930                 935
aag ggt tta aag tcg ctg agc aaa gag aaa cgg cag aaa cta gaa gca         2876
Lys Gly Leu Lys Ser Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala
940                 945                 950                 955
tac caa cac ctc ttc tac ctg ctc cag act cag ccc atc tac ctg gcc         2924
Tyr Gln His Leu Phe Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala
                960                 965                 970
aag ctg atc ttt cag atg cca cag aac aaa acc acc aag ttc atg gag         2972
Lys Leu Ile Phe Gln Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu
            975                 980                 985
gca gtg att ttc agc ctg tac aac tat gcc tcc agc cgc cga gag gcc         3020
Ala Val Ile Phe Ser Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala
        990                 995                1000
tat ctc ctg ctc cag ctg ttc aag aca gca ctc cag gag gaa atc aag         3068
Tyr Leu Leu Leu Gln Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys
   1005                1010                1015
tca aag gtg gag cag ccc cag gac gtg gtg aca ggc aac cca aca gtg         3116
Ser Lys Val Glu Gln Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val
1020               1025                1030                1035
gtg agg ctg gtg gtg aga ttc tac cgt aat ggg cgg gga cag agt gcc         3164
Val Arg Leu Val Val Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala
               1040                1045                1050
ctg cag gag att ctg ggc aag gtt atc cag gat gtg cta gaa gac aaa         3212
Leu Gln Glu Ile Leu Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys
           1055                1060                1065
gtg ctc agc gtc cac aca gac cct gtc cac ctc tat aag aac tgg atc         3260
Val Leu Ser Val His Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile
       1070                1075                1080
aac cag act gag gcc cag aca ggg cag cgc agc cat ctc cca tat gat         3308
Asn Gln Thr Glu Ala Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp
   1085                1090                1095
gtc acc ccg gag cag gcc ttg agc cac ccc gag gtc cag aga cga ctg         3356
Val Thr Pro Glu Gln Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu
1100               1105                1110                1115
gac atc gcc cta cgc aac ctc ctc gcc atg act gat aag ttc ctt tta         3404
Asp Ile Ala Leu Arg Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu
               1120                1125                1130
gcc atc acc tca tct gtg gac caa att ccg tat ggg atg cga tat gtg         3452
Ala Ile Thr Ser Ser Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val
           1135                1140                1145
gcc aaa gtc ctg aag gca act ctg gca gag aaa ttc cct gac gcc aca         3500
Ala Lys Val Leu Lys Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr
       1150                1155                1160
gac agc gag gtc tat aag gtg gtc ggg aac ctc ctg tac tac cgc ttc         3548
Asp Ser Glu Val Tyr Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe
   1165                1170                1175
ctg aac cca gct gtg gtg gct cct gac gcc ttc gac att gtg gcc atg         3596
Leu Asn Pro Ala Val Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met
1180               1185                1190                1195
gca gct ggt gga gcc ctg gct gcc ccc cag cgc cat gcc ctg ggg gct         3644
Ala Ala Gly Gly Ala Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala
               1200                1205                1210
gtg gct cag ctc cta cag cac gct gcg gct ggc aag gcc ttc tct ggg         3692
Val Ala Gln Leu Leu Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly
           1215                1220                1225
cag agc cag cac cta cgg gtc ctg aat gac tat ctg gag gaa aca cac         3740
Gln Ser Gln His Leu Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His
       1230                1235                1240
ctc aag ttc agg aag ttc atc cat aga gcc tgc cag gtg cca gag cca         3788
Leu Lys Phe Arg Lys Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro
   1245                1250                1255
gag gag cgt ttt gca gtg gac gag tac tca gac atg gtg gct gtg gcc         3836
Glu Glu Arg Phe Ala Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala
1260               1265                1270                1275
aaa ccc atg gtg tac atc acc gtg ggg gag ctg gtc aac acg cac agg         3884
Lys Pro Met Val Tyr Ile Thr Val Gly Glu Leu Val Asn Thr His Arg
               1280                1285                1290
ctg ttg ctg gag cac cag gac tgc att gcc cct gat cac caa gac ccc         3932
Leu Leu Leu Glu His Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro
           1295                1300                1305
ctg cat gag ctc ctg gag gat ctt ggg gag ctg ccc acc atc cct gac         3980
Leu His Glu Leu Leu Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp
       1310                1315                1320
ctt att ggt gag agc atc gct gca gat ggg cac aca gac ctg agc aag         4028
Leu Ile Gly Glu Ser Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys
   1325                1330                1335
cta gaa gtg tcc ctg acg ctg acc aac aag ttt gaa gga cta gag gca         4076
Leu Glu Val Ser Leu Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala
1340               1345                1350                1355
gat gct gat gac tcc aac acc cgt agc ctg ctt ctg agc acc aag cag         4124
Asp Ala Asp Asp Ser Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln
               1360                1365                1370
ctg ttg gcc gat atc ata cag ttc cat cct ggg gac acc ctc aag gag         4172
Leu Leu Ala Asp Ile Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu
           1375                1380                1385
atc ctg tcc ctc tcg gct tcc aga gag caa gaa gca gcc cac aag cag         4220
Ile Leu Ser Leu Ser Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln
       1390                1395                1400
ctg atg agc cga cgc cag gcc tgt aca gcc cag aca ccg gag cca ctg         4268
Leu Met Ser Arg Arg Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu
   1405                1410                1415
cga cga cac cgc tca ctg aca gct cac tcc ctc ctg cca ctg gca gag         4316
Arg Arg His Arg Ser Leu Thr Ala His Ser Leu Leu Pro Leu A1a Glu
1420               1425                1430                1435
aag cag cgg cgc gtc ctg cgg aac ctg cgc cga ctt gaa gcc ctg ggg         4364
Lys Gln Arg Arg Val Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly
               1440                1445                1450
ttg gtc agc gcc aga aat ggc tac cag ggg cta gtg gac gag ctg gcc         4412
Leu Val Ser Ala Arg Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala
           1455                1460                1465
aag gac atc cgc aac cag cac aga cac agg cac agg cgg aag gca gag         4460
Lys Asp Ile Arg Asn Gln His Arg His Arg His Arg Arg Lys Ala Glu
       1470                1475                1480
ctg gtg aag ctg cag gcc aca tta cag ggc ctg agc act aag acc acc         4508
Leu Val Lys Leu Gln Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr
   1485                1490                1495
ttc tat gag gag cag ggt gac tac tac agc cag tac atc cgg gcc tgc         4556
Phe Tyr Glu Glu Gln Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys
1500               1505                1510                1515
ctg gac cac ctg gcc ccc gac tcc aag agt tct ggg aag ggg aag aag         4604
Leu Asp His Leu Ala Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys
               1520                1525                1530
cag cct tct ctt cat tac act gct gct cag ctc ctg gaa aag ggt gtc         4652
Gln Pro Ser Leu His Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val
           1535                1540                1545
ttg gtg gaa att gaa gat ctt ccc gcc tct cac ttc aga aac gtc atc         4700
Leu Val Glu Ile Glu Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile
       1550                1555                1560
ttt gac atc acg ccg gga gat gag gca gga aag ttt gaa gta aat gcc         4748
Phe Asp Ile Thr Pro Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala
   1565                1570                1575
aag ttc ctg ggt gtg gac atg gag cga ttt cag ctt cac tat cag gat         4796
Lys Phe Leu Gly Val Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp
1580               1585                1590                1595
crc ctg cag ctc cag tat gag ggt gtg gct gtc atg aaa crc ttc aac         4844
Leu Leu Gln Leu Gln Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn
               1600                1605                1610
aag gcc aaa gtc aat gtc aac ctt ctc arc ttc crc ctc aac aag aag         4892
Lys Ala Lys Val Asn Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys
           1615                1620                1625
ttt ttg cgg aag           tgacag aggcaaaggg tgctacccaa gcccctctta       4940
Phe Leu Arg Lys
       1630
cctctctgga tgctttcttt aacactaact caccactgtg cttccctgca gacacccaga       5000
gctcaggact gggcaaggcc cagggattct caccccttcc ccagctggga ggagcttgcc       5060
tgcctggcca cagacagtgt atcttctaat tggctaaagt gggccttgcc cagagtccag       5120
ctgtgtggct tttatcatgc atgacaaacc cctggctttc ctgccagatg gattctcatc       5180
ccttacagct gactcttcca ggcaatttcc atagatctgc agtcctgcct ctgccacagt       5240
ctctctgttg tccccacatc tacccaactt cctgtactgt tgcccttctg atgttaataa       5300
aagcagctgt tactccc                                                      5317
<210>4
<211>1631
<212>PRT
<213>智人(Homo sapiens)
<400>4
Met Glu Arg Arg Ala Ala Gly Pro Gly Trp Ala Ala Tyr Glu Arg Leu
  1               5                  10                  15
Thr Ala Glu Glu Met Asp Glu Gln Arg Arg Gln Ash Val Ala Tyr Gln
             20                  25                  30
Tyr Leu Cys Arg Leu Glu Glu Ala Lys Arg Trp Met Glu Ala Cys Leu
         35                  40                  45
Lys Glu Glu Leu Pro Ser Pro Val Glu Leu Glu Glu Ser Leu Arg Asn
     50                  55                  60
Gly Val Leu Leu Ala Lys Leu Gly His Cys Phe Ala Pro Ser Val Val
 65                  70                  75                  80
Pro Leu Lys Lys Ile Tyr Asp Val Glu Gln Leu Arg Tyr Gln Ala Thr
                 85                  90                  95
Gly Leu His Phe Arg His Thr Asp Asn Ile Asn Phe Trp Leu Ser Ala
            100                 105                 110
Ile Ala His Ile Gly Leu Pro Ser Thr Phe Phe Pro Glu Thr Thr Asp
        115                 120                 125
Ile Tyr Asp Lys Lys Asn Met Pro Arg Val Val Tyr Cys Ile His Ala
    130                 135                 140
Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala Pro Gln Ile His Asp
145                 150                 155                 160
Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu Leu Ser Asn Met Ala
                165                 170                 175
Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro Ala Phe Ser Lys Ile
            180                 185                 190
Gly Gly Ile Leu Ala Asn Glu Leu Ser Val Asp Glu Ala Ala Val His
        195                 200                 205
Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu Arg Gly Val Val Glu
    210                 215                 220
Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala Leu Leu Glu Asn Leu
225                 230                 235                 240
Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met Leu Ala Gln Ala Lys
                245                 250                 255
Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp Asp Arg Glu Ser Gln
            260                 265                 270
Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu Ile Gln Gly Asn Ile
        275                 280                 285
Asn His Val Asn Val His Gly Ala Leu Glu Val Val Asp Asp Ala Leu
    290                 295                 300
Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala Leu Gln Asp Pro Ala
305                 310                 315                 320
Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala Asp Trp Tyr Leu Glu
                325                 330                 335
Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln Glu Leu Gly Leu Val
            340                 345                 350
Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly Val Ala Ala Ala Asn
        355                 360                 365
Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His Ala Val Gln Arg Ile
    370                 375                 380
Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp Thr Val Lys Glu Leu
385                 390                 395                 400
Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr Pro Val Ala Ser Ser
                405                 410                 415
Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln Gln Gln Gly Glu Leu
            420                 425                 430
Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met Leu Ser Ala Val Val
        435                 440                 445
Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala Ser Gly Phe Trp Ser
    450                 455                 460
Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu Val Glu Gly Glu Asn
465                 470                 475                 480
Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu Arg Gln Glu Arg Gly
                485                 490                 495
Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu Gln Ala Thr Val Ser
            500                 505                 510
Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp Arg Val Leu Ala Val
        515                 520                 525
Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser Pro Glu Lys Thr Leu
    530                 535                 540
Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp Asp Val Ser Leu Pro
545                 550                 555                 560
Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala Ala Lys Arg Gln Lys
                565                 570                 575
Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu Trp Leu Glu Glu Ile
            580                 585                 590
Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr Asn Thr Ala Gln Arg
        595                 600                 605
Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala Ile Lys Glu Gly Lys
    610                 615                 620
Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro Ala Val Ala Leu Arg
625                 630                 635                 640
Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln Arg Ala Leu Glu Ser
                645                 650                 655
Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr Ala Phe Trp Val Gln
            660                 665                 670
His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe His Leu Gln Thr Phe
        675                 680                 685
Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro Leu Asn Thr Ser His
    690                 695                 700
Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr Lys Val Thr Ala Ala
705                 710                 715                 720
Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val Gly Phe Val Ile Gln
                725                 730                 735
Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg Gln Lys Phe Ala Glu
            740                 745                 750
His Ser His Phe Leu Arg Thr Trp Leu Pro Ala Val Ile Lys Ile Gln
        755                 760                 765
Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile Tyr Leu Glu Trp Leu
    770                 775                 780
Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile Lys Ile Gln Ala Trp
785                 790                 795                 800
Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu Arg Arg Leu His Tyr
                805                 810                 815
Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile Gln Ala Phe Phe Arg
            820                 825                 830
Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu Val His Ala Pro His
        835                 840                 845
Pro Pro Leu Ser Val Val Arg Arg Phe Ala His Leu Leu Asn Gln Ser
    850                 855                 860
Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu Lys Leu Gln Glu Glu
865                 870                 875                 880
Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu Glu Gln Asp Leu Asn
                885                 890                 895
Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys Asn Arg Ile Thr Leu
            900                 905                 910
Gln Glu Val Val Ser His Cys Lys Lys Leu Thr Lys Arg Asn Lys Glu
        915                 920                 925
Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln Lys Gly Leu Lys Ser
    930                 935                 940
Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala Tyr Gln His Leu Phe
945                 950                 955                 960
Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala Lys Leu Ile Phe Gln
                965                 970                 975
Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu Ala Val Ile Phe Ser
            980                 985                 990
Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala Tyr Leu Leu Leu Gln
        995                1000                1005
Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys Ser Lys Val Glu Gln
   1010                1015                1020
Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val Val Arg Leu Val Val
1025               1030                1035                1040
Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala Leu Gln Glu Ile Leu
               1045                1050                1055
Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys Val Leu Ser Val His
           1060                1065                1070
Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile Asn Gln Thr Glu Ala
       1075                1080                1085
Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp Val Thr Pro Glu Gln
   1090                1095                1100
Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu Asp Ile Ala Leu Arg
l105               1110                1115                1120
Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu Ala Ile Thr Ser Ser
               1125                1130                1135
Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val Ala Lys Val Leu Lys
           1140                1145                1150
Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr Asp Ser Glu Val Tyr
       1155                1160                1165
Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe Leu Asn Pro Ala Val
   1170                1175                1180
Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met Ala Ala Gly Gly Ala
1185               1190                1195                1200
Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala Val Ala Gln Leu Leu
               1205                1210                1215
Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly Gln Ser Gln His Leu
           1220                1225                1230
Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His Leu Lys Phe Arg Lys
       1235                1240                1245
Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro Glu Glu Arg Phe Ala
   1250                1255                1260
Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala Lys Pro Met Val Tyr
1265               1270                1275                1280
Ile Thr Val Gly Glu Leu Val Asn Thr His Arg Leu Leu Leu Glu His
               1285                1290                1295
Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro Leu His Glu Leu Leu
           1300                1305                1310
Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp Leu Ile Gly Glu Ser
       1315                1320                1325
Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys Leu Glu Val Ser Leu
   1330                1335                1340
Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala Asp Ala Asp Asp Ser
1345               1350                1355                1360
Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln Leu Leu Ala Asp Ile
               1365                1370                1375
Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu Ile Leu Ser Leu Ser
           1380                1385                1390
Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln Leu Met Ser Arg Arg
       1395                1400                1405
Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu Arg Arg His Arg Ser
   1410                1415                1420
Leu Thr Ala His Ser Leu Leu Pro Leu Ala Glu Lys Gln Arg Arg Val
1425               1430                1435                1440
Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly Leu Val Ser Ala Arg
               1445                1450                1455
Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala Lys Asp Ile Arg Asn
           1460                1465                1470
Gln His Arg His Arg His Arg Arg Lys Ala Glu Leu Val Lys Leu Gln
       1475                1480                1485
Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr Phe Tyr Glu Glu Gln
   1490                1495                1500
Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys Leu Asp His Leu Ala
1505               1510                1515                1520
Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys Gln Pro Ser Leu His
               1525                1530                1535
Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val Leu Val Glu Ile Glu
           1540                1545                1550
Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile Phe Asp Ile Thr Pro
       1555                1560                1565
Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala Lys Phe Leu Gly Val
   1570                1575                1580
Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp Leu Leu Gln Leu Gln
1585               1590                1595                1600
Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn Lys Ala Lys Val Asn
               1605                1610                1615
Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys Phe Leu Arg Lys
           1620                1625                1630
<210>5
<211>3608
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(424)..(1908)
<223>Clone LBFL110
<400>5
ggcggcgaga gcagctgcag ctcgcatctc aggcagtacc tagaggagct gccggtgcct         60
cctcagaaca tctcctgatc gctacccagg accaggcacc aaggacaggg agtcccaggc        120
gcacaccccc cattctgggt cccccaggcc cagaccccca ctctgccaca ggttgcatct        180
tgacctggtc ctcctgcaga agtggcccct gtggtcctgc tctgagactc gtccctgggc        240
gcccctgcag cccctttcta tgactccatc tggatttggc tggctgtggg gacgcggtcc        300
gaggggcggc ctggctctca gcgtggtggc agccagctct ctggccacca tggcaaatgc        360
tgagatctga ggggacaagg ctctacagcc tcagccaggg gcactcagct gttgcagggt        420
gtg        atg gag aac aaa gct atg tac cta cac acc gtc agc gac tgt       465
           Met Glu Asn Lys Ala Met Tyr Leu His Thr Val Ser Asp Cys
             1               5                  10
gac acc agc tcc atc tgt gag gat tcc ttt gat ggc agg agc ctg tcc          513
Asp Thr Ser Ser Ile Cys Glu Asp Ser Phe Asp Gly Arg Ser Leu Ser
 15                  20                  25                  30
aag ctg aac ctg tgt gag gat ggt cca tgt cac aaa cgg cgg gca agc          561
Lys Leu Asn Leu Cys Glu Asp Gly Pro Cys His Lys Arg Arg Ala Ser
                 35                  40                  45
atc tgc tgt acc cag ctg ggg tcc ctg tcg gcc ctg aag cat gct gtc          609
Ile Cys Cys Thr Gln Leu Gly Ser Leu Ser Ala Leu Lys His Ala Val
             50                  55                  60
ctg ggg ctc tac ctg ctg gtc ttc ctg att ctt gtg ggc atc ttc atc          657
Leu Gly Leu Tyr Leu Leu Val Phe Leu Ile Leu Val Gly Ile Phe Ile
         65                  70                  75
tta gca gtg tcc agg ccg cgc agc tcc cct gac gac ctg aag gcc ctg          705
Leu Ala yal Ser Arg Pro Arg Ser Ser Pro Asp Asp Leu Lys Ala Leu
     80                  85                  90
act cgc aat gtg aac cgg ctg aat gag agc ttc cgg gac ttg cag ctg          753
Thr Arg Asn Val Asn Arg Leu Asn Glu Ser Phe Arg Asp Leu Gln Leu
95                  100                 105                 110
cgg ctg ctg cag gct ccg ctg caa gcg gac ctg acg gag cag gtg tgg          801
Arg Leu Leu Gln Ala Pro Leu Gln Ala Asp Leu Thr Glu Gln Val Trp
                115                 120                 125
aag gtg cag gac gcg ctg cag aac cag tca gac tcg ttg ctg gcg ctg          849
Lys Val Gln Asp Ala Leu Gln Asn Gln Ser Asp Ser Leu Leu Ala Leu
            130                 135                 140
gcg ggc gca gtg cag cgg ctg gag ggc gcg ctg tgg ggg ctg cag gcg          897
Ala Gly Ala Val Gln Arg Leu Glu Gly Ala Leu Trp Gly Leu Gln Ala
        145                 150                 155
cag gcg gtg cag acc gag cag gcg gtg gcc ctg ctg cgg gac cgc acg          945
Gln Ala Val Gln Thr Glu Gln Ala Val Ala Leu Leu Arg Asp Arg Thr
    160                 165                 170
ggc cag cag agc gac acg gcg cag ctg gag ctc tac cag ctg cag gtg          993
Gly Gln Gln Ser Asp Thr Ala Gln Leu Glu Leu Tyr Gln Leu Gln Val
175                 180                 185                 190
gag agc aac agt agc cag ctg ctg ctg agg cgc cac gcg ggc ctg ctg         1041
Glu Ser Asn Ser Ser Gln Leu Leu Leu Arg Arg His Ala Gly Leu Leu
                195                 200                 205
gac ggg ctg gcg cgc agg gtg ggc atc ctg ggc gag gag ctg gcc gac         1089
Asp Gly Leu Ala Arg Arg Val Gly Ile Leu Gly Glu Glu Leu Ala Asp
            210                 215                 220
gtg ggc ggc gtg ctg cgc ggc ctc aac cac agc ctg tcc tac gac gtg         1137
Val Gly Gly Val Leu Arg Gly Leu Asn His Ser Leu Ser Tyr Asp Val
        225                 230                 235
gcc ctc cac cgc acg cgg ctg cag gac ctg cgg gtg ctg gtg agc aac         1185
Ala Leu His Arg Thr Arg Leu Gln Asp Leu Arg Val Leu Val Ser Asn
    240                 245                 250
gcc agc gag gac acg cgc cgc ctg cgc ctg gcg cac gta ggc atg gag         1233
Ala Ser Glu Asp Thr Arg Arg Leu Arg Leu Ala His Val Gly Met Glu
255                 260                 265                 270
ctg cag ctg aag cag gag ctg gcc atg ctc aac gcg gtc acc gag gac         1281
Leu Gln Leu Lys Gln Glu Leu Ala Met Leu Asn Ala Val Thr Glu Asp
                275                 280                 285
ctg cgc ctc aag gac tgg gag cac tcc atc gca ctg cgg aac atc tcc         1329
Leu Arg Leu Lys Asp Trp Glu His Ser Ile Ala Leu Arg Asn Ile Ser
            290                 295                 300
ctc gcg aaa ggg cca ccg gga ccc aaa ggt gat cag ggg cat gaa gga         1377
Leu Ala Lys Gly Pro Pro Gly Pro Lys Gly Asp Gln Gly His Glu Gly
        305                 310                 315
aag gaa ggc agg cct ggc atc cct gga ttg cct gga ctt cga ggt ctg         1425
Lys Glu Gly Arg Pro Gly Ile Pro Gly Leu Pro Gly Leu Arg Gly Leu
    320                 325                 330
ccc ggg gag aga ggt acc cca gga ttg ccc ggg ccc aag ggc gat gat         1473
Pro Gly Glu Arg Gly Thr Pro Gly Leu Pro Gly Pro Lys Gly Asp Asp
335                 340                 345                 350
ggg aag ctg ggg gcc aca gga cca atg ggc atg cgt ggg ttc aaa ggt         1521
Gly Lys Leu Gly Ala Thr Gly Pro Met Gly Met Arg Gly Phe Lys Gly
                355                 360                 365
gac cga ggc cca aaa gga gag aaa gga gag aaa gga gac aga gct ggg         1569
Asp Arg Gly Pro Lys Gly Glu Lys Gly Glu Lys Gly Asp Arg Ala Gly
            370                 375                 380
gat gcc agt ggc gtg gag gcc ccg atg atg atc cgc ctg gtg aat ggc         1617
Asp Ala Ser Gly Val Glu Ala Pro Met Met Ile Arg Leu Val Asn Gly
        385                 390                 395
tca ggt ccg cac gag ggc cgc gtg gaa gtg tac cac gac cgg cgt tgg         1665
Ser Gly Pro His Glu Gly Arg Val G1u Val Tyr His Asp Arg Arg Trp
    400                 405                 410
ggc acc gtg tgt gac gac ggc tgg gac aag aag gac gga gac gtg gtg         1713
Gly Thr Val Cys Asp Asp Gly Trp Asp Lys Lys Asp Gly Asp Val Val
415                 420                 425                 430
tgc cgc atg ctc ggc ttc cgc ggt gtg gag gag gtg tac cgc aca gct         1761
Cys Arg Met Leu Gly Phe Arg Gly Val Glu Glu Val Tyr Arg Thr Ala
                435                 440                 445
cga ttc ggg caa ggc act ggg agg atc tgg atg gat gac gtt gcc tgc         1809
Arg Phe Gly Gln Gly Thr Gly Arg Ile Trp Met Asp Asp Val Ala Cys
            450                 455                 460
aag ggc aca gag gaa acc atc ttc cgc tgc agc ttc tcc aaa tgg ggg         1857
Lys Gly Thr Glu Glu Thr Ile Phe Arg Cys Ser Phe Ser Lys Trp Gly
        465                 470                 475
gtg aca aac tgt gga cat gcc gaa gat gcc agc gtg aca tgc aac aga         1905
Val Thr Asn Cys Gly His Ala Glu Asp Ala Ser Val Thr Cys Asn Arg
    480                 485                 490
cac     tg aaagtgggca gagcccaagt tcggggtcct gcacagagca cccttcctgc       1960
His
495
atccctgggg tggggcacag ctcggggcca ccctgaccat gcctcgacca caccccgtcc       2020
agcattctca gtcctcacac ctgcatccca ggaccgtggg ggccggtcgt catttccctc       2080
ttgaacatgt gctccgaagt ataactctgg gacctactgc ccgtctctct cttccaccag       2140
gttcctgcat gaggagccct gatcaactgg atcaccactt tgcccagcct ctgaacacca       2200
tgcaccaggc ctcaatatcc cagttccctt tggcctttta gttacaggtg aatgctgaga       2260
atgtgtcaga gacaagtgca gcagcagcga tggttggtag tatagatcat ttactcttca       2320
gacaattccc aaacctccat tagtccaaga gtttctacat cttcctcccc agcaagaggc       2380
aacgtcaagt gatgaatttc ccccctttac tctgcctctg ctccccattt gctagtttga       2440
ggaagtgaca tagaggagaa gccagctgta ggggcaagag ggaaatgcaa gtcacctgca       2500
ggaatccagc tagatttgga gaagggaatg aaactaacat tgaatgacta ccatggcacg       2560
ctaaatagta tcttgggtgc caaattcatg tatccactta gctgcattgg tccagggcat       2620
gtcagtctgg atacagcctt acctccaggt agcacttaac tggtccattc acctagactg       2680
caagtaagaa gacaaaatga ctgagaccgt gtgcccacct gaacttattg tctttacttg       2740
gcctgagcta aaagcttggg tgcaggacct gtgtaactag aaagttgcct acttcagaac       2800
ctccagggcg tgagtgcaag gtcaaacatg actggcttcc aggccgacca tcaatgtagg       2860
aggagagctg atgtggaggg tgacatgggg gctgcccatg ttaaacctga gtccagtgct       2920
ctggcattgg gcagtcacgg ttaaagccaa gtcatgtgtg tctcagctgt ttggaggtga       2980
tgattttgca tcttccaagc ctcttcaggt gtgaatctgt ggtcaggaaa acacaagtcc       3040
taatggaacc cttagggggg aaggaaatga agattcccta taacctctgg gggtggggag       3100
taggaataag gggcttgggc ctccataaat ctgcaatctg caccctcctc ctagagacag       3160
ggagatcgtg ttctgctttt tacatgagga gcagaactgg gccatacaca tgttcaagaa       3220
ctaggggagc tacctggtag caagtgagtg cagacccacc tcaccttggg ggaatctcaa       3280
actcataggc ctcagataca cgatcacctg tcatatcagg tgagcactgg cctgcttggg       3340
gagagacctg ggcccctcca ggtgtaggaa cagcaacact cctggctgac aactaagcca       3400
atatggccct aggtcattct tgcttccaat atgcttgcca ctccttaaat gtcctaatga       3460
tgagaaactc tctttctgac caattgctat gtttacataa cacgcatgta ctcatgcatc       3520
ccttgccaga gcccatatat gtatgcatat ataaacatag cactttttac tacatagctc       3580
agcacattgc aaggtttgca tttaagtt                                          3608
<210>6
<211>495
<212>PRT
<213>智人(Homo sapiens)
<400>6
Met Glu Asn Lys Ala Met Tyr Leu His Thr Val Ser Asp Cys Asp Thr
  1               5                  10                  15
Ser Ser Ile Cys Glu Asp Ser Phe Asp Gly Arg Ser Leu Ser Lys Leu
             20                  25                  30
Asn Leu Cys Glu Asp Gly Pro Cys His Lys Arg Arg Ala Ser Ile Cys
         35                  40                  45
Cys Thr Gln Leu Gly Ser Leu Ser Ala Leu Lys His Ala Val Leu Gly
     50                  55                  60
Leu Tyr Leu Leu Val Phe Leu Ile Leu Val Gly Ile Phe Ile Leu Ala
 65                  70                  75                  80
Val Ser Arg Pro Arg Ser Ser Pro Asp Asp Leu Lys Ala Leu Thr Arg
                 85                  90                  95
Asn Val Asn Arg Leu Asn Glu Ser Phe Arg Asp Leu Gln Leu Arg Leu
            100                 105                 110
Leu Gln Ala Pro Leu Gln Ala Asp Leu Thr Glu Gln Val Trp Lys Val
        115                 120                 125
Gln Asp Ala Leu Gln Asn Gln Ser Asp Ser Leu Leu Ala Leu Ala Gly
    130                 135                 140
Ala Val Gln Arg Leu Glu Gly Ala Leu Trp Gly Leu Gln Ala Gln Ala
145                 150                 155                 160
Val Gln Thr Glu Gln Ala Val Ala Leu Leu Arg Asp Arg Thr Gly Gln
                165                 170                 175
Gln Ser Asp Thr Ala Gln Leu Glu Leu Tyr Gln Leu Gln Val Glu Ser
            180                 185                 190
Asn Ser Ser Gln Leu Leu Leu Arg Arg His Ala Gly Leu Leu Asp Gly
        195                 200                 205
Leu Ala Arg Arg Val Gly Ile Leu Gly Glu Glu Leu Ala Asp Val Gly
    210                 215                 220
Gly Val Leu Arg Gly Leu Asn His Ser Leu Ser Tyr Asp Val Ala Leu
225                 230                 235                 240
His Arg Thr Arg Leu Gln Asp Leu Arg Val Leu Val Ser Asn Ala Ser
                245                 250                 255
Glu Asp Thr Arg Arg Leu Arg Leu Ala His Val Gly Met Glu Leu Gln
            260                 265                 270
Leu Lys Gln Glu Leu Ala Met Leu Asn Ala Val Thr Glu Asp Leu Arg
        275                 280                 285
Leu Lys Asp Trp Glu His Ser Ile Ala Leu Arg Asn Ile Ser Leu Ala
    290                 295                 300
Lys Gly Pro Pro Gly Pro Lys Gly Asp Gln Gly His Glu Gly Lys Glu
305                 310                 315                 320
Gly Arg Pro Gly Ile Pro Gly Leu Pro Gly Leu Arg Gly Leu Pro Gly
                325                 330                 335
Glu Arg Gly Thr Pro Gly Leu Pro Gly Pro Lys Gly Asp Asp Gly Lys
            340                 345                 350
Leu Gly Ala Thr Gly Pro Met Gly Met Arg Gly Phe Lys Gly Asp Arg
        355                 360                 365
Gly Pro Lys Gly Glu Lys Gly Glu Lys Gly Asp Arg Ala Gly Asp Ala
    370                 375                 380
Ser Gly Val Glu Ala Pro Met Met Ile Arg Leu Val Asn Gly Ser Gly
385                 390                 395                 400
Pro His Glu Gly Arg Val Glu Val Tyr His Asp Arg Arg Trp Gly Thr
                405                 410                 415
Val Cys Asp Asp Gly Trp Asp Lys Lys Asp Gly Asp Val Val Cys Arg
            420                 425                 430
Met Leu Gly Phe Arg Gly Val Glu Glu Val Tyr Arg Thr Ala Arg Phe
        435                 440                 445
Gly Gln Gly Thr Gly Arg Ile Trp Met Asp Asp Val Ala Cys Lys Gly
    450                 455                 460
Thr Glu Glu Thr Ile Phe Arg Cys Ser Phe Ser Lys Trp Gly Val Thr
465                 470                 475                 480
Asn Cys Gly His Ala Glu Asp Ala Ser Val Thr Cys Asn Arg His
                485                 490                 495
<210>7
<211>3162
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(405)..(1835)
<223>Clone LBFLl23
<400>7
tggccggggt gccccgcaaa gagagacaag ggagaaaaag acagcaggga aaaccccggg         60
gaggagaagg cgaaagagaa ggtggagctc agagaagggg gccggctccc cagctccatg        120
tggccgccgc cgctgcgggt ctgtgggggc agagggcggc ggctcccagg gcagcgcgta        180
gcgggaccga ttgcctaata ctccggcagg ggccggggcc gcagctggct cggataaata        240
gccgcccggc tggcccggag ctgcagggga gagcggcggc cgcgatcccc accacaccac        300
cagcccggcc gcacggggca ctgagccggg tgctgagcac cggaggcccc gccgaggccg        360
ggactcagga cctgcagaga aacgcctcct gattttgtct taca       atg gaa ctt       413
                                                       Met Glu Leu
                                                         1
aaa aag tcg cct gac ggt gga tgg ggc tgg gtg att gtg ttt gtc tcc          461
Lys Lys Ser Pro Asp Gly Gly Trp Gly Trp Val Ile Val Phe Val Ser
      5                  10                  15
ttc ctt act cag ttt ttg tgt tac gga tcc cca cta gct gtt gga gtc          509
Phe Leu Thr Gln Phe Leu Cys Tyr Gly Ser Pro Leu Ala Val Gly Val
 20                  25                  30                  35
ctg tac ata gaa tgg ctg gat gcc ttt ggt gaa gga aaa gga aaa aca          557
Leu Tyr Ile Glu Trp Leu Asp Ala Phe Gly Glu Gly Lys Gly Lys Thr
                 40                  45                  50
gcc tgg gtt gga tcc ctg gca agt gga gtt ggc ttg ctt gca agt cct          605
Ala Trp Val Gly Ser Leu Ala Ser Gly Val Gly Leu Leu Ala Ser Pro
             55                  60                  65
gtc tgc agt ctc tgt gtc rca tct ttt gga gca aga cct gtc aca arc          653
Val Cys Ser Leu Cys Val Ser Ser Phe Gly Ala Arg Pro Val Thr Ile
         70                  75                  80
ttc agt ggc ttc atg gtg gct gga ggc ctg atg ttg agc agt ttt gct          701
Phe Ser Gly Phe Met Val Ala Gly Gly Leu Met Leu Ser Ser Phe Ala
     85                  90                  95
ccc aat atc tac ttt ctg ttt ttt tcc tat ggc att gtt gta ggt tca          749
Pro Asn Ile Tyr Phe Leu Phe Phe Ser Tyr Gly Ile Val Val Gly Ser
100                 105                 110                 115
agc gtt ggc ctt ttc ata tat gct gct ctg cag agg atg ctg gtt gag          797
Ser Val Gly Leu Phe Ile Tyr Ala Ala Leu Gln Arg Met Leu Val Glu
                120                 125                 130
ttc tat gga ctg gat gga tgc ttg ctg att gtg ggt gct tta gct tta          845
Phe Tyr Gly Leu Asp Gly Cys Leu Leu Ile Val Gly Ala Leu Ala Leu
            135                 140                 145
aat ata tta gcc tgt ggc agt ctg atg aga ccc ctc caa tct tct gat          893
Asn Ile Leu Ala Cys Gly Ser Leu Met Arg Pro Leu Gln Ser Ser Asp
        150                 155                 160
tgt cct ttg cct aaa aaa ata gct cca gaa gat cta cca gat aaa tac          941
Cys Pro Leu Pro Lys Lys Ile Ala Pro Glu Asp Leu Pro Asp Lys Tyr
    165                 170                 175
tcc att tac aat gaa aaa gga aag aat ctg gaa gaa aac ata aac att          989
Ser Ile Tyr Asn Glu Lys Gly Lys Asn Leu Glu Glu Asn Ile Asn Ile
180                 185                 190                 195
ctt gac aag agc tac agt agt gag gaa aaa tgc agg atc acg tta gcc         1037
Leu Asp Lys Ser Tyr Ser Ser Glu Glu Lys Cys Arg Ile Thr Leu Ala
                200                 205                 210
aat ggt gac tgg aaa caa gac agc cta ctt cat aaa aac ccc aca gtg         1085
Asn Gly Asp Trp Lys Gln Asp Ser Leu Leu His Lys Asn Pro Thr Val
            215                 220                 225
aca cac aca aaa gag cct gaa acg tac aaa aag aaa gtt gca gaa cag         1133
Thr His Thr Lys Glu Pro Glu Thr Tyr Lys Lys Lys Val Ala Glu Gln
        230                 235                 240
aca tat ttt tgc aaa cag ctt gcc aag agg aag tgg cag tta tat aaa         1181
Thr Tyr Phe Cys Lys Gln Leu Ala Lys Arg Lys Trp Gln Leu Tyr Lys
    245                 250                 255
aac tac tgt ggt gaa act gtg gct ctt ttt aaa aac aaa gta ttt tca         1229
Asn Tyr Cys Gly Glu Thr Val Ala Leu Phe Lys Asn Lys Val Phe Ser
260                 265                 270                 275
gcc ctt ttc att gct atc tta ctc ttt gac atc gga ggg ttt cca cct         1277
Ala Leu Phe Ile Ala Ile Leu Leu Phe Asp Ile Gly Gly Phe Pro Pro
                280                 285                 290
tca tta ctt atg gaa gat gta gca aga agt tca aac gtg aaa gaa gaa         1325
Ser Leu Leu Met Glu Asp Val Ala Arg Ser Ser Asn Val Lys Glu Glu
            295                 300                 305
gag ttt att atg cca ctt att tcc att ata ggc att atg aca gca gtt         1373
Glu Phe Ile Met Pro Leu Ile Ser Ile Ile Gly Ile Met Thr Ala Val
        310                 315                 320
ggt aaa ctg ctt tta ggg ata ctg gct gac ttc aag tgg att aat acc         1421
Gly Lys Leu Leu Leu Gly Ile Leu Ala Asp Phe Lys Trp Ile Asn Thr
    325                 330                 335
ttg tat ctt tat gtt gct acc tta atc atc atg ggc cta gcc ttg tgt         1469
Leu Tyr Leu Tyr Val Ala Thr Leu Ile Ile Met Gly Leu Ala Leu Cys
340                 345                 350                 355
gca att cca ttt gcc aaa agc tat gtc aca ttg gcg ttg ctt tct ggg         1517
Ala Ile Pro Phe Ala Lys Ser Tyr Val Thr Leu Ala Leu Leu Ser Gly
                360                 365                 370
atc cta ggg ttt ctt act ggt aat tgg tcc atc ttt cca tat gtg acc         1565
Ile Leu Gly Phe Leu Thr Gly Asn Trp Ser Ile Phe Pro Tyr Val Thr
            375                 380                 385
acg aag act gtg gga att gaa aaa tta gcc cat gcc tat ggg ata tta         1613
Thr Lys Thr Val Gly Ile Glu Lys Leu Ala His Ala Tyr Gly Ile Leu
        390                 395                 400
atg ttc ttt gct gga ctt gga aat agc cta gga cca ccc atc gtt ggt         1661
Met Phe Phe Ala Gly Leu Gly Asn Ser Leu Gly Pro Pro Ile Val Gly
    405                 410                 415
tgg ttt tat gac tgg acc cag acc tat gat att gca ttt tat ttt agt         1709
Trp Phe Tyr Asp Trp Thr Gln Thr Tyr Asp Ile Ala Phe Tyr Phe Ser
420                 425                 430                 435
ggc ttc tgc gtc ctg ctg gga ggt ttt att ctg ctg ctg gca gcc ttg         1757
Gly Phe Cys Val Leu Leu Gly Gly Phe Ile Leu Leu Leu Ala Ala Leu
                440                 445                 450
ccc tct tgg gat aca tgc aac aag caa ctc ccc aag cca gct cca aca         1805
Pro Ser Trp Asp Thr Cys Asn Lys Gln Leu Pro Lys Pro Ala Pro Thr
            455                 460                 465
act ttc ttg tac aaa gtt gcc tct aat gtt          tagaa gaatattgga       1850
Thr Phe Leu Tyr Lys Val Ala Ser Asn Val
        470                 475
agacactatt tttgctattt tataccatat agcaacgata ttttaacaga tctcaagcaa       1910
attttctaga gtcaagacta ttttctcata gcaaaatttc acaatgactg actctgaatg       1970
aattattttt ttttttttat atatcctatt ttttatgtag tgtatgcgta gcctctatct       2030
cgtatttttt tctatttctc ctccccacac catcaatggg actattctgt tttgctgtta       2090
ttcactagtt cttaacattg taaaaagttt gaccagcctc agaaggcttt ctctgtgtaa       2150
agaagtataa tttctctgct gactccattt aatccactgc aaggcaccta gagagactgc       2210
tcctatttta aaagtgatgc aagcatcatg ataagatatg tgtgaagccc actaggaaat       2270
aaatcattct cttctctatg tttgacttgc tagtaaacag aagacttcaa gccagccagg       2330
aaattaaagt ggcgactaaa acagccttaa gaattgcagt ggagcaaatt ggtcattttt       2390
taaaaaaata tattttaacc tacagtcacc agttttcatt attctattta cctcactgaa       2450
gtactcgcat gttgtttggt acccactgag caactgtttc agttcctaag gtatttgctg       2510
agatgtgggt gaactccaaa tggagaagta gtcactgtag actttcttca tggttgacca       2570
ctccaacctt gctcactttt gcttcttggc catccactca gctgatgttt cctgggaagt       2630
gctaatttta cctgtttcca aattggaaac acatttctca atcattccgt tctggcaaat       2690
gggaaacatc catttgcttt gggcacagtg gggatgggct gcaagttctt gcatatcctc       2750
ccagtgaagc atttatttgc tactatcaga ttttaccact atcaaatata attcaagggc       2810
agaattaaac gtgagtgtgt gtgtgtgtgt gtgtgtgtgt gctatgcatg ctctaagtct       2870
gcatgggata tgggaatgga aaagggcaat aagaaattaa tacccttatg cagttgcatt       2930
taaccttaag aaaaatgtcc ttgggataaa ctccaatgtt taatacattg attttttttc       2990
taaagaaatg ggttttaaac tttggtatgc atcagaattc cctatagatc tttttgaaaa       3050
tataggtacc tgggtatcac acatagaact tttaattctg ctggtgtagg ctgttgccca       3110
aacatctata attttactga gctcttcaag tgattctgat aacacagcct gg               3162
<210>8
<211>477
<212>PRT
<213>智人(Homo sapiens)
<400>8
Met Glu Leu Lys Lys Ser Pro Asp Gly Gly Trp Gly Trp Val Ile Val
  1               5                  10                  15
Phe Val Ser Phe Leu Thr Gln Phe Leu Cys Tyr Gly Ser Pro Leu Ala
             20                  25                  30
Val Gly Val Leu Tyr Ile Glu Trp Leu Asp Ala Phe Gly Glu Gly Lys
         35                  40                  45
Gly Lys Thr Ala Trp Val Gly Ser Leu Ala Ser Gly Val Gly Leu Leu
     50                  55                  60
Ala Ser Pro Val Cys Ser Leu Cys Val Ser Ser Phe Gly Ala Arg Pro
 65                  70                  75                  80
Val Thr Ile Phe Ser Gly Phe Met Val Ala Gly Gly Leu Met Leu Ser
                 85                  90                  95
Ser Phe Ala Pro Asn Ile Tyr Phe Leu Phe Phe Ser Tyr Gly Ile Val
            100                 105                 110
Val Gly Ser Ser Val Gly Leu Phe Ile Tyr Ala Ala Leu Gln Arg Met
        115                 120                 125
Leu Val Glu Phe Tyr Gly Leu Asp Gly Cys Leu Leu Ile Val Gly Ala
    130                 135                 140
Leu Ala Leu Asn Ile Leu Ala Cys Gly Ser Leu Met Arg Pro Leu Gln
145                 150                 155                 160
Ser Ser Asp Cys Pro Leu Pro Lys Lys Ile Ala Pro Glu Asp Leu Pro
                165                 170                 175
Asp Lys Tyr Ser Ile Tyr Asn Glu Lys Gly Lys Asn Leu Glu Glu Asn
            180                 185                 190
Ile Asn Ile Leu Asp Lys Ser Tyr Ser Ser Glu Glu Lys Cys Arg Ile
        195                 200                 205
Thr Leu Ala Asn Gly Asp Trp Lys Gln Asp Ser Leu Leu His Lys Asn
    210                 215                 220
Pro Thr Val Thr His Thr Lys Glu Pro Glu Thr Tyr Lys Lys Lys Val
225                 230                 235                 240
Ala Glu Gln Thr Tyr Phe Cys Lys Gln Leu Ala Lys Arg Lys Trp Gln
                245                 250                 255
Leu Tyr Lys Asn Tyr Cys Gly Glu Thr Val Ala Leu Phe Lys Asn Lys
            260                 265                 270
Val Phe Ser Ala Leu Phe Ile Ala Ile Leu Leu Phe Asp Ile Gly Gly
        275                 280                 285
Phe Pro Pro Ser Leu Leu Met Glu Asp Val Ala Arg Ser Ser Asn Val
    290                 295                 300
Lys Glu Glu Glu Phe Ile Met Pro Leu Ile Ser Ile Ile Gly Ile Met
305                 310                 315                 320
Thr Ala Val Gly Lys Leu Leu Leu Gly Ile Leu Ala Asp Phe Lys Trp
                325                 330                 335
Ile Asn Thr Leu Tyr Leu Tyr Val Ala Thr Leu Ile Ile Met Gly Leu
            340                 345                 350
Ala Leu Cys Ala Ile Pro Phe Ala Lys Ser Tyr Val Thr Leu A1a Leu
        355                 360                 365
Leu Ser Gly Ile Leu Gly Phe Leu Thr Gly Asn Trp Ser Ile Phe Pro
    370                 375                 380
Tyr Val Thr Thr Lys Thr Val Gly Ile Glu Lys Leu Ala His Ala Tyr
385                 390                 395                 400
Gly Ile Leu Met Phe Phe Ala Gly Leu Gly Asn Ser Leu Gly Pro Pro
                405                 410                 415
Ile Val Gly Trp Phe Tyr Asp Trp Thr Gln Thr Tyr Asp Ile Ala Phe
            420                 425                 430
Tyr Phe Ser Gly Phe Cys Val Leu Leu Gly 61y Phe Ile Leu Leu Leu
        435                 440                 445
Ala Ala Leu Pro Ser Trp Asp Thr Cys Asn Lys Gln Leu Pro Lys Pro
    450                 455                 460
Ala Pro Thr Thr Phe Leu Tyr Lys Val Ala Ser Asn Val
465                 470                 475
<210>9
<211>4891
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(89)..(1150)
<223>Clone LBFLl31
<400>9
acgcctggtt cccgggaaga ctcgccagca ccagggggtg ggggagtgcg agctgaaagc         60
tgctggagag tgagcagccc tagcaggg   atg gac atg atg ctg ttg gtg cag         112
                                 Met Asp Met Met Leu Leu Val Gln
                                   1               5
ggt gct tgt tgc tcg aac cag tgg ctg gcg gcg gtg ctc ctc agc ctg          160
Gly Ala Cys Cys Ser Asn Gln Trp Leu Ala Ala Val Leu Leu Ser Leu
     10                  15                  20
tgc tgc ctg cta ccc tcc tgc ctc ccg gct gga cag agt gtg gac ttc          208
Cys Cys Leu Leu Pro Ser Cys Leu Pro Ala Gly Gln Ser Val Asp Phe
 25                  30                  35                  40
ccc tgg gcg gcc gtg gac aac atg atg gtc aga aaa ggg gac acg gcg          256
Pro Trp Ala Ala Val Asp Asn Met Met Val Arg Lys Gly Asp Thr Ala
                 45                  50                  55
gtg ctt agg tgt tat ttg gaa gat gga gct tca aag ggt gcc tgg ctg          304
Val Leu Arg Cys Tyr Leu Glu Asp Gly Ala Ser Lys Gly Ala Trp Leu
             60                  65                  70
aac cgg tca agt att att ttt gcg gga ggt gat aag tgg tca gtg gat          352
Asn Arg Ser Ser Ile Ile Phe Ala Gly Gly Asp Lys Trp Ser Val Asp
         75                  80                  85
cct cga gtt tca att tca aca ttg aat aaa agg gac tac agc ctc cag          400
Pro Arg Val Ser Ile Ser Thr Leu Asn Lys Arg Asp Tyr Ser Leu Gln
     90                  95                 100
ata cag aat gta gat gtg aca gat gat ggc cca tac acg tgt tct gtt          448
Ile Gln Asn Val Asp Val Thr Asp Asp Gly Pro Tyr Thr Cys Ser Val
105                 110                 115                 120
cag act caa cat aca ccc aga aca atg cag gtg cat cta act gtg caa          496
Gln Thr Gln His Thr Pro Arg Thr Met Gln Val His Leu Thr Val Gln
                125                 130                 135
gtt cct cct aag ata tat gac atc tca aat gat atg acc gtc aat gaa          544
Val Pro Pro Lys Ile Tyr Asp Ile Ser Asn Asp Met Thr Val Asn Glu
            140                 145                 150
gga acc aac gtc act ctt act tgt ttg gcc act ggg aaa cca gag cct          592
Gly Thr Asn Val Thr Leu Thr Cys Leu Ala Thr Gly Lys Pro Glu Pro
        155                 160                 165
tcc att tct tgg cga cac atc tcc cca tca gcg aaa cca ttt gaa aat          640
Ser Ile Ser Trp Arg His Ile Ser Pro Ser Ala Lys Pro Phe Glu Asn
    170                 175                 180
gga caa tat ttg gac att tat gga att aca agg gac cag gct ggg gaa          688
Gly Gln Tyr Leu Asp Ile Tyr Gly Ile Thr Arg Asp Gln Ala Gly Glu
185                 190                 195                 200
tat gaa tgc agt gcg gaa aat gat gtg tca ttc cca gat gtg agg aaa          736
Tyr Glu Cys Ser Ala Glu Asn Asp Val Ser Phe Pro Asp Val Arg Lys
                205                 210                 215
gta aaa gtt gtt gtc aac ttt gct cct act att cag gaa att aaa tct          784
Val Lys Val Val Val Asn Phe Ala Pro Thr Ile Gln Glu Ile Lys Ser
            220                 225                 230
ggc acc gtg acc ccc gga cgc agt ggc ctg ata aga tgt gaa ggt gca          832
Gly Thr Val Thr Pro Gly Arg Ser Gly Leu Ile Arg Cys Glu Gly Ala
        235                 240                 245
ggt gtg ccg cct cca gcc ttt gaa tgg tac aaa gga gag aag aag ctc          880
Gly Val Pro Pro Pro Ala Phe Glu Trp Tyr Lys Gly Glu Lys Lys Leu
    250                 255                 260
ttc aat ggc caa caa gga att att att caa aat ttt agc aca aga tcc          928
Phe Asn Gly Gln Gln Gly Ile Ile Ile Gln Asn Phe Ser Thr Arg Ser
265                 270                 275                 280
att ctc act gtt acc aac gtg aca cag gag cac ttc ggc aat tat act          976
Ile Leu Thr Val Thr Asn Val Thr Gln Glu His Phe Gly Asn Tyr Thr
                285                 290                 295
tgt gtg gct gcc aac aag cta ggc aca acc aat gcg agc ctg cct ctt         1024
Cys Val Ala Ala Asn Lys Leu Gly Thr Thr Asn Ala Ser Leu Pro Leu
            300                 305                 310
aac cct cca agt aca gcc cag tat gga att acc ggg agc gct gat gtt         1072
Asn Pro Pro Ser Thr Ala Gln Tyr Gly Ile Thr Gly Ser Ala Asp Val
        315                 320                 325
ctt ttc tcc tgc tgg tac ctt gtg ttg aca ctg tcc tct ttc acc agc         1120
Leu Phe Ser Cys Trp Tyr Leu Val Leu Thr Leu Ser Ser Phe Thr Ser
    330                 335                 340
ata ttc tac ctg aag aat gcc att cta caa     taaattcaaa gacccataaa       1170
Ile Phe Tyr Leu Lys Asn Ala Ile Leu Gln
345                 350
aggcttttaa ggattctctg aaagtgctga tggctggatc caatctggta cagtttgtta       1230
aaagcagcgt gggatataat cagcagtgct tacatgggga tgatcgcctt ctgtagaatt       1290
gctcattatg taaatacttt aattctactc ttttttgatt agctacatta ccttgtgaag       1350
cagtacacat tgtccttttt ttaagacgtg aaagctctga aattactttt agaggatatt       1410
aattgtgatt tcatgtttgt aatctacaac ttttcaaaag cattcagtca tggtctgcta       1470
ggttgcaggc tgtagtttac aaaaacgaat attgcagtga atatgtgatt ctttaaggct       1530
gcaatacaag cattcagttc cctgtttcaa taagagtcaa tccacattta caaagatgca       1590
tttttttctt ttttgataaa aaagcaaata atattgcctt cagattattt cttcaaaata       1650
taacacatat ctagattttt ctgctcgcat gatattcagg tttcaggaat gagccttgta       1710
atataactgg ctgtgcagct ctgcttctct ttcctgtaag ttcagcatgg gtgtgccttc       1770
atacaataat atttttctct ttgtctccaa ctaatataaa atgttttgct aaatcttaca       1830
atttgaaagt aaaaataaac cagagtgatc aagttaaacc atacactatc tctaagtaac       1890
gaaggagcta ttggactgta aaaatctctt cctgcactga caatggggtt tgagaatttt       1950
gccccacact aactcagttc ttgtgatgag agacaattta ataacagtat agtaaatata       2010
ccatatgatt tctttagttg tagctaaatg ttagatccac cgtgggaaat tattcccttt       2070
aaaatgacag cacagtccac tcaaaggatt gcctagcaat acagcatctt ttcctttcac       2130
tagtccaagc caaaaatttt aagatgattt gtcagaaagg gcacaaagtc ctatcaccta       2190
atattacaag agttggtaag cgctcatcat taattttatt ttgtggcagc taagttagta       2250
tgacagaggc agtgctcctg tggacaggag cattttgcat attttccatc tgaaagtatc       2310
actcagttga tagtctggaa tgcatgttat atattttaaa acttccaaaa tatattataa       2370
caaacattct atatcggtat gtagcagacc aatctctaaa atagctaatt cttcaataaa       2430
atctttctat atagccattt cagtgcaaac aagtaaaatc aaaaaagacc atcctttatt       2490
tttccttaca tgatatatgt aagatgcgat caaataaaga caaaacacca gtgatgagaa       2550
tatcttaaga taagtaatta tcaaattatt gtgaatgtta aattatttct actataaaga       2610
agcaaaacta catttttgaa ggaaaatgct gttactctaa cattaattta caggaatagt       2670
ttgatggttt cactctttac taaagaaagg ccatcacctt gaaagccatt ttacaggttt       2730
gatgaagtta ccaatttcag tacacctaaa tttctacaaa tagtcccctt ttacaagttg       2790
taacaacaaa gaccctataa taaaattaga tacaagaaat tttgcagtgg ttatacatat       2850
ttgagatatc tagtatgttg ccctagcagg gatggcttaa aaactgtgat tttttttctt       2910
caagtaaaac ttagtcccaa agtacatcat aaatcaattt taactagaaa aatgaatctt       2970
aaatgagggg acataagtat actctttcca caaaatggca ataataaggc ataaagctag       3030
taaatctact aactgtaata aatgtatgac attattttga ttgatacatt aaaaaagagt       3090
ttttagaaca aatatggcat ttaactttat tatttatttg cttttaagaa atattctttg       3150
tggaattgtt gaataaacta taaaatatta ttttgtattg cagctttaaa gtggcacact       3210
ccataataat ctacctacta gaaatagtgg tgctaccaca aaaaatgtta accatcagta       3270
ccattgtttg ggagaaagaa acaggtcaag aatgcatatt attcagtgac cgctttccta       3330
gagttaaaat acctcctctt tgtaaggttt gtaggtaaat tgaggtataa actatggatg       3390
aaccaaataa ttagttcaaa gtgttgtcat gattccaaat ttgtggagtc tggtgttttt       3450
accatagaat gtgacagaag tacagtcata gctcagtagc tatatgtatt tgcctttatg       3510
ttagaagaga ctttcttgag tgacattttt aaatagagga ggtattcact atgtttttct       3570
gtatcacagc agcattccta gtccttaggc cctcggacag agtgaaatca tgagtattta       3630
tgagttcaat attgtcaaat aaggctacag tatttgcttt tttgtgtgaa tgtattgcat       3690
ataatgttca agtagatgat tttacattta tggacatata aaacgtctga ttaccccatt       3750
ttatcagtcc tgactgtaca agattgttgc aatttcagaa tagcagtttt ataaattgat       3810
ttatctttta atctataaca atttgtgtta gctgttcatt tcaggattat attttctaca       3870
agttccactt gtgggactcc ttttgttgcc cctatttttt tttaaagaag gaagaaagaa       3930
aaatgagtag cagtttaaaa atgagaatgg agagaaaaga aaaagaatga aaaggaaagg       3990
cagtaaagag ggaaaaaaaa ggaaggatgg aaggaatgaa ggaaggaagg gaggaagggg       4050
agaaggtagg aagaaagaaa ggatgagagg gaaggaagaa tcagagtatt agggtagtta       4110
acttacacat ttgcattctt agttatactg caagtggtgt aactatgttt ttcaatgatc       4170
gcatttgaaa cataagtcct attataccat taagttccta ttatgcagca attatataat       4230
aaaaagtact gcccaagtta tagtaatgtg ggtgtttttg agacactaaa agatttgaga       4290
gggagaattt caaacttaaa gccacttttg gggggtttat aacttaactg aaaaattaat       4350
gcttcatcat aacatttaag ctatatctag aaagtagact ggagaactga gaaaattacc       4410
caggtaattc agggaaaaaa aaaaaatata tatatatata aataccccta catttgaagt       4470
cagaaaactc tgaaaaactg aattatcaaa gtcaatcatc tataatgatc aaatttactg       4530
aacaattgtt aatttatcca ttgtgcttag ctttgtgaca cagccaaaag ttacctattt       4590
aatcttttca ataaaaattg ttttttgaaa tccagaaatg atttaaaaag aggtcaggtt       4650
tttaactatt tattgaagta tgtggatgtc cagtatttca atagatatga atatgaataa       4710
atggtatgcc ttaagattct ttgaatatgt atttacttta aagactggaa aaagctcttc       4770
ctgtctttta gtaaacatcc atatttcata acctgatgta aaatatgttg tactgtttcc       4830
aataggggaa tataaactca gtttatcaat taaaaaaaaa aaaaaaaaaa aaaaaaaaaa       4890
a                                                                       4891
<210>10
<211>354
<212>PRT
<213>智人(Homo sapiens)
<400>10
Met Asp Met Met Leu Leu Val Gln Gly Ala Cys Cys Ser Asn Gln Trp
  1               5                  10                  15
Leu Ala Ala Val Leu Leu Ser Leu Cys Cys Leu Leu Pro Ser Cys Leu
             20                  25                  30
Pro Ala Gly Gln Ser Val Asp Phe Pro Trp Ala Ala Val Asp Asn Met
         35                  40                  45
Met Val Arg Lys Gly Asp Thr Ala Val Leu Arg Cys Tyr Leu Glu Asp
     50                  55                  60
Gly Ala Ser Lys Gly Ala Trp Leu Asn Arg Ser Ser Ile Ile Phe Ala
 65                  70                  75                  80
Gly Gly Asp Lys Trp Ser Val Asp Pro Arg Val Ser Ile Ser Thr Leu
                 85                  90                  95
Asn Lys Arg Asp Tyr Ser Leu Gln Ile Gln Asn Val Asp Val Thr Asp
            100                 105                 110
Asp Gly Pro Tyr Thr Cys Ser Val Gln Thr Gln His Thr Pro Arg Thr
        115                 120                 125
Met Gln Val His Leu Thr Val Gln Val Pro Pro Lys Ile Tyr Asp Ile
    130                 135                 140
Ser Asn Asp Met Thr Val Asn Glu Gly Thr Asn Val Thr Leu Thr Cys
145                 150                 155                 160
Leu Ala Thr Gly Lys Pro Glu Pro Ser Ile Ser Trp Arg His Ile Ser
                165                 170                 175
Pro Ser Ala Lys Pro Phe Glu Asn Gly Gln Tyr Leu Asp Ile Tyr Gly
            180                 185                 190
Ile Thr Arg Asp Gln Ala Gly Glu Tyr Glu Cys Ser Ala Glu Asn Asp
        195                 200                 205
Val Ser Phe Pro Asp Val Arg Lys Val Lys Val Val Val Asn Phe Ala
    210                 215                 220
Pro Thr Ile Gln Glu Ile Lys Ser Gly Thr Val Thr Pro Gly Arg Ser
225                 230                 235                 240
Gly Leu Ile Arg Cys Glu Gly Ala Gly Val Pro Pro Pro Ala Phe Glu
                245                 250                 255
Trp Tyr Lys Gly Glu Lys Lys Leu Phe Asn Gly Gln Gln Gly Ile Ile
            260                 265                 270
Ile Gln Asn Phe Ser Thr Arg Ser Ile Leu Thr Val Thr Asn Val Thr
        275                 280                 285
Gln Glu His Phe Gly Asn Tyr Thr Cys Val Ala Ala Asn Lys Leu Gly
    290                 295                 300
Thr Thr Asn Ala Ser Leu Pro Leu Asn Pro Pro Ser Thr Ala Gln Tyr
305                 310                 315                 320
Gly Ile Thr Gly Ser Ala Asp Val Leu Phe Ser Cys Trp Tyr Leu Val
                325                 330                 335
Leu Thr Leu Ser Ser Phe Thr Ser Ile Phe Tyr Leu Lys Asn Ala Ile
            340                 345                 350
Leu Gln
<210>11
<211>3098
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(223)..(1569)
<223>LBFL164
<400>11
gtttatcgcg cacatctcgc ggcgaggagg agaggccgga agggcgcccc agccccaagg         60
ctcctgcccc gcctgggcct ccggctttcg tttccccgca acgcttcgct ttcgtttccc        120
gctggcgcct ggctccctcc gggtttcgtt tcccgccggc gcctggctcc cgccaggttt        180
cgtttccgag gcggggccga gggcggcgtc gctgaggcgc cc         atg gcc ttc       231
                                                       Met Ala Phe
                                                         1
gcc cgc cgg ctc ctg cgc ggg cca ctg tcg ggg ccg ctg ctc ggg cgg          279
Ala Arg Arg Leu Leu Arg Gly Pro Leu Ser Gly Pro Leu Leu Gly Arg
      5                  10                  15
cgc ggg gtc tgc gct ggg gcc atg gct ccg ccg cgc cgc ttc gtc ctg          327
Arg Gly Val Cys Ala Gly Ala Met Ala Pro Pro Arg Arg Phe Val Leu
 20                  25                  30                  35
gag ctt ccc gac tgc acc ctg gct cac ttc gcc cta ggc gcc gac gcc          375
Glu Leu Pro Asp Cys Thr Leu Ala His Phe Ala Leu Gly Ala Asp Ala
                 40                  45                  50
ccc ggc gac gca gac gcc ccc gac ccc cgc ctg gcg gcg ctg ctg ggg          423
Pro Gly Asp Ala Asp Ala Pro Asp Pro Arg Leu Ala Ala Leu Leu Gly
             55                  60                  65
ccc ccg gag cgc agc tac tcg ctg tgc gtg ccc gtg acc ccg gac gcc          471
Pro Pro Glu Arg Ser Tyr Ser Leu Cys Val Pro Val Thr Pro Asp Ala
         70                  75                  80
ggc tgc ggg gcc cgg gtc cgg gcg gcg cgg ctg cac cag cgc ctg ctg          519
Gly Cys Gly Ala Arg Val Arg Ala Ala Arg Leu His Gln Arg Leu Leu
     85                  90                  95
cac cag ctg cgc cgc ggc ccc ttc cag cgg tgc cag ctg ctc agg ctg          567
His Gln Leu Arg Arg Gly Pro Phe Gln Arg Cys Gln Leu Leu Arg Leu
100                 105                 110                 115
ctc tgc tac tgc ccg ggc ggc cag gcc ggc ggc gca cag caa ggc ttc          615
Leu Cys Tyr Cys Pro Gly Gly Gln Ala Gly Gly Ala Gln Gln Gly Phe
                120                 125                 130
ctg ctg cgc gac ccc ctg gat gac cct gac acc cgg caa gcg ctg ctc          663
Leu Leu Arg Asp Pro Leu Asp Asp Pro Asp Thr Arg Gln Ala Leu Leu
            135                 140                 145
gag ctg ctg ggc gcc tgc cag gag gca cca cgc ccg cac ttg ggc gag          711
Glu Leu Leu Gly Ala Cys Gln Glu Ala Pro Arg Pro His Leu Gly Glu
        150                 155                 160
ttc gag gcc gac ccg cgc ggc cag ctg tgg cag cgc ctc tgg gag gtg          759
Phe Glu Ala Asp Pro Arg Gly Gln Leu Trp Gln Arg Leu Trp Glu Val
    165                 170                 175
caa gac ggc agg cgg ctg cag gtg ggc tgc gca cag gtc gtg ccc gtc          807
Gln Asp Gly Arg Arg Leu Gln Val Gly Cys Ala Gln Val Val Pro Val
180                 185                 190                 195
ccg gag ccc ccg ctg cac ccg gtg gtg cca gac ttg ccc agt tcc gtg          855
Pro Glu Pro Pro Leu His Pro Val Val Pro Asp Leu Pro Ser Ser Val
                200                 205                 210
gtc ttc ccg gac cgg gaa gcc gcc cgg gcc gtt ttg gag gag tgt acc          903
Val Phe Pro Asp Arg Glu Ala Ala Arg Ala Val Leu Glu Glu Cys Thr
            215                 220                 225
tcc ttt att cct gaa gcc cgg gca gtg ctt gac ctg gtc gac cag tgc          951
Ser Phe Ile Pro Glu Ala Arg Ala Val Leu Asp Leu Val Asp Gln Cys
        230                 235                 240
cca aaa cag atc cag aaa gga aag ttc cag gtt gtt gcc atc gaa gga          999
Pro Lys Gln Ile Gln Lys Gly Lys Phe Gln Val Val Ala Ile Glu Gly
    245                 250                 255
ctg gat gcc acg ggt aaa acc acg gtg acc cag tca gtg gca gat tca         1047
Leu Asp Ala Thr Gly Lys Thr Thr Val Thr Gln Ser Val Ala Asp Ser
260                 265                 270                 275
ctt aag gct gtc ctc tta aag tca cca ccc tct tgc att ggc cag tgg         1095
Leu Lys Ala Val Leu Leu Lys Ser Pro Pro Ser Cys Ile Gly Gln Trp
                280                 285                 290
agg aag atc ttt gat gat gaa cca act atc att aga aga gct ttt tac         1143
Arg Lys Ile Phe Asp Asp Glu Pro Thr Ile Ile Arg Arg Ala Phe Tyr
            295                 300                 305
tct ttg ggc aat tat att gtg gcc tcc gaa ata gct aaa gaa tct gcc         1191
Ser Leu Gly Asn Tyr Ile Val Ala Ser Glu Ile Ala Lys Glu Ser Ala
        310                 315                 320
aaa tct cct gtg att gta gac agg tac tgg cac agc acg gcc acc tat         1239
Lys Ser Pro Val Ile Val Asp Arg Tyr Trp His Ser Thr Ala Thr Tyr
    325                 330                 335
gct ata gcc act gag gtg agt ggg ggt ctc cag cac ctg ccc cca gcc         1287
Ala Ile Ala Thr Glu Val Ser Gly Gly Leu Gln His Leu Pro Pro Ala
340                 345                 350                 355
cat cac cct gtg tac cag tgg cca gag gac ctg ctc aaa cct gac ctt         1335
His His Pro Val Tyr Gln Trp Pro Glu Asp Leu Leu Lys Pro Asp Leu
                360                 365                 370
atc ctg ctg ctc act gtg agt cct gag gag agg ttg cag agg ctg cag         1383
Ile Leu Leu Leu Thr Val Ser Pro Glu Glu Arg Leu Gln Arg Leu Gln
            375                 380                 385
ggc cgg ggc atg gag aag acc agg gaa gaa gca gaa ctt gag gcc aac         1431
Gly Arg Gly Met Glu Lys Thr Arg Glu Glu Ala Glu Leu Glu Ala Asn
        390                 395                 400
agt gtg ttt cgt caa aag gta gaa atg tcc tac cag cgg atg gag aat         1479
Ser Val Phe Arg Gln Lys Val Glu Met Ser Tyr Gln Arg Met Glu Asn
    405                 410                 415
cct ggc tgc cat gtg gtt gat gcc agc ccc tcc aga gaa agg gtc ctg         1527
Pro Gly Cys His Val Val Asp Ala Ser Pro Ser Arg Glu Arg Val Leu
420                 425                 430                 435
cag acg gta tta agc cta atc cag aat agt ttt agt gaa ccg         t       1570
Gln Thr Val Leu Ser Leu Ile Gln Asn Ser Phe Ser Glu Pro
                440                 445
agttactctg gccaggtgcc acgtctaact agattagatg ttgtttgaaa catctacatc       1630
caccatttgt tatgcagtgt tcccaaattt ctgttctaca agcatgttgt gtggcagaaa       1690
actggagacc aggcatctta attttacttc agccatcgta ccctcttctg actgatggac       1750
ccgtcatcac aaaggtccct ctcatcatgt tccagtgaga ggccagcgat tgctttcttc       1810
ctggcatagt aaacattttc ttggaacata tgtttcactt aatcactacc aaatatctgg       1870
aagacctgtc ttactcagac agcaccaggt gtacagaagc agcagacaag atcttccaga       1930
tcagcaggga gaccccggag cctctgcttc tcctacactg gcatgctgat gagatcgtga       1990
catgcccaca ttggcttctt ccacatctgg ttgcactcgt catgatgggc tcgctgcatc       2050
tccctcagtc ccaaattcta gagccaagtg ttcctgcaga ggctgtctat gtgtcctggc       2110
tgcccaagga cactcctgca gagccatttt tgggtaagga acacttacaa agaaggcatt       2170
gatcttgtgt ctgaggctca gagccctttt gataggcttc tgagtcatat ataaagacat       2230
tcaagccaag atgctccaac tgcaaatata ccaaccttct ctgaattata ttttgcttat       2290
ttatatttct tttctttttt tctaaagtat ggctctgaat agaatgcaca ttttccattg       2350
aactggatgc atttcattta gccaatccag taatttattt atattaatct atacaatatg       2410
tttcctcagc ataggagcta tgattcatta attaaaagtg gagtcaaaac gctaaatgca       2470
atgtttgttg tgtattttca ttacacaaac ttaatttgtc ttgttaaata agtacagtgg       2530
atcttggagt gggatttctt ggtaaattat cttgcacttg aatgtctcat gattacatat       2590
gaaatcgctt tgacatatct ttagacagaa aaaagtagct gagtgagggg gaaattatag       2650
agctgtgtga ctttagggag taggttgaac caggtgatta cctaaaattc cttccagttc       2710
aaaggcagat aaatctgtaa attattttat cctatctacc atttcttaag aagacattac       2770
tccaaaataa ttaaatttaa ggctttatca ggtctgcata tagaatctta aattctaata       2830
aagtttcatg ttaatgtcat aggattttta aaagagctat aggtaatttc tatataatat       2890
gtgtatatta aaatgtaatt gatttcagtt gaaagtattt taaagctgat aaatagcatt       2950
agggttcttt gcaatgtggt atctagctgt attattggtt ttatttactt taaacatttt       3010
gaaaagctta tactggcagc ctagaaaaac aaacaattaa tgtatcttta tgtccctggc       3070
acatgaataa actttgctgt ggtttact                                          3098
<210>12
<211>449
<212>PRT
<213>智人(Homo sapiens)
<400>12
Met Ala Phe Ala Arg Arg Leu Leu Arg Gly Pro Leu Ser Gly Pro Leu
  1               5                  10                  15
Leu Gly Arg Arg Gly Val Cys Ala Gly Ala Met Ala Pro Pro Arg Arg
             20                  25                  30
Phe Val Leu Glu Leu Pro Asp Cys Thr Leu Ala His Phe Ala Leu Gly
         35                  40                  45
Ala Asp Ala Pro Gly Asp Ala Asp Ala Pro Asp Pro Arg Leu Ala Ala
     50                  55                  60
Leu Leu Gly Pro Pro Glu Arg Ser Tyr Ser Leu Cys Val Pro Val Thr
 65                  70                  75                  80
Pro Asp Ala Gly Cys Gly Ala Arg Val Arg Ala Ala Arg Leu His Gln
                 85                  90                  95
Arg Leu Leu His Gln Leu Arg Arg Gly Pro Phe Gln Arg Cys Gln Leu
            100                 105                 110
Leu Arg Leu Leu Cys Tyr Cys Pro Gly Gly Gln Ala Gly Gly Ala Gln
        115                 120                 125
G1n Gly Phe Leu Leu Arg Asp Pro Leu Asp Asp Pro Asp Thr Arg Gln
    130                 135                 140
Ala Leu Leu Glu Leu Leu Gly Ala Cys Gln Glu Ala Pro Arg Pro His
145                 150                 155                 160
Leu Gly Glu Phe Glu Ala Asp Pro Arg Gly Gln Leu Trp Gln Arg Leu
                165                 170                 175
Trp Glu Val Gln Asp Gly Arg Arg Leu Gln Val Gly Cys Ala Gln Val
            180                 185                 190
Val Pro Val Pro Glu Pro Pro Leu His Pro Val Val Pro Asp Leu Pro
        195                 200                 205
Ser Ser Val Val Phe Pro Asp Arg Glu Ala Ala Arg Ala Val Leu Glu
    210                 215                 220
Glu Cys Thr Ser Phe Ile Pro Glu Ala Arg Ala Val Leu Asp Leu Val
225                 230                 235                 240
Asp Gln Cys Pro Lys Gln Ile Gln Lys Gly Lys Phe Gln Val Val Ala
                245                 250                 255
Ile Glu Gly Leu Asp Ala Thr Gly Lys Thr Thr Val Thr Gln Ser Val
            260                 265                 270
Ala Asp Ser Leu Lys Ala Val Leu Leu Lys Ser Pro Pro Ser Cys Ile
        275                 280                 285
Gly Gln Trp Arg Lys Ile Phe Asp Asp Glu Pro Thr Ile Ile Arg Arg
    290                 295                 300
Ala Phe Tyr Ser Leu Gly Asn Tyr Ile Val Ala Ser Glu Ile Ala Lys
305                 310                 315                 320
Glu Ser Ala Lys Ser Pro Val Ile Val Asp Arg Tyr Trp His Ser Thr
                325                 330                 335
Ala Thr Tyr Ala Ile Ala Thr Glu Val Ser Gly Gly Leu Gln His Leu
            340                 345                 350
Pro Pro Ala His His Pro Val Tyr Gln Trp Pro Glu Asp Leu Leu Lys
        355                 360                 365
Pro Asp Leu Ile Leu Leu Leu Thr Val Ser Pro Glu Glu Arg Leu Gln
    370                 375                 380
Arg Leu Gln Gly Arg Gly Met Glu Lys Thr Arg Glu Glu Ala Glu Leu
385                 390                 395                 400
Glu Ala Asn Ser Val Phe Arg Gln Lys Val Glu Met Ser Tyr Gln Arg
                405                 410                 415
Met Glu Asn Pro Gly Cys His Val Val Asp Ala Ser Pro Ser Arg Glu
            420                 425                 430
Arg Val Leu Gln Thr Val Leu Ser Leu Ile Gln Asn Ser Phe Ser Glu
        435                 440                 445
Pro
<210>13
<211>1893
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(418)..(1392)
<223>LBFLl67 Clone #20
<400>13
agtccagctg ccgttaggcg ctgggatagt cgcacgctgg atgcatctac gtccgccgag         60
cccctggggc gaagaggccg cgtccgcctt catttgtggc cggtgcttcg ccccctgacc        120
cttcgccccc aaagaccagc tctaacgtga gcgcctcggc cgccctgccc cagcctcgta        180
cacgccgcca gcctcgccca gccggtgtcc ggagaccctc gggccgtgtc catttgtggg        240
caaagccagc ggggcaggct tggccagagt gcaccactcg gcgccgtccc aggcccgacg        300
ctctgggcgc gcccggaacc ccaggttcgc ggcccgtgtt tccgaccggc ggagggggct        360
cagcggcccg atcccacgga agcgcgctcg gaggggtggg acccggccgg accggag           417
atg gcg ccg cca gcg ggc ggg gcg gcg gcg gcg gcc tcg gac ttg ggc          465
Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly
  1               5                  10                  15
tcc gcc gca gtg crc ttg gct gtg cac gcc gcg gtg agg ccg ctg ggc          513
Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly
             20                  25                  30
gcc ggg cca gac gcc gag gca cag ctg cgg agg ctg cag ctg agc gcg          561
Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala
         35                  40                  45
gac cct gag cgg cct ggg cgc ttc cgg ctg gag ctg ctg ggc gcg gga          609
Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly
     50                  55                  60
cct ggg gcg gtt aat ttg gag tgg ccc ctg gag tca gtt tcc tac acc          657
Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr
 65                  70                  75                  80
atc cga ggc ccc acc cag cac gag cta cag cct cca cca gga ggg cct          705
Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro
                 85                  90                  95
gga acc ctc agc ctg cac ttc ctc aac cct cag gaa gct cag cgg tgg          753
Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp
            100                 105                 110
gca gtc cta gtc cga ggt gcc acc gtg gaa gga cag aat ggc agc aag          801
Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys
        115                 120                 125
agc aac tca cca cca gcc ttg ggc cca gaa gca tgc cct gtc tcc ctg          849
Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu
    130                 135                 140
ccc agt ccc ccg gaa gcc tcc aca ctc aag ggc cct cca cct gag gca          897
Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala
145                 150                 155                 160
gat ctt cct agg agc cct gga aac ttg acg gag aga gaa gag ctg gca          945
Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala
                165                 170                 175
ggg agc ctg gcc cgg gct att gca ggt gga gac gag aag ggg gca gcc          993
Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala
            180                 185                 190
caa gtg gca gcc gtc ctg gcc cag cat cgt gtg gcc ctg agt gtt cag         1041
G1n Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln
        195                 200                 205
ctt cag gag gcc tgc ttc cca cct ggc ccc atc agg ctg cag gtc aca         1089
Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr
    210                 215                 220
ctt gaa gac gct gcc tct gcc gca tcc gcc gcg tcc tct gca cac gtt         1137
Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val
225                 230                 235                 240
gcc ctg cag gtc cac ccc cac tgc act gtt gca gct ctc cag gag cag         1185
Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln
                245                 250                 255
gtg ttc tca gag ctc ggt ttc cog cca gcc gtg caa cgc tgg gtc atc         1233
Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile
            260                 265                 270
gga cgg tgc ctg tgt gtg cct gag cgc agc crt gcc tct tac ggg gtt         1281
Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val
        275                 280                 285
cgg cag gat ggg gac cct gct ttc ctc tac ttg ctg tca gct cct cga         1329
Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg
    290                 295                 300
gaa gcc cca ggt cag tcc tcg atg ggg gtg ggg tgt ggg agg tgg ggt         1377
Glu Ala Pro Gly Gln Ser Ser Met Gly Val Gly Cys Gly Arg Trp Gly
305                 310                 315                 320
gca gcc cca cag tcc     tgagctcc accccctcag ccacaggacc tagccctcag       1430
Ala Ala Pro Gln Ser
                325
cacccccaga agatggacgg ggaacttgga cgcttgtttc ccccatcatt ggggctaccc       1490
ccaggccccc agccagctgc ctccagcctg cccagtccac tccagcccag ctggtcctgt       1550
ccttcctgca ccttcatcaa tgccccagac cgccctggct gtgagatgtg tagcacccag       1610
aggccctgca cttgggaccc ccttgctgca gcttccacct agcagccacc agaggtacca       1670
gaggtggcac aggcagggga ggtggggggc cagggcagaa tccacaggaa tgacccagct       1730
cctcccccac aggttacaag gggagagtgg cccttccctc acaagtccga catctccagg       1790
cccccactga actccgggga cctctactga ctgcttgctg ggacagtcac cagggttggg       1850
gggaagggcc acaaaatgaa accattaaag acccttaaga gcc                         1893
<210>14
<211>325
<212>PRT
<213>智人(Homo sapiens)
<400>14
Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly
  1               5                  10                  15
Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly
             20                  25                  30
Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala
         35                  40                  45
Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly
     50                  55                  60
Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr
 65                  70                  75                  80
Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro
                 85                  90                  95
Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp
            100                 105                 110
Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys
        115                 120                 125
Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val  Ser Leu
    130                 135                 140
Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala
145                 150                 155                 160
Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala
                165                 170                 175
Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala
            180                 185                 190
Gln Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln
        195                 200                 205
Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr
    210                 215                 220
Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val
225                 230                 235                 240
Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln
                245                 250                 255
Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile
            260                 265                 270
Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val
        275                 280                 285
Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg
    290                 295                 300
Glu Ala Pro Gly Gln Ser Ser Met Gly Val Gly Cys Gly Arg Trp Gly
305                 310                 315                 320
Ala Ala Pro Gln Ser
                325
<210>15
<211>1597
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>CDS
<222>(271)..(1431)
<223>LBFLl67 Clone #46
<400>15
gtgagcgcct cggccgccct gccccagcct cgtacacgcc gccagctcgc ccagccggtg         60
tccggagacc ctcgggccgt gtccatttgt gggcaaagcc agcggggcag gcttggccag        120
agtgcaccac tcggcgccgt cccaggcccg acgctctggg cgcgcccgga accccaggtt        180
cgcggcccgt gtttccgacc ggcggagggg gctcagcggc ccgatcccac ggaagcgcgc        240
tcggaggggt gggacccggc cggaccggag atg gcg ccg cca gcg ggc ggg gcg         294
                                 Met Ala Pro Pro Ala Gly Gly Ala
                                   1               5
gcg gcg gcg gcc tcg gac ttg ggc tcc gcc gca gtg ctc ttg gct gtg          342
Ala Ala Ala Ala Ser Asp Leu Gly Ser Ala Ala Val Leu Leu Ala Val
     10                  15                  20
cac gcc gcg gtg agg ccg ctg ggc gcc ggg cca gac gcc gag gca cag          390
His Ala Ala Val Arg Pro Leu Gly Ala Gly Pro Asp Ala Glu Ala Gln
 25                  30                  35                  40
ctg cgg agg ctg cag ctg agc gcg gac cct gag agg cct ggg cgc ttc          438
Leu Arg Arg Leu Gln Leu Ser Ala Asp Pro Glu Arg Pro Gly Arg Phe
                 45                  50                  55
cgg ctg gag ctg ctg ggc gcg gga cct ggg gcg gtt aat ttg gag tgg          486
Arg Leu Glu Leu Leu Gly Ala Gly Pro Gly Ala Val Asn Leu Glu Trp
             60                  65                  70
ccc ctg gag tca gtt tcc tac acc atc cga ggc ccc acc cag cac gag          534
Pro Leu Glu Ser Val Ser Tyr Thr Ile Arg Gly Pro Thr Gln His Glu
         75                  80                  85
cta cag cct cca cca gga ggg cct gga acc ctc agc ctg cac ttc ctc          582
Leu Gln Pro Pro Pro Gly Gly Pro Gly Thr Leu Ser Leu His Phe Leu
     90                  95                 100
aac cct cag gaa gct cag cgg tgg gca gtc cta gtc cga ggt gcc acc          630
Asn Pro Gln Glu Ala Gln Arg Trp Ala Val Leu Val Arg Gly Ala Thr
105                 110                 115                 120
gtg gaa gga cag aat ggc agc aag agc aac tca cca cca gcc ttg ggc          678
Val Glu Gly Gln Asn Gly Ser Lys Ser Asn Ser Pro Pro Ala Leu Gly
                125                 130                 135
cca gaa gca tgc cct gtc tcc ctg ccc agt ccc ccg gaa gcc tcc aca          726
Pro Glu Ala Cys Pro Val Ser Leu Pro Ser Pro Pro Glu Ala Ser Thr
            140                 145                 150
ctc aag ggc cct cca cct gag gca gat ctt cct agg agc cct gga aac          774
Leu Lys Gly Pro Pro Pro Glu Ala Asp Leu Pro Arg Ser Pro Gly Asn
        155                 l60                 165
ttg acg gag aga gaa gag ctg gca ggg agc ctg gcc cgg gct att gca          822
Leu Thr Glu Arg Glu Glu Leu Ala Gly Ser Leu Ala Arg Ala Ile Ala
    170                 175                 180
ggt gga gac gag aag ggg gca gcc caa gtg gca gcc gtc ctg gcc cag          870
Gly Gly Asp Glu Lys Gly Ala Ala Gln Val Ala Ala Val Leu Ala Gln
185                 190                 195                 200
cat cgt gtg gcc ctg agt gtt cag ctt cag gag gcc tgc ttc cca cct          918
His Arg Val Ala Leu Ser Val Gln Leu Gln Glu Ala Cys Phe Pro Pro
                205                 210                 215
ggc ccc atc agg ctg cag gtc aca ctt gaa gac gct gcc tct gcc gca          966
Gly Pro Ile Arg Leu Gln Val Thr Leu Glu Asp Ala Ala Ser Ala Ala
            220                 225                 230
tcc gcc gcg tcc tct gca cac gtt gcc ctg cag gtc cac ccc cac tgc         1014
Ser Ala Ala Ser Ser Ala His Val Ala Leu Gln Val His Pro His Cys
        235                 240                 245
act gtt gca gct ctc cag gag cag gtg ttc tca gag ctc ggt ttc ccg         1062
Thr Val Ala Ala Leu Gln Glu Gln Val Phe Ser Glu Leu Gly Phe Pro
    250                 255                 260
cca gcc gtg caa cgc tgg gtc atc gga cgg tgc ctg tgt gtg cct gag         1110
Pro Ala Val Gln Arg Trp Val Ile G1y Arg Cys Leu Cys Val Pro Glu
265                 270                 275                 280
cgc agc ctt gcc tct tac ggg gtt cgg cag gat ggg gac cct gct ttc         1158
Arg Ser Leu Ala Ser Tyr Gly Val Arg Gln Asp Gly Asp Pro Ala Phe
                285                 290                 295
ctc tac ttg ctg tca gct cct cga gaa gcc cca gcc aca gga cct agc         1206
Leu Tyr Leu Leu Ser Ala Pro Arg Glu Ala Pro Ala Thr Gly Pro Ser
            300                 305                 310
cct cag cac ccc cag aag atg gac ggg gaa ctt gga cgc  ttg ttt ccc        1254
Pro Gln His Pro Gln Lys Met Asp Gly Glu Leu Gly Arg Leu Phe Pro
        315                 320                 325
cca tca ttg ggg cta ccc cca ggc ccc cag cca gct gcc tcc agc ctg         1302
Pro Ser Leu Gly Leu Pro Pro Gly Pro Gln Pro Ala Ala Ser Ser Leu
    330                 335                 340
ccc agt cca ctc cag ccc agc tgg tcc tgt cct tcc tgc acc ttc atc         1350
Pro Ser Pro Leu Gln Pro Ser Trp Ser Cys Pro Ser Cys Thr Phe Ile
345                 350                 355                 360
aat gcc cca gac cgc cct ggc tgt gag atg tgt agc acc cag agg ccc         1398
Asn Ala Pro Asp Arg Pro Gly Cys Glu Met Cys Ser Thr Gln Arg Pro
                365                 370                 375
tgc act tgg gac ccc ctt gct gca gct tcc acc  tagcagcca ccagaggtta       1450
Cys Thr Trp Asp Pro Leu Ala Ala Ala Ser Thr
            380                 385
caaggggaga gtggcccttc cctcacaagt ccgacatctc caggccccca ctgaactccg       1510
gggacctcta ctgactgctt gctgggacag tcaccagggt tggggggaag ggccacaaaa       1570
tgaaaccatt aaagaccctt aagagcc                                           1597
<210>16
<211>387
<212>PRT
<213>智人(Homo sapiens)
<400>16
Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly
  1               5                  10                  15
Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly
             20                  25                  30
Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala
         35                  40                  45
Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly
     50                  55                  60
Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr
 65                  70                  75                  80
Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro
                 85                  90                  95
Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp
                100                 105                 110
Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys
        115                 120                 125
Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu
    130                 135                 140
Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala
1451                 50                 155                 160
Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala
                165                 170                 175
Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala
            180                 185                 190
Gln Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln
        195                 200                 205
Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr
    210                 215                 220
Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val
225                 230                 235                 240
Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln
                245                 250                 255
Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile
            260                 265                 270
Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val
        275                 280                 285
Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg
    290                 295                 300
Glu Ala Pro Ala Thr Gly Pro Ser Pro Gln His Pro Gln Lys Met Asp
305                 310                 315                 320
Gly Glu Leu Gly Arg Leu Phe Pro Pro Ser Leu Gly Leu Pro Pro Gly
                325                 330                 335
Pro Gln Pro Ala Ala Ser Ser Leu Pro Ser Pro Leu Gln Pro Ser Trp
            340                 345                 350
Ser Cys Pro Ser Cys Thr Phe Ile Asn Ala Pro Asp Arg Pro Gly Cys
        355                 360                 365
Glu Met Cys Ser Thr Gln Arg Pro Cys Thr Trp Asp Pro Leu Ala Ala
    370                 375                 380
Ala Ser Thr
385
<210>17
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>17
gctgaagcag gaaaatcgct t                                                  21
<210>18
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>18
tgagacggag tctcactcgg t                                                  21
<210>19
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>19
gtttttccta attttggcat gaac                                               24
<210>20
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>20
cgcccaagct tttcctttt                                                     19
<210>21
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>21
caccctttgc ctctgtcact tccgca                                             26
<210>22
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>22
gctggagcac caggactgca ttg                                                23
<210>23
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>23
ggagctgagc agcagtgtaa tgaa                                               24
<210>24
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>24
gaggcctgcc tgaaggagga gcttc                                              25
<210>25
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>25
tctggaagta gtgcagacgc ctcagg                                             26
<210>26
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>26
agccaacgtc ggctttgtta tccagc                                             26
<210>27
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>27
gctgtcagat atgatggttc tggac                                              25
<210>28
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>28
ccagcctcac cactgttggg ttgc                                               24
<210>29
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>29
cattctctga gctgtattag tgt                                                23
<210>30
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>30
cctgagctgg aatgacctgc a                                                  21
<210>31
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>31
ctttgtgttg gctgcagcca ca                                                 22
<210>32
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>32
tgaggagaga ctttgctgac tggt                                               24
<210>33
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>33
gtcctgtctg gcggtgccga                                                    20
<210>34
<211>42
<212>DNA
<213>人工序列
<220>
<223>引物
<400>34
gctccaggat cccctgtcac ctgggccttc tgccttttgg ct                           42
<210>35
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物
<400>35
ccatatggag aggagagcag cgggccca                                           28
<210>36
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>36
gaaggaggaa catggagagg aga                                                23
<210>37
<211>27
<212>DNA
<213>人工序列
<220>
<223>引物
<400>37
ccatatgccc cgggtagtct actgcat                                            27
<210>38
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>38
gtcgactcga gtcacttccg caaaaacttc ttg                                     33
<210>39
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>39
tccattccga aggctctcct cc                                                 22
<210>40
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>40
gtctgtgtga cggaaatgta agc                                                23
<210>41
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>41
gaaggtcgaa ggcagaccga tgt                                                23
<210>42
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>42
gaatgtgtca gagacaagtg cagc                                               24
<210>43
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>43
tgtagaaact cttggactaa tggagg                                             26
<210>44
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>44
gtatgcatca gaattcccta tagatcttt                                          29
<210>45
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>45
tagatgtttg ggcaacagcc t                                                  21
<210>46
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物
<400>46
ttccttcacc aaaggcatcc agccattcta tg                                      32
<210>47
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物
<400>47
aaatgtctga ttaccccatt ttatcagt                                           28
<210>48
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>48
taatcctgaa atgaacagct aaca                                               24
<210>49
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>49
taatgttaga gtaacagcat tttccttcaa                                         30
<210>50
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>50
tgccccacac taactcagtt cttgtgatg                                          29
<210>51
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>51
aaggctttat caggtctgca tatagaatc                                          29
<210>52
<211>28
<212>DNA
<213>人工序列
<220>
<223>引物
<400>52
gcaaagaacc ctaatgctat ttatcagc                                           28
<210>53
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>53
gagaagacca gggaagaagc ag                                                 22
<210>54
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>54
ggacggggaa cttggacgc                                                     19
<210>55
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>55
aagtgcaggg cctctgggtg                                                    20
<210>56
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>56
cgctgggtca tcggacggt                                                     19

Claims (33)

1.分离的核酸分子,选自:(a)包括SEQ ID NO:1、3、5、7、9、11、13或15的分离的核酸分子,(b)编码SEQ ID NO:2、4、6、8、10、12、14或16的分离的核酸分子,(c)分离的核酸分子,其编码的蛋白在癌症中表达,并与SEQ ID NO:1、3、5、7、9、11、13或15中的全部连续的序列表现出至少大约75%的核苷酸序列同一性,以及(d)包括与(a)、(b)或(c)中核酸分子互补的序列的分离的核酸分子。
2.权利要求1的分离的核酸分子,其中的核酸分子包括SEQ IDNO:1的390-4880位核苷酸,SEQ ID NO:3的12-4904位核苷酸,SEQ IDNO:5的424-1908位核苷酸,SEQ ID NO:7的405-1835位核苷酸,SEQID NO:9的89-1150位核苷酸,SEQ ID NO:11的223-1569位核苷酸,SEQ ID NO:13的418-1392位核苷酸,或SEQ ID NO:15的271-1431位核苷酸。
3.权利要求1的分离的核酸分子,其中核酸分子包括SEQ IDNO:1的390-4883位核苷酸,SEQ ID NO:3的12-4907位核苷酸,SEQ IDNO:5的424-1911位核苷酸,SEQ ID NO:7的405-1838位核苷酸,SEQID NO:9的89-1153位核苷酸,SEQ ID NO:11的223-1572位核苷酸,SEQ ID NO:13的418-1395位核苷酸,或SEQ ID NO:15的271-1434位核苷酸。
4.权利要求1的分离的核酸分子,其中核酸分子的组成为SEQ IDNO:1的390-4883位核苷酸,SEQ ID NO:3的12-4907位核苷酸,SEQ IDNO:5的424-1908位核苷酸,SEQ ID NO:7的405-1835位核苷酸,SEQID NO:9的89-1153位核苷酸,SEQ ID NO:11的223-1569位核苷酸,SEQ ID NO:13的418-1395位核苷酸,或SEQ ID NO:15的271-1434位核苷酸。
5.权利要求1-4任一项的分离的核酸分子,其中该核酸分子与一个或多个表达控制元件可操作地连接。
6.含有权利要求1-4任一项的分离的核酸分子的载体。
7.被转化以含有权利要求1-4任一项的核酸分子的宿主细胞。
8.含有权利要求6的载体的宿主细胞。
9.权利要求8的宿主细胞,其中该宿主细胞选自原核宿主细胞和真核宿主细胞。
10.一种生产多肽的方法,包括培养以权利要求1-4任一项的核酸分子转化的宿主细胞,培养条件为由所述核酸分子编码的蛋白被表达。
11.权利要求10的方法,其中该宿主细胞选自原核宿主细胞和真核宿主细胞。
12.通过权利要求10的方法生产的分离的多肽。
13.分离的多肽或蛋白,选自包括SEQ ID NO:2、4、6、8、10、12、14或16的氨基酸序列的蛋白和与SEQ ID NO:2、4、6、8、10、12、14或16具有至少大约75%氨基酸序列同一性的蛋白。
14.与权利要求13的多肽结合的分离的抗体或抗原结合的抗体片段。
15.权利要求14的抗体,其中该抗体是单克隆或多克隆抗体。
16.一种鉴定试剂的方法,所述试剂能够调节编码权利要求13的蛋白的核酸表达,包括:
将表达核酸的细胞暴露于试剂;以及
确定试剂是否调节该核酸的表达,从而鉴定调节编码蛋白的核酸表达的试剂。
17.一种鉴定试剂的方法,所述试剂调节权利要求13的蛋白的水平或至少一种活性,包括:
将表达蛋白的细胞暴露于试剂;
确定试剂是否调节该蛋白的水平或至少一种活性,从而鉴定调节蛋白的水平或至少一种活性的试剂。
18.权利要求17的方法,其中的试剂调节蛋白的一种活性。
19.一种调节编码权利要求13的蛋白的核酸表达的方法,包括:
施用有效量的调节编码所述蛋白的核酸表达的试剂。
20.一种调节权利要求13的蛋白的至少一种活性的方法,包括:
施用有效量的调节所述蛋白的至少一种活性的试剂。
21.一种鉴定权利要求13的蛋白的结合配体的方法,包括:
将该蛋白暴露于潜在的结合配体;以及
确定潜在的结合配体是否与该蛋白结合,从而鉴定蛋白的结合配体。
22.一种鉴定试剂的方法,所述试剂调节权利要求21的结合配体和权利要求13的蛋白之间的相互作用,包括:
将该蛋白和该配体暴露于试剂;以及
确定该试剂是否调节结合配体与该蛋白的结合,从而鉴定调节结合配体与该蛋白的结合的试剂。
23.一种调节权利要求21的结合配体和权利要求13的蛋白之间的相互作用的方法,包括:
施用有效量的调节结合配体与该蛋白的结合的试剂。
24.一种非人的转基因动物,被修饰以含有权利要求1-4任一项的核酸分子。
25.权利要求24的转基因动物,其中的核酸分子含有阻止编码的蛋白表达的突变。
26.一种治疗对象疾病状态的方法,包括:
在患病的细胞中插入基因构建物,该构建物中含有与启动子或增强子元件连接的权利要求1-4任一项的分离的核酸分子,以便该核酸分子的表达抑制该疾病。
27.权利要求26的方法,其中在患病的细胞中插入基因构建物是在体内完成的。
28.权利要求26的方法,其中在患病的细胞中插入基因构建物还包括病毒或质粒因子的使用,并且在体外或体内完成。
29.一种诊断对象疾病状态的方法,包括:
确定权利要求1-4或13任一项的核酸分子或蛋白的表达水平。
30.权利要求26和29的方法,其中的疾病状态是癌症。
31.权利要求26和29的方法,其中的疾病状态是恶性肿瘤。
32.权利要求31的方法,其中的恶性肿瘤发生在乳腺、结肠、食管、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、直肠和/或胃。
33.一种含有稀释剂和多肽或蛋白的组合物,其中该多肽或蛋白选自:含有SEQ ID NO:2、4、6、8、10、12、14或16氨基酸序列的分离的多肽;含有SEQ ID NO:2、4、6、8、10、12、14或16的至少10个氨基酸片段的分离的多肽;含有SEQ ID NO:2、4、6、8、10、12、14或16的保守氨基酸置换的分离的多肽;含有SEQ ID NO:2、4、6、8、10、12、14或16的自然存在的氨基酸序列变体的分离的多肽;以及与SEQ ID NO:2、4、6、8、10、12、14或16表现出至少大约75%氨基酸序列同一性的分离的多肽。
CNB2003801016401A 2002-10-18 2003-10-16 与癌症相关的基因家族 Expired - Fee Related CN100552027C (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US41991102P 2002-10-18 2002-10-18
US60/419,912 2002-10-18
US60/420,088 2002-10-18
US60/419,911 2002-10-18
US60/434,243 2002-12-16
US60/434,278 2002-12-16
US60/438,278 2003-01-03

Publications (2)

Publication Number Publication Date
CN1705745A true CN1705745A (zh) 2005-12-07
CN100552027C CN100552027C (zh) 2009-10-21

Family

ID=35578307

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2003801016401A Expired - Fee Related CN100552027C (zh) 2002-10-18 2003-10-16 与癌症相关的基因家族

Country Status (1)

Country Link
CN (1) CN100552027C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109072229A (zh) * 2016-04-06 2018-12-21 定制药品研究株式会社 使用了抗mct5抗体的癌症治疗用药物组合物

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109072229A (zh) * 2016-04-06 2018-12-21 定制药品研究株式会社 使用了抗mct5抗体的癌症治疗用药物组合物

Also Published As

Publication number Publication date
CN100552027C (zh) 2009-10-21

Similar Documents

Publication Publication Date Title
CN1592793A (zh) 肝细胞癌-相关基因和多肽,以及检测肝细胞癌的方法
CN1264980C (zh) 新型肿瘤抗原蛋白sart-3及其肿瘤抗原肽
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1705745A (zh) 与癌症相关的基因家族
CN1932016A (zh) 影响sre活性的多核苷酸及其编码多肽和用途
CN1169954C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1246457C (zh) 人tsc403基因和人ing1l基因
CN1209373C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1900279A (zh) 诱导细胞凋亡的多核苷酸及其编码的多肽和用途
CN1177048C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199998C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1194989C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1281962C (zh) 作为肝癌标志物的肿瘤相关分泌蛋白及其用途
CN1199997C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1169955C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1249082C (zh) 促凋亡基因bnipl及其编码蛋白和用途
CN1177050C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1169958C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1169957C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1194010C (zh) 具有抑制癌细胞生长功能的人蛋白及基编码序列
CN1230445C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1708511A (zh) 对促肾上腺皮质激素释放激素刺激的应答而表达增加的基因
CN1231497C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1243017C (zh) 肿瘤抑制基因及其编码蛋白和应用
CN1199994C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091021

Termination date: 20111016