CN101068935A

CN101068935A - 与乳腺癌相关的基因和多肽

Info

Publication number: CN101068935A
Application number: CNA2005800345275A
Authority: CN
Inventors: 中村佑辅; 片桐丰雅; 中鹤修一
Original assignee: Oncotherapy Science Inc; University of Tokyo NUC
Current assignee: Oncotherapy Science Inc
Priority date: 2004-08-10
Filing date: 2005-07-29
Publication date: 2007-11-07
Anticipated expiration: 2025-07-29
Also published as: ATE491044T1; JP5028601B2; ES2357658T3; EP1786925A2; WO2006016525A3; EP1786925B1; WO2006016525A2; JP2008509652A; CN101068935B; DE602005025231D1; US20090263395A1

Abstract

本申请提供了新的人基因B1194，A2282V1，A2282V2，和A2282V3，它们的表达在乳腺癌中显著增加。这些基因及其编码的多肽可用于例如诊断乳腺癌，并作为开发抗乳腺癌药物的靶分子。

Description

与乳腺癌相关的基因和多肽

技术领域

本发明涉及生物科学领域，更具体地涉及癌症研究领域。本发明具体涉及与乳腺癌增殖机制有关的新基因B1194和A2282以及由这些基因编码的多肽。本发明的基因和多肽可用于例如诊断乳腺癌，以及用作靶分子来开发抗乳腺癌的药物。

背景技术

乳腺癌是一种遗传异质疾病，是妇女中最常见的恶性肿瘤。据报道全世界每年估计约有800000个新病例出现(Parkin DM，Pisani P，Ferlay J(1999).CA Cancer J Clin 49：33-64)。乳房切除术是公认的治疗该病的首选方案。尽管可手术切除原发性肿瘤，但诊断时无法检测到的微转移会导致患处或较远的位点出现肿瘤复发(Saphner T，Tommey DC，Gray R(1996).J ClinOncol，14，2738-2749.)。通常在手术后施用细胞毒性剂作为辅助疗法，目的是杀死那些残留的或恶变前的细胞。用常规的化学治疗剂治疗经常需要依靠经验，大多基于组织学肿瘤参数，对特异性的疗法缺乏了解。因此，靶向药物正在成为乳腺癌的基础疗法。已证实靶向药物的两种代表性药物三苯氧胺和芳香酶抑制剂用作转移乳腺癌患者的辅助治疗剂或化学预防剂有良好的反应(Fisher B，Costantino JP，Wickerham DL，Redmond CK，Kavanah M，Cronin WM，Vogel V，Robidoux A，Dimitrov N，Atkins J，Daly M，Wieand S，Tan-Chiu E，Ford L，Wolmark N(1998).J Natl Cancer Inst，90，1371-1388；Cuzick J(2002).Lancet 360，817-824)。然而，缺点是仅有表达雌激素受体的患者对这些药物敏感。最近，人们甚至关注到与这些药物有关的副作用，具体提到长期用三苯氧胺治疗可能会导致子宫内膜癌，而且，在按处方服用芳香酶抑制剂的患者中，绝经后妇女会遭受骨折的有害副作用(ColemanRE(2004).Oncology.18(5Suppl 3)，16-20)。

尽管最近在诊断和治疗策略上取得了进展，但晚期癌症患者的预后仍然很差。分子研究表明，肿瘤抑制基因和/或癌基因与癌症发生有关，但具体机制尚不明了。

cDNA微阵列技术使人们得以构建正常细胞和恶性细胞中基因表达的全面分布图，并比较恶性细胞和相应正常细胞中的基因表达(Okabe et al.，Cancer Res 61：2129-37(2001)；Kitahara et al.，Cancer Res 61：3544-9(2001)；Lin et al.，Oncogene 21：4120-8(2002)；Hasegawa et al.，Cancer Res 62：7012-7(2002))。这种方法促进了对癌症细胞复杂性质的理解，有助于阐明癌症发生的机理。鉴定出肿瘤中下调的基因能够更准确地诊断个体癌症，并可开发新的治疗靶(Bienz and Clevers，Cell 103：311-20(2000))。为了从整个基因组的角度揭示肿瘤发生的机理，并且找出用于诊断和用于开发新治疗药的靶分子，本发明人使用23,040个基因的cDNA微阵列来分析肿瘤细胞的基因表达谱(Okabe et al.，Cancer Res 61：2129-37(2001)；Kitahara et al.，Cancer Res61：3544-9(2001)；Lin et al.，Oncogene 21：4120-8(2002)；Hasegawa et al.，Cancer Res 62：7012-7(2002))。

被设计用于揭示癌症发生机制的研究促使人们鉴定出一些抗-肿瘤剂的分子靶。例如，起初被开发用于抑制与Ras有关的生长-信号传导途径、其活化取决于翻译后法尼基化的法尼基转移酶抑制剂(FTI)能在动物模型中有效治疗依赖于Ras的肿瘤(He et al.，Cell 99：335-45(1999))。同样，以拮抗原癌基因受体HER2/neu为目的，使用抗癌药物和抗-HER2单克隆抗体trastuzumab的组合对人体进行的临床试验已使乳腺癌患者获得改善的临床反应并使其全部存活(Lin et al.，Cancer Res 61：6345-9(2001))。最终，已开发出能选择性失活bcr-abl融合蛋白的酪氨酸激酶抑制剂STI-571以治疗慢性髓性白血病，在所述疾病中，bcr-abl酪氨酸激酶的组成型活化在白细胞转化中起着至关重要的作用。此类药剂被设计用于抑制具体基因产物的致癌活性(Fujita et al.，Cancer Res 61：7722-6(2001))。因此，在癌细胞中一般被上调的基因产物显然可用作潜在的靶，该靶可用于开发新的抗癌药。

经证实，CD8+细胞毒T淋巴细胞(CTL)能识别MHC I类分子上呈递的肿瘤相关抗原(TAA)的表位肽并裂解肿瘤细胞。第一例TAA是MAGE家族，由于这一发现，使用免疫学方法已发现很多其它的TAA(Boon，Int J Cancer54：177-80(1993)；Boon and van der Bruggen，J Exp Med 183：725-9(1996)；van der Bruggen et al.，Science 254：1643-7(1991)；Brichard et al.，J Exp Med178：489-95(1993)；Kawakami et al.，J Exp Med 180：347-52(1994))。目前，临床上将一些新发现的TAA作为免疫疗法的靶进行开发。迄今为止所发现的TAA包括MAGE(van der Bruggen et al.，Science 254：1643-7(1991))，gp100(Kawakami et al.，J Exp Med 180：347-52(1994))，SART(Shichijo et al.，J ExpMed 187：277-88(1998))和NY-ESO-1(Chen et al.，Proc Natl Acad Sci USA 94：1914-8(1997))。另一方面，经证实在肿瘤细胞中特异性过表达的基因产物可作为诱导细胞免疫应答的靶被识别。所述基因产物包括p53(Umano et al.，Brit J Cancer 84：1052-7(2001))，HER2/neu(Tanaka et al.，Brit J Cancer 84：94-9(2001))，CEA(Nukaya et al.，Int J Cancer 80：92-7(1999))等。

尽管已在与TAA有关的基础和临床研究中取得显著进步(Rosenberg etal.，Nature Med 4：321-7(1998)；Mukherji et al.，Proc Natl Acad Sci USA 92：8078-82(1995)；Hu et al.，Cancer Res 56：2479-83(1996))，但目前可以使用的能治疗腺癌，包括乳腺癌的候选TAA的数目仍然很有限。局限于在癌细胞中表达且在癌细胞中表达量高的TAA可能是理想的候选免疫治疗靶。此外，鉴定能诱导有效而特异性的抗-肿瘤免疫应答的新型TAA有望促进在临床上针对多种类型的癌症使用肽接种策略(Boon and van der Bruggen，J ExpMed 183：725-9(1996)；van der Bruggen et al.，Science 254：1643-7(1991)；Brichard et al.，J Exp Med 178：489-95(1993)；Kawakami et al.，J Exp Med 180：347-52(1994)；Shichijo et al.，J Exp Med 187：277-88(1998)；Chen et al.，ProcNatl Acad Sci USA 94：1914-8(1997)；Harris，J Natl Cancer Inst 88：1442-5(1996)；ButterFIeld et al.，Cancer Res 59：3134-42(1999)；Vissers et al.，CancerRes 59：5554-9(1999)；van der Burg et al.，J Immunol 156：3308-14(1996)；Tanaka et al.，Cancer Res 57：4465-8(1997)；FUJie et al.，Int J Cancer 80：169-72(1999)；Kikuchi et al.，Int J Cancer 81：459-66(1999)；Oiso et al.，Int J Cancer81：387-94(1999))。

据多篇文献报道，得自一些健康供体的经肽刺激的外周血单核细胞(PBMC)对肽作出反应，产生显著水平的IFN-α，但在⁵¹Cr-释放试验中很少以局限于HLA-A24或-A0201的方式对肿瘤细胞发挥细胞毒性(Kawano et al.，Cancer Res 60：3550-8(2000)；Nishizaka et al.，Cancer Res 60：4830-7(2000)；Tamura et al.，Jpn J Cancer Res 92：762-7(2001))。然而，在日本人和白种人中，HLA-A24和HLA-A0201是常见的HLA等位基因(Date et al.，Tissue Antigens47：93-101(1996)；Kondo et al.，J Immunol 155：4307-12(1995)；Kubo et al.，JImmunol 152：3913-24(1994)；Imanishi et al.，Proceeding of the eleventhInternational Histocompatibility Workshop and Conference Oxford UniversityPress，Oxford，1065(1992)；Williams et al.，Tissue Antigen 49：129(1997))。因此，由这些HLA呈递的癌症抗原肽对于治疗日本人和白种人的癌症特别有用。另外，已知使用高浓度的肽通常可在体外诱导低亲和力的CTL，在抗原呈递细胞(APC)上产生高水平的特异性肽/MHC复合物，该复合物会有效激活这些CTL(Alexander-Miller et al.，Proc Natl Acad Sci USA 93：4102-7(1996))。

为了公开乳腺癌发病机制，并鉴定这些肿瘤的新的诊断标记和/或治疗用药物标靶，本发明人使用含有27,648个基因的全-基因组cDNA微阵列(genome-wide cDNA microarray)分析了乳腺癌发生(breast carcinogenesis)中基因的表达谱。从药物学的观点看，在实际操作中抑制致癌信号比激活肿瘤-抑制效应更加容易。因此，本发明人检索了在乳腺癌发生过程中被上调的基因。

发明概述

因此，为了掌握与癌症有关的致癌机制并鉴定出潜在的靶用以开发新的抗癌药，我们使用27,648个基因的cDNA微阵列对纯化的乳腺癌细胞群中的基因表达模式进行了大规模分析。更具体地，为了分离新的治疗乳腺癌的分子靶，联合使用cDNA微阵列和激光束显微解剖，检查了77例乳腺肿瘤的精确的全基因组表达谱，包括8例原位导管癌(DCIS)和69例浸润性导管癌(IDC)。

从这些被上调的基因中，本发明人鉴定出原为假定蛋白FLJ 10252设计的B1194，它在41例可获得表达数据的乳腺癌病例中有24例(59％)出现两倍过表达，尤其是在36例高分化型乳腺癌标本中有20例(56％)出现两倍过表达。本发明人还鉴定出原为母体胚性亮氨酸拉链激酶(MELK)设计的A2282，它在33例可获得表达数据的乳腺癌病例中有25例(76％)出现三倍过表达，尤其是在14例中分化型乳腺癌标本中有10例(71％)出现三倍过表达。后来的半定量RT-PCR证实，B1194和A2282在临床乳腺癌标本和乳腺癌细胞系中比在乳腺导管细胞或正常乳房等正常人组织中上调。Northern印迹分析也表明，B1194和A2282的约2.4kb转录物仅在睾丸(B1194)以及乳腺癌细胞系(B1194和A2282)中表达。免疫细胞化学染色表明，外源B1194定位在COS7细胞的核中。用小干扰RNA(siRNA)处理乳腺癌细胞能有效抑制B1194和A2282的表达，并抑制乳腺癌细胞系T47D和/或MCF7的细胞/肿瘤生长，提示这些基因在细胞生长增殖中起关键作用。这些发现表明，B1194和A2282的过表达可能参与乳腺肿瘤发生，并且可能成为特异性治疗乳腺癌患者的理想策略。

因此，本发明分离了在乳腺癌细胞中显著过表达的B1194和A2282，经半定量RT-PCR和Northern印迹分析确认，B1194以及A2282变体V1、V2和V3在乳腺癌细胞系中显著过表达。在先报道称，B1194和A2282两者的EST在非小细胞肺癌中上调(WO 2004/031413)。但这些基因与乳腺癌的关联尚不明了。而且，这些基因的全长核苷酸序列是本发明新发现的。

相应地，本发明一个目标是提供与乳腺癌细胞增殖机制有关的新的蛋白和编码这些蛋白的基因，以及制备这些蛋白的方法和应用这些蛋白诊断和治疗乳腺癌的方法。

在众多在乳腺癌中普遍上调的转录物中，B1194，A2282V1，A2282V2和A2282V3被鉴定为分别位于染色体带1q41和9p13.1上。B1194，A2282V1，A2282V2和A2282V3的基因转移促进了细胞增殖。此外，用B1194，A2282V1，A2282V2和A2282V3的特异性反义S-寡核苷酸或小干扰RNA进行转染，导致这些基因的表达减少，从而抑制了乳腺癌细胞的生长。很多抗癌药，例如DNA和/或RNA合成抑制剂、代谢抑制剂、及DNA嵌入剂，都不仅对癌细胞有毒性而且对正常生长的细胞有毒性。而抑制B1194表达的制剂则有可能对其它器官没有负面影响，因为该基因的正常表达仅限于睾丸，因此该基因对治疗癌症非常重要。

因此，本发明提供了分离的新基因B1194，A2282V1，A2282V2和A2282V3，它们是候选的癌症诊断标记，并且是可用于开发新诊断策略和有效抗癌药的理想的潜在靶。另外，本发明提供了由这些基因编码的多肽及其制备方法和用途。更具体地，本发明提供了下述内容：

本申请提供了新的人多肽B1194，A2282V1，A2282V2和A2282V3，或其功能等同物，它们促进细胞增殖，并在乳腺癌等细胞增殖疾病中被上调。

在优选实施方案中，B1194多肽包括公认的528个氨基酸的蛋白，它由SEQ ID NO：1的开放读框编码。优选该多肽包括SEQ ID NO：2所示氨基酸序列。本申请还提供了分离的蛋白，其由B1194多核苷酸序列的至少一部分或与SEQ ID NO：1所示序列至少30％、更优选至少40％互补的多核苷酸序列编码。

在一优选实施方案中，A2282V1，A2282V2和A2282V3多肽分别包括公认的651，619和580个氨基酸的蛋白，它们分别由SEQ ID NO：3，5和7的开放读框编码。A2282V1，A2282V2和A2282V3多肽优选分别包含SEQ IDNO：4，6和8。本申请还提供了分离的蛋白，其分别由A2282V1，A2282V2和A2282V3多核苷酸序列的至少一部分或与SEQ ID NO：3，5和7所示序列至少15％、更优选至少25％互补的多核苷酸序列编码。

本发明还提供了新的人基因B1194，A2282V1，A2282V2和A2282V3，它们的表达在绝大多数乳腺癌中比在相应非癌组织中显著升高。分离的B1194基因包含SEQ ID NO：1所示多核苷酸序列。具体地，B1194 cDNA包含2338个核苷酸，其中有1587个核苷酸的开放读框(SEQ ID NO：1)。本发明还包括与SEQ ID NO：1所示多核苷酸序列杂交并与其至少30％、更优选至少40％互补的多核苷酸，杂交和互补的程度应使其能编码B1194蛋白或其功能等同物。所述多核苷酸的例子是SEQ ID NO：1的简并突变体和等位突变体。另一方面，分离的A2282V1，A2282V2和A2282V3基因分别包含SEQ IDNO：3，5和7所示多核苷酸序列。具体地，A2282V1，A2282V2和A2282V3cDNA分别包含2501，2368和2251个核苷酸(分别为SEQ ID NO：3，5和7)，其中分别含有1956，1860和1743个核苷酸的开放读框。本发明还包括分别与SEQ ID NO：3，5和7所示多核苷酸序列杂交并与其至少15％、更优选至少25％互补的多核苷酸，杂交和互补的程度应使它们能编码A2282V1，A2282V2或A2282V3蛋白或其功能等同物。这种多核苷酸的例子是SEQ IDNO：3，5和7的简并突变体和等位突变体。

本文中，分离的基因是一种多核苷酸，其结构与任何天然多核苷酸结构或横跨三个以上分开的基因的天然基因组多核苷酸的任何片段的结构都不相同。因此，该术语包括例如(a)具有生物体基因组中天然基因组DNA分子的部分序列的DNA，所述DNA分子天然存在于所述生物体中；(b)掺入到原核或真核载体或基因组DNA中的多核苷酸，其使所得分子不同于任何天然载体或基因组DNA；(c)分离的分子，如cDNA、基因组片段、聚合酶链反应(PCR)产生的片段或限制性片段；和(d)重组核苷酸序列，其为杂合基因，即编码融合多肽的基因的一部分。

因此，本发明一方面提供了编码本文所述多肽或其片段的分离的多核苷酸。优选分离的多核苷酸包括与SEQ ID NO：1，3，5或7所示核苷酸序列至少60％相同的核苷酸序列。更优选分离的核酸分子与SEQ ID NO：1，3，5或7所示核苷酸序列的同一性至少为65％，70％，75％，80％，85％，90％，91％，92％，93％，94％，95％，96％，97％，98％，99％或更高。当分离的多核苷酸的长度长于或等于参照序列，如SEQ ID NO：1，3，5或7时，与参照序列的全长进行比较。当分离的多核苷酸的长度短于参照序列，如短于SEQ ID NO：1，3，5或7时，与相同长度的参照序列的区段进行比较(排除同源性计算所需的任何环)。

本发明还提供了产生蛋白的方法，所述方法是用编码B1194，A2282V1，A2282V2或A2282V3蛋白的多核苷酸序列转染或转化宿主细胞，并且表达所述多核苷酸序列。另外，本发明提供了含有编码B1194，A2282V1，A2282V2或A2282V3蛋白的核苷酸序列的载体，和携有编码B1194，A2282V1，A2282V2或A2282V3蛋白的多核苷酸的宿主细胞。所述载体和宿主细胞可用于产生B1194，A2282V1，A2282V2或A2282V3蛋白。

本申请还提供了识别B1194，A2282V1，A2282V2或A2282V3蛋白的抗体。还提供了B1194，A2282V1，A2282V2或A2282V3基因的反义多核苷酸(如反义DNA)、核酶和siRNA(小干扰RNA)。

本发明还提供了诊断乳腺癌的方法，包括测定标本的生物样品中B1194，A2282V1，A2282V2或A2282V3基因的表达水平，将B1194，A2282V1，A2282V2或A2282V3基因的表达水平与正常样品中的相比较，样品中B1194，A2282V1，A2282V2或A2282V3基因的高表达水平表示患有乳腺癌。

另外，还提供了筛选可用于治疗乳腺癌的化合物的方法。所述方法包括使B1194，A2282V1，A2282V2或A2282V3多肽与受试化合物接触，并选出与B1194，A2282V1，A2282V2或A2282V3多肽结合的受试化合物。

本发明还提供了筛选可用于治疗乳腺癌的化合物的方法，其中所述方法包括使B1194，A2282V1，A2282V2或A2282V3多肽与受试化合物接触，并选出能抑制B1194，A2282V1，A2282V2或A2282V3多肽的生物活性的受试化合物。

本申请还提供了用于治疗乳腺癌的药物组合物。所述药物组合物可以是例如抗癌药。所述药物组合物可以分别是SEQ ID NO：1，3，5或7所示B1194，A2282V1，A2282V2或A2282V3多核苷酸序列的反义S-寡核苷酸或siRNA的至少一部分。siRNA的适当靶序列包括SEQ ID NO：38，39，40和41所示核苷酸序列。B1194的siRNA靶序列，包括具有SEQ ID NO：38或39所示核苷酸序列的那些，适用于治疗乳腺癌；A2282V1，A2282V2或A2282V3的siRNA靶序列，包括具有SEQ ID NO：40或41所示核苷酸序列的那些，适用于治疗乳腺癌。本发明的药物组合物也可以包括用本发明筛选治疗乳腺癌的化合物的方法所选出的化合物。

优选所述药物组合物的作用过程抑制癌细胞的生长。可将所述药物组合物施用于哺乳动物，包括人和家养的哺乳动物。

本发明还提供了使用本发明提供的药物组合物治疗乳腺癌的方法。

另外，本发明提供了治疗或预防乳腺癌的方法，包括施用B1194，A2282V1，A2282V2或A2282V3多肽的步骤。预期施用B1194，A2282V1，A2282V2或A2282V3多肽能引发抗肿瘤免疫力。因此，本发明还提供了引发抗肿瘤免疫力的方法，包括施用B1194，A2282V1，A2282V2或A2282V3多肽，以及含有B1194，A2282V1，A2282V2或A2282V3多肽的治疗或预防乳腺癌的药物组合物的步骤。

本发明的这些及其它目标和特征在阅读下文对发明的详细描述和附图、实施例之后将更显而易见。但是，应理解不论是上文的发明概述还是下文的详细描述都是优选的实施方案，而不是对本发明或本发明的其它可替换实施方案的限制。

附图说明

图1是一组RT-PCR照片，证实了B1194基因的过表达。图1(a)的1-12列是先经历一轮基于T7的扩增再经历逆转录的临床样品，图1(b)的1-9列是乳腺癌细胞系。缩写“pre”表示正常乳腺导管细胞混合物，它在本文的微阵列实验中用作通用对照。

图2是一组Northern印迹照片，显示了B1194分别在(a)多种正常组织，(b)乳腺癌细胞系中的表达模式。“#”表示重要器官。

图3(a)是一组照片，显示B1194蛋白在COS7细胞中的亚细胞定位。DAPI(核)；B1194(FITC)以及它们的合并图分别是第1，2和3号照片。图3(b)是B 1194蛋白的Western印迹照片。

图4(a)是一组半定量RT-PCR照片，特别显示T47D细胞系中内源B1194的敲减效应(knock down effect)。图4(b)的柱状图显示MTT试验结果，表明si1和si5培养物的低水平增殖。

图5是一组半定量RT-PCR照片，特别显示A2282的表达。图5(a)的1-12列是先经历一轮基于T7的扩增再经历逆转录的临床样品，图5(b)的1-6列是乳腺癌细胞系。缩写“pre”表示正常乳腺导管细胞混合物，它在本文的cDNA微阵列实验中用作通用对照。

图6(a)显示A2282的基因组结构。图6(b)和6(c)是Northern印迹照片，分别显示(b)多种正常组织，(c)乳腺癌细胞系和正常组织的表达模式。“#”表示重要器官。

图7(a)显示A2282变体的结构。A2282的5种转录物通过筛选cDNA文库而分离出。ATG和TAA分别表示翻译起始密码子和翻译终止密码子。黑块和阴影块表示非翻译区和编码序列。图7(b)是乳腺癌细胞系和正常组织的Northern印迹照片。

图8的照片显示4种A2282转录物的体外翻译能力。每一变体之后的括号中表示该蛋白的分子量。N表示阴性对照。

图9(a)是一组Western印迹照片，显示A2282蛋白的表达。缩写“E”和“M”分别表示无药物处理(指数生长)和有丝分裂期。用β肌动蛋白(ACTB)作为内部对照。每一列加载等量的总蛋白(10μg)。图9(b)的照片显示细胞周期分析结果。3种A2282转录物对细胞周期转移的影响在同步于G1期的HeLa细胞中通过流式细胞术分析。用未经转染的细胞作对照。

图10(a)是一组半定量RT-PCR照片，显示内源A2282在MCF-7和T47D细胞系中的敲减效应。图10(b)的柱状图显示MTT试验结果，特别显示第3号和第4号培养物的低水平增殖。图10(c)的照片显示集落形成试验结果，表明在敲减了A2282基因的培养物中，集落密度降低。

图11表明，A2282蛋白在激酶区被磷酸化。具体地，图11(a)显示野生型和两种截短型A2282蛋白。图11(b)是用抗-HA抗体对所有三种转录物进行western印迹的结果。图11(c)显示λ-PPase试验结果，证实了野生型A2282蛋白的磷酸化。

图12是免疫沉淀和免疫复合物激酶试验的结果。具体地，图12(a)显示野生型转录物和突变的转录物。12(b)检测了这三种突变体在HEK 293细胞系中的磷酸化状态。图12(c)用免疫复合物激酶试验评估了这三种突变体的激酶活性。用组蛋白H1作为体外底物。

优选实施方案祥述

I.概述

本申请鉴定出新的人基因B1194，A2282V1，A2282V2和A2282V3，其表达在乳腺癌中比在相应非癌组织中显著升高。B1194 cDNA由2338个核苷酸组成，其中含有SEQ ID NO：1所示的1587个核苷酸的开放读框。此开放读框编码公认的528个氨基酸的蛋白。同样，A2282V1，A2282V2和A2282V3cDNA分别包含2501，2368和2251个核苷酸(分别为SEQ ID NO：3，5和7)，其中分别含有1956，1860和1743个核苷酸的开放读框。核苷酸序列SEQ IDNO：5和7(分别为A2282V2和A2282V3)已提交日本DNA数据库(DNADatabank of Japan，DDBJ)，登录号分别为AB183427和AB183428。所述蛋白因在乳腺癌中表达上调而被称为A2282V1，A2282V2和A2282V3(在乳腺癌中被上调)。

B1194，A2282V1，A2282V2或A2282V3在细胞内的外源表达能使细胞生长增加，而用反义S-寡核苷酸或小干扰RNA(siRNA)抑制其表达会导致对癌细胞的显著生长-抑制作用。这些发现表明，B1194，A2282V1，A2282V2和A2282V3为癌细胞提供了致癌活性，抑制这些蛋白的活性不失为一种治疗癌症的理想策略。

更具体地，本文发现，B1194作为FLJ-10252假定蛋白的基因，在乳腺癌中的表达被显著上调。该发现得到临床样品的半定量RT-PCR及Northern印迹分析的证实。还发现，该基因的表达是癌症特异性的，而非普遍存在的事件。用小干扰RNA(siRNA)处理乳腺癌细胞，可以有效抑制B1194表达，并抑制乳腺癌细胞系T47D的细胞/肿瘤生长。这些发现一起表明，FLJ-10252假定蛋白是乳腺癌药物开发中很有希望的新候选分子。

此外，通过全基因组cDNA微阵列精确分析乳腺癌表达谱，鉴定出新基因A2282在乳腺癌细胞中比在正常人组织中显著过表达。用siRNA处理乳腺癌细胞，可以有效抑制A2282表达，并显著抑制乳腺癌的细胞/肿瘤生长。

A2282也称MELK，是在爪蟾(xenopus)和小鼠胚的发育过程中鉴定出的KIN1/PAR-1/MARK家族新成员(Blot J，et al.，(2002).Dev Biol，241，327-338；Heyer BS，et al.，(1999).Dev Dyn，215，344-351)，由于其在乳腺癌中表达显著增加而被选出进行研究。目前已鉴定出人MELK基因的5种变体，其中约2.4kb的转录物显示出癌特异性表达，另两种转录物在几乎所有器官中不能被翻译。序列分析表明，两种转录物的N端催化区有内部缺失，这两种转录物后来被称为V2和V3。由于这种缺失，以及在同一读框中有另一种起始密码子，使翻译提前终止，翻译出较短的蛋白，生成V2或V3的新的翻译起始密码子，得到缺失的N端部分。通过比对三种变体的氨基酸序列，可清楚看出，V2和V3仍保留部分激酶区但未保留公认的跨膜区。但不清楚这种缺失是否影响该蛋白的动力学活性(kinetic activity)。

为了鉴定这些转录物，检查了这些变体在细胞周期中的磷酸化状态。与在先研究(Davezac N，et al.，(2002).Oncogene，21，7630-7641)一致，V1在有丝分裂期发生高水平磷酸化。而V2和V3在任何细胞周期都未发现磷酸化。有趣的是，这些转录物在同步的HeLa细胞中的瞬时表达有略显不同的影响。V1的表达导致第一个细胞周期缩短，而后停滞在G2/M期。相反，对V2和V3进行诱导导致第一个细胞周期比未转染的对照细胞延长。忽略初期结果的这种差异，所有变体都逐渐使细胞停滞在G2/M期。类似的结果已有报道(Davezac N，et al.，(2002).Oncogene，21，7630-7641；Vulsteke V，etal.，(2004).J Biol Chem，279，8642-7)。此外，近期证据表明，MELK的C端区很可能是MELK激酶活性的强效抑制物(Vulsteke V，et al.，(2004).J BiolChem，279，8642-7)。该发现提示，MELK的激酶区可能在乳腺癌中导致缩短细胞周期，其活性可能受其C端区负调节的严格控制。

结论是，这些发现表明，A2282是不可缺少的癌特异性基因，是癌细胞通过尚未被鉴定出的信号通路进行生长所必需的。根据这些结果，MELK看来是乳腺癌治疗的很有希望的分子靶。

II.定义

除非另有说明，本文中术语“一(a，an)”、“该(the)”指的是“至少一个”。

在本发明上下文中，两种蛋白之间″结合的抑制″是指至少减少蛋白结合。因此，在一些情况中，样品中结合对的百分比比相应(如未用受试化合物处理或来自非癌样品，或来自癌样品)对照减少。结合的蛋白的减少量可以是，例如比对照样品中结合对少90％，80％，70％，60％，50％，40％，25％，10％，5％，1％或更少(例如，0％)。

化合物的“药物有效量”是足以治疗和/或改善个体中癌症的量。药物有效量例如是在施用至动物后降低B1194，A2282V1，A2282V2或A2282V3表达所需的量。所述表达降低可以是，例如有至少5％，10％，20％，30％，40％，50％，75％，80％，90％，95％，99％，或100％的变化。

术语“可药用载体”是指用做药物稀释剂或运载体(vehicle)的惰性物质。

在本发明中，术语“功能等同”是指所述多肽具有与B1194，A2282V1，A2282V2，或A2282V3蛋白类似的促进细胞增殖的活性，并能赋予癌细胞以致癌活性。此外，功能等同多肽可以具有A2282V1，A2282V2和A2282V3蛋白的蛋白激酶活性。测定这类活性的试验是本领域已知的。例如，可以用以下方法判断所述多肽是否具有细胞增殖活性：将编码所述多肽的DNA导入表达每一多肽的细胞中，检测对细胞增殖的促进作用或集落形成活性的提高。所述细胞包括例如对B1194和A2282V1，A2282V2，A2282V3而言的COS7和NIH3T3。

术语″分离的″和″生物纯″是指一种物质，其基本上不含有在其天然状态中通常与其相伴出现的成分。但术语″分离的″并不指电泳胶或其它分离介质中出现的成分。分离的成分不含有这类分离介质，而是另一用途可直接使用的形式或者是已在新用途/环境中使用的形式。

在本发明上下文中，“序列同一性百分比”是在对比窗口(comparisonwindow)比较两个最适比对的序列而测出的，其中多核苷酸序列在该对比窗口中的部分相比于不含有添加或缺失的参照序列(例如本发明多肽)而言，可以含有添加或缺失(即缺口)，以便对两种序列进行最适比对。通过测定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目，得到匹配位置数，用该数除以该对比窗口中总位置数，将结果乘以100，就得到序列同一性百分比。

术语“相同”或“同一性”百分比，在两个或多个核酸序列或多肽序列的上下文中，是指两个或多个序列或部分序列，它们是相同的序列。两个序列“实质相同”是指，用以下任一种序列比较算法或用手工比对和目测观察确定，在对比窗口内或在指定区域内、在获得最大对应关系的情况下进行比较和比对时，两个序列具有指定百分比的相同氨基酸残基或核苷酸(即，在指定区域，或在未指定的情况下，在整个序列范围内，有60％同一性，可选为65％，70％，75％，80％，85％，90％，或95％同一性)。可选地，所述同一性存在于至少约50个核苷酸的区域中，或更优选至少100-500或1000或更多个核苷酸的区域中。

进行序列比较时，通常将一个序列作为参照序列，用它比较受试序列。使用序列比较算法时，将受试序列和参照序列输入计算机，根据需要设定部分序列的坐标，并设定序列算法程序的参数。可以用程序默认的参数，或者可以另设一套参数。然后，根据该程序参数，用序列比较算法来计算受试序列相对于参照序列的序列同一性百分比。

“对比窗口(comparison window)”在本文中是指，含有20-600、通常约50-200、更通常约100-150个连续位置的区段，在该区段中，在将两个序列进行最适比对后，可以将其中一个序列与具有相同数目连续位置的另一序列进行比较。用于比较的序列比对方法是本领域已知的。用于比较的序列最适比对可以用以下方法进行，例如Smith and Waterman(1981)Adv.Appl.Math.2：482-489的局部同源性算法，Needleman and Wunsch(1970)J.Mol.Biol.48：443的同源性比对算法，Pearson and Lipman(1988)Proc.Nat’l.Acad.Sci.USA 85：2444的相似性检索法，这些算法的计算机运算(GAP，BESTFIT，FASTA，和TFASTA，见Wisconsin Genetics Software Package，GeneticsComputer Group，575Science Dr.，Madison，WI)，或手工比对和目测观察(见例如Ausubel et al.，Current Protocols in Molecular Biology(1995supplement))。

两例适于测定序列同一性百分比和序列相似性的算法是BLAST和BLAST 2.0算法，分别见Altschul et al.(1977)Nuc.Acids Res.25：3389-3402，Altschul et al.(1990)J.Mol.Biol.215：403-410。BLAST分析软件可从NationalCenter for Biotechnology Information获得。该算法包括，先在问询序列(querysequence)中确定短字长(short words of length)W，以此确定高分值序列对(HSP)，当它与数据库序列中相同字长的字进行比对时，匹配或符合正值阈值(positive-valued threshold score)T。T是指近邻字的阈值(Altschul et al.，同上)。用这些最初的热点近邻字作为种子进行检索，来寻找包含它们的更长HSP。这些热点字(word hits)在每一序列中沿两个方向延伸，以便尽可能多的增加累计比对分值。核苷酸序列的累计分值用参数M(匹配残基对的奖励分值，总是＞0)和N(错配残基的罚分，总是＜0)计算。氨基酸序列用分值矩阵计算累计分值。热点字在每一方向上的延伸在下列情况时停止：累计比对分值比其可获得的最大值下降达到量X；因累积一或多个负值残基比对，使累计分值为0或更低；或达到任一序列的末端。BLAST算法的参数W，T和X决定了比对的敏感度和速度。BLASTN程序(用于核苷酸序列)的默认参数是：字长(W)＝11、期望值(expectation，E)＝10、M＝5、N＝-4，并且是两条链都比较。用于氨基酸序列时，BLASTP程序的默认参数是：字长＝3、期望值(E)＝10，BLOSUM62分值矩阵(见Henikoff and Henikoff(1989)Proc.Natl.Acad.Sci.USA 89：10915)比对(B)＝50、期望值(E)＝10、M＝5、N＝-4，并且是两条链都比较。

BLAST算法也可对两个序列之间的相似性进行统计分析(见例如Karlinand Altschul(1993)Proc.Natl.Acad.Sci.USA 90：5873-7)。BLAST算法提供的一种相似性计算法是最小合计概率(smallest sum probability，P(N))，它提供两个核苷酸序列或氨基酸序列偶然匹配的概率的指标。例如，在比较受试核酸与参照核酸时，最小合计概率是约0.2以下、更优选约0.01以下、最优选约0.001以下时，认为该核酸与该参照序列相似。

术语“反义寡核苷酸”在本文中不仅意味着其中与构成DNA或mRNA特定区域的核苷酸相对应的核苷酸能够完全互补，还意味着其中可错配一个或多个核苷酸，只要所述DNA或mRNA和反义寡核苷酸能与核苷酸序列SEQ ID NO：1，3，5或7特异性杂交即可。

“至少15个连续核苷酸序列区域”中所包含的这种多核苷酸的同源性至少为70％或更高，优选为80％或更高，更优选为90％或更高，甚至更优选为95％或更高。可以使用本文提及的算法测定同源性。所述多核苷酸可用作探针以按照下文实施例所述分离或检测编码本发明的多肽的DNA，或用作扩增引物。

术语″标记″和″可检测的标记″在本文中指，可以通过分光学、光化学、生物化学、免疫化学、电学、光学或化学手段检测的任何组合物。这种标记包括，可以用于用标记的链霉亲和素偶联物进行染色的生物素、磁珠(如DYNABEADS^TM)、荧光染料(如荧光素、得克萨斯红(Texas red)、罗丹明(rhodamine)、绿色荧光蛋白等)、放射性标记(如³H，¹²⁵I，.³⁵S，¹⁴C，或³²P)、酶(如辣根过氧化物酶、碱性磷酸酶以及其它常用于ELISA的酶)、热量测定标记(calorimetric labels)如胶体金或有色玻璃或塑料(如聚苯乙烯、聚丙烯、乳胶等)珠。指示如何使用这类标记的专利包括美国专利3,817,837；3,850,752；3,939,350；3,996,345；4,277,437；4,275,149；和4,366,241。检测这类标记的手段是本领域已知的。例如，放射性标记可以用照相胶片或闪烁计数器检测，荧光标记可以用光电探测器检测激发光。酶标记一般通过使酶与底物接触并检测酶作用于底物产生的反应产物来检测，热量测定标记通过简单观察着色的标记来检测。

术语″抗体″在本文中包括天然抗体及非天然抗体，例如单链抗体，嵌合抗体，双功能抗体和人源化抗体，及其抗原结合片段(如Fab′，F(ab′)₂，Fab，Fv和rIgG)。见Pierce Catalog and Handbook，1994-1995(Pierce Chemical Co.，Rockford，IL)；Kuby，J.，Immunology，3^rd Ed.，W.H.Freeman & Co.，New York(1998)。这类非天然抗体可以用固相肽合成技术构建，可以重组生成，或者可以通过例如筛选由可变重链和可变轻链组成的组合文库而获得，见Huseet al.，Science 246：1275-1281(1989)，其全文引入做参考。这些方法，以及其它制备例如嵌合抗体、人源化抗体、CDR-移植抗体、单链抗体和双功能抗体的方法是本领域已知的(Winter and Harris，Immunol.Today 14：243-246(1993)；Ward et al.，Nature 341：544-546(1989)；Harlow and Lane，Antibodies，511-52，Cold Spring Harbor Laboratory publications，New York，1988；Hilyardet al.，Protein Engineering：A practical approach(IRL Press 1992)；Borrebaeck，Antibody Engineering，2d ed.(Oxford University Press 1995)；均引入本文做参考)。

术语″抗体″包括多克隆抗体和单克隆抗体。该术语还包括遗传改造形式如嵌合抗体(如人源化鼠抗体)和异源偶联抗体(如双特异性抗体)。该术语还指重组单链Fv片段(scFv)。术语抗体还包括二价分子或双特异性分子，二重特异性抗体(diabodies)，三重特异性抗体(triabodies)，和四重特异性抗体(tetrabodies)。二价分子和双特异性分子可参见例如Kostelny et al.(1992)JImmunol 148：1547，Pack and Pluckthun(1992)Biochemistry 31：1579，Holligeret al.(1993)Proc Natl Acad Sci U S A.90：6444，Gruber et al.(1994)JImmunol：5368，Zhu et al.(1997)Protein Sci 6：781，Hu et al.(1997)Cancer Res.56：3055，Adams et al.(1993)Cancer Res.53：4026，and McCartney，et al.(1995)Protein Eng.8：301。

抗体一般都具有重链和轻链。每一重链和轻链包含恒定区和可变区(称“结构域”)。轻链和重链可变区包含4个″框架″区，这4个区被超变区(也称“互补决定区”或“CDR”)隔断。框架区和CDR的范围是确定的。不同轻链或重链的框架区序列在一个物种中相对保守。抗体的框架区由该抗体的轻链和重链框架区组合而成，它使CDR在三维空间内定位(position)并排列(align)。

CDR主要负责与抗原表位结合。每条链的CDR通常从N-端开始依次编号为CDR1、CDR2和CDR3，一般通过含有特定CDR的链来识别。故，V_H CDR3位于含有它的抗体的重链可变区中，而V_L CDR1是含有它的抗体轻链可变区的CDR1。“V_H”指抗体免疫球蛋白重链(包括Fv，scFv或Fab重链)的可变区。“V_L”指免疫球蛋白轻链(包括Fv，scFv，dsFv或Fab轻链)的可变区。

术语“单链Fv”或“scFv”指，传统的具有两条链的抗体其重链可变区和轻链可变区连结成一条链而形成的抗体。通常在这两条链之间插入连接肽，以便正确折叠并生成活性结合位点。

“嵌合抗体”是一种免疫球蛋白分子，其中(a)恒定区或其部分被改变、置换或交换，致使抗原结合位点(可变区)与另一类恒定区、具有另一种效应功能的恒定区和/或另一物种的恒定区、或与为该嵌合抗体带来新特异性的另一种完全不同的分子(如酶、毒素、激素、生长因子、药物等)连结；或(b)可变区或其部分被改变、置换或交换为具有另一种抗原特异性的可变区。

″人源化抗体″是一种免疫球蛋白分子，它含有来自非人免疫球蛋白的最小序列。人源化抗体包括人免疫球蛋白(受体抗体)，其中该受体互补决定区(CDR)被置换为非人物种(如小鼠、大鼠或兔)的具有所需特异性、亲和力和能力的CDR(供体抗体)残基。在一些例子中，人免疫球蛋白的Fv框架残基被置换为相应非人残基。人源化抗体还可包含既不出现在受体抗体中、也不出现在引入的CDR或框架序列中的残基。一般情况下，人源化抗体包含至少一个、通常两个可变区的全部，其中所有或基本上所有CDR区对应于非人免疫球蛋白的那些，所有或基本上所有框架区(FR)是人的免疫球蛋白共有序列中的那些。人源化抗体任选还包含免疫球蛋白恒定区(Fc)、通常为人免疫球蛋白的至少一部分(Jones et al.，Nature 321：522-525(1986)；Riechmannet al.，Nature 332：323-327(1988)；Presta，Curr.Op.Struct.Biol.2：593-596(1992))。人源化基本可以按照Winter及其同事的方法(Jones et al.，Nature321：522-525(1986)；Riechmann et al.，Nature 332：323-327(1988)；Verhoeyenet al.，Science 239：1534-1536(1988))进行，即，用啮齿类动物的CDR或CDR序列取代相应人抗体的序列。故，这种人源化抗体是嵌合抗体(美国专利4,816,567)，其中完整人可变区的相当一部分被非人物种的相应序列取代。

术语“表位”和″抗原决定簇″是指抗原上的抗体结合位点。表位可以由连续氨基酸形成，或者可以是蛋白三维折叠致使不连续氨基酸并列而成。由连续氨基酸形成的表位一般保持暴露于变性溶剂的状态，而由三维折叠形成的表位一般被变性溶剂处理后丢失。表位通常在特有的空间构象中含有至少3个，更通常是至少5个或8-10个氨基酸。测定表位空间构象的方法包括例如，x-线晶体成像和二维核磁共振。见例如Epitope Mapping Protocolsin Methods in Molecular Biology，Vol.66，Glenn E.Morris，Ed(1996)。

术语“多肽”、“肽”和“蛋白”在本文中可互换使用，是指氨基酸残基的多聚体。这些术语适用于，有一或多个氨基酸残基为相应天然氨基酸的人工化学模拟物的氨基酸多聚体，以及含有修饰的残基的天然氨基酸多聚体，和非天然氨基酸多聚体。

术语“氨基酸”是指天然氨基酸和合成氨基酸，以及与天然氨基酸功能类似的氨基酸类似物和氨基酸模拟物。天然氨基酸是由遗传密码编码的那些，以及后来被修饰的那些，例如羟脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物是指，具有与天然氨基酸相同的基本化学结构(如具有与羟基、羧基、氨基和R基结合的α碳)的化合物，例如同型半胱氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍(methyl sulfonium)。这类类似物可以具有修饰的R基(如正亮氨酸)或修饰的肽骨架，但仍保留与天然氨基酸相同的基本化学结构。氨基酸模拟物是指，具有与氨基酸的一般化学结构不同的结构、但与天然氨基酸功能类似的化合物。

本文中，氨基酸可以用一般已知的三字母符号表示，或用IUPAC-IUB生物化学命名委员会(IUPAC-IUB Biochemical Nomenclature Commission)推荐的单字母符号表示。同样，核苷酸可以用一般认可的单字母密码表示。

本文中，提到细胞、核酸、蛋白、或载体时，术语“重组”表示，所述细胞、核酸、蛋白、或载体通过引入异源核酸或蛋白、或改变天然核酸或蛋白而被修饰，或表示所述细胞来自如此修饰的细胞。因此，例如重组细胞可以表达该细胞的天然(非重组)形式中未发现的基因，或可以表达那些异常表达、低水平表达、或根本不表达的天然基因。术语“重组核酸”在本文中是指，一般通过用例如聚合酶和内切核酸酶进行核酸操作、而最初在体外形成的、自然界通常未发现的形式的核酸。如此可以将不同序列可操作相连。故，分离的线性核酸，或在体外将通常不相连的DNA分子连接而形成的表达载体，都是本发明的重组体。应理解，生成重组核酸并将其再导入宿主细胞或生物后，其将进行非重组形式的复制，即用宿主细胞内的机制而非体外操作来进行复制；但这种核酸重组生成后，即使随后进行非重组复制，也仍然是本发明的重组体。同样，“重组蛋白”是用重组技术生成的蛋白，即通过表达上述重组核酸生成的蛋白。

除非另外说明，本文所使用的所有技术术语和科学术语与本领域技术人员一般理解的含义相同。在有冲突的情况下，以本说明书(包括定义)为准。

III.新的核酸、多肽、载体和宿主细胞

本发明涉及含有多核苷酸序列SEQ ID NO：1的新的人基因B1194，及其简并体和突变体，它们编码含有氨基酸序列SEQ ID NO：2的B1194蛋白或其功能等同物。与B1194功能等同的多肽例如有，与人B1194蛋白相应的其它生物的同源蛋白，以及人B1194蛋白的突变体。

本发明还涉及分别含有多核苷酸序列SEQ ID NO：3，5，7的新的人基因A2282V1，A2282V2，和A2282V3，及其简并体和突变体，它们编码分别含有氨基酸序列SEQ ID NO：4，6，8的A2282V1，A2282V2，或A2282V3蛋白或其功能等同物。与A2282V1，A2282V2，或A2282V3功能等同的多肽例如有，与人A2282V1，A2282V2，或A2282V3蛋白相应的其它生物的同源蛋白，以及人A2282V1，A2282V2，或A2282V3蛋白的突变体。

制备与指定蛋白功能等同的多肽的方法是本领域已知的，包括将突变导入所述蛋白的已知方法。例如，本领域技术人员可以通过定点诱变在人B1194，A2282V1，A2282V2，或A2282V3蛋白的氨基酸序列中导入合适的突变，从而制备这些蛋白的功能等同多肽(Hashimoto-Gotoh et al.，Gene152：271-5(1995)；Zoller and Smith，Methods Enzymol 100：468-500(1983)；Kramer et al.，Nucleic Acids Res.12：9441-9456(1984)；Kramer and Fritz，Methods Enzymol 154：350-67(1987)；Kunkel，Proc Natl Acad Sci USA 82：488-92(1985)；Kunkel，Methods Enzymol 204：125-139(1991))。氨基酸突变也可以天然发生。本发明的多肽包括这样的蛋白，它们具有人B1194，A2282V1，A2282V2，或A2282V3蛋白的氨基酸序列，且其中突变了一或多个氨基酸，使所得的突变多肽与人B1194，A2282V1，A2282V2，或A2282V3蛋白功能等同。这种突变体中被突变的氨基酸个数通常为10以下，优选6以下，更优选3以下。

突变的蛋白或经修饰的蛋白，具有在指定氨基酸序列中取代、缺失、插入、和/或添加一或多个氨基酸残基所修饰得到的氨基酸序列的蛋白，已知它们都可以保留最初的生物活性(Mark et al.，Proc Natl Acad Sci USA 81：5662-6(1984)；Zoller and Smith，Nucleic Acids Res 10：6487-500(1982)；Dalbadie-McFarland et al.，Proc Natl Acad Sci USA 79：6409-13(1982))。

优选将待突变的氨基酸残基突变成另一种氨基酸，且保守其氨基酸侧链的特性(即保守氨基酸取代过程)。氨基酸侧链的特性有：疏水氨基酸(A，I，L，M，F，P，W，Y，V)，亲水氨基酸(R，D，N，C，E，Q，G，H，K，S，T)，以及具有下述官能团或共有特性的侧链：脂肪族侧链(G，A，V，L，I，P)；含羟基侧链(S，T，Y)；含硫原子侧链(C，M)；含羧酸和酰胺侧链(D，N，E，Q)；含碱基侧链(R，K，H)和含芳香族侧链(H，F，Y，W)。需说明的是括号中的字母表示氨基酸的单字母代码。

功能相似氨基酸的保守取代列表是本领域已知的。这种保守修饰的变体同时还是本发明的多态变体，种间同系物，及等位基因。例如，以下8组分别包含可以彼此保守取代的氨基酸：

1)丙氨酸(A)，甘氨酸(G)；

2)天冬氨酸(D)，谷氨酸(E)；

3)天冬酰胺(N)，谷胺酰胺(Q)；

4)精氨酸(R)，赖氨酸(K)；

5)异亮氨酸(I)，亮氨酸(L)，甲硫氨酸(M)，缬氨酸(V)；

6)苯丙氨酸(F)，酪氨酸(Y)，色氨酸(W)；

7)丝氨酸(S)，苏氨酸(T)；以及

8)半胱氨酸(C)，甲硫氨酸(M)(见例如Creighton，Proteins(1984))。

在人B1194，A2282V1，A2282V2，或A2282V3蛋白的氨基酸序列中添加一或多个氨基酸残基所得的多肽例如是，含有人B1194，A2282V1，A2282V2，或A2282V3蛋白的融合蛋白。将人B1194，A2282V1，A2282V2，或A2282V3蛋白与其它肽或蛋白融合形成的融合体也包括在本发明中。融合蛋白可通过本领域技术人员众所周知的技术制备，例如将编码本发明的人B1194，A2282V1，A2282V2，或A2282V3蛋白的DNA与编码另一种肽或蛋白的DNA连接，使得读码框匹配，将融合DNA插入表达载体，在宿主中表达所述融合DNA。对于与本发明蛋白融合的肽或蛋白没有限制。

可用于与本发明蛋白融合的已知肽有FLAG(Hopp et al.，Biotechnology6：1204-10(1988))、含有6个His(组氨酸)残基的6×His、10×His、流感病毒凝集素(HA)、人c-myc片段、VSP-GP片段、p18HIV片段、T7-标记、HSV-标记、E-标记、SV40T抗原片段、lck标记、β-微管蛋白片段、B-标记、C蛋白片段等。可与本发明蛋白融合的蛋白有GST(谷胱甘肽-S-转移酶)、流感病毒凝集素(HA)、免疫球蛋白恒定区、β-半乳糖苷酶、MBP(麦芽糖-结合蛋白)等。

通过将编码上述融合肽或蛋白的商购DNA与编码本发明多肽的DNA融合，并表达所制备的融合DNA即可制备出融合蛋白。

另一种本领域已知的分离功能等同多肽的方法是例如使用杂交技术的方法(Sambrook et al.，Molecular Cloning 2nd ed.9.47-9.58，Cold Spring HarborLab.Press(1989))。本领域技术人员能容易地分离出与编码人B1194，A2282V1，A2282V2，或A2282V3蛋白的DNA序列(即SEQ ID NO：1，3，5或7)的全部或部分具有高度同源性的DNA，并且能从分离的DNA中分离出人B1194，A2282V1，A2282V2，或A2282V3蛋白的功能等同多肽。本发明的多肽包括由能与编码人B1194，A2282V1，A2282V2，或A2282V3蛋白的DNA序列的全部或部分杂交的DNA编码、并且与人B1194，A2282V1，A2282V2，或A2282V3蛋白功能等同的多肽。所述多肽包括对应于人源蛋白的哺乳动物同系物(例如由猴、大鼠、兔和牛基因编码的多肽)。当从动物中分离与编码人B1194蛋白的DNA高度同源的cDNA时，特别优选使用得自睾丸或乳腺癌细胞系的组织。或者，当从动物中分离与编码人A2282V1，A2282V2，或A2282V3蛋白的DNA高度同源的cDNA时，特别优选使用得自乳腺癌细胞系的组织。

本领域技术人员可以常规选择分离DNA所用的杂交条件，所述DNA编码与人B1194，A2282V1，A2282V2，或A2282V3蛋白功能等同的多肽。例如，可通过于68℃使用“Rapid-hyb缓冲液”(Amersham LIFE SCIENCE)进行预杂交达30分钟或更长时间，加入经标记的探针并于68℃加热1小时或更长时间来进行杂交。例如，可在低严紧条件下进行下述洗涤步骤。低严紧条件是例如42℃，2×SSC，0.1％SDS，或优选为50℃，2×SSC，0.1％SDS。更优选使用高度严紧条件。高度严紧条件是例如室温下用2×SSC，0.01％SDS洗涤3次，每次20分钟，然后于37℃用1×SSC，0.1％SDS洗涤3次，每次20分钟，再于50℃用1×SSC，0.1％SDS洗涤2次，每次20分钟。然而，几个诸如温度和盐浓度的因素可影响杂交的严紧度，本领域技术人员可适当选择这些因素以获得所需的严紧度。

可以使用基因扩增法，例如聚合酶链反应(PCR)法替代杂交来分离DNA，所述DNA编码与人B1194，A2282V1，A2282V2，或A2282V3蛋白功能等同的多肽，所述方法使用基于编码蛋白的DNA序列信息(SEQ ID NO：1，3，5或7)所合成的引物。

由通过上述杂交技术或基因扩增技术分离的DNA编码的、与人B1194，A2282V1，A2282V2，或A2282V3蛋白功能等同的多肽一般与人B1194，A2282V1，A2282V2，或A2282V3蛋白的氨基酸序列具有高度同源性。“高度同源性”一般指的是同源性为40％或更高，优选为60％或更高，更优选为80％或更高，甚至更优选为95％或更高。根据“Wilbur and Lipman，Proc NatlAcad Sci USA 80：726-730(1983)”中的算法即可测定多肽的同源性。

本发明多肽的氨基酸序列、分子量、等电点、糖链的存在或缺乏、或形式可以有所不同，这取决于用于产生所述多肽的细胞或宿主或所使用的纯化方法。无论如何，只要其功能等同于本发明的人B1194，A2282V1，A2282V2，或A2282V3蛋白，就落入本发明的范围。

通过本领域技术人员众所周知的方法可将本发明的多肽制备成重组蛋白或天然蛋白。通过下述方法即可制备重组蛋白，即将编码本发明多肽的DNA(例如含有核苷酸序列SEQ ID NO：1，3，5或7的DNA)插入适当的表达载体，将载体导入适当的宿主细胞，获得提取物，通过对提取物进行层析来纯化多肽，所述层析包括例如离子交换层析、反相层析、凝胶过滤、或利用固定有抗本发明蛋白之抗体的层析柱的亲和层析，或一种以上所述柱的组合。

另外，当在宿主细胞(例如动物细胞和大肠杆菌)中将本发明的多肽表达成与谷胱甘肽-S-转移酶的融合蛋白或添加有多个组氨酸的重组蛋白时，可使用谷胱甘肽柱或镍柱来纯化所表达的重组蛋白。或者，当将本发明的多肽表达成被c-myc，多个组氨酸或FLAG标记的蛋白时，可分别使用抗c-myc，His或FLAG的抗体来检测和纯化所述蛋白。

纯化融合蛋白之后，必要时也可以通过凝血酶或Xa因子切割来切除非目的多肽区域。通过本领域技术人员已知的方法，例如通过使结合有能与B1194，A2282V1，A2282V2，或A2282V3蛋白蛋白结合的下述抗体的亲和柱与表达本发明多肽的组织或细胞提取物接触，即可分离出天然蛋白。抗体可以是多克隆抗体或单克隆抗体。

本发明还包括本发明多肽的部分肽。部分肽具有本发明多肽所特有的氨基酸序列，并由至少7个氨基酸，优选为8个或更多个氨基酸，更优选为9个或更多个氨基酸组成。部分肽可用于例如制备抗本发明多肽的抗体，筛选与本发明多肽结合的化合物，以及筛选本发明多肽的促进剂或抑制剂。

通过基因工程，通过已知的肽合成法或通过用适当的肽酶消化本发明的多肽，即可产生本发明的部分肽。例如，可以使用固相合成或液相合成来进行肽合成。

另外，本发明提供了编码本发明多肽的多核苷酸。本发明的多核苷酸可用于体内或体外产生如上所述的本发明多肽。可以使用任何形式的本发明的多核苷酸，只要它能编码本发明的多肽即可，其包括mRNA，RNA，cDNA，基因组DNA和化学合成的多核苷酸。本发明的多核苷酸包括含有给定核苷酸序列及其简并序列的DNA，只要所得DNA能编码本发明的多肽即可。

通过本领域技术人员已知的方法即可制备本发明的多核苷酸。例如，可通过下述方法制备本发明的多核苷酸：由表达本发明多肽的细胞制备cDNA文库，并使用本发明DNA(如SEQ ID NO：1，3，5或7)的部分序列作为探针进行杂交。例如，通过Sambrook et al.，Molecular Cloning，Cold SpringHarbor Laboratory Press(1989)所述的方法即可制备cDNA文库；或者也可以使用商购的cDNA文库。也可通过下述方法制备cDNA文库：从表达本发明多肽的细胞中提取RNA，基于本发明DNA的序列(如SEQ ID NO：1，3，5或7)合成寡DNA，使用寡DNA作为引物进行PCR，并扩增编码本发明蛋白的cDNA。

另外，通过对所得cDNA的核苷酸进行测序，即可常规测定由cDNA编码的翻译区，并能容易地获得本发明多肽的氨基酸序列。另外，通过使用所得cDNA或其部分作为探针筛选基因组DNA文库，即可分离出基因组DNA。

更具体地，可首先从表达本发明目标多肽的细胞、组织或器官中制备mRNA(如B1194可用睾丸或乳腺癌细胞系；A2282V1，A2282V2，或A2282V3可用乳腺癌细胞系)。可使用已知方法分离mRNA；例如，通过胍超速离心(Chirgwin et al.，Biochemistry 18：5294-9(1979))或AGPC法(Chomczynski andSacchi，Anal Biochem 162：156-9(1987))即可制备总RNA。另外，可使用mRNA纯化试剂盒(Pharmacia)等从总RNA中纯化mRNA，或者使用QuickPrep mRNA纯化试剂盒(Pharmacia)直接纯化mRNA。

使用逆转录酶，用所得mRNA合成cDNA。可使用商购的试剂盒，如AMV逆转录酶第一链cDNA合成试剂盒(Seikagaku Kogyo)合成cDNA。或者，可以根据5’-RACE法(Frohman et al.，Proc Natl Acad Sci USA 85：8998-9002(1988)；Belyavsky et al.，Nucleic Acids Res 17：2919-32(1989))合成和扩增cDNA，所述方法使用本文所述的引物、5’-Ampli FINDER RACE试剂盒(Clontech)和聚合酶链反应(PCR)。

由PCR产物制备所需DNA片段，并与载体DNA连接。使用重组载体转化大肠杆菌等，由选定菌落制备所需重组载体。通过常规方法，如双脱氧核苷酸链终止法证实所需DNA的核苷酸序列。

考虑到用于表达的宿主中的密码子使用频率，将本发明多核苷酸的核苷酸序列设计成能够更有效地表达(Grantham et al.，Nucleic Acids Res 9：43-74(1981))。还可通过商购试剂盒或常规方法改变本发明多核苷酸的序列。例如，可通过用限制性酶消化、插入合成的寡核苷酸或适当的多核苷酸片段、添加接头或插入起始密码子(ATG)和/或终止密码子(TAA，TGA或TAG)来改变序列。

在一具体优选实施方案中，本发明的多核苷酸包括含有核苷酸序列SEQ ID NO：1，3，5或7的DNA。

另外，本发明提供了能在严紧条件下与具有核苷酸序列SEQ ID NO：1，3，5或7的多核苷酸杂交、并且编码与上文所述的本发明B1194，A2282V1，A2282V2，或A2282V3蛋白功能等同的多肽的多核苷酸。本领域技术人员可适当选择严紧条件。例如，可使用低度严紧条件。更优选使用高度严紧条件。这些条件与上文所述的相同。上述杂交DNA优选为cDNA或染色体DNA。

本发明还提供了载体，其中插入了本发明的多核苷酸。本发明的载体可用于在宿主细胞中维持本发明的多核苷酸，尤其是DNA，从而表达本发明的多肽。

当宿主细胞为大肠杆菌(E.coli)，并且在大肠杆菌(如JM109，DH5α，HB101或XL1Blue)中大量扩增和制备载体时，载体应具有欲在大肠杆菌中扩增的″ori″和用于选择转化的大肠杆菌的标记基因(例如用药物进行选择的药物-抗性基因，如氨苄青霉素、四环素、卡那霉素、氯霉素等)。例如，可使用M13-系列载体、pUC-系列载体、pBR322、pBluescript、pCR-Script等。另外，也可使用pGEM-T、pDIRECT和pT7亚克隆和提取cDNA以及上述载体。当使用载体制备本发明的蛋白时，表达载体特别有用。例如，欲在大肠杆菌中表达的表达载体应具有欲在大肠杆菌中扩增的上述特征。当将大肠杆菌，如JM109，DH5α，HB101或XL1Blue用作宿主细胞时，载体应具有能在大肠杆菌中有效表达所需基因的启动子，例如lacZ启动子(Ward et al.，Nature341：544-6(1989)；FASEB J 6：2422-7(1992))、araB启动子(Better et al.，Science 240：1041-3(1988))或T7启动子等。在此方面，可使用例如pGEX-5X-1(Pharmacia)、“QIAexpress系统”(Qiagen)、pEGFP和pET(此时，宿主优选为表达T7 RNA聚合酶的BL21)来替代上述载体。另外，载体也可含有多肽分泌所用的信号序列。介导多肽分泌至大肠杆菌周质的信号序列的例子为pelB信号序列(Lei et al.，J Bacteriol 169：4379-83(1987))。将载体导入靶宿主细胞的方法包括例如氯化钙法和电穿孔法。

除了大肠杆菌外，也可使用下述载体制备本发明的多肽，即得自哺乳动物细胞的表达载体(例如pcDNA3(Invitrogen)和pEGF-BOS(Mizushima S.，Nucleic Acids Res 18(17)：5322(1990))，pEF，pCDM8)，得自昆虫细胞的表达载体(例如“Bac-to-BAC杆状病毒表达系统”(GIBCO BRL)，pBacPAK8)，得自植物的表达载体(例如pMH1，pMH2)，得自动物病毒的表达载体(例如pHSV，pMV，pAdexLcw)，得自逆转录病毒的表达载体(例如pZIpneo)，得自酵母的表达载体(例如“毕赤氏酵母表达试剂盒”(Invitrogen)，pNV11，SP-Q01)以及得自枯草芽孢杆菌(Bacillus subtilis)的表达载体(如pPL608，pKTH50)。

为了在动物细胞，如CHO，COS或NIH3T3细胞中表达载体，载体应具有在所述细胞中进行表达所必需的启动子，例如SV40启动子(Mulligan et al.，Nature 277：108-14(1979))、MMLV-LTR启动子、EF1α启动子(Mizushima etal.，Nucleic Acids Res 18：5322(1990))、CMV启动子等，优选还具有选择转化子所用的标记基因(例如用药物进行选择的药物抗性基因(如新霉素、G418))。具有这些特征的已知载体的例子包括例如pMAM，pDR2，pBK-RSV，pBK-CMV，pOPRSV和pOP13。

另外，可使用一些方法在稳定表达基因的同时在细胞内扩增基因的拷贝数。例如，可将含有互补DHFR基因的载体(如pCHO I)导入核酸合成途径缺失的CHO细胞，然后通过氨甲蝶呤(MTX)进行扩增。另外，当瞬时表达基因时，可以使用这样一种方法，其中含有SV40复制起点的载体(pcD等)被转化至染色体上含有表达SV40T抗原的基因的COS细胞。

按上述方法获得的本发明多肽可分离自宿主细胞的内部或外部(如培养基)，并被纯化成基本上纯的均质多肽。本文所用的与给定多肽有关的术语“基本上纯”指的是多肽基本上不含其它生物大分子。基本上纯的多肽是指干重至少75％(如至少80，85，95或99％)纯。通过任何适当的标准方法皆可测定纯度，所述方法包括例如柱层析、聚丙烯酰胺凝胶电泳或HPLC分析。分离和纯化多肽的方法不局限于任何特定的方法；实际上，可使用任何标准方法。

例如，可以适当选择柱层析、过滤、超滤、盐沉淀、溶剂沉淀、溶剂提取、蒸馏、免疫沉淀、SDS-聚丙烯酰胺凝胶电泳、等电点电泳、透析和重结晶，并将它们组合用于分离和纯化多肽。

层析的例子包括例如亲和层析、离子交换层析、疏水层析、凝胶过滤、反相层析、吸附层析等(Strategies for Protein Purification and Characterization：A Laboratory Course Manual.Ed.Daniel R.Marshak et al.，Cold Spring HarborLaboratory Press(1996))。通过液相层析，如HPLC和FPLC即可进行这些层析。因此，本发明提供了通过上述方法制备的高度纯化的多肽。

通过在纯化前或纯化后用适当的蛋白修饰酶处理本发明的多肽，即可对其进行任意修饰或部分缺失。有用的蛋白修饰酶包括但不限于胰蛋白酶、胰凝乳蛋白酶、赖氨酰内肽酶、蛋白激酶、葡糖苷酶等。

IV.抗体

本发明还提供了与本发明的多肽结合的抗体。本发明的抗体可以任何形式被使用，如单克隆或多克隆抗体，并且包括通过用本发明的多肽免疫动物，如兔获得的抗血清、所有类别的多克隆和单克隆抗体、人抗体和通过基因重组产生的人源化抗体。

可用作抗原以获得抗体的本发明多肽可得自任何动物，但优选得自哺乳动物，如人、小鼠或大鼠，更优选得自人。人源多肽可得自本文公开的核苷酸或氨基酸序列。根据本发明，用作免疫抗原的多肽可以是完整蛋白或蛋白的部分肽。部分肽可含有例如本发明多肽的氨基(N)-末端或羧基(C)-末端片段。

可将编码本发明多肽或其片段的基因插入已知表达载体，然后按本文所述用所述载体转化宿主细胞。通过任何标准方法从宿主细胞的外部或内部回收所需多肽或其片段，随后将其用作抗原。或者，将表达多肽的完整细胞或其裂解物或化学合成的多肽用作抗原。

可用抗原免疫任何哺乳动物，但优选考虑与细胞融合所用亲代细胞的相容性。一般使用啮齿目(Rodentia)、兔形目(Lagomorpha)或灵长目(Primates)动物。啮齿目动物包括例如小鼠、大鼠和仓鼠。兔形目动物包括例如兔。灵长目动物包括例如Catarrhini猴(old world monkey)，如食蟹猴(Macacafascicularis)，恒河猴(rhesus monkey)，阿拉伯狒狒(sacred baboon)和黑猩猩(chimpanzees)。

用抗原免疫动物的方法是本领域已知的。例如，腹膜内注射或皮下注射抗原是免疫哺乳动物的标准方法。更具体地，可稀释抗原，将其悬浮于适当量的磷酸缓冲盐水(PBS)、生理盐水等中。必要时，可将抗原悬浮液与适当量的标准佐剂，如弗氏完全佐剂混合，制成乳剂，然后施用给哺乳动物。优选随后按照4至21天的间隔数次施用与适当量的弗氏不完全佐剂混合的抗原。适当的载体也可用于免疫。按上文所述进行免疫之后，通过标准方法检查血清中所需抗体量的增加。

通过从经检查后确定血清中所需抗体量有所增加的经免疫哺乳动物体内收集血液，并通过使用任何常规方法从血液中分离出血清，即可制备抗本发明多肽的多克隆抗体。多克隆抗体包括含有多克隆抗体的血清，可以从血清中分离含有多克隆抗体的组分。可以使用例如与本发明多肽偶联的亲和柱获得仅识别本发明多肽的组分，并使用蛋白A或蛋白G柱进一步纯化该组分，从而由所述组分制备免疫球蛋白G或M。

为了制备单克隆抗体，从用抗原免疫的哺乳动物体内收集免疫细胞，按上文所述检查血清中水平有所增加的所需抗体，并进行细胞融合。用于细胞融合的免疫细胞优选得自脾脏。其它可与上述免疫细胞融合的优选亲代细胞包括例如哺乳动物的骨髓瘤细胞，更优选为具有用药物选择融合细胞时所需的获得型特性的骨髓瘤细胞。

可根据已知方法融合上述免疫细胞和骨髓瘤细胞，例如Milstein等的方法(Galffe and Milstein，Methods Enzymol 73：3-46(1981))。

通过在标准的选择培养基，如HAT培养基(含有次黄嘌呤、氨基蝶呤和胸苷的培养基)中培养即可选择出通过细胞融合获得的杂交瘤。一般在HAT培养基中维持细胞培养物数天至数周，维持的时间应足以使除所需杂交瘤以外的所有其它细胞(非融合细胞)死亡。然后进行标准的有限稀释以筛选和克隆能产生所需抗体的杂交瘤细胞。

除了上文所述的用抗原免疫非人动物以制备杂交瘤的方法外，也可在体外用多肽、表达多肽的细胞或其裂解物免疫人淋巴细胞，例如被EB病毒感染的人淋巴细胞。然后，使经免疫的淋巴细胞与得自人的能够无限分裂的骨髓瘤细胞，如U266融合，从而产生能生成所需人抗体的杂交瘤，所述抗体能结合所述多肽(特开昭63-17688号)。

随后，将所得杂交瘤移植到小鼠腹腔中并抽取腹水。可通过例如硫酸铵沉淀、蛋白A或蛋白G柱、DEAE离子交换层析或偶联有本发明多肽的亲和柱来纯化所获得的单克隆抗体。本发明的抗体不仅可用于纯化和检测本发明的多肽，还可用作本发明多肽的候选激动剂和拮抗剂。另外，所述抗体还可用于与本发明多肽相关之疾病的抗体治疗。当给人体施用所得抗体时(抗体治疗)，优选人抗体或人源化抗体以降低免疫原性。

例如，可以用选自多肽、表达多肽的细胞或其裂解物的抗原免疫携有人抗体基因的转基因动物。然后从动物体内收集产生抗体的细胞并与骨髓瘤细胞融合，从而获得杂交瘤，从中可制备出抗所述多肽的人抗体(参见WO92-03918，WO94-02602，WO94-25585，WO96-33735和WO96-34096)。

或者，可通过癌基因无限增殖化能产生抗体的免疫细胞，如经免疫的淋巴细胞，并将其用于制备单克隆抗体。

也可使用基因工程技术重组制备如此获得的单克隆抗体(参见例如Borrebaeck and Larrick，Therapeutic Monoclonal Antibodies，published in theUnited Kingdom by MacMillan Publishers LTD(1990))。例如，可从能产生抗体的免疫细胞，如杂交瘤或经免疫的淋巴细胞中克隆编码抗体的DNA，将其插入适当载体，并导入宿主细胞以制备重组抗体。本发明还提供了按上文所述制备的重组抗体。

另外，本发明的抗体可以是抗体片段或经修饰的抗体，只要它们能结合本发明的一种或多种多肽即可。例如，抗体片段可以是Fab，F(ab’)2，Fv或单链Fv(scFv)，其中通过适当接头连接得自H和L链的Fv片段(Huston etal.，Proc Natl Acad Sci USA 85：5879-83(1988))。更具体地，通过用酶，如木瓜蛋白酶或胃蛋白酶处理抗体即可产生抗体片段。或者，可构建编码抗体片段的基因，将其插入表达载体，并在适当宿主细胞中表达(参见例如Co etal.，J Immunol 152：2968-76(1994)；Better and & Horwitz，Methods Enzymol178：476-96(1989)；Pluckthun and Skerra，Methods Enzymol 178：497-515(1989)；Lamoyi，Methods Enzymol 121：652-63(1986)；Rousseaux et al.，Methods Enzymol 121：663-9(1986)；Bird and Walker，Trends Biotechnol 9：132-7(1991))。

通过与多种分子，如聚乙二醇(PEG)偶联即可修饰抗体。本发明提供了这种经修饰的抗体。通过对抗体进行化学修饰即可获得经修饰的抗体。这些修饰方法是本领域的常规技术。

或者，本发明的抗体可以是得自非人抗体的可变区与得自人抗体的恒定区之间的嵌合抗体，或者是含有得自非人抗体的互补决定区(CDR)、得自人抗体的构架区(FR)和恒定区的人源化抗体。使用已知技术即可制备出所述抗体。

可将按上文所述获得的抗体纯化至均质。例如，可根据用于普通蛋白的分离和纯化方法进行抗体的分离和纯化。例如，通过适当选择和组合使用柱层析，如亲和层析、过滤、超滤、盐析、透析、SDS聚丙烯酰胺凝胶电泳、等电聚焦等可以分离抗体(Antibodies：A Laboratory Manual.Ed Harlowand David Lane，Cold Spring Harbor Laboratory(1988))，但并不局限于此。蛋白A柱和蛋白G柱可用作亲和柱。可以使用的蛋白A柱的例子包括例如HyperD，POROS和Sepharose F.F.(Pharmacia)。

除亲和层析以外的层析包括例如：离子交换层析、疏水层析、凝胶过滤、反相层析、吸附层析等(Strategies for Protein Purification andCharacterization：A Laboratory Course Manual.Ed Daniel R.Marshak et al.，Cold Spring Harbor Laboratory Press(1996))。可通过液相层析，如HPLC和FPLC进行层析过程。

例如，可以使用吸光度测定、酶联免疫吸附试验(ELISA)、酶免疫测定(EIA)、放射免疫测定(RIA)和/或免疫荧光来测定本发明抗体的抗原结合活性。在ELISA中，将本发明的抗体固定在培养板上，将本发明的多肽上样于板上，然后上样含有所需抗体的样品，如产生抗体的细胞的培养物上清液或纯化抗体样品。然后上样能识别第一抗体并被酶，如碱性磷酸酶标记的第二抗体，并保温培养板。接着，在洗涤之后，在培养板中加入酶底物，如对硝基苯磷酸，测定吸光度以评价样品的抗原结合活性。多肽的片段，如C-末端或N-末端片段可用作所述抗原，来评价所述抗体的结合活性。可使用BIAcore(Pharmacia)评价本发明抗体的活性。

上述方法通过将本发明的抗体暴露于假定含有本发明多肽的样品，并检测或测定抗体和多肽形成的免疫复合物，可以检测或测定本发明的多肽。

由于检测或测定本发明多肽的方法可特异性检测或测定多肽，因此，所述方法可用于多种使用所述多肽的实验。

V.反义寡核苷酸

如上所述，本发明还提供了含有至少15个核苷酸的多核苷酸，所述多核苷酸能与编码人B1194，A2282V1，A2282V2或A2282V3蛋白的多核苷酸(SEQ ID NO：1，3，5或7)或其互补链杂交。优选本发明的多核苷酸是能与编码本发明多肽的DNA特异性杂交的多核苷酸。本文所用术语“特异性杂交”指的是在通常的杂交条件下，优选在严紧杂交条件下不与编码其它蛋白的DNA发生显著交叉杂交。所述多核苷酸包括能与编码本发明多肽的DNA或其互补链特异性杂交的探针、引物、核苷酸和核苷酸衍生物(例如反义寡核苷酸和核酶)。另外，所述多核苷酸可用于制备DNA芯片。

相应地，本发明包括能与核苷酸序列SEQ ID NO：1，3，5或7内的任何位点杂交的反义寡核苷酸。优选所述反义寡核苷酸针对的是核苷酸序列SEQ ID NO：1，3，5或7中的至少15个连续核苷酸。甚至更优选上述反义寡核苷酸在上述至少15个连续核苷酸中含有起始密码子。

反义寡核苷酸的衍生物或修饰产物可用作本发明反义寡核苷酸。所述修饰产物的例子包括低级烷基磷酸酯修饰，如甲基-磷酸酯型或乙基-磷酸酯型修饰，硫代磷酸酯修饰和氨基磷酸酯修饰。

本发明的反义寡核苷酸衍生物通过下述机制对产生本发明多肽的细胞发挥作用，即与编码多肽的DNA或mRNA结合，抑制其转录或翻译，促进mRNA降解并抑制本发明多肽的表达，从而导致多肽功能受抑制。

通过与对衍生物无活性的适当基质混合，可将本发明的反义寡核苷酸衍生物制成外用制剂，如涂抹剂(liniment)或泥罨敷剂(poultice)。

必要时，也可通过加入赋形剂、等渗剂、增溶剂、稳定剂、防腐剂、止痛剂等，将衍生物配制成片剂、粉剂、颗粒剂、胶囊、脂质体胶囊、注射剂、溶液、滴鼻剂和冻干剂。通过下述的一般方法即可制备所述制剂。

通过直接施用于病痛部位或注射至血管以使其到达病痛部位，将反义寡核苷酸衍生物施用给患者。也可使用反义寡核苷酸-固定介质增加持久性和膜-通透性。实例包括但不限于，脂质体、聚-L-赖氨酸、脂质、胆固醇、脂转染试剂，或其衍生物。

可根据患者的身体状况适当调整本发明的反义寡核苷酸衍生物的剂量，并按所需的量使用所述剂量。例如，可以施用的剂量范围为0.1至100mg/kg，优选为0.1至50mg/kg。

术语″siRNA″指的是能防止靶mRNA翻译的双链RNA分子。可使用将siRNA导入细胞的标准技术，包括将DNA用作模板，由其转录RNA的技术。siRNA含有编码人B1194，A2282V1，A2282V2或A2282V3蛋白的多核苷酸(SEQ ID NO：1，3，5或7)的有义核酸序列和反义核酸序列。构建siRNA使得单个转录物具有来自靶基因的有义和互补反义序列，如发夹结构。

siRNA与靶细胞中B1194，A2282V1，A2282V2或A2282V3转录物的结合导致该细胞产生的蛋白减少。寡核苷酸的长度至少为10个核苷酸，并且可以与天然转录物一样长。优选寡核苷酸长度少于75，50或25个核苷酸。更优选寡核苷酸长度为19-25个核苷酸。能抑制癌细胞生长的B1194，A2282V1，A2282V2和A2282V3 siRNA寡核苷酸的例子包括，含有SEQ IDNO：38-41的靶序列。

此外，为了增强siRNA的抑制活性，可以在靶序列反义链的3’端添加核苷酸“u”。“u”的添加量为至少2个，通常2-10个，优选2-5个。所添加的“u”在该siRNA反义链3’端形成单链。

B1194，A2282V1，A2282V2和A2282V3siRNA可以以能结合mRNA转录物的形式直接导入细胞中。或者，可以将编码B1194，A2282V1，A2282V2或A2282V3 siRNA的DNA包含在载体中。

通过例如将B1194，A2282V1，A2282V2或A2282V3靶序列克隆到表达载体中，与侧翼于B1194，A2282V1，A2282V2或A2282V3序列的调节序列可操作相连，使得两条链都能表达(通过转录该DNA分子而表达)，可以制得载体(Lee，N.S.et al.，(2002)Nature Biotechnology 20：500-505.)。B1194，A2282V1，A2282V2或A2282V3 mRNA的反义链RNA分子由第一种启动子(如所述被克隆的DNA 3’侧的启动子序列)转录，B1194，A2282V1，A2282V2或A2282V3 mRNA的有义链RNA分子由第二种启动子(如所述被克隆的DNA 5’侧的启动子序列)转录。使所述有义链和反义链在体内杂交，产生siRNA构建体，以便使B1194，A2282V1，A2282V2或A2282V3基因沉默。或者，可以利用两种构建体产生所述siRNA构建体的有义链和反义链。经过克隆的B1194，A2282V1，A2282V2或A2282V3可以编码具有诸如发夹等二级结构的构建体，其中单个转录物具有来自所述靶基因的有义链和互补反义链两者的序列。

而且，由任意核苷酸序列组成的环序列可位于有义和反义序列之间以形成发夹环结构。因此，本发明还提供了具有通式5’-[A]-[B]-[A’]-3’的siRNA，其中[A]是与核苷酸序列SEQ ID NO：38-41相对应的核糖核苷酸序列，[B]是由3-23个核苷酸组成的核糖核苷酸序列，[A’]是由[A]的互补序列组成的核糖核苷酸序列。环序列可以由任意序列组成，优选长度为3-23个核苷酸。环序列可选自例如下述序列(http://www.ambion.com/techlib/tb/tb_506.html)。在本发明siRNA中，核苷酸“u”可以添加在[A’]的3’端，以达到增强该siRNA的抑制活性的目的。“u”的添加量为至少2个，通常2-10个，优选2-5个。另外，由23个核苷酸组成的环序列也可提供有活性的siRNA(Jacque，J.-M.et al.，Nature 418：435-438(2002))：

-CCC，CCACC或CCACACC：Jacque，J.M.et al.，Nature，Vo1.418：435-438(2002)；

-UUCG：Lee，N.S.et al.，Nature Biotechnology 20：500-505.；Fruscoloni，P.et al.，Proc.Natl.Acad.Sci.USA 100(4)：1639-1644(2003)；和

-UUCAAGAGA：Dykxhoorn，D.M.et al.，Nature Reviews Molecular CellBiology 4：457-467(2003)。

例如，下文显示了本发明优选的具有发夹结构的siRNA。在下述结构中，环序列可选自CCC，UUCG，CCACC，CCACACC和UUCAAGAGA。优选的环序列是UUCAAGAGA(DNA为“ttcaagaga”)。

guauaucuugcccucugaa-[B]-uucagagggcaagauauac(针对靶序列SEQ ID NO：38)

guccgaacacaucuuuguu-[B]-aacaaagauguguucggac(针对靶序列SEQ ID NO：39)

gacauccuaucuagcugca-[B]-ugcagcuagauaggauguc(针对靶序列SEQ ID NO：40)

aguucauuggaacuaccaa-[B]-uugguaguuccaaugaacu(针对靶序列SEQ ID NO：41)

侧翼于B1194，A2282V1，A2282V2或A2282V3序列的调节序列可以相同或不同，以独立地或按时序或空间来调制其表达。通过将B1194，A2282V1，A2282V2或A2282V3基因模板分别克隆至载体，即可在细胞内转录siRNA，所述载体含有例如小的核RNA(snRNA)U6的RNA pol III转录单位或人H1RNA启动子。为了将载体导入细胞，可使用转染-增强剂。FuGENE(RocheDiagnostics)，Lipofectamine 2000(Invitrogen)，Oligofectamine(Invitrogen)，和Nucleofector(Wako pure Chemical)可用作转染-增强剂。

使用可得自Ambion网站( http://www.ambion.com/techlib/misc/siRNA_finder.html)的siRNA设计计算机程序，可以设计siRNA的核苷酸序列。计算机程序基于下述方案选择siRNA合成所用的核苷酸序列。

选择siRNA靶位点：

1.自目标转录物的AUG起始密码子开始，扫描下游的AA二核苷酸序列。记录每个AA和3′方向邻接的19个核苷酸的出现，以作为潜在的siRNA靶位点。Tuschl，et al.，Genes Dev 13(24)：3191-7(1999)不推荐针对5′和3′非翻译区(UTR)和起始密码子附近的区域(75个碱基以内)设计siRNA，因为它们可能富含调节蛋白结合位点。UTR-结合蛋白和/或翻译起始复合物可干扰siRNA内切核酸酶复合物的结合。

2.将潜在的靶位点与人基因组数据库进行比较，无需考虑任何与其它编码序列具有显著同源性的靶序列。可使用能在NCBI服务器：www.ncbi.nlm.nih.gov/BLAST/中找到的BLAST进行同源性检索(Altschul SF，et al.，J Mol Biol.1990；215：403-10.；Altschul SF，et al.，Nucleic Acids Res.1997；25：3389-402.)。

3.选择合格的靶序列用于合成。在Ambion网站，优选沿着需评价之基因的长度选择几个靶序列。

对于B1194，A2282V1，A2282V2和A2282V3 mRNA的各种形式以及与它们互补的寡核苷酸，可以用标准方法，在体外测试它们降低肿瘤细胞中B1194，A2282V1，A2282V2或A2282V3生成水平的能力(例如用T47D或MCF7乳腺癌细胞系进行测试)。利用B1194，A2282V1，A2282V2或A2282V3-特异性抗体或其它检测方法，可检测B1194，A2282V1，A2282V2或A2282V3基因产量在接触候选siRNA组合物的细胞中是否比在缺乏该候选组合物时培养的细胞中减少。对那些在体外基于细胞的测定或不含细胞的测定中测出的、减少B1194，A2282V1，A2282V2或A2282V3生成的序列，可以再测定它们对细胞生长的抑制效果。对那些在体外基于细胞的测定中测出抑制细胞生长的序列，通过在大鼠或小鼠体内的试验证实，它们在患有恶性瘤形成的动物中，减少B1194，A2282V1，A2282V2或A2282V3的生成，并减少肿瘤细胞的生长。

本发明还包括双链分子，其含有靶序列的核酸序列，例如核苷酸SEQ IDNO：38-41。在本发明中，双链分子含有有义链和反义链，其中该有义链含有对应于SEQ ID NO：38-41的核糖核苷酸序列，该反义链与该有义链互补，该有义链与该反义链彼此杂交，形成该双链分子，该双链分子导入表达B1194，A2282V1，A2282V2或A2282V3基因的细胞中，可以抑制这些基因的表达。在本发明中，当分离的核酸是RNA或其衍生物时，该核苷酸序列中的碱基“t”应替换为“u”。本文中，术语“互补”是指，核酸分子的核苷酸单位之间的Watson-Crick或Hoogsteen碱基配对，术语“结合”是指两个多肽或化合物或相伴多肽或化合物或其组合之间的物理或化学相互作用。

互补核酸序列在适当条件下杂交，形成稳定的双链，其中含有很少的错配或根本不含有错配。而且，本发明分离的核苷酸的有义链和反义链可以通过杂交形成双链核苷酸或发夹环结构。在优选实施方案中，这种双链每10个匹配含有不超过1个错配。在特别优选的实施方案中，当双链的两条链完全互补时，这种双链不含有错配。例如，核酸分子长度不足500，200或75个核苷酸。本发明还包括含有一或多种本文所述核酸的载体，以及包含所述载体的细胞。本发明分离的核酸可以用作B1194，A2282V1，A2282V2或A2282V3的siRNA或编码该siRNA的DNA。当所述核酸用作siRNA或编码它的DNA时，有义链优选比19个核苷酸长，更优选比21个核苷酸长。

VI.诊断乳腺癌

本发明的反义寡核苷酸或siRNA抑制本发明多肽的表达，因此可用于抑制本发明多肽的生物活性。而且，含有本发明反义寡核苷酸或siRNA的表达抑制物，因其可以抑制本发明多肽的生物活性，因此是有用的。故，含有本发明反义寡核苷酸或siRNA的组合物可以用于治疗乳腺癌。此外，本发明提供了用本发明多肽的表达水平作为诊断标记来诊断乳腺癌的方法。

本发明的诊断方法优选包括以下步骤：(a)检测本发明B1194，A2282V1，A2282V2或A2282V3基因的表达水平；和(b)将表达水平的升高与乳腺癌关联。

B1194，A2282V1，A2282V2或A2282V3基因在具体标本中的表达水平可以通过定量由B1194，A2282V1，A2282V2或A2282V3基因编码的蛋白的相应mRNA来评价。mRNA定量方法是本领域已知的。例如，B1194，A2282V1，A2282V2或A2282V3基因的mRNA水平可通过Northern印迹或RT-PCR评估。由于B1194，A2282V1，A2282V2或A2282V3基因的全长核苷酸序列示于SEQ ID NO：1，3，5或7中，本领域任何技术人员可以设计探针或引物的核苷酸序列来定量B1194，A2282V1，A2282V2或A2282V3基因。

B1194，A2282V1，A2282V2或A2282V3基因的表达水平还可以根据这些基因编码的蛋白的活性或量来分析。测定B1194，A2282V1，A2282V2或A2282V3蛋白的量的方法见下文。例如，可以用免疫分析方法测定生物材料中的蛋白。任何生物材料都可以用于测定蛋白或其活性。例如，可以通过分析血液样品来评估血清标记物所编码的蛋白。另一方面，可以根据B1194，A2282V1，A2282V2或A2282V3基因各自编码的蛋白的待分析活性，选用合适的方法，来测定蛋白活性。

按照本发明的方法，评估标本(受试样品)中B1194，A2282V1，A2282V2或A2282V3基因的表达水平，并与正常样品中的水平进行比较。当比较显示靶基因的表达水平高于正常样品中的水平时，将该受试者判为患有乳腺癌。B1194，A2282V1，A2282V2或A2282V3基因在正常样品和受试者的标本中的表达水平可以同时测定。或者，可以分析对照组收集的标本，基于所得结果用统计学方法确定该表达水平的正常范围。将受试者样品的结果与正常范围比较，当该结果并未落在正常范围内时，将该受试者判为患有乳腺癌。

本发明还提供了诊断乳腺癌的诊断试剂。本发明的诊断试剂包含与本发明多核苷酸或多肽结合的化合物。优选地，可以用与本发明多核苷酸杂交的寡核苷酸，或与本发明多肽结合的抗体作为这样的化合物。

VII.对乳腺癌的治疗进行监测

B1194，A2282V1，A2282V2和A2282V3基因的表达水平也使得能监测乳腺癌治疗的疗程。在此方法中，由接受乳腺癌治疗治疗的受试者提供受试细胞群体。必要时，在治疗之前、当中和/或之后的不同时间点由受试者获得受试细胞群体。然后测定B1194，A2282V1，A2282V2和A2282V3基因中一种或多种基因在该细胞群体中的表达，并与包括已知乳腺癌状态的细胞的参照细胞群体相比较。在本发明的上下文中，参照细胞应未曾暴露于所述治疗之中。

如果参照细胞群体不含有乳腺癌细胞，B1194，A2282V1，A2282V2和A2282V3基因中一或多种基因在受试细胞群体和参照细胞群体中的表达相似性表明，所述治疗是有效的。而这些基因在受试细胞群体和正常对照参照细胞群体中的表达差异则表明，临床结果或预后不太好。同样，如果参照细胞群体含有乳腺癌细胞，一种或多种本发明基因在受试细胞群体和参照细胞群体中的表达差异表明，所述治疗是有效的，而这些基因在受试细胞群体和参照细胞群体中的表达相似性表明，临床结果或预后不太好。

另外，可将本发明所述基因在治疗后从受试者生物样品中测定的表达水平(即治疗后的水平)与B1194，A2282V1，A2282V2和A2282V3基因中一或多种基因在开始治疗之前从受试者生物样品中测定的表达水平(即治疗前的水平)相比较。治疗后样品中表达水平的降低表明，所述治疗是有效的，而治疗后样品中表达水平的增加或维持则表明，临床结果或预后不太好。

本文中，术语“有效的”是指，所述治疗导致受试者体内因病而被上调的基因的表达降低，因病而被下调的基因的表达增加，或乳腺导管癌的大小、流行性或转移潜力降低。当将所述治疗用于预防时，术语“有效的”是指，该治疗能延迟或防止乳腺肿瘤的形成，或者能延迟、防止或减轻乳腺癌的临床症状。可使用标准的临床方案评估乳腺肿瘤。

另外，可与任何已知的诊断或治疗乳腺癌的方法相关联来判定有效性。例如，通过鉴定症状的异常，如体重减轻、腹痛、背痛、食欲减退、恶心、呕吐、全身不适、虚弱和黄疸即可诊断乳腺癌。

VIII.治疗乳腺癌

本发明还提供了使用本发明的多肽筛选治疗乳腺癌的化合物的方法。这类筛选方法的一个实施方案包括以下步骤：(a)使受试化合物与本发明的多肽接触，(b)检测本发明多肽与受试化合物之间的结合活性，和(c)选择与本发明多肽结合的化合物。

用于筛选的本发明多肽可以是重组多肽或得自天然的蛋白，或其部分肽。可以使用任何受试化合物，例如细胞提取物、细胞培养上清、发酵微生物的产物、海洋生物提取物、植物提取物、纯化的或粗的蛋白、肽、非-肽化合物、合成的小分子化合物和天然化合物。与受试化合物接触的本发明多肽可以是例如纯化的多肽、可溶性蛋白、与载体结合的形式，或与其它多肽融合的融合蛋白。

至于用本发明多肽筛选蛋白(例如与本发明多肽结合的蛋白)的方法，可以使用多种本领域技术人员众所周知的方法。通过例如免疫沉淀法，特别是按照下述方式即可进行所述筛选。通过将编码本发明多肽的基因插入外源基因表达载体，如pSV2neo，pcDNAI和pCD8，可以在动物细胞中表达所述基因。用于表达的启动子可以是任何常用的启动子，包括例如SV40早期启动子(Rigby in Williamson(ed.)，Genetic Engineering，vol.3.Academic Press，London，83-141(1982))、EF-1α启动子(Kim et al.，Gene 91：217-23(1990))、CAG启动子(Niwa et al.，Gene 108：193-9(1991))、RSV LTR启动子(Cullen，Methods in Enzymology 152：684-704(1987))、SRα启动子(Takebe et al.，MolCell Biol 8：466-72(1988))、CMV即早期启动子(Seed and Aruffo，Proc NatlAcad Sci USA 84：3365-9(1987))、SV40晚期启动子(Gheysen and Fiers，J MolAppl Genet 1：385-94(1982))、腺病毒晚期启动子(Kaufman et al.，Mol CellBiol 9：946-58(1989))、HSV TK启动子等。可根据任何方法将基因导入动物细胞以表达外源基因，所述方法如电穿孔法(Chu et al.，Nucleic Acids Res 15：1311-26(1987))、磷酸钙法(Chen and Okayama，Mol Cell Biol 7：2745-52(1987))、DEAE葡聚糖法(Lopata et al.，Nucleic Acids Res 12：5707-17(1984)；Sussman and Milman，Mol Cell Biol 4：1641-3(1984))、脂转染法(Derijard B，Cell 76：1025-37(1994)；Lamb et al.，Nature Genetics 5：22-30(1993)：Rabindran et al.，Science 259：230-4(1993))等。可将本发明的多肽表达成含有单克隆抗体识别位点(表位)的融合蛋白，方法是在本发明多肽的N-端或C-端导入显示特异性的单克隆抗体表位。可以使用商购的表位-抗体系统(Experimental Medicine 13：85-90(1995))。利用其多克隆位点表达与例如β-半乳糖苷酶、麦芽糖-结合蛋白、谷胱甘肽S-转移酶、绿色荧光蛋白(GFP)等的融合蛋白的载体可以商购。

本文还报道了通过仅导入由几个至十几个氨基酸组成的小表位而制备的融合蛋白，以致于融合不会改变本发明多肽的特性。诸如聚组氨酸(His-标记)、流感病毒聚集体HA、人c-myc、FLAG、水泡性口炎病毒糖蛋白(VSV-GP)、T7基因10蛋白(T7-标记)、人单纯疱疹病毒糖蛋白(HSV-标记)、E-标记(单克隆噬菌体上的表位)等表位和识别它们的单克隆抗体可用作表位-抗体系统，用于筛选与本发明多肽结合的蛋白(Experimental Medicine13：85-90(1995))。

在免疫沉淀中，通过在使用适当去污剂制备的细胞裂解物中加入这些抗体以形成免疫复合物。免疫复合物由本发明的多肽、具有与所述多肽的结合亲和力的多肽和抗体组成。除了使用抗上述表位的抗体外，还可使用可按上文所述制备的抗本发明多肽的抗体进行免疫沉淀。

当抗体是小鼠IgG抗体时，可通过例如蛋白A Sepharose凝胶或蛋白GSepharose凝胶沉淀免疫复合物。如果本发明的多肽被制备成与表位，如GST的融合蛋白，可按照与使用抗本发明多肽的抗体相同的方式，使用与这些表位特异性结合的物质，如谷胱甘肽-Sepharose 4B形成免疫复合物。

免疫沉淀可根据或按照例如以下文献所述方法进行(Harlow and Lane，Antibodies，511-52，Cold Spring Harbor Laboratory publications，New York(1988))。

SDS-PAGE常用于分析被免疫沉淀的蛋白，使用具有适当浓度的凝胶，通过蛋白的分子量可分析结合的蛋白。由于通过普通的染色法，如考马斯染色或银染难以检测与本发明多肽结合的蛋白，通过在含有放射性同位素³⁵S-甲硫氨酸或³⁵S-半胱氨酸的培养基中培养细胞，标记细胞中的蛋白并检测蛋白即可改善蛋白的检测敏感性。当已揭示出蛋白的分子量时，可直接从SDS-聚丙烯酰胺凝胶中纯化靶蛋白并测定其序列。

至于使用本发明多肽筛选与所述多肽结合的蛋白的方法，可以使用例如West-Western印迹分析(Skolnik et al.，Cell 65：83-90(1991))。具体地说，可通过下述步骤获得与本发明多肽结合的蛋白：使用噬菌体载体(如ZAP)，由有望表达与本发明多肽结合的蛋白的细胞、组织、器官(例如，筛选与B1194结合的蛋白时，所述组织如睾丸和乳腺癌细胞系；筛选与A2282V1，A2282V2，A2282V3结合的蛋白时，所述组织为乳腺癌细胞系)或经培养的细胞制备cDNA文库，在LB-琼脂糖上表达蛋白，将表达的蛋白固定于滤膜上，使经纯化和标记的本发明多肽与上述滤膜反应，以及根据标记检测表达与本发明多肽结合的蛋白的噬斑。利用生物素与亲和素之间的结合，或利用与本发明多肽特异性结合的抗体，或与本发明多肽融合的肽或多肽(如GST)，可以标记本发明的多肽。也可利用使用放射性同位素或荧光等方法。

或者，在本发明筛选方法的另一个实施方案中，可使用利用细胞的双-杂合系统(“MATCHMAKER双-杂合系统(Two-Hybrid system)”，“哺乳动物MATCHMAKER双-杂合试验试剂盒”，“MATCHMAKER单-杂合系统(one-Hybrid system)”(Clontech)；“HybriZAP双-杂合载体系统”(Stratagene)；参见文献“Dalton and Treisman，Cell 68：597-612(1992)”，“Fields andSternglanz，Trends Genet 10：286-292(1994)”)。

在双-杂合系统中，本发明的多肽与SRF-结合区或GAL4-结合区融合并在酵母细胞中表达。cDNA文库制备自有望表达与本发明多肽结合的蛋白的细胞，使得所述文库表达时能与VP16或GAL4转录激活区融合。然后将cDNA文库导入上述酵母细胞，从检测到的阳性克隆中分离得自文库的cDNA(当在酵母细胞中表达与本发明多肽结合的蛋白时，两者的结合激活了报道基因，使得阳性克隆能被检测到)。通过将上文分离到的cDNA导入大肠杆菌并表达蛋白即可制备由cDNA编码的蛋白。

至于报道基因，除了HIS3基因外，还可使用例如Ade2基因、lacZ基因、CAT基因、萤光素酶基因等。

也可使用亲和层析筛选与本发明多肽结合的化合物。例如，可将本发明的多肽固定在亲和柱的载体上，将含有能与本发明多肽结合的蛋白的受试化合物上样于亲和柱。本文中的受试化合物可以是例如细胞提取物、细胞裂解物等。上样受试化合物之后，洗涤柱，即可制备与本发明多肽结合的化合物。

当受试化合物是蛋白时，分析所得蛋白的氨基酸序列，基于所述序列合成寡DNA，使用该寡DNA作为探针筛选cDNA文库以获得编码蛋白的DNA。

在本发明中，使用表面胞质基因组共振现象的生物传感器可用作检测或定量结合化合物的仪器。当使用所述生物传感器时，仅使用极少量的多肽并且无需标记，即可实时观察到表现为表面胞质基因组共振信号的本发明多肽和受试化合物之间的相互作用(例如BIAcore，Pharmacia)。因此，可以使用生物传感器，如BIAcore评价本发明多肽和受试化合物之间的结合。

当固定化的本发明多肽暴露于合成化合物、或天然物质库，或随机噬菌体肽展示文库时筛选结合分子的方法，以及基于组合化学技术(Wrightonet al.，Science 273：458-63(1996)；Verdine，Nature 384：11-13(1996))进行高通量筛选从而不仅分离出蛋白，还分离出与本发明蛋白结合的化合物(包括激动剂和拮抗剂)的方法，都是本领域技术人员众所周知的。

或者，本发明的筛选方法可包括下述步骤：

a)使候选化合物与已导入载体的细胞接触，所述载体含有一个或多个标记基因的转录调节区和在转录调节区控制之下表达的报道基因，其中一个或多个标记基因选自B1194，A2282V1，A2282V2和A2282V3，

b)测定所述报道基因的表达或活性；和

c)选择与缺乏受试化合物时检测到的所述报道基因的表达或活性水平相比，能降低所述报道基因的表达或活性水平的化合物。

适当的报道基因和宿主细胞是本领域众所周知的。通过使用标记基因的转录调节区，可以制备出该筛选所需的报道构建体。当标记基因的转录调节区已为本领域技术人员所知时，使用先前已知的序列信息即可制备报道构建体。当仍未鉴定出标记基因的转录调节区时，可基于标记基因的核苷酸序列信息，从基因组文库中分离出含有转录调节区的核苷酸区段。

所述筛选分离出的化合物是抑制本发明多肽的活性并因此可用于治疗或预防乳腺癌的候选药物。本发明筛选方法所得的化合物还包括，对于由所述筛选方法获得的、具有结合本发明多肽的活性的化合物，将其部分结构通过添加、缺失和/或置换进行变换得到的化合物。

在另一实施方案中，本发明提供了筛选有可能作为乳腺癌治疗目标的候选物质的方法。如上文祥述，通过控制B1194，A2282V1，A2282V2或A2282V3蛋白的表达水平，可以控制乳腺癌的发生和进展。故，有可能作为乳腺癌治疗目标的候选物质可以通过用B1194，A2282V1，A2282V2，A2282V3的表达水平和活性作为指标进行筛选而鉴别出。在本发明的上下文中，所述筛选包括例如下述步骤：

a)使候选化合物与表达B1194，A2282V1，A2282V2或A2282V3蛋白的细胞接触；和

b)选出与缺乏所述受试化合物时检测到的表达水平相比，能降低B1194，A2282V1，A2282V2或A2282V3表达水平的化合物。

表达B1194，A2282V1，A2282V2或A2282V3中至少一种蛋白的细胞包括例如，由乳腺癌建立的细胞系；所述细胞可用于本发明的上述筛选。表达水平可通过本领域技术人员众所周知的方法评价。在筛选方法中，可将能降低B1194，A2282V1，A2282V2或A2282V3中至少一种蛋白的表达水平的化合物选为候选药剂。

在本发明筛选治疗乳腺癌所用化合物的方法的另一实施方案中，所述方法利用本发明多肽的生物活性作为指标。由于本发明的B1194，A2282V1，A2282V2或A2282V3蛋白具有促进细胞增殖的活性，可以用此活性作为指标，筛选出抑制本发明这些蛋白中一种蛋白的此活性的化合物。此外，本发明证实，A2282V1，A2282V2和A2282V3蛋白具有蛋白激酶活性。因此，可以用此活性作为指标，筛选出抑制A2282V1，A2282V2或A2282V3蛋白中一种蛋白的蛋白激酶活性的化合物。所述筛选方法包括以下步骤：(a)使受试化合物与本发明的多肽接触；(b)检测步骤(a)中多肽的生物活性；和(c)选出与缺乏受试化合物时检测到的生物活性相比，抑制多肽生物活性的化合物。

任何多肽都可用于筛选，只要它们具有B1194，A2282V1，A2282V2或A2282V3蛋白的生物活性即可。所述生物活性包括，人B1194，A2282V1，A2282V2或A2282V3蛋白的细胞-增殖活性，或者A2282V1，A2282V2或A2282V3蛋白的蛋白激酶活性。例如，可使用人B1194，A2282V1，A2282V2或A2282V3蛋白，也可使用与这些蛋白功能等同的多肽。这样的多肽可由细胞内源表达或外源表达。

在本发明中，A2282V1，A2282V2或A2282V3蛋白的生物活性优选蛋白激酶活性。本领域技术人员可以推定蛋白激酶活性。例如，可以使表达A2282V1，A2282V2或A2282V3中至少一种蛋白的细胞与受试化合物在有[γ-³²P]-ATP存在的情况下接触。接着，可以测定被A2282V1，A2282V2或A2282V3蛋白的蛋白激酶活性导致磷酸化的蛋白。为了检测磷酸化蛋白，可以使用SDS-PAGE或免疫沉淀。此外，识别磷酸化酪氨酸残基的抗体也可以用于测定磷酸化蛋白的水平。

可以使用任何受试化合物，例如细胞提取物、细胞培养上清、发酵微生物的产物、海洋生物提取物、植物提取物、纯化的或粗的蛋白、肽、非-肽化合物、合成的小分子化合物或天然化合物。

通过所述筛选分离出的化合物是本发明多肽的候选拮抗剂。术语“拮抗剂”是指，通过与本发明多肽结合而抑制该多肽功能的分子。另外，通过所述筛选分离出的化合物是抑制本发明多肽与分子(包括DNA和蛋白)的体内相互作用的候选化合物。

当本发明方法所要检测的生物活性是细胞增殖时，可以通过例如以下方法进行检测：制备表达本发明多肽的细胞，在受试化合物存在的情况下培养所述细胞，按实施例所述测定细胞增殖的速度、测定细胞周期等、以及测定集落形成活性。

IX.分离的化合物和药物组合物

通过上述筛选分离出的化合物是抑制本发明多肽活性的候选药物，可用于治疗乳腺癌。更具体地，当用B1194，A2282V1，A2282V2或A2282V3蛋白的生物活性作为指标时，通过本发明的方法筛选的化合物可用作治疗乳腺癌的候选药物。

此外，用本发明筛选方法获得的化合物还包括，将抑制B1194，A2282V1，A2282V2或A2282V3蛋白活性的化合物的部分结构通过添加、缺失和/或置换进行变换得到的化合物。

将本发明方法分离出的化合物，作为人用和其它哺乳动物(如小鼠、大鼠、豚鼠、兔、猫、狗、羊、猪、牛、猴、狒狒、黑猩猩)用药物，治疗乳腺癌时，可直接施用分离的化合物，或使用已知的药物配制方法将其配制成剂量形式。例如，根据需要，药物可以是糖衣片剂、胶囊、酏剂和微囊剂型口服药物，或者以溶于水或任何其它可药用液体的无菌溶液或悬浮液注射剂形式非口服给药。例如，可以将所述化合物与可药用载体或介质混合成常规药物实践所需的单位剂量形式，所述载体或介质具体例如无菌水、生理盐水、植物油、乳化剂、悬浮剂、表面活性剂、稳定剂、增味剂、赋形剂、运载体(vehicle)、保存剂、结合剂等。这些制品中活性成分的量能提供指定范围内的适当剂量。

可与片剂和胶囊混合的添加剂的例子有：明胶、玉米淀粉、黄蓍胶和阿拉伯胶等结合剂；晶体纤维素等赋形剂；玉米淀粉、明胶和藻酸等膨胀剂；硬脂酸镁等润滑剂；蔗糖、乳糖或糖精等甜味剂；胡椒薄荷、Gaultheriaadenothrix油和樱桃等增味剂。当单位剂量形式是胶囊时，上述成分中还可包括液体载体，如油。可使用注射用载体，如蒸馏水，根据常规药物实践配制注射用的无菌混合物。

生理盐水、葡萄糖和其它等渗液体包括助剂，如D-山梨糖醇、D-甘露糖、D-甘露醇和氯化钠可用作注射用的水溶液。它们可与适当的增溶剂，如醇，特别是乙醇；聚醇，如丙二醇和聚乙二醇；非离子型表面活性剂，如Polysorbate 80(TM)和HCO-50一起使用。

芝麻油或豆油可用作油质液体，并可与苯甲酸苄酯或苄醇一起用作增溶剂，并可与如磷酸缓冲液和醋酸钠缓冲液的缓冲液；如盐酸普鲁卡因的止痛剂；如苄醇、酚的稳定剂；和抗氧化剂一起配制。可将制备好的注射液注入适当的安瓿中。

可使用本领域技术人员众所周知的方法给患者施用本发明的药物组合物，例如以动脉内、静脉内、经皮注射给药和鼻内、经支气管、肌内或口服给药。给药剂量和方法随患者体重和年龄的变化而改变；然而，本领域技术人员可常规选择给药剂量和方法。如果所述化合物可由DNA编码，可将DNA插入基因治疗载体，施用所述载体以进行治疗。给药剂量和方法随患者体重、年龄和症状的变化而改变；但本领域技术人员可适当选择给药剂量和方法。

例如，当给正常成人(体重为60kg)口服给药时，尽管根据症状的不同有一些差异，但与本发明多肽结合并调节其活性的化合物剂量约为0.1mg至100mg/天，优选约为1.0mg至50mg/天，更优选约为1.0mg至20mg/天。

当以注射液形式给正常成人(体重为60kg)非肠道给药时，尽管根据患者、靶器官、症状和给药方法的不同有一些差异，但合适的静脉内注射剂量约为0.01mg至30mg/天，优选约为0.1至20mg/天，更优选约为0.1至10mg/天。当给其它动物给药时，可以施用被转换成60kg体重的量。

另外，本发明提供了使用抗本发明多肽的抗体治疗或预防乳腺癌的方法。根据此方法，需施用药物有效量的抗本发明多肽的抗体。由于B1194，A2282V1，A2282V2或A2282V3蛋白的表达在癌细胞中被上调，因此抑制这些蛋白的表达可导致细胞增殖活性降低，通过抗体与这些蛋白的结合有望治疗或预防乳腺癌。因此，可以以足以降低本发明蛋白活性的剂量施用抗本发明多肽的抗体，所述剂量范围是0.1至约250mg/kg/天。成人的剂量范围一般约为5mg至17.5g/天，优选约为5mg至10g/天，最优选约为100mg至3g/天。

或者，用与特异于肿瘤细胞的细胞表面标记结合的抗体作为药物传递的工具。例如，以足以损伤肿瘤细胞的剂量施用与细胞毒性剂偶联的抗体。

X.诱导抗肿瘤免疫力的方法和肿瘤疫苗

本发明还涉及诱导抗-肿瘤免疫力的方法，包括施用B1194，A2282V1，A2282V2或A2282V3蛋白或其免疫活性片段，或编码所述蛋白或其片段的多核苷酸的步骤。B1194，A2282V1，A2282V2或A2282V3蛋白或其免疫活性片段可用作抗乳腺癌的疫苗。在一些例子中，所述蛋白或其片段可以以与T细胞受体(TCR)结合的形式、或者以被抗原呈递细胞(APC)呈递的形式来施用，所述APC例如巨噬细胞、树突细胞(DC)、或B细胞。由于DC呈递抗原的能力很强，因此众多APC中最优选DC。

在本发明中，抗乳腺癌疫苗是指，当接种至动物后能诱导抗-肿瘤免疫力的物质。一般说来，抗-肿瘤免疫力包括如下所述的免疫应答：

-诱导抗乳腺癌的细胞毒淋巴细胞，

-诱导识别乳腺癌的抗体，和

-诱导产生抗-肿瘤的细胞因子。

因此，当一种蛋白接种至动物后可诱导上述任一种免疫应答时，可以将该蛋白视为具有诱导抗-肿瘤免疫力的作用。蛋白诱导抗-肿瘤免疫力的作用，可通过观察宿主免疫系统在体内或体外抗该蛋白的反应来检测出。

例如，检测对细胞毒T淋巴细胞的诱导作用的方法是众所周知的。进入活体的外源物质通过抗原呈递细胞(APC)的作用被呈递至T细胞和B细胞。以抗原特异性方式对APC呈递的抗原作出反应的T细胞因受抗原的刺激而分化成细胞毒T细胞(或细胞毒T淋巴细胞；CTL)，然后进行增殖(也称作T细胞激活)。因此，通过用APC将一种肽呈递至T细胞，并检测对CTL的诱导作用即可评价该肽的CTL诱导活性。另外，APC具有激活CD4+T细胞、CD8+T细胞、巨噬细胞、嗜酸性粒细胞和NK细胞的作用。由于CD4+T细胞和CD8+T细胞对于抗-肿瘤免疫力也很重要，因此，使用这些细胞的激活作用作为指标，即可评价所述肽的抗-肿瘤免疫力诱导作用。

以树状细胞(DC)作为APC评价CTL诱导作用的方法是本领域众所周知的。DC是众多APC中具有最强CTL诱导作用的代表性APC。在此方法中，起初使受试多肽与DC接触，然后使该DC与T细胞接触。与DC接触后检测到具有针对感兴趣细胞的细胞毒作用的T细胞，这表明受试多肽具有诱导细胞毒T细胞的活性。例如，使用⁵¹Cr-标记的肿瘤细胞的裂解作为标志，可以检测抗肿瘤的CTL活性。或者，使用³H-胸苷摄取活性或LDH(乳糖脱氢酶)-释放作为标志评价肿瘤细胞损害程度的方法也是众所周知的。

APC不限于DC，也可使用外周血单核细胞(PBMC)。有报道表明，在有GM-CSF和IL-4存在的条件下培养PBMC可以增强CTL诱导作用。同样，已证实，在有匙孔戚血蓝蛋白(keyhole limpet hemocyanin，KLH)和IL-7存在的条件下培养PBMC可以诱导CTL。

经这些方法证实具有CTL诱导活性的受试多肽，是具有DC激活作用继而具有CTL诱导活性的多肽。因此，能诱导针对肿瘤细胞的CTL的多肽可用作抗肿瘤疫苗。另外，通过与多肽接触获得诱导抗肿瘤CTL的能力的APC可用作抗肿瘤疫苗。另外，因APC呈递多肽抗原而获得细胞毒性的CTL也可用作抗肿瘤疫苗。使用APC和CTL所导致的抗-肿瘤免疫力的肿瘤治疗方法被称为细胞免疫治疗。

一般而言，当使用多肽进行细胞免疫治疗时，已知混合多种具有不同结构的多肽并将它们与DC接触可以增加CTL-诱导的效率。因此，当用蛋白片段刺激DC时，使用多种类型的片段较为有利。

或者，通过观察诱导抗肿瘤抗体产生的效果，可以证实多肽的抗-肿瘤免疫力诱导作用。例如，当在用多肽免疫的实验室动物中诱导出抗该多肽的抗体时，以及当肿瘤细胞的生长被这些抗体抑制时，可以判定所述多肽具有诱导抗-肿瘤免疫力的能力。

抗肿瘤免疫力可通过施用本发明的疫苗来诱导，诱导出抗肿瘤免疫力能治疗和预防乳腺癌。抗癌疗法或预防癌症发生包括下述任一种步骤：如抑制癌细胞生长、癌退化和抑制癌发生。治疗或预防癌症还包括，降低患癌个体死亡率、减少血液中肿瘤标记、减轻与癌症相伴随、且可检测的症状等。优选所述治疗和预防效果具有统计学显著性。例如，通过观察发现，与未施用疫苗的对照相比，抗乳腺癌疫苗的治疗或预防效果具有5％或更低的显著性水平。例如，可用Student′s t-检验、Mann-Whitney U-检验或ANOVA进行统计学分析。

上述具有免疫活性的蛋白或编码该蛋白的载体可与佐剂混合。佐剂是指，当与具有免疫活性的蛋白一起(或相继)施用时，能增强抗该蛋白的免疫应答的化合物。佐剂的例子包括霍乱毒素、沙门氏菌毒素、明矾等，但并不局限于此。另外，本发明的疫苗可与可药用载体适当混合。所述载体的例子是无菌水、生理盐水、磷酸缓冲液、培养液等。另外，必要时疫苗还可含有稳定剂、悬浮剂、保存剂、表面活性剂等。疫苗可全身或局部施用。可通过单次给药施用疫苗，或通过多次给药加强免疫。

当使用APC或CTL作为本发明的疫苗时，可通过例如来自体内的方法治疗或预防肿瘤。更具体地，收集接受治疗或预防的受试者的PBMC，使来自体内的细胞与多肽接触，诱导APC或CTL之后，可给受试者施用细胞。也可通过在来自体内的PBMC中导入编码多肽的载体来诱导APC。在给药前可克隆在体外诱导的APC或CTL。通过克隆和培养具有较高靶细胞损害活性的细胞，可更有效地进行细胞免疫治疗。另外，按此方式分离的APC和CTL，不仅可用于针对产生这些细胞的个体进行细胞免疫治疗，还可用于针对来自其它个体的相似类型肿瘤进行细胞免疫治疗。

另外，本发明提供了用于治疗或预防乳腺癌的药物组合物，其含有药物有效量的本发明多肽。药物组合物可用于产生抗肿瘤免疫力。B1194的正常表达局限于睾丸；但未发现A2282V1，A2282V2和A2282V3在正常器官中的表达。因此，抑制这些基因不会对其它器官有不利影响。因此，优选使用B1194，A2282V1，A2282V2和A2282V3多肽治疗乳腺癌。在本发明中，将所述多肽或其片段以足以诱导抗肿瘤免疫力的剂量给药，所述剂量为0.1mg-10mg、优选0.3mg-5mg、更优选0.8mg-1.5mg。可重复给药。例如，可以每2周4次施用1mg所述多肽或其片段，来诱导抗肿瘤免疫力。

在下文中，参照实施例更详细描述本发明。但以下描述的材料、方法和实施例仅仅是举例说明本发明的一些方面，无论如何都不打算限制本发明的范围。因此，与本文所述类似的方法和材料可以用于实践或测试本发明。

实施例

从上述公开内容可以看出，本发明具有广泛的应用。相应地，以下实施例只是为了举例说明的目的，并不想被理解为以任何方式限制本发明。本领域技术人员很容易认识到，可以变更或改变多种并非重要的参数，得到基本相似的结果。

实施本发明的最佳形式

本发明通过以下实施例举例说明，但并不限于这些实施例。

实施例1-材料和方法

(1)细胞系和临床材料

人乳腺癌细胞系HBL100，HCC1937，MCF7，MDA-MB-435S，YMB1，SKBR3，T47D，宫颈癌HeLa和COS-7细胞系购自美国典型培养物保藏中心(ATCC)，按照它们各自保藏人的建议进行培养。HBC4，HBC5和MDA-MB-231细胞系由Dr.Yamori，Molecular Pharmacology，CancerChemotherapy Center of the Japanese Foundation for Cancer Research惠赠。

所有细胞都在合适的培养基中培养：即用RPMI-1640(Sigma，St.Louis，MO)培养HBC4，HBC5，SKBR3，T47D，YMB1和HCC1937(添加2mM L-谷胺酰胺)；用DMEM(Invitrogen，Carlsbad，CA)培养HBL100，COS7；用EMEM(Sigma)添加0.1mM必需氨基酸(Roche)，1mM丙酮酸钠(Roche)，0.01mg/ml胰岛素(Sigma)来培养MCF-7；用L-15(Roche)培养MDA-MB-231和MDA-MB-435S。每种培养基都添加10％胎牛血清(Cansera)和1％抗生素/抗有丝分裂溶液(Sigma)。MDA-MB-231和MDA-MB-435S细胞维持在37℃、无CO₂的湿境中。其它细胞系维持在37℃、5％CO₂的湿境中。临床样品(乳腺癌和正常乳腺导管)从外科手术标本获得，并且事先都征得病人同意。

(2)在cDNA微阵列上分离新的人基因

制作cDNA微阵列玻片(slide)的方法已有记载(Ono K，et al.，(2000).Cancer Res，60，5007-5011)。每一次分析表达谱时，制作两套含27,648个cDNA点的玻片，以减少实验波动。简言之，从每一份经过激光显微解剖的(laser-micro dissected)细胞的样品纯化总RNA，进行基于T7的RNA扩增，获得足以进行微阵列实验的量的RNA。将从乳腺癌细胞和正常导管细胞扩增得到的RNA取等份试样，分别用Cy5-dCTP和Cy3-dCTP(AmershamBiosciences，Buckinghamshire，UK)通过逆转录进行标记。按文献记载进行杂交、洗涤和检测(Ono K，et al.，(2000).Cancer Res，60，5007-5011)。为检测在乳腺癌中普遍上调的基因，对微阵列上27,648个基因的总体表达模式进行筛选，在总共77例绝经前乳腺癌病例中，筛出50％以上的基因的表达比＞2.0。最终鉴定出总共468个在肿瘤细胞中上调的基因。

为检测在乳腺癌中普遍上调的基因，对微阵列上27,648个基因的总体表达模式进行筛选，分别在i)总共77例绝经前乳腺癌病例、ii)69例侵袭性导管腺癌、iii)31例高分化病变、iv)14例中分化病变、或v)24例低分化病变中，筛出50％以上的基因的表达比＞3.0。最终选出总共493个在肿瘤细胞中上调的基因。

(3)半定量RT-PCR分析

从每一群激光捕获细胞提取总RNA，按文献记载进行基于T7的扩增和逆转录(Kitahara O，et al.，Cancer Res 61，3544-3549(2001))。监控甘油醛-3-磷酸脱氢酶(GAPDH)作为定量内部对照，制备每一单链cDNA的适当稀释物。

GAPDH的PCR引物序列是5′-CGACCACTTTGTCAAGCTCA-3′(SEQID NO.9)和5′-GGTTGAGCACAGGGTACTTTATT-3′(SEQ ID NO.10)，

B1194的PCR引物序列是5′-TGGGTAACAAGAGAATGGTTCA-3′(SEQID NO.11)和5′-ATCCAAGTCCTAATCCCTTTGG-3′(SEQ ID NO.12)；

A2282的PCR引物序列是5′-GCTGCAAGGTATAATTGATGGA-3′(SEQID NO.13)和5′-CAGTAACATAATGACAGATGGGC-3′(SEQ ID NO.14)。

(4)Northern印迹分析

使用Rneasy试剂盒(QIAGEN)，按厂商说明，从所有乳腺癌细胞系中提取总RNA。用DNase I(Nippon Gene，Osaka，Japan)处理后，使用mRNA纯化试剂盒(Amersham Biosciences)，按厂商说明分离mRNA。对每种mRNA，以及从正常成人肺、心脏、肝脏、肾脏、骨髓、脑分离的polyA(+)RNA(BD，Clontech，Palo Alto，CA)，取1-μg等份试样，在1％变性琼脂糖凝胶上分离，并转移至尼龙膜上(乳腺癌-Northern印迹)。通过RT-PCR制备B1194和A2282的PCR产物，用[α³²P]-dCTP-标记，使之与多种人组织的Northern印迹(Clontech，Palo Alto，CA)以及与乳腺癌-Northern印迹杂交(见下文)。根据厂商推荐的方法进行预-杂交、杂交和洗涤。于-80℃用增感屏使印迹放射自显影14天。用引物套5’-TGG GTAACAAGAGAATGGTTCA-3’(SEQ IDNO.11)和5’-ATCCAAGTCCTAATCCCTTTGG-3’(SEQ ID NO.12)进行PCR，制得B1194的特异性探针(411bp)；用引物套554bp：5’-TTATCACTGTGCTCACCAGGAG-3’(SEQ ID NO.15)和5’-CAGTAACATAATGACAGATGGGC-3’(SEQ ID NO.14)；170bp5’-AAACTTGCCTGCCATATCCTTA-3’(SEQ ID NO.16)和5’-ATTTTGTTGGCTGTCTCTAGCA-3’(SEQ ID NO.17)通过PCR制得A2282的变体1，2和3的特异性探针(554bp)以及A2282的变体1和2的特异性探针(170bp)，用megaprime DNA标记体系(Amersham bioscience)进行放射性标记。

(5)cDNA文库筛选

用superscript^TM质粒体系、gateway^TM cDNA合成技术、克隆试剂盒(Invitrogen)、以及从乳腺癌细胞系T47D获得的poly(A)+RNA，构建cDNA文库，用与变体V1的核苷酸1-1112对应的cDNA探针，筛选该文库中3×10⁶个独立的克隆。

(6)体外翻译试验

将A2282的四种变体(V1，V2，V3和V4)分别克隆到用于构建上述cDNA文库的pSPORT-1表达载体中，将其用作体外转录/翻译试验的模板。所述质粒(1μg)在有ε-标记的生物素化赖氨酸-tRNA存在的情况下，用TNT偶联网织红细胞裂解物体系(Promega，Madison，WI)按厂家说明进行转录和翻译。蛋白产物在5-20％SDS-聚丙烯酰胺梯度胶上电泳分离。电印迹后，生物素化蛋白通过结合链霉亲和素-辣根过氧化物酶、再检测化学发光(Amersham Biosciences)就可以观察到。

(7)构建表达载体

为构建哺乳动物表达载体，用KOD-Plus DNA聚合酶(Toyobo，大阪，日本)、引物套5’-AAAGAATTCGGGTGTCGTTAATGTTCGGGG-3’(SEQ IDNO.18)和5’-AAAGCGGCCGCTTAGGCGGATTTTCCTGCA-3’(SEQ IDNO.19)，通过PCR扩增B1194 cDNA的完整编码序列。将PCR产物插入pCMV-N-myc表达载体(Clontech)的EcoRI和NotI位点。

为构建A2282变体V1、V2和V3的表达载体，由于所有变体含有相同的5’ORF序列，用KOD-Plus DNA聚合酶(Toyobo，大阪，日本)、引物套5’-CGGAATTCACTATGAAAGATTATGATGAAC-3’(SEQ ID NO.20)和5’-AAACTCGAGTACCTTGCAGCTAGATAGGAT-3’(SEQ ID NO.21)，通过PCR扩增每一种A2282变体的cDNA的完整编码序列。将PCR产物插入pCAGGS-HA表达载体的EcoRI和Xho I位点。构建体pCMV-myc-B1194和pCAGGS-A2282-HA通过DNA测序确认。

(8)免疫细胞化学染色

为了检查B1194的亚细胞定位，在Lab-Tek^ II Chamber Slide System(Nalgen Nunc International)中，COS7细胞按每孔5×10⁴个细胞的密度接种B1194，之后，用含有4％低聚甲醛的PBS固定细胞，于4℃用含有0.1％TritonX-100的PBS透化细胞3分钟。用含有3％BSA的PBS室温封闭1小时后，将细胞与小鼠抗-myc 9E10单克隆抗体(0.2μg/ml，Santa Cruz Biotechnology)室温保温1小时。接着，细胞用FITC-偶联山羊抗-小鼠第二抗体染色，在TCS SP2 AOBS显微镜(Leica，东京，日本)下观察。

(9)Western印迹分析

为检查外源B1194和A2282蛋白的表达，将B1194表达质粒pCAGGS-A2282-HA或作为阴性对照的pCMV-N-myc(模拟(Mock))分别瞬时转染至COS7细胞或HeLa细胞中。细胞裂解物在5％-10％SDS-聚丙烯酰胺胶上分离，转移至硝酸纤维素膜，用BlockAce^TM粉末(Dainippon Seiyaku)封闭，用小鼠抗-myc 9E10单克隆抗体、或小鼠抗-HA抗体(0.4μg/ml，SantaCruz Biotechnology)、或作为蛋白上样对照的单克隆β-肌动蛋白抗体1∶1000稀释液(克隆AC-15，Sigma-Aldrich，MO)处理。洗净后，将这些印迹用辣根过氧化物酶偶联驴抗小鼠β-肌动蛋白的IgG抗体(Amersham Biosciences)处理，蛋白通过结合辣根过氧化物酶、随后用化学发光检测(AmershamBiosciences)进行观察。

(10)同步生长和流式细胞术分析

HeLa细胞(1×10⁶)用8μg pCAGGS-A2282-HA表达载体转染，使用FuGENE6(Roche)按厂家建议进行。细胞用艾菲地可宁(aphidicolin)1(μg/ml)转染24小时后，在G1期停滞16小时。将细胞用新鲜培养基洗三次，解放细胞周期，在指定时间点收集细胞。为了使细胞停止在分裂期，将细胞与洛可达唑(Nocodazole)(250ng/ml)一起保温16小时，然后收获。

为了进行FACS分析，将同步生长的贴壁细胞和脱壁细胞取400μl的等份试样，混合后用70％乙醇在4℃进行固定。将细胞用PBS(-)洗两次，然后与含有1μg RNase I的1μl PBS在37℃保温30min。再将细胞在含有50μg碘化丙锭(PI)的1ml PBS中染色。在流式细胞仪(FACScalibur；BectonDickinson，San Diego，CA)中，从至少10000个细胞测定细胞周期各个时期的每一级分的百分比。

(11)构建B1194或A2282特异性-siRNA表达载体

基于载体的RNAi体系，按以前的报道(Shimokawa T，et al.，(2003).Cancer Res，63，6116-6120)，用psiH1BX3.0 siRNA表达载体来建立。将表1中的双链寡核苷酸克隆到psiH1BX载体的BbsI位点中，制得针对B1194的siRNA表达载体(psiH1BX-B1194 Si-1和Si-5)，以及针对A2282的siRNA表达载体(psiH1BX-A2282Si-3和Si-4)。将针对SC(倒序)的双链寡核苷酸

5’-TCCCGCGCGCTTTGTAGGATTCGTTCAAGAGACGAATCCTACAAAGCGCGC-3’(SEQ ID NO.22)和5’-AAAAGCGCGCTTTGTAGGATTCGTCTCTTGAACGAATCCTACAAAGCGCGC-3’(SEQ ID NO.23)，

以及针对LUC(萤光素酶对照)的双链寡核苷酸

5′-TCCCCGTACGCGGAATACTTCGATTCAAGAGATCGAAGTATTCCGCGTACG-3′(SEQ ID NO.24)和5′-AAAACGTACGCGGAATACTTCGATCTCTTGAATCGAAGTATTCCGCGTACG-3′(SEQ ID NO.25)

分别克隆到psiH1BX3.0载体的BbsI位点，制得各自的对照质粒psiH1BX-SC和psiH1BX-LUC。

表1 插入siRNA表达载体的特异性双链寡核苷酸序列

SEQ ID No.

B1194

Si-1

F

5′-TCCCGTATATCTTGCCCTCTGAATTCAAGAGATTCAGAGGGCAAGATATAC-3′

30

		R	5′-AAAAGTATATCTTGCCCTCTGAATCTCTTGAATTCAGAGGGCAAGATATAC-3′	31
		R	5′-AAAAGTATATCTTGCCCTCTGAATCTCTTGAATTCAGAGGGCAAGATATAC-3′	31	Si-5	F	5′-TCCCGTCCGAACACATCTTTGTTTTCAAGAGAAACAAAGATGTGTTCGGAC-3′	32
	R	5′-AAAAGTCCGAACACATCTTTGTTTCTCTTGAAAACAAAGATGTGTTCGGAC-3′	33			F	5′-TCCCGTCCGAACACATCTTTGTTTTCAAGAGAAACAAAGATGTGTTCGGAC-3′	32
	R	5′-AAAAGTCCGAACACATCTTTGTTTCTCTTGAAAACAAAGATGTGTTCGGAC-3′	33	A2282		Si-3	F	5′-TCCCGACATCCTATCTAGCTGCATTCAAGAGATGCAGCTAGATAGGATGTC-3′	34
R	5′-AAAAGACATCCTATCTAGCTGCATCTCTTGAATGCAGCTAGATAGGATGTC-3′	35					F	5′-TCCCGACATCCTATCTAGCTGCATTCAAGAGATGCAGCTAGATAGGATGTC-3′	34
R	5′-AAAAGACATCCTATCTAGCTGCATCTCTTGAATGCAGCTAGATAGGATGTC-3′	35	Si-4		F		5′-TCCCAGTTCATTGGAACTACCAATTCAAGAGATTGGTAGTTCCAATGAACT-3′	36
R	5′-AAAAAGTTCATTGGAACTACCAATCTCTTGAATTGGTAGTTCCAATGAACT-3′	37			F		5′-TCCCAGTTCATTGGAACTACCAATTCAAGAGATTGGTAGTTCCAATGAACT-3′	36

每一siRNA的靶序列见表2。

表2

		靶序列	SEQ ID No.
		靶序列	SEQ ID No.	B1194	Si-1	GTATATCTTGCCCTCTGAA	38
Si-5	GTCCGAACACATCTTTGTT	39			Si-1	GTATATCTTGCCCTCTGAA	38
Si-5	GTCCGAACACATCTTTGTT	39	A2282		Si-3	GACATCCTATCTAGCTGCA	40
Si-4	AGTTCATTGGAACTACCAA	41			Si-3	GACATCCTATCTAGCTGCA	40

(12)B1194或A2282的基因沉默作用

将人乳腺癌细胞系T47D或MCF-7铺于15-cm平皿中(4×10⁶个细胞/皿)，用FuGENE6试剂(Roche)，按厂商推荐的方法，转染16μg psiH1BX-LUC(萤光素酶对照)、psiH1BX-SC(倒序对照，作为阴性对照)、psiH1BX-A2282或psiH1BX-B1194。转染24小时后，将细胞再接种，进行集落形成试验(3×106个细胞/10cm皿)、RT-PCR (1×10⁶个细胞/10cm皿)和MTT试验(5×10⁵个细胞/孔)。用含有0.7或0.6mg/ml新霉素(Geneticin，Gibco)的培养基，从T47D或MCF-7细胞中选出分别导入了B1194或A2282的细胞。之后，在3周内每两天更换培养基。为评价siRNA功能，从新霉素筛选后第4天的细胞提取总RNA，用特异于B1194或A2282的引物以及特异于β2MG的引物，通过半定量RT-PCR确认siRNA的敲减作用，所述引物具体是：作为内部对照的特异于β2MG的引物5’-TTAGCTGTGCTCGCGCTACT-3’(SEQ IDNO.26)和5’-TCACATGGTTCACACGGCAG-3’(SEQ ID NO.27)；特异于B 1194的引物5’-TTAAGTGAAGGCTCTGATTCTAGTT-3’(SEQ ID NO.28)和5’-GTCCTTATTGGCTGGTTCGTT-3’(SEQ ID NO.29)；特异于A2282的引物5’-TTATCACTGTGCTCACCAGGAG -3(SEQ ID NO.15)和5’-CAGTAACATAATGACAGATGGGC-3’(SEQ ID NO.14)。

另外，将使用T47D或MCF-7细胞、表达siRNA的转染子在含有0.7mg/ml新霉素的选择培养基中培养28天。将转染细胞用4％低聚甲醛固定，之后用Giemsa溶液染色，评价集落形成。用MTT试验定量测定细胞生存力。在含新霉素的培养基中培养7天后，加入0.5mg/ml MTT溶液(3-(4，5-二甲基-2-噻唑)-2，5-二苯基溴化四唑)(Sigma)。37℃保温2.5小时后，加入酸-SDS (0.01N HCl/10％SDS)；将该悬浊液激烈混合，然后37℃保温过夜，使黑蓝色结晶溶解。用Microplate Reader 550(BioRad)测定570nm的吸光度。每种实验做平行三份。

(13)用pCAGGS-HA载体构建截短型A2282蛋白

所有构建体用以下引物套通过聚合酶链反应(PCR)来制备：(全长正向：5’-CGGAATTCACTATGAAAGATTATGATGAAC-3’(SEQ ID NO；20)；第一种截短型正向：5’-ACGGAATTCATCATGCAAGATTACAACTATCC-3’(SEQ ID NO；42)；第二种截短型正向：5’-GACGGAATTCAATATGGAGGAGACTCCAAAAAG-3’(SEQ ID NO；43)和通用反向：5’-CCCTCGAGTACCTTGCAGCTAGATAGGATG-3’(SEQ ID NO；44))。再将这些ORF连接至pCAGGS-HA载体的EcoRI和XhoI限制酶位点，使之与血凝素(HA)标记在同一读框内。

(14)细胞培养以备鉴定潜在的磷酸化位点

HBC5细胞在10cm平皿上培养，至80％铺满后进行转染。每种构建体取8μg，按厂家建议(FuGENE 6)，转染至HBC5细胞中。转染36小时后，将细胞用艾菲地可宁1μg/ml(Sigma A-0781)和洛可达唑0.5μg/ml(sigmaM-1404)处理18小时。

(15)Lambda磷酸酶试验

磷酸酶试验按厂家(New England)所述进行。简言之，将细胞裂解物与1μl lambda磷酸酶在30℃保温1小时。

(16)制备A2282突变体表达载体以备体外激酶试验

以pCAGGS-A2282-HA为模板，用QuickChange定点诱变试剂盒(Stratagene目录号200518-5)按厂家建议制得突变构建体D150A，T167A和T478A。

(17)转染和细胞培养以备免疫沉淀

每种构建体取16μg，用其转染HEK 293细胞。转染48小时后，用裂解缓冲液(50mM Tris-HCl(pH 7.5)，150mM NaCl，1％NP-40，40mM NAF，40mMβ-甘油磷酸，蛋白酶抑制剂混合物)和抗-HA大鼠抗体(Roche)进行免疫沉淀。与蛋白结合的Rec-蛋白G sepharose 4B珠(ZYMED)用裂解缓冲液洗2次，用激酶缓冲液(50mM Tris-HCl，(pH 7.5)，10mM MgCl，25mM NaCl，1mM DTT)洗1次。

(18)体外激酶试验

在有包含50μM ATP和10ci[γ³²P]-ATP的30μl激酶缓冲液存在的条件下，将20μl免疫沉淀(IP)产物与5μg组蛋白H1(UPSTATE，Lake Placid，NY 12946)30℃保温30min。加10μl SDS样品缓冲液，煮沸3min，使反应终止。

实施例2-B1194

(1)将B1194鉴定为在乳腺癌中上调的基因

用含有27,648个人基因的cDNA微阵列，从77例绝经前乳腺癌患者癌细胞的基因-表达谱中，选出468个在乳腺癌细胞中比在正常乳腺导管细胞(见材料和方法章节)中普遍上调至少2倍的基因，从中选出被称为FLJ-10252(Genbank登录号NM_018040)的B1194。在微阵列上，B1194基因的表达在41例乳腺癌知情病例(informative breast cancer cases)的24例中增加。随后用半定量RT-PCR确认，B1194在12例临床标本(高分化)的8例中(图1a)、以及在几乎所有9种乳腺癌细胞系(图1b)中，都比与正常乳腺导管细胞和其它正常组织中显著上调表达，但在乳腺和心脏中发现弱表达。为进一步检查B1194的表达模式，用411bp的cDNA片段作为探针(见材料和方法)，用多种人组织和乳腺癌细胞系进行Northern印迹分析。结果发现，B1194只在睾丸中表达(图2a)，并且在所有乳腺癌细胞系中特异性过表达(图2b)，提示B1194可能是开发抗癌药的良好候选标靶。B1194由10个外显子组成，人称FLJ-10252假想蛋白，它位于染色体1q41。B1194的全长cDNA序列有2338个核苷酸，编码528个氨基酸(58kDa)。经SMART计算机程序预测，该基因的产物具有高度保守的G-patch，在其羧基端是富含甘氨酸的核酸结合区，提示它可能有结合RNA的功能。开放读框(ORF)从第1个外显子开始，止于第10个外显子。

(2)B1194的亚细胞定位

经PSORTII计算机程序预测，B1194基因产物主要定位在核内。为进一步鉴别B1194，在哺乳动物细胞中研究该基因产物的亚细胞定位。用表达B1194蛋白的质粒(pCMV(+)-myc-B1194)瞬时转染COS7细胞，免疫细胞化学染色表明，外源B1194在COS7细胞中定位在整个核部位(图3a)，其分子量为58kDa(图3b)。

(3)抗B1194的siRNA的生长抑制作用

为评价B1194促进生长的作用，利用基于哺乳动物载体的RNA干扰(RNAi)技术(见材料和方法章节)，在已显示B1194过表达的乳腺癌细胞系T47D中敲减内源B1194的表达(见图1b和2b)。B1194的表达水平用半定量RT-PCR检测。如图4a所示，在所检查的该基因的两种siRNA构建体中，与对照siRNA构建体(psiH1BX-SC)相比，B1194-特异性siRNA(si1和si5)显著抑制B1194表达。用MTT试验确认B1194-特异性siRNA的细胞生长抑制作用。结果表明，导入B1194-特异性siRNA(si1和si5)构建体抑制了T47D细胞的生长(图4b)，该结果与上述表达降低的结果是一致的。每一种结果用三个独立试验验证。因此，这里的发现提示，B1194在乳腺癌细胞生长中有明显作用。

实施例3-A2282

(1)将A2282鉴定为在乳腺癌中上调的基因

用含有27,648个人基因的cDNA微阵列，分析77例绝经前乳腺癌患者癌细胞的基因-表达谱，鉴定出493个在乳腺癌细胞中普遍上调的基因，从中选出被称为母体胚性亮氨酸激酶(MELK)的A2282。MELK(Genbank登录号NM 014791)位于染色体9p13.1，其mRNA转录物有2501个碱基，由18个外显子组成。A2282的表达在33例能获得表达信息的乳腺癌病例的25例(76％)中增加，尤其在14例中分化乳腺癌标本的10例(71％)中增加。有趣的是，A2282主要在雌激素和黄体酮受体阴性的患者中表达。为确认该基因在乳腺癌中的表达模式，用乳腺癌细胞系和正常人组织，包括正常乳腺细胞，进行半定量RT-PCR。结果发现，A2282在12例临床乳腺癌标本(中分化)的11例中，比在正常乳腺导管细胞和其它正常的重要组织中增加表达(图5a)，在所有6种乳腺癌细胞系中过表达(图5b)，但也在骨髓中表达。为进一步检查该基因的表达模式，用位于A22823’UTR的cDNA片段(554bp)作为探针(图6a)，用多种人组织和乳腺癌细胞系进行Northern印迹分析。意外发现，两种明显转录物(约1.4kb和0.5kb)在所有正常人组织中普遍表达。特别是，在几乎所有正常组织中，0.5kb转录物比1.4kb转录物高表达(图6b)。而在乳腺癌-Northern印迹分析中发现，约2.4kb的转录物在乳腺癌细胞系中特异性过表达(图6c)。

(2)分离乳腺癌特异性表达的A2282转录物

为分离乳腺癌特异性表达的A228变体，从乳腺癌细胞系T47D获得poly(A)+RNA，用它构建cDNA文库，进行筛选。分离出5种变体(图7a)，其中三种转录物大小都是约2.4kb，将它们按全长转录物、缺133个碱基的转录物、和缺250个碱基的转录物分别称为V1、V2和V3。另两种转录物V4和V5分别为1.23kb和0.5kb。为研究哪一种转录物在乳腺癌细胞中比在正常乳房中过表达，用V1和V2特异性序列作为探针(核苷酸214-383)进行northern印记分析。与预想的一样，A2282基因的V1转录物和V2转录物在所有乳腺癌细胞系中特异性过表达(图7b)。因此选出A2282V1，V2和V3转录物。A2282V1也称MELK，它编码75kDa蛋白，在N-端有丝氨酸苏氨酸激酶催化域，在C-端附近有激酶关联域(KA1)。人MELK蛋白在进化过程中在不同物种之间是保守的，它与爪蟾和小鼠MELK蛋白分别有65％(Heyer BS，et al.，Dev Dyn.1999；215：344-51)和29.91％(Gilardi-Hebenstreit，P.et al.，(1992)Oncogene 7(12)，2499-2506)的同一性，提示人MELK蛋白可能具有同样的功能或体内结合配对物。据报道，爪蟾MELK激酶是KIN1/PAR-1/MARK家族新成员，它参与确立细胞极性，并与微管动力学和细胞骨架构成(cytoskeleton organization)都有关。最重要的是，据信，它在爪蟾胚胎发生期间细胞周期的调节中有重要作用(Blot J，et al.，(2002)Dev Biol241，327-338)。也有报道称，人MELK蛋白与细胞周期进程有关(Davezac N，et al.，(2002).Oncogene，21，7630-7641)。但真正的分子途径和机制尚不明了。

(3)体外翻译

为进一步检查这5种不同变体是否可以有效翻译成为功能性蛋白，进行了体外翻译试验。结果确认，V1、V2和V3转录物能在体外翻译，它们的预计分子量分别为75、71和66kDa(图8)。但未在乳腺癌细胞系中发现V4的带。上述发现表明，A2282的V1、V2和V3转录物是开发新抗癌药的分子标靶的优良候选物。

(4)在细胞周期的任何时期表达A2282的V1、V2和V3蛋白

由于文献已报道人MELK与细胞周期调节有关，且发现其激酶活性和磷酸化状态在有丝分裂期达到最大水平(Davezac N，et al.，(2002).Oncogene，21，7630-7641)，因此用Western印迹和流式细胞术检查V2和V3是否也具有V1的特征。结果，在同步生长的HeLa细胞中，在有丝分裂期观察到V1蛋白有额外的较慢迁移带(图9a，b)；但未观察到V2和V3蛋白的额外带，这表明，V2和V3蛋白在细胞周期任何时期可能都无磷酸化。

(5)抗A2282 siRNA的生长抑制作用

为评价A2282促进生长的作用，利用基于哺乳动物载体的RNA干扰(RNAi)技术(见材料和方法章节)，在已显示A2282过表达的乳腺癌细胞系T47D和MCF-7中敲减内源A2282的表达(图10)。A2282的表达水平用半定量RT-PCR检测。如图10a所示，与对照siRNA构建体(psiH1BX-LUC或psiH1BX-SC)相比，A2282-特异性siRNA(si3和si4)显著抑制表达。为确认A2282-特异性siRNA抑制细胞生长的作用，分别进行MTT试验和集落形成试验(图10b，c)。结果表明，导入A2282-特异性siRNA构建体抑制了T47D和MCF-7细胞的生长，该结果与上述该基因表达降低的结果是一致的。每一种结果用三个独立试验验证。因此，这里的发现提示，A2282在乳腺癌细胞生长中有明显作用。

(6)在激酶区磷酸化的A2282蛋白

为鉴定潜在的磷酸化位点，研究野生型A2282(WT)以及缺两个激酶区的A2282蛋白的磷酸化(图11a)。如图11b所示，在细胞周期任何时期，尤其是在有丝分裂期，WT蛋白迁移为模糊带(FUzzy band)；截短构建体(TC1和TC2)却不出现模糊带。为研究WT蛋白的模糊带是否磷酸化，进行lambda磷酸酶试验(图11c)。用lambda磷酸酶处理使模糊带缩变为单一带，提示WT蛋白在M期被广泛磷酸化。相反，另两种激酶截短蛋白中，既未观察到两条带，也未观察到模糊带。这些信息表明，磷酸化位点很可能位于A2282蛋白的激酶区。

(7)通过磷酸化调节A2282激酶活性

文献报道，MARK和AMPK相关激酶的活化受其T-环苏氨酸残基磷酸化的调节(Drewes G and Nurse P，FEBS Lett.2003；554：45-9；Spicer J，et al.，Oncogene.2003；22：4752-6)。相应地，构建多个取代变体和缺失变体(见材料和方法章节)。在哺乳动物细胞中进行免疫沉淀，用组蛋白H1和在先报道中的底物检查这些构建体的激酶活性。预计的ATP结合口袋(D150残基)和潜在被磷酸化的苏氨酸(T167残基)，按材料和方法章节所述，用丙氨酸残基替换。文献报道的磷酸化位点(Vulsteke V，et al.，J Biol Chem.2004；279(10)：8642-7)Thr 478也被突变，作为对照(图12a)。还观察到，所有转录物在HEK293细胞系中磷酸化，可参见Western印迹(图12b)。考虑到激酶活性，对于野生型蛋白、及具有完整激酶区的T478A蛋白，在体外观察它们的磷酸化组蛋白H1(图12c)。该活性在T167A突变体中严重受损，在D150A蛋白中完全消失。而且，在WT、T167A和T478A中观察到一条75kDa的带，但未在D150A中发现该带，表明A2282蛋白有可能自我磷酸化。

以上实施例是为了举例说明本发明，不应理解为限制本发明的范围。本发明的其它变体对于本领域技术人员而言是简便明显的，它们都被所附权利要求书涵盖。

工业应用

新人基因B1194，A2282V1，A2282V2和A2282V3表达在乳腺癌中比在非癌人组织中显著增加。因此，这些基因可以作为癌症诊断标记物，它们编码的蛋白可以用在癌症诊断中。

本文显示，新蛋白B1194，A2282V1，A2282V2和A2282V3的表达促进细胞生长，而与B1194，A2282V1，A2282V2和A2282V3基因对应的反义寡核苷酸或小干扰RNA抑制细胞生长。这些发现提示，B1194、A2282V1、A2282V2和A2282V3蛋白之一可刺激生癌活性。因此，所述癌蛋白每一种都可以用作开发抗癌药的标靶。例如，阻止B1194，A2282V1，A2282V2或A2282V3表达的物质或妨碍其活性的物质可以作为抗癌药进行治疗性应用，尤其是作为治疗乳腺癌的抗癌药。这类物质的实例包括识别B1194、A2282V1、A2282V2或A2282V3的反义寡核苷酸、小干扰RNA和抗体。

本文提及的所有出版物、数据库、Genbank序列、专利和专利申请皆全文列入本文作为参考。

尽管本发明参考具体实施方案进行了详细描述，但本领域技术人员可以理解，在不背离本发明的精神和范围的情况下，可以对本发明进行多种改变和修饰。本发明的范围可参见所附权利要求。

序列表

<110>肿瘤疗法科学股份有限公司(ONCOTHERAPY SCIENCE，INC.)

国立大学法人东京大学(THE UNIVERSITY OF TOKYO)

<120>与乳腺癌相关的基因和多肽

<130>ONC-A0409P

<150>US 60/600,146

<151>2004-08-10

<160>44

<170>PatentIn version 3.3

<210>1

<211>2338

<212>DNA

<213>人(Homo sapiens)

<220>

<221>CDS

<222>(99)..(1685)

<400>1

aaaaaatgct gaactgctct ttggaagtcg ccggtgctgt tgtagttgga gtctgttcac 60

gggcctgagc ttcgaggcca ggctcccggg tgtcgtta atg ttc ggg gcc gcc ggg 116

Met Phe Gly Ala Ala Gly

1 5

cgc caa ccg atc gga gct cca gca gcc ggg aac agc tgg cat ttc agt 164

Arg Gln Pro Ile Gly Ala Pro Ala Ala Gly Asn Ser Trp His Phe Ser

10 15 20

aga acc atg gag gag ctg gtt cat gac ctt gtc tca gca ttg gaa gag 212

Arg Thr Met Glu Glu Leu Val His Asp Leu Val Ser Ala Leu Glu Glu

25 30 35

agc tca gag caa gct cga ggt gga ttt gct gaa aca gga gac cat tct 260

Ser Ser Glu Gln Ala Arg Gly Gly Phe Ala Glu Thr Gly Asp His Ser

40 45 50

cga agt ata tct tgc cct ctg aaa cgc cag gca agg aaa agg aga ggg 308

Arg Ser Ile Ser Cys Pro Leu Lys Arg Gln Ala Arg Lys Arg Arg Gly

55 60 65 70

aga aaa cgg agg tcg tat aat gtg cat cac ccg tgg gag act ggt cac 356

Arg Lys Arg Arg Ser Tyr Asn Val His His Pro Trp Glu Thr Gly His

75 80 85

tgc tta agt gaa ggc tct gat tct agt tta gaa gaa cca agc aag gac 404

Cys Leu Ser Glu Gly Ser Asp Ser Ser Leu Glu Glu Pro Ser Lys Asp

90 95 100

tat aga gag aat cac aat aat aat aaa aaa gat cac agt gac tct gat 452

Tyr Arg Glu Asn His Asn Asn Asn Lys Lys Asp His Ser Asp Ser Asp

105 110 115

gac caa atg tta gta gca aag cgc agg ccg tca tca aac tta aat aat 500

Asp Gln Met Leu Val Ala Lys Arg Arg Pro Ser Ser Asn Leu Asn Asn

120 125 130

aat gtt cga ggg aaa aga cct cta tgg cat gag tct gat ttt gct gtg 548

Asn Val Arg Gly Lys Arg Pro Leu Trp His Glu Ser Asp Phe Ala Val

135 140 145 150

gac aat gtt ggg aat aga act ctg cgc agg agg aga aag gta aaa cgc 596

Asp Asn Val Gly Asn Arg Thr Leu Arg Arg Arg Arg Lys Val Lys Arg

155 160 165

atg gca gta gat ctc cca cag gac atc tct aac aaa cgg aca atg acc 644

Met Ala Val Asp Leu Pro Gln Asp Ile Ser Asn Lys Arg Thr Met Thr

170 175 180

cag cca cct gag ggt tgt aga gat cag gac atg gac agt gat aga gcc 692

Gln Pro Pro Glu Gly Cys Arg Asp Gln Asp Met Asp Ser Asp Arg Ala

185 190 195

tac cag tat caa gaa ttt acc aag aac aaa gtc aaa aaa aga aag ttg 740

Tyr Gln Tyr Gln Glu Phe Thr Lys Asn Lys Val Lys Lys Arg Lys Leu

200 205 210

aaa ata atc aga caa gga cca aaa atc caa gat gaa gga gta gtt tta 788

Lys Ile Ile Arg Gln Gly Pro Lys Ile Gln Asp Glu Gly Val Val Leu

215 220 225 230

gaa agt gag gaa acg aac cag acc aat aag gac aaa atg gaa tgt gaa 836

Glu Ser Glu Glu Thr Asn Gln Thr Asn Lys Asp Lys Met Glu Cys Glu

235 240 245

gag caa aaa gtc tca gat gag ctc atg agt gaa agt gat tcc agc agt 884

Glu Gln Lys Val Ser Asp Glu Leu Met Ser Glu Ser Asp Ser Ser Ser

250 255 260

ctc agc agc act gat gct gga ttg ttt acc aat gat gag gga aga caa 932

Leu Ser Ser Thr Asp Ala Gly Leu Phe Thr Asn Asp Glu Gly Arg Gln

265 270 275

ggt gat gat gaa cag agt gac tgg ttc tac gaa aag gaa tca ggt gga 980

Gly Asp Asp Glu Gln Ser Asp Trp Phe Tyr Glu Lys Glu Ser Gly Gly

280 285 290

gca tgt ggt atc act gga gtt gtg ccc tgg tgg gaa aag gaa gat cct 1028

Ala Cys Gly Ile Thr Gly Val Val Pro Trp Trp Glu Lys Glu Asp Pro

295 300 305 310

act gag cta gac aaa aat gta cca gat cct gtc ttt gaa agt atc tta 1076

Thr Glu Leu Asp Lys Asn Val Pro Asp Pro Val Phe Glu Ser Ile Leu

315 320 325

act ggt tct ttt ccc ctt atg tca cac cca agc aga aga ggt ttc caa 1124

Thr Gly Ser Phe Pro Leu Met Ser His Pro Ser Arg Arg Gly Phe Gln

330 335 340

gct aga ctc agt cgc ctt cat gga atg tct tca aag aat att aaa aaa 1172

Ala Arg Leu Ser Arg Leu His Gly Met Ser Ser Lys Asn Ile Lys Lys

345 350 355

tct gga ggg act cca act tca atg gta ccc att cct ggc cca gtg ggt 1220

Ser Gly Gly Thr Pro Thr Ser Met Val Pro Ile Pro Gly Pro Val Gly

360 365 370

aac aag aga atg gtt cat ttt tcc ccg gat tct cat cac cat gac cat 1268

Asn Lys Arg Met Val His Phe Ser Pro Asp Ser His His His Asp His

375 380 385 390

tgg ttt agc cct ggg gct agg aca gag cat gac cag cat cag ctt ctg 1316

Trp Phe Ser Pro Gly Ala Arg Thr Glu His Asp Gln His Gln Leu Leu

395 400 405

aga gat aat cga gct gaa aga gga cac aag aaa aat tgt tct gtg aga 1364

Arg Asp Asn Arg Ala Glu Arg Gly His Lys Lys Asn Cys Ser Val Arg

410 415 420

aca gcc agc agg caa aca agc atg cat tta gga tcc tta tgc acg gga 1412

Thr Ala Ser Arg Gln Thr Ser Met His Leu Gly Ser Leu Cys Thr Gly

425 430 435

gat atc aaa cgg aga aga aaa gct gca cct ttg cct gga cct act act 1460

Asp Ile Lys Arg Arg Arg Lys Ala Ala Pro Leu Pro Gly Pro Thr Thr

440 445 450

gca gga ttt gta ggt gaa aat gcc cag cca atc cta gaa aat aat att 1508

Ala Gly Phe Val Gly Glu Asn Ala Gln Pro Ile Leu Glu Asn Asn Ile

455 460 465 470

gga aac cga atg ctt cag aat atg ggc tgg acg cct ggg tca ggc ctt 1556

Gly Asn Arg Met Leu Gln Asn Met Gly Trp Thr Pro Gly Ser Gly Leu

475 480 485

gga cga gat ggc aag ggg atc tct gag cca att caa gcc atg cag agg 1604

Gly Arg Asp Gly Lys Gly Ile Ser Glu Pro Ile Gln Ala Met Gln Arg

490 495 500

cca aag gga tta gga ctt gga ttt cct cta cca aaa agt act tcc gca 1652

Pro Lys Gly Leu Gly Leu Gly Phe Pro Leu Pro Lys Ser Thr Ser Ala

505 510 515

act act acc ccc aat gca gga aaa tcc gcc taa gaaaagcaaa gaagaaatgt 1705

Thr Thr Thr Pro Asn Ala Gly Lys Ser Ala

520 525

tttacagact ttattcacta tgtcccattg ttctaaaatg ataacatgac ttctgttttt 1765

gaagcaaaaa tctacattgc ctcaaacaca tcactctagc ttccttactg catacagtcc 1825

tgccatagtg agagaaatgg gatttcatca caattcatgg tgctaaaatg aaaacctctg 1885

cactttaatt tttttcagta atttccagct atttctaggt ataaagagca gctcgtttct 1945

cttatttatt ttagtctcat gtgtcaatac tttccgatgc tttgcttaat tcatgtatgt 2005

gtgcagtgct gcaatgccca gacaaacgtg agcacaccca ccagtttcta aaatggaata 2065

gacaggaaaa gattgtgttt tatatcatcc ctatctattg taacccaaaa gacctaccat 2125

cgcatcagtg aagtccgaac acatctttgt ttgaaaggct tgtcaatttc atattccttg 2185

aattggcttc ttggtgagga ttttctgaca gagtgatacc catcaatttt ctatccttag 2245

acaatgtagt gtgaagttca cagttgacaa acaacaatta atgtttccct tggatgtttt 2305

gacaaaaata aacctcatcg ttgttatcac cag 2338

<210>2

<211>528

<212>PRT

<213>人(Homo sapiens)

<400>2

Met Phe Gly Ala Ala Gly Arg Gln Pro Ile Gly Ala Pro Ala Ala Gly

1 5 10 15

Asn Ser Trp His Phe Ser Arg Thr Met Glu Glu Leu Val His Asp Leu

20 25 30

Val Ser Ala Leu Glu Glu Ser Ser Glu Gln Ala Arg Gly Gly Phe Ala

35 40 45

Glu Thr Gly Asp His Ser Arg Ser Ile Ser Cys Pro Leu Lys Arg Gln

50 55 60

Ala Arg Lys Arg Arg Gly Arg Lys Arg Arg Ser Tyr Asn Val His His

65 70 75 80

Pro Trp Glu Thr Gly His Cys Leu Ser Glu Gly Ser Asp Ser Ser Leu

85 90 95

Glu Glu Pro Ser Lys Asp Tyr Arg Glu Asn His Asn Asn Asn Lys Lys

100 105 110

Asp His Ser Asp Ser Asp Asp Gln Met Leu Val Ala Lys Arg Arg Pro

115 120 125

Ser Ser Asn Leu Asn Asn Asn Val Arg Gly Lys Arg Pro Leu Trp His

130 135 140

Glu Ser Asp Phe Ala Val Asp Asn Val Gly Asn Arg Thr Leu Arg Arg

145 150 155 160

Arg Arg Lys Val Lys Arg Met Ala Val Asp Leu Pro Gln Asp Ile Ser

165 170 175

Asn Lys Arg Thr Met Thr Gln Pro Pro Glu Gly Cys Arg Asp Gln Asp

180 185 190

Met Asp Ser Asp Arg Ala Tyr Gln Tyr Gln Glu Phe Thr Lys Asn Lys

195 200 205

Val Lys Lys Arg Lys Leu Lys Ile Ile Arg Gln Gly Pro Lys Ile Gln

210 215 220

Asp Glu Gly Val Val Leu Glu Ser Glu Glu Thr Asn Gln Thr Asn Lys

225 230 235 240

Asp Lys Met Glu Cys Glu Glu Gln Lys Val Ser Asp Glu Leu Met Ser

245 250 255

Glu Ser Asp Ser Ser Ser Leu Ser Ser Thr Asp Ala Gly Leu Phe Thr

260 265 270

Asn Asp Glu Gly Arg Gln Gly Asp Asp Glu Gln Ser Asp Trp Phe Tyr

275 280 285

Glu Lys Glu Ser Gly Gly Ala Cys Gly Ile Thr Gly Val Val Pro Trp

290 295 300

Trp Glu Lys Glu Asp Pro Thr Glu Leu Asp Lys Asn Val Pro Asp Pro

305 310 315 320

Val Phe Glu Ser Ile Leu Thr Gly Ser Phe Pro Leu Met Ser His Pro

325 330 335

Ser Arg Arg Gly Phe Gln Ala Arg Leu Ser Arg Leu His Gly Met Ser

340 345 350

Ser Lys Asn Ile Lys Lys Ser Gly Gly Thr Pro Thr Ser Met Val Pro

355 360 365

Ile Pro Gly Pro Val Gly Asn Lys Arg Met Val His Phe Ser Pro Asp

370 375 380

Ser His His His Asp His Trp Phe Ser Pro Gly Ala Arg Thr Glu His

385 390 395 400

Asp Gln His Gln Leu Leu Arg Asp Asn Arg Ala Glu Arg Gly His Lys

405 410 415

Lys Asn Cys Ser Val Arg Thr Ala Ser Arg Gln Thr Ser Met His Leu

420 425 430

Gly Ser Leu Cys Thr Gly Asp Ile Lys Arg Arg Arg Lys Ala Ala Pro

435 440 445

Leu Pro Gly Pro Thr Thr Ala Gly Phe Val Gly Glu Asn Ala Gln Pro

450 455 460

Ile Leu Glu Asn Asn Ile Gly Asn Arg Met Leu Gln Asn Met Gly Trp

465 470 475 480

Thr Pro Gly Ser Gly Leu Gly Arg Asp Gly Lys Gly Ile Ser Glu Pro

485 490 495

Ile Gln Ala Met Gln Arg Pro Lys Gly Leu Gly Leu Gly Phe Pro Leu

500 505 510

Pro Lys Ser Thr Ser Ala Thr Thr Thr Pro Asn Ala Gly Lys Ser Ala

515 520 525

<210>3

<211>2501

<212>DNA

<213>人(Homo sapiens)

<220>

<221>CDS

<222>(139)..(2094)

<400>3

cgaaaagatt cttaggaacg ccgtaccagc cgcgtctctc aggacagcag gcccctgtcc 60

ttctgtcggg cgccgctcag ccgtgccctc cgcccctcag gttctttttc taattccaaa 120

taaacttgca agaggact atg aaa gat tat gat gaa ctt ctc aaa tat tat 171

Met Lys Asp Tyr Asp Glu Leu Leu Lys Tyr Tyr

1 5 10

gaa tta cat gaa act att ggg aca ggt ggc ttt gca aag gtc aaa ctt 219

Glu Leu His Glu Thr Ile Gly Thr Gly Gly Phe Ala Lys Val Lys Leu

15 20 25

gcc tgc cat atc ctt act gga gag atg gta gct ata aaa atc atg gat 267

Ala Cys His Ile Leu Thr Gly Glu Met Val Ala Ile Lys Ile Met Asp

30 35 40

aaa aac aca cta ggg agt gat ttg ccc cgg atc aaa acg gag att gag 315

Lys Asn Thr Leu Gly Ser Asp Leu Pro Arg Ile Lys Thr Glu Ile Glu

45 50 55

gcc ttg aag aae ctg aga cat cag cat ata tgt caa ctc tac cat gtg 363

Ala Leu Lys Asn Leu Arg His Gln His Ile Cys Gln Leu Tyr His Val

60 65 70 75

cta gag aca gcc aac aaa ata ttc atg gtt ctt gag tac tgc cct gga 411

Leu Glu Thr Ala Asn Lys Ile Phe Met Val Leu Glu Tyr Cys Pro Gly

80 85 90

gga gag ctg ttt gac tat ata att tcc cag gat cgc ctg tca gaa gag 459

Gly Glu Leu Phe Asp Tyr Ile Ile Ser Gln Asp Arg Leu Ser Glu Glu

95 100 105

gag acc cgg gtt gtc ttc cgt cag ata gta tct gct gtt gct tat gtg 507

Glu Thr Arg Val Val Phe Arg Gln Ile Val Ser Ala Val Ala Tyr Val

110 115 120

cac agc cag ggc tat gct cac agg gac ctc aag cca gaa aat ttg ctg 555

His Ser Gln Gly Tyr Ala His Arg Asp Leu Lys Pro Glu Asn Leu Leu

125 130 135

ttt gat gaa tat cat aaa tta aag ctg att gac ttt ggt ctc tgt gca 603

Phe Asp Glu Tyr His Lys Leu Lys Leu Ile Asp Phe Gly Leu Cys Ala

140 145 150 155

aaa ccc aag ggt aac aag gat tac cat cta cag aca tgc tgt ggg agt 651

Lys Pro Lys Gly Asn Lys Asp Tyr His Leu Gln Thr Cys Cys Gly Ser

160 165 170

ctg gct tat gca gca cct gag tta ata caa ggc aaa tca tat ctt gga 699

Leu Ala Tyr Ala Ala Pro Glu Leu Ile Gln Gly Lys Ser Tyr Leu Gly

175 180 185

tca gag gca gat gtt tgg agc atg ggc ata ctg tta tat gtt ctt atg 747

Ser Glu Ala Asp Val Trp Ser Met Gly Ile Leu Leu Tyr Val Leu Met

190 195 200

tgt gga ttt cta cca ttt gat gat gat aat gta atg gct tta tac aag 795

Cys Gly Phe Leu Pro Phe Asp Asp Asp Asn Val Met Ala Leu Tyr Lys

205 210 215

aag att atg aga gga aaa tat gat gtt ccc aag tgg ctc tct ccc agt 843

Lys Ile Met Arg Gly Lys Tyr Asp Val Pro Lys Trp Leu Ser Pro Ser

220 225 230 235

agc att ctg ctt ctt caa caa atg ctg cag gtg gac cca aag aaa cgg 891

Ser Ile Leu Leu Leu Gln Gln Met Leu Gln Val Asp Pro Lys Lys Arg

240 245 250

att tct atg aaa aat cta ttg aac cat ccc tgg atc atg caa gat tac 939

Ile Ser Met Lys Asn Leu Leu Asn His Pro Trp Ile Met Gln Asp Tyr

255 260 265

aac tat cct gtt gag tgg caa agc aag aat cct ttt att cac ctc gat 987

Asn Tyr Pro Val Glu Trp Gln Ser Lys Asn Pro Phe Ile His Leu Asp

270 275 280

gat gat tgc gta aca gaa ctt tct gta cat cac aga aac aac agg caa 1035

Asp Asp Cys Val Thr Glu Leu Ser Val His His Arg Asn Asn Arg Gln

285 290 295

aca atg gag gat tta att tca ctg tgg cag tat gat cac ctc acg gct 1083

Thr Met Glu Asp Leu Ile Ser Leu Trp Gln Tyr Asp His Leu Thr Ala

300 305 310 315

acc tat ctt ctg ctt cta gcc aag aag gct cgg gga aaa cca gtt cgt 1131

Thr Tyr Leu Leu Leu Leu Ala Lys Lys Ala Arg Gly Lys Pro Val Arg

320 325 330

tta agg ctt tct tct ttc tcc tgt gga caa gcc agt gct acc cca ttc 1179

Leu Arg Leu Ser Ser Phe Ser Cys Gly Gln Ala Ser Ala Thr Pro Phe

335 340 345

aca gac atc aag tca aat aat tgg agt ctg gaa gat gtg acc gca agt 1227

Thr Asp Ile Lys Ser Asn Asn Trp Ser Leu Glu Asp Val Thr Ala Ser

350 355 360

gat aaa aat tat gtg gcg gga tta ata gac tat gat tgg tgt gaa gat 1275

Asp Lys Asn Tyr Val Ala Gly Leu Ile Asp Tyr Asp Trp Cys Glu Asp

365 370 375

gat tta tca aca ggt gct gct act ccc cga aca tca cag ttt acc aag 1323

Asp Leu Ser Thr Gly Ala Ala Thr Pro Arg Thr Ser Gln Phe Thr Lys

380 385 390 395

tac tgg aca gaa tca aat ggg gtg gaa tct aaa tca tta act cca gcc 1371

Tyr Trp Thr Glu Ser Asn Gly Val Glu Ser Lys Ser Leu Thr Pro Ala

400 405 410

tta tgc aga aca cct gca aat aaa tta aag aac aaa gaa aat gta tat 1419

Leu Cys Arg Thr Pro Ala Asn Lys Leu Lys Asn Lys Glu Asn Val Tyr

415 420 425

act cct aag tct gct gta aag aat gaa gag tac ttt atg ttt cct gag 1467

Thr Pro Lys Ser Ala Val Lys Asn Glu Glu Tyr Phe Met Phe Pro Glu

430 435 440

cca aag act cca gtt aat aag aac cag cat aag aga gaa ata ctc act 1515

Pro Lys Thr Pro Val Asn Lys Asn Gln His Lys Arg Glu Ile Leu Thr

445 450 455

acg cca aat cgt tac act aca ccc tca aaa gct aga aac cag tgc ctg 1563

Thr Pro Asn Arg Tyr Thr Thr Pro Ser Lys Ala Arg Asn Gln Cys Leu

460 465 470 475

aaa gaa act cca att aaa ata cca gta aat tca aca gga aca gac aag 1611

Lys Glu Thr Pro Ile Lys Ile Pro Val Asn Ser Thr Gly Thr Asp Lys

480 485 490

tta atg aca ggt gtc att agc cct gag agg cgg tgc cgc tca gtg gaa 1659

Leu Met Thr Gly Val Ile Ser Pro Glu Arg Arg Cys Arg Ser Val Glu

495 500 505

ttg gat ctc aac caa gca cat atg gag gag act cca aaa aga aag gga 1707

Leu Asp Leu Asn Gln Ala His Met Glu Glu Thr Pro Lys Arg Lys Gly

510 515 520

gcc aaa gtg ttt ggg agc ctt gaa agg ggg ttg gat aag gtt atc act 1755

Ala Lys Val Phe Gly Ser Leu Glu Arg Gly Leu Asp Lys Val Ile Thr

525 530 535

gtg ctc acc agg agc aaa agg aag ggt tct gcc aga gac ggg ccc aga 1803

Val Leu Thr Arg Ser Lys Arg Lys Gly Ser Ala Arg Asp Gly Pro Arg

540 545 550 555

aga cta aag ctt cac tat aat gtg act aca act aga tta gtg aat cca 1851

Arg Leu Lys Leu His Tyr Asn Val Thr Thr Thr Arg Leu Val Asn Pro

560 565 570

gat caa ctg ttg aat gaa ata atg tct att ctt cca aag aag cat gtt 1899

Asp Gln Leu Leu Asn Glu Ile Met Ser Ile Leu Pro Lys Lys His Val

575 580 585

gac ttt gta caa aag ggt tat aca ctg aag tgt caa aca cag tca gat 1947

Asp Phe Val Gln Lys Gly Tyr Thr Leu Lys Cys Gln Thr Gln Ser Asp

590 595 600

ttt ggg aaa gtg aca atg caa ttt gaa tta gaa gtg tgc cag ctt caa 1995

Phe Gly Lys Val Thr Met Gln Phe Glu Leu Glu Val Cys Gln Leu Gln

605 610 615

aaa ccc gat gtg gtg ggt atc agg agg cag cgg ctt aag ggc gat gcc 2043

Lys Pro Asp Val Val Gly Ile Arg Arg Gln Arg Leu Lys Gly Asp Ala

620 625 630 635

tgg gtt tac aaa aga tta gtg gaa gac atc cta tct agc tgc aag gta 2091

Trp Val Tyr Lys Arg Leu Val Glu Asp Ile Leu Ser Ser Cys Lys Val

640 645 650

taa ttgatggatt cttccatcct gccggatgag tgtgggtgtg atacagccta 2144

cataaagact gttatgatcg ctttgatttt aaagttcatt ggaactacca acttgtttct 2204

aaagagctat cttaagacca atatctcttt gtttttaaac aaaagatatt attttgtgta 2264

tgaatctaaa tcaagcccat ctgtcattat gttactgtct tttttaatca tgtggttttg 2324

tatattaata attgttgact ttcttagatt cacttccata tgtgaatgta agctcttaac 2384

tatgtctctt tgtaatgtgt aatttctttc tgaaataaaa ccatttgtga atataaaaaa 2444

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 2501

<210>4

<211>651

<212>PRT

<213>人(Homo sapiens)

<400>4

Met Lys Asp Tyr Asp Glu Leu Leu Lys Tyr Tyr Glu Leu His Glu Thr

1 5 10 15

Ile Gly Thr Gly Gly Phe Ala Lys Val Lys Leu Ala Cys His Ile Leu

20 25 30

Thr Gly Glu Met Val Ala Ile Lys Ile Met Asp Lys Asn Thr Leu Gly

35 40 45

Ser Asp Leu Pro Arg Ile Lys Thr Glu Ile Glu Ala Leu Lys Asn Leu

50 55 60

Arg His Gln His Ile Cys Gln Leu Tyr His Val Leu Glu Thr Ala Asn

65 70 75 80

Lys Ile Phe Met Val Leu Glu Tyr Cys Pro Gly Gly Glu Leu Phe Asp

85 90 95

Tyr Ile Ile Ser Gln Asp Arg Leu Ser Glu Glu Glu Thr Arg Val Val

100 105 110

Phe Arg Gln Ile Val Ser Ala Val Ala Tyr Val His Ser Gln Gly Tyr

115 120 125

Ala His Arg Asp Leu Lys Pro Glu Asn Leu Leu Phe Asp Glu Tyr His

130 135 140

Lys Leu Lys Leu Ile Asp Phe Gly Leu Cys Ala Lys Pro Lys Gly Asn

145 150 155 160

Lys Asp Tyr His Leu Gln Thr Cys Cys Gly Ser Leu Ala Tyr Ala Ala

165 170 175

Pro Glu Leu Ile Gln Gly Lys Ser Tyr Leu Gly Ser Glu Ala Asp Val

180 185 190

Trp Ser Met Gly Ile Leu Leu Tyr Val Leu Met Cys Gly Phe Leu Pro

195 200 205

Phe Asp Asp Asp Asn Val Met Ala Leu Tyr Lys Lys Ile Met Arg Gly

210 215 220

Lys Tyr Asp Val Pro Lys Trp Leu Ser Pro Ser Ser Ile Leu Leu Leu

225 230 235 240

Gln Gln Met Leu Gln Val Asp Pro Lys Lys Arg Ile Ser Met Lys Asn

245 250 255

Leu Leu Asn His Pro Trp Ile Met Gln Asp Tyr Asn Tyr Pro Val Glu

260 265 270

Trp Gln Ser Lys Asn Pro Phe Ile His Leu Asp Asp Asp Cys Val Thr

275 280 285

Glu Leu Ser Val His His Arg Asn Asn Arg Gln Thr Met Glu Asp Leu

290 295 300

Ile Ser Leu Trp Gln Tyr Asp His Leu Thr Ala Thr Tyr Leu Leu Leu

305 310 315 320

Leu Ala Lys Lys Ala Arg Gly Lys Pro Val Arg Leu Arg Leu Ser Ser

325 330 335

Phe Ser Cys Gly Gln Ala Ser Ala Thr Pro Phe Thr Asp Ile Lys Ser

340 345 350

Asn Asn Trp Ser Leu Glu Asp Val Thr Ala Ser Asp Lys Asn Tyr Val

355 360 365

Ala Gly Leu Ile Asp Tyr Asp Trp Cys Glu Asp Asp Leu Ser Thr Gly

370 375 380

Ala Ala Thr Pro Arg Thr Ser Gln Phe Thr Lys Tyr Trp Thr Glu Ser

385 390 395 400

Asn Gly Val Glu Ser Lys Ser Leu Thr Pro Ala Leu Cys Arg Thr Pro

405 410 415

Ala Asn Lys Leu Lys Asn Lys Glu Asn Val Tyr Thr Pro Lys Ser Ala

420 425 430

Val Lys Asn Glu Glu Tyr Phe Met Phe Pro Glu Pro Lys Thr Pro Val

435 440 445

Asn Lys Asn Gln His Lys Arg Glu Ile Leu Thr Thr Pro Asn Arg Tyr

450 455 460

Thr Thr Pro Ser Lys Ala Arg Asn Gln Cys Leu Lys Glu Thr Pro Ile

465 470 475 480

Lys Ile Pro Val Asn Ser Thr Gly Thr Asp Lys Leu Met Thr Gly Val

485 490 495

Ile Ser Pro Glu Arg Arg Cys Arg Ser Val Glu Leu Asp Leu Asn Gln

500 505 510

Ala His Met Glu Glu Thr Pro Lys Arg Lys Gly Ala Lys Val Phe Gly

515 520 525

Ser Leu Glu Arg Gly Leu Asp Lys Val Ile Thr Val Leu Thr Arg Ser

530 535 540

Lys Arg Lys Gly Ser Ala Arg Asp Gly Pro Arg Arg Leu Lys Leu His

545 550 555 560

Tyr Asn Val Thr Thr Thr Arg Leu Val Asn Pro Asp Gln Leu Leu Asn

565 570 575

Glu Ile Met Ser Ile Leu Pro Lys Lys His Val Asp Phe Val Gln Lys

580 585 590

Gly Tyr Thr Leu Lys Cys Gln Thr Gln Ser Asp Phe Gly Lys Val Thr

595 600 605

Met Gln Phe Glu Leu Glu Val Cys Gln Leu Gln Lys Pro Asp Val Val

610 615 620

Gly Ile Arg Arg Gln Arg Leu Lys Gly Asp Ala Trp Val Tyr Lys Arg

625 630 635 640

Leu Val Glu Asp Ile Leu Ser Ser Cys Lys Val

645 650

<210>5

<211>2368

<212>DNA

<213>人(Homo sapiens)

<220>

<221>CDS

<222>(146)..(2002)

<400>5

aaagattctt aggaacgccg taccagccgc gtctctcagg acagcaggcc cctgtccttc 60

tgtcgggcgc cgctcagccg tgccctccgc ccctcaggtt ctttttctaa ttccaaataa 120

acttgcaaga ggactatgaa agatt atg atg aac ttc tca aat att atg aat 172

Met Met Asn Phe Ser Asn Ile Met Asn

1 5

tac atg aaa cta ttg gga cag agt gat ttg ccc cgg atc aaa acg gag 220

Tyr Met Lys Leu Leu Gly Gln Ser Asp Leu Pro Arg Ile Lys Thr Glu

10 15 20 25

att gag gcc ttg aag aac ctg aga cat cag cat ata tgt caa ctc tac 268

Ile Glu Ala Leu Lys Asn Leu Arg His Gln His Ile Cys Gln Leu Tyr

30 35 40

cat gtg cta gag aca gcc aac aaa ata ttc atg gtt ctt gag tac tgc 316

His Val Leu Glu Thr Ala Asn Lys Ile Phe Met Val Leu Glu Tyr Cys

45 50 55

cct gga gga gag ctg ttt gac tat ata att tcc cag gat cgc ctg tca 364

Pro Gly Gly Glu Leu Phe Asp Tyr Ile Ile Ser Gln Asp Arg Leu Ser

60 65 70

gaa gag gag acc cgg gtt gtc ttc cgt cag ata gta tct gct gtt gct 412

Glu Glu Glu Thr Arg Val Val Phe Arg Gln Ile Val Ser Ala Val Ala

75 80 85

tat gtg cac agc cag ggc tat gct cac agg gac ctc aag cca gaa aat 460

Tyr Val His Ser Gln Gly Tyr Ala His Arg Asp Leu Lys Pro Glu Asn

90 95 100 105

ttg ctg ttt gat gaa tat cat aaa tta aag ctg att gac ttt ggt ctc 508

Leu Leu Phe Asp Glu Tyr His Lys Leu Lys Leu Ile Asp Phe Gly Leu

110 115 120

tgt gca aaa ccc aag ggt aac aag gat tac cat cta cag aca tgc tgt 556

Cys Ala Lys Pro Lys Gly Asn Lys Asp Tyr His Leu Gln Thr Cys Cys

125 130 135

ggg agt ctg gct tat gca gca cct gag tta ata caa ggc aaa tca tat 604

Gly Ser Leu Ala Tyr Ala Ala Pro Glu Leu Ile Gln Gly Lys Ser Tyr

140 145 150

ctt gga tca gag gca gat gtt tgg agc atg ggc ata ctg tta tat gtt 652

Leu Gly Ser Glu Ala Asp Val Trp Ser Met Gly Ile Leu Leu Tyr Val

155 160 165

ctt atg tgt gga ttt cta cca ttt gat gat gat aat gta atg gct tta 700

Leu Met Cys Gly Phe Leu Pro Phe Asp Asp Asp Asn Val Met Ala Leu

170 175 180 185

tac aag aag att atg aga gga aaa tat gat gtt ccc aag tgg ctc tct 748

Tyr Lys Lys Ile Met Arg Gly Lys Tyr Asp Val Pro Lys Trp Leu Ser

190 195 200

ccc agt agc att ctg ctt ctt caa caa atg ctg cag gtg gac cca aag 796

Pro Ser Ser Ile Leu Leu Leu Gln Gln Met Leu Gln Val Asp Pro Lys

205 210 215

aaa cgg att tct atg aaa aat cta ttg aac cat ccc tgg atc atg caa 844

Lys Arg Ile Ser Met Lys Asn Leu Leu Asn His Pro Trp Ile Met Gln

220 225 230

gat tac aac tat cct gtt gag tgg caa agc aag aat cct ttt att cac 892

Asp Tyr Asn Tyr Pro Val Glu Trp Gln Ser Lys Asn Pro Phe Ile His

235 240 245

ctc gat gat gat tgc gta aca gaa ctt tct gta cat cac aga aac aac 940

Leu Asp Asp Asp Cys Val Thr Glu Leu Ser Val His His Arg Asn Asn

250 255 260 265

agg caa aca atg gag gat tta att tca ctg tgg cag tat gat cac ctc 988

Arg Gln Thr Met Glu Asp Leu Ile Ser Leu Trp Gln Tyr Asp His Leu

270 275 280

acg gct acc tat ctt ctg ctt cta gcc aag aag gct cgg gga aaa cca 1036

Thr Ala Thr Tyr Leu Leu Leu Leu Ala Lys Lys Ala Arg Gly Lys Pro

285 290 295

gtt cgt tta agg ctt tct tct ttc tcc tgt gga caa gcc agt gct acc 1084

Val Arg Leu Arg Leu Ser Ser Phe Ser Cys Gly Gln Ala Ser Ala Thr

300 305 310

cca ttc aca gac atc aag tca aat aat tgg agt ctg gaa gat gtg acc 1132

Pro Phe Thr Asp Ile Lys Ser Asn Asn Trp Ser Leu Glu Asp Val Thr

315 320 325

gca agt gat aaa aat tat gtg gcg gga tta ata gac tat gat tgg tgt 1180

Ala Ser Asp Lys Asn Tyr Val Ala Gly Leu Ile Asp Tyr Asp Trp Cys

330 335 340 345

gaa gat gat tta tca aca ggt gct gct act ccc cga aca tca cag ttt 1228

Glu Asp Asp Leu Ser Thr Gly Ala Ala Thr Pro Arg Thr Ser Gln Phe

350 355 360

acc aag tac tgg aca gaa tca aat ggg gtg gaa tct aaa tca tta act 1276

Thr Lys Tyr Trp Thr Glu Ser Asn Gly Val Glu Ser Lys Ser Leu Thr

365 370 375

cca gcc tta tgc aga aca cct gca aat aaa tta aag aac aaa gaa aat 1324

Pro Ala Leu Cys Arg Thr Pro Ala Asn Lys Leu Lys Asn Lys Glu Asn

380 385 390

gta tat act cct aag tct gct gta aag aat gaa gag tac ttt atg ttt 1372

Val Tyr Thr Pro Lys Ser Ala Val Lys Asn Glu Glu Tyr Phe Met Phe

395 400 405

cct gag cca aag act cca gtt aat aag aac cag cat aag aga gaa ata 1420

Pro Glu Pro Lys Thr Pro Val Asn Lys Asn Gln His Lys Arg Glu Ile

410 415 420 425

ctc act acg cca aat cgt tac act aca ccc tca aaa gct aga aac cag 1468

Leu Thr Thr Pro Asn Arg Tyr Thr Thr Pro Ser Lys Ala Arg Asn Gln

430 435 440

tgc ctg aaa gaa act cca att aaa ata cca gta aat tca aca gga aca 1516

Cys Leu Lys Glu Thr Pro Ile Lys Ile Pro Val Asn Ser Thr Gly Thr

445 450 455

gac aag tta atg aca ggt gtc att agc cct gag agg cgg tgc cgc tca 1564

Asp Lys Leu Met Thr Gly Val Ile Ser Pro Glu Arg Arg Cys Arg Ser

460 465 470

gtg gaa ttg gat ctc aac caa gca cat atg gag gag act cca aaa aga 1612

Val Glu Leu Asp Leu Asn Gln Ala His Met Glu Glu Thr Pro Lys Arg

475 480 485

aag gga gcc aaa gtg ttt ggg agc ctt gaa agg ggg ttg gat aag gtt 1660

Lys Gly Ala Lys Val Phe Gly Ser Leu Glu Arg Gly Leu Asp Lys Val

490 495 500 505

atc act gtg ctc acc agg agc aaa agg aag ggt tct gcc aga gac ggg 1708

Ile Thr Val Leu Thr Arg Ser Lys Arg Lys Gly Ser Ala Arg Asp Gly

510 515 520

ccc aga aga cta aag ctt cac tat aat gtg act aca act aga tta gtg 1756

Pro Arg Arg Leu Lys Leu His Tyr Asn Val Thr Thr Thr Arg Leu Val

525 530 535

aat cca gat caa ctg ttg aat gaa ata atg tct att ctt cca aag aag 1804

Asn Pro Asp Gln Leu Leu Asn Glu Ile Met Ser Ile Leu Pro Lys Lys

540 545 550

cat gtt gac ttt gta caa aag ggt tat aca ctg aag tgt caa aca cag 1852

His Val Asp Phe Val Gln Lys Gly Tyr Thr Leu Lys Cys Gln Thr Gln

555 560 565

tca gat ttt ggg aaa gtg aca atg caa ttt gaa tta gaa gtg tgc cag 1900

Ser Asp Phe Gly Lys Val Thr Met Gln Phe Glu Leu Glu Val Cys Gln

570 575 580 585

ctt caa aaa ccc gat gtg gtg ggt atc agg agg cag cgg ctt aag ggc 1948

Leu Gln Lys Pro Asp Val Val Gly Ile Arg Arg Gln Arg Leu Lys Gly

590 595 600

gat gcc tgg gtt tac aaa aga tta gtg gaa gac atc cta tct agc tgc 1996

Asp Ala Trp Val Tyr Lys Arg Leu Val Glu Asp Ile Leu Ser Ser Cys

605 610 615

aag gta taattgatgg attcttccat cctgccggat gagtgtgggt gtgatacagc 2052

Lys Val

ctacataaag actgttatga tcgctttgat tttaaagttc attggaacta ccaacttgtt 2112

tctaaagagc tatcttaaga ccaatatctc tttgttttta aacaaaagat attattttgt 2172

gtatgaatct aaatcaagcc catctgtcat tatgttactg tcttttttaa tcatgtggtt 2232

ttgtatatta ataattgttg actttcttag attcacttcc atatgtgaat gtaagctctt 2292

aactatgtct ctttgtaatg tgtaatttct ttctgaaata aaaccatttg tgaatataaa 2352

aaaaaaaaaa aaaaaa 2368

<210>6

<211>619

<212>PRT

<213>人(Homo sapiens)

<400>6

Met Met Asn Phe Ser Asn Ile Met Asn Tyr Met Lys Leu Leu Gly Gln

1 5 10 15

Ser Asp Leu Pro Arg Ile Lys Thr Glu Ile Glu Ala Leu Lys Asn Leu

20 25 30

Arg His Gln His Ile Cys Gln Leu Tyr His Val Leu Glu Thr Ala Asn

35 40 45

Lys Ile Phe Met Val Leu Glu Tyr Cys Pro Gly Gly Glu Leu Phe Asp

50 55 60

Tyr Ile Ile Ser Gln Asp Arg Leu Ser Glu Glu Glu Thr Arg Val Val

65 70 75 80

Phe Arg Gln Ile Val Ser Ala Val Ala Tyr Val His Ser Gln Gly Tyr

85 90 95

Ala His Arg Asp Leu Lys Pro Glu Asn Leu Leu Phe Asp Glu Tyr His

100 105 110

Lys Leu Lys Leu Ile Asp Phe Gly Leu Cys Ala Lys Pro Lys Gly Asn

115 120 125

Lys Asp Tyr His Leu Gln Thr Cys Cys Gly Ser Leu Ala Tyr Ala Ala

130 135 140

Pro Glu Leu Ile Gln Gly Lys Ser Tyr Leu Gly Ser Glu Ala Asp Val

145 150 155 160

Trp Ser Met Gly Ile Leu Leu Tyr Val Leu Met Cys Gly Phe Leu Pro

165 170 175

Phe Asp Asp Asp Asn Val Met Ala Leu Tyr Lys Lys Ile Met Arg Gly

180 185 190

Lys Tyr Asp Val Pro Lys Trp Leu Ser Pro Ser Ser Ile Leu Leu Leu

195 200 205

Gln Gln Met Leu Gln Val Asp Pro Lys Lys Arg Ile Ser Met Lys Asn

210 215 220

Leu Leu Asn His Pro Trp Ile Met Gln Asp Tyr Asn Tyr Pro Val Glu

225 230 235 240

Trp Gln Ser Lys Asn Pro Phe Ile His Leu Asp Asp Asp Cys Val Thr

245 250 255

Glu Leu Ser Val His His Arg Asn Asn Arg Gln Thr Met Glu Asp Leu

260 265 270

Ile Ser Leu Trp Gln Tyr Asp His Leu Thr Ala Thr Tyr Leu Leu Leu

275 280 285

Leu Ala Lys Lys Ala Arg Gly Lys Pro Val Arg Leu Arg Leu Ser Ser

290 295 300

Phe Ser Cys Gly Gln Ala Ser Ala Thr Pro Phe Thr Asp Ile Lys Ser

305 310 315 320

Asn Asn Trp Ser Leu Glu Asp Val Thr Ala Ser Asp Lys Asn Tyr Val

325 330 335

Ala Gly Leu Ile Asp Tyr Asp Trp Cys Glu Asp Asp Leu Ser Thr Gly

340 345 350

Ala Ala Thr Pro Arg Thr Ser Gln Phe Thr Lys Tyr Trp Thr Glu Ser

355 360 365

Asn Gly Val Glu Ser Lys Ser Leu Thr Pro Ala Leu Cys Arg Thr Pro

370 375 380

Ala Asn Lys Leu Lys Asn Lys Glu Asn Val Tyr Thr Pro Lys Ser Ala

385 390 395 400

Val Lys Asn Glu Glu Tyr Phe Met Phe Pro Glu Pro Lys Thr Pro Val

405 410 415

Asn Lys Asn Gln His Lys Arg Glu Ile Leu Thr Thr Pro Asn Arg Tyr

420 425 430

Thr Thr Pro Ser Lys Ala Arg Asn Gln Cys Leu Lys Glu Thr Pro Ile

435 440 445

Lys Ile Pro Val Asn Ser Thr Gly Thr Asp Lys Leu Met Thr Gly Val

450 455 460

Ile Ser Pro Glu Arg Arg Cys Arg Ser Val Glu Leu Asp Leu Asn Gln

465 470 475 480

Ala His Met Glu Glu Thr Pro Lys Arg Lys Gly Ala Lys Val Phe Gly

485 490 495

Ser Leu Glu Arg Gly Leu Asp Lys Val Ile Thr Val Leu Thr Arg Ser

500 505 510

Lys Arg Lys Gly Ser Ala Arg Asp Gly Pro Arg Arg Leu Lys Leu His

515 520 525

Tyr Asn Val Thr Thr Thr Arg Leu Val Asn Pro Asp Gln Leu Leu Asn

530 535 540

Glu Ile Met Ser Ile Leu Pro Lys Lys His Val Asp Phe Val Gln Lys

545 550 555 560

Gly Tyr Thr Leu Lys Cys Gln Thr Gln Ser Asp Phe Gly Lys Val Thr

565 570 575

Met Gln Phe Glu Leu Glu Val Cys Gln Leu Gln Lys Pro Asp Val Val

580 585 590

Gly Ile Arg Arg Gln Arg Leu Lys Gly Asp Ala Trp Val Tyr Lys Arg

595 600 605

Leu Val Glu Asp Ile Leu Ser Ser Cys Lys Val

610 615

<210>7

<211>2251

<212>DNA

<213>人(Homo sapiens)

<220>

<221>CDS

<222>(148)..(1887)

<400>7

gaaaagattc ttaggaacgc cgtaccagcc gcgtctctca ggacagcagg cccctgtcct 60

tctgtcgggc gccgctcagc cgtgccctcc gcccctcagg ttctttttct aattccaaat 120

aaacttgcaa gaggactatg aaagatt atg atg aac ttc tca aat att atg aat 174

Met Met Asn Phe Ser Asn Ile Met Asn

1 5

tac atg aaa cta ttg gga cag tac tgc cct gga gga gag ctg ttt gac 222

Tyr Met Lys Leu Leu Gly Gln Tyr Cys Pro Gly Gly Glu Leu Phe Asp

10 15 20 25

tat ata att tcc cag gat cgc ctg tca gaa gag gag acc cgg gtt gtc 270

Tyr Ile Ile Ser Gln Asp Arg Leu Ser Glu Glu Glu Thr Arg Val Val

30 35 40

ttc cgt cag ata gta tct gct gtt gct tat gtg cac agc cag ggc tat 318

Phe Arg Gln Ile Val Ser Ala Val Ala Tyr Val His Ser Gln Gly Tyr

45 50 55

gct cac agg gac ctc aag cca gaa aat ttg ctg ttt gat gaa tat cat 366

Ala His Arg Asp Leu Lys Pro Glu Asn Leu Leu Phe Asp Glu Tyr His

60 65 70

aaa tta aag ctg att gac ttt ggt ctc tgt gca aaa ccc aag ggt aac 414

Lys Leu Lys Leu Ile Asp Phe Gly Leu Cys Ala Lys Pro Lys Gly Asn

75 80 85

aag gat tac cat cta cag aca tgc tgt ggg agt ctg gct tat gca gca 462

Lys Asp Tyr His Leu Gln Thr Cys Cys Gly Ser Leu Ala Tyr Ala Ala

90 95 100 105

cct gag tta ata caa ggc aaa tca tat ctt gga tca gag gca gat gtt 510

Pro Glu Leu Ile Gln Gly Lys Ser Tyr Leu Gly Ser Glu Ala Asp Val

110 115 120

tgg agc atg ggc ata ctg tta tat gtt ctt atg tgt gga ttt cta cca 558

Trp Ser Met Gly Ile Leu Leu Tyr Val Leu Met Cys Gly Phe Leu Pro

125 130 135

ttt gat gat gat aat gta atg gct tta tac aag aag att atg aga gga 606

Phe Asp Asp Asp Asn Val Met Ala Leu Tyr Lys Lys Ile Met Arg Gly

140 145 150

aaa tat gat gtt ccc aag tgg ctc tct ccc agt agc att ctg ctt ctt 654

Lys Tyr Asp Val Pro Lys Trp Leu Ser Pro Ser Ser Ile Leu Leu Leu

155 160 165

caa caa atg ctg cag gtg gac cca aag aaa cgg att tct atg aaa aat 702

Gln Gln Met Leu Gln Val Asp Pro Lys Lys Arg Ile Ser Met Lys Asn

170 175 180 185

cta ttg aac cat ccc tgg atc atg caa gat tac aac tat cct gtt gag 750

Leu Leu Asn His Pro Trp Ile Met Gln Asp Tyr Asn Tyr Pro Val Glu

190 195 200

tgg caa agc aag aat cct ttt att cac ctc gat gat gat tgc gta aca 798

Trp Gln Ser Lys Asn Pro Phe Ile His Leu Asp Asp Asp Cys Val Thr

205 210 215

gaa ctt tct gta cat cac aga aac aac agg caa aca atg gag gat tta 846

Glu Leu Ser Val His His Arg Asn Asn Arg Gln Thr Met Glu Asp Leu

220 225 230

att tca ctg tgg cag tat gat cac ctc acg gct acc tat ctt ctg ctt 894

Ile Ser Leu Trp Gln Tyr Asp His Leu Thr Ala Thr Tyr Leu Leu Leu

235 240 245

cta gcc aag aag gct cgg gga aaa cca gtt cgt tta agg ctt tct tct 942

Leu Ala Lys Lys Ala Arg Gly Lys Pro Val Arg Leu Arg Leu Ser Ser

250 255 260 265

ttc tcc tgt gga caa gcc agt gct acc cca ttc aca gac atc aag tca 990

Phe Ser Cys Gly Gln Ala Ser Ala Thr Pro Phe Thr Asp Ile Lys Ser

270 275 280

aat aat tgg agt ctg gaa gat gtg acc gca agt gat aaa aat tat gtg 1038

Asn Asn Trp Ser Leu Glu Asp Val Thr Ala Ser Asp Lys Asn Tyr Val

285 290 295

gcg gga tta ata gac tat gat tgg tgt gaa gat gat tta tca aca ggt 1086

Ala Gly Leu Ile Asp Tyr Asp Trp Cys Glu Asp Asp Leu Ser Thr Gly

300 305 310

gct gct act ccc cga aca tca cag ttt acc aag tac tgg aca gaa tca 1134

Ala Ala Thr Pro Arg Thr Ser Gln Phe Thr Lys Tyr Trp Thr Glu Ser

315 320 325

aat ggg gtg gaa tct aaa tca tta act cca gcc tta tgc aga aca cct 1182

Asn Gly Val Glu Ser Lys Ser Leu Thr Pro Ala Leu Cys Arg Thr Pro

330 335 340 345

gca aat aaa tta aag aac aaa gaa aat gta tat act cct aag tct gct 1230

Ala Asn Lys Leu Lys Asn Lys Glu Asn Val Tyr Thr Pro Lys Ser Ala

350 355 360

gta aag aat gaa gag tac ttt atg ttt cct gag cca aag act cca gtt 1278

Val Lys Asn Glu Glu Tyr Phe Met Phe Pro Glu Pro Lys Thr Pro Val

365 370 375

aat aag aac cag cat aag aga gaa ata ctc act acg cca aat cgt tac 1326

Asn Lys Asn Gln His Lys Arg Glu Ile Leu Thr Thr Pro Asn Arg Tyr

380 385 390

act aca ccc tca aaa gct aga aac cag tgc ctg aaa gaa act cca att 1374

Thr Thr Pro Ser Lys Ala Arg Asn Gln Cys Leu Lys Glu Thr Pro Ile

395 400 405

aaa ata cca gta aat tca aca gga aca gac aag tta atg aca ggt gtc 1422

Lys Ile Pro Val Asn Ser Thr Gly Thr Asp Lys Leu Met Thr Gly Val

410 415 420 425

att agc cct gag agg cgg tgc cgc tca gtg gaa ttg gat ctc aac caa 1470

Ile Ser Pro Glu Arg Arg Cys Arg Ser Val Glu Leu Asp Leu Asn Gln

430 435 440

gca cat atg gag gag act cca aaa aga aag gga gcc aaa gtg ttt ggg 1518

Ala His Met Glu Glu Thr Pro Lys Arg Lys Gly Ala Lys Val Phe Gly

445 450 455

agc ctt gaa agg ggg ttg gat aag gtt atc act gtg ctc acc agg agc 1566

Ser Leu Glu Arg Gly Leu Asp Lys Val Ile Thr Val Leu Thr Arg Ser

460 465 470

aaa agg aag ggt tct gcc aga gac ggg ccc aga aga cta aag ctt cac 1614

Lys Arg Lys Gly Ser Ala Arg Asp Gly Pro Arg Arg Leu Lys Leu His

475 480 485

tat aat gtg act aca act aga tta gtg aat cca gat caa ctg ttg aat 1662

Tyr Asn Val Thr Thr Thr Arg Leu Val Asn Pro Asp Gln Leu Leu Asn

490 495 500 505

gaa ata atg tct att ctt cca aag aag cat gtt gac ttt gta caa aag 1710

Glu Ile Met Ser Ile Leu Pro Lys Lys His Val Asp Phe Val Gln Lys

510 515 520

ggt tat aca ctg aag tgt caa aca cag tca gat ttt ggg aaa gtg aca 1758

Gly Tyr Thr Leu Lys Cys Gln Thr Gln Ser Asp Phe Gly Lys Val Thr

525 530 535

atg caa ttt gaa tta gaa gtg tgc cag ctt caa aaa ccc gat gtg gtg 1806

Met Gln Phe Glu Leu Glu Val Cys Gln Leu Gln Lys Pro Asp Val Val

540 545 550

ggt atc agg agg cag cgg ctt aag ggc gat gcc tgg gtt tac aaa aga 1854

Gly Ile Arg Arg Gln Arg Leu Lys Gly Asp Ala Trp Val Tyr Lys Arg

555 560 565

tta gtg gaa gac atc cta tct agc tgc aag gta taattgatgg attcttccat 1907

Leu Val Glu Asp Ile Leu Ser Ser Cys Lys Val

570 575 580

cctgccggat gagtgtgggt gtgatacagc ctacataaag actgttatga tcgctttgat 1967

tttaaagttc attggaacta ccaacttgtt tctaaagagc tatcttaaga ccaatatctc 2027

tttgttttta aacaaaagat attattttgt gtatgaatct aaatcaagcc catctgtcat 2087

tatgttactg tcttttttaa tcatgtggtt ttgtatatta ataattgttg actttcttag 2147

attcacttcc atatgtgaat gtaagctctt aactatgtct ctttgtaatg tgtaatttct 2207

ttctgaaata aaaccatttg tgaatataaa aaaaaaaaaa aaaa 2251

<210>8

<211>580

<212>PRT

<213>人(Homo sapiens)

<400>8

Met Met Asn Phe Ser Asn Ile Met Asn Tyr Met Lys Leu Leu Gly Gln

1 5 10 15

Tyr Cys Pro Gly Gly Glu Leu Phe Asp Tyr Ile Ile Ser Gln Asp Arg

20 25 30

Leu Ser Glu Glu Glu Thr Arg Val Val Phe Arg Gln Ile Val Ser Ala

35 40 45

Val Ala Tyr Val His Ser Gln Gly Tyr Ala His Arg Asp Leu Lys Pro

50 55 60

Glu Asn Leu Leu Phe Asp Glu Tyr His Lys Leu Lys Leu Ile Asp Phe

65 70 75 80

Gly Leu Cys Ala Lys Pro Lys Gly Asn Lys Asp Tyr His Leu Gln Thr

85 90 95

Cys Cys Gly Ser Leu Ala Tyr Ala Ala Pro Glu Leu Ile Gln Gly Lys

100 105 110

Ser Tyr Leu Gly Ser Glu Ala Asp Val Trp Ser Met Gly Ile Leu Leu

115 120 125

Tyr Val Leu Met Cys Gly Phe Leu Pro Phe Asp Asp Asp Asn Val Met

130 135 140

Ala Leu Tyr Lys Lys Ile Met Arg Gly Lys Tyr Asp Val Pro Lys Trp

145 150 155 160

Leu Ser Pro Ser Ser Ile Leu Leu Leu Gln Gln Met Leu Gln Val Asp

165 170 175

Pro Lys Lys Arg Ile Ser Met Lys Asn Leu Leu Asn His Pro Trp Ile

180 185 190

Met Gln Asp Tyr Asn Tyr Pro Val Glu Trp Gln Ser Lys Asn Pro Phe

195 200 205

Ile His Leu Asp Asp Asp Cys Val Thr Glu Leu Ser Val His His Arg

210 215 220

Asn Asn Arg Gln Thr Met Glu Asp Leu Ile Ser Leu Trp Gln Tyr Asp

225 230 235 240

His Leu Thr Ala Thr Tyr Leu Leu Leu Leu Ala Lys Lys Ala Arg Gly

245 250 255

Lys Pro Val Arg Leu Arg Leu Ser Ser Phe Ser Cys Gly Gln Ala Ser

260 265 270

Ala Thr Pro Phe Thr Asp Ile Lys Ser Asn Asn Trp Ser Leu Glu Asp

275 280 285

Val Thr Ala Ser Asp Lys Asn Tyr Val Ala Gly Leu Ile Asp Tyr Asp

290 295 300

Trp Cys Glu Asp Asp Leu Ser Thr Gly Ala Ala Thr Pro Arg Thr Ser

305 310 315 320

Gln Phe Thr Lys Tyr Trp Thr Glu Ser Asn Gly Val Glu Ser Lys Ser

325 330 335

Leu Thr Pro Ala Leu Cys Arg Thr Pro Ala Asn Lys Leu Lys Asn Lys

340 345 350

Glu Asn Val Tyr Thr Pro Lys Ser Ala Val Lys Asn Glu Glu Tyr Phe

355 360 365

Met Phe Pro Glu Pro Lys Thr Pro Val Asn Lys Asn Gln His Lys Arg

370 375 380

Glu Ile Leu Thr Thr Pro Asn Arg Tyr Thr Thr Pro Ser Lys Ala Arg

385 390 395 400

Asn Gln Cys Leu Lys Glu Thr Pro Ile Lys Ile Pro Val Asn Ser Thr

405 410 415

Gly Thr Asp Lys Leu Met Thr Gly Val Ile Ser Pro Glu Arg Arg Cys

420 425 430

Arg Ser Val Glu Leu Asp Leu Asn Gln Ala His Met Glu Glu Thr Pro

435 440 445

Lys Arg Lys Gly Ala Lys Val Phe Gly Ser Leu Glu Arg Gly Leu Asp

450 455 460

Lys Val Ile Thr Val Leu Thr Arg Ser Lys Arg Lys Gly Ser Ala Arg

465 470 475 480

Asp Gly Pro Arg Arg Leu Lys Leu His Tyr Asn Val Thr Thr Thr Arg

485 490 495

Leu Val Asn Pro Asp Gln Leu Leu Asn Glu Ile Met Ser Ile Leu Pro

500 505 510

Lys Lys His Val Asp Phe Val Gln Lys Gly Tyr Thr Leu Lys Cys Gln

515 520 525

Thr Gln Ser Asp Phe Gly Lys Val Thr Met Gln Phe Glu Leu Glu Val

530 535 540

Cys Gln Leu Gln Lys Pro Asp Val Val Gly Ile Arg Arg Gln Arg Leu

545 550 555 560

Lys Gly Asp Ala Trp Val Tyr Lys Arg Leu Val Glu Asp Ile Leu Ser

565 570 575

Ser Cys Lys Val

580

<210>9

<211>20

<212>DNA

<213>人工的

<220>

<223>人工合成的RT-PCR引物

<400>9

cgaccacttt gtcaagctca 20

<210>10

<211>23

<212>DNA

<213>人工的

<220>

<223>人工合成的RT-PCR引物

<400>10

ggttgagcac agggtacttt att 23

<210>11

<211>22

<212>DNA

<213>人工的

<220>

<223>人工合成的RT-PCR引物

<400>11

tgggtaacaa gagaatggtt ca 22

<210>12

<211>22

<212>DNA

<213>人工的

<220>

<223>人工合成的RT-PCR引物

<400>12

atccaagtcc taatcccttt gg 22

<210>13

<211>22

<212>DNA

<213>人工的

<220>

<223>人工合成的RT-PCR引物

<400>13

gctgcaaggt ataattgatg ga 22

<210>14

<211>23

<212>DNA

<213>人工的

<220>

<223>人工合成的RT-PCR引物

<400>14

cagtaacata atgacagatg ggc 23

<210>15

<211>22

<212>DNA

<213>人工的

<220>

<223>人工合成的PCR引物

<400>15

ttatcactgt gctcaccagg ag 22

<210>16

<211>22

<212>DNA

<213>人工的

<220>

<223>人工合成的PCR引物

<400>16

aaacttgcct gccatatcct ta 22

<210>17

<211>22

<212>DNA

<213>人工的

<220>

<223>人工合成的PCR引物

<400>17

attttgttgg ctgtctctag ca 22

<210>18

<211>30

<212>DNA

<213>人工的

<220>

<223>人工合成的PCR引物

<400>18

aaagaattcg ggtgtcgtta atgttcgggg 30

<210>19

<211>30

<212>DNA

<213>人工的

<220>

<223>人工合成的PCR引物

<400>19

aaagcggccg cttaggcgga ttttcctgca 30

<210>20

<211>30

<212>DNA

<213>人工的

<220>

<223>人工合成的PCR引物

<400>20

cggaattcac tatgaaagat tatgatgaac 30

<210>21

<211>30

<212>DNA

<213>人工的

<220>

<223>人工合成的PCR引物

<400>21

aaactcga gt accttgcagc tagataggat 30

<210>22

<211>51

<212>DNA

<213>人工的

<220>

<223>人工合成的用于siRNA的寡核苷酸

<400>22

tcccgcgcgc tttgtaggat tcgttcaaga gacgaatcct acaaagcgcg c 51

<210>23

<211>51

<212>DNA

<213>人工的

<220>

<223>人工的ly synthesized primer for siRNA

<400>23

aaaagcgcgc tttgtaggat tcgtctcttg aacgaatcct acaaagcgcg c 51

<210>24

<211>51

<212>DNA

<213>人工的

<220>

<223>人工合成的用于siRNA的寡核苷酸

<400>24

tccccgtacg cggaatactt cgattcaaga gatcgaagta ttccgcgtac g 51

<210>25

<211>51

<212>DNA

<213>人工的

<220>

<223>人工合成的用于siRNA的寡核苷酸

<400>25

aaaacgtacg cggaatactt cgatctcttg aatcgaagta ttccgcgtac g 51

<210>26

<211>20

<212>DNA

<213>人工的

<220>

<223>人工合成的RT-PCR引物

<400>26

ttagctgtgc tcgcgctact 20

<210>27

<211>20

<212>DNA

<213>人工的

<220>

<223>人工合成的RT-PCR引物

<400>27

tcacatggtt cacacggcag 20

<210>28

<211>25

<212>DNA

<213>人工的

<220>

<223>人工合成的RT-PCR引物

<400>28

ttaagtgaag gctctgattc tagtt 25

<210>29

<211>21

<212>DNA

<213>人工的

<220>

<223>人工合成的RT-PCR引物

<400>29

gtccttattg gctggttcgt t 21

<210>30

<211>51

<212>DNA

<213>人工的

<220>

<223>人工合成的用于siRNA的寡核苷酸

<400>30

tcccgtatat cttgccctct gaattcaaga gattcagagg gcaagatata c 51

<210>31

<211>51

<212>DNA

<213>人工的

<220>

<223>人工合成的用于siRNA的寡核苷酸

<400>31

aaaagtatat cttgccctct gaatctcttg aattcagagg gcaagatata c 51

<210>32

<211>51

<212>DNA

<213>人工的

<220>

<223>人工合成的用于siRNA的寡核苷酸

<400>32

tcccgtccga acacatcttt gttttcaaga gaaacaaaga tgtgttcgga c 51

<210>33

<211>51

<212>DNA

<213>人工的

<220>

<223>人工合成的用于siRNA的寡核苷酸

<400>33

aaaagtccga acacatcttt gtttctcttg aaaacaaaga tgtgttcgga c 51

<210>34

<211>51

<212>DNA

<213>人工的

<220>

<223>人工合成的用于siRNA的寡核苷酸

<400>34

tcccgacatc ctatctagct gcattcaaga gatgcagcta gataggatgt c 51

<210>35

<211>51

<212>DNA

<213>人工的

<220>

<223>人工合成的用于siRNA的寡核苷酸

<400>35

aaaagacatc ctatctagct gcatctcttg aatgcagcta gataggatgt c 51

<210>36

<211>51

<212>DNA

<213>人工的

<220>

<223>人工合成的用于siRNA的寡核苷酸

<400>36

tcccagttca ttggaactac caattcaaga gattggtagt tccaatgaac t 51

<210>37

<211>51

<212>DNA

<213>人工的

<220>

<223>人工合成的用于siRNA的寡核苷酸

<400>37

aaaaagttca ttggaactac caatctcttg aattggtagt tccaatgaac t 51

<210>38

<211>19

<212>DNA

<213>人工的

<220>

<223>SiRNA靶序列

<400>38

gtatatcttg ccctctgaa 19

<210>39

<211>19

<212>DNA

<213>人工的

<220>

<223>SiRNA靶序列

<400>39

gtccgaacac atctttgtt 19

<210>40

<211>19

<212>DNA

<213>人工的

<220>

<223>SiRNA靶序列

<400>40

gacatcctat ctagctgca 19

<210>41

<211>19

<212>DNA

<213>人工的

<220>

<223>SiRNA靶序列

<400>41

agttcattgg aactaccaa 19

<210>42

<211>32

<212>DNA

<213>人工的

<220>

<223>人工合成的PCR引物

<400>42

acggaattca tcatgcaaga ttacaactat cc 32

<210>43

<211>33

<212>DNA

<213>人工的

<220>

<223>人工合成的PCR引物

<400>43

gacgga attc aatatggagg agactccaaa aag 33

<210>44

<211>30

<212>DNA

<213>人工的

<220>

<223>人工合成的PCR引物

<400>44

ccctcgagta ccttgcagct agataggatg 30

Claims

1.选自下列的基本上纯的多肽：

(a)多肽，其含有氨基酸序列SEQ ID NO：6或8；

(b)多肽，其含有氨基酸序列SEQ ID NO：6或8且其中取代、缺失、插入和/或添加了一个或多个氨基酸，该多肽具有与由氨基酸序列SEQ ID NO：6或8组成的蛋白等同的生物活性；和

(c)多肽，其由能在严紧条件下与核苷酸序列SEQ ID NO：5或7组成的多核苷酸杂交的多核苷酸编码，且所述多肽具有与由SEQ ID NO：6或8中任一氨基酸序列组成的多肽等同的生物活性。

2.分离的多核苷酸，其编码权利要求1的多肽。

3.载体，其含有权利要求2的多核苷酸。

4.宿主细胞，其携有权利要求2的多核苷酸或权利要求3的载体。

5.产生权利要求1的多肽的方法，所述方法包括下述步骤：

(a)培养权利要求4的宿主细胞；

(b)使所述宿主细胞表达所述多肽；和

(c)收集所表达的多肽。

6.抗体，其与权利要求1的多肽结合。

7.多核苷酸，其与权利要求2的多核苷酸或其互补链互补，并且含有至少15个核苷酸。

8.反义多核苷酸或小干扰RNA，其针对权利要求2的多核苷酸。

9.权利要求8的小干扰RNA，其有义链选自核苷酸序列SEQ ID NO：38，39，40和41。

10.诊断乳腺癌的方法，所述方法包括下述步骤：

(a)检测标本的生物样品中编码氨基酸序列SEQ ID NO：2，4，6或8的基因的表达水平；和

(b)将表达水平的升高与乳腺癌相关联。

11.权利要求10的方法，其中所述表达水平通过选自下列的任一种方法检测：

(a)检测编码氨基酸序列SEQ ID NO：2，4，6或8的mRNA；

(b)检测含有氨基酸序列SEQ ID NO：2，4，6或8的蛋白；和

(c)检测含有氨基酸序列SEQ ID NO：2，4，6或8的蛋白的生物活性。

12.筛选可用于治疗乳腺癌的化合物的方法，所述方法包括下述步骤：

(a)使受试化合物与选自下列的多肽接触：

(1)多肽，其含有氨基酸序列SEQ ID NO：2，4，6或8；

(2)多肽，其含有氨基酸序列SEQ ID NO：2，4，6或8且其中取代、缺失、插入和/或添加了一个或多个氨基酸，该多肽具有与由氨基酸序列SEQ IDNO：2，4，6或8组成的蛋白等同的生物活性；和

(3)多肽，其由能在严紧条件下与由核苷酸序列SEQ ID NO：1，3，5或7组成的多核苷酸杂交的多核苷酸编码，其中所述多肽具有与由氨基酸序列SEQ ID NO：2，4，6或8组成的多肽等同的生物活性；

(b)检测所述多肽与受试化合物之间的结合活性；和

(c)选择与所述多肽结合的受试化合物。

13.筛选治疗乳腺癌的化合物的方法，所述方法包括下述步骤：

a)使候选化合物与细胞接触，所述细胞表达一种或多种含核苷酸序列SEQ ID NO：1，3，5或7的多核苷酸；和

b)选择与缺乏受试化合物时检测到的表达水平相比，能降低一种或多种含核苷酸序列SEQ ID NO：1，3，5或7的多核苷酸的表达水平的受试化合物。

14.筛选可用于治疗乳腺癌的化合物的方法，所述方法包括下述步骤：

(a)使受试化合物与选自下列的多肽接触：

(1)多肽，含有氨基酸序列SEQ ID NO：2，4，6或8的；

(2)多肽，含有氨基酸序列SEQ ID NO：2，4，6或8且其中取代、缺失、插入和/或添加了一个或多个氨基酸，该多肽具有与由氨基酸序列SEQ IDNO：2，4，6或8组成的蛋白等同的生物活性；和

(3)多肽，由能在严紧条件下与由核苷酸序列SEQ ID NO：1，3，5或7组成的多核苷酸杂交的多核苷酸编码，其中所述多肽具有与由氨基酸序列SEQ ID NO：2，4，6或8组成的多肽等同的生物活性；

(b)检测步骤(a)的多肽的生物活性；和

(c)选择与缺乏受试化合物时检测到的生物活性相比，能抑制所述多肽生物活性的化合物。

15.权利要求14的方法，其中所述生物活性是细胞-增殖活性。

16.权利要求14的方法，其中所述由SEQ ID NO：2，4，6或8组成的多肽的生物活性是激酶活性。

17.筛选可用于治疗乳腺癌的化合物的方法，所述方法包括下述步骤：

a)使候选化合物与已导入载体的细胞接触，所述载体含有一或多种标记基因的转录调节区和在所述转录调节区控制之下表达的报道基因，其中所述一或多种标记基因含有选自SEQ ID NO：1，3，5和7的任一核苷酸序列，

b)测定所述报道基因的表达或活性；和

18.用于治疗乳腺癌的组合物，所述组合物含有药物有效量的反义多核苷酸或小干扰RNA作为活性成分并含有可药用载体，所述反义多核苷酸或小干扰RNA针对编码选自下列的多肽的多核苷酸：

(a)多肽，其含有氨基酸序列SEQ ID NO：2，4，6或8；

(b)多肽，其含有氨基酸序列SEQ ID NO：2，4，6或8且其中取代、缺失、插入和/或添加就一个或多个氨基酸，所述多肽具有与由氨基酸序列SEQ IDNO：2，4，6或8组成的蛋白等同的生物活性；和

(c)多肽，其由能在严紧条件下与由核苷酸序列SEQ ID NO：1，3，5或7组成的多核苷酸杂交的多核苷酸编码，其中所述多肽具有与由氨基酸序列SEQ ID NO：2，4，6或8组成的多肽等同的生物活性。

19.用于治疗乳腺癌的组合物，所述组合物含有药物有效量的抗体作为活性成分并含有可药用载体，所述抗体抗选自下列的多肽：

(a)多肽，其含有氨基酸序列SEQ ID NO：2，4，6或8；

(b)多肽，其含有氨基酸序列SEQ ID NO：2，4，6或8且其中取代、缺失、插入和/或添加了一个或多个氨基酸，所述多肽具有与由氨基酸序列SEQ IDNO：2，4，6或8组成的蛋白等同的生物活性；和

20.可用于治疗乳腺癌的组合物，所述组合物含有药物有效量的化合物作为活性成分并含有可药用载体，所述化合物通过权利要求12-17之一的方法选出。

21.治疗乳腺癌的方法，所述方法包括施用药物有效量的反义多核苷酸或小干扰RNA，其针对编码选自下列的多肽的多核苷酸：

(1)多肽，其含有氨基酸序列SEQ ID NO：2，4，6或8；

(2)多肽，其含有氨基酸序列SEQ ID NO：2，4，6或8且其中取代、缺失、插入和/或添加了一个或多个氨基酸，所述多肽具有与由氨基酸序列SEQ IDNO：2，4，6或8组成的蛋白等同的生物活性；和

(3)多肽，其由能在严紧条件下与由核苷酸序列SEQ ID NO：1，3，5或7组成的多核苷酸杂交的多核苷酸编码，其中所述多肽具有与由氨基酸序列SEQ ID NO：2，4，6或8组成的多肽等同的生物活性。

22.治疗乳腺癌的方法，所述方法包括施用药物有效量的抗体，所述抗体抗选自下列的多肽：

(a)多肽，其含有氨基酸序列SEQ ID NO：2，4，6或8；

(b)多肽，含有氨基酸序列SEQ ID NO：2，4，6或8且其中取代、缺失、插入和/或添加了一个或多个氨基酸，所述多肽具有与由氨基酸序列SEQ IDNO：2，4，6或8组成的蛋白等同的生物活性；和

23.治疗乳腺癌的方法，所述方法包括施用药物有效量的化合物，所述化合物通过权利要求12-17之一的方法选出。

24.治疗或预防乳腺癌的方法，所述方法包括施用药物有效量的选自(a)-(c)的多肽或编码所述多肽的多核苷酸：

(a)多肽或其片段，所述多肽含有氨基酸序列SEQ ID NO：2，4，6或8；

(b)多肽或其片段，所述多肽含有氨基酸序列SEQ ID NO：2，4，6或8且其中取代、缺失、插入和/或添加了一个或多个氨基酸，所述多肽或其片段具有与由氨基酸序列SEQ ID NO：2，4，6或8组成的蛋白等同的生物活性；和

(c)多肽或其片段，所述多肽由能在严紧条件下与由核苷酸序列SEQ IDNO：1，3，5或7组成的多核苷酸杂交的多核苷酸编码，其中所述多肽具有与由氨基酸序列SEQ ID NO：2，4，6或8组成的多肽等同的生物活性。

25.诱导针对乳腺癌的抗肿瘤免疫力的方法，所述方法包括使选自(a)-(c)的多肽与抗原呈递细胞接触，或将编码所述多肽的多核苷酸或含有所述多核苷酸的载体导入抗原呈递细胞：

(b)多肽或其片段，所述多肽含有氨基酸序列SEQ ID NO：2，4，6或8且其中取代、缺失、插入和/或添加了一个或多个氨基酸，所述多肽具有与由氨基酸序列SEQ ID NO：2，4，6或8组成的蛋白等同的生物活性；和

26.权利要求25的诱导抗肿瘤免疫力的方法，其中所述方法还包括给受试者施用抗原呈递细胞的步骤。

27.治疗或预防乳腺癌的药物组合物，所述组合物含有药物有效量的选自(a)-(c)的多肽或编码所述多肽的多核苷酸作为活性成分，并含有可药用载体：

28.权利要求27的药物组合物，其中所述多核苷酸被掺入到表达载体中。