CN101835893A - 癌症相关基因cdca5、epha7、stk31和wdhd1 - Google Patents

癌症相关基因cdca5、epha7、stk31和wdhd1 Download PDF

Info

Publication number
CN101835893A
CN101835893A CN200880113358A CN200880113358A CN101835893A CN 101835893 A CN101835893 A CN 101835893A CN 200880113358 A CN200880113358 A CN 200880113358A CN 200880113358 A CN200880113358 A CN 200880113358A CN 101835893 A CN101835893 A CN 101835893A
Authority
CN
China
Prior art keywords
epha7
level
seq
cancer
cdca5
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880113358A
Other languages
English (en)
Inventor
中村佑辅
醍醐弥太郎
中鹤修一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oncotherapy Science Inc
Original Assignee
Oncotherapy Science Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oncotherapy Science Inc filed Critical Oncotherapy Science Inc
Publication of CN101835893A publication Critical patent/CN101835893A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1138Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds

Abstract

本发明的特征在于,利用与正常器官相比过表达的基因:CDCA5、EPHA7、STK31或WDHD1检测癌症(尤其是肺癌和/或食道癌)的方法。本发明还公开了根据CDCA5、EPHA7、STK31或WDHD1在癌症中的过表达或者生物活性,尤其是EPHA7与EGFR之间的相互作用,鉴定用于治疗和预防癌症的化合物的方法。本发明的特征还在于,通过施用针对CDCA5、EPHA7、STK31或WDHD1基因的双链分子来治疗癌症的方法。本发明的特征还在于用在所提供的方法中的产物,包括双链分子和编码它们的载体,以及包括所述分子或载体的组合物。

Description

癌症相关基因CDCA5、EPHA7、STK31和WDHD1
技术领域
相关申请的交叉引用
本申请要求2007年8月24日提交的美国临时申请流水号60/957,934和2007年10月3日提交的美国临时申请流水号60/977,335的权益,上述申请的全部内容援引并入本文。
技术领域
本发明涉及生物科学领域,更具体地涉及癌症研究领域。特别地,本发明涉及检测和诊断癌症的方法,以及治疗和预防癌症的方法。此外,本发明还涉及对治疗和预防癌症有用的作用剂的筛选方法。
背景技术
肺癌和食道癌
包括肺癌、食道癌和鼻咽癌在内的上呼吸消化道癌症占日本所有癌症死亡的近四分之一。肺癌是全世界癌症相关死亡的主要原因,每年有130万患者死于肺癌(WHO Cancer World Health Organization.2006)。肺癌的两种主要的不同组织学类型,非小细胞肺癌(NSCLC)和小细胞肺癌(SCLC)具有不同的病理生理和临床特征。NSCLC占肺癌总数的近80%,而SCLC占肺癌总数的20%(Morita T & Sugano H.Acta Pathol Jpn.1990Sep;40(9):665-75;Simon GR,et al.,Chest.2003 Jan;123(1Suppl):259S-271S)。尽管已经采用了联合各种治疗形式例如放射疗法和化学疗法的外科技术,但5年肺癌总存活率仍然很低,约15%(Parkin DM.Lancet Oncol.2001Sep;2(9):533-43)。食道鳞状细胞癌(ESCC)是最致死性的消化道癌症之一,并且其肺癌5年总存活率仅为15%(Shimada H,et al.,Surgery.2003May;133(5):486-94)。在称为“亚洲食道癌带(Asian esophageal cancer belt)”的地区已有食道癌最高发病率的报道,该地区覆盖了从里海东海岸到华中地区(Mosavi-Jarrahi A & Mohagheghi MA.Asian Pac J Cancer Prev.2006Jul-Sep;7(3):375-80)。尽管已有许多与肺癌和食道癌发生和发展相关的遗传学改变的报道,但精确的分子机制仍然不清楚(Sozzi G.Eur J Cancer.2001Oct;37Suppl 7:S63-73)。
尽管应用了联合各种治疗形式例如放射疗法和化学疗法的外科技术,但已知肺癌和ESCC显示出在恶性肿瘤中预后最差。包括所有疾病阶段的肺癌患者的5年存活率仍然保持在15%,ESCC患者的5年存活率为10%-16%(Parkin Dm et al.,CA Cancer J Clin 2005;55:74-108 Global cancerstatistics,2002)。因此,急切期待改良的治疗策略,包括开发分子靶向作用剂和抗体,以及癌症疫苗。对肺癌分子基础理解的加深已确定抑制肿瘤生长和进展中特异性关键分子这样的靶向策略。例如,表皮生长因子受体(EGFR)在NSCLC中普遍过表达,其表达常与不良预后相关(Brabender J,et al.,Clin Cancer Res.2001 Jul;7(7):1850-5)。最近,已经开发出两种主要类别的EGFR抑制剂;作为酪氨酸激酶抑制剂(TKI)的小分子,例如吉非替尼(gefitinib)和埃罗替尼(erlotinib),以及针对EGFR胞外区的单克隆抗体,例如,西妥昔单抗(cetuximab)。尽管期望上述靶向治疗能提高NSCLC的预后,但结果仍然不够充分。与安慰剂相比,埃罗替尼显示出存活效果,其中与安慰剂的4.7个月相比,埃罗替尼的中位生存时间为6.7个月(ShepherdFA.et al.,N Engl J Med.2005 Jul 14;353(2):123-32)。另一方面,只有吉非替尼显示出优良应答率和症状控制(Giaccone G,et al.,J Clin Oncol.2004 Mar1;22(5):777-84;Baselga J.J Clin Oncol.2004 Mar 1;22(5):759-61)。至于西妥昔单抗,当前2期数据还不够成熟,不足以作出任何关于该作用剂在NSCLC中作用的确定性结论(Azim HA & Ganti AK.Cancer Treat Rev.2006Dec;32(8):630-6.Epub 2006 Oct 10)。因此,急切期待有效的治疗策略,包括开发分子靶向作用剂和抗体,以及癌症疫苗。
肿瘤标志物
目前可以用于肺癌的肿瘤标志物,例如癌胚抗原(CEA)、血清细胞角蛋白19片段(CYFRA 21-1)和胃泌素释放肽前体(pro-GRP),由于它们在检测癌细胞存在方面具有相对低的灵敏度和特异性,因此用于早期诊断或监测该疾病方面并不令人满意(Shinkai T,et al.,Cancer.1986 Apr1;57(7):1318-23;Pujol JL,et al.,Cancer Res.1993 Jan 1;53(1):61-6)。同样地,目前可以用于食道癌的肿瘤标志物,例如鳞状细胞癌相关抗原(SCC)、癌胚抗原(CEA)、血清细胞角蛋白19片段(CYFRA 21-1)在用于早期诊断或者监测该疾病方面并不令人满意。尽管与肺和食道肿瘤发生相关的精确途径仍然不清楚,但一些证据表明肿瘤细胞在分化的特定阶段表达每个组织学类型所特有的细胞表面标志物(Mahomed F,et al.,Oral Dis.2007Jul;13(4):386-92)。因为细胞表面蛋白被认为更接近免疫机制和药物传递系统,所以鉴定癌症特异性细胞表面和分泌蛋白将会是开发有效的诊断标志物和治疗策略的有效方法。
cDNA微阵列分析
系统分析cDNA微阵列上成千上万个基因的表达水平是鉴定致癌途径相关分子的有效方法,这些基因或其产物中的一些将成为开发有效抗癌药物和疾病可靠指标的肿瘤标志物的靶标。为了分离这些分子,我们已采用经激光显微解剖制备的纯肿瘤细胞群对肺癌和ESCC的全基因组表达谱进行了分析(Kikuchi T,et al.,Oncogene.2003 Apr 10;22(14):2192-205;KakiuchiS,et al.,Mol Cancer Res.2003 May;1(7):485-99;Kakiuchi S,et al.,Hum MolGenet.2004 Dec 15;13(24):3029-43.Epub 2004 Oct 20;Kikuchi T,et al.,Int JOncol.2006 Apr;28(4):799-805;Taniwaki M,et al.,Int J Oncol.2006Sep;29(3):567-75;Yamabuki T,et al.,Int J Oncol.2006 Jun;28(6):1375-84)。
siRNA
例如,近年来,在临床试验中尝试了一种采用基因特异性短干扰RNA(siRNA)的癌症治疗新方法(Bumcrot D et al.,Nat Chem Biol 2006 Dec,2(12):711-9)。RNAi在主要技术平台中已占有一席之地(Putral LN et al.,Drug News Perspect 2006 Jul-Aug,19(6):317-24;Frantz S,Nat Rev DrugDiscov 2006 Jul,5(7):528-9;Dykxhoorn DM et al.,Gene Ther 2006 Mar,13(6):541-52)。然而,在RNAi可以临床应用之前还需要面临一些挑战。这些挑战包括RNA的体内稳定性不好(Hall AH et al.,Nucleic Acids Res 2004 Nov15,32(20):5991-6000,Print 2004;Amarzguioui M et al.,Nucleic Acids Res2003 Jan 15,31(2):589-95)、作为药剂的毒性(Frantz S,Nat Rev Drug Discov2006 Jul,5(7):528-9)、传递方式、所使用的siRNA或shRNA的精确序列,以及细胞类型特异性。
公认的事实是,存在与部分同源基因的沉默化或激活干扰素反应从而诱导普遍性基因抑制相关的可能毒性(Judge AD et al.,Nat Biotechnol 2005Apr,23(4):457-62,Epub 2005 Mar 20;Jackson AL & Linsley PS,Trends Genet2004 Nov,20(11):521-4)。因此对于开发抗癌药物需要靶向癌症特异性基因的没有不良副作用的双链分子。
基因功能
(1)CDCA5
CDCA5被鉴定为姐妹染色单体粘连的调节子,一种细胞周期调控蛋白。这个35-KDa蛋白在G1期经后期促进复合物(APC)依赖泛素化作用降解。先前的研究已经证明CDCA5与染色质上的粘结蛋白(cohesin)相互作用,并且在分裂间期发挥作用帮助姐妹染色单体粘连。与通常大多数G2细胞中的相比,姐妹染色单体进一步分离,这证明在S期期间建立粘连已经需要CDCA5(Schmitz J,et al.,Curr Biol.2007 Apr 3;17(7):630-6.Epub 2007 Mar8)。迄今为止,已知只有一种其它蛋白是建立粘连所明确需要的:芽殖酵母乙酰转移酶Eco1/Ctf7(Skibbens RV,et al.,Genes Dev.1999 Feb1;13(3):307-19;Tóth A,et al.,Genes Dev.1999 Feb 1;13(3):320-33;Ivanov D,et al.,Curr Biol.2002 Feb 19;12(4):323-8)。尽管这种酶的同系物在S期是否发挥作用尚不清楚,但这些蛋白也是果蝇和人类细胞中粘连所需的(Williams BC,et al.,Curr Biol.2003 Dec 2;13(23):2025-36;Hou F & Zou H.Mol Biol Cell.2005 Aug;16(8):3908-18.Epub 2005 Jun 15)。因此确定CDCA5和Eco1/Ctf7同系物是否在癌细胞中协同建立粘连是有意义的。
必需在细胞周期的适当时间建立和解除姐妹染色单体粘连,来有效地确保精确的染色体分离。先前已经证明通过靶向用于降解的后期抑制剂保全素(securin)激活APCCdc20可以控制粘连的分解。这样可使分离酶依赖性地切割Scc1/Rad21,并引发后期。大多数APC细胞周期底物的降解就它们的功能而言是合理的;降解阻止活性不合时宜的存在并且以棘齿样(ratchet-like)方式促进细胞周期进程。
CDCA5的功能也是与调节粘连的其它因子的功能冗余的,所述因子的活性结合起来确保染色体复制和分离可靠性(Rankin S,et al.,Mol Cell.2005Apr 15;18(2):185-200)。根据我们的微阵列资料,尽管APC和CDC20在正常组织中表达水平低,但它们在肺癌和食道癌中是高表达的。此外,采用半定量RT-PCR和免疫组织化学分析已证实CDC20在临床小细胞肺癌中高表达(Taniwaki M,et al,Int J Oncol.2006 Sep;29(3):567-75)。
这些资料与CDCA5协同CDC20通过促进细胞周期进程来增强癌细胞生长的结论是一致的,尽管没有证据表明这些分子能与CDCA5直接相互作用。该蛋白位于间期细胞的细胞核,在有丝分裂中从染色单体分散,并且在后期中与粘连复合物相互作用(Rankin S,et al.,Mol Cell.2005 Apr15;18(2):185-200)。有报道称CDCA5是间期中粘连稳定结合染色单体和姐妹染色单体粘连所需的(Schmitz J,et al.,Curr Biol.2007 Apr 3;17(7):630-6.Epub 2007 Mar 8)。尽管有这些生物学研究,但在本发明之前还没有描述CDCA5的激活在人类致癌作用中重要性及其作为诊断和治疗靶标用途的相关报道。
(2)EPHA7
EPH受体是受体酪氨酸激酶中的最大一个类群,并且在发育和成熟组织的多种细胞类型中都有发现。EPH蛋白的一个显著功能包括建立细胞定位和维持细胞组织。在中枢神经系统的许多发育区域,EPH受体和肝配蛋白(ephrin)显示出互补性的表达模式(Murai KK & Pasquale EB.J Cell Sci.2003 Jul 15;116(Pt 14):2823-32)。根据EPH受体相应配体和其序列同源性,将EPH受体分成两组:EphA和EphB受体(Eph Nomenclature Committee,1997)。
在人类基因组中发现的所有受体酪氨酸激酶(RTK)中,Eph受体家族具有13个成员,构成最大的一个家族。根据序列相似性和配体亲和力,将EPH受体分成A亚类和B亚类,A亚类包括8个成员(EPHA1-EPHA8),在哺乳动物中B亚类包括5个成员(EPHB1-EPHB4,EPHB6)。它们的配体肝配蛋白分为两个亚类,A亚类(肝配蛋白A1-肝配蛋白A5),其通过糖基磷脂酰肌醇(GPI)锚固定到细胞膜,以及B亚类(肝配蛋白B1-肝配蛋白B3),其成员具有跨膜区,其后是一个短的胞质区(Kullander K & KleinR.Nat Rev Mol Cell Biol.2002 Jul;3(7):475-86)。
关于EPH/肝配蛋白轴的一些信号转导通路是已知的。例如,EPHA4涉及JAK/Stat通路(Lai KO,et al.,J Biol Chem.2004 Apr 2;279(14):13383-92.Epub 2004 Jan 15),EPHB4受体信号通过PI3K通路介导内皮细胞迁移和增殖(Steinle JJ,et al.,J Biol Chem.2002 Nov 15;277(46):43830-5.Epub 2002Sep 13)。此外,EPH/肝配蛋白轴调节Rho信号或Ras家族小GTP酶的活性(Lawrenson ID,et al.,J Cell Sci.2002 Mar 1;115(Pt 5):1059-72:Murai KK &Pasquale EB.J Cell Sci.2003 Jul 15;116(Pt 14):2823-32)。
尽管有一些关于EPH受体家族蛋白在细胞增殖和转化信号通路中重要性的报道,但有报道称EPHA7仅在四肢发育和神经系统中有表达(Salsi V& Zappavigna V.J Biol Chem.2006 Jan 27;281(4):1992-9.Epub 2005 Nov 28;Rogers JH et al.,Brain Res Mol Brain Res.1999 Dec 10;74(1-2):225-30;AraujoM & Nieto MA.Mech Dev.1997 Nov;68(1-2):173-7)。在Eph家族基因中,对人类肿瘤中的EPHA7关注的相对较少,并且在本发明之前,EPHA7在人类肿瘤学中的作用还不清楚。
(3)STK31
STK31是Ser/Thr蛋白激酶家族成员,其编码一个115-kDa的蛋白,在该蛋白的N末端含有一个被认为与RNA结合有关的Tudor结构域,在C末端含有Ser/Thr激酶蛋白激酶结构域,然而该蛋白的生理功能尚不清楚。根据Kinome系统树将STK31分成非常独特的类别(互联网cellsignal.com/reference/kinase/kinome.jsp)。PKR被认为是STK31的结构同系物。
PKR蛋白激酶也通过其N末端结构域结合双链RNA,并且具有C末端Ser/Thr激酶结构域。当其结合到活化的RNA和ATP时,PKR进行自磷酸化反应,并且将真核起始因子(elF2 alpha)α亚单位磷酸化,从而抑制elF2复合物的功能和翻译的连续起始(Manche L,et al.,Mol Cell Biol.1992Nov;12(11):5238-48;Jammi NV & Beal PA.Nucleic Acids Res.2001 Jul15;29(14):3020-9;Kwon HC,et al.,Jpn J Clin Oncol.2005 Sep;35(9):545-50.Epub 2005 Sep 7)。
最近,一些丝氨酸-苏氨酸激酶被认为是良好的癌症治疗靶标。属于丝氨酸-苏氨酸激酶成员的蛋白激酶Cβ(PKC beta)被发现在致死/顽固性的弥漫性大B细胞淋巴瘤(DLBCL)中过表达,并且作为抗肿瘤治疗的靶标(Goekjian PG & Jirousek MR.Expert Opin Investig Drugs.2001Dec;10(12):2117-40)。采用PKCβ的抑制剂恩扎妥林(enzastaurin)对患有复发性或者顽固性DLBCL的患者进行II期研究(Goekjian PG & Jirousek MR.Expert Opin Investig Drugs.2001 Dec;10(12):2117-40)。STK31被认为与减数分裂/小鼠生殖细胞分化有关(Wang PJ,et al.,Nat Genet.2001Apr;27(4):422-6;Olesen C,et al.,Cell Tissue Res.2007 Apr;328(1):207-21.Epub 2006 Nov 25)。然而,在本发明之前,其精确的生理功能及其与致癌作用的相关性是未知的。
(4)WDHD1
WDHD1编码带有高速泳动族(HMG)框结构域和WD重复序列结构域的含1129个氨基酸的蛋白。HMG框非常保守,由三个排列成L形的α-螺旋组成,与DNA小沟结合(Thomas JO & Travers AA.Trends Biochem Sci.2001 Mar;26(3):167-74)。HMG蛋白以序列特异性或者非序列特异性的方式结合DNA来诱导DNA弯曲,并且调节染色质功能和基因表达(Sessa L &Bianchi ME.Gene.2007 Jan 31;387(1-2):133-40.Epub 2006 Nov 10)。
通常,已知HMG蛋白结合核小体,通过与基础转录装置相互作用来抑制转录,充当转录辅激活蛋白,或确定特异调节子是否作为转录激活物或阻遏物起作用(Ge H & Roeder RG.J Biol Chem.1994;269:17136-40;Paranjape SM,et al.,Genes Dev 1995;9:1978-91;Sutrias-Grau M,et al.,J BiolChem.1999;274:1628-34;Shykind BM,et al.,Genes Dev 1995;9:354-65;Lehming N,et al.,Nature 1994;371:175-79)。上述广谱功能除了HMG结构域所赋予的DNA结合活性以外,还可以部分通过蛋白-蛋白相互作用来获得。至于WDHD1,蛋白-蛋白相互作用的候选结构域是WD重复序列。
WD重复序列蛋白引起范围从信号转导到细胞周期调控的细胞功能,并且在真核生物以及原核生物中是保守的(Li D & Roberts R.Cell Mol Life Sci.2001;58:2085-97)。AND-1是一种具有保守WD重复序列结构域的核蛋白,其通常被发现作为蛋白-蛋白相互作用结构域以及HMG框结构域,HMG框结构域被认为是光滑爪蟾(Xenopus laevis)卵母细胞和各种其它细胞中DNA或染色质结合结构域(
Figure GPA00001115063300071
A,et al.,J Cell Sci.1997 May;110(Pt9):1051-62)。采用四通DNA(four-way junction DNA)通过DNA亲和层析和电泳迁移位移试验证实该蛋白的DNA结合能力(
Figure GPA00001115063300072
A,et al.,J Cell Sci.1997 May;110(Pt 9):1051-62)。结构分析阐明了WD重复序列蛋白形成带有若干叶片的螺旋桨样结构,该结构由一个四链反平行β-片层组成。β螺旋桨样结构作为蛋白稳定或可逆结合的平台(Li D & Roberrs R.Cell Mol LifeSci.2001;58:2085-97)。蛋白与WDHD1相互作用的证据有助于理解WDHD1的功能。然而,在本发明之前,没有任何阐明WDHD1/AND-1生理功能和WDHD1反式激活在人类癌症进程中重要性的相关报道。
发明内容
本发明涉及癌症相关基因,尤其涉及CX基因,包括在肿瘤中普遍上调的CDCA5、EPHA7、STK31和WDHD1,以及利用CX基因用于开发癌症治疗的分子靶向药物和癌症疫苗的策略。
一方面,本发明提供了采用CX基因表达水平或生物学活性作为指标诊断癌症,例如由CX基因介导的癌症,如肺癌和/或食道癌,的方法。本发明还提供采用CX基因表达水平或生物学活性作为指标的预测患者癌症,例如肺癌和/或食道癌,的治疗进展的方法。此外,本发明提供采用CX基因表达水平或生物学活性作为指标的预测癌症,如肺癌和/或食道癌,的预后的方法,。在一些实施方案中,所述癌症由CX基因介导或促进。在一些实施方案中,所述癌症是肺癌和/或食道癌。
在另一个实施方案中,本发明提供采用CX基因表达水平或生物学活性作为指标的筛选用于治疗或预防癌症,例如由CX基因介导的癌症,如肺癌和/或食道癌,的作用剂的方法。具体地,本发明提供采用CDCA5多肽和CDC2多肽之间的相互作用或CDCA5多肽和ERK多肽之间的相互作用作为指标的筛选用于治疗或预防表达CDCA5的癌症,例如肺癌和/或食道癌,的作用剂的方法。
在进一步的实施方案中,本发明提供通过本发明方法所筛选的针对CX基因,CDCA5、EPHA7、STK31和WDHD1,的双链分子,例如siRNA。本发明的双链分子对于治疗或预防癌症,例如CX基因介导或由CX基因过表达引起的癌症,如肺癌和/或食道癌,是有用的。因此本发明进一步涉及治疗癌症的方法,包括使癌细胞与通过本发明方法所筛选的作用剂,例如siRNA,相接触。
附图简要说明
图1肺癌和食道癌以及正常组织中的CDCA5表达。
A,经半定量RT-PCR和Western印迹检测,CDCA5基因在肺癌样品中的表达。B,经半定量RT-PCR和Western印迹检测,CDCA5基因在食道癌样品中的表达。C,外源CDCA5蛋白在COS-7细胞中的定位。采用亲和纯化的抗c-Myc兔多克隆抗体(绿色)和DAPI(蓝色)对细胞进行免疫细胞化学染色来区分细胞核(参见“材料和方法”)。D,各种正常人组织中CDCA5转录物的Northern印迹分析。CDCA5在仅在睾丸中表达。
图2针对CDCA5的siRNA对肺癌细胞的生长抑制作用以及外源性CDCA5的生长促进作用。
采用针对CDCA5的siRNA转染两种肺癌细胞系A549和LC319(A,B)。上图,通过半定量RT-PCR分析证实siRNA对CDCA5表达的敲低作用。ACTB的表达作为转录水平的质量控制。中图,对转染CDCA5特异寡核苷酸siRNA(si-#1和-#2)或对照寡核苷酸的A549和LC319细胞进行集落形成分析。下图,与对照的生存力相比,通过MTT分析评价A549和LC319细胞对si-#1和si-#2应答的生存力。C,MTT分析显示与模拟载体相比,CDCA5对哺乳动物细胞有生长促进作用。
图3肺癌和食道癌以及正常组织中的EPHA7表达。
A,上图,经半定量RT-PCR检测,EPHA7在临床肺癌和正常肺组织中的表达。下图,经半定量RT-PCR检测,EPHA7在肺癌细胞系中的表达。本发明人对从肺癌样品mRNA制备的每种单链cDNA配制适当的稀释度,将β肌动蛋白(ACTB)的表达水平作为定量控制。B,上图,经半定量RT-PCR检测,EPHA7在ESCC临床样品和正常食道组织中的表达。下图,经半定量RT-PCR检测,EPHA7在食道癌细胞系中的表达。C,经northern印迹分析检测,EPHA7在正常人组织中的表达。D,经northern印迹分析检测,EPHA7在肺癌细胞和胎儿组织中的表达。E,经免疫组织化学染色(x200)检测,EPHA7蛋白在正常人组织中的表达。F,上图,内源性EPHA7蛋白在SBC-3细胞中的亚细胞定位。下图,通过针对EPHA7N末端的抗EPHA7抗体,EPHA7在细胞的细胞质和胞质膜被染色。通过针对EPHA7C末端的抗EPHA7抗体,EPHA7在细胞的细胞质和细胞核被染色。G,通过对培养液免疫细胞化学和ELISA检测,EPHA7阳性和阴性肺癌细胞系中的EPHA7蛋白表达水平。
图4肺癌和食道癌组织中的EPHA7蛋白表达。
A,采用肺癌和食道癌组织对EPHA7蛋白表达进行免疫组织化学评价。左图,经免疫组织化学染色检测到,EPHA7在SCLCs、肺ADCs和肺SCCs中有表达,而在正常肺中没有表达(上,x100;下,x200)。在细胞质和胞质膜中以正染色为主。右图,经免疫组织化学染色检测到,EPHA7在ESCCs中有表达,而在正常食道中没有表达(上,x100;下,x200)。B,EPHA7过表达与NSCLC患者的不良临床结果有关。根据EPHA7表达对NSCLC患者的肿瘤特异性存活率进行Kaplan-Meier分析(P=0.006;Log-rank检验)。C,EPHA7过表达与ESCC患者的不良临床结果有关。根据EPHA7表达对NSCLC患者的肿瘤特异性存活率进行Kaplan-Meier分析(P=0.0263;Log-rank检验)。
图5EPHA7的血清水平
A,EPHA7在肺、食道和宫颈癌患者以及COPD患者和健康捐赠者中的血清水平。B,左图,根据这439名癌症患者(NSCLC+SCLC+ESCC)和127名健康对照的数据所作的受试者操作特征(ROC)曲线。右图,原发性肿瘤外科手术切除前后的血清EPHA7浓度。C,上图,EPHA7和CEA的ROC曲线。下图,EPHA7和ProGRP的ROC曲线。
图6EPHA7的生长促进和侵袭效应
A,左图和右图,通过针对EPHA7的siRNA抑制NCI-H520或SBC-5细胞的生长。经半定量RT-PCR分析,EPHA7对癌细胞中si-EPHA7或对照siRNAs应答的表达(上图)。对转染有EPHA7的特异siRNAs或对照siRNAs的细胞进行集落形成分析(中图)。通过MTT分析评价细胞对si-EPHA7s或对照siRNAs应答的生存力(下图)。所有分析均采用三复孔,进行三次重复。
图7作为EPHA7下游靶标的EGFR、p44/42MAPK和CDC25的磷酸化作用。A,EPHA7对转染有EPHA7表达质粒的COS-7细胞的生长促进作用。上图,通过Western印迹检测到EPHA7在COS-7细胞中瞬时表达。下图,通过MTT分析测定COS-7细胞的细胞生存力。B,分析证明在转染人EPHA7表达质粒之后Matrigel matrix中NIH3T3和COS-7细胞的侵袭特征。上图,通过Western印迹检测到COS-7和NIH-3T3细胞瞬时表达EPHA7。中图和下图,吉姆萨染色(x100)和迁移通过Matrigel包被滤器的相对细胞数。分析采用三复孔,进行三次重复。
图8A,与模拟载体转染的细胞相比,转染EPHA7表达载体的细胞中EGFR的Tyr-845、PLCgamma的Tyr-783以及CDC25的Ser-216显著磷酸化。B,经免疫沉淀实验,内源性EGFR和外源性EPHA7之间同种相互作用。
图9肿瘤样品和正常组织中的STK31表达。
A,经半定量RT-PCR分析检测,STK31在正常肺组织和15个临床肺癌样品(肺ADC、肺SCC和SCLC;上图)以及23个肺癌细胞系(下图)中有表达。B,经半定量RT-PCR分析检测,STK31在正常食道和10个临床ESCC组织样品以及10个ESCC细胞系中有表达。C,内源性STK31蛋白在肺癌细胞NCI-H2170中的亚细胞定位。STK31在癌细胞的细胞质和细胞核上被染色。D,对23个正常成年人组织的STK31转录物进行Northern印迹分析。在睾丸中观察到强信号。
图10正常人组织中的STK31蛋白表达以及STK31过表达与NSCLC患者的预后不良有关。
A,STK31在正常组织(心、肺、肾、肝、睾丸)中的表达。B,在肺癌组织和正常肺组织(原放大倍数x100)中STK31阳性和阴性表达的实例。C,根据STK31表达,对NSCLC患者的存活率进行Kaplan-Meier分析(经Log-rank检验P=0.0178)。
图11通过针对STK31的siRNA对肺癌细胞的生长抑制以及外源性STK31的生长促进作用。
A,经半定量RT-PCR分析,对LC319细胞中si-STK31-#1、si-STK31-#2或对照siRNAs(si-EGFP和si-LUC)应答的基因敲低作用。B,C,转染特异siRNAs或对照的LC319细胞的集落形成和MTT分析结果。条形,3次重复分析的标准差。D,上图,经免疫印迹分析检测,STK31在COS-7中瞬时表达。下图,MTT分析显示与模拟载体相比,STK31瞬时表达的生长促进作用。
图12STK31重组蛋白的激酶活性及STK31的下游靶标。
A,采用STK31激酶的GST融合重组蛋白和MBP作为底物进行体外激酶分析。检测到磷酸化的MBP。B,经免疫印迹分析检测,STK31在COS-7细胞中瞬时表达之后,EGFR(Ser1046/1047)和ERK(ERK1/2、P44/42MAPK)(Thr202/Tyr204)的磷酸化水平。C,采用重组STK31和从COS-7细胞制备的全细胞提取物进行体外激酶分析。检测到STK31以剂量依赖方式诱导ERK(ERK1/2、P44/42MAPK)磷酸化。D,经免疫印迹分析检测,STK31在COS-7细胞中瞬时表达之后,MEK(MEK1/2)(Ser217/Ser221)的磷酸化水平。E,当STK31表达被针对STK31的siRNA敲低时,ERK1/2和MEK1/2的去磷酸化。F,STK31和MAPK级联相互作用。
图13肺癌和食道癌以及正常组织中的WDHD1表达。
A,经半定量RT-PCR分析检测,WDHD1在正常肺组织和15个临床肺癌样品(肺ADC、肺SCC和SCLC;上图)以及23个肺癌细胞系(下图)中有表达。B,经半定量RT-PCR分析检测,WDHD1在正常食道和10个临床ESCC组织样品以及10个ESCC细胞系中有表达。C,经免疫印迹分析检测,WDHD1蛋白在5个肺癌和4个食道癌细胞系中有表达。D,内源性WDHD1蛋白在LC319细胞中的亚细胞定位。在整个细胞周期,WDHD1都是在细胞核中强染色,在细胞质中弱染色。在分裂期期间,WDHD1在有丝分裂的染色质上被染色。
图14正常组织中的WDHD1表达及WDHD1过表达与NSCLC和ESCC患者的预后不良有关。
A,23个正常成年人组织中WDHD1转录物的northern印迹分析。在睾丸中观察到强信号。B,WDHD1蛋白在5个正常组织(肝、心、肾、肺和睾丸)及相应肺癌组织中表达的免疫组织化学分析。WDHD1在睾丸(主要在初级精母细胞的细胞核和/或细胞质)和肺癌中大量表达,但在其余四个正常组织中几乎没有表达。C,D,WDHD1表达与预后不良有关。上图,肺癌组织(原放大倍数x100)中WDHD1表达的阳性和阴性染色的实例。C,肺SCC,D,ESCC。根据WDHD1表达,对NSCLC(C;经Log-rank检验P=0.0208)和ESCC(D;经Log-rank检验P=0.0285)患者的存活率进行Kaplan-Meier分析。
图15WDHD1的生长促进作用。
A,B,通过针对WDHD1的siRNAs抑制肺癌细胞系A549(A,左图)和LC319(A,右图)以及食道癌TE9(B)的细胞生长。上图,经RT-PCR分析,通过两种si-WDHD1(si-WDHD1-#1和si-WDHD1-#2)和两种对照siRNA(si-EGFP和si-SCR)对WDHD1蛋白在A549、LC319和TE9细胞中表达的基因敲低作用。中图和下图,对转染si-WDHD1s或对照siRNAs的A549、LC319和TE9细胞进行集落形成和MTT分析。柱形,3次重复分析的相对吸光度;条形,标准差。C,对si-WDHD1处理的NSCLC细胞进行流式细胞检测分析。将si-WDHD1-#2转染LC319细胞,转染后72小时收集细胞用于流式细胞计数。图边的数字表示每个周期的总细胞百分比。D,瞬时转染WDHD1表达质粒的哺乳动物细胞的细胞生长增强。分析显示hWDHD1表达质粒转染后,COS-7细胞的生长特性。对转染hWDHD1或对照质粒的COS-7细胞进行MTT分析。E,F,对si-WDHD1处理的NSCLC细胞进行流式细胞检测分析。将si-WDHD1-#2或si-LUC(萤光素酶)转染A549细胞,于转染后24、48和72小时收集细胞用于流式细胞计数(E)。转染si-WDHD1-#2或si-LUC的A549细胞在G0/G1期同步化,细胞周期释放后0、4.5和9小时收集细胞用于流式细胞计数(F)。图边的数字表示每个周期的细胞百分比。G,对si-WDHD1处理的NSCLC细胞进行延时成像分析。将si-WDHD1-#2或si-萤光素酶转染A549细胞,每30分钟捕获图像。结果显示每12小时会出现细胞(从24小时到108小时)。H,通过WDHD1敲低作用诱导有丝分裂阻滞和细胞死亡。
图16通过PI3K信号传导的WDHD1磷酸化来调节其稳定性。A,WDHD1在丝氨酸和酪氨酸残基的磷酸化作用。左图,通过λ-磷酸酶处理A549细胞使其内源性WDHD1蛋白去磷酸化。右图,通过用抗WDHD1抗体进行免疫沉淀,然后用pan-phospho特异性抗体免疫印迹,表明WDHD1在其丝氨酸和酪氨酸残基磷酸化。B,WDHD1蛋白在整个细胞周期中的表达。用含有1%FBS和4μg/ml阿非科林(aphidicolin)的RPMI1640对G0/G1期的LC319细胞同步化24小时,然后通过去除阿非科林使其从G1阻滞中释放。去除阿非科林后0、4和9小时(h)进行流式细胞检测分析(上图)和Western印迹(下图)。C,用含有1%FBS和1μg/ml阿非科林的RPMI1640对G0/G1期的A549细胞同步化18小时,然后通过去除阿非科林使其从G1阻滞中释放。去除阿非科林后0、2、4、6和8小时(h)进行流式细胞检测分析(上图)和Western印迹(下图)。D,通过LY294002的PI3K抑制作用来减少WDHD1蛋白。用浓度范围从0到20μM的LY294002处理LC319细胞24小时,用于Western印迹分析。E,通过针对AKT1的siRNA的AKT1抑制作用减少WDHD1蛋白。将针对AKT1或EGFP的siRNA转染LC319细胞,并用于Western印迹分析。F,G,通过AKT1磷酸化WDHD1蛋白。用抗磷酸AKT底物(PAS)抗体检测WDHD1的免疫沉淀物(F)。通过重组人AKT1(rhAKT1)体外磷酸化WDHD1蛋白(G)。H,I,通过AKT1的WDHD1蛋白丝氨酸374的磷酸化状态。用PAS抗体对丝氨酸374被丙氨酸(S374A)替代的WDHD1免疫沉淀物进行免疫印迹(H),并应用于采用rhAKT1的体外激酶分析(I)。
图17通过CDC2和ERK使CDCA5体外磷酸化。A,CDCA5与CDC2和ERK的共有磷酸化位点。上图,人CDCA5(氨基酸残基68-82)的磷酸化位点与其它物种同系物的CDC2(S/T-P-x-R/K)的同源性。中图和下图,其它物种同系物ERK(x-x-S/T-P)的磷酸化位点(氨基酸残基76-86和109-122)同源性。B-C,通过CDC2和ERK使CDCA5体外磷酸化。D,体内磷酸化CDCA5的基质辅助激光解吸附电离/飞行时间质谱技术。经鉴定有8个位点被ERK直接磷酸化,而3个位点被确定为CDC2依赖的磷酸化位点。
图18培养细胞中CDCA5的ERK依赖的磷酸化位点的鉴定。A,带有或不带有MEK抑制剂U0126的EGF刺激后,通过ERK磷酸化Hela细胞内源性CDCA5。B,Hela细胞中,在EGF刺激过程中外源性CDCA5被筛到(sifted)酸性pI值。然而,在U0126处理的细胞中其被抑制,在未处理的细胞中有可能是点模式(spots pattern)。
图19培养细胞中CDCA5的CDK1/CDC2依赖磷酸化位点的鉴定。A,用阿非科林处理G1/S期的肺癌细胞系A549和LC319使其同步化。从G1/S期释放后,通过Western印迹检测整个细胞周期中内源性CDCA5蛋白的磷酸化状态。B,采用阿非科林使TE8细胞系在G1/S期同步化。每2小时收集细胞,共12小时。为了阻断有丝分裂退出,在从G1/S期释放后5小时加入诺考达唑(nocodazole)。与此同时,加入CDK1/CDC2抑制剂。C,将无标记野生型CDCA5和S21A、S75A和T159A的丙氨酸替代物转染到Hela细胞。从G1/S期释放后24小时,随后用诺考达唑同步化。D,在经诺考达唑处理的食道癌细胞系TE8和小细胞肺癌细胞系SBC3中筛到(sifted)内源性CDCA5。E,用1、2、3、4mM的CDK1/CDC2抑制剂alsterpaullon处理TE8细胞系,从G1/S期释放后5小时使用nocodazole进行有丝分裂同步化。
图20鉴定EGFR和MET作为EPHA7的新型相互作用蛋白。
A,B,鉴定MET作为EPHA7相互作用蛋白。通过抗myc琼脂糖或抗Flag琼脂糖对外源性表达EPHA7、MET和/或模拟物的COS-7细胞的提取物进行免疫沉淀,并用抗Flag抗体或抗myc抗体进行免疫印迹。为了评价免疫沉淀的有效性,去除相同膜并重新免疫印迹,采用与免疫沉淀相同的抗体进行免疫印迹。IP,免疫沉淀;IB,免疫印迹。C,D,鉴定EGFR作为EPHA7相互作用蛋白。IP,免疫沉淀;IB,免疫印迹。E,EPHA7、EGFR和MET蛋白在肺癌细胞中的表达谱。ACTB,β肌动蛋白。
图21通过EPHA7激酶使EGFR和MET的酪氨酸磷酸化。
A,重组EGFR和MET的示意图。数字表示氨基酸数。TM,跨膜损伤。B,体外激酶分析,采用重组EPHA7和EGFR,然后用抗pan phospho酪氨酸抗体进行免疫印迹。#1、#2和#3表示A中所描述的全部胞质区EGFR和部分片段EGFR。箭头,EGFR胞质区的磷酸化。箭,#3EGFR的磷酸化。C,使用[gamma-32P]ATP对EPHA7和MET进行体外激酶分析。箭,#3EGFR的磷酸化。D,使用[gamma-32P]ATP对EPHA7和MET进行体外激酶分析。箭头,MET胞质区的磷酸化。E,外源性表达EPHA7的COS-7细胞中EGFR/MET磷酸化作用的增强。所有提取物均在EPHA7表达载体或模拟载体转染后48小时获得。
图22通过EPHA7增强对细胞增殖/存活信号转导重要的EGFR和MET的下游。所有提取物均在EPHA7表达载体或模拟载体转染后48小时获得。
发明内容
定义
本发明所使用的措词“一个”、“一种”(a、an)和“该(the)”,如无另外特别说明是指“至少一个”。
本发明所使用的与物质(例如多肽、抗体、多核苷酸等)有关的术语“分离的”和“纯化的”表示该物质基本上不含在天然来源中所包括的至少一种物质。因此,分离或纯化的抗体是指基本上不含细胞材料或者当化学合成时基本上不含化学前体或其它化学制品的抗体,所述细胞材料例如产生蛋白(抗体)的细胞或组织来源的碳水化合物、脂质或者其它污染蛋白。术语“基本上不含细胞材料”包括多肽的制备,其中所述多肽与分离或重组制备该多肽的细胞的细胞组分分离。
因此,基本上不含细胞材料的多肽包括多肽的制备,所述多肽具有小于约30%、20%、10%或5%(以干重计)的异源蛋白(在本文中也称为“污染蛋白”)。当多肽经重组制备产生时,在一些实施方案中其也基本上不含培养基,其包括多肽的制备,所含培养基小于蛋白制备物体积的约20%、10%或5%。当多肽经化学合成产生时,在一些实施方案中其基本上不含化学前体或其它化学制品,其包括多肽的制备,与蛋白合成有关的化学前体或其它化学制品小于蛋白制备物体积的约30%、20%、10%、5%(以干重计)。可以证明特定蛋白制备物含有经分离或纯化的多肽,例如通过在蛋白制备物的十二烷基硫酸钠(SDS)聚丙烯酰胺凝胶电泳和考马斯亮蓝染色或凝胶类似物之后出现单一条带。在一个实施方案中,包含本发明抗体在内的蛋白是分离或纯化的。
经“分离”或“纯化”的核酸分子,例如cDNA分子,当经重组技术制备时基本上不含其它细胞材料或培养基,或者当化学合成时基本上不含化学前体或其它化学制品。在一个实施方案中,编码本发明蛋白的核酸分子是分离或纯化的。
在本说明书中可互换使用的术语“多肽”、“肽”和“蛋白”是指氨基酸残基的聚合物。该术语用于氨基酸聚合物,其中一个或多个氨基酸残基是经修饰的残基,或者非天然残基,例如,相应天然氨基酸以及天然氨基酸聚合物的人造化学模拟物。
术语“氨基酸”是指天然和人造的氨基酸,以及与天然氨基酸功能类似的氨基酸类似物和氨基酸模拟物。天然氨基酸是那些由遗传密码编码的氨基酸以及那些在细胞中翻译后经修饰的氨基酸(例如,羟脯氨酸、γ-羧基谷氨酸盐和O-磷酸丝氨酸)。短语“氨基酸类似物”是指这样的化合物,其具有与天然氨基酸相同的基本化学结构(与氢结合的alpha碳、羧基、氨基和R基),并且具有经修饰的R基或经修饰的支架(例如,高丝氨酸、正亮氨酸、甲硫氨酸、亚砜、甲硫氨酸甲基硫)。短语“氨基酸模拟物”是指与通用氨基酸结构不同但功能相似的化合物。
氨基酸在本文中可以由公知的三字母符号或IUPAC-IUB BiochemicalNomenclature Commission推荐的单字母符号表示。
除非另外特别说明,术语“多核苷酸”、“寡核苷酸”、“核苷酸”、“核酸”以及“核酸分子”可以互换使用,并与它们普遍接受的单字母密码所表示的氨基酸类似。与氨基酸类似,它们包括天然和非天然核苷酸聚合物。多核苷酸、寡核苷酸、核苷酸、核酸或核酸分子可以由DNA、RNA或它们的组合构成。
在本说明书中所使用的术语“生物学样品”是指整个生物体或其组织、细胞或构成部分(例如,体液,包括但不限于血液、黏液、淋巴液、滑液、脑脊髓液、唾液、羊水、脐带血、尿、阴道液和精液)。“生物学样品”还表示从整个生物体或其细胞、组织或构成部分制备得到的匀浆、裂解物、细胞培养物或组织培养物,或其部分。最后,“生物学样品”还指这样的培养基,例如培养过生物体的营养肉汤或凝胶,其含有细胞组分,例如蛋白或多核苷酸。
(1)癌症相关基因和癌症相关蛋白及其功能等价物
在本说明书中可互换使用的措词“癌症相关基因”、“癌症相关多核苷酸”、“CX基因”和“CX多核苷酸”是指选自CDCA5、EPHA7、STK31和WDHD1的基因。
在本说明书中所使用的措词“癌症相关蛋白”、“癌症相关多肽”、“CX蛋白”和“CX多肽”是指由选自CDCA5、EPHA7、STK31和WDHD1的基因编码的蛋白或多肽。
(i)CDCA5
SEQ ID NO:1中所显示的是人CDCA5基因的核苷酸序列,其还可以从GenBank登录号NM_080668或BC011000获得。在本文中,短语“CDCA5基因”包括人CDCA5基因以及包括非人类灵长类、小鼠、大鼠、狗、猫、马和牛但不限于此的其它动物的CDCA5基因,并且包括等位基因突变体和与CDCA5基因对应的在其它动物中发现的基因。
SEQ ID NO:2中所显示的是由人CDCA5基因所编码的氨基酸序列,其还可以从GenBank登录号AAH11000获得。在本发明中,由CDCA5基因编码的多肽称为“CDCA5”,有时也称为“CDCA5多肽”或“CDCA5蛋白”。
根据本发明的一个方面,CDCA5也包括功能等价物。在本文中,蛋白的“功能等价物”是具有与该蛋白相同生物学活性的多肽。即,保留CDCA5至少一种生物学活性的任何多肽都可以用作本发明的功能等价物。例如,CDCA5的功能等价物保留细胞增殖的促进活性。此外,CDCA5的生物学活性包括与CDC2(GenBank登录号:NM_001786,SEQ ID NO:48)或ERK(GenBank登录号:NM_001040056,SEQ ID NO:50)的结合活性、和/或CDC2介导或ERK介导的磷酸化作用。CDCA5的功能等价物可以包含CDC2结合区、ERK结合区和/或至少一种磷酸化基序,例如,SEQ ID NO:2氨基酸残基68-82的CDC2(S/T-P-x-R/K)共有磷酸化基序,其中磷酸化位点在SEQ ID NO:2丝氨酸21、丝氨酸75和苏氨酸159和/或SEQ ID NO:2氨基酸残基76-86或109-122的ERK(x-x-S/T-P)共有磷酸化基序,其中磷酸化位点是SEQ ID NO:2丝氨酸21、苏氨酸48、丝氨酸75、丝氨酸79、苏氨酸111、苏氨酸115、苏氨酸159和丝氨酸209。
CDCA5的功能等价物包括那些在CDCA5蛋白天然氨基酸序列中替换、缺失、添加或插入一个或多个氨基酸的分子,例如1-5个氨基酸,例如直到5%的氨基酸。
(ii)EPHA7
SEQ ID NO:3中所显示的是人EPHA7基因的核苷酸序列,其还可以从GenBank登录号NM_004440.2获得。在本文中,短语“EPHA7基因”包括人EPHA7基因以及包括非人类灵长类、小鼠、大鼠、狗、猫、马和牛但不限于此的其它动物的EPHA7基因,并且包括等位基因突变体和与EPHA7基因对应的在其它动物中发现的基因。
SEQ ID NO:4中所显示的是由人EPHA7基因所编码的氨基酸序列,其还可以从GenBank登录号NP_004431.1获得。在本发明中,由EPHA7基因编码的多肽称为“EPHA7”,有时也称为“EPHA7多肽”或“EPHA7蛋白”。
根据本发明的一个方面,EPHA7也包括功能等价物。在本文中,蛋白的“功能等价物”是具有与该蛋白相同生物学活性的多肽。即,保留EPHA7至少一种生物学活性的任何多肽都可以用作本发明的功能等价物。EPHA7的示例性生物学活性是细胞增殖的促进活性、酪氨酸激酶活性或对EGFR的结合活性。在一些实施方案中,EPHA7的功能等价物包含酪氨酸激酶结构域(SEQ ID NO:4的633aa-890aa)和/或EGFR结合结构域。
EPHA7的功能等价物包括那些在EPHA7蛋白的天然氨基酸序列中替换、缺失、添加或插入一个或多个氨基酸的分子,例如1-5个氨基酸,例如直到5%的氨基酸。
(iii)STK31
SEQ ID NO:5中所显示的是人STK31基因的核苷酸序列,其还可以从GenBank登录号NM_031414.2获得。在本文中,短语“STK31基因”包括人STK31基因以及包括非人类灵长类、小鼠、大鼠、狗、猫、马和牛但不限于此的其它动物的STK31基因,并且包括等位基因突变体和与STK31基因对应的在其它动物中发现的基因。
SEQ ID NO:6中所显示的是由人STK31基因所编码的氨基酸序列,其还可以从GenBank登录号NP_116562.1获得。在本发明中,由STK31基因编码的多肽称为“STK31”,有时也称为“STK31多肽”或“STK31蛋白”。
根据本发明的一个方面,STK31也包括功能等价物。在本文中,蛋白的“功能等价物”是具有与该蛋白相同生物学活性的多肽。即,保留STK31至少一种生物学活性的任何多肽都可以用作本发明中的功能等价物。STK31的示例性生物学活性是细胞增殖的促进活性、丝氨酸/苏氨酸激酶活性或对EGFR(Ser1046/1047)、ERK(p44/42MAPK)(Thr202/Tyr204)(SEQ IDNO.:50,GenBank登录号:NM_001040056)和MEK(MEK1/2)(SEQ ID NO.:72或SEQ ID NO.:74,NM_002755或NM_030662)磷酸化的促进活性。在一些实施方案中,STK31的功能等价物包含丝氨酸/苏氨酸激酶结构域(SEQID NO:6的745aa-972aa)和/或c-raf(GenBank登录号:NM_002880,SEQID NO.:50)、MEK1/2和/或ERK(p44/42MAPK)结合结构域。
STK31的功能等价物包括那些在STK31蛋白的天然氨基酸序列中替换、缺失、添加或插入一个或多个氨基酸的分子,例如1-5个氨基酸,例如直到5%的氨基酸。
(iv)WDHD1
SEQ ID NO:7中所显示的是人WDHD1基因的核苷酸序列,其还可以从GenBank登录号NM_007086.2获得。在本文中,短语“WDHD1基因”包括人WDHD1基因以及包括非人类灵长类、小鼠、大鼠、狗、猫、马和牛但不限于此的其它动物的WDHD1基因,并且包括等位基因突变体和与WDHD1基因对应的在其它动物中发现的基因。
SEQ ID NO:8中所显示的是由人WDHD1基因所编码的氨基酸序列,其还可以从GenBank登录号NP_009017.1获得。在本发明中,由WDHD1基因编码的多肽称为“WDHD1”,有时也称为“WDHD1多肽”或“WDHD1蛋白”。
根据本发明的一个方面,WDHD1也包括功能等价物。在本文中,蛋白的“功能等价物”是具有与该蛋白相同生物学活性的多肽。即,保留WDHD1至少一种生物学活性的任何多肽都可以用作本发明中的功能等价物。WDHD1的示例性生物学活性是细胞增殖的促进活性。在一些实施方案中,WDHD1的功能等价物包含磷酸化位点。
WDHD1的功能等价物包括那些在WDHD1蛋白的天然氨基酸序列中替换、缺失、添加或插入一个或多个氨基酸的分子,例如1-5个氨基酸,例如直到5%的氨基酸。
通常,已知的是,蛋白中一个或多个氨基酸的修饰不会影响该蛋白的功能(Mark DF,et al.,Proc Natl Acad Sci USA.1984 Sep;81(18):5662-6;Zoller MJ & Smith M.Nucleic Acids Res.1982 Oct 25;10(20):6487-500;WangA,et al.,Science.1984 Jun 29;224(4656):1431-3;Dalbadie-McFarland G,et.al.,Proc Natl Acad Sci USA.1982 Nov;79(21):6409-13)。本领域技术人员会认为改变单个氨基酸或一小部分氨基酸的氨基酸序列的个别添加、缺失、插入或替换是“保守性的修饰”,其中蛋白的改变产生具有相似功能的蛋白。
氨基酸侧链特性的实施方案是疏水性氨基酸(丙氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、色氨酸、酪氨酸、缬氨酸)、亲水性氨基酸(精氨酸、天冬氨酸、天冬酰胺、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、组氨酸、赖氨酸、丝氨酸、苏氨酸)以及具有下列功能基团或共同特征的侧链:脂肪族侧链(甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸);含有侧链的羟基(丝氨酸、苏氨酸、酪氨酸);含有侧链的硫原子(C,M);含有侧链的羧酸或酰胺(天冬氨酸、天冬酰胺、谷氨酸、谷氨酰胺);含有侧链的碱基(精氨酸、赖氨酸、组氨酸);以及含有侧链的芳香族(组氨酸、苯丙氨酸、酪氨酸、色氨酸)。此外,功能相似氨基酸的保守性替换表是本领域公知的。例如,下列8组,每组均含有相互保守性替换的氨基酸。
(1)丙氨酸(A),甘氨酸(G);
(2)天冬氨酸(D),谷氨酸(E);
(3)天冬酰胺(N),谷氨酰胺(Q);
(4)精氨酸(R),赖氨酸(K);
(5)异亮氨酸(I),亮氨酸(L),甲硫氨酸(M),缬氨酸(V);
(6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W);
(7)丝氨酸(S),苏氨酸(T);以及
(8)半胱氨酸(C),甲硫氨酸(M)
(参见,例如,Thomas E.Creighton,Proteins Publisher:New York:W.H.Freeman,c1984)
CX蛋白包括这些经保守性修饰的多肽。然而,本发明不局限于此,CX蛋白也包括非保守性修饰。只要非保守性修饰能保留CX蛋白的任何一种生物学活性。修饰蛋白中要突变的氨基酸数通常小于10个氨基酸,例如,小于6个氨基酸,例如,3个氨基酸或更少。
通过添加一个或多个氨基酸残基修饰的蛋白的一个例子是CX蛋白的融合蛋白。融合蛋白包括CX蛋白和其它肽或蛋白的融合,它们也可以用于本发明。通过本领域技术人员公知的技术可以制备融合蛋白,例如,通过将编码CX基因的DNA与编码其它肽或蛋白的DNA连接,使框架匹配,将融合DNA插入到表达载体并在宿主中对其进行表达。对于与CX蛋白融合的肽或蛋白没有任何限制,只要产生的融合蛋白保留CX蛋白的任何一种目标生物学活性。
已知可以用于与CX蛋白融合的肽包括,例如,FLAG(Hopp TP,et al.,Biotechnology 6:1204-10(1988))、含有6×组氨酸残基的6×His、10×His、流感凝集素(HA)、人c-myc片段、VSP-GP片段、p18HIV片段、T7标签、HSV标签、E标签、SV40T抗原片段、lck标签、alpha微管蛋白片段、B标签、蛋白C片段等等。可以与本发明蛋白融合的蛋白实施方案包括GST(谷胱甘肽S-转移酶)、流感凝集素(HA)、免疫球蛋白恒定区、β-半乳糖苷酶、MBP(麦芽糖结合蛋白)等等。
此外,修饰蛋白不排除多态变异体、种间同系物以及由这些蛋白的等位基因所编码者。
本领域已知的分离功能等价蛋白的方法包括,例如杂交技术(Sambrookand Russell,Molecular Cloning:A Laboratory Manual,3rd ed.,Cold SpringHarbor Lab.Press,2001)。本领域技术人员能够很容易地分离与编码人CX蛋白的人CX DNA序列整个或部分(例如,CDCA5为SEQ ID NO:1、EPHA7为SEQ ID NO:3、STK31为SEQ ID NO:5、WDHD1为SEQ ID NO:7)具有高度同源性(即,序列同一性)的DNA,以及从所分离的DNA中分离人CX蛋白的功能等价蛋白。因而,用于本发明的蛋白包括由与编码人CX蛋白的DNA序列的整体或部分在严格条件下杂交的DNA所编码的、并且是人CX蛋白的功能等价物的那些蛋白。这些蛋白包括与人或小鼠来源的蛋白相对应的哺乳动物同系物(例如,由猴、大鼠、兔或牛基因所编码的蛋白)。从肺或食道癌组织或细胞系、或来自睾丸(对于CDCA5、STK31或WDHD1)、脑或肾(对于EPHA7)组织可以用于分离与编码人CX基因的DNA高度同源的cDNA。
用于分离编码与人CX基因功能等价的蛋白的DNA的杂交条件可以由本领域技术人员的常规选择。短语“严格(杂交)条件”是指这样的条件,在该条件下,核酸分子将与其靶序列杂交(通常在核酸复杂混合物中),而没有与其它序列的可检测的杂交。严格条件是序列依赖性的,并且在不同情况下会有所不同。较长的序列在较高温度下特异杂交。在Tijssen的Techniques in Biochemistry and Molecular Biology--Hybridization with NucleicProbes,“Overview of principles of hybridization and the strategy of nucleicacid assays”(1993)中有对核酸杂交的详尽指导。通常,在确定的离子强度、pH条件下所选择的严格条件比特异序列的热解链温度(Tm)约低5-10摄氏度。Tm是这样的温度(在确定的离子强度、pH和核酸浓度条件下),在该温度下,与靶标互补的探针中有50%在平衡状态下与靶序列杂交(由于靶序列过量,因此在Tm下,平衡状态时50%的探针被占据)。还可以通过添加去稳定剂例如甲酰胺来得到严格条件。对于选择性或特异性杂交,阳性信号是本底的至少两倍,例如杂交背景的10倍。
例如,可以如下所述进行杂交,通过使用“Rapid-hyb缓冲液”(Amersham LIFE SCIENCE)在68℃预杂交30min或更长时间,然后加入标记的探针,并且在68℃加热1h或更长时间。接下来的洗涤步骤可以在例如低严格条件下进行。低严格条件是例如42℃、2xSSC、0.1%SDS,例如50℃、2xSSC、0.1%SDS。在一些实施方案中,采用高严格条件。高严格条件是例如室温下用2xSSC、0.01%SDS洗涤3次20min,然后在37℃用1xSSC、0.1%SDS洗涤3次20min,并且在50℃用1xSSC、0.1%SDS洗涤两次20min。然而,一些因素例如温度和盐浓度可以影响杂交的严格性,本领域技术人员可以适当地选择这些因素来达到所必需的严格性。
可以利用基因扩增方法例如聚合酶链反应(PCR)方法代替杂交,来分离编码与人CX基因功能等价的蛋白的DNA,该方法采用根据编码人CX蛋白(CDCA5的SEQ ID NO:2;EPHA7的SEQ ID NO:4;STK31的SEQ IDNO:6;或WDHD1的SEQ ID NO:8)的DNA(CDCA5的SEQ ID NO:1;EPHA7的SEQ ID NO:3;STK31的SEQ ID NO:5;或WDHD1的SEQ ID NO:7;)序列信息所合成的引物,在[实施例1]半定量RT-PCR中列举了引物序列的实施方案。
由上述杂交技术或基因扩增技术所分离的DNA编码与人CX蛋白功能等价的蛋白,通常与人CX蛋白氨基酸序列具有高度同源性(也称为序列同一性)。“高度同源性”(也称为“高度序列同一性”)通常是指两条最佳比对序列之间(多肽或多核苷酸序列)的同一性程度。通常,高度同源性或序列同一性是指40%或更高的同源性,例如,60%或更高,例如80%或更高,例如,85%、90%、95%、98%、99%或更高。可以根据算法(WilburWJ & Lipman DJ.Proc Natl Acad Sci USA.1983 Feb;80(3):726-30)确定两条多肽或多核苷酸序列之间的同源性或同一性程度。
适合确定序列百分比同一性和序列相似性的算法的其它实例有算法BLAST和BLAST 2.0,它们在(Altschul SF,et al.,J Mol Biol.1990 Oct 5;215(3):403-10;Nucleic Acids Res.1997 Sep 1;25(17):3389-402)中有描述。用于进行BLAST分析的软件可以从美国国家生物技术信息中心(互联网ncbi.nlm.nih.gov/)公开获得。该算法包括首先通过鉴别查询序列中长度W的短字串来确定高分值序列对(HSP),当与数据库序列中相同长度的字串比对时,其与某些正值的评分阈值T相匹配或满足。T称为邻近字串评分阈值(Altschul et al,supra)。这些起始邻近命中字串作为启动搜索的种子来寻找含有它们的更长HSP。
然后命中字串沿着每条序列的两个方向延伸来增加加和比对分值。对于核苷酸序列,采用参数M(对一对匹配残基的奖励分值;总是大于0)和N(对错配残基的罚分;总是小于0)来计算加和分值。对于氨基酸序列,采用记分矩阵来计算加和分值。当加和比对分值对数量X从其所达到的最大值发生下降时;当由于一个或多个负记分残基比对的积累,或到达任何一个序列的末端,加和分值趋于零或零以下时,命中字串在每个方向的延伸都会停止。
BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(用于核苷酸序列)采用字串长度(W)28、期望值(E)10、M=1、N=-2以及两条链比较作为默认值。对于氨基酸序列,BLASTP程序采用字串长度(W)3、期望值(E)10以及BLOSUM62记分矩阵作为默认值(HenikoffS & HenikoffJG.Proc Natl Acad Sci USA.1992 Nov 15;89(22):10915-9)。
在本发明上下文所使用的蛋白可以在氨基酸序列、分子量、等电点、有无糖链或形式等方面有变化,取决于用来制备该蛋白的细胞或宿主或者所使用的纯化方法。然而,只要其具有CX蛋白(CDCA5为SEQ ID NO:2、EPHA7为SEQ ID NO:4、STK31为SEQ ID NO:6、WDHD1为SEQ ID NO:8)的任何一种生物学活性,就可以用于本发明。
本发明还包括CX蛋白的部分肽的用途。部分肽具有CX蛋白特有的氨基酸序列,并且由小于约400个氨基酸组成,通常是小于约200个氨基酸并且经常是小于约100个氨基酸,至少约7个氨基酸,例如约8个氨基酸或更多,例如约9个氨基酸或更多。
用于本发明筛选的部分肽适合含有至少一种粘结蛋白(cohesin)结合结构域和/或CDCA5磷酸化位点、酪氨酸激酶结构域(SEQ ID NO:4的633aa-890aa)和/或EPHA7的EGFR结合结构域、STK31的丝氨酸/苏氨酸激酶结构域(SEQ ID NO:6的745aa-972aa)、和/或WDHD1的磷酸化位点。此外,用于本发明筛选的CDCA5部分肽(partial CDCA5 peptide)视情况含有CDC2结合结构域、ERK结合结构域和/或至少一种磷酸化基序,例如SEQ IDNO:2中氨基酸残基68-82位置上的共有CDC2磷酸化基序(S/T-P-x-R/K),其中磷酸化位点是SEQ ID NO:2的丝氨酸21、丝氨酸75和苏氨酸159,氨基酸残基76-86或109-122位置上的共有ERK磷酸化基序(x-x-S/T-P),其中磷酸化位点在SEQ ID NO:2的丝氨酸21、苏氨酸48、丝氨酸75、丝氨酸79、苏氨酸111、苏氨酸115、苏氨酸159和丝氨酸209;用于本发明筛选的CDC2部分肽视情况含有CDCA5结合结构域和/或丝氨酸/苏氨酸蛋白激酶催化结构域,例如,SEQ ID NO:48(CDC2)的氨基酸残基4-287;用于本发明筛选的部分ERK肽适合含有CDCA5结合结构域和/或蛋白激酶结构域,例如SEQ ID NO:50(ERK)的氨基酸残基72-369。短语CX蛋白的“功能等价物”也包括这些部分肽。
用于本方法的多肽或片段可以作为天然蛋白通过常规纯化方法从自然界获得,或基于所选择的氨基酸序列通过化学合成获得。例如,可以用于合成的常规肽合成方法,包括:
(1)Peptide Synthesis,Interscience,New York,1966;
(2)The Proteins,Vol.2,Academic Press,New York,1976;
(3)Peptide Synthesis(in Japanese),Maruzen Co.,1975;
(4)Basics and Experiment of Peptide Synthesis(in Japanese),MaruzenCo.,1985;
(5)Development of Pharmaceuticals(second volume)(in Japanese),Vol.14(peptide synthesis),Hirokawa,1991;
(6)WO99/67288;以及
(7)Barany G.& Merrifield R.B.,Peptides Vol.2,“Solid Phase PeptideSynthesis”,Academic Press,New York,1980,100-118。
另外,可以采用制备多肽的任何已知基因工程方法来获得该蛋白(例如,Morrison DA.,et al.,J Bacteriol.1977 Oct;132(1):349-51;Clark-Curtiss JE& Curtiss R 3rd.Methods Enzymol.1983;101:347-62)。例如,首先,制备适合的载体,其以可表达的形式含有编码目的蛋白的多核苷酸(例如,包含启动子的调控序列的下游),转化到适合的宿主细胞,然后培养宿主细胞产生该蛋白。更具体地,通过将基因插入表达外源基因的载体,例如,pSV2neo、pcDNA I、pcDNA3.1、pCAGGS或pCD8,在宿主(例如动物)细胞中表达编码HJURP的基因。
启动子可以用于表达。可以采用任何常用的启动子,包括,例如SV40早期启动子(Rigby in Williamson(ed.),Genetic engineering,vol.3.AcademicPress,London,1982,83-141)、EF-alpha启动子(Kim DW,et al.Gene.1990Jul 16;91(2):217-23)、CAG启动子(Niwa H,et al.,Gene.1991 Dec15;108(2):193-9)、RSV LTR启动子(Cullen BR.Methods Enzymol.1987;152:684-704)、SR alpha启动子(Takebe Y,et al.,Mol Cell Biol.1988Jan;8(1):466-72)、CMV立即早期启动子(Seed B & Aruffo A.Proc Natl AcadSci USA.1987 May;84(10):3365-9))、SV40晚期启动子(Gheysen D & FiersW.J Mol Appl Genet.1982;1(5):385-94)、腺病毒晚期启动子(Kaufman RJ,etal.,Mol Cell Biol.1989 Mar;9(3):946-58)、HSV TK启动子等等。
可以根据任何方法将载体导入宿主细胞来表达CX基因,例如,电穿孔法(Chu G,et al.,Nucleic Acids Res.1987 Feb 11;15(3):1311-26)、磷酸钙法(Chen C & Okayama H.Mol Cell Biol.1987 Aug;7(8):2745-52)、二乙氨乙基葡聚糖(DEAE dextran)法(Lopata MA,et al.,Nucleic Acids Res.1984 Jul25;12(14):5707-17;Sussman DJ & Milman G.Mol Cell Biol.1984Aug;4(8):1641-3)、脂质体法(Derijard B,et al.,Cell.1994 Mar25;76(6):1025-37;Lamb BT,et al.,Nat Genet.1993 Sep;5(1):22-30;RabindranSK,et al.,Science.1993 Jan 8;259(5092):230-4)等等。
也可以采用体外翻译系统在体外制备CX蛋白。
在本发明上下文中,短语“CX基因”包括编码人CX基因或人CX基因的任何功能等价物的多核苷酸。
CX基因可以作为天然蛋白通过常规克隆方法从自然界获得,或基于所选择的核苷酸序列通过化学合成获得。采用cDNA文库等克隆基因的方法在本领域中是公知的。
(2)抗体
在本说明书中所使用的术语“抗体”意欲包括与指定蛋白或其肽特异反应的免疫球蛋白及其片段。抗体可以包括人源抗体、灵长源抗体、嵌合抗体、双特异性抗体、人源化抗体、融合其它蛋白或放射标记的抗体以及抗体片段。此外,抗体在本文中可以最广义的应用,明确涵盖完整的单克隆抗体、多克隆抗体、由至少两个完整抗体形成的多特异性抗体(例如双特异性抗体)以及抗体片段,只要它们表现出所需的生物学活性。“抗体”表示所有类型(例如IgA、IgD、IgE、IgG和IgM)。
本发明采用针对CX蛋白的抗体,包括例如,针对EPHA7N末端部分(例如,EPHA7的SEQ ID NO:4残基526-580aa)的抗体。这些抗体可以用于诊断肺癌或食道癌。也可以采用针对CDCA5多肽的抗体,尤其是针对CDCA5多肽至少一个磷酸化区的抗体,例如位于SEQ ID NO:2(CDCA5)氨基酸残基68-82(S/T-P-x-R/K)、和SEQ ID NO:2(CDCA5)氨基酸残基76-86(x-x-S/T-P)和/或SEQ ID NO:2(CDCA5)109-122(x-x-S/T-P)的共有CDC2磷酸化基序。这些抗体可以用于抑制和/或阻断CDC2介导的CDCA5多肽磷酸化或ERK介导的CDCA5多肽磷酸化,并且可以用于治疗和/或预防(过)表达CDCA5的癌症,例如肺癌或食道癌。此外,本发明采用针对CDCA5多肽或其部分肽的抗体,尤其是针对CDCA5多肽的CDC2结合区或CDCA5多肽的ERK结合区的抗体。
这些抗体可以用于抑制和/或阻断CDCA5多肽和CDC2多肽之间的相互作用,例如结合,或CDCA5多肽和ERK多肽之间的相互作用,例如结合,并且可以用于治疗和/或预防(过)表达CDCA5的癌症,例如肺癌或食道癌。另外,本发明还采用针对CDC2多肽、ERK多肽或它们的部分肽,例如它们的CDCA5结合区,的抗体。这些抗体将通过已知方法来提供。描述了本发明所使用的制备抗体的示例性技术。
(i)多克隆抗体
可以通过相关抗原和佐剂分次皮下(sc)或腹腔(ip)注射动物来制备多克隆抗体。将相关抗原与在要免疫的物种中具有免疫原性的蛋白偶联来发挥作用,例如,钥孔血蓝蛋白、血清白蛋白、牛甲状腺球蛋白或使用双功能或衍生作用剂的大豆胰蛋白酶抑制剂,例如,马来酰亚胺苯甲酰磺基琥珀酰亚胺酯(maleimidobenzoyl sulfosuccinimide ester)(通过半胱氨酸残基偶联)、N-羟基琥珀酰亚胺(通过赖氨酸残基)、戊二醛、琥珀酸酐、SOC12或R’N=C=NR,其中R和R’是不同的烷基。
用抗原、免疫原性偶联物或衍生物免疫动物,通过将例如100微克或5微克蛋白或偶联物(分别用于兔或小鼠)与3倍体积的弗氏完全佐剂混合,多点皮内注射该溶液。一个月之后,用混合于弗氏完全佐剂的原剂量的1/5到1/10的肽或偶联物通过多点皮下注射对动物进行加强免疫。7到14天后,对动物取血并且分析血清抗体效价。加强免疫动物直到效价达到平台。在一些实例中,用相同抗原偶联到不同蛋白和/或通过不同交联剂而成的偶联物加强免疫动物。
偶联物也可以作为融合蛋白在重组细胞培养中制备。此外,聚集剂例如铝适合用来增强免疫反应。
(ii)单克隆抗体
单克隆抗体从基本均质的抗体群获得,即,构成该抗体群的单个抗体除了存在少量可能的天然突变以外是相同的。因此,经修饰的“单克隆”表示该抗体的特征不是分离抗体的混合物。
例如,可以采用KohlerG & Milstein C.Nature.1975 Aug 7;256(5517):495-7首先描述的杂交瘤方法,或通过重组DNA方法来制备单克隆抗体(美国专利4,816,567)。
在杂交瘤方法中,根据上文所述对小鼠或其它合适的宿主动物,例如仓鼠进行免疫来诱导淋巴细胞,所述淋巴细胞产生或能够产生将特异结合用于免疫的蛋白的抗体。另外,可以体外免疫淋巴细胞。然后采用适当的融合剂如聚乙二醇,使淋巴细胞和骨髓瘤细胞融合以形成杂交瘤细胞(Goding,Monoclonal Antibodies:Principles and Practice,pp.59-103(Academic Press,1986))。
因此,将制备的杂交瘤细胞接种于适合的培养液并进行培养,所述培养液可以含有一种或多种可抑制未融合细胞、亲本骨髓瘤细胞生长或存活的物质。例如,如果亲本骨髓瘤细胞缺乏次黄嘌呤鸟嘌呤磷酸核糖转移酶(HGPRT或HPRT),则通常杂交瘤培养液将包括次黄嘌呤、氨基蝶呤和胸苷(HAT培养液),这些物质阻止HGPRT缺陷细胞的生长。
在一些实施方案中,优选的骨髓瘤细胞具有如下特征:融合效率高,支持所选抗体产生细胞稳定高水平产生抗体,并且对某种培养基例如HAT培养基敏感。其中,优选的骨髓瘤细胞系是鼠骨髓瘤细胞系,例如从可以从Salk研究所细胞配送中心(Salk Institute Cell Distribution Center,SanDiego),California USA获得的MOPC-21和MPC-11小鼠肿瘤和可以从美国典型培养物保藏中心(American Type Culture Collection),Manassas,Virginia,USA获得的SP-2或X63-Ag8-653细胞衍生的细胞系。人骨髓瘤和小鼠-人异源骨髓瘤细胞系也有报道用于产生人单克隆抗体(Kozbor D,et al,J.Immunol.,1984 Dec;133(6):3001-5;Brodeur et al.,Monoclonal AntibodyProduction Techniques and Applications,pp.51-63(Marcel Dekker,Inc.,NewYork,1987))。
对培养着杂交瘤细胞的培养基,测定其中针对抗原的单克隆抗体的产生。在一些实施方案中,由杂交瘤细胞产生的单克隆抗体的结合特异性通过免疫沉淀或通过体外结合试验加以确定,例如放射免疫试验(RIA)或酶联免疫吸附试验(ELISA)。
例如,可以通过Munson PJ & Rodbard D的30Scatchard分析(AnalBiochem.1980 Sep 1;107(1):220-39)确定单克隆抗体的结合亲和力。
在鉴定出可产生具有期望特异性、亲和性和/或活性的抗体的杂交瘤细胞之后,可以通过有限稀释程序对克隆进行亚克隆,并通过常规方法来培育它们(Goding,Monoclonal Antibodies:Principles and Practice,pp.59-103(Academic Press,1986))。用于此目的的合适培养基包括例如D-MEM或RPML-1640培养基。此外,杂交瘤细胞可以在体内作为动物体内的腹水瘤培育。
可以通过常规免疫球蛋白纯化方法将亚克隆所分泌的单克隆抗体与培养液、腹水或血清适当分离,例如,蛋白A-Sepharose、羟基磷灰石层析、凝胶电泳、透析或亲和层析。
编码单克隆抗体的DNA可以用传统方法(例如通过使用能够特异结合编码鼠源抗体重链和轻链的基因的寡核苷酸探针)容易地加以分离和测序。杂交瘤细胞是这类DNA的优选来源。一旦分离了DNA,即可将DNA置于表达载体内,然后将其转染进入宿主细胞,例如大肠杆菌细胞、猿COS细胞、中华仓鼠卵巢(CHO)细胞,或骨髓瘤细胞,这些细胞本身不会产生免疫球蛋白,从而在重组宿主细胞内合成单克隆抗体。关于在细菌体内重组表达编码抗体的DNA的综述文献见Skerra A.Curr.Opinion in Immunol.,1993Apr;5(2):256-262和Pluckthun,Immunol.Rev.,1992 Dec;130:151-188。
产生与CX蛋白反应的特异抗体或抗体片段的另一个方法是用CX蛋白或肽对细菌中所表达的编码免疫球蛋白基因或其部分的表达文库进行筛选。例如,可以采用噬菌体表达文库在细菌中表达完整Fab片段、VH区和Fv区。参见例如,Ward ES,et al.,Nature.1989 Oct 12;341(6242):544-6;HuseWD,et al.,Science.1989 Dec 8;246(4935):1275-81;和McCafferty J,et al.,Nature.1990 Dec 6;348(6301):552-4。用CX蛋白例如CX肽对这些文库进行筛选可以鉴定与CX蛋白有反应性的免疫球蛋白片段。另外,SCID-humouse(可从Genpharm获得)可以用于制备抗体或其片段。
在进一步的实施方案中,可以采用McCafferty J,et al.,Nature.1990 Dec6;348(6301):552-4;Clackson T,et al.,Nature.1991 Aug 15;352(6336):624-8中所描述的技术从产生的抗体噬菌体文库中分离抗体或抗体片段,Marks JD,et al.,J MoL BioL,222:581-597(1991)J Mol Biol.1991 Dec 5;222(3):581-97分别描述了使用噬菌体文库分离鼠源和人源抗体。随后的出版物描述了通过链改组(Marks JD,et al.,Biotechnology(N Y).1992 Jul;10(7):779-83)以及组合感染(combinatorial infection)和体内重组作为构建极大型噬菌体文库的策略来产生高亲和力(nM范围)的人源抗体(Waterhouse P,et al.,NucleicAcids Res.1993 May 11;21(9):2265-6)。因此,这些技术是分离单克隆抗体的传统单克隆抗体杂交瘤技术的可行替代方案。
也可以通过,例如,用人重链和轻链恒定区编码序列替换同源鼠序列(U.S.Patent No.4,816,567;Morrison SL,et al.,Proc Natl Acad Sci USA.1984 Nov;81(21):6851-5),或通过将免疫球蛋白编码序列与非免疫球蛋白多肽的全部或部分编码序列共价连接,来修饰DNA。
通常,用这些非免疫球蛋白多肽替换抗体恒定区,或它们替换抗体的一个抗原结合位点的可变区以产生包括一个具有某种抗原特异性的抗原结合位点和另一个具有不同抗原特异性的抗原结合位点的嵌合双价抗体。
(iii)人源化抗体
用于将非人抗体人源化的方法在本领域中已有记载。在一些实施方案中,人源化抗体中导入了一个或多个来自非人来源的氨基酸残基。这些非人氨基酸残基经常称作“输入(import)”残基,通常取自某个“输入”可变域。人源化可以基本上按照Winter及其合作者的方法(Jones PT,et al.,Nature.1986 May 29-Jun 4;321(6069):522-5;Riechmann L,et al.,Nature.1988 Mar24;332(6162):323-7;Verhoeyen M,et al.,Science.1988 Mar25;239(4847):1534-6)来进行,用高变区序列替换人抗体的相应序列。因此,这些“人源化”抗体是嵌合抗体(美国专利No.4,816,567),其中完整人可变区的一小部分(substantially less than intact)被来自非人物种的相应序列替代。在实践中,人源化抗体典型的是人抗体中一些高变区残基(可能还有一些FR残基)被来自啮齿动物抗体中类似位置上的残基替代而得到的抗体。
用于制造人源化抗体的人可变区,包括轻链和重链,的选择对于减少抗原性是非常重要的。根据所谓的“最佳匹配(best-fit)”方法,用啮齿动物抗体的可变域的序列来筛选整个已知人可变区序列文库。然后,接受与啮齿动物序列最接近的人序列作为用于人源化抗体的人框架区(FR)(Sims MJ,et al.,J Immunol.1993 Aug 15;151(4):2296-308;Chothia C & Lesk AM.J MolBiol.1987 Aug 20;196(4):901-17)。另一种方法使用来源于轻链或重链特定亚群中的所有人抗体之共有序列的特定框架区。同一框架可用于数种不同的人源化抗体(Carter et al.,Proc.Natl.Acad.Sci.USA,89:4285(1992);Presta etal.,J.Immunol.,151:2623(1993))。
此外,人源化的抗体保留对抗原的高亲和性和其它有利的生物学性质是重要的。为了实现这一目标,根据优选的方法,人源化抗体的制备借助下述过程:使用亲本和人源化序列的三维模型来分析亲本序列和各种理论上的人源化产物。三维免疫球蛋白模型是常用的,而且本领域技术人员很熟悉它们。有可用的计算机程序来图解和显示选定的候选免疫球蛋白序列的可能三维构型结构。通过检查这些显示结果,人们可以分析残基在候选免疫球蛋白序列功能中的可能作用,即分析残基是否影响候选免疫球蛋白与其抗原结合的能力。这样,可以选择FR残基,并与受体序列和输入序列组合,从而获得期望的抗体特性,例如增加对靶抗原的亲和性。一般地说,高变区残基直接而且最实质性地参与影响抗原的结合。
(iv)人源抗体
作为人源化的替代,可以制备人源抗体。例如,目前可以产生这样的转基因动物(例如小鼠),它们在经免疫之后能够产生完全的人抗体库,而不产生内源性免疫球蛋白。例如,已经描述了在嵌合和种系突变型小鼠中抗体重链连接区(JH)基因的纯合缺失导致内源性抗体产生的完全抑制。向所述种系突变型小鼠中转移人种系免疫球蛋白基因群,结果在抗原攻击之后会产生人源抗体。参见例如Jakobovits A,et al.,Proc Natl Acad Sci USA.1993 Mar 15;90(6):2551-5;Nature.1993 Mar 18;362(6417):255-8;BrüggemannM,et al.,Year Immunol.1993;7:33-40和U.S.Patent Nos.5,591,669;5,589,369以及5,545,807。
另外,噬菌体展示技术(McCafferty J,et al.,Nature.1990 Dec6;348(6301):552-4)可用于在体外从来自未被免疫的供体的免疫球蛋白可变(V)区基因库(repertoire)产生人抗体和抗体片段。根据这种技术,将抗体V区基因阅读框架一致地(in-frame)克隆到丝状噬菌体(例如M13或fd)的大衣壳蛋白或小衣壳蛋白基因内,作为有功能的抗体片段被展示在噬菌体颗粒的表面上。因为丝状颗粒含有噬菌体基因组的单链DNA拷贝,所以根据抗体的功能性质进行选择也可以选出编码显示这些性质的抗体的基因。因此,噬菌体模拟B细胞的一些性质。噬菌体展示可以用多种形式进行,关于它们的综述,见例如Johnson KS & Chiswell DJ.Curr Opin Struct Biol.1993;3:564-71。有多种来源的V基因片段可用于噬菌体展示。
Clackson T,et al.,Nature.1991 Aug 15;352(6336):624-8从经免疫小鼠的脾脏来源的小型随机组合V基因文库分离了多种系列的抗噁唑酮(oxazolone)抗体。可以从未被免疫的人供体构建V基因谱,并基本上按照下列文献中记载的技术分离针对多种系列抗原(包括自身抗原)的抗体:Marks JD,et al.,J Mol Biol.1991 Dec 5;222(3):581-97,或Griffiths AD,et al.,EMBO J.1993 Feb;12(2):725-34。另见美国专利5,565,332和5,573,905。
也可以通过体外活化的B细胞生产人源抗体(参见美国专利20,567,610和5,229,275)。
(v)非抗体结合蛋白
本发明还预期针对CX蛋白的非抗体结合蛋白,包括针对EPHA7N末端部分的非抗体结合蛋白。可互换的术语“非抗体结合蛋白”或“非抗体配体”或“抗原结合蛋白”是指采用非免疫球蛋白支架的抗体模拟物,包括在下文中详细讨论的adnectins、avimers、单链多肽结合分子以及抗体样结合肽模拟物。
已经开发出了其它按照与抗体相似的方式靶定和结合靶标的化合物。这些“抗体模拟物”中的一些使用非免疫球蛋白骨架作为抗体可变区的可替代蛋白框架。
例如,Ladner等人(美国专利5,260,203)描述了具有结合特异性的单多肽链结合分子,所述结合特异性类似于聚合但分子上分离的抗体轻链和重链可变区。单链结合分子含有通过肽键连接的抗体重链和轻链可变区的抗原结合位点,其将折叠成类似于两个肽抗体的结构。单链结合分子显示出优于常规抗体的一些优势,包括尺寸更小、稳定性更好而且更易于修饰。
Ku等(Proc Natl Acad Sci USA 92(14):6552-6556(1995))公开了一种基于细胞色素b562的抗体替代物。Ku等(1995)制成了一个文库,其中细胞色素b562的两个环被随机化,并从中选择针对牛血清白蛋白的结合性。发现突变体们以与抗BSA抗体相似的方式选择性结合BSA。
Lipovsek等(美国专利6,818,418和7,115,396)公开了一种抗体模拟物,其特征是具有一个纤连蛋白或纤连蛋白样骨架和至少一个可变环。这些基于纤连蛋白的抗体模拟物称作Adnectins,它们显示出许多与天然或工程化抗体相同的特征,包括对任何靶配体的高亲和性和特异性。任何用于开发新的或改良的结合蛋白的技术均可用于这些抗体模拟物。
这些基于纤连蛋白的抗体模拟物的结构与IgG重链可变区的结构相似。因此,这些模拟物的抗原结合性质在性质上与亲和性上与天然抗体相似。而且,这些基于纤连蛋白的抗体模拟物与抗体和抗体片段相比还表现出某些优点。例如,这些抗体模拟物的天然折叠稳定性不依赖于二硫键,因此这些抗体模拟物在通常会破坏抗体的条件下仍然保持稳定。此外,因为这些基于纤连蛋白的抗体模拟物的结构与IgG重链的结构相似,所以可以在体外进行环随机化和重排处理,类似于抗体的体内亲和力成熟过程。
Beste等(Proc Natl Acad Sci USA 96(5):1898-1903(1999))公开了一种基于脂笼蛋白骨架的抗体模拟物(
Figure GPA00001115063300331
)。脂笼蛋白包括蛋白末端由4个超变环构成的β-桶。Beste(1999)将这些环进行随机突变,并以例如对荧光素的结合为条件进行选择。这些变异体显示对荧光素的特异性结合,其中一个变异体显示与抗-荧光素抗体相似的结合。进一步的分析显示,所有随机化位置均是可变的,表明
Figure GPA00001115063300332
可能适合于用作抗体的替代物。是小的单链肽,通常在160-180个残基之间,其提供了一些优于抗体的优势,包括生产成本降低、在储存中稳定性提高并且免疫反应降低。
Hamilton等(美国专利No.5,770,380)公开了一种合成抗体模拟物,其使用杯芳烃(calixarene)刚性非肽有机骨架,骨架上搭接有多个可变肽环,作为结合位点。肽环相对于彼此均从杯芳烃的几何学上的同一侧突出。由于这种几何学构型,所有的环均可供结合,从而增加了与配体的结合亲和性。然而,与其它的抗体模拟物相比,基于杯芳烃的抗体模拟物不是纯粹由肽构成的,因此对蛋白酶攻击的敏感性降低。骨架也不是纯粹由肽、DNA或RNA构成,这意味着该抗体在极端环境条件下相对稳定,寿命较长。而且,因为基于杯芳烃的抗体模拟物相对较小,其产生免疫响应的可能性降低。
Murali等(Cell Mol Biol.49(2):209-216(2003))讨论了一种用于将抗体减小为更小的模拟肽的方法,他们称之为“类抗体结合模拟肽(antibody likebinding peptidomemetics)”(ABiP),也可以作用抗体的替代物。
Silverman等(Nat Biotechno1.(2005),23:1556-1561)公开了融合蛋白,它们是包含多个域的单链多肽,称作“avimers”。avimers是通过体外外显子重排和噬菌体展示从人细胞外受体域发展而来的,是一类在亲和性和对各种靶分子的特异性方面与抗体有些相似的结合蛋白。所得的多结构域蛋白可以包括多个独立的结合域,它们与单表位结合蛋白相比显示更高的亲和性(在某些情况下是亚纳摩尔级)和特异性。关于avimers构建和使用的更多细节参见例如美国专利申请公开Nos.20040175756,20050048512,20050053973,20050089932和20050221384。
除了非免疫球蛋白骨架之外,还可以在含有RNA分子和非天然寡聚物(例如蛋白酶抑制剂、苯并二氮卓类(benzodiazepines)、嘌呤衍生物和β转角模拟物)的化合物中模拟抗体特性,所有这些均适合本发明使用。
正如本领域公知的,适体是由与特异分子靶标紧密结合的核酸所组成的大分子。Tuerk和Gold(Science.249:505-510(1990))披露了筛选适体的SELEX方法(Systematic Evolution of Ligand by Exponential Enrichment,配体指数级富集的系统进化)。在SELEX方法中,制备核酸分子的大型文库(例如1015种不同分子)和/或用靶分子进行筛选。然后分离的适体可以进一步精制以消除任何对靶向结合和/或适体结构没有帮助的核苷酸(即截短到其关键结合结构域的适体)。关于适体技术的综述参见例如Jayasena,1999,Clin.Chem.45:1628-1650。
尽管检验作用剂文库的构建在本领域是公知的,但在下文中提供了用于本发明筛选方法的对鉴定检验作用剂和构建该作用剂文库的其它指导。
(vi)抗体片段
已经开发了多种用于生产抗体片段的技术。通常,这些片段来自完整抗体的蛋白水解消化(参见,例如Morimoto K & Inouye K.J Biochem BiophysMethods.1992 Mar;24(1-2):107-17;Brennan M,et al.,Science.1985 Jul5;229(4708):81-3)。然而,这些片段现在可以直接通过重组宿主细胞制备。例如,抗体片段可以从上文所讨论的抗体噬菌体文库中分离。另外,Fab’-SH片段可以直接从大肠杆菌中回收并化学偶联来形成F(ab’)2片段(Carter P,et al.,Biotechnology(N Y).1992 Feb;10(2):163-7)。根据另一个方法,F(ab’)2可以直接从重组宿主细胞培养物中分离。用于制备抗体片段的其它技术对于本领域技术人员是显而易见的。在其它实施方案中,所选择的抗体是单链Fv片段(scFv)。参见WO 93/16185;美国专利5,571,894和5,587,458。抗体片段也可以是“线性抗体”,例如,如美国专利5,641,870中所描述的。所述线性抗体片段可以是单特异性或双特异性的。
(vii)筛选抗体或抗体片段
经上述方法制备的抗体或抗体片段可以通过检测CX基因表达细胞,如癌细胞的亲和力来筛选。通过用含3%BSA的PBS在室温下处理30min来封闭与这些细胞的非特异结合。将细胞与候选抗体或抗体片段在室温下孵育60min。PBS洗涤之后,用FITC偶联的第二抗体在室温下对细胞染色60min并采用荧光计进行检测。或者,采用表面等离子共振现象的生物传感器可以用作检测或定量本发明抗体或抗体片段的手段。在本发明中筛选能够检测细胞表面CX肽的抗体或抗体片段。
(3)双链分子
除非另外特别说明,在本说明书中可互换使用的术语“多核苷酸”和“寡核苷酸”通过其通常所接受的单字母密码来指称。该术语适用于这样的核酸(核苷酸)聚合物,其中一个或多个核酸通过酯键连接。多核苷酸或寡核苷酸可以由DNA、RNA或其组合来构成。
本说明书中所使用的术语“分离的双链分子”是指抑制靶基因表达的核酸分子,包括例如,短干扰RNA(siRNA;例如双链核糖核酸(dsRNA)或小发夹RNA(shRNA))和短干扰DNA/RNA(siD/R-NA;例如DNA和RNA的双链嵌合体(dsD/R-NA)或DNA和RNA的小发夹嵌合体(shD/R-NA))。
本说明书中所使用的术语“siRNA”是指可阻止靶mRNA翻译的双链RNA分子。可以采用将siRNA导入细胞的标准技术,包括用DNA作为RNA转录模板的那些技术。siRNA包括与CX基因有义核酸序列对应的核糖核苷酸(也称为“有义链”)、与CX基因反义核酸序列对应的核糖核苷酸(也称为“反义链”)或这两者。siRNA可以这样构建,使单个转录物同时具有靶基因的有义核酸序列和互补的反义核酸序列,例如发夹。siRNA可以是dsRNA或shRNA。
本说明书中所使用的术语“dsRNA”是指两个RNA分子的构建体,这两个RNA分子含有彼此互补的序列,并且通过所述互补序列退火在一起形成双链RNA分子。两条链的序列不仅可以包括选自靶基因序列的蛋白编码序列的“有义”或“反义”RNA,还包括具有选自靶基因非编码区的核苷酸序列的RNA分子。
在本说明书中使用的术语“shRNA”是指具有茎-环结构的siRNA,其包含彼此互补的第一区和第二区,即有义链和反义链。两个区的互补程度和方向足以使两个区之间发生碱基配对,所述第一区和第二区通过环区连接,所述环是由于环区内的核苷酸(或核苷酸类似物)之间缺乏碱基配对而形成的。shRNA的环区是介于有义和反义链之间的单链区,也可以称作“间插单链”。
在本说明书中所使用的术语“siD/R-NA”是指由RNA和DNA组成的双链分子,包括RNA和DNA的杂合体和嵌合体,其阻止靶mRNA的翻译。在这里,杂合体表示这样的分子,其中由DNA组成的寡核苷酸和由RNA组成的寡核苷酸相互杂交形成双链分子;而嵌合体表示组成双链分子的一条或两条链可以同时含有RNA和DNA。采用标准技术将siD/R-NA导入细胞。siD/R-NA包括CX基因的有义核酸序列(也称作“有义链”)、CX基因的反义核酸序列(也称作“反义链”)或这两者。siD/R-NA可以这样构建,使单个转录物同时具有来自靶基因的有义和互补的反义核酸序列,例如发夹。siD/R-NA可以是dsD/R-NA或shD/R-NA。
在本说明书中所使用的术语“dsD/R-NA”是指这样两个分子的构建体,它们包含彼此互补的序列,并且通过所述互补序列退火在一起形成双链多核苷酸分子。两条链的核苷酸序列可以不仅包括选自靶基因序列的蛋白编码序列的“有义”或“反义”多核苷酸序列,还可以包括具有选自靶基因非编码区核苷酸序列的多核苷酸。组成dsD/R-NA的两个分子中的一个或两个是由RNA和DNA组成(嵌合分子),或者其中一个分子由RNA组成而另一个分子由DNA组成(杂合双链)。
在本说明书中所使用的术语“shD/R-NA”是指具有茎-环结构的siD/R-NA,其包含彼此互补的第一区和第二区,即有义链和反义链。所述区的互补程度和方向足以使该区之间间发生碱基配对,第一区和第二区通过环区连接,所述环是由于环区内的核苷酸(或核苷酸类似物)之间缺乏碱基配对而形成的。shD/R-NA的环区是介于有义和反义链之间的单链区,也可以称作“间插单链”。
概述
(1)CDCA5
为了鉴定癌症治疗的生物标志和/或治疗靶标,本发明人采用含有27,648个基因的cDNA微阵列对120个肺癌和食道癌临床病例的基因表达谱进行了分析。在这些肿瘤中普遍上调的基因中鉴定出了CDCA5,它编码后期促进复合物的底物。Northern印迹分析在受检的23个正常组织中仅在睾丸中检测到CDCA5转录物。采用针对CDCA5的siRNA处理癌细胞可以抑制其表达以及细胞的生长。另一方面,通过诱导CDCA5外源性表达,可赋予哺乳动物细胞生长促进活性。体外激酶分析检测到CDC2介导的CDCA5多肽磷酸化或ERK介导的CDCA5磷酸化。由于CDCA5可以归类为睾丸癌抗原并且其对细胞生长和/或存活是必需的,所以,以CDCA5为靶标,和/或以CDC2多肽或ERK多肽对CDCA5多肽的酶活性为靶标,对于开发肺癌和ID NO:42和SEQ ID NO:43(对于EPHA7)、SEQ ID NO:38和SEQ ID NO:39(对于STK31)、SEQ ID NO:44和SEQ ID NO:45(对于WDHD1)的序列对应的寡核苷酸的有义链;
[B]是间插单链;并且
[A’]是含有与[A]中所选序列互补的序列相对应的寡核苷酸的反义链。
[23][1]的方法,其中双链分子包含在组合物中,所述组合物除了该分子外还含有转染增强剂和细胞通透剂。
将在下文中更详细地描述本发明方法。
通过使细胞与针对CX基因的双链分子、表达该分子的载体或含有其的组合物相接触,抑制(过)表达CX基因的细胞的生长。进一步使所述细胞与转染剂接触。合适的转染剂在本领域是公知的。短语“抑制细胞生长”表示与未暴露于该分子的细胞相比,细胞以较低的速率增殖,或细胞生存力减少。细胞生长可以通过本领域公知的方法来测定,例如采用MTT细胞增殖实验。
根据本方法可以抑制任何类型细胞的生长,只要该细胞表达或过表达本发明双链分子的靶基因。示例性的细胞包括癌细胞。
因此,可以通过施用至少一种本发明双链分子、至少一种表达至少一种所述分子的载体或至少一种含有至少一种所述分子的组合物,对患有CX基因相关疾病或有患上CX基因相关疾病风险的患者进行治疗。例如,根据本方法可以治疗癌症患者。癌症类型可以根据诊断的肿瘤的特定类型,采用标准方法来鉴别。在一些实施方案中,通过RT-PCR、杂交或免疫测定来检测CX基因在患者来源的活组织检查物中的(过)表达,来选择依照本发明方法治疗的患者。在一些实施方案中,在实施本发明治疗之前,通过本领域公知的方法来确认受试者来源的活检标本中CX基因的过表达,所述本领域公知的方法例如,免疫组织化学分析、杂交或RT-PCR(参见,[实施例1]中的(3)半定量RT-PCR,(4)Northern印迹分析,(5)免疫印迹,(8)免疫组织化学或(10)ELISA)。
根据本方法抑制或减少细胞生长并由此治疗癌症,当施用多种双链分子(或表达所述分子的载体、或含有所述分子的组合物)时,每个分子都可以针对相同基因的不同靶序列,或不同基因的不同靶序列。例如,该方法可以利用针对相同CX基因转录物的不同双链分子。另外,例如,该方法可食道癌疗法例如分子靶向药物和癌症疫苗是有希望的策略。
(2)EPHA7
本发明人研究了肺癌和食道癌的基因表达谱,在大多数肺癌和食道鳞状细胞癌(ESCC)中检测到属于蛋白酪氨酸激酶家族的肝配蛋白受体亚家族的肝配蛋白受体A7(EPHA7)的表达增强。采用由402个记录在案的非小细胞肺癌(NSCLC)和292个ESCC样本组成的肿瘤组织微阵列进行免疫组织化学染色,结果证明EPHA7高水平表达与NSCLC以及ESCC患者的预后不良有关,并且多变量统计分析证实其对NSCLC的独立预后价值。本发明人建立了一套用于测定血清EPHA7的ELISA法,并且发现血清EPHA7阳性病例的比例是149例(56.4%)/264例非小细胞癌症(NSCLC)、35例(44.3%)/79例SCLC以及81例(84.4%)/96例ESCC患者,而仅有6例(4.7%)/127例健康志愿者被误诊。针对EPHA7和CEA二者的联合ELISA将77.2%的NSCLC患者分为阳性,并且EPHA7和ProGRP二者的使用将SCLC的检测灵敏度增加到77.5%,而假阳性率为7-8%。此外,采用针对EPHA7的siRNA处理肺癌细胞可以抑制细胞的生长,而诱导EPHA7可以增强细胞侵袭和生长促进活性。为了研究其功能,我们采用一组针对癌细胞信号传导相关的磷蛋白的抗体来筛选EPHA7激酶的下游靶标,鉴定出了EPHA7诱导的EGFR(Tyr-845)、PLCgamma(Tyr-783)(GenBank登录号:NM_002660,SEQ ID NO.:52)、CDC25(Ser-216)(GenBank登录号:NM_001790,SEQ ID NO.:54)、MET(Tyr-1230/1234/1235,Tyr-1313,Tyr-1349,Tyr-1365)(GenBank登录号:NM_000245,SEQ ID NO.:56)、Shc(Tyr317,Tyr239/240)(GenBank登录号:NM_001130041,SEQ ID NO.:58)、ERK(p44/42MAPK)(Thr202/Tyr204)(GenBank登录号:NM_001040056,SEQ ID NO.:50)、Akt(Ser473)(GenBank登录号:NM_001014431SEQID NO.:60)以及STAT3(Tyr705)(GenBank登录号:NM_139276)的磷酸化作用。这些数据与EPHA7在癌细胞生长和侵袭中起重要作用的结论一致,并且应该可以用作有效的肿瘤生物标记和治疗靶标。
(3)STK31
采用120个肺癌和食道癌对27,648个基因进行基因表达谱分析,结果显示编码丝氨酸-苏氨酸激酶31(STK31)的基因在这些癌症中经常被反式激活。STK31在正常组织中显示出睾丸特异性表达。STK31定位于癌细胞的细胞质和细胞核。在含有368个肺癌的组织微阵列上对STK31进行免疫组织化学染色,结果表明STK31表达与不良临床结果有关(经log-rank检验P=0.0178),证明其可以用作预后生物标志。采用针对STK31的siRNA处理肺癌细胞可以抑制其表达并导致生长抑制。另一方面,通过诱导STK31外源性表达可赋予哺乳动物细胞生长促进活性。采用重组STK31蛋白进行磷酸化分析,证明其具有激酶活性,并且通过诱导STK31表达可使哺乳动物细胞中EGFR(Ser1046/1047)、ERK(p44/42MAPK)(Thr202/Tyr204)(GenBank登录号:NM_001040056,SEQ ID NO.:50)以及MEK(Ser217/Ser221)磷酸化。我们的数据与这样的结论一致,即选择性抑制STK31酶活性对于开发分子靶向作用剂和癌症疫苗是有希望的治疗策略。
(4)WDHD1
通过对32,000个基因的cDNA微阵列分析,本发明人发现在大多数肺癌和食道鳞状细胞癌(ESCC)中WD重复序列蛋白和HMG-box DNA结合蛋白1(WDHD1)高丰度表达。Northern印迹分析在受检的除睾丸外任何正常组织中都没有识别出WDHD1表达。WDHD1定位于癌细胞的细胞核。用抗WDHD1抗体对WDHD1进行免疫沉淀,之后用泛-磷酸特异抗体进行免疫印迹,表明WDHD1在其丝氨酸和酪氨酸残基处被磷酸化。涵盖297个ESCC和264个肺癌的组织微阵列分析显示,WDHD1高水平表达与预后不良有关(经log-rank检验分别为P=0.0285和0.0208)。采用siRNA抑制WDHD1的表达可以有效地抑制癌细胞的生长。
与此一致地,在COS-7细胞中诱导WDHD1外源性表达显示出其生长促进活性。WDHD1在其丝氨酸和酪氨酸残基处被磷酸化。在从G1到S期的过渡期时WDHD1的水平增加,在S期达到最高水平,而它被磷脂酰肌醇(-3)激酶(PI3K)抑制剂LY294002所降低。这些资料提示WDHD1应该分类为癌-睾丸抗原,并且其通过PI3K/AKT通路在细胞周期进程中起重要作用。选择性抑制WDHD1致癌活性对于开发分子靶向作用剂治疗食道癌和肺癌是有希望的方法。
针对CX基因的双链分子
(i)靶序列
针对CX基因的双链分子可与靶mRNA杂交,通过与CX基因正常情况下为单链的mRNA转录物结合(associate),干扰翻译,从而抑制靶基因所编码的蛋白的表达,来抑制或减少CX基因所编码的CX蛋白的产生。本发明的双链分子抑制了癌细胞系中CX基因的表达;两个双链分子抑制了癌细胞系中CDCA5的表达(图2A和2B,上图);两个双链分子抑制了抑制癌细胞系中EPHA7的表达(图6A,上图);两个双链分子抑制了癌细胞系中STK31的表达(图11A);两个双链分子抑制了癌细胞系中WDHD1的表达(图15A和B,上图)。
因此,本发明提供具有如此特性的分离的双链分子,当其导入细胞时可抑制或减少癌细胞CX基因表达。通过下文所提及的siRNA设计算法来设计双链分子的靶序列。
CDCA5靶序列包括,例如,核苷酸
5’-GCAGTTTGATCTCCTGGT-3’(SEQ ID NO:40)(在SEQ ID NO:1的位置808-827nt)或
5’-GCCAGAGACTTGGAAATGT-3’(SEQ ID NO:41)(在SEQ ID NO:1的位置470-488nt)
EPHA7靶序列包括,例如,核苷酸
5’-AAAAGAGATGTTGCAGTA-3’(SEQ ID NO:42)(在SEQ ID NO:3的位置2182-2200nt)或
5’-TAGCAAAGCTGACCAAGAA-3’(SEQ ID NO:43)(在SEQ IDNO:3的位置1968-1987nt)
STK31靶序列包括,例如,核苷酸
5’-GGAGATAGCTCTGGTTGAT-3’(SEQ ID NO:38)(在SEQ ID NO:5的位置1713-1732nt)或
5’-GGGCTATTCTGTGGATGTTS-3’(SEQ ID NO:39)(在SEQ ID NO:5的位置2289-2308nt)
WDHD1靶序列包括,例如,核苷酸
5’-GATCAGACATGTGCTATTA-3’(SEQ ID NO:44)(在SEQ ID NO:7的位置)或
5’-GGTAATACGTGGACTCCTA-3’(SEQ ID NO:45)(在SEQ ID NO:7的位置)
具体地,本发明提供下列双链分子[1]-[19]:
[1]一种分离的双链分子,
(i)当它被导入细胞时,抑制CDCA5基因的体内表达和细胞增殖,其中所述双链分子作用于与选自SEQ ID NO:40(在SEQ ID NO:1的位置808-827nt)和SEQ ID NO:41(在SEQ ID NO:1的位置470-488nt)的靶序列匹配的mRNA。
(ii)当它被导入细胞时,抑制EPHA7基因的体内表达和细胞增殖,其中,所述双链分子作用于与选自SEQ ID NO:42(在SEQ ID NO:3的位置2182-2200nt)和SEQ ID NO:43(在SEQ ID NO:3的位置1968-1987nt)的靶序列匹配的mRNA。
(iii)当它被导入细胞时,抑制STK31基因的体内表达和细胞增殖,其中,所述双链分子作用于与选自SEQ ID NO:38(在SEQ ID NO:5的位置1713-1732nt)和SEQ ID NO:39(在SEQ ID NO:5的位置2289-2308nt)的靶序列匹配的mRNA。
(iv)当它被导入细胞时,抑制WDHD1基因的体内表达和细胞增殖,其中,所述双链分子作用于与选自SEQ ID NO:44(在SEQ ID NO:7的位置)和SEQ ID NO:45(在SEQ ID NO:7的位置)的靶序列匹配的mRNA。
[2][1]的双链分子,其含有有义链和与之互补反义链,二者相互杂交形成双链,
(i)其中对于CDCA5,所述有义链含有与选自SEQ ID NO:40和SEQID NO:41的序列对应的寡核苷酸;
(ii)其中对于EPHA7,所述有义链含有与选自SEQ ID NO:42和SEQID NO:43的序列对应的寡核苷酸;
(iii)其中对于STK31,所述有义链含有与选自SEQ ID NO:38和SEQID NO:39的序列对应的寡核苷酸;
(vi)其中对于WDHD1,所述有义链含有与选自SEQ ID NO:44和SEQID NO:45的序列对应的寡核苷酸。
[3][1]的双链分子,其中所述靶序列含有选自CDCA5的SEQ ID NO:1、EPHA7的SEQ ID NO:3、STK31的SEQ ID NO:5或WDHD1的SEQ ID NO:7中的核苷酸序列的至少约10个连续核苷酸。
[4][3]的双链分子,其中所述靶标序列含有选自CDCA5的SEQ ID NO:1、EPHA7的SEQ ID NO:3、STK31的SEQ ID NO:5或WDHD1的SEQ IDNO:7的核苷酸序列约19到约25个连续核苷酸。
[5][2]的双链分子,其长度小于约100个核苷酸。
[6][5]的双链分子,其长度小于约75个核苷酸。
[7][6]的双链分子,其长度小于约50个核苷酸。
[8][7]的双链分子,其长度小于约25个核苷酸。
[9][8]的双链分子,其长度在约19-约25个核苷酸之间。
[10][1]的双链分子,其由单个寡核苷酸组成,所述寡核苷酸包含通过间插单链连接的有义链和反义链。
[11][10]的双链分子,其具有通式5’-[A]-[B]-[A’]-3’,其中
[A]是有义链,其含有与选自CDCA5的SEQ ID NO:40和SEQ ID NO:41、EPHA7的SEQ ID NO:42和SEQ ID NO:43、STK31的SEQ ID NO:38和SEQ ID NO:39、WDHD1的SEQ ID NO:44和SEQ ID NO:45的序列相对应的寡核苷酸;
[B]是间插单链;以及
[A’]是含有与[A]中所选序列的互补序列相对应的寡核苷酸的反义链。
[12][1]的双链分子,其包含RNA。
[13][1]的双链分子,其包含DNA和RNA。
[14][13]的双链分子,其是DNA多核苷酸和RNA多核苷酸的杂合体。
[15][14]的双链分子,其中有义链和反义链分别由DNA和RNA构成。
[16][13]的双链分子,其是DNA和RNA的嵌合体。
[17][16]的双链分子,其中有义链中靶序列的5’端区域,和/或反义链中靶序列互补序列的3’端区域由RNA组成。
[18][17]的双链分子,其中所述RNA区由9-13个核苷酸组成;以及
[19][2]的双链分子,其含有3’突出端。
本发明双链分子将在下文中详细描述。
设计具有抑制细胞内靶基因表达能力的双链分子的方法是已知的。(参见,例如美国专利6,506,559,以提述的方式将其全部内容并入本文中)。例如,可以从Ambion网站(互联网ambion.com/techlib/misc/siRNA_finder.html)获得用于设计siRNA的计算机程序。
该计算机程序根据下列方案选择双链分子的靶核苷酸序列。
靶点的设计
1、从转录物的AUG起始密码子开始,向下游扫描搜寻AA双核苷酸序列。记录每个AA的出现及其3’邻近的19个核苷酸作为潜在siRNA靶点。Tuschl等建议避免针对5’和3’非翻译区(UTRs)以及起始密码子邻近区域(75个碱基之内)设计siRNA,因为这些区域可能更富含调控蛋白的结合位点,而UTR结合蛋白和/或翻译起始复合物可能干扰siRNA核酸内切酶复合物的结合。
2、将潜在靶点与合适的基因组数据库(人、小鼠、大鼠等)进行比较,并且将任何与其它编码序列显著同源的靶序列排除在考虑之外。主要使用BLAST,其可以在互联网ncbi.nlm.nih.gov/BLAST/的NCBI服务器上找到(Altschul SF,et al.,Nucleic Acids Res.1997 Sep 1;25(17):3389-402)。
3、选择合格的靶序列用于合成。通常沿着待评估的基因的长度选择几个靶序列。
根据该方案,对本发明分离的双链分子的靶序列进行设计,如下
CDCA5靶序列包括,例如,核苷酸
5’-GCAGTTTGATCTCCTGGT-3’(SEQ ID NO:40)(SEQ ID NO:1的位置808-827nt)或
5’-GCCAGAGACTTGGAAATGT-3’(SEQ ID NO:41)(SEQ ID NO:1的位置470-488nt)
EPHA7靶序列包括,例如核苷酸
5’-AAAAGAGATGTTGCAGTA-3’(SEQ ID NO:42)(SEQ ID NO:3位置2182-2200nt)或
5’-TAGCAAAGCTGACCAAGAA-3’(SEQ ID NO:43)(SEQ ID NO:3的位置1968-1987nt)
STK31靶序列包括,例如,核苷酸
5’-GGAGATAGCTCTGGTTGAT-3’(SEQ ID NO:38)(SEQ ID NO:5的位置1713-1732nt)或
5’-GGGCTATTCTGTGGATGTTS-3’(SEQ ID NO:39)(SEQ ID NO:5的位置2289-2308nt)
WDHD1靶序列包括,例如,核苷酸
5’-GATCAGACATGTGCTATTA-3’(SEQ ID NO:44)(SEQ ID NO:7的位置)或
5’-GGTAATACGTGGACTCCTA-3’(SEQ ID NO:45)(SEQ ID NO:7的位置)
具体地,本发明提供了分别对靶向上述靶序列的下列双链分子进行检查其是否具有抑制或减少表达靶序列的细胞的生长的能力。通过本发明双链分子抑制或减少了表达CX基因的癌细胞的生长;通过本发明双链分子抑制或减少了表达CX基因的细胞的生长;通过两个双链分子抑制了CDCA5表达细胞例如肺癌细胞系A549和LC319的生长(图2A和B,中图和下图);通过两个双链分子抑制EPHA7表达细胞例如肺癌细胞系NCI-H520和SBC-5的生长(图6A,中图和下图);通过两个双链分子抑制了STK31表达细胞例如肺癌细胞系LC319和NCI-H2170的生长(图11B和C);通过两个双链分子抑制了WDHD1表达细胞例如肺癌细胞系LC319和TE9的生长(图15A中图和下图)。因此,本发明提供靶向选自下组的任何序列的双链分子。
CDCA5靶序列包括,例如,核苷酸
5’-GCAGTTTGATCTCCTGGT-3’(SEQ ID NO:40)(SEQ ID NO:1的位置808-827nt)或
5’-GCCAGAGACTTGGAAATGT-3’(SEQ ID NO:41)(SEQ ID NO:1的位置470-488nt)
EPHA7靶序列包括,例如,核苷酸
5’-AAAAGAGATGTTGCAGTA-3’(SEQ ID NO:42)(SEQ ID NO:3的位置2182-2200nt)或
5’-TAGCAAAGCTGACCAAGAA-3’(SEQ ID NO:43)(SEQ ID NO:3的位置1968-1987nt)
STK31靶序列包括,例如核苷酸
5’-GGAGATAGCTCTGGTTGAT-3’(SEQ ID NO:38)(SEQ ID NO:5的位置1713-1732nt)或
5’-GGGCTATTCTGTGGATGTTS-3’(SEQ ID NO:39)(SEQ ID NO:5的位置2289-2308nt)
WDHD1靶序列包括,例如核苷酸
5’-GATCAGACATGTGCTATTA-3’(SEQ ID NO:44)(SEQ ID NO:7的位置)或
5’-GGTAATACGTGGACTCCTA-3’(SEQ ID NO:45)(SEQ ID NO:7的位置)
本发明的双链分子针对单个靶CX基因序列,或可以针对多个靶CX基因序列。
本发明靶向上述CX基因靶序列的双链分子包括这样的分离的多核苷酸,所述多核苷酸包含靶序列的任何核酸序列和/或与靶序列互补的序列。靶向CDCA5基因的双链分子的实例包括寡核苷酸,所述寡核苷酸含有与SEQ ID NO:40或SEQ ID NO:41对应的序列,及其互补序列;靶向EPHA7基因的双链分子包括这样的寡核苷酸,其含有与SEQ ID NO:42或SEQ IDNO:43对应的序列,及其互补序列;靶向STK31基因的双链分子包括这样的寡核苷酸,其含有与SEQ ID NO:38或SEQ ID NO:39对应的序列,及其互补序列;靶向WDHD1基因的双链分子包括这样的寡核苷酸,其含有与SEQ ID NO:44或SEQ ID NO:45对应的序列,及其互补序列。然而,本发明不局限于这些实施方案,上述核酸序列中的细微修饰是可以接受的,只要经过修饰的分子保留抑制CX基因表达的能力即可。在这里,核酸序列的“细微修饰”表示对该序列进行一个、两个或几个核酸的替换、缺失、添加或插入。
根据本发明,对于本发明的双链分子,可以采用实施例中所使用的方法来测试其能力(参见(12)[实施例1]RNA干扰分析)。在实施例中,根据标准方法,对含有与CX基因mRNA不同部分的互补的有义链和反义链的双链分子进行体外测试,检测它们减少癌细胞系(例如,对于CDCA5采用LC319和A549;对于EPHA7采用NCI-H520和SBC-5;对于STK31采用LC319和NCI-H2170,对于WDHD1采用LC319)中CX基因产物的产生的能力。此外,与在不存在候选分子的条件下所培养的细胞相比较,与候选双链分子接触的细胞中CX基因产物减少,可以通过,例如,用所述CX基因mRNA的引物进行RT-PCR来加以检测(参见,(3)[实施例1]半定量RT-PCR)。然后对于那些可在体外基于细胞的测定中减少CX基因产物产生的序列,可以检测其对细胞生长的抑制效果。对在体外基于细胞的测定中可抑制细胞生长的序列,使用患有癌症的动物,例如裸鼠异种移植模型来测试它们的体内能力,以确认CX基因产物的产生的减少和癌细胞生长的降低。
当分离的多核苷酸是RNA或其衍生物时,应将核苷酸序列中碱基“t”(胸腺嘧啶)替换为“u”(尿嘧啶)。在本说明书中所使用的术语“互补”是指多核苷酸的核苷酸单元之间形成Watson-Crick或Hoogsteen碱基配对,术语“结合”表示两个多核苷酸之间的物理或化学相互作用。当所述多核苷酸含有经修饰的核苷酸和/或非磷酸二酯键时,这些多核苷酸也可以以相同方式相互结合。通常,互补的多核苷酸序列在适宜条件下杂交,形成含有少许或完全不含错配的稳定双螺旋。此外,本发明经分离的多核苷酸的有义链和反义链可以通过杂交形成双链分子或发夹环结构。在一个实施方案中,所述双螺旋中每10个配对中含有的错配不超过1个。在一些实施方案中,双螺旋的链完全互补,这样的双螺旋不含错配。
对于CDCA5,多核苷酸长度小于2507个核苷酸,对于EPHA7,多核苷酸长度小于5229个核苷酸,对于STK31,多核苷酸长度小于3244个核苷酸,对于WDHD1,多核苷酸长度小于1129个核苷酸。例如,对于所有这些基因,多核苷酸长度小于500、200、100、75、50或25个核苷酸。本发明分离的多核苷酸可以用于形成针对CX基因的双链分子或制备编码双链分子的模板DNA。当所述多核苷酸用于形成双链分子时,所述多核苷酸可以长于19个核苷酸,例如长于21个核苷酸,例如约19-25个核苷酸之间。
本发明双链分子可以含有一个或多个经修饰的核苷酸和/或非磷酸二酯联结。本领域公知的化学修饰可以增加双链分子的稳定性、可用性和/或细胞对该双链分子的摄取。本领域技术人员将会了解本分子中可以引入的其它类型的化学修饰(WO03/070744;WO2005/045037)。在一个实施方案中,可以进行修饰,来提供对降解更好的抗性或更好的摄取。这些修饰的实施方案包括引入硫代磷酸酯联结、2’-O-甲基核糖核苷酸(尤其是在双链分子有义链上)、2’-脱氧-氟代核糖核苷酸、2’-脱氧核糖核苷酸、“通用碱基”核苷酸、5’-C-甲基核苷酸以及倒位脱氧脱碱基(inverted deoxyabasic)残基(美国专利申请20060122137)。
在另一个实施方案中,修饰可以用来增强双链分子稳定性或提高双链分子的靶向效率。修饰包括双链分子两个互补链之间的化学交联、双链分子一条链3’或5’末端的化学修饰、糖修饰、核碱基修饰和/或骨架修饰、2-氟代修饰核糖核苷酸以及2’-脱氧核糖核酸(WO2004/029212)。
在另一个实施方案中,修饰可以用来增强或减少针对靶mRNA中和/或互补双链分子链中互补核苷酸的亲和力(WO2005/044976)。例如,未修饰的嘧啶核苷酸可以用2-硫代、5-炔基、5-甲基或5-丙炔基嘧啶取代。另外,未修饰的嘌呤可以用7-脱氮、7-烷基或7-烯基嘌呤取代。在另一个实施方案中,当所述双链分子是带有3’突出端的双链分子时,可以将3’末端核苷酸的突出端核苷酸替换成脱氧核糖核苷酸(Elbashir SM et al.,Genes Dev2001 Jan 15,15(2):188-200)。关于进一步的细节可以从公开文献,例如美国专利申请号20060234970获知。本发明不局限于这些实施方案,任何已知的化学修饰都可以应用于本发明双链分子,只要所产生的分子保留抑制靶基因表达的能力。
此外,本发明双链分子可以含有DNA和RNA,例如dsD/R-NA或shD/R-NA。具体地,DNA链和RNA链的杂合体多核苷酸或DNA-RNA嵌合体多核苷酸显示出增强的稳定性。可以形成DNA和RNA的混合,即由DNA链(多核苷酸)和RNA链(多核苷酸)形成的杂合型双链分子、在任一单链(多核苷酸)或两条单链上都含有DNA和RNA的嵌合型双链分子,等等,来增强双链分子的稳定性。DNA链和RNA链的杂合体可以是这样的杂合体,其中有义链是DNA而反义链是RNA,或者相反,只要当其导入表达该基因的细胞时,具有抑制靶基因表达的活性即可。
在一些实施方案中,有义链多核苷酸是DNA,反义链多核苷酸是RNA。此外,嵌合体型双链分子可以是有义链和反义链两者都由DNA和RNA组成,或者其中有义链和反义链任何一个是由DNA和RNA组成,只要当其导入表达该基因的细胞时,具有抑制靶基因表达的活性。为了增强双链分子的稳定性,在一些实施方案中,所述分子含有尽可能多的DNA,然而为了诱导靶基因表达的抑制作用,要求所述分子在一定范围内是RNA,从而诱导对表达的充分抑制。在嵌合体型双链分子的一个实例中,所述双链分子上游部分区域(即,位于有义或反义链中靶序列或其互补序列之侧翼的区域)是RNA。
在一些实施方案中,上游部分区域表示有义链的5’端(5’侧)和反义链的3’端(3’侧)。即,在一些实施方案中,反义链3’端的侧翼区域,或有义链5’端的侧翼区域和反义链3’端的侧翼区域都由RNA组成。例如,本发明嵌合体或杂合体型双链分子含有下列组合。
有义链:5’-[DNA]-3’
        3’-(RNA)-[DNA]-5’:反义链,
有义链:5’-(RNA)-[DNA]-3’
        3’-(RNA)-[DNA]-5’:反义链,以及
有义链:5’-(RNA)-[DNA]-3’
        3’-(RNA)-5’:反义链。
所述上游部分区域可以是从双链分子有义或反义链中从靶序列或其互补序列的末端算起约9-13个核苷酸的结构域。此外,这些嵌合体型双链分子的实施方案包括那些具有长度为19-21个核苷酸的链,其中至少多核苷酸的上游半区(对于有义链5’侧的区域,对于反义链是3’侧区域)是RNA,而另一半是DNA。在该嵌合体型双链分子中,抑制靶基因表达的效果比反义链整体为RNA时强得多(美国专利申请号20050004064)。
在本发明中,双链分子可以形成发夹结构,例如,短发夹RNA(shRNA)和由DNA和RNA形成的短发夹(shD/R-NA)。shRNA或shD/R-NA是RNA序列或者RNA和DNA的混合物,其形成紧密发夹环,可以用来通过RNA干扰来沉默基因表达。所述shRNA或shD/R-NA在单一链上含有有义靶序列和反义靶序列,其中所述序列被环序列隔开。通常,发夹结构被细胞机构切割成dsRNA或dsD/R-NA,然后被结合到RNA诱导的沉默复合物(RISC)上。该复合物结合并切割与dsRNA或dsD/R-NA靶序列匹配的mRNA。
为了形成发夹环结构,可以在有义和反义序列之间设置由任意核苷酸序列形成的环序列。因此,本发明还提供具有通式5’-[A]-[B]-[A’]-3’的双链分子,其中[A]是含有靶序列的有义链,[B]是间插单链,[A’]是含有与[A]互补的序列的反义链。所述靶序列可以选自,例如,核苷酸
对于CDCA5 SEQ ID NO:40或SEQ ID NO:41;核苷酸,或
对于EPHA7 SEQ ID NO:42或SEQ ID NO:43;核苷酸
对于STK1 SEQ ID NO:38或SEQ ID NO:39;核苷酸
对于WDHD1 SEQ ID NO:44或SEQ ID NO:45;核苷酸
本发明不局限于这些实例,[A]中靶序列可以是在这些实例的基础上加以修饰的序列,只要所述双链分子保留抑制作为靶标的CDCA5、EPHA7、STK31或WDHD1基因表达,从而抑制或减少表达这些基因的细胞的能力。区域[A]与[A’]杂交形成含有区域[B]的环。间插单链部分[B],即环序列,长度可为3-23个核苷酸。例如,环序列可以选自下列序列(互联网ambion.com/techlib/tb/tb_506.html)。此外,由23个核苷酸组成的环序列也提供活性siRNA(Jacque JM et al.,Nature 2002 Jul 25,418(6896):435-8,Epub2002 Jun 26):
CCC、CCACC或CCACACC:Jacque JM et al.,Nature 2002 Jul 25,418(6896):435-8,Epub 2002 Jun 26;
UUCG:Lee NS et al.,Nat Biotechnol 2002 May,20(5):500-5;FruscoloniP et al.,Proc Natl Acad Sci USA 2003 Feb 18,100(4):1639-44,Epub 2003 Feb10;以及
UUCAAGAGA:Dykxhoorn DM et al.,Nat Rev Mol Cell Biol 2003 Jun,4(6):457-67。
具有本发明发夹环结构的示例性双链分子如下所示。在下列结构中,环序列可以选自AUG、CCC、UUCG、CCACC、CTCGAG、AAGCUU、CCACACC和UUCAAGAGA;然而,本发明不局限于此:
CDCA5的:
GCAGTTTGATCTCCTGGT-[B]-ACCAGGAGATCAAACTGC(靶序列SEQ ID NO:40)和
GCCAGAGACTTGGAAATG T-[B]-ACATTTCCAAGTCTC TG GC(靶序列SEQ ID NO:41);
EPHA7的:
AAAAGAGATGTTGCAGTA-[B]-TACTGCAACATCTCTTTT(靶序列SEQ ID NO:42)和
TAGCAAAGCTGACCAAGAA-[B]-TTCTTGGTCAGCTTTGCTA(靶序列SEQ ID NO:43);
STK31的:
GGAGATAGCTCTGGTTGAT-[B]-ATCAACCAGAGCTATCTCC(靶序列SEQ ID NO:38)和
GGGCTATTCTGTGGATGTT-[B]-AACATCCACAGAATAGCCC(靶序列SEQ ID NO:39);以及
WDHD1的:
GATCAGACATGTGCTATTA-[B]-TAATAGCACATGTCTGATC(靶序列SEQ ID NO:44)和
GGTAATACGTGGACTCCTA-[B]-TAGGAGTCCACGTATTACC(靶序列SEQ ID NO:45)。
此外,为了增强双链分子的抑制活性,可以将核苷酸“u”添加到靶序列反义链的3’末端,作为3’突出端。添加的“u”的数量至少是2个,通常是2-10个,例如2-5个。添加的“u”在双链分子反义链的3’末端形成单链。
制备双链分子的方法可以采用本领域公知的任何化学合成方法。根据化学合成方法,分别合成有义和反义单链多核苷酸,然后通过适当方法退火在一起来获得双链分子。在一个退火的实施方案中,将合成后的单链多核苷酸以至少约3∶7,例如约4∶6,例如基本上等摩尔量(即约5∶5的摩尔比)的摩尔比混合。接着,将混合物加热到双链分子解链的温度,再逐渐冷却。退火的双链多核苷酸可以通过本领域公知的通常使用的方法来纯化。纯化方法的实例包括利用琼脂糖凝胶电泳的方法,或其中任选地通过例如用适当的酶降解来去除其中剩余的单链多核苷酸的方法。
位于靶序列侧翼的调控序列可以是相同的或不同的,使它们的表达可以被独立地调节,或以时间性或空间性的方式调节。通过将CX基因模板克隆到含有例如来自小核RNA(snRNA)U6或人H1RNA启动子的RNA pol III转录单位的载体中,可以在细胞内转录双链分子
(ii)载体
本发明还包括含有一种或多种本文所述双链分子的载体和包含该载体的细胞。本发明载体以可表达的形式编码本发明双链分子。在这里,短语“以可表达的形式”表示当载体导入细胞时,载体将表达该分子。在一个实施方案中,载体包括双链分子表达所必需的调控元件。本发明的这些载体可以用于产生本发明的双链分子,或直接作为治疗癌症的活性成分。
本发明载体可以通过,例如,将含有靶序列的序列克隆到表达载体,以两条链都能表达(通过DNA分子转录)的方式将调控序列可操作地连接到该序列来产生(Lee NS et al.,Nat Biotechnol 2002 May,20(5):500-5)。例如,与mRNA反义的RNA分子由第一启动子(例如位于克隆序列3’末端的侧翼的启动子序列)来转录,而mRNA有义链的RNA分子由第二启动子(例如位于克隆序列5’末端侧翼的启动子序列)来转录。有义和反义链在体内杂交,产生用于基因沉默的双链分子构建体。或者,使用分别编码双链分子有义和反义链的两个载体构建体分别表达有义和反义链,接着形成双链分子构建体。此外,克隆的序列可以编码具有二级结构(例如发夹)的构建体;即,载体的单个转录物同时含有靶基因的有义和互补反义序列。
还可以对本发明载体进行配置以实现在靶细胞基因组中的稳定插入(参见,例如Thomas KR & Capecchi MR,Cell 1987,51:503-12,关于同源重组盒载体的描述)。参见,例如Wolff et al.,Science 1990,247:1465-8;美国专利5,580,859;5,589,466;5,804,566;5,739,118;5,736,524;5,679,647和WO98/04720。基于DNA的传递技术的实施方案包括“裸DNA”、辅助传递(布比卡因(bupivicaine)、聚合物、肽介导型)、阳离子脂质体复合物以及颗粒介导(“基因枪”)或压力介导型传递(参见,例如美国专利5,922,687)。
本发明载体可以是,例如,病毒或细菌载体。表达载体的实施方案包括减毒病毒宿主,例如牛痘或禽痘(参见,例如美国专利4,722,848)。该方法涉及使用痘苗病毒,例如作为表达编码双链分子的核苷酸序列的载体。在导入表达靶基因的细胞时,重组痘苗病毒表达所述分子从而抑制该细胞的增殖。可使用的载体的另一个例子包括卡介苗(BCG)。BCG载体在Stoveret al.,Nature 1991,351:456-60中有描述。各种其他载体都可以用于双链分子的治疗性施用和生产;实例包括腺病毒载体和腺伴随病毒载体、逆转录病毒载体、伤寒沙门氏菌(Salmonella typhi)载体、脱毒的炭疽毒素载体等。参见,例如Shata et al.,Mol Med Today 2000,6:66-71;Shedlock et al.,JLeukoc Biol 2000,68:793-806和Hipp et al.,In Vivo 2000,14:571-85。
(iii)采用双链分子抑制或减少癌细胞生长以及治疗或预防癌症的方法
在本发明中,对靶向上述靶序列的双链分子,分别检查它们抑制或减少(过)表达靶序列的细胞的生长的能力。本发明双链分子抑制或减少了(过)表达CX基因的癌细胞的生长;本发明双链分子抑制或减少了(过)表达CX基因的细胞的生长;两种双链分子抑制了CDCA5(过)表达细胞例如肺癌细胞系A549和LC319的生长(图2A和B,中图和下图);两种双链分子抑制了EPHA7表达细胞例如肺癌细胞系NCI-H520和SBC-5的生长(图6A,中图和下图);两种双链分子抑制了STK31表达细胞例如肺癌细胞系LC319和NCI-H2170的生长(图11B和C);两种双链分子抑制了WDHD1表达细胞例如肺癌细胞系LC319和TE9的生长(图15A,中图和下图)。
因此,本发明提供一种方法,其通过抑制CX基因的表达来抑制细胞生长,即来自如下所述之癌症的细胞的癌性细胞生长:所述癌症由CX基因过表达引起或由CX基因介导。CX基因的表达可以由:特异靶向互补CX基因之表达的任何如上所述的本发明双链分子,或可表达任何所述双链分子的本发明载体,来加以抑制。
本发明双链分子和载体的这种抑制癌细胞生长的能力表明它们可以用于介导治疗由CX基因过表达引起或由CX基因的癌症的方法。因此,本发明提供治疗患有由CX基因过表达引起或由CX基因介导的癌症患者的方法,所述方法施用针对CX基因的双链分子,即抑制性核酸,或表达该分子的载体,而不产生不良反应,因为那些基因在正常器官中几乎检测不到。
具体地,本发明提供下列方法[1]-[22]:
[1]用于抑制或减少(过)表达CX基因的细胞的生长的方法,所述CX基因选自CDCA5、EPHA7、STK31和WDHD1;或用于治疗或预防(过)表达选自CDCA5、EPHA7、STK31和WDHD1的基因的癌症的方法,其中,所述方法包括给予至少一种双链分子的步骤,其中所述双链分子被导入细胞,并抑制或减少所述CX基因的体内表达。
[2][1]的方法,其中所述双链分子对mRNA起作用,所述mRNA与如下所述的靶序列具有序列同一性或与之互补,所述靶序列选自:对于CDCA5,SEQ ID NO:40(SEQ ID NO:1的位置808-827nt)和SEQ ID NO:41(SEQ ID NO:1的位置470-488nt);对于EPHA7,SEQ ID NO:42(SEQ IDNO:3位置2182-2200nt)和SEQ ID NO:43(SEQ ID NO:3的位置1968-1987nt);对于STK31,SEQ ID NO:38(SEQ ID NO:5的位置1713-1732nt)和SEQ ID NO:39(SEQ ID NO:5的位置2289-2308nt);对于WDHD1,SEQ ID NO:44(SEQ ID NO:7的位置577-596nt)和SEQ IDNO:45(SEQ ID NQ:7位置2041-2060nt)。
[3][2]的方法,其中所述双链分子含有有义链和与其互补的反义链,二者相互杂交形成双链,其中所述有义链含有与选自CDCA5的SEQ ID NO:40和SEQ ID NO:41;EPHA7的SEQ ID NO:42和SEQ ID NO:43;STK31的SEQ ID NO:38和SEQ ID NO:39;WDHD1的SEQ ID NO:44和SEQ IDNO:45的序列相对应的寡核苷酸。
[4][1]的方法,其中施用多种双链分子;在一些实施方案中,所述双链分子包含不同的核酸序列。
[5][4]的方法,其中所述多种双链分子靶向相同的基因;
[6][1]的方法,其中双链分子长度小于约100个核苷酸;
[7][6]的方法,其中双链分子长度小于约75个核苷酸;
[8][7]的方法,其中双链分子长度小于约50个核苷酸;
[9][8]的方法,其中双链分子长度小于约25个核苷酸;
[10][9]的方法,其中双链分子长度在约19-约25个核苷酸之间;
[11][1]的方法,其中所述双链分子由单个寡核苷酸组成,所述单个寡核苷酸含有通过间插单链连接在一起的有义和反义链。
[12][11]的方法,其中所述双链分子具有通式5’-[A]-[B]-[A’]-3’,其中
[A]是含有与选自SEQ ID NO:40和SEQ ID NO:41(对于CDCA5)、SEQID NO:42和SEQ ID NO:43(对于EPHA7)、SEQ ID NO:38和SEQ ID NO:39(对于STK31)、SEQ ID NO:44和SEQ ID NO:45(对于WDHD1)的序列对应的寡核苷酸的有义链;
[B]是间插单链;并且
[A’]是含有与[A]中所选序列互补的序列相对应的寡核苷酸的反义链。
[13][1]的方法,其中双链分子含有RNA。
[14][1]的方法,其中双链分子含有DNA和RNA。
[15][14]的方法,其中双链分子是DNA多核苷酸和RNA多核苷酸的杂合体。
[16][15]的方法,其中有义链和反义链多核苷酸分别由DNA和RNA形成。
[17][14]的方法,其中双链分子是DNA和RNA的嵌合体。
[18][17]的方法,其中有义和反义多核苷酸中的一个或两者的5’-末端侧翼区由RNA形成。
[19][18]的方法,其中侧翼区由9-13个核苷酸组成。
[20][1]的方法,其中双链分子含有3’突出端。
[21][1]的方法,其中双链分子由载体编码。
[22][21]的方法,其中所述双链分子具有通式5’-[A]-[B]-[A’]-3’,其中
[A]是含有与选自SEQ ID NO:40和SEQ ID NO:41(对于CDCA5)、SEQ以利用针对选自相同CX基因的一个、两个或多个靶序列的双链分子。
为了抑制细胞生长,可以将本发明双链分子以能够实现与对应的mRNA转录物的结合的形式直接导入细胞。另外,如上文所述,可以将编码双链分子的DNA作为载体导入细胞。为了将双链分子和载体导入细胞,可以采用转染增强剂,例如FuGENE(Roche diagnostics)、Lipofectamine 2000(Invitrogen)、Oligofectamine(Invitrogen)以及Nucleofector(Wako pureChemical)。
如果治疗产生临床效益,例如,受试者中CX基因的表达减少、或癌症尺寸减少、普遍性(prevalence)或转移潜力减小,则认为该治疗有效。当预防性地适用治疗时,“有效”表示其延缓或阻止癌症形成、或阻止或减轻癌症的临床症状。有效性可以结合特定肿瘤类型的任何公知的诊断或治疗方法来确定。
应当理解的是,本发明双链分子以亚化学计量的量来降解靶mRNA(CX基因转录物)。不希望受任何理论的约束,相信本发明双链分子以催化的方式使靶mRNA降解。因此,与常规癌症治疗方法相比,为发挥治疗效果而需要投递到癌症部位或其邻近的双链分子要少的多。
本领域技术人员在考虑一些因素,例如体重、年龄、性别、疾病类型、受试者的症状和其它条件;给药途径、以及是局部还是全身给药的基础上,能够容易地确定向给定受试者施用的本发明双链分子的有效量。通常,本发明双链分子的有效量包括在癌症部位或其邻近约1纳摩尔(nM)-约100nM的胞间浓度,例如约2nM-约50nM,例如约2.5nM-约10nM。预想也可以施用更多或更少量的双链分子。
本方法可以用于抑制癌症的生长或迁移;例如,由CX基因过表达引起的癌症或由CX基因介导的癌症,例如,肺癌或食道癌。尤其是,针对如下所述的靶序列的双链分子可用于治疗癌症,所述靶序列选自:对于CDCA5,SEQ ID NO:40(SEQ ID NO:1的位置808-827nt)和SEQ ID NO:41(SEQ IDNO:1的位置470-488nt);对于EPHA7SEQ ID NO:42(SEQ ID NO:3的位置2182-2200nt)和SEQ ID NO:43(SEQ ID NO:3的位置1968-1987nt);对于STK31,SEQ ID NO:38(SEQ ID NO:5的位置1713-1732nt)和SEQ IDNO:39(SEQ ID NO:5的位置2289-2308nt);对于WDHD1,SEQ ID NO:44(SEQ ID NO:7的位置577-596nt)和SEQ ID NO:45(SEQ ID NO:7的位置2041-2060nt)。
为了治疗癌症,例如由CX基因促进的癌症,还可以将本发明双链分子与不同于双链分子的药剂联合施用给受试者。或者,可以将本发明双链分子与为治疗癌症所设计的其它治疗方法联合施用受试者。例如,本发明双链分子可以与目前用于治疗癌症或阻止癌症转移的治疗方法(例如,放射疗法、外科手术和采用化疗剂的治疗,例如顺铂、卡铂、环磷酰胺、5-氟尿嘧啶、阿霉素、柔红霉素(daunorubicin)或他莫昔芬(tamoxifen))联合施用。
在本方法中,将双链分子作为裸双链分子与递送试剂结合,或作为表达双链分子的重组质粒或病毒载体施用给受试者。
用于与本发明双链分子联合施用的适合的传递作用剂包括MirusTransit TKO亲脂性试剂;lipofectin;lipofectamine;cellfectin或多聚阳离子(例如,多聚赖氨酸)或脂质体(liposomes)。在一个实施方案中,递送试剂是脂质体(liposomes)。
脂质体有助于将双链分子递送到特定组织,例如视网膜或肿瘤组织,还可以增加双链分子的血液半衰期。本发明适用的脂质体是由标准的成膜脂质(vesile-forming lipids)形成的,成膜脂质通常包括中性或带负电荷的磷脂和固醇,例如胆固醇。对一些因素的考虑通常可以为脂质的选择提供指导,例如所需的脂质体大小和其在血流中的半衰期。制备脂质体的各种方法是公知的,例如在Szoka et al.,Ann Rev Biophys Bioeng 1980,9:467和USPat.Nos.4,235,871;4,501,728;4,837,028以及5,019,369中所描述的,以提述的方式将其全部内容并入本文中。
在一些实施方案中,包封本发明双链分子的脂质体含有配体分子,所述配体分子可以将脂质体递送到癌症部位。与肿瘤或血管内皮细胞中普遍存在的受体相结合的配体,例如结合肿瘤抗原或内皮细胞表面抗原的单克隆抗体,是有用的。
在一些实施方案中,对包封本发明双链分子的脂质体进行修饰,以避免被单核巨噬细胞和网状内皮系统清除,例如其结构的表面结合有调理作用抑制模块(opsonization-inhibition moieties)。在一个实施方案中,本发明脂质体可以同时含有调理作用抑制模块和配体。
用于制备本发明的脂质体的调理作用抑制部分通常是与脂质体膜结合的大型亲水性聚合物。如在本说明书中所使用的,例如,当调理作用抑制部分化学地或物理地搭接在膜上时,例如通过脂溶性锚(anchor)插入膜本身,或者通过与膜脂质的活性基团直接结合,则调理作用抑制部分与脂质体膜“结合”。这些调理作用抑制性亲水性聚合物形成保护性表层,显著地减少单核巨噬细胞系统(“MMS”)和网状内皮系统(”RES”)对脂质体的摄入;在例如美国专利第4,920,016号中对此有记载,后者的全部公开内容援引并入本说明书。因此,与未修饰的脂质体相比,被调理作用抑制部分修饰过的脂质体能够保留在血液循环中的时间显著更长。出于以上理由,上述脂质体有时也被称为“隐形”(stealth)脂质体。
已知隐形脂质体蓄积在依靠多孔性或“渗漏性”微血管系统供给的组织中。因此,在以这样的微血管系统缺损为特征的靶组织,例如实体瘤中,这些脂质体会高效率地蓄积。参见Gabizon等,Proc Natl Acad Sci USA 1988,18:6949-53。此外,由于RES的摄入的减少,防止隐形脂质体在肝脏和脾脏中的显著蓄积,从而降低隐形脂质体的毒性。因此,用调理作用抑制部分修饰的本发明的脂质体能够将本发明的双链核酸分子输送至肿瘤细胞。
适用于修饰脂质体的调理作用抑制部分优选为分子量约500~约40,000道尔顿、更优选约2,000~约20,000道尔顿的水溶性聚合物。这样的聚合物中包括聚乙二醇(PEG)或聚丙二醇(PPG)衍生物;例如,甲氧基PEG或PPG、和PEG或PPG硬脂酸酯;合成聚合物如聚丙烯酰胺或聚N-乙烯基吡咯烷酮;直链状、分枝状或者树状聚酰胺胺(polyamidoamine);聚丙烯酸;多元醇,诸如化学结合有羧基或氨基的聚乙烯醇和聚木糖醇,以及神经节苷脂,诸如神经节苷脂GM1。PEG、甲氧基PEG、或甲氧基PPG或其衍生物的共聚体也是适合的。此外,抑制调理作用的聚合物可以是PEG与聚氨基酸、多糖、聚酰胺胺、聚亚乙基胺或者多核苷酸中的任何一种的嵌段共聚物。抑制调理作用的聚合物还可以是含有氨基酸或羧酸的天然多糖,例如半乳糖醛酸、葡糖醛酸、甘露糖醛酸、透明质酸、果胶酸、神经氨酸、海藻酸、角叉胶;氨基化多糖类或寡糖(直链状或者分枝状);或者羧基化的多糖或寡糖,例如,与碳酸的衍生物反应而生成了羧基结合的羧基化多糖类或寡糖。
在一些实施方案中,调理作用抑制部分是PEG、PPG或其衍生物。用PEG或PEG衍生物修饰的脂质体有时称作“PEG化脂质体”。
调理作用抑制部分可以通过许多公知技术中的任何一种结合到脂质体膜上。例如,PEG的N-羟基琥珀酰亚胺酯能够与磷脂酰乙醇胺脂溶性锚(lipid-soluble anchor)结合,然后再结合到膜上。相似地,可以通过还原性氨基化,用硬脂酰胺脂溶性锚来将右旋糖酐聚合物衍生化,所述还原性氨基化中使用Na(CN)BH3和混合溶剂,如60℃的四氢呋喃与水的30∶12比例混合物。
上文中讨论了表达本发明的双链分子的载体。这样的表达至少一种本发明的双链核酸分子的载体也可以直接施用或者与合适的投递试剂,包括Mirus Transit
Figure GPA00001115063300571
脂溶性试剂、lipofectin、lipofectamine、cellfectin、聚阳离子(例如聚赖氨酸)或脂质体等组合施用。将表达本发明的双链核酸分子的重组病毒载体投递到患者的癌症区域的方法在本技术领域的技术范围内。
本发明双链分子可以通过任何适合于将双链分子递送到癌症部位的方式来给受试者施用。例如,双链分子可以通过基因枪、电穿孔或通过其它适合非消化道或肠内的给药途径来施用。
适合的肠内给药途径包括经口、直肠或鼻内递送。
合适的非消化道施用途径包括静脉内施用(例如静脉内推注、静脉内输注、动脉内推注、动脉内输注和向血管网络中的导管滴注),组织周围和组织内注射(例如肿瘤周围和肿瘤内注射),皮下注射或沉积,包括皮下输注(例如利用浸透压泵),直接施加到癌症区域或其附近,例如借助导管或其它放置装置(例如,包含多孔性、非多孔性或明胶状材料的视网膜片剂(retinal pellet)或栓剂或植入物),和吸入。在一些实施方案中,通过注射或输注将双链核酸分子或载体施用到癌症部位或其附近。
本发明双链分子可以采用单一剂量或分多个剂量施用。当经输注施用本发明双链分子时,输注可以是单一的持续剂量或可以经多次输注递送。可以直接将作用剂注射到癌症组织或邻近癌症部位。可以将作用剂多次注射到癌症组织或邻近癌症部位
为了将本发明双链分子施用给给定受试者,本领域技术人员也可以容易地确定合适的给药方案。例如,可以将双链分子一次性施用给受试者,例如作为单次注射或或者沉积的形式施用到癌症部位或邻近癌症部位。或者,双链分子可以在约3-28天、例如约7-10天的期间内每天一次或两次施用给受试者。在一个示例性的给药方案中,双链分子可以在7天内每天一次地注射到癌症部位或邻近癌症部位。当给药方案包括多次给药时,应当理解的是,给受试者施用的双链分子的有效量可以包括在整个给药方案中施用的该双链分子的总量。
(iv)组合物
此外,本发明提供含有至少一种本发明双链分子或编码该分子的载体的药物组合物。具体地,本发明提供下列组合物[1]-[24]:
[1]用于抑制或减少细胞生长的组合物,所述细胞表达选自CDCA5、EPHA7、STK31和WDHD1的基因,或用于治疗或预防表达CX基因的癌症的组合物,所述CX基因选自CDCA5、EPHA7、STK31和WDHD1,所述组合物含有至少一种双链分子,其中将所述双链分子导入细胞,抑制或减少所述基因的体内表达。
[2][1]的组合物,其中所述双链分子对mRNA起作用,所述mRNA与选自SEQ ID NO:40(SEQ ID NO:1的位置808-827nt)和SEQ ID NO:41(SEQ ID NO:1的位置470-488nt)(对于CDCA5)、SEQ ID NO:42(SEQ IDNO:3的位置2182-2200nt)和SEQ ID NO:43(SEQ ID NO:3的位置1968-1987nt)(对于EPHA7)、SEQ ID NO:38(SEQ ID NO:5的位置1713-1732nt)和SEQ ID NO:39(SEQ ID NO:5的位置2289-2308nt)(对于STK31)、SEQ ID NO:44(SEQ ID NO:7的位置577-596nt)和SEQ ID NO:45(SEQ ID NO:7的位置2041-2060nt)(对于WDHD1)的靶序列匹配。
[3][2]的组合物,其中所述双链分子含有有义链和与其互补的反义链,二者相互杂交形成双链,其中所述有义链含有与选自SEQ ID NO:40和SEQ ID NO:41(对于CDCA5)、SEQ ID NO:42和SEQ ID NO:43(对于EPHA7)、SEQ ID NO:38和SEQ ID NO:39(对于STK31)、SEQ ID NO:44和SEQ ID NO:45(对于WDHD1)的序列相对应的寡核苷酸。
[1]的组合物,其中要治疗的癌症是由CX基因过表达引起的癌症,或由CX基因介导的癌症。
[4][1]的组合物,其中要治疗的癌症是肺癌或食道癌;
[5][4]的组合物,其中所述肺癌是小细胞肺癌或非小细胞肺癌;
[6][1]的组合物,其中所述组合物含有多种所述的双链分子;
[7][6]的组合物,其中所述多种双链分子靶向相同的基因;
[8][1]的组合物,其中所述双链分子长度小于约100个核苷酸;
[9][8]的组合物,其中所述双链分子长度小于约75个核苷酸;
[10][9]的组合物,其中所述双链分子长度小于约50个核苷酸;
[11][10]的组合物,其中所述双链分子长度小于约25个核苷酸;
[12][11]的组合物,其中所述双链分子长度在约19-约25个核苷酸之间;
[13][1]的组合物,其中所述双链分子由单个寡核苷酸组成,所述单个寡核苷酸包含通过间插单链连接的有义和反义链。
[14][13]的组合物,其中所述双链分子具有通式5’-[A]-[B]-[A’]-3’,其中
[A]是含有与选自SEQ ID NO:40和SEQ ID NO:41(对于CDCA5)、SEQID NO:42和SEQ ID NO:43(对于EPHA7)、SEQ ID NO:38和SEQ ID NO:39(对于STK31)、SEQ ID NO:44和SEQ ID NO:45(对于WDHD1)的序列相对应的寡核苷酸的有义链;
[B]是间插单链;并且
[A’]是含有与[A]中所选序列互补的序列相对应的寡核苷酸的反义链。
[15][1]的组合物,其中所述双链分子含有RNA;
[16][1]的组合物,其中所述双链分子含有DNA和RNA;
[17][16]的组合物,其中双链分子是DNA多核苷酸和RNA多核苷酸的杂合体;
[18][17]的组合物,其中有义链和反义链多核苷酸分别由DNA和RNA形成;
[19][18]的组合物,其中所述双链分子是DNA和RNA的嵌合体;
[20][19]的组合物,其中有义和反义多核苷酸中一个或两者的5’-末端侧翼区由RNA组成。
[21][20]的组合物,其中侧翼区由9-13个核苷酸组成;
[22][1]的组合物,其中双链分子含有3’突出端;
[23][1]的组合物,其中双链分子由载体编码并且包含在组合物中;
[24][1]的组合物,其进一步含有转染增强剂、细胞通透剂和药学上可接受的载体。
将在下文中更详细地描述本发明方法。
根据本领域公知技术,向受试者施用之前,可以将本发明双链分子配制成药学组合物。本发明药学组合物具有至少灭菌和无热原的特征。正如本说明书中所使用的,“药物制剂”包括用于人用和兽医用的制剂。用于制备本发明药物组合物的方法在本领域的技术范围之内,例如,在Remington’sPharmaceutical Science,17th ed.,Mack Publishing Company,Easton,Pa.(1985)中所描述的,以提述的方式将其全部内容并入本文中。
本发明药物制剂含有至少一种本发明双链分子或编码所述双链分子的载体(例如,以重量计0.1-90%)、或所述分子的生理上可接受的盐,与生理上可接受的载体培养液混合。示例性的生理上可接受的载体培养液包括,例如水、缓冲水(buffered water)、生理盐水、0.4%盐水、0.3%甘氨酸、透明质酸等。
根据本发明,所述组合物可以包含多种类型的双链分子,每种分子都可以针对CX基因的相同靶序列,或不同靶序列。例如,所述组合物可以包含针对CX基因的双链分子。或者,例如,所述组合物可以包含针对选自CX基因的一个、两个或更多个靶序列的双链分子。
此外,本发明组合物可以包含编码一个或多个双链分子的载体。例如,所述载体可以编码一种、两种或多种本发明双链分子。或者,本发明组合物可以包含多种载体,每种载体均编码不同的双链分子。
此外,本发明双链分子可以作为脂质体包含在本发明组合物中。关于脂质体细节参见“治疗癌症的方法”项。
本发明药物组合物还可以含有常规的药用赋形剂和/或添加剂。适合的药用赋形剂包括稳定剂、抗氧化剂、渗透压调节剂(osmolality adjustingagents)、缓冲液和pH调节剂。适合的添加剂包括生理学生物相容性缓冲液(例如氨基丁三醇氢氧化物)、补加螯合剂(例如DTPA或DTPA-双酰胺)或钙螯合剂复合物(例如DTPA钙、CaNaDTPA-双酰胺)、或者,任选地,添加钙或钠盐(例如氯化钙、抗坏血酸酸钙、葡糖酸钙或乳酸钙)。本发明药物组合物可以进行包装以作为液体使用,或者也可以加以冷冻干燥。
对于固体组合物,可以采用常规的无毒性固体载体;例如,药用级的甘露醇、乳糖、淀粉、硬脂酸镁、糖精钠、滑石、纤维素、葡萄糖、蔗糖、碳酸镁等。
例如,用于口服施用的固体药物组合物可以含有上面所列的任何载体和赋形剂,以及10-95%的本发明的一种或多种双链分子,例如25-75%。用于气雾剂施用(吸入)的药物组合物可以含有以重量计0.01-20%,例如以重量计1-10%的包被于上述脂质体中的一种或多种本发明双链分子以及推进剂(propellant)。还可以视需要包含载体;例如,用于鼻内递送的卵磷脂。
除了上述内容外,本发明组合物还可以包含其它药物活性成分,只要它们不抑制本发明双链分子的体内功能。例如,所述组合物可以包含通常用于治疗癌症的化疗剂。
本发明还提供了本发明双链核酸分子在制造用于治疗CX基因(过)表达的癌症的药物组合物中的用途。例如,本发明涉及下述双链核酸分子在制造用于治疗(过)表达CX基因的癌症的药物组合物方面的用途,所述双链核酸分子抑制细胞中CX基因的(过)表达,所述细胞过表达该基因,其中CX基因选自CDCA5、EPHA7、STK31和WDHD1,为了,所述分子含有有义链和与其互补的反义链,二者相互杂交形成双链核酸分子,并靶向选自SEQ ID NO:38-45的序列。
本发明进一步提供了制造用于治疗(过)表达CX基因的癌症的药物组合物的方法或过程,其中所述方法或过程包括将药用或生理上可接受的载体与作为活性成分的、能够抑制细胞中CX基因(过)表达的双链核酸分子配制在一起的步骤,所述细胞过表达该基因,其中CX基因选自CDCA5、EPHA7、STK31和WDHD1,所述分子含有有义链和与其互补的反义链,二者相互杂交形成双链核酸分子,并靶向选自SEQ ID NOs:38-45的序列。
本发明还提供了用于制造用于治疗(过)表达CX基因的癌症的药物组合物的方法或过程,其中该方法或过程包括混合活性成分与药学上或生理学上可接受的载体的步骤,其中该活性成分是抑制细胞CX基因表达的双链核酸分子,所述细胞过表达该基因,其中CX基因选自CDCA5、EPHA7、STK31和WDHD1,所述分子含有有义链和与其互补的反义链,二者相互杂交形成双链核酸分子,并靶向选自SEQ ID NO:38-45的序列。
诊断CX基因介导的癌症的方法
发现与对应的正常组织相比,CX基因表达水平在肺癌和食道癌组织中显著提高(图1CDCA5;图3EPHA7;图9STK31和图13WDHD1)。因此,在本说明书中经鉴定的基因及其转录和翻译产物可以用作一种或多种CX基因介导的癌症的诊断标志物,并且通过测量从疑似癌症的患者来源的样品中CX基因的表达,可以诊断这些癌症。具体地,本发明提供了一种通过测定受试者中CX基因的表达水平来诊断一种或多种由CX基因介导的癌症的方法。可通过本方法诊断的、由CX促进的癌症,包括肺癌和食道癌。肺癌包括非小细胞肺癌和小细胞肺癌。所述CX基因可以选自CDCA5、EPHA7、STK31和WDHD1。
根据本发明,可以提供用于检查受试者状况的中间结果。这些中间结果可以与其他信息组合来帮助医生、护士或其他从业者来确诊受试者患有该疾病。或者,本发明可以用于检测来源于受试者的组织中的癌细胞,并且给医生提供有用信息来诊断受试者患有该疾病。
具体地,本发明提供了下列方法[1]-[10]:
[1]一种诊断癌症,例如由CX基因介导或促进的癌症的方法,其中所述方法包括下列步骤:
(a)对生物样品中选自CDCA5、EPHA7、STK31和WDHD1的基因表达水平进行检测;并且
(b)将该基因与其正常对照水平相比表达水平的增加与该疾病相关联。
[2][1]的方法,其中所述表达水平比正常对照水平至少高10%。
[3][2]的方法,其中表达水平通过下列任一种方法来检测:
(a)检测编码多肽的mRNA,所述多肽选自CDCA5、EPHA7、STK31和WDHD1;
(b)检测多肽,所述多肽选自CDCA5、EPHA7、STK31和WDHD1;并且
(c)检测多肽的生物学活性,所述多肽选自CDCA5、EPHA7、STK31和WDHD1。
[1]的方法,其中所述癌症由CX基因过表达引起,或由CX基因介导或促进。
[4][1]的方法,其中所述癌症是肺癌或食道癌。
[5][4]的方法,其中所述肺癌是非小细胞肺癌或小细胞肺癌。
[6][3]的方法,其中通过检测探针与编码多肽的基因转录物的杂交来确定表达水平,所述多肽选自CDCA5、EPHA7、STK31和WDHD1。
[7][3]的方法,其中通过检测抗体与多肽的结合来确定表达水平,所述多肽选自CDCA5、EPHA7、STK31和WDHD1。
[8][1]的方法,其中所述生物样品包括活组织检查物、痰或血液。
[9][1]的方法,其中受试者来源的生物样品包括上皮细胞、血清、胸腔积液或食道粘液。
[10][1]的方法,其中受试者来源的生物样品包括癌细胞。
[11][1]的方法,其中受试者来源的生物样品包括癌性上皮细胞。
在下文中将对诊断癌症的方法进行更详细的描述。
通过本方法诊断的受试者可以是哺乳动物。示例性的哺乳动物包括,但不限于,例如人、非人灵长类、小鼠、大鼠、狗、猫、马和牛。
在进行本方法时,从待诊断的受试者中收集生物样品来进行诊断。任何生物材料都可以用作供测定的生物样品,只要其含有CX基因的目标转录或翻译产物。所述生物样品包括,但不限于,身体组织和体液,例如血液,诸如血清、痰、尿液和胸腔积液。在一些实施方案中,所述生物样品包括含有上皮细胞,例如癌性上皮细胞或来源于疑似癌性的组织的上皮细胞,的细胞群。或者,如果有必要的话,可以从所获得的身体组织和体液中纯化出所述细胞,然后用作生物样品。
根据本发明,测定CX基因在受试者来源的生物样品中的表达水平。可以采用本领域公知方法在转录(核酸)产物水平上确定该表达水平。例如,可以通过杂交方法(例如Northern印迹分析)使用探针对CX基因的mRNA进行定量。所述检测可以在芯片或阵列上进行。阵列可以用于检测包括CX基因在内的多个基因(例如各种癌特异基因)的表达水平。本领域技术人员可以利用CDCA5(SEQ ID NO:1;GenBank登录号BC011000)、EPHA7(SEQ ID NO:3;GenBank登录号NM_004440)、STK31(SEQ ID NO:5;GenBank登录号NM_032944.1)或WDHD1(SEQ ID NO:7;GenBank登录号NM_007086.2)的序列信息来制备所述探针。例如,CX基因的cDNA可以用作探针。如果有必要的话,可以用合适的标记物,例如染料、荧光和同位素,对探针进行标记,然后基因表达水平可以作为杂交标记强度来加以检测(参见(4)[实施例1]中Northern印迹分析)。
此外,可以通过基于扩增的检测方法(例如RT-PCR)采用引物对CX基因的转录产物进行定量。也可以根据该基因可获得的序列信息制备所述引物。例如,实施例中所使用的引物(CDCA5:SEQ ID NO:11和12或SEQID NO:19和20;EPHA7:SEQ ID NO:13和14;STK31:SEQ ID NO:15和16或SEQ ID NO:21和16;以及WDHD1:SEQ ID NO:17和18或SEQID NO:22和18)可以用于通过RT-PCR或Northern印迹的检测,但是本发明不局限于此(参见,[实施例1](3)半定量RT-PCR和(4)Northern印迹分析)。
具体地,用于本方法的探针或引物在严格条件、中等严格或低严格条件下与CX基因的mRNA杂交。
或者,可以检测翻译产物以用于本发明的诊断。例如,可以测定CX蛋白的量。用于测定作为翻译产物的蛋白的量的方法包括采用特异识别该蛋白的抗体的免疫测定方法。所述抗体可以是单克隆或多克隆的。此外,抗体的任何片段或修饰(例如,嵌合抗体、scFv、Fab、F(ab’)2、Fv等)都可以用于检测,只要所述片段保留与CX蛋白的结合能力。这些用于检测蛋白的抗体的制备方法是本领域公知的,本发明可以采用任何方法制备所述抗体和其等价物(参见(2)“抗体定义”)。
作为根据CX基因翻译产物检测其表达水平的另一种方法,可以采用针对CX蛋白的抗体通过免疫组织化学分析观察染色强度。即,观察到强染色表示存在的蛋白增加并且同时CX基因表达水平高(参见,[实施例1]中(8)免疫组织化学和组织微阵列分析)。
此外,除了CX基因表达水平之外,也可以测定其它癌症相关基因,例如已知在癌症中差异表达的基因,的表达水平,来提高诊断的准确性。
如果生物样品中包括CX基因在内的癌症标记基因的表达水平比相应癌症标志基因(例如,在正常或非癌性细胞中)的对照水平增加,例如,10%、25%或50%;或增加到大于1.1倍、大于1.5倍、大于2.0倍、大于5.0倍、大于10.0倍或更多,则可以认为其表达水平增加。
对照水平可以与生物样品同时确定,使用先前从已知疾病状态(癌或非癌)的受试者所收集和保存的样品来确定。或者,可以用基于对先前确定的已知疾病状态的受试者来源的样品中CX基因表达水平分析所获结果的统计方法确定对照水平。此外,所述对照水平可以是来自先前检验过的细胞的表达模式数据库。此外,根据本发明的一个方面,可以将CX基因在生物样品中的表达水平与多个对照水平进行比较,所述多个对照水平是从多个参比样品确定的。在一些实施方案中,对照水平采用参比样品来确定,所述参比样品来自与患者来源的生物样品类似的组织类型。在一些实施方案中,采用已知疾病状态的群体中CX基因表达水平的标准值。标准值可以通过本领域公知的任何方法获得。例如,标准值可以使用平均值+/-2倍标准差或平均值+/-3倍标准差的范围。
在本发明语境下,根据从已知非癌性的生物样品确定的对照水平称作“正常对照水平”。另一方面,如果根据癌性生物样品来确定对照水平,则将其称作“癌对照水平”。
当CX基因表达水平与正常对照水平相比发生增加或类似于癌对照水平时,可以将受试者诊断为患有癌症或有患癌症风险,所述癌症例如由CX基因介导的癌症或由CX基因过表达引起的癌症。此外,在对多个CX基因表达水平进行比较的情况下,样品和癌性参比之间基因表达模式的相似性表明受试者患有癌症或有患癌症的风险,所述癌症例如由CX基因介导的癌症或由CX基因过表达引起的癌症。
可以依据对照核酸的表达水平对检验生物样品表达水平和对照水平之间的差异进行标准化,所述对照核酸已知其表达水平不会取决于细胞的癌或非癌状态而发生变化,例如持家基因。示例性的对照基因包括,但不限于,β肌动蛋白、3-磷酸甘油醛脱氢酶和核糖体蛋白P1。
CX基因介导的癌症的预后评价方法
本发明部分上根据这一发现,即EPHA7、STK31或WDHD1的(过)表达与患有CX基因介导癌症,例如肺癌或食道癌,的患者的预后更差显著相关。因此,本发明提供确定或评价癌症,例如CX基因介导的癌症或由CX基因过表达引起的癌症,例如肺癌和/或食道癌,患者预后的方法,所述方法检测EPHA7、STK31或WDHD1基因在患者生物样品中的表达水平;将检测到的表达水平与对照水平比较;将与对照水平相比增加的表达水平确定作为预后不良(不良的存活率)的指标。
在本文中,术语“预后”是指由病例性质和症状所提示的、对疾病可能的结果以及疾病恢复前景的预测。相应地,较差(less favorable)预后、负面预后或预后不良被定义为治疗后存活期或存活率较低。相反地,正面预后、预后良好(favorable or good)被定义为治疗后存活期或存活率提高。
术语“评价预后”是指预测、预报患者癌症的未来结果(例如恶性肿瘤、治愈癌症的可能性、估计的存活时间等)、或者将一定的检测或测定结果与患者癌症的未来结果相联系的能力。例如,测定EPHA7、STK31或WDHD1的经时表达水平能够预测患者的结果(例如,恶性增加或减少、癌症等级增加或减少、治愈癌症可能性、存活等)。
在本发明的语境下,短语“评价(或确定)预后”试图包括癌症进展的预测和可能性分析、尤其是癌症的复发、转移性传播以及病情反复。本发明的预后评价方法意图在临床上用于作出关于治疗方式的决定,所述治疗方式包括治疗性干预、诊断标准,例如疾病分期、疾病监测以及对肿瘤性疾病转移或反复的监控。
本方法所使用的患者来源的生物样品可以是来源于待评价的受试者的任何样品,只要可以在该样品中检测到EPHA7、STK31或WDHD1基因。在一些实施方案中,所述生物样品含有肺细胞(自肺或食道获得的细胞)。此外,所述生物样品包括体液,例如痰、血液、血清、血浆、胸腔积液、食道粘液等。此外,所述样品可以是从组织纯化的细胞。所述生物样品可以从不同时间点的患者获得,包括治疗前、治疗中和/或治疗后。
根据本发明,证实在患者来源的生物样品中测得的EPHA7、STK31或WDHD1基因的表达水平越高,治疗后缓解、恢复和/或存活的预后越差并且不良临床结果的可能性越高。因此,根据本方法,用于比较的“对照水平”可以是,例如:在经过治疗后表现出良好或正面癌症预后的个体或群体,在接受任何治疗之前被检出的EPHA7、STK31或WDHD1基因表达水平,在本文中将其称为“良好预后对照水平”。或者,“对照水平”可以是在经过治疗后表现出不良或负面癌症预后的个体或群体,在接受任何治疗之前被检出的EPHA7、STK31或WDHD1基因表达水平,在本文中将其称为“不良预后对照水平”。所述“对照水平”是一种单独的表达模式,其衍生自单个参比群体,或者衍生自多种表达模式。因此,对照水平可以在下述基础上确定:在对癌症患者或已知疾病状态(预后良好或预后不良)的患者群体进行任何治疗之前,所检测到的EPHA7、STK31或WDHD1基因表达水平。在一些实施方案中,所述癌症是肺癌。在一些实施方案中,采用EPHA7、STK31或WDHD1基因在已知疾病状态的患者组中的表达水平的标准值。标准值可以通过本领域公知的任何方法获得。例如,平均值+/-2倍标准差或平均值+/-3倍标准差的范围可以用作标准值。
对照水平可以与被检的生物样品同时确定,对照水平的确定采用在进行任何治疗之前预先从已知疾病状态(预后良好或预后不良)的癌症患者(对照或对照组)收集和保存的样品。
或者,可以基于对先前从对照组收集和保存的样品中EPHA7、STK31或WDHD1基因表达水平的分析所获的结果,用统计方法确定对照水平。此外,所述对照水平可以是来自先前检验的细胞或患者的表达模式数据库。此外,根据本发明的一个方面,可以将EPHA7、STK31或WDHD1基因在生物样品中的表达水平与多个对照水平进行比较,所述对照水平由多个参比样品确定。在一些实施方案中,所用的对照水平是用这样的参比样品来确定的,所述参比样品来自与患者来源的生物样品类似的组织类型。
根据本发明,EPHA7、STK31或WDHD1基因的表达水平与良好预后对照水平的相似性表明患者的预后更好,而与良好预后对照水平相比表达水平增加,则表明在治疗后缓解、恢复、存活和/或临床结果方面的预后更差。另一方面,与不良预后对照水平相比EPHA7、STK31或WDHD1基因表达水平的减少则表明患者的预后更好,而表达水平与不良预后对照水平的相似性则表明在治疗后缓解、恢复、存活和/或临床结果方面的预后更差。
当EPHA7、STK31或WDHD1表达水平与对照水平相差大于1.0、1.5、2.0、5.0、10.0或更多倍时,EPHA7、STK31或WDHD1基因在生物样品中的表达水平被认为是有改变的(即增加或减少)。
可以相对于对照,例如持家基因,将检验生物样品和对照水平之间的表达水平差异标准化,EPHA7、STK31或WDHD1基因表达水平的标准化可以使用,例如,已知其表达水平在癌和非癌细胞之间没有差别的多核苷酸,包括编码β肌动蛋白、3-磷酸甘油醛脱氢酶和核糖体蛋白P1的多核苷酸。
表达水平的确定可以通过采用本领域公知技术检测患者来源的生物样品中的基因转录物。通过本方法检测的基因转录物包括转录和翻译产物,例如mRNA和蛋白。
例如,可以通过杂交,例如Northern印迹杂交分析,来检测EPHA7、STK31或WDHD1基因的转录产物,其中所述杂交使用针对基因转录物的EPHA7、STK31或WDHD1基因探针。所述检测可以在芯片或阵列上进行。阵列可以用于检测包括EPHA7、STK31或WDHD1基因在内的多个基因的表达水平。作为另一个实例,该检测可以使用基于扩增的检测方法(参见,(3)[实施例1]中半定量RT-PCR),例如逆转录聚合酶链式反应(RT-PCR),其采用EPHA7、STK31或WDHD1基因的特异引物。EPHA7、STK31或WDHD1基因的特异探针或引物,可以通过参考EPHA7(SEQ ID NO:3)、STK31(SEQ ID NO:5)和WDHD1(SEQ ID NO:7)的全序列采用常规技术来设计和制备。例如,实施例中所使用的引物(SEQ ID NOs:13和14(EPHA7)、SEQ ID NOs:15和16(STK31)、SEQ ID NOs:17和18(WDHD1))可以用于通过RT-PCR的检测,但是本发明不局限于此。
具体地,用于本方法的探针或引物在严格条件、适度严格或低严格条件下与EPHA7、STK31或WDHD1基因的mRNA杂交。是指这样的条件,探针或引物将与其靶序列杂交,而不与其它序列杂交。严格条件是序列依赖性的,并且在不同情况下会有所不同。与较短序列相比,观察到较长序列在较高的温度下特异杂交。通常在确定的离子强度、pH条件下,所选择的严格条件的温度比特异序列的热解链温度(Tm)约低5摄氏度。所述Tm是这样的温度(在确定的离子强度、pH和核酸浓度下),在该温度下,在平衡状态下与靶序列互补的探针中的50%与靶序列杂交。由于靶序列通常过量存在,因此在Tm下,平衡状态时50%的探针被占据。通常,严格条件是那些条件,其中盐浓度小于约1.0M钠离子,在pH 7.0-8.3下通常是约0.01-1.0M钠离子(或其它盐),对于短探针或引物(例如10-50个核苷酸),所述温度为至少约30摄氏度,对于较长探针或引物,温度为至少约60摄氏度。还可以采用添加去稳定剂例如甲酰胺来得到严格条件。
或者,可以检测翻译产物用于本发明的评价。例如可以测定EPHA7、STK31或WDHD1蛋白的量。用于测定作为翻译产物的蛋白含量的方法包括采用特异识别EPHA7、STK31或WDHD1蛋白的抗体的免疫分析方法。所述抗体可以是单克隆或多克隆。此外,抗体任何片段或修饰(例如,嵌合抗体、scFv、Fab、F(ab’)2、Fv等)均可用于检测,只要所述片段保留与EPHA7、STK31或WDHD1蛋白的结合能力。这些用于检测蛋白的抗体的制备方法是本领域公知的,本发明可以采用任何方法来制备所述抗体和其等价物。
作为根据EPHA7、STK31或WDHD1基因翻译产物检测其表达水平的另一种方法,可以采用针对EPHA7、STK31或WDHD1蛋白的抗体通过免疫组织化学分析观察染色强度。即,观察到强染色表示EPHA7、STK31或WDHD1蛋白存在的量增加并且同时EPHA7、STK31或WDHD1基因表达水平高。
此外,已知EPHA7、STK31或WDHD1蛋白具有细胞增殖活性。因此,可以采用这些细胞增殖活性作为指标确定EPHA7、STK31或WDHD1基因的表达水平。例如,在生物样品存在条件下,对表达EPHA7、STK31或WDHD1的细胞进行制备和培养,然后可以通过检测增殖速度或通过测定细胞周期或集落形成能力来确定生物样品的细胞增殖活性。
此外,除了EPHA7、STK31或WDHD1基因表达水平之外,也可以测定其它肺癌相关基因,例如已知在肺癌或食道癌中差异表达的基因,的表达水平来提高评价的准确性。这样的其它肺癌相关基因包括在WO2004/031413和WO 2005/090603中所描述的那些基因;这样的其它食道癌相关基因包括在WO 2007/013671中所描述的那些基因。
根据本方法,用于评价癌症预后的患者可以是哺乳动物,包括人、非人类灵长类、小鼠、大鼠、狗、猫、马和牛。
或者,根据本发明,除了评价受试者预后的其它检查结果以外,还可以提供中间结果。这些中间结果可以帮助医生、护士或其他医师评价、确定或估计受试者的预后。可以考虑将其它信息与获得自本发明的中间结果组合来评价预后,包括受试者临床症状和身体健康状况。
用于诊断癌症或评价癌症预后的试剂盒
本发明提供用于诊断癌症或评价癌症预后的试剂盒。在一些实施方案中,所述癌症是由CX基因介导或由CX基因过表达引起,例如,肺癌和/或食道癌。具体地,所述试剂盒含有至少一种用于检测CDCA5、EPHA7、STK31或WDHD1基因在患者来源的样品中表达的试剂,所述试剂可以选自下列:
(a)用于检测CDCA5、EPHA7、STK31或WDHD1基因的mRNA的试剂;
(b)用于检测CDCA5、EPHA7、STK31或WDHD1蛋白的试剂;以及
(c)用于检测CDCA5、EPHA7、STK31或WDHD1蛋白生物学活性的试剂。
用于检测CDCA5、EPHA7、STK31或WDHD1基因的mRNA的合适的试剂包括可特异结合或识别CDCA5、EPHA7、STK31或WDHD1的mRNA的核酸,例如,具有与CDCA5、EPHA7、STK31或WDHD1的mRNA的一部分互补的序列的寡核苷酸。这类寡核苷酸的例子有CDCA5、EPHA7、STK31或WDHD1mRNA的特异引物和探针。这类寡核苷酸可以根据本领域公知的方法制备。如果有需要,可以将检测CDCA5、EPHA7、STK31或WDHD1mRNA的作用剂固定到固相基质上。此外,在试剂盒中可以包括不止一种用于检测CDCA5、EPHA7、STK31或WDHD1mRNA的作用剂。
另一方面,用于检测CDCA5、EPHA7、STK31或WDHD1蛋白的适合的试剂包括针对CDCA5、EPHA7、STK31或WDHD1蛋白的抗体。所述抗体可以是单克隆或多克隆的。此外,抗体的任何片段或修饰(例如,嵌合抗体、scFv、Fab、F(ab’)2、Fv等)都可以用作所述试剂,只要所述片段保留与CDCA5、EPHA7、STK31或WDHD1蛋白的结合能力。这些用于检测蛋白的抗体的制备方法是本领域公知的,本发明可以采用任何方法来制备所述抗体和其等价物。此外,可以通过直接连接或间接标记技术用信号产生分子对抗体进行标记。用于标记抗体和检测抗体与其靶标结合的标记和方法是本领域公知的,任何标记和方法都可以用于本发明。此外,在试剂盒中可以包括超过一种用于检测CDCA5、EPHA7、STK31或WDHD1蛋白的试剂。
此外,可以测定生物学活性,例如通过测定由生物样品中表达的CDCA5、EPHA7、STK31或WDHD1蛋白所引起的细胞增殖活性。例如,在患者来源的生物样品的存在下培养细胞,然后通过检测增殖速度或通过测定细胞周期或集落形成能力来确定生物样品的细胞增殖活性。如果有需要,可以将检测CDCA5、EPHA7、STK31或WDHD1mRNA的作用剂固定到固相基质上。此外,在试剂盒中可以包括超过一种用于检测CDCA5、EPHA7、STK31或WDHD1蛋白的生物学活性的试剂。
所述试剂盒可以含有超过一种上述试剂。此外,所述试剂盒可以含有固相基质和用于结合针对CDCA5、EPHA7、STK31或WDHD1基因的探针或针对CDCA5、EPHA7、STK31或WDHD1蛋白的抗体的试剂、培养基以及培养细胞的容器、阳性和阴性对照试剂、以及用于检测针对CDCA5、EPHA7、STK31或WDHD1蛋白的抗体的第二抗体。例如,获得自良好预后或不良预后患者的组织样品可以作为有用的对照试剂。本发明试剂盒可以进一步包括从商业和用户角度看有用的其它材料,包括缓冲液、稀释液、滤器、针头、注射器以及带有使用说明的装箱单(例如书面、磁带、CD-ROM等)。这些作用剂及其它材料可以包含在带有标签的容器中。适合的容器包括瓶(bottles)、小瓶(vials)和试管。所述容器可以由各种材料形成,例如玻璃或塑料。
作为本发明的一个实施方案,当所述试剂是针对CDCA5、EPHA7、STK31或WDHD1mRNA的探针时,可以将该试剂固定到固相基质(例如,多孔条)上以形成至少一个检测位点。多孔条的测定或检测区可以包括多个位点,每个位点均含有核酸(探针)。测试条还可以含有阴性和/或阳性对照的位点。或者,对照位点可以位于与测试条不同的条上。任选地,不同检测位点可以含有不同量的固定化核酸,即,在第一检测位点上的量较高,在随后的位点上量较低。在加入检验样品时,显示可检测信号的位点的数目可以定量指示样品中存在的CDCA5、EPHA7、STK31或WDHD1mRNA的量。所述检测位点可以配置成任何适合检测的形状,并且通常采用跨越测试条宽度的条状或点状。
本发明试剂盒可以进一步含有阳性对照样品或CDCA5、EPHA7、STK31或WDHD1标准样品。可以通过收集CDCA5、EPHA7、STK31或WDHD1阳性血液样品来制备本发明的阳性对照样品,然后,分析CDCA5、EPHA7、STK31或WDHD1水平。或者,可以将纯化的CDCA5、EPHA7、STK31或WDHD1蛋白或多核苷酸添加到不含CDCA5、EPHA7、STK31或WDHD1的血清中以形成阳性样品或CDCA5、EPHA7、STK31或WDHD1标准。在本发明中,纯化的CDCA5、EPHA7、STK31或WDHD1可以是重组蛋白。阳性对照样品的CDCA5、EPHA7、STK31或WDHD1水平是,例如,大于截断值。
在下文中,将参考实施方案对本发明进行更详细的描述。然而,下列材料、方法和实施方案仅说明本发明的一些方面,而绝不试图限制本发明的范围。这样,与本文中所描述的那些类似或等价的方法和材料可以用于本发明的实践或测试。
诊断癌症的方法
在本发明中,已证实EPHA7蛋白N末端结构域被切割并分泌到细胞外间隙(图3G)。因此特异识别EPHA7蛋白N末端结构域(SEQ ID NO:4的526-580aa)的作用剂对于检测分泌型EPHA7是有用的。例如,所述作用剂可以是针对EPHA7蛋白N末端结构域的抗体,尤其是针对SEQ ID NO:4526-580aa的抗体,例如,[实施例3]中所使用的针对人EPHA7N末端部分中表位的兔多克隆抗体(批号sc25459,Santa Cruz,Santa Cruz,CA)。可以借助该作用剂检查生物样品例如体液是否含有EPHA7。所述体液可以包括全血、血清、血浆、痰、胸腔积液、食道粘液等。所述检测系统可以是免疫测定、ELISA或Western印迹。
此外,本发明人建立了一种ELISA来测定血清EPHA7,发现血清EPHA7阳性病例的比例是149个(56.4%)/264个非小细胞癌(NSCLC)、35个(44.3%)/79个SCLC以及81个(84.4%)/96个ESCC患者,而只有6个(4.7%)/127个健康志愿者被误诊(图5,上图)。在外科切除原发性肿瘤之后,血清EPHA7的浓度显著减少(图5B,右图)。
通过测定EPHA7在受试者来源的生物样品中的水平,可以确定受试者癌症的发生或癌症发病的倾向。在一些实施方案中,所述癌症是由CX基因介导或由CX基因过表达引起的,例如肺癌和/或食道癌。相应地,本发明涉及确定(例如测定)生物样品中EPHA7的水平。或者,根据本发明,可以提供用于检查受试者状态的中间结果。这些中间结果可以与其它信息组合来帮助医生、护士或其他从业者诊断受试者患有该疾病。或者,本发明可以用于检测受试者来源的组织中的癌细胞,并且为医生提供诊断受试者患有该疾病的有用信息。此外,通过本发明可以筛选疑似肺癌和/或食道癌的受试者。具体地,本发明提供下列双链分子[1]-[5]:
[1]用于诊断受试者癌症或评价癌症治疗效果的方法,包括如下步骤:
(a)收集待诊断受试者的体液;
(b)通过免疫分析测定体液中EPHA7蛋白或其片段的水平;
(c)对步骤(b)中测定的水平与正常对照水平进行比较;并且
(d)判断与正常对照相比,血液样品中高水平表示受试者患有癌症。
[2]权利要求[1]的方法,其中所述体液选自全血、血清、血浆。
[3]权利要求[1]的方法,其中所述免疫分析是ELISA。
[4]权利要求[1]的方法,所述癌症是肺癌和/或食道癌。
[5][3]的方法,所述方法与其它血清生物标记组合。
[6][5]的方法,所述其它血清生物标记选自CEA和ProGRP。
[7][1]的方法,所述治疗是外科手术。
任何生物材料都可以用作测定样品中EPHA7蛋白水平的生物样品。在一些实施方案中,所述生物样品含有血液、血清或其它体液,例如痰、胸腔积液、食道粘液等。在一些实施方案中,所述生物样品是血液或血液来源的样品。所述血液来源的样品包括血清、血浆或全血。根据本方法诊断癌症的受试者可以是哺乳动物,包括人、非人类灵长类、小鼠、大鼠、狗、猫、马和牛。
在该实施方案中,通过测定生物样品中EPHA7蛋白的量来确定EPHA7水平。用于测定生物样品中EPHA7蛋白量的方法包括免疫测定法。在一个实施方案中,所述免疫测定包括ELISA。
然后对生物样品中EPHA7水平与参比样品例如正常对照样品相关的EPHA7水平进行比较。短语“正常对照水平”是指通常在未患癌症群体的生物样品中所发现的EPHA7水平。所述参比样品与检验样品具有相似性质。例如,如果检验样品含有患者血清,则参比样品也应该是血清。可以同时测定来自对照和检验受试者的生物样品的EPHA7水平,或通过统计方法确定正常对照水平,所述统计方法基于通过对先前从对照组收集的样品中EPHA7水平的分析所获得的结果。
EPHA7水平还可以用于监测癌症的治疗疗程。在该方法中,由正在进行癌症治疗的受试者提供检验生物样品。在一些实施方案中,所述癌症是肺癌和/或食道癌。在一些实施方案中,所述多个检验生物样品是从治疗前、治疗中或治疗后不同时间点的受试者获得的。然后可以对治疗后样品的EPHA7水平与治疗前样品的EPHA7水平进行比较,或与参比样品(例如,正常对照水平)进行比较。例如,如果治疗后EPHA7水平低于治疗前EPHA7水平,可以推断该治疗是有效的。同样,如果治疗后EPHA7水平与正常对照EPHA7水平类似,也可以推断该治疗是有效的。
“有效”治疗是这样的治疗,其导致EPHA7水平减少或受试者癌症尺寸、普遍程度(prevalence)或转移的可能性减小。当预防性地进行治疗时,“有效”表示治疗延缓或阻止癌症发生,或减轻癌症的临床症状。可以使用标准临床规程对癌症进行评价。此外,可以根据任何已知的诊断或治疗癌症的方法来确定治疗的有效性。例如,常规组织病理学或通过鉴定异常症状来诊断癌症,例如,久咳、声音嘶哑、咳血、体重减轻、食欲缺乏、呼吸急促、喘鸣、支气管炎或肺炎反复发作以及胸痛。
此外,本发明诊断癌症的方法还可以用于通过比较患者来源的生物样品EPHA7水平和参比样品水平来评价癌症患者的预后。在一些实施方案中,所述癌症是肺癌。或者,可以通过测定疾病的一系列阶段的生物样品中的EPHA7水平来评价患者的预后。与正常对照水平相比,EPHA7水平增加表示预后更差。EPHA7水平与正常对照水平类似表示患者预后更好。
在本发明诊断方法中,除EPHA7血液浓度以外,还可以参考CEA或proGRP或两者的血液浓度来检测肺癌。因此,本发明提供了诊断肺癌的方法,其中当除EPHA7血液浓度以外,CEA血液浓度也高于健康个体时,检出NSCLC。或者,本发明提供了诊断肺癌的方法,其中当除EPHA7血液浓度以外,proGRP血液浓度也高于健康个体时,检出SCLC。
癌胚抗原(CEA)是一种临床上应用的癌胚抗原(oncofetal antigens)。它是分子量为20,000的复杂糖蛋白,与肿瘤细胞质膜相关并可以从质膜释放到血液。
尽管CEA首先在结肠癌中被鉴定,但是异常CEA血液水平通常是结肠癌或恶性肿瘤特异的。CEA水平提高在除结肠以外的各种癌症中都有发现,包括肺、胰腺、胃和乳腺。正如上文中所描述的,CEA已被用作诊断或检测肺癌的血清学标志物。然而,CEA作为肺癌尤其是NSCLC的标志物,其灵敏度有些不能完全满足检测肺癌的需要。或者,众所周知的是,胃泌素释放肽前体(proGRP)是SCLC的血清学肿瘤标志物。正如上文中所描述的,proGRP已被用作诊断或检测SCLC的血清学标志物。然而,proGRP作为SCLC的标志物,其灵敏度不完全满足检测SCLC的需要。相应地,需要提高诊断肺癌例如NSCLC和SCLC的敏感度。
在本发明中,提供了肺癌血清学标志物EPHA7。可以通过本发明提高肺癌诊断或检测方法的灵敏度。
通过在EPHA7和CEA和/或proGRP之间进行组合,可以显著提高检测肺癌即NSCLC和/或SCLC的灵敏度。例如,在下文提到的实际实施例所分析的小组中,CEA对NSCLC的灵敏度为37.9%(88/232)、特异性为89.8%(114/127);(图5C,上图)。与此同时,EPHA7和CEA的组合可以将检测NSCLC的总体灵敏度提高到76.7%(178/232)。在本发明中,“EPHA7和CEA的组合”是指将EPHA7和CEA任何一个或两者的水平用作标志物。在一些实施方案中,EPHA7和CEA中任何一个检验为阳性的患者可以判断为患有NSCLC。在本领域中没有公开将EPHA7和CEA组合作为NSCLC血清学标志物的用途。
类似地,例如,在下文提到的实际实施例所分析的小组之中,proGRP对SCLC的灵敏度约64.8%(46/71),特异性为97.6%(120/123);(图5C,下图)。与此同时,EPHA7和proGRP的组合可以将检测SCLC的总体灵敏度提高到77.5%(55/71)。在本发明中,“EPHA7和proGRP的组合”是指将EPHA7和proGRP中任何一个或两者的水平用作标志物。在一些实施方案中,EPHA7和proGRP任何一个检验为阳性的患者可以判断为患有SCLC。在本领域中没有公开将EPHA7和proGRP组合作为SCLC血清学标志物的用途。
因此,与根据单独测定CEA或proGRP的结果的测定相比,本发明可以显著提高检测NSCLC或SCLC患者的灵敏度。这一提高背后的事实是CEA-或proGRP-阳性患者组和EPHA7-阳性患者组不完全匹配。将进一步具体描述该事实。
首先,在根据CEA或proGRP测定结果确定低于标准值(即,没有肺癌)的患者中,实际上存在一定比率的患者患有肺癌(即,NSCLC或SCLC)。这些患者称为CEA-或proGRP-假阴性患者。通过将基于CEA或proGRP的测定结果与基于EPHA7的测定结果组合,可以在CEA-或proGRP-假阴性患者中发现EPHA7值高于标准值的患者。即,在由于CEA或proGRP低血液浓度而被错误地确定为“阴性”的患者中,本发明可以发现实际上患有肺癌的患者。因此可以通过本发明提高检测肺癌患者的灵敏度。通常,简单地将采用多个标志物的测定结果进行组合可以提高检测灵敏度,但是另一方面,这经常会减少特异性。然而,本发明通过确定灵敏度和特异性之间的最佳平衡,确定了特征性的组合,其可以提高检测灵敏度而无损于特异性。
在本发明中,为了同时考虑CEA或proGRP的测定结果,例如,可以采用与上述比较EPHA7测量值和标准值的相同方式,测定CEA或proGRP的血液浓度并与标准值比较。例如,如何测定CEA或proGRP血液浓度并将其与标准值进行比较,这是已知的。此外,CEA或proGRP的ELISA试剂盒也是市售可得的。在已知报道中所描述的这些方法可以用于本发明诊断或检测肺癌的方法中。
在本发明中,可以通过统计学确定EPHA7血液浓度的标准值。例如,可以测定健康个体EPHA7的血液浓度来通过统计学确定EPHA7标准血液浓度。当可以收集到统计学上足够的群体时,在平均值上下两倍或三倍标准差(S.D.)范围内的数值经常被用作标准值。因此,与平均值+2xS.D.或平均值+3xS.D.相对应的数值可以用作标准值。根据理论描述所设定的标准值分别含有90%和99.7%的健康个体。
或者,也可以根据肺癌患者EPHA7的实际血液浓度来设定标准值。通常,以这种方式设定的标准值使假阳性百分比减到最低,且标准值从满足能使检测敏感度最大化的条件的值的范围中选择。在本文中,假阳性百分比,是指其EPHA7血浓度被判断高于标准值的患者在健康个体中所占的百分比。相反,其EPHA7血浓度被判断低于标准值的患者在健康个体中所占的百分比表示特异性。即,假阳性百分比和特异性的和总是1。检测灵敏度是指在确定存在肺癌的群体内全部肺癌患者中,其EPHA7血液浓度被判断为高于标准值的患者的百分比。
此外,在本发明中,在经判断其EPHA7浓度高于标准值的患者中肺癌患者所占的百分比,表示阳性预测价值。另一方面,在经判断其EPHA7浓度低于标准值的患者中健康个体所占的百分比,表示阴性预测价值。表1概述了这些值之间的关系。下文所显示的关系表明,作为评价肺癌诊断准确性的指标,灵敏度、特异性、阳性预测值以及阴性预测值中每个值都可以根据用来推断EPHA7血液浓度水平的标准值而变化。
[表1]
 EPHA7血液浓度 肺癌患者 健康个体
 高   a:真阳性   b:假阳性   阳性预测值a/(a+b)
 EPHA7血液浓度 肺癌患者 健康个体
c:假阳性 d:真阳性   阴性预测值d/(c+d)
  灵敏度a/(a+c)   灵敏度d/(b+d)
正如已提及的,通常设定标准值使假阳性率低而灵敏度高。然而,根据上文所显示的关系显而易见的是,在假阳性率和灵敏度之间存在权衡(trade-off)。即,如果标准值减少,则检测灵敏度增强。然而,由于假阳性率也增加,因此很难满足具有“低假阳性率”的条件。考虑到这个情况,例如,本发明可以选择给出下列预测结果的数值作为代表性标准值。对于标准值,其假阳性率为50%或更少(即,对于标准值,其特异性不小于50%)。
对于标准值,其灵敏度不小于20%。
在本发明中,可以采用ROC曲线设定标准值。受试者操作特征(ROC)曲线是竖轴显示检测灵敏度和竖轴显示假阳性率(即,“1-特异性”)的图表。在本发明中,可以通过标绘灵敏度和假阳性率的变化来获得ROC曲线,所述变化可以在连续改变用于确定高/低度EPHA7血液浓度的标准值之后获得。
用于获得ROC曲线的“标准值”是临时用于统计分析的数值。用于获得ROC曲线的“标准值”通常可以在涵盖所有可检测标准值范围内连续变化。例如,所述标准值可以在所分析群体中EPHA7最小和最大测定值之间变化。
根据所获得的ROC曲线,可以从满足上述条件的范围内选择本发明要使用的代表性标准值。或者,可以通过使标准值在包括大多数EPHA7测定值的范围内变化,根据所产生的ROC曲线来选择标准值。
可以通过定量蛋白的任何方法测定血液中的EPHA7。例如,免疫分析、液相色谱、表面等离子共振(SPR)、质谱等都可以用作定量蛋白的方法。在质谱法中,可以通过使用合适的内标物来定量蛋白。同位素标记的EPHA7等都可以用作内标物。可以根据EPHA7和内标物在血液中的峰强度来确定血液中EPHA7的浓度。通常,基质辅助激光解吸/电离(MALDI)法用于蛋白质谱。通过采用质谱或液相色谱的分析方法,还可以同时分析EPHA7和其它肿瘤标志物(例如CEA和/或proGRP)。
本发明用于测定EPHA7的示例性方法是免疫测定。EPHA7的氨基酸序列是已知的(GenBank登录号NP_004431.1)。SEQ ID NO:显示的是EPHA7的氨基酸序列,SEQ ID NO:显示的是编码EPHA7的cDNA的核苷酸序列。因此,本领域技术人员可以根据EPHA7氨基酸序列通过合成必需的免疫原来制备抗体。用作免疫原的肽可以使用多肽合成仪很容易地合成。所述合成肽可以通过将其与载体蛋白连接用作免疫原。在一些实施方案中,所述抗原肽含有EPHA7N末端区域,或可以是EPHA7N末端区域的片段(SEQID NO:4的526-580aa)。
钥孔血蓝蛋白、肌球蛋白、白蛋白及类似物可用作载体蛋白。载体蛋白优选是KLH、牛血清白蛋白等。一般用马来酰亚胺苯甲酰基-N-氢化琥珀酰亚胺酯法(下面缩写为MBS法)等方法将合成肽连接到载体蛋白。
具体而言,将半胱氨酸导入所述合成肽,且将该肽通过MBS使用该半胱氨酸的SH基团与KLH交联。可将所述半胱氨酸残基导入所述合成肽的N端或C端。
或者,可以根据EPHA7核苷酸序列(GenBank登录号NM_004440)获得EPHA7的基因重组体。可以使用从EPHA7表达组织制备的mRNA对含有所需的核苷酸序列的DNA进行克隆。或者,市售可得的cDNA文库可以用作克隆来源。获得的EPHA7基因重组体或其片段也可以用作免疫原。以这种方式表达的EPHA7重组体也可以用作获得本发明所使用抗体的免疫原。市售可得的EPHA7重组体也可以用作免疫原。可以通过(2)“抗体定义”中所提及的常规方法制备本发明抗体。
当针对EPHA7的抗体接触EPHA7时,所述抗体与其通过抗原-抗体反应所识别的抗原决定簇(表位)相结合。可以通过各种免疫分析原理检测抗体与抗原的结合。免疫测定主要可以分为异源分析方法和同源分析方法。为了将免疫分析的灵敏度和特异性保持在高水平,希望使用单克隆抗体。通过各种免疫分析形式来具体说明本发明测定EPHA7的方法。
首先,描述了采用异相免疫分析测定EPHA7的方法。异相免疫分析中,需要一套机制来在结合EPHA7的抗体与不结合EPHA7的抗体分离之后,检测与其结合的抗体。为了促进分离,通常采用固定化剂。例如,首先制备固定有识别EPHA7的抗体的固相(固定化抗体)。使EPHA7与其结合,且进一步使第二抗体与之反应。
当所述固相从液相分离并如需要进一步漂洗后,第二抗体与EPHA7浓度成比例地残留在固相上。通过标记第二抗体,可以通过测定标记物来源的信号定量EPHA7。
可使用任何方法将所述抗体与所述固相结合。举例而言,可将抗体物理性地吸附于疏水材料,例如聚苯乙烯。此外,可将抗体化学性地与多种在其表面具有功能基团的材料结合。进一步,可通过用其配体的结合伴侣将其捕获的方法将该配体标记的抗体结合到固相上。结合配体与其结合伴侣的组合包括抗生物素蛋白-生物素等。所述固相与抗体可于第一抗体与EPHA7反应同时或之前结合。
类似地,第二抗体不需要直接标记。即,它们可以使用针对抗体的抗体或采用结合反应(例如抗生物素蛋白-生物素反应)间接进行标记。
根据采用已知EPHA7浓度的标准样品所获得的信号强度可以确定样品中EPHA7的浓度。
任何抗体都可以用作固定化抗体和用于上述异相免疫分析的第二抗体,只需其是识别所述EPHA7的抗体或具有抗原结合位点的抗体片段。因此,其可以是单克隆抗体、多克隆抗体,或两者的混合物或组合物。例如,单克隆抗体和多克隆抗体的组合是本发明中示例性的组合。或者,当两个抗体都是单克隆抗体时,组合识别不同表位的单克隆抗体是有用的。
因为需测量的抗原被抗体包夹,上述异源免疫测定称为夹心法。由于夹心法的测量灵敏度和重复性极佳,它们是本发明中合适的测量原理。
竞争性抑制反应原理也可以适用于异源免疫测定。具体地,它们是基于样品中EPHA7竞争性抑制已知浓度EPHA7和抗体的结合这一现象的免疫测定。可以通过标记已知浓度EPHA7并测定与抗体反应(或不反应)的EPHA7量来测定样品中EPHA7的浓度。
当已知浓度抗原和样品中抗原同时与抗体反应时,建立竞争性反应体系。此外,当抗体与样品中抗原反应,其后与已知浓度抗原反应时,通过抑制性反应体系的分析是可能的。在两种类型的反应体系中,通过设定一种已知浓度抗原作为作用剂成分或抗体作为标记组分,而另一个作为固定化作用剂,可以构建有操作性优势的反应体系。
放射性同位素、荧光物质、发光物质、具有酶活性的物质、肉眼可见的物质、可用磁性观察的物质等用于这些异源免疫测定。这些标记物质的具体例子如下所示。
具有酶活性的物质:
过氧化物酶,
碱性磷酸酶,
尿素酶,过氧化氢酶,
葡糖氧化酶,
乳糖脱氢酶,或
淀粉酶等。
荧光体:
异硫氰酸荧光素,
四甲基罗丹明异硫氰酸盐,
取代的罗丹明异硫氰酸盐,或
异氰酸二氯三嗪(dichlorotriazine isothiocyanate)等。
放射性同位素:
氚,
125I,或
131I等。
在这些物质中,非放射性标记,例如酶,就安全性、可操作性、灵敏度等而言是有优势的标记。可以通过已知方法将酶标记连接到抗体或EPHA7,例如,高碘酸法或顺丁烯二酰亚胺法。
作为固相,使用珠子、容器内壁、微细颗粒、多孔载体、磁性颗粒等。可使用通过下列材料形成的固相:聚苯乙烯、聚碳酸酯、聚乙烯基甲苯、聚丙烯、聚乙烯、聚氯乙烯、尼龙、聚甲基丙烯酸酯、乳胶、明胶、琼脂糖、玻璃、金属、陶瓷等。亦已知表面导入化学性结合抗体等的功能团的固体材料。已知的结合方法,包括化学结合,例如聚-L-赖氨酸或戊二醛处理以及物理吸附,可施用于固相与抗体(或抗原)。
尽管本文说明的所有异相免疫分析都需要将固相和液相分离的步骤以及洗涤步骤,但采用免疫层析法可以很容易地进行这些步骤,所述免疫层析法是夹心法的一种变形。
具体地,可以通过毛细现象将要固定的抗体固定到能够运送样品溶液的多孔载体上,然后通过该毛细现象将含有EPHA7的样品和标记抗体的混合物放置于此。在布置过程中,EPHA7与标记抗体反应,并且当其进一步接触固定化抗体时,就会在那个位置被捕获。与EPHA7不反应的标记抗体不被固定化抗体所捕获而流过。
因此,可以采用保留在固定化抗体位置的标记抗体的信号作为指标来检测EPHA7的存在。如果所述标记抗体被预先保持在多孔载体上游,则仅通过注入试样溶液就可以起始与完成所有反应,从而可构建非常简单的反应体系。在免疫层析法中,可以对肉眼区分的标记组分,例如着色颗粒进行组合,来构建甚至无需专用读数器的分析装置。
此外,在免疫层析法中,可以调节EPHA7的检测灵敏度。例如,通过调节截断值(下文所述的)附近的检测灵敏度,上述标记组分可在超过截止值时被检测出来。通过使用该装置,可以非常简单地判断受试者是阳性还是阴性。采用允许肉眼可见标记差别的构造,可以通过简单地将血液样品施加到免疫层析装置来获得必需的检测结果。
多种调节所述免疫色谱方法的检测灵敏度的方法在本领域是已知的。举例而言,可将另一种用于调节检测灵敏度的固定化抗体置于上样处与固定化抗体之间(日本专利申请公布(JP-A)H06-341989(未审查、已发表的日本专利申请))。试样中的EPHA7在从上样处转移到为检测标签的第一固定化抗体处时,被所述第二固定化抗体所捕获。在第二固定化抗体饱和后,EPHA7可到达下游的第一固定化抗体处。其结果是,当包含于试样中的EPHA7浓度超过预定的浓度时,与所述标记抗体结合的EPHA7在第一固定化抗体处被检测出来。
接下来,说明同源免疫测定法。与上文所描述的需要反应液分离的异源免疫测定方法不同的是,采用同源免疫测定法也可以测定EPHA7。同源分析方法允许在无需将其从反应溶液中分离的情况下检测抗原-抗体反应产物。
一种代表性的同源分析方法是免疫沉淀反应,其中通过检测抗原-抗体反应后产生的沉淀来定量分析抗原成分。多克隆抗体通常用于免疫沉淀反应。当应用单克隆抗体时,优选使用能与EPHA7的不同表位结合的多种类型的单克隆抗体。免疫学反应后的沉淀反应的产物可由肉眼观测,或可通过光学测量转换成数值数据。
免疫学粒子凝集反应是一种通用的同源分析方法,利用抗体致敏的细颗粒在抗原作用下的凝集作为指标。与上述免疫沉淀反应中一样,多克隆抗体或多种类型单克隆抗体的组合也可用在这种方法中。细颗粒的抗体致敏可以用抗体混合物致敏,或者可以通过混合分别用每种抗体致敏的粒子来制备这样的细颗粒。用这种方式获得的细颗粒一旦与EPHA7接触就产生基质样反应产物。反应产物可以作为粒子聚集来检测。粒子聚集可由肉眼观测或通过光学测定转换成数值数据。
基于能量转移和酶引导作用(enzyme channeling)的免疫测定方法是已知的同源免疫测定法。在使用能量转移的方法中,将具有供体/受体关系的不同的光学标记分别接到能够识别抗原上靠近的表位的多种抗体上。当发生免疫反应时,两个部分相互接近,发生能量转移现象,其结果是产生荧光淬灭或者荧光波长的改变等信号。另一方面,酶引导作用为能够结合邻近的表位的多种抗体使用标记,其中所述标记是具有这样的关系的酶的组合,即一种酶的反应产物是另一种酶的底物。当两个部分由于免疫反应彼此靠近时,促进酶反应,从而它们的结合可以作为酶反应速率的变化被检测到。
在本发明中,可以用取自患者的血液制备用于测定EPHA7的血液。示例性的血液样品包括血清或血浆。在测定之前可以对血清或血浆样品进行稀释。或者,全血可以作为样品来测定,并且可以对获得的测定值进行校正来确定血清浓度。例如,可以通过测定红细胞容积在相同血液样品中的百分比将全血浓度校正为血清浓度。
在一个实施方案中,所述免疫分析包括ELISA。本发明人建立了夹心ELISA来检测肺癌患者血清EPHA7。
然后将血液样品中EPHA7水平与和标准样品(例如正常对照样品)有关的EPHA7水平相比较。短语“正常对照水平”指在未患有肺癌的群体的血液样品中通常发现的EPHA7水平。优选具有与试验样品相似性质的标准样品。例如,如果试验样品包含患者血清,标准样品也应是血清。来自于对照和试验受试者的血液样品中EPHA7水平可以同时测定,或者,作为选择,可以根据分析先前从对照组收集的样品中现的EPHA7水平得到的结果,用统计学方法测定正常对照水平。
EPHA7水平也可以用于监测肺癌的治疗疗程。在该方法中,由正在进行肺癌治疗的受试者提供检验血液样品。在一些实施方案中,多个检验血液样品是从治疗前、治疗中或治疗后不同时间点的受试者获得的。然后可以对治疗后样品的EPHA7水平与治疗前样品的EPHA7水平进行比较,或与参比样品(例如,正常对照水平)进行比较。例如,如果治疗后EPHA7水平低于治疗前的EPHA7水平,可以断定该治疗是有效的。同样地,如果治疗后EPHA7水平与正常对照EPHA7水平类似,人们也可以断定该治疗是有效的。
“有效”治疗是这样的治疗,其导致EPHA7水平减少或受试者肺癌大小、普遍程度或转移潜能降低。当治疗用于预防时,“有效”表示治疗延缓或阻止肺癌发生,或减轻肺癌的临床症状。可以使用标准临床规程对肺癌进行评价。此外,可以根据任何已知的诊断或治疗肺癌的方法来确定治疗有效性。例如,常规组织病理学或通过鉴定异常症状来诊断肺癌
肺癌的诊断和检测正面临着巨大的困难。本发明提供用于血清EPHA7的ELISA,其对于通过与其它血清标志物例如CEA和/或proGRP组合筛选肺癌是有希望的工具。
根据本发明,用于实施肺癌诊断的组分可以预先组合并以检验试剂盒的形式提供。相应地,本发明提供用于检测肺癌的试剂盒,其包括:
(i)用于测定血液样品EPHA7水平的免疫测定试剂;以及
(ii)EPHA7的阳性对照样品。
在一些实施方案中,本发明试剂盒可以进一步包括:
(iii)用于测定血液样品中CEA和/或proGRP的水平的免疫测定试剂;以及
(iv)CEA和/或proGRP的阳性对照样品。
组成本发明试剂盒的免疫测定用试剂可以包括如上所述各种免疫测定所必需的试剂。具体地,免疫测定用试剂包括能识别待测量物质的抗体。可以根据免疫测定的测定形式修饰所述抗体。ELISA可用作本发明优选的测定形式。在ELISA中,例如,通常应用固定到固相上的第一抗体和带有标记的第二抗体。
因此,用于ELISA的免疫测定试剂可以包括固定在固相载体上的第一抗体。细颗粒或反应容器内壁可以用作固相载体。磁性粒子可以用作细颗粒。或者,多孔板(例如96孔微量培养板)常常用作反应容器。用于处理大量样品的容器也是众所周知的,其带有高密度的、比96孔微量培养板体积小的孔。在本发明中,这些反应容器的内壁可以用作固相载体。
用于ELISA的免疫测定试剂可进一步包括带有标记的第二抗体。用于ELISA的第二抗体可以是直接或间接地与酶连接的抗体。将酶化学连接到抗体的方法是已知的。例如,可以酶切免疫球蛋白以获得包括可变区的片段。通过使所述片段中包含的-SS-键还原成-SH基,可以附接上双功能接头。通过预先将酶与双功能接头连接,可以使酶与抗体片段连接。
或者,为了间接地连接酶,例如,可以使用抗生物素蛋白-生物素结合。即,可以通过使生物素化的抗体与附接有抗生物素蛋白的酶接触,使酶间接地与抗体连接。另外,利用第三抗体(一种识别第二抗体的酶标抗体)可以使酶间接地与第二抗体连接。例如,如上述例示的那些酶可用作标记抗体的酶。
本发明的试剂盒包括EPHA7的阳性对照。EPHA7的阳性对照包括预先确定了浓度的EPHA7。示例性的浓度包括,例如,在本发明的试验方法中设定为标准值的浓度。或者,也可以组合具有更高浓度的阳性对照。本发明中EPHA7的阳性对照还可包括预先测定了浓度的CEA和/或pro-GRP。包括CEA和/或pro-GRP、以及EPHA7的阳性对照,可以作为本发明的阳性对照。
因此,本发明提供一种用于检测肺癌的阳性对照,其除了包括浓度超过正常值的EPHA7外,还包括CEA和/或pro-GRP。或者,本发明涉及包含浓度超过正常值的EPHA7以及CEA和/或pro-GRP的血液样品在用于检测肺癌的阳性对照的生产中的用途。已知CEA和/或pro-GRP可以用作肺癌的指标;然而,EPHA7可以用作肺癌的指标是本发明获得的新发现。因此,除CEA和/或pro-GRP外还包含EPHA7的阳性对照是新颖的。本发明的阳性对照可以通过将浓度超过标准值的CEA和/或pro-GRP添加到血液样品中来制备。例如,包含浓度超过标准值的CEA和/或pro-GRP的血清可以用作本发明的阳性对照。
在一些实施方案中,本发明阳性对照是液体形式的。在本发明中,使用血液样品作为样品。因此,用作对照的样品也需要是液体形式。或者,使用时以预先定量的液体溶解干燥的阳性对照,可以制备提供试验浓度的对照。将干燥的阳性对照与溶解它所必需的一定量液体一起包装,使用者可仅通过将它们混合而获得必需的阳性对照。用作阳性对照的EPHA7可以是天然来源的蛋白质,或者其可以是重组蛋白。不仅是阳性对照,阴性对照也可以组合在本发明的试剂盒中。所述阳性对照或阴性对照都可以用于证实免疫分析所表示的结果是否正确。
筛选方法
(1)筛选的受试化合物
在本发明的上下文中,欲通过本筛选方法鉴定的作用剂可为任一种化合物或者包括数种化合物的组合物。此外,根据本发明的筛选方法,暴露于细胞或蛋白质的测试剂可为单个化合物或者化合物的组合。当化合物的组合用在本方法中时,所述化合物可被相继接触或同时接触。
任何测试剂都可用在本发明的筛选方法中,所述测试剂例如细胞提取物、细胞培养上清液、发酵微生物的产物、海洋生物提取物、植物提取物、纯化蛋白或粗蛋白、肽、非肽化合物、合成的小分子化合物(包括核酸构建体,例如反义RNA、siRNA、核酶等)以及天然化合物。本发明的测试剂还可利用本领域公知的组合文库法的众多方法中任一种来获得,所述组合文库法包括
(1)生物文库,
(2)空间可寻址的平行固相或液相文库,
(3)需要解卷积(deconvolution)的合成文库法
(4)“一珠一化合物”(“one-bead one-compound”)文库法和
(5)利用亲和层析选择的合成文库法
利用亲和层析选择的生物文库法限于肽库,而其他4种方法适用于肽、非肽低聚体或化合物的小分子文库(Lam,Anticancer Drug Des 1997,12:145-67)。用于分子文库合成的方法的实例可在本领域找到(DeWitt et al.,ProcNatl Acad Sci USA 1993,90:6909-13;Erb et al.,Proc Natl Acad Sci USA 1994,91:11422-6;Zuckermann et al.,J Med Chem 37:2678-85,1994;Cho et al.,Science 1993,261:1303-5;Carell et al.,Angew Chem Int Ed Engl 1994,33:2059;Carell et al.,Angew Chem Int Ed Engl 1994,33:2061;Gallop et al.,JMed Chem 1994,37:1233-51)。化合物的文库可存在于溶液中(参见Houghten,Bio/Techniques 1992,13:412-21)或珠子(Lam,Nature 1991,354:82-4)、芯片(Fodor,Nature 1993,364:555-6)、细菌(美国专利5,223,409)、孢子(美国专利5,571,698;5,403,484和5,223,409)、质粒(Cull et al.,Proc Natl Acad Sci USA1992,89:1865-9)或噬菌体(Scott and Smith,Science 1990,249:386-90;Devlin,Science 1990,249:404-6;Cwirla et al.,Proc Natl Acad Sci USA 1990,87:6378-82;Felici,J Mol Biol 1991,222:301-10;美国专利申请2002-103360)上。
通过本发明任何筛选方法筛选到的化合物的一部分结构通过添加、删除、和/或置换方式被转换而得到的化合物,包括在通过本发明筛选方法鉴定的作用剂之内。
此外,当所筛选的测试剂是蛋白质时,为了获得编码该蛋白的DNA,可以确定蛋白的全部氨基酸序列,以此推定编码蛋白的核酸序列,或者可以分析所得蛋白的部分氨基酸序列,根据该序列制备寡DNA作为探针,并用该探针筛选cDNA文库,以获得编码该蛋白的DNA。对所得的DNA进行确认,以其在制备治疗或预防癌症的候选物测试剂中的有用性为准。
用在本说明书所述的筛选中的测试剂还可以是抗体或非抗体结合蛋白,其与CX蛋白或CX部分肽特异性结合,所述CX部分肽没有与配偶物结合的活性或者磷酸化底物或由体内激酶磷酸化的活性。所述部分蛋白或抗体可利用本说明书中所述的方法制备(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物或者参见“抗体”),可检测它们阻断CX蛋白磷酸化或者蛋白质(例如EPHA7/EGFR、STK31或WDHD1)与其结合配偶结合的能力。
(i)分子建模
通过对已知具有所寻求性质的化合物的分子结构,和/或要抑制的靶分子(即CDCA5、EPHA7、STK31或WDHD1)的分子结构的了解,很容易构建测试剂文库。初筛适合于进一步评定的测试剂的一种方法是测试剂与其靶标之间相互作用的计算机模拟。
计算机建模技术为针对选定分子的三维原子结构的可视化以及会与该分子相互作用的新化合物的合理设计提供了可能。三维构建典型地依赖于从选定分子的x-射线晶体分析或NMR成像而来的数据。分子动力学需要力场数据。计算机图形系统为预测新化合物如何连接靶分子,以及实验操作化合物和靶分子的结构以优化结合特异性提供了可能。为了预测当分子和化合物之一或二者发生细小改变时分子-化合物相互作用是什么样的,需要分子力学软件和计算密集型计算机,它们通常耦联着分子设计程序和用户之间的用户友好的、菜单驱动的界面。
通常以上描述的分子模拟系统的实例包括CHARMm和QUANTA程序,Polygen公司,沃尔瑟姆,马萨诸塞州。CHARMm实现能量最低化和分子动力学功能。QUANTA实现构建、图形模拟和分子结构分析。QUANTA允许交互式构建、修饰、可视化和分析分子彼此间的行为。
有许多文章综述了与特定蛋白质相互作用的药物的计算机模拟,例如Rotivinen et al.Acta Pharmaceutica Fennica 1988,97:159-66;Ripka,NewScientist 1988,54-8;McKinlay & Rossmann,Annu Rev Pharmacol Toxiciol1989,29:111-22;Perry & Davies,Prog Clin Biol Res 1989,291:189-93;Lewis& Dean,Proc R Soc Lond 1989,236:125-40,141-62;以及关于核酸组分的模型受体,Askew et al.,J Am Chem Soc 1989,111:1082-90。
其它可筛选并图形描述化学物质的计算机程序可以从例如Mississauga,Ontario,Canada的BioDesign,Inc.,Pasadena,Calif.,Allelix,Inc公司、Cambridge,Ontario的Hypercube,Inc.等公司获取。见例如DesJarlais et al.,JMed Chem 1988,31:722-9;Meng et al.,J Computer Chem 1992,13:505-24;Meng et al.,Proteins 1993,17:266-78;Shoichet et al.,Science 1993,259:1445-50。
一旦CX活性的抑制剂得以鉴定,则可根据所鉴定抑制剂的化学结构,应用组合化学技术来构建任何数目的变体,如下所述。利用本发明的方法,可筛选产生的候选抑制剂,或“测试剂”的文库,以鉴定文库中阻断CDCA5、EPHA7、STK31或WDHD1活性的测试剂。
(ii)组合化学合成
测试剂的组合文库可以作为合理药物设计程序——其涉及有关CDCA5、EPHA7、STK31或WDHD1活性的已知抑制剂中存在的核心结构的知识——的一部分来制备。这种策略使得文库可以保持合理的规模,有助于高通量筛选。或者,可通过简单地合成构成文库的分子家族的所有排列,构建简单的、特别短的、聚合的分子文库。所述后一种方法的实例为长度为6个氨基酸的所有肽的文库。所述肽库可包括所有6个氨基酸序列的排列。这种类型的文库称为线性组合化学文库。
组合化学文库的制备是本领域技术人员所熟知的,可以通过化学或生物合成来产生。组合化学文库包括,但不仅限于,肽文库(见例如美国专利5,010,175;Furka,Int J Pept Prot Res 1991,37:487-93;Houghten et al.,Nature1991,354:84-6)。也可以使用其它用于产生化学多样性文库的化学。这些化学包括,但不仅限于,肽(例如PCT公布WO 91/19735),被编码的肽(例如WO 93/20242),随机生物寡聚体(例如WO 92/00091),苯并二氮卓(benzodiazepines)(例如美国专利5,288,514),diversomer如乙内酰脲、苯并二氮卓和二肽(DeWitt et al.,Proc Natl Acad Sci USA 1993,90:6909-13),插烯化(vinylogous)多肽(Hagihara et al.,J Amer Chem Soc 1992,114:6568),具有葡萄糖骨架(scaffolding)的非肽类肽模拟物(Hirschmann et al.,J Amer ChemSoc 1992,114:9217-8),小化合物文库的模拟物有机合成(analogous organicsynthese)(Chen et al.,J.Amer Chem Soc 1994,116:2661),寡聚氨基甲酸盐(Cho et al.,Science 1993,261:1303),和/或肽酰膦酸酯(peptidylphosphonates)(Campbell et al.,J Org Chem 1994,59:658),核酸文库(见Ausubel,CurrentProtocols in Molecular Biology 1995 supplement;Sambrook et al.,MolecularCloning:A Laboratory Manual,1989,Cold Spring Harbor Laboratory,New York,USA),肽核酸文库(见例如美国专利5,539,083),抗体文库(见例如Vaughan etal.,Nature Biotechnology 1996,14(3):309-14和PCT/US96/10287),碳水化合物文库(见例如Liang et al.,Science 1996,274:1520-22;美国专利5,593,853),和有机小分子文库(见例如苯并二氮卓,Gordon EM.Curr Opin Biotechnol.1995 Dec 1;6(6):624-31;类异戊二烯(isoprenoids),美国专利5,569,588;噻唑烷酮(thiazolidinones)和偏硫杂氮杂环己烷(metathiazanone),美国专利5,549,974;吡咯烷(pyrrolidines),美国专利5,525,735和5,519,134;吗啉代化合物,美国专利5,506,337;苯并二氮卓,5,288,514;等)。
(iii)噬菌体展示
另一种方法利用重组噬菌体来制备文库。利用“噬菌体方法(phagemethod)”(Scott & Smith,Science 1990,249:386-90;Cwirla et al.,Proc NatlAcad Sci USA 1990,87:6378-82;Devlin et al.,Science 1990,249:404-6),可构建很大的文库(例如106-108个化学个体)。第二种方法主要利用化学法,其中实例有Geysen法(Geysen et al.,Molecular Immunology 1986,23:709-15;Geysen et al.,J Immunologic Method 1987,102:259-74);和Fodor等(Science1991,251:767-73)的方法。Furka等(14th International Congress ofBiochemistry 1988,Volume #5,Abstract FR:013;Furka,Int J Peptide ProteinRes 1991,37:487-93),Houghten(美国专利4,631,211)以及Rutter等(美国专利5,010,175)描述了制备可被检验为激动剂或拮抗剂的肽的混合物的方法。
用来制备组合文库的设备是商业上可得到的(参见例如357MPS,390MPS,Advanced Chem Tech,Louisville KY,Symphony,Rainin,Woburn,MA,433A Applied Biosystems,Foster City,CA,9050 Plus,Millipore,Bedford,MA)。而且,很多组合文库本身是商业上可得到的(参见例如ComGenex,Princeton,N.J.,Tripos,Inc.,St.Louis,MO,3D Pharmaceuticals,Exton,PA,Martek Biosciences,Columbia,MD,etc.)。
(2)筛选方法
(i)通用筛选方法
对于以免疫沉淀法筛选与CX蛋白结合的化合物,通过将这些抗体或非抗体结合蛋白加至利用适当去污剂制备的细胞裂解物中,从而形成免疫复合物。所述免疫复合物由多肽、具有对多肽亲合力的多肽,以及抗体或非抗体结合蛋白组成。除了利用针对上述表位的抗体,免疫沉淀还可以利用针对多肽的抗体来进行,所述抗体可如上所述制备(参见抗体)。
当抗体是小鼠IgG抗体时,可例如利用蛋白A琼脂糖或蛋白G琼脂糖沉淀免疫复合物。如果将本发明的多肽制备成与表位例如GST的融合蛋白,则可利用与这些表位特异性结合的底物(例如谷胱甘肽-Sepharose 4B),以与利用针对多肽的抗体中相同的方式形成免疫复合物。
免疫沉淀可通过例如采用或根据文献中的方法来进行(Harlow and Lane,Antibodies,511-52,Cold Spring Harbor Laboratory publications,New York(1988))。
SDS-PAGE通常用于分析免疫沉淀的蛋白质,结合蛋白可利用适当浓度的凝胶通过蛋白质的分子量来分析。由于与多肽结合的蛋白质难以用通常的染色法(例如考马斯染色法或银染色法)检测,所以可通过在含有放射性同位素(35S-甲硫氨酸或35S-半胱氨酸)的培养基中培养细胞、标记细胞中的蛋白质,并检测所述蛋白质,从而提高蛋白质的检测灵敏度。靶蛋白可直接从SDS聚丙烯酰胺凝胶中纯化,当蛋白质的分子量已知时,可确定其序列。
利用多肽筛选与CX多肽结合的蛋白质的方法,例如West-Western印迹分析(Skolnik et al.,Cell 65:83-90(1991))可以使用。具体地,可通过以下步骤获得与CX多肽结合的蛋白质:利用噬菌体载体(如ZAP)从细胞、组织、器官(参见定义中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)或预期表达与CX多肽结合的蛋白质的培养细胞中制备cDNA文库,在LB-琼脂糖上表达蛋白质,使表达的蛋白质固定在滤膜上,使纯化并标记的CX多肽与以上滤膜反应,以及依据标记来检测表达与CX多肽结合的蛋白质的噬斑。所述CX多肽可利用生物素与亲和素之间的结合来标记,或者利用与CX多肽特异性结合的抗体,或与CX多肽融合的肽或多肽(例如GST)来标记。也可使用利用放射性同位素或荧光等的方法。
本说明书中使用术语“标签(label)”和“可检测标签(detectable label)”,指的是可通过光谱、光化学、生物化学、免疫化学、电、光学或化学方法检测的任意组合物。所述标签包括以标记的链亲合素偶联物染色的生物素,磁珠(例如DYNABEADSTM),荧光染料(如荧光素、德克萨斯红、罗丹明、绿色荧光蛋白等),放射性示踪标记(如3H、125I、35S、14C或32P),酶(如辣根过氧化物酶、碱性磷酸酶和其他通常用在ELISA中的酶)以及量热标签,例如胶态金或有色玻璃或者塑料(如聚苯乙烯、聚丙烯、胶乳等)珠。教导所述标签的应用的专利包括美国专利3,817,837;3,850,752;3,939,350;3,996,345;4,275,149;和4,366,241。检测所述标签的方法是本领域技术人员众所周知的。因而例如,放射性示踪标记可利用胶片或闪烁计数器检测,荧光标记可利用光检测器测定发光来检测。酶标记通常通过为酶提供底物并检测酶作用于底物产生的反应产物来检测,量热标记通过简单地使有色标签显影来检测。
或者,在本发明筛选方法的另一个实施方案中,可使用利用细胞的双杂交系统(″MATCHMAKER Two-Hybrid system″,″MammalianMATCHMAKER Two-Hybrid Assay Kit″,″MATCHMAKER one-Hybridsystem″(Clontech);″HybriZAP Two-Hybrid Vector System″(Stratagene);参考文献″Dalton and Treisman,Cell 68:597-612(1992)″,″Fields and Sternglanz,Trends Genet 10:286-92(1994)″)。
在所述双杂交系统中,本发明的多肽与SRF-结合区或GAL4-结合区融合,并在酵母细胞中表达。从预期表达与本发明多肽结合的蛋白的细胞制备cDNA文库,从而使该文库在被表达时与VP16或GAL4转录激活区融合。然后将所述cDNA文库导入上述酵母细胞,从检测到的阳性克隆分离源自文库的cDNA(当与本发明多肽结合的蛋白质在酵母细胞中表达时,两者的结合激活报告基因,使得阳性克隆可检测到)。由cDNA编码的蛋白质可通过将上述分离的cDNA导入大肠杆菌并表达所述蛋白从而制备。
除HIS3基因外,例如Ade2基因、lacZ基因、CAT基因、萤光素酶基因等也可用作报告基因。
还可以利用亲和层析筛选与CX多肽结合的化合物。例如,可将CX多肽固定在亲和柱的载体上,将含有能够与CX多肽结合的蛋白质的受试化合物施加到所述柱上。本说明书中受试化合物可例如为细胞提取物、细胞裂解物等。受试化合物上样后,洗柱,可制得结合于CX多肽的化合物。
当所述受试化合物为蛋白质时,分析获得的蛋白质的氨基酸序列,根据所述序列合成寡核苷酸DNA,利用所述寡核苷酸DNA作为探针筛选cDNA文库从而得到编码蛋白质的DNA。
利用表面等离子体共振现象的生物传感器可以在本发明中用作检测或定量结合化合物的装置。当使用这种生物传感器时,可以仅使用微量并且没有标记的多肽(例如BIAcore,Pharmacia),以表面等离子体共振信号的形式对本发明多肽与测试化合物间的相互作用进行实时的观察。因此,使用生物传感器,例如BIAcore,人们就有可能对本发明多肽与测试化合物间的结合进行评估。
对于抑制CX蛋白与其结合伴侣(例如EPHA7/EGFR、CDCA5/CDC2、CDCA5/ERK、STK31/c-raf、STK31/MEK和STK31/ERK)之间结合的化合物的筛选方法,可以使用本领域技术人员众所周知的许多方法。例如,筛选可以以体外测定系统(例如细胞系统)进行。更具体地,首先,使CX蛋白或者其结合配偶结合到载体上,再把其他蛋白与受试化合物一起加入。例如使CDCA5多肽、或CDC2多肽、或ERK多肽结合到载体上,将结合配偶多肽与受试化合物一起加入。然后,温育、洗涤混合物,检测和/或测定与载体结合的其他蛋白。
在本发明的上下文中,两种蛋白质之间″结合的抑制(inhibition ofbinding)″指的是至少降低蛋白质间的结合。因此,在某些情况下,与适当的(例如,未用受试化合物处理或者来自非癌症样本或来自癌症样本的)对照相比较,在测试剂存在下样本中结合对的百分比将降低。与对照样本中结合对相比较,所述结合的蛋白降低的量可例如为小于90%、80%、70%、60%、50%、40%、25%、10%、5%、1%或更小(如0%)。
可用于结合蛋白质的支持物的实例例如包括不溶性多糖,如琼脂糖、纤维素和葡聚糖;及合成树脂,如聚丙烯酰胺、聚苯乙烯和硅橡胶;例如,可使用由以上材料制备的商业上可得到的珠子和平板(例如多孔板、生物传感器芯片等)。当使用珠子时,可将它们填充至柱子中。或者,磁珠的使用也是本领域公知的,它使得人们能够通过磁性容易地分离结合在珠子上的蛋白质。
蛋白质与支持物的结合可以例如根据常规方法进行,例如化学键和物理吸附。或者,可通过特异性识别蛋白质的抗体使蛋白质与支持物结合。此外,蛋白质与支持物的结合还可利用亲合素与生物素来进行。
筛选当固定的多肽暴露时与合成化学化合物,或天然底物库,或随机噬菌体肽展示库结合的分子的方法,以及根据组合化学技术利用高通量筛选不仅分离蛋白质还有与蛋白质结合的化合物(包括激动剂和拮抗剂)的方法(Wrighton et al.,Science 273:458-63(1996);Verdine,Nature 384:11-3(1996)),是本领域技术人员众所周知的。
此外,多肽或其功能等价物的磷酸化水平可根据本领域公知的任何方法检测。例如,使受试化合物与多肽表达细胞接触,所述细胞温育足够长时间使得多肽可磷酸化,然后可检测磷酸化多肽的量。或者,使受试化合物与多肽在体外接触,在允许多肽磷酸化的条件下温育所述多肽,然后可检测磷酸化多肽的量(参见(14)体外和体内激酶测定)。
在本发明中,可提供适合于磷酸化的条件,在磷酸盐供体(如ATP)存在下温育底物和酶蛋白。适合于磷酸化的条件还包括培养表达多肽的细胞的条件。例如,所述细胞是包含表达载体的转化子细胞,所述表达载体包括编码CX多肽的多核苷酸(参见定义中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。温育后,可例如用识别磷酸化底物的抗体或通过检测由ATP磷酸盐供体传递的标记的γ-磷酸盐,检测底物的磷酸化水平。在检测磷酸化底物之前,可从其他成分或转化子细胞的细胞裂解物中分离底物。例如,可利用凝胶电泳分离底物。或者,底物可通过与含针对底物的抗体的载体接触而被捕获。
为检测磷酸化蛋白,可使用SDS-PAGE或免疫沉淀法。此外,可使用识别磷酸化残基的抗体或传递的标记的磷酸盐,来检测磷酸化蛋白水平。任何利用识别磷酸化多肽的抗体的免疫学技术都可用于检测。ELISA或用识别磷酸化多肽的抗体的免疫印迹法可用于本发明。当使用标记的磷酸供体时,可通过追踪所述标记来检测底物的磷酸化水平。例如,放射标记的ATP(如32P-ATP)可用作磷酸供体,其中分离的底物的放射性与底物的磷酸化水平相关。或者,可使用特异性识别磷酸化底物与非磷酸化底物的抗体来检测磷酸化底物。
如果检测到的与受试化合物接触的磷酸化CX多肽的量相对于未与受试化合物接触检测到的量降低,则认为受试化合物抑制CX蛋白的多肽磷酸化,因而具有肺癌和/或食道癌抑制能力。在这里,当与未与测试剂接触的细胞检测到的磷酸化水平相比较,磷酸化水平降低例如10%、25%或50%,或至少0.1倍、至少0.2倍、至少1倍、至少2倍、至少5倍或至少12倍或更多时,可认为是磷酸化水平“降低(decreased)”。例如,Student氏t测验(Student’s t-test)、Mann-Whitney U检验或ANOVA可用于统计分析。
此外,多肽或其功能等价物的表达水平可根据本领域公知的任意方法来检测。例如,可使用报告基因测定。合适的报告基因和宿主细胞是本领域众所周知的。可利用CX基因或其下游基因的转录调节区来制备筛选所需的报告基因构建体。当所述基因的转录调节区已为本领域技术人员公知时,可通过利用以前的序列信息制备报告基因构建体。当所述转录调节区还未经确认时,可根据基因的核苷酸序列信息从基因组文库分离包含转录调节区的核苷酸片段。具体地,可通过使报告基因序列连接到所需CX基因的转录调节区来制备筛选所需的报告基因构建体。CX基因的转录调节区是从起始密码子到上游至少500bp(例如1000bp,例如上游5000bp或10000bp)的区域。包含转录调节区的核苷酸片段可从基因组文库分离或者可通过PCR扩增。鉴定转录调节区的方法以及试验方案是众所周知的(Sambrook andRussell,Molecular Cloning:A Laboratory Manual,3rd Ed.,Chapter 17,2001,Cold Springs Harbor Laboratory Press)。
多种低通量和高通量的酶测定形式是本领域公知的,可容易地加以调适以适合于检测或测定CX多肽的磷酸化水平。对于高通量测定,可方便地使底物固定在固体载体上。反应后,可利用上述方法检测固体载体上的磷酸化底物。或者,可在溶液中进行接触步骤,然后可使底物固定在固体载体上,并检测磷酸化底物。为利于所述测定,可用链亲合素包被固体载体,用生物素标记底物,或者可用针对底物的抗体包被固体载体。技术人员可根据筛选所需的通过能力确定合适的测定形式。
本发明的试验还适合于有利于高通量筛选的自动化操作。已开发了许多众所周知的机器人系统用于液相化学。这些系统包括像由TakedaChemical Industries,Ltd.(大阪,日本)开发的自动化合成装置这样的自动化工作站,和许多利用机器臂的机器人系统(Zymate II,Zymark Corporation,Hopkinton,Mass.;Orca,Hewlett Packard,Palo Alto,Calif.),其模拟由化学家进行的手工合成操作。上述设备中任一种都适合于本发明的应用。相关领域技术人员很容易想到对这些设备进行什么性质的改造(若有的话),以及如何实现该改造,以便如本说明书讨论的那样操作这些设备。另外,很多组合文库本身是商业上可得到的(参见例如ComGenex,Princeton,N.J.,Asinex,Moscow,Ru,Tripos,Inc.,St.Louis,MO,ChemStar,Ltd,Moscow,RU,3DPharmaceuticals,Exton,PA,Martek Biosciences,Columbia,MD,etc.)。
(ii)筛选与CX蛋白结合的化合物
在本发明中,检测到了CDCA5在肺癌和食道癌中过表达,而它们在正常器官(除睾丸外)中无表达(图1);检测到了EPHA7在肺癌和食道癌中过表达,而它们在正常器官(除胎儿脑和胎儿肾外)中无表达(图3);检测到了STK31在肺癌和食道癌中过表达,而它们在正常器官(除睾丸外)中无表达(图9);检测到了WDHD1在肺癌和食道癌中过表达,而它们在正常器官(除睾丸外)中无表达(图13,图14A和图14B)。因此,可以利用CDCA5、EPHA7、STK31或WDHD1基因,由所述基因编码的蛋白质、或所述基因的转录调节区,筛选能改变所述基因的表达或由所述基因编码的多肽的生物活性的化合物。所述化合物用作药物治疗或预防肺癌和食道癌,或者用作检测试剂用于诊断肺癌和食道癌以及评估肺癌和/或食道癌患者的预后。
具体地,本发明提供利用CDCA5、EPHA7、STK31或WDHD1多肽来筛选用于诊断、治疗或预防癌症的药剂的方法。该筛选方法的一个实施方案包括以下步骤:
(a)使测试剂与选自下组的多肽或其片段接触:CDCA5、EPHA7、STK31和WDHD1蛋白;
(b)检测多肽与所述测试剂之间的结合;
(c)选择与步骤(a)中所述多肽结合的测试剂。
本发明的方法将在下文更详细地描述。
欲用于筛选的CDCA5、EPHA7、STK31和WDHD1多肽可为重组多肽或者源自天然的蛋白质或其部分肽。与受试化合物接触的多肽可例如为纯化多肽、可溶蛋白、与载体结合的形式.,或同其他多肽融合的融合蛋白。
本领域技术人员众所周知的许多方法可用作利用CDCA5、EPHA7、STK31和WDHD1多肽,筛选例如与CDCA5、EPHA7、STK31和WDHD1多肽结合的蛋白质的方法。所述筛选可例如用免疫沉淀方法进行。通过插入所述基因到表达载体中作为外源基因,例如pSV2neo、pcDNA I、pcDNA3.1、pCAGGS和pCD8,使编码CDCA5、EPHA7、STK31和WDHD1多肽的基因在宿主(如动物)细胞等中表达。
用于表达的启动子可为任何通常可使用的启动子,包括例如SV40早期启动子(Rigby in Williamson(ed.),Genetic Engineering,vol.3.Academic Press,London,83-141(1982))、EF-α启动子(Kim et al.,Gene 91:217-23(1990))、CAG启动子(Niwa et al.,Gene 108:193(1991))、RSV LTR启动子(Cullen,Methods in Enzymology 152:684-704(1987))、SRα启动子(Takebe et al.,MolCell Biol 8:466(1988))、CMV立即早期启动子(Seed and Aruffo,Proc NatlAcad Sci USA 84:3365-9(1987))、SV40晚期启动子(Gheysen and Fiers,J MolAppl Genet 1:385-94(1982))、腺病毒晚期启动子(Kaufman et al.,Mol CellBiol 9:946(1989))、HSV TK启动子等。
基因导入宿主细胞以表达外源基因可根据任意方法进行,例如电穿孔法(Chu et al.,Nucleic Acids Res 15:1311-26(1987))、磷酸钙法(Chen andOkayama,Mol Cell Biol 7:2745-52(1987))、DEAE葡聚糖法(Lopata et al.,Nucleic Acids Res 12:5707-17(1984);Sussman and Milman,Mol Cell Biol 4:1641-3(1984))、Lipofectin法(Derijard B.,Cell 76:1025-37(1994);Lamb et al.,Nature Genetics 5:22-30(1993):Rabindran et al.,Science 259:230-4(1993))等。
通过引入特异性已知的单克隆抗体的表位至多肽的N-末端或C-末端,可使由CDCA5、EPHA7、STK31和WDHD1基因编码的多肽表达为包括单克隆抗体的识别位点(表位)的融合蛋白。可使用商业上可得到的表位-抗体系统(Experimental Medicine 13:85-90(1995))。可表达例如与β-半乳糖苷酶、麦芽糖结合蛋白、谷胱甘肽S-转移酶、绿色荧光蛋白(GFP)等的融合蛋白的载体(通过使用其多克隆位点)是商业上可得到的。而且,还报道了仅通过引入由数个至十二个(a dozen)氨基酸组成的小型表位而制备的融合蛋白,目的是不会通过融合改变CX多肽的性质。表位例如多组氨酸(His标签)、流感凝集素HA、人c-myc、FLAG、水疱性口炎病毒糖蛋白(VSV-GP)、T7基因10蛋白(T7标签)、人单纯疱疹病毒糖蛋白(HSV标签)、E-标签(单克隆噬菌体上的表位)等,以及识别它们的单克隆抗体,可用作表位-抗体系统,用于筛选与CX多肽结合的蛋白质(Experimental Medicine 13:85-90(1995))。
在免疫沉淀法中,将这些抗体添加到利用适当去污剂制备的细胞裂解物中,以形成免疫复合物。所述免疫复合物由CX多肽、包括与多肽结合能力的多肽,及抗体组成。除了利用针对上述表位的抗体之外,还可利用针对CX多肽的抗体进行免疫沉淀,这样的抗体可如上所述制备。当抗体是小鼠IgG抗体时,可例如利用蛋白A Sepharose或蛋白G Sepharose沉淀免疫复合物。如果将由CX基因编码的多肽制备成与表位(例如GST)融合的融合蛋白,则可利用与这些表位特异性结合的底物(例如谷胱甘肽-Sepharose4B),以与利用针对CX多肽的抗体中相同的方式形成免疫复合物。
免疫沉淀可通过例如采用或根据文献中的方法来进行(Harlow and Lane,Antibodies,511-52,Cold Spring Harbor Laboratory publications,New York(1988))。
SDS-PAGE通常用于分析免疫沉淀的蛋白质,结合蛋白可利用适当浓度的凝胶通过蛋白质的分子量来分析。由于与CDCA5、EPHA7、STK31和WDHD1多肽结合的蛋白质难以用通常的染色法(例如考马斯染色法或银染色法)检测,所以可通过在含有放射性同位素(35S-甲硫氨酸或35S-半胱氨酸)的培养基中培养细胞、标记细胞中的蛋白质及检测所述蛋白质,从而提高蛋白质的检测灵敏度。靶蛋白可直接从SDS聚丙烯酰胺凝胶中纯化,当蛋白质的分子量已知时,可确定其序列。
作为利用多肽筛选与CDCA5、EPHA7、STK31和WDHD1多肽结合的蛋白质的方法,可以使用例如West-Western印迹分析(Skolnik et al.,Cell 65:83-90(1991))。具体地,可通过以下步骤获得与CX多肽结合的蛋白质:利用噬菌体载体(如ZAP)从预期表达与CX多肽结合的蛋白质的培养细胞(例如肺癌细胞系或食道癌细胞系)中制备cDNA文库,在LB-琼脂糖上表达蛋白质,使表达的蛋白质固定在滤膜上,使纯化并标记的CX多肽与以上滤膜反应,以及根据标记检测表达与CDCA5、EPHA7、STK31和WDHD1多肽结合的蛋白质的噬斑。本发明的多肽可利用生物素与亲合素之间的结合来标记,或者利用与CDCA5、EPHA7、STK31和WDHD1多肽特异性结合的抗体,或与CDCA5、EPHA7、STK31和WDHD1多肽融合的肽或多肽(例如GST)来标记。利用放射性同位素或荧光等的方法也可使用。
或者,在本发明筛选方法的另一个实施方案中,可使用利用细胞的双杂交系统(“MATCHMAKER Two-Hybrid system”,“MammalianMATCHMAKER Two-Hybrid Assay Kit”,“MATCHMAKER one-Hybridsystem”(Clontech);“HybriZAP Two-Hybrid Vector System”(Stratagene);参考文献“Dalton and Treisman,Cell 68:597-612(1992)”,“Fields and Sternglanz,Trends Genet 10:286-92(1994)”)。
在所述双杂交系统中,本发明的多肽与SRF-结合区或GAL4-结合区融合,并在酵母细胞中表达。从预期表达与本发明多肽结合的蛋白质的细胞制备cDNA文库,以便表达时所述文库与VP16或GAL4转录激活区融合。然后将所述cDNA文库导入上述酵母细胞,从检测到的阳性克隆分离源自文库的cDNA(当与本发明多肽结合的蛋白质在酵母细胞中表达时,两者的结合激活报告基因,使得阳性克隆可检测到)。由cDNA编码的蛋白质可通过将上述分离的cDNA导入大肠杆菌并表达所述蛋白从而制备。除HIS3基因外,例如Ade2基因、lacZ基因、CAT基因、萤光素酶基因等也可用作报告基因。
还可以利用亲和层析筛选与由CX基因编码的多肽结合的化合物。例如,可将本发明的多肽固定在亲和柱的载体上,含有能够与本发明的多肽结合的蛋白质的受试化合物施加于所述柱。本说明书中受试化合物可例如为细胞提取物、细胞裂解物等。受试化合物上样后,洗柱,可制备与本发明的多肽结合的化合物。当所述受试化合物为蛋白质时,分析获得的蛋白质的氨基酸序列,根据所述序列合成寡核苷酸DNA,利用所述寡核苷酸DNA作为探针筛选cDNA文库从而得到编码蛋白质的DNA。
利用表面等离子体共振现象的生物传感器可以在本发明中用作检测或定量结合化合物的装置。当使用这种生物传感器时,可以仅使用微量并且没有标记的多肽(例如BIAcore,Pharmacia),以表面等离子体共振信号的形式对本发明多肽与测试化合物间的相互作用进行实时的观察。因此,使用生物传感器,例如BIAcore,人们就有可能对本发明多肽与测试化合物间的结合进行评估。
筛选当固定的多肽暴露时与合成化学化合物,或天然底物库,或随机噬菌体肽展示库结合的分子的方法,以及根据组合化学技术利用高通量筛选不仅分离蛋白质还有与CX蛋白结合的化合物(包括激动剂和拮抗剂)的方法(Wrighton et al.,Science 273:458-63(1996);Verdine,Nature 384:11-3(1996)),是本领域技术人员众所周知的。
(iii)筛选抑制CX基因生物活性的化合物
在本发明中,CDCA5蛋白具有促进癌细胞增殖的活性(图2)和磷酸化活性(图17C);EPHA7蛋白具有促进细胞的细胞增殖的活性(图6),促进细胞侵袭的活性(图7),对EGFR的结合活性(图8B),对EGFR的激酶活性(Tyr-845、Tyr-1068、Tyr-1086、Tyr-1173)(图8A,图20E,图21)和促进PLCgamma(Tyr783)、CDC25(Ser-216)、MET(Tyr-1230/1234/1235,Tyr-1313,Tyr-1349,Tyr-1365)(GenBank登录号:NM_000245,SEQ ID NO.:56)磷酸化的活性(图8A,图21);STK31蛋白具有促进癌细胞增殖的活性(图11),激酶活性(图12A)和促进EGFR(Ser1046/1047)、ERK(ERK1/2,P44/42MAPK)(Thr202/Thr204)和MEK磷酸化的活性(图12B,图12D);WDHD1蛋白具有促进癌细胞增殖的活性(图15A),促进细胞生存力的活性(图15C)和磷酸化活性(图16A)。利用这种生物活性,可筛选抑制该蛋白这种活性的化合物。因此,本发明提供一种方法,利用由CDCA5、EPHA7、STK31或WDHD1基因编码的多肽筛选用于治疗或预防表达CDCA5、EPHA7、STK31或WDHD1基因的癌症,例如肺癌(非小细胞肺癌或小细胞肺癌)或食道癌,的化合物。
具体地,本发明提供以下[1]至[19]的方法:
[1]一种筛选试剂的方法,所述试剂用于治疗或预防表达至少一种选自下组的基因的癌症:CDCA5、EPHA7、STK31和WDHD1,所述方法包括以下步骤:
(a)使测试剂与表达多核苷酸的细胞接触,所述多核苷酸编码由癌症中表达的基因编码的多肽,或其功能等价物;
(b)检测步骤(a)中所述多核苷酸或多肽的水平;
(c)将步骤(b)中检测到的所述水平与在无测试剂存在下检测到的水平相比较;和
(d)选择降低或抑制(c)中所述水平的测试剂。
[2][1]中的方法,其中所述水平通过选自下组的任一种方法检测:
(a)检测编码选自下组的多肽或其功能等价物的mRNA的量:CDCA5、EPHA7、STK31和WDHD1多肽;
(b)检测选自下组的多肽或其功能等价物的量:CDCA5、EPHA7、STK31和WDHD1多肽;和
(c)检测选自下组的多肽或其功能等价物的生物活性:CDCA5、EPHA7、STK31和WDHD1多肽。
[3][2]中的方法,其中所述生物活性是选自下组的任一种活性:
(a)表达选自下组的多肽或其功能等价物的细胞的增殖活性:CDCA5、EPHA7、STK31和WDHD1多肽;
(b)表达EPHA7多肽或其功能等价物的细胞的侵袭活性;和
(c)选自下组的多肽或其功能等价物的激酶活性:EPHA7和STK31多肽。
本发明的方法将在下文更详细地描述。
任何多肽都可用于筛选,只要它们包含CDCA5、EPHA7、STK31和WDHD1蛋白的生物活性。所述生物活性包括:CDCA5、EPHA7、STK31或WDHD1的细胞增殖活性;EPHA7的促进细胞侵袭的活性;EPHA7的EGFR-结合活性;或者EPHA7蛋白的胞外分泌活性;EPHA7或STK31的激酶活性;WDHD1的磷酸化活性或者WDHD1的细胞生存促进活性。例如,可使用CDCA5、EPHA7、STK31或WDHD1蛋白,还可使用与这些蛋白质功能等价的多肽。所述多肽可由细胞内源或外源表达。
通过这种筛选分离的化合物是由CDCA5、EPHA7、STK31或WDHD1基因编码的多肽的拮抗剂的候选物。术语“拮抗剂(antagonist)”指的是通过与多肽结合,从而抑制多肽功能的分子。所述术语还指降低或抑制编码CDCA5、EPHA7、STK31或WDHD1的基因表达的分子。此外,通过这种筛选分离的化合物是抑制CDCA5、EPHA7、STK31或WDHD1多肽与分子(包括DNA和蛋白质)在体内相互作用的化合物的候选物。
当本方法中欲检测的生物活性为细胞增殖时,可例如通过下述方法来检测:制备表达选自CDCA5、EPHA7、STK31或WDHD1的多肽的细胞,在受试化合物存在下培养所述细胞,并测定细胞增殖的速度,测定细胞周期等,以及通过测定集落形成活性,如[实施例2-5]中所示的MTT测定、集落形成测定或FACS。
当本方法欲检测的生物活性为EPHA7的胞外分泌时,可例如通过下述方法来检测:在受试化合物存在下培养表达EPHA7多肽的细胞,测定EPHA7蛋白在培养基中的量,从而测定所述EPHA7的胞外分泌活性,例如图2G,下图所示。
本说明书中定义的术语“抑制生物活性(suppress the biological activity)”指的是与无化合物存在下相比较,CDCA5、EPHA7、STK31或WDHD1的生物活性抑制至少10%,例如至少抑制25%、50%或75%,至少抑制90%。
(iv)筛选改变CX基因表达的化合物
在本发明中,特异性针对CX基因的双链分子降低CX基因的表达,导致抑制癌细胞增殖(CDCA5见图2;EPHA7见图6;STK31见图11;WDHD1见图15)。因此,利用CX基因表达水平作为指标进行筛选,可以鉴定出能用于膀胱癌治疗或预防的化合物。在本发明的上下文中,所述筛选可例如包括以下步骤:
(a)使候选化合物与表达CDCA5、EPHA7、STK31或WDHD的细胞接触;和
(b)选择与对照相比较,降低CDCA5、EPHA7、STK31或WDHD表达水平的候选化合物。
本发明的方法将在下文更详细地描述。
表达CDCA5、EPHA7、STK31或WDHD的细胞例如包括由肺癌或食道癌建立的细胞系;所述细胞可用于本发明的上述筛选(例如,A549和LC319用于CDCA5;NCI-H520和SBC-5用于EPHA7;LC319和NCI-H2170用于STK31;LC319和TE9用于WDHD1)。表达水平可用本领域技术人员众所周知的方法评估,例如RT-PCR、Northern印迹试验、Western印迹试验、免疫染色、ELISA或流式细胞术分析。本说明书中定义的术语“降低表达水平(reduce the expression level)”指的是与在无化合物存在下的表达水平相比较,CDCA5、EPHA7、STK31或WDHD的表达水平降低至少10%,例如降低至少25%、50%或75%的水平,例如降低至少95%的水平。本说明书中的化合物包括化学化合物、双链核苷酸等。双链核苷酸的制备在上文描述。在筛选方法中,可选择降低CDCA5、EPHA7、STK31或WDHD表达水平的化合物作为用于治疗或预防癌症(如肺癌和/或食道癌)的候选药剂。
或者,本发明的筛选方法可包括以下步骤:
(a)使候选化合物与细胞接触,所述细胞中已导入了包含CDCA5、EPHA7、STK31或WDHD的转录调节区和在转录调节区控制下表达的报告基因的载体;
(b)测定所述报告基因的表达或活性,和
(c)选择降低所述报告基因表达或活性的候选化合物。
合适的报告基因和宿主细胞是本领域众所周知的。例如,报告基因为萤光素酶、绿色荧光蛋白(GFP)、香菇珊瑚(Discosoma.sp)红色荧光蛋白(DsRed)、氯霉素乙酰转移酶(CAT)、lacZ和β葡萄糖苷酸酶(GUS),宿主细胞为COS7、HEK293、HeLa等。可通过使报告基因序列连接到CX的转录调节区来制备筛选所需的报告基因构建体。本说明书中CX的转录调节区是从起始密码子到上游至少500bp(例如1000bp,例如上游5000bp或10000bp,但并不限于此)的区域。包含转录调节区的核苷酸片段可从基因组文库分离或者可通过PCR扩增。鉴定转录调节区的方法以及试验方案是众所周知的(Molecular Cloning third edition chapter 17,2001,Cold Springs HarborLaboratory Press)。
使包含所述报告基因构建体的载体感染宿主细胞,用本领域众所周知的方法(例如,利用光度计、吸收分光光度计、流式细胞仪等)检测所述报告基因的表达或活性。本说明书中定义的“降低表达或活性(reduces theexpression or activity)”指的是与无化合物存在下相比较,报告基因的表达或活性降低至少10%,例如至少降低25%、50%或75%,例如至少降低95%。
以下实施例中描述本发明的各个方面,其并非意欲限制权利要求书中所述的本发明的范围。
除非另外限定,本说明书中使用的全部技术术语和科学术语均与本发明所属技术领域的普通技术人员一般理解的含义相同。尽管与本说明书中的所述类似或等同的方法和材料均可用于实施或检验本发明,但以下描述了合适的方法和材料。
以下实施例中将进一步描述本发明,其并不限制权利要求书中所述的本发明的范围。
(v)利用EPHA7与EGFR的结合作为指标的筛选
在本发明中,证实了EPHA7蛋白与EGFR蛋白相互作用(图8B),且在EGFR蛋白的Tyr-845处磷酸化(图8A)。另外,还证实了EPHA7蛋白存在下,促进PLCgamma(Tyr-783),CDC25(Ser-216),MET(Tyr-1230/1234/1235、Tyr-1313、Tyr-1349、Tyr-1365),Shc(Tyr317、Tyr239/240)(GenBank登录号:NM_001130041,SEQ ID NO.:58),ERK(p44/42MAPK)(Thr202/Tyr204),Akt(Ser473)(GenBank登录号:NM_001014431,SEQ ID NO.:60)和STAT3(Tyr705)(GenBank登录号:NM_139276,SEQ ID NO.:62)的磷酸化(图8A,图21,图22)。已知EPHA7具有一个位于633-890aa的蛋白激酶域共有序列。因此,本发明人鉴定了EGFR为EPHA7的底物,而后者的途径公知与细胞增殖和侵袭有关。因而,可利用EPHA7蛋白与EGFR蛋白的所述结合或者EGFR蛋白(Tyr-845)的磷酸化水平作为指标,筛选抑制EPHA7蛋白与EGFR蛋白之间结合的化合物。此外,本发明人鉴定了MET与EPHA7的相互作用。因此,本发明还提供一种筛选用于抑制EPHA7蛋白与EGFR或MET蛋白之间的结合的化合物的方法,可利用EPHA7蛋白与EGFR或MET蛋白的所述结合或者EGFR蛋白(Tyr-845)的磷酸化水平作为指标来筛选。此外,本发明还提供了一种筛选用于抑制或降低表达EPHA7的癌细胞(例如肺癌细胞和/或食道癌细胞)的生长的化合物,以及用于治疗或预防癌症(例如肺癌和/或食道癌)的化合物的方法。
具体地,本发明提供以下[1]至[5]的方法:
[1]一种筛选阻断EPHA7多肽与EGFR或MET多肽之间结合的试剂的方法,所述方法包括以下步骤:
(a)使EPHA7多肽或其功能等价物与EGFR或MET多肽或其功能等价物在测试剂存在下接触;
(b)检测所述多肽之间的结合;
(c)将步骤(b)中检测到的结合水平与在无测试剂存在下检测到的结合水平相比较;和
(d)选择降低或抑制所述结合水平的测试剂。
[2]一种筛选用于治疗或预防癌症的试剂的方法,所述方法包括以下步骤:
(a)使EPHA7多肽或其功能等价物与EGFR或MET多肽或其功能等价物在测试剂存在下接触;
(b)检测多肽之间的结合;
(c)将步骤(b)中检测到的结合水平与在无测试剂存在下检测到的结合水平相比较;和
(d)选择降低或抑制所述结合水平的测试剂。
[3][1]或[2]中的方法,其中EPHA7的功能等价物包括EGFR-结合域。
[4][1]或[2]中的方法,其中EGFR或MET的功能等价物包括EPHA7-结合域。
[5][1]中的方法,其中所述癌症选自肺癌和食道癌。
在本发明的上下文中,EPHA7、EGFR或MET多肽的功能等价物是分别具有与EPHA7多肽(SEQ ID NO:4)、EGFR或MET多肽等价的生物活性的多肽(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物或者[实施例1]中(6)“表达载体”)。更具体地,EGFR的功能等价物是包括SEQ ID NO:75的氨基酸序列的多肽片段,MET的功能等价物是包括SEQID NO:76的氨基酸序列的多肽片段,包括EPHA7结合域。
本领域技术人员众所周知的许多方法可用作筛选调节(例如抑制)EPHA7与EGFR的结合的化合物的方法。
欲用于筛选的多肽可为重组多肽或源自天然来源的蛋白质,或者其部分肽。上述任一种受试化合物都可用于筛选。
本领域技术人员众所周知的许多方法可用作筛选例如利用EPHA7或EGFR多肽或其功能等价物与多肽结合的蛋白质的方法(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。所述筛选可例如利用免疫沉淀、West-Western印迹分析(Skolnik et al.,Cell 65:83-90(1991))、利用细胞的双杂交系统(″MATCHMAKER Two-Hybrid system″,″MammalianMATCHMAKER Two-Hybrid Assay Kit″,″MATCHMAKER one-Hybridsystem″(Clontech);″HybriZAP Two-Hybrid Vector System″(Stratagene);参考文献″Dalton and Treisman,Cell 68:597-612(1992)″,″Fields and Sternglanz,Trends Genet 10:286-92(1994)″)、亲和层析以及利用表面等离子共振现象的生物传感器进行(参见(i)通用筛选方法)。
可使用上述任一种受试化合物(参见(1)筛选的受试化合物)。
在一些实施方案中,该方法进一步包括检测候选化合物与EPHA7蛋白或EGFR结合的步骤,或者检测EPHA7蛋白与EGFR蛋白结合水平的步骤。表达EPHA7蛋白和EGFR蛋白的细胞例如包括由癌症(如肺癌和/或食道癌)建立的细胞系,所述细胞可用于本发明的上述筛选,只要所述细胞表达这两种基因。或者,可用EPHA7和EGFR的表达载体或其中任何一种表达载体转染细胞,以表达这两种基因。EPHA7蛋白与EGFR蛋白的结合可利用抗-EPHA7抗体和抗-EGFR抗体通过免疫沉淀试验来检测(图8B)。
(vii)利用EPHA7-介导的磷酸化作为指标的筛选
根据本发明的另一方面,抑制或降低EGFR,PLC-gamma(SEQ ID NO.:52,GenBank登录号:NM_002660),CDC25(SEQ ID NO.:54,GenBank登录号:NM_001790),MET(SEQ ID NO.:56,GenBank登录号:NM_000245),Shc(SEQ ID NO.:58,GenBank登录号:NM_001130041),ERK(p44/42MAPK)(SEQ ID NO.:50,GenBank登录号:NM_001040056),Akt(SEQ IDNO.:60,GenBank登录号:NM_001014431)或STAT3(SEQ ID NO.:62,GenBank登录号:NM_139276)的EPHA7-介导的磷酸化的试剂可用于抑制或降低表达EPHA7的癌细胞(例如肺癌细胞或食道癌细胞)的生长,且可用于治疗或预防表达EPHA7的癌症(例如肺癌或食道癌),利用EPHA7-介导的磷酸化水平作为指标来进行筛选。
具体地,本发明提供以下[1]至[5]的方法:
[1]一种筛选调节EPHA7-介导的磷酸化的试剂或者预防或治疗表达EPHA7基因的癌症的试剂的方法,所述方法包括以下步骤:
(a)使测试剂与
(i)EPHA7多肽或其功能等价物和
(ii)作为底物的EGFR、PLC-gamma、CDC25、MET、Shc、ERK(p44/42MAPK)、Akt或STAT3多肽或其功能等价物;
在允许底物磷酸化的条件下接触;
(b)检测底物的磷酸化水平;
(c)将步骤(b)中检测到的磷酸化水平与在无测试剂存在下检测到的磷酸化水平相比较;和
(d)选择抑制或降低该磷酸化水平的测试剂作为抑制剂,或者选择促进或增强该磷酸化水平的测试剂作为增强剂。
[2]一种筛选用于预防或治疗癌症的试剂的方法,所述方法包括以下步骤:
(a)使测试剂与
(i)EPHA7多肽或其功能等价物和
(ii)EGFR、PLC-gamma、CDC25、MET、Shc、ERK(p44/42MAPK)、Akt或STAT3多肽或其功能等价物作为底物;
在允许底物磷酸化的条件下接触;
(b)检测底物的磷酸化水平;
(c)将步骤(b)中检测到的磷酸化水平与在无测试剂存在下检测到的磷酸化水平相比较;和
(d)选择抑制或降低所述磷酸化水平的测试剂。
[3][1]或[2]中的方法,其中EGFR、PLC-gamma、CDC25、MET、Shc、ERK(p44/42MAPK)、Akt或STAT3多肽的功能等价物包括所述多肽的至少一个EPHA7-介导的磷酸化位点。
[4][3]中的方法,其中EPHA7-介导的磷酸化位点为EGFR的Tyr845、Tyr-1068、Tyr-1086或Tyr-1173,PLCgamma的Tyr-783,CDC25的Ser-216,MET的Tyr-1230/1234/1235、Tyr-1313、Tyr-1349或Tyr-1365,Shc的Tyr317或Tyr239/240,ERK(p44/42MAPK)的Thr202/Tyr204,或Akt多肽的Ser473。
[5][2]中的方法,其中所述癌症选自下组:肺癌和食道癌。
用在筛选中的EPHA7多肽或其功能等价物可以利用本领域技术人员众所周知的方法制备成重组蛋白或天然蛋白。可采用如上所述生产多肽的任何已知的基因工程方法(例如,Morrison J.,J Bacteriology 1977,132:349-51;Clark-Curtiss & Curtiss,Methods in Enzymology(eds.Wu et al.)1983,101:347-62)获得所述多肽(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。
而且,EPHA7蛋白的部分肽也可用于本发明,只要其保留蛋白质的激酶活性。这样的部分肽可利用基因工程,利用已知的肽合成方法,或者通过用适当的肽酶消化天然EPHA7蛋白来产生(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。
用来与测试剂和EGFR蛋白接触的EPHA7多肽或其功能等价物可为,例如,纯化的多肽、可溶蛋白或者与其他多肽融合的融合蛋白。
类似于EPHA7多肽,用于本筛选的EGFR多肽可以作为重组蛋白或天然蛋白制备。此外,EGFR多肽可制备成融合蛋白,只要产生的融合蛋白可被EPHA7多肽磷酸化。EGFR的核苷酸序列是本领域众所周知的。而且,EGFR也是商业上可得到的。
在这些实施方案中,允许EGFR多肽磷酸化的条件,可以通过将EGFR多肽、要被EGFR多肽磷酸化的EPHA7多肽、以及ATP一起温育来提供(参见[实施例1]中(14)体外激酶测定)。另外,在本发明中,可将能增强EPHA7多肽激酶活性的底物加至筛选的反应混合物中。当底物的磷酸化通过加入该物质而增强时,底物的磷酸化水平测定的灵敏度可以更高。
EPHA7多肽或其功能等价物、其底物和测试剂的接触可在体内或体外进行。体外筛选可在缓冲液中进行,例如但不限于磷酸盐缓冲液和Tris缓冲液,只要所述缓冲液不抑制底物被EPHA7多肽或其功能等价物磷酸化。
在本发明中,底物的磷酸化水平可利用本领域公知的方法测定(参见(2)通用筛选方法)。
(viii)利用STK31激酶活性作为指标的筛选
在本发明中,证实了在STK31蛋白存在下EGFR(Ser1046/1047)、ERK(P44/42MAPK)(Thr202/Tyr204)、和MEK(S217/221)的磷酸化的促进作用(图12B,图12C,图12D)。已知STK31蛋白在745-972aa具有STYKc域的共有序列。因此,本发明人鉴定了EGFR、ERK(P44/42MAPK)和MEK为STK31的下游靶标。已证明,EGFR的Ser1046/1047被Ca2+/钙调蛋白依赖性激酶II(CaM kinase II)磷酸化,且其磷酸化减弱EGFR激酶活性。还有人报道了CaM kinase II引起调节细胞生长的ERK(P44/42MAPK)活化。因此,能抑制或降低STK31激酶活性的化合物可用于抑制或减少表达STK31的癌细胞(例如肺癌细胞和/或食道癌细胞),且可用于治疗或预防表达STK31的癌症(例如肺癌和/或食道癌)。此外,本发明人利用MBP作为底物证实了STK31的激酶活性。因而,可利用MBP的磷酸化水平来筛选能抑制SYK31激酶活性的化合物。因此,本发明还提供了一种利用所述STK31激酶活性作为指标来筛选用于抑制或降低癌细胞生长的化合物的方法。此外,本发明还提供了一种筛选用于抑制或降低表达EPHA7的癌细胞(例如肺癌细胞和/或食道癌细胞)的化合物的方法。所述方法特别适合用于筛选可在表达EPHA7的癌症(例如肺癌和/或食道癌)中使用的试剂。
具体地,本发明提供以下[1]至[3]的方法:
[1]一种筛选用于预防或治疗癌症的试剂的方法,其中所述方法包括以下步骤:
(a)使测试剂与
(i)STK31多肽或其功能等价物和
(ii)底物;
在允许底物磷酸化的条件下接触;
(b)检测底物的磷酸化水平;
(c)将步骤(b)中检测到的磷酸化水平与在无测试剂存在下检测到的磷酸化水平相比较;和
(d)选择抑制或降低所述磷酸化水平的测试剂。
[2][1]中的方法,其中所述底物为MBP、EGFR、ERK(P44/42MAPK)或MEK。
[3][1]中的方法,其中癌症选自下组:肺癌和食道癌。
用在筛选中的STK31多肽或其功能等价物可以利用本领域技术人员众所周知的方法制备成重组蛋白或天然蛋白。可采用如上所述生产多肽的任何已知的基因工程方法(例如,Morrison J.,J Bacteriology 1977,132:349-51;Clark-Curtiss & Curtiss,Methods in Enzymology(eds.Wu et al.)1983,101:347-62)获得所述多肽(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。
而且,STK31蛋白的部分肽也可用于本发明,只要其保留该蛋白质的激酶活性。所述部分肽可利用基因工程,利用已知的肽合成方法,或者通过用适当的肽酶消化天然STK31蛋白而产生(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。
用来与测试剂和底物例如MBP、EGFR、ERK(P44/42MAPK)/或MEK接触的STK31多肽或其功能等价物可以是,例如,纯化的多肽、可溶蛋白,或者与其它多肽融合的融合多肽。
在这些实施方案中,允许底物磷酸化的条件,可以通过将底物与要磷酸化底物的STK31多肽和ATP一起温育来提供(参见[实施例1]中(14)体外激酶测定)。另外,在本发明中,可将增强STK31多肽激酶活性的底物加到筛选的反应混合物中。当通过加入所述底物增强了底物的磷酸化时,测定底物的磷酸化水平的灵敏度可以更高。
STK31多肽或其功能等价物、其底物和测试剂的接触可在体内或体外进行。体外筛选可在缓冲液中进行,例如但不限于磷酸盐缓冲液和Tris缓冲液,只要所述缓冲液不抑制底物被STK31多肽或其功能等价物磷酸化。
在本发明中,底物的磷酸化水平可利用本领域公知的方法测定(参见(2)通用筛选方法)。
(ix)利用STK31与c-raf、MEK或ERK(p44/42MAPK)的结合作为指标的筛选
在本发明中,证实了STK31蛋白与c-raf(GenBank登录号:NM_002880,SEQ ID NO.:64)、MEK或ERK蛋白相互作用(图12F),且磷酸化EGFR蛋白的Ser-1046/1047,ERK(p44/42MAPK)的Thr202/Tyr204和MEK(图12B,图12D)。可利用STK31蛋白与c-raf、MEK或ERK(p44/42MAPK)蛋白的所述结合作为指标,筛选抑制STK31蛋白与c-raf、MEK或ERK(p44/42MAPK)蛋白之间结合的化合物。因此,本发明还提供一种利用STK31蛋白与c-raf、MEK或ERK(p44/42MAPK)的所述结合筛选化合物的方法,所述化合物抑制STK31蛋白与c-raf、MEK或ERK(p44/42MAPK)之间的结合。此外,本发明还提供了一种筛选用于抑制或降低表达STK31的癌细胞(例如肺癌细胞和/或食道癌细胞)生长的化合物,以及用于治疗或预防癌症(例如肺癌细胞和/或食道癌)的化合物的方法。
具体地,本发明提供以下[1]至[5]的方法:
[1]一种筛选阻断STK31多肽与c-raf、MEK或ERK(p44/42MAPK)之间结合的试剂的方法,所述方法包括以下步骤:
(a)使STK31多肽或其功能等价物与c-raf、MEK或ERK(p44/42MAPK)多肽或其功能等价物在测试剂存在下接触;
(b)检测所述多肽之间的结合;
(c)将步骤(b)中检测到的结合水平与在无测试剂存在下检测到的结合水平相比较;和
(d)选择降低或抑制所述结合水平的测试剂。
[2]一种筛选用于治疗或预防癌症的试剂的方法,所述方法包括以下步骤:
(a)使STK31多肽或其功能等价物与c-raf、MEK或ERK(p44/42MAPK)多肽或其功能等价物在测试剂存在下接触;
(b)检测所述多肽之间的结合;
(c)将步骤(b)中检测到的结合水平与在无测试剂存在下检测到的结合水平相比较;和
(d)选择降低或抑制所述结合水平的测试剂。
[3][1]或[2]中的方法,其中STK31的功能等价物包含c-raf、MEK或ERK(p44/42MAPK)-结合域。
[4][1]或[2]中的方法,其中c-raf、MEK或ERK(p44/42MAPK)的功能等价物包含STK31-结合域。
[5][1]中的方法,其中所述癌症选自下组:肺癌和食道癌。
在本发明的上下文中,STK31、c-raf(SEQ ID NO.:64)、MEK或ERK(p44/42MAPK)多肽的功能等价物是分别具有与STK31多肽(SEQ ID NO:6)、或者c-raf、MEK或ERK(p44/42MAPK)等价的生物活性的多肽(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物,或者[实施例1]中的(6)表达载体)。
本领域技术人员众所周知的许多方法可用作筛选能调节(例如抑制)EPHA7与EGFR的结合的化合物的方法。
用于筛选的多肽可以是重组多肽或源自天然来源的蛋白,或其部分肽。任何前述的测试化合物都可用于筛选。
本领域技术人员众所周知的许多方法都可用作筛选蛋白质的方法,例如利用STK31、c-raf、MEK或ERK(p44/42MAPK)多肽或其功能等价物与多肽结合的蛋白质(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。所述筛选可例如利用免疫沉淀、West-Western印迹分析(Skolniket al.,Cell 65:83-90(1991))、利用细胞的双杂交系统(″MATCHMAKERTwo-Hybrid system″,″Mammalian MATCHMAKER Two-Hybrid Assay Kit″,″MATCHMAKER one-Hybrid system″(Clontech);″HybriZAP Two-HybridVector System″(Stratagene);参考文献″Dalton and Treisman,Cell 68:597-612(1992)″,″Fields and Sternglanz,Trends Genet 10:286-92(1994)″)、亲和层析以及利用表面等离子共振现象的生物传感器进行(参见(i)通用筛选方法)。
可使用上述任一种受试化合物(参见(1)筛选的受试化合物)。
在一些实施方案中,该方法进一步包括检测候选化合物与STK31蛋白、c-raf、MEK或ERK(p44/42MAPK)结合的步骤,或者检测STK31蛋白与c-raf、MEK或ERK(p44/42MAPK)蛋白结合的水平的步骤。表达STK31蛋白和c-raf、MEK或ERK(p44/42MAPK)蛋白的细胞例如包括由癌症(如肺癌和/或食道癌)建立的细胞系,所述细胞可用于本发明的上述筛选,只要所述细胞表达这两种基因。或者,可用STK31和c-raf、MEK或ERK(p44/42MAPK)的表达载体或其中一种表达载体转染细胞,来表达这两种基因。STK31蛋白与c-raf、MEK或ERK(p44/42MAPK)蛋白的结合可利用抗-STK31抗体和抗-c-raf、MEK或ERK(p44/42MAPK)抗体通过免疫沉淀试验来检测(图12)。
(x)利用WDHD1的磷酸化水平作为指标的筛选
此外,在本发明中,证实了WDHD1蛋白通过磷酸化被修饰。而且WDHD1的一个磷酸化区域具有AKT激酶的共有磷酸化位点(GenBank登录号:NM_001014431)(R-X-R-X-X-S374;ref.33)。PI3K/AKT信号对于细胞增殖和细胞存活是重要的。而且,利用LY294002抑制PI3K活性降低了总WDHD1和磷酸化WDHD1的表达水平(图16C)。这个结果说明,WDHD1是PI3K/AKT途径的组分之一,且通过磷酸化作用被稳定。此外,WDHD1表达的抑制引起细胞生长的抑制,且导致了诱导细胞凋亡(图15C)。因此,利用所述修饰作为指标筛选得到的、抑制WDHD1蛋白磷酸化的化合物可用于抑制或降低表达WDHD1的癌细胞的生长,可用于诱导癌细胞的凋亡,或者可用于治疗或预防表达WDHD1的癌症,。所述癌症可为肺癌,例如非小细胞肺癌或小细胞肺癌,和/或食道癌。因此,本发明还提供了一种筛选化合物的方法,所述化合物用于抑制WDHD1蛋白的磷酸化。此外,本发明还提供了一种筛选用于抑制或降低表达WDHD1的癌细胞生长的化合物,以及用于诱导表达WDHD1的癌细胞凋亡的化合物的方法。所述方法特别适合于筛选可用于治疗或预防表达WDHD1的癌症的试剂。所述癌症为肺癌,例如非小细胞肺癌或小细胞肺癌,或者食道癌。
具体地,本发明提供以下[1]至[2]的方法:
[1]一种筛选用于预防或治疗癌症的试剂的方法,其中所述方法包括以下步骤:
(a)使测试剂与表达编码WDHD1多肽或其功能类似物的基因的细胞接触;
(b)在允许步骤(a)中所述多肽磷酸化的条件下培养;
(c)检测步骤(a)中所述多肽的磷酸丝氨酸或磷酸酪氨酸水平;
(d)将在步骤(c)中检测到的磷酸化水平与在无测试剂存在下检测到的磷酸化水平相比较;和
(e)选择抑制或降低所述磷酸化水平的测试剂。
[2][1]中的方法,其中所述癌症选自下组:肺癌和食道癌。
[3][1]中的方法,其中所述WDHD1的磷酸丝氨酸为S374。
[4][1]中的方法,其中所述测试剂与WDHD1多肽或其功能等价物结合。
[5][1]中的方法,其中所述试剂在WDHD1位点AKT的磷酸化活性。
这里,可使用任何细胞,只要其表达WDHD1多肽或其功能等价物(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。用在本筛选中的细胞可为天然表达WDHD1多肽的细胞,例如包括源自肺癌、食道癌和睾丸的细胞和由肺癌、食道癌和睾丸建立的细胞系。可应用肺癌细胞和/或食道癌细胞的细胞系,例如LC319、TE9等。
或者,用在本筛选中的细胞可为天然不表达WDHD1多肽、用WDHD1多肽-表达载体或WDHD1功能等价物-表达载体转染得到的细胞。所述重组细胞可通过如上所述的已知的基因工程方法(例如,Morrison DA.,JBacteriology 1977,132:349-51;Clark-Curtiss & Curtiss,Methods inEnzymology(eds.Wu et al.)1983,101:347-62)获得(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。
上述任一种受试化合物都可用于本筛选。在一些实施方案中,选择了可透入细胞的化合物。或者,当受试化合物为多肽时,本筛选中细胞与测试剂的接触可通过用包括编码测试剂的核苷酸序列的载体转化细胞并在细胞中表达测试剂来实现。
在本发明中,如上所述,WDHD1蛋白的生物活性包括磷酸化活性。技术人员可如上所述评估磷酸化水平(参见(2)通用筛选方法)。
当本方法中欲检测的生物活性为细胞增殖时,可例如通过制备表达本发明的多肽的细胞,在受试化合物存在下培养所述细胞,并测定细胞增殖的速度,测定细胞周期等,以及如实施例中所述通过测定克隆形成活性,从而检测所述细胞增殖活性。
(xi)利用CDCA5与CDC2,或CDCA5与ERK之间的相互作用作为指标的筛选
在本发明中,证实了CDCA5多肽与CDC2多肽和ERK多肽的相互作用,且CDCA5多肽被CDC2多肽和ERK多肽磷酸化(图2)。此外,CDCA5多肽在氨基酸残基68-82(S/T-P-x-R/K)处具有针对CDC2的共有磷酸化基序,其中SEQ ID NO:2的丝氨酸-75是磷酸化区或位点(图1)。CDCA5多肽在氨基酸残基76-86和109-122(x-x-S/T-P)具有针对ERK的共有磷酸化基序,其中SEQ ID NO:2的丝氨酸-79和苏氨酸-115是磷酸化区或部位(图1)。这些数据与CDCA5多肽被ERK多肽和CDC2多肽磷酸化的结论一致。
由ERK基因编码的蛋白质是MAP激酶家族蛋白的一员,MAP激酶家族蛋白充当多个生物化学信号的整合点,与多种细胞进程有关,例如增殖、分化、转录调节和发育。MAPK级联整合并处理多种胞外信号是通过磷酸化底物,从而改变它们的催化活性和构象或创建蛋白质-蛋白质相互作用的结合部位。
另一方面,细胞周期蛋白依赖性蛋白激酶(cyclin-dependent kinases,CDKs)是由催化性激酶亚基和调节性细胞周期蛋白亚基构成的异源二聚体复合物,包括根据它们在细胞进程和转录调节中的作用分成两组的一个家族。CDC2/CDK1(CDC2-周期蛋白B复合物)是第一组的成员,有序地从G2至M期转变需要CDC2/CDK1。最近,有人暗示CDC2与有丝分裂检查点活化期间的细胞存活有关(O′Connor DS,et al.Cancer Cell.2002Jul;2(1):43-54.)。
因此,这些数据显示了,CDCA5被ERK和CDC2磷酸化促进了使肿瘤恶性可能性增加的癌细胞周期进程。总之,这些数据证明,CDCA5通过其被MAPK或CDK途径磷酸化从而促进肺癌和食道癌的生长。
具体地,本发明提供以下[1]至[14]的方法:
[1]一种筛选阻断CDCA5多肽与CDC2多肽之间相互作用或结合的试剂的方法,所述方法包括以下步骤:
(a)使(i)和(ii)的多肽在测试剂存在下接触
(i)CDCA5多肽或其功能等价物;和
(ii)CDC2多肽或其功能等价物
(b)检测多肽之间相互作用或结合的水平;
(c)将步骤(b)中检测到的水平与在无测试剂存在下检测到的水平相比较;和
(d)选择降低或抑制所述水平的测试剂。
[2][1]中的方法,其中所述试剂用于治疗或预防表达CDCA5的癌症。
[3][2]中的方法,其中所述癌症选自下组:肺癌和食道癌。
[4][3]中的方法,其中所述肺癌为非小细胞肺癌或小细胞肺癌。
[5][1]中的方法,其中所述测试剂与CDCA5多肽或其功能等价物结合。
[6][1]中的方法,其中所述CDCA5的功能等价物包括CDC2-相互作用域。
[7][1]中的方法,其中所述CDC2的功能等价物包括CDCA5-相互作用域。
[8]一种筛选阻断CDCA5多肽与ERK多肽之间相互作用或结合的试剂的方法,所述方法包括以下步骤:
(a)使(i)和(ii)的多肽在测试剂存在下接触
(i)CDCA5多肽或其功能等价物;和
(ii)ERK多肽或其功能等价物
(b)检测多肽之间相互作用或结合的水平;
(c)将步骤(b)中检测到的水平与在无测试剂存在下检测到的水平相比较;和
(d)选择降低或抑制所述水平的测试剂。
[9][8]中的方法,其中所述试剂可用于治疗或预防表达CDCA5的癌症。
[10][9]中的方法,其中所述癌症选自下组:肺癌和食道癌。
[11][10]中的方法,其中所述肺癌为非小细胞肺癌或小细胞肺癌。
[12][8]中的方法,其中所述测试剂与CDCA5多肽或其功能等价物结合。
[13][8]中的方法,其中所述CDCA5的功能等价物包括CDC2-相互作用域。
[14][8]中的方法,其中所述CDC2的功能等价物包括CDCA5-相互作用域。
在本发明的上下文中,CDCA5多肽、CDC2多肽或ERK多肽的功能等价物是具有与CDCA5多肽(SEQ ID NO:2)、CDC2多肽(SEQ ID NO:48)或ERK多肽(SEQ ID NO:50)等价的生物活性的多肽(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。
作为筛选调节(例如抑制)CDCA5多肽与CDC2多肽之间结合,或者CDCA5多肽与ERK多肽之间结合的化合物的方法,所述功能等价物保留结合活性。CDCA5多肽的功能等价物可包含CDCA5多肽的CDCA2结合域或者CDCA5多肽的ERK结合域;CDC2多肽的功能等价物可包含CDC2多肽的CDCA5结合域;ERK多肽的功能等价物可包含ERK多肽的CDCA5结合域。
可使用本领域技术人员众所周知的许多检测多肽间相互作用或结合的水平的方法。欲用于筛选的多肽可为重组多肽或源自天然来源的蛋白质,或其部分肽。
上述任一种受试化合物都可用于筛选(参见“定义”中(1)筛选的受试化合物)。例如,测试剂可为针对CDCA5多肽的抗体,针对CDCA5多肽的CDC2结合域的抗体或者针对CDCA5多肽的ERK结合域的抗体,或者所述测试剂可为CDCA5多肽、CDC2多肽或ERK多肽的起显性失活物(dominantnegative)作用的部分肽,例如CDCA5多肽的CDC2结合域、CDCA5多肽的ERK结合域、CDC2多肽的CDCA5结合域或者ERK多肽的CDCA5结合域。
本领域技术人员众所周知的许多方法可用作筛选蛋白质的方法,例如利用CDCA5多肽、CDC2多肽、ERK多肽或其功能等价物与多肽结合的蛋白质(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。所述筛选可例如利用免疫沉淀、West-Western印迹分析(Skolnik et al.,Cell 65:83-90(1991))、利用细胞的双杂交系统(″MATCHMAKER Two-Hybrid system″,″Mammalian MATCHMAKER Two-Hybrid Assay Kit″,″MATCHMAKERone-Hybrid system″(Clontech);″HybriZAP Two-Hybrid Vector System″(Stratagene);参考文献″Dalton and Treisman,Cell 68:597-612(1992)″,″Fieldsand Sternglanz,Trends Genet 10:286-92(1994)″)、亲和层析以及利用表面等离子共振现象的生物传感器进行(参见(i)通用筛选方法)。
可使用上述任一种受试化合物(参见(1)筛选的受试化合物)。
在一些实施方案中,该方法进一步包括检测候选化合物与CDCA5多肽、CDC2多肽或ERK多肽结合的步骤,或者检测表达这些基因的细胞中CDCA5多肽与CDC2多肽,或CDCA5多肽与ERK多肽之间结合的水平的步骤。表达这些基因的细胞例如包括由癌症(例如由CX基因过表达引起的或由CX基因介导的癌症,如肺癌和/或食道癌)建立的细胞系,所述细胞可用于本发明的上述筛选,只要所述细胞表达这些基因。或者,为了表达这些基因,可用CDCA5和CDC2,或CDCA5和ERK的表达载体之两者或其中任一种转染细胞。CDCA5与CDC2之间的结合或者CDCA5与ERK之间的结合可利用抗-CDCA5抗体、抗-CDC2抗体和抗-ERK抗体通过免疫沉淀测定来加以检测。
(x)利用CDCA5的磷酸化作为指标的筛选
根据本发明的另一方面,抑制或降低CDCA5的CDC2-介导的磷酸化或CDCA5的ERK-介导的CDCA5磷酸化的试剂可用于抑制或降低表达CDCA5的癌细胞(例如由CX基因过表达引起的或由CX基因介导的癌症的细胞,如肺癌和/或食道癌细胞)的细胞周期进程,且可用于治疗或预防表达CDCA5的癌症(例如肺癌或食道癌),利用CDCA5的CDC2-介导的磷酸化水平或CDCA5的ERK-介导的磷酸化水平作为指标筛选。
具体地,本发明提供以下[1]至[14]的方法:
[1]一种筛选调节CDCA5的CDC2-介导的磷酸化的试剂的方法,所述方法包括以下步骤:
(a)使(i)和(ii)的多肽在测试剂存在下接触
(i)CDCA5多肽或其功能等价物;和
(ii)CDC2多肽或其功能等价物
(b)检测(a)(i)的多肽的磷酸化水平;
(c)将步骤(b)中检测到的磷酸化水平与在无测试剂存在下检测到的磷酸化水平相比较;和
(d)选择抑制或降低所述磷酸化水平的测试剂作为抑制剂,或者选择促进或增强所述磷酸化水平的测试剂作为增强剂。
[2][1]中的方法,其中所述试剂可用于预防或治疗表达CDCA5的癌症。
[3][2]中的方法,其中所述癌症选自下组:肺癌和食道癌。
[4][3]中的方法,其中所述肺癌为非小细胞肺癌或小细胞肺癌。
[5][1]中的方法,其中所述测试剂与CDCA5多肽或其功能等价物结合。
[6][1]中的方法,其中CDCA5多肽的功能等价物包括至少一个CDCA5多肽的CDC2-介导的磷酸化位点。
[7][6]中的方法,其中CDC2-介导的磷酸化位点为SEQ ID NO:2(CDCA5)的丝氨酸-21、丝氨酸-75或苏氨酸-159。
[8]一种筛选调节CDCA5的ERK-介导的磷酸化的试剂的方法,所述方法包括以下步骤:
(a)使(i)和(ii)的多肽在测试剂存在下接触
(i)CDCA5多肽或其功能等价物;和
(ii)ERK多肽或其功能等价物
(b)检测(a)(i)的多肽的磷酸化水平;
(c)将步骤(b)中检测到的磷酸化水平与在无测试剂存在下检测到的磷酸化水平相比较;和
(d)选择抑制或降低所述磷酸化水平的测试剂作为抑制剂,或者选择促进或增强所述磷酸化水平的测试剂作为增强剂。
[9][8]中的方法,其中所述试剂可用于预防或治疗表达CDCA5的癌症。
[10][9]中的方法,其中所述癌症选自下组:肺癌和食道癌。
[11][10]中的方法,其中所述肺癌为非小细胞肺癌或小细胞肺癌。
[12][8]中的方法,其中所述测试剂与CDCA5多肽或其功能等价物结合。
[13][8]中的方法,其中所述CDCA5多肽的功能等价物包括CDCA5多肽的至少一个ERK-介导的磷酸化位点。
[14][13]中的方法,其中所述ERK-介导的磷酸化位点为SEQ ID NO:2(CDCA5)的丝氨酸-21、苏氨酸-48、丝氨酸-75、丝氨酸-79、苏氨酸-111、苏氨酸-115、苏氨酸-158或丝氨酸-209。
在另一个实施方案中,本发明提供以下[1]至[9]的方法:
[1]一种筛选用于预防或治疗癌症的试剂的方法,其中所述方法包括以下步骤:
(a)使测试剂与表达编码CDCA5多肽或其功能等价物的基因的细胞接触;
(b)在允许步骤(a)中所述多肽磷酸化的条件下培养;
(c)检测步骤(a)中所述多肽的磷酸化水平;
(d)将在步骤(c)中检测到的磷酸化水平与在无测试剂存在下检测到的磷酸化水平相比较;和
(e)选择抑制或降低所述磷酸化水平的测试剂。
[2][1]中的方法,其中所述试剂用于预防或治疗表达CDCA5的癌症。
[3][2]中的方法,其中所述癌症选自下组:肺癌和食道癌。
[4][3]中的方法,其中所述肺癌为非小细胞肺癌或小细胞肺癌。
[5][1]中的方法,其中所述试剂抑制或降低CDC2-介导的CDCA5的磷酸化活性。
[6][1]中的方法,其中所述试剂抑制或降低ERK-介导的CDCA5的磷酸化。
[7][1]中的方法,其中所述磷酸化水平为磷酸丝氨酸或磷酸苏氨酸水平。
[8][6]中的方法,其中CDCA5的磷酸丝氨酸为SEQ ID NO:2(CDCA5)的丝氨酸-21、丝氨酸-75、丝氨酸-79或丝氨酸-209。
[9][5]中的方法,其中CDCA5的磷酸苏氨酸为SEQ ID NO:2(CDCA5)的苏氨酸-48、苏氨酸-111、苏氨酸-115或苏氨酸-159。
在本发明的上下文中,CDCA5多肽、CDC2多肽或ERK多肽的功能等价物是具有与CDCA5多肽、CDC2多肽或ERK多肽等价的生物活性的多肽(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。在上述方法中,生物活性为相互作用,例如CDCA5多肽的CDC2-介导的磷酸化或CDCA5多肽的ERK-介导的磷酸化。
用于本发明筛选的CDCA5多肽的功能等价物适当地包含CDCA2结合域、ERK结合域和/或至少一个磷酸化位点,例如:位于氨基酸残基68-82的针对CDC2的共有磷酸化基序(S/T-P-x-R/K)其中SEQ ID NO:2的丝氨酸-75被磷酸化;位于氨基酸残基76-86(x-x-S/T-P)的针对ERK的共有磷酸化基序,其中SEQ ID NO:2的丝氨酸-79被磷酸化;和/或位于氨基酸残基109-122的针对ERK的共有磷酸化基序(x-x-S/T-P),其中SEQ ID NO:2的苏氨酸-115被磷酸化;用于本发明筛选的CDC2肽的功能等价物适当地包含CDCA5结合域和/或丝氨酸/苏氨酸蛋白激酶催化域,例如SEQ ID NO:48(CDC2)的氨基酸残基4-287;用于本发明筛选的ERK肽的功能等价物适当地包含CDCA5结合域和/或蛋白激酶域,例如SEQ ID NO:50(ERK)的氨基酸残基72-369(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。
这里,可使用任何细胞,只要其表达CDCA5多肽或其功能等价物(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。用在本筛选中的细胞可为天然表达CDCA5多肽的细胞,例如包括源自肺癌、食道癌和睾丸的细胞和由肺癌、食道癌和睾丸建立的细胞系。可应用肺癌细胞和/或食道癌细胞的细胞系,例如A549、LC319等。
或者,用在本筛选中的细胞可以是天然不表达CDCA5多肽,而用CDCA5多肽表达载体或CDCA5功能等价物表达载体转染过的细胞。所述重组细胞可通过如上所述的已知的基因工程方法(例如,Morrison DA.,JBacteriology 1977,132:349-51;Clark-Curtiss & Curtiss,Methods inEnzymology(eds.Wu et al.)1983,101:347-62)获得(参见“定义”中(1)癌症相关基因和癌症相关蛋白,及其功能等价物)。
上述任一种受试化合物都可用于本筛选。在一些实施方案中,选择了可透入细胞的化合物。或者,当受试化合物为多肽时,本筛选中细胞与测试剂的接触可通过用包括编码测试剂的核苷酸序列的载体转化细胞并在细胞中表达测试剂从而实现。
在本发明中,如上所述,CDCA5蛋白的生物活性包括磷酸化活性。技术人员可如上所述评估磷酸化水平(参见(2)通用筛选方法)。
当本方法中欲检测的生物活性为细胞周期的促进时,可例如通过制备表达本发明的多肽的细胞,在受试化合物存在下培养所述细胞,并测定细胞增殖的速度,测定细胞周期等,以及如实施例中所述通过测定集落形成活性或FACS分析,来检测所述细胞周期的促进。
除非另外限定,本说明书中使用的全部技术术语和科学术语均与本发明所属技术领域的普通技术人员一般理解的含义相同。若有抵触,以本说明书(包括定义)为准。
在这些实施方案中,允许CDCA5多肽磷酸化的条件,可以通过将CDCA5多肽与要磷酸化CDCA5多肽的CDC2多肽或ERK多肽以及ATP一起温育来提供(参见[实施例1]中(14)体外激酶测定)。另外,在本发明中,可将增强CDCA5多肽磷酸化活性的底物加到筛选的反应混合物中。当所述底物的加入增强CDCA5多肽的磷酸化时,测定所述磷酸化水平的灵敏度可以更高。
CDCA5多肽或其功能等价物、CDC2多肽、ERK多肽、其功能等价物与测试剂的接触可在体内或体外进行。体外筛选可在缓冲液中进行,例如但不限于磷酸盐缓冲液和Tris缓冲液,只要所述缓冲液不抑制CDCA5多肽或其功能等价物的磷酸化。
在本发明中,底物的磷酸化水平可利用本领域公知的方法测定(参见(2)通用筛选方法)。除非另外限定,本说明书中使用的全部技术术语和科学术语均与本发明所属技术领域的普通技术人员一般理解的含义相同。若有抵触,以本说明书(包括定义)为准。
分离的化合物和药物组合物
通过以上筛选分离的化合物是抑制本发明CX多肽活性的药物的候选物,可用于治疗由CX基因过表达引起的或CX基因介导的癌症,例如肺癌和/或食道癌。更具体地,当CX蛋白的生物活性用作指标时,通过本方法筛选的化合物充当用于治疗表达CX基因的癌症(例如肺癌和/或食道癌)的药物的候选物。例如,本发明提供了用于抑制或降低癌细胞生长的组合物、用于诱导癌细胞凋亡的化合物、用于抑制或降低癌细胞生长的组合物和用于治疗或预防癌症的化合物,所述组合物包括药学有效剂量的抑制剂,其具有至少一种选自下组的功能:
(a)抑制选自下组的多肽或其功能等价物的表达水平:CDCA5、EPHA7、STK31和WDHD1多肽;
(b)抑制表达选自下组的多肽或其功能等价物的细胞的增殖活性:CDCA5、EPHA7、STK31和WDHD1;
(c)诱导表达WDHD1多肽或其功能等价物的细胞的凋亡;
(d)抑制表达EPHA7多肽或其功能等价物的细胞的侵袭活性;
(e)抑制EPHA7多肽与EGFR多肽,或其功能等价物之间的结合活性;
(f)抑制选自EPHA7和STK31多肽的多肽或其功能等价物的激酶活性;和
(g)抑制WDHD1蛋白或其功能等价物的磷酸化水平。
(h)抑制表达CDCA5多肽或其功能等价物的细胞的细胞周期;和
(i)抑制CDCA5多肽与CDC2多肽,或其功能等价物之间的相互作用或结合。
(j)抑制CDCA5多肽与ERK多肽,或其功能等价物之间的相互作用或结合。
(k)抑制CDCA5多肽或其功能等价物的磷酸化水平。
可通过二次和/或更进一步的筛选来评估用于治疗或预防癌症的候选化合物的效力,以鉴定癌症的治疗剂。例如,当抑制CDCA5多肽表达的化合物抑制癌症的活性(例如细胞生长或侵袭)时,可得出该化合物具有CDCA5特异性治疗效应的结论。
化合物的“药学有效量(pharmaceutically effective amount)”是足以治疗和/或改善个体中癌症的量。药学有效量的实例包括向动物施用时,降低CDCA5、EPHA7、STK31或WDHD1的表达或生物活性所需的量。所述降低可以是,例如,表达的至少5%、10%、20%、30%、40%、50%、75%、80%、90%、95%、99%或100%的改变。
所述抑制选自CDCA5、EPHA7、STK31和WDHD1基因中上任一种基因表达的活性成分(a)-(k)还可为针对所述基因的抑制性寡核苷酸(例如,反义寡核苷酸、双链分子或核酶),或上述反义寡核苷酸、双链分子或核酶的衍生物,例如表达载体(参见(3)双链分子)。或者,活性成分(e)-(f)可例如是CDCA5、EPHA7、EGFR、STK31或WDHD1的显性失活突变体。另外,EPHA7的拮抗剂可用作抑制EPHA7与EGFR之间结合的活性成分。此外,CDCA5的拮抗剂可用作抑制CDCA5多肽与CDC2多肽之间结合,或CDCA5多肽与ERK多肽之间结合的活性成分。或者,所述活性成分可利用如上所述的筛选方法来选择(参见筛选方法)。
此外,通过本发明筛选方法可得到的化合物中还包括以下化合物,即其中抑制一种CX蛋白活性的化合物的一部分结构通过添加、删除和/或取代而转变的化合物。
通过本发明任一种方法分离的试剂可作为药物施用,或者可用来生产药物(治疗性或预防性)组合物,用于人和其他哺乳动物,例如小鼠(mice)、大鼠(rats)、豚鼠(guinea-pigs)、兔(rabbits)、猫(cats)、狗(dogs)、绵羊(sheep)、猪(pigs)、牛(cattle)、猴(monkeys)、狒狒(baboons)和黑猩猩(chimpanzees),以治疗或预防表达CX基因的癌症,如肺癌和/或食道癌。欲利用通过本方法筛选的试剂治疗或预防的例示性癌症包括过表达CX基因或由CX基因不受控制的功能介导的癌症,例如肺癌(如非小细胞肺癌或小细胞肺癌)、食道癌等。
所述分离的试剂可直接施用或者利用已知的药物制剂方法配方到剂型中。药物配方可包括适合于口服、直肠、鼻、局部(包括颊内和舌下)、阴道或肠胃外(包括肌内、皮下和静脉内)给药,或者通过吸入或吹入给药的那些配方。例如,根据需要,试剂可以糖衣片、胶囊、酏剂和微胶囊口服;或者以水或任何其他药学可接受液体的灭菌溶液或悬液注射的形式非口服。例如,所述试剂可以以通常接受的药物仪器所需的单位剂量形式,与药学可接受载体或介质混合,具体有灭菌水、生理盐水、植物油、乳化剂、助悬剂、表面活性剂、稳定剂、调味剂、赋形剂、溶剂、防腐剂、黏合剂等。活性成分在这些制剂中的量使得在指定的范围内可得到合适的剂量。
短语“药学可接受载体(pharmaceutically acceptable carrier)”指的是用作药物的稀释剂或溶剂的惰性物质。
可混合到片剂和胶囊中的添加物的实例有黏合剂例如明胶、玉米淀粉、黄蓍胶和阿拉伯胶;赋形剂例如微晶纤维素;溶胀剂例如玉米淀粉、明胶和海藻酸;润滑剂例如硬脂酸镁;甜味剂例如蔗糖、乳糖或糖精;调味剂例如薄荷油、Gaultheria adenothrix油和樱桃。当单位剂型为胶囊时,上述成分中还可进一步包括液体载体例如油。注射用无菌混合物可利用溶剂例如注射用蒸馏水,用常规药物配制方法进行配制。
生理盐水、葡萄糖和其他包含辅料(例如D-山梨醇、D-甘露糖、D-甘露醇和氯化钠)的等渗液体可用作注射用水溶液。这些可与合适的增溶剂,例如醇(具体有乙醇、多元醇例如丙二醇和聚乙二醇),非离子型表面活性剂,例如聚山梨醇80(TM)和HCO-50一起使用。
芝麻油或大豆油可用作油状液体,可与苯甲酸苄酯(benzyl benzoate)或苯甲醇(benzyl alcohol)一起用作增溶剂,还可与缓冲液例如磷酸盐缓冲液和醋酸钠缓冲液;镇痛药例如盐酸普鲁卡因(procaine hydrochloride);稳定剂例如苯甲醇、苯酚;以及抗氧化剂一起配方。制备的注射剂可装入合适的安瓿。
适合于口服给药的药物配方可以作为分立的单位方便地提供,例如以胶囊、扁胶囊或片剂,各自包含预定量的活性成分;以粉末或颗粒;或者以溶液、悬液或以乳剂。活性成分还可以以丸煎膏剂或糊剂提供,以及以纯的形式(即无载体)提供。口服给药的片剂和胶囊可包含常规的赋形剂,例如黏合剂、填充剂、润滑剂、崩解剂或湿润剂。可选择性地与一种或多种配方成分一起,通过挤压或模压来制备片剂。压制片可通过在合适的机器中压缩散粒形式(例如粉末或颗粒)的活性成分来制备,可选择地与黏合剂、润滑剂、惰性稀释剂、润滑、表面活性剂或分散剂混合。模制片可通过在合适的机器中模压用惰性液体稀释剂润湿的粉末化合物的混合物来制备。片剂可根据本领域众所周知的方法包衣。口服液体制剂可例如为含水或含油悬液、溶液、乳剂、糖浆剂或酏剂的形式,或者可以以干燥产物提供,使用之前用水或其他合适的溶剂形成。所述液体制剂可包含常规添加物例如助悬剂、乳化剂、非水溶剂(其可包括食用油)或防腐剂。可将片剂选择性配方,目的是使得其中活性成分缓慢释放或控制释放。
非消化道给药的配方包括含水和非水灭菌注射溶液,其可包含抗氧化剂、缓冲液、抑菌剂和使得配方与预期受者的血液等渗的溶质;还包括含水和非水灭菌混悬液,其可包括助悬剂和增稠剂。所述配方可以以单位剂量或多剂量容器提供,例如密封安瓿和小瓶,还可以在冷冻干燥(冻干)条件下储存,仅需要在使用前立即加入无菌液体载体,例如盐水、注射用水。或者,可提供所述配方用于连续输注。临时注射溶液和悬液可由无菌粉末、颗粒和先前所述种类的片剂制备。
直肠给药的配方可以以栓剂提供,含通常的载体(例如可可脂或聚乙二醇)。口腔局部给药(例如颊内或舌下)的配方包括锭剂,在调味成分(例如蔗糖和阿拉伯胶或黄蓍胶)中包含活性成分,还包括软锭剂,在例如明胶和甘油或蔗糖和阿拉伯胶成分中包含活性成分。对于鼻内给药,通过本发明得到的化合物可用作液体喷雾剂或可分散粉末或者以滴剂的形式应用。滴剂可用含水或非水成分配方,还包括一种或多种分散剂、增溶剂或助悬剂。液体喷雾剂可方便地从加压包装喷出。
对于吸入给药,化合物可方便地从吹入器、喷雾器、加压包装或其他方便提供气雾喷雾的装置射出。加压包装可包含合适的喷射剂,例如二氯二氟甲烷(dichlorodifluoromethane)、三氯氟甲烷(trichlorofluoromethane)、二氯四氟乙烷(dichlorotetrafluoroethane)、二氧化碳(carbon dioxide)或其他合适的气体。就加压气雾剂而言,可通过提供阀来确定剂量单位,以释放计量的剂量。
或者,对于吸入或吹入给药,化合物可采取干粉组合物的形式,例如化合物与适当的粉末成分(例如乳糖或淀粉)的粉末混合物。所述粉末组合物可以以单位剂量形式提供,例如以胶囊、药筒、明胶或泡状包装形式,粉末可借助于吸入器或吹入器通过所述形式给药。
需要时可应用上述配方,使其适合于使活性成分持续释放。所述药物组合物还可包含其他活性成分,例如抗微生物剂、免疫抑制剂或防腐剂。
例示性单位剂量配方是包含有效剂量(如下所述)或者活性成分的适当部分的那些配方。
可使用本领域技术人员众所周知的方法向患者施以本发明的药物化合物,例如以动脉内、静脉内、经皮注射,还有以鼻内、经支气管、肌内或口服给药。给药剂量和给药途径根据患者的体重和年龄及给药方法而变化;但本领域技术人员可对其进行常规选择。如果所述化合物可由DNA编码,则可将所述DNA插入用于基因治疗的载体中,并施用所述载体进行治疗。给药剂量和给药途径根据患者的体重、年龄和症状而变化,但本领域技术人员可适当地对它们进行选择。
举例来说,当向正常成年人(体重60kg)口服给药时,尽管根据症状有一些区别,但与本发明多肽结合并调节其活性的化合物的剂量为每日约0.1mg至约100mg,例如每日约1.0mg至约50mg,例如每日约1.0mg至约20mg。
当以注射剂形式向正常成年人(体重60kg)胃肠外给药时,尽管根据患者、靶器官、症状和给药途径有一些区别,但可方便地由静脉内注射每日约0.01mg至约30mg的剂量,例如每日约0.1mg至约20mg,例如每日约0.1mg至约10mg。而且,就其他动物而言,也可能施以转换成60kg体重的剂量。
所述药剂可口服或通过注射(静脉内或皮下)给药,向受试者施用的准确剂量将由巡诊医生负责确定,考虑到许多因素,包括受试者的年龄和性别、所治疗的确切疾病及其严重性。给药途径还可根据疾病及其严重性而变化。
此外,本发明提供了利用针对本发明多肽的抗体,治疗或预防表达CX基因的癌症(例如肺癌和/或食道癌)的方法。根据本方法,施以针对本发明多肽的抗体的药学有效量。由于CX蛋白在癌细胞中的表达上调,抑制这些蛋白的表达引起细胞增殖活性降低,所以预期可通过结合所述抗体和这些蛋白质来治疗或预防肺癌和/或食道癌。因此,针对本发明多肽的抗体可以以足以降低本发明蛋白质活性的剂量施用,所述剂量在每日0.1mg/kg至约250mg/kg的范围内。对成年人的剂量范围通常从约5mg至约17.5g/日,例如约5mg至约10g/日,例如约100mg至约3g/日。
通常,一种或多种CX蛋白抑制剂的效果量或有效量通过以下步骤确定:首先施以低剂量或小量CX蛋白抑制剂,然后逐渐增加剂量(dose)或给药量(dosages),和/或视需要加入第二种CX蛋白抑制剂,直到在治疗的受试者中观察到抑制或预防肺癌和/食道癌的预期效应,有极轻的或者没有毒性副作用。确定施用本发明药物组合物的适当剂量和给药方案的可用方法例如在Goodman and Gilman′s The Pharmacological Basis of Therapeutics,11thEd.,Brunton,et al.,Eds.,McGraw-Hill(2006)以及在Remington:The Scienceand Practice of Pharmacy,21st Ed.,University of the Sciences in Philadelphia(USIP),Lippincott Williams & Wilkins(2005)中描述,它们都在此以提述方式并入本文。
通过本方法筛选的试剂进一步可用于治疗或预防受试者中表达CX基因的癌症,例如肺癌和/或食道癌。针对具有与CX蛋白异常磷酸化活性有关的疾病风险(或易感于)或者患有与CX蛋白异常磷酸化活性有关的疾病的受试者的施用可为预防性或治疗性的。所述方法包括降低CX蛋白在肺癌细胞和/或食道癌细胞中的功能。可通过施用利用本发明筛选方法得到的试剂来抑制所述功能。
这里,术语“预防(preventing)”意味着所述试剂预防性施用,以延缓或抑制肿瘤的形成,或者延缓、抑制或缓解癌症的至少一种临床症状。可利用标准临床规程对受试者中肿瘤状态进行评估。
或者,与特异针对肿瘤细胞的细胞表面标志结合的抗体可用作给药的工具。例如,以足以损害肿瘤细胞的剂量施用与细胞毒剂偶联的抗体。
筛选试剂盒
本发明还提供包含用于筛选治疗或预防癌症(特别是乳腺癌、膀胱癌或肺癌)的试剂的物质的制品或试剂盒。所述制品可包括本说明书中所述物质的一个或多个标记的容器,连同使用说明书一起。合适的容器例如包括瓶子、管形瓶和试管。所述容器可由多种材料构成,例如玻璃或塑料。
[1]一种筛选阻断EPHA7多肽与EGFR多肽之间结合的试剂的试剂盒,其中所述试剂盒包括:
(a)包含EPHA7多肽的EGFR-结合域的多肽;
(b)包含EGFR多肽的EPHA7-结合域的多肽;和
(c)检测多肽之间的相互作用或结合的工具。
在一些实施方案中,(a)中的多肽(即包含EGFR-结合域的多肽)包括EPHA7多肽。同样,在其他实施方案中,(b)中的多肽(即包含EPHA7-结合域的多肽)包括EGFR多肽。
[2]一种用于筛选调节EGFR的EPHA7-介导的磷酸化的试剂的试剂盒,其中所述试剂盒包括:
(a)包含EPHA7多肽的蛋白激酶区的多肽,或其功能等价物;
(b)包含EGFR多肽的EPHA7-介导的磷酸化位点的多肽,或其功能等价物;和
(c)检测(b)中多肽的磷酸化水平的工具。
在一些实施方案中,(a)中的多肽(即EGFR多肽的功能等价物)包括所述多肽的至少一个EPHA7介导的磷酸化位点。而且EPHA7介导的磷酸化位点为EGFR多肽的Tyr845。
[3]一种筛选用于预防或治疗癌症的试剂的试剂盒,其中所述试剂盒包括:
(a)包含STK31多肽的蛋白激酶区的多肽;
(b)底物;和
(c)检测(b)中底物的磷酸化水平的工具。
在一些实施方案中,所述底物为BMP。
[4]一种筛选用于预防或治疗癌症的试剂的试剂盒,其中所述试剂盒包括:
(a)表达编码WDHD1多肽或其功能等价物的基因的细胞;和
(c)检测(a)中多肽的磷酸化水平的工具。
在一些实施方案中,用于本发明的筛选的多肽在活细胞中表达。
[5]一种用于筛选阻断CDCA5多肽与CDC2多肽之间相互作用或结合的试剂的试剂盒,其中所述试剂盒包括:
(a)包含CDCA5多肽的CDC2-相互作用域的多肽;
(b)包含CDC2多肽的CDCA5-相互作用域的多肽;和
(c)检测所述多肽之间相互作用或结合的工具。
[6]一种用于筛选试剂的试剂盒,所述试剂调节CDCA5的CDC2-介导的磷酸化,其中所述试剂盒包括:
(a)包含CDC2多肽的蛋白激酶区的多肽;
(b)包含CDCA5多肽的CDC2-介导的磷酸化位点的多肽,或其功能等价物;和
(c)检测(b)中多肽的磷酸化水平的工具。
[7]一种筛选用于预防或治疗表达CDCA5的癌症的试剂的试剂盒,其中所述试剂盒包括:
(a)包含CDC2多肽的蛋白激酶区的多肽,或其功能等价物;
(b)包含CDCA5多肽的CDC2-介导的磷酸化位点的多肽,或其功能等价物;和
(c)检测(b)中多肽的磷酸化水平的工具。
[8]一种筛选用于预防或治疗癌症的试剂的试剂盒,其中所述试剂盒包括:
(a)表达编码CDCA5多肽或其功能等价物的基因的细胞;和
(c)检测(a)中多肽的磷酸化水平的工具。
[9]一种筛选阻断CDCA5多肽与ERK多肽之间的相互作用或结合的试剂的试剂盒,其中所述试剂盒包括:
(a)包含CDCA5多肽的ERK-相互作用域的多肽;
(b)包含ERK多肽的CDCA5-相互作用域的多肽;和
(c)检测所述多肽之间的相互作用或结合的工具。
[10]一种筛选调节CDCA5的ERK-介导的磷酸化的试剂的试剂盒,其中所述试剂盒包括:
(a)包含ERK多肽的蛋白激酶区的多肽;
(b)包含CDCA5多肽的ERK-介导的磷酸化位点的多肽,或其功能等价物;和
(c)检测(b)中多肽的磷酸化水平的工具。
[11]一种筛选用于预防或治疗表达CDCA5的癌症的试剂的试剂盒,其中所述试剂盒包括:
(a)包含ERK多肽的蛋白激酶区的多肽,或其功能等价物;
(b)包含CDCA5多肽的ERK-介导磷酸化位点的多肽,或其功能等价物;和
(c)检测(b)中多肽的磷酸化水平的工具。
[12]一种筛选用于预防或治疗癌症的试剂的试剂盒,其中所述试剂盒包括:
(a)表达编码CDCA5多肽或其功能等价物的基因的细胞;和
(c)检测(a)中多肽的磷酸化水平的工具。
本发明进一步提供包含用于治疗本说明书中所述病理症候的物质的制品或试剂盒。所述制品可包括如本说明书中所述的药物的带标签的容器。如上文所指出的,合适的容器例如包括瓶子、管形瓶和试管。所述容器可由多种材料构成,例如玻璃或塑料。在本发明的上下文中,所述容器存贮含有活性剂的组合物,所述活性剂有效于治疗细胞增殖性疾病(如肺癌或食道癌)。组合物中的活性剂可为经鉴定的受试化合物(例如抗体、小分子等),其能够破坏体内EPHA7/EGFR、CDCA5/CDC2或CDCA5/ERK结合,抑制EGFR的EPHA7-介导的磷酸化,抑制STK31激酶活性,或者抑制WDHD1或CDCA5的磷酸化。容器上的标签可标明所述组合物用于治疗一种或多种特征在于异常细胞增殖的疾病。所述标签还可标明用药说明和监测技术,例如本说明书中所述的那些。
除上述容器之外,本发明的试剂盒可选择性地包括贮藏药学可接受稀释剂的第二种容器。其可进一步包括站在商业最终用户的立场所需的其他物质,包括其他缓冲液、稀释剂、滤器、针、注射器和药品说明书,带有使用说明。
若需要,可将所述组合物以包装或分配设备提供,其可包含一种或多种含活性成分的单位剂量形式。所述包装例如可包括金属或塑料箔,例如发泡包装。所述包装或分配设备可附有施用的说明书。还可制备配方在适合的药学载体中的包括本发明试剂的组合物,将其置于适当的容器中,并标明用于治疗指定的疾病。
以下参考本发明的实施例详细地描述本发明。但是,以下材料、方法和实施例仅说明本发明的各个方面,决非意欲限制本发明的范围。同样地,在实施或检验本发明时可使用与本文所述类似或等同的方法和材料。
实施例
本发明将用以下实施例进一步描述,其并不限制权利要求书中所述的本发明的范围。
[实施例1]
(1)细胞系和临床样品
用在本研究中的23种人肺癌细胞系包括9种腺癌(ADCs;A427、A549、LC319、NCI-H1373、PC-3、PC-9、PC-14、NCI-H1666和NCI-H1781),9种鳞状细胞癌(SCCs;EBC-1、LU61、NCI-H520、NCI-H1703、NCI-H2170、RERF-LC-AI和SK-MES-1、NCI-H226和NCI-H647),1种大细胞癌(LCC;LX1),以及4种小细胞肺癌(SCLCs;DMS114、DMS273、SBC-3和SBC-5)。用在本研究中的人食道癌细胞系如下:9种SCC细胞系(TE1、TE2、TE3、TE4、TE5、TE6、TE8、TE9和TE10)以及1种腺癌(ADC)细胞系(TE7)(Nishihira T、et al.、J Cancer Res Clin Oncol 1993;119:441-49)。
所有细胞在补充10%胎牛血清(FCS)的适当培养基中单层生长,于37℃在含5%CO2的潮湿空气的气氛中维持。人小气道上皮细胞(SAEC)在购自Cambrex Bio Science公司(Walkersville,MD)的最佳培养基(SAGM)中生长。原发性肺癌和ESCC样本先前已经知情同意获得(Kikuchi T,et al.,Oncogene2003;22:2192-205;Taniwaki M,et al.,Int J Oncol 2006;29:567-75;YamabukiT,et al.,Int J Oncol 2006;28:1375-84)。
根据国际抗癌联盟(International Union Against Cancer)TNM分类法判断了临床分期(Sobin L & Wittekind Ch.TNM Classification of MalignantTumours,6th edition.New York:Wiley-Liss;2002)。还从接受手术的患者中获得了甲醛固定的原发性NSCLC(EPHA7共402例;STK31共368例;WDHD1共264例)和邻近正常肺组织样本,用于在组织微阵列上免疫染色。还从接受根治性手术的患者中获得了福尔马林固定的原发性ESCC(EPHA7共292例;WDHD1共297例)和邻近正常食道组织样本。从接受根治性手术的患者中获得了针对EPHA7的27例SCLC样本。本研究及全部临床材料的应用均经各机构伦理委员会批准。
(2)血清样本
经书面知情同意,从127例健康对照个体(100例男性,27例女性;年龄中值53岁,范围31-61岁),以及从89例患有慢性阻塞性肺疾病(chronicobstructive pulmonary disease,COPD)的非肿瘤肺病患者(78例男性,11例女性;年龄中值68岁,范围54-84岁)中获得了血清样本,所述肺病患者加入为日本个人医疗计划(Japanese Project for Personalized Medicine)(BioBankJapan)的一部分或者入院至广岛大学医院(Hiroshima University Hospital)。所有这些患者都是现时吸烟者和/或曾吸烟者(包-年指标(pack-year index,PYI)的均值[+/-1SD]为71.9+/-45.4;PYI定义为一天消耗的香烟包数[每包20根香烟]乘以年)。
还经知情同意,从214例入院至广岛大学医院及神奈川癌症中心医院(Kanagawa Cancer Center Hospital)的肺癌患者,以及从129例在BioBankJapan中登记的肺癌患者(229例男性,114例女性;年龄中值68+/-10.8SD;范围30-89岁)中获得了血清样本。这343例病例包括205例肺ADC、59例SCC和79例SCLC。还经知情同意,从96例入院至惠佑会札幌医院或者在BioBank Japan中登记的ESCC患者(79例男性,17例女性;年龄中值63岁,范围37-74岁),以及从102例在BioBank Japan中登记的宫颈癌患者(102例女性;年龄中值46岁,范围40-55岁)中获得了血清样本。
根据以下标准选择样本用于本研究:(a)患者为最近确诊且以前未接受治疗,以及(b)患者的肿瘤病理性诊断为肺癌(I-IV期)。诊断时得到了血清,并于-150℃储存。
(3)半定量RT-PCR
根据生产商的规程,利用Trizol试剂(Life Technologies,Inc.Gaithersburg,MD),从培养细胞中提取了总RNA。利用DNase I(Nippon Gene,Tokyo,Japan)处理提取的RNA,利用寡核苷酸(dT)引物和SuperScript II对其进行反转录。扩增用引物对如下:
ACTB-F:5’-GAGGTGATAGCATTGCTTTCG-3’(SEQ ID NO:9)和
ACTB-R:5’-CAAGTCAGTGTACAGGTAAGC-3’(SEQ ID NO:10)用于ACTB,
CDCA5-F:5’-CGCCAGAGACTTGGAAATGT-3’(SEQ ID NO:11)和
CDCA5-R:5’-GTTTCTGTTTCTCGGGTGGT-3’(SEQ ID NO:12)用于CDCA5,
EPHA7-F:5’-GCAGGTAGTCAAGAAAATGCAAG-3’(SEQ ID NO:13)和
EPHA7-R:5’-CAGATCCTTCACCTCTTCCTTCT-3’(SEQ ID NO:14)用于EPHA7,
STK31-F:5’-AAGCCAAAGAAGGAGCAAAT-3’(SEQ ID NO:15)和
STK31-R:5’-CAATGAGCCTTTCCTCTGAA-3’(SEQ ID NO:16)用于STK31,
WDHD1-F:5’-AGTGAAGGAACTGAAGCAAAGAAG-3’(SEQ ID NO:17)和
WDHD1-R:5’-ATCCATTACTTCCCTAGGGTCAC-3’(SEQ ID NO:18)用于WDHD1。
优化PCR反应的循环数,以确保产物强度在扩增的对数期范围内。
(4)Northern印迹分析
使人多个组织印迹(23个正常组织,包括心、脑、胎盘、肺、肝、骨骼肌、肾、胰、脾、胸腺、前列腺、睾丸、卵巢、小肠、结肠、白细胞、胃、甲状腺、脊髓、淋巴结、气管、肾上腺、骨髓;BD Biosciences Clontech,PaloAlto,CA)与CDCA5、EPHA7、STK31的[α-32P]-dCTP-标记的PCR产物杂交。利用以下引物,通过RT-PCR制备了部分长度cDNA:
CDCA5-F:5’-GCTTGTAAAGTCCTCGGAAAGTT-3’(SEQ ID NO:19)和
CDCA5-R:5’-ATCTCAACTCTGCATCATCTGGT-3’(SEQ ID NO:20)用于CDCA5,
EPHA7-F:5’-GCAGGTAGTCAAGAAAATGCAAG-3’(SEQ ID NO:13)和
EPHA7-R:5’-CAGATCCTTCACCTCTTCCTTCT-3’(SEQ ID NO:14)用于EPHA7,
STK31-F:5’-GAAAATGGGAAAACCTGCTT-3’(SEQ ID NO:21)和
STK31-R:5’-CAATGAGCCTTTCCTCTGAA-3’(SEQ ID NO:16)用于STK31(516-bp)
WDHD1-F:5’-CTCTGATTCCAAAGCCGAAG-3’(SEQ ID NO:22)和
WDHD1-R:5’-ATCCATTACTTCCCTAGGGTCAC-3’(SEQ ID NO:18)用于WDHD1(535-bp)。
根据供应商的推荐进行预杂交、杂交和洗涤。通过增强BAS屏(Bio-RadLaboratories,Hercules,CA)使所述印迹放射自显影,对于CDCA5于-80℃7天,对于EPHA7于-80℃两周,对于STK31于室温30小时,对于WDHD1于-80℃7天。
(5)Western印迹
用裂解缓冲液裂解了肿瘤组织或细胞;50mM Tris-HCl(pH 8.0),150mM NaCl,0.5%NP-40,0.5%脱氧胆酸盐-Na,0.1%SDS,及Protease InhibitorCocktail Set III(EMD Biosciences,Inc.,San Diego,CA)。以牛血清白蛋白(BSA)作为标准,通过Bio-Rad蛋白测定试剂盒(Hercules,CA),测定了各裂解物的蛋白质含量。将各裂解物10μg于10%-12%变性聚丙烯酰胺凝胶(用3%聚丙烯酰胺浓缩胶)上分离,经电泳转移至硝酸纤维素膜(GE HealthcareBio-sciences,Piscataway,NJ)。对于STK31,用含5%脱脂奶粉的TBST封闭后,所述膜与一抗一起于室温温育1小时。对于WDHD1,用含Block Ace(Dainippon Seiyaku,Osaka,Japan)的TBS-Tween 20(TBST)封闭后,将所述膜与一抗一起于-4℃温育过夜。免疫活性蛋白与辣根过氧化物酶-偶联的二抗(GE Healthcare Bio-sciences)一起于室温温育1小时。用TBST洗涤后,利用增强化学发光试剂盒(GE Healthcare Bio-sciences)使反应物显影。
用在本研究中的商业上可得到的抗体如下:
针对来自人EPHA7 N末端部分的表位的兔多克隆抗体(批号sc25459,Santa Cruz,Santa Cruz,CA);
针对来自人EPHA7 C末端部分的表位的兔多克隆抗体(批号ab5411,Abcam);
针对人STK31的兔多克隆抗体(ABGENT,San Diego,CA);和
针对人WDHD1的兔多克隆抗体(ATLAS Antibodies AB(Stockholm,Sweden))。
为鉴定底物和下游靶蛋白,所述下游靶蛋白将通过EPHA7信号被磷酸化并激活细胞增殖信号,本发明人利用经EPHA7表达载体转染的COS-7细胞的细胞裂解物和一系列特异针对与癌细胞信号传导有关的磷酸化蛋白的抗体,进行了EPHA7的激酶底物的免疫印迹筛选(参见表2)。
表2一系列特异针对与癌细胞信号传导有关的磷酸化蛋白的抗体列表
Figure GPA00001115063301311
Figure GPA00001115063301321
Figure GPA00001115063301331
Figure GPA00001115063301341
(6)表达载体
将CDCA5(SEQ ID NO:1的74-829nt)或EPHA7(SEQ ID NO:3的214-3210nt)或WDHD1(SEQ ID NO:5的79-3468nt)的全编码序列克隆至pcDNA3.1myc-His质粒载体(invitrogen)的适当位点。将STK31(SEQ ID NO:7的467-3457nt)的全编码序列克隆至pCAGGSn3FC载体的适当位点。
利用FuGENE6转染试剂(Roche),将c-Myc-标签的CDCA5(pcDNA3.1/myc-His-CDCA5)、c-Myc-标签的EPHA7(pcDNA3.1/myc-His-EPHA7)、c-Myc-标签的WDHD1(pcDNA3.1/myc-His-WDHD1)或FLAG-标签的STK31(pCAGGSn3FC-STK31)或者模拟载体(pcDNA3.1/myc-His或pCAGGSn3FC)转染到COS-7细胞中。
(7)免疫细胞化学分析
用PBS(-)洗涤培养细胞两次,室温用4%甲醛溶液固定30分钟,然后用含0.1%Triton X-100的PBS(-)室温使其透化3分钟。封闭非特异性结合,对于CDCA5和WDHD1用Casblock(ZYMED,San Francisco,CA)室温封闭10分钟,对于EPHA7用Casblock(ZYMED,San Francisco,CA)室温封闭7分钟,对于STK31用含3%牛血清白蛋白的PBS(-)室温封闭7分钟。然后使细胞与用含3%BSA的PBS稀释的一抗一起室温温育60分钟(对于CDCA5、EPHA7或STK31)或者10分钟(对于WDHD1)。用PBS(-)洗涤细胞后,用1∶1,000稀释的与Alexa488(Molecular Probes)偶联的驴抗兔二抗(对于CDCA5和EPHA7)或FITC偶联的二抗(Santa Cruz Biotechnology,SantaCruz,CA)(对于STK31和WDHD1),于室温染色细胞60分钟。用PBS(-)再次洗涤,之后用含4’,6-二脒基-2-苯基吲哚的Vectashield(VectorLaboratories,Inc.,Burlingame,CA)包埋各标本,并用Spectral ConfocalScanning Systems(TSC SP2 AOBS;Leica Microsystems,Wetzlar,Germany)使之可视化。
在本研究中用作一抗的商业上可得到的抗体如下:
针对外源CDCA5的兔多克隆抗-c-Myc抗体(Santa Cruz Biotechnology,Santa Cruz,CA);
针对来自人EPHA7 N末端部分的表位的兔多克隆抗体(批号sc25459,Santa Cruz,Santa Cruz,CA);
针对来自人EPHA7C末端部分的表位的兔多克隆抗体(批号ab5411,Abcam);
针对STK31的兔抗人STK31多克隆抗体(ABGENT,San Diego,CA);和
针对WDHD1的兔多克隆抗-WDHD1抗体(ATLAS Antibodies AB)。
(8)免疫组织化学和组织-微阵列分析
组织切片为利用ENVISION+Kit/HRP(DakoCytomation,Glostrup,Denmark)染色的组织切片。封闭内源性过氧化物酶后加入一抗和蛋白质,将各切片与作为二抗的HRP-标签的抗-兔IgG(Histofine Simple Stain MAXPO(G),Nichirei,Tokyo,Japan)一起温育。加入底物-色原,并用苏木精将所述标本复染。如以前公开的,利用甲醛固定的NSCL构建了肿瘤-组织微阵列(Chin SF,et al.,Mol Pathol.2003 Oct;56(5):275-9;Callagy G,et al.,DiagnMol Pathol.2003 Mar;12(1):27-34;J Pathol.2005Feb;205(3):388-96)。根据与载玻片上相应的HE-染色切片的目视比对选择了取样的组织面积。利用组织微阵列仪(Beecher Instruments,Sun Prairie,WI),将取自供体肿瘤块的3个、4个或5个组织核心(直径0.6mm;高3-4mm)埋入受体石蜡块中。从每一例穿取正常组织的核心,用产生的微阵列块的5-μm切片进行免疫组织化学分析。由事先不知道临床病理学数据和临床随访数据3个独立的研究者半定量地评定染色的阳性率。染色强度利用以下标准评估:
阳性(1+),在肿瘤细胞的细胞核和细胞质中可看到呈棕色着染;
阴性(0),在肿瘤细胞中看不到染色。
各病例仅当评定者独立地评判为强阳性时方被接受为强阳性。
在本研究中用作一抗的商业上可得到的抗体如下:
针对来自人EPHA7 N末端部分的表位的兔多克隆抗体(批号sc25459,Santa Cruz,Santa Cruz,CA);
针对STK31的兔抗人STK31多克隆抗体(ABGENT,San Diego,CA);和
针对WDHD1的兔多克隆抗-WDHD1抗体(ATLAS Antibodies AB)。
(9)统计分析
利用StatView统计程序(SaS,Cary,NC,USA)进行了统计分析。我们使用列联表分析了NSCLC或ESCC患者中CX基因表达与临床病理学变量之间的关系。推算了从手术日期至因NSCLC或ESCC死亡的时间或者至最近一次随访观察的肿瘤特异存活曲线。对各相关变量和CX基因表达推算了卡普兰-迈耶曲线(Kaplan-Meier curves);利用时序检验(log-rank test)分析了患者亚群中存活时间的差别。利用Cox比例风险回归模型进行了单变量分析和多变量分析,以确定临床病理学变量与CX死亡率之间的关联。首先,我们分析了死亡与影响预后的因素(包括年龄、性别、吸烟史、组织学类型、pT-分期和pN-分期)之间的关联,每次考虑一个因素。其次,应用了多变量Cox分析,采用步降(逐步)法,其中总是将CX基因表达,连同满足P值小于0.05准入水平的所有变量一起强制引入该模型。随着所述模型继续增加因素,独立的因素没有超过P<0.05的退出水平。
(10)ELISA
利用原来已构建的ELISA系统,测定了EPHA7的血清水平。首先,将特异针对人EPHA7N末端部分的兔多克隆抗体(批号sc25459,Santa Cruz,Santa Cruz,CA)加至96孔微孔板(Apogent,Denmark),作为捕获抗体,室温温育2小时。洗掉所有非结合抗体后,将5%BSA加至孔中,于4℃温育16小时以封闭。洗涤后,将3倍稀释的血清加到预涂布捕获抗体的96孔微孔板,室温温育2小时。洗掉所有非结合抗体后,利用Biotin LabelingKit-NH2(Dojindo Molecular Technologies,Inc.,Kumamoto,Japan)将特异针对EPHA7的生物素化多克隆抗体加至孔中,室温温育2小时。洗涤除去任何非结合抗体-酶试剂之后,将HRP-链亲合素(streptavidin)加至孔中,温育20分钟。洗涤后,将底物溶液(R&D Systems,Inc.,Minneapolis,MN)加至孔中,使之反应30分钟。加入100μl 2N硫酸终止反应。利用光度计于450nm波长处测定了染色强度,参比波长570nm。根据供应商的推荐,用商业上可得到的酶检验试剂盒(HOPE Laboratories,Belmont,CA),通过ELISA测定了血清中CEA的水平。根据生产商的规程,用商业上可得到的酶检验试剂盒(TFB,Tokyo,Japan),通过ELISA测定了血清中ProGRP的水平。通过Mann-Whitney U检验,分析了肿瘤组和健康对照组之间EPHA7、CEA和ProGRP水平的差别。利用接受者操作特性(ROC)曲线分析,评估了EPHA7、CEA和ProGRP的水平,以确定有最佳诊断精确度和似然比的临界值。用Spearman秩相关(Spearman rank correlation)计算了EPHA7与CEA/ProGRP之间的相关系数。显著性定义为P<0.05。
(11)RNA干扰测定
(i)基于寡核苷酸的测定
按照生厂商的规程,利用30μl Lipofectamine 2000(Invitrogen,Carlsbad,CA),将小干扰RNA(siRNA)双链体(Dharmacon,Inc.,Lafayette,CO)(600pM)转染到肺癌细胞系LC319和A549(用于CDCA5);NCI-H520和SBC-5(用于EPHA7),以及食道癌细胞系TE9(用于WDHD1)。转染的细胞培养了7天,在转染后第7天,通过吉姆萨染色(Giemsa staining)对克隆的数目进行计数,利用3-(4,5-二甲基-2-噻唑)-2,5-二苯基溴化四唑(3-(4,5-dimethylthiazol-2-yl)-2,5-diphenyltetrazolium bromide,MTT)试验(细胞计数试剂盒-8溶液;Dojindo Laboratories,Kumanoto,Japan)评估了细胞的活力。为证实基因表达的抑制,用上述合成的引物进行了半定量RT-PCR。使用的siRNA序列如下:
对照-1(si-LUC:来自北美萤火虫(Photinus pyralis)的萤光素酶基因):5’-NNCGUACGCGGAAUACUUCGA-3’(SEQ ID NO:23);
对照-2(CNT:ON-TARGETplus siCONTROL非靶向siRNA池):5’-UGGUUUACAUGUCGACUAA-3’(SEQ ID NO:24)、5’-UGGUUUACAUGUUUUCUGA-3’(SEQ ID NO:25)、5’-UGGUUUACAUGUUUUCCUA-3’(SEQ ID NO:26)和5’-UGGUUUACAUGUUGUGUGA-3’(SEQ ID NO:27)的混合物;
对照-3(乱序/SCR:编码5S和16S rRNA的叶绿体小眼虫(Euglenagracili s)基因):5’-NNGCGCGCUUUGUAGGAUUCG-3’(SEQ ID NO:28);
对照-4(EGFP:增强的绿色荧光蛋白(GFP)基因,维多利亚水母(Aequorea victoria)GFP的突变体):5’-NNGAAGCAGCACGACUUCUUC-3’(SEQ ID NO:29)
si-CDCA5-#1:5’-GCAGUUUGAUCUCCUGGUUU-3’(SEQ ID NO:30);
si-CDCA5-#2:5’-GCCAGAGACUUGGAAAUGU UU-3’(SEQ ID NO:31);
si-EPHA7-#1(D-003119-05):5’-AAAAGAGAUGUUGCAGUA-3’(SEQID NO:32);
si-EPHA7-#2(D-003119-08):5’-UAGCAAAGCUGACCAAGAA-3’(SEQID NO:33);
si-WDHD1-#1(D-019780-01):5’-GAUCAGACAUGUGCUAUUA UU-3’(SEQ ID NO:34);和
si-WDHD1-#2(D-019780-02):5’-GGUAAUACGUGGACUCCUA UU-3’‘(SEQ ID NO:35)。
(ii)基于载体的测定
本发明人以前已建立了基于载体的RNAi系统,siH1BX3.0,将其设计成了在哺乳动物细胞中合成小干扰RNAs(siRNA)(Suzuki C,et al.,CancerRes.2003 Nov 1;63(21):7038-41)。利用30μL Lipofectamine 2000(Invitrogen),将10μg siRNA表达载体转染至肺癌细胞系LC319和NCI-H2170。在适当浓度遗传霉素(G418)存在下,培养转染的细胞7天,在G418处理后第7天,通过吉姆萨染色对集落的数目进行计数,利用3-(4,5-二甲基-2-噻唑)-2,5-二苯基溴化四唑(MTT)测定(细胞计数试剂盒-8溶液;Dojindo Laboratories,Kumanoto,Japan)评估了细胞的活力。为证实STK31蛋白表达的抑制,根据标准规程,用亲和纯化的针对STK31的多克隆抗体进行了Western印迹。合成的针对RNAi的寡核苷酸的靶序列如下:
对照1(增强的绿色荧光蛋白(EGFP)基因,Aequorea victoria GFP的突变体),5’-GAAGCAGCACGACTTCTTC-3’(SEQ ID NO:36);
对照2(萤光素酶/LUC:北美萤火虫萤光素酶基因),5’-CGTACGCGGAATACTTCGA-3’(SEQ ID NO:37);
si-STK31-#1,5’-GGAGATAGCTCTGGTTGAT-3’(SEQ ID NO:38);和
si-STK31-#2,5’-GGGCTATTCTGTGGATGTT-3’(SEQ ID NO:49)。
(12)细胞生长测定
用表达myc-His-标签的EPHA7、FLAG-标签的STK31的质粒,或者用模拟质粒转染的COS-7细胞,在适当浓度遗传霉素(G418)存在下,在含10%FCS的DMEM中生长8天。通过MTT试验评估了细胞的活力;简言之,将细胞计数试剂盒-8溶液(DOJINDO)以1/10体积的浓度加至各平板,平板于37℃再温育2小时。然后用Microplate Reader 550(BIO-RAD,Hercules,CA)测定了490nm处的吸光度,以630nm处的吸光度作为参比。
利用FuGENE6转染试剂(Roche),将c-Myc/His-标记的CDCA5表达载体(pcDNA3.1-c-Myc/His-CDCA5)或模拟载体(pcDNA3.1-c-Myc/His)转染至COS-7或NIH3T3细胞。在含0.4mg/ml新霉素(Geneticin,Invitrogen)的培养基中培养转染的细胞。7天后,通过MTT测定评估了细胞的活力。
利用引物对5’-CGCGGATCCCACCATGGTTTTTCAAACTCG-3’(SEQID NO:65)和5’-CCGCTCGAGCACTTGAATGCCAGTTCCATGTAA-3’(SEQID NO:66),通过RT-PCR扩增了EPHA7的全编码序列,将其克隆至pcDNA3.1myc-His质粒载体(invitrogen)的适当位点。用表达myc-His-标签的EPHA7或者用模拟质粒转染的COS-7细胞,在适当浓度遗传霉素(G418)存在下,在含10%FCS的DMEM中生长8天。通过MTT测定评估了细胞的活力;简言之,将细胞计数试剂盒-8溶液(DOJINDO)以1/10体积的浓度加至各平板,平板于37℃再温育2小时。然后用Microplate Reader 550(BIO-RAD,Hercules,CA),测定了490nm处的吸光度,以630nm处的吸光度作为参比。
(13)基质胶侵袭测定
用表达EPHA7的质粒,或者用模拟质粒转染的COS-7细胞和NIH3T3细胞,在含10%FCS的DMEM中生长至接近汇合。利用胰酶消化收集细胞,用未添加血清或蛋白酶抑制剂的DMEM洗涤,以5×105个细胞/ml悬浮于DMEM中。制备细胞悬液之前,用DMEM使基质胶(Matrigel)介质(BectonDickinson Labware)的干燥层于室温再水化2小时。将含10%FCS的DMEM(0.75ml)加至24孔基质胶侵袭室的各下室,0.5ml(2.5×105个细胞)细胞悬液加至上室的各小室。小室的平板于37℃温育22小时。温育后,处理所述室;如供应商(Becton Dickinson Labware)所指导的,将侵袭穿过基质胶的细胞固定,并用Giemsa染色。
(14)体外激酶测定
本发明人利用全长重组STK31蛋白(Invitrogen)做了体外激酶测定。简言之,使0.5μg STK31蛋白在30μl激酶缓冲液{250mmol/L Tris-HCl(pH7.4)/50μmol/L MgCl2/5mmol/L NaF/10mmol/L DTT/20μmol/L ATP}中温育,然后补加5μCi的[γ-32P]-ATP(GE Healthcare)。对于底物,我们加入了10μg MBP至反应溶液中。30℃温育30分钟后,加入SDS样品缓冲液使反应终止。将蛋白质样品煮沸后,在15%凝胶(Bio-Rad Laboratories)上电泳,然后使之放射自显影。还将重组STK31与从COS-7细胞制备的全部提取物一起于30℃在反应溶液中温育30分钟,加入SDS样品缓冲液使反应终止。蛋白质样品煮沸后,用SDS-PAGE分离,然后进行western印迹。
还利用全长重组GST-CDCA5(用Precision Protease剪切的pGEX-6p-1/CDCA5),进行了体外激酶测定。简言之,使GST-CDCA5、组蛋白H1(Upstate)、MBP、或GST各1.0μg,在补充了1μCi[γ-32P]-ATP(GEHealthcare)和2单位CDC2(BioLabs)或50ng ERK2(Upstate)的20μl激酶缓冲液(50mM Tris-HCl,10mM MgCl2,1mM EGTA,2mM DTT,0.01%Briji 35,1mMATP,pH7.5 25℃)中,于30℃温育20分钟。用Laemmli SDS样品缓冲液终止反应至终体积30μl,使一半样品经5%-15%梯度凝胶(Bio-RadLaboratories),通过放射自显影使磷酸化可视化。MBP用作ERK底物,H1用作CDC2底物(阳性对照)。GST作为阴性对照底物。
利用野生型或突变型WDHD1蛋白的免疫沉淀物进一步进行了体外激酶测定。将野生型或突变型WDHD1蛋白的免疫沉淀物与重组AKT1(AKT1;Invitrogen,Carlsbad,CA)(GenBank登录号:NM_001014431,SEQ ID NO.:60)一起,在补充了蛋白酶抑制剂、10mmol/L NaF、5nmol/L微囊藻素(microcystin LR)和50μmol/L ATP的混合物的激酶缓冲液[20mmol/L Tris(pH 7.5),10mmol/L MgCl2,2mmol/L MnCl2,1mmol/L苯甲磺酰基氟化物,1mmol/L DTT]中温育。加入0.2体积的5X蛋白样品缓冲液终止反应,用SDS-PAGE分析了所述蛋白质。
(15)流式细胞术
用PBS收集细胞,在70%冷乙醇中固定细胞30分钟。以100μg/mLRNase(Sigma/Aldrich,St.Louis,MO)处理后,用含50μg/mL碘化丙啶(Sigma/Aldrich,St.)的PBS将细胞染色。在Becton Dickinson FACScan上完成流式细胞计数,用ModFit软件(Verity Software House,Inc.,Topsham,ME)分析。分析了从至少20,000个未设门细胞中选择的细胞的DNA含量。
(16)细胞周期进程中WDHD1表达的分析
用含1%FBS和4μg/ml阿非科林(aphidicolin)(Sigma/Aldrich,St.Louis,MO)的RPMI1640,使密度为5×105个细胞/100mm平皿的LC319细胞同步化于G0/G1期24小时,通过移除阿非科林使其从G1期阻滞中释放。然后在移除阿非科林后0小时、4小时和9小时用胰蛋白酶消化细胞,并收集所述细胞用于流式细胞分析和western-印迹分析。用含1%FBS和1μg/ml阿非科林(Sigma/Aldrich,St.Louis,MO)的RPMI1640,使密度为5×105个细胞/100mm平皿的A549细胞同步化于G0/G1期18小时,通过移除阿非科林使其从G1期阻滞中释放。然后在移除阿非科林后0小时、2小时、4小时、6小时、8小时和10小时用胰蛋白酶消化细胞,并收集所述细胞用于流式细胞分析和western-印迹分析。
(17)活细胞成像
细胞在35mm玻璃底平皿上含10%胎牛血清(FBS)的无酚红达尔伯克改良伊格尔培养基(Dulbecco′s modified Eagle′s medium)中生长。用siRNA转染细胞,利用配有物镜(Olympus,UAPO 40×/340N.A.=0.90)、卤素灯泡、红色LED(620nm)、CCD照相机(Olympus,DP30)、差动干扰对比(differentialinterference contrast,DIC)光学元件和干扰滤光片的计算机辅助荧光显微镜(Olympus,LCV100),使细胞经延时成像(time-lapse imaging)。对于DIC成像,使用了带有包含检偏器的立方过滤器的红色LED。利用MetaMorph 6.13软件(Universal Imaging,Media,PA)进行了图像采集和图像分析。
(18)MALDI-T0F质谱分析
CDCA5重组蛋白与ERK或CDC2一起,于37℃温育3.5小时。在SDS-PAGE凝胶上分离样品。电泳后,用R-250(Bio-Rad)染色凝胶。如以前所述(Kato T.,et al.Clin Cancer Res 2008;14:2363-70),用胰蛋白酶消化对应于CDCA5的特异性条带,并用于通过基质辅助的激光解吸/电离质谱分析(MALDI-QIT-TOF;Shimadzu Biotech,Kyoto,Japan)进行分析。利用Mascot检索引擎(http://www.matrixscience.com)评估了质谱的数据,以从一级序列数据库中鉴定蛋白质。
(19)有丝分裂期细胞同步化及EGF刺激试验
通过与2μg/ml阿非科林温育16小时,使培养的A549和LC319肺癌细胞以及宫颈鳞状细胞癌Hela细胞同步化于G1/S期。为有丝分裂同步化,使所述细胞在第0小时从G1/S期释放。在第5小时加入诺考达唑(nocodazole),以阻止有丝分裂退出。此时,加入CDC2抑制剂或PBS至细胞培养物中。对于EGF刺激测定,将Hela细胞在无FBS培养基中培养20小时。然后,用50μg/ml EGF刺激所述细胞30分钟,含有或不含10μM MEK抑制剂U0126(Promega)。
(20)鉴定EPHA7相关蛋白
用表达EPHA7(pcDNA3.1/myc-His-EPHA7)的质粒或空白载体(pcDNA3.1/myc-His作为对照)转染的COS-7细胞(5×106),在针对蛋白水解酶(EMD,San Diego,CA)和磷酸酶(EMD)的抑制剂存在下,在1mL裂解缓冲液(0.5%NP40,50mmol/L Tris-HCl,150mmol/L NaCl)中温育。在蛋白酶抑制剂存在下,通过与60μL蛋白G-琼脂糖珠(Invitrogen)一起,于4℃在终体积1.2mL的免疫沉淀缓冲液(0.5%NP40,50mmol/L Tris-HCl,150mmol/L NaCl)中温育1小时来预清理细胞提取物。4℃ 1,500rpm离心1分钟后,上清液于4℃与抗-c-myc琼脂糖(Sigma)一起温育2小时。通过3,000rpm离心1分钟,从各样品中收集所述珠子并用1mL免疫沉淀缓冲液洗涤6次,之后使珠子重悬于30μL Laemmli样品缓冲液并煮沸5分钟,再在5%-10%SDS-PAGE凝胶(Bio-Rad)上分离蛋白质。电泳后,凝胶用银染色。切下在EPHA7-转染的提取物中特异发现的蛋白条带,用于通过基质辅助的激光解吸/电离飞行时间质谱(MALDI-TOF-MS;AXIMA-CFR plus,SHIMADZU BIOTECH,Kyoto,Japan)分析。为了证实EPHA7与MET(GenBank登录号:NM_000245)之间的相互作用,我们进行了免疫沉淀实验。为获得带FLAG标签的MET,我们利用引物对5’-TTGCGGCCGCAAATGAAGGCCCCCGCTGTGCTTG-3’(SEQ ID NO:67)和5’-CCGCTCGAGCGGTGATGTCTCCCAGAAGGAGGCTG-3’(SEQ ID NO:68),通过RT-PCR扩增了全长编码序列,将所述全长编码序列克隆至pCAGGSn-3Fc质粒载体的适当位点。用抗-c-Myc-琼脂糖对来自以pCCAGGSn-3Fc-MET和pcDNA3.1/myc-His-EphA7转染的COS-7细胞的提取物进行免疫沉淀。利用抗-FLAG M2单克隆抗体(Sigma-Aldrich)进行了免疫印迹。为了进一步证实,我们还利用抗-c-myc多克隆抗体(Santa-Cruz)进行了免疫印迹,之后利用抗-Flag琼脂糖免疫沉淀同一提取物。为了证实EPHA7与EGFR之间的相互作用,我们将全长编码序列克隆至pCAGGSn-3Fc质粒载体的适当位点。使来自以pCCAGGSn-3Fc-EGFR和pcDNA3.1/myc-His-EphA7转染的COS-7细胞的提取物免疫沉淀,并用与MET相同的方法进行了免疫印迹。
体外EPHA7激酶测定
活化的重组EPHA7(Carnabioscience,Kobe,Japan)、EGFR(Millipore,Billerica,MA)、MET(Millipore)、EGFR抑制剂AG1478(EMD)和MET抑制剂SU11274是商业上可购买的。我们构建了表达EGFR部分片段(#1:密码子692-891,#2:密码子889-1045,#3:密码子1046-1186)的质粒,利用pGEX载体(GE Healthcare Bio-sciences)制备了在它们的N末端包含GST标签的表位。重组肽在大肠杆菌,BL21 codon-plus菌株(Stratagene,La Jolla,CA)中表达,根据供应商的规程,利用TALON树脂(BD Biosciences Clontech)纯化。在SDS-PAGE凝胶上提取纯化的蛋白质。为避免EGFR或MET自身磷酸化,我们预先确定了AG1478或SU11274的最小抑制浓度,并确认了这些抑制剂在这样的浓度不抑制EPHA7的自身磷酸化。利用EGFR作为底物的EPHA7激酶测定包括以下反应混合物:20ng EPHA7蛋白,50ng EGFR蛋白(有1mM AG1478[EGFR抑制剂;见上文]的活化重组蛋白质或者无抑制剂的部分非活化EGFR片段),50mM tris-HCl,10mM MgCl2,2mM DTT,1mM NaF,以及0.1μL蛋白酶抑制剂,之后添加含3.μCi[γ-32P]ATP(GEHealthcare Bio-sciences)的1mM ATP。30℃温育30分钟后,加入SDS样品缓冲液终止反应。蛋白质样品煮沸后,在5%-15%梯度凝胶(Bio-Rad)上电泳,然后用Molecular imager FX(Bio-Rad)使信号可视化。在利用MET作为底物的EPHA7激酶测定中,我们采用了与上述EPHA7-EGFR激酶反应相同的方法,利用50ng MET和12.5μM SU11274(MET抑制剂;见上文),代替EGFR和AG1478。为确定激酶反应中存在酪氨酸磷酸化蛋白质,我们利用不包含[γ-32P]ATP的1mM ATP进行了体外激酶测定,利用抗-泛磷酸酪氨酸抗体(Invitrogen)检测了磷酸化的蛋白质。
鉴定EPHA7的下游信号通路
为鉴定与EGFR/MET有关的活化的信号通路,我们利用外源表达EPHA7的COS-7细胞的提取物进行了免疫印迹筛选。简言之,将COS-7细胞以1×106的数目接种平皿,24小时后用表达EPHA7的质粒(pcDNA3.1/myc-His-EPHA7)或者空白载体(pcDNA3.1/myc-His作为对照)转染所述细胞,温育48小时。用冷PBS洗涤细胞两次,立即在蛋白酶抑制剂和磷酸酶抑制剂存在下加入0.5mL裂解缓冲液。然后对提取物超声,并于15,000rpm离心15分钟,收集上清液作为样品。用于免疫印迹的特异性抗体有抗-EGFR,抗-磷酸-EGFR(Tyr1068、Tyr1086和Tyr1173),抗-phospho-MET(Tyr1349),抗-p44/42MAP激酶(ERK),抗-磷酸-p44/42MAP激酶(ERK)(Thr202/Tyr204),抗-Akt,抗-磷酸-Akt(Ser473),抗-Shc,抗-磷酸-Shc(Tyr317),抗-磷酸-Shc(Tyr239/240),抗-STAT1,抗-磷酸-STAT1(Tyr701),抗-STAT3,抗-磷酸-STAT3(Tyr705),抗-STAT5和抗-磷酸-STAT5(Tyr694),它们购自于Cell Signaling technology(Danvers,MA),还有来自于Santa-Cruz的抗-MET和抗-磷酸-MET(Tyr1313)抗体。抗-磷酸-MET(Tyr1230/1234/1235,Tyr1365)来自于Invitrogen。
[实施例2]CDCA5
(1)CDCA5在肺癌和食道癌以及正常组织中的表达
本发明人先前在cDNA微阵列上筛选了27,648个基因,以检测在超过40%所分析的临床样品中,显示出在癌症细胞中表达比在正常对照细胞中表达高3倍或更高的转录物(WO2004/031413、WO2007/013665、WO2007/013671)。在上调的基因中,本发明人通过半定量RT-PCR实验,鉴定出CDCA5转录物,并证实了其在10例代表性NSCLC中的9例,全部5例SCLC,及全部23个肺癌细胞系中表达增加(图1A,上图和中图)。还在全部10例ESCC和全部10个食道癌细胞系中,观察到了CDCA5高水平表达,而PCR产物在源自正常小气道上皮(SAEC)和正常食道样本的细胞中几乎检测不到(图1B,上图和中图)。此外,利用抗-CDCA5抗体,证实了内源性CDCA5蛋白在肺癌和食道癌细胞系中强表达(图1A,B,下图)。
为考察外源性CDCA5在COS-7细胞系中的亚细胞定位,进行了免疫荧光分析,发现了CDCA5定位在间期细胞的细胞核(图1C),但在M期细胞内广泛地观察到(数据未显示)。利用CDCA5 cDNA片段作为探针的Northern印迹分析鉴定了2.8-kb的转录物在睾丸中高表达,但其转录物在任何其他正常组织中几乎检测不到(图1D)。
(2)CDCA5的生长促进活性
我们利用针对CDCA5的siRNA寡核苷酸,敲低了内源性CDCA5在肺癌细胞系A549和LC319(其显示出高水平CDCA5表达)中的表达。我们利用半定量RT-PCR考察了CDCA5的表达水平,发现与对照siRNA构建体(si-LUC和si-CNT)相比较,两种CDCA5-特异性siRNAs(si-CDCA5-#1和si-CDCA5-#2)明显地抑制CDCA5的表达(图2A和2B,上图)。集落形成和MTT测定显示,si-CDCA5的导入明显地抑制了A549和LC319细胞的生长,与其对CDCA5表达的敲低作用一致(图2A和2B,中图和下图)。接着我们考察了CDCA5在促进细胞生长中的作用。我们制备了设计成表达CDCA5的质粒(pcDNA3.1-CDCA5-c-Myc/His),将其转染至COS-7或NIH3T3细胞中。如图2C所示,与模拟载体相比较,CDCA5cDNA转染至COS-7或NIH3T3细胞中明显地增强了细胞生长。
(3)CDCA5在体外被ERK和CDC2蛋白激酶磷酸化
为分析CDCA5在癌发生中的作用,我们致力于CDCA5蛋白上的磷酸化位点。根据以前利用蛋白质组学磷酸-肽筛选的报道,CDCA5应该在丝氨酸-75、丝氨酸-79和苏氨酸-115处被磷酸化(Olsen JV,Blagoev B,Gnad F.Global,In vivo and Site-Specific Phosphorylation Dynamics in SignalingNetworks.Cell 2006;127(3):635-648.)。为鉴定CDCA5磷酸化的关联激酶,我们比较了包含丝氨酸-75、丝氨酸-79和苏氨酸-115的CDCA5的肽序列与磷酸化位点,发现CDCA5的丝氨酸-75完全符合CDC2蛋白激酶磷酸化位点[S/T-P-x-R/K],而丝氨酸-79和苏氨酸-115一致符合ERK磷酸化位点[x-x-S/T-P](图17A)。这些共有序列在许多物种中高度保守(图17A)。接着我们通过温育重组的CDC2或ERK与CDCA5,进行了体外激酶测定,发现CDCA5被ERK和CDC2直接磷酸化(图17B)。该结果同CDCA5与CDC2和/或ERK途径有关这一结论是相符的。
为确定CDCA5上由这些激酶直接磷酸化的位点,我们进行了体外激酶测定,随后配套进行MALDI-QIT-TOF分析。将重组CDCA5蛋白于37℃与ERK或CDC2蛋白激酶一起温育3.5小时。在凝胶上,与ERK一起温育的CDCA5在蛋白激酶测定后包括两个条带,但与CDC2一起温育的CDCA5表现为一个条带。我们切下4个条带用于MS分析(图17C),结果鉴定出8个ERK-依赖性和3个CDC2-依赖性磷酸化位点(图17D)。丝氨酸-21、丝氨酸-75和苏氨酸-159被ERK和CDC2磷酸化。
(4)CDCA5的ERK-依赖性体内磷酸化的鉴定
为了证明哺乳动物细胞中内源性CDCA5被ERK磷酸化,在MEK抑制剂U0126存在或不存在的情况下,用EGF刺激了血清饥饿的Hela细胞。利用抗-ERK抗体的Western印迹表明,ERK在EGF刺激后15分钟和30分钟时高度活化,但该水平在60分钟和120分钟时降低(图18A,左图)。与ERK磷酸化水平增加一致,利用抗-CDCA5抗体检测到的CDCA5条带向更高分子量的位置移动。相反,用EGF和MEK抑制剂U0126处理细胞降低了ERK磷酸化的水平,完全抑制了CDCA5条带的上移(图18A,右图)。这些结果证明内源性CDCA5蛋白可能通过ERK途径磷酸化。
为确认CDCA5的MAP激酶途径-依赖性磷酸化,并鉴定在培养的细胞中的磷酸化位点,在MEK抑制剂U0126存在或不存在的情况下,用EGF刺激了以设计成表达myc-标记的CDCA5的质粒转染的Hela细胞,它们的细胞提取物用于利用抗-myc抗体的2D-western-印迹。在未用EGF和U0126处理的Hela细胞中,检测到了2个斑点(斑点1和斑点2),但用EGF处理引起一个斑点(斑点2)的信号相对明显的增加,而其诱导了两个有更偏酸性pI值的新的斑点信号(斑点3和斑点4)。通过预温育细胞与MEK抑制剂U0126,显著减轻了这些有更偏酸性pI值的移位斑点(图18B)。另外,用U0126处理还降低了通过EGF刺激而增加的斑点2的信号。这些结果说明,作为对EGF配体刺激的响应,CDCA5被MAPK级联特异性磷酸化。
(5)CDCA5的CDK1/CDC2-依赖性体内磷酸化的鉴定
已知哺乳动物细胞中M期进入及有丝分裂状态的维持需要CDK1/CDC2和其结合蛋白细胞周期蛋白B1,说明有丝分裂中CDC2激酶的底物蛋白质的磷酸化有可能增强了(Minshull L,et al.Cell 1989;56:947-956.,Nurse P,et al.Nature 1990;344:503-508.)。根据这一假设,用阿非科林处理使得肺癌细胞系A549和LC319在G1/S期同步化。从G1/S期释放后,利用western-印迹,然后测量了整个细胞周期中内源性CDCA5蛋白的磷酸化情况。有趣的是,在M期(主要在10~11小时)观察到了上移条带,说明CDCA5可能通过CDC2途径磷酸化(图19A)。在用阿非科林处理使之在M期同步化的食道癌细胞系TE8和小细胞肺癌细胞系SBC-3中也观察到了移位的条带(图19D)。
为确定有丝分裂中内源性CDCA5磷酸化是否为CDC2-依赖性的,我们在从G1/S释放后第5小时,进一步单独用阿非科林或者用阿非科林和CDC2抑制剂CGP74514A处理了肺癌细胞,利用western印迹测定了CDCA5磷酸化的情况。单独用阿非科林处理的有丝分裂细胞逐渐表达了磷酸化的CDCA5(移位的条带)(图19B)。但用阿非科林和CGP74514A同时处理的细胞未显示出上移的条带,说明有丝分裂中CDCA5的磷酸化受到了显著抑制(图19B)。这些结果说明,有丝分裂中内源性CDCA5的磷酸化依赖于CDC2活性。我们还利用其另一种CDC2抑制剂alsterpaullone考察了该实验,4μMalsterpaullone可完全抑制CDCA5磷酸化,但其CDC2抑制活性看起来比另一种CDC2抑制剂CGP74514A要低(图19E)。
体外激酶测定鉴定了CDCA5上3个磷酸化位点(丝氨酸-21、丝氨酸-75和苏氨酸-159)。为了确定培养细胞中CDCA5上的CDC2-依赖性磷酸化位点,我们构建了有氨基酸取代的突变型CDCA5表达质粒:密码子21、75或159处丝氨酸/苏氨酸突变成丙氨酸(分别为S21A、S75A或T159A),将无标签野生型CDCA5-表达质粒或者3个突变型CDCA5构建体各转染至Hela细胞中。接着我们用阿非科林处理使细胞同步化于G1/S期。从G1/S期释放及随后用阿非科林在M期同步化后24小时,在用野生型CDCA5表达载体转染的细胞中检测到了对应于野生型CDCA5的3个不同条带,但用丝氨酸-21、丝氨酸-75或苏氨酸-159处丙氨酸取代物转染的细胞显示出与野生型CDCA5不同的CDCA5的移位带型(图19C)。结果表明,在哺乳动物细胞中CDCA5被磷酸化。此外,当用CDC2抑制剂CGP74514A处理细胞时CDCA5蛋白似乎是不稳定的,或者其密码子21处的丝氨酸残基不被磷酸化(图19C)。
这些数据与CDC5被ERK和CDC2磷酸化这一结论一致。由ERK基因编码的蛋白质是MAP激酶家族蛋白的一员,MAP激酶家族充当多个生物化学信号的整合点,与增殖、分化、转录调节和发育等多种细胞进程有关。MAPK级联通过磷酸化底物整合并处理多种胞外信号,这改变它们的催化活性和构象或创建蛋白质-蛋白质相互作用的结合部位。另一方面,周期蛋白依赖性蛋白激酶(CDK)是由催化的激酶亚基和调节的细胞周期蛋白亚基构成的异二聚体复合物,包括根据它们在细胞进程和转录调节中的作用分成两组的一个家族。CDC2/CDK1(CDC2-周期蛋白B复合物)是第一组的成员,有序地从G2至M期转变需要CDC2/CDK1。最近,CDC2被牵涉在有丝分裂检查点活化期间的细胞存活中(O’Connor DS,Wall NR,PorterACG.A p34cdc2 survival checkpoint in cancer.Cancer cell 2002;2:43-54.)。因此,我们的数据表明,ERK和CDC2对CDCA5的磷酸化可促进使肿瘤恶性潜能增加的癌细胞周期进程。
(6)讨论
预期分子靶向的药物对恶性细胞是高度特异的,并且由于它们定义明确的作用机制而具有极小的不良反应。尽管现代外科技术和辅助的化疗放射治疗有改善,但在恶性肿瘤中已知肺癌和ESCC预后最差。因此,当前迫切需要开发有效的诊断生物标志,用于癌症早期检测和更好地选择对不同患者的辅助治疗方法,以及开发新型抗癌药和/或癌症疫苗。为鉴定合适的诊断和治疗靶分子,我们把1)用于选择在肺癌和食道癌细胞中过表达基因的全基因组范围表达分析(Kikuchi T,et al.,Oncogene.2003 Apr 10;22(14):2192-205;Kakiuchi S,et al.,Mol Cancer Res.2003 May;1(7):485-99;KakiuchiS,et al.,Hum Mol Genet.2004 Dec 15;13(24):3029-43.Epub 2004 Oct 20;Kikuchi T,et al.Int J Oncol.2006 Apr;28(4):799-805;Taniwaki M,et al,Int JOncol.2006 Sep;29(3):567-75;Yamabuki T,et al.,Int J Oncol.2006Jun;28(6):1375-84),与2)利用RNAi技术的功能缺失效应高通量筛选(Suzuki C,et al.,Cancer Res.2003 Nov 1;63(21):7038-41;Ishikawa N,et al.,Clin Cancer Res.2004 Dec 15;10(24):8363-70;Kato T,et al.,Cancer Res.2005Jul 1;65(13):5638-46;Furukawa C,et al.,Cancer Res.2005 Aug 15;65(16):7102-10;Ishikawa N,et al.,Cancer Res.2005 Oct 15;65(20):9176-84;Suzuki C,et al.,Cancer Res.2005 Dec 15;65(24):11314-25;Ishikawa N,et al.,Cancer Sci.2006 Aug;97(8):737-45;Takahashi K,et al.,Cancer Res.2006 Oct 1;66(19):9408-19;Hayama S,et al.,Cancer Res.2006 Nov 1;66(21):10339-48;Kato T,etal.,Clin Cancer Res.2007 Jan 15;13(2 Pt 1):434-42;Suzuki C,et al.,MolCancer Ther.2007 Feb;6(2):542-51;Yamabuki T,et al.,Cancer Res.2007 Mar15;67(6):2517-25;Hayama S,et al.,Cancer Res.2007 May 1;67(9):4113-22)结合起来。利用这种系统性研究策略,我们发现CDCA5在临床肺癌和ESCC样本中常常是过表达的,并显示了该基因产物的过表达在肺癌细胞生长中发挥必要的作用。
先前的研究已证明,在间期CDCA5与染色质上的黏合素相互作用并在那里发挥作用,以维持姐妹染色单体的凝聚,姐妹染色单体比正常在多数G2细胞中分离得更远,这与CDCA5已是S期凝聚的建立所必需的这一结论一致(Schmitz J,et al.,Curr Biol.2007 Apr 3;17(7):630-6.Epub 2007 Mar8)。迄今为止,仅有一种另外的蛋白质为已知的凝聚建立所特别需要的:芽殖酵母乙酰转移酶Ecol/Ctf7(Skibbens RV,et al.,Genes Dev.1999 Feb1;13(3):307-19;Tóth A,et al.,Genes Dev.1999 Feb 1;13(3):320-33;Ivanov D,et al.,Curr Biol.2002 Feb 19;12(4):323-8)。该酶的同源物也是果蝇属(Drosophila)和人类细胞中凝聚所需要的(Williams BC,et al.,Curr Biol.2003Dec 2;13(23):2025-36;Hou F & Zou H.Mol Biol Cell.2005Aug;16(8):3908-18.Epub 2005 Jun 15),但尚不知道这些蛋白质是否也在S期发挥作用。因此,讨论CDCA5和Eco1/Ctf7同系物是否在癌细胞中合作建立凝聚将是有趣的。
姐妹染色单体凝聚必须在细胞周期中适当的时候建立和分离,以有效地确保精确的染色体分离。以前已经显示,APCCdc20的活化通过靶向用于降解的晚期抑制剂保全素(securin),从而控制凝聚的分离。这允许Scc1/Rad21的分离酶(separase)依赖的裂解,触发晚期的开始。APC的大多数细胞周期物质的降解就它们的作用而言是合理的;降解避免过早存在活性,以棘轮样(rachet-like)的方式促进细胞周期进展。CDCA5的作用还可能与其他调节凝聚的因子冗余,它们的活性联合起来确保染色体复制和分离的精确度(Rankin S,et al.,Mol Cell.2005 Apr 15;18(2):185-200)。根据我们的微阵列数据,APC;CDC20还在肺癌和食道癌中高表达;但它们在正常组织中的表达较低。此外,利用半定量RT-PCR和免疫组织化学分析,证实了CDC20在临床小细胞肺癌中高表达(Taniwaki M,et al.,Int J Oncol.2006Sep;29(3):567-75)。这些数据与CDCA5与CDC20协作通过促进细胞周期进展而增强癌细胞生长这一结论一致,但没有证据显示这些分子可直接与CDCA5相互作用。
以前有人报道了CDCA5在间期定位于细胞核,有丝分裂中定位于胞质(Rankin S,et al.,Mol Cell.2005 Apr 15;18(2):185-200)。但其生理功能尚不清楚。CDCA5被证明定位于细胞核。细胞核包含遗传物质,其主要功能是维持基因的完整性并调节基因表达。细胞核为一个动态的结构,根据细胞的需要而变化。为了控制细胞核功能,调节从细胞核进入和退出的过程。CDCA5集中在细胞核中,说明该分子可作为控制细胞周期的必要因子发挥作用(Kho CJ,et al.,Cell Growth Differ.1996Sep;7(9):1157-66;Bader N,et al.,Exp Gerontol.2007 Apr 10;[印刷前电子发布])。虽然已知CDCA5在细胞周期控制中发挥重要作用,但没有研究证明CDCA5与癌发生过程有任何联系。本发明人证实了引入si-CDCA5显著抑制了肺癌细胞的生长,而CDCA5对哺乳动物细胞有生长促进作用,证明CDCA5对癌细胞生长/存活发挥重要作用。此外,仅在睾丸中观察到了CDCA5表达,意味着该基因是有希望用于癌症免疫疗法(例如癌症疫苗)的而不良反应极小的靶分子。
这些数据与CDCA5被ERK和CDC2磷酸化的结论一致。由ERK基因编码的蛋白质是MAP激酶家族蛋白的一员,其充当多个生物化学信号的整合点,与多种细胞进程有关,例如增殖、分化、转录调节和发育。MAPK级联通过磷酸化底物整合并处理多种胞外信号,这改变它们的催化活性和构象或创建蛋白质-蛋白质相互作用的结合部位。另一方面,周期蛋白依赖性蛋白激酶(CDKs)是由催化的激酶亚基和调节的细胞周期蛋白亚基构成的异二聚体复合物,包括根据它们在细胞进程和转录调节中的作用分成两组的一个家族。CDC2/CDK1(CDC2-周期蛋白B复合物)是第一组的成员,有序地从G2至M期转变需要CDC2/CDK1。最近,CDC2被牵涉在有丝分裂检查点活化期间的细胞存活中(O’Connor DS,Wall NR,Porter ACG.Ap34cdc2 survival checkpoint in cancer.Cancer cell 2002;2:43-54.)。因此,我们的数据显示了,CDCA5被ERK和CDC2磷酸化促进了使肿瘤恶性可能性增加的癌细胞周期进程。
总之,这些数据证明了CDCA5促进肺癌和食道癌的生长,说明其用作有效的治疗靶标,用于开发抗癌药。
[实施例3]EPHA7
(1)EPHA7在肺癌和正常组织中的表达和细胞定位
本发明人利用cDNA微阵列筛选在大部分肺癌(WO2007/013665)和/或食道癌中被高度反式激活的成分,鉴定出EPHA7基因为好的候选物。该基因显示出在大多数肺癌和食道癌中3倍或更高水平表达。接着我们通过半定量RT-PCR实验,证实了其在10例NSCLC中的7例(5例ADC中的3例和5例SCC中的4例)和全部3例SCLC(图3A,上图),以及19个NSCLC细胞系中的9个和4个SCLC细胞系中的3个(图3A,下图)中的反式激活。在9例ESCC中的7例和10个食道癌细胞系中的2个中也检测到了EPHA7的上调(图3B,上图和下图)。为确定内源性EPHA7在癌细胞中的亚细胞定位,利用抗-EPHA7多克隆抗体进行了免疫细胞化学分析;当利用针对EPHA7的胞外部分的抗体时,人EPHA7的N末端部分定位在源自肺癌的SBC-3细胞的胞质膜和细胞质中(图3F,上图)。另一方面,当利用针对EPHA7的胞内部分的抗体时,还在SBC-3细胞的细胞核和细胞质检测到了人EPHA7的C末端部分(图3F,下图)。由于EPHA7是I型膜蛋白,本发明人假设EPHA7蛋白的N末端区被剪切并分泌至细胞外空间,这与其他受体酪氨酸激酶蛋白(包括ERBB家族)类似(McKay MM & Morrison DK.Oncogene.2007 May 14;26(22):3113-21;Reinmuth N,et al.,Int J Cancer.2006Aug 15;119(4):727-34;Lemmon MA.Breast Dis.2003;18:33-43)。因此,本发明人利用特异针对人EPHA7N末端部分(EPHA7的胞外部分)(批号sc25459,Santa Cruz,Santa Cruz,CA)的兔多克隆抗体,应用ELISA方法,考察了其在肺癌细胞系培养基中的存在。在SBC-3、DMS114和NCI-H1373培养物的培养基中检测到了高水平EPHA7蛋白,但在PC-14、NCI-H226和A549细胞的培养基中未检测到(图3G)。在培养基中可检测EPHA7的量与用半定量RT-PCR和免疫细胞化学检测到的EPHA7表达水平相当一致。
利用EPHA7cDNA作为探针的Northern印迹分析,在27个成人和人胎儿组织之中,仅在胎儿脑和胎儿肾中鉴定了极低水平的6.8-kb转录物(图3C)。进一步利用相同探针进行northern印迹,仅在肺癌细胞系SBC-3中检测到了EPHA7转录物,且比胎儿脑和胎儿肾中量大很多(图3D)。此外,我们通过免疫组织化学利用抗-EPHA7多克隆抗体,比较了在4个正常组织(心、肺、肝、肾和睾丸)中与在肺癌中的EPHA7蛋白表达。EPHA7主要在肺癌细胞的细胞质和/或胞质膜大量表达,但其表达在其余4种正常组织中几乎检测不到(图3E)。
(2)EPHA7过表达与预后不良之间的联系
本发明人利用从402例NSCLC和27例SCLC制备的组织微阵列,用抗-EPHA7多克隆抗体进行了免疫组织化学分析。在74.6%NSCLC(300/402)和85.2%SCLC(23/27)中观察到了EPHA7的阳性染色,而在所考察的任何正常肺组织中没有观察到染色(图4A,左图)。在这些EPHA7阳性NSCLC病例中,189例为ADCs(253例的74.7%);78例为SCCs(109例的71.6%);23例为LCCs(27例的85.2%);10例为腺鳞细胞癌(ASC;13例的76.9%)。
将EPHA7在组织芯片上的表达图式分类,范围从无(记为0)至弱/强阳性(记为1+~2+)。在402例NSCLC中,EPHA7在190例中强染色(47.3%,记分2+),在110例中弱染色(27.3%;记分1+),在102例中未染色(25.4%;记分0)(细节显示在表3A中)。接着本发明人设法使该蛋白在行根治性手术的NSCLCs中的表达与各种临床病理学变量相关联。用相同方法处理的SCLCs的样本大小过小,以至于不能进一步评估。统计分析显示,肿瘤大小(在pT1-4中更高;利用Fisher确切检验P=0.0256)与EPHA7强阳性明显相关(细节显示在表3A中)。其肿瘤显示EPHA7强表达的NSCLC患者与无/弱EPHA7表达的患者相比较,显示出肿瘤特异性存活期更短(利用时序检验(Log-rank test)P=0.006;图2B)。
通过单变量分析,年龄(≥65对<65),性别(男性对女性),pT期(T2+T3对T1),pN期(N1,N2对N0),非ADC组织学(非ADC对ADC)以及EPHA7强表达与NSCLC患者中肿瘤特异性存活不良显著相关(表3B)。此外,利用Cox比例风险模型(Cox proportional-hazard model)的多变量分析表明,老年人、更大的肿瘤尺寸、淋巴结转移和EPHA7强染色对于NSCLC是独立的预后因素(表3B)。
通过对292例ESCCs的免疫组织化学分析,在88.3%的ESCCs中(258/292)观察到了EPHA7的正染色,而在所考察的任何正常食道组织中没有观察到染色(图4A,右图)。在所考察的292例ESCC中,EPHA7在153例中强染色(52.4%;记分2+),在105例中弱染色(36.0%;记分1+),在34例中未染色(11.6%;记分0)(细节显示在表4A中)。统计分析显示,肿瘤大小(在pT2-4中更高;利用Fisher确切检验P<0.0001)和淋巴结转移(在pN1-2中更高;利用Fisher确切检验P=0.0006)与EPHA7强阳性明显相关(表4A)。
与EPHA7-弱阳性/阴性肿瘤的患者相比,EPHA7-强阳性的ESCCs的患者中平均存活时间明显更短(利用时序检验P=0.0263;图4C)。用单变量分析评估ESCC患者预后与多种因素之间的联系,性别(男性对女性),pT期(T2+T3对T1),pN期(N1,N2对N0)和EPHA7状态(记分2+对0,1+)与预后不良明显相关。在多变量分析中,EPHA7状态未达到作为针对入选本研究的手术治疗的ESCC患者的独立预后因素所需的统计学显著水平(P=0.5586),而pT期和pN期以及性别能达到统计学显著的水平,证明食道癌中EPHA7表达与这些临床病理学因素的关联(表4B)。
表3A NSCLC组织中EPHA7-强阳性与患者特征之间的关联(n=402)
ADC,腺癌
非ADC,鳞状细胞癌加大细胞癌和腺鳞细胞癌
NS,非显著性
*P<0.05(Fisher确切检验)
**ADC对其他组织学
表3B.NSCLC患者中预后因素的Cox比例风险模型分析
Figure GPA00001115063301532
Figure GPA00001115063301541
ADC,腺癌
非ADC,鳞状细胞癌加大细胞癌和腺鳞细胞癌
NS,非显著性
*P<0.05
表4A ESCC组织中EPHA7-强阳性与患者特征之间的关联(n=402)
Figure GPA00001115063301542
ESCC,食管鳞状细胞癌
NS,无显著性
*P<0.05(Fisher确切检验)
表4B ESCC患者中预后因素的Cox比例风险模型分析
ESCC,食道鳞状细胞癌
NS,非显著性
*P<0.05
(3)肺癌和食道癌患者中EPHA7的血清水平
由于体外测定证明了肺癌细胞中EPHA7蛋白的N末端区被剪切并分泌至细胞外空间,所以本发明人研究了EPHA7是否分泌到肺癌或食道癌患者的血清中。ELISA实验检测了来自患有肺癌或食道癌的439例患者中大多数的血清样本中的EPHA7蛋白。343例肺癌患者中血清EPHA7的均值(+/-1SD)为4.33+/-3.73U/ml,96例ESCC中血清EPHA7的均值(+/-1SD)为10.74+/-8.12U/ml。相比之下,127例健康个体中EPHA7血清水平的均值(+/-1SD)为1.69+/-0.80U/ml。差异具有显著性,P值<0.001(Mann-WhitneyU检验)。
根据肺癌的组织学类型,EPHA7的血清水平在205例ADC患者中为4.40+/-3.54U/ml,在59例SCC患者中为3.41+/-2.35U/ml,在79例SCLC患者中为4.85+/-4.83U/ml(图5A);3种组织学类型之间的差异是非显著性的。甚至在早期肿瘤患者中也检测到了高水平血清EPHA7(数据未显示)。利用以这439例癌症(NSCLC+SCLC+ESCC)患者和127例健康对照的数据绘制的接受者操作特性(ROC)曲线(图5B,左图),设定了该试验的可提供对于EPHA7的最佳诊断准确性和似然比的截断值(cut-off level),即2.83U/ml(灵敏度60.4%(265/439),特异性95.3%(121/127))。根据肿瘤组织学,血清EPHA7阳性病例的比例为:ADC为58.5%(205例中的120例),SCC为49.2%(59例中的29例),SCLC为44.3%(79例中的35例),ESCC为84.4%(96例中的81例)。
接着本发明人利用来自肺癌患者的成对的术前和术后(手术后2个月)血清样本进行了ELISA实验,以监测相同患者中血清EPHA7的水平。手术切除原发肿瘤后,血清EPHA7的浓度显著降低(图5B,右图)。该结果独立地证明血清EPHA7作为生物标记用于检测早期癌症和监测疾病的复发的高特异性及用处。
为评价血清EPHA7水平作为肿瘤检测生物标记的临床有效性,本发明人还通过ELISA测定了在来自癌症患者和对照个体的同一组血清样本中,两种常规肿瘤标志物(针对NSCLC患者的CEA和针对SCLC患者的ProGRP)的血清水平。ROC分析确定了对于NSCLC检测,CEA的截断值为2.5ng/ml(灵敏度37.9%(88/232),特异性89.8%(114/127);图5C,上图)。血清EPHA7与CEA值之间的相关系数是非显著性的(Spearman秩相关系数(Spearman rank correlation coefficient):(rho)=-0.172,P=0.009),说明同时检测血清中这两种标志物可使NSCLC检测的总体灵敏度提高到76.7%(232例中的178例)(对于诊断NSCLC,单独CEA的灵敏度为37.9%(232例中的88例),EPHA7的灵敏度为55.2%(232例中的128例))。健康人受试者(对照组)中两种肿瘤标志物假阳性率各为7.1%(127例中的9例),而在相同对照组中CEA和EPHA7各自的假阳性率分别为2.4%(127例中的3例)和4.7%(127例中的6例)。
对SCLC患者的ROC分析确定了ProGRP的截断值为46.0pg/ml,敏感度64.8%(71例中的46例),特异性97.6%(123例中的120例)(图5C,下图)。血清EPHA7与ProGRP值之间的相关系数是非显著性的(Spearman秩相关系数:(rho)=0.143,P=0.2325),也说明了同时检测这两种标志物的血清水平可使SCLC检测的总体灵敏度提高到77.5%(71例中的55例);对于诊断SCLC,单独ProGRP的灵敏度为64.8%(71例中的46例),EPHA7的灵敏度为45.1%(71例中的32例)。健康人受试者(对照组)中两种肿瘤标志物的假阳性率各为7.3%(123例中的9例),但在相同对照组中对于ProGRP和EPHA7的假阳性率分别为2.4%(123例中的3例)和4.9%(123例中的6例)。
(4)哺乳动物细胞中EPHA7的细胞生长和侵袭作用
利用针对EPHA7的小干扰RNA抑制肺癌细胞的生长。为评估EPHA7对肺癌细胞的生长或存活是否是必要的,本发明人构建了针对EPHA7的siRNAs(si-EPHA7s)以及对照质粒(针对LUC/萤光素酶和乱序/SCR的siRNA),并将它们转染至NCI-H520和SBC-5细胞。与用任一个对照siRNA转染的细胞相比较,用si-EPHA7-#2转染的细胞中mRNA水平显著降低。我们观察到了形成的集落数目以及利用MTT试验测定的活细胞的数目均显著减少(图6A,右图和左图)。si-EPHA7-#1的转染引起集落数目和细胞活力轻微下降,以及EPHA7表达微弱降低。
为确定EPHA7对哺乳动物细胞生长和转化的作用,我们利用瞬时表达EPHA7的COS-7细胞(COS-7-EPHA7)进行了体外试验。与空白载体相比较,COS-7-EPHA7细胞的生长得到了促进,如MTT测定所示(图7B)。
由于组织微阵列上免疫组织化学和统计分析已经显示了EPHA7阳性与癌症特异性存活期更短明显相关,所以我们进行了基质胶侵袭试验,以确定EPHA7是否对于细胞侵袭能力有影响。与用模拟质粒转染的对照细胞相比较,COS-7-EPHA7细胞或NIH3T3-EPHA7细胞侵袭穿过基质胶显著增强,因此独立地证明了EPHA7还对肺癌细胞的高度恶性表型有贡献(图7C)。
(5)鉴定EGFR、p44/42MAPK和CDC25为EPHA7的下游靶标
为了说明EPHA7激酶在癌发生中的作用,本发明人尝试了鉴定将通过EPHA7信号被磷酸化并激活细胞增殖信号的底物和/或下游靶蛋白。本发明人利用以EPHA7-表达载体转染的COS-7细胞的裂解物和特异针对与癌-细胞信号有关的磷酸化-蛋白的一系列抗体,进行了EPHA7的激酶底物的免疫印迹筛选(见表2)。本发明人筛选了总共28种磷酸化蛋白,发现与以模拟载体转染的细胞相比较,在以EPHA7-表达载体转染的细胞中,EGFR的Tyr-845,LCgamma的Tyr-783以及CDC25的Ser-216被显著地磷酸化(图8A)。本发明人通过免疫沉淀实验,证实了内源性EGFR和外源性EPHA7之间的关连相互作用(图7B)。
(6)鉴定EGFR和MET为EPHA7的新型底物
为了说明EPHA7在癌发生中的作用,我们尝试了鉴定EPHA7激酶的底物蛋白,所述底物蛋白将被EPHA7直接磷酸化并激活细胞增殖和/或存活信号。我们利用表达外源EPHA7的COS-7细胞的免疫沉淀物进行了MALDI-TOF MS分析,鉴定出MET原癌基因前体为候选的EPHA7-相互作用蛋白。我们利用外源表达MET和EPHA7的COS-7的提取物,通过免疫沉淀验证了这种相互作用(图20A和20B)。EPHA7和MET都是受体酪氨酸激酶蛋白的成员,最近的报道显示,在癌细胞中数个受体酪氨酸激酶被活化,它们可能对激活下游信号转导发挥互补作用(Reinmuth N et al.Int JCancer.2006 Aug 15;119(4):727-34.)。实际上,利用以EPHA7-表达载体转染的COS-7细胞的裂解物和特异针对与癌-细胞信号有关的磷酸化-蛋白的一系列抗体进行的EPHA7的激酶底物的免疫印迹筛选,鉴定了EGFR和MET为被EPHA7过表达磷酸化的蛋白质(见下文)。根据这个发现,我们利用外源表达EGFR和EPHA7的COS-7的提取物进行了免疫沉淀,证实了EPHA7可与EGFR结合(图20C和20D)。为评估癌细胞中EPHA7与EGFR和/或MET协作活化的可能性,我们利用western印迹考察了它们在肺癌细胞中的表达(图20E)。某一肺癌细胞群体表达EPHA7和MET二者或EPHA7和EGFR二者,说明肺癌细胞中可能存在这些异二聚体复合物。
为了评估EPHA7与EGFR/MET之间的激酶-底物反应,我们利用胞质EPHA7、MET、EGFR的活性重组蛋白质,并利用3种覆盖了胞质EGFR的非活性部分蛋白,进行了体外激酶测定(图21A)。与预料的一样,我们发现在EGFR激酶抑制剂存在下(其已降低了EGFR的自身磷酸化),EPHA7可直接磷酸化EGFR(图6B和6C)。另外的利用3种部分胞质EGFR作为底物的体外激酶测定显示,胞质EGFR上磷酸化的酪氨酸残基可能存在于COOH-末端部分中(密码子1046-1186;图21B和21C)。该区域中包含数个磷酸化的酪氨酸残基,其中一些例如Tyr1068和Tyr1173在激活下游信号中有重要作用。我们还利用EPHA7和MET进行了体外激酶测定,发现EPHA7可直接磷酸化MET(图21D)。有趣的是,通过加入ATP至EPHA7,我们可观察到EPHA7自身磷酸化,但当在MET激酶抑制剂存在下共温育MET时,EPHA7磷酸化的水平显著提高,说明EPHA7可能通过与MET相互作用而被激活(图21D)。接着我们筛选了哺乳动物细胞中EGFR/MET上EPHA7-依赖性磷酸化位点。在该筛选中,我们考察了当前可得到的所有针对磷酸化-EGFR和磷酸化-MET的抗体,它们识别EGFR的胞浆区内各种磷酸化-残基(Tyr-992、Tyr-1045、Tyr-1068、Tyr-1086、Tyr-1148和Tyr-1173以及磷酸化-Ser-1046/1047)和MET的胞浆区内各个磷酸化残基(Tyr-1230/1234/1235、Tyr-1313、Tyr-1349和Tyr-1365),然而我们发现了EGFR的Tyr-1068、Tyr-1086和Tyr-1173以及MET的Tyr-1230/1234/1235、Tyr-1313、Tyr-1349、Tyr-1365的磷酸化增加(图21E)。未观察到其他Tyr-残基的磷酸化水平显著增加(数据未显示)。数据有力地暗示,在哺乳动物细胞中表达的EPHA7可磷酸化内源性EGFR/MET。
(7)EPHA7对致癌的下游信号传导的增强作用
由于有证据表明EGFR/MET对细胞增殖、存活或者癌细胞的活力发挥关键作用,所以接着我们致力于EGFR/MET活性被EPHA7增强引起EGFR/MET下游信号活化的可能性。我们利用以EPHA7-表达载体转染的COS-7细胞的裂解物和特异针对致癌性磷酸化-蛋白(包括与EGFR/MET的磷酸化位点相关的蛋白质)(MAPK,AKT,STAT1、3、5和Shc;也可参见表2)的一系列抗体,进行了免疫印迹分析。在这些蛋白质中,我们发现了与模拟转染的COS-7相比,用EPHA7表达载体转染的COS-7细胞中,Shc(GenBank登录号:NM_001014431),STAT3(GenBank登录号:NM_139276),MAPK和AKT的磷酸化增加(图22)。我们检测到在STAT1和-5中无显著的磷酸化增加(数据未显示)。数据明确地显示了,在哺乳动物细胞中表达的EPHA7可增强EGFR/MET的特异性下游通路,所述通路对于癌细胞生长、存活和/或侵袭是重要的。
(6)讨论
在过去十年里,尽管在治疗性药物和放射线疗法以及肿瘤成像方面每日都有进展,但在肺癌患者的预后和生活质量方面几乎未得到改善。有效用于肺癌的诊断策略和工具例如肿瘤生物标记仍然是全世界都期望的,因为在肺癌治疗中早期检测肿瘤是最有效的需求之一。目前只有少数检测癌症特异性跨膜/分泌蛋白的肿瘤特异性生物标记(例如CYFRA或Pro-GRP)可使用(Pujol JL,et al.,Cancer Res.1993 Jan 1;53(1):61-6;Miyake Y,et al.,Cancer Res.1994 Apr 15;54(8):2136-40)。肿瘤特异性跨膜/分泌蛋白可用作分子靶标,因为它们或者存在于细胞表面或者存在于细胞外隙,这使得它们很容易作为分子治疗靶标得到。利妥昔单抗(Rituxan)是一种针对CD20-阳性淋巴瘤的人源化单克隆抗体,其提供了靶向特定细胞表面蛋白质可产生显著的临床益处的证据(Hennessy BT,et al.,Lancet Oncol.2004Jun;5(6):341-53)。因此,我们利用全基因组cDNA微阵列分析的能力,选择所述编码在癌细胞中过表达的肿瘤特异性跨膜/分泌蛋白的基因,鉴定出EPHA7为用于开发肺癌诊断和治疗的有效工具的靶标。
在人基因组中发现的所有受体酪氨酸激酶(RTKs)中,有13个成员的Eph-受体家族构成最大的家族。根据序列相似性和配体亲和性将EPH受体分成A-亚类(其包含8个成员(EPHA1-EPHA8))和B-亚类(其在哺乳动物中包含5个成员(EPHB1-EPHB4,EPHB6))。将它们的配体,肝配蛋白(ephrins),分成两个亚类,即A-亚类(其通过糖基磷脂酰肌醇(GPI)ANCHOR限制在细胞膜)(肝配蛋白A1-肝配蛋白A5),以及B-亚类(其中成员有跨膜区,跨膜区后为短的胞质区)(肝配蛋白B1-肝配蛋白B3)(Kullander K & Klein R.NatRev Mol Cell Biol.2002 Jul;3(7):475-86)。已知数个信号传导途径涉及EPH/肝配蛋白轴,例如在JAK/Stat途径中涉及EPHA4(Lai KO,et al.,J Biol Chem.2004 Apr 2;279(14):13383-92.Epub 2004 Jan 15),EPHB4受体信号通过PI3K途径介导内皮细胞迁移和增殖(Steinle JJ,et al.,J Biol Chem.2002 Nov15;277(46):43830-5.Epub 2002 Sep 13)。此外,EPH/肝配蛋白轴调节Rho信号的活性或Ras家族的小GTP酶的活性(Lawrenson ID,et al.,J Cell Sci.2002Mar 1;115(Pt 5):1059-72;Murai KK & Pasquale EB.J Cell Sci.2003 Jul15;116(Pt 14):2823-32)。
尽管有几篇关于EPH受体家族蛋白在细胞增殖和转化的信号通路中重要性的报道,但报道了EPHA7仅在肢体发育期和在神经系统中表达(Salsi V& Zappavigna V.J Biol Chem.2006 Jan 27;281(4):1992-9.Epub 2005 Nov 28;Rogers JH,et al.,Brain Res Mol Brain Res.1999 Dec 10;74(1-2):225-30;AraujoM & Nieto MA.Mech Dev.1997 Nov;68(1-2):173-7)。
我们用特异性siRNA处理肺癌细胞以降低EPHA7的表达,引起了生长抑制。EPHA7的表达还导致体外试验中细胞生长和侵袭的显著促进。此外,通过我们的组织微阵列实验得到的临床病理学证据说明,与有弱表达或不表达EPHA7的肿瘤的患者相比,有EPHA7强表达的肿瘤的NSCLC患者显示出更短的癌症特异性存活期。通过体外和体内试验获得的结果与以下结论一致,即过表达的EPHA7是重要的生长因子,其与癌细胞生长和侵袭有关,诱导肺癌细胞的高度恶性表型。
此外,本发明人发现EGFR的Tyr-845,PLCgamm的Tyr-783及CDC25的Ser-216为EPHA7激酶的胞内靶分子,众所周知细胞增殖和侵袭中涉及它们的通路。例如,有人报道了在肝细胞癌中,EGFR在酪氨酸845处磷酸化(Kannangai R,et al.,Mod Pathol.2006 Nov;19(11):1456-61.Epub 2006 Aug25)。PLCgamma是PLC同工酶,其介导PDGF-诱导的肌醇磷脂水解,其在Tyr-783的磷酸化对于PLCgamma活化是必要的(Kim HK,et al.,Cell.1991May 3;65(3):435-41)。PLCgamma在酪氨酸783处被PDGF磷酸化除了在有丝分裂发生中之外,还在细胞骨架重组中发挥重要作用(Yu H,et al.,Exp CellRes.1998 Aug 25;243(1):113-22)。CDC25是蛋白磷酸酶,负责cdc2脱去磷酸及激活,这是调节所有真核细胞进入有丝分裂中的一个关键步骤(Jessus C& Ozon R.Prog Cell Cycle Res.1995;1:215-28)。
在体外,p38结合CDC25B磷酸化其丝氨酸309和361,而且结合CDC25C并磷酸化其丝氨酸216;结合至14-3-3蛋白质需要这些残基的磷酸化(Bulavin DV,et al.,Nature.2001 May 3;411(6833):102-7),14-3-3蛋白质的结合及出核转运调节CDC25的细胞内定位(Kumagai A & Dunphy WG.GenesDev.1999 May 1;13(9):1067-72)。
我们找到了有趣的证据证明:EPHA7活化是肿瘤增殖和侵袭中的一个独特的信号传导功能,其作用方式是通过直接与EGFR和/或MET相互作用并使之磷酸化,所述EGFR和/或MET可能增强下游致癌的信号通路,包括MAPK、AKT和STAT3(Blume-Jensen P,et al.Nature 2001;411:355-65.,Birchmeier C,et al.Nat Rev Mol Cell Biol 2003;4:915-25.)。最近的一份报道显示,RTKs可能在癌细胞表面上被协同地激活,从而可能互补激活下游信号例如MAPK和AKT(Stommel JM,et al.Science 2007;318:287-290.),但没有报道描述在EGFR与Eph-RTK之间或者MET与Eph-RTK之间形成可显著增强随后的下游信号的新型RTK异二聚体。EGFR或MET的新的异二聚体活化可能在个体致癌信号中赋予互补作用,并引起癌细胞对EGFR酪氨酸激酶抑制剂(即吉非替尼(gefitinib)和厄洛替尼(erlotinib))或MET抑制剂的天然抗性和/或获得抗性。我们发现,EGFR/MET的C末端部分的酪氨酸残基可直接被EPHA7磷酸化,这可能导致下游信号增强。EGFR Tyr1068和Tyr1086的磷酸化被认为是数个衔接蛋白的停泊位点(Batzer AG,et al.MolCell Biol 1994;14:5192-201.,Rodrigues GA,et al.Mol Cell Biol2000;20:1448-59.)。Grb2、Gab1和p85可结合所述磷酸化残基并激活下游MAPK或AKT信号。磷酸化的Tyr106和Tyr1086可直接和间接激活STAT3信号(Shao H,et al.Cancer Res 2003;63:3923-30.,Xi S,et al.J Biol Chem2003;278:31574-83.)。磷酸化的Tyr1173与Shc(GenBank登录号:NM_001130041)相关,Shc随后引起MAPK信号传导(Batzer AG,et al.MolCell Biol 1994;14:5192-201.)。另一方面,磷酸化的MET Tyr1349与Tyr1356一起被认为是衔接蛋白(例如Grb2和磷脂酰肌醇3-激酶)的停泊位点(Ponzetto C et al.Cell 1994;77:261-71.,Ponzetto C,et al.Mol Cell Biol1993;13:4600-8.,Nguyen L,et al.J Biol Chem 1997;272:20811-9.),而磷酸化-MET-Tyr1313和磷酸化-MET-Tyr1365在癌发生中的作用尚未阐明。虽然哪些RTKs对下游信号是重要的可能在癌细胞中有变化,而且怎样确定所述“主要的RTKs(dominant RTKs)”尚不清楚,但是可能会有某一肺癌和食道癌细胞群体,在其中EPHA7在癌症增殖、存活和侵袭中发挥关键作用。我们的数据强烈地暗示,EPHA7可能对EGFR/MET信号上调的癌细胞中的癌基因依赖(oncogenic addiction)有贡献,而且调节EPHA7活性可能是用于治疗癌症患者的有希望的治疗策略。
在来自肺癌和ESCC患者的血清学样本中也发现了高水平EPHA7蛋白。为考察应用EPHA7作为诊断工具的可行性,我们EPHA7的血清水平与CEA或ProGRP的血清水平(CEA和ProGRP是用于NSCLCs和SCLCs的两种常规诊断标志物),就其用于诊断的灵敏度与特异性进行了比较。对于肺癌(NSCLC以及SCLC),联合两种标志物(EPHA7+CEA或EPHA7+ProGRP)的试验增加灵敏度至超过75%,显著高于CEA或ProGRP单独的灵敏度,而大约7%的健康志愿受试者被错误地诊断成阳性。我们在此提供的数据充分地证明了EPHA7作为肺癌和食道癌的血清学标志物的临床有效性。
综上所述,EPHA7的活化对于肺癌和食道癌细胞的生长和/或恶性表型具有功能性作用。血清EPHA7与其他肿瘤标志物联合显著提高肺癌诊断的灵敏度。设计特异靶向EPHA7信号传导的新型抗癌药是治疗癌症患者的有希望的治疗和诊断策略。
[实施例4]STK31
(1)STK31在肺肿瘤和食道肿瘤及正常组织中的表达
为鉴定可根据癌细胞的生物学特性应用于治疗的分子,本发明人利用cDNA微阵列进行了肺癌ESCC的表达谱分析。在筛选的27,648个基因中,我们鉴定了STK31在所考察的一大部分肺癌和食道癌样本中过表达。本发明人利用半定量RT-PCR实验,在15个肺癌组织的8个,23个肺癌细胞系的11个(图9A),10个ESCC组织的4个及10个ESCC细胞系(图9B)中的7个中,证实了STK31的过表达。为确定内源性STK31蛋白在癌细胞中的亚细胞定位,我们利用抗-STK31抗体和NCI-H2170细胞进行了免疫荧光分析,发现STK31定位于肿瘤细胞的细胞质和细胞核(图9C)。
利用STK31cDNA片段作为探针的Northern印迹分析,在所考察的23个人类组织中仅在睾丸中鉴定出3.6-kb的转录物(图9D)。此外,我们利用抗-STK31多克隆抗体,通过免疫组织化学,比较了在5种正常组织(心、肝、肾、肺和睾丸)与在肺癌中的STK31蛋白表达。STK31在睾丸(在细胞的细胞质和/或细胞核)和肺癌中表达,但其表达在其余4种正常组织中几乎检测不到(图10A)。
(2)STK31表达与预后不良之间的联系
为了研究STK31在肺癌发生中的生物学和临床病理学意义,本发明人在包含来自368例行根治性手术切除的NSCLC的组织切片的组织微阵列上进行了免疫组织化学染色。用特异针对STK31的多克隆抗体观察到STK31染色主要在肿瘤细胞的细胞核和细胞质,但在正常细胞中未检测到(图10B)。在368例NSCLCs中,STK31在235例(63.9%)中正染色(记为1+),在133例(36.1%)中未染色(记为0)。接着本发明人考察了STK31表达(阳性对阴性)与各临床病理学参数的联系,发现其与组织学类型(在非ADC中更高;利用Fisher确切检验P=0.0033)和吸烟史(在吸烟者中更高,利用Fisher确切检验P=0.0446)显著相关(图5A)。与STK31的表达一致,NSCLC患者的平均存活时间明显更短(P=0.0178,时序检验;图10C)。本发明人还应用了单变量分析,以评估患者预后与其他因素之间的关联,包括年龄(<65对65≥),性别(女性对男性),病理学肿瘤分期(肿瘤大小;T1+T2对T3+T4),病理学淋巴结分期(淋巴结状态;N0+N1对N2),组织学类型(ADC对非ADC),以及吸烟史(从不吸烟者对吸烟者)。在那些参数中,STK31状态(P=0.0178),男性(P=0.0005),晚期pT期(P=0.0005),晚期pN期(P<0.0001),非ADC组织学类别(P=0.0115),和吸烟史(P=0.0297)与预后不良显著相关(表5B)。在预后因素的多变量分析中,STK31状态未达到作为入选本研究的手术治疗的NSCLC患者的独立预后因素的统计学显著水平(P=0.0829),而pT期和pN期以及性别能达到统计学显著的水平(分别为P=0.0017,<0.0090,和<0.0001),这证明了肺癌中STK31表达与这些临床病理学因素的关联(图5B)。
表5A NSCLC组织中STK31-阳性与患者特征之间的关联(n=368)
Figure GPA00001115063301641
ADC,腺癌
非ADC,鳞状细胞癌加大细胞癌和腺鳞细胞癌
NS,非显著性
*P<0.05(Fisher确切检验)
表5B NSCLC患者中预后因素的Cox比例风险模型分析
Figure GPA00001115063301651
ADC,腺癌
非ADC,鳞状细胞癌加大细胞癌和腺鳞细胞癌
NS,非显著性
*P<0.05
(3)STK31的生长促进作用
为评估STK31对肺癌细胞的生长或存活是否是必要的,我们构建了表达针对STK31的siRNA的质粒(si-STK31-#1和si-STK31-#2)。将它们中任一个的siRNAs或者针对EGFP和萤光素酶的siRNAs作为对照转染至LC319和NCI-H2170细胞(LC319的代表性数据显示在图11A-C中)。当我们使用si-STK31-#1和si-STK31-#2构建体时,通过RT-PCR证实了敲低作用(图11A)。利用LC319的MTT测定和集落形成测定揭示了用si-STK31-#1和si-STK31-#2转染的细胞数目显著减少(图11B和11C;P<0.001)。接着本发明人考察了STK31在促进细胞生长中的作用。本发明人制备了设计成表达STK31的质粒(pCAGGSn-STK31-3xFlag)并将它们转染至COS-7细胞中。如图11D所示,与模拟载体相比较,STK31cDNA转染至COS-7细胞显著地增加了COS-7细胞的生长。
(4)STK31重组蛋白的激酶活性
为考察STK31的激酶活性,本发明人利用重组STK31蛋白和MBP(作为通用底物)进行了体外激酶测定,检测到了15kDa的磷酸化MBP蛋白,说明STK31蛋白似乎具有激酶活性(图12A)。
(5)鉴定EGFR(Ser1046/1047)和p44/42MAPK(Thr202/Tyr204)为STK31的下游靶标
为了说明STK31激酶在癌发生中的作用,本发明人尝试了鉴定将通过STK31信号被磷酸化并激活细胞增殖信号的底物和/或下游靶蛋白。本发明人利用以STK31-表达载体转染的COS-7细胞的裂解物和特异针对与癌细胞信号传导有关的磷酸化-蛋白的一系列抗体,进行了STK31的激酶底物的免疫印迹筛选(见表2)。本发明人筛选了总共26种磷酸化蛋白,发现与以模拟载体转染的细胞相比较,在以STK31-表达载体转染的细胞中EGFR的Ser1046/1047和ERK的Thr202/Tyr204(p44/42MAPK)被显著地磷酸化(图12B)。接着我们通过温育重组STK31与从COS-7细胞制备的全提取物,进行了体外激酶测定。利用针对ERK的磷酸化-特异性抗体(P44/42MAPK)(Thr202/Tyr204)的Western印迹分析发现,重组STK31以剂量依赖性方式,特异性诱导了ERK(P44/42MAPK)在Thr202/Tyr204处的磷酸化(图12C)。
(6)MAPK通路中涉及STK31
为确定ERK(ERK1/2)(Thr202/Tyr204)被STK31磷酸化的机制,尝试了考察ERK的上游通路在以STK31-表达载体转染的细胞中的活化。STK31的表达增加了COS-7细胞和SBC-5细胞中MEK(MEK1/2)的磷酸化(图12D)。另外,与STK31表达受siRNA抑制一致,SBC-5细胞中ERK1/2和MEK的磷酸化都降低(图12E)。此外,我们利用来自以STK31-表达载体转染的COS-7细胞的裂解物,通过免疫沉淀,证实了外源性STK31可与内源性c-raf、MEK和ERK1/2结合,说明MAPK信号可能被STK31过表达活化。
(7)讨论
尽管有现代手术技术和辅助化学疗法,但肺癌和ESCC被认为在恶性肿瘤中显示出最差的预后。最近已通过鉴定在癌细胞中特异性表达的分子,开发了用于癌症治疗的分子靶向药物。但对当前可用的治疗应答良好的患者比例仍然非常有限。因此,迫切需要开发有效的、不良反应风险极低的治疗性抗癌药物。针对这一目标,我们利用包含27,648个基因的cDNA微阵列,通过激光显微解剖,在癌细胞富集之后进行了101例肺癌和19例ESCC细胞的全基因组表达谱分析(Kikuchi T,et al.,Oncogene.2003 Apr10;22(14):2192-205;Kakiuchi S,et al.,Mol Cancer Res.2003 May;1(7):485-99;Kikuchi T,et al.,Int J Oncol.2006 Apr;28(4):799-805;Taniwaki M,et al.,Int JOncol.2006 Sep;29(3):567-75;Yamabuki T,et al.,Int J Oncol.2006Jun;28(6):1375-84)。本发明人通过该分析,鉴定了数个在癌症样本中显著上调而在正常组织中几乎不表达的候选分子靶基因。本发明人利用siRNA技术和包含数百个保存的NSCLC组织样本的组织微阵列,验证了靶基因对于肺癌细胞的存活/生长以及肿瘤进展是否是必要的(Suzuki C,et al.,CancerRes.2003 Nov 1;63(21):7038-41;Cancer Res.2005 Dec 15;65(24):11314-25;Mol Cancer Ther.2007 Feb;6(2):542-51;Ishikawa N,et al.,Clin Cancer Res.2004 Dec 15;10(24):8363-70;Cancer Res.2005 Oct 15;65(20):9176-84;CancerSci.2006 Aug;97(8):737-45;Kato T,et al.,Cancer Res.2005 Jul1;65(13):5638-46;Clin Cancer Res.2007 Jan 15;13(2 Pt 1):434-42;Furukawa C,et al.,Cancer Res.2005 Aug 15;65(16):7102-10;Takahashi K,et al.,Cancer Res.2006 Oct 1;66(19):9408-19;Hayama S,et al.,Cancer Res.2006 Nov1;66(21):10339-48;Cancer Res.2007 May 1;67(9):4113-22;Yamabuki T,et al.,Cancer Res.2007 Mar 15;67(6):2517-25)。利用这种系统研究法,我们鉴定出STK31在大多数临床肺癌和ESCC样本中是过表达的,该分子对于癌细胞生长和进展是必要的。
在对在小鼠精原细胞中表达但在体细胞组织中不表达的基因的系统化研究中,Wang等(Wang PJ,et al.,Nat Genet.2001 Apr;27(4):422-6)鉴定了25个基因(其中19个是以前未知的)仅在男性生殖细胞中表达;这些基因中有一个是STK31。STK31编码115-kDa的蛋白质,其N末端包含Tudor域(已知其与RNA结合有关),C末端包含Ser/Thr-激酶蛋白激酶区,但其生理功能尚不清楚。利用Kinome的系统树(万维网站点cellsignal.com/reference/kinase/kinome.jsp),将STK31分类为非常独特的类别。PKR被认为是STK31的结构同系物。PKR蛋白激酶N末端区还与双链RNA结合,且有C末端Ser/Thr-激酶域。
当与激活性RNA和ATP结合时,PKR经自身磷酸化反应,并磷酸化真核起始因子2的α亚基(elF2α),抑制elF2复合物的功能和翻译的连续起始(Manche L,et al.,Mol Cell Biol.1992 Nov;12(11):5238-48;Jammi NV &Beal PA.Nucleic Acids Res.2001 Jul 15;29(14):3020-9;Kwon HC,et al.,Jpn JClin Oncol.2005 Sep;35(9):545-50.Epub 2005 Sep 7)。最近,数个丝氨酸苏氨酸激酶被认为是良好的癌症治疗靶标。蛋白激酶Cβ(PKCβ)属于丝氨酸苏氨酸激酶的成员,人们发现了其在致死性/顽固弥散性的B细胞淋巴瘤(DLBCL)中过表达,而且是抗肿瘤治疗的靶标(Goekjian PG & Jirousek MR.Expert Opin Investig Drugs.2001 Dec;10(12):2117-40)。
用PKCβ的抑制剂enzastaurin在有复发或顽固性DLBCL的患者中进行了II期研究(Goekjian PG & Jirousek MR.Expert Opin Investig Drugs.2001Dec;10(12):2117-40)。在该研究中,发现了STK31在肺癌和食道癌中过表达,但在除睾丸外的正常组织中检测不到。
本发明人还证明了STK31对哺乳动物细胞有生长促进作用,还具有蛋白激酶活性,说明STK31可用作治疗靶标。有趣的是,将STK31引入哺乳动物细胞促进了EGFR(Ser1046/1047),ERK(p44/42MAPK)(Thr202/Tyr204)和MEK(S217/221)的磷酸化,STK31可与c-raf、MEK1/2和ERK1/2相互作用。数据显示这些分子是STK31的下游靶标。已经显示了EGFR的Ser1046/1047被Ca2+/钙调蛋白依赖性激酶II(CaM激酶II)磷酸化,其磷酸化减弱了EGFR激酶活性(Robertson MJ,et al.,J Clin Oncol.2007 May1;25(13):1741-6.Epub 2007 Mar 26;Feinmesser RL,et al.,J Biol Chem.1999Jun 4;274(23):16168-73;Countaway JL,et al.,J Biol Chem.1992 Jan15;267(2):1129-40)。还有人报道CaM激酶II引起了调节细胞生长和分化的ERK(P44/42MAPK)活化(Ginnan R & Singer HA.Am J Physiol Cell Physiol.2002 Apr;282(4):C754-61)。本发明的这些结果还导致了一个假设,即STK31是一种作为MAPK级联的正调节物的支架蛋白。支架蛋白们提供一种对激酶信号级联放大中特异性起贡献的机制。这些蛋白质通过物理结合和使信号通路中上游和下游元件集合在一起,从而确保信号的有效且特异的转导。RAS1的激酶抑制剂(KSR1)具有推定的激酶样区域,但据报道KSR1无酶活性,充当MAPK级联的真正激酶组分的停泊平台(Erzsebet Szatmari et al.J.Neurosci.2007 27:11389-11400,Jürgen Müller et al.Molecular Cell2001;8:983-993.,M Therrien,et al.Genes Dev.1996 10:2684-2695.,ScottStewart,et al.Mol.Cell.Biol.1999 19:5523-5534.)。
总之,鉴定了癌症-睾丸抗原STK31在大多数肺癌和食道癌组织中过表达,其功能作用与癌细胞的生长和/或存活有关。STK31能用作肺癌的预后生物标记,并作为开发抗癌剂和癌症疫苗的治疗靶标。
[实施例5]WDHD1
(1)WDHD1在肺癌和食道癌及正常组织中的表达
为鉴定用于早期检测癌症存在的分子和开发基于癌症细胞的生物学特性的治疗,本发明人利用cDNA微阵列进行了肺癌和ESCC的全基因组表达谱分析(Kikuchi T,et al.,Oncogene.2003 Apr 10;22(14):2192-205;Int JOncol.2006 Apr;28(4):799-805;Kakiuchi S,et al.,Mol Cancer Res.2003May;1(7):485-99;Hum Mol Genet.2004 Dec 15;13(24):3029-43.Epub 2004Oct 20;Taniwaki M,et al.,Int J Oncol.2006 Sep;29(3):567-75;Yamabuki T,etal.,Int J Oncol.2006 Jun;28(6):1375-84)。
在筛选的27,648个基因中,本发明人鉴定了WDHD1转录物在所考察的大多数肺癌和食道癌样本的癌症细胞中表达提高(3倍或更高)。本发明人利用半定量RT-PCR实验,在15个肺癌组织的14个,24个肺癌细胞系的20个,10个ESCC组织的6个和10个ESCC细胞系的6个中,证实了WDHD1的过表达(图13A和13B)。本发明人接着利用-WDHD1抗体,通过Western印迹分析,证实了126-kDa WDHD1蛋白在肺癌细胞系和食道癌细胞系中过表达(图13C)。为考察内源性WDHD1在NSCLC细胞中的亚细胞定位,本发明人利用抗-WDHD1抗体和LC319细胞进行了免疫荧光分析。在整个细胞周期中WDHD1大量定位在细胞核,少量定位在细胞质,分裂期在染色体上检测到WDHD1(图13D)。
利用WDHD1 cDNA片段作为探针的Northern印迹分析仅在睾丸中鉴定了约5kb的转录物(图14A)。此外,本发明人利用抗-WDHD1多克隆抗体,通过免疫组织化学,比较了在5个正常组织(肝、心、肾、肺和睾丸)与在肺癌中的WDHD1蛋白表达。WDHD1在睾丸(主要在初级精母细胞的细胞核和/或细胞质中)和肺癌中大量表达,但其表达在其余4种正常组织中几乎检测不到(图14B)。
(2)WDHD1表达与不良预后之间的联系
为了研究WDHD1在肺和食道癌发生中的生物学和临床病理学意义,本发明人在包含来自行根治性手术切除的264例NSCLC和297例ESCC的组织切片的组织微阵列上,进行了免疫组织化学染色。用特异针对WDHD1的多克隆抗体的WDHD1染色主要在肿瘤细胞的细胞核和细胞质观察到,但在正常细胞中未检测到(图14C,左图)。在264例NSCLCs中,WDHD1在134例(50.8%)中强染色,在130例(49.2%)中未染色(细节在表6A中显示)。接着本发明人考察了WDHD1表达与临床结果的联系。与WDHD1的表达水平更高一致,NSCLC患者的平均存活时间明显更短(利用时序检验P=0.0208;图2C,右图)。本发明人还应用单变量分析,评估了患者预后与数个因素之间的联系,所述因素包括年龄,性别,pT期(肿瘤大小;T1对T2+T3+T4),pN期(淋巴结状态;N0对N1+N2),组织学类型(非ADC对ADC),以及WDHD1状态(阳性对阴性)。所有那些参数都与预后不良明显相关(表6B)。在多变量分析中,WDHD1状态不能够达到对于入选本研究的手术治疗的肺癌患者为独立预后因素的统计学显著水平(P=0.8668),证明肺癌中WDHD1表达与这些临床病理学因素有关联(表6B)。
在所考察的297例ESCC中,WDHD1在180例(60.6%)中强染色,在117例(39.4%)中未染色(图14D,左图;细节在表7A中显示)。与WDHD1的高表达水平一致,ESCC患者的平均存活时间明显更短(利用时序检验P=0.0285;图14D,右图)。本发明人还应用单变量分析,评估了ESCC患者预后与数个因素之间的联系,所述因素包括年龄,性别,pT期(肿瘤深度(depth);T1+T2对T3+T4),pN期(淋巴结状态;N0对N1),以及WDHD1状态(阳性对阴性)。所有那些参数除年龄外都与预后不良明显相关(图7B)。利用Cox比例风险因素的多变量分析,确定了WDHD1(P=0.0085)以及其他3个因素(男性、较大的肿瘤尺寸和淋巴结转移)对于手术治疗的ESCC患者是独立的预后因素(图7B)。
表6A NSCLC组织中WDHD1-阳性与患者特征之间的关联(n=264)
Figure GPA00001115063301701
Figure GPA00001115063301711
ADC,腺癌
非ADC,鳞状细胞癌加大细胞癌和腺鳞细胞癌
*P<0.05(Fisher确切检验)
表6B NSCLC患者中预后因素的Cox比例风险模型分析
Figure GPA00001115063301712
ADC,腺癌
非ADC,鳞状细胞癌加大细胞癌和腺鳞细胞癌
*P<0.05
表7A ESCC组织中WDHD1-阳性与患者特征之间的关联(n=297)
Figure GPA00001115063301713
Figure GPA00001115063301721
表7B ESCC患者中预后因素的Cox比例风险模型分析
Figure GPA00001115063301722
*P<0.05
(3)WDHD1对癌细胞生长的作用
本发明人构建了数个特异针对WDHD1序列的siRNA表达寡核苷酸,并将它们转染至内源表达高水平WDHD1的A549、LC319和TE9细胞系。当我们使用si-WDHD1-#1和si-WDHD1-#2构建体时,通过RT-PCR证实了敲低作用(图15A和15B,上图)。MTT测定和集落形成测定揭示了用WDHD1-si2转染的细胞数目显著减少(图15A和15B,中图和下图)。流式细胞分析显示,WDHD1敲低后72小时,亚G1期细胞的数目增加,说明WDHD1敲低诱导了细胞凋亡(图15C)。另一方面,与模拟载体相比较,将WDHD1-表达载体转染至COS-7细胞中提高了细胞的活力(图15D)。流式细胞分析显示,si-WDHD1转染至肺癌A549细胞后24~72小时,S期细胞的数目不断减少,而转染后48~72小时期间,G0/G1期细胞的比例增加(图15E)。为进一步研究WDHD1对细胞周期的影响,我们使30分钟前已转染si-WDHD1的siRNA的A549细胞同步化,并监测它们的细胞周期。G0/G1期细胞的数目增加,S期的进程延迟,说明有一个群体的S期入口被抑制,并被维持在G0/G1期,而其他已处于S期的群体的G2/M期入口被抑制(图15F)。为了进一步研究WDHD1敲低对细胞形态学的影响,我们利用时延(time-lapse)显微镜,考察了用针对WDHD1的siRNA处理的A549细胞。在对照细胞中约每10小时观察到了细胞分裂,而WDHD1被敲低的细胞分裂缓慢,且细胞分裂之后立刻死亡(图15G)。免疫细胞化学分析显示,用针对WDHD1的siRNA转染的有丝分裂细胞有相对正常的纺锤体,但它们的染色体未能汇聚在纺锤体中央区,而是分散于纺锤体上。相比之下,用si-LUC处理的对照细胞装配类似于正常的中期分裂相,其中染色体很好地组织在中期板处(图15H)。
(4)WDHD1的磷酸化
当用SDS-PAGE分离WDHD1蛋白较长时间时,通过Western印迹检测到了WDHD1蛋白为双条带。因此,我们首先在有或无蛋白磷酸酶(NewEngland Biolabs,Beverly,MA)存在下,温育了来自A549细胞的提取物,并通过Western印迹分析分析了WDHD1蛋白的分子量。不出所料,用磷酸酶处理的提取物中多数WDHD1蛋白的测得分子量比在未处理细胞中的小。该数据表明,WDHD1在肺癌细胞中被磷酸化(图16A,左图)。用抗-WDHD1抗体免疫沉淀WDHD1,之后用泛-磷酸化-特异性抗体进行免疫印迹,显示了WDHD1在其丝氨酸和酪氨酸残基处磷酸化(图16A,右图)。
(5)WDHD1的细胞周期依赖性表达
由于WDHD1的过表达促进COS-7细胞的生长,所以本发明人考察了细胞周期中WDHD1的表达水平。利用阿非科林使LC319和A549细胞同步化,从G0/G1阻滞中释放后,通过Western印迹检测了WDHD1蛋白的表达水平。WDHD1水平在从G1期至S期的过渡期增加,在S期达到最高水平,然后在G2期和M期降低,证明了其在细胞周期进程中的功能性作用(图16B,C)。
(6)在PI3K信号传导中涉及WDHD1
为了说明WDHD1磷酸化的重要性,本发明人接着筛选了WDHD1蛋白上的磷酸化位点,发现它们中有一个共有的AKT激酶磷酸化位点(R-X-R-X-X-S374;Olsen JV,et al.,Cell.2006 Nov 3;127(3):635-48)。众所周知,磷脂酰肌醇-3激酶(PI3K)/AKT通路在广泛的肿瘤类型中被激活,并且触发一系列级联的应答,从细胞生长和增殖,到存活、运动性、上皮-间质转换和血管发生(Krystal GW,et al.,Mol Cancer Ther.2002 Sep;1(11):913-22;Nguyen DM,et al.,J Thorac Cardiovasc Surg.2004 Feb;127(2):365-75;KandelES & Hay N.Exp Cell Res.1999 Nov 25;253(1):210-29;Roy HK,et al.,Carcinogenesis.2002 Jan;23(1):201-5;Altomare DA,et al.,J Cell Biochem.2003 Jan 1;88(1):470-6;Tanno S,et al.,Cancer Res.2004 May15;64(10):3486-90)。
因此本发明人考察了在PI3K和/或AKT通路中是否涉及WDHD1。用不同浓度LY294002(0-40μmol/L,24小时)处理后,测定了WDHD1蛋白的水平,LY294002是PI3K的催化亚基的特异性抑制剂,其定向于激酶的ATP-结合位点(Vlahos CJ,et al.,J Biol Chem.1994 Feb 18;269(7):5241-8),降低AKT磷酸化,并引起细胞的G1阻滞(Suzuki C,et al.,Cancer Res.2005 Dec15;65(24):11314-25)。通过LY294002处理,WDHD1以及磷酸化WDHD1的总量均明显下降,说明WDHD1是PI3K通路的下游靶标(图16D)。为考察WDHD1是否为AKT1(GenBank登录号:NM_001014431)的靶标,检测了用针对AKT1的siRNA处理的A549细胞中WDHD1蛋白的表达水平,不出所料,WDHD1蛋白的水平降低了(图16E)。接着我们利用磷酸化-AKT底物(PAS)抗体,对在COS-7细胞中外源表达的经免疫沉淀的WDHD1进行了免疫印迹,检测到了阳性条带,说明其可能被内源性AKT磷酸化(图16F)。利用WDHD1免疫沉淀物作为底物和AKT1重组蛋白(rhAKT)作为激酶,随后用PAS抗体进行免疫印迹的体外激酶测定,也证明了WDHD1被AKT直接磷酸化(图16G),提示了WDHD1可能是AKT激酶的底物。为了研究WDHD1上被AKT1磷酸化的位点,我们构建了WDHD1-表达载体,其中WDHD1上的共有AKT磷酸化序列的丝氨酸374或1058被取代为丙氨酸(S374A,S1058A),将所述载体分别转染至COS-7细胞。对经免疫沉淀的WDHD1进行免疫印迹,或者利用经免疫沉淀的WDHD1结合随后用PAS抗体的免疫印迹进行的体外激酶测定,明确地显示了用S374A突变体转染的细胞中WDHD1磷酸化的水平下降,说明丝氨酸374是WDHD1上主要的AKT1依赖性磷酸化位点之一(图16H,I)。
(7)讨论
我们利用包含27,648个基因的cDNA微阵列,通过激光显微解剖,在癌细胞富集之后进行了101例肺癌和19例ESCC细胞的全基因组表达谱分析(Kikuchi T,et al.,Oncogene.2003 Apr 10;22(14):2192-205;Int J Oncol.2006 Apr;28(4):799-805;Kakiuchi S,et al.,Mol Cancer Res.2003 May;1(7):485-99;Hum Mol Genet.2004 Dec 15;13(24):3029-43.Epub 2004 Oct 20;Taniwaki M,et al.,Int J Oncol.2006 Sep;29(3):567-75;Yamabuki T,et al.,Int JOncol.2006 Jun;28(6):1375-84)。
通过这些分析,我们鉴定了许多基因,它们是开发有效的诊断标志物、治疗性药物和/或免疫疗法的良好的候选物(Suzuki C,et al.,Cancer Res.2003Nov 1;63(21):7038-41;Cancer Res.2005 Dec 15;65(24):11314-25;Mol CancerTher.2007 Feb;6(2):542-51;Ishikawa N,et al.,Clin Cancer Res.2004 Dec15;10(24):8363-70;Cancer Res.2005 Oct 15;65(20):9176-84;Cancer Sci.2006Aug;97(8):737-45;Kato T,et al.,Cancer Res.2005 Jul 1;65(13):5638-46;ClinCancer Res.2007 Jan 15;13(2 Pt 1):434-42;Furukawa C,et al.,Cancer Res.2005 Aug 15;65(16):7102-10;Takahashi K,et al.,Cancer Res.2006 Oct1;66(19):9408-19;Hayama S,et al.,Cancer Res.2006 Nov 1;66(21):10339-48;Cancer Res.2007 May 1;67(9):4113-22;Yamabuki T,et al.,Cancer Res.2007Mar 15;67(6):2517-25)。在本文的研究中,我们选择了WDHD1作为用于肺癌和/或ESCC诊断和预后生物标志的良好的候选物和治疗靶标,并提供了WDHD1在人肺和食道癌发生中所起作用的证据。
根据northern印迹和免疫组织化学分析的结果,WDHD1仅在睾丸和癌细胞中表达。癌症-睾丸抗原(CTAs)已被认为是一组具有非常引人兴趣的用于癌症疫苗的靶标(Li M,et al.,Clin Cancer Res.2005 Mar 1;11(5):1809-14)。虽然其他因素,例如蛋白质的体内自然免疫原性也是重要的(Wang Y,et al.,Cancer Immun.2004 Nov 1;4:11),但WDHD1是用于肺癌和ESCC免疫疗法的良好的靶标。
WDHD1编码1129个氨基酸的蛋白质,有高迁移率组(high-mobility-group,HMG)盒域和WD重复序列序列域。所述HMG盒保守性较好,由排列成L形的3个α螺旋构成,其结合DNA小沟(Thomas JO&Travers AA.Trends Biochem Sci.2001 Mar;26(3):167-74)。HMG蛋白以序列特异性或非序列特异性的方式结合DNA,引起DNA弯曲,调节染色质功能和基因表达(Sessa L & Bianchi ME.Gene.2007 Jan 31;387(1-2):133-40.Epub 2006 Nov 10)。通常,已知HMG结合核小体,通过与基本转录机构相互作用而抑制转录,作为转录辅激活物,或者确定特异性调节剂是作为转录的激活剂还是转录的阻遏物发挥作用(Ge H & Roeder RG.J Biol Chem.1994;269:17136-40;Paranjape SM,et al.,Genes Dev 1995;9:1978-91;Sutrias-Grau M,et al.,J Biol Chem.1999;274:1628-34;Shykind BM,et al.,Genes Dev 1995;9:354-65;Lehming N,et al.,Nature 1994;371:175-79)。
本说明书中描述了WDHD1被AKT1磷酸化和稳定化。这种广谱功能部分地可通过蛋白质-蛋白质相互作用加之由HMG区赋予的DNA结合活性而实现。就WDHD1而言,蛋白质-蛋白质相互作用的候选区域为WD重复序列。WD重复序列蛋白有助于细胞的从信号传导到细胞周期控制的一系列功能,其在真核生物以及原核生物中是保守的(Li D & Roberts R.Cell MolLife Sci.2001;58:2085-97)。结构分析已阐明了WD重复序列蛋白形成螺旋桨样结构,有数个由4股反平行β折叠构成的叶片。这种β-螺旋桨样结构作为蛋白可与之结合的平台,或者稳定地结合或者可逆地结合(Li D&Roberts R.Cell Mol Life Sci.2001;58:2085-97)。蛋白质与WDHD1相互作用的证据可有助于理解WDHD1功能。
细胞信号传导机制常常通过翻译后的蛋白质修饰传递信息,最重要的是可逆的蛋白质磷酸化。已经检测到了WDHD1序列中的一些磷酸化位点(Tanno S,et al.,Cancer Res.2004 May 15;64(10):3486-9039;Beausoleil SA,etal.,Proc Natl Acad Sci USA.2004 Aug 17;101(33):12130-5.Epub 2004 Aug9)。在我们的实验中,利用抗WDHD1抗体进行免疫沉淀,之后用泛-磷酸化-特异性抗体进行免疫印迹,显示了WDHD1在其丝氨酸和酪氨酸残基处磷酸化。利用NetPhos 2.0程序(万维网站点cbs.dtu.dk/services/NetPhos/;数据未显示),预测了GSK3,CaMK2,AKT,和ALK为这些残基的激酶。WDHD1的磷酸化区中有一个共有AKT激酶磷酸化位点(R-X-R-X-X-S374;Olsen JV,et al.,Cell.2006Nov 3;127(3):635-48)。PI3K/AKT信号传导对于细胞增殖和存活是重要的(Liang J & Slingerland JM.Cell Cycle.2003Jul-Aug;2(4):339-45;Hanahan D,Weinberg RA.Cell.2000 Jan 7;100(1):57-70;Bellacosa A,et al.,Oncogene.1998 Jul 23;17(3):313-25)。另外,AKT磷酸化往往在多种人类癌症中发生,已被认为是早期疾病复发和不良预后的危险因素(Chen YL,et al.,Cancer Res.2004 Dec 1;64(23):8723-30;Nicholson KM,et al.,Breast Cancer Res Treat.2003 Sep;81(2):117-28;Xu X,et al.,Oncol Rep.2004 Jan;11(1):25-32;Nakanishi K,et al.,Cancer.2005 Jan 15;103(2):307-12)。我们的数据显示,利用LY294002和针对AKT1的siRNA抑制PI3K/AKT通路,降低了总WDHD1和磷酸化WDHD1的表达水平。这个结果表明,WDHD1可能作为PI3K/AKT通路的一个组分,在癌细胞生长/存活中发挥重要作用。
这个结果说明,WDHD1是PI3K/AKT通路的组分之一,通过磷酸化得以稳定。另一方面,PI3K/AKT/mTOR/p70S6K1信号通过细胞周期蛋白和CDKs表达增加从而调节G1细胞周期进程。因此,利用LY294002抑制PI3K活性降低了细胞增殖,并引起了G1细胞周期阻滞(Gao N,et al.,Am J PhysiolCell Physiol.2004 Aug;287(2):C281-91.Epub 2004 Mar 17)。在我们的实验中,WDHD1的表达水平在S期较高,故WDHD1表达被LY294002降低是因为G1细胞周期阻滞。
综上所述,WDHD1在大多数肺癌和食道癌组织中过表达,在癌细胞生长和/存活中发挥重要作用。数据表明,WDHD1可用作治疗靶标和预后生物标记,用于治疗肺癌和食道癌患者。
工业实用性
本发明人已显示,特异性靶向CDCA5、EPHA7、STK31或WDHD1基因的双链分子可抑制细胞生长。因此,这些双链分子是用于开发抗癌药物的有用的候选物。例如,阻断CDCA5、EPHA7、STK31或WDHD1基因蛋白质的表达或者阻止其活性的试剂,可治疗性地用作抗癌剂,特别是用于治疗肺癌或食道癌的抗癌剂。
人基因CDCA5、EPHA7、STK31或WDHD1的表达在肺癌或食道癌中显著提高。因此,这些基因可方便地用作癌症的诊断标志物,由它们编码的蛋白质可用在癌症的诊断性试验中。
而且,在来自肺癌或食道癌患者的血液样品中检测到了EPHA7。因此,EPHA7可用作血清学诊断标志物。
此外,CDCA5、EPHA7、STK31或WDHD1多肽是用于开发抗癌药物或癌症诊断试剂的有用的靶标。例如,结合CDCA5、EPHA7、STK31或WDHD1,或者阻断CDCA5、EPHA7、STK31和WDHD1表达,或者阻止EPHA7或STK31的磷酸化活性,或者阻止WDHD1磷酸化,或者抑制EPHA7与EGFR之间结合的试剂,可治疗性用作抗癌剂或诊断试剂,特别是用于治疗肺癌或食道癌的抗癌剂。
序列表
<110>肿瘤疗法科学股份有限公司(ONCOTHERAPY SCIENCE,INC.)
 
<120>癌症相关基因CDCA5、EPHA7、STK31和WDHD1
 
<130>ONC-A0715P
 
<150>US 60/957,934
<151>2007-08-24
 
<150>US 60/977,335
<151>2007-10-03
 
<160>76
 
<170>PatentIn version 3.5
 
<210>1
<211>2507
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(74)..(832)
 
<400>1
gcagcgagtg gccttcccgg ttggcgcgcg cccggggcgg cggcgctgga ggagctcgag    60
acggagccta gtt atg tct ggg agg cga acg cgg tcc gga gga gcc gct       109
               Met Ser Gly Arg Arg Thr Arg Ser Gly Gly Ala Ala
               1               5                   10
cag cgc tcc ggg cca agg gcc cca tct cct act aag cct ctg cgg agg      157
Gln Arg Ser Gly Pro Arg Ala Pro Ser Pro Thr Lys Pro Leu Arg Arg
       15                   20                  25
tcc cag cgg aaa tca ggc tct gaa ctc ccg agc atc ctc cct gaa atc      205
Ser Gln Arg Lys Ser Gly Ser Glu Leu Pro Ser Ile Leu Pro Glu Ile
    30                  35                  40
tgg ccg aag aca ccc agt gcg gct gca gtc aga aag ccc atc gtc tta      253
Trp Pro Lys Thr Pro Ser Ala Ala Ala Val Arg Lys Pro Ile Val Leu
45                  50                  55                  60
aag agg atc gtg gcc cat gct gta gag gtc cca gct gtc caa tca cct      301
Lys Arg Ile Val Ala His Ala Val Glu Val Pro Ala Val Gln Ser Pro
                65                   70                  75
cgc agg agc cct agg att tcc ttt ttc ttg gag aaa gaa aac gag ccc      349
Arg Arg Ser Pro Arg Ile Ser Phe Phe Leu Glu Lys Glu Asn Glu Pro
            80                  85                  90
cct ggc agg gag ctt act aag gag gac ctt ttc aag aca cac agc gtc      397
Pro Gly Arg Glu Leu Thr Lys Glu Asp Leu Phe Lys Thr His Ser Val
        95                  100                 105
cct gcc acc ccc acc agc act cct gtg ccg aac cct gag gcc gag tcc      445
Pro Ala Thr Pro Thr Ser Thr Pro Val Pro Asn Pro Glu Ala Glu Ser
    110                 115                 120
agc tcc aag gaa gga gag ctg gac gcc aga gac ttg gaa atg tct aag      493
Ser Ser Lys Glu Gly Glu Leu Asp Ala Arg Asp Leu Glu Met Ser Lys
125                 130                 135                 140
aaa gtc agg cgt tcc tac agc cgg ctg gag acc ctg ggc tct gcc tct      541
Lys Val Arg Arg Ser Tyr Ser Arg Leu Glu Thr Leu Gly Ser Ala Ser
                145                 150                 155
acc tcc acc cca ggc cgc cgg tcc tgc ttt ggc ttc gag ggg ctg ctg       589
Thr Ser Thr Pro Gly Arg Arg Ser Cys Phe Gly Phe Glu Gly Leu Leu
            160                 165                 170
ggg gca gaa gac ttg tcc gga gtc tcg cca gtg gtg tgc tcc aaa ctc       637
Gly Ala Glu Asp Leu Ser Gly Val Ser Pro Val Val Cys Ser Lys Leu
        175                 180                 185
acc gag gtc ccc agg gtt tgt gca aag ccc tgg gcc cca gac atg act       685
Thr Glu Val Pro Arg Val Cys Ala Lys Pro Trp Ala Pro Asp Met Thr
    190                 195                 200
ctc cct gga atc tcc cca cca ccc gag aaa cag aaa cgt aag aag aag       733
Leu Pro Gly Ile Ser Pro Pro Pro Glu Lys Gln Lys Arg Lys Lys Lys
205                 210                 215                 220
aaa atg cca gag atc ttg aaa acg gag ctg gat gag tgg gct gcg gcc       781
Lys Met Pro Glu Ile Leu Lys Thr Glu Leu Asp Glu Trp Ala Ala Ala
                225                 230                 235
atg aat gcc gag ttt gaa gct gct gag cag ttt gat ctc ctg gtt gaa       829
Met Asn Ala Glu Phe Glu Ala Ala Glu Gln Phe Asp Leu Leu Val Glu
            240                 245                 250
tga gatgcagtgg ggggtgcacc  tggccagact ctccctcctg tcctgtacat           882
agccacctcc ctgtggagag gacacttagg gtcccctccc ctggtcttgt tacctgtgtg     942
tgtgctggtg ctgcgcatga ggactgtctg cctttgaggg cttgggcagc agcggcagcc     1002
atcttggttt taggaaatgg ggccgcctgg cccagccact cactggtgtc ctgtctcttg     1062
tcgtcctgtc cttcctatct ccccaaagta ccatagccag tttccagatg ggccacagac     1122
tggggaggag aatcagtggc ccagccagaa gttaaagggc tgagggttga ggtgagaggc     1182
acctctgctc ttgttgggag gggtggctgc ttggaaatag gcccaggggc tctgccagcc     1242
tcggcctctc cctcctgagt tgccttctgt tggtggcttt cttcttgaac ccacctgtgt     1302
aaagaggttt tcagttccgt gggtttcccc tttgattctg taaatagtcc cagagagaat     1362
tcgtgggctg agggcaattc tgtcttggag gaagaagctg gacattcagc ctgtggagtc     1422
tgagttttga aggatgtagg gagccttagt tgggtctcag accataagtg tgtactacac     1482
agaagctgtg ttttctagtt ctggtctgct gttgagatgt ttggtaaatg ccaggttgat     1542
agggcgctgg ctgcttggag caaagggtgc atttcagggt gtggccacca ggtgctgtga     1602
gtttctgtgg ctcatggcct ctgggctggt cccttgcaca gggcccacgc tggagtctta     1662
ccactctgct gcaggggtgg aaggtggccc ctcttgtcac ccatacccat ttcttacaaa     1722
ataagttaca ccgagtctac ttggccctag aagagaaagt tgaagagtcc cagacctact     1782
agcattttgc aactatgctt gtaaagtcct cggaaagttt cctcgcgtac cagacagcgg     1842
cgggggctga tagcaatttt agtttttggc ctccctatcc tctcacatga gaacactgcc     1902
tggatgcatc tcatgatctc tggagaattt ccccatcttt ctcttctttc catcgtgtgg     1962
attcaatagt ttggatttga aggctgccct gcccccgact ctcctgccgc acccctggcc     2022
attgtacctt ttgatgttta gaagttcgtg gaagtagacg ctgaggtgtg cagaggagct     2082
ggtggataac agagaatgcc agggaagatg agtgctgggt cagggtactt ggatgaaacg     2142
gtgcaggcca ggcgggccct aataaaaccc tctgccaggt ctgggagtcc caggccatct     2202
gctcaacgct ctgtggtttg tcagacctgc aagcaagccc cctgctgggg aagcctaggt     2262
gtccttgagc tgaaccgcac tgaagaactc ttgtcctcac tggctgatgc agcagaactc    2322
ttgggaaatg tcttagtcct gcagaatcag gagtcaccag atgatgcaga gttgagatca    2382
tcattgcaaa gttctctgtt cctgaggaac taaatttaag gaaaaaatgg gattttgttt    2442
tagagttgga aaaaaagcct gattaaagag tttctgcctg ttaaaaaaaa aaaaaaaaaa    2502
aaaaa    2507
 
<210>2
<211>252
<212>PRT
<213>人(Homo sapiens)
 
<400>2
 
Met Ser Gly Arg Arg Thr Arg Ser Gly Gly Ala Ala Gln Arg Ser Gly
1           5                       10                  15
Pro Arg Ala Pro Ser Pro Thr Lys Pro Leu Arg Arg Ser Gln Arg Lys
            20                  25                  30
Ser Gly Ser Glu Leu Pro Ser Ile Leu Pro Glu Ile Trp Pro Lys Thr
        35                  40                  45
Pro Ser Ala Ala Ala Val Arg Lys Pro Ile Val Leu Lys Arg Ile Val
    50                  55                  60
Ala His Ala Val Glu Val Pro Ala Val Gln Ser Pro Arg Arg Ser Pro
65                  70                  75                  80
Arg Ile Ser Phe Phe Leu Glu Lys Glu Asn Glu Pro Pro Gly Arg Glu
                85                  90                      95
Leu Thr Lys Glu Asp Leu Phe Lys Thr His Ser Val Pro Ala Thr Pro
            100                 105                 110
Thr Ser Thr Pro Val Pro Asn Pro Glu Ala Glu Ser Ser Ser Lys Glu
        115                 120                 125
Gly Glu Leu Asp Ala Arg Asp Leu Glu Met Ser Lys Lys Val Arg Arg
    130                 135                 140
Ser Tyr Ser Arg Leu Glu Thr Leu Gly Ser Ala Ser Thr Ser Thr Pro
145                 150                 155                 160
Gly Arg Arg Ser Cys Phe Gly Phe Glu Gly Leu Leu Gly Ala Glu Asp
                165                 170                 175
Leu Ser Gly Val Ser Pro Val Val Cys Ser Lys Leu Thr Glu Val Pro
            180                 185                 190
Arg Val Cys Ala Lys Pro Trp Ala Pro Asp Met Thr Leu Pro Gly Ile
        195                 200                 205
Ser Pro Pro Pro Glu Lys Gln Lys Arg Lys Lys Lys Lys Met Pro Glu
    210                 215                 220
Ile Leu Lys Thr Glu Leu Asp Glu Trp Ala Ala Ala Met Asn Ala Glu
225                 230                 235                 240
Phe Glu Ala Ala Glu Gln Phe Asp Leu Leu Val Glu
                245                 250
 
<210>3
<211>5229
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(214)..(3210)
 
<400>3
gcagtcggag acttgcaggc agcaaacacg gtgcgagcga acaggagtgg gggggaaatt       60
aaaaaaagct aaacgtggag cagccgatcg gggaccgaga aggggaatcg atgcaaggag      120
cacaataaaa caaaagctac ttcggaacaa acagcattta aaaatccacg actcaagata      180
actgaaacct aaaataaaac ctgctcatgc acc atg gtt ttt caa act cgg tac       234
                                     Met Val Phe Gln Thr Arg Tyr
                                     1               5
cct tca tgg att att tta tgc tac atc tgg ctg ctc cgc ttt gca cac        282
Pro Ser Trp Ile Ile Leu Cys Tyr Ile Trp Leu Leu Arg Phe Ala His
        10                  15                  20
aca ggg gag gcg cag gct gcg aag gaa gta cta ctg ctg gat tct aaa        330
Thr Gly Glu Ala Gln Ala Ala Lys Glu Val Leu Leu Leu Asp Ser Lys
    25                  30                  35
gca caa caa aca gag ttg gag tgg att tcc tct cca ccc aat ggg tgg        378
Ala Gln Gln Thr Glu Leu Glu Trp Ile Ser Ser Pro Pro Asn Gly Trp
40                  45                  50                  55
gaa gaa att agt ggt ttg gat gag aac tat acc ccg ata cga aca tac        426
Glu Glu Ile Ser Gly Leu Asp Glu Asn Tyr Thr Pro Ile Arg Thr Tyr
                60                  65                  70
cag gtg tgc caa gtc atg gag ccc aac caa aac aac tgg ctg cgg act        474
Gln Val Cys Gln Val Met Glu Pro Asn Gln Asn Asn Trp Leu Arg Thr
            75                  80                  85
aac tgg att tcc aaa ggc aat gca caa agg att ttt gta gaa ttg aaa        522
Asn Trp Ile Ser Lys Gly Asn Ala Gln Arg Ile Phe Val Glu Leu Lys
        90                  95                  100
ttc acc ctg agg gat tgt aac agt ctt cct gga gta ctg gga act tgc        570
Phe Thr Leu Arg Asp Cys Asn Ser Leu Pro Gly Val Leu Gly Thr Cys
    105                 110                 115
aag gaa aca ttt aat ttg tac tat tat gaa aca gac tat gac act ggc        618
Lys Glu Thr Phe Asn Leu Tyr Tyr Tyr Glu Thr Asp Tyr Asp Thr Gly
120                 125                 130                 135
agg aat ata aga gaa aac ctc tat gta aaa ata gac acc att gct gca        666
Arg Asn Ile Arg Glu Asn Leu Tyr Val Lys Ile Asp Thr Ile Ala Ala
                140                 145                 150
gat gaa agt ttt acc caa ggt gac ctt ggt gaa aga aag atg aag ctt        714
Asp Glu Ser Phe Thr Gln Gly Asp Leu Gly Glu Arg Lys Met Lys Leu
            155                 160                 165
aac act gag gtg aga gag att gga cct ttg tcc aaa aag gga ttc tat    762
Asn Thr Glu Val Arg Glu Ile Gly Pro Leu Ser Lys Lys Gly Phe Tyr
        170                 175                 180
ctt gcc ttt cag gat gta ggg gct tgc ata gct ttg gtt tct gtc aaa    810
Leu Ala Phe Gln Asp Val Gly Ala Cys Ile Ala Leu Val Ser Val Lys
    185                 190                 195
gtg tac tac aag aag tgc tgg tcc att att gag aac tta gct atc ttt    858
Val Tyr Tyr Lys Lys Cys Trp Ser Ile Ile Glu Asn Leu Ala Ile Phe
200                 205                 210                 215
cca gat aca gtg act ggt tca gaa ttt tcc tct tta gtc gag gtt cga    906
Pro Asp Thr Val Thr Gly Ser Glu Phe Ser Ser Leu Val Glu Val Arg
                220                 225                 230
ggg aca tgt gtc agc agt gca gag gaa gaa gcg gaa aac gcc ccc agg    954
Gly Thr Cys Val Ser Ser Ala Glu Glu Glu Ala Glu Asn Ala Pro Arg
            235                 240                 245
atg cac tgc agt gca gaa gga gaa tgg tta gtg ccc att gga aaa tgt    1002
Met His Cys Ser Ala Glu Gly Glu Trp Leu Val Pro Ile Gly Lys Cys
        250                 255                 260
atc tgc aaa gca ggc tac cag caa aaa gga gac act tgt gaa ccc tgt    1050
Ile Cys Lys Ala Gly Tyr Gln Gln Lys Gly Asp Thr Cys Glu Pro Cys
    265                 270                 275
ggc cgt ggg ttc tac aag tct tcc tct caa gat ctt cag tgc tct cgt    1098
Gly Arg Gly Phe Tyr Lys Ser Ser Ser Gln Asp Leu Gln Cys Ser Arg
280                 285                 290                 295
tgt cca act cac agt ttt tct gat aaa gaa ggc tcc tcc aga tgt gaa    1146
Cys Pro Thr His Ser Phe Ser Asp Lys Glu Gly Ser Ser Arg Cys Glu
                300                 305                 310
tgt gaa gat ggg tat tac agg gct cca tct gac cca cca tac gtt gca    1194
Cys Glu Asp Gly Tyr Tyr Arg Ala Pro Ser Asp Pro Pro Tyr Val Ala
            315                 320                 325
tgc aca agg cct cca tct gca cca cag aac ctc att ttc aac atc aac    1242
Cys Thr Arg Pro Pro Ser Ala Pro Gln Asn Leu Ile Phe Asn Ile Asn
        330                 335                 340
caa acc aca gta agt ttg gaa tgg agt cct cct gca gac aat ggg gga    1290
Gln Thr Thr Val Ser Leu Glu Trp Ser Pro Pro Ala Asp Asn Gly Gly
    345                 350                 355
aga aac gat gtg acc tac aga ata ttg tgt aag cgg tgc agt tgg gag    1338
Arg Asn Asp Val Thr Tyr Arg Ile Leu Cys Lys Arg Cys Ser Trp Glu
360                 365                 370                 375
cag ggc gaa tgt gtt ccc tgt ggg agt aac att gga tac atg ccc cag    1386
Gln Gly Glu Cys Val Pro Cys Gly Ser Asn Ile Gly Tyr Met Pro Gln
                380                 385                 390
cag act gga tta gag gat aac tat gtc act gtc atg gac ctg cta gcc    1434
Gln Thr Gly Leu Glu Asp Asn Tyr Val Thr Val Met Asp Leu Leu Ala
            395                 400                 405
cac gct aat tat act ttt gaa gtt gaa gct gta aat gga gtt tct gac    1482
His Ala Asn Tyr Thr Phe Glu Val Glu Ala Val Asn Gly Val Ser Asp
        410                 415                 420
tta agc cga tcc cag agg ctc ttt gct gct gtc agt atc acc act ggt    1530
Leu Ser Arg Ser Gln Arg Leu Phe Ala Ala Val Ser Ile Thr Thr Gly
    425                 430                 435
caa gca gct ccc tcg caa gtg agc gga gta atg aag gag aga gta ctg    1578
Gln Ala Ala Pro Ser Gln Val Ser Gly Val Met Lys Glu Arg Val Leu
440                 445                 450                 455
cag cgg agt gtc gag ctt tcc tgg cag gaa cca gag cat ccc aat gga       1626
Gln Arg Ser Val Glu Leu Ser Trp Gln Glu Pro Glu His Pro Asn Gly
                460                 465                 470
gtc atc aca gaa tat gaa atc aag tat tac gag aaa gat caa agg gaa       1674
Val Ile Thr Glu Tyr Glu Ile Lys Tyr Tyr Glu Lys Asp Gln Arg Glu
            475                 480                 485
cgg acc tac tca aca gta aaa acc aag tct act tca gcc tcc att aat       1722
Arg Thr Tyr Ser Thr Val Lys Thr Lys Ser Thr Ser Ala Ser Ile Asn
        490                 495                 500
aat ctg aaa cca gga aca gtg tat gtt ttc cag att cgg gct ttt act       1770
Asn Leu Lys Pro Gly Thr Val Tyr Val Phe Gln Ile Arg Ala Phe Thr
    505                 510                 515
gct gct ggt tat gga aat tac agt ccc aga ctt gat gtt gct aca cta       1818
Ala Ala Gly Tyr Gly Asn Tyr Ser Pro Arg Leu Asp Val Ala Thr Leu
520                 525                 530                 535
gag gaa gct aca ggt aaa atg ttt gaa gct aca gct gtc tcc agt gaa       1866
Glu Glu Ala Thr Gly Lys Met Phe Glu Ala Thr Ala Val Ser Ser Glu
                540                 545                 550
cag aat cct gtt att atc att gct gtg gtt gct gta gct ggg acc atc       1914
Gln Asn Pro Val Ile Ile Ile Ala Val Val Ala Val Ala Gly Thr Ile
            555                 560                 565
att ttg gtg ttc atg gtc ttt ggc ttc atc att ggg aga agg cac tgt       1962
Ile Leu Val Phe Met Val Phe Gly Phe Ile Ile Gly Arg Arg His Cys
        570                 575                 580
ggt tat agc aaa gct gac caa gaa ggc gat gaa gag ctt tac ttt cat       2010
Gly Tyr Ser Lys Ala Asp Gln Glu Gly Asp Glu Glu Leu Tyr Phe His
    585                 590                 595
ttt aaa ttt cca ggc acc aaa acc tac att gac cct gaa acc tat gag       2058
Phe Lys Phe Pro Gly Thr Lys Thr Tyr Ile Asp Pro Glu Thr Tyr Glu
600                 605                 610                 615
gac cca aat aga gct gtc cat caa ttc gcc aag gag cta gat gcc tcc       2106
Asp Pro Asn Arg Ala Val His Gln Phe Ala Lys Glu Leu Asp Ala Ser
                620                 625                 630
tgt att aaa att gag cgt gtg att ggt gca gga gaa ttc ggt gaa gtc       2154
Cys Ile Lys Ile Glu Arg Val Ile Gly Ala Gly Glu Phe Gly Glu Val
            635                 640                 645
tgc agt ggc cgt ttg aaa ctt cca ggg aaa aga gat gtt gca gta gcc       2202
Cys Ser Gly Arg Leu Lys Leu Pro Gly Lys Arg Asp Val Ala Val Ala
        650                 655                 660                                           
ata aaa acc ctg aaa gtt ggt tac aca gaa aaa caa agg aga gac ttt       2250
Ile Lys Thr Leu Lys Val Gly Tyr Thr Glu Lys Gln Arg Arg Asp Phe
    665                 670                 675
ttg tgt gaa gca agc atc atg ggg cag ttt gac cac cca aat gtt gtc       2298
Leu Cys Glu Ala Ser Ile Met Gly Gln Phe Asp His Pro Asn Val Val
680                 685                 690                 695
cat ttg gaa ggg gtt gtt aca aga ggg aaa cca gtc atg ata gta ata       2346
His Leu Glu Gly Val Val Thr Arg Gly Lys Pro Val Met Ile Val Ile
                700                 705                 710
gag ttc atg gaa aat gga gcc cta gat gca ttt ctc agg aaa cat gat       2394
Glu Phe Met Glu Asn Gly Ala Leu Asp Ala Phe Leu Arg Lys His Asp
            715                 720                 725
ggg caa ttt aca gtc att cag tta gta gga atg ctg aga gga att gct       2442
Gly Gln Phe Thr Val Ile Gln Leu Val Gly Met Leu Arg Gly Ile Ala
        730                 735                 740
gct gga atg aga tat ttg gct gat atg gga tat gtt cac agg gac ctt       2490
Ala Gly Met Arg Tyr Leu Ala Asp Met Gly Tyr Val His Arg Asp Leu
    745                 750                 755
gca gct cgc aat att ctt gtc aac agc aat ctc gtt tgt aaa gtg tca       2538
Ala Ala Arg Asn Ile Leu Val Asn Ser Asn Leu Val Cys Lys Val Ser
760                 765                 770                 775
gat ttt ggc ctg tcc cga gtt ata gag gat gat cca gaa gct gtc tat       2586
Asp Phe Gly Leu Ser Arg Val Ile Glu Asp Asp Pro Glu Ala Val Tyr
                780                 785                 790
aca act act ggt gga aaa att cca gta agg tgg aca gca ccc gaa gcc       2634
Thr Thr Thr Gly Gly Lys Ile Pro Val Arg Trp Thr Ala Pro Glu Ala
            795                 800                 805
atc cag tac cgg aaa ttc aca tca gcc agt gat gta tgg agc tat gga       2682
Ile Gln Tyr Arg Lys Phe Thr Ser Ala Ser Asp Val Trp Ser Tyr Gly
        810                 815                 820
ata gtc atg tgg gaa gtt atg tct tat gga gaa aga cct tat tgg gac       2730
Ile Val Met Trp Glu Val Met Ser Tyr Gly Glu Arg Pro Tyr Trp Asp
    825                 830                 835
atg tca aat caa gat gtt ata aaa gca ata gaa gaa ggt tat cgt tta       2778
Met Ser Asn Gln Asp Val Ile Lys Ala Ile Glu Glu Gly Tyr Arg Leu
840                 845                 850                 855
cca gca ccc atg gac tgc cca gct ggc ctt cac cag cta atg ttg gat       2826
Pro Ala Pro Met Asp Cys Pro Ala Gly Leu His Gln Leu Met Leu Asp
                860                 865                 870
tgt tgg caa aag gag cgt gct gaa agg cca aaa ttt gaa cag ata gtt       2874
Cys Trp Gln Lys Glu Arg Ala Glu Arg Pro Lys Phe Glu Gln Ile Val
            875                 880                 885
gga att cta gac aaa atg att cga aac cca aat agt ctg aaa act ccc       2922
Gly Ile Leu Asp Lys Met Ile Arg Asn Pro Asn Ser Leu Lys Thr Pro
        890                 895                 900
ctg gga act tgt agt agg cca ata agc cct ctt ctg gat caa aac act       2970
Leu Gly Thr Cys Ser Arg Pro Ile Ser Pro Leu Leu Asp Gln Asn Thr
    905                 910                 915
cct gat ttc act acc ttt tgt tca gtt gga gaa tgg cta caa gct att       3018
Pro Asp Phe Thr Thr Phe Cys Ser Val Gly Glu Trp Leu Gln Ala Ile
920                 925                 930                 935
aag atg gaa aga tat aaa gat aat ttc acg gca gct ggc tac aat tcc       3066
Lys Met Glu Arg Tyr Lys Asp Asn Phe Thr Ala Ala Gly Tyr Asn Ser
                 940                 945                 950
ctt gaa tca gta gcc agg atg act att gag gat gtg atg agt tta ggg       3114
Leu Glu Ser Val Ala Arg Met Thr Ile Glu Asp Val Met Ser Leu Gly
            955                 960                 965
atc aca ctg gtt ggt cat caa aag aaa atc atg agc agc att cag act       3162
Ile Thr Leu Val Gly His Gln Lys Lys Ile Met Ser Ser Ile Gln Thr
        970                 975                 980
atg aga gca caa atg cta cat tta cat gga act ggc att caa gtg tga       3210
Met Arg Ala Gln Met Leu His Leu His Gly Thr Gly Ile Gln Val
    985                 990                 995
tatgcatttc tcccttttaa gggagattac agactgcaag agaacagtac tggccttcag     3270
tatatgcata gaatgctgct agaagacaag tgatgtcctg ggtccttcca acagtgaaga     3330
gaagatttaa gaagcaccta tagacttgaa ctcctaagtg ccaccagaat atataaaaag    3390
ggaatttagg atccaccatc ggtggccagg aaaatagcag tgacaataaa caaagtacta    3450
cctgaaaaac atccaaacac cttgagctct ctaacctcct ttttgtctta tagacttttt    3510
aaaatgtaca taaagaattt aagaaagaat atatttgtca aataaaatca tgatcttatt    3570
gttaaaatta atgaaatatt ttccttaaat atgtgatttc agactattcc tttttaaaat    3630
catttgtgtt tattcttcat aaggactttg ttttagaaag ctgtttatag ctttggacct    3690
ttttagtgtt aaatctgtaa cattactaca ctgggtacct ttgaaagaat ctcaaatttc    3750
aaaagaaata gcatgattga agatacatct ctgttagaac attggtatcc tttttgtgcc    3810
attttattct gtttaatcag tgctgttttg atattgtttg ctaattggca ggtagtcaag    3870
aaaatgcaag ttgccaagag ctctgatatt ttttaaaaag aatttttttg taaagatcag    3930
acaacacact atcttttcaa tgaaaaaagc aataatgatc catacatact ataaggcact    3990
tttaacagat tgtttataga gtgattttac tagaaagaat ttaataaact cgaagtttag    4050
gtttatgagt atataaacaa atgaggcact tcatctgaag aatgttggtg aaggcaagtc    4110
tctgaaagca gaactatcca gtgttatcta aaaattaatc tgagcacatc aagatttttt    4170
cattctcgtg acattaggaa atttaggata aatagttgac atatatttta tatcctcttc    4230
tgttgaatgc agtccaaaca tgaaaggaaa taattgtttt atattataac tctgaagcat    4290
gataaagggg cagttcacaa ttttcaccat ttaaacacaa atttgctgca cagaatatca    4350
ccattgcagt tcaaaacaaa acaaaacaaa aagtcttttg tttgtgaaca ctgatgcaag    4410
aaacttgtta aatgaaagga ctctttaccc tagaaggaag aggtgaagga tctggcttgt    4470
ttttaaagct ttatttatta aaccatatta tttgattact gtgttagaat ttcataagca    4530
ataattaaat gtgtctttat agatattgca ggaatgtata catattgtga ttaatgcttt    4590
caaaacttat gaaaatcatg aactacccca gaattgaact gttgtacttc caaagagaat    4650
tgggctgttt ataatgattt taatagagaa agatcccagg gatcggtcat aattggtctt    4710
gtttgataat gtgggcatcc acaaacaaac aaacaaataa cagaaacaaa atctgtaaat    4770
gttcctttgt aaaacttgta aattttattt atactgtctt gttttgtaca cacatttctc    4830
tgtagtgggc tctgaataca ttgaaaatgc actatatttt tctattttac ttgcagagca    4890
tcacaaaaga acaggtattt tcagtgctac ataatgtgtt ttcccacatt taggaccaaa    4950
gacggctata gaaaaactca aatggattgc ttcccaaacc cctccccacc cttttttttt    5010
ggttttaaat cactgtacag tgttatttga tattttaatt tattttttga ttgactagaa    5070
aaatcatttt aatttcacta aaatgttttt tgtccctaag gaaaagtaat ctgtaaaaat    5130
aattttaatt agcataatac agtcacctag acacttccat ttgtaatctt tgtaatagac    5190
tgtaaatata tttttggaac tataaaaaaa aaaaaaaaa                           5229
 
<210>4
<211>998
<212>PRT
<213>人(Homo sapiens)
<400>4
 
Met Val Phe Gln Thr Arg Tyr Pro Ser Trp Ile Ile Leu Cys Tyr Ile
1               5                   10                  15
Trp Leu Leu Arg Phe Ala His Thr Gly Glu Ala Gln Ala Ala Lys Glu
            20                  25                  30
Val Leu Leu Leu Asp Ser Lys Ala Gln Gln Thr Glu Leu Glu Trp Ile
        35                  40                  45
Ser Ser Pro Pro Asn Gly Trp Glu Glu Ile Ser Gly Leu Asp Glu Asn
    50                  55                  60
Tyr Thr Pro Ile Arg Thr Tyr Gln Val Cys Gln Val Met Glu Pro Asn
65                  70                  75                  80
Gln Asn Asn Trp Leu Arg Thr Asn Trp Ile Ser Lys Gly Asn Ala Gln
                85                  90                  95
Arg Ile Phe Val Glu Leu Lys Phe Thr Leu Arg Asp Cys Asn Ser Leu
            100                 105                 110
Pro Gly Val Leu Gly Thr Cys Lys Glu Thr Phe Asn Leu Tyr Tyr Tyr
        115                 120                 125
Glu Thr Asp Tyr Asp Thr Gly Arg Asn Ile Arg Glu Asn Leu Tyr Val
    130                 135                 140
Lys Ile Asp Thr Ile Ala Ala Asp Glu Ser Phe Thr Gln Gly Asp Leu
145                 150                 155                 160
Gly Glu Arg Lys Met Lys Leu Asn Thr Glu Val Arg Glu Ile Gly Pro
                165                 170                 175
Leu Ser Lys Lys Gly Phe Tyr Leu Ala Phe Gln Asp Val Gly Ala Cys
            180                 185                 190
Ile Ala Leu Val Ser Val Lys Val Tyr Tyr Lys Lys Cys Trp Ser Ile
        195                 200                 205
Ile Glu Asn Leu Ala Ile Phe Pro Asp Thr Val Thr Gly Ser Glu Phe
    210                 215                 220
Ser Ser Leu Val Glu Val Arg Gly Thr Cys Val Ser Ser Ala Glu Glu
225                 230                 235                 240
Glu Ala Glu Asn Ala Pro Arg Met His Cys Ser Ala Glu Gly Glu Trp
                245                 250                 255
Leu Val Pro Ile Gly Lys Cys Ile Cys Lys Ala Gly Tyr Gln Gln Lys
            260                 265                 270   Gly Asp Thr Cys Glu Pro Cys Gly Arg Gly Phe Tyr Lys Ser Ser Ser
        275                 280                 285
Gln Asp Leu Gln Cys Ser Arg Cys Pro Thr His Ser Phe Ser Asp Lys
    290                 295                 300
Glu Gly Ser Ser Arg Cys Glu Cys Glu Asp Gly Tyr Tyr Arg Ala Pro
305                 310                 315                 320
Ser Asp Pro Pro Tyr Val Ala Cys Thr Arg Pro Pro Ser Ala Pro Gln
               325                 330                 335
Asn Leu Ile Phe Asn Ile Asn Gln Thr Thr Val Ser Leu Glu Trp Ser
            340                 345                 350
Pro Pro Ala Asp Asn Gly Gly Arg Asn Asp Val Thr Tyr Arg Ile Leu
        355                 360                 365
Cys Lys Arg Cys Ser Trp Glu Gln Gly Glu Cys Val Pro Cys Gly Ser
    370                 375                 380
Asn Ile Gly Tyr Met Pro Gln Gln Thr Gly Leu Glu Asp Asn Tyr Val
385                 390                 395                 400
Thr Val Met Asp Leu Leu Ala His Ala Asn Tyr Thr Phe Glu Val Glu
                405                 410                 415
Ala Val Asn Gly Val Ser Asp Leu Ser Arg Ser Gln Arg Leu Phe Ala
            420                 425                 430
Ala Val Ser Ile Thr Thr Gly Gln Ala Ala Pro Ser Gln Val Ser Gly
        435                 440                 445
Val Met Lys Glu Arg Val Leu Gln Arg Ser Val Glu Leu Ser Trp Gln
    450                 455                 460
Glu Pro Glu His Pro Asn Gly Val Ile Thr Glu Tyr Glu Ile Lys Tyr
465                 470                 475                 480
Tyr Glu Lys Asp Gln Arg Glu Arg Thr Tyr Ser Thr Val Lys Thr Lys
                485                 490                 495
Ser Thr Ser Ala Ser Ile Asn Asn Leu Lys Pro Gly Thr Val Tyr Val
            500                 505                 510
Phe Gln Ile Arg Ala Phe Thr Ala Ala Gly Tyr Gly Asn Tyr Ser Pro
        515                 520                 525
Arg Leu Asp Val Ala Thr Leu Glu Glu Ala Thr Gly Lys Met Phe Glu
    530                 535                 540
Ala Thr Ala Val Ser Ser Glu Gln Asn Pro Val Ile Ile Ile Ala Val
545                 550                 555                 560
Val Ala Val Ala Gly Thr Ile Ile Leu Val Phe Met Val Phe Gly Phe
                565                 570                 575
Ile Ile Gly Arg Arg His Cys Gly Tyr Ser Lys Ala Asp Gln Glu Gly
            580                 585                 590
Asp Glu Glu Leu Tyr Phe His Phe Lys Phe Pro Gly Thr Lys Thr Tyr
        595                 600                 605
Ile Asp Pro Glu Thr Tyr Glu Asp Pro Asn Arg Ala Val His Gln Phe
    610                 615                 620
Ala Lys Glu Leu Asp Ala Ser Cys Ile Lys Ile Glu Arg Val Ile Gly
625                 630                 635                 640
Ala Gly Glu Phe Gly Glu Val Cys Ser Gly Arg Leu Lys Leu Pro Gly
                645                 650                 655
Lys Arg Asp Val Ala Val Ala Ile Lys Thr Leu Lys Val Gly Tyr Thr
            660                 665                 670
Glu Lys Gln Arg Arg Asp Phe Leu Cys Glu Ala Ser Ile Met Gly Gln
        675                 680                 685
Phe Asp His Pro Asn Val Val His Leu Glu Gly Val Val Thr Arg Gly
    690                 695                 700
Lys Pro Val Met Ile Val Ile Glu Phe Met Glu Asn Gly Ala Leu Asp
705                 710                 715                 720
Ala Phe Leu Arg Lys His Asp Gly Gln Phe Thr Val Ile Gln Leu Val
                725                 730                 735
Gly Met Leu Arg Gly Ile Ala Ala Gly Met Arg Tyr Leu Ala Asp Met
            740                 745                 750
Gly Tyr Val His Arg Asp Leu Ala Ala Arg Asn Ile Leu Val Asn Ser
        755                 760                 765
Asn Leu Val Cys Lys Val Ser Asp Phe Gly Leu Ser Arg Val Ile Glu
    770                 775                 780
Asp Asp Pro Glu Ala Val Tyr Thr Thr Thr Gly Gly Lys Ile Pro Val
785                 790                 795                 800
Arg Trp Thr Ala Pro Glu Ala Ile Gln Tyr Arg Lys Phe Thr Ser Ala
                805                 810                 815
Ser Asp Val Trp Ser Tyr Gly Ile Val Met Trp Glu Val Met Ser Tyr
            820                 825                 830
Gly Glu Arg Pro Tyr Trp Asp Met Ser Asn Gln Asp Val Ile Lys Ala
        835                 840                 845
Ile Glu Glu Gly Tyr Arg Leu Pro Ala Pro Met Asp Cys Pro Ala Gly
    850                 855                 860
Leu Hi s Gln Leu Met Leu Asp Cys Trp Gln Lys Glu Arg Ala Glu Arg
865                 870                 875                 880
Pro Lys Phe Glu Gln Ile Val Gly Ile Leu Asp Lys Met Ile Arg Asn
                 885                 890                 895
Pro Asn Ser Leu Lys Thr Pro Leu Gly Thr Cys Ser Arg Pro Ile Ser
            900                 905                 910
Pro Leu Leu Asp Gln Asn Thr Pro Asp Phe Thr Thr Phe Cys Ser Val
        915                 920                 925
Gly Glu Trp Leu Gln Ala Ile Lys Met Glu Arg Tyr Lys Asp Asn Phe
    930                 935                 940
Thr Ala Ala Gly Tyr Asn Ser Leu Glu Ser Val Ala Arg Met Thr Ile
945                 950                 955                 960
Glu Asp Val Met Ser Leu Gly Ile Thr Leu Val Gly His Gln Lys Lys
                965                 970                 975
Ile Met Ser Ser Ile Gln Thr Met Arg Ala Gln Met Leu His Leu His
            980                 985                 990
Gly Thr Gly I le Gln Val
        995
 
<210>5
<211>3244
<212>DNA
<213>人(Homo sapiens)
      
<220>
<221>CDS
<222>(16)..(3075)
 
<400>5
cggcgaaagt ccagt atg tgg gtc cag ggt cac tct tct aga gct tcc gca     51
                 Met Trp Val Gln Gly His Ser Ser Arg Ala Ser Ala
                 1               5                   10
acg gaa agt gtg agt ttt tca gga att gtt cag atg gat gaa gat aca      99
Thr Glu Ser Val Ser Phe Ser Gly Ile Val Gln Met Asp Glu Asp Thr
        15                  20                  25
cat tac gat aaa gtg gaa gat gtg gtt gga agt cac ata gaa gat gca      147
His Tyr Asp Lys Val Glu Asp Val Val Gly Ser His Ile Glu Asp Ala
    30                  35                  40
gta aca ttt tgg gcc cag agt atc aat aga aat aag gat atc atg aag      195
Val Thr Phe Trp Ala Gln Ser Ile Asn Arg Asn Lys Asp Ile Met Lys
45                  50                  55                  60
att ggt tgc tca ctg tct gaa gtt tgc ccc cag gcc agt tca gtt ttg      243
Ile Gly Cys Ser Leu Ser Glu Val Cys Pro Gln Ala Ser Ser Val Leu
                65                  70                  75
ggg aat ctt gac cca aac aag att tat ggt gga tta ttt tct gaa gat    291
Gly Asn Leu Asp Pro Asn Lys Ile Tyr Gly Gly Leu Phe Ser Glu Asp
            80                  85                  90
cag tgt tgg tac aga tgc aaa gta ctg aaa atc atc agc gtt gaa aag    339
Gln Cys Trp Tyr Arg Cys Lys Val Leu Lys Ile Ile Ser Val Glu Lys
        95                  100                 105
tgt ctg gtg agg tac att gac tat gga aat act gaa att cta aat cga    387
Cys Leu Val Arg Tyr Ile Asp Tyr Gly Asn Thr Glu Ile Leu Asn Arg
    110                 115                 120
tct gat ata gtt gaa att cct ttg gag ctg cag ttt tct agt gtt gcc    435
Ser Asp Ile Val Glu Ile Pro Leu Glu Leu Gln Phe Ser Ser Val Ala
125                 130                 135                 140
aaa aag tat aaa ctt tgg gga cta cac att cct tct gat caa gaa gtt    483
Lys Lys Tyr Lys Leu Trp Gly Leu His Ile Pro Ser Asp Gln Glu Val
                145                 150                 155
acc cag ttt gat cag ggc aca acc ttt ttg ggg agc ttg att ttt gaa    531
Thr Gln Phe Asp Gln Gly Thr Thr Phe Leu Gly Ser Leu Ile Phe Glu
            160                 165                 170
aag gaa ata aaa atg aga att aaa gca acc tct gaa gat gga aca gtt    579
Lys Glu Ile Lys Met Arg Ile Lys Ala Thr Ser Glu Asp Gly Thr Val
        175                 180                 185
att gct cag gct gag tat ggc agt gtg gat ata ggg gaa gag gtg ctt    627
Ile Ala Gln Ala Glu Tyr Gly Ser Val Asp Ile Gly Glu Glu Val Leu
    190                 195                 200
aag aaa gga ttt gca gag aaa tgc aga ctt gct tcc aga act gac atc    675
Lys Lys Gly Phe Ala Glu Lys Cys Arg Leu Ala Ser Arg Thr Asp Ile
205                 210                 215                 220
tgt gag gaa aaa aaa ttg gat cct ggt caa ctt gtt ctc agg aac ctc    723
Cys Glu Glu Lys Lys Leu Asp Pro Gly Gln Leu Val Leu Arg Asn Leu
                225                 230                 235
aaa agc ccc att cct  ttg tgg gggcat aga tca aac cag tca acc ttc    771
Lys Ser Pro Ile Pro Leu Trp Gly His Arg Ser Asn Gln Ser Thr Phe
            240                 245                 250
agc agg ccc aag ggg cac tta agt gag aaa atg act ctt gac ttg aag    819
Ser Arg Pro Lys Gly His Leu Ser Glu Lys Met Thr Leu Asp Leu Lys
        255                 260                 265
gat gaa aat gat gca ggc aat ctt ata aca ttt cca aag gaa agt ttg    867
Asp Glu Asn Asp Ala Gly Asn Leu Ile Thr Phe Pro Lys Glu Ser Leu
    270                 275                 280
gct gtt ggt gac ttt aat tta ggg tct aac gtc agc ctg gaa aaa att    915
Ala Val Gly Asp Phe Asn Leu Gly Ser Asn Val Ser Leu Glu Lys Ile
285                 290                 295                 300
aag cag gac cag aaa ctg att gaa gaa aat gaa aaa ctt aaa aca gag    963
Lys Gln Asp Gln Lys Leu Ile Glu Glu Asn Glu Lys Leu Lys Thr Glu
                305                 310                 315
aag gac gct ctt ctt gaa agt tat aag gcg tta gaa ttg aaa gta gag    1011
Lys Asp Ala Leu Leu Glu Ser Tyr Lys Ala Leu Glu Leu Lys Val Glu
            320                 325                 330
cag att gcc cag gag ctg cag caa gag aag gca gct gct gtg gat ttg    1059
Gln Ile Ala Gln Glu Leu Gln Gln Glu Lys Ala Ala Ala Val Asp Leu
        335                 340                 345
act aac cac tta gaa tac act ctg aag acc tat ata gat acc aga atg    1107
Thr Asn His Leu Glu Tyr Thr Leu Lys Thr Tyr Ile Asp Thr Arg Met
    350                 335                 360
aaa aat ctg gca gct aag atg gaa ata ctg aaa gaa atg agg cat gtc    1155
Lys Asn Leu Ala Ala Lys Met Glu Ile Leu Lys Glu Met Arg His Val
365                 370                 375                 380
gac atc agt gtc cgt ttc gga aaa gac ctt tca gat gct ata caa gtg    1203
Asp Ile Ser Val Arg Phe Gly Lys Asp Leu Ser Asp Ala Ile Gln Val
                385                 390                 395
ttg gat gaa ggg tgc ttt act act cca gct tct ttg aat gga tta gag    1251
Leu Asp Glu Gly Cys Phe Thr Thr Pro Ala Ser Leu Asn Gly Leu Glu
            400                 405                 410
ata ata tgg gca gaa tac agt ctg gct cag gag aat att aaa act tgt    1299
Ile Ile Trp Ala Glu Tyr Ser Leu Ala Gln Glu Asn Ile Lys Thr Cys
        415                 420                 425
gaa tat gtg agt gaa ggg aat att ttg att gcc caa aga aat gaa atg    1347
Glu Tyr Val Ser Glu Gly Asn Ile Leu Ile Ala Gln Arg Asn Glu Met
    430                 435                 440
cag cag aag ctg tac atg tca gta gaa gat ttt att ctg gaa gtt gat    1395
Gln Gln Lys Leu Tyr Met Ser Val Glu Asp Phe Ile Leu Glu Val Asp
445                 450                 455                 460
gag tca tct ctt aat aaa cgc tta aaa aca ttg cag gat ttg tca gtc    1443
Glu Ser Ser Leu Asn Lys Arg Leu Lys Thr Leu Gln Asp Leu Ser Val
                465                 470                 475
tct tta gaa gca gtg tat gga caa gcc aaa gaa gga gca aat tct gat    1491
Ser Leu Glu Ala Val Tyr Gly Gln Ala Lys Glu Gly Ala Asn Ser Asp
            480                 485                 490
gaa ata ctt aaa aaa ttt tat gac tgg aag tgt gat aaa aga gag gag    1539
Glu Ile Leu Lys Lys Phe Tyr Asp Trp Lys Cys Asp Lys Arg Glu Glu
        495                 500                 505
ttc acc agt gtt aga agt gaa aca gac gct tct ctg cac cgt ctt gta    1587
Phe Thr Ser Val Arg Ser Glu Thr Asp Ala Ser Leu His Arg Leu Val
    510                 515                 520
gca tgg ttc caa aga acc tta aag gtt ttt gac cta tct gtg gaa gga    1635
Ala Trp Phe Gln Arg Thr Leu Lys Val Phe Asp Leu Ser Val Glu Gly
525                 530                 535                 540
tca ctg att tca gaa gac gca atg gat aat att gat gaa atc cta gag    1683
Ser Leu Ile Ser Glu Asp Ala Met Asp Asn Ile Asp Glu Ile Leu Glu
                545                 550                 555
aag act gag tca agt gtc tgc aaa gag ctg gag ata gct ctg gtt gat    1731
Lys Thr Glu Ser Ser Val Cys Lys Glu Leu Glu Ile Ala Leu Val Asp
            560                 565                 570
caa ggt gat gca gac aag gag ata att tca aat aca tat agt caa gta    1779
Gln Gly Asp Ala Asp Lys Glu Ile Ile Ser Asn Thr Tyr Ser Gln Val
        575                 580                 585
ctg caa aag att cat tca gag gaa agg ctc att gcc aca gta caa gct    1827
Leu Gln Lys Ile His Ser Glu Glu Arg Leu Ile Ala Thr Val Gln Ala
    590                 595                 600
aag tac aag gac agt att gag ttt aaa aag cag ctt att gaa tat tta    1875
Lys Tyr Lys Asp Ser Ile Glu Phe Lys Lys Gln Leu Ile Glu Tyr Leu
605                 610                 615                 620
aat aag agt ccc agt gtg gat cac ttg cta tcc att aag aag aca ttg    1923
Asn Lys Ser Pro Ser Val Asp His Leu Leu Ser Ile Lys Lys Thr Leu
                625                 630                 635
aaa agc tta aaa gct cta ctc aga tgg aaa ttg gtt gaa aag agt aat    1971
Lys Ser Leu Lys Ala Leu Leu Arg Trp Lys Leu Val Glu Lys Ser Asn
            640                 645                 650
ttg gaa gag tca gat gat cct gat ggc tct caa att gag aaa ata aaa    2019
Leu Glu Glu Ser Asp Asp Pro Asp Gly Ser Gln Ile Glu Lys Ile Lys
        655                 660                 665
gaa gaa ata act cag ctg cgc aat aat gtc ttt cag gaa att tat cat    2067
Glu Glu Ile Thr Gln Leu Arg Asn Asn Val Phe Gln Glu Ile Tyr His
    670                 675                 680
gag aga gag gaa tat gag atg cta act agt ttg gca cag aaa tgg ttc    2115
Glu Arg Glu Glu Tyr Glu Met Leu Thr Ser Leu Ala Gln Lys Trp Phe
685                 690                 695                 700
cct gag ctg cct ctg ctt cat cct gaa ata gga tta ctc aaa tac atg    2163
Pro Glu Leu Pro Leu Leu His Pro Glu Ile Gly Leu Leu Lys Tyr Met
                705                 710                 715
aac tct ggt ggt ctc ctt aca atg agc ttg gaa cga gat ctt ctt gat    2211
Asn Ser Gly Gly Leu Leu Thr Met Ser Leu Glu Arg Asp Leu Leu Asp
            720                 725                 730
gct gag ccc atg aag gaa ctt agc agc aag cgt cct ttg gta cgt tct    2259
Ala Glu Pro Met Lys Glu Leu Ser Ser Lys Arg Pro Leu Val Arg Ser
        735                 740                 745
gag gtt aat ggg cag ata att ctg tta aag ggc tat tct gtg gat gtt    2307
Glu Val Asn Gly Gln Ile Ile Leu Leu Lys Gly Tyr Ser Val Asp Val
    750                 755                 760
gac aca gaa gcc aag gtg att gag aga gca gcc acc tac cat aga gct    2355
Asp Thr Glu Ala Lys Val Ile Glu Arg Ala Ala Thr Tyr His Arg Ala
765                 770                 775                 780
tgg aga gaa gct gaa gga gac tca ggg tta ctg cca ttg ata ttc ctg    2403
Trp Arg Glu Ala Glu Gly Asp Ser Gly Leu Leu Pro Leu Ile Phe Leu
                785                 790                 795
ttt tta tgt aag tct gat cct atg gct tat ctg atg gtc cca tac tac    2451
Phe Leu Cys Lys Ser Asp Pro Met Ala Tyr Leu Met Val Pro Tyr Tyr
            800                 805                 810
cct agg gca aac ctg aat gct gtt caa gcc aac atg cct tta aat tca    2499
Pro Arg Ala Asn Leu Asn Ala Val Gln Ala Asn Met Pro Leu Asn Ser
        815                 820                 825
gaa gaa act tta aag gtc atg aaa ggt gtt gcc cag ggt ctg cat aca    2547
Glu Glu Thr Leu Lys Val Met Lys Gly Val Ala Gln Gly Leu His Thr
    830                 835                 840
ttg cat aag gct gac ata att cat gga tca ctt cat cag aac aat gta    2595
Leu His Lys Ala Asp Ile Ile His Gly Ser Leu His Gln Asn Asn Val
845                 850                 855                 860
ttt gct tta aac cgt gaa caa gga att gtt gga gat ttt gac ttc acc    2643
Phe Ala Leu Asn Arg Glu Gln Gly Ile Val Gly Asp Phe Asp Phe Thr
                865                 870                 875
aaa tct gtg agt cag cga gcc tcg gtg aac atg atg gtt ggt gac ttg    2691
Lys Ser Val Ser Gln Arg Ala Ser Val Asn Met Met Val Gly Asp Leu
            880                 885                 890
agt ttg atg tca cct gag ttg aaa atg gga aaa cct gct tct cca ggt    2739
Ser Leu Met Ser Pro Glu Leu Lys Met Gly Lys Pro Ala Ser Pro Gly
        895                 900                 905
tca gac tta tat gct tat ggc tgc ctc tta tta tgg ctt tct gtt caa    2787
Ser Asp Leu Tyr Ala Tyr Gly Cys Leu Leu Leu Trp Leu Ser Val Gln
    910                 915                 920
aat cag gag ttt gag ata aat aaa gat gga ate ccc aaa gtg gat cag      2835
Asn Gln Glu Phe Glu Ile Asn Lys Asp Gly Ile Pro Lys Val Asp Gln
925                 930                 935                 940
ttt cat ctg gat gat aaa gtc aaa tcc ctc ctc tgt agc ttg ata tgt      2883
Phe His Leu Asp Asp Lys Val Lys Ser Leu Leu Cys Ser Leu Ile Cys
                945                 950                 955
tat aga agt tca atg act gct gaa caa gtt tta aat gct gaa tgt ttc      2931
Tyr Arg Ser Ser Met Thr Ala Glu Gln Val Leu Asn Ala Glu Cys Phe
            960                 965                 970
ttg atg cca aag gag caa tca gtt cca aac cca gaa aaa gat act gaa      2979
Leu Met Pro Lys Glu Gln Ser Val Pro Asn Pro Glu Lys Asp Thr Glu
        975                 980                 985
tac acc cta tat aaa aag gaa gaa gaa ata aag acg gag aac ttg gat      3027
Tyr Thr Leu Tyr Lys Lys Glu Glu Glu Ile Lys Thr Glu Asn Leu Asp
    990                 995                 1000
aaa tgt atg gag aag aca aga aat ggt gaa gcc aac ttt gat tgt          3072
Lys Cys Met Glu Lys Thr Arg Asn Gly Glu Ala Asn Phe Asp Cys
1005                1010                1015
taa attattattg ttgttgttgc agaggttctt tttaaaaact ttgtttggtt           3125
tggttaatac acagaaatat ctagaaatgt tctgggacta gttgagttgt atctttagta    3185
ttcaggttgt gaaaaataaa gatgtttggc tatgcaaaaa aaaaaaaaaa aaaaaaagg     3244
 
<210>6
<211>1019
<212>PRT
<213>人(Homo sapiens)
 
<400>6
 
Met Trp Val Gln Gly His Ser Ser Arg Ala Ser Ala Thr Glu Ser Val
1               5                   10                  15
Ser Phe Ser Gly Ile Val Gln Met Asp Glu Asp Thr His Tyr Asp Lys
            20                  25                  30
Val Glu Asp Val Val Gly Ser His Ile Glu Asp Ala Val Thr Phe Trp
        35                  40                  45
Ala Gln Ser Ile Asn Arg Asn Lys Asp Ile Met Lys Ile Gly Cys Ser
    50                  55                  60
Leu Ser Glu Val Cys Pro Gln Ala Ser Ser Val Leu Gly Asn Leu Asp
65                  70                  75                  80
Pro Asn Lys Ile Tyr Gly Gly Leu Phe Ser Glu Asp Gln Cys Trp Tyr
                85                  90                  95
Arg Cys Lys Val Leu Lys Ile Ile Ser Val Glu Lys Cys Leu Val Arg
            100                 105                 110
Tyr Ile Asp Tyr Gly Asn Thr Glu Ile Leu Asn Arg Ser Asp Ile Val
        115                 120                 125
Glu Ile Pro Leu Glu Leu Gln Phe Ser Ser Val Ala Lys Lys Tyr Lys
    130                 135                 140
Leu Trp Gly Leu His Ile Pro Ser Asp Gln Glu Val Thr Gln Phe Asp
145                 150                 155                 160
Gln Gly Thr Thr Phe Leu Gly Ser Leu Ile Phe Glu Lys Glu Ile Lys
                165                 170                 175
Met Arg Ile Lys Ala Thr Ser Glu Asp Gly Thr Val Ile Ala Gln Ala
            180                 185                 190
Glu Tyr Gly Ser Val Asp Ile Gly Glu Glu Val Leu Lys Lys Gly Phe
        195                 200                 205
Ala Glu Lys Cys Arg Leu Ala Ser Arg Thr Asp Ile Cys Glu Glu Lys
    210                 215                 220
Lys Leu Asp Pro Gly Gln Leu Val Leu Arg Asn Leu Lys Ser Pro Ile
225                 230                 235                 240
Pro Leu Trp Gly His Arg Ser Asn Gln Ser Thr Phe Ser Arg Pro Lys
                245                 250                 255
Gly His Leu Ser Glu Lys Met Thr Leu Asp Leu Lys Asp Glu Asn Asp
            260                 265                 270
Ala Gly Asn Leu Ile Thr Phe Pro Lys Glu Ser Leu Ala Val Gly Asp
        275                 280                 285
Phe Asn Leu Gly Ser Asn Val Ser Leu Glu Lys Ile Lys Gln Asp Gln
    290                 295                 300
Lys Leu Ile Glu Glu Asn Glu Lys Leu Lys Thr Glu Lys Asp Ala Leu
305                 310                 315                 320
Leu Glu Ser Tyr Lys Ala Leu Glu Leu Lys Val Glu Gln Ile Ala Gln
                325                 330                 335
Glu Leu Gln Gln Glu Lys Ala Ala Ala Val Asp Leu Thr Asn His Leu
           340                 345                 350
Glu Tyr Thr Leu Lys Thr Tyr Ile Asp Thr Arg Met Lys Asn Leu Ala
        355                 360                 365
Ala Lys Met Glu Ile Leu Lys Glu Met Arg His Val Asp Ile Ser Val
    370                 375                 380
Arg Phe Gly Lys Asp Leu Ser Asp Ala Ile Gln Val Leu Asp Glu Gly
385                 390                 395                 400
Cys Phe Thr Thr Pro Ala Ser Leu Asn Gly Leu Glu Ile Ile Trp Ala
                405                 410                 415
Glu Tyr Ser Leu Ala Gln Glu Asn Ile Lys Thr Cys Glu Tyr Val Ser
            420                 425                 430
Glu Gly Asn Ile Leu Ile Ala Gln Arg Asn Glu Met Gln Gln Lys Leu
        435                 440                 445
Tyr Met Ser Val Glu Asp Phe Ile Leu Glu Val Asp Glu Ser Ser Leu
    450                 455                 460
Asn Lys Arg Leu Lys Thr Leu Gln Asp Leu Ser Val Ser Leu Glu Ala
465                 470                 475                 480
Val Tyr Gly Gln Ala Lys Glu Gly Ala Asn Ser Asp Glu Ile Leu Lys
                485                 490                 495
Lys Phe Tyr Asp Trp Lys Cys Asp Lys Arg Glu Glu Phe Thr Ser Val
            500                 505                 510
Arg Ser Glu Thr Asp Ala Ser Leu His Arg Leu Val Ala Trp Phe Gln
        515                 520                 525
Arg Thr Leu Lys Val Phe Asp Leu Ser Val Glu Gly Ser Leu Ile Ser
    530                 535                 540
Glu Asp Ala Met Asp Asn Ile Asp Glu Ile Leu Glu Lys Thr Glu Ser
545                 550                 555                 560
Ser Val Cys Lys Glu Leu Glu Ile Ala Leu Val Asp Gln Gly Asp Ala
                565                 570                 575
Asp Lys Glu Ile Ile Ser Asn Thr Tyr Ser Gln Val Leu Gln Lys Ile
            580                 585                 590
His Ser Glu Glu Arg Leu Ile Ala Thr Val Gln Ala Lys Tyr Lys Asp
        595                 600                 605
Ser Ile Glu Phe Lys Lys Gln Leu Ile Glu Tyr Leu Asn Lys Ser Pro
    610                 615                 620
Ser Val Asp His Leu Leu Ser Ile Lys Lys Thr Leu Lys Ser Leu Lys
625                 630                 635                 640
Ala Leu Leu Arg Trp Lys Leu Val Glu Lys Ser Asn Leu Glu Glu Ser
                645                 650                 655
Asp Asp Pro Asp Gly Ser Gln Ile Glu Lys Ile Lys Glu Glu Ile Thr
            660                 665                 670
Gln Leu Arg Asn Asn Val Phe Gln Glu Ile Tyr His Glu Arg Glu Glu
        675                 680                 685
Tyr Glu Met Leu Thr Ser Leu Ala Gln Lys Trp Phe Pro Glu Leu Pro
    690                 695                 700
Leu Leu His Pro Glu Ile Gly Leu Leu Lys Tyr Met Asn Ser Gly Gly
705                 710                 715                 720
Leu Leu Thr Met Ser Leu Glu Arg Asp Leu Leu Asp Ala Glu Pro Met
                725                 730                 735
Lys Glu Leu Ser Ser Lys Arg Pro Leu Val Arg Ser Glu Val Asn Gly
            740                 745                 750
Gln Ile Ile Leu Leu Lys Gly Tyr Ser Val Asp Val Asp Thr Glu Ala
        755                 760                 765
Lys Val Ile Glu Arg Ala Ala Thr Tyr His Arg Ala Trp Arg Glu Ala
    770                 775                 780
Glu Gly Asp Ser Gly Leu Leu Pro Leu Ile Phe Leu Phe Leu Cys Lys
785                 790                 795                 800
Ser Asp Pro Met Ala Tyr Leu Met Val Pro Tyr Tyr Pro Arg Ala Asn
                805                 810                 815
Leu Asn Ala Val Gln Ala Asn Met Pro Leu Asn Ser Glu Glu Thr Leu
            820                 825                 830
Lys Val Met Lys Gly Val Ala Gln Gly Leu His Thr Leu His Lys Ala
        835                 840                 845
Asp Ile Ile His Gly Ser Leu His Gln Asn Asn Val Phe Ala Leu Asn
    850                 855                 860
Arg Glu Gln Gly Ile Val Gly Asp Phe Asp Phe Thr Lys Ser Val Ser
865                 870                 875                 880
Gln Arg Ala Ser Val Asn Met Met Val Gly Asp Leu Ser Leu Met Ser
                885                 890                 895
Pro Glu Leu Lys Met Gly Lys Pro Ala Ser Pro Gly Ser Asp Leu Tyr
            900                 905                 910
Ala Tyr Gly Cys Leu Leu Leu Trp Leu Ser Val Gln Asn Gln Glu Phe
        915                 920                 925
Glu Ile Asn Lys Asp Gly Ile Pro Lys Val Asp Gln Phe His Leu Asp
    930                 935                 940
Asp Lys Val Lys Ser Leu Leu Cys Ser Leu Ile Cys Tyr Arg Ser Ser
945                 950                 955                 960
Met Thr Ala Glu Gln Val Leu Asn Ala Glu Cys Phe Leu Met Pro Lys
                965                 970                 975
Glu Gln Ser Val Pro Asn Pro Glu Lys Asp Thr Glu Tyr Thr Leu Tyr
            980                 985                 990
Lys Lys Glu Glu Glu Ile Lys Thr Glu Asn Leu Asp Lys Cys Met Glu
        995                 1000                1005
Lys Thr  Arg Asn Gly Glu Ala  Asn Phe Asp Cys
    1010                 1015
 
<210>7
<211>4734
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(79)..(3468)
 
<400>7
gcgagccgaa gcgcgggaag cagctcttgt ggatcctcag tggcggaggc tcggtcaccc    60
ggataggtaa aggaaaac atg cct gcc aca cgg aag cca atg aga tat ggg      111
                    Met Pro Ala Thr Arg Lys Pro Met Arg Tyr Gly
                    1               5                   10
cat aca gag gga cac acg gag gtc tgt ttt gat gat tct ggg agt ttt      159
His Thr Glu Gly His Thr Glu Val Cys Phe Asp Asp Ser Gly Ser Phe
            15                  20                  25
att gtg act tgt gga agt gat ggt gat gtg agg att tgg gaa gac ttg      207
Ile Val Thr Cys Gly Ser Asp Gly Asp Val Arg Ile Trp Glu Asp Leu
        30                  35                  40
gat gat gat gat cct aag ttc att aat gtt gga gaa aag gca tat tca      255
Asp Asp Asp Asp Pro Lys Phe Ile Asn Val Gly Glu Lys Ala Tyr Ser
    45                  50                  55
tgt gct ttg aag agt gga aaa ctg gtc act gca gtt tct aat aat act      303
Cys Ala Leu Lys Ser Gly Lys Leu Val Thr Ala Val Ser Asn Asn Thr
60                  65                  70                  75
att caa gtc cac aca ttt cct gaa gga gtt cca gat ggt ata ttg act      351
Ile Gln Val His Thr Phe Pro Glu Gly Val Pro Asp Gly Ile Leu Thr
                80                  85                  90
cgc ttc act aca aat gca aac cat gtg gtc ttt aat ggg gat ggt act      399
Arg Phe Thr Thr Asn Ala Asn His Val Val Phe Asn Gly Asp Gly Thr
            95                  100                 105
aaa att gct gct gga tct agt gat ttt cta gtc aaa att gtg gat gtg      447
Lys Ile Ala Ala Gly Ser Ser Asp Phe Leu Val Lys Ile Val Asp Val
        110                 115                 120
atg gat agc agc caa cag aaa aca ttt cga gga cat gat gcc cct gtt      495
Met Asp Ser Ser Gln Gln Lys Thr Phe Arg Gly His Asp Ala Pro Val
    125                 130                 135
tta agt ctt tcc ttt gat cct aag gac atc ttt ctg gca tea gct agt      543
Leu Ser Leu Ser Phe Asp Pro Lys Asp Ile Phe Leu Ala Ser Ala Ser
140                 145                 150                 155
tgt gat gga tct gtc aga gtg tgg caa att tca gat cag aca tgt gct      591
Cys Asp Gly Ser Val Arg Val Trp Gln Ile Ser Asp Gln Thr Cys Ala
                160                 165                 170
att agt tgg cca ctg cta caa aaa tgc aac gat gtg ata aat gca aaa      639
Ile Ser Trp Pro Leu Leu Gln Lys Cys Asn Asp Val Ile Asn Ala Lys
            175                 180                 185
tca atc tgc aga ctt gct tgg cag cca aaa agt ggg aag tta ctg gca       687
Ser Ile Cys Arg Leu Ala Trp Gln Pro Lys Ser Gly Lys Leu Leu Ala
        190                 195                 200
att cct gtg gaa aaa tct gtt aag cta tat aga aga gaa tct tgg agt       735
Ile Pro Val Glu Lys Ser Val Lys Leu Tyr Arg Arg Glu Ser Trp Ser
    205                 210                 215
cat caa ttt gat ctt tca gat aat ttc atc tct cag acc ctc aat ata       783
His Gln Phe Asp Leu Ser Asp Asn Phe Ile Ser Gln Thr Leu Asn Ile
220                 225                 230                 235
gta acc tgg tct ccc tgt ggg caa tat tta gct gca ggt agt att aat       831
Val Thr Trp Ser Pro Cys Gly Gln Tyr Leu Ala Ala Gly Ser Ile Asn
                240                 245                 250
ggt cta atc ata gtt tgg aat gtg gaa acc aaa gac tgc atg gaa agg       879
Gly Leu Ile Ile Val Trp Asn Val Glu Thr Lys Asp Cys Met Glu Arg
            255                 260                 265
gtg aaa cat gag aaa ggt tat gca att tgt ggt ctg gca tgg cat cct       927
Val Lys His Glu Lys Gly Tyr Ala Ile Cys Gly Leu Ala Trp His Pro
        270                 275                 280
act tgt ggt cga ata tcg tat act gat gcg gaa gga aat cta ggg ctt       975
Thr Cys Gly Arg Ile Ser Tyr Thr Asp Ala Glu Gly Asn Leu Gly Leu
    285                 290                 295
cta gag aat gtt tgt gac ccc agt gga aag aca tca agc agt aag gta       1023
Leu Glu Asn Val Cys Asp Pro Ser Gly Lys Thr Ser Ser Ser Lys Val
300                 305                 310                 315
tct agc aga gtg gaa aag gat tat aat gat ctt ttt gat gga gat gat       1071
Ser Ser Arg Val Glu Lys Asp Tyr Asn Asp Leu Phe Asp Gly Asp Asp
                320                 325                 330
atg agt aat gct ggt gat ttt cta aat gac aat gca gtt gag atc cct       1119
Met Ser Asn Ala Gly Asp Phe Leu Asn Asp Asn Ala Val Glu Ile Pro
            335                 340                 345
tct ttt tca aaa ggg att ata aat gat gat gag gat gat gaa gac ctc       1167
Ser Phe Ser Lys Gly Ile Ile Asn Asp Asp Glu Asp Asp Glu Asp Leu
        350                 355                 360
atg atg gct tca ggt cgt cct aga cag cga agt cac atc cta gaa gat       1215
Met Met Ala Ser Gly Arg Pro Arg Gln Arg Ser His Ile Leu Glu Asp
    365                 370                 375
gat gaa aac tca gtt gat att tca atg cta aaa act ggt tct agt ctt       1263
Asp Glu Asn Ser Val Asp Ile Ser Met Leu Lys Thr Gly Ser Ser Leu
380                 385                 390                 395
ctc aaa gag gag gag gaa gat ggt caa gaa ggc agc att cac aat cta       1311
Leu Lys Glu Glu Glu Glu Asp Gly Gln Glu Gly Ser Ile His Asn Leu
                400                 405                 410
cca ctt gta aca tcc caa agg cca ttt tat gat gga ccc atg cca act       1359
Pro Leu Val Thr Ser Gln Arg Pro Phe Tyr Asp Gly Pro Met Pro Thr
            415                 420                 425
ccc cgg caa aag cca ttt cag tca ggt tct aca ccg ttg cat ctc act       1407
Pro Arg Gln Lys Pro Phe Gln Ser Gly Ser Thr Pro Leu His Leu Thr
        430                 435                 440
cac aga ttc atg gtg tgg aac tct att gga att att cgc tgc tat aat       1455
His Arg Phe Met Val Trp Asn Ser Ile Gly Ile Ile Arg Cys Tyr Asn
    445                 450                 455
gat gag caa gac aat gcc ata gat gtg gag ttc cat gat acc tcc ata       1503
Asp Glu Gln Asp Asn Ala Ile Asp Val Glu Phe His Asp Thr Ser Ile
460                 465                 470                 475
cac cat gca aca cac tta tca aac act ttg aat tat aca ata gca gat       1551
His His Ala Thr His Leu Ser Asn Thr Leu Asn Tyr Thr Ile Ala Asp
                480                 485                 490
ctt tcc cac gaa gct att ttg ttg gca tgt gaa agc act gat gaa cta       1599
Leu Ser His Glu Ala Ile Leu Leu Ala Cys Glu Ser Thr Asp Glu Leu
            495                 500                 505
gca agc aag ctt cac tgc ctg cac ttt agt tct tgg gat tca agc aaa       1647
Ala Ser Lys Leu His Cys Leu His Phe Ser Ser Trp Asp Ser Ser Lys
       510                 515                 520
gag tgg ata ata gac ttg cct cag aat gag gat att gaa gcc ata tgt       1695
Glu Trp Ile Ile Asp Leu Pro Gln Asn Glu Asp Ile Glu Ala Ile Cys
    525                 530                 535
ctc ggt caa gga tgg gct gct gcc gct act agt gcc ctg ctt ctt cga       1743
Leu Gly Gln Gly Trp Ala Ala Ala Ala Thr Ser Ala Leu Leu Leu Arg
540                 545                 550                 555
ttg ttt act att gga ggg gtt caa aaa gag gta ttc agc ctt gct gga       1791
Leu Phe Thr Ile Gly Gly Val Gln Lys Glu Val Phe Ser Leu Ala Gly
                560                 565                 570
cct gtg gtg tca atg gca gga cat gga gaa cag ctt ttc att gtt tat       1839
Pro Val Val Ser Met Ala Gly His Gly Glu Gln Leu Phe Ile Val Tyr
            575                 580                 585
cac aga ggt aca gga ttt gat ggg gat cag tgc ctt gga gtt caa ctg       1887
His Arg Gly Thr Gly Phe Asp Gly Asp Gln Cys Leu Gly Val Gln Leu
        590                 595                 600
cta gag ctg ggg aaa aag aaa aaa caa att ttg cat ggt gac cct ctt       1935
Leu Glu Leu Gly Lys Lys Lys Lys Gln Ile Leu His Gly Asp Pro Leu
    605                 610                 615
cct ctt aca agg aaa tcc tac ctt gca tgg att ggg ttt tca gct gaa       1983
Pro Leu Thr Arg Lys Ser Tyr Leu Ala Trp Ile Gly Phe Ser Ala Glu
620                 625                 630                 635
ggt acc cct tgt tac gtg gat tca gaa gga att gtt cga atg ctt aac       2031
Gly Thr Pro Cys Tyr Val Asp Ser Glu Gly Ile Val Arg Met Leu Asn
                640                 645                 650
aga gga ctt ggt aat acg tgg act cct ata tgt aat aca aga gag cac       2079
Arg Gly Leu Gly Asn Thr Trp Thr Pro Ile Cys Asn Thr Arg Glu His
            655                 660                 665
tgc aaa gga aaa tct gat cac tac tgg gtg gtt ggt atc cat gaa aat       2127
Cys Lys Gly Lys Ser Asp His Tyr Trp Val Val Gly Ile His Glu Asn
        670                 675                 680
ccc cag caa cta agg tgc att cct tgt aaa ggt tct cgg ttt ccc cca       2175
Pro Gln Gln Leu Arg Cys Ile Pro Cys Lys Gly Ser Arg Phe Pro Pro
    685                 690                 695
acc ctt cca cgc cct gct gtt gct ata tta tcc ttt aag ctt cct tac       2223
Thr Leu Pro Arg Pro Ala Val Ala Ile Leu Ser Phe Lys Leu Pro Tyr
700                 705                 710                 715
tgt cag att gca aca gag aaa gga caa atg gag gag caa ttt tgg cgt       2271
Cys Gln Ile Ala Thr Glu Lys Gly Gln Met Glu Glu Gln Phe Trp Arg
                720                 725                 730
tca gtt ata ttt cac aac cac ctt gat tat tta gct aaa aat ggt tat       2319
Ser Val Ile Phe His Asn His Leu Asp Tyr Leu Ala Lys Asn Gly Tyr
            735                 740                 745
gaa tat gaa gag agc act aaa aat caa gca aca aaa gag caa cag gaa       2367
Glu Tyr Glu Glu Ser Thr Lys Asn Gln Ala Thr Lys Glu Gln Gln Glu
        750                 755                 760
ctt tta atg aaa atg ctt gcg ctt tct tgt aaa ctg gag cga gaa ttc       2415
Leu Leu Met Lys Met Leu Ala Leu Ser Cys Lys Leu Glu Arg Glu Phe
    765                 770                 775
cgt tgt gtg gaa ctt gct gat cta atg act caa aat gct gtg aat tta       2463
Arg Cys Val Glu Leu Ala Asp Leu Met Thr Gln Asn Ala Val Asn Leu
780                 785                 790                 795
gcc att aaa tat gct tct cgc tct cgg aaa tta ata ctg gct caa aaa       2511
Ala Ile Lys Tyr Ala Ser Arg Ser Arg Lys Leu Ile Leu Ala Gln Lys
                800                 805                 810
cta agt gaa ctg gct gta gag aag gca gcc gaa ttg aca gca acc cag       2559
Leu Ser Glu Leu Ala Val Glu Lys Ala Ala Glu Leu Thr Ala Thr Gln
            815                 820                 825
gtg gaa gag gaa gaa gaa gaa gaa gat ttc aga aaa aag ctg aat gct       2607
Val Glu Glu Glu Glu Glu Glu Glu Asp Phe Arg Lys Lys Leu Asn Ala
        830                 835                 840
ggt tac agc aat act gct aca gag tgg agc caa cca agg ttc aga aat       2655
Gly Tyr Ser Asn Thr Ala Thr Glu Trp Ser Gln Pro Arg Phe Arg Asn
    845                 850                 855
caa gtt gaa gaa gat gct gag gac agt gga gaa gct gat gat gaa gaa       2703
Gln Val Glu Glu Asp Ala Glu Asp Ser Gly Glu Ala Asp Asp Glu Glu
860                 865                 870                 875
aaa cca gaa ata cat aag cct gga cag aac tcg ttt tcc aaa agt aca       2751
Lys Pro Glu Ile His Lys Pro Gly Gln Asn Ser Phe Ser Lys Ser Thr
                880                 885                 890
aat tcc tct gat gtt tca gct aag tca ggt gca gtt acc ttt agc agc       2799
Asn Ser Ser Asp Val Ser Ala Lys Ser Gly Ala Val Thr Phe Ser Ser
            895                 900                 905
caa gga cga gta aat ccc ttt aag gta tca gcc agt tcc aaa gaa cca       2847
Gln Gly Arg Val Asn Pro Phe Lys Val Ser Ala Ser Ser Lys Glu Pro
        910                 915                 920
gcc atg tca atg aat tca gca cgt tca act aat att tta gac aat atg       2895
Ala Met Ser Met Asn Ser Ala Arg Ser Thr Asn Ile Leu Asp Asn Met
    925                 930                 935
ggc aaa tca tcc aag aaa tcc act gca ctt agt cga act aca aat aat       2943
Gly Lys Ser Ser Lys Lys Ser Thr Ala Leu Ser Arg Thr Thr Asn Asn
940                 945                 950                 955
gaa aag tct ccc att ata aag cct ctg att cca aag ccg aag cct aag       2991
Glu Lys Ser Pro Ile Ile Lys Pro Leu Ile Pro Lys Pro Lys Pro Lys
                960                 965                 970
cag gca tct gca gca tcc tat ttc cag aaa aga aat tct caa act aat       3039
Gln Ala Ser Ala Ala Ser Tyr Phe Gln Lys Arg Asn Ser Gln Thr Asn
            975                 980                 985
aaa act gag gaa gtg aaa gaa gaa aat ctt aaa aat gta  tta tct gaa      3087
Lys Thr Glu Glu Val Lys Glu Glu Asn Leu Lys Asn Val  Leu Ser Glu
        990                 995                 1000
acc cca gct ata tgt cct cct caa aac act gaa aac caa agg cca           3132
Thr Pro Ala Ile Cys Pro Pro Gln Asn Thr Glu Asn Gln Arg Pro
    1005                1010                1015
aag acc ggg ttc cag atg tgg tta gaa gaa aat aga agt aat att           3177
Lys Thr Gly Phe Gln Met Trp Leu Glu Glu Asn Arg Ser Asn Ile
    1020                1025                1030
ttg tct gac aat cct gac ttt tca gat gaa gca gac ata ata aaa           3222
Leu Ser Asp Asn Pro Asp Phe Ser Asp Glu Ala Asp Ile Ile Lys
    1035                1040                1045
gaa gga atg att cga ttt aga gta ttg tca act gaa gaa aga aag           3267
Glu Gly Met Ile Arg Phe Arg Val Leu Ser Thr Glu Glu Arg Lys
    1050                1055                1060
gtg tgg gct aac aaa gcc aaa gga gaa acg gca agt gaa gga act           3312
Val Trp Ala Asn Lys Ala Lys Gly Glu Thr Ala Ser Glu Gly Thr
    1065                1070                1075
gaa gca aag aag cga aaa cgt gtg gtt gat gaa agt gat gaa aca           3357
Glu Ala Lys Lys Arg Lys Arg Val Val Asp Glu Ser Asp Glu Thr
    1080                1085                1090
gaa aac cag gaa gaa aaa gca aaa gag aac ctg aat ttg tct aaa           3402
Glu Asn Gln Glu Glu Lys Ala Lys Glu Asn Leu Asn Leu Ser Lys
    1095                1100                1105
aag cag aaa cct tta gat ttt tct aca aat cag aaa cta tca gct           3447
Lys Gln Lys Pro Leu Asp Phe Ser Thr Asn Gln Lys Leu Ser Ala
    1110                1115                1120
ttt gca ttt aag cag gag taa aggaagaaag tgaccctagg gaagtaatgg          3498
Phe Ala Phe Lys Gln Glu
    1125
attttttttt actcatcttt gaatatagac tcgagtcttt gggaaactca ttatatatat     3558
attttttaaa gagtttgaag caactgtttg tctttataag ataatgtagt aattatattg     3618
gtgtaggtaa caggacatat gtaaaaacta tcatctttgc agattactct gcctccaaat     3678
gcagggcctt tcagagatgc attgtgattg taattactga gttgaagctc caaccaattt     3738
gaatttgttt cttaaccttg aaaaatcatt aaagccaagg tattaaaacc tttgtgcatt     3798
aataccttct aggggtttgg ttcatttggt ttttgtcatg tgcaaggaag gacaatagtc     3858
ctctttccaa gtgtgttagc atagacttct ctatatgttt ctactagacc taggggatga     3918
cgtcttttaa taatactggc cctaaacatg taaataatct tgtaggtgag actttttctt     3978
ttgtgtttcg gaaatttcct atgtggcttt cagttgtctg tttgtatagc ctggattttt     4038
ttgaggtaaa tgaaactttc tcatttgtat atttggcttg atatggtctt aatattatct     4098
ttccacgaaa tggatatatt tctagaaaat atatatttac taccataatt tctaccacca     4158
cccccatttt gctctgcatt atacacagta gagaagaact gaagacactg ctgtgacagt     4218
attgcagtcc aaggcatcat gtgctcttgg tgggatactc tgattatcag catcaacagt     4278
actttactga gcaagacttt gaaggcctga gaagagagca aagttatgga aagtatttaa     4338
ctcttatttt atattgaaca aacaaggttt aatcatgtca tacatttttg gttttctaag     4398
cagagactaa tacaaatgca gccacataaa ggcagtgtac tgggggtggg agggaaggaa     4458
acaatcacat aaaatcagct gactcaaaat tgaggatagt taataggttg aaagggaaaa     4518
agtatgttga aaatttagac ataaatgaac caagaatatt ccttatctgg tgatgattaa     4578
agttaggaaa acatacattt tttatttttt aattagtagc tgctatcaga gacattatag     4638
cacagtggtt atgagcacag attccaaagc cagattacct aggttcggag acccgcttct     4698
ctacctacta ctaatagttg ggtcatgttg ggccgg                               4734
 
<210>8
<211>1129
<212>PRT
<213>人(Homo sapiens)
 
<400>8
 
Met Pro Ala Thr Arg Lys Pro Met Arg Tyr Gly His Thr Glu Gly His
l           5                       10                  15
Thr Glu Val Cys Phe Asp Asp Ser Gly Ser Phe Ile Val Thr Cys Gly
            20                  25                  30
Ser Asp Gly Asp Val Arg Ile Trp Glu Asp Leu Asp Asp Asp Asp Pro
        35                  40                  45
Lys Phe Ile Asn Val Gly Glu Lys Ala Tyr Ser Cys Ala Leu Lys Ser
    50                  55                  60
Gly Lys Leu Val Thr Ala Val Ser Asn Asn Thr Ile Gln Val His Thr
65                  70                  75                  80
Phe Pro Glu Gly Val Pro Asp Gly Ile Leu Thr Arg Phe Thr Thr Asn
                85                  90                  95
Ala Asn His Val Val Phe Asn Gly Asp Gly Thr Lys Ile Ala Ala Gly
            100                 105                 110
Ser Ser Asp Phe Leu Val Lys Ile Val Asp Val Met Asp Ser Ser Gln
        115                 120                 125
Gln Lys Thr Phe Arg Gly His Asp Ala Pro Val Leu Ser Leu Ser Phe
    130                 135                 140
Asp Pro Lys Asp Ile Phe Leu Ala Ser Ala Ser Cys Asp Gly Ser Val
145                 150                 155                 160
Arg Val Trp Gln Ile Ser Asp Gln Thr Cys Ala Ile Ser Trp Pro Leu
                165                 170                 175
Leu Gln Lys Cys Asn Asp Val Ile Asn Ala Lys Ser Ile Cys Arg Leu
            180                 185                 190
Ala Trp Gln Pro Lys Ser Gly Lys Leu Leu Ala Ile Pro Val Glu Lys
       195                 200                 205
Ser Val Lys Leu Tyr Arg Arg Glu Ser Trp Ser His Gln Phe Asp Leu
    210                 215                 220
Ser Asp Asn Phe Ile Ser Gln Thr Leu Asn Ile Val Thr Trp Ser Pro
225                 230                 235                 240
Cys Gly Gln Tyr Leu Ala Ala Gly Ser Ile Asn Gly Leu Ile Ile Val
                245                 250                 255
Trp Asn Val Glu Thr Lys Asp Cys Met Glu Arg Val Lys His Glu Lys
            260                 265                 270
Gly Tyr Ala Ile Cys Gly Leu Ala Trp His Pro Thr Cys Gly Arg Ile
        275                 280                 285
Ser Tyr Thr Asp Ala Glu Gly Asn Leu Gly Leu Leu Glu Asn Val Cys
    290                 295                 300
Asp Pro Ser Gly Lys Thr Ser Ser Ser Lys Val Ser Ser Arg Val Glu
305                 310                 315                 320
Lys Asp Tyr Asn Asp Leu Phe Asp Gly Asp Asp Met Ser Asn Ala Gly
                325                 330                 335
Asp Phe Leu Asn Asp Asn Ala Val Glu Ile Pro Ser Phe Ser Lys Gly
            340                 345                 350
Ile Ile Asn Asp Asp Glu Asp Asp Glu Asp Leu Met Met Ala Ser Gly
        355                 360                 365
Arg Pro Arg Gln Arg Ser His Ile Leu Glu Asp Asp Glu Asn Ser Val
    370                 375                 380
Asp Ile Ser Met Leu Lys Thr Gly Ser Ser Leu Leu Lys Glu Glu Glu
385                 390                 395                 400
Glu Asp Gly Gln Glu Gly Ser Ile His Asn Leu Pro Leu Val Thr Ser
                405                 410                 415
Gln Arg Pro Phe Tyr Asp Gly Pro Met Pro Thr Pro Arg Gln Lys Pro
            420                 425                 430
Phe Gln Ser Gly Ser Thr Pro Leu His Leu Thr His Arg Phe Met Val
        435                 440                 445
Trp Asn Ser Ile Gly Ile Ile Arg Cys Tyr Asn Asp Glu Gln Asp Asn
    450                 455                 460
Ala Ile Asp Val Glu Phe His Asp Thr Ser Ile His His Ala Thr His
465                 470                 475                 480
Leu Ser Asn Thr Leu Asn Tyr Thr Ile Ala Asp Leu Ser His Glu Ala
               485                 490                 495
Ile Leu Leu Ala Cys Glu Ser Thr Asp Glu Leu Ala Ser Lys Leu His
            500                 505                 510
Cys Leu His Phe Ser Ser Trp Asp Ser Ser Lys Glu Trp Ile Ile Asp
        515                 520                 525
Leu Pro Gln Asn Glu Asp Ile Glu Ala Ile Cys Leu Gly Gln Gly Trp
    530                 535                 540
Ala Ala Ala Ala Thr Ser Ala Leu Leu Leu Arg Leu Phe Thr Ile Gly
545                 550                 555                 560
Gly Val Gln Lys Glu Val Phe Ser Leu Ala Gly Pro Val Val Ser Met
                565                 570                 575
Ala Gly His Gly Glu Gln Leu Phe Ile Val Tyr His Arg Gly Thr Gly
            580                 585                 590
Phe Asp Gly Asp Gln Cys Leu Gly Val Gln Leu Leu Glu Leu Gly Lys
        595                 600                 605
Lys Lys Lys Gln Ile Leu His Gly Asp Pro Leu Pro Leu Thr Arg Lys
    610                 615                 620
Ser Tyr Leu Ala Trp Ile Gly Phe Ser Ala Glu Gly Thr Pro Cys Tyr
625                 630                 635                 640
Val Asp Ser Glu Gly Ile Val Arg Met Leu Asn Arg Gly Leu Gly Asn
                645                 650                 655
Thr Trp Thr Pro Ile Cys Asn Thr Arg Glu His Cys Lys Gly Lys Ser
            660                 665                 670
Asp His Tyr Trp Val Val Gly Ile His Glu Asn Pro Gln Gln Leu Arg
        675                 680                 685
Cys Ile Pro Cys Lys Gly Ser Arg Phe Pro Pro Thr Leu Pro Arg Pro
    690                 695                 700
Ala Val Ala Ile Leu Ser Phe Lys Leu Pro Tyr Cys Gln Ile Ala Thr
705                 710                 715                 720
Glu Lys Gly Gln Met Glu Glu Gln Phe Trp Arg Ser Val Ile Phe His
                725                 730                 735
Asn His Leu Asp Tyr Leu Ala Lys Asn Gly Tyr Glu Tyr Glu Glu Ser
            740                 745                 750
Thr Lys Asn Gln Ala Thr Lys Glu Gln Gln Glu Leu Leu Met Lys Met
        755                 760                 765
Leu Ala Leu Ser Cys Lys Leu Glu Arg Glu Phe Arg Cys Val Glu Leu
    770                 775                 780
Ala Asp Leu Met Thr Gln Asn Ala Val Asn Leu Ala Ile Lys Tyr Ala
785                 790                 795                 800
Ser Arg Ser Arg Lys Leu Ile Leu Ala Gln Lys Leu Ser Glu Leu Ala
                805                 810                 815
Val Glu Lys Ala Ala Glu Leu Thr Ala Thr Gln Val Glu Glu Glu Glu
            820                 825                 830
Glu Glu Glu Asp Phe Arg Lys Lys Leu Asn Ala Gly Tyr Ser Asn Thr
        835                 840                 845
Ala Thr Glu Trp Ser Gln Pro Arg Phe Arg Asn Gln Val Glu Glu Asp
    850                 855                 860
Ala Glu Asp Ser Gly Glu Ala Asp Asp Glu Glu Lys Pro Glu Ile His
865                 870                 875                 880
Lys Pro Gly Gln Asn Ser Phe Ser Lys Ser Thr Asn Ser Ser Asp Val
                885                 890                 895
Ser Ala Lys Ser Gly Ala Val Thr Phe Ser Ser Gln Gly Arg Val Asn
            900                 905                 910
Pro Phe Lys Val Ser Ala Ser Ser Lys Glu Pro Ala Met Ser Met Asn
        915                 920                 925
Ser Ala Arg Ser Thr Asn Ile Leu Asp Asn Met Gly Lys Ser Ser Lys
    930                 935                 940
Lys Ser Thr Ala Leu Ser Arg Thr Thr Asn Asn Glu Lys Ser Pro Ile
945                 950                 955                 960
Ile Lys Pro Leu Ile Pro Lys Pro Lys Pro Lys Gln Ala Ser Ala Ala
                965                 970                 975
Ser Tyr Phe Gln Lys Arg Asn Ser Gln Thr Asn Lys Thr Glu Glu Val
            980                 985                 990
Lys Glu Glu Asn Leu Lys Asn Val Leu Ser Glu Thr Pro Ala Ile Cys
        995                 1000                1005
Pro Pro Gln Asn Thr Glu Asn Gln Arg Pro Lys Thr Gly Phe Gln
    1010                1015                1020
Met Trp Leu Glu Glu Asn Arg Ser Asn Ile Leu Ser Asp Asn Pro
    1025                1030                1035
Asp Phe Ser Asp Glu Ala Asp Ile Ile Lys Glu Gly Met Ile Arg
    1040                1045                1050
Phe Arg Val Leu Ser Thr Glu Glu Arg Lys Val Trp Ala Asn Lys
    1055                1060                1065
Ala Lys Gly Glu Thr Ala Ser Glu Gly Thr Glu Ala Lys Lys Arg
    1070                1075                1080
Lys Arg Val Val Asp Glu Ser Asp Glu Thr Glu Asn Gln Glu Glu
    1085                1090                1095
Lys Ala Lys Glu Asn Leu Asn Leu Ser Lys Lys Gln Lys Pro Leu
    1100                1105                1110
Asp Phe Ser Thr Asn Gln Lys Leu Ser Ala Phe Ala Phe Lys Gln
    1115                1120                1125
Glu
 
<210>9
<211>21
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>9
gaggtgatag cattgctttc g                                               21
 
<210>10
<211>21
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>10
caagtcagtg tacaggtaag c                                               21
 
<210>11
<211>20
<212>DNA
<213>人工的
 
<220>
<223>引物(RT-PCR)
 
<400>11
cgccagagact tggaaatgt                                                 20
 
<210>12
<211>20
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>12
gtttctgttt ctcgggtggt                                                 20
 
<210>13
<211>23
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>13
gcaggtagtc aagaaaatgc aag                                             23
 
<210>14
<211>23
<212>DNA
<213>人工的
 
<220>
<223>引物(RT-PCR)
 
<400>14
cagatccttc acctcttcct tct                                             23
 
<210>15
<211>20
<212>DNA
<213>人工的
 
<220>
<223>引物(RT-PCR)
 
<400>15
aagccaaaga aggagcaaa t                                                20
 
<210>16
<211>20
<212>DNA
<213>人工的
 
<220>
<223>引物(RT-PCR)
 
<400>16
caatgagcct ttcctctgaa                                                 20
 
<210>17
<211>24
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>17
agtgaaggaa ctgaagcaaa gaag                                            24
 
<210>18
<211>23
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>18
atccattact tccctagggt cac                                             23
 
<210>19
<211>23
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>19
gcttgtaaag tcctcggaaa gtt                                             23
<210>20
<211>23
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>20
atctcaactc tgcatcatct ggt                                             23
 
<210>21
<211>20
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>21
gaaaatggga aaacctgctt                                                 20
 
<210>22
<211>20
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>22
ctctgattcc aaagccgaag                                                 20
 
<210>23
<211>19
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>23
cguacgcgga auacuucga                                                  19
 
<210>24
<211>19
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>24
ugguuuacau gucgacuaa                                                  19
 
<210>25
<211>19
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>25
ugguuuacau guuuucuga                                                  19
<210>26
<211>19
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>26
ugguuuacau guuuuccua                                                  19
 
<210>27
<211>19
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>27
ugguuuacau guuguguga                                                  19
 
<210>28
<21l>19
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>28
gcgcgcuuug uaggauucg                                                  19
 
<210>29
<211>19
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>29
gaagcagcac gacuucuuc                                                  19
 
<210>30
<211>20
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>30
gcaguuugau cuccugguuu                                                 20
 
<210>31
<211>21
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>31
gccagagacu uggaaauguu u                                                21
<210>32
<211>18
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>32
aaaagagaug uugcagua                                                   18
 
<210>33
<211>19
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>33
uagcaaagcu gaccaagaa                                                  19
 
<210>34
<211>21
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>34
gaucagacau gugcuauuau u                                               21
 
<210>35
<211>21
<212>RNA
<213>人工的
 
<220>
<223>用于siRNA的人工合成的寡核苷酸
 
<400>35
gguaauacgu ggacuccuau u                                               21
 
<210>36
<211>19
<212>DNA
<213>人工的
 
<220>
<223>用于siRNA的靶序列
 
<400>36
gaagcagcac gacttcttc                                                  19
 
<210>37
<211>19
<212>DNA
<213>人工的
 
<220>
<223>用于siRNA的靶序列
 
<400>37
cgtacgcgga atacttcga                                                  19
 
<210>38
<211>19
<212>DNA
<213>人工的
 
<220>
<223>用于siRNA的靶序列
 
<400>38
ggagatagct ctggttgat                                                  19
 
<210>39
<211>19
<212>DNA
<213>人工的
 
<220>
<223>用于siRNA的靶序列
 
<400>39
gggctattct gtggatgtt                                                  19
 
<210>40
<211>19
<212>DNA
<2l3>人工的
 
<220>
<223>用于siRNA的靶序列
 
<400>40
gcagtttgat ctcctggtt                                                  19
 
<210>41
<211>19
<212>DNA
<213>人工的
 
<220>
<223>用于siRNA的靶序列
 
<400>41
gccagagact tggaaatgt                                                  19
 
<2l0>42
<211>18
<212>DNA
<213>人工的
 
<220>
<223>用于siRNA的靶序列
 
<400>42
aaaagagatg ttgcagta                                                   18
 
<210>43
<211>19
<212>DNA
<213>人工的
 
<220>
<223>用于siRNA的靶序列
<400>43
tagcaaagct gaccaagaa                                                  19
 
<210>44
<211>19
<212>DNA
<213>人工的
 
<220>
<223>用于siRNA的靶序列
 
<400>44
gatcagacat gtgctatta                                                  19
 
<210>45
<211>19
<212>DNA
<213>人工的
 
<220>
<223>用于siRNA的靶序列
 
<400>45
ggtaatacgt ggactccta                                                  19
 
<210>46
<211>6
<212>PRT
<213>人工的
 
<220>
<223>磷酸化位点
           
<400>46
 
Arg Pro Arg Gln Arg Ser
1               5
 
<210>47
<211>1200
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(130)..(1020)
 
<400>47
gggggggggg ggcacttggc ttcaaagctg gctcttggaa attgagcgga gagcgacgcg      60
gttgttgtag ctgccgctgc ggccgccgcg gaataataag ccgggatcta ccatacccat      120
tgactaact atg gaa gat tat acc aaa ata gag aaa att gga gaa ggt acc      171
          Met Glu Asp Tyr Thr Lys Ile Glu Lys Ile Gly Glu Gly Thr
          1               5                   10
tat gga gtt gtg tat aag ggt aga cac aaa act aca ggt caa gtg gta        219
Tyr Gly Val Val Tyr Lys Gly Arg His Lys Thr Thr Gly Gln Val Val
15                  20                  25                  30
gcc atg aaa aaa atc aga cta gaa agt gaa gag gaa ggg gtt cct agt        267
Ala Met Lys Lys Ile Arg Leu Glu Ser Glu Glu Glu Gly Val Pro Ser
                35                  40                  45
act gca att cgg gaa att tct cta tta aag gaa ctt cgt cat cca aat        315
Thr Ala Ile Arg Glu Ile Ser Leu Leu Lys Glu Leu Arg His Pro Asn
            50                  55                  60
ata gtc agt ctt cag gat gtg ctt atg cag gat tcc agg tta tat ctc       363
Ile Val Ser Leu Gln Asp Val Leu Met Gln Asp Ser Arg Leu Tyr Leu
        65                  70                  75
atc ttt gag ttt ctt tcc atg gat ctg aag aaa tac ttg gat tct atc       411
Ile Phe Glu Phe Leu Ser Met Asp Leu Lys Lys Tyr Leu Asp Ser Ile
    80                  85                  90
cct cct ggt cag tac atg gat tct tca ctt gtt aag agt tat tta tac       459
Pro Pro Gly Gln Tyr Met Asp Ser Ser Leu Val Lys Ser Tyr Leu Tyr
95                 100                 105                 110
caa atc cta cag ggg att gtg ttt tgt cac tct aga aga gtt ctt cac       507
Gln Ile Leu Gln Gly Ile Val Phe Cys His Ser Arg Arg Val Leu His
                115                 120                 125
aga gac tta aaa cct caa aat ctc ttg att gat gac aaa gga aca att       555
Arg Asp Leu Lys Pro Gln Asn Leu Leu Ile Asp Asp Lys Gly Thr Ile
            130                 135                 140
aaa ctg gct gat ttt ggc ctt gcc aga gct ttt gga ata cct atc aga       603
Lys Leu Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Ile Arg
        145                 150                 155
gta tat aca cat gag gta gta aca ctc tgg tac aga tct cca gaa gta       651
Val Tyr Thr His Glu Val Val Thr Leu Trp Tyr Arg Ser Pro Glu Val
    160                 165                 170
ttg ctg ggg tca gct cgt tac tca act cca gtt gac att tgg agt ata       699
Leu Leu Gly Ser Ala Arg Tyr Ser Thr Pro Val Asp Ile Trp Ser Ile
175                 180                 185                 190
ggc acc ata ttt gct gaa cta gca act aag aaa cca ctt ttc cat ggg       747
Gly Thr Ile Phe Ala Glu Leu Ala Thr Lys Lys Pro Leu Phe His Gly
                    195                 200                 205
gat tca gaa att gat caa ctc ttc agg att ttc aga gct ttg ggc act       795
Asp Ser Glu Ile Asp Gln Leu Phe Arg Ile Phe Arg Ala Leu Gly Thr
                210                 215                 220
ccc aat aat gaa gtg tgg cca gaa gtg gaa tct tta cag gac tat aag       843
Pro Asn Asn Glu Val Trp Pro Glu Val Glu Ser Leu Gln Asp Tyr Lys
            225                 230                 235
aat aca ttt ccc aaa tgg aaa cca gga agc cta gca tcc cat gtc aaa       891
Asn Thr Phe Pro Lys Trp Lys Pro Gly Ser Leu Ala Ser His Val Lys
    240                 245                 250
aac ttg gat gaa aat ggc ttg gat ttg ctc tcg aaa atg tta atc tat       939
Asn Leu Asp Glu Asn Gly Leu Asp Leu Leu Ser Lys Met Leu Ile Tyr
255                 260                 265                 270
gat cca gcc aaa cga att tct ggc aaa atg gca ctg aat cat cca tat       987
Asp Pro Ala Lys Arg Ile Ser Gly Lys Met Ala Leu Asn His Pro Tyr
                275                 280                 285
ttt aat gat ttg gac aat cag att aag aag atg tagctttctg acaaaaagtt     1040
Phe Asn Asp Leu Asp Asn Gln Ile Lys Lys Met
            290                 295
tccatatgtt atgtcaacag atagttgtgt ttttattgtt aactcttgtc tatttttgtc     1100
ttatatatat ttctttgtta tcaaacttca gctgtacttc gtcttctaat ttcaaaaata     1160
taacttaaaa atgtaaatat tctatatgaa tttaaatata                           1200
 
<210>48
<211>297
<212>PRT
<213>人(Homo sapiens)
 
<400>48
 
Met Glu Asp Tyr Thr Lys Ile Glu Lys Ile Gly Glu Gly Thr Tyr Gly
1               5                   10                  15
Val Val Tyr Lys Gly Arg His Lys Thr Thr Gly Gln Val Val Ala Met
            20                  25                  30
Lys Lys Ile Arg Leu Glu Ser Glu Glu Glu Gly Val Pro Ser Thr Ala
        35                  40                  45
Ile Arg Glu Ile Ser Leu Leu Lys Glu Leu Arg His Pro Asn Ile Val
    50                  55                  60
Ser Leu Gln Asp Val Leu Met Gln Asp Ser Arg Leu Tyr Leu Ile Phe
65                  70                  75                  80
Glu Phe Leu Ser Met Asp Leu Lys Lys Tyr Leu Asp Ser Ile Pro Pro
               85                  90                  95
Gly Gln Tyr Met Asp Ser Ser Leu Val Lys Ser Tyr Leu Tyr Gln Ile
           100                  105                 110
Leu Gln Gly Ile Val Phe Cys His Ser Arg Arg Val Leu His Arg Asp
        115                 120                 125
Leu Lys Pro Gln Asn Leu Leu Ile Asp Asp Lys Gly Thr Ile Lys Leu
    130                 135                 140
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Ile Arg Val Tyr
145                 150                 155                 160
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ser Pro Glu Val Leu Leu
                165                 170                 175
Gly Ser Ala Arg Tyr Ser Thr Pro Val Asp Ile Trp Ser Ile Gly Thr
            180                 185                 190
Ile Phe Ala Glu Leu Ala Thr Lys Lys Pro Leu Phe His Gly Asp Ser
        195                 200                 205
Glu Ile Asp Gln Leu Phe Arg Ile Phe Arg Ala Leu Gly Thr Pro Asn
    210                 215                 220
Asn Glu Val Trp Pro Glu Val Glu Ser Leu Gln Asp Tyr Lys Asn Thr
225                 230                 235                 240
Phe Pro Lys Trp Lys Pro Gly Ser Leu Ala Ser His Val Lys Asn Leu
                245                 250                 255
Asp Glu Asn Gly Leu Asp Leu Leu Ser Lys Met Leu Ile Tyr Asp Pro
            260                 265                 270
Ala Lys Arg Ile Ser Gly Lys Met Ala Leu Asn His Pro Tyr Phe Asn
        275                 280                 285
Asp Leu Asp Asn Gln Ile Lys Lys Met
    290                 295
 
<210>49
<211>2005
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(101)..(1174)
 
<400>49
ctggcgcgcg cggccctgcg ggtgacaggc aggcgggaag gggcggggcc tcgggcgggg      60
ccgccgtggg gaggagggcg gtgggagggg aggagtggag atg gcg gcg gcg gcg        115
                                            Met Ala Ala Ala Ala
                                            1               5
gct cag ggg ggc ggg ggc ggg gag ccc cgt aga acc gag ggg gtc ggc        163
Ala Gln Gly Gly Gly Gly Gly Glu Pro Arg Arg Thr Glu Gly Val Gly
                10                  15                  20
ccg ggg gtc ccg ggg gag gtg gag atg gtg aag ggg cag ccg ttc gac        211
Pro Gly Val Pro Gly Glu Val Glu Met Val Lys Gly Gln Pro Phe Asp
            25                  30                  35
gtg ggc ccg cgc tac acg cag ttg cag tac atc ggc gag ggc gcg tac        259
Val Gly Pro Arg Tyr Thr Gln Leu Gln Tyr Ile Gly Glu Gly Ala Tyr
        40                  45                  50
ggc atg gtc agc tcg gcc tat gac cac gtg cgc aag act cgc gtg gcc        307
Gly Met Val Ser Ser Ala Tyr Asp His Val Arg Lys Thr Arg Val Ala
    55                  60                  65
atc aag aag atc agc ccc ttc gaa cat cag acc tac tgc cag cgc acg        355
Ile Lys Lys Ile Ser Pro Phe Glu His Gln Thr Tyr Cys Gln Arg Thr
70                  75                  80                  85
ctc cgg gag atc cag atc ctg ctg cgc ttc cgc cat gag aat gtc atc        403
Leu Arg Glu Ile Gln Ile Leu Leu Arg Phe Arg His Glu Asn Val Ile
                90                  95                  100
ggc atc cga gac att ctg cgg gcg tcc acc ctg gaa gcc atg aga gat        451
Gly Ile Arg Asp Ile Leu Arg Ala Ser Thr Leu Glu Ala Met Arg Asp
            105                 110                 115
gtc tac att gtg cag gac ctg atg gag act gac ctg tac aag ttg ctg        499
Val Tyr Ile Val Gln Asp Leu Met Glu Thr Asp Leu Tyr Lys Leu Leu
        120                 125                 130
aaa agc cag cag ctg agc aat gac cat atc tgc tac ttc ctc tac cag        547
Lys Ser Gln Gln Leu Ser Asn Asp His Ile Cys Tyr Phe Leu Tyr Gln
    135                 140                 145
atc ctg cgg ggc ctc aag tac atc cac tcc gcc aac gtg ctc cac cga        595
Ile Leu Arg Gly Leu Lys Tyr Ile His Ser Ala Asn Val Leu His Arg
150                 155                 160                 165
gat cta aag ccc tcc aac ctg ctc atc aac acc acc tgc gac ctt aag        643
Asp Leu Lys Pro Ser Asn Leu Leu Ile Asn Thr Thr Cys Asp Leu Lys
                170                 175                 180
att tgt gat ttc ggc ctg gcc cgg att gcc gat cct gag cat gac cac       691
Ile Cys Asp Phe Gly Leu Ala Arg Ile Ala Asp Pro Glu His Asp His
            185                 190                 195
acc ggc ttc ctg acg gag tat gtg gct acg cgc tgg tac cgg gcc cca       739
Thr Gly Phe Leu Thr Glu Tyr Val Ala Thr Arg Trp Tyr Arg Ala Pro
        200                 205                 210
gag atc atg ctg aac tcc aag ggc tat acc aag tcc atc gac atc tgg       787
Glu Ile Met Leu Asn Ser Lys Gly Tyr Thr Lys Ser Ile Asp Ile Trp
    215                 220                 225
tct gtg ggc tgc att ctg gct gag atg ctc tct aac cgg ccc atc ttc       835
Ser Val Gly Cys Ile Leu Ala Glu Met Leu Ser Asn Arg Pro Ile Phe
230                 235                 240                 245
cct ggc aag cac tac ctg gat cag ctc aac cac att ctg ggc atc ctg       883
Pro Gly Lys His Tyr Leu Asp Gln Leu Asn His Ile Leu Gly Ile Leu
                250                 255                 260
ggc tcc cca tcc cag gag gac ctg aat tgt atc atc aac atg aag gcc       931
Gly Ser Pro Ser Gln Glu Asp Leu Asn Cys Ile Ile Asn Met Lys Ala
            265                 270                 275
cga aac tac cta cag tct ctg ccc tcc aag acc aag gtg gct tgg gcc       979
Arg Asn Tyr Leu Gln Ser Leu Pro Ser Lys Thr Lys Val Ala Trp Ala
        280                 285                 290
aag ctt ttc ccc aag tca gac tcc aaa gcc ctt gac ctg ctg gac cgg       1027
Lys Leu Phe Pro Lys Ser Asp Ser Lys Ala Leu Asp Leu Leu Asp Arg
    295                 300                 305
atg tta acc ttt aac ccc aat aaa cgg atc aca gtg gag gaa gcg ctg       1075
Met Leu Thr Phe Asn Pro Asn Lys Arg Ile Thr Val Glu Glu Ala Leu
310                 315                 320                 325
gct cac ccc tac ctg gag cag tac tat gac ccg acg gat gag gtg ggc       1123
Ala His Pro Tyr Leu Glu Gln Tyr Tyr Asp Pro Thr Asp Glu Val Gly
                330                 335                 340
cag tcc cca gca gca gtg ggg ctg ggg gca ggg gag cag ggg ggc acg       1171
Gln Ser Pro Ala Ala Val Gly Leu Gly Ala Gly Glu Gln Gly Gly Thr
            345                 350                 355
tag gcatccccca tgccaggcct gagccttgct gtctctacca ccccagccag            1224
tggccgagga gcccttcacc ttcgccatgg agctggatga cctacctaag gagcggctga     1284
aggagctcat cttccaggag acagcacgct tccagcccgg agtgctggag gccccctagc     1344
ccagacagac atctctgcac cctggggcct ggacctgcct cctgcctgcc cctctcccgc     1404
cagactgtta gaaaatggac actgtgccca gcccggacct tggcagccca ggccggggtg     1464
gagcatgggc ctggccacct ctctcctttg ctgaggcctc cagcttcagg caggccaagg     1524
ccttctcctc cccacccgcc ctccccacgg ggcctcggga cctcaggtgg ccccagttca     1584
atctcccgct gctgctgctg cgcccttacc ttccccagcg tcccagtctc tggcagttct     1644
ggaatggaag ggttctggct gccccaacct gctgaagggc agaggtggag ggtggggggc     1704
gctgagtagg gactcagggc catgcctgcc cccctcatct cattcaaacc ccaccctagt     1764
ttccctgaag gaacattcct tagtctcaag ggctagcatc cctgaggagc caggccgggc     1824
cgaatcccct ccctgtcaaa gctgtcactt cgcgtgccct cgctgcttct gtgtgtggtg     1884
agcagaagtg gagctggggg gcgtggagag cccggcgccc ctgccacctc cctgacccgt     1944
ctaatatata aatatagaga tgtgtctatg gctgaaaaaa aaaaaaaaaa aaaaaaaaaa     2004
a                                                   2005
 
<210>50
<211>357
<212>PRT
<213>人(Homo sa piens)
 
<400>50
 
Met Ala Ala Ala Ala Ala Gln Gly Gly Gly Gly Gly Glu Pro Arg Arg
1               5                   10                  15
Thr Glu Gly Val Gly Pro Gly Val Pro Gly Glu Val Glu Met Val Lys
            20                  25                  30
Gly Gln Pro Phe Asp Val Gly Pro Arg Tyr Thr Gln Leu Gln Tyr Ile
        35                  40                  45
Gly Glu Gly Ala Tyr Gly Met Val Ser Ser Ala Tyr Asp His Val Arg
    50                  55                  60
Lys Thr Arg Val Ala Ile Lys Lys Ile Ser Pro Phe Glu His Gln Thr
65                  70                  75                  80
Tyr Cys Gln Arg Thr Leu Arg Glu Ile Gln Ile Leu Leu Arg Phe Arg
                85                  90                  95
His Glu Asn Val Ile Gly Ile Arg Asp Ile Leu Arg Ala Ser Thr Leu
            100                 105                 110
Glu Ala Met Arg Asp Val Tyr Ile Val Gln Asp Leu Met Glu Thr Asp
        115                 120                 125
Leu Tyr Lys Leu Leu Lys Ser Gln Gln Leu Ser Asn Asp His Ile Cys
    130                 135                 140
Tyr Phe Leu Tyr Gln Ile Leu Arg Gly Leu Lys Tyr Ile His Ser Ala
145                 150                 155                 160
Asn Val Leu His Arg Asp Leu Lys Pro Ser Asn Leu Leu Ile Asn Thr
                165                 170                 175
Thr Cys Asp Leu Lys Ile Cys Asp Phe Gly Leu Ala Arg Ile Ala Asp
            180                 185                 190
Pro Glu His Asp His Thr Gly Phe Leu Thr Glu Tyr Val Ala Thr Arg
        195                 200                 205
Trp Tyr Arg Ala Pro Glu Ile Met Leu Asn Ser Lys Gly Tyr Thr Lys
    210                 215                 220
Ser Ile Asp Ile Trp Ser Val Gly Cys Ile Leu Ala Glu Met Leu Ser
225                 230                 235                 240
Asn Arg Pro Ile Phe Pro Gly Lys His Tyr Leu Asp Gln Leu Asn His
                245                 250                 255
Ile Leu Gly Ile Leu Gly Ser Pro Ser Gln Glu Asp Leu Asn Cys Ile
            260                 265                 270
Ile Asn Met Lys Ala Arg Asn Tyr Leu Gln Ser Leu Pro Ser Lys Thr
        275                 280                 285
Lys Val Ala Trp Ala Lys Leu Phe Pro Lys Ser Asp Ser Lys Ala Leu
    290                 295                 300
Asp Leu Leu Asp Arg Met Leu Thr Phe Asn Pro Asn Lys Arg Ile Thr
305                 310                 315                 320
Val Glu Glu Ala Leu Ala His Pro Tyr Leu Glu Gln Tyr Tyr Asp Pro
                325                 330                 335
Thr Asp Glu Val Gly Gln Ser Pro Ala Ala Val Gly Leu Gly Ala Gly
            340                 345                 350
Glu Gln Gly Gly Thr
        355
 
<210>51
<211>5205
<212>DNA
<213>人(Homo sa piens)
 
<220>
<221>CDS
<222>(122)..(3997)
 
<400>51
gagccgccgc cgggtcccgc tcgtctgccg cctcagcctc agccccaacc tcagccgccg       60
ccgttgcgct tgctcccggg cggtcctggc ctgtgccgcc gccgccccca gcgtcggagc      120
c atg gcg ggc gcc gcg tcc cct tgc gcc aac ggc tgc ggg ccc ggc gcg      169
  Met Ala Gly Ala Ala Ser Pro Cys Ala Asn Gly Cys Gly Pro Gly Ala
  1               5                   10                  15
ccc tcg gac gcc gag gtg ctg cac ctc tgc cgc agc ctc gag gtg ggc        217
Pro Ser Asp Ala Glu Val Leu His Leu Cys Arg Ser Leu Glu Val Gly
            20                  25                  30
acc gtc atg act ttg ttc tac tcc aag aag tcg cag cga ccc gag cgg        265
Thr Val Met Thr Leu Phe Tyr Ser Lys Lys Ser Gln Arg Pro Glu Arg
        35                  40                  45
aag acc ttc cag gtc aag ctg gag acg cgc cag atc acg tgg agc cgg        313
Lys Thr Phe Gln Val Lys Leu Glu Thr Arg Gln Ile Thr Trp Ser Arg
    50                  55                  60
ggc gcc gac aag atc gag ggg gcc att gac att cgt gaa att aag gag        361
Gly Ala Asp Lys Ile Glu Gly Ala Ile Asp Ile Arg Glu Ile Lys Glu
65                  70                  75                  80
atc cgc cca ggg aag acc tca cgg gac ttt gat cgc tat caa gag gac        409
Ile Arg Pro Gly Lys Thr Ser Arg Asp Phe Asp Arg Tyr Gln Glu Asp
                85                  90                  95
cca gct ttc cgg ccg gac cag tca cat tgc ttt gtc att ctc tat gga       457
Pro Ala Phe Arg Pro Asp Gln Ser His Cys Phe Val Ile Leu Tyr Gly
            100                 105                 110
atg gaa ttt cgc ctg aaa acg ctg agc ctg caa gcc aca tct gag gat       505
Met Glu Phe Arg Leu Lys Thr Leu Ser Leu Gln Ala Thr Ser Glu Asp
        115                 120                 125
gaa gtg aac atg tgg atc aag ggc tta act tgg ctg atg gag gat aca       553
Glu Val Asn Met Trp Ile Lys Gly Leu Thr Trp Leu Met Glu Asp Thr
    130                 135                 140
ttg cag gca ccc aca ccc ctg cag att gag agg tgg ctc cgg aag cag       601
Leu Gln Ala Pro Thr Pro Leu Gln Ile Glu Arg Trp Leu Arg Lys Gln
145                 150                 155                 160
ttt tac tca gtg gat cgg aat cgt gag gat cgt ata tca gcc aag gac       649
Phe Tyr Ser Val Asp Arg Asn Arg Glu Asp Arg Ile Ser Ala Lys Asp
                165                 170                 175
ctg aag aac atg ctg tcc cag gtc aac tac cgg gtc ccc aac atg cgc       697
Leu Lys Asn Met Leu Ser Gln Val Asn Tyr Arg Val Pro Asn Met Arg
            180                 185                 190
ttc ctc cga gag cgg ctg acg gac ctg gag cag cgc agc ggg gac atc       745
Phe Leu Arg Glu Arg Leu Thr Asp Leu Glu Gln Arg Ser Gly Asp Ile
        195                 200                 205
acc tac ggg cag ttt gct cag ctg tac cgc agc ctc atg tac agc gcc       793
Thr Tyr Gly Gln Phe Ala Gln Leu Tyr Arg Ser Leu Met Tyr Ser Ala
    210                 215                 220
cag aag acg atg gac ctc ccc ttc ttg gaa gcc agt act ctg agg gct       841
Gln Lys Thr Met Asp Leu Pro Phe Leu Glu Ala Ser Thr Leu Arg Ala
225                 230                 235                 240
ggg gag cgg ccg gag ctt tgc cga gtg tcc ctt cct gag ttc cag cag       889
Gly Glu Arg Pro Glu Leu Cys Arg Val Ser Leu Pro Glu Phe Gln Gln
                245                 250                 255
ttc ctt ctt gac tac cag ggg gag ctg tgg gct gtt gat cgc ctc cag       937
Phe Leu Leu Asp Tyr Gln Gly Glu Leu Trp Ala Val Asp Arg Leu Gln
            260                 265                 270
gtg cag gag ttc atg ctc agc ttc ctc cga gac ccc tta cga gag atc       985
Val Gln Glu Phe Met Leu Ser Phe Leu Arg Asp Pro Leu Arg Glu Ile
        275                 280                 285
gag gag cca tac ttc ttc ctg gat gag ttt gtc acc ttc ctg ttc tcc       1033
Glu Glu Pro Tyr Phe Phe Leu Asp Glu Phe Val Thr Phe Leu Phe Ser
    290                 295                 300
aaa gag aac agt gtg tgg aac tcg cag ctg gat gca gta tgc ccg gac       1081
Lys Glu Asn Ser Val Trp Asn Ser Gln Leu Asp Ala Val Cys Pro Asp
305                 310                 315                 320
acc atg aac aac cct ctt tcc cac tac tgg atc tcc tcc tcg cac aac       1129
Thr Met Asn Asn Pro Leu Ser His Tyr Trp Ile Ser Ser Ser His Asn
                325                 330                 335
acg tac ctg acc ggg gac cag ttc tcc agt gag tcc tcc ttg gaa gcc       1177
Thr Tyr Leu Thr Gly Asp Gln Phe Ser Ser Glu Ser Ser Leu Glu Ala
            340                 345                 350
tat gct cgc tgc ctg cgg atg ggc tgt cgc tgc att gag ttg gac tgc       1225
Tyr Ala Arg Cys Leu Arg Met Gly Cys Arg Cys Ile Glu Leu Asp Cys
        355                 360                 365
tgg gac ggc ccg gat ggg atg cca gtt att tac cat ggg cac acc ctt       1273
Trp Asp Gly Pro Asp Gly Met Pro Val Ile Tyr His Gly His Thr Leu
    370                 375                 380
acc acc aag atc aag ttc tca gat gtc ctg cac acc atc aag gag cat    1321
Thr Thr Lys Ile Lys Phe Ser Asp Val Leu His Thr Ile Lys Glu His
385                 390                 395                 400
gcc ttt gtg gcc tca gag tac cca gtc atc ctg tcc att gag gac cac    1369
Ala Phe Val Ala Ser Glu Tyr Pro Val Ile Leu Ser Ile Glu Asp His
                405                 410                 415
tgc agc att gcc cag cag aga aac atg gcc caa tac ttc aag aag gtg    1417
Cys Ser Ile Ala Gln Gln Arg Asn Met Ala Gln Tyr Phe Lys Lys Val
            420                 425                 430
ctg ggg gac aca ctc ctc acc aag ccc gtg gag atc tct gcc gac ggg    1465
Leu Gly Asp Thr Leu Leu Thr Lys Pro Val Glu Ile Ser Ala Asp Gly
        435                 440                 445
ctc ccc tca ccc aac cag ctt aag agg aag atc ctc atc aag cac aag    1513
Leu Pro Ser Pro Asn Gln Leu Lys Arg Lys Ile Leu Ile Lys His Lys
    450                 455                 460
aag ctg gct gag ggc agt gcc tac gag gag gtg cct aca tcc atg atg    1561
Lys Leu Ala Glu Gly Ser Ala Tyr Glu Glu Val Pro Thr Ser Met Met
465                 470                 475                 480
tac tct gag aac gac atc agc aac tct atc aag aat ggc atc ctc tac    1609
Tyr Ser Glu Asn Asp Ile Ser Asn Ser Ile Lys Asn Gly Ile Leu Tyr
                485                 490                 495
ctg gag gac cct gtg aac cac gaa tgg tat ccc cac tac ttt gtt ctg    1657
Leu Glu Asp Pro Val Asn His Glu Trp Tyr Pro His Tyr Phe Val Leu
            500                 505                 510
acc agc agc aag atc tac tac tct gag gag acc agc agt gac cag ggc    1705
Thr Ser Ser Lys Ile Tyr Tyr Ser Glu Glu Thr Ser Ser Asp Gln Gly
        515                 520                 525
aac gag gat gag gag gag ccc aag gag gtc agc agc agc aca gag ctg    1753
Asn Glu Asp Glu Glu Glu Pro Lys Glu Val Ser Ser Ser Thr Glu Leu
    530                 535                 540
cac tcc aat gag aag tgg ttc cat ggg aag cta ggg gca ggg cgt gac    1801
His Ser Asn Glu Lys Trp Phe His Gly Lys Leu Gly Ala Gly Arg Asp
545                 550                 555                 560
ggg cgt cac atc gct gag cgc ctg ctt act gag tac tgc atc gag acc    1849
Gly Arg His Ile Ala Glu Arg Leu Leu Thr Glu Tyr Cys Ile Glu Thr
                565                 570                 575
gga gcc cct gac ggc tcc ttc ctc gtg cga gag agt gag acc ttc gtg    1897
Gly Ala Pro Asp Gly Ser Phe Leu Val Arg Glu Ser Glu Thr Phe Val
            580                 585                 590
ggc gac tac acg ctc tct ttc tgg cgg aac ggg aaa gtc cag cac tgc    1945
Gly Asp Tyr Thr Leu Ser Phe Trp Arg Asn Gly Lys Val Gln His Cys
        595                 600                 605
cgt atc cac tcc cgg caa gat gct ggg acc ccc aag ttc ttc ttg aca    1993
Arg Ile Hi s Ser Arg Gln Asp Ala Gly Thr Pro Lys Phe Phe Leu Thr
    610                 615                 620
gac aac ctc gtc ttt gac tcc ctc tat gac ctc atc acg cac tac cag    2041
Asp Asn Leu Val Phe Asp Ser Leu Tyr Asp Leu Ile Thr His Tyr Gln
625                 630                 635                 640
cag gtg ccc ctg cgc tgt aat gag ttt gag atg cga ctt tca gag cct    2089
Gln Val Pro Leu Arg Cys Asn Glu Phe Glu Met Arg Leu Ser Glu Pro
               645                 650                 655
gtc cca cag acc aac gcc cac gag agc aaa gag tgg tac cac gcg agc    2137
Val Pro Gln Thr Asn Ala His Glu Ser Lys Glu Trp Tyr His Ala Ser
            660                 665                 670
ctg acc aga gca cag gct gag cac atg cta atg cgc gtc cct cgt gat    2185
Leu Thr Arg Ala Gln Ala Glu His Met Leu Met Arg Val Pro Arg Asp
        675                 680                 685
ggg gcc ttc ctg gtg cgg aag cgg aat gaa ccc aac tca tat gcc atc    2233
Gly Ala Phe Leu Val Arg Lys Arg Asn Glu Pro Asn Ser Tyr Ala Ile
    690                 695                 700
tct ttc cgg gct gag ggc aag atc aag cat tgc cgt gtc cag caa gag    2281
Ser Phe Arg Ala Glu Gly Lys Ile Lys His Cys Arg Val Gln Gln Glu
705                 710                 715                 720
ggc cag aca gtg atg cta ggg aac tcg gag ttc gac agc ctt gtt gac    2329
Gly Gln Thr Val Met Leu Gly Asn Ser Glu Phe Asp Ser Leu Val Asp
                725                 730                 735
ctc atc agc tac tat gag aaa cac ccg cta tac cgc aag atg aag ctg    2377
Leu Ile Ser Tyr Tyr Glu Lys His Pro Leu Tyr Arg Lys Met Lys Leu
            740                 745                 750
cgc tat ccc atc aac gag gag gca ctg gag aag att ggc aca gct gag    2425
Arg Tyr Pro Ile Asn Glu Glu Ala Leu Glu Lys Ile Gly Thr Ala Glu
        755                 760                 765
cct gac tac ggg gcc ctg tat gag gga cgc aac cct ggc ttc tat gta    2473
Pro Asp Tyr Gly Ala Leu Tyr Glu Gly Arg Asn Pro Gly Phe Tyr Val
    770                 775                 780
gag gca aac cct atg cca act ttc aag tgt gca gtc aaa gcc ctc ttt    2521
Glu Ala Asn Pro Met Pro Thr Phe Lys Cys Ala Val Lys Ala Leu Phe
785                 790                 795                 800
gac tac aag gcc cag agg gag gac gag ctg acc ttc atc aag agc gcc    2569
Asp Tyr Lys Ala Gln Arg Glu Asp Glu Leu Thr Phe Ile Lys Ser Ala
                805                 810                 815
atc atc cag aat gtg gag aag caa gag gga ggc tgg tgg cga ggg gac    2617
Ile Ile Gln Asn Val Glu Lys Gln Glu Gly Gly Trp Trp Arg Gly Asp
            820                 825                 830
tac gga ggg aag aag cag ctg tgg ttc cca tca aac tac gtg gaa gag    2665
Tyr Gly Gly Lys Lys Gln Leu Trp Phe Pro Ser Asn Tyr Val Glu Glu
        835                 840                 845
atg gtc aac ccc gtg gcc ctg gag ccg gag agg gag cac ttg gac gag    2713
Met Val Asn Pro Val Ala Leu Glu Pro Glu Arg Glu His Leu Asp Glu
    850                 855                 860
aac agc ccc cta ggg gac ttg ctg cgg ggg gtc ttg gat gtg ccg gct    2761
Asn Ser Pro Leu Gly Asp Leu Leu Arg Gly Val Leu Asp Val Pro Ala
865                 870                 875                 880
tgt cag att gcc atc cgt cct gag ggc aag aac aac cgg ctc ttc gtc    2809
Cys Gln Ile Ala Ile Arg Pro Glu Gly Lys Asn Asn Arg Leu Phe Val
                885                 890                 895
ttc tcc atc agc atg gcg tcg gtg gcc cac tgg tcc ctg gat gtt gct    2857
Phe Ser Ile Ser Met Ala Ser Val Ala His Trp Ser Leu Asp Val Ala
            900                 905                 910
gcc gac tca cag gag gag ctg cag gac tgg gtg aaa aag atc cgt gaa    2905
Ala Asp Ser Gln Glu Glu Leu Gln Asp Trp Val Lys Lys Ile Arg Glu
        915                 920                 925
gtg gcc cag aca gca gac gcc agg ctc act gaa ggg aag ata atg gaa    2953
Val Ala Gln Thr Ala Asp Ala Arg Leu Thr Glu Gly Lys Ile Met Glu
    930                 935                 940
cgg agg aag aag att gcc ctg gag ctc tct gaa ctt gtc gtc tac tgc    3001
Arg Arg Lys Lys Ile Ala Leu Glu Leu Ser Glu Leu Val Val Tyr Cys
945                 950                 955                 960
cgg cct gtt ccc ttt gat gaa gag aag att ggc aca gaa cgt gct tgc    3049
Arg Pro Val Pro Phe Asp Glu Glu Lys Ile Gly Thr Glu Arg Ala Cys
                965                 970                 975
tac cgg gac atg tca tcc ttc ccg gaa acc aag gct gag aaa tac gtg    3097
Tyr Arg Asp Met Ser Ser Phe Pro Glu Thr Lys Ala Glu Lys Tyr Val
            980                 985                 990
aac aag gcc aaa ggc aag aag ttc ctt cag tac aat cga ctg cag ctc    3145
Asn Lys Ala Lys Gly Lys Lys Phe Leu Gln Tyr Asn Arg Leu Gln Leu
        995                 1000                1005
tcc cgc atc tac ccc aag ggc cag cga ctg gat tcc tcc aac tac        3190
Ser Arg Ile Tyr Pro Lys Gly Gln Arg Leu Asp Ser Ser Asn Tyr
    1010                1015                1020
gat cct ttg ccc atg tgg atc tgt ggc agt cag ctt gtg gcc ctc        3235
Asp Pro Leu Pro Met Trp Ile Cys Gly Ser Gln Leu Val Ala Leu
    1025                1030                1035
aac ttc cag acc cct gac aag cct atg cag atg aac cag gcc ctc        3280
Asn Phe Gln Thr Pro Asp Lys Pro Met Gln Met Asn Gln Ala Leu
    1040                1045                1050
ttc atg acg ggc agg cac tgt ggc tac gtg ctg cag cca agc acc        3325
Phe Met Thr Gly Arg His Cys Gly Tyr Val Leu Gln Pro Ser Thr
    1055                1060                1065
atg cgg gat gag gcc ttc gac ccc ttt gac aag agc agc ctc cgc        3370
Met Arg Asp Glu Ala Phe Asp Pro Phe Asp Lys Ser Ser Leu Arg
    1070                1075                1080
ggg ctg gag cca tgt gcc atc tct att gag gtg ctg ggg gcc cga        3415
Gly Leu Glu Pro Cys Ala Ile Ser Ile Glu Val Leu Gly Ala Arg
    1085                1090                1095
cat ctg cca aag aat ggc cga ggc att gtg tgt cct ttt gtg gag        3460
His Leu Pro Lys Asn Gly Arg Gly Ile Val Cys Pro Phe Val Glu
    1100                1105                1110
att gag gtg gct gga gct gag tat gac agc acc aag cag aag aca        3505
Ile Glu Val Ala Gly Ala Glu Tyr Asp Ser Thr Lys Gln Lys Thr
    1115                1120                1125
gag ttt gtg gtg gac aat gga ctc aac cct gta tgg cca gcc aag        3550
Glu Phe Val Val Asp Asn Gly Leu Asn Pro Val Trp Pro Ala Lys
    1130                1135                1140
ccc ttc cac ttc cag atc agt aac cct gaa ttt gcc ttt ctg cgc        3595
Pro Phe His Phe Gln Ile Ser Asn Pro Glu Phe Ala Phe Leu Arg
    1145                1150                1155
ttc gtg gtg tat gag gaa gac atg ttt agt gac cag aat ttc ctg        3640
Phe Val Val Tyr Glu Glu Asp Met Phe Ser Asp Gln Asn Phe Leu
    1160                1165                1170
gct cag gct act ttc cca gta aaa ggc ctg aag aca gga tac aga        3685
Ala Gln Ala Thr Phe Pro Val Lys Gly Leu Lys Thr Gly Tyr Arg
    1175                1180                1185
gca gtg cct ttg aag aac aac tac agt gag gac ctg gag ttg gcc        3730
Ala Val Pro Leu Lys Asn Asn Tyr Ser Glu Asp Leu Glu Leu Ala
    1190                1195                1200
tcc ctg ctg atc aag att gac att ttc cct gcc aag cag gag aat        3775
Ser Leu Leu Ile Lys Ile Asp Ile Phe Pro Ala Lys Gln Glu Asn
    1205                1210                1215
ggt gac ctc agt ccc ttc agt ggt acg tcc ctg cgg gag cgg ggc           3820
Gly Asp Leu Ser Pro Phe Ser Gly Thr Ser Leu Arg Glu Arg Gly
    1220                1225                1230
tca gat gcc tca ggc cag ctg ttt cat ggc cga gcc cgg gaa ggc           3865
Ser Asp Ala Ser Gly Gln Leu Phe His Gly Arg Ala Arg Glu Gly
    1235                1240                1245
tcc ttt gaa tcc cgc tac cag cag ccg ttt gag gac ttc cgc atc           3910
Ser Phe Glu Ser Arg Tyr Gln Gln Pro Phe Glu Asp Phe Arg Ile
    1250                1255                1260
tcc cag gag cat ctc gca gac cat ttt gac agt cga gaa cga agg           3955
Ser Gln Glu His Leu Ala Asp His Phe Asp Ser Arg Glu Arg Arg
    1265                1270                1275
gcc cca aga agg act cgg gtc aat gga gac aac cgc ctc tag               3997
Ala Pro Arg Arg Thr Arg Val Asn Gly Asp Asn Arg Leu
    1280                1285                1290
ttgtacccca gcctcgttgg agagcagcag gtgctgtgcg ccttgtagaa tgccgcgaac     4057
tgggttcttt ggaagcagcc ccctgtggcg gccttccggg tctcgcagcc tgaagcctgg     4117
attccagcag tgaatgctag acagaaacca agccattaat gagatgttat tactgttttg     4177
ggcctccatg ccccagctct ggatgaaggc aaaaactgta ctgtgtttcg cattaagcac     4237
acacatctgg ccctgacttc tggagatgga tccttccatc ttgtggggcc aggaccatgg     4297
ccgaagcccc ttggagagag aggctgcctc agccagtggc acaggagact ccaaggagct     4357
actgacattc ctaagagtgg aggaggagga ggagccttgc tgggccaggg aaacaaagtt     4417
tacattgtcc tgtagcttta aaaccacagc tgggcagggt gagaagctag atgcccctgc     4477
agtttggccc tggagccagg gcagaggaat gtagggcctg catggagaag ggttctgccc     4537
tgcctgagga ggaggacaca gcacaagggc acattgccca tggctgggaa catgacccag     4597
cctgaaagat acaggggatc atgttaaaaa tagcagtatt atttttcgtc tcaatggtat     4657
tgtaactaag ttatttactc ctcctgctcc tcacccctgt agggaaacct tggagaggag     4717
agtggcaggt gggctgcctg ctgtgttaag aggacttagt ttgtgatgta aggcactgtc     4777
aggaatgggg ggcgggccag ggtgggaaga gaagaaatag cagagcctat tttggtgagg     4837
ttttttgttt ttaagtcaaa gaagactcag tatgctttcc ctgaggaatg aaaaagggat     4897
tgaggagttg cctgactcct gggtgggtgg ggtacaggca gttaggtgct gaatgaagct     4957
gccatccttg ctgcagcttc taactggtaa aaagatccag ggatggagat gggaaggtta     5017
gaaaggcagc cctcacctct gaggacagag gccggggtcc aggcccgtgg gcgcaaaggt     5077
gcctcatagc atagccagca ttcagcacac acaaacctac tgcccacatt tgggctcagg     5137
gttggccatt tgctagttct gctgccctct taagatctga ctgccaaata aatcatcctc     5197
atgtcctt                                                              5205
 
<210>52
<211>1291
<212>PRT
<213>人(Homo sapiens)
 
<400>52
 
Met Ala Gly Ala Ala Ser Pro Cys Ala Asn Gly Cys Gly Pro Gly Ala
1               5                   10                  15
Pro Ser Asp Ala Glu Val Leu His Leu Cys Arg Ser Leu Glu Val Gly
            20                  25                  30
Thr Val Met Thr Leu Phe Tyr Ser Lys Lys Ser Gln Arg Pro Glu Arg
        35                  40                  45
Lys Thr Phe Gln Val Lys Leu Glu Thr Arg Gln Ile Thr Trp Ser Arg
    50                  55                  60
Gly Ala Asp Lys Ile Glu Gly Ala Ile Asp Ile Arg Glu Ile Lys Glu
65                  70                  75                  80
Ile Arg Pro Gly Lys Thr Ser Arg Asp Phe Asp Arg Tyr Gln Glu Asp
                85                  90                  95
Pro Ala Phe Arg Pro Asp Gln Ser His Cys Phe Val Ile Leu Tyr Gly
            100                 105                 110
Met Glu Phe Arg Leu Lys Thr Leu Ser Leu Gln Ala Thr Ser Glu Asp
        115                 120                 125
Glu Val Asn Met Trp Ile Lys Gly Leu Thr Trp Leu Met Glu Asp Thr
    130                 135                 140
Leu Gln Ala Pro Thr Pro Leu Gln Ile Glu Arg Trp Leu Arg Lys Gln
145                 150                 155                 160
Phe Tyr Ser Val Asp Arg Asn Arg Glu Asp Arg Ile Ser Ala Lys Asp
                165                 170                 175
Leu Lys Asn Met Leu Ser Gln Val Asn Tyr Arg Val Pro Asn Met Arg
            180                 185                 190
Phe Leu Arg Glu Arg Leu Thr Asp Leu Glu Gln Arg Ser Gly Asp Ile
        195                 200                 205
Thr Tyr Gly Gln Phe Ala Gln Leu Tyr Arg Ser Leu Met Tyr Ser Ala
    210                 215                 220
Gln Lys Thr Met Asp Leu Pro Phe Leu Glu Ala Ser Thr Leu Arg Ala
225                 230                 235                 240
Gly Glu Arg Pro Glu Leu Cys Arg Val Ser Leu Pro Glu Phe Gln Gln
                245                 250                 255
Phe Leu Leu Asp Tyr Gln Gly Glu Leu Trp Ala Val Asp Arg Leu Gln
            260                 265                 270
Val Gln Glu Phe Met Leu Ser Phe Leu Arg Asp Pro Leu Arg Glu Ile
        275                 280                 285
Glu Glu Pro Tyr Phe Phe Leu Asp Glu Phe Val Thr Phe Leu Phe Ser
    290                 295                 300
Lys Glu Asn Ser Val Trp Asn Ser Gln Leu Asp Ala Val Cys Pro Asp
305                 310                 315                 320
Thr Met Asn Asn Pro Leu Ser His Tyr Trp Ile Ser Ser Ser His Asn
                325                 330                 335
Thr Tyr Leu Thr Gly Asp Gln Phe Ser Ser Glu Ser Ser Leu Glu Ala
            340                 345                 350
Tyr Ala Arg Cys Leu Arg Met Gly Cys Arg Cys Ile Glu Leu Asp Cys
        355                 360                 365
Trp Asp Gly Pro Asp Gly Met Pro Val Ile Tyr His Gly His Thr Leu
    370                 375                 380
Thr Thr Lys Ile Lys Phe Ser Asp Val Leu His Thr Ile Lys Glu His
385                 390                 395                 400
Ala Phe Val Ala Ser Glu Tyr Pro Val Ile Leu Ser Ile Glu Asp His
                405                 410                 415
Cys Ser Ile Ala Gln Gln Arg Asn Met Ala Gln Tyr Phe Lys Lys Val
            420                 425                 430
Leu Gly Asp Thr Leu Leu Thr Lys Pro Val Glu Ile Ser Ala Asp Gly
        435                 440                 445
Leu Pro Ser Pro Asn Gln Leu Lys Arg Lys Ile Leu Ile Lys His Lys
    450                 455                 460
Lys Leu Ala Glu Gly Ser Ala Tyr Glu Glu Val Pro Thr Ser Met Met
465                 470                 475                 480
Tyr Ser Glu Asn Asp Ile Ser Asn Ser Ile Lys Asn Gly Ile Leu Tyr
                485                 490                 495
Leu Glu Asp Pro Val Asn His Glu Trp Tyr Pro His Tyr Phe Val Leu
            500                 505                 510
Thr Ser Ser Lys Ile Tyr Tyr Ser Glu Glu Thr Ser Ser Asp Gln Gly
        515                 520                 525
Asn Glu Asp Glu Glu Glu Pro Lys Glu Val Ser Ser Ser Thr Glu Leu
    530                 535                 540
His Ser Asn Glu Lys Trp Phe His Gly Lys Leu Gly Ala Gly Arg Asp
545                 550                 555                 560
Gly Arg His Ile Ala Glu Arg Leu Leu Thr Glu Tyr Cys Ile Glu Thr
                565                 570                 575
Gly Ala Pro Asp Gly Ser Phe Leu Val Arg Glu Ser Glu Thr Phe Val
            580                 585                 590
Gly Asp Tyr Thr Leu Ser Phe Trp Arg Asn Gly Lys Val Gln His Cys
        595                 600                 605
Arg Ile His Ser Arg Gln Asp Ala Gly Thr Pro Lys Phe Phe Leu Thr
    610                 615                 620
Asp Asn Leu Val Phe Asp Ser Leu Tyr Asp Leu Ile Thr His Tyr Gln
625                 630                 635                 640
Gln Val Pro Leu Arg Cys Asn Glu Phe Glu Met Arg Leu Ser Glu Pro
                645                 650                 655
Val Pro Gln Thr Asn Ala His Glu Ser Lys Glu Trp Tyr His Ala Ser
            660                 665                 670
Leu Thr Arg Ala Gln Ala Glu His Met Leu Met Arg Val Pro Arg Asp
        675                 680                 685
Gly Ala Phe Leu Val Arg Lys Arg Asn Glu Pro Asn Ser Tyr Ala Ile
    690                 695                 700
Ser Phe Arg Ala Glu Gly Lys Ile Lys His Cys Arg Val Gln Gln Glu
705                 710                 715                 720
Gly Gln Thr Val Met Leu Gly Asn Ser Glu Phe Asp Ser Leu Val Asp
                725                 730                 735
Leu Ile Ser Tyr Tyr Glu Lys His Pro Leu Tyr Arg Lys Met Lys Leu
            740                 745                 750
Arg Tyr Pro Ile Asn Glu Glu Ala Leu Glu Lys Ile Gly Thr Ala Glu
         755                 760                 765
Pro Asp Tyr Gly Ala Leu Tyr Glu Gly Arg Asn Pro Gly Phe Tyr Val
    770                 775                 780
Glu Ala Asn Pro Met Pro Thr Phe Lys Cys Ala Val Lys Ala Leu Phe
785                 790                 795                 800
Asp Tyr Lys Ala Gln Arg Glu Asp Glu Leu Thr Phe Ile Lys Ser Ala
                805                 810                 815
Ile Ile Gln Asn Val Glu Lys Gln Glu Gly Gly Trp Trp Arg Gly Asp
            820                 825                 830
Tyr Gly Gly Lys Lys Gln Leu Trp Phe Pro Ser Asn Tyr Val Glu Glu
        835                 840                 845
Met Val Asn Pro Val Ala Leu Glu Pro Glu Arg Glu His Leu Asp Glu
    850                 855                 860
Asn Ser Pro Leu Gly Asp Leu Leu Arg Gly Val Leu Asp Val Pro Ala
865                 870                 875                 880
Cys Gln Ile Ala Ile Arg Pro Glu Gly Lys Asn Asn Arg Leu Phe Val
                885                 890                 895
Phe Ser Ile Ser Met Ala Ser Val Ala His Trp Ser Leu Asp Val Ala
            900                 905                 910
Ala Asp Ser Gln Glu Glu Leu Gln Asp Trp Val Lys Lys Ile Arg Glu
        915                 920                 925
Val Ala Gln Thr Ala Asp Ala Arg Leu Thr Glu Gly Lys Ile Met Glu
    930                 935                 940
Arg Arg Lys Lys Ile Ala Leu Glu Leu Ser Glu Leu Val Val Tyr Cys
945                 950                 955                 960
Arg Pro Val Pro Phe Asp Glu Glu Lys Ile Gly Thr Glu Arg Ala Cys
                965                 970                 975
Tyr Arg Asp Met Ser Ser Phe Pro Glu Thr Lys Ala Glu Lys Tyr Val
            980                 985                 990
Asn Lys Ala Lys Gly Lys Lys Phe Leu Gln Tyr Asn Arg Leu Gln Leu
        995                 1000                1005
Ser Arg Ile Tyr Pro Lys Gly Gln Arg Leu Asp Ser Ser Asn Tyr
    1010                1015                1020
Asp Pro Leu Pro Met Trp Ile Cys Gly Ser Gln Leu Val Ala Leu
    1025                1030                1035
Asn Phe Gln Thr Pro Asp Lys Pro Met Gln Met Asn Gln Ala Leu
    1040                1045                1050
Phe Met Thr Gly Arg His Cys Gly Tyr Val Leu Gln Pro Ser Thr
    1055                1060                1065
Met Arg Asp Glu Ala Phe Asp Pro Phe Asp Lys Ser Ser Leu Arg
    1070                1075                1080
Gly Leu Glu Pro Cys Ala Ile Ser Ile Glu Val Leu Gly Ala Arg
    1085                1090                1095
His Leu Pro Lys Asn Gly Arg Gly Ile Val Cys Pro Phe Val Glu
    1100                1105                1110
Ile Glu Val Ala Gly Ala Glu Tyr Asp Ser Thr Lys Gln Lys Thr
    1115                1120                1125
Glu Phe Val Val Asp Asn Gly Leu Asn Pro Val Trp Pro Ala Lys
    1130                1135                1140
Pro Phe His Phe Gln Ile Ser Asn Pro Glu Phe Ala Phe Leu Arg
    1145                1150                1155
Phe Val Val Tyr Glu Glu Asp Met Phe Ser Asp Gln Asn Phe Leu
    1160                1165                1170
Ala Gln Ala Thr Phe Pro Val Lys Gly Leu Lys Thr Gly Tyr Arg
    1175                1180                1185
Ala Val Pro Leu Lys Asn Asn Tyr Ser Glu Asp Leu Glu Leu Ala
    1190                1195                1200
Ser Leu Leu Ile Lys Ile Asp Ile Phe Pro Ala Lys Gln Glu Asn
    1205                1210                1215
Gly Asp Leu Ser Pro Phe Ser Gly Thr Ser Leu Arg Glu Arg Gly
    1220                1225                1230
Ser Asp Ala Ser Gly Gln Leu Phe His Gly Arg Ala Arg Glu Gly
    1235                1240                1245
Ser Phe Glu Ser Arg Tyr Gln Gln Pro Phe Glu Asp Phe Arg Ile
    1250                1255                1260
Ser Gln Glu His Leu Ala Asp His Phe Asp Ser Arg Glu Arg Arg
    1265                1270                1275
Ala Pro Arg Arg Thr Arg Val Asn Gly Asp Asn Arg Leu
    1280                1285                1290
      
<210>53
<211>2115
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(272)..(1693)
 
<400>53
ggtcaacgcc tgcggctgtt gatattcttg ctcagaggcc gtaactttgg ccttctgctc    60
agggaagact ctgagtccga cgttggccta cccagtcgga aggcagagct gcaatctagt    120
taactacctc ctttccccta gatttccttt cattctgctc aagtcttcgc ctgtgtccga    180
tccctatcta ctttctctcc tcttgtaggc aagcctcaga ctccaggctt gagctaggtt    240
ttgtttttct cctggtgaga attcgaagac c atg tct acg gaa ctc ttc tca       292
                                    Met SerThr Giu Leu PheSer
                                    1              5
tcc aca aga gag gaa gga agc tct ggc tca gga ccc agt ttt agg tct      340
Ser Thr Arg Glu Glu Gly Ser Ser Gly Ser Gly Pro Ser Phe Arg Ser
    10                  15                      20
aat caa agg aaa atg tta aac ctg ctc ctg gag aga gac act tcc ttt      388
Asn Gln Arg Lys Met Leu Asn Leu Leu Leu Glu Arg Asp Thr Ser Phe
    25                  30                  35
acc gtc tgt cca gat gtc cct aga act cca gtg ggc aaa ttt ctt ggt    436
Thr Val Cys Pro Asp Val Pro Arg Thr Pro Val Gly Lys Phe Leu Gly
40                  45                  50                  55
gat tct gca aac cta agc att ttg tct gga gga acc cca aaa cgt tgc    484
Asp Ser Ala Asn Leu Ser Ile Leu Ser Gly Gly Thr Pro Lys Arg Cys
                60                  65                  70
ctc gat ctt tcg aat ctt agc agt ggg gag ata act gcc act cag ctt    532
Leu Asp Leu Ser Asn Leu Ser Ser Gly Glu Ile Thr Ala Thr Gln Leu
            75                  80                  85
acc act tct gca gac ctt gat gaa act ggt cac ctg gat tct tca gga    580
Thr Thr Ser Ala Asp Leu Asp Glu Thr Gly His Leu Asp Ser Ser Gly
        90                  95                  100
ctt cag gaa gtg cat tta gct ggg atg aat cat gac cag cac cta atg    628
Leu Gln Glu Val His Leu Ala Gly Met Asn Hi s Asp Gln His Leu Met
    105                 110                 115
aaa tgt agc cca gca cag ctt ctt tgt agc act ccg aat ggt ttg gac    676
Lys Cys Ser Pro Ala Gln Leu Leu Cys Ser Thr Pro Asn Gly Leu Asp
120                 125                 130                 135
cgt ggc cat aga aag aga gat gca atg tgt agt tca tct gca aat aaa    724
Arg Gly His Arg Lys Arg Asp Ala Met Cys Ser Ser Ser Ala Asn Lys
                140                 145                 150
gaa aat gac aat gga aac ttg gtg gac agt gaa atg aaa tat ttg ggc    772
Glu Asn Asp Asn Gly Asn Leu Val Asp Ser Glu Met Lys Tyr Leu Gly
            155                 160                 165
agt ccc att act act gtt cca aaa ttg gat aaa aat cca aac cta gga    820
Ser Pro Ile Thr Thr Val Pro Lys Leu Asp Lys Asn Pro Asn Leu Gly
        170                 175                 180
gaa gac cag gca gaa gag att tca gat gaa tta atg gag ttt tcc ctg    868
Glu Asp Gln Ala Glu Glu Ile Ser Asp Glu Leu Met Glu Phe Ser Leu
    185                 190                 195
aaa gat caa gaa gca aag gtg agc aga agt ggc cta tat cgc tcc ccg    916
Lys Asp Gln Glu Ala Lys Val Ser Arg Ser Gly Leu Tyr Arg Ser Pro
200                 205                 210                 215
tcg atg cca gag aac ttg aac agg cca aga ctg aag cag gtg gaa aaa    964
Ser Met Pro Glu Asn Leu Asn Arg Pro Arg Leu Lys Gln Val Glu Lys
                220                 225                 230
ttc aag gac aac aca ata cca gat aaa gtt aaa aaa aag tat ttt tct    1012
Phe Lys Asp Asn Thr Ile Pro Asp Lys Val Lys Lys Lys Tyr Phe Ser
            235                 240                 245
ggc caa gga aag ctc agg aag ggc tta tgt tta aag aag aca gtc tct    1060
Gly Gln Gly Lys Leu Arg Lys Gly Leu Cys Leu Lys Lys Thr Val Ser
        250                 255                 260
ctg tgt gac att act atc act cag atg ctg gag gaa gat tct aac cag    1108
Leu Cys Asp Ile Thr Ile Thr Gln Met Leu Glu Glu Asp Ser Asn Gln
    265                 270                 275
ggg cac ctg att ggt gat ttt tcc aag gta tgt gcg ctg cca acc gtg    1158
Gly His Leu Ile Gly Asp Phe Ser Lys Val Cys Ala Leu Pro Thr Val
280                 285                 290                 295
tca ggg aaa cac caa gat ctg aag tat gtc aac cca gaa aca gtg gct    1204
Ser Gly Lys His Gln Asp Leu Lys Tyr Val Asn Pro Glu Thr Val Ala
                300                 305                 310
gcc tta ctg tcg ggg aag ttc cag ggt ctg att gag aag ttt tat gtc    1252
Ala Leu Leu Ser Gly Lys Phe Gln Gly Leu Ile Glu Lys Phe Tyr Val
            315                 320                 325
att gat tgt cgc tat cca tat gag tat ctg gga gga cac atc cag gga    1300
Ile Asp Cys Arg Tyr Pro Tyr Glu Tyr Leu Gly Gly His Ile Gln Gly
        330                 335                 340
gcc tta aac tta tat agt cag gaa gaa ctg ttt aac ttc ttt ctg aag    1348
Ala Leu Asn Leu Tyr Ser Gln Glu Glu Leu Phe Asn Phe Phe Leu Lys
    345                 350                 355
aag ccc atc gtc cct ttg gac acc cag aag aga ata atc atc gtg ttc    1396
Lys Pro Ile Val Pro Leu Asp Thr Gln Lys Arg Ile Ile Ile Val Phe
360                 365                 370                 375
cac tgt gaa ttc tcc tca gag agg ggc ccc cga atg tgc cgc tgt ctg    1444
His Cys Glu Phe Ser Ser Glu Arg Gly Pro Arg Met Cys Arg Cys Leu
                380                 385                 390
cgt gaa gag gac agg tct ctg aac cag tat cct gca ttg tac tac cca    1492
Arg Glu Glu Asp Arg Ser Leu Asn Gln Tyr Pro Ala Leu Tyr Tyr Pro
            395                 400                 405
gag cta tat atc ctt aaa ggc ggc tac aga gac ttc ttt cca gaa tat    1540
Glu Leu Tyr Ile Leu Lys Gly Gly Tyr Arg Asp Phe Phe Pro Glu Tyr
        410                 415                 420
atg gaa ctg tgt gaa cca cag agc tac tgc cct atg cat cat cag gac    1588
Met Glu Leu Cys Glu Pro Gln Ser Tyr Cys Pro Met His His Gln Asp
    425                 430                 435
cac aag act gag ttg ctg agg tgt cga agc cag agc aaa gtg cag gaa    1636
His Lys Thr Glu Leu Leu Arg Cys Arg Ser Gln Ser Lys Val Gln Glu
440                 445                 450                 455
ggg gag cgg cag ctg cgg gag cag att gcc ctt ctg gtg aag gac atg    1684
Gly Glu Arg Gln Leu Arg Glu Gln Ile Ala Leu Leu Val Lys Asp Met
                460                 465                 470
agc cca  tga  taacattcca gccactggct gctaacaagt  caccaaaaga           1733
Ser Pro
cactgcagaa accctgagca gaaagaggcc ttctggatgg ccaaacccaa gattattaaa    1793
agatgtctct gcaaaccaac aggctaccaa cttgtatcca ggcctgggaa tggattaggt    1853
ttcagcagag ctgaaagctg gtggcagagt cctggagctg gctctataag gcagccttga    1913
gttgcataga gatttgtatt ggttcaggga actctggcat tccttttccc aactcctcat    1973
gtcttctcac aagccagcca actctttctc tctgggcttc gggctatgca agagcgttgt    2033
ctaccttctt tctttgtatt ttccttcttt gtttccccct ctttcttttt taaaaatgga    2093
aaaataaaca ctacagaatg ag                                             2115
 
<210>54
<211>473
<212>PRT
<213>人(Homo sa piens)
 
<400>54
 
Met Ser Thr Glu Leu Phe Ser Ser Thr Arg Glu Glu Gly Ser Ser Gly
1               5                   10                  15
Ser Gly Pro Ser Phe Arg Ser Asn Gln Arg Lys Met Leu Asn Leu Leu
            20                  25                  30
Leu Glu Arg Asp Thr Ser Phe Thr Val Cys Pro Asp Val Pro Arg Thr
        35                  40                  45
Pro Val Gly Lys Phe Leu Gly Asp Ser Ala Asn Leu Ser Ile Leu Ser
    50                  55                  60
Gly Gly Thr Pro Lys Arg Cys Leu Asp Leu Ser Asn Leu Ser Ser Gly
65                  70                  75                  80
Glu Ile Thr Ala Thr Gln Leu Thr Thr Ser Ala Asp Leu Asp Glu Thr
                85                  90                  95
Gly His Leu Asp Ser Ser Gly Leu Gln Glu Val His Leu Ala Gly Met
            100                 105                 110
Asn His Asp Gln His Leu Met Lys Cys Ser Pro Ala Gln Leu Leu Cys
        115                 120                 125
Ser Thr Pro Ash Gly Leu Asp Arg Gly His Arg Lys Arg Asp Ala Met
    130                 135                 140
Cys Ser Ser Ser Ala Asn Lys Glu Asn Asp Asn Gly Asn Leu Val Asp
145                 150                 155                 160
Ser Glu Met Lys Tyr Leu Gly Ser Pro Ile Thr Thr Val Pro Lys Leu
                165                 170                 175
Asp Lys Asn Pro Asn Leu Gly Glu Asp Gln Ala Glu Glu Ile Ser Asp
            180                 185                 190
Glu Leu Met Glu Phe Ser Leu Lys Asp Gln Glu Ala Lys Val Ser Arg
        195                 200                 205
Ser Gly Leu Tyr Arg Ser Pro Ser Met Pro Glu Asn Leu Asn Arg Pro
    210                 215                 220
Arg Leu Lys Gln Val Glu Lys Phe Lys Asp Asn Thr Ile Pro Asp Lys
225                 230                 235                 240
Val Lys Lys Lys Tyr Phe Ser Gly Gln Gly Lys Leu Arg Lys Gly Leu
                245                 250                 255
Cys Leu Lys Lys Thr Val Ser Leu Cys Asp Ile Thr Ile Thr Gln Met
            260                 265                 270
Leu Glu Glu Asp Ser Asn Gln Gly His Leu Ile Gly Asp Phe Ser Lys
    275                 280                 285
Val Cys Ala Leu Pro Thr Val Ser Gly Lys His Gln Asp Leu Lys Tyr
    290                 295                 300
Val Asn Pro Glu Thr Val Ala Ala Leu Leu Ser Gly Lys Phe Gln Gly
305                 310                 315                 320
Leu Ile Glu Lys Phe Tyr Val Ile Asp Cys Arg Tyr Pro Tyr Glu Tyr
                325                 330                 335
Leu Gly Gly His Ile Gln Gly Ala Leu Asn Leu Tyr Ser Gln Glu Glu
            340                 345                 350
Leu Phe Asn Phe Phe Leu Lys Lys Pro Ile Val Pro Leu Asp Thr Gln
        355                 360                 365
Lys Arg Ile Ile Ile Val Phe His Cys Glu Phe Ser Ser Glu Arg Gly
    370                 375                 380
Pro Arg Met Cys Arg Cys Leu Arg Glu Glu Asp Arg Ser Leu Asn Gln
385                 390                 395                 400
Tyr Pro Ala Leu Tyr Tyr Pro Glu Leu Tyr Ile Leu Lys Gly Gly Tyr
                405                 410                 415
Arg Asp Phe Phe Pro Glu Tyr Met Glu Leu Cys Glu Pro Gln Ser Tyr
            420                 425                 430
Cys Pro Met His His Gln Asp His Lys Thr Glu Leu Leu Arg Cys Arg
        435                 440                 445
Ser Gln Ser Lys Val Gln Glu Gly Glu Arg Gln Leu Arg Glu Gln Ile
    450                 455                460
Ala Leu Leu Val Lys Asp Met Ser Pro
465                 470
 
<210>55
<211>6641
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(188)..(4360)
 
<400>55
gccctcgccg cccgcggcgc cccgagcgct ttgtgagcag atgcggagcc gagtggaggg    60
cgcgagccag atgcggggcg acagctgact tgctgagagg aggcggggag gcgcggagcg    120
cgcgtgtggt ccttgcgccg ctgacttctc cactggttcc tgggcaccga aagataaacc    180
tctcata atg aag gcc ccc gct gtg ctt gca cct ggc atc ctc gtg ctc      229
        Met Lys Ala Pro Ala Val Leu Ala Pro Gly Ile Leu Val Leu
        1               5                   10
ctg ttt acc ttg gtg cag agg agc aat ggg gag tgt aaa gag gca cta      277
Leu Phe Thr Leu Val Gln Arg Ser Asn Gly Glu Cys Lys Glu Ala Leu
15                  20                  25                  30
gca aag tcc gag atg aat gtg aat atg aag tat cag ctt ccc aac ttc      325
Ala Lys Ser Glu Met Asn Val Asn Met Lys Tyr Gln Leu Pro Asn Phe
                35                  40                  45
acc gcg gaa aca ccc atc cag aat gtc att cta cat gag cat cae att       373
Thr Ala Glu Thr Pro Ile Gln Asn Val Ile Leu His Glu His His Ile
            50                  55                  60
ttc ctt ggt gcc act aac tac att tat gtt tta aat gag gaa gac ctt       421
Phe Leu Gly Ala Thr Asn Tyr Ile Tyr Val Leu Asn Glu Glu Asp Leu
        65                  70                  75
cag aag gtt gct gag tac aag act ggg cct gtg ctg gaa cac cca gat       469
Gln Lys Val Ala Glu Tyr Lys Thr Gly Pro Val Leu Glu His Pro Asp
    80                  85                  90
tgt ttc cca tgt cag gac tgc agc agc aaa gcc aat tta tca gga ggt       517
Cys Phe Pro Cys Gln Asp Cys Ser Ser Lys Ala Asn Leu Ser Gly Gly
95                  100                 105                 110
gtt tgg aaa gat aac atc aac atg gct cta gtt gtc gac acc tac tat       565
Val Trp Lys Asp Asn Ile Asn Met Ala Leu Val Val Asp Thr Tyr Tyr
                115                 120                 125
gat gat caa ctc att agc tgt ggc agc gtc aac aga ggg acc tgc cag       613
Asp Asp Gln Leu Ile Ser Cys Gly Ser Val Asn Arg Gly Thr Cys Gln
            130                 135                 140
cga cat gtc ttt ccc cac aat cat act gct gac ata cag tcg gag gtt       661
Arg His Val Phe Pro His Asn His Thr Ala Asp Ile Gln Ser Glu Val
        145                 150                 155
cac tgc ata ttc tcc cca cag ata gaa gag ccc agc cag tgt cct gac       709
His Cys Ile Phe Ser Pro Gln Ile Glu Glu Pro Ser Gln Cys Pro Asp
    160                 165                 170
tgt gtg gtg agc gcc ctg gga gcc aaa gtc ctt tca tct gta aag gac       757
Cys Val Val Ser Ala Leu Gly Ala Lys Val Leu Ser Ser Val Lys Asp
175                 180                 185                 190
cgg ttc atc aac ttc ttt gta ggc aat acc ata aat tct tct tat ttc       805
Arg Phe Ile Asn Phe Phe Val Gly Asn Thr Ile Asn Ser Ser Tyr Phe
                195                 200                 205
cca gat cat cca ttg cat tcg ata tca gtg aga agg cta aag gaa acg       853
Pro Asp His Pro Leu His Ser Ile Ser Val Arg Arg Leu Lys Glu Thr
            210                 215                 220
aaa gat ggt ttt atg ttt ttg acg gac cag tcc tac att gat gtt tta       901
Lys Asp Gly Phe Met Phe Leu Thr Asp Gln Ser Tyr Ile Asp Val Leu
        225                 230                 235
cct gag ttc aga gat tct tac ccc att aag tat gtc cat gcc ttt gaa       949
Pro Glu Phe Arg Asp Ser Tyr Pro Ile Lys Tyr Val His Ala Phe Glu
    240                 245                 250
agc aac aat ttt att tac ttc ttg acg gtc caa agg gaa act cta gat       997
Ser Asn Asn Phe Ile Tyr Phe Leu Thr Val Gln Arg Glu Thr Leu Asp
255                 260                 265                 270
gct cag act ttt cac aca aga ata atc agg ttc tgt tcc ata aac tct       1045
Ala Gln Thr Phe His Thr Arg Ile Ile Arg Phe Cys Ser Ile Asn Ser
                275                 280                 285
gga ttg cat tcc tac atg gaa atg cct ctg gag tgt att ctc aca gaa       1093
Gly Leu His Ser Tyr Met Glu Met Pro Leu Glu Cys Ile Leu Tnr Glu
            290                 295                 300
aag aga aaa aag aga tcc aca aag aag gaa gtg ttt aat ata ctt cag       1141
Lys Arg Lys Lys Arg Ser Thr Lys Lys Glu Val Phe Asn Ile Leu Gln
        305                 310                 315
gct gcg tat gtc agc aag cct ggg gcc cag ctt gct aga caa ata gga       1189
Ala Ala Tyr Val Ser Lys Pro Gly Ala Gln Leu Ala Arg Gln Ile Gly
    320                 325                 330
gcc agc ctg aat gat gac att ctt ttc ggg gtg ttc gca caa agc aag       1237
Ala Ser Leu Asn Asp Asp Ile Leu Phe Gly Val Phe Ala Gln Ser Lys
335                 340                 345                 350
cca gat tct gcc gaa cca atg gat cga tct gcc atg tgt gca ttc cct       1285
Pro Asp Ser Ala Glu Pro Met Asp Arg Ser Ala Met Cys Ala Phe Pro
                355                 360                 365
atc aaa tat gtc aac gac ttc ttc aac aag atc gtc aac aaa aac aat       1333
Ile Lys Tyr Val Asn Asp Phe Phe Asn Lys Ile Val Asn Lys Asn Asn
            370                 375                 380
gtg aga tgt ctc cag cat ttt tac gga ccc aat cat gag cac tgc ttt       1381
Val Arg Cys Leu Gln His Phe Tyr Gly Pro Asn His Glu His Cys Phe
        385                 390                 395
aat agg aca ctt ctg aga aat tca tca ggc tgt gaa gcg cgc cgt gat       1429
Asn Arg Thr Leu Leu Arg Asn Ser Ser Gly Cys Glu Ala Arg Arg Asp
    400                 405                 410
gaa tat cga aca gag ttt acc aca gct ttg cag cgc gtt gac tta ttc       1477
Glu Tyr Arg Thr Glu Phe Thr Thr Ala Leu Gln Arg Val Asp Leu Phe
415                 420                 425                 430
atg ggt caa ttc agc gaa gtc ctc tta aca tct ata tcc acc ttc att       1525
Met Gly Gln Phe Ser Glu Val Leu Leu Thr Ser Ile Ser Thr Phe Ile
                435                 440                 445
aaa gga gac ctc acc ata gct aat ctt ggg aca tca gag ggt cgc ttc       1573
Lys Gly Asp Leu Thr Ile Ala Asn Leu Gly Thr Ser Glu Gly Arg Phe
            450                 455                 460
atg cag gtt gtg gtt tct cga tca gga cca tca acc cct cat gtg aat       1621
Met Gln Val Val Val Ser Arg Ser Gly Pro Ser Thr Pro His Val Asn
        465                 470                 475
ttt ctc ctg gac tcc cat cca gtg tct cca gaa gtg att gtg gag cat       1669
Phe Leu Leu Asp Ser His Pro Val Ser Pro Glu Val Ile Val Glu His
    480                 485                 490
aca tta aac caa aat ggc tac aca ctg gtt atc act ggg aag aag atc       1717
Thr Leu Asn Gln Asn Gly Tyr Thr Leu Val Ile Thr Gly Lys Lys Ile
495                 500                 505                 510
acg aag atc cca ttg aat ggc ttg ggc tgc aga cat ttc cag tcc tgc       1765
Thr Lys Ile Pro Leu Asn Gly Leu Gly Cys Arg His Phe Gln Ser Cys
                515                 520                 525
agt caa tgc ctc tct gcc cca ccc ttt gtt cag tgt ggc tgg tgc cac       1813
Ser Gln Cys Leu Ser Ala Pro Pro Phe Val Gln Cys Gly Trp Cys His
            530                 535                 540
gac aaa tgt gtg cga tcg gag gaa tgc ctg agc ggg aca tgg act caa       1861
Asp Lys Cys Val Arg Ser Glu Glu Cys Leu Ser Gly Thr Trp Thr Gln
        545                 550                 555
cag atc tgt ctg cct gca atc tac aag gtt ttc cca aat agt gca ccc       1909
Gln Ile Cys Leu Pro Ala Ile Tyr Lys Val Phe Pro Asn Ser Ala Pro
    560                 565                 570
ctt gaa gga ggg aca agg ctg acc ata tgt ggc tgg gac ttt gga ttt       1957
Leu Glu Gly Gly Thr Arg Leu Thr Ile Cys Gly Trp Asp Phe Gly Phe
575                 580                 585                 590
cgg agg aat aat aaa ttt gat tta aag aaa act aga gtt ctc ctt gga       2005
Arg Arg Asn Asn Lys Phe Asp Leu Lys Lys Thr Arg Val Leu Leu Gly
                595                 600                 605
aat gag agc tgc acc ttg act tta agt gag agc acg atg aat aca ttg       2053
Asn Glu Ser Cys Thr Leu Thr Leu Ser Glu Ser Thr Met Asn Thr Leu
            610                 615                 620
aaa tgc aca gtt ggt cct gcc atg aat aag cat ttc aat atg tcc ata       2101
Lys Cys Thr Val Gly Pro Ala Met Asn Lys His Phe Asn Met Ser Ile
        625                 630                 635
att att tca aat ggc cac ggg aca aca caa tac agt aca ttc tcc tat       2149
Ile Ile Ser Asn Gly His Gly Thr Thr Gln Tyr Ser Thr Phe Ser Tyr
    640                 645                 650
gtg gat cct gta ata aca agt att tcg ccg aaa tac ggt cct atg gct       2197
Val Asp Pro Val Ile Thr Ser Ile Ser Pro Lys Tyr Gly Pro Met Ala
655                 660                 665                 670
ggt ggc act tta ctt act tta act gga aat tac cta aac agt ggg aat       2245
Gly Gly Thr Leu Leu Thr Leu Thr Gly Asn Tyr Leu Asn Ser Gly Asn
                675                 680                 685
tct aga cac att tca att ggt gga aaa aca tgt act tta aaa agt gtg       2293
Ser Arg His Ile Ser Ile Gly Gly Lys Thr Cys Thr Leu Lys Ser Val
            690                 695                 700
tca aac agt att ctt gaa tgt tat acc cca gcc caa acc att tca act       2341
Ser Asn Ser Ile Leu Glu Cys Tyr Thr Pro Ala Gln Thr Ile Ser Thr
        705                 710                 715
gag ttt gct gtt aaa ttg aaa att gac tta gcc aac cga gag aca agc       2389
Glu Phe Ala Val Lys Leu Lys Ile Asp Leu Ala Asn Arg Glu Thr Ser
    720                 725                 730
atc ttc agt tac cgt gaa gat ccc att gtc tat gaa att cat cca acc       2437
Ile Phe Ser Tyr Arg Glu Asp Pro Ile Val Tyr Glu Ile His Pro Thr
735                 740                 745                 750
aaa tct ttt att agt ggt ggg agc aca ata aca ggt gtt ggg aaa aac       2485
Lys Ser Phe Ile Ser Gly Gly Ser Thr Ile Thr Gly Val Gly Lys Asn
                755                 760                 765
ctg aat tca gtt agt gtc ccg aga atg gtc ata aat gtg cat gaa gca       2533
Leu Asn Ser Val Ser Val Pro Arg Met Val Ile Asn Val His Glu Ala
            770                 775                 780
gga agg aac ttt aca gtg gca tgt caa cat cgc tct aat tca gag ata       2581
Gly Arg Asn Phe Thr Val Ala Cys Gln His Arg Ser Asn Ser Glu Ile
        785                 790                 795
atc tgt tgt acc act cct tcc ctg caa cag ctg aat ctg caa ctc ccc       2629
Ile Cys Cys Thr Thr Pro Ser Leu Gln Gln Leu Asn Leu Gln Leu Pro
    800                 805                 810
ctg aaa acc aaa gcc ttt ttc atg tta gat ggg atc ctt tcc aaa tac       2677
Leu Lys Thr Lys Ala Phe Phe Met Leu Asp Gly Ile Leu Ser Lys Tyr
815                 820                 825                 830
ttt gat ctc att tat gta cat aat cct gtg ttt aag cct ttt gaa aag       2725
Phe Asp Leu Ile Tyr Val His Asn Pro Val Phe Lys Pro Phe Glu Lys
                835                 840                 845
cca gtg atg atc tca atg ggc aat gaa aat gta ctg gaa att aag gga       2773
Pro Val Met Ile Ser Met Gly Asn Glu Asn Val Leu Glu Ile Lys Gly
            850                 855                 860
aat gat att gac cct gaa gca gtt aaa ggt gaa gtg tta aaa gtt gga       2821
Asn Asp Ile Asp Pro Glu Ala Val Lys Gly Glu Val Leu Lys Val Gly
        865                 870                 875
aat aag agc tgt gag aat ata cac tta cat tct gaa gcc gtt tta tgc       2869
Asn Lys Ser Cys Glu Asn Ile His Leu His Ser Glu Ala Val Leu Cys
    880                 885                 890
acg gtc ccc aat gac ctg ctg aaa ttg aac agc gag cta aat ata gag    2917
Thr Val Pro Asn Asp Leu Leu Lys Leu Asn Ser Glu Leu Asn Ile Glu
895                 900                 905                 910
tgg aag caa gca att tct tca acc gtc ctt gga aaa gta ata gtt caa    2965
Trp Lys Gln Ala Ile Ser Ser Thr Val Leu Gly Lys Val Ile Val Gln
                915                 920                 925
cca gat cag aat ttc aca gga ttg att gct ggt gtt gtc tca ata tca    3013
Pro Asp Gln Asn Phe Thr Gly Leu Ile Ala Gly Val Val Ser Ile Ser
            930                 935                 940
aca gca ctg tta tta cta ctt ggg ttt ttc ctg tgg ctg aaa aag aga    3061
Thr Ala Leu Leu Leu Leu Leu Gly Phe Phe Leu Trp Leu Lys Lys Arg
        945                 950                 955
aag caa att aaa gat ctg ggc agt gaa tta gtt cgc tac gat gca aga    3109
Lys Gln Ile Lys Asp Leu Gly Ser Glu Leu Val Arg Tyr Asp Ala Arg
    960                 965                 970
gta cac act cct cat ttg gat agg ctt gta agt gcc cga agt gta agc    3157
Val His Thr Pro His Leu Asp Arg Leu Val Ser Ala Arg Ser Val Ser
975                 980                 985                 990
cca act aca gaa atg gtt tca aat gaa tct gta gac tac cga gct act    3205
Pro Thr Thr Glu Met Val Ser Asn Glu Ser Val Asp Tyr Arg Ala Thr
                995                 1000                1005
ttt cca gaa gat cag ttt cct aat tca tct cag aac ggt tca tgc        3250
Phe Pro Glu Asp Gln Phe Pro Asn Ser Ser Gln Asn Gly Ser Cys
            1010                1015                1020
cga caa gtg cag tat cct ctg aca gac atg tcc ccc atc cta act        3295
Arg Gln Val Gln Tyr Pro Leu Thr Asp Met Ser Pro Ile Leu Thr
            1025                1030                1035
agt ggg gac tct gat ata tcc agt cca tta ctg caa aat act gtc        3340
Ser Gly Asp Ser Asp Ile Ser Ser Pro Leu Leu Gln Asn Thr Val
            1040                1045                1050
cac att gac ctc agt gct cta aat cca gag ctg gtc cag gca gtg        3385
His Ile Asp Leu Ser Ala Leu Asn Pro Glu Leu Val Gln Ala Val
            1055                1060                1065
cag cat gta gtg att ggg ccc agt agc ctg att gtg cat ttc aat        3430
Gln His Val Val Ile Gly Pro Ser Ser Leu Ile Val His Phe Asn
            1070                1075                1080
gaa gtc ata gga aga ggg cat ttt ggt tgt gta tat cat ggg act         3475
Glu Val Ile Gly Arg Gly His Phe Gly Cys Val Tyr His Gly Thr
            1085                1090                1095
ttg ttg gac aat gat ggc aag aaa att cac tgt gct gtg aaa tcc        3520
Leu Leu Asp Asn Asp Gly Lys Lys Ile His Cys Ala Val Lys Ser
            1100                1105                1110
ttg aac aga atc act gac ata gga gaa gtt tcc caa ttt ctg acc        3565
Leu Asn Arg Ile Thr Asp Ile Gly Glu Val Ser Gln Phe Leu Thr
            1115                1120                1125
gag gga atc atc atg aaa gat ttt agt cat ccc aat gtc ctc tcg        3610
Glu Gly Ile Ile Met Lys Asp Phe Ser His Pro Asn Val Leu Ser
            1130                1135                1140
ctc ctg gga atc tgc ctg cga agt gaa ggg tct ccg ctg gtg gtc        3655
Leu Leu Gly Ile Cys Leu Arg Ser Glu Gly Ser Pro Leu Val Val
            1145                1150                1155
cta cca tac atg aaa cat gga gat ctt cga aat ttc att cga aat        3700
Leu Pro Tyr Met Lys His Gly Asp Leu Arg Asn Phe Ile Arg Asn
            1160                1165                1170
gag act cat aat cca act gta aaa gat ctt att ggc ttt ggt ctt        3745
Glu Thr His Asn Pro Thr Val Lys Asp Leu Ile Gly Phe Gly Leu
            1175                1180                1185
caa gta gcc aaa ggc atg aaa tat ctt gca agc aaa aag ttt gtc        3790
Gln Val Ala Lys Gly Met Lys Tyr Leu Ala Ser Lys Lys Phe Val
            1190                1195                1200
cac aga gac ttg gct gca aga aac tgt atg ctg gat gaa aaa ttc        3835
His Arg Asp Leu Ala Ala Arg Asn Cys Met Leu Asp Glu Lys Phe
            1205                1210                1215
aca gtc aag gtt gct gat ttt ggt ctt gcc aga gac atg tat gat        3880
Thr Val Lys Val Ala Asp Phe Gly Leu Ala Arg Asp Met Tyr Asp
            1220                1225                1230
aaa gaa tac tat agt gta cac aac aaa aca ggt gca aag ctg cca        3925
Lys Glu Tyr Tyr Ser Val His Asn Lys Thr Gly Ala Lys Leu Pro
            1235                1240                1245
gtg aag tgg atg gct ttg gaa agt ctg caa act caa aag ttt acc        3970
Val Lys Trp Met Ala Leu Glu Ser Leu Gln Thr Gln Lys Phe Thr
            1250                1255                1260
acc aag tca gat gtg tgg tcc ttt ggc gtg ctc ctc tgg gag ctg        4015
Thr Lys Ser Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu Leu
            1265                1270                1275
atg aca aga gga gcc cca cct tat cct gac gta aac acc ttt gat        4060
Met Thr Arg Gly Ala Pro Pro Tyr Pro Asp Val Asn Thr Phe Asp
            1280                1285                1290
ata act gtt tac ttg ttg caa ggg aga aga ctc cta caa ccc gaa        4105
Ile Thr Val Tyr Leu Leu Gln Gly Arg Arg Leu Leu Gln Pro Glu
            1295                1300                1305
tac tgc cca gac ccc tta tat gaa gta atg cta aaa tgc tgg cac        4150
Tyr Cys Pro Asp Pro Leu Tyr Glu Val Met Leu Lys Cys Trp His
            1310                1315                1320
cct aaa gcc gaa atg cgc cca tcc ttt tct gaa ctg gtg tcc cgg        4195
Pro Lys Ala Glu Met Arg Pro Ser Phe Ser Glu Leu Val Ser Arg
            1325                1330                1335
ata tca gcg atc ttc tct act ttc att ggg gag cac tat gtc cat        4240
Ile Ser Ala Ile Phe Ser Thr Phe Ile Gly Glu His Tyr Val His
            1340                1345                1350
gtg aac gct act tat gtg aac gta aaa tgt gtc gct ccg tat cct        4285
Val Asn Ala Thr Tyr Val Asn Val Lys Cys Val Ala Pro Tyr Pro
            1355                1360                1365
tct ctg ttg tca tca gaa gat aac gct gat gat gag gtg gac aca        4330
Ser Leu Leu Ser Ser Glu Asp Asn Ala Asp Asp Glu Val Asp Thr
            1370                1375                1380      
cga cca gcc tcc ttc tgg gag aca tca tag tgctagtact atgtcaaagc      4380
Arg Pro Ala Ser Phe Trp Glu Thr Ser
            1385                1390
aacagtccac actttgtcca atggtttttt cactgcctga cctttaaaag gccatcgata     4440
ttctttgctc ttgccaaaat tgcactatta taggacttgt attgttattt aaattactgg     4500
attctaagga atttcttatc tgacagagca tcagaaccag aggcttggtc ccacaggcca     4560
cggaccaatg gcctgcagcc gtgacaacac tcctgtcata ttggagtcca aaacttgaat     4620
tctgggttga attttttaaa aatcaggtac cacttgattt catatgggaa attgaagcag     4680
gaaatattga gggcttcttg atcacagaaa actcagaaga gatagtaatg ctcaggacag     4740
gagcggcagc cccagaacag gccactcatt tagaattcta gtgtttcaaa acacttttgt     4800
gtgttgtatg gtcaataaca tttttcatta ctgatggtgt cattcaccca ttaggtaaac     4860
attccctttt aaatgtttgt ttgttttttg agacaggatc tcactctgtt gccagggctg     4920
tagtgcagtg gtgtgatcat agctcactgc aacctccacc tcccaggctc aagcctcccg     4980
aatagctggg actacaggcg cacaccacca tccccggcta atttttgtat tttttgtaga     5040
gacggggttt tgccatgttg ccaaggctgg tttcaaactc ctggactcaa gaaatccacc     5100
cacctcagcc tcccaaagtg ctaggattac aggcatgagc cactgcgccc agcccttata     5160
aatttttgta tagacattcc tttggttgga agaatattta taggcaatac agtcaaagtt     5220
tcaaaatagc atcacacaaa acatgtttat aaatgaacag gatgtaatgt acatagatga     5280
cattaagaaa atttgtatga aataatttag tcatcatgaa atatttagtt gtcatataaa     5340
aacccactgt ttgagaatga tgctactctg atctaatgaa tgtgaacatg tagatgtttt     5400
gtgtgtattt ttttaaatga aaactcaaaa taagacaagt aatttgttga taaatatttt     5460
taaagataac tcagcatgtt tgtaaagcag gatacatttt actaaaaggt tcattggttc     5520
caatcacagc tcataggtag agcaaagaaa gggtggatgg attgaaaaga ttagcctctg     5580
tctcggtggc aggttcccac ctcgcaagca attggaaaca aaacttttgg ggagttttat     5640
tttgcattag ggtgtgtttt atgttaagca aaacatactt tagaaacaaa tgaaaaaggc     5700
aattgaaaat cccagctatt tcacctagat ggaatagcca ccctgagcag aactttgtga     5760
tgcttcattc tgtggaattt tgtgcttgct actgtatagt gcatgtggtg taggttactc     5820
taactggttt tgtcgacgta aacatttaaa gtgttatatt ttttataaaa atgtttattt     5880
ttaatgatat gagaaaaatt ttgttaggcc acaaaaacac tgcactgtga acattttaga     5940
aaaggtatgt cagactggga ttaatgacag catgattttc aatgactgta aattgcgata     6000
aggaaatgta ctgattgcca atacacccca ccctcattac atcatcagga cttgaagcca     6060
agggttaacc cagcaagcta caaagagggt gtgtcacact gaaactcaat agttgagttt     6120
ggctgttgtt gcaggaaaat gattataact aaaagctctc tgatagtgca gagacttacc     6180
agaagacaca aggaattgta ctgaagagct attacaatcc aaatattgcc gtttcataaa     6240
tgtaataagt aatactaatt cacagagtat tgtaaatggt ggatgacaaa agaaaatctg     6300
ctctgtggaa agaaagaact gtctctacca gggtcaagag catgaacgca tcaatagaaa     6360
gaactcgggg aaacatccca tcaacaggac tacacacttg tatatacatt cttgagaaca     6420
ctgcaatgtg aaaatcacgt ttgctattta taaacttgtc cttagattaa tgtgtctgga     6480
cagattgtgg gagtaagtga ttcttctaag aattagatac ttgtcactgc ctatacctgc     6540
agctgaactg aatggtactt cgtatgttaa tagttgttct gataaatcat gcaattaaag     6600
taaagtgatg caacatcttg taaaaaaaaa aaaaaaaaaa a                         6641
 
<210>56
<211>1390
<212>PRT
<213>人(Homo sapiens)
 
<400>56
 
Met Lys Ala Pro Ala Val Leu Ala Pro Gly Ile Leu Val Leu Leu Phe
1               5                   10                  15
Thr Leu Val Gln Arg Ser Asn Gly Glu Cys Lys Glu Ala Leu Ala Lys
            20                  25                  30
Ser Glu Met Asn Val Asn Met Lys Tyr Gln Leu Pro Asn Phe Thr Ala
        35                  40                  45
Glu Thr Pro Ile Gln Asn Val Ile Leu His Glu His His Ile Phe Leu
    50                  55                  60
Gly Ala Thr Asn Tyr Ile Tyr Val Leu Asn Glu Glu Asp Leu Gln Lys
65                  70                  75                  80
Val Ala Glu Tyr Lys Thr Gly Pro Val Leu Glu His Pro Asp Cys Phe
                85                  90                  95
Pro Cys Gln Asp Cys Ser Ser Lys Ala Asn Leu Ser Gly Gly Val Trp
            100                 105                 110
Lys Asp Asn Ile Asn Met Ala Leu Val Val Asp Thr Tyr Tyr Asp Asp
        115                 120                 125
Gln Leu Ile Ser Cys Gly Ser Val Asn Arg Gly Thr Cys Gln Arg His
    130                 135                 140
Val Phe Pro His Asn His Thr Ala Asp Ile Gln Ser Glu Val His Cys
145                 150                 155                 160
Ile Phe Ser Pro Gln Ile Glu Glu Pro Ser Gln Cys Pro Asp Cys Val
                165                 170                 175
Val Ser Ala Leu Gly Ala Lys Val Leu Ser Ser Val Lys Asp Arg Phe
            180                 185                 190
Ile Asn Phe Phe Val Gly Asn Thr Ile Asn Ser Ser Tyr Phe Pro Asp
        195                 200                 205
His Pro Leu His Ser Ile Ser Val Arg Arg Leu Lys Glu Thr Lys Asp
    210                 215                 220
Gly Phe Met Phe Leu Thr Asp Gln Ser Tyr Ile Asp Val Leu Pro Glu
225                 230                 235                 240
Phe Arg Asp Ser Tyr Pro Ile Lys Tyr Val His Ala Phe Glu Ser Asn
                245                 250                 255
Asn Phe Ile Tyr Phe Leu Thr Val Gln Arg Glu Thr Leu Asp Ala Gln
            260                 265                 270
Thr Phe His Thr Arg Ile Ile Arg Phe Cys Ser Ile Asn Ser Gly Leu
        275                 280                 285
His Ser Tyr Met Glu Met Pro Leu Glu Cys Ile Leu Thr Glu Lys Arg
    290                 295                 300
Lys Lys Arg Ser Thr Lys Lys Glu Val Phe Asn Ile Leu Gln Ala Ala
305                 310                 315                 320
Tyr Val Ser Lys Pro Gly Ala Gln Leu Ala Arg Gln Ile Gly Ala Ser
                325                 330                 335
Leu Asn Asp Asp Ile Leu Phe Gly Val Phe Ala Gln Ser Lys Pro Asp
            340                 345                 350
Ser Ala Glu Pro Met Asp Arg Ser Ala Met Cys Ala Phe Pro Ile Lys
        355                 360                 365
Tyr Val Asn Asp Phe Phe Asn Lys Ile Val Asn Lys Asn Asn Val Arg
    370                 375                 380
Cys Leu Gln His Phe Tyr Gly Pro Asn His Glu His Cys Phe Asn Arg
385                 390                 395                 400
Thr Leu Leu Arg Asn Ser Ser Gly Cys Glu Ala Arg Arg Asp Glu Tyr
                405                 410                 415
Arg Thr Glu Phe Thr Thr Ala Leu Gln Arg Val Asp Leu Phe Met Gly
            420                 425                 430
Gln Phe Ser Glu Val Leu Leu Thr Ser Ile Ser Thr Phe Ile Lys Gly
        435                 440                 445
Asp Leu Thr Ile Ala Asn Leu Gly Thr Ser Glu Gly Arg Phe Met Gln
    450                 455                 460
Val Val Val Ser Arg Ser Gly Pro Ser Thr Pro His Val Asn Phe Leu
465                 470                 475                 480
Leu Asp Ser His Pro Val Ser Pro Glu Val Ile Val Glu His Thr Leu
                485                 490                 495
Asn Gln Asn Gly Tyr Thr Leu Val Ile Thr Gly Lys Lys Ile Thr Lys
            500                 505                 510
Ile Pro Leu Asn Gly Leu Gly Cys Arg His Phe Gln Ser Cys Ser Gln
        515                 520                 525
Cys Leu Ser Ala Pro Pro Phe Val Gln Cys Gly Trp Cys His Asp Lys
    530                 535                 540
Cys Val Arg Ser Glu Glu Cys Leu Ser Gly Thr Trp Thr Gln Gln Ile
545                 550                 555                 560
Cys Leu Pro Ala Ile Tyr Lys Val Phe Pro Asn Ser Ala Pro Leu Glu
                565                 570                 575
Gly Gly Thr Arg Leu Thr Ile Cys Gly Trp Asp Phe Gly Phe Arg Arg
            580                 585                 590
Asn Asn Lys Phe Asp Leu Lys Lys Thr Arg Val Leu Leu Gly Asn Glu
        595                 600                 605
Ser Cys Thr Leu Thr Leu Ser Glu Ser Thr Met Asn Thr Leu Lys Cys
    610                 615                 620
Thr Val Gly Pro Ala Met Asn Lys His Phe Asn Met Ser Ile Ile Ile
625                 630                 635                 640
Ser Asn Gly His Gly Thr Thr Gln Tyr Ser Thr Phe Ser Tyr Val Asp
                645                 650                 655
Pro Val Ile Thr Ser Ile Ser Pro Lys Tyr Gly Pro Met Ala Gly Gly
            660                 665                 670
Thr Leu Leu Thr Leu Thr Gly Asn Tyr Leu Asn Ser Gly Asn Ser Arg
        675                 680                 685
His Ile Ser Ile Gly Gly Lys Thr Cys Thr Leu Lys Ser Val Ser Asn
    690                 695                 700
Ser Ile Leu Glu Cys Tyr Thr Pro Ala Gln Thr Ile Ser Thr Glu Phe
705                 710                 715                 720
Ala Val Lys Leu Lys Ile Asp Leu Ala Asn Arg Glu Thr Ser Ile Phe
                725                 730                 735
Ser Tyr Arg Glu Asp Pro Ile Val Tyr Glu Ile His Pro Thr Lys Ser
            740                 745                 750
Phe Ile Ser Gly Gly Ser Thr Ile Thr Gly Val Gly Lys Asn Leu Asn
       755                 760                 765
Ser Val Ser Val Pro Arg Met Val Ile Asn Val His Glu Ala Gly Arg
    770                 775                 780
Asn Phe Thr Val Ala Cys Gln His Arg Ser Asn Ser Glu Ile Ile Cys
785                 790                 795                 800
Cys Thr Thr Pro Ser Leu Gln Gln Leu Asn Leu Gln Leu Pro Leu Lys
                805                 810                 815
Thr Lys Ala Phe Phe Met Leu Asp Gly Ile Leu Ser Lys Tyr Phe Asp
            820                 825                 830
Leu Ile Tyr Val His Asn Pro Val Phe Lys Pro Phe Glu Lys Pro Val
        835                 840                 845
Met Ile Ser Met Gly Asn Glu Asn Val Leu Glu Ile Lys Gly Asn Asp
    850                 855                 860
Ile Asp Pro Glu Ala Val Lys Gly Glu Val Leu Lys Val Gly Asn Lys
865                 870                 875                 880
Ser Cys Glu Asn Ile His Leu His Ser Glu Ala Val Leu Cys Thr Val
                885                 890                 895
Pro Asn Asp Leu Leu Lys Leu Asn Ser Glu Leu Asn Ile Glu Trp Lys
            900                 905                 910
Gln Ala Ile Ser Ser Thr Val Leu Gly Lys Val Ile Val Gln Pro Asp
        915                 920                 925
Gln Asn Phe Thr Gly Leu Ile Ala Gly Val Val Ser Ile Ser Thr Ala
    930                 935                 940
Leu Leu Leu Leu Leu Gly Phe Phe Leu Trp Leu Lys Lys Arg Lys Gln
945                 950                 955                 960
Ile Lys Asp Leu Gly Ser Glu Leu Val Arg Tyr Asp Ala Arg Val His
                965                 970                 975
Thr Pro His Leu Asp Arg Leu Val Ser Ala Arg Ser Val Ser Pro Thr
            980                 985                 990
Thr Glu Met Val Ser Asn Glu Ser Val Asp Tyr Arg Ala Thr Phe Pro
        995                 1000                1005
Glu Asp Gln Phe Pro Asn Ser Ser Gln Asn Gly Ser Cys Arg Gln
    1010                1015                1020
Val Gln Tyr Pro Leu Thr Asp Met Ser Pro Ile Leu Thr Ser Gly
    1025                1030                1035
Asp Ser Asp Ile Ser Ser Pro Leu Leu Gln Asn Thr Val His Ile
    1040                1045                1050
Asp Leu Ser Ala Leu Asn Pro Glu Leu Val Gln Ala Val Gln His
    1055                1060                1065
Val Val Ile Gly Pro Ser Ser Leu Ile Val His Phe Asn Glu Val
    1070                1075                1080
Ile Gly Arg Gly His Phe Gly Cys Val Tyr His Giy Thr Leu Leu
    1085                1090                1095
Asp Asn Asp Gly Lys Lys Ile His Cys Ala Val Lys Ser Leu Asn
    1100                1105                1110
Arg Ile Thr Asp Ile Gly Glu Val Ser Gln Phe Leu Thr Glu Gly
    1115                1120                1125
Ile Ile Met Lys Asp Phe Ser His Pro Asn Val Leu Ser Leu Leu
    1130                1135                1140
Gly Ile Cys Leu Arg Ser Glu Gly Ser Pro Leu Val Val Leu Pro
    1145                1150                1155
Tyr Met Lys His Gly Asp Leu Arg Asn Phe Ile Arg Asn Glu Thr
    1160                1165                1170
His Asn Pro Thr Val Lys Asp Leu Ile Gly Phe Gly Leu Gln Val
    1175                1180                1185
Ala Lys Gly Met Lys Tyr Leu Ala Ser Lys Lys Phe Val His Arg
    1190                1195                1200
Asp Leu Ala Ala Arg Asn Cys Met Leu Asp Glu Lys Phe Thr Val
    1205                1210                1215
Lys Val Ala Asp Phe Gly Leu Ala Arg Asp Met Tyr Asp Lys Glu
    1220                1225                1230
Tyr Tyr Ser Val His Asn Lys Thr Gly Ala Lys Leu Pro Val Lys
    1235                1240                1245
Trp Met Ala Leu Glu Ser Leu Gln Thr Gln Lys Phe Thr Thr Lys
    1250                1255                1260
Ser Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu Leu Met Thr
    1265                1270                1275
Arg Gly Ala Pro Pro Tyr Pro Asp Val Asn Thr Phe Asp Ile Thr
    1280                1285                1290
Val Tyr Leu Leu Gln Gly Arg Arg Leu Leu Gln Pro Glu Tyr Cys
    1295                1300                1305
Pro Asp Pro Leu Tyr Glu Val Met Leu Lys Cys Trp His Pro Lys
    1310                1315                1320
Ala Glu Met Arg Pro Ser Phe Ser Glu Leu Val Ser Arg Ile Ser
    1325                1330                1335
Ala Ile Phe Ser Thr Phe Ile Gly Glu His Tyr Val His Val Asn
    1340                1345                1350
Ala Thr Tyr Val Asn Val Lys Cys Val Ala Pro Tyr Pro Ser Leu
    1355                1360                1365
Leu Ser Ser Glu Asp Asn Ala Asp Asp Glu Val Asp Thr Arg Pro
    1370                1375                1380
Ala Ser Phe Trp Glu Thr Ser
    1385                1390
 
<210>57
<211>3192
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(240)..(1661)
 
<400>57
actgcctttg tgcgcgatct cgcgctgcca ttggctaact cgggaaagtg ggaagcgtga      60
aggagggacc ctgaggtaga gggtcagggg ttagtgaggc cggaagtgag tgtaataaag      120
tttctccagg gaggcagggc ccggggagaa agttggagcg gtaacctaag ctggcagtgg      180
cgtgatccgg caccaaatcg gcccgcggtg cggtgcggag actccatgag gccctggac       239
atg aac aag ctg agt gga ggc ggc ggg cgc agg act cgg gtg gaa ggg        287
Met Asn Lys Leu Ser Gly Gly Gly Gly Arg Arg Thr Arg Val Glu Gly
1               5                   10                  15
ggc cag ctt ggg ggc gag gag tgg acc cgc cac ggg agc ttt gtc aat        335
Gly Gln Leu Gly Gly Glu Glu Trp Thr Arg His Gly Ser Phe Val Asn
            20                  25                  30
aag ccc acg cgg ggc tgg ctg cat ccc aac gac aaa gtc atg gga ccc        383
Lys Pro Thr Arg Gly Trp Leu His Pro Asn Asp Lys Val Met Gly Pro
        35                  40                  45
ggg gtt tcc tac ttg gtt cgg tac atg ggt tgt gtg gag gtc ctc cag        431
Gly Val Ser Tyr Leu Val Arg Tyr Met Gly Cys Val Glu Val Leu Gln
    50                  55                  60
tca atg cgt gcc ctg gac ttc aac acc cgg act cag gtc acc agg gag        479
Ser Met Arg Ala Leu Asp Phe Asn Thr Arg Thr Gln Val Thr Arg Glu
65                  70                  75                  80
gcc atc agt ctg gtg tgt gag gct gtg ccg ggt gct aag ggg gcg aca        527
Ala Ile Ser Leu Val Cys Glu Ala Val Pro Gly Ala Lys Gly Ala Thr
                85                  90                  95
agg agg aga aag ccc tgt agc cgc ccg ctc agc tct atc ctg ggg agg        575
Arg Arg Arg Lys Pro Cys Ser Arg Pro Leu Ser Ser Ile Leu Gly Arg
            100                 105                 110
agt aac ctg aaa ttt gct gga atg cca atc act ctc acc gtc tcc acc        623
Ser Asn Leu Lys Phe Ala Gly Met Pro Ile Thr Leu Thr Val Ser Thr
        115                 120                 125
agc agc ctc aac ctc atg gcc gca gac tgc aaa cag atc atc gcc aac        671
Ser Ser Leu Asn Leu Met Ala Ala Asp Cys Lys Gln Ile Ile Ala Asn
    130                 135                 140
cac cac atg caa tct atc tca ttt gca tcc ggc ggg gat ccg gac aca        719
His His Met Gln Ser Ile Ser Phe Ala Ser Gly Gly Asp Pro Asp Thr
145                 150                 155                 160
gcc gag tat gtc gcc tat gtt gcc aaa gac cct gtg aat cag aga gcc        767
Ala Glu Tyr Val Ala Tyr Val Ala Lys Asp Pro Val Asn Gln Arg Ala
                165                 170                 175
tgc cac att ctg gag tgt ccc gaa ggg ctt gcc cag gat gtc atc agc        815
Cys His Ile Leu Glu Cys Pro Glu Gly Leu Ala Gln Asp Val Ile Ser
            180                 185                 190
acc att ggc cag gcc ttc gag ttg cgc ttc aaa caa tac ctc agg aac       863
Thr Ile Gly Gln Ala Phe Glu Leu Arg Phe Lys Gln Tyr Leu Arg Asn
        195                 200                 205
cca ccc aaa ctg gtc acc cct cat gac agg atg gct ggc ttt gat ggc       911
Pro Pro Lys Leu Val Thr Pro His Asp Arg Met Ala Gly Phe Asp Gly
    210                 215                 220
tca gca tgg gat gag gag gag gaa gag cca cct gac cat cag tac tat       959
Ser Ala Trp Asp Glu Glu Glu Glu Glu Pro Pro Asp His Gln Tyr Tyr
225                 230                 235                 240
aat gac ttc ccg ggg aag gaa ccc ccc ttg ggg ggg gtg gta gac atg       1007
Asn Asp Phe Pro Gly Lys Glu Pro Pro Leu Gly Gly Val Val Asp Met
                245                 250                 255
agg ctt cgg gaa gga gcc gct cca ggg gct gct cga ccc act gca ccc       1055
Arg Leu Arg Glu Gly Ala Ala Pro Gly Ala Ala Arg Pro Thr Ala Pro
            260                 265                 270
aat gcc cag acc ccc agc cac ttg gga gct aca ttg cct gta gga cag       1103
Asn Ala Gln Thr Pro Ser His Leu Gly Ala Thr Leu Pro Val Gly Gln
        275                 280                 285
cct gtt ggg gga gat cca gaa gtc cgc aaa cag atg cca cct cca cca       1151
Pro Val Gly Gly Asp Pro Glu Val Arg Lys Gln Met Pro Pro Pro Pro
    290                 295                 300
ccc tgt cca ggc aga gag ctt ttt gat gat ccc tcc tat gtc aac gtc       1199
Pro Cys Pro Gly Arg Glu Leu Phe Asp Asp Pro Ser Tyr Val Asn Val
305                 310                 315                 320
cag aac cta gac aag gcc cgg caa gca gtg ggt ggt gct ggg ccc ccc       1247
Gln Asn Leu Asp Lys Ala Arg Gln Ala Val Gly Gly Ala Gly Pro Pro
                325                 330                 335
aat cct gct atc aat ggc agt gca ccc cgg gac ctg ttt gac atg aag       1295
Asn Pro Ala Ile Asn Gly Ser Ala Pro Arg Asp Leu Phe Asp Met Lys
            340                 345                 350
ccc ttc gaa gat gct ctt cgc gtg cct cca cct ccc cag tcg gtg tcc       1343
Pro Phe Glu Asp Ala Leu Arg Val Pro Pro Pro Pro Gln Ser Val Ser
        355                 360                 365
atg gct gag cag ctc cga ggg gag ccc tgg ttc cat ggg aag ctg agc       1391
Met Ala Glu Gln Leu Arg Gly Glu Pro Trp Phe His Gly Lys Leu Ser
    370                 375                 380
cgg cgg gag gct gag gca ctg ctg cag ctc aat ggg gac ttc ctg gta       1439
Arg Arg Glu Ala Glu Ala Leu Leu Gln Leu Asn Gly Asp Phe Leu Val
385                 390                 395                 400
cgg gag agc acg acc aca cct ggc cag tat gtg ctc act ggc ttg cag       1487
Arg Glu Ser Thr Thr Thr Pro Gly Gln Tyr Val Leu Thr Gly Leu Gln
                405                 410                 415
agt ggg cag cct aag cat ttg cta ctg gtg gac cct gag ggt gtg gtt       1535
Ser Gly Gln Pro Lys His Leu Leu Leu Val Asp Pro Glu Gly Val Val
            420                 425                 430
cgg act aag gat cac cgc ttt gaa agt gtc agt cac ctt atc agc tac       1583
Arg Thr Lys Asp His Arg Phe Glu Ser Val Ser His Leu Ile Ser Tyr
        435                 440                 445
cac atg gac aat cac ttg ccc atc atc tct gcg ggc agc gaa ctg tgt       1631
His Met Asp Asn His Leu Pro Ile Ile Ser Ala Gly Ser Glu Leu Cys
    450                 455                 460
cta cag caa cct gtg gag cgg aaa ctg tga tctgccctag cgctctcttc         1681
Leu Gln Gln Pro Val Glu Arg Lys Leu
465                 470
cagaagatgc cctccaatcc tttccaccct attccctaac tctcgggacc tcgtttggga     1741
gtgttctgtg ggcttggcct tgtgtcagag ctgggagtag catggactct gggtttcata     1801
tccagctgag tgagagggtt tgagtcaaaa gcctgggtga gaatcctgcc tctccccaaa     1861
cattaatcac caaagtatta atgtacagag tggcccctca cctgggcctt tcctgtgcca     1921
acctgatgcc ccttccccaa gaaggtgagt gcttgtcatg gaaaatgtcc tgtggtgaca     1981
ggcccagtgg aacagtcacc cttctgggca agggggaaca aatcacacct ctgggcttca     2041
gggtatccca gacccctctc aacacccgcc ccccccatgt ttaaactttg tgcctttgac     2101
catctcttag gtctaatgat attttatgca aacagttctt ggacccctga attcaatgac     2161
agggatgcca acaccttctt ggcttctggg acctgtgttc ttgctgagca ccctctccgg     2221
tttgggttgg gataacagag gcaggagtgg cagctgtccc ctctccctgg ggatatgcaa     2281
cccttagaga ttgccccaga gccccactcc cggccaggcg ggagatggac ccctcccttg     2341
ctcagtgcct cctggccggg gcccctcacc ccaaggggtc tgtatataca tttcataagg     2401
cctgccctcc catgttgcat gcctatgtac tctacgccaa agtgcagccc ttcctcctga     2461
agcctctgcc ctgcctccct ttctgggagg gcggggtggg ggtgactgaa tttgggcctc     2521
ttgtacagtt aactctccca ggtggatttt gtggaggtga gaaaaggggc attgagacta     2581
taaagcagta gacaatcccc acataccatc tgtagagttg gaactgcatt cttttaaagt     2641
tttatatgca tatattttag ggctgtagac ttactttcct attttctttt ccattgctta     2701
ttcttgagca caaaatgata atcaattatt acatttatac atcacctttt tgacttttcc     2761
aagccctttt acagctcttg gcattttcct cgcctaggcc tgtgaggtaa ctgggatcgc     2821
accttttata ccagagacct gaggcagatg aaatttattt ccatctagga ctagaaaaac     2881
ttgggtctct taccgcgaga ctgagaggca gaagtcagcc cgaatgcctg tcagtttcat     2941
ggaggggaaa cgcaaaacct gcagttcctg agtaccttct acaggcccgg cccagcctag     3001
gcccggggtg gccacaccac agcaagccgg ccccccctct tttggccttg tggataaggg     3061
agagttgacc gttttcatcc tggcctcctt ttgctgtttg gatgtttcca cgggtctcac     3121
ttataccaaa gggaaaactc ttcattaaag tccgtatttc ttctaaaaaa aaaaaaaaaa     3181
aaaaaaaaaa a                                                          3192
 
<210>58
<211>473
<212>PRT
<213>人(Homo sa piens)
 
<400>58
 
Met Asn Lys Leu Ser Gly Gly Gly Gly Arg Arg Thr Arg Val Glu Gly
1               5                   10                  15
Gly Gln Leu Gly Gly Glu Glu Trp Thr Arg His Gly Ser Phe Val Asn
            20                  25                  30
Lys Pro Thr Arg Gly Trp Leu His Pro Asn Asp Lys Val Met Gly Pro
        35                  40                  45
Gly Val Ser Tyr Leu Val Arg Tyr Met Gly Cys Val Glu Val Leu Gln
    50                  55                  60
Ser Met Arg Ala Leu Asp Phe Asn Thr Arg Thr Gln Val Thr Arg Glu
65                  70                  75                  80
Ala Ile Ser Leu Val Cys Glu Ala Val Pro Gly Ala Lys Gly Ala Thr
                85                  90                  95
Arg Arg Arg Lys Pro Cys Ser Arg Pro Leu Ser Ser Ile Leu Gly Arg
            100                 105                 110
Ser Asn Leu Lys Phe Ala Gly Met Pro Ile Thr Leu Thr Val Ser Thr
        115                 120                 125
Ser Ser Leu Asn Leu Met Ala Ala Asp Cys Lys Gln Ile Ile Ala Asn
    130                 135                 140
His His Met Gln Ser Ile Ser Phe Ala Ser Gly Gly Asp Pro Asp Thr
145                 150                 155                 160
Ala Glu Tyr Val Ala Tyr Val Ala Lys Asp Pro Val Asn Gln Arg Ala
                165                 170                 175
Cys His Ile Leu Glu Cys Pro Glu Gly Leu Ala Gln Asp Val Ile Ser
            180                 185                 190
Thr Ile Gly Gln Ala Phe Glu Leu Arg Phe Lys Gln Tyr Leu Arg Asn
        195                 200                 205
Pro Pro Lys Leu Val Thr Pro His Asp Arg Met Ala Gly Phe Asp Gly
    210                 215                 220
Ser Ala Trp Asp Glu Glu Glu Glu Glu Pro Pro Asp His Gln Tyr Tyr
225                 230                 235                 240
Asn Asp Phe Pro Gly Lys Glu Pro Pro Leu Gly Gly Val Val Asp Met
                245                 250                 255
Arg Leu Arg Glu Gly Ala Ala Pro Gly Ala Ala Arg Pro Thr Ala Pro
            260                 265                 270
Asn Ala Gln Thr Pro Ser His Leu Gly Ala Thr Leu Pro Val Gly Gln
        275                 280                 285
Pro Val Gly Gly Asp Pro Glu Val Arg Lys Gln Met Pro Pro Pro Pro
    290                 295                 300
Pro Cys Pro Gly Arg Glu Leu Phe Asp Asp Pro Ser Tyr Val Asn Val
305                 310                 315                 320
Gln Asn Leu Asp Lys Ala Arg Gln Ala Val Gly Gly Ala Gly Pro Pro
                325                 330                 335
Asn Pro Ala Ile Asn Gly Ser Ala Pro Arg Asp Leu Phe Asp Met Lys
            340                 345                 350
Pro Phe Glu Asp Ala Leu Arg Val Pro Pro Pro Pro Gln Ser Val Ser
        355                 360                 365
Met Ala Glu Gln Leu Arg Gly Glu Pro Trp Phe His Gly Lys Leu Ser
    370                 375                 380
Arg Arg Glu Ala Glu Ala Leu Leu Gln Leu Asn Gly Asp Phe Leu Val
385                 390                 395                 400
Arg Glu Ser Thr Thr Thr Pro Gly Gln Tyr Val Leu Thr Gly Leu Gln
                405                 410                 415
Ser Gly Gln Pro Lys His Leu Leu Leu Val Asp Pro Glu Gly Val Val
            420                 425                 430
Arg Thr Lys Asp His Arg Phe Glu Ser Val Ser His Leu Ile Ser Tyr
        435                 440                 445
His Met Asp Asn His Leu Pro Ile Ile Ser Ala Gly Ser Glu Leu Cys
    450                 455                 460
Leu Gln Gln Pro Val Glu Arg Lys Leu
465                 470
 
<210>59
<211>2794
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(341)..(1783)
 
<400>59
cggcaggacc gagcgcggca ggcggctggc ccagcgcagc cagcgcggcc cgaaggacgg       60
gagcaggcgg ccgagcaccg agcgctgggc accgggcacc gagcggcggc ggcacgcgag      120
gcccggcccc gagcagcgcc cccgcccgcc gcggcctcca gcccggcccc gcccagcgcc      180
ggcccgcggg gatgcggagc ggcgggcgcc ggaggccgcg gcccggctag gcccgcgctc      240
gcgcccggac gcggcggccc gaggctgtgg ccaggccagc tgggctcggg gagcgccagc      300
ctgagaggag cgcgtgagcg tcgcgggagc ctcgggcacc atg agc gac gtg gct        355
                                            Met Ser Asp Val Ala
                                            1               5
att gtg aag gag ggt tgg ctg cac aaa cga ggg gag tac atc aag acc        403
Ile Val Lys Glu Gly Trp Leu His Lys Arg Gly Glu Tyr Ile Lys Thr
               10                  15                  20
tgg cgg cca cgc tac ttc ctc ctc aag aat gat ggc acc ttc att ggc        451
Trp Arg Pro Arg Tyr Phe Leu Leu Lys Asn Asp Gly Thr Phe Ile Gly
            25                  30                  35
tac aag gag cgg ccg cag gat gtg gac caa cgt gag gct ccc ctc aac       499
Tyr Lys Glu Arg Pro Gln Asp Val Asp Gln Arg Glu Ala Pro Leu Asn
        40                  45                  50
aac ttc tct gtg gcg cag tgc cag ctg atg aag acg gag cgg ccc cgg       547
Asn Phe Ser Val Ala Gln Cys Gln Leu Met Lys Thr Glu Arg Pro Arg
    55                  60                  65
ccc aac acc ttc atc atc cgc tgc ctg cag tgg acc act gtc atc gaa       595
Pro Asn Thr Phe Ile Ile Arg Cys Leu Gln Trp Thr Thr Val Ile Glu
70                  75                  80                  85
cgc acc ttc cat gtg gag act cct gag gag cgg gag gag tgg aca acc       643
Arg Thr Phe His Val Glu Thr Pro Glu Glu Arg Glu Glu Trp Thr Thr
                90                  95                  100
gcc atc cag act gtg gct gac ggc ctc aag aag cag gag gag gag gag       691
Ala Ile Gln Thr Val Ala Asp Gly Leu Lys Lys Gln Glu Glu Glu Glu
            105                110                 115
atg gac ttc cgg tcg ggc tca ccc agt gac aac tca ggg gct gaa gag       739
Met Asp Phe Arg Ser Gly Ser Pro Ser Asp Asn Ser Gly Ala Glu Glu
        120                 125                 130
atg gag gtg tcc ctg gcc aag ccc aag cac cgc gtg acc atg aac gag       787
Met Glu Val Ser Leu Ala Lys Pro Lys His Arg Val Thr Met Asn Glu
    135                 140                 145
ttt gag tac ctg aag ctg ctg ggc aag ggc act ttc ggc aag gtg atc       835
Phe Glu Tyr Leu Lys Leu Leu Gly Lys Gly Thr Phe Gly Lys Val Ile
150                 155                 160                 165
ctg gtg aag gag aag gcc aca ggc cgc tac tac gcc atg aag atc ctc       883
Leu Val Lys Glu Lys Ala Thr Gly Arg Tyr Tyr Ala Met Lys Ile Leu
                170                 175                 180
aag aag gaa gtc atc gtg gcc aag gac gag gtg gcc cac aca ctc acc       931
Lys Lys Glu Val Ile Val Ala Lys Asp Glu Val Ala His Thr Leu Thr
            185                 190                 195
gag aac cgc gtc ctg cag aac tcc agg cac ccc ttc ctc aca gcc ctg       979
Glu Asn Arg Val Leu Gln Asn Ser Arg His Pro Phe Leu Thr Ala Leu
        200                 205                 210
aag tac tct ttc cag acc cac gac cgc ctc tgc ttt gtc atg gag tac       1027
Lys Tyr Ser Phe Gln Thr His Asp Arg Leu Cys Phe Val Met Glu Tyr
    215                 220                 225
gcc aac ggg ggc gag ctg ttc ttc cac ctg tcc cgg gag cgt gtg ttc       1075
Ala Asn Gly Gly Glu Leu Phe Phe His Leu Ser Arg Glu Arg Val Phe
230                 235                 240                 245
tcc gag gac cgg gcc cgc ttc tat ggc gct gag att gtg tca gcc ctg       1123
Ser Glu Asp Arg Ala Arg Phe Tyr Gly Ala Glu Ile Val Ser Ala Leu
                250                 255                 260
gac tac ctg cac tcg gag aag aac gtg gtg tacc gg gac ctc aag ctg       1171
Asp Tyr Leu His Ser Glu Lys Asn Val Val Tyr Arg Asp Leu Lys Leu
            265                 270                 275
gag aac ctc atg ctg gac aag gac ggg cac att aag atc aca gac ttc       1219
Glu Asn Leu Met Leu Asp Lys Asp Gly His Ile Lys Ile Thr Asp Phe
        280                 285                 290
ggg ctg tgc aag gag ggg atc aag gac ggt gcc acc atg aag acc ttt       1267
Gly Leu Cys Lys Glu Gly Ile Lys Asp Gly Ala Thr Met Lys Thr Phe
    295                 300                 305
tgc ggc aca cct gag tac ctg gcc ccc gag gtg ctg gag gac aat gac       1315
Cys Gly Thr Pro Glu Tyr Leu Ala Pro Glu Val Leu Glu Asp Asn Asp
310                 315                 320                 325
tac ggc cgt gca gtg gac tgg tgg ggg ctg ggc gtg gtc atg tac gag       1363
Tyr Gly Arg Ala Val Asp Trp Trp Gly Leu Gly Val Val Met Tyr Glu
                330                 335                 340
atg atg tgc ggt cgc ctg ccc ttc tac aac cag gac cat gag aag ctt       1411
Met Met Cys Gly Arg Leu Pro Phe Tyr Asn Gln Asp His Glu Lys Leu
            345                 350                 355
ttt gag ctc atc ctc atg gag gag atc cgc ttc ccg cgc acg ctt ggt       1459
Phe Glu Leu Ile Leu Met Glu Glu Ile Arg Phe Pro Arg Thr Leu Gly
        360                 365                 370
ccc gag gcc aag tcc ttg ctt tca ggg ctg ctc aag aag gac ccc aag       1507
Pro Glu Ala Lys Ser Leu Leu Ser Gly Leu Leu Lys Lys Asp Pro Lys
    375                 380                 385
cag agg ctt ggc ggg ggc tcc gag gac gcc aag gag atc atg cag cat       1555
Gln Arg Leu Gly Gly Gly Ser Glu Asp Ala Lys Glu Ile Met Gln His
390                 395                 400                 405
cgc ttc ttt gcc ggt atc gtg tgg cag cac gtg tac gag aag aag ctc       1603
Arg Phe Phe Ala Gly Ile Val Trp Gln His Val Tyr Glu Lys Lys Leu
                410                 415                 420
agc cca ccc ttc aag ccc cag gtc acg tcg gag act gac acc agg tat       1651
Ser Pro Pro Phe Lys Pro Gln Val Thr Ser Glu Thr Asp Thr Arg Tyr
            425                 430                 435
ttt gat gag gag ttc acg gcc cag atg atc acc atc aca cca cct gac       1699
Phe Asp Glu Glu Phe Thr Ala Gln Met Ile Thr Ile Thr Pro Pro Asp
        440                 445                 450
caa gat gac agc atg gag tgt gtg gac agc gag cgc agg ccc cac ttc       1747
Gln Asp Asp Ser Met Glu Cys Val Asp Ser Glu Arg Arg Pro His Phe
    455                 460                 465
ccc cag ttc tcc tac tcg gcc agc ggc acg gcc tga ggcggcggtg            1793
Pro Gln Phe Ser Tyr Ser Ala Ser Gly Thr Ala
470                 475                 480
gactgcgctg gacgatagct tggagggatg gagaggcggc ctcgtgccat gatctgtatt     1853
taatggtttt tatttctcgg gtgcatttga gagaagccac gctgtcctct cgagcccaga     1913
tggaaagacg tttttgtgct gtgggcagca ccctcccccg cagcggggta gggaagaaaa     1973
ctatcctgcg ggttttaatt tatttcatcc agtttgttct ccgggtgtgg cctcagccct     2033
cagaacaatc cgattcacgt agggaaatgt taaggacttc tgcagctatg cgcaatgtgg     2093
cattgggggg ccgggcaggt cctgcccatg tgtcccctca ctctgtcagc cagccgccct     2153
gggctgtctg tcaccagcta tctgtcatct ctctggggcc ctgggcctca gttcaacctg     2213
gtggcaccag atgcaacctc actatggtat gctggccagc accctctcct gggggtggca     2273
ggcacacagc agccccccag cactaaggcc gtgtctctga ggacgtcatc ggaggctggg     2333
cccctgggat gggaccaggg atgggggatg ggccagggtt tacccagtgg gacagaggag     2393
caaggtttaa atttgttatt gtgtattatg ttgttcaaat gcattttggg ggtttttaat     2453
ctttgtgaca ggaaagccct cccccttccc cttctgtgtc acagttcttg gtgactgtcc     2513
caccgggagc ctccccctca gatgatctct ccacggtagc acttgacctt ttcgacgctt     2573
aacctttccg ctgtcgcccc aggccctccc tgactccctg tgggggtggc catccctggg     2633
cccctccacg cctcctggcc agacgctgcc gctgccgctg caccacggcg tttttttaca     2693
acattcaact ttagtatttt tactattata atataatatg gaaccttccc tccaaattct     2753
tcaataaaag ttgcttttca aaaaaaaaaa aaaaaaaaaa a                         2794
 
<210>60
<211>480
<212>PRT
<213>人(Homo sapiens)
 
<400>60
 
Met Ser Asp Val Ala Ile Val Lys Glu Gly Trp Leu His Lys Arg Gly
1               5                   10                  15
Glu Tyr Ile Lys Thr Trp Arg Pro Arg Tyr Phe Leu Leu Lys Asn Asp
            20                  25                  30
Gly Thr Phe Ile Gly Tyr Lys Glu Arg Pro Gln Asp Val Asp Gln Arg
        35                  40                  45
Glu Ala Pro Leu Asn Asn Phe Ser Val Ala Gln Cys Gln Leu Met Lys
    50                  55                  60
Thr Glu Arg Pro Arg Pro Asn Thr Phe Ile Ile Arg Cys Leu Gln Trp
65                  70                  75                  80
Thr Thr Val Ile Glu Arg Thr Phe His Val Glu Thr Pro Glu Glu Arg
                85                  90                  95
Glu Glu Trp Thr Thr Ala Ile Gln Thr Val Ala Asp Gly Leu Lys Lys
            100                 105                 110
Gln Glu Glu Glu Glu Met Asp Phe Arg Ser Gly Ser Pro Ser Asp Asn
        115                 120                 125
Ser Gly Ala Glu Glu Met Glu Val Ser Leu Ala Lys Pro Lys His Arg
    130                 135                 140
Val Thr Met Asn Glu Phe Glu Tyr Leu Lys Leu Leu Gly Lys Gly Thr
145                 150                 155                 160
Phe Gly Lys Val Ile Leu Val Lys Glu Lys Ala Thr Gly Arg Tyr Tyr
                165                 170                 175
Ala Met Lys Ile Leu Lys Lys Glu Val Ile Val Ala Lys Asp Glu Val
            180                 185                 190
Ala His Thr Leu Thr Glu Asn Arg Val Leu Gln Asn Ser Arg His Pro
        195                 200                 205
Phe Leu Thr Ala Leu Lys Tyr Ser Phe Gln Thr His Asp Arg Leu Cys
    210                 215                 220
Phe Val Met Glu Tyr Ala Asn Gly Gly Glu Leu Phe Phe His Leu Ser
225                 230                 235                 240
Arg Glu Arg Val Phe Ser Glu Asp Arg Ala Arg Phe Tyr Gly Ala Glu
                245                 250                 255
Ile Val Ser Ala Leu Asp Tyr Leu His Ser Glu Lys Asn Val Val Tyr
            260                 265                 270
Arg Asp Leu Lys Leu Glu Asn Leu Met Leu Asp Lys Asp Gly His Ile
        275                 280                 285
Lys Ile Thr Asp Phe Gly Leu Cys Lys Glu Gly Ile Lys Asp Gly Ala
    290                 295                 300
Thr Met Lys Thr Phe Cys Gly Thr Pro Glu Tyr Leu Ala Pro Glu Val
305                 310                 315                 320
Leu Glu Asp Asn Asp Tyr Gly Arg Ala Val Asp Trp Trp Gly Leu Gly
                325                 330                 335
Val Val Met Tyr Glu Met Met Cys Gly Arg Leu Pro Phe Tyr Asn Gln
            340                 345                 350
Asp His Glu Lys Leu Phe Glu Leu Ile Leu Met Glu Glu Ile Arg Phe
        355                 360                 365
Pro Arg Thr Leu Gly Pro Glu Ala Lys Ser Leu Leu Ser Gly Leu Leu
    370                 375                 380
Lys Lys Asp Pro Lys Gln Arg Leu Gly Gly Gly Ser Glu Asp Ala Lys
385                 390                 395                 400
Glu Ile Met Gln His Arg Phe Phe Ala Gly Ile Val Trp Gln His Val
                405                 410                 415
Tyr Glu Lys Lys Leu Ser Pro Pro Phe Lys Pro Gln Val Thr Ser Glu
            420                 425                 430
Thr Asp Thr Arg Tyr Phe Asp Glu Glu Phe Thr Ala Gln Met Ile Thr
        435                 440                 445
Ile Thr Pro Pro Asp Gln Asp Asp Ser Met Glu Cys Val Asp Ser Glu
    450                 455                 460
Arg Arg Pro His Phe Pro Gln Phe Ser Tyr Ser Ala Ser Gly Thr Ala
465                 470                 475                 480
 
<210>61
<211>4978
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(241)..(2553)
 
<400>61
ggtttccgga gctgcggcgg cgcagactgg gagggggagc cgggggttcc gacgtcgcag     60
ccgagggaac aagccccaac cggatcctgg acaggcaccc cggcttggcg ctgtctctcc     120
ccctcggctc ggagaggccc ttcggcctga gggagcctcg ccgcccgtcc ccggcacacg     180
cgcagccccg gcctctcggc ctctgccgga gaaacagttg ggacccctga ttttagcagg     240
atg gcc caa tgg aat cag cta cag cag ctt gac aca cgg tac ctg gag       288
Met Ala Gln Trp Asn Gln Leu Gln Gln Leu Asp Thr Arg Tyr Leu Glu
1               5                   10                  15
cag ctc cat cag ctc tac agt gac agc ttc cca atg gag ctg cgg cag       336
Gln Leu His Gln Leu Tyr Ser Asp Ser Phe Pro Met Glu Leu Arg Gln
            20                  25                  30
ttt ctg gcc cct tgg att gag agt caa gat tgg gca tat gcg gcc agc       384
Phe Leu Ala Pro Trp Ile Glu Ser Gln Asp Trp Ala Tyr Ala Ala Ser
        35                  40                  45
aaa gaa tca cat gcc act ttg gtg ttt cat aat ctc ctg gga gag att       432
Lys Glu Ser His Ala Thr Leu Val Phe His Asn Leu Leu Gly Glu Ile
    50                  55                  60
gac cag cag tat agc cgc ttc ctg caa gag tcg aat gtt ctc tat cag       480
Asp Gln Gln Tyr Ser Arg Phe Leu Gln Glu Ser Asn Val Leu Tyr Gln
65                  70                  75                  80
cac aat cta cga aga atc aag cag ttt ctt cag agc agg tat ctt gag       528
His Asn Leu Arg Arg Ile Lys Gln Phe Leu Gln Ser Arg Tyr Leu Glu
                85                  90                  95
aag cca atg gag att gcc cgg att gtg gcc cgg tgc ctg tgg gaa gaa       576
Lys Pro Met Glu Ile Ala Arg lle Val Ala Arg Cys Leu Trp Glu Glu
            100                 105                 110
tca cgc ctt cta cag act gca gcc act gcg gcc cag caa ggg ggc cag       624
Ser Arg Leu Leu Gln Thr Ala Ala Thr Ala Ala Gln Gln Gly Gly Gln
        115                 120                 125
gcc aac cac ccc aca gca gcc gtg gtg acg gag aag cag cag atg ctg       672
Ala Asn His Pro Thr Ala Ala Val Val Thr Glu Lys Gln Gln Met Leu
    130                 135                 140
gag cag cac ctt cag gat gtc cgg aag aga gtg cag gat cta gaa cag       720
Glu Gln His Leu Gln Asp Val Arg Lys Arg Val Gln Asp Leu Glu Gln
145                 150                 155                 160
aaa atg aaa gtg gta gag aat ctc cag gat gac ttt gat ttc aac tat       768
Lys Met Lys Val Val Glu Asn Leu Gln Asp Asp Phe Asp Phe Asn Tyr
                165                 170                 175
aaa acc ctc aag agt caa gga gac atg caa gat ctg aat gga aac aac       816
Lys Thr Leu Lys Ser Gln Gly Asp Met Gln Asp Leu Asn Gly Asn Asn
            180                 185                 190
cag tca gtg acc agg cag aag atg cag cag ctg gaa cag atg ctc act       864
Gln Ser Val Thr Arg Gln Lys Met Gln Gln Leu Glu Gln Met Leu Thr
        195                 200                 205
gcg ctg gac cag atg cgg aga agc atc gtg agt gag ctg gcg ggg ctt       912
Ala Leu Asp Gln Met Arg Arg Ser Ile Val Ser Glu Leu Ala Gly Leu
    210                 215                 220
ttg tca gcg atg gag tac gtg cag aaa act ctc acg gac gag gag ctg       960
Leu Ser Ala Met Glu Tyr Val Gln Lys Thr Leu Thr Asp Glu Glu Leu
225                 230                 235                 240
gct gac tgg aag agg cgg caa cag att gcc tgc att gga ggc ccg ccc       1008
Ala Asp Trp Lys Arg Arg Gln Gln Ile Ala Cys Ile Gly Gly Pro Pro
                245                 250                 255
aac atc tgc cta gat cgg cta gaa aac tgg ata acg tea tta gca gaa       1056
Asn Ile Cys Leu Asp Arg Leu Glu Asn Trp Ile Thr Ser Leu Ala Glu
            260                 265                 270
tct caa ctt cag acc cgt caa caa att aag aaa ctg gag gag ttg cag       1104
Ser Gln Leu Gln Thr Arg Gln Gln Ile Lys Lys Leu Glu Glu Leu Gln
        275                 280                 285
caa aaa gtt tcc tac aaa ggg gac ccc att gta cag cac cgg ccg atg       1152
Gln Lys Val Ser Tyr Lys Gly Asp Pro Ile Val Gln His Arg Pro Met
    290                 295                 300
ctg gag gag aga atc gtg gag ctg ttt aga aac tta atg aaa agt gcc       1200
Leu Glu Glu Arg Ile Val Glu Leu Phe Arg Asn Leu Met Lys Ser Ala
305                 310                 315                 320
ttt gtg gtg gag cgg cag ccc tgc atg ccc atg cat cct gac cgg ccc       1248
Phe Val Val Glu Arg Gln Pro Cys Met Pro Met His Pro Asp Arg Pro
                325                 330                 335
ctc gtc atc aag acc ggc gtc cag ttc act act aaa gtc agg ttg ctg       1296
Leu Val Ile Lys Thr Gly Val Gln Phe Thr Thr Lys Val Arg Leu Leu
            340                 345                 350
gtc aaa ttc cct gag ttg aat tat cag ctt aaa att aaa gtg tgc att       1344
Val Lys Phe Pro Glu Leu Asn Tyr Gln Leu Lys Ile Lys Val Cys Ile
        355                 360                 365
gac aaa gac tct ggg gac gtt gca gct ctc aga gga tcc cgg aaa ttt       1392
Asp Lys Asp Ser Gly Asp Val Ala Ala Leu Arg Gly Ser Arg Lys Phe
    370                 375                 380
aac att ctg ggc aca aac aca aaa gtg atg aac atg gaa gaa tcc aac       1440
Asn Ile Leu Gly Thr Asn Thr Lys Val Met Asn Met Glu Glu Ser Asn
385                 390                 395                 400
aac ggc agc ctc tct gca gaa ttc aaa cac ttg acc ctg agg gag cag       1488
Asn Gly Ser Leu Ser Ala Glu Phe Lys His Leu Thr Leu Arg Glu Gln
                405                 410                 415
aga tgt ggg aat ggg ggc cga gcc aat tgt gat gct tcc ctg att gtg       1536
Arg Cys Gly Asn Gly Gly Arg Ala Asn Cys Asp Ala Ser Leu Ile Val
            420                 425                 430
act gag gag ctg cac ctg atc acc ttt gag acc gag gtg tat cac caa       1584
Thr Glu Glu Leu His Leu Ile Thr Phe Glu Thr Glu Val Tyr His Gln
        435                 440                 445
ggc ctc aag att gac cta gag acc cac tcc ttg cca gtt gtg gtg atc       1632
Gly Leu Lys Ile Asp Leu Glu Thr His Ser Leu Pro Val Val Val Ile
    450                 455                 460
tcc aac atc tgt cag atg cca aat gcc tgg gcg tcc atc ctg tgg tac       1680
Ser Asn Ile Cys Gln Met Pro Asn Ala Trp Ala Ser Ile Leu Trp Tyr
465                 470                 475                 480
aac atg ctg acc aac aat ccc aag aat gta aac ttt ttt acc aag ccc       1728
Asn Met Leu Thr Asn Asn Pro Lys Asn Val Asn Phe Phe Thr Lys Pro
                485                 490                 495
cca att gga acc tgg gat caa gtg gcc gag gtc ctg agc tgg cag ttc       1776
Pro Ile Gly Thr Trp Asp Gln Val Ala Glu Val Leu Ser Trp Gln Phe
            500                 505                 510
tcc tcc acc acc aag cga gga ctg agc atc gag cag ctg act aca ctg       1824
Ser Ser Thr Thr Lys Arg Gly Leu Ser Ile Glu Gln Leu Thr Thr Leu
        515                 520                 525
gca gag aaa ctc ttg gga cct ggt gtg aat tat tca ggg tgt cag atc       1872
Ala Glu Lys Leu Leu Gly Pro Gly Val Asn Tyr Ser Gly Cys Gln Ile
    530                 535                 540
aca tgg gct aaa ttt tgc aaa gaa aac atg gct ggc aag ggc ttc tcc       1920
Thr Trp Ala Lys Phe Cys Lys Glu Asn Met Ala Gly Lys Gly Phe Ser
545                 550                 555                 560
ttc tgg gtc tgg ctg gac aat atc att gac ctt gtg aaa aag tac atc       1968
Phe Trp Val Trp Leu Asp Asn Ile Ile Asp Leu Val Lys Lys Tyr Ile
                565                 570                 575
ctg gcc ctt tgg aac gaa ggg tac atc atg ggc ttt atc agt aag gag       2016
Leu Ala Leu Trp Asn Glu Gly Tyr Ile Met Gly Phe Ile Ser Lys Glu
            580                 585                 590
cgg gag cgg gcc atc ttg agc act aag cct cca ggc acc ttc ctg cta       2064
Arg Glu Arg Ala Ile Leu Ser Thr Lys Pro Pro Gly Thr Phe Leu Leu
        595                 600                 605
aga ttc agt gaa agc agc aaa gaa gga ggc gtc act ttc act tgg gtg       2112
Arg Phe Ser Glu Ser Ser Lys Glu Gly Gly Val Thr Phe Thr Trp Val
    610                 615                 620
gag aag gac atc agc ggt aag acc cag atc cag tcc gtg gaa cca tac       2160
Glu Lys Asp Ile Ser Gly Lys Thr Gln Ile Gln Ser Val Glu Pro Tyr
625                 630                 635                 640
aca aag cag cag ctg aac aac atg tca ttt gct gaa atc atc atg ggc       2208
Thr Lys Gln Gln Leu Ash Asn Met Ser Phe Ala Glu Ile Ile Met Gly
                645                 650                 655
tat aag atc atg gat gct acc aat atc ctg gtg tct cca ctg gtc tat       2256
Tyr Lys Ile Met Asp Ala Thr Asn Ile Leu Val Ser Pro Leu Val Tyr
            660                 665                 670
ctc tat cct gac att ccc aag gag gag gca ttc gga aag tat tgt cgg       2304
Leu Tyr Pro Asp Ile Pro Lys Glu Glu Ala Phe Gly Lys Tyr Cys Arg
        675                 680                 685
cca gag agc cag gag cat cct gaa gct gac cca ggt agc gct gcc cca       2352
Pro Glu Ser Gln Glu His Pro GGlu Ala Asp Pro Gly Ser Ala Ala Pro
    690                 695                 700
tac ctg aag acc aag ttt atc tgt gtg aca cca acg acc tgc agc aat       2400
Tyr Leu Lys Thr Lys Phe Ile Cys Val Thr Pro Thr Thr Cys Ser Asn
705                 710                 715                 720
acc att gac ctg ccg atg tcc ccc cgc act tta gat tca ttg atg cag       2448
Thr Ile Asp Leu Pro Met Ser Pro Arg Thr Leu Asp Ser Leu Met Gln
                725                 730                 735
ttt gga aat aat ggt gaa ggt gct gaa ccc tca gca gga ggg cag ttt       2496
Phe Gly Asn Asn Gly Glu Gly Ala Glu Pro Ser Ala Gly Gly Gln Phe
            740                 745                 750
gag tcc ctc acc ttt gac atg gag ttg acc tcg gag tgc gct acc tcc       2544
Glu Ser Leu Thr Phe Asp Met Glu Leu Thr Ser Glu Cys Ala Thr Ser
        755                 760                 765
ccc atg tga ggagctgaga acggaagctg cagaaagata cgactgaggc               2593
Pro Met
    770
gcctacctgc attctgccac ccctcacaca gccaaacccc agatcatctg aaactactaa     2653
ctttgtggtt ccagattttt tttaatctcc tacttctgct atctttgagc aatctgggca     2713
cttttaaaaa tagagaaatg agtgaatgtg ggtgatctgc ttttatctaa atgcaaataa     2773
ggatgtgttc tctgagaccc atgatcaggg gatgtggcgg ggggtggcta gagggagaaa     2833
aaggaaatgt cttgtgttgt tttgttcccc tgccctcctt tctcagcagc tttttgttat     2893
tgttgttgtt gttcttagac aagtgcctcc tggtgcctgc ggcatccttc tgcctgtttc     2953
tgtaagcaaa tgccacaggc cacctatagc tacatactcc tggcattgca ctttttaacc     3013
ttgctgacat ccaaatagaa gataggacta tctaagccct aggtttcttt ttaaattaag     3073
aaataataac aattaaaggg caaaaaacac tgtatcagca tagcctttct gtatttaaga     3133
aacttaagca gccgggcatg gtggctcacg cctgtaatcc cagcactttg ggaggccgag     3193
gcggatcata aggtcaggag atcaagacca tcctggctaa cacggtgaaa ccccgtctct     3253
actaaaagta caaaaaatta gctgggtgtg gtggtgggcg cctgtagtcc cagctactcg     3313
ggaggctgag gcaggagaat cgcttgaacc tgagaggcgg aggttgcagt gagccaaaat     3373
tgcaccactg cacactgcac tccatcctgg gcgacagtct gagactctgt ctcaaaaaaa     3433
aaaaaaaaaa aaagaaactt cagttaacag cctccttggt gctttaagca ttcagcttcc     3493
ttcaggctgg taatttatat aatccctgaa acgggcttca ggtcaaaccc ttaagacatc     3553
tgaagctgca acctggcctt tggtgttgaa ataggaaggt ttaaggagaa tctaagcatt     3613
ttagactttt ttttataaat agacttattt tcctttgtaa tgtattggcc ttttagtgag     3673
taaggctggg cagagggtgc ttacaacctt gactcccttt ctccctggac ttgatctgct     3733
gtttcagagg ctaggttgtt tctgtgggtg ccttatcagg gctgggatac ttctgattct     3793
ggcttccttc ctgccccacc ctcccgaccc cagtccccct gatcctgcta gaggcatgtc     3853
tccttgcgtg tctaaaggtc cctcatcctg tttgttttag gaatcctggt ctcaggacct     3913
catggaagaa gagggggaga gagttacagg ttggacatga tgcacactat ggggccccag     3973
cgacgtgtct ggttgagctc agggaatatg gttcttagcc agtttcttgg tgatatccag     4033
tggcacttgt aatggcgtct tcattcagtt catgcagggc aaaggcttac tgataaactt     4093
gagtctgccc tcgtatgagg gtgtatacct ggcctccctc tgaggctggt gactcctccc     4153
tgctggggcc ccacaggtga ggcagaacag ctagagggcc tccccgcctg cccgccttgg     4213
ctggctagct cgcctctcct gtgcgtatgg gaacacctag cacgtgctgg atgggctgcc     4273
tctgactcag aggcatggcc ggatttggca actcaaaacc accttgcctc agctgatcag     4333
agtttctgtg gaattctgtt tgttaaatca aattagctgg tctctgaatt aagggggaga     4393
cgaccttctc taagatgaac agggttcgcc ccagtcctcc tgcctggaga cagttgatgt     4453
gtcatgcaga gctcttactt ctccagcaac actcttcagt acataataag cttaactgat     4513
aaacagaata tttagaaagg tgagacttgg gcttaccatt gggtttaaat catagggacc     4573
tagggcgagg gttcagggct tctctggagc agatattgtc aagttcatgg ccttaggtag     4633
catgtatctg gtcttaactc tgattgtagc aaaagttctg agaggagctg agccctgttg     4693
tggcccatta aagaacaggg tcctcaggcc ctgcccgctt cctgtccact gccccctccc     4753
catccccagc ccagccgagg gaatcccgtg ggttgcttac ctacctataa ggtggtttat     4813
aagctgctgt cctggccact gcattcaaat tccaatgtgt acttcatagt gtaaaaattt     4873
atattattgt gaggtttttt gtcttttttt tttttttttt tttttggtat attgctgtat     4933
ctactttaac ttccagaaat aaacgttata taggaaccgt aaaaa                      4978
 
<210>62
<211>770
<212>PRT
<213>人(Homo sapiens)
 
<400>62
 
Met Ala Gln Trp Asn Gln Leu Gln Gln Leu Asp Thr Arg Tyr Leu Glu
1               5                   10                  15
Gln Leu His Gln Leu Tyr Ser Asp Ser Phe Pro Met Glu Leu Arg Gln
            20                  25                  30
Phe Leu Ala Pro Trp Ile Glu Ser Gln Asp Trp Ala Tyr Ala Ala Ser
        35                  40                  45
Lys Glu Ser His Ala Thr Leu Val Phe His Asn Leu Leu Gly Glu Ile
    50                  55                  60
Asp Gln Gln Tyr Ser Arg Phe Leu Gln Glu Ser Asn Val Leu Tyr Gln
65                  70                  75                  80
His Asn Leu Arg Arg Ile Lys Gln Phe Leu Gln Ser Arg Tyr Leu Glu
                85                  90                  95
Lys Pro Met Glu Ile Ala Arg Ile Val Ala Arg Cys Leu Trp Glu Glu
            100                 105                 110
Ser Arg Leu Leu Gln Thr Ala Ala Thr Ala Ala Gln Gln Gly Gly Gln
        115                 120                 125
Ala Asn His Pro Thr Ala Ala Val Val Thr Glu Lys Gln Gln Met Leu
    130                 135                 140
Glu Gln His Leu Gln Asp Val Arg Lys Arg Val Gln Asp Leu Glu Gln
145                 150                 155                 160
Lys Met Lys Val Val Glu Asn Leu Gln Asp Asp Phe Asp Phe Asn Tyr
                165                 170                 175
Lys Thr Leu Lys Ser Gln Gly Asp Met Gln Asp Leu Asn Gly Asn Asn
            180                 185                 190
Gln Ser Val Thr Arg Gln Lys Met Gln Gln Leu Glu Gln Met Leu Thr
        195                 200                 205
Ala Leu Asp Gln Met Arg Arg Ser Ile Val Ser Glu Leu Ala Gly Lee
    210                 215                 220
Leu Ser Ala Met Glu Tyr Val Gln Lys Thr Leu Thr Asp Glu Glu Leu
225                 230                 235                 240
Ala Asp Trp Lys Arg Arg Gln Gln Ile Ala Cys Ile Gly Gly Pro Pro
                245                 250                 255
Asn Ile Cys Leu Asp Arg Leu Glu Asn Trp Ile Thr Ser Leu Ala Glu
            260                 265                 270
Ser Gln Leu Gln Thr Arg Gln Gln Ile Lys Lys Leu Glu Glu Leu Gln
        275                 280                 285
Gln Lys Val Ser Tyr Lys Gly Asp Pro Ile Val Gln His Arg Pro Met
    290                 295                 300
Leu Glu Glu Arg Ile Val Glu Leu Phe Arg Asn Leu Met Lys Ser Ala
305                 310                 315                 320
Phe Val Val Glu Arg Gln Pro Cys Met Pro Met His Pro Asp Arg Pro
                325                 330                 335
Leu Val Ile Lys Thr Gly Val Gln Phe Thr Thr Lys Val Arg Leu Leu
            340                 345                 350
Val Lys Phe Pro Glu Leu Asn Tyr Gln Leu Lys Ile Lys Val Cys Ile
        355                 360                 365
Asp Lys Asp Ser Gly Asp Val Ala Ala Leu Arg Gly Ser Arg Lys Phe
    370                 375                 380
Asn Ile Leu Gly Thr Asn Thr Lys Val Met Asn Met Glu Glu Ser Asn
385                 390                 395                 400
Asn Gly Ser Leu Ser Ala Glu Phe Lys His Leu Thr Leu Arg Glu Gln
                405                 410                 415
Arg Cys Gly Asn Gly Gly Arg Ala Asn Cys Asp Ala Ser Leu Ile Val
            420                 425                 430
Thr Glu Glu Leu His Leu Ile Thr Phe Glu Thr Glu Val Tyr His Gln
        435                 440                 445
Gly Leu Lys Ile Asp Leu Glu Thr His Ser Leu Pro Val Val Val Ile
    450                 455                 460
Ser Asn Ile Cys Gln Met Pro Asn Ala Trp Ala Ser Ile Leu Trp Tyr
465                 470                 475                 480
Asn Met Leu Thr Asn Asn Pro Lys Asn Val Asn Phe Phe Thr Lys Pro
                485                 490                 495
Pro Ile Gly Thr Trp Asp Gln Val Ala Glu Val Leu Ser Trp Gln Phe
            500                 505                 510
Ser Ser Thr Thr Lys Arg Gly Leu Ser Ile Glu Gln Leu Thr Thr Leu
        515                 520                 525
Ala Glu Lys Leu Leu Gly Pro Gly Val Asn Tyr Ser Gly Cys Gln Ile
    530                 535                 540
Thr Trp Ala Lys Phe Cys Lys Glu Asn Met Ala Gly Lys Gly Phe Ser
545                 550                 555                 560
Phe Trp Val Trp Leu Asp Asn Ile Ile Asp Leu Val Lys Lys Tyr Ile
                565                 570                 575
Leu Ala Leu Trp Asn Glu Gly Tyr Ile Met Gly Phe Ile Ser Lys Glu
            580                 585                 590
Arg Glu Arg Ala Ile Leu Ser Thr Lys Pro Pro Gly Thr Phe Leu Leu
        595                 600                 605
Arg Phe Ser Glu Ser Ser Lys Glu Gly Gly Val Thr Phe Thr Trp Val
    610                 615                 620
Glu Lys Asp Ile Ser Gly Lys Thr Gln Ile Gln Ser Val Glu Pro Tyr
625                 630                 635                 640
Thr Lys Gln Gln Leu Asn Asn Met Ser Phe Ala Glu Ile Ile Met Gly
                645                 650                 655
Tyr Lys Ile Met Asp Ala Thr Asn Ile Leu Val Ser Pro Leu Val Tyr
            660                 665                 670
Leu Tyr Pro Asp Ile Pro Lys Glu Glu Ala Phe Gly Lys Tyr Cys Arg
        675                 680                 685
Pro Glu Ser Gln Glu His Pro Glu Ala Asp Pro Gly Ser Ala Ala Pro
    690                 695                 700
Tyr Leu Lys Thr Lys Phe Ile Cys Val Thr Pro Thr Thr Cys Ser Asn
705                 710                 715                 720
Thr Ile Asp Leu Pro Met Ser Pro Arg Thr Leu Asp Ser Leu Met Gln
                725                 730                 735
Phe Gly Asn Asn Gly Glu Gly Ala Glu Pro Ser Ala Gly Gly Gln Phe
            740                 745                 750
Glu Ser Leu Thr Phe Asp Met Glu Leu Thr Ser Glu Cys Ala Thr Ser
        755                 760                 765
Pro Met
    770
 
<210>63
<211>3291
<212>DNA
<213>人(Homo sapiens)
<220>
<221>CDS
<222>(416)..(2362)
 
<400>63
agaatcggag agccggtggc gtcgcaggtc gggaggacga gcaccgagtc gagggctcgc     60
tcgtctgggc cgcccgagag tcttaatcgc gggcgcttgg gccgccatct tagatggcgg     120
gagtaagagg aaaacgattg tgaggcggga acggctttct gctgcctttt ttgggccccg     180
aaaagggtca gctggccggg ctttggggcg cgtgccctga ggcgcggagc gcgtttgcta     240
cgatgcgggg gctgctcggg gctccgtccc ctgggctggg gacgcgccga atgtgaccgc     300
ctcccgctcc ctcacccgcc gcggggagga ggagcgggcg agaagctgcc gccgaacgac     360
aggacgttgg ggcggcctgg ctccctcagg tttaagaatt gtttaagctg catca atg      418
                                                             Met
                                                             1
gag cac ata cag gga gct tgg aag acg atc agc aat ggt ttt gga ttc       466
Glu His Ile Gln Gly Ala Trp Lys Thr Ile Ser Asn Gly Phe Gly Phe
            5                   10                  15
aaa gat gcc gtg ttt gat ggc tcc agc tgc atc tct cct aca ata gtt       514
Lys Asp Ala Val Phe Asp Gly Ser Ser Cys Ile Ser Pro Thr Ile Val
        20                  25                  30
cag cag ttt ggc tat cag cgc cgg gca tca gat gat ggc aaa ctc aca       562
Gln Gln Phe Gly Tyr Gln Arg Arg Ala Ser Asp Asp Gly Lys Leu Thr
    35                  40                  45
gat cct tct aag aca agc aac act atc cgt gtt ttc ttg ccg aac aag       610
Asp Pro Ser Lys Thr Ser Asn Thr Ile Arg Val Phe Leu Pro Asn Lys
50                  55                  60                  65
caa aga aca gtg gtc aat gtg cga aat gga atg agc ttg cat gac tgc       658
Gln Arg Thr Val Val Asn Val Arg Asn Gly Met Ser Leu His Asp Cys
                70                  75                  80
ctt atg aaa gca ctc aag gtg agg ggc ctg caa cca gag tgc tgt gca       706
Leu Met Lys Ala Leu Lys Val Arg Gly Leu Gln Pro Glu Cys Cys Ala
            85                  90                  95
gtg ttc aga ctt ctc cac gaa cac aaa ggt aaa aaa gca cgc tta gat       754
Val Phe Arg Leu Leu His Glu His Lys Gly Lys Lys Ala Arg Leu Asp
        100                 105                 110
tgg aat act gat gct gcg tct ttg att gga gaa gaa ctt caa gta gat       802
Trp Asn Thr Asp Ala Ala Ser Leu Ile Gly Glu Glu Leu Gln Val Asp
    115                 120                 125
ttc ctg gat cat gtt ccc ctc aca aca cac aac ttt gct cgg aag acg       850
Phe Leu Asp His Val Pro Leu Thr Thr His Asn Phe Ala Arg Lys Thr
130                 135                 140                 145
ttc ctg aag ctt gcc ttc tgt gac atc tgt cag aaa ttc ctg ctc aat       898
Phe Leu Lys Leu Ala Phe Cys Asp Ile Cys Gln Lys Phe Leu Leu Asn
                150                 155                 160
gga ttt cga tgt cag act tgt ggc tac aaa ttt cat gag cac tgt agc       946
Gly Phe Arg Cys Gln Thr Cys Gly Tyr Lys Phe His Glu His Cys Ser
            165                 170                 175
acc aaa gta cct act atg tgt gtg gac tgg agt aac atc aga caa ctc       994
Thr Lys Val Pro Thr Met Cys Val Asp Trp Ser Asn Ile Arg Gln Leu
        180                 185                 190
tta ttg ttt cca aat tcc act att ggt gat agt gga gtc cca gca cta       1042
Leu Leu Phe Pro Asn Ser Thr Ile Gly Asp Ser Gly Val Pro Ala Leu
    195                 200                 205
cct tct ttg act atg cgt cgt atg cga gag tct gtt tcc agg atg cct       1090
Pro Ser Leu Thr Met Arg Arg Met Arg Glu Ser Val Ser Arg Met Pro
210                 215                 220                 225
gtt agt tct cag cac aga tat tct aca cct cac gcc ttc acc ttt aac       1138
Val Ser Ser Gln His Arg Tyr Ser Thr Pro His Ala Phe Thr Phe Asn
                230                 235                 240
acc tcc agt ccc tca tct gaa ggt tcc ctc tcc cag agg cag agg tcg       1186
Thr Ser Ser Pro Ser Ser Glu Gly Ser Leu Ser Gln Arg Gln Arg Ser
            245                 250                 255
aca tcc aca cct aat gtc cac atg gtc agc acc acc ctg cct gtg gac       1234
Thr Ser Thr Pro Asn Val His Met Val Ser Thr Thr Leu Pro Val Asp
        260                 265                 270
agc agg atg att gag gat gca att cga agt cac agc gaa tca gcc tca       1282
Ser Arg Met Ile Glu Asp Ala Ile Arg Ser His Ser Glu Ser Ala Ser
    275                 280                 285
cct tca gcc ctg tcc agt agc ccc aac aat ctg agc cca aca ggc tgg       1330
Pro Ser Ala Leu Ser Ser Ser Pro Asn Asn Leu Ser Pro Thr Gly Trp
290                 295                 300                 305
tca cag ccg aaa acc ccc gtg cca gca caa aga gag cgg gca cca gta       1378
Ser Gln Pro Lys Thr Pro Val Pro Ala Gln Arg Glu Arg Ala Pro Val
                310                 315                 320
tct ggg acc cag gag aaa aac aaa att agg cct cgt gga cag aga gat       1426
Ser Gly Thr Gln Glu Lys Asn Lys Ile Arg Pro Arg Gly Gln Arg Asp
            325                 330                 335
tca agc tat tat tgg gaa ata gaa gcc agt gaa gtg atg ctg tcc act       1474
Ser Ser Tyr Tyr Trp Glu Ile Glu Ala Ser Glu Val Met Leu Ser Thr
        340                 345                 350
cgg att ggg tca ggc tct ttt gga act gtt tat aag ggt aaa tgg cac       1522
Arg Ile Gly Ser Gly Ser Phe Gly Thr Val Tyr Lys Gly Lys Trp His
    355                 360                 365
gga gat gtt gca gta aag atc cta aag gtt gtc gac cca acc cca gag       1570
Gly Asp Val Ala Val Lys Ile Leu Lys Val Val Asp Pro Thr Pro Glu
370                 375                 380                 385
caa ttc cag gcc ttc agg aat gag gtg gct gtt ctg cgc aaa aca cgg       1618
Gln Phe Gln Ala Phe Arg Asn Glu Val Ala Val Leu Arg Lys Thr Arg
                390                 395                 400
cat gtg aac att ctg ctt ttc atg ggg tac atg aca aag gac aac ctg       1666
His Val Asn Ile Leu Leu Phe Met Gly Tyr Met Thr Lys Asp Asn Leu
            405                 410                 415
gca att gtg acc cag tgg tgc gag ggc agc agc ctc tac aaa cac ctg       1714
Ala Ile Val Thr Gln Trp Cys Glu Gly Ser Ser Leu Tyr Lys His Leu
        420                 425                 430
cat gtc cag gag acc aag ttt cag atg ttc cag cta att gac att gcc       1762
His Val Gln Glu Thr Lys Phe Gln Met Phe Gln Leu Ile Asp Ile Ala
    435                  440                 445
cgg cag acg gct cag gga atg gac tat ttg cat gca aag aac atc atc       1810
Arg Gln Thr Ala Gln Gly Met Asp Tyr Leu His Ala Lys Asn Ile Ile
450                 455                 460                 465
cat aga gac atg aaa tcc aac aat ata ttt ctc cat gaa ggc tta aca       1858
His Arg Asp Met Lys Ser Asn Asn Ile Phe Leu His Glu Gly Leu Thr
                470                 475                 480
gtg aaa att gga gat ttt ggt ttg gca aca gta aag tca cgc tgg agt       1906
Val Lys Ile Gly Asp Phe Gly Leu Ala Thr Val Lys Ser Arg Trp Ser
            485                 490                 495
ggt tct cag cag gtt gaa caa cct act ggc tct gtc ctc tgg atg gcc       1954
Gly Ser Gln Gln Val Glu Gln Pro Thr Gly Ser Val Leu Trp Met Ala
        500                 505                 510
cca gag gtg atc cga atg cag gat aac aac cca ttc agt ttc cag tcg       2002
Pro Glu Val Ile Arg Met Gln Asp Asn Asn Pro Phe Ser Phe Gln Ser
    515                 520                 525
gat gtc tac tcc tat ggc atc gta ttg tat gaa ctg atg acg ggg gag       2050
Asp Val Tyr Ser Tyr Gly Ile Val Leu Tyr Glu Leu Met Thr Gly Glu
530                 535                 540                 545
ctt cct tat tct cac atc aac aac cga gat cag atc atc ttc atg gtg       2098
Leu Pro Tyr Ser His Ile Asn Asn Arg Asp Gln Ile Ile Phe Met Val
                550                 555                 560
ggc cga gga tat gcc tcc cca gat ctt agt aag cta tat aag aac tgc       2146
Gly Arg Gly Tyr Ala Ser Pro Asp Leu Ser Lys Leu Tyr Lys Asn Cys
            565                 570                 575
ccc aaa gca atg aag agg ctg gta gct gac tgt gtg aag aaa gta aag       2194
Pro Lys Ala Met Lys Arg Leu Val Ala Asp Cys Val Lys Lys Val Lys
        580                 585                 590
gaa gag agg cct ctt ttt ccc cag atc ctg tct tcc att gag ctg ctc       2242
Glu Glu Arg Pro Leu Phe Pro Gln Ile Leu Ser Ser Ile Glu Leu Leu
    595                 600                 605
caa cac tct cta ccg aag atc aac cgg agc gct tcc gag cca tcc ttg       2290
Gln His Ser Leu Pro Lys Ile Asn Arg Ser Ala Ser Glu Pro Ser Leu
610                 615                 620                 625
cat cgg gca gcc cac act gag gat atc aat get tgc acg ctg acc acg       2338
His Arg Ala Ala His Thr Glu Asp Ile Asn Ala Cys Thr Leu Thr Thr
                630                 635                 640
tcc ccg agg ctg cct gtc ttc tag ttgactttgc acctgtcttc aggctgccag      2392
Ser Pro Arg Leu Pro Val Phe
            645
gggaggagga gaagccagca ggcaccactt ttctgctccc tttctccaga ggcagaacac     2452
atgttttcag agaagctgct gctaaggacc ttctagactg ctcacagggc cttaacttca     2512
tgttgccttc ttttctatcc ctttgggccc tgggagaagg aagccatttg cagtgctggt     2572
gtgtcctgct ccctccccac attccccatg ctcaaggccc agccttctgt agatgcgcaa     2632
gtggatgttg atggtagtac aaaaagcagg ggcccagccc cagctgttgg ctacatgagt     2692
atttagagga agtaaggtag caggcagtcc agccctgatg tggagacaca tgggattttg     2752
gaaatcagct tctggaggaa tgcatgtcac aggcgggact ttcttcagag agtggtgcag     2812
cgccagacat tttgcacata aggcaccaaa cagcccagga ctgccgagac tctggccgcc     2872
cgaaggagcc tgctttggta ctatggaact tttcttaggg gacacgtcct cctttcacag     2932
cttctaaggt gtccagtgca ttgggatggt tttccaggca aggcactcgg ccaatccgca     2992
tctcagccct ctcagggagc agtcttccat catgctgaat tttgtcttcc aggagctgcc     3052
cctatggggc ggggccgcag ggccagcctt gtttctctaa caaacaaaca aacaaacagc     3112
cttgtttctc tagtcacatc atgtgtatac aaggaagcca ggaatacagg ttttcttgat     3172
gatttgggtt ttaattttgt ttttattgca cctgacaaaa tacagttatc tgatggtccc     3232
tcaattatgt tattttaata aaataaatta aatttaggtg taaaaaaaaa aaaaaaaaa      3291
 
<210>64
<211>648
<212>PRT
<213>人(Homo sapiens)
 
<400>64
 
Met Glu His Ile Gln Gly Ala Trp Lys Thr Ile Ser Asn Gly Phe Gly
1               5                   10                  15
Phe Lys Asp Ala Val Phe Asp Gly Ser Ser Cys Ile Ser Pro Thr Ile
            20                  25                  30
Val Gln Gln Phe Gly Tyr Gln Arg Arg Ala Ser Asp Asp Gly Lys Leu
        35                  40                  45
Thr Asp Pro Ser Lys Thr Ser Asn Thr Ile Arg Val Phe Leu Pro Asn
    50                  55                  60
Lys Gln Arg Thr Val Val Asn Val Arg Asn Gly Met Ser Leu His Asp
65                  70                  75                  80
Cys Leu Met Lys Ala Leu Lys Val Arg Gly Leu Gln Pro Glu Cys Cys
                85                  90                  95
Ala Val Phe Arg Leu Leu His Glu His Lys Gly Lys Lys Ala Arg Leu
            100                 105                 110
Asp Trp Asn Thr Asp Ala Ala Ser Leu Ile Gly Glu Glu Leu Gln Val
        115                 120                 125
Asp Phe Leu Asp His Val Pro Leu Thr Thr His Asn Phe Ala Arg Lys
    130                 135                 140
Thr Phe Leu Lys Leu Ala Phe Cys Asp Ile Cys Gln Lys Phe Leu Leu
145                 150                 155                 160
Asn Gly Phe Arg Cys Gln Thr Cys Gly Tyr Lys Phe His Glu His Cys
                165                 170                 175
Ser Thr Lys Val Pro Thr Met Cys Val Asp Trp Ser Asn Ile Arg Gln
                180                 185                 190
Leu Leu Leu Phe Pro Asn Ser Thr Ile Gly Asp Ser Gly Val Pro Ala
        195                 200                 205
Leu Pro Ser Leu Thr Met Arg Arg Met Arg Glu Ser Val Ser Arg Met
    210                 215                 220
Pro Val Ser Ser Gln His Arg Tyr Ser Thr Pro His Ala Phe Thr Phe
225                 230                 235                 240
Asn Thr Ser Ser Pro Ser Ser Glu Gly Ser Leu Ser Gln Arg Gln Arg
                245                 250                 255
Ser Thr Ser Thr Pro Asn Val His Met Val Ser Thr Thr Leu Pro Val
            260                 265                 270
Asp Ser Arg Met Ile Glu Asp Ala Ile Arg Ser His Ser Glu Ser Ala
        275                 280                 285
Ser Pro Ser Ala Leu Ser Ser Ser Pro Asn Asn Leu Ser Pro Thr Gly
    290                 295                 300
Trp Ser Gln Pro Lys Thr Pro Val Pro Ala Gln Arg Glu Arg Ala Pro
305                 310                 315                 320
Val Ser Gly Thr Gln Glu Lys Asn Lys Ile Arg Pro Arg Gly Gln Arg
                325                 330                 335
Asp Ser Ser Tyr Tyr Trp Glu Ile Glu Ala Ser Glu Val Met Leu Ser
            340                 345                 350
Thr Arg Ile Gly Ser Gly Ser Phe Gly Thr Val Tyr Lys Gly Lys Trp
        355                 360                 365
His Gly Asp Val Ala Val Lys Ile Leu Lys Val Val Asp Pro Thr Pro
    370                 375                 380
Glu Gln Phe Gln Ala Phe Arg Asn Glu Val Ala Val Leu Arg Lys Thr
385                 390                 395                 400
Arg His Val Asn Ile Leu Leu Phe Met Gly Tyr Met Thr Lys Asp Asn
                405                 410                 415
Leu Ala Ile Val Thr Gln Trp Cys Glu Gly Ser Ser Leu Tyr Lys His
            420                 425                 430
Leu His Val Gln Glu Thr Lys Phe Gln Met Phe Gln Leu Ile Asp Ile
        435                 440                 445
Ala Arg Gln Thr Ala Gln Gly Met Asp Tyr Leu His Ala Lys Asn Ile
    450                 455                 460
Ile His Arg Asp Met Lys Ser Asn Asn Ile Phe Leu His Glu Gly Leu
465                 470                 475                 480
Thr Val Lys Ile Gly Asp Phe Gly Leu Ala Thr Val Lys Ser Arg Trp
                485                 490                 495
Ser Gly Ser Gln Gln Val Glu Gln Pro Thr Gly Ser Val Leu Trp Met
            500                 505                 510
Ala Pro Glu Val Ile Arg Met Gln Asp Asn Asn Pro Phe Ser Phe Gln
        515                 520                 525
Ser Asp Val Tyr Ser Tyr Gly Ile Val Leu Tyr Glu Leu Met Thr Gly
    530                 535                 540
Glu Leu Pro Tyr Ser His Ile Asn Asn Arg Asp Gln Ile Ile Phe Met
545                 550                 555                 560
Val Gly Arg Gly Tyr Ala Ser Pro Asp Leu Ser Lys Leu Tyr Lys Asn
                565                 570                 575
Cys Pro Lys Ala Met Lys Arg Leu Val Ala Asp Cys Val Lys Lys Val
            580                 585                 590
Lys Glu Glu Arg Pro Leu Phe Pro Gln Ile Leu Ser Ser Ile Glu Leu
        595                 600                 605
Leu Gln His Ser Leu Pro Lys Ile Asn Arg Ser Ala Ser Glu Pro Ser
   610                 615                 620
Leu His Arg Ala Ala His Thr Glu Asp Ile Asn Ala Cys Thr Leu Thr
625                 630                 635                 640
Thr Ser Pro Arg Leu Pro Val Phe
                645
 
<210>65
<211>30
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>65
cgcggatccc accatggttt ttcaaactcg                                      30
 
<210>66
<211>33
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>66
ccgctcgagc acttgaatgc cagttccatg taa                                  33
 
<210>67
<211>34
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>67
ttgcggccgc aaatgaaggc ccccgctgtg cttg                                 34
 
<210>68
<211>35
<212>DNA
<213>人工的
 
<220>
<223>用于RT-PCR的人工合成的引物序列
 
<400>68
ccgctcgagc ggtgatgtct cccagaagga ggctg                                35
 
<210>69
<211>5616
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(247)..(3879)
 
<400>69
ccccggcgca gcgcggccgc agcagcctcc gccccccgca cggtgtgagc gcccgacgcg     60
gccgaggcgg ccggagtccc gagctagccc cggcggccgc cgccgcccag accggacgac     120
aggccacctc gtcggcgtcc gcccgagtcc ccgcctcgcc gccaacgcca caaccaccgc     180
gcacggcccc ctgactccgt ccagtattga tcgggagagc cggagcgagc tcttcgggga     240
gca gcg atg cga ccc tcc ggg acg gcc ggg gca gcg ctc ctg gcg ctg       288
        Met Arg Pro Ser Gly Thr Ala Gly Ala Ala Leu Leu Ala Leu
        1               5               10
ctg gct gcg ctc tgc ccg gcg agt cgg gct ctg gag gaa aag aaa gtt       336
Leu Ala Ala Leu Cys Pro Ala Ser Arg Ala Leu Glu Glu Lys Lys Val
15                  20                  25                  30
tgc caa ggc acg agt aac aag ctc acg cag ttg ggc act ttt gaa gat       384
Cys Gln Gly Thr Ser Asn Lys Leu Thr Gln Leu Gly Thr Phe Glu Asp
                35                  40                  45
cat ttt ctc agc ctc cag agg atg ttc aat aac tgt gag gtg gtc ctt       432
His Phe Leu Ser Leu Gln Arg Met Phe Asn Asn Cys Glu Val Val Leu
            50                  55                  60
ggg aat ttg gaa att acc tat gtg cag agg aat tat gat ctt tcc ttc       480
Gly Asn Leu Glu Ile Thr Tyr Val Gln Arg Asn Tyr Asp Leu Ser Phe
        65                  70                  75
tta aag acc atc cag gag gtg gct ggt tat gtc ctc att gcc ctc aac       528
Leu Lys Thr Ile Gln Glu Val Ala Gly Tyr Val Leu Ile Ala Leu Asn
    80                  85                  90
aca gtg gag cga att cct ttg gaa aac ctg cag atc atc aga gga aat       576
Thr Val Glu Arg Ile Pro Leu Glu Asn Leu Gln Ile Ile Arg Gly Asn
95                  100                 105                 110
atg tac tac gaa aat tcc tat gcc tta gca gtc tta tct aac tat gat       624
Met Tyr Tyr Glu Asn Ser Tyr Ala Leu Ala Val Leu Ser Asn Tyr Asp
                115                 120                 125
gca aat aaa acc gga ctg aag gag ctg ccc atg aga aat tta cag gaa       672
Ala Asn Lys Thr Gly Leu Lys Glu Leu Pro Met Arg Asn Leu Gln Glu
            130                 135                 140
atc ctg cat ggc gcc gtg cgg ttc agc aac aac cct gcc ctg tgc aac       720
Ile Leu His Gly Ala Val Arg Phe Ser Asn Asn Pro Ala Leu Cys Asn
        145                 150                 155
gtg gag agc atc cag tgg cgg gac ata gtc agc agt gac ttt ctc agc       768
Val Glu Ser Ile Gln Trp Arg Asp Ile Val Ser Ser Asp Phe Leu Ser
    160                 165                 170
aac atg tcg atg gac ttc cag aac cac ctg ggc agc tgc caa aag tgt        816
Asn Met Ser Met Asp Phe Gln Asn His Leu Gly Ser Cys Gln Lys Cys
175                 180                 185                 190
gat cca agc tgt ccc aat ggg agc tgc tgg ggt gca gga gag gag aac        864
Asp Pro Ser Cys Pro Asn Gly Ser Cys Trp Gly Ala Gly Glu Glu Asn
                195                 200                 205
tgc cag aaa ctg acc aaa atc atc tgt gcc cag cag tgc tcc ggg cgc        912
Cys Gln Lys Leu Thr Lys Ile Ile Cys Ala Gln Gln Cys Ser Gly Arg
            210                 215                 220
tgc cgt ggc aag tcc ccc agt gac tgc tgc cac aac cag tgt gct gca        960
Cys Arg Gly Lys Ser Pro Ser Asp Cys Cys His Asn Gln Cys Ala Ala
        225                 230                 235
ggc tgc aca ggc ccc cgg gag agc gac tgc ctg gtc tgc cgc aaa ttc       1008
Gly Cys Thr Gly Pro Arg Glu Ser Asp Cys Leu Val Cys Arg Lys Phe
    240                 245                 250
cga gac gaa gcc acg tgc aag gac acc tgc ccc cca ctc atg ctc tac       1056
Arg Asp Glu Ala Thr Cys Lys Asp Thr Cys Pro Pro Leu Met Leu Tyr
255                 260                 265                 270
aac ccc acc acg tac cag atg gat gtg aac ccc gag ggc aaa tac agc       1104
Asn Pro Thr Thr Tyr Gln Met Asp Val Asn Pro Glu Gly Lys Tyr Ser
                275                 280                 285
ttt ggt gcc acc tgc gtg aag aag tgt ccc cgt aat tat gtg gtg aca       1152
Phe Gly Ala Thr Cys Val Lys Lys Cys Pro Arg Asn Tyr Val Val Thr
            290                 295                 300
gat cac ggc tcg tgc gtc cga gcc tgt ggg gcc gac agc tat gag atg       1200
Asp His Gly Ser Cys Val Arg Ala Cys Gly Ala Asp Ser Tyr Glu Met
        305                 310                 315
gag gaa gac ggc gtc cgc aag tgt aag aag tgc gaa ggg cct tgc cgc       1248
Glu Glu Asp Gly Val Arg Lys Cys Lys Lys Cys Glu Gly Pro Cys Arg
    320                 325                 330
aaa gtg tgt aac gga ata ggt att ggt gaa ttt aaa gac tca ctc tcc       1296
Lys Val Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu Ser
335                 340                 345                 350
ata aat gct acg aat att aaa cac ttc aaa aac tgc acc tcc atc agt       1344
Ile Asn Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile Ser
                355                 360                 365
ggc gat ctc cac atc ctg ccg gtg gca ttt agg ggt gac tcc ttc aca       1392
Gly Asp Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe Thr
            370                 375                 380
cat act cct cct ctg gat cca cag gaa ctg gat att ctg aaa acc gta       1440
His Thr Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr Val
       385                 390                 395
aag gaa atc aca ggg ttt ttg ctg att cag gct tgg cct gaa aac agg       1488
Lys Glu Ile Thr Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn Arg
    400                 405                 410
acg gac ctc cat gcc ttt gag aac cta gaa atc ata cgc ggc agg acc       1536
Thr Asp Leu His Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg Thr
415                 420                 425                 430
aag caa cat ggt cag ttt tct ctt gca gtc gtc agc ctg aac ata aca       1584
Lys Gln His Gly Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile Thr
                435                 440                 445
tcc ttg gga tta cgc tcc ctc aag gag ata agt gat gga gat gtg ata       1632
Ser Leu Gly Leu Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val Ile
            450                 455                 460
att tca gga aac aaa aat ttg tgc tat gca aat aca ata aac tgg aaa       1680
Ile Ser Gly Asn Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp Lys
        465                 470                 475
aaa ctg ttt ggg acc tcc ggt cag aaa acc aaa att ata agc aac aga       1728
Lys Leu Phe Gly Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn Arg
    480                 485                 490
ggt gaa aac agc tgc aag gcc aca ggc cag gtc tgc cat gcc ttg tgc       1776
Gly Glu Asn Ser Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu Cys
495                 500                 505                 510
tcc ccc gag ggc tgc tgg ggc ccg gag ccc agg gac tgc gtc tct tgc       1824
Ser Pro Glu Gly Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser Cys
                515                 520                 525
cgg aat gtc agc cga ggc agg gaa tgc gtg gac aag tgc aac ctt ctg       1872
Arg Asn Val Ser Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu Leu
            530                 535                 540
gag ggt gag cca agg gag ttt gtg gag aac tct gag tgc ata cag tgc       1920
Glu Gly Glu Pro Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln Cys
        545                 550                 555
cac cca gag tgc ctg cct cag gcc atg aac atc acc tgc aca gga cgg       1968
His Pro Glu Cys Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly Arg
    560                 565                 570
gga cca gac aac tgt atc cag tgt gcc cac tac att gac ggc ccc cac       2016
Gly Pro Asp Asn Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro His
575                 580                 585                 590
tgc gtc aag acc tgc ccg gca gga gtc atg gga gaa aac aac acc ctg       2064
Cys Val Lys Thr Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr Leu
                595                 600                 605
gtc tgg aag tac gca gac gcc ggc cat gtg tgc cac ctg tgc cat cca       2112
Val Trp Lys Tyr Ala Asp Ala Gly His Val Cys His Leu Cys His Pro
            610                 615                 620
aac tgc acc tac gga tgc act ggg cca ggt ctt gaa ggc tgt cca acg       2160
Asn Cys Thr Tyr Gly Cys Thr Gly Pro Gly Leu Glu Gly Cys Pro Thr
        625                 630                 635
aat ggg cct aag atc ccg tcc atc gcc act ggg atg gtg ggg gcc ctc       2208
Asn Gly Pro Lys Ile Pro Ser Ile Ala Thr Gly Met Val Gly Ala Leu
    640                 645                 650
ctc ttg ctg ctg gtg gtg gcc ctg ggg atc ggc ctc ttc atg cga agg       2256
Leu Leu Leu Leu Val Val Ala Leu Gly Ile Gly Leu Phe Met Arg Arg
655                 660                 665                 670
cgc cac atc gtt cgg aag cgc acg ctg cgg agg ctg ctg cag gag agg       2304
Arg His Ile Val Arg Lys Arg Thr Leu Arg Arg Leu Leu Gln Glu Arg
                675                 680                 685
gag ctt gtg gag cct ctt aca ccc agt gga gaa gct ccc aac caa gct       2352
Glu Leu Val Glu Pro Leu Thr Pro Ser Gly Glu Ala Pro Asn Gln Ala
            690                 695                 700
ctc ttg agg atc ttg aag gaa act gaa ttc aaa aag atc aaa gtg ctg       2400
Leu Leu Arg Ile Leu Lys Glu Thr Glu Phe Lys Lys Ile Lys Val Leu
        705                 710                 715
ggc tcc ggt gcg ttc ggc acg gtg tat aag gga ctc tgg atc cca gaa       2448
Gly Ser Gly Ala Phe Gly Thr Val Tyr Lys Gly Leu Trp Ile Pro Glu
    720                 725                 730
ggt gag aaa gtt aaa att ccc gtc gct atc aag gaa tta aga gaa gca       2496
Gly Glu Lys Val Lys Ile Pro Val Ala Ile Lys Glu Leu Arg Glu Ala
735                 740                 745                 750
aca tct ccg aaa gcc aac aag gaa atc ctc gat gaa gcc tac gtg atg       2544
Thr Ser Pro Lys Ala Asn Lys Glu Ile Leu Asp Glu Ala Tyr Val Met
                755                 760                 765
gcc agc gtg gac aac ccc cac gtg tgc cgc ctg ctg ggc atc tgc ctc       2592
Ala Ser Val Asp Asn Pro His Val Cys Arg Leu Leu Gly Ile Cys Leu
            770                 775                 780
acc tcc acc gtg cag ctc atc acg cag ctc atg ccc ttc ggc tgc ctc       2640
Thr Ser Thr Val Gln Leu Ile Thr Gln Leu Met Pro Phe Gly Cys Leu
        785                 790                 795
ctg gac tat gtc cgg gaa cac aaa gac aat att ggc tcc cag tac ctg       2688
Leu Asp Tyr Val Arg Glu His Lys Asp Asn Ile Gly Ser Gln Tyr Leu
    800                 805                 810
ctc aac tgg tgt gtg cag atc gca aag ggc atg aac tac ttg gag gac       2736
Leu Asn Trp Cys Val Gln Ile Ala Lys Gly Met Asn Tyr Leu Glu Asp
815                 820                 825                 830
cgt cgc ttg gtg cac cgc gac ctg gca gcc agg aac gta ctg gtg aaa       2784
Arg Arg Leu Val His Arg Asp Leu Ala Ala Arg Asn Val Leu Val Lys
                835                 840                 845
aca ccg cag cat gtc aag atc aca gat ttt ggg ctg gcc aaa ctg ctg       2832
Thr Pro Gln His Val Lys Ile Thr Asp Phe Gly Leu Ala Lys Leu Leu
            850                 855                 860
ggt gcg gaa gag aaa gaa tac cat gca gaa gga ggc aaa gtg cct atc       2880
Gly Ala Glu Glu Lys Glu Tyr His Ala Glu Gly Gly Lys Val Pro Ile
        865                 870                 875
aag tgg atg gca ttg gaa tca att tta cac aga atc tat acc cac cag       2928
Lys Trp Met Ala Leu Glu Ser Ile Leu His Arg Ile Tyr Thr His Gln
    880                 885                 890
agt gat gtc tgg agc tac ggg gtg acc gtt tgg gag ttg atg acc ttt       2976
Ser Asp Val Trp Ser Tyr Gly Val Thr Val Trp Glu Leu Met Thr Phe
895                 900                 905                 910
gga tcc aag cca tat gac gga atc cct gcc agc gag atc tcc tcc atc       3024
Gly Ser Lys Pro Tyr Asp Gly Ile Pro Ala Ser Glu Ile Ser Ser Ile
                915                 920                 925
ctg gag aaa gga gaa cgc ctc cct cag cca ccc ata tgt acc atc gat       3072
Leu Glu Lys Gly Glu Arg Leu Pro Gln Pro Pro Ile Cys Thr Ile Asp
            930                 935                 940
gtc tac atg atc atg gtc aag tgc tgg atg ata gac gca gat agt cgc       3120
Val Tyr Met Ile Met Val Lys Cys Trp Met Ile Asp Ala Asp Ser Arg
        945                 950                 955
cca aag ttc cgt gag ttg atc atc gaa ttc tcc aaa atg gcc cga gac       3168
Pro Lys Phe Arg Glu Leu Ile Ile Glu Phe Ser Lys Met Ala Arg Asp
    960                 965                 970
ccc cag cgc tac ctt gtc att cag ggg gat gaa aga atg cat ttg cca       3216
Pro Gln Arg Tyr Leu Val Ile Gln Gly Asp Glu Arg Met His Leu Pro
975                 980                 985                 990
agt cct aca gac tcc aac ttc tac cgt gcc ctg atg gat gaa gaa gac       3264
Ser Pro Thr Asp Ser Asn Phe Tyr Arg Ala Leu Met Asp Glu Glu Asp
                995                 1000                 1005
atg gac gac gtg gtg gat gcc gac gag tac ctc atc cca cag cag           3309
Met Asp Asp Val Val Asp Ala Asp Glu Tyr Leu Ile Pro Gln Gln
            1010                1015                1020
ggc ttc ttc agc agc ccc tcc acg tca cgg act ccc ctc ctg agc           3354
Gly Phe Phe Ser Ser Pro Ser Thr Ser Arg Thr Pro Leu Leu Ser
            1025                1030                1035
tct ctg agt gca acc agc aac aat tcc acc gtg gct tgc att gat           3399
Ser Leu Ser Ala Thr Ser Asn Asn Ser Thr Val Ala Cys Ile Asp
            1040                1045                1050
aga aat ggg ctg caa agc tgt ccc atc aag gaa gac agc ttc ttg           3444
Arg Asn Gly Leu Gln Ser Cys Pro Ile Lys Glu Asp Ser Phe Leu
            1055                1060                1065
cag cga tac agc tca gac ccc aca ggc gcc ttg act gag gac agc           3489
Gln Arg Tyr Ser Ser Asp Pro Thr Gly Ala Leu Thr Glu Asp Ser
            1070                1075                1080
ata gac gac acc ttc ctc cca gtg cct gaa tac ata aac cag tcc           3534
Ile Asp Asp Thr Phe Leu Pro Val Pro Glu Tyr Ile Asn Gln Ser
            1085                1090                1095
gtt ccc aaa agg ccc gct ggc tct gtg cag aat cct gtc tat cac           3579
Val Pro Lys Arg Pro Ala Gly Ser Val Gln Asn Pro Val Tyr His
            1100                1105                1110
aat cag cct ctg aac ccc gcg ccc agc aga gac cca cac tac cag           3624
Asn Gln Pro Leu Asn Pro Ala Pro Ser Arg Asp Pro His Tyr Gln
            1115                1120                1125
gac ccc cac agc act gca gtg ggc aac ccc gag tat ctc aac act           3669
Asp Pro His Ser Thr Ala Val Gly Asn Pro Glu Tyr Leu Asn Thr
            1130                1135                1140
gtc cag ccc acc tgt gtc aac agc aca ttc gac agc cct gcc cac           3714
Val Gln Pro Thr Cys Val Asn Ser Thr Phe Asp Ser Pro Ala His
            1145                1150                1155
tgg gcc cag aaa ggc agc cac caa att agc ctg gac aac cct gac           3759
Trp Ala Gln Lys Gly Ser His Gln Ile Ser Leu Asp Asn Pro Asp
            1160                1165                1170
tac cag cag gac ttc ttt ccc aag gaa gcc aag cca aat ggc atc           3804
Tyr Gln Gln Asp Phe Phe Pro Lys Glu Ala Lys Pro Asn Gly Ile
            1175                1180                1185
ttt aag ggc tcc aca gct gaa aat gca gaa tac cta agg gtc gcg           3849
Phe Lys Gly Ser Thr Ala Glu Asn Ala Glu Tyr Leu Arg Val Ala
            1190                1195                1200
cca caa agc agt gaa ttt att gga gca tga ccacggagga tagtatgagc         3899
Pro Gln Ser Ser Glu Phe Ile Gly Ala
            1205                1210
cctaaaaatc cagactcttt cgatacccag gaccaagcca cagcaggtcc tccatcccaa     3959
cagccatgcc cgcattagct cttagaccca cagactggtt ttgcaacgtt tacaccgact     4019
agccaggaag tacttccacc tcgggcacat tttgggaagt tgcattcctt tgtcttcaaa     4079
ctgtgaagca tttacagaaa cgcatccagc aagaatattg tccctttgag cagaaattta     4139
tctttcaaag aggtatattt gaaaaaaaaa aaaagtatat gtgaggattt ttattgattg     4199
gggatcttgg agtttttcat tgtcgctatt gatttttact tcaatgggct cttccaacaa     4259
ggaagaagct tgctggtagc acttgctacc ctgagttcat ccaggcccaa ctgtgagcaa     4319
ggagcacaag ccacaagtct tccagaggat gcttgattcc agtggttctg cttcaaggct     4379
tccactgcaa aacactaaag atccaagaag gccttcatgg ccccagcagg ccggatcggt     4439
actgtatcaa gtcatggcag gtacagtagg ataagccact ctgtcccttc ctgggcaaag     4499
aagaaacgga ggggatggaa ttcttcctta gacttacttt tgtaaaaatg tccccacggt     4559
acttactccc cactgatgga ccagtggttt ccagtcatga gcgttagact gacttgtttg     4619
tcttccattc cattgttttg aaactcagta tgctgcccct gtcttgctgt catgaaatca     4679
gcaagagagg atgacacatc aaataataac tcggattcca gcccacattg gattcatcag     4739
catttggacc aatagcccac agctgagaat gtggaatacc taaggatagc accgcttttg     4799
ttctcgcaaa aacgtatctc ctaatttgag gctcagatga aatgcatcag gtcctttggg     4859
gcatagatca gaagactaca aaaatgaagc tgctctgaaa tctcctttag ccatcacccc     4919
aaccccccaa aattagtttg tgttacttat ggaagatagt tttctccttt tacttcactt     4979
caaaagcttt ttactcaaag agtatatgtt ccctccaggt cagctgcccc caaaccccct     5039
ccttacgctt tgtcacacaa aaagtgtctc tgccttgagt catctattca agcacttaca     5099
gctctggcca caacagggca ttttacaggt gcgaatgaca gtagcattat gagtagtgtg     5159
gaattcaggt agtaaatatg aaactagggt ttgaaattga taatgctttc acaacatttg     5219
cagatgtttt agaaggaaaa aagttccttc ctaaaataat ttctctacaa ttggaagatt     5279
ggaagattca gctagttagg agcccacctt ttttcctaat ctgtgtgtgc cctgtaacct     5339
gactggttaa cagcagtcct ttgtaaacag tgttttaaac tctcctagtc aatatccacc     5399
ccatccaatt tatcaaggaa gaaatggttc agaaaatatt ttcagcctac agttatgttc     5459
agtcacacac acatacaaaa tgttcctttt gcttttaaag taatttttga ctcccagatc     5519
agtcagagcc cctacagcat tgttaagaaa gtatttgatt tttgtctcaa tgaaaataaa     5579
actatattca tttccactct aaaaaaaaaa aaaaaaa                              5616
 
<210>70
<211>1210
<212>PRT
<213>人(Homo sapiens)
 
<400>70
 
Met Arg Pro Ser Gly Thr Ala Gly Ala Ala Leu Leu Ala Leu Leu Ala
1               5                   10                  15
Ala Leu Cys Pro Ala Ser Arg Ala Leu Glu Glu Lys Lys Val Cys Gln
            20                  25                  30
Gly Thr Ser Asn Lys Leu Thr Gln Leu Gly Thr Phe Glu Asp His Phe
        35                  40                  45
Leu Ser Leu Gln Arg Met Phe Asn Asn Cys Glu Val Val Leu Gly Asn
    50                  55                  60
Leu Glu Ile Thr Tyr Val Gin Arg Asn Tyr Asp Leu Ser Phe Leu Lys
65                  70                  75                  80
Thr Ile Gln Glu Val Ala Gly Tyr Val Leu Ile Ala Leu Asn Thr Val
                85                  90                  95
Glu Arg Ile Pro Leu Glu Asn Leu Gln Ile Ile Arg Gly Asn Met Tyr
            100                 105                 110
Tyr Glu Asn Ser Tyr Ala Leu Ala Val Leu Ser Asn Tyr Asp Ala Asn
        115                 120                 125
Lys Thr Gly Leu Lys Glu Leu Pro Met Arg Asn Leu Gln Glu Ile Leu
    130                 135                 140
His Gly Ala Val Arg Phe Ser Asn Asn Pro Ala Leu Cys Asn Val Glu
145                 150                 155                 160
Ser Ile Gln Trp Arg Asp Ile Val Ser Ser Asp Phe Leu Ser Asn Met
                165                 170                 175
Ser Met Asp Phe Gln Asn His Leu Gly Ser Cys Gln Lys Cys Asp Pro
            180                 185                 190
Ser Cys Pro Asn Gly Ser Cys Trp Gly Ala Gly Glu Glu Asn Cys Gln
        195                 200                 205
Lys Leu Thr Lys Ile Ile Cys Ala Gln Gln Cys Ser Gly Arg Cys Arg
    210                 215                 220
Gly Lys Ser Pro Ser Asp Cys Cys His Asn Gln Cys Ala Ala Gly Cys
225                 230                 235                 240
Thr Gly Pro Arg Glu Ser Asp Cys Leu Val Cys Arg Lys Phe Arg Asp
                245                 250                 255
Glu Ala Thr Cys Lys Asp Thr Cys Pro Pro Leu Met Leu Tyr Asn Pro
            260                 265                 270
Thr Thr Tyr Gln Met Asp Val Asn Pro Glu Gly Lys Tyr Ser Phe Gly
        275                 280                 285
Ala Thr Cys Val Lys Lys Cys Pro Arg Asn Tyr Val Val Thr Asp His
    290                 295                 300
Gly Ser Cys Val Arg Ala Cys Gly Ala Asp Ser Tyr Glu Met Glu Glu
305                 310                 315                 320
Asp Gly Val Arg Lys Cys Lys Lys Cys Glu Gly Pro Cys Arg Lys Val
                325                 330                 335
Cys Asn Gly Ile Gly Ile Gly Glu Phe Lys Asp Ser Leu Ser Ile Asn
            340                 345                 350
Ala Thr Asn Ile Lys His Phe Lys Asn Cys Thr Ser Ile Ser Gly Asp
        355                 360                 365
Leu His Ile Leu Pro Val Ala Phe Arg Gly Asp Ser Phe Thr His Thr
    370                 375                 380
Pro Pro Leu Asp Pro Gln Glu Leu Asp Ile Leu Lys Thr Val Lys Glu
385                 390                 395                 400
Ile Thr Gly Phe Leu Leu Ile Gln Ala Trp Pro Glu Asn Arg Thr Asp
                405                 410                 415
Leu His Ala Phe Glu Asn Leu Glu Ile Ile Arg Gly Arg Thr Lys Gln
            420                 425                 430
His Gly Gln Phe Ser Leu Ala Val Val Ser Leu Asn Ile Thr Ser Leu
        435                 440                 445
Gly Leu Arg Ser Leu Lys Glu Ile Ser Asp Gly Asp Val Ile Ile Ser
    450                 455                 460
Gly Asn Lys Asn Leu Cys Tyr Ala Asn Thr Ile Asn Trp Lys Lys Leu
465                 470                 475                 480
Phe Gly Thr Ser Gly Gln Lys Thr Lys Ile Ile Ser Asn Arg Gly Glu
                485                 490                 495
Asn Ser Cys Lys Ala Thr Gly Gln Val Cys His Ala Leu Cys Ser Pro
            500                 505                 510
Glu Gly Cys Trp Gly Pro Glu Pro Arg Asp Cys Val Ser Cys Arg Asn
        515                 520                 525
Val Ser Arg Gly Arg Glu Cys Val Asp Lys Cys Asn Leu Leu Glu Gly
    530                 535                 540
Glu Pro Arg Glu Phe Val Glu Asn Ser Glu Cys Ile Gln Cys His Pro
545                 550                 555                 560
Glu Cys Leu Pro Gln Ala Met Asn Ile Thr Cys Thr Gly Arg Gly Pro
                565                 570                 575
Asp Asn Cys Ile Gln Cys Ala His Tyr Ile Asp Gly Pro His Cys Val
            580                 585                 590
Lys Thr Cys Pro Ala Gly Val Met Gly Glu Asn Asn Thr Leu Val Trp
        595                 600                 605
Lys Tyr Ala Asp Ala Gly His Val Cys His Leu Cys His Pro Asn Cys
    610                 615                 620
Thr Tyr Gly Cys Thr Gly Pro Gly Leu Glu Gly Cys Pro Thr Asn Gly
625                 630                 635                 640
Pro Lys Ile Pro Ser Ile Ala Thr Gly Met Val Gly Ala Leu Leu Leu
                645                 650                 655
Leu Leu Val Val Ala Leu Gly Ile Gly Leu Phe Met Arg Arg Arg His
            660                 665                 670
Ile Val Arg Lys Arg Thr Leu Arg Arg Leu Leu Gln Glu Arg Glu Leu
        675                 680                 685
Val Glu Pro Leu Thr Pro Ser Gly Glu Ala Pro Asn Gln Ala Leu Leu
    690                 695                 700
Arg Ile Leu Lys Glu Thr Glu Phe Lys Lys Ile Lys Val Leu Gly Ser
705                 710                 715                 720
Gly Ala Phe Gly Thr Val Tyr Lys Gly Leu Trp Ile Pro Glu Gly Glu
                725                 730                 735
Lys Val Lys Ile Pro Val Ala Ile Lys Glu Leu Arg Glu Ala Thr Ser
            740                 745                 750
Pro Lys Ala Asn Lys Glu Ile Leu Asp Glu Ala Tyr Val Met Ala Ser
        755                 760                 765
Val Asp Asn Pro His Val Cys Arg Leu Leu Gly Ile Cys Leu Thr Ser
    770                 775                 780
Thr Val Gln Leu Ile Thr Gln Leu Met Pro Phe Gly Cys Leu Leu Asp
785                 790                 795                 800
Tyr Val Arg Glu His Lys Asp Asn Ile Gly Ser Gln Tyr Leu Leu Asn
                805                 810                 815
Trp Cys Val Gln Ile Ala Lys Gly Met Asn Tyr Leu Glu Asp Arg Arg
            820                 825                 830
Leu Val His Arg Asp Leu Ala Ala Arg Asn Val Leu Val Lys Thr Pro
        835                 840                 845
Gln His Val Lys Ile Thr Asp Phe Gly Leu Ala Lys Leu Leu Gly Ala
    850                 855                 860
Glu Glu Lys Glu Tyr His Ala Glu Gly Gly Lys Val Pro Ile Lys Trp
865                 870                 875                 880
Met Ala Leu Glu Ser Ile Leu His Arg Ile Tyr Thr His Gln Ser Asp
                885                 890                 895
Val Trp Ser Tyr Gly Val Thr Val Trp Glu Leu Met Thr Phe Gly Ser
            900                 905                 910
Lys Pro Tyr Asp Gly Ile Pro Ala Ser Glu Ile Ser Ser Ile Leu Glu
        915                 920                 925
Lys Gly Glu Arg Leu Pro Gln Pro Pro Ile Cys Thr Ile Asp Val Tyr
    930                 935                 940
Met Ile Met Val Lys Cys Trp Met Ile Asp Ala Asp Ser Arg Pro Lys
945                 950                 955                 960
Phe Arg Glu Leu Ile Ile Glu Phe Ser Lys Met Ala Arg Asp Pro Gln
                965                 970                 975
Arg Tyr Leu Val Ile Gln Gly Asp Glu Arg Met His Leu Pro Ser Pro
            980                 985                 990
Thr Asp Ser Asn Phe Tyr Arg Ala Leu Met Asp Glu Glu Asp Met Asp
        995                 1000                1005
Asp Val Val Asp Ala Asp Glu Tyr Leu Ile Pro Gln Gln Gly Phe
    1010                1015                1020
Phe Ser Ser Pro Ser Thr Ser Arg Thr Pro Leu Leu Ser Ser Leu
    1025                1030                1035
Ser Ala Thr Ser Asn Asn Ser Thr Val Ala Cys Ile Asp Arg Asn
    1040                1045                1050
Gly Leu Gln Ser Cys Pro Ile Lys Glu Asp Ser Phe Leu Gln Arg
    1055                1060                1065
Tyr Ser Ser Asp Pro Thr Gly Ala Leu Thr Glu Asp Ser Ile Asp
    1070                1075                1080
Asp Thr Phe Leu Pro Val Pro Glu Tyr Ile Asn Gln Ser Val Pro
    1085                1090                1095
Lys Arg Pro Ala Gly Ser Val Gln Asn Pro Val Tyr His Asn Gln
    1100                1105                1110
Pro Leu Asn Pro Ala Pro Ser Arg Asp Pro His Tyr Gln Asp Pro
    1115                1120                1125
His Ser Thr Ala Val Gly Asn Pro Glu Tyr Leu Asn Thr Val Gln
    1130                1135                1140
Pro Thr Cys Val Asn Ser Thr Phe Asp Ser Pro Ala His Trp Ala
    1145                1150                1155
Gln Lys Gly Ser His Gln Ile Ser Leu Asp Asn Pro Asp Tyr Gln
    1160                1165                1170
Gln Asp Phe Phe Pro Lys Glu Ala Lys Pro Asn Gly Ile Phe Lys
    1175                1180                1185
Gly Ser Thr Ala Glu Asn Ala Glu Tyr Leu Arg Val Ala Pro Gln
    1190                1195                1200
Ser Ser Glu Phe Ile Gly Ala
    1205                1210
<210>71
<211>2603
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(476)..(1657)
 
<400>71
aggcgaggct tccccttccc cgcccctccc ccggcctcca gtccctccca gggccgcttc      60
gcagagcggc taggagcacg gcggcggcgg cactttcccc ggcaggagct ggagctgggc      120
tctggtgcgc gcgcggctgt gccgcccgag ccggagggac tggttggttg agagagagag      180
aggaagggaa tcccgggctg ccgaaccgca cgttcagccc gctccgctcc tgcagggcag      240
cctttcggct ctctgcgcgc gaagccgagt cccgggcggg tggggcgggg gtccactgag      300
accgctaccg gcccctcggc gctgacggga ccgcgcgggg cgcacccgct gaaggcagcc      360
ccggggcccg cggcccggac ttggtcctgc gcagcgggcg cggggcagcg cagcgggagg      420
aagcgagagg tgctgccctc cccccggagt tggaagcgcg ttacccgggt ccaaa atg       478
                                                             Met
                                                             1
ccc aag aag aag ccg acg ccc atc cag ctg aac ccg gcc ccc gac ggc        526
Pro Lys Lys Lys Pro Thr Pro Ile Gln Leu Asn Pro Ala Pro Asp Gly
            5                   10                  15
tct gca gtt aac ggg acc agc tct gcg gag acc aac ttg gag gcc ttg        574
Ser Ala Val Asn Gly Thr Ser Ser Ala Glu Thr Asn Leu Glu Ala Leu
        20                  25                  30
cag aag aag ctg gag gag cta gag ctt gat gag cag cag cga aag cgc        622
Gln Lys Lys Leu Glu Glu Leu Glu Leu Asp Glu Gln Gln Arg Lys Arg
    35                  40                  45
ctt gag gcc ttt ctt acc cag aag cag aag gtg gga gaa ctg aag gat        670
Leu Glu Ala Phe Leu Thr Gln Lys Gln Lys Val Gly Glu Leu Lys Asp
50                  55                  60                  65
gac gac ttt gag aag atc agt gag ctg ggg gct ggc aat ggc ggt gtg        718
Asp Asp Phe Glu Lys Ile Ser Glu Leu Gly Ala Gly Asn Gly Gly Val
                70                  75                  80
gtg ttc aag gtc tcc cac aag cct tct ggc ctg gtc atg gcc aga aag        766
Val Phe Lys Val Ser His Lys Pro Ser Gly Leu Val Met Ala Arg Lys
            85                  90                  95
cta att cat ctg gag atc aaa ccc gca atc cgg aac cag atc ata agg        814
Leu Ile His Leu Glu Ile Lys Pro Ala Ile Arg Asn Gln Ile Ile Arg
        100                 105                 110
gag ctg cag gtt ctg cat gag tgc aac tct ccg tac atc gtg ggc ttc        862
Glu Leu Gln Val Leu His Glu Cys Asn Ser Pro Tyr Ile Val Gly Phe
    115                 120                 125
tat ggt gcg ttc tac agc gat ggc gag atc agt atc tgc atg gag cac        910
Tyr Gly Ala Phe Tyr Ser Asp Gly Glu Ile Ser Ile Cys Met Glu His
130                 135                 140                 145
atg gat gga ggt tct ctg gat caa gtc ctg aag aaa gct gga aga att        958
Met Asp Gly Gly Ser Leu Asp Gln Val Leu Lys Lys Ala Gly Arg Ile
                150                 155                 160
cct gaa caa att tta gga aaa gtt agc att gct gta ata aaa ggc ctg        1006
Pro Glu Gln Ile Leu Gly Lys Val Ser Ile Ala Val Ile Lys Gly Leu
            165                 170                 175
aca tat ctg agg gag aag cac aag atc atg cac aga gat gtc aag ccc       1054
Thr Tyr Leu Arg Glu Lys His Lys Ile Met His Arg Asp Val Lys Pro
        180                 185                 190
tcc aac atc cta gtc aac tcc cgt ggg gag atc aag ctc tgt gac ttt       1102
Ser Asn Ile Leu Val Asn Ser Arg Gly Glu Ile Lys Leu Cys Asp Phe
    195                 200                 205
ggg gtc agc ggg cag ctc atc gac tcc atg gcc aac tcc ttc gtg ggc       1150
Gly Val Ser Gly Gln Leu Ile Asp Ser Met Ala Asn Ser Phe Val Gly
210                 215                 220                 225
aca agg tcc tac atg tcg cca gaa aga ctc cag ggg act cat tac tct       1198
Thr Arg Ser Tyr Met Ser Pro Glu Arg Leu Gln Gly Thr His Tyr Ser
                230                 235                 240
gtg cag tca gac atc tgg agc atg gga ctg tct ctg gta gag atg gcg       1246
Val Gln Ser Asp Ile Trp Ser Met Gly Leu Ser Leu Val Glu Met Ala
            245                 250                 255
gtt ggg agg tat ccc atc cct cct cca gat gcc aag gag ctg gag ctg       1294
Val Gly Arg Tyr Pro Ile Pro Pro Pro Asp Ala Lys Glu Leu Glu Leu
        260                 265                 270
atg ttt ggg tgc cag gtg gaa gga gat gcg gct gag acc cca ccc agg       1342
Met Phe Gly Cys Gln Val Glu Gly Asp Ala Ala Glu Thr Pro Pro Arg
    275                 280                 285
cca agg acc ccc ggg agg ccc ctt agc tca tac gga atg gac agc cga       1390
Pro Arg Thr Pro Gly Arg Pro Leu Ser Ser Tyr Gly Met Asp Ser Arg
290                 295                 300                 305
cct ccc atg gca att ttt gag ttg ttg gat tac ata gtc aac gag cct       1438
Pro Pro Met Ala Ile Phe Glu Leu Leu Asp Tyr Ile Val Asn Glu Pro
                310                 315                 320
cct cca aaa ctg ccc agt gga gtg ttc agt ctg gaa ttt caa gat ttt       1486
Pro Pro Lys Leu Pro Ser Gly Val Phe Ser Leu Glu Phe Gln Asp Phe
            325                 330                 335
gtg aat aaa tgc tta ata aaa aac ccc gca gag aga gca gat ttg aag       1534
Val Asn Lys Cys Leu Ile Lys Asn Pro Ala Glu Arg Ala Asp Leu Lys
        340                 345                 350
caa ctc atg gtt cat gct ttt atc aag aga tct gat gct gag gaa gtg       1582
Gln Leu Met Val His Ala Phe Ile Lys Arg Ser Asp Ala Glu Glu Val
    355                 360                 365
gat ttt gca ggt tgg ctc tgc tcc acc atc ggc ctt aac cag ccc agc       1630
Asp Phe Ala Gly Trp Leu Cys Ser Thr Ile Gly Leu Asn Gln Pro Ser
370                 375                 380                 385
aca cca acc cat gct gct ggc gtc taa gtgtttggga agcaacaaag             1677
Thr Pro Thr His Ala Ala Gly Val
                390
agcgagtccc ctgcccggtg gtttgccatg tcgcttttgg gcctccttcc catgcctgtc     1737
tctgttcaga tgtgcatttc acctgtgaca aaggatgaag aacacagcat gtgccaagat     1797
tctactcttg tcatttttaa tattactgtc tttattctta ttactattat tgttccccta     1857
agtggattgg ctttgtgctt ggggctattt gtgtgtatgc tgatgatcaa aacctgtgcc     1917
aggctgaatt acagtgaaat tttggtgaat gtgggtagtc attcttacaa ttgcactgct     1977
gttcctgctc catgactggc tgtctgcctg tattttcggg attctttgac atttggtggt     2037
actttattct tgctgggcat actttctctc taggagggag ccttgtgaga tccttcacag     2097
gcagtgcatg tgaagcatgc tttgctgcta tgaaaatgag catcagagag tgtacatcat     2157
gttattttat tattattatt tgcttttcat gtagaactca gcagttgaca tccaaatcta     2217
gccagagccc ttcactgcca tgatagctgg ggcttcacca gtctgtctac tgtggtgatc     2277
tgtagacttc tggttgtatt tctatattta ttttcagtat actgtgtggg atacttagtg     2337
gtatgtctct ttaagttttg attaatgttt cttaaatgga attattttga atgtcacaaa     2397
ttgatcaaga tattaaaatg tcggatttat ctttccccat atccaagtac caatgctgtt     2457
gtaaacaacg tgtatagtgc ctaaaattgt atgaaaatcc ttttaaccat tttaacctag     2517
atgtttaaca aatctaatct cttattctaa taaatatact atgaaataaa aaaaaaagga     2577
tgaaagctaa aaaaaaaaaa aaaaaa                                          2603
 
<210>72
<211>393
<212>PRT
<213>人(Homo sapiens)
 
<400>72
 
Met Pro Lys Lys Lys Pro Thr Pro Ile Gln Leu Asn Pro Ala Pro Asp
1               5                   10                  15
Gly Ser Ala Val Asn Gly Thr Ser Ser Ala Glu Thr Asn Leu Glu Ala
            20                  25                  30
Leu Gln Lys Lys Leu Glu Glu Leu Glu Leu Asp Glu Gln Gln Arg Lys
        35                  40                  45
Arg Leu Glu Ala Phe Leu Thr Gln Lys Gln Lys Val Gly Glu Leu Lys
    50                  55                  60
Asp Asp Asp Phe Glu Lys Ile Ser Glu Leu Gly Ala Gly Asn Gly Gly
65                  70                  75                  80
Val Val Phe Lys Val Ser His Lys Pro Ser Gly Leu Val Met Ala Arg
                85                  90                  95
Lys Leu Ile His Leu Glu Ile Lys Pro Ala Ile Arg Asn Gln Ile Ile
            100                 105                 110
Arg Glu Leu Gln Val Leu His Glu Cys Asn Ser Pro Tyr Ile Val Gly
        115                 120                 125
Phe Tyr Gly Ala Phe Tyr Ser Asp Gly Glu Ile Ser Ile Cys Met Glu
    130                 135                 140
His Met Asp Gly Gly Ser Leu Asp Gln Val Leu Lys Lys Ala Gly Arg
145                 150                 155                 160
Ile Pro Glu Gln Ile Leu Gly Lys Val Ser Ile Ala Val Ile Lys Gly
                165                 170                 175
Leu Thr Tyr Leu Arg Glu Lys His Lys Ile Met His Arg Asp Val Lys
            180                 185                 190
Pro Ser Asn Ile Leu Val Asn Ser Arg Gly Glu Ile Lys Leu Cys Asp
        195                 200                 205
Phe Gly Val Ser Gly Gln Leu Ile Asp Ser Met Ala Asn Ser Phe Val
    210                 215                 220
Gly Thr Arg Ser Tyr Met Ser Pro Glu Arg Leu Gln Gly Thr His Tyr
225                 230                 235                 240
Ser Val Gln Ser Asp Ile Trp Ser Met Gly Leu Ser Leu Val Glu Met
                245                 250                 255
Ala Val Gly Arg Tyr Pro Ile Pro Pro Pro Asp Ala Lys Glu Leu Glu
            260                 265                 270
Leu Met Phe Gly Cys Gln Val Glu Gly Asp Ala Ala Glu Thr Pro Pro
        275                 280                 285
Arg Pro Arg Thr Pro Gly Arg Pro Leu Ser Ser Tyr Gly Met Asp Ser
    290                 295                 300
Arg Pro Pro Met Ala Ile Phe Glu Leu Leu Asp Tyr Ile Val Asn Glu
305                 310                 315                 320
Pro Pro Pro Lys Leu Pro Ser Gly Val Phe Ser Leu Glu Phe Gln Asp
                325                 330                 335
Phe Val Asn Lys Cys Leu Ile Lys Asn Pro Ala Glu Arg Ala Asp Leu
            340                 345                 350
Lys Gln Leu Met Val His Ala Phe Ile Lys Arg Ser Asp Ala Glu Glu
        355                 360                 365
Val Asp Phe Ala Gly Trp Leu Cys Ser Thr Ile Gly Leu Asn Gln Pro
    370                 375                 380
Ser Thr Pro Thr His Ala Ala Gly Val
385                 390
 
<210>73
<211>1759
<212>DNA
<213>人(Homo sapiens)
 
<220>
<221>CDS
<222>(255)..(1457)
 
<400>73
cccctgcctc tcggactcgg gctgcggcgt cagccttctt cgggcctcgg cagcggtagc       60
ggctcgctcg cctcagcccc agcgcccctc ggctaccctc ggcccaggcc cgcagcgccg      120
cccgccctcg gccgccccga cgccggcctg ggccgcggcc gcagccccgg gctcgcgtag      180
gcgccgaccg ctcccggccc gccccctatg ggccccggct agaggcgccg ccgccgccgg      240
cccgcggagc cccg atg ctg gcc cgg agg aag ccg gtg ctg ccg gcg ctc        290
                Met Leu Ala Arg Arg Lys Pro Val Leu Pro Ala Leu
                1               5                   10
acc atc aac cct acc atc gcc gag ggc cca tcc cct acc agc gag ggc        338
Thr Ile Asn Pro Thr Ile Ala Glu Gly Pro Ser Pro Thr Ser Glu Gly
        15                  20                  25
gcc tcc gag gca aac ctg gtg gac ctg cag aag aag ctg gag gag ctg        386
Ala Ser Glu Ala Asn Leu Val Asp Leu Gln Lys Lys Leu Glu Glu Leu
    30                  35                  40
gaa ctt gac gag cag cag aag aag cgg ctg gaa gcc ttt ctc acc cag        434
Glu Leu Asp Glu Gln Gln Lys Lys Arg Leu Glu Ala Phe Leu Thr Gln
45                  50                  55                  60
aaa gcc aag gtc ggc gaa ctc aaa gac gat gac ttc gaa agg atc tca        482
Lys Ala Lys Val Gly Glu Leu Lys Asp Asp Asp Phe Glu Arg Ile Ser
                65                  70                  75
gag ctg ggc gcg ggc aac ggc ggg gtg gtc acc aaa gtc cag cac aga        530
Glu Leu Gly Ala Gly Asn Gly Gly Val Val Thr Lys Val Gln His Arg
            80                  85                  90
ccc tcg ggc ctc atc atg gcc agg aag ctg atc cac ctt gag atc aag        578
Pro Ser Gly Leu Ile Met Ala Arg Lys Leu Ile His Leu Glu Ile Lys
        95                  100                 105
ccg gcc atc cgg aac cag atc atc cgc gag ctg cag gtc ctg cac gaa        626
Pro Ala Ile Arg Asn Gln Ile Ile Arg Glu Leu Gln Val Leu His Glu
    110                 115                 120
tgc aac tcg ccg tac atc gtg ggc ttc tac ggg gcc ttc tac agt gac        674
Cys Asn Ser Pro Tyr Ile Val Gly Phe Tyr Gly Ala Phe Tyr Ser Asp
125                 130                 135                 140
ggg gag atc agc att tgc atg gaa cac atg gac ggc ggc tcc ctg gac        722
Gly Glu Ile Ser Ile Cys Met Glu His Met Asp Gly Gly Ser Leu Asp
                145                 150                 155
cag gtg ctg aaa gag gcc aag agg att ccc gag gag atc ctg ggg aaa        770
Gln Val Leu Lys Glu Ala Lys Arg Ile Pro Glu Glu Ile Leu Gly Lys
            160                 165                 170
gtc agc atc gcg gtt ctc cgg ggc ttg gcg tac ctc cga gag aag cac        818
Val Ser Ile Ala Val Leu Arg Gly Leu Ala Tyr Leu Arg Glu Lys His
        175                 180                 185
cag atc atg cac cga gat gtg aag ccc tcc aac atc ctc gtg aac tct        866
Gln Ile Met His Arg Asp Val Lys Pro Ser Asn Ile Leu Val Asn Ser
    190                 195                 200
aga ggg gag atc aag ctg tgt gac ttc ggg gtg agc ggc cag ctc atc        914
Arg Gly Glu Ile Lys Leu Cys Asp Phe Gly Val Ser Gly Gln Leu Ile
205                 210                 215                 220
gac tcc atg gcc aac tcc ttc gtg ggc acg cgc tcc tac atg gct ccg        962
Asp Ser Met Ala Asn Ser Phe Val Gly Thr Arg Ser Tyr Met Ala Pro
                225                 230                 235
gag cgg ttg cag ggc aca cat tac tcg gtg cag tcg gac atc tgg agc       1010
Glu Arg Leu Gln Gly Thr His Tyr Ser Val Gln Ser Asp Ile Trp Ser
            240                 245                 250
atg ggc ctg tcc ctg gtg gag ctg gcc gtc gga agg tac ccc atc ccc       1058
Met Gly Leu Ser Leu Val Glu Leu Ala Val Gly Arg Tyr Pro Ile Pro
        255                 260                 265
ccg ccc gac gcc aaa gag ctg gag gcc atc ttt ggc cgg ccc gtg gtc       1106
Pro Pro Asp Ala Lys Glu Leu Glu Ala Ile Phe Gly Arg Pro Val Val
    270                 275                 280
gac ggg gaa gaa gga gag cct cac agc atc tcg cct cgg ccg agg ccc       1154
Asp Gly Glu Glu Gly Glu Pro His Ser Ile Ser Pro Arg Pro Arg Pro
285                 290                 295                 300
ccc ggg cgc ccc gtc agc ggt cac ggg atg gat agc cgg cct gcc atg       1202
Pro Gly Arg Pro Val Ser Gly His Gly Met Asp Ser Arg Pro Ala Met
                305                 310                 315
gcc atc ttt gaa ctc ctg gac tat att gtg aac gag cca cct cct aag       1250
Ala Ile Phe Glu Leu Leu Asp Tyr Ile Val Asn Glu Pro Pro Pro Lys
            320                 325                 330
ctg ccc aac ggt gtg ttc acc ccc gac ttc cag gag ttt gtc aat aaa       1298
Leu Pro Asn Gly Val Phe Thr Pro Asp Phe Gln Glu Phe Val Asn Lys
        335                 340                 345
tgc ctc atc aag aac cca gcg gag cgg gcg gac ctg aag atg ctc aca       1346
Cys Leu Ile Lys Asn Pro Ala Glu Arg Ala Asp Leu Lys Met Leu Thr
    350                 355                 360
aac cac acc ttc atc aag cgg tcc gag gtg gaa gaa gtg gat ttt gcc       1394
Asn His Thr Phe Ile Lys Arg Ser Glu Val Glu Glu Val Asp Phe Ala
365                 370                 375                 380
ggc tgg ttg tgt aaa acc ctg cgg ctg aac cag ccc ggc aca ccc acg       1442
Gly Trp Leu Cys Lys Thr Leu Arg Leu Asn Gln Pro Gly Thr Pro Thr
                385                 390                 395
cgc acc gcc gtg tga cagtggccgg gctccctgcg tcccgctggt gacctgccca       1497
Arg Thr Ala Val
            400
ccgtccctgt ccatgccccg cccttccagc tgaggacagg ctggcgcctc cacccaccct     1557
cctgcctcac ccctgcggag agcaccgtgg cggggcgaca gcgcatgcag gaacgggggt     1617
ctcctctcct gcccgtcctg gccggggtgc ctctggggac gggcgacgct gctgtgtgtg     1677
gtctcagagg ctctgcttcc ttaggttaca aaacaaaaca gggagagaaa aagcaaaaaa     1737
aaaaaaaaaa aaaaaaaaaa aa                                              1759
 
<210>74
<211>400
<212>PRT
<213>人(Homo sapiens)
 
<400>74
 
Met Leu Ala Arg Arg Lys Pro Val Leu Pro Ala Leu Thr Ile Asn Pro
1               5                   10                  15
Thr Ile Ala Glu Gly Pro Ser Pro Thr Ser Glu Gly Ala Ser Glu Ala
            20                  25                  30
Asn Leu Val Asp Leu Gln Lys Lys Leu Glu Glu Leu Glu Leu Asp Glu
        35                  40                  45
Gln Gln Lys Lys Arg Leu Glu Ala Phe Leu Thr Gln Lys Ala Lys Val
    50                  55                  60
Gly Glu Leu Lys Asp Asp Asp Phe Glu Arg Ile Ser Glu Leu GIy Ala
65                  70                  75                  80
Gly Asn Gly Gly Val Val Thr Lys Val Gln His Arg Pro Ser Gly Leu
                85                  90                  95
Ile Met Ala Arg Lys Leu Ile His Leu Glu Ile Lys Pro Ala Ile Arg
            100                 105                 110
Asn Gln Ile Ile Arg Glu Leu Gln Val Leu His Glu Cys Asn Ser Pro
        115                 120                 125
Tyr Ile Val Gly Phe Tyr Gly Ala Phe Tyr Ser Asp Gly Glu Ile Ser
    130                 135                 140
Ile Cys Met Glu His Met Asp Gly Gly Ser Leu Asp Gln Val Leu Lys
145                 150                 155                 160
Glu Ala Lys Arg Ile Pro Glu Glu Ile Leu Gly Lys Val Ser Ile Ala
                165                 170                 175
Val Leu Arg Gly Leu Ala Tyr Leu Arg Glu Lys His Gln Ile Met His
            180                 185                 190
Arg Asp Val Lys Pro Ser Asn Ile Leu Val Asn Ser Arg Gly Glu Ile
        195                 200                 205
Lys Leu Cys Asp Phe Gly Val Ser Gly Gln Leu Ile Asp Ser Met Ala
    210                 215                 220
Asn Ser Phe Val Gly Thr Arg Ser Tyr Met Ala Pro Glu Arg Leu Gln
225                 230                 235                 240
Gly Thr His Tyr Ser Val Gln Ser Asp Ile Trp Ser Met Gly Leu Ser
                245                 250                 255
Leu Val Glu Leu Ala Val Gly Arg Tyr Pro Ile Pro Pro Pro Asp Ala
            260                 265                 270
Lys Glu Leu Glu Ala Ile Phe Gly Arg Pro Val Val Asp Gly Glu Glu
        275                 280                 285
Gly Glu Pro His Ser Ile Ser Pro Arg Pro Arg Pro Pro Gly Arg Pro
    290                 295                 300
Val Ser Gly His Gly Met Asp Ser Arg Pro Ala Met Ala Ile Phe Glu
305                 310                 315                 320
Leu Leu Asp Tyr Ile Val Asn Glu Pro Pro Pro Lys Leu Pro Asn Gly
                325                 330                 335
Val Phe Thr Pro Asp Phe Gln Glu Phe Val Asn Lys Cys Leu Ile Lys
            340                 345                 350
Asn Pro Ala Glu Arg Ala Asp Leu Lys Met Leu Thr Asn His Thr Phe
        355                 360                 365
Ile Lys Arg Ser Glu Val Glu Glu Val Asp Phe Ala Gly Trp Leu Cys
    370                 375                 380
Lys Thr Leu Arg Leu Asn Gln Pro Gly Thr Pro Thr Arg Thr Ala Val
385                 390                 395                 400
 
<210>75
<211>141
<212>PRT
<213>人工的
 
<220>
<223>人工合成的多肽片段
 
<400>75
 
Ser Ser Asp Pro Thr Gly Ala Leu Thr Glu Asp Ser Ile Asp Asp Thr
1               5                   10                  15
Phe Leu Pro Val Pro Glu Tyr Ile Asn Gln Ser Val Pro Lys Arg Pro
            20                  25                  30
Ala Gly Ser Val Gln Asn Pro Val Tyr His Asn Gln Pro Leu Asn Pro
        35                  40                  45
Ala Pro Ser Arg Asp Pro His Tyr Gln Asp Pro His Ser Thr Ala Val
    50                  55                  60
Gly Asn Pro Glu Tyr Leu Asn Thr Val Gln Pro Thr Cys Val Asn Ser
65                  70                  75                  80
Thr Phe Asp Ser Pro Ala His Trp Ala Gln Lys Gly Ser His Gln Ile
                85                  90                  95
Ser Leu Asp Asn Pro Asp Tyr Gln Gln Asp Phe Phe Pro Lys Glu Ala
            100                 105                 110
Lys Pro Asn Gly Ile Phe Lys Gly Ser Thr Ala Glu Asn Ala Glu Tyr
        115                 120                 125
Leu Arg Val Ala Pro Gln Ser Ser Glu Phe Ile Gly Ala
    130                 135                 140
 
<210>76
<211>420
<212>PRT
<213>人工的
 
<220>
<223>人工合成的多肽片段
 
<400>76
 
Tyr Asp Ala Arg Val His Thr Pro His Leu Asp Arg Leu Val Ser Ala
1               5                   10                  15
Arg Ser Val Ser Pro Thr Thr Glu Met Val Ser Asn Glu Ser Val Asp
            20                  25                  30
Tyr Arg Ala Thr Phe Pro Glu Asp Gln Phe Pro Asn Ser Ser Gln Asn
        35                  40                  45
Gly Ser Cys Arg Gln Val Gln Tyr Pro Leu Thr Asp Met Ser Pro Ile
    50                  55                  60
Leu Thr Ser Gly Asp Ser Asp Ile Ser Ser Pro Leu Leu Gln Asn Thr
65                  70                  75                  80
Val His Ile Asp Leu Ser Ala Leu Asn Pro Glu Leu Val Gln Ala Val
                85                  90                  95
Gln His Val Val Ile Gly Pro Ser Ser Leu Ile Val His Phe Asn Glu
            100                 105                 110
Val Ile Gly Arg Gly His Phe Gly Cys Val Tyr His Gly Thr Leu Leu
        115                 120                 125
Asp Asn Asp Gly Lys Lys Ile His Cys Ala Val Lys Ser Leu Asn Arg
    130                 135                 140
Ile Thr Asp Ile Gly Glu Val Ser Gln Phe Leu Thr Glu Gly Ile Ile
145                 150                 155                 160
Met Lys Asp Phe Ser His Pro Asn Val Leu Ser Leu Leu Gly Ile Cys
                165                 170                 175
Leu Arg Ser Glu Gly Ser Pro Leu Val Val Leu Pro Tyr Met Lys His
            180                 185                 190
Gly Asp Leu Arg Asn Phe Ile Arg Asn Glu Thr His Asn Pro Thr Val
        195                 200                 205
Lys Asp Leu Ile Gly Phe Gly Leu Gln Val Ala Lys Gly Met Lys Tyr
    210                 215                 220
Leu Ala Ser Lys Lys Phe Val His Arg Asp Leu Ala Ala Arg Asn Cys
225                 230                 235                 240
Met Leu Asp Glu Lys Phe Thr Val Lys Val Ala Asp Phe Gly Leu Ala
                245                 250                 255
Arg Asp Met Tyr Asp Lys Glu Tyr Tyr Ser Val His Asn Lys Thr Gly
            260                 265                 270
Ala Lys Leu Pro Val Lys Trp Met Ala Leu Glu Ser Leu Gln Thr Gln
        275                 280                 285
Lys Phe Thr Thr Lys Ser Asp Val Trp Ser Phe Gly Val Leu Leu Trp
    290                 295                 300
Glu Leu Met Thr Arg Gly Ala Pro Pro Tyr Pro Asp Val Asn Thr Phe
305                 310                 315                 320
Asp Ile Thr Val Tyr Leu Leu Gln Gly Arg Arg Leu Leu Gln Pro Glu
                325                 330                 335
Tyr Cys Pro Asp Pro Leu Tyr Glu Val Met Leu Lys Cys Trp His Pro
            340                 345                 350
Lys Ala Glu Met Arg Pro Ser Phe Ser Glu Leu Val Ser Arg Ile Ser
        355                 360                 365
Ala Ile Phe Ser Thr Phe Ile Gly Glu His Tyr Val His Val Asn Ala
    370                 375                 380
Thr Tyr Val Asn Val Lys Cys Val Ala Pro Tyr Pro Ser Leu Leu Ser
385                 390                 395                 400
Ser Glu Asp Asn Ala Asp Asp Glu Val Asp Thr Arg Pro Ala Ser Phe
                405                 410                 415
Trp Glu Thr Ser
            420

Claims (72)

1.一种分离的双链分子,它当被导入细胞时,抑制选自CDCA5、EPHA7、STK31和WDHD1中的基因的体内表达和细胞增殖,其中所述双链分子作用于与选自下组的靶序列匹配的mRNA:对于STK31为SEQ IDNO:38(在SEQ ID NO:5的1713-1732nt位置)和SEQ ID NO:39(在SEQ IDNO:5的2289-2308nt位置),对于CDCA5为SEQ ID NO:40(在SEQ ID NO:1的808-827nt位置)和SEQ ID NO:41(在SEQ ID NO:1的470-488nt位置),对于EPHA7为SEQ ID NO:42(在SEQ ID NO:3的2182-2200nt位置)和SEQID NO:43(在SEQ ID NO:3的1968-1987nt位置),以及对于WDHD1为SEQID NO:44(SEQ ID NO:7的577-596nt位置)和SEQ ID NO:45(在SEQ IDNO:7的2041-2060位置)。
2.权利要求1的双链分子,其包括有义链和与之互补的反义链,它们相互杂交形成双链,其中所述有义链包括相应于选自下组的序列的寡核苷酸:对于CDCA5为SEQ ID NO:40和SEQ ID NO:41,对于EPHA7为SEQID NO:42和SEQ ID NO:43,对于STK31的SEQ ID NO:38为SEQ ID NO:39,以及对于WDHD1的SEQ ID NO:44为SEQ ID NO:45。
3.权利要求2的双链分子,其由单一寡核苷酸组成,所述单一寡核苷酸包含通过间插单链连接在一起的的有义链和反义链。
4.权利要求3的双链分子,其具有通式5’-[A]-[B]-[A’]-3’,其中
[A]为有义链,其包括对应于选自下组的序列的寡核苷酸:对于CDCA5为SEQ ID NO:40和SEQ ID NO:41,对于EPHA7为SEQ ID NO:42和SEQID NO:43,对于STK31为SEQ ID NO:38和SEQ ID NO:39,以及对于WDHD1为SEQ ID NO:44和SEQ ID NO:45;
[B]为间插单链;和
[A’]为反义链,其包括对应于与[A]中所选序列互补的序列的寡核苷酸。
5.权利要求1的双链分子,其包含3’突出端。
6.一种载体,其表达权利要求1的双链分子。
7.一种抑制或降低表达选自下组的基因的细胞生长的方法:CDCA5、EPHA7、STK31和WDHD1,其中所述方法包括提供至少一个双链分子或表达至少一个双链分子的载体的步骤,其中所述双链分子或载体被导入细胞,抑制或降低所述基因的体内表达。
8.权利要求7的方法,其中所述双链分子是权利要求1的双链分子。
9.一种治疗或预防表达选自CDCA5、EPHA7、STK31和WDHD1中的基因的癌症的方法,其中所述方法包括施用至少一个双链分子或表达至少一个双链分子的载体的步骤,其中所述双链分子或载体被导入细胞,抑制或降低所述基因的体内表达。
10.权利要求9的方法,其中所述双链分子是权利要求1的双链分子.
11.权利要求9的方法,其中所述癌症为肺癌和/或食道癌。
12.一种抑制或降低表达选自CDCA5、EPHA7、STK31和WDHD1中的基因的细胞生长的组合物,所述组合物包括至少一个双链分子或表达至少一个双链分子的载体,其中所述双链分子或载体被导入细胞,抑制或降低所述基因的体内表达。
13.权利要求12的组合物,其中所述双链分子是权利要求1的双链分子。
14.一种治疗或预防表达选自CDCA5、EPHA7、STK31和WDHD1中的基因的癌症的组合物,其中所述方法包括施用至少一个双链分子或表达至少一个双链分子的载体的步骤,其中所述双链分子或载体被导入细胞,抑制或降低所述基因的体内表达和细胞增殖。
15.权利要求14的组合物,其中所述双链分子是权利要求1的双链分子。
16.一种诊断肺癌和/或食道癌的方法,其中所述方法包括以下步骤:
(a)检测生物样品中选自CDCA5、EPHA7、STK31和WDHD1中的基因的表达水平;和
(b)将该表达水平与该基因的正常对照水平相比的增加与所述疾病相关联。
17.权利要求16的方法,其中所述表达水平比正常对照水平高至少10%。
18.权利要求16的方法,其中所述表达水平利用选自下组的任一种方法检测:
(a)检测编码选自CDCA5、EPHA7、STK31和WDHD1中的多肽的mRNA;
(b)检测选自CDCA5、EPHA7、STK31和WDHD1中的多肽;和
(c)检测选自CDCA5、EPHA7、STK31和WDHD1中的多肽的生物活性。
19.权利要求16的方法,其中所述肺癌为非小细胞肺癌或小细胞肺癌。
20.一种评估肺癌和/或食道癌患者预后的方法,该方法包括以下步骤:
(a)检测生物样品中选自EPHA7、STK31和WDHD1中的基因的表达水平;和
(b)将检测到的表达水平与对照水平相比较;和
(c)根据(b)中的比较确定患者的预后。
21.权利要求20的方法,其中所述对照水平是预后良好的对照水平,且将表达水平与对照水平相比的增加确定为预后不良。
22.权利要求21的方法,其中所述增加是比所述对照水平高至少10%。
23.权利要求20的方法,其中所述表达水平是利用选自下组的任一种方法测定的:
(a)检测编码选自EPHA7、STK31和WDHD1中的多肽的mRNA;
(b)检测选自EPHA7、STK31和WDHD1中的多肽;和
(c)检测选自CDCA5、EPHA7、STK31和WDHD1中的多肽的生物活性。
24.权利要求23的方法,其中所述肺癌为非小细胞肺癌或小细胞肺癌。
25.一种检测受试者中EPHA7多肽的方法,包括以下步骤:
(a)收集来自待诊断的受试者的体液;
(b)通过免疫测定法检测所述体液中EPHA7多肽或其片段的水平。
26.权利要求25的方法,其中所述体液选自全血、血清和血浆。
27.权利要求25的方法,其中所述免疫测定法为ELISA。
28.权利要求25的方法,进一步包括以下步骤:
(d)测定血液样品中pro-GRP的水平;
(e)将步骤(e)中测定的pro-GRP水平与正常对照的pro-GRP水平相比较,其中与正常对照相比血液样品中的高EPHA7和/或高pro-GRP水平表明受试者患有肺癌。
29.权利要求25的方法,进一步包括以下步骤:
(d)测定血液样品中CEA的水平;
(e)将步骤(e)中测定的CEA水平与正常对照的CEA水平相比较,其中与正常对照相比血液样品中的高EPHA7和/或高CEA水平表明受试者患有肺癌。
30.一种用于检测肺癌和/或食道癌的试剂盒,其中所述试剂盒包括:
(a)用于测定血液样品中EPHA7水平的免疫测定试剂;和
(b)EPHA7的阳性对照样品。
31.权利要求30的试剂盒,所述试剂盒进一步包括用于检测CEA和/或pro-GRP的试剂。
32.一种筛选可用于诊断、治疗或预防癌症的试剂的方法,所述癌症表达至少一种选自CDCA5、EPHA7、STK31或WDHD1基因中的基因,所述方法包括以下步骤:
(a)使受试试剂与由所述基因编码的多肽或其片段接触;
(b)检测多肽与所述受试试剂之间的结合;
(c)选择与步骤(a)中所述多肽结合的受试试剂。
33.一种筛选可用于治疗或预防癌症的试剂的方法,所述癌症表达CDCA5、EPHA7、STK31或WDHD1基因,所述方法包括以下步骤:
(a)使受试试剂与表达编码选自下组的多肽或其功能等价物的多核苷酸的细胞接触:CDCA5、EPHA7、STK31和WDHD1多肽;
(b)检测步骤(a)中所述多核苷酸或多肽的表达水平;
(c)将步骤(b)中所述检测到的水平与在无受试试剂存在下检测到的水平相比较;和
(d)选择与步骤(c)中无受试试剂存在下检测到的水平相比,降低或抑制所述水平的受试试剂。
34.一种筛选可用于治疗或预防癌症的试剂的方法,所述癌症表达CDCA5、EPHA7、STK31或WDHD1基因,所述方法包括以下步骤:
(a)使受试试剂与表达编码选自下组的多肽或其功能等价物的多核苷酸的细胞接触:CDCA5、EPHA7、STK31和WDHD1多肽;
(b)检测步骤(a)中所述多核苷酸或多肽的生物活性;
(c)将步骤(b)中所述检测到的生物活性与在无受试试剂存在下检测到的生物活性相比较;和
(d)选择与步骤(c)中无受试试剂存在下检测到的生物活性相比,降低所述生物活性的受试试剂。
35.权利要求34的方法,其中所述生物活性是选自下组的任一种活性:
(a)增殖活性;
(b)侵袭活性;和
(c)激酶活性。
36.权利要求35的方法,其中用选自下组的基因的磷酸化水平检测所述激酶活性:EGFR、PLCgamma、CDC25、MET、Shc、ERK1/2(p44/42MAPK)、Akt、STAT3和MEK1/2。
37.权利要求36的方法,其中检测选自下组的残基处的所述磷酸化水平:
(a)EGFR的Y845、Y1068、Y1086、Y1173、S1046或S1047;
(b)PLCgamma的Y783;
(c)CDC25的S216;
(d)MET的Y1230、Y1234、Y1235、Y1349或Y1365;
(e)Shc的Y317、Y239、Y240;
(f)ERK1/2(p44/42MAPK)的T202或Y204;
(g)Akt的S473;
(h)STAT3的Y705;和
(i)MEK1/2的S217或S221。
38.一种筛选可用于治疗或预防表达EPHA7基因的癌症的试剂的方法,所述方法包括以下步骤:
(a)在受试化合物存在且允许底物磷酸化的条件下,使EPHA7多肽或其功能等价物与选自下组的底物接触:EGFR、PLCgamma、CDC25、MET、Shc、ERK1/2(p44/42MAPK)、Akt、STAT3及其功能等价物;
(b)检测底物的磷酸化水平;
(c)将步骤(b)中所述检测到的水平与在无受试试剂存在下检测到的水平相比较;和
(d)选择与步骤(c)中无受试试剂存在下检测到的水平相比降低或抑制所述水平的受试试剂。
39.权利要求38的方法,其中检测所述底物在选自下组的残基处磷酸化的水平:EGFR的Y845、Y1068、Y1086和/或Y1173,PLCgamma的Y783,CDC25的S216,MET的Y1230、Y1234、Y1235、Y1313、Y1349和/或Y1365,Shc的Y317、Y239和/或Y240,ERK1/2(p44/42MAPK)的T202和/或Y204,Akt的S473以及STAT3的Y705。
40.权利要求39的方法,其中EGFR的功能等价物为包含SEQ ID NO:75的氨基酸序列的多肽片段。
41.权利要求38的方法,其中MET的功能等价物为包含SEQ ID NO:76的氨基酸序列的多肽片段。
42.权利要求38的方法,其中所述癌症为肺癌和/或食道癌。
43.一种筛选阻断EPHA7多肽与EGFR多肽或MET之间的结合的试剂的方法,所述方法包括以下步骤:
(a)使EPHA7多肽或其功能等价物与EGFR或MET多肽或其功能等价物在受试试剂存在下接触;
(b)检测所述多肽之间的结合;
(c)将步骤(b)中检测到的结合水平与在无受试试剂存在下检测到的结合水平相比较;和
(d)选择与步骤(c)中无受试试剂存在下检测到的结合水平相比较,降低或抑制所述结合水平的受试试剂。
44.权利要求38的方法,其中EPHA7的功能等价物包括EGFR-结合域。
45.权利要求38的方法,其中EPHA7的功能等价物为包含SEQ ID NO:75的氨基酸序列的多肽片段。
46.权利要求38的方法,其中MET的功能等价物为包含SEQ ID NO:76的氨基酸序列的多肽片段。
47.一种筛选可用于治疗或预防表达STK31基因的癌症的试剂的方法,所述方法包括以下步骤:
(a)在受试化合物存在且允许底物磷酸化的条件下,使STK31多肽或其功能等价物与选自ERK1/2(p44/42MAPK)、EGFR和MEK1/2的底物接触;
(b)检测所述底物的磷酸化水平;
(c)将步骤(b)中所述检测到的水平与在无受试试剂存在下检测到的水平相比较;和
(d)选择与步骤(c)中无受试试剂存在下检测到的水平相比较,降低或抑制所述水平的受试试剂。
48.权利要求47的方法,其中检测所述底物在选自下组的残基处磷酸化的水平:ERK1/2(p44/42MAPK)的T202和/或Y204,EGFR的S1046和/或S1047以及MEK1/2的S217和/或S221。
49.权利要求47的方法,其中所述癌症选自肺癌和食道癌。
50.一种筛选阻断STK31多肽与c-raf、MEK或ERK(p44/42MAPK)多肽之间的结合的试剂的方法,所述方法包括以下步骤:
(a)使STK31多肽或其功能等价物与c-raf、MEK或ERK(p44/42MAPK)多肽或其功能等价物在受试试剂存在下接触;
(b)检测多肽之间的结合;
(c)将步骤(b)中检测到的结合水平与在无受试试剂存在下检测到的结合水平相比较;和
(d)选择与步骤(c)中无受试试剂存在下检测到的结合水平相比较,降低或抑制所述结合水平的受试试剂。
51.权利要求50的方法,其中STK31的功能等价物包括c-raf、MEK或ERK(p44/42MAPK)-结合域。
52.权利要求51的方法,其中c-raf、MEK或ERK(p44/42MAPK)的功能等价物包括STK31-结合域。
53.一种筛选用于治疗或预防癌症的试剂的方法,所述方法包括以下步骤:
(a)使受试试剂与表达编码WDHD1多肽或其功能等价物的基因的细胞接触;
(b)在允许步骤(a)中所述多肽磷酸化的条件下培养;
(c)检测步骤(a)中所述多肽的磷酸丝氨酸或磷酸酪氨酸水平;
(d)将在步骤(c)中检测到的磷酸化水平与在无受试试剂存在下检测到的磷酸化水平相比较;和
(e)选择抑制或降低磷酸化水平的受试试剂。
54.权利要求53的方法,其中所述癌症选自肺癌和食道癌。
55.权利要求54的方法,其中WDHD1的磷酸丝氨酸为S374。
56.权利要求53的方法,其中所述癌症选自肺癌和食道癌。
57.一种筛选试剂的方法,所述试剂用于治疗或预防表达WDHD1基因的癌症,所述方法包括以下步骤:
(a)在受试化合物存在,允许WDHD1磷酸化的条件下,使Akt多肽或其功能等价物与WDHD1或其功能等价物接触;
(b)检测WDHD1的磷酸化水平;
(c)将步骤(b)中所述检测到的水平与在无受试试剂存在下检测到的水平相比较;和
(d)选择与步骤(c)中无受试试剂存在下检测到的水平相比较,降低或抑制所述水平的受试试剂。
58.权利要求57的方法,其中检测WDHD1的S374残基处的磷酸化水平。
59.一种筛选阻断CDCA5多肽与CDC2或ERK多肽之间的相互作用或结合的试剂的方法,所述方法包括以下步骤:
(a)使(i)和(ii)的多肽在受试试剂存在下接触
(i)CDCA5多肽或其功能等价物;和
(ii)CDC2或ERK多肽或其功能等价物
(b)检测多肽之间相互作用或结合的水平;
(c)将步骤(b)中检测到的水平与在无受试试剂存在下检测到的水平相比较;和
(d)选择降低或抑制所述水平的受试试剂。
60.权利要求59的方法,其中CDCA5的功能等价物包括CDC2-相互作用域或ERK-相互作用域。
61.权利要求59的方法,其中CDC2或ERK的功能等价物包括CDCA5-相互作用域。
62.一种筛选调节CDCA5的CDC2-介导磷酸化或ERK-介导磷酸化的试剂的方法,所述方法包括以下步骤:
(a)使(i)和(ii)的多肽在受试试剂存在下接触
(i)CDCA5多肽或其功能等价物;和
(ii)CDC2或ERK多肽或其功能等价物
(b)检测(a)(i)的多肽的磷酸化水平;
(c)将步骤(b)中检测到的磷酸化水平与在无受试试剂存在下检测到的磷酸化水平相比较;和
(d)选择抑制或降低磷酸化水平的受试试剂作为抑制剂,或者选择促进或增强磷酸化水平的受试试剂作为增强剂。
63.权利要求62的方法,其中CDCA5多肽的功能等价物包括CDCA5多肽的至少一个CDC2-介导的磷酸化位点或ERK-介导的磷酸化位点。
64.权利要求62的方法,其中CDC2-介导的磷酸化位点为SEQ ID NO:2(CDCA5)的丝氨酸-21、丝氨酸-75或苏氨酸-159,ERK-介导的磷酸化位点为丝氨酸-21、苏氨酸-48、丝氨酸-75、丝氨酸-79、苏氨酸-111、苏氨酸-115、苏氨酸-159或丝氨酸-209。
65.一种筛选可用于预防或治疗表达CDCA5的癌症的试剂的方法,所述方法包括以下步骤:
(a)使受试试剂与表达编码CDCA5多肽或其功能等价物的基因的细胞接触;
(b)在允许步骤(a)中所述多肽磷酸化的条件下培养;
(c)检测步骤(a)中所述多肽的磷酸化水平;
(d)将在步骤(c)中检测到的磷酸化水平与在无受试试剂存在下检测到的磷酸化水平相比较;和
(e)选择与步骤(c)中无受试试剂存在下检测到的磷酸化水平相比较,抑制或降低所述磷酸化水平的受试试剂。
66.权利要求65的方法,其中所述试剂抑制或降低CDCA5的CDC2-介导的磷酸化活性或ERK-介导的磷酸化活性。
67.权利要求65的方法,其中所述磷酸化水平为磷酸丝氨酸或磷酸苏氨酸水平。
68.权利要求67的方法,其中CDCA5的磷酸丝氨酸为SEQ ID NO:2(CDCA5)的丝氨酸-21、丝氨酸-75、丝氨酸-79或丝氨酸-209。
69.权利要求68的方法,其中CDCA5的磷酸苏氨酸为SEQ ID NO:2(CDCA5)的苏氨酸-48、苏氨酸-111或苏氨酸-115。
70.权利要求65的方法,其中所述癌症选自肺癌和食道癌。
71.一种筛选用于治疗或预防表达CDCA5、EPHA7、STK31或WDHD1基因的癌症的试剂的方法,所述方法包括以下步骤:
(a)使受试试剂与细胞接触,所述细胞中已导入了包含CDCA5、EPHA7、STK31和/或WDHD1基因的转录调节区和在转录调节区控制下表达的报告基因的载体;
(b)测定所述报告基因的表达活性;和
(c)选择与在无受试化合物存在下的水平相比较,降低所述报告基因活性水平表达的化合物。
72.权利要求71的方法,其中所述癌症选自肺癌和食道癌。
CN200880113358A 2007-08-24 2008-08-21 癌症相关基因cdca5、epha7、stk31和wdhd1 Pending CN101835893A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US95793407P 2007-08-24 2007-08-24
US60/957,934 2007-08-24
US97733507P 2007-10-03 2007-10-03
US60/977,335 2007-10-03
PCT/JP2008/065353 WO2009028581A1 (en) 2007-08-24 2008-08-21 Cancer-related genes, cdca5, epha7, stk31 and wdhd1

Publications (1)

Publication Number Publication Date
CN101835893A true CN101835893A (zh) 2010-09-15

Family

ID=40387296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880113358A Pending CN101835893A (zh) 2007-08-24 2008-08-21 癌症相关基因cdca5、epha7、stk31和wdhd1

Country Status (10)

Country Link
US (1) US20110160280A1 (zh)
EP (1) EP2190985A4 (zh)
JP (1) JP2010536367A (zh)
KR (1) KR20100075858A (zh)
CN (1) CN101835893A (zh)
BR (1) BRPI0816150A2 (zh)
CA (1) CA2697517A1 (zh)
RU (1) RU2010111135A (zh)
TW (1) TW200922626A (zh)
WO (1) WO2009028581A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107619835A (zh) * 2017-05-11 2018-01-23 广东医科大学 Cdca5在胃癌中的表达载体及其构建方法及cdca5在胃癌中特异干扰片段
CN109355394A (zh) * 2018-12-28 2019-02-19 江苏省人民医院(南京医科大学第附属医院) 癌-睾丸抗原cdca5作为食管鳞癌预后标志物及治疗靶点
CN112979824A (zh) * 2021-02-01 2021-06-18 中国航天员科研训练中心 EphA7-Fc融合蛋白及其在预防和/或治疗骨质疏松疾病药物中的应用

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2305811A1 (en) * 2005-07-27 2011-04-06 Oncotherapy Science, Inc. Method of diagnosing smal cell lung cancer
JP2011522872A (ja) 2008-06-09 2011-08-04 オックスフォード ビオトヘラペウトイクス エルティーディー. エフリンa型受容体7タンパク質
JP2012506236A (ja) * 2008-10-24 2012-03-15 オンコセラピー・サイエンス株式会社 抗肺がん化合物または抗食道がん化合物のスクリーニング方法
MX2012011668A (es) * 2010-04-09 2012-12-17 Oncotherapy Science Inc Peptidos cdca5 y vacunas que incluyen los mismos.
TW201216982A (en) * 2010-10-21 2012-05-01 Oncotherapy Science Inc WDHD1 peptides and vaccines including the same
CN103048463A (zh) * 2012-05-02 2013-04-17 中国科学院广州生物医药与健康研究院 一种基于不同严谨度的用于检测dna结合蛋白的微孔板核酸杂交elisa方法
WO2014097875A1 (ja) * 2012-12-20 2014-06-26 国立大学法人鳥取大学 新規の脱分化誘導方法を用いた多能性幹細胞化
WO2014106886A1 (en) * 2013-01-07 2014-07-10 Oncotherapy Science, Inc. Cdca5 peptides and vaccines containing the same
KR101591378B1 (ko) * 2014-08-14 2016-02-03 한국생명공학연구원 Ddias 및 stat3의 상호작용을 이용한 암 치료제 스크리닝 방법
KR102337232B1 (ko) * 2018-11-30 2021-12-09 차의과학대학교 산학협력단 뇌 유래 소포체 특이적 마커 및 이를 이용한 뇌 질병 진단 방법

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4816567A (en) 1983-04-08 1989-03-28 Genentech, Inc. Recombinant immunoglobin preparations
US5260203A (en) 1986-09-02 1993-11-09 Enzon, Inc. Single polypeptide chain binding molecules
US5567610A (en) 1986-09-04 1996-10-22 Bioinvent International Ab Method of producing human monoclonal antibodies and kit therefor
US5229275A (en) 1990-04-26 1993-07-20 Akzo N.V. In-vitro method for producing antigen-specific human monoclonal antibodies
US5565332A (en) 1991-09-23 1996-10-15 Medical Research Council Production of chimeric antibodies - a combinatorial approach
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
WO1999067288A1 (fr) 1998-06-25 1999-12-29 Sumitomo Pharmaceuticals Company, Limited Peptides d'antigenes tumoraux provenant de la cyclophiline b
US20030166300A1 (en) * 2000-08-30 2003-09-04 Tang Y. Tom Growth-related inflammatory and immune response protein
WO2002086443A2 (en) * 2001-04-18 2002-10-31 Protein Design Labs, Inc Methods of diagnosis of lung cancer, compositions and methods of screening for modulators of lung cancer
US20050053973A1 (en) 2001-04-26 2005-03-10 Avidia Research Institute Novel proteins with targeted binding
WO2002088171A2 (en) 2001-04-26 2002-11-07 Avidia Research Institute Combinatorial libraries of monomer domains
US20050089932A1 (en) 2001-04-26 2005-04-28 Avidia Research Institute Novel proteins with targeted binding
US20050048512A1 (en) 2001-04-26 2005-03-03 Avidia Research Institute Combinatorial libraries of monomer domains
US20040175756A1 (en) 2001-04-26 2004-09-09 Avidia Research Institute Methods for using combinatorial libraries of monomer domains
JP2005508145A (ja) * 2001-06-15 2005-03-31 インサイト・ゲノミックス・インコーポレイテッド 細胞成長、分化および細胞死関連タンパク質
AU2003207708A1 (en) 2002-02-20 2003-09-09 Sirna Therapeutics, Inc. Rna interference mediated inhibition of map kinase genes
CA2500224C (en) 2002-09-25 2015-04-28 University Of Massachusetts In vivo gene silencing by chemically modified and stable sirna
EP2314691A3 (en) * 2002-11-14 2012-01-18 Dharmacon, Inc. Fuctional and hyperfunctional siRNA
WO2005044976A2 (en) 2003-06-20 2005-05-19 Isis Pharmaceuticals, Inc. Oligomeric compounds for use in gene modulation
US20050136437A1 (en) 2003-08-25 2005-06-23 Nastech Pharmaceutical Company Inc. Nanoparticles for delivery of nucleic acids and stable double-stranded RNA
WO2005045037A2 (en) 2003-10-23 2005-05-19 Sirna Therapeutics, Inc. RNA INTERFERENCE MEDIATED INHIBITION OF 5-ALPHA REDUCTASE AND ANDROGEN RECEPTOR GENE EXPRESSION USING SHORT INTERFERING NUCLEIC ACID (siNA)
US7700573B2 (en) * 2004-03-23 2010-04-20 Oncotherapy Science, Inc. Method for diagnosing non-small lung cancer
PL1781787T3 (pl) 2004-08-23 2018-01-31 Sylentis Sau Leczenie zaburzeń oka charakteryzowanych przez podwyższone ciśnienie wewnątrzgałkowe przy użyciu siRNA
WO2006105237A2 (en) * 2005-03-29 2006-10-05 The University Of Maryland, Baltimore Inhibitors for extracellular signal-regulated kinase docking domains and uses therefor
US8053183B2 (en) * 2005-07-27 2011-11-08 Oncotherapy Science, Inc. Method of diagnosing esophageal cancer
EP2305811A1 (en) * 2005-07-27 2011-04-06 Oncotherapy Science, Inc. Method of diagnosing smal cell lung cancer
JP5688497B2 (ja) * 2005-10-04 2015-03-25 国立大学法人名古屋大学 肺腺癌患者の術後予後を予測するための方法及び組成物

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107619835A (zh) * 2017-05-11 2018-01-23 广东医科大学 Cdca5在胃癌中的表达载体及其构建方法及cdca5在胃癌中特异干扰片段
CN109355394A (zh) * 2018-12-28 2019-02-19 江苏省人民医院(南京医科大学第附属医院) 癌-睾丸抗原cdca5作为食管鳞癌预后标志物及治疗靶点
CN112979824A (zh) * 2021-02-01 2021-06-18 中国航天员科研训练中心 EphA7-Fc融合蛋白及其在预防和/或治疗骨质疏松疾病药物中的应用
CN112979824B (zh) * 2021-02-01 2022-09-20 中国航天员科研训练中心 EphA7-Fc融合蛋白及其在预防和/或治疗骨质疏松疾病药物中的应用

Also Published As

Publication number Publication date
BRPI0816150A2 (pt) 2019-09-24
KR20100075858A (ko) 2010-07-05
JP2010536367A (ja) 2010-12-02
EP2190985A1 (en) 2010-06-02
RU2010111135A (ru) 2011-10-27
WO2009028581A1 (en) 2009-03-05
CA2697517A1 (en) 2009-03-05
US20110160280A1 (en) 2011-06-30
TW200922626A (en) 2009-06-01
EP2190985A4 (en) 2010-12-15

Similar Documents

Publication Publication Date Title
CN101835893A (zh) 癌症相关基因cdca5、epha7、stk31和wdhd1
JP5764822B2 (ja) がんの治療および診断の標的遺伝子としてのprmt1
CN101835894A (zh) Ebi3、dlx5、nptx1和cdkn3用作肺癌治疗和诊断的靶基因
WO2011096210A1 (en) Prmt1 and prmt6 for target genes of cancer therapy and diagnosis
JP5150855B2 (ja) Cdca1−kntc2複合体を標的とするスクリーニングおよびnsclcの治療方法
JP2012511305A (ja) 癌の治療および診断の標的遺伝子としてのネクチン−4
JP2013518560A (ja) がんの治療および診断の標的遺伝子としてのwhsc1およびwhsc1l1
CN102414318A (zh) 用作癌症治疗和诊断的靶基因的jarid1b
CN101855346A (zh) Pkib和naaladl2用作前列腺癌治疗和诊断的靶基因
JP2010523081A (ja) Cdca8−aurkb複合体を標的とするスクリーニング方法およびnsclcの治療方法
KR20110067107A (ko) 종양 마커 및 암에 대한 치료적 표적으로서 tbc1d7
CN102203250A (zh) 用于癌症治疗和诊断的靶基因syngr4
CN102197134A (zh) Oip5作为用于癌症治疗和诊断的靶基因
CN102597235A (zh) 肺癌和食管癌相关基因adamts18
JP2011518541A (ja) 癌治療法および癌診断のための標的遺伝子としてのC2orf18
WO2011018898A1 (en) Cdc45l as tumor marker and therapeutic target for cancer
CN102575300A (zh) 肺癌治疗和诊断的靶基因cstf2
CN102597236A (zh) 癌症治疗和诊断的靶基因ercc6l

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100915