CN1681834A - 肝癌相关的基因家族 - Google Patents

肝癌相关的基因家族 Download PDF

Info

Publication number
CN1681834A
CN1681834A CNA038217805A CN03821780A CN1681834A CN 1681834 A CN1681834 A CN 1681834A CN A038217805 A CNA038217805 A CN A038217805A CN 03821780 A CN03821780 A CN 03821780A CN 1681834 A CN1681834 A CN 1681834A
Authority
CN
China
Prior art keywords
leu
seq
nucleic acid
val
acid molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA038217805A
Other languages
English (en)
Inventor
高祥锡
Q·刘
郑贤镐
W·曾
李福万
宋始英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Chem Ltd
Original Assignee
LG Life Sciences Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Life Sciences Ltd filed Critical LG Life Sciences Ltd
Publication of CN1681834A publication Critical patent/CN1681834A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds

Abstract

本发明总体上涉及肝细胞癌中基因表达的改变。本发明特别涉及与相应于mRNA种类的人类基因,其中与非癌变的肝组织相比,所述mRNA种类与在癌变的肝组织和癌变的肿瘤中差异表达。

Description

肝癌相关的基因家族
                    技术领域
本发明总体上涉及肝癌患者的肝组织中基因表达的改变,所述肝癌患者同时患有肝硬化或肝炎。本发明特别涉及与发炎或硬化的肝组织相比在肝癌组织或其它恶性肿瘤中差异表达的人类基因家族。
                    背景技术
肝病
一般,肝病被分类为导致肝脏功能故障或丧失全部功能的疾病。例如,肝硬化是一类慢性肝病,其中肝脏细胞被损坏然后被瘢痕组织代替,因此减少了正常肝组织的数量。肝硬化通常是由滥用酒精引起的,但是有肝炎感染的患者或有其它胆汁疾病的患者也会发展为肝硬化。通常认为慢性的乙型肝炎,丙型肝炎,和肝硬化都表现出与原发性肝癌有着很强的相关性,尽管所涉及的机理到目前还不是很了解(Wu等人,(2001)Oncogene 20:3674-3682)。大约10-20%的慢性乙型肝炎感染会导致原发性肝癌。其它的因素例如酒精的消费,营养贫乏和黄曲霉毒素也都与原发性肝癌和肝硬化相关。
肝硬化的特征在于广泛存在的结节以及纤维化。受损的或死亡的肝细胞被纤维状的瘢痕组织代替,导致了纤维化。肝细胞以一种反常的形式进行再生,产生了被纤维组织围绕的结节。所述纤维化和结节的形成导致了对肝脏结构成分的扭曲和封闭,从而破坏了血流和生化功能。
利用患者所表现出的明显症状对肝硬化进行诊断通常是容易的,但是在其早期阶段是很难诊断肝硬化的。在早期阶段出现的一些细微的改变包括红色的手掌,白色上体出现红点,腮腺肥大,手掌内腱的纤维化和男子乳房发育症。X光和放射性追踪检测测试法可能是有效的,但是诊断必须经常要通过肝脏的活组织切片检查来进行。
与肝硬化的病理学不同,在原发性肝癌中,肝细胞成为异常的,它们生长不受控制并形成了恶性的肿瘤。所述疾病也称为肝细胞癌(HCC)或恶性肝细胞瘤。由于转移的结果从身体的其它部分扩散到肝脏的癌是一种不同的疾病。由于症状不明确,HCC在其早期很难进行诊断。这些症状包括食欲丧失和体重降低,发烧,疲劳和虚弱。随着癌症的发展,上腹部可能出现疼痛,并进一步发展为背部和右肩的疼痛。在上腹部可能会出现肿胀或可触摸到的肿块,同时会出现黄疸和黑尿。当癌转移时,它一般指向肺或脑。
HCC的诊断可以通过血液检测进行,特别是,例如检测肿瘤标记例如α-胎蛋白。大约50-70%的HCC患者表现出升高的α-胎蛋白水平。另外的检测方法包括非放射性成像(腹部的或胸部的X光片,血管造影,CT扫描和MRIs),使用放射性材料的肝脏扫描和肝脏的活组织切片检查。由于疾病的发现通常都太晚了,所以HCC的治疗通常是不成功的,但是其方法包括外科手术切除癌,化学疗法或放射疗法,它们单独或组合使用。尽管HCC在美国不是非常普遍,但是它在亚洲和非洲的部分地区是非常普遍的,这主要是由于肝炎病毒感染的高发病率( http://cis.nci.nih.gov/http://cancer.med.upenn.edu/disease /liver/intro_liver.html)。
肝脏疾病中的分子变化
与肝病的发展和进展相关的肝脏细胞中的分子变化知之甚少。因此,需要研究与肝病的发展和进展有关的基因表达水平的改变和鉴定新分子标记。此外,如果想要成功地进行干扰以中断或缓解肝病,就需要建立可以精确评价肝硬化或HCC的早期表现的方法。同样,为了防止或停止肝病的发展而采用的疗法的发展依赖于基因的鉴定,所述基因负责肝细胞的癌变和癌变肝细胞的生长或与肝硬化有关的组织损伤的诱导和瘢痕形成。
                        发明内容
本发明是基于新的基因家族的发现,其分别被命名为LBFL302和LBFL303,与肝硬化(LC)或慢性肝炎(CH)相比,它们在肝细胞癌(HCC)和其它的恶性肿瘤中差异性表达。本发明包括分离的核酸分子,其选自下列:含有SEQ ID NO:1,3,5或7的分离的核酸分子;编码SEQ IDNO:6或8的分离的核酸分子;编码肝癌中所表达的蛋白并与SEQ IDNO:5的整个连续序列表现出至少95%核苷酸序列同一性的分离的核酸分子;编码肝癌中所表达的蛋白并与SEQ ID NO:7的整个连续序列表现出至少75%核苷酸序列同一性的分离的核酸分子;和包含上述任一核酸分子的互补链的分离的核酸分子。
本发明进一步包括可操作地连接到一种或多种表达控制元件的核酸分子,包括包含所述分离的核酸分子的载体。本发明进一步包括经转化含有本发明核酸分子的宿主细胞,以及生产蛋白质的方法,所述方法包括步骤:在可以表达所述蛋白质的条件下培养用本发明核酸分子转化的宿主细胞。
本发明进一步提供选自下列的分离的多肽:包含SEQ ID NO:2,4,6或8的氨基酸序列的分离多肽;包含SEQ ID NO:2或4中至少10个氨基酸的片段的分离多肽;包含SEQ ID NO:2或4的保守氨基酸替代的分离多肽;和包含SEQ ID NO:2或4的天然存在的突变氨基酸序列的分离多肽。本发明的多肽还包括这样的多肽,它们的氨基酸序列与SEQ ID NO:2或4的序列具有至少大约50%,60%,70%或75%氨基酸序列同一性,优选至少大约80%,进一步优选至少大约90-95%,和最优选至少95-98%的序列同一性,本发明还包括与SEQ ID NO:6或8具有至少大约95%氨基酸序列同一性的蛋白质。
本发明进一步提供与本发明多肽特异性结合的分离的抗体或抗原结合型抗体片段,包括单克隆和多克隆抗体。
本发明进一步提供了鉴定一种物质的方法,所述物质可以调控编码本发明蛋白的核酸的表达,该方法包括:将表达该核酸分子的细胞暴露于所述物质;和确认所述物质是否调控所述核酸分子的表达,从而鉴定可以调控编码所述蛋白的核酸分子表达的物质。
本发明进一步提供鉴定物质的方法,该物质可以调控本发明蛋白的水平或该蛋白的至少一种活性,该方法包括:将表达该蛋白的细胞暴露于所述物质;和确认所述物质是否可以调控所述蛋白的水平或该蛋白的至少一种活性,从而鉴定可以调控所述蛋白的水平或该蛋白的至少一种活性的物质。
本发明进一步提供鉴定本发明蛋白的结合配偶体(partner)的方法,包括步骤:将所述蛋白暴露于潜在的结合配偶体;和确认所述潜在的结合配偶体是否结合到所述蛋白上,从而鉴定所述蛋白的结合配偶体。
本发明进一步提供调控编码本发明蛋白的核酸分子表达的方法,包括步骤:施用有效量的调控编码所述蛋白的核酸分子表达的物质。本发明还提供了调控本发明蛋白的至少一种活性的方法,包括步骤:施用有效量的调控本发明蛋白的至少一种活性的物质。
本发明进一步包括经修饰含有本发明核酸分子的非人类转基因动物,或者经修饰含有突变的核酸分子从而可以阻止所编码的本发明多肽的表达的非人类转基因动物。
本发明还包括非人类转基因动物,这些动物中含有SEQ ID NO:1,3,5,7或9的一部分或全长的基因的全部或一部分已经从所述动物的基因组中敲除或删除。
本发明进一步提供肝癌和其它癌症的诊断方法,包括步骤:从受试者中获得组织,血液,尿或其它样品,以及检测本发明多肽或核酸分子的表达水平。
本发明进一步包括组合物,该组合物包含稀释剂和选自下列的蛋白或多肽:含有SEQ ID NO:2,4,6,8或10的氨基酸序列的分离多肽;含有SEQ ID NO:2,4,6,8或10中至少10个氨基酸的片段的分离多肽;含有SEQ ID NO:2或4的保守氨基酸替代的分离多肽;SEQID NO:2或4的天然存在的氨基酸序列变体;分离的多肽,其氨基酸序列与SEQ ID NO:2或4的氨基酸序列具有至少大约50%,60%,70%或75%的氨基酸序列同一性,优选至少大约80%,进一步优选至少大约90-95%,和最优选至少大约95-98%的序列同一性;以及与SEQID NO:6,8或10具有至少大约95%氨基酸序列同一性的多肽。
                附图的简要说明
图1  图1是LBFL302——BC4变体(SEQ ID NO:2)的开放读码框所编码蛋白的疏水图。分析是根据Kyte-Doolittle和Goldman等人的方法进行的。
图2  图2是LBFL302——BC7变体(SEQ ID NO:4)的开放读码框所编码蛋白的疏水图。分析是根据Kyte-Doolittle和Goldman等人的方法进行的。
图3  图3是LBFL303——GE6克隆(SEQ ID NO:6)的开放读码框所编码蛋白的疏水图。分析是根据Kyte-Doolittle和Goldman等人的方法进行的。
图4  图4是LBFL303——MB5克隆(SEQ ID NO:8)的开放读码框所编码蛋白的疏水图。分析是根据Kyte-Doolittle和Goldman等人的方法进行的。
图5  图5是LBFL303——IE4克隆(SEQ ID NO:10)的开放读码框所编码蛋白的疏水图。分析是根据Kyte-Doolittle和Goldman等人的方法进行的。
                本发明最优选的实施方式
I.概述
本发明部分地基于新基因家族(LBFL302和LBFL303)的鉴定,与肝炎或肝硬化患者的人类肝脏组织相比,所述基因家族在癌变人类肝脏组织和其它恶性肿瘤中差异表达。这些基因家族相应于SEQ ID NOS:1和3的人类cDNA(LBFL302),和SEQ ID NOS:5,7和9的人类cDNA(LBFL303)。
本发明的基因和蛋白可以用作诊断试剂或标记以检测肝癌,或者将样品中的肝癌和肝硬化组织进行区分。它们还可以作为那些可调控基因表达或活性的物质的靶标使用。例如,可以鉴定调控与肿瘤生长相关的生物过程的物质,所述生物过程包括肝癌的增生过程。
II.具体实施方式
A.与肝癌相关的蛋白
本发明提供了分离的蛋白,所述蛋白的等位基因变体,和所述蛋白的保守氨基酸替代。如此处所述,“蛋白”或“多肽”部分地是指具有SEQ ID NO:2,4,6,8或10所述的人类氨基酸序列的蛋白。这两个词也涉及天然存在的具有与上面特定提到的序列有细微不同的氨基酸序列的等位基因变体和蛋白。虽然等位基因变体具有与上面提到的序列细微不同的氨基酸序列,但是其仍具有相同或相似的与这些蛋白相关的生物功能。
如此处所述,涉及人类氨基酸序列SEQ ID NO:2,4,6,8或10的蛋白家族是指已经从人类和生物体中分离出来的蛋白质。下面描述了鉴定和分离与这些蛋白有关的蛋白家族中其它成员的方法。
本发明的蛋白优选是分离形式。如此处所述,当利用物理,机械或化学方法将蛋白质从通常与该蛋白相关的细胞成分中分离出来后,所述蛋白可以说是分离的。本领域的普通技术人员可以很容易的利用标准的纯化方法得到分离的蛋白。
本发明的蛋白进一步包括SEQ ID NO:2,4,6,8或10的插入,删除或保守氨基酸替代变体。如此处所述,保守变体是指没有不利地影响蛋白生物功能的氨基酸序列改变。当所述改变的序列阻止或破坏了所述蛋白相关的生物功能时,所述替代,插入或删除被认为不利地影响了该蛋白质。例如,在一定情况下蛋白的总电荷,结构或疏水/亲水特性可能有所改变但并没有不利地影响生物活性。因此,可以对氨基酸序列进行改变,例如赋予蛋白更多的疏水或亲水特性但又不会不利地影响该蛋白的生物活性。
通常,所述等位基因变体,保守替代变体,和LBFL302基因编码的蛋白家族成员将具有与SEQ ID NO:2或4的序列保持至少大约50%,60%,70%或75%氨基酸序列同一性的氨基酸序列,更优选至少大约80%,进一步优选至少大约90-95%,和最优选至少大约99%或99.5%的序列同一性。进一步,LBFL303基因编码的蛋白家族的成员将具有与SEQ ID NO:6,8或10的序列保持至少大约50%,60%,70%或75%氨基酸序列同一性的氨基酸序列,更优选至少大约80-90%,进一步优选至少大约91-94%,和最优选至少大约95%或98%的序列同一性。这些序列的同一性或同源性定义为,在将序列进行比对并引入缺口(如果必要)以达到最大百分比同源性后,候选序列中与SEQ ID NO:2,4,6,8或10序列中相同的氨基酸残基的百分比,其中所述比对中不考虑将任何保守替代作为序列同一性的一部分(参考B部分中的相关参数)。融合蛋白,或对所述肽序列进行的N端,C端或内部延伸,删除,或插入不能被解释为影响同源性。
因此,本发明的蛋白包括:具有SEQ ID NO:2,4,6,8或10所示的氨基酸序列的分子;具有这些蛋白的至少大约3,4,5,6,10,15,20,25,30,35或更多氨基酸残基的连续序列的其片段;氨基酸序列变体,其中一个或多个氨基酸残基插入到所公开的编码序列的N端或C端或其中间;所述公开的序列的氨基酸序列变体,或如上所述的其片段,它们已经被至少一个残基所替换。这些片段,也称为肽或多肽,可能包含所述蛋白的抗原性区域,功能性区域,这些区域被确认为是与已知蛋白的功能域相对应的氨基酸序列的区域,也可以包含显著亲水的区域。这些区域通过使用常用的蛋白质序列分析软件可以很容易的进行确认,所述软件例如MacVector(Oxford Molecular)。
预见到的变体进一步包括那些含有预先确定的突变(例如通过同源重组,定点诱变或PCR诱变)的变体,以及其它动物品种(包括但不限于兔子,小鼠,大鼠,猪,牛,绵羊,马和非人灵长类动物)的相应蛋白,和所述蛋白家族的等位基因或其它天然存在的变体;以及衍生物,其中所述蛋白质通过用天然存在的氨基酸以外的部分(例如可探测的部分,如酶或放射性同位素)进行替换,化学修饰,酶促修饰和其它合适方法修饰而得到共价修饰。
本发明进一步提供了一种包含本发明的蛋白或多肽以及稀释剂的组合物。合适的稀释剂可以是水性或非水性溶剂或其组合,该稀释剂可以包含对所述蛋白或多肽的稳定性,溶解性,活性和/或储藏有益的额外组分,例如水溶性盐或甘油。
如下面所描述的,该蛋白家族的成员可以被:(1)用于鉴定可以调控该蛋白的水平或至少一种活性的物质,(2)用于鉴定该蛋白的结合配偶体,(3)用作抗原来产生多克隆或单克隆抗体,(4)用作肝癌和其它增生疾病的治疗试剂或靶标和(5)用作肝癌和其它增生疾病的诊断试剂或标记。
B.核酸分子
本发明进一步提供了编码具有SEQ ID NO:2,4,6,8或10的蛋白和此处所述的相关蛋白的核酸,优选是分离形式。如此处所述,“核酸”被定义为:编码上面所述蛋白或肽的RNA或DNA,或是编码所述此类肽的核酸序列的互补序列;在合适的严紧条件下与SEQ ID NO:1,3,5,7或9的核酸进行杂交并且保持稳定结合于其上;编码与SEQ IDNO:2或4的肽序列具有至少大约50%,60%,70%或75%,优选至少大约80%,进一步优选至少大约85%,和最优选至少大约90%,95%,98%,99%,99.5%或更高同一性的多肽,或者编码与SEQ ID NO:6或8的肽序列具有至少大约50%,60%,70%或75%,优选至少大约80-90%,进一步优选至少大约91-92%,和最优选至少大约93%,95%,98%,99%或更高同一性的多肽;或与SEQ ID NO:1或3的开放读码框具有至少50%,60%,70%或75%,优选至少大约80%,进一步优选至少大约85%,和更进一步优选至少大约90%,95%,98%,99%,99.5%或更高的核苷酸序列同一性,或与SEQ ID NO:5,7或9的开放读码框具有至少50%,60%,70%或75%,优选至少大约80-90%,进一步优选至少大约91-92%,和更进一步优选至少大约93%,95%,98%,99%或更高的核苷酸序列同一性。
本发明进一步包括与SEQ ID NO:1,3,5,7或9的互补序列进行特异杂交的分离的核酸分子,特别是与开放读码框进行特异杂交的分子。与SEQ ID NO:1,3,5,7或9的互补序列进行特异杂交的核酸分子一般在严紧的杂交条件下进行这样的杂交。
特别涉及的是基因组DNA,cDNA,mRNA和反义分子,以及建立在可选择骨架上的或包括可选择碱基的核酸,无论其是天然来源还是人工合成的。然而,所述杂交或互补的核酸将被进一步确定为相对于已有技术中的核酸是新颖的和非显而易见的,包括那些编码本发明蛋白质的核酸、与其互补的核酸以及在合适的严紧条件下与其杂交的核酸。
核苷酸或氨基酸序列水平的同源性或同一性通过BLAST(基本局部比对检索工具)分析进行确定,所述分析使用经过修改以适应序列相似性搜索的程序blastp,blastn,blastx,tblastn和tblastx(Altschul等人.,(1997)Nucleic Acids Res 25:3389-3402,和Karlin等人.,(1990)Proc Natl Acad Sci USA 87:2264-2268,二者都完整引入作为参考)的算法。BLAST程序使用的方法首先考虑查询序列和数据库序列之间的相似片段(带有或不带有缺口),然后评价鉴定的所有匹配(match)的统计学显著性,最后仅仅把那些达到预先确定的显著性阈值的匹配相加。对于序列数据库相似性搜索的基本情况的讨论,可以参考Altschul等人,(1994)Nature Genetics 6:119-129,这里将其完整引入作为参考。柱状图(Histogram),描述(descriptions),比对(alignments),预期值(expect)(也就是,报告与数据库序列匹配的统计学显著性阈值),阈值(cutoff),矩阵和过滤器(filter)  (低复杂性)的搜索参数全部使用其缺省设置。blastp,blastx,tblastn,和tblastx所用的缺省记分矩阵是BLOSUM62矩阵(Henikoff等人.,(1992)Proc NatlAcad Sci USA 89:10915-10919,全文引入作为参考),其被推荐用于那些长度超过85个核苷酸或氨基酸的查询序列。
对于blastn,记分矩阵由M(即,对匹配残基的奖励分值)与N(即,对错配残基的罚分)的比率来设定,其中M和N的缺省数值分别为5和-4。blastn的四个参数设定如下:Q=10(裂口产生罚分);R=10(裂口延伸罚分);wink=1(在查询序列中每个winkth位置产生的字串命中值(hit));和gapw-16(设定窗口宽度,在该窗口中产生缺口比对)。等同的Blastp参数设置为Q=9;R=2;wink=1;和gapw=32。存在于10.0版的GCG包中的用于在序列之间进行比较的Bestfit使用了DNA参数GAP=50(缺口产生罚分)和LEN=3(缺口延伸罚分),而蛋白比较中的等同参数为GAP=88和LEN=2。
“严紧条件”如下:(1)采用低离子强度和高温进行洗涤,例如,50℃下用0.015M NaCl/0.0015M柠檬酸钠/0.1%SDS,或(2)在杂交中采用甲酰胺之类的变性剂,例如42℃下的50%(vol/vol)甲酰胺和0.1%的牛血清白蛋白/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/pH6.5的50mM磷酸钠和750mM NaCl,75mM柠檬酸钠。另外一个例子是42℃下在50%甲酰胺,5×SSC(0.75M NaCl,0.075M柠檬酸钠),50mM磷酸钠(pH6.8),0.1%焦磷酸钠盐,5×Denhardt’s溶液,声波处理的鲑精DNA(50μg/ml),0.1%SDS,和10%的硫酸葡聚糖中杂交,并在42℃下于0.2×SSC和0.1%SDS中洗涤。本领域的技术人员可以轻易地确定和改变合适的严紧条件以取得清晰的可探测的杂交信号。优选的分子是那些在上述条件下与SEQ ID NO:1,3,5或7的互补序列杂交并编码功能性或全长蛋白的分子。进一步优选的杂交分子是那些在上述条件下与SEQ ID NO:1,3,5,7或9的开放读码框的互补链进行杂交的分子。
如此处所述,当核酸分子与编码其它多肽的核酸分子污染物基本分开后,该核酸分子被认为是“分离的”。
本发明进一步提供了所公开的核酸分子的片段。如此处所述,核酸分子的片段是指编码序列或非编码序列的一个小部分。所述片段的大小由其使用目的来决定。例如,如果这个片段是用于编码蛋白的活性部分,则所述片段就需要足够长以编码蛋白的功能区域。举例来说,可以制备编码相应于预测的抗原性区域的肽的片段。如果所述片段是用作核酸探针或PCR引物,则片段长度应该使得在探测/引发中得到相对少数目的假阳性(参考H部分中的讨论)。
用作探针或聚合酶链式反应(PCR)的特异引物,或用来合成编码本发明蛋白的基因序列的本发明核酸分子的片段(即,合成的寡核苷酸)可以通过化学技术轻易地进行合成,例如Matteucci等人的亚磷酰胺方法((1981),J Am Chem Soc 103:3185-3191),或使用自动合成的方法合成。另外,更大的DNA片段可以利用公知的技术简单地进行合成,例如首先合成一组定义基因中不同模块片段的寡核苷酸,然后将这些寡核苷酸连接在一起来产生完整的修饰基因。
本发明的核酸分子可以被进一步的修饰以包含用于诊断和探测目的的可检测标记。本领域中有很多公知的所述标记,可以很轻易地将其用于这里所述的编码分子中。适合的标记包括,但不限于,生物素标记,放射性标记或荧光标记的核苷酸等。本领域技术人员可以很轻易地利用任意一种此类标记得到本发明核酸分子的标记变体。
C.其它相关核酸分子的分离
如上所描述的,具有SEQ ID NO:1,3,5,7或9的核酸分子的鉴定和表征使本领域普通技术人员可以分离核酸分子,该核酸分子编码蛋白家族中除了上面所述序列的其它成员。进一步,本发明公开的核酸分子使本领域技术人员可以分离那些编码蛋白家族中除了具有SEQ IDNO:2,4,6,8或10的蛋白的其它成员的核酸分子。
例如,本领域技术人员可以轻易地使用SEQ ID NO:2,4,6,8或10的氨基酸序列制备抗体探针以筛选来自适当细胞的表达文库。通常,来自哺乳动物(如用纯化蛋白免疫的兔子,如下所述)的多克隆抗血清或者单克隆抗体可用于探测哺乳动物的cDNA或基因组表达文库,例如入gtll文库,以获得编码蛋白质家族其它成员的合适序列。克隆的cDNA序列可表达为一种融合蛋白,用其自身的控制序列直接进行表达,或者通过构建体进行表达,所述构建体使用适合于表达所述酶的特定宿主的控制序列。
可选择的,这里所提到的编码序列的一部分可以被合成并用作探针以从任何哺乳动物中得到编码该蛋白家族成员的DNA。制备包括大约18-20个核苷酸(编码大约6-7个氨基酸的片段)的低聚物,并将其用于筛选基因组DNA或cDNA文库以在严紧条件下或足以除去不必要的假阳性的严紧条件下得到杂交。
另外,可以制备寡核酸引物对以用于聚合酶链式反应(PCR)来选择性克隆编码核酸分子。使用了所述PCR引物的PCR变性/退火/延伸循环在本领域是公知的,并可以轻易地进行调整以用于分离其它的编码核酸分子。
编码该蛋白家族的其它成员的核酸分子也可以利用任何已有的计算方法在已有的基因组或其它序列信息中来获得,这些计算方法包括但不限于:PSI-BLAST(Altschul等人,(1997)Nucleic Acids Res 25:3389-3402);PHI-BLAST(Zhang等人,(1998)Nucleic Acids Res 26:3986-3990),3D-PSSM(Kelly等人,(2000)J Mol Biol 299(2):499-520);和其它计算分析方法(Shi等人,(1999)Biochem BiophysRes Commun 262(1):132-138和Matsunami等人,(2000)Nature404(6778):601-604)。
D.包含核酸分子的rDNA分子
本发明进一步提供包含了编码序列的重组DNA分子(rDNAs)。如此处所用,rDNA分子是进行了分子原位操作的DNA分子。生产rDNA分子的方法在本领域是公知的,例如,参考Sambrook等人, Molecular Cloning-A Laboratory Manual,第三版.,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,2001。在优选的rDNA分子中,编码DNA序列是与表达控制序列和/或载体序列可操作地连接在一起的。
如同本领域所公知的,可操作地连接于本发明蛋白家族的一种编码序列的载体和/或表达控制序列的选择直接依赖于所需的功能特性,例如蛋白表达,还依赖于转化的宿主细胞。本发明预期的载体至少可以指导rDNA分子中结构基因的复制或使其插入到宿主染色体中,优选还可以指导表达。
用于调整可操作性连接的蛋白编码序列的表达控制元件在本领域是公知的,包括但不限于,诱导型启动子,组成型启动子,分泌信号,和其它调控元件。优选,诱导型启动子是可以轻易控制的,例如响应于宿主细胞培养基中的营养物。
在一个实施方案中,包含编码核酸分子的载体将包括原核复制子,即,能在原核宿主细胞中指导重组DNA分子的自主复制并使其保持在染色体外,所述宿主细胞例如为用所述重组DNA分子转化的细菌宿主细胞。所述复制子在本领域是公知的。另外,包含原核复制子的载体还可以包括一种基因,所述基因的表达可以提供可探测标记例如抗药性。典型的细菌抗药性基因是那些提供了氨苄青霉素,卡那霉素,氯霉素或四环素抗性的基因。
包括原核复制子的载体还可进一步包括可以指导编码基因序列在细菌宿主细胞中表达(转录和翻译)的原核或噬菌体启动子,所述细菌例如为大肠杆菌。启动子是DNA序列形成的表达控制元件,其可以允许结合RNA聚合酶并可以引发转录过程。与细菌宿主兼容的启动子序列一般提供于质粒载体中,所述质粒载体包含方便的限制性酶切位点以插入本发明的DNA片段。典型的所述质粒载体是来自BioRad实验室(Richmond,CA)的pUC8,pUC9,pBR322和pBR329,来自Pharmacia(Piscataway,NJ)的pPL和pKK223。
与真核细胞兼容的表达载体,优选那些与脊椎动物细胞(例如肝细胞)兼容的载体也可以用于形成包含编码序列的rDNA分子。真核细胞表达载体,包括病毒载体,是本领域所公知的并可以利用多种商业途径获得。通常,所述载体是以包含方便的限制性酶切位点以插入所需DNA片段的形式提供的。典型的所述载体是pSVL和pKSV-10(Pharmacia),pBPV-1/pML2d(International Biotechnologies,Inc.),pTDT1(ATCC,#31255),和这里所描述的pCDM8载体,以及类似真核表达载体。如果需要,所述载体可以被修饰成包含肝细胞特异的启动子。
用于构建本发明的rDNA分子的真核细胞表达载体进一步可以包括在真核细胞中有效的选择性标记,优选抗药性选择标记。优选的抗药性标记是可以导致新霉素抗性的基因,即,新霉素磷酸转移酶(neo)基因。(Southern等人,(1982)J Mol Anal Genet 1:327-341)。可选择的,所述选择性标记可以位于其它质粒上,通过宿主细胞的共转染而引入两种载体,并通过在所述选择性标记的适当药物中培养来进行选择。
E.包含外源提供的编码核酸分子的宿主细胞
本发明进一步提供了被编码本发明蛋白的核酸分子转化的宿主细胞。所述宿主细胞可以是原核的或真核的。用于表达本发明蛋白的真核细胞是没有限制的,只要所述细胞系与细胞培养方法兼容并与表达载体的增殖和基因产物的表达兼容。优选的真核宿主细胞包括,但不限于,酵母,昆虫和哺乳动物细胞,优选脊椎动物细胞例如那些来自小鼠,大鼠,猴子或人类的细胞系。优选的真核宿主细胞包括来自ATCC的编号为CCL61的中国仓鼠卵巢(CHO)细胞,来自ATCC的编号为CRL 1658的NIH瑞士小鼠胚胎细胞(NIH/3T3),幼仓鼠肾细胞(BHK),以及类似真核组织培养细胞系。
任何原核宿主都可以用来表达编码本发明蛋白的rDNA分子。优选的原核宿主是大肠杆菌。
用本发明rDNA分子对适当宿主细胞的转化可以利用公知的方法来完成,所述方法一般依赖于使用的载体和所用的宿主系统类型。对于原核宿主细胞的转化,可以典型地利用电穿孔和盐处理方法(参考,例如,Cohen等人,(1972)Proc Natl Acad Sci USA 69:211O;和Sambrook等人,同上)。对于用包含rDNAs的载体对脊椎动物细胞的转化,可以典型地利用电穿孔,阳离子脂质或盐处理方法(参考,例如,Graham等人,(1973)Virol 52:456;Wigler等人,(1979)Proc Natl Acad SciUSA 76;1373-1376)。
成功转化的细胞,即,包含本发明rDNA分子的细胞,其可以利用公知的技术来获得,包括对选择性标记的选择。例如,通过引入本发明的rDNA得到的细胞可以进行克隆以产生单个菌落。由那些菌落得到的细胞可以收获,裂解,而且它们的DNA成分可以利用如Southern或Berent等人描述的方法检测以确定是否存在该rDNA,该方法参考Southern,(1975)J Mol Biol 98:503或Berent等人,(1985)Biotech3:208,或者将从该细胞得到的蛋白利用免疫学方法进行检验。
F.使用rDNA分子生产重组蛋白
本发明进一步提供使用这里所描述的核酸分子来生产本发明蛋白的方法。简而言之,重组形式的蛋白的生产一般包括以下步骤:
第一,得到编码本发明蛋白的核酸分子,例如包含下列,基本由下列组成或由下列组成的核酸分子:SEQ ID NO:1或SEQ ID NO:3;SEQ ID NO:1的核苷酸155-421或155-418;SEQ ID NO:3的核苷酸139-405或139-402;SEQ ID NO:5,SEQ ID NO:7或SEQ ID NO:9;SEQ ID NO:5的核苷酸32-1387或32-1384;SEQ ID NO:7的41-1504或41-1501;或者SEQ ID NO:9的核苷酸31-1554或31-1551。如果所述编码序列是被内含子所打断的,就如同这些开放读码框,则其适于直接在任意的宿主中进行表达。
所述核酸分子然后优选与适当的控制序列进行可操作的连接,如上面所述的,以形成包含该蛋白开放读码框的表达单元。所述表达单元用于转化适当的宿主,而所述转化的宿主是在允许重组蛋白产生的条件下进行培养的。可选择地,所述重组蛋白从细胞或培养基中分离出来;在可以容忍一些杂质的情况下,蛋白的回收和纯化不是必需的。
前面的每一个步骤都可以使用多种方法进行。例如,可以从基因组片段得到所需的编码序列并直接用于适当的宿主。在多种细胞中可操作的表达载体的构建通过是利用如上面所述的适当复制子和控制序列完成。控制序列,表达载体,和转化方法依赖于用于表达所述基因的宿主细胞类型,其将在下面进行详细的描述。合适的限制性酶切位点(如果不是通常可获得的)可以添加到编码序列的末端以提供可切除的基因来插入到这些载体中。本领域技术人员可以利用现有技术轻易地调整任意已知的宿主/表达系统以适于本发明核酸分子的使用从而产生重组蛋白。
G.鉴定结合配偶体的方法
本发明的另外一个实施方案提供了分离和鉴定本发明蛋白的结合配偶体的方法。一般而言,将本发明的蛋白与潜在结合配偶体或细胞的提取物或级分在允许本发明蛋白和潜在结合配偶体结合的条件下混合在一起。混合后,将已经与本发明蛋白结合的肽,多肽,蛋白或其它分子从该混合物中分离出来。与本发明蛋白结合的配偶体然后可以被移出并进而进行分析。为了鉴定和分离所述结合配偶体,可以使用完整的蛋白,例如包含SEQ ID NO:2,4,6,8或10的完整氨基酸序列的蛋白。可选择的,也可以使用所述蛋白的片段。
如此处所述,细胞提取物是指从裂解或破碎的细胞中得到的制备物或级分。优选的细胞提取物来源是来自人类的肝脏肿瘤细胞或转化的肝脏细胞,例如,肝癌的活组织切片组织或组织培养细胞。可选择的,可以利用正常的组织或已有的细胞系来制备细胞提取物,尤其是采用来自肝脏的细胞系。
可以使用多种方法得到细胞的提取物。可以利用物理或化学的破碎方法来破碎细胞。物理破碎方法的例子包括,但不限于,声波处理和机械剪切。化学裂解方法的例子包括,但不限于,去污剂裂解和酶裂解。本领域普通技术人员可以轻易地对所述制备细胞提取物的方法进行调整以得到本发明方法所需的提取物。
一旦得到细胞的提取物,就将其在可以发生蛋白和结合配偶体结合的条件下与本发明的蛋白混合在一起。可以使用的条件有很多种,最优选该条件与人类细胞质中的条件非常相似。所用细胞提取物的特征,例如同渗容摩,pH,温度和浓度,都可以进行调整以优化蛋白与结合配偶体的结合。
在适当的条件下进行混合后,将结合复合物从混合物中分离。多种方法都可以用来分离所述混合物。例如,可以用本发明蛋白的特异抗体来免疫沉淀结合配偶体复合物。可选择的,可以使用标准的化学分离方法,例如色谱和密度/沉降离心方法。
在除去了提取物中没有结合的细胞组分后,可以利用常规的方法使结合配偶体从复合物上解离下来。例如,所述解离可以通过改变混合物的盐浓度或pH值来实现。
为了利于从混合的提取物中分离结合的结合配偶体对,可以将本发明的蛋白固定到固相载体上。例如,可以将所述蛋白附着到硝酸纤维素基质上或丙烯酸珠子上。将所述蛋白连接到固相载体上有利于从提取物的其它组分中分离肽/结合配偶体对。鉴定的结合配偶体可以是一种蛋白也可以是两种或多种蛋白组成的复合物。可选择的,所述结合配偶体可以使用Takayama或者Sauder等人描述的Far-Western检测方法或者使用表位标记的蛋白或GST融合蛋白来鉴定,参考Takayama等人,(1997)Methods Mol Biol 69:171-184或者Sauder等人,(1996)J GenVirol 77:991-996。
可选择的,本发明的核酸分子可以在酵母双杂交系统中或其它体内蛋白-蛋白检测系统使用。酵母双杂交系统已用来鉴定其它蛋白配偶体对,并且可以轻易地进行改变以使用这里所描述的核酸分子。
H.可调控编码肝癌相关基因的核酸表达的物质的鉴定方法
本发明的另一个实施方案提供了调控核酸表达的物质的鉴定方法,其中所述核酸编码本发明的蛋白例如具有SEQ ID NO:2,4,6,8或10的氨基酸序列的蛋白。所述检测方法可以使用任何已有的方法监控本发明核酸分子表达水平的改变。如此处所述,当一种物质增量或减量调节细胞中核酸的表达时,该物质被认为可以调控本发明核酸分子的表达。
在一种测试方法中,可以制备含有报告基因融合体的细胞系,所述报告基因融合体在下列核苷酸和任何可检测的融合配偶体之间形成:由SEQ ID NO:1的核苷酸155-421、SEQ ID NO:3的核苷酸139-405、SEQ ID NO:5的核苷酸32-1387、SEQ ID NO:7的核苷酸41-1504、或SEQ ID NO:9的核苷酸31-1554所定义的开放读码框和/或5’和/或3’调控元件。已知的可检测融合配偶体有很多并且很容易得到,包括萤火虫的荧光素酶和编码氯霉素乙酰转移酶的基因(Alam等人,(1990)AnalBiochem 188:245-254)。然后将包括报告基因融合体的细胞系在适当的条件和时间暴露于待测物质。通过暴露于所述物质的样品和对照样品之间报告基因的差异表达,可以鉴定调控本发明核酸表达的物质。
另外一种测试方法可以用来监控所述物质调控编码本发明蛋白的核酸表达的能力,所述蛋白例如为具有SEQ ID NO:2,4,6,8或10的蛋白。举例来说,mRNA的表达可以通过与本发明核酸的杂交来进行直接检测。将细胞系在适当条件和时间暴露于待测物质,总RNA或mRNA是通过如Sambrook等人所述的标准方法进行分离的,参考Sambrook等人, Molecular Cloning-A Laboratory Manual,第三版,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY,2001。
优选的细胞是那些来自人类肝脏组织的细胞,举例来说,来自肝癌或肝癌并发肝硬化,或肝癌并发肝炎患者的用于肝脏活组织检查的组织或培养的细胞。可以使用的细胞系例如为ATCC编号为Nos.HB-8064,HB-8065或CRL-10741的肝细胞癌细胞系。
用于检测暴露于所述物质的细胞和对照细胞之间RNA表达水平差异的探针可以利用本发明的核酸进行制备。优选地,但不是必须地,设计仅在高严紧条件下与目标核酸进行杂交的探针。在高严紧条件下仅形成高度互补核酸杂交体。因此,检测条件的严紧程度决定了为了形成杂交体而在两条核酸链之间应该存在的互补性的数量。应该选择所述严紧性从而可以使探针:目标杂交体和探针:非目标杂交体之间的稳定性差异最大化。
可以利用本领域公知的方法从本发明的核酸来设计探针。例如,探针中G+C的含量和探针长度可以影响该探针结合到其目标序列的能力。探针特异性的优化方法通常是已有的,参考Sambrook等人,同上,或Ausubel等人,Short Protocols in Molecular Biology,第四版,John Wiley&Sons,Inc.,New York,1999。
杂交条件可以利用已有方法进行改进,例如那些Sambrook等人和Ausubel等人描述的适合于每一探针的方法。可以利用任何已有的方法进行总细胞RNA或polyA RNA富集的RNA的杂交。例如,可以将总细胞RNA或polyA RNA富集的RNA附着到固相载体上,在探针可以进行特异性杂交的条件下,所述固相载体暴露于至少一种所述探针,所述探针包含至少一种本发明序列或本发明序列的一部分。可选择的,包含至少一种本发明序列或本发明序列的一部分的核酸片段可以附着到固相载体上,例如硅片,多孔玻璃胶片或膜。然后在所述附着序列可以特异杂交的条件下将所述固相载体暴露于来自样品的细胞RNA或polyA RNA。所述固相载体和杂交方法是广泛可获得的,例如,那些由Beattie所公开的,参考(1995)WO 95/11755。通过检查给定的探针与来自未处理细胞群和来自暴露于所述物质的细胞群的RNA样品特异性杂交的能力,鉴定了可以增量或减量调节核酸表达的物质,所述核酸编码具有SEQ ID NO:2,4,6,8或10的蛋白。
为了对mRNA进行定量或定性分析,杂交也可以利用RNaseProtection Assay来实现(即RPA,参考Ma等人,(1996)Methods10:273-238)。简要的说,包含编码所述基因产物的cDNA和DNA依赖性的噬菌体特异性RNA聚合酶启动子(例如T7、T3或SP6 RNA聚合酶)的表达载体在所述cDNA分子的3’末端(噬菌体启动子的下游)线性化,其中所述线性化分子随后作为模板通过体外转录合成标记的cDNA的反义转录本。然后将所述标记的转录本与分离的RNA混合物(即,全部或分级的mRNA)通过45℃的过夜孵育进行杂交,缓冲液包含80%甲酰胺,40mM Pipes,pH6.4,0.4M NaCl和1mM EDTA。然后将得到的杂交体在包含40μg/ml核糖核酸酶A和2μg/ml核糖核酸酶的缓冲液中进行消化。钝化和提取外源蛋白后,将所述样品放在尿素/聚丙烯酰胺胶上进行分析。
在另外一种检测方法中,为了得到影响本发明基因产品表达的物质,首先鉴定生理上表达本发明基因产品的细胞或细胞系。如此鉴定的细胞和/或细胞系预期应该包含必要的细胞机制,使得当与具有合适表面传导机制和/或胞质溶胶级联传导的物质外源接触时,转录装置的调控精度得以保持。进一步,这些细胞或细胞系将用表达载体(例如,质粒或病毒载体)构建体进行转导或转染,该构建体包含可操作的编码本发明基因产物的结构基因的非翻译5’末端(含有启动子),所述5’末端与一种或多种抗原性片段融合,所述抗原性片段对于本发明基因产物来说是独特的,其中所述片段处于所述启动子的转录控制下并将被表达为多肽,所述多肽的分子量与天然存在的多肽相比是可以区别的,或者所述抗原性片段可能进一步包括免疫学上不同的标签或其它可探测标记。所述方法在本领域是公知的(参考Sambrook等人,同上)。
按上述方案进行转导或转染的细胞或细胞系随后在适当条件下与物质进行接触。例如,将药物可接受赋形剂中的该物质在含水生理缓冲溶液中与细胞接触,所述缓冲液例如为在37℃下孵育的生理pH的磷酸缓冲液(PBS),生理pH的Eagles平衡盐溶液(BSS),包含血清的PBS或BSS,或包含PBS或BSS和/或血清的条件培养基。所述条件可以由本领域技术人员根据需要进行调节。所述物质与细胞接触后,对所述细胞进行破碎并对裂解产物中的多肽进行分级,从而手机所述多肽级分,并与抗体接触以进一步进行免疫学检测(例如,ELISA,免疫沉淀反应或Western blot)。从“物质-结合”的样品中分离的蛋白级分将与对照样品进行比较(在对比样品中仅仅使赋形剂与细胞接触),与对比样品相比,“物质-结合”的样品中免疫学产生的信号的增加或减少将用于确定所述物质的功效。
H.调控肝癌相关蛋白的水平或至少一种活性的物质的鉴定方法
本发明的另一个实施方案提供了鉴定调控本发明蛋白的水平或至少一种活性的物质的方法,所述蛋白例如为具有SEQ ID NO:2,4,6,8或10的氨基酸序列的蛋白。所述方法或检验法可以使用用于监控或探测所需活性的任意方法。
在一种方法中,可以检验暴露于待测物质的细胞群体和未暴露的对照细胞群体之间的蛋白质相对数量。在所述方法中,可以使用特异性抗体之类的探针监控不同细胞群体中蛋白的差异表达。在适当的条件和时间下将细胞系或细胞群体暴露于待测物质。可以从暴露的细胞系或细胞群体和作为对照的未暴露的细胞系或细胞群体得到细胞裂解物。然后利用探针对细胞裂解物进行分析。
可以通过适当的免疫方案来免疫适当的哺乳动物宿主从而制备抗体探针,所述免疫利用了本发明的肽,多肽或蛋白,如果它们有足够长度的话,或者,如果需要的话,或如果需要提高免疫原性,应将其缀合于合适的载体上。连接于例如BSA,KLH或其它载体蛋白从而制备免疫原性缀合物的方法是本领域所公知的。在某些情况下,采用直接缀合,例如,采用碳二亚胺试剂可以是有效的;在其它情况下,可能需要用连接试剂例如那些由Pierce Chemical Co.(罗克福德,伊利诺斯州)提供的,来提供对半抗原的可接近性。半抗原肽可以用半胱氨酸残基在羧基末端或氨基末端进行延伸,或者利用半胱氨酸进行点缀,例如可以有利于与载体的连接。通常在适当的时间段并使用适当的佐剂来进行免疫原的施用,这是本领域已知的。在免疫过程中,获取抗体的滴定度来确定抗体形成是否足够。
虽然利用所述方法得到的多克隆抗血清可以满足一部分应用,但是对于药物组合物,优选使用单克隆制剂。如众所周知的,分泌所需单克隆抗体的永生化细胞系可以利用Kohler和Milstein的标准方法((1975)Nature 256:495-497)或者能够实现淋巴细胞或脾细胞永生化的其改进方法来进行制备。分泌所需抗体的所述永生化细胞系利用免疫测定进行筛选,其中抗原是肽半抗原,多肽或蛋白。当鉴定了分泌所需抗体的适当永生化细胞培养物后,所述细胞可以在体外进行培养或在腹水中生产。
然后将所需的单克隆抗体从培养物的上清或从腹水的上清回收。含有免疫学显著的(抗原结合)部分的单克隆抗体或多克隆抗血清的片段,以及完整的抗体可以被用作拮抗剂。使用免疫反应性(抗原结合)抗体片段,例如Fab,Fab’,或F(ab’)2片段经常是优选的,特别是在治疗中,因为这些片段一般比整个免疫球蛋白更不具有免疫原性。
也可以利用现有技术通过重组的方法来制备抗体或抗原结合型片段。特异性结合到蛋白所需区域的抗体区域也可以以多物种来源的嵌合体形式进行制备,例如人源化抗体。
利用上述方法检测的物质可以进行随机选择或理性选择和设计。如此处所述,当不考虑特定序列而随即选取某物质时,该物质被认为是随即选择的,其中所述特定序列参与于本发明蛋白的单独结合或联合其底物、结合配偶体等与本发明蛋白结合。随机选择物质的一个例子是使用化学文库或肽组合文库,或生物的生长培养物。
如这里所使用的,当考虑靶位点的序列和/或与物质的作用相关的构象从而在非随机的基础上选取该物质时,所述物质被认为是理性选择或设计的。利用形成这些位点的肽序列可以对物质进行理性选择或设计。例如,理性选择的肽物质是这样一种多肽,其氨基酸序列与任一多功能性一致位点是相同的或是其衍生物。
本发明的物质可以是,例如,肽,小分子,维生素衍生物,和糖类。显性阴性蛋白,编码这些蛋白的DNA,这些蛋白的抗体,这些蛋白的肽片段或这些蛋白的模拟体可以引入到细胞中来实现功能。这里所用的“模拟体”是指对肽分子的一个或几个区域的修饰从而提供化学上与其亲本肽不同但在拓扑图形学和功能上与其亲本肽相似的结构(参考Grant: Molecular Biology and Biotechnology,Meyers,编写,659-664页,VCH出版有限公司,纽约,1995)。本领域普通技术人员可以轻易地认识到,这里对于本发明中物质的结构性质没有限制。
本发明的肽物质可以利用本领域公知的标准固相(或液相)肽合成方法进行制备。另外,编码这些肽的DNA可以采用商业上可得的寡核酸合成设备来进行合成,并利用标准的重组生产系统进行重组生产。如果包括非基因编码的氨基酸,那么就必须使用固相肽合成来进行生产。
本发明的另一类物质是可以与本发明蛋白的关键位点发生免疫反应的抗体。所述抗体物质是通过利用具有肽免疫适当的哺乳动物受试者来获得的,所述肽含有预定被所述抗体所靶向的所述蛋白的那些部分作为抗原性区域。
J.调控肝癌相关蛋白的表达或至少一种活性的物质的应用
如实施例中所提供的,本发明的蛋白和核酸,例如具有氨基酸序列SEQ ID NO:2,4,6,8或10的蛋白,在癌变肝脏组织中差异表达。增量或减量调节或调控所述蛋白的表达或所述蛋白的至少一种活性的物质,例如激动剂或拮抗剂,可以用来调控与所述蛋白功能和活性有关的生物学和病理学过程。
如此处所述,受试者可以是任何哺乳动物,只要所述哺乳动物需要调控由本发明蛋白介导的病理学或生物学过程。术语“哺乳动物”是指属于哺乳动物纲的个体。本发明特别适用于治疗人类受试者。
病理学过程是指一类产生有害作用的生物学过程。例如,本发明蛋白的表达可能与肝细胞的繁殖或增生有关。如此处所述,当某物质减轻病理学过程的程度或严重性时,所述物质被认为调控该病理学过程。举例说明,通过施用可以以某种方式增量或减量调节或调控本发明蛋白的表达或至少一种活性的物质,从而防止肝癌或调控疾病进展。
本发明的物质可以被单独提供,或者可以与其它调控特定病理学过程的物质联合使用。例如,本发明的物质可以与其它已知的药物联合施用。如此处所述,当两种物质同时施用或以所述物质可以同时起作用的方式独立施用时,该两种物质被认为是联合施用的。
本发明的物质可以通过肠胃外的,皮下的,静脉内的,肌肉的,腹膜内的,透皮的,或口腔的途径施用。替代性的,或同时的,可以通过口服来施用。施用的剂量是由接受者的年龄,健康状况和体重,共同治疗的类型(如果有的话),治疗的频率,和需要达到的效果性质来决定的。
本发明进一步提供了组合物,该组合物含有一种或多种可以调控本发明蛋白的至少一种活性或其表达的物质。由于个体需要的差异,本领域普通技术人员可以确定每种成分有效量的最优化范围。典型的剂量包含0.1至100μg/kg体重。优选的剂量包含0.1至10μg/kg体重。最优选的剂量包含0.1至1μg/kg体重。
除了药理活性物质外,本发明的组合物还可以包含适当的药物可接受载体以递送至作用位点,所述载体包含有利于将活性成分加工成药学可利用的制剂的赋形剂和辅剂。肠胃外施用的适当配剂包括水溶形式活性化合物的水溶液,例如,水溶性盐。另外,可以施用活性化合物的悬浮物,例如合适的油性注射悬浮液。适当的亲脂溶剂或介质包括脂肪油,例如,芝麻油,或合成脂肪酸酯,例如,油酸乙酯或甘油三酯。水性注射悬浮液可以包含提高悬浮液粘度的物质,其包括,例如,羧甲基纤维素钠,山梨糖醇,和/或葡聚糖。可选的,悬浮液还可以包含稳定剂。也可以利用脂质体将所述物质包囊化从而将其运送到细胞内。
按照本发明进行系统施用的药物配剂可以配制成用于肠内,肠胃外或局部施用。实际上,这三种制剂形式可以同时使用以获得活性组份的系统施用。
进行口服的适当制剂包括硬质或软质明胶胶囊,丸剂,片剂,包括包衣片剂,酏剂,悬浮液,糖浆或吸入剂及其控释形式。
在本发明方法的实施中,可以将本发明的化合物单独使用或联合使用,或与其它的治疗剂或诊断剂联合使用。在优选的实施方案中,本发明的化合物可以与其它一般适用于这些病症的化合物按照一般可接受的医学实践联合施用。本发明的混合物可以在体内使用,一般在哺乳动物中,例如人类,绵羊,马,牛,猪,狗,猫,大鼠和小鼠,或者在体外使用。
K.转基因动物
本发明还包括含有突变、敲除或修饰基因的转基因动物,所述基因相应于SEQ ID NO:1,3,5,7或9的cDNA序列,或者编码多肽序列SEQ ID NO:2,4,6,8或10或其具有至少大约3,4,5,6,10,15,20,25,30,35或更多氨基酸残基的连续序列的片段的开放读码框。转基因动物是经过基因修饰的动物,其中转入了重组的,外源的或克隆的基因材料。所述基因材料通常被称为“转基因”。所述转基因的核苷酸序列(在本案中为SEQ ID NO:1,3,5,7或9的形式)被整合入通常没有该特定核苷酸序列的基因组座位,或该转基因的正常基因座位。所述转基因可以由来自同一物种的基因组或来自目标动物之外的其它物种基因组的核酸序列组成。
在一些实施方案中,可以构建这样的转基因动物,在这些动物体中删除了包含SEQ ID NO:1,3,5,7或9的基因的全部或一部分。在相应于SEQ ID NO:1,3,5,7或9相基因包含了一个或多个内含子的那些情况下,可以删除整个基因——所有的外显子,内含子和调控序列——。可以选择的,删除的部分也可以小于整个基因。例如,只是删除了一个外显子和/或内含子,从而产生表达本发明蛋白的修饰版本的动物。
术语“生殖细胞系转基因动物”是指一种转基因动物,在其生殖系细胞中引入了遗传改变或遗传信息,因此使所述转基因动物能够将该遗传信息传递给后代。如果所述后代实际具有了所述改变或遗传信息的一些或全部,则它们也是转基因动物。
所述改变或遗传信息对受体所属的动物物种来说可以是外来的,只对该特定受体个体来说是外来的,或可能是该受体已经具有的遗传信息。在最后一种情况下,改变或引入的基因的表达可能不同于其天然基因。
转基因动物可以通过不同的方法进行制备,包括转染,电穿孔,显微注射,对胚胎干细胞的基因靶向和重组病毒和逆转录病毒的感染(参考,例如,美国专利No.4,736,866;美国专利No.5,602,307;Mullins等人,(1993)Hypertension 22:630-633;Brenin等人,(1997)Surg Oncol 6:99-110; Recombinant Gene Expression Protocols (Methods In Molecular Biology,Vol.62),Tuan,编辑,Humana Press,Totowa,NJ,1997)。
已经制备了很多重组的或转基因的小鼠,其中包括那些表达激活的致癌基因的小鼠(美国专利No.4,736,866);表达猿SV40 T-抗原的小鼠(美国专利No.5,728,915);缺少干扰素调节因子1(IRF-1)表达的小鼠(美国专利No.5,731,490);表现出多巴胺能功能紊乱的小鼠(美国专利No.5,723,719);表达至少一种参与血压控制的人类基因的小鼠(美国专利No.5,731,489);与自然存在的Alzheimer病的症状表现出极大相似度的小鼠(美国专利No.5,720,936);介导细胞粘附的能力降低的小鼠(美国专利No.5,602,307);具有牛生长激素基因的小鼠(Clutter等人,(1996)Genetics 143:1753-1760);或者,可以产生全部人类抗体响应的小鼠(McCarthy(1997)Lancet349:405)。
虽然小鼠和大鼠可以作为大多数转基因试验的选择,但在有些情况下优选或必须使用其它品种的动物。转基因方法已经成功的在很多非鼠类动物中进行,包括绵羊,山羊,猪,狗,猫,猴子,黑猩猩,仓鼠,兔子,牛和豚猪(参考,例如,Kim等人,(1997)Mol Reprod Dev46:515-526;Houdebine,(1995)Reprod Nutr Dev 35:609-617;Petters,(1994)Reprod Fertil Dev 6:643-645;Schnieke等人,(1997)Science278:2130-2133;和Amoah,(1997)J Animal Science 75:578-585)。
可以通过任意有利于共转化多个核酸分子的方法将核酸片段引入到具有重组能力的哺乳动物细胞中。产生转基因动物的具体方法对本领域普通技术人员来说是公知的,其中包括美国专利No.5,489,743和美国专利No.5,602,307中所公开的。
L.诊断方法
与非癌变的组织相比,本发明的基因和蛋白在癌变的肝脏组织(HCC)和其它癌症中差异表达,因此本发明的基因和蛋白可以用来诊断或监控肝癌或其它恶性肿瘤,追踪疾病的发展,或者区分HCC组织和肝硬化组织样品。使用本发明的核酸分子或蛋白诊断肝癌的一种方法包括从活体受试者中得到组织,所述组织包括肝脏组织。
分子生物学工具已经成为了常见的法医学技术。例如,包含SEQ IDNO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7或SEQ ID NO:9的全长或至少一部分序列的核酸探针可以用来确定核酸分子在法医学/病理学标本中的表达。进一步,核酸检测可以通过转录图谱分析的任意方法来实施。除了核酸分析,本发明的法医学方法可以指向本发明的蛋白,尤其是含有SEQ ID NO:2,4,6,8或10的蛋白,从而确定所述基因的增量或减量调节。(Shiverick等人,(1975)Biochim BiophysActa 393:124-133)。
本发明的方法可以包括用胶原酶或其它蛋白酶处理组织,从而使所述组织易于进行细胞裂解(Semenov等人,(1987)Biull Eksp BiolMed 104:113-116)。进一步,可以从肝脏的不同区域得到活组织切片检查样品以进行分析。
探测本发明核酸或蛋白分子的检测法可以是任何可用的形式。核酸分子的典型检测法包括杂交或基于PCR的形式。检测本发明的蛋白,多肽或肽的典型检测法包括在任何可用的形式中使用抗体,可用的形式例如为原位结合检测法等(参考,Harlow&Lane, Antibodies-A Laboratory Manual,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,1988)。在优选的实施方案中,所述检测是在适当的对照存在下进行的。
以上方法也可以用于其它的诊断方案,包括检测其它组织或器官中疾病情况的方案和方法,例如在探测到本发明核酸分子的表达的组织中进行。
无需进一步的说明,相信本领域的普通技术人员通过前面的描述和接下来的示例性实施例可以制造和使用本发明的化合物并实施所公开的方法。因此接下来的工作实施例具体的指出了本发明的优选实施方案,但是不能被认为是对公开内容的任何限制。
实施例
实施例la
鉴定肝细胞癌中差异表达的LBFL302mRNA
将10个韩国患者分成两组,每组5个患者,并从其身上取得患者组织样品。一组的患者被诊断为具有慢性病毒性乙型肝炎(CH)并随后发展为肝癌(HCC)。这组患者为三男两女,年龄范围是34-63岁。第二组患者被诊断具有肝硬化(LC)。这些人随后也发展成为肝癌(HCC)。这组为四男一女,患者年龄范围是40-62岁。对于每一个患者,都从其肝脏的两个区域取得组织以产生一套活组织解剖样品。在第一患者组中(癌症/肝炎),样品取自肝脏肿瘤和含有发炎组织(肝炎引起的发炎)的周围非癌变区域。在第二组中(癌症/肝硬化),肝脏组织取自肿瘤和含有纤维化组织(肝硬化引起的纤维化区域)的周围非癌变区域。对该组织样品的每一个进行组织学分析,并将样品分为非癌变组或癌变组。
样品制备方法按照Affymetrix GeneChip Expression AnalysisManual进行,但稍加改变。首先使用Spex Certiprep 6800 Freezer Mill将冷冻组织碾碎成粉末。然后利用Trizol(Life Technologies)提取总RNA。每个样品(平均组织重300mg)产生200-500μg的总RNA。接下来,利用0ligotex mRNA Midi试剂盒(Qiagen)分离mRNA。由于mRNA稀释于终体积400μl中,因此需要进行乙醇沉淀步骤从而使其浓度达到1μg/μl。使用1-5μg的mRNA采用SuperScript Choice系统得到双链cDNA。第一链cDNA的合成用T7-(dT24)寡核苷酸引发。cDNA然后进行苯酚-氯仿提取并进行乙醇沉淀得到1μg/μl的终浓度。
按照标准的步骤从2μg的cDNA合成cRNA。为了对cRNA进行生物素标记,将核苷酸Bio-11-CTP和Bio-16-UTP(Enzo Diagnostics)加入反应体系中。在37℃孵育6小时后,按照Rneasy Mini试剂盒方案(Qiagen)清洗标记的cRNA。然后将cRNA在94℃片段化(5×片段化缓冲液:200mM Tris-乙酸盐(pH8.1),500mM KOAc,150mM MgOAc)35分钟。
将55μg片段化的cRNA与Affymetrix Human Genome U95和U133阵列进行杂交24小时,杂交箱的设定为45℃和60rpm。在Affymetrix流体平台中清洗芯片并利用Streptavidin Phycoerythrin(SAPE)(Molecular Probes)进行染色。为了增强染色,两次添加SAPE溶液,并在两次添加间进行抗-链霉亲和素生物素化抗体染色步骤。与探针阵列的杂交用荧光测定扫描法进行检测(Hewlett Packard Gene ArrayScanner)。在杂交和扫描后,对微排列图像进行分析以进行质量控制,寻找主要的芯片缺陷和杂交信号中的异常。在所有的芯片通过了QC后,对数据进行分析,其中对于U95使用Affymetrix Microarray Suite(v4.0)和LIMS(v1.5),对于U133使用Affymetrix Microarray Suite(v5.0)和LIMS(v3.0)。
采用下述的统计方法,利用Affymetrix human GeneChip装置——U95和U133,确定了癌变和非癌变肝脏样品中基因的差异表达情况。(1)对于每一个基因,利用Affymetrix Microarray Suite(v4.0)检测U95的Affymetrix GeneChip平均差异值,Affymetrix Microarray Suite(v4.0)还为每一个GeneChip元件设置“Absent”(=没有检测到),“Present”(=检测到)或“Marginal”(=不能确定存在或不存在)标记。利用Affymetrix Microarray Suite(v5.0)确定了U133的信号值,Affymetrix Microarray Suite(v5.0)也设置了Absent,Present或Marginal标记。(2)使用括号中的标准(在癌变和非癌变肝脏组织样品中同时至少有10%的Present标记,而在癌变或非癌变肝脏样品组中有至少40%的Present标记),选择一组基因进行进一步的分析。(3)在U95数据的平均差异值基础上,将该组基因分成两组,即高表达组和低表达组。高表达组含有在癌变和非癌变样品两者中平均差异值大于或等于5的基因。剩下的基因被分入低表达组中。将高表达组中的平均差异值转变成对数值,而低表达组中的数值保持不变。对于U133数据,不考虑表达水平而将所有的信号都转变成对数值。(4)使用Analysis ofViariance方法(ANOVA)进行数据分析(Steel等人, Principles and Procedures of Statistics:A Biometrical Approach,第三版,McGraw-Hill,1997)。在进行最后分析之前,利用排除方法进行外部检测。在ANOVA分析中每次排除一个样品来确定从分析中去除特定样品是否对最后结果有显著影响。如果是,则所述特定样品被从最后分析中排除。在进行了外部检测后,通过ANOVA分析产生了以小于或等于0.05的P值差异表达的一系列基因。利用相似的步骤分析得到AffymetrixGeneChip U133芯片装置的数据。(5)额外再使用两个标准来减少由U95得到的基因系列中的基因数。首先,通过对比非癌变对照组和癌症组样品的几何平均值得到一组基因,这组基因的表达水平显示出最少2倍的增加或减少。其次,倍数改变值和P-值的比率应该为400或更高。
芯片数据分析显示,与肝硬化组织样品相比,在肝癌样品中标记物LBFL 302的表达被显著增量调节了(对于U95为6.26倍,p=0.00116;对于U133为7.87倍,p=0.000944)。与发炎的肝脏组织样品(从慢性肝炎患者的发炎区域得到的活组织切片)相比,同样发现在肝癌样品中的增量调节(对于U95为2.76倍,p>0.05;对于U133为4.64倍,p=0.0115)。这些数据显示LBFL302的增量调节可以用于在肝硬化患者中诊断肝癌,也可以用于在慢性肝炎患者中诊断肝癌。
LBFL302(SEQ ID NO:1或3)的表达水平可以分别通过AffymetrixGeneChipsU95和U133芯片序列片段nos.51263_at和226936_at进行测量。与正常对照组织相比的不同恶性肿瘤中51263_at和226936_at的表达水平显示在表la中,其中还表示出了变化倍数和变化趋势(增量或减量调节)。大于1.5的变化倍数被认为是显著的。
表1a
 Affy ID 组织 疾病 形态学 变化倍数 趋势 T-统计
 51263_at 膀胱,NOS 膀胱恶性肿瘤,NOS 过渡型细胞癌,NOS  1.9 3.9
 226936_at 乳房,NOS 女性乳房恶性肿瘤,NOS 浸润性管癌  1.8 3.6
 51263_at 女性乳房恶性肿瘤,NOS 黏液性腺癌  -1.7 -3.5
 226936_at 子宫颈,NOS 子宫颈恶性肿瘤, 鳞片状细胞癌,NOS  3.5 4.1
 226936_at 结肠,NOS 结肠恶性肿瘤,NOS 腺癌,NOS  2.2 7.8
 226936_at 子宫内膜,NOS 子宫内膜恶性肿瘤,NOS 缪氏混合肿瘤  2.4 2.6
 226936_at 肾,NOS 肾脏恶性肿瘤,NOS WILMS’肿瘤  14.3 3.2
 226936_at 肝,NOS 肝脏继发性恶性肿瘤,NOS 腺癌,NOS  5.6 5.7
 226936_at 肺,NOS 肺部恶性肿瘤,NOS 鳞片状细胞癌,NOS  4.0 6.3
  226936_at   肺部恶性肿瘤,NOS   腺癌,NOS   1.7   升   2.2
  51263_at   子宫肌层,NOS   子宫肌层继发性恶性肿瘤   缪氏混合肿瘤   2.3   升   4.6
  226936_at   卵巢,NOS   卵巢恶性肿瘤,NOS   腺癌,NOS   5.7   升   2.3
  226936_at   卵巢恶性肿瘤,NOS   乳头状液体腺癌   4.8   升   3.9
  226936_at   胰腺,NOS   胰腺恶性肿瘤,NOS   腺癌,NOS   3.2   升   2.2
  226936_at   前列腺,NOS   前列腺恶性肿瘤,NOS   腺癌,NOS   -1.6   降   -5.6
  226936_at   直肠,NOS   直肠恶性肿瘤,NOS   腺癌,NOS   2.1   升   6.5
  226936_at   皮肤,NOS   皮肤恶性肿瘤,NOS   鳞片状细胞癌,NOS   2.8   升   3.1
  226936_at   皮肤恶性肿瘤,NOS   基底细胞癌,NOS   1.7   升   2.9
  51263_at   小肠,NOS   恶性淋巴瘤,非确定的,节外的,或实体器官位点的NOS   恶性淋巴瘤,NOS   3.0   升   3.1
  226936_at   软组织,NOS   结缔组织和其它软组织的继发性恶性肿瘤,NOS   鳞片状细胞癌,NOS   2.5   升   3.2
  226936_at   脾,NOS   未消退的慢性髓细胞样白血病,NOS   慢性髓细胞样白血病   6.6   升   16.1
  226936_at   胃,NOS   胃部恶性肿瘤,NOS   腺癌,NOS   2.3   升   4.6
  226936_at   胃部恶性肿瘤,NOS   印戒细胞癌   1.9   升   2.9
表2总结了通过使用不同组织类型以及Affymetrix GeneChip的试验得到的差异表达数据。对芯片进行扫描并利用GX Scan算法分析数据,该算法在下述的相关申请中进行了描述:60/331,182,60/388,745和60/390,608,题目都是“一种用于组织和发掘来自于具有复合临床原因的生物样品的基因表达数据的自动化计算机算法”,以上文件都作为参考文献被完整的引入。
表2
LBFL 302在下面的某些恶性肿瘤类型中增量调节,变化倍数为1.5或更高。
             来自U95数据的51263_at     来自U133数据的226936_at
1.膀胱       升                        ---
2.乳房
浸润性管癌   升                        升
3.子宫颈     升                        升
4.结肠       升                        升
5.肾         升                        升
6.肝         升                        升
7.肺         升                        升
8.子宫肌层   升                        ---
9.卵巢       升                        升
10.胰腺      升                        升
11.直肠      升                        升
12.皮肤      升                        升
13.小肠      升                        ---
14.软组织    升                        升
15.脾        升                        升
16.胃        升                        升
通过结合于芯片序列片段no.51263_at的样品确定的GeneChip表达结果经使用Taqman检测(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到证实。在检测中使用从特异性Affymetrix片段(51263_at)的序列信息文件设计的PCR引物。检测每个RNA样品(10ng的总RNA)中的目标基因,其中使用了外面掺入的参考基因。为了这个目的,将四环素抗性基因用作外面添加的掺入物(spike)。该方法提供了相对表达量,其通过相对于恒定量的Tet spike Ct值的目标mRNA的循环阈值(cycle threshold)(Ct)来测定。所述样品组包括于U95GeneChips上进行分析的肝硬化(LC),慢性肝炎(CH)和肝细胞癌(HCC)组织的RNA。另外,几个没有在GeneChip上进行分析的新样品用于Q-RT-PCR来证实表达。Q-RT-PCR数据证明,与LC或CH活组织切片检查样品相比,在HCC中可以观察到LBFL302的增量表达。
实施例1b
鉴定肝细胞癌中差异表达的LBFL303 mRNA
将从19名韩国患者分成两组,从中得到患者组织样品。其中一组包括的9名患者已经被诊断患有慢性病毒性乙型肝炎(CH)并随后发展成了肝癌(HCC)。这组的患者为五男四女,年龄范围为34-65。第二组的10名患者已经被诊断为肝硬化(LC)。这些人也随后发展成了肝癌(HCC)。这一组中为8男2女,患者的年龄范围为37-62。随后,利用与上述实施例1a中相同的技术方案对每一个患者进行实验。
由U95芯片得到的数据分析显示,与肝硬化组织样品相比,肝癌样品中相应于SEQ ID NO:5,7或9的标记物的表达被显著增量调节了(9.34倍,p值=1.44×10-4)。由U133芯片得到的数据显示,与肝硬化组织样品(2.60倍,p值=3.63×10-2)和发炎的肝组织样品(对于U95为5.69倍,p值=8.99×10-4)(从慢性肝炎患者的发炎区域取得的活组织切片)相比,肝癌样品中SEQ ID NO:5或7的表达也被显著增量调节了。这些数据表明,SEQ ID NOS:5,7和9的增量调节可以用来在人群中诊断肝癌,特别是在具有肝硬化或慢性肝炎的患者群中。
通过Affymetrix GeneChips上的芯片序列片段nos.46690_at(U95芯片)和219175_at和224931_at(U133芯片)测定了LBFL303克隆GE6,MB5或IE4(分别为SEQ ID NOS:5,7or9)的表达水平。通过利用Affymetrix GeneChips进行的不同组织类型的实验可以收集到差异表达的数据,并使用GX Scan算法进行分析,该算法在相关申请60/331,182,60/388,745和60/390,608中进行了描述,题目都是“用于组织和发掘来自具有复合临床原因的生物样品的基因表达数据的自动化计算机算法”,以上文件都作为参考文献被完整的引入。与正常的对比组织相比的不同恶性肿瘤中的46690_at,219175_at和224931_at的表达水平列在了表1中,这里还指出了变化倍数和变化趋势(增量或者减量调节)。大于1.5的变化倍数被认为是显著的。
表1b
  Affy ID   组织   疾病   形态学   变化倍数   趋势   T-统计
  46690_at   乳房,NOS   女性乳房恶性肿瘤,NOS   浸润型管和小叶癌   -1.7   降   -5.5
  46690_at   子宫颈,NOS   子宫颈恶性肿瘤   鳞片状细胞癌,NOS   -1.7   降   -4.5
  224931_at   肾,NOS   肾脏恶性肿瘤,NOS   WILMS’肿瘤   1.6   升   6.3
  46690_at 卵巢,NOS   卵巢恶性肿瘤   黏液性囊腺癌,NOS   -1.5   降   -2.9
  219175_s_at   卵巢恶性肿瘤   缪氏混合肿瘤   -1.6   降   -11.3
  219175_s_at   胰腺,NOS   朗格汉斯胰岛恶性肿瘤   胰岛细胞癌   -2.2   降   -9.2
  46690_at 软组织,NOS   结缔组织和其它软组织的恶性肿瘤,NOS   纤维样组织细胞瘤,恶性   -1.6   降   -3.2
  46690_at   结缔组织和其它软组织的恶性肿瘤,NOS   脂肪肉瘤,NOS   -1.6   降   -2.6
  219175_s_at   结缔组织和其它软组织的恶性肿瘤,NOS   脂肪肉瘤,NOS   -1.6   降   -2.5
  46690_at   睾丸,NOS   睾丸恶性肿瘤,NOS   混合生殖细胞瘤   -2.2   降   -2.8
  46690_at   睾丸恶性肿瘤,NOS   精原细胞瘤   -2.5   降   -2.3
  224931_at   睾丸恶性肿瘤,NOS   混合生殖细胞瘤   -1.7   降   -2.3
  224931_at   甲状腺,NOS   恶性淋巴瘤,未确定的,节外的,或实体器官的NOS   恶性淋巴瘤,NOS   -1.7   降   -4.4
如上面实施例1a中所述的,由结合于芯片序列片段no.46690-at的样品确定的GeneChip表达结果通过使用Taqman检测(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到证实。
Q-RT-PCR数据证明,与LC或CH的活组织切片样品相比,在HCC中发现相应于LBFL303克隆GE6,MB5和IE4的基因被增量调节了。
实施例2
相应于差异表达的mRNA种类的全长人类cDNA的克隆
具有SEQ ID NOS:1,3,5,7或9的全长cDNA是通过寡核苷酸钓取方法(oligo-pulling method)得到的。简要地说,在SEQ ID NOS:1,3,5,7或9的序列基础上设计基因特异性的寡核苷酸。按照Sambrook等人的步骤,所述寡核苷酸使用生物素进行标记,并用于和2μg单链质粒DNA(cDNA重组体)进行杂交,所述质粒DNA来自完全分化的胃腺癌文库(NCI CGAP Gas 4)。所述杂交的cDNA利用链霉亲合素缀合的珠子进行分离并通过加热进行洗脱。洗脱后的cDNA转变成双链质粒DNA,并用来转化大肠杆菌细胞(DHl0B),筛选出最长的cDNA。在利用基因特异的引物以PCR方法证实了阳性选择后,将cDNA克隆进行DNA序列分析。
相应于差异调控的mRNA的上述检测的全长人类cDNA的核酸序列如SEQ ID NOS:1,3,5,7和9所列。SEQ ID NO:1的cDNA包括578个碱基对(531个碱基对和polyA尾巴),而SEQ ID NO:3的cDNA包括531个碱基对(515个碱基对和polyA尾巴)。SEQ ID NO:5的cDNA包括2067个碱基对(2040个碱基对和polyA尾巴),SEQ ID NO:7的cDNA包括2178个碱基对(2162个碱基对和polyA尾巴),而SEQ ID NO:9的cDNA包括1616个碱基对(1598个碱基对和polyA尾巴)。
SEQ ID NO:1的cDNA核苷酸序列中的开放读码框位于155-418位核苷酸处(155-421位核苷酸中包括终止密码子),该开放读码框编码一个88个氨基酸的蛋白。相应于由SEQ ID NOS:1编码的预测蛋白的氨基酸序列如SEQ ID NO:2所列。
SEQ ID NO:3的cDNA核苷酸序列中的开放读码框位于139-402位核苷酸处(139-405位核苷酸中包括终止密码子),该开放读码框也编码一个88个氨基酸的蛋白。相应于由SEQ ID NOS:3编码的预测蛋白的氨基酸序列如SEQ ID NO:4所列。尽管编码这些蛋白的核酸序列在编码区域上游不同,但是SEQ ID NO:4的蛋白序列和SEQ ID NO:2是一样的,除了第28位的氨基酸(SEQ ID NO:2中为精氨酸,SEQ ID NO:4中为亮氨酸,这是由于SEQ ID NO:1中第237位和SEQ ID NO:3中第221位的G->T的点突变造成的)。
SEQ ID NOS:2和4与类组蛋白转录因子(CBF/NF-Y)和原始组蛋白基序(signature)有微弱的相似。另外,这些氨基酸序列还与细菌调控蛋白lysR家族螺旋-转角-螺旋基序有微弱的相似。所述基序含有三个结构域。SEQ ID NO:2和SEQ ID NO:4的氨基酸序列与C末端的两个结构域有22%的相同。
SEQ ID NO:5(GE6)的cDNA核苷酸序列中的开放读码框位于32-1384位核苷酸处(32-1387位核苷酸中包括终止密码子),该开放读码框编码一个451个氨基酸的蛋白。相应于由SEQ ID NO:5编码的蛋白的氨基酸序列如SEQ ID NO:6所列。
SEQ ID NO:7(MB5)的cDNA核苷酸序列中的开放读码框位于41-1504位核苷酸处(41-1504位核苷酸中包括终止密码子),该开放读码框编码一个487个氨基酸的蛋白。相应于由SEQ ID NO:7编码的蛋白的氨基酸序列如SEQ ID NO:8所列。除了在靠近氨基末端插入了36个氨基酸外,SEQ ID NO:8的蛋白序列和SEQ ID NO:6是一样的(参照下面的多序列比对)。
SEQ ID NO:9(IE4)的cDNA核苷酸序列中的开放读码框位于31-1551位核苷酸处(31-1554位核苷酸中包括终止密码子),该开放读码框编码一个507个氨基酸的蛋白。相应于由SEQ ID NO:9编码的蛋白的氨基酸序列如SEQ ID NO:10所列。相应于SEQ ID NO:10的蛋白与SEQ ID NO:8在前456个氨基酸是完全相同的,尽管蛋白的剩余部分没有同源性(参照下面的多序列比对)。
GE6,MB5和IE4的多氨基酸序列比对
            1                                                   50LBFL303_GE6.pep MDGTETRQRR LDSCGKPGEL GLPHPLSTGG LPVASEDGAL RAPESQSVTPLBFL303_MB5.pep MDGTETRQRR LDSCGKPGEL GLPHPLSTGG LPVASEDGAL RAPESQSVTPLBFL303_IE4.pep MDGTETRQRR LDSCGKPGEL GLPHPLSTGG LPVASEDGAL RAPESQSVTP
   一致序列 MDGTETRQRR LDSCGKPGEL GLPHPLSTGG LPVASEDGAL RAPESQSVTP
            51                                                 100LBFL303_GE6.pep KPLETEPSRE TAWSIGLQVT VPFMFAGLGL SWAGMLLDYF Q.........LBFL303_MB5.pep KPLETEPSRE TAWSIGLQVT VPFMFAGLGL SWAGMLLDYF QHWPVFVEVKLBFL303_IE4.pep KPLETEPSRE TAWSIGLQVT VPFMFAGLGL SWAGMLLDYF QHWPVFVEVK
   二致序列 KPLETEPSRE TAWSIGLQVT VPFMFAGLGL SWAGMLLDYF QHWPVFVEVK
            101                                                150LBFL303_GE6.pep .......... .......... .......ANT GQIDDPQEQH RVISSNLALILBFL303_MB5.pep DLLTLVPPLV GLKGNLEMTL ASRLSTAANT GQIDDPQEQH RVISSNLALILBFL303_IE4.pep DLLTLVPPLV GLKGNLEMTL ASRLSTAANT GQIDDPQEQH RVISSNLALI
   一致序列 DLLTLVPPLV GLKGNLEMTL ASRLSTAANT GQIDDPQEQH RVISSNLALI
            151                                                200LBFL303_GE6.pep QVQATVVGLL AAVAALLLGV VSREEVDVAK VELLCASSVL TAFLAAFALGLBFL303_MB5.pep QVQATVVGLL AAVAALLLGV VSREEVDVAK VELLCASSVL TAFLAAFALGLBFL303_IE4.pep QVQATVVGLL AAVAALLLGV VSREEVDVAK VELLCASSVL TAFLAAFALG
   二致序列 QVQATVVGLL AAVAALLLGV VSREEVDVAK VELLCASSVL TAFLAAFALG
            201                                                250LBFL303_GE6.pep VLMVCIVIGA RKLGVNPDMI ATPIAASLGD LITLSILALV SSFFYRHKDSLBFL303_MB5.pep VLMVCIVIGA RKLGVNPDNI ATPIAASLGD LITLSILALV SSFFYRHKDSLBFL303_IE4.pep VLMVCIVIGA RKLGVNPDNI ATPIAASLGD LITLSILALV SSFFYRHKDS
   一致序列 VLMVCIVIGA RKLGVNPDNI ATPIAASLGD LITLSILALV SSFFYRHKDS
            251                                                300LBFL303_GE6.pep RYLTPLVCLS FAALTPVWVL IAKQSPPIVK ILKFGWFPII LAMVISSFGGLBFL303_MB5.pep RYLTPLVCLS FAALTPVWVL IAKQSPPIVK ILKFGWFPII LAMVISSFGGLBFL303_IE4.pep RYLTPLVCLS FAALTPVWVL IAKQSPPIVK ILKFGWFPII LAMVISSFGG
   一致序列 RYLTPLVCLS FAALTPVWVL IAKQSpPIVK ILKFGWFPII LAMVISSFGG
            301                                                350LBFL303_GE6.pep LILSKTVSKQ QYKGMAIFTP VICGVGGNLV AIQTSRISTY LHMWSAPGVLLBFL303_MBS.pep LILSKTVSKQ QYKGMAIFTP VICGVGGNLV AIQTSRISTY LHMWSAPGVLLBFL303_IE4.pep LILSKTVSKQ QYKGMAIFTP VICGVGGNLV AIQTSRISTY LHMWSAPGVL
   一致序列 LILSKTVSKQ QYKGMAIFTP VICGVGGNLV AIQTSRISTY LHMWSAPGVL
            351                                                400LBFL303_GE6.pep PLQMKKFWPN PCSTFCTSEI NSMSARVLLL LVVPGHLIFF YIIYLVEGQSLBFL303_MBS.pep PLQMKKFWPN PCSTFCTSEI NSMSARVLLL LVVPGHLIFF YIIYLVEGQSLBFL303_IE4.pep PLQMKKFWPN PCSTFCTSEI NSMSARVLLL LVVPGHLIFF YIIYLVEGQS
   一致序列 PLQMKKFWPN PCSTFCTSEI NSMSARVLLL LVVPGHLIFF YIIYLVEGQS
            401                                                450LBFL303_GE6.pep VINSQTFVVL YLLAGLIQVT ILLYLAEVMV RLTWHQALDP DNHCIPYLTGLBFL303_MB5.pep VINSQTFVVL YLLAGLIQVT ILLYLAEVMV RLTWHQALDP DNHCIPYLTGLBFL303_IE4.pep VINSQTFVVL YLLAGLIQVT ILLYIAEVMV RLTWHQALDP DNHCIPYLTG
   二致序列 VINSQTFVVL YLLAGLIQVT ILLYLAEVMV RLTWHQALDP DNHCIPYLTG
            451                                                500LBFL303_GE6.pep LGDLLGTGLL ALCFFTDWLL KSKAELGGIS ELASGPP*-- ----------LBFL303_MB5.pep LGDLLGTGLL ALCFFTDWLL KSKAELGGIS ELASGPP*-- ----------LBFL303_IE4.pep LGDLLGSSSV GHTAAVPRRC TASPGWGLIQ PFICTQHLIV SLLSFYFPFC
   一致序列 IGDLLGTGLL ALCFFTDWLL KSKAELGGIS ELASGPP--- ----------
            501LBFL303_GE6.pep --------LBFL303_MB5.pep --------LBFL303_IE4.pep LLAKTSI*
   一致序列 --------
LBFL 303克隆还表现出与小鼠同系物(GenBank目录号No.XM_132686)的部分同源性。SEQ ID NO:5在全部连续序列中表现出44%的同一性,在开放读码框中表现出68%的同一性,而SEQ ID NO:7在全部连续序列中表现出46%的同一性,在开放读码框中表现出69%的同一性。SEQ ID NO:9与小鼠的核酸序列在全部连续序列上表现出61%的同一性,在开放读码框中表现出64%的同一性。
SEQ ID NOS:6,8和10包含二价阳离子转运基序,所述基序具有两个结构域。SEQ ID NOS:6和8同时包含两个域(在SEQ ID NO:6的85-205和282-428位氨基酸处,在SEQ ID NO:8的105-241和318-464位氨基酸处),尽管SEQ ID NO:10只包含N末端的结构域(氨基酸残基105-241)。另外,SEQ ID NOS:6,8和10中包含过氧化物酶活性位点,即在SEQ ID NOS:6的390-401氨基酸位置以及在SEQ ID NOS:8和10的426-437氨基酸位置。
图1,2,3,4和5显示了SEQ ID NOS:2,4,6,8和10的氨基酸序列的疏水分析结果。如上面所描述的,亲水区域可以用来产生抗原性肽。
进行Northern印迹分析以确定与SEQ ID NOS:1,3,5,7和9相对应的mRNA转录本的大小。使用了含有来自多种人类组织的总RNA的Northern印迹物(ClonTech),将克隆BC7(SEQ ID NO:3),克隆GE6(SEQ ID NO:5),克隆MB5(SEQ ID NO:7),克隆IE4(SEQ IDNO:9)中的每一个用随机引物方法进行放射性标记,并用来探测所述印迹物。所述印迹物在65℃于Church和Gilbert缓冲液中进行杂交,并在室温下用含有0.1%SDS的0.1XSSC进行洗涤。Northern印迹物对于每个LBFL302和303基因显示出单个转录本,其大小接近于0.65kb和2.45kb。这分别对应于在克隆BC7和BC4(SEQ ID NOS:3 and 1)中插入物的大小,分别为0.531kb和0.578kb,以及GE6中的2.2kb,MB5中的2.3kb,IE4中的1.8kb,SEQ ID NOS:5,7和9。
为了检查SEQ ID NO:1,3,5,7或9在不同正常组织中的表达,如下制备了电子Northern印迹物(e-Northern)。采用实施例1中的芯片和程序,将得自表3中列出的一组46个正常组织的mRNA与Affymetrix U95 human GeneChip进行杂交。这些试验的结果列于表3中。对于每一个组织类型,都标记出了所谓的存在和不存在的样品的数目,以及在这个样品组中总的样品数。另外,还列出了每一个组织类型的中间值和25%和75%点时的数值。有趣的是,尽管所述基因在肝癌中是增量调节的,在大多数正常的肝脏样品中没有检测到LBFL302和303的表达。如下面所讨论的,所述观察到的结果表明,可以将LBFL302和303用作一种诊断剂或标记物来检测肝癌或将肝细胞癌与肝硬化组织进行区分。LBFL302在胸腺中表现出的表达水平似乎是最高的,其次是生殖系统的器官(睾丸,子宫内膜,子宫肌层,子宫,子宫颈和乳房)和消化系统的器官(食道,直肠,结肠和阑尾)。LBFL303在脑部(小脑,额叶皮质,颞叶皮质和海马体)和生殖系统的器官(睾丸,子宫内膜,子宫肌层,子宫,子宫颈和乳房)中表现出的表达水平似乎是最高的,但是在大多数其它组织中检测到的表达水平是比较低的。肝脏的表达是最低的。
表3a 51263_at的e-Northern表:正常组织中LBFL302基因的表达
全球存在频率 组织     存在     不存在     下面25%     中值     上面75%
0.7176
动物脂肪     26/32     6/32     32.78     40.25     56.11
肾上     55/12     7/12     10.18     28.24     42.42
阑尾     3/3     0/3     65.56     75.82     78.15
动脉     3/3     0/3     39.18     43.53     48.12
膀胱     5/5     0/5     49.95     81.92     89.71
骨骼     3/3     0/3     73.57     112.71     113.59
乳房     76/80     4/80     56.53     79.61     107.84
小脑     1/5     4/5     10.58     16.98     17.79
子宫颈     96/101     5/101     75.45     102.71     139.70
结肠     147/151     4/151     72.44     107.19     149.44
皮层前叶     2/7     5/7     11.01     17.48     21.95
皮层颞叶     0/3     3/3     -1.09     10.90     11.83
十二指肠     58/61     3/61     57.59     72.35     94.63
子宫内膜     21/21     0/21     123.36     151.44     185.97
食道     26/27     1/27     98.53     127.38     167.07
输卵管     46/51     5/51     37.81     52.34     94.69
胆囊     2/8     6/8     13.23     32.72     39.09
心脏     1/3     2/3     8.24     13.13     15.87
海马体     2/5     3/5     17.28     19.47     31.10
肾脏     24/86     62/86     8.63     14.36     20.22
喉咙     4/4     0/4     40.57     97.82     163.75
左心房     30/141     111/141     11.25     14.57     19.93
左心室     0/15     15/15     4.77     8.67     12.80
肝脏     10/34     24/34     2.08     10.42     19.94
    62/93     31/93     23.04     35.46     55.34
淋巴结     10/11     1/11     58.47     85.56     98.77
肌肉     9/39     30/39     9.03     16.64     27.86
子宫肌层     105/106     1/106     123.43     180.91     216.99
网膜     14/15     1/15     46.67     67.85     151.98
卵巢     49/74     25/74     24.22     34.54     55.81
胰腺     2/34     32/34     -2.88     6.00     14.34
胎盘     3/5     2/5     28.65     40.79     53.18
前列腺     30/32     2/32     44.39     59.04     73.73
直肠     42/4 3     1/43     97.69     133.62     173.02
右心房     34/169     135/169     9.78     14.77     19.39
右心室     21/160     139/160     4.93     10.56     18.22
皮肤     50/59     9/59     44.51     64.27     93.29
小肠     60/68     8/68     41.12     70.61     103.24
软组织     4/6     2/6     26.64     61.11     115.92
脾脏     22/31     9/31     26.94     39.23     52.19
    34/47     13/47     22.49     41.88     80.51
睾丸     5/5     0/5     137.44     236.97     359.92
胸腺     71/71     0/71     261.31     322.22     358.16
甲状腺     6/18     12/18     10.27     15.12     31.99
子宫     58/58     0/58     88.62     140.06     190.83
WBC     12/40     28/40     10.23     15.37     24.59
表3b 46690_at的e-Northern表:正常组织中LBFL303基因的表达
全球存在频率 组织     存在     不存在     下面25%     中值     上面75%
0.6295
动物脂肪     21/32     11/32     176.42     227.48     291.00
肾上腺     10/12     2/12     195.93     286.51     364.93
阑尾     2/3     1/3     59.10     61.20     71.28
动脉     3/3     0/3     257.57     268.59     334.19
膀胱     4/5     1/5     222.21     236.51     310.37
骨骼     2/3     1/3     241.64     263.23     269.74
乳房     74/80     6/80     208.22     279.85     332.28
小脑     5/5     0/5     333.02     348.16     421.84
子宫颈     88/101     13/101     212.62     292.96     344.12
结肠     70/151     81/151     63.11     98.21     142.28
皮层前叶     7/7     0/7     293.14     313.78     323.67
皮层颞叶     3/3     0/3     255.54     260.80     339.41
十二指肠     31/61     30/61     86.34     113.58     143.09
子宫内膜     18/21     3/21     243.49     259.81     299.21
食道     17/27     10/27     120.68     166.05     207.75
输卵管     45/51     6/51     236.80     296.76     358.36
胆囊     8/8     0/8     250.23     277.49     328.73
心脏     2/3     1/3     128.08     129.40     139.86
海马体     5/5     0/5     216.82     302.36     337.49
肾脏     53/86     33/86     155.75     202.37     235.42
喉咙     3/4     1/4     189.07     222.38     268.94
左心房     75/141     66/141     130.83     173.47     220.14
左心室     8/15     7/15     117.45     175.84     208.91
肝脏     5/34     29/34     8.65     33.49     55.39
    52/93     41/93     115.09     167.11     232.69
淋巴结     8/11     3/11     119.03     167.95     223.28
肌肉     32/39     7/39     147.91     200.14     226.77
子宫肌层     98/106     8/106     248.04     328.05     407.02
网膜     8/15     7/15     88.63     179.55     196.14
卵巢     71/74     3/74     306.34     384.95     435.31
胰腺     10/34     24/34     78.67     128.72     162.20
胎盘     1/5     4/5     79.06     108.81     112.22
前列腺     23/32     9/32     181.76     193.51     230.41
直肠     28/43     15/43     113.19     126.40     167.84
右心房     82/169     87/169     134.58     166.54     208.73
右心室     100/160     60/160     122.83     165.44     216.16
皮肤     49/59     10/59     185.75     236.37     297.31
小肠     33/68     35/68     69.62     109.95     142.30
软组织     5/6     1/6     186.44     214.50     260.89
脾脏     22/31     9/31     149.56     184.29     215.47
    20/47     27/47     77.44     114.84     158.63
睾丸     5/5     0/5     396.28     429.08     448.94
胸腺     70/71     1/71     296.44     348.71     400.48
甲状腺     13/18     5/18     228.07     310.09     350.55
子宫     53/58     5/58     249.90     318.35     361.58
 WBC     15/40     25/40     68.93     94.14     122.44
工业应用性
实施例3
检测LBFL302和303mRNA以筛选肝癌。
如实施例1中所描述的,在肝组织的活检样品中确定对应于SEQ IDNO:1,3,5,7或9的mRNA表达水平,即,在GeneChip上筛选mRNA样品,或者按照实施例2中所描述的,即利用Northern印迹筛选mRNA样品。可以选择的,也可以采用恶性状态或非恶性状态的非肝增生组织的样品进行分析。来自肝癌患者或正常个体的肝组织样品可以用作阳性和阴性对照。使用分析基因表达的任意方法,高于普通对照的表达水平表示有肝癌或有发展成肝癌的可能性。
尽管本发明已经通过上面的实施例进行了详细地描述,但是应理解可以进行各种改变而不偏离本发明的精神。因此,本发明仅由下面的权利要求所限制。本发明中引用的所有专利,专利申请和出版物都以其整体引入作为参考。
                        序列表
<110>LG Life Sciences Ltd.
<120>肝癌相关的基因家族
<150>US 60/402,905
<151>2002-08-14
<150>US 60/403,651
<151>2002-08-16
<160>10
<170>KopatentIn 1.71
<210>1
<211>578
<212>DNA
<213>智人
<220>
<221>CDS
<222>(155)..(418)
<223>基因LBFL302,克隆BC4
<400>1
cggacgcgtg ggttcgaacg ttcggactga ggtttttctg cctgaagaag cgtcatacgg  60
accggattgt tttcgctggc ccagtgtccc cggagcttgt gtgcgataca gagagcacct  120
cggaagctga ggcagctggt acttgacaga gagg       atg gcg ctg tcg acc    169
                                            Met Ala Leu Set Thr
                                              1               5
ata gtc tcc cag agg aag cag ata aag cgg aag gct ccc cgt ggc ttt    217
Ile Val Ser Gln Arg Lys Gln Ile Lys Arg Lys Ala Pro Arg Gly Phe
                 10                  15                  20
cta aag cga gtc ttc aag cga aag aag cct caa ctt cgt ctg gag aaa    265
Leu Lys Arg Val Phe Lys Arg Lys Lys Pro Gln Leu Arg Leu Glu Lys
             25                  30                  35
agt ggt gac tta ttg gtc cat ctg aac tgt tta ctg ttt gtt cat cga    313
Ser Gly Asp Leu Leu Val His Leu Asn Cys Leu Leu Phe Val His Arg
         40                  45                  50
tta gca gaa gag tcc agg aca aac gct tgt gcg agt aaa tgt aga gtc    361
Leu Ala Glu Glu Ser Arg Thr Asn Ala Cys Ala Ser Lys Cys Arg Val
     55                  60                  65
att aac aag gag cat gta ctg gcc gca gca aag gta att cta aag aag      409
Ile Asn Lys Glu His Val Leu Ala Ala Ala Lys Val Ile Leu Lys Lys
 70                  75                  80                  85
agc aga ggt        ta gaagtcaaag aacatattct tgaaagttat gatgcattct    460
Ser Arg Gly
tttgggtggt aacagatcat aaagacattt tttacacatc agttaatatg ggattattaa    520
atattggcta taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa      578
<210>2
<211>88
<212>PRT
<213>智人
<400>2
Met Ala Leu Ser Thr Ile Val Ser Gln Arg Lys Gln Ile Lys Arg Lys
  1               5                  10                  15
Ala Pro Arg Gly Phe Leu Lys Arg Val Phe Lys Arg Lys Lys Pro Gln
             20                  25                  30
Leu Arg Leu Glu Lys Ser Gly Asp Leu Leu Val His Leu Asn Cys Leu
         35                  40                  45
Leu Phe Val His Arg Leu Ala Glu Glu Ser Arg Thr Asn Ala Cys Ala
     50                  55                  60
Ser Lys Cys Arg Val Ile Asn Lys Glu His Val Leu Ala Ala Ala Lys
65                   70                  75                  80
Val Ile Leu Lys Lys Ser Arg Gly
                 85
<210>3
<211>531
<212>DNA
<213>智人
<220>
<221>CDS
<222>(139)..(402)
<223>基因LBFL302,克隆BC7
<400>3
cccacgcgtc cggaggtttt tctgcctgaa gaagcgtcat acggaccgga ttgttttcgc   60
tggcccagtg tccccggagc ttgtgtgcga tacagagagc acctcggaag ctgaggcagc  120
tggtacttga cagagagg   atg gcg ctg tcg acc ata gtc tcc cag agg aag  171
                      Met Ala Leu Ser Thr Ile Val Ser Gln Arg Lys
                        1               5                  10
cag ata aag cgg aag gct ccc cgt ggc ttt cta aag cga gtc ttc aag    219
Gln Ile Lys Arg Lys Ala Pro Arg Gly Phe Leu Lys Arg Val Phe Lys
             15                  20                  25
cta aag aag cct caa ctt cgt ctg gag aaa agt ggt gac tta ttg gtc    267
Leu Lys Lys Pro Gln Leu Arg Leu Glu Lys Ser Gly Asp Leu Leu Val
         30                  35                  40
cat ctg aac tgt tta ctg ttt gtt cat cga tta gca gaa gag tcc agg    315
His Leu Asn Cys Leu Leu Phe Val His Arg Leu Ala Glu Glu Ser Arg
     45                  50                  55
aca aac gct tgt gcg agt aaa tgt aga gtc att aac aag gag cat gta    363
Thr Asn Ala Cys Ala Ser Lys Cys Arg Val Ile Asn Lys Glu His Val
 60                  65                  70                  75
ctg gcc gca gca aag gta att cta aag aag agc aga ggt tagaagtc       410
Leu Ala Ala Ala Lys Val Ile Leu Lys Lys Ser Arg Gly
                 80                  85
aaagaacata ttcttgaaag ttatgatgca ttcttttggg tggtaacaga tcataaagac  470
attttttaca catcagttaa tatgggatta ttaaatattg gatataaaaa aaaaaaaaaa  530
a                                                                  531
<210>4
<211>88
<212>PRT
<213>智人
<400>4
Met Ala Leu Ser Thr Ile Val Ser Gln Arg Lys Gln Ile Lys Arg Lys
  1               5                  10                  15
Ala Pro Arg Gly Phe Leu Lys Arg Val Phe Lys Leu Lys Lys Pro Gln
             20                  25                  30
Leu Arg Leu Glu Lys Ser Gly Asp Leu Leu Val His Leu Asn Cys Leu
         35                  40                  45
Leu Phe Val His Arg Leu Ala Glu Glu Ser Arg Thr Asn Ala Cys Ala
     50                  55                  60
Ser Lys Cys Arg Val Ile Asn Lys Glu His Val Leu Ala Ala Ala Lys
65                   70                  75                  80
Val Ile Leu Lys Lys Ser Arg Gly
                 85
<210>5
<211>2067
<212>DNA
<213>智人
<220>
<221>CDS
<222>(32)..(1384)
<223>克隆GE6
<400>5
cccgggctgc caggcgccca gctgtgccca g          atg gat ggg aca gag    46
                                            Met Asp Gly Thr Glu
                                              1               5
acc cgg cag cgg agg ctg gac agc tgt ggc aag cca ggg gag ctg ggg    94
Thr Arg Gln Arg Arg Leu Asp Ser Cys Gly Lys Pro Gly Glu Leu Gly
                 10                  15                  20
ctt cct cac ccc ctc agc aca gga gga ctc cct gta gcc tca gaa gat    142
Leu Pro His Pro Leu Ser Thr Gly Gly Leu Pro Val Ala Ser Glu Asp
             25                  30                  35
gga gct ctc agg gcc cct gag agc caa agc gtg acc ccc aag cca ctg    190
Gly Ala Leu Arg Ala Pro Glu Ser Gln Ser Val Thr Pro Lys Pro Leu
         40                  45                  50
gag act gag cct agc agg gag acc gcc tgg tcc ata ggc ctt cag gtg    238
Glu Thr Glu Pro Ser Arg Glu Thr Ala Trp Ser Ile Gly Leu Gln Val
     55                  60                  65
acc gtg ccc ttc atg ttt gca ggc ctg gga ctg tcc tgg gcc ggc atg    286
Thr Val Pro Phe Met Phe Ala Gly Leu Gly Leu Ser Trp Ala Gly Met
70                   75                  80                  85
ctt ctg gac tat ttc cag gcc aac act gga caa att gat gac ccc cag    334
Leu Leu Asp Tyr Phe Gln Ala Asn Thr Gly Gln Ile Asp Asp Pro Gln
                 90                  95                 100
gag cag cac aga gtc atc agc agc aac ctg gcc ctc atc cag gtg cag    382
Glu Gln His Arg Val Ile Ser Ser Asn Leu Ala Leu Ile Gln Val Gln
            105                 110                 115
gcc act gtc gtg ggg ctc ttg gct gct gtg gct gcg ctg ctg ttg ggc    430
Ala Thr Val Val Gly Leu Leu Ala Ala Val Ala Ala Leu Leu Leu Gly
        120                 125                 130
gtg gtg tct cga gag gaa gtg gat gtc gcc aag gtg gag ttg ctg tgt    478
Val Val Ser Arg Glu Glu Val Asp Val Ala Lys Val Glu Leu Leu Cys
    135                 140                 145
gcc agc agt gtc ctc act gcc ttc ctt gca gcc ttt gcc ctg ggg gtg    526
Ala Ser Ser Val Leu Thr Ala Phe Leu Ala Ala Phe Ala Leu Gly Val
150                 155                 160                 165
ctg atg gtc tgt ata gtg att ggt gct cga aag ctc ggg gtc aac cca    574
Leu Met Val Cys Ile Val Ile Gly Ala Arg Lys Leu Gly Val Asn Pro
                170                 175                 180
gac aac att gcc acg ccc att gca gcc agc ctg gga gac ctc atc aca    622
Asp Asn Ile Ala Thr Pro Ile Ala Ala Ser Leu Gly Asp Leu Ile Thr
            185                 190                 195
ctg tcc att ctg gct ttg gtt agc agc ttc ttc tac aga cac aaa gat    670
Leu Ser Ile Leu Ala Leu Val Ser Ser Phe Phe Tyr Arg His Lys Asp
        200                 205                 210
agt cgg tat ctg acg ccg ctg gtc tgc ctc agc ttt gcg gct ctg acc    718
Ser Arg Tyr Leu Thr Pro Leu Val Cys Leu Ser Phe Ala Ala Leu Thr
    215                 220                 225
cca gtg tgg gtc ctc att gcc aag cag agc cca ccc atc gtg aag atc    766
Pro Val Trp Val Leu Ile Ala Lys Gln Ser Pro Pro Ile Val Lys Ile
230                 235                 240                 245
ctg aag ttt ggc tgg ttc cca atc atc ctg gcc atg gtc atc agc agt    814
Leu Lys Phe Gly Trp Phe Pro Ile Ile Leu Ala Met Val Ile Ser Ser
                250                 255                 260
ttc gga gga ctc atc ttg agc aaa acc gtt tct aaa cag cag tac aaa    862
Phe Gly Gly Leu Ile Leu Ser Lys Thr Val Ser Lys Gln Gln Tyr Lys
            265                 270                 275
ggc atg gcg ata ttt acc ccc gtc ata tgt ggt gtt ggt ggc aat ctg    910
Gly Met Ala Ile Phe Thr Pro Val Ile Cys Gly Val Gly Gly Asn Leu
        280                 285                 290
gtg gcc att cag acc agc cga atc tca acc tac ctg cac atg tgg agt    958
Val Ala Ile Gln Thr Ser Arg Ile Ser Thr Tyr Leu His Met Trp Ser
    295                 300                 305
gca cct ggc gtc ctg ccc ctc cag atg aag aaa ttc tgg ccc aac ccg      1006
Ala Pro Gly Val Leu Pro Leu Gln Met Lys Lys Phe Trp Pro Asn Pro
310                 315                 320                 325
tgt tct act ttc tgc acg tca gaa atc aat tcc atg tca gct cga gtc      1054
Cys Ser Thr Phe Cys Thr Ser Glu Ile Asn Ser Met Ser Ala Arg Val
                330                 335                 340
ctg ctc ttg ctg gtg gtc cca ggc cat ctg att ttc ttc tac atc atc      1102
Leu Leu Leu Leu Val Val Pro Gly His Leu Ile Phe Phe Tyr Ile Ile
            345                 350                 355
tac ctg gtg gag ggt cag tca gtc ata aac agc cag acc ttt gtg gtg      1150
Tyr Leu Val Glu Gly Gln Ser Val Ile Asn Ser Gln Thr Phe Val Val
        360                 365                 370
ctc tac ctg ctg gca ggc ctg atc cag gtg aca atc ctg ctg tac ctg      1198
Leu Tyr Leu Leu Ala Gly Leu Ile Gln Val Thr Ile Leu Leu Tyr Leu
    375                 380                 385
gca gaa gtg atg gtt cgg ctg act tgg cac cag gcc ctg gat cct gac      1246
Ala Glu Val Met Val Arg Leu Thr Trp His Gln Ala Leu Asp Pro Asp
390                 395                 400                 405
aac cac tgc atc ccc tac ctt aca ggg ctg ggg gac ctg ctc ggt act      1294
Asn His Cys Ile Pro Tyr Leu Thr Gly Leu Gly Asp Leu Leu Gly Thr
                410                 415                 420
ggc ctc ctg gca ctc tgc ttt ttc act gac tgg cta ctg aag agc aag      1342
Gly Leu Leu Ala Leu Cys Phe Phe Thr Asp Trp Leu Leu Lys Ser Lys
            425                 430                 435
gca gag ctg ggt ggc atc tca gaa ctg gca tct gga cct ccc  taactg      1390
Ala Glu Leu Gly Gly Ile Ser Glu Leu Ala Ser Gly Pro Pro
        440                 445                 450
ggccccgctg gtcccatttg ctcattagaa tttcctctca catcagtggg atacagaatt    1450
cagtttctcc cttgccaggt ccttgggatg gttgacccct gcctctgcag tagccttttg    1510
tgagtctgct aaggtagctc tcacacacct cggctctggg gttgatacct gagcctgcaa    1570
tagagccctg aaatcaagag catggcttga gtgtgtgaat atgatgtgtg cacatgctta    1630
atgagcgtgc aagtgtgcac acgtttgtgg agaggagggt gttctggcct gagaaggtaa    1690
agaagaggca tgtccagtat gctttgcagg gtgtgtttgc tcttttccat gcccatgcaa    1750
cccagattgg ggtggagcag gaaggagctc ttttctgttc ccaagcctca gaactcttga    1810
gctgtggctt acttgctgtc ttcaccaggt tcaagctccg tgggccacac tgctgctgtg    1870
ccaagaaggt gtacagcctc cccaggatgg ggcctcatac aacccttcat ctgcactcaa    1930
catttaatcg tgtccttgct gtctttttat tttccttttt gtttgttagc aaaaacctct    1990
atttagattt caataatcag agaagtgtaa aataaaacag attatattgt aaaaaaaaaa    2050
aaaaaaaaaa aaaaaaa                                                   2067
<210>6
<211>45l
<212>PRT
<213>智人
<400>6
Met Asp Gly Thr Glu Thr Arg Gln Arg Arg Leu Asp Ser Cys Gly Lys
  1               5                  10                  15
Pro Gly Glu Leu Gly Leu Pro His Pro Leu Ser Thr Gly Gly Leu Pro
             20                  25                  30
Val Ala Ser Glu Asp Gly Ala Leu Arg Ala Pro Glu Ser Gln Ser Val
         35                  40                  45
Thr Pro Lys Pro Leu Glu Thr Glu Pro Ser Arg Glu Thr Ala Trp Ser
     50                  55                  60
Ile Gly Leu Gln Val Thr Val Pro Phe Met Phe Ala Gly Leu Gly Leu
65                   70                  75                  80
Ser Trp Ala Gly Met Leu Leu Asp Tyr Phe Gln Ala Asn Thr Gly Gln
                 85                  90                  95
Ile Asp Asp Pro Gln Glu Gln His Arg Val Ile Ser Ser Asn Leu Ala
            100                 105                 110
Leu Ile Gln Val Gln Ala Thr Val Val Gly Leu Leu Ala Ala Val Ala
        115                 120                 125
Ala Leu Leu Leu Gly Val Val Ser Arg Glu Glu Val Asp Val Ala Lys
    130                 135                 140
Val Glu Leu Leu Cys Ala Ser Ser Val Leu Thr Ala Phe Leu Ala Ala
145                 150                 155                 160
Phe Ala Leu Gly Val Leu Met Val Cys Ile Val Ile Gly Ala Arg Lys
                165                 170                 175
Leu Gly Val Asn Pro Asp Asn Ile Ala Thr Pro Ile Ala Ala Ser Leu
            180                 185                 190
Gly Asp Leu Ile Thr Leu Ser Ile Leu Ala Leu Val Ser Ser Phe Phe
        195                 200                 205
Tyr Arg His Lys Asp Ser Arg Tyr Leu Thr Pro Leu Val Cys Leu Ser
    210                 215                 220
Phe Ala Ala Leu Thr Pro Val Trp Val Leu Ile Ala Lys Gln Ser Pro
225                 230                 235                 240
Pro Ile Val Lys Ile Leu Lys Phe Gly Trp Phe Pro Ile Ile Leu Ala
                245                 250                 255
Met Val Ile Ser Ser Phe Gly Gly Leu Ile Leu Ser Lys Thr Val Ser
            260                 265                 270
Lys Gln Gln Tyr Lys Gly Met Ala Ile Phe Thr Pro Val Ile Cys Gly
        275                 280                 285
Val Gly Gly Asn Leu Val Ala Ile Gln Thr Ser Arg Ile Ser Thr Tyr
    290                 295                 300
Leu His Met Trp Ser Ala Pro Gly Val Leu Pro Leu Gln Met Lys Lys
305                 310                 315                 320
Phe Trp Pro Asn Pro Cys Ser Thr Phe Cys Thr Ser Glu Ile Asn Ser
                325                 330                 335
Met Ser Ala Arg Val Leu Leu Leu Leu Val Val Pro Gly His Leu Ile
            340                 345                 350
Phe Phe Tyr Ile Ile Tyr Leu Val Glu Gly Gln Ser Val Ile Asn Ser
        355                 360                 365
Gln Thr Phe Val Val Leu Tyr Leu Leu Ala Gly Leu Ile Gln Val Thr
    370                 375                 380
Ile Leu Leu Tyr Leu Ala Glu Val Met Val Arg Leu Thr Trp His Gln
385                 390                 395                 400
Ala Leu Asp Pro Asp Asn His Cys Ile Pro Tyr Leu Thr Gly Leu Gly
                405                 410                 415
Asp Leu Leu Gly Thr Gly Leu Leu Ala Leu Cys Phe Phe Thr Asp Trp
            420                 425                 430
Leu Leu Lys Ser Lys Ala Glu Leu Gly Gly Ile Ser Glu Leu Ala Ser
        435                 440                 445
Gly Pro Pro
    450
<210>7
<211>2178
<212>DNA
<213>智人
<220>
<221>CDS
<222>(41)..(1501)
<223>克隆MB5
<400>7
gggaggggac ccgggctgcc aggcgcccag ctgtgcccag atg gat ggg aca gag    55
                                            Met Asp Gly Thr Glu
                                              1               5
acc cgg cag cgg agg ctg gac agc tgt ggc aag cca ggg gag ctg ggg    103
Thr Arg Gln Arg Arg Leu Asp Ser Cys Gly Lys Pro Gly Glu Leu Gly
                 10                  15                  20
ctt cct cac ccc ctc agc aca gga gga ctc cct gta gcc tca gaa gat    151
Leu Pro His Pro Leu Ser Thr Gly Gly Leu Pro Val Ala Ser Glu Asp
             25                  30                  35
gga gct ctc agg gcc cct gag agc caa agc gtg acc ccc aag cca ctg    199
Gly Ala Leu Arg Ala Pro Glu Ser Gln Ser Val Thr Pro Lys Pro Leu
         40                  45                  50
gag act gag cct agc agg gag acc gcc tgg tcc ata ggc ctt cag gtg    247
Glu Thr Glu Pro Ser Arg Glu Thr Ala Trp Ser Ile Gly Leu Gln Val
     55                  60                  65
acc gtg ccc ttc atg ttt gca ggc ctg gga ctg tcc tgg gcc ggc atg    295
Thr Val Pro Phe Met Phe Ala Gly Leu Gly Leu Ser Trp Ala Gly Met
 70                  75                  80                  85
ctt ctg gac tat ttc cag cac tgg cct gtg ttt gtg gag gtg aaa gac    343
Leu Leu Asp Tyr Phe Gln His Trp Pro Val Phe Val Glu Val Lys Asp
                 90                  95                 100
ctt ttg aca ttg gtg ccg ccc ctg gtg ggc ctg aag ggg aac ctg gag    391
Leu Leu Thr Leu Val Pro Pro Leu Val Gly Leu Lys Gly Asn Leu Glu
            105                 110                 115
atg aca ctg gca tcc aga ctc tcc aca gct gcc aac act gga caa att    439
Met Thr Leu Ala Ser Arg Leu Ser Thr Ala Ala Asn Thr Gly Gln Ile
        120                 125                 130
gat gac ccc cag gag cag cac aga gtc atc agc agc aac ctg gcc ctc    487
Asp Asp Pro Gln Glu Gln His Arg Val Ile Ser Ser Asn Leu Ala Leu
    135                 140                 145
atc cag gtg cag gcc act gtc gtg ggg ctc ttg gct gct gtg gct gcg    535
Ile Gln Val Gln Ala Thr Val Val Gly Leu Leu Ala Ala Val Ala Ala
150                 155                 160                 165
ctg ctg ttg ggc gtg gtg tct cga gag gaa gtg gat gtc gcc aag gtg    583
Leu Leu Leu Gly Val Val Ser Arg Glu Glu Val Asp Val Ala Lys Val
                170                 175                 180
gag ttg ctg tgt gcc agc agt gtc ctc act gcc ttc ctt gca gcc ttt    631
Glu Leu Leu Cys Ala Ser Ser Val Leu Thr Ala Phe Leu Ala Ala Phe
            185                 190                 195
gcc ctg ggg gtg ctg atg gtc tgt ata gtg att ggt gct cga aag ctc    679
Ala Leu Gly Val Leu Met Val Cys Ile Val Ile Gly Ala Arg Lys Leu
        200                 205                 210
ggg gtc aac cca gac aac att gcc acg ccc att gca gcc agc ctg gga    727
Gly Val Asn Pro Asp Asn Ile Ala Thr Pro Ile Ala Ala Ser Leu Gly
    215                 220                 225
gac ctc atc aca ctg tcc att ctg gct ttg gtt agc agc ttc ttc tac    775
Asp Leu Ile Thr Leu Ser Ile Leu Ala Leu Val Ser Ser Phe Phe Tyr
230                 235                 240                 245
aga cac aaa gat agt cgg tat ctg acg ccg ctg gtc tgc ctc agc ttt    823
Arg His Lys Asp Ser Arg Tyr Leu Thr Pro Leu Val Cys Leu Ser Phe
                250                 255                 260
gcg gct ctg acc cca gtg tgg gtc ctc att gcc aag cag agc cca ccc    871
Ala Ala Leu Thr Pro Val Trp Val Leu Ile Ala Lys Gln Ser Pro Pro
            265                 270                 275
atc gtg aag atc ctg aag ttt ggc tgg ttc cca atc atc ctg gcc atg    919
Ile Val Lys Ile Leu Lys Phe Gly Trp Phe Pro Ile Ile Leu Ala Met
        280                 285                 290
gtc atc agc agt ttc gga gga ctc atc ttg agc aaa acc gtt tct aaa    967
Val Ile Ser Ser Phe Gly Gly Leu Ile Leu Ser Lys Thr Val Ser Lys
    295                 300                 305
cag cag tac aaa ggc atg gcg ata ttt acc ccc gtc ata tgt ggt gtt      1015
Gln Gln Tyr Lys Gly Met Ala Ile Phe Thr Pro Val Ile Cys Gly Val
310                 315                 320                 325
ggt ggc aat ctg gtg gcc att cag acc agc cga atc tca acc tac ctg      1063
Gly Gly Asn Leu Val Ala Ile Gln Thr Ser Arg Ile Ser Thr Tyr Leu
                330                 335                 340
cac atg tgg agt gca cct ggc gtc ctg ccc ctc cag atg aag aaa ttc      111l
His Met Trp Ser Ala Pro Gly Val Leu Pro Leu Gln Met Lys Lys Phe
            345                 350                 355
tgg ccc aac ccg tgt tct act ttc tgc acg tca gaa atc aat tcc atg      1159
Trp Pro Asn Pro Cys Ser Thr Phe Cys Thr Ser Glu Ile Asn Ser Met
        360                 365                 370
tca gct cga gtc ctg ctc ttg ctg gtg gtc cca ggc cat ctg att ttc      1207
Ser Ala Arg Val Leu Leu Leu Leu Val Val Pro Gly His Leu Ile Phe
    375                 380                 385
ttc tac atc atc tac ctg gtg gag ggt cag tca gtc ata aac agc cag      1255
Phe Tyr Ile Ile Tyr Leu Val Glu Gly Gln Ser Val Ile Asn Ser Gln
390                 395                 400                 405
acc ttt gtg gtg ctc tac ctg ctg gca ggc ctg atc cag gtg aca atc      1303
Thr Phe Val Val Leu Tyr Leu Leu Ala Gly Leu Ile Gln Val Thr Ile
                410                 415                 420
ctg ctg tac ctg gca gaa gtg atg gtt cgg ctg act tgg cac cag gcc      1351
Leu Leu Tyr Leu Ala Glu Val Met Val Arg Leu Thr Trp His Gln Ala
            425                 430                 435
ctg gat cct gac aac cac tgc atc ccc tac ctt aca ggg ctg ggg gac      1399
Leu Asp Pro Asp Asn His Cys Ile Pro Tyr Leu Thr Gly Leu Gly Asp
        440                 445                 450
ctg ctc ggt act ggc ctc ctg gca ctc tgc ttt ttc act gac tgg cta      1447
Leu Leu Gly Thr Gly Leu Leu Ala Leu Cys Phe Phe Thr Asp Trp Leu
    455                 460                 465
ctg aag agc aag gca gag ctg ggt ggc atc tca gaa ctg gca tct gga      1495
Leu Lys Ser Lys Ala Glu Leu Gly Gly Ile Ser Glu Leu Ala Ser Gly
470                 475                 480                 485
cct ccc     taactgggc cccgctggtc ccatttgctc attagaattt cctctcacat    1550
Pro Pro
cagtgggata cagaattcag tttctccctt gccaggtcct tgggatggtt gacccctgcc    1610
tctgcagtag ccttttgtga gtctgctaag gtagctctca cacacctcgg ctctggggtt    1670
gatacctgag cctgcaatag agccctgaaa tcaagagcat ggcttgagtg tgtgaatatg    1730
atgtgtgcac atgcttaatg agcgtgcaag tgtgcacacg tttgtggaga ggagggtgtt    1790
ctggcctgag aaggtaaaga agaggcatgt ccagtatgct ttgcagggtg tgtttgctct    1850
tttccatgcc catgcaaccc agattggggt ggagcaggaa ggagctcttt tctgttccca    1910
agcctcagaa ctcttgagct gtggcttact tgctgtcttc accaggttca agctccgtgg    1970
gccacactgc tgctgtgcca agaaggtgta cagcctcccc aggatggggc ctcatacaac    2030
ccttcatctg cactcaacat ttaatcgtgt ccttgctgtc tttttatttt cctttttgtt    2090
tgttagcaaa aacctctatt tagatttcaa taatcagaga agtgtaaaat aaaacagatt    2150
atattgtact tgaaaaaaaa aaaaaaaa                                       2178
<210>8
<211>487
<212>PRT
<213>智人
<400>8
Met Asp Gly Thr Glu Thr Arg Gln Arg Arg Leu Asp Ser Cys Gly Lys
  1               5                  10                  15
Pro Gly Glu Leu Gly Leu Pro His Pro Leu Ser Thr Gly Gly Leu Pro
             20                  25                  30
Val Ala Ser Glu Asp Gly Ala Leu Arg Ala Pro Glu Ser Gln Ser Val
         35                  40                  45
Thr Pro Lys Pro Leu Glu Thr Glu Pro Ser Arg Glu Thr Ala Trp Ser
     50                  55                  60
Ile Gly Leu Gln Val Thr Val Pro Phe Met Phe Ala Gly Leu Gly Leu
65                   70                  75                  80
Ser Trp Ala Gly Met Leu Leu Asp Tyr Phe Gln His Trp Pro Val Phe
                 85                  90                  95
Val Glu Val Lys Asp Leu Leu Thr Leu Val Pro Pro Leu Val Gly Leu
            100                 105                 110
Lys Gly Asn Leu Glu Met Thr Leu Ala Ser Arg Leu Ser Thr Ala Ala
        115                 120                 125
Asn Thr Gly Gln Ile Asp Asp Pro Gln Glu Gln His Arg Val Ile Ser
    130                 135                 140
Ser Asn Leu Ala Leu Ile Gln Val GIn Ala Thr Val Val Gly Leu Leu
145                 150                 155                 160
Ala Ala Val Ala Ala Leu Leu Leu Gly Val Val Ser Arg Glu Glu Val
                165                 170                 175
Asp Val Ala Lys Val Glu Leu Leu Cys Ala Ser Ser Val Leu Thr Ala
            180                 185                 190
Phe Leu Ala Ala Phe Ala Leu Gly Val Leu Met Val Cys Ile Val Ile
        195                 200                 205
Gly Ala Arg Lys Leu Gly Val Asn Pro Asp Asn Ile Ala Thr Pro Ile
    210                 215                 220
Ala Ala Ser Leu Gly Asp Leu Ile Thr Leu Ser Ile Leu Ala Leu Val
225                 230                 235                 240
Ser Ser Phe Phe Tyr Arg His Lys Asp Ser Arg Tyr Leu Thr Pro Leu
                245                 250                 255
Val Cys Leu Ser Phe Ala Ala Leu Thr Pro Val Trp Val Leu Ile Ala
            260                 265                 270
Lys Gln Ser Pro Pro Ile Val Lys Ile Leu Lys Phe Gly Trp Phe Pro
        275                 280                 285
Ile Ile Leu Ala Met Val Ile Ser Ser Phe Gly Gly Leu Ile Leu Ser
    290                 295                 300
Lys Thr Val Ser Lys Gln Gln Tyr Lys Gly Met Ala Ile Phe Thr Pro
305                 310                 315                 320
Val Ile Cys Gly Val Gly Gly Asn Leu Val Ala Ile Gln Thr Ser Arg
                325                 330                 335
Ile Ser Thr Tyr Leu His Met Trp Ser Ala Pro Gly Val Leu Pro Leu
            340                 345                 350
Gln Met Lys Lys Phe Trp Pro Asn Pro Cys Ser Thr Phe Cys Thr Ser
        355                 360                 365
Glu Ile Asn Ser Met Ser Ala Arg Val Leu Leu Leu Leu Val Val Pro
    370                 375                 380
Gly His Leu Ile Phe Phe Tyr Ile Ile Tyr Leu Val Glu Gly Gln Ser
385                 390                 395                 400
Val Ile Asn Ser Gln Thr Phe Val Val Leu Tyr Leu Leu Ala Gly Leu
                405                 410                 415
Ile Gln Val Thr Ile Leu Leu Tyr Leu Ala Glu Val Met Val Arg Leu
            420                 425                 430
Thr Trp His Gln Ala Leu Asp Pro Asp Asn His Cys Ile Pro Tyr Leu
        435                 440                 445
Thr Gly Leu Gly Asp Leu Leu Gly Thr Gly Leu Leu Ala Leu Cys Phe
    450                 455                 460
Phe Thr Asp Trp Leu Leu Lys Ser Lys Ala Glu Leu Gly Gly Ile Ser
465                 470                 475                 480
Glu Leu Ala Ser Gly Pro Pro
                485
<210>9
<211>1616
<212>DNA
<213>智人
<220>
<221>CDS
<222>(31)..(1551)
<223>克隆IE4
<400>9
ccgggctgcc aggcgcccag ctgtgcccag atg gat ggg aca gag acc cgg cag    54
                                 Met Asp Gly Thr Glu Thr Arg Gln
                                   1               5
cgg agg ctg gac agc tgt ggc aag cca ggg gag ctg ggg ctt cct cac    102
Arg Arg Leu Asp Ser Cys Gly Lys Pro Gly Glu Leu Gly Leu Pro His
     10                  15                  20
ccc ctc agc aca gga gga ctc cct gta gcc tca gaa gat gga gct ctc    150
Pro Leu Ser Thr Gly Gly Leu Pro Val Ala Set Glu Asp Gly Ala Leu
 25                  30                  35                  40
agg gcc cct gag agc caa agc gtg acc ccc aag cca ctg gag act gag    198
Arg Ala Pro Glu Ser Gln Ser Val Thr Pro Lys Pro Leu Glu Thr Glu
                 45                  50                  55
cct agc agg gag acc gcc tgg tcc ata ggc ctt cag gtg acc gtg ccc    246
Pro Ser Arg Glu Thr Ala Trp Ser Ile Gly Leu Gln Val Thr Val Pro
             60                  65                  70
ttc atg ttt gca ggc ctg gga ctg tcc tgg gcc ggc atg ctt ctg gac    294
Phe Met Phe Ala Gly Leu Gly Leu Ser Trp Ala Gly Met Leu Leu Asp
         75                  80                  85
tat ttc cag cac tgg cct gtg ttt gtg gag gtg aaa gac ctt ttg aca    342
Tyr Phe Gln His Trp Pro Val Phe Val Glu Val Lys Asp Leu Leu Thr
     90                  95                 100
ttg gtg ccg ccc ctg gtg ggc ctg aag ggg aac ctg gag atg aca ctg    390
Leu Val Pro Pro Leu Val Gly Leu Lys Gly Asn Leu Glu Met Thr Leu
105                 110                 115                 120
gca tcc aga ctc tcc aca gct gcc aac act gga caa att gat gac ccc    438
Ala Ser Arg Leu Ser Thr Ala Ala Asn Thr Gly Gln Ile Asp Asp Pro
                125                 130                 135
cag gag cag cac aga gtc atc agc agc aac ctg gcc ctc atc cag gtg    486
Gln Glu Gln His Arg Val Ile Ser Ser Asn Leu Ala Leu Ile Gln Val
            140                 145                 150
cag gcc act gtc gtg ggg ctc ttg gct gct gtg gct gcg ctg ctg ttg    534
Gln Ala Thr Val Val Gly Leu Leu Ala Ala Val Ala Ala Leu Leu Leu
        155                 160                 165
ggc gtg gtg tct cga gag gaa gtg gat gtc gcc aag gtg gag ttg ctg    582
Gly Val Val Ser Arg Glu Glu Val Asp Val Ala Lys Val Glu Leu Leu
    170                 175                 180
tgt gcc agc agt gtc ctc act gcc ttc ctt gca gcc ttt gcc ctg ggg    630
Cys Ala Ser Ser Val Leu Thr Ala Phe Leu Ala Ala Phe Ala Leu Gly
185                 190                 195                 200
gtg ctg atg gtc tgt ata gtg att ggt gct cga aag ctc ggg gtc aac    678
Val Leu Met Val Cys Ile Val Ile Gly Ala Arg Lys Leu Gly Val Asn
                205                 210                 215
cca gac aac att gcc acg ccc att gca gcc agc ctg gga gac ctc atc    726
Pro Asp Asn Ile Ala Thr Pro Ile Ala Ala Ser Leu Gly Asp Leu Ile
            220                 225                 230
aca ctg tcc att ctg gct ttg gtt agc agc ttc ttc tac aga cac aaa    774
Thr Leu Ser Ile Leu Ala Leu Val Ser Ser Phe Phe Tyr Arg His Lys
        235                 240                 245
gat agt cgg tat ctg acg ccg ctg gtc tgc ctc agc ttt gcg gct ctg    822
Asp Ser Arg Tyr Leu Thr Pro Leu Val Cys Leu Ser Phe Ala Ala Leu
    250                 255                 260
acc cca gtg tgg gtc ctc att gcc aag cag agc cca ccc atc gtg aag    870
Thr Pro Val Trp Val Leu Ile Ala Lys Gln Ser Pro Pro Ile Val Lys
265                 270                 275                 280
atc ctg aag ttt ggc tgg ttc cca atc atc ctg gcc atg gtc atc agc    918
Ile Leu Lys Phe Gly Trp Phe Pro Ile Ile Leu Ala Met Val Ile Ser
                285                 290                 295
agt ttc gga gga ctc atc ttg agc aaa acc gtt tct aaa cag cag tac    966
Ser Phe Gly Gly Leu Ile Leu Ser Lys Thr Val Ser Lys Gln Gln Tyr
            300                 305                 310
aaa ggc atg gcg ata ttt acc ccc gtc ata tgt ggt gtt ggt ggc aat    1014
Lys Gly Met Ala Ile Phe Thr Pro Val Ile Cys Gly Val Gly Gly Asn
        315                 320                 325
ctg gtg gcc att cag acc agc cga atc tca acc tac ctg cac atg tgg    1062
Leu Val Ala Ile Gln Thr Ser Arg Ile Ser Thr Tyr Leu His Met Trp
    330                 335                 340
agt gca cct ggc gtc ctg ccc ctc cag atg aag aaa ttc tgg ccc aac    1110
Ser Ala Pro Gly Val Leu Pro Leu Gln Met Lys Lys Phe Trp Pro Asn
345                 350                 355                 360
ccg tgt tct act ttc tgc acg tca gaa atc aat tcc atg tca gct cga    1158
Pro Cys Ser Thr Phe Cys Thr Ser Glu Ile Asn Ser Met Ser Ala Arg
                365                 370                 375
gtc ctg ctc ttg ctg gtg gtc cca ggc cat ctg att ttc ttc tac atc    1206
Val Leu Leu Leu Leu Val Val Pro Gly His Leu Ile Phe Phe Tyr Ile
            380                 385                 390
atc tac ctg gtg gag ggt cag tca gtc ata aac agc cag acc ttt gtg    1254
Ile Tyr Leu Val Glu Gly Gln Ser Val Ile Asn Ser Gln Thr Phe Val
        395                 400                 405
gtg ctc tac ctg ctg gca ggc ctg atc cag gtg aca atc ctg ctg tac    1302
Val Leu Tyr Leu Leu Ala Gly Leu Ile Gln Val Thr Ile Leu Leu Tyr
    410                 415                 420
ctg gca gaa gtg atg gtt cgg ctg act tgg cac cag gcc ctg gat cct    1350
Leu Ala Glu Val Met Val Arg Leu Thr Trp His Gln Ala Leu Asp Pro
425                 430                 435                 440
gac aac cac tgc atc ccc tac ctt aca ggg ctg ggg gac ctg ctc ggt    1398
Asp Asn His Cys Ile Pro Tyr Leu Thr Gly Leu Gly Asp Leu Leu Gly
                445                 450                 455
tca agc tcc gtg ggc cac act gct gct gtg cca aga agg tgt aca gcc    1446
Ser Ser Ser Val Gly His Thr Ala Ala Val Pro Arg Arg Cys Thr Ala
            460                 465                 470
tcc cca gga tgg ggc ctc ata caa ccc ttc atc tgc act caa cat tta      1494
Ser Pro Gly Trp Gly Leu Ile Gln Pro Phe Ile Cys Thr Gln His Leu
        475                 480                 485
atc gtg tcc ttg ctg tct ttt tat ttt cct ttt tgt ttg tta gca aaa      1542
Ile Val Ser Leu Leu Ser Phe Tyr Phe Pro Phe Cys Leu Leu Ala Lys
    490                 495                 500
acc tct att tagatttca ataatcagag aagtgtaaaa taaaacagat tatattgtaa    1600
Thr Ser Ile
505
aaaaaaaaaa aaaaaa                                                    1616
<210>10
<211>507
<212>PRT
<213>智人
<400>10
Met Asp Gly Thr Glu Thr Arg Gln Arg Arg Leu Asp Ser Cys Gly Lys
  1               5                  10                  15
Pro Gly Glu Leu Gly Leu Pro His Pro Leu Ser Thr Gly Gly Leu Pro
             20                  25                  30
Val Ala Ser Glu Asp Gly Ala Leu Arg Ala Pro Glu Ser Gln Ser Val
         35                  40                  45
Thr Pro Lys Pro Leu Glu Thr Glu Pro Ser Arg Glu Thr Ala Trp Ser
     50                  55                  60
Ile Gly Leu Gln Val Thr Val Pro Phe Met Phe Ala Gly Leu Gly Leu
 65                  70                  75                  80
Ser Trp Ala Gly Met Leu Leu Asp Tyr Phe Gln His Trp Pro Val Phe
                 85                  90                  95
Val Glu Val Lys Asp Leu Leu Thr Leu Val Pro Pro Leu Val Gly Leu
            100                 105                 110
Lys Gly Asn Leu Glu Met Thr Leu Ala Ser Arg Leu Ser Thr Ala Ala
        115                 120                 125
Asn Thr Gly Gln Ile Asp Asp Pro Gln Glu Gln His Arg Val Ile Ser
    130                 135                 140
Ser Asn Leu Ala Leu Ile Gln Val Gln Ala Thr Val Val Gly Leu Leu
145                 150                 155                 160
Ala Ala Val Ala Ala Leu Leu Leu Gly Val Val Ser Arg Glu Glu Val
                165                 170                 175
Asp Val Ala Lys Val Glu Leu Leu Cys Ala Ser Ser Val Leu Thr Ala
            180                 185                 190
Phe Leu Ala Ala Phe Ala Leu Gly Val Leu Met Val Cys Ile Val Ile
        195                 200                 205
Gly Ala Arg Lys Leu Gly Val Asn Pro Asp Asn Ile Ala Thr Pro Ile
    210                 215                 220
Ala Ala Ser Leu Gly Asp Leu Ile Thr Leu Ser Ile Leu Ala Leu Val
225                 230                 235                 240
Ser Ser Phe Phe Tyr Arg His Lys Asp Ser Arg Tyr Leu Thr Pro Leu
                245                 250                 255
Val Cys Leu Ser Phe Ala Ala Leu Thr Pro Val Trp Val Leu Ile Ala
            260                 265                 270
Lys Gln Ser Pro Pro Ile Val Lys Ile Leu Lys Phe Gly Trp Phe Pro
        275                 280                 285
Ile Ile Leu Ala Met yal Ile Ser Ser Phe Gly Gly Leu Ile Leu Ser
    290                 295                 300
Lys Thr Val Ser Lys Gln Gln Tyr Lys Gly Met Ala Ile Phe Thr Pro
305                 310                 315                 320
Val Ile Cys Gly Val Gly Gly Asn Leu Val Ala Ile Gln Thr Ser Arg
                325                 330                 335
Ile Ser Thr Tyr Leu His Met Trp Ser Ala Pro Gly Val Leu Pro Leu
            340                 345                 350
Gln Met Lys Lys Phe Trp Pro Asn Pro Cys Ser Thr Phe Cys Thr Ser
        355                 360                 365
Glu Ile Asn Ser Met Ser Ala Arg Val Leu Leu Leu Leu Val Val Pro
    370                 375                 380
Gly His Leu Ile Phe Phe Tyr Ile Ile Tyr Leu Val Glu Gly Gln Ser
385                 390                 395                 400
Val Ile Asn Ser Gln Thr Phe Val Val Leu Tyr Leu Leu Ala Gly Leu
                405                 410                 415
Ile Gln Val Thr Ile Leu Leu Tyr Leu Ala Glu Val Met Val Arg Leu
            420                 425                 430
Thr Trp His Gln Ala Leu Asp Pro Asp Asn His Cys Ile Pro Tyr Leu
        435                 440                 445
Thr Gly Leu Gly Asp Leu Leu Gly Ser Ser Ser Val Gly His Thr Ala
    450                 455                 460
Ala Val Pro Arg Arg Cys Thr Ala Ser Pro Gly Trp Gly Leu Ile Gln
465                 470                 475                 480
Pro Phe Ile Cys Thr Gln His Leu Ile Val Ser Leu Leu Ser Phe Tyr
                485                 490                 495
Phe Pro Phe Cys Leu Leu Ala Lys Thr Ser Ile
            500                 505

Claims (34)

1.一种分离的核酸分子,其选自下列:(a)包含SEQ ID NO:1,3,5或7的分离的核酸分子,(b)编码SEQ ID NO:6或8的分离的核酸分子,(c)编码肝癌中表达的蛋白的分离的核酸分子,该核酸分子与SEQ ID NO:5的全长连续序列表现出至少大约95%的核苷酸序列同一性,(d)编码肝癌中表达的蛋白的分离的核酸分子,该核酸分子与SEQ ID NO:7的全长连续序列表现出至少大约75%的核苷酸序列同一性,和(e)包含(a)、(b)、(c)或(d)的核酸分子的互补链的分离的核酸分子。
2.权利要求1中的分离的核酸分子,其中该核酸分子由SEQ ID NO:1的155-418位核苷酸组成。
3.权利要求1中的分离的核酸分子,其中该核酸分子由SEQ ID NO:3的139-402位核苷酸组成。
4.权利要求1中的分离的核酸分子,其中该核酸分子包含SEQ IDNO:5的32-1384位核苷酸。
5.权利要求1中的分离的核酸分子,其中该核酸分子包含SEQ IDNO:5的32-1387位核苷酸。
6.权利要求1中的分离的核酸分子,其中该核酸分子由SEQ ID NO:5的32-1384位核苷酸组成。
7.权利要求1中的分离的核酸分子,其中该核酸分子由SEQ ID NO:7的41-1501位核苷酸组成。
8.权利要求1中的分离的核酸分子,其中该核酸分子包含SEQ IDNO:7的41-1504位核苷酸。
9.权利要求1中的分离的核酸分子,其中该核酸分子由SEQ ID NO:7的41-1501位核苷酸组成。
10.权利要求1-9中任一权利要求的分离的核酸分子,其中所述核酸分子可操作的连接于一种或多种表达控制元件。
11.包含权利要求1-9中任一权利要求的分离的核酸分子的载体。
12.经转化而含有权利要求1-9中任一权利要求的核酸分子的宿主细胞。
13.含有权利要求11中的载体的宿主细胞。
14.权利要求13的宿主细胞,其中所述宿主细胞选自原核宿主细胞和真核宿主细胞。
15.一种生产多肽的方法,包括在一定条件下培养被权利要求1-9中任一权利要求的核酸分子转化的宿主细胞,所述条件使得所述核酸分子编码的蛋白可以表达。
16.权利要求15的方法,其中所述宿主细胞选自原核宿主细胞和真核宿主细胞。
17.由权利要求15的方法生产的分离的多肽。
18.一种分离的多肽或蛋白,其选自下列:含有SEQ ID NO:2,4,6或8的氨基酸序列的分离多肽;含有SEQ ID NO:2或4中至少10个氨基酸的片段的分离多肽;含有SEQ ID NO:2或4的保守氨基酸替代的分离多肽;含有SEQ ID NO:2或4的天然存在的氨基酸序列变体的分离多肽;与SEQ ID NO:2或4表现出至少大约75%氨基酸序列同一性的分离多肽;以及与SEQ ID NO:6或8具有至少大约95%氨基酸序列同一性的蛋白。
19.一种分离的抗体或抗原结合型抗体片段,其与权利要求18的多肽结合。
20.权利要求19的抗体,其中所述抗体是单克隆或多克隆抗体。
21.一种鉴定物质的方法,所述物质调控编码权利要求18的蛋白的核酸的表达,该方法包括:
将表达所述核酸的细胞暴露于所述物质;和
确定所述物质是否调控所述核酸的表达,从而鉴定可以调控编码所述蛋白的核酸的表达的物质。
22.一种鉴定物质的方法,该物质调控权利要求18的蛋白或者含有SEQ ID NO:10的蛋白的水平或至少一种活性,该方法包括:
将表达所述蛋白的细胞暴露于所述物质;
确定所述物质是否调控所述蛋白的水平或至少一种活性,从而鉴定可以调控所述蛋白的水平或至少一种活性的物质。
23.权利要求22的方法,其中所述物质调控所述蛋白的一种活性。
24.一种鉴定权利要求18的蛋白或者含有SEQ ID NO:10的蛋白的结合配偶体的方法,包括:
将所述蛋白暴露给潜在的结合配偶体;和
确定所述潜在的结合配偶体是否结合到所述蛋白,从而鉴定所述蛋白的结合配偶体。
25.一种调控编码权利要求18的蛋白或包含SEQ ID NO:10的蛋白的核酸表达的方法,包括:
施用有效量的物质,该物质调控编码所述蛋白的核酸的表达。
26.一种调控权利要求18的蛋白或者包含SEQ ID NO:10的蛋白的至少一种活性的方法,包括:
施用有效量的物质,该物质调控所述蛋白的至少一种活性。
27.经修饰而含有权利要求1-9中任一权利要求的核酸分子或SEQID NO:10的非人类转基因动物。
28.权利要求27的转基因动物,其中该核酸分子含有阻止所编码的蛋白表达的突变。
29.在受试者中诊断疾病状态的方法,包括:
确定权利要求1-9或18中任一项的核酸分子或蛋白的表达水平、含有SEQ ID NO:9的核酸的表达水平或含有SEQ ID NO:10的蛋白分子的表达水平。
30.权利要求29的方法,其中所述疾病状态是肝癌。
31.权利要求30的方法,其中所述疾病状态是肝细胞癌。
32.权利要求29的方法,其中所述疾病状态是恶性肿瘤。
33.权利要求32的方法,其中所述恶性肿瘤发生在膀胱,乳房,子宫颈,结肠,肾脏,肺部,子宫肌层,卵巢,胰腺,前列腺,直肠,皮肤,小肠,软组织,脾,胃,睾丸或甲状腺。
34.一种包含稀释剂和多肽或蛋白的组合物,其中所述多肽或蛋白选自下列:含有SEQ ID NO:2,4,6,8或10的氨基酸序列的分离多肽;含有SEQ ID NO:2,4,6,8或10中至少10个氨基酸的片段的分离多肽;含有SEQ ID NO:2或4的保守氨基酸替代的分离多肽;含有SEQ ID NO:2或4的天然存在的氨基酸序列变体的分离多肽;与SEQID NO:2或4表现出至少大约75%氨基酸序列同一性的分离多肽;以及与SEQ ID NO:6,8或10表现出至少大约95%氨基酸序列同一性的多肽。
CNA038217805A 2002-08-14 2003-08-14 肝癌相关的基因家族 Pending CN1681834A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US40290502P 2002-08-14 2002-08-14
US60/402,905 2002-08-14
US40365102P 2002-08-16 2002-08-16
US60/403,651 2002-08-16

Publications (1)

Publication Number Publication Date
CN1681834A true CN1681834A (zh) 2005-10-12

Family

ID=31891369

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA038217805A Pending CN1681834A (zh) 2002-08-14 2003-08-14 肝癌相关的基因家族

Country Status (7)

Country Link
US (1) US20060242721A1 (zh)
EP (1) EP1543018A4 (zh)
JP (1) JP2006512056A (zh)
KR (1) KR20050056199A (zh)
CN (1) CN1681834A (zh)
AU (1) AU2003256106A1 (zh)
WO (1) WO2004016637A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100954322B1 (ko) * 2006-06-14 2010-04-21 주식회사 엘지생명과학 췌장암과 관련된 신규한 lbfl313 유전자

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1100898A2 (en) * 1998-07-24 2001-05-23 Sagami Chemical Research Center Human proteins having hydrophobic domains and dnas encoding these proteins
CA2311201A1 (en) * 1999-08-05 2001-02-05 Genset S.A. Ests and encoded human proteins
US6974667B2 (en) * 2000-06-14 2005-12-13 Gene Logic, Inc. Gene expression profiles in liver cancer
AR031250A1 (es) * 2000-07-11 2003-09-17 Corixa Corp Composiciones y metodos para la terapia y el diagnostico del cancer de pulmon
AU2003290432A1 (en) * 2002-12-26 2004-07-22 Asahi Kasei Pharma Corporation T cell activating gene

Also Published As

Publication number Publication date
EP1543018A4 (en) 2006-10-25
KR20050056199A (ko) 2005-06-14
US20060242721A1 (en) 2006-10-26
EP1543018A1 (en) 2005-06-22
AU2003256106A1 (en) 2004-03-03
WO2004016637A1 (en) 2004-02-26
JP2006512056A (ja) 2006-04-13

Similar Documents

Publication Publication Date Title
CN1310942C (zh) 校正基因
CN1675362A (zh) Hla-a24限制性癌抗原肽
CN1592793A (zh) 肝细胞癌-相关基因和多肽,以及检测肝细胞癌的方法
CN1264980C (zh) 新型肿瘤抗原蛋白sart-3及其肿瘤抗原肽
CN101039956A (zh) 细胞表面糖蛋白
CN1241940C (zh) 新型胶原蛋白样蛋白clac、其前体和它们的编码基因
CN1289670C (zh) 用于调节癌细胞增生的多核苷酸
CN1390256A (zh) 新型蛋白质及其dna
CN1249087C (zh) 新的人g蛋白偶联受体
CN1681834A (zh) 肝癌相关的基因家族
CN1708589A (zh) Cns中crh应答基因
CN1359421A (zh) 新型多肽及其dna
CN1246457C (zh) 人tsc403基因和人ing1l基因
CN1596264A (zh) 有关肥胖及2型糖尿病的差异表达基因
CN1681835A (zh) 胃癌相关的基因家族
CN1900279A (zh) 诱导细胞凋亡的多核苷酸及其编码的多肽和用途
CN1177049C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199998C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1708511A (zh) 对促肾上腺皮质激素释放激素刺激的应答而表达增加的基因
CN1705745A (zh) 与癌症相关的基因家族
CN1169958C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1177050C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1199997C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列
CN1194989C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1230445C (zh) 具有促进小鼠nih/3t3细胞转化功能的新的人蛋白及其编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication