CN101133081A - 人类原癌基因及其编码的蛋白 - Google Patents

人类原癌基因及其编码的蛋白 Download PDF

Info

Publication number
CN101133081A
CN101133081A CNA2005800487632A CN200580048763A CN101133081A CN 101133081 A CN101133081 A CN 101133081A CN A2005800487632 A CNA2005800487632 A CN A2005800487632A CN 200580048763 A CN200580048763 A CN 200580048763A CN 101133081 A CN101133081 A CN 101133081A
Authority
CN
China
Prior art keywords
leu
glu
ser
lys
pro
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800487632A
Other languages
English (en)
Inventor
金弦起
金振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN101133081A publication Critical patent/CN101133081A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/82Translation products from oncogenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Oncology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Toxicology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明披露了一种新型原癌基因及其编码的蛋白。本发明的原癌基因,是参与人类致癌作用同时具有诱导癌症转移能力的新型基因,可有效用于诊断癌症,包括肺癌、白血病、子宫癌、淋巴瘤、结肠癌、皮肤癌等,还用于产生转化的动物等。

Description

人类原癌基因及其编码的蛋白
技术领域
本发明涉及新的原癌基因,其与之前报道的原癌基因无同源性,但具有诱导癌症转移的能力;还涉及其编码的蛋白。
背景技术
已知高等动物包括人通常具有大约30,000个基因,但每一个个体中仅表达所述基因的约15%。因此,研究发现所有生命现象即生殖、分化、稳态、对刺激的反应、细胞周期控制、衰老和凋亡(程序性细胞死亡)等均依赖于哪些基因被选择并表达(Liang,P.and A.B.Pardee,Science 257:967-971,1992)。
病理现象例如肿瘤生成是通过遗传变异引起基因表达的改变而诱导。因此,比较不同细胞之间的基因表达可能是理解多种生物学机制的根本而主要的途径。例如,由Liang和Pardee提出的mRNA差异显示法(Liang,P.and A.B.Pardee,Science 257:967-971,1992)已经有效用于搜寻肿瘤抑制基因、细胞周期调节相关基因以及凋亡相关的转录调节基因等,并且也广泛应用于详细说明仅在一个细胞内发生的不同基因的联系。
综合肿瘤生成的多个结果,现在已经报道了多种遗传改变例如丧失特异性染色体杂合性、原癌基因的激活以及其他肿瘤抑制基因包括p53基因的失活在肿瘤组织中累积而形成人类肿瘤(Bishop,J.M.,Cell 64:235-248,1991;Hunter,T.,Cell 64:249-270,1991)。而且,据报道10-30%的癌通过扩增原癌基因而活化。因此,原癌基因的激活在多种癌症的病因学研究中发挥重要的作用,而且科研人员已经多方尝试以详细说明该作用。
因此,本发明者发现一种用于产生肺癌及宫颈癌的机制在原癌基因水平作了研究,因此该原癌基因,命名为人类迁移诱导基因,仅在癌细胞中表现出特殊增高的表达水平。该原癌基因可有效用于诊断、预防和治疗多种癌症例如肺癌、白血病、子宫癌、淋巴瘤、结肠癌、皮肤癌等。
发明内容
因此,设计本发明以解决该领域现存的问题,因此本发明的一个目标是提供新的原癌基因及其片段。
本发明的另一个目标是提供包括所述每一种原癌基因及其片段的重组载体以及由所述重组载体中每一种所转化的微生物。
本发明的另外一个目标是提供由每一种所述原癌基因编码的蛋白及其片段。
本发明的另外一个目标是提供用于诊断癌症及癌症转移的试剂盒,其包括每一种所述原癌基因或其片段。
本发明的另外一个目标是提供用于诊断癌症及癌症转移的试剂盒,其包括每一种所述蛋白或其片段。
为了实现上述目标,本发明提供了一种具有DNA序列SEQ IDNO:1的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体;以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:2的蛋白或其片段。
本发明提供了一种具有DNA序列SEQ ID NO:5的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:6的蛋白或其片段。
本发明提供了一种具有DNA序列SEQ ID NO:9的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:10的蛋白或其片段。本发明提供了一种具有DNA序列SEQ IDNO:13的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据所述另外一个目标,本发明提供了一种具有氨基酸序列SEQ ID NO:14的蛋白或其片段。
本发明提供了一种具有DNA序列SEQ ID NO:17的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:18的蛋白或其片段。
本发明提供一种具有DNA序列SEQ ID NO:21的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:22的蛋白或其片段。
本发明提供了一种具有DNA序列SEQ ID NO:25的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据所述另外一个目标,本发明提供了一种具有氨基酸序列SEQ ID NO:26的蛋白或其片段。
本发明提供了一种具有DNA序列SEQ ID NO:29的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:30的蛋白或其片段。
本发明提供了一种具有DNA序列SEQ ID NO:33的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:34的蛋白或其片段。
根据所述另外一个目标,本发明提供了用于诊断癌症以及癌症转移的试剂盒,包括所述原癌基因及其片段。
根据另外一个目标,本发明提供了用于诊断癌症以及癌症转移的试剂盒,包括所述原癌蛋白及其片段。
附图说明
本发明优选的具体实施方式的这些和其它特征、方面及优势将在下面的详细说明中结合附图做充分阐述。在附图中:
图1是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定L276811 DNA片段是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中表达;
图2是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定CC231 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达;
图3是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定L789DNA片段是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中表达;
图4是一个凝胶图,示出了差异显示逆转录PCR(DDT-PCR)的结果,以确定L986 DNA片段是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中表达;
图5是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定L1284 DNA片段是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中表达;
图6是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定CA367 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达;
图7是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定CA335 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达;
图8是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定CG263 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达;
图9是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定CG233 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达;
图10(a)是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG3是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358肺癌细胞系中表达。图10(b)是一个示图,示出了通过将图10(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图11是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG8是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达;
图12是一个示图,示出了通过将图11中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图13(a)是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG10是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358肺癌细胞系中表达。图13(b)是一个示图,示出了通过将图13(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图14(a)是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG13是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358肺癌细胞系中表达。图14(b)是一个示图,示出了通过将图14(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图15(a)是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG14是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358肺癌细胞系中表达。图15(b)是一个示图,示出了通过将图15(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图16是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG18是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达;
图17是一个示图,示出了通过将图16中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图18是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG19是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达;
图19是一个示图,示出了通过将图18中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图20是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG5是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达;
图21是一个示图,示出了通过将图20中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图22是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG7是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达;
图23是一个示图,示出了通过将图22中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图24(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG3是否在12个泳道的多个人类正常组织中表达,图24(b)是一个示图,示出了通过将图24(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图25是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG8是否在12个泳道的多个人类正常组织中表达;
图26是一个示图,示出了通过将图25中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图27(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG10是否在12个泳道的多个人类正常组织中表达,图27(b)是一个示图,示出了通过将图27(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图28(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG13是否在12个泳道的多个人类正常组织中表达,图28(b)是一个示图,示出了通过将图28(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图29(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG14是否在12个泳道的多个人类正常组织中表达,图29(b)是一个示图,示出了通过将图29(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图30是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG18是否在12个泳道的多个人类正常组织中表达;
图31是一个示图,示出了通过将图30中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图32是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG19是否在12个泳道的多个人类正常组织中表达;
图33是一个示图,示出了通过将图32中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图34是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG5是否在12个泳道的多个人类正常组织中表达;
图35是一个示图,示出了通过将图34中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图36是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG7是否在12个泳道的多个人类正常组织中表达;
图37是一个示图,示出了通过将图36中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图38(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG3是否在人类癌细胞系中表达,图38(b)是一个示图,示出了通过将图38(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图39是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG8是否在人类癌细胞系中表达;
图40是一个示图,示出了通过将图39中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图41(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG10是否在人类癌细胞系中表达,图41(b)是一个示图,示出了通过将图41(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图42(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG13是否在人类癌细胞系中表达,图42(b)是一个示图,示出了通过将图42(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图43(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG14是否在人类癌细胞系中表达,图43(b)是一个示图,示出了通过将图43(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图44是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG18是否在人类癌细胞系中表达;
图45是一个示图,示出了通过将图44中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图46是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG19是否在人类癌细胞系中表达;
图47是一个示图,示出了通过将图46中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图48是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG5是否在人类癌细胞系中表达;
图49是一个示图,示出了通过将图48中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图50是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG7是否在人类癌细胞系中表达;
图51是一个示图,示出了通过将图50中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;以及
图52至60是示图,示出了十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)的结果,以确定将本发明的原癌基因MIG3,MIG8,MIG10,MIG18,MIG13,MIG14,MIG19,MIG5和MIG7分别转化入大肠杆菌中后,在L-阿拉伯糖诱导前后所表达蛋白的大小。
具体实施方式
下文将参照附图对本发明的优选具体实施方式详细加以阐述。
1.MIG3
本发明的原癌基因,人类迁移诱导基因3(MIG3)(下文中,称为MIG3原癌基因),具有在SEQ ID NO:1中列出的2,295bp全长DNA序列。
在SEQ ID NO:1的DNA序列中,对应于核苷酸序列位置89-709(707-709:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:2中列出并包含206个氨基酸(下文中,称为“MIG3蛋白”)。
SEQ ID NO:1的DNA序列已经以编码号AY239293储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其DNA序列与智人cDNA:FLJ23513 fis,克隆体LNG03869基因的序列类似,后者以编码号AK027166储存于所述数据库中。本发明的原癌基因表达的蛋白包含206个氨基酸,氨基酸序列在SEQ ID NO:2中列出,分子量约23kDa。
2.MIG8
本发明的原癌基因,人类迁移诱导基因8(MIG8)(下文中,称为原癌基因MIG8),具有在SEQ ID NO:5中列出的3,737bp全长DNA序列。
在SEQ ID NO:5的DNA序列中,对应于核苷酸序列位置113-1627(1625-1627:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:6中列出并且包含665个氨基酸(下文中,称为“MIG8蛋白”)。
SEQ ID NO:5的DNA序列已经以编码号AY311389储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其氨基酸序列与智人凋亡抑制因子5(API5)基因的氨基酸序列一致,后者以编码号NM_006595和NM_021112储存于所述数据库中。但其一部分DNA序列不同于所述智人凋亡抑制因子5(API5)基因的DNA序列。
本发明的原癌基因表达的蛋白包含504个氨基酸,并且氨基酸序列在SEQ ID NO:6中列出,分子量约57kDa。
3.MIG10
本发明的原癌基因,人类迁移诱导基因10(MIG10)(下文中,称为原癌基因MIG10),具有在SEQ ID NO:9中列出的1,321bp全长DNA序列。
在SEQ ID NO:9的DNA序列中,对应于核苷酸序列位置23-1276(1274-1276:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:10中列出并且包含417个氨基酸(下文中,称为“MIG10蛋白”)。
SEQ ID NO:9的DNA序列已经以编码号AY423725储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其DNA序列与智人磷酸甘油酸激酶1基因以及智人磷酸甘油酸激酶(phosphoglycerate kinase)1(PGK1)基因的DNA序列一致,后者分别以编码号BC023234和NM_000291储存于所述数据库中。
本发明的原癌基因表达的蛋白包含417个氨基酸,而氨基酸序列在SEQ ID NO:10中列出,分子量约45kDa。
4.MIG13
本发明的原癌基因,人类迁移诱导基因13(MIG13)(下文中,称为原癌基因MIG13),具有在SEQ ID NO:13中列出的1,019bp全长DNA序列。
在SEQ ID NO:13的DNA序列中,对应于核苷酸序列位置11-844(842-844:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:14中列出并且包含277个氨基酸(下文中,称为“MIG13蛋白”)。
SEQ ID NO:13的DNA序列已经以编码号AY336090储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其部分DNA序列与Cot 25-标准化(Cot 25-normalized)智人(人类)B细胞(Ramos细胞系)的全长cDNA克隆CS0DL001YE02基因的DNA序列类似,后者以编码号CR613087储存于所述数据库中。
本发明的原癌基因表达的蛋白包含277个氨基酸,并且氨基酸序列在SEQ ID NO:14中列出,分子量约31kDa。
5.MIG14
本发明的原癌基因,人类迁移诱导基因14(MIG14)(下文中,称为原癌基因MIG14),具有在SEQ ID NO:17中列出的1,142bp全长DNA序列。
在SEQ ID NO:17的DNA序列中,对应于核苷酸序列位置67-1125(1123-1125:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:18中列出并且包含206个氨基酸(下文中,称为“MIG14蛋白”)。
SEQ ID NO:17的DNA序列已经以编码号AY336091储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),并且DNA测序结果表明其DNA序列与智人RAE1RNA输出1同系物(S.pombe)(RAE1)以及智人(人类)的Cot25标准化的胎盘(Placenta Cot 25-normalized)全长cDNA克隆CS0DI002YP18的基因的序列相同,分别以编码号NM_003610和CR626728储存于所述数据库中。
本发明的该原癌基因表达的蛋白包含352个氨基酸,并且氨基酸序列在SEQ ID NO:18中列出,分子量约39kDa。
6.MIG18
本发明的原癌基因,人类迁移诱导基因18(MIG18)(下文中,称为原癌基因MIG18),具有在SEQ ID NO:21中列出的3,633bp全长DNA序列。
在SEQ ID NO:21的DNA序列中,对应于核苷酸序列位置215-2212(2210-2212:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:22中列出并且包含665个氨基酸(下文中,称为“MIG18蛋白”)。
DNA测序结果表明本发明的原癌基因MIG18与智人SH3结构域激酶结合蛋白1(SH3KBP1)(GenBank编码号NM_031892)具有相同的蛋白质序列(Take,H.,et al.,Biochem.Biophy.Res.Comm.268:321-328,2000),后者通过结合于c-Cb1基因而发挥作用以转导表皮生长因子相关信号(Langdon,W.Y.,et al.,Proc.Natl.Acad.SciUSA 86:1168-1172,1989),但其部分DNA序列不同于智人SH3结构域激酶结合蛋白1基因的DNA序列。
本发明的该原癌基因表达的蛋白包含665个氨基酸,而氨基酸序列在SEQ ID NO:22中列出,分子量约73kDa。
7.MIG19
本发明的原癌基因,人类迁移诱导基因19(MIG19)(下文中,称为原癌基因MIG19),具有在SEQ ID NO:25中列出的4,639bp全长DNA序列。
在SEQ ID NO:25的DNA序列中,对应于核苷酸序列位置65-2965(2963-2965:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:26中列出并且包含966个氨基酸(下文中,称为“MIG19蛋白”)。
SEQ ID NO:25的DNA序列已经以编码号AY450308储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其部分蛋白质序列与智人膜组分,染色体17,表面标记物2(卵巢癌抗原CA125)(M17S2),转录变异体3基因(以编码号NM_031862储存于所述数据库中)的蛋白质序列一致,但其部分DNA序列不同于所述基因的DNA序列。
本发明的该原癌基因表达的蛋白包含966个氨基酸,而氨基酸序列在SEQ ID NO:26中列出,分子量约107kDa。
8.MIG5
本发明的原癌基因,人类迁移诱导基因5(MIG5)(下文中,称为原癌基因MIG5),具有在SEQ ID NO:29中列出的833bp全长DNA序列。
在SEQ ID NO:29的DNA序列中,对应于核苷酸序列位置159-737(735-737:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:30中列出并且包含192个氨基酸(下文中,称为“MIG5蛋白”)。
SEQ ID NO:29的DNA序列已经以编码号AY279384储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其DNA序列与智人ras相关C3肉毒杆菌毒素底物1(rho家族,小GTP结合蛋白Racl)(RAC1),转录变异体Racl基因的DNA序列一致,其分别以编码号NM 006908储存于所述数据库中。
本发明的该原癌基因表达的蛋白包含192个氨基酸,而其氨基酸序列在SEQ ID NO:30中列出,分子量约21kDa。
9.MIG7
本发明的原癌基因,人类迁移诱导基因7(MIG7)(下文中,称为原癌基因MIG7),具有在SEQ ID NO:33中列出的2,364bp的全长DNA序列。
在SEQ ID NO:33的DNA序列中,对应于核苷酸序列位置1435-1685(1683-1685:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:34中列出并且包含76个氨基酸(下文中,称为“MIG7蛋白”)。
SEQ ID NO:33的DNA序列已经以编码号AY305872储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其部分DNA序列分别与染色体14上的智人T细胞受体αδ基因座(TCRA/TCRD,以编码号NG_001332储存)、智人T细胞受体αδ基因座(全核苷酸序列的1-250529碱基)(1/5的部分)(以编码号AE000658、AE000521和U85195储存)以及智人(N6-腺苷)-甲基转移酶基因(以编码号AF283991储存于所述数据库中)的DNA序列相同。
本发明的该原癌基因表达的蛋白包含76个氨基酸,并且氨基酸序列在SEQ ID NO:34中列出,分子量约9kDa。
同时,由于密码子的简并性或者考虑到对于存活生物表达所述原癌基因的密码子的优选,本发明的原癌基因可以在编码区进行多种修饰而不改变该编码区表达的致癌蛋白的氨基酸序列,以及在不影响基因表达的范围内对编码区以外的区域进行多种修饰或改变。这种修饰基因也包括在本发明的范畴内。因此,本发明还包括具有的DNA序列与所述原癌基因以及所述原癌基因的片段基本相同的多核苷酸。术语“基本相同的多核苷酸”指的是这样的DNA,其编码相同的翻译蛋白产物且与本发明的原癌基因具有至少80%,优选至少90%,以及最优选至少95%的DNA序列同源性。
而且,在不改变所述蛋白功能的范围内,可以在所述蛋白的氨基酸序列中置换、添加或缺失一个或多个氨基酸,并且根据应用可仅使用部分蛋白。这种修饰的氨基酸序列也包括在本发明的范畴内。因此,本发明还包括具有的氨基酸序列与所述致癌蛋白以及所述蛋白的片段基本相同的多肽。术语“基本相同的多肽”指的是这样的多肽,其具有至少80%,优选至少90%,以及最优选至少95%的序列同源性。
本发明的原癌基因和蛋白可以分离自人类癌组织,或者按照已知用于合成DNA或肽的方法而合成。而且,这样制备的基因可插入本领域中已知的用于在微生物中表达的载体中,以获得表达载体,然后该表达载体可以导入恰当的宿主细胞中,例如大肠杆菌、酵母细胞等。在这种转化的宿主中,可以大量复制本发明的基因DNA或可以大量生产其蛋白。
一旦构建了该表达载体,则根据生产该基因或蛋白的宿主细胞种类,可以恰当地选择和组合表达调节序列例如启动子和终止子、自主复制序列、分泌信号等。
已证实本发明的基因为强致癌基因,能够形成肺癌,因为诸如RNA印迹的分析方法表明该基因在正常肺组织中几乎不表达,而在肺癌组织和肺癌细胞系中则过表达。而且已证明这些基因是癌症转移相关基因,能够诱导癌症转移,因为其在转移性淋巴结癌组织中表达增加。除了上皮组织例如肺癌,本发明的原癌基因也在其他癌性肿瘤组织中高度表达,例如白血病、子宫癌、淋巴瘤、结肠癌、皮肤癌等。因此,认为本发明的原癌基因是多种肿瘤生成中的共有癌基因,并且可以有效用于诊断多种癌症并生产转化的动物。
例如,利用所述原癌基因诊断癌症的方法包括这样的步骤,即所述原癌基因的全部或部分作为证明(proves)与从受试者体液中提取的核酸杂交后,通过本领域中已知的多种方法检测所述原癌基因来确定受试者是否具有本发明的原癌基因。利用放射性同位素、酶等标记的探针可以很容易证实所述基因存在于组织样品中。因此,本发明提供含有全部或部分所述原癌基因的试剂盒,用于诊断癌症。
通过将本发明的原癌基因导入哺乳动物例如啮齿类如大鼠体内,可以获得转化的动物,而且优选在至少8细胞期之前的受精卵期将所述原癌基因导入。这样制备的转化动物可以有效用于搜寻致癌物质或抗癌物质如抗氧化剂。
来自本发明的原癌基因的蛋白可有效用于产生作为诊断工具的抗体。按照本领域中已知的常规方法可以利用从本发明的原癌基因或其片段表达的蛋白产生作为单克隆抗体或多克隆抗体的本发明的抗体,因此,通过利用本领域中已知的方法,例如酶联免疫吸附试验(ELISA)、放射性免疫测定(RIA)、夹层分析法、聚丙烯酰胺凝胶上的蛋白质印迹或免疫印迹等,来确定所述蛋白是否在受试者的体液样品中表达,从而这种抗体可用来诊断癌症和癌症转移。
而且,本发明的原癌基因可用来构建以失控方式持续生长的癌细胞系,并且这种细胞系可以,例如,从利用转染了所述原癌基因的成纤维细胞在裸鼠背中形成的瘤组织而产生。这种癌细胞系可有效用于搜寻抗癌剂等。
下文将参照优选实施例来详细阐述本发明。
然而,本文中提出的阐述仅是优选实施例,仅用于说明的目的,而不限制本发明的范畴。
实施例1:肿瘤细胞的培养以及总RNA的分离
1-1:MIG3、MIG10、MIG13以及MIG14
(第一步)肿瘤细胞的培养
为了实施所述mRNA差异显示法,取得正常肺组织、并从肺癌患者得到原发性肺癌组织以及转移至右肺的癌组织,其中上述患者在外科手术之前未进行过抗癌治疗和/或放射治疗。在差异显示法中,A549(美国模式培养物收藏中心(American Type CultureCollection);ATCC号CCL-185)用作人类肺癌细胞系。
将从得到的组织获得的细胞以及A549肺癌细胞系在Waymouth′s MB 752/1培养基(Gibco)中培养,该培养基含2mM谷氨酰胺,100IU/ml青霉素,100μg/ml链霉素和10%胎牛血清(Gibco,U.S.)。本实验中采用的培养细胞处于指数生长期,且本文采用的细胞通过台盼蓝染料排阻实验表现出至少95%的生存力(Freshney,″Culture of Animal Cells:A Manual of Basic Technique″2nd Ed.,A.R.Liss,New York,1987)。
(第二步)RNA的分离和mRNA差异显示法
利用市售系统RNeasy总RNA试剂盒(Qiagen Inc.,Germany),从正常肺组织、原发性肺癌组织、转移性肺癌组织以及A549细胞(每一种均在第一步中得到)分离总RNA样品,随后利用messageclean试剂盒(GenHunter Corp.,Brookline,MA,U.S.)将DNA污染物从RNA样品中去除。
1-2:MIG8、MIG18、MIG19、MIG5以及MIG9
(第一步)肿瘤细胞的培养
为了实施所述mRNA差异显示法,从患子宫肌瘤已行子宫切除术的患者得到正常外子宫颈组织,以及从在外科手术之前未进行过抗癌治疗和/或放射治疗的子宫癌患者得到原发性宫颈肿瘤组织和转移性淋巴结肿瘤组织。在差异显示法中,CUMC-6(Kim,J.W.et al.,Gynecol.Oncol.62:230-240,1996)用作人类宫颈癌细胞系。
将从得到的组织获得的细胞以及CUMC-6细胞系在Waymouth′s MB 752/1培养基(Gibco)中培养,该培养基含2mM谷氨酰胺,100IU/ml青霉素,100μg/ml链霉素和10%胎牛血清(Gibco,U.S.)。本实验中采用的培养细胞处于指数生长期,且本文中采用的细胞通过台盼蓝排阻实验表现出至少95%的生存力(Freshney,″Culture of Animal Cells:A Manual of Basic Technique″2nd Ed.,A.R.Liss,New York,1987)。
(第二步)RNA的分离和mRNA差异显示法
利用市售系统RNeasy总RNA试剂盒(Qiagen Inc.,Germany),从正常外子宫颈组织、原发性宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6细胞(每一种均在第一步中得到)分离总RNA样品,随后利用message clean试剂盒(GenHunter Corp.,Brookline,MA,U.S.)将DNA污染物从RNA样品中去除。
实施例2:差异显示逆转录-聚合酶链反应(DDRT-PCR)
2-1:MIG3
利用稍作改良的逆转录-聚合酶链反应(RT-PCR,由Liang,P.和A.B.Pardee提出)实施差异显示逆转录。
首先,利用具有SEQ ID NO:3给出的DNA序列的锚定引物H-T11A(5-AAGCTTTTTTTTTTTC-3′,RNAimage试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1-1的第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP22(5′-AAGCTTTTGATCC-3′)实施PCR反应,而H-AP22具有随机5’11-mer引物(RNAimage引物组1-5)H-AP 1至40中SEQ ID NO:4给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在用于DNA测序的6%聚丙烯酰胺测序凝胶中,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取具有L276-811cDNA(碱基位置从SEQ ID NO:1的1862-2166)的305个碱基对(bp)条带。将切出的凝胶加热15分钟以洗脱该L276-811cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增L276-811cDNA,只是在此里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-2:MIG8
利用稍作改良的逆转录-聚合酶链反应(RT-PCR,由Liang,P.和A.B.Pardee提出)实施差异显示逆转录。
首先,利用具有SEQ ID NO:7给出的DNA序列的锚定引物H-T11C(5-AAGCTTTTTTTTTTTC-3′,RNAimage  试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1-2的第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP23(5′-AAGCTTGGCTATG-3′)实施PCR反应,其中H-AP23具有随机的5’11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQ IDNO:8给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取带有CC231cDNA(SEQ ID NO:5碱基位置3142-3483)的342个碱基对(bp)的条带。将切出的凝胶加热15分钟以洗脱该CC231cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增CC231cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-3:MIG10
首先,利用具有SEQ ID NO:11给出的DNA序列的锚定引物H-T11C(5-AAGCTTTTTTTTTTTC-3′,RNAimage  试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1-1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP23(5′-AAGCTTGGCTATG-3′)实施PCR反应,其中H-AP23具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP 1至40中SEQID NO:12给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取284个碱基对(bp)带有L789cDNA(SEQ IDNO:9的碱基位置1022-1305)的条带。将切出的凝胶加热15分钟以洗脱该L789cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增L789cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-4:MIG13
首先,利用具有SEQ ID NO:15给出的DNA序列的锚定引物H-T11C(5-AAGCTTTTTTTTTTTC-3′,RNAimage  试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP21(5′-AAGCTTTCTCTGG-3′)实施PCR反应,其中H-AP21具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO:16给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取295个碱基对(bp)带有L986cDNA(SEQ IDNO:13的碱基位置685-979)的条带。将切出的凝胶加热15分钟以洗脱该L986cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增L986cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-5:MIG14
首先,利用具有SEQ ID NO:19给出的DNA序列的锚定引物H-T11A(5-AAGCTTTTTTTTTTTA-3′,RNAimage  试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP21(5′-AAGCTTTCTCTGG-3′)实施PCR反应,其中H-AP21具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO:20给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取276个碱基对(bp)带有L1284cDNA(SEQ IDNO:17的碱基位置823-1098)的条带。将切出的凝胶加热15分钟以洗脱该L1284cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增L1284cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-6:MIG18
首先,利用具有SEQ ID NO:23给出的DNA序列的锚定引物H-T11A(5-AAGCTTTTTTTTTTTA-3′,RNAimage  试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP36(5′-AAGCTTCGACGCT-3′)实施PCR反应,其中H-AP36具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO:24给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取221个碱基对(bp)带有CA367cDNA(SEQID NO:21的碱基位置2920-3140)的条带。将切出的凝胶加热15分钟以洗脱该CA367cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增CA367cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-7:MIG19
首先,利用具有SEQ ID NO:27给出的DNA序列的锚定引物H-T11A(5-AAGCTTTTTTTTTTTA-3′,RNAimage试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP33(5′-AAGCTTGCTGCTC-3′)实施PCR反应,其中H-AP33具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO:28给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取381个碱基对(bp)带有CA335cDNA(SEQID NO:25的碱基位置4123-4503)的条带。将切出的凝胶加热15分钟以洗脱该CA335cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增CA335cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-8:MIG5
利用稍作改良的逆转录-聚合酶链反应(RT-PCR,由Liang,P.和A.B.Pardee提出)实施差异显示逆转录。
首先,利用具有SEQ ID NO:31给出的DNA序列的锚定引物H-T11G(5-AAGCTTTTTTTTTTTG-3′,RNAimage试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP26(5′-AAGCTTGCCATGG-3′)实施PCR反应,其中H-AP26具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP 1至40中SEQID NO:32给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取263个碱基对(bp)带有CG263cDNA(SEQID NO:29的碱基位置476-738)的条带。将切出的凝胶加热15分钟以洗脱该CG263cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增CG263cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-9:MIG7
利用改良的逆转录-聚合酶链反应(RT-PCR,由Liang,P.和A.B.Pardee提出)实施差异显示逆转录。
首先,利用具有SEQ ID NO:35给出的DNA序列的锚定引物H-T11G(5-AAGCTTTTTTTTTTTG-3′,RNAimage  试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP23(5′-AAGCTTGGCTATG-3′)实施PCR反应,其中H-AP23具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO:36给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取327个碱基对(bp)带有CG233cDNA(SEQID NO:33的碱基位置1903-2229)的条带。将切出的凝胶加热15分钟以洗脱该CG233cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增CG233cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
实施例3:克隆
利用TA克隆系统(Promega,U.S.),按照生产商手册将上述均已经过再次扩增的L276-811PCR产物、CC231PCR产物、L789PCR产物、L986PCR产物、L1284PCR产物、CA367PCR产物、CA335PCR产物、CG263PCR产物以及CG233PCR产物分别插入pGEM-T EASY载体中。
(第一步)连接反应
将实施例2中均已经过再次扩增的L276-811PCR产物、CC231PCR产物、L789PCR产物、L986PCR产物、L1284PCR产物、CA367PCR产物、CA335PCR产物、CG263PCR产物以及CG233PCR产物每种各2μl,pGEM-T EASY载体1μl(50ng),T4DNA连接酶(10X缓冲液)1μl以及T4DNA连接酶(3weiss单位/μl;Promega)1μl加入0.5ml试管中,并加入蒸馏水至终体积10μl。将该连接反应混合物14℃孵育过夜。
(第二步)TA克隆的转化
将E.coli JM109(Promega,WI,U.S.)在10mlLB液体培养基(10g细菌用胰蛋白胨,5g细菌用酵母提取物,5g NaCl)中孵育,直至600nm处的光密度达到约0.3-0.6。将该孵育的混合物置于冰中约10分钟,于4℃4,000rpm离心10分钟,然后弃上清并收集细胞。将收集的细胞沉淀物置于10ml 0.1M冰冷的CaCl2中约30分钟至1小时,以生成感受态细胞。将产物再次于4℃4,000rpm离心10分钟,然后弃上清、收集细胞并悬浮于2ml 0.1M冰冷的CaCl2中。
将该感受态细胞悬浮液200μl转移至新的微量离心管(microfuge)中,并向管中加入第一步中制备的连接反应产物2μl。将得到的混合物在42℃水浴中孵育90秒,然后0℃骤冷。向管中加入800μl SOC培养基(2.0g细菌用胰蛋白胨,0.5g细菌用酵母提取物,1ml 1M NaCl,0.25ml 1M KCl,97ml TDW,1ml 2M Mg2+,1ml 2M葡萄糖),然后将得到的混合物在旋转式振荡培养箱(220rpm)中37℃孵育45分钟。
用玻璃棒将25μlX-gal(储存于40mg/ml二甲基甲酰胺中)涂布于LB盘(补充了氨苄青霉素且已提前放入37℃培养箱中)上,加入25μl转化的细胞,再次用玻璃棒涂布,然后37℃孵育过夜。孵育后,选择3-4个形成的白色菌落,并将每一种选择的细胞均接种培养于补充了氨苄青霉素的LB盘上。为了构建质粒,选择认为已经分别导入连接反应产物的菌落,并在10ml高营养(terrific)液体培养基(900ml TDW,12g细菌用胰蛋白胨,24g细菌用酵母提取物,4ml甘油,0.17M KH2PO4,100ml 0.72N K2HPO4)中培养,所述连接反应产物即转化的大肠杆菌株JM109/L276-811、JM109/CC231、JM109/L789、JM109/L986、JM109/L1284、JM109/CA367、JM109/CA335、JM109/CG263和JM109/CG233。
实施例4:重组质粒DNA的分离
利用WizardTM Plus Minipreps DNA纯化试剂盒(Promega,U.S.),按照生产商手册将L276-811质粒DNA、CC231质粒DNA、L789质粒DNA、L986质粒DNA、L1284质粒DNA、CA367质粒DNA、CA335质粒DNA、CG263质粒DNA和CG233质粒DNA中的每一种从所述转化的大肠杆菌株中分离出来。
证实用限制性内切酶ECoRI处理部分每种分离的质粒DNA,通过在2%凝胶中电泳,L276-811、CC231、L789、L986、L1284、CA367、CA335、CG263和CG233的部分序列分别插入该质粒中。
实施例5:DNA测序分析
5-1:MIG3
将实施例2中得到的L276-811PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase 2.0版DNA测序试剂盒(UnitedStates Biochemical,Cleveland,OH,U.S.),将得到的L276-811PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:1的核苷酸序列位置1862-2166,其在本发明中命名为“L276-811”。
利用5′随机引物H-AP22和3′锚定引物H-T11A,对上述得到的305bp cDNA片段例如L276-811进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图1所示,差异显示(DD)表明该基因在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中差异表达。如图1可以看出,该305bp的cDNA片段L276-811在肺癌组织、转移性肺癌组织以及A549肺癌细胞中表达,但在正常肺组织中不表达。该L276-811在癌组织特别是转移性癌组织中表达最高。
5-2:MIG8
将实施例2中得到的CC231PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),将得到的CC231PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:5的核苷酸序列位置3142-3483,其在本发明中命名为“CC231”。
利用5′随机引物H-AP23和3′锚定引物H-T11C,对上述得到的342bp cDNA片段例如CC231进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图2所示,差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图2可以看出,该342bp的cDNA片段CC231在宫颈癌、转移性淋巴结组织以及CUMC-6癌细胞中表达,但在正常组织中不表达。
5-3:MIG10
将实施例2中得到的L789PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),将得到的L789PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:9的核苷酸序列位置1022-1305,其在本发明中命名为“L789”。
利用5′随机引物H-AP23和3′锚定引物H-T11C,对上述得到的284bp cDNA片段例如L789进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图3所示,差异显示(DD)表明该基因在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中差异表达。如图3可以看出,该255bp的cDNA片段L276在肺癌组织、转移性肺癌组织以及A549肺癌细胞中表达,但在正常肺组织中不表达。该L276基因在癌组织特别是转移性癌组织中表达最高。
5-4:MIG13
将实施例2中得到的L986PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),对得到的L986PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:13的核苷酸序列位置685-979,其在本发明中命名为“L986”。
利用5′随机引物H-AP21和3′锚定引物H-T11C,对上述得到的295bp cDNA片段例如L986进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图4所示,差异显示(DD)表明该基因在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中差异表达。如图4可以看出,该255bp的cDNA片段L986在肺癌组织、转移性肺癌组织以及A549肺癌细胞中表达,但在正常肺组织中不表达。该L276-811基因在癌组织特别是转移性癌组织中表达最高。
5-5:MIG14
将实施例2中得到的L1284PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),对得到的L1284PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID N0:17的核苷酸序列位置823-1098,其在本发明中命名为“L1284”。
利用5′随机引物H-AP21和3′锚定引物H-T11A,对上述得到的276bp cDNA片段例如L1284进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图5所示,差异显示(DD)表明该基因在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中差异表达。如图5可以看出,该276bp的cDNA片段L1284在肺癌组织、转移性肺癌组织以及A549肺癌细胞中表达,但在正常肺组织中不表达。该L1284基因在癌组织特别是转移性癌组织中表达最高。
5-6:MIG18
将实施例2中得到的CA367PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),对得到的CA367PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:21的核苷酸序列位置2920-3140,其在本发明中命名为“CA367”。
利用5′随机引物H-AP36和3′锚定引物H-T11A,对上述得到的221bp cDNA片段例如CA367进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图6所示,差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图6可以看出,该221bp的cDNA片段CA367在宫颈癌组织、转移性淋巴结组织以及CUMC-6癌细胞中表达,但在正常组织中不表达。
5-7:MIG19
将实施例2中得到的CA335PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),对得到的CA335PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:25的核苷酸序列位置4123-4503,其在本发明中命名为“CA335”。
利用5′随机引物H-AP33和3′锚定引物H-T11A,对上述得到的381bp cDNA片段例如CA335进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图7所示,差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图7可以看出,该381bp的cDNA片段CA335在宫颈癌组织、转移性淋巴结组织以及CUMC-6癌细胞中表达,但在正常组织中不表达。
5-8:MIG5
将实施例2中得到的CG263PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),对得到的CG263PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:29的核苷酸序列位置476-738,其在本发明中命名为“CG263”。
利用5′随机引物H-AP26和3′锚定引物H-T11G,对上述得到的263bp cDNA片段例如CG263进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图8所示,差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图8可以看出,该263bp的cDNA片段CG263在宫颈癌组织、转移性淋巴结组织以及CUMC-6癌细胞中表达,但在正常组织中不表达。
5-9:MIG7
将实施例2中得到的CG233PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),对得到的CG233PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:33的核苷酸序列位置1903-2229,其在本发明中命名为“CG233”。
利用5′随机引物H-AP23和3′锚定引物H-T11G,对上述得到的327bp cDNA片段例如CG233进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图9所示,差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图9可以看出,该327bp的cDNA片段CG233在宫颈癌组织、转移性淋巴结组织以及CUMC-6癌细胞中表达,但在正常组织中不表达。
实施例6:全长原癌基因的cDNA序列分析
6-1:MIG3
32P标记的L276-811用作探针来筛查噬菌体λgt11人胚肺成纤维细胞(lung embryonic fibroblast)cDNA文库(Miki,T.et al.,Gene83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG3cDNA克隆,其中2295bp片段插入pCEV-LAC载体中,然后于2003年2月19日以编码号AY239293储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG3克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG3基因的pCEV-LAC载体,以获得MIG3质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
在SEQ ID NO:1的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置89-709,并且编码由SEQ ID NO:2的206个氨基酸组成的蛋白。
6-2:MIG8
32p-标记的CC231用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG8cDNA克隆,其中3737bp片段插入pCEV-LAC载体中,然后于2003年6月1日以编码号AY311389储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG8克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG8基因的pCEV-LAC载体,以获得MIG8质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
MIG18(8)的全长DNA序列由3737bp组成,并在SEQ ID NO:5中列出。
在SEQ ID NO:5的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置113-1627,并且编码由SEQ ID NO:6的504个氨基酸组成的蛋白。
6-3:MIG10
32p-标记的L789用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG10cDNA克隆,其中1321bp片段插入pCEV-LAC载体中,然后于2003年9月26日以编码号AY423725储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG10克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG10基因的pCEV-LAC载体,以获得MIG10质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
在SEQ ID NO:9的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置23-1276,并且编码由SEQ ID NO:10的417个氨基酸组成的蛋白。
6-4:MIG13
32P-标记的L986用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG13cDNA克隆,其中1019bp片段插入pCEV-LAC载体中,然后于2003年7月7日以编码号AY336090储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG13克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG13基因的pCEV-LAC载体,以获得MIG13质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
在SEQ ID NO:13的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置11-844,并且编码由SEQ ID NO:14的277个氨基酸组成的蛋白。
6-5:MIG14
32p-标记的L1284用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG14cDNA克隆,其中1142bp片段插入pCEV-LAC载体中,然后于2003年7月4日以编码号AY336091储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG14克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG14基因的pCEV-LAC载体,以获得MIG14质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
在SEQ ID NO:17的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置67-1125,并且编码由SEQ IDNO:18的352个氨基酸组成的蛋白。
6-6:MIG18
32P-标记的CA367用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG18cDNA克隆,其中3633bp片段插入pCEV-LAC载体中,然后于2003年9月30日以编码号AY423734储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG18克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG18基因的pCEV-LAC载体,以获得MIG18质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
MIG18的全长DNA序列由3633bp组成,并在SEQ ID NO:21中列出。
在SEQ ID NO:21的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置215-2212,并且编码由SEQ IDNO:22的665个氨基酸组成的蛋白。
6-7:MIG19
32P-标记的CA335用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG19cDNA克隆,其中4639bp片段插入pCEV-LAC载体中,然后于2003年10月26日以编码号AY450308储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG19克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG19基因的pCEV-LAC载体,以获得MIG19质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
MIG19的全长DNA序列由4639bp组成,并在SEQ ID NO:25中列出。
在SEQ ID NO:25的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置65-2965,并且编码由SEQ IDNO:26的966个氨基酸组成的蛋白。
6-8:MIG5
32P-标记的CG263用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG5cDNA克隆,其中833bp片段插入pCEV-LAC载体中,然后于2003年4月19日以编码号AY279384储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG5克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG5基因的pCEV-LAC载体,以获得MIG5质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
MIG5的全长DNA序列由833bp组成,并在SEQ ID NO:29中列出。
在SEQ ID NO:29的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置159-737,并且编码由SEQ IDNO:30的192个氨基酸组成的蛋白。
6-9:MIG7
32P-标记的CG233用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG7cDNA克隆,其中2364bp片段插入pCEV-LAC载体中,然后于2003年5月24日以编码号AY305872储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG7克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG7基因的pCEV-LAC载体,以获得MIG7质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
MIG7的全长DNA序列由2364bp组成,并在SEQ ID NO:33中列出。
在SEQ ID NO:33的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置1435-1665,并且编码由SEQ IDNO:4(34)的76个氨基酸组成的蛋白。
实施例7:多种细胞中的基因的RNA印迹分析
7-1:MIG3,MIG10,MIG13以及MIG14
以与实施例1中相同的方式从正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358(美国模式培养物收藏中心;ATCC No.CRL-5807)肺癌细胞系中提取总RNA样品。
为了确定MIG3、MIG10、MIG13和MIG14基因中每一种的表达水平,将从所述组织和细胞系每一种提取的变性总RNA样品每种各20μg在1%甲醛琼脂糖凝胶中电泳,然后将得到的琼脂糖凝胶转移至尼龙膜(Boehringer-Mannheim,Germany)上。将印迹与32P标记的并随机预处理的全长MIG cDNA探针杂交,其中探针是利用Rediprime II随机prime标记系统((Amersham,UnitedKingdom)所制备。该RNA印迹分析重复两次,因此用密度计对得到的印迹加以定量并用β-肌动蛋白进行标准化。
图10(a)示出了RNA印迹结果,以确定MIG3原癌基因是否在正常肺组织、肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中表达。如图10(a)中所示,表明MIG3原癌基因的表达水平在肺癌组织、转移性肺癌组织以及A549和NCI-H358肺癌细胞系中显著增加,但在正常肺组织中很低或未检测到。图10(a)中,泳道“正常”表示正常肺组织,泳道“癌”表示肺癌组织,泳道“转移”表示转移性肺癌组织,以及泳道“A549”和“NCI-H358”每一种均表示肺癌细胞系。图10(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图24(a)示出了RNA印迹结果,以确定MIG3原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图24(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图24(a)中所示,MIG3mRNA转录物(大约4.0kb)在正常组织中微弱表达。
图38(a)示出了RNA印迹结果,以确定MIG3原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图38(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如38(a)中所示,表明MIG3原癌基因在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。
图13(a)示出了RNA印迹结果,以确定MIG10原癌基因是否在正常肺组织、肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中表达。如图13(a)中所示,表明MIG10原癌基因的表达水平在肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中显著增加,但在正常肺组织中很低或未检测到。图13(a)中,泳道“正常”表示正常肺组织,泳道“癌”表示肺癌组织,泳道“转移”表示转移性肺癌组织,以及泳道“A549”和“NCI-H358”每一种均表示肺癌细胞系。图13(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图27(a)示出了RNA印迹结果,以确定MIG10原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图27(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图27(a)中所示,MIG10mRNA转录物(大约2.0kb)在正常组织中极微弱表达。
图41(a)示出了RNA印迹结果,以确定MIG10原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图41(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如41(a)中所示,表明MIG10原癌基因在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。还可以观察到除了2.0kb的mRNA转录物以外,还表达约2.4kb的mRNA转录物。
图14(a)示出了RNA印迹结果,以确定MIG13原癌基因是否在正常肺组织、肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中表达。如图14(a)中所示,表明MIG13原癌基因的表达水平在肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中显著增加,但在正常肺组织中很低或未检测到。图14(a)中,泳道“正常”表示正常肺组织,泳道“癌”表示肺癌组织,泳道“转移”表示转移性肺癌组织,以及泳道“A549”和“NCI-H358”每一种均表示肺癌细胞系。图14(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图28(a)示出了RNA印迹结果,以确定MIG13原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图28(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图28(a)中所示,MIG13mRNA转录物(大约1.7kb的优势转录物以及1.4kb的转录物)在正常组织中表达极微弱或未检测到。
图42(a)示出了RNA印迹结果,以确定MIG13原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图42(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图42(a)中所示,表明MIG13mRNA转录物(大约1.7kb的优势转录物以及1.4kb的转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。
图15(a)示出了RNA印迹结果,以确定MIG14原癌基因是否在正常肺组织、肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中表达。如图15(a)所示,表明MIG14原癌基因的表达水平在肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中显著增加,但在正常肺组织中很低或未检测到。图15中,泳道“正常”表示正常肺组织,泳道“癌”表示肺癌组织,泳道“转移”表示转移性肺癌组织,以及泳道“A549”和“NCI-H358”每一种均表示肺癌细胞系。图15(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图29(a)示出了RNA印迹结果,以确定MIG14原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图29(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图29(a)所示,MIG14mRNA转录物(大约1.3kb的优势转录物以及2kb的转录物)在正常组织中表达极微弱或未检测到。
图43(a)示出了RNA印迹结果,以确定MIG14原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图43(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如43(a)所示,表明MIG14mRNA转录物(大约1.3kb的优势转录物以及2kb的转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。
7-2:MIG8,MIG18,MIG19,MIG5以及MIG7
以与实施例1中相同的方式从正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系CaSki(ATCC CRL 1550)和CUMC-6中提取总RNA样品。
为了确定MIG8、MIG18、MIG19、MIG5和MIG7基因中每一种的表达水平,将从所述组织和细胞系每一种提取的变性总RNA样品每种各20μg在1%甲醛琼脂糖凝胶中电泳,然后将得到的琼脂糖凝胶转移至尼龙膜(Boehringer-Mannheim,Germany)上。将印迹与32P标记的并随机预处理的(primed)全长MIG cDNA探针杂交,其中探针是利用Rediprime II随机prime标记系统(Amersham,United Kingdom)所制备。该RNA印迹分析重复两次,因此用密度计对得到的印迹加以定量并用β-肌动蛋白进行标准化。
图11示出了RNA印迹结果,以确定MIG8原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaSki和CUMC-6)中表达。如图11所示,表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG8原癌基因的表达水平增加,即过表达约4.0kb的优势MIG8mRNA转录物和约1.3kb的MIG8mRNA转录物,而且特别在转移性宫颈淋巴结组织中MIG8原癌基因表达最高,但在正常组织中表达极低。图11中,泳道“正常”表示正常外子宫颈组织,泳道“癌”表示宫颈癌组织,泳道“转移”表示转移性宫颈淋巴结组织,以及泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图12示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图25示出了RNA印迹结果,以确定MIG8原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图26示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图25所示,MIG8mRNA转录物(约4.0kb的优势MIG8mRNA转录物和约1.3kb的MIG8mRNA转录物)在正常组织例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞中微弱表达。
图39示出了RNA印迹结果,以确定MIG8原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图40示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图39所示,表明MIG8mRNA转录物(大约4.0kb的优势MIG8mRNA转录物以及约1.3kb的MIG8mRNA转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。但在皮肤癌细胞系G361中不表达约1.3kb的MIG8mRNA转录物。
图16示出了RNA印迹结果,以确定MIG18原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaSki和CUMC-6)中表达。如图16所示,表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG18原癌基因的表达水平增加,而且特别在转移性宫颈淋巴结组织中MIG18原癌基因表达最高,但在正常组织中表达极低。图16和17中,泳道“正常”表示正常外子宫颈组织,泳道“癌”表示宫颈癌组织,泳道“转移”表示转移性宫颈淋巴结组织,以及泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图17示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图30示出了RNA印迹结果,以确定MIG18原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图31示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图30所示,MIG18mRNA转录物(大约4.0kb)在正常组织例如心脏、肌肉和肝脏中微弱表达。
图44示出了RNA印迹结果,以确定MIG18原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图45示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图44所示,表明MIG18mRNA转录物在HeLa子宫癌细胞系和慢性髓细胞源性白血病细胞系K-562中表达极高,以及在前髓细胞白血病细胞系HL-60、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中以增高的水平表达。
图18示出了RNA印迹结果,以确定MIG19原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaS ki和CUMC-6)中表达。如图18所示,表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG19原癌基因的表达水平增加,即过表达约4.7kb的优势MIG19mRNA转录物,而且特别在转移性宫颈淋巴结组织中MIG19原癌基因表达最高,但在正常组织中表达极低。图18和19中,泳道“正常”表示正常外子宫颈组织,泳道“癌”表示宫颈癌组织,泳道“转移”表示转移性宫颈淋巴结组织,泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图19示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图32示出了RNA印迹结果,以确定MIG19原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图33示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图32所示,MIG19mRNA转录物(大约4.7kb的优势mRNA转录物)在正常组织例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞中表达微弱或未检测到。
图46示出了RNA印迹结果,以确定MIG19原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图47示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图46所示,表明MIG19mRNA转录物(大约4.7kb的优势MIG19mRNA转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中以极度增高的水平表达。但在皮肤癌细胞系G361中不表达约1.3kb的MIG8mRNA转录物。
图20示出了RNA印迹结果,以确定MIG5原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaSki和CUMC-6)中表达。
如图20所示,表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG5原癌基因的表达水平增加,即过表达约5.5kb的优势MIG5mRNA转录物,而且特别在转移性宫颈淋巴结组织中MIG5原癌基因表达最高,但在正常组织中不表达。图20和21中,泳道“正常”表示正常外子宫颈组织,泳道“癌”表示宫颈癌组织,泳道“转移”表示转移性宫颈淋巴结组织,以及泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图21示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图34示出了RNA印迹结果,以确定MIG5原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图35示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图34所示,MIG5mRNA转录物(大约5.5kb的优势mRNA转录物)在正常组织例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞中不表达。
图48示出了RNA印迹结果,以确定MIG5原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图49示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图48所示,表明MIG5mRNA转录物(大约5.5kb的优势mRNA转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中以极度增高的水平表达。但在皮肤癌细胞系G361中不表达约1.3kb的MIG8mRNA转录物。
图22示出了RNA印迹结果,以确定MIG19原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaSki和CUMC-6)中表达。如图22所示,表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG7原癌基因的表达水平增加,即过表达约10kb的优势MIG7mRNA转录物,而且特别在转移性宫颈淋巴结组织中MIG7原癌基因表达最高,但在正常组织中表达极低。图22和23中,泳道“正常”表示正常外子宫颈组织,泳道“癌”表示宫颈癌组织,泳道“转移”表示转移性宫颈淋巴结组织,以及泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图23示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图36示出了RNA印迹结果,以确定MIGl9原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图37示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图36所示,MIG7mRNA转录物(大约10kb的优势mRNA转录物)在正常组织例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞中表达微弱或检测不到。
图50示出了RNA印迹结果,以确定MIG7原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图51示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图50所示,表明MIG7mRNA转录物(大约10kb的优势mRNA转录物)在HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480以及肺癌细胞系A549中以极度增高的水平表达。
实施例8:确定用原癌基因转化大肠杆菌后所表达蛋白的大小
将全长MIG原癌基因的每一种例如SEQ ID NO:1的MIG3、SEQ ID NO:5的MIG8、SEQ ID NO:9的MIG10、SEQ ID NO:13的MIG13、SEQ ID NO:17的MIG14、SEQ ID NO:21的MIG18、SEQ ID NO:25的MIG 19、SEQ ID NO:29的MIG 5、以及SEQ IDNO:33的MIG 7均插入pBAD/thio-Topo载体(Invitrogen,U.S.)的多克隆位点,然后用得到的每一种pBAD/thio-Topo/MIG载体转化大肠杆菌Top10(Invitrogen,U.S.)。将表达蛋白HT-硫氧还蛋白插入pBAD/thio-Topo载体多克隆位点的上游区域。将每一种转化的大肠杆菌株在LB液体培养基中振荡孵育,然后将每一种得到的培养物以1/100的比例稀释,孵育3小时,并加入0.5mM L-阿拉伯糖(Sigma),以促进蛋白生成。
L-阿拉伯糖诱导(induction)前/后,对培养物中的大肠杆菌细胞进行超声处理,然后对超声处理的匀浆进行12%十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)。
图52示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG3载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约38kDa分子量的融合蛋白条带。该38kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约23kDa分子量的MIG3蛋白,每种蛋白均插入pBAD/thio-Topo/MIG3载体中。
图53示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG8载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约72kDa分子量的融合蛋白条带。该72kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约57kDa分子量的MIG8蛋白,每种蛋白均插入pBAD/thio-Topo/MIG8载体中。
图54示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG10载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约60kDa分子量的融合蛋白条带。该60kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约45kDa分子量的MIG10蛋白,每种蛋白均插入pBAD/thio-Topo/MIG10载体中。
图55示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG13载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约46kDa分子量的融合蛋白条带。该46kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约31kDa分子量的MIG13蛋白,每种蛋白均插入pBAD/thio-Topo/MIG13载体中。
图56示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG14载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约54kDa分子量的融合蛋白条带。该54kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约39kDa分子量的MIG14蛋白,每种蛋白均插入pBAD/thio-Topo/MIG14载体中。
图57示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG18载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约88kDa分子量的融合蛋白条带。该88kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约73kDa分子量的MIG18蛋白,每种蛋白均插入pBAD/thio-Topo/MIG18载体中。
图58示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG19载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约122kDa分子量的融合蛋白条带。该122kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约107kDa分子量的MIG19蛋白,每种蛋白均插入pBAD/thio-Topo/MIG19载体中。
图59示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG5载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约36kDa分子量的融合蛋白条带。该36kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约21kDa分子量的MIG5蛋白,每种蛋白均插入pBAD/thio-Topo/MIG5载体中。
图60示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG7载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约24kDa分子量的融合蛋白条带。该24kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约9kDa分子量的MIG7蛋白,每种蛋白均插入pBAD/thio-Topo/MIG7载体中。
工业应用
如上所述,本发明的原癌基因是参与人类致癌作用同时具有诱导癌症转移能力的新基因,可有效用于诊断癌症,包括肺癌、白血病、子宫癌、淋巴瘤、结肠癌、皮肤癌等,还用于产生转化的动物等。
                          序  列  表
<110>金弦起(KIM,HYUN KEE)
<120>人类原癌基因及其编码的蛋白(HUMAN PROTOONCOGENE AND PROTEIN ENCODEDTHEREIN)
<160>36
<170>KopatentIn 1.71
<210>1
<211>2295
<212>DNA
<213>Homo sapiens
<400>1
aaagtctgcc tctctagcta caacatttct tcaagaaaag aaagcagaag cccagaatca     60
taatcgtgtc cctgatgtaa aggcattaat ggagagtccc gagggacagt tatctctgga    120
gcccaaatct gatagtcact tccaagcatc acacactggg tgccagagcc ctttatgttc    180
agcccagcgt cacactcctc agagcccctt caccaatcat gctgcagctg ctggcaggaa    240
gactcttcgc agctgcatgg ggctggagtg gtttccagag ctctatcctg gttaccttgg    300
actaggggtg ttgccaggga agcctcagtg ttggaatgca atgacccaga agccacaact    360
tatcagtccc cagggggaaa gactctcgca agtttctttg ttggaacgaa gctcaactca    420
tataaggagt ttggaacccc ctaccggact tacaacctcc aacttctctc taatgaggct    480
cttgggagct gtacaaaaag gctggatcag gtgcaacacc accataagga agagtggatt    540
cggtggcatc acgatgctct tcacaggata cttcgtcctg tgttgtagct ggagtttcag    600
acgtctgaaa aaattgtgcc gacccctgcc ctggaagagc acagtacctc catgcattgg    660
tgtggcgaag acgactgggg attgccgctc taaaacatgt ttggattagg aagcacgttt    720
aagtaggaga agccttcgtg acttctctct agtgccttcg tgccctgtgt tgcccactga    780
attgccctgt aacacctaag tgtagtggta gcattaaggg atagcttttc agccctcaag    840
gttatcagga gcatttgtat cactgctata aataaagtag tatcacttgt cataatcagg    900
gtgctgaaac ataatgaaaa ggtttaactt agtcacagta aatattttat atccctgaaa    960
ataagttatt taatgagaat agaactattt aatgatccat gagtcctaaa aggatatctg   1020
ccttgtattg ccaagtttaa ggcaaaggtg agatcctgta ttaataagaa gacagctttt   1080
ttgtttgaca ttggtaagta ccaagaattc taactcacat atagtaggaa acaacaaaaa   1140
gtctccactg acttctttga attagatact gagaatccac aatacagtag tgtggataac   1200
tttcaagaag ccattggaaa catctccaca ttctgggatg acttgtaaat gtctacagag   1260
taatggaagg aaaggcttcc ttgtctgctc attgctgcca cctgggttgg gaaaataatt    1320
gaagatgttt tctcaagtcc ttcaagaatc tcttcttaat gttcagaata gtttaagagc    1380
gttgttgagg taaagtgata gctgattatt ttctgagatt tagatctaaa caaactcagc    1440
atgacgagga agcacacttc acagctccag ggtgcaatac tgatgtaaag ttgcctcgtg    1500
aggatacatt tttcgctcat gtatgcaaaa ttcctatcag ttcatttgca cagccagttc    1560
caatcatgta tgtgatcacc agattaaaag cttcatccag aaagacaaga ctcctcagaa    1620
cgaatagtag acaagtaaga ctgctaccca cagaagccag tacgcttcag gtgtgaggcg    1680
gggtaactac tcatctcttc acagagccaa ggaaagaaaa agaacgtctc taacatgatt    1740
taccatttta aacagcctta taagttttgt ctcttaaaat catgctgcag aaggaggggg    1800
taaaagtcgt gttctgccct gtctgtggca ttggagtgcc ccgctaggta agaagcaatg    1860
cttagatctt gcttccaggc agcagcttga attcccgaat cttcctgcaa ggtgcataca    1920
aatgcagcgt gagaatccat acacgtaatc catattcacc ttcccatcca tcccgcagaa    1980
gaggcatggt gacacccagg ctactgtcca tgcttgagag gacgtatttg aaggttctgt    2040
tactacaagt tgggaatatt cacggacatg cctgaatacc ccggctgtaa ctcacacgtg    2100
gtctgtgtaa gtggattaac ctcggggcgg ccttgtttaa tcctgaataa tatctgaaag    2160
actgagttta cttgggaatg tgtagttttt ctaatgcaca ttaaaattta ttttagctgt    2220
taaaaataaa atcattttat tatcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa    2280
aaaaaaaaaa aaaaa                                                     2295
<210>2
<211>206
<212>PRT
<213>Homo sapiens
<400>2
Met Glu Ser Pro Glu Gly Gln Leu Ser Leu Glu Pro Lys Ser Asp Ser
1                 5                  10                  15
His Phe Gln Ala Ser His Thr Gly Cys Gln Ser Pro Leu Cys Ser Ala
             20                  25                  30
Gln Arg His Thr Pro Gln Ser Pro Phe Thr Asn His Ala Ala Ala Ala
         35                  40                  45
Gly Arg Lys Thr Leu Arg Ser Cys Met Gly Leu Glu Trp Phe Pro Glu
     50                  55                  60
Leu Tyr Pro Gly Tyr Leu Gly Leu Gly Val Leu Pro Gly Lys Pro Gln
 65                  70                  75                  80
Cys Trp Asn Ala Met Thr Gln Lys Pro Gln Leu Ile Ser Pro Gln Gly
                 85                  90                  95
Glu Arg Leu Ser Gln Val Ser Leu Leu Glu Arg Ser Ser Thr His Ile
            100                 105                 110
Arg Ser Leu Glu Pro Pro Thr Gly Leu Thr Thr Ser Asn Phe Ser Leu
        115                 120                 125
Met Arg Leu Leu Gly Ala Val Gln Lys Gly Trp Ile Arg Cys Asn Thr
    130                 135                 140
Thr Ile Arg Lys Ser Gly Phe Gly Gly Ile Thr Met Leu Phe Thr Gly
145                 150                 155                 160
Tyr Phe Val Leu Cys Cys Ser Trp Ser Phe Arg Arg Leu Lys Lys Leu
                165                 170                 175
Cys Arg Pro Leu Pro Trp Lys Ser Thr Val Pro Pro Cys Ile Gly Mal
            180                 185                 190
Ala Lys Thr Thr Gly Asp Cys Arg Ser Lys Thr Cys Leu Asp
        195                 200                 205
<210>3
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11A Primer
<400>3
aagctttttt tttttc                                                                16
<210>4
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP22 primer
<400>4
aagcttttga tcc                                                                   13
<210>5
<211>3737
<212>DNA
<213>Homo sapiens
<400>5
cggcagctgg aggtgtaata gtgcgggtag tgggtttgga gaagttccga ggcggcggtg     60
gcgccggtca ggacaaggat agcggaaccg ggccctgggc ttgtcgctca ccatgccgac    120
agtagaggag ctttaccgca attatggcat cctggccgat gccacggagc aagtgggcca    180
gcataaagat gcctatcaag tgatattgga tggtgtgaaa ggtggtacta aggaaaagcg    240
attagcagct caatttattc cgaaattctt taagcatttt ccagaattgg ctgattctgc    300
tatcaatgca cagttagacc tctgtgagga tgaagatgta tctattcgac gtcaagcaat    360
taaagaactg cctcaatttg ccactggaga aaatcttcct cgagtggcag atatactaac    420
gcaacttttg cagacagatg actctgcaga atttaaccta gtgaacaatg ccctattaag    480
tatatttaaa atggatgcaa aagggacttt aggtgggttg ttcagccaaa tacttcaagg    540
agaggacatt gttagagaac gagcaattaa attcctttct acaaaactta agactttacc    600
agatgaagtc ttaacaaagg aagtggaaga gcttatacta actgaatcca aaaaggtcct    660
agaagatgtg actggtgaag aatttgttct atttatgaag atactgtctg ggttaaaaag    720
cttacagaca gtgagtggaa gacagcaact tgtagagttg gtggctgaac aggccgacct    780
agaacagacc ttcaatccct cggatcctga ctgtgtggac aggctcttac agtgcactcg    840
gcaggcagta cccctcttct ctaaaaatgt ccattccaca aggtttgtga catatttctg    900
tgagcaggtt ctccctaacc tcggtacctt gactacccca gtggaaggtc ttgatataca    960
gttggaggta ttgaaattgt tggcggagat gagttcattt tgtggtgaca tggaaaaact   1020
agaaacaaat ttaaggaaac tatttgataa gttattggaa tacatgcccc tccctccaga   1080
agaggcagaa aatggagaga atgctggtaa tgaagaaccc aagctacagt tcagttatgt   1140
ggaatgtttg ttgtacagtt ttcaccagtt gggccgaaaa cttccagatt tcttaacagc   1200
caaactgaat gcagaaaagc tcaaagattt caaaatcagg ctgcagtact ttgcacgggg   1260
cctgcaagtt tatatcagac aacttcgctt agctctccag ggtaaaacgg gtgaggcctt   1320
aaaaacagaa gagaacaaga ttaaagtcgt tgcattgaaa ataacaaaca atatcaatgt   1380
tttaatcaag gatctcttcc acattcctcc ttcttataag agcacagtaa cactatcctg   1440
gaaacctgta caaaaggttg agattgggca aaagagagcc agtgaagata caacttcagg   1500
ttcaccaccc aagaaatctt cagcaggacc aaaaagagat gccaggcaga tttataaccc    1560
tcccagtggg aaatatagca gcaatttggg caactttaat tatgagagga gccttcaggg    1620
gaagtagagg tggccgaggt tggggcacac gaggaaatcg tagtcgggga agactctact    1680
gaataagaca tcagcattct tcagcattgt catgagctta atatacttaa attctactac    1740
tcattggatt gccggggatg tccctttaaa cagactgctg ccttcagcta aaaacttaat    1800
gttctttata cctttgtatg tatgacctac ttttgtaaca gaccatggtt gtgtccaagg    1860
taaaaccaca gtgatatttt tggatgcttt gtctgcaatc ttgacttgtt tttgcagtat    1920
cattattcag acttcaaatt gtgaatcttt taaacatctt gataatttgt tgttgagagc    1980
tgttcattct aaaatgtaat gaaattcagt ctagttctgc tgataaagat catcagtttt    2040
gaaaggttac tgattttcct cttccctctt agttttttac ccaatatatg gagaagagta    2100
atggtcaatc ttaacatttt gttttaattg tttaataaag ctgctgggca gtggtgcagc    2160
attcctacct agtgtcataa aagcaaaata cttacatagc tttcttaaaa tataggaatg    2220
acattacatt tttaggagaa agtaagttgc tttgcaccgc ctacttaatt cttttccata    2280
tattgtgata caaacttttg aatatggaat cttactattt gaatagaaat gtgtatgtat    2340
aatatacata catacataag catatatgtg tgtgtgtgtg tgtatatata tatatatgca    2400
tgctgtgaaa cttgactaca caacataaat cactttttaa attccaggaa cgggtagtct    2460
gacacggtga ttatcctttt gaggctgaat ccgttattaa cttgttattt aggtttttac    2520
tcccagtagc aagggattct aagttagttg cacttacatg attattgtta tttaaaacta    2580
agaataaagg ctgcattttc aaagataaat tggaattgct gttggtgaaa taacaaccaa    2640
aatactgaat ctgatgtaca tacaggtttc tacaggaaga gatggtataa tttacaattt    2700
ggagatttaa taaccagggc tacccagaaa aagtgacttg ataacatggt accaataagt    2760
aagggatgct ctctcggttt gcttttgcca ctttcaagat tttaacttct caggttatta    2820
atcaaaatta ttgtataagt tagccaatag aatttttagg ttaaaacaac agatgggggg    2880
tttgtggagt gtttaatgtc atgggcattt ttagtagcat agaccctttg ttctgcattt    2940
gaatgtttcg tatatttttg tttcacagtt aatcttccct ccccaagttt gctattcaaa    3000
tcaactgcct gaatgacatt tctagtagtc tgatgtattt ttctgaggaa tagtttgtga    3060
ttccaatgca ggtgtcttca ttaccattac ctctacactg cagaagaagc aaaactcctt    3120
tattagaatt actgcacatg tgtatgggga aaatagttct gaaaggctag aatgatacaa    3180
gtgagcaaaa gttggtcagc ttggctatgg agtggtggca ataatctcta aacattccaa    3240
aagaccatga gctgaaccta aactcccttg gaatctgaac aaaggaatat aaaattgcca    3300
tttgaaaact gaccagctaa tctggacctc agagatagat cagccagtgg cccaaagcca    3360
tttcaagtac agaaattata gagactacag ctaaataaat ttgaacatta aatataattt    3420
taccactttt tgtctttata agcatatttg taaactcaga actgagcaga agtgacttta    3480
ctttctcaag tttgatactg agttgactgt tcccttatcc ctcacccttc cccttccctt    3540
tcctaaggca atagtgcaca acttaggtta tttttgcttc cgaatttgaa tgaaaaactt    3600
aatgccatgg atttttttct tttgcaagac acctgtttat catcttgttt aaatgtaaat    3660
gtccccttat gcttttgaaa taaatttcct tttgtaattt taaaaaaaaa aaaaaaaaaa    3720
aaaaaaaaaa aaaaaaa                                                   3737
<210>6
<211>504
<212>PRT
<213>Homo sapiens
<400>6
Met Pro Thr Val Glu Glu Leu Tyr Arg Asn Tyr Gly Ile Leu Ala Asp
  1               5                  10                  15
Ala Thr Glu Gln Val Gly Gln His Lys Asp Ala Tyr Gln Val Ile Leu
             20                  25                  30
Asp Gly Val Lys Gly Gly Thr Lys Glu Lys Arg Leu Ala Ala Gln Phe
         35                  40                  45
Ile Pro Lys Phe Phe Lys His Phe Pro Glu Leu Ala Asp Ser Ala Ile
     50                  55                  60
Asn Ala Gln Leu Asp Leu Cys Glu Asp Glu Asp Val Ser Ile Arg Arg
 65                  70                  75                  80
Gln Ala Ile Lys Glu Leu Pro Gln Phe Ala Thr Gly Glu Asn Leu Pro
                 85                  90                  95
Arg Val Ala Asp Ile Leu Thr Gln Leu Leu Gln Thr Asp Asp Ser Ala
            100                 105                 110
Glu Phe Asn Leu Val Asn Asn Ala Leu Leu Ser Ile Phe Lys Met Asp
        115                 120                 125
Ala Lys Gly Thr Leu Gly Gly Leu Phe Ser Gln Ile Leu Gln Gly Glu
    130                 135                 140
Asp Ile Val Arg Glu Arg Ala Ile Lys Phe Leu Ser Thr Lys Leu Lys
145                 150                 155                 160
Thr Leu Pro Asp Glu Val Leu Thr Lys Glu Val Glu Glu Leu Ile Leu
                165                 170                 175
Thr Glu Ser Lys Lys Val Leu Glu Asp Val Thr Gly Glu Glu Phe Val
            180                 185                 190
Leu Phe Met Lys Ile Leu Ser Gly Leu Lys Ser Leu Gln Thr Val Ser
        195                 200                 205
Gly Arg Gln Gln Leu Val Glu Leu Val Ala Glu Gln Ala Asp Leu Glu
    210                 215                 220
Gln Thr Phe Asn Pro Ser Asp Pro Asp Cys Val Asp Arg Leu Leu Gln
225                 230                 235                 240
Cys Thr Arg Gln Ala Val Pro Leu Phe Ser Lys Asn Val His Ser Thr
                245                 250                 255
Arg Phe Val Thr Tyr Phe Cys Glu Gln Val Leu Pro Asn Leu Gly Thr
            260                 265                 270
Leu Thr Thr Pro Val Glu Gly Leu Asp Ile Gln Leu Glu Val Leu Lys
        275                 280                 285
Leu Leu Ala Glu Met Ser Ser Phe Cys Gly Asp Met Glu Lys Leu Glu
    290                 295                 300
Thr Asn Leu Arg Lys Leu Phe Asp Lys Leu Leu Glu Tyr Met Pro Leu
305                 310                 315                 320
Pro Pro Glu Glu Ala Glu Asn Gly Glu Asn Ala Gly Asn Glu Glu Pro
                325                 330                 335
Lys Leu Gln Phe Ser Tyr Val Glu Cys Leu Leu Tyr Ser Phe His Gln
            340                 345                 350
Leu Gly Arg Lys Leu Pro Asp Phe Leu Thr Ala Lys Leu Asn Ala Glu
        355                 360                 365
Lys Leu Lys Asp Phe Lys Ile Arg Leu Gln Tyr Phe Ala Arg Gly Leu
    370                 375                 380
Gln Val Tyr Ile Arg Gln Leu Arg Leu Ala Leu Gln Gly Lys Thr Gly
385                 390                 395                 400
Glu Ala Leu Lys Thr Glu Glu Asn Lys Ile Lys Val Val Ala Leu Lys
                405                 410                 415
Ile Thr Asn Asn Ile Asn Val Leu Ile Lys Asp Leu Phe His Ile Pro
            420                 425                 430
Pro Ser Tyr Lys Ser Thr Val Thr Leu Ser Trp Lys Pro Val Gln Lys
        435                 440                 445
Val Glu Ile Gly Gln Lys Arg Ala Ser Glu Asp Thr Thr Ser Gly Ser
    450                 455                 460
Pro Pro Lys Lys Ser Ser Ala Gly Pro Lys Arg Asp Ala Arg Gln Ile
465                 470                 475                 480
Tyr Asn Pro Pro Ser Gly Lys Tyr Ser Ser Asn Leu Gly Asn Phe Asn
                485                 490                 495
Tyr Glu Arg Ser Leu Gln Gly Lys
            500
<210>7
<211>16
<212>DNA
<213>Artificia1 Sequence
<220>
<223>H-T11C primer
<400>7
aagctttttt tttttc                                                                16
<210>8
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP23 primer
<400>8
aagcttggct atg                                                                   13
<210>9
<211>1321
<212>DNA
<213>Homo sapiens
<400>9
tctccccagc tgtatttcca aaatgtcgct ttctaacaag ctgacgctgg acaagctgga     60
cgttaaaggg aagcgggtcg ttatgagagt cgacttcaat gttcctatga agaacaacca    120
gataacaaac aaccagagga ttaaggctgc tgtcccaagc atcaaattct gcttggacaa    180
tggagccaag tcggtagtcc ttatgagcca cctaggccgg cctgatggtg tgcccatgcc    240
tgacaagtac tccttagagc cagttgctgt agaactcaaa tctctgctgg gcaaggatgt    300
tctgttcttg aaggactgtg taggcccaga agtggagaaa gcctgtgcca acccagctgc    360
tgggtctgtc atcctgctgg agaacctccg ctttcatgtg gaggaagaag ggaagggaaa    420
agatgcttct gggaacaagg ttaaagccga gccagccaaa atagaagctt tccgagcttc    480
actttccaag ctaggggatg tctatgtcaa tgatgctttt ggcactgctc acagagccca    540
cagctccatg gtaggagtca atctgccaca gaaggctggt gggtttttga tgaagaagga    600
gctgaactac tttgcaaagg ccttggagag cccagagcga cccttcctgg ccatcctggg    660
cggagctaaa gttgcagaca agatccagct catcaataat atgctggaca aagtcaatga    720
gatgattatt ggtggtggaa tggcttttac cttccttaag gtgctcaaca acatggagat    780
tggcacttct ctgtttgatg aagagggagc caagattgtc aaagacctaa tgtccaaagc    840
tgagaagaat ggtgtgaaga ttaccttgcc tgttgacttt gtcactgctg acaagtttga    900
tgagaatgcc aagactggcc aagccactgt ggcttctggc atacctgctg gctggatggg    960
cttggactgt ggtcctgaaa gcagcaagaa gtatgctgag gctgtcactc gggctaagca   1020
gattgtgtgg aatggtcctg tgggggtatt tgaatgggaa gcttttgccc ggggaaccaa   1080
agctctcatg gatgaggtgg tgaaagccac ttctaggggc tgcatcacca tcataggtgg   1140
tggagacact gccacttgct gtgccaaatg gaacacggag gataaagtca gccatgtgag   1200
cactgggggt ggtgccagtt tggagctcct ggaaggtaaa gtccttcctg gggtggatgc   1260
tctcagcaat atttagtact ttcctgcctt ttagttcctg tgcacagccc ctaagtcaac   1320
t                                                                   1321
<210>10
<211>417
<212>PRT
<213>Homo sapiens
<400>10
Met Ser Leu Ser Asn Lys Leu Thr Leu Asp Lys Leu Asp Val Lys Gly
  1               5                  10                  15
Lys Arg Val Val Met Arg Val Asp Phe Asn Val Pro Met Lys Asn Asn
             20                  25                  30
Gln Ile Thr Asn Asn Gln Arg Ile Lys Ala Ala Val Pro Ser Ile Lys
         35                  40                  45
Phe Cys Leu Asp Asn Gly Ala Lys Ser Val Val Leu Met Ser His Leu
     50                  55                  60
Gly Arg Pro Asp Gly Val Pro Met Pro Asp Lys Tyr Ser Leu Glu Pro
 65                  70                  75                  80
Val Ala Val Glu Leu Lys Ser Leu Leu Gly Lys Asp Val Leu Phe Leu
                 85                  90                  95
Lys Asp Cys Val Gly Pro Glu Val Glu Lys Ala Cys Ala Asn Pro Ala
            100                 105                 110
Ala Gly Ser Val Ile Leu Leu Glu Asn Leu Arg Phe His Val Glu Glu
        115                 120                 125
Glu Gly Lys Gly Lys Asp Ala Ser Gly Asn Lys Val Lys Ala Glu Pro
    130                 135                 140
Ala Lys Ile Glu Ala Phe Arg Ala Ser Leu Ser Lys Leu Gly Asp Val
145                 150                 155                 160
Tyr Val Asn Asp Ala Phe Gly Thr Ala His Arg Ala His Ser Ser Met
                165                 170                 175
Val Gly Val Asn Leu Pro Gln Lys Ala Gly Gly Phe Leu Met Lys Lys
            180                 185                 190
Glu Leu Asn Tyr Phe Ala Lys Ala Leu Glu Ser Pro Glu Arg Pro Phe
        195                 200                 205
Leu Ala Ile Leu Gly Gly Ala Lys Val Ala Asp Lys Ile Gln Leu Ile
    210                 215                 220
Asn Asn Met Leu Asp Lys Val Asn Glu Met Ile Ile Gly Gly Gly Met
225                 230                 235                 240
Ala Phe Thr Phe Leu Lys Val Leu Asn Asn Met Glu Ile Gly Thr Ser
                245                 250                 255
Leu Phe Asp Glu Glu Gly Ala Lys Ile Val Lys Asp Leu Met Ser Lys
            260                 265                 270
Ala Glu Lys Asn Gly Val Lys Ile Thr Leu Pro Val Asp Phe Val Thr
        275                 280                 285
Ala Asp Lys Phe Asp Glu Asn Ala Lys Thr Gly Gln Ala Thr Val Ala
    290                 295                 300
Ser Gly Ile Pro Ala Gly Trp Met Gly Leu Asp Cys Gly Pro Glu Ser
305                 310                 315                 320
Ser Lys Lys Tyr Ala Glu Ala Val Thr Arg Ala Lys Gln Ile Val Trp
                325                 330                 335
Asn Gly Pro Val Gly Val Phe Glu Trp Glu Ala Phe Ala Arg Gly Thr
            340                 345                 350
Lys Ala Leu Met Asp Glu Val Val Lys Ala Thr Ser Arg Gly Cys Ile
        355                 360                 365
Thr Ile Ile Gly Gly Gly Asp Thr Ala Thr Cys Cys Ala Lys Trp Asn
    370                 375                 380
Thr Glu Asp Lys Va1 Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu
385                 390                 395                 400
Glu Leu Leu Glu Gly Lys Val Leu Pro Gly Val Asp Ala Leu Ser Asn
                405                 410                 415
Ile
<210>11
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11C primer
<400>11
aagctttttt tttttc                                                                16
<210>12
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP23 primer
<400>12
aagcttggct atg                                                                   13
<210>13
<211>1019
<212>DNA
<213>Homo sapiens
<400>13
ctataggcgc atggaaggtt ccctggaacg ggaggcgcca gcgggggcgc tggccgccgt     60
gctaaagcac agctcgacgt tgccgcccga aagcacccag gtccggggct acgacttcaa    120
ccgcggtgtg aattaccgcg cactgctgga ggccttcggc accaccggct tccaagcaac    180
caacttcggg cgcgctgtac agcaagtcaa tgccatgatc gagaagaagc tggaaccact    240
gtcacaggat gaagaccagc acgcggacct gacccagagc cgccgcccac ttaccagctg    300
caccattttc ctgggatata catccaacct catcagttca ggcatccgtg agaccattcg    360
ctaccttgtg cagcacaaca tggtggacgt attggtgacc acagctggcg gcgtggagga    420
agacctcatc aagtgcctgg cgcccacata cttgggcgag tttagcctca gggggaagga    480
gctccgggag aacgggatca ataggatcgg aaacctgctg gtgcccaatg agaattactg    540
caagtttgag gactggctga tgcccattct ggaccagatg gtgatggagc agaacacaga    600
gggtgtaaag tggacgcctt ctaagatgat cgcccggctg ggcaaggaga tcaacaaccc    660
agagtccgtg tattactggg cccagaagaa ccacatccct gtgtttagtc ccgcacttac    720
agacggctcg ctgggcgaca tgatcttctt ccattcctac aagaacccgg gcctggtcct    780
ggacatcgtt gaggcggaac ggggccgact acgctgttta catcaacaca gcccaggagt    840
ttgatggctc tgactcaggt gcccgaccag acgaggctgt ctcctggggc aagatccggg    900
tggatgcaca gcccgtcaag gtctatgctg acgcctccct ggtcttcccc ctgcttgtgg    960
ctgaaacctt tgcccagaag atggatgcct tcatgcatga gaagaacgag gactgagcg    1019
<210>14
<211>277
<212>PRT
<213>Homo sapiens
<400>14
Met Glu Gly Ser Leu Glu Arg Glu Ala Pro Ala Gly Ala Leu Ala Ala
  1                   5                  10                  15
Val Leu Lys His Ser Ser Thr Leu Pro Pro Glu Ser Thr Gln Val Arg
             20                  25                  30
Gly Tyr Asp Phe Asn Arg Gly Val Asn Tyr Arg Ala Leu Leu Glu Ala
         35                  40                  45
Phe Gly Thr Thr Gly Phe Gln Ala Thr Asn Phe Gly Arg Ala Val Gln
     50                  55                  60
Gln Val Asn Ala Met Ile Glu Lys Lys Leu Glu Pro Leu Ser Gln Asp
 65                  70                  75                  80
Glu Asp Gln His Ala Asp Leu Thr Gln Ser Arg Arg Pro Leu Thr Ser
                 85                  90                  95
Cys Thr Ile Phe Leu Gly Tyr Thr Ser Asn Leu Ile Ser Ser Gly Ile
            100                 105                 110
Arg Glu Thr Ile Arg Tyr Leu Val Gln His Asn Met Val Asp Val Leu
        115                 120                 125
Val Thr Thr Ala Gly Gly Val Glu Glu Asp Leu Ile Lys Cys Leu Ala
    130                 135                 140
Pro Thr Tyr Leu Gly Glu Phe Ser Leu Arg Gly Lys Glu Leu Arg Glu
145                 150                 155                 160
Asn Gly Ile Asn Arg Ile Gly Asn Leu Leu Val Pro Asn Glu Asn Tyr
                165                 170                 175
Cys Lys Phe Glu Asp Trp Leu Met Pro Ile Leu Asp Gln Met Val Met
            180                 185                 190
Glu Gln Asn Thr Glu Gly Val Lys Trp Thr Pro Ser Lys Met Ile Ala
        195                 200                 205
Arg Leu Gly Lys Glu Ile Asn Asn Pro Glu Ser Val Tyr Tyr Trp Ala
    210                 215                 220
Gln Lys Asn His Ile Pro Val Phe Ser Pro Ala Leu Thr Asp Gly Ser
225                 230                 235                 240
Leu Gly Asp Met Ile Phe Phe His Ser Tyr Lys Asn Pro Gly Leu Val
                245                 250                 255
Leu Asp Ile Val Glu Ala Glu Arg Gly Arg Leu Arg Cys Leu His Gln
            260                 265                 270
His Ser Pro Gly Val
        275
<210>15
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11C primer
<400>15
aagctttttt tttttc                                                                16
<210>16
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP21 primer
<400>16
aagctttctc tgg                                                                  12
<210>17
<211>1142
<212>DNA
<213>Homo sapiens
<400>17
gagaccccca ggttcaaaat aagcctgttt ggaacaacct caggttttgg aaccagtggg     60
accagcatgt ttggcagtgc aactacagac aatcacaatc ccatgaagga tattgaagta    120
acatcatctc ctgatgatag cattggttgt ctgtctttta gcccaccaac cttgccgggg    180
aactttctta ttgcagggtc atgggctaat gatgttcgct gctgggaagt tcaagacagt    240
ggacagacca ttccaaaagc ccagcagatg cacactgggc ctgtgcttga tgtctgctgg    300
agtgacgatg ggagcaaagt gtttacggca tcgtgtgata aaactgccaa aatgtgggac    360
ctcagcagta accaaacgat acagatcgca cagcatgatg ctcctgttaa aaccatccat    420
tggatcaaag ctccaaacta cagctgtgtg atgactggga gctgggataa gactttaaag    480
ttttgggata ctcgatcgtc aaatcctatg atggttttgc aactccctga aaggtgttac    540
tgtgctgacg tgatataccc catggctgtg gtggcaactg cagagagggg cctgattgtc    600
tatcagctag agaatcaacc ttctgaattc aggaggatag aatctccact gaaacatcag    660
catcggtgtg tggctatttt taaagacaaa cagaacaagc ctactggttt tgccctggga    720
agtatcgagg ggagagttgc tattcactat atcaaccccc cgaaccccgc caaagataac    780
ttcaccttta aatgtcatcg atctaatgga accaacactt cagctcctca ggacatttat    840
gcggtaaatg gaatcgcgtt ccatcctgtt catggcaccc ttgcaactgt gggatctgat    900
ggtagattca gcttctggga caaagatgcc agaacaaaac taaaaacttc ggaacagtta    960
gatcagccca tctcagcttg ctgtttcaat cacaatggaa acatatttgc atacgcttcc   1020
agctacgact ggtcaaaggg acatgaattt tataatcccc agaaaaaaaa ttacattttc   1080
ctgcgtaatg cagccgaaga gctaaagccc aggaataaga agtagtggct ggagactctg   1140
gc                                                                  1142
<210>18
<211>352
<212>PRT
<213>Homo sapiens
<400>18
Met Phe Gly Ser Ala Thr Thr Asp Asn His Asn Pro Met Lys Asp Ile
  1               5                  10                  15
Glu Val Thr Ser Ser Pro Asp Asp Ser Ile Gly Cys Leu Ser Phe Ser
             20                  25                  30
Pro Pro Thr Leu Pro Gly Asn Phe Leu Ile Ala Gly Ser Trp Ala Asn
         35                  40                  45
Asp Val Arg Cys Trp Glu Val Gln Asp Ser Gly Gln Thr Ile Pro Lys
     50                  55                  60
Ala Gln Gln Met His Thr Gly Pro Val Leu Asp Val Cys Trp Ser Asp
 65                  70                  75                  80
Asp Gly Ser Lys Val Phe Thr Ala Ser Cys Asp Lys Thr Ala Lys Met
                 85                  90                  95
Trp Asp Leu Ser Ser Asn Gln Thr Ile Gln Ile Ala Gln His Asp Ala
            100                 105                 110
Pro Val Lys Thr Ile His Trp Ile Lys Ala Pro Asn Tyr Ser Cys Val
        115                 120                 125
Met Thr Gly Ser Trp Asp Lys Thr Leu Lys Phe Trp Asp Thr Arg Ser
    130                 135                 140
Ser Asn Pro Met Met Val Leu Gln Leu Pro Glu Arg Cys Tyr Cys Ala
145                 150                 155                 160
Asp Val Ile Tyr Pro Met Ala Val Val Ala Thr Ala Glu Arg Gly Leu
                165                 170                 175
Ile Val Tyr Gln Leu Glu Asn Gln Pro Ser Glu Phe Arg Arg Ile Glu
            180                 185                 190
Ser Pro Leu Lys His Gln His Arg Cys Val Ala Ile Phe Lys Asp Lys
        195                 200                 205
Gln Asn Lys Pro Thr Gly Phe Ala Leu Gly Ser Ile Glu Gly Arg Val
    210                 215                 220
Ala Ile His Tyr Ile Asn Pro Pro Asn Pro Ala Lys Asp Asn Phe Thr
225                 230                 235                 240
Phe Lys Cys His Arg Ser Asn Gly Thr Asn Thr Ser Ala Pro Gln Asp
                245                 250                 255
Ile Tyr Ala Val Asn Gly Ile Ala Phe His Pro Val His Gly Thr Leu
            260                 265                 270
Ala Thr Val Gly Ser Asp Gly Arg Phe Ser Phe Trp Asp Lys Asp Ala
        275                 280                 285
Arg Thr Lys Leu Lys Thr Ser Glu Gln Leu Asp Gln Pro Ile Ser Ala
    290                 295                 300
Cys Cys Phe Asn His Asn Gly Asn Ile Phe Ala Tyr Ala Ser Ser Tyr
305                 310                 315                 320
Asp Trp Ser Lys Gly His Glu Phe Tyr Asn Pro Gln Lys Lys Asn Tyr
                325                 330                 335
Ile Phe Leu Arg Asn Ala Ala Glu Glu Leu Lys Pro Arg Asn Lys Lys
            340                 345                 350
<210>19
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11A primer
<400>19
aagctttttt ttttta                                                                16
<210>20
<211>13
<212>DNA
<213>Artificial Sequcnce
<220>
<223>H-AP21 primer
<400>20
aagctttctc tgg                                                                   13
<210>21
<211>3633
<212>DNA
<213>Homo sapiens
<400>21
cgcaatttcc actcgcgggg agcagcagca gcagaggcag cagcgggcgg cgctgagccg     60
ccgccgccgc cactgaggaa gaagccggcc cagccgccgc cgcgtccgga ccctcgcgcc    120
tggatcccag cgccccgatc ccggcgcccc aacccccacg cccgcctccg ccaactttca    180
cgctgcctcg gcggcccggc ccggctcgac gccaatggtg gaggccatag tggagtttga    240
ctaccaggcc cagcacgatg atgagctgac gatcagcgtg ggtgaaatca tcaccaacat    300
caggaaggag gatggaggct ggtgggaggg acagatcaac ggcaggagag gtttgttccc    360
tgacaacttt gtaagagaaa taaagaaaga gatgaagaaa gaccctctca ccaacaaagc    420
tccagaaaag cccctgcacg aagtgcccag tggaaactct ttgctgtctt ctgaaacgat    480
tttaagaacc aataagagag gcgagcgacg gaggcgccgg tgccaggtgg cattcagcta    540
cctgccccag aatgacgatg aacttgagct gaaagttggc gacatcatag aggtggtagg     600
agaggtagag gaaggatggt gggaaggtgt tctcaacggg aagactggaa tgtttccttc     660
caacttcatc aaggagctgt caggggagtc ggatgagctt ggcatttccc aggatgagca     720
gctatccaag tcaagtttaa gggaaaccac aggctccgag agtgatgggg gtgactcaag     780
cagcaccaag tctgaaggtg ccaacgggac agtggcaact gcagcaatcc agcccaagaa     840
agttaaggga gtgggctttg gagacatttt caaagacaag ccaatcaaac taagaccaag     900
gtcaattgaa gtagaaaatg actttctgcc ggtagaaaag actattggga agaagttacc     960
tgcaactaca gcaactccag actcatcaaa aacagaaatg gacagcagga caaagagcaa    1020
ggattactgc aaagtaatat ttccatatga ggcacagaat gatgatgaat tgacaatcaa    1080
agaaggagat atagtcactc tcatcaataa ggactgcatc gacgtaggct ggtgggaagg    1140
agagctgaac ggcagacgag gcgtgttccc cgataacttc gtgaagttac ttccaccgga    1200
ctttgaaaag gaagggaata gacccaagaa gccaccgcct ccatccgctc ctgtcatcaa    1260
acaaggggca ggcaccactg agagaaaaca tgaaattaaa aagatacctc ctgaaagacc    1320
agaaatgctt ccaaacagaa cagaagaaaa agaaagacca gagagagagc caaaactgga    1380
tttacagaag ccctccgttc ctgccatacc gccaaaaaag cctcggccac ctaagaccaa    1440
ttctctcagc agacctggcg cactgccccc gagaaggccg gagagaccgg tgggtccgct    1500
gacacacacc aggggtgaca gtccaaagat tgacttggcc ggcagttcgc tatctggcat    1560
cctggacaaa gatctctcgg accgcagcaa tgacattgac ttagaaggtt ttgactccgt    1620
ggtatcatct actgagaaac tcagtcatcc gaccacaagc agaccaaaag ctacagggag    1680
gcggcctccg tcccagtccc tcacatcttc atccctttca agccctgata tcttcgactc    1740
cccaagtccc gaagaggata aggaggaaca catttcactt gcgcacagag gagtggacgc    1800
gtcaaagaaa acttccaaga ctgttaccat atcccaagtg tctgacaaca aagcatccct    1860
gccgcccaag ccggggacca tggcagcagg tggcggtggg ccagcccctc tgtcctcagc    1920
ggcgccctcc cccctgtcat cctctttggg aacagctgga cacagagcca actccccgtc    1980
tctgttcggc acggaaggaa aaccaaagat ggagcctgcg gccagcagcc aggcggccgt    2040
ggaggagcta aggacacagg tccgcgagct gaggagcatc atcgagacca tgaaggacca    2100
gcagaaacga gagattaaac agttattgtc tgagttggat gaagagaaga aaatccggct    2160
tcggttgcag atggaagtga acgacataaa gaaagctcta caatcaaaat gaatacttga    2220
tcaatgaaat gtcacattat tcatcctgag tccgagactc aaattttctg ccccagccaa    2280
aataatcttg tgccaaaaga ttaaaggttt gcctcaaaat gtccctgttt gaaagattag    2340
cacaaaagtc ttgatagcac aacacaaatt ccatccaaga ggagaatctt ccccagggtt    2400
tagtcctggg gctggcactc gttgtgactt acacagagca aaattgtgct aaaggctttt    2460
ctactctgag atctcaatgc gaaatgaaaa ctcaggcagt ttagtccata gtggtactat    2520
tttgatgata ttttccatta ataaaatgta atttcagatt attcgtttac aagctttata    2580
attttatgat tttttaatcg tgttttgtca cagacttccc tagtgtttgt actacacgta    2640
gtcagaagcg agtgtccttt tcttttgctt caggctaaga gctgcctcgc tctttgtccc    2700
cccattagga ttctattaca tatgcaattg taggttcaac ctgtcccttt ccctgccagc    2760
aaaccccacc accctaagag aaattttagc ttatatatga cggtatattt acaaaaagag    2820
aaagagaaaa tctggtattt gcaatgatct gtgccttctt tttaccaccc tcttgattgg    2880
agcttttgtg atgcagctac catgattcaa aaaaattaaa aattaaaaaa aaaaaatctg    2940
ccacttatcc aagtccacta gaggccactg tcttcaaagc ttctctcacc ctagccaaag    3000
gtcctaagag gagacagctg tgaagttggg cgtgctctgt ggtaccagct gtgacttttc    3060
tatttctcct agttttaggt tgttcatgaa actagaaatg tcatcctgct tgatttttca    3120
tcagccaagt taaacccctg ctttctgtcc tttgcacctt ttgcgtgaac agaatatgca    3180
ttattaaagc aaaaataaat aaaagtaaaa tgcaaatgaa aaaaaaaaaa aaaaaaaaaa    3240
aaaaaaaaaa aaggccgccc ccaacaccct cctagcctta ctactaataa ttattacatt    3300
ttgactacca caactcaacg gctacataga aaaatccacc ccttacgagt gcggcttcga    3360
ccctatatcc cccgcccgcg tccctttctc cataaaattc ttcttagtag ctattacctt    3420
cttattattt gatctagaaa ttgccctcct tttaccccta ccatgagccc tacaaacaac    3480
taacctgcca ctaatagtta tgtcatccct cttattaatc atcatcctag ccctaagtct    3540
ggcctatgag tgactacaaa aaggattaga ctgaaccgaa taaaaaaaaa aaaaaaaaaa    3600
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa                                 3633
<210>22
<211>665
<212>PRT
<213>Homo sapiens
<400>22
Met Val Glu Ala Ile Val Glu Phe Asp Tyr Gln Ala Gln His Asp Asp
  1               5                  10                  15
Glu Leu Thr Ile Ser Val Gly Glu Ile Ile Thr Asn Ile Arg Lys Glu
             20                  25                  30
Asp Gly Gly Trp Trp Glu Gly Gln Ile Asn Gly Arg Arg Gly Leu Phe
         35                  40                  45
Pro Asp Asn Phe Val Arg Glu Ile Lys Lys Glu Met Lys Lys Asp Pro
     50                  55                  60
Leu Thr Asn Lys Ala Pro Glu Lys Pro Leu His Glu Val Pro Ser Gly
 65                  70                  75                  80
Asn Ser Leu Leu Ser Ser Glu Thr Ile Leu Arg Thr Asn Lys Arg Gly
                 85                  90                  95
Glu Arg Arg Arg Arg Arg Cys Gln Val Ala Phe Ser Tyr Leu Pro Gln
            100                 105                 110
Asn Asp Asp Glu Leu Glu Leu Lys Val Gly Asp Ile Ile Glu Val Val
        115                 120                 125
Gly Glu Val Glu Glu Gly Trp Trp Glu Gly Val Leu Asn Gly Lys Thr
    130                 135                 140
Gly Met Phe Pro Ser Asn Phe Ile Lys Glu Leu Ser Gly Glu Ser Asp
145                 150                 155                 160
Glu Leu Gly Ile Ser Gln Asp Glu Gln Leu Ser Lys Ser Ser Leu Arg
                165                 170                 175
Glu Thr Thr Gly Ser Gl u Ser Asp Gly Gly Asp Ser Ser Ser Thr Lys
            180                 185                 190
Ser Glu Gly Ala Asn Gly Thr Val Ala Thr Ala Ala Ile Gln Pro Lys
        195                 200                 205
Lys Val Lys Gly Val Gly Phe Gly Asp Ile Phe Lys Asp Lys Pro Ile
    210                 215                 220
Lys Leu Arg Pro Arg Ser Ile Glu Val Glu Asn Asp Phe Leu Pro Val
225                 230                 235                 240
Glu Lys Thr Ile Gly Lys Lys Leu Pro Ala Thr Thr Ala Thr Pro Asp
                245                 250                 255
Ser Ser Lys Thr Glu Met Asp Ser Arg Thr Lys Ser Lys Asp Tyr Cys
            260                 265                 270
Lys Val Ile Phe Pro Tyr Glu Ala Gln Asn Asp Asp Glu Leu Thr Ile
        275                 280                 285
Lys Glu Gly Asp Ile Val Thr Leu Ile Asn Lys Asp Cys Ile Asp Val
    290                 295                 300
Gly Trp Trp Glu Gly Glu Leu Asn Gly Arg Arg Gly Val Phe Pro Asp
305                 310                 315                 320
Asn Phe Val Lys Leu Leu Pro Pro Asp Phe Glu Lys Glu Gly Asn Arg
                325                 330                 335
Pro Lys Lys Pro Pro Pro Pro Ser Ala Pro Val Ile Lys Gln Gly Ala
            340                 345                 350
Gly Thr Thr Glu Arg Lys His Glu Ile Lys Lys Ile Pro Pro Glu Arg
        355                 360                 365
Pro Glu Met Leu Pro Asn Arg Thr Glu Glu Lys Glu Arg Pro Glu Arg
    370                 375                 380
Glu Pro Lys Leu Asp Leu Gln Lys Pro Ser Val Pro Ala Ile Pro Pro
385                 390                 395                 400
Lys Lys Pro Arg Pro Pro Lys Thr Asn Ser Leu Ser Arg Pro Gly Ala
                405                 410                 415
Leu Pro Pro Arg Arg Pro Glu Arg Pro Val Gly Pro Leu Thr His Thr
            420                 425                 430
Arg Gly Asp Ser Pro Lys Ile Asp Leu Ala Gly Ser Ser Leu Ser Gly
        435                 440                 445
Ile Leu Asp Lys Asp Leu Ser Asp Arg Ser Asn Asp Ile Asp Leu Glu
    450                 455                 460
Gly Phe Asp Ser Val Val Ser Ser Thr Glu Lys Leu Ser His Pro Thr
465                 470                 475                 480
Thr Ser Arg Pro Lys Ala Thr Gly Arg Arg Pro Pro Ser Gln Ser Leu
                485                 490                 495
Thr Ser Ser Ser Leu Ser Ser Pro Asp Ile Phe Asp Ser Pro Ser Pro
            500                 505                 510
Glu Glu Asp Lys Glu Glu His Ile Ser Leu Ala His Arg Gly Val Asp
        515                 520                 525
Ala Ser Lys Lys Thr Ser Lys Thr Val Thr Ile Ser Gln Val Ser Asp
    530                 535                 540
Asn Lys Ala Ser Leu Pro Pro Lys Pro Gly Thr Met Ala Ala Gly Gly
545                 550                 555                 560
Gly Gly Pro Ala Pro Leu Ser Ser Ala Ala Pro Ser Pro Leu Ser Ser
                565                 570                 575
Ser Leu Gly Thr Ala Gly His Arg Ala Asn Ser Pro Ser Leu Phe Gly
            580                 585                 590
Thr Glu Gly Lys Pro Lys Met Glu Pro Ala Ala Ser Ser Gln Ala Ala
        595                 600                 605
Val Glu Glu Leu Arg Thr Gln Val Arg Glu Leu Arg Ser Ile Ile Glu
    610                 615                 620
Thr Met Lys Asp Gln Gln Lys Arg Glu Ile Lys Gln Leu Leu Ser Glu
625                 630                 635                 640
Leu Asp Glu Glu Lys Lys Ile Arg Leu Arg Leu Gln Met Glu Val Asn
                645                 650                 655
Asp Ile Lys Lys Ala Leu Gln Ser Lys
            660                 665
<210>23
<211>16
<212>DNA
<213>Artificial Seauence
<220>
<223>H-T11A primer
<400>23
aagctttttt ttttta                                                                16
<210>24
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP36 primer
<400>24
aagcttcgac gct                                                                   13
<210>25
<211>4639
<212>DNA
<213>Homo sapiens
<400>25
agcggacggt ccttgcattg gcctccggca ggcgcccccc gggggcggga agctgcctca     60
cagcatggaa ccacaggtta ctctaaatgt gacttttaaa aatgaaattc aaagctttct    120
ggtttctgat ccagaaaata caacttgggc tgatatcgaa gctatggtaa aagtttcatt    180
tgatctgaat actattcaaa taaaatacct ggatgaggaa aatgaagagg tatccatcaa    240
cagtcaagga gaatatgaag aagcgcttaa gatggcagtt aaacagggaa accaactgca    300
gatgcaagtc cacgaagggc accatgtcgt tgatgaagcc ccacccccag ttgtaggagc     360
aaaacgacta gctgccaggg cagggaagaa gccacttgca cattactctt cactggtgag     420
agtcttggga tcagacatga agaccccaga ggatcctgca gtgcagtcgt ttccacttgt     480
tccatgtgac acagaccagc ctcaagacaa gcccccagac tggttcacaa gctacctgga     540
gacgttcaga gaacaagtgg ttaacgaaac ggttgagaag cttgaacaga aattacatga     600
aaagcttgtc ctccagaacc catccttggg ttcttgtccc tcagaagtct caatgcctac     660
ttcagaagaa acattgtttt tgccagaaaa ccagttcagc tggcatattg cttgcaacaa     720
ctgccaaaga aggattgttg gtgtccgcta ccagtgtagc ctatgcccat cctacaatat     780
ctgtgaagat tgtgaagcag ggccatatgg ccatgacact aaccacgtcc tgctgaagtt     840
gcggagacct gttgtgggct cctctgaacc gttctgtcac tcaaagtact ctactcctcg     900
tcttcctgct gctctggaac aagtcaggct ccagaaacag gttgataaga actttcttaa     960
agcagaaaag caaaggttgc gagctgagaa gaaacaacgt aaagcagagg tcaaggaact    1020
taaaaagcag cttaaactcc ataggaaaat tcacctgtgg aattcaatcc atggactcca    1080
gagccccaag tctcctttag gccgacctga gagcttgctc cagtctaata ccctgatgct    1140
ccctttgcag ccctgtacct ccgttatgcc aatgctcagt gcagcatttg tggatgagaa    1200
tttgcctgat gggactcacc ttcagccagg aaccaagttt atcaaacact ggaggatgaa    1260
aaatacagga aatgtaaagt ggagtgcaga cacaaagctc aagttcatgt ggggaaacct    1320
gactttggct tccacagaaa agaaggatgt tttggttccc tgcctcaagg ccggccatgt    1380
gggagttgta tctgtggagt tcattgcccc agccttggag ggaacgtata cttcccattg    1440
gcgtctttct cacaaaggcc agcaatttgg gcctcgggtc tggtgcagta tcatagtaga    1500
tcctttcccc tccgaagaga gccctgataa cattgaaaag ggcatgatca gctcaagcaa    1560
aactgatgat ctcacctgcc agcaagagga aacttttctt ctggctaaag aagaaagaca    1620
gcttggtgaa gtgactgagc agacagaagg gacagcagcc tgcatcccac agaaggcaaa    1680
aaatgttgcc agtgagaggg agctctacat cccatctgtg gatcttctga ctgcccagga    1740
cctgctgtcc tttgagctgt tggatataaa cattgttcaa gagttggaga gagtgcccca    1800
caacacccct gtggatgtga ctccctgcat gtctcctctg ccacatgaca gtcctttaat    1860
agagaagcca ggcttggggc agatagagga agagaatgaa ggggcaggat ttaaagcact    1920
tcctgattct atggtgtcag taaagaggaa ggctgagaac attgcttctg tggaggaagc    1980
agaagaagac ctgagtggga cccagtttgt gtgtgagaca gtaatccgat cccttacctt    2040
ggatgctgcc ccagaccaca accctccttg cagacagaag tccttgcaga tgacatttgc    2100
cttgcctgaa ggaccacttg gaaatgagaa ggaggagatt atccatatcg ctgaggaaga    2160
agctgtcatg gaggaggagg aggatgagga ggatgaggag gaggaggatg agctcaaaga    2220
tgaagttcaa agtcagtcct ctgcttcctc agaggattac atcatcatcc tgcctgagtg    2280
ctttgatacc agccgccccc tgggggattc tatgtacagc tctgcgctct cacagccagg    2340
cctggagcga ggtgctgaag gcaagcctgg ggttgaggct gggcaggaac cagctgaggc    2400
tggggaaaga ctccctggag gggagaacca gccacaggag cacagcataa gtgacatcct    2460
cacgacctca cagactctgg aaacagtgcc cctaatccca gaggtagtgg agcttccacc    2520
gtcactgccc aggagctctc cttgtgtaca tcatcatggt tccccaggag tggatttacc    2580
agttaccata ccagaagttt cttcagtccc tgatcagatc agaggagagc ccagaggctc    2640
atcaggactt gtaaacagca gacagaagag ctatgaccac tcaaggcacc atcatgggag    2700
cagcattgct ggaggactgg tgaagggggc tttgtctgtt gctgcctctg catacaaggc    2760
cctgtttgct gggccaccag tcactgcaca gccaataatt tctgaagatc agacagcagc    2820
cctgatggcc catctctttg aaatgggatt ctgtgacagg cagctgaacc tacggctgct    2880
gaagaaacac aattacaata tcctgcaggt tgtgacagaa cttcttcagt taaacaacaa    2940
cgactggtac agccaacgct attgaggagt gaccttgtat taaataactg cctgctgctc    3000
agagatgatc tttattctgt cattggggta tgggatagaa gcccttgctt atttttaatc    3060
tgatgaatct gtatagagcc catcgttgag ttaccaagac aatacctgct acagtatttt    3120
ggggagcaaa ctaaagacca gaacttaaat tttcacttta gacattggat gaatagtatg    3180
aagacagttt ttcagttgat ttggataaaa ctattttagt gcattgacaa gtgtaacttc    3240
aacttcatat agaaccattt ttctttctgc ttttattgaa actgagtatt tttctttggc    3300
taatgtggat tttttatggg gatatctgtt aattttcagg ttttgaaaga cattaacctc    3360
ggaagttgtt tttaagaatt attctcataa ttcttattct cataatttct gtaatccacc    3420
tcaagcttca tagttatttg gcattgaaat aacacccaga gcatgataga aatgttgtta    3480
ctcttcctct ctcaaggaga aagtaatttt cctgcaatac ttaataattg gcaccgttgc    3540
tttctaaaga ctccatggtg cattcaagag tatccaactt caagggaatc tccgcatttc    3600
aatgaaagga ggaagagtgt gctgataaac ctaccagcac ctattgagca atgtctatta    3660
tagtaatttt gcatacattt ttatttaagg gaaaaaatat aggtattgtg aaatattttg    3720
ctaatcttat agaaaaggaa aaaatcccgt tatttaaagg gaaaagtaaa tttaacagtt    3780
gccttttttc ttaatgtcag ggcagatctt attttacagt acagtggggg aaatagaaaa    3840
catgtgaaag gcaaaaggca ggctcctaaa ttaatgtcag tgaagttcag ggtgggcaaa    3900
tgagtgtgtg tgaggtatag gaaatgctga tgacttcttt aatgcttgaa gtccgttcac    3960
aggtatctag ccctagaatg cctagaacag gaagaggcag ctggtgttct gcaaaacttg    4020
gacaggggca aagttgctga aaaagttttg gtttaacccg aagataagtg gaaaagagct    4080
tgtccatgaa cccaggttct cactctgttt acagaagtgt gttgagtaca gttggtgaag    4140
gaagaggtaa caaaaaatgc taaatatttt atccatgaaa atgacttcca gaaaaggaag    4200
aatatgaacc ccagaccgaa ggggaaaaga tagttaatag tattatctaa cctggttggt    4260
atttgtaatg aatggtgatt ttaattagtc attagccata atgatgttta tttacagtat    4320
aactcctgaa tgctacttaa ataaaccagg attcaaactg caagccagcc aggccgttca    4380
ttatttaaaa cgttttaatc ggggcttccg ggtagaaggt ggagcggcag ggtgtaattg    4440
ggttgatggg tgggacctgt cttgaccatc ggagttttat aatcgagggc caggagggcc    4500
cgggttgctc tcctggttat gtatgtactt gtacataacc accttaagaa tggtgaaata    4560
aatgttcttg gaaattccta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa    4620
aaaaaaaaaa aaaaaaaaa                                                 4639
<210>26
<211>966
<212>PRT
<213>Homo sapiens
<400>26
Met Glu Pro Gln Val Thr Leu Asn Val Thr Phe Lys Asn Glu Ile Gln
  1               5                  10                  15
Ser Phe Leu Val Ser Asp Pro Glu Asn Thr Thr Trp Ala Asp Ile Glu
             20                  25                  30
Ala Met Val Lys Val Ser Phe Asp Leu Asn Thr Ile Gln Ile Lys Tyr
         35                  40                  45
Leu Asp Glu Glu Asn Glu Glu Val Ser Ile Asn Ser Gln Gly Glu Tyr
     50                  55                  60
Glu Glu Ala Leu Lys Met Ala Val Lys Gln Gly Asn Gln Leu Gln Met
 65                  70                  75                  80
Gln Val His Glu Gly His His Val Val Asp Glu Ala Pro Pro Pro Val
                 85                  90                  95
Val Gly Ala Lys Arg Leu Ala Ala Arg Ala Gly Lys Lys Pro Leu Ala
            100                 105                 110
His Tyr Ser Ser Leu Val Arg Val Leu Gly Ser Asp Met Lys Thr Pro
        115                 120                 125
Glu Asp Pro Ala Val Gln Ser Phe Pro Leu Val Pro Cys Asp Thr Asp
    130                 135                 140
Gln Pro Gln Asp Lys Pro Pro Asp Trp Phe Thr Ser Tyr Leu Glu Thr
145                 150                 155                 160
Phe Arg Glu Gln Val Val Asn Glu Thr Val Glu Lys Leu Glu Gln Lys
                165                 170                 175
Leu His Glu Lys Leu Val Leu Gln Asn Pro Ser Leu Gly Ser Cys Pro
            180                 185                 190
Ser Glu Val Ser Met Pro Thr Ser Glu Glu Thr Leu Phe Leu Pro Glu
        195                 200                 205
Asn Gln Phe Ser Trp His Ile Ala Cys Asn Asn Cys Gln Arg Arg Ile
    210                 215                 220
Val Gly Val Arg Tyr Gln Cys Ser Leu Cys Pro Ser Tyr Asn Ile Cys
225                 230                 235                 240
Glu Asp Cys Glu Ala Gly Pro Tyr Gly His Asp Thr Asn His Val Leu
                245                 250                 255
Leu Lys Leu Arg Arg Pro Val Val Gly Ser Ser Glu Pro Phe Cys His
            260                 265                 270
Ser Lys Tyr Ser Thr Pro Arg Leu Pro Ala Ala Leu Glu Gln Val Arg
        275                 280                 285
Leu Gln Lys Gln Va1 Asp Lys Asn Phe Leu Lys Ala Glu Lys Gln Arg
    290                 295                 300
Leu Arg Ala Glu Lys Lys Gln Arg Lys Ala Glu Val Lys Glu Leu Lys
305                 310                 315                 320
Lys Gln Leu Lys Leu His Arg Lys Ile His Leu Trp Asn Ser Ile His
                325                 330                 335
Gly Leu Gln Ser Pro Lys Ser Pro Leu Gly Arg Pro Glu Ser Leu Leu
            340                 345                 350
Gln Ser Asn Thr Leu Met Leu Pro Leu Gln Pro Cys Thr Ser Val Met
        355                 360                 365
Pro Met Leu Ser Ala Ala Phe Val Asp Glu Asn Leu Pro Asp Gly Thr
    370                 375                 380
His Leu Gln Pro Gly Thr Lys Phe Ile Lys His Trp Arg Met Lys Asn
385                 390                 395                 400
Thr Gly Asn Val Lys Trp Ser Ala Asp Thr Lys Leu Lys Phe Met Trp
                405                 410                 415
Gly Asn Leu Thr Leu Ala Ser Thr Glu Lys Lys Asp Va1 Leu Val Pro
            420                 425                 430
Cys Leu Lys Ala Gly His Val Gly Val Val Ser Val Glu Phe Ile Ala
        435                 440                 445
Pro Ala Leu Glu Gly Thr Tyr Thr Ser His Trp Arg Leu Ser His Lys
    450                 455                 460
Gly Gln Gln Phe Gly Pro Arg Val Trp Cys Ser Ile Ile Val Asp Pro
465                 470                 475                 480
Phe Pro Ser Glu Glu Ser Pro Asp Asn Ile Glu Lys Gly Met Ile Ser
                485                 490                 495
Ser Ser Lys Thr Asp Asp Leu Thr Cys Gln Gln Glu Glu Thr Phe Leu
            500                 505                 510
Leu Ala Lys Glu Glu Arg Gln Leu Gly Glu Val Thr Glu Gln Thr Glu
        515                 520                 525
Gly Thr Ala Ala Cys Ile Pro Gln Lys Ala Lys Asn Val Ala Ser Glu
    530                 535                 540
Arg Glu Leu Tyr Ile Pro Ser Val Asp Leu Leu Thr Ala Gln Asp Leu
545                 550                 555                 560
Leu Ser Phe Glu Leu Leu Asp Ile Asn Ile Val Gln Glu Leu Glu Arg
                565                 570                 575
Val Pro His Asn Thr Pro Val Asp Val Thr Pro Cys Met Ser Pro Leu
            580                 585                 590
Pro His Asp Ser Pro Leu Ile Glu Lys Pro Gly Leu Gly Gln Ile Glu
       595                 600                 605
Glu Glu Asn Glu Gly Ala Gly Phe Lys Ala Leu Pro Asp Ser Met Val
    610                 615                 620
Ser Val Lys Arg Lys Ala Glu Asn Ile Ala Ser Val Glu Glu Ala Glu
625                 630                 635                 640
Glu Asp Leu Ser Gly Thr Gln Phe Val Cys Glu Thr Val Ile Arg Ser
                645                 650                 655
Leu Thr Leu Asp Ala Ala Pro Asp His Asn Pro Pro Cys Arg Gln Lys
            660                 665                 670
Ser Leu Gln Met Thr Phe Ala Leu Pro Glu Gly Pro Leu Gly Asn Glu
        675                 680                 685
Lys Glu Glu Ile Ile His Ile Ala Glu Glu Glu Ala Val Met Glu Glu
    690                 695                 700
Glu Glu Asp Glu Glu Asp Glu Glu Glu Glu Asp Glu Leu Lys Asp Glu
705                 710                 715                 720
Val Gln Ser Gln Ser Ser Ala Ser Ser Glu Asp Tyr Ile Ile Ile Leu
                725                 730                 735
Pro Glu Cys Phe Asp Thr Ser Arg Pro Leu Gly Asp Ser Met Tyr Ser
            740                 745                 750
Ser Ala Leu Ser Gln Pro Gly Leu Glu Arg Gly Ala Glu Gly Lys Pro
        755                 760                 765
Gly Val Glu Ala Gly Gln Glu Pro Ala Glu Ala Gly Glu Arg Leu Pro
    770                 775                 780
Gly Gly Glu Asn Gln Pro Gln Glu His Ser Ile Ser Asp Ile Leu Thr
785                 790                 795                 800
Thr Ser Gln Thr Leu Glu Thr Val Pro Leu Ile Pro Glu Val Val Glu
                805                 810                 815
Leu Pro Pro Ser Leu Pro Arg Ser Ser Pro Cys Val His His His Gly
            820                 825                 830
Ser Pro Gly Val Asp Leu Pro Val Thr Ile Pro Glu Val Ser Ser Val
        835                 840                 845
Pro Asp Gln Ile Arg Gly Glu Pro Arg Gly Ser Ser Gly Leu Val Asn
    850                 855                 860
Ser Arg Gln Lys Ser Tyr Asp His Ser Arg His His His Gly Ser Ser
865                 870                 875                 880
Ile Ala Gly Gly Leu Mal Lys Gly Ala Leu Ser Val Ala Ala Ser Ala
                885                 890                 895
Tyr Lys Ala Leu Phe Ala Gly Pro Pro Val Thr Ala Gln Pro Ile Ile
            900                 905                 910
Ser Glu Asp Gln Thr Ala Ala Leu Met Ala His Leu Phe Glu Met Gly
        915                 920                 925
Phe Cys Asp Arg Gln Leu Asn Leu Arg Leu Leu Lys Lys His Asn Tyr
    930                 935                 940
Asn Ile Leu Gln Val Val Thr Glu Leu Leu Gln Leu Asn Asn Asn Asp
945                 950                 955                 960
Trp Tyr Ser Gln Arg Tyr
                965
<210>27
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11A primer
<400>27
aagctttttt ttttta                                                                16
<210>28
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP33 primer
<400>28
aagcttgctg ctc                                                                   13
<210>29
<211>833
<212>DNA
<213>Homo sapiens
<400>29
cggcttccag tccgcggagg gcgaggcggc gtggacagcg gccccggcac ccagcgcccc          60
gccgcccgca agccgcgcgc ccgtccgccg cgccccgagc ccgccgcttc ctatctcagc         120
gccctgccgc cgccgccgcg gcccagcgag cggccctgat gcaggccatc aagtgtgtgg         180
tggtgggaga cggagctgta ggtaaaactt gcctactgat cagttacaca accaatgcat         240
ttcctggaga atatatccct actgtctttg acaattattc tgccaatgtt atggtagatg         300
gaaaaccggt gaatctgggc ttatgggata cagctggaca agaagattat gacagattac         360
gccccctatc ctatccgcaa acagatgtgt tcttaatttg cttttccctt gtgagtcctg         420
catcatttga aaatgtccgt gcaaagtggt atcctgaggt gcggcaccac tgtcccaaca         480
ctcccatcat cctagtggga actaaacttg atcttaggga tgataaagac acgatcgaga         540
aactgaagga gaagaagctg actcccatca cctatccgca gggtctagcc atggctaagg         600
agattggtgc tgtaaaatac ctggagtgct cggcgctcac acagcgaggc ctcaagacag         660
tgtttgacga agcgatccga gcagtcctct gcccgcctcc cgtgaagaag aggaagagaa         720
aatgcctgct gttgtaaatg tctcagcccc tcgttcttgg tcctgtccct tggaaccttt         780
gtacgctttg ctcaatcaaa aacaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa                833
<210>30
<211>192
<212>PRT
<213>Homo sapiens
<400>30
Met Gln Ala Ile Lys Cys Val Val Val Gly Asp Gly Ala Val Gly Lys
  1               5                  10                  15
Thr Cys Leu Leu Ile Ser Tyr Thr Thr Asn Ala Phe Pro Gly Glu Tyr
             20                  25                  30
Ile Pro Thr Val Phe Asp Asn Tyr Ser Ala Asn Val Met Val Asp Gly
         35                  40                  45
Lys Pro Val Asn Leu Gly Leu Trp Asp Thr Ala Gly Gln Glu Asp Tyr
     50                  55                  60
Asp Arg Leu Arg Pro Leu Ser Tyr Pro Gln Thr Asp Val Phe Leu Ile
 65                  70                  75                  80
Cys Phe Ser Leu Val Ser Pro Ala Ser Phe Glu Asn Val Arg Ala Lys
                 85                  90                  95
Trp Tyr Pro Glu Val Arg His His Cys Pro Asn Thr Pro Ile Ile Leu
            100                 105                 110
Val Gly Thr Lys Leu Asp Leu Arg Asp Asp Lys Asp Thr Ile Glu Lys
        115                 120                 125
Leu Lys Glu Lys Lys Leu Thr Pro Ile Thr Tyr Pro Gln Gly Leu Ala
    130                 135                 140
Met Ala Lys Glu Ile Gly Ala Val Lys Tyr Leu Glu Cys Ser Ala Leu
145                 150                 155                 160
Thr Gln Arg Gly Leu Lys Thr Val Phe Asp Glu Ala Ile Arg Ala Val
                165                 170                 175
Leu Cys Pro Pro Pro Val Lys Lys Arg Lys Arg Lys Cys Leu Leu Leu
            180                 185                 190
<210>31
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11G primer
<400>31
aagctttttt tttttg                                                                16
<210>32
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP26 primer
<400>32
aagcttgcca tgg                                                                   13
<210>33
<211>2364
<212>DNA
<213>Homo sapiens
<400>33
gcagaggaaa gggtgaaggg agtctgggca agcaaagcat agagatggtg gggtggtggt     60
ggggttgaag aaacttgttg gtataattgt cataggactt gcctaaaata ttattaaaat    120
tacgggagtg tactcagctt tgagcctagg agaaaatgcc actgtgtgca tccattttaa    180
agggttccct cataaaaaaa tgttattccc cattatcaca tcagtacact gctttgaaaa    240
caaaactttt caacatgggc atactgggct acatggaaaa tgacatcacc caggagtgat    300
ttctctttat atatattatt tctgcagtta ccatccttat ctgagttatc acagttcatg    360
aatctaagag gcggaactct acatcattag taagaggttc caccaaagtc taaagttgta    420
ttcacttgtg tttgatgaac tatctttaaa agaccatagg tctatcatta tttcttagac    480
ataatctaaa gaaaaacaga ctagagaagc cacctggttg taacagaata agcagaagtt    540
tacagcatga tagtccaagt ggtgataact ttaaataaaa ctcaaatttt tactgtttgt    600
agacaggaat gctgtcctag agaacctcct cctcaaccag ctacgtacat agttttatcc    660
tatgcattcc tgttttctgt gttttttgtt tttttttttt gagacagagt ctcgctctgt    720
cacccaggct ggagtgcagt ggtgcgacct cagctcactg aaacctctgc ctcccgggtt    780
caagcgattc tcctgcatca gcctcccgag tagctaggat tacaggcgcc cgccactacg    840
cccagctaat ttgtggtatt tttagtagag acagggtttc accatgttgg ccaggctggt     900
ctcgaactcc tgacctcatg atccgcccgc cttgacctcc caaagtgctg ggattacagg     960
catgagccac cgcacccagc ctgcattcct gtttttttaa tggttttgga gggtagcagt    1020
agagatgggg tctcactatg ttgcccagtc tagtcttgaa ctcctgggct acagttaccc    1080
tcctacctcg gcttcccaaa gtgctcggat tacaggtgtg agccactgtg cctagcctat    1140
aatgatcatt ttaatgtttc ccatgcactc atttagtttg aaccttcaca gcaacccaat    1200
gaggtaatac tcccatttca catataatac tgagagatga gttgcacaag attatacact    1260
gttaagtagc agagccagaa tggacttcag aatcccaact acaatacaaa tgtttattta    1320
aataaagaag aaagctattg tacaaatatc actcttcagg tttagcttac agagccatgg    1380
ctatggattc ttagctctgt aaggaagtgc ttctataaat tcttaggttt agagatgata    1440
ccatctgggt acctttgctt gaaccgtgca accacatctg ggtctagtag gtggatccca    1500
tccagttggt ttccaagggt gatcctgaaa cagtgtaaaa ggaggggcaa accagaaatc    1560
ctggaattag agggtttaat attgttaaaa aatgcatacc aaatgaagac tgcctatcat    1620
catatcaaat atgccaattc taaaaagagc ttaacattag aatagtatat ggtagaatta    1680
ctagttcaga attggcatag attctggtgt taaaatagac tggatctgta ttatctgagg    1740
gttagtaact aatgcttagc caggcctgct tcacagagtt gctaccaggg agtattcttt    1800
ggataagcaa atgctagcag catgtgtttt aagctctgtt aaggggtgaa agatgtaatt    1860
attgacagat taaatagata acttcgtaac caccaggggg cagattcaat acatcacaga    1920
atggctgagg aagatccttg ggttgtgaag agagtagaaa ccctagggag cagtgctttt    1980
gggtcctaga acctgttgag tttctaatga atatttgtag aatctcataa aacagtttaa    2040
atacaagctt aagtggctta tgaatcctgt gaagctcatt tatggactag tgtaaaacaa    2100
tgtgaagctc tactaagttc tgtccttaat cataaataat agccccttga ggactagcct    2160
gttctctggt caccttacca gttgggttgc acattgtgtg gtcgtccaaa taactcaatc    2220
ttgcgagtgc caggagatag tctttcaatc atgccataga tttcatctgg tttatgactg    2280
gtggaacgaa cctaggaaat aaaaactagc tgctttttaa gttaaaaaaa aaaaaaaaaa    2340
aaaaaaaaaa aaaaaaaaaa aaaa                                           2364
<210>34
<211>76
<212>PRT
<213>Homo sapiens
<400>34
Met Ile Pro Ser Gly Tyr Leu Cys Leu Asn Arg Ala Thr Thr Ser Gly
  1               5                  10                  15
Ser Ser Arg Trp Ile Pro Ser Ser Trp Phe Pro Arg Val Ile Leu Lys
             20                  25                  30
Gln Cys Lys Arg Arg Gly Lys Pro Glu Ile Leu Glu Leu Glu Gly Leu
         35                  40                  45
Ile Leu Leu Lys Asn Ala Tyr Gln Met Lys Thr Ala Tyr His His Ile
     50                  55                  60
Lys Tyr Ala Asn Ser Lys Lys Ser Leu Thr Leu Glu
 65                  70                  75
<210>35
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11G primer
<400>35
aagctttttt tttttg                                                                16
<210>36
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP23 primer
<400>36
aagcttggct atg                                                                   13

Claims (6)

1.一种人类原癌蛋白,具有的氨基酸序列选自由SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:3Q和SEQID NO:34组成的组。
2.一种人类原癌基因,具有的DNA序列选自由对应于SEQ IDNO:1的核苷酸序列位置89-709的DNA序列、对应于SEQ IDNO:5的核苷酸序列位置113-1627的DNA序列、对应于SEQID NO:9的核苷酸序列位置23-1276的DNA序列、对应于SEQID NO:13的核苷酸序列位置11-844的DNA序列、对应于SEQID NO:17的核苷酸序列位置67-1125的DNA序列、对应于SEQ ID NO:21的核苷酸序列位置215-2212的DNA序列、对应于SEQ ID NO:25的核苷酸序列65-2965的DNA序列、对应于SEQ ID NO:29的核苷酸序列位置159-737的DNA序列、以及对应于SEQ ID NO:33的核苷酸序列位置1435-1685的DNA序列组成的组,其中所述DNA序列中每一种均编码如权利要求1中所定义的原癌蛋白。
3.根据权利要求2所述的人类原癌基因,其中所述原癌基因具有选自由SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ IDNO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:29和SEQ ID NO:33组成的组的DNA序列。
4.一种包括如权利要求2或3中定义的每一种原癌基因的载体。
5.一种用于诊断癌症及癌症转移的试剂盒,包括如权利要求1中定义的每一种原癌蛋白。
6.一种用于诊断癌症和癌症转移的试剂盒,包括如权利要求2或3中定义的每一种原癌基因。
CNA2005800487632A 2004-12-28 2005-12-28 人类原癌基因及其编码的蛋白 Pending CN101133081A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020040114281A KR100664588B1 (ko) 2004-12-28 2004-12-28 인간 원암유전자 및 이에 의해 코드되는 단백질
KR1020040114281 2004-12-28

Publications (1)

Publication Number Publication Date
CN101133081A true CN101133081A (zh) 2008-02-27

Family

ID=36615159

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800487632A Pending CN101133081A (zh) 2004-12-28 2005-12-28 人类原癌基因及其编码的蛋白

Country Status (7)

Country Link
US (1) US20080213764A1 (zh)
EP (1) EP1838728A4 (zh)
JP (1) JP2008525045A (zh)
KR (1) KR100664588B1 (zh)
CN (1) CN101133081A (zh)
CA (1) CA2592466A1 (zh)
WO (1) WO2006071080A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012058532A2 (en) * 2010-10-28 2012-05-03 Yale University Methods and compositions for assessing and treating cancer
AU2013232855B2 (en) 2012-03-15 2016-10-27 Hyun Kee Kim Gremlin-1 antibody

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6812339B1 (en) * 2000-09-08 2004-11-02 Applera Corporation Polymorphisms in known genes associated with human disease, methods of detection and uses thereof
KR100503559B1 (ko) * 2002-12-23 2005-07-26 김진우 인간 원암유전자 hlc-8 및 이에 의해 코드되는 단백질
WO2004067779A2 (en) * 2003-01-30 2004-08-12 Applera Corporation Genetic polymorphisms associated with rheumatoid arthritis, methods of detection and uses thereof

Also Published As

Publication number Publication date
CA2592466A1 (en) 2006-07-06
WO2006071080A1 (en) 2006-07-06
KR100664588B1 (ko) 2007-01-04
EP1838728A1 (en) 2007-10-03
JP2008525045A (ja) 2008-07-17
US20080213764A1 (en) 2008-09-04
KR20060075482A (ko) 2006-07-04
EP1838728A4 (en) 2008-12-03

Similar Documents

Publication Publication Date Title
ES2238026T3 (es) Uso de polipeptidos casb616 y polinucleotidos para tratamiento de cancer.
WO1998054963A2 (en) 207 human secreted proteins
US20030077604A1 (en) Compositions and methods relating to breast specific genes and proteins
PT1650221E (pt) Novos compostos
CN101133081A (zh) 人类原癌基因及其编码的蛋白
CN101184773A (zh) 人类原癌基因trg及其编码的蛋白
WO2001038377A1 (fr) Nouveau polypeptide - la proteine humaine 95 contenant un bromodomaine- et un polynucleotide codant pour ledit polypeptide
CN100436479C (zh) 人类原癌基因及其编码蛋白
WO2001060855A1 (fr) Nouvelle proteine humaine associee a la regulation du cycle cellulaire et sa sequence de codage
CN100358917C (zh) 肿瘤标志物及其用途
KR100503559B1 (ko) 인간 원암유전자 hlc-8 및 이에 의해 코드되는 단백질
KR20060090786A (ko) 인간 원암유전자 및 이에 의해 코드되는 단백질
KR20060089714A (ko) 인간 원암유전자 및 이에 의해 코드되는 단백질
US20080213763A1 (en) Human Protooncogene and Protein Encoded by Same, and Expression Vector Containing Same
KR100915609B1 (ko) 인간 원암유전자 및 이에 의해 코드되는 단백질
US20030017545A1 (en) Isolated human transporter proteins, nucleic acid molecules encoding human transporter proteins, and uses thereof
KR100503567B1 (ko) 인간 원암유전자 hlc-2 및 이에 의해 코드되는 단백질
KR100453478B1 (ko) 인간 원암 유전자 및 이에 의해 코드되는 단백질
WO2001032699A1 (fr) Nouveau polypeptide, nouvelle udp glucose-glycoproteine glucosyltransferase (« biohugtr »), et polynucleotide codant pour ce polypeptide
WO2002022676A1 (fr) Proteine garante de longevite, sa sequence de codage et ses utilisations
KR20060111876A (ko) 인간 원암유전자 trg 및 이에 의해 코드되는 단백질
KR20060111875A (ko) 인간 원암유전자 trg 및 이에 의해 코드되는 단백질
KR20060107490A (ko) 인간 원암유전자 trg 및 이에 의해 코드되는 단백질
KR20060105732A (ko) 인간 원암유전자 trg 및 이에 의해 코드되는 단백질
KR20060107489A (ko) 인간 원암유전자 trg 및 이에 의해 코드되는 단백질

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20080227