CN101133081A - 人类原癌基因及其编码的蛋白 - Google Patents
人类原癌基因及其编码的蛋白 Download PDFInfo
- Publication number
- CN101133081A CN101133081A CNA2005800487632A CN200580048763A CN101133081A CN 101133081 A CN101133081 A CN 101133081A CN A2005800487632 A CNA2005800487632 A CN A2005800487632A CN 200580048763 A CN200580048763 A CN 200580048763A CN 101133081 A CN101133081 A CN 101133081A
- Authority
- CN
- China
- Prior art keywords
- leu
- glu
- ser
- lys
- pro
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/82—Translation products from oncogenes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biomedical Technology (AREA)
- Oncology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Toxicology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
本发明披露了一种新型原癌基因及其编码的蛋白。本发明的原癌基因,是参与人类致癌作用同时具有诱导癌症转移能力的新型基因,可有效用于诊断癌症,包括肺癌、白血病、子宫癌、淋巴瘤、结肠癌、皮肤癌等,还用于产生转化的动物等。
Description
技术领域
本发明涉及新的原癌基因,其与之前报道的原癌基因无同源性,但具有诱导癌症转移的能力;还涉及其编码的蛋白。
背景技术
已知高等动物包括人通常具有大约30,000个基因,但每一个个体中仅表达所述基因的约15%。因此,研究发现所有生命现象即生殖、分化、稳态、对刺激的反应、细胞周期控制、衰老和凋亡(程序性细胞死亡)等均依赖于哪些基因被选择并表达(Liang,P.and A.B.Pardee,Science 257:967-971,1992)。
病理现象例如肿瘤生成是通过遗传变异引起基因表达的改变而诱导。因此,比较不同细胞之间的基因表达可能是理解多种生物学机制的根本而主要的途径。例如,由Liang和Pardee提出的mRNA差异显示法(Liang,P.and A.B.Pardee,Science 257:967-971,1992)已经有效用于搜寻肿瘤抑制基因、细胞周期调节相关基因以及凋亡相关的转录调节基因等,并且也广泛应用于详细说明仅在一个细胞内发生的不同基因的联系。
综合肿瘤生成的多个结果,现在已经报道了多种遗传改变例如丧失特异性染色体杂合性、原癌基因的激活以及其他肿瘤抑制基因包括p53基因的失活在肿瘤组织中累积而形成人类肿瘤(Bishop,J.M.,Cell 64:235-248,1991;Hunter,T.,Cell 64:249-270,1991)。而且,据报道10-30%的癌通过扩增原癌基因而活化。因此,原癌基因的激活在多种癌症的病因学研究中发挥重要的作用,而且科研人员已经多方尝试以详细说明该作用。
因此,本发明者发现一种用于产生肺癌及宫颈癌的机制在原癌基因水平作了研究,因此该原癌基因,命名为人类迁移诱导基因,仅在癌细胞中表现出特殊增高的表达水平。该原癌基因可有效用于诊断、预防和治疗多种癌症例如肺癌、白血病、子宫癌、淋巴瘤、结肠癌、皮肤癌等。
发明内容
因此,设计本发明以解决该领域现存的问题,因此本发明的一个目标是提供新的原癌基因及其片段。
本发明的另一个目标是提供包括所述每一种原癌基因及其片段的重组载体以及由所述重组载体中每一种所转化的微生物。
本发明的另外一个目标是提供由每一种所述原癌基因编码的蛋白及其片段。
本发明的另外一个目标是提供用于诊断癌症及癌症转移的试剂盒,其包括每一种所述原癌基因或其片段。
本发明的另外一个目标是提供用于诊断癌症及癌症转移的试剂盒,其包括每一种所述蛋白或其片段。
为了实现上述目标,本发明提供了一种具有DNA序列SEQ IDNO:1的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体;以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:2的蛋白或其片段。
本发明提供了一种具有DNA序列SEQ ID NO:5的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:6的蛋白或其片段。
本发明提供了一种具有DNA序列SEQ ID NO:9的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:10的蛋白或其片段。本发明提供了一种具有DNA序列SEQ IDNO:13的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据所述另外一个目标,本发明提供了一种具有氨基酸序列SEQ ID NO:14的蛋白或其片段。
本发明提供了一种具有DNA序列SEQ ID NO:17的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:18的蛋白或其片段。
本发明提供一种具有DNA序列SEQ ID NO:21的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:22的蛋白或其片段。
本发明提供了一种具有DNA序列SEQ ID NO:25的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据所述另外一个目标,本发明提供了一种具有氨基酸序列SEQ ID NO:26的蛋白或其片段。
本发明提供了一种具有DNA序列SEQ ID NO:29的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:30的蛋白或其片段。
本发明提供了一种具有DNA序列SEQ ID NO:33的原癌基因或其片段。
根据另一个目标,本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。
根据另外一个目标,本发明提供了一种具有氨基酸序列SEQ IDNO:34的蛋白或其片段。
根据所述另外一个目标,本发明提供了用于诊断癌症以及癌症转移的试剂盒,包括所述原癌基因及其片段。
根据另外一个目标,本发明提供了用于诊断癌症以及癌症转移的试剂盒,包括所述原癌蛋白及其片段。
附图说明
本发明优选的具体实施方式的这些和其它特征、方面及优势将在下面的详细说明中结合附图做充分阐述。在附图中:
图1是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定L276811 DNA片段是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中表达;
图2是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定CC231 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达;
图3是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定L789DNA片段是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中表达;
图4是一个凝胶图,示出了差异显示逆转录PCR(DDT-PCR)的结果,以确定L986 DNA片段是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中表达;
图5是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定L1284 DNA片段是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中表达;
图6是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定CA367 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达;
图7是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定CA335 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达;
图8是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定CG263 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达;
图9是一个凝胶图,示出了差异显示逆转录PCR(DDRT-PCR)的结果,以确定CG233 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达;
图10(a)是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG3是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358肺癌细胞系中表达。图10(b)是一个示图,示出了通过将图10(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图11是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG8是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达;
图12是一个示图,示出了通过将图11中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图13(a)是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG10是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358肺癌细胞系中表达。图13(b)是一个示图,示出了通过将图13(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图14(a)是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG13是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358肺癌细胞系中表达。图14(b)是一个示图,示出了通过将图14(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图15(a)是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG14是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358肺癌细胞系中表达。图15(b)是一个示图,示出了通过将图15(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图16是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG18是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达;
图17是一个示图,示出了通过将图16中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图18是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG19是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达;
图19是一个示图,示出了通过将图18中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图20是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG5是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达;
图21是一个示图,示出了通过将图20中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图22是一个凝胶图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG7是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达;
图23是一个示图,示出了通过将图22中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图24(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG3是否在12个泳道的多个人类正常组织中表达,图24(b)是一个示图,示出了通过将图24(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图25是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG8是否在12个泳道的多个人类正常组织中表达;
图26是一个示图,示出了通过将图25中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图27(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG10是否在12个泳道的多个人类正常组织中表达,图27(b)是一个示图,示出了通过将图27(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图28(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG13是否在12个泳道的多个人类正常组织中表达,图28(b)是一个示图,示出了通过将图28(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图29(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG14是否在12个泳道的多个人类正常组织中表达,图29(b)是一个示图,示出了通过将图29(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图30是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG18是否在12个泳道的多个人类正常组织中表达;
图31是一个示图,示出了通过将图30中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图32是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG19是否在12个泳道的多个人类正常组织中表达;
图33是一个示图,示出了通过将图32中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图34是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG5是否在12个泳道的多个人类正常组织中表达;
图35是一个示图,示出了通过将图34中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图36是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG7是否在12个泳道的多个人类正常组织中表达;
图37是一个示图,示出了通过将图36中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图38(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG3是否在人类癌细胞系中表达,图38(b)是一个示图,示出了通过将图38(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图39是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG8是否在人类癌细胞系中表达;
图40是一个示图,示出了通过将图39中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图41(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG10是否在人类癌细胞系中表达,图41(b)是一个示图,示出了通过将图41(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图42(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG13是否在人类癌细胞系中表达,图42(b)是一个示图,示出了通过将图42(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图43(a)是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG14是否在人类癌细胞系中表达,图43(b)是一个示图,示出了通过将图43(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图44是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG18是否在人类癌细胞系中表达;
图45是一个示图,示出了通过将图44中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图46是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG19是否在人类癌细胞系中表达;
图47是一个示图,示出了通过将图46中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图48是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG5是否在人类癌细胞系中表达;
图49是一个示图,示出了通过将图48中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;
图50是一个示图,示出了RNA印迹的结果,以确定本发明的原癌基因MIG7是否在人类癌细胞系中表达;
图51是一个示图,示出了通过将图50中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果;以及
图52至60是示图,示出了十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)的结果,以确定将本发明的原癌基因MIG3,MIG8,MIG10,MIG18,MIG13,MIG14,MIG19,MIG5和MIG7分别转化入大肠杆菌中后,在L-阿拉伯糖诱导前后所表达蛋白的大小。
具体实施方式
下文将参照附图对本发明的优选具体实施方式详细加以阐述。
1.MIG3
本发明的原癌基因,人类迁移诱导基因3(MIG3)(下文中,称为MIG3原癌基因),具有在SEQ ID NO:1中列出的2,295bp全长DNA序列。
在SEQ ID NO:1的DNA序列中,对应于核苷酸序列位置89-709(707-709:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:2中列出并包含206个氨基酸(下文中,称为“MIG3蛋白”)。
SEQ ID NO:1的DNA序列已经以编码号AY239293储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其DNA序列与智人cDNA:FLJ23513 fis,克隆体LNG03869基因的序列类似,后者以编码号AK027166储存于所述数据库中。本发明的原癌基因表达的蛋白包含206个氨基酸,氨基酸序列在SEQ ID NO:2中列出,分子量约23kDa。
2.MIG8
本发明的原癌基因,人类迁移诱导基因8(MIG8)(下文中,称为原癌基因MIG8),具有在SEQ ID NO:5中列出的3,737bp全长DNA序列。
在SEQ ID NO:5的DNA序列中,对应于核苷酸序列位置113-1627(1625-1627:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:6中列出并且包含665个氨基酸(下文中,称为“MIG8蛋白”)。
SEQ ID NO:5的DNA序列已经以编码号AY311389储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其氨基酸序列与智人凋亡抑制因子5(API5)基因的氨基酸序列一致,后者以编码号NM_006595和NM_021112储存于所述数据库中。但其一部分DNA序列不同于所述智人凋亡抑制因子5(API5)基因的DNA序列。
本发明的原癌基因表达的蛋白包含504个氨基酸,并且氨基酸序列在SEQ ID NO:6中列出,分子量约57kDa。
3.MIG10
本发明的原癌基因,人类迁移诱导基因10(MIG10)(下文中,称为原癌基因MIG10),具有在SEQ ID NO:9中列出的1,321bp全长DNA序列。
在SEQ ID NO:9的DNA序列中,对应于核苷酸序列位置23-1276(1274-1276:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:10中列出并且包含417个氨基酸(下文中,称为“MIG10蛋白”)。
SEQ ID NO:9的DNA序列已经以编码号AY423725储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其DNA序列与智人磷酸甘油酸激酶1基因以及智人磷酸甘油酸激酶(phosphoglycerate kinase)1(PGK1)基因的DNA序列一致,后者分别以编码号BC023234和NM_000291储存于所述数据库中。
本发明的原癌基因表达的蛋白包含417个氨基酸,而氨基酸序列在SEQ ID NO:10中列出,分子量约45kDa。
4.MIG13
本发明的原癌基因,人类迁移诱导基因13(MIG13)(下文中,称为原癌基因MIG13),具有在SEQ ID NO:13中列出的1,019bp全长DNA序列。
在SEQ ID NO:13的DNA序列中,对应于核苷酸序列位置11-844(842-844:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:14中列出并且包含277个氨基酸(下文中,称为“MIG13蛋白”)。
SEQ ID NO:13的DNA序列已经以编码号AY336090储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其部分DNA序列与Cot 25-标准化(Cot 25-normalized)智人(人类)B细胞(Ramos细胞系)的全长cDNA克隆CS0DL001YE02基因的DNA序列类似,后者以编码号CR613087储存于所述数据库中。
本发明的原癌基因表达的蛋白包含277个氨基酸,并且氨基酸序列在SEQ ID NO:14中列出,分子量约31kDa。
5.MIG14
本发明的原癌基因,人类迁移诱导基因14(MIG14)(下文中,称为原癌基因MIG14),具有在SEQ ID NO:17中列出的1,142bp全长DNA序列。
在SEQ ID NO:17的DNA序列中,对应于核苷酸序列位置67-1125(1123-1125:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:18中列出并且包含206个氨基酸(下文中,称为“MIG14蛋白”)。
SEQ ID NO:17的DNA序列已经以编码号AY336091储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),并且DNA测序结果表明其DNA序列与智人RAE1RNA输出1同系物(S.pombe)(RAE1)以及智人(人类)的Cot25标准化的胎盘(Placenta Cot 25-normalized)全长cDNA克隆CS0DI002YP18的基因的序列相同,分别以编码号NM_003610和CR626728储存于所述数据库中。
本发明的该原癌基因表达的蛋白包含352个氨基酸,并且氨基酸序列在SEQ ID NO:18中列出,分子量约39kDa。
6.MIG18
本发明的原癌基因,人类迁移诱导基因18(MIG18)(下文中,称为原癌基因MIG18),具有在SEQ ID NO:21中列出的3,633bp全长DNA序列。
在SEQ ID NO:21的DNA序列中,对应于核苷酸序列位置215-2212(2210-2212:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:22中列出并且包含665个氨基酸(下文中,称为“MIG18蛋白”)。
DNA测序结果表明本发明的原癌基因MIG18与智人SH3结构域激酶结合蛋白1(SH3KBP1)(GenBank编码号NM_031892)具有相同的蛋白质序列(Take,H.,et al.,Biochem.Biophy.Res.Comm.268:321-328,2000),后者通过结合于c-Cb1基因而发挥作用以转导表皮生长因子相关信号(Langdon,W.Y.,et al.,Proc.Natl.Acad.SciUSA 86:1168-1172,1989),但其部分DNA序列不同于智人SH3结构域激酶结合蛋白1基因的DNA序列。
本发明的该原癌基因表达的蛋白包含665个氨基酸,而氨基酸序列在SEQ ID NO:22中列出,分子量约73kDa。
7.MIG19
本发明的原癌基因,人类迁移诱导基因19(MIG19)(下文中,称为原癌基因MIG19),具有在SEQ ID NO:25中列出的4,639bp全长DNA序列。
在SEQ ID NO:25的DNA序列中,对应于核苷酸序列位置65-2965(2963-2965:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:26中列出并且包含966个氨基酸(下文中,称为“MIG19蛋白”)。
SEQ ID NO:25的DNA序列已经以编码号AY450308储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其部分蛋白质序列与智人膜组分,染色体17,表面标记物2(卵巢癌抗原CA125)(M17S2),转录变异体3基因(以编码号NM_031862储存于所述数据库中)的蛋白质序列一致,但其部分DNA序列不同于所述基因的DNA序列。
本发明的该原癌基因表达的蛋白包含966个氨基酸,而氨基酸序列在SEQ ID NO:26中列出,分子量约107kDa。
8.MIG5
本发明的原癌基因,人类迁移诱导基因5(MIG5)(下文中,称为原癌基因MIG5),具有在SEQ ID NO:29中列出的833bp全长DNA序列。
在SEQ ID NO:29的DNA序列中,对应于核苷酸序列位置159-737(735-737:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:30中列出并且包含192个氨基酸(下文中,称为“MIG5蛋白”)。
SEQ ID NO:29的DNA序列已经以编码号AY279384储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其DNA序列与智人ras相关C3肉毒杆菌毒素底物1(rho家族,小GTP结合蛋白Racl)(RAC1),转录变异体Racl基因的DNA序列一致,其分别以编码号NM 006908储存于所述数据库中。
本发明的该原癌基因表达的蛋白包含192个氨基酸,而其氨基酸序列在SEQ ID NO:30中列出,分子量约21kDa。
9.MIG7
本发明的原癌基因,人类迁移诱导基因7(MIG7)(下文中,称为原癌基因MIG7),具有在SEQ ID NO:33中列出的2,364bp的全长DNA序列。
在SEQ ID NO:33的DNA序列中,对应于核苷酸序列位置1435-1685(1683-1685:终止密码子)的可读框是一个全长蛋白编码区,而来自该蛋白编码区的氨基酸序列在SEQ ID NO:34中列出并且包含76个氨基酸(下文中,称为“MIG7蛋白”)。
SEQ ID NO:33的DNA序列已经以编码号AY305872储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期:2004年12月31日),而DNA测序结果表明其部分DNA序列分别与染色体14上的智人T细胞受体αδ基因座(TCRA/TCRD,以编码号NG_001332储存)、智人T细胞受体αδ基因座(全核苷酸序列的1-250529碱基)(1/5的部分)(以编码号AE000658、AE000521和U85195储存)以及智人(N6-腺苷)-甲基转移酶基因(以编码号AF283991储存于所述数据库中)的DNA序列相同。
本发明的该原癌基因表达的蛋白包含76个氨基酸,并且氨基酸序列在SEQ ID NO:34中列出,分子量约9kDa。
同时,由于密码子的简并性或者考虑到对于存活生物表达所述原癌基因的密码子的优选,本发明的原癌基因可以在编码区进行多种修饰而不改变该编码区表达的致癌蛋白的氨基酸序列,以及在不影响基因表达的范围内对编码区以外的区域进行多种修饰或改变。这种修饰基因也包括在本发明的范畴内。因此,本发明还包括具有的DNA序列与所述原癌基因以及所述原癌基因的片段基本相同的多核苷酸。术语“基本相同的多核苷酸”指的是这样的DNA,其编码相同的翻译蛋白产物且与本发明的原癌基因具有至少80%,优选至少90%,以及最优选至少95%的DNA序列同源性。
而且,在不改变所述蛋白功能的范围内,可以在所述蛋白的氨基酸序列中置换、添加或缺失一个或多个氨基酸,并且根据应用可仅使用部分蛋白。这种修饰的氨基酸序列也包括在本发明的范畴内。因此,本发明还包括具有的氨基酸序列与所述致癌蛋白以及所述蛋白的片段基本相同的多肽。术语“基本相同的多肽”指的是这样的多肽,其具有至少80%,优选至少90%,以及最优选至少95%的序列同源性。
本发明的原癌基因和蛋白可以分离自人类癌组织,或者按照已知用于合成DNA或肽的方法而合成。而且,这样制备的基因可插入本领域中已知的用于在微生物中表达的载体中,以获得表达载体,然后该表达载体可以导入恰当的宿主细胞中,例如大肠杆菌、酵母细胞等。在这种转化的宿主中,可以大量复制本发明的基因DNA或可以大量生产其蛋白。
一旦构建了该表达载体,则根据生产该基因或蛋白的宿主细胞种类,可以恰当地选择和组合表达调节序列例如启动子和终止子、自主复制序列、分泌信号等。
已证实本发明的基因为强致癌基因,能够形成肺癌,因为诸如RNA印迹的分析方法表明该基因在正常肺组织中几乎不表达,而在肺癌组织和肺癌细胞系中则过表达。而且已证明这些基因是癌症转移相关基因,能够诱导癌症转移,因为其在转移性淋巴结癌组织中表达增加。除了上皮组织例如肺癌,本发明的原癌基因也在其他癌性肿瘤组织中高度表达,例如白血病、子宫癌、淋巴瘤、结肠癌、皮肤癌等。因此,认为本发明的原癌基因是多种肿瘤生成中的共有癌基因,并且可以有效用于诊断多种癌症并生产转化的动物。
例如,利用所述原癌基因诊断癌症的方法包括这样的步骤,即所述原癌基因的全部或部分作为证明(proves)与从受试者体液中提取的核酸杂交后,通过本领域中已知的多种方法检测所述原癌基因来确定受试者是否具有本发明的原癌基因。利用放射性同位素、酶等标记的探针可以很容易证实所述基因存在于组织样品中。因此,本发明提供含有全部或部分所述原癌基因的试剂盒,用于诊断癌症。
通过将本发明的原癌基因导入哺乳动物例如啮齿类如大鼠体内,可以获得转化的动物,而且优选在至少8细胞期之前的受精卵期将所述原癌基因导入。这样制备的转化动物可以有效用于搜寻致癌物质或抗癌物质如抗氧化剂。
来自本发明的原癌基因的蛋白可有效用于产生作为诊断工具的抗体。按照本领域中已知的常规方法可以利用从本发明的原癌基因或其片段表达的蛋白产生作为单克隆抗体或多克隆抗体的本发明的抗体,因此,通过利用本领域中已知的方法,例如酶联免疫吸附试验(ELISA)、放射性免疫测定(RIA)、夹层分析法、聚丙烯酰胺凝胶上的蛋白质印迹或免疫印迹等,来确定所述蛋白是否在受试者的体液样品中表达,从而这种抗体可用来诊断癌症和癌症转移。
而且,本发明的原癌基因可用来构建以失控方式持续生长的癌细胞系,并且这种细胞系可以,例如,从利用转染了所述原癌基因的成纤维细胞在裸鼠背中形成的瘤组织而产生。这种癌细胞系可有效用于搜寻抗癌剂等。
下文将参照优选实施例来详细阐述本发明。
然而,本文中提出的阐述仅是优选实施例,仅用于说明的目的,而不限制本发明的范畴。
实施例1:肿瘤细胞的培养以及总RNA的分离
1-1:MIG3、MIG10、MIG13以及MIG14
(第一步)肿瘤细胞的培养
为了实施所述mRNA差异显示法,取得正常肺组织、并从肺癌患者得到原发性肺癌组织以及转移至右肺的癌组织,其中上述患者在外科手术之前未进行过抗癌治疗和/或放射治疗。在差异显示法中,A549(美国模式培养物收藏中心(American Type CultureCollection);ATCC号CCL-185)用作人类肺癌细胞系。
将从得到的组织获得的细胞以及A549肺癌细胞系在Waymouth′s MB 752/1培养基(Gibco)中培养,该培养基含2mM谷氨酰胺,100IU/ml青霉素,100μg/ml链霉素和10%胎牛血清(Gibco,U.S.)。本实验中采用的培养细胞处于指数生长期,且本文采用的细胞通过台盼蓝染料排阻实验表现出至少95%的生存力(Freshney,″Culture of Animal Cells:A Manual of Basic Technique″2nd Ed.,A.R.Liss,New York,1987)。
(第二步)RNA的分离和mRNA差异显示法
利用市售系统RNeasy总RNA试剂盒(Qiagen Inc.,Germany),从正常肺组织、原发性肺癌组织、转移性肺癌组织以及A549细胞(每一种均在第一步中得到)分离总RNA样品,随后利用messageclean试剂盒(GenHunter Corp.,Brookline,MA,U.S.)将DNA污染物从RNA样品中去除。
1-2:MIG8、MIG18、MIG19、MIG5以及MIG9
(第一步)肿瘤细胞的培养
为了实施所述mRNA差异显示法,从患子宫肌瘤已行子宫切除术的患者得到正常外子宫颈组织,以及从在外科手术之前未进行过抗癌治疗和/或放射治疗的子宫癌患者得到原发性宫颈肿瘤组织和转移性淋巴结肿瘤组织。在差异显示法中,CUMC-6(Kim,J.W.et al.,Gynecol.Oncol.62:230-240,1996)用作人类宫颈癌细胞系。
将从得到的组织获得的细胞以及CUMC-6细胞系在Waymouth′s MB 752/1培养基(Gibco)中培养,该培养基含2mM谷氨酰胺,100IU/ml青霉素,100μg/ml链霉素和10%胎牛血清(Gibco,U.S.)。本实验中采用的培养细胞处于指数生长期,且本文中采用的细胞通过台盼蓝排阻实验表现出至少95%的生存力(Freshney,″Culture of Animal Cells:A Manual of Basic Technique″2nd Ed.,A.R.Liss,New York,1987)。
(第二步)RNA的分离和mRNA差异显示法
利用市售系统RNeasy总RNA试剂盒(Qiagen Inc.,Germany),从正常外子宫颈组织、原发性宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6细胞(每一种均在第一步中得到)分离总RNA样品,随后利用message clean试剂盒(GenHunter Corp.,Brookline,MA,U.S.)将DNA污染物从RNA样品中去除。
实施例2:差异显示逆转录-聚合酶链反应(DDRT-PCR)
2-1:MIG3
利用稍作改良的逆转录-聚合酶链反应(RT-PCR,由Liang,P.和A.B.Pardee提出)实施差异显示逆转录。
首先,利用具有SEQ ID NO:3给出的DNA序列的锚定引物H-T11A(5-AAGCTTTTTTTTTTTC-3′,RNAimage试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1-1的第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP22(5′-AAGCTTTTGATCC-3′)实施PCR反应,而H-AP22具有随机5’11-mer引物(RNAimage引物组1-5)H-AP 1至40中SEQ ID NO:4给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在用于DNA测序的6%聚丙烯酰胺测序凝胶中,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取具有L276-811cDNA(碱基位置从SEQ ID NO:1的1862-2166)的305个碱基对(bp)条带。将切出的凝胶加热15分钟以洗脱该L276-811cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增L276-811cDNA,只是在此里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-2:MIG8
利用稍作改良的逆转录-聚合酶链反应(RT-PCR,由Liang,P.和A.B.Pardee提出)实施差异显示逆转录。
首先,利用具有SEQ ID NO:7给出的DNA序列的锚定引物H-T11C(5-AAGCTTTTTTTTTTTC-3′,RNAimage 试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1-2的第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP23(5′-AAGCTTGGCTATG-3′)实施PCR反应,其中H-AP23具有随机的5’11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQ IDNO:8给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取带有CC231cDNA(SEQ ID NO:5碱基位置3142-3483)的342个碱基对(bp)的条带。将切出的凝胶加热15分钟以洗脱该CC231cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增CC231cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-3:MIG10
首先,利用具有SEQ ID NO:11给出的DNA序列的锚定引物H-T11C(5-AAGCTTTTTTTTTTTC-3′,RNAimage 试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1-1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP23(5′-AAGCTTGGCTATG-3′)实施PCR反应,其中H-AP23具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP 1至40中SEQID NO:12给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取284个碱基对(bp)带有L789cDNA(SEQ IDNO:9的碱基位置1022-1305)的条带。将切出的凝胶加热15分钟以洗脱该L789cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增L789cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-4:MIG13
首先,利用具有SEQ ID NO:15给出的DNA序列的锚定引物H-T11C(5-AAGCTTTTTTTTTTTC-3′,RNAimage 试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP21(5′-AAGCTTTCTCTGG-3′)实施PCR反应,其中H-AP21具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO:16给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取295个碱基对(bp)带有L986cDNA(SEQ IDNO:13的碱基位置685-979)的条带。将切出的凝胶加热15分钟以洗脱该L986cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增L986cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-5:MIG14
首先,利用具有SEQ ID NO:19给出的DNA序列的锚定引物H-T11A(5-AAGCTTTTTTTTTTTA-3′,RNAimage 试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP21(5′-AAGCTTTCTCTGG-3′)实施PCR反应,其中H-AP21具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO:20给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取276个碱基对(bp)带有L1284cDNA(SEQ IDNO:17的碱基位置823-1098)的条带。将切出的凝胶加热15分钟以洗脱该L1284cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增L1284cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-6:MIG18
首先,利用具有SEQ ID NO:23给出的DNA序列的锚定引物H-T11A(5-AAGCTTTTTTTTTTTA-3′,RNAimage 试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP36(5′-AAGCTTCGACGCT-3′)实施PCR反应,其中H-AP36具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO:24给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取221个碱基对(bp)带有CA367cDNA(SEQID NO:21的碱基位置2920-3140)的条带。将切出的凝胶加热15分钟以洗脱该CA367cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增CA367cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-7:MIG19
首先,利用具有SEQ ID NO:27给出的DNA序列的锚定引物H-T11A(5-AAGCTTTTTTTTTTTA-3′,RNAimage试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP33(5′-AAGCTTGCTGCTC-3′)实施PCR反应,其中H-AP33具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO:28给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取381个碱基对(bp)带有CA335cDNA(SEQID NO:25的碱基位置4123-4503)的条带。将切出的凝胶加热15分钟以洗脱该CA335cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增CA335cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-8:MIG5
利用稍作改良的逆转录-聚合酶链反应(RT-PCR,由Liang,P.和A.B.Pardee提出)实施差异显示逆转录。
首先,利用具有SEQ ID NO:31给出的DNA序列的锚定引物H-T11G(5-AAGCTTTTTTTTTTTG-3′,RNAimage试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP26(5′-AAGCTTGCCATGG-3′)实施PCR反应,其中H-AP26具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP 1至40中SEQID NO:32给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取263个碱基对(bp)带有CG263cDNA(SEQID NO:29的碱基位置476-738)的条带。将切出的凝胶加热15分钟以洗脱该CG263cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增CG263cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
2-9:MIG7
利用改良的逆转录-聚合酶链反应(RT-PCR,由Liang,P.和A.B.Pardee提出)实施差异显示逆转录。
首先,利用具有SEQ ID NO:35给出的DNA序列的锚定引物H-T11G(5-AAGCTTTTTTTTTTTG-3′,RNAimage 试剂盒,Genhunter,Cor.,MA,U.S.)作为锚定寡-dT引物,对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。
然后,在存在0.5mM[α-35S]dATP(1200Ci/mmole)的情况下,利用相同的锚定引物以及引物H-AP23(5′-AAGCTTGGCTATG-3′)实施PCR反应,其中H-AP23具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO:36给出的DNA序列。PCR反应在以下条件下进行:共40个扩增循环,包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤,然后是72℃5分钟的一个最后延伸步骤。
将PCR反应中扩增的片段溶解在6%聚丙烯酰胺测序凝胶中,用于DNA测序,然后利用放射自显影来证实差异表达的条带位置。
从干凝胶中切取327个碱基对(bp)带有CG233cDNA(SEQID NO:33的碱基位置1903-2229)的条带。将切出的凝胶加热15分钟以洗脱该CG233cDNA,然后在上述相同条件下用相同的引物重复PCR反应,以再次扩增CG233cDNA,只是在这里未使用[α-35S]标记的dATP(1200Ci/mmole)和20μM dNTP。
实施例3:克隆
利用TA克隆系统(Promega,U.S.),按照生产商手册将上述均已经过再次扩增的L276-811PCR产物、CC231PCR产物、L789PCR产物、L986PCR产物、L1284PCR产物、CA367PCR产物、CA335PCR产物、CG263PCR产物以及CG233PCR产物分别插入pGEM-T EASY载体中。
(第一步)连接反应
将实施例2中均已经过再次扩增的L276-811PCR产物、CC231PCR产物、L789PCR产物、L986PCR产物、L1284PCR产物、CA367PCR产物、CA335PCR产物、CG263PCR产物以及CG233PCR产物每种各2μl,pGEM-T EASY载体1μl(50ng),T4DNA连接酶(10X缓冲液)1μl以及T4DNA连接酶(3weiss单位/μl;Promega)1μl加入0.5ml试管中,并加入蒸馏水至终体积10μl。将该连接反应混合物14℃孵育过夜。
(第二步)TA克隆的转化
将E.coli JM109(Promega,WI,U.S.)在10mlLB液体培养基(10g细菌用胰蛋白胨,5g细菌用酵母提取物,5g NaCl)中孵育,直至600nm处的光密度达到约0.3-0.6。将该孵育的混合物置于冰中约10分钟,于4℃4,000rpm离心10分钟,然后弃上清并收集细胞。将收集的细胞沉淀物置于10ml 0.1M冰冷的CaCl2中约30分钟至1小时,以生成感受态细胞。将产物再次于4℃4,000rpm离心10分钟,然后弃上清、收集细胞并悬浮于2ml 0.1M冰冷的CaCl2中。
将该感受态细胞悬浮液200μl转移至新的微量离心管(microfuge)中,并向管中加入第一步中制备的连接反应产物2μl。将得到的混合物在42℃水浴中孵育90秒,然后0℃骤冷。向管中加入800μl SOC培养基(2.0g细菌用胰蛋白胨,0.5g细菌用酵母提取物,1ml 1M NaCl,0.25ml 1M KCl,97ml TDW,1ml 2M Mg2+,1ml 2M葡萄糖),然后将得到的混合物在旋转式振荡培养箱(220rpm)中37℃孵育45分钟。
用玻璃棒将25μlX-gal(储存于40mg/ml二甲基甲酰胺中)涂布于LB盘(补充了氨苄青霉素且已提前放入37℃培养箱中)上,加入25μl转化的细胞,再次用玻璃棒涂布,然后37℃孵育过夜。孵育后,选择3-4个形成的白色菌落,并将每一种选择的细胞均接种培养于补充了氨苄青霉素的LB盘上。为了构建质粒,选择认为已经分别导入连接反应产物的菌落,并在10ml高营养(terrific)液体培养基(900ml TDW,12g细菌用胰蛋白胨,24g细菌用酵母提取物,4ml甘油,0.17M KH2PO4,100ml 0.72N K2HPO4)中培养,所述连接反应产物即转化的大肠杆菌株JM109/L276-811、JM109/CC231、JM109/L789、JM109/L986、JM109/L1284、JM109/CA367、JM109/CA335、JM109/CG263和JM109/CG233。
实施例4:重组质粒DNA的分离
利用WizardTM Plus Minipreps DNA纯化试剂盒(Promega,U.S.),按照生产商手册将L276-811质粒DNA、CC231质粒DNA、L789质粒DNA、L986质粒DNA、L1284质粒DNA、CA367质粒DNA、CA335质粒DNA、CG263质粒DNA和CG233质粒DNA中的每一种从所述转化的大肠杆菌株中分离出来。
证实用限制性内切酶ECoRI处理部分每种分离的质粒DNA,通过在2%凝胶中电泳,L276-811、CC231、L789、L986、L1284、CA367、CA335、CG263和CG233的部分序列分别插入该质粒中。
实施例5:DNA测序分析
5-1:MIG3
将实施例2中得到的L276-811PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase 2.0版DNA测序试剂盒(UnitedStates Biochemical,Cleveland,OH,U.S.),将得到的L276-811PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:1的核苷酸序列位置1862-2166,其在本发明中命名为“L276-811”。
利用5′随机引物H-AP22和3′锚定引物H-T11A,对上述得到的305bp cDNA片段例如L276-811进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图1所示,差异显示(DD)表明该基因在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中差异表达。如图1可以看出,该305bp的cDNA片段L276-811在肺癌组织、转移性肺癌组织以及A549肺癌细胞中表达,但在正常肺组织中不表达。该L276-811在癌组织特别是转移性癌组织中表达最高。
5-2:MIG8
将实施例2中得到的CC231PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),将得到的CC231PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:5的核苷酸序列位置3142-3483,其在本发明中命名为“CC231”。
利用5′随机引物H-AP23和3′锚定引物H-T11C,对上述得到的342bp cDNA片段例如CC231进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图2所示,差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图2可以看出,该342bp的cDNA片段CC231在宫颈癌、转移性淋巴结组织以及CUMC-6癌细胞中表达,但在正常组织中不表达。
5-3:MIG10
将实施例2中得到的L789PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),将得到的L789PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:9的核苷酸序列位置1022-1305,其在本发明中命名为“L789”。
利用5′随机引物H-AP23和3′锚定引物H-T11C,对上述得到的284bp cDNA片段例如L789进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图3所示,差异显示(DD)表明该基因在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中差异表达。如图3可以看出,该255bp的cDNA片段L276在肺癌组织、转移性肺癌组织以及A549肺癌细胞中表达,但在正常肺组织中不表达。该L276基因在癌组织特别是转移性癌组织中表达最高。
5-4:MIG13
将实施例2中得到的L986PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),对得到的L986PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:13的核苷酸序列位置685-979,其在本发明中命名为“L986”。
利用5′随机引物H-AP21和3′锚定引物H-T11C,对上述得到的295bp cDNA片段例如L986进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图4所示,差异显示(DD)表明该基因在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中差异表达。如图4可以看出,该255bp的cDNA片段L986在肺癌组织、转移性肺癌组织以及A549肺癌细胞中表达,但在正常肺组织中不表达。该L276-811基因在癌组织特别是转移性癌组织中表达最高。
5-5:MIG14
将实施例2中得到的L1284PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),对得到的L1284PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID N0:17的核苷酸序列位置823-1098,其在本发明中命名为“L1284”。
利用5′随机引物H-AP21和3′锚定引物H-T11A,对上述得到的276bp cDNA片段例如L1284进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图5所示,差异显示(DD)表明该基因在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中差异表达。如图5可以看出,该276bp的cDNA片段L1284在肺癌组织、转移性肺癌组织以及A549肺癌细胞中表达,但在正常肺组织中不表达。该L1284基因在癌组织特别是转移性癌组织中表达最高。
5-6:MIG18
将实施例2中得到的CA367PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),对得到的CA367PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:21的核苷酸序列位置2920-3140,其在本发明中命名为“CA367”。
利用5′随机引物H-AP36和3′锚定引物H-T11A,对上述得到的221bp cDNA片段例如CA367进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图6所示,差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图6可以看出,该221bp的cDNA片段CA367在宫颈癌组织、转移性淋巴结组织以及CUMC-6癌细胞中表达,但在正常组织中不表达。
5-7:MIG19
将实施例2中得到的CA335PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),对得到的CA335PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:25的核苷酸序列位置4123-4503,其在本发明中命名为“CA335”。
利用5′随机引物H-AP33和3′锚定引物H-T11A,对上述得到的381bp cDNA片段例如CA335进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图7所示,差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图7可以看出,该381bp的cDNA片段CA335在宫颈癌组织、转移性淋巴结组织以及CUMC-6癌细胞中表达,但在正常组织中不表达。
5-8:MIG5
将实施例2中得到的CG263PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),对得到的CG263PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:29的核苷酸序列位置476-738,其在本发明中命名为“CG263”。
利用5′随机引物H-AP26和3′锚定引物H-T11G,对上述得到的263bp cDNA片段例如CG263进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图8所示,差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图8可以看出,该263bp的cDNA片段CG263在宫颈癌组织、转移性淋巴结组织以及CUMC-6癌细胞中表达,但在正常组织中不表达。
5-9:MIG7
将实施例2中得到的CG233PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical,Cleveland,OH,U.S.),对得到的CG233PCR片段按照双脱氧链终止法进行测序。
所述基因的DNA序列对应于SEQ ID NO:33的核苷酸序列位置1903-2229,其在本发明中命名为“CG233”。
利用5′随机引物H-AP23和3′锚定引物H-T11G,对上述得到的327bp cDNA片段例如CG233进行差异显示逆转录-聚合酶链反应(DDRT-PCR),随后利用电泳来证实。
如图9所示,差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图9可以看出,该327bp的cDNA片段CG233在宫颈癌组织、转移性淋巴结组织以及CUMC-6癌细胞中表达,但在正常组织中不表达。
实施例6:全长原癌基因的cDNA序列分析
6-1:MIG3
32P标记的L276-811用作探针来筛查噬菌体λgt11人胚肺成纤维细胞(lung embryonic fibroblast)cDNA文库(Miki,T.et al.,Gene83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG3cDNA克隆,其中2295bp片段插入pCEV-LAC载体中,然后于2003年2月19日以编码号AY239293储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG3克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG3基因的pCEV-LAC载体,以获得MIG3质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
在SEQ ID NO:1的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置89-709,并且编码由SEQ ID NO:2的206个氨基酸组成的蛋白。
6-2:MIG8
32p-标记的CC231用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG8cDNA克隆,其中3737bp片段插入pCEV-LAC载体中,然后于2003年6月1日以编码号AY311389储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG8克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG8基因的pCEV-LAC载体,以获得MIG8质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
MIG18(8)的全长DNA序列由3737bp组成,并在SEQ ID NO:5中列出。
在SEQ ID NO:5的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置113-1627,并且编码由SEQ ID NO:6的504个氨基酸组成的蛋白。
6-3:MIG10
32p-标记的L789用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG10cDNA克隆,其中1321bp片段插入pCEV-LAC载体中,然后于2003年9月26日以编码号AY423725储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG10克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG10基因的pCEV-LAC载体,以获得MIG10质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
在SEQ ID NO:9的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置23-1276,并且编码由SEQ ID NO:10的417个氨基酸组成的蛋白。
6-4:MIG13
32P-标记的L986用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG13cDNA克隆,其中1019bp片段插入pCEV-LAC载体中,然后于2003年7月7日以编码号AY336090储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG13克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG13基因的pCEV-LAC载体,以获得MIG13质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
在SEQ ID NO:13的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置11-844,并且编码由SEQ ID NO:14的277个氨基酸组成的蛋白。
6-5:MIG14
32p-标记的L1284用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG14cDNA克隆,其中1142bp片段插入pCEV-LAC载体中,然后于2003年7月4日以编码号AY336091储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG14克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG14基因的pCEV-LAC载体,以获得MIG14质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
在SEQ ID NO:17的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置67-1125,并且编码由SEQ IDNO:18的352个氨基酸组成的蛋白。
6-6:MIG18
32P-标记的CA367用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG18cDNA克隆,其中3633bp片段插入pCEV-LAC载体中,然后于2003年9月30日以编码号AY423734储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG18克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG18基因的pCEV-LAC载体,以获得MIG18质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
MIG18的全长DNA序列由3633bp组成,并在SEQ ID NO:21中列出。
在SEQ ID NO:21的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置215-2212,并且编码由SEQ IDNO:22的665个氨基酸组成的蛋白。
6-7:MIG19
32P-标记的CA335用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG19cDNA克隆,其中4639bp片段插入pCEV-LAC载体中,然后于2003年10月26日以编码号AY450308储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG19克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG19基因的pCEV-LAC载体,以获得MIG19质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
MIG19的全长DNA序列由4639bp组成,并在SEQ ID NO:25中列出。
在SEQ ID NO:25的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置65-2965,并且编码由SEQ IDNO:26的966个氨基酸组成的蛋白。
6-8:MIG5
32P-标记的CG263用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG5cDNA克隆,其中833bp片段插入pCEV-LAC载体中,然后于2003年4月19日以编码号AY279384储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG5克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG5基因的pCEV-LAC载体,以获得MIG5质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
MIG5的全长DNA序列由833bp组成,并在SEQ ID NO:29中列出。
在SEQ ID NO:29的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置159-737,并且编码由SEQ IDNO:30的192个氨基酸组成的蛋白。
6-9:MIG7
32P-标记的CG233用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki,T.et al.,Gene 83:137-146,1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG7cDNA克隆,其中2364bp片段插入pCEV-LAC载体中,然后于2003年5月24日以编码号AY305872储存于U.S.NIH的GenBank数据库中(公布日期:2004年12月31日)。
通过限制性内切酶NotI剪切插入λpCEV载体中的MIG7克隆,并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki,T.et al.,Gene 83:137-146,1989)。
通过T4DNA连接酶连接含MIG7基因的pCEV-LAC载体,以获得MIG7质粒DNA,然后用连接的克隆转化大肠杆菌DH5α。
MIG7的全长DNA序列由2364bp组成,并在SEQ ID NO:33中列出。
在SEQ ID NO:33的DNA序列中,估计本发明的原癌基因的全长可读框对应于核苷酸序列位置1435-1665,并且编码由SEQ IDNO:4(34)的76个氨基酸组成的蛋白。
实施例7:多种细胞中的基因的RNA印迹分析
7-1:MIG3,MIG10,MIG13以及MIG14
以与实施例1中相同的方式从正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358(美国模式培养物收藏中心;ATCC No.CRL-5807)肺癌细胞系中提取总RNA样品。
为了确定MIG3、MIG10、MIG13和MIG14基因中每一种的表达水平,将从所述组织和细胞系每一种提取的变性总RNA样品每种各20μg在1%甲醛琼脂糖凝胶中电泳,然后将得到的琼脂糖凝胶转移至尼龙膜(Boehringer-Mannheim,Germany)上。将印迹与32P标记的并随机预处理的全长MIG cDNA探针杂交,其中探针是利用Rediprime II随机prime标记系统((Amersham,UnitedKingdom)所制备。该RNA印迹分析重复两次,因此用密度计对得到的印迹加以定量并用β-肌动蛋白进行标准化。
图10(a)示出了RNA印迹结果,以确定MIG3原癌基因是否在正常肺组织、肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中表达。如图10(a)中所示,表明MIG3原癌基因的表达水平在肺癌组织、转移性肺癌组织以及A549和NCI-H358肺癌细胞系中显著增加,但在正常肺组织中很低或未检测到。图10(a)中,泳道“正常”表示正常肺组织,泳道“癌”表示肺癌组织,泳道“转移”表示转移性肺癌组织,以及泳道“A549”和“NCI-H358”每一种均表示肺癌细胞系。图10(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图24(a)示出了RNA印迹结果,以确定MIG3原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图24(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图24(a)中所示,MIG3mRNA转录物(大约4.0kb)在正常组织中微弱表达。
图38(a)示出了RNA印迹结果,以确定MIG3原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图38(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如38(a)中所示,表明MIG3原癌基因在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。
图13(a)示出了RNA印迹结果,以确定MIG10原癌基因是否在正常肺组织、肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中表达。如图13(a)中所示,表明MIG10原癌基因的表达水平在肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中显著增加,但在正常肺组织中很低或未检测到。图13(a)中,泳道“正常”表示正常肺组织,泳道“癌”表示肺癌组织,泳道“转移”表示转移性肺癌组织,以及泳道“A549”和“NCI-H358”每一种均表示肺癌细胞系。图13(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图27(a)示出了RNA印迹结果,以确定MIG10原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图27(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图27(a)中所示,MIG10mRNA转录物(大约2.0kb)在正常组织中极微弱表达。
图41(a)示出了RNA印迹结果,以确定MIG10原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图41(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如41(a)中所示,表明MIG10原癌基因在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。还可以观察到除了2.0kb的mRNA转录物以外,还表达约2.4kb的mRNA转录物。
图14(a)示出了RNA印迹结果,以确定MIG13原癌基因是否在正常肺组织、肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中表达。如图14(a)中所示,表明MIG13原癌基因的表达水平在肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中显著增加,但在正常肺组织中很低或未检测到。图14(a)中,泳道“正常”表示正常肺组织,泳道“癌”表示肺癌组织,泳道“转移”表示转移性肺癌组织,以及泳道“A549”和“NCI-H358”每一种均表示肺癌细胞系。图14(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图28(a)示出了RNA印迹结果,以确定MIG13原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图28(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图28(a)中所示,MIG13mRNA转录物(大约1.7kb的优势转录物以及1.4kb的转录物)在正常组织中表达极微弱或未检测到。
图42(a)示出了RNA印迹结果,以确定MIG13原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图42(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图42(a)中所示,表明MIG13mRNA转录物(大约1.7kb的优势转录物以及1.4kb的转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。
图15(a)示出了RNA印迹结果,以确定MIG14原癌基因是否在正常肺组织、肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中表达。如图15(a)所示,表明MIG14原癌基因的表达水平在肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中显著增加,但在正常肺组织中很低或未检测到。图15中,泳道“正常”表示正常肺组织,泳道“癌”表示肺癌组织,泳道“转移”表示转移性肺癌组织,以及泳道“A549”和“NCI-H358”每一种均表示肺癌细胞系。图15(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图29(a)示出了RNA印迹结果,以确定MIG14原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图29(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图29(a)所示,MIG14mRNA转录物(大约1.3kb的优势转录物以及2kb的转录物)在正常组织中表达极微弱或未检测到。
图43(a)示出了RNA印迹结果,以确定MIG14原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图43(b)示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如43(a)所示,表明MIG14mRNA转录物(大约1.3kb的优势转录物以及2kb的转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。
7-2:MIG8,MIG18,MIG19,MIG5以及MIG7
以与实施例1中相同的方式从正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系CaSki(ATCC CRL 1550)和CUMC-6中提取总RNA样品。
为了确定MIG8、MIG18、MIG19、MIG5和MIG7基因中每一种的表达水平,将从所述组织和细胞系每一种提取的变性总RNA样品每种各20μg在1%甲醛琼脂糖凝胶中电泳,然后将得到的琼脂糖凝胶转移至尼龙膜(Boehringer-Mannheim,Germany)上。将印迹与32P标记的并随机预处理的(primed)全长MIG cDNA探针杂交,其中探针是利用Rediprime II随机prime标记系统(Amersham,United Kingdom)所制备。该RNA印迹分析重复两次,因此用密度计对得到的印迹加以定量并用β-肌动蛋白进行标准化。
图11示出了RNA印迹结果,以确定MIG8原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaSki和CUMC-6)中表达。如图11所示,表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG8原癌基因的表达水平增加,即过表达约4.0kb的优势MIG8mRNA转录物和约1.3kb的MIG8mRNA转录物,而且特别在转移性宫颈淋巴结组织中MIG8原癌基因表达最高,但在正常组织中表达极低。图11中,泳道“正常”表示正常外子宫颈组织,泳道“癌”表示宫颈癌组织,泳道“转移”表示转移性宫颈淋巴结组织,以及泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图12示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图25示出了RNA印迹结果,以确定MIG8原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图26示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图25所示,MIG8mRNA转录物(约4.0kb的优势MIG8mRNA转录物和约1.3kb的MIG8mRNA转录物)在正常组织例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞中微弱表达。
图39示出了RNA印迹结果,以确定MIG8原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图40示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图39所示,表明MIG8mRNA转录物(大约4.0kb的优势MIG8mRNA转录物以及约1.3kb的MIG8mRNA转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。但在皮肤癌细胞系G361中不表达约1.3kb的MIG8mRNA转录物。
图16示出了RNA印迹结果,以确定MIG18原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaSki和CUMC-6)中表达。如图16所示,表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG18原癌基因的表达水平增加,而且特别在转移性宫颈淋巴结组织中MIG18原癌基因表达最高,但在正常组织中表达极低。图16和17中,泳道“正常”表示正常外子宫颈组织,泳道“癌”表示宫颈癌组织,泳道“转移”表示转移性宫颈淋巴结组织,以及泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图17示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图30示出了RNA印迹结果,以确定MIG18原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图31示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图30所示,MIG18mRNA转录物(大约4.0kb)在正常组织例如心脏、肌肉和肝脏中微弱表达。
图44示出了RNA印迹结果,以确定MIG18原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图45示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图44所示,表明MIG18mRNA转录物在HeLa子宫癌细胞系和慢性髓细胞源性白血病细胞系K-562中表达极高,以及在前髓细胞白血病细胞系HL-60、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中以增高的水平表达。
图18示出了RNA印迹结果,以确定MIG19原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaS ki和CUMC-6)中表达。如图18所示,表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG19原癌基因的表达水平增加,即过表达约4.7kb的优势MIG19mRNA转录物,而且特别在转移性宫颈淋巴结组织中MIG19原癌基因表达最高,但在正常组织中表达极低。图18和19中,泳道“正常”表示正常外子宫颈组织,泳道“癌”表示宫颈癌组织,泳道“转移”表示转移性宫颈淋巴结组织,泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图19示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图32示出了RNA印迹结果,以确定MIG19原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图33示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图32所示,MIG19mRNA转录物(大约4.7kb的优势mRNA转录物)在正常组织例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞中表达微弱或未检测到。
图46示出了RNA印迹结果,以确定MIG19原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图47示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图46所示,表明MIG19mRNA转录物(大约4.7kb的优势MIG19mRNA转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中以极度增高的水平表达。但在皮肤癌细胞系G361中不表达约1.3kb的MIG8mRNA转录物。
图20示出了RNA印迹结果,以确定MIG5原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaSki和CUMC-6)中表达。
如图20所示,表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG5原癌基因的表达水平增加,即过表达约5.5kb的优势MIG5mRNA转录物,而且特别在转移性宫颈淋巴结组织中MIG5原癌基因表达最高,但在正常组织中不表达。图20和21中,泳道“正常”表示正常外子宫颈组织,泳道“癌”表示宫颈癌组织,泳道“转移”表示转移性宫颈淋巴结组织,以及泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图21示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图34示出了RNA印迹结果,以确定MIG5原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图35示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图34所示,MIG5mRNA转录物(大约5.5kb的优势mRNA转录物)在正常组织例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞中不表达。
图48示出了RNA印迹结果,以确定MIG5原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图49示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图48所示,表明MIG5mRNA转录物(大约5.5kb的优势mRNA转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中以极度增高的水平表达。但在皮肤癌细胞系G361中不表达约1.3kb的MIG8mRNA转录物。
图22示出了RNA印迹结果,以确定MIG19原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaSki和CUMC-6)中表达。如图22所示,表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG7原癌基因的表达水平增加,即过表达约10kb的优势MIG7mRNA转录物,而且特别在转移性宫颈淋巴结组织中MIG7原癌基因表达最高,但在正常组织中表达极低。图22和23中,泳道“正常”表示正常外子宫颈组织,泳道“癌”表示宫颈癌组织,泳道“转移”表示转移性宫颈淋巴结组织,以及泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图23示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。
图36示出了RNA印迹结果,以确定MIGl9原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达,例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图37示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图36所示,MIG7mRNA转录物(大约10kb的优势mRNA转录物)在正常组织例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞中表达微弱或检测不到。
图50示出了RNA印迹结果,以确定MIG7原癌基因是否在人类癌细胞系中表达,例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图51示出了RNA印迹结果,通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图50所示,表明MIG7mRNA转录物(大约10kb的优势mRNA转录物)在HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480以及肺癌细胞系A549中以极度增高的水平表达。
实施例8:确定用原癌基因转化大肠杆菌后所表达蛋白的大小
将全长MIG原癌基因的每一种例如SEQ ID NO:1的MIG3、SEQ ID NO:5的MIG8、SEQ ID NO:9的MIG10、SEQ ID NO:13的MIG13、SEQ ID NO:17的MIG14、SEQ ID NO:21的MIG18、SEQ ID NO:25的MIG 19、SEQ ID NO:29的MIG 5、以及SEQ IDNO:33的MIG 7均插入pBAD/thio-Topo载体(Invitrogen,U.S.)的多克隆位点,然后用得到的每一种pBAD/thio-Topo/MIG载体转化大肠杆菌Top10(Invitrogen,U.S.)。将表达蛋白HT-硫氧还蛋白插入pBAD/thio-Topo载体多克隆位点的上游区域。将每一种转化的大肠杆菌株在LB液体培养基中振荡孵育,然后将每一种得到的培养物以1/100的比例稀释,孵育3小时,并加入0.5mM L-阿拉伯糖(Sigma),以促进蛋白生成。
L-阿拉伯糖诱导(induction)前/后,对培养物中的大肠杆菌细胞进行超声处理,然后对超声处理的匀浆进行12%十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)。
图52示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG3载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约38kDa分子量的融合蛋白条带。该38kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约23kDa分子量的MIG3蛋白,每种蛋白均插入pBAD/thio-Topo/MIG3载体中。
图53示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG8载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约72kDa分子量的融合蛋白条带。该72kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约57kDa分子量的MIG8蛋白,每种蛋白均插入pBAD/thio-Topo/MIG8载体中。
图54示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG10载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约60kDa分子量的融合蛋白条带。该60kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约45kDa分子量的MIG10蛋白,每种蛋白均插入pBAD/thio-Topo/MIG10载体中。
图55示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG13载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约46kDa分子量的融合蛋白条带。该46kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约31kDa分子量的MIG13蛋白,每种蛋白均插入pBAD/thio-Topo/MIG13载体中。
图56示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG14载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约54kDa分子量的融合蛋白条带。该54kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约39kDa分子量的MIG14蛋白,每种蛋白均插入pBAD/thio-Topo/MIG14载体中。
图57示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG18载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约88kDa分子量的融合蛋白条带。该88kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约73kDa分子量的MIG18蛋白,每种蛋白均插入pBAD/thio-Topo/MIG18载体中。
图58示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG19载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约122kDa分子量的融合蛋白条带。该122kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约107kDa分子量的MIG19蛋白,每种蛋白均插入pBAD/thio-Topo/MIG19载体中。
图59示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG5载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约36kDa分子量的融合蛋白条带。该36kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约21kDa分子量的MIG5蛋白,每种蛋白均插入pBAD/thio-Topo/MIG5载体中。
图60示出了SDS-PAGE结果,以确定用pBAD/thio-Topo/MIG7载体转化的大肠杆菌Top10株的蛋白表达模式,其中在L-阿拉伯糖诱导后,可以清楚地观察到大约24kDa分子量的融合蛋白条带。该24kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约9kDa分子量的MIG7蛋白,每种蛋白均插入pBAD/thio-Topo/MIG7载体中。
工业应用
如上所述,本发明的原癌基因是参与人类致癌作用同时具有诱导癌症转移能力的新基因,可有效用于诊断癌症,包括肺癌、白血病、子宫癌、淋巴瘤、结肠癌、皮肤癌等,还用于产生转化的动物等。
序 列 表
<110>金弦起(KIM,HYUN KEE)
<120>人类原癌基因及其编码的蛋白(HUMAN PROTOONCOGENE AND PROTEIN ENCODEDTHEREIN)
<160>36
<170>KopatentIn 1.71
<210>1
<211>2295
<212>DNA
<213>Homo sapiens
<400>1
aaagtctgcc tctctagcta caacatttct tcaagaaaag aaagcagaag cccagaatca 60
taatcgtgtc cctgatgtaa aggcattaat ggagagtccc gagggacagt tatctctgga 120
gcccaaatct gatagtcact tccaagcatc acacactggg tgccagagcc ctttatgttc 180
agcccagcgt cacactcctc agagcccctt caccaatcat gctgcagctg ctggcaggaa 240
gactcttcgc agctgcatgg ggctggagtg gtttccagag ctctatcctg gttaccttgg 300
actaggggtg ttgccaggga agcctcagtg ttggaatgca atgacccaga agccacaact 360
tatcagtccc cagggggaaa gactctcgca agtttctttg ttggaacgaa gctcaactca 420
tataaggagt ttggaacccc ctaccggact tacaacctcc aacttctctc taatgaggct 480
cttgggagct gtacaaaaag gctggatcag gtgcaacacc accataagga agagtggatt 540
cggtggcatc acgatgctct tcacaggata cttcgtcctg tgttgtagct ggagtttcag 600
acgtctgaaa aaattgtgcc gacccctgcc ctggaagagc acagtacctc catgcattgg 660
tgtggcgaag acgactgggg attgccgctc taaaacatgt ttggattagg aagcacgttt 720
aagtaggaga agccttcgtg acttctctct agtgccttcg tgccctgtgt tgcccactga 780
attgccctgt aacacctaag tgtagtggta gcattaaggg atagcttttc agccctcaag 840
gttatcagga gcatttgtat cactgctata aataaagtag tatcacttgt cataatcagg 900
gtgctgaaac ataatgaaaa ggtttaactt agtcacagta aatattttat atccctgaaa 960
ataagttatt taatgagaat agaactattt aatgatccat gagtcctaaa aggatatctg 1020
ccttgtattg ccaagtttaa ggcaaaggtg agatcctgta ttaataagaa gacagctttt 1080
ttgtttgaca ttggtaagta ccaagaattc taactcacat atagtaggaa acaacaaaaa 1140
gtctccactg acttctttga attagatact gagaatccac aatacagtag tgtggataac 1200
tttcaagaag ccattggaaa catctccaca ttctgggatg acttgtaaat gtctacagag 1260
taatggaagg aaaggcttcc ttgtctgctc attgctgcca cctgggttgg gaaaataatt 1320
gaagatgttt tctcaagtcc ttcaagaatc tcttcttaat gttcagaata gtttaagagc 1380
gttgttgagg taaagtgata gctgattatt ttctgagatt tagatctaaa caaactcagc 1440
atgacgagga agcacacttc acagctccag ggtgcaatac tgatgtaaag ttgcctcgtg 1500
aggatacatt tttcgctcat gtatgcaaaa ttcctatcag ttcatttgca cagccagttc 1560
caatcatgta tgtgatcacc agattaaaag cttcatccag aaagacaaga ctcctcagaa 1620
cgaatagtag acaagtaaga ctgctaccca cagaagccag tacgcttcag gtgtgaggcg 1680
gggtaactac tcatctcttc acagagccaa ggaaagaaaa agaacgtctc taacatgatt 1740
taccatttta aacagcctta taagttttgt ctcttaaaat catgctgcag aaggaggggg 1800
taaaagtcgt gttctgccct gtctgtggca ttggagtgcc ccgctaggta agaagcaatg 1860
cttagatctt gcttccaggc agcagcttga attcccgaat cttcctgcaa ggtgcataca 1920
aatgcagcgt gagaatccat acacgtaatc catattcacc ttcccatcca tcccgcagaa 1980
gaggcatggt gacacccagg ctactgtcca tgcttgagag gacgtatttg aaggttctgt 2040
tactacaagt tgggaatatt cacggacatg cctgaatacc ccggctgtaa ctcacacgtg 2100
gtctgtgtaa gtggattaac ctcggggcgg ccttgtttaa tcctgaataa tatctgaaag 2160
actgagttta cttgggaatg tgtagttttt ctaatgcaca ttaaaattta ttttagctgt 2220
taaaaataaa atcattttat tatcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2280
aaaaaaaaaa aaaaa 2295
<210>2
<211>206
<212>PRT
<213>Homo sapiens
<400>2
Met Glu Ser Pro Glu Gly Gln Leu Ser Leu Glu Pro Lys Ser Asp Ser
1 5 10 15
His Phe Gln Ala Ser His Thr Gly Cys Gln Ser Pro Leu Cys Ser Ala
20 25 30
Gln Arg His Thr Pro Gln Ser Pro Phe Thr Asn His Ala Ala Ala Ala
35 40 45
Gly Arg Lys Thr Leu Arg Ser Cys Met Gly Leu Glu Trp Phe Pro Glu
50 55 60
Leu Tyr Pro Gly Tyr Leu Gly Leu Gly Val Leu Pro Gly Lys Pro Gln
65 70 75 80
Cys Trp Asn Ala Met Thr Gln Lys Pro Gln Leu Ile Ser Pro Gln Gly
85 90 95
Glu Arg Leu Ser Gln Val Ser Leu Leu Glu Arg Ser Ser Thr His Ile
100 105 110
Arg Ser Leu Glu Pro Pro Thr Gly Leu Thr Thr Ser Asn Phe Ser Leu
115 120 125
Met Arg Leu Leu Gly Ala Val Gln Lys Gly Trp Ile Arg Cys Asn Thr
130 135 140
Thr Ile Arg Lys Ser Gly Phe Gly Gly Ile Thr Met Leu Phe Thr Gly
145 150 155 160
Tyr Phe Val Leu Cys Cys Ser Trp Ser Phe Arg Arg Leu Lys Lys Leu
165 170 175
Cys Arg Pro Leu Pro Trp Lys Ser Thr Val Pro Pro Cys Ile Gly Mal
180 185 190
Ala Lys Thr Thr Gly Asp Cys Arg Ser Lys Thr Cys Leu Asp
195 200 205
<210>3
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11A Primer
<400>3
aagctttttt tttttc 16
<210>4
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP22 primer
<400>4
aagcttttga tcc 13
<210>5
<211>3737
<212>DNA
<213>Homo sapiens
<400>5
cggcagctgg aggtgtaata gtgcgggtag tgggtttgga gaagttccga ggcggcggtg 60
gcgccggtca ggacaaggat agcggaaccg ggccctgggc ttgtcgctca ccatgccgac 120
agtagaggag ctttaccgca attatggcat cctggccgat gccacggagc aagtgggcca 180
gcataaagat gcctatcaag tgatattgga tggtgtgaaa ggtggtacta aggaaaagcg 240
attagcagct caatttattc cgaaattctt taagcatttt ccagaattgg ctgattctgc 300
tatcaatgca cagttagacc tctgtgagga tgaagatgta tctattcgac gtcaagcaat 360
taaagaactg cctcaatttg ccactggaga aaatcttcct cgagtggcag atatactaac 420
gcaacttttg cagacagatg actctgcaga atttaaccta gtgaacaatg ccctattaag 480
tatatttaaa atggatgcaa aagggacttt aggtgggttg ttcagccaaa tacttcaagg 540
agaggacatt gttagagaac gagcaattaa attcctttct acaaaactta agactttacc 600
agatgaagtc ttaacaaagg aagtggaaga gcttatacta actgaatcca aaaaggtcct 660
agaagatgtg actggtgaag aatttgttct atttatgaag atactgtctg ggttaaaaag 720
cttacagaca gtgagtggaa gacagcaact tgtagagttg gtggctgaac aggccgacct 780
agaacagacc ttcaatccct cggatcctga ctgtgtggac aggctcttac agtgcactcg 840
gcaggcagta cccctcttct ctaaaaatgt ccattccaca aggtttgtga catatttctg 900
tgagcaggtt ctccctaacc tcggtacctt gactacccca gtggaaggtc ttgatataca 960
gttggaggta ttgaaattgt tggcggagat gagttcattt tgtggtgaca tggaaaaact 1020
agaaacaaat ttaaggaaac tatttgataa gttattggaa tacatgcccc tccctccaga 1080
agaggcagaa aatggagaga atgctggtaa tgaagaaccc aagctacagt tcagttatgt 1140
ggaatgtttg ttgtacagtt ttcaccagtt gggccgaaaa cttccagatt tcttaacagc 1200
caaactgaat gcagaaaagc tcaaagattt caaaatcagg ctgcagtact ttgcacgggg 1260
cctgcaagtt tatatcagac aacttcgctt agctctccag ggtaaaacgg gtgaggcctt 1320
aaaaacagaa gagaacaaga ttaaagtcgt tgcattgaaa ataacaaaca atatcaatgt 1380
tttaatcaag gatctcttcc acattcctcc ttcttataag agcacagtaa cactatcctg 1440
gaaacctgta caaaaggttg agattgggca aaagagagcc agtgaagata caacttcagg 1500
ttcaccaccc aagaaatctt cagcaggacc aaaaagagat gccaggcaga tttataaccc 1560
tcccagtggg aaatatagca gcaatttggg caactttaat tatgagagga gccttcaggg 1620
gaagtagagg tggccgaggt tggggcacac gaggaaatcg tagtcgggga agactctact 1680
gaataagaca tcagcattct tcagcattgt catgagctta atatacttaa attctactac 1740
tcattggatt gccggggatg tccctttaaa cagactgctg ccttcagcta aaaacttaat 1800
gttctttata cctttgtatg tatgacctac ttttgtaaca gaccatggtt gtgtccaagg 1860
taaaaccaca gtgatatttt tggatgcttt gtctgcaatc ttgacttgtt tttgcagtat 1920
cattattcag acttcaaatt gtgaatcttt taaacatctt gataatttgt tgttgagagc 1980
tgttcattct aaaatgtaat gaaattcagt ctagttctgc tgataaagat catcagtttt 2040
gaaaggttac tgattttcct cttccctctt agttttttac ccaatatatg gagaagagta 2100
atggtcaatc ttaacatttt gttttaattg tttaataaag ctgctgggca gtggtgcagc 2160
attcctacct agtgtcataa aagcaaaata cttacatagc tttcttaaaa tataggaatg 2220
acattacatt tttaggagaa agtaagttgc tttgcaccgc ctacttaatt cttttccata 2280
tattgtgata caaacttttg aatatggaat cttactattt gaatagaaat gtgtatgtat 2340
aatatacata catacataag catatatgtg tgtgtgtgtg tgtatatata tatatatgca 2400
tgctgtgaaa cttgactaca caacataaat cactttttaa attccaggaa cgggtagtct 2460
gacacggtga ttatcctttt gaggctgaat ccgttattaa cttgttattt aggtttttac 2520
tcccagtagc aagggattct aagttagttg cacttacatg attattgtta tttaaaacta 2580
agaataaagg ctgcattttc aaagataaat tggaattgct gttggtgaaa taacaaccaa 2640
aatactgaat ctgatgtaca tacaggtttc tacaggaaga gatggtataa tttacaattt 2700
ggagatttaa taaccagggc tacccagaaa aagtgacttg ataacatggt accaataagt 2760
aagggatgct ctctcggttt gcttttgcca ctttcaagat tttaacttct caggttatta 2820
atcaaaatta ttgtataagt tagccaatag aatttttagg ttaaaacaac agatgggggg 2880
tttgtggagt gtttaatgtc atgggcattt ttagtagcat agaccctttg ttctgcattt 2940
gaatgtttcg tatatttttg tttcacagtt aatcttccct ccccaagttt gctattcaaa 3000
tcaactgcct gaatgacatt tctagtagtc tgatgtattt ttctgaggaa tagtttgtga 3060
ttccaatgca ggtgtcttca ttaccattac ctctacactg cagaagaagc aaaactcctt 3120
tattagaatt actgcacatg tgtatgggga aaatagttct gaaaggctag aatgatacaa 3180
gtgagcaaaa gttggtcagc ttggctatgg agtggtggca ataatctcta aacattccaa 3240
aagaccatga gctgaaccta aactcccttg gaatctgaac aaaggaatat aaaattgcca 3300
tttgaaaact gaccagctaa tctggacctc agagatagat cagccagtgg cccaaagcca 3360
tttcaagtac agaaattata gagactacag ctaaataaat ttgaacatta aatataattt 3420
taccactttt tgtctttata agcatatttg taaactcaga actgagcaga agtgacttta 3480
ctttctcaag tttgatactg agttgactgt tcccttatcc ctcacccttc cccttccctt 3540
tcctaaggca atagtgcaca acttaggtta tttttgcttc cgaatttgaa tgaaaaactt 3600
aatgccatgg atttttttct tttgcaagac acctgtttat catcttgttt aaatgtaaat 3660
gtccccttat gcttttgaaa taaatttcct tttgtaattt taaaaaaaaa aaaaaaaaaa 3720
aaaaaaaaaa aaaaaaa 3737
<210>6
<211>504
<212>PRT
<213>Homo sapiens
<400>6
Met Pro Thr Val Glu Glu Leu Tyr Arg Asn Tyr Gly Ile Leu Ala Asp
1 5 10 15
Ala Thr Glu Gln Val Gly Gln His Lys Asp Ala Tyr Gln Val Ile Leu
20 25 30
Asp Gly Val Lys Gly Gly Thr Lys Glu Lys Arg Leu Ala Ala Gln Phe
35 40 45
Ile Pro Lys Phe Phe Lys His Phe Pro Glu Leu Ala Asp Ser Ala Ile
50 55 60
Asn Ala Gln Leu Asp Leu Cys Glu Asp Glu Asp Val Ser Ile Arg Arg
65 70 75 80
Gln Ala Ile Lys Glu Leu Pro Gln Phe Ala Thr Gly Glu Asn Leu Pro
85 90 95
Arg Val Ala Asp Ile Leu Thr Gln Leu Leu Gln Thr Asp Asp Ser Ala
100 105 110
Glu Phe Asn Leu Val Asn Asn Ala Leu Leu Ser Ile Phe Lys Met Asp
115 120 125
Ala Lys Gly Thr Leu Gly Gly Leu Phe Ser Gln Ile Leu Gln Gly Glu
130 135 140
Asp Ile Val Arg Glu Arg Ala Ile Lys Phe Leu Ser Thr Lys Leu Lys
145 150 155 160
Thr Leu Pro Asp Glu Val Leu Thr Lys Glu Val Glu Glu Leu Ile Leu
165 170 175
Thr Glu Ser Lys Lys Val Leu Glu Asp Val Thr Gly Glu Glu Phe Val
180 185 190
Leu Phe Met Lys Ile Leu Ser Gly Leu Lys Ser Leu Gln Thr Val Ser
195 200 205
Gly Arg Gln Gln Leu Val Glu Leu Val Ala Glu Gln Ala Asp Leu Glu
210 215 220
Gln Thr Phe Asn Pro Ser Asp Pro Asp Cys Val Asp Arg Leu Leu Gln
225 230 235 240
Cys Thr Arg Gln Ala Val Pro Leu Phe Ser Lys Asn Val His Ser Thr
245 250 255
Arg Phe Val Thr Tyr Phe Cys Glu Gln Val Leu Pro Asn Leu Gly Thr
260 265 270
Leu Thr Thr Pro Val Glu Gly Leu Asp Ile Gln Leu Glu Val Leu Lys
275 280 285
Leu Leu Ala Glu Met Ser Ser Phe Cys Gly Asp Met Glu Lys Leu Glu
290 295 300
Thr Asn Leu Arg Lys Leu Phe Asp Lys Leu Leu Glu Tyr Met Pro Leu
305 310 315 320
Pro Pro Glu Glu Ala Glu Asn Gly Glu Asn Ala Gly Asn Glu Glu Pro
325 330 335
Lys Leu Gln Phe Ser Tyr Val Glu Cys Leu Leu Tyr Ser Phe His Gln
340 345 350
Leu Gly Arg Lys Leu Pro Asp Phe Leu Thr Ala Lys Leu Asn Ala Glu
355 360 365
Lys Leu Lys Asp Phe Lys Ile Arg Leu Gln Tyr Phe Ala Arg Gly Leu
370 375 380
Gln Val Tyr Ile Arg Gln Leu Arg Leu Ala Leu Gln Gly Lys Thr Gly
385 390 395 400
Glu Ala Leu Lys Thr Glu Glu Asn Lys Ile Lys Val Val Ala Leu Lys
405 410 415
Ile Thr Asn Asn Ile Asn Val Leu Ile Lys Asp Leu Phe His Ile Pro
420 425 430
Pro Ser Tyr Lys Ser Thr Val Thr Leu Ser Trp Lys Pro Val Gln Lys
435 440 445
Val Glu Ile Gly Gln Lys Arg Ala Ser Glu Asp Thr Thr Ser Gly Ser
450 455 460
Pro Pro Lys Lys Ser Ser Ala Gly Pro Lys Arg Asp Ala Arg Gln Ile
465 470 475 480
Tyr Asn Pro Pro Ser Gly Lys Tyr Ser Ser Asn Leu Gly Asn Phe Asn
485 490 495
Tyr Glu Arg Ser Leu Gln Gly Lys
500
<210>7
<211>16
<212>DNA
<213>Artificia1 Sequence
<220>
<223>H-T11C primer
<400>7
aagctttttt tttttc 16
<210>8
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP23 primer
<400>8
aagcttggct atg 13
<210>9
<211>1321
<212>DNA
<213>Homo sapiens
<400>9
tctccccagc tgtatttcca aaatgtcgct ttctaacaag ctgacgctgg acaagctgga 60
cgttaaaggg aagcgggtcg ttatgagagt cgacttcaat gttcctatga agaacaacca 120
gataacaaac aaccagagga ttaaggctgc tgtcccaagc atcaaattct gcttggacaa 180
tggagccaag tcggtagtcc ttatgagcca cctaggccgg cctgatggtg tgcccatgcc 240
tgacaagtac tccttagagc cagttgctgt agaactcaaa tctctgctgg gcaaggatgt 300
tctgttcttg aaggactgtg taggcccaga agtggagaaa gcctgtgcca acccagctgc 360
tgggtctgtc atcctgctgg agaacctccg ctttcatgtg gaggaagaag ggaagggaaa 420
agatgcttct gggaacaagg ttaaagccga gccagccaaa atagaagctt tccgagcttc 480
actttccaag ctaggggatg tctatgtcaa tgatgctttt ggcactgctc acagagccca 540
cagctccatg gtaggagtca atctgccaca gaaggctggt gggtttttga tgaagaagga 600
gctgaactac tttgcaaagg ccttggagag cccagagcga cccttcctgg ccatcctggg 660
cggagctaaa gttgcagaca agatccagct catcaataat atgctggaca aagtcaatga 720
gatgattatt ggtggtggaa tggcttttac cttccttaag gtgctcaaca acatggagat 780
tggcacttct ctgtttgatg aagagggagc caagattgtc aaagacctaa tgtccaaagc 840
tgagaagaat ggtgtgaaga ttaccttgcc tgttgacttt gtcactgctg acaagtttga 900
tgagaatgcc aagactggcc aagccactgt ggcttctggc atacctgctg gctggatggg 960
cttggactgt ggtcctgaaa gcagcaagaa gtatgctgag gctgtcactc gggctaagca 1020
gattgtgtgg aatggtcctg tgggggtatt tgaatgggaa gcttttgccc ggggaaccaa 1080
agctctcatg gatgaggtgg tgaaagccac ttctaggggc tgcatcacca tcataggtgg 1140
tggagacact gccacttgct gtgccaaatg gaacacggag gataaagtca gccatgtgag 1200
cactgggggt ggtgccagtt tggagctcct ggaaggtaaa gtccttcctg gggtggatgc 1260
tctcagcaat atttagtact ttcctgcctt ttagttcctg tgcacagccc ctaagtcaac 1320
t 1321
<210>10
<211>417
<212>PRT
<213>Homo sapiens
<400>10
Met Ser Leu Ser Asn Lys Leu Thr Leu Asp Lys Leu Asp Val Lys Gly
1 5 10 15
Lys Arg Val Val Met Arg Val Asp Phe Asn Val Pro Met Lys Asn Asn
20 25 30
Gln Ile Thr Asn Asn Gln Arg Ile Lys Ala Ala Val Pro Ser Ile Lys
35 40 45
Phe Cys Leu Asp Asn Gly Ala Lys Ser Val Val Leu Met Ser His Leu
50 55 60
Gly Arg Pro Asp Gly Val Pro Met Pro Asp Lys Tyr Ser Leu Glu Pro
65 70 75 80
Val Ala Val Glu Leu Lys Ser Leu Leu Gly Lys Asp Val Leu Phe Leu
85 90 95
Lys Asp Cys Val Gly Pro Glu Val Glu Lys Ala Cys Ala Asn Pro Ala
100 105 110
Ala Gly Ser Val Ile Leu Leu Glu Asn Leu Arg Phe His Val Glu Glu
115 120 125
Glu Gly Lys Gly Lys Asp Ala Ser Gly Asn Lys Val Lys Ala Glu Pro
130 135 140
Ala Lys Ile Glu Ala Phe Arg Ala Ser Leu Ser Lys Leu Gly Asp Val
145 150 155 160
Tyr Val Asn Asp Ala Phe Gly Thr Ala His Arg Ala His Ser Ser Met
165 170 175
Val Gly Val Asn Leu Pro Gln Lys Ala Gly Gly Phe Leu Met Lys Lys
180 185 190
Glu Leu Asn Tyr Phe Ala Lys Ala Leu Glu Ser Pro Glu Arg Pro Phe
195 200 205
Leu Ala Ile Leu Gly Gly Ala Lys Val Ala Asp Lys Ile Gln Leu Ile
210 215 220
Asn Asn Met Leu Asp Lys Val Asn Glu Met Ile Ile Gly Gly Gly Met
225 230 235 240
Ala Phe Thr Phe Leu Lys Val Leu Asn Asn Met Glu Ile Gly Thr Ser
245 250 255
Leu Phe Asp Glu Glu Gly Ala Lys Ile Val Lys Asp Leu Met Ser Lys
260 265 270
Ala Glu Lys Asn Gly Val Lys Ile Thr Leu Pro Val Asp Phe Val Thr
275 280 285
Ala Asp Lys Phe Asp Glu Asn Ala Lys Thr Gly Gln Ala Thr Val Ala
290 295 300
Ser Gly Ile Pro Ala Gly Trp Met Gly Leu Asp Cys Gly Pro Glu Ser
305 310 315 320
Ser Lys Lys Tyr Ala Glu Ala Val Thr Arg Ala Lys Gln Ile Val Trp
325 330 335
Asn Gly Pro Val Gly Val Phe Glu Trp Glu Ala Phe Ala Arg Gly Thr
340 345 350
Lys Ala Leu Met Asp Glu Val Val Lys Ala Thr Ser Arg Gly Cys Ile
355 360 365
Thr Ile Ile Gly Gly Gly Asp Thr Ala Thr Cys Cys Ala Lys Trp Asn
370 375 380
Thr Glu Asp Lys Va1 Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu
385 390 395 400
Glu Leu Leu Glu Gly Lys Val Leu Pro Gly Val Asp Ala Leu Ser Asn
405 410 415
Ile
<210>11
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11C primer
<400>11
aagctttttt tttttc 16
<210>12
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP23 primer
<400>12
aagcttggct atg 13
<210>13
<211>1019
<212>DNA
<213>Homo sapiens
<400>13
ctataggcgc atggaaggtt ccctggaacg ggaggcgcca gcgggggcgc tggccgccgt 60
gctaaagcac agctcgacgt tgccgcccga aagcacccag gtccggggct acgacttcaa 120
ccgcggtgtg aattaccgcg cactgctgga ggccttcggc accaccggct tccaagcaac 180
caacttcggg cgcgctgtac agcaagtcaa tgccatgatc gagaagaagc tggaaccact 240
gtcacaggat gaagaccagc acgcggacct gacccagagc cgccgcccac ttaccagctg 300
caccattttc ctgggatata catccaacct catcagttca ggcatccgtg agaccattcg 360
ctaccttgtg cagcacaaca tggtggacgt attggtgacc acagctggcg gcgtggagga 420
agacctcatc aagtgcctgg cgcccacata cttgggcgag tttagcctca gggggaagga 480
gctccgggag aacgggatca ataggatcgg aaacctgctg gtgcccaatg agaattactg 540
caagtttgag gactggctga tgcccattct ggaccagatg gtgatggagc agaacacaga 600
gggtgtaaag tggacgcctt ctaagatgat cgcccggctg ggcaaggaga tcaacaaccc 660
agagtccgtg tattactggg cccagaagaa ccacatccct gtgtttagtc ccgcacttac 720
agacggctcg ctgggcgaca tgatcttctt ccattcctac aagaacccgg gcctggtcct 780
ggacatcgtt gaggcggaac ggggccgact acgctgttta catcaacaca gcccaggagt 840
ttgatggctc tgactcaggt gcccgaccag acgaggctgt ctcctggggc aagatccggg 900
tggatgcaca gcccgtcaag gtctatgctg acgcctccct ggtcttcccc ctgcttgtgg 960
ctgaaacctt tgcccagaag atggatgcct tcatgcatga gaagaacgag gactgagcg 1019
<210>14
<211>277
<212>PRT
<213>Homo sapiens
<400>14
Met Glu Gly Ser Leu Glu Arg Glu Ala Pro Ala Gly Ala Leu Ala Ala
1 5 10 15
Val Leu Lys His Ser Ser Thr Leu Pro Pro Glu Ser Thr Gln Val Arg
20 25 30
Gly Tyr Asp Phe Asn Arg Gly Val Asn Tyr Arg Ala Leu Leu Glu Ala
35 40 45
Phe Gly Thr Thr Gly Phe Gln Ala Thr Asn Phe Gly Arg Ala Val Gln
50 55 60
Gln Val Asn Ala Met Ile Glu Lys Lys Leu Glu Pro Leu Ser Gln Asp
65 70 75 80
Glu Asp Gln His Ala Asp Leu Thr Gln Ser Arg Arg Pro Leu Thr Ser
85 90 95
Cys Thr Ile Phe Leu Gly Tyr Thr Ser Asn Leu Ile Ser Ser Gly Ile
100 105 110
Arg Glu Thr Ile Arg Tyr Leu Val Gln His Asn Met Val Asp Val Leu
115 120 125
Val Thr Thr Ala Gly Gly Val Glu Glu Asp Leu Ile Lys Cys Leu Ala
130 135 140
Pro Thr Tyr Leu Gly Glu Phe Ser Leu Arg Gly Lys Glu Leu Arg Glu
145 150 155 160
Asn Gly Ile Asn Arg Ile Gly Asn Leu Leu Val Pro Asn Glu Asn Tyr
165 170 175
Cys Lys Phe Glu Asp Trp Leu Met Pro Ile Leu Asp Gln Met Val Met
180 185 190
Glu Gln Asn Thr Glu Gly Val Lys Trp Thr Pro Ser Lys Met Ile Ala
195 200 205
Arg Leu Gly Lys Glu Ile Asn Asn Pro Glu Ser Val Tyr Tyr Trp Ala
210 215 220
Gln Lys Asn His Ile Pro Val Phe Ser Pro Ala Leu Thr Asp Gly Ser
225 230 235 240
Leu Gly Asp Met Ile Phe Phe His Ser Tyr Lys Asn Pro Gly Leu Val
245 250 255
Leu Asp Ile Val Glu Ala Glu Arg Gly Arg Leu Arg Cys Leu His Gln
260 265 270
His Ser Pro Gly Val
275
<210>15
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11C primer
<400>15
aagctttttt tttttc 16
<210>16
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP21 primer
<400>16
aagctttctc tgg 12
<210>17
<211>1142
<212>DNA
<213>Homo sapiens
<400>17
gagaccccca ggttcaaaat aagcctgttt ggaacaacct caggttttgg aaccagtggg 60
accagcatgt ttggcagtgc aactacagac aatcacaatc ccatgaagga tattgaagta 120
acatcatctc ctgatgatag cattggttgt ctgtctttta gcccaccaac cttgccgggg 180
aactttctta ttgcagggtc atgggctaat gatgttcgct gctgggaagt tcaagacagt 240
ggacagacca ttccaaaagc ccagcagatg cacactgggc ctgtgcttga tgtctgctgg 300
agtgacgatg ggagcaaagt gtttacggca tcgtgtgata aaactgccaa aatgtgggac 360
ctcagcagta accaaacgat acagatcgca cagcatgatg ctcctgttaa aaccatccat 420
tggatcaaag ctccaaacta cagctgtgtg atgactggga gctgggataa gactttaaag 480
ttttgggata ctcgatcgtc aaatcctatg atggttttgc aactccctga aaggtgttac 540
tgtgctgacg tgatataccc catggctgtg gtggcaactg cagagagggg cctgattgtc 600
tatcagctag agaatcaacc ttctgaattc aggaggatag aatctccact gaaacatcag 660
catcggtgtg tggctatttt taaagacaaa cagaacaagc ctactggttt tgccctggga 720
agtatcgagg ggagagttgc tattcactat atcaaccccc cgaaccccgc caaagataac 780
ttcaccttta aatgtcatcg atctaatgga accaacactt cagctcctca ggacatttat 840
gcggtaaatg gaatcgcgtt ccatcctgtt catggcaccc ttgcaactgt gggatctgat 900
ggtagattca gcttctggga caaagatgcc agaacaaaac taaaaacttc ggaacagtta 960
gatcagccca tctcagcttg ctgtttcaat cacaatggaa acatatttgc atacgcttcc 1020
agctacgact ggtcaaaggg acatgaattt tataatcccc agaaaaaaaa ttacattttc 1080
ctgcgtaatg cagccgaaga gctaaagccc aggaataaga agtagtggct ggagactctg 1140
gc 1142
<210>18
<211>352
<212>PRT
<213>Homo sapiens
<400>18
Met Phe Gly Ser Ala Thr Thr Asp Asn His Asn Pro Met Lys Asp Ile
1 5 10 15
Glu Val Thr Ser Ser Pro Asp Asp Ser Ile Gly Cys Leu Ser Phe Ser
20 25 30
Pro Pro Thr Leu Pro Gly Asn Phe Leu Ile Ala Gly Ser Trp Ala Asn
35 40 45
Asp Val Arg Cys Trp Glu Val Gln Asp Ser Gly Gln Thr Ile Pro Lys
50 55 60
Ala Gln Gln Met His Thr Gly Pro Val Leu Asp Val Cys Trp Ser Asp
65 70 75 80
Asp Gly Ser Lys Val Phe Thr Ala Ser Cys Asp Lys Thr Ala Lys Met
85 90 95
Trp Asp Leu Ser Ser Asn Gln Thr Ile Gln Ile Ala Gln His Asp Ala
100 105 110
Pro Val Lys Thr Ile His Trp Ile Lys Ala Pro Asn Tyr Ser Cys Val
115 120 125
Met Thr Gly Ser Trp Asp Lys Thr Leu Lys Phe Trp Asp Thr Arg Ser
130 135 140
Ser Asn Pro Met Met Val Leu Gln Leu Pro Glu Arg Cys Tyr Cys Ala
145 150 155 160
Asp Val Ile Tyr Pro Met Ala Val Val Ala Thr Ala Glu Arg Gly Leu
165 170 175
Ile Val Tyr Gln Leu Glu Asn Gln Pro Ser Glu Phe Arg Arg Ile Glu
180 185 190
Ser Pro Leu Lys His Gln His Arg Cys Val Ala Ile Phe Lys Asp Lys
195 200 205
Gln Asn Lys Pro Thr Gly Phe Ala Leu Gly Ser Ile Glu Gly Arg Val
210 215 220
Ala Ile His Tyr Ile Asn Pro Pro Asn Pro Ala Lys Asp Asn Phe Thr
225 230 235 240
Phe Lys Cys His Arg Ser Asn Gly Thr Asn Thr Ser Ala Pro Gln Asp
245 250 255
Ile Tyr Ala Val Asn Gly Ile Ala Phe His Pro Val His Gly Thr Leu
260 265 270
Ala Thr Val Gly Ser Asp Gly Arg Phe Ser Phe Trp Asp Lys Asp Ala
275 280 285
Arg Thr Lys Leu Lys Thr Ser Glu Gln Leu Asp Gln Pro Ile Ser Ala
290 295 300
Cys Cys Phe Asn His Asn Gly Asn Ile Phe Ala Tyr Ala Ser Ser Tyr
305 310 315 320
Asp Trp Ser Lys Gly His Glu Phe Tyr Asn Pro Gln Lys Lys Asn Tyr
325 330 335
Ile Phe Leu Arg Asn Ala Ala Glu Glu Leu Lys Pro Arg Asn Lys Lys
340 345 350
<210>19
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11A primer
<400>19
aagctttttt ttttta 16
<210>20
<211>13
<212>DNA
<213>Artificial Sequcnce
<220>
<223>H-AP21 primer
<400>20
aagctttctc tgg 13
<210>21
<211>3633
<212>DNA
<213>Homo sapiens
<400>21
cgcaatttcc actcgcgggg agcagcagca gcagaggcag cagcgggcgg cgctgagccg 60
ccgccgccgc cactgaggaa gaagccggcc cagccgccgc cgcgtccgga ccctcgcgcc 120
tggatcccag cgccccgatc ccggcgcccc aacccccacg cccgcctccg ccaactttca 180
cgctgcctcg gcggcccggc ccggctcgac gccaatggtg gaggccatag tggagtttga 240
ctaccaggcc cagcacgatg atgagctgac gatcagcgtg ggtgaaatca tcaccaacat 300
caggaaggag gatggaggct ggtgggaggg acagatcaac ggcaggagag gtttgttccc 360
tgacaacttt gtaagagaaa taaagaaaga gatgaagaaa gaccctctca ccaacaaagc 420
tccagaaaag cccctgcacg aagtgcccag tggaaactct ttgctgtctt ctgaaacgat 480
tttaagaacc aataagagag gcgagcgacg gaggcgccgg tgccaggtgg cattcagcta 540
cctgccccag aatgacgatg aacttgagct gaaagttggc gacatcatag aggtggtagg 600
agaggtagag gaaggatggt gggaaggtgt tctcaacggg aagactggaa tgtttccttc 660
caacttcatc aaggagctgt caggggagtc ggatgagctt ggcatttccc aggatgagca 720
gctatccaag tcaagtttaa gggaaaccac aggctccgag agtgatgggg gtgactcaag 780
cagcaccaag tctgaaggtg ccaacgggac agtggcaact gcagcaatcc agcccaagaa 840
agttaaggga gtgggctttg gagacatttt caaagacaag ccaatcaaac taagaccaag 900
gtcaattgaa gtagaaaatg actttctgcc ggtagaaaag actattggga agaagttacc 960
tgcaactaca gcaactccag actcatcaaa aacagaaatg gacagcagga caaagagcaa 1020
ggattactgc aaagtaatat ttccatatga ggcacagaat gatgatgaat tgacaatcaa 1080
agaaggagat atagtcactc tcatcaataa ggactgcatc gacgtaggct ggtgggaagg 1140
agagctgaac ggcagacgag gcgtgttccc cgataacttc gtgaagttac ttccaccgga 1200
ctttgaaaag gaagggaata gacccaagaa gccaccgcct ccatccgctc ctgtcatcaa 1260
acaaggggca ggcaccactg agagaaaaca tgaaattaaa aagatacctc ctgaaagacc 1320
agaaatgctt ccaaacagaa cagaagaaaa agaaagacca gagagagagc caaaactgga 1380
tttacagaag ccctccgttc ctgccatacc gccaaaaaag cctcggccac ctaagaccaa 1440
ttctctcagc agacctggcg cactgccccc gagaaggccg gagagaccgg tgggtccgct 1500
gacacacacc aggggtgaca gtccaaagat tgacttggcc ggcagttcgc tatctggcat 1560
cctggacaaa gatctctcgg accgcagcaa tgacattgac ttagaaggtt ttgactccgt 1620
ggtatcatct actgagaaac tcagtcatcc gaccacaagc agaccaaaag ctacagggag 1680
gcggcctccg tcccagtccc tcacatcttc atccctttca agccctgata tcttcgactc 1740
cccaagtccc gaagaggata aggaggaaca catttcactt gcgcacagag gagtggacgc 1800
gtcaaagaaa acttccaaga ctgttaccat atcccaagtg tctgacaaca aagcatccct 1860
gccgcccaag ccggggacca tggcagcagg tggcggtggg ccagcccctc tgtcctcagc 1920
ggcgccctcc cccctgtcat cctctttggg aacagctgga cacagagcca actccccgtc 1980
tctgttcggc acggaaggaa aaccaaagat ggagcctgcg gccagcagcc aggcggccgt 2040
ggaggagcta aggacacagg tccgcgagct gaggagcatc atcgagacca tgaaggacca 2100
gcagaaacga gagattaaac agttattgtc tgagttggat gaagagaaga aaatccggct 2160
tcggttgcag atggaagtga acgacataaa gaaagctcta caatcaaaat gaatacttga 2220
tcaatgaaat gtcacattat tcatcctgag tccgagactc aaattttctg ccccagccaa 2280
aataatcttg tgccaaaaga ttaaaggttt gcctcaaaat gtccctgttt gaaagattag 2340
cacaaaagtc ttgatagcac aacacaaatt ccatccaaga ggagaatctt ccccagggtt 2400
tagtcctggg gctggcactc gttgtgactt acacagagca aaattgtgct aaaggctttt 2460
ctactctgag atctcaatgc gaaatgaaaa ctcaggcagt ttagtccata gtggtactat 2520
tttgatgata ttttccatta ataaaatgta atttcagatt attcgtttac aagctttata 2580
attttatgat tttttaatcg tgttttgtca cagacttccc tagtgtttgt actacacgta 2640
gtcagaagcg agtgtccttt tcttttgctt caggctaaga gctgcctcgc tctttgtccc 2700
cccattagga ttctattaca tatgcaattg taggttcaac ctgtcccttt ccctgccagc 2760
aaaccccacc accctaagag aaattttagc ttatatatga cggtatattt acaaaaagag 2820
aaagagaaaa tctggtattt gcaatgatct gtgccttctt tttaccaccc tcttgattgg 2880
agcttttgtg atgcagctac catgattcaa aaaaattaaa aattaaaaaa aaaaaatctg 2940
ccacttatcc aagtccacta gaggccactg tcttcaaagc ttctctcacc ctagccaaag 3000
gtcctaagag gagacagctg tgaagttggg cgtgctctgt ggtaccagct gtgacttttc 3060
tatttctcct agttttaggt tgttcatgaa actagaaatg tcatcctgct tgatttttca 3120
tcagccaagt taaacccctg ctttctgtcc tttgcacctt ttgcgtgaac agaatatgca 3180
ttattaaagc aaaaataaat aaaagtaaaa tgcaaatgaa aaaaaaaaaa aaaaaaaaaa 3240
aaaaaaaaaa aaggccgccc ccaacaccct cctagcctta ctactaataa ttattacatt 3300
ttgactacca caactcaacg gctacataga aaaatccacc ccttacgagt gcggcttcga 3360
ccctatatcc cccgcccgcg tccctttctc cataaaattc ttcttagtag ctattacctt 3420
cttattattt gatctagaaa ttgccctcct tttaccccta ccatgagccc tacaaacaac 3480
taacctgcca ctaatagtta tgtcatccct cttattaatc atcatcctag ccctaagtct 3540
ggcctatgag tgactacaaa aaggattaga ctgaaccgaa taaaaaaaaa aaaaaaaaaa 3600
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 3633
<210>22
<211>665
<212>PRT
<213>Homo sapiens
<400>22
Met Val Glu Ala Ile Val Glu Phe Asp Tyr Gln Ala Gln His Asp Asp
1 5 10 15
Glu Leu Thr Ile Ser Val Gly Glu Ile Ile Thr Asn Ile Arg Lys Glu
20 25 30
Asp Gly Gly Trp Trp Glu Gly Gln Ile Asn Gly Arg Arg Gly Leu Phe
35 40 45
Pro Asp Asn Phe Val Arg Glu Ile Lys Lys Glu Met Lys Lys Asp Pro
50 55 60
Leu Thr Asn Lys Ala Pro Glu Lys Pro Leu His Glu Val Pro Ser Gly
65 70 75 80
Asn Ser Leu Leu Ser Ser Glu Thr Ile Leu Arg Thr Asn Lys Arg Gly
85 90 95
Glu Arg Arg Arg Arg Arg Cys Gln Val Ala Phe Ser Tyr Leu Pro Gln
100 105 110
Asn Asp Asp Glu Leu Glu Leu Lys Val Gly Asp Ile Ile Glu Val Val
115 120 125
Gly Glu Val Glu Glu Gly Trp Trp Glu Gly Val Leu Asn Gly Lys Thr
130 135 140
Gly Met Phe Pro Ser Asn Phe Ile Lys Glu Leu Ser Gly Glu Ser Asp
145 150 155 160
Glu Leu Gly Ile Ser Gln Asp Glu Gln Leu Ser Lys Ser Ser Leu Arg
165 170 175
Glu Thr Thr Gly Ser Gl u Ser Asp Gly Gly Asp Ser Ser Ser Thr Lys
180 185 190
Ser Glu Gly Ala Asn Gly Thr Val Ala Thr Ala Ala Ile Gln Pro Lys
195 200 205
Lys Val Lys Gly Val Gly Phe Gly Asp Ile Phe Lys Asp Lys Pro Ile
210 215 220
Lys Leu Arg Pro Arg Ser Ile Glu Val Glu Asn Asp Phe Leu Pro Val
225 230 235 240
Glu Lys Thr Ile Gly Lys Lys Leu Pro Ala Thr Thr Ala Thr Pro Asp
245 250 255
Ser Ser Lys Thr Glu Met Asp Ser Arg Thr Lys Ser Lys Asp Tyr Cys
260 265 270
Lys Val Ile Phe Pro Tyr Glu Ala Gln Asn Asp Asp Glu Leu Thr Ile
275 280 285
Lys Glu Gly Asp Ile Val Thr Leu Ile Asn Lys Asp Cys Ile Asp Val
290 295 300
Gly Trp Trp Glu Gly Glu Leu Asn Gly Arg Arg Gly Val Phe Pro Asp
305 310 315 320
Asn Phe Val Lys Leu Leu Pro Pro Asp Phe Glu Lys Glu Gly Asn Arg
325 330 335
Pro Lys Lys Pro Pro Pro Pro Ser Ala Pro Val Ile Lys Gln Gly Ala
340 345 350
Gly Thr Thr Glu Arg Lys His Glu Ile Lys Lys Ile Pro Pro Glu Arg
355 360 365
Pro Glu Met Leu Pro Asn Arg Thr Glu Glu Lys Glu Arg Pro Glu Arg
370 375 380
Glu Pro Lys Leu Asp Leu Gln Lys Pro Ser Val Pro Ala Ile Pro Pro
385 390 395 400
Lys Lys Pro Arg Pro Pro Lys Thr Asn Ser Leu Ser Arg Pro Gly Ala
405 410 415
Leu Pro Pro Arg Arg Pro Glu Arg Pro Val Gly Pro Leu Thr His Thr
420 425 430
Arg Gly Asp Ser Pro Lys Ile Asp Leu Ala Gly Ser Ser Leu Ser Gly
435 440 445
Ile Leu Asp Lys Asp Leu Ser Asp Arg Ser Asn Asp Ile Asp Leu Glu
450 455 460
Gly Phe Asp Ser Val Val Ser Ser Thr Glu Lys Leu Ser His Pro Thr
465 470 475 480
Thr Ser Arg Pro Lys Ala Thr Gly Arg Arg Pro Pro Ser Gln Ser Leu
485 490 495
Thr Ser Ser Ser Leu Ser Ser Pro Asp Ile Phe Asp Ser Pro Ser Pro
500 505 510
Glu Glu Asp Lys Glu Glu His Ile Ser Leu Ala His Arg Gly Val Asp
515 520 525
Ala Ser Lys Lys Thr Ser Lys Thr Val Thr Ile Ser Gln Val Ser Asp
530 535 540
Asn Lys Ala Ser Leu Pro Pro Lys Pro Gly Thr Met Ala Ala Gly Gly
545 550 555 560
Gly Gly Pro Ala Pro Leu Ser Ser Ala Ala Pro Ser Pro Leu Ser Ser
565 570 575
Ser Leu Gly Thr Ala Gly His Arg Ala Asn Ser Pro Ser Leu Phe Gly
580 585 590
Thr Glu Gly Lys Pro Lys Met Glu Pro Ala Ala Ser Ser Gln Ala Ala
595 600 605
Val Glu Glu Leu Arg Thr Gln Val Arg Glu Leu Arg Ser Ile Ile Glu
610 615 620
Thr Met Lys Asp Gln Gln Lys Arg Glu Ile Lys Gln Leu Leu Ser Glu
625 630 635 640
Leu Asp Glu Glu Lys Lys Ile Arg Leu Arg Leu Gln Met Glu Val Asn
645 650 655
Asp Ile Lys Lys Ala Leu Gln Ser Lys
660 665
<210>23
<211>16
<212>DNA
<213>Artificial Seauence
<220>
<223>H-T11A primer
<400>23
aagctttttt ttttta 16
<210>24
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP36 primer
<400>24
aagcttcgac gct 13
<210>25
<211>4639
<212>DNA
<213>Homo sapiens
<400>25
agcggacggt ccttgcattg gcctccggca ggcgcccccc gggggcggga agctgcctca 60
cagcatggaa ccacaggtta ctctaaatgt gacttttaaa aatgaaattc aaagctttct 120
ggtttctgat ccagaaaata caacttgggc tgatatcgaa gctatggtaa aagtttcatt 180
tgatctgaat actattcaaa taaaatacct ggatgaggaa aatgaagagg tatccatcaa 240
cagtcaagga gaatatgaag aagcgcttaa gatggcagtt aaacagggaa accaactgca 300
gatgcaagtc cacgaagggc accatgtcgt tgatgaagcc ccacccccag ttgtaggagc 360
aaaacgacta gctgccaggg cagggaagaa gccacttgca cattactctt cactggtgag 420
agtcttggga tcagacatga agaccccaga ggatcctgca gtgcagtcgt ttccacttgt 480
tccatgtgac acagaccagc ctcaagacaa gcccccagac tggttcacaa gctacctgga 540
gacgttcaga gaacaagtgg ttaacgaaac ggttgagaag cttgaacaga aattacatga 600
aaagcttgtc ctccagaacc catccttggg ttcttgtccc tcagaagtct caatgcctac 660
ttcagaagaa acattgtttt tgccagaaaa ccagttcagc tggcatattg cttgcaacaa 720
ctgccaaaga aggattgttg gtgtccgcta ccagtgtagc ctatgcccat cctacaatat 780
ctgtgaagat tgtgaagcag ggccatatgg ccatgacact aaccacgtcc tgctgaagtt 840
gcggagacct gttgtgggct cctctgaacc gttctgtcac tcaaagtact ctactcctcg 900
tcttcctgct gctctggaac aagtcaggct ccagaaacag gttgataaga actttcttaa 960
agcagaaaag caaaggttgc gagctgagaa gaaacaacgt aaagcagagg tcaaggaact 1020
taaaaagcag cttaaactcc ataggaaaat tcacctgtgg aattcaatcc atggactcca 1080
gagccccaag tctcctttag gccgacctga gagcttgctc cagtctaata ccctgatgct 1140
ccctttgcag ccctgtacct ccgttatgcc aatgctcagt gcagcatttg tggatgagaa 1200
tttgcctgat gggactcacc ttcagccagg aaccaagttt atcaaacact ggaggatgaa 1260
aaatacagga aatgtaaagt ggagtgcaga cacaaagctc aagttcatgt ggggaaacct 1320
gactttggct tccacagaaa agaaggatgt tttggttccc tgcctcaagg ccggccatgt 1380
gggagttgta tctgtggagt tcattgcccc agccttggag ggaacgtata cttcccattg 1440
gcgtctttct cacaaaggcc agcaatttgg gcctcgggtc tggtgcagta tcatagtaga 1500
tcctttcccc tccgaagaga gccctgataa cattgaaaag ggcatgatca gctcaagcaa 1560
aactgatgat ctcacctgcc agcaagagga aacttttctt ctggctaaag aagaaagaca 1620
gcttggtgaa gtgactgagc agacagaagg gacagcagcc tgcatcccac agaaggcaaa 1680
aaatgttgcc agtgagaggg agctctacat cccatctgtg gatcttctga ctgcccagga 1740
cctgctgtcc tttgagctgt tggatataaa cattgttcaa gagttggaga gagtgcccca 1800
caacacccct gtggatgtga ctccctgcat gtctcctctg ccacatgaca gtcctttaat 1860
agagaagcca ggcttggggc agatagagga agagaatgaa ggggcaggat ttaaagcact 1920
tcctgattct atggtgtcag taaagaggaa ggctgagaac attgcttctg tggaggaagc 1980
agaagaagac ctgagtggga cccagtttgt gtgtgagaca gtaatccgat cccttacctt 2040
ggatgctgcc ccagaccaca accctccttg cagacagaag tccttgcaga tgacatttgc 2100
cttgcctgaa ggaccacttg gaaatgagaa ggaggagatt atccatatcg ctgaggaaga 2160
agctgtcatg gaggaggagg aggatgagga ggatgaggag gaggaggatg agctcaaaga 2220
tgaagttcaa agtcagtcct ctgcttcctc agaggattac atcatcatcc tgcctgagtg 2280
ctttgatacc agccgccccc tgggggattc tatgtacagc tctgcgctct cacagccagg 2340
cctggagcga ggtgctgaag gcaagcctgg ggttgaggct gggcaggaac cagctgaggc 2400
tggggaaaga ctccctggag gggagaacca gccacaggag cacagcataa gtgacatcct 2460
cacgacctca cagactctgg aaacagtgcc cctaatccca gaggtagtgg agcttccacc 2520
gtcactgccc aggagctctc cttgtgtaca tcatcatggt tccccaggag tggatttacc 2580
agttaccata ccagaagttt cttcagtccc tgatcagatc agaggagagc ccagaggctc 2640
atcaggactt gtaaacagca gacagaagag ctatgaccac tcaaggcacc atcatgggag 2700
cagcattgct ggaggactgg tgaagggggc tttgtctgtt gctgcctctg catacaaggc 2760
cctgtttgct gggccaccag tcactgcaca gccaataatt tctgaagatc agacagcagc 2820
cctgatggcc catctctttg aaatgggatt ctgtgacagg cagctgaacc tacggctgct 2880
gaagaaacac aattacaata tcctgcaggt tgtgacagaa cttcttcagt taaacaacaa 2940
cgactggtac agccaacgct attgaggagt gaccttgtat taaataactg cctgctgctc 3000
agagatgatc tttattctgt cattggggta tgggatagaa gcccttgctt atttttaatc 3060
tgatgaatct gtatagagcc catcgttgag ttaccaagac aatacctgct acagtatttt 3120
ggggagcaaa ctaaagacca gaacttaaat tttcacttta gacattggat gaatagtatg 3180
aagacagttt ttcagttgat ttggataaaa ctattttagt gcattgacaa gtgtaacttc 3240
aacttcatat agaaccattt ttctttctgc ttttattgaa actgagtatt tttctttggc 3300
taatgtggat tttttatggg gatatctgtt aattttcagg ttttgaaaga cattaacctc 3360
ggaagttgtt tttaagaatt attctcataa ttcttattct cataatttct gtaatccacc 3420
tcaagcttca tagttatttg gcattgaaat aacacccaga gcatgataga aatgttgtta 3480
ctcttcctct ctcaaggaga aagtaatttt cctgcaatac ttaataattg gcaccgttgc 3540
tttctaaaga ctccatggtg cattcaagag tatccaactt caagggaatc tccgcatttc 3600
aatgaaagga ggaagagtgt gctgataaac ctaccagcac ctattgagca atgtctatta 3660
tagtaatttt gcatacattt ttatttaagg gaaaaaatat aggtattgtg aaatattttg 3720
ctaatcttat agaaaaggaa aaaatcccgt tatttaaagg gaaaagtaaa tttaacagtt 3780
gccttttttc ttaatgtcag ggcagatctt attttacagt acagtggggg aaatagaaaa 3840
catgtgaaag gcaaaaggca ggctcctaaa ttaatgtcag tgaagttcag ggtgggcaaa 3900
tgagtgtgtg tgaggtatag gaaatgctga tgacttcttt aatgcttgaa gtccgttcac 3960
aggtatctag ccctagaatg cctagaacag gaagaggcag ctggtgttct gcaaaacttg 4020
gacaggggca aagttgctga aaaagttttg gtttaacccg aagataagtg gaaaagagct 4080
tgtccatgaa cccaggttct cactctgttt acagaagtgt gttgagtaca gttggtgaag 4140
gaagaggtaa caaaaaatgc taaatatttt atccatgaaa atgacttcca gaaaaggaag 4200
aatatgaacc ccagaccgaa ggggaaaaga tagttaatag tattatctaa cctggttggt 4260
atttgtaatg aatggtgatt ttaattagtc attagccata atgatgttta tttacagtat 4320
aactcctgaa tgctacttaa ataaaccagg attcaaactg caagccagcc aggccgttca 4380
ttatttaaaa cgttttaatc ggggcttccg ggtagaaggt ggagcggcag ggtgtaattg 4440
ggttgatggg tgggacctgt cttgaccatc ggagttttat aatcgagggc caggagggcc 4500
cgggttgctc tcctggttat gtatgtactt gtacataacc accttaagaa tggtgaaata 4560
aatgttcttg gaaattccta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4620
aaaaaaaaaa aaaaaaaaa 4639
<210>26
<211>966
<212>PRT
<213>Homo sapiens
<400>26
Met Glu Pro Gln Val Thr Leu Asn Val Thr Phe Lys Asn Glu Ile Gln
1 5 10 15
Ser Phe Leu Val Ser Asp Pro Glu Asn Thr Thr Trp Ala Asp Ile Glu
20 25 30
Ala Met Val Lys Val Ser Phe Asp Leu Asn Thr Ile Gln Ile Lys Tyr
35 40 45
Leu Asp Glu Glu Asn Glu Glu Val Ser Ile Asn Ser Gln Gly Glu Tyr
50 55 60
Glu Glu Ala Leu Lys Met Ala Val Lys Gln Gly Asn Gln Leu Gln Met
65 70 75 80
Gln Val His Glu Gly His His Val Val Asp Glu Ala Pro Pro Pro Val
85 90 95
Val Gly Ala Lys Arg Leu Ala Ala Arg Ala Gly Lys Lys Pro Leu Ala
100 105 110
His Tyr Ser Ser Leu Val Arg Val Leu Gly Ser Asp Met Lys Thr Pro
115 120 125
Glu Asp Pro Ala Val Gln Ser Phe Pro Leu Val Pro Cys Asp Thr Asp
130 135 140
Gln Pro Gln Asp Lys Pro Pro Asp Trp Phe Thr Ser Tyr Leu Glu Thr
145 150 155 160
Phe Arg Glu Gln Val Val Asn Glu Thr Val Glu Lys Leu Glu Gln Lys
165 170 175
Leu His Glu Lys Leu Val Leu Gln Asn Pro Ser Leu Gly Ser Cys Pro
180 185 190
Ser Glu Val Ser Met Pro Thr Ser Glu Glu Thr Leu Phe Leu Pro Glu
195 200 205
Asn Gln Phe Ser Trp His Ile Ala Cys Asn Asn Cys Gln Arg Arg Ile
210 215 220
Val Gly Val Arg Tyr Gln Cys Ser Leu Cys Pro Ser Tyr Asn Ile Cys
225 230 235 240
Glu Asp Cys Glu Ala Gly Pro Tyr Gly His Asp Thr Asn His Val Leu
245 250 255
Leu Lys Leu Arg Arg Pro Val Val Gly Ser Ser Glu Pro Phe Cys His
260 265 270
Ser Lys Tyr Ser Thr Pro Arg Leu Pro Ala Ala Leu Glu Gln Val Arg
275 280 285
Leu Gln Lys Gln Va1 Asp Lys Asn Phe Leu Lys Ala Glu Lys Gln Arg
290 295 300
Leu Arg Ala Glu Lys Lys Gln Arg Lys Ala Glu Val Lys Glu Leu Lys
305 310 315 320
Lys Gln Leu Lys Leu His Arg Lys Ile His Leu Trp Asn Ser Ile His
325 330 335
Gly Leu Gln Ser Pro Lys Ser Pro Leu Gly Arg Pro Glu Ser Leu Leu
340 345 350
Gln Ser Asn Thr Leu Met Leu Pro Leu Gln Pro Cys Thr Ser Val Met
355 360 365
Pro Met Leu Ser Ala Ala Phe Val Asp Glu Asn Leu Pro Asp Gly Thr
370 375 380
His Leu Gln Pro Gly Thr Lys Phe Ile Lys His Trp Arg Met Lys Asn
385 390 395 400
Thr Gly Asn Val Lys Trp Ser Ala Asp Thr Lys Leu Lys Phe Met Trp
405 410 415
Gly Asn Leu Thr Leu Ala Ser Thr Glu Lys Lys Asp Va1 Leu Val Pro
420 425 430
Cys Leu Lys Ala Gly His Val Gly Val Val Ser Val Glu Phe Ile Ala
435 440 445
Pro Ala Leu Glu Gly Thr Tyr Thr Ser His Trp Arg Leu Ser His Lys
450 455 460
Gly Gln Gln Phe Gly Pro Arg Val Trp Cys Ser Ile Ile Val Asp Pro
465 470 475 480
Phe Pro Ser Glu Glu Ser Pro Asp Asn Ile Glu Lys Gly Met Ile Ser
485 490 495
Ser Ser Lys Thr Asp Asp Leu Thr Cys Gln Gln Glu Glu Thr Phe Leu
500 505 510
Leu Ala Lys Glu Glu Arg Gln Leu Gly Glu Val Thr Glu Gln Thr Glu
515 520 525
Gly Thr Ala Ala Cys Ile Pro Gln Lys Ala Lys Asn Val Ala Ser Glu
530 535 540
Arg Glu Leu Tyr Ile Pro Ser Val Asp Leu Leu Thr Ala Gln Asp Leu
545 550 555 560
Leu Ser Phe Glu Leu Leu Asp Ile Asn Ile Val Gln Glu Leu Glu Arg
565 570 575
Val Pro His Asn Thr Pro Val Asp Val Thr Pro Cys Met Ser Pro Leu
580 585 590
Pro His Asp Ser Pro Leu Ile Glu Lys Pro Gly Leu Gly Gln Ile Glu
595 600 605
Glu Glu Asn Glu Gly Ala Gly Phe Lys Ala Leu Pro Asp Ser Met Val
610 615 620
Ser Val Lys Arg Lys Ala Glu Asn Ile Ala Ser Val Glu Glu Ala Glu
625 630 635 640
Glu Asp Leu Ser Gly Thr Gln Phe Val Cys Glu Thr Val Ile Arg Ser
645 650 655
Leu Thr Leu Asp Ala Ala Pro Asp His Asn Pro Pro Cys Arg Gln Lys
660 665 670
Ser Leu Gln Met Thr Phe Ala Leu Pro Glu Gly Pro Leu Gly Asn Glu
675 680 685
Lys Glu Glu Ile Ile His Ile Ala Glu Glu Glu Ala Val Met Glu Glu
690 695 700
Glu Glu Asp Glu Glu Asp Glu Glu Glu Glu Asp Glu Leu Lys Asp Glu
705 710 715 720
Val Gln Ser Gln Ser Ser Ala Ser Ser Glu Asp Tyr Ile Ile Ile Leu
725 730 735
Pro Glu Cys Phe Asp Thr Ser Arg Pro Leu Gly Asp Ser Met Tyr Ser
740 745 750
Ser Ala Leu Ser Gln Pro Gly Leu Glu Arg Gly Ala Glu Gly Lys Pro
755 760 765
Gly Val Glu Ala Gly Gln Glu Pro Ala Glu Ala Gly Glu Arg Leu Pro
770 775 780
Gly Gly Glu Asn Gln Pro Gln Glu His Ser Ile Ser Asp Ile Leu Thr
785 790 795 800
Thr Ser Gln Thr Leu Glu Thr Val Pro Leu Ile Pro Glu Val Val Glu
805 810 815
Leu Pro Pro Ser Leu Pro Arg Ser Ser Pro Cys Val His His His Gly
820 825 830
Ser Pro Gly Val Asp Leu Pro Val Thr Ile Pro Glu Val Ser Ser Val
835 840 845
Pro Asp Gln Ile Arg Gly Glu Pro Arg Gly Ser Ser Gly Leu Val Asn
850 855 860
Ser Arg Gln Lys Ser Tyr Asp His Ser Arg His His His Gly Ser Ser
865 870 875 880
Ile Ala Gly Gly Leu Mal Lys Gly Ala Leu Ser Val Ala Ala Ser Ala
885 890 895
Tyr Lys Ala Leu Phe Ala Gly Pro Pro Val Thr Ala Gln Pro Ile Ile
900 905 910
Ser Glu Asp Gln Thr Ala Ala Leu Met Ala His Leu Phe Glu Met Gly
915 920 925
Phe Cys Asp Arg Gln Leu Asn Leu Arg Leu Leu Lys Lys His Asn Tyr
930 935 940
Asn Ile Leu Gln Val Val Thr Glu Leu Leu Gln Leu Asn Asn Asn Asp
945 950 955 960
Trp Tyr Ser Gln Arg Tyr
965
<210>27
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11A primer
<400>27
aagctttttt ttttta 16
<210>28
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP33 primer
<400>28
aagcttgctg ctc 13
<210>29
<211>833
<212>DNA
<213>Homo sapiens
<400>29
cggcttccag tccgcggagg gcgaggcggc gtggacagcg gccccggcac ccagcgcccc 60
gccgcccgca agccgcgcgc ccgtccgccg cgccccgagc ccgccgcttc ctatctcagc 120
gccctgccgc cgccgccgcg gcccagcgag cggccctgat gcaggccatc aagtgtgtgg 180
tggtgggaga cggagctgta ggtaaaactt gcctactgat cagttacaca accaatgcat 240
ttcctggaga atatatccct actgtctttg acaattattc tgccaatgtt atggtagatg 300
gaaaaccggt gaatctgggc ttatgggata cagctggaca agaagattat gacagattac 360
gccccctatc ctatccgcaa acagatgtgt tcttaatttg cttttccctt gtgagtcctg 420
catcatttga aaatgtccgt gcaaagtggt atcctgaggt gcggcaccac tgtcccaaca 480
ctcccatcat cctagtggga actaaacttg atcttaggga tgataaagac acgatcgaga 540
aactgaagga gaagaagctg actcccatca cctatccgca gggtctagcc atggctaagg 600
agattggtgc tgtaaaatac ctggagtgct cggcgctcac acagcgaggc ctcaagacag 660
tgtttgacga agcgatccga gcagtcctct gcccgcctcc cgtgaagaag aggaagagaa 720
aatgcctgct gttgtaaatg tctcagcccc tcgttcttgg tcctgtccct tggaaccttt 780
gtacgctttg ctcaatcaaa aacaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 833
<210>30
<211>192
<212>PRT
<213>Homo sapiens
<400>30
Met Gln Ala Ile Lys Cys Val Val Val Gly Asp Gly Ala Val Gly Lys
1 5 10 15
Thr Cys Leu Leu Ile Ser Tyr Thr Thr Asn Ala Phe Pro Gly Glu Tyr
20 25 30
Ile Pro Thr Val Phe Asp Asn Tyr Ser Ala Asn Val Met Val Asp Gly
35 40 45
Lys Pro Val Asn Leu Gly Leu Trp Asp Thr Ala Gly Gln Glu Asp Tyr
50 55 60
Asp Arg Leu Arg Pro Leu Ser Tyr Pro Gln Thr Asp Val Phe Leu Ile
65 70 75 80
Cys Phe Ser Leu Val Ser Pro Ala Ser Phe Glu Asn Val Arg Ala Lys
85 90 95
Trp Tyr Pro Glu Val Arg His His Cys Pro Asn Thr Pro Ile Ile Leu
100 105 110
Val Gly Thr Lys Leu Asp Leu Arg Asp Asp Lys Asp Thr Ile Glu Lys
115 120 125
Leu Lys Glu Lys Lys Leu Thr Pro Ile Thr Tyr Pro Gln Gly Leu Ala
130 135 140
Met Ala Lys Glu Ile Gly Ala Val Lys Tyr Leu Glu Cys Ser Ala Leu
145 150 155 160
Thr Gln Arg Gly Leu Lys Thr Val Phe Asp Glu Ala Ile Arg Ala Val
165 170 175
Leu Cys Pro Pro Pro Val Lys Lys Arg Lys Arg Lys Cys Leu Leu Leu
180 185 190
<210>31
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11G primer
<400>31
aagctttttt tttttg 16
<210>32
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP26 primer
<400>32
aagcttgcca tgg 13
<210>33
<211>2364
<212>DNA
<213>Homo sapiens
<400>33
gcagaggaaa gggtgaaggg agtctgggca agcaaagcat agagatggtg gggtggtggt 60
ggggttgaag aaacttgttg gtataattgt cataggactt gcctaaaata ttattaaaat 120
tacgggagtg tactcagctt tgagcctagg agaaaatgcc actgtgtgca tccattttaa 180
agggttccct cataaaaaaa tgttattccc cattatcaca tcagtacact gctttgaaaa 240
caaaactttt caacatgggc atactgggct acatggaaaa tgacatcacc caggagtgat 300
ttctctttat atatattatt tctgcagtta ccatccttat ctgagttatc acagttcatg 360
aatctaagag gcggaactct acatcattag taagaggttc caccaaagtc taaagttgta 420
ttcacttgtg tttgatgaac tatctttaaa agaccatagg tctatcatta tttcttagac 480
ataatctaaa gaaaaacaga ctagagaagc cacctggttg taacagaata agcagaagtt 540
tacagcatga tagtccaagt ggtgataact ttaaataaaa ctcaaatttt tactgtttgt 600
agacaggaat gctgtcctag agaacctcct cctcaaccag ctacgtacat agttttatcc 660
tatgcattcc tgttttctgt gttttttgtt tttttttttt gagacagagt ctcgctctgt 720
cacccaggct ggagtgcagt ggtgcgacct cagctcactg aaacctctgc ctcccgggtt 780
caagcgattc tcctgcatca gcctcccgag tagctaggat tacaggcgcc cgccactacg 840
cccagctaat ttgtggtatt tttagtagag acagggtttc accatgttgg ccaggctggt 900
ctcgaactcc tgacctcatg atccgcccgc cttgacctcc caaagtgctg ggattacagg 960
catgagccac cgcacccagc ctgcattcct gtttttttaa tggttttgga gggtagcagt 1020
agagatgggg tctcactatg ttgcccagtc tagtcttgaa ctcctgggct acagttaccc 1080
tcctacctcg gcttcccaaa gtgctcggat tacaggtgtg agccactgtg cctagcctat 1140
aatgatcatt ttaatgtttc ccatgcactc atttagtttg aaccttcaca gcaacccaat 1200
gaggtaatac tcccatttca catataatac tgagagatga gttgcacaag attatacact 1260
gttaagtagc agagccagaa tggacttcag aatcccaact acaatacaaa tgtttattta 1320
aataaagaag aaagctattg tacaaatatc actcttcagg tttagcttac agagccatgg 1380
ctatggattc ttagctctgt aaggaagtgc ttctataaat tcttaggttt agagatgata 1440
ccatctgggt acctttgctt gaaccgtgca accacatctg ggtctagtag gtggatccca 1500
tccagttggt ttccaagggt gatcctgaaa cagtgtaaaa ggaggggcaa accagaaatc 1560
ctggaattag agggtttaat attgttaaaa aatgcatacc aaatgaagac tgcctatcat 1620
catatcaaat atgccaattc taaaaagagc ttaacattag aatagtatat ggtagaatta 1680
ctagttcaga attggcatag attctggtgt taaaatagac tggatctgta ttatctgagg 1740
gttagtaact aatgcttagc caggcctgct tcacagagtt gctaccaggg agtattcttt 1800
ggataagcaa atgctagcag catgtgtttt aagctctgtt aaggggtgaa agatgtaatt 1860
attgacagat taaatagata acttcgtaac caccaggggg cagattcaat acatcacaga 1920
atggctgagg aagatccttg ggttgtgaag agagtagaaa ccctagggag cagtgctttt 1980
gggtcctaga acctgttgag tttctaatga atatttgtag aatctcataa aacagtttaa 2040
atacaagctt aagtggctta tgaatcctgt gaagctcatt tatggactag tgtaaaacaa 2100
tgtgaagctc tactaagttc tgtccttaat cataaataat agccccttga ggactagcct 2160
gttctctggt caccttacca gttgggttgc acattgtgtg gtcgtccaaa taactcaatc 2220
ttgcgagtgc caggagatag tctttcaatc atgccataga tttcatctgg tttatgactg 2280
gtggaacgaa cctaggaaat aaaaactagc tgctttttaa gttaaaaaaa aaaaaaaaaa 2340
aaaaaaaaaa aaaaaaaaaa aaaa 2364
<210>34
<211>76
<212>PRT
<213>Homo sapiens
<400>34
Met Ile Pro Ser Gly Tyr Leu Cys Leu Asn Arg Ala Thr Thr Ser Gly
1 5 10 15
Ser Ser Arg Trp Ile Pro Ser Ser Trp Phe Pro Arg Val Ile Leu Lys
20 25 30
Gln Cys Lys Arg Arg Gly Lys Pro Glu Ile Leu Glu Leu Glu Gly Leu
35 40 45
Ile Leu Leu Lys Asn Ala Tyr Gln Met Lys Thr Ala Tyr His His Ile
50 55 60
Lys Tyr Ala Asn Ser Lys Lys Ser Leu Thr Leu Glu
65 70 75
<210>35
<211>16
<212>DNA
<213>Artificial Sequence
<220>
<223>H-T11G primer
<400>35
aagctttttt tttttg 16
<210>36
<211>13
<212>DNA
<213>Artificial Sequence
<220>
<223>H-AP23 primer
<400>36
aagcttggct atg 13
Claims (6)
1.一种人类原癌蛋白,具有的氨基酸序列选自由SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:3Q和SEQID NO:34组成的组。
2.一种人类原癌基因,具有的DNA序列选自由对应于SEQ IDNO:1的核苷酸序列位置89-709的DNA序列、对应于SEQ IDNO:5的核苷酸序列位置113-1627的DNA序列、对应于SEQID NO:9的核苷酸序列位置23-1276的DNA序列、对应于SEQID NO:13的核苷酸序列位置11-844的DNA序列、对应于SEQID NO:17的核苷酸序列位置67-1125的DNA序列、对应于SEQ ID NO:21的核苷酸序列位置215-2212的DNA序列、对应于SEQ ID NO:25的核苷酸序列65-2965的DNA序列、对应于SEQ ID NO:29的核苷酸序列位置159-737的DNA序列、以及对应于SEQ ID NO:33的核苷酸序列位置1435-1685的DNA序列组成的组,其中所述DNA序列中每一种均编码如权利要求1中所定义的原癌蛋白。
3.根据权利要求2所述的人类原癌基因,其中所述原癌基因具有选自由SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ IDNO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:29和SEQ ID NO:33组成的组的DNA序列。
4.一种包括如权利要求2或3中定义的每一种原癌基因的载体。
5.一种用于诊断癌症及癌症转移的试剂盒,包括如权利要求1中定义的每一种原癌蛋白。
6.一种用于诊断癌症和癌症转移的试剂盒,包括如权利要求2或3中定义的每一种原癌基因。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040114281A KR100664588B1 (ko) | 2004-12-28 | 2004-12-28 | 인간 원암유전자 및 이에 의해 코드되는 단백질 |
KR1020040114281 | 2004-12-28 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101133081A true CN101133081A (zh) | 2008-02-27 |
Family
ID=36615159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005800487632A Pending CN101133081A (zh) | 2004-12-28 | 2005-12-28 | 人类原癌基因及其编码的蛋白 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20080213764A1 (zh) |
EP (1) | EP1838728A4 (zh) |
JP (1) | JP2008525045A (zh) |
KR (1) | KR100664588B1 (zh) |
CN (1) | CN101133081A (zh) |
CA (1) | CA2592466A1 (zh) |
WO (1) | WO2006071080A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012058532A2 (en) * | 2010-10-28 | 2012-05-03 | Yale University | Methods and compositions for assessing and treating cancer |
AU2013232855B2 (en) | 2012-03-15 | 2016-10-27 | Hyun Kee Kim | Gremlin-1 antibody |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6812339B1 (en) * | 2000-09-08 | 2004-11-02 | Applera Corporation | Polymorphisms in known genes associated with human disease, methods of detection and uses thereof |
KR100503559B1 (ko) * | 2002-12-23 | 2005-07-26 | 김진우 | 인간 원암유전자 hlc-8 및 이에 의해 코드되는 단백질 |
WO2004067779A2 (en) * | 2003-01-30 | 2004-08-12 | Applera Corporation | Genetic polymorphisms associated with rheumatoid arthritis, methods of detection and uses thereof |
-
2004
- 2004-12-28 KR KR1020040114281A patent/KR100664588B1/ko not_active IP Right Cessation
-
2005
- 2005-12-28 WO PCT/KR2005/004617 patent/WO2006071080A1/en active Application Filing
- 2005-12-28 US US11/794,402 patent/US20080213764A1/en not_active Abandoned
- 2005-12-28 CN CNA2005800487632A patent/CN101133081A/zh active Pending
- 2005-12-28 CA CA002592466A patent/CA2592466A1/en not_active Abandoned
- 2005-12-28 JP JP2007549263A patent/JP2008525045A/ja active Pending
- 2005-12-28 EP EP05822701A patent/EP1838728A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
CA2592466A1 (en) | 2006-07-06 |
WO2006071080A1 (en) | 2006-07-06 |
KR100664588B1 (ko) | 2007-01-04 |
EP1838728A1 (en) | 2007-10-03 |
JP2008525045A (ja) | 2008-07-17 |
US20080213764A1 (en) | 2008-09-04 |
KR20060075482A (ko) | 2006-07-04 |
EP1838728A4 (en) | 2008-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2238026T3 (es) | Uso de polipeptidos casb616 y polinucleotidos para tratamiento de cancer. | |
WO1998054963A2 (en) | 207 human secreted proteins | |
US20030077604A1 (en) | Compositions and methods relating to breast specific genes and proteins | |
PT1650221E (pt) | Novos compostos | |
CN101133081A (zh) | 人类原癌基因及其编码的蛋白 | |
CN101184773A (zh) | 人类原癌基因trg及其编码的蛋白 | |
WO2001038377A1 (fr) | Nouveau polypeptide - la proteine humaine 95 contenant un bromodomaine- et un polynucleotide codant pour ledit polypeptide | |
CN100436479C (zh) | 人类原癌基因及其编码蛋白 | |
WO2001060855A1 (fr) | Nouvelle proteine humaine associee a la regulation du cycle cellulaire et sa sequence de codage | |
CN100358917C (zh) | 肿瘤标志物及其用途 | |
KR100503559B1 (ko) | 인간 원암유전자 hlc-8 및 이에 의해 코드되는 단백질 | |
KR20060090786A (ko) | 인간 원암유전자 및 이에 의해 코드되는 단백질 | |
KR20060089714A (ko) | 인간 원암유전자 및 이에 의해 코드되는 단백질 | |
US20080213763A1 (en) | Human Protooncogene and Protein Encoded by Same, and Expression Vector Containing Same | |
KR100915609B1 (ko) | 인간 원암유전자 및 이에 의해 코드되는 단백질 | |
US20030017545A1 (en) | Isolated human transporter proteins, nucleic acid molecules encoding human transporter proteins, and uses thereof | |
KR100503567B1 (ko) | 인간 원암유전자 hlc-2 및 이에 의해 코드되는 단백질 | |
KR100453478B1 (ko) | 인간 원암 유전자 및 이에 의해 코드되는 단백질 | |
WO2001032699A1 (fr) | Nouveau polypeptide, nouvelle udp glucose-glycoproteine glucosyltransferase (« biohugtr »), et polynucleotide codant pour ce polypeptide | |
WO2002022676A1 (fr) | Proteine garante de longevite, sa sequence de codage et ses utilisations | |
KR20060111876A (ko) | 인간 원암유전자 trg 및 이에 의해 코드되는 단백질 | |
KR20060111875A (ko) | 인간 원암유전자 trg 및 이에 의해 코드되는 단백질 | |
KR20060107490A (ko) | 인간 원암유전자 trg 및 이에 의해 코드되는 단백질 | |
KR20060105732A (ko) | 인간 원암유전자 trg 및 이에 의해 코드되는 단백질 | |
KR20060107489A (ko) | 인간 원암유전자 trg 및 이에 의해 코드되는 단백질 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20080227 |