CN101133081A

CN101133081A - 人类原癌基因及其编码的蛋白

Info

Publication number: CN101133081A
Application number: CNA2005800487632A
Authority: CN
Inventors: 金弦起; 金振宇
Original assignee: Individual
Current assignee: Individual
Priority date: 2004-12-28
Filing date: 2005-12-28
Publication date: 2008-02-27
Also published as: CA2592466A1; WO2006071080A1; KR100664588B1; EP1838728A1; JP2008525045A; US20080213764A1; KR20060075482A; EP1838728A4

Abstract

本发明披露了一种新型原癌基因及其编码的蛋白。本发明的原癌基因，是参与人类致癌作用同时具有诱导癌症转移能力的新型基因，可有效用于诊断癌症，包括肺癌、白血病、子宫癌、淋巴瘤、结肠癌、皮肤癌等，还用于产生转化的动物等。

Description

人类原癌基因及其编码的蛋白

技术领域

本发明涉及新的原癌基因，其与之前报道的原癌基因无同源性，但具有诱导癌症转移的能力；还涉及其编码的蛋白。

背景技术

已知高等动物包括人通常具有大约30,000个基因，但每一个个体中仅表达所述基因的约15％。因此，研究发现所有生命现象即生殖、分化、稳态、对刺激的反应、细胞周期控制、衰老和凋亡(程序性细胞死亡)等均依赖于哪些基因被选择并表达(Liang，P.and A.B.Pardee，Science 257：967-971，1992)。

病理现象例如肿瘤生成是通过遗传变异引起基因表达的改变而诱导。因此，比较不同细胞之间的基因表达可能是理解多种生物学机制的根本而主要的途径。例如，由Liang和Pardee提出的mRNA差异显示法(Liang，P.and A.B.Pardee，Science 257：967-971，1992)已经有效用于搜寻肿瘤抑制基因、细胞周期调节相关基因以及凋亡相关的转录调节基因等，并且也广泛应用于详细说明仅在一个细胞内发生的不同基因的联系。

综合肿瘤生成的多个结果，现在已经报道了多种遗传改变例如丧失特异性染色体杂合性、原癌基因的激活以及其他肿瘤抑制基因包括p53基因的失活在肿瘤组织中累积而形成人类肿瘤(Bishop，J.M.，Cell 64：235-248，1991；Hunter，T.，Cell 64：249-270，1991)。而且，据报道10-30％的癌通过扩增原癌基因而活化。因此，原癌基因的激活在多种癌症的病因学研究中发挥重要的作用，而且科研人员已经多方尝试以详细说明该作用。

因此，本发明者发现一种用于产生肺癌及宫颈癌的机制在原癌基因水平作了研究，因此该原癌基因，命名为人类迁移诱导基因，仅在癌细胞中表现出特殊增高的表达水平。该原癌基因可有效用于诊断、预防和治疗多种癌症例如肺癌、白血病、子宫癌、淋巴瘤、结肠癌、皮肤癌等。

发明内容

因此，设计本发明以解决该领域现存的问题，因此本发明的一个目标是提供新的原癌基因及其片段。

本发明的另一个目标是提供包括所述每一种原癌基因及其片段的重组载体以及由所述重组载体中每一种所转化的微生物。

本发明的另外一个目标是提供由每一种所述原癌基因编码的蛋白及其片段。

本发明的另外一个目标是提供用于诊断癌症及癌症转移的试剂盒，其包括每一种所述原癌基因或其片段。

本发明的另外一个目标是提供用于诊断癌症及癌症转移的试剂盒，其包括每一种所述蛋白或其片段。

为了实现上述目标，本发明提供了一种具有DNA序列SEQ IDNO：1的原癌基因或其片段。

根据另一个目标，本发明提供了包含所述原癌基因或其片段的重组载体；以及由该重组载体转化的微生物。

根据另外一个目标，本发明提供了一种具有氨基酸序列SEQ IDNO：2的蛋白或其片段。

本发明提供了一种具有DNA序列SEQ ID NO：5的原癌基因或其片段。

根据另一个目标，本发明提供了包含所述原癌基因或其片段的重组载体以及由该重组载体转化的微生物。

根据另外一个目标，本发明提供了一种具有氨基酸序列SEQ IDNO：6的蛋白或其片段。

本发明提供了一种具有DNA序列SEQ ID NO：9的原癌基因或其片段。

根据另外一个目标，本发明提供了一种具有氨基酸序列SEQ IDNO：10的蛋白或其片段。本发明提供了一种具有DNA序列SEQ IDNO：13的原癌基因或其片段。

根据所述另外一个目标，本发明提供了一种具有氨基酸序列SEQ ID NO：14的蛋白或其片段。

本发明提供了一种具有DNA序列SEQ ID NO：17的原癌基因或其片段。

根据另外一个目标，本发明提供了一种具有氨基酸序列SEQ IDNO：18的蛋白或其片段。

本发明提供一种具有DNA序列SEQ ID NO：21的原癌基因或其片段。

根据另外一个目标，本发明提供了一种具有氨基酸序列SEQ IDNO：22的蛋白或其片段。

本发明提供了一种具有DNA序列SEQ ID NO：25的原癌基因或其片段。

根据所述另外一个目标，本发明提供了一种具有氨基酸序列SEQ ID NO：26的蛋白或其片段。

本发明提供了一种具有DNA序列SEQ ID NO：29的原癌基因或其片段。

根据另外一个目标，本发明提供了一种具有氨基酸序列SEQ IDNO：30的蛋白或其片段。

本发明提供了一种具有DNA序列SEQ ID NO：33的原癌基因或其片段。

根据另外一个目标，本发明提供了一种具有氨基酸序列SEQ IDNO：34的蛋白或其片段。

根据所述另外一个目标，本发明提供了用于诊断癌症以及癌症转移的试剂盒，包括所述原癌基因及其片段。

根据另外一个目标，本发明提供了用于诊断癌症以及癌症转移的试剂盒，包括所述原癌蛋白及其片段。

附图说明

本发明优选的具体实施方式的这些和其它特征、方面及优势将在下面的详细说明中结合附图做充分阐述。在附图中：

图1是一个凝胶图，示出了差异显示逆转录PCR(DDRT-PCR)的结果，以确定L276811 DNA片段是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中表达；

图2是一个凝胶图，示出了差异显示逆转录PCR(DDRT-PCR)的结果，以确定CC231 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达；

图3是一个凝胶图，示出了差异显示逆转录PCR(DDRT-PCR)的结果，以确定L789DNA片段是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中表达；

图4是一个凝胶图，示出了差异显示逆转录PCR(DDT-PCR)的结果，以确定L986 DNA片段是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中表达；

图5是一个凝胶图，示出了差异显示逆转录PCR(DDRT-PCR)的结果，以确定L1284 DNA片段是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中表达；

图6是一个凝胶图，示出了差异显示逆转录PCR(DDRT-PCR)的结果，以确定CA367 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达；

图7是一个凝胶图，示出了差异显示逆转录PCR(DDRT-PCR)的结果，以确定CA335 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达；

图8是一个凝胶图，示出了差异显示逆转录PCR(DDRT-PCR)的结果，以确定CG263 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达；

图9是一个凝胶图，示出了差异显示逆转录PCR(DDRT-PCR)的结果，以确定CG233 DNA片段是否在正常外子宫颈组织、宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6癌细胞中表达；

图10(a)是一个凝胶图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG3是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358肺癌细胞系中表达。图10(b)是一个示图，示出了通过将图10(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图11是一个凝胶图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG8是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达；

图12是一个示图，示出了通过将图11中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图13(a)是一个凝胶图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG10是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358肺癌细胞系中表达。图13(b)是一个示图，示出了通过将图13(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图14(a)是一个凝胶图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG13是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358肺癌细胞系中表达。图14(b)是一个示图，示出了通过将图14(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图15(a)是一个凝胶图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG14是否在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358肺癌细胞系中表达。图15(b)是一个示图，示出了通过将图15(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图16是一个凝胶图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG18是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达；

图17是一个示图，示出了通过将图16中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图18是一个凝胶图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG19是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达；

图19是一个示图，示出了通过将图18中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图20是一个凝胶图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG5是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达；

图21是一个示图，示出了通过将图20中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图22是一个凝胶图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG7是否在正常外子宫颈组织、子宫癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系中表达；

图23是一个示图，示出了通过将图22中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图24(a)是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG3是否在12个泳道的多个人类正常组织中表达，图24(b)是一个示图，示出了通过将图24(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图25是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG8是否在12个泳道的多个人类正常组织中表达；

图26是一个示图，示出了通过将图25中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图27(a)是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG10是否在12个泳道的多个人类正常组织中表达，图27(b)是一个示图，示出了通过将图27(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图28(a)是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG13是否在12个泳道的多个人类正常组织中表达，图28(b)是一个示图，示出了通过将图28(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图29(a)是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG14是否在12个泳道的多个人类正常组织中表达，图29(b)是一个示图，示出了通过将图29(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图30是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG18是否在12个泳道的多个人类正常组织中表达；

图31是一个示图，示出了通过将图30中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图32是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG19是否在12个泳道的多个人类正常组织中表达；

图33是一个示图，示出了通过将图32中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图34是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG5是否在12个泳道的多个人类正常组织中表达；

图35是一个示图，示出了通过将图34中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图36是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG7是否在12个泳道的多个人类正常组织中表达；

图37是一个示图，示出了通过将图36中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图38(a)是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG3是否在人类癌细胞系中表达，图38(b)是一个示图，示出了通过将图38(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图39是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG8是否在人类癌细胞系中表达；

图40是一个示图，示出了通过将图39中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图41(a)是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG10是否在人类癌细胞系中表达，图41(b)是一个示图，示出了通过将图41(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图42(a)是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG13是否在人类癌细胞系中表达，图42(b)是一个示图，示出了通过将图42(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图43(a)是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG14是否在人类癌细胞系中表达，图43(b)是一个示图，示出了通过将图43(a)中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图44是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG18是否在人类癌细胞系中表达；

图45是一个示图，示出了通过将图44中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图46是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG19是否在人类癌细胞系中表达；

图47是一个示图，示出了通过将图46中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图48是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG5是否在人类癌细胞系中表达；

图49是一个示图，示出了通过将图48中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；

图50是一个示图，示出了RNA印迹的结果，以确定本发明的原癌基因MIG7是否在人类癌细胞系中表达；

图51是一个示图，示出了通过将图50中的相同样品与β-肌动蛋白探针杂交所获得的RNA印迹结果；以及

图52至60是示图，示出了十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)的结果，以确定将本发明的原癌基因MIG3，MIG8，MIG10，MIG18，MIG13，MIG14，MIG19，MIG5和MIG7分别转化入大肠杆菌中后，在L-阿拉伯糖诱导前后所表达蛋白的大小。

具体实施方式

下文将参照附图对本发明的优选具体实施方式详细加以阐述。

1.MIG3

本发明的原癌基因，人类迁移诱导基因3(MIG3)(下文中，称为MIG3原癌基因)，具有在SEQ ID NO：1中列出的2,295bp全长DNA序列。

在SEQ ID NO：1的DNA序列中，对应于核苷酸序列位置89-709(707-709：终止密码子)的可读框是一个全长蛋白编码区，而来自该蛋白编码区的氨基酸序列在SEQ ID NO：2中列出并包含206个氨基酸(下文中，称为“MIG3蛋白”)。

SEQ ID NO：1的DNA序列已经以编码号AY239293储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期：2004年12月31日)，而DNA测序结果表明其DNA序列与智人cDNA：FLJ23513 fis，克隆体LNG03869基因的序列类似，后者以编码号AK027166储存于所述数据库中。本发明的原癌基因表达的蛋白包含206个氨基酸，氨基酸序列在SEQ ID NO：2中列出，分子量约23kDa。

2.MIG8

本发明的原癌基因，人类迁移诱导基因8(MIG8)(下文中，称为原癌基因MIG8)，具有在SEQ ID NO：5中列出的3,737bp全长DNA序列。

在SEQ ID NO：5的DNA序列中，对应于核苷酸序列位置113-1627(1625-1627：终止密码子)的可读框是一个全长蛋白编码区，而来自该蛋白编码区的氨基酸序列在SEQ ID NO：6中列出并且包含665个氨基酸(下文中，称为“MIG8蛋白”)。

SEQ ID NO：5的DNA序列已经以编码号AY311389储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期：2004年12月31日)，而DNA测序结果表明其氨基酸序列与智人凋亡抑制因子5(API5)基因的氨基酸序列一致，后者以编码号NM_006595和NM_021112储存于所述数据库中。但其一部分DNA序列不同于所述智人凋亡抑制因子5(API5)基因的DNA序列。

本发明的原癌基因表达的蛋白包含504个氨基酸，并且氨基酸序列在SEQ ID NO：6中列出，分子量约57kDa。

3.MIG10

本发明的原癌基因，人类迁移诱导基因10(MIG10)(下文中，称为原癌基因MIG10)，具有在SEQ ID NO：9中列出的1,321bp全长DNA序列。

在SEQ ID NO：9的DNA序列中，对应于核苷酸序列位置23-1276(1274-1276：终止密码子)的可读框是一个全长蛋白编码区，而来自该蛋白编码区的氨基酸序列在SEQ ID NO：10中列出并且包含417个氨基酸(下文中，称为“MIG10蛋白”)。

SEQ ID NO：9的DNA序列已经以编码号AY423725储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期：2004年12月31日)，而DNA测序结果表明其DNA序列与智人磷酸甘油酸激酶1基因以及智人磷酸甘油酸激酶(phosphoglycerate kinase)1(PGK1)基因的DNA序列一致，后者分别以编码号BC023234和NM_000291储存于所述数据库中。

本发明的原癌基因表达的蛋白包含417个氨基酸，而氨基酸序列在SEQ ID NO：10中列出，分子量约45kDa。

4.MIG13

本发明的原癌基因，人类迁移诱导基因13(MIG13)(下文中，称为原癌基因MIG13)，具有在SEQ ID NO：13中列出的1,019bp全长DNA序列。

在SEQ ID NO：13的DNA序列中，对应于核苷酸序列位置11-844(842-844：终止密码子)的可读框是一个全长蛋白编码区，而来自该蛋白编码区的氨基酸序列在SEQ ID NO：14中列出并且包含277个氨基酸(下文中，称为“MIG13蛋白”)。

SEQ ID NO：13的DNA序列已经以编码号AY336090储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期：2004年12月31日)，而DNA测序结果表明其部分DNA序列与Cot 25-标准化(Cot 25-normalized)智人(人类)B细胞(Ramos细胞系)的全长cDNA克隆CS0DL001YE02基因的DNA序列类似，后者以编码号CR613087储存于所述数据库中。

本发明的原癌基因表达的蛋白包含277个氨基酸，并且氨基酸序列在SEQ ID NO：14中列出，分子量约31kDa。

5.MIG14

本发明的原癌基因，人类迁移诱导基因14(MIG14)(下文中，称为原癌基因MIG14)，具有在SEQ ID NO：17中列出的1,142bp全长DNA序列。

在SEQ ID NO：17的DNA序列中，对应于核苷酸序列位置67-1125(1123-1125：终止密码子)的可读框是一个全长蛋白编码区，而来自该蛋白编码区的氨基酸序列在SEQ ID NO：18中列出并且包含206个氨基酸(下文中，称为“MIG14蛋白”)。

SEQ ID NO：17的DNA序列已经以编码号AY336091储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期：2004年12月31日)，并且DNA测序结果表明其DNA序列与智人RAE1RNA输出1同系物(S.pombe)(RAE1)以及智人(人类)的Cot25标准化的胎盘(Placenta Cot 25-normalized)全长cDNA克隆CS0DI002YP18的基因的序列相同，分别以编码号NM_003610和CR626728储存于所述数据库中。

本发明的该原癌基因表达的蛋白包含352个氨基酸，并且氨基酸序列在SEQ ID NO：18中列出，分子量约39kDa。

6.MIG18

本发明的原癌基因，人类迁移诱导基因18(MIG18)(下文中，称为原癌基因MIG18)，具有在SEQ ID NO：21中列出的3,633bp全长DNA序列。

在SEQ ID NO：21的DNA序列中，对应于核苷酸序列位置215-2212(2210-2212：终止密码子)的可读框是一个全长蛋白编码区，而来自该蛋白编码区的氨基酸序列在SEQ ID NO：22中列出并且包含665个氨基酸(下文中，称为“MIG18蛋白”)。

DNA测序结果表明本发明的原癌基因MIG18与智人SH3结构域激酶结合蛋白1(SH3KBP1)(GenBank编码号NM_031892)具有相同的蛋白质序列(Take，H.，et al.，Biochem.Biophy.Res.Comm.268：321-328，2000)，后者通过结合于c-Cb1基因而发挥作用以转导表皮生长因子相关信号(Langdon，W.Y.，et al.，Proc.Natl.Acad.SciUSA 86：1168-1172，1989)，但其部分DNA序列不同于智人SH3结构域激酶结合蛋白1基因的DNA序列。

本发明的该原癌基因表达的蛋白包含665个氨基酸，而氨基酸序列在SEQ ID NO：22中列出，分子量约73kDa。

7.MIG19

本发明的原癌基因，人类迁移诱导基因19(MIG19)(下文中，称为原癌基因MIG19)，具有在SEQ ID NO：25中列出的4,639bp全长DNA序列。

在SEQ ID NO：25的DNA序列中，对应于核苷酸序列位置65-2965(2963-2965：终止密码子)的可读框是一个全长蛋白编码区，而来自该蛋白编码区的氨基酸序列在SEQ ID NO：26中列出并且包含966个氨基酸(下文中，称为“MIG19蛋白”)。

SEQ ID NO：25的DNA序列已经以编码号AY450308储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期：2004年12月31日)，而DNA测序结果表明其部分蛋白质序列与智人膜组分，染色体17，表面标记物2(卵巢癌抗原CA125)(M17S2)，转录变异体3基因(以编码号NM_031862储存于所述数据库中)的蛋白质序列一致，但其部分DNA序列不同于所述基因的DNA序列。

本发明的该原癌基因表达的蛋白包含966个氨基酸，而氨基酸序列在SEQ ID NO：26中列出，分子量约107kDa。

8.MIG5

本发明的原癌基因，人类迁移诱导基因5(MIG5)(下文中，称为原癌基因MIG5)，具有在SEQ ID NO：29中列出的833bp全长DNA序列。

在SEQ ID NO：29的DNA序列中，对应于核苷酸序列位置159-737(735-737：终止密码子)的可读框是一个全长蛋白编码区，而来自该蛋白编码区的氨基酸序列在SEQ ID NO：30中列出并且包含192个氨基酸(下文中，称为“MIG5蛋白”)。

SEQ ID NO：29的DNA序列已经以编码号AY279384储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期：2004年12月31日)，而DNA测序结果表明其DNA序列与智人ras相关C3肉毒杆菌毒素底物1(rho家族，小GTP结合蛋白Racl)(RAC1)，转录变异体Racl基因的DNA序列一致，其分别以编码号NM 006908储存于所述数据库中。

本发明的该原癌基因表达的蛋白包含192个氨基酸，而其氨基酸序列在SEQ ID NO：30中列出，分子量约21kDa。

9.MIG7

本发明的原癌基因，人类迁移诱导基因7(MIG7)(下文中，称为原癌基因MIG7)，具有在SEQ ID NO：33中列出的2,364bp的全长DNA序列。

在SEQ ID NO：33的DNA序列中，对应于核苷酸序列位置1435-1685(1683-1685：终止密码子)的可读框是一个全长蛋白编码区，而来自该蛋白编码区的氨基酸序列在SEQ ID NO：34中列出并且包含76个氨基酸(下文中，称为“MIG7蛋白”)。

SEQ ID NO：33的DNA序列已经以编码号AY305872储存于美国国立卫生研究院(NIH)的GenBank数据库中(公布日期：2004年12月31日)，而DNA测序结果表明其部分DNA序列分别与染色体14上的智人T细胞受体αδ基因座(TCRA/TCRD，以编码号NG_001332储存)、智人T细胞受体αδ基因座(全核苷酸序列的1-250529碱基)(1/5的部分)(以编码号AE000658、AE000521和U85195储存)以及智人(N6-腺苷)-甲基转移酶基因(以编码号AF283991储存于所述数据库中)的DNA序列相同。

本发明的该原癌基因表达的蛋白包含76个氨基酸，并且氨基酸序列在SEQ ID NO：34中列出，分子量约9kDa。

同时，由于密码子的简并性或者考虑到对于存活生物表达所述原癌基因的密码子的优选，本发明的原癌基因可以在编码区进行多种修饰而不改变该编码区表达的致癌蛋白的氨基酸序列，以及在不影响基因表达的范围内对编码区以外的区域进行多种修饰或改变。这种修饰基因也包括在本发明的范畴内。因此，本发明还包括具有的DNA序列与所述原癌基因以及所述原癌基因的片段基本相同的多核苷酸。术语“基本相同的多核苷酸”指的是这样的DNA，其编码相同的翻译蛋白产物且与本发明的原癌基因具有至少80％，优选至少90％，以及最优选至少95％的DNA序列同源性。

而且，在不改变所述蛋白功能的范围内，可以在所述蛋白的氨基酸序列中置换、添加或缺失一个或多个氨基酸，并且根据应用可仅使用部分蛋白。这种修饰的氨基酸序列也包括在本发明的范畴内。因此，本发明还包括具有的氨基酸序列与所述致癌蛋白以及所述蛋白的片段基本相同的多肽。术语“基本相同的多肽”指的是这样的多肽，其具有至少80％，优选至少90％，以及最优选至少95％的序列同源性。

本发明的原癌基因和蛋白可以分离自人类癌组织，或者按照已知用于合成DNA或肽的方法而合成。而且，这样制备的基因可插入本领域中已知的用于在微生物中表达的载体中，以获得表达载体，然后该表达载体可以导入恰当的宿主细胞中，例如大肠杆菌、酵母细胞等。在这种转化的宿主中，可以大量复制本发明的基因DNA或可以大量生产其蛋白。

一旦构建了该表达载体，则根据生产该基因或蛋白的宿主细胞种类，可以恰当地选择和组合表达调节序列例如启动子和终止子、自主复制序列、分泌信号等。

已证实本发明的基因为强致癌基因，能够形成肺癌，因为诸如RNA印迹的分析方法表明该基因在正常肺组织中几乎不表达，而在肺癌组织和肺癌细胞系中则过表达。而且已证明这些基因是癌症转移相关基因，能够诱导癌症转移，因为其在转移性淋巴结癌组织中表达增加。除了上皮组织例如肺癌，本发明的原癌基因也在其他癌性肿瘤组织中高度表达，例如白血病、子宫癌、淋巴瘤、结肠癌、皮肤癌等。因此，认为本发明的原癌基因是多种肿瘤生成中的共有癌基因，并且可以有效用于诊断多种癌症并生产转化的动物。

例如，利用所述原癌基因诊断癌症的方法包括这样的步骤，即所述原癌基因的全部或部分作为证明(proves)与从受试者体液中提取的核酸杂交后，通过本领域中已知的多种方法检测所述原癌基因来确定受试者是否具有本发明的原癌基因。利用放射性同位素、酶等标记的探针可以很容易证实所述基因存在于组织样品中。因此，本发明提供含有全部或部分所述原癌基因的试剂盒，用于诊断癌症。

通过将本发明的原癌基因导入哺乳动物例如啮齿类如大鼠体内，可以获得转化的动物，而且优选在至少8细胞期之前的受精卵期将所述原癌基因导入。这样制备的转化动物可以有效用于搜寻致癌物质或抗癌物质如抗氧化剂。

来自本发明的原癌基因的蛋白可有效用于产生作为诊断工具的抗体。按照本领域中已知的常规方法可以利用从本发明的原癌基因或其片段表达的蛋白产生作为单克隆抗体或多克隆抗体的本发明的抗体，因此，通过利用本领域中已知的方法，例如酶联免疫吸附试验(ELISA)、放射性免疫测定(RIA)、夹层分析法、聚丙烯酰胺凝胶上的蛋白质印迹或免疫印迹等，来确定所述蛋白是否在受试者的体液样品中表达，从而这种抗体可用来诊断癌症和癌症转移。

而且，本发明的原癌基因可用来构建以失控方式持续生长的癌细胞系，并且这种细胞系可以，例如，从利用转染了所述原癌基因的成纤维细胞在裸鼠背中形成的瘤组织而产生。这种癌细胞系可有效用于搜寻抗癌剂等。

下文将参照优选实施例来详细阐述本发明。

然而，本文中提出的阐述仅是优选实施例，仅用于说明的目的，而不限制本发明的范畴。

实施例1：肿瘤细胞的培养以及总RNA的分离

1-1：MIG3、MIG10、MIG13以及MIG14

(第一步)肿瘤细胞的培养

为了实施所述mRNA差异显示法，取得正常肺组织、并从肺癌患者得到原发性肺癌组织以及转移至右肺的癌组织，其中上述患者在外科手术之前未进行过抗癌治疗和/或放射治疗。在差异显示法中，A549(美国模式培养物收藏中心(American Type CultureCollection)；ATCC号CCL-185)用作人类肺癌细胞系。

将从得到的组织获得的细胞以及A549肺癌细胞系在Waymouth′s MB 752/1培养基(Gibco)中培养，该培养基含2mM谷氨酰胺，100IU/ml青霉素，100μg/ml链霉素和10％胎牛血清(Gibco，U.S.)。本实验中采用的培养细胞处于指数生长期，且本文采用的细胞通过台盼蓝染料排阻实验表现出至少95％的生存力(Freshney，″Culture of Animal Cells：A Manual of Basic Technique″2nd Ed.，A.R.Liss，New York，1987)。

(第二步)RNA的分离和mRNA差异显示法

利用市售系统RNeasy总RNA试剂盒(Qiagen Inc.，Germany)，从正常肺组织、原发性肺癌组织、转移性肺癌组织以及A549细胞(每一种均在第一步中得到)分离总RNA样品，随后利用messageclean试剂盒(GenHunter Corp.，Brookline，MA，U.S.)将DNA污染物从RNA样品中去除。

1-2：MIG8、MIG18、MIG19、MIG5以及MIG9

(第一步)肿瘤细胞的培养

为了实施所述mRNA差异显示法，从患子宫肌瘤已行子宫切除术的患者得到正常外子宫颈组织，以及从在外科手术之前未进行过抗癌治疗和/或放射治疗的子宫癌患者得到原发性宫颈肿瘤组织和转移性淋巴结肿瘤组织。在差异显示法中，CUMC-6(Kim，J.W.et al.，Gynecol.Oncol.62：230-240，1996)用作人类宫颈癌细胞系。

将从得到的组织获得的细胞以及CUMC-6细胞系在Waymouth′s MB 752/1培养基(Gibco)中培养，该培养基含2mM谷氨酰胺，100IU/ml青霉素，100μg/ml链霉素和10％胎牛血清(Gibco，U.S.)。本实验中采用的培养细胞处于指数生长期，且本文中采用的细胞通过台盼蓝排阻实验表现出至少95％的生存力(Freshney，″Culture of Animal Cells：A Manual of Basic Technique″2nd Ed.，A.R.Liss，New York，1987)。

(第二步)RNA的分离和mRNA差异显示法

利用市售系统RNeasy总RNA试剂盒(Qiagen Inc.，Germany)，从正常外子宫颈组织、原发性宫颈肿瘤组织、转移性淋巴结肿瘤组织以及CUMC-6细胞(每一种均在第一步中得到)分离总RNA样品，随后利用message clean试剂盒(GenHunter Corp.，Brookline，MA，U.S.)将DNA污染物从RNA样品中去除。

实施例2：差异显示逆转录-聚合酶链反应(DDRT-PCR)

2-1：MIG3

利用稍作改良的逆转录-聚合酶链反应(RT-PCR，由Liang，P.和A.B.Pardee提出)实施差异显示逆转录。

首先，利用具有SEQ ID NO：3给出的DNA序列的锚定引物H-T11A(5-AAGCTTTTTTTTTTTC-3′，RNAimage试剂盒，Genhunter，Cor.，MA，U.S.)作为锚定寡-dT引物，对实施例1-1的第一步中得到的总RNA每种各0.2μg实施逆转录。

然后，在存在0.5mM[α-³⁵S]dATP(1200Ci/mmole)的情况下，利用相同的锚定引物以及引物H-AP22(5′-AAGCTTTTGATCC-3′)实施PCR反应，而H-AP22具有随机5’11-mer引物(RNAimage引物组1-5)H-AP 1至40中SEQ ID NO：4给出的DNA序列。PCR反应在以下条件下进行：共40个扩增循环，包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤，然后是72℃5分钟的一个最后延伸步骤。

将PCR反应中扩增的片段溶解在用于DNA测序的6％聚丙烯酰胺测序凝胶中，然后利用放射自显影来证实差异表达的条带位置。

从干凝胶中切取具有L276-811cDNA(碱基位置从SEQ ID NO：1的1862-2166)的305个碱基对(bp)条带。将切出的凝胶加热15分钟以洗脱该L276-811cDNA，然后在上述相同条件下用相同的引物重复PCR反应，以再次扩增L276-811cDNA，只是在此里未使用[α-³⁵S]标记的dATP(1200Ci/mmole)和20μM dNTP。

2-2：MIG8

首先，利用具有SEQ ID NO：7给出的DNA序列的锚定引物H-T11C(5-AAGCTTTTTTTTTTTC-3′，RNAimage 试剂盒，Genhunter，Cor.，MA，U.S.)作为锚定寡-dT引物，对实施例1-2的第一步中得到的总RNA每种各0.2μg实施逆转录。

然后，在存在0.5mM[α-³⁵S]dATP(1200Ci/mmole)的情况下，利用相同的锚定引物以及引物H-AP23(5′-AAGCTTGGCTATG-3′)实施PCR反应，其中H-AP23具有随机的5’11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQ IDNO：8给出的DNA序列。PCR反应在以下条件下进行：共40个扩增循环，包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤，然后是72℃5分钟的一个最后延伸步骤。

将PCR反应中扩增的片段溶解在6％聚丙烯酰胺测序凝胶中，用于DNA测序，然后利用放射自显影来证实差异表达的条带位置。

从干凝胶中切取带有CC231cDNA(SEQ ID NO：5碱基位置3142-3483)的342个碱基对(bp)的条带。将切出的凝胶加热15分钟以洗脱该CC231cDNA，然后在上述相同条件下用相同的引物重复PCR反应，以再次扩增CC231cDNA，只是在这里未使用[α-³⁵S]标记的dATP(1200Ci/mmole)和20μM dNTP。

2-3：MIG10

首先，利用具有SEQ ID NO：11给出的DNA序列的锚定引物H-T11C(5-AAGCTTTTTTTTTTTC-3′，RNAimage 试剂盒，Genhunter，Cor.，MA，U.S.)作为锚定寡-dT引物，对实施例1-1第一步中得到的总RNA每种各0.2μg实施逆转录。

然后，在存在0.5mM[α-³⁵S]dATP(1200Ci/mmole)的情况下，利用相同的锚定引物以及引物H-AP23(5′-AAGCTTGGCTATG-3′)实施PCR反应，其中H-AP23具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP 1至40中SEQID NO：12给出的DNA序列。PCR反应在以下条件下进行：共40个扩增循环，包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤，然后是72℃5分钟的一个最后延伸步骤。

从干凝胶中切取284个碱基对(bp)带有L789cDNA(SEQ IDNO：9的碱基位置1022-1305)的条带。将切出的凝胶加热15分钟以洗脱该L789cDNA，然后在上述相同条件下用相同的引物重复PCR反应，以再次扩增L789cDNA，只是在这里未使用[α-³⁵S]标记的dATP(1200Ci/mmole)和20μM dNTP。

2-4：MIG13

首先，利用具有SEQ ID NO：15给出的DNA序列的锚定引物H-T11C(5-AAGCTTTTTTTTTTTC-3′，RNAimage 试剂盒，Genhunter，Cor.，MA，U.S.)作为锚定寡-dT引物，对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。

然后，在存在0.5mM[α-³⁵S]dATP(1200Ci/mmole)的情况下，利用相同的锚定引物以及引物H-AP21(5′-AAGCTTTCTCTGG-3′)实施PCR反应，其中H-AP21具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO：16给出的DNA序列。PCR反应在以下条件下进行：共40个扩增循环，包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤，然后是72℃5分钟的一个最后延伸步骤。

从干凝胶中切取295个碱基对(bp)带有L986cDNA(SEQ IDNO：13的碱基位置685-979)的条带。将切出的凝胶加热15分钟以洗脱该L986cDNA，然后在上述相同条件下用相同的引物重复PCR反应，以再次扩增L986cDNA，只是在这里未使用[α-³⁵S]标记的dATP(1200Ci/mmole)和20μM dNTP。

2-5：MIG14

首先，利用具有SEQ ID NO：19给出的DNA序列的锚定引物H-T11A(5-AAGCTTTTTTTTTTTA-3′，RNAimage 试剂盒，Genhunter，Cor.，MA，U.S.)作为锚定寡-dT引物，对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。

然后，在存在0.5mM[α-³⁵S]dATP(1200Ci/mmole)的情况下，利用相同的锚定引物以及引物H-AP21(5′-AAGCTTTCTCTGG-3′)实施PCR反应，其中H-AP21具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO：20给出的DNA序列。PCR反应在以下条件下进行：共40个扩增循环，包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤，然后是72℃5分钟的一个最后延伸步骤。

从干凝胶中切取276个碱基对(bp)带有L1284cDNA(SEQ IDNO：17的碱基位置823-1098)的条带。将切出的凝胶加热15分钟以洗脱该L1284cDNA，然后在上述相同条件下用相同的引物重复PCR反应，以再次扩增L1284cDNA，只是在这里未使用[α-³⁵S]标记的dATP(1200Ci/mmole)和20μM dNTP。

2-6：MIG18

首先，利用具有SEQ ID NO：23给出的DNA序列的锚定引物H-T11A(5-AAGCTTTTTTTTTTTA-3′，RNAimage 试剂盒，Genhunter，Cor.，MA，U.S.)作为锚定寡-dT引物，对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。

然后，在存在0.5mM[α-³⁵S]dATP(1200Ci/mmole)的情况下，利用相同的锚定引物以及引物H-AP36(5′-AAGCTTCGACGCT-3′)实施PCR反应，其中H-AP36具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO：24给出的DNA序列。PCR反应在以下条件下进行：共40个扩增循环，包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤，然后是72℃5分钟的一个最后延伸步骤。

从干凝胶中切取221个碱基对(bp)带有CA367cDNA(SEQID NO：21的碱基位置2920-3140)的条带。将切出的凝胶加热15分钟以洗脱该CA367cDNA，然后在上述相同条件下用相同的引物重复PCR反应，以再次扩增CA367cDNA，只是在这里未使用[α-³⁵S]标记的dATP(1200Ci/mmole)和20μM dNTP。

2-7：MIG19

首先，利用具有SEQ ID NO：27给出的DNA序列的锚定引物H-T11A(5-AAGCTTTTTTTTTTTA-3′，RNAimage试剂盒，Genhunter，Cor.，MA，U.S.)作为锚定寡-dT引物，对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。

然后，在存在0.5mM[α-³⁵S]dATP(1200Ci/mmole)的情况下，利用相同的锚定引物以及引物H-AP33(5′-AAGCTTGCTGCTC-3′)实施PCR反应，其中H-AP33具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO：28给出的DNA序列。PCR反应在以下条件下进行：共40个扩增循环，包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤，然后是72℃5分钟的一个最后延伸步骤。

从干凝胶中切取381个碱基对(bp)带有CA335cDNA(SEQID NO：25的碱基位置4123-4503)的条带。将切出的凝胶加热15分钟以洗脱该CA335cDNA，然后在上述相同条件下用相同的引物重复PCR反应，以再次扩增CA335cDNA，只是在这里未使用[α-³⁵S]标记的dATP(1200Ci/mmole)和20μM dNTP。

2-8：MIG5

首先，利用具有SEQ ID NO：31给出的DNA序列的锚定引物H-T11G(5-AAGCTTTTTTTTTTTG-3′，RNAimage试剂盒，Genhunter，Cor.，MA，U.S.)作为锚定寡-dT引物，对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。

然后，在存在0.5mM[α-³⁵S]dATP(1200Ci/mmole)的情况下，利用相同的锚定引物以及引物H-AP26(5′-AAGCTTGCCATGG-3′)实施PCR反应，其中H-AP26具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP 1至40中SEQID NO：32给出的DNA序列。PCR反应在以下条件下进行：共40个扩增循环，包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤，然后是72℃5分钟的一个最后延伸步骤。

从干凝胶中切取263个碱基对(bp)带有CG263cDNA(SEQID NO：29的碱基位置476-738)的条带。将切出的凝胶加热15分钟以洗脱该CG263cDNA，然后在上述相同条件下用相同的引物重复PCR反应，以再次扩增CG263cDNA，只是在这里未使用[α-³⁵S]标记的dATP(1200Ci/mmole)和20μM dNTP。

2-9：MIG7

利用改良的逆转录-聚合酶链反应(RT-PCR，由Liang，P.和A.B.Pardee提出)实施差异显示逆转录。

首先，利用具有SEQ ID NO：35给出的DNA序列的锚定引物H-T11G(5-AAGCTTTTTTTTTTTG-3′，RNAimage 试剂盒，Genhunter，Cor.，MA，U.S.)作为锚定寡-dT引物，对实施例1第一步中得到的总RNA每种各0.2μg实施逆转录。

然后，在存在0.5mM[α-³⁵S]dATP(1200Ci/mmole)的情况下，利用相同的锚定引物以及引物H-AP23(5′-AAGCTTGGCTATG-3′)实施PCR反应，其中H-AP23具有随机的5’-11-mer引物(RNAimage引物组1-5)H-AP1至40中SEQID NO：36给出的DNA序列。PCR反应在以下条件下进行：共40个扩增循环，包括95℃40秒的变性步骤、40℃2分钟的退火步骤和72℃40秒的延伸步骤，然后是72℃5分钟的一个最后延伸步骤。

从干凝胶中切取327个碱基对(bp)带有CG233cDNA(SEQID NO：33的碱基位置1903-2229)的条带。将切出的凝胶加热15分钟以洗脱该CG233cDNA，然后在上述相同条件下用相同的引物重复PCR反应，以再次扩增CG233cDNA，只是在这里未使用[α-³⁵S]标记的dATP(1200Ci/mmole)和20μM dNTP。

实施例3：克隆

利用TA克隆系统(Promega，U.S.)，按照生产商手册将上述均已经过再次扩增的L276-811PCR产物、CC231PCR产物、L789PCR产物、L986PCR产物、L1284PCR产物、CA367PCR产物、CA335PCR产物、CG263PCR产物以及CG233PCR产物分别插入pGEM-T EASY载体中。

(第一步)连接反应

将实施例2中均已经过再次扩增的L276-811PCR产物、CC231PCR产物、L789PCR产物、L986PCR产物、L1284PCR产物、CA367PCR产物、CA335PCR产物、CG263PCR产物以及CG233PCR产物每种各2μl，pGEM-T EASY载体1μl(50ng)，T4DNA连接酶(10X缓冲液)1μl以及T4DNA连接酶(3weiss单位/μl；Promega)1μl加入0.5ml试管中，并加入蒸馏水至终体积10μl。将该连接反应混合物14℃孵育过夜。

(第二步)TA克隆的转化

将E.coli JM109(Promega，WI，U.S.)在10mlLB液体培养基(10g细菌用胰蛋白胨，5g细菌用酵母提取物，5g NaCl)中孵育，直至600nm处的光密度达到约0.3-0.6。将该孵育的混合物置于冰中约10分钟，于4℃4,000rpm离心10分钟，然后弃上清并收集细胞。将收集的细胞沉淀物置于10ml 0.1M冰冷的CaCl₂中约30分钟至1小时，以生成感受态细胞。将产物再次于4℃4,000rpm离心10分钟，然后弃上清、收集细胞并悬浮于2ml 0.1M冰冷的CaCl₂中。

将该感受态细胞悬浮液200μl转移至新的微量离心管(microfuge)中，并向管中加入第一步中制备的连接反应产物2μl。将得到的混合物在42℃水浴中孵育90秒，然后0℃骤冷。向管中加入800μl SOC培养基(2.0g细菌用胰蛋白胨，0.5g细菌用酵母提取物，1ml 1M NaCl，0.25ml 1M KCl，97ml TDW，1ml 2M Mg²⁺，1ml 2M葡萄糖)，然后将得到的混合物在旋转式振荡培养箱(220rpm)中37℃孵育45分钟。

用玻璃棒将25μlX-gal(储存于40mg/ml二甲基甲酰胺中)涂布于LB盘(补充了氨苄青霉素且已提前放入37℃培养箱中)上，加入25μl转化的细胞，再次用玻璃棒涂布，然后37℃孵育过夜。孵育后，选择3-4个形成的白色菌落，并将每一种选择的细胞均接种培养于补充了氨苄青霉素的LB盘上。为了构建质粒，选择认为已经分别导入连接反应产物的菌落，并在10ml高营养(terrific)液体培养基(900ml TDW，12g细菌用胰蛋白胨，24g细菌用酵母提取物，4ml甘油，0.17M KH₂PO₄，100ml 0.72N K₂HPO₄)中培养，所述连接反应产物即转化的大肠杆菌株JM109/L276-811、JM109/CC231、JM109/L789、JM109/L986、JM109/L1284、JM109/CA367、JM109/CA335、JM109/CG263和JM109/CG233。

实施例4：重组质粒DNA的分离

利用Wizard^TM Plus Minipreps DNA纯化试剂盒(Promega，U.S.)，按照生产商手册将L276-811质粒DNA、CC231质粒DNA、L789质粒DNA、L986质粒DNA、L1284质粒DNA、CA367质粒DNA、CA335质粒DNA、CG263质粒DNA和CG233质粒DNA中的每一种从所述转化的大肠杆菌株中分离出来。

证实用限制性内切酶ECoRI处理部分每种分离的质粒DNA，通过在2％凝胶中电泳，L276-811、CC231、L789、L986、L1284、CA367、CA335、CG263和CG233的部分序列分别插入该质粒中。

实施例5：DNA测序分析

5-1：MIG3

将实施例2中得到的L276-811PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase 2.0版DNA测序试剂盒(UnitedStates Biochemical，Cleveland，OH，U.S.)，将得到的L276-811PCR片段按照双脱氧链终止法进行测序。

所述基因的DNA序列对应于SEQ ID NO：1的核苷酸序列位置1862-2166，其在本发明中命名为“L276-811”。

利用5′随机引物H-AP22和3′锚定引物H-T11A，对上述得到的305bp cDNA片段例如L276-811进行差异显示逆转录-聚合酶链反应(DDRT-PCR)，随后利用电泳来证实。

如图1所示，差异显示(DD)表明该基因在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中差异表达。如图1可以看出，该305bp的cDNA片段L276-811在肺癌组织、转移性肺癌组织以及A549肺癌细胞中表达，但在正常肺组织中不表达。该L276-811在癌组织特别是转移性癌组织中表达最高。

5-2：MIG8

将实施例2中得到的CC231PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical，Cleveland，OH，U.S.)，将得到的CC231PCR片段按照双脱氧链终止法进行测序。

所述基因的DNA序列对应于SEQ ID NO：5的核苷酸序列位置3142-3483，其在本发明中命名为“CC231”。

利用5′随机引物H-AP23和3′锚定引物H-T11C，对上述得到的342bp cDNA片段例如CC231进行差异显示逆转录-聚合酶链反应(DDRT-PCR)，随后利用电泳来证实。

如图2所示，差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图2可以看出，该342bp的cDNA片段CC231在宫颈癌、转移性淋巴结组织以及CUMC-6癌细胞中表达，但在正常组织中不表达。

5-3：MIG10

将实施例2中得到的L789PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical，Cleveland，OH，U.S.)，将得到的L789PCR片段按照双脱氧链终止法进行测序。

所述基因的DNA序列对应于SEQ ID NO：9的核苷酸序列位置1022-1305，其在本发明中命名为“L789”。

利用5′随机引物H-AP23和3′锚定引物H-T11C，对上述得到的284bp cDNA片段例如L789进行差异显示逆转录-聚合酶链反应(DDRT-PCR)，随后利用电泳来证实。

如图3所示，差异显示(DD)表明该基因在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中差异表达。如图3可以看出，该255bp的cDNA片段L276在肺癌组织、转移性肺癌组织以及A549肺癌细胞中表达，但在正常肺组织中不表达。该L276基因在癌组织特别是转移性癌组织中表达最高。

5-4：MIG13

将实施例2中得到的L986PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical，Cleveland，OH，U.S.)，对得到的L986PCR片段按照双脱氧链终止法进行测序。

所述基因的DNA序列对应于SEQ ID NO：13的核苷酸序列位置685-979，其在本发明中命名为“L986”。

利用5′随机引物H-AP21和3′锚定引物H-T11C，对上述得到的295bp cDNA片段例如L986进行差异显示逆转录-聚合酶链反应(DDRT-PCR)，随后利用电泳来证实。

如图4所示，差异显示(DD)表明该基因在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中差异表达。如图4可以看出，该255bp的cDNA片段L986在肺癌组织、转移性肺癌组织以及A549肺癌细胞中表达，但在正常肺组织中不表达。该L276-811基因在癌组织特别是转移性癌组织中表达最高。

5-5：MIG14

将实施例2中得到的L1284PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical，Cleveland，OH，U.S.)，对得到的L1284PCR片段按照双脱氧链终止法进行测序。

所述基因的DNA序列对应于SEQ ID N0：17的核苷酸序列位置823-1098，其在本发明中命名为“L1284”。

利用5′随机引物H-AP21和3′锚定引物H-T11A，对上述得到的276bp cDNA片段例如L1284进行差异显示逆转录-聚合酶链反应(DDRT-PCR)，随后利用电泳来证实。

如图5所示，差异显示(DD)表明该基因在正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549肺癌细胞中差异表达。如图5可以看出，该276bp的cDNA片段L1284在肺癌组织、转移性肺癌组织以及A549肺癌细胞中表达，但在正常肺组织中不表达。该L1284基因在癌组织特别是转移性癌组织中表达最高。

5-6：MIG18

将实施例2中得到的CA367PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical，Cleveland，OH，U.S.)，对得到的CA367PCR片段按照双脱氧链终止法进行测序。

所述基因的DNA序列对应于SEQ ID NO：21的核苷酸序列位置2920-3140，其在本发明中命名为“CA367”。

利用5′随机引物H-AP36和3′锚定引物H-T11A，对上述得到的221bp cDNA片段例如CA367进行差异显示逆转录-聚合酶链反应(DDRT-PCR)，随后利用电泳来证实。

如图6所示，差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图6可以看出，该221bp的cDNA片段CA367在宫颈癌组织、转移性淋巴结组织以及CUMC-6癌细胞中表达，但在正常组织中不表达。

5-7：MIG19

将实施例2中得到的CA335PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical，Cleveland，OH，U.S.)，对得到的CA335PCR片段按照双脱氧链终止法进行测序。

所述基因的DNA序列对应于SEQ ID NO：25的核苷酸序列位置4123-4503，其在本发明中命名为“CA335”。

利用5′随机引物H-AP33和3′锚定引物H-T11A，对上述得到的381bp cDNA片段例如CA335进行差异显示逆转录-聚合酶链反应(DDRT-PCR)，随后利用电泳来证实。

如图7所示，差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图7可以看出，该381bp的cDNA片段CA335在宫颈癌组织、转移性淋巴结组织以及CUMC-6癌细胞中表达，但在正常组织中不表达。

5-8：MIG5

将实施例2中得到的CG263PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical，Cleveland，OH，U.S.)，对得到的CG263PCR片段按照双脱氧链终止法进行测序。

所述基因的DNA序列对应于SEQ ID NO：29的核苷酸序列位置476-738，其在本发明中命名为“CG263”。

利用5′随机引物H-AP26和3′锚定引物H-T11G，对上述得到的263bp cDNA片段例如CG263进行差异显示逆转录-聚合酶链反应(DDRT-PCR)，随后利用电泳来证实。

如图8所示，差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图8可以看出，该263bp的cDNA片段CG263在宫颈癌组织、转移性淋巴结组织以及CUMC-6癌细胞中表达，但在正常组织中不表达。

5-9：MIG7

将实施例2中得到的CG233PCR产物按照常规方法扩增、克隆并再次扩增。利用Sequenase2.0版DNA测序试剂盒(United StatesBiochemical，Cleveland，OH，U.S.)，对得到的CG233PCR片段按照双脱氧链终止法进行测序。

所述基因的DNA序列对应于SEQ ID NO：33的核苷酸序列位置1903-2229，其在本发明中命名为“CG233”。

利用5′随机引物H-AP23和3′锚定引物H-T11G，对上述得到的327bp cDNA片段例如CG233进行差异显示逆转录-聚合酶链反应(DDRT-PCR)，随后利用电泳来证实。

如图9所示，差异显示(DD)表明该基因在正常外子宫颈组织、转移性淋巴结组织以及CUMC-6细胞中差异表达。如图9可以看出，该327bp的cDNA片段CG233在宫颈癌组织、转移性淋巴结组织以及CUMC-6癌细胞中表达，但在正常组织中不表达。

实施例6：全长原癌基因的cDNA序列分析

6-1：MIG3

³²P标记的L276-811用作探针来筛查噬菌体λgt11人胚肺成纤维细胞(lung embryonic fibroblast)cDNA文库(Miki，T.et al.，Gene83：137-146，1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG3cDNA克隆，其中2295bp片段插入pCEV-LAC载体中，然后于2003年2月19日以编码号AY239293储存于U.S.NIH的GenBank数据库中(公布日期：2004年12月31日)。

通过限制性内切酶NotI剪切插入λpCEV载体中的MIG3克隆，并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki，T.et al.，Gene 83：137-146，1989)。

通过T4DNA连接酶连接含MIG3基因的pCEV-LAC载体，以获得MIG3质粒DNA，然后用连接的克隆转化大肠杆菌DH5α。

在SEQ ID NO：1的DNA序列中，估计本发明的原癌基因的全长可读框对应于核苷酸序列位置89-709，并且编码由SEQ ID NO：2的206个氨基酸组成的蛋白。

6-2：MIG8

³²p-标记的CC231用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.et al.，Gene 83：137-146，1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG8cDNA克隆，其中3737bp片段插入pCEV-LAC载体中，然后于2003年6月1日以编码号AY311389储存于U.S.NIH的GenBank数据库中(公布日期：2004年12月31日)。

通过限制性内切酶NotI剪切插入λpCEV载体中的MIG8克隆，并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki，T.et al.，Gene 83：137-146，1989)。

通过T4DNA连接酶连接含MIG8基因的pCEV-LAC载体，以获得MIG8质粒DNA，然后用连接的克隆转化大肠杆菌DH5α。

MIG18(8)的全长DNA序列由3737bp组成，并在SEQ ID NO：5中列出。

在SEQ ID NO：5的DNA序列中，估计本发明的原癌基因的全长可读框对应于核苷酸序列位置113-1627，并且编码由SEQ ID NO：6的504个氨基酸组成的蛋白。

6-3：MIG10

³²p-标记的L789用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.et al.，Gene 83：137-146，1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG10cDNA克隆，其中1321bp片段插入pCEV-LAC载体中，然后于2003年9月26日以编码号AY423725储存于U.S.NIH的GenBank数据库中(公布日期：2004年12月31日)。

通过限制性内切酶NotI剪切插入λpCEV载体中的MIG10克隆，并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki，T.et al.，Gene 83：137-146，1989)。

通过T4DNA连接酶连接含MIG10基因的pCEV-LAC载体，以获得MIG10质粒DNA，然后用连接的克隆转化大肠杆菌DH5α。

在SEQ ID NO：9的DNA序列中，估计本发明的原癌基因的全长可读框对应于核苷酸序列位置23-1276，并且编码由SEQ ID NO：10的417个氨基酸组成的蛋白。

6-4：MIG13

³²P-标记的L986用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.et al.，Gene 83：137-146，1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG13cDNA克隆，其中1019bp片段插入pCEV-LAC载体中，然后于2003年7月7日以编码号AY336090储存于U.S.NIH的GenBank数据库中(公布日期：2004年12月31日)。

通过限制性内切酶NotI剪切插入λpCEV载体中的MIG13克隆，并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki，T.et al.，Gene 83：137-146，1989)。

通过T4DNA连接酶连接含MIG13基因的pCEV-LAC载体，以获得MIG13质粒DNA，然后用连接的克隆转化大肠杆菌DH5α。

在SEQ ID NO：13的DNA序列中，估计本发明的原癌基因的全长可读框对应于核苷酸序列位置11-844，并且编码由SEQ ID NO：14的277个氨基酸组成的蛋白。

6-5：MIG14

³²p-标记的L1284用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.et al.，Gene 83：137-146，1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG14cDNA克隆，其中1142bp片段插入pCEV-LAC载体中，然后于2003年7月4日以编码号AY336091储存于U.S.NIH的GenBank数据库中(公布日期：2004年12月31日)。

通过限制性内切酶NotI剪切插入λpCEV载体中的MIG14克隆，并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki，T.et al.，Gene 83：137-146，1989)。

通过T4DNA连接酶连接含MIG14基因的pCEV-LAC载体，以获得MIG14质粒DNA，然后用连接的克隆转化大肠杆菌DH5α。

在SEQ ID NO：17的DNA序列中，估计本发明的原癌基因的全长可读框对应于核苷酸序列位置67-1125，并且编码由SEQ IDNO：18的352个氨基酸组成的蛋白。

6-6：MIG18

³²P-标记的CA367用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.et al.，Gene 83：137-146，1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG18cDNA克隆，其中3633bp片段插入pCEV-LAC载体中，然后于2003年9月30日以编码号AY423734储存于U.S.NIH的GenBank数据库中(公布日期：2004年12月31日)。

通过限制性内切酶NotI剪切插入λpCEV载体中的MIG18克隆，并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki，T.et al.，Gene 83：137-146，1989)。

通过T4DNA连接酶连接含MIG18基因的pCEV-LAC载体，以获得MIG18质粒DNA，然后用连接的克隆转化大肠杆菌DH5α。

MIG18的全长DNA序列由3633bp组成，并在SEQ ID NO：21中列出。

在SEQ ID NO：21的DNA序列中，估计本发明的原癌基因的全长可读框对应于核苷酸序列位置215-2212，并且编码由SEQ IDNO：22的665个氨基酸组成的蛋白。

6-7：MIG19

³²P-标记的CA335用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.et al.，Gene 83：137-146，1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG19cDNA克隆，其中4639bp片段插入pCEV-LAC载体中，然后于2003年10月26日以编码号AY450308储存于U.S.NIH的GenBank数据库中(公布日期：2004年12月31日)。

通过限制性内切酶NotI剪切插入λpCEV载体中的MIG19克隆，并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki，T.et al.，Gene 83：137-146，1989)。

通过T4DNA连接酶连接含MIG19基因的pCEV-LAC载体，以获得MIG19质粒DNA，然后用连接的克隆转化大肠杆菌DH5α。

MIG19的全长DNA序列由4639bp组成，并在SEQ ID NO：25中列出。

在SEQ ID NO：25的DNA序列中，估计本发明的原癌基因的全长可读框对应于核苷酸序列位置65-2965，并且编码由SEQ IDNO：26的966个氨基酸组成的蛋白。

6-8：MIG5

³²P-标记的CG263用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.et al.，Gene 83：137-146，1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG5cDNA克隆，其中833bp片段插入pCEV-LAC载体中，然后于2003年4月19日以编码号AY279384储存于U.S.NIH的GenBank数据库中(公布日期：2004年12月31日)。

通过限制性内切酶NotI剪切插入λpCEV载体中的MIG5克隆，并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki，T.et al.，Gene 83：137-146，1989)。

通过T4DNA连接酶连接含MIG5基因的pCEV-LAC载体，以获得MIG5质粒DNA，然后用连接的克隆转化大肠杆菌DH5α。

MIG5的全长DNA序列由833bp组成，并在SEQ ID NO：29中列出。

在SEQ ID NO：29的DNA序列中，估计本发明的原癌基因的全长可读框对应于核苷酸序列位置159-737，并且编码由SEQ IDNO：30的192个氨基酸组成的蛋白。

6-9：MIG7

³²P-标记的CG233用作探针来筛查噬菌体λgt11人胚肺成纤维细胞cDNA文库(Miki，T.et al.，Gene 83：137-146，1989)。从所述人胚肺成纤维细胞cDNA文库获得全长MIG7cDNA克隆，其中2364bp片段插入pCEV-LAC载体中，然后于2003年5月24日以编码号AY305872储存于U.S.NIH的GenBank数据库中(公布日期：2004年12月31日)。

通过限制性内切酶NotI剪切插入λpCEV载体中的MIG7克隆，并将其从抗氨苄青霉素的pCEV-LAC噬菌粒载体形式的噬菌体中分离出来(Miki，T.et al.，Gene 83：137-146，1989)。

通过T4DNA连接酶连接含MIG7基因的pCEV-LAC载体，以获得MIG7质粒DNA，然后用连接的克隆转化大肠杆菌DH5α。

MIG7的全长DNA序列由2364bp组成，并在SEQ ID NO：33中列出。

在SEQ ID NO：33的DNA序列中，估计本发明的原癌基因的全长可读框对应于核苷酸序列位置1435-1665，并且编码由SEQ IDNO：4(34)的76个氨基酸组成的蛋白。

实施例7：多种细胞中的基因的RNA印迹分析

7-1：MIG3，MIG10，MIG13以及MIG14

以与实施例1中相同的方式从正常肺组织、左侧肺癌组织、从左肺转移至右肺的转移性肺癌组织以及A549和NCI-H358(美国模式培养物收藏中心；ATCC No.CRL-5807)肺癌细胞系中提取总RNA样品。

为了确定MIG3、MIG10、MIG13和MIG14基因中每一种的表达水平，将从所述组织和细胞系每一种提取的变性总RNA样品每种各20μg在1％甲醛琼脂糖凝胶中电泳，然后将得到的琼脂糖凝胶转移至尼龙膜(Boehringer-Mannheim，Germany)上。将印迹与³²P标记的并随机预处理的全长MIG cDNA探针杂交，其中探针是利用Rediprime II随机prime标记系统((Amersham，UnitedKingdom)所制备。该RNA印迹分析重复两次，因此用密度计对得到的印迹加以定量并用β-肌动蛋白进行标准化。

图10(a)示出了RNA印迹结果，以确定MIG3原癌基因是否在正常肺组织、肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中表达。如图10(a)中所示，表明MIG3原癌基因的表达水平在肺癌组织、转移性肺癌组织以及A549和NCI-H358肺癌细胞系中显著增加，但在正常肺组织中很低或未检测到。图10(a)中，泳道“正常”表示正常肺组织，泳道“癌”表示肺癌组织，泳道“转移”表示转移性肺癌组织，以及泳道“A549”和“NCI-H358”每一种均表示肺癌细胞系。图10(b)示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。

图24(a)示出了RNA印迹结果，以确定MIG3原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达，例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图24(b)示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图24(a)中所示，MIG3mRNA转录物(大约4.0kb)在正常组织中微弱表达。

图38(a)示出了RNA印迹结果，以确定MIG3原癌基因是否在人类癌细胞系中表达，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图38(b)示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如38(a)中所示，表明MIG3原癌基因在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。

图13(a)示出了RNA印迹结果，以确定MIG10原癌基因是否在正常肺组织、肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中表达。如图13(a)中所示，表明MIG10原癌基因的表达水平在肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中显著增加，但在正常肺组织中很低或未检测到。图13(a)中，泳道“正常”表示正常肺组织，泳道“癌”表示肺癌组织，泳道“转移”表示转移性肺癌组织，以及泳道“A549”和“NCI-H358”每一种均表示肺癌细胞系。图13(b)示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。

图27(a)示出了RNA印迹结果，以确定MIG10原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达，例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图27(b)示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图27(a)中所示，MIG10mRNA转录物(大约2.0kb)在正常组织中极微弱表达。

图41(a)示出了RNA印迹结果，以确定MIG10原癌基因是否在人类癌细胞系中表达，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图41(b)示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如41(a)中所示，表明MIG10原癌基因在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。还可以观察到除了2.0kb的mRNA转录物以外，还表达约2.4kb的mRNA转录物。

图14(a)示出了RNA印迹结果，以确定MIG13原癌基因是否在正常肺组织、肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中表达。如图14(a)中所示，表明MIG13原癌基因的表达水平在肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中显著增加，但在正常肺组织中很低或未检测到。图14(a)中，泳道“正常”表示正常肺组织，泳道“癌”表示肺癌组织，泳道“转移”表示转移性肺癌组织，以及泳道“A549”和“NCI-H358”每一种均表示肺癌细胞系。图14(b)示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。

图28(a)示出了RNA印迹结果，以确定MIG13原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达，例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图28(b)示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图28(a)中所示，MIG13mRNA转录物(大约1.7kb的优势转录物以及1.4kb的转录物)在正常组织中表达极微弱或未检测到。

图42(a)示出了RNA印迹结果，以确定MIG13原癌基因是否在人类癌细胞系中表达，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图42(b)示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图42(a)中所示，表明MIG13mRNA转录物(大约1.7kb的优势转录物以及1.4kb的转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。

图15(a)示出了RNA印迹结果，以确定MIG14原癌基因是否在正常肺组织、肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中表达。如图15(a)所示，表明MIG14原癌基因的表达水平在肺癌组织、转移性肺癌组织以及肺癌细胞系(A549和NCI-H358)中显著增加，但在正常肺组织中很低或未检测到。图15中，泳道“正常”表示正常肺组织，泳道“癌”表示肺癌组织，泳道“转移”表示转移性肺癌组织，以及泳道“A549”和“NCI-H358”每一种均表示肺癌细胞系。图15(b)示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。

图29(a)示出了RNA印迹结果，以确定MIG14原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达，例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图29(b)示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图29(a)所示，MIG14mRNA转录物(大约1.3kb的优势转录物以及2kb的转录物)在正常组织中表达极微弱或未检测到。

图43(a)示出了RNA印迹结果，以确定MIG14原癌基因是否在人类癌细胞系中表达，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图43(b)示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如43(a)所示，表明MIG14mRNA转录物(大约1.3kb的优势转录物以及2kb的转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。

7-2：MIG8，MIG18，MIG19，MIG5以及MIG7

以与实施例1中相同的方式从正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系CaSki(ATCC CRL 1550)和CUMC-6中提取总RNA样品。

为了确定MIG8、MIG18、MIG19、MIG5和MIG7基因中每一种的表达水平，将从所述组织和细胞系每一种提取的变性总RNA样品每种各20μg在1％甲醛琼脂糖凝胶中电泳，然后将得到的琼脂糖凝胶转移至尼龙膜(Boehringer-Mannheim，Germany)上。将印迹与³²P标记的并随机预处理的(primed)全长MIG cDNA探针杂交，其中探针是利用Rediprime II随机prime标记系统(Amersham，United Kingdom)所制备。该RNA印迹分析重复两次，因此用密度计对得到的印迹加以定量并用β-肌动蛋白进行标准化。

图11示出了RNA印迹结果，以确定MIG8原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaSki和CUMC-6)中表达。如图11所示，表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG8原癌基因的表达水平增加，即过表达约4.0kb的优势MIG8mRNA转录物和约1.3kb的MIG8mRNA转录物，而且特别在转移性宫颈淋巴结组织中MIG8原癌基因表达最高，但在正常组织中表达极低。图11中，泳道“正常”表示正常外子宫颈组织，泳道“癌”表示宫颈癌组织，泳道“转移”表示转移性宫颈淋巴结组织，以及泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图12示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。

图25示出了RNA印迹结果，以确定MIG8原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达，例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图26示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图25所示，MIG8mRNA转录物(约4.0kb的优势MIG8mRNA转录物和约1.3kb的MIG8mRNA转录物)在正常组织例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞中微弱表达。

图39示出了RNA印迹结果，以确定MIG8原癌基因是否在人类癌细胞系中表达，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图40示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图39所示，表明MIG8mRNA转录物(大约4.0kb的优势MIG8mRNA转录物以及约1.3kb的MIG8mRNA转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中表达极高。但在皮肤癌细胞系G361中不表达约1.3kb的MIG8mRNA转录物。

图16示出了RNA印迹结果，以确定MIG18原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaSki和CUMC-6)中表达。如图16所示，表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG18原癌基因的表达水平增加，而且特别在转移性宫颈淋巴结组织中MIG18原癌基因表达最高，但在正常组织中表达极低。图16和17中，泳道“正常”表示正常外子宫颈组织，泳道“癌”表示宫颈癌组织，泳道“转移”表示转移性宫颈淋巴结组织，以及泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图17示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。

图30示出了RNA印迹结果，以确定MIG18原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达，例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图31示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图30所示，MIG18mRNA转录物(大约4.0kb)在正常组织例如心脏、肌肉和肝脏中微弱表达。

图44示出了RNA印迹结果，以确定MIG18原癌基因是否在人类癌细胞系中表达，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图45示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图44所示，表明MIG18mRNA转录物在HeLa子宫癌细胞系和慢性髓细胞源性白血病细胞系K-562中表达极高，以及在前髓细胞白血病细胞系HL-60、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中以增高的水平表达。

图18示出了RNA印迹结果，以确定MIG19原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaS ki和CUMC-6)中表达。如图18所示，表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG19原癌基因的表达水平增加，即过表达约4.7kb的优势MIG19mRNA转录物，而且特别在转移性宫颈淋巴结组织中MIG19原癌基因表达最高，但在正常组织中表达极低。图18和19中，泳道“正常”表示正常外子宫颈组织，泳道“癌”表示宫颈癌组织，泳道“转移”表示转移性宫颈淋巴结组织，泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图19示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。

图32示出了RNA印迹结果，以确定MIG19原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达，例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图33示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图32所示，MIG19mRNA转录物(大约4.7kb的优势mRNA转录物)在正常组织例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞中表达微弱或未检测到。

图46示出了RNA印迹结果，以确定MIG19原癌基因是否在人类癌细胞系中表达，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图47示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图46所示，表明MIG19mRNA转录物(大约4.7kb的优势MIG19mRNA转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中以极度增高的水平表达。但在皮肤癌细胞系G361中不表达约1.3kb的MIG8mRNA转录物。

图20示出了RNA印迹结果，以确定MIG5原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaSki和CUMC-6)中表达。

如图20所示，表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG5原癌基因的表达水平增加，即过表达约5.5kb的优势MIG5mRNA转录物，而且特别在转移性宫颈淋巴结组织中MIG5原癌基因表达最高，但在正常组织中不表达。图20和21中，泳道“正常”表示正常外子宫颈组织，泳道“癌”表示宫颈癌组织，泳道“转移”表示转移性宫颈淋巴结组织，以及泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图21示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。

图34示出了RNA印迹结果，以确定MIG5原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达，例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图35示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图34所示，MIG5mRNA转录物(大约5.5kb的优势mRNA转录物)在正常组织例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞中不表达。

图48示出了RNA印迹结果，以确定MIG5原癌基因是否在人类癌细胞系中表达，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图49示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图48所示，表明MIG5mRNA转录物(大约5.5kb的优势mRNA转录物)在前髓细胞白血病细胞系HL-60、HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480、肺癌细胞系A549以及皮肤癌细胞系G361中以极度增高的水平表达。但在皮肤癌细胞系G361中不表达约1.3kb的MIG8mRNA转录物。

图22示出了RNA印迹结果，以确定MIG19原癌基因是否在正常外子宫颈组织、宫颈癌组织、转移性宫颈淋巴结组织以及宫颈癌细胞系(CaSki和CUMC-6)中表达。如图22所示，表明在宫颈癌组织以及宫颈癌细胞系(CaSki和CUMC-6)中MIG7原癌基因的表达水平增加，即过表达约10kb的优势MIG7mRNA转录物，而且特别在转移性宫颈淋巴结组织中MIG7原癌基因表达最高，但在正常组织中表达极低。图22和23中，泳道“正常”表示正常外子宫颈组织，泳道“癌”表示宫颈癌组织，泳道“转移”表示转移性宫颈淋巴结组织，以及泳道“CaSki”和“CUMC-6”每一种均表示子宫癌细胞系。图23示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。

图36示出了RNA印迹结果，以确定MIGl9原癌基因是否在12个泳道的多种人类正常组织(Clontech)中表达，例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞组织。图37示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图36所示，MIG7mRNA转录物(大约10kb的优势mRNA转录物)在正常组织例如脑、心脏、横纹肌、大肠、胸腺、脾脏、肾脏、肝脏、小肠、胎盘、肺以及外周血白细胞中表达微弱或检测不到。

图50示出了RNA印迹结果，以确定MIG7原癌基因是否在人类癌细胞系中表达，例如HL-60、HeLa、K-562、MOLT-4、Raji、SW480、A549和G361(Clontech)。图51示出了RNA印迹结果，通过将相同样品与β-肌动蛋白探针杂交而表明存在mRNA转录物。如图50所示，表明MIG7mRNA转录物(大约10kb的优势mRNA转录物)在HeLa子宫癌细胞系、慢性髓细胞源性白血病细胞系K-562、成淋巴细胞白血病细胞系MOLT-4、伯基特淋巴瘤细胞系Raji、结肠癌细胞系SW480以及肺癌细胞系A549中以极度增高的水平表达。

实施例8：确定用原癌基因转化大肠杆菌后所表达蛋白的大小

将全长MIG原癌基因的每一种例如SEQ ID NO：1的MIG3、SEQ ID NO：5的MIG8、SEQ ID NO：9的MIG10、SEQ ID NO：13的MIG13、SEQ ID NO：17的MIG14、SEQ ID NO：21的MIG18、SEQ ID NO：25的MIG 19、SEQ ID NO：29的MIG 5、以及SEQ IDNO：33的MIG 7均插入pBAD/thio-Topo载体(Invitrogen，U.S.)的多克隆位点，然后用得到的每一种pBAD/thio-Topo/MIG载体转化大肠杆菌Top10(Invitrogen，U.S.)。将表达蛋白HT-硫氧还蛋白插入pBAD/thio-Topo载体多克隆位点的上游区域。将每一种转化的大肠杆菌株在LB液体培养基中振荡孵育，然后将每一种得到的培养物以1/100的比例稀释，孵育3小时，并加入0.5mM L-阿拉伯糖(Sigma)，以促进蛋白生成。

L-阿拉伯糖诱导(induction)前/后，对培养物中的大肠杆菌细胞进行超声处理，然后对超声处理的匀浆进行12％十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)。

图52示出了SDS-PAGE结果，以确定用pBAD/thio-Topo/MIG3载体转化的大肠杆菌Top10株的蛋白表达模式，其中在L-阿拉伯糖诱导后，可以清楚地观察到大约38kDa分子量的融合蛋白条带。该38kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约23kDa分子量的MIG3蛋白，每种蛋白均插入pBAD/thio-Topo/MIG3载体中。

图53示出了SDS-PAGE结果，以确定用pBAD/thio-Topo/MIG8载体转化的大肠杆菌Top10株的蛋白表达模式，其中在L-阿拉伯糖诱导后，可以清楚地观察到大约72kDa分子量的融合蛋白条带。该72kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约57kDa分子量的MIG8蛋白，每种蛋白均插入pBAD/thio-Topo/MIG8载体中。

图54示出了SDS-PAGE结果，以确定用pBAD/thio-Topo/MIG10载体转化的大肠杆菌Top10株的蛋白表达模式，其中在L-阿拉伯糖诱导后，可以清楚地观察到大约60kDa分子量的融合蛋白条带。该60kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约45kDa分子量的MIG10蛋白，每种蛋白均插入pBAD/thio-Topo/MIG10载体中。

图55示出了SDS-PAGE结果，以确定用pBAD/thio-Topo/MIG13载体转化的大肠杆菌Top10株的蛋白表达模式，其中在L-阿拉伯糖诱导后，可以清楚地观察到大约46kDa分子量的融合蛋白条带。该46kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约31kDa分子量的MIG13蛋白，每种蛋白均插入pBAD/thio-Topo/MIG13载体中。

图56示出了SDS-PAGE结果，以确定用pBAD/thio-Topo/MIG14载体转化的大肠杆菌Top10株的蛋白表达模式，其中在L-阿拉伯糖诱导后，可以清楚地观察到大约54kDa分子量的融合蛋白条带。该54kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约39kDa分子量的MIG14蛋白，每种蛋白均插入pBAD/thio-Topo/MIG14载体中。

图57示出了SDS-PAGE结果，以确定用pBAD/thio-Topo/MIG18载体转化的大肠杆菌Top10株的蛋白表达模式，其中在L-阿拉伯糖诱导后，可以清楚地观察到大约88kDa分子量的融合蛋白条带。该88kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约73kDa分子量的MIG18蛋白，每种蛋白均插入pBAD/thio-Topo/MIG18载体中。

图58示出了SDS-PAGE结果，以确定用pBAD/thio-Topo/MIG19载体转化的大肠杆菌Top10株的蛋白表达模式，其中在L-阿拉伯糖诱导后，可以清楚地观察到大约122kDa分子量的融合蛋白条带。该122kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约107kDa分子量的MIG19蛋白，每种蛋白均插入pBAD/thio-Topo/MIG19载体中。

图59示出了SDS-PAGE结果，以确定用pBAD/thio-Topo/MIG5载体转化的大肠杆菌Top10株的蛋白表达模式，其中在L-阿拉伯糖诱导后，可以清楚地观察到大约36kDa分子量的融合蛋白条带。该36kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约21kDa分子量的MIG5蛋白，每种蛋白均插入pBAD/thio-Topo/MIG5载体中。

图60示出了SDS-PAGE结果，以确定用pBAD/thio-Topo/MIG7载体转化的大肠杆菌Top10株的蛋白表达模式，其中在L-阿拉伯糖诱导后，可以清楚地观察到大约24kDa分子量的融合蛋白条带。该24kDa融合蛋白包括具有大约15kDa分子量的HT-硫氧还蛋白以及具有大约9kDa分子量的MIG7蛋白，每种蛋白均插入pBAD/thio-Topo/MIG7载体中。

工业应用

如上所述，本发明的原癌基因是参与人类致癌作用同时具有诱导癌症转移能力的新基因，可有效用于诊断癌症，包括肺癌、白血病、子宫癌、淋巴瘤、结肠癌、皮肤癌等，还用于产生转化的动物等。

序列表

<110>金弦起(KIM，HYUN KEE)

<120>人类原癌基因及其编码的蛋白(HUMAN PROTOONCOGENE AND PROTEIN ENCODEDTHEREIN)

<160>36

<170>KopatentIn 1.71

<210>1

<211>2295

<212>DNA

<213>Homo sapiens

<400>1

aaagtctgcc tctctagcta caacatttct tcaagaaaag aaagcagaag cccagaatca 60

taatcgtgtc cctgatgtaa aggcattaat ggagagtccc gagggacagt tatctctgga 120

gcccaaatct gatagtcact tccaagcatc acacactggg tgccagagcc ctttatgttc 180

agcccagcgt cacactcctc agagcccctt caccaatcat gctgcagctg ctggcaggaa 240

gactcttcgc agctgcatgg ggctggagtg gtttccagag ctctatcctg gttaccttgg 300

actaggggtg ttgccaggga agcctcagtg ttggaatgca atgacccaga agccacaact 360

tatcagtccc cagggggaaa gactctcgca agtttctttg ttggaacgaa gctcaactca 420

tataaggagt ttggaacccc ctaccggact tacaacctcc aacttctctc taatgaggct 480

cttgggagct gtacaaaaag gctggatcag gtgcaacacc accataagga agagtggatt 540

cggtggcatc acgatgctct tcacaggata cttcgtcctg tgttgtagct ggagtttcag 600

acgtctgaaa aaattgtgcc gacccctgcc ctggaagagc acagtacctc catgcattgg 660

tgtggcgaag acgactgggg attgccgctc taaaacatgt ttggattagg aagcacgttt 720

aagtaggaga agccttcgtg acttctctct agtgccttcg tgccctgtgt tgcccactga 780

attgccctgt aacacctaag tgtagtggta gcattaaggg atagcttttc agccctcaag 840

gttatcagga gcatttgtat cactgctata aataaagtag tatcacttgt cataatcagg 900

gtgctgaaac ataatgaaaa ggtttaactt agtcacagta aatattttat atccctgaaa 960

ataagttatt taatgagaat agaactattt aatgatccat gagtcctaaa aggatatctg 1020

ccttgtattg ccaagtttaa ggcaaaggtg agatcctgta ttaataagaa gacagctttt 1080

ttgtttgaca ttggtaagta ccaagaattc taactcacat atagtaggaa acaacaaaaa 1140

gtctccactg acttctttga attagatact gagaatccac aatacagtag tgtggataac 1200

tttcaagaag ccattggaaa catctccaca ttctgggatg acttgtaaat gtctacagag 1260

taatggaagg aaaggcttcc ttgtctgctc attgctgcca cctgggttgg gaaaataatt 1320

gaagatgttt tctcaagtcc ttcaagaatc tcttcttaat gttcagaata gtttaagagc 1380

gttgttgagg taaagtgata gctgattatt ttctgagatt tagatctaaa caaactcagc 1440

atgacgagga agcacacttc acagctccag ggtgcaatac tgatgtaaag ttgcctcgtg 1500

aggatacatt tttcgctcat gtatgcaaaa ttcctatcag ttcatttgca cagccagttc 1560

caatcatgta tgtgatcacc agattaaaag cttcatccag aaagacaaga ctcctcagaa 1620

cgaatagtag acaagtaaga ctgctaccca cagaagccag tacgcttcag gtgtgaggcg 1680

gggtaactac tcatctcttc acagagccaa ggaaagaaaa agaacgtctc taacatgatt 1740

taccatttta aacagcctta taagttttgt ctcttaaaat catgctgcag aaggaggggg 1800

taaaagtcgt gttctgccct gtctgtggca ttggagtgcc ccgctaggta agaagcaatg 1860

cttagatctt gcttccaggc agcagcttga attcccgaat cttcctgcaa ggtgcataca 1920

aatgcagcgt gagaatccat acacgtaatc catattcacc ttcccatcca tcccgcagaa 1980

gaggcatggt gacacccagg ctactgtcca tgcttgagag gacgtatttg aaggttctgt 2040

tactacaagt tgggaatatt cacggacatg cctgaatacc ccggctgtaa ctcacacgtg 2100

gtctgtgtaa gtggattaac ctcggggcgg ccttgtttaa tcctgaataa tatctgaaag 2160

actgagttta cttgggaatg tgtagttttt ctaatgcaca ttaaaattta ttttagctgt 2220

taaaaataaa atcattttat tatcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2280

aaaaaaaaaa aaaaa 2295

<210>2

<211>206

<212>PRT

<213>Homo sapiens

<400>2

Met Glu Ser Pro Glu Gly Gln Leu Ser Leu Glu Pro Lys Ser Asp Ser

1 5 10 15

His Phe Gln Ala Ser His Thr Gly Cys Gln Ser Pro Leu Cys Ser Ala

20 25 30

Gln Arg His Thr Pro Gln Ser Pro Phe Thr Asn His Ala Ala Ala Ala

35 40 45

Gly Arg Lys Thr Leu Arg Ser Cys Met Gly Leu Glu Trp Phe Pro Glu

50 55 60

Leu Tyr Pro Gly Tyr Leu Gly Leu Gly Val Leu Pro Gly Lys Pro Gln

65 70 75 80

Cys Trp Asn Ala Met Thr Gln Lys Pro Gln Leu Ile Ser Pro Gln Gly

85 90 95

Glu Arg Leu Ser Gln Val Ser Leu Leu Glu Arg Ser Ser Thr His Ile

100 105 110

Arg Ser Leu Glu Pro Pro Thr Gly Leu Thr Thr Ser Asn Phe Ser Leu

115 120 125

Met Arg Leu Leu Gly Ala Val Gln Lys Gly Trp Ile Arg Cys Asn Thr

130 135 140

Thr Ile Arg Lys Ser Gly Phe Gly Gly Ile Thr Met Leu Phe Thr Gly

145 150 155 160

Tyr Phe Val Leu Cys Cys Ser Trp Ser Phe Arg Arg Leu Lys Lys Leu

165 170 175

Cys Arg Pro Leu Pro Trp Lys Ser Thr Val Pro Pro Cys Ile Gly Mal

180 185 190

Ala Lys Thr Thr Gly Asp Cys Arg Ser Lys Thr Cys Leu Asp

195 200 205

<210>3

<211>16

<212>DNA

<213>Artificial Sequence

<220>

<223>H-T11A Primer

<400>3

aagctttttt tttttc 16

<210>4

<211>13

<212>DNA

<213>Artificial Sequence

<220>

<223>H-AP22 primer

<400>4

aagcttttga tcc 13

<210>5

<211>3737

<212>DNA

<213>Homo sapiens

<400>5

cggcagctgg aggtgtaata gtgcgggtag tgggtttgga gaagttccga ggcggcggtg 60

gcgccggtca ggacaaggat agcggaaccg ggccctgggc ttgtcgctca ccatgccgac 120

agtagaggag ctttaccgca attatggcat cctggccgat gccacggagc aagtgggcca 180

gcataaagat gcctatcaag tgatattgga tggtgtgaaa ggtggtacta aggaaaagcg 240

attagcagct caatttattc cgaaattctt taagcatttt ccagaattgg ctgattctgc 300

tatcaatgca cagttagacc tctgtgagga tgaagatgta tctattcgac gtcaagcaat 360

taaagaactg cctcaatttg ccactggaga aaatcttcct cgagtggcag atatactaac 420

gcaacttttg cagacagatg actctgcaga atttaaccta gtgaacaatg ccctattaag 480

tatatttaaa atggatgcaa aagggacttt aggtgggttg ttcagccaaa tacttcaagg 540

agaggacatt gttagagaac gagcaattaa attcctttct acaaaactta agactttacc 600

agatgaagtc ttaacaaagg aagtggaaga gcttatacta actgaatcca aaaaggtcct 660

agaagatgtg actggtgaag aatttgttct atttatgaag atactgtctg ggttaaaaag 720

cttacagaca gtgagtggaa gacagcaact tgtagagttg gtggctgaac aggccgacct 780

agaacagacc ttcaatccct cggatcctga ctgtgtggac aggctcttac agtgcactcg 840

gcaggcagta cccctcttct ctaaaaatgt ccattccaca aggtttgtga catatttctg 900

tgagcaggtt ctccctaacc tcggtacctt gactacccca gtggaaggtc ttgatataca 960

gttggaggta ttgaaattgt tggcggagat gagttcattt tgtggtgaca tggaaaaact 1020

agaaacaaat ttaaggaaac tatttgataa gttattggaa tacatgcccc tccctccaga 1080

agaggcagaa aatggagaga atgctggtaa tgaagaaccc aagctacagt tcagttatgt 1140

ggaatgtttg ttgtacagtt ttcaccagtt gggccgaaaa cttccagatt tcttaacagc 1200

caaactgaat gcagaaaagc tcaaagattt caaaatcagg ctgcagtact ttgcacgggg 1260

cctgcaagtt tatatcagac aacttcgctt agctctccag ggtaaaacgg gtgaggcctt 1320

aaaaacagaa gagaacaaga ttaaagtcgt tgcattgaaa ataacaaaca atatcaatgt 1380

tttaatcaag gatctcttcc acattcctcc ttcttataag agcacagtaa cactatcctg 1440

gaaacctgta caaaaggttg agattgggca aaagagagcc agtgaagata caacttcagg 1500

ttcaccaccc aagaaatctt cagcaggacc aaaaagagat gccaggcaga tttataaccc 1560

tcccagtggg aaatatagca gcaatttggg caactttaat tatgagagga gccttcaggg 1620

gaagtagagg tggccgaggt tggggcacac gaggaaatcg tagtcgggga agactctact 1680

gaataagaca tcagcattct tcagcattgt catgagctta atatacttaa attctactac 1740

tcattggatt gccggggatg tccctttaaa cagactgctg ccttcagcta aaaacttaat 1800

gttctttata cctttgtatg tatgacctac ttttgtaaca gaccatggtt gtgtccaagg 1860

taaaaccaca gtgatatttt tggatgcttt gtctgcaatc ttgacttgtt tttgcagtat 1920

cattattcag acttcaaatt gtgaatcttt taaacatctt gataatttgt tgttgagagc 1980

tgttcattct aaaatgtaat gaaattcagt ctagttctgc tgataaagat catcagtttt 2040

gaaaggttac tgattttcct cttccctctt agttttttac ccaatatatg gagaagagta 2100

atggtcaatc ttaacatttt gttttaattg tttaataaag ctgctgggca gtggtgcagc 2160

attcctacct agtgtcataa aagcaaaata cttacatagc tttcttaaaa tataggaatg 2220

acattacatt tttaggagaa agtaagttgc tttgcaccgc ctacttaatt cttttccata 2280

tattgtgata caaacttttg aatatggaat cttactattt gaatagaaat gtgtatgtat 2340

aatatacata catacataag catatatgtg tgtgtgtgtg tgtatatata tatatatgca 2400

tgctgtgaaa cttgactaca caacataaat cactttttaa attccaggaa cgggtagtct 2460

gacacggtga ttatcctttt gaggctgaat ccgttattaa cttgttattt aggtttttac 2520

tcccagtagc aagggattct aagttagttg cacttacatg attattgtta tttaaaacta 2580

agaataaagg ctgcattttc aaagataaat tggaattgct gttggtgaaa taacaaccaa 2640

aatactgaat ctgatgtaca tacaggtttc tacaggaaga gatggtataa tttacaattt 2700

ggagatttaa taaccagggc tacccagaaa aagtgacttg ataacatggt accaataagt 2760

aagggatgct ctctcggttt gcttttgcca ctttcaagat tttaacttct caggttatta 2820

atcaaaatta ttgtataagt tagccaatag aatttttagg ttaaaacaac agatgggggg 2880

tttgtggagt gtttaatgtc atgggcattt ttagtagcat agaccctttg ttctgcattt 2940

gaatgtttcg tatatttttg tttcacagtt aatcttccct ccccaagttt gctattcaaa 3000

tcaactgcct gaatgacatt tctagtagtc tgatgtattt ttctgaggaa tagtttgtga 3060

ttccaatgca ggtgtcttca ttaccattac ctctacactg cagaagaagc aaaactcctt 3120

tattagaatt actgcacatg tgtatgggga aaatagttct gaaaggctag aatgatacaa 3180

gtgagcaaaa gttggtcagc ttggctatgg agtggtggca ataatctcta aacattccaa 3240

aagaccatga gctgaaccta aactcccttg gaatctgaac aaaggaatat aaaattgcca 3300

tttgaaaact gaccagctaa tctggacctc agagatagat cagccagtgg cccaaagcca 3360

tttcaagtac agaaattata gagactacag ctaaataaat ttgaacatta aatataattt 3420

taccactttt tgtctttata agcatatttg taaactcaga actgagcaga agtgacttta 3480

ctttctcaag tttgatactg agttgactgt tcccttatcc ctcacccttc cccttccctt 3540

tcctaaggca atagtgcaca acttaggtta tttttgcttc cgaatttgaa tgaaaaactt 3600

aatgccatgg atttttttct tttgcaagac acctgtttat catcttgttt aaatgtaaat 3660

gtccccttat gcttttgaaa taaatttcct tttgtaattt taaaaaaaaa aaaaaaaaaa 3720

aaaaaaaaaa aaaaaaa 3737

<210>6

<211>504

<212>PRT

<213>Homo sapiens

<400>6

Met Pro Thr Val Glu Glu Leu Tyr Arg Asn Tyr Gly Ile Leu Ala Asp

1 5 10 15

Ala Thr Glu Gln Val Gly Gln His Lys Asp Ala Tyr Gln Val Ile Leu

20 25 30

Asp Gly Val Lys Gly Gly Thr Lys Glu Lys Arg Leu Ala Ala Gln Phe

35 40 45

Ile Pro Lys Phe Phe Lys His Phe Pro Glu Leu Ala Asp Ser Ala Ile

50 55 60

Asn Ala Gln Leu Asp Leu Cys Glu Asp Glu Asp Val Ser Ile Arg Arg

65 70 75 80

Gln Ala Ile Lys Glu Leu Pro Gln Phe Ala Thr Gly Glu Asn Leu Pro

85 90 95

Arg Val Ala Asp Ile Leu Thr Gln Leu Leu Gln Thr Asp Asp Ser Ala

100 105 110

Glu Phe Asn Leu Val Asn Asn Ala Leu Leu Ser Ile Phe Lys Met Asp

115 120 125

Ala Lys Gly Thr Leu Gly Gly Leu Phe Ser Gln Ile Leu Gln Gly Glu

130 135 140

Asp Ile Val Arg Glu Arg Ala Ile Lys Phe Leu Ser Thr Lys Leu Lys

145 150 155 160

Thr Leu Pro Asp Glu Val Leu Thr Lys Glu Val Glu Glu Leu Ile Leu

165 170 175

Thr Glu Ser Lys Lys Val Leu Glu Asp Val Thr Gly Glu Glu Phe Val

180 185 190

Leu Phe Met Lys Ile Leu Ser Gly Leu Lys Ser Leu Gln Thr Val Ser

195 200 205

Gly Arg Gln Gln Leu Val Glu Leu Val Ala Glu Gln Ala Asp Leu Glu

210 215 220

Gln Thr Phe Asn Pro Ser Asp Pro Asp Cys Val Asp Arg Leu Leu Gln

225 230 235 240

Cys Thr Arg Gln Ala Val Pro Leu Phe Ser Lys Asn Val His Ser Thr

245 250 255

Arg Phe Val Thr Tyr Phe Cys Glu Gln Val Leu Pro Asn Leu Gly Thr

260 265 270

Leu Thr Thr Pro Val Glu Gly Leu Asp Ile Gln Leu Glu Val Leu Lys

275 280 285

Leu Leu Ala Glu Met Ser Ser Phe Cys Gly Asp Met Glu Lys Leu Glu

290 295 300

Thr Asn Leu Arg Lys Leu Phe Asp Lys Leu Leu Glu Tyr Met Pro Leu

305 310 315 320

Pro Pro Glu Glu Ala Glu Asn Gly Glu Asn Ala Gly Asn Glu Glu Pro

325 330 335

Lys Leu Gln Phe Ser Tyr Val Glu Cys Leu Leu Tyr Ser Phe His Gln

340 345 350

Leu Gly Arg Lys Leu Pro Asp Phe Leu Thr Ala Lys Leu Asn Ala Glu

355 360 365

Lys Leu Lys Asp Phe Lys Ile Arg Leu Gln Tyr Phe Ala Arg Gly Leu

370 375 380

Gln Val Tyr Ile Arg Gln Leu Arg Leu Ala Leu Gln Gly Lys Thr Gly

385 390 395 400

Glu Ala Leu Lys Thr Glu Glu Asn Lys Ile Lys Val Val Ala Leu Lys

405 410 415

Ile Thr Asn Asn Ile Asn Val Leu Ile Lys Asp Leu Phe His Ile Pro

420 425 430

Pro Ser Tyr Lys Ser Thr Val Thr Leu Ser Trp Lys Pro Val Gln Lys

435 440 445

Val Glu Ile Gly Gln Lys Arg Ala Ser Glu Asp Thr Thr Ser Gly Ser

450 455 460

Pro Pro Lys Lys Ser Ser Ala Gly Pro Lys Arg Asp Ala Arg Gln Ile

465 470 475 480

Tyr Asn Pro Pro Ser Gly Lys Tyr Ser Ser Asn Leu Gly Asn Phe Asn

485 490 495

Tyr Glu Arg Ser Leu Gln Gly Lys

500

<210>7

<211>16

<212>DNA

<213>Artificia1 Sequence

<220>

<223>H-T11C primer

<400>7

aagctttttt tttttc 16

<210>8

<211>13

<212>DNA

<213>Artificial Sequence

<220>

<223>H-AP23 primer

<400>8

aagcttggct atg 13

<210>9

<211>1321

<212>DNA

<213>Homo sapiens

<400>9

tctccccagc tgtatttcca aaatgtcgct ttctaacaag ctgacgctgg acaagctgga 60

cgttaaaggg aagcgggtcg ttatgagagt cgacttcaat gttcctatga agaacaacca 120

gataacaaac aaccagagga ttaaggctgc tgtcccaagc atcaaattct gcttggacaa 180

tggagccaag tcggtagtcc ttatgagcca cctaggccgg cctgatggtg tgcccatgcc 240

tgacaagtac tccttagagc cagttgctgt agaactcaaa tctctgctgg gcaaggatgt 300

tctgttcttg aaggactgtg taggcccaga agtggagaaa gcctgtgcca acccagctgc 360

tgggtctgtc atcctgctgg agaacctccg ctttcatgtg gaggaagaag ggaagggaaa 420

agatgcttct gggaacaagg ttaaagccga gccagccaaa atagaagctt tccgagcttc 480

actttccaag ctaggggatg tctatgtcaa tgatgctttt ggcactgctc acagagccca 540

cagctccatg gtaggagtca atctgccaca gaaggctggt gggtttttga tgaagaagga 600

gctgaactac tttgcaaagg ccttggagag cccagagcga cccttcctgg ccatcctggg 660

cggagctaaa gttgcagaca agatccagct catcaataat atgctggaca aagtcaatga 720

gatgattatt ggtggtggaa tggcttttac cttccttaag gtgctcaaca acatggagat 780

tggcacttct ctgtttgatg aagagggagc caagattgtc aaagacctaa tgtccaaagc 840

tgagaagaat ggtgtgaaga ttaccttgcc tgttgacttt gtcactgctg acaagtttga 900

tgagaatgcc aagactggcc aagccactgt ggcttctggc atacctgctg gctggatggg 960

cttggactgt ggtcctgaaa gcagcaagaa gtatgctgag gctgtcactc gggctaagca 1020

gattgtgtgg aatggtcctg tgggggtatt tgaatgggaa gcttttgccc ggggaaccaa 1080

agctctcatg gatgaggtgg tgaaagccac ttctaggggc tgcatcacca tcataggtgg 1140

tggagacact gccacttgct gtgccaaatg gaacacggag gataaagtca gccatgtgag 1200

cactgggggt ggtgccagtt tggagctcct ggaaggtaaa gtccttcctg gggtggatgc 1260

tctcagcaat atttagtact ttcctgcctt ttagttcctg tgcacagccc ctaagtcaac 1320

t 1321

<210>10

<211>417

<212>PRT

<213>Homo sapiens

<400>10

Met Ser Leu Ser Asn Lys Leu Thr Leu Asp Lys Leu Asp Val Lys Gly

1 5 10 15

Lys Arg Val Val Met Arg Val Asp Phe Asn Val Pro Met Lys Asn Asn

20 25 30

Gln Ile Thr Asn Asn Gln Arg Ile Lys Ala Ala Val Pro Ser Ile Lys

35 40 45

Phe Cys Leu Asp Asn Gly Ala Lys Ser Val Val Leu Met Ser His Leu

50 55 60

Gly Arg Pro Asp Gly Val Pro Met Pro Asp Lys Tyr Ser Leu Glu Pro

65 70 75 80

Val Ala Val Glu Leu Lys Ser Leu Leu Gly Lys Asp Val Leu Phe Leu

85 90 95

Lys Asp Cys Val Gly Pro Glu Val Glu Lys Ala Cys Ala Asn Pro Ala

100 105 110

Ala Gly Ser Val Ile Leu Leu Glu Asn Leu Arg Phe His Val Glu Glu

115 120 125

Glu Gly Lys Gly Lys Asp Ala Ser Gly Asn Lys Val Lys Ala Glu Pro

130 135 140

Ala Lys Ile Glu Ala Phe Arg Ala Ser Leu Ser Lys Leu Gly Asp Val

145 150 155 160

Tyr Val Asn Asp Ala Phe Gly Thr Ala His Arg Ala His Ser Ser Met

165 170 175

Val Gly Val Asn Leu Pro Gln Lys Ala Gly Gly Phe Leu Met Lys Lys

180 185 190

Glu Leu Asn Tyr Phe Ala Lys Ala Leu Glu Ser Pro Glu Arg Pro Phe

195 200 205

Leu Ala Ile Leu Gly Gly Ala Lys Val Ala Asp Lys Ile Gln Leu Ile

210 215 220

Asn Asn Met Leu Asp Lys Val Asn Glu Met Ile Ile Gly Gly Gly Met

225 230 235 240

Ala Phe Thr Phe Leu Lys Val Leu Asn Asn Met Glu Ile Gly Thr Ser

245 250 255

Leu Phe Asp Glu Glu Gly Ala Lys Ile Val Lys Asp Leu Met Ser Lys

260 265 270

Ala Glu Lys Asn Gly Val Lys Ile Thr Leu Pro Val Asp Phe Val Thr

275 280 285

Ala Asp Lys Phe Asp Glu Asn Ala Lys Thr Gly Gln Ala Thr Val Ala

290 295 300

Ser Gly Ile Pro Ala Gly Trp Met Gly Leu Asp Cys Gly Pro Glu Ser

305 310 315 320

Ser Lys Lys Tyr Ala Glu Ala Val Thr Arg Ala Lys Gln Ile Val Trp

325 330 335

Asn Gly Pro Val Gly Val Phe Glu Trp Glu Ala Phe Ala Arg Gly Thr

340 345 350

Lys Ala Leu Met Asp Glu Val Val Lys Ala Thr Ser Arg Gly Cys Ile

355 360 365

Thr Ile Ile Gly Gly Gly Asp Thr Ala Thr Cys Cys Ala Lys Trp Asn

370 375 380

Thr Glu Asp Lys Va1 Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu

385 390 395 400

Glu Leu Leu Glu Gly Lys Val Leu Pro Gly Val Asp Ala Leu Ser Asn

405 410 415

Ile

<210>11

<211>16

<212>DNA

<213>Artificial Sequence

<220>

<223>H-T11C primer

<400>11

aagctttttt tttttc 16

<210>12

<211>13

<212>DNA

<213>Artificial Sequence

<220>

<223>H-AP23 primer

<400>12

aagcttggct atg 13

<210>13

<211>1019

<212>DNA

<213>Homo sapiens

<400>13

ctataggcgc atggaaggtt ccctggaacg ggaggcgcca gcgggggcgc tggccgccgt 60

gctaaagcac agctcgacgt tgccgcccga aagcacccag gtccggggct acgacttcaa 120

ccgcggtgtg aattaccgcg cactgctgga ggccttcggc accaccggct tccaagcaac 180

caacttcggg cgcgctgtac agcaagtcaa tgccatgatc gagaagaagc tggaaccact 240

gtcacaggat gaagaccagc acgcggacct gacccagagc cgccgcccac ttaccagctg 300

caccattttc ctgggatata catccaacct catcagttca ggcatccgtg agaccattcg 360

ctaccttgtg cagcacaaca tggtggacgt attggtgacc acagctggcg gcgtggagga 420

agacctcatc aagtgcctgg cgcccacata cttgggcgag tttagcctca gggggaagga 480

gctccgggag aacgggatca ataggatcgg aaacctgctg gtgcccaatg agaattactg 540

caagtttgag gactggctga tgcccattct ggaccagatg gtgatggagc agaacacaga 600

gggtgtaaag tggacgcctt ctaagatgat cgcccggctg ggcaaggaga tcaacaaccc 660

agagtccgtg tattactggg cccagaagaa ccacatccct gtgtttagtc ccgcacttac 720

agacggctcg ctgggcgaca tgatcttctt ccattcctac aagaacccgg gcctggtcct 780

ggacatcgtt gaggcggaac ggggccgact acgctgttta catcaacaca gcccaggagt 840

ttgatggctc tgactcaggt gcccgaccag acgaggctgt ctcctggggc aagatccggg 900

tggatgcaca gcccgtcaag gtctatgctg acgcctccct ggtcttcccc ctgcttgtgg 960

ctgaaacctt tgcccagaag atggatgcct tcatgcatga gaagaacgag gactgagcg 1019

<210>14

<211>277

<212>PRT

<213>Homo sapiens

<400>14

Met Glu Gly Ser Leu Glu Arg Glu Ala Pro Ala Gly Ala Leu Ala Ala

1 5 10 15

Val Leu Lys His Ser Ser Thr Leu Pro Pro Glu Ser Thr Gln Val Arg

20 25 30

Gly Tyr Asp Phe Asn Arg Gly Val Asn Tyr Arg Ala Leu Leu Glu Ala

35 40 45

Phe Gly Thr Thr Gly Phe Gln Ala Thr Asn Phe Gly Arg Ala Val Gln

50 55 60

Gln Val Asn Ala Met Ile Glu Lys Lys Leu Glu Pro Leu Ser Gln Asp

65 70 75 80

Glu Asp Gln His Ala Asp Leu Thr Gln Ser Arg Arg Pro Leu Thr Ser

85 90 95

Cys Thr Ile Phe Leu Gly Tyr Thr Ser Asn Leu Ile Ser Ser Gly Ile

100 105 110

Arg Glu Thr Ile Arg Tyr Leu Val Gln His Asn Met Val Asp Val Leu

115 120 125

Val Thr Thr Ala Gly Gly Val Glu Glu Asp Leu Ile Lys Cys Leu Ala

130 135 140

Pro Thr Tyr Leu Gly Glu Phe Ser Leu Arg Gly Lys Glu Leu Arg Glu

145 150 155 160

Asn Gly Ile Asn Arg Ile Gly Asn Leu Leu Val Pro Asn Glu Asn Tyr

165 170 175

Cys Lys Phe Glu Asp Trp Leu Met Pro Ile Leu Asp Gln Met Val Met

180 185 190

Glu Gln Asn Thr Glu Gly Val Lys Trp Thr Pro Ser Lys Met Ile Ala

195 200 205

Arg Leu Gly Lys Glu Ile Asn Asn Pro Glu Ser Val Tyr Tyr Trp Ala

210 215 220

Gln Lys Asn His Ile Pro Val Phe Ser Pro Ala Leu Thr Asp Gly Ser

225 230 235 240

Leu Gly Asp Met Ile Phe Phe His Ser Tyr Lys Asn Pro Gly Leu Val

245 250 255

Leu Asp Ile Val Glu Ala Glu Arg Gly Arg Leu Arg Cys Leu His Gln

260 265 270

His Ser Pro Gly Val

275

<210>15

<211>16

<212>DNA

<213>Artificial Sequence

<220>

<223>H-T11C primer

<400>15

aagctttttt tttttc 16

<210>16

<211>13

<212>DNA

<213>Artificial Sequence

<220>

<223>H-AP21 primer

<400>16

aagctttctc tgg 12

<210>17

<211>1142

<212>DNA

<213>Homo sapiens

<400>17

gagaccccca ggttcaaaat aagcctgttt ggaacaacct caggttttgg aaccagtggg 60

accagcatgt ttggcagtgc aactacagac aatcacaatc ccatgaagga tattgaagta 120

acatcatctc ctgatgatag cattggttgt ctgtctttta gcccaccaac cttgccgggg 180

aactttctta ttgcagggtc atgggctaat gatgttcgct gctgggaagt tcaagacagt 240

ggacagacca ttccaaaagc ccagcagatg cacactgggc ctgtgcttga tgtctgctgg 300

agtgacgatg ggagcaaagt gtttacggca tcgtgtgata aaactgccaa aatgtgggac 360

ctcagcagta accaaacgat acagatcgca cagcatgatg ctcctgttaa aaccatccat 420

tggatcaaag ctccaaacta cagctgtgtg atgactggga gctgggataa gactttaaag 480

ttttgggata ctcgatcgtc aaatcctatg atggttttgc aactccctga aaggtgttac 540

tgtgctgacg tgatataccc catggctgtg gtggcaactg cagagagggg cctgattgtc 600

tatcagctag agaatcaacc ttctgaattc aggaggatag aatctccact gaaacatcag 660

catcggtgtg tggctatttt taaagacaaa cagaacaagc ctactggttt tgccctggga 720

agtatcgagg ggagagttgc tattcactat atcaaccccc cgaaccccgc caaagataac 780

ttcaccttta aatgtcatcg atctaatgga accaacactt cagctcctca ggacatttat 840

gcggtaaatg gaatcgcgtt ccatcctgtt catggcaccc ttgcaactgt gggatctgat 900

ggtagattca gcttctggga caaagatgcc agaacaaaac taaaaacttc ggaacagtta 960

gatcagccca tctcagcttg ctgtttcaat cacaatggaa acatatttgc atacgcttcc 1020

agctacgact ggtcaaaggg acatgaattt tataatcccc agaaaaaaaa ttacattttc 1080

ctgcgtaatg cagccgaaga gctaaagccc aggaataaga agtagtggct ggagactctg 1140

gc 1142

<210>18

<211>352

<212>PRT

<213>Homo sapiens

<400>18

Met Phe Gly Ser Ala Thr Thr Asp Asn His Asn Pro Met Lys Asp Ile

1 5 10 15

Glu Val Thr Ser Ser Pro Asp Asp Ser Ile Gly Cys Leu Ser Phe Ser

20 25 30

Pro Pro Thr Leu Pro Gly Asn Phe Leu Ile Ala Gly Ser Trp Ala Asn

35 40 45

Asp Val Arg Cys Trp Glu Val Gln Asp Ser Gly Gln Thr Ile Pro Lys

50 55 60

Ala Gln Gln Met His Thr Gly Pro Val Leu Asp Val Cys Trp Ser Asp

65 70 75 80

Asp Gly Ser Lys Val Phe Thr Ala Ser Cys Asp Lys Thr Ala Lys Met

85 90 95

Trp Asp Leu Ser Ser Asn Gln Thr Ile Gln Ile Ala Gln His Asp Ala

100 105 110

Pro Val Lys Thr Ile His Trp Ile Lys Ala Pro Asn Tyr Ser Cys Val

115 120 125

Met Thr Gly Ser Trp Asp Lys Thr Leu Lys Phe Trp Asp Thr Arg Ser

130 135 140

Ser Asn Pro Met Met Val Leu Gln Leu Pro Glu Arg Cys Tyr Cys Ala

145 150 155 160

Asp Val Ile Tyr Pro Met Ala Val Val Ala Thr Ala Glu Arg Gly Leu

165 170 175

Ile Val Tyr Gln Leu Glu Asn Gln Pro Ser Glu Phe Arg Arg Ile Glu

180 185 190

Ser Pro Leu Lys His Gln His Arg Cys Val Ala Ile Phe Lys Asp Lys

195 200 205

Gln Asn Lys Pro Thr Gly Phe Ala Leu Gly Ser Ile Glu Gly Arg Val

210 215 220

Ala Ile His Tyr Ile Asn Pro Pro Asn Pro Ala Lys Asp Asn Phe Thr

225 230 235 240

Phe Lys Cys His Arg Ser Asn Gly Thr Asn Thr Ser Ala Pro Gln Asp

245 250 255

Ile Tyr Ala Val Asn Gly Ile Ala Phe His Pro Val His Gly Thr Leu

260 265 270

Ala Thr Val Gly Ser Asp Gly Arg Phe Ser Phe Trp Asp Lys Asp Ala

275 280 285

Arg Thr Lys Leu Lys Thr Ser Glu Gln Leu Asp Gln Pro Ile Ser Ala

290 295 300

Cys Cys Phe Asn His Asn Gly Asn Ile Phe Ala Tyr Ala Ser Ser Tyr

305 310 315 320

Asp Trp Ser Lys Gly His Glu Phe Tyr Asn Pro Gln Lys Lys Asn Tyr

325 330 335

Ile Phe Leu Arg Asn Ala Ala Glu Glu Leu Lys Pro Arg Asn Lys Lys

340 345 350

<210>19

<211>16

<212>DNA

<213>Artificial Sequence

<220>

<223>H-T11A primer

<400>19

aagctttttt ttttta 16

<210>20

<211>13

<212>DNA

<213>Artificial Sequcnce

<220>

<223>H-AP21 primer

<400>20

aagctttctc tgg 13

<210>21

<211>3633

<212>DNA

<213>Homo sapiens

<400>21

cgcaatttcc actcgcgggg agcagcagca gcagaggcag cagcgggcgg cgctgagccg 60

ccgccgccgc cactgaggaa gaagccggcc cagccgccgc cgcgtccgga ccctcgcgcc 120

tggatcccag cgccccgatc ccggcgcccc aacccccacg cccgcctccg ccaactttca 180

cgctgcctcg gcggcccggc ccggctcgac gccaatggtg gaggccatag tggagtttga 240

ctaccaggcc cagcacgatg atgagctgac gatcagcgtg ggtgaaatca tcaccaacat 300

caggaaggag gatggaggct ggtgggaggg acagatcaac ggcaggagag gtttgttccc 360

tgacaacttt gtaagagaaa taaagaaaga gatgaagaaa gaccctctca ccaacaaagc 420

tccagaaaag cccctgcacg aagtgcccag tggaaactct ttgctgtctt ctgaaacgat 480

tttaagaacc aataagagag gcgagcgacg gaggcgccgg tgccaggtgg cattcagcta 540

cctgccccag aatgacgatg aacttgagct gaaagttggc gacatcatag aggtggtagg 600

agaggtagag gaaggatggt gggaaggtgt tctcaacggg aagactggaa tgtttccttc 660

caacttcatc aaggagctgt caggggagtc ggatgagctt ggcatttccc aggatgagca 720

gctatccaag tcaagtttaa gggaaaccac aggctccgag agtgatgggg gtgactcaag 780

cagcaccaag tctgaaggtg ccaacgggac agtggcaact gcagcaatcc agcccaagaa 840

agttaaggga gtgggctttg gagacatttt caaagacaag ccaatcaaac taagaccaag 900

gtcaattgaa gtagaaaatg actttctgcc ggtagaaaag actattggga agaagttacc 960

tgcaactaca gcaactccag actcatcaaa aacagaaatg gacagcagga caaagagcaa 1020

ggattactgc aaagtaatat ttccatatga ggcacagaat gatgatgaat tgacaatcaa 1080

agaaggagat atagtcactc tcatcaataa ggactgcatc gacgtaggct ggtgggaagg 1140

agagctgaac ggcagacgag gcgtgttccc cgataacttc gtgaagttac ttccaccgga 1200

ctttgaaaag gaagggaata gacccaagaa gccaccgcct ccatccgctc ctgtcatcaa 1260

acaaggggca ggcaccactg agagaaaaca tgaaattaaa aagatacctc ctgaaagacc 1320

agaaatgctt ccaaacagaa cagaagaaaa agaaagacca gagagagagc caaaactgga 1380

tttacagaag ccctccgttc ctgccatacc gccaaaaaag cctcggccac ctaagaccaa 1440

ttctctcagc agacctggcg cactgccccc gagaaggccg gagagaccgg tgggtccgct 1500

gacacacacc aggggtgaca gtccaaagat tgacttggcc ggcagttcgc tatctggcat 1560

cctggacaaa gatctctcgg accgcagcaa tgacattgac ttagaaggtt ttgactccgt 1620

ggtatcatct actgagaaac tcagtcatcc gaccacaagc agaccaaaag ctacagggag 1680

gcggcctccg tcccagtccc tcacatcttc atccctttca agccctgata tcttcgactc 1740

cccaagtccc gaagaggata aggaggaaca catttcactt gcgcacagag gagtggacgc 1800

gtcaaagaaa acttccaaga ctgttaccat atcccaagtg tctgacaaca aagcatccct 1860

gccgcccaag ccggggacca tggcagcagg tggcggtggg ccagcccctc tgtcctcagc 1920

ggcgccctcc cccctgtcat cctctttggg aacagctgga cacagagcca actccccgtc 1980

tctgttcggc acggaaggaa aaccaaagat ggagcctgcg gccagcagcc aggcggccgt 2040

ggaggagcta aggacacagg tccgcgagct gaggagcatc atcgagacca tgaaggacca 2100

gcagaaacga gagattaaac agttattgtc tgagttggat gaagagaaga aaatccggct 2160

tcggttgcag atggaagtga acgacataaa gaaagctcta caatcaaaat gaatacttga 2220

tcaatgaaat gtcacattat tcatcctgag tccgagactc aaattttctg ccccagccaa 2280

aataatcttg tgccaaaaga ttaaaggttt gcctcaaaat gtccctgttt gaaagattag 2340

cacaaaagtc ttgatagcac aacacaaatt ccatccaaga ggagaatctt ccccagggtt 2400

tagtcctggg gctggcactc gttgtgactt acacagagca aaattgtgct aaaggctttt 2460

ctactctgag atctcaatgc gaaatgaaaa ctcaggcagt ttagtccata gtggtactat 2520

tttgatgata ttttccatta ataaaatgta atttcagatt attcgtttac aagctttata 2580

attttatgat tttttaatcg tgttttgtca cagacttccc tagtgtttgt actacacgta 2640

gtcagaagcg agtgtccttt tcttttgctt caggctaaga gctgcctcgc tctttgtccc 2700

cccattagga ttctattaca tatgcaattg taggttcaac ctgtcccttt ccctgccagc 2760

aaaccccacc accctaagag aaattttagc ttatatatga cggtatattt acaaaaagag 2820

aaagagaaaa tctggtattt gcaatgatct gtgccttctt tttaccaccc tcttgattgg 2880

agcttttgtg atgcagctac catgattcaa aaaaattaaa aattaaaaaa aaaaaatctg 2940

ccacttatcc aagtccacta gaggccactg tcttcaaagc ttctctcacc ctagccaaag 3000

gtcctaagag gagacagctg tgaagttggg cgtgctctgt ggtaccagct gtgacttttc 3060

tatttctcct agttttaggt tgttcatgaa actagaaatg tcatcctgct tgatttttca 3120

tcagccaagt taaacccctg ctttctgtcc tttgcacctt ttgcgtgaac agaatatgca 3180

ttattaaagc aaaaataaat aaaagtaaaa tgcaaatgaa aaaaaaaaaa aaaaaaaaaa 3240

aaaaaaaaaa aaggccgccc ccaacaccct cctagcctta ctactaataa ttattacatt 3300

ttgactacca caactcaacg gctacataga aaaatccacc ccttacgagt gcggcttcga 3360

ccctatatcc cccgcccgcg tccctttctc cataaaattc ttcttagtag ctattacctt 3420

cttattattt gatctagaaa ttgccctcct tttaccccta ccatgagccc tacaaacaac 3480

taacctgcca ctaatagtta tgtcatccct cttattaatc atcatcctag ccctaagtct 3540

ggcctatgag tgactacaaa aaggattaga ctgaaccgaa taaaaaaaaa aaaaaaaaaa 3600

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 3633

<210>22

<211>665

<212>PRT

<213>Homo sapiens

<400>22

Met Val Glu Ala Ile Val Glu Phe Asp Tyr Gln Ala Gln His Asp Asp

1 5 10 15

Glu Leu Thr Ile Ser Val Gly Glu Ile Ile Thr Asn Ile Arg Lys Glu

20 25 30

Asp Gly Gly Trp Trp Glu Gly Gln Ile Asn Gly Arg Arg Gly Leu Phe

35 40 45

Pro Asp Asn Phe Val Arg Glu Ile Lys Lys Glu Met Lys Lys Asp Pro

50 55 60

Leu Thr Asn Lys Ala Pro Glu Lys Pro Leu His Glu Val Pro Ser Gly

65 70 75 80

Asn Ser Leu Leu Ser Ser Glu Thr Ile Leu Arg Thr Asn Lys Arg Gly

85 90 95

Glu Arg Arg Arg Arg Arg Cys Gln Val Ala Phe Ser Tyr Leu Pro Gln

100 105 110

Asn Asp Asp Glu Leu Glu Leu Lys Val Gly Asp Ile Ile Glu Val Val

115 120 125

Gly Glu Val Glu Glu Gly Trp Trp Glu Gly Val Leu Asn Gly Lys Thr

130 135 140

Gly Met Phe Pro Ser Asn Phe Ile Lys Glu Leu Ser Gly Glu Ser Asp

145 150 155 160

Glu Leu Gly Ile Ser Gln Asp Glu Gln Leu Ser Lys Ser Ser Leu Arg

165 170 175

Glu Thr Thr Gly Ser Gl u Ser Asp Gly Gly Asp Ser Ser Ser Thr Lys

180 185 190

Ser Glu Gly Ala Asn Gly Thr Val Ala Thr Ala Ala Ile Gln Pro Lys

195 200 205

Lys Val Lys Gly Val Gly Phe Gly Asp Ile Phe Lys Asp Lys Pro Ile

210 215 220

Lys Leu Arg Pro Arg Ser Ile Glu Val Glu Asn Asp Phe Leu Pro Val

225 230 235 240

Glu Lys Thr Ile Gly Lys Lys Leu Pro Ala Thr Thr Ala Thr Pro Asp

245 250 255

Ser Ser Lys Thr Glu Met Asp Ser Arg Thr Lys Ser Lys Asp Tyr Cys

260 265 270

Lys Val Ile Phe Pro Tyr Glu Ala Gln Asn Asp Asp Glu Leu Thr Ile

275 280 285

Lys Glu Gly Asp Ile Val Thr Leu Ile Asn Lys Asp Cys Ile Asp Val

290 295 300

Gly Trp Trp Glu Gly Glu Leu Asn Gly Arg Arg Gly Val Phe Pro Asp

305 310 315 320

Asn Phe Val Lys Leu Leu Pro Pro Asp Phe Glu Lys Glu Gly Asn Arg

325 330 335

Pro Lys Lys Pro Pro Pro Pro Ser Ala Pro Val Ile Lys Gln Gly Ala

340 345 350

Gly Thr Thr Glu Arg Lys His Glu Ile Lys Lys Ile Pro Pro Glu Arg

355 360 365

Pro Glu Met Leu Pro Asn Arg Thr Glu Glu Lys Glu Arg Pro Glu Arg

370 375 380

Glu Pro Lys Leu Asp Leu Gln Lys Pro Ser Val Pro Ala Ile Pro Pro

385 390 395 400

Lys Lys Pro Arg Pro Pro Lys Thr Asn Ser Leu Ser Arg Pro Gly Ala

405 410 415

Leu Pro Pro Arg Arg Pro Glu Arg Pro Val Gly Pro Leu Thr His Thr

420 425 430

Arg Gly Asp Ser Pro Lys Ile Asp Leu Ala Gly Ser Ser Leu Ser Gly

435 440 445

Ile Leu Asp Lys Asp Leu Ser Asp Arg Ser Asn Asp Ile Asp Leu Glu

450 455 460

Gly Phe Asp Ser Val Val Ser Ser Thr Glu Lys Leu Ser His Pro Thr

465 470 475 480

Thr Ser Arg Pro Lys Ala Thr Gly Arg Arg Pro Pro Ser Gln Ser Leu

485 490 495

Thr Ser Ser Ser Leu Ser Ser Pro Asp Ile Phe Asp Ser Pro Ser Pro

500 505 510

Glu Glu Asp Lys Glu Glu His Ile Ser Leu Ala His Arg Gly Val Asp

515 520 525

Ala Ser Lys Lys Thr Ser Lys Thr Val Thr Ile Ser Gln Val Ser Asp

530 535 540

Asn Lys Ala Ser Leu Pro Pro Lys Pro Gly Thr Met Ala Ala Gly Gly

545 550 555 560

Gly Gly Pro Ala Pro Leu Ser Ser Ala Ala Pro Ser Pro Leu Ser Ser

565 570 575

Ser Leu Gly Thr Ala Gly His Arg Ala Asn Ser Pro Ser Leu Phe Gly

580 585 590

Thr Glu Gly Lys Pro Lys Met Glu Pro Ala Ala Ser Ser Gln Ala Ala

595 600 605

Val Glu Glu Leu Arg Thr Gln Val Arg Glu Leu Arg Ser Ile Ile Glu

610 615 620

Thr Met Lys Asp Gln Gln Lys Arg Glu Ile Lys Gln Leu Leu Ser Glu

625 630 635 640

Leu Asp Glu Glu Lys Lys Ile Arg Leu Arg Leu Gln Met Glu Val Asn

645 650 655

Asp Ile Lys Lys Ala Leu Gln Ser Lys

660 665

<210>23

<211>16

<212>DNA

<213>Artificial Seauence

<220>

<223>H-T11A primer

<400>23

aagctttttt ttttta 16

<210>24

<211>13

<212>DNA

<213>Artificial Sequence

<220>

<223>H-AP36 primer

<400>24

aagcttcgac gct 13

<210>25

<211>4639

<212>DNA

<213>Homo sapiens

<400>25

agcggacggt ccttgcattg gcctccggca ggcgcccccc gggggcggga agctgcctca 60

cagcatggaa ccacaggtta ctctaaatgt gacttttaaa aatgaaattc aaagctttct 120

ggtttctgat ccagaaaata caacttgggc tgatatcgaa gctatggtaa aagtttcatt 180

tgatctgaat actattcaaa taaaatacct ggatgaggaa aatgaagagg tatccatcaa 240

cagtcaagga gaatatgaag aagcgcttaa gatggcagtt aaacagggaa accaactgca 300

gatgcaagtc cacgaagggc accatgtcgt tgatgaagcc ccacccccag ttgtaggagc 360

aaaacgacta gctgccaggg cagggaagaa gccacttgca cattactctt cactggtgag 420

agtcttggga tcagacatga agaccccaga ggatcctgca gtgcagtcgt ttccacttgt 480

tccatgtgac acagaccagc ctcaagacaa gcccccagac tggttcacaa gctacctgga 540

gacgttcaga gaacaagtgg ttaacgaaac ggttgagaag cttgaacaga aattacatga 600

aaagcttgtc ctccagaacc catccttggg ttcttgtccc tcagaagtct caatgcctac 660

ttcagaagaa acattgtttt tgccagaaaa ccagttcagc tggcatattg cttgcaacaa 720

ctgccaaaga aggattgttg gtgtccgcta ccagtgtagc ctatgcccat cctacaatat 780

ctgtgaagat tgtgaagcag ggccatatgg ccatgacact aaccacgtcc tgctgaagtt 840

gcggagacct gttgtgggct cctctgaacc gttctgtcac tcaaagtact ctactcctcg 900

tcttcctgct gctctggaac aagtcaggct ccagaaacag gttgataaga actttcttaa 960

agcagaaaag caaaggttgc gagctgagaa gaaacaacgt aaagcagagg tcaaggaact 1020

taaaaagcag cttaaactcc ataggaaaat tcacctgtgg aattcaatcc atggactcca 1080

gagccccaag tctcctttag gccgacctga gagcttgctc cagtctaata ccctgatgct 1140

ccctttgcag ccctgtacct ccgttatgcc aatgctcagt gcagcatttg tggatgagaa 1200

tttgcctgat gggactcacc ttcagccagg aaccaagttt atcaaacact ggaggatgaa 1260

aaatacagga aatgtaaagt ggagtgcaga cacaaagctc aagttcatgt ggggaaacct 1320

gactttggct tccacagaaa agaaggatgt tttggttccc tgcctcaagg ccggccatgt 1380

gggagttgta tctgtggagt tcattgcccc agccttggag ggaacgtata cttcccattg 1440

gcgtctttct cacaaaggcc agcaatttgg gcctcgggtc tggtgcagta tcatagtaga 1500

tcctttcccc tccgaagaga gccctgataa cattgaaaag ggcatgatca gctcaagcaa 1560

aactgatgat ctcacctgcc agcaagagga aacttttctt ctggctaaag aagaaagaca 1620

gcttggtgaa gtgactgagc agacagaagg gacagcagcc tgcatcccac agaaggcaaa 1680

aaatgttgcc agtgagaggg agctctacat cccatctgtg gatcttctga ctgcccagga 1740

cctgctgtcc tttgagctgt tggatataaa cattgttcaa gagttggaga gagtgcccca 1800

caacacccct gtggatgtga ctccctgcat gtctcctctg ccacatgaca gtcctttaat 1860

agagaagcca ggcttggggc agatagagga agagaatgaa ggggcaggat ttaaagcact 1920

tcctgattct atggtgtcag taaagaggaa ggctgagaac attgcttctg tggaggaagc 1980

agaagaagac ctgagtggga cccagtttgt gtgtgagaca gtaatccgat cccttacctt 2040

ggatgctgcc ccagaccaca accctccttg cagacagaag tccttgcaga tgacatttgc 2100

cttgcctgaa ggaccacttg gaaatgagaa ggaggagatt atccatatcg ctgaggaaga 2160

agctgtcatg gaggaggagg aggatgagga ggatgaggag gaggaggatg agctcaaaga 2220

tgaagttcaa agtcagtcct ctgcttcctc agaggattac atcatcatcc tgcctgagtg 2280

ctttgatacc agccgccccc tgggggattc tatgtacagc tctgcgctct cacagccagg 2340

cctggagcga ggtgctgaag gcaagcctgg ggttgaggct gggcaggaac cagctgaggc 2400

tggggaaaga ctccctggag gggagaacca gccacaggag cacagcataa gtgacatcct 2460

cacgacctca cagactctgg aaacagtgcc cctaatccca gaggtagtgg agcttccacc 2520

gtcactgccc aggagctctc cttgtgtaca tcatcatggt tccccaggag tggatttacc 2580

agttaccata ccagaagttt cttcagtccc tgatcagatc agaggagagc ccagaggctc 2640

atcaggactt gtaaacagca gacagaagag ctatgaccac tcaaggcacc atcatgggag 2700

cagcattgct ggaggactgg tgaagggggc tttgtctgtt gctgcctctg catacaaggc 2760

cctgtttgct gggccaccag tcactgcaca gccaataatt tctgaagatc agacagcagc 2820

cctgatggcc catctctttg aaatgggatt ctgtgacagg cagctgaacc tacggctgct 2880

gaagaaacac aattacaata tcctgcaggt tgtgacagaa cttcttcagt taaacaacaa 2940

cgactggtac agccaacgct attgaggagt gaccttgtat taaataactg cctgctgctc 3000

agagatgatc tttattctgt cattggggta tgggatagaa gcccttgctt atttttaatc 3060

tgatgaatct gtatagagcc catcgttgag ttaccaagac aatacctgct acagtatttt 3120

ggggagcaaa ctaaagacca gaacttaaat tttcacttta gacattggat gaatagtatg 3180

aagacagttt ttcagttgat ttggataaaa ctattttagt gcattgacaa gtgtaacttc 3240

aacttcatat agaaccattt ttctttctgc ttttattgaa actgagtatt tttctttggc 3300

taatgtggat tttttatggg gatatctgtt aattttcagg ttttgaaaga cattaacctc 3360

ggaagttgtt tttaagaatt attctcataa ttcttattct cataatttct gtaatccacc 3420

tcaagcttca tagttatttg gcattgaaat aacacccaga gcatgataga aatgttgtta 3480

ctcttcctct ctcaaggaga aagtaatttt cctgcaatac ttaataattg gcaccgttgc 3540

tttctaaaga ctccatggtg cattcaagag tatccaactt caagggaatc tccgcatttc 3600

aatgaaagga ggaagagtgt gctgataaac ctaccagcac ctattgagca atgtctatta 3660

tagtaatttt gcatacattt ttatttaagg gaaaaaatat aggtattgtg aaatattttg 3720

ctaatcttat agaaaaggaa aaaatcccgt tatttaaagg gaaaagtaaa tttaacagtt 3780

gccttttttc ttaatgtcag ggcagatctt attttacagt acagtggggg aaatagaaaa 3840

catgtgaaag gcaaaaggca ggctcctaaa ttaatgtcag tgaagttcag ggtgggcaaa 3900

tgagtgtgtg tgaggtatag gaaatgctga tgacttcttt aatgcttgaa gtccgttcac 3960

aggtatctag ccctagaatg cctagaacag gaagaggcag ctggtgttct gcaaaacttg 4020

gacaggggca aagttgctga aaaagttttg gtttaacccg aagataagtg gaaaagagct 4080

tgtccatgaa cccaggttct cactctgttt acagaagtgt gttgagtaca gttggtgaag 4140

gaagaggtaa caaaaaatgc taaatatttt atccatgaaa atgacttcca gaaaaggaag 4200

aatatgaacc ccagaccgaa ggggaaaaga tagttaatag tattatctaa cctggttggt 4260

atttgtaatg aatggtgatt ttaattagtc attagccata atgatgttta tttacagtat 4320

aactcctgaa tgctacttaa ataaaccagg attcaaactg caagccagcc aggccgttca 4380

ttatttaaaa cgttttaatc ggggcttccg ggtagaaggt ggagcggcag ggtgtaattg 4440

ggttgatggg tgggacctgt cttgaccatc ggagttttat aatcgagggc caggagggcc 4500

cgggttgctc tcctggttat gtatgtactt gtacataacc accttaagaa tggtgaaata 4560

aatgttcttg gaaattccta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4620

aaaaaaaaaa aaaaaaaaa 4639

<210>26

<211>966

<212>PRT

<213>Homo sapiens

<400>26

Met Glu Pro Gln Val Thr Leu Asn Val Thr Phe Lys Asn Glu Ile Gln

1 5 10 15

Ser Phe Leu Val Ser Asp Pro Glu Asn Thr Thr Trp Ala Asp Ile Glu

20 25 30

Ala Met Val Lys Val Ser Phe Asp Leu Asn Thr Ile Gln Ile Lys Tyr

35 40 45

Leu Asp Glu Glu Asn Glu Glu Val Ser Ile Asn Ser Gln Gly Glu Tyr

50 55 60

Glu Glu Ala Leu Lys Met Ala Val Lys Gln Gly Asn Gln Leu Gln Met

65 70 75 80

Gln Val His Glu Gly His His Val Val Asp Glu Ala Pro Pro Pro Val

85 90 95

Val Gly Ala Lys Arg Leu Ala Ala Arg Ala Gly Lys Lys Pro Leu Ala

100 105 110

His Tyr Ser Ser Leu Val Arg Val Leu Gly Ser Asp Met Lys Thr Pro

115 120 125

Glu Asp Pro Ala Val Gln Ser Phe Pro Leu Val Pro Cys Asp Thr Asp

130 135 140

Gln Pro Gln Asp Lys Pro Pro Asp Trp Phe Thr Ser Tyr Leu Glu Thr

145 150 155 160

Phe Arg Glu Gln Val Val Asn Glu Thr Val Glu Lys Leu Glu Gln Lys

165 170 175

Leu His Glu Lys Leu Val Leu Gln Asn Pro Ser Leu Gly Ser Cys Pro

180 185 190

Ser Glu Val Ser Met Pro Thr Ser Glu Glu Thr Leu Phe Leu Pro Glu

195 200 205

Asn Gln Phe Ser Trp His Ile Ala Cys Asn Asn Cys Gln Arg Arg Ile

210 215 220

Val Gly Val Arg Tyr Gln Cys Ser Leu Cys Pro Ser Tyr Asn Ile Cys

225 230 235 240

Glu Asp Cys Glu Ala Gly Pro Tyr Gly His Asp Thr Asn His Val Leu

245 250 255

Leu Lys Leu Arg Arg Pro Val Val Gly Ser Ser Glu Pro Phe Cys His

260 265 270

Ser Lys Tyr Ser Thr Pro Arg Leu Pro Ala Ala Leu Glu Gln Val Arg

275 280 285

Leu Gln Lys Gln Va1 Asp Lys Asn Phe Leu Lys Ala Glu Lys Gln Arg

290 295 300

Leu Arg Ala Glu Lys Lys Gln Arg Lys Ala Glu Val Lys Glu Leu Lys

305 310 315 320

Lys Gln Leu Lys Leu His Arg Lys Ile His Leu Trp Asn Ser Ile His

325 330 335

Gly Leu Gln Ser Pro Lys Ser Pro Leu Gly Arg Pro Glu Ser Leu Leu

340 345 350

Gln Ser Asn Thr Leu Met Leu Pro Leu Gln Pro Cys Thr Ser Val Met

355 360 365

Pro Met Leu Ser Ala Ala Phe Val Asp Glu Asn Leu Pro Asp Gly Thr

370 375 380

His Leu Gln Pro Gly Thr Lys Phe Ile Lys His Trp Arg Met Lys Asn

385 390 395 400

Thr Gly Asn Val Lys Trp Ser Ala Asp Thr Lys Leu Lys Phe Met Trp

405 410 415

Gly Asn Leu Thr Leu Ala Ser Thr Glu Lys Lys Asp Va1 Leu Val Pro

420 425 430

Cys Leu Lys Ala Gly His Val Gly Val Val Ser Val Glu Phe Ile Ala

435 440 445

Pro Ala Leu Glu Gly Thr Tyr Thr Ser His Trp Arg Leu Ser His Lys

450 455 460

Gly Gln Gln Phe Gly Pro Arg Val Trp Cys Ser Ile Ile Val Asp Pro

465 470 475 480

Phe Pro Ser Glu Glu Ser Pro Asp Asn Ile Glu Lys Gly Met Ile Ser

485 490 495

Ser Ser Lys Thr Asp Asp Leu Thr Cys Gln Gln Glu Glu Thr Phe Leu

500 505 510

Leu Ala Lys Glu Glu Arg Gln Leu Gly Glu Val Thr Glu Gln Thr Glu

515 520 525

Gly Thr Ala Ala Cys Ile Pro Gln Lys Ala Lys Asn Val Ala Ser Glu

530 535 540

Arg Glu Leu Tyr Ile Pro Ser Val Asp Leu Leu Thr Ala Gln Asp Leu

545 550 555 560

Leu Ser Phe Glu Leu Leu Asp Ile Asn Ile Val Gln Glu Leu Glu Arg

565 570 575

Val Pro His Asn Thr Pro Val Asp Val Thr Pro Cys Met Ser Pro Leu

580 585 590

Pro His Asp Ser Pro Leu Ile Glu Lys Pro Gly Leu Gly Gln Ile Glu

595 600 605

Glu Glu Asn Glu Gly Ala Gly Phe Lys Ala Leu Pro Asp Ser Met Val

610 615 620

Ser Val Lys Arg Lys Ala Glu Asn Ile Ala Ser Val Glu Glu Ala Glu

625 630 635 640

Glu Asp Leu Ser Gly Thr Gln Phe Val Cys Glu Thr Val Ile Arg Ser

645 650 655

Leu Thr Leu Asp Ala Ala Pro Asp His Asn Pro Pro Cys Arg Gln Lys

660 665 670

Ser Leu Gln Met Thr Phe Ala Leu Pro Glu Gly Pro Leu Gly Asn Glu

675 680 685

Lys Glu Glu Ile Ile His Ile Ala Glu Glu Glu Ala Val Met Glu Glu

690 695 700

Glu Glu Asp Glu Glu Asp Glu Glu Glu Glu Asp Glu Leu Lys Asp Glu

705 710 715 720

Val Gln Ser Gln Ser Ser Ala Ser Ser Glu Asp Tyr Ile Ile Ile Leu

725 730 735

Pro Glu Cys Phe Asp Thr Ser Arg Pro Leu Gly Asp Ser Met Tyr Ser

740 745 750

Ser Ala Leu Ser Gln Pro Gly Leu Glu Arg Gly Ala Glu Gly Lys Pro

755 760 765

Gly Val Glu Ala Gly Gln Glu Pro Ala Glu Ala Gly Glu Arg Leu Pro

770 775 780

Gly Gly Glu Asn Gln Pro Gln Glu His Ser Ile Ser Asp Ile Leu Thr

785 790 795 800

Thr Ser Gln Thr Leu Glu Thr Val Pro Leu Ile Pro Glu Val Val Glu

805 810 815

Leu Pro Pro Ser Leu Pro Arg Ser Ser Pro Cys Val His His His Gly

820 825 830

Ser Pro Gly Val Asp Leu Pro Val Thr Ile Pro Glu Val Ser Ser Val

835 840 845

Pro Asp Gln Ile Arg Gly Glu Pro Arg Gly Ser Ser Gly Leu Val Asn

850 855 860

Ser Arg Gln Lys Ser Tyr Asp His Ser Arg His His His Gly Ser Ser

865 870 875 880

Ile Ala Gly Gly Leu Mal Lys Gly Ala Leu Ser Val Ala Ala Ser Ala

885 890 895

Tyr Lys Ala Leu Phe Ala Gly Pro Pro Val Thr Ala Gln Pro Ile Ile

900 905 910

Ser Glu Asp Gln Thr Ala Ala Leu Met Ala His Leu Phe Glu Met Gly

915 920 925

Phe Cys Asp Arg Gln Leu Asn Leu Arg Leu Leu Lys Lys His Asn Tyr

930 935 940

Asn Ile Leu Gln Val Val Thr Glu Leu Leu Gln Leu Asn Asn Asn Asp

945 950 955 960

Trp Tyr Ser Gln Arg Tyr

965

<210>27

<211>16

<212>DNA

<213>Artificial Sequence

<220>

<223>H-T11A primer

<400>27

aagctttttt ttttta 16

<210>28

<211>13

<212>DNA

<213>Artificial Sequence

<220>

<223>H-AP33 primer

<400>28

aagcttgctg ctc 13

<210>29

<211>833

<212>DNA

<213>Homo sapiens

<400>29

cggcttccag tccgcggagg gcgaggcggc gtggacagcg gccccggcac ccagcgcccc 60

gccgcccgca agccgcgcgc ccgtccgccg cgccccgagc ccgccgcttc ctatctcagc 120

gccctgccgc cgccgccgcg gcccagcgag cggccctgat gcaggccatc aagtgtgtgg 180

tggtgggaga cggagctgta ggtaaaactt gcctactgat cagttacaca accaatgcat 240

ttcctggaga atatatccct actgtctttg acaattattc tgccaatgtt atggtagatg 300

gaaaaccggt gaatctgggc ttatgggata cagctggaca agaagattat gacagattac 360

gccccctatc ctatccgcaa acagatgtgt tcttaatttg cttttccctt gtgagtcctg 420

catcatttga aaatgtccgt gcaaagtggt atcctgaggt gcggcaccac tgtcccaaca 480

ctcccatcat cctagtggga actaaacttg atcttaggga tgataaagac acgatcgaga 540

aactgaagga gaagaagctg actcccatca cctatccgca gggtctagcc atggctaagg 600

agattggtgc tgtaaaatac ctggagtgct cggcgctcac acagcgaggc ctcaagacag 660

tgtttgacga agcgatccga gcagtcctct gcccgcctcc cgtgaagaag aggaagagaa 720

aatgcctgct gttgtaaatg tctcagcccc tcgttcttgg tcctgtccct tggaaccttt 780

gtacgctttg ctcaatcaaa aacaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 833

<210>30

<211>192

<212>PRT

<213>Homo sapiens

<400>30

Met Gln Ala Ile Lys Cys Val Val Val Gly Asp Gly Ala Val Gly Lys

1 5 10 15

Thr Cys Leu Leu Ile Ser Tyr Thr Thr Asn Ala Phe Pro Gly Glu Tyr

20 25 30

Ile Pro Thr Val Phe Asp Asn Tyr Ser Ala Asn Val Met Val Asp Gly

35 40 45

Lys Pro Val Asn Leu Gly Leu Trp Asp Thr Ala Gly Gln Glu Asp Tyr

50 55 60

Asp Arg Leu Arg Pro Leu Ser Tyr Pro Gln Thr Asp Val Phe Leu Ile

65 70 75 80

Cys Phe Ser Leu Val Ser Pro Ala Ser Phe Glu Asn Val Arg Ala Lys

85 90 95

Trp Tyr Pro Glu Val Arg His His Cys Pro Asn Thr Pro Ile Ile Leu

100 105 110

Val Gly Thr Lys Leu Asp Leu Arg Asp Asp Lys Asp Thr Ile Glu Lys

115 120 125

Leu Lys Glu Lys Lys Leu Thr Pro Ile Thr Tyr Pro Gln Gly Leu Ala

130 135 140

Met Ala Lys Glu Ile Gly Ala Val Lys Tyr Leu Glu Cys Ser Ala Leu

145 150 155 160

Thr Gln Arg Gly Leu Lys Thr Val Phe Asp Glu Ala Ile Arg Ala Val

165 170 175

Leu Cys Pro Pro Pro Val Lys Lys Arg Lys Arg Lys Cys Leu Leu Leu

180 185 190

<210>31

<211>16

<212>DNA

<213>Artificial Sequence

<220>

<223>H-T11G primer

<400>31

aagctttttt tttttg 16

<210>32

<211>13

<212>DNA

<213>Artificial Sequence

<220>

<223>H-AP26 primer

<400>32

aagcttgcca tgg 13

<210>33

<211>2364

<212>DNA

<213>Homo sapiens

<400>33

gcagaggaaa gggtgaaggg agtctgggca agcaaagcat agagatggtg gggtggtggt 60

ggggttgaag aaacttgttg gtataattgt cataggactt gcctaaaata ttattaaaat 120

tacgggagtg tactcagctt tgagcctagg agaaaatgcc actgtgtgca tccattttaa 180

agggttccct cataaaaaaa tgttattccc cattatcaca tcagtacact gctttgaaaa 240

caaaactttt caacatgggc atactgggct acatggaaaa tgacatcacc caggagtgat 300

ttctctttat atatattatt tctgcagtta ccatccttat ctgagttatc acagttcatg 360

aatctaagag gcggaactct acatcattag taagaggttc caccaaagtc taaagttgta 420

ttcacttgtg tttgatgaac tatctttaaa agaccatagg tctatcatta tttcttagac 480

ataatctaaa gaaaaacaga ctagagaagc cacctggttg taacagaata agcagaagtt 540

tacagcatga tagtccaagt ggtgataact ttaaataaaa ctcaaatttt tactgtttgt 600

agacaggaat gctgtcctag agaacctcct cctcaaccag ctacgtacat agttttatcc 660

tatgcattcc tgttttctgt gttttttgtt tttttttttt gagacagagt ctcgctctgt 720

cacccaggct ggagtgcagt ggtgcgacct cagctcactg aaacctctgc ctcccgggtt 780

caagcgattc tcctgcatca gcctcccgag tagctaggat tacaggcgcc cgccactacg 840

cccagctaat ttgtggtatt tttagtagag acagggtttc accatgttgg ccaggctggt 900

ctcgaactcc tgacctcatg atccgcccgc cttgacctcc caaagtgctg ggattacagg 960

catgagccac cgcacccagc ctgcattcct gtttttttaa tggttttgga gggtagcagt 1020

agagatgggg tctcactatg ttgcccagtc tagtcttgaa ctcctgggct acagttaccc 1080

tcctacctcg gcttcccaaa gtgctcggat tacaggtgtg agccactgtg cctagcctat 1140

aatgatcatt ttaatgtttc ccatgcactc atttagtttg aaccttcaca gcaacccaat 1200

gaggtaatac tcccatttca catataatac tgagagatga gttgcacaag attatacact 1260

gttaagtagc agagccagaa tggacttcag aatcccaact acaatacaaa tgtttattta 1320

aataaagaag aaagctattg tacaaatatc actcttcagg tttagcttac agagccatgg 1380

ctatggattc ttagctctgt aaggaagtgc ttctataaat tcttaggttt agagatgata 1440

ccatctgggt acctttgctt gaaccgtgca accacatctg ggtctagtag gtggatccca 1500

tccagttggt ttccaagggt gatcctgaaa cagtgtaaaa ggaggggcaa accagaaatc 1560

ctggaattag agggtttaat attgttaaaa aatgcatacc aaatgaagac tgcctatcat 1620

catatcaaat atgccaattc taaaaagagc ttaacattag aatagtatat ggtagaatta 1680

ctagttcaga attggcatag attctggtgt taaaatagac tggatctgta ttatctgagg 1740

gttagtaact aatgcttagc caggcctgct tcacagagtt gctaccaggg agtattcttt 1800

ggataagcaa atgctagcag catgtgtttt aagctctgtt aaggggtgaa agatgtaatt 1860

attgacagat taaatagata acttcgtaac caccaggggg cagattcaat acatcacaga 1920

atggctgagg aagatccttg ggttgtgaag agagtagaaa ccctagggag cagtgctttt 1980

gggtcctaga acctgttgag tttctaatga atatttgtag aatctcataa aacagtttaa 2040

atacaagctt aagtggctta tgaatcctgt gaagctcatt tatggactag tgtaaaacaa 2100

tgtgaagctc tactaagttc tgtccttaat cataaataat agccccttga ggactagcct 2160

gttctctggt caccttacca gttgggttgc acattgtgtg gtcgtccaaa taactcaatc 2220

ttgcgagtgc caggagatag tctttcaatc atgccataga tttcatctgg tttatgactg 2280

gtggaacgaa cctaggaaat aaaaactagc tgctttttaa gttaaaaaaa aaaaaaaaaa 2340

aaaaaaaaaa aaaaaaaaaa aaaa 2364

<210>34

<211>76

<212>PRT

<213>Homo sapiens

<400>34

Met Ile Pro Ser Gly Tyr Leu Cys Leu Asn Arg Ala Thr Thr Ser Gly

1 5 10 15

Ser Ser Arg Trp Ile Pro Ser Ser Trp Phe Pro Arg Val Ile Leu Lys

20 25 30

Gln Cys Lys Arg Arg Gly Lys Pro Glu Ile Leu Glu Leu Glu Gly Leu

35 40 45

Ile Leu Leu Lys Asn Ala Tyr Gln Met Lys Thr Ala Tyr His His Ile

50 55 60

Lys Tyr Ala Asn Ser Lys Lys Ser Leu Thr Leu Glu

65 70 75

<210>35

<211>16

<212>DNA

<213>Artificial Sequence

<220>

<223>H-T11G primer

<400>35

aagctttttt tttttg 16

<210>36

<211>13

<212>DNA

<213>Artificial Sequence

<220>

<223>H-AP23 primer

<400>36

aagcttggct atg 13

Claims

1.一种人类原癌蛋白，具有的氨基酸序列选自由SEQ ID NO：2、SEQ ID NO：6、SEQ ID NO：10、SEQ ID NO：14、SEQ ID NO：18、SEQ ID NO：22、SEQ ID NO：26、SEQ ID NO：3Q和SEQID NO：34组成的组。

2.一种人类原癌基因，具有的DNA序列选自由对应于SEQ IDNO：1的核苷酸序列位置89-709的DNA序列、对应于SEQ IDNO：5的核苷酸序列位置113-1627的DNA序列、对应于SEQID NO：9的核苷酸序列位置23-1276的DNA序列、对应于SEQID NO：13的核苷酸序列位置11-844的DNA序列、对应于SEQID NO：17的核苷酸序列位置67-1125的DNA序列、对应于SEQ ID NO：21的核苷酸序列位置215-2212的DNA序列、对应于SEQ ID NO：25的核苷酸序列65-2965的DNA序列、对应于SEQ ID NO：29的核苷酸序列位置159-737的DNA序列、以及对应于SEQ ID NO：33的核苷酸序列位置1435-1685的DNA序列组成的组，其中所述DNA序列中每一种均编码如权利要求1中所定义的原癌蛋白。

3.根据权利要求2所述的人类原癌基因，其中所述原癌基因具有选自由SEQ ID NO：1、SEQ ID NO：5、SEQ ID NO：9、SEQ IDNO：13、SEQ ID NO：17、SEQ ID NO：21、SEQ ID NO：25、SEQ ID NO：29和SEQ ID NO：33组成的组的DNA序列。

4.一种包括如权利要求2或3中定义的每一种原癌基因的载体。

5.一种用于诊断癌症及癌症转移的试剂盒，包括如权利要求1中定义的每一种原癌蛋白。

6.一种用于诊断癌症和癌症转移的试剂盒，包括如权利要求2或3中定义的每一种原癌基因。