CN102089428A

CN102089428A - 食道癌确定用组合物及方法

Info

Publication number: CN102089428A
Application number: CN200980126931.3A
Authority: CN
Inventors: 妙本阳; 小园聪子; 秋山英雄; 信正均; 岛田裕; 辻本豪三
Original assignee: Kyoto University; Toray Industries Inc
Current assignee: Kyoto University; Toray Industries Inc
Priority date: 2008-05-21
Filing date: 2009-05-21
Publication date: 2011-06-08
Anticipated expiration: 2029-05-21
Also published as: EP2295564A1; EP2295564A4; CA2726736A1; KR20110034602A; US20110098185A1; WO2009142257A1; CN102089428B; CN103540657A; JPWO2009142257A1; US8945849B2

Abstract

本发明提供食管癌诊断用组合物、试剂盒或DNA芯片或者使用该组合物、试剂盒或DNA芯片检测食管癌的方法。所述食管癌诊断用组合物、试剂盒或DNA芯片含有多种多核苷酸，所述多种多核苷酸选自：与来自食管癌患者的不含食管癌的组织相比在来自食管癌患者的食管癌组织中表达水平发生变化的多核苷酸、其变异体或其片段。

Description

食道癌确定用组合物及方法

技术领域

本发明涉及对确定或检测食管癌有用的诊断(确定或检测)用组合物、利用该组合物的食管癌检测或确定方法、及利用该组合物的食管癌诊断或检测试剂盒。

背景技术

食管是连接咽和胃的管腔状器官，大部分存在于胸腔，一部分存在于颈部和腹腔。在胸腔上部，食管位于气管和脊椎之间，在胸腔下部，食管被心脏、大动脉和肺包围。食管具有将从口摄入的食物输送到胃的作用。

2001年日本人的癌死亡率为10万人中有238.8人。死亡原因中食管癌所占的比例逐年增加，2001年男性的食管癌死亡例占到所有癌症死亡例的5.0％、女性占到1.4％。食管癌的发病年龄的高峰在60～70岁，男性发病较多。另外，吸烟、饮酒、嗜好热食品等环境因素与发病密切相关。并且，一般认为由于在食管壁内部或周围，血管和淋巴管丰富，所以发生的癌症多出现转移。

食管癌的治疗根据进展程度(日本食管疾病研究会编临床·病理食管癌治疗规范1999年)或转移、及全身状况而决定。食管癌的标准治疗方法记载于日本食管疾病研究会编“食管癌治疗方针”(2002年)。目前最普通的治疗方法是手术疗法，即切除含有癌细胞的食管和包括淋巴结的周围组织(淋巴结清扫(lymph node dissection))，并利用胃等其他器官重建食管。但是，手术疗法、特别是大范围的淋巴结清扫给患者带来很大的负担，还必须考虑手术后的生活质量评分(QOL)降低的问题。对于粘膜内的早期癌症，有时可以在内窥镜下实施粘膜剥除术。另外，从根治疗法、对症疗法两方面考虑，有时可以进行放射线照射。进而，与手术疗法或放射线疗法组合，进行化学疗法。目前，一般认为在化学疗法中，并用5-氟尿嘧啶和顺铂的治疗方法是最有效的。

食管癌通常是在患者感觉吞咽时有不适感、吞咽困难、胸骨后部疼痛及胸部不适感等自觉症状进行就诊时被发现。但是，上述症状的出现是由癌在食管内生长导致的，患者因自我检测而就诊时发现的癌已经扩散或转移到食管壁外，通常预后不良。

食管癌可以通过食管造影检查、内窥镜检查及活组织检查进行确定。在进行内窥镜检查时或手术时采集活组织检查标本，制作病理标本，并且通过病理组织学分类加以诊断。此时，需要开发一种快速简便的诊断方法，该方法能根据内窥镜检查得到的细胞的性质预测是否有食管癌。

至今为止，已有人提出使用食管癌组织中特异性含有的标记物的分子生物学诊断方法。该方法能快速地得到客观的结果，有助于快速诊断。

目前，作为食管癌临床检查用标记物，除使用作为血清中的蛋白质标记物的SCC、CYFRA21-1、CEA等之外，还报道了专利文献1、2中记载的蛋白质等。但是，上述标记物缺少灵敏度、特异性，即使是灵敏度最高的CYFRA21-1，其灵敏度也只是33.9％(非专利文献1)～43.9％(非专利文献2)左右。因此，尚不能达到通过对上述血清中的标记物及其组合进行检测来确定食管癌细胞是否存在的阶段。

另外，作为使用了用于特异性判断从受试者采集的活检试样中是否含有食管癌细胞的基因的标记物，公开了染色体异常(例如参见专利文献3，4)或基因的后生序列(epigenetic sequences)(例如专利文献5)，除此之外，还报道了多个利用DNA芯片全面解析基因表达的结果(例如，参见专利文献6、非专利文献3～8)。特别是，专利文献6中，提供了20种基因，所述基因通过组合检测来确定是否存在食管癌细胞，但由于分别使用不同的判断机器判断含有食管癌细胞和不含食管癌细胞，所以不仅诊断复杂，而且在一方判断机器预测含有食管癌细胞，另一方预测不含食管癌细胞时，还存在无法进行诊断的情况。另外，作为以单独的基因表达作为指标的标记物，报道了专利文献7、非专利文献9、10中记载的SPRR3基因(Small proline-rich protein 3)、非专利文献11中记载的fgf3基因、专利文献7、非专利文献12中记载的CSTB基因(cystatin B、liver thiol proteinase inhibitor)、专利文献8中记载的UCP2基因(mitochondrial uncoupling protein 2)及COL3A1(3’region for pro-alpha(III)collagen)、专利文献7中记载的UPK 1A基因(uroplakin 1A)、非专利文献13中记载的HSPA 1B基因(Heat Shock 70kDa Protein 1)等。另外，作为上皮系恶性肿瘤的标记物，已知专利文献9中记载的RRM1基因(ribonucleotide reductase M1 polypeptide)等。但是，即使利用上述基因，也不能充分地诊断是否存在食管癌。

专利文献1：日本特开2003-259872号公报

专利文献2：日本特表2000-511536号公报

专利文献3：日本特开2001-17200号公报

专利文献4：日本特开2002-272497号公报

专利文献5：日本特表2004-505612号公报

专利文献6：国际公开第2006/118308号说明书

专利文献7：国际公开第2003/042661号说明书

专利文献8：国际公开第2003/076594号说明书

专利文献9：国际公开第2006/119464号说明书

非专利文献1：Nakamura，T.等，1998，Diseases of the Esophagus，第11卷，p.35-39

非专利文献2：Kawaguchi，H.等，2000，Cancer，第89卷，p.1413-1417

非专利文献3：Luo，A.等，2004年，Oncogene，第23卷，p.1291-1299

非专利文献4：Zhi，H.等，2003年，International Journal of Cancer，第106卷，p.327-333

非专利文献5：Lu，J.等，2001年，International Journal of Cancer，第91卷，p.288-294

非专利文献6：Kazemi-Noureini，S.等，2004年，World Journal of Gastroenterology，第10卷，p.1716-1721

非专利文献7：Xu，S.H.等，2003年，World Journal of Gastroenterology，第9卷，p.417-422

非专利文献8：Su，H.等，2003年，Cancer Research，第63卷，p.3872-3876

非专利文献9：Chen，B.S.等，2000年，Carcinogenesis，第21卷，p.2147-2150

非专利文献10：Abraham，J.M.等，1996年，Cell Growth & Differentiation，第7卷，p.855-860

非专利文献11：Kitagawa，Y.等，1991年，Cancer Research，第51卷，p.1504-1508

非专利文献12：Shiraishi，T.等，1998年，International Journal of Cancer，第79卷，p.175-178

非专利文献13：Kawanishi，K.等，1999年，Cancer，第85卷，p.1649-1657

发明内容

但是，由于上述现有的指标缺少特异性及/或灵敏性，或尚未确立从生物试样中有效地检出的方法，所以通常不应用于临床，迫切希望开发出特异性及灵敏性高的食管癌标记物。

本发明的目的在于提供在食管癌的诊断及治疗中有用的疾病确定用组合物、使用该组合物的食管癌的确定(或检测)方法、及利用该组合物的食管癌的确定(或检测或诊断)用试剂盒。

作为寻找标记物的方法，可以举出下述方法：通过某种方法对食管癌细胞中的、手术时来自患者的食管癌细胞、和来自患者的非癌细胞中的基因表达或蛋白质表达、或细胞代谢产物等的量进行比较的方法；和对食管癌患者和非食管癌患者体液中含有的基因、蛋白质、代谢产物等的量进行测定的方法等。

近年来，使用DNA阵列进行的基因表达量解析，被特别广泛地用作寻找上述标记物的方法。DNA阵列中固定有使用了对应于数百至数万种基因的碱基序列的探针。通过将受试试样添加到DNA阵列中，试样中的基因与探针结合，利用某种方法测定结合量，由此可以知道受试试样中的基因量。对应于固定在DNA阵列上的探针的基因可以自由选择，另外，使用来自手术时或内窥镜检查时食管癌患者的食管癌细胞和非食管癌细胞，比较试样中的基因表达量，由此能判定可以作为食管癌标记物的基因组。

为了解决上述课题，本发明人等发现：利用DNA芯片解析来自手术时食管癌患者的食管癌细胞和非食管癌细胞的基因表达，发现了可用于食管癌的检测标记物的基因，并且发现它们的基因表达量与非食管癌细胞相比，在食管癌细胞中减少、降低、或增加、增大，从而完成了本发明。

1.发明概要

本发明具有以下特征。

在本发明的第一方案中，本发明提供一种食管癌诊断用组合物，其中含有选自下述(a)～(e)所示的多核苷酸、其变异体、或其片段中的3个以上多核苷酸。

(a)由序列号1～38表示的碱基序列组成的多核苷酸、其变异体、或其含有15个以上连续碱基的片段，

(b)含有序列号1～38表示的碱基序列的多核苷酸，

(c)由与序列号1～38表示的碱基序列互补的碱基序列组成的多核苷酸、其变异体、或其含有15个以上连续碱基的片段，

(d)含有与序列号1～38表示的碱基序列互补的碱基序列的多核苷酸，

(e)在严格条件下与上述(a)～(d)中任一多核苷酸杂交的多核苷酸、或其含有15个以上连续碱基的片段。

另外，在其他实施方式中，在上述组合物中，上述片段为含有60个以上连续碱基的多核苷酸。

另外，在其他实施方式中，在上述组合物中，上述片段是序列号1～38中任一个表示的碱基序列中分别含有序列号63～100中的任一个表示的碱基序列、且含有60个以上连续碱基的多核苷酸，或含有与该多核苷酸的序列互补的碱基序列的多核苷酸。

另外，在其他实施方式中，在上述组合物中，上述片段是含有序列号63～100中任一个表示的碱基序列、或与其互补的碱基序列的多核苷酸。

另外，在本发明的其他实施方式中，如上述任一项所述的组合物，其中还含有选自下述(f)～(j)所示的多核苷酸、其变异体、或其片段中的2个以上多核苷酸。

(f)由序列号39～62表示的碱基序列组成的多核苷酸、其变异体、或其含有15个以上连续碱基的片段，

(g)含有序列号39～62表示的碱基序列的多核苷酸，

(h)由与序列号39～62表示的碱基序列互补的碱基序列组成的多核苷酸、其变异体、或其含有15个以上连续碱基的片段，

(i)含有与序列号39～62表示的碱基序列互补的碱基序列的多核苷酸，

(j)在严格条件下与上述(f)～(i)中任一多核苷酸杂交的多核苷酸、或其含有15个以上连续碱基的片段。

另外，在其他实施方式中，上述组合物中，上述片段为含有60个以上连续碱基的多核苷酸。

另外，在其他实施方式中，上述组合物中，上述片段是序列号39～62中任一个表示的碱基序列中分别含有序列号101～124中任一个表示的碱基序列、且含有60个以上连续碱基的多核苷酸，或含有与该多核苷酸的序列互补的碱基序列的多核苷酸。

另外，在其他实施方式中，上述组合物中，上述片段是含有序列号101～124中任一个表示的碱基序列、或与其互补的碱基序列的多核苷酸。

作为本发明的第二方案，本发明提供一种食管癌诊断用试剂盒，其中含有上述任一项中所述的(a)～(e)所示的多核苷酸、其变异体、或其片段中的3个以上多核苷酸。

另外，在其他实施方式中，上述试剂盒中还含有上述任一项中所述的(f)～(j)所示的多核苷酸、其变异体、或其片段中的2个以上多核苷酸。

另外，在其他实施方式中，上述试剂盒中，上述多核苷酸是由序列号1～62中任一个表示的碱基序列组成的多核苷酸、由其互补序列组成的多核苷酸、在严格条件下与上述多核苷酸杂交的多核苷酸、或上述多核苷酸的含有15个以上连续碱基的片段。

另外，在其他实施方式中，上述试剂盒中，上述片段为含有60个以上连续碱基的多核苷酸。

另外，在其他实施方式中，上述的试剂盒中，上述片段是序列号1～62中任一个表示的碱基序列中分别含有序列号63～124中的任一个表示的碱基序列、且含有60个以上连续碱基的多核苷酸，或含有与该多核苷酸的序列互补的碱基序列的多核苷酸。

另外，在其他实施方式中，上述试剂盒中，上述片段是含有序列号63～124中的任一个表示的碱基序列、或与其互补的碱基序列的多核苷酸。

另外，在其他实施方式中，上述试剂盒中，上述片段是由序列号63～124中任一个表示的碱基序列组成的多核苷酸。

另外，在其他实施方式中，上述试剂盒含有5种以上至全部的含有序列号63～124中任一个表示的碱基序列或其互补序列的多核苷酸。

另外，在其他实施方式中，如上述任一项所述的试剂盒中，上述多核苷酸分别或以任意组合包装在不同的容器中。

另外，在其他实施方式中，本发明提供一种食管癌诊断用DNA芯片，其中含有上述任一项所述的(a)～(e)所示的多核苷酸、其变异体、或其片段中的3个以上多核苷酸。

作为本发明的第三方案，本发明提供一种食管癌诊断用DNA芯片，其中含有上述任一项所述的(f)～(j)所示的多核苷酸、其变异体、或其片段中的2个以上多核苷酸。

另外，在其他实施方式中，上述DNA芯片含有5种以上～全部的含有序列号63～124中任一个表示的碱基序列或其互补序列的多核苷酸。

作为第4方案，本发明提供一种在体外确定来自受试者的受试样品中是否含有食管癌细胞的方法，该方法使用上述任一项所述的组合物、上述任一项所述的试剂盒、上述任一项所述的DNA芯片或它们的组合，测定来自受试者的生物试样中的靶核酸的表达量，由此在体外确定来自受试者的受试样品中是否含有食管癌细胞。

另外，在其他实施方式中，上述方法使用DNA芯片。

另外，在其他实施方式中，提供一种确定食管癌的方法，该方法包括以下步骤：

第1步骤，使用上述任一项所述的组合物、上述任一项所述的试剂盒、上述任一项所述的DNA芯片或它们的组合，体外测定多个生物试样中的靶核酸的表达量，所述生物试样是已知含有食管癌细胞的组织；

第2步骤，以该第1步骤中得到的该靶核酸的表达量的测定值作为训练样本制作辨别式(支持向量机(Support Vector Machine))；

第3步骤，与第1步骤相同地体外测定来自受试者食管的生物试样中的该靶核酸的表达量；

第4步骤，将第3步骤中得到的该靶核酸的表达量的测定值代入上述第2步骤中得到的辨别式，基于由该辨别式得到的结果，判断生物试样中含有食管癌细胞。

另外，在其他实施方式中，本发明提供上述任一项所述的组合物、上述任一项所述的试剂盒、或上述任一项所述的DNA芯片在体外预测是否有食管癌中的应用。

另外，在其他实施方式中，本发明提供一种体外预测受试者是否有食管癌的方法，所述方法包括：使用针对由序列号1～38表示的碱基序列编码的多肽的、3个以上抗体或其片段，体外测定来自受试者的食管癌细胞或血液中的该多肽的量。

另外，在其他实施方式中，上述方法还包括：使用针对由序列号39～62表示的碱基序列编码的多肽的、2个以上抗体或其片段，测定该多肽的量。

另外，在其他实施方式中，上述方法的上述多肽具有序列号125～186表示的氨基酸序列。

另外，在其他实施方式中，上述任一项所述的方法中，与健康的受试者相比，上述多肽的表达水平在患有食管癌的受试者中发生变化时，确定为食管癌。

2.定义

本说明书中使用的术语具有以下定义。

核酸、多核苷酸、氨基酸、肽、多肽、蛋白质等简写符号所表达的含义根据“包括碱基序列或氨基酸序列的说明书等的撰写用手册”(日本国特许厅编)及本领域中的惯用含义。

在本说明书中，“多核苷酸”是指包括RNA及DNA在内的核酸。需要说明的是，上述DNA包括cDNA、基因组DNA及合成DNA。另外，上述RNA包括总RNA、mRNA、rRNA、及合成RNA。另外，本说明书中多核苷酸可以与核酸互换使用。

在本说明书中，“cDNA”包括与基因表达生成的RNA互补的序列的全长DNA链、及由其部分序列组成的DNA片段。cDNA可以通过以RNA为模板，利用使用聚T引物的RT-PCR(逆转录酶-聚合酶链反应)进行合成。

在本说明书中，“基因”不仅包括双链DNA，还包括构成双链DNA的正链(或有意义链)或互补链(或反义链)等各单链DNA。另外，对其长度无特别限定。

所以，在本说明书中，在没有特别说明的情况下，“基因”是指包括人类基因组DNA在内的双链DNA、包括cDNA在内的单链DNA(正链)、具有与该正链互补的序列的单链DNA(互补链)、及上述DNA的片段中的任一个。另外，该“基因”不仅包括以特定的碱基序列(或序列号)表示的“基因”，还包括编码与由上述基因编码的蛋白质的生物学功能相同的蛋白质的“基因”，所述蛋白质例如可以举出同源物(即homolog)、剪接变体等变异体、及衍生物。作为编码上述同源物、变异体或衍生物的“基因”，具体可以举出具有在下述的严格条件下与上述序列号1～62表示的任一特定碱基序列的互补序列杂交的碱基序列的“基因”。

例如，作为来自人的蛋白质的同源物(即homolog)或编码该同源物的基因，可以举出与该蛋白质或编码该蛋白质的人基因对应的其它生物种的蛋白质或基因，上述蛋白质或基因同源物可以通过homoloGene(http://www.ncbi.nlm.nih.gov/homoloGene/)鉴定。具体而言，可以将特定的人类氨基酸或碱基序列代入BLAST程序(BLAST program)(Karlin，S.等，Proceedings of the National Academic Sciences U.S.A.，1993年，第90卷，p.5873-5877，http://www.ncbi.nlm.nih.gov/BLAST/)，得到一致(得分最高、E值为0且同一性显示为100％)序列的登录号(accession number)。作为BLAST程序，已知有BLASTN(基因)、BLASTX(蛋白质)等。例如，进行基因检索时，将从上述BLAST检索得到的登录号输入UniGene(http://www.ncbi.nlm.nih.gov/UniGene/)，得到UniGeneClusterID(以Hs.表示的编号)，将得到的UniGeneClusterID输入homoloGene。从作为结果得到的表示其它生物种基因与人类基因的基因同源物的相关性的列表中选择其它生物种的基因作为与由特定碱基序列表示的人类基因对应的基因同源物。另外，在该方法中，也可以使用FASTA程序(http://www.ddbj.nig.ac.jp/search/fasta-e.html)代替BLAST程序。

需要说明的是，对“基因”的功能区域没有限定，例如可以包括表达控制区域、编码区域、外显子或内含子。

在本说明书中，“转录产物”是指以基因的DNA序列为模板合成的信使RNA(mRNA)。RNA聚合酶与位于基因上游的被称为启动子的部位结合，使核糖核苷酸与3’末端结合，使其与DNA的碱基序列互补，合成信使RNA。该信使RNA中不仅含有基因自身，还含有包括表达控制区域、编码区域、外显子或内含子在内的从转录起点至聚A序列末端的全长序列。

在本说明书中，“翻译产物”表示无论转录合成的信使RNA接受/不接受剪接等修饰，都基于其信息而合成的蛋白质。在信使RNA的翻译过程中，首先，核糖体与信使RNA结合，然后，根据信使RNA的碱基序列结合氨基酸，从而合成蛋白质。

在本说明书中，“探针”包括能用于特异性地检测基因表达产生的RNA或来自该RNA的多核苷酸所使用的多核苷酸及/或与其互补的多核苷酸。

在本说明书中，“引物”包括能特异性识别、扩增基因表达产生的RNA或来自该RNA的多核苷酸的连续的多核苷酸及/或与其互补的多核苷酸。

此处，互补的多核苷酸(互补链、反链)是指基于A：T(U)、G：C的碱基配对，与由序列号定义的碱基序列组成的多核苷酸的全长序列、或其部分序列(此处，为了便于说明，将上述序列称为正链)具有碱基互补关系的多核苷酸。其中，所述互补链不只限于形成与作为对象的正链的碱基序列完全互补的序列，也可以是具有能与作为对象的正链在严格条件下杂交的程度的互补关系的序列。

在本说明书中，“严格条件”是指相对于探针对其它序列的杂交，探针以可检测性更大的程度(例如，比背景至少大2倍)与其靶序列杂交的条件。严格条件具有序列依赖性，因进行杂交的环境的不同而不同。通过控制杂交及/或清洗条件为严格条件，可以鉴定与探针100％互补的靶序列。

在本说明书中，“变异体”为核酸时，是指起因于多型性、突变、转录时的选择剪接等的天然变异体、或以遗传密码的简并为基础的变异体、或在序列号1～62表示的碱基序列或其部分序列中缺失、置换、添加或插入1个以上、优选1个或几个碱基的变异体、或与该碱基序列或其部分序列具有约80％以上、约85％以上、约90％以上、约95％以上、约97％以上、约98％以上、约99％以上的同源性百分比的变异体、或在上述定义的严格条件下与含有该碱基序列或其部分序列的多核苷酸或寡核苷酸杂交的核酸，另一方面，变异体为蛋白质或肽时，是指包括在序列号125～186表示的氨基酸序列或其部分序列中缺失、置换、添加或插入1个以上、优选1个或几个氨基酸的变异体、或与该氨基酸序列或其部分序列具有约80％以上、约85％以上、约90％以上、约95％以上、约97％以上、约98％以上、约99％以上的同源性百分比的变异体。

在本说明书中，“数个”是指约10、9、8、7、6、5、4、3或2个的整数。

在本说明书中，“同源性百分比”可以使用由上述BLAST或FASTA得到的蛋白质或基因检索系统，导入或不导入空位(gap)而进行确定(Karlin，S.等，1993年，Proceedings of the National Academic Sciences U.S.A.，第90卷，p.5873-5877；Altschul，S.F.等，1990年，Journal of Molecular Biology，第215卷，p.403-410；Pearson，W.R.等，1988年，Proceedings of the National Academic Sciences U.S.A.，第85卷，p.2444-2448)。

在本说明书中，“衍生物”为核酸时，是指通过荧光团等进行标记的衍生物、含有修饰核苷酸(例如，含有卤素、甲基等烷基、甲氧基等烷氧基、硫代、羧甲基等基团的核苷酸，及进行了碱基的再构建、双键的饱和、脱氨基化、硫分子对氧分子的取代等的核苷酸等)的衍生物等，另一方面，“衍生物”为蛋白质时，是指乙酰化、酰化、烷基化、磷酸化、硫酸化、糖基化、生物素化等化学修饰衍生物。

在本说明书中，“诊断(或检测或确定)用组合物”，是指为了诊断是否罹患食管癌、发病程度或是否改善或改善程度，或为了筛选对食管癌的预防、改善或治疗有用的候补物质，而直接或间接使用的组合物。其中，包括能特异性识别或结合下述基因的核酸、寡核苷酸及多核苷酸，所述基因与食管癌的罹患相关、在生物体内特别是在食管组织内的表达发生变化，还包括能检测作为该基因翻译产物的蛋白质的抗体。上述核酸、寡核苷酸及多核苷酸基于上述性质，可以有效地用作探针或引物，所述探针用于检测在生物体内、组织或细胞内等表达的上述基因，所述引物用于扩增在生物体内表达的上述基因。

在本说明书中，成为检测·诊断对象的“生物组织”是指伴随食管癌的发生，本发明的基因表达发生变化的组织。具体是指食管组织、其周围的淋巴结、及怀疑发生转移的其它器官等。

本说明书中使用的“EYA2基因”或“EYA2”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号1)表示的眼缺乏同源物2(eyes absent homolog 2)基因(DNA)、编码HTG、PRKCBP 1、RPS2、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号1中记载的EYA2基因(GenBank登录号AL049540)或其他生物种同源物等。EYA2基因可以根据Zimmerman J.E.等，1997年，Genome Res.，第7卷，pp.128-141中记载的方法得到。

本说明书中使用的“SERF1A基因”或“SERF1A”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号2)表示的小EDRK丰富因子1(Small EDRK-rich factor 1)基因(DNA)、编码4F5、H4F5、SMA修饰物1、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号2中记载的SERF 1A基因(GenBank登录号AF073519)或其他生物种同源物等。SERF1A基因可以根据Scharf J.M.，等.，1998年，Nat.Genet.，第20卷，pp.83-86中记载的方法得到。

本说明书中使用的“IGHG1基因”或“IGHG1”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号3)表示的免疫球蛋白重链恒定区γ1(immunoglobulin heavy constant gamma 1)基因(DNA)、编码G1m marker、FLJ39988、FLJ40036、FLJ40253、FLJ40587、FLJ40789、FLJ40834、MGC45809、DKFZp686H11213、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号3中记载的IGHG1基因(GenBank登录号NC_000014)或其他生物种同源物等。IGHG1基因可以根据Hood L.，等，1968年，Nature，第220卷，pp.764-767中记载的方法得到。

本说明书中使用的“ITSN2基因”或“ITSN2”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号4)表示的INTERSECTIN2基因(DNA)、编码SH3domain-containing protein 1B、SH3P18、SH3P18-like WASP associated protein、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号4中记载的ITSN2基因(GenBank登录号NM_019595)或其他生物种同源物等。ITSN2基因可以根据Pucharcos C.，等，2000年，FEBS Lett.，第478卷，pp.43-51中记载的方法得到。

本说明书中使用的“RAB11FIP5基因”或“RAB11FIP5”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号5)表示的人类RAB11家族结合蛋白5(类I)基因(DNA)、编码KIAA0853、RIP11、pp75、GAF1、DKFZP434H018、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号5中记载的RAB11FIP5基因(GenBank登录号BC035013)或其他生物种同源物等。RAB11FIP5基因可以根据Ito T.，等，1999年，J.Clin.Invest.，第104卷，pp.1265-1275中记载的方法得到。

本说明书中使用的“HSPA1A基因”或“HSPA1A”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号6)表示的热休克70kD蛋白1A(Heat shock 70kDa protein 1A)基因(DNA)、编码HAPA1(DNA)、HSP70.1(DNA)、HSP70-1/HSP70-2(DNA)、HSPA1B(DNA)、HSP72(DNA)、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号6中记载的HSPA1A基因(GenBank登录号NM_005345)或其他生物种同源物等。HSPA1A基因可以根据Ito T.，等，1998年，J.Biochem.(Tokyo)，第124卷，pp.347-353中记载的方法得到。

本说明书中使用的“NMU基因”或“NMU”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号7)表示的神经介素U前体(neuromedin U precursor)基因(DNA)、编码神经介素-U-25、NmU-25、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号7中记载的NMU基因(GenBank登录号NM_006688)或其他生物种同源物等。NMU基因可以根据Austin U.，等，1995年，J.Mol.Endocrinol.，第14卷，pp.157-169中记载的方法得到。

本说明书中使用的“E2F3基因”或“E2F3”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号8)表示的E2F转录因子3(E2F transcription factor 3)基因(DNA)、编码E2F-3、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号8中记载的E2F3基因(GenBank登录号NM_001949)或其他生物种同源物等。E2F3基因可以根据Lees J.A.，等，1993，Mol.Cell.Biol.，第13卷，pp.7813-7825中记载的方法得到。

本说明书中使用的“ESR2基因”或“ESR2”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号9)表示的雌激素受体β(estrogen receptor beta)基因(DNA)、编码ER-BETA、Erb、NR3A2、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号9中记载的ESR2基因(GenBank登录号NM_001437)或其他生物种同源物等。ESR2基因可以根据Dotzlaw H.，等，1997年，J.Clin.Endocrinol.Metab.，第82卷，pp.2371-2374中记载的方法得到。

本说明书中使用的“CFDP1基因”或“CFDP1”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号10)表示的颅面发育蛋白1(craniofacial development protein 1)基因(DNA)、编码Bucentaur、BCNT、CP27、p97、SWC5、Yeti、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号10中记载的CFDP1基因(GenBank登录号NM_006324)或其他生物种同源物等。CFDP1基因可以根据Diekwisch T.G.，等，1999年，Gene，第235卷，pp.19-30中记载的方法得到。

本说明书中使用的“HSPC190基因”或“HSPC190”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号11)表示的前细胞凋亡胱天蛋白酶连接蛋白(proapoptotic caspase adaptor protein)基因(DNA)、编码胱天蛋白酶-2结合蛋白、MGC29506、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号11中记载的HSPC190基因(GenBank登录号NM_016459)或其他生物种同源物等。HSPC190基因可以根据Katoh M.，等，2003年，Int.J.Oncol.，第23卷，pp.235-241中记载的方法得到。

本说明书中使用的“COL1A2基因”或“COL1A2”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号12)表示的胶原α-2(I)链前体(collagen alpha-2(I)chain precursor)基因(DNA)、编码α-2型I胶原(Alpha-2 type I collagen)、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号12中记载的COL1A2基因(GenBank登录号Z7461)或其他生物种同源物等。COL1A2基因可以根据Mottes M.，等，1998年，Hum.Mutat.，第12卷，pp.71-72中记载的方法得到。

本说明书中使用的“GCS1基因”或“GCS1”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号13)表示的甘露糖基寡糖葡糖苷酶(Mannosyl-oligosaccharide glucosidase)基因(DNA)、编码加工A-葡糖苷酶I(Processing A-glucosidase I)、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号13中记载的GCS1基因(GenBank登录号NM_006302)或其他生物种同源物等。GCS1基因可以根据Kalz-Fuller B.，等，1995年，Eur.J.Biochem.，第231卷，pp.344-351中记载的方法得到。

本说明书中使用的“PARL基因”或“PARL”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号14)表示的早老素相关菱形样蛋白(presenillins associated rhomboid-like protein)基因(DNA)、编码其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号14中记载的PARL基因(GenBank登录号NM_01862)或其他生物种同源物等。PARL基因可以根据Pellegrini L.，等，2001年，J.Alzheimers Dis.，第3卷，pp.181-190中记载的方法得到。

本说明书中使用的“CELSR2基因”或“CELSR2”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号15)表示的钙粘着蛋白EGF LAG七经G型受体2前体(Cadherin EGF LAG seven-pass G-type receptor 2 precursor)基因(DNA)、编码类表皮生长因子2(epidermal growth factor-like 2)、类表皮生长因子域3(multiple epidermal growth factor-like domains 3)、Flamingo 1、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号15中记载的CELSR2基因(GenBank登录号NM_001408)或其他生物种同源物等。CELSR2基因可以根据Nakayama M.，等，1998年，Genomics，第51卷，pp.27-34中记载的方法得到。

本说明书中使用的“NDRG1基因”或“NDRG1”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号16)表示的N-myc下游调节基因1(N-myc downstream regulated gene 1)基因(DNA)、编码GC4、RTP、NDR1、NMSL、TDD5、CAP43、CMT4D、HMSNL、RIT42、TARG1、PROXY1、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号16中记载的NDRG1基因(GenBank登录号NM_006096)或其他生物种同源物等。NDRG1基因可以根据Kokame K.，等，1996年，J.Biol.Chem.，第271卷，pp.29659-29665中记载的方法得到。

本说明书中使用的“SLC25A44基因”或“SLC25A44”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号17)表示的溶质载体家族25成员44(solute carrier family 25，member 44)基因(DNA)、编码FLJ90431、KIAA0446、RP11-54H19.3、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号17中记载的SLC25A44基因(GenBank登录号NM_014655)或其他生物种同源物等。SLC25A44基因可以根据Haitina T.，等，2006年，Genomics，第88卷，pp.779-790中记载的方法得到。

本说明书中使用的“TUSC2基因”或“TUSC2”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号18)表示的肿瘤抑制因子候选基因2(tumor suppressor candidate 2)基因(DNA)、编码PAP、FUS1、PDAP2、C3orf11、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号18中记载的TUSC2基因(GenBank登录号NM_007275)或其他生物种同源物等。TUSC2基因可以根据Lerman M.I.，等，2000，Cancer Res.，第60卷，pp.6116-6133中记载的方法得到。

本说明书中使用的“SLC4A1基因”或“SLC4A1”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号19)表示的溶质载体家族4阴离子交换体成员1(Solute carrier family 4，anion exchanger，member 1)基因(DNA)、编码DI、FR、SW、WD、WR、AE1、WD1、BND3、EPB3、CD233、EMPB3、RTA1A、MGC116753、MGC126619、MGC126623、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号19中记载的SLC4A1基因(GenBank登录号NM_000342)或其他生物种同源物等。SLC4A1基因可以根据Lux S.E.，等，1189年，Proc.Natl.Acad.Sci.U.S.A.，第86卷，pp.9089-9093中记载的方法得到。

本说明书中使用的“MS4A7基因”或“MS4A7”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号20)表示的跨膜结构域4亚家族A成员7(Membrane-spanning 4-domains，sunfamily A，member 7)基因(DNA)、编码CFFM4、MS4A8、4SPAN2、CD20L4、MGC22368、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号20中记载的MS4A7基因(GenBank登录号NM_206938)或其他生物种同源物等。MS4A7基因可以根据Ishibashi K.，等，2001年，Gene，第264卷，pp.87-93中记载的方法得到。

本说明书中使用的“胸腺素β-4基因”或“TMSB4X”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号21)表示的胸腺素β-4(thymosin beta-4)基因(DNA)、编码FX、TB4X、PTMB4、TMSB4、胸腺素β-4、X-linked 8、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号21中记载的TMSB4X基因(GenBank登录号NM_021109)或其他生物种同源物等。TMSB4X基因可以根据Gondo H.等，1987年，J.Immunol.，第139卷，pp.3840-3848中记载的方法得到。

本说明书中使用的“PRC1基因”或“PRC1”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号22)表示的胞质分裂调控蛋白1(protein regulator of cytokinesis 1)基因(DNA)、编码胞质分裂调控蛋白1(protein regulationg cytokinesis 1)、ASE1、MGC1671、MGC3669、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号22中记载的PRC1基因(GenBank登录号NM_003981)或其他生物种同源物等。PRC1基因可以根据Jiang W.，等，1998年，Mol.Cell.，第2卷，pp.877-885中记载的方法得到。

本说明书中使用的“VCP基因”或“VCP”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号23)表示的缬酪肽蛋白(Valosin-containing protein)基因(DNA)、编码p97、TERA、IBMPFD、MGC8560、MGC131997、MGC148092、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号23中记载的VCP基因(GenBank登录号NM_007126)或其他生物种同源物等。VCP基因可以根据Druck T.，等，1995年，Genomics，第30卷，pp.94-97中记载的方法得到。

本说明书中使用的“RBM9基因”或“RBM9”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号24)表示的RNA结合修饰蛋白9(RNA binding motif protein 9)基因(DNA)、编码RTA、fxh、Fox-2、HNRBP2、HRNBP2、dj106I20.3、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号24中记载的RBM9基因(GenBank登录号NM_014309)或其他生物种同源物等。RBM9基因可以根据Norris J.D.，等，2002年，Mol.Endocrinol.，第16卷，pp.459-468中记载的方法得到。

本说明书中使用的“GPR126基因”或“GPR126”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号25)表示的G蛋白偶联受体126(G protein-coupled receptor 126)基因(DNA)、编码FLJ14937、DKFZp564D0462、VIGR、DREG、PS1TP2、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号25中记载的GPR126基因(GenBank登录号BC075798)或其他生物种同源物等。GPR126基因可以根据Stehlik C.，等，2004年，FEBS Lett.，第569卷，pp.149-155中记载的方法得到。

本说明书中使用的“HOXA10基因”或“HOXA10”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号26)表示的同源异型框基因A10(Homeobox A10)基因(DNA)、编码HOX1.8、MGC12859、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号26中记载的HOXA10基因(GenBank登录号BC013971)或其他生物种同源物等。HOXA10基因可以根据Lowney P.，等，1991年，Nucleic Acid Res.，第19卷，pp.3443-3449中记载的方法得到。

本说明书中使用的“PPP1R1A基因”或“PPP1R1A”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号27)表示的蛋白磷酸酶1调控因子(抑制因子)亚基1A(protein phosphatase 1，regulatory(inhibitor)subunit 1A)基因(DNA)、编码其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号27中记载的PPP1R1A基因(GenBank登录号NM_006741)或蛋白磷酸酶抑制因子1(protein phosphatase inhibitor 1)、IPP-1、I-1、其他生物种同源物等。PPP1R1A基因可以根据Endo S.，等，1996年，Biochemistry，第35卷，pp.5220-5228中记载的方法得到。

本说明书中使用的“MYO9B基因”或“MYO9B”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号28)表示的myosine IXB基因(DNA)、编码MYR5、CELIAC4、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号28中记载的MYO9B基因(GenBank登录号NM_004145)、其他生物种同源物等。MYO9B基因可以根据Wirth J.A.，等，1996年，J.Cell.Sci.，第109卷，pp.653-661中记载的方法得到。

本说明书中使用的“SLCO4C1基因”或“SLCO4C1”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号29)表示的溶质载体有机阴离子转运蛋白家族成员4C1(solute carrier organic anion transporter family，member 4C1)基因(DNA)、编码其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号29中记载的SLCO4C1基因(GenBank登录号NM_180991)或其他生物种同源物等。SLCO4C1基因可以根据Mikkaichi T.，等，2004年，Proc.Natl.Acad.Sci.U.S.A.，第101卷，pp.3569-3574中记载的方法得到。

本说明书中使用的“SERPINB13基因”或“SERPINB13”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号30)表示的HURPIN基因(DNA)、编码HACAT UV-REPRESSIBLE SERPIN、PROTEASE INHIBITOR 13、HEADPIN、SERPIN B13、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号30中记载的SERPINB13基因(GenBank登录号NM_012397)或其他生物种同源物等。SERPINB13基因可以根据Spring P.，等，1999年，Biochem.Biophys.Res.Commun.，第264卷，pp.299-304中记载的方法得到。

本说明书中使用的“SDC2基因”或“SDC2”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号31)表示的Syndecan 2基因(DNA)、编码硫酸乙酰肝素蛋白聚糖1(heparan sulfate proteoglycan 1)、cell-associated、纤维蛋白聚糖(fibroglycan)、人硫酸乙酰肝素蛋白聚糖核心蛋白3’末端(Human heparan sulfate proteoglycan(HSPG)core protein 3’end)、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号31中记载的SDC2基因(GenBank登录号J04621)或其他生物种同源物等。SDC2基因可以根据de Boeck H.，等，1987年，Biochem.J.，第247卷，pp.765-771中记载的方法得到。

本说明书中使用的“TOR1A基因”或“TOR1A”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号32)表示的torsin家族成员A(torsin family，member A)基因(DNA)、编码Dystonia1、DYT1、DQ2、torsin A、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号32中记载的TOR1A基因(GenBank登录号NM_000113)或其他生物种同源物等。TOR1A基因可以根据Ozelius L.J.，等，1997年，Nat.Genet.，第17卷，pp.40-48中记载的方法得到。

本说明书中使用的“RPL18A基因”或“RPL18A”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号33)表示的核糖体蛋白L18a(ribosomal protein L18a)基因(DNA)、编码其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号33中记载的RPL18A基因(GenBank登录号NM_000980)或其他生物种同源物等。RPL18A基因可以根据Adams M.D.，等，1992年，Nature，第355卷，pp.632-634中记载的方法得到。

本说明书中使用的“GAS7基因”或“GAS7”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号34)表示的生长终止特异性蛋白7(Growth-arrest-specific protein 7)基因(DNA)、编码GAS-7、MGC1348、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号34中记载的GAS7基因(GenBank登录号NM_201432)或其他生物种同源物等。GAS7基因可以根据Ju Y.T.，等，1998年，Proc.Natl.Acad.Sci.U.S.A.，第95卷，pp.11423-11428中记载的方法得到。

本说明书中使用的“WISP1基因”或“WISP1”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号35)表示的WNT1诱导信号通道蛋白1(WNT1 inducible signaling pathway protein 1)基因(DNA)、编码CCN4、WISP1c、WISP1i、WISP1tc、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号35中记载的WISP1基因(GenBank登录号NM_003882)或其他生物种同源物等。WISP1基因可以根据Pennica D.，等，1998年，Proc.Natl.Acad.Sci.U.S.A.，第95卷，pp.14717-14722中记载的方法得到。

本说明书中使用的“CACNG4基因”或“CACNG4”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号36)表示的依赖电压的钙离子通道γ-4亚单元(voltage-dependent calcium channel gamma-4 subunit)基因(DNA)、编码神经元电压门控性钙通道γ-4亚单位(Neuronal voltage-gated calcium channel gamma-4subunit)、MGC11138、MGC24983、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号36中记载的CACNG4基因(GenBank登录号NM_014405)或其他生物种同源物等。CACNG4基因可以根据Burgess D.L.，等，1999年，Genome Res.，第9卷，pp.1204-1213中记载的方法得到。

本说明书中使用的“S100P基因”或“S100P”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号37)表示的S-100P蛋白(S-100P protein)基因(DNA)、编码S100钙结合蛋白P(S100calcium binding protein P)、MIG9、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号37中记载的S100P基因(GenBank登录号NM_005980)或其他生物种同源物等。S100P基因可以根据Becker T.，等，1992年，Eur.J.Biochem.，第207卷，pp.541-547中记载的方法得到。

本说明书中使用的“UCHL5基因”或“UCHL5”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号38)表示的泛素羧基末端水解酶L5(ubiquitin carboxyl-terminal hydrolase L5)基因(DNA)、编码UCH37、CGI-70、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号38中记载的UCHL5基因(GenBank登录号NM_015984)或其他生物种同源物等。UCHL5基因可以根据Wicks S.J.，等，2005年，Oncogene，第24卷，pp.8080-8084中记载的方法得到。

本说明书中使用的“APQ3基因”或“APQ3”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号39)表示的水通道蛋白3(Aquaporin 3)基因(DNA)、编码其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号39中记载的APQ3基因(GenBank登录号NM_004925)或其他生物种同源物等。APQ3基因可以根据Kuriyama H.，等，1997年，Biochem.Biophys.Res.Commun.，第241卷，pp.53-58中记载的方法得到。

本说明书中使用的“NSUN5基因”或“NSUN5”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号40)表示的NOL1/NOP2/太阳域家族成员5(NOL1/NOP2/Sun domain family，member 5)基因(DNA)、编码p120、NOL1R、NOL1、MGC986、NSUN5A、WBSCR20、FLJ10267、WBSCR20A、p120(NOL1)、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号40中记载的NSUN5基因(GenBank登录号NM_018044)或其他生物种同源物等。NSUN5基因可以根据Doll A.，等，2001年，Cytogenet.Cell Genet.，第95卷，pp.20-27中记载的方法得到。

本说明书中使用的“B4GALT2基因”或“B4GALT2”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号41)表示的UDP-Gal：βGlcNAc β1，4-半乳糖基转移酶多肽2(UDP-Gal：betaGlcNAc beta 1，4-galactosyltransferase，polypeptide 2)基因(DNA)、编码其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号41中记载的B4GALT2基因(GenBank登录号BC096821)或其他生物种同源物等。B4GALT2基因可以根据Lo N.W.，等，1998年，Glycobiology，第8卷，pp.517-52中记载的方法得到。

本说明书中使用的“CD48基因”或“CD48”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号42)表示的CD48分子(CD48 molecule)基因(DNA)、编码BCM1、BLAST、hCD48、mCD48、BLAST1、SLAMF2、MEM-102、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号42中记载的CD48基因(GenBank登录号NM_001778)或其他生物种同源物等。CD48基因可以根据Wong Y.W.，等，1990年，J.Exp.Med.，第171卷，pp.2115-2130中记载的方法得到。

本说明书中使用的“DAB2基因”或“DAB2”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号43)表示的失效同源物2，促分裂原应答磷蛋白(Disabled homolog 2，mitogen-responsive phosphoprotein)基因(DNA)、编码DOC2、DOC-2、FLJ26626、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号43中记载的DAB2基因(GenBank登录号NM_001343)或其他生物种同源物等。DAB2基因可以根据Albertsen H.M.，等，1996年，Genomics，第33卷，pp.207-213中记载的方法得到。

本说明书中使用的“EBI3基因”或“EBI3”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号44)表示的Epstein-barr病毒诱导(Epstein-barr virus induced)基因(DNA)、编码其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号44中记载的EBI3基因(GenBank登录号NM_005755)或其他生物种同源物等。EBI3基因可以根据Devergne O.，等，1996年，J.Virol.，第70卷，pp.1143-1153中记载的方法得到。

本说明书中使用的“MAP3K12基因”或“MAP3K12”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号45)表示的丝裂原活化蛋白激酶12(mitogen-activated protein kinase 12)基因(DNA)、编码DLK、MUK、ZPK、ZPKP1、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号45中记载的MAP3K12基因(GenBank登录号NM_006301)或其他生物种同源物等。MAP3K12基因可以根据Ready U.R.和Pleasure D.，1994年，Biochem.Biophys.Res.Commun.，第202卷，pp.613-620中记载的方法得到。

本说明书中使用的“SPEN基因”或“SPEN”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号46)表示的spen同源物转录调控因子(spen homolog，transcriptional regulator)基因(DNA)、编码MINT、SHARP、KIAA0929、RP1-134O19.1、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号46中记载的SPEN基因(GenBank登录号NM_015001)或其他生物种同源物等。SPEN基因可以根据Shi T.，等，2001年，Genes Dev.，第15卷，pp.1140-1151中记载的方法得到。

本说明书中使用的“ARHGEF3基因”或“ARHGEF3”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号47)表示的Rho鸟苷酸转换因子(GEF)3(Rho guanine nucleotide exchange factor(GEF)3)基因(DNA)、编码GEF、STA3、XPLN、MGC118905、DKFZP434F2429、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号47中记载的ARHGEF3基因(GenBank登录号NM_019555)或其他生物种同源物等。ARHGEF3基因可以根据Thiesen S.，等，2000年，Biochem.Biophys.Res.Commun.，第273卷，pp.364-369中记载的方法得到。

本说明书中使用的“COL3A1基因”或“COL3A1”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号48)表示的α(III)型前胶原3’区域(3‘region for pro-alpha(III)collagen)基因(DNA)、编码其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号48中记载的COL3A1基因(GenBank登录号X06700)或其他生物种同源物等。COL3A1基因可以根据Loidl H.R.，等，1984年，Nucleic Acids Res.，第16卷，pp.9383-9394中记载的方法得到。

本说明书中使用的“CSTB基因”或“CSTB”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号49)表示的半胱氨酸蛋白酶抑制剂-B(Cystatin-B)基因(DNA)、编码Stefin-B、肝巯基蛋白酶抑制剂(Liver thiol proteinase inhibitor)、CPI-B、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号49中记载的CSTB基因(GenBank登录号NM_000100)或其他生物种同源物等。CSTB基因可以根据Jerala，R.，等.，1988年，FEBS Lett.，第239卷，pp.41-44中记载的方法得到。

本说明书中使用的“SPRR3基因”或“SPRR3”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号50)表示的小脯氨酸丰富蛋白3(Small proline-rich protein 3)基因(DNA)、编码Cornifine、Esophagin、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号50中记载的SPRR3基因(GenBank登录号NM_005416)或其他生物种同源物等。SPRR3基因可以根据AbrahamJ.M.，等，1996年，Cell Growth Differ.，第7卷，pp.855-860中记载的方法得到。

本说明书中使用的“SLIT2基因”或“SLIT2”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号51)表示的Slit同源物2蛋白(Slit homolog 2 protein)基因(DNA)、编码Slit-2、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号51中记载的SLIT2基因(GenBank登录号NM_004787)或其他生物种同源物等。SLIT2基因可以根据Holmes G.P.，等，1998年，Mech.Dev.，第79卷，pp.57-72中记载的方法得到。

本说明书中使用的“CAMK2B基因”或“CAMK2B”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号52)表示的钙/钙调素依赖蛋白激酶II型β链(Calcium/calmodulin-dependent protein kinase type II beta chain)基因(DNA)、编码CaM-激酶II β链(CaM-kinase II beta chain)、CaM激酶IIβ亚单位(CaM kinase II subunit beta)、CaMK-II激酶β亚单位(CaMK-II subunit beta)、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号52中记载的CAMK2B基因(GenBank登录号NM_001220)或其他生物种同源物等。CAMK2B基因可以根据Tombes R.M.，等，1997年，Biochem.Biophys.Acta.，第1355卷，pp.281-292中记载的方法得到。

本说明书中使用的“SLC2A14基因”或“SLC2A14”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号53)表示的溶质载体家族2(Solute carrier family 2)基因(DNA)、编码易化葡萄糖转运成员14(facilitated glucose transporter member 14)、葡萄糖转运蛋白14(Glucose transporter type 14)、GLUT14、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号53中记载的SLC2A14基因(GenBank登录号NM_153449)或其他生物种同源物等。SLC2A14基因可以根据Wu X.等，2002年，Genomics，第80卷，pp.553-557中记载的方法得到。

本说明书中使用的“SATB2基因”或“SATB2”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号54)表示的DNA结合蛋白SATB2(DNA-binding protein SATB2)基因(DNA)、编码特异富含AT序列结合蛋白2(Special AT-rich sequence-binding protein 2)、FLJ21474、KIAA1034、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号54中记载的SATB2基因(GenBank登录号NM_015265)或其他生物种同源物等。SATB2基因可以根据FitzPatrick D.R.，等，2003年，Hum.Mol.Genet.，第12卷，pp.2491-2501中记载的方法得到。

本说明书中使用的“SEPT6基因”或“SEPT6”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号55)表示的Septin-6基因(DNA)、编码KIAA0128、MGC16619、MGC20339、SEP2、SEPT2、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号55中记载的SEPT6基因(GenBank登录号NM_015129)或其他生物种同源物等。SEPT6基因可以根据Sui L.，等，2003年，Biochem.Biophys.Res.Commun.，第304卷，pp.393-398中记载的方法得到。

本说明书中使用的“GALNS基因”或“GALNS”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号56)表示的半乳糖胺(N-乙酰基)-6-硫酸盐硫酸酯酶(Galactosamine(N-acetyl)-6-sulfate sulfatase)基因(DNA)、编码Morquio syndrome、粘多糖贮积症IVA型(mucopolysaccharidosis type IVA)、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号56中记载的GALNS基因(GenBank登录号NM_000512)或其他生物种同源物等。GALNS基因可以根据Nakashima Y.，等，1994年，Genomics，第20卷，pp.99-104中记载的方法得到。

本说明书中使用的“TROAP基因”或“TROAP”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号57)表示的滋养蛋白关联蛋白(Trophinin associated protein)基因(DNA)、编码滋养蛋白辅助蛋白(tastin)、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号57中记载的TROAP基因(GenBank登录号NM_005480)或其他生物种同源物等。TROAP基因可以根据Fukuda M.N.，等，1995年，Genes Dev.，第9卷，pp.1199-1210中记载的方法得到。

本说明书中使用的“XRCC3基因”或“XRCC3”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号58)表示的中国仓鼠细胞X射线修复补缺陷修复3(X-ray repair complementing defective repairin Chinese hamster cells 3)基因(DNA)、编码其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号58中记载的XRCC3基因(GenBank登录号NM_005432)或其他生物种同源物等。XRCC3基因可以根据Tebbs R.S.，等，1995年，Proc.Natl.Acad.Sci.U.S.A.，第92卷，pp.6354-6358中记载的方法得到。

本说明书中使用的“FGF3基因”或“FGF3”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号59)表示的成纤维生长因子3(fibroblast growth factor 3)基因(DNA)、编码鼠乳腺肿瘤病毒整合位点(v-int-2)癌基因同源物(murine mammary tumor virus integration site(v-int-2)oncogene homolog)、INT-2、HBGF-3、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号59中记载的FGF3基因(GenBank登录号NM_005247)或其他生物种同源物等。FGF3基因可以根据Brookes S.，等，1989年，Oncogene，第4卷，pp.429-436中记载的方法得到。

本说明书中使用的“EIF4EBP2基因”或“EIF4EBP2”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号60)表示的真核细胞翻译起始因子4E结合蛋白(eukaryotic translation initiation factor 4E binding protein)基因(DNA)、编码4EBP2、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号60中记载的EIF4EBP2基因(GenBank登录号NM_004096)或其他生物种同源物等。EIF4EBP2基因可以根据Pause A.，等，1994，Nature.，第371卷，pp.762-767中记载的方法得到。Kawamata，H.等，2003年，Cancer Science，第94卷，pp.699-706中公开了EIF4EBP2基因在食管癌株化细胞的转移性亚株中表达增加。

本说明书中使用的“RRM1基因”或“RRM1”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号61)表示的核苷酸还原酶M1多肽(ribonucleotide reductase M1 polypeptide)基因(DNA)、编码R1、RR1、RIR1、其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号61中记载的RRM1基因(GenBank登录号NM_001033)或其他生物种同源物等。RRM1基因可以根据Parker N.J.，等，1994年，Genomics，第19卷，pp.91-96中记载的方法得到。

本说明书中使用的“M6PR基因”或“M6PR”的术语，在没有被序列号定义的情况下，包括特定碱基序列(序列号62)表示的甘露糖-6-磷酸受体(阳离子依赖)(mannose-6-phosphate receptor(cation dependent))基因(DNA)、编码其同源物、变异体及衍生物等的基因(DNA)。具体包括序列号62中记载的M6PR基因(GenBank登录号NM_002355)或其他生物种同源物等。M6PR基因可以根据Pohlmann R.，等，1987年，Proc.Natl.Acad.Sci.U.S.A.，第84卷，pp.5575-5579中记载的方法得到。

本发明提供对诊断及治疗食管癌有用的疾病确定用组合物及使用了该组合物的食管癌确定(或检测)方法，由此具有以下独特的作用效果，即，提供具有特异性且预测率高、及迅速、简单的确定食管癌的方法。

本说明书包括作为本申请优先权基础的日本国专利申请2008-133491号说明书及/或附图中记载的内容。

附图说明

[图1]表示组合使用与表1中记载的基因对应的序列号63～124的多核苷酸时，存在食管癌细胞的检出率。纵轴表示能够检测到样品中存在食管癌组织的准确率，横轴表示检测食管癌所需要的基因总数，该基因数按照表1中记载的序列号依次增加。

[图2]表示组合使用与表1中记载的基因对应的序列号63～124的多核苷酸时，存在食管癌细胞的检出率。纵轴表示样品中存在食管癌组织的准确率，横轴从左依次表示以由食管癌组织得到的总RNA与由不含食管癌的组织得到的总RNA的比率为9∶1、8∶2、7∶3、6∶4、5∶5、4∶6、3∶7、2∶8、1∶9混合得到的RNA混合物的数据。

[图3]表示组合使用与表1中记载的基因对应的序列号63～124的多核苷酸时，存在来自活检组织的食管癌细胞的检出率。纵轴表示活检样品中存在食管癌组织的准确率，横轴的左边的框表示由利用内窥镜采集的食管癌患者的不含食管癌的活检组织得到的数据，横轴的右边的框表示由利用内窥镜采集的食管癌患者的含有食管癌的活检组织得到的数据。

[图4]表示组合使用与国际公开第2006/118308号中记载的食管癌诊断用组合物对应的多核苷酸时，存在食管癌细胞的检出率。辨别机按照专利文献6所述的方法，制作癌辨别用辨别机，辨别活检样品中存在食管癌组织的准确率。纵轴表示活检样品中存在食管癌组织的准确率，横轴的左边的框表示由利用内窥镜采集的食管癌患者的不含食管癌的活检组织得到的数据，横轴的右边的框表示由利用内窥镜采集的食管癌患者的含有食管癌的活检组织得到的数据。

[图5]表示组合使用与国际公开第2006/118308号中记载的食管癌诊断用组合物对应的多核苷酸时，存在食管癌细胞的检出率。辨别机按照专利文献6所述的方法，制作非癌辨别用辨别机，辨别活检样品中存在食管癌组织的准确率。纵轴表示活检样品中存在食管癌组织的准确率，横轴的左边的框表示由利用内窥镜采集的食管癌患者的不含食管癌的活检组织得到的数据，横轴的右边的框表示由利用内窥镜采集的食管癌患者的含有食管癌的活检组织得到的数据。

[图6]表示组合使用与国际公开第2006/118308号中记载的食管癌诊断用组合物对应的多核苷酸时，存在食管癌细胞的检出率。利用本说明书所述的方法制作辨别机，辨别活检样品中存在食管癌组织的准确率。纵轴表示活检样品中存在食管癌组织的准确率，横轴的左边的框表示由利用内窥镜采集的食管癌患者的不含食管癌的活检组织得到的数据，横轴的右边的框表示由利用内窥镜采集的食管癌患者的含有食管癌的活检组织得到的数据。

具体实施方式

以下进一步具体地说明本发明。

1.食管癌靶核酸

作为在使用本发明上述定义的食管癌诊断用组合物及试剂盒用于确定存在及/或不存在食管癌或食管癌细胞的食管癌标记物的靶核酸，例如包括含有序列号1～62表示的碱基序列的人类基因(即，EYA2、SERF1A、IGHG1、ITSN2、RAB11FIP5、HSPA1A、NMU、E2F3、ESR2、CFDP1、HSPC190、COL1A2、GCS1、PARL、CELSR2、NDRG1、SLC25A44、TUSC2、SLC4A1、MS4A7、TMSB4X、PRC1、VCP、RBM9、GPR126、HOXA10、PPP1R1A、MYO9B、SLCO4C1、SERPINB13、SDC2、TOR1A、RPL18A、GAS7、WISP1、CACNG4、S100P、UCHL5、AQP3、NSUN5、B4GALT2、CD48、DAB2、EBI3、MAP3K12、SPEN、ARHGEF3、COL3A1、CSTB、SPRR3、SLIT2、CAMK2B、SLC2A14、SATB2、SEPT6、GALNS、TROAP、XRCC3、FGF3、EIF4EBP2、RRM1及M6PR)、其同源物、其转录产物或cDNA、或其变异体或衍生物。此处，基因、同源物、转录产物、cDNA、变异体及衍生物的含义与上述定义相同。优选的靶核酸为含有序列号1～62表示的碱基序列的人类基因、其转录产物或cDNA，较优选该转录产物或cDNA。

在本发明中，成为食管癌靶的上述基因在患有食管癌的受试者中的表达水平，与健康受试者相比均增加/降低(参见下述实施例的表1)。

第1靶核酸是EYA2基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于EYA2基因或其转录产物的表达增加可以作为食管癌的标志(marker)的报道。

第2靶核酸是SERF1A基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于SERF1A基因或其转录产物的表达增加可以作为食管癌的标志的报道。

第3靶核酸是IGHG1基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于IGHG1基因或其转录产物的表达增加可以作为食管癌的标志的报道。

第4靶核酸是ITSN2基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于ITSN2基因或其转录产物的表达增加可以作为食管癌的标志的报道。

第5靶核酸是RAB11FIP5基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于RAB11FIP5基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第6靶核酸是HSPA1A基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于HSPA1A基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第7靶核酸是NMU基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于NMU基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第8靶核酸是E2F3基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于E2F3基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第9靶核酸是ESR2基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于ESR2基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第10靶核酸是CFDP1基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于CFDP1基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第11靶核酸是HSPC190基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于HSPC190基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第12靶核酸是COL1A2基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于COL1A2基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第13靶核酸是GCS1基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于GCS1基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第14靶核酸是PARL基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于PARL基因及其转录产物的表达减少可以作为食管癌的标志的报道。

第15靶核酸是CELSR2基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于CELSR2基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第16靶核酸是NDRG1基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于NDRG1基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第17靶核酸是SLC25A4基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于SLC25A4基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第18靶核酸是TUSC2基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于TUSC2基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第19靶核酸是SLC4A1基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于SLC4A1基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第20靶核酸是MS4A7基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于MS4A7基因及其转录产物的表达减少可以作为食管癌的标志的报道。

第21靶核酸是TMSB4X基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于TMSB4X基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第22靶核酸是PRC1基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于PRC1基因及其转录产物的表达减少可以作为食管癌的标志的报道。

第23靶核酸是VCP基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于VCP基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第24靶核酸是RBM9基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于RBM9基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第25靶核酸是GPR126基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于GPR126基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第26靶核酸是HOXA10基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于HOXA10基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第27靶核酸是PPP1R1A基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于PPP1R1A基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第28靶核酸是MYO9B基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于MYO9B基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第29靶核酸是SLCO4C1基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于SLCO4C1基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第30靶核酸是SERPINB13基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于SERPINB13基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第31靶核酸是SDC2基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于SDC2基因及其转录产物的表达减少可以作为食管癌的标志的报道。

第32靶核酸是TOR1A基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于TOR1A基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第33靶核酸是RPL18A基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于RPL18A基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第34靶核酸是GAS7基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于GAS7基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第35靶核酸是WISP1基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于WISP1基因及其转录产物的表达减少可以作为食管癌的标志的报道。

第36靶核酸是CACNG4基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于CACNG4基因及其转录产物的表达增加可以作为食管癌的标志的报道。

第37靶核酸是S100P基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于S100P基因及其转录产物的表达减少可以作为食管癌的标志的报道。

第38靶核酸是UCHL5基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于UCHL5基因及其转录产物的表达减少可以作为食管癌的标志的报道。

第39靶核酸是AQP3基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知AQP3基因及其转录产物的表达可以作为食管癌的标志(WO 06118308)。

第40靶核酸是NSUN5基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知NSUN5基因及其转录产物的表达可以作为食管癌的标志(WO 06118308)。

第41靶核酸是B4GALT2基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知B4GALT2基因及其转录产物的表达可以作为食管癌的标志(WO 06118308)。

第42靶核酸是CD48基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知CD48基因及其转录产物的表达可以作为食管癌的标志(WO 06118308)。

第43靶核酸是DAB2基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知DAB2基因及其转录产物的表达可以作为食管癌的标志(WO 06118308)。

第44靶核酸是EBI3基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知EBI3基因及其转录产物的表达可以作为食管癌的标志(WO 06118308)。

第45靶核酸是MAP3K12基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知MAP3K12基因及其转录产物的表达可以作为食管癌的标志(WO 06118308)。

第46靶核酸是SPEN基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知SPEN基因及其转录产物的表达可以作为食管癌的标志(WO 06118308)。

第47靶核酸是ARHGEF3基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知ARHGEF3基因及其转录产物的表达可以作为食管癌的标志(WO 06118308)。

第48靶核酸是COL3A1基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知COL3A1基因及其转录产物的表达可以作为食管癌的标志(Su，H.，等，2003年，Cancer Research，第63卷，pp.3872-3876)。

第49靶核酸是CSTB基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知CSTB基因或其转录产物的表达可以作为食管癌的标志(WO 03042661、Shiraishi，T.，等，1998年，International Journal of Cancer，第79卷，pp.175-178)。

第50靶核酸是SPRR3基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知SPRR3基因为食管癌的标志(WO 06118308、国际公开WO 2003/042661说明书、Chem，B.S.，等，2000年，Carcinogenesis，第21卷，p2147-2150、Abraham，J.M.，等，1996年，Cell Growth & Differentiation，第7卷，p855-860)。

第51靶核酸是SLIT2基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知SLIT2基因为食管癌的标志(WO 06118308)。

第52靶核酸是CAMK2B基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知CAMK2B基因为食管癌的标志(WO 06118308)。

第53靶核酸是SLC2A14基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知SLC2A14基因为食管癌的标志(WO 06118308)。

第54靶核酸是SATB2基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知SATB2基因为食管癌的标志(WO 06118308)。

第55靶核酸是SEPT6基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。迄今为止还没有关于SEPT6基因及其转录产物的表达减少可以作为食管癌的标志的报道。

第56靶核酸是GALNS基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知GALNS基因为食管癌的标志(WO 06118308)。

第57靶核酸是TROAP基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知TROAP基因为食管癌的标志(WO 06118308)。

第58靶核酸是XRCC3基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知XRCC3基因为食管癌的标志(WO 06118308)。

第59靶核酸是FGF3基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知FGF3基因为食管癌的标志(WO 06118308)。

第60靶核酸是EIF4EBP2基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知EIF4EBP2基因为食管癌的标志(WO 06118308)。

第61靶核酸是RRM1基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知RRM1基因为上皮系恶性肿瘤的标志(WO 06119464A1)。

第62靶核酸是M6PR基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。已知M6PR基因为食管癌的标志(WO 06118308)。

2.食管癌相关靶多肽

作为使用本发明上述定义的食管癌诊断用组合物及试剂盒用于确定食管癌或食管癌细胞存在及/或不存在的食管癌标记物的靶核酸，包括例如由含有序列号1～62表示的碱基序列的人类基因(即，分别为EYA2、SERF1A、IGHG1、ITSN2、RAB11FIP5、HSPA1A、NMU、E2F3、ESR2、CFDP1、HSPC190、COL1A2、GCS1、PARL、CELSR2、NDRG1、SLC25A44、TUSC2、SLC4A1、MS4A7、TMSB4X、PRC1、VCP、RBM9、GPR126、HOXA10、PPP1R1A、MYO9B、SLCO4C1、SERPINB13、SDC2、TOR1A、RPL18A、GAS7、WISP1、CACNG4、S100P、UCHL5、AQP3、NSUN5、B4GALT2、CD48、DAB2、EBI3、MAP3K12、SPEN、ARHGEF3、COL3A1、CSTB、SPRR3、SLIT2、CAMK2B、SLC2A14、SATB2、SEPT6、GALNS、TROAP、XRCC3、FGF3、EIF4EBP2、RRM1、及M6PR)编码的多肽，例如含有序列号125～186表示的氨基酸序列的人多肽、其同源物、或其变异体或衍生物。此处，多肽、同源物、变异体及衍生物的含义与上述定义相同。优选的靶多肽是含有序列号125～186表示的氨基酸序列的人多肽。

本发明中，成为食管癌的靶的上述多肽与对应的基因及其转录产物的表达量相同地都具有以下特征：食管组织中的表达量低于其在非癌组织中的表达量，或血液中的该多肽的水平在患有食管癌的受试者中与健康受试者相比增加或下降。

3.食管癌诊断用组合物

3.1核酸

本发明中，能用于确定或诊断食管癌的核酸组合物能够定性及/或定量地测定食管癌的靶核酸的存在、表达水平或存在量，作为食管癌的靶核酸，为来自人的EYA2、SERF1A、IGHG1、ITSN2、RAB11FIP5、HSPA1A、NMU、E2F3、ESR2、CFDP1、HSPC190、COL1A2、GCS1、PARL、CELSR2、NDRG1、SLC25A44、TUSC2、SLC4A1、MS4A7、TMSB4X、PRC1、VCP、RBM9、GPR126、HOXA10、PPP1R1A、MYO9B、SLCO4C1、SERPINB13、SDC2、TOR1A、RPL18A、GAS7、WISP1、CACNG4、S100P、UCHL5、AQP3、NSUN5、B4GALT2、CD48、DAB2、EBI3、MAP3K12、SPEN、ARHGEF3、COL3A1、CSTB、SPRR3、SLIT2、CAMK2B、SLC2A14、SATB2、SEPT6、GALNS、TROAP、XRCC3、FGF3、EIF4EBP2、RRM1及M6PR基因、其同源物、其转录产物或cDNA、或其变异体或衍生物。

上述靶核酸在患有食管癌的受试者中的表达水平与在健康受试者中的表达水平相比增加或降低。因此，本发明的组合物能够有效地用于测定食管癌组织和正常食管组织中的靶核酸的表达水平，并对其进行比较。

本发明中能使用的组合物包括选自下述多核苷酸组的1种或多种(优选3个以上、较优选5个以上)多核苷酸的组合，所述多核苷酸组为患有食管癌的患者的生物组织中含有序列号1～62表示的碱基序列的多核苷酸组及其互补多核苷酸组；在严格条件下与下述DNA分别杂交的多核苷酸组及其互补多核苷酸组，所述DNA由与上述碱基序列互补的碱基序列组成；及上述多核苷酸组的碱基序列中含有15个以上、优选20个以上、较优选25个以上连续碱基的多核苷酸组。

具体而言，本发明的组合物可以含有以下1种或多种(优选3个以上、较优选5个以上)多核苷酸或其片段。

(1)由序列号1～62表示的碱基序列组成的多核苷酸组、其变异体、或其含有15个以上连续碱基的片段。

(2)含有序列号1～62表示的碱基序列的多核苷酸组。

(3)由序列号1～62表示的碱基序列组成的多核苷酸组、其变异体、或其含有15个以上连续碱基的片段。

(4)含有序列号1～38表示的碱基序列的多核苷酸组。

(5)由与序列号1～38表示的碱基序列互补的碱基序列组成的多核苷酸组、其变异体、或其含有15个以上连续碱基的片段。

(6)含有与序列号1～38表示的碱基序列互补的碱基序列的多核苷酸组。

(7)在严格条件下，与下述DNA杂交的多核苷酸组、或其含有15个以上连续碱基的片段，上述DNA由与序列号1～38表示的各碱基序列互补的碱基序列组成。

(8)在严格条件下与由序列号1～38表示的各碱基序列组成的DNA杂交的多核苷酸组、或其含有15个以上连续碱基的片段。

(9)由序列号39～62表示的碱基序列组成的多核苷酸组、其变异体、或其含有15个以上连续碱基的片段。

(10)含有序列号39～62表示的碱基序列的多核苷酸组。

(11)由与序列号39～62表示的碱基序列互补的碱基序列组成的多核苷酸组、其变异体、或含有15个以上连续碱基的片段。

(12)含有与序列号39～62表示的碱基序列互补的碱基序列的多核苷酸组。

(13)在严格条件下，与下述DNA杂交的多核苷酸组、或其含有15个以上连续碱基的片段，上述DNA由与序列号39～62表示的各碱基序列互补的碱基序列组成。

(14)在严格条件下，与由序列号39～62表示的各碱基序列组成的DNA杂交的多核苷酸组、或其含有15个以上连续碱基的片段。

上述(1)～(14)的多核苷酸的片段可以含有各多核苷酸的碱基序列中的例如下述范围的连续碱基数，但并不限定于此，所述范围包括15～序列的全部碱基数、15～5000个碱基、15～4500个碱基、15～4000个碱基、15～3500个碱基、15～3000个碱基、15～2500个碱基、15～2000个碱基、15～1500个碱基、15～1000个碱基、15～900个碱基、15～800个碱基、15～700个碱基、15～600个碱基、15～500个碱基、15～400个碱基、15～300个碱基、15～250个碱基、15～200个碱基、15～150个碱基、15～140个碱基、15～130个碱基、15～120个碱基、15～110个碱基、15～100个碱基、15～90个碱基、15～80个碱基、15～70个碱基、15～60个碱基、15～50个碱基、15～40个碱基、15～30个碱基或15～25个碱基；25～序列的全部碱基数、25～1000个碱基、25～900个碱基、25～800个碱基、25～700个碱基、25～600个碱基、25～500个碱基、25～400个碱基、25～300个碱基、25～250个碱基、25～200个碱基、25～150个碱基、25～140个碱基、25～130个碱基、25～120个碱基、25～110个碱基、25～100个碱基、25～90个碱基、25～80个碱基、25～70个碱基、25～60个碱基、25～50个碱基或25～40个碱基；50～序列的全部碱基数、50～1000个碱基、50～900个碱基、50～800个碱基、50～700个碱基、50～600个碱基、50～500个碱基、50～400个碱基、50～300个碱基、50～250个碱基、50～200个碱基、50～150个碱基、50～140个碱基、50～130个碱基、50～120个碱基、50～110个碱基、50～100个碱基、50～90个碱基、50～80个碱基、50～70个碱基或50～60个碱基；60～序列的全部碱基数、60～1000个碱基、60～900个碱基、60～800个碱基、60～700个碱基、60～600个碱基、60～500个碱基、60～400个碱基、60～300个碱基、60～250个碱基、60～200个碱基、60～150个碱基、60～140个碱基、60～130个碱基、60～120个碱基、60～110个碱基、60～100个碱基、60～90个碱基、60～80个碱基或60～70个碱基等。

根据本发明的实施方案，含有序列号1～62表示的碱基序列的多核苷酸的片段，优选分别含有序列号63～124表示的碱基序列或其互补序列、或其连续15个碱基以上的部分序列。

本发明的组合物中例如含有以下多核苷酸。

(1)序列号1～38表示的碱基序列或其互补序列的各序列中，含有15个以上连续碱基的多核苷酸。

(2)序列号1～38表示的碱基序列或其互补序列的各序列中，含有60个以上连续碱基的多核苷酸。

(3)序列号39～62表示的碱基序列或其互补序列中，含有15个以上连续碱基的多核苷酸。

(4)序列号39～62表示的碱基序列或其互补序列中，含有60个以上连续碱基的多核苷酸。

(5)序列号1～38表示的碱基序列中，分别含有序列号63～100表示的碱基序列、且含有60个以上连续碱基的多核苷酸。

(6)与序列号1～38表示的碱基序列互补的序列中，分别含有与序列号63～100表示的碱基序列互补的序列、且含有60个以上连续碱基的多核苷酸。

(7)序列号39～62表示的碱基序列中，含有序列号101～124表示的碱基序列、且含有60个以上连续碱基的多核苷酸。

(8)与序列号39～62表示的碱基序列互补的序列中，分别含有与序列号101～124表示的碱基序列互补的序列、且含有60个以上连续碱基的多核苷酸。

本发明中使用的上述多核苷酸类或其片段类均可以为DNA或RNA。

作为本发明的组合物的多核苷酸可以使用DNA重组技术、PCR法、使用DNA/RNA自动合成仪的方法等常规技术进行制作。

DNA重组技术及PCR法可以使用例如Ausubel等，Current Protocols in Molecular Biology，John Willey & Sons，US(1993)；Sambrook等，Molecular Cloning A Laboratory Manual，Cold Spring Harbor Laboratory Press，US(1989)等中记载的技术。

来自人的EYA2、SERF1A、IGHG1、ITSN2、RAB11FIP5、HSPA1A、NMU、E2F3、ESR2、CFDP1、HSPC190、COL1A2、GCS1、PARL、CELSR2、NDRG1、SLC25A44、TUSC2、SLC4A1、MS4A7、TMSB4X、PRC1、VCP、RBM9、GPR126、HOXA10、PPP1R1A、MYO9B、SLCO4C1、SERPINB13、SDC2、TOR1A、RPL18A、GAS7、WISP1、CACNG4、S100P、UCHL5、AQP3、NSUN5、B4GALT2、CD48、DAB2、EBI3、MAP3K12、SPEN、ARHGEF3、COL3A1、CSTB、SPRR3、SLIT2、CAMK2B、SLC2A14、SATB2、SEPT6、GALNS、TROAP、XRCC3、FGF3、EIF4EBP2、RRM1及M6PR基因是公知的，如上所述，其获得方法也是已知的。所以，可以通过克隆上述基因制作作为本发明的组合物的多核苷酸。

构成本发明的组合物的多核苷酸可以使用DNA自动合成装置化学合成得到。通常可以使用亚磷酰胺法进行合成，利用该方法可以自动合成至约100个碱基的单链DNA。DNA自动合成装置可以从例如Polygen公司、ABI公司、Applied BioSystems公司等购买。

或者，本发明的多核苷酸也可以通过cDNA克隆法制作。可以从表达作为本发明中的靶的上述基因的食管组织等生物组织中提取总RNA，将该总RNA用寡聚dT纤维素柱处理得到聚A(+)RNA，通过RT-PCR法由该聚A(+)RNA制作cDNA库，通过杂交筛选、表达筛选、抗体筛选等进行筛选，从该cDNA库得到目标cDNA克隆。也可以根据需要，利用PCR法扩增cDNA克隆。可以基于序列号1～62表示的碱基序列，从15～100个连续碱基序列中选择并合成探针或引物。例如在Sambrook，J.& Russel，D.著，Molecular Cloning，A LABORATORY MANUAL、Cold Spring Harbor Laboratory Press、2001年1月15日出版，第1卷7.42～7.45，第2卷8.9～8.17中记载了cDNA克隆技术。

3.2食管癌诊断用试剂盒(抗体)

本发明还提供一种食管癌诊断用试剂盒，所述食管癌诊断用试剂盒含有针对下述多肽的1种或多种(优选3个以上)的抗体、其片段、或其化学修饰衍生物，所述多肽具有序列号125～162表示的氨基酸序列。

本发明的试剂盒可以进一步含有针对下述多肽的1种或多种(优选2个以上)的抗体、其片段、或其化学修饰衍生物，所述多肽具有序列号163～186表示的氨基酸序列。通过并用上述抗体，可以提高用于预后预测的准确度。

即，根据本发明，为了检测作为食管癌标记物的、被上述EYA2、SERF1A、IGHG1、ITSN2、RAB11FIP5、HSPA1A、NMU、E2F3、ESR2、CFDP1、HSPC190、COL1A2、GCS1、PARL、CELSR2、NDRG1、SLC25A44、TUSC2、SLC4A1、MS4A7、TMSB4X、PRC1、VCP、RBM9、GPR126、HOXA10、PPP1R1A、MYO9B、SLCO4C1、SERPINB13、SDC2、TOR1A、RPL18A、GAS7、WISP1、CACNG4、S100P、UCHL5、AQP3、NSUN5、B4GALT2、CD48、DAB2、EBI3、MAP3K12、SPEN、ARHGEF3、COL3A1、CSTB、SPRR3、SLIT2、CAMK2B、SLC2A14、SATB2、SEPT6、GALNS、TROAP、XRCC3、FGF3、EIF4EBP2、RRM1及M6PR基因编码的多肽、其同源物、或其变异体或衍生物，可以组合使用1种或多种针对上述多肽的抗体。

上述多肽可以利用DNA重组技术得到。例如，将如上所述得到的cDNA克隆插入表达载体中，通过培养由该载体转化或转染的原核或真核宿主细胞，可以从该细胞或培养上清得到上述多肽。载体及表达系统可以从Novagen公司、宝酒造、第一化学药品、Qiagen公司、Stratagene公司、Promega公司、Roche Diagnositics公司、Invitrogen公司、Genetics Institute公司、Amersham Bioscience公司等购买。作为宿主细胞，可以使用细菌等原核细胞(例如大肠杆菌、枯草菌)、酵母(例如酿酒酵母)、昆虫细胞(例如Sf细胞)、哺乳动物细胞(例如COS、CHO、BHK)等。载体中除含有编码该多肽的DNA以外，还可以含有调节成分，例如启动子、增强子、多聚腺苷酸化信号、核糖体结合部位、复制起始点、终止子、选择标记等。为了容易进行多肽的精制，可以将多肽制成在多肽的C末端或N末端结合了标记肽的融合多肽。作为代表性的标记肽，可以举出6～10个残基的组氨酸重复序列、FLAG、myc肽、GFP多肽等，但标记肽并不限定于此。另外，DNA重组技术记载于Sambrook，J.& Russel，D.(参见上述记载)。

在不结合标记肽的状态下制备本发明的多肽时，作为其精制方法，例如可以举出利用离子交换色谱法的方法。除此之外，还可以使用组合凝胶过滤或疏水性色谱、等电点色谱等的方法。另一方面，在该蛋白上结合组氨酸重复序列、FLAG、myc、GFP等标记肽时，可以举出适合通常使用的各种标记肽的亲和色谱法。可以构建能容易分离·精制的表达载体。特别是构建能以多肽和标记肽的融合多肽的状态进行表达的表达载体，利用基因工程技术制备该多肽时，也可容易地进行分离·精制。

识别如上所述得到的多肽的抗体可以通过抗体的抗原结合部位特异性结合该多肽。具体而言可以将具有序列号125～186的氨基酸序列的多肽或其片段、其变异体多肽或融合多肽等，分别用作用于产生免疫反应性抗体的免疫原。

更具体而言，多肽、片段、变异体、融合多肽等含有促使抗体形成的抗原决定基或抗原决定部位，上述抗原决定基或抗原决定部位可以是直链，也可以是较高级结构(断开)。需要说明的是，该抗原决定基或抗原决定部位可以通过本领域已知的所有方法进行确定。

利用本发明的多肽能诱导所有种类的抗体。如果分离该多肽的全部或一部分或抗原决定部位，则使用常规技术即可制备多克隆抗体及单克隆抗体中的任一个。方法例如包括Kennet等(主编)，Monoclonal Antibodies，Hybridomas：A New Dimension in Biological Analyses，Ple num Press，NewYork，1980中列举的方法。

作为本发明的抗体，只要是能与本发明的靶多肽或其片段特异性结合的抗体即可，没有特别限定，可以使用单克隆抗体，也可以使用多克隆抗体，优选使用单克隆抗体。另外，本发明抗体的球蛋白类型只要具有上述特征的抗体即可，没有特别限定，可以是IgG、IgM、IgA、IgE、IgD中的任一个。

<单克隆抗体的制作>

(1)免疫及抗体产生细胞的采集

对哺乳动物例如大鼠、小鼠(例如近交系小鼠Balb/c)、家兔等给与由靶多肽组成的免疫原。免疫原的1次给药量可以根据免疫动物种类、给药途径等适当确定，每1只动物给药约50～200μg。主要通过在皮下、腹腔内注入免疫原进行免疫。另外，免疫的间隔没有特别限定，初次免疫后，间隔数日至数周，优选间隔1～4周，进行2～10次、优选3～4次追加免疫。初次免疫后，利用ELISA(酶联免疫吸附测定(Enzyme-Linked Immuno Sorbent Assay))法等反复测定免疫动物血清中的抗体值，抗体值达到平台时，向静脉内或腹腔内注射免疫原，进行最终免疫。从最终免疫日起2～5日后，优选3日后，采集抗体产生细胞。作为抗体产生细胞，可以举出脾脏细胞、淋巴结细胞、末梢血细胞等，优选脾脏细胞或局部淋巴结细胞。

(2)细胞融合

制作生产对各靶多肽特异的单克隆抗体的杂交瘤细胞株。该杂交瘤可以通过常规技术进行生产并鉴定。用于生产该杂交瘤细胞株的方法之一包括：用本发明的蛋白质免疫动物，从被免疫的动物中采集脾脏细胞，使该脾脏细胞与骨髓瘤细胞株融合，由此生成杂交瘤细胞，鉴定生产与该酶结合的单克隆抗体的杂交瘤细胞株。作为与抗体产生细胞融合的骨髓瘤细胞株，可以使用小鼠等动物的通常能购买到的细胞株。作为使用的细胞株，优选具有下述性质的细胞株，即具有药剂选择性，并具有在未融合状态下在HAT选择培养基(含有次黄嘌呤、氨基蝶呤、胸腺嘧啶)中不能存活，只有在与抗体产生细胞融合的状态下能存活的性质。另外，细胞株优选来自与免疫动物同种系的动物的细胞。作为骨髓瘤细胞株的具体例，可以举出来自BALB/c小鼠的次黄嘌呤·鸟嘌呤·磷酸核糖基·转换酶(HGPRT)缺损细胞株即P3X63-Ag.8株(ATCC TIB9)等。

接下来使上述骨髓瘤细胞株与抗体产生细胞进行细胞融合。细胞融合如下进行：在不含有血清的DMEM、RPMI-1640培养基等动物细胞培养用培养基中，以约1∶1～20∶1的比例混合抗体产生细胞和骨髓瘤细胞株，在细胞融合促进剂的存在下进行融合反应。作为细胞融合促进剂，可以使用浓度约为10～80％、平均分子量为1500～4000道尔顿的聚乙二醇等。另外，因情况的不同，为了提高融合效率，可以并用二甲基亚砜等辅助剂。还可以使用利用电刺激(例如电穿孔)的市售的细胞融合装置使抗体产生细胞和骨髓瘤细胞株融合。

(3)杂交瘤的筛选及克隆

从细胞融合处理后的细胞中筛选目标杂交瘤。作为筛选方法，使用例如含有胎牛血清的RPMI-1640培养基等适当稀释细胞悬浮液后，以约200万个细胞/孔左右接种到微孔板上，向各孔中加入选择培养基，并在以后适当更换选择培养基，进行培养。培养温度为20～40℃、优选为约37℃。骨髓瘤细胞是HGPRT缺损株或胸苷激酶缺损株时，通过使用含有次黄嘌呤·氨基蝶呤·胸腺嘧啶核苷的选择培养基(HAT培养基)，能够仅选择性培养、增殖具有抗体产生能力的细胞与骨髓瘤细胞株的杂交瘤。结果在用选择性培养基培养开始后，生长约14天左右的细胞可以作为杂交瘤被得到。

接下来，在进行了增殖的杂交瘤的培养上清中对是否存在目标抗体进行筛选。杂交瘤的筛选可以按照常规方法进行，没有特别限定。例如，采集作为杂交瘤培养的包含在孔中的培养上清的一部分，通过酶免疫测定法(EIA：Enzyme Immuno Assay、及ELISA)、放射免疫测定法(RIA：Radio Immuno Assay)等进行筛选。融合细胞的克隆通过有限稀释法等进行，从而最终确立产生单克隆抗体的细胞即杂交瘤。本发明的杂交瘤如下所述，在RPMI-1640、DMEM等基本培养基中的培养稳定，并能生产、分泌与靶多肽特异性反应的单克隆抗体。

(4)抗体的回收

单克隆抗体可以利用常规技术进行回收。即，作为从确立的杂交瘤中采集单克隆抗体的方法，可以采用通常的细胞培养法或腹水形成法等。采用细胞培养法时，在通常的培养条件(例如，37℃、5％CO₂浓度)下，在含有10％胎牛血清的RPMI-1640培养基、MEM培养基或无血清培养基等动物细胞培养基中培养杂交瘤2～10日，从该培养上清中获得抗体。采用腹水形成法的情况下，向与来自骨髓瘤细胞的哺乳动物同种系的动物的腹腔内给与约1000万个杂交瘤，使杂交瘤大量增殖。并在1～2周后采集腹水或血清。

对于上述抗体的采集方法，在需要精制抗体的情况下，可以通过适当选择硫酸铵盐析法、离子交换色谱法、亲和色谱法、凝胶色谱法等公知的方法，或组合使用上述方法，得到精制的单克隆抗体。

<多克隆抗体的制作>

制作多克隆抗体时，与上述相同，免疫家兔等动物，从最终免疫日起6～60天后，利用酶免疫测定法(EIA及ELISA)、放射免疫测定法(RIA)等测定抗体值，在显示最大抗体值的当天采血，得到抗血清。然后，利用ELISA法等测定抗血清中的多克隆抗体的反应性。

<检测法>

根据本发明，提供一种在体外确定受试者的样品试样中不含食管癌细胞/或含有食管癌细胞的方法，所述方法包括：使用本发明的上述抗体，在体外测定来自受试者的食管癌细胞、血液等生物试样中的该多肽水平。

作为免疫学测定方法，例如可以举出酶免疫测定法(ELISA、EIA)、荧光免疫测定法、放射免疫测定法(RIA)、发光免疫测定法、免疫比浊法、乳胶凝集反应、乳胶比浊法、红细胞凝集反应、粒子凝集反应或蛋白质印迹法。

上述方法通过使用了标记的免疫测定法进行时，可以在将本发明的抗体、或试样中的成分固相化后，进行其免疫学反应。

作为固相载体，可以使用由聚苯乙烯、聚碳酸酯、聚乙烯基甲苯、聚丙烯、聚乙烯、聚氯乙烯、尼龙、聚甲基丙烯酸酯、乳胶、明胶、琼脂糖、纤维素、琼脂糖凝胶、玻璃、金属、陶瓷或磁性体等材料组成的微珠、微量培养板、试管、棒(stick)或试验片等形状的不溶性载体。

可以通过物理吸附法、化学结合法或并用两种方法等公知的方法，使固相载体和本发明的抗体或试样成分结合，进行固相化。

进而，在本发明中，为了容易地检测本发明的抗体与试样中的靶多肽的反应，通过标记本发明的抗体直接检测该反应，或通过使用标记二抗间接检测该反应。本发明的检测方法，从灵敏度方面考虑，优选使用后者的间接检测(例如，夹心法等)。

作为标记物质，使用酶免疫测定法时，可以使用过氧化物酶(POD)、碱性磷酸酶、β-半乳糖苷酶、脲酶、过氧化氢酶、葡萄糖氧化酶、乳酸脱氢酶、淀粉酶或生物素-抗生物素蛋白复合体等酶；使用荧光免疫测定法时，可以使用异硫氰酸荧光素、四甲基罗丹明异硫氰酸盐、取代异硫氰酸罗丹明、二氯三嗪异硫氰酸盐、Alexa或AlexaFluoro等；使用放射免疫测定法时，可以使用氚、碘125或131等。另外，使用发光免疫测定法时，可以使用NADH-、FMNH2-、荧光素酶类、鲁米诺-过氧化氢-POD类、吖啶酯类或二氧杂环丁烷化合物类等。

作为标记物质和抗体的结合方法，在使用酶免疫测定法时，可以使用戊二醛法、马来酰亚胺法、吡啶基二硫化物法或高碘酸法等公知方法；在使用放射免疫测定法时，可以使用氯胺T法、Bolton-Hunter法等公知方法。测定操作方法可以通过公知的方法(Current protocols in Protein Sciences、1995年，John Wiley & Sons Inc.、Current protocols in Immunology、2001年，John Wiley & SonsInc.)进行。例如，直接标记本发明的抗体时，将试样中的成分固相化，使其与标记的本发明的抗体接触，形成标记多肽和本发明的抗体的复合体。然后将未结合的标记抗体洗涤分离，可以由结合标记抗体量或未结合标记抗体量测定试样中的靶多肽的量。

另外，使用例如标记二抗时，使本发明的抗体与试样反应(一次反应)，再与标记二抗反应(二次反应)。一次反应和二次反应可以以相反的顺序进行，也可以同时进行，还可以错开时间进行。通过一次反应及二次反应，形成固相化的靶多肽-本发明的抗体-标记二抗的复合体、或固相化的本发明的抗体-靶多肽-标记二抗的复合体。然后洗涤分离未结合的标记二抗，可以通过结合标记二抗量或未结合标记二抗量测定试样中的靶多肽的量。

具体而言，使用酶免疫测定法时，在标记酶的最适条件下使其与基质反应，通过光学方法等测定反应生成物的量。使用荧光免疫测定法时，测定由荧光物质标记产生的荧光强度，使用放射免疫测定法时，测定由放射性物质标记产生的放射能量。使用发光免疫测定法时，测定由发光反应体系产生的发光量。

本发明的方法中，通过采用光学方法测定或者肉眼观测其透射光或散射光的测定方法来测定免疫比浊法、乳胶凝聚反应、乳胶比浊法、红细胞凝集反应或粒子凝集反应等中免疫复合体凝集物的生成，此时，作为溶剂可以使用磷酸缓冲液、甘氨酸缓冲液、Tris缓冲液或Good’s缓冲液等，还可以在反应体系中含有聚乙二醇等反应促进剂或非特异性反应抑制剂。

本发明的试剂盒中含有的抗体可以单独存在，也可以以混合物的状态存在，或与固相载体结合存在，也可以以游离状态存在。另外，本发明的试剂盒可以含有标记二抗、载体、清洗缓冲液、试样稀释液、酶基质、反应停止液、精制的作为标准物质的标记物(靶)多肽、使用说明书等。

4.食管癌诊断用试剂盒(核酸)

另外，本发明提供一种食管癌诊断(检测)用试剂盒，所述试剂盒含有与本发明的组合中含有的多核苷酸相同的多核苷酸、其变异体及/或其片段中的1种或多种(优选3个以上、较优选5个以上)。

本发明的试剂盒优选含有选自上述3.1中记载的多核苷酸中的1种或多种多核苷酸或其片段。

本发明的试剂盒可以含有下述多核苷酸中的3个以上，所述多核苷酸为含有序列号1～38表示的碱基序列的多核苷酸、含有其互补序列的多核苷酸、在严格条件下与上述多核苷酸杂交的多核苷酸、或上述多核苷酸的片段。

本发明的试剂盒可以进一步含有下述多核苷酸中的2个以上，所述多核苷酸为含有序列号39～62表示的碱基序列的多核苷酸、含有其互补序列的多核苷酸、在严格条件下与上述多核苷酸杂交的多核苷酸、或上述多核苷酸的片段。

本发明的试剂盒中可以含有的多核苷酸片段例如是选自下述(1)～(5)中的5个以上DNA：

(1)序列号1～62表示的碱基序列或其互补序列中，含有15个以上连续碱基的DNA。

(2)序列号1～62表示的碱基序列或其互补序列中，含有60个以上连续碱基的DNA。

(3)序列号1～62表示的碱基序列或其互补序列中，分别含有序列号63～124表示的碱基序列或其互补序列、且含有60个以上连续碱基的DNA。

(4)包含序列号63～124表示的碱基序列的DNA。

(5)含有与序列号63～124表示的碱基序列互补的碱基序列的DNA。

在优选的实施方案中，上述多核苷酸是含有由序列号1～38中任一个表示的碱基序列组成的多核苷酸、由其互补序列组成的多核苷酸、在严格条件下与上述多核苷酸杂交的多核苷酸、或其含有15个以上、优选20个以上、较优选25个以上连续碱基的片段。

在其他优选的实施方案中，本发明的试剂盒除含有上述多核苷酸以外，还可以含有由序列号47表示的碱基序列组成的多核苷酸、由其互补序列组成的多核苷酸、在严格条件下与上述多核苷酸杂交的多核苷酸、或其含有15个以上连续碱基的片段。

在优选的实施方案中，上述片段可以是含有15个以上、优选20个以上、较优选25个以上、更优选60个以上连续碱基的多核苷酸。

在其他优选的实施方案中，上述片段是序列号1～62中任一个表示的碱基序列中分别含有序列号63～124中任一个表示的碱基序列、且含有60个以上连续碱基的多核苷酸、或含有与该多核苷酸的序列互补的碱基序列的多核苷酸。

在其他优选的实施方案中，上述片段是含有序列号63～124中任一个表示的碱基序列的多核苷酸。

在其他优选的实施方案中，上述片段是含有与序列号63～124中任一个表示的碱基序列互补的碱基序列的多核苷酸。

在其他优选的实施方案中，上述片段是由序列号63～124中任一个表示的碱基序列组成的多核苷酸。

上述组合的例子包括：对于含有序列号1～62表示的碱基序列或其互补序列的多核苷酸、在严格条件下与上述多核苷酸杂交的多核苷酸、及/或其片段(例如序列号63～124)，从下述表1所示的基因的优先顺序(第1号至第62号)较高的一方开始依次组合基因。采用上述方案依次组合62种基因时，相对于检测食管癌所需的基因数将存在食管癌的检测准确率(％)进行绘图，准确率如下：例如仅为SPRR3(序列号50)时准确率为42.1％，SPRR3(序列号50)及CSTB(序列号49)的组合时准确率为52.6％，SPRR3(序列号50)、CSTB(序列号49)及EYA2(序列号1)的组合时准确率为59.6％，SPRR3(序列号50)、CSTB(序列号49)、EYA2(序列号1)及SERF1A(序列号2)的组合时准确率为59.7％，SPRR3(序列号50)、CSTB(序列号49)、EYA2(序列号1)、SERF1A(序列号2)及IGHG1(序列号3)的组合时准确率为86.0％，同样地组合全部62种基因时，准确率为96.5％(图1)。

因此，本发明的实施方式中，优选最少的组合为SPRR3(序列号50)、CSTB(序列号49)、EYA2(序列号1)、SERF1A(序列号2)及IGHG1(序列号3)的组合，构成其的各多核苷酸或片段选自含有序列号50、49、1、2或3所示的碱基序列或其互补的序列的多核苷酸、在严格条件下与上述多核苷酸杂交的多核苷酸、及/或其片段。进而，可以在上述5种基因中，追加表1所示的其他基因，由此，可以提高其准确率至例如89％以上、91％以上、92％以上、96％以上。

根据其他较优选的实施方式，本发明的试剂盒可以包括3个以上(优选5个以上)～全部的含有序列号63～124表示的碱基序列或其互补序列的多核苷酸。

在本发明中，多核苷酸片段的大小是各多核苷酸碱基序列中下述范围的连续碱基数，例如15～序列的全部碱基数、15～5000个碱基、15～4500个碱基、15～4000个碱基、15～3500个碱基、15～3000个碱基、15～2500个碱基、15～2000个碱基、15～1500个碱基、15～1000个碱基、15～900个碱基、15～800个碱基、15～700个碱基、15～600个碱基、15～500个碱基、15～400个碱基、15～300个碱基、15～250个碱基、15～200个碱基、15～150个碱基、15～140个碱基、15～130个碱基、15～120个碱基、15～110个碱基、15～100个碱基、15～90个碱基、15～80个碱基、15～70个碱基、15～60个碱基、15～50个碱基、15～40个碱基、15～30个碱基或15～25个碱基；25～序列的全部碱基数、25～1000个碱基、25～900个碱基、25～800个碱基、25～700个碱基、25～600个碱基、25～500个碱基、25～400个碱基、25～300个碱基、25～250个碱基、25～200个碱基、25～150个碱基、25～140个碱基、25～130个碱基、25～120个碱基、25～110个碱基、25～100个碱基、25～90个碱基、25～80个碱基、25～70个碱基、25～60个碱基、25～50个碱基或25～40个碱基；50～序列的全部碱基数、50～1000个碱基、50～900个碱基、50～800个碱基、50～700个碱基、50～600个碱基、50～500个碱基、50～400个碱基、50～300个碱基、50～250个碱基、50～200个碱基、50～150个碱基、50～140个碱基、50～130个碱基、50～120个碱基、50～110个碱基、50～100个碱基、50～90个碱基、50～80个碱基、50～70个碱基或50～60个碱基；60～序列的全部碱基数、60～1000个碱基、60～900个碱基、60～800个碱基、60～700个碱基、60～600个碱基、60～500个碱基、60～400个碱基、60～300个碱基、60～250个碱基、60～200个碱基、60～150个碱基、60～140个碱基、60～130个碱基、60～120个碱基、60～110个碱基、60～100个碱基、60～90个碱基、60～80个碱基或60～70个碱基等。

构成本发明的试剂盒的上述组合只是列举，其他各种可能的组合都包括在本发明中。

本发明的试剂盒除了上述说明的本发明的多核苷酸、其变异体或其片段之外，还可以含有已知能够检测食管癌的或将来发现的多核苷酸。

本发明的试剂盒中含有的多核苷酸、其变异体或其片段可以被单独或任意组合包装在不同容器中。

5.DNA芯片

本发明还提供一种食管癌诊断用DNA芯片，所述食管癌诊断用DNA芯片含有与本发明的组合物及/或试剂盒中含有的物质相同的多核苷酸(或上述3.1节的组合物及/或4节的试剂盒中记载的多核苷酸)、变异体、片段或它们的组合。

作为DNA芯片的基板，只要是能够将DNA固相化的基板即可，没有特别限定，可以举出载玻片、硅制芯片、聚合物制芯片及尼龙膜等。另外，可以对上述基板进行聚L赖氨酸涂布或导入氨基、羧基等官能团等的表面处理。

另外，固相化法只要是通常使用的方法即可，没有特别限定，可以举出以下方法：使用被称为点样器(spotter)或阵列点样仪(arrayer)的高密度分液器点样DNA的方法、或使用通过压电元件等从喷嘴喷射微量的液滴的装置(喷墨)将DNA喷射到基板上的方法、或在基板上依次进行核苷酸合成的方法。使用高密度分液器时，例如如下进行固相化：在具有多个孔的平板的各孔中装入不同的基因溶液，用针取出该溶液，然后依次点到基板上。使用喷墨法时，如下进行固相化：从喷嘴喷射基因，将基因高速地排列在基板上。在基板上合成DNA时，如下进行固相化：用能在光或热的作用下离去的官能团保护与基板结合的碱基，通过使用掩模只将特定部位的碱基接触光或热，使官能团离去。然后，反复进行向反应液中加入碱基、使其与基板上的碱基偶联的步骤。

被固相化的多核苷酸是上述说明的本发明的全部多核苷酸。

例如，上述多核苷酸可以含有以下1种或几种(优选5个以上)多核苷酸或其片段。

(2)含有序列号1～62表示的碱基序列的多核苷酸组。

(3)由序列号1～38表示的碱基序列组成的多核苷酸组、其变异体、或其含有15个以上连续碱基的片段。

(4)含有序列号1～38表示的碱基序列的多核苷酸组、其变异体、或其含有15个以上连续碱基的片段。

(7)在严格条件下与DNA杂交的多核苷酸组、或其含有15个以上连续碱基的片段，所述DNA由与序列号1～38表示的各碱基序列互补的碱基序列组成。

(10)含有序列号39～62表示的碱基序列的多核苷酸组、其变异体、或其含有15以上连续碱基的片段。

(11)由与序列号39～62表示的碱基序列互补的碱基序列组成的多核苷酸组、其变异体、或其含有15个以上连续碱基的片段。

(13)在严格条件下与DNA杂交的多核苷酸组、或其含有15个以上连续碱基的片段，上述DNA由与序列号39～62表示的各碱基序列互补的碱基序列组成。

(14)在严格条件下与由序列号39～62表示的各碱基序列组成的DNA杂交的多核苷酸组、或其含有15个以上连续碱基的片段。

(15)序列号1～38表示的碱基序列或其互补序列的各序列中含有15个以上连续碱基的多核苷酸。

(16)序列号1～38表示的碱基序列或其互补序列的各序列中含有60个以上连续碱基的多核苷酸。

(17)序列号39～62表示的各碱基序列或其互补序列中，含有15个以上连续碱基的多核苷酸。

(18)序列号39～62表示的各碱基序列或其互补序列中，含有60个以上连续碱基的多核苷酸。

(19)序列号1～38表示的碱基序列中，分别含有序列号63～100表示的碱基序列、且含有60个以上连续碱基的多核苷酸。

(20)与序列号1～38表示的碱基序列互补的序列中，分别含有与序列号63～100表示的碱基序列互补的序列、且含有60个以上连续碱基的多核苷酸。

(21)序列号39～62表示的碱基序列中，分别含有序列号39～62表示的碱基序列、且含有60个以上连续碱基的多核苷酸。

(22)与序列号39～62表示的碱基序列互补的序列中，分别含有与序列号39～62表示的碱基序列互补的序列、且含有60个以上连续碱基的多核苷酸。

根据优选的实施方案，本发明的DNA芯片可以含有5个以上～全部的含有序列号63～124表示的碱基序列或其互补序列的多核苷酸。

本发明中，被固相化的多核苷酸可以是基因组DNA、cDNA、RNA、合成DNA、合成RNA中的任一个，可以为单链或双链。

作为能够检测、测定靶基因、RNA或cDNA的表达水平的DNA芯片的例子，可以举出东丽株式会社的3D-Gene、Affymetrix公司的the Gene Chip Human Genome U133 Plus 2.0 Array、Agilent公司的Whole human genome oligo microarray、Takara Bio公司的IntelliGene(注册商标)HS Human Expression CHIP等。

DNA芯片的制作例如可以使用在固相表面固定预先制备的探针的方法。在固相表面固定预先制备的多核苷酸探针的方法如下：合成导入了官能团的多核苷酸，在经过表面处理的固相载体表面上点样寡核苷酸或多核苷酸，使其共价键合(例如、J.B.Lamture等、Nucleic.Acids.Research、1994年，第22卷，p.2121-2125、Z.Guo等、Nucleic.Acids.Research、1994年，第22卷，p.5456-5465)。多核苷酸通常通过间隔臂(spacer)或交联剂(crosslinker)与经过表面处理的固相载体共价键合。还已知使聚丙烯酰胺凝胶的微小片排列在玻璃表面上，使合成多核苷酸与其共价键合的方法(G.Yershov等、Proceedings of the National Academic Sciences U.S.A.、1996年，第94卷，p.4913)。还已知下述方法：在二氧化硅微阵列上制作微小电极的阵列，在电极上设置含有链霉抗生物素蛋白的琼脂糖的渗透层，形成反应部位，通过使该部位带正电，固定生物素化多核苷酸，通过控制部位的电荷，能高速且严格地进行杂交(R.G.Sosnowski等、Proceedings of the National Academic Sciences U.S.A.、1997年，第94卷，p.1119-1123)。

6.食管癌的检测法

本发明提供下述方法，所述方法是使用本发明的组合物、试剂盒、DNA芯片、或它们的组合，在体外确定样品试样中是否含有食管癌细胞的方法，所述方法包括：手术时或内窥镜检查时使用来自食管癌患者的食管癌细胞和非癌细胞，比较试样中表达基因的量，该样品试样中的细胞的靶核酸表达量增加/降低时，确定该样品试样中存在食管癌细胞，此处，该靶核酸可以通过该组合物、试剂盒或DNA芯片所含的多核苷酸、其变异体或其片段来检测。

另外，本发明提供本发明的组合物、试剂盒、DNA芯片在体内检测来自受试者的样品试样中的食管癌中的应用。

本发明的上述方法中，组合物、试剂盒、DNA芯片以单独的方式或以所有可能的组合的方式含有如上所述的本发明的多核苷酸、其变异体或其片段进行使用。

在本发明的食管癌的检测、确定或(基因)诊断中，本发明的组合物、试剂盒或DNA芯片中含有的多核苷酸、其变异体或其片段可以作为引物或探针使用。用作引物时，可以举出碱基长度通常为15～50个碱基、优选为15～30个碱基、较优选为18～25个碱基的引物。另外，用作检测探针时，例如可以举出碱基长度为15个碱基～全部序列的碱基数、优选为25～1000个碱基、较优选为25～100个碱基的探针，但并不限定于上述范围。

本发明的组合物或试剂盒中含有的多核苷酸、其变异体或其片段在RNA印迹法(Northern Blot)、DNA印迹法(Southern blot)、RT-PCR法、原位杂交法、DNA杂交法等特异性地检测特定基因的公知方法中，可以根据标准方法用作引物或探针。作为测定对象试样，根据所用的检测方法的种类，可以通过活组织检测等采集受试者的食管组织或被怀疑存在食管癌细胞的生物组织的一部分或全部，或者从手术取出的生物组织中回收。还可以使用按照常规方法由其制备的总RNA，还可以使用基于该RNA制备的含有cDNA、聚A(+)RNA的各种多核苷酸。

或者，可以使用DNA芯片(包括DNA宏阵列(macroarray))检测或定量生物组织中的本发明的基因、RNA、cDNA等核酸的表达量。此种情况下，本发明的组合物或试剂盒可以用作DNA阵列的探针(例如，在Affymetrix公司的Human Genome U133 Plus 2.0 Array中，使用长度为25个碱基的多核苷酸探针)。使上述DNA芯片与以从生物组织采集的RNA为基础制备的标记DNA或RNA杂交，以该标记DNA或RNA的标记为指标，检测通过该杂交形成的上述探针和标记DNA或RNA的复合体，由此能评价生物组织中的食管癌相关基因或食管癌是否表达或表达水平(表达量)。本发明方法中优选使用DNA芯片，该DNA芯片能对一个生物试样同时评价多个基因是否表达或表达水平。

本发明的组合物、试剂盒或DNA芯片对于食管癌的诊断、确定或检测(是否患病或患病程度的诊断)是有用的。使用该组合物、试剂盒或DNA芯片诊断食管癌具体可以如下进行：使用手术时或内窥镜检查时来自食管癌患者的食管癌细胞和非癌细胞，比较试样中的基因表达量，或者将手术时或内窥镜检查时来自食管癌患者的食管癌细胞和非癌细胞与等同的生物组织进行比较，判断用该诊断用组合物检测的基因的表达水平的不同。此时，基因表达水平的不同不仅仅表示有无表达，还包括以下情形：来自食管癌患者的食管癌细胞和非癌细胞两者都表达时，比较两者间的表达量时的差值。例如，由于EYA2基因在食管癌中表达诱导/减少，所以，在受试者的食管癌组织中表达/减少，如果将该表达量与正常组织的表达量相比较存在差异，则确定试样中不含食管癌细胞/或含有食管癌细胞。

利用本发明的组合物、试剂盒或DNA芯片检测样品试样中不含食管癌细胞/或含有食管癌细胞的方法如下：通过活组织检测等采集或从手术取出的生物组织中回收受试者的生物组织的一部分或全部，使用选自本发明的多核苷酸组中的1种或几种多核苷酸、其变异体或其片段检测上述生物组织中含有的基因，测定该基因的表达量，由此诊断是否患有食管癌或患病程度。另外，本发明的食管癌的检测方法还可以在例如对食管癌患者给与用于改善该疾病的治疗药时，检测、确定或诊断该疾病是否改善或改善程度。

本发明的方法例如可以包括以下(a)、(b)及(c)步骤：

(a)使来自受试者的生物试样与本发明的组合物、试剂盒或DNA芯片的多核苷酸接触的步骤，

(b)使用上述多核苷酸作为探针测定生物试样中的靶核酸的表达水平的步骤、

(c)基于(b)的结果，判断该生物试样中是否存在食管癌(细胞)的步骤。

作为本发明方法中使用的生物试样，可以举出由受试者的生物组织例如食管组织及其周围组织、怀疑发生食管癌的组织等制备的试样。具体而言，含有由该组织制备的RNA的试样、或含有由该组织制备的多核苷酸的试样可以如下制备，即，通过活组织检测等采集或从通过手术取出的生物组织中回收受试者的生物组织的一部分或全部，然后按照常规方法进行制备。

此处的受试者是指哺乳动物，例如人、猴子、小鼠、大鼠等，并无限定，优选为人。

本发明的方法，可以根据用作测定对象的生物试样的种类变更步骤。

例如，使用RNA作为测定对象物时，食管癌(细胞)的检测可以包括例如下述步骤(a)、(b)及(c)：

(a)使由受试者的生物试样制备的RNA或由该RNA转录的互补多核苷酸(cDNA)与本发明的组合物、试剂盒或DNA芯片的多核苷酸结合的步骤，

(b)使用上述多核苷酸作为探针，测定与该多核苷酸结合的来自生物试样的RNA或由该RNA转录的互补多核苷酸的步骤，

(c)基于上述(b)的测定结果，判断是否存在食管癌(细胞)的步骤。

为了利用本发明检测、确定或诊断食管癌(细胞)，例如可以使用各种杂交法。所述杂交法，例如可以使用RNA印迹法、DNA印迹法、RT-PCR法、DNA芯片解析法、原位杂交法、DNA杂交法等。

使用RNA印迹法时，通过使用本发明的诊断用组合物作为探针，可以检测、测定RNA中的各基因是否表达或其表达水平。具体可以举出以下方法：用放射性同位素(³²P、³³P、³⁵S等)或荧光物质等标记本发明的诊断用组合物(互补链)，使其与利用常规方法转移到尼龙膜等上的来自受试者的生物组织的RNA杂交，然后用放射线检测器(可以举出BAS-1800II Fuji Photo Film株式会社等)或荧光检测器(例如STORM860，Amersham Bioscience公司等)检测、测定形成的诊断用组合物(DNA)和RNA的双链中的来自诊断用组合物的标记物(放射性同位素或荧光物质)的信号。

使用定量RT-PCR法时，通过使用本发明的上述诊断用组合物作为引物，可以检测、测定RNA中的基因是否表达或其表达水平。具体可以举出以下方法：按照常规方法由来自受试者的生物组织的RNA制备cDNA，为了能以该cDNA为模板扩增各靶基因区域，使由本发明的组合物制备的1对引物(由与上述cDNA结合的正链和反链组成)与cDNA杂交，按照常规方法进行PCR法，检测得到的双链DNA。需要说明的是，作为双链DNA的检测方法，可以采用以下方法：使用预先用放射性同位素或荧光物质标记的引物进行上述PCR的方法；用琼脂糖凝胶电泳PCR产物，用溴乙锭等染色双链DNA进行检测的方法；将产生的双链DNA按照常规方法转移到尼龙膜等上，作为探针与标记的诊断用组合物杂交，进行检测的方法。

使用DNA芯片解析时，使用将本发明的上述诊断用组合物作为DNA探针(单链或双链)贴合到基板上制成的DNA芯片。将基因组在基板上固相化得到的物质通常称为DNA芯片及DNA阵列，DNA阵列包括DNA宏阵列和DNA微阵列，本说明书中称为DNA芯片时，即为含有该DNA阵列的物质。

杂交条件没有限定，例如，包括在30℃～50℃下，在3～4×SSC、0.1～0.5％SDS中杂交1～24小时，较优选在40℃～45℃下，在3×SSC、0.3％SDS中杂交1～24小时，然后进行清洗。作为清洗条件，例如可以举出利用含有30℃的3×SSC和0.1％SDS的溶液、及42℃的0.3×SSC和0.1％SDS溶液、及30℃的0.1×SSC溶液在室温下连续清洗等的条件。此处，1×SSC是含有150mM氯化钠及15mM柠檬酸钠的水溶液(pH7.2)。互补链优选为即使在上述条件下进行清洗仍能保持与作为对象的正链杂交的状态的链。作为上述互补链，具体可以举出由与作为对象的正链的碱基序列具有完全互补关系的碱基序列组成的链、以及由与该链具有至少80％同源性的碱基序列组成的链。

作为以来自本发明的组合物或试剂盒的多核苷酸片段为引物进行PCR时的严格的杂交条件的例子，例如可以举出使用组成为10mM Tris-HCL(pH8.3)、50mM KCL、1～2mM MgCl₂等的PCR缓冲液，在由该引物序列计算的Tm+5～10℃下处理15秒～1分钟左右等。作为上述Tm的计算方法，可以举出Tm＝2×(腺嘌呤残基数+胸腺嘧啶残基数)+4×(鸟嘌呤残基数+胞嘧啶残基数)等。

上述杂交的“严格条件”的其它例子，记载于例如Sambrook，J.& Russel，D.著，Molecular Cloning，A LABORATORY MANUAL、Cold Spring Harbor Laboratory Press、2001年1月15日出版，第1卷7.42～7.45，第2卷8.9～8.17等中，可以在本发明中使用。

本发明还提供判断生物试样不含及/或含有食管癌细胞的方法，该方法使用本发明的组合物、试剂盒、DNA芯片或它们的组合，测定来自受试者的生物试样中的靶核酸或基因的表达量，以支持向量机(SVM，support vector machine)作为辨别式进行判断，所述支持向量机(SVM)以食管癌组织和正常组织的基因表达量作为训练样本。

即，本发明还提供上述方法，该方法包括以下步骤：第1步骤，使用本发明的组合物、试剂盒、DNA芯片或它们的组合，体外测定多个生物试样中的靶核酸的表达量，所述生物试样是已知确定样品试样中不含食管癌细胞/或含有食管癌细胞的生物试样；第2步骤，以该第1步骤得到的该靶核酸的表达量的测定值作为训练样本，制作辨别式(支持向量机)；第3步骤，与第1步骤相同地体外测定来自受试者的食管的生物试样中的该靶核酸的表达量；第4步骤，将第3步骤中得到的该靶乙酸的表达量的测定值代入该第2步骤中得到的辨别式，基于由该辨别式得到的结果，判断生物试样中不含食管癌细胞/或含有食管癌细胞，此处，该靶核酸可以通过该组合物、试剂盒或DNA芯片中含有的多核苷酸、其变异体或其片段检测到。

或者，本发明的方法可以包含例如下述步骤(a)、(b)及(c)：

(a)步骤：使用本发明的诊断(检测)用组合物、试剂盒或DNA芯片测定生物试样中的靶基因的表达量，所述生物试样是已知含有来自食管癌患者的食管癌细胞的组织及/或不含来自食管癌患者的食管癌细胞的组织；

(b)步骤：将(a)中测定的表达量的测定值代入下述数1～数5的式中，制作称为SVM的辨别式；

(c)步骤：使用本发明的诊断(检测)用组合物、试剂盒或DNA芯片测定来自受试者的生物试样中的该靶基因的表达量，并将其代入(b)中制作的辨别式，基于得到的结果，判断该生物试样中是否含有食管癌细胞。

SVM是为了解决二级分类问题而制作的，是1995年由AT&T的V.Vapnik(The Nature of Statistical Leaning Theory、Springer、1995年出版)基于统计学习理论的框架提出的学习机。SVM是一种线性辨识器，但通过组合后述的核函数(Kernel)，能够解决非线性问题。针对不同级别的训练样本，在辨识上述训练样本的多个超平面中，将该超平面与训练样本的最小距离变得最大的超平面作为辨识面，由此能最准确地辨识新给与的试样属于哪一个级别。

SVM只能解决线性问题，但作为用于解决本质上为非线性问题的方法，已知将特征向量非线性地转换成高维，在该高维空间内进行线性辨识的方法。使用该方法，与在原空间使用非线性模型等效。但进行向高维转换的绘图需要庞大的计算量，归纳能力也降低。SVM中，辨识函数仅依赖输入图案的内积，如果能计算内积，则能构建最优辨识函数。非线性地绘制的空间中的二个要素的内积仅由各自原来的空间的输入表示的式子称为核函数，一边在高维空间中绘制，一边避免在实际绘制的空间中的特征的计算，仅由核函数的计算构建最优辨识函数，即辨别式(例如，麻生英树等著、统计科学的前沿6“图案识别与学习的统计学新概念和方法”、岩波书店、东京、日本(2004年))。

本发明的方法中可以使用的辨别式的计算例如下所示。

为了确定SVM，可以准备生物试样中的靶基因的表达量作为训练样本，按照以下步骤确定辨识函数的常数，所述生物试样是已知含有食管癌细胞的组织或正常组织。

训练样本x_i属于被分类为(+1、-1)的含有食管癌细胞的组织组或正常组织组中的任一组。可以用超平面线性分离上述训练样本时，辨识函数例如为下式。

[等式1]

f (x) = Σ_{i = 1}^{n} w_{i} \cdot x_{i} + b

(此处，w表示加权系数、b表示非线性常数(bias constant)、x表示样本变数。)

但是，该函数存在限制条件：

[等式2]

y_i(w^Tx_i+b)≥1-ξ_i

ξ_i≥0，i＝1，...，n

(此处，T表示内积、y表示样本的类别、ζ表示松弛变量。)

所以，通过使用拉格朗日(Lagurange)未定乘子法，可以回归到使用了拉格朗日乘子α的下述最优化问题。

[等式3]

Σ α_{i} - \frac{1}{2} Σ α_{i} α_{j} y_{i} y_{j} x_{i}^{T} x_{j}

[等式4]

0 \leq α_{i} \leq C, Σ_{i = 1}^{n} α_{i} y_{i} = 0

(此处，C表示通过实验确定的限制条件参数。)

如果解决了该问题，则能够最终得到下式，

[等式5]

w = Σ_{i = 1}^{n} α_{i} y_{i} x_{i}

b = - \frac{1}{2} (w^{T} x_{A} + w^{T} x_{B})

从而能毫无疑义地得到辨识函数。通过将新的生物试样(不知道是否含有食管癌细胞的组织的表达基因量)的x代入该函数，能够分类f(x)(即+1或-1)，从而判断生物试样属于哪一类(即含有食管癌细胞的组织组或不含食管癌细胞的组织组)。

如上所示，为了制作用于进行未知试样分类的SVM判定式，必需有二组训练样本。在本发明的情况下，该训练样本例如是以下二组，即，与“从食管癌患者的含有食管癌细胞的组织获得的表达基因(基因x₁，x₂，..x_i，...x_n)”的各患者对应的组、以及与“从食管癌患者的不含食管癌细胞的组织获得的表达基因(基因x₁，x₂，..x_i，...x_n)”的各患者对应的组。对上述各组分别测定的表达基因数(n)因实验设计的不同而各种各样，但对于各基因，无论在哪一个实验中，在二组间都可以观察到存在明显差别的情况和差别比较小或无差别的情况。为了提高SVM辨别式的精度，要求作为训练样本的二组样本之间存在显著差异，所以，必须从基因组中仅提取在二组间表达量存在差别的基因加以利用。

另外，属于SVM判定式中使用的基因组的基因的提取优选如下进行。首先，对于含有食管癌细胞的组织组和正常的组织组，利用参数解析即t-检验检测组内表达量的中央值、组内表达量的平均值、平均值之差，利用Mann-Whitney的U检验进行非参数解析等，由此求出各基因的2组间的表达量之差。然后，按照此处求出的2组间的表达量之差从大到小的顺序将基因参入到每组中，算出其确定率(准确率)。重复进行上述基因向基因组中的参入过程，直至算出的确定率达到最大，采用能够得到最大的确定率的时刻的基因组。

在本发明的方法中，例如，使用上述记载的基于序列号1～62的1种或几种(优选5个以上)上述多核苷酸、及/或上述记载的基于1～62的1种或几种(优选5个以上)多核苷酸的任意组合，且上述62种靶基因的表达量在来自食管癌患者的食管癌组织和来自食管癌患者的不含食管癌组织(正常组织)之间都不同，以在来自食管癌患者的食管癌组织中表达增加/减少为指标，通过测定上述62种基因的表达量，能以80％以上、85％以上、优选90％以上、较优选92％以上、更优选95％以上的准确率分辨食管癌(图1)。

本发明还提供检测食管癌的方法，该方法使用针对下述多肽的一种或几种(优选5个以上)抗体或该抗体的片段，体外测定该多肽在来自食管癌患者的食管癌组织和来自食管癌患者的不含食管癌组织中的表达量、或该多肽在血液中的水平(或存在量)，所述多肽是由上述62种基因(例如相当于序列号1～62)或其片段(例如，相当于序列号63～124)编码的多肽、例如由序列号125～186表示的氨基酸序列组成的多肽。

上述抗体或片段例如包括多克隆抗体、单克隆抗体、合成抗体、重组抗体、多特异性抗体(包括二重特异性抗体)、单链抗体、Fab片段、F(ab’)₂片段等。多克隆抗体可以通过与结合有精制多肽的亲和性柱结合的所谓吸附法，作为特异性抗体进行制备。

测定可以包括以下步骤：使被惯用的酶或荧光团标记的抗体或片段与组织切片或均质化的组织接触的步骤、定性或定量测定抗原-抗体复合体的步骤。可以通过以下方法进行检测：例如，利用免疫电子显微镜测定靶多肽的存在和水平的方法、利用ELISA或荧光抗体法等惯用方法测定靶多肽的水平的方法等，来自食管癌患者的食管癌组织与来自食管癌患者的不含食管癌的组织相比，来自食管癌患者的食管癌组织中的靶多肽的表达量增加或降低(或减少)时，或来自食管癌患者的食管癌组织与来自食管癌患者的不含食管癌组织相比，来自食管癌患者的食管癌组织中的该多肽在血液中的水平增加或降低时，判断存在食管癌。换言之，与来自食管癌患者的食管癌细胞的值相比，上述多肽的表达量或水平增加或降低时，可以判断存在食管癌。此处，增加/降低是指有统计学意义(p≤0.05)。

利用以下实施例进一步详细说明本发明。但本发明并不限定于这些实施例。

实施例

1.实验者的临床病理学观察

从取得知情同意的进行食管癌摘除手术或食管活检的57名食管癌患者获得食管的摘除组织。对摘除的组织片进行肉眼及/或病理组织学观察，判断食管癌组织，区分食管癌病变部和正常组织部后，立即冻结，保存在液氮中。

2.总RNA的提取和cDNA的制备

作为试样，使用食管癌患者的食管组织中的食管癌病变部组织及非病变部组织。使用Trizol试剂(Invitrogen公司)，按照该公司推荐的操作手册，由各组织制备总RNA。

并用寡聚(dT)引物及随机九聚物，使用CyScribe First-Strand cDNA Labeling Kit(GE Healthcare公司)，按照制造商推荐的操作手册，对由上述方法得到的总RNA 1μg进行逆转录反应。在来自食管癌组织的总RNA中添加Cy3-dUTP(GE Healthcare公司)，在Human Universal Reference RNA(Stratagene公司)中添加Cy5-dUTP(GE Healthcare公司)，按照制造商推荐的操作手册，在逆转录反应时进行cDNA的标记。被标记的cDNA用QIA quick PCR purification Kit(QIAGEN公司)精制后用于杂交。

3.DNA芯片的制作

作为DNA芯片，使用东丽株式会社3D-Gene人总基因型DNA芯片，进行基因插入。对于3D-Gene人总基因型DNA芯片的操作基于该公司规定的顺序实施。使用3D-Gene人总基因型DNA芯片的分析结果是提取得到有可能因食管癌导致表达变动的基因，共计1119种。

对于提取的1119种基因，为了不引起序列的重复，分别选择序列特异性高的部位的序列60-70个残基进行合成，使用东丽株式会社的1296柱3D-Gene基板，制作特制芯片(Custom chip)。

4.杂交

分别采集经过标记的cDNA各1μg，使其溶解在杂交缓冲液(东丽株式会社，日本)中，在42℃下进行杂交16小时。杂交结束后，在含有30℃的3×SSC和0.1％SDS的溶液、含有42℃的0.3×SSC和0.1％SDS的溶液、及30℃的0.1×SSC溶液连续洗涤的条件下进行清洗。

5.基因表达量的测定

使用DNA阵列扫描仪(ScanArray Lite、Perkin Elmer Japan)扫描利用上述方法进行杂交的DNA芯片，获得图像，使用GenePix Pro5.0(Molecular Device)将荧光强度转变为数值。参考Speed T.著“Statistical analysis of gene expression microarray data”Chapman & Hall/CRC、及Causton H.C.等著“A beginner’s guide Microarray gene expression data analysis”Blackwell publishing进行统计学处理。即，将从杂交后的图像解析得到的数据分别取对数值，通过整体最佳化(global nomalization)进行归一化(normalization)。结果能够找到在食管癌病变部组织中的表达量比食管癌非病变部组织减少、降低或增加、增大的基因。可以考虑将该基因用作食管癌检测用基因。

6.预测得分系统

以从57例患者得到的检样作为训练样本，制作使用载带在基因组框架图(Genomic Profiler)(三井信息开发)上的SVM的辨别式。利用该辨别式，对进行了归一化的所有57例的数据进行数据预测。需要说明的是，核函数使用线性核函数(linear kernel)。另外，按照在两组间的(食管癌病变部组织与食管癌非病变部组织)组内表达量的中央值之差从大到小的顺序，确定基因。(表1：来自食管癌患者的食管癌组织和来自食管癌患者的不含食管癌的组织(正常组织)中的基因转录产物的表达量比较)。

[表1]

按照表1的第7列所示的顺序选择顺序靠前的62种基因，制作用于识别食管癌组织的SVM辨别机。第7列表示针对该基因的表达量算出食管癌组织的中央值(第5列)与正常组织的基因的表达量的中央值(第4列)后、两组中央值的差的绝对值从大到小的顺序。确定辨别机中使用的基因数时，按照第7列的顺序选择基因。制作辨别机时采用下述方法进行评价，即，在57例的食管癌病变部组织及食管癌非病变组织的组中，用除去1例后的56例制作辨别机，用剩余的1例计算辨别机的精度。结果，通过使用序列号63～124的多核苷酸的组合作为探针研究测定得到的基因表达，得到能够判断食管癌病变部组织和食管癌非病变组织的辨别机，所述辨别机利用序列号63～65、111、112这5个多核苷酸的组合能够以86.0％的准确率进行辨别，利用序列号63～67、111～115这10种多核苷酸的组合能够以87.7％的准确率进行辨别，利用序列号63～71、111～117这16种多核苷酸的组合能够以91.2％的准确率进行辨别，利用序列号63～75、111～117这20种多核苷酸的组合能够以93.0％的准确率进行辨别，利用序列号63～124这62种多核苷酸的组合能够以96％以上的准确率进行辨别(图1)。需要说明的是，仅以序列号112的多核苷酸为探针研究基因表达时，辨别食管癌病变部组织和食管癌非病变部组织的准确率为42.1％。

接下来，为了确认制作的辨别机能够辨别的混入来自食管癌患者的组织的不含食管癌组织的比例，将由食管癌组织得到的总RNA与由不含食管癌组织得到的总RNA以9∶1、8∶2、7∶3、6∶4、5∶5、4∶6、3∶7、2∶8、1∶9的比率进行混合，使用所得的RNA混合物(RNA cocktail)进行cDNA的制备、杂交及基因表达量的测定，得到数据。使用辨别机预测上述数据，所述辨别机制作了由55例患者得到的样品数据，结果含有食管癌组织的比例超过60％时，发现辨别机能够将数据辨别为癌部(图2)。

进而，为了确认制作的辨别机通常的精度，同样地从取得知情同意的进行食管活检的55名食管癌患者中获得食管的活检组织，采用相同的方法实施总RNA的提取和cDNA的制备、杂交及基因表达量的测定，得到数据。使用辨别机预测上述数据，所述辨别机制作了由55例患者得到的样品数据，结果可以以精度为85.5％的准确率辨别来自食管癌患者的食管癌组织和来自食管癌患者的不含食管癌的组织。另外，区分此时来自食管癌患者的不含食管癌的组织的准确率为100％(图3)。

[比较例1]

为了比较本发明的食管癌诊断用组合物和专利文献6(国际公开第2006/118308号)所述的食管癌诊断用组合物通常的精度，同样地从取得知情同意的进行食管活检的55名食管癌患者中获得食管的活检组织，采用本说明书中记载的方法实施总RNA的提取和cDNA的制备、杂交及基因表达量的测定，得到数据。使用辨别机预测上述样品数据，利用专利文献6所述的方法，使用辨别机预测专利文献6所述的食管癌诊断用组合物，结果辨别机可以以精度为61.8％的准确率辨别来自食管癌患者的食管癌组织和来自食管癌患者的不含食管癌的组织(图4)，非癌辨别用辨别机以精度为47.3％的准确率辨别来自食管癌患者的食管癌组织和来自食管癌患者的不含食管癌的组织(图5)。上述结果，与利用本发明的食管癌诊断用组合物和使用本发明的方法制作的辨别机辨别来自食管癌患者的不含食管癌的组织的准确率相比较低，专利文献6所述的食管癌诊断用组合物及专利文献6所述的方法对手术样品具有高精度，但对活检样品并不充分，本发明的食管癌诊断用组合物和本发明的方法占优势。

[比较例2]

利用本发明的方法，使用辨别机预测专利文献6(国际公开第2006/118308号)所述的食管癌诊断用组合物，结果以精度为74.5％的准确率辨别来自食管癌患者的食管癌组织和来自食管癌患者的不含食管癌的组织(图6)。上述结果与由本发明的食管癌诊断用组合物制作的辨别机的精度相比较低，专利文献6所述的食管癌诊断用组合物及专利文献6所述的方法对手术样品具有高精度，但对活检样品并不充分，本发明的食管癌诊断用组合物和本发明的方法占优势。

产业上的利用性

根据本发明，能够提供一种特异性、灵敏度优良的食管癌确定用组合物，至少在手术时或内窥镜检查时对辨别由食管癌患者采集的组织所含的食管癌组织的比例非常有用。

本说明书中引用的全部刊物、专利及专利申请直接作为参照引入本说明书。

Claims

1.一种食管癌诊断用组合物，其中，含有选自下述(a)～(e)所示的多核苷酸、其变异体或其片段中的3个以上多核苷酸：

(b)含有序列号1～38表示的碱基序列的多核苷酸，

(e)在严格条件下与所述(a)～(d)中的任一多核苷酸杂交的多核苷酸、或其含有15个以上连续碱基的片段。

2.如权利要求1所述的组合物，其中，所述片段为含有60个以上连续碱基的多核苷酸。

3.如权利要求2所述的组合物，其中，所述片段是序列号1～38中的任一个表示的碱基序列中分别含有序列号63～100中的任一个表示的碱基序列的多核苷酸，或含有与该多核苷酸的序列互补的碱基序列的多核苷酸。

4.如权利要求2所述的组合物，其中，所述片段是含有序列号63～100中的任一个表示的碱基序列、或含有与该碱基序列互补的碱基序列的多核苷酸。

5.如权利要求1～4中任一项所述的组合物，其中，还含有选自下述(f)～(j)所示的多核苷酸、其变异体、或其片段中的2个以上多核苷酸：

(g)含有序列号39～62表示的碱基序列的多核苷酸，

(j)在严格条件下与所述(f)～(i)中任一多核苷酸杂交的多核苷酸、或其含有15个以上连续碱基的片段。

6.如权利要求5所述的组合物，其中，所述片段为含有60个以上连续碱基的多核苷酸。

7.如权利要求6所述的组合物，其中，所述片段是序列号39～62表示的碱基序列中含有序列号101～124表示的碱基序列的多核苷酸、或含有与该多核苷酸的序列互补的碱基序列的多核苷酸。

8.如权利要求6所述的组合物，其中，所述片段是含有序列号101～124表示的碱基序列、或含有与该碱基序列互补的碱基序列的多核苷酸。

9.一种食管癌诊断用试剂盒，含有权利要求1～4中任一项所述的(a)～(e)所示的多核苷酸、其变异体及/或其片段中的3个以上。

10.如权利要求9所述的试剂盒，其中，还含有权利要求5～8中任一项所述的(f)～(j)所示的多核苷酸、其变异体、或其片段中的2个以上。

11.如权利要求9或10所述的试剂盒，其中，所述多核苷酸是由序列号1～62中任一个表示的碱基序列组成的多核苷酸、由其互补序列组成的多核苷酸、在严格条件下与所述多核苷酸杂交的多核苷酸、或其含有15个以上连续碱基的片段。

12.如权利要求11所述的试剂盒，其中，所述片段为含有60个以上连续碱基的多核苷酸。

13.如权利要求12所述的试剂盒，其中，所述片段是序列号1～62中的任一个表示的碱基序列中分别含有序列号63～124中的任一个表示的碱基序列的多核苷酸，或含有与所述多核苷酸的序列互补的碱基序列的多核苷酸。

14.如权利要求12所述的试剂盒，其中，所述片段是含有序列号63～124中任一个表示的碱基序列、或含有与该碱基序列互补的碱基序列的多核苷酸。

15.如权利要求14所述的试剂盒，其中，所述片段是由序列号63～124中任一个表示的碱基序列组成的多核苷酸。

16.如权利要求9所述的试剂盒，其中，含有5种以上至全部的含有序列号63～124表示的碱基序列或其互补序列的多核苷酸。

17.如权利要求9～16中任一项所述的试剂盒，其中，所述多核苷酸分别或任意组合包装在不同的容器中。

18.一种食管癌诊断用DNA芯片，其中，含有权利要求1～4中任一项所述的(a)～(e)所示的多核苷酸、其变异体、或其片段中的3个以上。

19.如权利要求18所述的DNA芯片，其中，还含有权利要求5～8中任一项所述的(f)～(j)所示的多核苷酸、其变异体、或其片段中的2个以上。

20.如权利要求18或19所述的DNA芯片，其中，含有5个以上～全部的含有序列号63～124表示的碱基序列或其互补序列的多核苷酸。

21.一种在体外确定来自受试者的受试样品中不含食管癌细胞、或含有食管癌细胞的方法，所述方法使用权利要求1～8中任一项所述的组合物、权利要求9～17中任一项所述的试剂盒、权利要求18～20中任一项所述的DNA芯片或它们的组合，测定来自受试者的生物试样中的靶核酸的表达水平，由此在体外确定来自受试者的受试样品中不含食管癌细胞、或含有食管癌细胞。

22.如权利要求21所述的方法，其中，使用DNA芯片。

23.一种确定食管癌的方法，所述方法包括以下步骤：

第1步骤，使用权利要求1～8中任一项所述的组合物、权利要求9～17中任一项所述的试剂盒、权利要求18～20中任一项所述的DNA芯片或它们的组合，体外测定多个生物试样中的靶核酸的表达量，所述生物试样是已知含有食管癌细胞的组织或正常组织；

第2步骤，以所述第1步骤中得到的所述靶核酸的表达量的测定值作为训练样本制作辨别式(支持向量机)；

第3步骤，与第1步骤相同地体外测定来自受试者食管的生物试样中的所述靶核酸的表达量；

第4步骤，将第3步骤中得到的所述靶核酸的表达量的测定值代入所述第2步骤中得到的辨别式，基于由所述辨别式得到的结果，判断来自受试者的生物试样中不含食管癌细胞、或含有食管癌细胞。

24.权利要求1～8中任一项所述的组合物、权利要求9～17中任一项所述的试剂盒、或权利要求18～20中任一项所述的DNA芯片在体外确定来自受试者的生物试样中不含食管癌细胞、或含有食管癌细胞中的应用。

25.一种体外确定来自受试者的生物试样中不含食管癌、或含有食管癌细胞的方法，所述方法包括：使用针对由序列号1～38表示的碱基序列编码的多肽的、3个以上的抗体或其片段，体外测定来自受试者的食管癌细胞或血液中的所述多肽的水平。

26.如权利要求25所述的方法，其中，还使用针对由序列号39～62表示的碱基序列编码的多肽的、2个以上的抗体或其片段，测定所述多肽的水平。

27.如权利要求25或26所述的方法，其中，所述多肽具有序列号125～186表示的氨基酸序列。

28.如权利要求25～27中任一项所述的方法，其中，与健康受试者相比，所述多肽的表达水平在患有食管癌的受试者中发生变化时，确定为食管癌。