CN103014155A

CN103014155A - 新型癌症标记物

Info

Publication number: CN103014155A
Application number: CN201210495659XA
Authority: CN
Inventors: 罗尔夫·I.·舍特海姆; 朗希尔德·A.·洛特; 古罗·E.·林德; 泰耶·C.·阿尔奎斯特
Original assignee: Oslo Universitetssykehus hf
Current assignee: Oslo Universitetssykehus hf
Priority date: 2007-02-21
Filing date: 2008-02-21
Publication date: 2013-04-03
Anticipated expiration: 2028-02-21
Also published as: JP5843840B2; CN104846092A; EP2808400A1; CN103014155B; JP2010518841A; US20100062440A1; EP2474629A1; EP2474629B1; JP5415963B2; EP2129796B1; EP2474628B1; ES2443230T3; CN101646783A; US20150176079A1; JP2014036672A; WO2008102002A2; EP2474627A1; EP2474628A1; WO2008102002A3; EP2474627B1

Abstract

本发明涉及一种新型癌症标记物。更具体地说，本发明涉及一种确定在呼吸消化系统内是否发生肿瘤，或者对所述肿瘤进行治疗后受试者是否复发的方法。本方法包括测定选自由CNRIP1、SPG20、FBN1、SNCA和INA所组成的组中一个或多个的基因的启动子区域、第一外显子或内含子中核酸序列中的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态。本方法还涉及用来测定呼吸消化道中的肿瘤的诊断试剂盒。

Description

新型癌症标记物

本申请是原申请的申请日为2008年02月21日，申请号为200880005551.X，发明名称为《新型癌症标记物》的中国专利申请的分案申请。

技术领域

本发明涉及一种用于癌症中基因启动子的超甲基化（hypermethylation）的新型标记物。更具体地说，本发明涉及一种测定在呼吸消化系统（aero-digestivesystem）内是否发生肿瘤，或者测定受试者对这种肿瘤进行治疗后是否复发的方法。本发明的方法包括测定一个或多个特定基因的启动子区域/序列中CpG位点的甲基化状态。本发明还涉及对这种甲基化的基因的使用和用来测定癌症的诊断试剂盒。

背景技术

在人类癌症中，受损的表观遗传学调节与基因突变同样普遍。这些机理在数量上和质量上发生了会导致选择性生长优势的基因表达变化，而这可能产生癌性转变的结果。在与转录失活有关的基因启动子内的异常超甲基化的CpG岛是癌症中最常见的表观遗传学变化（epigenetic change）。由于疾病的早期测定可能提高大多类型癌症的临床疗效结果，因此，对与癌症有关的异常的基因甲基化的确定反映了具有前景的新型生物标记物。对于呼吸消化系统中的癌症（包括结肠直肠癌）来说，开始的研究已经确定了异常甲基化的DNA在患者血液和粪中的存在。由于对高危腺瘤和低危时期癌瘤进行早期测定的潜在临床效应，已经存在于良性肿瘤中且仅少见于正常粘膜中高频率异常超甲基化的基因可能成为良好的候选诊断生物标记物。

然而，通常现有的用于呼吸消化系统癌症的早期标记物的灵敏度和特异性依然很差，并且到目前为止，仅少量的实际被筛选用于甲基化的基因显示了理想较高的灵敏度和特异性。根据马勒等人（Muller et al.）和陈等人（Chen et al.）的报道，在VIM（波形蛋白）和SFRP2中发现了特异性超甲基化，并且最近在来自林德等人（Lind et al）的报道中提出ADAMTS1和CRABP1在结肠直肠肿瘤中具有高频率的癌症特异性超甲基化，而NR3C1的超甲基化频率却要低得多。林德等人还确定了18种作为结肠直肠癌的潜在标记物的基因。在莫里等人（Mori et al.）的研究中，鉴于MAL的甲基化频率低（对应于仅6%的甲基化（2/34样品）），得出了林德等人所讨论的18种候选基因之一的T细胞分化蛋白MAL可能不是合适的用于呼吸消化道癌症的诊断生物标记物的结论。发明人对18种候选基因中的多个进行的进一步的分析也没有产生推动性的结果：NDRG1在所有被分析样品中未被甲基化；NR3C1虽然被甲基化，但是仅发生为非常低的频率，而且在随后的SDHA序列分析中不能证实该基因一致性，从而使其不适于作为癌症发展的标记物。

总而言之，不存在有这种启示：任何由林德等人所讨论的基因可以对目前的癌症检测技术做出改进。因此需要这样一组基因，其中的各个基因在癌症中被高频率且特异性地超甲基化。更具体地，需要这样一组基因：该基因在非侵入技术（例如涉及使用粪便样品的技术），或在可以用在易于获得的样品材料（例如血液或粘液）上的技术中是有用的。这种基因组可以极大地改进对这些癌症进行早期检测的可能。最终的目标可以为开发对仅少数（例如两种或三种）高频率的基因标记物中的超甲基化作用进行测定的诊断测试。

因此，需要确定其他的基因，在这些基因中，启动子区域内的CpG岛在癌症中以高频率被超甲基化。

发明内容

本发明建立在发明人对以下的实现：由林德等人确定为潜在标记物的特定基因亚群具有在呼吸消化癌症中以非常高的频率被甲基化的CpG位点。

因此，本发明的一个目的是提供一组用于癌症（例如呼吸消化系统中的癌症，特别是结肠癌和结肠直肠癌）的诊断标记物。该组标记物解决了用于癌症的大多数已知标记物中甲基化低特异性和低频率的问题。

因此，本发明的一方面涉及一种用来测定受试者是否已经发生、正在发生或易于发生癌症、或者受试者在癌症治疗后是否复发的方法，该方法包括以下步骤：

a）测定从所述受试者获得的样品中的至少一个基因内的启动子区域、第一外显子或内含子中核酸序列中的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，其中，所述基因选自由以下所组成的组中：

CNRIP1，例如由恩萨姆博（ensembl）（基因组结构注释数据库）基因编号ENSG00000119865、恩垂兹（entrez）（美国国家生物技术信息中心提供的在线资源检索系统）编号25927所确定；

SPG20，例如由ensembl基因编号ENSG00000133104、entrez编号23111所确定；

FBN1，例如由ensembl基因编号ENSG00000166147、entrez编号2200所确定；

SNCA，例如由ensembl基因编号ENSG00000145335、entrez编号6622所确定；和

INA，例如由ensembl基因编号ENSG00000148798、entrez编号9118所确定。

该方法还可以包括以下步骤：

b）与参照物比较甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态；和

c）如果甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态高于参照物的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，则将所述受试者确定为可能：发生了、正在发生或易于发生癌症、或在癌症治疗后复发，如果甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态低于所述参照物的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，则将所述受试者确定为不太可能：发生了、正在发生或易于发生癌症、或在癌症治疗后复发。

本发明的另一方面涉及一种用来测定受试者是否已经发生、正在发生或易于发生癌症、或者受试者在癌症治疗后是否复发的方法，该方法包括以下步骤：

a）测定来自受试者的样品内的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态

b）构建得自健康人群样品的所述至少一种基因的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态的百分位数图；

c）基于健康人群中测定的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态并基于患有癌症人群中测定的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，构建ROC（受试者操作特性）曲线；

d）从ROC曲线中选择所期望的灵敏度和特异性的结合；

e）从百分位数图测定相应于所测定的或选择的特异性的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态；和

f）如果样品中的所述至少一种基因的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态等于或高于相应于期望的灵敏度/特异性结合的所述甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，则预测受试者可能患有癌症，并且如果样品中的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态低于相应于期望的灵敏度/特异性结合的所述甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，则预测受试者不太可能患有癌症。

本发明还涉及用来测定癌症的诊断试剂盒，该诊断试剂盒含有一个或多个寡核苷酸引物或一组或多组寡核苷酸引物，它们中的每一个与选自以下的基因的核苷酸序列互补：

CNRIP1，例如由ensembl基因编号ENSG00000119865、entrez编号25927所确定；

本发明还涉及本发明的标记物的应用。因此，本发明进一步涉及：一个或多个选自由以下所组成的组中的基因在诊断分析中的应用：

INA，例如由ensembl基因编号ENSG00000148798、entrez编号9118所确定；

其中，对甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态进行评价，作为受试者是否发生了、正在发生或易于发生癌症、或受试者是否在癌症治疗后复发的指示物。

此外，本发明涉及核酸序列在诊断分析中的应用，其中，所述核酸含有选自由以下所组成的组中的核酸序列：

A）由SEQ ID NO.:6、SEQ ID NO.:7、SEQ ID NO.:9、SEQ ID NO.:13、SEQ ID NO.:14和SEQ ID NO.:16中的任意一个所定义的核酸序列；

B）与所述A）中所定义的序列互补的核酸序列；

C）所述A）或B）中所定义的核酸序列的子序列；

D）与所述A）、B）或C）中所定义的序列至少75%一致的核酸序列

本发明还提供了识别甲基化的核酸序列的抗体，所述核酸序列选自由以下所组成的组中：

B）与所述A）中所定义的序列互补的核酸序列；

C）所述A）或B）中所定义的核酸序列的子序列；

D）与所述A）、B）或C）中所定义的序列至少75%一致的核酸序列。

附图说明

图1

表示了代表性的甲基化特异性聚合酶链式反应，该聚合酶链式反应是由于对三种粘膜样品、三种腺瘤和三种癌瘤中的MAL进行分析而进行的。泳道（lane）U中的可见PCR产物说明了存在未被甲基化的等位基因，而泳道M中的PCR产物说明了存在被甲基化的等位基因。缩写：A，腺瘤；C，癌瘤；N，正常粘膜；POS，含有正常血液（针对未被甲基化样品的对照）以及体外被甲基化的DNA（针对甲基化的样品的对照）的阳性对照；NEG，阴性对照（含有水作为模板）；U，用于未被甲基化的MSP产物的泳道；M，用于被甲基化的MSP产物的泳道。本图示出了两组凝胶板的拼接（merge），因为腺瘤在独立的凝胶上电泳。

图2-4

图2-4示出了对最初被甲基化的细胞系进行表观遗传药物（epigeneticdrug）处理之后的基因表达的上调。单独使用脱甲基5-氮杂-2’-脱氧胞嘧啶核苷和与脱乙酰基酶抑制剂曲古抑菌素A结合使用进行处理后，在结肠癌细胞系中发现了上调的CNRIP1、INA和SPG20的mRNA表达。这些组分别（以线性比例的方式）示出了在单独使用5-氮杂-2’-脱氧胞嘧啶核苷（1uM和10uM）、曲古抑菌素A以及结合使用这两种药物（1μM的5-氮杂-2’-脱氧胞嘧啶核苷和0.5μM的曲古抑菌素A）对六份结肠癌细胞系（即，HT29、SW48、HCT15、SW480、RKO以及LS1034）进行处理之后，该六份结肠癌细胞系中的CNRIP1、INA以及SPG20的相对表达值。两种剂量（一种高，一种低）的5-氮杂-2’-脱氧胞嘧啶核苷在所有三个基因的相对表达值中产生类似的增大。这意味着，可以通过存在低剂量的5-氮杂-2’-脱氧胞嘧啶核苷的情况下对它们进行培养来实现细胞系的脱甲基化，考虑到该药物的细胞毒性，这是有利的。对于CNRIP1和INA而言，相比于单独使用5-氮杂-2’-脱氧胞嘧啶核苷和单独使用曲古抑菌素A进行处理，这两者的结合处理更加有效。结合处理还提高了SPG20的表达，然而，可以通过单独使用5-氮杂-2’-脱氧胞嘧啶核苷进行处理来达到类似的或者更高的再活化。如所预期的，单独使用脱乙酰基酶抑制剂曲古抑菌素A进行处理不会提高CNRIP、INA或者SPG20的基因表达。缩写：AZA，5-氮杂-2’-脱氧胞嘧啶核苷；TSA，曲古抑菌素A。

图5

示出了MAL启动子在正常结肠粘膜样品和结肠直肠癌瘤中的甲基化状态。图中示出了甲基化特异性聚合酶链式反应的具有代表性的结果。泳道U中的可见PCR产物说明了存在未被甲基化的等位基因，而泳道M中的PCR产物说明了存在被甲基化的等位基因。N，正常粘膜；C，癌瘤；Pos，阳性对照（未被甲基化的反应：来自正常血液的DNA；甲基化反应：体外被甲基化的DNA）；Neg，阴性对照（含有水作为模板）；U，用于未被甲基化的MSP产物的泳道；M，用于被甲基化的MSP产物的泳道。

图6

示出了MAL启动子中的位点特异性甲基化。对MAL启动子进行亚硫酸氢盐测序可以核实由甲基化特异性聚合酶链式反应所评价的甲基化状态。附图上部分是CpG位点经两个被分析的亚硫酸氢盐测序的片段（即，A（右侧的第-68至第+168）和B（左侧的第-427至第-85））成功扩增之后的示意图。转录起始位点由+1表示，垂直块表示单个CpG位点的位置。两个箭头说明了MSP引物的位置。对于附图的下部分而言，实心圆表示被甲基化的CpG；空心圆表示未被甲基化的CpG；而具有斜杠的空心圆表示被部分甲基化的位点（除胸腺嘧啶之外，还存在大约20-80%的胞嘧啶）。位于所述附图下部分右侧的U、M和U/M的量列出了通过使用MSP分析所评价的各个细胞系的甲基化状态。缩写：MSP，甲基化特异性PCR；s，正义；as，反义；U，未被甲基化的；M，被甲基化的；U/M，存在未被甲基化的和被甲基化的条带。

图7

示出了MAL启动子的“亚硫酸氢盐测序”。该图为结肠癌细胞系中的MAL启动子的代表性亚硫酸氢盐测序电泳图。

所述亚硫酸氢盐测序电泳图覆盖了相对于转录起始位点的第+11至+15的CpG位点。CpG位点中的胞嘧啶由黑色箭头表示，而已经被转换为胸腺嘧啶的胞嘧啶被标有红色下划线。在此所示的MAL启动子测序电泳图来自未被甲基化的V9P细胞系和超甲基化的ALA和HCT116。

图8

示出了癌症细胞系和结肠直肠癌瘤中的MAL表达。在体外模型中，MAL的启动子超甲基化是与基因表达的减小或者丧失有关的。MAL定量基因表达被表示为两个MAL分析（检测各种剪切变体）的平均值与两个内源性对照（GUSB和ACTB）的平均值之间的比值。将该值乘以系数1000。以下示出了甲基化特异性聚合酶链式反应所评价的每个样品各自的甲基化状态。实心圆表示MAL启动子超甲基化，空心圆表示未被甲基化的MAL，而具有斜杠的空心圆表示存在未被甲基化的等位基因和被甲基化的等位基因。将结肠直肠癌瘤被未被甲基化的组（n=3）和被超甲基化的组（n=13），在此示出了中间表达式。在表1中能够找到个体细胞系来源的组织。

图9

示出在进行药物治疗之后MAL表达的上调。在单独使用脱甲基5-氮杂-2’-脱氧胞嘧啶核苷和与脱乙酰基酶抑制剂曲古抑菌素A结合使用进行处理之后，发现结肠癌细胞系中mRNA表达上调之后，MAL启动子甲基化减小。上方组表明在单独使用5-氮杂-2’-脱氧胞嘧啶核苷、单独使用曲古抑菌素A、以及结合使用这两种药物进行治疗之后，两份结肠癌细胞系（HT29和HCT15）中的MAL的相对表达值（线性比例的方式）。下方组说明了相同样品的MAL的MAP结果。泳道U中的可见PCR产物说明了存在未被甲基化的等位基因，而泳道M中的PCR产物说明了存在被甲基化的等位基因。缩写：AZA，5-氮杂-2’-脱氧胞嘧啶核苷；TSA，曲古抑菌素A；Pos，（未被甲基化的反应：来自正常血液的DNA；被甲基化的反应：体外的被甲基化的DNA）；Neg，阴性对照（含有水作为模板）；U，用于未被甲基化的MSP产物的泳道；M，用于被甲基化的MSP产物的泳道。

图10

示出了结肠直肠癌瘤中的MAL表达。在肾小管（A）中发现了MAL的阳性细胞质染色，而在心肌（B）中没有发现任何染色，这与早期的报告（马拉祖厄拉M等人，组织化学和细胞化学杂志2003,51:665-674（Marazuela M,et al J Histochem Cytochem 2003,51:665-674））相符。结肠直肠癌瘤的上皮细胞为MAL阴性（C，D），而在正常结肠组织中，会在上皮细胞和结缔组织（E，F）中发现MAL的细胞质表达。所有图像均通过使用40×透镜（400×放大倍率）拍摄得到。

下面，将对本发明进行更详细的描述。

具体实施方式

定义

除非另有说明，本文使用的所有技术术语和科技术语具有本发明所属技术领域普通技术人员通常知晓的意思。虽然在实践中或对本发明进行的测试中可以使用于本文所描述类似或等价的任意的方法或材料，但是在此描述的优选的方法和材料。为了本发明的目的，对以下术语进行定义：

表观遗传学（Epigentics）

甲基化是一种表观遗传学变化，它被定义为不基于序列发生的通过细胞分裂而继承的。

甲基化

本文中的“超甲基化”仅指高于参照物甲基化的甲基化。参照物甲基化是来自健康受试者样品或正常组织中基因的甲基化。因此，甲基化的基因（而该基因在正常组织中未被甲基化）将被归类为超甲基化。

“甲基化状态”是在至少一种核酸序列中一个或多个CpG位点内存在或不存在甲基修饰的度量。应该理解的是，优选在多份具体的目标基因中对一个或多个CpG位点的甲基化状态进行测定。

“甲基化水平”表达了在一份或多份目标基因或核酸序列中甲基化的量。该甲基化水平可以被计算为目标基因或核酸序列中甲基化的绝对度量。此外，“相对甲基化水平”可以被测定为相对于存在的DNA总量的甲基化的DNA的量，或被测定为相对于基因或核酸序列总份数的目标基因或核酸序列甲基化的份数。另外，“甲基化水平”可以被测定为在感兴趣DNA段（DNA stretch）内的甲基化的CpG位点的百分数。

术语甲基化水平还包括了这样的情况：其中，在例如启动子区域内的一个或多个CpG位点被甲基化，但是甲基化的量低于扩增阈值（amplificationthreshold）。因此，甲基化水平可以是在感兴趣基因中甲基化的量的估计值。

本发明不以任何方式受到用来测量根据本发明的基因的甲基化状态或甲基化水平的特定的类型的分析的限制。

在一种事实方式中，如果感兴趣基因的甲基化水平为15%-100%，例如50%-100%，更优选为60-100%，更优选为70-100%，更优选为80%-100%，更优选为90%-100%。因此，本发明的一种实施方式中，根据本发明的基因的甲基化水平为80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。

CpG

“CpG位点”是DNA区域，其中，沿线性碱基序列长度方向上，胞嘧啶核苷酸紧接着鸟嘌呤核苷酸产生。“CpG”表示的是被磷酸酯间隔开的胞嘧啶和鸟嘌呤，所述磷酸酯在DNA中将这两个核苷酸连接在一起。“CpG”这一符号用来将紧邻鸟嘌呤的胞嘧啶与鸟嘌呤进行碱基配对的胞嘧啶进行区分。

CpG岛可以被定义为至少200个碱基对的DNA连续视窗，其中，G：C含量至少为50%，且观察到的超过预期频率的CpG率的比例超过0.6。然而，还可以以更严格的定义对它们进行定义：500个碱基对的视窗（window），其中G：C含量至少为55%，并且观察到的超过预期的CpG率至少为0.65。

启动子区域或序列

“启动子区域或序列”包括了从给定基因的转录起始位点向上游延长1000bp的连续核酸序列，和从转录起始位点向下游延长300个碱基对的连续核酸序列。在这种序列表中，上游序列以小写字母表示而下游序列以大写字母表示。在序列的3’部分中，小写字母表示内含子序列。

转录起始位点

本发明涉及的“转录起始位点”是描述转录发生的点。转录可以在基因内的一个或多个位点中发生，并且一个基因可以具有多个转录起始位点，它们中的一些可以对特定细胞类型或组织内的转录具有特异性。

核酸序列的甲基化

基因是DNA中起到产生并对多肽链进行调控的区域。基因包括编码部分和非编码部分，包括内含子、外显子、启动子、起始子（initiator）、增强子、终止子、微RNA和其他调控元件。本文使用的“基因”表示的基因的至少一部分。因此，例如说，“基因”可以被认为是为了本发明目的的启动子。所以，在本发明的一种实施方式中，一组基因中的至少一个成员含有整个基因的非编码部分。在一种具体的实施方式中，基因的非编码部分为启动子。在另一种实施方式中，在全组基因中的所有成员含有基因的非编码部分，例如但不限于，内含子。在另一种具体实施方式中，基因成员的非编码部分为启动子。在本发明的另一种实施方式中，一组基因中的至少一个成员含有基因的编码部分。在另一种实施方式中，全组基因的所有成员含有基因的编码部分。

术语“核酸序列”指的是单链或双链形式的脱氧核糖核苷酸的聚合物。

“子序列”指的是整个序列中的任意部分。因此，子序列指的是较长的核酸序列（例如，多核苷酸）中氨基酸或核酸的连续序列。

术语“序列一致性”指的是在两个相同长度的核酸序列之间的同源性程度的定性度量。如果这两个待比较序列长度不同，则必须将它们对齐以产生最佳的可能匹配，以允许插入间隔，或可选择地在多肽序列或核苷酸序列的端部进行切断。这种序列一致性可以按

进行计算，其中，N_dif是对齐时两个序列中不一致残基的总量，并且其中N_ref是序列之一中的残基的量。因此，DNA序列AGTCAGTC与序列AATCAATC的序列一致性为75%（N_dif＝2且N_ref＝8）。将甲基计算为不一致的特定残基，即，DNA序列AGTGTC与DNA序列AGTCAGTC的序列一致性为75%（N_dif＝2且N_ref＝8）。

对于本发明的全部涉及核苷酸序列的权利要求，一个或多个序列之间的序列一致性百分数也可以建立在使用聚类W（clustalW）软件（http:/www.ebi.ac.uk/clustalW/index.html）在默认设置下进行比对的基础上。对于核苷酸序列比对，这些设置为：比对=全三维（3Dfull），间隙开口（Gap Open）10.00，间隙延伸（Gap Ext.）0.20，间隙间隔距离（Gap separation Dist.）4，DNA权重矩阵（DNAweight matrix）：一致性（国际生物化学联合会（IUB））。可选择地，可以使用DNASIS Max程序对序列进行分析，并且可以在www.paralign.org进行序列比较。该服务基于被称为史密斯-华特曼（Smith-Waterman，SW）和ParAlign的两组比较算法。第一个算法是由史密斯和华特曼出版的（1981），并且是一种众所周知的寻扎两个序列的最佳局部比对的方法。另一种算法ParAlign是用于序列比对的启发式方法；关于该方法的细节由罗格勒斯等人（Rognes et al.）公布。使用用于评分矩阵和和空位罚值（Gap penalties）以及E值（E-values）。

在本发明的内容中，“互补”指的是两个核苷酸序列彼此之间精确配对的能力。例如，如果在寡核苷酸特定位置处的核苷酸能与DNA分子相应位置的核苷酸通过氢键连接，则认为该寡核苷酸和DNA在该位置处彼此互补。当寡核苷酸内足够多数量的核苷酸能与靶DNA中相应的核苷酸形成氢键从而促使稳定复合物形成时，认为DNA链彼此互补。

因此，本文中“互补序列”或“补体”的表述也指的是在严格性条件下能够退火到本发明的核酸分子的核苷酸序列。

术语“严格性条件”指的是高严格性条件、弱严格性条件或低严格性条件。

术语“严格性”是本领域公知的，并且用来描述进行核酸杂交的条件（温度、离子强度和其他化合物的存在，例如有机溶剂）。与“弱”或“低”严格性条件相比，“高严格性”条件中的核酸碱基配对将仅发生于核酸片段之间，该核酸片段具有高频率的互补碱基序列。对杂交进行测试的合适的条件包括在5×SSC中进行预浸泡，并在20%的甲酰胺、5×丹哈德溶液（Denhardt's solution）、50mM的磷酸钠（pH为6.8）、和50mg的超声变性小牛胸腺DNA的溶液中在约40℃下进行预杂交1小时，接着在补充了100mM ATP的相同溶液中在约40℃下杂交18小时，接着在30分钟内40℃下用2×SSC，0.2%SDS洗涤过滤器3次（低严格性），优选在50℃下（中等严格性）、更优选在65℃下（高严格性）、更优选在约75℃下（非常高的严格性）。更具体的杂交法记载于萨姆布鲁克等人，分子克隆：实验室手册，第二版，冷泉港，1989（Sambrook etal.,Molecular Cloning:A Laboratory Manual,2nd Ed.,Cold Spring Harbor,1989）。

癌症

“癌症”是这样一组疾病，其中细胞具有攻击性（生长和分裂不受到常规限制）、侵入性（侵入并摧毁临近组织），而且有时候具有转移性（蔓延至体内其它位置）。癌症的这三种恶性特性将与良性肿瘤区分开来，所述良性肿瘤的生长具有自限性，并且通常不会发生侵入和转移。

通常根据产生癌细胞的组织和与它们最相似的正常细胞对癌症进行划分。确切的诊断通常需要由病理学家对组织活检标进行组织学检查。癌症患者的预后很大程度地受到癌症类型和阶段或疾病的程度的影响。早期诊断通常关系到更成功的治疗和提高的存活率。

“肿瘤抑制基因”是通常在癌症细胞内失活的基因，导致这些细胞的正常功能丧失，例如精确的DNA复制、对细胞周期的控制、在组织内的定向和附着，以及与免疫系统的防卫细胞互相作用。在包括结肠直肠癌的一些癌症中，已经确认CpG岛启动子超甲基化使多个肿瘤抑制基因被表观遗传学地失活。

无论该术语在本文中作出何种解释，肿瘤可以为任何异常的肿胀（swelling）、肿块（lump）或块（mass），该术语表示瘤（neoplasm），特别是实质瘤（solid neoplasm）。瘤被定义为基因发生改变的细胞的异常增殖。瘤可以为良性的也可以为恶性的。恶性瘤或恶性肿瘤在此应该为理解成癌症。良性瘤或良性肿瘤是通常自身停止生长的肿瘤（实质瘤），并且不侵入其它组织液不形成转移。然而，良性肿瘤可以变成恶性的。

侵入周围组织的肿瘤在本文中被理解成癌症。癌变前（pre-malignancy）、癌前期（pre-cancer）或非侵入肿瘤在本文中被理解为瘤，它不具有侵入性但如果不进行治疗将具有发展为癌症（变得具有侵入性）的可能。

根据本发明的方法可以用来测定严重程度（即，期），例如杜克系统（Dukessystem）、Astler-Coller系统和恶性肿瘤国际临床病期分期美国癌症联合会（TNM staging AJCC（American joint committee on cancer））。杜克系统是将结肠直肠癌瘤从A到D划分成4类的分期系统，它建立在肿瘤程度的基础上：A，穿入但未穿过肠壁；B，穿透肠壁；C，无论肠壁穿过的程度淋巴结发生转移；D，癌症向远处器官（例如肝脏和肺）转移。对这种分类存在许多改进，例如TNM分期。

生物标记物

生物标记物可以为这样的物质，对它的检测说明了具体的疾病状态。生物标记物还可以说明蛋白质表达或状态的改变，该蛋白质与疾病风险或进展有关，或与疾病对给定治疗的感受性有关。良好的生物标记物可以用来诊断疾病风险、个体中疾病的存在或对个体中疾病进行量身化的治疗（tailor treatments）。术语生物标记物和标记物在本文中可互换使用。

癌症标记物、肿瘤标记物极易在本文中的甲基化标记物是用来检测癌症和/或肿瘤的标记物。该标记物可以用来检测受试者内癌症和/或肿瘤的存在，或癌症和/或肿瘤的发展、或受试者是否倾向于或已经从癌症和/或肿瘤复发。

根据本发明的基因可以分别为标记物、生物标记物、癌症标记物或肿瘤标记物。

肿瘤进展（Tumour progression）

除了测定受试者是否发生或、正在发生或可能发生癌症，或者受试者在癌症治疗后是否复发，根据本发明的方法还可以用来检测受试者内的癌症进展。这可以通过在不同的时间点对受试者内的一个或多个基因的甲基化状态或水平进行测定，并随后测定一个或多个基因的甲基化状态或水平随时间产生的不同。甲基化状态或水平随时间的不同可以说明受试者是否已经发生、正在发生或易于发生癌症、或者受试者在癌症治疗后是否复发。

本发明还提供了对人类癌症患者中病程做出预后的方法。出于本发明的该目的，术语“预后”包括疾病进展（特别是肿瘤复发、转移扩散和疾病复发）的预测和似然分析。本发明的预后方法可以在临床上使用，做出与治疗模式有关的判断，包括治疗介入、诊断标准（例如疾病分期、疾病监测）和对转移或瘤疾病复发进行监督。本文中的治疗应该被理解为预防性治疗和根治性治疗。

本发明的方法还提供了用来证实通过前述方法（例如测试或筛选方法）获得的结果或指示的方法。

因此，本文使用的短语“已经发生、正在发生或易于发生癌症、或者受试者在癌症治疗后是否复发”包括了测定和/或预测，例如对目前存在的、将来存在或将来复发的癌症的可能性的估计或测定。

样品

样品可以是但不限于组织切片或活检，例如正在被治疗的瘤的一部分，或者也可以周围正常组织的一部分。该样品可以优选为但不限于血液、粪便（粪）、尿、胸水、胆汁、支气管液（bronchial fluid）、口腔洗出液（oral washings）、组织活检、腹水、脓、脑脊髓液、抽出物（aspitate）、滤泡液、组织或粘液。可以在进行分析直线对样品进行处理。例如说，可以将样品进行稀释、浓缩或提纯和/或将至少一种化合物（例如内标物）加入到样品中。对不同的样品进行处理的方法是本领域技术人员已知的。

应该理解的是，优选根据本发明的所有的方法涉及对样品的体外分析。

样品甲基化频率

术语“样品甲基化频率”在本文中被定义为甲基化样品的定量测量，即，样品的相对量，该样品中感兴趣基因被甲基化。例如说，CNRIP1的样品甲基化频率为100%，20份来自结肠细胞系的样品中的20份全部被甲基化，如表3所示。甲基化样品的相对于与参照物或简历在各个基因的灵敏度和特异性的基础上进行估计的截止点水平进行比较。

参照物

为了测定受试者是否已经发生、正在发生或易于发生癌症、或者受试者在癌症治疗后是否复发，必须建立参照物或参考水平或参考值。参考物也可以包括在分析和方法变量、试剂盒变量、操作变量、与将标记物彼此结合或者与其他已知的标记物结合有关的变量，和其他不与甲基化直接或间接有关的变量。

在本发明的内容中，术语“参照物”涉及与数量、质量或类型有关的标准，可以将其他的值或特征对它们进行比较，例如标准曲线。

应该将本文中的参照物或参考水平理解为值或水平，该值或水平已经通过测量健康对照人群和患有已知癌症人群中的参数（甲基化状态或甲基化水平）而被测定，从而在分析健康对照人群和癌症患者人群的参数值和已知的临床数据之间关系的基础上，对参考值进行测定，该参考值确定了具有预定特异性或预定灵敏度的癌症人群。

如本领域技术人员通常能理解地，用来筛选癌症的方法是通过比较做出判断的过程。对于任何做出判断的过程来说，建立在患有癌症或感兴趣病况的受试者和/或未患有癌症的受试者基础上的参考值、参考水平或截止点，或感兴趣病况是需要的。

可以考虑了多个标准后建立参考值（或截止点或截止水平），包括可接受数量的可能继续进行进一步侵入诊断测试的受试者、可能继续进行进一步侵入诊断测试的受试者患有和/或发生例如癌症的平均风险）、任何患者特异性风险高于特定风险水平，例如1/400或1：250（通过对组织或单个受试者进行扫描而确定）的患者应该继续进行进一步侵入诊断测试的判断，或其他本领域技术人员已知的标准。

可以给予多个标准对参考水平进行调整，例如但不限于所测试的特定个体组。例如，在患有免疫缺陷的个体和具有发展成活动性疾病的高危患者中，可以将截止水平设定得较低，或者在发展成活动性疾病的低危健康个体的组中，可以将参考水平测定得较高。

参考水平可以对不同时期的疾病（例如，良性肿瘤或恶性肿瘤）、正常粘膜来源（来自未患癌症个体对癌症患者）或血液或粪便来源而有不同。此外，参考水平可以对于易感染疾病患者或在疾病治疗后复发患者而有不同。

可以定制参考水平来适应特定的灵敏度或特异性：如果希望测试具有高灵敏度，则可以将参考水平设定得低。如果寻求高特异性测试，可以将特异性设定得较低。

根据疾病的流行或预期的流行，可以调整参考水平以获得尽可能少的假阳性或假阴性结果，这依赖于疾病的严重程度和测定结果、患者是否对测试为阳性或对测试为阴性。

用来测量甲基化的方法，所选的部分核酸序列包括标记物基因的启动子区域或其他产生其他参考值的参数，可以根据本文所教导来测定该参数。

如果单个患有待诊断或测试的症状的患者参与了对人群中大量个体进行的筛选，参考水平可以不同。

参考值水平可以建立在对不同标记物（例如但不限于CNRIP1、SPG20、FBN1、SNCA、INA、MAL、ADAMTS1、VIM、SFRP1和/或SFRP2）结合的甲基化状态或水平测量上。复合参考水平可以产生其他值，这可以根据本发明的教导而被测定。

将甲基化水平与异族参考数据或参考水平进行比较（例如截止值），以确定受试者是否有增加的癌症风险或可能性。

特异性和灵敏度

任意给定筛选测试的灵敏度是被该测试正确地识别或诊断的患有病况的个体的比例，例如，如果所有具有给定病况的个体具有阳性测试，则灵敏度为100%。给定筛选测试的特异性是被该测试正确地识别或诊断未患有病况的个体的比例，例如，所有未患有该病况的个体具有阴性测试结果，则特异性为100%。

因此，将灵敏度定义为（真阳性测试结果的数量）/（真阳性测试结果的数量+假阴性测试结果的数量）

将特异性定义为（真阴性结果的数量）/（真阴性结果的数量+假阳性结果的数量）

根据本发明的基因特征在于：具有高的灵敏度（含有被甲基化的感兴趣基因的样品的相对量高，该样品来自癌症受试者）和高特异性（含有被甲基化的感兴趣基因的样品的相对量低，该样品来自未患有癌症的受试者）

一种用于癌症的良好标记物是这样一种基因：当受试者患有癌症时，该基因在几乎全部的样品中被甲基化而当样品是来自未患癌症的受试者时，该基因不被甲基化。

根据本发明的方法，特异性优选为70%-100%，例如75-100%，更优选为80%-100%，更优选为90%-100%。因此，在本发明的一种实施方式中，本发明的灵敏度为75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。

根据本发明的方法，灵敏度优选为80%-100％，更优选为85%-100％，更优选为90%-100%。因此，在本发明的一种实施方式中，本发明的灵敏度为80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。

应该理解的是，根据本发明的标记物可以结合使用于本发明的方法中。当与涉及使用单个标记物的分析相比，结合使用多个标记物可能提高分析的特异性和/或灵敏度。因此，当结合使用多个标记物时，可以接受各个标记物比的特异性和灵敏度低于上述规定。

如表3中所阐述的实施例，基因CNRIP1在20份来自结肠癌细胞系中所有20份样品（100%）中和48份腺瘤样品中的45份中（94%）被甲基化——也就是说，该基因具有高灵敏度，对检测疾病的可能性对各个样品为100%和94%。鉴于来自正常组织样品中的相同基因的甲基化为0/21，因此该基因具有高特异性，检测假阳性的机会为0并检测出所有未患有癌症的患者。在21份来自癌症患者的正常粘膜样品中有9份表现出被甲基化，这说明可以在原理肿瘤的位置检测到癌症。

受试者操作特性

诊断测试的准确性通过其受试者操作特性（receiver-operatingcharacteristics，ROC）而得到最佳描述（特别参见茨威格，M.H.和坎贝尔，G.临床化学39(1993)561-577（Zweig,M.H.,and Campbell,G.,Clin.Chem.39(1993)561-577））。ROC图是由在整个观察到的数据范围内，连续改变参考水平得到的所有灵敏度/特异性对的图。

实验室试验的临床表现取决于其诊断的准确性，或将受试者正确地划分至临床上有关的分组中的能力。诊断的准确性衡量了测试将被研究受试者的两种不同病况进行区分的能力。这种病况为例如健康和疾病、潜伏或新近感染对未感染，或良性对恶性疾病。

在各个情况中，ROC图通过在判断阈值完整范围内对灵敏度对1－特异性作图来描述两种分布之间的重叠。y轴为灵敏度，它对整个被感染的分组进行计算。x轴为假阳性部分，或1－特异性，它对整个未被感染的分组进行计算。

由于通过使用来自两组不同分组的结果完全独立地对灵敏度和特异性进行计算，ROC图独立于样品中疾病的流行。在ROC图上的每一个点反映了相对于具体判断阈值的灵敏度/特异性对。具有优秀辨别力的测试的ROC图（两个结果的分布中没有重叠）穿过了左上角，其中真阳性部分为1.0或（100%）（完全灵敏度），且假阳性部分为0（完全特异性）。对于不具有辨别力的测试的理论图（两组结果的分布相同）为从左下角到右上角的45°对角线。大部分的点落入这两个极端之间（如果ROC图完全落入45°对角线以下，这可以通过简单地将对“阳性”的标准由“大于”改成“小于”就可进行调整，反之亦然）。定量地，点越接近左上角，测试的整体准确性就越高。

一种便利的用来确定实验室测试的诊断准确性的目标是通过一个数来表示其性质。最普遍的通用测量师ROC图下面积。按惯例，该面积通常≥0.5（如果不是，可以颠倒判断规则使其变为是）。值在1.0（两组测试值完全分离）至0.5（两组测量值之间没有明显的分布区别）的范围之间。该面积不仅依赖于图的具体部分（例如最接近对角线或特异性为90%的灵敏度处的点）二是整个图。这是对ROC图多么接近于理想图（面积=1.0）定量的描述性表达。

新型癌症标记物基因的临床应用可以通与给定癌症的其他标记物的比较和结合来进行评价，例如通过与已建立的诊断工具进行比较而进行评价的新型癌症标记物CNRIP1、SPG20、FBN1、SNCA、INA和MAL的临床应用，例如测量相应的或者已建立的甲基化标记物（例如但不限于ADAMTS1、VIM、SFRP1、SFRP2和CRABP1）的表达水平。

风险评估和截止

为了测定受试者是否处于发生例如癌症的高风险中，必须建立阳性测试的截止界限。该截止可以通过实验室、医生或基于每个受试者的病例来建立。

可选择地，截止可被测定为阴性对照组（例如，未患有癌症）的平均值、中数值或几何平均数+/－一个或多个标准偏差或由标准偏差得到的值。

根据本发明的用于阳性测试结果的截止界限为甲基化状态或水平，其中甲基化是对癌症的指示物。

另一截止点可以是在将被测定为会发生甲基化的基因中需要被甲基化的CpG位点的数量。

本发明成功确定了新型的癌症标记物。在选自CNRIP1、SPG20、FBN1、SNCA、INA和MAL中的基因的核酸序列的启动子区域中，受试者内的CpG位点的甲基化状态或水平会随着癌症而增大，从而这些基因是用于检测例如癌症的有效标记物。

截止点可基于受测个体的特定条件而变化，例如但不限于患病风险、职业、地理居所或受照量（exposure）。

截止点可基于受测个体的特定条件而变化，例如但不限于年龄、性别、遗传背景（例如，HLA型）、后天的或遗传的受损免疫功能（例如HIV感染、糖尿病、肾衰竭或肝衰竭的患者、进行免疫调节药物（例如但不限于皮质类固醇、化学疗法、TNF-α阻断剂、有丝分裂抑制剂）治疗的患者）。

对于判断或截止界限进行调整，如果存在癌症，则测定检测癌症的测试灵敏度，如果低于所述界限，则测定其排除癌症或者疾病的特异性。因此，原则是：高于截止点的值表示增加的风险，而低于截止点的值表示减小的风险。

表达

多个肿瘤抑制基因已经被证实由于CpG导启动子甲基化而被失活。例如MLH1基因，其中在转录起始位点上游的约200个碱基对的有限数量的CpG位点的超甲基化始终与基因表达的缺失有关。

本发明对来自多个组织的癌症细胞系的分析说明了在接近MAL转录起始位点的有限区域内的超甲基化是与基因表达的减少或丧失有关的。在用表观遗传学药物处理之前和之后的源自结肠癌细胞系分析的定量基因表达结果说明了这对SPG20、INA和CRNIP1也是正确的。

因此，对甲基化状态或水平，以及感兴趣基因的表达的测量提高了本发明的特异性和灵敏度。

方法

本发明是建立在发现了选自由林德等人在先讨论的21中基因中的6种基因的特定亚群内的基因的基础上，该基因在癌症中（例如结肠直肠癌）以非常高的频率发生超甲基化。这些及其合适的超甲基化标记物物包括CNRIP1、SPG20、FBN1、SNCA、INA和MAL。这种对例如MAL的发现与在直肠结肠癌中发现MAL的超甲基化频率低的在先报道是相矛盾的。

本发明的一方面提供了用来测定受试者是否已经发生、正在发生或易于发生癌症、或者受试者在癌症治疗后是否复发的方法，该方法包括以下步骤：

CNRIP1，例如由ensembl（基因组结构注释数据库）基因编号ENSG00000119865、entrez（美国国家生物技术信息中心提供的在线资源检索系统）编号25927所确定；

在一种实施方式中，癌症为肿瘤，例如在呼吸消化系统中的肿瘤（良性的或恶性的）。

该方法还可以包括以下步骤：

本发明的另一方面提供了用来测定受试者是否已经发生、正在发生或易于发生癌症、或者受试者在癌症治疗后是否复发的方法，该方法包括以下步骤：

d）从ROC曲线中选择所期望的灵敏度和特异性的结合；

更具体地说以上所描述的方法包括测定核酸序列中的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态的方法，所述核酸序列含有选自由以下所组成的组中的序列：

B）与所述A）中所定义的序列互补的核酸序列；

C）所述A）或B）中所定义的核酸序列的子序列；

上述方法还可以包括测定附加基因的核酸序列中CpG位点的甲基化状态，所述附加基因选自由以下所组成的组中：

A）由SEQ ID NO.:1、SEQ ID NO.:2、SEQ ID NO.:3、SEQ ID NO.:4、SEQ ID NO.:5、SEQ ID NO.:8、SEQ ID NO.:10、SEQ ID NO.:11、SEQ ID NO.:12、SEQ ID NO.:15和SEQ ID NO.:16中的任意一个所定义的核酸序列

B）与所述A）中所定义的序列互补的核酸序列；

C）所述A）或B）中所定义的核酸序列的子序列；

在另一种实施方式中，本发明的方法包括测定MAL的启动子区域内的CpG位点的甲基化状态。根据该实施方式，所述核酸序列为，

A）由SEQ ID NO.:1所定义的核酸序列

B）与所述A）中所定义的序列互补的核酸序列；

C）所述A）或B）中所定义的核酸序列的子序列；

序列标识1-16代表了上述基因的核酸序列。本领域技术人员可以理解的是，对这些序列中的和它们的互补序列中的CpG位点的甲基化状态进行分析属于本发明的范围。

下表理出了根据本发明的基因，以及相对应的ID号、序列标识和别名。

根据本发明的核酸序列列于序列表中。各个序列具有以下提及的为从5’到3’方向的顺序：核酸残基的连续序列位于转录起始位点上游的1000bp区域内（以小写字母表示），之后是位于该转录起始位点下游的核酸残基的连续序列（以大写字母表示）和核酸残基的内含子序列（以小写字母表示）。

可以针对分析特定序列而进行本发明的方法，如上述C）项中所提出的。根据这些实施方式，C）中的子序列的长度为至少8个核酸残基，例如长度为至少9个核酸残基、至少10个核酸残基、至少11个核酸残基、至少12个核酸残基、至少13个核酸残基、至少14个核酸残基、至少15个核酸残基至少20个核酸残基、至少25个核酸残基、至少30个核酸残基、至少35个核酸残基、至少40个核酸残基、至少45个核酸残基、至少50个核酸残基、至少70个核酸残基，或例如长度为至少90个核酸残基。通常期望针对特定长度的序列进行分析，以确保该方法足够灵敏。

出于实践目的，还期望最小化子序列的长度，在本发明的方法中对所属子序列进行甲基化研究。因此，可以期望C）中的所述子序列的长度最多为10个核酸残基、最多13个核酸残基、最多14个核酸残基、最多15个核酸残基、最多20个核酸残基、最多25个核酸残基、最多30个核酸残基、最多35个核酸残基、最多40个核酸残基、最多45个核酸残基、最多50个核酸残基、最多70个核酸残基、最多90个核酸残基、最多110个核酸残基、最多150个核酸残基，或例如最多200个核酸残基。

根据具体地，可以期望C）中的所述子序列的长度为8-200个核酸残基，例如长度为8-150个核酸残基、8-100个核酸残基、8-75个核酸残基、8-50个核酸残基、9-200个核酸残基，例如长度为9-150个核酸残基、9-100个核酸残基、9-75个核酸残基、9-50个核酸残基，例如长度为10-200个核酸残基、10-150个核酸残基、10-100个核酸残基、10-75个核酸残基、10-50个核酸残基，例如长度为11-200个核酸残基、11-150个核酸残基、11-100个核酸残基、11-75个核酸残基、11-50个核酸残基，或例如长度为12-200个核酸残基，例如长度为12-150个核酸残基、12-100个核酸残基、12-75个核酸残基，或例如长度为12-50个核酸残基。

根据本发明的基因启动子区域列于下表：

HGNC名称	Entrez	Ensemb	SEQ ID NO.
				MAL	4118	ENSG00000172005	17-20
FBN1	2200	ENSG00000166147	22
				CNRIP1	25927	ENSG00000119865	23
SPG20	23111	ENSG00000133104	25
				SNCA	6622	ENSG00000145335	29、30
INA	9118	ENSG00000148798	32

对于各个上述基因来说，发明人确定了在本发明的方法中特别有用的子序列。对于MAL来说，在C）中的子序列可以相应地选自由SEQ ID NO.：17及其互补序列、SEQ ID NO.：18及其互补序列、SEQ ID NO.：19及其互补序列、SEQ ID NO.：20及其互补序列所限定的序列，和任意的这些序列的子序列所组成的组中的序列。

对于原纤维蛋白1而言，C）中的子序列优选为由SEQ ID NO.：22，或其互补序列，或这些序列之一的子序列所限定的序列。

对于染色体2开放阅读框32（CNRIP1）而言，C）中的子序列优选为由SEQ ID NO.：23，或其互补序列，或这些序列之一的子序列所限定的序列。

对于痉挛性截瘫20、斯巴亭（spartin）（特洛伊综合症（Troyer syndrome））而言，C）中的子序列优选为由SEQ ID NO.：25，或其互补序列，或这些序列之一的子序列所限定的序列。

对于α突触核蛋白（不是淀粉样蛋白前体的A4组分）而言，C）中的子序列优选为选自由SEQ ID NO.：29及其互补序列所限定的序列、SEQ ID NO.：30及其互补序列所限定的序列，和任意的这些序列的子序列所组成的组中的序列。

对于α微管连接蛋白神经元中间丝蛋白而言，C）中的子序列优选为由SEQID NO.：32，或其互补序列，或这些序列之一的子序列所限定的序列。

在本发明中，含有附加基因启动子区域的核酸也可以是有用的，所述附加基因选自但不限于由以下所组成的组中：肌细胞增强因子（SEQ ID NO.:24）、C3orf14/14HT021（SEQ ID NO.:21）、蛋白质泛素连接酶E3A（SEQ ID NO.:26、SEQ ID NO.:27和SEQ ID NO.:28）、脑表达的X-连锁1（SEQ ID NO.:31），或它们的互补序列，或这些序列之一的子序列。

到目前为止，已经证实了少数基因对基于启动子区域内的甲基化现象的癌症早期检测是有用的。这也属于本发明的范围内，包括用于癌症中超甲基化的分析在已知标记物的启动子区域的甲基化状态或水平的方法中。因此，在本发明的进一步的实施方式中，该方法包括测定一个或多个基因的启动子区域/序列中的CpG位点的甲基化状态或水平，所述一个或多个基因选自由以下所组成的组中：

具有1型血小板反应素模体的Adam金属肽酶（ADAMTS1、C3-C5、KIAA1346、METH1）

波形蛋白（VIM）

分泌型卷曲相关蛋白1（Secreted Frizzled-related protein 1，SFRP1））；和

分泌型卷曲相关蛋白2（SFRP2）

这些基因的基因的启动子区域由序列识别号35-38表示。因此，办发明的方法可以包括测定核酸序列中CpG位点的甲基化状态，所述核酸序列包括选自由以下所组成的组中的序列：

i）由SEQ ID NO.:33、SEQ ID NO.:34、SEQ ID NO.:35、和SEQ ID NO.:36所定义的核酸序列；

ii）与i）中所定义的序列互补的核酸序列；

iii）i）或ii）中所定义的核酸序列的子序列；

iv）与i）、ii）或iii）中所定义的序列至少75%，例如至少80%、至少85%、至少90%、至少95%、至少98%或至少99%一致的核酸序列。

本领域技术人员将进一步地意识到，不同的启动子区域将表现出一定程度的简并（degeneracy）。因此，如上述项D）所指出的，对于任意具体基因的启动子序列可以是不完全一致于由序列标识1-16所表示的序列之一。在具体的实施方式中，D）中的核酸序列至少80%与A）、B）或C）中所定义的序列一致，例如至少85%、至少90%、至少95%、至少98%、至少99%，或例如至少99.5%与A）、B）或C）中所定义的序列一致。

根据本发明的基因的特异性和灵敏度非常高，并且各个基因可以包含于本发明的方法中。

在一种实施方式中，该方法包括测定启动子区域内的核酸序列中的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述启动子区域位于：

I）含有选自由SEQ ID NO.:1-4及其相关序列所组成的组中的序列的核酸序列中，和

II）在前述段落中定义的1个、2个或3个核酸序列中。

在一种实施方式中，本方法包括测定启动子区域中的核酸序列的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述启动子区域位于：

I）含有由SEQ ID NO.:6及其相关序列所组成的序列的核酸序列中，和

II）在前述段落中定义的1个、2个或3个核酸序列中。

I）含有由SEQ ID NO.:7及其相关序列所组成的序列的核酸序列中，和

II）在前述段落中定义的1个、2个或3个核酸序列中。

I）含有由SEQ ID NO.:9及其相关序列所组成的序列的核酸序列中，和

II）在前述段落中定义的1个、2个或3个核酸序列中。

I）含有选自由SEQ ID NO.:13-14，及其相关序列所组成的组中的序列的核酸序列中，和

II）在前述段落中定义的1个、2个或3个核酸序列中。

I）含有由SEQ ID NO.:16及其相关序列所组成的序列的核酸序列中，和

II）在前述段落中定义的1个、2个或3个核酸序列中。

根据本发明的方法的目的在于对呼吸消化系统内的癌症（例如肿瘤）进行检测或诊断。“呼吸消化系统”或“呼吸消化道”包括肺和胃肠道：食管、胃、胰腺、肝脏、胆囊/胆管、小肠和大肠（包括结肠和直肠）。具体来说，肿瘤可以选自由以下所组成的组中：结肠直肠肿瘤、肺肿瘤（包括小细胞肺癌和/或非小细胞性肺癌）、食道肿瘤、胃肿瘤、胰腺肿瘤、肝肿瘤、胆囊和/或胆管的肿瘤、小肠肿瘤和大肠肿瘤。

因此，在本发明的一种实施方式中，癌症选自由以下所组成的组中：结肠直肠肿瘤、肺肿瘤（包括小细胞肺癌和/或非小细胞性肺癌）、食道肿瘤、胃肿瘤、胰腺肿瘤、肝肿瘤、胆囊和/或胆管的肿瘤、小肠肿瘤和大肠肿瘤。

为了测定在所述启动子区域/序列中的甲基化的CpG位点的数量、CpG位点的甲基化状态或甲基化水平，根据本发明的方法需要将足够量的DNA从特定受试者中分离出来。本领域技术人员已知按所需的量和质量将DNA进行分离和提纯的合适的技术。出于大多数的目的，可以将DNA从所述受试者的血液样品、粪便样品、组织样品或肺粘液样品中分离出来。通常来说，希望在任何可以的情况下以非侵入方式进行根据本发明的方法：对于胃肠癌来说，收集粪便样品中的DNA将通常具有实践性和便利性。对于肺肿瘤，从肺的粘液样品中分离DNA将提供方便的途径来以非侵入的方式收集DNA。对于其他肿瘤（包括在肝脏和胰腺中的肿瘤），优可以优选收集组织样品用于随后的DNA分离。

因此，在一种实施方式中，样品得自血液、粪便、尿液、胸水、胆汁、支气管液、口腔洗出液、组织活检、腹水、脓、脑脊髓液、抽出物、滤泡液、组织或粘液。

当根据本发明的方法仅用来测定癌症或肿瘤在呼吸消化系统内的存在的目的时，特别是需要“是/否”类型的结果。期望可以将该方法限于对2-4个基因的启动子区域内的CpG位点的甲基化水平或或甲基化状态进行测定。这明确地要求基因在癌症发展和持续过程中具有非常高的超甲基化频率。

因此，出于样品诊断目的，最优选将测定限制在非常少的基因内的启动子区域。如以上所述地，这需要一组用于超甲基化的标记物，其中，各个标记物具有高灵敏度和特异性。然而，出于其他更精细的目的，可能需要在大量的标记物基因中对启动子区域的甲基化状态和水平进行分析。因此，根据本发明的方法可以包括对至少2个基因、例如至少3个基因、例如至少4个基因、例如至少5个基因、例如至少7个基因、至少8个基因、至少9个基因、至少10个基因、至少11个基因、至少12个基因、至少13个基因、至少14个基因、至少15个基因、至少16个基因、至少17个基因、至少18个基因、至少19个基因或至少20个基因（包括如权利要求1中所定义的至少1个基因）的启动子区域/序列中的核酸序列中的CpG位点的甲基化状态进行测定，从而测定发生癌症和/或癌症在受试者中发展的风险水平。

根据以上所述的本发明的方法，还包括对至少1个，例如至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个或至少20个如以上所定义的附加核酸序列或它们的相关序列中的CpG位点的甲基化状态进行测定。

因此，出于多种目的，对一个基因的启动子区域的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态进行分析是不够的。因此，根据本发明的方法可以包括对至少2个基因、例如至少3个基因、例如至少4个基因、例如至少5个基因、例如至少7个基因、至少8个基因、至少9个基因、至少10个基因、至少11个基因、至少12个基因、至少13个基因、至少14个基因、至少15个基因、至少16个基因、至少17个基因、至少18个基因、至少19个基因或至少20个基因的启动子区域/序列中的核酸序列的CpG位点的甲基化状态进行测定，其中，至少一个基因选自以上定义的基因所组成的组中。

因此，本发明的另一方面涉及其中对至少一种附加标记物的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态进行测定的方法。

其中，所述至少一种附加标记物选自由以下所组成的组中：

MAL，例如由ensembl基因编号ENSG00000172005所确定。

标记物基因的结合

因此，出于以上所解释的理由，可以讲甲基化水平或甲基化状态与对一个或多个标记物进行的测量结合，并与结合的参考水平进行比较。可以通过数学运算将测得的标记物水平进行结合，例如加法、减法、乘法和百分率、平方根、求幂和对数函数的算法。还可以根据使用了各种模型的算法结合水平，例如逻辑回归和最大似然估计。可以通过本领域技术人员已知的方式进行对各种生物标记物的结合和各种用来计算结合的参考值的方法。

因此，本发明的另一种实施方式涉及根据前述任意一条权利要求所述的方法，其中，对至少一个附加标记物的甲基化水平或甲基化状态进行测定。

所述至少一个附加标记物可以为但不限于CNRIP1、SPG20、FBN1、SNCA、INA、MAL、ADAMTS1、VIM、SFRP1或SFRP2、CRABP1。可以将这些标记物与一系列的参考数据进行比较，从而测定受试者是否患有癌症，或处于产生癌症的高风险中。

构建基于结合的标记物的诊断测试的方法可以通过数学运算（例如加法）将两个或更多的个体标记物的甲基化水平或甲基化状态（或由其得到的值）进行结合而实现。由于不同标记物的甲基化水平或甲基化状态可能存在不同，这涉及到对测量进行考虑以实现结合，该结合独立于在例如甲基化水平或状态中的差。这可以通过从标准材料的中数或平均值进行简单的归一化而完成。

协同作用

通过结合根据本发明的不同的标记物基因可以实现协同效果。

特别地当协同作用用于本文时，它指的是这样一种现象，其中多个标记物共同作用产生“结合的标记物信号”，这种“结合的标记物信号”比仅由已知的单个标记物的预测的灵敏度或特异性对诊断具有更高的灵敏度或特异性的。

因此，在本发明的一种实施方式中，至少一种附加标记物（例如CNRIP1、SPG20、FBN1、SNCA、INA、MAL）的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1和INA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1和SNCA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1和FBN1标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，INA和SNCA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，INA和FBN1标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，INA和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，SNCA和FBN1标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，SNCA和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，FBN1和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1和MAL标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，SPG20和MAL标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，FBN1和MAL标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，SNCA和MAL标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，INA和MAL标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、SPG20和INA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、SPG20和FBN1标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、SPG20和SNCA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、INA和SNCA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、INA和FBN1标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、SNCA和FBN1标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，SNCA、SPG20和FBN1标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，INA、SPG20和FBN1标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，INA、SNCA和FBN1标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，INA、SPG20和SNCA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，MAL、SPG20和SNCA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，MAL、INA和SNCA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，MAL、INA和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，MAL、FBN1和SNCA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，MAL、FBN1和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，MAL、FBN1和INA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，MAL、FBN1和CNRIP1标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，MAL、CNRIP1和SNCA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，MAL、CNRIP1和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，MAL、CNRIP1和INA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、FBN1、SNCA和INA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，SPG20、FBN1、SNCA和INA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、SNCA、INA和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、FBN1、INA和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、FBN1、SNCA和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，MAL、FBN1、SNCA和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、MAL、SNCA和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、FBN1、MAL和SPG20标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、FBN1、SNCA和MAL标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，INA、FBN1、SNCA和MAL标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、INA、SNCA和MAL标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、FBN1、INA和MAL标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、SPG20、FBN1、SNCA和INA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，MAL、SPG20、FBN1、SNCA和INA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、MAL、FBN1、SNCA和INA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、SPG20、MAL、SNCA和INA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、SPG20、FBN1、MAL和INA标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

在本发明的另一种实施方式中，CNRIP1、SPG20、FBN1、SNCA和MAL标记物的联合使用在灵敏度和/或特异性方面提供了协同效应。

因此，在一种实施方式中，根据本发明的方法包括测定与至少一种附加标记物测得的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态相结合的CNRIP1的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述一种附加标记物选自由以下所组成的组中：

因此，在一种实施方式中，根据本发明的方法包括测定与至少一种附加标记物测得的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态相结合的SPG20的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述一种附加标记物选自由以下所组成的组中：

因此，在一种实施方式中，根据本发明的方法包括测定与至少一种附加标记物测得的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态相结合的FBN1的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述一种附加标记物选自由以下所组成的组中：

因此，在一种实施方式中，根据本发明的方法包括测定与至少一种附加标记物测得的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态相结合的SNCA的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述一种附加标记物选自由以下所组成的组中：

FBN1，例如由ensembl基因编号ENSG00000166147、entrez编号2200所确定；和

因此，在一种实施方式中，根据本发明的方法包括测定与至少一种附加标记物测得的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态相结合的INA的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述一种附加标记物选自由以下所组成的组中：

SNCA，例如由ensembl基因编号ENSG00000145335、entrez编号6622所确定。

亚硫酸氢盐处理和甲基化特异性聚合酶链式反应

本发明受到用来测定基因或基因组成员的甲基化状态的测定类型的限制。事实上，任何可以用来测定基因或基因组的甲基化状态或水平的方法应该满足本发明的目的。

一种用来测定启动子区域中CpG岛的甲基化状态的实用方法，该方法包括用亚硫酸氢盐处理启动子序列的步骤。用亚硫酸氢盐处理DNA导致了例如未被甲基化的序列变异，但不是将甲基化的胞嘧啶转化为尿嘧啶。随后进行序列分析的亚硫酸氢盐处理允许了在亚硫酸氢盐处理后，5-甲基胞嘧啶作为表现为胸腺嘧啶脱氧核苷的未被甲基化的胞嘧啶在基因启动子中的阳性显示，而在最终序列中，5-甲基胞嘧啶表现为胞嘧啶。因此，在本发明的具体实施方式中，通过核酸测序（亚硫酸氢盐测序）来测定所述启动子区域/序列的甲基化状态。

在本发明的另一种实施方式中，通过甲基特异性PCR测定所述启动子区域/序列的甲基化的CpG位点的数量、CpG位点的甲基化状态或甲基化水平。在本申请的实施方式中，给出了一组合适的PCR条件和引物涉及。然而，通常本领域技术人员具备所需的知识，使他能测定用于PCR分析的合适条件和引物设计。

如本领域技术人员已知的，实时荧光为PCR产物的检测提供了方便快捷的途径，并且易于应用到需要高生产量的诊断过程中。因此，在本发明当前优选的实施方式中，所述甲基特异性PCR包括对PCR产物的实时荧光检测。

与大多数其它的PCR过程相似地，本发明的方法可以包括根据大小对产物进行分离的步骤。具体来说，本发明的方法可以包括通过凝胶电泳或毛细管电泳对得到的PCR产物进行分离的步骤。

作为分析的一部分，可以通过使用选自由荧光标记物、化学发光标记物和放射性标记物所组成的组中的标记物来检测得到的PCR产物。出于安全和实践原因，在大多数场合中优选使用非放射性标记物。

也可以通过焦磷酸测序、质谱或通过使用甲基特异性限制酶来测定所述启动子区域/序列的甲基化状态或水平。

通过以下的方法测定甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，但不限于这些方法：亚硫酸氢盐测序、定量和/或定性甲基特异性聚合酶链式反应（MSP）、焦磷酸测序、索瑟恩印迹（Southern blotting）、基因组限制性酶切扫描法（RLGS）、单核苷酸引物延伸、CpG岛微阵列、SNUPE、联合亚硫酸氢钠限制性内切酶分析法（COBRA）、质谱，通过测量所述基因的表达水平，或它们的结合。

在优选的实施方式中，本发明的方法中使用的甲基特异性PCR包括使用能够与这样的核酸序列杂交的核酸引物：该核酸序列包括2个CPG位点和不在CpG位点内的胞嘧啶残基。将这种未被甲基化的胞嘧啶残基的包括在内是为了更好地将亚硫酸氢盐转化的DNA与未被亚硫酸氢盐转化的DNA进行区别所需要的。用于甲基化的序列的引物通常与甲基化的CpG位点连接，所述甲基化的CpG位点是在亚硫酸氢盐转化后还保留了CpG的位点。在未被转化的DNA存在下，它将各自含有甲基化状态的CpG位点，并且在随后将甲基特异性引物连接到未被转化的DNA上，产生假阳性。将不在被引物靶定区域内的CpG位点中的“C（胞嘧啶）”包括在内将防止引物与未转化的DNA连接，这是由于该DNA将含有“C”而被转化的DNA将在相同的位置含有“T”。

再另一种实施方式中，甲基特异性PCR包括使用能够与这样的核酸序列杂交的核酸引物：该核酸序列包括2个CPG位点和不在CpG位点内的胞嘧啶残基。

根据本发明的方法可以与任何其他已知的用于癌症的参数进行结合。因此，本发明的基因的甲基化水平或状态或可以与任意的下列用于癌症的参数进行结合，但不限于这些参数：遗传DNA完整性分析（genetic DNA integrityassay）、倍数性、基因突变状态、基因组变化、融合基因（fusions genes）、剪接变异体（splice variant）、表达差异、miRNA。

使用

根据本发明的标记物由于它们的高灵敏度和特异性而非常适于用作癌症标记物。因此，本发明的另一方面涉及一个或多个选自由以下所组成的组中的基因在诊断分析中的应用：

本发明的另一种实施方式涉及核酸序列在诊断分析中的应用，其中，所述核酸含有选自由以下所组成的组中的核酸序列：

B）与所述A）中所定义的序列互补的核酸序列；

C）所述A）或B）中所定义的核酸序列的子序列；

抗体

本发明还涉及用于甲基化序列的抗体。因此，本发明的另一种实施方式涉及一种识别甲基化的核酸序列的抗体，所述核酸序列选自由以下所组成的组中：

B）与所述A）中所定义的序列互补的核酸序列；

C）所述A）或B）中所定义的核酸序列的子序列；

诊断试剂盒

本发明的一个优选方面提供了用来测定癌症的检测试剂盒，该试剂盒含有一个或多个寡核苷酸引物或一组或多组寡核苷酸引物，所述寡核苷酸引物中的每一个与选自以下的基因的核苷酸序列互补：

本发明的第二方面提供了一种诊断试剂盒，该诊断试剂盒含有一个或多个寡核苷酸引物或一组或多组寡核苷酸引物，例如，2或更多、3或更多、4或更多、5或更多、6或更多、7或更多、8或更多、9或更多、10或更多、11或更多、12或更多、13或更多、14或更多、15或更多、16或更多、17或更多、18或更多、19或更多或例如20或更多个寡核苷酸引物或组寡核苷酸引物，所述寡核苷酸引物中的每一个互补于/能够杂交于启动子区域中的核酸序列/一个或多个基因的序列，所述一个或多个基因选自由以下所组成的组中：

具体来说，根据本发明这一方面的试剂盒含有一个或多个寡核苷酸引物或一组或多组寡核苷酸引物，所述所述寡核苷酸引物中的每一个互补于/能够杂交于核酸序列，该核酸序列含有选自由以下所组成的组中的序列：

A）由SEQ ID NO.:6、SEQ ID NO.:7、SEQ ID NO.:9、SEQ ID NO.:13、SEQ ID NO.:14和SEQ ID NO.:16中的任意一个所定义的核酸序列;

B）与所述A）中所定义的序列互补的核酸序列；;

C）所述A）或B）中所定义的核酸序列的子序列;

与所述A）、B）或C）中所定义的序列至少75%一致的核酸序列。

在具体的实施方式中，所述试剂盒含有一个或多个寡核苷酸引物或一组或多组寡核苷酸引物，所述寡核苷酸引物中的每一个互补于/能够杂交于启动子区域中的核酸序列/基因序列，所述基因序列选自由以下所组成的组中：

波形蛋白（VIM）

分泌型卷曲相关蛋白1（分泌型卷曲相关蛋白1，SFRP1））；和

分泌型卷曲相关蛋白2（SFRP2）

MAL（T细胞分化蛋白）

3号染色体开放阅读框（C3orf14/14HT021）

泛素蛋白质连接酶E3A（UBE3A、AS、ANCR、E6-AP、FLJ26981）

脑表达的X-连锁1（BEX1）

肌细胞增强因子2C，MEF2c

本发明的另一方面中，所述试剂盒含有一个或多个寡核苷酸引物或一组或多组寡核苷酸引物，所述寡核苷酸引物中的每一个互补于/能够杂交于核酸序列，该核酸序列含有选自由以下所组成的组中的序列：

A）由SEQ ID NO.:1、SEQ ID NO.:2、SEQ ID NO.:3、SEQ ID NO.:4、SEQ ID NO.:5、SEQ ID NO.:8、SEQ ID NO.:10、SEQ ID NO.:11、SEQ ID NO.:12和SEQ ID NO.:15中的任意一个所定义的核酸序列;

B）与所述A）中所定义的序列互补的核酸序列；

C）所述A）或B）中所定义的核酸序列的子序列；

根据这些实施方式，所述试剂盒含有一个或多个寡核苷酸引物或一组或多组寡核苷酸引物，所述所述寡核苷酸引物中的每一个互补于/能够杂交于含有核酸序列，所述核酸序列选自由以下所组成的组中的序列：

ii）与i）中所定义的序列互补的核酸序列；

iii）i）或ii）中所定义的核酸序列的子序列；

iv）至少75%，例如至少80%、至少85%、至少90%、至少95%、至少98%或至少99%与i）、ii）或iii）中所定义的序列一致的核酸序列。

考虑到MAL作为癌症标记物的非常高的特异性，所述试剂盒含有一个或多个寡核苷酸引物或一组或多组寡核苷酸引物，所述所述寡核苷酸引物中的每一个互补于/能够杂交于选自由以下所组成的组中的核酸序列：

A）由SEQ ID NO.:1中的任意一个所定义的核酸序列;

B）与所述A）中所定义的序列互补的核酸序列；

C）所述A）或B）中所定义的核酸序列的子序列；

可以对本发明的试剂盒做出各种设计。在一种实施方式中，所述引物或成组的引物中的每一个在不同的容器中。这将允许试剂盒的最终用于为了不同的目的制备不同的引物混合物。然而，根据其他实施方式，所述引物或成组的引物可以以混合物形式供应。

为了特定用途（例如传统的诊断目的），所述试剂盒可以包括少数引物或少数组引物。具体来说，这与什么时候将试剂盒用于需要“是/否”类型的结果的应用中有关，例如，当试剂盒简单地用于测定呼吸消化系统内发生了肿瘤或癌瘤。出于这种目的，可以将试剂盒中的引物的数量或引物的组数限制为2-4，其中，至少一个引物或一组引物，例如至少2个，至少3个或至少4个引物或成组的引物互补于/能够杂交于核酸序列，该核酸序列为根据SEQ IDNO.:1-16的核酸序列，或者为与上述项C）和D）中所定义的互补的或部分一致的序列。

然而，如上文所讨论的，关于本发明的方法，本发明的标记物基因的CpG岛的甲基化状态也可以用于更复杂的分析，例如用于测定受试者内肿瘤产生和/或进展的风险水平。

在这种实施方式中，本发明的诊断试剂盒通常含有能够靶定大量标记物基因的引物或成组的引物。用于这种目的的试剂盒通常需要含有5个或更多的引物或成组的引物，其中，至少一个引物或一组引物，例如至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少12个、至少13个、至少14个、至少15个，或例如至少16个引物或一组引物，互补于/能够杂交于根据本发明的标记物基因的核酸序列。

根据本发明的诊断试剂盒还可以包括任意需要的试剂或介质，以进行要求的分析，例如PCR分析、例如特异性聚合酶链式反应（MSP）序列分析、亚硫酸氢盐处理、亚硫酸氢盐测序、电泳、焦磷酸测序、质谱和通过限制性内切酶消化（restriction digestion）、定量和/或定性甲基化、焦磷酸测序、DNA印迹、基因组限制性酶切扫描法（RLGS）、单核苷酸引物延伸、CpG岛微阵列、SNUPE、联合亚硫酸氢钠限制性内切酶分析法（COBRA）、质谱进行序列分析，通过使用甲基特异性限制酶或通过测量所述基因的表达水平。具体来说，所述试剂盒可以进一步包括一种或多种选自由以下所组成的组中的成分：脱氧核糖核苷三磷酸、缓冲剂、稳定剂、热稳定DNA聚合酶、限制性内切核酸酶（包括甲基特异性内切核酸酶），和标记物（包括荧光标记物、化学发光标记物和放射性标记物）。根据本发明的诊断分析可以还包括一种或多种分离DNA所需要的试剂。

应该注意到的是，本发明多个方面之一的内容中描述的实施方式和特征也可以应用于本发明的其他方面。

当根据本发明的目的或其特征之一或特性以单数形式表示时，也表示了复数形式的该目的或特征或特性。例如，当提及“一个多肽（a polypeptide）”时，这应该理解为指的是一个或多个多肽。

本说明的全部内容中，单词“含有（comprise）”或其变体（例如“单数形式的含有（comprises）”或“分词形式的含有（comprising）”）应该理解为表示了包括所说明的元素、整体或步骤、或成组的元素、多个整体或多个步骤，但不排除任何其他的元素、整体或步骤，或成组的元素、多个整体或多个步骤。

本申请中引用的所有的专利和非专利文献通过引用它们的整体而与本文结合。

现在将在以下非限制性的实施例中对本发明进行更具体的描述。

实施例

实施例1：

亚硫酸氢盐处理和甲基化特异性PCR

将来自细胞系和结肠直肠癌瘤的DNA按现有技术的描述（格伦瑙等人（Grunau et al.）和弗拉加等人（Fraga et al.））进行亚硫酸氢盐处理。同时根据CpG基因组^TM（CpGenome^TM）DNA修饰试剂盒的说明书（因特基波士顿，马萨诸塞州（Intergen Boston,MA））对来自腺瘤的DNA进行亚硫酸氢盐处理（史密斯-石仁生等人

然后通过甲基化特异性PCR（MSP）对MAL、C3orf14、FBN1、MEF2c、CNRIP1、SPG20、UBE3A、SNCA、BEX和INA的启动子甲基化状态进行分析，甲基化特异性PCR是允许在未被甲基化和被甲基化的等位基因之间进行区分的方法（赫尔曼等人（Herman et al.）和德克斯等人（Derks et al.））。用甲基引物（MethPrimer）（李和达西亚）或甲基引物设计软件（Methyl Primer Express）（应用生物系统公司（Applied Biosystems））对全部引物进行设计。它们的序列列于表1，同时还有产物片段长度、引物位置和对于各个PCR的退火温度。使用热星塔克（HotStarTaq）DNA聚合酶（快而精公司，瓦伦西亚，加利福利亚洲（QIAGENInc.,Valencia,CA））对所有的片段进行扩增，且所有的结果通过第二轮独立的MSP进行证实。

表1.用于甲基化特异性PCR的引物

亚硫酸氢盐测序

用HotStarTaq DNA聚合物对所有的片段进行扩增，并将这些片段通过迷你洗提^TM（MinElute^TM）凝胶回收试剂盒（QIAGEN）从2%的琼脂糖凝胶中洗提出来。接着，将样品在3730测序仪（Applied Biosystems）中，用脱氧鸟苷三磷酸（dGTP）BigDye终端循环测序反应试剂盒（BigDye Terminator CycleSequencing Ready Reaction kit）（Applied Biosystems，福斯特市，加利福利亚洲）进行测序。如迈奇等人在先描述地，通过将胞嘧啶信号峰高度与胞嘧啶和胸腺嘧啶峰高度信号之和相比，计算各种片段中的各个CpG位点甲基胞嘧啶的大概的数量。

表2.用于亚硫酸氢盐测序的引物

当通过甲基化特异性聚合酶链式反应（MSP）测定进行分析时，在恶性大肠肿瘤（83%，48个癌瘤中的40个）和良性大肠肿瘤（73%，59个腺瘤的43个）观察到了格外高频率的MAL的超甲基化（图1）。

实施例2

对以下基因进行甲基化特异性聚合酶链式反应(MSP)：

MAL、C3orf14、FBN1、SPG20、SNCA、BEX1、INA、CNRIP1、UBE3A、MEF2C

对于各个样品（结肠癌细胞系、结肠直肠癌瘤、腺瘤和正常粘膜），按照操作规程使用埃匹泰克特（EpiTect）亚硫酸氢盐试剂盒（Qiagen公司，瓦伦西亚，加利福利亚洲）对1.3μg的DNA进行亚硫酸氢盐处理。将被修饰的DNA在40μl的洗提缓冲剂（包含在试剂盒内）中进行洗提。由于亚硫酸氢盐修饰产生了序列差异，使用两对引物，一对针对未被甲基化的模板具有特异性和另一对针对被甲基化的模板具有特异性，对各个基因进行扩增（参见实施例1中的引物表）。25μl的PCR混合物含有1×PCR缓冲液、0.75μl的亚硫酸氢盐处理的模板、1.5-2.0mM的MgCl₂、20pmol的各个引物、200μM的脱氧核糖核苷三磷酸（dNTP）和0.625-1U的HotStarTaq DNA聚合酶（Qiagen）。将在体外用Sss1甲基转移酶（新英格兰生物实验室公司，贝弗利，马萨诸塞州，美国（New England Biolabs Inc.,Beverly,MA,USA））处理过的人胎盘DNA（西格玛化学制品公司，圣路易斯，密苏里州，美国（Sigma Chemical Co,St.Louis,MO,USA））作为对甲基化的MSP反应的阳性对照，而将来自正常淋巴细胞的DNA用作未被甲基化的等位基因的阳性对照。上述两种反应中均将水用作阴性PCR对照。

PCR程序由以下组成：在95℃下进行15分钟的变性，接着进行35次循环（在95℃下30秒，在退火温度下30秒，且在72℃下30秒）。在72℃下进行7分钟的最后的伸长。

对于目前测试的各个基因的退火温度和MgCl₂含量：

MAL：56℃，1.5mM MgCl₂

C3orf14：53℃，1.5mM MgCl₂

FBN1：48℃，对于未被甲基化的反应为1.7mM MgCl₂，而对于被甲基化的反应为2.0

SPG20：56℃，1.5mM MgCl₂

SNCA：53℃，1.5mM MgCl₂

BEX1：51℃，1.5mM MgCl₂

INA：55℃，1.5mM MgCl₂

CNRIP1:52℃，1.5mM MgCl₂

结果：MAL、UBE3A、MEF2C、FBN1、C3orf14、BEX1、INA、SNCA、SPG20、和CNRIP1的甲基化作用

在甲基化特异性聚合酶链式反应（MSP）中获得的结果列于下表3：

	MAL	UBE3A	MEF2C	FBN1	c3orf14
						结肠癌细胞系	19/20(95%)	0/20(0%)	4/20(20%)	18/20(90%)	18/20(90%)
结肠直肠癌瘤	49/61(80%)			49/49(82%)	27/49(55%)
						腺瘤	45/63(71%)			34/59(58%)	33/59(56%)
粘膜(癌症/正常）	2/21(10%)			2/21(10%)	9/21(43%)

粘膜（正常/正常)

1/23(4%)

1/19(5%)

5/21(24%)

	BEX1	INA	SNCA	SPG20	CNRIP1
						结肠癌细胞系	18/19(95%)	19/20(95%)	19/20(95%)	20/20(100%)	20/20(100%)
结肠直肠癌瘤	45/49(92%)	33/48(69%)	37/48(77%)	44/49(90%)	45/48(94%)
						腺瘤	52/58(90%)	31/59(53%)	42/61(69%)	48/58(83%)	53/59(88%)
粘膜(癌症/正常）	15/21(71%)	2/20(10%)	14/21(67%)		9/21(43%)
						粘膜(正常/正常）	9/22(45%)	0/21(0%)	2/21(10%)	1/20(5%)	0/21(0%)

表3.

通常来说，在此进行分析的标记物基因以非常高的频率在结肠直肠癌细胞系和结肠直肠癌瘤中发生甲基化，而在来自非癌性供体的正常粘膜中的甲基化频率低。这些结果证实了标记物基因在对呼吸消化系统内肿瘤的诊断以及监控肿瘤发生中的实用性。

具体来说，MAL在1/23（4%）的来自非癌性供体的正常粘膜样品中被甲基化，在2/21（10%）的取自远离原发性肿瘤的正常粘膜样品中被甲基化，在45/63（71%）的腺瘤中被甲基化，在49/61（80%）的癌瘤中被甲基化，并在19/20（95%）的结肠癌细胞系中被甲基化。应该注意到的是，对MAL观察到的甲基化频率稍微地偏离了实施例1中的观察。这种偏离主要是由于所分析的样品组被扩大的原因造成的。

在来自非癌性供体的正常粘膜样品中和取自远离原发性肿瘤的正常粘膜样品中，FBN1和INA也鲜少被甲基化（对于FBN1分别为1/19，5%和2/21，10%；对于INA分别为0/21，0%和2/20，10%）。同时，FBN1和INA在癌瘤（分别为40/49，82%和33/48，69%）和腺瘤（分别为37/59，58%和31/59，53%）均被频繁地甲基化。在正常粘膜样品同类两组中的低甲基化频率，和在良性和恶性肿瘤中的高甲基化频率说明了FBN1和INA特别有力地用于检测发展中的早期肿瘤。同时，包括这两种标记物的测试将很可能具有高的特异性。

SNCA、SPG20和CNRP1整体上在癌瘤中的甲基化频率（分别为37/48（77%）、44/49（90%）和45/48（94%）），和在腺瘤中的甲基化频率（分别为42/61（69%）、48/58（83%）和52/59（88%）），前者比后组频率更高。通过在非侵入测试中使用这些标记物，可靠地提高了灵敏度。除了在来自非癌性供体的正常粘膜中具有低甲基化频率外，这些标记物在取自远离原发性肿瘤的正常粘膜样品中具有相对高的甲基化频率（分别为14/21（67%）、(29%-90%）和9/21（43%））。这可以说明了在肿瘤周围的“场效应（field effect）”，其中在紧挨着肿瘤附近的表现为正常的细胞液潜藏有这三种基因的甲基化作用。由于更多的潜藏有SNCA、SPG20和/或CNRP1的甲基化作用的细胞可能进入结肠的管腔中，并随着粪便排出，因此这种场效应的存在可能增加非侵入的基于粪便的测试的灵敏度。

实施例3

标记物基因在不同样品中的甲基化

从粪便中提纯DNA，并按上述实施例中所描述的对下列基因进行MSP：MAL、FBN1、CNRIP1、INA、SPG20和SNCA。

将从10份粪便样品中提纯的DNA对所有6种基因进行分析。从4-5个相应的肿瘤中获知与原发性肿瘤相对应的甲基化状态。

此外，向对其采集了粪便样品的10位患者中的9位采集血液样品，并将该结果列于表5。

使用QIAamp粪便试剂盒（QIAGEN）将DNA从250mg的粪便中分离出来。

来自不同样品的基因中的甲基化状态的结果列于下表4中：

组织/基因

MAL

CNRP1

INA

FBN1

SPG20

SNCA

粪便

0/3

1/4

2/6

0/4

2/5

3/8

血液

3/9

8/9

3/9

0/9

6/9

9/9

除了MAL和FBN1，在来自粪便的样品的全部标记物中检测到了甲基化作用。在血液样品中，在除了FBN1之外的全部基因中检测到了甲基化作用。整体上来说，对于来自血液样品的全部基因来说样品的甲基化作用频率高。特别是在含有SNCA和CNRIP1的血液样品中，样品的甲基化频率非常高。由于它们能在非侵入过程中（例如在血液样品中）被检测到，这些标记物似乎非常适于作为癌症标记物。

从血液中提纯DNA（使用标准苯酚/氯仿方法），上述实施例中所描述的对下列基因进行MSP：MAL、CNRIP1、INA、FBN1、SPG20和SNCA。

从14份来自患有相应原发性肿瘤的患者的血液样品中提纯DNA，该DNA由全部的六种基因被甲基化。

表5.扩展的样品组

组织/基因

MAL

CNRP1

INA

FBN1

SPG20

SNCA

血液

4/13

11/13

6/13

3/13

12/13

该实施例证实了在血液样品中基因的高的样品甲基化频率，特别是CNRIP1和SNCA是用于诊断和/或筛选用于癌症或癌症发展的高度合适的标记物。SPG20也表现出非常具有前景的对血液样品进行筛选的标记物。

实施例4

不同细胞系中的INA、SNCA、CNRIP1、SPG20或FBN1的组织特异性样品甲基化作用

在进行MSP之前，对于各个样品（来自乳腺、肾、卵巢、胰腺、前列腺、子宫和胃的细胞系），将DNA按照实施例2中所描述的进行亚硫酸氢盐处理。

不同样品中基因的样品甲基化频率的结果列于下表6中：

	INA	SNCA	CNRIP1	SPG20	FBN1
						乳腺	4/6	6/7	2/6	2/6	4/6
肾	2/4	1/4	0/4	0/4	0/4
						卵巢	2/4	0/4	0/4	1/4	1/4
胰腺	3/6	4/6	5/6	4/6	2/6
						前列腺	1/1	1/1	0/1	0/1	0/1
子宫	2/4	2/4	1/3	2/4	2/4
						胃	3/3	3/3	3/3	3/3	3/3

用MSP对INA、SNCA、CNRIP1、SPG20和FBN1的启动子甲基化状态进行分析。在来自胃细胞系的全部样品中，所测试的基因被甲基化，并因此对于所有被检测的基因甲基化频率为（100%）。通常来说，在全部被测试的组织中的至少一个样品中，INA被甲基化。在来自胃、乳腺和前列腺的细胞系中发现对于该基因的最高样品甲基化频率，分别为3/3（100%）、4/6（66%）、1/1（100%）。对于来自全部其他组织的细胞系，样品甲基化频率为50%。在来自所有被测试组织（除了卵巢）之外的细胞系中，SNCA被甲基化。最高的样品甲基化频率发生在来自胃（3/3（100%））、乳腺（6/7（85%））、胰腺（4/6（66%））和前列腺（1/1（100%））的细胞系中。对于子宫来说，样品的甲基化频率为50%。CNRIP1的样品甲基化频率在胃（3/3（100%））和胰腺（83%）（其中6个样品中有5个被甲基化）中高。在6个胰腺细胞系中有4个中的SPG20被甲基化（66%），且在4个子宫细胞系中有2个中的SPG20被甲基化（50%）。在6个乳腺癌细胞系中有4个中的FBN1被甲基化，且在4个来自子宫的样品中有2个样品中的FBN1被甲基化（50%）。

通常来说，在来自胃细胞系的样品中，所有的基因被甲基化，因此对于全部基因的样品甲基化的频率高。此外，在乳腺细胞系中所有的基因被甲基化，虽然在基因之间，这种甲基化频率会有不同。此外，在来自胰腺的样品中，所有的基因被甲基化，并且对于除了FBN1（33%）之外的全部基因，甲基化频率等于或超过了50%。

该实验明确地证实了根据本发明的基因在来自各种癌症组织的细胞系中被甲基化，并因此能够用作针对各种癌症的癌症标记物。对于本领域技术人员显而易见的是，各个根据本发明的基因可以根据待检测的癌症的类型而被不同地组合起来。因此，在乳腺细胞系中表现了最佳结果的基因可以被选择为检测乳腺癌时的标记物。

MAL的组织特异性甲基化频率的结果列于表8。

实施例5

对下列基因进行定量基因表达(Quantitative gene expression)：SPG20、INA和CNRIP1。

在用表观遗传学药物处理之前或之后，测量在6个结肠癌细胞系中的基因表达。测量SPG20、INA和CNRIP1在结肠癌细胞系（n=6）中的相对表达水平。表达水平表示为由ΔΔCT法计算得到的倍数改变，它使用未被处理的样品作为校准器。使用ACTB和GUSB的平均表达作为内源性对照。

按照在先描述的内容（吉布森等人（Gibson et al.）和海德等人（Heid etal.）），使用塔克曼（TaqMan）实时荧光检测（Applied Biosystems，福斯特市，加利福利亚洲）来对结肠癌细胞系中的mRNA水平进行定量。利用大容量cDNA库试剂盒（High-Capacity cDNA Archive kit）（Applied Biosystems）由5μg的总RNA产生cDNA，根据操作规程，该试剂盒包括随机引物。分别通过7900HT序列检测系统（Applied Biosystems），按照提供商推荐规程分别对来自感兴趣基因（SPG20、INA和CNRIP1）的cDNA和内源性对照（ACTB和GUSB）进行扩增。全部样品进行三次重复分析。使用ΔΔCT法计算表达水平倍数的改变，并且将未处理的样品作为校准器。为了对每个PCR中的可能变化的cDNA输入的量进行调整，我们用看家基因（housekeeping genes）ACTB和GUSB对靶基因的表达量进行了标准化。

对于SPG20、INA和CNRIP1，由5-氮杂-2’-脱氧胞嘧啶核苷（5-aza-2’-deoxycytidine）和曲古抑菌素A（trichostatin A）结合处理诱导的启动子脱甲基化之后，基因表达在绝大多数开始甲基化的结肠癌细胞系中被显著地上调（图2、图3和图4）。对于INA和CNRIP1，这种结合处理比单独使用5-氮杂-2’-脱氧胞嘧啶核苷和单独使用曲古抑菌素A进行处理更有效。结合处理还提高了SPG20的表达，然而，可以通过单独使用5-氮杂-2’-脱氧胞嘧啶核苷处理来达到类似的或更高的再活化。单独使用脱乙酰基酶曲古抑菌素A进行处理不会提高SPG20、INA或CNRIP1的基因表达。在此测试的5-氮杂-2’-脱氧胞嘧啶核苷的两种剂量（1uM和10uM）产生了可比较的效果。这意味着可以在低剂量的5-氮杂-2’-脱氧胞嘧啶核苷存在下对细胞系进行培养来完成对细胞系的脱甲基化，从该药物的细胞毒性而言，这是有利的。

在SPG20、INA和CNRIP1的甲基化状态和表达之间有明确的关系。因此，通过例如MSP并将结果与相应基因表达水平进行结合，可以提高本发明的方法的灵敏度和特异性。

实施例6

MAL的超甲基化

对患者和来自218份新鲜冷冻样品的细胞系DNA进行甲基化分析，包括来自64位患者的65份结肠直肠癌瘤（36份微卫星稳定（micro satellite stable，MSS），且29份微卫星不稳定（micro satellite instability，MSI））、来自52位患者的63份腺瘤，中数大小为8mm，范围为5-50mm（61份MSS和2份MSI）、来自21位结肠直肠癌患者的21份正常粘膜样品（取自原离原发性癌瘤的位置）、和来自22位未患癌症个体的23份正常结肠直肠粘膜样品和20份结肠癌细胞系（11份MSS，9份MSI），以及来自各个组织（乳腺、胃、肾、卵巢、胰腺、前列腺和子宫：表9）的29份细胞系。诊断中癌瘤患者的平均年龄为70岁（从33岁到92岁）、腺瘤患者的平均年龄为67岁（从62岁到72岁），第一组正常粘膜提供者的平均年龄为64岁（从24岁到89岁），第二组正常粘膜提供者的平均年龄为54岁（从33岁到86岁）。来自癌症患者的结肠直肠癌瘤样品和正常样品得自未经选择的可能系列，它们收集自位于挪威东南地区的7家医院。腺瘤得自参加了用于结肠直肠癌的基于大量人群基础上的乙状结肠镜筛选程序的个体。来自未患癌症个体的正常粘膜样品得自死亡人口，且全部正常样品对中的绝大多数（27/44）仅由粘膜组成，而其余的样品取自肠壁。对于目前的肿瘤系列的其他临床病理学数据包括性别和肿瘤位置，对于腺瘤系列的其他临床病理学数据包括息肉大小和每个体中的息肉总数。

所有的样品属于被认可的研究生物样本库（biobanks），并且是根据国家指导被认可的研究项目的一部分（生物样本库：在挪威公共健康研究所（Norwegian Institute of Public Health）注册。项目：地区伦理委员会和国家数据检验局（Regional Ethics Committee and National Data Inspectorate））。

将6个结肠癌细胞系HCT15、HT29、SW48、SW480、RKO和LS1034用脱甲基药5-氮杂-2’-脱氧胞嘧啶核苷（1μM的进行72h，且10μM的进行72h）、组蛋白脱乙酰基酶抑制剂曲古抑菌素A（0.5μM进行12h），和它们的结合（1μM的5-氮杂-2’-脱氧胞嘧啶核苷进行72h，在最后12h加入0.5μM的曲古抑菌素A）进行处理。

亚硫酸氢盐处理和甲基化特异性聚合酶链式反应(MSP）

按先前所描述的，对来自原发性肿瘤和正常粘膜样品的DNA进行亚硫酸氢盐处理。用EpiTect亚硫酸氢盐试剂盒（Qiagen公司，加利福利亚洲，美国）对来自结肠癌细胞系的DNA进行亚硫酸氢盐处理。用HotStarTaq DNA聚合酶（Qiagen）进行甲基化特异性聚合酶链式反应（MSP）分析全部基因的启动子甲基化状态。通过第二轮独立的MSP对全部结果进行证实。将在体外用Sss1甲基转移酶（New England Biolabs公司，贝弗利，马萨诸塞州，美国）处理过的人胎盘DNA（Sigma Chemical公司，圣路易斯，密苏里州，美国）作为对甲基化的MSP反应的阳性对照，而将来自正常淋巴细胞的DNA用作未被甲基化的等位基因的阳性对照。上述两种反应中均将水用作阴性对照。用MethPrimer和Methyl Primer Express对全部引物进行设计，且它们的序列列于表7中。

缩写：MSP，甲基化特异性聚合酶链式反应；BS，亚硫酸氢盐测序；M，甲基化的特异性引物；U，未被甲基化的特异性引物；Frg.Size，片段大小；An.Temp，退火温度（以摄氏温度计）。片段位置列出了各个片段相对于由NCBI（RefSeq ID NM_002371），http://www.ncbi.nlm.nih.gov/mapview/map/search_cg提供的转录起始位点的开始和结束的点（碱基对中）。

亚硫酸氢盐测序

将所有的结肠癌细胞系（n=20）进行MAL启动子的直接亚硫酸氢盐测序。对两个片段进行扩增：片段A，覆盖了相对于转录起始位点的第-68至第168的碱基（与我们的MSP产物重叠），而片段B覆盖了第-427至第-23的碱基。片段A全部覆盖了24个CpG位点，并且使用HotStarTaq DNA聚合物和35次PCR循环进行扩增。片段B全部覆盖了32个CpG位点，并且使用了相同的聚合酶和36次PCR循环进行扩增。引物序列列于表8中。遵照操作规程通过ExoSAP-IT（通用药业，USB公司，俄亥俄州，美国（GE Healthcare,USBCorporation,Ohio,USA））处理除去过量的引物和核苷酸。随后，在AB棱镜（Prism）3730测序平台（Applied Biosystems）中，用脱氧鸟苷三磷酸BigDye终端循环测序反应试剂盒（Applied Biosystems，福斯特市，加利福利亚洲）进行测序。通过将胞嘧啶信号峰高度与胞嘧啶和胸腺嘧啶峰高度信号之和相比计算各个CpG位点甲基胞嘧啶的大概的数量。比例为0-0.20的CpG位点被划分为未被甲基化，0.21-0.80范围内的CpG位点被划分为部分被甲基化，且0.81-1.0范围内的CpG位点被划分为超甲基化。

cDNA制备和实时定量基因表达

用Trizol（英杰生命技术公司，卡尔斯巴德，加利福利亚洲，美国（Invitrogen,Carlsbad,CA,USA））从细胞系（n=46）、肿瘤（n=16）和正常组织（n=3）将总RNA抽提出来，并使用ND-1000微量检测（微量检测技术，NanoDropTechnologies）测定RNA浓度。对于各个样品，使用大容量cDNA库试剂盒（Applied Biosystems）将总RNA转化成cDNA，该试剂盒包括随机引物。按照推荐规程（Applied Biosystems），分别在96孔固定板（fast plates）中对MAL（Hs00242749_m1和Hs00360838_m1）和内源性对照ACTB（Hs99999903_m1）和GUSB（Hs99999908_m1）进行扩增，并且用7900HT序列监测系统（AppliedBiosystems）测量实时定量基因表达。全部样品进行三次重复分析，并使用中数值进行数据分析。使用人类通用参照RNA（含有来自10不同细胞系的RNA的混合物；Stratagene公司）做出标准曲线，并将得到的MAL定量表达水平针对两种内源性对照的中数值进行标准化。

组织微阵列

为了对结肠直肠癌中蛋白质表达进行原位检测，基于在先描述的技术进行组织微阵列（TMA）。在TMA中含有292个来被乙醇固定且被埋入石蜡中的肿瘤样品的圆柱状组织芯片（直径为0.6mm），所述肿瘤样品来自281位个体。对来自相同患者系列的样品进行各种生物变量和临床终点进行测验。此外，该阵列含有来自肾、肝、脾和心脏的正常组织作为对照。分别获得被乙醇固定的来自4人的正常结肠组织，这四个人没有已知结肠直肠癌病史。

免疫组织化学原位蛋白表达分析

将5μm厚的TMA块切片转移到玻璃载玻片上进行免疫组织化学分析。将该切片在二甲苯浴中进行10分钟的脱石蜡，并通过一系列梯度的乙醇浴进行再水化。在100W下浸入10mM的pH为6.0的含有0.05%吐温20（Tween-20）的柠檬酸盐缓冲液中15分钟之后，通过在微波炉中在全效（850W）下加热5分钟进行热诱导的抗原决定簇修复（Heat-induced epitope retrieval）。冷却到室温之后，按照DAKO Envision+TM K5007试剂盒（达科，葛洛斯绰普，丹麦（Dako,Glostrup,Denmark））进行免疫组织化学染色。将第一抗体（小鼠克隆6D9反义-MAL）按1：5000稀释使用，这允许对肾小管进行染色作为阳性对照，而心脏肌肉组织保持未被染色作为阴性对照。将载玻片用苏木精复染2分钟，随后在递增梯度乙醇中并最终在二甲苯中复水。该免疫组织化学的结果通过作者之一和参考病理学进行独立评分而获得。

统计

所有的P值来自两组跟踪数据测试，使用SPSS13.0软件（斯普斯，芝加哥，伊利诺伊州，美国（SPSS,Chicago,IL,USA））。使用费歇尔精确检验（Fisher’s exact test）来分析2×2的列联表。使用2×3表格和卡方检验来分析MAL定量基因表达和激动子甲基化状态之间的潜在联系。将样品根据它们的基因表达水平分为两级：低表达包括的样品具有等于或低于整个细胞系或肿瘤的中数值的基因表达，高表达包括的样品具有高于该中数值的基因表达。将甲基化状态分为三级：未被甲基化、部分被甲基化和被甲基化。

MAL在组织和细胞系中的启动子甲基化状态

用MSP（图5）分析MAL启动子甲基化状态。23份来自未患癌症供体的正常粘膜样品中的一份（4%）和21份取自远离原发性肿瘤的正常粘膜样品中的2份（10%）被甲基化，但进行凝胶电泳后它们与阳性对照相比显示了低密度的条带。63份腺瘤中的45份（71%）和49/61（80%）份癌瘤表现出了启动子超甲基化。20份结肠癌细胞系中的19份（95%）和15/26（58%）的来自各种组织（乳腺、肾、卵巢、胰腺和子宫）的癌症细胞系被超甲基化（表9列出了组织特异性频率）。

表8.各个组织细胞系中MAL的启动子甲基化状态

细胞系	组织	启动子甲基化状态	甲基化频率
				BT-20	乳腺	M
BT-474	乳腺	U/M
				Hs 578T	乳腺	U
SK-BR-3	乳腺	U	57%
				T-47D	乳腺	U/M
ZR-75-1	乳腺	U
				ZR-75-38	乳腺	M
Co115	结肠	M
				HCT15	结肠	M
HCT116	结肠	M
				LoVo	结肠	M
LS174T	结肠	M
				RKO	结肠	M
SW48	结肠	M
				TC7	结肠	M
TC71	结肠	M
				ALA	结肠	M	95%
Colo320	结肠	M
				EB	结肠	M
FRI	结肠	U/M
				HT29	结肠	M
IS1	结肠	M
				IS2	结肠	M
IS3	结肠	M
				LS1034	结肠	M
SW480	结肠	M
				V9P	结肠	U
ACHN	肾	U
				Caki-1	肾	U	50%
Caki-2	肾	M
				786-O	肾	U/M
ES-2	卵巢	U/M
				OV-90	卵巢	U/M	50%
Ovcar-3	卵巢	U
				SK-OV-3	卵巢	U

AsPC-1	胰腺	M
				BxPC-3	胰腺	U
CFPAC-1	胰腺	U	67%
				HPAF-II	胰腺	M
PaCa-2	胰腺	M
				Panc-1	胰腺	U/M
LNCaP	胰腺	U	0%
				AN3 CA	子宫	U/M
HEC-1-A	子宫	M	75%
				KLE	子宫	U
RL95-2	子宫	M

通过甲基化特异性聚合酶链式反应（MSP）对个体细胞系的启动子甲基化状态进行评价。甲基化频率反映了被甲基化的来自各个组织的样品的数量（M和U/M）。缩写：U，未被甲基化；M，被甲基化）。

在正常样品中发现的超甲基化频率低于在腺瘤（P<0.0001）和癌瘤（P<0.0001）中所发现的超甲基化频率。在恶性肿瘤或良性肿瘤中，MAL启动子的超甲基化不与MSI状态、性别或年龄相关。在癌瘤中，位于肠远端位置的肿瘤（左侧和直肠）比近端位置的肿瘤更频繁地被超甲基化，虽然在数据上不具有显著性（P=0.088）。在腺瘤中，在NAL的启动子甲基化状态和息肉大小或数量之间没有发现显著的关联。

亚硫酸氢盐测序证实MAL的启动子甲基化状态

在20份结肠癌细胞系中对两个MAL启动子重叠片段进行亚硫酸氢盐测序。该结果总结于图6，并且代表性的原始数据示于图7中。当通过MSP进行评价时，甲基化状态和重叠片段A的亚硫酸氢盐测序之间具有良好的关联。然而，片段B中与MSP数据的关联差。对于位于相对于转录起始位点较远的上游的片段而言，多个连续的CpG位点通常未被甲基化和/或部分被甲基化。这在转录起始位点附近的表现出被严重甲基化的细胞系中也是正确的（片段A；图6）。

实时定量基因表达

通过定量实时PCR评价细胞系（n=46）、原发性结肠直肠癌瘤（n=16）、和正常粘膜中的MAL的mRNA（n=46）表达水平。在MAL启动子超甲基化和细胞系中基因表达的减少或丧失（P=0.041；图8）之间具有强烈的关联。此外，进行由5-氮杂-2’-脱氧胞嘧啶核苷和曲古抑菌素A结合处理所诱导的启动子脱甲基化之后，结肠癌细胞系中的MAL的基因表达被上调（图9）。单独使用脱乙酰基酶抑制剂曲古抑菌素A不会提高MAL表达，而用DNA脱甲基化5-氮杂-2’-脱氧胞嘧啶核苷进行的处理导致了HT29细胞中的高表达，但是在HCT15细胞中表达更温和（图9）。在原发性结肠直肠癌瘤中，与未被甲基化的肿瘤相比（n=3），这些潜藏有MAL超甲基化（n=13）表达了稍微低水平的MAL的mRNA，虽然这在数据上不具有显著性（图8）。

MAL蛋白表达在结肠直肠癌瘤中丧失

为了对MAL的免疫组织化学分析，分别将肾和心脏肌肉组织作为阳性和阴性对照（图10A-B）。从231份可计分的结肠直肠组织芯片（即，含有恶性结肠直肠上皮组织）中，有198份对MAL染色呈阴性（图10C-D）。它们中的29份在相同的组织芯片中的非上皮组织成分内（主要是神经元和血管（未示出））呈阳性染色。相比之下，所有正常结肠组织对上皮细胞中的MAL呈阳性染色（图10E-F）。

从这些实验得出的结论是，接近转录起始处的MAL启动子在大多数恶性结肠直肠肿瘤和良性结肠直肠肿瘤中被超甲基化，相比之下，正常结肠粘膜样品未被甲基化，而且我们注意到，MAL具有对于早期结肠直肠肿瘤发生的有力的诊断生物标记物。此外，在来自乳腺、肾、卵巢和子宫的癌症细胞系中发现了超甲基化的MAL。

通过定量甲基化特异性聚合酶链式反应（MSP），在先研究已经展示了MAL的超甲基化仅存在于小部分（6%，2/34）的结肠癌瘤中（莫里等人）。相反，本发明的发明人在此证明了在良性和恶性结肠直肠肿瘤中高得多的MAL甲基化频率（在腺瘤中为71%，在癌瘤中为80%）。甲基化频率在本发明的报道和由莫里等人进行的在先研究之间的差异可能是研究设计的结果。我们已经从结肠癌细胞系的直接亚硫酸氢盐测序中反映了MAL的DNA甲基化不均匀地分布在MAL启动子的CpG岛内（图6）。CpG岛通常横跨超过1千个的基因启动子碱基对，并且有时候会错误地假设在该区域内的甲基化状态是均匀分布的。由于MSP分析的结果依赖于未被甲基化的和被甲基化的启动子序列与亚硫酸氢盐处理的DNA之间的配对或错配，可以确认引物退火到基因启动子的有关CpG位点。在本研究中，发明人设计了接近基因转录起始位点（第-72至+70）的MSP引物，并通过亚硫酸氢盐测序发现了MSP评价的MAL整体甲基化状态和被我们的MSP引物对覆盖的个体CpG位点之间的一致性（图6）。在大多数的结肠癌细胞系中（95%），这部分的CpG岛被超甲基化。我们还发现，这些细胞系和其他组织中的细胞系通过定量实时分析表现出了MAL的RNA表达的丧失，并且通过5-氮杂-2’-脱氧胞嘧啶核苷和曲古抑菌素A结合处理对结肠癌细胞系中的MAL表达进行再诱导除去了DNA超甲基化（图9）。此外，通过蛋白质免疫组织化学对大量的临床代表性样品进行分析，我们证实了与正常粘膜相比，MAL的表达在恶性结肠直肠上皮细胞丧失。

本发明的发明人根据莫里等人的描述，进一步地对位于转录起始位点上游第-206至-126处的MAL启动子的相同区域进行了分析。通过直接亚硫酸氢盐测序，我们发现只有少数被莫里反义引物覆盖的CpG位点在19份结肠癌细胞系中被甲基化，它们在转录起始位点周围被严重的甲基化（图6）。因此，我们得出结论：一开始报道的在结肠癌瘤中MAL的非常低（6%）的甲基化频率很可能是引物设计的结果，并且是待检验的CpG位点的选择。

MAL启动子的超甲基化失活也可以在其他癌症类型中普及。在本研究中，再来自乳腺、肾、卵巢和子宫的癌症细胞系中发现了超甲基化的MAL。

本文对来自7个组织的癌症细胞系的分析说明了在MAL的转录起始位点附近的有限区域内的超甲基化与基因表达的减少或丧失有关。

用于结肠直肠癌的灵敏性非侵入筛选途径可以显著地改善患者的临床结果。这种诊断测试可以基本上测量单个生物标记物的状态。

MAL启动子的超甲基化反应了在癌变前结肠直肠损伤中频繁被超甲基化的基因，并伴随有正常结肠粘膜中的低甲基化频率。这种在癌变前组织中的表观遗传学改变的存在也可能对癌症化学预防有指示作用。通过抑制或逆转这种表观遗传学改变，可以防止向恶性显性进展（科佩洛维奇等人（Kopelovich etal.））。MAL的启动子超甲基化保留了用于结肠直肠肿瘤早期检测的最有力的诊断生物标记物之一。

参考文献

1、莫里Y，蔡K，程Y，王S，波恩B，汉密尔顿JP，金Z，佐藤F，贝尔基AT，卡恩T，伊东T，曼特佐尔C，亚伯拉罕JM，梅尔泽SJ.基因组范围内对结肠癌中的生长激素抑制素、速激肽-1和5种其他基因的表观遗传学沉默的识别。肠胃病学2006;131:797-808。（Mori Y，Cai K,Cheng Y，Wang S,PaunB,Hamilton JP，Jin Z,Sato F,Berki AT,Kan T,Ito T,Mantzur C,Abraham JM,Meltzer SJ.A genome-wide search identifies epigenetic silencing of somatostatin,tachykinin-1,and 5 other genes in colon cancer.Gastroenterology2006;131:797-808）。

2、林德GE，克雷伏K，梅林GI，特谢拉MR，赛斯-爱文森E，罗格纳姆TO，罗斯RA。结肠直肠肿瘤发生中被识别为表观遗传学无监管基因的ADAMTS1、CRABP1和NR3C1。细胞肿瘤学2006;28:259-272。（Lind GE，KleiviK,Meling GI,Teixeira MR,Thiis-Evensen E,Rognum TO,Lothe RA.ADAMTS1,CRABP1,and NR3C1 Identified as Epigenetically Deregulated genes in ColorectalTumourigenesis.Cell Oncol 2006;28:259-272）。

3、莱尔德PW.DNA甲基化标记物的能力和前景。自然癌症综述2003;3:253-266。（Laird P W.The power and the promise of DNA methylationmarkers.Nat Rev Cancer 2003;3:253-266）。

4、马勒HM，奥博瓦德M，菲格H，莫拉德尔M，戈贝尔G，兹特M，穆赛尔M，奥夫勒D，玛格雷特R，威德斯琪温特M.粪便DNA中的甲基化变化：用于直肠结肠癌筛选的标记物？柳叶刀2004;363:1283-1285。（MullerHM,Oberwalder M,Fiegl H,Morandell M,Goebel G，Zitt M,Muhlthaler M,OfnerD,Margreiter R,Widschwendter M.Methylation changes in faecal DNA:a markerfor colorectal cancer screening?Lancet 2004;363:1283-1285）。

5、陈WD，韩ZJ，斯克列茨基J，奥尔森J，沙赫J，梅洛夫L，普拉策P，路S，道森D，威利斯J，普列特罗TP，鲁特巴赫J，卡斯图里L，威尔森JK，拉奥JS，夏伯A，马克维茨SD.对不可表达的波形蛋白基因的结肠癌特异性甲基化的粪便DNA的检测。美国国立癌症研究所杂志2005；97：1124-1132。(Chen WD，Han ZJ，Skoletsky J，Olson J，Sah J，Myeroff L，Platzer P，Lu S，Dawson D，Willis J，Pretlow TP，Lutterbaugh J，Kasturi L，Willson JK，Rao JS，Shuber A，Markowitz SD.Detection in fecal DNA of colon cancer-specificmethylation of the nonexpressed vimentin gene.J Natl Cancer Inst2005；97：1124-1132)

6、C.格伦瑙，S.J.克拉克和A.罗森塔尔，亚硫酸氢盐基因测序：对临界实验条件的系统性调查，核酸研究，29(2001)，E65。(C.Grunau，S.J.Clark andA.Rosenthal，Bisulfite genomic sequencing：systematic investigation of criticalexperimental parameters，Nucleic Acids Res.29(2001)，E65)。

7、M.F.弗拉加和M.艾斯特尔，DNA甲基化：方法和应用概略，生物技术33(2002)，632-649。(M.F.Fraga and M.Esteller，DNA methylation：a profile ofmethods and applications，Biotechniques 33(2002)，632-649)

8、B.史密斯-石仁生，G.E.林德，R.I.斯科瑟姆，S.D.法莎，

佛德斯坦德，A.E.斯滕韦格，K.S.雅各布森和R.A.罗斯，睾丸癌中的O6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)基因的常见启动子超甲基化，致癌基因21(2002)，8878-8884。(B.Smith-

G.E.Lind，R.I.Skotheim，S.D.

Fodstad.A.E.Stenwig，K.S.Jakobsen and R.A.Lothe，Frequent promoter hypermethylation ofthe O6-Methyl鸟嘌呤-DNA Methyltransferase(MGMT)gene in testicular cancer，Oncogene 21(2002)，8878-8884)。

9、J.G.赫尔曼，J.R.格拉夫，S.麦欧汉恩，B.D.尼尔金和S.B.贝林，甲基化特异性PCR：用于CpG岛的甲基化状态的新型PCR测定，美国科学院学报93(1996),9821-9826。（J.G.Herman,J.R.Graff，B.D.Nelkin andS.B.Baylin,Methylation-specific PCR:a novel PCR assay for methylation status ofCpG islands,Proc.Natl.Acad.Sci.U.S.A.93(1996),9821-9826）。

10、S.德克斯，M.H.冷特杰斯，D.M.赫拉布雷克斯，A.P.德布林，J.G.赫尔曼和E.M.凡，甲基化特异性PCR揭秘，细胞肿瘤学26(2004),291-299。（S.Derks,M.H.Lentjes,D.M.Hellebrekers,A.P.de Bruine,J.G.Herman andE.M.van,Methylation-specific PCR unraveled,Cell Oncol.26(2004),291-299）

11、L.C.李和R.达西亚，甲基引物：设计用于甲基化PCR的引物，生物信息学18(2002),1427-1431。（L.C.Li and R.Dahiya,MethPrimer:designingprimers for methylation PCRs,Bioinformatics.18(2002),1427-1431）。

12、J.R.迈奇，P.C.文森特和S.J.克拉克，急性髓系白血病中的并存的多个基因的DNA超甲基化，癌症研究59(1999),3730-3740。（J.R.Melki,P.C.Vincent and S.J.Clark,Concurrent DNA hypermethylation of multiple genes inacute myeloid leukemia,Cancer Res.59(1999),3730-3740）。

13、茨威格，M.H.和坎贝尔，G.临床化学39(1993)561-577。（Zweig,M.H.,and Campbell,G.,Clin.Chem.39(1993)561-577）。

Claims

1.一种用来测定受试者是否已经发生、正在发生或易于发生癌症、或者受试者在癌症治疗后是否复发的方法，该方法包括以下步骤：

2.根据权利要求1所述的方法，该方法还包括以下步骤：

3.一种用来测定受试者是否已经发生、正在发生或易于发生癌症、或者受试者在癌症治疗后是否复发的方法，该方法包括以下步骤：

a）测定来自受试者的样品内的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态；

d）从ROC曲线中选择所期望的灵敏度和特异性的结合；

e）从百分位数图测定相应于所测定的或所选择的特异性的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态；和

f）如果样品中的所述至少一种基因的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态等于或高于相应于期望的灵敏度/特异性结合的所述甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，则预测受试者可能患有癌症，并且如果样品中的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态低于相应于期望的灵敏度/特异性结合的所述甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，则预测受试者不太可能或没有患有癌症。

4.根据前述任意一项权利要求所述的方法，其中，至少一种附加标记物的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态得到测定。

5.根据权利要求4所述的方法，其中，所述至少一种附加标记物选自由以下所组成的组中：

MAL，例如由ensembl基因编号ENSG00000172005所确定。

6.根据权利要求4所述的方法，该方法包括测定CNRIP1的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，联合测定至少一种附加标记物的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述一种附加标记物选自由以下所组成的组中：

7.根据权利要求4所述的方法，该方法包括测定SPG20的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，联合测定至少一种附加标记物的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述一种附加标记物选自由以下所组成的组中：

8.根据权利要求4所述的方法，该方法包括测定FBN1的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，联合测定至少一种附加标记物的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述一种附加标记物选自由以下所组成的组中：

9.根据权利要求4所述的方法，该方法包括测定SNCA的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，联合测定至少一种附加标记物的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述一种附加标记物选自由以下所组成的组中：

10.根据权利要求4所述的方法，该方法包括测定INA的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，联合测定至少一种附加标记物的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述一种附加标记物选自由以下所组成的组中：

11.根据权利要求10所述的方法，其中，通过亚硫酸氢盐测序、定量和/或定性的甲基化特异性聚合酶链式反应（MSP）、焦磷酸测序、DNA印迹法、基因组限制性酶切扫描法（RLGS）、单核苷酸引物延伸、CpG岛微阵列、SNUPE、COBRA、质谱，通过使用甲基特异性限制酶，通过测量所述基因的表达水平或它们的结合来对甲基化水平、甲基化的CpG位点的数量或CpG位点甲基化状态进行测定。

12.根据权利要求11所述的方法，其中，所述甲基特异性聚合酶链式反应包括使用能够与这样的核酸序列杂交的核酸引物：该核酸序列包括2个CPG位点和不在CpG位点内的胞嘧啶残基。

13.根据前述任意一项所述的方法，其中，所述癌症选自由以下所组成的组中：结肠直肠肿瘤、肺肿瘤（包括小细胞肺癌和/或非小细胞性肺癌）、食道肿瘤、胃肿瘤、胰腺肿瘤、肝肿瘤、胆囊和/或胆管的肿瘤、小肠肿瘤和大肠肿瘤。

14.根据前述任意一项所述的方法，其中，样品得自血液、粪便、尿液、胸水、胆汁、支气管液、口腔洗出液、组织活检、腹水、脓、脑脊髓液、抽出物、滤泡液、组织或粘液。

15.根据前述任意一项所述的方法，该方法包括测定核酸序列中的甲基化水平、甲基化的CpG位点的数量或CpG位点的甲基化状态，所述核酸序列包括选自由以下所组成的组中的序列：

B）与所述A）中所定义的序列互补的核酸序列;

C）所述A）或B）中所定义的核酸序列的子序列;

16.一种用来测定癌症的诊断试剂盒，该试剂盒含有一个或多个寡核苷酸引物或者一组或多组寡核苷酸引物，所述寡核苷酸引物中的每一个与选自以下的基因的核苷酸序列互补：

17.一个或多个选自由以下所组成的组中的基因在诊断分析中的应用：

18.核酸序列在诊断分析中的应用，其中，所述核酸含有选自由以下所组成的组中的核酸序列：

B）与所述A）中所定义的序列互补的核酸序列；

C）所述A）或B）中所定义的核酸序列的子序列；

D）与所述A）、A）或C）中所定义的序列至少75%一致的核酸序列；

19.一种识别甲基化的核酸序列的抗体，所述核酸序列选自由以下所组成的组中：

B）与所述A）中所定义的序列互补的核酸序列；

C）所述A）或B）中所定义的核酸序列的子序列；