CN105143465A

CN105143465A - 检测赘生物

Info

Publication number: CN105143465A
Application number: CN201480015389.5A
Authority: CN
Inventors: D.A.阿尔奎斯特; J.B.基西尔; W.R.泰勒; T.C.亚布; D.W.马霍尼; G.P.利加德; H.T.阿拉维
Original assignee: Mayo Foundation for Medical Education and Research; Exact Sciences Corp
Current assignee: Mayo Foundation for Medical Education and Research; Exact Sciences Corp
Priority date: 2013-03-14
Filing date: 2014-03-12
Publication date: 2015-12-09
Also published as: WO2014159652A3; US20240182980A1; EP3543360A2; US11821039B2; ES2859645T3; EP2971179B1; US9982310B2; ES2947873T3; EP2971179A4; CA2902916A1; EP3543360A3; US20160355892A1; US20200283853A1; EP4234721A2; US9994911B2; WO2014159650A3; EP4234721A3; EP2971179A2; CN118028467A; ES2712798T3

Abstract

本文提供的是涉及以下方面的技术：检测瘤形成，并且特别地但不排他地用于检测恶变前和恶性赘生物诸如胰腺和结肠直肠癌的方法、组合物及相关用途。因此，本文提供的是当从受试者中获取的样品(例如，粪便样品)进行检测时提供高信噪比和低背景水平的胰腺癌筛查标记物和其它胃肠癌筛查标记物的技术。如本文所述，所述技术以在总体和/或在各个肿瘤部位对GI赘生物的高判别能力提供多种甲基化DNA标记物及其子集(例如，2、3、4、5、6、7、8、9、10、11、12或更多种标记物的集合)。

Description

检测赘生物

发明领域

本文提供的是涉及以下方面的技术：检测瘤形成，并且特别地但不排他地用于检测恶变前和恶性赘生物诸如胰腺和结肠直肠癌的方法、组合物及相关用途。

背景

总的来说，胃肠癌比任何其它器官系统导致更高的癌症死亡率。虽然目前筛查结肠直肠癌，但在美国因上消化道癌导致的每年死亡数超过90,000人，相比之下结肠直肠癌为约50,000人。引人注目地，43,000名男性和女性每年被诊断出患有胰腺癌(PanC)，这将导致每年接近37,000人死亡(Jemal等(2010)“Cancerstatistics”CACancerJClin60：277-300)。因此，PanC是癌症死亡(id)的第四大主因。表现出症状的患者通常已到疾病晚期并且仅有15％符合可能根治的手术的标准(Ghaneh等(2007)“Biologyandmanagementofpancreaticcancer”Gut56：1134-52)。尽管进行手术，但85％仍将死于复发性疾病(Sohn等(2000)“Resectedadenocarcinomaofthepancreas-616patients：results，outcomes，andprognosticindicators”JGastrointestSurg4：567-79)。PanC死亡率超过95％并且对于接受了根治性手术的患者而言5年生存率低于25％(Cleary等(2004)“Prognosticfactorsinresectedpancreaticadenocarcinoma：analysisofactual5-yearsurvivors”JAmCollSurg198：722-31；Yeo等(1995)“Pancreaticoduodenectomyforcanceroftheheadofthepancreas.201patients”AnnSurg221：721-33)。

在具有PanC的综合征倾向或强家族史的患者之中，使用计算机断层扫描或内窥镜超声的积极、侵入性筛查策略已显示出10％的瘤形成检出率(Canto等(2006)“Screeningforearlypancreaticneoplasiainhigh-riskindividuals：aprospectivecontrolledstudy”ClinGastroenterolHepatol4：766-81)。该筛查策略对于大部分PanC在无已知倾向的情况下发生的一般人群而言是不切实际的(Klein等(2001)“Familialpancreaticcancer”CancerJ7：266-73)。

PanC几乎一致的致死率已在理解胰腺肿瘤生物学方面产生了强烈的兴趣。已鉴定了前期病变，包括胰腺上皮内赘生物(PanIN，I-III级)和导管内乳头状粘液瘤(IPMN)(Fernández-delCastillo等(2010)“Intraductalpapillarymucinousneoplasmsofthepancreas”Gastroenterology139：708-13，713.e1-2；Haugk(2010)“Pancreaticintraepithelialneoplasia-canwedetectearlypancreaticcancer？”Histopathology57：503-14)。对前期病变和恶性病变两者的研究已在遗传学、表观遗传学和蛋白组学水平上鉴定了许多分子特征，这些特征可被开发用于治疗或用作早期检测和筛查的生物标记物(Kaiser(2008)“Cancergenetics.Adetailedgeneticportraitofthedeadliesthumancancers”Science321：1280-1；Omura等(2009)“Epigeneticsandepigeneticalterationsinpancreaticcancer”IntJClinExpPathol2：310-26；Tonack等(2009)“Pancreaticcancer：proteomicapproachestoachallengingdisease”Pancreatology9：567-76)。近来的肿瘤和转移病灶图谱研究已表明：在恶性PanC的发生与转移性疾病的发生之间可能存在明显的潜伏期，从而表明对于症状发生前的最早期病变的检测和根治性治疗存在宽的机会窗口(Yachida等(2010)“Distantmetastasisoccurslateduringthegeneticevolutionofpancreaticcancer”Nature467：1114-7)。

PanC脱落(例如，剥落)细胞和DNA到局部排出物并最终到粪便中。例如，可从患有胰腺癌、PanIN和IPMN的患者的胰液中鉴定出(例如，测序)含有突变KRAS基因的DNA(Yamaguchi等(2005)“PancreaticjuicecytologyinIPMNofthepancreas”Pancreatology5：416-21)。之前，已将高度灵敏的测定法用于检测胰腺癌患者的匹配粪便中的突变DNA，这些患者的切除肿瘤已知含有相同的序列(Zou等(2009)“T2036Pan-DetectionofGastrointestinalNeoplasmsByStoolDNATesting：EstablishmentofFeasibility”Gastroenterology136：A-625)。突变标记物的局限涉及其在常规测定法中的检测过程的不便；通常，必须单独测定在多个基因中的每个突变位点以实现高灵敏性。

已在大多数肿瘤类型的组织中作为一类可能的生物标记物研究了甲基化DNA。在许多情况下，DNA甲基化转移酶在胞嘧啶-磷酸-鸟嘌呤(CpG)岛位点作为基因表达的表观遗传控制向DNA添加甲基。在有生物学吸引力的机理中，肿瘤抑制基因的启动子区中的获得性甲基化事件被认为使表达沉默，因而有助于癌发生。DNA甲基化可能是比RNA或蛋白表达在化学和生物学上更稳定的诊断工具(Laird(2010)“Principlesandchallengesofgenome-wideDNAmethylationanalysis”NatRevGenet11：191-203)。此外，在比如散发性结肠癌的其它癌症中，甲基化标记物提供优异的特异性，并且比单独的DNA突变提供更广泛的信息且更灵敏(Zou等(2007)“Highlymethylatedgenesincolorectalneoplasia：implicationsforscreening”CancerEpidemiolBiomarkersPrev16：2686-96)。

对CpG岛的分析当应用于动物模型和人细胞系时已得出了重要的发现。例如，Zhang及其同事发现：得自同一CpG岛的不同部分的扩增子可具有不同的甲基化水平(Zhang等(2009)“DNAmethylationanalysisofchromosome21genepromotersatsinglebasepairandsinglealleleresolution”PLoSGenet5：e1000438)。另外，甲基化水平在高度甲基化与未甲基化序列之间呈双峰分布，从而进一步支持DNA甲基化转移酶活性的二进制开关样模式(Zhang等(2009)“DNAmethylationanalysisofchromosome21genepromotersatsinglebasepairandsinglealleleresolution”PLoSGenet5：e1000438)。鼠组织体内分析和细胞系体外分析证明，仅有约0.3％的高CpG密度启动子(HCP，定义为在300个碱基对区中具有＞7％的CpG序列)甲基化，而低CpG密度的区域(LCP，定义为在300个碱基对区中具有＜5％的CpG序列)倾向于以动态组织特异性模式频繁甲基化(Meissner等(2008)“Genome-scaleDNAmethylationmapsofpluripotentanddifferentiatedcells”Nature454：766-70)。HCP包括普遍存在的看家基因和高度调控的发育基因的启动子。在以＞50％甲基化的HCP位点之中有若干已确立的标记物，诸如Wnt2、NDRG2、SFRP2和BMP3(Meissner等(2008)“Genome-scaleDNAmethylationmapsofpluripotentanddifferentiatedcells”Nature454：766-70)。

对于胰腺癌、PanIN和IPMN病变，已在组织水平研究了标记物甲基化(Omura等(2008)“Genome-wideprofilingofmethylatedpromotersinpancreaticadenocarcinoma”CancerBiolTher7：1146-56；Sato等(2008)“CpGislandmethylationprofileofpancreaticintraepithelialneoplasia”ModPathol21：238-44；Hong等(2008)“Multiplegenesarehypermethylatedinintraductalpapillarymucinousneoplasmsofthepancreas”ModPathol21：1499-507)。例如，标记物MDFI、ZNF415、CNTNAP2和ELOVL4在所研究的癌症的96％、86％、82％和68％中高度甲基化，而相比之下，对照(非癌性)胰腺分别仅有9％、6％、3％和7％在这四个相同的基因座高度甲基化(Omura等(2008)“Genome-wideprofilingofmethylatedpromotersinpancreaticadenocarcinoma”CancerBiolTher7：1146-56)。据发现，测量MDFI和CNTNAP2两者的甲基化状态提供具有高灵敏性(＞90％)和高特异性(＞85％)的胰腺癌指标(Omura等(2008)“Genome-wideprofilingofmethylatedpromotersinpancreaticadenocarcinoma”CancerBiolTher7：1146-56)。

此外，Sato及其同事发现在用甲基转移酶抑制剂处理前后的胰腺癌细胞系中差异表达的八种基因(Sato等(2003)“Discoveryofnoveltargetsforaberrantmethylationinpancreaticcarcinomausinghigh-throughputmicroarrays”CancerRes63：3735-42)。这些标记物随后通过得自Pan-IN病变的DNA的甲基化特异性PCR(MSP)进行了评估。结果表明，SARP-2(分泌型卷曲相关蛋白1，SFRP1)具有83％的灵敏性并可判别Pan-IN2与更高级的Pan-IN3(Sato等(2008)“CpGislandmethylationprofileofpancreaticintraepithelialneoplasia”ModPathol21：238-44)。从较低等级的病变中判别高级前期或早期癌在考虑胰十二指肠切除术或远端胰腺切除术(PanC的主要手术疗法)的发生率时是重要的。当研究主胰管和胰管侧支IPMN前兆时，Hong及其同事也证实了对SFRP1的灵敏性和特异性，尤其是与UCHL1结合时(Hong等(2008)“Multiplegenesarehypermethylatedinintraductalpapillarymucinousneoplasmsofthepancreas”ModPathol21：1499-507)。组织因子途径抑制物2(TFPI2)在包括前列腺、宫颈、结肠直肠、胃、食道和胰腺癌的GU和GI恶性肿瘤中具有得到确认的肿瘤抑制作用(Ma等(2011)“MicroRNA-616inducesandrogen-independentgrowthofprostatecancercellsbysuppressingexpressionoftissuefactorpathwayinhibitorTFPI-2”CancerRes71：583-92；Lim等(2010)“Cervicaldysplasia：assessingmethylationstatus(Methylight)ofCCNA1，DAPK1，HS3ST2，PAX1andTFPI2toimprovediagnosticaccuracy”GynecolOncol119：225-31；Hibi等(2010)“MethylationofTFPI2geneisfrequentlydetectedinadvancedwell-differentiatedcolorectalcancer”AnticancerRes30：1205-7；Glockner等(2009)“MethylationofTFPI2instoolDNA：apotentialnovelbiomarkerforthedetectionofcolorectalcancer”CancerRes69：4691-9；Hibi等(2010)“MethylationoftheTFPI2geneisfrequentlydetectedinadvancedgastriccarcinoma”AnticancerRes30：4131-3；Tsunoda等(2009)“MethylationofCLDN6，FBN2，RBP1，RBP4，TFPI2，andTMEFF2inesophagealsquamouscellcarcinoma”OncolRep21：1067-73；Tang等(2010)“Prognosticsignificanceoftissuefactorpathwayinhibitor-2inpancreaticcarcinomaanditseffectontumorinvasionandmetastasis”MedOncol27：867-75；Brune等(2008)“Geneticandepigeneticalterationsoffamilialpancreaticcancers”CancerEpidemiolBiomarkersPrev17：3536-4)。该标记物还已被证实脱落到GI内腔中并当从癌症和正常受试者的胰液中测定时具有73％的灵敏性(Matsubayashi等(2006)“DNAmethylationalterationsinthepancreaticjuiceofpatientswithsuspectedpancreaticdisease”CancerRes66：1208-17)。

在大量在组织和粪便样品中研究的潜在突变和甲基化标记物之中，TFPI2作为结肠直肠肿瘤的候选物。在对得自大约700名受试者的归档粪便进行的培训-测试集(training-testset)分析中，包括TFPI2、BMP3、NDRG4和波形蛋白的多标记物甲基化组经证实在CRC中具有85％的灵敏性，并在进展型结肠直肠腺瘤中具有64％的灵敏性，在两者中的特异性均为90％(AhlquistD等(2010)“NextGenerationStoolDNATestingforDetectionofColorectalNeoplasia-EarlyMarkerEvaluation”，发表于ColorectalCancer：BiologytoTherapy，AmericanAssociationforCancerResearch)。

之前的研究已测试了结肠直肠癌甲基化标记物在PanC检测中的性能。具体地，病例对照研究使用之前在PanC中报道的MSP靶向标记物(例如，MDFI、SFRP2、UCHL1、CNTNAP2和TFPI2)和另外的判别性结肠赘生物标记物(例如，BMP3、EYA4、波形蛋白和NDRG4)对得自PanC肿瘤病例的DNA与得自结肠上皮的DNA进行了比较。多标记物回归模型表明，EYA4、UCHL1和MDFI具有高度判别能力，接收者操作特征曲线下面积为0.85。作为单独的标记物，据发现BMP3具有0.90的接收者操作特征曲线下面积。随后与得自具有正常结肠镜检查结果的个体的匹配粪便进行设盲比较，将这四种标记物和突变KRAS在得自PanC受试者的更大的粪便样品集合中进行了测定。单独地，BMP3和KRAS具有高特异性但灵敏性较差；组合地，灵敏性提高到65％而同时维持88％的特异性(Kisiel等(2011)“StoolDNAscreeningforcolorectalcancer：opportunitiestoimprovevaluewithnextgenerationtests”JClinGastroenterol45：301-8。这些结果表明，在胰腺水平上UCHL1、EYA4和MDFI中的甲基化差异在基于粪便的比较中被背景结肠甲基化掩盖。因此，癌症筛查需要用于PanC的标记物或标记物组，当在取自受试者的样品(例如，粪便样品)中探询时，该标记物或标记物组提供广泛的信息并表现出在组织水平上对PanC的高特异性。

概述

因此，本文提供的是当从受试者中获取的样品(例如，粪便样品)进行检测时提供高信噪比和低背景水平的胰腺癌筛查标记物和其它胃肠癌筛查标记物的技术。在病例对照研究中通过将得自患有I期和II期PanC的受试者的肿瘤的DNA标记物的甲基化状态与得自对照受试者(例如，正常组织，诸如正常结肠和/或非肿瘤性胰腺)的相同DNA标记物的甲基化状态进行比较鉴定了标记物(参见实施例1和11)。

在病例对照研究中通过将DNA标记物的甲基化状态(例如，得自患有I期和II期PanC的受试者的肿瘤与得自对照受试者(例如，正常组织，诸如正常结肠和/或非肿瘤性胰腺)的相同DNA标记物的甲基化状态进行比较鉴定了标记物和/或成组的标记物(例如，具有选自ABCB1、ADCY1、BHLHE23(LOC63930)、c13orf18、CACNA1C、chr12133、CLEC11A、ELMO1、EOMES、CLEC11、SHH、GJC1、IHIF1、IKZF1、KCNK12、KCNN2、PCBP3、PRKCB、RSPO3、SCARF2、SLC38A3、ST8SIA1、TWIST1、VWC2、WT1和ZNF71的注释的染色体区)(参见实施例2和8)。

在病例对照研究中通过将得自具有巴瑞特氏食道(Barrett’sesophagus)的受试者的食道组织的DNA标记物的甲基化状态与得自对照受试者的相同DNA标记物的甲基化状态进行比较鉴定了标记物和/或成组的标记物(例如，具有选自NDRG4、SFRP1、BMP3、HPP1和/或APC的注释的染色体区)(参见实施例4和10)。

在病例对照研究中通过将得自患有胰腺癌的受试者的胰液样品中的DNA标记物的甲基化状态与得自对照受试者的相同DNA标记物的甲基化状态进行比较鉴定了标记物和/或成组的标记物(例如，具有选自ADCY1、PRKCB、KCNK12、C13ORF18、IKZF1、TWIST1、ELMO、55957、CD1D、CLEC11A、KCNN2、BMP3和/或NDRG4的注释的染色体区)(参见实施例5和6)。

在病例对照研究中通过将得自患有胰腺癌的受试者的粪便样品中的DNA标记物(例如，CD1D)的甲基化状态与得自不具有胰腺癌的对照受试者的相同DNA标记物的甲基化状态进行比较鉴定了标记物(例如，具有CD1D注释的染色体区)(参见实施例7)。

在病例对照研究中通过将得自患有胰腺癌的受试者的粪便样品中的DNA标记物(例如，miR-1290)的测定量与得自不具有胰腺癌的对照受试者的相同DNA标记物的测定量进行比较鉴定了标记物(例如，miR-1290)(参见实施例9)。

另外的对结果的统计分析证明，本文所述的基于这些标记物的技术特异性地且灵敏地预测肿瘤部位。

如本文所述，该技术以在总体和/或在各个肿瘤部位对GI赘生物的高判别能力提供多种甲基化DNA标记物及其子集(例如，2、3、4、5、6、7、8、9、10、11、12或更多种标记物的集合)。实验对候选标记物应用选择过滤器以鉴定提供高信噪比和低背景水平从而提供高特异性的标记物，例如，当测定远距离介质(distantmedia)(例如，粪便、血液、尿液、转移组织等)以用于癌症筛查或诊断目的时。另外，开展了实验以证明所鉴定的甲基化DNA标记物可预测肿瘤部位。因此，该技术提供特异性标记物、标记物组合和预测肿瘤部位的算法。

在一些实施方案中，该技术涉及评估生物样品中本文所鉴定的一种或多种标记物的存在性和甲基化状态。这些标记物包含一个或多个如本文所讨论的差异甲基化区(DMR)，例如，如在表1和/或表10中所提供的。在该技术的实施方案中评估了甲基化状态。因此，本文所提供的技术不限于借以测量基因的甲基化状态的方法。例如，在一些实施方案中，通过基因组扫描方法测量甲基化状态。例如，一种方法涉及限制性标记基因组扫描(Kawai等(1994)Mol.Cell.Biol.14：7421-7427)并且另一个实例涉及甲基化敏感性随机引物PCR(Gonzalgo等(1997)CancerRes.57：594-599)。在一些实施方案中，通过以下方式监测在特定CpG位点的甲基化模式的变化：用甲基化敏感性限制酶消化基因组DNA，然后对所关注的区进行Southern分析(消化-Southern方法)。在一些实施方案中，分析甲基化模式的变化涉及基于PCR的方法，该方法涉及用甲基化敏感性限制酶在PCR扩增之前消化基因组DNA(Singer-Sam等(1990)Nucl.AcidsRes.18：687)。此外，已报道了利用DNA的亚硫酸氢盐处理作为甲基化分析起点的其它技术。这些包括甲基化特异性PCR(MSP)(Herman等(1992)Proc.Natl.Acad.Sci.USA93：9821-9826)以及对从亚硫酸氢盐转化的DNA所扩增的PCR产物进行的限制性酶消化(Sadri和Hornsby(1996)Nucl.AcidsRes.24：5058-5059；以及Xiong和Laird(1997)Nucl.AcidsRes.25：2532-2534)。已开发了用于检测基因突变(Kuppuswamy等(1991)Proc.Natl.Acad.Sci.USA88：1143-1147)和对等位基因特异性表达定量(Szabo和Mann(1995)GenesDev.9：3097-3108；以及Singer-Sam等(1992)PCRMethodsAppl.1：160-163)的PCR技术。此类技术使用内部引物，其退火至经PCR生成的模板并且在待测定的单个核苷酸的5’立即终止。使用如美国专利No.7,037,650中所述的“定量Ms-SNuPE测定法”的方法用于一些实施方案中。

在评价甲基化状态时，通常将甲基化状态表示为在特定位点(例如，在单个核苷酸处、在特定区或基因座处、在更长的所关注序列，例如，长达约100-bp、200-bp、500-bp、1000-bp的DNA亚序列或更长)甲基化的DNA的各条链相对于样品中包含该特定位点的DNA的总群体的分率或百分比。通常，未甲基化的核酸的量通过PCR使用校准品而确定。然后，将已知量的DNA进行亚硫酸氢盐处理，并将所得的甲基化特异性序列用实时PCR或其它指数式扩增法例如QuARTS测定法(例如，如由通过引用并入本文的美国专利No.8,361,720以及美国专利申请公布No.2012/0122088和2012/0122106提供)测定。

例如，在一些实施方案中，方法包括通过使用外标生成未甲基化靶标的标准曲线。标准曲线通过至少两个点构成，并将未甲基化的DNA的实时Ct值与已知的定量标准品相关。然后，由至少两个点和外标构建甲基化靶标的第二标准曲线。该第二标准曲线将甲基化DNA的Ct与已知的定量标准品相关。接下来，确定甲基化和未甲基化群体的试样Ct值，并通过由前两个步骤产生的标准曲线计算DNA的基因组等效值。在所关注的位点的甲基化的百分比通过甲基化DNA的量相对于群体中的DNA的总量而计算，例如，(甲基化DNA的数量)/(甲基化DNA的数量+未甲基化的DNA的数量)×100。

本文还提供了用于实践所述方法的组合物和试剂盒。例如，在一些实施方案中，单独地或以集合的形式(例如，用于扩增多种标记物的引物对的集合)提供一种或多种标记物特异性的试剂(例如，引物、探针)。也可以提供用于进行检测测定法的另外试剂(例如，酶，缓冲液，进行QuARTS、PCR、测序、亚硫酸氢盐或其它测定法的阳性和阴性对照)。在一些实施方案中，提供了包含一种或多种执行方法所需的、足以执行该方法的或可用于执行该方法的试剂盒。还提供了包含试剂的反应混合物。进一步提供了主混合试剂集，其包含多种可添加到彼此中和/或添加到试样中以完成反应混合物的试剂。

在一些实施方案中，本文所述的技术与可编程机相关，该可编程机被设计成执行一连串如由本文所述的方法提供的算术或逻辑运算。例如，该技术的一些实施方案与计算机软件和/或计算机硬件相关(例如，在其中执行)。在一个方面，该技术涉及计算机，其包含一定形式的存储器，用于执行算术和逻辑运算的元件，以及用于执行一系列指令(例如，如本文所提供的方法)以读取、操纵和存储数据的处理元件(例如，微处理器)。在一些实施方案中，微处理器是用于执行以下方面的系统的一部分：确定甲基化状态(例如，一个或多个DMR的，例如，如表1中所提供的DMR1-107，例如，表10中的DMR1-449)；比较甲基化状态(例如，一个或多个DMR的，例如，如表1中所提供的DMR1-107，例如，表10中的DMR1-449)；生成标准曲线；确定Ct值；计算甲基化(例如，一个或多个DMR的，例如，如表1中所提供的DMR1-107，例如，表10中的DMR1-449)的分率、频率或百分比；鉴定CpG岛；确定测定法或标记物的特异性和/或灵敏性；计算ROC曲线和相关AUC；序列分析；所有的都如本文所述或在本领域中是已知的。

在一些实施方案中，微处理器或计算机在算法中使用甲基化状态数据来预测癌症部位。

在一些实施方案中，软件或硬件组件接收多个测定的结果并确定单个值的结果以报告给用户，该报告基于多个测定的结果指示癌症风险(例如，确定多个DMR的甲基化状态，例如，如表1中所提供，例如，如表10中所提供)。相关实施方案基于得自多个测定的结果的数学组合(例如，加权组合、线性组合)来计算风险因子，例如，确定多种标记物(诸如，多个DMR，例如，如表1中所提供，例如，如表10中所提供)的甲基化状态。在一些实施方案中，DMR的甲基化状态限定维度并可具有在多维空间中的值，并且由多个DMR的甲基化状态所限定的坐标是例如报告给用户的例如与癌症风险相关的结果。

一些实施方案包括存储介质和存储器组件。存储器组件(例如，易失性和/或非易失性存储器)可用于存储指令(例如，如本文所提供的方法的实施方案)和/或数据(例如，工作件，诸如甲基化测量值、序列和与之相关的统计描述)。一些实施方案还涉及包含CPU、图形卡和用户界面中的一者或多者(例如，包含诸如显示器的输出装置和诸如键盘的输入装置)的系统。

与所述技术相关的可编程机包括常规的现存技术和开发中或尚待开发的技术(例如，量子计算机、化学计算机、DNA计算机、光学计算机、基于自旋电子学的计算机等)。

在一些实施方案中，该技术包括用于传输数据的有线(例如，金属缆线、光纤)或无线传输介质。例如，一些实施方案涉及经网络(例如，局域网(LAN)、广域网(WAN)、自组网、互联网等)传输数据。在一些实施方案中，可编程机作为对等机存在于此类网络上，并在一些实施方案中，可编程机具有客户端/服务器关系。

在一些实施方案中，数据存储在计算机可读存储介质上，诸如硬盘、闪存、光学介质、软盘等。

在一些实施方案中，本文所提供的技术与多台配合运行以执行如本文所述的方法的可编程装置相关。例如，在一些实施方案中，多台计算机(例如，由网络连接)可并行工作以采集和加工数据，例如，在机群计算或网格计算或一些其它依赖于通过常规网络接口(诸如以太网、光纤)或通过无线网络技术连接到网络(私人、公共或互联网)的完整计算机(具有板载CPU、存储、电源、网络接口等)的分布式计算机架构。

例如，一些实施方案提供包含计算机可读介质的计算机。该实施方案包括耦合到处理器的随机存取存储器(RAM)。该处理器执行存储在存储器中的计算机可执行程序指令。此类处理器可包括微处理器、ASIC、状态机或其它处理器，并可以为多种处理器中的任一种，诸如得自SantaClara，California的Intel公司和Schaumburg，Illinois的Motorola公司的处理器。此类处理器包括存储指令的介质例如计算机可读介质或可与所述介质通信，该指令在由处理器执行时导致处理器执行本文所述的步骤。

计算机可读介质的实施方案包括但不限于能够为处理器提供计算机可读指令的电子、光学、磁或其它存储或传输装置。合适的介质的其它实例包括但不限于软盘、CD-ROM、DVD、磁盘、存储芯片、ROM、RAM、ASIC、经配置的处理器、所有光学介质、所有磁带或是其它磁介质、或计算机处理器可以从中读取指令的任何其它介质。另外，各种其它形式的计算机可读介质可以传输或携带指令到计算机，包括路由器、专用网络或公共网络、或其它有线和无线的传输装置或信道。指令可以包含来自任何合适的计算机编程语言(包括例如C、C++、C#、VisualBasic、Java、Python、Perl和JavaScript)的代码。

计算机在一些实施方案中连接到网络。计算机还可以包括多个外部或内部装置，诸如鼠标、CD-ROM、DVD、键盘、显示器或其它输入或输出装置。计算机的实例为个人计算机、数字助理、个人数字助理、蜂窝电话、移动电话、智能电话、寻呼机、数字写字板、膝上型计算机、互联网电器和其它基于处理器的装置。一般来讲，与本文所提供的技术的方面相关的计算机可以是能够支持一个或多个包含本文所提供的技术的程序的任何类型的在任何操作系统(诸如MicrosoftWindows、Linux、UNIX、MacOSX等)上运行的基于处理器的平台。一些实施方案包括执行其它应用软件(例如，应用程序)的个人计算机。应用程序可容纳在存储器中并可包括例如文字处理应用程序、电子表格应用程序、电子邮件应用程序、即时通讯应用程序、演示应用程序、互联网浏览器应用程序、日历/管理器应用程序和任何其它能够由客户端装置执行的应用程序。

本文与所述技术相关而描述的所有此类组件、计算机和系统可以是逻辑的或虚拟的。

因此，本文提供的是与筛查得自受试者的样品中的赘生物的方法相关的技术，该方法包括：测定得自受试者的样品中的标记物的甲基化状态；以及当标记物的甲基化状态不同于在不具有赘生物的受试者中测定的标记物的甲基化状态时，将受试者鉴定为具有赘生物，其中标记物包含在选自以下的差异甲基化区(DMR)中的碱基：如表1中所提供的DMR1-107和/或表10中的DMR1-449。在一些实施方案中，该方法进一步包括定位受试者内的赘生物部位，其中标记物的甲基化状态指示受试者内的赘生物部位。该技术涉及鉴定和判别胃肠癌，例如，在一些实施方案中，赘生物为胃肠赘生物。在一些实施方案中，赘生物存在于患者的上消化道区域中，并且在一些实施方案中，赘生物存在于患者的下消化道区域中。在特定的实施方案中，赘生物为胰腺赘生物、结肠直肠赘生物、胆管赘生物或腺瘤。该技术还涵盖确定癌症的状态或阶段，例如，在一些实施方案中，赘生物为癌前期的。一些实施方案提供包括测定多种标记物(例如，包括测定2至11种标记物)的方法。

该技术不限于所评估的甲基化状态。在一些实施方案中，评估样品中的标记物的甲基化状态包括确定一个碱基的甲基化状态。在一些实施方案中，测定样品中的标记物的甲基化状态包括确定多个碱基处的甲基化程度。此外，在一些实施方案中，标记物的甲基化状态包括相对于标记物的正常甲基化状态标记物的甲基化增加。在一些实施方案中，标记物的甲基化状态包括相对于标记物的正常甲基化状态标记物的甲基化减少。在一些实施方案中，标记物的甲基化状态包括相对于标记物的正常甲基化状态标记物的甲基化模式不同。

此外，在一些实施方案中，标记物是100个或更少的碱基的区，标记物是500个或更少的碱基的区，标记物是1000个或更少的碱基的区，标记物是5000个或更少的碱基的区，或在一些实施方案中，标记物是一个碱基。在一些实施方案中，标记物在高CpG密度启动子中。

该技术不受样品类型的限制。例如，在一些实施方案中，样品为粪便样品、组织样品、胰液样品、胰腺囊肿液样品、血液样品(例如，血浆、血清、全血)、分泌物或尿液样品。

此外，该技术不限于用于确定甲基化状态的方法。在一些实施方案中，测定包括使用甲基化特异性聚合酶链反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。在一些实施方案中，测定包括使用甲基化特异性寡核苷酸。在一些实施方案中，该技术使用大规模平行测序(例如，下一代测序)以确定甲基化状态，例如边合成边测序、实时(例如，单分子)测序、磁珠乳液测序(beademulsionsequencing)、纳米孔测序等。

该技术提供用于检测DMR的试剂，例如，在一些实施方案中，提供一组包含由SEQIDNO：1-202提供的序列的寡核苷酸。在一些实施方案中，提供包含与具有DMR中的碱基的染色体区互补的序列的寡核苷酸，例如，对DMR的甲基化状态敏感的寡核苷酸。

该技术提供多组标记物，例如，在一些实施方案中，标记物包含具有为ABCB1、ADCY1、BHLHE23(LOC63930)、c13orf18、CACNA1C、chr12.133、CLEC11A、ELMO1、EOMES、GJC1、IHIF1、IKZF1、KCNK12、KCNN2、NDRG4、PCBP3、PRKCB、RSPO3、SCARF2、SLC38A3、ST8SIA1、TWIST1、VWC2、WT1或ZNF71的注释并构成该标记物的染色体区(参见表1和表9)。此外，实施方案提供分析为DMRNo.11、14、15、65、21、22、23、5、29、30、38、39、41、50、51、55、57、60、61、8、75、81、82、84、87、93、94、98、99、103、104或107的表1中的DMR或对应于Chr16：58497395-58497458的DMR的方法。一些实施方案提供确定标记物的甲基化状态，其中具有为CLEC11A、C13ORF18、KCNN2、ABCB1、SLC38A3、CD1D、IKZF1、ADCY1、CHR12133、RSPO3、MBP3、PRKCB、NDRG4、ELMO或TWIST1的注释的染色体区构成该标记物。在一些实施方案中，该方法包括确定两种标记物的甲基化状态，例如，在表5的行中提供的一对标记物。

提供了试剂盒实施方案，例如，包含以下物质的试剂盒：亚硫酸氢盐试剂；和对照核酸，其包含选自DMR1-107(表1中)的DMR和/或选自DMR1-449(表10中)的DMR中的序列并具有与未患癌症的受试者相关的甲基化状态。在一些实施方案中，试剂盒包含亚硫酸氢盐试剂和如本文所述的寡核苷酸。在一些实施方案中，试剂盒包含亚硫酸氢盐试剂；和对照核酸，其包含选自DMR1-107(表1中)和/或DMR1-449(表10中)的DMR中的序列并具有与患有癌症的受试者相关的甲基化状态。一些试剂盒实施方案包含：用于从受试者获得样品(例如，粪便样品)的样品收集器；用于从样品中分离核酸的试剂；亚硫酸氢盐试剂；和如本文所述的寡核苷酸。

该技术涉及组合物(例如，反应混合物)的实施方案。在一些实施方案中提供包含含有DMR的核酸和亚硫酸氢盐试剂的组合物。一些实施方案提供包含含有DMR的核酸和如本文所述的寡核苷酸的组合物。一些实施方案提供包含含有DMR的核酸和甲基化敏感性限制酶的组合物。一些实施方案提供包含含有DMR的核酸和聚合酶的组合物。

提供了用于筛查得自受试者的样品中的赘生物的另外的相关方法实施方案，例如，包括以下方面的方法：确定样品中包含为DMR1-107(表1中)中的一者或多者和/或DMR1-449(表10中)中的一者或多者的DMR中的碱基的标记物的甲基化状态；将得自受试者样品的标记物的甲基化状态与得自未患癌症的受试者的正常对照样品的标记物的甲基化状态进行比较；以及确定受试者样品和正常对照样品的甲基化状态的差异的置信区间和/或p值。在一些实施方案中，置信区间为90％、95％、97.5％、98％、99％、99.5％、99.9％或99.99％，并且p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001或0.0001。方法的一些实施方案提供以下步骤：使包含DMR的核酸与亚硫酸氢盐试剂反应以产生亚硫酸氢盐反应的核酸；对亚硫酸氢盐反应的核酸测序以提供亚硫酸氢盐反应的核酸的核苷酸序列；将亚硫酸氢盐反应的核酸的核苷酸序列与得自未患癌症的受试者的包含DMR的核酸的核苷酸序列进行比较以鉴定这两个序列中的差异；以及当存在差异时将受试者鉴定为具有赘生物。

该技术提供了用于筛选得自受试者的样品中的赘生物的系统。系统的示例性实施方案包括例如用于筛选得自受试者的样品中的赘生物的系统，该系统包括：被配置成确定样品的甲基化状态的分析组件，被配置成将样品的甲基化状态与对照样品或数据库中记录的参照样品甲基化状态进行比较的软件组件，以及被配置成向用户提供癌症相关甲基化状态警报的警报组件。在一些实施方案中通过软件组件确定警报，该软件组件接收多个测定的结果(例如，确定多种标记物的甲基化状态，例如，DMR，例如，如表1中所提供，例如，如表10中所提供)并基于多个结构计算待报告的值或结果。一些实施方案提供与本文所提供的每个DMR相关的加权参数的数据库，以用于计算值或结果和/或警报以报告给用户(诸如医生、护士、临床医生等)。在一些实施方案中，报告得自多个测定的所有结果，并且在一些实施方案中，将一个或多个结果用于提供基于得自多个测定的一个或多个结果的合成结果的评分、值或结果，其指示受试者中的癌症风险。

在系统的一些实施方案中，样品包括含有DMR的核酸。在一些实施方案中，系统进一步包含用于分离核酸的组件，用于收集样品的组件，诸如用于收集粪便样品的组件。在一些实施方案中，系统包含含有DMR的核酸序列。在一些实施方案中，数据库包含得自未患癌症的受试者的核酸序列。还提供了核酸，例如，一组核酸，每种核酸具有包含DMR的序列。在一些实施方案中，在该组核酸中每种核酸具有得自未患癌症的受试者的序列。相关系统实施方案包含如所述的一组核酸和与该组核酸相关的核酸序列数据库。一些实施方案还包括亚硫酸氢盐试剂。并且，一些实施方案进一步包括核酸测序仪。

基于本文所含的教导，另外的实施方案将对相关领域的技术人员是显而易见的。

附图简述

本发明的技术的这些及其它特征、方面和优点参照以下附图将变得更易理解：

图1是曲线图，显示了针对部位预测通过平均准确度降低所测量的甲基化标记物子集的标记物重要性。

图2显示了如实施例8中所述的在巴瑞特氏病例和对照的刷取样本(贲门+整个食道)中的BMP3和NDRG4标记物水平。

图3显示了如实施例9中所述的粪便miR-1290的AUC。

应当理解，附图未必按比例绘制，附图中的对象也未必按照与彼此的关系的比例绘制。描绘的图旨在澄清和理解本文所公开的设备、系统、组合物和方法的各种实施方案。当可能时，贯穿所有附图使用相同的参考编号来表示相同或类似的部件。此外，应当认识到，附图无意以任何方式限制本发明的教导的范围。

详述

本文提供的是涉及以下方面的技术：检测瘤形成，并且特别地但不排他地用于检测恶变前和恶性赘生物诸如胰腺和结肠直肠癌的方法、组合物及相关用途。当在本文描述所述技术时，所用的章节标题仅用于组织目的，而不应解释为以任何方式限制主题。

在各种实施方案的该详述中，出于解释的目的，示出了许多具体细节以提供对所公开的实施方案的透彻理解。然而，本领域的技术人员将认识到，可在具有或不具有这些具体细节的情况下实践这些各种实施方案。在其它情况下，结构和装置以框图形式示出。此外，本领域的技术人员可容易地认识到，呈现和执行方法的具体顺序是说明性的，并且据设想所述顺序可以改变并仍保持在本文所公开的各种实施方案的精神和范围内。

所有文献和本申请中引用的类似材料(包括但不限于专利、专利申请、文章、书籍、论文和互联网网页)均明确地整体通过引用并入以用于任何目的。除非另有定义，否则本文使用的所有技术和科学术语都具有与本文所述的各种实施方案所属领域的技术人员公认的相同含义。当在所并入的参考文献中的术语的定义似乎与本教导中提供的定义不同时，以本教导中提供的定义为准。

定义

为了有利于理解本发明的技术，下文定义了多个术语和短语。另外的定义在整个详述中示出。

在整个说明书和权利要求书中，除非上下文另外明确地规定，否则以下术语采用本文明确关联的含义。如本文所用的短语“在一个实施方案中”虽然可以但不一定是指同一实施方案。此外，如本文所用的短语“在另一个实施方案中”虽然可以但不一定是指不同的实施方案。因此，如下所述，可在不脱离本发明的范围或精神的情况下，容易地组合本发明的各种实施方案。

此外，如本文所用，除非上下文另外明确地规定，否则术语“或”是包括性“或”运算符，并且等价于术语“和/或”。除非上下文另外明确地规定，否则术语“基于”并非排他性的且允许基于未描述的另外因素。此外，在整个说明书中，“一个/一种”和“该/所述”的含义包括复数引用。“在...中”的含义包括“在...中”和“在...上”。

如本文所用，“核酸”或“核酸分子”通常是指任何核糖核酸或脱氧核糖核酸，其可以为未修饰的或修饰的DNA或RNA。“核酸”包括但不限于单链和双链核酸。如本文所用，术语“核酸”还包括如上所述的含有一个或多个修饰碱基的DNA。因此，具有为稳定性或为其它原因而修饰的骨架的DNA是“核酸”。在本文使用的术语“核酸”涵盖核酸的此类化学、酶或代谢修饰的形式，以及病毒和细胞(包括例如简单细胞和复杂细胞)特有的DNA的化学形式。

术语“寡核苷酸”或“多核苷酸”或“核苷酸”或“核酸”是指具有两个或更多个，优选地多于三个，且通常多于十个脱氧核糖核苷酸或核糖核苷酸的分子。确切的大小将取决于许多因素，这些因素又取决于寡核苷酸的最终功能或用途。寡核苷酸可以任何方式生成，这些方式包括化学合成、DNA复制、逆转录或其组合。DNA的典型脱氧核糖核苷酸为胸腺嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。RNA的典型核糖核苷酸为尿嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。

如本文所用，核酸的术语“基因座”或“区”是指核酸的亚区，例如，染色体上的基因、单个核苷酸、CpG岛等。

术语“互补的”和“互补性”是指通过碱基配对原则相关的核苷酸(例如，1个核苷酸)或多核苷酸(例如，核苷酸的序列)。例如，序列5′-A-G-T-3′与序列3′-T-C-A-5′互补。互补性可以是“部分的”，其中只有一些核酸的碱基根据碱基配对原则匹配。或者，可在核酸之间存在“完全”或“总”互补性。核酸链之间的互补性程度影响核酸链之间的杂交效率和强度。这在扩增反应中以及在依赖核酸之间的结合的检测方法中具有尤其重要的意义。

术语“基因”是指包含对于RNA的产生或多肽或其前体的产生所必需的编码序列的核酸(例如DNA或RNA)序列。功能多肽可由全长编码序列或由该编码序列的任何部分编码，只要保持多肽的所需活性或功能性质(例如，酶活性、配体结合、信号转导等)即可。术语“部分”当关于基因使用时是指该基因的片段。片段的大小范围可为几个核苷酸至整个基因序列减去一个核苷酸。因此，“包含基因的至少一部分的核苷酸”可包含基因的片段或整个基因。

术语“基因”还涵盖结构基因的编码区并包含位于5′和3′两端上的编码区附近(例如，在任一端上约1kb的距离)的序列，使得该基因对应于全长mRNA的长度(例如，包含编码、调控、结构和其它序列)。位于编码区5′并存在于mRNA上的序列称为5′非翻译或未翻译序列。位于编码区3′或下游并存在于mRNA上的序列称为3′非翻译或3′未翻译序列。术语“基因”涵盖基因的cDNA和基因组两种形式。在一些生物体(例如，真核生物)中，基因的基因组形式或克隆包含被称为“内含子”或“插入区”或“插入序列”的非编码序列中断的编码区。内含子是转录成核RNA(hnRNA)的基因片段；内含子可包含调控元件，诸如增强子。内含子从核或初级转录物中移除或“剪除”；因此内含子不存在于信使RNA(mRNA)转录物中。mRNA在翻译过程中起到指定新生多肽中的氨基酸序列或顺序的作用。

除了含有内含子外，基因的基因组形式还可以包含位于RNA转录物上存在的序列的5′和3′两端上的序列。这些序列称为“侧翼”序列或区(这些侧翼序列位于mRNA转录物上存在的非翻译序列的5′或3′)。5′侧翼区可包含控制或影响基因转录的调控序列，诸如启动子和增强子。3′侧翼区可包含指导转录终止、转录后裂解和多聚腺苷酸化的序列。

术语“野生型”当涉及基因时是指具有从天然存在的来源中分离的基因的特性的基因。术语“野生型”当涉及基因产物时是指具有从天然存在的来源中分离的基因产物的特性的基因产物。术语“天然存在的”当应用于某个对象时是指这样的事实，即该对象可在自然界中发现。例如，存在于可从自然界中的来源分离得到的生物体(包括病毒)中且未经人工在实验室中有意修饰的多肽或多核苷酸序列即是天然存在的。野生型基因通常为在群体中最常观察到的基因或等位基因，并因此任意地命名为基因的“正常”或“野生型”形式。相比之下，术语“修饰的”或“突变的”当涉及基因或基因产物时分别是指当与野生型基因或基因产物相比时显示出序列和/或功能性质的修饰(即，改变的特性)的基因或基因产物。应当注意，可以分离天然存在的突变体；这些通过以下事实而加以鉴定：它们与野生型基因或基因产物相比时具有改变的特性。

术语“等位基因”是指基因的变型形式；该变型形式包括但不限于变体和突变体，多态性基因座以及单核苷酸多态性基因座、移码和剪接突变。等位基因可以在群体中天然存在，或其可在群体的任何特定个体的寿命期间出现。

因此，术语“变体”和“突变体”当关于核苷酸序列使用时是指与另一个通常相关的核苷酸序列相差一个或多个核苷酸的核酸序列。“变型形式”是两个不同的核苷酸序列之间的差异；通常，一个序列是参考序列。

“扩增”是涉及模板特异性的核酸复制的特殊情况。其与非特异性模板复制(例如，为模板依赖性的但不依赖于特定模板的复制)形成对比。模板特异性在这里有别于复制的保真度(例如，正确的多核苷酸序列的合成)和核苷酸(核糖核苷酸或脱氧核糖核苷酸)特异性。模板特异性常用“靶标”特异性来描述。靶标序列从试图将其从其它核酸中分选出来的意义上讲是“靶标”。扩增技术被设计成主要用于该分选。

核酸的扩增一般是指产生多核苷酸或多核苷酸一部分的多个拷贝，通常从少量的多核苷酸(例如单个多核苷酸分子，可以或可以不完全相同的多核苷酸分子的10至100个拷贝)开始，其中扩增产物或扩增子一般可以检测。多核苷酸的扩增涵盖多种化学和酶法过程。在聚合酶链反应(PCR)或连接酶链反应(LCR；参见例如整体通过引用并入本文的美国专利No.5,494,810)期间由靶标或模板DNA分子的一个或几个拷贝生成多个DNA拷贝是扩增的形式。另外的扩增类型包括但不限于等位基因特异性PCR(参见例如整体通过引用并入本文的美国专利No.5,639,611)、装配PCR(参见例如整体通过引用并入本文的美国专利No.5,965,408)、解旋酶依赖性扩增(参见例如整体通过引用并入本文的美国专利No.7,662,594)、热启动PCR(参见例如各自整体通过引用并入本文的美国专利No.5,773,258和5,338,671)、序列间特异性PCR(intersequence-specficPCR)、反向PCR(参见例如整体通过引用并入本文的Triglia等(1988)NucleicAcidsRes.，16：8186)、连接介导的PCR(参见例如各自整体通过引用并入本文的Guilfoyle，R.等，NucleicAcidsResearch，25：1854-1858(1997)；美国专利No.5,508,169)、甲基化特异性PCR(参见例如整体通过引用并入本文的Herman等，(1996)PNAS93(13)9821-9826)、小引物PCR(miniprimerPCR)、多重连接依赖性探针扩增(参见例如整体通过引用并入本文的Schouten等，(2002)NucleicAcidsResearch30(12)：e57)、多重PCR(参见例如各自整体通过引用并入本文的Chamberlain等，(1988)NucleicAcidsResearch16(23)11141-11156；Ballabio等，(1990)HumanGenetics84(6)571-573；Hayden等，(2008)BMCGenetics9：80)、巢式PCR、重叠延伸PCR(参见例如整体通过引用并入本文的Higuchi等，(1988)NucleicAcidsResearch16(15)7351-7367)、实时PCR(参见例如各自整体通过引用并入本文的Higuchi等，(1992)Biotechnology10：413-417；Higuchi等，(1993)Biotechnology11：1026-1030)、逆转录PCR(参见例如整体通过引用并入本文的Bustin，S.A.(2000)J.MolecularEndocrinology25：169-193)、固相PCR、热不对称交错PCR和降落PCR(参见例如各自整体通过引用并入本文的Don等，NucleicAcidsResearch(1991)19(14)4008；Roux，K.(1994)Biotechniques16(5)812-814；Hecker等，(1996)Biotechniques20(3)478-485)。多核苷酸扩增也可使用数字PCR实现(参见例如各自整体通过引用并入本文的Kalinina等，NucleicAcidsResearch.25；1999-2004，(1997)；Vogelstein和Kinzler，ProcNatlAcadSciUSA.96；9236-41，(1999)；国际专利公布No.WO05023091A2；美国专利申请公布No.20070202525)。

术语“聚合酶链反应”(“PCR”)是指K.B.Mullis美国专利No.4,683,195、4,683,202和4,965,188的方法，这些专利描述了在不用克隆或纯化的情况下增大基因组DNA混合物中靶序列的片段的浓度的方法。这种扩增靶序列的过程包括将大量过剩的两种寡核苷酸引物引入含有所需靶序列的DNA混合物中，然后是在DNA聚合酶存在下精确的热循环序列。这两种引物与它们的双链靶序列的相应链互补。为了实现扩增，对混合物变性，且然后将引物退火到它们在靶分子内的互补序列。在退火后，将引物用聚合酶延伸，以便形成一对新的互补链。变性、引物退火和聚合酶延伸步骤可重复许多次(即，变性、退火和延伸构成一个“循环”；可以存在许多个“循环”)以获得高浓度的所需靶序列的扩增片段。所需靶序列的扩增片段的长度由引物针对彼此的相对位置确定，并因此，该长度是可控制的参数。借助该过程的重复方面，该方法称为“聚合酶链反应”(“PCR”)。由于靶序列的所需扩增片段变成混合物中的主要序列(在浓度方面)，因此它们被称为“PCR扩增的”并为“PCR产物”或“扩增子”。

模板特异性在大多数扩增技术中通过选择酶而实现。扩增酶是在使用条件下仅加工异源核酸混合物中的特定核酸序列的酶。例如，在Q-β复制酶的情况下，MDV-1RNA是该复制酶的特异性模板(Kacian等，Proc.Natl.Acad.Sci.USA，69：3038[1972])。其它核酸将不能通过该扩增酶复制。类似地，在T7RNA聚合酶的情况下，该扩增酶具有针对其自身启动子的严格特异性(Chamberlin等，Nature，228：227[1970])。在T4DNA连接酶的情况下，当在寡核苷酸或多核苷酸底物与模板之间在连接接头处存在错配时，该酶将无法连接这两个寡核苷酸或多核苷酸(Wu和Wallace(1989)Genomics4：560)。最后，热稳定模板依赖性DNA聚合酶(例如，Taq和PfuDNA聚合酶)由于其在高温下起作用的能力，而被发现对由引物结合并由引物限定的序列显示出高特异性；高温导致有利于引物与靶序列杂交而不利于与非靶序列杂交的热力学条件(H.A.Erlich(编)，PCRTechnology，StocktonPress[1989])。

如本文所用，术语“核酸检测测定法”是指确定所关注的核酸的核苷酸组成的任何方法。核酸检测测定法包括但不限于DNA测序法、探针杂交法、结构特异性裂解测定法(例如INVADER测定法Hologic，Inc.)并例如在各自整体通过引用并入本文以用于所有目的的美国专利No.5,846,717、5,985,557、5,994,069、6,001,567、6,090,543和6,872,816；Lyamichev等，Nat.Biotech.，17：292(1999)，Hall等，PNAS，USA，97：8272(2000)和US2009/0253142中有所描述、酶错配切割法(例如整体通过引用并入本文的Variagenics美国专利No.6,110,684、5,958,692、5,851,770)、聚合酶链反应、支链杂交法(例如整体通过引用并入本文的Chiron美国专利No.5,849,481、5,710,264、5,124,246和5,624,802)、滚环式复制(例如整体通过引用并入本文的美国专利No.6,210,884、6,183,960和6,235,502)、NASBA(例如整体通过引用并入本文的美国专利No.5,409,818)、分子信标技术(例如整体通过引用并入本文的美国专利No.6,150,097)、电子传感器技术(整体通过引用并入本文的Motorola美国专利No.6,248,229、6,221,583、6,013,170和6,063,573)、循环探针技术(例如整体通过引用并入本文的美国专利No.5,403,711、5,011,769和5,660,988)、DadeBehring信号扩增法(例如整体通过引用并入本文的美国专利No.6,121,001、6,110,677、5,914,230、5,882,867和5,792,614)、连接酶链式反应(例如BarnayProc.Natl.Acad.SciUSA88，189-93(1991))以及夹心杂交法(例如整体通过引用并入本文的美国专利No.5,288,609)。

术语“可扩增的核酸”是指可通过任何扩增方法扩增的核酸。据设想，“可扩增的核酸”将通常包含“样品模板”。

术语“样品模板”是指来源于分析“靶标”(下文定义)存在性的样品中的核酸。相比之下，“背景模板”的使用涉及可以存在于样品中或可以不存在于样品中的样品模板之外的核酸。背景模板最通常的情况是无意的。其可能是携带的结果，或其可能由于存在需要从样品中纯化除去的核酸污染物。例如，测试样品中可存在来自待检测生物体以外的生物体的核酸作为背景。

术语“引物”是指无论天然存在的(如在经纯化的限制性消化物中)还是合成产生的寡核苷酸，当置于诱导与核酸链互补的引物延伸产物的合成所处的条件下时其能够作为合成的引发点(例如，在核苷酸和诱导剂诸如DNA聚合酶存在下并在合适的温度和pH下)。引物优选地为单链的以便获得最大的扩增效率，但作为另外一种选择也可以为双链的。如果为双链的，则在用于制备延伸产物前首先对引物进行处理，以将其两条链分离。优选地，引物是寡脱氧核糖核苷酸。引物必需足够长，以在诱导剂存在下引发延伸产物的合成。引物的确切长度将取决于许多因素，包括温度、引物的来源和方法的使用。

术语“探针”是指无论天然存在的(如在经纯化的限制性消化物中)还是合成、重组或通过PCR扩增所产生的寡核苷酸(例如，核苷酸序列)，其能够与另一种所关注的寡核苷酸杂交。探针可以是单链的或双链的。探针可用于特定基因序列的检测、鉴定和分离(“例如俘获性探针”)。据设想，本发明所用的任何探针可在一些实施方案中用任何“报告分子”标记，以使得可在任何检测系统中检测，包括但不限于酶(例如，ELISA以及基于酶的组织化学测定法)、荧光、放射性和发光系统。无意将本发明限于任何特定的检测系统或标记。

如本文所用，“甲基化”是指在胞嘧啶的C5或N4位置、腺嘌呤的N6位置的胞嘧啶甲基化或其它类型的核酸甲基化。体外扩增的DNA通常为未甲基化的，因为典型的体外DNA扩增方法不能保持扩增模板的甲基化模式。然而，“未甲基化的DNA”或“甲基化的DNA”也可以指其原始模板分别为未甲基化的或甲基化的扩增DNA。

因此，如本文所用“甲基化核苷酸”或“甲基化核苷酸碱基”是指核苷酸碱基上存在甲基部分，其中该甲基部分不存在于公认的典型核苷酸碱基中。例如，胞嘧啶在其嘧啶环上不含甲基部分，但5-甲基胞嘧啶在其嘧啶环的5位含有甲基部分。因此，胞嘧啶不是甲基化核苷酸，而5-甲基胞嘧啶是甲基化核苷酸。在另一个实例中，胸腺嘧啶在其嘧啶环的5位含有甲基部分；然而，对于本文的目的，当存在于DNA中时胸腺嘧啶不视为甲基化核苷酸，因为胸腺嘧啶是DNA的典型核苷酸碱基。

如本文所用，“甲基化核酸分子”是指含有一个或多个甲基化核苷酸的核酸分子。

如本文所用，核酸分子的“甲基化状态”、“甲基化谱”和“甲基化状况”是指在核酸分子中存在或不存在一个或多个甲基化核苷酸碱基。例如，包含甲基化胞嘧啶的核酸分子被视为甲基化的(例如，核酸分子的甲基化状态为甲基化的)。不含任何甲基化核苷酸的核酸分子被视为未甲基化的。

特定核酸序列(例如，如本文所述的基因标记物或DNA区)的甲基化状态可以指示该序列中每一个碱基的甲基化状态，或可以指示该序列内碱基子集(例如，一个或多个胞嘧啶)的甲基化状态，或可以指示该序列内关于区域甲基化密度的信息，其中提供或不提供该序列内发生甲基化的位置的精确信息。

核酸分子中核苷酸基因座的甲基化状态是指在核酸分子中的特定基因座处存在或不存在甲基化核苷酸。例如，在核酸分子中的第7个核苷酸处胞嘧啶的甲基化状态在当存在于核酸分子中的第7个核苷酸处的核苷酸为5-甲基胞嘧啶时为甲基化的。类似地，在核酸分子中的第7个核苷酸处胞嘧啶的甲基化状态在当存在于核酸分子中的第7个核苷酸处的核苷酸为胞嘧啶(而非5-甲基胞嘧啶)时为未甲基化的。

甲基化状况可任选地由“甲基化值”(例如，表示甲基化频率、分率、比率、百分比等)表示或指示。可例如通过以下方式产生甲基化值：对在用甲基化依赖性限制酶进行限制消化后存在的完整核酸的量进行定量，或比较亚硫酸氢盐处理后的扩增谱，或比较亚硫酸氢盐处理与未处理的核酸的序列。因此，值(即，甲基化值)代表甲基化状况，并因此可用作在多个基因座拷贝中的甲基化状况的定量指标。当期望对样品中序列的甲基化状况与阈值或参照值进行比较时，这是特别有用的。

如本文所用，“甲基化频率”或“甲基化百分比(％)”是指分子或基因座为甲基化的实例数相对于分子或基因座为未甲基化的实例数。

因此，甲基化状态描述核酸(例如，基因组序列)的甲基化的状态。此外，甲基化状态是指核酸片段在特定的基因组基因座处与甲基化相关的特性。此类特性包括但不限于：此DNA序列内的任何胞嘧啶(C)残基是否为甲基化的，甲基化C残基的位置，遍及核酸的任何特定区的甲基化C的频率或百分比，以及因例如等位基因来源中的差异而导致的甲基化中的等位基因差异。术语“甲基化状态”、“甲基化谱”和“甲基化状况”还指遍及生物样品中核酸的任何特定区的甲基化C或未甲基化C的相对、绝对浓度或模式。例如，如果使核酸序列内的胞嘧啶(C)残基甲基化，则其可称为“高甲基化”或具有“增加的甲基化”，而如果DNA序列内的胞嘧啶(C)残基未甲基化，则其可称为“低甲基化”或具有“降低的甲基化”。同样，如果核酸序列内的胞嘧啶(C)残基与另一个核酸序列(例如，来自不同的区或来自不同的个体等)相比甲基化，则该序列被视为与另一个核酸序列相比高甲基化或具有增加的甲基化。或者，如果DNA序列内的胞嘧啶(C)残基与另一个核酸序列(例如，来自不同的区或来自不同的个体等)相比未甲基化，则该序列被视为与另一个核酸序列相比低甲基化或具有降低的甲基化。另外，如本文所用的术语“甲基化模式”是指在核酸的某个区上甲基化和未甲基化核苷酸的集体位点。两个核苷酸可具有相同的或相似的甲基化频率或甲基化百分比，但当甲基化和未甲基化核苷酸的数量在整个区中相同或相似但甲基化和未甲基化核苷酸的位置不同时具有不同的甲基化模式。当序列在甲基化的程度(例如，一个相对于另一个具有增加或降低的甲基化)、频率或模式不同时，将所述序列称为“差异甲基化的”或称为具有“甲基化差异”或具有“不同的甲基化状态”。术语“差异甲基化”是指在癌症阳性样品中的核酸甲基化水平或模式与在癌症阴性样品中的核酸甲基化水平或模式相比的差异。其还可以指在手术后癌症复发的患者与未复发的患者之间的水平或模式的差异。差异甲基化以及DNA甲基化的特定水平或模式是诊断和预测性生物标记物，例如，一旦定义正确的截止值或预测特性后。

甲基化状态频率可用来描述一群个体或得自单一个体的样品。例如，具有50％的甲基化状态频率的核苷酸基因座是50％的实例甲基化而50％的实例未甲基化。此类频率可以用来例如描述一群个体或一批核酸中核苷酸基因座或核酸区甲基化的程度。因此，当在第一群体或集群的核酸分子中的甲基化不同于在第二群体或集群的核酸分子中的甲基化时，则第一群体或集群的甲基化状态的频率将不同于第二群体或集群的甲基化状态频率。此类频率也可以用来例如描述在单一个体中核苷酸基因座或核酸区甲基化的程度。例如，此类频率可以用来描述得自组织样品的一组细胞在核苷酸基因座或核酸区的甲基化或未甲基化程度。

如本文所用，“核苷酸基因座”是指核酸分子中的核苷酸的位置。甲基化核苷酸的核苷酸基因座是指核酸分子中甲基化核苷酸的位置。

通常，人DNA的甲基化在包含相邻鸟嘌呤和胞嘧啶的二核苷酸序列上发生，其中胞嘧啶位于鸟嘌呤的5’(也称作CpG二核苷酸序列)。CpG二核苷酸内的大多数胞嘧啶在人基因组中甲基化，然而，一些在特定的富含CpG二核苷酸的基因组区中保持未甲基化，这些区称为CpG岛(参见例如Antequera等(1990)Cell62：503-514)。

如本文所用，“CpG岛”是指相对于全基因组DNA，所含的CpG二核苷酸数量增多的基因组DNA的G：C富集区。CpG岛的长度可为至少100、200或更多个碱基对，其中所述区的G：C含量为至少50％，并且观察到的CpG频率与预期频率的比率为0.6；在一些情况下，CpG岛的长度可为至少500个碱基对，其中所述区的G：C含量为至少55％)，并且观察到的CpG频率与预期频率的比率为0.65。观察到的CpG频率/预期频率可根据Gardiner-Garden等(1987)J.Mol.Biol.196：261-281中提供的方法计算。例如，观察到的CpG频率/预期频率可以根据下式计算：R＝(A×B)/(C×D)，其中，R是观察到的CpG频率/预期频率的比率，A是所分析的序列中CpG二核苷酸的数量，B是所分析的序列的核苷酸总数，C是所分析的序列中C核苷酸的总数，以及D是所分析的序列中G核苷酸的总数。通常在CpG岛(例如，在启动子区)测定甲基化状态。将认识到，人基因组中的其它序列易于发生DNA甲基化，诸如CpA和CpT(参见Ramsahoye(2000)Proc.Natl.Acad.Sci.USA97：5237-5242；Salmon和Kaye(1970)Biochim.Biophys.Acta.204：340-351；Grafstrom(1985)NucleicAcidsRes.13：2827-2842；Nyce(1986)NucleicAcidsRes.14：4353-4367；Woodcock(1987)Biochem.Biophys.Res.Commun.145：888-894)。

如本文所用，修饰作为核酸分子甲基化状态的函数的核酸分子的核苷酸的试剂或甲基化特异性试剂，是指可以改变核酸分子的核苷酸序列的化合物或组合物或其它药剂，其改变方式使得反映核酸分子的甲基化状态。用此类试剂处理核酸分子的方法可以包括使核酸分子与试剂接触，如果需要可以结合另外的步骤，以便实现核苷酸序列的所需改变。核酸分子的核苷酸序列中的此类变化可以得到这样一种核酸分子，其中每个甲基化的核苷酸均被修饰成不同的核苷酸。核酸的核苷酸序列中的此类变化可以得到这样一种核酸分子，其中每个未甲基化的核苷酸均被修饰成不同的核苷酸。核酸的核苷酸序列中的此类变化可以得到这样一种核酸分子，其中每个未甲基化的选定核苷酸(例如，每个未甲基化的胞嘧啶)均被修饰成不同的核苷酸。改变核酸的核苷酸序列的此类试剂的使用可以得到这样一种核酸分子，其中每个作为甲基化核苷酸的核苷酸(例如每个甲基化的胞嘧啶)均被修饰成不同的核苷酸。如本文所用，使用修饰选定的核苷酸的试剂是指修饰核酸分子中的四个通常存在的核苷酸(DNA为C、G、T和A，而RNA为C、G、U和A)中的一个核苷酸的试剂，以使得该试剂修饰一个核苷酸而不修饰其它三个核苷酸。在一个示例性实施方案中，此类试剂修饰未甲基化的选定核苷酸以产生不同的核苷酸。在另一个示例性实施方案中，此类试剂可使未甲基化的胞嘧啶核苷酸脱氨基。示例性试剂为亚硫酸氢盐。

如本文所用，术语“亚硫酸氢盐试剂”是指在一些实施方案中包含亚硫酸氢盐、重亚硫酸盐、酸式亚硫酸盐或其组合以区分例如CpG二核苷酸序列中的甲基化与未甲基化胞苷的试剂。

术语“甲基化测定法”是指用于确定核酸序列内的一个或多个CpG二核苷酸序列的甲基化状态的任何测定法。

术语“MSAP-PCR”(甲基化敏感性随机引物聚合酶链反应)是指本领域公认的技术，其允许使用富含CG的引物进行基因组全局扫描以关注最可能包含CpG二核苷酸的区，并且其由Gonzalgo等(1997)CancerResearch57：594-599进行了描述。

术语“MethyLight^TM”是指由Eads等(1999)CancerRes.59：2302-2306描述的本领域公认的基于荧光的实时PCR技术。

术语“HeavyMethyl^TM”是指这样一种测定法，其中覆盖了扩增引物之间的或扩增引物所覆盖的CpG位置的甲基化特异性阻断探针(在本文中也称为阻断剂)使得能够进行核酸样品的甲基化特异性选择性扩增。

术语“HeavyMethyl^TMMethyLight^TM”测定法是指HeavyMethyl^TMMethyLight^TM测定法，其为MethyLight^TM测定法的变型形式，其中将MethyLight^TM测定法与覆盖扩增引物之间的CpG位置的甲基化特异性阻断探针相结合。

术语“Ms-SNuPE”(甲基化敏感性单核苷酸引物延伸)是指本领域公认的由Gonzalgo&Jones(1997)NucleicAcidsRes.25：2529-2531描述的测定法。

术语“MSP”(甲基化特异性PCR)是指本领域公认的由Herman等(1996)Proc.Natl.Acad.Sci.USA93：9821-9826和由美国专利No.5,786,146描述的甲基化测定法。

术语“COBRA”(联合亚硫酸氢盐限制分析)是指本领域公认的由Xiong&Laird(1997)NucleicAcidsRes.25：2532-2534描述的甲基化测定法。

术语“MCA”(甲基化CpG岛扩增)是指由Toyota等(1999)CancerRes.59：2307-12并在WO00/26401A1中描述的甲基化测定法。

如本文所用，“选定的核苷酸”是指核酸分子中的四个通常存在的核苷酸(DNA为C、G、T和A，而RNA为C、G、U和A)中的一个核苷酸，并且可以包括通常存在的核苷酸的甲基化衍生物(例如，当C是选定的核苷酸时，甲基化和未甲基化的C均包含在选定的核苷酸的含义内)，而甲基化的选定核苷酸特指甲基化的通常存在的核苷酸，并且未甲基化的选定核苷酸特指未甲基化的通常存在的核苷酸。

术语“甲基化特异性限制酶”或“甲基化敏感性限制酶”是指根据其识别位点的甲基化状态选择性消化核酸的酶。就特异性切割的限制酶而言，如果识别位点未甲基化或半甲基化，则切割将不会发生，或如果识别位点甲基化，则将以明显降低的效率发生。就特异性切割的限制酶而言，如果识别位点甲基化，则切割将不会发生，或如果识别位点未甲基化，则将以明显降低的效率发生。优选的是甲基化特异性限制酶，其识别序列包含CG二核苷酸(例如，诸如CGCG或CCCGGG的识别序列)。对于一些实施方案，进一步优选的是这样的限制酶，如果该二核苷酸中的胞嘧啶在碳原子C5处甲基化，则该酶不发生切割。

如本文所用，“不同的核苷酸”是指在化学上不同于选定的核苷酸的核苷酸，其通常使得该不同的核苷酸具有的沃森-克里克(Watson-Crick)碱基配对性质不同于该选定的核苷酸，由此，与该选定的核苷酸互补的通常存在的核苷酸不同于与该不同的核苷酸互补的通常存在的核苷酸。例如，当C是选定的核苷酸时，U或T可以为不同的核苷酸，其示例为C与G的互补性以及U或T与A的互补性。如本文所用，与选定的核苷酸互补的核苷酸或与不同的核苷酸互补的核苷酸是指这样一种核苷酸：其在高严格性条件下与选定的核苷酸或不同的核苷酸形成碱基配对，其中亲和力高于互补性核苷酸与四个通常存在的核苷酸中的三个的碱基配对。互补性的实例是DNA(例如A-T和C-G)和RNA(例如A-U和C-G)中的沃森-克里克碱基配对。因此，例如在高严格性条件下，G与C发生碱基配对的亲和力高于G与G、A或T的碱基配对，并因此当C为选定的核苷酸时，G是与该选定的核苷酸互补的核苷酸。

如本文所用，给定的标记物的“灵敏性”是指所报告的DNA甲基化值高于区分赘生性与非赘生性样品的阈值的样品的百分比。在一些实施方案中，将阳性定义为所报告的DNA甲基化值高于阈值(例如，与疾病相关的范围)的经组织学确认的赘生物，并将假阴性定义为所报告的DNA甲基化值低于阈值(例如，与未患疾病相关的范围)的经组织学确认的赘生物。灵敏性的值因此反映得自已知患病样品的给定标记物的DNA甲基化测量值将在疾病相关测量值的范围内的概率。如这里所定义，所计算的灵敏性值的临床相关性反映给定标记物在应用于患有临床病症的受试者时将检出存在该病症的概率估计。

如本文所用，给定的标记物的“特异性”是指所报告的DNA甲基化值低于区分赘生性与非赘生性样品的阈值的非赘生性样品的百分比。在一些实施方案中，将阴性定义为所报告的DNA甲基化值低于阈值(例如，与未患疾病相关的范围)的经组织学确认的非赘生性样品，并将假阳性定义为所报告的DNA甲基化值高于阈值(例如，与疾病相关的范围)的经组织学确认的非赘生性样品。特异性的值因此反映得自已知非赘生性样品的给定标记物的DNA甲基化测量值将在与未患疾病相关的测量值的范围内的概率。如这里所定义，所计算的特异性值的临床相关性反映给定标记物在应用于未患临床病症的患者时将检出不存在该病症的概率估计。

如本文所用的术语“AUC”是“曲线下面积”的缩写。具体地，其指接收者操作特征(ROC)曲线下面积。ROC曲线是对于诊断测试的不同可能的块割点而言真阳性比率相对于假阳性比率的曲线图。其表明根据所选的切割点在灵敏性与特异性之间的折衷(灵敏性的任何增加将伴随特异性的下降)。ROC曲线下面积(AUC)是诊断测试的准确度的度量(面积越大越好；最佳为1；随机测试将具有面积为0.5的处于对角线上的ROC曲线；参见：J.P.Egan.(1975)SignalDetectionTheoryandROCAnalysis，AcademicPress，NewYork)。

如本文所用，术语“赘生物”是指“异常性组织块，其生长超过且不协调于正常组织的生长”，参见例如WillisRA，“TheSpreadofTumorsintheHumanBody”，London，Butterworth&Co，1952。

如本文所用，术语“腺瘤”是指腺体起源的良性肿瘤。虽然这些生长物是良性的，但是随着时间的推移，它们可逐渐变成恶性的。

术语“癌前”或“赘生前”及其等效形式，是指正在经历恶性转化的任何细胞增殖障碍。

赘生物、腺瘤、癌症等的“部位”是赘生物、腺瘤、癌症等所处的受试者身体中的组织、器官、细胞类型、解剖区域、身体部分等。

如本文所用，“诊断”测试应用包括受试者疾病状态或病症的检测或鉴定、确定受试者将患给定疾病或病症的可能性、确定患有疾病或病症的受试者将对治疗有反应的可能性、确定患有疾病或病症的受试者的预后(或其可能的进展或消退)以及确定治疗对患有疾病或病症的受试者的效果。例如，诊断可用于检测受试者患赘生物的存在性或可能性或此类受试者将有利地对化合物(例如药物，例如药品)或其它治疗起反应的可能性。

如本文所用的术语“标记物”是指能够通过区分癌细胞与正常细胞(例如，基于其甲基化状态)而诊断癌症的物质(例如，核酸或核酸区域)。

术语“分离的”当相对于核酸使用时，如在“分离的寡核苷酸”中是指得到鉴定并与其在自然源中通常相关的至少一种污染性核酸分离的核酸序列。分离的核酸以与其存在于自然界中不同的形式或环境而存在。相比之下，非分离的核酸(诸如DNA和RNA)以其存在于自然界中的状态存在。非分离的核酸的实例包括：给定的DNA序列(例如基因)，其邻近相邻基因存在于宿主细胞染色体上；RNA序列，诸如编码特定蛋白的特异性mRNA序列，其作为与编码大量蛋白的许多其它mRNA的混合物存在于细胞中。然而，编码特定蛋白的分离的核酸以举例的方式包括在通常表达该蛋白的细胞中的此类核酸，其中该核酸在染色体中的位置不同于天然细胞的相应位置，或者其侧翼具有不同于自然界中存在的核酸序列。分离的核酸或寡核苷酸可以单链或双链形式存在。当要将分离的核酸或寡核苷酸用于表达蛋白时，该寡核苷酸将在最低限度上包含有义或编码链(即，寡核苷酸可以为单链的)，但是可同时包含有义和反义链(即，寡核苷酸可以为双链的)。分离的核酸可在从其自然或典型环境中分离后与其它核酸或分子结合。例如，分离的核酸可存在于例如为异源表达而置入的宿主细胞中。

术语“纯化的”是指从其自然环境中移除、分离或分开的核酸或氨基酸序列分子。“分离的核酸序列”因此可以是纯化的核酸序列。“基本上纯化的”分子至少60％不含、优选地至少75％不含并且更优选地至少90％不含与其自然相关的其它组分。如本文所用，术语“纯化的”或“以纯化”也指从样品中除去污染物。除去污染蛋白导致样品中所关注的多肽或核酸的百分比升高。在另一个实例中，使重组多肽在植物、细菌、酵母或哺乳动物宿主细胞中表达，并通过除去宿主细胞蛋白而纯化多肽；重组多肽的百分比在样品中因而得以提高。

术语“包含给定多核苷酸序列或多肽的组合物”广义上是指包含该给定多核苷酸序列或多肽的任何组合物。该组合物可包括含有盐(例如NaCl)、洗涤剂(例如SDS)和其它组分(例如，Denhardt溶液、奶粉、鲑精DNA等)的水溶液。

术语“样品”以其最广泛的含义使用。在一种意义中，其可以指动物细胞或组织。在另一种意义中，意在包括从任何来源获得的标本或培养物，以及生物和环境样品。生物样品可得自植物或动物(包括人)并涵盖流体、固体、组织和气体。环境样品包含诸如地表物质、土壤、水的环境物质和工业样品。这些样品不应视为限制适用于本发明的样品类型。

如本文所用，如在一些上下文中使用的“远程样品”涉及从不是样品的细胞、组织或器官来源的部位间接收集的样品。例如，当在粪便样品中评估源于胰腺的样品材料(例如，不是直接从胰腺获取的样品)时，样品为远程样品。

如本文所用，术语“患者”或“受试者”是指接受所述技术提供的各种测试的生物体。术语“受试者”包括动物，优选哺乳动物，包括人。在优选的实施方案中，受试者为灵长类动物。在甚至更优选的实施方案中，受试者为人。

如本文所用，术语“试剂盒”是指用于递送材料的任何递送系统。在反应测定法的背景下，此类递送系统包括允许储存、运输或从一个位置到另一位置递送反应试剂(例如合适容器中的寡核苷酸、酶等)和/或支持性材料(例如缓冲液、执行测定法的书面说明等)的系统。例如，试剂盒包括容纳相关反应试剂和/或支持材料的一个或多个容器(例如，盒子)。如本文所用，术语“分段试剂盒”是指包括两个或更多个单独的容器而每个容器容纳总试剂盒组成部分的子部分的递送系统。容器可一起或单独地递送给预期的受体。例如，第一容器可容纳用于测定法的酶，而第二容器则容纳寡核苷酸。术语“分段试剂盒”旨在涵盖容纳受《联邦食品、药品和化妆品法案》(FederalFood，Drug，andCosmeticAct)的第520(e)节管理的分析物特异性试剂(ASR)的试剂盒，但并不限于此。实际上，包括两个或更多个单独容器而每个容器容纳总试剂盒组成部分的子部分的任何递送系统均包括在术语“分段试剂盒”的范围内。相比之下，“组合试剂盒”是指将反应测定法的所有组成部分均容纳在单个容器中(例如，在装有每种所需组成部分的单个盒子中)的递送系统。术语“试剂盒”包括分段试剂盒和组合试剂盒。

技术的实施方案

本文提供的是当从受试者中获取的样品(例如，粪便样品)进行检测时提供高信噪比和低背景水平的胰腺癌筛查标记物和其它胃肠癌筛查标记物的技术。在病例对照研究中通过将得自患有I期和II期PanC的受试者的肿瘤的DNA标记物的甲基化状态与得自对照受试者(例如，正常组织，诸如正常结肠和/或非肿瘤性胰腺)的相同DNA标记物的甲基化状态进行比较鉴定了标记物(参见实施例1和11)。

在病例对照研究中通过将得自具有巴瑞特氏食道的受试者的食道组织的DNA标记物的甲基化状态与得自对照受试者的相同DNA标记物的甲基化状态进行比较鉴定了标记物和/或成组的标记物(例如，具有选自NDRG4、SFRP1、BMP3、HPP1和/或APC的注释的染色体区)(参见实施例4和10)。

在病例对照研究中通过将得自受试者的粪便样品中的DNA标记物(例如，CD1D)的甲基化状态与得自不具有胰腺癌的对照受试者的相同DNA标记物的甲基化状态进行比较鉴定了标记物(例如，具有CD1D注释的染色体区)(参见实施例7)。

在病例对照研究中通过将得自受试者的粪便样品中的DNA标记物(例如，miR-1290)的测定量与得自不具有胰腺癌的对照受试者的相同DNA标记物的测定量进行比较鉴定了标记物(例如，miR-1290)(参见实施例9)。

此外，该技术提供多组标记物，例如，在一些实施方案中，标记物包含具有为ABCB1、ADCY1、BHLHE23(LOC63930)、c13orf18、CACNA1C、chr12.133、CLEC11A、ELMO1、EOMES、GJC1、IHIF1、IKZF1、KCNK12、KCNN2、NDRG4、PCBP3、PRKCB、RSPO3、SCARF2、SLC38A3、ST8SIA1、TWIST1、VWC2、WT1或ZNF71的注释并构成该标记物的染色体区(参见表1和表9)。此外，实施方案提供分析为DMRNo.11、14、15、65、21、22、23、5、29、30、38、39、41、50、51、55、57、60、61、8、75、81、82、84、87、93、94、98、99、103、104或107的表1中的DMR或对应于Chr16：58497395-58497458的DMR的方法。一些实施方案提供确定标记物的甲基化状态，其中具有为CLEC11A、C13ORF18、KCNN2、ABCB1、SLC38A3、CD1D、IKZF1、ADCY1、CHR12133、RSPO3、MBP3、PRKCB、NDRG4、ELMO或TWIST1的注释的染色体区构成该标记物。在一些实施方案中，该方法包括确定两种标记物的甲基化状态，例如，在表5的行中提供的一对标记物。

虽然本文的公开内容涉及某些所示的实施方案，但是应当理解，这些实施方案以举例而非限制的方式给出。

在特定的方面，本发明的技术提供用于鉴定、确定和/或归类癌症诸如上消化道癌(例如，食道、胰腺、胃的癌症)或下消化道癌(例如，腺瘤、结肠直肠癌)的组合物和方法。在相关的方面，所述技术提供用于鉴定、预测和/或检测癌症部位的组合物和方法。该方法包括确定从受试者分离的生物样品中的至少一种甲基化标记物的甲基化状况，其中标记物甲基化状况的变化指示癌症的存在性、类别或部位。特定的实施方案涉及用于诊断(例如筛查)赘生性细胞增殖障碍(例如癌症)(包括在疾病癌前阶段的早期检测)和预测赘生物部位(例如通过判别癌症类型，例如上消化道癌和下消化道癌)的包含差异甲基化区(DMR，例如DMR1-107，参见表1，例如DMR1-449，参见表10)的标记物。此外，该标记物用于区分赘生性与两性细胞增殖障碍。在特定的方面，本发明的技术公开了一种方法，其中将赘生性细胞增殖障碍与良性细胞增殖障碍加以区分。

本发明的技术的标记物在检测或区分结肠直肠与胰腺增殖障碍方面特别有效，从而提供所述障碍的早期检测、分类和治疗的改进手段。

除了对含有本文所提供的和表1或表10所列的DMR(例如，表1中的DMR1-107)(例如，表10中的DMR1-449)的至少一种标记物、标记物的区或标记物的碱基进行甲基化分析的实施方案以外，该技术还提供包含含有具有实用性的DMR的至少一种标记物、标记物的区或标记物的碱基的成组标记物，其用于检测癌症，特别是结肠癌、胰腺癌，以及其它上GI癌和下GI癌。

该技术的一些实施方案基于对含有DMR的至少一种标记物、标记物的区或标记物的碱基的GpG甲基化状况的分析。

在一些实施方案中，本发明的技术提供亚硫酸氢盐技术与一种或多种甲基化测定法相结合的用途，以确定含有DMR(例如，如表1中所提供(例如DMR1-107))(例如，如表10中所提供(例如，DMR1-449))的至少一种标记物内的CpG二核苷酸序列的甲基化状况。基因组CpG二核苷酸可以为甲基化的或未甲基化的(或者分别称为上^-和下^-甲基化的)。然而，本发明的方法适于分析远程样品(例如血液、器官流出物(effluent)或粪便)背景内异质性的生物样品(例如，低浓度的肿瘤细胞或从其得到的生物材料)的分析。因此，当分析此类样品内的CpG位置的甲基化状况时，可以使用定量测定法来确定特定CpG位置处的甲基化水平(例如百分比、分率、比率、比例或程度)。

根据本发明的技术，含有DMR的标记物中的CpG二核苷酸序列的甲基化状况的确定可用于诊断和表征癌症，诸如上消化道癌(例如，食道、胰腺、胃的癌症)或下消化道癌(例如，腺瘤、结肠直肠癌)。

标记物的组合

在一些实施方案中，所述技术涉及评估包含表1中的DMR(例如，2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、27、29、30)或表10中的DMR(例如，2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、27、29、30)的标记物或更多包含DMR的标记物的组合的甲基化状态。在一些实施方案中，评估多于一种标记物的甲基化状态增加用于鉴定受试者中的赘生物(例如上消化道癌(例如，食道、胰腺、胃的癌症)或下消化道癌(例如，腺瘤、结肠直肠癌))的筛查或诊断的特异性和/或灵敏性。在一些实施方案中，标记物或标记物的组合判别赘生物的类型和/或位置。例如，标记物的组合将食道赘生物、胃赘生物、胰腺赘生物、结肠直肠赘生物和腺瘤与彼此进行判别，与其它赘生物进行判别，和/或与正常(例如，非癌性、非癌前)组织进行判别。

各种癌症通过标记物的各种组合进行预测，例如，如通过与预测的特异性和灵敏性相关的统计技术所鉴定的标记物组合。所述技术提供鉴定用于一些癌症的预测性组合和经验证的预测性组合的方法。

在一些实施方案中，标记物(例如，含有DMR)的组合预测赘生物的部位。例如，在本文所述的技术的开发期间，进行了统计分析以验证标记物组合的灵敏性和特异性。例如，标记物对在＞90％的样品中准确预测肿瘤部位，前17个标记物对在＞80％的样品中准确预测肿瘤部位，并且前49个标记物在70％的样品中准确预测肿瘤部位。

测定甲基化状态的方法

分析核酸中5-甲基胞嘧啶存在性的最常用方法基于由Frommer等针对DNA中5-甲基胞嘧啶检测所述的亚硫酸氢盐方法(Frommer等(1992)Proc.Natl.Acad.Sci.USA89：1827-31，其明确地整体通过引用并入本文以用于所有目的)或其变型形式。对5-甲基胞嘧啶作图的亚硫酸氢盐方法基于观察胞嘧啶而非5-甲基胞嘧啶与亚硫酸氢离子(也称为亚硫酸氢盐)反应。该反应通常根据以下步骤进行：首先，胞嘧啶与亚硫酸氢反应形成磺化胞嘧啶。接下来，磺化反应中间体的自发脱氨基产生磺化尿嘧啶。最后，磺化尿嘧啶在碱性条件下脱磺酸盐以形成尿嘧啶。检测是可能的，因为尿嘧啶与腺嘌呤碱基配对(因此表现类似于胸腺嘧啶)，而5-甲基胞嘧啶与鸟嘌呤碱基配对(因此表现类似于胞嘧啶)。这通过例如亚硫酸氢盐基因组测序(GriggG，&ClarkS，Bioessays(1994)16：431-36；GriggG，DNASeq.(1996)6：189-98)或如例如美国专利No.5,786,146中所公开的甲基化特异性PCR(MSP)使得判别甲基化胞嘧啶与甲基化胞嘧啶成为可能。

一些常规技术涉及包括以下方面的方法：将待分析的DNA封闭在琼脂糖基质中，从而防止DNA扩散和复性(亚硫酸氢盐仅与单链DNA反应)并将沉淀和纯化步骤用快速渗析替换(OlekA等(1996)“Amodifiedandimprovedmethodforbisulfitebasedcytosinemethylationanalysis”NucleicAcidsRes.24：5064-6)。因此可能分析各个细胞的甲基化状况，从而展示出该方法的实用性和灵敏性。检测5-甲基胞嘧啶的常规方法的概述由Rein，T.等(1998)NucleicAcidsRes.26：2255提供。

亚硫酸氢盐技术通常涉及在亚硫酸氢盐处理之后扩增已知核酸的短、特异性片段，然后通过测序(Olek&Walter(1997)Nat.Genet.17：275-6)或引物延伸反应(Gonzalgo&Jones(1997)NucleicAcidsRes.25：2529-31；WO95/00669；美国专利No.6,251,594)测定产物以分析各个胞嘧啶位置。一些方法使用酶消化(Xiong&Laird(1997)NucleicAcidsRes.25：2532-4)。通过杂交进行检测在本领域中也进行了描述(Olek等，WO99/28498)。另外，已经描述了相对于各个基因使用亚硫酸氢盐技术进行甲基化检测(Grigg&Clark(1994)Bioessays16：431-6，；Zeschnigk等(1997)HumMolGenet.6：387-95；Feil等(1994)NucleicAcidsRes.22：695；Martin等(1995)Gene157：261-4；WO9746705；WO9515373)。

各种甲基化测定程序在本领域中是已知的并可根据本发明的技术与亚硫酸氢盐处理结合使用。这些测定法使得可以确定核酸序列内一个或多个CpG二核苷酸(例如，CpG岛)的甲基化状态。此类测定法除了其它技术外涉及对亚硫酸氢盐处理的核酸测序、PCR(对于序列特异性扩增)、Southern印迹分析和使用甲基化敏感性限制酶。

例如，已对基因组测序进行了简化以通过使用亚硫酸氢盐处理来分析甲基化模式和5-甲基胞嘧啶分布(Frommer等(1992)Proc.Natl.Acad.Sci.USA89：1827-1831)。另外，对从亚硫酸氢盐转化的DNA扩增的PCR产物的限制酶消化可用于评估甲基化状态，例如，如由Sadri&Hornsby(1997)Nucl.AcidsRes.24：5058-5059所述或如在称为COBRA(联合亚硫酸氢盐限制分析)(Xiong&Laird(1997)NucleicAcidsRes.25：2532-2534)的方法中所体现。

COBRA^TM分析是可用于确定少量基因组DNA中特定基因座处的DNA甲基化水平的定量甲基化测定法(Xiong&Laird，NucleicAcidsRes.25：2532-2534，1997)。简而言之，将限制酶消化用于揭露经亚硫酸氢钠处理的DNA的PCR产物中的甲基化依赖性序列差异。首先将甲基化依赖性序列差异通过标准亚硫酸氢盐处理根据Frommer等(Proc.Natl.Acad.Sci.USA89：1827-1831，1992)所述的程序引入基因组DNA。然后使用所关注的CpG岛特异性的引物进行经亚硫酸氢盐转化的DNA的PCR扩增，再进行限制性内切核酸酶消化、凝胶电泳以及使用特异性、经标记的杂交探针进行检测。原始DNA样品中的甲基化水平由经消化的和未消化的PCR产物的相对量在整个广谱DNA甲基化水平中以线性定量方式表示。此外，该技术可以可靠地应用于得自显微解剖石蜡包埋组织样品的DNA。

用于COBRA^TM分析的典型试剂(例如，如可见于典型的基于COBRA^TM的试剂盒)可包括但不限于：特定基因座(例如，特定基因、标记物、DMR、基因区、标记物区、经亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物；限制酶和适当的缓冲液；基因杂交寡核苷酸；对照杂交寡核苷酸；寡核苷酸探针的激酶标记试剂盒；和标记的核苷酸。另外，亚硫酸氢盐转化试剂可包括：DNA变性缓冲液、磺化缓冲液、DNA回收试剂或试剂盒(例如，沉淀、超滤、亲和柱)、脱磺缓冲液和DNA回收组分。

优选地，将诸如“MethyLight^TM”(基于荧光的实时PCR技术)(Eads等，CancerRes.59：2302-2306，1999)、Ms-SNuPE^TM(甲基化敏感性单核苷酸引物延伸)反应(Gonzalgo&Jones，NucleicAcidsRes.25：2529-2531，1997)、甲基化特异性PCR(“MSP”；Herman等，Proc.Natl.Acad.Sci.USA93：9821-9826，1996；美国专利No.5,786,146)和甲基化CpG岛扩增(“MCA”；Toyota等，CancerRes.59：2307-12，1999)的测定法单独使用或与这些方法中的一种或多种结合使用。

“HeavyMethyl^TM”测定技术是用于基于经亚硫酸氢盐处理的DNA的甲基化特异性扩增而评估甲基化差异的定量方法。覆盖了扩增引物之间的或扩增引物所覆盖的CpG位置的甲基化特异性阻断探针(也称为阻断剂)使得能够进行核酸样品的甲基化特异性选择性扩增。

术语“HeavyMethyl^TMMethyLight^TM”测定法是指HeavyMethyl^TMMethyLight^TM测定法，其为MethyLight^TM测定法的变型形式，其中将MethyLight^TM测定法与覆盖扩增引物之间的CpG位置的甲基化特异性阻断探针相结合。HeavyMethyl^TM测定法还可以与甲基化特异性扩增引物结合使用。

用于HeavyMethyl^TM分析的典型试剂(例如，如可见于典型的基于MethyLight^TM的试剂盒)可包括但不限于：特定基因座(例如，特定基因、标记物、DMR、基因区、标记物区、经亚硫酸氢盐处理的DNA序列、CpG岛或经亚硫酸氢盐处理的DNA序列或CpG岛等)的PCR引物；阻断寡核苷酸；经优化的PCR缓冲液和脱氧核苷酸；以及Taq聚合酶。

MSP(甲基化特异性PCR)使得可以独立于甲基化敏感性限制酶的使用而评估CpG岛内几乎任一组CpG位点的甲基化状况(Herman等Proc.Natl.Acad.Sci.USA93：9821-9826，1996；美国专利No.5,786,146)。简而言之，将DNA通过亚硫酸氢钠修饰，其将未甲基化的而不是甲基化的胞嘧啶转化成尿嘧啶，随后将产物用甲基化与未甲基化DNA特异性的引物进行扩增。MSP仅需要少量的DNA，对给定CpG岛基因座的0.1％甲基化等位基因敏感；并且可在从石蜡包埋样品提取的DNA上进行。用于MSP分析的典型试剂(例如，如可见于典型的基于MSP的试剂盒)可包括但不限于：特定基因座(例如，特定基因、标记物、DMR、基因区、标记物区、经亚硫酸氢盐处理的DNA序列、CpG岛等)的甲基化和未甲基化PCR引物；经优化的PCR缓冲液和脱氧核苷酸；以及特异性探针。

MethyLight^TM测定法是一种高通量定量甲基化测定法，其利用基于荧光的实时PCR(例如，)，无需在PCR步骤之后进行进一步的操纵(Eads等，CancerRes.59：2302-2306，1999)。简而言之，MethyLight^TM方法始于基因组DNA的混合样品，所述DNA在亚硫酸氢钠反应中根据标准程序转化成甲基化依赖性序列差异的混合库(亚硫酸氢盐方法将未甲基化的胞嘧啶残基转化成尿嘧啶)。然后在“偏倚”(biased)反应中进行基于荧光的PCR，例如，通过与已知的CpG二核苷酸重叠的PCR引物。序列判别在扩增过程的水平上和在荧光检测过程的水平上均发生。

MethyLight^TM测定法用作核酸(例如，基因组DNA样品)中甲基化模式的定量测试，其中序列判别在探针杂交的水平上发生。在定量形式中，PCR反应在存在与特定的推定甲基化位点重叠的荧光探针的情况下提供甲基化特异性扩增。输入性DNA的量的无偏倚对照由既无引物也无探针叠加在任何CpG二核苷酸上的反应提供。或者，基因组甲基化的定性测试通过用未覆盖已知甲基化位点的对照寡核苷酸(例如，HeavyMethyl^TM和MSP技术的基于荧光的形式)或用覆盖潜在甲基化位点的寡核苷酸探查偏倚PCR库而实现。

MethyLight^TM方法与任何合适的探针(例如，探针、探针等)一起使用。例如，在一些应用中，将双链基因组DNA用亚硫酸氢钠处理并接受使用探针的两套PCR反应之一，例如，使用MSP引物和/或HeavyMethyl阻断寡核苷酸和探针。探针用荧光“报告”和“淬灭”分子进行双重标记，并被设计成对相对高GC含量的区特异性的，以使得其在PCR循环中在比正向或反向引物高约10℃的温度下熔解。这使得探针可以在PCR退火/延伸步骤期间保持完全杂交。随着Taq聚合酶在PCR期间以酶促方式合成新链，其最终将到达退火的探针。Taq聚合酶5′至3′内切核酸酶活性然后将通过消化探针而使其发生位移，从而释放荧光报告分子以供使用实时荧光检测系统对其现在未淬灭的信号进行定量检测。

用于MethyLight^TM分析的典型试剂(例如，如可见于典型的基于MethyLight^TM的试剂盒)可包括但不限于：特定基因座(例如，特定基因、标记物、DMR、基因区、标记物区、经亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物；或探针；经优化的PCR缓冲液和脱氧核苷酸；以及Taq聚合酶。

QM^TM(定量甲基化)测定法是基因组DNA样品中甲基化模式的替代性定量测试，其中序列判别在探针杂交的水平上发生。在该定量形式中，PCR反应在存在与特定的推定甲基化位点重叠的荧光探针的情况下提供无偏倚扩增。输入性DNA的量的无偏倚对照由既无引物也无探针叠加在任何CpG二核苷酸上的反应提供。或者，基因组甲基化的定性测试通过用未覆盖已知甲基化位点的对照寡核苷酸(HeavyMethyl^TM和MSP技术的基于荧光的形式)或用覆盖潜在甲基化位点的寡核苷酸探查偏倚PCR库而实现。

QM^TM方法可在扩增过程中与任何合适的探针一起使用，例如探针、探针。例如，将双链基因组DNA用亚硫酸氢钠处理并接受无偏倚引物和探针处理。探针用荧光“报告”和“淬灭”分子进行双重标记，并被设计成对相对高GC含量的区特异性的，以使得其在PCR循环中在比正向或反向引物高约10℃的温度下熔出。这使得探针可以在PCR退火/延伸步骤期间保持完全杂交。随着Taq聚合酶在PCR期间以酶促方式合成新链，其最终将到达退火的探针。Taq聚合酶5′至3′内切核酸酶活性然后将通过消化探针而使其发生位移，从而释放荧光报告分子以供使用实时荧光检测系统对其现在未淬灭的信号进行定量检测。用于QM^TM分析的典型试剂(例如，如可见于典型的基于QM^TM的试剂盒)可包括但不限于：特定基因座(例如，特定基因、标记物、DMR、基因区、标记物区、经亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物；或探针；经优化的PCR缓冲液和脱氧核苷酸；以及Taq聚合酶。

Ms-SNuPE^TM技术是基于DNA的亚硫酸氢盐处理然后是单核苷酸引物延伸而评估特定CpG位点处的甲基化差异的定量方法(Gonzalgo&Jones，NucleicAcidsRes.25：2529-2531，1997)。简而言之，使基因组DNA与亚硫酸氢盐反应以将未甲基化的胞嘧啶转化成尿嘧啶而保持5-甲基胞嘧啶不变。然后使用经亚硫酸氢盐转化的DNA特异性的PCR引物进行对所需靶序列的扩增，并将所得的产物分离且用作在所关注的CpG位点处进行甲基化分析的模板。可以分析少量DNA(例如，显微解剖的病理切片)并且其避免使用限制酶来确定CpG位点处的甲基化状况。

用于Ms-SNuPE^TM分析的典型试剂(例如，如可见于典型的基于Ms-SNuPE^TM的试剂盒)可包括但不限于：特定基因座(例如，特定基因、标记物、DMR、基因区、标记物区、经亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物；经优化的PCR缓冲液和脱氧核苷酸；凝胶提取试剂盒；阳性对照引物；特定基因座的Ms-SNuPE^TM引物；反应缓冲液(用于Ms-SNuPE反应)；以及经标记的核苷酸。另外，亚硫酸氢盐转化试剂可包括：DNA变性缓冲液、磺化缓冲液、DNA回收试剂或试剂盒(例如，沉淀、超滤、亲和柱)、脱磺缓冲液和DNA回收组分。

简化的表观亚硫酸氢盐测序(RRBS)始于核酸的亚硫酸氢盐处理以将所有未甲基化的胞嘧啶转化成尿嘧啶，然后进行限制酶消化(例如，通过识别包含CG序列的位点的酶，诸如MspI)以及在偶合到衔接子配体后的片段的完整测序。限制酶的选择富集CpG密集区的片段，从而减少可在分析期间映射到多个基因位置的冗余序列的数量。因此，RRBS通过选择限制片段的子集(例如，通过使用制备型凝胶电泳进行大小选择)进行测序而降低核酸样品的复杂性。与全基因组亚硫酸氢盐测序相对，通过限制酶消化所产生的每一个片段都含有至少一个CpG二核苷酸的DNA甲基化信息。因此，RRBS通过高频率的限制酶切割位点富集样品的启动子、CpG岛和其它基因组特征，并因此提供评估一个或多个基因组基因座的甲基化状态的测定法。

RRBS的典型方案包括用诸如MspI的限制酶消化核酸样品、填充悬垂和加A尾区、连接衔接子、亚硫酸氢盐转化以及PCR的步骤。参见例如等(2005)“Genome-scaleDNAmethylationmappingofclinicalsamplesatsingle-nucleotideresolution”NatMethods7：133-6；Meissner等(2005)“Reducedrepresentationbisulfitesequencingforcomparativehigh-resolutionDNAmethylationanalysis”NucleicAcidsRes.33：5868-77。

在一些实施方案中，将定量等位基因特异性实时靶标和信号扩增(QuARTS)测定法用于评价甲基化状态。三个反应在每次QuARTS测定中依次发生；包括在一次反应中的扩增(反应1)和靶探针裂解(反应2)；以及在二次反应中的FRET裂解和荧光信号生成(反应3)。当将靶核酸用特异性引物扩增时，具有侧翼序列的特异性检测探针松散地结合到扩增子。在靶结合位点处存在特异性侵入式寡核苷酸导致裂解酶(cleavase)通过在检测探针与侧翼序列之间切割而释放侧翼序列。侧翼序列与相应FRET盒的非发夹部分互补。因此，侧翼序列对FRET盒起到侵入式寡核苷酸的作用，并实现FRET盒荧光团与淬灭基团之间的裂解，这将产生荧光信号。裂解反应可每个靶标切割多个探针，并因此每个侧翼释放多个荧光团，从而提供指数级信号扩增。QuARTS可通过将FRET盒与不同的染料一起使用而在单个反应孔中检测多个靶标。参见例如在Zou等(2010)“Sensitivequantificationofmethylatedmarkerswithanovelmethylationspecifictechnology”ClinChem56：A199；美国专利申请No.12/946,737、12/946,745、12/946,752和61/548,639中。

术语“亚硫酸氢盐试剂”是指包含亚硫酸氢盐、重亚硫酸盐、酸式亚硫酸盐或其组合的试剂，如本文所公开其可用于区分甲基化与未甲基化CpG二核苷酸序列。所述处理的方法在本领域中是已知的(例如，整体以引用方式并入的PCT/EP2004/011715)。优选的是，亚硫酸氢盐处理在存在诸如但不限于正烷撑二醇(n-alkylenglycol)或二乙二醇(DME)的变性溶剂的情况下或在存在二噁烷或二噁烷衍生物的情况下进行。在一些实施方案中，变性溶剂以1％与35％(v/v)之间的浓度使用。在一些实施方案中，亚硫酸氢盐反应在存在清除剂的情况下进行，诸如但不限于色烷衍生物，例如6-羟基-2，5，7，8，-四甲基色烷2-羧酸或三羟基苯甲酸(trihydroxybenzoneacid)及其衍生物，例如没食子酸(参见PCT/EP2004/011715，其整体通过引用并入)。亚硫酸氢盐转化优选地在30℃与70℃之间的反应温度下进行，其中在反应期间将温度短时间地增至超过85℃(参见PCT/EP2004/011715，其整体通过引用并入)。经亚硫酸氢盐处理的DNA优选地在定量之前进行纯化。这可通过本领域任何已知的手段进行，诸如但不限于超滤，例如借助Microcon^TM柱(由Millipore^TM制造)。纯化根据改良的制造商方案进行(参见例如PCT/EP2004/011715，其整体通过引用并入)。

在一些实施方案中，将经处理的DNA的片段用根据本发明的引物寡核苷酸的集合(例如参见表2)和扩增酶进行扩增。多个DNA片段的扩增可在一个且相同的反应容器中同时进行。通常，扩增使用聚合酶链反应(PCR)进行。扩增子的长度通常为100至2000个碱基对。

在该方法的另一个实施方案中，在包含DMR(例如，如表1中所提供的DMR1-107)(例如，如表10中所提供的DMR1-449)的标记物内或附近的CpG位置的甲基化状态可通过使用甲基化特异性引物寡核苷酸进行检测。该技术(MSP)已在授予Herman的美国专利No.6,265,171中进行了描述。将甲基化状况特异性引物用于扩增经亚硫酸氢盐处理的DNA使得可以区分甲基化与未甲基化核酸。MSP引物对含有至少一个杂交到经亚硫酸氢盐处理的CpG二核苷酸的引物。因此，所述引物的序列包含至少一个CpG二核苷酸。非甲基化DNA特异性的MSP引物在CpG中的C位置的位置处包含“T”。

借助扩增而获得的片段可携带可直接或间接检测的标记。在一些实施方案中，标记为荧光标记、放射性核素或具有可在质谱仪中检测的典型质量的可检测分子片段。若所述标记为质量标记，则一些实施方案使得经标记的扩增子具有单个正或负净电荷，从而允许在质谱仪中更好地检测。可进行检测并借助例如基质辅助激光解析/电离质谱(MALDI)或使用电子喷雾质谱(ESI)进行观察。

适于这些测定技术的分离DNA的方法在本领域中是已知的。具体地，一些实施方案包括如整体通过引用并入本文的美国专利申请No.13/470,251(“IsolationofNucleicAcids”)中所述分离核酸。

方法

在所述技术的一些实施方案中，提供了包括以下步骤的方法：

1)将得自受试者的核酸(例如，基因组DNA，例如从体液诸如粪便样品或胰腺组织分离的)与区分包含DMR(例如，DMR1-107，例如，如表1中所提供)(例如，DMR1-449，例如，如表10中所提供)的至少一种标记物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，以及

2)检测赘生物或增殖障碍(例如，通过大于或等于80％的灵敏性和大于或等于80％的特异性提供)。

1)将得自受试者的核酸(例如，基因组DNA，例如从体液诸如粪便样品或胰腺组织分离的)与区分至少一种标记物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标记物选自具有选自ABCB1、ADCY1、BHLHE23(LOC63930)、c13orf18、CACNA1C、chr12133、CLEC11A、ELMO1、EOMES、CLEC11、SHH、GJC1、IHIF1、IKZF1、KCNK12、KCNN2、PCBP3、PRKCB、RSPO3、SCARF2、SLC38A3、ST8SIA1、TWIST1、VWC2、WT1和ZNF71的注释的染色体区；以及

2)检测胰腺癌(例如，通过大于或等于80％的灵敏性和大于或等于80％的特异性提供)。

1)将得自受试者的核酸(例如，基因组DNA，例如从体液诸如粪便样品或食道组织分离的)与区分至少一种标记物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标记物选自具有选自NDRG4、SFRP1、BMP3、HPP1和APC的注释的染色体区；以及

2)检测巴瑞特氏食道(例如，通过大于或等于80％的灵敏性和大于或等于80％的特异性提供)。

1)将得自受试者的核酸(例如，基因组DNA，例如从体液诸如粪便样品或胰腺组织分离的)与区分至少一种标记物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标记物选自具有选自ADCY1、PRKCB、KCNK12、C13ORF18、IKZF1、TWIST1、ELMO、55957、CD1D、CLEC11A、KCNN2、BMP3和NDRG4的注释的染色体区；以及

1)将得自受试者的核酸(例如，基因组DNA，例如从粪便样品分离的)与区分具有CD1D的染色体区内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触；以及

优选地，灵敏性为约70％至约100％、或约80％至约90％、或约80％至约85％。优选地，特异性为约70％至约100％、或约80％至约90％、或约80％至约85％。

基因组DNA可通过任何手段分离，包括使用市售试剂盒。简而言之，其中所关注的DNA被细胞膜包封，必须通过酶、化学或机械手段破坏和裂解生物样品。然后可清除DNA溶液中的蛋白质和其它污染物，例如，通过用蛋白酶K消化。然后从溶液中回收基因组DNA。这可借助多种方法进行，这些方法包括盐析、有机提取或将DNA结合到固相载体。方法的选择将受多种因素的影响，这些因素包括时间、花费和所需的DNA量。所有包含赘生物质或赘生前物质的临床样品类型均适用于本发明的方法，例如细胞系、组织学切片、活检标本、石蜡包埋组织、体液、粪便、结肠流出物、尿液、血浆、血清、全血、分离的血细胞、从血液分离的细胞及其组合。

所述技术不限于用于制备样品并提供用来测试的核酸的方法。例如，在一些实施方案中，使用直接基因捕获(例如，如在美国专利申请No.61/485386中详述的)或通过相关方法从粪便样品或从血液或从血浆样品中分离DNA。

然后将基因组DNA样品用至少一种试剂或试剂系列处理，该试剂区分含有DMR(例如，DMR1-107，例如，如由表1所提供)(例如，DMR1-449，例如，如由表10所提供)的至少一种标记物内的甲基化与未甲基化CpG二核苷酸。

在一些实施方案中，该试剂将在5′-位置未甲基化的胞嘧啶碱基转化成在杂交行为方面与胞嘧啶相异的尿嘧啶、胸腺嘧啶或另一种碱基。然而，在一些实施方案中，该试剂可以是甲基化敏感性限制酶。

在一些实施方案中，将基因组DNA样品以一定的方式处理，以使得在5′位置未甲基化的胞嘧啶碱基转化成在杂交行为方面与胞嘧啶相异的尿嘧啶、胸腺嘧啶或另一种碱基。在一些实施方案中，该处理通过亚硫酸氢盐(酸式亚硫酸盐、重亚硫酸盐)然后通过碱解而进行。

然后分析经处理的核酸以确定靶基因序列(含有DMR(例如选自例如如表1中所提供的DMR1-107的至少一个DMR)的标记物中的至少一个基因、基因组序列或核苷酸)(含有DMR(例如选自例如如表10中所提供的DMR1-449的至少一个DMR)的标记物中的至少一个基因、基因组序列或核苷酸)的甲基化状态。分析方法可选自本领域已知的那些，包括本文所列的那些，例如如本文所述的QuARTS和MSP。

含有DMR(例如，DMR1-107，例如，如由表1所提供)(例如，DMR1-449，例如，如由表10所提供)的标记物的异常甲基化更具体地讲高甲基化与癌症相关，并在一些实施方案中预测肿瘤部位。

所述技术涉及分析与胃肠系统的癌症相关的任何样品。例如，在一些实施方案中，样品包括得自患者的组织和/或体液。在一些实施方案中，样品包括分泌物。在一些实施方案中，样品包括血液、血清、血浆、胃分泌物、胰液、胃肠活检样品、得自胃肠活检的显微解剖细胞、脱落到胃肠内腔中的胃肠细胞和/或从粪便回收的胃肠细胞。在一些实施方案中，受试者为人。这些样品可源自上消化道、下消化道，或包括得自上消化道和下消化道两者的细胞、组织和/或分泌物。样品可包括得自肝脏、胆管、胰腺、胃、结肠、直肠、食道、小肠、阑尾、十二指肠、息肉、胆囊、肛门和/或腹膜的细胞、分泌物或组织。在一些实施方案中，样品包括细胞液、腹水、尿液、粪便、胰液、在内窥镜检查期间得到的体液、血液、粘液或唾液。在一些实施方案中，样品为粪便样品。

此类样品可以通过本领域已知的许多手段获得，诸如对技术人员来说显而易见的。例如，尿液和粪便样品可容易地得到，而血液、腹水或胰液样品可以例如通过使用针头和注射器不经肠道获得。无细胞或基本上无细胞的样品可以通过使样品接受本领域技术人员已知的各种技术处理而获得，这些技术包括但不限于离心和过滤。虽然通常优选的是使用非侵入式技术来获得样品，但仍然可以优选的是获取诸如组织匀浆、组织切片和活检标本的样品。

在一些实施方案中，所述技术涉及处理患者(例如，患有胃肠癌、患有早期胃肠癌或可能发生胃肠癌的患者)的方法，该方法包括确定如本文所提供的一个或多个DMR的甲基化状态并基于甲基化状态确定结果向患者施用治疗。该治疗可以是施用药物化合物、疫苗、进行手术、对患者成像、进行另一项测试。优选地，所述用途用于临床筛查方法、预后评估方法、监测治疗结果的方法、鉴定最可能对特定治疗性治疗有反应的患者的方法、对患者或受试者成像的方法以及药物筛选和开发方法。

在所述技术的一些实施方案中，提供了诊断受试者中的胃肠癌的方法。如本文所用的术语“诊断”是指这样的方法，即技术人员通过这些方法可估计甚至确定受试者是否患有给定的疾病或病症或可能在将来发生给定的疾病或病症。技术人员通常基于一个或多个诊断指标而作出诊断，这些指标比如为生物标记物(例如，如本文所公开的DMR)，其甲基化状态指示病症的存在性、严重性或不存在。

除了诊断，临床癌症的预后涉及确定癌症的侵袭性和肿瘤复发的可能性以计划最有效的治疗。如果可作出更加准确的预后或甚至可以评估发生癌症的潜在风险，则可以为患者选择适当的治疗，并在某些情况下更缓和的治疗。癌症生物标记物的评估(例如，确定甲基化状态)可用于以下方面：将具有良好预后和/或低癌症发生风险的将不需要治疗或需要有限治疗的受试者与那些更可能发生癌症或遭受癌症复发的将可能受益于更强化治疗的受试者分开。

由此，如本文所用的“作出诊断”或“诊断”进一步包括基于本文所公开的诊断性生物标记物(例如DMR)的测量来确定癌症发生风险或确定预后，这可用于预测临床结果(进行或不进行医学治疗)、选择适当的治疗(或治疗是否有效)或对现行治疗进行监测并可能改变治疗。另外，在本发明所公开的主题的一些实施方案中，可以随时间进行对生物标记物的多次测定以有利于诊断和/或预后。生物标记物的时间性变化可用于预测临床结果、监测胃肠癌的进展和/或监测针对所述癌症的适当治疗的效果。在此类实施方案中，例如，预期可能看到：在有效治疗的过程中随着时间的推移生物样品中一种或多种本文所公开的生物标记物(例如，DMR)(以及如果进行监测的话，有可能的一种或多种另外的生物标记物)的甲基化状态的变化。

本发明所公开的主题在一些实施方案中进一步提供用于确定是否在受试者中开始或继续癌症的预防或治疗的方法。在一些实施方案中，该方法包括：提供得自受试者的一个时间段内的一系列生物样品；分析该系列生物样品以确定每个生物样品中的至少一种本文所公开的生物标记物的甲基化状态；以及比较每个生物样品中一种或多种生物标记物的甲基化状态的任何可测量变化。在该时间段内生物标记物的甲基化状态的任何变化可用于预测发生癌症的风险，预测临床结果，确定是否开始或继续癌症的预防或治疗，以及现行治疗是否能有效治疗癌症。例如，可以在开始治疗之前选择第一时间点，并在开始该治疗后的某个时间选择第二时间点。可以测量取自不同时间点的每个样品中的甲基化状态，并记录定性和/或定量差异。可将不同样品中的生物标记物水平的甲基化状态的变化与受试者中的胃肠癌风险、预后、确定治疗效果和/或癌症进展相关联。

在优选的实施方案中，本发明的方法和组合物用于治疗或诊断处于早期的疾病，例如，在疾病症状出现前。在一些实施方案中，本发明的方法和组合物用于治疗或诊断处于临床阶段的疾病。

如所述，在一些实施方案中，可进行一种或多种诊断或预后生物标记物的多次测定，并且可以将标志物的时间性变化用于确定诊断或预后。例如，可在初始时间并再次在第二时间测定诊断标记物。在此类实施方案中，从初始时间到第二时间标记物的增加可诊断癌症的特定类型或严重性或给定的预后。同样，从初始时间到第二时间标记物的减少可指示癌症的特定类型或严重性或给定的预后。此外，一种或多种标记物的变化程度可与癌症的严重性和将来的不良事件相关。技术人员将理解的是，虽然在某些实施方案中可以在多个时间点进行同一生物标记物的比较测量，但是也可以在一个时间点测量给定的生物标记物并在另一时间点测量第二生物标记物，而对这些标记物的比较可提供诊断信息。

如本文所用，短语“确定预后”是指这样的方法，即技术人员通过该方法可预测受试者中的病症的过程或结果。术语“预后”不是指基于生物标记物(例如，DMR)的甲基化状态以100％的准确度预测病症的过程或结果的能力，甚至也不是指预测给定过程或结果更可能发生或更不可能发生的能力。相反，技术人员将理解的是，术语“预后”是指某一过程或结果将出现的概率增加；即当与未表现出给定病症的那些个体相比时，过程或结果更可能出现在表现出该病症的受试者中。例如，在未表现出该病症(例如，具有一个或多个DMR的正常甲基化状态)的个体中，给定结果(例如患胃肠癌)出现的机会可能极低。

在一些实施方案中，统计分析将预后指标与产生不良结果的倾向相关联。例如，在一些实施方案中，与得自未患癌症的患者的正常对照样品中不同的甲基化状态可预兆受试者比具有更类似于对照样品中的甲基化状态的水平的受试者更可能患癌症，如由统计显著性水平所确定。另外，甲基化状态相对于基线(例如，“正常”)水平的变化可反映受试者预后，并且甲基化状态的变化程度可与不良事件的严重性相关。统计显著性通过以下方式确定，即比较两个或多个群体并确定置信区间和/或p值。参见例如整体通过引用并入本文的Dowdy和Wearden，StatisticsforResearch，JohnWiley&Sons，NewYork，1983。本发明主题的示例性置信区间为90％、95％、97.5％、98％、99％、99.5％、99.9％和99.99％，而示例性p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001和0.0001。

在其它实施方案中，可确立本文所公开的预后或诊断生物标记物(例如，DMR)的甲基化状态变化的阈值程度，并只是将生物样品中的该生物标记物的甲基化状态变化程度与甲基化状态变化的阈值程度进行比较。本文所提供的生物标记物的甲基化状态的优选阈值变化为约5％、约10％、约15％、约20％、约25％、约30％、约50％、约75％、约100％和约150％。在另外其它实施方案中，可确立“诺模图”(nomogram)，通过该图将预后或诊断指标(生物标记物或生物标记物的组合)的甲基化状态与给定结果的相关倾向进行直接关联。技术人员熟悉使用此类诺模图来关联两个数值，且理解由于所参照的是各个样品测量值而非群体平均值，因此该测量的不确定性与该标记物浓度的不确定性相同。

在一些实施方案中，与生物样品同时分析对照样品，以使得可以将从生物样品得到的结果与从对照样品得到的结果进行比较。另外，据设想，可提供标准曲线，通过该标准曲线可比较生物样品的测定结果。此类标准曲线将生物标记物的甲基化状态作为测定单位(例如，在使用荧光标记时，为荧光信号强度)的函数形式而呈现。使用取自多个供体的样品，可提供以下方面的标准曲线：正常组织中一种或多种生物标记物的对照甲基化状态的标准曲线，以及取自具有化生的供体或取自患有胃肠癌的供体的组织中一种或多种生物标记物的“风险”水平的标准曲线。在该方法的某些实施方案中，当在得自受试者的生物样品中鉴定出本文所提供的一个或多个DMR的异常甲基化状态时，将该受试者鉴定为具有化生。在该方法的其它实施方案中，在得自受试者的生物样品中检测出一种或多种此类生物标记物的异常甲基化状态导致将受试者鉴定为患有癌症。

标记物的分析可与一个测试样品中的另外的标记物单独地或同时地进行。例如，可将多个标记物合并到一项测试中，以有效处理多个样品并可能提供更高的诊断和/或预后准确度。此外，本领域技术人员将会认识到测试得自同一受试者的多个样品(例如在连续的时间点)的价值。对系列样品的此类测试可允许鉴定标记物甲基化状态随时间的变化。甲基化状态的变化以及不存在甲基化状态的变化可提供关于疾病状态的有用信息，这些信息包括但不限于鉴定距事件发生的大致时间，可补救组织的存在性和量，药物治疗的适当性，各种治疗的有效性，以及受试者的结果的鉴定(包括未来事件的风险)。

可以以多种物理形式进行生物标记物的分析。例如，微量滴定板或自动装置的使用可用于促进大量测试样品的处理。或者，可以开发单样品的形式以有利于即时地进行立即治疗和诊断，例如在救护车上或在急诊室中。

在一些实施方案中，如果当与对照甲基化状态相比时，样品中至少一种生物标记物的甲基化状态存在可测量的差异，则该受试者诊断为患有胃肠癌。相反，当未在生物样品中鉴定出甲基化状态变化时，可以将该受试者鉴定为未患胃肠癌、不处于癌症风险中或具有低癌症风险。在这一点上，可将患有癌症或具有其风险的受试者与具有低至基本上无癌症或其风险的受试者加以区分。可以对那些具有发生胃肠癌风险的受试者执行更深入的和/或更常规的筛查计划，包括内窥镜监视。在另一方面，那些具有低风险至基本上无风险的受试者可避免接受内窥镜检查，直至在将来的筛查(例如根据本发明的技术进行的筛查)时表明在那些受试者中出现了胃肠癌的风险。

如上文所提及，根据本发明技术的方法的实施方案，对一种或多种生物标记物的甲基化状态变化的检测可以是定性确定，或可以是定量确定。因此，将受试者诊断为患有胃肠癌或处于发生胃肠癌风险中的步骤表明，可进行某些阈值测量，例如，生物样品中一种或多种生物标记物的甲基化状态与预定的对照甲基化状态不同。在该方法的一些实施方案中，对照甲基化状态是生物标记物的任何可检测的甲基化状态。在与生物样品同时测试对照样品的方法的其它实施方案中，预定的甲基化状态是对照样品中的甲基化状态。在该方法的其它实施方案中，预定的甲基化状态基于标准曲线和/或通过标准曲线进行鉴定。在该方法的其它实施方案中，预定的甲基化状态是具体的状态或状态范围。因此，在对本领域技术人员而言将显而易见的可接受的限度内，可部分地基于所实施的方法的实施方案以及所需的特异性等来选择预定的甲基化状态。

另外，关于诊断方法，优选的受试者为脊椎动物受试者。优选的脊推动物是温血动物；优选的温血脊椎动物是哺乳动物。优选的哺乳动物最优选地是人。如本文所用，术语“受试者”包括人和动物受试者。因此，本文提供了兽医治疗用途。因此，本发明的技术提供对诸如人的哺乳动物，以及因濒危而具有重要意义的那些哺乳动物(诸如西伯利亚虎)、具有经济重要性的那些哺乳动物(诸如在农场培育以供人消费的动物)和/或对于人有社会重要性的动物(诸如作为宠物或被保留在动物园中的动物)的诊断。此类动物的实例包括但不限于：食肉动物，诸如猫和狗；猪，包括小猪、肉猪和野猪；反刍动物和/或有蹄类动物，诸如牛、阉牛、羊、长颈鹿、鹿、山羊、野牛和骆驼；以及马。因此，也提供了对牲畜的诊断和治疗，该牲畜包括但不限于家养猪、反刍动物、有蹄类动物、马(包括赛马)等。本发明所公开的主题进一步包括用于诊断受试者中的胃肠癌的系统。该系统可例如作为这样一种商业试剂盒而提供，该试剂盒可用于筛查从中采集生物样品的受试者中的胃肠癌风险或诊断所述受试者中的胃肠癌。根据本发明的技术提供的示例性系统包括评估如表1中所提供的DMR的甲基化状态。

实施例

实施例1-使用RRBS鉴定标记物

总体而言，胃肠癌造成的死亡比来自任何其它器官系统的癌都要多，并且上消化道癌和结肠直肠癌(CRC)的总发生率相当。为了最大程度提高筛查和诊断的效率，需要在从诸如血液或粪便的远程介质测定时为位点特异性的胃肠癌分子标记物。虽然提供广泛的信息，但是异常甲基化的核酸标记物为上消化道癌和CRC共有的。

在开发本文所提供的技术期间，从病例对照研究中收集了数据以展示基因组范围搜索策略鉴定了新的且信息量丰富的候选标记物。初步实验证实了甲基化基因标记物(BMP3)的粪便测定法检出了PanC。然后，据表明，甲基化BMP3和突变KRAS的组合测定法相比于任一单独的标记物增加了检出。然而，在组织中的标记物判别经证实在粪便中是不良的标记物，因为具有高甲基化背景，例如，如在对照标本中检出。

研究群体、标本采集和样品

目标群体是在MayoClinic见到的患胰腺癌的患者。可得群体包括已接受了远端胰腺切除术、胰十二指肠切除术或结肠切除术的具有归档的切除标本和经确认的病理诊断的那些。之前由BiospecimensAccessioningProcessing(BAP)实验室使用苯酚-氯仿方案从显微解剖的标本中提取了结肠上皮DNA。关于这些样品的匹配变量的数据由PancreasSPORE人员用于选择组织注册样品。这些由病理学专家审查以确认病例和对照状态且排除因IPMN产生的病例赘生物，其可具有不同的潜在生物学。SPORE人员安排BAP实验室显微解剖和胰腺病例及对照样品的DNA提取，并向针对病例和对照状态设盲的实验室人员提供500ngDNA。归档核酸样品包括按照性别、年龄和吸烟状况匹配的18个胰腺腺癌、18个正常胰腺和18个正常结肠上皮样品。

样品类型为：

1)限于AJCCI和II期的MayoClinicPancreasSPORE注册PanC组织；

2)无PanC的对照胰腺；

3)无PanC的归档对照结肠上皮；和

4)已提取了DNA并储存在BAP实验室的结肠赘生物。

将病例和对照按性别、年龄(以5岁的增量)和吸烟状况(在吸或曾吸与未吸)进行匹配。

主要变量

主要变量为每个个体得自HCP区的101个碱基对的扩增子的甲基化百分比。在RRBS后，将病例样品中的甲基化百分比与对照样品进行了比较。

方法

根据之前报道的方法(参见Gu等(2011)“Preparationofreducedrepresentationbisulfitesequencinglibrariesforgenome-scaleDNAmethylationprofiling”NatureProtocols6：468-81)通过用10单位的MspI(一种识别含CpG的基序的甲基化特异性限制酶)进行消化使基因组DNA(300ng)片段化而制备了文库。该处理富集样品的CpG含量并消除基因座的冗余区。对消化后的片段进行末端修复并用5单位的Klenow片段(3′-5′外切酶)加A尾，然后过夜连接到含有四个条形码序列之一的衔接子，以将每个片段与其样品ID相联系。使用SPRI珠/缓冲液(AMPureXP，BeckmanCoulter)进行了160-340bp片段(具有40-220bp插入片段)的大小选择。缓冲液截止值为珠/缓冲液样品体积的0.7×至1.1×。将样品在22μl(EB缓冲液，Qiagen)的体积中洗脱。将qPCR用于测量样品的小等分试样的连接效率和片段质量。样品然后接受两轮使用改良的EpiTect方案(Qiagen)的亚硫酸氢盐转化。对经转化的样品等分试样进行的qPCR和常规PCR(PfuTurboCxhotstart，Agilent)然后进行的Bioanalyzer2100(Agilent)评估在对最终文库进行扩增之前确定了最佳的PCR循环数。在50μl的体积中进行了最终PCR(5μl的10×PCR缓冲液；各1.25μl的为10mM的dNTP；5μl的为约5μM的引物混合物；15μl的模板(样品)；1μl的PfuTurboCx热启动酶和22.75ul的水。热循环始于95℃下5分钟和98℃下30秒的初始孵育，然后是16个以下循环：98℃下10秒、65℃下30秒和72℃下30秒。在循环后，将样品在72℃下孵育5分钟，然后保持在4℃直到进一步的后处理和分析。基于随机化方案将样品以等摩尔的量合并成4重文库，并用生物分析仪进行测试以验证最终大小。还将样品通过qPCR使用phiX标准品和衔接子特异性引物进行了测试。

对于测序，将样品根据随机化泳道分配而上样到流动池泳道上，另外的泳道为内部测定对照而留。通过NGSCore在Mayo’sMedicalGenomeFacility在IlluminaHiSeq2000上进行了测序。对于101个循环，读取结果为单向的。每个流动池泳道生成了1-1.2亿个读取结果，对于所比对的序列，足以实现30×至50×测序深度的中值覆盖(基于每个CpG的读取数)。将标准Illumina流水线(pipeline)软件用于与RRBSMAP(Xi等(2012)“RRBSMAP：afast，accurateanduser-friendlyalignmenttoolforreducedrepresentationbisulfitesequencing”Bioinformatics28：430-432)和由MayoBiomedicalandStatistics人员开发的内部流水线(SAAP-RRBS)(Sun等(2012)“SAAP-RRBS：streamlinedanalysisandannotationpipelineforreducedrepresentationbisulfitesequencing”Bioinformatics28：2180-1)相结合来分析读取结果。生物信息学分析由以下方面组成：1)序列读取评估和清理(clean-up)，2)与参考基因组比对，3)甲基化状况提取，和4)CpG报告和注释。

统计考虑

主要比较评价了在每个CpG和/或瓦片式CpG窗口(tiledCpGwindow)处病例与胰腺对照之间的甲基化差异。次要比较评价了病例与结肠对照之间的甲基化差异。通过以下方式测试了标记物的差异甲基化：

1.评价每个标记物的甲基化百分比的分布并丢弃在10％的对照中甲基化超过1％的标记物；

2.使用Wilcoxon秩和检验法测试病例与对照之间其余标记物的甲基化分布，并按p值对标记物排序；以及

3.使用Q值估计假发现率(FDR)(Benjamini等(1995)“MultipleTesting”JournaloftheRoyalStattsticalSociety.SeriesB(Methodological)57：289-300；Storey等(2003)“Statisticalsignificanceforgenomewidestudies”ProcNatlAcadSciUSA100：9440-5)。在发现层级上，最高25％的FDR是可以接受的。

数据分析

在R统计分析软件包中开发了数据分析流水线(“R：ALanguageandEnvironmentforStatisticalComputing”(2012)，RFoundationforStatisticalComputing)。工作流程包括以下步骤：

1.在所有6,101,049个CpG位点中读取

2.为进一步分析而仅鉴定全组覆盖深度为200或更多个读取结果的那些CpG位点。该截止值基于检测任何两个组之间20％与30％甲基化之间的差异的能力评估(powerassessment)，因为小于该范围的任何值具有显著性的机会很小。组覆盖深度度量一个组中所有受试者的读取数(例如，如果每组有18名受试者而每个受试者有12个读取结果，则组覆盖深度为12×18＝216)。

3.使用方差膨胀泊松回归(varianceinflatedPoissonregression)估计疾病亚型与甲基化％的关联；通过比较所有拟合模型的模型拟合χ²与第95个百分位而确定最具判别性的CpG位点。排除在组中甲基化百分比的方差为0的所有CpG位点，因为这些位点是无信息的CpG位点。

应用2和3的过滤器留下了总共1,217,523个CpG位点。

4.通过定义为正常结肠、正常胰腺和癌性胰腺的组对甲基化％(基于实际的计数)执行逻辑回归。由于受试者之间甲基化％的变异性大于二项式假设所允许的变异性，因此将过度离散逻辑回归模型用于考虑增大的方差。使用拟合的皮尔森卡方(PearsonChi-square)估计该离散参数。

5.通过这些模型拟合，以和不以每个组作为回归量，基于模型之间的偏差变化来计算组比较的总体F统计值。将该偏差通过估计的离散参数进行缩放。

6.基于CpG位点位置之间的距离在每个染色体上形成CpG岛。大致上，当两个CpG位置之间的距离超过100bp时，将每个位置定义为独立的岛。一些岛为单拷贝(singleton)并被排除。

7.通过上文对岛的定义，计算了平均F统计值。当F统计值超过特定染色体的所有CpG位点的95％(即，前5％)时，生成图汇总。

进一步的分析包括以下选择过滤器：

1.ANOVAp值截止值＜0.01

2.PanC与正常胰腺和正常结肠的甲基化％的比率＞10

3.正常样品的甲基化％＜2％

4.邻接CpG的数量符合标准≥3

评估了甲基化窗口以包括表现出明显甲基化的另外的邻接CpG。然后，按照注释区的基因名称以及按照非注释区的染色体位置对候选物排序。

结果

以≥10×的覆盖对大约六百万个CpG作图。多于500个CpG岛符合差异甲基化的显著性标准。在应用以上过滤器标准后，鉴定出107个差异甲基化区(DMR)(表1)。

表1：DMR

在表1中，根据2009年2月humangenomeassemblyGRCh37/hg19(参见例如Rosenbloom等(2012)“ENCODEwhole-genomedataintheUCSCGenomeBrowser：update2012”NucleicAcidsResearch40：D912-D917)对碱基编号。标记物名称BHLHE23和LOC63930是指相同的标记物。

在这些候选物中，甲基化签名(methylationsignature)在3个相邻CpG至52个CpG的范围内。一些标记物在两条链上表现出甲基化；其它的为半甲基化的。由于链在亚硫酸氢盐转化后不互补，因此单独地对正向和反向区计数。虽然表1指出了其上存在标记物的链，但是所述技术不限于检测仅在所指出的链上的甲基化。所述技术涵盖测量正向或反向链和/或正向和反向链两者上的甲基化；和/或检测正向或反向链和/或正向和反向链两者上甲基化状态的变化。

胰腺癌的甲基化水平在经过滤的CpG处很少超过25％，这表明癌组织可具有高水平的污染性正常细胞和/或基质。为了检验这一点，对每种癌的KRAS突变进行测序以验证阳性样品的等位基因频率。对于具有杂合KRAS碱基变化的50％，突变等位基因的频率比相应野生型等位基因低至少4倍，从而支持被正常细胞和/或基质污染这一点。

据发现，107个标记物中的7个在非注释区中并位于不含蛋白质编码元件的基因组区中。一个标记物与ncRNA调控序列(AK055957)相邻。在其余99个候选标记物之中，约30个已被描述为与癌症相关，其中一些归类为肿瘤抑制因子。一些实例：

ADCY1在骨肉瘤中下调

ELMO1促进胶质瘤浸润

HOXA2在胆管癌中高甲基化

RSPO3Wnt信号转导调节因子

SUSD5介导肺癌中的骨转移

KCNK12在结肠癌中高甲基化

CLEC11A白血病中的干细胞GF

USP3进入S期所需

69个其它候选标记物具有之前鉴定的与癌症的弱关联(例如，在基因组范围筛查中观察到的突变和/或拷贝数改变)或不具有之前鉴定的癌症关联。

实施例2-验证标记物

为了验证DMR作为癌症标记物，对扩展的样品集进行了两项基于PCR的验证研究。第一项研究使用类似于实施例1中所用的得自患者组的样品(例如，PanC、正常胰腺、正常结肠)和额外样品，该额外样品包含得自无任何癌症史的正常患者的血沉棕黄层源DNA。第二项研究使用挑选出的pan-GI癌。

对于第一项验证研究，测试了之前运行的RRBS样品和新入库的样品的组合以分别验证技术准确度并确认生物重现性。针对每个标记物区设计了甲基化特异性PCR(MSP)引物，从而就非链特异性甲基化而言仅排除互补链。计算机软件(Methprimer)辅助由有经验的人员开展的MSP引物半人工设计；对测定法进行了测试，并通过采用SYBRGreen染料的qPCR针对通用甲基化和未甲基化基因组DNA对照的稀释样进行了优化。设计了MSP引物序列(其每一个包含2-4个CpG)以提供评价样品中的甲基化的快速方式并进行偏倚处理以最大程度提高扩增效率。引物序列和物理参数在表2a和表2b中提供：

表2a：MSP引物

在表2a中，Ta是优化的退火温度并且Tm是以℃表示的在50mMNaCl中的解链温度。将引物celf2f和celf2r、LOC63930(bhlhe23)f和LOC63930(bhlhe23)r、PRKCBf和PRKCBr以及TOX2f和TOX2r用于2步反应中。

标本

将得自Mayoclinic患者的归档DNA样品用于两项验证。将病例和对照设盲并按年龄和性别进行匹配。第一个样品集包括得自38个胰腺腺癌和对照的DNA(20个正常结肠上皮、15个正常胰腺和10个正常血沉棕黄层)。第二个样品集包括得自38个结肠直肠赘生物(20个结肠直肠腺癌和18个腺瘤＞1cm)、19个食道腺癌、10个胃癌和10个胆管癌的DNA。

方法

将归档的DNA用SPRI珠(AMPureXP-BeckmanCoulter)再次纯化并通过吸光度进行定量。然后将1-2μg样品DNA用亚硫酸氢钠处理并使用EpiTect方案(Qiagen)进行纯化。将洗脱的材料(10-20ng)在Roche480LightCycler上使用384孔模块扩增。每块板容纳4种标记物(和标准品及对照)，因而使用总共23块板。88个MSP测定具有不同的最佳扩增谱，并相应地进行分组。具体的退火温度在表2中提供。将20-μl反应物用LightCycler480SYBRI主混合物(Roche)和0.5μmol引物运行50个循环，并通常通过LightCycler软件所含的二阶导数方法进行分析。将原始数据(以基因组拷贝数表示)归一化到输入性DNA的量，并制表。在组织水平上的分析包括执行PCA(补充有k折交叉验证)、弹性网络回归，并构建非零弹性网络标记物的箱形图。以此方式，对标记物总体排序。在这些候选物中，由于最大程度降低基于粪便和血液的测定法的正常细胞背景甲基化的重要性，针对在病例与对照之间表现出最高倍数的变化差异的那些标记物，对排序进行加权。

结果

在经证实能够判别GI癌的107个甲基化DNA标记物之中，对88个进行了MSP验证，从中鉴定了子集以展示更详细的汇总数据。

胰腺癌的检测

以下甲基化标记物的子集尤其能够判别胰腺癌：ABCB1、ADCY1、BHLHE23(LOC63930)、c13orf18、CACNA1C、chr12133、CLEC11A、ELMO1、EOMES、GJC1、IHIF1、IKZF1、KCNK12、KCNN2、PCBP3、PRKCB、RSPO3、SCARF2、SLC38A3、ST8SIA1、TWIST1、VWC2、WT1和ZNF71(参见表1)。这些标记物的各个AUC值(PanC对胰腺或结肠)高于0.87，这表明优异的临床灵敏性和特异性。

最初，两个最好的独立的标记物似乎为CLEC11A和c13orf18，它们以95％的特异性对胰腺癌的灵敏性分别为95％和82％。另外的实验设计了另外的引物以靶向所选标记物的指定DMR内最具特异性的CpG。这些另外的引物进一步增强了判别能力。例如，标记物PRKCB(68％的初始灵敏性)的新MSP的设计明显增强了胰腺癌的判别能力并以100％的特异性实现了100％的灵敏性。此外，将癌症与正常组织相比，该标记物的中值甲基化信噪比大于8000。这提供了对检测具有高水平的正常细胞异质性的样品中的癌症标记物而言至关重要的尺度。从经过滤的RRBS数据中获得DMR的碱基水平甲基化谱使得可以构建高灵敏性和特异性的检测测定法。这些得自改进的MSP设计的结果表明，通过另外的设计改进、验证和测试形式可以从另外106个DMR中获得类似的性能指标。

表2b：MSP引物

在表2b中，Ta是优化的退火温度并且Tm是以℃表示的在50mMNaCl中的解链温度。

检测其它GI赘生物

然后在第2个样品集合中评价了标记物，该集合包括如上所示的其它GI癌和初癌。方法(包括反应条件和平台)与上述第一个验证相同。将数据归一化到输入性DNA的量，从而使得可以在两个验证之间比较拷贝数。分析由如前的PCA和k折交叉验证组成。

所鉴定的一些甲基化序列表现出非凡的判别程度，正如独立的标记物。例如，IKZF1对于腺瘤具有95％的灵敏性，并且对于CRC具有80％的灵敏性，其中在正常样品中几乎没有背景甲基化。S/N比超过10,000-任一类标记物都很少见到的判别程度。chr12.133测定法(甲基化DNA的完全无注释且未描述的段特异性的)也擅于同样好地检测所有癌症。多种标记物(cd1d、chr12.133、clec11a、elmo1、vwc2、zuf71)单独地实现了完美的胃癌判别，与twist1判别结肠直肠癌一样(表6)。

肿瘤部位预测

在所述技术的实施方案的开发期间收集的数据证实特定DNA标记物的甲基化状态准确预测赘生物部位。在该分析中，基于具有互补性能的标记物的组合，在决策树分析中使用递归分割回归模型生成稳健的部位分类。

具体地，进行统计分析以验证标记物组合的灵敏性和特异性。例如，使用“RandomForest”模型(参见例如Breiman(2001)“RandomForests”MachineLearning45：5-32)，采用递归分割树回归构建了树模型，例如，如由R统计软件中的rPart包所执行。递归分割树回归是尝试最大程度减小损失函数并因此最大程度提高分类问题的信息量的回归技术。通过以下过程构建树：首先找到将数据最佳地分成两个组的单个变量。分离数据，且然后将该过程单独应用于每个亚组，以此类推进行递归直到亚组达到最小或直到无改善余地。该程序的第二阶段包括使用交叉验证来修剪完整的树。计算子树的嵌套集合的风险交叉验证估计值，并从具有最低的风险估计值的子树产生最终模型。参见例如Therneau(2012)“AnIntroductiontoRecursivePartitioningUsingRPARTRoutines”，可见于TheComprehensiveRArchiveNetwork；Breiman等(1983)“ClassificationandRegressionTrees”Wadsworth，Belmont，CA；Clark等(1992)“Tree-basedmodels”，J.M.Chambers和T.J.Hastie编，StatisticalModelsinS，第9章.WadsworthandBrooks/Cole，PacificGrove，CA；Therneau(1983)“Ashortintroductiontorecursivepartitioning”OrionTechnicalReport21，StanfordUniversity，DepartmentofStatistics；Therneau等(1997)“Anintroductiontorecursivepartitioningusingtherpartroutines”DivsionofBiostatistics61，MayoClinic。

如在该分析中所用，分类为上GI病变与下GI病变与正常样品。在回归的每个节点，对于输入，考虑所有变量，但仅输入在预测的结果的风险中降低最大的变量。将后续节点添加到树直到不存在风险变化为止。为了避免过度拟合，使用了随机森林回归。在该方法中，使用样品的自举(bootstrapping)和变量的随机选择生成了500棵预测树。为了确定第i个变量的重要性，将第i个变量抽出，并使用所有500个预测比较完整拟合(包括所有数据)与减小拟合(除了第i个变量外的所有数据)的相应错误率。

构建了500棵树的森林以测试候选标记物判别正常组织、上消化道病变和下消化道病变的预测能力。该程序以极高水平的稳健性进行。首先，对于每棵树形成，从数据集中取出自举样本以形成训练集，并将未选择的所有观察结果用作验证集。在树中的每个分支，使用标记物的随机子集并进行评价以确定用于树的该特定层级的最好的标记物。因此，所有标记物具有相等的被选中的机会。该技术提供对每个标记物的相对重要性的严格验证和评价。使500棵树中的每一棵对特定的样品属于哪一类进行“投票”，其中大部分赢得选票。通过未用于特定树的所有样品估计误分类率估计值。

为了测试给定标记物的相对重要性，再次使用了验证集。在这里，一旦对树进行拟合，则使验证数据顺着树传递下去并记录正确的分类率。然后，将标记物值在第m个标记物内随机置乱，将它们沿着树传递下去，并再次记录正确的分类。如果标记物具有高度的重要性，则实际的数据提供比随机置乱数据更好的分类。因置乱的数据导致的误分类被称为平均准确度降低。如果标记物不重要，则实际的数据将提供与随机置乱数据类似的分类。图1是通过平均准确度降低所度量的标记物重要性的曲线图。垂直线处于2.5％和5％。这些数据表明，例如，对于clec11a，估计的平均准确度降低为约12％，从而表明当随机置乱该标记物的结果时，预测的总体准确度降低12％。图1按重要性顺序列出标记物。

森林中500棵树的估计的总体误分类率为0.0989。在森林的所有500棵树中进行的投票过程的结果在表3中汇总，并在表4中按亚型扩展。在表格中，组织样品类型在第一列中列出(例如，表3中的非癌性(“正常”)、上消化道癌(“上”)或下消化道癌(“下”)；表4中的腺瘤(“Ad”)、正常结肠(“结肠正常”)、结肠直肠癌(“CRC”)、食道癌(“EsoC”)、胰腺癌(“PanC”)、正常胰腺(“胰腺正常”)、和胃癌(“胃C”))。以数值的形式分别针对以下分类在第1、2或3列中提供由分析对样品所作出的定量分类：上消化道癌(第1列)、下消化道癌(第2列)或正常组织(第3列)。这些数值提供一个量度，其指示分类器的成功率(例如，分类器将第一列中的样品类型分类成第一行中的类型的次数)。

表3

第1列＝上GI；第2列＝下GI；第3列＝正常

表4

预测模型

*UGIC＝上消化道癌，**CRN＝CRC+腺瘤≥1cm

另外的分析证实了两种标记物的组合准确预测了＞90％的样品中的肿瘤部位，前17个双标记物组合准确预测了＞80％的样品中的肿瘤部位，并且前49个组合准确预测70％的样品中的肿瘤部位。DNA甲基化标记物的多种组合准确预测肿瘤部位这一观察结果证实了所述技术的稳健性。

使用递归分割决策树中的前两种标记物，将所有正常的组织均正确分类成了正常，将所有胃癌均正确分类成了上GI，将几乎所有食道和胰腺癌均正确分类成了上GI，以及将几乎所有结肠直肠癌和初癌(腺瘤)均正确分类成了下GI。在本文所提供的技术的实施方案的开发期间，统计分析关注于特定标记物的集合，其由clec11a、c13orf18、kcnn2、abcb1、slc38a3、cd1c、ikzf1、adcy1、chr12133、rspo3和twist1组成。具体地，上述统计分析涉及鉴定提供增加的鉴定癌症和/或区分癌症的能力的标记物集合(例如，具有两种或更多种标记物)。表5汇总了每个成对的标记物集合的准确度，即clec11a、c13orf18、kcnn2、abcb1、slc38a3、cd1c、ikzf1、adcy1、chr12133、rspo3和twist1。根据该分析，由clec11a和twistl组成的标记物对信息量最丰度，但各种其它组合具有相似的准确度。

表5-使用各种标记物组合进行的部位预测的准确度

表5(续)

实施例3-各个标记物的AUC分析

统计分析包括主成分分析以鉴定不相关的线性标记物组合，其方差解释在原始数据中观察到的变异性的最大百分比。该分析确定了每个标记物的相对权重以区分处理组。作为该分析的结果，确定标记物子集的端点AUC值，这些值度量每个标记物区分特定癌症(食道、胃、胰腺、结肠直肠和腺瘤)与1)其它癌症类型和2)正常样品(例如，不含癌组织或不是来自具有癌症或可能发生癌症的患者)的能力。这些数据在表6中提供。

表6-标记物子集的AUC值

实施例4-巴瑞特氏食道和食道癌

食道癌的发展与巴瑞特氏上皮化生密切相关，并且胰腺腺癌由离散的粘液细胞化生引起。参见例如Biankin等(2003)“Molecularpathogenesisofprecursorlesionsofpancreaticductaladenocarcinoma”Pathology35：14-24；Cameron等(1995)“AdenocarcinomaoftheesophagogastricjunctionandBarrett′sesophagus”Gastroenterology109：1541-1546。

为了有意义地控制食管腺癌升高的发病率，需要有效的方法来筛查群体的巴瑞特氏食道(BE)这一关键前兆。已提出将微创工具或非侵入式工具用于BE筛查，但是因缺乏具有最佳灵敏性和特异性的标记物而受阻。所需的筛查标记物区分BE与正常食管胃粘膜。某些异常甲基化基因是与BE相关的候选标记物(参见例如Gastroenterology2011；140：S-222)。

因此，在所述技术的实施方案的开发期间，开展了实验以评估所选甲基化DNA标记物区分BE与相邻鳞状食管(SE)和胃贲门(GC)以及正常对照中的SE和GC的价值。

在常规上消化道内窥镜检查之前募集了具有和不具有已知BE的患者。BE病例具有＞1cm长度的带有经组织学确认的肠化生的圆周柱状粘膜；对照不具有通过内窥镜检查所确定的BE。在BE、GC(Z-线下方1cm)和SE(BE上方＞2cm)病例中以及在GC(就BE而论)和SE(Z线上方5cm)对照中获得活检标本并立即冷冻。将活检样品分批处理，并以设盲方式测定。在DNA提取和亚硫酸氢盐处理后，针对标记物APC、HPP1、SFRP1通过甲基化特异性PCR以及针对标记物BMP3和NDRG4通过QuARTS测定法测定了靶基因上的甲基化。作为总人DNA的对照标记物，对β-肌动蛋白进行了定量。

在25个BE病例和22个对照之中，中值年龄分别为67(范围39-83)和50(范围20-78)，并且男性在BE和对照组中分别占受试者的72％和46％。中值BE长度为6cm(范围2-14cm)。除了APC，甲基化标记物的中值水平在BE中比在相邻SE和GC中或相对于正常SE和GC明显且实质性(例如，200-1100倍)更高。针对每种标记物示出了在各种特异性下BE的灵敏性(表7)。甲基化标记物在与BE相邻的GC中比在得自正常对照的GC中明显更高。甲基化APC在BE中比在SE中更高，但未能区分BE与GC。与甲基化标记物相比之下，β-肌动蛋白分布在组织组中相似。标记物水平随着NDRG4、SFRP1、BMP3和HPP1的BE长度而增加(p分别＝0.01、0.01、0.02和0.04)。不明显影响标记物水平的因素包括年龄、性别、炎症和存在化生不良(无(8)、低等级(6)、高等级(11))。

因此，这些数据证明所选的甲基化DNA标记物高度判别BE与GC和SE，并提供有用的筛查应用。

表7

*基于得自正常对照的组合SE和GC数据

实施例5-胰液中的甲基化DNA标记物区分胰腺癌与慢性胰腺炎和正常对照

已探索了胰液分析作为胰腺癌(PC)早期检测的微创方法。然而，细胞学和胰液中的许多分子标记物已证实对区分PC与慢性胰腺炎不敏感或不能区分(参见例如JClinOncol2005；23：4524)。进行了实验以确认异常甲基化基因的测定可代表从胰液检测PC的更准确方法(参见例如CancerRes2006；66：1208)。具体地，收集数据以评估从胰液测定的所选甲基化DNA标记物区分具有PC的病例患者与具有慢性胰腺炎(CP)或正常胰腺(NP)的对照。

110名患者(66例PC、22例CP、22例NP对照)的小组在内窥镜超声期间接受了分泌素刺激的胰液采集。对于PC在组织学上以及对于CP和NP基于放射照相确认了诊断。立即冷冻胰液并储存在-80℃下。对分批解冻的样品以设盲方式进行了测定。在单独的组织研究中，通过全甲基化组测序选择了候选甲基化DNA标记物。在从胰液提取DNA并进行亚硫酸氢盐处理后，对于CD1D、CLEC11A和KCNN2通过甲基化特异性PCR或对于BMP3和NDRG4通过QuARTS测定了基因甲基化。通过QuARTS测定了KRAS突变(总共7个)(存在任何KRAS突变被视为阳性)。还通过QuARTS测定了β-肌动蛋白(一种人DNA标记物)以提供对DNA量的控制。

分别针对PC、CP和NP，中值年龄为67(范围43-90)、64(范围44-86)和60(范围35-78)；男性分别占这些组的56％、68％和21％。所有标记物均区分出了PC与NP，但程度不同。对于甲基化CD1D、NDRG4、CLEC11A、KCNN2和BMP3，AUC分别为0.91(95％CI，0.85-0.97)、0.85(0.77-0.94)、0.85(0.76-0.94)、0.78(0.67-0.89)和0.75(0.64-0.87)，而对于突变KRAS，为0.75(0.64-0.86)。通过CD1D判别PC明显高于通过KRAS(p＝0.01)、KCNN2(p＝0.02)或BMP3(p＜0.01)进行的判别。显示了每个标记物在95％和100％的正常特异性截止值下的PC和CP阳性率(表8)；CD1D的CP阳性率(假阳性)最低，KRAS的最高。标记物水平无明显受PC部位(头、身体、尾)或阶段(N0与N1)的影响。β-肌动蛋白水平在患者组中类似。

这些数据表明当从胰液(例如，分泌素刺激的胰液)测定时甲基化DNA标记物判别出PC与CP和NP。具体地，甲基化CD1D对PC明显更敏感，并显示出比突变KRAS实质性更少的CP假阳性。

表8

*基于NP数据的特异性截止值

实施例6-用于通过在胰液中测定而检测胰腺癌的敏感性DNA标记物组

胰液分析代表了检测胰腺癌(PC)和初癌的微创方法。已发现，胰液中的特定甲基化DNA标记物区分PC与慢性胰腺炎(CP)和正常胰腺(Gastroenterology2013；144：S-90)，但新的标记物和标记物组合仍未探索。

进行了实验以评估最近发现的单独测定的和在胰液中组合的甲基化DNA标记物和突变KRAS区分PC与慢性胰腺炎(CP)和参照对照(CON)的价值。

研究了在EUS期间接受了分泌素刺激的胰液采集的167名患者(85例PC、30例CP、23例恶化前导管内粘液瘤(IPMN)、29例CON)。对于PC基于组织学、对于CP通过放射照相以及对于IPMN在组织学上或通过放射照相确认了诊断。特异性基于CON，其包括具有PC风险因素、升高的胰酶或GI症状但通过放射照相确定为胰腺正常的患者。将在-80℃下归档的胰液样品以设盲方式分批测定。对从200μL胰液提取的DNA，在亚硫酸氢盐处理后通过定量等位基因特异性实时靶标和信号扩增(QuARTS)测定了基因甲基化，以测定ADCY1、CD1D、BMP3、PRKCB、KCNK12、C13ORF18、IKZF1、CLEC11A、TWIST1、NDRG4、ELMO和55957。还通过QuARTS测定了突变型KRAS突变(总共7个)和β-肌动蛋白(一种总人DNA标记物)。对于定量数据，遵循某种算法以通过合并所有标记物的组而实现最佳的判别。

分别针对PC、CP、IPMN和CON：中值年龄为67(IQR60-77)、66(55-77)、66(60-76)和70(62-77)；男性占52％、53％、49％和72％。以90％和95％的相应特异性截止值：合并的标记物组实现了最高的PC灵敏性(88％和77％)；ADCY1(灵敏性最高的单一标记物)检出了84％和71％。其它单一标记物检出了PC，但程度不同(表)。组的总体判别能力(以ROC曲线下面积表示)高于任何单一标记物(p＜0.05)，ADCY1除外(表)。以90％的特异性，组检出了所有IPMN中的44％，和具有高等级化生不良的子集中的75％(3/4)。对于表7中所示的所有标记物，CP中的阳性率实质性低于PC中的阳性率(p＜0.0001)。以100％的特异性，组在58％的PC、17％的IPMN和13％的CP中呈阳性。因此，这些结果表明从胰液测定的新型甲基化DNA标记物和突变KRAS的组实现了针对PC的高灵敏性。

表7：患有胰腺癌(PC)、导管内乳头状粘液瘤(IPMN)和慢性胰腺炎(CP)的患者的胰液中的标记物阳性率

*基于参照对照(CON)数据的特异性截止值。

**所示的前7个单独的甲基化DNA标记物。

***除了ADCY1，该组具有比各个甲基化DNA标记物明显更高的AUC(p＜0.05)。

实施例7：使用CD1D标记物在粪便样品中检测胰腺癌。

收集了来自45个患有胰腺癌的个体和45个未患胰腺癌的个体的粪便样品，并测试了CD1D标记物的存在性。使用来自粪便的CD1D标记物成功检出了胰腺癌。

实施例8：与早期胰腺癌相关的新型DNA甲基化标记物。

研究概述：

在独立的病例对照组织研究中，将RRBS用于发现期而将甲基化特异性PCR(MSP)用于验证期，开展了实验以鉴定新的且具有高判别能力的PanC甲基化标记物。

研究群体：

在由MayoClinicInstitutionalReviewBoard批准后，从现有的癌症登记中鉴定了组织样品。可得群体包括接受了远端胰腺切除术、胰十二指肠切除术、结肠切除术或结肠活检的具有冷冻的归档标本的那些。所有组织均由胃肠病理学专家审查以确认正确的分类。PanC病例样品包括限于早期疾病(AJCCI期和II期)的胰腺导管腺癌组织(EdgeSBB，D.R.；Compton，C.C.；Fritz，A.G.；Greene，F.L.；Trotti，A.(编)，编辑.AJCCCancerStagingManual.第7版：Springer，NewYork；2010)。将由IPMN病变产生的赘生物排除。存在两个进行研究的对照组。第一个(称为“正常胰腺”)包括低风险的在组织学上正常的切缘(浆液囊腺瘤)或局灶性胰腺赘生物(神经内分泌瘤)。第二个对照组包括得自经确认无PanC或结肠赘生物的患者的结肠上皮组织。将病例和两个对照按性别、年龄(以5岁的增量)和吸烟状况(在吸或曾吸与未吸)进行匹配。在中心实验室，对病例和对照组织进行显微解剖，并使用苯酚-氯仿技术提取DNA，从而得到至少500ngDNA。通过独立人员执行病例鉴定、匹配和DNA提取以维持实验室人员对病例和对照状态的盲性。

简化的表观亚硫酸氢盐测序：

文库制备(GuH，BockC，MikkelsenTS，JagerN，SmithZD，TomazouE等Genome-scaleDNAmethylationmappingofclinicalsamplesatsingle-nucleotideresolution.NatMethods.2010；7：133-6)：通过用10单位MspI(一种识别含CpG的基序的甲基化特异性限制酶)进行消化而使基因组DNA(300ng)片段化。这富集样品的CpG含量并消除基因座的冗余区。对消化后的片段进行末端修复并用5单位的Klenow片段(3’-5’外切酶)加A尾，然后过夜连接到含有四个条形码序列之一的甲基化TruSeq衔接子(Illumina，SanDiegoCA)(以将每个片段与其样品ID相联系)。使用AgencourtAMPureXPSPRI珠/缓冲液(BeckmanCoulter，BreaCA)进行了160-340bp片段(40-220bp插入片段)的大小选择。缓冲液截止值为珠/缓冲液的0.7×至1.1×样品体积。最终洗脱体积为22uL(EB缓冲液-Qiagen，GermantownMD)。将qPCR用于测量样品的小等分试样的连接效率和片段质量。样品然后接受使用改良的EpiTect方案(Qiagen)的亚硫酸氢盐转化(两次)。对经转化的样品等分试样进行的qPCR和常规PCR(PfuTurboCx热启动酶-Agilent，SantaClaraCA)然后进行的Bioanalyzer2100(Agilent)评估在对最终文库进行扩增之前确定了最佳的PCR循环数。最终PCR的条件：50uLrxn：5uL10X缓冲液、各1.25uL10mM的dNTP、5uL引物混合物(～5uM)、15uL模板(样品)、1uLPfuTurboCx热启动酶、22.75水。95C-5min；98C-30s；16个以下循环：98C-10s、65C-30s、72C-30s；72C-5min；4C。将样品基于随机化方案合并(等摩尔)成4重文库，并通过生物分析仪测试以进行最终大小验证，以及通过采用phiX标准品和衔接子特异性引物的qPCR进行测试。

测序和生物信息学：

将样品根据随机化泳道分配而上样到流动池泳道上，另外的泳道为内部测定对照而留。通过NextGenerationSequencingCore在MayoClinicMedicalGenomeFacility在IlluminaHiSeq2000上进行了测序。对于101个循环，读取结果为单向的。每个流动池泳道生成了1-1.2亿个读取结果，对于所比对的序列，足以实现30至50倍测序深度(每个CpG的读取数)的中值覆盖。将标准Illumina流水线软件以fastq格式用于碱基读出和序列读取结果生成。如前人所述(SunZ，BahetiS，MiddhaS，KanwarR，ZhangY，LiX等SAAP-RRBS：streamlinedanalysisandannotationpipelineforreducedrepresentationbisulfitesequencing.Bioinformatics.2012；28：2180-1)，将SAAP-RRBS(一种用于简化的表观亚硫酸氢盐测序的精简式分析和注释流水线)用于序列比对和甲基化提取。

通过甲基化特异性PCR进行验证研究：

概述：对扩展的样品集进行了两项基于MSP的验证研究已确认所观察到的差异甲基化候选物的准确度和重现性。使用PanC的生物和技术重复样以及正常结肠以及正常胰腺的技术重复样对未匹配的、未设盲的样品进行了第一项(内部验证)研究。执行该步骤以确保通过RRBS数据过滤所鉴定的差异甲基化位点(其中甲基化％是分析的单位)将在MSP中得以反映，其中分析的单位是靶序列的绝对基因组拷贝数，其通过每个样品的输入性DNA的浓度进行校正。第二项(外部验证)实验利用MSP在随机分配、匹配、设盲、独立的PanC，良性胰腺和正常结肠样品中测试靠前的候选物。

引物设计：设计了每种标记物的引物以靶向每种靶基因经亚硫酸氢盐修饰的甲基化序列(IDT，CoralvilleIA)和β-肌动蛋白基因中不含胞嘧啶-磷酸-鸟嘌呤位点的区(作为亚硫酸氢盐处理和DNA输入的参照)。该设计通过Methprimer软件(UniversityofCalifornia，SanFranciscoCA)或通过半人工方法(由H.Z和WR.T)完成。然后对测定法进行了测试，并通过采用SYBRGreen(LifeTechnologies，GrandIslandNY)染料的qPCR针对通用甲基化和未甲基化基因组DNA对照的稀释样进行了优化。

甲基化特异性PCR：如前人所述(KisielJB，YabTC，TaylorWR，ChariST，PetersenGM，MahoneyDW等StoolDNAtestingforthedetectionofpancreaticcancer：assessmentofmethylationmarkercandidates.Cancer.2012；118：2623-31)对组织提取的DNA进行MSP反应。简而言之，将DNA用EZDNA甲基化试剂盒(ZymoResearch，Orange，CA)进行亚硫酸氢盐处理并在缓冲液中洗脱。将1μl经亚硫酸氢盐处理的DNA用作甲基化定量的模板，该定量采用基于荧光的实时PCR，用SYBRGreen主混合物(Roche，MannheimGermany)进行。反应在Roche480LightCyclers(Indianapolis，IN)上运行，其中将经过亚硫酸氢盐处理的CpGenomeUniversalMethylatedDNA(Millipore，Billerica，MA)用作阳性对照，并进行系列稀释以形成所有板的标准曲线。寡核苷酸序列和退火温度可根据要求提供。

统计分析

RRBS：所关注的主要比较是在每个作图的CpG处病例与胰腺对照之间的甲基化差异。CpG岛在生物化学上通过超过0.6的观察与预期CpG比来定义(Gardiner-GardenM，FrommerM.CpGislandsinvertebrategenomes.Journalofmolecularbiology1987；196：261-82)。然而，对于该模型，基于每条染色体的CpG位点位置之间的距离创建CpG分析“差异甲基化区(DMR)”的瓦片式单元(tiledunit)。随着任何给定CpG之间的距离超过之前或下一个位置100bp以上，则创建新的岛标识符。将仅具有单个CpG的岛排除。次要结局指标是在病例与结肠对照之间进行的相同比较。仅当每个疾病组的总覆盖深度≥200个读取结果(约等于每个受试者平均10个读取结果)并且甲基化％的方差大于零(将方差为0的无信息的CpG位点排除)时，才考虑将各个CpG位点用于差异分析。读取深度的标准基于检测任何两个组之间10％的甲基化率差异的所需统计功效，其中每个组的个体的样本大小为18。

通过对每个DMR的甲基化％(使用实际计数)执行逻辑回归而确定统计显著性，其中将各组定义为PanC、正常胰腺和正常结肠。为了考虑到在各个受试者中变化的读取深度，使用了过度离散逻辑回归模型，其中使用得自拟合模型的残差的皮尔森卡方统计来估计离散参数。为了评估链特异性甲基化，单独分析了正向和反向区。然后对DMR根据其显著性水平排序，并当对照中的甲基化率≤1％但在PanC中≥10％时将该DMR视为可行的标记物区。将每个具有显著性的DMR视为候选标记物。

对于内部验证研究，主要结局指标是每种标记物的接收者操作特征曲线(AUC)下面积。该面积使用逻辑回归(JMP9.0.1版，SASInstitute，CaryNC)进行计算以模拟将PanC与正常胰腺和正常结肠相比时每种标记物的浓度校正拷贝数的强度。选择具有最高AUC值以及病例与对照之间最宽的中值拷贝数比率的标记物进行外部验证研究。外部验证实验的主要结局指标是针对每种标记物的信号强度绘制的每种标记物的AUC，所述信号强度通过病例与对照中的中值校正拷贝数的比率的对数来度量。对于十八个病例，存在＞80％的以0.05双面显著性水平从0.5的虚假设检测0.85或更高的曲线下面积的能力。次要终点指标是通过逻辑回归而测得的双标记物组合的AUC，其中需要两种标记物来独立地与PanC病例相关联。

RRBS标记物发现

通过RRBS对得自18例胰腺癌肿瘤、18例良性胰腺对照组织和18例正常结肠上皮组织的匹配、设盲、随机分配的DNA提取物测序。中值年龄为61(四分位数范围52-65)，61％为女性，并且44％是当前吸烟者或曾吸烟者。以至少10X覆盖率在任何样品中捕获了总共6,101,049个CpG位点。在仅选择符合组覆盖率和方差标准的CpG位点后，进一步考虑了总共1,217,523个CpG位点进行分析。约500个DMR符合差异甲基化的显著性标准。在这些之中，我们鉴定了107个具有对于MSP引物设计而言足够的甲基化签名的候选区。甲基化签名在3个相邻CpG至52个CpG的范围内。胰腺癌的甲基化水平在经过滤的CpG处很少超过25％，从而反映出高水平的污染性基质细胞。这一点在对每种癌症进KRAS突变测序以验证阳性样品的等位基因频率后得到确认；对于具有杂合KRAS碱基变化的50％的PanC标本，突变等位基因的频率比相应野生型等位基因低至少4倍。

内部验证

基于每个候选基因甲基化签名中相邻CpG的数量，针对107个候选标记物中的87个设计了引物。然后将MSP用于测定以下DNA样品中的候选物：得自另外20例未设盲的PanC病变、10例另外的正常结肠上皮样品(生物重复样)的DNA，以及得自18例经测序的PanC病变、15例经测序的良性胰腺组织和10例经测序的正常结肠样品(技术重复样)的其余DNA样品。对于第一遍引物设计，成功扩增了87个标记物中的74个。对于再次设计，成功扩增了其余13个引物，并在12个未设盲的PanC样品和10个正常结肠样品中进行了测试。在所有样品中扩增了β-肌动蛋白。对于第一或第二遍MSP，87个候选标记物中的31个具有＞0.85的AUC。基于每种候选标记物在病例与对照之间的中值基因组拷贝数的差异幅度，选择了23个用于在独立的样品中进行外部验证。这些为ABCB1、ADCY1、BMP3、C13ORF18、CACNA1C、CD1D、CHR12：133484978-133485738(CHR12133)、CLEC11A、ELMO1、FOXP2、GRIN2D、IKZF1、KCNK12、KCNN2、NDRG4、PRKCB、RSPO3、SCARF2、SHH、SLC38A3、TWIST1、VWC3和WT1。

外部验证

通过MSP测定了得自18例PanC、18例良性胰腺和36例正常结肠上皮样品的匹配、设盲、随机分配的DNA中的前23个候选物。该子集的中值年龄为60(四分位数范围54-64)。大部分(55％)样品来自男性，并且61％是当前吸烟者或曾吸烟者。在所有样品中扩增了β-肌动蛋白。23种候选物中的9种显示出与PanC的优异关联。CACNA1C、CHR12.133、WT1、GRIN2D、ELMO1、TWIST1、C13ORF18、KCNN2和CLEC11A的各个AUC值分别为0.95、0.95、0.94、0.94、0.93、0.92、0.91、0.90和0.90。观察到了与9种其它标记物的良好关联：PRKCB、CD1D、SLC38A3、ABCB1、KCNK12、VWC2、RSPO3、SHH和ADCY1的AUC值分别为0.89、0.88、0.86、0.86、0.86、0.85、0.85、0.85和0.84。

将每种标记物的中值病例和对照值的对数比率针对AUC作图。八种标记物SHH、KCNK12、PRKCB、CLEC11、C13ORF18、TWIST1、ELMO1和CHR12.133各自具有大于0.85的AUC，并在病例之中显示出比对照大1.5个对数以上(＞30倍)的基因组拷贝数。KCNK12、PRKCB、ELMO1和CHR12.133显示出大于2个对数(＞100倍)的差异。

互补性分析

在所有231种可能的双标记物组合之中，两种标记物在与PanC的关联性的30个(13％)成对模型中保持高度的显著性。在那些之中，18(8％)显示出AUC的改善。值得注意的是，在多种互补标记物之中，C13ORF18改善了CACNA1C、WT1、GRIND2D、SLC38A3和SCARF2的准确度，对于每种组合而言，AUC分别为0.99、0.99、0.97、0.96和0.95。虽然SHH作为单个标记物的AUC为0.85，但在配对时其改善了6个其它标记物的性能。CACNA1C、WT1、SLC38A3、ABCB1、VWC2和RSPO3当在模型中与SHH组合时的AUC分别提高到0.96、0.95、0.92、0.98、0.88和0.95。在18个最稳健的标记物组合中，可在得自内部验证数据集的成对比较中测试9个组合。在这些之中，7对(78％)在两个数据集中均保持高度的显著性。

实施例9：用于检测巴瑞特氏食道的高判别性甲基化DNA标记物

为了控制食管腺癌升高的发病率，需要有效的方法来筛查群体的关键前兆-巴瑞特氏食道(BE)。已提出微创工具或非侵入式工具，但是因缺乏具有最佳灵敏性和特异性的标记物而受阻。开展了实验，并将异常甲基化的BMP3和NDRG4鉴定为BE的判别性候选标记物。

此类实验的目的是使用内窥镜活检标本(阶段1)和模拟内窥镜取样器的得自整个食道和贲门的刷取样本(阶段2)前瞻性评估甲基化BMP3和NDRG4鉴定BE的准确度。

在内窥镜检查之前募集了病例和无BE的对照。BE病例具有＞1cm的带有经确认的肠化生的圆周柱状粘膜；对照不具有以内窥镜方式确定的BE。在阶段1，在BE、胃贲门((GC)；Z线下方1cm)和鳞状上皮((SE)；BE上方＞2cm)病例中以及在GC(就BE而论)和SE(Z线上方5cm)对照中获得活检标本，然后立即冷冻。将活检样品分批处理，并以设盲方式测定。在阶段2，使用高容量内窥镜细胞刷(HobbsMedical，StaffordSpringsCT)获得标本；刷取贲门、BE(在病例中)和整个食道长度以模拟吞下的海绵取样器。在DNA提取和亚硫酸氢盐处理后，通过定量等位基因特异性实时靶标和信号扩增测定了靶基因上的甲基化。还作为总人DNA标记物对β-肌动蛋白进行了定量。

前瞻性研究了100名受试者。阶段1：在40个BE病例和40个对照之中，中值年龄为65(四分位数55-77)和54(37-69)，并且男性分别占78％和48％。中值BE长度为6cm(范围3-10)。甲基化标记物的中值水平在BE中比在相邻SE和GC中或比在正常SE和GC中实质性更高(34-600倍)(表)。与甲基化标记物相比之下，β-肌动蛋白分布在组织组中相似。两种标记物水平均随着BE长度和年龄而增加，p＜0.001，而仅有NDRG4在存在化生不良(无(19)，低等级(9)，高等级(11)；p＝0.003)时显著增加。不显著影响标记物水平的因素包括年龄和炎症。阶段2：在10个BE病例和10个对照之中，中值年龄为64(59-70)和66(49，71)，并且男性分别占80％和30％。中值BE长度为2cm(范围1-4)。通过标记物来判别BE非常出色，其中NDRG4的AUC为1.0，而BMP3的AUC为0.99；病例中的水平比对照高＞100倍(图2)。

这些实验证明了所选的甲基化DNA标记物在活检和刷取标本中均能高度区分BE与正常GC和SE。表9显示了所选甲基化DNA标记物的功能和癌症生物学关联。

表8：得自BE病例(贲门、巴瑞特氏、鳞状)和对照(贲门、鳞状)的BMP3和NDRG4活检样本的标记物水平(针对β肌动蛋白而调整的标记物拷贝数)

表9.靠前的候选标记物的功能和癌症生物学关联

LeeWK，ChakrabortyPK，F.2(PITX2)protectsrenalcelllinesagainstdoxorubieintoxicitybyactivationofthemultidrugtransporterABCBLInternationaljournalofcancerJournalducancer.2013；133:556-67.

VincentA，OmuraN，HongSM，JaffeA，J，GogginsM，Genomewideanalysisofpromotermethylationassociatedwithgeneexpressionprofileinpancceaticadenocarcinoma.Clinicalcancerresearch：anofficialjournaloftheAmericanAssociationforCancerResearch.2011；17：4341-54.

YangN，EijsinkJJ，LendvaiA，VolsersHH，KlipH.BuikemaHJ，etal.MethylationmarkersforCCNA1andC13ORF18arestronglyassociatedwithhigh-gradecervicalandcancerincervicelscrapings.Cancerepideminlogy，biomarkers&prevention：apubhcationoftheAmericanAssociationforCancercosponsoredbytheAmericanSocietyofPreventiveOneology.2009；18：3000-7.

LiuD，SongL，BrwleyVS，RobisonN，WeiJ，GaoX，etal.MedullohlastomaexpressesCD1dandcanbetargetedforwithNKTcells.Clin2013；149：55-64.LiH，YangL.FuH.YanJ，WangY，GaoH，etal.AssociationhetweenGalphai2andELMO1/Dock180connectschemokinesignallingwithRacactivationandmetastasls.NatCommun，2013；4：1706.

StummL，BurkhardtL，StenrerS，SimonR，AdamM，BeckerA，etal.StrongexpressionofthetranscriptionfactorFOXP2islinkedtoanincreasedriskofearlyPSArecurrenceinERGfusion-negativecancers.Journalofclinicalpathology.2013；66：563-8.

CampbellAJ，LyneL，BrownPJ，LaunchburyRJ，BignoneP，ChiJ，etal.AberrantexpressionoftheneuronaltranscriptionfactorFOXP2inneoplasticplasmacells.Britishjourualof2010；149：221-30.

JiaoX，WoodLD，LindmanM，JonesS，BuekhanltsP，PolyakK，etal.SomaticmutationsintheNotch.NF-KB.PIK3CA，andHedgehogpathwaysinhumanbreastcancers.Genes，chromosomes&cancer.2012；51：480-9.

AsaiD，ImamuraT，SuenohuS，SaitoA，HasegawaD，DeguchiT，etal.IKZF1deletionisassociatedwithapoorouteomeinpediatrieB-cellprecursoracutelymphoblasticleukemiainJapan，CancerMed.2013；2：412-9.

KoberP.BujkoM，OledzkooJ，TysarowskiA，SiedledkiJA.MethylCpGbindingcohumn-hasedidentificationofninegeneshupermethylatedincolorectalcancer.Molecularcarcinogenesis.2011；50：846-56.

CamoesMJ，PauloP，RibeiroFR，Barros-SilvaJD，AlmeidaM，CostaVL，etal.PotentialdownstreamtargetgenesofaberrantETStranseriptionfactorsaredifforantiallyaffectedinEwing’ssarcomaandprostatecarcinoma.PLoSONE.2012；7：49819.

KisielJB，YabTC，TaylorWR，ChariST，GM，MahoneyDW，etal.StoolDNAtestingforthedetectionofpaancreaticcancer：assessmentofmethylationmarkercandidates.Caneer.2012；118：2623-31.

AhlquistDA，ZouH，DomanicoM，MahoneyDW，YabTC，TaylorWR，etal.NextGenerationStoolDNATestAccuratelyDetectsColorectalCaneerandAdenomas.Gastroenterology.2012；142：248-56.

surdezD，M，PerrinV，HanZY，PierronG，BalletS，etal.TargetingtheEWSR1-FLI1oncogeneinducedproteinkinasePKChetaabolishesewingsarcomagyowth，Cancerresearch.2012；72：4494-503.

SeshagiriS，StawiskiEW，DarinckS，Z，StormEE，ConhoyCB，etal.ReeurrentR-Spondinincoloncancer.Nature.2012；488：660-4.

ZhaoJ，LiangQ，CheungKF，KangW，LungRW，TongJH，etal.Genome-wideidentificationofEpsteinBarrvirasdrivenpromotermethylationprofilesofhumangenesingasiriccancerrcells.Cancer.2013；119：304-12.

GurungB，FengZ，IwamotoDV，ThielA，JinG，FanCM，etal.MeninepigeneticallyrepressesHedgehogsignlinginMEN1tumorsyndrome.Cancerresearch.2013；73：2650-8.

PersonR，J，TokarE，J，XuY，OrihuelaR，NgalameNN，WaalkesMP.Chroniccadmiumexposureinvitroinducescancercellcharacteristicsinhumanlungcells.ToxicolApplPharmacol.2013.

ShinSH，LeeK，KimBH，ChoNY，JangJY，KimYT.etal.Bile-baseddetectionofextrahepatiecholangiocarcinomawithquantitativeDNAmethylationmarkersanditshighsensitivity.TheJournalofmoleculardiagnosties：JMD.2015；14：256-63.

JacobsDI，MaoY，FuA，KellyWK，ZhuY.Dysregulatedmethylationatimpriatedgenesinprostatetumortissuedetected.bymethylationmicroarray.BMCUrol.2013；13：37.

实施例9：用于检测胰腺癌的基于粪便的微RNA和DNA标记物组

鉴于胰腺癌(PC)极高的致死率，需要用于症状前筛查检测的实用的非侵入式方法。微RNA(miRNA)在PC中具有改变的表达。

以探索粪便mir-1290检测PC的可行性为目标开展了实验。

分析了得自按年龄、性别和吸烟史匹配的58个PC病例和64个健康对照的归档粪便样品。通过茎-环定量逆转录聚合酶链反应(qRT-PCR)法进行了对miRNA的检测。miRNA的定量基于测量每纳克提取RNA的绝对拷贝数。如所述(Cancer2012，118：2623)对DNA标记物(甲基化BMP3、突变KRAS和β-肌动蛋白)进行杂交捕获和扩增。将限于5个变量的逐步逻辑回归模型用来基于mir-1290、DNA标记物和年龄构建优化的标记物组。使用DeLong等的方法对每个模型的经年龄调整的ROC曲线下面积(AUC)进行比较。使用Wilcoxon秩和检验评价了miR-1290与临床因素的关联。

miR-1290的分布在得自PC病例的粪便中明显高于对照(P＝0.0002)。粪便miR-1290水平不受年龄、性别、肿瘤部位或肿瘤阶段的影响。对于PC检测，粪便miR-1290的AUC为0.74(95％CI：0.65-0.82，图3)，相比之下，粪便DNA标记物组的AUC为0.81(0.73-0.89)。向DNA标记物添加miR-1290证实了价值的提升(P＝0.0007)，其中AUC为0.87(0.81-0.94)。向DNA组添加miR-1290增加了测试在整个特异性范围内(包括90-100％的临界区)的灵敏性。组合的标记物组的PC灵敏性在95％(87％-99％)的特异性下为64％(50％-76％)，以及在85％(74％-92％)的特异性下为79％(67％-89％)。

这些实验将粪便miR-1290鉴定为PC的标记物。

实施例11-使用RRBS鉴定标记物

在开发本文所提供的技术期间，从病例对照研究中收集了数据以展示基因组范围搜索策略鉴定了新的且信息量丰富的标记物。

研究群体、标本采集和样品

样品类型为：

1)限于AJCCI和II期的MayoClinicPancreasSPORE注册PanC组织；

2)无PanC的对照胰腺；

3)无PanC的归档对照结肠上皮；和

4)已提取了DNA并储存在BAP实验室的结肠赘生物。

方法

根据之前报道的方法(参见Gu等(2011)“Preparationofreducedrepresentationbisulfitesequencinglibrariesforgenome-scaleDNAmethylationprofiling”NatureProtocols6：468-81)通过用10单位的MspI(一种识别含CpG的基序的甲基化特异性限制酶)进行消化使基因组DNA(300ng)片段化而制备了文库。该处理富集样品的CpG含量并消除基因座的冗余区。对消化后的片段进行末端修复并用5单位的Klenow片段(3′-5′外切酶)加A尾，然后过夜连接到含有四个条形码序列之一的衔接子，以将每个片段与其样品ID相联系。使用SPRI珠/缓冲液(AMPureXP，BeckmanCoulter)进行了160-340bp片段(具有40-220bp插入片段)的大小选择。缓冲液截止值为珠/缓冲液样品体积的0.7×至1.1×。将样品在22μl(EB缓冲液，Qiagen)的体积中洗脱。将qPCR用于测量样品的小等分试样的连接效率和片段质量。样品然后接受两轮使用改良的EpiTect方案(Qiagen)的亚硫酸氢盐转化。对经转化的样品等分试样进行的qPCR和常规PCR(PfuTurboCxhotstart，Agilent)然后进行的Bioanalyzer2100(Agilent)评估在对最终文库进行扩增之前确定了最佳的PCR循环数。在50μl的体积中进行了最终PCR(5μl的10×PCR缓冲液；各1.25μl的为10mM的dNTP；5μl的为约5μM的引物混合物；15μl的模板(样品)；1μl的PfuTurboCx热启动酶和22.75μl的水。热循环始于95℃下5分钟和98℃下30秒的初始孵育，然后是16个以下循环：98℃下10秒、65℃下30秒和72℃下30秒。在循环后，将样品在72℃下孵育5分钟，然后保持在4℃直到进一步的后处理和分析。基于随机化方案将样品以等摩尔的量合并成4重文库，并用生物分析仪进行测试以验证最终大小。还将样品通过qPCR使用phiX标准品和衔接子特异性引物进行了测试。

对于测序，将样品根据随机化泳道分配而上样到流动池泳道上，另外的泳道为内部测定对照而留。通过NGSCore在MayoMedicalGenomeFacility在IlluminaHiSeq2000上进行了测序。对于101个循环，读取结果为单向的。每个流动池泳道生成了1-1.2亿个读取结果，对于所比对的序列，足以实现30×至50×测序深度的中值覆盖(基于每个CpG的读取数)。将标准Illumina流水线软件用于与RRBSMAP(Xi等(2012)“RRBSMAP：afast，accurateanduser-friendlyalignmenttoolforreducedrepresentationbisulfitesequencing”Bioinformatics28：430-432)和由MayoBiomedicalandStatistics人员开发的内部流水线(SAAP-RRBS)(Sun等(2012)“SAAP-RRBS：streamlinedanalysisandannotationpipelineforreducedrepresentationbisulfitesequencing”Bioinformatics28：2180-1)相结合来分析读取结果。生物信息学分析由以下方面组成：1)序列读取评估和清理(clean-up)，2)与参考基因组比对，3)甲基化状况提取，和4)CpG报告和注释。

统计考虑：

所关注的主要比较是在每个CpG和/或瓦片式CpG窗口处病例与胰腺对照之间的甲基化差异。次要结局指标是在病例与正常血沉棕黄层和结肠对照之间进行的相同比较。通过以下方式测试了标记物的差异甲基化：

1.评价每种标记物的甲基化百分比的分布并丢弃在结肠对照和正常血沉棕黄层中甲基化背景超过2.5％的标记物

2.使用Wilcoxon秩和检验法测试病例与对照之间其余标记物的甲基化分布，并按p值对标记物排序。

3.使用Q值估计假发现率(FDR)(Benjamini等(1995)“MultipleTesting”JournaloftheRoyalStatisticalSociety.SeriesB(Methodological)57：289-300；Storey等(2003)“Statisticalsignificanceforgenomewidestudies”ProcNatlAcadSciUSA100：9440-5)。在发现层级上，最高25％的FDR是可以接受的。

数据分析

1.在所有CpG位点中读取

2.仅考虑全组覆盖深度为200或更多个读取结果的那些CpG位点。这基于检测任何两个组之间20％与30％甲基化之间的差异的能力评估；小于该范围的任何值具有显著性的机会很小。因此，如果每组有18名受试者而每个受试者有12个读取结果，则组覆盖深度为12*18＝216。

3.排除在组中甲基化％的方差为0的所有CpG位点(无信息的CpG位点)。

4.通过定义为正常结肠/血沉棕黄层、疾病特定对照和所关注的特定疾病的组对甲基化％(使用实际的计数)执行过度离散逻辑回归以确定主要和次要分析的甲基化％的统计显著性。由于受试者之间甲基化％的变异性大于二项式假设所允许的变异性，因此使用过度离散逻辑模型。使用拟合的皮尔森卡方估计该离散参数。

5.生成接收者操作特征曲线(ROC)下面积的值。ROC曲线下面积是受试者特定的甲基化％的预测准确度的度量，并单独针对主要分析(病例与疾病对照)和次要分析(病例与正常结肠/血沉棕黄层)进行估计。

6.以与#5类似的方式，还使用病例与相应对照组之间的平均甲基化％的比率估计了主要和次要分析的倍数变化(FC，病例与对照之间的分离的度量)。

7.对各个CpG位点以及甲基化CpG区执行了以上4-6。针对每条染色体将这些区定义为一组共计至少5个在大约100个碱基对(bp)距离内的CpG位点，其中在正常结肠/血沉棕黄层对照中的平均甲基化％＜2.5％

8.显示出技术和生物验证前景的CpG区被鉴定为对于主要或次要分析具有统计显著性甲基化差异、大FC和高AUC。

R后(Post-R)分析：

1.按p值、FC和AUC分类各个CpG和CpG区。截止值分别为＜0.01、＞20和＞0.85，但这些值通常根据数据的稳健性加以调整。例如，高度异质性的赘生物组织产生了较低的甲基％值，其继而影响过滤。主要和次要比较可根据应用的特异性要求而一起或单独分类。包括正常的结肠上皮作为适于粪便测定法的未覆盖标记物的对照。如果测试胰液，则不需要结肠组织。这可产生完全不同的标记物集合。

2.基于测定平台要求对标记物区排序。当前，基于引物退火的特异性进行判别的甲基化特异性PCR(MSP)或类似的扩增平台是首选的平台。对于该技术，必须在DNA的可扩增段内每个寡核苷酸具有2-5个判别性CpG。对于粪便测定法，该要求甚至更严格，因为扩增子必须更短(＜100bp)。因此，标记物选择需要基于高判别性CpG的短邻接段。如果该平台发展到基于序列的技术，则在某个区中的CpG分布要求可完全不同。

结果

通过RRBS对得自18例胰腺癌肿瘤、18例良性胰腺对照组织和18例正常结肠上皮组织的匹配、设盲、随机分配的DNA提取物测序。中值年龄为61(四分位数范围52-65)，61％为女性，并且44％为当前吸烟者或曾吸烟者。以≥10×的覆盖对大约六百万个CpG作图。多于2000个CpG岛符合差异甲基化的显著性标准。在应用以上过滤器标准后，鉴定出449个差异甲基化区(DMR)(表10)。表11展示了按渐减的ROC曲线下面积(AUC)排序的鉴定出的449个差异甲基化区(DMR)。

在这些标记物中，甲基化签名在3个相邻CpG至56个CpG的范围内。胰腺癌的甲基化水平在经过滤的CpG处很少超过25％，这表明癌组织可具有高水平的污染性正常细胞和/或基质。为了检验这一点，对每种癌的KRAS突变进行测序以验证阳性样品的等位基因频率。对于具有杂合KRAS碱基变化的50％，突变等位基因的频率比相应野生型等位基因低至少4倍，从而支持被正常细胞和/或基质污染这一点。

据发现，449个标记物中的58个在非注释区中并位于不含蛋白编码元件的基因组区中。在其余391个候选标记物之中，约225个已被描述为与癌症相关，其中一些归类为肿瘤抑制因子。166个其它候选标记物具有之前鉴定的与癌症的弱关联(例如，在基因组范围筛查中观察到的突变和/或拷贝数改变)或不具有之前鉴定的癌症关联。

表10：DMR

标记物

在表10中，根据2009年2月humangenomeassemblyGRCh37/hg19(参见例如Rosenbloom等(2012)“ENCODEwhole-genomedataintheUCSCGenomeBrowser：update2012”NucleicAcidsResearch40：D912-D917)对碱基编号。标记物名称BHLHE23和LOC63930是指相同的标记物。

表11.

以上说明书中提及的所有出版物和专利整体通过引用并入本文以用于所有目的。技术的所述组合物、方法和用途的各种修改形式和变型形式在不脱离如所述的技术的范围和精神的情况下将对本领域的技术人员显而意见。虽然已结合具体示例性实施方案对该技术进行了描述，但是应当理解，受权利要求书保护的本发明不应不当地限于此类具体实施方案。实际上，对药理学、生物化学、医学科学或相关领域的技术人员显而易见的对用于实践本发明的所述模式的各种修改形式旨在落在以下权利要求书的范围内。

Claims

1.一种筛查得自受试者的样品中的赘生物的方法，所述方法包括：

1)测定得自受试者的样品中的标记物的甲基化状态；以及

2)当所述标记物的所述甲基化状态不同于在不具有赘生物的受试者中测定的标记物的甲基化状态时，将所述受试者鉴定为具有赘生物，

其中所述标记物包含在选自以下的差异甲基化区(DMR)中的碱基：

表1中的DMR1-107、表10中的DMR1-449和对应于Chr16：58497395-58497458的DMR。

2.根据权利要求1所述的方法，其进一步包括定位所述受试者内的赘生物部位，其中所述标记物的所述甲基化状态指示所述受试者内的所述赘生物部位。

3.根据权利要求1所述的方法，其中所述赘生物为胃肠赘生物。

4.根据权利要求1所述的方法，其中所述赘生物存在于所述患者的上消化道区域。

5.根据权利要求1所述的方法，其中所述赘生物存在于所述患者的下消化道区域。

6.根据权利要求1所述的方法，其中所述赘生物为胰腺赘生物、结肠直肠赘生物、胆管赘生物、胃赘生物、食道赘生物或腺瘤。

7.根据权利要求1所述的方法，其中所述赘生物为癌前的。

8.根据权利要求1所述的方法，其包括测定多种标记物。

9.根据权利要求1所述的方法，其包括测定2至11种标记物。

10.根据权利要求1所述的方法，其包括测定12至107种标记物。

11.根据权利要求1所述的方法，其中测定所述样品中的所述标记物的所述甲基化状态包括确定一个碱基的甲基化状态。

12.根据权利要求1所述的方法，其中测定所述样品中的所述标记物的所述甲基化状态包括确定多个碱基处的甲基化程度。

13.根据权利要求1所述的方法，其中所述标记物的所述甲基化状态包括相对于所述标记物的正常甲基化状态所述标记物的甲基化增加或减少。

14.根据权利要求1所述的方法，其中所述标记物的所述甲基化状态包括相对于所述标记物的正常甲基化状态所述标记物的甲基化模式不同。

15.根据权利要求1所述的方法，其包括测定正义链的甲基化状态或测定反义链的甲基化状态。

16.根据权利要求1所述的方法，其中所述标记物为100个或更少的碱基的区。

17.根据权利要求1所述的方法，其中所述标记物为500个或更少的碱基的区。

18.根据权利要求1所述的方法，其中所述标记物为1000个或更少的碱基的区。

19.根据权利要求1所述的方法，其中所述标记物为5000个或更少的碱基的区。

20.根据权利要求1所述的方法，其中所述标记物为一个碱基。

21.根据权利要求1所述的方法，其中所述标记物在高CpG密度启动子中。

22.根据权利要求1所述的方法，其中所述样品为粪便样品、组织样品、胰液样品、胰腺囊肿液样品、血液样品或尿液样品。

23.根据权利要求1所述的方法，其中所述测定包括使用甲基化特异性聚合酶链反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。

24.根据权利要求1所述的方法，其中所述测定包括使用甲基化特异性寡核苷酸。

25.一种寡核苷酸，其包含选自SEQIDNO：1-202的序列。

26.一种寡核苷酸，其包含与具有DMR中的碱基的染色体区互补的序列。

27.一种寡核苷酸，其对DMR的甲基化状态敏感。

28.根据权利要求1所述的方法，其中具有选自ABCB1、ADCY1、BHLHE23(LOC63930)、c13orf18、CACNA1C、chr12.133、CLEC11A、ELMO1、EOMES、GJC1、IHIF1、IKZF1、KCNK12、KCNN2、NDRG4、PCBP3、PRKCB、RSPO3、SCARF2、SLC38A3、ST8SIA1、TWIST1、VWC2、WT1或ZNF71的注释的染色体区构成所述标记物。

29.根据权利要求1所述的方法，其中所述DMR来自表1并选自DMRNo.11、14、15、65、21、22、23、5、29、30、38、39、41、50、51、55、57、60、61、8、75、81、82、84、87、93、94、98、99、103、104和107。

30.根据权利要求1所述的方法，其中所述DMR来自表1并选自DMRNo.11、14、15、65、21、22、23、5、29、30、38、39、41、50、51、55、57、60、61、8、75、81、82、84、87、93、94、98、99、103、104或107。

31.根据权利要求1所述的方法，其中具有选自

CLEC11A、C13ORF18、KCNN2、ABCB1、SLC38A3、CD1D、IKZF1、ADCY1、CHR12133、RSPO3和TWIST1或

ADCY1、PRKCB、KCNK12、C13ORF18、IKZF1、TWIST1、ELMO、55957、CD1D、CLEC11A、KCNN2、BMP3和/或NDRG4

的注释的染色体区构成所述标记物。

32.根据权利要求1所述的方法，其包括确定两种标记物的甲基化状态。

33.根据权利要求1所述的方法，包括确定在表5的行中提供的一对标记物的甲基化状态。

34.一种试剂盒，其包含：

1)亚硫酸氢盐试剂；以及

2)对照核酸，其包含选自表1中的DMR1-107、表10中的DMR1-449和对应于Chr16：58497395-58497458的DMR的DMR中的序列，并具有与未患癌症的受试者相关的甲基化状态。

35.一种试剂盒，其包含亚硫酸氢盐试剂和根据权利要求25-27中任一项所述的寡核苷酸。

36.一种试剂盒，其包含：

1)亚硫酸氢盐试剂；以及

2)对照核酸，其包含选自表1中的DMR1-107、表10中的DMR1-449和对应于Chr16：58497395-58497458的DMR的DMR中的序列，并具有与患癌症的受试者相关的甲基化状态。

37.一种试剂盒，其包含：用于从受试者获得样品的样品收集器；用于从所述样品中分离核酸的试剂；亚硫酸氢盐试剂；和根据权利要求25-27中任一项所述的寡核苷酸。

38.根据权利要求37所述的试剂盒，其中所述样品为粪便样品。

39.一种组合物，其包含含有DMR的核酸和亚硫酸氢盐试剂。

40.一种组合物，其包含含有DMR的核酸和根据权利要求25-27中任一项所述的寡核苷酸。

41.一种组合物，其包含含有DMR的核酸和甲基化敏感性限制酶。

42.一种组合物，其包含含有DMR的核酸和聚合酶。

43.一种用于筛查得自受试者的样品中的赘生物的方法，所述方法包括：

a)确定所述样品中包含选自表1中的DMR1-107、表10中的DMR1-449和对应于Chr16：58497395-58497458的DMR的DMR中的碱基的标记物的甲基化状态；

b)将得自所述受试者样品的所述标记物的所述甲基化状态与得自未患癌症的受试者的正常对照样品的所述标记物的甲基化状态进行比较；

c)确定所述受试者样品和所述正常对照样品的所述甲基化状态的差异的置信区间和/或p值。

44.根据权利要求43所述的方法，其中所述置信区间为90％、95％、97.5％、98％、99％、99.5％、99.9％或99.99％，并且所述p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001或0.0001。

45.一种用于筛选得自受试者的样品中的赘生物的方法，所述方法包括：使包含DMR的核酸与亚硫酸氢盐试剂反应以产生亚硫酸氢盐反应的核酸；对所述亚硫酸氢盐反应的核酸测序以提供所述亚硫酸氢盐反应的核酸的核苷酸序列；将所述亚硫酸氢盐反应的核酸的所述核苷酸序列与得自未患癌症的受试者的包含所述DMR的核酸的核苷酸序列进行比较以鉴定这两个序列中的差异；以及当存在差异时将所述受试者鉴定为具有赘生物。

46.一种用于筛选得自受试者的样品中的赘生物的系统，所述系统包括：被配置成确定样品的甲基化状态的分析组件，被配置成将所述样品的所述甲基化状态与对照样品或数据库中记录的参照样品甲基化状态进行比较的软件组件，以及被配置成基于甲基化状态的组合确定单个值并向用户提供癌症相关甲基化状态警报的警报组件。

47.根据权利要求46所述的系统，其中所述样品包含含有DMR的核酸。

48.根据权利要求46所述的系统，其进一步包括用于分离核酸的组件。

49.根据权利要求46所述的系统，其进一步包括用于收集样品的组件。

50.根据权利要求46所述的系统，其进一步包括用于收集粪便样品的组件。

51.根据权利要求46所述的系统，其中所述数据库包含含有DMR的核酸序列。

52.根据权利要求46所述的系统，其中所述数据库包含得自未患癌症的受试者的核酸序列。

53.一组分离的核酸，每个核酸具有包含DMR的序列。

54.根据权利要求53所述的一组核酸，其中每个核酸具有得自未患癌症的受试者的序列。

55.一种系统，其包含根据权利要求53或54所述的一组核酸和与所述一组核酸相关的核酸序列数据库。

56.根据权利要求55所述的系统，其进一步包含亚硫酸氢盐试剂。

57.根据权利要求55所述的系统，其进一步包含核酸测序仪。

58.根据权利要求1所述的方法，其中具有选自NDRG4和BMP3的注释的至少一个染色体区构成所述标记物。

59.根据权利要求58所述的方法，其中所述样品包括食道组织。

60.根据权利要求59所述的方法，其中所述食道组织通过食道活检程序获得。

61.根据权利要求59所述的方法，其中所述食道组织通过食道刷取程序获得。

62.根据权利要求1所述的方法，其中具有选自CD1D、NDRG4、CLEC11A、KCNN2、BMP3、ADCY1、PRKCB、KCNK12、c13orf18、IKZF1、TWIST1、ELMO和55957的注释的至少一个染色体区构成所述标记物。

63.根据权利要求22所述的方法，其中所述组织为食道组织或胰腺组织。