CN115702251A

CN115702251A - 进展期腺瘤和/或早期结直肠癌的检测

Info

Publication number: CN115702251A
Application number: CN202080101924.4A
Authority: CN
Inventors: K·克鲁斯马; C·亨塞; J·马丁内兹-巴雷亚; P·索拉·德罗斯·桑托斯; P·科内尔·诺格尔; M·比滕茨; M·切西科拉; P·科纳普
Original assignee: General Diagnostics
Current assignee: General Diagnostics
Priority date: 2020-04-17
Filing date: 2020-09-21
Publication date: 2023-02-14
Also published as: US20210332440A1; WO2021209161A1; EP4121563A1

Abstract

本公开特别提供一种用于腺瘤和/或早期结直肠癌检测(例如筛查)的方法和与其相关的组合物。在多种实施方式中，本公开提供了筛查方法，其包括分析一种或多种甲基化生物标志物的甲基化状态，以及与其相关的组合物。在多种实施方式中，本公开提供了检测(例如筛查)方法，其包括检测(例如筛查)cfDNA(例如，ctDNA)中的一种或多种甲基化生物标志物的甲基化状态。在多种实施方式中，本公开提供了筛查方法，其包括使用MSRE‑qPCR和/或使用大规模平行测序(例如下一代测序)来检测(例如筛查)cfDNA(例如，ctDNA)中的一种或多种甲基化生物标志物的甲基化状态。

Description

进展期腺瘤和/或早期结直肠癌的检测

技术领域

本发明总体涉及用于检测和/或预先筛查进展期腺瘤和/或早期结直肠癌的方法和试剂盒。在某些实施方式中，本文所述的方法和试剂盒利用人类基因组的确定的差异甲基化区域作为标志物，以确定进展期腺瘤和/或早期结直肠癌的存在和/或风险。

背景技术

癌症筛查是癌症预防、诊断和治疗的重要组成部分。根据一些报告，结直肠癌(CRC)已被确定为世界上第三大最常见的癌症类型和第二大最常见的癌症死亡原因。根据一些报告，每年有超过180万个结直肠癌新病例，约有881,000人死于结直肠癌，约占癌症死亡数的1/10。已推荐定期进行结直肠癌筛查，特别是对超过50岁的人。此外，50岁以下的个体的结直肠癌发病率也随时间增加。统计数据表明，目前的结直肠癌筛查技术是不足的。尽管随时间的推移有所改善，但目前只有约40％至44％的结直肠癌在早期、局部阶段被筛查出。这至少部分上是由于目前筛查技术的灵敏度和/或特异性不足。目前推荐的技术包括对超过50岁以的人群的结肠镜检查和/或粪便血液检测。

大多数结直肠癌起源于结肠息肉，根据组织学，这些息肉最初看似是良性的。因此，提前检测和切除结肠息肉是结肠癌筛查的重要部分。然而，仅仅根据组织病理学分类来确定哪些息肉会发展成侵袭性癌是很困难的。在例如结肠镜检查等过程中，对从结肠组织中切除的样品常规地进行组织病理学分类，将有发展为恶性肿瘤的趋势的息肉列为进展期腺瘤。进展期腺瘤被归类为具有以下一个或多个特征：具有大尺寸(即腺瘤大于1cm)；具有高等级发育异常；具有突出的绒毛组分；和/或具有锯齿状特征。然而，即使将腺瘤根据上述分类归类为进展期腺瘤，该腺瘤也可能不会发展为侵袭性癌。

在不希望被任何特定理论束缚的情况下，发展为侵袭性癌的腺瘤或息肉将获得并积累与正常组织不同的基因改变。通过识别这些不同的改变，可以开发出一种分子指纹来帮助确定腺瘤是否会发展为侵袭性癌。开发工具和技术来确定晚期癌和结直肠癌的分子指纹，将有助于在最早期就鉴定结直肠癌。因此，需要工具和筛查技术来准确筛查最早阶段的结直肠癌。

发明内容

本公开内容特别提供了从人生物样品中以高准确度检测恶变前肿瘤和恶性肿瘤(例如进展期腺瘤和早期结直肠癌)的方法。在多种实施方式中，本发明提供了结直肠癌的筛查方法，该方法包括确定人类受试者的脱氧核糖核酸(DNA)的甲基化基因座(例如差异甲基化区域(DMR))内存在的一个或多个甲基化位点的甲基化状态(例如甲基化的数量、频率或模式)，以及与此相关的组合物。在多种实施方式中，本公开提供了进展期腺瘤和/或早期结直肠癌(例如，二者作为一个组合类别，或进展期腺瘤作为一个单一类别，或早期结直肠癌作为一个单一类别)的筛查方法，所述方法包括筛查cfDNA(无细胞DNA)(例如ctDNA(循环肿瘤DNA))中的一个或多个甲基化基因座中每一个的甲基化状态。在多种实施方式中，本公开提供了结直肠癌的筛查方法，该方法包括使用例如定量聚合酶链反应(qPCR)(例如甲基化敏感限制性酶定量聚合酶链反应，MSRE-qPCR)来确定cfDNA(例如ctDNA)中的一个或多个甲基化基因座中每一个的甲基化状态。在一些实施方式中，该技术使用大规模平行测序(例如，下一代测序)来确定甲基化状态，例如，通过合成测序、实时(例如单分子)测序、珠乳液测序、纳米孔测序等方法来测序。本文提供的各种组合物和方法提供足以在临床上用于筛查进展期腺瘤和/或早期结直肠癌的灵敏度和特异性。本发明提供的各种组合物和方法可用于通过分析受试者的可及组织样品(例如，组织样品是血液或血液组分(例如cfDNA，如ctDNA)或粪便)来筛查进展期腺瘤和/或早期结直肠癌。

在一个方面，本发明涉及一种检测(例如，筛查)进展期腺瘤的方法，该方法包括：确定人类受试者的脱氧核糖核酸(DNA)中以下一项或两项各自的甲基化状态：(i)NRF1基因内的甲基化基因座；和(ii)TMEM196基因内的甲基化基因座；以及至少基于所确定的甲基化状态来诊断人类受试者的进展期腺瘤。

在某些实施方式中，NRF1基因内的甲基化基因座包括具有SEQ ID NO:50的NRF1的至少一部分(例如，至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％)。

在某些实施方式中，TMEM196基因内的甲基化基因座包括具有SEQ ID NO:49的TMEM196的至少一部分(例如，至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％)。

在某些实施方式中，所述方法进一步包括确定包含SEQ ID NO:27的至少一部分(例如至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％)的甲基化基因座的甲基化状态，并且其中诊断步骤包括至少基于所确定的包含SEQ ID NO:27的甲基化基因座的甲基化状态来诊断人类受试者的进展期腺瘤。

在某些实施方式中，所述DNA从人类受试者的血液或血浆中分离出。

在某些实施方式中，所述DNA是人类受试者的无细胞DNA。

在某些实施方式中，甲基化状态用定量聚合酶链反应(qPCR)确定。

在某些实施方式中，甲基化状态用大规模平行测序(例如下一代测序)[例如，合成测序、实时(例如单分子)测序、珠乳液测序、纳米孔测序等测序方法]来确定。

在另一方面，本发明涉及一种检测(例如，筛查)结直肠癌的方法，该方法包括：确定人类受试者的脱氧核糖核酸(DNA)中的以下一个或多个(例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或全部20个)各自的甲基化状态：(i)ADSSL1基因内的甲基化基因座，例如SEQ ID NO:45的至少一部分(例如至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％)；(ii)CFAP44基因内的甲基化基因座，例如SEQ ID NO:7的至少一部分和/或SEQ ID NO:10的至少一部分和/或SEQ ID NO:12的至少一部分；(iii)ENG基因内的甲基化基因座，例如SEQ ID NO:32的至少一部分；(iv)LINC01395基因内的甲基化基因座，例如SEQ ID NO:16的至少一部分和/或SEQID NO:17的至少一部分；(v)NOS3基因内的甲基化基因座，例如SEQ ID NO:14的至少一部分；(vi)RASA3基因内的甲基化基因座，例如SEQ ID NO:22的至少一部分；(vii)SYCP1基因内的甲基化基因座，例如SEQ ID NO:37的至少一部分；(viii)ZAN基因内的甲基化基因座，例如SEQ ID NO:43的至少一部分；(ix)CD8B和ANAPC1P1的重叠基因区域内的甲基化基因座，例如SEQ ID NO:59的至少一部分；(x)FLI1和LOC101929538的重叠基因区域内的甲基化基因座，例如SEQ ID NO:36的至少一部分；(xi)KCNQ1OT1和KCNQ的重叠基因区域内的甲基化基因座，例如SEQ ID NO:33的至少一部分；(xii)LOC101929234和ZNF503-AS2的重叠基因区域内的甲基化基因座，例如SEQ ID NO:15的至少一部分；(xiii)MAP3K6和FCN3的重叠基因区域内的甲基化基因座，例如SEQ ID NO:46的至少一部分和/或SEQ ID NO:47的至少一部分；(xiv)包含SEQ ID NO:5的至少一部分(例如至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％)的甲基化基因座；(xv)包含SEQ ID NO:39的至少一部分的甲基化基因座；(xvi)包含SEQ ID NO:52的至少一部分的甲基化基因座；(xvii)包含SEQ ID NO:53的至少一部分的甲基化基因座；(xviii)包含SEQ ID NO:54的至少一部分的甲基化基因座；(xix)包含SEQ ID NO:25的至少一部分的甲基化基因座；和(xx)包含SEQ ID NO:27的至少一部分的甲基化基因座；以及至少基于所确定的甲基化状态来诊断人类受试者的结直肠癌。

在另一方面，本发明涉及一种在从受试者(例如人类受试者)获得的样品(例如粪便样品、结直肠组织样品、血液样品或血液制品样品)中检测(例如，筛查)结直肠肿瘤(例如结直肠癌和/或进展期腺瘤)的方法，该方法包括：确定在所述样品中鉴定出的一个或多个标志物各自的甲基化状态；以及至少部分地基于所确定的所述一个或多个标志物各自的甲基化状态和代表不具有被认为是恶性或恶变前的结直肠肿瘤的一个或多个受试者(例如没有结肠镜检发现、有增生性息肉和/或有非恶性胃肠道疾病的一个或多个患者)的所述一个或多个标志物的相应甲基化状态(例如数值或范围)，确定该受试者是否患有结直肠肿瘤(例如结直肠癌和/或进展期腺瘤)，其中，所述一个或多个标志物各自包含差异甲基化区域(DMR)中的碱基，所述差异甲基化区域(DMR)选自表1所列的DMR。

在上述任何方面的某些实施方式中，每个甲基化基因座的长度等于或小于5000bp、4000bp、3000bp、2000bp、1000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp。

在另一方面，本发明涉及用于本文所述方法的试剂盒，该试剂盒包括表1中所列的一个或多个寡核苷酸引物对，用于扩增一个或多个相应的甲基化基因座。

在另一方面，本发明涉及用于检测(例如筛查)结直肠癌的诊断性qPCR反应(例如在本文所述的方法中)，该诊断性qPCR反应包括人类DNA、聚合酶、用于扩增一个或多个相应甲基化基因座的一个或多个寡核苷酸引物对、以及可选的至少一种甲基化敏感限制性酶。

在多个方面，本发明的方法和组合物可以与本领域已知的生物标志物(例如美国专利10,006,925号中所公开的)组合使用。

定义

一个或一种：本文中的"一个"和"一种"是指文章中的一个或多于一个或一种(即至少一个或一种)的语法对象。举例来说，"一个要素"指的是一个或多于一个要素。

约：术语"约"当在本文中描述数值时，指的是在上下文中与所述数值类似的一个数值。通常，熟悉上下文的本领域技术人员会理解在该上下文中"约"所包含的差异的相对程度。例如，在一些实施方式中，例如如本文所述，术语"约"可以包括在所述数值的25％、20％、19％、18％、17％、16％、15％、14％、13％、12％、11％、10％、9％、8％、7％、6％、5％、4％、3％、2％、1％以内的数值范围，或者所述数值的百分数零头。

施用：如本文所用，术语"施用"通常是指将组合物施用至受试者或系统，以例如实现该组合物中所包含的或以其他方式递送的试剂的递送。

进展期腺瘤：如本文所用，术语"进展期腺瘤(advanced adenoma)"通常指的是指表现出相对异常、不受控制和/或自主生长的初步指征但尚未被归类为癌性改变的细胞。在结肠组织方面，"进展期腺瘤"是指显示出高等级发育异常迹象的肿瘤性生长，和/或带有任何类型的发育异常的大于等于10mm的尺寸、和/或绒毛状组织学类型、和/或锯齿状组织学类型。

试剂：如本文所用，术语"试剂"是指一种实体(例如小分子、肽、多肽、核酸、脂质、多糖、复合物、组合、混合物、系统或现象，例如热、电流、电场、磁力、磁场等)。

改善：如本文所用，术语"改善"是指预防、减少、缓和或改进受试者的状态。改善包括但不必须完全恢复或完全预防疾病、病症或状况。

扩增子或扩增子分子：如本文所用，术语"扩增子"或"扩增子分子"是指从模板核酸分子转录产生的核酸分子，或与之具有序列互补性的核酸分子，或包括任何此类核酸分子的双链核酸。转录可以从引物开始。

扩增：如本文所用，术语"扩增"是指使用模板核酸分子与各种试剂组合，从模板核酸分子产生进一步的核酸分子，这些进一步的核酸分子可以与模板核酸分子的一个片段相同或相似(例如至少70％相同，例如至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同)，和/或可以是其互补序列。

扩增反应混合物：如本文所用，术语"扩增反应混合物"或"扩增反应"是指模板核酸分子和足以扩增该模板核酸分子的试剂。

生物学样品：如本文所用，本文所述的术语"生物学样品"通常是指从所关注的生物源(例如组织或生物体或细胞培养物)获得或衍生的样品。在一些实施方式中，例如如本文所述，生物源是或包括生物体，例如动物或人类。在一些实施方式中，例如如本文所述，生物学样品是或包括生物组织或液体。在一些实施方式中，例如如本文所述，生物学样品可以是或包括细胞、组织或体液。在一些实施方式中，例如。如本文所述，生物学样品可以是或包括血液、血细胞、无细胞DNA、自由漂浮的核酸、腹水、活检样品、手术标本、含细胞的体液、痰、唾液、粪便、尿液、脑脊液、腹腔液、胸腔液、淋巴、妇科液、分泌物、排泄物、皮肤拭子、阴道拭子、口腔拭子、鼻腔拭子、洗液或灌洗液(例如导管灌洗液或支气管肺泡灌洗液)、吸液、刮片、骨髓。在一些实施方式中，例如如本文所述，生物学样品是或包括从单个受试者或多个受试者获得的细胞。样品可以是直接从生物源获得的"原始样品"，也可以是"经处理的样品"。生物学样品也可以被称为"样品"。

生物标志物：如本文所用，术语"生物标志物"与其在本领域的使用一致，是指一个实体，其存在、水平或形式与所关注的特定生物学事件或状态相关，使得认为它是该事件或状态的"标志物"。本领域的技术人员将理解，例如在DNA生物标志物的情况下，生物标志物可以是或包括基因座(例如一个或多个甲基化基因座)和/或基因座状态(例如一个或多个甲基化基因座的状态)。仅举几个生物标志物的实例，在一些实施方式中，例如如本文所述，生物标志物可以是或包括特定疾病、病症或状况的标志物，或者可以是特定疾病、病症或状况(例如在受试者中)能够发展、发生或重新发生的定性或定量概率的标志物。在一些实施方式中，例如如本文所述，生物标志物可以是或包括特定治疗结果的标志物，或其定性或定量概率。因此，在多种实施方式中，例如如本文所述，一个生物标志物可以对所关注的相关生物学事件或状态是预测性、预后性和/或诊断性的。生物标志物可以是任何化学类别的实体。例如，在一些实施方式中，如本文所述，生物标志物可以是或包括核酸、多肽、脂质、碳水化合物、小分子、无机试剂(例如金属或离子)或其组合。在一些实施方式中，例如如本文所述，生物标志物是细胞表面标志物。在一些实施方式中，例如如本文所述，生物标志物是细胞内的。在一些实施方式中，例如如本文所述，生物标志物出现在细胞外(例如，被分泌或以其他方式在细胞外产生或存在，例如，在体液中，例如血液、尿液、泪水、唾液、脑脊液等)。在一些实施例中，例如如本文所述，生物标志物是甲基化基因座的甲基化状态。在一些情况下，例如如本文所述，生物标志物可被称为"标志物"。

仅举生物标志物的一个实例，在一些实施方式中，例如如本文所述，该术语是指由基因编码产物的表达，其表达是特定肿瘤、肿瘤亚类、肿瘤阶段等的特征。替代地或额外地，在一些实施方式中，例如如本文所述，特定标志物的存在或水平可与特定信号传导途径的活性(或活性水平)相关，例如，信号传导途径的活性是特定类别肿瘤的特征。

本领域的技术人员将理解，生物标志物可以单独决定所关注的特定的生物学事件或状态，或者可以代表或有助于确定所关注的特定生物学事件或状态的统计学概率。本领域的技术人员将理解，标志物在与所关注的特定生物学事件或状态相关的特异性和/或灵敏度方面可能有区别。

血液组分：如本文所用，术语"血液组分"是指全血的任何组分，包括红血球、白血球、血浆、血小板、内皮细胞、间皮细胞、上皮细胞和无细胞DNA。血液组分还包括血浆的组分，包括蛋白、代谢物、脂质、核酸和碳水化合物，以及可存在于血液中的任何其他细胞，例如，由于怀孕、器官移植、感染、受伤或疾病而存在的细胞。

癌症：如本文所述，术语"癌症"、"恶性肿瘤"、"肿瘤"、"瘤"和"癌"可互换使用，指的是细胞表现或曾表现出相对异常、不受控制和/或自主生长的疾病、病症或状况，因此它们显示或曾显示出异常升高的增殖速率和/或异常的生长表型。在一些实施方式中，例如如本文所述，癌症可以包括一种或多种肿瘤。在一些实施方式中，例如如本文所述，癌症可以是或包括癌前(例如良性)、恶性、转移前、转移性和/或非转移性的细胞。在一些实施方式中，例如如本文所述，癌症可以是或包括实体瘤。在一些实施方式中，例如如本文所述，癌症可以是或包括血液学肿瘤。一般来说，本领域已知的不同类型的癌症的实例包括例如：结直肠癌；造血性癌，包括白血病、淋巴瘤(霍奇金氏和非霍奇金氏)、骨髓瘤和骨髓增生性病症；肉瘤，黑色素瘤，腺瘤，固体组织癌，口腔、咽喉、喉部和肺的鳞状细胞癌，肝癌；泌尿生殖系统癌症，例如前列腺、宫颈、膀胱、子宫和子宫内膜癌；以及肾细胞癌，骨癌，胰腺癌，皮肤癌，皮肤或眼内黑色素瘤，内分泌系统癌症，甲状腺癌症，甲状旁腺癌症，头颈部癌症，乳腺癌，胃肠道癌症和神经系统癌症；良性病变，例如乳头瘤；等等。

化疗剂：如本文所用，术语"化疗剂"与其在本领域的用法一致，是指一种或多种已知的或具有已知特性的、治疗或有助于治疗癌症的试剂。特别而言，化疗剂包括促凋亡剂、细胞抑制剂和/或细胞毒剂。在一些实施方式中，例如如本文所述，化疗剂可以是或包括烷化剂、蒽环类药物、细胞骨架破坏剂(例如微管靶向分子，例如紫杉烷、美坦辛及其类似物)、埃博霉素类、组蛋白去乙酰酶抑制剂(HDAC)、拓扑异构酶抑制剂(例如拓扑异构酶I和/或拓扑异构酶II的抑制剂)、激酶抑制剂、核苷酸类似物或核苷酸前体类似物、肽类抗生素、铂类试剂、维甲酸类、长春花生物碱和/或具有相关抗增殖活性的类似物。在一些特定的实施方式中，例如如本文所述，化疗剂可以是或包括放线菌素、全反式维甲酸、澳瑞他汀、阿扎胞苷、硫唑嘌呤、博莱霉素、硼替佐米、卡铂、卡培他滨、顺铂、氯丙嗪、环磷酰胺、姜黄素、阿糖胞苷、柔红霉素、多西紫杉醇、去氧氟尿苷、多柔比星、表柔比星、埃博霉素、依托泊苷、氟尿嘧啶、吉西他滨、羟基脲、伊达鲁比星、伊马替尼、伊立替康、梅坦辛和/或其类似物(例如DM1)、甲氯乙胺、巯基嘌呤、甲氨蝶呤、米托蒽醌、美登素、奥沙利铂、紫杉醇、培美曲塞、替尼泊苷、噻胍、拓扑替康、缬柔比星、长春碱、长春新碱、长春西碱、长春瑞滨或其组合。在一些实施方式中，例如如本文所述，可以在抗体-药物缀合物的背景下利用化疗剂。在一些实施方式中，例如如本文所述，化疗剂是选自以下组的抗体-药物缀合物中的化疗剂：hLL1-多柔比星、hRS7-SN-38、hMN-14-SN-38、hLL2-SN-38、hA20-SN-38、hPAM4-SN-38、hLL1-SN-38、hRS7-Pro-2-P-Dox、hMN-14-Pro-2-P-Dox、hLL2-Pro-2-P-Dox、hA20-Pro-2-P-Dox、hPAM4-Pro-2-P-Dox、hLL1-Pro-2-P-Dox、P4/D10-多柔比星、吉妥珠单抗-奥佐卡霉素、布仑妥昔单抗-维多汀、曲妥珠单抗-伊姆坦辛、伊诺妥珠单抗-奥佐卡霉素、格列巴瘤单抗-维多汀、SAR3419、SAR566658、BIIB015、BT062、SGN-75、SGN-CD19A、AMG-172、AMG-595、BAY-94-9343、ASG-5ME、ASG-22ME、ASG-16M8F、MDX-1203、MLN-0264、抗PSMAADC、RG-7450、RG-7458、RG-7593、RG-7596、RG-7598、RG-7599、RG-7600、RG-7636、ABT-414、IMGN-853、IMGN-529、伏塞妥珠单抗-镁佛多汀和洛伐妥单抗-美坦司汀。在一些实施方式中，例如如本文所述，化疗剂可以是或包括法尼基-硫代水杨酸(FTS)、4-(4-氯-2-甲基苯氧基)-N-羟基丁酰胺(CMH)、雌二醇(E2)、四甲氧基苯乙烯(TMS)、δ-托卡替尼、盐霉素或姜黄。

联合疗法：如本文所用，术语"联合疗法"是指对受试者施用两种或多种试剂或方案，使得这两种或多种试剂或方案共同治疗受试者的疾病、状况或病症。在一些实施方式中，例如如本文所述，两种或多种治疗剂或治疗方案可以同时、依次或以重叠的给药方案施用。本领域的技术人员将理解，联合疗法包括但不必需两种试剂或方案在单一组合中一起施用，也不要求在同一时间施用。

可比较：如本文所用，术语"可比较(comparable)"是指两个以上的条件、情况、试剂、实体、群体等的集合中的成员可能彼此不完全相同，但有足够的相似性以允许在它们之间进行比较，从而使本领域的技术人员将理解，可以根据观察到的差异或相似性而合理地得出结论。在一些实施方式中，例如如本文所述，可比较的条件、情况、试剂、实体、群体等的集合的特征通常在于多个基本相同的特征以及零个、一个或多个不同的特征。根据上下文，本领域的普通技术人员将理解需要何种程度的相同来使一个集合的成员是可比较的。例如，本领域的普通技术人员将理解，当特征在于足够数量和类型的基本相同的特征以保证合理的结论(即观察到的差异可以全部或部分归因于其不相同的特征)时，条件、情况、试剂、实体、群体等的集合的成员是彼此可比较的。

可检测部分：本文所用的术语"可检测部分(detectable moiety"是指任何可检测的元素、分子、官能团、化合物、片段或其他部分。在一些实施方式中，例如如本文所述，可检测部分单独提供或利用。在一些实施方式中，例如如本文所述，可检测部分与其他试剂联合(例如连接至其他试剂)提供和/或利用。可检测部分的实例包括但不限于各种配体、放射性核素(例如³H、¹⁴C、¹⁸F、¹⁹F、³²P、³⁵S、¹³⁵I、¹²⁵I、¹²³I、⁶⁴Cu、¹⁸⁷Re、¹¹¹In、⁹⁰Y、^99mTc、¹⁷⁷Lu、⁸⁹Zr等)、荧光染料、化学发光剂、生物发光剂、光谱可解析的无机荧光半导体纳米晶体(即量子点)、金属纳米颗粒、纳米簇、顺磁金属离子、酶、比色标记、生物素、地高辛配基、半抗原、以及可获得相应抗血清或单克隆抗体的蛋白质。

诊断：如本文所用，术语"诊断"是指确定受试者是否有或将要发展疾病、病症、状况或状态和/或其定性或定量概率。例如，在癌症的诊断中，诊断可以包括关于癌症的风险、类型、阶段、恶性程度或其他分类的确定。在一些情况下，例如如本文所述，诊断可以是或包括与预后和/或对一种或多种一般或特定的治疗剂或治疗方案的可能响应有关的确定。

诊断信息：如本文所使用的，术语"诊断信息"是指对提供诊断有用的信息。诊断信息可以包括但不限于生物标志物状态信息。

差异甲基化：如本文所用，术语"差异甲基化(differentially methylated)"是指在第一条件和第二条件下甲基化状态不同的甲基化位点。差异甲基化的甲基化位点可称为差异甲基化位点。在一些情况下，例如如本文所述，DMR由使用寡核苷酸引物(例如，选定用于扩增DMR或用于扩增扩增子中存在的所关注的DNA区域的一对寡核苷酸引物)扩增产生的扩增子定义。在一些情况下，例如如本文所述，DMR被定义为由一对寡核苷酸引物扩增的DNA区域，包括具有寡核苷酸引物序列或与之互补的序列的区域。在某些情况下，例如如本文所述，DMR被定义为由一对寡核苷酸引物扩增的DNA区域，不包括具有寡核苷酸引物序列或与之互补的序列的区域。如本文所使用的，具体提供的DMR可以通过相关基因的名称和起始位置的三位数字来明确识别，例如，在ALK的29921434位置开始的DMR可以被识别为ALK'434。

差异甲基化区域：如本文所用，术语"差异甲基化区域(differentiallymethylated region)"(DMR)是指包括一个或多个差异甲基化位点的DNA区域。在所关注的选定条件下，例如癌症状态下，包括更多数量或频率的甲基化位点的DMR可称为高甲基化DMR。在所关注的选定条件下，例如癌症状态下，包括更少数量或频率的甲基化位点的DMR可称为低甲基化DMR。作为结直肠癌的甲基化生物标志物的DMR可称为结直肠癌DMR。在一些情况下，例如如本文所述，DMR可以是单个核苷酸，该单个核苷酸是甲基化位点。在一些情况下，例如如本文所述，DMR的长度为至少10、至少15、至少20、至少24、至少50或至少75个碱基对。在一些情况下，例如如本文所述，DMR的长度小于1000、小于750、小于500、小于350、小于300或小于250个碱基对(例如，其中甲基化状态使用定量聚合酶链反应(qPCR)来确定，例如，甲基化敏感限制性酶定量聚合酶链反应(MSRE-qPCR))。在一些情况下，例如如本文所述，作为进展期腺瘤的甲基化生物标志物的DMR也可用于鉴定结直肠癌。

DNA区域：如本文所述，"DNA区域"是指一个较大的DNA分子的任何连续部分。本领域的技术人员将熟悉用于确定第一DNA区域和第二DNA区域是否在例如第一和第二DNA区域的序列相似性(例如，序列同一性或同源性)和/或背景(例如，第一和第二DNA区域的上游和/或下游的核酸的序列同一性或同源性)方面相对应的技术。

除本文另有规定，在人类中发现的或与人类有关的序列(例如，与人类DNA杂交的序列)是存在于、基于和/或源自通常被称为且本领域技术人员已知为智人(人类)基因组汇编GRCh38、hg38和/或Genome Reference Consortium Human Build 38的实例代表性人类基因组序列。本领域的技术人员将进一步理解，hg38的DNA区域可以通过已知的系统来参照，包括按照指定的编号识别特定的核苷酸位置或其范围。

剂量给药方案：如本文所用，术语"剂量给药方案"可指向受试者施用的一个或多个相同或不同的单位剂量组，通常包括多个单位剂量，其中每个单位剂量的施用与其他单位剂量的施用相隔一段时间。在多种实施方式中，例如如本文所述，一个或多个或所有单位剂量的剂量给药方案可以是相同的，也可以是不同的(例如，随时间增加，随时间减少，或根据受试者和/或医务工作者的决定进行调整)。在多种实施方式中，例如如本文所述，各剂量之间的一个或多个或所有的时间段可以是相同的，也可以是不同的(例如，随时间增加，随时间减少，或根据受试者和/或医务工作者的决定进行调整)。在一些实施方式中，例如如本文所述，给定的治疗剂具有推荐的剂量给药方案，其可以涉及一个或多个剂量。通常，上市药物的至少一种推荐的剂量给药方案是本领域的技术人员已知的。在一些实施方式中，例如如本文所述，当在相关群体中施用时，剂量给药方案与所需或有益的结果相关(即，是治疗性剂量给药方案)。

下游：如本文所用，术语"下游"是指第一DNA区域相对于第二DNA区域更接近于包括第一DNA区域和第二DNA区域的核酸的C端。

基因：如本文所用，术语"基因"是指单一DNA区域，例如，染色体中的单一DNA区域，其包括编码产物(例如，RNA产物和/或多肽产物)的编码序列，以及所有、一些或没有有助于调节编码序列的表达的DNA序列。在一些实施方式中，例如如本文所述，基因包括一个或多个非编码序列。在一些特定实施方式中，例如如本文所述，基因包括外显子和内含子序列。在一些实施方式中，例如如本文所述，基因包括一个或多个调控元件，例如，其可以控制或影响基因表达的一个或多个方面(例如，细胞类型特异性表达、可诱导的表达等)。在一些实施方式中，例如如本文所述，基因包括启动子。在一些实施方式中，例如如本文所述，基因包括(i)在编码序列上游延伸预定数量个核苷酸的DNA核苷酸和/或(ii)在编码序列下游延伸预定数量个核苷酸的DNA核苷酸。在多种实施方式中，例如如本文所述，预定数量个核苷酸可以是500bp、1kb、2kb、3kb、4kb、5kb、10kb、20kb、30kb、40kb、50kb、75kb或100kb。

同源性：如本文所用，术语"同源性"是指高分子之间的整体关联性，例如，核酸分子(例如DNA分子和/或RNA分子)和/或多肽分子之间。本领域的技术人员将理解，同源性可以由例如同一性百分比或同源性百分比(序列相似性)来定义。在一些实施方式中，例如如本文所述，如果高分子的序列至少有25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或99％相同，则认为它们彼此"同源"。在一些实施方式中，例如如本文所述，如果高分子的序列至少有25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或99％相似，则认为它们彼此"同源"。

杂交：如本文所用，"杂交"是指第一核酸与第二核酸的缔合，形成双链结构，这种缔合是通过核苷酸的互补配对发生的。本领域的技术人员将认识到，互补序列尤其能够杂交。在多种实施方式中，例如如本文所述，杂交可以发生在例如具有至少70％互补性的核苷酸序列之间，例如至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％互补性。本领域的技术人员将进一步理解，第一核酸和第二核酸的杂交是否发生，可以取决于各种反应条件。杂交可以发生的条件在本领域中是已知的。

低甲基化：如本文所用，术语"低甲基化(hypomethylation)"是指甲基化基因座的状态，在所关注的状态下，其与参照状态相比少至少一个甲基化核苷酸(例如，在结直肠癌中甲基化核苷酸比健康对照少至少一个)。

高甲基化：如本文所用，术语"高甲基化(hypermethylation)"是指甲基化基因座的状态，在所关注的状态下，其与参照状态相比多至少一个甲基化核苷酸(例如，在结直肠癌中甲基化核苷酸比健康对照多至少一个)。

同一性，相同：如本文所用，术语"同一性"和"相同"是指高分子之间(例如核酸分子(例如DNA分子和/或RNA分子)和/或多肽分子之间)的整体关联性。计算两条给定序列之间的同一性百分比的方法在本领域是已知的。两条核酸或多肽序列的同一性百分比的计算可以通过例如将两条序列(或一条或两条序列的互补序列)比对以达到最佳比较的目的(例如，可以在第一和/或第二序列中引入空位以达到最佳比对，并且可以忽略不相同的序列以达到比较目的)。然后比较对应位置的核苷酸或氨基酸。当第一序列中的一个位置被与第二序列中对应位置相同的残基(例如核苷酸或氨基酸)所占据时，那么这些分子在该位置是相同的。两条序列之间的同一性百分比是它们所共有的相同位置数的函数，可选地，也可以选择考虑空位数和每个空位的长度，可能需要引入这些空位来实现这两条序列的最佳比对。序列的比较和两条序列之间同一性百分比的确定可以通过计算算法来完成，例如BLAST(局部比对基本检索工具)。

"改进"、"增加"或"减少"：如本文所使用的，这些术语，或语法上可比较的比较性术语，表示相对于可比较的参照测量的值。例如，在一些实施方式中，例如如本文所述，使用所关注的试剂实现的评估值相对于使用可比较的参照试剂或不使用试剂时获得的评估值可以是"改进的"。替代性地或额外地，在一些实施方式中，例如如本文所述，在所关注的受试者或系统中的评估值相对于在同一受试者或系统中在不同条件下或在不同时间点(例如，在事件之前或之后，例如施用所关注的试剂之前或之后)获得的评估值或相对于在不同的可比较受试者中(例如，在不同于所关注的受试者或系统的可比较的受试者或系统中，在存在所关注的特定疾病、病症或状况的一个或多个指征的情况下，或在先前暴露于条件或试剂的情况下，等等)获得的评估值可以是"改进的"。在一些实施方式中，例如如本文所述，比较性术语指的是统计学相关的差异(例如，足以获得统计学相关性的普遍性和/或幅度的差异)。在给定背景下，本领域技术人员将意识到或将容易确定实现这种统计学显著性所需的或足够的差异程度和/或普遍性。

甲基化：如本文所用，术语"甲基化"包括以下任何位置的甲基化：(i)胞嘧啶的C5位；(ii)胞嘧啶的N4位；和(iii)腺嘌呤的N6位。甲基化还包括(iv)其他类型的核苷酸甲基化。被甲基化的核苷酸可以称为"甲基化核苷酸"或"甲基化核苷酸碱基"。在某些实施方式中，例如如本文所述，甲基化特指胞嘧啶残基的甲基化。在某些情况下，甲基化特指存在于CpG位点的胞嘧啶残基的甲基化。

甲基化测定：如本文所用，术语"甲基化测定"是指可用于确定甲基化基因座的甲基化状态的任何技术。

甲基化生物标志物：如本文所用，术语"甲基化生物标志物"是指是或包括至少一个甲基化基因座和/或至少一个甲基化基因座(例如高甲基化基因座)的甲基化状态的生物标志物。特别是，甲基化生物标志物是以一个或多个核酸基因座的甲基化状态在第一状态和第二状态(例如癌变状态和非癌变状态)之间的变化为特征的生物标志物。

甲基化基因座：如本文所用，术语"甲基化基因座"是指包括至少一个差异甲基化区域的DNA区域。在所关注的选定条件下(例如癌症状态下)包含更多数量或更高频率的甲基化位点的甲基化基因座可称为高甲基化基因座。在所关注的选定条件下(例如癌症状态下)包含更少数量或更低频率的甲基化位点的甲基化基因座可称为低甲基化基因座。在一些情况下，例如如本文所述，甲基化基因座的长度为至少10、至少15、至少20、至少24、至少50或至少75个碱基对。在一些情况下，例如如本文所述，甲基化基因座的长度小于1000、小于750、小于500、小于350、小于300、或小于250个碱基对(例如，甲基化状态使用定量聚合酶链反应(qPCR)、例如甲基化敏感限制性酶定量聚合酶链反应(MSRE-qPCR)来确定)。

甲基化位点：如本文所用，甲基化位点是指在至少一种状况下被甲基化的核苷酸或核苷酸位置。在其甲基化状态下，甲基化位点可称为经甲基化的位点。

甲基化状态：如本文所用，"甲基化状态"、"甲基化状况"或"甲基化谱"是指甲基化基因座内的甲基化位点处的甲基化的数量、频率或模式。因此，第一状态和第二状态之间的甲基化状态变化可以是或包括甲基化位点的数量、频率或模式的增加，或者可以是或包括甲基化位点的数量、频率或模式的减少。在多种情况下，甲基化状态的变化是甲基化值的变化。

甲基化值：如本文所用，术语"甲基化值"是指甲基化状态的数值表示，例如，以代表甲基化基因座的甲基化频率或比例的数值的形式。在一些情况下，例如如本文所述，甲基化值可以通过在用甲基化依赖性限制性酶对样品进行限制性消化后对样品中存在的完整核酸的量进行定量的方法来产生。在一些情况下，例如如本文所述，甲基化值可以通过在样品的亚硫酸氢盐反应后比较扩增曲线来产生。在一些情况下，例如如本文所述，甲基化值可以通过比较亚硫酸氢盐处理和未处理的核酸的序列来产生。在一些情况下，例如如本文所述，甲基化值是、包括或基于定量PCR结果。

核酸：如本文所述，在其最广泛的意义上，术语"核酸"是指并入或能够并入寡核苷酸链中的任何化合物和/或物质。在一些实施方式中，例如如本文所述，核酸是通过磷酸二酯键并入或能够并入寡核苷酸链的化合物和/或物质。从上下文可以清楚看出，在一些实施方式中，例如如本文所述，术语核酸是指单个的核酸残基(例如核苷酸和/或核苷)，而在一些实施方式中，例如如本文所述，其是指包含多个单个核酸残基的多核苷酸链。核酸可以是或包括DNA、RNA或其组合。核酸可以包括天然核酸残基、核酸类似物和/或合成残基。在一些实施方式中，例如如本文所述，核酸包括天然核苷酸(例如腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)。在一些实施方式中，例如如本文所述，核酸是或包括一个或多个核苷酸类似物(例如2-氨基腺苷、2-硫代嘧啶、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基胞苷、C-5丙炔基尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基尿苷、C5-丙炔基胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、0(6)-甲基鸟苷、2-硫代胞苷、甲基化碱基、嵌入碱基及其组合)。

在一些实施方式中，例如如本文所述，核酸具有编码功能性基因产物(例如RNA或蛋白)的核苷酸序列。在一些实施例中，例如如本文所述，核酸包括一个或多个内含子。在一些实施方式中，例如如本文所述，核酸包括一个或多个基因。在一些实施方式中，例如如本文所述，核酸通过以下一种或多种方式制备：从天然来源分离、基于互补模板(体内或体外)通过聚合进行酶促合成、在重组细胞或系统中复制、以及化学合成。

在一些实施方式中，例如如本文所述，核酸类似物与核酸的区别在于它不利用磷酸二酯骨架。例如，在一些实施方式中，例如如本文所述，核酸可以包括一个或多个肽核酸，这些核酸是本领域已知的，其骨架中具有肽键而不是磷酸二酯键。替代性地或额外地，在一些实施方式中，例如如本文所述，核酸具有一个或多个硫代磷酸酯和/或5'-N-磷酰胺键而不是磷酸二酯键。在一些实施方式中，例如如本文所述，与天然核酸中的糖相比，核酸包括一种或多种改性糖(例如2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖和己糖)。

在一些实施方式中，例如如本文所述，核酸是或包括至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000个或更多个残基。在一些实施方式中，例如如本文所述，核酸部分或全部是单链的，或部分或全部是双链的。

核酸检测测定：如本文所述，术语"核酸检测测定"是指确定所关注的核酸的核苷酸组成的任何方法。核酸检测测定包括但不限于：DNA测序方法、基于聚合酶链反应的方法、探针杂交方法、连接酶链反应等。

核苷酸：如本文所用，术语"核苷酸"是指多核苷酸(例如DNA和/或RNA聚合物)的结构组分或构建单元。核苷酸包括碱基(例如腺嘌呤、胸腺嘧啶、尿嘧啶、鸟嘌呤或胞嘧啶)和糖分子以及至少一个磷酸酯基。如本文所用，核苷酸可以是甲基化的核苷酸或未甲基化的核苷酸。本领域的技术人员将理解，核酸术语，例如"基因座"或"核苷酸"，既可以指单个核酸分子的基因座或核苷酸，也可以指代表该基因座或核苷酸(例如，具有相同的核酸序列和/或核酸序列背景或具有基本相同的核酸序列和/或核酸背景)的多个核酸中的基因座或核苷酸的累积群体(例如样品中的多个核酸和/或代表受试者的多个核酸)。

寡核苷酸引物：如本文所用，术语寡核苷酸引物或引物是指已用于、能够用于或将用于从模板核酸分子产生扩增子的核酸分子。在允许转录的条件下(例如，在核苷酸和DNA聚合酶的存在下，在合适的温度和pH值下)，寡核苷酸引物可以提供从寡核苷酸引物所杂交的模板开始转录的点。通常，寡核苷酸引物是长度为5到200个核苷酸的单链核酸。本领域的技术人员将理解，从模板核酸分子产生扩增子的最佳引物长度可以因条件而变化，这些条件包括温度参数、引物成分和转录或扩增方法。本文所述的一对寡核苷酸引物是指一组分别与模板双链核酸分子的第一链和第二链互补的两个寡核苷酸引物。相对于模板核酸链而言，一对寡核苷酸引物的第一和第二成员可以分别称为"正向"寡核苷酸引物和"反向"寡核苷酸引物，其中正向寡核苷酸引物能够与模板核酸链的互补核酸链杂交，反向寡核苷酸引物能够与模板核酸链杂交，并且正向寡核苷酸引物相对于模板核酸链的位置是反向寡核苷酸引物序列相对于模板核酸链的5′。本领域技术人员可以理解，将第一和第二寡核苷酸引物分别标识为正向和反向寡核苷酸引物是任意的，因为这些标识取决于是利用给定的核酸链还是其互补链作为模板核酸分子。

重叠：术语"重叠"在本文使用时是指两个DNA区域，其各自包含与另一区域中相同长度的子序列基本相同的子序列(例如，两个DNA区域有一个共同的子序列)。“基本相同”是指这两个相同长度的子序列的差异小于给定的碱基对数。在某些情况下，例如如本文所述，每个子序列的长度至少为20个碱基对，它们相差少于4、3、2或1个碱基对(例如，两个子序列具有至少80％、至少85％、至少90％、至少95％的相似性、至少97％的相似性、至少98％的相似性或至少99.5％的相似性)。在某些情况下，例如如本文所述，每个子的长度至少为24个碱基对，它们相差小于5、4、3、2或1个碱基对(例如，两个子序列具有至少80％、至少85％、至少90％、至少95％相似性、至少97％相似性、至少98％相似性、至少99％相似性或至少99.5％相似性)。在某些情况下，例如如本文所述，每个子序列的长度至少为50个碱基对，它们相差小于10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％、至少85％、至少90％、至少95％相似性、至少97％相似性、至少98％相似性、至少99％相似性或至少99.5％相似性)。在某些情况下，例如如本文所述，每个子序列的长度至少为100个碱基对，它们相差小于20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％、至少85％、至少90％、至少95％相似性、至少97％相似性、至少98％相似性或至少99.5％相似性)。在某些情况下，例如如本文所述，每个子序列的长度至少为200个碱基对，它们相差小于40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％、至少85％、至少90％、至少95％相似性、至少97％相似性、至少98％相似性、至少99％相似性或至少99.5％相似性)。在某些情况下，例如如本文所述，每个子序列的长度至少为250个碱基对，它们相差小于50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％、至少85％、至少90％、至少95％相似性、至少97％相似性、至少98％相似性、至少99％相似性或至少99.5％相似性)。在某些情况下，例如如本文所述，每个子序列的长度至少为300个碱基对，它们相差小于60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％、至少85％、至少90％、至少95％相似性、至少97％相似性、至少98％相似性、至少99％相似性或至少99.5％相似性)。在某些情况下，例如如本文所述，每个子序列的长度至少为500个碱基对，它们相差小于100、60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％、至少85％、至少90％、至少95％的相似性、至少97％的相似性、至少98％的相似性、至少99％的相似性、或至少99.5％的相似性)。在某些情况下，例如如本文所述，每个子序列的长度至少为1000个碱基对，它们相差小于200、100、60、50、40、30、20、15、10、9、8、7、6、5、4、3、2或1个碱基对(例如，两个子序列具有至少80％、至少85％、至少90％、至少95％的相似性、至少97％的相似性、至少98％的相似性、至少99％的相似性、或至少99.5％的相似性)。在某些情况下，例如如本文所述，两个DNA区域的第一区域的子序列可以包括两个DNA区域的第二区域的全部(或反之)(例如，共同子序列可以包含任一或两个区域的全部)。

药物组合物：如本文所使用的，术语"药物组合物"是指将活性剂与一种或多种药学上可接受的载体一起配制成的组合物。在一些实施方式中，例如如本文所述，活性剂以适合施用至受试者的单位剂量的量存在，例如，在施用给相关人群时显示出达到预定治疗效果的统计学显著概率的治疗方案中。在一些实施方式中，例如如本文所述，药物组合物可以配制成用于施用的特定形式(例如，固体形式或液体形式)，和/或可以专门适用于例如：口服施用(例如，作为浸渍剂(水溶液或非水溶液或悬浮液)、片剂、胶囊、推注剂、粉末、颗粒、糊剂等，其可以专门为例如含服、舌下或全身吸收而配制)；肠胃外施用(例如，通过皮下、肌肉、静脉或硬膜外注射，例如，作为无菌溶液或悬浮液，或缓释制剂等)；局部涂药(例如，作为药膏、软膏、贴片或喷雾剂应用于例如皮肤、肺或口腔)；阴道内或直肠内施用(例如，作为子宫托、栓剂、药膏或泡沫)；眼部施用；鼻腔或肺部施用，等等。

药学上可接受：如本文所使用的，术语"药学上可接受"适用于配制本文所披露的组合物所用的一种或多种或所有成分，意味着每种成分必须与组合物的其他成分相容，并且对接受者无害。

药学上可接受的载体：如本文所用，术语"药学上可接受的载体"是指药学上可接受的材料、组合物或溶媒，例如液体或固体填充物、稀释剂、赋形剂或溶剂封装材料，其有利于配制和/或改变试剂(例如药学试剂)的生物利用度。可以作为药学上可接受的载体的材料的一些实例包括：糖类，里如乳糖、葡萄糖和蔗糖；淀粉，例如玉米淀粉和马铃薯淀粉；纤维素及其衍生物，例如羧甲基纤维素钠、乙基纤维素和醋酸纤维素；粉末状黄蓍胶；麦芽；明胶；滑石；赋形剂，例如可可脂和栓剂蜡；油，例如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和大豆油；二醇类，例如丙二醇；多元醇，例如甘油、山梨醇、甘露醇和聚乙二醇；酯类，例如油酸乙酯和月桂酸乙酯；琼脂；缓冲剂，例如氢氧化镁和氢氧化铝；藻酸；无热原水；等渗盐水；林格氏溶液；乙醇；pH缓冲溶液；聚酯、聚碳酸酯和/或聚酸酐；以及药学制剂中使用的其他无毒相容性物质。

预防：本文中与疾病、病症或状况的发生相关使用的术语"预防"是指降低患该疾病、病症或状况的风险；延迟该疾病、病症或状况的发作；延迟该疾病、病症或状况的一个或多个特征或症状的发作；和/或减少该疾病、病症或状况的一个或多个特征或症状的频率和/或严重程度。预防可以指对特定受试者的预防，也可以指对受试者群体的统计学影响。当疾病、病症或状况的发作已被延迟了预定的时间段时，可以认为预防是完全的。

探针：如本文所用，术语"探针"是指能够与互补性靶标杂交的单链或双链核酸分子，并包括可检测部分。在某些情况下，如本文所述，探针是限制性消化产物或合成的核酸，例如通过重组或扩增产生的核酸。在一些情况下，例如如本文所述，探针是在检测、鉴定和/或分离目标序列(例如基因序列中)有用的捕获探针。在多种情况下，例如如本文所述，探针的可检测部分可以是例如酶(例如，ELISA，以及基于酶的组织化学测定)、荧光部分、放射性部分或与发光信号相关的部分。

预后：如本文所用，术语"预后"是指确定至少一个可能的未来结果或事件的定性或定量概率。如本文所用，预后可以是对受试者的疾病、病症或状况(例如癌症)的可能进程的确定，关于受试者的寿命预期的确定，或关于对疗法(例如特定疗法)的响应性的确定。

预后信息：如本文所用，术语"预后信息"是指对提供预后有用的信息。预后信息可以包括但不限于生物标志物状态信息。

启动子：如本文所用，"启动子"可指DNA调控区域，其直接或间接地(例如通过启动子结合的蛋白质或物质)与RNA聚合酶结合，并参与编码序列的转录的启动。

参照物：如本文所使用的，其描述的是所比较的标准或对照。例如，在一些实施方式中，如本文所述，将所关注的试剂、受试者、动物、个体、群体、样品、序列或数值与参照或对照试剂、受试者、动物、个体、群体、样品、序列或数值进行比较。在一些实施方式中，例如如本文所述，参照物或其特征的测试和/或确定基本上与所关注的样品中的特征的测试或确定同时进行。在一些实施方式中，例如如本文所述，参照物是历史参照物，可选地实施在有形介质中。通常，本领域技术人员将理解，参照物是在与评估中的条件或环境(例如，针对样品)相仿的条件和环境下确定或表征的。本领域的技术人员将理解何时有足够的相似性来证明对特定的可能参照物或对照的信赖和/或比较。

风险：如本文中针对疾病、病症或状况所使用的，术语"风险"是指特定个体发展疾病、病症或状况的定性或定量概率(无论是以百分比或其他方式表示)。在一些实施方式中，例如如本文所述，风险被表示为百分比。在一些实施方式中，例如如本文所述，风险是等于或大于0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100％的定性或定量概率。在一些实施方式中，例如如本文所述，风险被表示为相对于参照风险或水平的定性或定量风险水平，或是归因于参照物的相同结果的风险。在一些实施方式中，例如如本文所述，与参照样品相比，相对风险增加至或减少1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9、10倍或更多。

样品：如本文所使用的，术语"样品"通常是指获自或源自所关注的来源的材料的等分试样。在一些实施方式中，例如如本文所述，所关注的来源是一个生物或环境来源。在一些实施方式中，例如如本文所述，样品是直接获自所关注的来源的"原始样品"。在一些实施方式中，例如如本文所述，从上下文中可以清楚看出，术语"样品"是指通过处理原始样品(例如，通过去除原始样品的一种或多种成分和/或向原始样品中添加一种或多种试剂)而获得的制备物。这样的"经处理的样品"可以包括例如从样品中提取出的细胞、核酸或蛋白，或通过对原始样品进行技术处理而获得，例如核酸的扩增或逆转录、某些成分的分离和/或纯化等。

在某些情况下，例如如本文所述，经处理的样品可以是已扩增(例如，预扩增)的DNA样品。因此，在多种情况下，例如如本文所述，确定的样品可以指样品的原始形式或样品的加工形式。在一些情况下，例如如本文所述，经酶解的DNA样品可以指原始的酶解DNA(酶解的直接产物)，或指经进一步处理的样品，例如经过扩增步骤(例如中间扩增步骤，如预扩增)和/或过滤步骤、纯化步骤或修饰样品以促进下一步的步骤，例如，在确定甲基化状态(例如，DNA的原始样品的甲基化状态和/或DNA在其原始来源环境中存在时的甲基化状态)的过程中。

筛查：如本文所用，术语"筛查"是指任何旨在产生诊断信息和/或预后信息的方法、技术、过程或工作。因此，本领域的技术人员可以理解，术语筛查包括确定个体是否患有、可能患有或发展、或有风险患有或发展疾病、病症或状况(例如结直肠癌)的方法、技术、过程或工作。

特异性：如本文所用，生物标志物的"特异性"是指以不存在所关注的事件或状态为特征的样品的百分比，对于这些样品，生物标志物的测量准确地表明不存在所关注的所述事件或状态(真阴性率)。在多种实施方式中，例如如本文所述，阴性样品的表征独立于生物标志物，而可以通过任何相关措施来实现，例如本领域技术人员已知的任何相关措施。因此，特异性反映了当在不以所关注的事件或状态为特征的样品中测量时，生物标志物将检测到不存在所关注的该事件或状态的概率。在所关注的事件或状态是结直肠癌的特定实施方式中，例如如本文所述，特异性是指生物标志物在不具有结直肠癌的受试者中检测到不存在结直肠癌的概率。结直肠癌的不存在可以通过例如组织学来确定。

灵敏度：如本文所使用的，生物标志物的"灵敏度"是指以存在所关注的事件或状态为特征的样品的百分比，对于这些样品，生物标志物的测量准确地表明存在所关注的所述事件或状态(真阳性率)。在多种实施方式中，例如如本文所述，阳性样品的表征独立于生物标志物，而可以通过任何相关措施来实现，例如本领域技术人员已知的任何相关措施。因此，灵敏度反映了当在以存在所关注的事件或状态为特征的样品中测量时，生物标志物将检测到存在所关注的该事件或状态的概率。在所关注的事件或状态是结直肠癌的特定实施方式中，例如如本文所述，灵敏度是指生物标志物在患有结直肠癌的受试者中检测到存在结直肠癌的概率。结直肠癌的存在可以通过例如组织学来确定。

实体瘤：如本文所用，术语"实体瘤"是指包括癌细胞的异常组织块。在多种实施方式中，例如如本文所述，实体瘤是或包括不包含囊肿或液体区域的异常组织块。在一些实施方式中，例如如本文所述，实体瘤可以是良性的；在一些实施方式中，实体瘤可以是恶性的。实体瘤的实例包括癌、淋巴瘤和肉瘤。在一些实施方式中，例如如本文所述，实体瘤可以是或包括肾上腺、胆管、膀胱、骨、脑、乳房、宫颈、结肠、子宫内膜、食道、眼、胆囊、胃肠道、肾脏、喉、肝脏、肺、鼻腔、鼻咽、口腔、卵巢、阴茎、垂体、前列腺、视网膜、唾液腺、皮肤、小肠、胃、睾丸、胸腺、甲状腺、子宫、阴道和/或外阴的肿瘤。

癌症的分期：如本文所用，术语"癌症的分期"是指对癌症进展水平的定性或定量评估。在一些实施方式中，例如如本文所述，用于确定癌症分期的标准可以包括但不限于癌在身体中的位置、肿瘤大小、癌是否已扩散到淋巴结、癌是否已扩散到身体的一个或多个不同部位等中的一项或多项。在一些实施方式中，例如如本文所述，可以使用所谓的TNM系统对癌症进行分期，根据该系统，T指的是主要肿瘤(通常称为原发肿瘤)的大小和范围；N指的是具有癌的附近淋巴结数量；M指的是癌是否已经转移。在一些实施方式中，例如如本文所述，癌症可以被称为0期(存在异常细胞，但没有扩散到附近的组织，也称为原位癌或CIS；CIS不是癌，但它可以变成癌)，I-III期(存在癌；该数字越大，肿瘤越大，且越多地扩散到附近组织中)，或IV期(癌已扩散到身体的远端)。在一些实施方式中，例如如本文所述，癌症可以被分配到选自以下组的分期：原位(存在异常细胞，但未扩散到附近的组织)；局部(癌限于其开始的地点，没有已扩散的迹象)；区域(癌已经扩散到附近的淋巴结、组织或器官)：远端(癌已经扩散到身体的远端)；和未知(没有足够的信息来确定癌症分期)。

易感：对疾病、病症或状况"易感"的个体有风险患该疾病、病症或状况。在一些实施方式中，例如如本文所述，对疾病、病症或状况易感的个体不显示该疾病、病症或状况的任何症状。在一些实施方式中，例如如本文所述，对疾病、病症或状况易感的个体尚未被诊断出患有该疾病、病症和/或状况。在一些实施方式中，例如如本文所述，对疾病、病症或状况易感的个体是指已暴露于与该疾病、病症或状况的发展相关的条件或呈现出与该疾病、病症或状况的发展相关的生物标志物状态(例如甲基化状态)的个体。在一些实施方式中，例如如本文所述，发展疾病、病症和/或状况的风险是基于人群的风险(例如，患疾病、病症或状况的个人的家庭成员)。

受试者：如本文所使用的，术语"受试者"指的是生物体，通常是哺乳动物(例如人类)。在一些实施方式中，例如如本文所述，受试者患有疾病、病症或状况。在一些实施方式中，例如如本文所述，受试者对疾病、病症或状况易感。在一些实施方式中，例如如本文所述，受试者表现出疾病、病症或状况的一种或多种症状或特征。在一些实施方式中，例如如本文所述，受试者没有患疾病、病症或状况。在一些实施方式中，例如如本文所述，受试者未显示疾病、病症或状况的任何症状或特征。在一些实施方式中，例如如本文所述，受试者是对疾病、病症或状况具有一种或多种易感性特征或风险特征的人。在一些实施方式中，例如如本文所述，受试者是患者。在一些实施方式中，例如如本文所述，受试者是已对其进行过诊断和/或已对其实施过疗法的个体。在某些情况下，例如如本文所述，人类受试者可以互换地称为"个体"。

治疗剂：如本文所述，术语"治疗剂"是指对受试者施用时引起所需的药理学效应的任何试剂。在一些实施方式中，例如如本文所述，如果试剂在适当的群体中表现出统计学显著效果，则认为其是治疗剂。在一些实施方式中，例如如本文所述，适当的群体可以是模式生物体群体或人类群体。在一些实施方式中，例如如本文所述，适当的群体可以通过各种标准来定义，例如某个年龄组、性别、遗传背景、预先存在的临床状况等。在一些实施方式中，例如如本文所述，治疗剂是可用于治疗疾病、病症或状况的物质。在一些实施方式中，例如如本文所述，治疗剂是已被或要求被政府机构批准然后才能上市供人类使用的试剂。在一些实施方式中，例如如本文所述，治疗剂是需要医疗处方来对人类施用的试剂。

治疗有效量：如本文所述，术语"治疗有效量"是指产生施用所需效果的量。在一些实施方式中，例如如本文所述，该术语指的是当按照治疗性给药方案给患有或易患疾病、病症或状况的群体施用时，足以治疗该疾病、病症或状况的量。本领域的普通技术人员将理解，术语治疗有效量实际上并不要求在特定个体中实现成功的治疗。相反，治疗有效量可以是当给需要这种治疗的个体施用时，在显著数量的受试者中提供特定的所需药理学响应的量。在一些实施方式中，例如如本文所述，提及治疗有效量可以是指在一个或多个特定组织(例如，受疾病、病症或状况影响的组织)或液体(例如，血液、唾液、血清、汗液、眼泪、尿液等)中测量的量。本领域的普通技术人员会理解，在一些实施方式中，治疗有效量的特定试剂可以以单剂量配制和/或施用。在一些实施方式中，例如如本文所述，治疗有效的试剂可以以多个剂量配制和/或施用，例如，作为多剂量给药方案的一部分。

治疗：如本文所用，术语“治疗”是指施用部分或完全减轻、改善、缓解、抑制、延迟特定疾病、病症或状况的发作、降低特定疾病、病症或状况的严重程度和/或降低特定疾病、病症或状况的一种或多种症状、特征和/或原因的发生率，或为实现任何此类结果的目的而施用。在一些实施方式中，例如如本文所述，此类治疗可以针对不表现出相关疾病、病症或状况的迹象的受试者和/或仅表现出疾病、病症或状况的早期征兆的受试者。作为选择或另外，此类治疗可以针对表现出相关疾病、病症和/或状况的一种或多种确定迹象的受试者。在一些实施方式中，例如如本文所述，治疗可以针对已被诊断患有相关疾病、病症和/或状况的受试者。在一些实施方式中，例如如本文所述，治疗可以针对已知具有一种或多种易感因素的受试者，所述一种或多种易感因素与相关疾病、病症或状况的发展风险增加在统计学上相关。在各种实例中，治疗是针对癌症的

上游：如本文所用，如本文所用，术语“上游”是指第一DNA区相对于第二DNA区更靠近包括第一DNA区和第二DNA区的核酸的N末端。

单位剂量：如本文所用，术语“单位剂量(unit dose)”是指作为单一剂量和/或以药物组合物的物理离散单位施用的量。在许多实施方式中，例如如本文所述，单位剂量包含预定量的活性剂。在一些实施方式中，例如如本文所述，单位剂量包含完整的单一剂量的试剂。在一些实施方式中，例如如本文所述，施用多于一个单位剂量以实现总单一剂量。在一些实施方式中，例如如本文所述，需要或预期需要施用多个单位剂量，以实现指定效果。单位剂量可以例如是一定体积的含有预定量的一种或多种治疗部分的液体(例如，可接受的载体)、预定量的一种或多种固体形式的治疗部分、缓释制剂或包含预定量的一种或多种治疗部分的递送装置，等等。应当理解，单位剂量可以存在于包括除治疗剂之外的多种组分中的任一种的制剂中。例如，可以包括可接受的载体(例如，药学上可接受的载体)、稀释剂、稳定剂、缓冲剂、防腐剂等。本领域技术人员将理解，在许多实施方式中，例如如本文所述，特定治疗剂的总适当日剂量可以包括一部分或多个单位剂量，并且可以例如由执业医师在合理的医学判断范围内决定。在一些实施方式中，例如如本文所述，任何特定受试者或生物体的特定有效剂量水平可取决于多种因素，包括所治疗的病症和病症的严重程度；所用特定活性化合物的活性；采用的特定成分；受试者的年龄、体重、一般健康状况、性别和饮食；施用时间，使用的特定活性化合物的排泄率；治疗持续时间；与使用的特定化合物组合或同时使用的药物和/或其他疗法，以及医学领域众所周知的类似因素。

未甲基化：在这里，如本文所用，术语“未甲基化”和“非甲基化”可互换使用，是指鉴定的DNA区不包括甲基化核苷酸。

变体：如本文所用，术语“变体(variant)”是指与参照实体显示显著结构同一性但与参照实体相比在一个或多个化学部分的存在、不存在或水平上与参照实体在结构上不同的实体。在一些实施方式中，例如如本文所述，变体在功能上也不同于其参照实体。一般而言，特定实体是否被适当地视为参照实体的“变体”取决于其与参照实体的结构同一性程度。变体可以是与参照相当但不完全相同的分子。例如，变体核酸可以在核苷酸序列的一个或多个差异处不同于参照核酸。在一些实施方式中，例如如本文所述，变体核酸显示与参照核酸的总体序列同一性为至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％或99％。在许多实施方式中，例如如本文所述，如果所关注的核酸具有与参照的序列相同但在特定位置有少量序列改变的序列，则所关注的核酸被认为是参照核酸的“变体”。在一些实施方式中，例如如本文所述，与参照相比，变体具有10、9、8、7、6、5、4、3、2或1个取代的残基。在一些实施方式中，例如如本文所述，与参照相比，变体具有不超过5、4、3、2或1个残基添加、取代或缺失。在各种实施方式中，例如如本文所述，添加、取代或缺失的数目少于约25、约20、约19、约18、约17、约16、约15、约14、约13、约10、约9、约8个、约7个、约6个，并且通常少于约5个、约4个、约3个或约2个残基。

附图说明

参考以下结合附图的描述，本公开的上述及其他目的、方面、特征和优点将变得更加明显和更好地理解，在附图中：

图1是基于MSRE-qPCR的甲基化标志物分析的工作流程示意图。

图2是初始标志物集的PCA图，表明疾病组之间的分离。

图3：血浆中的甲基化标志物的检测。针对对照组(健康+增生性息肉+GID)样品(蓝色)和AA+CRC样品(红色)的12个标志物标绘出的45-Ct值。更高的45-Ct值对应于AA+CRC样品中更高的甲基化状态。

图4：血浆中甲基化标志物的检测。针对对照组(健康+增生性息肉+GID)样品(蓝色)和AA组样品(红色)的3个标志物标绘出的45-Ct值。更高的45-Ct值对应于AA样品中更高的甲基化状态。

图5：血浆中甲基化标志物的检测。针对对照组(健康+增生性息肉+GID)样品(红色)和CRC样品(蓝色)的18种标志物标绘出的45-Ct值。更高的45-Ct值对应于CRC样品中更高的甲基化状态。

具体实施方式

筛选进展期腺瘤和/或结直肠癌(例如早期结直肠癌)的方法

需要改进的检测(例如筛查)进展期腺瘤和/或结直肠癌的方法，包括用于早期诊断结直肠癌的筛查。尽管建议对个体(例如50岁以上)进行筛查，但结直肠癌筛查计划通常是无效的或不令人满意的。改进的结直肠癌筛查可改善诊断并降低结直肠癌死亡率。

DNA甲基化(例如，高甲基化或低甲基化)可以激活或失活基因，包括影响癌症发展的基因。因此，例如，高甲基化可使一种或多种通常用于抑制癌症的基因失活，从而导致或促进样品或受试者中的癌症发展。

本公开包括下述发现，对于本文提供的一个或多个甲基化基因座的甲基化状态，和/或本文提供的一个或多个DMR的甲基化状态，和/或本文提供的一个或多个甲基化位点的甲基化状态的确定，提供例如具有高度灵敏度和/或特异性的对进展期腺瘤和/或结直肠癌(例如早期结直肠癌)的筛查。本公开提供包括或涉及进展期腺瘤和/或结直肠癌甲基化生物标志物的组合物和方法，其单独地或在包含两种以上甲基化生物标志物的各种组中以高度特异性和/或灵敏度提供对进展期腺瘤和/或结直肠癌(例如早期结直肠癌)的筛查。

在多种实施方式中，本公开的结直肠癌甲基化生物标志物选自是或包括表1中所列的DMR的甲基化基因座。

表1：DMR列表，与对照相比，发现其在结直肠癌和/或进展期腺瘤患者的血液中具有显著改变的甲基化谱。

表1的每一行显示出：对于特定的DMR，相关的(人类)染色体，开始和结束的位置，用于扩增DMR序列的正向和反向寡核苷酸引物，DMR序列，和关联基因(如果确定)。

为避免任何疑问，本文提供的任何甲基化生物标志物尤其可以是或被包括在进展期腺瘤和/或结直肠癌(例如早期结直肠癌)甲基化生物标志物中。

在一些实施方式中，所述甲基化生物标志物可以是或包括单个甲基化基因座。在一些实施方式中，甲基化生物标志物可以是或包括两个以上甲基化基因座。在一些实施方式中，甲基化生物标志物可以是或包括单个差异甲基化区域(DMR)(例如，(i)选自表1所列的DMR，(ii)包含选自表1所列的DMR的DMR，(iii)与选自表1所列的一个或多个DMR重叠的DMR，或(iv)是选自表1所列的DMR的一部分的DMR，例如，是该DMR的至少2％、至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、或至少95％)。在一些实施方式中，甲基化基因座可以是或包括两个以上DMR(例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或更多个选自表1所列的DMR，或2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或更多个各自重叠于或包含选自表1所列的DMR的DMR)。在一些实施方式中，甲基化生物标志物可以是或包括单个甲基化位点。在其他实施方式中，甲基化生物标志物可以是或包括两个以上甲基化位点。在一些实施方式中，甲基化基因座可以包括两个以上DMR并且进一步包括与一个或多个所包括的DMR相邻的DNA区。

在一些情况下，甲基化基因座是或包括基因，例如表1中提供的基因。在一些情况下，甲基化基因座是或包括基因的一部分，例如表1中提供的基因的一部分。在一些情况下，甲基化基因座包括但不限于基因的经鉴定核酸边界。

在一些情况下，甲基化基因座是或包括基因的编码区，例如表1中提供的基因的编码区。在一些情况下，甲基化基因座是或包括基因的编码区的一部分，例如，表1中提供的基因的编码区的一部分。在一些情况下，甲基化基因座包括但不限于基因编码区的经鉴定核酸边界。

在一些情况下，甲基化基因座是或包括基因的启动子和/或其他调控区，例如表1中提供的基因的启动子和/或其他调控区。在一些情况下，甲基化基因座是或包括基因的启动子和/或调控区的一部分，例如表1中提供的基因的启动子和/或调控区的一部分。在一些情况下，甲基化基因座包括但不限于基因的启动子和/或其他调控区的经鉴定核酸边界。在一些实施方式中，甲基化基因座是或包括高CpG密度启动子，或其一部分。

在一些实施方式中，甲基化基因座是或包括非编码序列。在一些实施方式中，甲基化基因座是或包括一个或多个外显子和/或一个或多个内含子。

在一些实施方式中，甲基化基因座包括在编码序列上游延伸预定数量的核苷酸的DNA区，和/或在编码序列下游延伸预定数量的核苷酸的DNA区。在各种情况下，上游和/或下游的预定数量的核苷酸是或包括例如500bp、1kb、2kb、3kb、4kb、5kb、10kb、20kb、30kb、40kb、50kb、75kb或100kb。本领域技术人员将理解，能够影响编码序列表达的甲基化生物标志物通常可以在编码序列上游和/或下游的任何这些距离内。

本领域技术人员将理解，鉴定为甲基化生物标志物的甲基化基因座不必在单个实验、反应或扩增子中进行测试。鉴定为结直肠癌甲基化生物标志物的单个甲基化基因座可以例如以下述方法测试，所述方法包括单独扩增甲基化基因座内的一个或多个不同或重叠DNA区(或提供足以扩增甲基化基因座内的一个或多个不同或重叠DNA区的寡核苷酸引物和条件)。本领域技术人员将进一步理解，不需要分析被鉴定为甲基化生物标志物的甲基化基因座的每个核苷酸的甲基化状态，也不需要分析存在于甲基化基因座内的每个CpG。相反，可以例如通过分析甲基化基因座内的单个DNA区，例如通过分析甲基化基因座内的单个DMR，来分析作为甲基化生物标志物的甲基化基因座。

本公开的DMR可以是甲基化基因座或包括甲基化基因座的一部分。在一些情况下，DMR是具有例如长度为1bp至5000bp的甲基化基因座的DNA区。在各种实施方式中，DMR是具有长度等于或小于5000bp、4000bp、3000bp、2000bp、1000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp的甲基化基因座的DNA区。在一些实施方式中，DMR的长度为1bp、2bp、3bp、4bp、5bp、6bp、7bp、8bp或9bp。

甲基化生物标志物，包括但不限于本文提供的甲基化基因座和DMR，可以包括至少一个作为进展期腺瘤和/或结直肠癌(例如早期结直肠癌)甲基化生物标志物的甲基化位点。

为清楚起见，本领域技术人员将理解，术语甲基化生物标志物被宽泛地使用，使得甲基化基因座可以是包括一个或多个DMR的甲基化生物标志物，其中每个DMR本身也是甲基化生物标志物，并且每个所述DMR可以包括一个或多个甲基化位点，每个所述甲基化位点本身也是甲基化生物标志物。此外，甲基化生物标志物可以包括两个以上甲基化基因座。因此，作为甲基化生物标志物的状态不会开启生物标志物中包含的核酸的连续性，而是开启第一状态和第二状态之间(例如在结直肠癌和对照之间)所包含的DNA区的甲基化状态变化的存在。

如本文提供的，甲基化基因座可以是一个或多个以下甲基化基因座中的任一个，所述甲基化基因座各自是或包括表1中鉴定的基因(或特定DMR)或是其一部分。在一些特定实施方式中，进展期腺瘤和/或结直肠癌(例如早期结直肠癌)甲基化生物标志物包括单个甲基化基因座，其是或包括表1中鉴定的基因或是其一部分。

在一些具体实施方式中，甲基化生物标志物包括两个以上的甲基化基因座，每个甲基化基因座是或包括表1中鉴定的基因或是其一部分。在一些实施方式中，结直肠癌甲基化生物标志物包括多个甲基化基因座，每个甲基化基因座是或包括表1中鉴定的基因或是其一部分。

在各种实施方式中，甲基化生物标志物可以是或包括存在于本文提供的一个或多个甲基化基因座(例如，一个或多个DMR)中的一个或多个个体核苷酸(例如，CpG情况中的单个个体半胱氨酸残基)或多个个体半胱氨酸残基(例如，多个CpG的多个单独的半胱氨酸残基)。因此，在某些实施方式中，甲基化生物标志物是或包括多个个体甲基化位点的甲基化状态。

在各种实施方式中，甲基化生物标志物是或包括或特征在于甲基化状态的变化，所述变化是一个或多个甲基化基因座(例如，一个或多个DMR)内的一个或多个甲基化位点的甲基化的变化。在各种实施方式中，甲基化生物标志物是或包括甲基化状态的变化，所述变化是一个或多个甲基化基因座(例如，一个或多个DMR)内甲基化位点数量的变化。在各种实施方式中，甲基化生物标志物是或包括甲基化状态的变化，所述变化是一个或多个甲基化基因座(例如，一个或多个DMR)内甲基化位点频率的变化。在各种实施方式中，甲基化生物标志物是或包括甲基化状态的变化，所述变化是一个或多个甲基化基因座(例如，一个或多个DMR)内甲基化位点模式的变化。

在各种实施方式中，一个或多个甲基化基因座(例如，一个或多个DMR)的甲基化状态表示为被甲基化的样品中存在的一个或多个甲基化基因座(例如，一个或多个DMR)的分数或百分比，例如，作为在一个或多个特定甲基化基因座(例如，一个或多个特定DMR)处甲基化的样品中DNA的单个DNA链的数量的分数。本领域技术人员将理解，在一些情况下，甲基化的分数或百分比可以从例如样品内的一个或多个分析的DMR的甲基化DMR与未甲基化DMR的比率计算。

在一些特定的实施方式中，例如如本文所述，结直肠癌和/或进展期腺瘤甲基化生物标志物包括3个或更多个甲基化基因座，这些甲基化基因座各自是或包括表1、5至7、9至10和12至15中任一个表中所鉴定的基因区域，包括但不限于两个或更多个甲基化基因座的组合，它们分别是或包括表5至7、9至10和12至15之一中鉴定的基因区域。

在一些特定实施方式中，例如如本文所述，结直肠癌和/或进展期腺瘤甲基化生物标志物包括两个甲基化基因座，这两个甲基化基因座包括是或包括表5或12中鉴定的基因区域的甲基化基因座。在一些特定实施方式中，例如如本文所述，结直肠癌甲基化生物标志物包括3个甲基化基因座，这3个甲基化基因座包括是或包括表10或13中鉴定的基因区域的甲基化基因座。在一些特定实施方式中，例如如本文所述，结直肠癌甲基化生物标志物包括6个甲基化基因座，这6个甲基化基因座包括是或包括表6中鉴定的基因区域的甲基化基因座。在一些特定实施方式中，例如如本文所述，结直肠癌甲基化生物标志物包括9个甲基化基因座，这9个甲基化基因座包括是或包括表14中鉴定的基因区域的甲基化基因座。在一些特定实施方式中，例如如本文所述，结直肠癌甲基化生物标志物包括12个甲基化基因座，这12个甲基化基因座包括是或包括表7中鉴定的基因区域的甲基化基因座。在一些特定实施方式中，例如如本文所述，结直肠癌甲基化生物标志物包括18个甲基化基因座，这18个甲基化基因座包括是或包括表15中鉴定的基因区域的甲基化基因座。

表5至7、9至10和12至15中提供的DMR序列是由表1的DMR组成、与之重叠或包含其部分的选定区域。

表5：2种标志物的组合

SEQ ID NO	关联基因	chr	开始	结束
					SEQ ID NO:5	NA	3	75609726	75609832
SEQ ID NO:27	NA	19	22709270	22709382

表6：6种标志物的组合

SEQ ID NO	关联基因	chr	开始	结束
					SEQ ID NO:5	NA	3	75609726	75609832
SEQ ID NO:27	NA	19	22709270	22709382
					SEQ ID NO:50	NRF1	7	129720565	129720676
SEQ ID NO:59	CD8B,ANAPC1P1	2	86862416	86862559
					SEQ ID NO:17	LINC01395	11	129618345	129618455
SEQ ID NO:47	MAP3K6,FCN3	1	27369224	27369347

表7：12种标志物的组合

SEQ ID NO	关联基因	chr	开始	结束
					SEQ ID NO:45	ADSSL1	14	104736436	104736562
SEQ ID NO:59	CD8B,ANAPC1P1	2	86862416	86862559
					SEQ ID NO:12	CFAP44	3	113441596	113441690
SEQ ID NO:36	FLI1,LOC101929538	11	128685299	128685448
					SEQ ID NO:17	LINC01395	11	129618345	129618455
SEQ ID NO:47	MAP3K6,FCN3	1	27369224	27369347
					SEQ ID NO:5	NA	3	75609726	75609832
SEQ ID NO:27	NA	19	22709270	22709382
					SEQ ID NO:52	NA	12	53694915	53695058
SEQ ID NO:50	NRF1	7	129720565	129720676
					SEQ ID NO:13	PACSIN1	6	34514653	34514751
SEQ ID NO:37	SYCP1	1	114855187	114855327

表9：2种标志物的组合

SEQ ID NO	关联基因	chr	开始	结束
					SEQ ID NO:27	NA	19	22709270	22709382
SEQ ID NO:50	NRF1	7	129720565	129720676

表10：3种标志物的组合

SEQ ID NO	关联基因	chr	开始	结束
					SEQ ID NO:27	NA	19	22709270	22709382
SEQ ID NO:50	NRF1	7	129720565	129720676
					SEQ ID NO:49	TMEM196	7	19772652	19772800

表12：2种标志物的组合

表13：3种标志物的组合

SEQ ID NO	关联基因	chr	开始	结束
					SEQ ID NO:5	NA	3	75609726	75609832
SEQ ID NO:27	NA	19	22709270	22709382
					SEQ ID NO:36	FLI1,LOC101929538	11	128685299	128685448

表14：9种标志物的组合

SEQ ID NO	关联基因	chr	开始	结束
					SEQ ID NO:5	NA	3	75609726	75609832
SEQ ID NO:27	NA	19	22709270	22709382
					SEQ ID NO:36	FLI1,LOC101929538	11	128685299	128685448
SEQ ID NO:45	ADSSL1	14	104736436	104736562
					SEQ ID NO:59	CD8B,ANAPC1P1	2	86862416	86862559
SEQ ID NO:14	NOS3	7	150996901	150997007
					SEQ ID NO:52	NA	12	53694915	53695058
SEQ ID NO:53	NA	12	53695032	53695180
					SEQ ID NO:37	SYCP1	1	114855187	114855327

表15：18种标志物的组合

SEQ ID NO	关联基因	chr	开始	结束
					SEQ ID NO:5	NA	3	75609726	75609832
SEQ ID NO:27	NA	19	22709270	22709382
					SEQ ID NO:36	FLI1LOC101929538	11	128685299	128685448
SEQ ID NO:45	ADSSL1	14	104736436	104736562
					SEQ ID NO:59	CD8B,ANAPC1P1	2	86862416	86862559
SEQ ID NO:14	NOS3	7	150996901	150997007
					SEQ ID NO:52	NA	12	53694915	53695058
SEQ ID NO:53	NA	12	53695032	53695180
					SEQ ID NO:37	SYCP1	1	114855187	114855327
SEQ ID NO:46	MAP3K6,FCN3	1	27369167	27369316
					SEQ ID NO:10	CFAP44	3	113441519	113441620
SEQ ID NO:39	NA	3	45036223	45036316
					SEQ ID NO:43	ZAN	7	100785886	100786015
SEQ ID NO:32	ENG	9	127828322	127828421
					SEQ ID NO:22	RASA3	13	114111799	114111878
SEQ ID NO:52	NA	12	53695146	53695232
					SEQ ID NO:25	NA	17	78304805	78304921
SEQ ID NO:15	LOC101929234,ZNF503-AS2	10	75407300	75407400

在各种实施方式中，将一个或多个甲基化基因座(例如，一个或多个DMR)的甲基化状态与参照甲基化状态值和/或与参照样品中的一个或多个甲基化基因座(例如，一个或多个DMR)的甲基化状态进行比较。在某些情况下，参照是来自相同来源的非同期样品，例如来自相同来源的先前样品，例如来自相同受试者。在某些情况下，一个或多个甲基化基因座(例如，一个或多个DMR)的甲基化状态的参照是已知代表特定状态(例如，癌症状态或非癌症状态)的样品(例如，来自受试者的样品)或多个样品中一个或多个甲基化基因座(例如，一个或多个DMR)的甲基化状态)。因此，参照可以是或包括一个或多个预定阈值，该预定阈值可以是定量的(例如甲基化值)或定性的。在某些情况下，DMR甲基化状态的参照是在不包括DMR的核苷酸的同一样品中存在的一个核苷酸或多个核苷酸(例如，多个连续寡核苷酸)的甲基化状态。本领域技术人员将理解，参照测量通常通过使用与进行非参照测量的方法相同、相似或相当的方法进行测量来产生。

癌症

在某些实施方式中，本公开的方法和组合物可用于筛查进展期腺瘤和/或癌症，特别是结直肠癌。结直肠癌包括但不限于结肠癌、直肠癌及其组合。结直肠癌包括转移性结直肠癌和非转移性结直肠癌。结直肠癌包括位于结肠癌近端的癌症和位于结肠远端的癌症。

结直肠癌包括本领域已知的各种可能分期中的任何一个的结直肠癌，包括例如I期、II期、III期和IV期结直肠癌(例如0、I、IIA、IIB、IIC、IIIA、IIIB、IIIC、IVA、IVB和IVC期)。结直肠癌包括肿瘤/淋巴结/转移(TNM)分期系统的所有阶段。对于结直肠癌，T可以指肿瘤是否生长到结肠壁还是直肠壁中，如果如此的话多少层；N可以指肿瘤是否已经扩散到淋巴结，如果如此，有多少个淋巴结以及它们位于哪里；并且M可以指癌症是否已经扩散到身体的其他部位，如果如此，已经扩散到哪些部位，扩散到什么程度。T、N和M的特定阶段是本领域已知的。T阶段可以包括TX、T0、Tis、T1、T2、T3、T4a和T4b；N阶段可以包括NX、N0、N1a、N1b、N1c、N2a和N2b；M阶段可以包括M0、M1a和M1b。此外，结直肠癌的等级可包括GX、G1、G2、G3和G4。癌症、尤其是结直肠癌分期的各种手段是本领域众所周知的，例如在万维网上的cancer.net/cancer-types/colorectal-cancer/stages上总结的。

在某些情况下，本公开内容包括早期结直肠癌的筛查。早期结直肠癌可以包括例如位于受试者内的结直肠癌，例如，因为它们尚未扩散至受试者的淋巴结，例如癌附近的淋巴结(N0期)，并且尚未扩散至远端位点(M0期)。早期癌症包括对应于例如0至II C期的结直肠癌。

因此，本公开的结直肠癌尤其包括恶性前结直肠癌和恶性结直肠癌。本公开的方法和组合物可用于筛查所有形式和阶段的结直肠癌，包括但不限于本文命名的或本领域已知的那些，以及其所有亚组。因此，本领域技术人员将理解，此处提供的对结直肠癌的所有参照包括但不限于其所有形式和阶段的结直肠癌，包括但不限于本文提及的或本领域已知的那些，以及所有其亚组。

受试者和样品

使用本文提供的方法和组合物分析的样品可以是任何生物样品和/或任何样品，包括核酸。在各种特定实施方式中，使用本文提供的方法和组合物分析的样品可以是来自哺乳动物的样品。在各种特定实施方式中，使用本文提供的方法和组合物分析的样品可以是来自人类受试者的样品。在各种特定实施方式中，使用本文提供的方法和组合物分析的样品可以是来自小鼠、大鼠、猪、马、鸡或牛的样品。

在各种情况下，人类受试者是被诊断或寻求诊断为患有癌症(例如结直肠癌)的受试者，被诊断为或寻求诊断为有风险患癌症(例如结直肠癌)的受试者，和/或被诊断为或寻求诊断为有直接风险患癌症(例如结直肠癌)的受试者。在各种情况下，人类受试者是被鉴定为需要结直肠癌筛查的受试者的受试者。在某些情况下，人类受试者是被鉴定为需要由执业医师进行结直肠癌筛查的受试者。在各种情况下，人类受试者被鉴定为由于年龄而需要结直肠癌筛查，例如由于年龄等于或大于50岁，例如年龄等于或大于50、55、60、65、70、75、80、85或90岁。在各种情况下，人类受试者是未被诊断为患有癌症(例如结直肠癌)的受试者，没有风险患癌症(例如结直肠癌)的受试者，或没有直接风险患癌症(例如结直肠癌)的受试者，未被诊断为患有癌症(例如结直肠癌)的受试者，和/或没有尝试诊断癌症(例如结直肠癌)的受试者，或其任何组合。

来自受试者例如人类或其他哺乳动物受试者的样品可以是例如血液、血液成分、cfDNA、ctDNA、粪便或结肠直肠组织的样品。在一些特定实施方式中，样品是受试者的排泄物或体液(例如受试者的粪便、血液、淋巴液或尿液)或结直肠癌组织样品。来自受试者的样品可以是细胞或组织样品，例如具有癌症或包括癌细胞(例如具有肿瘤或转移性组织)的细胞或组织样品。在各种实施方式中，可以通过活组织检查(例如，细针抽吸或组织活组织检查)或手术获得来自受试者例如人或其他哺乳动物受试者的样品。

在各种特定实施方式中，样品是无细胞DNA(cfDNA)样品。cfDNA通常以短的双链片段形式存在于人体生物体液(例如血浆、血清或尿液)中。cfDNA的浓度通常很低，但在特定条件下会显著增加，包括但不限于怀孕、自身免疫性疾病、心肌梗塞和癌症。循环肿瘤DNA(ctDNA)是特异性源自癌细胞的循环DNA的成分。ctDNA可以存在于与白细胞和红细胞结合或不与白细胞和红细胞结合的人类生物体液中。用于检测肿瘤来源的cfDNA的各种测试基于对癌症(例如相关癌症)特征的遗传或表观遗传修饰的检测。癌症特征的遗传或表观遗传修饰可包括但不限于肿瘤抑制基因中的致癌突变或癌症相关突变、活化的致癌基因、高甲基化和/或染色体疾病。检测癌症特征的遗传或表观遗传修饰可以确认所检测的cfDNA是ctDNA。

cfDNA和ctDNA可提供源组织甲基化状态的实时或近乎实时的指标。cfDNA和ctDNA在血液中的半衰期约为2小时，因此在给定时间采集的样品可以相对及时地反映源组织的状态。

从样品中分离核酸(例如，从血液或血浆中分离cfDNA)的各种方法是本领域已知的。核酸可以通过例如但不限于标准DNA纯化技术，通过直接基因捕获(例如，通过澄清样品以去除测试抑制剂并用捕获剂从澄清样品中捕获靶核酸(如果存在的话)，以产生捕获复合物，并分离捕获复合物以回收目标核酸)来分离。

测量甲基化状态的方法

甲基化状态可以通过本领域已知的多种方法和/或通过本文提供的方法测量。本领域技术人员将理解，用于测量甲基化状态的方法通常可应用于来自任何来源和任何种类的样品，并且将进一步理解可用于将样品修饰成适合通过以下方法进行测量的形式的处理步骤。测量甲基化状态的方法包括但不限于，包括甲基化状态特异性聚合酶链式反应(PCR)的方法、包括核酸测序的方法、包括质谱的方法、包括甲基化特异性核酸酶的方法、包括基于质量的分离的方法、包括目标特异性捕获的方法，以及包括甲基化特异性寡核苷酸引物在内的方法。甲基化的某些特定的测试使用亚硫酸氢盐试剂(例如，亚硫酸氢根离子)。

亚硫酸氢盐试剂尤其可包括亚硫酸氢盐(bisulfite)、偏重亚硫酸盐(disulfite)、氢亚硫酸盐(hydrogen sulfite)或它们的组合等，这些试剂可用于区分甲基化和未甲基化的核酸。亚硫酸氢盐与胞嘧啶和5-甲基胞嘧啶的相互作用不同。在典型的基于亚硫酸氢盐的方法中，DNA与亚硫酸氢盐接触会使未甲基化的胞嘧啶脱氨基为尿嘧啶，而甲基化的胞嘧啶不受影响；选择性保留甲基化胞嘧啶，而不是未甲基化胞嘧啶。因此，在经亚硫酸氢盐处理的样品中，尿嘧啶残基代替了未甲基化的胞嘧啶残基，并因此提供未甲基化胞嘧啶残基的识别信号，而残留的(甲基化)胞嘧啶残基因此提供甲基化胞嘧啶残基的识别信号。可以例如，通过PCR分析经亚硫酸氢盐处理的样品。

各种甲基化测试程序可与亚硫酸氢盐处理结合使用，以确定靶序列如DMR的甲基化状态。此类测试可尤其包括甲基化特异性限制酶qPCR、经亚硫酸氢盐处理的核酸的测序、PCR(例如，使用序列特异性扩增)、甲基化特异性核酸酶辅助小等位基因富集PCR和甲基化灵敏度高分辨率溶解。在一些实施方式中，从经亚硫酸氢盐处理的DNA样品中扩增DMR，并根据例如Illumina方案或基于转座的Nextera XT方案制备DNA测序文库以用于测序。在某些实施方式中，高通量和/或下一代测序技术用于实现DNA序列的碱基对水平解析，允许分析甲基化状态。

在各种实施方式中，甲基化状态通过包括使用甲基化特异性寡核苷酸引物的PCR扩增的方法(MSP方法)检测，例如应用于经亚硫酸氢盐处理的样品(参见例如Herman1992Proc.Natl.Acad.Sci.USA 93:9821-9826，其关于确定甲基化状态的方法通过引用并入本文)。使用甲基化状态特异性寡核苷酸引物来扩增经亚硫酸氢盐处理的DNA可以区分甲基化和非甲基化核酸。用于MSP方法的寡核苷酸引物对包括至少一种寡核苷酸引物，其能够与包括甲基化位点(例如CpG)的序列杂交。在与胞嘧啶残基互补的位置包含T残基的寡核苷酸引物将选择性地与其中胞嘧啶在亚硫酸氢盐处理之前未甲基化的模板杂交，而在与胞嘧啶残基互补的位置包含G残基的寡核苷酸引物将选择性地与其中胞嘧啶在亚硫酸氢盐处理之前是甲基化胞嘧啶的模板杂交。MSP结果可以在使用或不使用测序扩增子的情况下获得，例如使用凝胶电泳。MSP(甲基化特异性PCR)允许使用亚硫酸氢盐转化的DNA的PCR扩增对位点特异性DNA甲基化进行高灵敏度检测(检测水平为0.1％的等位基因，具有完全特异性)。

可用于确定样品在亚硫酸氢盐处理后的甲基化状态的另一种方法是甲基化敏感高分辨率溶解(MS-HRM)PCR(参见，例如Hussmann 2018Methods Mol Biol.1708:551-571，其关于确定甲基化状态的方法通过引用并入本文)。MS-HRM是一种基于PCR的试管内方法，其可基于杂交熔解检测所关注的特定基因座的甲基化水平。在执行MS-HRM之前对DNA进行亚硫酸氢盐处理可确保甲基化和未甲基化DNA之间的不同碱基组成，其用于通过高分辨率熔解分离所得扩增子。独特的引物设计促进了测试的高灵敏度，能够在未甲基化背景中检测低至0.1％至1％的甲基化等位基因。用于MS-HRM测试的寡核苷酸引物设计为与甲基化等位基因互补，特定的退火温度使这些引物能够与甲基化和未甲基化等位基因退火，从而提高测试的灵敏度。

另一种可用于在亚硫酸氢盐处理样品后确定甲基化状态的方法是定量多重甲基化特异性PCR(QM-MSP)。QM-MSP使用甲基化特异性引物对DNA甲基化进行灵敏定量(参见，例如Fackler 2018Methods Mol Biol.1708:473-496，其关于确定甲基化状态的方法通过引用并入本文)。QM-MSP是一种两步PCR方法，在第一步中，一对基因特异性引物(正向和反向)在一个PCR反应中同时和多重地扩增同一基因的甲基化和未甲基化的拷贝。在36个PCR循环后，该甲基化独立扩增步骤可产生每μL高达10⁹个拷贝的扩增子。在第二步中，使用实时PCR和两个独立的荧光团检测同一孔中每个基因的甲基化/未甲基化DNA(例如6FAM和VIC)，用标准曲线对第一次反应的扩增子进行量化。可检测到100000个参照基因拷贝中的1个甲基化拷贝。

另一种可用于确定在亚硫酸氢盐处理样品后甲基化状态的方法是甲基化特异性核酸酶辅助小等位基因富集(MS-NaME)(参见，例如，Liu 2017Nucleic Acids Res.45(6):e39，其关于确定甲基化状态的方法通过引用并入本文)。Ms-NaME基于对在双链(ds)DNA(DSN)具有特异性的DNA核酸酶的存在下探针与靶序列的选择性杂交，从而杂交产生随后被DSN消化的双链DNA的区域。因此，靶向未甲基化序列的寡核苷酸探针产生局部双链区域，导致未甲基化靶标的消化；能够与甲基化序列杂交的寡核苷酸探针会产生导致甲基化靶标的消化的局部双链区域，使甲基化靶标保持完整。此外，寡核苷酸探针可以同时将DSN活性导向经亚硫酸氢盐处理的DNA中的多个靶标。随后的扩增可以富集未消化的序列。Ms-NaME可以单独使用或与本文提供的其他技术组合使用。

另一种可用于确定在亚硫酸氢盐处理样品后甲基化状态的方法是甲基化灵敏度单核苷酸引物延伸(Ms-SNuPE^TM)(参见例如Gonzalgo 2007Nat Protoc.2(8):1931-6，其关于确定甲基化状态的方法通过引用并入本文)。在Ms-SNuPE中，执行链特异性PCR以生成DNA模板，以用于使用Ms-SNuPE进行定量甲基化分析。然后用寡核苷酸进行SNuPE，该寡核苷酸设计用于在被询问的CpG位点的紧接上游进行杂交。反应产物可以在聚丙烯酰胺凝胶上电泳，以用于通过磷光体图像分析进行可视化和定量。扩增子还可以携带可直接或间接检测的标记，例如荧光标记、放射性同位素或可脱离的分子片段或具有可通过质谱法区分的质量的其他实体。检测可以通过例如基质辅助激光解吸/电离质谱(MALDI)或使用电喷雾质谱(ESI)来进行和/或可视化。

可用于在亚硫酸氢盐处理样品后确定甲基化状态的某些方法在基于扩增的方法中利用第一寡核苷酸引物、第二寡核苷酸引物和寡核苷酸探针。例如，寡核苷酸引物和探针可用于实时聚合酶链式反应(PCR)或液滴数字PCR(ddPCR)的方法中。在各种情况下，第一寡核苷酸引物、第二寡核苷酸引物和/或寡核苷酸探针与甲基化DNA和/或未甲基化DNA选择性杂交，使得扩增或探针信号指示样品的甲基化状态。

用于检测甲基化状态(例如，5-甲基胞嘧啶水平的存在)的其他基于亚硫酸氢盐的方法公开于例如Frommer(1992Proc Natl Acad Sci U S A.1；89(5):1827-31，其关于确定甲基化状态的方法通过引用并入本文)。

可用于确定甲基化状态的某些方法不包括样品的亚硫酸氢盐处理。例如，可以通过基于PCR的方法检测甲基化状态的变化，所述方法中用一种或多种甲基化敏感限制酶(MSRE)消化DNA，然后进行PCR扩增(例如，通过MSRE-qPCR)。通常，MSRE具有包含至少一个CpG基序的识别位点，因此如果该位点包含5-甲基胞嘧啶，则MSRE的活性被阻止切割可能的识别位点(参见，例如，Beikircher 2018Methods Mol Biol.1708:407-424，其关于确定甲基化状态的方法通过引用并入本文)。因此，MSRE根据MSRE识别位点的甲基化状态选择性消化核酸；它们可以在未甲基化的MSRE识别位点消化DNA，但不能在甲基化的MSRE识别位点消化DNA。在某些实施方式中，样品的等分试样可以用MSRE消化，产生其中未甲基化的DNA已被MSRE切割的加工样品，使得在MSRE识别位点内具有至少一个甲基化位点(例如，DNA分子的每个MSRE识别位点内有至少一个甲基化位点)的未切割的和/或可扩增的DNA相对于在MSRE识别位点内不包括至少一个甲基化位点(例如，在DNA分子的每个MSRE识别位点内不包括至少一个甲基化位点)的未切割的和/或可扩增的DNA的比例增加。然后可以将限制性酶消化样品的未切割序列进行预扩增(例如以PCR)，并进行定量(例如通过qPCR、实时PCR或数字PCR定量)。用于MSRE-qPCR的寡核苷酸引物扩增包括一个或多个MSRE切割位点和/或多个MSRE切割位点的区域。包含多个MSRE切割位点的扩增子通常更有可能产生可靠的结果。DMR扩增子切割位点的数量，以及在某些情况下所产生的DMR甲基化状态确定的稳健性，可以通过设计在DMR扩增子中包含多个MSRE识别位点(而不是单个识别位点)的DMR来增加。在各种情况下，多个MSRE可以应用于同一样品，包括例如AciI、Hin6I、HpyCH4IV和HpaII中的两个以上(例如，包括AciI、Hin6I和HpyCH4IV)。多个MSRE(例如，AciI、Hin6I、HpyCH4IV和HpaII的组合，或AciI、Hin6I和HpyCH4IV的组合)可以在DMR扩增子内提供改善的MSRE识别位点频率。

鉴于血液中cfDNA的占比较低，MSRE-qPCR还可以包括在通过MSRE消化样品之后但在qPCR之前进行预扩增步骤，以提高可用样品的数量。

在某些MSRE-qPCR实施方式中，使用例如实时PCR或数字PCR在天然(例如未消化)形式的样品的等分试样中测量总DNA的量。

各种扩增技术可单独使用或与本文所述的其他技术结合使用以检测甲基化状态。本领域技术人员在阅读了本说明书后将理解如何将本领域已知的和/或本文描述的各种扩增技术与本领域已知的和/或本文提供的用于甲基化状态确定的各种其他技术结合起来。扩增技术包括但不限于PCR，例如定量PCR(qPCR)、实时PCR和/或数字PCR。本领域技术人员将理解聚合酶扩增可以在单个反应中多重扩增多个靶标。PCR扩增子的长度通常为100至2000个碱基对。在各种情况下，扩增技术足以确定甲基化状态。

基于数字PCR(dPCR)的方法涉及将样品分配和分布在具有96孔、384孔或更多孔的板的孔中，或分配和分布在单个乳液液滴(ddPCR)中，例如，使用微流体装置，使得一些孔包括一个或多个模板拷贝，其他不包含模板拷贝。因此，扩增前每孔的平均模板分子数小于1。发生模板扩增的孔的数量提供了模板浓度的量度。如果样品已与MSRE接触，发生模板扩增的孔的数量提供了甲基化模板浓度的量度。

在各种实施方式中，基于荧光的实时PCR测试，例如MethyLight^TM，可用于测量甲基化状态(参见，例如Campan 2018Methods Mol Biol.1708:497-513，其甲基化状态的测试方法通过引用并入本文)。MethyLight是一种基于荧光的定量实时PCR方法，其可灵敏地检测和量化基因组候选区的DNA甲基化。MethyLight特别适合在未甲基化DNA的高背景下检测低频甲基化DNA区，因为它结合了甲基化特异性引发和甲基化特异性荧光探测。此外，MethyLight可与数字PCR结合使用，用于高度灵敏地检测个体甲基化分子，用于疾病检测和筛查。

用于确定甲基化状态的基于实时PCR的方法通常包括基于外部标准的分析生成未甲基化DNA的标准曲线的步骤。标准曲线可以由至少两个点构建，并且可以将消化的DNA的实时Ct值和/或未消化的DNA的实时Ct值与已知的定量标准进行比较。在特定情况下，可以确定MSRE消化和/或未消化样品或样品等分试样的样品Ct值，并且可以从标准曲线计算DNA的基因组当量。可以评估MSRE消化和未消化DNA的Ct值，以鉴定消化的扩增子(例如，有效消化；例如，产生45的Ct值)。也可以鉴定在消化或未消化条件下未扩增的扩增子。然后可以跨条件直接比较所关注的扩增子的校正Ct值，以确定条件之间甲基化状态的相对差异。作为选择或另外，消化和未消化DNA的Ct值之间的delta差异可用于确定条件之间甲基化状态的相对差异。

测量甲基化状态的方法可以包括但不限于大规模平行测序(例如下一代测序)以确定甲基化状态，例如合成测序、实时(例如单分子)测序、珠乳液测序、纳米孔测序或本领域已知的其他测序技术。在一些实施方式中，测量甲基化状态的方法可以包括全基因组测序，例如，利用碱基对分辨率。

在某些特定实施方式中，MSRE-qPCR技术尤其可用于确定是或包括单个甲基化基因座的进展期腺瘤和/或结直肠癌(例如早期结直肠癌)甲基化生物标志物的甲基化状态。在某些特定实施方式中，MSRE-qPCR技术尤其可用于确定是或包括两个或更多个甲基化基因座的甲基化生物标志物的甲基化状态。在某些特定实施方式中，MSRE-qPCR技术尤其可用于确定是或包括单个差异甲基化区域(DMR)的甲基化生物标志物的甲基化状态。在某些特定实施方式中，MSRE-qPCR技术尤其可用于确定是或包括两个或更多个DMR的甲基化生物标志物的甲基化状态。在某些特定实施方式中，MSRE-qPCR技术尤其可用于确定是或包括单个甲基化位点的甲基化生物标志物的甲基化状态。在某些特定实施方式中，MSRE-qPCR技术尤其可用于确定是或包括两个或更多个甲基化位点的甲基化生物标志物的甲基化状态。在各种实施方式中，甲基化生物标志物可以是本文提供的任何甲基化生物标志物。本公开内容特别包括如表1和2所示的用于扩增DMR的寡核苷酸引物对，例如用于扩增表1中鉴定的DMR。

在某些特定实施方式中，cfDNA样品源自受试者血浆并与MSRE接触，MSRE是或包括AciI、Hin6I、HpyCH4IV和HpaII中的一个或多个(例如，AciI、Hin6I和HpyCH4IV)。经消化的样品可以用一个或多个DMR的寡核苷酸引物对进行预扩增，例如用表1和2中提供的一个或多个寡核苷酸引物对。经消化的DNA(例如，预扩增的经消化的DNA)，可以用qPCR用一个或多个DMR的寡核苷酸引物对进行定量，例如，使用表1和2中提供的一个或多个寡核苷酸引物对。然后可以确定qPCR ct值并用于确定每个DMR扩增子的甲基化状态。

本领域技术人员将理解，表2中提供的寡核苷酸引物对可根据本文鉴定的结直肠癌甲基化生物标志物的任何组合使用。技术人员将意识到，可以在给定的分析中单独包括或不包括表2的寡核苷酸引物对，以分析特定的期望的DRM组合。

本领域技术人员将进一步理解，虽然可以使用其他寡核苷酸引物对，但是选择和配对寡核苷酸引物以产生有用的DMR扩增子是重要的并且代表了实质性的贡献。

本领域技术人员将进一步理解，qPCR的方法、试剂和方案是本领域公知的。与传统PCR不同，qPCR能够检测扩增过程中(例如，在每个扩增循环结束时)随时间推移产生的扩增子，通常通过使用扩增响应荧光系统，例如，结合具有荧光检测能力的热循环仪。qPCR中使用的荧光报告基因的两种常见类型包括：(i)双链DNA结合染料，其在结合时比未结合时发出的荧光更亮；(ii)标记的寡核苷酸(例如标记的寡核苷酸引物或标记的寡核苷酸探针)。

本领域技术人员将理解，以本文提供的结直肠癌筛查方法分析多个甲基化基因座(例如，多个DMR)的甲基化状态的实施方式中，每个甲基化基因座的甲基化状态可以是以多种形式中的任一种来测量或表示的，并且多个甲基化基因座的甲基化状态(优选地各自以相同、相似或可比较的方式测量和/或表示)一起或累积地以各种形式的任一种分析或表示。在各种实施方式中，每个甲基化基因座的甲基化状态可以测量为ct值。在各种实施方式中，每个甲基化基因座的甲基化状态可以表示为测量样品和参照之间的ct值差异。在各种实施方式中，每个甲基化基因座的甲基化状态可以表示为与参照的定性比较，例如通过将每个甲基化基因座鉴定为高甲基化或未高甲基化。

在分析单个甲基化基因座的一些实施方式中，单个甲基化基因座的高甲基化构成受试者患有或可能患有病况(例如进展期腺瘤和/或结直肠癌(例如早期结直肠癌))的诊断，而不存在单甲基化基因座的高甲基化构成受试者可能不患有该病况的诊断。在一些实施方式中，多个分析的甲基化基因座的单个甲基化基因座(例如单个DMR)的高甲基化构成受试者患有或可能患有所述病况的诊断，而在多个分析的甲基化基因座的任何甲基化基因座不存在高甲基化构成受试者可能不患有所述病况的诊断。在一些实施方式中，多个分析的甲基化基因座中甲基化基因座的确定百分比(例如，预定百分比)(例如，至少10％(例如，至少10％、至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％或100％))的高甲基化构成受试者患有或可能患有所述病况的诊断，而不存在多个分析的甲基化基因座中甲基化基因座的确定百分比(例如，预定百分比)(例如，至少10％(例如，至少10％、至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％或100％))的高甲基化构成受试者不太可能患有所述病况的诊断。在一些实施方式中，多个分析的甲基化基因座(例如，2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个DMR)中确定数量(例如，预定数量)的甲基化基因座(例如，至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个DMR)的高甲基化构成受试者患有或可能患有所述病况的诊断，而不存在多个分析的甲基化基因座(例如，2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个DMR)中确定数量(例如，预定数量)的甲基化基因座(例如，至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个DMR)的高甲基化构成受试者不太可能患有所述病况的诊断。

在一些实施方式中，定性或定量测量多个甲基化基因座(例如多个DMR)的甲基化状态，并且组合多个甲基化基因座中的每一个的测量以提供诊断。在一些实施方式中，多个甲基化基因座中的每一个的定量测量的甲基化状态的定性被单独加权，并且加权值被组合以提供可以与参照进行比较以提供诊断的单个值。仅提供这种方法的一个实例而言，支持向量机(SVM)算法可用于分析本公开的多个甲基化基因座的甲基化状态以产生诊断。支持向量机算法的至少一个目标是在N维空间(N为特征的数量)中鉴定一个超平面，该超平面对数据点进行明确分类，目标是找到一个具有最大边距的平面，即两类数据点之间的最大距离。如本文实施例中所讨论的，SVM模型建立在源自训练样品集(例如，第一受试者组和/或第二受试者组)的标记值(例如，ct值)上，其在进行预测时被转化成支持向量值。在将SVM模型应用于新样品时，样品将被映射到模型的向量空间并分类为具有属于第一条件或第二条件的概率，例如，基于每个新样品相对于两个条件之间的间隙的位置。本领域技术人员将理解，一旦确定了相关组合和方法，向量值可以与由R-package的predict()函数定义的SVM算法结合使用(参见超文本传输协议安全(HTTPS)://cran.r-project.org/web/packages/e1071/index.html，其SVM在此通过引用并入)，以容易地生成对新样品的预测。因此，利用本文公开的用于进展期腺瘤和/或结直肠癌诊断的组合物和方法(并且仅在那时)，将很直接地生成利用算法输入信息组合来预测R-package的predict()函数(参见超文本传输协议安全(HTTPS)://cran.r-project.org/web/packages/e1071/index.html)的预测模型来提供病况诊断。

应用

本公开的方法和组合物可用于多种应用中的任何一种。例如，本公开的方法和组合物可用于筛查或帮助筛查进展期腺瘤和/或结直肠癌(例如早期结直肠癌)。在各种情况下，使用本公开内容的方法和组合物进行筛查可以检测任何阶段的结直肠癌，包括但不限于早期结直肠癌。在一些实施方式中，使用本公开内容的方法和组合物进行的筛查适用于50岁以上，例如50、55、60、65、70、75、80、85或90岁以上的个体。在一些实施方式中，使用本公开的方法和组合物进行的筛查适用于20岁以上，例如20、25、30、35、40、45、50、55、60、65、70、75、80、85或90岁以上的个体。在一些实施方式中，使用本公开的方法和组合物进行的筛查适用于20至50岁，例如20至30岁、20至40岁、20至50岁、30岁至40岁、30至50岁或40至50岁的个体。在各种实施方式中，使用本公开内容的方法和组合物进行的筛查适用于经历腹痛或不适的个体，例如，经历未诊断或不完全诊断的腹痛或不适的个体。在各种实施方式中，使用本公开内容的方法和组合物进行的筛查适用于没有可能与进展期腺瘤和/或结直肠癌相关的症状的个体。因此，在某些实施方式中，使用本公开内容的方法和组合物进行的筛查是完全或部分预防性或防止性的，至少对于晚期或非早期的结直肠癌而言如此。

在各种实施方式中，使用本公开内容的方法和组合物进行的筛查可应用于无症状的人类受试者。如本文所用，如果受试者通过非侵入性可观察标记(例如，没有进行基于装置的探测、组织样品分析、体液分析、手术或结直肠癌筛查中的一项、多项或所有)没有报告和/或证明所述状况的充分特征以支持对受试者可能患有所述状况的医学合理怀疑，则受试者可以称为是“无症状的(asymptomatic)”。进展期腺瘤和/或早期结直肠癌特别可能在根据本公开内容的方法和组合物筛查的无症状个体中检测到。

本领域技术人员将理解对进展期腺瘤和/或结直肠癌的定期、预防性和/或防止性筛查改善了诊断。如上所述，根据至少一种癌症分期系统，早期癌症包括结直肠癌的0至IIC期。因此，本公开尤其提供了适用于进展期腺瘤和/或早期结直肠癌的诊断和治疗的方法和组合物。通常，特别是在根据本公开每年进行结直肠癌筛查和/或其中受试者在筛查时无症状的实施方式中，本发明的方法和组合物特别有可能检测到早期阶段结直肠癌。

在各种实施方式中，根据本公开的结直肠癌筛查对给定受试者进行一次或对给定受试者进行多次。在各种实施方式中，根据本公开定期进行结直肠癌筛查，例如每六个月、每年、每两年、每三年、每四年、每五年或每十年。

在各种实施方式中，使用本文公开的方法和组合物进行的筛查将提供癌症状况的诊断。在其他情况下，使用本文公开的方法和组合物进行的结直肠癌筛查将指示状况的诊断，但不能确定状况的诊断。在多种情况下，使用本公开的方法和组合物进行筛查之后可以进行进一步的诊断确认测试(diagnosis-confirmatory assay)，该进一步的诊断确认测试可以确认、支持、削弱、或推翻由先前筛查(例如，根据本公开的筛查)产生的诊断。如本文所用，诊断确认测试可以是提供被执业医师确认为确证性的诊断的结直肠癌测试，例如基于结肠镜检查的诊断，或显著增加或降低先前诊断(例如，根据本公开的筛查产生的诊断)正确的可能性的结直肠癌测试。诊断确认测试可以包括现有的筛查技术，这些技术通常需要在灵敏度、特异性和非侵入性中的一个或多个方面进行改进，特别是在检测早期结直肠癌方面。

在一些情况下，诊断确认测试是这样一种测试，即它是或包括对受试者组织的视觉或结构性检查，例如通过结肠镜检查。在一些实施方式中，结肠镜检查包括或随后进行组织学分析。结直肠癌的视觉和/或结构性测试可以包括检查结肠和/或直肠的结构是否有任何异常组织和/或结构。例如，可以使用经直肠内窥镜或通过CT扫描进行视觉和/或结构性检查。在一些情况下，诊断确认测试是结肠镜检查，例如，包括或随后进行组织学分析。根据一些报告，结肠镜检查是目前主要的和/或最被依赖的诊断确认测试。

另一种基于计算机断层扫描(CT)的视觉和/或结构性诊断确认测试是CT结肠成像，有时也称为虚拟结肠镜检查。CT扫描利用结肠和/或直肠的大量X射线图像来生成结肠的二维呈现图。尽管可用作诊断确认测试，但一些报告表明CT结肠成像不足以替代结肠镜检查，至少部分是因为医生没有实际接触受试者的结肠来获取组织以进行组织学分析。

另一种诊断确认测试可以是乙状结肠镜检查。在乙状结肠镜检查中，乙状结肠镜用于经直肠对结肠和/或直肠的部分进行成像。根据一些报道，乙状结肠镜检查并未得到广泛应用。

在某些情况下，诊断确认测试是基于粪便的测试。通常，当使用基于粪便的测试代替目视或结构性检查时，建议以比使用目视或结构性检查所需的频率更高的频率使用。在一些情况下，诊断确认测试是基于guiac的粪便潜血试验或粪便免疫化学试验(gFOBT/FIT)(参见，例如Navarro 2017World J Gastroenterol.23(20):3632-3642，其关于结直肠癌测试通过引用并入本文)。FOBT和FIT有时用于诊断结直肠癌(参见，例如，Nakamura 2010JDiabetes Investig.Oct 19；1(5):208-11，其关于结直肠癌测试通过引用并入本文)。FIT是基于粪便中潜血的检测，潜血的存在通常预示着结直肠癌，但通常量不足以通过肉眼进行识别。例如，在典型的FIT中，该测试利用血红蛋白特异性试剂来测试粪便样品中的潜血。在各种情况下，FIT试剂盒适合个人在家中使用。当在没有其他诊断确认测试的情况下使用时，建议每年使用一次FIT。通常不依赖FIT为结直肠癌的结论性诊断提供足够的诊断信息。

诊断确认测试还包括gFOBT，其经设计通过化学反应检测粪便中的潜血。与FIT一样，当在没有其他诊断确认测试的情况下使用时，可能建议每年使用gFOBT。通常不依赖gFOBT为结直肠癌的结论性诊断提供足够的诊断信息。

诊断确认测试还可以包括粪便DNA检测。结直肠癌的粪便DNA检测可经设计以鉴定粪便样品中癌症的DNA序列特征。如果在没有其他诊断确认测试的情况下使用，建议每三年使用一次粪便DNA检测。通常不依赖粪便DNA检测来为结直肠癌的结论性诊断提供足够的诊断信息。

一种特别的筛查技术是基于粪便的筛查测试(

(Exact SciencesCorporation,Madison,WI,United States)，其将FIT分析与DNA的异常修饰(例如突变和甲基化)分析相结合。

测试与单独的FIT检测相比，显示出改善的灵敏度，但由于依从率低，临床上可能不切实际或无效，所述低依从率至少部分是由于受试者不喜欢使用基于粪便的检测(参见，例如，doi:10.1056/NEJMc1405215(例如，2014N Engl J Med.371(2):184-188))。

测试似乎将几乎一半的合格人群排除在筛查计划之外(参见，例如，van der Vlugt 2017Br J Cancer.116(1):44-49)。使用如本文提供的筛查(例如通过基于血液的分析)，将增加选择筛查结直肠癌的个体数量(参见，例如Adler 2014BMCGastroenterol.14:183；Liles 2017Cancer Treatment and Research Communications10:27-31)。就目前所知，只有一种现有的结直肠癌筛查技术Epiprocolon获得FDA批准和CE-IVD准售，并且是基于血液的。Epiprocolon基于SEPT9基因的高甲基化。Epiprocolon测试的结直肠癌检测的准确率低，灵敏度为68％，而晚期腺瘤灵敏度仅为22％(参见，例如，Potter 2014Clin Chem.60(9):1183-91)。本领域尤其需要一种非侵入性结直肠癌筛查，其可以实现高受试者依从性，并且具有高和/或改进的特异性和/或灵敏度。

在各种实施方式中，根据本公开的方法和组合物的筛查降低了结直肠癌死亡率，例如通过早期结直肠癌诊断。数据支持结直肠癌筛查降低了影响持续了30多年的结直肠癌死亡率(参见，例如，Shaukat 2013N Engl J Med.369(12):1106-14)。此外，结直肠癌特别难以治疗，至少部分是因为没有及时筛查的结直肠癌可能直到癌症过了早期阶段才被检测到。至少出于这个原因，结直肠癌的治疗通常是不成功的。为了使结直肠癌结果的全人群改善最大化，根据本公开的筛查的利用可以与例如合格受试者的招募配对以确保广泛筛查。

在各种实施方式中，包括一种或多种本文公开的方法和/或组合物的结直肠癌筛查之后是结直肠癌的治疗，例如早期结直肠癌的治疗。在各种实施方式中，结直肠癌例如早期结直肠癌的治疗包括施用治疗方案，所述治疗方案包括手术、放射疗法和化学疗法中的一种或多种。在各种实施方式中，结直肠癌例如早期结直肠癌的治疗包括施用包括本文提供的一种或多种治疗的治疗方案，以用于治疗0期结直肠癌、I期结直肠癌和/或II期结直肠癌。

在各种实施方式中，结直肠癌的治疗包括通过以下中的一种或多种来治疗早期结直肠癌，例如0期结直肠癌或I期结直肠癌：手术切除癌组织(例如通过局部切除(例如通过结肠镜)、部分结肠切除术或全结肠切除术)。

在各种实施方式中，结直肠癌的治疗包括通过以下中的一种或多种来治疗早期结直肠癌，例如II期结直肠癌：手术切除癌组织(例如，通过局部切除(例如，通过结肠镜)、部分结肠切除术或全结肠切除术)、手术切除已识别的结直肠癌组织附近的淋巴结，以及化学疗法(例如，施用5-FU和亚叶酸、奥沙利铂或卡培他滨)。

在各种实施方式中，结直肠癌的治疗包括通过以下中的一种或多种来治疗III期结直肠癌：手术切除癌组织(例如，通过局部切除(例如，通过基于结肠镜检查的切除)、部分结肠切除术或全结肠切除术)、手术切除已识别的结直肠癌组织附近的淋巴结，以及化学疗法(例如，施用5-FU和亚叶酸、奥沙利铂或卡培他滨中的一种或多种，例如以下述组合：(i)5-FU和亚叶酸，(ii)5-FU、亚叶酸和奥沙利铂(例如，FOLFOX)，或(iii)卡培他滨和奥沙利铂(例如，CAPEOX))和放射疗法。

在各种实施方式中，结直肠癌的治疗包括通过以下中的一种或多种来治疗IV期结直肠癌：手术切除癌组织(例如，通过局部切除(例如，通过基于结肠镜检查的切除)、部分结肠切除术或全结肠切除术)、手术切除已识别的结直肠癌组织附近的淋巴结，手术切除转移灶、化学疗法(例如，施用5-FU、亚叶酸、奥沙利铂、卡培他滨、伊立替康、VEGF靶向治疗剂(例如，贝伐单抗、阿柏西普、或雷莫芦单抗)、EGFR靶向治疗剂(例如，西妥昔单抗或帕尼单抗)、瑞戈非尼、三氟尿苷和替吡嘧啶中的一种或多种，例如以下述组合：(i)5-FU和亚叶酸，(ii)5-FU、亚叶酸和奥沙利铂(例如，FOLFOX)，(iii)卡培他滨和奥沙利铂(例如，CAPEOX)、以及(v)氟尿嘧啶和替吡嘧啶(Lonsurf))、放射疗法、肝动脉输注(例如，如果癌已转移至肝脏)、肿瘤消融、肿瘤栓塞、结肠支架、结肠切除术、结肠造口术(例如，分流结肠造口术)和免疫疗法(例如，派姆单抗)。

本领域技术人员本文提供的结直肠癌的治疗可以例如如由执业医师确定的那样，单独或以任何组合，以任何顺序、方案和/或治疗程序使用。本领域技术人员将进一步理解，高级治疗选择可能适用于先前患有癌症或结直肠癌的受试者中的早期癌症，例如，被诊断为患有复发性结直肠癌的受试者。

在一些实施方式中，本文提供的用于结直肠癌筛查的方法和组合物可以为例如由个体、医疗保健机构、医疗保健从业者、医疗保险提供者、政府机构或对医疗保健费用所关注的其他各方做出的治疗和/或支付(例如，医疗保健如筛查或治疗的费用的报销或减少)的决定和/或行动给出信息。

在一些实施方式中，本文提供的用于结直肠癌筛查的方法和组合物可以为与健康保险提供者是否偿付医疗保健费用支付者或接受者(或不偿付)有关的决策给出信息，例如，用于(1)筛查本身(例如，报销筛查，除非不可用，仅适用于定期/常规筛查，或仅适用于临时和/或偶然动机的筛查)；和/或用于(2)治疗，包括例如，基于筛查结果启动、维持和/或改变治疗。例如，在一些实施方式中，本文提供的用于结直肠癌筛查的方法和组合物用作基础、有助于或支持确定是否将向医疗保健费用支付者或接受者提供报销或成本降低。在一些情况下，寻求报销或降低成本的一方可以提供根据本说明书进行的筛查的结果以及对医疗保健费用的这种报销或成本降低的请求。在某些情况下，作出关于是否提供医疗费用的报销或费用降低的决定的一方将全部或部分基于接收和/或审查根据本说明书进行的筛选的结果来作出决定。

为避免任何疑问，本领域技术人员将从本公开中理解，本说明书的用于结直肠癌诊断的方法和组合物至少用于体外使用。因此，本公开的所有方面和实施方式可以至少在体外进行和/或使用。

试剂盒

本公开内容尤其包括试剂盒，该试剂盒包括一种或多种如本文提供的用于筛查的组合物，任选地与其在筛查(例如进展期腺瘤和/或结直肠癌(例如早期结直肠癌)的筛查)中的使用说明书组合。在各种实施方式中，用于筛查的试剂盒可包括以下中的一种或多种：一种或多种寡核苷酸引物(例如，一个或多个寡核苷酸引物对，例如见表1和2)、一种或多种MSRE、一种或多种用于qPCR的试剂(例如，足以完成qPCR反应混合物的试剂，包括但不限于dNTP和聚合酶)，以及用于结直肠癌筛查的试剂盒的一种或多种成分的使用说明书。在各种实施方式中，用于结直肠癌筛查的试剂盒可包括以下中的一种或多种：一种或多种寡核苷酸引物(例如，一个或多个寡核苷酸引物对，例如见表1和2)、一种或多种亚硫酸氢盐试剂、一种或多种用于qPCR的试剂(例如，足以完成qPCR反应混合物的试剂，包括但不限于dNTP和聚合酶)，以及用于结直肠癌筛查的试剂盒的一种或多种成分的使用说明书。

在某些实施方式中，本公开的试剂盒包括用于扩增如本文公开的甲基化基因座和/或DMR的至少一个寡核苷酸引物对。

在一些情况下，本公开的试剂盒包括用于扩增本公开的一个或多个甲基化基因座的一个或多个寡核苷酸引物对。在一些情况下，本公开的试剂盒包括用于扩增一个或多个甲基化基因座的一个或多个寡核苷酸引物对，所述一个或多个甲基化基因座是或包括表1中提供的一个或多个基因的全部或部分。在一些特定情况下，本公开的试剂盒包括用于多个甲基化基因座的寡核苷酸引物对，每个甲基化基因座是或包括表1中鉴定的基因的全部或部分，所述多个甲基化基因座包括，例如3、4、5、6、7、8、9、10、11、12、13、14、15、16或更多个甲基化基因座，例如，如表1所提供的。

在一些情况下，本公开的试剂盒包括表1和2中所示的一个或多个寡核苷酸引物对，其用于扩增本公开的一种或多种DMR。在一些情况下，本公开的试剂盒包括用于扩增一种或多种DMR的一个或多个寡核苷酸引物对，这些DMR是或包括表1中鉴定的基因的全部或一部分，或在表1中鉴定的基因之内。在一些特定实施方式中，本公开的试剂盒包括用于多个DMR的寡核苷酸引物对，每个DMR是或包括表1中鉴定的基因的全部或部分，或在表1中鉴定的基因之内，例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16个或更多个DMR。

用于扩增本公开的一种或多种DMR的优选寡核苷酸引物对列于表2中：

表2：用于MSRE-qPCR方法的最佳性能测定的引物序列

本公开的试剂盒还可包括单独或在单一溶液中的一种或多种MSRE。在各种实施方式中，一个或多个MSRE选自包括AciI、Hin6I、HpyCH4IV和HpaII的MSRE组(例如，使得该试剂盒包括AciI、Hin6I和HpyCH4IV，单独或在单一溶液中)。在某些实施方式中，本公开的试剂盒包括一种或多种用于qPCR的试剂(例如，足以完成qPCR反应混合物的试剂，包括但不限于dNTP和聚合酶)。

实施例

实施例1：与进展期腺瘤和/或早期结直肠癌相关的标志物的鉴定

在潜在标志物选择的初始阶段，从健康患者、进展期腺瘤患者和结直肠癌患者采集血浆。血浆被分为4个独立的组：健康(CTR)、进展期腺瘤(AA)、1期癌(CRC1)、混合期癌(CRC)。CTR、AA和CRC池被分成3个技术重复样品，并作为单独的样品来处理。使用QIAamp循环核酸试剂盒从每个池中提取无细胞DNA(cfDNA)。使用EZ DNA Methylation-Lightning试剂盒(ZymoResearch)对提取的cfDNA进行亚硫酸氢盐转化。

使用Accel-NGS甲基序列DNA文库试剂盒(Swift Biosciences)从亚硫酸氢盐转化的cfDNA制备测序文库，然后使用NovaSeq6000(Illumina)设备以37.5x的平均深度进行测序，其中使用配对末端测序(2x150 bp)。将测序的读出结果与亚硫酸氢盐转化的人类基因组(Ensembl 91数据库)比对，其中使用亚硫酸氢盐读取映射器(Bisulfite Read Mapper)和Bowtie2，并遵循标准步骤：

评估测序质量

与参照基因组(hG38)比对

接头二聚体的去重和清理

甲基化调用

CpG计数按其文库大小归一化，并计算技术重复样品的平均覆盖率。链覆盖率(对于每个CpG)还表明，大多数读出结果与正向或反向链完全对齐，或者达到来自两条链的一半覆盖率。将来自正向链和反向链的计数相加并计算甲基化比例。甲基化CpG的覆盖分布表明，在血浆中大多数(在基因组的所有CpG中)被覆盖，所有组的覆盖率峰值都在9左右，且在晚期CRC组中略高。

CpG密集区域是通过调整相邻CpG(hg38数据库)之间的最大距离来定义的。基于这个距离阈值(4395bp)，将CpG归类到基因座中。从这些基因座，计算每个距离阈值的CpG之间的长度和平均距离。

血液中cfDNA片段的大小主要取决于包裹在核小体周围(以保护其免于降解)的DNA的长度。两个主要结构是核小体和染色体(核小体+接头组蛋白)，分别保护约147bp和约167bp的DNA(Fan等，2008；Snyder等，2016)。选择77bp的距离(第65百分位数)，其中中位基因座大小为140bp，基因座内CpG之间的中位距离为43bp。

首先，低于4的CpG计数被过滤掉，覆盖率高于90的CpG也被过滤掉，因为这些主要代表错误匹配。对于所有定义的基因座，平均甲基化和覆盖率是根据基因座内的所有CpG和前5个CpG(最高甲基化差异)来计算的。

覆盖截止值(cut-off)和排最前的CpG(top CpG)的数量都可以调整。标志物的选择是为了使对照和进展期腺瘤患者的血浆之间的差异最大化。对于每个基因座，计算以下值：AA CpG覆盖率、AA甲基化差异(与CTR相比)、CTR甲基化比例、CTR覆盖率、基因座内的CpG数量。使用以下过滤器选择排最前的基因座：AA甲基化差异>0.2，CTR甲基化比例<0.1。还目视检查了所有区域。最终的选择包含147个差异甲基化区域和250个单CpG。

实施例2：血浆样品上的选定的差异甲基化区域的验证

出于筛选目的，重要的是允许从容易获得的生物样品(例如血液、尿液或粪便)中检测诊断标志物。然而，由于循环中的肿瘤衍生的DNA的浓度低(相对于非肿瘤cfDNA背景为0.1％至1％)，确认血液中的组织标志物具有挑战性。对于基于血液的验证性测试，本发明的作者选择使用甲基化敏感限制性酶(MSRE)-qPCR技术，该技术能够以高度多重形式检测<10个拷贝的靶标，使其适用于低肿瘤衍生的循环DNA情形。MSRE-qPCR测定的设计通常非常简单明了，并且不如基于亚硫酸氢盐的测定的设计复杂，因为靶向的是“天然”DNA，不需要事先进行化学改变。然而，引物选择要求覆盖至少存在一个MSRE切割位点的目标区域。富含CpG的区域大多也是甲基化差异的候选区域，是MSRE-qPCR测定设计的完美目标，因为它们通常包含大量的MSRE切割位点，因此通常预期测定开发的成功率很高。此外，强烈建议使用多于一种MSRE，特别是限制性酶AciI、Hin6I、HpyCH4IV和HpaII通常提供非常好的富CpG序列覆盖。从最初的250个CpG靶标，本发明的作者设法开发了其中引物对覆盖至少1个限制性酶切割位点的147个测定。此外，还测量了4个已建立的对照基因(JUB、H19、SNRPN、IRF4)，以确保每次测定运行的稳健性和可重复性。然后，使用从发现患有进展期腺瘤、结直肠癌的患者和对照患者(包括结肠镜检查阴性患者、增生性息肉患者和非恶性胃肠道疾病患者)提取的DNA，评估所有测定对基于血浆的标志物检测和临床预测能力的可用性。一般测定工作流程可以在图1中示意性地看到。

更详细而言：从2017-2019年期间在西班牙和美国参加结直肠癌筛查中心和肿瘤诊所的150名参与者收集的4ml血浆。表3中描述了样品队列。cfDNA使用QIAamp MinEluteccfDNA试剂盒提取，用于遵循制造商定义的操作规程(QIAamp MinElute ccfDNA手册08/2018，Qiagene)手动分离样品。1/3的洗脱cfDNA体积直接用于目标区域的PCR扩增和连续的uQPCR分析。该反应起到品控作用，显示出所关注的靶标是否可以从血浆中以其天然DNA形式检测到和量化。最初洗脱的cfDNA体积的剩余2/3用于用甲基化特异性限制性酶(AciI、Hin6I或HpyCH4IV(每个靶标1-15个切割位点))消化，以富集甲基化衍生信号。甲基化敏感的限制性酶检测未甲基化的DNA区域，随后DNA链被消化，从而从样品中消除，仅留下完整且可量化的甲基化区域。

表3：描述了本研究中使用的样品队列，示出了试点队列中用于初始标志物评估和预测模型开发的样品，以及用于预测算法验证的验证队列样品

qPCR循环阈值(ct)用于所有连续数据分析。为了简化可视化，所有ct值都从最大阈值45.01中减去。R版本3.3.2软件用于数据分析。通过具有函数prcomp的主成分分析(PCA)进行的无监督分析首先用于评估对甲基化标志物的总体辨别能力。从图2中可以看出，结直肠癌和对照+GID组之间可以看到明显的分离，但在进展期腺瘤和对照+GID组之间也可以看到一定的分离，表明存在具有预测进展期腺瘤潜力的成分(标志物)。

然后，本发明的作者进行了进一步分析以评估多种标志物的组合在构建预测模型中的表现，该预测模型用于相对于包括胃肠道疾病患者的对照样品检测结直肠癌和进展期腺瘤。使用78个样品(表3的试点队列)通过Monte-Carlo交叉验证运行50次来训练算法，其中提取训练集的子集来进行模型的测试和训练。随机森林算法用于特征选择，SBS方法用于对每次运行的标志物进行排序。最后，根据SBS，使用支持向量机算法在表现最佳的标志物上建立分类模型。然后将SVM模型应用于剩余样品(表3的验证队列)。

在72个样品的验证集(表3的验证队列)上评估了标志物的不同组合，显示出使用2种标志物(表4)已经实现了75％的AUC。将标志物组增加到6种、12种提高了准确性，使用12种标志物组获得了最佳结果，其中AUC为79％，检测AA+CRC的灵敏度为78％、特异性为73％。AA的灵敏度为62.5％(对于具有高级别异型增生的进展期腺瘤患者和具有低级别异型增生但尺寸>＝10mm的患者可以获得相同的灵敏度)，对结直肠癌的灵敏度高达87.5％，其中67％ I期癌症、100％的II期癌症和87.5％的III期癌症被正确鉴定。

表4：根据AA+CRC与CNT+GID组的不同标志物组合的预测算法准确度评估

显示出最佳预测性能的标志物组可见于表5-表7。

表5：2种标志物的组合

表6：6种标志物的组合

表7：12种标志物的组合

单独的标志物的准确度值在图3中表示为箱线图。

实施例3：AA样品的亚组分析

本发明的作者随后进一步研究了65DMR集(表1)的区分进展期腺瘤与对照组的潜力，对照组包括结肠镜检查结果阴性的患者、增生性息肉患者和胃肠道疾病患者。对于最佳标志物排序和预测算法开发，使用如表3试点队列所示相同的24个进展期腺瘤病例和30个对照病例。16个进展期腺瘤和40个对照病例(表3验证队列)用于验证开发的模型。

使用Monte-Carlo交叉验证运行50次来训练算法，其中提取训练集的子集来进行模型的测试和训练。随机森林算法用于特征选择，SBS法用于在每次运行中对标志物进行排序。最后，根据SBS，使用支持向量机算法在性能最佳的标志物上建立分类模型。在56个样品的验证集(表3)上评估标志物的不同组合，其显示出使用2种标志物已经可以以80％的特异性实现50％的灵敏度(表8)。将标志物组增加到3种标志物达到最佳准确度，其中AUC为78％，检测AA的灵敏度为69％、特异性为80％(表8)。

表8.根据AA与CNT+GID组的不同标志物组合的预测算法准确度评估

对最佳性能组有贡献的单个标志物列于表9-表10。

表9：2种标志物的组合

表10：3种标志物的组合

单独的标志物的准确度值在图4中表示为箱线图。

实施例4：结直肠癌样品的亚组分析

本发明的作者随后进一步研究了65DMR集(表1)的区分结直肠癌与对照组的潜力，对照组包括结肠镜检查结果阴性的患者、增生性息肉患者和胃肠道疾病患者。对于最佳标志物排序和预测算法开发，使用如表3试点队列所示相同的24个结直肠癌病例和30个对照病例。16个结直肠癌和40个对照病例(表3验证队列)用于验证开发的模型。

使用Monte-Carlo交叉验证运行50次来训练算法，其中提取训练集的子集来进行模型的测试和训练。随机森林算法用于特征选择，SBS法用于在每次运行中对标志物进行排序。最后，根据SBS，使用支持向量机算法在性能最佳的标志物上建立分类模型。在56个样品的验证集(表3)上评估标志物的不同组合，其显示出使用2种标志物已经可以以78％的特异性实现69％的灵敏度(表11)。将标志物组增加到3种和9种标志物改进了结果，而18种标志物的组给出了最佳准确度，其中AUC为95％，检测CRC的灵敏度为94％、特异性为83％(表9)。

表11.根据CRC与CNT+GID组的不同标志物组合的预测算法准确度评估

对最佳性能组有贡献的单个标志物列于表12-表15。

表12：2种标志物的组合

表13：3种标志物的组合

表14：9种标志物的组合

表15：18种标志物的组合

SEQ ID NO	关联基因	chr	开始	结束
					SEQ ID NO:5	NA	3	75609726	75609832
SEQ ID NO:27	NA	19	22709270	22709382
					SEQ ID NO:36	FLI1,LOC101929538	11	128685299	128685448
SEQ ID NO:45	ADSSL1	14	104736436	104736562
					SEQ ID NO:59	CD8B,ANAPC1P1	2	86862416	86862559
SEQ ID NO:14	NOS3	7	150996901	150997007
					SEQ ID NO:52	NA	12	53694915	53695058
SEQ ID NO:53	NA	12	53695032	53695180
					SEQ ID NO:37	SYCP1	1	114855187	114855327
SEQ ID NO:46	MAP3K6,FCN3	1	27369167	27369316
					SEQ ID NO:10	CFAP44	3	113441519	113441620
SEQ ID NO:39	NA	3	45036223	45036316
					SEQ ID NO:43	ZAN	7	100785886	100786015
SEQ ID NO:32	ENG	9	127828322	127828421
					SEQ ID NO:22	RASA3	13	114111799	114111878
SEQ ID NO:52	NA	12	53695146	53695232
					SEQ ID NO:25	NA	17	78304805	78304921
SEQ ID NO:15	LOC101929234,ZNF503-AS2	10	75407300	75407400

单独的标志物的准确度值在图6中表示为箱线图。

表2中列出了用于最佳重整测定的引物对。设计这些引物对来扩增所关注的DMR，条件是至少覆盖1个甲基化特异性限制性酶切割位点。在大多数情况下，覆盖了3至15个单独的切割位点。

序列表

<110> 通用诊断公司

<120> 进展期腺瘤和/或早期结直肠癌的检测

<130> AX200122WO

<150> US63/011,970

<151> 2020-04-17

<160> 195

<170> BiSSAP 1.3.6

<210> 1

<211> 108

<212> DNA

<213> 智人(Homo sapiens)

<400> 1

cgatgcttgg ccaatgaaaa gaggtctacc cgagagtgcg acgcgcaatg ggcgggactt 60

ccggcgtctc ccctcggcgg ttgctttcgc tgccctcaag agaactca 108

<210> 2

<211> 116

<212> DNA

<213> 智人(Homo sapiens)

<400> 2

gcaaggtgca gatggtgaag gatgcacacg agggccgcat caccacgctg cggaagaaaa 60

agaaggggaa ggatggagcc ggggccaagg aggctgataa gggcacaagc aaagcc 116

<210> 3

<211> 115

<212> DNA

<213> 智人(Homo sapiens)

<400> 3

ctcctctggc tctcctgctc catcgcgctc ctccgcgccc ttgccacctc caacgcccgt 60

gcccagcagc gcgcggctgc ccaacagcgc cggagcttcc ttaacgccca ccacc 115

<210> 4

<211> 124

<212> DNA

<213> 智人(Homo sapiens)

<400> 4

gaggcaaaaa ggacaatcgg caagtaaata gtaaatgaac aagaagaccc cggttgtgag 60

aaaatgttat aaagcaaata aatcagagaa atgtgatcac aaaccctggg tgggtgaagg 120

gtac 124

<210> 5

<211> 107

<212> DNA

<213> 智人(Homo sapiens)

<400> 5

cctgcgacgt gaatcgtcat atccagaggg gggtgatatg actccccgca tcgcgggggc 60

ctcaccccat tgcgatgggg gtcctaagag ccagggggag atagggg 107

<210> 6

<211> 81

<212> DNA

<213> 智人(Homo sapiens)

<400> 6

agctgaggga aagggggaag tcactgggct gggggccggg gccgctcact ctggcctcct 60

ctgaggggtc cactggggtt c 81

<210> 7

<211> 106

<212> DNA

<213> 智人(Homo sapiens)

<400> 7

tgctgaggtc caaactcacc gaaggtactg accgccgcgg ctcctctctt cacagcgtct 60

gccggaggcc tccgtttact ccggttaccg agacaacgcc acccct 106

<210> 8

<211> 129

<212> DNA

<213> 智人(Homo sapiens)

<400> 8

ccttccccag cctaagaagg tttcctctcc gggagtcacc caaggtgtgc tgaccctggc 60

ctgggaccct gggaccgtgg cgctcccacg ctagcagcga cacggccagt gtctgtccac 120

tcagaggcc 129

<210> 9

<211> 90

<212> DNA

<213> 智人(Homo sapiens)

<400> 9

gccagtgagt cagaggcaga ggtgccagag accccgcccg aagggaggag atctgagagc 60

ctgcagccac aggctcctcc aggactcgag 90

<210> 10

<211> 102

<212> DNA

<213> 智人(Homo sapiens)

<400> 10

taccgagaca acgccacccc tcttccaggg aggcggaacc agggcgggcc gtggggcgca 60

tgcgcggccg gcgtccagct ctccgggaac ccggtaccta tc 102

<210> 11

<211> 109

<212> DNA

<213> 智人(Homo sapiens)

<400> 11

gagctgggac aagaagggaa cacggtacca gggtagcaga agacaggcac cccccgtccc 60

ccagtcctag ggcttcctca ccgcgcctgt gaggagctcc aggcctgtg 109

<210> 12

<211> 95

<212> DNA

<213> 智人(Homo sapiens)

<400> 12

gctctccggg aacccggtac ctatccgccc tttggtcggg ccttctccgc ctcatgacac 60

tggttcaaag ccaaacagaa aagcccgacg agttt 95

<210> 13

<211> 99

<212> DNA

<213> 智人(Homo sapiens)

<400> 13

gcgtctctgt ggccgtgaag tgtatgcatg cgtgcccatg ttgatgcggc gccgtgcggg 60

aggcgggcat cccctgctgt acatgggagg gaggctgtc 99

<210> 14

<211> 107

<212> DNA

<213> 智人(Homo sapiens)

<400> 14

ccggatccag tgggggaagc tgcaggtgcg gctggccagc gactgagaga cccgggcgct 60

accaaaaggg gagcggggtg gcggggcagt tcctaaggct tcccggg 107

<210> 15

<211> 101

<212> DNA

<213> 智人(Homo sapiens)

<400> 15

aatacatcca gctcgcaggc atcctgcaag aaacggctcc cggctcgcgt gtacgccgac 60

acctcggccc aacgcaggac tcgaggtggt ttctagtgcc c 101

<210> 16

<211> 107

<212> DNA

<213> 智人(Homo sapiens)

<400> 16

gggagcctgg aggggttgac accgcctgct ccaccgcaag cccctggagg aagagccccg 60

ctgtgcccga gagcgagcgc gggcaggtgt aactacccgg ggctggg 107

<210> 17

<211> 111

<212> DNA

<213> 智人(Homo sapiens)

<400> 17

cctctgcttc aggtgcttgg ctagagaaag ggcggcaaga cggggcagtg cgtgtgcgcg 60

cgcgggcaag tgcatgtgag tgcacactta tgtgagcgca tgtgtgtctg c 111

<210> 18

<211> 124

<212> DNA

<213> 智人(Homo sapiens)

<400> 18

gcccaagggc cacaagagta tgacggggct gtacgagctg ctgtgacggg tgctgcatgc 60

gctgctccgt ctgcaccgca cgctcacctc ctggctccgc gttcggttcc acacctggaa 120

ctgg 124

<210> 19

<211> 110

<212> DNA

<213> 智人(Homo sapiens)

<400> 19

cggttccaca cctggaactg gatttggcgg cgctgctgcc gcgccgcctc tgccgcggtc 60

ctagagccgc ttggcttcac gctccgcaag catggaacag ccctcaccac 110

<210> 20

<211> 81

<212> DNA

<213> 智人(Homo sapiens)

<400> 20

cggttccaca cctggaactg gatttggcgg cgctgctgcc gcgccgcctc tgccgcggtc 60

ctagagccgc ttggcttcac g 81

<210> 21

<211> 91

<212> DNA

<213> 智人(Homo sapiens)

<400> 21

ggtcctagag ccgcttggct tcacgctccg caagcatgga acagccctca ccacacgcac 60

ccgcgcgggg ggtagtgcct gcccgcagcc c 91

<210> 22

<211> 80

<212> DNA

<213> 智人(Homo sapiens)

<400> 22

tgtcaaacct ccatctgtgg tcaggagtta ggacatcccc agctgcaatt tgagcaaaga 60

cggcgcttcc agaggatcat 80

<210> 23

<211> 106

<212> DNA

<213> 智人(Homo sapiens)

<400> 23

tggggccgaa gagatccttg aacacgtcgt aggactcctc gtcggccgcc acgcggccca 60

cggccctgag tacgggtggc ccgggctgtc cacgcgggtc tggatg 106

<210> 24

<211> 130

<212> DNA

<213> 智人(Homo sapiens)

<400> 24

gctgcagttt cgtcagccct tggctccggg ctctgcaggc ggaatcccga gcctgcgtga 60

gggccgccct ggcctcggcg tgtgtcctgg gaaggggcgt tggaagcctc tctgcttgtc 120

ttggctgcct 130

<210> 25

<211> 117

<212> DNA

<213> 智人(Homo sapiens)

<400> 25

cagccctagg gagacagcag gatggttcca ggaagcctgg gccgctcccc agatcaatgc 60

agggacggac agcagccagc aggctgggcc acggcatcag agctggggtc aagaggt 117

<210> 26

<211> 93

<212> DNA

<213> 智人(Homo sapiens)

<400> 26

ggctcacctt caggaagcac ctgtggcggg ccgcgtcacc cactcgggac cccggagacc 60

aagtccgctc ttctgcacgt aaaccctgcc tcc 93

<210> 27

<211> 113

<212> DNA

<213> 智人(Homo sapiens)

<400> 27

gggccagttc ctcctaccag cttcctgctg ccacctcggc ttccatcaga gggacgctta 60

ggatggcgca ggggcccgga gacactgtga agagtccagg ggaatgagga ggg 113

<210> 28

<211> 107

<212> DNA

<213> 智人(Homo sapiens)

<400> 28

ggtctttccc acacctctgc accttgttac ctgactttcg gcttcaggat ccgcagcgtg 60

cacccgcgtt ccgtgagtgc cctataggca gtcagcatgc ccctctg 107

<210> 29

<211> 116

<212> DNA

<213> 智人(Homo sapiens)

<400> 29

gcctggccac cacagagaag aagacggagc agcagcggcg gcgggagaag gctgtgcaca 60

ggctggtgag cgcctgggcc agcggggcct gcctctgatg cctcgccccc ttcctt 116

<210> 30

<211> 90

<212> DNA

<213> 智人(Homo sapiens)

<400> 30

tgctctctct ccaaaggcga gttgatcaca gacgctggca gtgagtcagc ggcaccgcca 60

gggctgctga gaaatccctc ctgctgtccg 90

<210> 31

<211> 88

<212> DNA

<213> 智人(Homo sapiens)

<400> 31

cctgggaacc agtgctggag aaagtatgtg gaagctggcg atggagaagg cgcgcgcatg 60

tgtgcacaac ctcgctctgg aggagtca 88

<210> 32

<211> 100

<212> DNA

<213> 智人(Homo sapiens)

<400> 32

gcccctgtaa aatggggata cagcagggca cgacgtctgt tggtcgcctg gcactgggtc 60

ggccaccgag gccgcgcctt ggcctctttg tcccctctgg 100

<210> 33

<211> 85

<212> DNA

<213> 智人(Homo sapiens)

<400> 33

tgggcacttg tcatcatggg tgtttggaaa gcaactctac gttctagcct gtgctccatc 60

gttccttcta catacaagtg atgca 85

<210> 34

<211> 109

<212> DNA

<213> 智人(Homo sapiens)

<400> 34

acactttgaa aagcgtggcg ttccagcgca aaccaacccg aacgggttgg aagggggcag 60

tcctttcttc ccgcaagttc ggggctcgag agacggctgc aggaaggcc 109

<210> 35

<211> 110

<212> DNA

<213> 智人(Homo sapiens)

<400> 35

aaaaggctcc gacgatgctc cagacgcgga cacggccatc atcaatgcag aaggcgggca 60

gtcaggaggg gacgacaaga aggaatattt catctagagg cgcctgccca 110

<210> 36

<211> 150

<212> DNA

<213> 智人(Homo sapiens)

<400> 36

gcaccaagaa ctaacacatc ctggagctgc ccggagttcc gctcctgcgg gcttagcagg 60

aaagggtgcc taaggtgagt gcccacttgc gtccgatcct ctgggggcga tgcagggtcg 120

gggcgcctca gtgtgtctcg ctgcttgttc 150

<210> 37

<211> 141

<212> DNA

<213> 智人(Homo sapiens)

<400> 37

gaagggaacg ggctttcttt tcaggccagc gtggcagcgg gcggtagggc gaaagggaga 60

aggaaacgag ggtttattcc gttgcccact ccgcggtaag cgacgttgta gggctccact 120

gtagcgagag ccccgtggat t 141

<210> 38

<211> 123

<212> DNA

<213> 智人(Homo sapiens)

<400> 38

cgagaaggga ggaggtgaag gagggcgagc tgagcacacg cgcttcatgc cacaggaggg 60

tgggaatgag cggaggactg aggagaggaa ggagggaaag aatagggaga tgaaaacgcc 120

ccg 123

<210> 39

<211> 94

<212> DNA

<213> 智人(Homo sapiens)

<400> 39

tgagcggagg actgaggaga ggaaggaggg aaagaatagg gagatgaaaa cgccccggtc 60

tgctgctaag cacagcacag ttaccaaagc cagg 94

<210> 40

<211> 119

<212> DNA

<213> 智人(Homo sapiens)

<400> 40

gctctgatgc ctctccctcc acaccacacc tgtgatctac tgtgcatagg atctcacagg 60

cccaataaca gagctggagt tcctcttacg tgacacagga tttggcattt gcctgtgcc 119

<210> 41

<211> 116

<212> DNA

<213> 智人(Homo sapiens)

<400> 41

gacatcctcc ttggcagcct ttcaacacgt ttctcaaatc ctttcccagc ttcctgtgca 60

gcctttcctc ctcagcctgg ctgccttact gtctcagctc cgatctctgg gccttt 116

<210> 42

<211> 106

<212> DNA

<213> 智人(Homo sapiens)

<400> 42

tgagcgctta acgatccgga aagaggaaga tggagacgct ggaaaggaag aggacgccag 60

gacgcgcatc atcagacgcg cagctctgga atttgaggac ggcatg 106

<210> 43

<211> 130

<212> DNA

<213> 智人(Homo sapiens)

<400> 43

tgacctcagg tgatccaccc gtctcggcct cccaaagtgt tgggattaca ggcgtgagcc 60

gccgcgccca gccccctcct cactctcttt ctcttcctgt aacttctaca gctgggcaag 120

agctgggtct 130

<210> 44

<211> 80

<212> DNA

<213> 智人(Homo sapiens)

<400> 44

ccccataggg aggacttgcg cacagttggc gctgggtaaa tgctgggaga actgctgcgg 60

gcgaggggaa agggttaaag 80

<210> 45

<211> 127

<212> DNA

<213> 智人(Homo sapiens)

<400> 45

cacagacacc ctgagcttgc aacactccgg gcctctgccg cgtgtttatt tcaggatgcc 60

gtggcatttg ggtgaccttt tgtgctcacc atggcttgcg tcgtctccgg gtcactctcg 120

tctggac 127

<210> 46

<211> 150

<212> DNA

<213> 智人(Homo sapiens)

<400> 46

gcaaaggcaa ggtggctgac gatccggaag ctgtacagga gagataaggg cactggctgc 60

cagagtgccc tatcgaagca tcatccgaac cctgcggtag gggtggccca caccacggcc 120

tgaggcccag tcaatgccat atttgtgggc 150

<210> 47

<211> 124

<212> DNA

<213> 智人(Homo sapiens)

<400> 47

tgccagagtg ccctatcgaa gcatcatccg aaccctgcgg taggggtggc ccacaccacg 60

gcctgaggcc cagtcaatgc catatttgtg ggcggcagcc tcagacactg catagcgacc 120

attg 124

<210> 48

<211> 78

<212> DNA

<213> 智人(Homo sapiens)

<400> 48

gtcatcagtg aatcgaccac aaagagcctt tgcggaggtg atttacagga gagctctgat 60

gtctgctgtc ccctgcac 78

<210> 49

<211> 149

<212> DNA

<213> 智人(Homo sapiens)

<400> 49

ggagagcacc aagaggctcc caataatctg accgctggtg cacatccttc ctcggtcatc 60

ttccttccag atcagagagg gaaatcaacc atctaccttt ttttcttcca ctatcctcct 120

taccccttcc accccctacc agatcccaa 149

<210> 50

<211> 112

<212> DNA

<213> 智人(Homo sapiens)

<400> 50

taaccacctg cacctctgct gcaatgtaaa cagcagatgt gggcgcaggg tgagaaggga 60

gaggaagcta cgtgcaatgg caggttgggg aataaggagg cagaggggct cc 112

<210> 51

<211> 134

<212> DNA

<213> 智人(Homo sapiens)

<400> 51

acaccccgcg gcaggacttc tagagaagcc caggatctgt cccgtgccgc cgctgctccc 60

ctccccagac acctctccac gtctcctacc cagggggtcg catccctagc ccttcactga 120

ccccagctct tccc 134

<210> 52

<211> 144

<212> DNA

<213> 智人(Homo sapiens)

<400> 52

catctcctcc tcgcaaaccc caagccaagg caagctggat gaagcgctcc ctgggcaggc 60

ccggctctcc gtgtccctcc atcacctgac cccgctggct ctcgcagacc ccttcctcca 120

cactcactcc tcccggctct cctt 144

<210> 53

<211> 149

<212> DNA

<213> 智人(Homo sapiens)

<400> 53

ccacactcac tcctcccggc tctccttcta taatctcctg acatctcttc aaatccaatt 60

attgaattaa ttgacgtacg aacccagagg caaacagaaa ggggcggcaa acactgggcg 120

gctcagattt atccttcggc ctccgcagg 149

<210> 54

<211> 87

<212> DNA

<213> 智人(Homo sapiens)

<400> 54

tgggcggctc agatttatcc ttcggcctcc gcagggcccg gccggacgag atttactggg 60

cctcgaacac ggcgacagtt caaacct 87

<210> 55

<211> 131

<212> DNA

<213> 智人(Homo sapiens)

<400> 55

tcggcagtga aaagcgggag attagaaaat gtttcatgct aatttccatg gagatttctt 60

taatttagcg aagactgctt cccgggctcc gcctggcccg cgccggcccg cgtcctcggt 120

ggtctgggcg c 131

<210> 56

<211> 125

<212> DNA

<213> 智人(Homo sapiens)

<400> 56

ggctctcggg ctctcgcttt tttttttttt ttttctttcc gcggcagtct taggattctt 60

gtcacatgat ggcttcatcg ggcccttctc ctcctgatcc tttcaagctc tttctcctgc 120

ctggc 125

<210> 57

<211> 143

<212> DNA

<213> 智人(Homo sapiens)

<400> 57

ctggggagaa gtgaccccat tcaatagtcc ttggtctcct tctgccctgc ggctgcgctt 60

cctcggctct cacggcacca gcagaattcc atgtgagagg gagcttgtcg agcgtggcct 120

cttcccactt ggggctgctt tct 143

<210> 58

<211> 121

<212> DNA

<213> 智人(Homo sapiens)

<400> 58

gcaccatcct cagagcttca gaccatacat tgacagtgag caaagggggc cccaggcagg 60

cgggtctggg gccaaggagg gcggctcccc tgcgcggatc cttccctggt ggctcccaaa 120

t 121

<210> 59

<211> 144

<212> DNA

<213> 智人(Homo sapiens)

<400> 59

gctgggaact ggaggtgcag agaaggcccc gacgctgttt gtaggttgtg ggggtgcagc 60

aagacctaga tcttaagaat ttcgaaggac tgtgacgatc accggctgcg ccctgccggc 120

gagtgccctg gggctggctc tatt 144

<210> 60

<211> 117

<212> DNA

<213> 智人(Homo sapiens)

<400> 60

gcttcaaacg ccgtatcatg ttgctttaaa acctgcgggt aacagcataa gctgagtttt 60

ctatcttaga actcttaacc ccaagaacac tcttcacagg ccctgatagg tggaccc 117

<210> 61

<211> 74

<212> DNA

<213> 智人(Homo sapiens)

<400> 61

tggtgccagg ggttaccaca aagaggcggc agagccatgg cccaccagcc acttggcagg 60

ctggttgtct ggtg 74

<210> 62

<211> 112

<212> DNA

<213> 智人(Homo sapiens)

<400> 62

gagacaacag cccagacccc catcacggag ctgcacgtga ccctggaact taacagcttc 60

cagttgttcc ctagacagtc attgtcttta tggtgccttt tcccccatca gg 112

<210> 63

<211> 116

<212> DNA

<213> 智人(Homo sapiens)

<400> 63

tgtaagatga cacagctata ttttctggga gagggcggga ggatgctcag cgagggtggc 60

ccggagtgtc cttgtacaga gtacagatgt tatgaagtgg ggaagaccag cctgtg 116

<210> 64

<211> 108

<212> DNA

<213> 智人(Homo sapiens)

<400> 64

ggaggagctg aggtttcggc tgagccccca gcctcccccg accgcacagc ctcgggcatg 60

aacccgcgaa gccagacgct tagttgctta tcaggccatc gctgtaca 108

<210> 65

<211> 120

<212> DNA

<213> 智人(Homo sapiens)

<400> 65

aggaggagac cctgccccag aaataggcca gtgcttgtta tgcaggcctt ggcggttccc 60

cgtttcctta cgtaacctca gtgttcacgc tgtttccttt tgttgattcc ctccgtgtga 120

<210> 66

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 66

cgatgcttgg ccaatgaaaa gagg 24

<210> 67

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 67

gcaaggtgca gatggtgaag gatg 24

<210> 68

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 68

ctcctctggc tctcctgctc catc 24

<210> 69

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 69

gaggcaaaaa ggacaatcgg caag 24

<210> 70

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 70

cctgcgacgt gaatcgtcat atcc 24

<210> 71

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 71

agctgaggga aagggggaag tcac 24

<210> 72

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 72

tgctgaggtc caaactcacc gaag 24

<210> 73

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 73

ccttccccag cctaagaagg tttcc 25

<210> 74

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 74

gccagtgagt cagaggcaga ggtg 24

<210> 75

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 75

taccgagaca acgccacccc tctt 24

<210> 76

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 76

gagctgggac aagaagggaa cacg 24

<210> 77

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 77

gctctccggg aacccggtac ctat 24

<210> 78

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 78

gcgtctctgt ggccgtgaag tgta 24

<210> 79

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 79

ccggatccag tgggggaagc tg 22

<210> 80

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 80

aatacatcca gctcgcaggc atcc 24

<210> 81

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 81

gggagcctgg aggggttgac ac 22

<210> 82

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 82

cctctgcttc aggtgcttgg ctaga 25

<210> 83

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 83

gcccaagggc cacaagagta tgac 24

<210> 84

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 84

cggttccaca cctggaactg gatt 24

<210> 85

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 85

cggttccaca cctggaactg gatt 24

<210> 86

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 86

ggtcctagag ccgcttggct tcac 24

<210> 87

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 87

tgtcaaacct ccatctgtgg tcagg 25

<210> 88

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 88

tggggccgaa gagatccttg aaca 24

<210> 89

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 89

gctgcagttt cgtcagccct tg 22

<210> 90

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 90

cagccctagg gagacagcag gatg 24

<210> 91

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 91

ggctcacctt caggaagcac ctgt 24

<210> 92

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 92

gggccagttc ctcctaccag cttc 24

<210> 93

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 93

ggtctttccc acacctctgc acct 24

<210> 94

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 94

gcctggccac cacagagaag aaga 24

<210> 95

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 95

tgctctctct ccaaaggcga gttg 24

<210> 96

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 96

cctgggaacc agtgctggag aaag 24

<210> 97

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 97

gcccctgtaa aatggggata cagca 25

<210> 98

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 98

tgggcacttg tcatcatggg tgtt 24

<210> 99

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 99

acactttgaa aagcgtggcg ttcc 24

<210> 100

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 100

aaaaggctcc gacgatgctc caga 24

<210> 101

<211> 26

<212> DNA

<213> 智人(Homo sapiens)

<400> 101

gcaccaagaa ctaacacatc ctggag 26

<210> 102

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 102

gaagggaacg ggctttcttt tcagg 25

<210> 103

<211> 23

<212> DNA

<213> 智人(Homo sapiens)

<400> 103

cgagaaggga ggaggtgaag gag 23

<210> 104

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 104

tgagcggagg actgaggaga ggaa 24

<210> 105

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 105

gctctgatgc ctctccctcc acac 24

<210> 106

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 106

gacatcctcc ttggcagcct ttca 24

<210> 107

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 107

tgagcgctta acgatccgga aaga 24

<210> 108

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 108

tgacctcagg tgatccaccc gtct 24

<210> 109

<211> 29

<212> DNA

<213> 智人(Homo sapiens)

<400> 109

ccccataggg aggacttgcg cacagttgg 29

<210> 110

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 110

cacagacacc ctgagcttgc aaca 24

<210> 111

<211> 21

<212> DNA

<213> 智人(Homo sapiens)

<400> 111

gcaaaggcaa ggtggctgac g 21

<210> 112

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 112

tgccagagtg ccctatcgaa gcat 24

<210> 113

<211> 27

<212> DNA

<213> 智人(Homo sapiens)

<400> 113

gtcatcagtg aatcgaccac aaagagc 27

<210> 114

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 114

ggagagcacc aagaggctcc caat 24

<210> 115

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 115

taaccacctg cacctctgct gcaa 24

<210> 116

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 116

acaccccgcg gcaggacttc ta 22

<210> 117

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 117

catctcctcc tcgcaaaccc caag 24

<210> 118

<211> 23

<212> DNA

<213> 智人(Homo sapiens)

<400> 118

ccacactcac tcctcccggc tct 23

<210> 119

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 119

tgggcggctc agatttatcc ttcg 24

<210> 120

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 120

tcggcagtga aaagcgggag atta 24

<210> 121

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 121

ggctctcggg ctctcgcttt tt 22

<210> 122

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 122

ctggggagaa gtgaccccat tcaa 24

<210> 123

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 123

gcaccatcct cagagcttca gacca 25

<210> 124

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 124

gctgggaact ggaggtgcag agaa 24

<210> 125

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 125

gcttcaaacg ccgtatcatg ttgct 25

<210> 126

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 126

tggtgccagg ggttaccaca aaga 24

<210> 127

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 127

gagacaacag cccagacccc catc 24

<210> 128

<211> 34

<212> DNA

<213> 智人(Homo sapiens)

<400> 128

tgtaagatga cacagctata ttttctggga gagg 34

<210> 129

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 129

ggaggagctg aggtttcggc tgag 24

<210> 130

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 130

aggaggagac cctgccccag aaat 24

<210> 131

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 131

tgagttctct tgagggcagc gaaa 24

<210> 132

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 132

ggctttgctt gtgcccttat cagc 24

<210> 133

<211> 23

<212> DNA

<213> 智人(Homo sapiens)

<400> 133

ggtggtgggc gttaaggaag ctc 23

<210> 134

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 134

gtacccttca cccacccagg gttt 24

<210> 135

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 135

cccctatctc cccctggctc ttag 24

<210> 136

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 136

gaaccccagt ggacccctca ga 22

<210> 137

<211> 23

<212> DNA

<213> 智人(Homo sapiens)

<400> 137

aggggtggcg ttgtctcggt aac 23

<210> 138

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 138

ggcctctgag tggacagaca ctgg 24

<210> 139

<211> 23

<212> DNA

<213> 智人(Homo sapiens)

<400> 139

ctcgagtcct ggaggagcct gtg 23

<210> 140

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 140

gataggtacc gggttcccgg agag 24

<210> 141

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 141

cacaggcctg gagctcctca ca 22

<210> 142

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 142

aaactcgtcg ggcttttctg tttgg 25

<210> 143

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 143

gacagcctcc ctcccatgta cagc 24

<210> 144

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 144

cccgggaagc cttaggaact gc 22

<210> 145

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 145

gggcactaga aaccacctcg agtcc 25

<210> 146

<211> 23

<212> DNA

<213> 智人(Homo sapiens)

<400> 146

cccagccccg ggtagttaca cct 23

<210> 147

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 147

gcagacacac atgcgctcac ataa 24

<210> 148

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 148

ccagttccag gtgtggaacc gaac 24

<210> 149

<211> 23

<212> DNA

<213> 智人(Homo sapiens)

<400> 149

gtggtgaggg ctgttccatg ctt 23

<210> 150

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 150

cgtgaagcca agcggctcta ggac 24

<210> 151

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 151

gggctgcggg caggcactac 20

<210> 152

<211> 23

<212> DNA

<213> 智人(Homo sapiens)

<400> 152

atgatcctct ggaagcgccg tct 23

<210> 153

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 153

catccagacc cgcgtggaca gc 22

<210> 154

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 154

aggcagccaa gacaagcaga gagg 24

<210> 155

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 155

acctcttgac cccagctctg atgc 24

<210> 156

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 156

ggaggcaggg tttacgtgca gaag 24

<210> 157

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 157

ccctcctcat tcccctggac tctt 24

<210> 158

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 158

cagaggggca tgctgactgc ctat 24

<210> 159

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 159

aaggaagggg gcgaggcatc ag 22

<210> 160

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 160

cggacagcag gagggatttc tcag 24

<210> 161

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 161

tgactcctcc agagcgaggt tgtg 24

<210> 162

<211> 23

<212> DNA

<213> 智人(Homo sapiens)

<400> 162

ccagagggga caaagaggcc aag 23

<210> 163

<211> 30

<212> DNA

<213> 智人(Homo sapiens)

<400> 163

tgcatcactt gtatgtagaa ggaacgatgg 30

<210> 164

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 164

ggccttcctg cagccgtctc tc 22

<210> 165

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 165

tgggcaggcg cctctagatg aaat 24

<210> 166

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 166

gaacaagcag cgagacacac tgag 24

<210> 167

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 167

aatccacggg gctctcgcta cagt 24

<210> 168

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 168

cggggcgttt tcatctccct at 22

<210> 169

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 169

cctggctttg gtaactgtgc tgtgc 25

<210> 170

<211> 23

<212> DNA

<213> 智人(Homo sapiens)

<400> 170

ggcacaggca aatgccaaat cct 23

<210> 171

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 171

aaaggcccag agatcggagc tgag 24

<210> 172

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 172

catgccgtcc tcaaattcca gagc 24

<210> 173

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 173

agacccagct cttgcccagc tgta 24

<210> 174

<211> 28

<212> DNA

<213> 智人(Homo sapiens)

<400> 174

ctttaaccct ttcccctcgc ccgcagca 28

<210> 175

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 175

gtccagacga gagtgacccg gaga 24

<210> 176

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 176

gcccacaaat atggcattga ctgg 24

<210> 177

<211> 26

<212> DNA

<213> 智人(Homo sapiens)

<400> 177

caatggtcgc tatgcagtgt ctgagg 26

<210> 178

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 178

gtgcagggga cagcagacat caga 24

<210> 179

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 179

ttgggatctg gtagggggtg gaag 24

<210> 180

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 180

ggagcccctc tgcctcctta ttcc 24

<210> 181

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 181

gggaagagct ggggtcagtg aagg 24

<210> 182

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 182

aaggagagcc gggaggagtg agtg 24

<210> 183

<211> 22

<212> DNA

<213> 智人(Homo sapiens)

<400> 183

cctgcggagg ccgaaggata aa 22

<210> 184

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 184

aggtttgaac tgtcgccgtg ttcg 24

<210> 185

<211> 20

<212> DNA

<213> 智人(Homo sapiens)

<400> 185

gcgcccagac caccgaggac 20

<210> 186

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 186

gccaggcagg agaaagagct tgaaa 25

<210> 187

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 187

agaaagcagc cccaagtggg aaga 24

<210> 188

<211> 23

<212> DNA

<213> 智人(Homo sapiens)

<400> 188

atttgggagc caccagggaa gga 23

<210> 189

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 189

aatagagcca gccccagggc actc 24

<210> 190

<211> 23

<212> DNA

<213> 智人(Homo sapiens)

<400> 190

gggtccacct atcagggcct gtg 23

<210> 191

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 191

caccagacaa ccagcctgcc aagt 24

<210> 192

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 192

cctgatgggg gaaaaggcac cata 24

<210> 193

<211> 24

<212> DNA

<213> 智人(Homo sapiens)

<400> 193

cacaggctgg tcttccccac ttca 24

<210> 194

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 194

tgtacagcga tggcctgata agcaa 25

<210> 195

<211> 25

<212> DNA

<213> 智人(Homo sapiens)

<400> 195

tcacacggag ggaatcaaca aaagg 25

Claims

1.一种筛查受试者的进展期腺瘤的体外方法，所述方法包括：

-确定人类受试者的DNA样品中的以下一项或两项各自的甲基化状态：

(i)NRF1基因内的甲基化基因座；和

(ii)TMEM196基因内的甲基化基因座；

-将获得的数据与从健康个体获得的参照值进行比较，

并且

如果与参照样品相比，检测到一个或两个所述基因座各自的高甲基化，则诊断所述人类受试者的进展期腺瘤。

2.如权利要求1所述的方法，其中，NRF1基因内的甲基化基因座包含选自以下的至少一部分：具有SEQ ID NO:50的NRF1'564的至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％。

3.如权利要求1或2所述的方法，其中，TMEM196基因内的甲基化基因座包含选自以下的至少一部分：具有SEQ ID NO:49的TMEM196'651的至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％。

4.如权利要求1至3中任一项所述的方法，所述方法还包括确定包含选自以下的至少一部分的甲基化基因座的甲基化状态：SEQ ID NO:27的至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％，

并且其中，诊断步骤包括：至少基于所确定的包含SEQ ID NO:27的甲基化基因座的甲基化状态来诊断所述人类受试者的进展期腺瘤。

5.如前述权利要求中任一项所述的方法，其中，所述DNA分离自所述人类受试者的血液或血浆。

6.如前述权利要求中任一项所述的方法，其中，所述DNA是所述人类受试者的无细胞DNA。

7.如前述权利要求中任一项所述的方法，其中，甲基化状态使用定量聚合酶链反应(qPCR)来确定。

8.如前述权利要求中任一项所述的方法，其中，甲基化状态使用以下方式来确定：大规模平行测序，例如下一代测序；边合成边测序；实时单分子测序；珠乳液测序；和/或纳米孔测序。

9.一种筛查结直肠癌的体外方法，所述方法包括：

-确定人类受试者的DNA样品中的以下一项或多项各自的甲基化状态，例如以下1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19项或全部20项的甲基化状态：

(i)ADSSL1基因内的甲基化基因座，其包含选自以下的至少一部分：SEQ ID NO:45的至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％,至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％；

(ii)CFAP44基因内的甲基化基因座，其包含SEQ ID NO:7的至少一部分和/或SEQ IDNO:10的至少一部分和/或SEQ ID NO:12的至少一部分；

(iii)ENG基因内的甲基化基因座，其包含SEQ ID NO:32的至少一部分；

(iv)LINC01395基因内的甲基化基因座，其包含SEQ ID NO:16的至少一部分和/或SEQID NO:17的至少一部分；

(v)NOS3基因内的甲基化基因座，其包含SEQ ID NO:14的至少一部分；

(vi)RASA3基因内的甲基化基因座，其包含SEQ ID NO:22的至少一部分；

(vii)SYCP1基因内的甲基化基因座，其包含SEQ ID NO:37的至少一部分；

(viii)ZAN基因内的甲基化基因座，其包含SEQ ID NO:43的至少一部分；

(ix)CD8B和ANAPC1P1的重叠基因区域内的甲基化基因座，其包含SEQ ID NO:59的至少一部分；

(x)FLI1和LOC101929538的重叠基因区域内的甲基化基因座，其包含SEQ IDNO:36的至少一部分；

(xi)KCNQ1OT1和KCNQ的重叠基因区域内的甲基化基因座，其包含SEQ ID NO:33的至少一部分；

(xii)LOC101929234和ZNF503-AS2的重叠基因区域内的甲基化基因座，其包含SEQ IDNO:15的至少一部分；

(xiii)MAP3K6和FCN3的重叠基因区域内的甲基化基因座，其包含SEQ ID NO:46的至少一部分和/或SEQ ID NO:47的至少一部分；

(xiv)包含选自以下的至少一部分的甲基化基因座：SEQ ID NO:5的至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％；

(xv)包含SEQ ID NO:39的至少一部分的甲基化基因座；

(xvi)包含SEQ ID NO:52的至少一部分的甲基化基因座；

(xvii)包含SEQ ID NO:53的至少一部分的甲基化基因座；

(xviii)包含SEQ ID NO:54的至少一部分的甲基化基因座；

(xix)包含SEQ ID NO:25的至少一部分的甲基化基因座；和

(xx)包含SEQ ID NO:27的至少一部分的甲基化基因座；

-将获得的数据与从健康个体获得的参照值进行比较，

并且

如果与参照样品相比，检测到一个或多个所述基因座各自的高甲基化，则诊断所述人类受试者的结直肠癌。

10.一种在人类受试者的样品中筛查结直肠肿瘤的体外方法，所述样品选自粪便样品、结直肠组织样品、血液样品或血液制品样品，所述结直肠肿瘤选自结直肠癌和/或进展期腺瘤，所述方法包括：

确定在所述样品中鉴定出的一个或多个标志物各自的甲基化状态；

将所获得的数据与从健康个体获得的参照值进行比较，并且

如果与参照样品相比，检测到一个或多个标志物的高甲基化，则确定所述受试者是否具有结直肠肿瘤，所述结直肠肿瘤选自结直肠癌和/或进展期腺瘤；

其中，所述一个或多个标志物各自包含差异甲基化区域(DMR)中的碱基，所述差异甲基化区域(DMR)选自表1中所列的DMR。

11.如前述权利要求中任一项所述的方法，其中，每个甲基化基因座的长度等于或小于5000bp、4000bp、3000bp、2000bp、1000bp、950bp、900bp、850bp、800bp、750bp、700bp、650bp、600bp、550bp、500bp、450bp、400bp、350bp、300bp、250bp、200bp、150bp、100bp、50bp、40bp、30bp、20bp或10bp。

12.一种用于权利要求1至11中任一项所述的方法中的试剂盒，所述试剂盒包含表1和表2中所列的一个或多个寡核苷酸引物对，用于扩增一个或多个相应的甲基化基因座。

13.用于在权利要求1至11中任一项所述的体外方法中筛查结直肠癌的诊断性qPCR反应，其中，所述诊断性qPCR反应包括：人DNA、聚合酶、用于扩增表1的一个或多个相应的甲基化基因座的表1和表2中的一个或多个寡核苷酸引物对、以及任选的至少一种甲基化敏感限制性酶。