CN113557308A

CN113557308A - 检测子宫内膜癌

Info

Publication number: CN113557308A
Application number: CN202080017116.XA
Authority: CN
Inventors: 威廉·R·泰勒; 约翰·B·基谢尔; 道格拉斯·W·马奥尼; 大卫·A·阿尔奎斯特; 哈特姆·T·阿拉维; 玛丽亚·贾库莫普洛斯
Original assignee: Mayo Foundation for Medical Education and Research; Exact Sciences Development Co LLC
Current assignee: Mayo Foundation for Medical Education and Research; Exact Sciences Corp
Priority date: 2019-01-24
Filing date: 2020-01-24
Publication date: 2021-10-26
Anticipated expiration: 2040-01-24
Also published as: EP3914733A1; US20220106644A1; JP2022518762A; EP3914733A4; CN113557308B; CA3127329A1; WO2020154665A1; KR20210119474A; AU2020211461A1

Abstract

本文提供了筛查子宫内膜癌(EC)的技术，并且特别但不仅仅是检测子宫内膜癌和各种子宫内膜癌亚型的存在的方法、组合物和相关用途。

Description

检测子宫内膜癌

相关申请的交叉引用

本申请要求2019年1月24日提交的美国临时专利申请No.62/796,384的优先权，其以引用的方式整体并入本文中。

技术领域

背景技术

尽管子宫内膜癌(EC)是美国和许多其它发达国家最常见的妇科恶性肿瘤，但缺乏早期检测EC的方法(参见Siegel,R.L.等人,Cancer statistics,2016.CA Cancer J Clin,2016.66(1):第7-30页；Parkin,D.等人,Global cancer statistics,2002.CA Cancer JClin.,2005.55(2):第74-108页)。虽然低风险的早期EC预后良好，5年总生存率(OS)>95％，但被诊断为III期或IV期时的5年OS分别变为68％和17％(参见Fridley,B.L.等人,PLoSONE,2010.5(9):第e12693页)。大多数EC都是低级别子宫内膜样组织学，并且之前都有增生前体；然而，更具侵袭性的3级子宫内膜样、浆液性、透明细胞和癌肉瘤组织学占新诊断的EC的10-15％，并且可能是高度致命的(参见Felix,A.S.等人,Cancer Causes Control,2010.21(11):第1851-6页；Moore,K.N.和A.N.Fader,Clin Obstet Gynecol,2011.54(2):第278-91页；Cancer Genome Atlas Research,N.等人,Nature,2013.497(7447):第67-73页；Hussein,Y.R.等人,Int J Gynecol Pathol,2016.35(1):第16-24页)。早期检测可增加治愈的机会(参见Mariani,A.等人,Gynecologic Oncology,2008.109(1):第11-18页)。

需要改进检测EC和各种EC亚型的方法。

本发明满足了这些需要。

发明内容

已经将甲基化DNA作为大多数肿瘤类型组织中潜在的一类生物标志物进行研究。在许多情况下，DNA甲基转移酶在胞嘧啶-磷酸-鸟嘌呤(CpG)岛位点处添加甲基至DNA，作为基因表达的表观遗传控制。在生物学上有吸引力的机制中，认为肿瘤抑制基因启动子区域中的获得性甲基化事件会使表达沉默，从而促进肿瘤发生。DNA甲基化可能是比RNA或蛋白质表达更具有化学和生物学稳定性的诊断工具(Laird(2010)Nat Rev Genet 11:191-203)。此外，在如散发性结肠癌等其它癌症中，甲基化标志物提供了极好的特异性，并且比单独DNA突变具有更广泛的信息和更灵敏(Zou等人(2007)Cancer Epidemiol BiomarkersPrev 16:2686-96)。

当应用于动物模型和人类细胞系时，对CpG岛的分析产生了重要的发现。例如，Zhang和同事发现来自同一CpG岛的不同部分的扩增子可能具有不同的甲基化水平(Zhang等人(2009)PLoS Genet 5:e1000438)。此外，甲基化水平在高度甲基化与未甲基化序列之间呈双峰分布，这进一步证明了DNA甲基转移酶活性的二元开关样模式(Zhang等人(2009)PLoS Genet 5:e1000438)。对鼠体内组织和体外细胞系的分析表明，只有约0.3％的高CpG密度启动子(HCP，定义为在300个碱基对区域内具有>7％CpG序列)被甲基化，而低CpG密度区域(LCP，定义为在300个碱基对区域内具有<5％CpG序列)往往以动态组织特异性模式频繁甲基化(Meissner等人(2008)Nature 454:766-70)。HCP包括普遍存在的看家基因和高度调控的发育基因的启动子。在>50％甲基化的HCP位点中，有几个已建立的标志物，例如Wnt2、NDRG2、SFRP2和BMP3(Meissner等人(2008)Nature 454:766-70)。

已经将DNA甲基转移酶在胞嘧啶-磷酸-鸟嘌呤(CpG)岛位点处对DNA的表观遗传甲基化作为大多数肿瘤类型组织中潜在的一类生物标志物进行研究。在生物学上有吸引力的机制中，认为肿瘤抑制基因启动子区域中的获得性甲基化事件会使表达沉默，从而促进肿瘤发生。DNA甲基化可能是比RNA或蛋白质表达更具有化学和生物学稳定性的诊断工具。此外，在如散发性结肠癌等其它癌症中，异常的甲基化标志物比单独DNA突变具有更广泛的信息和更灵敏，并且提供了极好的特异性。

有几种方法可用于搜索新的甲基化标志物。虽然基于微阵列的CpG甲基化询问是一种合理的高通量方法，但这种策略偏向于已知的感兴趣区域，主要是已确立的肿瘤抑制启动子。在过去十年中，已经开发了用于全基因组DNA甲基化分析的替代方法。有三种基本方法。第一种采用通过识别特定甲基化位点的限制酶消化DNA，然后是几种可能的分析技术，这些技术提供的甲基化数据仅限于酶识别位点或用于在定量步骤中扩增DNA的引物(例如甲基化特异性PCR；MSP)。第二种方法使用针对甲基胞嘧啶或其它甲基化特异性结合结构域的抗体富集基因组DNA的甲基化部分，然后进行微阵列分析或测序以将片段映射至参考基因组。这种方法不提供片段内所有甲基化位点的单核苷酸分辨率。第三种方法首先是对DNA进行亚硫酸氢盐处理，将所有未甲基化的胞嘧啶转化为尿嘧啶，然后是限制酶消化，并在与接头配体偶联后对所有片段进行完整测序。限制酶的选择可以富集CpG密集区域的片段，减少在分析过程中可能映射至多个基因位置的冗余序列的数目。

在中高读取覆盖率下RRBS在单核苷酸分辨率下产生所有CpG岛的80-90％和大多数肿瘤抑制启动子的CpG甲基化状态数据。在癌症病例对照研究中，对这些读数的分析可鉴定差异甲基化区域(DMR)。在之前对胰腺癌样本的RRBS分析中，发现了数百个DMR，其中许多从未与致癌作用相关联，并且许多未注释。对独立组织样品集的进一步验证研究证实了在性能方面具有100％灵敏度和特异性的标志物CpG。

EC自发脱落肿瘤细胞(参见Chin,A.B.等人,American Journal of Obstetricsand Gynecology,2000.182(6):第1278-1282页)并且通过微创方法检测EC生物标志物是一种很有前景的方法(参见Kinde,I.等人,Science Translational Medicine,2013.5(167):第167ra4页；Bakkum-Gamez,J.N.等人,Gynecologic Oncology,2015.137(1):第14-22页；Wentzensen,N.等人,International Journal of Cancer,2014.135(8):第1860-1868页；Fiegl H,G.C.等人,Cancer Epidemiol Biomarkers Prev,2004.13(5):第882-8页)；然而，需要优化标志物、标准化收集方法和提高特异性。DNA甲基化是EC致癌作用的早期事件(参见Tao,M.H.和J.L.Freudenheim,Epigenetics,2010.5(6):第491-8页)；在与EC相邻的看起来形态正常的子宫内膜中RASSF1甲基化(参见Fiegl H,G.C.等人,Cancer EpidemiolBiomarkers Prev,2004.13(5):第882-8页；Pijnenborg,J.等人,Annals of Oncology,2007.18(3):第491-497页；Suehiro,Y.等人,Clinical Cancer Research,2008.14(11):第3354-3361页；Arafa,M.等人,Histopathology,2008.53(5):第525-532页)；MLH1甲基化发生在非典型增生中(参见Suehiro,Y.等人,Clinical Cancer Research,2008.14(11):第3354-3361页；Horowitz,N.等人,Gynecologic Oncology,2002.86(1):第62-68页；Xiong,Y.等人,Gynecologic Oncology,2006.103(1):第321-328页；Banno K,Y.M.等人,OncolRep,2006.16(6):第1189-96页；Zighelboim,I.等人,Clinical Cancer Research,2007.13(10):第2882-2889页；Guida M,S.F.等人,Eur J Gynaecol Oncol.,2009.30(3):第267-70页)。这些和其它基因被确定为在EC中甲基化(参见Fiegl H,G.C.等人,Cancer EpidemiolBiomarkers Prev,2004.13(5):第882-8页；Suehiro,Y.等人,Clinical Cancer Research,2008.14(11):第3354-3361页；Zighelboim,I.等人,Clinical Cancer Research,2007.13(10):第2882-2889页；Wentzensen,N.等人,International Journal of Cancer,2014:页码[电子出版比印刷先进]；Tao MH,F.J.,DNA methylation in EC.Epigenetics,2010.5(6):第491-8页；Integrated genomic characterization of endometrialcarcinoma.Nature,2013.497(7447):第67-73页；Huang,Y.-W.等人,GynecologicOncology,2010.117(2):第239-247页；Xiong,Y.等人,Gynecologic Oncology,2005.99(1):第135-141页；Sasaki,M.等人,Cancer Research,2001.61(1):第97-102页；Sasaki,M.等人,Molecular and Cellular Endocrinology,2003.202(1-2):第201-207页)，并且从坏死肿瘤细胞释放的游离甲基化DNA是一个有吸引力的目标，并已在各种生物体液中检测到，包括唾液、血浆、腹膜液、粪便、乳头抽吸物、尿液、胰液和阴道液(参见Bakkum-Gamez,J.N.等人,Gynecologic Oncology,2015.137(1):第14-22页；Fiegl H,G.C.等人,CancerEpidemiol Biomarkers Prev,2004.13(5):第882-8页；Duffy MJ,N.R.等人,Eur JCancer,2009.45(3):第335-46页；Ahlquist,D.A.等人,Gastroenterology,2012.142(2):第248-256页；Duffy,M.J.等人,Eur J Cancer,2009.45(3):第335-46页；Kisiel,J.B.等人,Clinical Cancer Research,2015.21(19):第4473-4481页)。

本文提供了筛查EC的技术，并且特别但不仅仅是检测EC和各种EC亚型(例如透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的存在的方法、组合物和相关用途。

实际上，如实施例I、II和III中所述，在鉴定本发明实施方案的过程中进行的实验鉴定了一组新的差异甲基化区域(DMR)，用于区分子宫内膜癌来源的DNA与非肿瘤对照DNA。

这类实验列出并描述了499种新的DNA甲基化标志物，可将EC组织(以及EC组织的各种亚型)与良性子宫内膜组织区分开来(参见表1、8和21，实施例1、2和3)。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下能够区分EC组织与良性子宫内膜组织的标志物和/或标志物组：

·AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90(参见表2，实施例1)；

·EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B(参见表3，实施例1)；

·SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表15，实施例1)；以及

·EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553(参见表20，实施例1)。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下标志物和/或标志物组，用于检测血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)中的EC：

·ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A(参见表9，实施例1)。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下能够区分透明细胞EC组织与良性子宫内膜组织的标志物和/或标志物组：

·DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422(参见表4，实施例1)；

·ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A(参见表11，实施例1)；

·SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A(参见表16，实施例1)；以及

·MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B(参见表24，实施例3)。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下标志物和/或标志物组，用于检测血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)中的透明细胞EC：

·SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下能够区分癌肉瘤EC组织与良性子宫内膜组织的标志物和/或标志物组：

·EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B(参见表5，实施例1)；

·EMX2OS和LRRC34(参见表13，实施例1)；

·ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL(参见表18，实施例1)；以及

·TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B(参见表24，实施例3)。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下标志物和/或标志物组，用于检测血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)中的癌肉瘤EC：

·SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL(参见表13，实施例1)。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下能够区分浆液性EC组织与良性子宫内膜组织的标志物和/或标志物组：

·EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B(参见表7，实施例1)；

·MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C(参见表12，实施例1)；

·MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL(参见表17，实施例1)；以及

·EMX2OS和LRRC41_D(参见表24，实施例3)。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下标志物和/或标志物组，用于检测血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)中的浆液性EC：

·SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A(参见表12，实施例1)。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下能够区分子宫内膜样EC组织与良性子宫内膜组织的标志物和/或标志物组：

·MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B(参见表6，实施例1)；

·MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL(参见表14，实施例1)；以及

·SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表19，实施例1)。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下标志物和/或标志物组，用于检测血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)中的子宫内膜样EC：

·SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A(参见表14，实施例1)。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下能够区分子宫内膜样EC 1级组织与良性子宫内膜组织的标志物和/或标志物组：

·TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C(参见表25，实施例3)。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下能够区分子宫内膜样EC 2级组织与良性子宫内膜组织的标志物和/或标志物组：

·TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B(参见表25，实施例3)。

从这499种新的DNA甲基化标志物中，进一步的实验鉴定了以下能够区分子宫内膜样EC 3级组织与良性子宫内膜组织的标志物和/或标志物组：

·TSPYL5、MPZ_B、TRH和PTGDR(参见表25，实施例3)。

如本文所述，这项技术提供了对EC总体和各种类型EC(例如透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)具有高辨别力的许多甲基化DNA标志物和其子集(例如，2种、3种、4种、5种、6种、7种或8种标志物的集合)。实验将选择过滤器应用于候选标志物以鉴定提供高信噪比和低背景水平，从而为EC筛查或诊断提供高特异性的标志物。

在一些实施方案中，这项技术涉及评估生物样品(例如子宫内膜组织样品、血液样品)中本文鉴定的一种或多种标志物的存在和甲基化状态。这些标志物包含如本文所讨论，例如，如表1、8和21中提供的一个或多个差异甲基化区域(DMR)。在这项技术的实施方案中评估甲基化状态。因此，在测量基因甲基化状态的方法中不限制本文提供的技术。例如，在一些实施方案中，通过基因组扫描方法测量甲基化状态。例如，一种方法涉及限制性界标基因组扫描(Kawai等人(1994)Mol.Cell.Biol.14:7421-7427)并且另一实例涉及甲基化敏感性随机引物PCR(Gonzalgo等人(1997)Cancer Res.57:594-599)。在一些实施方案中，特定CpG位点处甲基化模式的变化通过用甲基化敏感性限制酶消化基因组DNA，随后对感兴趣区域进行DNA分析(Southern analysis)(消化-DNA法)来监测。在一些实施方案中，分析甲基化模式的变化涉及基于PCR的方法，所述方法涉及在PCR扩增之前用甲基化敏感性限制酶或甲基化依赖性限制酶消化基因组DNA(Singer-Sam等人(1990)Nucl.Acids Res.18:687)。此外，已报告利用亚硫酸氢盐处理DNA作为甲基化分析的起点的其它技术。这些包括甲基化特异性PCR(MSP)(Herman等人(1992)Proc.Natl.Acad.Sci.USA 93:9821-9826)和从亚硫酸氢盐转化的DNA扩增的PCR产物的限制酶消化(Sadri和Hornsby(1996)Nucl.Acids Res.24:5058-5059；以及Xiong和Laird(1997)Nucl.Acids Res.25:2532-2534)。已开发PCR技术用于检测基因突变(Kuppuswamy等人(1991)Proc.Natl.Acad.Sci.USA 88:1143-1147)和定量等位基因特异性表达(Szabo和Mann(1995)Genes Dev.9:3097-3108；以及Singer-Sam等人(1992)PCR Methods Appl.1:160-163)。这类技术使用内部引物，其与PCR生成的模板退火并紧邻待测定的单个核苷酸的5'端终止。如美国专利No.7,037,650中所述的使用“定量Ms-SNuPE测定”的方法用于一些实施方案中。

在评估甲基化状态时，甲基化状态通常表示为在特定位点(例如，在单个核苷酸、特定区域或基因座、更长的感兴趣序列，例如，高达约100-bp、200-bp、500-bp、1000-bp的DNA子序列或更长序列)处甲基化的单个DNA链相对于包含该特定位点的样品中的DNA总群体的分数或百分比。传统上，未甲基化核酸的量是通过PCR使用校准器来确定。然后，用亚硫酸氢盐处理已知量的DNA，并使用实时PCR或其它指数扩增，例如QuARTS测定(例如，由美国专利No.8,361,720以及美国专利申请公布No.2012/0122088和2012/0122106提供，以引用的方式并入本文中)来确定所得到的甲基化特异性序列。

例如，在一些实施方案中，方法包括通过使用外部标准来生成未甲基化靶标的标准曲线。标准曲线由至少两个点构建，并将未甲基化DNA的实时Ct值与已知的定量标准相关联。然后，由至少两个点和外部标准构建甲基化靶标的第二条标准曲线。这个第二条标准曲线将甲基化DNA的Ct与已知的定量标准相关联。接着，确定甲基化和未甲基化群体的测试样品Ct值，并根据前两个步骤产生的标准曲线计算DNA的基因组当量。感兴趣位点处的甲基化百分比由甲基化DNA的量相对于群体中DNA的总量计算，例如(甲基化DNA的数目)/(甲基化DNA的数目+未甲基化DNA的数目)×100。

本文还提供了用于实施所述方法的组合物和试剂盒。例如，在一些实施方案中，对一种或多种标志物具有特异性的试剂(例如，引物、探针)单独或成组提供(例如，用于扩增多个标志物的引物对组)。还可提供用于进行检测测定的额外试剂(例如，用于进行QuARTS、PCR、测序、亚硫酸氢盐或其它测定的酶、缓冲液、阳性和阴性对照)。在一些实施方案中，试剂盒含有能够以甲基化特异性方式修饰DNA的试剂(例如，甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)。在一些实施方案中，提供了含有一种或多种对于实施方法而言必需的、足够的或有用的试剂的试剂盒。还提供了含有试剂的反应混合物。还提供了含有多种试剂的预混试剂组，这些试剂可以相互添加和/或添加至测试样品中以完善反应混合物。

在一些实施方案中，本文所述的技术与可编程机器相关联，该可编程机器被设计用于执行由本文所述的方法提供的一系列算术或逻辑运算。例如，这项技术的一些实施方案与计算机软件和/或计算机硬件相关联(例如，在其中执行)。在一个方面，这项技术涉及一种计算机，该计算机包括一种形式的存储器、用于执行算术和逻辑运算的元件以及用于执行一系列指令(例如，本文提供的方法)以读取、操作和存储数据的处理元件(例如，微处理器)。在一些实施方案中，微处理器是系统的一部分，用于：确定甲基化状态(例如，一种或多种DMR，例如表1、8和21中提供的DMR 1-499)；比较甲基化状态(例如，一种或多种DMR，例如表1、8和21中提供的DMR 1-499)；生成标准曲线；确定Ct值；计算甲基化的分数、频率或百分比(例如，一种或多种DMR，例如表1、8和21中提供的DMR 1-499)；鉴定CpG岛；确定测定或标志物的特异性和/或灵敏度；计算ROC曲线和相关的AUC；序列分析；皆如本文所述或本领域已知。

在一些实施方案中，微处理器或计算机在算法中使用甲基化状态数据来预测癌症部位。

在一些实施方案中，软件或硬件组件接收多个测定的结果并基于多个测定的结果确定单个值结果以向用户报告，指示癌症风险(例如，确定如表2、18和26中提供的多个DMR的甲基化状态)。相关实施方案基于来自多个测定的结果的数学组合(例如加权组合、线性组合)计算风险因子，例如确定多个标志物(例如，如表1、8和21中提供的多个DMR)的甲基化状态。在一些实施方案中，DMR的甲基化状态定义了一个维度并且可以在多维空间中具有值并且由多个DMR的甲基化状态定义的坐标是例如向用户报告的结果，例如与癌症相关风险。

一些实施方案包含存储媒体和存储器组件。存储器组件(例如，易失性和/或非易失性存储器)可用于存储指令(例如，如本文提供的方法的实施方案)和/或数据(例如工件，例如甲基化测量、序列和与之相关的统计描述)。一些实施方案涉及还包括CPU、图形卡和用户界面(例如，包括例如显示器的输出装置和例如键盘的输入装置)中的一个或多个的系统。

与这项技术相关的可编程机器包括常规的现存技术和正在开发或有待开发的技术(例如，量子计算机、化学计算机、DNA计算机、光学计算机、基于自旋电子学的计算机等)。

在一些实施方案中，这项技术包含用于传输数据的有线(例如，金属电缆、光纤)或无线传输媒体。例如，一些实施方案涉及通过网络(例如，局域网(LAN)、广域网(WAN)、自组织网络、互联网等)进行数据传输。在一些实施方案中，可编程机器作为对等体存在于这样的网络上，并且在一些实施方案中可编程机器具有客户端/服务器关系。

在一些实施方案中，数据存储在例如硬盘、闪存、光学媒体、软盘等计算机可读存储媒体上。

在一些实施方案中，本文提供的技术与协同操作以执行如本文所述的方法的多个可编程装置相关联。例如，在一些实施方案中，多台计算机(例如，通过网络连接)可以并行工作以收集和处理数据，例如，在集群计算或网格计算或一些其它依赖于完整计算机(具有板载CPU、存储器、电源、网络接口等)通过常规网络接口(例如以太网、光纤)或无线网络技术连接到网络(私有、公共或互联网)的分布式计算机架构的执行中。

例如，一些实施方案提供了一种包括计算机可读媒体的计算机。该实施方案包括耦合到处理器的随机存取存储器(RAM)。处理器执行被存储在存储器中的计算机可执行程序指令。这样的处理器可以包括微处理器、ASIC、状态机或其它处理器，并且可以是多种计算机处理器中的任一种，例如来自Santa Clara(California)的Intel公司和Schaumburg(Illinois)的Motorola公司的处理器。这样的处理器包括或可以与媒体，例如计算机可读媒体通信，所述媒体存储指令，在由处理器执行时，这些指令使处理器执行本文所述的步骤。

计算机可读媒体的实施方案包括但不限于能够为处理器提供计算机可读指令的电子、光学、磁性或其它存储或传输装置。合适媒体的其它实例包括但不限于软盘、CD-ROM、DVD、磁盘、存储芯片、ROM、RAM、ASIC、配置的处理器、所有光学媒体、所有磁带或其它磁性媒体，或计算机处理器可以从中读取指令的任何其它媒体。此外，各种其它形式的计算机可读媒体可以向计算机传输或携带指令，包括路由器、私有或公共网络、或其它有线和无线传输装置或信道。指令可以包含来自任何合适的计算机编程语言的代码，包括例如C、C++、C#、Visual Basic、Java、Python、Perl和JavaScript。

在一些实施方案中，计算机连接到网络。计算机还可能包括许多外部或内部装置，例如鼠标、CD-ROM、DVD、键盘、显示器或其它输入或输出装置。计算机的实例是个人计算机、数字助理、个人数字助理、蜂窝电话、移动电话、智能电话、寻呼机、数字平板电脑、膝上型计算机、互联网设备和其它基于处理器的装置。一般来说，与本文提供的技术的各方面相关的计算机可以是在任何操作系统上操作的任何类型的基于处理器的平台，例如MicrosoftWindows、Linux、UNIX、Mac OS X等，能够支持一个或多个包含本文提供的技术的程序。一些实施方案包括执行其它应用程序(例如，应用程序)的个人计算机。应用程序可以含在存储器中并且可以包括例如文字处理应用程序、电子表格应用程序、电子邮件应用程序、即时消息应用程序、演示应用程序、因特网浏览器应用程序、日历/组织器应用程序和任何其它能够由客户端装置执行的应用程序。

本文所述的与这项技术相关联的所有这类组件、计算机和系统可以是逻辑的或虚拟的。

因此，本文提供了与从受试者获得的样品中筛查EC和/或各种形式的EC(例如，透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的方法相关的技术，所述方法包括测定从受试者获得的样品(例如子宫内膜组织)(例如血液样品)中标志物的甲基化状态，并且当标志物的甲基化状态不同于在未患EC的受试者中测定的标志物的甲基化状态时，将所述受试者鉴定为患有EC和/或特定形式的EC，其中标志物包含差异甲基化区域(DMR)中的碱基，所述DMR选自由表1、8和21中提供的DMR 1-499组成的组。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有EC：AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90(参见表2，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有EC：EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B(参见表3，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有EC：SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表15，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有EC：EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553(参见表20，实施例1)。

在一些实施方案中，其中从受试者获得的样品是血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有EC：ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A(参见表9，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有透明细胞EC：DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422(参见表4，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有透明细胞EC：ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A(参见表11，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有透明细胞EC：SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A(参见表16，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有透明细胞EC：MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B(参见表24，实施例3)。

在一些实施方案中，其中从受试者获得的样品是血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有透明细胞EC：SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有癌肉瘤EC：EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B(参见表5，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有癌肉瘤EC：EMX2OS和LRRC34(参见表13，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有癌肉瘤EC：ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL(参见表18，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有癌肉瘤EC：TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B(参见表24，实施例3)。

在一些实施方案中，其中从受试者获得的样品是血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有癌肉瘤EC：SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL(参见表13，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有浆液性EC：EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B(参见表7，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有浆液性EC：MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C(参见表12，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有浆液性EC：MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL(参见表17，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有浆液性EC：EMX2OS和LRRC41_D(参见表24，实施例3)。

在一些实施方案中，其中从受试者获得的样品是血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有浆液性EC：SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A(参见表12，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样EC：MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B(参见表6，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样EC：MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL(参见表14，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样EC：SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表19，实施例1)。

在一些实施方案中，其中从受试者获得的样品是血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样EC：SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A(参见表14，实施例1)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样1级EC：TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C(参见表25，实施例3)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样2级EC：TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B(参见表25，实施例3)。

在一些实施方案中，其中从受试者获得的样品是子宫内膜组织并且以下标志物中的一种或多种的甲基化状态不同于在未患EC的受试者中测定的一种或多种标志物的甲基化状态指示所述受试者患有子宫内膜样3级EC：TSPYL5、MPZ_B、TRH和PTGDR(参见表25，实施例3)。

这项技术涉及鉴定和区分EC和/或各种形式的EC(例如，透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)。一些实施方案提供了包括测定多种标志物，例如包括测定2种至11种至100种或120种或499种标志物的方法。

这项技术不限于所评估的甲基化状态。在一些实施方案中，评估样品中标志物的甲基化状态包括确定一种碱基的甲基化状态。在一些实施方案中，测定样品中标志物的甲基化状态包括确定多种碱基的甲基化程度。此外，在一些实施方案中，标志物的甲基化状态包含相对于标志物的正常甲基化状态增加的标志物甲基化。在一些实施方案中，标志物的甲基化状态包含相对于标志物的正常甲基化状态减少的标志物甲基化。在一些实施方案中，标志物的甲基化状态包含相对于标志物的正常甲基化状态不同的标志物甲基化模式。

此外，在一些实施方案中，标志物是100个或更少碱基的区域，标志物是500个或更少碱基的区域，标志物是1000个或更少碱基的区域，标志物是5000个或更少碱基的区域，或在一些实施方案中，标志物是一个碱基。在一些实施方案中，标志物在高CpG密度启动子中。

这项技术不受样品类型的限制。例如，在一些实施方案中，样品是粪便样品、组织样品(例如子宫内膜组织样品)、血液样品(例如血浆、白细胞、血清、全血)、排泄物或尿液样品。

此外，在用于确定甲基化状态的方法中不限制这项技术。在一些实施方案中，分析包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。在一些实施方案中，测定包括使用甲基化特异性寡核苷酸。在一些实施方案中，这项技术使用大规模平行测序(例如，下一代测序)来确定甲基化状态，例如，边合成边测序、实时(例如，单分子)测序、珠乳液测序(bead emulsion sequencing)、纳米孔测序等。

这项技术提供了用于检测DMR的试剂，例如，在一些实施方案中提供了一组寡核苷酸，其包含由SEQ ID NO：1-499提供的序列(参见表1、8和21)。在一些实施方案中，提供了包含与在DMR中具有碱基的染色体区域互补的序列的寡核苷酸，例如对DMR的甲基化状态敏感的寡核苷酸。

这项技术提供了用于鉴定EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90(参见表2，实施例1)。

这项技术提供了用于鉴定EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B(参见表3，实施例1)。

这项技术提供了用于鉴定EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表15，实施例1)。

这项技术提供了用于鉴定EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553(参见表20，实施例1)。

这项技术提供了用于鉴定EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A(参见表9，实施例1)。

这项技术提供了用于鉴定透明细胞EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422(参见表4，实施例1)。

这项技术提供了用于鉴定透明细胞EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A(参见表11，实施例1)。

这项技术提供了用于鉴定透明细胞EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A(参见表16，实施例1)。

这项技术提供了用于鉴定透明细胞EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B(参见表24，实施例3)。

这项技术提供了用于鉴定透明细胞EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC(参见表11，实施例1)。

这项技术提供了用于鉴定癌肉瘤EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B(参见表5，实施例1)。

这项技术提供了用于鉴定癌肉瘤EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：EMX2OS和LRRC34(参见表13，实施例1)。

这项技术提供了用于鉴定癌肉瘤EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL(参见表18，实施例1)。

这项技术提供了用于鉴定癌肉瘤EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B(参见表24，实施例3)。

这项技术提供了用于鉴定癌肉瘤EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL(参见表13，实施例1)。

这项技术提供了用于鉴定浆液性EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B(参见表7，实施例1)。

这项技术提供了用于鉴定浆液性EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C(参见表12，实施例1)。

这项技术提供了用于鉴定浆液性EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL(参见表17，实施例1)。

这项技术提供了用于鉴定浆液性EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：EMX2OS和LRRC41_D(参见表24，实施例3)。

这项技术提供了用于鉴定浆液性EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A(参见表12，实施例1)。

这项技术提供了用于鉴定子宫内膜样EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B(参见表6，实施例1)。

这项技术提供了用于鉴定子宫内膜样EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL(参见表14，实施例1)。

这项技术提供了用于鉴定子宫内膜样EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表19，实施例1)。

这项技术提供了用于鉴定子宫内膜样EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A(参见表14，实施例1)。

这项技术提供了用于鉴定子宫内膜样1级EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C(参见表25，实施例3)。

这项技术提供了用于鉴定子宫内膜样2级EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B(参见表25，实施例3)。

这项技术提供了用于鉴定子宫内膜样3级EC的各种标志物组，例如，在一些实施方案中，标志物包含具有如下注释的染色体区域：TSPYL5、MPZ_B、TRH和PTGDR(参见表25，实施例3)。

提供了试剂盒实施方案，例如一种试剂盒，所述试剂盒包括能够以甲基化特异性方式修饰DNA的试剂(例如，甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)；以及对照核酸，所述对照核酸包含来自选自由DMR 1-499(来自表1、8和21)组成的组的DMR的序列并且具有与未患EC的受试者相关的甲基化状态。在一些实施方案中，试剂盒包括亚硫酸氢盐试剂和如本文所述的寡核苷酸。在一些实施方案中，试剂盒包括能够以甲基化特异性方式修饰DNA的试剂(例如，甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)；以及对照核酸，所述对照核酸包含来自选自由DMR 1-499(来自表1、8和21)组成的组的DMR的序列并且具有与患有EC的受试者相关的甲基化状态。一些试剂盒实施例包括用于从受试者获得样品(例如，粪便样品；子宫内膜组织样品；血液样品)的样品收集器；能够以甲基化特异性方式修饰DNA的试剂(例如，甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)；以及如本文所述的寡核苷酸。

这项技术涉及组合物(例如，反应混合物)的实施方案。在一些实施方案中，提供了一种组合物，所述组合物包含：包含DMR的核酸，以及能够以甲基化特异性方式修饰DNA的试剂(例如，甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)。一些实施方案提供包含核酸的组合物，所述核酸包含DMR和如本文所述的寡核苷酸。一些实施方案提供包含核酸的组合物，所述核酸包含DMR和甲基化敏感性限制酶。一些实施方案提供包含核酸的组合物，所述核酸包含DMR和聚合酶。

提供了额外的相关方法实施方案，用于筛查从受试者获得的样品(例如，子宫内膜组织样品；血液样品；粪便样品)中的EC和/或各种形式的EC(例如，透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)，例如一种方法，所述方法包括确定样品中的标志物的甲基化状态，所述标志物包含如DMR 1-499(来自表1、8和21)中的一个或多个的DMR中的碱基；将来自受试者样品的标志物的甲基化状态与来自未患EC(例如，EC、透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的受试者的正常对照样品的标志物的甲基化状态进行比较；以及确定受试样品和正常对照样品的甲基化状态差异的置信区间和/或p值。在一些实施方案中，置信区间为90％、95％、97.5％、98％、99％、99.5％、99.9％或99.99％，并且p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001或0.0001。方法的一些实施方案提供了使包含DMR的核酸与能够以甲基化特异性方式修饰核酸的试剂(例如，甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)反应的步骤，以产生例如以甲基化特异性方式修饰的核酸；对以甲基化特异性方式修饰的核酸进行测序，以提供以甲基化特异性方式修饰的核酸的核苷酸序列；将以甲基化特异性方式修饰的核酸的核苷酸序列与来自未患EC和/或一种形式的EC的受试者的包含DMR的核酸的核苷酸序列进行比较，以鉴定这两个序列的差异；以及当存在差异时，将受试者鉴定为患有EC(例如，EC和/或一种形式的EC：透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)。

这项技术提供了用于筛查从受试者获得的样品中的EC的系统。系统的示例性实施方案包括例如用于筛查从受试者获得的样品(例如子宫内膜组织样品；血浆样品；粪便样品)中的EC和/或和/或EC类型(例如透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的系统，该系统包括：分析组件，所述分析组件被配置用于确定样品的甲基化状态；软件组件，所述软件组件被配置用于将样品的甲基化状态与数据库中记录的对照样品或参考样品甲基化状态进行比较；以及警报组件，所述警报组件被配置用于向用户发出关于EC相关的甲基化状态的警报。在一些实施方案中，警报由软件组件确定，所述软件组件接收多个测定的结果(例如，确定多种标志物，如例如表1、8和21中提供的DMR的甲基化状态)并基于多个结果计算值或结果以进行报告。一些实施例提供与本文提供的每个DMR相关联的加权参数的数据库，用于计算值或结果和/或警报以向用户(例如，如医师、护士、临床医生等)报告。在一些实施方案中，报告了来自多个测定的所有结果，并且在一些实施方案中，一个或多个结果用于提供评分、值或结果，所述评分、值或结果基于来自多个测定的一个或多个结果的复合物，其指示受试者中的癌症风险。

在系统的一些实施方案中，样品包含含有DMR的核酸。在一些实施方案中，该系统还包括用于分离核酸的组件、用于收集样品的组件，例如用于收集粪便样品的组件。在一些实施方案中，系统包含含有DMR的核酸序列。在一些实施方案中，数据库包含来自未患EC和/或特定类型EC(例如，透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的受试者的核酸序列。还提供了核酸，例如一组核酸，每个核酸具有包含DMR的序列。在一些实施方案中，该组核酸中每个核酸具有来自未患EC和/或特定类型EC的受试者的序列。相关系统实施方案包括如所述的一组核酸和与该组核酸相关的核酸序列数据库。一些实施方案还包括能够以甲基化特异性方式修饰DNA的试剂(例如，甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)。并且，一些实施方案还包括核酸测序仪。

在某些实施方案中，提供了用于表征来自人类患者的样品(例如，子宫内膜组织样品；血液样品；粪便样品)的方法。例如，在一些实施方案中，这类实施方案包括从人类患者的样品获得DNA；测定DNA甲基化标志物的甲基化状态，所述DNA甲基化标志物包含选自由表1、8和21的DMR 1-499组成的组的差异甲基化区域(DMR)中的碱基；以及将一种或多种DNA甲基化标志物的所测定的甲基化状态与未患EC和/或特定类型EC(例如，透明细胞EC、癌肉瘤EC、子宫内膜样EC，浆液性EC)的人类患者的一种或多种DNA甲基化标志物的甲基化水平参考进行比较。

这类方法不限于来自人类患者的特定类型的样品。在一些实施方案中，样品是子宫内膜组织样品。在一些实施方案中，样品是血浆样品。在一些实施方案中，样品是粪便样品、组织样品、子宫内膜组织样品、血液样品(例如白细胞样品、血浆样品、全血样品、血清样品)或尿液样品。

在一些实施方案中，这类方法包括测定多种DNA甲基化标志物。在一些实施方案中，这类方法包括测定2至11种DNA甲基化标志物。在一些实施方案中，这类方法包括测定12至120种DNA甲基化标志物。在一些实施方案中，这类方法包括测定2至499种DNA甲基化标志物。在一些实施方案中，这类方法包括测定样品中的一种或多种DNA甲基化标志物的甲基化状态，包括确定一种碱基的甲基化状态。在一些实施方案中，这类方法包括测定样品中的一种或多种DNA甲基化标志物的甲基化状态，包括确定多种碱基处的甲基化程度。在一些实施方案中，这类方法包括测定正向链的甲基化状态或测定反向链的甲基化状态。

在一些实施方案中，DNA甲基化标志物是100个或更少碱基的区域。在一些实施方案中，DNA甲基化标志物是500个或更少碱基的区域。在一些实施方案中，DNA甲基化标志物是1000个或更少碱基的区域。在一些实施方案中，DNA甲基化标志物是5000个或更少碱基的区域。在一些实施方案中，DNA甲基化标志物是一个碱基。在一些实施方案中，DNA甲基化标志物在高CpG密度启动子中。

在一些实施方案中，分析包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。

在一些实施方案中，测定包括使用甲基化特异性寡核苷酸。在一些实施方案中，甲基化特异性寡核苷酸选自由SEQ ID NO:1-499(表1、8和21)组成的组。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90(参见表2，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B(参见表3，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表15，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553(参见表20，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A(参见表9，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422(参见表4，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A(参见表11，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A(参见表16，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B(参见表24，实施例3)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC(参见表11，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B(参见表5，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：EMX2OS和LRRC34(参见表13，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL(参见表18，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B(参见表24，实施例3)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL(参见表13，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B(参见表7，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C(参见表12，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL(参见表17，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：EMX2OS和LRRC41_D(参见表24，实施例3)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A(参见表12，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B(参见表6，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL(参见表14，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A(参见表19，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A(参见表14，实施例1)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C(参见表25，实施例3)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B(参见表25，实施例3)。

在一些实施方案中，具有选自由以下组成的组的注释的染色体区域构成DNA甲基化标志物：TSPYL5、MPZ_B、TRH和PTGDR(参见表25，实施例3)。

在一些实施方案中，这类方法包括确定两种DNA甲基化标志物的甲基化状态。在一些实施方案中，这类方法包括确定在表1、8和/或21的一行中提供的一对DNA甲基化标志物的甲基化状态。

在某些实施方案中，这项技术提供了用于表征从人类患者获得的样品(例如，子宫内膜组织样品；白细胞样品；血浆样品；全血样品；血清样品；粪便样品)的方法。这类方法包括确定样品中的DNA甲基化标志物的甲基化状态，所述DNA甲基化标志物包含选自由表1、8或21的DMR 1-499组成的组的DMR中的碱基；将来自患者样品的DNA甲基化标志物的甲基化状态与来自未患EC和/或特定形式EC(例如，透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的人类受试者的正常对照样品的DNA甲基化标志物的甲基化状态进行比较；以及确定人类患者和正常对照样品的甲基化状态差异的置信区间和/或p值。在一些实施方案中，置信区间为90％、95％、97.5％、98％、99％、99.5％、99.9％或99.99％，并且p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001或0.0001。

在某些实施方案中，这项技术提供了用于表征从人类受试者获得的样品(例如，子宫内膜组织样品；白细胞样品；血浆样品；全血样品；血清样品；粪便样品)的方法，所述方法包括使包含DMR的核酸与能够以甲基化特异性方式修饰DNA的试剂(例如，甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)反应，以产生以甲基化特异性方式修饰的核酸；对以甲基化特异性方式修饰的核酸进行测序，以提供以甲基化特异性方式修饰的核酸的核苷酸序列；将以甲基化特异性方式修饰的核酸的核苷酸序列与来自未患EC的受试者的包含DMR的核酸的核苷酸序列进行比较，以鉴定这两个序列的差异。

在某些实施方案中，这项技术提供了用于表征从人类受试者获得的样品(例如，子宫内膜组织样品；血浆样品；粪便样品)的系统，所述系统包括：分析组件，所述分析组件被配置用于确定样品的甲基化状态；软件组件，所述软件组件被配置用于将样品的甲基化状态与数据库中记录的对照样品或参考样品甲基化状态进行比较；以及警报组件，所述警报组件被配置用于基于甲基化状态的组合确定单个值并向用户发出关于EC相关的甲基化状态的警报。在一些实施方案中，样品包含含有DMR的核酸。

在一些实施方案中，这类系统还包括用于分离核酸的组件。在一些实施方案中，这类系统还包括用于收集样品的组件。

在一些实施方案中，样品是粪便样品、组织样品、子宫内膜组织样品、血液样品(例如血浆样品、白细胞样品、全血样品、血清样品)或尿液样品。

在一些实施方案中，数据库包含含有DMR的核酸序列。在一些实施方案中，数据库包含来自未患EC的受试者的核酸序列。

基于本文所含的教导内容，额外实施方法对于相关领域的技术人员来说将是显而易见的。

附图说明

图1：交叉验证的3-MDM图源自于rPART模拟(EMX2OS、NBPF8、SFMBT2)，其以97％特异性和97％灵敏度以及0.98的AUC区分总体EC与BE。数据以热矩阵格式绘制，允许互补性可视化。

图2：用于61个甲基化标志物的标志物染色体区域(例如区分EC组织与正常子宫内膜组织的甲基化区域)和相关引物和探针信息。

定义

为了便于理解本发明的技术，以下定义了多个术语和短语。在整个详细描述中阐述了另外的定义。

在整个说明书和权利要求书中，除非上下文另外清楚规定，否则以下术语采用与本文明确相关的含义。如本文所用，短语“在一个实施方案中”不一定指相同的实施方案，尽管其可能是这样。此外，如本文所用，短语“在另一个实施方案中”不一定指不同的实施方案，尽管其可能是这样。因此，如下所述，在不脱离本发明的范围或精神下，可以容易地组合本发明的各种实施方案。

另外，除非上下文另外清楚规定，否则如本文所用，术语“或”是包括性的“或”运算符并且等同于术语“和/或”。除非上下文另外清楚规定，术语“基于”不是排他性的，并且允许基于未描述的另外的因素。另外，在整个说明书中，“一(a/an)”和“所述”的含义包括复数个提及物。“在……中”的含义包括“在……中”和“在……上”。

如在本申请中的权利要求书中使用的过渡短语“基本上由……组成”将权利要求的范围限于所说明的材料或步骤，“以及实质上不影响所要求的发明的基本和新颖特征的那些材料或步骤”，如In re Herz,537F.2d 549,551-52,190USPQ 461,463(CCPA 1976)中所论述。举例来说，“基本上由所列举元素组成的”组合物可以含有一定水平的未列举的污染物，使得污染物尽管存在，但与纯组合物，即“由所列举组分组成”的组合物相比，不会改变所列举组合物的功能。

如本文所用，“核酸”或“核酸分子”一般是指任何核糖核酸或脱氧核糖核酸，其可以是未修饰的或修饰的DNA或RNA。“核酸”包括不限于单链和双链核酸。如本文所用，术语“核酸”还包括含有一个或多个修饰碱基的如上所述的DNA。因此，具有出于稳定性或其它原因而进行修饰的主链的DNA是“核酸”。如本文所用，术语“核酸”涵盖这样的化学、酶促或代谢修饰形式的核酸，以及病毒和细胞(包括例如简单和复杂细胞)特征性的DNA化学形式。

术语“寡核苷酸”或“多核苷酸”或“核苷酸”或“核酸”是指具有两个或更多个，优选地超过三个和通常超过十个脱氧核糖核苷酸或核糖核苷酸的分子。确切的大小将取决于许多因素，而这些因素又取决于寡核苷酸的最终功能或用途。寡核苷酸可以通过任何方式产生，包括化学合成、DNA复制、逆转录或它们的组合。DNA的典型脱氧核糖核苷酸是胸腺嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。RNA的典型核糖核苷酸是尿嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。

如本文所用，术语核酸的“基因座”或“区域”是指核酸的亚区域，例如染色体上的基因、单个核苷酸、CpG岛等。

术语“互补”和“互补性”是指通过碱基配对规则相关的核苷酸(例如1个核苷酸)或多核苷酸(例如核苷酸序列)。例如，序列5'-A-G-T-3'与序列3'-T-C-A-5'互补。互补性可以是“部分的”，其中仅一些核酸碱基根据碱基配对规则匹配。或者，核酸之间可能存在“完全”或“全部”互补。核酸链之间的互补程度影响核酸链之间杂交的效率和强度。这在依赖于核酸之间的结合的扩增反应和检测方法中特别重要。

术语“基因”是指包含产生RNA或多肽或其前体所必需的编码序列的核酸(例如DNA或RNA)序列。功能性多肽可由全长编码序列或由编码序列的任何部分编码，只要保留多肽的所需活性或功能特性(例如酶活性、配体结合、信号转导等)即可。当在提及基因时使用时术语“部分”是指该基因的片段。片段的大小可以在几个核苷酸至整个基因序列减去一个核苷酸的范围内变化。因此，“包含基因至少一部分的核苷酸”可以包含基因片段或整个基因。

术语“基因”还涵盖结构基因的编码区，并包括在5'和3'末端与编码区相邻，例如在任一个末端相距约1kb的序列，使得基因对应于全长mRNA(例如包含编码、调控、结构和其它序列)的长度。位于编码区5'并且存在于mRNA上的序列称为5'非翻译或未翻译序列。位于编码区3'或下游并且存在于mRNA上的序列称为3'非翻译或3'未翻译序列。术语“基因”涵盖基因的cDNA与基因组形式。在一些生物体(例如真核生物)中，基因的基因组形式或克隆含有被称为“内含子”或“插入区”或“插入序列”的非编码序列中断的编码区。内含子是转录成核RNA(hnRNA)的基因区段；内含子可以含有调控元件，例如增强子。内含子从核转录本或初级转录本中移出或“剪除”；因此，在信使RNA(mRNA)转录本中不存在内含子。mRNA在翻译期间发挥作用，以指定新生多肽中氨基酸的序列或次序。

除含有内含子外，基因的基因组形式还可以包括位于RNA转录本上存在的序列的5'和3'末端的序列。这些序列被称为“侧接”序列或区域(这些侧接序列位于mRNA转录本上存在的非翻译序列的5'或3')。5'侧接区域可以含有调控序列，例如启动子和强化子，其控制或影响基因的转录。3'侧接区域可以含有指导转录终止、转录后裂解和多腺苷酸化的序列。

在提及基因时术语“野生型”是指具有从天然存在的来源分离的基因特征的基因。在提及基因产物时术语“野生型”是指具有从天然存在的来源分离的基因产物特征的基因产物。如应用于物体的术语“天然存在”是指可以在自然界中发现物体的事实。例如，存在于生物体(包括病毒)中的可以从自然界来源分离并且未经实验室人员有意修饰的多肽或多核苷酸序列是天然存在的。野生型基因通常是在群体中最常观察到的基因或等位基因，因此被任意指定为基因的“正常”或“野生型”形式。相比之下，在提及基因或基因产物时术语“修饰的”或“突变的”分别是指与野生型基因或基因产物相比显示序列和/或功能特性修饰(例如特征改变)的基因或基因产物。注意，可以分离天然存在的突变体；这些通过它们与野生型基因或基因产物相比特征改变的事实来鉴定。

术语“等位基因”是指基因的变异；所述变异包括但不限于变体和突变体、多态基因座和单核苷酸多态基因座、移码和剪接突变。等位基因可能在群体中天然存在，或者其可能在群体中任何特定个体的一生中出现。

因此，在提及核苷酸序列时使用时术语“变体”和“突变体”是指与另一个通常相关的核苷酸序列相差一个或多个核苷酸的核酸序列。“变异”是两个不同核苷酸序列之间的差异；典型地，一个序列是参考序列。

“扩增”是涉及模板特异性的核酸复制的特定情况。其与非特异性模板复制(例如依赖用模板但不依赖于特定模板的复制)形成对比。在这里模板特异性不同于复制保真度(例如合成适当多核苷酸序列)和核苷酸(核糖或脱氧核糖)特异性。模板特异性常根据“靶标”特异性来描述。在设法从其它核酸中分选出来的意义上，靶序列是“靶标”。扩增技术主要是为这种分选而设计的。

在核酸背景下术语“扩增(amplifying或amplification)”是指典型地从少量多核苷酸(例如单个多核苷酸分子)开始，产生多拷贝的多核苷酸或多核苷酸的一部分，其中扩增产物或扩增子一般是可检测的。多核苷酸的扩增涵盖多种化学和酶促过程。在聚合酶链式反应(PCR)或连接酶链式反应(LCR；参见例如美国专利No.5,494,810；以引用的方式整体并入本文中)期间从靶标或模板DNA分子的一个或几个拷贝产生多个DNA拷贝是扩增的形式。另外类型的扩增包括(但不限于)等位基因特异性PCR(参见例如美国专利No.5,639,611；以引用的方式整体并入本文中)、装配PCR(参见例如美国专利No.5,965,408；以引用的方式整体并入本文中)、解旋酶依赖性扩增(参见例如美国专利No.7,662,594；以引用的方式整体并入本文中)、热启动PCR(参见例如美国专利No.5,773,258和5,338,671；各以引用的方式整体并入本文中)、序列间特异性PCR、反向PCR(参见例如Triglia等人(1988)Nucleic Acids Res.,16:8186；以引用的方式整体并入本文中)、连接介导的PCR(参见例如Guilfoyle,R.等人,Nucleic Acids Research,25:1854-1858(1997)；美国专利No.5,508,169；各以引用的方式整体并入本文中)、甲基化特异性PCR(参见例如Herman等人,(1996)PNAS 93(13)9821-9826；以引用的方式整体并入本文中)、微型引物PCR、多重连接依赖性探针扩增(参见例如Schouten等人,(2002)Nucleic Acids Research 30(12):e57；以引用的方式整体并入本文中)、多重PCR(参见例如Chamberlain等人,(1988)Nucleic AcidsResearch 16(23)11141-11156；Ballabio等人,(1990)Human Genetics 84(6)571-573；Hayden等人,(2008)BMC Genetics 9:80；各以引用的方式整体并入本文中)、巢式PCR、重叠延伸PCR(参见例如Higuchi等人,(1988)Nucleic Acids Research 16(15)7351-7367；以引用的方式整体并入本文中)、实时PCR(参见例如Higuchi等人,(1992)Biotechnology 10:413-417；Higuchi等人,(1993)Biotechnology 11:1026-1030；各以引用的方式整体并入本文中)、逆转录PCR(参见例如Bustin,S.A.(2000)J.Molecular Endocrinology 25:169-193；以引用的方式整体并入本文中)、固相PCR、热不对称交错PCR和降落PCR(参见例如Don等人,Nucleic Acids Research(1991)19(14)4008；Roux,K.(1994)Biotechniques 16(5)812-814；Hecker等人,(1996)Biotechniques 20(3)478-485；各以引用的方式整体并入本文中)。多核苷酸扩增也可以使用数字PCR来完成(参见例如Kalinina等人,Nucleic AcidsResearch.25；1999-2004,(1997)；Vogelstein和Kinzler,Proc Natl Acad Sci USA.96；9236-41,(1999)；国际专利公布No.WO05023091A2；美国专利申请公布No.20070202525；各以引用的方式整体并入本文中)。

术语“聚合酶链式反应”(“PCR”)是指K.B.Mullis的美国专利No.4,683,195、4,683,202和4,965,188的方法，其描述了一种增加基因组或其它DNA或RNA的混合物中的靶序列区段的浓度的方法，不进行克隆或纯化。这种扩增靶序列的过程由以下组成：将大量过量的两种寡核苷酸引物引入含有所需靶序列的DNA混合物中，接着在DNA聚合酶存在下进行精确的热循环序列。两种引物与它们各自的双链靶序列的链互补。为了实现扩增，使混合物变性，然后使引物与它们在靶分子内的互补序列退火。在退火之后，将引物用聚合酶延伸以便形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可以重复多次(即，变性、退火和延伸构成一个“循环”；可以存在多个“循环”)以获得高浓度的所需靶序列的扩增区段。所需靶序列的扩增区段的长度由引物彼此之间的相对位置决定，因此，该长度是一个可控参数。由于所述过程的重复方面，所述方法称为“聚合酶链式反应”(“PCR”)。因为靶序列的所需扩增区段变成混合物中的主要序列(根据浓度)，所以它们被称为“PCR扩增”并且是“PCR产物”或“扩增子”。本领域的技术人员将理解，术语“PCR”涵盖使用例如实时PCR、巢式PCR、逆转录PCR(RT-PCR)、单引物和随机引物PCR等最初描述的方法的许多变体。

大部分扩增技术是通过选择酶来实现模板特异性的。扩增酶是在使用它们的条件下将仅加工核酸的异质混合物中的特定核酸序列的酶。例如，在Q-β复制酶的情况下，MDV-1RNA是复制酶的特定模板(Kacian等人,Proc.Natl.Acad.Sci.USA,69:3038[1972])。其它核酸不会被这种扩增酶复制。类似地，在T7 RNA聚合酶的情况下，这种扩增酶对其自身的启动子具有严格的特异性(Chamberlin等人,Nature,228:227[1970])。在T4 DNA连接酶的情况下，酶不会连接两种寡核苷酸或多核苷酸，其中寡核苷酸或多核苷酸底物与模板之间在连接点处存在错配(Wu和Wallace(1989)Genomics 4:560)。最终，发现依赖于热稳定模板的DNA聚合酶(例如Taq和Pfu DNA聚合酶)由于它们能够在高温下发挥作用，而对由引物限制并因此由引物界定的序列显示高特异性；高温产生有利于引物与靶序列杂交而不利于与非靶序列杂交的热力学条件(H.A.Erlich(编辑),PCR Technology,Stockton Press[1989])。

如本文所用，术语“核酸检测测定”是指测定感兴趣核酸的核苷酸组成的任何方法。核酸检测测定包括但不限于DNA测序法、探针杂交法、结构特异性裂解测定(例如INVADER测定(Hologic公司)，并描述于例如美国专利No.5,846,717、5,985,557、5,994,069、6,001,567、6,090,543和6,872,816；Lyamichev等人,Nat.Biotech.,17:292(1999)；Hall等人,PNAS,USA,97:8272(2000)和美国专利No.9,096,893，各以引用的方式整体并入本文中以达成所有目的)；酶错配裂解法(例如Variagenics，美国专利No.6,110,684、5,958,692、5,851,770，以引用的方式整体并入本文中)；上述聚合酶链式反应(PCR)；分支杂交法(例如Chiron，美国专利No.5,849,481、5,710,264、5,124,246和5,624,802，以引用的方式整体并入本文中)；滚环复制(例如美国专利No.6,210,884、6,183,960和6,235,502，以引用的方式整体并入本文中)；NASBA(例如美国专利No.5,409,818，以引用的方式整体并入本文中)；分子信标技术(例如美国专利No.6,150,097，以引用的方式整体并入本文中)；电子传感器技术(Motorola，美国专利No.6,248,229、6,221,583、6,013,170和6,063,573，以引用的方式整体并入本文中)；循环探针技术(例如美国专利No.5,403,711、5,011,769和5,660,988，以引用的方式整体并入本文中)；Dade Behring信号放大法(例如美国专利No.6,121,001、6,110,677、5,914,230、5,882,867和5,792,614，以引用的方式整体并入本文中)；连接酶链式反应(例如Baranay Proc.Natl.Acad.Sci USA 88,189-93(1991))；和夹心杂交法(例如美国专利No.5,288,609，以引用的方式整体并入本文中)。

术语“可扩增核酸”是指可以通过任何扩增方法扩增的核酸。预期“可扩增核酸”通常包含“样品模板”。

术语“样品模板”是指源自针对“靶标”(定义如下)的存在进行分析的样品的核酸。相反，“背景模板”用于指代样品中可能存在或不存在的除样品模板以外的核酸。背景模板通常是无意的。它可能是交叉污染的结果，或者可能是由于存在试图从样品中净化掉的核酸污染物。例如，来自生物体的除待检测核酸之外的核酸可能作为测试样品中的背景存在。

术语“引物”是指当置于诱导与核酸模板链互补的引物延伸产物合成的条件下(例如在核苷酸和诱导剂如DNA聚合酶存在下以及在合适温度和pH值下)时能够充当合成起始点的寡核苷酸，无论天然存在，如例如来自限制消化液的核酸片段，还是合成产生。引物优选是单链的，以获得最大的扩增效率，但也可以是双链的。如果是双链，那么引物在用于制备延伸产物之前首先进行处理以分离其链。优选地，引物是寡脱氧核糖核苷酸。引物必须足够长以在诱导剂存在下引发延伸产物的合成。引物的确切长度取决于许多因素，包括温度、引物来源和方法的使用。

术语“探针”是指能够与另一感兴趣寡核苷酸杂交的寡核苷酸(例如核苷酸序列)，无论天然存在，如纯化的限制消化液中，还是合成、重组或通过PCR扩增产生。探针可以是单链或双链的。探针可用于检测、鉴定和分离特定基因序列(例如，“捕获探针”)。预期本发明中使用的任何探针在一些实施方案中都可以用任何“报告分子”标记，以便在任何检测系统中可检测，包括但不限于酶(例如，ELISA，以及基于酶的组织化学分析)、荧光、放射性和发光系统。并不意图将本发明限于任何特定的检测系统或标记。

如本文所用，术语“靶标”是指设法例如通过探针结合、扩增、分离、捕获等从其它核酸中分选出的核酸。例如，当用于聚合酶链式反应时，“靶标”是指由用于聚合酶链式反应的引物结合的核酸区域，而当用于不扩增靶DNA的测定时，例如在侵入性裂解测定的一些实施方案中，靶标包括探针和侵入性寡核苷酸(例如，INVADER寡核苷酸)结合形成侵入性裂解结构的位点，以便可以检测到靶核酸的存在。“区段”定义为靶序列内的核酸区域。

如本文所用，“甲基化”是指胞嘧啶的C5或N4位置的胞嘧啶甲基化、腺嘌呤的N6位置或其它类型的核酸甲基化。体外扩增的DNA通常未甲基化，因为典型的体外DNA扩增方法不会保留扩增模板的甲基化模式。然而，“未甲基化的DNA”或“甲基化的DNA”也可以分别指原始模板未甲基化或甲基化的扩增DNA。

因此，如本文所用，“甲基化核苷酸”或“甲基化核苷酸碱基”是指核苷酸碱基上存在甲基部分，其中甲基部分不存在于公认的典型核苷酸碱基中。例如，胞嘧啶在其嘧啶环上不含甲基部分，但5-甲基胞嘧啶在其嘧啶环的5位含有甲基部分。因此，胞嘧啶不是甲基化核苷酸，5-甲基胞嘧啶是甲基化核苷酸。在另一个实例中，胸腺嘧啶在其嘧啶环的5位含有甲基部分；然而，就本文而言，当存在于DNA中时，胸腺嘧啶不被视为甲基化核苷酸，因为胸腺嘧啶是DNA的典型核苷酸碱基。

如本文所用，“甲基化核酸分子”是指含有一个或多个甲基化核苷酸的核酸分子。

如本文所用，核酸分子的“甲基化状态”、“甲基化概况”和“甲基化状况”是指核酸分子中一个或多个甲基化核苷酸碱基的存在或不存在。例如，含有甲基化胞嘧啶的核酸分子被认为是甲基化的(例如，核酸分子的甲基化状态是甲基化的)。不含任何甲基化核苷酸的核酸分子被认为是未甲基化的。

特定核酸序列(例如，如本文所述的基因标志物或DNA区域)的甲基化状态可以指示序列中每个碱基的甲基化状态，或者可以指示序列内碱基子集(例如，一个或多个胞嘧啶)的甲基化状态，或者可以指示关于序列内区域甲基化密度的信息，提供或不提供序列内发生甲基化的位置的精确信息。

核酸分子中核苷酸基因座的甲基化状态是指核酸分子中特定基因座处甲基化核苷酸的存在或不存在。例如，当核酸分子中第7个核苷酸处存在的核苷酸为5-甲基胞嘧啶时，核酸分子中第7个核苷酸处胞嘧啶的甲基化状态是甲基化的。类似地，当核酸分子中第7个核苷酸处存在的核苷酸为胞嘧啶(而非5-甲基胞嘧啶)时，核酸分子中第7个核苷酸处胞嘧啶的甲基化状态是未甲基化的。

甲基化状况可以任选地由“甲基化值”(例如，代表甲基化频率、分数、比率、百分比等)表示或指示。例如，可以通过量化在用甲基化依赖性限制酶进行限制性消化后完整核酸的量，或通过比较亚硫酸氢盐反应后的扩增概况，或通过比较经过亚硫酸氢盐处理和未处理的核酸的序列来产生甲基化值。因此，值，例如甲基化值，代表甲基化状况并且因此可以用作跨基因座的多个拷贝的甲基化状况的定量指标。当需要将样品中序列的甲基化状况与阈值或参考值进行比较时，这特别有用。

如本文所用，“甲基化频率”或“甲基化百分比(％)”是指分子或基因座被甲基化的实例数相对于分子或基因座未甲基化的实例数。

因此，甲基化状态描述了核酸(例如，基因组序列)的甲基化状态。此外，甲基化状态是指与甲基化相关的特定基因组基因座处的核酸区段的特征。这类特征包括但不限于，该DNA序列中的任何胞嘧啶(C)残基是否被甲基化、甲基化C残基的位置、甲基化C在核酸任何特定区域中的频率或百分比，以及由于例如等位基因来源的差异而导致的甲基化的等位基因差异。术语“甲基化状态”、“甲基化概况”和“甲基化状况”还指生物样品中核酸的任何特定区域中甲基化C或未甲基化C的相对浓度、绝对浓度或模式。例如，如果核酸序列内的胞嘧啶(C)残基被甲基化，那么可以将其称为“高甲基化”或“甲基化增加”，而如果DNA序列内的胞嘧啶(C)残基未甲基化，那么可以将其称为“低甲基化”或“甲基化降低”。同样，如果与另一核酸序列(例如，来自不同区域或来自不同个体等)相比，核酸序列内的胞嘧啶(C)残基被甲基化，那么认为该序列与其它核酸序列相比是高甲基化的或甲基化增加。可替代地，如果与另一核酸序列(例如，来自不同区域或来自不同个体等)相比，DNA序列内的胞嘧啶(C)残基未被甲基化，那么认为该序列与其它核酸序列相比是低甲基化的或甲基化降低。此外，如本文所用的术语“甲基化模式”是指核酸区域上甲基化和未甲基化核苷酸的集合位点。当整个区域中甲基化和未甲基化核苷酸的数量相同或相似但甲基化和未甲基化核苷酸的位置不同时，两个核酸可能具有相同或相似的甲基化频率或甲基化百分比但具有不同的甲基化模式。当序列的甲基化程度(例如一个的甲基化相对于另一个增加或减少)、频率或模式时有差异时，称其为“差异甲基化”或具有“甲基化差异”或具有“不同甲基化状态”。术语“差异甲基化”是指与癌症阴性样品中的核酸甲基化水平或模式相比，癌症阳性样品中的核酸甲基化水平或模式的差异。它还可能指手术后癌症复发的患者与未复发的患者之间水平或模式的差异。差异甲基化和DNA甲基化的特定水平或模式是预后和预测性生物标志物，例如，一旦确定了正确的截止或预测特征。

甲基化状态频率可以用于描述个体群体或来自单一个体的样品。例如，甲基化状态频率为50％的核苷酸基因座在50％的情况下被甲基化，在50％的情况下未甲基化。例如，这种频率可以用于描述个体群体或一批核酸中核苷酸基因座或核酸区域被甲基化的程度。因此，当核酸分子的第一个群体或库中的甲基化不同于核酸分子的第二个群体或库中的甲基化时，第一个群体或库的甲基化状态频率将不同于第二个群体或库的甲基化状态频率。例如，这种频率还可以用于描述单一个体中核苷酸基因座或核酸区域被甲基化的程度。例如，这种频率可以用于描述来自组织样品的一组细胞在核苷酸基因座或核酸区域被甲基化或未甲基化的程度。

如本文所用，“核苷酸基因座”是指核苷酸在核酸分子中的位置。甲基化核苷酸的核苷酸基因座是指甲基化核苷酸在核酸分子中的位置。

典型地，人类DNA的甲基化发生在包括相邻鸟嘌呤和胞嘧啶的二核苷酸序列上，其中胞嘧啶位于鸟嘌呤的5'(也称为CpG二核苷酸序列)。CpG二核苷酸内的大多数胞嘧啶在人类基因组中被甲基化，但是一些在特定的富含CpG二核苷酸的基因组区域(称为CpG岛)中保持未甲基化(参见例如Antequera等人(1990)Cell 62:503-514)。

如本文所用，“CpG岛”是指基因组DNA的富含G:C的区域，其含有相对于总基因组DNA数量增加的CpG二核苷酸。CpG岛的长度可以是至少100、200或更多个碱基对，其中该区域的G:C含量至少为50％，并且观察CpG频率与预期频率的比率为0.6；在某些情况下，CpG岛的长度可以为至少500个碱基对，其中该区域的G:C含量至少为55％并且观察CpG频率与预期频率的比率为0.65。可以根据Gardiner-Garden等人(1987)J.Mol.Biol.196:261-281中提供的方法计算相比于预期频率的观察CpG频率。例如，相比于预期频率的观察CpG频率可以根据公式R＝(A×B)/(C×D)计算，其中R是观察CpG频率与预期频率的比值，A是分析序列中的CpG二核苷酸的数量，B是分析序列中的核苷酸总数，C是分析序列中的C核苷酸总数，D是分析序列中的G核苷酸总数。典型地在CpG岛中，例如在启动子区域确定甲基化状态。应了解尽管人类基因组中的其它序列易于发生DNA甲基化，例如CpA和CpT(参见Ramsahoye(2000)Proc.Natl.Acad.Sci.USA 97:5237-5242；Salmon和Kaye(1970)Biochim.Biophys.Acta.204:340-351；Grafstrom(1985)Nucleic Acids Res.13:2827-2842；Nyce(1986)Nucleic Acids Res.14:4353-4367；Woodcock(1987)Biochem.Biophys.Res.Commun.145:888-894)。

如本文所用，“甲基化特异性试剂”是指根据核酸分子的甲基化状态修饰核酸分子的核苷酸的试剂，或甲基化特异性试剂是指能够以反映核酸分子的甲基化状态的方式改变核酸分子的核苷酸序列的化合物或组合物或其它剂。用这种试剂处理核酸分子的方法可以包括使核酸分子与试剂接触，如果需要，再加上额外的步骤，以实现核苷酸序列的所需改变。这类方法可以以将未甲基化的核苷酸(例如，每个未甲基化的胞嘧啶)修饰成不同核苷酸的方式应用。例如，在一些实施方案中，这种试剂可以使未甲基化的胞嘧啶核苷酸脱氨基，产生脱氧尿嘧啶残基。这种试剂的实例包括但不限于甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂。

甲基化特异性试剂对核酸核苷酸序列的改变也可能产生每个甲基化核苷酸被修饰为不同的核苷酸的核酸分子。

术语“甲基化测定”是指用于确定核酸序列内的一个或多个CpG二核苷酸序列的甲基化状态的任何测定。

术语“MS AP-PCR”(甲基化敏感性随机引物聚合酶链式反应)是指本领域公认的技术，这项技术允许使用富含CG的引物对基因组进行全局扫描，重点关注最有可能含有CpG二核苷酸的区域，并由Gonzalgo等人(1997)Cancer Research 57:594-599描述。

术语“MethyLight^TM”是指Eads等人(1999)Cancer Res.59:2302-2306描述的本领域公认的基于荧光的实时PCR技术。

术语“HeavyMethyl^TM”是指一种测定，其中覆盖扩增引物之间的CpG位置或被扩增引物覆盖的甲基化特异性阻断探针(本文也称为阻断剂)能够实现核酸样品的甲基化特异性选择性扩增。

术语“HeavyMethyl^TMMethyLight^TM”测定是指HeavyMethyl^TMMethyLight^TM测定，它是MethyLight^TM测定的变体，其中MethyLight^TM测定与覆盖扩增引物之间的CpG位置的甲基化特异性阻断探针组合。

术语“Ms-SNuPE”(甲基化敏感性单核苷酸引物延伸)是指由Gonzalgo和Jones(1997)Nucleic Acids Res.25:2529-2531描述的本领域公认的测定。

术语“MSP”(甲基化特异性PCR)是指由Herman等人(1996)Proc.Natl.Acad.Sci.USA 93:9821-9826和由美国专利No.5,786,146描述的本领域公认的甲基化测定。

术语“COBRA”(联合亚硫酸氢盐限制分析)是指由Xiong和Laird(1997)NucleicAcids Res.25:2532-2534描述的本领域公认的甲基化测定。

术语“MCA”(甲基化CpG岛扩增)是指由Toyota等人(1999)Cancer Res.59:2307-12和WO 00/26401A1中描述的甲基化测定。

如本文所用，“选定核苷酸”是指核酸分子中四种典型存在的核苷酸中的一种核苷酸(DNA为C、G、T和A，RNA为C、G、U和A)，并且可以包括典型存在的核苷酸的甲基化衍生物(例如，当C是选定核苷酸时，甲基化和未甲基化的C都包括在选定核苷酸的含义内)，而甲基化的选定核苷酸特指甲基化的典型存在的核苷酸并且未甲基化的选定核苷酸特指未甲基化的典型存在的核苷酸。

术语“甲基化特异性限制酶”是指根据核酸识别位点的甲基化状态选择性消化核酸的限制酶。在识别位点未甲基化或半甲基化下特异性切割的限制酶的情况下(甲基化敏感性酶)，如果在一条或两条链上识别位点甲基化，那么切割不会发生。在只有识别位点甲基化时才特异性切割的限制酶的情况下(甲基化依赖性酶)，如果识别位点未甲基化，那么切割不会发生(或会发生，但效率显著降低)。优选的是甲基化特异性限制酶，其识别序列含有CG二核苷酸(例如识别序列如CGCG或CCCGGG)。对于一些实施方案进一步优选的是如果该二核苷酸中的胞嘧啶在碳原子C5处被甲基化则不会切割的限制酶。

如本文所用，“不同核苷酸”是指化学上与选定核苷酸不同的核苷酸，通常使得不同核苷酸具有不同于选定核苷酸的沃森-克里克碱基配对(Watson-Crick base-pairing)特性，其中与选定核苷酸互补的典型存在的核苷酸不同于与不同核苷酸互补的典型存在的核苷酸。例如，当C是选定核苷酸时，U或T可以是不同核苷酸，例如C与G的互补性和U或T与A的互补性。如本文所用，与选定核苷酸互补或与不同核苷酸互补的核苷酸是指在高严格条件下以比互补核苷酸与四种典型存在的核苷酸中的三种进行碱基配对高的亲和力与选定核苷酸或不同核苷酸进行碱基配对的核苷酸。互补性的一个实例是DNA(例如A-T和C-G)和RNA(例如A-U和C-G)中的沃森-克里克碱基配对。因此，例如，在高严格条件下，G与C碱基配对的亲和力高于G与G、A或T碱基配对，因此，当C是选定核苷酸时，G是与选定核苷酸互补的核苷酸。

如本文所用，给定标志物(或一起使用的标志物组)的“灵敏度”是指报告DNA甲基化值高于区分赘生物与非赘生物样品的阈值的样品的百分比。在一些实施方案中，阳性定义为报告DNA甲基化值高于阈值(例如，与疾病相关的范围)的组织学确认的瘤形成，并且假阴性定义为报告DNA甲基化值低于阈值(例如，与无疾病相关的范围)的组织学确认的瘤形成。因此，灵敏度值反映了从已知患病样品获得的给定标志物的DNA甲基化测量值在疾病相关测量值范围内的概率。如这里所定义，计算出的灵敏度值的临床相关性表示对当将给定标志物应用于患有临床疾患的受试者时将检测到该疾患存在的概率的估计。

如本文所用，给定标志物(或一起使用的标志物组)的“特异性”是指报告DNA甲基化值高于区分赘生物与非赘生物样品的阈值的非赘生物样品的百分比。在一些实施方案中，阴性定义为报告DNA甲基化值低于阈值(例如，与无疾病相关的范围)的组织学确认的非赘生物样品，并且假阳性定义为报告DNA甲基化值高于阈值(例如，与疾病相关的范围)的组织学确认的非赘生物样品。因此，特异性值反映了从已知非赘生物样品获得的给定标志物的DNA甲基化测量值在非疾病相关测量值范围内的概率。如这里所定义，计算出的特异性值的临床相关性表示对当将给定标志物应用于未患临床疾患的受试者时将检测到该疾患不存在的概率的估计。

如本文所用，术语“AUC”是“曲线下面积”的缩写。其尤其是指接受者操作特征(ROC)曲线下面积。ROC曲线是针对诊断测试的不同可能切点的真阳性率与假阳性率的关系图。它显示了取决于所选切点的灵敏度与特异性之间的平衡(灵敏度的任何增加都将伴随着特异性的降低)。ROC曲线下面积(AUC)是衡量诊断测试准确性的量度(面积越大越好；最佳值为1；随机测试的ROC曲线位于对角线上，面积为0.5；参考：J.P.Egan.(1975)SignalDetection Theory and ROC Analysis,Academic Press,New York)。

如本文所用，术语“赘生物”是指组织的任何新的异常生长。因此，赘生物可以是癌前赘生物或恶性赘生物。

如本文所用，术语“赘生物特异性标志物”是指可用于指示赘生物存在的任何生物物质或要素。生物物质的实例包括但不限于核酸、多肽、碳水化合物、脂肪酸、细胞成分(例如细胞膜和线粒体)和全细胞。在一些情况下，标志物是特定核酸区域(例如，基因、基因内区域、特定基因座等)。作为标志物的核酸区域可称为例如“标志基因”、“标志物区域”、“标志序列”、“标志基因座”等。

如本文所用，术语“腺瘤”是指腺来源的良性肿瘤。虽然这些生长是良性的，但随着时间的推移，它们可能会发展为恶性。

术语“癌前”或“赘生物前”和其等同术语是指任何正在发生恶性转化的细胞增殖性疾病。

赘生物、腺瘤、癌症等的“部位”是受试者体内赘生物、腺瘤、癌症等所在的组织、器官、细胞类型、解剖区域、身体部位等。

如本文所用，“诊断”测试应用包括检测或鉴定受试者的疾病状态或疾患，确定受试者感染给定疾病或疾患的可能性，确定患有疾病或疾患的受试者将对疗法作出反应的可能性，确定患有疾病或疾患的受试者的预后(或其可能的进展或消退)，以及确定治疗对患有疾病或疾患的受试者的影响。例如，诊断可用于检测受试者感染赘生物的存在或可能性，或这类受试者将对化合物(例如药品，例如药物)或其它治疗产生有利反应的可能性。

术语“分离的”如在“分离的寡核苷酸”中当与核酸相关使用时是指从至少一种在天然来源中通常相关联的污染核酸中鉴定并分离的核酸序列。分离的核酸以不同于在自然界中发现的形式或设置存在。相比之下，未分离的核酸，如DNA和RNA，在它们存在于自然界中的状态下被发现。未分离的核酸的实例包括：在宿主细胞染色体上与邻近基因相邻的给定DNA序列(例如，基因)；RNA序列，例如编码特定蛋白质的特定mRNA序列，在细胞中发现其呈与许多其它编码多种蛋白质的mRNA的混合物。然而，编码特定蛋白质的分离的核酸包括例如在通常表达蛋白质的细胞中的这种核酸，其中该核酸在与天然细胞不同的染色体位置中，或者另外由不同于自然界中发现的核酸侧接。分离的核酸或寡核苷酸可以单链或双链形式存在。当分离的核酸或寡核苷酸用于表达蛋白质时，该寡核苷酸将至少包含有义链或编码链(即寡核苷酸可以是单链的)，但可以同时含有有义链和反义链(即，寡核苷酸可以是双链的)。分离的核酸在从其天然或典型环境分离后，可以与其它核酸或分子组合。例如，分离的核酸可以存在于宿主细胞中，在该宿主细胞中放置该核酸，例如用于异源表达。

术语“纯化的”是指从其天然环境中移出、分离或分离出的分子，核酸或氨基酸序列。因此，“分离的核酸序列”可以是纯化的核酸序列。“基本上纯化的”分子至少60％不含，优选至少75％不含，更优选至少90％不含与它们天然相关的其它组分。如本文所用，术语“纯化的”或“进行纯化”还指从样品中去除污染物。污染蛋白质的去除引起样品中感兴趣的多肽或核酸的百分比增加。在另一个实例中，重组多肽在植物、细菌、酵母或哺乳动物宿主细胞中表达，并且通过去除宿主细胞蛋白质来纯化多肽；从而增加了样品中重组多肽的百分比。

术语“包含”给定多核苷酸序列或多肽的“组合物”泛指含有给定多核苷酸序列或多肽的任何组合物。该组合物可包含含有盐(例如NaCl)、去污剂(例如SDS)和其它组分(例如登哈特溶液(Denhardt’ssolution)、奶粉、鲑鱼精DNA等)的水溶液。

术语“样品”以其最广泛的含义使用。在某种意义上，它可以指动物细胞或组织。在另一种意义上，它是指从任何来源获得的样本或培养物，以及生物和环境样品。生物样品可以从植物或动物(包括人类)获得，并且涵盖流体、固体、组织和气体。环境样品包括环境材料，例如表面物质、土壤、水和工业样品。这些实例不应被解释为限制适用于本发明的样品类型。

如本文所用，在一些情况下使用的“远程样品”涉及从不是样品的细胞、组织或器官来源的部位间接收集的样品。

如本文所用，术语“患者”或“受试者”是指要经受这项技术提供的各种测试的生物体。术语“受试者”包括动物，优选哺乳动物，包括人。在一个优选的实施方案中，受试者是灵长类动物。在一个更优选的实施方案中，受试者是人。进一步关于诊断方法，优选的受试者是脊椎动物受试者。优选的脊椎动物是温血动物；优选的温血脊椎动物是哺乳动物。优选的哺乳动物最优选是人。如本文所用，术语“受试者”包括人和动物受试者。因此，本文提供了兽医治疗用途。因此，本发明的技术提供了对哺乳动物(例如人类)以及以下动物的诊断：那些因濒危而重要的哺乳动物(例如东北虎)；具有经济重要性的动物，例如在农场饲养供人类食用的动物；和/或对人类具有社会重要性的动物，例如作为宠物或在动物园饲养的动物。这种动物的实例包括但不限于：食肉动物，例如猫和狗；猪科动物，包括猪、肉猪和野猪；反刍动物和/或有蹄类动物，如牛、公牛、绵羊、长颈鹿、鹿、山羊、野牛和骆驼；鳍足类动物；和马。因此，还提供了家畜的诊断和治疗，包括但不限于家养猪、反刍动物、有蹄类动物、马(包括赛马)等。当前公开的主题还包括用于诊断受试者的肺癌的系统。例如，该系统可作为市售试剂盒提供，该试剂盒可用于筛查已收集生物样品的受试者患肺癌的风险或诊断其患肺癌。根据本发明的技术提供的示例性系统包括评估本文所述的标志物的甲基化状态。

如本文所用，术语“试剂盒”是指递送材料的任何递送系统。在反应测定的情况下，这类递送系统包括允许存储反应试剂(例如适当容器中的寡核苷酸、酶等)和/或支持材料(例如，缓冲液、关于进行测定的书面说明书等)、将其从一个位置运输或递送至另一个位置的系统。例如，试剂盒包括含有相关反应试剂和/或支持材料的一个或多个外壳(例如，盒)。如本文使用，术语“零散试剂盒”是指包括两个或更多个单独容器的递送系统，每个容器含有全部试剂盒组分的子部分。这些容器可共同或单独递送至预定接受者。例如，第一个容器可含有用于测定中的酶，而第二个容器含有寡核苷酸。术语“零散试剂盒”意图涵盖含有受联邦食品、药品和化妆品法案第520(e)节监管的分析物特定试剂(ASR)的试剂盒，但不限于此。事实上，包含各自含有全部试剂盒组分的子部分的两个或更多个单独容器的任何递送系统均包括在术语“零散试剂盒”中。相比之下，“组合试剂盒”是指在单一容器中(例如，容纳每个所需组分的单一盒中)含有反应测定的所有组分的递送系统。术语“试剂盒”包括零散试剂盒和组合试剂盒。

如本文所用，术语“信息”是指任何事实或数据的集合。在提及使用计算机系统(包括但不限于互联网)存储或处理的信息时，该术语是指以任何格式(例如，模拟、数字、光学等)存储的任何数据。如本文所用，术语“与受试者相关的信息”是指与受试者(例如，人、植物或动物)有关的事实或数据。术语“基因组信息”是指与基因组有关的信息，包括但不限于核酸序列、基因、甲基化百分比、等位基因频率、RNA表达水平、蛋白质表达、与基因型相关的表型等。“等位基因频率信息”是指与等位基因频率有关的事实或数据，包括但不限于等位基因身份、等位基因的存在与受试者(例如人类受试者)的一种特征之间的统计相关性、个体或群体中等位基因的存在或不存在、在具有一种或多种特定特征的个体中存在等位基因的可能性百分比等。

具体实施方式

在各种实施方案的详细描述中，为了解释的目的，阐述了许多具体细节以提供对所公开的实施方案的透彻理解。然而，本领域技术人员将理解，可以在有或没有这些具体细节的情况下实践这些各种实施方案。在其它情况下，结构和装置以框图形式展示。此外，本领域技术人员可以容易地理解，其中呈现和执行方法的特定顺序是例示性的，并且预期这些顺序可以变化并且仍然保持在本文公开的各种实施方案的精神和范围内。

本文提供了筛查EC的技术，并且特别但不仅仅是检测EC和/或EC特定形式(例如透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的存在的方法、组合物和相关用途。如这项技术在本文中所描述，使用的章节标题仅仅是出于组织的目的，而不应视为以任何方式限制主题。

实际上，如实施例1、2和3中所述，在本发明的实施方案的鉴定过程期间进行的实验鉴定了一组499个新颖的差异甲基化区域(DMR)，用于区分源自子宫内膜癌的DNA与非赘生物对照DNA。从这499个新颖的DNA甲基化标志物中，进一步的实验鉴定出能够区分不同EC类型与正常子宫内膜组织的标志物。例如，单独的DMR组被确定能够区分1)EC与正常子宫内膜组织；2)透明细胞EC与正常子宫内膜组织；3)浆液性EC与正常子宫内膜组织；4)癌肉瘤EC与正常子宫内膜组织；以及5)子宫内膜样EC与正常子宫内膜组织。

尽管这里的公开内容涉及某些例示的实施方案，但是应当理解，这些实施方案是作为示例而不是作为限制来呈现的。

在具体方面，本发明的技术提供了用于鉴定、确定和/或分类例如EC的癌症的组合物和方法。所述方法包括确定从受试者分离的生物样品(例如，粪便样品、子宫内膜组织样品、血浆样品)中至少一种甲基化标志物的甲基化状况，其中该标志物的甲基化状态的变化指示EC的存在、类别或部位。具体实施方案涉及包含差异甲基化区域(DMR，例如DMR 1-499，参见表1、8和21)的标志物，所述标志物用于诊断(例如筛查)EC和各种EC类型(例如，透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)。

除了分析包含本文所提供和表1、8和21中所列出的DMR(例如DMR，例如DMR 1-499)的至少一种标志物、标志物区域或标志物的碱基的甲基化分析的实施方案以外，这项技术还提供了包含含有DMR的至少一种标志物、标志物区域或标志物的碱基的标志物组，用于检测癌症、尤其是EC。

这项技术的的一些实施方案是基于对包含DMR的至少一种标志物、标志物区域或标志物的碱基的CpG甲基化状况的分析。

在一些实施方案中，本发明的技术提供了以甲基化特异性方式修饰DNA的试剂(例如甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)的用途，所述试剂与一种或多种甲基化测定组合，用于确定包含DMR(例如DMR 1-499，参见表1、8和21)的至少一种标志物内的CpG二核苷酸序列的甲基化状况。基因组CpG二核苷酸可以是甲基化或未甲基化的(可替代地分别称为高甲基化和低甲基化)。然而，本发明的方法适合于分析非均质性的生物样品，例如在偏远样品(例如血液、器官流出物或粪便)的背景内的低浓度的肿瘤细胞或从中获得的生物材料。因此，当分析这类样品内CpG位置的甲基化状况时，可使用定量测定来确定具体CpG位置的甲基化水平(例如百分比、分数、比率、比例或程度)。

根据本发明的技术，对包含DMR的标志物中CpG二核苷酸序列的甲基化状况的确定可用于诊断和表征例如EC的癌症。

标志物的组合

在一些实施方案中，这项技术涉及评估包含来自表1、8和21的DMR(例如DMR编号1-499)的标志物的组合的甲基化状态。在一些实施方案中，评估超过一种标志物的甲基化状态增加用于鉴定受试者中的赘生物(例如EC)的筛查或诊断法的特异性和/或灵敏度。

利用例如如通过与预测特异性和灵敏度有关的统计技术鉴定的标志物的多种组合预测多种癌症。这项技术提供了鉴定一些癌症的预测组合和验证预测组合的方法。

测定甲基化状态的方法

在某些实施方案中，用于分析核酸中5-甲基胞嘧啶的存在的方法涉及用以甲基化特异性方式修饰DNA的试剂处理DNA。这种试剂的实例包括(但不限于)甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂。

常用于分析核酸中5-甲基胞嘧啶的存在的方法是基于Frommer等人描述的用于检测DNA中的5-甲基胞嘧啶的亚硫酸氢盐方法(Frommer等人(1992)Proc.Natl.Acad.Sci.USA89:1827-31，明确地以引用的方式整体并入本文中以达成所有目的)或其变体。定位5-甲基胞嘧啶的亚硫酸氢盐方法是基于如下观测结果：胞嘧啶与亚硫酸氢盐离子(又名亚硫酸氢盐)反应，而5-甲基胞嘧啶不反应。反应通常根据以下步骤进行：首先，胞嘧啶与亚硫酸氢盐反应，形成磺化胞嘧啶。然后，磺化的反应中间体自发脱氨基，产生磺化尿嘧啶。最终，磺化尿嘧啶在碱性条件下脱磺酸，形成尿嘧啶。检测是可能的原因在于尿嘧啶碱基与腺嘌呤配对(因此，行为如胸腺嘧啶一样)，而5-甲基胞嘧啶碱基与鸟嘌呤配对(因此，行为如胞嘧啶一样)。这使得通过例如以下区分甲基化胞嘧啶与非甲基化胞嘧啶成为可能：亚硫酸氢盐基因组测序(Grigg G和Clark S,Bioessays(1994)16:431-36；Grigg G,DNA Seq.(1996)6:189-98)、如例如美国专利No.5,786,146中公开的甲基化特异性PCR(MSP)或使用包含序列特异性探针裂解的测定，例如QuARTS瓣状核酸内切酶测定(参见例如Zou等人(2010)“Sensitive quantification of methylated markers with a novel methylationspecific technology”Clin Chem 56:A199；以及美国专利No.8,361,720；8,715,937；8,916,344；和9,212,392。

一些常规技术涉及如下方法，所述方法包括将待分析的DNA封装在琼脂糖基质中，从而防止DNA的扩散和复性(亚硫酸氢盐仅与单链DNA反应)，并用快速透析代替沉淀和纯化步骤(Olek A等人,(1996)“A modified and improved method for bisulfite basedcytosine methylation analysis”Nucleic Acids Res.24:5064-6)。因此可以分析单个细胞的甲基化状况，这说明了该方法的实用性和灵敏度。Rein,T.等人,(1998)Nucleic AcidsRes.26:2255概述了检测5-甲基胞嘧啶的常规方法。

亚硫酸氢盐技术典型地包括在亚硫酸氢盐处理后扩增已知核酸的短的特定片段，然后通过测序(Olek和Walter(1997)Nat.Genet.17:275-6)或引物延伸反应(Gonzalgo和Jones(1997)Nucleic Acids Res.25:2529-31；WO 95/00669；美国专利No.6,251,594)分析产物以分析单个胞嘧啶位置。一些方法使用酶消化(Xiong和Laird(1997)Nucleic AcidsRes.25:2532-4)。本领域也描述了通过杂交进行的检测(Olek等人,WO 99/28498)。此外，已经描述了使用亚硫酸氢盐技术检测单个基因的甲基化(Grigg和Clark(1994)Bioessays16:431-6；Zeschnigk等人(1997)Hum Mol Genet.6:387-95；Feil等人(1994)NucleicAcids Res.22:695；Martin等人(1995)Gene 157:261-4；WO 9746705；WO 9515373)。

根据本发明的技术，各种甲基化测定程序可以与亚硫酸氢盐处理结合使用。这些测定允许确定核酸序列内的一个或多个CpG二核苷酸(例如CpG岛)的甲基化状态。这类测定除其它技术外还涉及经过亚硫酸氢盐处理的核酸的测序、PCR(用于序列特异性扩增)、DNA印迹分析(Southern blot analysis)和甲基化特异性限制酶如甲基化敏感性或甲基化依赖性酶的使用。

例如，通过使用亚硫酸氢盐处理，已简化基因组测序供分析甲基化模式和5-甲基胞嘧啶分布(Frommer等人(1992)Proc.Natl.Acad.Sci.USA 89:1827-1831)。此外，对从经过亚硫酸氢盐转化的DNA扩增的PCR产物的限制酶消化可用于评估甲基化状态，例如，如Sadri和Hornsby(1997)Nucl.Acids Res.24:5058-5059所述或如在称为COBRA(联合亚硫酸氢盐限制分析)的方法中所体现(Xiong和Laird(1997)Nucleic Acids Res.25:2532-2534)。

COBRA^TM分析是一种定量甲基化测定，可用于确定少量基因组DNA中特定基因座的DNA甲基化水平(Xiong和Laird,Nucleic Acids Res.25:2532-2534,1997)。简单地说，限制酶消化用于揭示经过亚硫酸氢钠处理的DNA的PCR产物的甲基化依赖性序列差异。根据Frommer等人(Proc.Natl.Acad.Sci.USA 89:1827-1831,1992)描述的程序，首先通过标准亚硫酸氢盐处理将甲基化依赖性序列差异引入基因组DNA。然后使用对感兴趣的CpG岛具有特异性的引物对经过亚硫酸氢盐转化的DNA进行PCR扩增，接着进行限制性内切酶消化、凝胶电泳，并使用特定的标记的杂交探针进行检测。原始DNA样品中的甲基化水平由在广泛的DNA甲基化水平范围内呈线性定量方式的消化和未消化的PCR产物的相对量表示。此外，这项技术可以可靠地应用于从显微解剖的石蜡包埋组织样品中获得的DNA。

用于COBRA^TM分析的典型试剂(例如，可在典型的基于COBRA^TM的试剂盒中找到)可能包括但不限于：针对特定基因座(例如，特定基因、标志物、DMR、基因区域、标志物区域、经过亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物；限制酶和适当的缓冲液；基因杂交寡核苷酸；对照杂交寡核苷酸；寡核苷酸探针的激酶标记试剂盒；和标记的核苷酸。此外，亚硫酸氢盐转化试剂可能包括：DNA变性缓冲液；磺化缓冲液；DNA回收试剂或试剂盒(如沉淀、超滤、亲和柱)；脱磺酸缓冲液；和DNA回收组分。

如“MethyLight^TM”(一种基于荧光的实时PCR技术)(Eads等人,Cancer Res.59:2302-2306,1999)、Ms-SNuPE^TM(甲基化敏感性单核苷酸引物延伸)反应(Gonzalgo和Jones,Nucleic Acids Res.25:2529-2531,1997)、甲基化特异性PCR(“MSP”；Herman等人,Proc.Natl.Acad.Sci.USA 93:9821-9826,1996；美国专利No.5,786,146)和甲基化CpG岛扩增(“MCA”；Toyota等人,Cancer Res.59:2307-12,1999)等测定单独使用或与这些方法中的一种或多种组合使用。

“HeavyMethyl^TM”测定技术是一种基于经过亚硫酸氢盐处理的DNA的甲基化特异性扩增来评估甲基化差异的定量方法。覆盖扩增引物之间的CpG位置或被扩增引物覆盖的甲基化特异性阻断探针(本文也称为阻断剂)能够实现核酸样品的甲基化特异性选择性扩增。

术语“HeavyMethyl^TMMethyLight^TM”测定是指HeavyMethyl^TMMethyLight^TM测定，它是MethyLight^TM测定的变体，其中MethyLight^TM测定与覆盖扩增引物之间的CpG位置的甲基化特异性阻断探针组合。HeavyMethyl^TM测定也可以与甲基化特异性扩增引物结合使用。

用于HeavyMethyl^TM分析的典型试剂(例如，可在典型的基于MethyLight^TM的试剂盒中找到)可以包括但不限于：针对特定基因座(例如，特定基因、标志物、基因区域、标志物区域、经过亚硫酸氢盐处理的DNA序列、CpG岛或经过亚硫酸氢盐处理的DNA序列或CpG岛等)的PCR引物；阻断寡核苷酸；优化的PCR缓冲液和脱氧核苷酸；以及Taq聚合酶。

MSP(甲基化特异性PCR)允许评估CpG岛内几乎任一组CpG位点的甲基化状况，而无需使用甲基化敏感性限制酶(Herman等人Proc.Natl.Acad.Sci.USA 93:9821-9826,1996；美国专利No.5,786,146)。简单地说，亚硫酸氢钠对DNA进行修饰，将未甲基化而非甲基化的胞嘧啶转化为尿嘧啶，随后使用对甲基化与未甲基化DNA具有特异性的引物扩增产物。MSP只需要少量的DNA，对给定CpG岛基因座的0.1％甲基化等位基因敏感，并且可以对从石蜡包埋样品中提取的DNA进行分析。用于MSP分析的典型试剂(例如，可在典型的基于MSP的试剂盒中找到)可以包括但不限于：针对特定基因座(例如，特定基因、标志物、基因区域、标志物区域、经过亚硫酸氢盐处理的DNA序列、CpG岛等)的甲基化和未甲基化PCR引物；优化的PCR缓冲液和脱氧核苷酸；以及特定的探针。

MethyLight^TM测定是一种高通量的定量甲基化测定，它利用基于荧光的实时PCR(例如

)，在PCR步骤后无需进一步操作(Eads等人,Cancer Res.59:2302-2306,1999)。简单地说，MethyLight^TM过程从基因组DNA的混合样品开始，该样品在亚硫酸氢钠反应中根据标准程序转化为甲基化依赖性序列差异的混合库(亚硫酸氢盐过程将未甲基化的胞嘧啶残基转化为尿嘧啶)。然后在“偏向”反应中例如使用与已知的CpG二核苷酸重叠的PCR引物进行基于荧光的PCR。序列区分发生在扩增过程的水平和荧光检测过程的水平下。

MethyLight^TM测定用作核酸，例如基因组DNA样品中甲基化模式的定量测试，其中序列区分发生在探针杂交水平下。在定量型式中，PCR反应在存在与特定假定甲基化位点重叠的荧光探针的情况下提供甲基化特异性扩增。引物和探针都不覆盖任何CpG二核苷酸的反应提供了对所述量的输入DNA的无偏向控制。可替代地，通过使用不覆盖已知的甲基化位点的对照寡核苷酸(例如，HeavyMethyl^TM和MSP技术的基于荧光的型式)或使用覆盖潜在甲基化位点的寡核苷酸探测偏向的PCR池，实现基因组甲基化的定性测试。

MethyLight^TM过程与任何合适的探针(例如“

”探针、

探针等)一起使用。例如，在一些应用中，双链基因组DNA用亚硫酸氢钠处理并使用

探针，例如使用MSP引物和/或HeavyMethyl阻断剂寡核苷酸和

探针进行两组PCR反应中的一组。

探针使用荧光“报告基因”和“猝灭剂”分子进行双重标记，并且设计成对相对较高GC含量的区域具有特异性，以便它在PCR循环中比正向或反向引物高约10℃的温度下熔化。这允许

探针在PCR退火/延伸步骤期间保持完全杂交。当Taq聚合酶在PCR过程中酶促合成一条新链时，它最终将到达退火的

探针。然后，Taq聚合酶5'至3'核酸内切酶活性将置换

探针，它是通过消化探针以释放荧光报告分子，从而使用实时荧光检测系统对其现在未淬灭的信号进行定量检测。

用于MethyLight^TM分析的典型试剂(例如，可在典型的基于MethyLight^TM的试剂盒中找到)可以包括但不限于：针对特定基因座(例如，特定基因、标志物、基因区域、标志物区域、经过亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物；

或

探针；优化的PCR缓冲液和脱氧核苷酸；以及Taq聚合酶。

QM^TM(定量甲基化)测定是基因组DNA样品中甲基化模式的替代定量测试，其中序列区分发生在探针杂交水平下。在这种定量型式中，PCR反应在存在与特定假定甲基化位点重叠的荧光探针的情况下提供无偏向的扩增。引物和探针都不覆盖任何CpG二核苷酸的反应提供了对所述量的输入DNA的无偏向控制。可替代地，通过使用不覆盖已知的甲基化位点的对照寡核苷酸(HeavyMethyl^TM和MSP技术的基于荧光的型式)或使用覆盖潜在甲基化位点的寡核苷酸探测偏向的PCR池，实现基因组甲基化的定性测试。

在扩增过程中，QM^TM过程可以与任何合适的探针，例如“

”探针、

探针一起使用。例如，双链基因组DNA用亚硫酸氢钠处理，并经受无偏向引物和

探针。

探针。然后，Taq聚合酶5'至3'核酸内切酶活性将置换

探针，它是通过消化探针以释放荧光报告分子，从而使用实时荧光检测系统对其现在未淬灭的信号进行定量检测。用于QM^TM分析的典型试剂(例如，可在典型的基于QM^TM的试剂盒中找到)可以包括但不限于：针对特定基因座(例如，特定基因、标志物、基因区域、标志物区域、经过亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物；

或

探针；优化的PCR缓冲液和脱氧核苷酸；以及Taq聚合酶。

Ms-SNuPE^TM技术是一种用于评估特定CpG位点的甲基化差异的定量方法，该方法基于DNA的亚硫酸氢盐处理，然后是单核苷酸引物延伸(Gonzalgo和Jones,Nucleic AcidsRes.25:2529-2531,1997)。简单地说，基因组DNA与亚硫酸氢钠反应，将未甲基化的胞嘧啶转化为尿嘧啶，同时保持5-甲基胞嘧啶不变。然后使用对经过亚硫酸氢盐转化的DNA具有特异性的PCR引物进行所需靶序列的扩增，并且分离所得产物并用作感兴趣CpG位点的甲基化分析的模板。可以分析少量的DNA(例如，显微解剖病理切片)，并且避免使用限制酶来确定CpG位点的甲基化状况。

用于Ms-SNuPE^TM分析的典型试剂(例如，可在典型的基于Ms-SNuPE^TM的试剂盒中找到)可能包括但不限于：针对特定基因座(例如，特定基因、标志物、基因区域、标志物区域、经过亚硫酸氢盐处理的DNA序列、CpG岛等)的PCR引物；优化的PCR缓冲液和脱氧核苷酸；凝胶提取试剂盒；阳性对照引物；针对特定基因座的Ms-SNuPE^TM引物；反应缓冲液(针对Ms-SNuPE反应)；和标记的核苷酸。此外，亚硫酸氢盐转化试剂可能包括：DNA变性缓冲液；磺化缓冲液；DNA回收试剂或试剂盒(如沉淀、超滤、亲和柱)；脱磺酸缓冲液；和DNA回收组分。

简化代表性亚硫酸氢盐测序(RRBS)从对核酸进行亚硫酸氢盐处理以将所有未甲基化的胞嘧啶转化为尿嘧啶开始，然后进行限制酶消化(例如，通过识别包括CG序列的位点的酶，如MspI)以及在与接头配体偶联后对片段进行完整测序。限制酶的选择可以富集CpG密集区域的片段，减少在分析过程中可能映射至多个基因位置的冗余序列的数目。因此，RRBS通过选择限制性片段的子集(例如，通过使用制备型凝胶电泳的大小选择)用于测序来降低核酸样品的复杂性。与全基因组亚硫酸氢盐测序相反，限制酶消化产生的每个片段都含有至少一个CpG二核苷酸的DNA甲基化信息。因此，RRBS富集样品中在区域内具有高频率的限制酶切割位点的启动子、CpG岛和其它基因组特征，从而提供了一种评估一个或多个基因组基因座的甲基化状态的测定法。

RRBS的典型方案包括使用限制酶(如MspI)消化核酸样品、填充悬垂和A尾、连接接头、亚硫酸氢盐转化和PCR的步骤。参见例如等人(2005)“Genome-scale DNA methylationmapping of clinical samples at single-nucleotide resolution”Nat Methods 7:133-6；Meissner等人(2005)“Reduced representation bisulfite sequencing forcomparative high-resolution DNA methylation analysis”Nucleic Acids Res.33:5868-77。

在一些实施方案中，使用定量等位基因特异性实时靶标和信号放大(QuARTS)测定来评估甲基化状态。在每个QuARTS测定中依次发生三个反应，包括初级反应中的扩增(反应1)和靶探针裂解(反应2)；以及次级反应中的FRET裂解和荧光信号生成(反应3)。当使用特定引物扩增目标核酸时，带有瓣序列的特定检测探针与扩增子松散地结合。靶结合位点处特定侵入性寡核苷酸的存在引起5'核酸酶，例如FEN-1核酸内切酶，通过在检测探针和瓣序列之间切割来释放瓣序列。瓣序列与相应FRET盒的非发夹部分互补。因此，瓣序列充当FRET盒上的侵入性寡核苷酸，并在FRET盒荧光团与猝灭剂之间实现裂解，产生荧光信号。裂解反应可以每个靶标切割多个探针，从而每个瓣释放多个荧光团，提供指数信号放大。QuARTS可以通过使用带有不同染料的FRET盒来检测单个反应孔中的多个靶标。参见例如Zou等人(2010)“Sensitive quantification of methylated markers with a novelmethylation specific technology”Clin Chem 56:A199)，和美国专利No.8,361,720；8,715,937；8,916,344；以及9,212,392，每一个都通过引用的方式并入本文中，以达成所有目的。

术语“亚硫酸氢盐试剂”是指包含亚硫酸氢盐(bisulfite)、亚硫酸氢盐(disulfite)、亚硫酸氢盐(hydrogen sulfite)或其组合的试剂，如本文所公开，其用于区分甲基化与未甲基化的CpG二核苷酸序列。所述处理方法是本领域已知的(例如PCT/EP2004/011715和WO2013/116375，各自通过引用的方式整体并入)。在一些实施方案中，亚硫酸氢盐处理在变性溶剂例如但不限于正烷二醇或二乙二醇二甲醚(DME)的存在下，或在二噁烷或二噁烷衍生物的存在下进行。在一些实施方案中，变性溶剂以介于1％与35％(v/v)之间的浓度使用。在一些实施方案中，亚硫酸氢盐反应在清除剂存在下进行，所述清除剂例如但不限于色烷衍生物，例如6-羟基-2,5,7,8,-四甲基色烷2-甲酸或三羟基苯甲酸和其衍生物，例如没食子酸(参见：PCT/EP2004/011715，以引用的方式整体并入)。在某些优选的实施方案中，亚硫酸氢盐反应包括用亚硫酸氢铵处理，例如，如WO 2013/116375中所述。

在一些实施方案中，使用根据本发明的引物寡核苷酸组(例如参见表10、19和20)和扩增酶扩增处理过的DNA的片段。几个DNA区段的扩增可以在同一个反应容器中同时进行。通常，使用聚合酶链式反应(PCR)进行扩增。扩增子的长度通常为100至2000个碱基对。

在该方法的另一个实施方案中，可以通过使用甲基化特异性引物寡核苷酸来检测在包含DMR(例如DMR 1-499，表1、8和21)的标志物内或附近的CpG位置的甲基化状况。这种技术(MSP)已在Herman的美国专利No.6,265,171中描述。使用甲基化状况特异性引物扩增经过亚硫酸氢盐处理的DNA可以区分甲基化与未甲基化的核酸。MSP引物对含有至少一种与经过亚硫酸氢盐处理的CpG二核苷酸杂交的引物。因此，所述引物的序列包含至少一个CpG二核苷酸。对未甲基化的DNA具有特异性的MSP引物在CpG的C位置处含有“T”。

通过扩增获得的片段可以带有直接或间接的可检测标记。在一些实施方案中，标记是荧光标记、放射性核素或具有可在质谱仪中检测到的典型质量的可分离分子片段。在所述标记是质量标记的情况下，一些实施方案提供标记的扩增子具有单个正或负净电荷，从而允许在质谱仪中具有更好的可检测性。可以通过例如基质辅助激光解吸/电离质谱法(MALDI)或使用电喷雾质谱法(ESI)来进行检测和可视化。

适用于这些测定技术的分离DNA的方法是本领域已知的。具体地说，一些实施方案包括分离核酸，如通过引用的方式整体并入本文中的美国专利申请序列号13/470,251(“Isolation of Nucleic Acids”)中所述。

在一些实施方案中，本文所述的标志物可用于对粪便样品进行的QUARTS测定。在一些实施方案中，提供了产生DNA样品的方法，特别是产生如下DNA样品的方法，所述DNA样品包含小体积(例如，小于100微升、小于60微升)的高度纯化的低丰度核酸并且基本上和/或实际上不含抑制用于测试DNA样品的测定(例如，PCR、INVADER、QuARTS测定等)的物质。这类DNA样品可在定性检测在取自患者的样品中存在的基因、基因变体(例如等位基因)或基因修饰(例如甲基化)的存在或定量测量其活性、表达或数量的诊断分析中使用。例如，一些癌症与特定突变等位基因或特定甲基化状态的存在相关，因此检测和/或定量这类突变等位基因或甲基化状态在癌症的诊断和治疗中具有预测价值。

许多有价值的遗传标志物以极低的量存在于样品中，并且产生这类标志物的许多事件非常罕见。因此，即使是灵敏的检测方法(例如PCR)也需要大量DNA来提供足够的低丰度靶标，以满足或代替测定的检测阈值。此外，即使是少量抑制物质的存在也会损害这些旨在检测如此少量靶标的测定的准确性和精确度。因此，本文提供了对体积和浓度提供必要管理以产生这类DNA样品的方法。

在一些实施方案中，样品包含血液、血清、白细胞、血浆或唾液。在一些实施方案中，受试者是人。这类样品可以通过本领域已知的，例如熟练技术人员显而易见的多种方法获得。可以通过使样品经受本领域技术人员已知的各种技术，包括但不限于离心和过滤来获得无细胞或基本上无细胞的样品。尽管通常优选不使用侵入性技术来获得样品，但获得样品例如组织匀浆、组织切片和活检标本仍可能是优选的。这项技术不限于用于制备样品和提供用于测试的核酸的方法。例如，在一些实施方案中，使用直接基因捕获，例如，如美国专利No.8,808,990和9,169,511以及WO 2012/155072中所详述，或通过相关方法，从粪便样品或血液或血浆样品中分离DNA。

标志物的分析可以单独或与一个测试样品中的另外的标志物同时进行。例如，可以将几个标志物组合到一个测试中以有效处理多个样品并潜在地提供更高的诊断和/或预后准确性。此外，本领域技术人员会认识到测试来自同一受试者的多个样品(例如，在连续时间点)的价值。这类系列样品测试可以鉴定标志物甲基化状态随时间的变化。甲基化状态的变化以及甲基化状态没有变化可以提供有关疾病状态的有用信息，包括但不限于鉴定事件发生的大致时间、可挽救组织的存在和数量、药物疗法的适当性、各种疗法的有效性以及对受试者结果的鉴定，包括未来事件的风险。

生物标志物的分析可以呈多种物理格式进行。例如，可以使用微量滴定板或自动化来促进大量测试样品的处理。可替代地，可以开发单一样品格式以促进以及时方式进行即刻治疗和诊断，例如在非卧床运输或急诊室环境中。

预期以试剂盒的形式提供这项技术的实施方案。试剂盒包含本文所述的组合物、装置、设备等的实施方案，以及试剂盒的使用说明书。这类说明书描述了用于从样品制备分析物，例如用于收集样品和从样品制备核酸的合适方法。试剂盒的各个组分被包装在合适的容器和包装(例如，小瓶、盒子、泡罩包装、安瓿、广口瓶、瓶子、管等)中并且这些组分被一起包装在合适的容器(例如，一个盒子或多个盒子)中以方便试剂盒的用户存储、运输和/或使用。应当理解，液体组分(例如，缓冲液)可以呈冻干形式提供以供用户复原。试剂盒可以包括用于评估、验证和/或确保试剂盒性能的对照或参考。例如，用于测定样品中存在的核酸量的试剂盒可以包括对照，其包含已知浓度的用于比较的相同或另一种核酸，并且在一些实施方案中，对对照核酸具有特异性的检测试剂(例如引物)。试剂盒适用于临床环境，并且在一些实施方案中，适用于用户家中。在一些实施方案中，试剂盒的组件提供用于从样品制备核酸溶液的系统的功能。在一些实施方案中，系统的某些组件由用户提供。

方法

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90，以及

2)检测EC(例如以大于或等于80％的灵敏度和大于或等于80％的特异性提供)。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422，以及

2)检测透明细胞EC(例如以大于或等于80％的灵敏度和大于或等于80％的特异性提供)。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B，以及

2)检测癌肉瘤EC(例如以大于或等于80％的灵敏度和大于或等于80％的特异性提供)。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：EMX2OS和LRRC34，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B，以及

2)检测浆液性EC(例如以大于或等于80％的灵敏度和大于或等于80％的特异性提供)。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：EMX2OS和LRRC41_D，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B，以及

2)检测子宫内膜样EC(例如以大于或等于80％的灵敏度和大于或等于80％的特异性提供)。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从血液样品(例如，血浆样品、全血样品、白细胞样品、血清样品)分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A，以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C，以及

2)检测子宫内膜样1级EC(例如以大于或等于80％的灵敏度和大于或等于80％的特异性提供)。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B，以及

2)检测子宫内膜样EC 2级(例如以大于或等于80％的灵敏度和大于或等于80％的特异性提供)。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)使从受试者获得的核酸(如例如从子宫内膜组织分离的基因组DNA)与区分至少一种标志物内的甲基化与非甲基化CpG二核苷酸的至少一种试剂或一系列试剂接触，所述标志物选自具有选自由以下组成的组的注释的染色体区域：TSPYL5、MPZ_B、TRH和PTGDR，以及

2)检测子宫内膜样EC 3级(例如以大于或等于80％的灵敏度和大于或等于80％的特异性提供)。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)通过用以甲基化特异性方式修饰DNA的试剂(例如其中所述试剂亚硫酸氢盐试剂、甲基化敏感性限制酶或甲基化依赖性限制酶)处理人类个体的生物样品中的基因组DNA，测量所述生物样品中一种或多种基因的甲基化水平，其中所述一种或多种基因选自以下组中的一组：

(i)AFF3、AIM1_A、AMIGO3_A、BMP4_B、C17orf107_A、C1orf70_B、C5orf52、CLDN7、DIDO1_A、EEF1A2、EMX2OS、FEV、FKBP11_A、GDF6、GDF7_A、JSRP1_A、KCTD15_A、KLHL21、LRRC8D_A、NBPF8、MAX.chr10.130339363-130339534、MAX.chr10.22624479-22624553、MAX.chr14.103021656-103021718、MAX.chr8.145103829-145103992、MAX.chr8.145104263-145104422、MDFI_B、MIAT_A、MMP23B、NDRG2、OBSCN_A、PCOLCE、PYCARD、SEPT9_B、SLC6A3_A、SLC8A3_B、SQSTM1、VILL、ZNF302、ZNF323_A、ZNF506和ZNF90；

(ii)EMX2OS、CYTH2、C17orf107_A、DIDO1_A、GDF6、NBPF8、MAX.chr14.103021656-103021718、JSRP1_A、GATA2_B和SFMBT2_B；

(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A；

(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553；以及

(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A；

2)使用一组针对所选择的一种或多种基因的引物扩增经过处理的基因组DNA；以及

3)通过聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离以及靶标捕获确定所述一种或多种基因的甲基化水平。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

(i)DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422；

(ii)ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A；

(iii)SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A；

(iv)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B；以及

(v)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC；

在这项技术的一些实施方案中，提供包括以下步骤的方法：

(i)EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B；

(ii)EMX2OS和LRRC34；

(iii)ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL；

(iv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B；以及

(v)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL；

在这项技术的一些实施方案中，提供包括以下步骤的方法：

(i)EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B；

(ii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C；

(iii)MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL；

(iv)EMX2OS和LRRC41_D；以及

(v)SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A；

在这项技术的一些实施方案中，提供包括以下步骤的方法：

(i)MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B；

(ii)MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL；

(iii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A；

(iv)SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A；

(v)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C；

(vi)TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B；以及

(vii)TSPYL5、MPZ_B、TRH和PTGDR；

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)测量来自样品的DNA中至少一种甲基化标志基因的量，其中所述一种或多种基因选自以下组中的一组：

(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553；以及

2)测量DNA中的至少一种参考标志物的量；以及

3)将在DNA中测量的至少一种甲基化标志基因的量的值计算为在DNA中测量的参考标志基因的量的百分比，其中该值指示在样品中测量的至少一种甲基化标志DNA的量。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

(iv)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B；以及

2)测量DNA中至少一种参考标志物的量；以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

(ii)EMX2OS和LRRC34；

(iv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B；以及

2)测量DNA中至少一种参考标志物的量；以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

(ii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C；

(iv)EMX2OS和LRRC41_D；以及

2)测量DNA中至少一种参考标志物的量；以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

(v)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C；

(vii)TSPYL5、MPZ_B、TRH和PTGDR；

2)测量DNA中至少一种参考标志物的量；以及

在这项技术的一些实施方案中，提供包括以下步骤的方法：

1)通过用亚硫酸氢盐以甲基化特异性方式修饰DNA的试剂(例如甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂)处理人类个体的生物样品中的基因组DNA，测量所述生物样品中一种或多种基因的CpG位点的甲基化水平；

2)使用一组针对所选择的一种或多种基因的引物扩增经过修饰的基因组DNA；以及

3)通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的甲基化水平；

其中所述一种或多种基因选自以下组中的一组：

(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553；以及

(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

其中所述一种或多种基因选自以下组中的一组：

(iv)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B；以及

(v)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

其中所述一种或多种基因选自以下组中的一组：

(ii)EMX2OS和LRRC34；

(iv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B；以及

(v)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

其中所述一种或多种基因选自以下组中的一组：

(ii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C；

(iv)EMX2OS和LRRC41_D；以及

(v)SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A。

在这项技术的一些实施方案中，提供包括以下步骤的方法：

其中所述一种或多种基因选自以下组中的一组：

(v)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C；

(vii)TSPYL5、MPZ_B、TRH和PTGDR。

优选地，这类方法的灵敏度为约70％至约100％，或约80％至约90％，或约80％至约85％。优选地，特异性为约70％至约100％，或约80％至约90％，或约80％至约85％。

基因组DNA可以通过任何方式分离，包括使用市售试剂盒。简单地说，当感兴趣的DNA被细胞膜包裹时，生物样品必须通过酶促、化学或机械方式进行破坏和溶解。然后可以例如通过用蛋白酶K消化来清除DNA溶液中的蛋白质和其它污染物。然后从溶液中回收基因组DNA。这可以通过多种方法进行，包括盐析、有机萃取或将DNA结合到固相载体上。方法的选择将受到几种因素的影响，包括时间、费用和所需的DNA数量。包含赘生物或肿瘤发生前物质的所有临床样品类型都适用于本发明的方法，例如细胞系、组织切片、活检、石蜡包埋组织、体液、粪便、乳腺组织、子宫内膜组织、白细胞、结肠流出物、尿液、血浆、血清、全血、分离的血细胞、从血液中分离的细胞以及它们的组合。

这项技术不限于用于制备样品和提供用于测试的核酸的方法。例如，在一些实施方案中，使用直接基因捕获，例如，如美国专利申请序列号61/485386中所详述，或通过相关方法，从粪便样品或血液或血浆样品中分离DNA。

然后用至少一种试剂或一系列试剂处理基因组DNA样品，所述试剂区分包含DMR(例如DMR 1-499，如表1、8和21所提供)的至少一种标志物内的甲基化与未甲基化的CpG二核苷酸。

在一些实施方案中，试剂将在5'-位置未甲基化的胞嘧啶碱基转化为尿嘧啶、胸腺嘧啶或在杂交行为方面与胞嘧啶不同的另一碱基。然而，在一些实施方案中，试剂可以是甲基化敏感性限制酶。

在一些实施方案中，基因组DNA样品通过如下方式进行处理，使得将在5'-位置未甲基化的胞嘧啶碱基转化为尿嘧啶、胸腺嘧啶或在杂交行为方面与胞嘧啶不同的另一碱基。在一些实施方案中，这种处理是用亚硫酸氢盐(亚硫酸氢盐、亚硫酸氢盐)，然后碱水解进行的。

然后分析处理过的核酸以确定靶基因序列(来自包含DMR，例如至少一种选自DMR1-499(例如，如表1、8和21中提供)的DMR的标志物的至少一种基因、基因组序列或核苷酸)的甲基化状态。分析方法可选自本领域已知的那些，包括本文所列的那些，例如本文所述的QuARTS和MSP。

异常甲基化，更具体地，包含DMR(例如，DMR 1-499，例如，如表1、8和21所提供)的标志物的高甲基化与EC和/或一种EC类型(例如，透明细胞EC，癌肉瘤EC、子宫内膜样EC、浆液性EC)相关。

这项技术涉及与EC相关的任何样品的分析。例如，在一些实施方案中，样品包含从患者获得的组织和/或生物流体。在一些实施方案中，样品包含分泌物。在一些实施方案中，样品包含血液、血清、血浆、胃分泌物、胰液、胃肠活检样品、来自乳房活检的显微解剖细胞和/或从粪便中回收的细胞。在一些实施方案中，样品包含子宫内膜组织。在一些实施方案中，受试者是人。样品可以包括来自子宫内膜、乳房、肝脏、胆管、胰腺、胃、结肠、直肠、食道、小肠、阑尾、十二指肠、息肉、胆囊、肛门和/或腹膜的细胞、分泌物或组织。在一些实施方案中，样品包含细胞液、腹水、尿液、粪便、胰液、在内窥镜检查期间获得的流体、血液、粘液或唾液。在一些实施方案中，样品是粪便样品。在一些实施方案中，样品是子宫内膜组织样品。

这类样品可以通过本领域已知的，例如熟练技术人员显而易见的多种方法获得。例如，尿液和粪便样品很容易获得，而血液、腹水、血清或胰液样品可以通过使用例如针头和注射器以肠胃外方式获得。可以通过使样品经受本领域技术人员已知的各种技术，包括但不限于离心和过滤来获得无细胞或基本上无细胞的样品。尽管通常优选不使用侵入性技术来获得样品，但获得样品例如组织匀浆、组织切片和活检标本仍可能是优选的。

在一些实施方案中，这项技术涉及一种治疗患者(例如，患有EC、早期EC或可能发展为EC的患者)(例如，患有透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC的患者)的方法，该方法包括确定如本文提供的一种或多种DMR的甲基化状态并基于确定甲基化状态的结果对患者进行治疗。治疗可以是施用药物化合物、疫苗、进行手术、对患者进行成像、进行另一测试。优选地，所述使用是在临床筛查方法、预后评估方法、监测疗法结果的方法、鉴定最可能对特定治疗性治疗有反应的患者的方法、对患者或受试者进行成像的方法以及药物筛查和开发的方法中。

在这项技术的一些实施方案中，提供了一种用于诊断受试者中的EC的方法。如本文所用，术语“诊断(diagnosing)”和“诊断(diagnosis)”是指熟练技术人员可以估计甚至确定受试者是否患有给定疾病或疾患或将来是否可能显现给定疾病或疾患的方法。熟练技术人员通常基于一种或多种诊断指标做出诊断，所述诊断指标例如生物标志物(例如，如本文公开的DMR)，其甲基化状态指示疾患存在、严重性或不存在。

连同诊断一起，临床癌症预后涉及确定癌症的侵袭性和肿瘤复发的可能性，以规划最有效的疗法。如果可以做出更准确的预后，或者甚至可以评估显现癌症的潜在风险，则可以为患者选择适当的疗法，在某些情况下，可以选择不太严重的疗法。癌症生物标志物的评估(例如，确定甲基化状态)可用于将不需要疗法或需要有限疗法的具有良好预后和/或显现癌症风险低的受试者与更可能显现癌症或遭受癌症复发的受益于更深入的治疗的受试者分开。

因此，如本文所用，“做出诊断”或“诊断”还包括确定显现癌症的风险或确定预后，这可以基于本文公开的诊断生物标志物(例如，DMR)的测量预测临床结果(有或没有医学治疗)、选择适当的治疗(或治疗是否有效)或监测当前治疗并可能改变治疗。此外，在本公开主题的一些实施方案中，可以随时间对生物标志物进行多次测定以促进诊断和/或预后。生物标志物的时间变化可用于预测临床结果、监测EC的进展和/或监测针对癌症的适当疗法的功效。例如，在这样的实施方案中，可能期望在有效疗法过程期间的时间内看到生物样品中的一种或多种本文公开的生物标志物(例如DMR)(以及可能的一种或多种额外生物标志物，如果被监测)的甲基化状态的变化。

在一些实施方案中，本发明公开的主题还提供了一种用于确定是否在受试者中开始或继续癌症的预防或治疗的方法。在一些实施方案中，该方法包括在一段时间内提供来自受试者的一系列生物样品；分析该系列生物样品以确定每个生物样品中至少一种本文公开的生物标志物的甲基化状态；以及比较每个生物样品中一种或多种生物标志物的甲基化状态的任何可测量变化。一段时间内生物标志物甲基化状态的任何变化都可用于预测显现癌症的风险、预测临床结果、确定是否开始或继续癌症的预防或疗法，以及当前疗法是否有效治疗癌症。例如，可以在开始治疗之前选择第一时间点并且可以在开始治疗之后的某个时间选择第二时间点。甲基化状态可以在取自不同时间点的每个样品中测量，并记录定性和/或定量差异。来自不同样品的生物标志物水平的甲基化状态的变化可与受试者中的EC风险、预后、确定治疗功效和/或癌症进展相关。

在优选的实施方案中，本发明的方法和组合物用于在早期阶段，例如在疾病症状出现之前治疗或诊断疾病。在一些实施方案中，本发明的方法和组合物用于在临床阶段治疗或诊断疾病。

如所述，在一些实施方案中，可以对一种或多种诊断或预后生物标志物进行多次测定，并且可以使用标志物的时间变化来确定诊断或预后。例如，可以在初始时间确定诊断标志物，并在第二时间再次确定。在这样的实施方案中，标志物从初始时间到第二时间的增加可以诊断癌症的特定类型或严重程度，或给定的预后。同样，标志物从初始时间到第二时间的减少可以指示癌症的特定类型或严重程度，或给定的预后。此外，一种或多种标志物的变化程度可能与癌症的严重程度和未来的不良事件有关。技术人员将理解，虽然在某些实施方案中可以在多个时间点对相同的生物标志物进行比较测量，但也可以在一个时间点测量给定的生物标志物，并在第二个时间点测量第二种生物标志物，并且比较这些标志物可以提供诊断信息。

如本文所用，短语“确定预后”是指熟练技术人员可以预测受试者的疾患的进程或结果的方法。术语“预后”并不是指能够以100％的准确度预测疾患的进程或结果，甚至不是基于生物标志物(例如DMR)的甲基化状态大概预测给定的进程或结果发生的可能性。相反，熟练技术人员会理解，术语“预后”是指某个过程或结果发生的可能性增加；也就是说，与未表现出给定疾患的那些个体相比，表现出疾患的受试者更可能发生过程或结果。例如，在未表现出疾患(例如，具有一种或多种DMR的正常甲基化状态)的个体中，给定结果(例如，患有EC)的机会可能非常低。

在一些实施方案中，统计分析将预后指标与不利结果的倾向相关联。例如，在一些实施方案中，与从未患癌症的患者获得的正常对照样品中的甲基化状态不同的甲基化状态可以表示受试者比水平更类似于对照样品中的甲基化状态的受试者更可能患上癌症，如由统计显著性水平确定。此外，甲基化状态相对于基线(例如，“正常”)水平的变化可以反映受试者的预后，并且甲基化状态的变化程度可以与不良事件的严重程度相关。通常通过比较两个或更多个群体并确定置信区间和/或p值来确定统计显著性。参见例如Dowdy和Wearden,Statistics for Research,John Wiley&Sons,New York,1983，以引用的方式整体并入本文中。本发明主题的示例性置信区间为90％、95％、97.5％、98％、99％、99.5％、99.9％和99.99％，而示例性p值为0.1、0.05、0.025、0.02、0.01、0.005、0.001和0.0001。

在其它实施方案中，可以建立本文公开的预后或诊断生物标志物(例如，DMR)的甲基化状态变化的阈值程度，并且简单地比较生物样品中生物标志物的甲基化状态变化程度与甲基化状态变化的阈值程度。本文提供的生物标志物的甲基化状态的优选阈值变化为约5％、约10％、约15％、约20％、约25％、约30％、约50％、约75％、约100％和约150％。在其它实施方案中，可以建立“列线图”，通过该“列线图”，预后或诊断指标(生物标志物或生物标志物的组合)的甲基化状态与给定结果的相关倾向直接相关。熟练技术人员熟悉使用这类列线图来关联两个数值，并理解该测量中的不确定度与标志物浓度中的不确定度相同，因为参考的是单个样品测量值，而不是总体平均值。

在一些实施方案中，对照样品与生物样品同时分析，使得从生物样品获得的结果可以与从对照样品获得的结果进行比较。此外，预期可提供标准曲线，生物样品的测定结果可与之进行比较。如果使用荧光标记，则这类标准曲线将生物标志物的甲基化状态呈现为测定单位的函数，例如荧光信号强度。使用取自多个供体的样品，可以提供正常组织中一种或多种生物标志物的对照甲基化状态，以及取自具有化生的供体或具有EC的供体的组织中一种或多种生物标志物的“风险”水平的标准曲线。在该方法的某些实施方案中，在从受试者获得的生物样品中鉴定本文提供的一种或多种DMR的异常甲基化状态后，受试者被鉴定为具有化生。在该方法的其它实施方案中，在从受试者获得的生物样品中检测到一种或多种这类生物标志物的异常甲基化状态引起该受试者被鉴定为具有癌症。

在一些实施方案中，如果与对照甲基化状态相比，样品中至少一种生物标志物的甲基化状态存在可测量的差异，则受试者被诊断为具有EC。相反，当在生物样品中未鉴定出甲基化状态的变化时，可以鉴定受试者为未患EC、没有患癌症的风险或具有低的患癌症的风险。在这点上，患有癌症或其风险的受试者可以与患有低至基本上没有癌症或其风险的受试者相区分。那些有显现EC风险的受试者可以进行更密集和/或定期的筛查计划，包括内窥镜监测。另一方面，那些具有低至基本上没有风险的受试者可以避免接受额外的EC测试(例如，侵入性程序)，直到例如未来的筛查，例如根据本发明的技术进行的筛查表明在那些受试者中出现了EC风险的时间。

如上所述，根据本发明的技术方法的实施方案，检测一种或多种生物标志物的甲基化状态的变化可以是定性测定，也可以是定量测定。因此，将受试者诊断为患有EC或有显现EC风险的步骤表明进行了某些阈值测量，例如，生物样品中一种或多种生物标志物的甲基化状态不同于预定的对照甲基化状态。在该方法的一些实施方案中，对照甲基化状态是生物标志物的任何可检测的甲基化状态。在对照样品与生物样品同时测试的方法的其它实施方案中，预定甲基化状态是对照样品中的甲基化状态。在该方法的其它实施方案中，预定甲基化状态基于标准曲线和/或由标准曲线鉴定。在该方法的其它实施方案中，预定甲基化状态是特定状态或状态范围。因此，可以在本领域技术人员显而易见的可接受限度内，部分地基于所实践的方法的实施方案和期望的特异性等来选择预定甲基化状态。

进一步关于诊断方法，优选的受试者是脊椎动物受试者。优选的脊椎动物是温血动物；优选的温血脊椎动物是哺乳动物。优选的哺乳动物最优选是人。如本文所用，术语“受试者”包括人和动物受试者。因此，本文提供了兽医治疗用途。因此，本发明的技术提供了对哺乳动物(例如人类)以及以下动物的诊断：那些因濒危而重要的哺乳动物(例如东北虎)；具有经济重要性的动物，例如在农场饲养供人类食用的动物；和/或对人类具有社会重要性的动物，例如作为宠物或在动物园饲养的动物。这种动物的实例包括但不限于：食肉动物，例如猫和狗；猪科动物，包括猪、肉猪和野猪；反刍动物和/或有蹄类动物，如牛、公牛、绵羊、长颈鹿、鹿、山羊、野牛和骆驼；和马。因此，还提供了家畜的诊断和治疗，包括但不限于家养猪、反刍动物、有蹄类动物、马(包括赛马)等。

本发明公开的主题还包括用于诊断受试者中的EC和/或特定EC形式(例如，透明细胞EC、癌肉瘤EC、子宫内膜样EC、浆液性EC)的系统。例如，该系统可作为市售试剂盒提供，该试剂盒可用于筛查已收集生物样品的受试者患EC的风险或诊断其患EC。根据本发明的技术提供的示例性系统包括评估如表1、8和21中提供的DMR的甲基化状态。

实施例

实施例I.

本实施例描述了通过全甲基化分析选择发现和验证用于检测子宫内膜癌(EC)和EC组织学亚型(例如，浆液性EC、透明细胞EC、癌肉瘤EC和子宫内膜样EC)的新颖DNA甲基化标志物。

使用样品制备、测序、分析管道和过滤器的专有方法来鉴定差异甲基化区域(DMR)并将其缩小到那些可以精确定位EC和各种EC组织学亚型(例如，浆液性EC、透明细胞EC、癌肉瘤EC和子宫内膜样EC)并在临床测试环境中表现出色的DMR。

从组织到组织分析，鉴定了318个高甲基化EC DMR(表1)。表2展示了与表1中列举的标志物的EC对照相比较的曲线下面积和倍数变化。

表1.已鉴定的将子宫内膜癌组织与正常子宫内膜组织区分开来的甲基化区域。

表2.与表1中列举的标志物的EC对照相比较的EC组织的曲线下面积、倍数变化和p值。

这类EC DMR包括EC特定区域、EC亚型特定区域以及针对更通用癌症谱的那些区域。

表3中示出了区分EC与正常子宫内膜组织的最高总DMR。表4中示出了区分透明细胞EC与正常子宫内膜组织的最高总DMR。表5中示出了区分癌肉瘤EC与正常子宫内膜组织的最高总DMR。表6中示出了区分子宫内膜样EC与正常子宫内膜组织的最高总DMR。表7中示出了区分浆液性EC与正常子宫内膜组织的最高总DMR。表4、5、6和7中某些基因上的灰度红色阴影指示与多个亚型重叠的DMR。

表3.区分子宫内膜癌组织与正常子宫内膜组织的最高甲基化区域。

基因名称	DMR编号	AUC	FC
				EMX2OS	81	0.9309	264
CYTH2	59	0.8856	20.37
				C17orf107_A	28	0.8328	64.08
DIDO1_A	63	0.8777	126.3
				GDF6	102	0.8772	22.97
NBPF8	162	0.8718	42.83
				MAX.chr14.103021656-103021718	174	0.8679	100.9
JSRP1_A	124	0.8642	38.78
				GATA2_B	100	0.8639	19.23
SFMBT2_B	262	0.8431	18.31

表4.区分透明细胞EC与正常子宫内膜组织的最高总DMR。

基因名称	DMR编号	AUC	FC	p值
					DIDO1_A	63	0.98	238	5.6E-12
NDRG2	226	0.98	84	1.08E-07
					MAX.chr14.103021656-103021718	174	0.98	127	5.89E-07
MMP23B	218	0.97	88	4.16E-10
					EMX2OS	81	0.97	235	1.49E-07
SEPT9_B	259	0.97	101	1.34E-06
					NBPF8	162	0.97	53	1.61E-08
EEF1A2	75	0.95	68	3.22E-06
					AIM1_A	11	0.94	369	5.34E-06
BMP4_B	26	0.94	33	1.18E-08
					MAX.chr8.145103829-145103992	207	0.94	26	6.52E-08
OBSCN_A	234	0.93	436	5.79E-08
					PYCARD	248	0.93	336	0.000463
GDF6	102	0.93	38	7.98E-07
					MDFI_B	212	0.93	80	3.45E-07
MIAT_A	214	0.93	68	4.28E-07
					SLC8A3	271	0.92	55	1.94E-09
ZNF323_A	312	0.92	364	5.47E-05
					SQSTM1	278	0.92	146	4.73E-10
AFF3	7	0.92	32	2.95E-09
					C1orf70	34	0.91	252	1.56E-07
GDF7_A	103	0.91	54	2.74E-08
					JSRP1_A	124	0.91	72	5.16E-10
LRRC8D_A	152	0.90	27	9.12E-05
					FEV	87	0.90	14	1.08E-09
MAX.chr8.145104263-145104422	208	0.90	52	0.000146

表5.区分癌肉瘤EC与正常子宫内膜组织的最高总DMR。

基因名称	DMR编号	AUC	FC	p值
					EMX2OS	81	0.94	323	4.11E-05
DIDO1_A	63	0.94	143	1.84E-06
					SBNO2	256	0.94	129	0.003217
AMIGO3_A	13	0.93	40	8.39E-05
					PCOLCE	238	0.91	41	0.000952
CLDN7	55	0.91	62	0.005037
					CYTH2	59	0.91	19	4.92E-06
OBSCN_A	234	0.90	159	0.007225
					AHSA2	10	0.90	59	0.001032
DLL4	67	0.90	17	0.000177
					EMX2	80	0.89	308	0.007177
MAX.chr14.74100620-74100870	177	0.88	49	0.000555
					LRRC34	146	0.88	150	0.002837
PPP2R5C_A	243	0.88	169	6.79E-05
					SQSTM1	278	0.88	102	0.005911
MAX.chr17.73073716-73073814	180	0.87	586	0.008309
					CYP11A1	57	0.86	61	0.001696
ACOXL_A	2	0.86	51	0.007356
					AIM1_B	12	0.86	95	0.001099

表6.区分子宫内膜样EC与正常子宫内膜组织的最高总DMR。

基因名称	DMR编号	AUC	FC	p值
					MAX.chr10.130339363-130339534	165	0.97	29	1.53E-06
SFMBT2_C	263	0.95	33	6.01E-08
					CYTH2	59	0.94	25	2.18E-08
SLC6A3	270	0.93	24	1.07E-07
					VILL	302	0.93	67	5.35E-11
EMX2OS	81	0.92	299	9.02E-06
					MAX.chr10.22624479-22624553	167	0.92	63	1.42E-10
GDF6	102	0.92	28	7.96E-07
					ZNF90	318	0.91	104	3.79E-05
ZNF506	314	0.91	71	9.38E-10
					JSRP1_A	124	0.91	70	1.24E-10
C5orf52	40	0.90	166	1.66E-07
					SFMBT2_B	262	0.90	36	2.01E-09
NBPF8	162	0.90	66	2.95E-07
					RHBDL1_A	252	0.90	51	1.34E-05
DIDO1_A	63	0.90	90	1.81E-08
					KANK1	126	0.89	135	1.05E-06
GATA2_B	100	0.89	24	9.71E-09

表7.区分浆液性EC与正常子宫内膜组织的最高总DMR。

基因名称	DMR编号	AUC	FC	p值
					EMX2OS	81	1.00	277	3.71E-10
KANK1	126	0.94	65	3.2E-07
					C1orf70_B	35	0.94	49	5.25E-06
AMIGO3_A	13	0.92	23	2.81E-05
					DIDO1_A	63	0.92	127	3.83E-07
LRRC41_C	149	0.91	50	7.06E-08
					NFIC	230	0.91	46	7.52E-05
FKBP11_A	88	0.91	722	0.001236
					C17orf107_A	28	0.91	93	6.96E-12
SMTN	273	0.90	87	2.18E-06
					LRRC41_B	148	0.90	93	9.19E-06
LRRC8D_A	152	0.89	59	3.13E-06
					OBSCN_A	234	0.87	128	2.48E-05
MAX.chr7.104624356-104624730	204	0.86	403	0.000153
					MIAT_B	215	0.86	47	3.77E-05

组织对白细胞(血沉棕黄层)分析产生了129个高甲基化子宫内膜组织DMR，其中WBC中的噪音小于1％(表8)。表9示出了与EC血沉棕黄层对照相比较的表8中列举的标志物的曲线下面积、倍数变化和p值。

表8.WBC中噪声小于1％的高甲基化子宫内膜组织DMR

表9.EC与EC血沉棕黄层对照相比较的表8中列举的标志物的曲线下面积、倍数变化和p值。

从这些标志物组中选择了56个候选标志物作为初始试点。开发了甲基化特异性PCR测定并在两轮样品上进行了测试；那些被测序的样品和更大的独立队列。短扩增子引物(<150bp)被设计成靶向DMR中最具辨别力的CpG，并在对照上进行测试以确保完全甲基化的片段以线性方式稳健地扩增，而未甲基化和/或未转化的片段不会扩增。表10列出了56个候选标志物的112个引物序列和退火温度。

表10.

对第一轮验证的结果进行逻辑分析以确定AUC和倍数变化。从以前的工作中认识到，器官内癌症亚型的表观遗传学不同，并且最好的组来自亚型标志物的组合。组织和血沉棕黄层对照的分析是分开进行的。在表11(透明细胞EC与血沉棕黄层)、12(浆液性EC与血沉棕黄层)、13(癌肉瘤EC与血沉棕黄层)和14(子宫内膜样EC与血沉棕黄层)中突出显示结果。某些基因上的灰度红色阴影指示与多个亚型重叠的DMR。灰度红色阴影的程度指示标志物测定的辨别强度。许多测定在EC与血沉棕黄层样品具有100％的辨别率，并且在EC与良性子宫内膜比较中接近100％。

表11.区分1)透明细胞EC与血沉棕黄层和2)透明细胞EC与正常子宫内膜和正常宫颈阴道组织的DMR

表12.区分1)浆液性EC与血沉棕黄层和2)浆液性EC与正常子宫内膜和正常宫颈阴道组织的DMR

表13.区分1)癌肉瘤EC与血沉棕黄层和2)癌肉瘤EC与正常子宫内膜和正常宫颈阴道组织的DMR

表14.区分1)子宫内膜样EC与血沉棕黄层和2)子宫内膜样EC与正常子宫内膜和正常宫颈阴道组织的DMR

这些结果为用于独立样品测试的高性能候选者提供了丰富的来源。在最初的56个MDM中，选择33个。大多数都在0.90-1.00的AUC范围内，但包括具有极高FC数(非常少的背景)的MDM和/或表现出与其它MDM的互补性的那些MDM。所有MDM测定都展示了高分析性能-线性、效率、序列特异性(使用熔化曲线分析评估)和强扩增。

在第2轮验证中，与上一步一样，进行的实验是在一个批次中的整个样品和标志物组上运行。每个标志物运行约10ng FFPE来源的样品DNA-总共350个。表15、16、17、18和19中列出EC总体和亚型对比正常组织(组合)的结果。与BE(良性子宫内膜)相比，多个MDM在所有EC组织学中都显示出显著的甲基化倍数变化(10至>1000)。表20中列出了交叉验证的AUC。

表15.区分EC与正常子宫内膜组织的DMR。

表16.区分透明细胞EC与正常子宫内膜组织的DMR。

表17.区分浆液性EC与正常子宫内膜组织的DMR。

表18.区分癌肉瘤EC与正常子宫内膜组织的DMR。

表19.区分子宫内膜样EC与正常子宫内膜组织的DMR。

表20.

接着，数据以热矩阵格式绘制，允许互补性可视化。交叉验证的3-MDM图源自于rPART模拟(EMX2OS、NBPF8、SFMBT2)，其以97％特异性和97％灵敏度以及0.98的AUC区分总体EC与BE(参见图1)。

一些MDM区分透明细胞组织学与BE和所有其它EC组织学(MDFI、GDF7_A、SEPTIN9、EEF1A2)并且C5orf52区分子宫内膜样组织学(G1/2E、G3E)与BE和所有其它EC组织学。

总之，全甲基化组测序、严格的过滤标准和生物学验证得出针对EC的出色候选MDM。一些MDM以相对较高的灵敏度区分所有EC组织学与BE，而另一些则准确地区分组织学。

实施例II.

本实施例描述了实施例I的材料和方法。

样品：

组织和血液从Mayo Clinic生物样本库获得，并接受机构IRB监督。样本的选择严格遵守主题研究授权和纳入/排除标准。癌症亚型包括1)浆液性EC，2)透明细胞EC，3)癌肉瘤EC，和4)子宫内膜样EC。对照包括非赘生物组织和全血来源的白细胞。对组织进行宏观解剖并由专门的GI病理学家审查组织学。样品经过年龄性别匹配，随机化并且是盲样。使用QIAamp DNA Tissue Mini试剂盒(冷冻组织)、QIAamp DNA FFPE Tissue试剂盒(FFPE组织)和QIAamp DNA Blood Mini试剂盒(血沉棕黄层样品)(Qiagen,Valencia CA)纯化来自113个冷冻组织(16个1/2级子宫内膜样(G1/2E)、16个3级子宫内膜样(G3E)、11个浆液性、11个透明细胞EC、15个子宫癌肉瘤、44个良性子宫内膜(BE)组织(14个增生、12个萎缩、18个增生紊乱)、70个福尔马林固定石蜡包埋(FFPE)宫颈癌(CC)(36个鳞状细胞癌、34个腺癌)和18个无癌女性的血沉棕黄层)的DNA。DNA用AMPure XP珠(Beckman-Coulter,Brea CA)重新纯化，并通过PicoGreen(Thermo-Fisher,Waltham MA)定量。使用qPCR评估DNA完整性。

测序：

RRBS测序文库是按照Meissner协议(参见Gu等人Nature Protocols 2011)并经过修改制备的。样品以4重形式合并，并通过Mayo Genomics Facility在Illumina HiSeq2500仪器(Illumina,San Diego CA)上进行测序。读数由Illumina管道模块处理，用于图像分析和碱基判读。使用Mayo开发的生物信息学套件SAAP-RRBS进行二次分析。简单地说，使用Trim-Galore清理读数，并与使用BSMAP构建的GRCh37/hg19参考基因组比对。对于覆盖率≥10X并且碱基质量得分≥20的CpG，甲基化比率通过计算C/(C+T)或对于映射到反向链的读数，相反地，计算G/(G+A)来确定。

生物标志物选择：

单个CpG按高甲基化比率排序，即给定基因座的甲基化胞嘧啶数量占该基因座总胞嘧啶计数的比率。对于病例，要求比率≥0.20(20％)；对于组织对照，≤0.05(5％)；对于血沉棕黄层对照，≤0.01(1％)。不符合这些标准的CpG被丢弃。随后，候选CpG通过基因组定位被分入DMR(差异甲基化区域)，范围在大约60-200bp，每个区域的最小截止值为5个CpG。CpG密度过高(>30％)的DMR被排除在外，以避免在验证阶段出现GC相关的扩增问题。对于每个候选区域，创建了一个2D矩阵，将样品中的单个CpG与病例和对照的样品方式进行比较。分析总体EC与所有良性子宫内膜和/或无癌血沉棕黄层，以及亚型比较。然后将这些CpG矩阵与参考序列进行比较，以评估在初始过滤过程中是否丢弃了基因组连续的甲基化位点。从这个区域子集中，最终选择要求在每个样品水平上跨DMR序列的单个CpG协调和连续的高甲基化(在病例下)。相反，对照样品的甲基化程度必须至少比病例低10倍，并且CpG模式必须更加随机且不那么协调。要求亚型队列中至少10％的癌症样品对DMR内的每个CpG位点具有至少50％的高甲基化比率。

在单独的分析中，利用专有的DMR鉴定管道和回归包，根据CpG的平均甲基化值推导出DMR。比较EC病例、组织对照和血沉棕黄层对照之间平均甲基化百分比的差异；每个映射的CpG的100个碱基对内的平铺阅读框用于鉴定对照甲基化<5％的DMR；仅当覆盖的总深度为每个受试者平均10个读数并且亚组间的差异>0时才分析DMR。假设比值比的生物学相关增加>3x并且覆盖深度为10个读数，在双侧检验中，在5％的显著性水平和假设二项式方差膨胀因子为1下，每组需要≥18个样品才能达到80％的功效。

回归后，DMR按p值、接受者操作特征曲线下面积(AUC)和病例与所有对照之间的倍数变化差异排序。由于事先计划了独立验证，因此在此阶段没有对错误发现进行调整。

生物标志物验证：

选择DMR的一个子集进行进一步开发。标准主要是逻辑推导的ROC曲线下面积度量，它提供了对该区域辨别潜力的性能评估。选择0.85的AUC作为截止值。此外，计算甲基化倍数变化比(平均癌症高甲基化比率/平均对照高甲基化比率)，组织与组织比较采用下限10，并且组织与血沉棕黄层比较采用下限20。要求p值小于0.01。DMR必须在平均和单个CpG选择过程中列出。使用MethPrimer(Li LC和Dahiya R.MethPrimer:designing primersfor methylation PCRs.Bioinformatics 2002年11月；18(11):1427-31PMID:12424112)为候选区域设计定量甲基化特异性PCR(qMSP)引物，并且对20ng(6250当量)的阳性和阴性基因组甲基化对照进行QC检查。测试多个退火温度以获得最佳辨别。在qMSP的两个阶段中进行验证。第一个阶段由重新测试已测序的DNA样品组成。这样做是为了验证DMR是真正具有辨别力的，而不是过度拟合极大的下一代数据集的结果。第二个阶段使用了更大的独立样品集：

组	N
		子宫内膜癌-癌肉瘤	36
子宫内膜癌-透明细胞	22
		子宫内膜癌-子宫内膜样1/2级	36
子宫内膜癌-子宫内膜样3级	36
		子宫内膜癌-浆液性	32
良性子宫内膜-分泌	5
		良性子宫内膜-增生	32
良性子宫内膜-萎缩	28
		良性子宫内膜-增生紊乱	19
宫颈癌-鳞癌	36
		宫颈癌-腺癌	36

这些组织像以前一样通过专家临床和病理审查进行鉴定。如前所述进行DNA纯化。EZ-96DNA甲基化试剂盒(Zymo Research,Irvine CA)用于亚硫酸氢盐转化步骤。在Roche480LightCyclers(Roche,Basel Switzerland)上使用SYBR Green检测扩增10ng转化的DNA(每个标志物)。连续稀释的通用甲基化基因组DNA(Zymo Research)用作定量标准。CpG不可知的ACTB(β-肌动蛋白)测定用作输入参考和标准化对照。结果表示为甲基化拷贝(特定标志物)/ACTB拷贝。

统计学：

对单个MDM(甲基化DNA标志物)性能的结果进行逻辑分析。对于标志物的组合，使用两种技术。首先，将rPart技术应用于整个MDM集并仅限于3个MDM的组合，在此基础上计算出rPart预测的癌症概率。第二种方法使用随机森林回归(rForest)，它生成500个单独的rPart模型，这些模型与原始数据的boot strap样品拟合(大约2/3数据用于训练)并用于估计整个MDM组的交叉验证误差(1/3数据用于测试)，并重复500次，以避免低估或高估真实交叉验证度量的虚假分开。然后将结果在500次迭代中取平均值。

实施例III.

本实施例描述了用于检测乳腺癌的子宫内膜癌组织标志物和血浆标志物的鉴定。

通过EC组织样品与正常子宫内膜组织样品的RRBS鉴定用于检测EC、透明细胞EC、浆液性EC、癌肉瘤EC和子宫内膜样EC的候选甲基化标志物。为了鉴定甲基化DNA标志物，每个患者组165个样品(即，19个良性、34个腺癌、36个鳞状细胞癌、15个癌瘤子宫内膜癌、11个透明细胞子宫内膜癌、5个子宫内膜样子宫内膜癌1级、11个子宫内膜样子宫内膜癌2级、16个子宫内膜样子宫内膜癌3级和18个正常血沉棕黄层)进行RRBS过程，然后与经过亚硫酸氢盐转化的人类基因组进行比对。选择子宫内膜癌中相对于正常子宫内膜和血沉棕黄层的甲基化比率高的CpG区域并映射到它们的基因名称。

通过RRBS选择标志物后，共鉴定出61个甲基化标志物，并设计和订购了富集靶标的长探针定量放大信号测定(通用技术参见例如WO2017/075061和美国专利申请序列号15,841,006)。表21示出了用于61个甲基化标志物的标志物染色体区域。表22和23示出了标志物的引物信息和探针信息。图2还提供了用于61个甲基化标志物的标志物染色体区域以及相关的引物和探针信息。

表21.所鉴定的区分EC组织与正常子宫内膜组织的甲基化区域。

表22.表21中所示的标志物的引物信息。

表23.表21中所示的标志物的探针信息。

所有开发的测定都与向Quasar670报告的参考测定B3GALT6三联(参见表26)。对156个具有以下分布和亚型的良性和癌症样品进行测定：21个宫颈癌腺癌、20个宫颈癌鳞癌、13个癌肉瘤子宫内膜癌、11个透明细胞子宫内膜癌、10个浆液性子宫内膜癌、4个子宫内膜样子宫内膜癌1级、9个子宫内膜样子宫内膜癌2级，16个子宫内膜样子宫内膜癌3级、16个良性宫颈阴道、6个子宫内膜良性萎缩、3个子宫内膜良性增生紊乱、6个子宫内膜良性增生、子宫内膜良性分泌、4个无异型性的复杂子宫内膜增生、10个有异型性的复杂子宫内膜增生综合征以及2个无异型性的单纯子宫内膜增生。

每个甲基化标志物的灵敏度以每个亚型的95％截止值计算并列于表24和25中。表24示出了表21中所示标志物对于癌肉瘤EC、透明细胞EC和浆液性EC的95％的子宫内膜组织灵敏度。表25示出了表21中所示标志物对于子宫内膜样EC 1级、子宫内膜样EC 2级和子宫内膜样EC 3级的95％的子宫内膜组织灵敏度。

表24.表21中所示标志物对于癌肉瘤EC、透明细胞EC和浆液性EC的95％的子宫内膜组织灵敏度。

表25.表21中所示标志物对于子宫内膜样EC 1级、子宫内膜样EC 2级和子宫内膜样EC 3级的95％的子宫内膜组织灵敏度。

对于这类测试，设置并完成了多重PCR反应。每个多重PCR反应都使用中间引物混合物设置，所述中间引物混合物含有每个标志物2μM正向引物和2μM反向引物。多重PCR反应1由以下每个标志物组成：AIM1_C、AGRN_B、C17orf107_B、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B、GDF7_B、FKBP11_B、LHFPL2_B、AKR7A3、LRRC41_D、LOC100129726_B和B3GALT6。多重PCR反应2由以下每个标志物组成：MAX.chr10:22624470-22624553、LRRC8D_B、MAX.chr7:104624356-104624513、MAX.chr14:103021654-103021725、MDFI_B、SPDYA_B、RHBDL1_B、OBSCN_B、SFMBT2_E、SEPT9_D、ST3GAL2_B、JSRP1_B、ITPKA和B3GALT6。多重PCR反应3由以下每个标志物组成：ZNF323_B、VILL、ZMIZ1_D、SLC13A5_B、C8orf73_B、MAX.chr8:145103900-145103993、KBTBD11_B、ARL5C、TRIM71_B、LOC100192379_C、STX16_B、LOC440925_B和B3GALT6。多重PCR反应4由以下每个标志物组成：TSPYL5、MPZ_B、TRH、CXCL12、IRF4、CNTN4、GRIN2A、NOTCH3、PAX1、ZNF521、VSX1、JAM3和B3GALT6。多重PCR反应5由以下每个标志物组成：CRHR2、FAM19A5、ASCL1、GLT1D1、T、CAPN2、RYR2_F、PTGDR、BARX1、ZNF671_B、SIM2和B3GALT6。

每个多重PCR反应的最终浓度为0.2μM反应缓冲液、0.075μM引物混合物、0.025μMHotstart Go Taq(5U/μL)，产生25μL预混液，其与50μL DNA模板组合，最终反应体积为75μL。多重PCR的热分布需要12个循环，即95°5分钟的预孵育阶段，95°30秒、64°60秒的两步扩增阶段，以及4°冷却阶段，无限进行。多重PCR完成后，使用Te将PCR产物按1:10稀释，随后每个LQAS反应使用10μL。每个LQAS测定都以三重形式开发，由2个甲基化标志物和B3GALT6作为参考基因组成。每个LQAS测定都是使用每个甲基化标志物和B3GALT6的每个引物2μM、5μM每个甲基化标志物探针、每个带有2500μM dNTP的FRET盒5μM构建的。

从多重PCR产物1开始，运行以下6个LQAS测定(参见表26)：(1.)AIM1_C、AGRN_B、B3GALT6；(2.)C17orf107_B、MAX.chr7:104624386-104624529、B3GALT6；(3.)EMX2OS、DIDO1_B、B3GALT6；(4.)GDF7_B、FKBP11_B、B3GALT6；(5.)LHFPL2_B、AKR7A3、B3GALT6；(6.)LRRC41_D、LOC100129726_B、B3GALT6。从多重PCR产物2中，运行以下7个LQAS测定(参见表26)：(1.)MAX.chr10:22624470-22624553、LRRC8D_B、B3GALT6；(2.)MAX.chr7:104624356-104624513、MAX.chr14:103021654-103021725、B3GALT6；(3.)MDFI、SPDYA_B、B3GALT6；(4.)RHBDL1_B、OBSCN_B、B3GALT6；(5.)SFMBT2_E、SEPT9_D、B3GALT6；(6.)ST3GAL2_B、JSRP1_B、B3GALT6；(7.)ITPKA、B3GALT6。从多重PCR产物3，运行以下6个LQAS测定(参见表26)：(1.)ZNF323_B、VILL、B3GALT6；(2.)ZMIZ1_D、SLC13A5_B、B3GALT6；(3.)C8orf73_B、MAX.chr8:145103900-145103993、B3GALT6；(4.)KBTBD11_B、ARL5C、B3GALT6；(5.)TRIM71_B、LOC100192379_C、B3GALT6；(6.)STX16_B、LOC440925_B和B3GALT6。从多重PCR产物4，运行以下6个LQAS测定(参见表26)：(1.)TSPYL5、MPZ_B、B3GALT6；(2.)TRH、CXCL12、B3GALT6；(3.)IRF4、CNTN4、B3GALT6；(4.)GRIN2A、NOTCH3、B3GALT6；(5.)PAX1、ZNF521、B3GALT6；(6.)VSX1、JAM3和B3GALT6。从多重PCR产物5，运行以下5个LQAS测定(参见表26)：(1.)EMX1、ARHGEF4、BTACT；(2.)OPLAH、CYP26C1、BTACT；(3.)ZNF781、DLX4、BTACT；(4.)PTGDR、KLHDC7B、BTACT；(5.)GRIN2D、chr17_737和BTACT。从多重PCR产物6，运行以下6个LQAS测定(参见表27)：(1.)CRHR2、FAM19A5、B3GALT6；(2.)ASCL1、GLT1D1、B3GALT6；(3.)T、CAPN2、B3GALT6；(4.)RYR2_F、PTGDR、B3GALT6；(5.)BARX1、ZNF671_B、B3GALT6；(6.)SIM2和B3GALT6。

表26.LQAS三重测定

所有LQAS测定均采用先前公布的标准条件进行设置和运行。

现在已经充分描述了本发明，本领域技术人员应理解，本发明可以在不影响本发明或其任何实施方案的范围下在广泛并等同范围的条件、制剂和其它参数内进行。本文中引用的所有专利、专利申请和公布都完全以引用的方式整体并入本文。

以引用的方式并入

本文中所提及的每一个专利文献和科技文章的全部公开内容都出于全部目的以引用的方式并入。

等效方案

在不脱离本发明的精神或基本特征的情况下，本发明能以其它具体形式来实施。因此，前述实施方案在所有方面都应被视为说明性的，而非是对本文中描述的本发明的限制。因此，本发明的范围是由随附权利要求书而非由上述描述所指示，并且属于权利要求书的等效含义和范围内的所有变化都意图包括在其中。

序列表

<110> 梅约医学教育与研究基金会(MAYO FOUNDATION FOR MEDICAL EDUCATION ANDRESEARCH)

精密科学发展有限责任公司(EXACT SCIENCES DEVELOPMENT COMPANY, LLC)

<120> 检测子宫内膜癌

<130> EXCTM-37456.601

<140> PCT/US2020/015059

<141> 2020-01-24

<150> US 62/796,384

<151> 2019-01-24

<160> 589

<170> PatentIn version 3.5

<210> 1

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 1

gcgcgcggtt ttgggagata agtac 25

<210> 2

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 2

aaaaaaaaca acccctcgcc tcgac 25

<210> 3

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 3

aggtttttag gatatttagt tgagtggcgg 30

<210> 4

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 4

acctcgatcc cgaattcgaa ttcgac 26

<210> 5

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 5

gttttcggtt attcggtgac gg 22

<210> 6

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 6

aaaaaactaa aaaacgaatc gcgct 25

<210> 7

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 7

tttaatgatc gattaatcgt aaaggtcgg 29

<210> 8

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 8

aaccaataaa ctcaaaacga ctaacgca 28

<210> 9

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 9

ttaggttttt agggggtttc ggcgt 25

<210> 10

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 10

atcgtcttca ctactctata ccgtc 25

<210> 11

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 11

aattgggtaa ggagaagtcg gtcgt 25

<210> 12

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 12

ataacgaaac ttaaacctcc ccgca 25

<210> 13

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 13

agttaagttt taacgggtgt ggcgg 25

<210> 14

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 14

aaacgtcgat aaaacgaacg tcgta 25

<210> 15

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 15

tatcgttgtt tcgagtcggg gacga 25

<210> 16

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 16

aaccgaaatt ccgacgacta cacgt 25

<210> 17

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 17

ggttcggagc ggtttaaata agcga 25

<210> 18

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 18

cttaaccctt cccgcctatc cgtc 24

<210> 19

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 19

ttgggggttg tcggtttttg gagac 25

<210> 20

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 20

ccgatctaaa taccccaaac gaaatcgaa 29

<210> 21

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 21

cgtttttaga tttagtggtg ggaatcgg 28

<210> 22

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 22

tcgaacgaaa aaaatcgaac tcgta 25

<210> 23

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 23

tttttcgcgg gtcgtttatt ttcgt 25

<210> 24

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 24

aaacgaataa actcgaacta tatcgaa 27

<210> 25

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 25

ttacgatcgg attatagggg ttacgg 26

<210> 26

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 26

taccgaatct aaaaacgaaa acgaa 25

<210> 27

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 27

ggggagttat aggggtgaag gtcgc 25

<210> 28

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 28

gcctccgcca aactcgctac gtc 23

<210> 29

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 29

tatttggcgc gtggggagag gtc 23

<210> 30

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 30

tcccttccga aaattctacg acgaa 25

<210> 31

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 31

ttttagggta aatagcgggt ttcgt 25

<210> 32

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 32

cgaccgccct acatacaatt catccg 26

<210> 33

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 33

gtgtgataga cgttagagcg gcgg 24

<210> 34

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 34

cgttttaatc aaaaaaatct cccgta 26

<210> 35

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 35

gggagaattc gagtagtagt tgtaaacgg 29

<210> 36

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 36

aataacctcg ctaccaacca cccgc 25

<210> 37

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 37

gggcgttgtt tcgttttttt tatcgt 26

<210> 38

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 38

gaaacgcgct tacccgtcga a 21

<210> 39

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 39

gttcgttatc gtttggtttt gtataacgt 29

<210> 40

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 40

tatatcttat catccgacgt ctcgca 26

<210> 41

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 41

tatttgggat ttagagaggt agcgg 25

<210> 42

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 42

ccaaaaaccg aaacctaaac gct 23

<210> 43

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 43

ttttatttcg tagacgattt ttcgt 25

<210> 44

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 44

gaaaaaaccg caactccgcg c 21

<210> 45

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 45

aataatagga attagaggtt gtcgg 25

<210> 46

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 46

aaataacaaa ctccgcgcgc gaa 23

<210> 47

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 47

tacggttcgt acgagtgagt ggacgt 26

<210> 48

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 48

acgccgaaaa cgaacaaaaa acgat 25

<210> 49

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 49

ggttttgggg gatttagggt tcgg 24

<210> 50

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 50

tccgcgaaaa cccctaccta acgtc 25

<210> 51

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 51

tttttcgtag cgatcgtagc ggcgt 25

<210> 52

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 52

acctactaaa caaaccaaaa acgaa 25

<210> 53

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 53

ttcgtttaga aggcgggtgg aaggtc 26

<210> 54

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 54

aaaaaatctc gcgcgaaaat acgct 25

<210> 55

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 55

ggaaggttag ggggaaattt gtatttcgt 29

<210> 56

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 56

cgtaacatcg tcatttctta accgcgat 28

<210> 57

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 57

tttcgtatta aaattttatg ggcgt 25

<210> 58

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 58

tctaatcccg cgaacgcaac cg 22

<210> 59

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 59

tagttttgtt taggggtagg aggaatagaa agcg 34

<210> 60

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 60

acaccaacgc ttaccccgcg aa 22

<210> 61

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 61

ttttcgatcg tggatgttcg gagtc 25

<210> 62

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 62

gaaaaccgcg cgactcttac cgaa 24

<210> 63

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 63

gggaggggtc gtaggagtgt tttcg 25

<210> 64

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 64

ataacgttct accgcctttc ccctacgc 28

<210> 65

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 65

gaaagcgaaa cggtttcggc gtc 23

<210> 66

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 66

caaacttccg aatcctaccc ccgc 24

<210> 67

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 67

tcgagagagg tcggtttttt ttatcgt 27

<210> 68

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 68

aaacttccga tcacgacccc acgtc 25

<210> 69

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 69

tcgttggtaa atggagttac gg 22

<210> 70

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 70

gaaaaaacta taaaaaaacg aacgat 26

<210> 71

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 71

gtatttatcg cgttttcgag ttcga 25

<210> 72

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 72

tataacgcga ccccaacgct 20

<210> 73

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 73

gtagtcggag ggagatttcg tcgg 24

<210> 74

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 74

ataaacttaa ccgaccacgc tcgaa 25

<210> 75

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 75

cgggttgtaa ttcgagtcgt cga 23

<210> 76

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 76

caaaacctcc gaaaaaaatc cgaa 24

<210> 77

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 77

gtatagggcg tcgtttttag ttcga 25

<210> 78

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 78

aaaaaatcta ccgaaaaatt ccgaa 25

<210> 79

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 79

ttggtttaat tcgttattcg tttcgt 26

<210> 80

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 80

aacaaacctt ttccgcttcg acgta 25

<210> 81

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 81

cgaagttcgg gtagggtaag cgttgc 26

<210> 82

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 82

cgacgtaaaa atacgaaacg cacgaa 26

<210> 83

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 83

gtgaggcggt tatacgagtt tcggc 25

<210> 84

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 84

caaaaaacct ccacaaaata aacgat 26

<210> 85

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 85

tttttcgagt cgttttattt cgcgg 25

<210> 86

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 86

gaactccgaa cgccgcttaa acgta 25

<210> 87

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 87

cgcgtaggtg tttaacgtga ttagcgc 27

<210> 88

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 88

cttacatcct caaaacccgc ccgac 25

<210> 89

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 89

ttatggtggc ggtgtcggga gttac 25

<210> 90

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 90

ccctctccta aaaaccccgc tcgat 25

<210> 91

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 91

agttcgcgtt cggttttttt gttcg 25

<210> 92

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 92

gtccgtcccg atcgcaatac ga 22

<210> 93

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 93

cgcgttgcgc ggaagttaga gtc 23

<210> 94

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 94

ccacataaaa tcgaaaaaac cgcgaa 26

<210> 95

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 95

gggtttataa gttcggaggt cga 23

<210> 96

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 96

cacccaacac ctaacgacga 20

<210> 97

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 97

agcgttttta gggagttcgg cgttc 25

<210> 98

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 98

aatcgaaaaa acgaaaaaaa tcgca 25

<210> 99

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 99

ggggcgtata tattagttat cgagcga 27

<210> 100

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 100

aaaaaaaacc ctaaaaaccg ccgaa 25

<210> 101

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 101

taggtcgttt cgtcgtgcgc 20

<210> 102

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 102

ataaccttac cgacgccgcc gct 23

<210> 103

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 103

tttttgaaga gatcgttttc gacgg 25

<210> 104

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 104

cccccttaaa ccttaacccg aa 22

<210> 105

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 105

ggcgtttcga ttttttcgtt cgg 23

<210> 106

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 106

ccgaaactcc aacatctacc taacacgcc 29

<210> 107

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 107

cgtaattttt ggcgagcgac gtttgc 26

<210> 108

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 108

caaccttcga aatcccccat ccgct 25

<210> 109

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 109

ggttgcgagt acggtaaggt tt 22

<210> 110

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 110

aaaactcaaa ataccgaaac gcc 23

<210> 111

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 111

ttgagagcgt tgttagggac gac 23

<210> 112

<400> 112

000

<210> 113

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 113

cgcgtttaac gccacctc 18

<210> 114

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 114

aacgtaaaat cgaactcgta aacgac 26

<210> 115

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 115

cgaagtttta tttcgattcg ggttgtatcg 30

<210> 116

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 116

ccacgccata tccccgc 17

<210> 117

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 117

aggttatcgg gtagcgttta gg 22

<210> 118

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 118

cgtacccctc ccccgctac 19

<210> 119

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 119

gtcgtttacg cgagcgacg 19

<210> 120

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 120

ctcgaacaaa acaaacgcta cgtaac 26

<210> 121

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 121

ggtttttatt tggagggttc ggac 24

<210> 122

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 122

actactcaat acgacgatat accgaac 27

<210> 123

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 123

tcgttcgttt tttcggtttt tggtc 25

<210> 124

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 124

ccttctaaac gaaaacaacg actaacgaaa 30

<210> 125

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 125

tagcgttttg tcgttttttt tttgcgt 27

<210> 126

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 126

cgcaaaaata cccccgaaaa ac 22

<210> 127

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 127

ggagggcggt tagtagcgt 19

<210> 128

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 128

acgatatcgc tacgcgacga aa 22

<210> 129

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 129

gttgtggtgt aatttgggtc gc 22

<210> 130

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 130

acacgcgcga tacgttacac 20

<210> 131

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 131

cgttcgtata gttcgaatag ggcg 24

<210> 132

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 132

cgacgccaac gaaaaactc 19

<210> 133

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 133

ggagaattcg agtagtagtt gtaaacgga 29

<210> 134

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 134

caaccacccg cccgcc 16

<210> 135

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 135

tgtttacgtg gtatcgttat tttttaatcg c 31

<210> 136

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 136

cgacgaccgc gaaaaaaaaa aacc 24

<210> 137

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 137

tcgtggggaa tagtaggacg gc 22

<210> 138

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 138

cctcccgaca aataaacgcg a 21

<210> 139

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 139

ggaggtaggt tcgcgcgg 18

<210> 140

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 140

ccaactcaat tcctcctccg c 21

<210> 141

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 141

gaggaggaat tgagttggcg c 21

<210> 142

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 142

caacccataa tccgatccta tcttcga 27

<210> 143

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 143

ttcgtacgag tgagtggacg 20

<210> 144

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 144

caaaaaacga ttcccccgca aa 22

<210> 145

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 145

tggagattta cgtcgagggc 20

<210> 146

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 146

ccacgatcga caaaacctac gt 22

<210> 147

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 147

gcgcgtgttt tggtcgc 17

<210> 148

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 148

tcgtccgcct acccgccc 18

<210> 149

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 149

ggagttacgt tgtttttggg tttcg 25

<210> 150

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 150

ctctcctaaa aaccccgctc 20

<210> 151

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 151

ggatcgggat cgaagtttgg agaa 24

<210> 152

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 152

cttatctccc aaaaccgcgc 20

<210> 153

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 153

ttggttgttt aatcgaaggg aagtaaac 28

<210> 154

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 154

ctacctccct taaacacgtc tcg 23

<210> 155

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 155

gggcgtagtt attttatagc gc 22

<210> 156

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 156

caccaaaaaa aaacgatcgc tacgaaa 27

<210> 157

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 157

cggggaagac ggaggtg 17

<210> 158

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 158

aaacccctac ctaacgtctc cc 22

<210> 159

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 159

cggggttgta gtattttaat gatcga 26

<210> 160

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 160

cttcaaccaa taaactcaaa acgactaacg 30

<210> 161

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 161

ggcgtttttt cgcggttttg 20

<210> 162

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 162

gcgtcccaca aaccccg 17

<210> 163

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 163

cgtagggtgg gtggttacgt tc 22

<210> 164

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 164

aacttcccac gacccg 16

<210> 165

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 165

gttacgcggt ttttattttt gtgatttttc g 31

<210> 166

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 166

ctcattaact tccaaaaaac aaactaactc gtc 33

<210> 167

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 167

gagttcgacg gtcgaggcg 19

<210> 168

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 168

actacgccct cccacgc 17

<210> 169

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 169

tcgttttagc ggcggaagg 19

<210> 170

<211> 14

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 170

ccgcgaacca ccgc 14

<210> 171

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 171

ggttgtagtt ggagggcgag 20

<210> 172

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 172

cgaaacgccc tcgcga 16

<210> 173

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 173

gttgtgtaag gagatgtgcg gttc 24

<210> 174

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 174

aaacgacgac gcgaacgaa 19

<210> 175

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 175

cgtagtgcgt tttcgcgagt c 21

<210> 176

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 176

cgccctaaaa cattaaaaat acgaaaccg 29

<210> 177

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 177

gtttcggggt ttgttaagag acg 23

<210> 178

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 178

actactacga atttcctacg attataactt cg 32

<210> 179

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 179

agtttttagt tcggttcgcg c 21

<210> 180

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 180

cccgaaaacg cttcgcaacg 20

<210> 181

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 181

gataaggtag ggaagttgtg gcg 23

<210> 182

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 182

cctctaatat cactaacaaa ccccatcg 28

<210> 183

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 183

cgcggtgagt tgcggtaac 19

<210> 184

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 184

cgaaatactt accgctatcg atctaatcga 30

<210> 185

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 185

ggtagttcga atttcggcgc 20

<210> 186

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 186

ctccctcccg acgctcg 17

<210> 187

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 187

gtagtttttc ggcggcgacg 20

<210> 188

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 188

ccttatttac cgccgtacgc t 21

<210> 189

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 189

ggtcgcgttt tgtttggcg 19

<210> 190

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 190

cgcgcgtcga aaaaaaacgc g 21

<210> 191

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 191

cgatcgtgta gaaggttgta gcg 23

<210> 192

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 192

tttcccgcaa ccaactatac gcg 23

<210> 193

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 193

cgggatttag cgggttcgg 19

<210> 194

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 194

cccgaaaacg aaaaacaaaa aacgac 26

<210> 195

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 195

tcggggtgtt ttcgtagttg ttaaatttac 30

<210> 196

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 196

cattctttta accgccaaaa cgcg 24

<210> 197

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 197

gggttttggt tttcgttagt ttagtttc 28

<210> 198

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 198

acaactctaa acgaccgaaa ataacg 26

<210> 199

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 199

gcggtcggag tttagttagc g 21

<210> 200

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 200

acctacgact acctcctaaa cgcg 24

<210> 201

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 201

gtcgtagttt tagtagtttt ttttgtcgtt cg 32

<210> 202

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 202

cgaccgccgc gactac 16

<210> 203

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 203

gacgcggggc gtttagt 17

<210> 204

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 204

cgactcgaaa cgaccccga 19

<210> 205

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 205

ggagttttag gcggcgttac g 21

<210> 206

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 206

accgcgaaaa cacccgac 18

<210> 207

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 207

gttcgcgcgg ttttacggt 19

<210> 208

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 208

cgcccttctc ctcccgc 17

<210> 209

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 209

ggaggtttcg cgtttcgatt a 21

<210> 210

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 210

cgaacgatcc ccgcctac 18

<210> 211

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 211

ggtttagcgc gggtttttcg 20

<210> 212

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 212

ccccgaactt cccgaact 18

<210> 213

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 213

ttttcgttga ttttattcga gtcgtc 26

<210> 214

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 214

gaaccctctt caaataaacc gc 22

<210> 215

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 215

tggtcgtttt agcgttatgt cg 22

<210> 216

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 216

cgaaaactac aaaccgcgc 19

<210> 217

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 217

cgttaatttg ttagatagag ggcg 24

<210> 218

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 218

tccgaacaac cgcctac 17

<210> 219

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 219

gttgtcggga gcggtagg 18

<210> 220

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 220

ccaatatccc gaaacgcgtc t 21

<210> 221

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 221

tttgtttcgg tttttggcg 19

<210> 222

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 222

cgccaccata aacgacc 17

<210> 223

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 223

ggttaggggt ggagttcgtt a 21

<210> 224

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 224

actccgaact ctactcatcc tttc 24

<210> 225

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 225

tcggcggttt ttagtaaaag cg 22

<210> 226

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 226

aaatctcccg tcccactcc 19

<210> 227

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 227

gggttcgggg atttataatt acgg 24

<210> 228

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 228

ctaaatcacc tcctactact aacgctaata ac 32

<210> 229

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 229

cgcgccgagg ccgtacccac gtcca 25

<210> 230

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 230

aggccacgga cgcgtcgtcg aacaccg 27

<210> 231

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 231

cgcgccgagg cgtcgaacac cttcgac 27

<210> 232

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 232

aggccacgga cgcgactacg ccacgtaaa 29

<210> 233

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 233

cgcgccgagg gtttcggttt ttgggagg 28

<210> 234

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 234

aggccacgga cgcgacaact aaaactccgt acg 33

<210> 235

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 235

cgcgccgagg cgggattttc ggtttcga 28

<210> 236

<211> 35

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 236

aggccacgga cgcgtttacg tatatagtcg gtagt 35

<210> 237

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 237

cgcgccgagg cgctcacgaa ctaaacgatc c 31

<210> 238

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 238

aggccacgga cgtcgttagg tttcgtttcg t 31

<210> 239

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 239

cgcgccgagg cggttttcgc ggga 24

<210> 240

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 240

aggccacgga cgcgacctcg aaccccaa 28

<210> 241

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 241

cgcgccgagg ccgctcgctc acaa 24

<210> 242

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 242

aggccacgga cgcggtttta cgaaatgtaa attt 34

<210> 243

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 243

cgcgccgagg cgtcgaggtc gtttcg 26

<210> 244

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 244

aggccacgga cggcggaagt gcgtt 25

<210> 245

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 245

cgcgccgagg cgcgggttag ttgtt 25

<210> 246

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 246

aggccacgga cgatacgcgc ctccca 26

<210> 247

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 247

cgcgccgagg cgttcgttat cgtttggttt 30

<210> 248

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 248

aggccacgga cgcctaccgc acacgc 26

<210> 249

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 249

cgcgccgagg cgatcctacc gacctcga 28

<210> 250

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 250

aggccacgga cgcgctcccg cccttct 27

<210> 251

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 251

cgcgccgagg cggttttaac gtaagtttga ttg 33

<210> 252

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 252

aggccacgga cgcggtcgag gtggga 26

<210> 253

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 253

cgcgccgagg gcgggtggag aagg 24

<210> 254

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 254

aggccacgga cggcgggtgg agaagg 26

<210> 255

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 255

aggccacgga cggcatttcc gacctttacg a 31

<210> 256

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 256

cgcgccgagg gaaaaataac cccgccc 27

<210> 257

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 257

aggccacgga cgcgtagggt tcgcgag 27

<210> 258

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 258

cgcgccgagg cgatacatcc gcgcg 25

<210> 259

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 259

aggccacgga cggcggattg agtttcgtg 29

<210> 260

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 260

aggccacgga cggcgcggtt attttttcgt 30

<210> 261

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 261

cgcgccgagg gcgcgtcgtt cgtatattt 29

<210> 262

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 262

aggccacgga cgcgtcggcg tcgtttt 27

<210> 263

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 263

cgcgccgagg gcgttaaaaa cctcgcg 27

<210> 264

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 264

cgcgccgagg gcgttatact ctttctctaa acac 34

<210> 265

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 265

aggccacgga cgcggcgatt tagttttttg tcg 33

<210> 266

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 266

cgcgccgagg gacctccgaa cttataaacc c 31

<210> 267

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 267

aggccacgga cgcgggaagt ttcgttagtg g 31

<210> 268

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 268

cgcgccgagg cgttaggttt ttttagtcgt cg 32

<210> 269

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 269

aggccacgga cgtctcgaaa cgaataaccg c 31

<210> 270

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 270

cgcgccgagg gctacgctaa acgccg 26

<210> 271

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 271

aggccacgga cggatcgaaa acacacaacc c 31

<210> 272

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 272

cgcgccgagg ggcgggcgta ttagt 25

<210> 273

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 273

aggccacgga cgcgggtcgc gtttagg 27

<210> 274

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 274

aggccacgga cgcgattttt cgggtagttt ttgg 34

<210> 275

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 275

cgcgccgagg ggtttttcgg tcgagatg 28

<210> 276

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 276

aggccacgga cgcgaccgta acaaaaaaac aaac 34

<210> 277

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 277

cgcgccgagg acgcgactaa aaaaaaccta ac 32

<210> 278

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 278

aggccacgga cgcgccgaaa caaactaatc c 31

<210> 279

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 279

cgcgccgagg cgcgaaactt caaaaatacg a 31

<210> 280

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 280

aggccacgga cgattcgcgt tcgagcg 27

<210> 281

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 281

aggccacgga cggcggtagt ggtcgtag 28

<210> 282

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 282

aggccacgga cgcgtttggc gtagatataa gc 32

<210> 283

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 283

aggccacgga cgccgcgcta ccgcta 26

<210> 284

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 284

cgcgccgagg ccgcgctacc gcta 24

<210> 285

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 285

aggccacgga cgcgaaaaat cccacgc 27

<210> 286

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 286

cgcgccgagg gcgtttcgat cgggg 25

<210> 287

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 287

aggccacgga cggcgggagg attttcgatt tc 32

<210> 288

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 288

cgcgccgagg cgtaactcca tctcgataac c 31

<210> 289

<211> 90

<212> DNA

<213> 智人(Homo sapiens)

<400> 289

gggctgcgag cacggcaagg tctctcaggc ttgtggacgt gggtacgggc gtctcggcac 60

cctgagcttt ctcccctacc cgccccagcg 90

<210> 290

<211> 90

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 290

gggttgcgag tacggtaagg ttttttaggt ttgtggacgt gggtacgggc gtttcggtat 60

tttgagtttt tttttttatt cgttttagcg 90

<210> 291

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 291

ggttgcgagt acggtaaggt tt 22

<210> 292

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 292

aaaactcaaa ataccgaaac gcc 23

<210> 293

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 293

cgcgccgagg ccgtacccac gtcca 25

<210> 294

<211> 93

<212> DNA

<213> 智人(Homo sapiens)

<400> 294

cgcggacgcc gagctccctg agagcgctgc cagggacgac gcggtgttcg acgacgaggt 60

ggcgccaaac gcggccagcg ataacgcctc ggc 93

<210> 295

<211> 93

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 295

cgcggacgtc gagttttttg agagcgttgt tagggacgac gcggtgttcg acgacgaggt 60

ggcgttaaac gcggttagcg ataacgtttc ggt 93

<210> 296

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 296

ttgagagcgt tgttagggac gac 23

<210> 297

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 297

cgcgtttaac gccacctc 18

<210> 298

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 298

aggccacgga cgcgtcgtcg aacaccg 27

<210> 299

<211> 97

<212> DNA

<213> 智人(Homo sapiens)

<400> 299

gagacgggct cgggccccgc ccaccggcgg gtgcagctga gggcgcggcc gaaggtgccc 60

gacgccgccc acgagctcga ctccacgctc ggctact 97

<210> 300

<211> 97

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 300

gagacgggtt cgggtttcgt ttatcggcgg gtgtagttga gggcgcggtc gaaggtgttc 60

gacgtcgttt acgagttcga ttttacgttc ggttatt 97

<210> 301

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 301

cgggtttcgt ttatcggcgg 20

<210> 302

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 302

aacgtaaaat cgaactcgta aacgac 26

<210> 303

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 303

cgcgccgagg cgtcgaacac cttcgac 27

<210> 304

<211> 139

<212> DNA

<213> 智人(Homo sapiens)

<400> 304

ggcggggctt aggggacgag gttagtacga agccccaccc cgacccgggc tgcaccgccc 60

cctccgcgct tacgtggcgc agccgcgggg acatggcgtg ggtggtgggc gtccgctggg 120

acacgttgag cacgatgac 139

<210> 305

<211> 139

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 305

ggcggggttt aggggacgag gttagtacga agttttattt cgattcgggt tgtatcgttt 60

ttttcgcgtt tacgtggcgt agtcgcgggg atatggcgtg ggtggtgggc gttcgttggg 120

atacgttgag tacgatgat 139

<210> 306

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 306

cgaagtttta tttcgattcg ggttgtatcg 30

<210> 307

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 307

ccacgccata tccccgc 17

<210> 308

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 308

aggccacgga cgcgactacg ccacgtaaa 29

<210> 309

<211> 101

<212> DNA

<213> 智人(Homo sapiens)

<400> 309

gccgaggcca ccgggcagcg tccaggtctc ggcctttggg aggggagcag cgggggaggg 60

gcacggggag gggcgagggc ggggcgcgcc tgggcctcgg c 101

<210> 310

<211> 101

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 310

gccgaggtta tcgggtagcg tttaggtttc ggtttttggg aggggagtag cgggggaggg 60

gtacggggag gggcgagggc ggggcgcgtt tgggtttcgg t 101

<210> 311

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 311

aggttatcgg gtagcgttta gg 22

<210> 312

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 312

cgtacccctc ccccgctac 19

<210> 313

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 313

cgcgccgagg gtttcggttt ttgggagg 28

<210> 314

<211> 90

<212> DNA

<213> 智人(Homo sapiens)

<400> 314

cgctgtgagt cgcccacgcg agcgacgtgg ggatacgggg cgcacggagt ctcagctgcc 60

gccacgcagc gcttgccctg cccgagcttc 90

<210> 315

<211> 90

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 315

cgttgtgagt cgtttacgcg agcgacgtgg ggatacgggg cgtacggagt tttagttgtc 60

gttacgtagc gtttgttttg ttcgagtttt 90

<210> 316

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 316

gtcgtttacg cgagcgacg 19

<210> 317

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 317

ctcgaacaaa acaaacgcta cgtaac 26

<210> 318

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 318

aggccacgga cgcgacaact aaaactccgt acg 33

<210> 319

<211> 110

<212> DNA

<213> 智人(Homo sapiens)

<400> 319

tgagggtcgg gactatctcc tcaccagggt ctccacttgg agggtccgga cgggactttc 60

ggtttcgagc ccagcctcag cccggcacac cgccgcactg agcagcagca 110

<210> 320

<211> 110

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 320

tgagggtcgg gattattttt ttattagggt ttttatttgg agggttcgga cgggattttc 60

ggtttcgagt ttagttttag ttcggtatat cgtcgtattg agtagtagta 110

<210> 321

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 321

ggtttttatt tggagggttc ggac 24

<210> 322

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 322

actactcaat acgacgatat accgaac 27

<210> 323

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 323

cgcgccgagg cgggattttc ggtttcga 28

<210> 324

<211> 129

<212> DNA

<213> 智人(Homo sapiens)

<400> 324

gccatcccgg ggctctgcgc cgtccgctct cccggctcct ggccgctcac gcacacagcc 60

ggtagctggt tttcgttagc cgctgccctc gcccagaagg cgggtggaag gtcgccagtt 120

ggacgcaca 129

<210> 325

<211> 129

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 325

gttatttcgg ggttttgcgt cgttcgtttt ttcggttttt ggtcgtttac gtatatagtc 60

ggtagttggt tttcgttagt cgttgttttc gtttagaagg cgggtggaag gtcgttagtt 120

ggacgtata 129

<210> 326

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 326

tcgttcgttt tttcggtttt tggtc 25

<210> 327

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 327

ccttctaaac gaaaacaacg actaacgaaa 30

<210> 328

<211> 35

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 328

aggccacgga cgcgtttacg tatatagtcg gtagt 35

<210> 329

<211> 119

<212> DNA

<213> 智人(Homo sapiens)

<400> 329

gtagcgttct gccgcctttc ccctgcgccc tctctgggga ccgctcagct cgtgagcgcc 60

ccccgggggc actcctgcga cccctccctt gctaggggcc tcctacagcc cgtggtcgg 119

<210> 330

<211> 119

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 330

gtagcgtttt gtcgtttttt ttttgcgttt tttttgggga tcgtttagtt cgtgagcgtt 60

tttcgggggt atttttgcga tttttttttt gttaggggtt ttttatagtt cgtggtcgg 119

<210> 331

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 331

tagcgttttg tcgttttttt tttgcgt 27

<210> 332

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 332

cgcaaaaata cccccgaaaa ac 22

<210> 333

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 333

cgcgccgagg cgctcacgaa ctaaacgatc c 31

<210> 334

<211> 109

<212> DNA

<213> 智人(Homo sapiens)

<400> 334

cggacccaga gcaccgcctg cggcctcacc taggggagag ggagggcggt tagcagcgcc 60

gccaggcccc gccccgcctt cccgccgcgc agcgacaccg tccaagtcc 109

<210> 335

<211> 109

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 335

cggatttaga gtatcgtttg cggttttatt taggggagag ggagggcggt tagtagcgtc 60

gttaggtttc gtttcgtttt ttcgtcgcgt agcgatatcg tttaagttt 109

<210> 336

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 336

ggagggcggt tagtagcgt 19

<210> 337

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 337

acgatatcgc tacgcgacga aa 22

<210> 338

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 338

aggccacgga cgtcgttagg tttcgtttcg t 31

<210> 339

<211> 88

<212> DNA

<213> 智人(Homo sapiens)

<400> 339

cgacgggaag cccgagaagc tgaggctgtg gtgcaacttg ggccgcggct cccgcgggaa 60

gcccaggtgc aacgcatcgc gcgtgcca 88

<210> 340

<211> 88

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 340

cgacgggaag ttcgagaagt tgaggttgtg gtgtaatttg ggtcgcggtt ttcgcgggaa 60

gtttaggtgt aacgtatcgc gcgtgtta 88

<210> 341

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 341

gttgtggtgt aatttgggtc gc 22

<210> 342

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 342

acacgcgcga tacgttacac 20

<210> 343

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 343

cgcgccgagg cggttttcgc ggga 24

<210> 344

<211> 84

<212> DNA

<213> 智人(Homo sapiens)

<400> 344

gctcaccgcc cgcccgcaca gctcgaacag ggcgggggga gcgttggggc ccgaggccga 60

gctcttcgct ggcgccgcct cccg 84

<210> 345

<211> 84

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 345

gtttatcgtt cgttcgtata gttcgaatag ggcgggggga gcgttggggt tcgaggtcga 60

gtttttcgtt ggcgtcgttt ttcg 84

<210> 346

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 346

cgttcgtata gttcgaatag ggcg 24

<210> 347

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 347

cgacgccaac gaaaaactc 19

<210> 348

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 348

aggccacgga cgcgacctcg aaccccaa 28

<210> 349

<211> 110

<212> DNA

<213> 智人(Homo sapiens)

<400> 349

cggcggagga agcgtggagt ccattgatct aggtacttgt ggggagggga gaacccgagc 60

agcagctgca aacggaaggg ctgtgagcga gcgggcgggc gggtggctgg 110

<210> 350

<211> 110

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 350

cggcggagga agcgtggagt ttattgattt aggtatttgt ggggagggga gaattcgagt 60

agtagttgta aacggaaggg ttgtgagcga gcgggcgggc gggtggttgg 110

<210> 351

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 351

ggagaattcg agtagtagtt gtaaacgga 29

<210> 352

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 352

caaccacccg cccgcc 16

<210> 353

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 353

cgcgccgagg ccgctcgctc acaa 24

<210> 354

<211> 87

<212> DNA

<213> 智人(Homo sapiens)

<400> 354

cttgtctacg tggcatcgtc atttcttaac cgcggtttta cgaaatgcaa atttccccct 60

ggccttcctc ctccgcggcc gtcgacc 87

<210> 355

<211> 87

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 355

tttgtttacg tggtatcgtt attttttaat cgcggtttta cgaaatgtaa attttttttt 60

ggtttttttt tttcgcggtc gtcgatt 87

<210> 356

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 356

tgtttacgtg gtatcgttat tttttaatcg c 31

<210> 357

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 357

cgacgaccgc gaaaaaaaaa aacc 24

<210> 358

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 358

aggccacgga cgcggtttta cgaaatgtaa attt 34

<210> 359

<211> 72

<212> DNA

<213> 智人(Homo sapiens)

<400> 359

ccgccccgtg gggaacagca ggacggcgcc gaggccgttt cgctttcctc cgcgcccatt 60

tgccgggagg gg 72

<210> 360

<211> 72

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 360

tcgtttcgtg gggaatagta ggacggcgtc gaggtcgttt cgtttttttt cgcgtttatt 60

tgtcgggagg gg 72

<210> 361

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 361

tcgtggggaa tagtaggacg gc 22

<210> 362

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 362

cctcccgaca aataaacgcg a 21

<210> 363

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 363

cgcgccgagg cgtcgaggtc gtttcg 26

<210> 364

<211> 131

<212> DNA

<213> 智人(Homo sapiens)

<400> 364

cggcctagga cgcgccctgc gtggaggcag gcccgcgcgg cggaagtgcg tttctggggc 60

tcctcctgaa gaatgcggag gaggaactga gctggcgcgc gggccagctg tcctctcttc 120

tgatcccgaa g 131

<210> 365

<211> 131

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 365

cggtttagga cgcgttttgc gtggaggtag gttcgcgcgg cggaagtgcg tttttggggt 60

tttttttgaa gaatgcggag gaggaattga gttggcgcgc gggttagttg tttttttttt 120

tgatttcgaa g 131

<210> 366

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 366

ggaggtaggt tcgcgcgg 18

<210> 367

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 367

ccaactcaat tcctcctccg c 21

<210> 368

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 368

aggccacgga cggcggaagt gcgtt 25

<210> 369

<211> 144

<212> DNA

<213> 智人(Homo sapiens)

<400> 369

gcccgcgcgg cggaagtgcg tttctggggc tcctcctgaa gaatgcggag gaggaactga 60

gctggcgcgc gggccagctg tcctctcttc tgatcccgaa gacaggatcg gattatgggt 120

tgttaccggc ttgtgcggcc ctgg 144

<210> 370

<211> 144

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 370

gttcgcgcgg cggaagtgcg tttttggggt tttttttgaa gaatgcggag gaggaattga 60

gttggcgcgc gggttagttg tttttttttt tgatttcgaa gataggatcg gattatgggt 120

tgttatcggt ttgtgcggtt ttgg 144

<210> 371

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 371

gaggaggaat tgagttggcg c 21

<210> 372

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 372

caacccataa tccgatccta tcttcga 27

<210> 373

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 373

cgcgccgagg cgcgggttag ttgtt 25

<210> 374

<211> 61

<212> DNA

<213> 智人(Homo sapiens)

<400> 374

cggctcgcac gagtgagtgg acgtgggagg cgcgcatctg cgggggaatc gccccttgcc 60

c 61

<210> 375

<211> 61

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 375

cggttcgtac gagtgagtgg acgtgggagg cgcgtatttg cgggggaatc gttttttgtt 60

t 61

<210> 376

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 376

ttcgtacgag tgagtggacg 20

<210> 377

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 377

caaaaaacga ttcccccgca aa 22

<210> 378

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 378

aggccacgga cgatacgcgc ctccca 26

<210> 379

<211> 97

<212> DNA

<213> 智人(Homo sapiens)

<400> 379

cgggaaagaa cgtggagatc cacgccgagg gcgcccgcca ccgcctggtt ctgcacaacg 60

taggttttgc cgaccgtggc ttctttggct gcgagac 97

<210> 380

<211> 97

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 380

cgggaaagaa cgtggagatt tacgtcgagg gcgttcgtta tcgtttggtt ttgtataacg 60

taggttttgt cgatcgtggt ttttttggtt gcgagat 97

<210> 381

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 381

tggagattta cgtcgagggc 20

<210> 382

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 382

ccacgatcga caaaacctac gt 22

<210> 383

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 383

cgcgccgagg cgttcgttat cgtttggttt 30

<210> 384

<211> 73

<212> DNA

<213> 智人(Homo sapiens)

<400> 384

gcgtgcaggg tgcgcgcgtg tcttggccgc gcgtggcggc gtgtgcggca ggggcgggca 60

ggcgggcgac tcg 73

<210> 385

<211> 73

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 385

gcgtgtaggg tgcgcgcgtg ttttggtcgc gcgtggcggc gtgtgcggta ggggcgggta 60

ggcgggcgat tcg 73

<210> 386

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 386

gcgcgtgttt tggtcgc 17

<210> 387

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 387

tcgtccgcct acccgccc 18

<210> 388

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 388

aggccacgga cgcctaccgc acacgc 26

<210> 389

<211> 174

<212> DNA

<213> 智人(Homo sapiens)

<400> 389

gggggctctc aggtggcgcg gccgcgaggc ggaccctgat ggccatggtg gcggtgccgg 60

gagccacgct gtccctgggc cccggcccga ggccggcagg accgagcggg gtccccagga 120

gaggggtggc ggggagctcg atctccacgc ggggaccaga ttttcggcct caaa 174

<210> 390

<211> 174

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 390

gggggttttt aggtggcgcg gtcgcgaggc ggattttgat ggttatggtg gcggtgtcgg 60

gagttacgtt gtttttgggt ttcggttcga ggtcggtagg atcgagcggg gtttttagga 120

gaggggtggc ggggagttcg atttttacgc ggggattaga ttttcggttt taaa 174

<210> 391

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 391

ggagttacgt tgtttttggg tttcg 25

<210> 392

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 392

ctctcctaaa aaccccgctc 20

<210> 393

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 393

cgcgccgagg cgatcctacc gacctcga 28

<210> 394

<211> 103

<212> DNA

<213> 智人(Homo sapiens)

<400> 394

gaggtggggg accgggaccg aagcttggag aagaccaaag tggtggtggt ggtggtgggg 60

tggggcagaa gggcgggagc gcgcggctct gggagacaag cac 103

<210> 395

<211> 103

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 395

gaggtggggg atcgggatcg aagtttggag aagattaaag tggtggtggt ggtggtgggg 60

tggggtagaa gggcgggagc gcgcggtttt gggagataag tat 103

<210> 396

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 396

ggatcgggat cgaagtttgg agaa 24

<210> 397

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 397

cttatctccc aaaaccgcgc 20

<210> 398

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 398

aggccacgga cgcgctcccg cccttct 27

<210> 399

<211> 138

<212> DNA

<213> 智人(Homo sapiens)

<400> 399

aaccacgctg tgcccgcgtg tgccgggcgg ggaggggagg ccgcagcccc agccccgggg 60

gcctggttgt ctaatcgaag ggaagtaaac ggccccaacg caagcctgac tgcgagacgt 120

gcccaaggga ggtaggtc 138

<210> 400

<211> 138

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 400

aattacgttg tgttcgcgtg tgtcgggcgg ggaggggagg tcgtagtttt agtttcgggg 60

gtttggttgt ttaatcgaag ggaagtaaac ggttttaacg taagtttgat tgcgagacgt 120

gtttaaggga ggtaggtt 138

<210> 401

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 401

ttggttgttt aatcgaaggg aagtaaac 28

<210> 402

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 402

ctacctccct taaacacgtc tcg 23

<210> 403

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 403

cgcgccgagg cggttttaac gtaagtttga ttg 33

<210> 404

<211> 104

<212> DNA

<213> 智人(Homo sapiens)

<400> 404

cgcaggaagc cctgggggcg cagccatccc acagcgcggc cgaggtggga ctgggggtcc 60

cgcagcgacc gcttttcttt ggtgggtctg cacgcaccta tccg 104

<210> 405

<211> 104

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 405

cgtaggaagt tttgggggcg tagttatttt atagcgcggt cgaggtggga ttgggggttt 60

cgtagcgatc gttttttttt ggtgggtttg tacgtattta ttcg 104

<210> 406

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 406

gggcgtagtt attttatagc gc 22

<210> 407

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 407

caccaaaaaa aaacgatcgc tacgaaa 27

<210> 408

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 408

aggccacgga cgcggtcgag gtggga 26

<210> 409

<211> 99

<212> DNA

<213> 智人(Homo sapiens)

<400> 409

cgggtgtttg tgtatatgtg ttgcggggaa gacggaggtg cgggtggaga aggggaggat 60

gtaccaaggg ccatggggag acgctaggca ggggcttcc 99

<210> 410

<211> 99

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 410

cgggtgtttg tgtatatgtg ttgcggggaa gacggaggtg cgggtggaga aggggaggat 60

gtattaaggg ttatggggag acgttaggta ggggttttt 99

<210> 411

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 411

cggggaagac ggaggtg 17

<210> 412

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 412

aaacccctac ctaacgtctc cc 22

<210> 413

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 413

cgcgccgagg gcgggtggag aagg 24

<210> 414

<211> 105

<212> DNA

<213> 智人(Homo sapiens)

<400> 414

cggcaagcta cggaacaggt ggcggggctg cagcacccca atgaccgatc aaccgcaaag 60

gccggaaatg cgtcagccgt tctgagccca ctggctgaag ccagg 105

<210> 415

<211> 105

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 415

cggtaagtta cggaataggt ggcggggttg tagtatttta atgatcgatt aatcgtaaag 60

gtcggaaatg cgttagtcgt tttgagttta ttggttgaag ttagg 105

<210> 416

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 416

cggggttgta gtattttaat gatcga 26

<210> 417

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 417

cttcaaccaa taaactcaaa acgactaacg 30

<210> 418

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 418

aggccacgga cggcatttcc gacctttacg a 31

<210> 419

<211> 88

<212> DNA

<213> 智人(Homo sapiens)

<400> 419

ccccgcacgg gggcgcctcc ccgcggccct ggggcggggc cacccctcgg ggtctgtggg 60

acgcgcctgc ccccaattct gccacccg 88

<210> 420

<211> 88

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 420

tttcgtacgg gggcgttttt tcgcggtttt ggggcggggt tatttttcgg ggtttgtggg 60

acgcgtttgt ttttaatttt gttattcg 88

<210> 421

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 421

ggcgtttttt cgcggttttg 20

<210> 422

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 422

gcgtcccaca aaccccg 17

<210> 423

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 423

cgcgccgagg gaaaaataac cccgccc 27

<210> 424

<211> 80

<212> DNA

<213> 智人(Homo sapiens)

<400> 424

gcgggcacac gcagggtggg tggtcacgcc cgcagggtcc gcgagcgcgg cgcagagcgc 60

gggccgtggg aagtttctcc 80

<210> 425

<211> 80

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 425

gcgggtatac gtagggtggg tggttacgtt cgtagggttc gcgagcgcgg cgtagagcgc 60

gggtcgtggg aagttttttt 80

<210> 426

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 426

cgtagggtgg gtggttacgt tc 22

<210> 427

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 427

aacttcccac gacccg 16

<210> 428

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 428

aggccacgga cgcgtagggt tcgcgag 27

<210> 429

<211> 94

<212> DNA

<213> 智人(Homo sapiens)

<400> 429

gtgccacgcg gccttcaccc ctgtgactcc ccgcagctcg cgcggatgca ccgacgagtc 60

agcttgtcct ctggaagcca atgagtctcc ccgg 94

<210> 430

<211> 94

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 430

gtgttacgcg gtttttattt ttgtgatttt tcgtagttcg cgcggatgta tcgacgagtt 60

agtttgtttt ttggaagtta atgagttttt tcgg 94

<210> 431

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 431

gttacgcggt ttttattttt gtgatttttc g 31

<210> 432

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 432

ctcattaact tccaaaaaac aaactaactc gtc 33

<210> 433

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 433

cgcgccgagg cgatacatcc gcgcg 25

<210> 434

<211> 86

<212> DNA

<213> 智人(Homo sapiens)

<400> 434

cggcgcacca gagtcccaag gagcccgacg gccgaggcgc ggattgagtc ccgtgtctgc 60

gtgggagggc gcagtcaggg caggcg 86

<210> 435

<211> 86

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 435

cggcgtatta gagttttaag gagttcgacg gtcgaggcgc ggattgagtt tcgtgtttgc 60

gtgggagggc gtagttaggg taggcg 86

<210> 436

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 436

gagttcgacg gtcgaggcg 19

<210> 437

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 437

actacgccct cccacgc 17

<210> 438

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 438

aggccacgga cggcggattg agtttcgtg 29

<210> 439

<211> 80

<212> DNA

<213> 智人(Homo sapiens)

<400> 439

cgccgcagtc cctcgcctca gcggcggaag gcgcggccac ctccccgccc tccagcggtg 60

gcccgcgggt ggtggagcgg 80

<210> 440

<211> 80

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 440

cgtcgtagtt tttcgtttta gcggcggaag gcgcggttat tttttcgttt tttagcggtg 60

gttcgcgggt ggtggagcgg 80

<210> 441

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 441

tcgttttagc ggcggaagg 19

<210> 442

<211> 14

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 442

ccgcgaacca ccgc 14

<210> 443

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 443

aggccacgga cggcgcggtt attttttcgt 30

<210> 444

<211> 78

<212> DNA

<213> 智人(Homo sapiens)

<400> 444

gcgggctgca gctggagggc gagcgcgccg cccgcacacc cacctcccgc actcccgccc 60

ctcgcgaggg cgtcccgc 78

<210> 445

<211> 78

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 445

gcgggttgta gttggagggc gagcgcgtcg ttcgtatatt tatttttcgt attttcgttt 60

ttcgcgaggg cgtttcgt 78

<210> 446

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 446

ggttgtagtt ggagggcgag 20

<210> 447

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 447

cgaaacgccc tcgcga 16

<210> 448

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 448

cgcgccgagg gcgcgtcgtt cgtatattt 29

<210> 449

<211> 121

<212> DNA

<213> 智人(Homo sapiens)

<400> 449

ccgatttcca gatctgcttg ctgtgcaagg agatgtgcgg ctcgccggcg ccgctctcct 60

ccaactcgtc cgcgtcgtcg tcctcctcgc agacgtccac gtcgtcgggg ggcggcggcg 120

g 121

<210> 450

<211> 121

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 450

tcgattttta gatttgtttg ttgtgtaagg agatgtgcgg ttcgtcggcg tcgttttttt 60

ttaattcgtt cgcgtcgtcg tttttttcgt agacgtttac gtcgtcgggg ggcggcggcg 120

g 121

<210> 451

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 451

gttgtgtaag gagatgtgcg gttc 24

<210> 452

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 452

aaacgacgac gcgaacgaa 19

<210> 453

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 453

aggccacgga cgcgtcggcg tcgtttt 27

<210> 454

<211> 122

<212> DNA

<213> 智人(Homo sapiens)

<400> 454

ggccgagctc cggcggccac tccgcagtgc gctctcgcga gccggggccg cgaggcctcc 60

aacgcggttc cgcaccccta atgccccagg gcggtgagca ccccgcggtt ccccgcccgc 120

ct 122

<210> 455

<211> 122

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 455

ggtcgagttt cggcggttat ttcgtagtgc gttttcgcga gtcggggtcg cgaggttttt 60

aacgcggttt cgtattttta atgttttagg gcggtgagta tttcgcggtt tttcgttcgt 120

tt 122

<210> 456

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 456

cgtagtgcgt tttcgcgagt c 21

<210> 457

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 457

cgccctaaaa cattaaaaat acgaaaccg 29

<210> 458

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 458

cgcgccgagg gcgttaaaaa cctcgcg 27

<210> 459

<211> 160

<212> DNA

<213> 智人(Homo sapiens)

<400> 459

cggtggaaaa gacagctgag cccccacctc ccttcacatt ccagaaaagt gtctgaaagg 60

cccggggcgc ttcggggctt gccaagagac ggtgtttaga gaaagagcat aacgcgaagt 120

cacaatcgca ggaaactcgc agcagccccc catccccgcc 160

<210> 460

<211> 160

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 460

cggtggaaaa gatagttgag tttttatttt tttttatatt ttagaaaagt gtttgaaagg 60

ttcggggcgt ttcggggttt gttaagagac ggtgtttaga gaaagagtat aacgcgaagt 120

tataatcgta ggaaattcgt agtagttttt tattttcgtt 160

<210> 461

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 461

gtttcggggt ttgttaagag acg 23

<210> 462

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 462

actactacga atttcctacg attataactt cg 32

<210> 463

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 463

cgcgccgagg gcgttatact ctttctctaa acac 34

<210> 464

<211> 165

<212> DNA

<213> 智人(Homo sapiens)

<400> 464

ctgcagcctc cagcccggcc cgcgcggcga cccagtcccc tgtcgcccga atcttccacc 60

gctgcgaagc gtccccgggc gagcgccctg ctctccgcgc tgcgcggaag ccagagccgg 120

tcctcacagt gaactcgccc agccctgctc gcggctctct cgatt 165

<210> 465

<211> 165

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 465

ttgtagtttt tagttcggtt cgcgcggcga tttagttttt tgtcgttcga attttttatc 60

gttgcgaagc gttttcgggc gagcgttttg tttttcgcgt tgcgcggaag ttagagtcgg 120

tttttatagt gaattcgttt agttttgttc gcggtttttt cgatt 165

<210> 466

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 466

agtttttagt tcggttcgcg c 21

<210> 467

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 467

cccgaaaacg cttcgcaacg 20

<210> 468

<211> 33

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 468

aggccacgga cgcggcgatt tagttttttg tcg 33

<210> 469

<211> 144

<212> DNA

<213> 智人(Homo sapiens)

<400> 469

cgcacaatcg gctgggacaa ggcagggaag ctgtggcgac ctgcaggggt tcacaagccc 60

ggaggccgat ggggtttgtc agtgacacca gaggggaaaa gcctcacaga gcaggaacac 120

cccccgccgc caggtgctgg gtgc 144

<210> 470

<211> 144

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 470

cgtataatcg gttgggataa ggtagggaag ttgtggcgat ttgtaggggt ttataagttc 60

ggaggtcgat ggggtttgtt agtgatatta gaggggaaaa gttttataga gtaggaatat 120

ttttcgtcgt taggtgttgg gtgt 144

<210> 471

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 471

gataaggtag ggaagttgtg gcg 23

<210> 472

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 472

cctctaatat cactaacaaa ccccatcg 28

<210> 473

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 473

cgcgccgagg gacctccgaa cttataaacc c 31

<210> 474

<211> 97

<212> DNA

<213> 智人(Homo sapiens)

<400> 474

cggcatgagc gcggtgagct gcggcaacgg gaagctccgc cagtggctga tcgaccagat 60

cgacagcggc aagtaccccg ggctggtgtg ggagaac 97

<210> 475

<211> 97

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 475

cggtatgagc gcggtgagtt gcggtaacgg gaagtttcgt tagtggttga tcgattagat 60

cgatagcggt aagtatttcg ggttggtgtg ggagaat 97

<210> 476

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 476

cgcggtgagt tgcggtaac 19

<210> 477

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 477

cgaaatactt accgctatcg atctaatcga 30

<210> 478

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 478

aggccacgga cgcgggaagt ttcgttagtg g 31

<210> 479

<211> 64

<212> DNA

<213> 智人(Homo sapiens)

<400> 479

ggcagcccga actccggcgc gccaggtttt tccagccgcc gcgagcgccg ggagggaggg 60

cagc 64

<210> 480

<211> 64

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 480

ggtagttcga atttcggcgc gttaggtttt tttagtcgtc gcgagcgtcg ggagggaggg 60

tagt 64

<210> 481

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 481

ggtagttcga atttcggcgc 20

<210> 482

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 482

ctccctcccg acgctcg 17

<210> 483

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 483

cgcgccgagg cgttaggttt ttttagtcgt cg 32

<210> 484

<211> 163

<212> DNA

<213> 智人(Homo sapiens)

<400> 484

cgcagtccct cggcggcgac gcggagcgcg gccacccgtt ccgagagcgc acggcggcaa 60

ataaggccag gataggtggc tggctggcga cgggggcgcc tgcggcggcg cgcgctgctg 120

tccgtggtgt tggaaccacg ctctccgccc gctcccgggc gtc 163

<210> 485

<211> 163

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 485

cgtagttttt cggcggcgac gcggagcgcg gttattcgtt tcgagagcgt acggcggtaa 60

ataaggttag gataggtggt tggttggcga cgggggcgtt tgcggcggcg cgcgttgttg 120

ttcgtggtgt tggaattacg tttttcgttc gttttcgggc gtt 163

<210> 486

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 486

gtagtttttc ggcggcgacg 20

<210> 487

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 487

ccttatttac cgccgtacgc t 21

<210> 488

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 488

aggccacgga cgtctcgaaa cgaataaccg c 31

<210> 489

<211> 128

<212> DNA

<213> 智人(Homo sapiens)

<400> 489

cgcccggggc gtcgggaggg ggcccgcgcg ggtcgcgccc tgcctggcgg tgggaccagc 60

tatcctcggc gcccagcgca gcgcgccccc tcccgacgcg cggtcggggc cgcagtggtc 120

gccctgcg 128

<210> 490

<211> 128

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 490

cgttcggggc gtcgggaggg ggttcgcgcg ggtcgcgttt tgtttggcgg tgggattagt 60

tattttcggc gtttagcgta gcgcgttttt tttcgacgcg cggtcggggt cgtagtggtc 120

gttttgcg 128

<210> 491

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 491

ggtcgcgttt tgtttggcg 19

<210> 492

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 492

cgcgcgtcga aaaaaaacgc g 21

<210> 493

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 493

cgcgccgagg gctacgctaa acgccg 26

<210> 494

<211> 153

<212> DNA

<213> 智人(Homo sapiens)

<400> 494

agctcgggaa cccgcgatac ccggccgggg gacgacaggg ggcgacaaac tgtaaggttt 60

tccctatgcc cgaccgtgca gaaggctgca gcgagggctg tgtgctcccg atcgcgcaca 120

gctggctgcg ggaaaggggc caggattgag acg 153

<210> 495

<211> 153

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 495

agttcgggaa ttcgcgatat tcggtcgggg gacgataggg ggcgataaat tgtaaggttt 60

tttttatgtt cgatcgtgta gaaggttgta gcgagggttg tgtgttttcg atcgcgtata 120

gttggttgcg ggaaaggggt taggattgag acg 153

<210> 496

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 496

cgatcgtgta gaaggttgta gcg 23

<210> 497

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 497

tttcccgcaa ccaactatac gcg 23

<210> 498

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 498

aggccacgga cggatcgaaa acacacaacc c 31

<210> 499

<211> 75

<212> DNA

<213> 智人(Homo sapiens)

<400> 499

gggccgcgcg gacctcggcg ggacccagcg ggcccgggcg ggcgcaccag ccgccctttg 60

tcctccgcct ccggg 75

<210> 500

<211> 75

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 500

gggtcgcgcg gatttcggcg ggatttagcg ggttcgggcg ggcgtattag tcgttttttg 60

tttttcgttt tcggg 75

<210> 501

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 501

cgggatttag cgggttcgg 19

<210> 502

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 502

cccgaaaacg aaaaacaaaa aacgac 26

<210> 503

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 503

cgcgccgagg ggcgggcgta ttagt 25

<210> 504

<211> 193

<212> DNA

<213> 智人(Homo sapiens)

<400> 504

gtctgcaaga gataaaaagc tagcccacga tccacccaca atcctcgtgt ccccggggtg 60

ccctcgcagt tgccaaacct acgggccgcg tttaggggaa gcctccgcgt cctggcggcc 120

aaaagaatgg gctccttcca gcttccccct accggatacc acctgcaaat ctattgccag 180

aggcgcagct ccc 193

<210> 505

<211> 188

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 505

gtttgtaaga gataaaaagt tagtttacga tttatttata attttcgtgt tttcggggtg 60

ttttcgtagt tgttaaattt acgggtcgcg tttaggggaa gttttcgcgt tttggcggtt 120

aaaagaatgg gtttttttta gttttttttt atcggatatt atttgtaaat ttattgttag 180

aggcgtag 188

<210> 506

<211> 30

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 506

tcggggtgtt ttcgtagttg ttaaatttac 30

<210> 507

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 507

cattctttta accgccaaaa cgcg 24

<210> 508

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 508

aggccacgga cgcgggtcgc gtttagg 27

<210> 509

<211> 111

<212> DNA

<213> 智人(Homo sapiens)

<400> 509

gcggggtcct ggcccccgcc agcccagccc cgatctcccg ggcagccttt gggcgccacc 60

tccggtcgcc cagagctgtc aagtggggac cttcccggag aggagccgcc g 111

<210> 510

<211> 111

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 510

gcggggtttt ggttttcgtt agtttagttt cgatttttcg ggtagttttt gggcgttatt 60

ttcggtcgtt tagagttgtt aagtggggat tttttcggag aggagtcgtc g 111

<210> 511

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 511

gggttttggt tttcgttagt ttagtttc 28

<210> 512

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 512

acaactctaa acgaccgaaa ataacg 26

<210> 513

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 513

aggccacgga cgcgattttt cgggtagttt ttgg 34

<210> 514

<211> 99

<212> DNA

<213> 智人(Homo sapiens)

<400> 514

cggcggtcgg agcccagcca gcggcttccc ggccgagatg cgcgctcagg aggcagccgc 60

aggtcgcgga gggcgggcgg cgctgccggg gtgtctgcg 99

<210> 515

<211> 99

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 515

cggcggtcgg agtttagtta gcggtttttc ggtcgagatg cgcgtttagg aggtagtcgt 60

aggtcgcgga gggcgggcgg cgttgtcggg gtgtttgcg 99

<210> 516

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 516

gcggtcggag tttagttagc g 21

<210> 517

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 517

acctacgact acctcctaaa cgcg 24

<210> 518

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 518

cgcgccgagg ggtttttcgg tcgagatg 28

<210> 519

<211> 99

<212> DNA

<213> 智人(Homo sapiens)

<400> 519

ggccagcagc cccagccgca gccccagcag cccttcctgc cgcccgcagc ctgtttcttt 60

gccacggccg cagccgcggc ggccgcagcc gccgcagcg 99

<210> 520

<211> 99

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 520

ggttagtagt tttagtcgta gttttagtag ttttttttgt cgttcgtagt ttgttttttt 60

gttacggtcg tagtcgcggc ggtcgtagtc gtcgtagcg 99

<210> 521

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 521

gtcgtagttt tagtagtttt ttttgtcgtt cg 32

<210> 522

<211> 16

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 522

cgaccgccgc gactac 16

<210> 523

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 523

aggccacgga cgcgaccgta acaaaaaaac aaac 34

<210> 524

<211> 69

<212> DNA

<213> 智人(Homo sapiens)

<400> 524

gggacccggg gacgcggggc gctcagccag gccccctcca gccgcgccgg ggccgtcccg 60

agccgcgcg 69

<210> 525

<211> 69

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 525

gggattcggg gacgcggggc gtttagttag gtttttttta gtcgcgtcgg ggtcgtttcg 60

agtcgcgcg 69

<210> 526

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 526

gacgcggggc gtttagt 17

<210> 527

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 527

cgactcgaaa cgaccccga 19

<210> 528

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 528

cgcgccgagg acgcgactaa aaaaaaccta ac 32

<210> 529

<211> 152

<212> DNA

<213> 智人(Homo sapiens)

<400> 529

ggtgcacctg tccccacacg tccctcgccc acggagcccc aggcggcgtt acgcacaccc 60

aggatcgtgg atcagcctgc cccggcgtcg ggtgtccccg cggctctcac catctggaaa 120

aggaaggtcc gcgcgcagag agggaaatgg ac 152

<210> 530

<211> 152

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 530

ggtgtatttg tttttatacg tttttcgttt acggagtttt aggcggcgtt acgtatattt 60

aggatcgtgg attagtttgt ttcggcgtcg ggtgttttcg cggtttttat tatttggaaa 120

aggaaggttc gcgcgtagag agggaaatgg at 152

<210> 531

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 531

ggagttttag gcggcgttac g 21

<210> 532

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 532

accgcgaaaa cacccgac 18

<210> 533

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 533

aggccacgga cgcgccgaaa caaactaatc c 31

<210> 534

<211> 138

<212> DNA

<213> 智人(Homo sapiens)

<400> 534

gggcccgcgc ggccccacgg tggtccagtt tacactcggg ccccgcactc ctgaagttcc 60

gcgcgggagg agaagggcgt ccctttcgca gctcgggcgc cgggtgcgcc gcgctgccac 120

ctggtggccg cagtggcc 138

<210> 535

<211> 138

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 535

gggttcgcgc ggttttacgg tggtttagtt tatattcggg tttcgtattt ttgaagtttc 60

gcgcgggagg agaagggcgt ttttttcgta gttcgggcgt cgggtgcgtc gcgttgttat 120

ttggtggtcg tagtggtt 138

<210> 536

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 536

gttcgcgcgg ttttacggt 19

<210> 537

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 537

cgcccttctc ctcccgc 17

<210> 538

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 538

cgcgccgagg cgcgaaactt caaaaatacg a 31

<210> 539

<211> 172

<212> DNA

<213> 智人(Homo sapiens)

<400> 539

tgcggggctg cttccccgcg tcctccgggc ccgggccgcc ctcctcccgc acagtgcgga 60

gcagggaggc cccgcgcctc gaccacccgc gcccgagcgt ccgcgcctcc tcctccgctc 120

tgcaggcggg gaccgcccgg cgctcggcac ccggcagcgc ggccccctcc ag 172

<210> 540

<211> 172

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 540

tgcggggttg ttttttcgcg tttttcgggt tcgggtcgtt tttttttcgt atagtgcgga 60

gtagggaggt ttcgcgtttc gattattcgc gttcgagcgt tcgcgttttt tttttcgttt 120

tgtaggcggg gatcgttcgg cgttcggtat tcggtagcgc ggtttttttt ag 172

<210> 541

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 541

ggaggtttcg cgtttcgatt a 21

<210> 542

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 542

cgaacgatcc ccgcctac 18

<210> 543

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 543

aggccacgga cgattcgcgt tcgagcg 27

<210> 544

<211> 67

<212> DNA

<213> 智人(Homo sapiens)

<400> 544

gggcccagcg cgggctcctc gcggtagtgg ccgcagctcg ggaagctcgg gggcgcggtg 60

tcctcgc 67

<210> 545

<211> 67

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 545

gggtttagcg cgggtttttc gcggtagtgg tcgtagttcg ggaagttcgg gggcgcggtg 60

ttttcgt 67

<210> 546

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 546

ggtttagcgc gggtttttcg 20

<210> 547

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 547

ccccgaactt cccgaact 18

<210> 548

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 548

aggccacgga cggcggtagt ggtcgtag 28

<210> 549

<211> 92

<212> DNA

<213> 智人(Homo sapiens)

<400> 549

ggccgcgacc cctccccgct gacctcactc gagccgccgc ctggcgcaga tataagcggc 60

ggcccatctg aagagggctc ggcaggcgcc cg 92

<210> 550

<211> 92

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 550

ggtcgcgatt ttttttcgtt gattttattc gagtcgtcgt ttggcgtaga tataagcggc 60

ggtttatttg aagagggttc ggtaggcgtt cg 92

<210> 551

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 551

ttttcgttga ttttattcga gtcgtc 26

<210> 552

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 552

gaaccctctt caaataaacc gc 22

<210> 553

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 553

aggccacgga cgcgtttggc gtagatataa gc 32

<210> 554

<211> 104

<212> DNA

<213> 智人(Homo sapiens)

<400> 554

gagccggagt cgcggtggcc gcctcagcgc catgtcgagg gttgctgagg ggccagcggc 60

agcgcggcgc ggcttgtagt ccccgcgcgc atgcgcccag cctg 104

<210> 555

<211> 104

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 555

gagtcggagt cgcggtggtc gttttagcgt tatgtcgagg gttgttgagg ggttagcggt 60

agcgcggcgc ggtttgtagt tttcgcgcgt atgcgtttag tttg 104

<210> 556

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 556

tggtcgtttt agcgttatgt cg 22

<210> 557

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 557

cgaaaactac aaaccgcgc 19

<210> 558

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 558

aggccacgga cgccgcgcta ccgcta 26

<210> 559

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 559

cgcgccgagg ccgcgctacc gcta 24

<210> 560

<211> 100

<212> DNA

<213> 智人(Homo sapiens)

<400> 560

ggcccggggc cgcctgggcc cctaggggct ggacgtcaac ctgttagata gagggcgtgg 60

gaccccccgc aggcggctgc tcggacgacc gcatccggag 100

<210> 561

<211> 100

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 561

ggttcggggt cgtttgggtt tttaggggtt ggacgttaat ttgttagata gagggcgtgg 60

gatttttcgt aggcggttgt tcggacgatc gtattcggag 100

<210> 562

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 562

cgttaatttg ttagatagag ggcg 24

<210> 563

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 563

tccgaacaac cgcctac 17

<210> 564

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 564

aggccacgga cgcgaaaaat cccacgc 27

<210> 565

<211> 117

<212> DNA

<213> 智人(Homo sapiens)

<400> 565

ccgtgggcgc ggacagctgc cgggagcggc aggcgtctcg atcggggacg caggcacttc 60

cgtccctgca gagcatcaga cgcgtctcgg gacactgggg acaacatctc ctccgcg 117

<210> 566

<211> 117

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 566

tcgtgggcgc ggatagttgt cgggagcggt aggcgtttcg atcggggacg taggtatttt 60

cgtttttgta gagtattaga cgcgtttcgg gatattgggg ataatatttt tttcgcg 117

<210> 567

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 567

gttgtcggga gcggtagg 18

<210> 568

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 568

ccaatatccc gaaacgcgtc t 21

<210> 569

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 569

cgcgccgagg gcgtttcgat cgggg 25

<210> 570

<211> 109

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 570

ttagcgggcc gggcggggga tcgggggtta ggggtggagt ccgccaaagg cccaaaggtg 60

atggtcatcg agatggagct acgaaaggat gagcagagcc cggagctcc 109

<210> 571

<211> 109

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 571

ttagcgggtc gggcggggga tcgggggtta ggggtggagt tcgttaaagg tttaaaggtg 60

atggttatcg agatggagtt acgaaaggat gagtagagtt cggagtttt 109

<210> 572

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 572

ggttaggggt ggagttcgtt a 21

<210> 573

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 573

actccgaact ctactcatcc tttc 24

<210> 574

<211> 31

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 574

cgcgccgagg cgtaactcca tctcgataac c 31

<210> 575

<211> 116

<212> DNA

<213> 智人(Homo sapiens)

<400> 575

aaggcgccgg cggctctcag taaaagcgaa tgtagccttt gtacttccga cctctcaatg 60

gtgaaatgag ctaatcacag gcccaccccg cggagtggga cgggagattc aatgag 116

<210> 576

<211> 116

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 576

aaggcgtcgg cggtttttag taaaagcgaa tgtagttttt gtattttcga ttttttaatg 60

gtgaaatgag ttaattatag gtttatttcg cggagtggga cgggagattt aatgag 116

<210> 577

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 577

tcggcggttt ttagtaaaag cg 22

<210> 578

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 578

aaatctcccg tcccactcc 19

<210> 579

<211> 36

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 579

cgcgccgagg cgcgaaataa acctataatt aactca 36

<210> 580

<211> 119

<212> DNA

<213> 智人(Homo sapiens)

<400> 580

gcctttgccc cggtttttgg cgcgggagga ctttcgaccc cgacttcggc cgctcatggt 60

ggcggcggag gcagcttcaa agacacgctg tgaccctgcg gctcctgacg ccagctctc 119

<210> 581

<211> 119

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 581

gtttttgttt cggtttttgg cgcgggagga ttttcgattt cgatttcggt cgtttatggt 60

ggcggcggag gtagttttaa agatacgttg tgattttgcg gtttttgacg ttagttttt 119

<210> 582

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 582

tttgtttcgg tttttggcg 19

<210> 583

<211> 17

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 583

cgccaccata aacgacc 17

<210> 584

<211> 12

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 584

aggccacgga cg 12

<210> 585

<211> 107

<212> DNA

<213> 智人(Homo sapiens)

<400> 585

gcctcggggc ccggggactc acaattacgg gcagagaaca catagtgaag agcacggtca 60

tcagcgccag cagcaggagg tgatccagct cctccagggg ctgaggg 107

<210> 586

<211> 107

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 586

gtttcggggt tcggggattt ataattacgg gtagagaata tatagtgaag agtacggtta 60

ttagcgttag tagtaggagg tgatttagtt tttttagggg ttgaggg 107

<210> 587

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 587

gggttcgggg atttataatt acgg 24

<210> 588

<211> 32

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 588

ctaaatcacc tcctactact aacgctaata ac 32

<210> 589

<211> 35

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成

<400> 589

cgcgccgagg ccgtactctt cactatatat tctct 35

Claims

1.一种方法，所述方法包括：

通过以下来测量人类个体的生物样品中的一种或多种基因的甲基化水平：

将所述生物样品中的基因组DNA用以甲基化特异性方式修饰DNA的试剂处理；

使用一组针对所选择的一种或多种基因的引物扩增经过处理的基因组DNA；以及

通过聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离以及靶标捕获确定所述一种或多种基因的甲基化水平；

其中所述一种或多种基因选自以下组中的一组：

(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553；

(vi)DIDO1_A、NDRG4、MAX.chr14.103021656-103021718、MMP23B、EMX2OS、SEPT9_B、NBPF8、EEF1A2、AIM1_A、BMP4_B、MAX.chr8.145103829-145103992、OBSCN、PYCARD、GDF6、MDFI_B、MIAT_A、SCL8A3、ZNF323_A、SQSTM1、AFF3、C1orf70、GDF7_A、JSRP1_A、LRRC8D_A、FEV和MAX.chr8.145104263-145104422；

(vii)ZNF323_A、MAX.chr7.104624356-104624730、NDRG2、DIDO1_A、MDFI_B、MAX.chr14.103021656-103021718、MMP23B、SEPT9_B和STX16_A；

(viii)SFMBT2_B、SQSTM1、ZNF323_A、ZNF90、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、MDFI_B、GDF7_A、MAX.chr10.22624479-22624553、JSRP1_A、MAX.chr14.103021656-103021718、EMX2OS、LRRC34、NBPF8、SEPT9_B、EEF1A2、LRRC41_C、VILL和MPZ_A；

(ix)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B；

(x)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC；

(xi)EMX2OS、DIDO1_A、SBNO2、AMIGO3_A、PCOLCE、CLDN7、CYTH2、OBSCN_A、AHSA2、DLL4、EMX2、MAX.chr14.74100620-74100870、LRRC4、PPP2R5C_A、SQSTM1、MAX.chr17.73073716-73073814、CYP11A1、ACOXL_A和AIM1_B；

(xii)EMX2OS和LRRC34；

(xiii)ZNF506、ZNF90、MAX.chr8.145103829-145103992、LRRC8D_A、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和VILL；

(xiv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B；

(xv)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL；

(xvi)EMX2OS、KANK1、C1orf70_B、AMIGO3_A、DIDO1_A、LRRC41_C、NFIC、FKBP11_A、C17orf107_A、SMTN、LRRC41_B、LRRC8D_A、OBSCN_A、MAX.chr7.104624356-104624730、MIAT_B；

(xvii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C；

(xviii)MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、OBSCN_A、DIDO1_A、EMX2OS、LRRC41_C和VILL；

(xix)EMX2OS和LRRC41_D；

(xx)SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A；

(xxi)MAX.chr10.130339363-130339534、SFMBT2_C、CYTH2、SLC6A3、VILL、EMX2OS、MAX.chr10.22624479-22624553、GDF6、ZNF90、ZNF506、JSRP1_A、c5orf52、SFMBT2_B、NBPF8、RHBDL1_A、DIDO1_A、KANK1和GATA2_B；

(xxii)MAX.chr8.145103829-145103992、CYTH2、DIDO1_A、MAX.chr10.22624479-22624553、JSRP1_A、SBNO2、NBPF8和VILL；

(xxiii)SFMBT2_B、ZNF90、MAX.chr8.145103829-145103992、CYTH2、MAX.chr8.145104263-145104422、OBSCN_A、MAX.chr10.22624479-22624553、JSRP1_A、EMX2OS、NBPF8和MPZ_A；

(xxiv)SFMBT2_B、SMTN、SQSTM1、ZNF506、ZNF90、CLDN7、LRRC41_B、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、DLL4、MAX.chr10.22624479-22624553、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、KANK1、SBNO2、c5orf52、EMX2O6、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC、VILL和MPZ_A；

(xxv)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C；

(xxvi)TSPYL5、MPZ_B、TRH、CNTN4、FAM19A5、GLT1D1、RYR2_F、PTGDR、EMX2OS、MAX.chr10:22624470-22624553、SPDYA_B、SFMBT2_E和JSRP1_B；以及

(xxvii)TSPYL5、MPZ_B、TRH和PTGDR。

2.如权利要求1所述的方法，其中将所述DNA用以甲基化特异性方式修饰DNA的试剂处理。

3.如权利要求2所述的方法，其中所述试剂包含甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂中的一种或多种。

4.如权利要求3所述的方法，其中将所述DNA用亚硫酸氢盐试剂处理以产生经过亚硫酸氢盐处理的DNA。

5.如权利要求1所述的方法，其中所述测量包括多重扩增。

6.如权利要求1所述的方法，其中测量至少一种甲基化标志基因的量包括使用一种或多种选自由以下组成的组的方法：甲基化特异性PCR、定量甲基化特异性PCR、甲基化特异性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序、瓣状核酸内切酶测定、PCR-瓣测定和亚硫酸氢盐基因组测序PCR。

7.如权利要求1所述的方法，其中所述样品包含血浆样品、血液样品或组织样品(例如子宫内膜组织)中的一种或多种。

8.如权利要求1所述的方法，其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。

9.一种表征样品的方法，所述方法包括：

a)测量来自所述样品的DNA中的至少一种甲基化标志基因的量，其中所述至少一种甲基化标志基因为选自以下组中的一组的一种或多种基因：

(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553；

(ix)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B；

(xii)EMX2OS和LRRC34；

(xiv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B；

(xvii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C；

(xix)EMX2OS和LRRC41_D；

(xxv)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C；

(xxvii)TSPYL5、MPZ_B、TRH和PTGDR；

b)测量所述DNA中的至少一种参考标志物的量；以及

c)将在所述DNA中测量的所述至少一种甲基化标志基因的所述量的值计算为在所述DNA中测量的所述参考标志基因的所述量的百分比，其中所述值指示在所述样品中测量的所述至少一种甲基化标志DNA的量。

10.如权利要求9所述的方法，其中所述至少一种参考标志物包含选自B3GALT6 DNA和β-肌动蛋白DNA的一种或多种参考标志物。

11.如权利要求9所述的方法，其中所述样品包含血浆样品、血液样品或组织样品(例如子宫内膜组织)中的一种或多种。

12.如权利要求9所述的方法，其中从所述样品提取所述DNA。

13.如权利要求9所述的方法，其中将所述DNA用以甲基化特异性方式修饰DNA的试剂处理。

14.如权利要求13所述的方法，其中所述试剂包含甲基化敏感性限制酶、甲基化依赖性限制酶和亚硫酸氢盐试剂中的一种或多种。

15.如权利要求14所述的方法，其中将所述DNA用亚硫酸氢盐试剂处理以产生经过亚硫酸氢盐处理的DNA。

16.如权利要求14所述的方法，其中使用一组针对所选择的一种或多种基因的引物扩增经过修饰的DNA。

17.如权利要求16所述的方法，其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。

18.如权利要求9所述的方法，其中测量甲基化标志基因的量包括使用聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离以及靶标捕获中的一种或多种。

19.如权利要求18所述的方法，其中所述测量包括多重扩增。

20.如权利要求18所述的方法，其中测量至少一种甲基化标志基因的所述量包括使用一种或多种选自由以下组成的组的方法：甲基化特异性PCR、定量甲基化特异性PCR、甲基化特异性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序、瓣状核酸内切酶测定、PCR-瓣测定和亚硫酸氢盐基因组测序PCR。

21.一种用于表征生物样品的方法，所述方法包括：

(a)测量人类个体的生物样品中选自以下组中的一组的一种或多种基因的CpG位点的甲基化水平：

(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553；以及

(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A，

所述测量通过以下进行：

将所述生物样品中的基因组DNA用亚硫酸氢盐处理；

使用一组针对所选择的一种或多种基因的引物扩增经过亚硫酸氢盐处理的基因组DNA；以及

通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的所述甲基化水平；

(b)将所述甲基化水平与无EC的对照样品中的一组相应基因的甲基化水平进行比较；以及

(c)当在所述一种或多种基因中测量的所述甲基化水平高于在所述相应对照样品中测量的所述甲基化水平时确定所述个体患有EC。

22.如权利要求21所述的方法，其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。

23.如权利要求21所述的方法，其中所述生物样品为血浆样品、血液样品或组织样品(例如子宫内膜组织)。

24.如权利要求21所述的方法，其中所述一种或多种基因由表1、8或21中所示的基因组坐标描述。

25.如权利要求21所述的方法，其中所述CpG位点存在于编码区或调控区中。

26.如权利要求21所述的方法，其中所述测量一种或多种基因的CpG位点的所述甲基化水平包括选自由以下组成的组的确定：确定所述CpG位点的甲基化评分和确定所述CpG位点的甲基化频率。

27.一种用于表征生物样品的方法，所述方法包括：

(iv)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B；以及

(v)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC，

所述测量通过以下进行：

将所述生物样品中的基因组DNA用亚硫酸氢盐处理；

(c)当在所述一种或多种基因中测量的所述甲基化水平高于在所述相应对照样品中测量的所述甲基化水平时确定所述个体患有透明细胞EC。

28.如权利要求27所述的方法，其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。

29.如权利要求27所述的方法，其中所述生物样品为血浆样品、血液样品或组织样品(例如子宫内膜组织)。

30.如权利要求27所述的方法，其中所述一种或多种基因由表1、8或21中所示的基因组坐标描述。

31.如权利要求27所述的方法，

其中若所述生物样品为组织样品，则所述一种或多种基因选自组i、ii、iii或iv；

其中若所述生物样品为血浆样品，则所述一种或多种基因在组v内。

32.如权利要求27所述的方法，其中所述测量一种或多种基因的CpG位点的甲基化水平包括选自由以下组成的组的确定：确定所述CpG位点的甲基化评分和确定所述CpG位点的甲基化频率。

33.一种用于表征生物样品的方法，所述方法包括：

(ii)EMX2OS和LRRC34；

(iv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B；以及

(v)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL，

所述测量通过以下进行：

将所述生物样品中的基因组DNA用亚硫酸氢盐处理；

(c)当在所述一种或多种基因中测量的所述甲基化水平高于在所述相应对照样品中测量的所述甲基化水平时确定所述个体患有癌肉瘤EC。

34.如权利要求33所述的方法，其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。

35.如权利要求33所述的方法，其中所述生物样品为血浆样品、血液样品或组织样品(例如子宫内膜组织)。

36.如权利要求33所述的方法，其中所述一种或多种基因由表1、8或21中所示的基因组坐标描述。

37.如权利要求33所述的方法，

38.如权利要求33所述的方法，其中所述测量一种或多种基因的CpG位点的所述甲基化水平包括选自由以下组成的组的确定：确定所述CpG位点的甲基化评分和确定所述CpG位点的甲基化频率。

39.一种用于表征生物样品的方法，所述方法包括：

(ii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C；

(iv)EMX2OS和LRRC41_D；以及

(v)SFMBT2_B、SMTN、SQSTM1、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、CYP11A1、FKBP11_A、MAX.chr8.145103829-145103992、AHSA2、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、GDGF6、DLL4、PYCARD、BMP4_B、JSRP1_A、MIAT_B、KANK1、EMX2OS、NBPF8、LOC440925_A、ITPKA、EEF1A2、FEV、LRRC41_C、NFIC、VILL、MPZ_A，

所述测量通过以下进行：

将所述生物样品中的基因组DNA用亚硫酸氢盐处理；

(c)当在所述一种或多种基因中测量的所述甲基化水平高于在所述相应对照样品中测量的所述甲基化水平时确定所述个体患有浆液性EC。

40.如权利要求39所述的方法，其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。

41.如权利要求39所述的方法，其中所述生物样品为血浆样品、血液样品或组织样品(例如子宫内膜组织)。

42.如权利要求39所述的方法，其中所述一种或多种基因由表1、8或21中所示的基因组坐标描述。

43.如权利要求39所述的方法，

44.如权利要求39所述的方法，其中所述测量一种或多种基因的CpG位点的甲基化水平包括选自由以下组成的组的确定：确定所述CpG位点的甲基化评分和确定所述CpG位点的甲基化频率。

45.一种用于表征生物样品的方法，所述方法包括：

(v)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C；

(vii)TSPYL5、MPZ_B、TRH和PTGDR，

所述测量通过以下进行：

将所述生物样品中的基因组DNA用亚硫酸氢盐处理；

(c)当在所述一种或多种基因中测量的所述甲基化水平高于在所述相应对照样品中测量的所述甲基化水平时确定所述个体患有子宫内膜样EC。

46.如权利要求45所述的方法，其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。

47.如权利要求45所述的方法，其中所述生物样品为血浆样品、血液样品或组织样品(例如子宫内膜组织)。

48.如权利要求45所述的方法，其中所述一种或多种基因由表1、8或21中所示的基因组坐标描述。

49.如权利要求45所述的方法，

其中若所述生物样品为组织样品，则所述一种或多种基因选自组i、ii、iii、v、vi和vii；

其中若所述生物样品为血浆样品，则所述一种或多种基因在组iv内。

50.如权利要求45所述的方法，其中所述测量一种或多种基因的CpG位点的所述甲基化水平包括选自由以下组成的组的确定：确定所述CpG位点的甲基化评分和确定所述CpG位点的甲基化频率。

51.一种方法，所述方法包括：

(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553；

(ix)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B；

(xii)EMX2OS和LRRC34；

(xiv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B；

(xvii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C；

(xix)EMX2OS和LRRC41_D；

(xxv)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C；

(xxvii)TSPYL5、MPZ_B、TRH和PTGDR，

所述测量通过以下进行：

将所述生物样品中的基因组DNA用亚硫酸氢盐处理；

通过甲基化特异性PCR、定量甲基化特异性PCR、甲基化敏感性DNA限制酶分析、定量亚硫酸氢盐焦磷酸测序或亚硫酸氢盐基因组测序PCR确定所述CpG位点的所述甲基化水平。

52.如权利要求51所述的方法，其中所述一组针对所选择的一种或多种基因的引物在表10或22中叙述。

53.如权利要求51所述的方法，其中所述生物样品为血浆样品、血液样品或组织样品(例如子宫内膜组织)。

54.如权利要求51所述的方法，其中所述一种或多种基因由表1、8或21中所示的基因组坐标描述。

55.如权利要求51所述的方法，

其中若所述生物样品为组织样品，则所述一种或多种基因选自组i、ii、iii、vi、vii、viii、ix、xi、xii、xiii、xiv、xvi、xvii、xviii、xix、xxi、xxii、xxiii、xxv、xxvi或xxvii；

其中若所述生物样品为血浆样品，则所述一种或多种基因在组v、x、xv或xxiv内。

56.如权利要求51所述的方法，其中所述测量一种或多种基因的CpG位点的所述甲基化水平包括选自由以下组成的组的确定：确定所述CpG位点的甲基化评分和确定所述CpG位点的甲基化频率。

57.一种筛查从受试者获得的样品中的子宫内膜癌的方法，所述方法包括：

1)测定DNA甲基化标志物的甲基化状态，所述DNA甲基化标志物包含具有选自由以下组中的一组组成的组的注释的染色体区域：

(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553；以及

(v)ANKRD35、ARL5C、ARRB1、BCL2L11_A、BCL2L11_B、BCL2L11_C、BZRAP1、C16orf54、C17orf101、C6orf132、CACNA2D4、DEDD2、EPS15L1、FAIM2、FAM125B、FAM189B、FAM78A、FOXP4、GYPC_A、GYPC_B、IFFO1_A、IFFO1_B、ITPKA、KLF16、LIMD2、LOC389333、LOC440925_A、LOC646278、LYL1、LYPLAL1、MAX.chr11.32355226-32355251、MAX.chr14.102172621-102172686、MAX.chr14.105512122-105512239、MAX.chr15.95128144-95128248、MAX.chr16.11327016-11327312、MAX.chr3.187676577-187676668、MAX.chr4.174430676-174430847、MAX.chr8.145900783-145900914、MAX.chr8.80804237-80804301、N4BP3、NCOR2、NFATC1_A、NFATC1_B、NKX2-6、NR2F6、OSM、PALLD_C、PIK3CD、PRKAR1B、RAD52、STX16_A、SUCLG2、TNFRSF1B、TNFRSF4、ZDHHC18和ZNF671_A，以及

2)当所述标志物的所述甲基化状态不同于在未患子宫内膜癌的受试者中测定的所述标志物的甲基化状态时将所述受试者鉴定为患有子宫内膜癌。

58.如权利要求57所述的方法，所述方法包括测定多种标志物。

59.如权利要求57所述的方法，其中所述标志物在高CpG密度启动子中。

60.如权利要求57所述的方法，其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。

61.如权利要求57所述的方法，其中所述测定包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。

62.如权利要求57所述的方法，其中所述测定包括使用甲基化特异性寡核苷酸。

63.如权利要求57所述的方法，

其中若所述样品为组织样品，则所述一种或多种基因选自组i、ii、iii、v、vi或vii；

其中若所述样品为血浆样品，则所述一种或多种基因在组iv内。

64.一种筛查从受试者获得的样品中的透明细胞子宫内膜癌的方法，所述方法包括：

(iv)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B；以及

(v)SFMBT2_B、SQSTM1、ZNF323_A、ZNF506、ZNF90、CLDN7、LRRC41_B、MAX.chr7.104624356-104624730、NDRG2、CYP11A1、MAX.chr8.145103829-145103992、CYTH2、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、MAX.chr10.130339363-130339534、MDFI_B、DLL4、GDF7_A、MIAT_A、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、EMX2、MMP23B、EMX2OS、MAX.chr17.73073716-73073814、NBPF8、SEPT9_B、LOC440925_A、STX16_A、ITPKA、EEF1A2、FEV、LRRC41_C和NFIC，以及

2)当所述标志物的所述甲基化状态不同于在未患透明细胞子宫内膜癌的受试者中测定的所述标志物的甲基化状态时将所述受试者鉴定为患有透明细胞子宫内膜癌。

65.如权利要求64所述的方法，所述方法包括测定多种标志物。

66.如权利要求64所述的方法，其中所述标志物在高CpG密度启动子中。

67.如权利要求64所述的方法，其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。

68.如权利要求64所述的方法，其中所述测定包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。

69.如权利要求64所述的方法，其中所述测定包括使用甲基化特异性寡核苷酸。

70.如权利要求64所述的方法，

71.一种筛查从受试者获得的样品中的癌肉瘤子宫内膜癌的方法，所述方法包括：

(ii)EMX2OS和LRRC34；

(iv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B；以及

(v)SFMBT2_B、SMTN、ZNF506、ZNF90、CLDN7、LRRC41_B、CYP11A1、MAX.chr8.145103829-145103992、AHSA2、CYTH2、GATA2_B、LRRC8D_A、MAX.chr8.145104263-145104422、OBSCN_A、DIDO1_A、GDF6、DLL4、MAX.chr10.22624479-22624553、PYCARD、BMP4_B、JSRP1_A、MAX.chr14.103021656-103021718、MIAT_B、EMX2OS、LRRC34、NBPF8、LOC440925_A、ITPKA、NFIC和VILL，以及

2)当所述标志物的所述甲基化状态不同于在未患癌肉瘤子宫内膜癌的受试者中测定的所述标志物的甲基化状态时将所述受试者鉴定为患有癌肉瘤子宫内膜癌。

72.如权利要求71所述的方法，所述方法包括测定多种标志物。

73.如权利要求71所述的方法，其中所述标志物在高CpG密度启动子中。

74.如权利要求71所述的方法，其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。

75.如权利要求71所述的方法，其中所述测定包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。

76.如权利要求71所述的方法，其中所述测定包括使用甲基化特异性寡核苷酸。

77.如权利要求71所述的方法，

78.一种筛查从受试者获得的样品中的浆液性子宫内膜癌的方法，所述方法包括：

(ii)EMX2OS和LRRC34；

(iv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B；以及

2)当所述标志物的所述甲基化状态不同于在未患浆液性子宫内膜癌的受试者中测定的所述标志物的甲基化状态时将所述受试者鉴定为患有浆液性子宫内膜癌。

79.如权利要求78所述的方法，所述方法包括测定多种标志物。

80.如权利要求78所述的方法，其中所述标志物在高CpG密度启动子中。

81.如权利要求78所述的方法，其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。

82.如权利要求78所述的方法，其中所述测定包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。

83.如权利要求78所述的方法，其中所述测定包括使用甲基化特异性寡核苷酸。

84.如权利要求78所述的方法，

85.一种筛查从受试者获得的样品中的子宫内膜样性子宫内膜癌的方法，所述方法包括：

(v)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C；

(vii)TSPYL5、MPZ_B、TRH和PTGDR，以及

2)当所述标志物的所述甲基化状态不同于在未患子宫内膜样子宫内膜癌的受试者中测定的所述标志物的甲基化状态时将所述受试者鉴定为患有子宫内膜样子宫内膜癌。

86.如权利要求85所述的方法，所述方法包括测定多种标志物。

87.如权利要求85所述的方法，其中所述标志物在高CpG密度启动子中。

88.如权利要求85所述的方法，其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。

89.如权利要求85所述的方法，其中所述测定包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。

90.如权利要求85所述的方法，其中所述测定包括使用甲基化特异性寡核苷酸。

91.如权利要求85所述的方法，

92.一种用于表征来自人类患者的样品的方法，所述方法包括：

a)从人类患者的样品获得DNA；

b)测定DNA甲基化标志物的甲基化状态，所述DNA甲基化标志物包含具有选自由以下组中的一组组成的组的注释的染色体区域：

(iv)EMX2OS、CYTH2、NBPF8、MAX.chr10.22624479-22624553；

(ix)MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和OBSCN_B；

(xii)EMX2OS和LRRC34；

(xiv)TRH、MAX.chr7:104624386-104624529、EMX2OS、DIDO1_B和ST3GAL2_B；

(xvii)MAX.chr7.104624356-104624730、EMX2OS和LRRC41_C；

(xix)EMX2OS和LRRC41_D；

(xxv)TSPYL5、TRH、JAM3、FAM19A5、PTGDR、SFMBT2_E、JSRP1_B和ARL5C；

(xxvii)TSPYL5、MPZ_B、TRH和PTGDR；

c)将所述一种或多种DNA甲基化标志物的所测定的甲基化状态与未患子宫内膜癌、透明细胞子宫内膜癌、癌肉瘤子宫内膜癌、子宫内膜样子宫内膜癌和/或浆液性子宫内膜癌的人类患者的所述一种或多种DNA甲基化标志物的甲基化水平参考进行比较。

93.如权利要求92所述的方法，其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。

94.如权利要求92所述的方法，所述方法包括测定多种DNA甲基化标志物。

95.如权利要求92所述的方法，

96.如权利要求92所述的方法，其中所述测定包括使用甲基化特异性聚合酶链式反应、核酸测序、质谱法、甲基化特异性核酸酶、基于质量的分离或靶标捕获。

97.如权利要求92所述的方法，其中所述测定包括使用甲基化特异性寡核苷酸。

98.如权利要求92所述的方法，其中所述甲基化特异性寡核苷酸选自表10或22中叙述的一组针对所选择的一种或多种基因的引物或选自表23的探针。

99.一种用于表征从人类受试者获得的样品的方法，所述方法包括使包含DMR的核酸与亚硫酸氢盐试剂反应以产生与亚硫酸氢盐反应过的核酸；对所述与亚硫酸氢盐反应过的核酸进行测序以提供所述与亚硫酸氢盐反应过的核酸的核苷酸序列；将所述与亚硫酸氢盐反应过的核酸的所述核苷酸序列与来自未患子宫内膜癌的受试者的包含所述DMR的核酸的核苷酸序列进行比较以鉴定两个序列的差异。

100.一种用于表征从人类受试者获得的样品的系统，所述系统包括：分析组件，所述分析组件被配置用于确定样品的甲基化状态；软件组件，所述软件组件被配置用于将所述样品的所述甲基化状态与数据库中记录的对照样品或参考样品甲基化状态进行比较；以及警报组件，所述警报组件被配置用于基于甲基化状态的组合确定单个值并向用户发出关于子宫内膜癌相关的甲基化状态的警报。

101.如权利要求100所述的系统，其中所述EC相关的甲基化状态是针对子宫内膜癌、透明细胞子宫内膜癌、癌肉瘤子宫内膜癌、子宫内膜样子宫内膜癌以及浆液性子宫内膜癌中的一种或多种的。

102.如权利要求100所述的系统，其中所述样品包含含有DMR的核酸。

103.如权利要求100所述的系统，所述系统还包括用于分离核酸的组件。

104.如权利要求100所述的系统，所述系统还包括用于收集样品的组件。

105.如权利要求100所述的系统，其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。

106.如权利要求100所述的系统，其中所述数据库包含含有DMR的核酸序列。

107.如权利要求100所述的系统，其中所述数据库包含来自未患子宫内膜癌、透明细胞子宫内膜癌、癌肉瘤子宫内膜癌、子宫内膜样子宫内膜癌和/或浆液性子宫内膜癌中的至少一种的受试者的核酸序列。

108.一种试剂盒，所述试剂盒包括：

1)亚硫酸氢盐试剂；以及

2)包含来自选自由表1、8和21的DMR 1-499组成的组的DMR的序列并具有与未患子宫内膜癌的受试者相关的甲基化状态的对照核酸。

109.一种试剂盒，所述试剂盒包括亚硫酸氢盐试剂和根据SEQ ID NO 1-288的寡核苷酸。

110.一种试剂盒，所述试剂盒包括用于从受试者获得样品的样品收集器；用于从所述样品分离核酸的试剂；亚硫酸氢盐试剂；以及根据SEQ ID NO 1-288的寡核苷酸。

111.根据权利要求110所述的试剂盒，其中所述样品为粪便样品、组织样品、子宫内膜组织样品、血浆样品或尿样品。

112.一种组合物，所述组合物包含含有DMR的核酸和亚硫酸氢盐试剂。

113.一种组合物，所述组合物包含含有DMR的核酸和根据SEQ ID NO 1-288的寡核苷酸。

114.一种组合物，所述组合物包含含有DMR的核酸和甲基化敏感性限制酶。

115.一种组合物，所述组合物包含含有DMR的核酸和聚合酶。

116.一种用于筛查从受试者获得的样品中的子宫内膜癌的方法，所述方法包括使包含DMR的核酸与亚硫酸氢盐试剂反应以产生与亚硫酸氢盐反应过的核酸；对所述与亚硫酸氢盐反应过的核酸进行测序以提供所述与亚硫酸氢盐反应过的核酸的核苷酸序列；将所述与亚硫酸氢盐反应过的核酸的所述核苷酸序列与来自未患子宫内膜癌的受试者的包含所述DMR的核酸的核苷酸序列进行比较以鉴定两个序列的差异；以及当存在差异时将所述受试者鉴定为患有子宫内膜癌。

117.一种用于筛查从受试者获得的样品中的子宫内膜癌的系统，所述系统包括：分析组件，所述分析组件被配置用于确定样品的甲基化状态；软件组件，所述软件组件被配置用于将所述样品的所述甲基化状态与数据库中记录的对照样品或参考样品甲基化状态进行比较；以及警报组件，所述警报组件被配置用于基于甲基化状态的组合确定单个值并向用户发出关于子宫内膜癌相关的甲基化状态的警报。

118.如权利要求117所述的系统，其中所述样品包含含有DNA甲基化标志物的核酸，所述DNA甲基化标志物包含选自由表1、8和21的DMR 1-499组成的组的差异甲基化区域(DMR)中的碱基。

119.如权利要求118所述的系统，所述系统还包括用于分离核酸的组件。

120.如权利要求118所述的系统，所述系统还包括用于收集样品的组件。

121.如权利要求118所述的系统，所述系统还包括用于收集粪便样品、子宫内膜组织样品和/或血浆样品的组件。

122.如权利要求118所述的系统，其中所述数据库包含来自未患子宫内膜癌的受试者的核酸序列。