WO2013064066A1

WO2013064066A1 - 全基因组甲基化高通量测序文库的构建方法及其应用

Info

Publication number: WO2013064066A1
Application number: PCT/CN2012/083821
Authority: WO
Inventors: 高飞; 王君文; 夏渝东; 王俊
Original assignee: 深圳华大基因科技有限公司; 深圳华大基因研究院
Priority date: 2011-11-02
Filing date: 2012-10-31
Publication date: 2013-05-10
Also published as: CN103088433A; CN103088433B

Abstract

提供了全基因组甲基化高通量测序文库的构建方法及其应用。构建全基因组甲基化高通量测序文库的方法包括：用Msp I和第二限制性内切酶对基因组DNA进行酶切；将DNA片段进行末端修复；在经过末端修复的DNA片段的3'末端添加碱基A；将具有粘性末端A的DNA片段与甲基化接头相连；将具有甲基化接头的连接产物进行片段选择，以便获得目的片段；将目的片段进行重亚硫酸盐处理，以便将目的片段中非甲基化的胞嘧啶转换为尿嘧啶；将经过转换的目的片段进行PCR扩增；分离纯化扩增产物，该扩增产物构成全基因组甲基化高通量测序文库。釆用本发明的构建全基因组甲基化高通量测序文库的方法及其应用，能够方便有效地构建基因组DNA样品的全基因组甲基化高通量测序文库。

Description

全基因组曱基化高通量测序文库的构建方法及其应用技术领域

本发明涉及生物技术领域。具体地，涉及全基因组甲基化检测技术，特别是微量 DNA 全基因组甲基化检测技术领域。更具体地，本发明提供了一种构建全基因组甲基化高通量测序文库的方法、一种确因组 DNA样品的甲基化位点的方法、一种用于确定基因组 DNA 样品的甲基化位点的装置、一组分离的限制性内切酶以及一种用于构建全基因组甲基化高通量测序文库的试剂盒。

背景技术

DNA甲基化是研究最为深入的表观遗传学机制， DNA甲基化在维持正常细胞功能、抑制寄生 DNA成分对基因组完整性的损害、染色盾结构修饰、 X染色体失活、基因组印迹、胚胎发育以及人类肿瘤发生中起着重要作用，是目前新的研究热点之一。

然而，目前对全基因组 DNA甲基化的研究仍有待改进。

发明内容

本发明是基于发明人的下列发现完成的：

减少的代表性重亚硫酸盐测序（RRBS ) (参见 Smith ZD等人， 2009. 在哺乳动物基因组中高通量重亚石克酸盐测序 ( High-throughput bisulfite sequencing in mammalian genomes )

Methods. 48:226-232. ,通过引用将其全文并入本文)，是目前常用的全基因组甲基化检测方法，其可以检测人类和鼠基因组中大部分的 CpG岛和启动子区域。然而，越来越多的研究显示差异甲基化区域（DMR )如组织特异性差异甲基化区域（T-DMR )和癌症中的差异甲基化区域 ( C-DMR )并非仅仅位于 CpG岛内, 更多的甲基化差异区域位于 CpG岛夕卜，如 CpG岛外

( CGIshore )来调控基因的表达，而这些区¾^现有 RRBS技术不足以检测到的。另一方面，现有 RRBS技术对岛内 CG数量的覆盖度低。

本发明旨在解决现有技术问题的至少之一。由此，为了检测基因组中更多具有性区域的甲基化状态并更真实的反应这些区域的甲基化水平，本发明提供了全基因组甲基化高通量测序文库的构建方法及其应用。

根据本发明的一个方面，本发明提供了一种构建全基因组甲基化高通量测序文库的方法。根据本发明的实施例，该方法包括以下步骤：用 Msp I和第二限制性内切酶对基因组 DNA 进行酶切，以便获得 DNA片段，其中，所述第二限制性内切酶为选自 fotN I、 HpyCm V, Alu l, Hae IIL HpyCH4 Apek L Ban IL Taqa L Sph l. Bgl ll. BssS L BamlU和 Kpn l 的至少一种；将所述 DNA片段进行末端修复，以便获得经过末端修复的 DNA片段；在所述经过末端修复的 DNA片段的 3'末端添加 A, 以便获得具有粘性末端 A的 DNA片段；将所述具有粘性末端 A的 DNA片段与甲基化接头相连，以便获得具有甲基化接头的连接产物；将所述具有甲基化接头的连接产物进行片段选择，以便获得目的片段；将所述目的片段进行重亚硫酸盐处理，以便将所述目的片段中非甲基化的胞嘧啶转换为尿嘧啶，获得经过转换的目的片段；将所述经过转换的目的片段进行 PCR扩增，以便获得扩增产物；以及分离纯化所述扩增产物，所述扩增产物构成全基因组甲基化高通量测序文库。

利用根据本发明实施例的构建全基因组甲基化高通量测序文库的方法，能够有效地构建基因组 DNA样品的全基因组甲基化高通量测序文库，特别是能够有效地构建微量样本的全基因组甲基化高通量测序文库，从而能够有效、充分地应用于高通量测序技术，通过对文库的测序，然后基于对测序结果的数据分析，就能够有效地获得全基因组甲基化位点信息，实现对基因组 DNA样品的全基因组甲基^ ^测。

根据本发明的另一方面，本发明提供了一种确定基因组 DNA样品的甲基化位点的方法。根据本发明的实施例，该方法包括下列步骤： #4居前面所述构建全基因组甲基化高通量测序文库的方法，构建基因组 DNA样品的全基因组甲基化高通量测序 ^; 对该全基因组甲基化高通量测序文库进行测序，以便得到测序结果；以及对测序结果进行数据分析，以便确定基因组 DNA样品的甲基化位点。利用根据本发明实施例的确定基因组 DNA样品的甲基化位点的方法，能够准确地确定基因组 DNA样品的甲基化位点，从而实现对基因组 DNA样品的全基因组甲基化检测，相对于目前的 RRBS技术，本发明的确定基因组 DNA样品的甲基化位点的方法，对全基因组的调控区域的覆盖广度得到显著提高，对调控区域内 CpG位点的覆盖量显著增加。

根据本发明的再一方面，本发明提供了一种用于确定基因组 DNA样品的甲基化位点的装置。 # ^据本发明的实施例，该装置包括：文库制备单元，所述文库制备单元用于制备基因组 DNA样品的全基因组甲基化高通量测序文库，所述文库制备单元内设置有 Msp I酶以及第二限制性内切酶，其中，所述第二限制性内切酶为选自 Bsm I、 HpyCm V、 Alu I、 Hae ΙΠ、 HpyCm IL Apek l. B m JL TaqaA、 Sph l. Bg!JL BssS L Sa H I和 " 1的至少一种；测序单元，所述测序单元与所述文库制备单元相连，并且从所述文库制备单元接收所述基因组 DNA样品的全基因组甲基化高通量测序文库，以便用于对所述基因组 DNA样品的全基因组甲基化高通量测序文库进行测序，获得测序结果；以及数据分析单元，所述数据分析单元与所述测序单元相连，并且从所述测序单元接收所述测序结果，以便对所述测序结果进行数据分析，确定所述基因组 DNA样品的甲基化位点。利用根据本发明实施例的用于确定基因组 DNA样品的甲基化位点的装置，能够方便准确地确定基因组 DNA样品的甲基化位点，可以应用于多种针对全基因组甲基化的研究，例如可以用于对人的肿瘤基因抑制基因的甲基化异常的检测 , 以便为人类疾病的早期诊断提供有效的途径。

才艮据本发明的又一方面，本发明提供了一组分离的限制性内切酶。根据本发明的实施例，其由 Msp I酶以及第二限制性内切酶构成，其中，所述第二限制性内切酶为选自 I、 HpyCm \, Alu l. Hae ΠΚ HpyCH4 IL Apek l. Ban IL Taqa l. Sph l、 Bgl L. BssS L BamR 1和 « 1的至少一种。根据本发明实施例的 M p I酶和第二限制性内切酶构成的组合，能够有效地对基因组 DNA进行酶切，且酶切获得的 DNA片段非常适用于本发明的构建全基因组甲基化高通量测序文库的方法。

根据本发明的另一方面，本发明提供了一种用于构建全基因组甲基化高通量测序的试剂盒。根据本发明的实施例，该试剂盒包括： Msp I酶，以及第二限制性内切酶，其中，所述第二限制性内切酶为选自 BsfN I、 HpyCm V、 Alu I、 Hae III、 HpyCH4 II、 Apek I、 Ban Π、 Taq I、 Sph I、 Bgl Π、 BssS I、 BamR I和 Kpn I的至少一种。利用根据本发明实施例的用于构建全基因组甲基化高通量测序文库的试剂盒，能够方便有效地构建基因组 DNA样品的全基因组甲基化高通量测序文库。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显, 或通过本发明的实践了解到。

附图说明本发明的上述和 /或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图 1 显示了根据本发明一个实施例的构建全基因组甲基化高通量测序文库的方法的流程示意图

图 2 显示了根据本发明一个实施例的针对不同长度目的片段所构建全基因组甲基化高通量测序文库的安捷伦 2100检测结果。

A: 显示了根据本发明一个实施例的目的片段长度为 160bp以上，且小于 240bp的全基因组甲基化高通量测序文库的安捷伦 2100检测结果。

B: 显示了根据本发明一个实施例的目的片段长度为 240bp以上，且小于 340bp的全基因组甲基化高通量测序文库的安捷伦 2100检测结果。

C: 显示了根据本发明一个实施例的目的片段长度为 340bp以上，且 420bp以下的全基因组甲基化高通量测序文库的安捷伦 2100检测结果。

D: 显示了根据本发明一个实施例的目的片段长度为 160bp-420bp的全基因组甲基化高通量测序文库的安捷伦 2100检测结果。

图 3:显示了根据本发明一个实施例的用于确定基因组 DNA样品的甲基化位点的装置的示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

构建全基因组甲基化高通量测序文库的方法

根据本发明的一个方面，本发明提供了一种构建全基因组甲基化高通量测序文库的方法。参考图 1 , 根据本发明的实施例，该方法包括以下步骤：用 I和第二限制性内切酶对基因组 DNA进行酶切，以便获得 DNA片段；将 DNA片段进行末端修复，以便获得经过末端修复的 DNA片段；在经过末端修复的 DNA片段的 3'末端添加 A, 以便获得具有粘性末端 A的 DNA片段；将具有粘性末端 A的 DNA片段与甲基化接头相连，以便获得具有甲基化接头的连接产物；将具有甲基化接头的连接产物进行片段选择，以便获得目的片段；将目的片段进行重亚硫酸盐处理，以便将目的片段中非甲基化的胞嘧啶转换为尿嘧啶，获得经过转换的目的片段；将经过转换的目的片段进行 PCR扩增，以便获得扩增产物；以及分离纯化扩增产物，所得到的扩增产物构成全基因组甲基化高通量测序文库。

在本发明中所使用的术语 "DNA"可以是任何包含脱氧核糖核苷酸的聚合物，包括但不限于经过修饰的或者未经修饰的 DNA。本领域的技术人员可以理解，基因组 DNA的来源不受特别限制，可以从任何可能的途径获得，可以是通过市售直接获得，也可以是从其他实验室直接获取，还可以是直接从样本中提取。 #4居本发明的实施例，可以从样本中提取获得基因组 DNA。根据本发明的一个实施例，构建全基因组甲基化高通量测序文库的方法可以进一步包括从样本中提取基因组 DNA的步骤。根据本发明的一些具体示例，样本可以来源于哺乳动物、植物、和生物的至少一种。根据本发明的一些实施例，哺乳动物可以为人和小鼠的至少一种。根据本发明的一个实施例，基因组 DNA可以为人类全血基因组 DNA。发明人发现，当釆用人类全血基因组 DNA构建全基因组甲基化高通量测序时，从样本中提取基因组 DNA的操作方便易行，且获得的 DNA盾量好、甲基化信息完整，由其构建的能够方便地应用于高通量测序技术，从而基于对测序结果的数据分析就能方便有效地获得样本的全基因组甲基化信息。根据本发明的实施例，基因组 DNA的量不受特别限制，根据本发明的具体示例，优选基因组 DNA的量为 150-200ng, 更优选为 100ng。发明人惊奇地发现，当基因组 DNA的量为 lOOng时，根据本发明实施例的构建全基因组甲基化高通量测序文库的方法构建的文库，能够非常方便地应用于高通量测序技术，如 Solexa测序技术，且文库测序结果准确，可重复性好，包含甲基化信息完整、 CpG位点覆盖多。

另外，需要说明的是，根据本发明实施例的构建全基因组甲基化高通量测序文库的方法中用 Msp I和第二限制性内切酶对基因组 DNA进行酶切的步骤，是本申请的发明人经过艰苦的研究和创造性劳动而意外获得的。在本文中所使用的术语 "第二限制性内切酶 "的含义是指与 M I不同的限制性内切酶。根据本发明的实施例，可以釆用的第二限制性内切酶的含义为选 SWN HpyCm \, Alu l. Hae ΠΚ HpyCH4 IL Apek L Ban IL Taqa L Sph l. Bglll. BssS L 謂10和 « 1的至少一种。根据本发明的具体示例，优选釆用^^ K I作为第二限制性内切酶。这些限制性内切酶均为已知的，并且其最佳酶切条件以及识别位点也都是已知的。例如，限制性内切酶 M p I和 ApeK I的识别位点分别为 CCGG和 GCWGC (其中 W表示 4 & A或 T )。发明人发现，当釆用 Msp I和上述第二限制性内切酶组合对基因组 DNA 进行酶切时，酶切所得的 DNA片段对基因组调控区域的覆盖情况非常好，具体地， Msp l和 ApeK I结合酶切与 RRBS技术中的 Msp I单酶切相比，理论上可检测到 CpG岛内的 CpG位点数由不足 50%提高到近 70%。发明人发现，通过 I和上述第二限制性内切酶对基因组 DNA进行酶切，然后进行全基因甲基化高通量测序文库构建以^^续的全基因组甲基化位点的确定，能够实现对甲基化区域的有效检测，尤其是现有 RRBS技术无法检测到的区域例如大于 70%的组织特异性差异的甲基化区域（ T-DMR )和癌症中的差异甲基化区域（ C-DMR ), 由此检测范围得到显著扩大并且可覆盖更多的 CpG位点，具有广阔的应用前景。

根据本发明的实施例，使用 I和第二限制性内切酶对基因组 DNA进行酶切时，限制性内切酶对基因组 DNA进行处理的先后顺序不受特别限制，可以依次进行，也可以同时进行。以 Msp I和 ApeK I的组合为例，根据本发明的具体示例，可以首先使用 Msp I进行酶切处理，然后再使用^ ¾¾ 1进行酶切处理。发明人惊奇地发现，当釆用这种酶切顺序进行酶切处理时，能够有效地对基因组 DNA进行酶切处理，并且在完成 M p I对基因组 DNA的酶切处理后，不需要纯化酶切产物，只需要对限制性内切酶进行失活处理，即可以添加 ^eK I, 进行酶切。

根据本发明的一个实施例，在使用 Msp I和第二限制性内切酶对基因组 DNA进行酶切时，可以添加对照样品，以验证方法的有效性。根据本发明的实施例，对照样品可以为序列已知且与样品基因组 DNA来源不同的任何 DNA。具体地，优选釆用 λ-DNA, 因为 λ-DNA 的序列信息已知，且其核苷酸序列中不存在甲基化位点。由此，能够更加精确地评估文库构建过程重亚硫酸盐的转换效率，以便提高检测样本的应用范围和检测可信度。具体地，根据以 Msp I和 Apek I的组合为例，本发明的一个实施例，发明人利用 Msp I和 Apek I酶切 lambda 基因组 DNA ( λ-DNA ), 选取同样大小范围的片段（40-300bp )与人类基因组 hgl9比对，结果显示所有选取范围内的 λ-DNA片段均不会比回到人类基因组上。进一步，发明人使用 lOOng 的成熟树突状细胞（ mDC )基因组，同时混入 50pg完整的 λ-DNA共同酶切建库，计算证明建库过程重亚硫酸盐转换率约为 99%,确定了其作为参照评估重亚硫酸盐转换效率的精确性。目前已知千细胞等相关细胞中存在大量非 CpG位点上的甲基化修饰，因此，不能按照基因组本身单个 C碱基 (非 CG二核苷酸处的 C碱基 )的甲基化状态来计算重亚硫酸盐处理的转换率。居本发明的实施例，发明人通过将未甲基化的 λ-DNA 引入建库和测序过程，可更加精确的评估不同实验样本的检测准确性，为实验数据可信性的判定提供了重要依据。此外，根据本发明的实施例，与基因组 DNA混合的 λ-DNA的量不受特别限制。根据本发明的一些具体示例，可以添加极微量的 λ-DNA与基因组 DNA混合，本领域的技术人员可以理解，这里所使用的术语 "极微量"是相对而言，是指与基因组 DNA的量相比，混合的 λ-DNA的量非常少，不会千扰基因组 DNA的酶切及其后续的建库过程。基因组 DNA和 λ-DNA的添加量可以不是一个数量级，例如 lOOng基因组 DNA中，可以混合 30-100pg的 λ-ϋΝΑ。发明人发现，皮克级的未甲基化 λ-DNA的混合，就能够实现其参照作用，即能够精确地评估文库构建过程中重亚硫酸盐的转换效率。根据本发明的具体示例，优选地， lOOng基因组 DNA中混合 50pg的 λ-DNA, 由此既能精确评估重亚硫酸盐的转换效率，还能有效地构建基因组 DNA 样品的全基因组甲基化高通量测序文库，且该能有效地用于后续的全基因族甲基化检测中，检测到的甲基化区域广、 CpG为点多。

根据本发明的一个实施例，在将 DNA片段进行末端修复前，可以进一步包括纯化 DNA 片段的步骤，由此，使得后续的末端修复易于进行。根据本发明的实施例，将 DNA片段进行末端修复可以利用 Klenow片段、 T4 DNA聚合酶和 T4多核苷酸激酶进行，其中，所述 Klenow片段具有 5'→3'聚合酶活性和 3'→5'聚合酶活性，但缺少 5'→3'外切酶活性。由此，能够方便准确地对 DNA片段进行末端修复。

根据本发明的一个实施例，可以利用 Klenow (3'-5' exo-), 即具有 3'→5'外切酶活性的 Klenow, 在经过末端修复的 DNA片段的 3'末端添加碱基 A。由此，能够方便准确地将碱基 A添加到经过末端修复的 DNA片段的 3'末端。

本发明中所使用的术语"甲基化接头"是指这样的一种接头，在其核苷列中，所有 C 位点均被甲基化修饰。根据本发明的一个实施例，在将具有粘性末端 A的 DNA片段与甲基化接头相连前，可以进一步包括对常规测序所使用的接头进行甲基化的步骤。由此，能够避免测序接头对后续重亚硫酸盐处理等操作的千扰。本领域的技术人员可以理解，对接头进行甲基化的方法不受特别限制，可以利用本领域已知的任何方法对测序接头进行甲基化。根据本发明的一些实施例，甲基化接头中还可以进一步包含标签，由此可以方便地同时构建多种基因组 DNA样品的全基因组甲基化高通量测序文库，并能够有效地应用于高通量测序平台，从而在对测序结果进行数据分析后，基于标签的序列信息，就能够准确地区分多种基因组 DNA样品的文库的序列信息以及全基因组甲基化位点的信息，由此，能够充分地利用高通量测序平台，且能够节省时间、降低成本。

根据本发明的一个实施例，将具有粘性末端 A的 DNA片段与甲基化接头相连是利用 T4 DNA连接酶进行的，由此可以方便地获得具有甲基化接头的连接产物。

才艮据本发明的实施例，将具有甲基化接头的连接产物进行片段选择，是通过 2%的琼脂糖 O交电泳进行的。根据本发明的实施例，通过 2%的琼脂糖；O交电泳对具有甲基化接头的连接产物进行片段选择后 , 还可以对获得的目的片段进行纯化回收，以便^ ^续的实验易于进行。才居本发明的一些具体示例，将具有甲基化接头的连接产物进行片段选择，获得的目的片段的长度为 160-420bp。根据本发明的一个实施例，目的片段的长度可以为 160 bp以上，且小于 240bp。根据本发明的另一个实施例，目的片段的长度可以为 240 bp以上，且小于 340bp。根据本发明的又一个实施例，目的片段的长度可以为 340 bp以上，且 420bp以下。发明人发现，当目的片段的长度为 160-420bp时，构建的样品的全基因组甲基化高通量测序文库，能够方便有效地应用于高通量测序平台如 Solexa测序平台，且可重复性好,测序结果真实可靠，包含基因组甲基化信息完整、 CpG位点多。

根据本发明的一些具体示例，在将目的片段进行重亚硫酸盐处理之前，可以将目的片段与片段化的 λ-DNA混合。发明人发现，通过添加外源 DNA ( λ-DNA ), 即将目的片段与外源 DNA混合，然后进行重亚硫酸盐高效共处理，对目标 DNA片段能够起到保护作用，最大限度地降低重亚硫酸盐对微量 DNA的破坏，可以进一步提高检测精度，使得纳克级，例如 50-150ng基因组整体水平高精度的甲基化检测成为现实。根据本发明的实施例，片段化的 λ-DNA的添加量不受特别限制， #4居具体的示例，优选片段化的 λ-DNA的量为 100-500ng, 更优选为 200ng。本领域技术人员能够理解，可以通过本领域已知的任意方法制备这些片段化的 λ-DNA, 例如可以随同前面的 DNA片段化处理一起进行制备。

此外，将目的片段进行重亚硫酸盐处理，可以通过本领域已知的任何方法进行，根据本发明的具体示例，可以釆用商品化的试剂盒进行，优选地釆用 EZ DNAMethylation-Gold Kit™ ( ZYMO )进行。发明人惊奇地发现，釆用 EZ DNA Methylation-Gold Kit™ ( ZYMO )对目的片段进行重亚硫酸盐处理时，方便快捷，且处理效果好，目的片段中非甲基化的胞嘧啶能够高效准确地转换为尿嘧啶，并且利于后续处理。根据本发明的实施例，可以使用热启动 taq DNA聚合酶对经过转换的目的片段进行 PCR 扩增。根据本发明的实施例，热启动 taq DNA聚合酶的种类不受特别限制，根据本发明的具体示例，热启动 taq DNA聚合酶可以为 r-taq聚合酶，由此 PCR扩增效率高、用时少。根据本发明的实施例，可以基于目的片段的长度，确定 PCR扩增的循环数。具体地，当目的片段的长度为 160bp以上，且小于 240bp时， PCR扩增的循环数可以为 11; 当目的片段的长度为 240bp以上，且小于 340bp时， PCR扩增的循环数可以为 13;以及当目的片段的长度为 340bp 以上，且 420bp以下时， PCR扩增的循环数可以为 15。发明人惊奇地发现，当釆用上述方法确定 PCR扩增的循环数时， PCR扩增效率高、用时少，扩增效果都非常好。在为对目的片段长度进行细分的情况下，如果目的片段的长度在 160-420bp的范围内， PCR扩增的循环数可以为 13 , 发明人发现仍然可以实现较好的扩增效果。

根据本发明的实施例，分离纯化扩增产物的方法不受特别限制，根据本发明的具体示例，可以通过选自磁珠纯化、纯化柱纯化和 2%的琼脂糖; O交电泳的至少一种进行，优选通过 2% 的琼脂糖 O交电泳进行。

利用根据本发明实施例的构建全基因组甲基化高通量测序文库的方法，能够有效地构建基因组 DNA样品的全基因组甲基化高通量测序文库，特别是能够有效地构建微量样本的全基因组甲基化高通量测序文库，从而能够有效、充分地应用于高通量测序技术，通过对文库的测序，然后基于对测序结果的数据分析，就能够有效地获得全基因组甲基化位点信息，实现对基因组 DNA样品的全基因组甲基^ ^测。确^^因组 DNA样品的甲基化位点的方法和装置

根据本发明的另一方面，本发明提供了一种确定基因组 DNA样品的甲基化位点的方法。根据本发明的实施例，该方法包括下列步骤：根据本发明实施例的构建全基因组甲基化高通量测序文库的方法构建基因组 DNA样品的全基因组甲基化高通量测序文库；对该全基因组甲基化高通量测序文库进行测序，以便得到测序结果；以及对测序结果进行数据分析，以便确定基因组 DNA样品的甲基化位点。

根据本发明的一些实施例，测序是利用高通量测序技术进行的。本领域的技术人员可以理解，可以通过本领域已知的任何高通量测序技术进行测序，根据本发明的具体示例，优选地釆用 Solexa测序平台进行测序。发明人发现，釆用 Solexa测序平台对基因组 DNA样品的全基因组甲基化高通量测序文库进行测序，能够有效地获得测序结果，且测序用时少、效率高、测序结果准确，可重复性好。

利用根据本发明实施例的确定基因组 DNA样品的甲基化位点的方法，能够有效地构建基因组 DNA样品的全基因组甲基化高通量测序文库，并且能够通过高通量测序技术如 Solexa 测序技术实现对文库的准确测序，基于对测序结果的数据分析，就能够准确地确定基因组 DNA样品的甲基化位点，从而实现对基因组 DNA样品的全基因组甲基化检测 , 相对于目前的 RRBS技术，根据本发明实施例的确定基因组 DNA样品的甲基化位点的方法，全基因组的调控区域的覆盖广度得到显著提高，使得调控区域内 CpG位点的覆盖量显著增加。

根据本发明的再一方面，本发明提供了一种用于确定基因组 DNA样品的甲基化位点的装置 1000。参考图 3 , 根据本发明的一个实施例，该装置包括：文库制备单元 100、测序单元 200以及数据分析单元 300。

根据本发明的实施例，文库制备单元 100用于制备基因组 DNA样品的全基因组甲基化高通量测序文库，其中，文库制备单元 100内设置有限制性内切酶 I和第二限制性内切酶。根据本发明的实施例第二限制性内切酶为选自 Bsm I、 HpyCm V、 Alu I、 Hae ΙΠ、 HpyCm II、 Apek l. B m JL TaqaA、 Sph l. Bgl ll. BssS L Sa H I和 " 1的至少一种，优选所述第二限制性内切酶为^ ¾?k l。关于第二限制性内切酶，在前面已经进行了详细描述，不再赞述。由此，文库制备单元 100可以适于实施前面所述的全基因组甲基化高通量测序文库构建方法。

测序单元 200与文库制备单元 100相连，可以从文库制备单元 100接收所制备的全基因组甲基化高通量测序文库，并对所接收的全基因组甲基化高通量测序文库进行测序，从而可以获得测序结果。

数据分析单元 300与测序单元 200相连，可以从测序单元 200接收所获得的测序结果，并且能够进一步对测序结果进行数据分析，从而基于分析结果确定基因组 DNA样品的甲基化位点，最终实现对基因组 DNA样品的全基因组甲基化检测。本领域技术人员能够理解的是，可以釆用本领域中已知的任何适于进行上述操作的装置作为上述各个单元的组成部件。在本文中所使用的术语 "相连 "应作广义理解，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

利用根据本发明实施例的用于确定基因组 DNA样品的甲基化位点的装置，能够方便准确地确定基因组 DNA样品的甲基化位点，从而可以应用于多种针对全基因组甲基化的研究，例如可以用于对人的肿瘤基因抑制基因的甲基化异常的检测，以便为人类疾病的早期诊断提供有效的途径。试剂盒

才居本发明的又一方面，本发明提供了一组分离的限制性内切酶。根据本发明的实施例, 其由 I酶以及第二限制性内切酶构成。根据本发明的实施例，第二限制性内切酶为选自 BstN L HpyCm \, Alu l. Hae ΠΚ HpyCH4 IL Apek l. Ban JL Taqa l. Sph l、 Bglll. BssS I、謂10和 « 1的至少一种，优选所述第二限制性内切酶为^¾^ 1。关于第二限制性内切酶，在前面已经进行了详细描述，不再赘述。根据本发明实施例的 I酶和第二限制性内切酶酶构成的酶切组合，能够有效地对基因组 DNA进行酶切，且酶切获得的 DNA片段非常适用于本发明的构建全基因组甲基化高通量测序文库的方法。该组分离的限制性内切酶的用途及效果，前面已经详细描述，在此不再赘述。

根据本发明的另一方面，本发明提供了一种用于构建全基因组甲基化高通量测序的试剂盒。根据本发明的实施例，该试剂盒包括： Msp I酶，以及第二限制性内切酶。根据本发明的实施例，第二限制性内切酶为选自 fotN L HpyCm Alu l. Hae ΠΚ HpyCm Π, Apek L Ban JL. Taqa L Sph l. Bg! JL BssS L Sa H I和 « I的至少一种，优选所述第二限制性内切酶为^¾^ 1。关于第二限制性内切酶，在前面已经进行了详细描述，不再赞述。本领域的技术人员可以理解，试剂盒中还可以进一步包括构建全基因组甲基化高通量测序文库所需的任何其他组分，在此不再赘述。利用根据本发明实施例的用于构建全基因组甲基化高通量测序文库的试剂盒，能够方便有效地构建基因组 DNA样品的全基因组甲基化高通量测序文库。

需要说明的是，根据本发明实施例的构建全基因组甲基化高通量测序文库的方法及其应用，是本申请的发明人经过艰苦的创造性劳动和优化工作完成的。

下面将结合实施例对本发明的实施方案进行详细描述，但是本领域技术人员将会理解，下列实施例仅用于说明本发明，而不应视为限定本发明的范围。实施例中未注明具体技术或条件的，按照本领域内的文献所描述的技术或牛（例如参考 J.萨姆布鲁克等著，黄培堂等译的《分子克隆实验指南》，第三版，科学出版社）或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者，均为可以通过市购获得的常规产品。

实施例 1:

一、实验呈

1. 使用 p l和^ ¾?K I酶切基因组 DNA:

1.1 p l酶切：釆 p l对 lOOng人源 mDC细胞系全基因组 DNA样品（mDC, 成熟树突状细胞）进行酶切：

1 )在 1.5ml的离心管中配制 Msp I酶切反应体系：

mDC基因组 DNA lOOng 未甲基化的 -DNA(Promega) ( 50pg/ul ) Ιμί 10 x NEB緩冲液 2 ΙΟμί

Msp I (NEB) (100,000单位 /ml ) 5μL·

H₂0 补足至 ΙΟΟμί 总体积 \00μL·

2 )将上述反应体系在 37°C 7j浴中反应 7h。反应完成后，将酶切反应体系置于 80°C下

20min, 使限制性内切酶 p I失活。

1.2 ApeK l酶切:

1 )在限制性内切酶失活的 Msp I酶切反应体系中，直接力。入 5 L eK I(NEB) (4,000单位 /ml)

2 )将反应体系在 75°C水浴进行酶切反应过夜 (16-19h)。

1、向反应体系中加入 l L EDTA ( ImM ), 使限制性内切酶^ ¾?K I失活。

2、用 MiniElute PCR纯化试剂盒（Qiagen)回收反应体系中的 DNA, 用离心纯化柱进行纯化，溶于 42μί Elution緩冲液（EB ) (Qiagen)中。

2. 末端修复：

1)将上一步得到的 DNA按下表在 1.5ml的离心管中配制末端修复反应体系：

酶切后回收纯化的 DNA 40μί

¾0 28 μL·

10 X 多核苷酸激酶緩冲液（Enzymatics) \0μL· dNTPs (Enzymatics) (每种 dNTP均为 10mM ) 6μ

T4 DNA聚合酶（Enzymatics) 6μ

Klenow 片段 (Enzymatics) (稀释 10倍） 4μ

T4 多核苷酸激酶 (Enzymatics) 6μ 总体积 \00μL·

2)将上述反应体系置于 20°C的 Thermomixer(Eppendrf)上，进行反应 30min。反应完后用

MiniElute PCR纯化试剂盒（Qiagen )进行纯化，最后将纯化的产物溶于 34μ1 Elution緩冲液（ EB )。

3. 末端添加石 A:

1 )将上一步得到的 DNA按下表在 1.5 ml的离心管中配制末端添加 A的反应体系：上一步得到的 DNA 32μL·

10 χ blue緩冲液 (Enzymatics) 5μL· dATP (Enzymatics) (ImM) \0μL·

Klenow (3'-5' exo-)(Enzymatics) 3μL· 总体积 50μL·

2)将上述反应体系置于 37°C的 Thermomixer(Eppendrf) , 进行反应 30min。反应完后用

MiniElute PCR纯化试剂盒 Qiagen )进行纯化，最后将纯化的产物溶于 12μί Elution緩冲液

( EB )。

4. 连接甲基化标签接头：

1 )将上一步得到的 DNA按下表配制连接甲基化标签接头的反应体系:

上一步得到的 DNA \0μL·

2 X Rapid连接緩冲液 (Enzymatics) 25μL· 甲基化标签接头 (2μιη)* 3μL·

Η₂0 9μ

Τ4 DNA连接酶 (Rapid, L603-HC-L) (Enzymatics) 3μL· 总体积 50μL·

其中甲基化标签接头序列为：

接头 1 : 5'Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCAC ( SEQ ID NO. l ) 接头 2: 5'TACACTCTTTCCCTACACGACGCTCTTCCGATCT ( SEQ ID NO.2 ) 接头 1和接头 2中的 4 & C均经过甲基化修饰

2)将上述反应体系置于 20°C的 Thermomixer (Eppendrf)上反应 15 min。

5. 片段选择

1 )将上一步得到的样品进行 2%琼脂糖电泳并进行切胶回收，电泳条件为： 100V, 2h。 2 )片段选择大小及范围： 160bp以上，且小于 240bp; 240 bp以上，且小于 340bp; 340bp 以上，且 420 bp以下；或直接回收 160-420bp的片段。

3 )用 QIAquick凝胶提取试剂盒 (Qiagen)分别回收纯化不同大小的片段，并溶于 22μί

Elution緩冲液（EB )。

6. 重亚 A酸盐处理：以 200ng片段化的 λ-DNA作为外源 DNA分别与胶回收的目的片段经重亚石克酸盐共处理。重亚硫酸盐处理釆用 EZ DNAMethylation-Gold Kit™(ZYMO),并按照制造商提供的说明书进行操作 (通过参照将其说明书并入本文；)，具体步骤如下：

1 )制备 CT转换试剂（ CT Conversion Reagent )溶液：从试剂盒中取出 CT转换试剂（固体混合物），分别加入 900μ1水、 50μ1Μ-溶解緩冲液（ M-Dissolving Buffer )和 300μ1 Μ-稀释緩冲液（ M-Dilution Buffer ), 室温下溶解并且震荡 10分钟或在摇床上摇动 10分钟。

2 )M-洗涤緩冲液的制备：向 M-洗涤緩冲液（ M-Wash Buffer )中添加 24ml 100%的乙醇，备用。

3 )将待转换的目的片段 DNA与 λ-DNA的混合物，按照目的片段大小分别加入不同的 PCR管中，若不足 20μ1的则用水补足。

4 )在 PCR管中分别加入 130μ1的 CT转换试剂溶液，轻弹或移液器吹悬混合样品。

5 )将上述 PCR管置于 PCR仪上按以下步骤操作：

98°C持续 5分钟

64 °C持续 2.5小时

完成上述操作后，立刻进行下一步操作或者在 4°C下存储 (最多 20小时) ^用。

6 )将 Zymo-Spin IC™ Column放入收集管（ Collection Tube ) 中，并加入 600μ1 Μ-结合緩冲液（ M-Binding Buffer )。

7 )将重亚 4酸盐处理的样品分别加入到不同的含 M-结合緩冲液的 Zymo-Spin IC™ Column中，加盖颠倒混匀。

8 )全速（>10,000 x g)离心 30秒，弃收集管中的液体。

9 )向柱中加入 ΙΟΟμΙ M-洗涤緩冲液，全速 (>10,000 χ g)离心 30秒，弃收集管中的液体。

10 )向柱中添加 200μ1 M-Desulphonation緩冲液，室温放置 15min, 全速 (>10,000 x g) 离心 30s, 弃收集管中的液体。

11 )向柱中添加 200μ1的 M-洗涤緩冲液，全速 (>10,000 x g)离心 30s, 弃收集管中的液体，并再重复此步骤 1次。

12 )将 Zymo-Spin IC™ Column分别置于新的 1.5ml EP管中，分别加入 12μ1的 Μ-洗脱緩冲液到柱基盾中，室温放置 2min, 全速 (>10,000 x g)离心洗脱 DNA。

7. PCR扩增及文库大小选择：

1 )将上一步得到的 DNA按以下体系配制 PCR反应体系：

重亚^ ^酸盐处理的 DNA ΙΟμΙ dNTP(2.5mM) (Takara) 4μ1

10 x PCR緩冲液 (Sigma) 5ul

JumpStart™ Taq DNA聚合酶 (Sigma) 0.5μ1

PI公用引物 * 1 μΐ 标签 N** Ιμΐ dH₂0 28.5μ1 总体积 50μ1

* 其中， PI 公用引物的序列为:

TCT ( SEQ ID N0.3 )

**标签 Ν的序列为：

CAAGCAGAAGACGGCATACGAGAT mGTGACTGGAGTTCAGACGTGT GCTCTTCCGATCT ( SEQ ID NO 4 ), N为 A、 T、 C、 G四个¾ &的任意组合

PCR反应条件：

94 °C lmin

11-15个循环的以下 3个步骤 *:

94 °C 30 s

58 °C 30 s

72 °C 30 s 72 °C 5min

12V 保持

*针对文库片段的长度，选择不同的循环数目，即如果长度为 160bp以上，且小于 240bp, 则循环数为 11; 如果长度为 240 bp以上，且小于 340bp, 则循环数为 13; 如果长度为 340bp 以上，且 420 bp以下，则循环数为 15。对于^ ^ 160-340bp范围内进一步细分的文库片段，循环数为 13。

2 ) PCR产物经 2%琼脂糖电泳后 ,使用 QIAquick 交提取试剂盒 (Qiagen)分别回收纯化不同大小片段的文库。

8. 文库检测：

使用 Bioanalyzer分析系统 (Agilent, Santa Clara, USA),检测文库插入片段的大小及含量；并利用 Q-PCR精确定量文库的浓度。 9. 测序及数据分析：

经检测，所构建的合格。

按照双末端 90个碱基，在 Hiseq2000测序仪上进行序列分析。通过与现有的 Msp I单酶切 RRBS方法测序数据比较，得出结论：使用 1^ 71和^¾¾ 1双酶切，提高了对靶区域覆盖广度以及区域内 CpG位点的覆盖深度，确定该技术显著优于现有 Msp I单酶切 RRBS技术。

二、实验结果：

1、利用表 1中所列出的酶组合重复前述实验，获得人和小鼠基因组经单酶切和不同的双酶切组合对不同元件的覆盖度，结果示于表 1中。

由上表 1可以看出，人类基因组经 p I和第二限制性内切酶的双酶切与仅经 p I的单酶切相比，对各靶区域内 CpG位点的覆盖均有较大程度的提高，特别是对最近研究发现的肿瘤和组织特异性差异甲基化区域 ( DMR ) 比较集中的元件如： CpG 岛外（CpGshore ) 由约 24%提升到 50%, 启动子由约 38%提升到 55%, 外显子由约 29%提升到 54%, 内含子由约 11%提升到 30%,增强子由约 8%提升到 33%,基因下游 2Kb区域由约 20%提升到 43%等。表 1 数据充分显示 M p l和第二限制性内切酶，尤其是 eK I双酶切技术比目前 M p l单酶切 RRBS技术有显著的进步。

2. 安捷伦 2100生物分析仪检测双酶切 RRBS技术构建不同个数文库的可行性。

在一定测序数据量的基础上，为了获取尽可能多的甲基化信息，发明人选取长度为 40-300bp的插入片段（加上测序接头后，长度显示为 160-420bp ), 并且将文库片段分为 3个长度范围（即： 160bp以上，且小于 240bp; 240 bp以上，且小于 340bp; 340bp以上，且 420 bp以下 )构建文库，以及直接构建一个长度范围 160-240bp的文库。

图 2显示了根据本发明一个实施例的构建的目的片段长度范围不同的全基因组甲基化高通量测序文库的安捷伦 2100检测结果。图 2A显示了根据本发明一个实施例的目的片段长度为 160bp以上，且小于 240bp的全基因组甲基化高通量测序文库的安捷伦 2100检测结果。图 2B显示了根据本发明一个实施例的目的片段长度为 240bp以上，且小于 340bp的全基因组甲基化高通量测序文库的安捷伦 2100检测结果。图 2C显示了根据本发明一个实施例的目的片段长度为 340bp以上，且 420bp以下的全基因组甲基化高通量测序文库的安捷伦 2100 检测结果。图 2D显示了根据本发明一个实施例的目的片段长度为 160bp-420bp的全基因组甲基化高通量测序的安捷伦 2100检测结果。其中，安捷伦 2100检测结果表示的是各个文库的文库片段分布范围。如图 2所示，各个片段长度的文库，其分布范围均与理论值相符。此外，安捷伦 2100结果证明 160-420bp的 ί夸度范围可以直接构建一个文库进行测序也可以分几个 ί夸度范围构建几个文库进行测序。

3. 以 Msp I与 ApeK l双酶切为例， mDC细胞系基因组单酶切与双酶切 RRBS技术产出数据比较

用相同样品 mDC细胞系基因组分别构建 p I单酶切 RRBS和 p I与 ApeK I双酶切的 RRBS文库，测序读长分别为 50PE和 90PE (即双末端 50个¾ &和双末端 90个测序数据量分别约为 7.7G和 9.6G, 下机数据经统计分析结果示于表 2中。如表 2所示，双酶切 RRBS可检测到的 CpG位点数约为 10.5M,而单酶切 RRBS检测到的 CpG位点数仅为 3.8M。

虽然单酶切对 CpG位点的平均测序深度较双酶切对 CpG位点的平均测序深度要高，但相对于检测到 CpG甲基化信息的位点数来讲，双酶切 RRBS成本并没有任何提高，即平均每一个位点的甲基化信息的成本并没有任何提高。但是，双酶切 RRBS可检测到的位点数有数量级的增加，提供的甲基化信息将更加精确 , 而且增加的检测位点主要分布在差异甲基化区域，这表明双酶切 RRBS比单酶切 RRBS技术更有利于分析不同样本间的甲基化差异信息，对于探索甲基化在疾病发生发展过程中所承担的角色提供了一个更有利的工具。

表 2. mDC样品 Msp I单酶切 RRBS与 Msp I和 ApeK I双酶切 RRBS测序数据比较

检测唯一检 CpG 样品起始 _t 片段选择转换率总测序序列唯一比对测序唯一比对 CpG总测 CpG平均覆样品名酶

量（ g) (bp) (%) (M) 序列 (M) 率（％) 数位点数盖深度

(M) (M) (倍） mDC 0.1 Msp l 40-220 >99.2* 153.6 98.7 64.3% 85.5 3.8 22.5 mDC 0.1 sp l和^ pekl 40-300 >99.2* 106.5 71.7 67.3% 73.7 10.5 7.0

*:重亚硫酸盐转换率是根据加入未曱基化的 λ-DNA的转换率进 4ti平估的

4. 单酶切与双酶切 RRBS检测不同元件上 CpG位点

发明人借助生物信息学工具分析了全基因组分别经过 M p I酶切或经过 M p I和 ApeK I 酶切, 选择不同片段跨度后，分析比较不同方法可覆盖到靶区域内的 CpG位点百分比。

同时，发明人 mDC细胞系基因组作为样本，重复前述实验，证明了实际数据与信息预测结果的一致性。并且实验证明，使用 Msp I和 ApeK I双酶切后，不论选择 40-220bp还是选择 40-300bp的跨度范围，在各靶区域内可检测到的 CpG位点数均比单酶切可检测的位点数要多，尤其是在最近研究发现差异甲基化区域分布较多的区域如 CpG岛外、内^^、基因下游调控区域等可检测的位点增加更为显著。在本说明书的描述中，参考术语"一个实施例"、 "一些实施例"、 "示例"、 "具体示例"、或"一些示例"等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

Claims

权利要求书

1、一种构建全基因组甲基化高通量测序文库的方法，其特征在于，包括以下步骤：用 Msp I和第二限制性内切酶对基因组 DNA进行酶切，以便获得 DNA片段，其中所述第二限制性内切酶为选自 Ν Ι、 HpyCm \, Alu l. Hae III. HpyCH4 IL Apek L B m JL Taqa L Sph l. Bg!JL BssS L Sa H I和 " 1的至少一种；

将所述 DNA片段进行末端修复，以便获得经端修复的 DNA片段；

在所述经过末端修复的 DNA片段的 3'末端添加碱基 A, 以便获得具有粘性末端 A的 DNA片段；

将所述具有粘性末端 A的 DNA片段与甲基化接头相连，以便获得具有甲基化接头的连接产物；

将所述具有甲基化接头的连接产物进行片段选择，以便获得目的片段；

将所述目的片段进行重亚石克酸盐处理，以便将所述目的片段中非甲基化的胞嘧啶转换为尿嘧啶，获得经过转换的目的片段；

将所述经过转换的目的片段进行 PCR扩增，以便获得扩增产物；以及

分离纯化所述扩增产物，所述扩增产物构成全基因组甲基化高通量测序文库。

2、根据权利要求 1所述的方法，其特征在于，所述第二限制性内切酶为^ ¾?k l。

3、根据权利要求 1或 2所述的方法，其特征在于，进一步包括从样本中提取基因组 DNA 的步骤。

4、根据权利要求 3 所述的方法，其特征在于，所述样本来源于哺乳动物、植物和微生物的至少一种。

5、根据权利要求 4所述的方法，其特征在于，所述哺乳动物为人和小鼠的至少一种。

6、根据权利要求 1-5任一项所述的方法，其特征在于，所述基因组 DNA为人类全血基因组 DNA。

7、根据权利要求 1-6任一项所述的方法，其特征在于，所述基因组 DNA的量为 150-200ng。

8、根据权利要求 7所述的方法，其特征在于，所述基因组 DNA的量为 100ng。

9、根据权利要求 1-8任一项所述的方法，其特征在于，在将所述 DNA片段进行末端修复前，进一步包括纯化 DNA片段的步骤。

10、根据权利要求 1-9任一项所述的方法，其特征在于，将所述 DNA片段进行末端修利用 Klenow片段、 T4 DNA聚合酶和 T4多核苷酸激酶进行的，其中，所述 Klenow片段具有 5'→3'聚合酶活性和 3'→5'聚合酶活性，但缺少 5'→3'外切酶活性。

11、根据权利要求 1-10任一项所述的方法，其特征在于，将所述经过末端修复的 DNA 片段的 3'末端添加 A是利用 Klenow (3'-5' exo-)进行的。

12、根据权利要求 1-11任一项所述的方法，其特征在于，所述甲基化接头中包含标签。

13、根据权利要求 1-12任一项所述的方法，其特征在于，将所述具有粘性末端 A的 DNA 片段与甲基化接头相连前，进一步包括对接头进行甲基化的步骤。

14、根据权利要求 1-13任一项所述的方法，其特征在于，将所述具有粘性末端 A的 DNA 片段与甲基化接头相连是利用 T4 DNA连接酶进行的。

15、根据权利要求 1-14任一项所述的方法，其特征在于，将所述具有甲基化接头的连接产物进行片段选择，是通过 2%的琼脂糖；交电泳进行的。

16、根据权利要求 1-15 任一项所述的方法，其特征在于，所述目的片段的长度为

160-420bp_o

17、根据权利要求 1-16任一项所述的方法，其特征在于，在将所述目的片段进行重亚硫酸盐处理之前，将所述目的片段与片段化的 λ-DNA混合。

18、根据权利要求 17所述的方法，其特征在于，所述片段化的 λ-DNA的量为 200ng。

19、根据权利要求 1-18任一项所述的方法，其特征在于，将所述目的片段进行重亚硫酸盐处理是釆用 EZ DNAMethylation-Gold Kit™ ( ZYMO )进行的。

20、根据权利要求 1-19任一项所述的方法，其特征在于，所述 PCR扩增使用热启动 taq DNA聚合酶。

21、根据权利要求 20所述的方法，其特征在于，所述热启动 taq DNA聚合酶为！ "-taq聚合酶。

22、根据权利要求 1-21任一项所述的方法，其特征在于，基于所述目的片段的长度，确定所述 PCR扩增的循环数，

其巾，

当所述目的片段的长度为 160bp以上，且小于 240bp时，所述 PCR扩增的循环数为 11;

当所述目的片段的长度为 240bp以上，且小于 340bp时，所述 PCR扩增的循环数为 13; 以及

当所述目的片段的长度为 340bp以上，且 420bp以下时，所述 PCR扩增的循环数为 15。

23、根据权利要求 1-22任一项所述的方法，其特征在于，分离纯化所述扩增产物是通过选自磁珠纯化、纯化柱纯化和 2%的琼脂糖; O交电泳的至少一种进行的。

24、根据权利要求 23所述的方法，其特征在于，分离纯化所述扩增产物是通过 2%的琼脂糖 O交电泳进行的。

25、一种确定基因组 DNA样品的甲基化位点的方法，其特征在于，包括下列步骤：根据权利要求 1-24任一项所述的方法构建所述基因组 DNA样品的全基因组甲基化高通量测序文库；

对所述全基因组甲基化高通量测序文库进行测序，以便得到测序结果；以及

对所述测序结果进行数据分析，以便确定所述基因组 DNA样品的甲基化位点。

26、根据权利要求 25 所述的方法，其特征在于，所述测序是利用高通量测序技术进行的。

27、根据权利要求 26所述的方法，其特征在于，所述测序是通过 Solexa测序平台进行的。

28、一种用于确定基因组 DNA样品的甲基化位点的装置，其特征在于，包括：文库制备单元，所述文库制备单元用于制备基因组 DNA样品的全基因组甲基化高通量测序文库，所述文库制备单元内设置有 p I酶以及第二限制性内切酶，其中，所述第二限制性内切酶为选自 ΝΙ、 HpyCm \, Alul. Hae ΠΚ HpyCH4 IL Apek L BmJL Taqa L Sphl、 Bg!JL BssS L Sa HI和 «1的至少一种；

测序单元，所述测序单元与所述文库制备单元相连，并且从所述文库制备单元接收所述基因组 DNA样品的全基因组甲基化高通量测序文库，以便用于对所述基因组 DNA样品的全基因组甲基化高通量测序文库进行测序，获得测序结果；以及

数据分析单元，所述数据分析单元与所述测序单元相连，并且从所述测序单元接收所述测序结果，以便对所述测序结果进行数据分析，确定所述基因组 DNA样品的甲基化位点。

29、根据权利要求 28所述的装置，其特征在于，所述第二限制性内切酶为^ ¾?kl。

30、一组分离的限制性内切酶，其特征在于，由 pl酶以及^¾¾1酶构成。

31、一种用于构建全基因组甲基化高通量测序文库的试剂盒，其特征在于，包括： pl酶，以及

第二限制性内切酶，

其巾，

所述第二限制性内切酶为选自 ΝΙ、 HpyCm \, Alul. Hae ΙΠ^ HpyCH4 Apek L Ban IL TaqaA、 Sphl. Bglll. BssS L Sa HI和 " I的至少一种。

32、根据权利要求 31所述的试剂盒，其特征在于，所述第二限制性内切酶为^ ¾?kl。