CN116287166A

CN116287166A - 甲基化测序接头及其应用

Info

Publication number: CN116287166A
Application number: CN202310422311.6A
Authority: CN
Inventors: 余丽萍; 冀长泉; 吴强
Original assignee: Naonda Nanjing Biological Technology Co ltd
Current assignee: Naonda Nanjing Biological Technology Co ltd
Priority date: 2023-04-19
Filing date: 2023-04-19
Publication date: 2023-06-23

Abstract

本文提供了测序接头，其中至少一个胞嘧啶碱基为5‑羟甲基胞嘧啶(5hmC)。本文还提供了该测序接头在DNA甲基化检测中的应用。

Description

甲基化测序接头及其应用

技术领域

本文涉及测序接头，尤其是包括甲基化胞嘧啶的测序接头。本文还涉及该测序接头在DNA甲基化检测中的应用。

背景技术

DNA化学修饰为DNA序列编码基因的表达增加了一层调控机制。这些化学修饰中，研究得最透彻的是5-甲基胞嘧啶(5mC)，5mC这种表观遗传修饰，广泛存在于植物、动物等真核生物基因组中,称誉为“第五碱基”；5mC最初被发现位于CpG岛内，CpG岛是富含CpG二核苷酸的基因启动子区域常见的一段DNA片段。在这些启动子区域内，5mC充当了一种抑制基因转录稳定表观遗传标记的角色。

DNA甲基化与很多生理的、病理的因素相关，承载着大量生物学信息。随着NGS技术的发展，我们可以从全基因组层面分析DNA甲基化状态。甲基化测序方法种类繁多，重亚硫酸氢盐转化是甲基化测序的金标准，但是高温高盐的转化条件对样本造成较大损伤，基于酶转化模块的甲基化测序方法成为大家关注的热点。

发明内容

在一方面，本文提供了测序接头，其中至少一个胞嘧啶碱基为5-羟甲基胞嘧啶(5hmC)、5-甲酰基化胞嘧啶(5fC)或5-羧基化胞嘧啶(5caC)。

在一些实施方案中，所述测序接头中全部胞嘧啶碱基均为5hmC、5fC或5caC。

另一方面，本文提供了甲基化测序文库，其包括上述测序接头。

另一方面，本文提供了甲基化测序试剂盒，其包括上述测序接头。

在一些实施方案中，所述甲基化测序试剂盒还包括胞嘧啶脱氨酶，其中所述胞嘧啶脱氨酶不导致5fmC、5fC或5caC脱氨基。

在一些实施方案中，所述胞嘧啶脱氨酶为APOBEC，优选APOBEC3A。

另一方面，本文提供了上述测序接头在DNA甲基化检测中的应用。

另一方面，本文提供了提高甲基化测序文库建库效率的方法，其包括使用上述测序接头或甲基化测序试剂盒。

另一方面，本文提供了评估第一甲基化测序接头在DNA甲基化检测中是否发生转化的方法，包括在添加有所述甲基化测序接头的DNA分子上添加第二甲基化测序接头，以便对所述第一甲基化测序接头在转化后进行测序；优选地，所述第一甲基化测序接头和所述第二甲基化测序接头分别适用于不同的测序平台，如所述第一甲基化测序接头适用于Illumina平台，所述第二甲基化测序接头适用于MGI平台。

在一些实施方案中，所述第一甲基化测序接头和/或所述第二甲基化测序接头为前文所述测序接头。

附图说明

图1为甲基化文库构建流程示意图。

图2显示了C碱基甲基化修饰单体结构式。(A)5mC甲基化修饰单体结构式；(B)5hmC甲基化修饰单体结构式。

图3显示了甲基化接头，接头修饰示意图。接头序列中C碱基采用不同的甲基化单体。

图4显示了建库结果数据。(A)建库产量；(B)[Target]Average depth-[中靶]平均深度；(C)[Target]Average depth(rmdup)-[中靶]平均深度[去重]

图5显示了甲基化接头中C碱基过度转化的比例。(A)5mC修饰的C碱基，同一位点C碱基被转化成U碱基的比例；(B)5hmC修饰的C碱基，同一位点C碱基被转化成U的比例。

图6以条形图显示了图5中同一位点C碱基被转化成U的百分比结果。

具体实施方式

除非另有说明，本文使用的所有技术和科学术语具有本领域普通技术人员所通常理解的含义。

“DNA甲基化”在本文中指DNA分子或DNA片段中胞嘧啶碱基被修饰为5-甲基胞嘧啶(5mC)。脊椎动物中的DNA甲基化一般发生在CpG位点(即DNA序列中胞嘧啶后紧连鸟嘌呤的位点)，经DNA甲基转移酶催化将胞嘧啶转化为5-甲基胞嘧啶。人类基因组中大多CpG位点已被甲基化，但是在某些特定区域，如富含胞嘧啶(C)和鸟嘌呤(G)的CpG岛则通常未被甲基化。CpG甲基化可影响相关基因的转录活性，例如，甲基化可抑制抑癌基因，而去甲基化则刺激某些癌基因的表达，这些情况下都有可能导致癌症发生。另外，尽管发生率低于5mC，也有少数胞嘧啶碱基被修饰为5-羟甲基胞嘧啶(5hmC)、5-甲酰基化胞嘧啶(5fC)、5-羧基化胞嘧啶(5caC)。本文中提到甲基化时，也可以指修饰为5hmC、5fC、5caC，除非上下文另有说明。

“甲基化测序”在本文中指通过测序来了解DNA分子或DNA片段中的胞嘧啶的甲基化状况，包括但不限于，甲基化位点、甲基化水平、甲基化方式(5mC或5hmC)等。可通过多种方式来检测一个胞嘧啶位点是否被甲基化。常用方法包括化学或酶转化法，在转化过程中甲基化胞嘧啶和未甲基的胞嘧啶中的一种转化为尿嘧啶(U)或者在碱基配对方式上基本上等同于尿嘧啶的碱基(例如二氢尿嘧啶，DHU)。在随后的扩增过程中，对应的尿嘧啶作为胸腺嘧啶(T)与腺嘌呤(A)配对，最终结果是该甲基化位点的胞嘧啶或甲基化胞嘧啶在检测结果(如测序结果)中以胸腺嘧啶体现出来。通过与参考序列对比，就能够确定DNA分子或DNA片段中的胞嘧啶是否被甲基化。该参考序列可以为来自相同样品但不经上述转化的序列，或者健康群体中的对应序列。另外，如下文有描述的，还可通过一些方法来对5mC和5hmC进行区分。目前，已经将DNA甲基化信息广泛用于癌症(例如，肺癌、乳腺癌、肝癌、结直肠癌等)筛查和诊断中，尤其是早期筛查和诊断。

“测序接头”在本文中指在DNA或RNA测序过程中使用的已知序列的短片段DNA或RNA，用于在样本中待测DNA或RNA的末端添加特定的序列，以便将其固定在测序仪的载体上。测序接头的一个重要作用是连接DNA或RNA分子到测序仪的载体上，并标记起始和终止点，以便在测序过程中识别并确定序列。在Illumina测序中，测序接头通常是一对短序列，称为“P5”和“P7”接头，每个都通常包括与流动池上固定的寡核苷酸单链链相同或互补的片段(P5和P7)、用于区分不同样本的Index序列以及测序引物结合部分(Rd1 SP和Rd2 SP)。这样，测序文库中的每个DNA片段都可以在测序过程中被复制和扩增，并且被准确地识别和测序。根据Index位置的不同，接头可以分为单端和双端Index接头。单端Index接头只在P7端存在Index序列，双端Index接头在P5和P7两端均存在Index序列。一般而言，Index序列的碱基数为6nt-10nt。接头还可以分为长接头(例如完整的Y型)和短接头(例如不完整的Y型接头)。长接头通过TA连接的方式连接到待测DNA片段两端，在文库产量足够的情况下，可不进行PCR扩增直接上机测序；而短接头通过TA连接的方式连接到待测DNA片段两端后，必须使用与短接头互补的Indexing Primers进行PCR扩增成为完整接头后，才能上机测序。另外，测序接头中还可以包括UDI(Unique dual Index)序列以克服标签跳跃问题或包括UMI(Unique Molecular Identifiers)序列以剔除扩增或测序错误。除了Illumina，其他测序平台也使用各种类型的测序接头，包括Roche/454、Ion Torrent、Pacific Biosciences、MGI等。这些不同的平台可能使用不同的测序技术和接头设计，但都涵盖在本文的测序接头范围内。

“甲基化测序接头”，或称为“甲基化修饰接头”，指用于检测样本中DNA甲基化情况的测序接头。甲基化测序接头中的胞嘧啶碱基可以被修饰，如甲基化，以便在后续胞嘧啶转化过程中保持序列不变。

“酶转化”在本文中指借助于特定酶(如胞嘧啶脱氨酶)的催化作用对胞嘧啶或甲基化胞嘧啶进行修饰，以便在随后的检测中可区分其甲基化和未甲基化状态，或者区分5mC和5hmC。本领域已知一些酶学转化方法，包括，例如但不限于，EM-seq转化法和TAPS转化法。酶转化中通常将这些酶与一些化学试剂配合使用。“转化”在本文中指包括酶转化在内的各种转化手段，例如还包括化学转化法，如亚硫酸氢盐处理。

本文中甲基化文库的构建流程参见图1。该流程适用于基因组DNA及血浆游离DNA的甲基化文库构建。现对该流程简述如下：基因组DNA使用超声打断的方式，打断至200-250bp的DNA片段；对打断后的基因组DNA或cfDNA进行末端修复、甲基化接头连接，接头连接产物的转化，使用NEB的酶转化模块(NEBNext Enzymatic Conversion module)，将未甲基化的C碱基转化成U碱基，使用能够识别U碱基的扩增酶(KAPA HiFi HotStart Uracil Mix)进行PCR扩增，Qubit定量试剂对甲基化文库进行定量。该流程所用接头为甲基化修饰接头，本文对该甲基化修饰接头中C碱基的修饰形式进行研究，发现C碱基修饰类型影响所构建甲基化文库的建库效率。

甲基化接头示意图参见图3，接头序列中所用的C碱基发生了甲基化修饰，若采用非甲基化修饰的接头，转化过程中会将C碱基转化成U碱基，PCR扩增后U碱基会复制成为T碱基。接头序列改变会导致PCR扩增失败以及下游测序失败。采用双链建库方案构建甲基化文库时，会使用重压硫酸氢盐或者是酶转化模块对接头连接产物进行转化，所用接头必须是甲基化修饰的接头。针对不同转化模块，工作原理不同，所采用的甲基化修饰接头类型也会有差异。采用BS转化模块，常规的5mC修饰类型即可。重亚硫酸氢盐会通过磺化以及脱氨基两步反应对非甲基化修饰的C碱基转化成U碱基，5mC修饰的C碱基不会发生改变。NEB的酶转化模块使用TET2和氧化增强剂来保护修饰后的胞嘧啶免受下游去甲基化的影响。TET2通过级联反应将5-甲基胞嘧啶(5mC)和5-羟甲基胞嘧啶(5hmC)氧化成5-羧甲基胞嘧啶(5caC)。这样可以保护5mC和5hmC免受去甲基化的影响。5hmC也可以通过使用氧化增强剂进行葡萄糖基化形成5ghmc来保护免受去甲基化的影响。5-甲基胞嘧啶(5mC)和5-羟甲基胞嘧啶(5hmC)的结构见图2A和2B。第二个酶促步骤使用APOBEC脱氨基胞嘧啶形成U，但是没有影响5caC和5ghmC的状态。我们意外地发现针对EM转化模块，C碱基修饰类型，直接影响构建的甲基化接头的性能。若接头中的C碱基采用5mC进行修饰，使用EM转化模块时C碱基氧化不完全，APOBEC会将氧化不完全的C碱基转化成U，导致接头序列发生改变，从而导致PCR扩增过程中Index引物无法结合到接头序列，建库效率偏低，这是测序引物无法结合到相应的位点，导致测序失败，从而导致测序产出偏低。本文所选择的甲基化接头使用5hmC修饰(图2B)，氧化更完全，选择该碱基修饰的甲基化接头，搭配EM转化模块构建甲基化文库时，其建库效率更高。

本研究通过优化甲基化接头的修饰方案，提高了酶转化方案的甲基化文库建库效率，提高甲基化文库的数据利用率。尤其是，本文提供一种甲基化修饰接头，接头中的C碱基采用5hmC修饰，而不是传统的5mC修饰，这种修饰方式更适用于酶转化模块，提高建库效率。其次，本文通过针对甲基化修饰的文库添加一种其他测序平台的接头，用来评估转化后甲基化接头的完整性。

以下通过实施例来进一步说明本发明。

实施例1

使用两种甲基化修饰的接头(分别包括5mC和5hmC)构建文库，对构建的文库进行杂交捕获，比较不同接头建库效率差异。

具体实验步骤如下。

甲基化文库的构建：基因组DNA使用超声打断的方式，打断至200～250bp的DNA片段；取50ng打断后的样本，使用

甲基化文库构建试剂盒(for/>

)#1002141构建甲基化文库。对打断后的基因组DNA(或cfDNA)进行末端修复、甲基化接头连接(采用两种不同类型的甲基化修饰形式)(图2和3)，接头连接产物的转化(按试剂盒说明书操作)，使用NEB的酶转化模块(NEBNext Enzymatic Conversion module，简称EM模块)，将未甲基化的C碱基转化成U碱基，使用能够识别U碱基的扩增酶(2X HiFi-Methyl PCR Master Mix)进行PCR扩增，扩增循环数为5，Qubit定量试剂对甲基化文库进行定量，取500ng甲基化文库进行杂交捕获。杂交捕获试剂盒为/>

Hybrid Capture Reagents(#1005102)；靶向甲基化文库的构建过程主要包括：甲基化文库混合、浓缩，甲基化文库杂交，甲基化文库热洗脱，甲基化文库常温洗脱，靶向甲基化文库扩增和靶向甲基化文库纯化。纯化完成的靶向甲基化文库即可用于下游测序。

本实施例所用接头为两种类型甲基化接头：方案一，5mC修饰的甲基化接头；方案二，5hmC修饰的甲基化接头。通过建库产量以及建库产物中分析到的有效文库信息两个层面进行评估。

I5--ACACTCTTTCCCTACACGACGCTCTTCCGATC*T(SEQ ID NO：1)

I7--GATCGGAAGAGCACACGTCTGAACTCCAGT*C(SEQ ID NO：2)

*硫代修饰

实验结果参见图4A-4C。当采用所用5hmC甲基化接头建库时(合成甲基化接头序列时，使用5hmC单体原料)，相对于5mC甲基化接头(合成甲基化接头序列时，使用5mC单体原料)，能够提高文库产量，杂交捕获文库原始深度以及去重后的深度均高于5mC修饰的甲基化接头实验组。

实施例2

转化后文库中甲基化接头的完整性比较。

针对实施例1中构建的甲基化文库，加MGI测序平台的接头，构建MGI平台文库，送MGI-Seq2000测序仪进行测序。对文库中Illumina接头序列进行测序，通过分析甲基化接头序列，评估不同修饰类型甲基化接头在转化的过程中是否存在过度转化(即)的现象。具体分析结果参见图5A、5B和图6。图5中红色框代表该位点C碱基转化为U碱基。实验结果表明，使用5hmC修饰的甲基化接头，C碱基被过度转化的比例较低，使用5mC修饰的甲基化接头，C碱基被转化成U碱基的比例较高。

因此采用的甲基化修饰方式(采用5hmC替代5mC)，能够提高甲基化文库的建库效率，是一种更优的甲基化接头修饰方案。

Claims

1.测序接头，其中至少一个胞嘧啶碱基为5-羟甲基胞嘧啶(5hmC)、5-甲酰基化胞嘧啶(5fC)或5-羧基化胞嘧啶(5caC)。

2.如权利要求1所述的测序接头，其中全部胞嘧啶碱基均为5hmC、5fC或5caC。

3.甲基化测序文库，包括权利要求1或2所述的测序接头。

4.甲基化测序试剂盒，包括权利要求1或2所述的测序接头。

5.如权利要求4所述的甲基化测序试剂盒，还包括胞嘧啶脱氨酶，其中所述胞嘧啶脱氨酶不导致5fmC、5fC或5caC脱氨基。

6.如权利要求4或5所述的甲基化测序试剂盒，其中所述胞嘧啶脱氨酶为APOBEC，优选APOBEC3A。

7.权利要求1或2所述的测序接头在DNA甲基化检测中的应用。

8.提高甲基化测序文库建库效率的方法，包括使用权利要求1或2所述的测序接头或权利要求4-6任一项所述的甲基化测序试剂盒。

9.评估第一甲基化测序接头在DNA甲基化检测中是否发生转化的方法，包括在添加有所述甲基化测序接头的DNA分子上添加第二测序接头，以便对所述第一甲基化测序接头在转化后进行测序；优选地，所述第一甲基化测序接头和所述第二甲基化测序接头分别适用于不同的测序平台，如所述第一甲基化测序接头适用于Illumina平台，所述第二测序接头适用于MGI平台。

10.如权利要求9所述的方法，其中所述第一甲基化测序接头和/或所述第二测序接头为权利要求1或2所述的测序接头。