CN115992203B - 一种全基因组羟甲基化捕获测序的文库构建方法 - Google Patents

一种全基因组羟甲基化捕获测序的文库构建方法 Download PDF

Info

Publication number
CN115992203B
CN115992203B CN202210882962.9A CN202210882962A CN115992203B CN 115992203 B CN115992203 B CN 115992203B CN 202210882962 A CN202210882962 A CN 202210882962A CN 115992203 B CN115992203 B CN 115992203B
Authority
CN
China
Prior art keywords
capture
dna
library
washing
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210882962.9A
Other languages
English (en)
Other versions
CN115992203A (zh
Inventor
陈清
薛添香
张�杰
孙银狐
李志文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SANGON BIOTECH (SHANGHAI) CO Ltd
Original Assignee
SANGON BIOTECH (SHANGHAI) CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SANGON BIOTECH (SHANGHAI) CO Ltd filed Critical SANGON BIOTECH (SHANGHAI) CO Ltd
Priority to CN202210882962.9A priority Critical patent/CN115992203B/zh
Publication of CN115992203A publication Critical patent/CN115992203A/zh
Application granted granted Critical
Publication of CN115992203B publication Critical patent/CN115992203B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种全基因组羟甲基化捕获测序的文库构建方法,涉及基因组学、表观遗传学和分子生物学技术领域。捕获处理包括:将糖基化标记的生物样品进行点击化学反应,经进行片段化处理、纯化,然后进行捕获和捕获后清洗。该方法具有低假阳性率、高可信度、高捕获率的技术优势。该方法能为科研院校和临床研究提供更真实的预测结果,减少试错次数,提升工作效率,加快研究步伐。

Description

一种全基因组羟甲基化捕获测序的文库构建方法
技术领域
本发明涉及基因组学、表观遗传学和分子生物学技术领域,具体而言,涉及一种全基因组羟甲基化捕获测序的文库构建方法。
背景技术
表观遗传学修饰是指非基因序列改变导致的基因表达水平的变化,包括DNA甲基化、组蛋白修饰、非编码RNA和基因组印迹等。这些表观遗传学改变通过开放或关闭某些特定基因,在胚胎发育、细胞分化、组织特异性蛋白表达、维持基因组完整性和染色体稳定性等方面发挥重要作用。
其中,DNA羟甲基化修饰(5-hydroxymethylcytosine,5hmC)作为表观遗传学的重要组成,是在DNA甲基化改变的基础上,在胞嘧啶第五位碳原子的甲基基团上增加一个羟基生成5hmC而完成DNA的去甲基化过程。2009年,Rao和Heintz分别报道在不同类型的细胞和组织中5hmC修饰水平存在显著差异,其中在人、小鼠大脑及胚胎干细胞中表达丰富,它可能通过影响染色质结构和局部转录活性而参与基因调控。5hmC在肺癌、脑癌、肝癌、肾癌、皮肤癌、前列腺癌、乳腺癌和结肠癌等多种癌症中的含量均有显著降低,表明5hmC在癌症发展中发挥重要作用。此外,骨髓增生异常综合征、亨廷顿病和阿尔茨海默病也被发现与异常5hmC分布存在关联性。因此,5hmC不仅是去甲基化过程的关键中间体,也是疾病诊断、治疗和预后的重要生物标志物。5hmC的超灵敏检测能够为理解疾病发展的表观遗传规律和疾病早期诊断提供有力支持。
了解5hmC在基因组DNA中的分布是更好阐明5hmC的生物学特性的基础。目前已有的基于亚硫酸氢盐的方法如OxBS-seq、TAB-seq,能够在单碱基分辨率上检测5hmC,为科学和疾病研究提供了较全面和精确的定量信息。然而,OxBS-seq和TAB-seq两种方法都是基于全基因组测序,而想要达到分析需求测序深度至少达到30×,使得这些检测方法价格异常昂贵。同时氧化和亚硫酸氢盐处理也会导致基因组DNA的大量损失,限制了它们在有限样品下的研究实用性。相比之下,基于富集的分析方法在降低测序深度的同时也降低了测序成本。
使用较广泛的富集方法有两种,一种是特异性抗体捕获,另一种是特异性的化学标记捕获。其中抗体价格昂贵,并具有位点偏好性,易于与5hmC丰富度高的CpG位置的序列结合,对5hmC分布稀疏的序列结合性差,这种序列偏好导致富集率降低。而羟甲基化学标记捕获方法最初由芝加哥大学何川教授开创并发表,其流程主要包括:1)DNA样本片段化,2)末端修复加“A”,3)接头连接,4)纯化,5)5hmC标记及点击化学反应,6)亲和富集,7)PCR扩增。该方法经过5年的优化,现已将传统的物理打断改为用时少、操作方便的酶切打断;但文库富集扩增步骤仍采用传统带磁珠扩增法,这样导致假阳性率高,也因此需要更高的初始投入量。
有文献报道,将DBCO-PEG4-Biotin换成DBCO-PEG3-S-S-Biotin(如下简称DBCO-S-S-Biotin),可以通过DTT还原二硫键,将结合在核酸链上的大分子biotin和磁珠在非PCR扩增的情况下切除,实现捕获片段无磁珠扩增,该方法已被应用在羟甲基化捕获测序中。使用DBCO-S-S-Biotin和DTT还原可以实现无磁珠扩增,但其捕获假阳性率依旧高达10%,这对捕获测序是非常“致命的”。
鉴于此,特提出本发明。
发明内容
本发明的目的在于提供一种全基因组羟甲基化捕获测序的文库构建方法以有效降低假阳性率。
发明人发现造成现有的羟甲基化学标记捕获方法假阳性率高的原因是:由于文库富集扩增步骤仍采用传统带磁珠扩增法,这会使得缠绕在磁珠上的非靶向捕获的片段也大量扩增,假阳性率高,也因此需要更高的初始投入量。而有鉴于现有的点击化学反应仍然存在捕获假阳性率高达20%的问题。为改变此弊端,发明人首先同时构建阴性对照文库(不加糖基转移酶的处理方式),并对实验样本和对照样本的数据进行个性化处理,最终能够将假阳性率降至3%左右。但该操作对实验人员的操作水平依赖性较高、成本大,同时测序数据分析方法因人而异,不具有通用性。
发明人对捕获建库流程进行一系列改进,最终实现无需阴性对照便可将假阳性率降到1.5%以内;同时该方法流程可做到1 ng级别的微量捕获建库。
具体地,本发明是这样实现的:
本发明提供了一种对用于构建羟甲基化测序文库的生物样品进行捕获前的处理的方法,包括:将糖基化标记的生物样品进行点击化学反应,经进行片段化处理,然后进行纯化。
高假阳性率是捕获测序方法的通病。经测试与摸索,非羟甲基化修饰的片段主要缠绕在捕获的DNA分子、DBCO-PEG3-S-S-Biotin(如下均简称DBCO-S-S-Biotin)和捕获磁珠上。发明人通过如下方式降低了捕获假阳性率:1)将基因组片段化步骤置于点击化学步骤之后,通过片段化操作可以将捕获体系(即经过点击化学反应后的反应产物)中多余的大分子DBCO-S-S-Biotin和未被标记的DNA片段与成功标记的DNA分子在空间上得以一定程度的分离,发明人发现这样的操作对降低捕获假阳性率立竿见影;2)打断后的纯化步骤,可以继续将上述空间上具有一定分离程度的多余的大分子DBCO-S-S-Biotin进行有效去除,从而大幅降低了非羟甲基化修饰的片段与多余的DBCO-S-S-Biotin缠绕的可能性,进而初步从根本上有效降低了假阳性率;3)捕获后用清洗缓冲液清洗后,增加水洗流程,去掉体系中未被捕获的核酸片段。
此外,本发明提供的方法具有高捕获率,通过MACS鉴定和宽峰broad方法模型进行peak预测发现,本发明在低捕获假阳性率的情况下,能够捕获到更多的5hmC位点。
本发明提供的方法具有高可信度,本发明能够捕获到更多聚集在转录起始位点附近的含5hmC位点的片段,这也与文献报道一致,证明本发明捕获数据具有更高的可信度,因此,该方法能为科研院校和临床研究提供更真实的预测结果,减少试错次数,提升工作效率,加快研究步伐。
在本发明应用较佳的实施方式中,片段化处理是指通过超声打断仪进行片段化。而酶切打断无法实现降低假阳性。
发明人发现,在进行超声打断时,可以借助打断仪的超声波将捕获体系中多余的大分子DBCO-S-S-Biotin和未被标记的DNA片段“荡开”,该“不起眼”的操作对降低捕获假阳性率立竿见影;而后续的打断后纯化步骤,通过使用纯化将打断过程中“荡下”的DBCO-S-S-Biotin有效去除。
在一种可选的实施方式中,片段化的时间为15-38 min。例如15-35min,或20-30min,或25-38min。在上述片段化时间内有助于更好地将多余的大分子DBCO-S-S-Biotin和未被标记的DNA片段“荡开”,从而更好地减少非羟甲基化修饰的片段的残留,从而大幅降低了非羟甲基化修饰的片段的扩增,进而从根本上有效降低了假阳性率。
在一种可选的实施方式中,片段化的时间为38 min,在一种可选的实施方式中,片段化后的片段范围为200-500 bp。
在一种可选的实施方式中,片段化之后还包括纯化步骤。去除荡开”的多余的大分子DBCO-S-S-Biotin。
在本发明应用较佳的实施方式中,上述生物样品为基因组DNA。
生物样品来源于动物、植物、微生物。
在一种可选的实施方式中,基因组DNA的初始上样量为1ng-200 ng。在其他实施方式中,上述基因组DNA的初始上样量也可以是10-200 ng,或50-200 ng,或100-200 ng。本发明通过上述方法的改进,可以有效去除非目标片段,降低捕获假阳性率和提高扩增有效性,使得微量基因组DNA捕获建库得以实现,初始基因组DNA投入量可低至1 ng。经测试,增加测序深度,可在很大程度上弥补低初始上样量的不足。这对于微量DNA或痕量DNA样本的羟甲基化测序文库构建具有积极的意义。
在一种可选的实施方式中,基因组DNA的初始上样量为50-200 ng。
在本发明应用较佳的实施方式中,点击化学反应是指将糖基化标记的生物样品与DBCO-S-S-Biotin或DBCO-PEG4-Biotin按照20-30:1的体积比混合孵育。发明人发现,在上述混合比下,具有较好的标记效率。
在一种可选的实施方式中,混合孵育条件是37℃±1℃孵育1-2h。
例如在24 μL标记产物中加入1 μL DBCO-S-S-Biotin,37℃孵育2 h。
在本发明应用较佳的实施方式中,片段化处理之后的纯化是采用普通的纯化磁珠进行纯化。采用磁珠纯化具有较好的降低假阳性效果。
在一种可选的实施方式中,捕获后清洗是先进行清洗液清洗,然后进行水洗。通过捕获后的清洗步骤能够有效地将捕获体系中缠绕在DNA-Biotin-Bead复合物上的非捕获DNA片段洗脱并去除。
在一种可选的实施方式中,捕获是采用链酶亲和素标记的磁珠与片段化处理后的产物混合,进行磁珠捕获。
链酶亲和素磁珠与biotin结合pull down 含有5hmC位点的片段:取25 μL末端修复后的基因组DNA,加入清洗并用25 μL 2×B&W Buffer重悬后的捕获磁珠,混匀后室温孵育30 min进行捕获。
本发明整个流程中对非目标片段的有效去除,最终使得假阳性率由20%以上降低1.5%以内,并且无需构建阴性对照文库。
在一种可选的实施方式中,清洗是指使用清洗缓冲液清洗磁珠1-5次,然后用水清洗磁珠1-5次。发明人发现,增设水洗步骤可以进一步地提高对非目标片段的去除效果,最终使得假阳性率进一步降低。
在一种可选的实施方式中,清洗是指使用清洗缓冲液清洗磁珠1-3次,然后用水清洗磁珠1-3次。在一些实施方式中,上述清洗的次数也可根据需要进行自适应调整,并不限于上述的次数。
在一种可选的实施方式中,清洗缓冲液包括Tris-HCl、EDTA和NaCl,在一种可选的实施方式中,缓冲液中含5-10 mM的Tris-HCl、0.5-1 mM的EDTA和1-2 M的NaCl。
在一种可选的实施方式中,上述清洗是采用100 μL ddH2O进行清洗。
在本发明应用较佳的实施方式中,糖基化标记包括将生物样品与标记缓冲液、糖基转移酶混合孵育;
在一种可选的实施方式中,糖基转移酶选自如下糖基转移酶中的至少一种:半乳糖基转移酶、葡糖基转移酶、唾液酰转移酶、N-乙酰葡糖胺转移酶和岩藻糖基转移酶;
在一种可选的实施方式中,糖基转移酶选自以下中的至少一种:β-1,3-N-乙酰葡糖胺转移酶、β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、β-1,6-半乳糖基转移酶、α-2,3-唾液酰转移酶、α-2,6-唾液酰转移酶、α-1,2-岩藻糖基转移酶、T4 噬菌体 β-葡糖基转移酶(T4-βGT)、UDP-葡萄糖醛酸转移酶和α-1,3-岩藻糖基转移酶。
在一种可选的实施方式中,糖基转移酶选自 T4 噬菌体 β-葡糖基转移酶(T4-βGT)。UDP-6-N3-Glu可以特异性识别糖基化,并使其能进一步被生物素标记。
本发明的葡糖基转移酶可以是“前体”、“未成熟”或“全长”的,在这种情况下,它们包含信号序列;或“成熟”的,在这种情况下,它们缺乏信号序列。成熟形式的多肽通常是最有用的。只要所得的多肽保留葡糖基转移酶活性,本发明的葡糖基转移酶多肽也可被截短以去除N-末端或C-末端。
本发明的葡糖基转移酶可以是“嵌合”或“杂合”多肽,因为其包括第一葡糖基转移酶多肽的至少一部分和第二葡糖基转移酶多肽的至少一部分。本发明的葡糖基转移酶多肽可进一步包括异源信号序列,即允许跟踪或纯化等的表位。示例性异源信号序列来自地衣芽孢杆菌(B.licheniformis)淀粉酶(LAT)、枯草芽孢杆菌(B.subtilis)(AmyE或AprE)、和链霉菌属(Streptomyces)CelA。
葡糖基转移酶的产生
本发明的葡糖基转移酶可以在宿主细胞中产生,例如通过分泌或细胞内表达。在将葡糖基转移酶分泌到细胞培养基中后,可以获得包含葡糖基转移酶的培养细胞材料(例如,全细胞培养液)。任选地,葡糖基转移酶可以从宿主细胞中分离,或甚至从细胞培养液中分离,这取决于最终葡糖基转移酶所需的纯度。可以根据本领域熟知的方法克隆和表达编码葡糖基转移酶的基因。合适的宿主细胞包括细菌、真菌(包括酵母和丝状真菌)和植物细胞(包括藻类)。特别有用的宿主细胞包括黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)或里氏木霉(Trichoderma reesei)。其他宿主细胞包括细菌细胞,例如枯草芽孢杆菌(Bacillus subtilis)或地衣芽孢杆菌(B.licheniformis),以及链霉菌属(Streptomyces)和大肠杆菌(E.Coli)。
宿主细胞还可以表达编码同源或异源葡糖基转移酶(即,与宿主细胞不同物种的葡糖基转移酶)或一种或多种其他酶的核酸。葡糖基转移酶可以是变体葡糖基转移酶。另外,宿主可以表达一种或多种辅酶、蛋白质、肽。
在一种可选的实施方式中,混合孵育是在37℃±1℃孵育1-2h;
在一种可选的实施方式中,标记缓冲液选自HEPES,在一种可选的实施方式中,标记缓冲液的终浓度为0.5-1 M。
在其他实施方式中,上述标记缓冲液也可以是磷酸盐、咪唑-HCl、4-吗啉乙磺酸(MES);双(2-羟乙基)-氨基-三(羟甲基)甲烷(bis-Tris);N-(2-乙酰氨基)亚氨基二乙酸;N-(2-乙酰氨基)-2-氨基乙磺酸;1,4-哌嗪二乙磺酸;3-吗啉基-2-羟基丙磺酸(MOPSO);1,3-双[三(羟甲基)甲基-氨基]丙烷;N,N-双(2-羟乙基)-2-氨基乙磺酸;4-吗啉丙磺酸(MOPS);2-[(2-羟基-1,1-双(羟甲基)乙基)-氨基]乙磺酸;4-(2-羟乙基)哌嗪-1-乙磺酸(HEPES);3-(N,N-双[2-羟乙基]氨基)-2-羟基丙磺酸;4-(N-吗啉基)丁磺酸;2-羟基-3-[三(羟甲基)甲基氨基]-1-丙磺酸;三(羟甲基)氨基甲烷;哌嗪-N,N′-双(2-羟基丙磺酸);4-(2-羟乙基)-1-哌嗪丙磺酸;N-[三(羟甲基)甲基]甘氨酸;二甘氨酸;N,N-双(2-羟乙基)-甘氨酸;N-(2-羟乙基)哌嗪-N′-(4-丁磺酸);N-[三(羟甲基)-甲基]-3-氨基丙磺酸;N-(1,1-二甲基-2-羟乙基)-3-氨基-2-羟基丙磺酸;2-(环己基氨基)-乙磺酸;3-(环己基氨基)-2-羟基-1-丙磺酸;2-氨基-2-甲基-2-丙醇;碳酸钠-碳酸氢钠;3-(环己基氨基)-1-丙磺酸;和4-(环己基氨基)-1-丁磺酸。
在一种可选的实施方式中,混合孵育时,还在混合液中添加有氯化镁,氯化镁终浓度为0.5-1 M。
本发明还提供了一种全基因组羟甲基化捕获测序的文库构建方法,其包括如下步骤:
将上述的方法纯化后的产物进行清洗后,进行DNA末端修复,然后进行接头连接,还原反应后,进行文库的扩增。
羟甲基化捕获测序虽不能实现单碱基精确度,但因其数据量远少于OxBS-seq、TAB-seq等方法,所以更适用于科研领域大样本数据关联分析。本发明提供的文库构建方法具有低捕获假阳性率、高捕获率、高可信度和低上样量。该方法能为科研院校和临床研究提供更真实的预测结果,有利于减少试错次数,提升工作效率,加快研究步伐。
在本发明应用较佳的实施方式中,末端修复是在DNA片段的缺口进行修复,并在DNA片段的3’端加上A;
在一种可选的实施方式中,末端修复包括:在Endprep buffer和Endprep enzyme酶的作用下,在PCR仪中30℃,反应20 min,然后72℃,反应20min。
在本发明应用较佳的实施方式中,接头连接时,所连接的DNA接头的序列如SEQ IDNO.1-2所示。
在一种可选的实施方式中,上述接头连接包括:向捕获的DNA片段体系中加入30 μL Ligation Enhancer、5 μL T4 DNA Ligase和DNA Adaptors。
接头序列如下:
SEQ ID NO.1:
5´-Phos-GATCGGAAGAGCACACGTCTGAACTCCAGT*C -3´
SEQ ID NO.2:
5´-ACACTCTTTCCCTACACGACGCTCTTCCGATC*T-3´。
在本发明应用较佳的实施方式中,还原反应是指通过断裂二硫键去除通过生物素与DNA连接的磁珠;
在一种可选的实施方式中,通过加入还原剂的方式进行还原反应;
在一种可选的实施方式中,还原剂选自硫代乙醇酸铵、L-半胱氨酸、N-乙酰L-半胱氨酸、谷胱甘肽、抗坏血酸、β-巯基乙醇、2-巯基乙胺、2-巯基乙胺盐酸盐、二硫苏糖醇(DTT)、硫代乳酸、硫代水杨酸、三-2-羧乙基膦盐酸盐(TCEP)、亚硫酸氢钠、硫代硫酸钠、二亚硫酸钾、二亚硫酸钠、硫酸氢钠、亚硫酸氢钠、亚硫酸氢铵、硫代乙醇酸、硫代乙醇酸钙、硫代乙醇酸钾、硫代乙醇酸钠、半胱氨酸盐酸盐、硫代乳酸铵、硫代甘油、巯基丙酸、硫代乙醇酸甘油酯和二硫代丁胺(DTBA);
在一种可选的实施方式中,文库的扩增时,扩增循环数为13-18个;
在一种可选的实施方式中,在文库的扩增后,还包括文库纯化及分选;
在一种可选的实施方式中,加入Hieff NGS DNA Selection Beads进行纯化,磁吸后,去上清后加入Hieff NGS DNA Selection Beads进行单分选。
DNA产物分选所用Hieff NGS DNA Selection Beads的量为22.5-27 μL。
术语“葡糖基转移酶(glucosyl transferase或glucosyl transferaseenzyme)”、“GTF酶”、和“GTF”在本文可互换使用。葡糖基转移酶催化从蔗糖合成名为葡聚糖的高分子量D-葡萄糖聚合物。根据CAZy(碳水化合物活性酶)数据库(Cantarel等人,Nucleic AcidsRes.[核酸研究]37:D233-238,2009),将GTF酶分类在糖苷水解酶家族70(GH70)下。
本发明具有以下有益效果:
发明人经测试与摸索,发现非羟甲基化修饰的片段主要缠绕在捕获的DNA分子、DBCO-S-S-Biotin或DBCO-PEG4-Biotin以及捕获磁珠上。发明人通过如下方式降低了捕获假阳性率:1)将基因组片段化步骤置于点击化学步骤之后,通过超声片段化操作可以将捕获体系(即经过点击化学反应后的反应产物)中多余的大分子DBCO -S-S-Biotin和未被标记的DNA片段与成功标记的DNA分子在空间上得以一定程度的分离,发明人发现这样的操作对降低捕获假阳性率立竿见影;2)打断后的纯化步骤,可以继续将上述空间上具有一定分离程度的多余的大分子DBCO-S-S-Biotin进行有效去除,从而大幅降低了非羟甲基化修饰的片段的扩增,进而从根本上有效降低了假阳性率;(3)通过捕获后的水洗步骤能够将捕获体系中缠绕在复合物上的非捕获DNA片段洗脱并去除。
此外,本发明提供的方法具有高捕获率,通过MACS鉴定和宽峰broad方法模型进行peak预测发现,本发明在低捕获假阳性率的情况下,能够捕获到更多的5hmC位点。
本发明提供的方法具有高可信度,本发明能够捕获到更多聚集在转录起始位点附近的含5hmC位点的片段,这也与文献报道一致,证明本发明捕获数据具有更高的可信度,因此,该方法能为科研院校和临床研究提供更真实的预测结果,减少试错次数,提升工作效率,加快研究步伐。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明提出的一种全基因组羟甲基化捕获测序的文库构建方法整体流程图;
图2 为Agilent 2100片段检测结果;
图3 为捕获富集分析在转录起始位点附近的可视化分析比较;
图4为微量上样量不同测序深度下捕获率比较结果图;
图5为本发明与Y检测公司的数据比较结果图。
具体实施方式
现将详细地提供本发明实施方式的参考,其一个或多个实例描述于下文。提供每一实例作为解释而非限制本发明。实际上,对本领域技术人员而言,显而易见的是,可以对本发明进行多种修改和变化而不背离本发明的范围或精神。例如,作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中,来产生更进一步的实施方式。
除非另外指明,否则实践本发明将采用细胞生物学、分子生物学(包含重组技术)、微生物学、生物化学和免疫学的常规技术,所述常规技术在本领域技术人员的能力范围内。文献中充分解释了这种技术,如《分子克隆:实验室手册(Molecular Cloning:ALaboratory Manual)》,第二版(Sambrook等人,1989);《寡核苷酸合成(OligonucleotideSynthesis)》(M.J.Gait编,1984);《动物细胞培养(Animal Cell Culture)》(R.I.Freshney编,1987);《酶学方法(Methods in Enzymology)》(学术出版社有限公司(Academic Press,Inc.);《实验免疫学手册(Handbook of Experimental Immunology)》(D.M.Weir和C.C.Blackwell编);《哺乳动物细胞用基因转移载体(Gene Transfer Vectors forMammalian Cells)》(J.M.Miller和M.P.Calos编,1987);《当代分子生物学方法(CurrentProtocols inMolecular Biology)》(F.M.Ausubel等人编,1987);《PCR:聚合酶链反应(PCR:The Polymerase Chain Reaction)》(Mullis等人编,1994);以及《当代免疫学方法(Current Protocols in Immunology)》(J.E.Coligan等人编,1991),所述文献中的每个文献均通过引用明确并入本文中。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
以下结合实施例对本发明的特征和性能作进一步的详细描述。
所使用的材料如下:
试剂配制:
1×B&W Buffer的主要成分包括Tris-HCl(pH 7.5)、EDTA和NaCl,且浓度分别为5mM,0.5 mM和1 M。
2×B&W Buffer的主要成分包括Tris-HCl(pH 7.5)、EDTA和NaCl,且浓度分别为10mM,1 mM和2 M。
实施例1
本实施例进行小鼠脑组织样本羟甲基化修饰捕获文库构建,流程参照图1所示。
运用商业化的组织样本提取试剂盒(DNeasy Blood&Tissue Kits,Qiagen,69504)提取基因组DNA。分别取1 μL用NanoDrop检测样本质量并用1%琼脂糖凝胶电泳检测样本完整性,确保260/280>1.7,260/230>1.8,主条带完整。
1、5-hmC标记:在20 μL DNA样本(总量50-200 ng)中加入下表中的试剂,并置于PCR仪器中37℃孵育2 h。标记后加入1.5×纯化磁珠涡旋振荡混匀,室温孵育5 min,磁吸去上清后用新配置的80%乙醇清洗两次,待磁珠晾干用24 μL ddH2O重悬洗脱。
2、点击化学反应:在纯化后的糖基化产物中加入1 μL 4.5 mM DBCO-S-S-Biotin37℃孵育2 h。
3、纯化:点击化学反应结束后,向PCR管中加入25 μL ddH2O将体积补充到50 μL,加入1.5×纯化磁珠涡旋振荡混匀,室温孵育5 min,磁吸去上清后用新配置的80%乙醇清洗两次,待磁珠晾干后用25 μL ddH2O重悬洗脱。
4、打断:纯化后的DNA在QSONICA打断仪上片段化38 min。
5、打断后纯化:向PCR管中加入25 μL纯化磁珠涡旋振荡混匀,室温孵育5 min,磁吸去上清后用新配置的80%乙醇清洗两次,待磁珠晾干后用25 μL ddH2O重悬洗脱。
6、捕获:取5 μL重悬好的链酶亲和素标记的磁珠加入新PCR管中,并将PCR管放置在磁力架上,溶液澄清后,弃上清。用5 μL 1× B&W Buffer清洗磁珠3遍。洗完后在带有磁珠的PCR管中加入25 μL 2× B&W Buffer以及25 μL纯化后的DNA,移液器轻轻吹打混匀。室温孵育30 min。
7、纯化:将PCR管放置在磁力架上,溶液澄清后,弃上清。用50 μL 1× B&W Buffer清洗磁珠3遍。100 μL ddH2O清洗磁珠1遍。25 μL ddH2O重悬磁珠。
8、双链DNA片段末端修复、3´端加A:使用商业化的双链文库构建试剂盒(Sangon,N608380)进行文库构建,具体流程如下:取25 μL纯化后的DNA片段,加入3 μL EndRepairBuffer和2 μL EndRepair Enzyme混匀后瞬离,分别在30℃ 反应20 min,72℃反应20 min进行缺口末端的修复和加A过程。
9、接头连接:按下表配制接头连接反应体系,放20℃ 反应30 min。放应后,将PCR管放置在磁力架上,溶液澄清后,弃上清。用50 μL 1× B&W Buffer清洗磁珠3遍。100 μLddH2O清洗磁珠1遍。
试剂 体积 (μL)
Suspend DNA 30
Fast Ligation Buffer 15
Fast Ligase 2.5
Short Adaptor 2.5
Milli-Q Water to Total volume 50
接头序列如下:
5´-Phos-GATCGGAAGAGCACACGTCTGAACTCCAGT*C -3´
5´-ACACTCTTTCCCTACACGACGCTCTTCCGATC*T-3´
10、DTT还原及纯化:纯化后加入20 μL 50 mM DTT 重悬磁珠,25 ℃ 900 rpm孵育1 h。孵育后将PCR管放置在磁力架上,将上清转移到新的PCR管上。加30 μL ddH2O补足到50μL,加入1×纯化磁珠涡旋振荡混匀,室温孵育5 min,磁吸去上清后用新配置的80%乙醇清洗两次,待磁珠晾干用13 μL ddH2O重悬洗脱。
11、文库扩增:在上述纯化产物中加入15 μL 2×Hot Start PCR mix和1.8 μLUDI Adaptor,充分混匀后按以下程序进行扩增反应:
12、PCR产物纯化:待扩增反应完成,取出扩增产物瞬离后加入20 μL ddH2O使体积补充到50 μL,再加入1×纯化磁珠涡旋振荡混匀,室温孵育5 min,磁吸去上清后用新配置的80%乙醇清洗两次,待磁珠晾干用50 μL ddH2O重悬洗脱。洗脱液里再次加入0.9×纯化磁珠,涡旋振荡混匀,室温孵育5 min;磁吸去上清,用200 μL新制备的80%乙醇清洗两次,待磁珠晾干,洗脱至16 μL EB中。
13、文库质控及测序:文库构建后,用Qubit检测文库浓度,并通过2%的琼脂糖凝胶电泳或Agilent 2100检测文库片段范围。质检合格后上Illumina 测序仪测序。
测序结果参照图2所示。
实施例2
本实施例提供了一种微量基因组DNA羟甲基化修饰捕获测序文库构建方法,具体包括如下步骤:
1、取在20 μL 小鼠脑组织DNA样本(总量1 ng)进行标记。
其余步骤同实施例1。
第11步,进行文库扩增:在还原后纯化产物中加入15 μL 2×Hot Start PCR mix和1.8 μL UDI Adaptor,充分混匀后按以下程序进行扩增反应:
其余步骤同实施例1。
本实施例的测序深度≥1000×。
实验例1
本发明为检验对基因组样本的捕获情况的真实性进行了两项操作:1)同时将同一小鼠基因组样本DNA送往国内在羟甲基化捕获测序领域具有较高声誉的Y公司进行传统方法检测;2)将同一小鼠基因组样本DNA做单碱基精确度的5hmC的ACE-seq检测,以此验证捕获数据的真实性和统计捕获到的5hmC位点数目。
通过MACS鉴定和宽峰broad方法模型进行peak预测发现,本发明在低捕获假阳性率(1.38% vs. 3.80%)的情况下,能够捕获到更多的5hmC位点(11330274 vs.10368132)(图5)。图5中The best为本发明方法构建文库。
羟甲基化捕获测序分析方法主要是通过对捕获到的片段进行位置富集,找出5hmC在全基因组水平相对富集的区域或基因位置,以此预测与5hmC修饰相关的基因或疾病。本发明捕获到的较多的hmC位点(57.28% vs.52.42%)落在了较少的peak(311681vs. 479613)中,显著提升了数据可信度(图5)。由图3可知,本发明能够捕获到更多聚集在转录起始位点附近的含5hmC位点的片段,这与文献报道一致,进一步证明本发明捕获数据具有更高的可信度。因此,该方法能为科研院校和临床研究提供更真实的预测结果,减少试错次数,提升工作效率,加快研究步伐。
图3为5hmC在TSS附近分布情况。TSS,转录起始位点;The best,本发明方法构建文库。
实验例2
本实验例对实施例2中的微量上样量下进行不同测序深度下的捕获率比较试验。Y公司初始上样量>50 ng,图4表示 本发明1 ng初始上样量不同测序深度相对于Y公司所捕获到的基因比例。
经测试,通过增加测序深度(例如1000×),可在很大程度上弥补低初始上样量的不足。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (31)

1.对用于构建羟甲基化测序文库的生物样品进行捕获处理方法,其特征在于,其包括:将糖基化标记的生物样品进行点击化学反应,经片段化处理、纯化,然后进行捕获和捕获后清洗;
所述点击化学反应是指将糖基化标记的生物样品与DBCO-PEG3-S-S-Biotin按照20-30:1的体积比混合孵育;
所述片段化处理是指通过超声打断仪进行片段化。
2.根据权利要求1所述的方法,其特征在于,所述生物样品为基因组DNA。
3.根据权利要求2所述的方法,其特征在于,所述基因组DNA的初始上样量为1ng-200ng。
4. 根据权利要求3所述的方法,其特征在于,所述基因组DNA的初始上样量为50-200ng。
5.根据权利要求1所述的方法,其特征在于,所述混合孵育条件是37℃±1℃孵育1-2h。
6.根据权利要求5所述的方法,其特征在于,所述糖基化标记包括将生物样品与标记缓冲液、糖基转移酶混合孵育。
7.根据权利要求6所述的方法,其特征在于,所述糖基转移酶选自如下糖基转移酶中的至少一种:半乳糖基转移酶、葡糖基转移酶、唾液酰转移酶、N-乙酰葡糖胺转移酶和岩藻糖基转移酶。
8. 根据权利要求7所述的方法,其特征在于,所述糖基转移酶选自以下中的至少一种:β-1,3-N-乙酰葡糖胺转移酶、β-1,3-半乳糖基转移酶、β-1,4-半乳糖基转移酶、β-1,6-半乳糖基转移酶、β-葡糖基转移酶、α-2,3-唾液酰转移酶、α-2,6-唾液酰转移酶、α-1,2-岩藻糖基转移酶、T4 噬菌体 β-葡糖基转移酶(T4-βGT)、UDP-葡萄糖醛酸转移酶和α-1,3-岩藻糖基转移酶。
9. 根据权利要求8所述的方法,其特征在于,所述糖基转移酶选自T4 噬菌体 β-葡糖基转移酶。
10.根据权利要求6所述的方法,其特征在于,所述标记缓冲液选自HEPES。
11. 根据权利要求10所述的方法,其特征在于,所述标记缓冲液的终浓度为0.5-1 M。
12. 根据权利要求6所述的方法,其特征在于,所述混合孵育时,还在混合液中添加有氯化镁,所述氯化镁的终浓度为0.5-1 M。
13. 根据权利要求1所述的方法,其特征在于,所述片段化的时间为15-38 min。
14. 根据权利要求13所述的方法,其特征在于,所述片段化的时间为38 min。
15. 根据权利要求14所述的方法,其特征在于,所述片段化后的片段范围为200-500bp。
16.根据权利要求1所述的方法,其特征在于,所述捕获后清洗是先进行清洗液清洗,然后进行水洗。
17.根据权利要求16所述的方法,其特征在于,所述捕获是采用链酶亲和素标记的磁珠与片段化处理后的产物混合,进行磁珠捕获。
18.根据权利要求16所述的方法,其特征在于,所述清洗是指使用清洗缓冲液清洗磁珠1-5次,然后用水清洗所述磁珠1-5次。
19.根据权利要求18所述的方法,其特征在于,所述清洗是指使用清洗缓冲液清洗磁珠1-3次,然后用水清洗所述磁珠1-3次。
20.根据权利要求18所述的方法,其特征在于,所述清洗缓冲液包括Tris-HCl、EDTA和NaCl。
21. 根据权利要求20所述的方法,其特征在于,所述缓冲液中含5-10 mM的Tris-HCl、0.5-1 mM的EDTA和1-2 M的NaCl。
22.一种全基因组羟甲基化捕获测序的文库构建方法,其特征在于,其包括如下步骤:
将权利要求1-21任一项所述的方法纯化后的产物进行清洗后,进行DNA末端修复,然后进行接头连接,还原反应后,进行文库的扩增。
23.根据权利要求22所述的文库构建方法,其特征在于,所述末端修复是在DNA片段的缺口进行修复,并在DNA片段的3’端加上A。
24.根据权利要求23所述的文库构建方法,其特征在于,所述末端修复包括:在Endprepbuffer和Endprep enzyme酶的作用下,在PCR仪中30℃,反应20 min,然后72℃,反应20min。
25.根据权利要求22所述的文库构建方法,其特征在于,所述接头连接时,所连接的DNA接头的序列如SEQ ID NO.1-2所示。
26.根据权利要求22所述的文库构建方法,其特征在于,所述还原反应是指通过断裂二硫键去除通过生物素与DNA连接的磁珠。
27.根据权利要求26所述的文库构建方法,其特征在于,通过加入还原剂的方式进行还原反应。
28.根据权利要求27所述的文库构建方法,其特征在于,所述还原剂选自硫代乙醇酸铵、L-半胱氨酸、N-乙酰L-半胱氨酸、谷胱甘肽、抗坏血酸、β-巯基乙醇、2-巯基乙胺、2-巯基乙胺盐酸盐、二硫苏糖醇(DTT)、硫代乳酸、硫代水杨酸、三-2-羧乙基膦盐酸盐(TCEP)、亚硫酸氢钠、硫代硫酸钠、二亚硫酸钾、二亚硫酸钠、硫酸氢钠、亚硫酸氢钠、亚硫酸氢铵、硫代乙醇酸、硫代乙醇酸钙、硫代乙醇酸钾、硫代乙醇酸钠、半胱氨酸盐酸盐、硫代乳酸铵、硫代甘油、巯基丙酸、硫代乙醇酸甘油酯和二硫代丁胺(DTBA)。
29.根据权利要求22所述的文库构建方法,其特征在于,所述文库的扩增时,扩增循环数为13-18个。
30.根据权利要求29所述的文库构建方法,其特征在于,在所述文库的扩增后,还包括文库纯化及分选。
31.根据权利要求30所述的文库构建方法,其特征在于,加入Hieff NGS DNASelection Beads进行纯化,磁吸后,去上清后加入Hieff NGS DNA Selection Beads进行单分选。
CN202210882962.9A 2022-07-26 2022-07-26 一种全基因组羟甲基化捕获测序的文库构建方法 Active CN115992203B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210882962.9A CN115992203B (zh) 2022-07-26 2022-07-26 一种全基因组羟甲基化捕获测序的文库构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210882962.9A CN115992203B (zh) 2022-07-26 2022-07-26 一种全基因组羟甲基化捕获测序的文库构建方法

Publications (2)

Publication Number Publication Date
CN115992203A CN115992203A (zh) 2023-04-21
CN115992203B true CN115992203B (zh) 2024-07-26

Family

ID=85994237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210882962.9A Active CN115992203B (zh) 2022-07-26 2022-07-26 一种全基因组羟甲基化捕获测序的文库构建方法

Country Status (1)

Country Link
CN (1) CN115992203B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102533941A (zh) * 2010-12-10 2012-07-04 金赟懿 修饰5-羟甲基胞嘧啶的组合物和方法
CN105648537A (zh) * 2016-03-02 2016-06-08 上海易毕恩基因科技有限公司 Dna5-甲基胞嘧啶与5-羟甲基胞嘧啶基因图谱测序方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160194696A1 (en) * 2013-08-09 2016-07-07 New England Biolabs, Inc. Detecting, Sequencing and/or Mapping 5-Hydroxymethylcytosine and 5-Formylcytosine at Single-Base Resolution
SG11201808775PA (en) * 2016-04-07 2018-11-29 Univ Leland Stanford Junior Noninvasive diagnostics by sequencing 5-hydroxymethylated cell-free dna
CN111961729A (zh) * 2020-09-01 2020-11-20 深圳泰莱生物科技有限公司 一种用于检测5-羟甲基胞嘧啶含量的试剂盒及其应用
CN113061652A (zh) * 2021-03-30 2021-07-02 成都泰莱医学检验实验室有限公司 一种基于葡萄糖基修饰的测定基因标志物中5hmC含量的方法
CN113430255A (zh) * 2021-07-19 2021-09-24 深圳泰莱生物科技有限公司 基于5hmC点击化学高通量测序技术的肺癌检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102533941A (zh) * 2010-12-10 2012-07-04 金赟懿 修饰5-羟甲基胞嘧啶的组合物和方法
CN105648537A (zh) * 2016-03-02 2016-06-08 上海易毕恩基因科技有限公司 Dna5-甲基胞嘧啶与5-羟甲基胞嘧啶基因图谱测序方法

Also Published As

Publication number Publication date
CN115992203A (zh) 2023-04-21

Similar Documents

Publication Publication Date Title
CN113699135B (zh) 一种无pam限制的腺嘌呤碱基编辑器融合蛋白及应用
US8481262B2 (en) Method for enriching and/or separating prokaryotic DNA using a protein that specifically bonds to unmethylated DNA containing CpG-motifs
JP2016538001A (ja) 体細胞半数体ヒト細胞株
US20210332353A1 (en) Argonaute protein mutant and use thereof
Seibel et al. The role of pheromone receptors for communication and mating in Hypocrea jecorina (Trichoderma reesei)
JP2022522019A (ja) 単一塩基編集による非標的な単一ヌクレオチド変異及び当該変異を避ける高特異性オフターゲットのない単一塩基遺伝子編集ツール
TW201625665A (zh) 具有高分泌效能之蛋白質分泌因子及包含該因子之表現載體
CN104245932A (zh) 具有简单糖型的重组蛋白的产生
JP2023515670A (ja) キロ塩基スケールでのrnaガイドゲノムリコンビニアリング
CN111607613A (zh) 一种表达细胞免疫疫苗mRNA的质粒载体及其构建方法和应用
CA3228222A1 (en) Class ii, type v crispr systems
CN115992203B (zh) 一种全基因组羟甲基化捕获测序的文库构建方法
CN111500583B (zh) 特异性识别牛妊娠相关糖蛋白4的核酸适配体及其应用
WO2023072145A1 (zh) 一种纯化单链dna的方法
CN111334511B (zh) 一种特异性识别牛妊娠相关糖蛋白的核酸适配体及其应用
CN107988317A (zh) 一种对核酸目标区域进行杂交捕获的缓冲液
CN115161305B (zh) 一种包括双碱基编辑器的融合蛋白及其制备方法和应用
WO2024138664A1 (zh) 一种核酸连接酶及其应用
CN117568311A (zh) 一种用于精准基因编辑的工程化crispr酶和系统及其应用
CN116813800B (zh) 一种双链dna结合蛋白-转座酶融合蛋白及文库构建方法
US20240287484A1 (en) Systems, compositions, and methods involving retrotransposons and functional fragments thereof
JP7422762B2 (ja) 種を同定するための新しい方法
JPWO2005121336A1 (ja) 環境dnaの精製方法及び環境dnaからのタンパク質をコードする遺伝子の効率的なスクリーニング方法
CN113136420A (zh) 一种检测病原微生物的方法及试剂盒
JP2022524688A (ja) スピラマイシン産生菌、カリマイシン産生菌、作製方法、応用、及び生成物の産生量を増加させる方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant