CN117926429A - 一种高效富集甲基化位点的甲基化测序文库建库方法 - Google Patents

一种高效富集甲基化位点的甲基化测序文库建库方法 Download PDF

Info

Publication number
CN117926429A
CN117926429A CN202410091297.0A CN202410091297A CN117926429A CN 117926429 A CN117926429 A CN 117926429A CN 202410091297 A CN202410091297 A CN 202410091297A CN 117926429 A CN117926429 A CN 117926429A
Authority
CN
China
Prior art keywords
sequencing
nucleic acid
methylation
dna
adapter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410091297.0A
Other languages
English (en)
Inventor
孙雪光
朱辰
童石渊
唐诗灿
魏从翀
吴晓晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Weihe Medical Laboratory Co ltd
Original Assignee
Shanghai Weihe Medical Laboratory Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Weihe Medical Laboratory Co ltd filed Critical Shanghai Weihe Medical Laboratory Co ltd
Priority to CN202410091297.0A priority Critical patent/CN117926429A/zh
Publication of CN117926429A publication Critical patent/CN117926429A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种用于高效富集甲基化位点的甲基化测序文库的构建方法,其可高效富集核酸中的甲基化位点,以更低用量和更高检出率来检测核酸中的甲基化程度。

Description

一种高效富集甲基化位点的甲基化测序文库建库方法
技术领域
本发明属于分子生物学领域,涉及一种高效富集核酸中甲基化位点的甲基化测序文库建库方法,可用于血液样本中甲基化位点的高灵敏度检测。
背景技术
DNA甲基化通常在CpG位点出现,异常高甲基化或低甲基化会与许多疾病包括癌症有密切关系。在癌细胞中,DNA甲基化模式被破坏,肿瘤抑癌基因启动子区域发生高甲基化(抑癌基因表达下调)或致癌基因启动子区域发生低甲基化(致癌基因表达增加)。坏死或凋亡的细胞释放到血液中的DNA,被称为循环游离DNA(circulating free DNA,cfDNA),而在肿瘤患者中还含有来自死亡的肿瘤细胞的cfDNA,被称为循环肿瘤DNA(ctDNA),二者在癌症的筛查、疗效监控、定位癌症的组织起源(TOO)等领域均有广泛应用。但是,血液中的cfDNA或ctDNA含量非常低,长度也很短,对检测技术的灵敏度及候选位点的选取的要求较高。
全基因组甲基化测序(WGBS)通过结合DNA的亚硫酸氢盐转化技术和高通量测序技术对DNA的甲基化位点进行检测,但其所需数据量庞大且花费高昂。简化基因组甲基化测序(RRBS)技术通过MspI限制性酶切富集DNA上富含CCGG位点的片段,经重亚硫酸盐(Bisulfite)处理和高通量测序技术进行基因组CpG富集区域内的单碱基分辨率的甲基化测序。但绝大部分的cfDNA已经高度碎片化,由此导致RRBS测序文库中含有大量来源于MspI的酶切片段,造成CpG位点的富集效果大打折扣。
为此,De Koker等人开发的cf-RRBS技术中先对cfDNA片段的5’端去磷酸化处理然后再用MspI消化建库,参见bioRxiv preprint doi:https://doi.org/10.1101/663195,其通过引用并入本文。Jasmine Zhou等人开发的cf Methyl-Seq技术中对原始cfDNA的模板进行去磷酸化处理并加入ddNTP进行末端修复,以使得cfDNA模版的3’端也不具备连接接头的能力,从而进一步降低了非MspI片段在建库过程中的干扰,参见https://doi.org/10.1038/s41467-022-32995-6,其通过引用并入本文。但现有RRBS建库技术均要求cfDNA片段的5’和3’端同时含有MspI位点,而只含有一个MspI酶切位点的片段将不能被检测到。因此,高效富集核酸中甲基化位点的建库方法还有待于进一步改善。
发明内容
本发明提供了一种用于高效富集甲基化位点的甲基化测序文库(Library)的构建方法,其可高效富集DNA中的甲基化位点,以更低用量和更高检出率来检测DNA中的甲基化程度,由此为甲基化检测在临床中的应用提供了更坚实的基础。
在一个方面,本发明提供了一种高效富集甲基化位点的甲基化测序文库的构建方法,其包括以下步骤:
(1)使用核酸修饰酶对分离的核酸进行末端修复,以形成经末端修复的核酸;
(2)将第一测序接头连接至步骤(1)中形成的所述经末端修复的核酸的两端,以得到连接第一测序接头的核酸;
(3)使用限制性内切酶对步骤(2)中产生的所述连接第一测序接头的核酸进行酶切,以得到一端连接第一测序接头的酶切核酸片段;
(4)将第二测序接头连接至步骤(3)中得到的所述一端连接第一测序接头的酶切核酸片段的另一端,以得到两端分别连接第一测序接头和第二测序接头的核酸片段;
(5)对步骤(5)中得到所述两端分别连接第一测序接头和第二测序接头的核酸片段进行扩增,以得到高效富集甲基化位点的甲基化测序文库。
在另一个方面,本发明提供了一种甲基化测序文库,其是通过本发明的建库方法构建的测序文库。
本发明的甲基化测序文库构建方法中,通过将经末端修复后的核酸与一种测序接头连接以筛选出含有一个以上酶切位点的核酸片段,随后使用限制性内切酶对连接测序接头的核酸进行酶切,再将酶切核酸片段与另一种不同的测序接头连接,由此产生两端连接不同测序接头的核酸片段,以实现含一个以上酶切位点的核酸片段的富集。本发明的方法打破了现有RRBS建库技术中要求核酸片段两端必须同时包含MspI位点的限制,显著提高了cfDNA的利用率,同时也在建库过程中保留了核酸片段末端的连接能力,由此扩大了其应用范围。
与常规的甲基化测序文库的构建方法相比,本发明的方法的主要优势至少包括:1、提高cfDNA片段的利用率,高效富集cfDNA中的甲基化信息,从而节约测序成本;2、本发明对含有CCGG位点的基因片段富集率与现有技术相似,但相比于现有技术,本发明可有效地提高获得CpG位点覆盖度;3、本发明检测灵敏度高,利用少量较低丰度的cfDNA样品即可完成建库;4、相比于现有技术,本发明无需额外添加UMI等标记序列,简化接头设计及后续测序步骤,实验操作简便;5、本发明有效缩短了建库时间,以节约成本;6、相比于现有RRBS建库技术,本发明有效保留了核酸末端motif,使其仍保留其末端的连接能力,由此可实现至少两种组学分析。
附图说明
图1:cfDNA片段中CCGG位点分布个数。
图2:cfRRBS文库构建实验流程及时长示意图。
图3:模拟cfMethyl-Seq和cfRRBS建库片段长度分布。
图4:健康人样本中cfMethyl-Seq(NR04_V3)与cfRRBS(NR05_V2N)片段长度分布比较。
图5:健康人样本中cfMethyl-Seq(NR06_V3)与cfRRBS(NR06_V2N)CpG位点覆盖度比较。
图6:肿瘤病人样本中cfMethyl-Seq(V3)与cfRRBS(V2)片段长度分布比较。
图7:肿瘤病人样本中cfMethyl-Seq(V3)与cfRRBS(V2)CpG位点覆盖度比较。
具体实施方式
在一些实施方式中,本发明涉及一种高效富集甲基化位点的甲基化测序文库的构建方法,其包括以下步骤:
(1)使用核酸修饰酶对分离的核酸进行末端修复,以形成经末端修复的核酸;
(2)将第一测序接头连接至步骤(1)中形成的所述经末端修复的核酸的两端,以得到连接第一测序接头的核酸;
(3)使用限制性内切酶对步骤(2)中产生的所述连接第一测序接头的核酸进行酶切,以得到一端连接第一测序接头的酶切核酸片段;
(4)将第二测序接头连接至步骤(3)中得到的所述一端连接第一测序接头的酶切核酸片段的另一端,以得到两端分别连接第一测序接头和第二测序接头的核酸片段;
(5)对步骤(5)中得到所述两端分别连接第一测序接头和第二测序接头的核酸片段进行扩增,以得到高效富集甲基化位点的甲基化测序文库。
在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述分离的核酸为DNA。在一些实施方式中,本发明提供了一种高效富集甲基化位点的甲基化测序文库的构建方法,其中所述分离的核酸为cfDNA或、ctDNA、cfDNA和ctDNA的组合、片段化DNA或或者损伤DNA。在一些实施方式中,其中所述分离的核酸为获取自新鲜血液的cfDNA、ctDNA或cfDNA和ctDNA的组合。
在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述核酸分离自体液。在一些实施方式中,其中所述核酸分离自血液。在一些实施方式中,其中所述核酸分离自血浆。
在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述经末端修复的核酸保留其末端的连接能力。在一些实施方式中,其中所述经末端修复的核酸的末端为平末端。在一些实施方式中,其中所述经末端修复的核酸的末端为通过添加碱基形成的粘性末端。
在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述第一测序接头连接至所述经末端修复的核酸的3’端,且所述第二测序接头连接至所述连接第一测序接头的酶切核酸片段的5’端。在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述第一测序接头连接至所述经末端修复的核酸的5’端,且所述第二测序接头连接至所述连接第一测序接头的酶切DNA片段的3’端。
在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述第一测序接头和所述第二测序接头为相同的测序接头。在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述第一测序接头和所述第二测序接头为不同的测序接头。
在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述测序接头可以是本领域内可用的任意测序接头。在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述第一测序接头可以是下表A的两个序列。在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述第二测序接头可以是下表B的序列。
表A:第一测序接头
*N/n表示任意核苷酸。
表B:第二测序接头
*n表示任意核苷酸。
在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述核酸修饰酶可以是末端修饰酶(End Repair Enzymes)。在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述核酸修饰酶可以是Klenow Exo-酶、DNA聚合酶中的一种或多种或其组合。
在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述第一测序接头的连接是通过使用连接酶(Ligase)实现的。在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述第二测序接头的连接是通过使用连接酶实现的。在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中连接接头的连接酶为DNA连接酶,优选地为T4 DNA连接酶。在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中连接接头的连接酶为T4 DNA连接酶。
在一些实施方式中,本发明提供了一种甲基化测序文库的构建方法,其中所述限制性内切酶为可以特异性切割甲基化位点的酶。在一些实施方式中,其中所述限制性内切酶为MspI、TaqI中的一种或多种或其组合。
在一些实施方式中,本发明还提供了一种甲基化测序文库,其中,所述测序文库是利用本发明的建库方法构建的。
定义
除非另有定义,否则本文使用的所有技术和科学术语具有与本发明所属领域普通技术人员通常理解的相同的含义。为了本发明的目的,下文定义了本文所用术语。
在本说明书全文,提到“一个实施方式”、“一种实施方式”、“一些实施方式”、“实施方式”、“特定实施方式”、“相关实施方式”、“某个实施方式”、“另外的实施方式”或“进一步的实施方式”或其组合意指与所述实施方式结合描述的特定特征、结构或特性被包括在本发明的至少一个实施方式中。因此,前述短语在本说明书全文的各个地方的出现不一定全部指相同实施方式。此外,特定特征、结构或特性可以以任何合适方式在一个或多个实施方式中组合。
如本文所用,术语“任选”“任选地”包括选择或不选择两种情形。例如“任选修饰”包括被修饰和不被修饰两种情形。
如本文所用,术语“一种(个)”和“所述”通常被解释为涵盖单数和复数形式。
如本文所用,术语“包括”意指词组“包括(但不限于)”,并可与其交换使用。本文所采用术语“包含”意指词组“包含(但不限于)”,并可与其交换使用。本专利中的使用“包括”或“包含”的技术方案,可以进一步限定成“组成”或“构成”。
如本文所用,术语“受试者”、“需要的对象”指任何哺乳动物或非哺乳动物。哺乳动物包括但不限于人类、脊椎动物诸如啮齿类、非人类灵长类、牛、马、狗、猫、猪、绵羊、山羊。优选地,在一些实施方式中,受试者是人。
分离的DNA
如本文所用,如本文所述“分离的DNA”是指从生物体获得的、存在于生物体中细胞外的任何DNA。
如本文所用,术语“循环游离DNA”、“无细胞DNA”或“cfDNA”指的是在个体身体(例如血流)中循环并源自于一个或多个健康细胞和/或一个或多个癌细胞的多个核酸片段。此外,cfDNA可能来自其他来源,如病毒、胎儿等。术语“循环肿瘤DNA”或“ctDNA”是指源于肿瘤细胞的核酸片段,这些片段可能由于生物学过程(例如死亡细胞凋亡或坏死或活的肿瘤细胞主动释放)而释放到个体血液中。
在一些实施方式中,分离的DNA是哺乳动物DNA。在一些实施方式中,分离的DNA是人DNA。在一些实施方式中,分离的DNA来自哺乳动物或人基因组。在一些实施方式中,游离DNA是胎儿DNA。在一些实施方式中,分离的DNA是循环游离DNA,例如获取自新鲜血液的cfDNA。在一些实施方式中,分离的DNA是循环肿瘤DNA,例如获取自新鲜血液的ctDNA。
DNA的甲基化
如本文所用,术语“DNA的甲基化(DNA methylation)”,是指胞嘧啶碱基(特别是CpG位点)上的甲基化,可以反应来源细胞的表观遗传状态,是无创癌症筛查最主流、最常用的指标之一。现在的甲基化测序方法常使用重亚硫酸盐或酶来对胞嘧啶和甲基化胞嘧啶进行有区分的转化,在后续测序中被识别成两种不同的碱基序列。“CpG”位点是最常见的甲基化位点,但甲基化位点并不局限于CpG位点。例如,DNA甲基化可能发生在CHG和CHH的胞嘧啶中,其中H是腺嘌呤、胞嘧啶或胸腺嘧啶。
如本文所用,术语“CpG位点”也称为“CG位点”,是指DNA分子中的一个区域,其中胞嘧啶核苷酸在碱基的线性序列沿其5’至3’方向排列后接鸟嘌呤核苷酸,其表现形式包括但不限于:CG、CCGG、CGCG等。“CpG”是5’-C-磷酸盐-G-3’(5’-C-phosphate-G-3’)的简写,它是由仅有一个磷酸基分开的胞嘧啶和鸟嘌呤。CpG二核苷酸中的多个胞嘧啶可以被甲基化形成5-甲基胞嘧啶。
样品
在一些实施方式中,分离的核酸是从样品中提取。在一些实施方式中,样品是血液。在一些实施方式中,样品是外周血。在一些实施方式中,样品是血浆,如外周血的血浆。
在一些实施方式中,用于本发明方法的样品的体积是0.005、0.01、0.05、0.1、0.5、1.0、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、20、30、50ml或上述数值间的任意数值。在一些实施方式中,用于本发明方法的样品的体积是至少0.5ml。在一些实施方式中,用于本发明方法的样品的体积是至多10ml。
本发明所述的样品均可以通过本领域的标准技术获得。例如,血液样品可以通过标准技术获得,如使用针和注射器。在一些实施方式中,血液样品是外周血样品。可选地,血液样品可以是外周血的分离部分,如血浆样品。在一些实施方式中,从样品中,例如血液中,提取循环游离DNA。在一些实施方式中,在获得血液样品后,可以利用本领域技术人员已知的标准技术从样品提取总DNA。用于接收循环游离DNA提取的标准技术是技术人员已知的,其非限制性实例是QIAGEN Circulating Nucleic Acid试剂盒(QIAGEN,55114)。
建立文库与测序
在一些实施方式中,用于建立文库的循环游离DNA的用量为0.001、0.005、0.01、0.05、0.1、0.5、1.0、2.0、3.0、4.0、5.0、6.0、7.0、8.0、9.0、10、20、30、40、50、60、70、80、90、100、150、200、250、300、400或500ng或上述数值间的任意数值。在一些实施方式中,用于建立文库的循环游离DNA的用量为10至100ng。
在一些实施方式中,测序的深度小于9000万、8000万、7000万、6000万、5000万、4000万、3000万、2000万、1000万、900万、800万、700万、600万、500万、400万、300万、200万、100万、50万、10万、5万、1万、5000或1000个读段(reads)或上述数值间的任意数值。在一些实施方式中,测序的深度在100万至1000万个读段。在一些实施方式中,测序的深度小于1000万。优选地,在一些实施方式中,测序的深度小于500万。
在一些实施方式中,测序是下一代测序。下一代测序,也称为高通量测序或大规模并行测序,是实现对来自DNA或RNA样品的碱基对进行快速高通量测序的任何测序方法。在一些实施方式中,测序是高通量测序。在一些实施方式中,测序是大规模并行测序。这样的测序是本领域公知的,并且可以包括使用Illumina阵列、孔和纳米孔测序仪以及离子激流(iontorrent)作为非限制性实例。对于非限制性实例,可以使用诸如Illumina Nextseq500机器的测序机器,并且可以使用Illumina 500/550V2试剂盒进行处理。在一些实施方式中,测序是全基因组测序。在一些实施方式中,仅部分基因组被测序。在一些实施方式中,涉及仅部分基因组的芯片或阵列用于下一代测序。
在一些实施方式中,本发明的方法在测序之前还包括化学或酶转化。在进行测序时,可以根据转化的碱基序列识别DNA的甲基化状态。
在一些实施方式中,测序是DNA甲基化敏感测序。DNA甲基化敏感测序是不经碱基转化步骤直接识别DNA甲基化碱基的测序方法。在一些实施方式中,DNA甲基化敏感测序是使用甲基化敏感的限制性内切酶处理序列后进行的第二代测序。优选地,在一些实施方式中,DNA甲基化敏感测序是第三代测序。
实施例
本申请将通过以下实施例来说明本发明的有益效果。本领域技术人员将认识到这些示例是说明性的而非限制性的。这些示例不会以任何方式限制本发明的范围。以下实施例中所描述的实验技术与实验方法,除另有说明外,均为常规技术方法,例如下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件;除非另有说明,试剂和材料均为市售品,均可通过正规商业渠道获得。
本申请的发明人通过在对真实的cfDNA样本进行分析后,发现含有单个CCGG酶切位点的片段约占比约整体cfDNA片段的80%,而含有两个CCGG酶切位点的片段仅有约10%(图1),也就是说,通过现有技术(例如,cfMethyl-Seq技术)构建测序文库时,会丢失掉80%的cfDNA片段,同时也丢掉了这部分片段所携带的甲基化信息。因此,发明人在此基础上,进一步改善现有RRBS建库技术得到本发明的建库方法(以下简称“cfRRBS”),以提高建库时cfDNA或ctDNA片段的利用率,从而提高甲基化位点的检出率。
实施例1:使用全基因组测序(WGS)数据对cfMethyl-Seq与cfRRBS进行比较
样本情况
使用了健康人血液cfDNA的low-pass WGS样本,一共19例,测序深度在(20-30X)。
分析流程
a.提取hg19基因组带有MspI酶切位点CCGG的坐标;
b.提取WGS样本片段(R1+R2 stitch后)断点坐标;
c.提取WGS样本含有MspI酶切位点的片段断点坐标;
d.分析cfMethyl-Seq能检测的CG位点和cfRRBS能检测的CG位点数目。
分析结果
含有MspI酶切位点片段占比:挑选了10个健康人样本,统计MspI酶切片段和样品中原始片段的数量发现,样本中带有MspI酶切位点片段占总体WGS数据比例仅约为12%(表1)。因此,通过富集带有酶切位点的片段,可以节省约88%的测序数据量。
表1含有MspI酶切位点数据占比
注:*样品中原始片段的数量;**经MspI酶切后片段的数量。
片段带有MspI酶切位点数目分布:现有技术(例如cfMethyl-Seq方法)要求cfDNA片段中必须含有至少两个MspI酶切位点才能保证该片段的部分序列在文库中。通过分析样本中片段的酶切位点数量,本申请令人惊讶地发现,仅包含单个MspI酶切位点的片段占比高达约82%;而包含3个及以上MspI位点的片段仅占约4.5%(图1)。本申请的发明人不受任何理论束缚地推测,包含单个酶切位点的片段占比过高是导致在通过现有技术建立的文库中CpG位点的检出率低的原因。
建库片段长度分布:本发明模拟了cfRRBS和cfMethyl-Seq两种方法建库片段长度的分布情况(图3)。片段分布显示,cfMethyl-Seq方法建库后,片段长度集中在几个峰值,而本发明cfRRBS的片段分布较为平均,显示能有效回收不同长度的片段。
检出的CpG位点数目:基因组包含的CCGG位点总数为2335233;在最宽松的过滤条件和检出线(10bp和>=2frag_counts per sample),通过cfMethyl-Seq方法建库后,CpG位点的检出个数仅为977636,而通过本发明cfRRBS方法建库后,约2020984的CpG位点能被检出,其检出率约为cfMethyl-Seq方法的2.0倍,远高于cfMethyl-Seq方法建库后的检出个数(表2和表3)。
表2 cfMethyl-Seq检测CpG位点个数
10bp 20bp 30bp 40bp
>=2frag_counts per sample 977636 920102 852707 768696
>=5frag_counts per sample 786621 718115 644116 557483
>=10frag_counts per sample 515177 432829 354522 273585
表3 cfRRBS检测CpG位点个数
10bp 20bp 30bp 40bp
>=2frag_counts per sample 2020984 1987817 1951604 1920931
>=5frag_counts per sample 1916652 1886539 1856644 1829438
>=10frag_counts per sample 1763050 1725772 1675328 1619041
实施例2:使用健康人cfDNA样本对cfMethyl-Seq与cfRRBS进行建库比较
样本情况
使用了健康人混合血液样本
实验操作
a.以新鲜采集的血液样本为材料,使用QIAGEN Circulating Nucleic Acid Kit(QIAGEN,55114)提取cfDNA;
b.在12μL的cfDNA(不足用无核酸酶水补齐)中加入3.5μL的End repair mix(mix包括2.5μL末端修饰酶buffer,1μL磷酸激酶(Vazyme,N102-0-AA/N101-0-AA)和DNA聚合酶(Takara,R001BM)),按照表4的步骤进行孵育,对cfDNA末端进行修复,形成平末端。
表4末端修复程序
c.在上一步产物中加入4.5μL Adapter B ligation mix(1.5μL连接mix,1μL10mM Adapter B(序列见表5,生工订制),0.5μL T4 DNA连接酶(Vazyme,N103-01)),22℃孵育1h;
表5 Adapter B序列
名称 序列(5’-3’)
Oligo_B_1 GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
Oligo_B_2 BP’-AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC
d.使用2×Ampure XP磁珠(Beckman Coulter,20212200)对上一步产物进行纯化,使用15.5μL的无核酸酶水进行洗脱,得到14μL连接产物;
e.在上一步产物中加入6.5μL Adapter A ligation mix(4μL连接mix,1μL 10mMAdapter A(序列见表6,生工订制),0.5μL T4 DNA连接酶(Vazyme,N103-01),1μL限制性内切酶(NEB,R0106L)),按照表5的程序同时进行酶切和Adapter A连接;
表6 Adapter A序列
名称 序列(5’-3’)
Oligo_A_1 ACACTCTTTCCCTACACGACGCTCTTCCGATCT
Oligo_A_2 P’-GCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT
表7酶切和连接程序
步骤 温度 时间
Step 1 37℃ 30min
Step 2 20℃ 30min
Step 3 37℃ 30min
Step 4 20℃ 30min
Step 5 4℃ Hold
f.使用EZ DNA Methylation-Lightning试剂盒(Zymo Research,D5031),通过下表8中所列程序参数,对cfDNA进行甲基化转化,使用22μL elution buffer进行洗脱,得到20μL转化后产物;
表8甲基化转化程序
步骤 温度 时间
Step 1 98℃ 8min
Step 2 54℃ 1h
Step 3 4℃ Up to 20h
g.在上一步转化产物中加入30μL PCR amplification mix(25μL KAPA HiFiHotStart Uracil+Readymix(Roche,07959079001),5μL xGenTMUDI Primers(IDT,10005922)),使用下表9中所列PCR程序参数设定对甲基化转化后的cfDNA进行PCR扩增;
表9 PCR扩增程序
h.PCR扩增完成后,使用1.5×Ampure XP(Beckman Coulter,20212200)磁珠对扩增产物进行纯化,完成cfRRBS测序文库构建。
结果分析
cfMethyl-Seq(NR04_V3)与cfRRBS(NR05_V2N):从片段长度分布看,两种建库方式的片段长度和模拟数据的片段长度曲线非常吻合(图3和图4)。此结果表明,本发明的cfRRBS方法可有效地完成甲基化测序文库构建,建立与通过现有技术构建的测序文库相当的文库构建。
cfMethyl-Seq(NR06_V3)与cfRRBS(NR06_V2N)CpG位点覆盖度比较:从结果可以看出,在相同测试深度(depth)下,cfRRBS(NRV2N)覆盖的CpG位点约为cfMethyl-Seq(NRV3)的两倍(图5)。此结果表明通过本发明的方法建库可大幅提高测序文库的CpG位点的富集率。
cfMethyl-Seq(NR06_V3)与cfRRBS(NR06_V2N)CpG island区域CpG位点覆盖度比较:在管家基因的启动子区,通常存在一些富含CG位点的区域,称为CpG岛(CpG island)。从结果可以看出,在相同测试深度下,cfRRBS(NRV2N)在CpG岛区域覆盖的CpG位点约为cfMethyl-Seq(NRV3)的1.1倍,此结果表明通过本发明的方法建库可有效提高测序文库在CpG island区域的CpG位点的富集率。
表10 CpG island区域CpG位点覆盖度
样品 CpG covered(>=1)
NR06_V2N_1 1802244
NR06_V2N_2 1691493
NR06_V3_1 1669536
NR06_V3_2 1664454
cfMethyl-Seq(NR06_V3)与cfRRBS(NR06_V2N)蛋白编码区域CpG位点覆盖度比较:蛋白编码区域的CpG位点直接参与调控基因的表达,与疾病的发生密切相关。从结果可以看出,在相同测试深度下,cfRRBS(NRV2N)在蛋白表达区域覆盖的CpG位点约为cfMethyl-Seq(NRV3)的1.2倍,表明通过本发明的方法建库可有效提高测序文库在蛋白表达区域的CpG位点的富集率,从而有助于疾病相关甲基化位点的筛选。
表11蛋白编码区域CpG位点覆盖度
样品 CpG covered(>=1)
NR06_V2N_1 1223642
NR06_V2N_2 1135171
NR06_V3_1 996279
NR06_V3_2 993177
实施例3:使用肿瘤病人cfDNA样本对cfMethyl-Seq与cfRRBS进行建库比较
样本情况
使用了5例肿瘤病人真实血浆样本。
实验操作
a.以新鲜采集的血液样本为材料,使用QIAGEN Circulating Nucleic Acid Kit(QIAGEN,55114)提取cfDNA;
b.在12μL的cfDNA(不足用无核酸酶水补齐)中加入3.5μL的End repair mix(mix包括2.5μL末端修饰酶buffer,1μL磷酸激酶(Vazyme,N102-0-AA/N101-0-AA)和DNA聚合酶(Takara,R001BM)),按照表12的步骤进行孵育,对cfDNA末端进行修复,形成平末端;
表12末端修复程序
步骤 温度 时间
Step 1 25℃ 30min
Step 2 56℃ 20min
Step 3 4℃ Hold for≤2h
c.在上一步产物中加入4.5μL Adapter B ligation mix(1.5μL连接mix,1μL10mM Adapter B(序列见表13,生工订制),0.5μL T4 DNA连接酶(Vazyme,N103-01)),22℃孵育1h;
表13 Adapter B序列
名称 序列(5’-3’)
Oligo_B_1 GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
Oligo_B_2 BP’-AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC
d.使用2×Ampure XP磁珠(Beckman Coulter,20212200)对上一步产物进行纯化,使用15.5μL的无核酸酶水进行洗脱,得到14μL连接产物;
e.在上一步产物中加入6.5μL Adapter A ligation mix(4μL连接mix,1μL 10mMadapter A(序列见表14,生工订制),0.5μL T4 DNA连接酶(Vazyme,N103-01),1μL限制性内切酶(NEB,R0106L)),按照表15的程序同时进行酶切和Adapter A连接;
表14 Adapter A序列
名称 序列(5’-3’)
Oligo_A_1 ACACTCTTTCCCTACACGACGCTCTTCCGATCT
Oligo_A_2 P’-GCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT
表15酶切和连接程序
步骤 温度 时间
Step 1 37℃ 30min
Step 2 20℃ 30min
Step 3 37℃ 30min
Step 4 20℃ 30min
Step 5 4℃ Hold
f.使用EZ DNA Methylation-Lightning试剂盒(Zymo Research,D5031),通过下表16所列程序参数,对cfDNA进行甲基化转化,使用22μL elution buffer进行洗脱,得到20μL转化后产物;
表16甲基化转化程序
步骤 温度 时间
Step 1 98℃ 8min
Step 2 54℃ 1h
Step 3 4℃ Up to 20h
g.在上一步转化产物中加入30μL PCR amplification mix(25μL KAPA HiFiHotStart Uracil+Readymix(Roche,07959079001),5μL xGenTMUDI Primers(IDT,10005922)),使用下表17中的PCR程序参数设定对甲基化转化后的cfDNA进行PCR扩增;
表17 PCR扩增程序
h.PCR扩增完成后,使用1.5×Ampure XP(Beckman Coulter,20212200)磁珠对扩增产物进行纯化,完成cfRRBS测序文库构建。
结果分析
cfMethyl-Seq(V3)与cfRRBS(V2)片段长度分布比较:从图6中所示的在测序文库中插入的目标片段长度(insert size)来看,使用cfMethyl-Seq(V3)与cfRRBS(V2)两种方法对肿瘤病人cfDNA样本进行建库后所得片段长度与模拟cfDNA样本一致。此结果表明使用两种方法都可以对cfDNA进行有效建库。
cfMethyl-Seq(V3)与cfRRBS(V2)CpG位点覆盖度比较:从图7的结果可以看出,在相同的测序数据量下,cfRRBS(V2)覆盖的CpG位点约为cfMethyl-Seq(V3)的两倍,此结果表明通过本发明的方法建库可大幅提高测序文库的CpG位点的富集率。
cfMethyl-Seq(V3)与cfRRBS(V2)CpG island区域CpG位点覆盖度比较:从表18的结果可以看出,在相同的测试数据量下,cfRRBS(V2)在CpG island区域覆盖的CpG位点约为cfMethyl-Seq(V3)的1.1倍。此结果表明通过本发明的方法建库后在CpG island区域可以覆盖的位点更多。
表18 CpG island区域CpG位点覆盖度比较
cfMethyl-Seq(V3)与cfRRBS(V2)蛋白编码区域CpG位点覆盖度比较:从表19的结果可以看出,在相同测试深度下,cfRRBS(V2)在蛋白编码区域覆盖的CpG位点约为cfMethyl-Seq(V3)的1.3倍,此结果表明通过本发明的方法建库后在蛋白编码区域可以覆盖的位点更多。
表19蛋白编码区域CpG位点覆盖度比较

Claims (13)

1.一种高效富集甲基化位点的甲基化测序文库的构建方法,其包括以下步骤:
(1)使用核酸修饰酶对分离的核酸进行末端修复,以形成经末端修复的核酸;
(2)将第一测序接头连接至步骤(1)中形成的所述经末端修复的核酸的两端,以得到连接第一测序接头的核酸;
(3)使用限制性内切酶对步骤(2)中产生的所述连接第一测序接头的核酸进行酶切,以得到一端连接第一测序接头的酶切核酸片段;
(4)将第二测序接头连接至步骤(3)中得到的所述一端连接第一测序接头的酶切核酸片段的另一端,以得到两端分别连接第一测序接头和第二测序接头的核酸片段;
(5)对步骤(5)中得到所述两端分别连接第一测序接头和第二测序接头的核酸片段进行扩增,以得到高效富集甲基化位点的甲基化测序文库。
2.根据权利要求1所述的方法,其中所述分离的核酸为DNA,优选地为cfDNA、ctDNA、cfDNA和ctDNA的组合、片段化DNA或损伤DNA,更优选地为获取自新鲜血液的cfDNA、ctDNA或cfDNA和ctDNA的组合。
3.根据权利要求1所述的方法,其中所述核酸分离自体液,优选地分离自血液,更优选地分离自血浆。
4.根据权利要求1所述的方法,其中步骤(1)中所述经末端修复的核酸保留其末端的连接能力。
5.根据权利要求1所述的方法,其中步骤(1)中所述经末端修复的核酸的末端为平末端,任选地为通过添加碱基形成的粘性末端。
6.根据权利要求1所述的方法,其中所述第一测序接头和所述第二测序接头为序列不同的接头。
7.根据权利要求1-6中任一项所述的方法,其中所述第一测序接头为选自SEQ ID NO:1-8的两个序列。
8.根据权利要求1-6中任一项所述的方法,其中所述第二测序接头为选自SEQ ID NO:9-13的序列。
9.根据权利要求1-6中任一项所述的方法,其中所述核酸修饰酶包括:Klenow Exo-酶、DNA聚合酶中的一种或多种或其组合。
10.根据权利要求1-6中任一项所述的方法,其中步骤(2)和步骤(4)中的测序接头连接通过使用连接酶实现,优选地通过使用DNA连接酶实现。
11.根据权利要求10所述的方法,其中所述DNA连接酶为T4DNA连接酶。
12.根据权利要求1-6所述的方法,其中所述限制性内切酶为可以特异性切割甲基化位点的酶,优选地为MspI、TaqI中的一种或多种或其组合。
13.一种甲基化测序文库,其特征在于,所述甲基化测序文库是利用如权利要求1-12中所述的方法构建的。
CN202410091297.0A 2024-01-22 2024-01-22 一种高效富集甲基化位点的甲基化测序文库建库方法 Pending CN117926429A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410091297.0A CN117926429A (zh) 2024-01-22 2024-01-22 一种高效富集甲基化位点的甲基化测序文库建库方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410091297.0A CN117926429A (zh) 2024-01-22 2024-01-22 一种高效富集甲基化位点的甲基化测序文库建库方法

Publications (1)

Publication Number Publication Date
CN117926429A true CN117926429A (zh) 2024-04-26

Family

ID=90764188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410091297.0A Pending CN117926429A (zh) 2024-01-22 2024-01-22 一种高效富集甲基化位点的甲基化测序文库建库方法

Country Status (1)

Country Link
CN (1) CN117926429A (zh)

Similar Documents

Publication Publication Date Title
CN103088433B (zh) 全基因组甲基化高通量测序文库的构建方法及其应用
EP2725125B1 (en) High throughput methylation detection method
EP3192869B1 (en) Isolated oligonucleotide and use thereof in nucleic acid sequencing
CN111183145B (zh) 高灵敏度dna甲基化分析方法
US11827933B2 (en) Bubble-shaped adaptor element and method of constructing sequencing library with bubble-shaped adaptor element
RU2733888C2 (ru) Зонд нуклеиновой кислоты и способ детектирования геномных фрагментов
EP3885445B1 (en) Methods of attaching adapters to sample nucleic acids
EP3433378B1 (en) Means and methods for amplifying nucleotide sequences
EP3098324A1 (en) Compositions and methods for preparing sequencing libraries
WO2017054302A1 (zh) 测序文库及其制备和应用
Liu et al. Analysis of genome-wide in cell free DNA methylation: progress and prospect
CN112941635A (zh) 一种提高文库转化率的二代测序建库试剂盒及其方法
CN112322700B (zh) 短rna片段文库的构建方法、试剂盒及应用
WO2022199242A1 (zh) 一组条码接头以及中通量多重单细胞代表性dna甲基化建库和测序方法
CN111989406B (zh) 一种测序文库的构建方法
CN117926429A (zh) 一种高效富集甲基化位点的甲基化测序文库建库方法
CN110923300A (zh) 一种基因甲基化的检测方法和应用
CN113943779A (zh) 一种高cg含量dna序列的富集方法及其应用
CN114774514B (zh) 一种适用于高通量靶向基因组甲基化检测的文库构建方法及其试剂盒
CN112301103B (zh) 一种非特异性扩增天然短片段核酸的方法和试剂盒
CN118006746A (zh) 基于CRISPR-dCas9的DNA靶向捕获测序方法、系统和设备
CN113490750B (zh) 微量dna甲基化高通量测序方法
KR20240085399A (ko) Dna 단편의 멀티 결합 조립 반응을 이용한 단일세포의 다중체 전장 시퀀싱 분석방법
CN116042767A (zh) 测序文库的构建方法及试剂盒
CN118562935A (zh) 一种基因组dna中8-氧代鸟嘌呤的精准定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination