CN113373207A - 确定胞嘧啶修饰的方法 - Google Patents

确定胞嘧啶修饰的方法 Download PDF

Info

Publication number
CN113373207A
CN113373207A CN202010117568.7A CN202010117568A CN113373207A CN 113373207 A CN113373207 A CN 113373207A CN 202010117568 A CN202010117568 A CN 202010117568A CN 113373207 A CN113373207 A CN 113373207A
Authority
CN
China
Prior art keywords
modification
nucleic acid
cytosine
sequencing
acid sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010117568.7A
Other languages
English (en)
Inventor
唐冲
阮凤英
石卓兴
谢烨明
何映东
杨林峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Technology Solutions Co Ltd
Original Assignee
BGI Technology Solutions Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Technology Solutions Co Ltd filed Critical BGI Technology Solutions Co Ltd
Priority to CN202010117568.7A priority Critical patent/CN113373207A/zh
Publication of CN113373207A publication Critical patent/CN113373207A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及一种确定胞嘧啶修饰的方法。该方法包括:对核酸样品进行末端修复和加A处理,以便获得末端修复产物;对所述末端修复产物进行糖基化反应,以便获得糖基化产物;将所述糖基化产物与测序接头连接,以便获得连接产物;利用纳米孔测序平台对所述连接产物进行测序,以便确定所述核酸样品中的胞嘧啶修饰;所述胞嘧啶修饰为5‑羟甲基胞嘧啶修饰。所提供的方法反应条件温和,不会对长片段DNA有较大损伤,可以实现5‑羟甲基胞嘧啶修饰的直接检测,尤其是长片段胞嘧啶修饰的检测,在羟甲基分型领域有很大的应用前景。

Description

确定胞嘧啶修饰的方法
技术领域
本发明涉及基因测序领域,具体涉及一种确定胞嘧啶修饰的方法。
背景技术
5-甲基胞嘧啶(5-methylated cytosine,5mC)和5-羟甲基胞嘧啶(5-hydroxymethylcytosine,5hmC)是表观修饰中较为常见的两种修饰,与生命体内许多重要的生命活动密切相关,分别被称为第五种碱基和第六种碱基。5mC发现较早,研究的比较透彻,研究结果表明5mC修饰与基因沉默、基因组印记及基因表达等密切相关。5hmC修饰,早先作为一种5mC去甲基化的中间产物而被发现,并未受到很大的关注。近年的研究表明,5hmC是一种重要的肿瘤筛查标志,在癌症早筛及预后领域有很大的应用前景。然而当前市场上用于检测5hmC和5mC修饰的方法都存在一定的不足。早先用于检测5hmC修饰的标准方法大都基于亚硫酸氢盐测序法做的改进,如oxBS-seq,TAB-seq测序法。亚硫酸盐这种化学物质极具破坏性,投入的DNA中99%的会被降解,只适用于短读长测序平台,可应用的样品范围有限,此外这些方法还需要结合BS-seq的数据进行分析才能准确的定位5hmC和5mC修饰位点。也有研究者尝试Pacbiao测序平台检测5hmC修饰,如hmC-seal,但对测序深度要求高,相应的测序成本也会提高,应用受到限制。Nanopore是近年来兴起的一种单分子,实时测序技术,其测序原理与传统的高通量测序技术完全不同,以单分子DNA(RNA)通过生物纳米孔的电流变化推测碱基组成而进行测序,基于此原理,nanopore平台在DNA的碱基修饰检测上有很大的应用前景。
如何实现胞嘧啶修饰的检测还需要进一步改进。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种确定胞嘧啶修饰的方法。
现有的用于检测5hmC修饰的二代高通量测序技术,常用的有OxBS-seq技术(化学氧化结合重亚硫酸盐测序技术)和TAB-seq技术。OxBS-seq技术首先通过将5hmC氧化为甲酰基修饰(5fC),进而被重亚硫酸盐处理转换为U,从而排除5hmC的干扰,实现DNA甲基化的精准检测。TAB-seq技术是对DNA样品进行糖基化处理,特异性标记5hmC位点,使其转化为β-葡糖基5-羟甲基胞嘧啶(5gmC);然后对反应后的样品进行氧化处理,将5mC氧化为5caC,而β-葡糖基5-羟甲基胞嘧啶则不会被氧化;再用亚硫酸氢盐进行处理,将不含修饰的胞嘧啶转化为尿嘧啶,将5caC转化为caU,而β-葡糖基5-羟甲基胞嘧啶保留下来。经聚合酶链式反应后,只有原始的5hmC仍然保留为胞嘧啶,从而可以在单分子水平上检测5hmC。然后这些技术大都基于亚硫酸氢盐测序法进行改进,亚硫酸氢盐极具破坏性,99%的DNA会被降解,10K长的基因组片段会被降解为1kb左右的片段,适用于短读长测序平台,应用有局限性。
三代平台用于5hmC直接检测也有相关技术发表,例如Hmc-seal技术。但是其是用在PacBio平台检测,存在测序深度要求高,存在成本高的问题。
本发明通过建库测序技术进行改进,设计了一个可以直接检测长片段基因组上胞嘧啶修饰的技术,尤其是可以用于长片段基因组上5hmC的检测。发明人在研究过程中发现,可以在纳米孔建库测序技术的基础上,引入一步糖基化反应,即在ONT常规直接连接建库过程中引入一步糖基化反应,从而可以实现5hmC的特异性糖基化修饰,将其转化为5gmC,使其修饰基团变大。这样在经纳米孔进行测序的时候会产生异于5C,5mC的电流信号,从而被直接检测出来。由此通过对电流信号的检测,可以实现胞嘧啶修饰的检测,尤其是长片段基因组上的胞嘧啶修饰的检测。
具体而言,本发明提供了如下技术方案:
在本发明的第一方面,本发明提供了一种确定核酸样品中胞嘧啶修饰的方法,包括:对所述核酸样品进行末端修复和加A处理,以便获得末端修复产物;对所述末端修复产物进行糖基化反应,以便获得糖基化产物;将所述糖基化产物与测序接头连接,以便获得连接产物;对所述连接产物进行测序,以便确定所述核酸分子上的胞嘧啶修饰;所述胞嘧啶修饰为5-羟甲基胞嘧啶修饰。
本发明所提供的确定核酸样品中胞嘧啶修饰的方法,在常规纳米孔技术的基础上,引入了一步糖基化反应。在进行糖基化反应的过程中,核酸上的5-羟甲基胞嘧啶能够被转化为β-葡糖基5-羟甲基胞嘧啶,使得其在经过纳米孔孔测序时产生特定的电流模式,从而能够会检测出来,并与5mC修饰能够很好的区分开来。所提用的方法建库反应条件温和,不会对长片段DNA有较大损伤,可以实现5hmC修饰的直接检测,尤其是长片段胞嘧啶修饰的检测,在羟甲基分型领域有很大的应用前景。本文中,所述胞嘧啶修饰可以存在于所述核酸样品的任意位置上,例如可以存在与核酸样品的任意一个位置或者任意多个位置。另外,核酸样品上存在的胞嘧啶修饰是5-羟甲基胞嘧啶修饰。
根据本发明的实施例,以上所述确定核酸样品中胞嘧啶修饰的方法可以进一步包括如下技术特征:
根据本发明的实施例,经过所述糖基化反应使得5-羟甲基胞嘧啶修饰转化为β-葡萄糖基5-羟甲基胞嘧啶修饰。
根据本发明的实施例,利用T4噬菌体β-葡糖基转移酶(T4 Phageβ-glucosyltransferase)进行所述糖基化反应。
根据本发明的实施例,利用纳米孔测序平台对所述连接产物进行测序。根据本发明的实施例,所述核酸样品的大小不作特殊限制。需要说明的是,由于本发明所提供的方法借助于纳米孔测序平台进行测序,检测,因此更适用于长片段的核酸样品中胞嘧啶修饰类型的检测。
根据本发明的实施例,所述核酸样品为基因组DNA。
根据本发明的实施例,所述方法进一步包括:基于碱基的电流信号特征,确定所述核酸分子上的胞嘧啶修饰类型。根据本发明的实施例,所提到的碱基的电流信号特征可以具体表现为碱基的电流信号大小或者其他能够区分或者辅助区分不同碱基修饰的电流信号。碱基的不同修饰就可以表现出不同的电流信号特征,以此实现胞嘧啶修饰类型的判定。
当核酸样品上胞嘧啶存在修饰时,其在利用纳米孔测序平台进行检测时,修饰位点及相邻位点的电流信号特征均表现出与未修饰的胞嘧啶所不同的电流信号特征。因此可以基于至少连续3个碱基的电流信号特征,通过识别这种修饰碱基以及前后碱基经过纳米孔产生的电流信号特征,确定所含样品的胞嘧啶修饰。根据本发明的实施例,可以基于至少连续3个碱基的电流信号特征,确定所述核酸样品上的胞嘧啶类型。根据本发明实施例,可以基于至少连续4个碱基的电流信号特征,确定所述核酸样品上的胞嘧啶类型。还可以分析至少5个碱基的电流信号特征。
根据本发明的实施例,基于β-葡糖基5-羟甲基胞嘧啶修饰所产生的电流信号特征,确定所述核酸分子上含有5-羟甲基胞嘧啶修饰。根据本发明的实施例,所述5-甲基胞嘧啶修饰和5-羟甲基胞嘧啶修饰的区分度至少为99%以上,优选为99.5%以上。所提到的区分度是指用于区分5-甲基胞嘧啶修饰和5-羟甲基胞嘧啶修饰的程度,该值越大,表明效果越好。当区分度值为100%时,即表明能完全地、没有任何误差的实现两种胞嘧啶修饰的区分。
在本发明的第二方面,本发明提供了一种确定胞嘧啶修饰的方法,包括:对核酸样品进行建库,测序,以便确定所述核酸样品中的胞嘧啶修饰;其中所述建库包括对所述核酸样品进行糖基化反应;所述胞嘧啶修饰为5-羟甲基胞嘧啶修饰。通过该方法,能够实现5-甲基胞嘧啶修饰和5-羟甲基胞嘧啶修饰的99%以上的区分度,例如可以实现99.5%以上的区分度,甚至是99.8%以上的区分度。
根据本发明的实施例,利用T4噬菌体β-葡糖基转移酶进行所述糖基化反应对所述核酸样品进行糖基化反应。根据本发明的实施例,利用纳米孔测序平台进行所述测序,更适用于长片段的核酸样品中胞嘧啶修饰类型的检测。
附图说明
图1是根据本发明的实施例提供的利用T4噬菌体β-葡糖基转移酶5-羟甲基胞嘧啶进行糖基化反应的示意图。
图2是根据本发明的实施例提供的对带有5hmC修饰的核酸分子进行建库的原理图。
图3是根据本发明的实施例提供的对含有修饰的PCR产物经过纯化后的质检结果图。
图4是根据本发明的实施例提供的带有不同胞嘧啶修饰的核酸分子经过测序的平均电流信号结果图。
具体实施方式
下面详细描述本发明的实施例,需要说明的是,所描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
本发明提供了一种确定胞嘧啶修饰的方法,包括:利用纳米孔测序平台对核酸样品进行建库,测序,以便确定所述核酸样品中的胞嘧啶修饰;其中,所述建库包括对所述核酸样品进行糖基化反应;所述胞嘧啶修饰为5-羟甲基胞嘧啶修饰。
本发明在ONT常规的直接连接测序试剂盒的标准建库流程中,引入一步糖基化反应,特异性修饰5-羟甲基胞嘧啶(5hmC)位点,将其转换为β-葡萄糖基-5-羟甲基胞嘧啶(5gmC),改变其在经纳米孔测序时产生的电流模式,使其能够被检测出来,并与5mC修饰能够很好的区分开来。由于建库反应条件比较温和,不会对长片段DNA有较大的损伤,可实现5hmC修饰的长片段直接检测,在羟甲化分型领域有很大的应用前景。
其中所述糖基化反应可以借助于T4噬菌体β-葡糖基转移酶(T4 Phageβ-glucosyltransferase)进行。其中所用到的T4噬菌体β-葡糖基转移酶(T4 Phageβ-glucosyltransferase)是由T4噬菌体编码的一个DNA修饰酶,其能特异性地将尿嘧啶二磷酸葡萄糖(UDP-Glc)的葡萄糖基团转移至双链DNA的5-羟甲基胞嘧啶残基上,形成β-葡糖基-5-羟甲基胞嘧啶,如图1所示。所用到的T4噬菌体β-葡糖基转移酶可以制备而成,也可以直接通过购买获得。若有其他酶能够实现上述功能,即5-羟甲基胞嘧啶糖基化为β-葡糖基-5-羟甲基胞嘧啶,也包含在本发明的保护范围之内。
所提供的建库过程中基因组打断以及末端修复步骤与常规ONT直接连接测序试剂盒建库步骤一致,不同的是在末端修复以及加A尾这一步后引入了一步糖基化反应,将5hmC修饰转化为5gmC,然后连接上ONT的测序接头(SQK-LSK109)进行上机测序。催化糖基化反应的酶为T4-BGT(NEB试剂盒,也有其他酶),反应过程如图2所示。
核酸样品可以是基因组序列。例如,可以包括基因序列的全部或者部分,包括外显子、内含子或者上游或者下游调控基因的基因序列,也可以是与基因无关的基因组序列。所适用的核酸样品可以是DNA,优选为基因组DNA,和RNA。核酸样品可以是从细胞样品中得到或者分离的,所述细胞样品例如可以为哺乳动物细胞,优选为人类细胞。细胞样品可以是体细胞,也可以是生殖系细胞。核酸样品也可以是组织样品。从细胞样品中或者组织样品中分离获得基因组DNA和RNA的方法也是本领域公知的。例如,可以采用苯酚/氯仿提取技术配合一些分离技术获得基因组DNA和RNA。
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1
实施例1对含有不同修饰的双链DNA片段进行建库、测序,并对测序结果进行分析。带有不同修饰的双链DNA片段通过以Lambada DNA为模板,利用PCR引物进行扩增获得。带有不同修饰的双链DNA片段分别如下:
仅含有一个5hmC修饰位点的双链DNA片段(其对应的单链片段为SEQ ID NO:1);
仅含有一个5mC修饰位点的双链DNA片段(其对应的单链片段为SEQ ID NO:2);
利用SEQ ID NO:1进行糖基化反应获得的仅含有一个5gmC修饰位点的双链DNA片段(其对应的单链片段为SEQ ID NO:3)。
其中各序列信息分别如下:
5hmC:
CATGCAATTACAACAT5hmCAGGGTAACTCATAGAAATGGTGCTATTAAGCATATTTTTTACACGAATCAGATCCACGGAGGGATCATCAGCAGATTGTTCTTTATTCATTTTGTCGCTCCATGCGCTTGCTCTTCATCTAGCGGTTAAAATATTACTTCAAATCTTTCTGTATGAAGATTTGAGCACGTTGGCCTTACATACATCTGTCGGTTGTATTTCCCTCCAGAATGCCAGCAGGACCGCACTTTGTTACGCAACCAATACTATTAAGTGAAAACATTCCTAATATTTGACATAAATCATCAACAAAACACAAGGAGGTCAGACCAGATTGAAACGATAAAAACGATAATGCAAACTACGCGCCCTCGTATCACATGGAAGGTTTTACCAATGGCTCAGGTTGCCATTTTTAAAGAAATATTCGATCAAGTGCGAAAAGATTTAGACTGTGAATTGTTTTATTCTGAACTAAAACGTCACAACGTCTCACATTATATTTACTATCTAGCCACAGATAATATTCACATCGTGTTAGAAAACGATAACACCGTGTTAATAAAAGGACTTAAAAAGGTTGTAAATGTTAAATTCTCAAGAAACACGCATCTTATAGAAACGTCCTATGATAGGTTGAAATCAAGAGAAATCACATTTCAGCAATACAGGG(SEQID NO:1)。
5mC:
CATGCAATTACAACAT5mCAGGGTAACTCATAGAAATGGTGCTATTAAGCATATTTTTTACACGAATCAGATCCACGGAGGGATCATCAGCAGATTGTTCTTTATTCATTTTGTCGCTCCATGCGCTTGCTCTTCATCTAGCGGTTAAAATATTACTTCAAATCTTTCTGTATGAAGATTTGAGCACGTTGGCCTTACATACATCTGTCGGTTGTATTTCCCTCCAGAATGCCAGCAGGACCGCACTTTGTTACGCAACCAATACTATTAAGTGAAAACATTCCTAATATTTGACATAAATCATCAACAAAACACAAGGAGGTCAGACCAGATTGAAACGATAAAAACGATAATGCAAACTACGCGCCCTCGTATCACATGGAAGGTTTTACCAATGGCTCAGGTTGCCATTTTTAAAGAAATATTCGATCAAGTGCGAAAAGATTTAGACTGTGAATTGTTTTATTCTGAACTAAAACGTCACAACGTCTCACATTATATTTACTATCTAGCCACAGATAATATTCACATCGTGTTAGAAAACGATAACACCGTGTTAATAAAAGGACTTAAAAAGGTTGTAAATGTTAAATTCTCAAGAAACACGCATCTTATAGAAACGTCCTATGATAGGTTGAAATCAAGAGAAATC
ACATTTCAGCAATACAGGG(SEQ ID NO:2)
5gmC:
CATGCAATTACAACAT5gmCAGGGTAACTCATAGAAATGGTGCTATTAAGCATATTTTTTACACGAATCAGATCCACGGAGGGATCATCAGCAGATTGTTCTTTATTCATTTTGTCGCTCCATGCGCTTGCTCTTCATCTAGCGGTTAAAATATTACTTCAAATCTTTCTGTATGAAGATTTGAGCACGTTGGCCTTACATACATCTGTCGGTTGTATTTCCCTCCAGAATGCCAGCAGGACCGCACTTTGTTACGCAACCAATACTATTAAGTGAAAACATTCCTAATATTTGACATAAATCATCAACAAAACACAAGGAGGTCAGACCAGATTGAAACGATAAAAACGATAATGCAAACTACGCGCCCTCGTATCACATGGAAGGTTTTACCAATGGCTCAGGTTGCCATTTTTAAAGAAATATTCGATCAAGTGCGAAAAGATTTAGACTGTGAATTGTTTTATTCTGAACTAAAACGTCACAACGTCTCACATTATATTTACTATCTAGCCACAGATAATATTCACATCGTGTTAGAAAACGATAACACCGTGTTAATAAAAGGACTTAAAAAGGTTGTAAATGTTAAATTCTCAAGAAACACGCATCTTATAGAAACGTCCTATGATAGGTTGAAATCAAGAGAAATCACATTTCAGCAATACAGGG(SEQID NO:3)
具体的建库、测序流程以纳米孔测序技术为参考。例如可以参考记载于ONT常规连接测序试剂盒进行建库和测序(流程见https://community.nanoporetech.com/protocols/gDNA-sqk-lsk109/v/GDE_9063_v109_revK_14Aug2019对应的文件名为“sequence-capture-sqk-lsk109-SCE_9075_v109_revK_14Aug2019-minion”,中文网站可参考https://nanopore.yilimart.com/static/images/media/1D%20Lambda%20Control%20Experiment%20(SQK-LSK109).pdf)。
具体包括如下步骤:
1含单个5hmC位点dsDNA合成
1.1 dsDNA合成
以Lambada DNA为模板,利用试剂盒KAPA HiFi HotStart Uracil+ReadyMix(2X)(购自于KAPA)通过PCR扩增合成上述提到的SEQ ID NO:1~SEQ ID NO:3。
1)按表1配置反应体系:
表1反应体系
试剂名称 单管用量(μL)
Lambada DNA(5ng/μl) 1
F primer(10μM) 2
R primer(10μM) 2
无核酸酶水(NF water) 20
KAPA HiFi HotStart ReadyMix 25
总体积 50
分别以Lambada DNA为模板,利用不同的引物分别扩增出含有5hmC和5mC的DN A片段(分别按照上述表1的反应体系,在不同的反应体系中制备获得)。
其中Lambada DNA分子序列可以直接在数据库中获得,相应的网址为https:// international.neb.com/-/media/nebus/page-images/tools-and-resources/ interactive-tools/dna-sequences-and-maps/text-documents/lambdagbk.txt?la=en& rev=50c75f4579114750a9ad75d892d7d118&hash=DAB59C3E72D27D3681CF574A3F24BA19 0A3A6D0C
其中,针对于5hmC PCR产物,所用到的R Primer的序列为5’–CATGCAATTACA ACAT/55HydMe-dC/AGGGTAAC-3’(SEQ ID NO:4);所用到的F primer序列为5’–CCCTGTATTGCTGAAATGTGATTTC-3’(SEQ ID NO:5)。从而获得含有一个5hmc修饰位点的双链DNA片段(其对应的单链片段为SEQ ID NO:1);
针对于5mC PCR产物,所用到的R Primer的序列为5’–CATGCAATTACAACAT/i5MedC/AGGGTAAC-3’(SEQ ID NO:6);所用到的F primer序列与上述F primer序列一致。仅含有一个5mC修饰位点的双链DNA片段(其对应的单链片段为SEQ ID NO:2)。
其中:序列中55HydMe-dC为5hmC修饰碱基,i5MedC为5mC修饰,主要有两个作用:第一,在新扩增的PCR产物上引入5hmC修饰位点(或者5mC修饰位点);第二,可以帮助知道5hmC修饰的确切位置,有利于生信分析来更好的评估本发明的有效性。
2)反应体系配好后,混匀并短暂离心,置于PCR仪上反应,反应条件如下表2,由此获得含有不同修饰的双链DNA。利用
Figure BDA0002391965290000071
dsDNA HS Assay Kit(Invitrogen)试剂盒进行定量,总量达1μg即可。
表2反应条件
反应条件 反应时间 循环数
95℃ 2min 1
98℃ 20s 15
60℃ 15s 15
72℃ 40s 15
72℃ 2min 1
4℃ hold
1.2样品纯化
利用试剂盒对上述步骤1.1获得的含有不同修饰的PCR产物进行纯化,所用到的试剂盒为AGENCOURT AMPURE XP-MEDIUM(购自于AGENCOURT,货号为A63882),包括如下步骤:
1)取1倍体积(50μl)的AMPure PB磁珠加入到装有到PCR产物的1.5mL离心管中,混匀并瞬离。
2)将离心管放于ThemoMixer上,20℃,2000rpm,离心10min。
3)取出,短离2s。
4)离心管转移放置于磁力架上,静止至澄清。
5)吸取上清液。加入300μL 75%乙醇,弃上清。
6)重复上一步骤一次,将去上清后的离心管短离2s,放于磁力架上静止至澄清,去掉残留的乙醇。
7)开盖晾干1min后,用41μL洗脱缓冲液回溶,放于ThemoMixer上,20℃,2000rpm,10min。
8)10min结束后,取出离心管,短离2s,放置于磁力架上,静止至澄清,吸取上清液,回收于另一个标记好的1.5mL离心管中。
9)取1μL纯化好的样品稀释至10倍左右,取1μL稀释液进行Qubit检测,并稀释至0.5ng/μl左右进行2100质检(使用DNA high sensitive Kit,购自Agilent),质检结果如图3所示。图3示出的为带有5hmC修饰的PCR产物的质检结果图。质检结果表明经过纯化获得目标片段。
2末端修复(使用
Figure BDA0002391965290000081
UltraTMII End Repair/dA-Tailing Module&
Figure BDA0002391965290000082
FF PE DNA Repair Mix)
对纯化后的PCR产物进行末端修复,所用到的试剂盒为
Figure BDA0002391965290000083
UltraTMII EndRe pair/dA-Tailing Module(购自于NEB,货号为M0357S)以及
Figure BDA0002391965290000091
FFPE DNARepair Mix(购自于NEB,货号为M6630L),包括如下步骤:
2.1末端修复
按照表3配制末端修复反应体系。
表3末端修复反应体系
试剂 体积/μL
纯化后的PCR产物 300ng for 5mC,300ng for 5hmC
NEBNext Ultra II End Prep Reaction Buffer 3.5μl
NEBNext Ultra II End Prep Enzyme Mix 3μl
NEBNext FFPE DNA Repair Buffer 3.5μl
NEBNext FFPE DNA Repair Mix 2μl
NF water Up to 60μl
混匀后20℃反应15min,65℃反应15min,获得末端修复产物,4℃保持。
2.2末端修复产物纯化(使用AGENCOURT AMPURE XP)
利用试剂盒对上述步骤2.1获得的末端修复产物进行纯化,所用到的试剂盒为AGENCOURT AMPURE XP-MEDIUM(购自于AGENCOURT,货号为A63882),包括如下步骤:
1)取1倍体积(60μl)的AMPure PB磁珠加入到装有到PCR产物的1.5mL离心管中,混匀并瞬离。
2)将离心管放于ThemoMixer上,20℃,2000rpm,离心10min。
3)取出,短离2s。
4)离心管转移放置于磁力架上,静止至澄清。
5)吸取上清液。加入300μL 75%乙醇,弃上清。
6)重复上一步骤一次,将去上清后的离心管短离2s,放于磁力架上静止至澄清,去掉残留的乙醇。
7)开盖晾干1min后,用16μL洗脱缓冲液回溶,放于ThemoMixer上,20℃,2000rpm,离心10min。
8)取出离心管,短离2s,放置于磁力架上,静止至澄清,吸取上清液,回收于另一个标记好的1.5mL离心管中。
9)取1μL纯化好的样品稀释至5倍左右,取1μL稀释液进行Qubit检测。
针对带有5mC修饰的末端修复纯化产物停留在此步,带有5hmC修饰的末端修复纯化产物进行后续的反应糖基化反应。
3糖基化反应
3.1糖基化反应
利用T4 Phageβ-glucosyltransferase(购自于NEB,货号为M0357S)对带有5hmC的末端修复纯化产物进行糖基化反应,反应体系如下表4所示:
表4糖基化反应体系
试剂 体积/μl
带有5hmC修饰的末端修复纯化产物 15μl
10X CutSmart Buffer 2μl
UDP-Glucose 2mM 0.4μl
T4-BGT(10U/μl) 1μl
NF water Up to 20μl
混匀后,37℃反应过夜,获得糖基化反应产物。
3.2糖基化反应产物纯化
利用试剂盒对上述步骤3.1获得的糖基化反应产物进行纯化,所用到的试剂盒为AGENCOURT AMPURE XP-MEDIUM(购自于AGENCOURT,货号为A63882),包括如下步骤:
1)加入30μl无核酸酶水到糖基化反应产物中,转移至1.5mL离心管中,加入1倍体积(50μl)的AMPure PB磁珠,混匀并瞬离。
2)将离心管放于ThemoMixer上,20℃,2000rpm,离心10min。
3)取出,短离2s。
4)离心管转移放置于磁力架上,静止至澄清。
5)吸取上清液。加入200μL 75%乙醇,弃上清。
6)重复上一步骤一次,将去上清后的离心管短离2s,放于磁力架上静止至澄清,去掉残留的乙醇。
7)开盖晾干1min后,用61μL洗脱缓冲液回溶,放于ThemoMixer上,20℃,2000rpm,离心10min。
8)10min结束后,取出离心管,短离2s,放置于磁力架上,静止至澄清,吸取上清液,回收于另一个标记好的1.5mL离心管中。
9)取1μL稀释液进行Qubit检测。
同时经过质谱鉴定糖基化反应的效率经在98%以上。
4测序接头连接
4.1测序接头连接
利用试剂盒对上述步骤2所获得的带有5mC修饰的末端修复纯化产物,以及步骤3所获得的糖基化纯化产物连接测序接头,所用到的的试剂盒为
Figure BDA0002391965290000111
Quick LigationModule(购自于NEB,货号为E6056L)以及Ligation Sequencing Kit 1D(厂家为nanopore,货号为SQK-LSK109),包括如下步骤:
a)取出LSK109试剂盒里的Adapter Mix I和NEB Quick T4 DNA Ligase,短暂离心后冰上放置;
b)取出Elution Buffer(EB)和NEB Next Quick Ligation Reaction Buffer(5x)室温溶解后震荡混匀,冰上放置。取出Ligation buffer(LNB)粘度较大,室温溶解后,用枪头吸打混匀。5xbuffer容易产生沉淀,使用前要仔细观察沉淀是否都已溶解。
c)取出回收短片段用的S Fragment Buffer(LFB),室温溶解后震荡混匀,冰上放置;
d)按照下表顺序添加各组分,每个组分添加后都要轻弹混匀:
表5反应体系
试剂 体积/μl
DNA 60μl
NEB Next Quick Ligation Reaction Buffer(5X) 25μl
Quick T4 DNA Ligase 10μl
Adapter Mix 5μl
Total 100μl
e)轻弹混匀后短暂离心。
f)室温孵育10min。
4.2接头连接后纯化
利用试剂盒AGENCOURT AMPURE XP-MEDIUM(购自于AGENCOURT,货号为A63882)以及Ligation Sequencing Kit 1D(厂家为nanopore,货号为SQK-LSK109)对接头连接后的产物进行纯化,包括如下步骤:
a)待孵育完成后,加入40μl震荡混匀后的AMPure XP beads并轻弹离心管混匀;
b)将离心管放置于thermomixer 400rpm(或垂直混匀仪)上室温孵育5min;
c)瞬时离心后放置于磁力架上,待液体澄清后去掉上清;
d)取下离心管,加入250ul S Fragment Buffer(SFB)并轻弹至完全混匀,瞬时离心后重新放置于磁力架上,待液体澄清后去掉上清;
e)重复步骤d);
f)取下离心管,瞬时离心后重新放置于磁力架上,用10μl枪头吸头吸出残留液体,干燥30s;
g)取下离心管,加入15μl Elution Buffer(EB)轻弹混匀,室温孵育10min;
h)将离心管瞬时离心后,放置于磁力架上,待液体澄清后取出14μl上清于新的1.5mL低吸附离心管中,取1μl测定浓度,计算得率。
i)建库完毕,将文库放在冰上保存,等待上机。
5上机测序
按ONT测序芯片制备试剂盒(Flow Cell Priming Kit(厂家nanopore,EXP-FLP002))说明书要求制备上机文库并测序,使用芯片为FLO-MIN106 flow cells(厂家nanopore,R9.4.1)。测试完的芯片如可用孔数大于500.可继续使用,用Wash Kit(厂家nanopore,EXP-WSH002)清洗芯片,具体操作见说明书。
6测序结果
图4为带有5mC修饰,5hmC修饰以及5gmC修饰的下机数据平均电流信号结果。从测试结果可以看出,测试结果中含有3批数据,分别为5hmC,5gmC以及5mC,这三批数据原始序列除了第17位的胞嘧啶修饰不一样,其他位置均为同一碱基。
我们将测序结果中的每个碱基位置的平均电流信号提取出来,图中展示的是第14位至第20位的平均电流信号。从图中可以看出,第17位碱基上的修饰不仅影响其本身的平均电流信号,对前后两个碱基的电流信号也有一定的影响。从图中也可以明显的看到,5gmC和5mC这两批数据在第16位和第17位碱基的电流变化差异相较于5hmC与5mC的电流变化差异有明显的提升。在第18位和第19位碱基,5hmC与5mC基本无差异,但是经糖基化反应将5hmC转化为5gmC后,5gmC与5mC的差异相较于5hmC与5mC有明显的提升,表明本技术能够很好的将5gmC与5mC区分开来。
我们同时也将5hmC,5gmC,5mC的数据进行了训练集分析,构建神经网络模型,利用该模型对下机数据进行分析,判定有无羟甲基胞嘧啶修饰。
以5hmC和5mC的区分度训练集分析为例,取5hmC和5mC测序数据的60%构建生信区分模型,10%的数据验证该模型区分5hmC和5mC的准确度,结果是在98%左右,生信结果表明5hmC和5mC的区分度为98%。同样地,将5hmC转化为5gmC后,5gmC与5mC的区分度为99.5%,由此表明通过糖基化反应,然后再利用纳米孔测序平台进行测序,将5hmC与5mC的区分度至少提高了1.5%。
在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
SEQUENCE LISTING
<110> 深圳华大基因科技服务有限公司
<120> 确定胞嘧啶修饰的方法
<130> PIDC3195503
<160> 6
<170> PatentIn version 3.5
<210> 1
<211> 669
<212> DNA
<213> Artificial Sequence
<220>
<223> 仅含有一个5hmc修饰位点的片段
<220>
<221> misc_feature
<222> (17)..(17)
<223> 5hmc修饰
<400> 1
catgcaatta caacatcagg gtaactcata gaaatggtgc tattaagcat attttttaca 60
cgaatcagat ccacggaggg atcatcagca gattgttctt tattcatttt gtcgctccat 120
gcgcttgctc ttcatctagc ggttaaaata ttacttcaaa tctttctgta tgaagatttg 180
agcacgttgg ccttacatac atctgtcggt tgtatttccc tccagaatgc cagcaggacc 240
gcactttgtt acgcaaccaa tactattaag tgaaaacatt cctaatattt gacataaatc 300
atcaacaaaa cacaaggagg tcagaccaga ttgaaacgat aaaaacgata atgcaaacta 360
cgcgccctcg tatcacatgg aaggttttac caatggctca ggttgccatt tttaaagaaa 420
tattcgatca agtgcgaaaa gatttagact gtgaattgtt ttattctgaa ctaaaacgtc 480
acaacgtctc acattatatt tactatctag ccacagataa tattcacatc gtgttagaaa 540
acgataacac cgtgttaata aaaggactta aaaaggttgt aaatgttaaa ttctcaagaa 600
acacgcatct tatagaaacg tcctatgata ggttgaaatc aagagaaatc acatttcagc 660
aatacaggg 669
<210> 2
<211> 669
<212> DNA
<213> Artificial Sequence
<220>
<223> 仅含有一个5mc修饰位点的片段
<220>
<221> misc_feature
<222> (17)..(17)
<223> 5mc修饰
<400> 2
catgcaatta caacatcagg gtaactcata gaaatggtgc tattaagcat attttttaca 60
cgaatcagat ccacggaggg atcatcagca gattgttctt tattcatttt gtcgctccat 120
gcgcttgctc ttcatctagc ggttaaaata ttacttcaaa tctttctgta tgaagatttg 180
agcacgttgg ccttacatac atctgtcggt tgtatttccc tccagaatgc cagcaggacc 240
gcactttgtt acgcaaccaa tactattaag tgaaaacatt cctaatattt gacataaatc 300
atcaacaaaa cacaaggagg tcagaccaga ttgaaacgat aaaaacgata atgcaaacta 360
cgcgccctcg tatcacatgg aaggttttac caatggctca ggttgccatt tttaaagaaa 420
tattcgatca agtgcgaaaa gatttagact gtgaattgtt ttattctgaa ctaaaacgtc 480
acaacgtctc acattatatt tactatctag ccacagataa tattcacatc gtgttagaaa 540
acgataacac cgtgttaata aaaggactta aaaaggttgt aaatgttaaa ttctcaagaa 600
acacgcatct tatagaaacg tcctatgata ggttgaaatc aagagaaatc acatttcagc 660
aatacaggg 669
<210> 3
<211> 669
<212> DNA
<213> Artificial Sequence
<220>
<223> 仅含有一个5gmc修饰位点的片段
<220>
<221> misc_feature
<222> (17)..(17)
<223> 5gmc修饰
<400> 3
catgcaatta caacatcagg gtaactcata gaaatggtgc tattaagcat attttttaca 60
cgaatcagat ccacggaggg atcatcagca gattgttctt tattcatttt gtcgctccat 120
gcgcttgctc ttcatctagc ggttaaaata ttacttcaaa tctttctgta tgaagatttg 180
agcacgttgg ccttacatac atctgtcggt tgtatttccc tccagaatgc cagcaggacc 240
gcactttgtt acgcaaccaa tactattaag tgaaaacatt cctaatattt gacataaatc 300
atcaacaaaa cacaaggagg tcagaccaga ttgaaacgat aaaaacgata atgcaaacta 360
cgcgccctcg tatcacatgg aaggttttac caatggctca ggttgccatt tttaaagaaa 420
tattcgatca agtgcgaaaa gatttagact gtgaattgtt ttattctgaa ctaaaacgtc 480
acaacgtctc acattatatt tactatctag ccacagataa tattcacatc gtgttagaaa 540
acgataacac cgtgttaata aaaggactta aaaaggttgt aaatgttaaa ttctcaagaa 600
acacgcatct tatagaaacg tcctatgata ggttgaaatc aagagaaatc acatttcagc 660
aatacaggg 669
<210> 4
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> 应用于5hmc的R 引物
<220>
<221> misc_feature
<222> (17)..(17)
<223> 55HydMe-dC修饰
<400> 4
catgcaatta caacatcagg gtaac 25
<210> 5
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> F 引物
<400> 5
ccctgtattg ctgaaatgtg atttc 25
<210> 6
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> 应用于5mc 的R 引物
<220>
<221> misc_feature
<222> (17)..(17)
<223> i5MedC修饰
<400> 6
catgcaatta caacatcagg gtaac 25

Claims (10)

1.一种确定核酸样品中胞嘧啶修饰的方法,其特征在于,包括:
对所述核酸样品进行末端修复和加A处理,以便获得末端修复产物;
对所述末端修复产物进行糖基化反应,以便获得糖基化产物;
将所述糖基化产物与测序接头连接,以便获得连接产物;
对所述连接产物进行测序,以便确定所述核酸样品中的胞嘧啶修饰;
其中,所述胞嘧啶修饰为5-羟甲基胞嘧啶修饰。
2.根据权利要求1所述的方法,其特征在于,经过所述糖基化反应使得5-羟甲基胞嘧啶修饰转化为β-葡糖基5-羟甲基胞嘧啶修饰。
3.根据权利要求2所述的方法,其特征在于,利用T4噬菌体β-葡糖基转移酶进行所述糖基化反应。
4.根据权利要求1所述的方法,其特征在于,利用纳米孔测序平台对所述连接产物进行测序。
5.根据权利要求1所述的方法,其特征在于,所述核酸样品为基因组DNA。
6.根据权利要求1所述的方法,其特征在于,进一步包括:
基于碱基的电流信号特征,确定所述核酸样品上的胞嘧啶修饰类型;
任选地,基于至少连续3个碱基的电流信号特征,确定所述核酸样品上的胞嘧啶修饰类型。
7.根据权利要求6所述的方法,其特征在于,进一步包括:
基于β-葡糖基5-羟甲基胞嘧啶修饰所产生的电流信号特征,确定所述核酸样品上含有5-羟甲基胞嘧啶修饰。
8.一种确定胞嘧啶修饰的方法,其特征在于,包括:
对核酸样品进行建库,测序,以便确定所述核酸样品中的胞嘧啶修饰;
其中,所述建库包括对所述核酸样品进行糖基化反应;
所述胞嘧啶修饰为5-羟甲基胞嘧啶修饰。
9.根据权利要求8所述的方法,其特征在于,利用T4噬菌体β-葡糖基转移酶进行所述糖基化反应对所述核酸样品进行糖基化反应。
10.根据权利要求8所述的方法,其特征在于,利用纳米孔测序平台进行所述测序。
CN202010117568.7A 2020-02-25 2020-02-25 确定胞嘧啶修饰的方法 Pending CN113373207A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010117568.7A CN113373207A (zh) 2020-02-25 2020-02-25 确定胞嘧啶修饰的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010117568.7A CN113373207A (zh) 2020-02-25 2020-02-25 确定胞嘧啶修饰的方法

Publications (1)

Publication Number Publication Date
CN113373207A true CN113373207A (zh) 2021-09-10

Family

ID=77569359

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010117568.7A Pending CN113373207A (zh) 2020-02-25 2020-02-25 确定胞嘧啶修饰的方法

Country Status (1)

Country Link
CN (1) CN113373207A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117004717A (zh) * 2023-05-10 2023-11-07 上海鲸舟基因科技有限公司 一种特异性检测5hmC的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104480214A (zh) * 2014-12-30 2015-04-01 深圳市易基因科技有限公司 羟甲基化暨甲基化长序列标签测序技术
WO2019136413A1 (en) * 2018-01-08 2019-07-11 Ludwig Institute For Cancer Research Ltd Bisulfite-free, base-resolution identification of cytosine modifications
WO2019239218A2 (en) * 2018-06-14 2019-12-19 Cambridge Epigenetix Limited Determination of epigenetic modifications by nanopore sequencing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104480214A (zh) * 2014-12-30 2015-04-01 深圳市易基因科技有限公司 羟甲基化暨甲基化长序列标签测序技术
WO2019136413A1 (en) * 2018-01-08 2019-07-11 Ludwig Institute For Cancer Research Ltd Bisulfite-free, base-resolution identification of cytosine modifications
WO2019239218A2 (en) * 2018-06-14 2019-12-19 Cambridge Epigenetix Limited Determination of epigenetic modifications by nanopore sequencing

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117004717A (zh) * 2023-05-10 2023-11-07 上海鲸舟基因科技有限公司 一种特异性检测5hmC的方法

Similar Documents

Publication Publication Date Title
CN109609647B (zh) 基于二代测序的用于泛癌种靶向、化疗及免疫用药的检测Panel、检测试剂盒及其应用
CN106906211B (zh) 一种分子接头及其应用
CN111440896B (zh) 一种新型β冠状病毒变异检测方法、探针和试剂盒
CN107217095B (zh) 人类亲权鉴定用多重pcr引物组及检测方法
CN107541791A (zh) 血浆游离dna甲基化检测文库的构建方法、试剂盒及应用
CN110628880B (zh) 一种同步使用信使rna与基因组dna模板检测基因变异的方法
CN111808854B (zh) 带有分子条码的平衡接头及快速构建转录组文库的方法
WO2013075629A1 (zh) 一种检测核酸羟甲基化修饰的方法及其应用
CN112176057B (zh) 利用CpG位点甲基化水平检测胰腺导管腺癌的标志物及其应用
CN107142320B (zh) 用于检测肝癌的基因标志物及其用途
CN107988372A (zh) 一种检测结直肠癌易感基因突变的试剂盒及其检测方法
CN114317762B (zh) 用于检测早期肝癌的三标记物组合物及其试剂盒
CN115786459B (zh) 一种应用于高通量测序检测实体瘤微小残留病的方法
CN111748637A (zh) 一种用于亲缘关系分析鉴定的snp分子标记组合、多重复合扩增引物组、试剂盒及方法
CN113373207A (zh) 确定胞嘧啶修饰的方法
CN112662761A (zh) 一种检测3种实质性器官肿瘤的探针组合物
CN114438210B (zh) 一种基于高通量测序子宫内膜癌分子分型的文库构建方法
CN112662759A (zh) 一种检测3种管腔性器官肿瘤的探针组合物
CN113025702B (zh) 强直性脊柱炎易感基因的早筛方法及试剂盒
CN114058681A (zh) 一种基于目标区域捕获的甲基化突变检测方法及试剂盒
CN113151428A (zh) 一种检测文库构建过程中样本混淆的方法和装置
CN107904297B (zh) 用于微生物多样性研究的引物组、接头组和测序方法
CN114657248B (zh) 用于检测早期结直肠癌的血浆游离dna甲基化生物标记物或其组合物、应用及试剂盒
CN112063690A (zh) 单分子探针多重靶向捕获文库的构建方法及应用
CN112831558B (zh) 克罗恩病易感基因的早筛方法及试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination