CN118006746A - 基于CRISPR-dCas9的DNA靶向捕获测序方法、系统和设备 - Google Patents

基于CRISPR-dCas9的DNA靶向捕获测序方法、系统和设备 Download PDF

Info

Publication number
CN118006746A
CN118006746A CN202410176777.7A CN202410176777A CN118006746A CN 118006746 A CN118006746 A CN 118006746A CN 202410176777 A CN202410176777 A CN 202410176777A CN 118006746 A CN118006746 A CN 118006746A
Authority
CN
China
Prior art keywords
dcas9
sgrna
sequence
dna
target sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410176777.7A
Other languages
English (en)
Inventor
王姣
张晓丽
邓涛
常玉俊
朱修篁
蔚跃
赵丽倩
孙立超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Capitalbio Medlab Co ltd
Original Assignee
Beijing Capitalbio Medlab Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Capitalbio Medlab Co ltd filed Critical Beijing Capitalbio Medlab Co ltd
Priority to CN202410176777.7A priority Critical patent/CN118006746A/zh
Publication of CN118006746A publication Critical patent/CN118006746A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种基于CRISPR‑dCas9的DNA靶向捕获测序方法、系统、设备、介质和程序产品,涉及精准医疗领域。所述方法包括:获取包含有靶序列的DNA序列;所述靶序列包括:200‑1000bp的序列、大于等于1000bp的序列、小于等于200bp的序列;获取dCas9‑sgRNA复合物;混合所述DNA序列和所述dCas9‑sgRNA复合物,所述dCas9‑sgRNA复合物捕获所述DNA序列中的靶序列,得到dCas9‑sgRNA复合物与靶序列相结合的dCas9‑sgRNA‑DNA复合物,进而获得靶标DNA的分离和富集。本发明解决现有靶向测序操作复杂、耗时长、成本高的问题,不仅适用于常规长度核酸片段的捕获,还可以直接对超长和超短核酸进行捕获。

Description

基于CRISPR-dCas9的DNA靶向捕获测序方法、系统和设备
技术领域
本发明涉及生物医学技术领域,更具体地,涉及一种基于CRISPR-dCas9的DNA靶向捕获测序方法、系统、设备、介质和程序产品。
背景技术
目前的医疗,特别是个性化或精准医疗,越来越依赖于DNA分析。临床样品中的DNA越来越多地用于寻找疾病的诊断,预后和预测生物标志物。随着测序技术的发展,二代和三代测序在疾病研究、临床诊断和个体化医疗中发挥着重要作用。基因检测已经成为科学研究和医学实践中不可或缺的工具。相比于全基因组测序(Whole Genome Sequencing,WGS),靶向测序技术旨在对特定基因区域或基因组内特定序列进行快速、准确的测序分析。通过引入特定的引物或探针,靶向测序能够选择性地放大和测序感兴趣的基因区域。这种精准的方法在研究遗传变异、致病基因的发现、肿瘤基因突变分析、病原微生物及其耐药基因检测等方面发挥着重要作用。
目前最常用的基因捕获方法包括探针杂交捕获技术和多重PCR扩增技术。其中,探针杂交捕获技术利用核酸碱基互补配对的原理,根据研究需求,设计针对特定基因组区域的带修饰探针,与加上测序接头的核酸文库进行杂交,使探针与目标DNA序列特异性结合。探针与目标区域形成的复合物可通过磁珠或其他方法回收,将目标区域从整个DNA样本中捕获出来。虽然相对于全基因组测序来说,探针杂交捕获测序通常成本较低,但受制于探针设计和合成等成本,其整个捕获流程成本依然较高。此外,探针杂交捕获技术还有着操作复杂、耗时长等缺点。多重PCR扩增技术是一种在单个反应中同时扩增多个目标序列的PCR技术。它通过在同一反应中同时引入多对引物对多个目标序列进行扩增。相比于探针杂交捕获,多重PCR扩增技术成本低、操作和分析简单且特异性高,但该技术的引物集设计难度较高。引物设计时需要确保多个引物在同一反应中相互不干扰,并且保持特异性和相对的一致性。因此,多重PCR扩增的通量通常较低,应用灵活性较差。
此外,近年来,随着CRISPR/Cas(Clustered regularly interspaced shortpalindromic repeats(CRISPR)/CRISPR-associatedprotein)系统的发展,其应用已经不再局限于基因编辑领域。CRISPR/Cas9系统可通过sgRNA靶向目标序列进行切割,并通过切割后连接某种修饰用于分离目标片段。但这种切割的策略通常需要对样本核酸进行末端钝化等前处理,操作繁琐;且对sgRNA的位置选择通常有诸多限制,如sgRNA(single guideRNA)间隔过小会导致目标序列被Cas9切割过于碎片化影响核酸回收效率。上述缺点限制了CRISPR/Cas9系统在核酸捕获检测领域更广泛的应用。经过改造后的dCas9,即失活型Cas9(dead Cas9,dCas9),虽然失去了核酸酶活性,但保留DNA结合能力,为CRISPR/Cas系统应用于核酸捕获领域带来了新的可能性。通常情况下,dCas9多应用于基因表达调控和表观修饰等研究中。通过在dCas9的C端融合各种具有转录调控功能的结构域,可招募转录因子或者修饰目标区域,从而研究目标基因的转录调控。目前,dCas9在转录调控方面已得到了广泛应用,但其在核酸捕获领域的潜在应用仍需进一步探索。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提供一种基于CRISPR-dCas9的DNA靶向捕获测序方法及其系统;本发明方法通过利用缺失核酸酶活性而保留DNA结合能力的失活型Cas9(dead Cas9,dCas9)与sgRNA组成复合物对提取后核酸直接进行靶序列的捕获。生物素等标记的dCas9与sgRNA形成的复合物可特异性与目标靶序列结合,再利用链霉亲和素等捕获方法实现对靶序列的有效富集。本发明解决现有靶向测序操作复杂、耗时长、成本高、无法直接对超长和超短核酸进行捕获等问题。
本申请第一方面公开一种基于CRISPR-dCas9的DNA靶向捕获测序方法,所述方法包括:
获取包含有靶序列的DNA序列;所述靶序列包括:200-1000bp的序列、大于等于1000bp的序列、小于等于200bp的序列;
获取dCas9-sgRNA复合物;
混合所述DNA序列和所述dCas9-sgRNA复合物,所述dCas9-sgRNA复合物捕获所述DNA序列中的靶序列,得到dCas9-sgRNA复合物与靶序列相结合的dCas9-sgRNA-DNA复合物。
在一些实施例中,所述靶序列包括:大于等于10kb的序列;
可选的,所述靶序列包括:60-120bp的序列;优选包括:以下任一种长度的序列:60bp、80bp、100bp、120bp。
在一些实施例中,所述dCas9-sgRNA复合物的获取方法包括:
获取sgRNA;
按照指定间隔长度从所述sgRNA中确定目标sgRNA;
获取所述目标sgRNA的正向引物和反向引物;
基于所述正向引物和反向引物,利用PCR技术合成体外转录用使用的模板DNA,得到PCR产物;
对PCR产物进行纯化处理,得到纯化后的sgRNA;
按照体系混合标准组装所述纯化后的sgRNA,得到所述dCas9-sgRNA复合物;
可选的,所述指定间隔长度包括以下任一种或几种:20bp、100bp、200bp;
可选的,所述获取sgRNA中sgRNA通过以下方法得到:确定靶序列;根据PAM序列确定所述靶序列上的sgRNA;从所述靶序列上的sgRNA中筛选出符合要求的sgRNA即为所述sgRNA;
可选的,所述筛选的标准包括以下任一种或几种:GC含量在区间内、均聚物小于等于第一阈值、双核甘酸重复小于等于第二阈值、无发夹结构、无人基因组脱靶;
可选的,所述纯化处理包括:利用固相介质纯化所述PCR产物,得到纯化后的sgRNA模板DNA;利用体外转录试剂盒进行体外转录,去除模板DNA,得到体外转录sgRNA;利用RNA纯化试剂盒纯化所述体外转录sgRNA,得到所述纯化后的sgRNA;
可选的,所述体系混合标准包括以下组分:sgRNA、dCas9-Biotin、反应缓冲液、无核酸酶水。
在一些实施例中,所述dCas9-sgRNA复合物包括无核酸酶活性的Cas9蛋白与sgRNA结合形成的复合物;
可选的,所述dCas9蛋白包括常规dCas9蛋白以及经过其他改造过程形成的各种dCas9蛋白。
在一些实施例中,所述包含有靶序列的DNA序列来自以下任一种或几种样本:人源细胞、鲍曼不动杆菌AcinetobacterbaumanniiATCC 19606、肺炎克雷伯菌KlebsiellapneumoniaeATCC 43816、大肠杆菌Escherichia coliATCC 11775、铜绿假单胞菌Pseudomonas aeruginosaATCC 27853、金黄色葡萄球Staphylococcus aureusATCC43300。
在一些实施例中,所述方法还包括:利用固相介质捕获所述dCas9-sgRNA-DNA复合物,得到捕获后的固相介质;对所述固相介质进行清洗和纯化,得到纯化后的靶标DNA;
对所述纯化后的靶标DNA进行建库、测序和数据分析,计算富集倍数;
可选的,所述富集倍数的计算方法包括:富集倍数=捕获后靶序列reads占比/未捕获靶序列reads占比;
可选的,所述固相介质为磁珠;所述磁珠表面固定的为链霉亲和素。
本申请第二方面公开一种基于CRISPR-dCas9的DNA靶向捕获测序系统,所述系统包括:
第一获取单元,用于获取包含有靶序列的DNA序列;所述靶序列包括:200-1000bp的序列、大于等于1000bp的序列、小于等于200bp的序列;
第二获取单元,用于获取dCas9-sgRNA复合物;
捕获单元,用于混合所述DNA序列和所述dCas9-sgRNA复合物,所述dCas9-sgRNA复合物捕获所述DNA序列中的靶序列,得到dCas9-sgRNA复合物与靶序列相结合的dCas9-sgRNA-DNA复合物。
本申请第三方面公开一种计算机设备,所述设备包括:存储器和处理器;所述存储器用于存储程序指令;所述处理器用于调用程序指令,当程序指令被执行时,用于执行第一方面公开的方法的步骤。
本申请第四方面公开一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面公开的方法的步骤。
本申请第五方面公开一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面公开的方法的步骤。
本申请第六方面公开第一方面公开的所述的基于CRISPR-dCas9的DNA靶向捕获测序方法在制备DNA检测、诊断及治疗试剂中的应用。
本申请具有以下有益效果:
1、本申请创新性的公开一种基于CRISPR-dCas9的DNA靶向捕获测序方法,利用缺失核酸酶活性而保留DNA结合能力的失活型Cas9(dead Cas9,dCas9)与sgRNA组成复合物对提取后核酸直接进行靶序列的捕获。生物素等标记的dCas9与sgRNA形成的复合物可特异性与目标靶序列结合,再利用链霉亲和素等捕获方法实现对靶序列的有效富集。本发明解决现有靶向测序操作复杂、耗时长、成本高、无法直接对超长和超短核酸进行捕获等问题。
2、本申请直接对超长和超短DNA进行捕获,证明本技术路线可实现对超长(>10kb)和超短DNA(60bp-120bp)的有效富集,改善了已报道的CRISPR-dCas9捕获系统仅对常规大小(200-1000bp)的核酸进行捕获的现状,并且克服了由于CRISPR-dCas9复合物与双链DNA结合时,存在双链DNA解链,与CRISPR-dCas9复合物中sgRNA形成杂合链的过程,故超短DNA可否与CRISPR-dCas9复合物有效结合仍有待进一步研究,以及对于超长DNA(>10kb)由于分子量大,CRISPR-dCas9系统能否将其拉取出来实现有效富集也暂无报道的难题。
3、本申请可以有效克服前期报道的CRISPR-dCas9捕获系统需提前制备核酸文库,且捕获所使用的sgRNA需提前修饰,操作繁琐,本流程直接使用生物素标记的dCas9,sgRNA制备和捕获流程简单,且捕获前无需构建文库,简化了整个体系的操作。
基于以上特点,本技术路线有着广泛应用,可用于肿瘤检测中的融合基因检测和靶向病原微生物检测中的病原序列物种注释、耐药基因检测和游离DNA的检测等。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获取其他的附图。
图1是本发明实施例第一方面提供的方法流程示意图;
图2是本发明实施例第二方面提供的系统示意流程图;
图3是本发明实施例提供的计算机设备的示意图;
图4是本发明实施例提供的基于CRISPR-dCas9的DNA靶向捕获的技术原理图;
图5是本发明实施例提供的提取后模拟样本核酸的琼脂糖凝胶电泳图;
图6是本发明实施例提供的每个靶序列的富集倍数(以单独加sgRNA和dCas9的作为对照);
图7是本发明实施例提供的不同sgRNA间隔的靶向捕获实验富集倍数。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例提供的一种基于CRISPR-dCas9的DNA靶向捕获测序方法流程示意图,具体地,所述方法包括如下步骤:
101:获取包含有靶序列的DNA序列;所述靶序列包括:200-1000bp的序列、大于等于1000bp的序列、小于等于200bp的序列;
在一些实施例中,所述靶序列包括:大于等于10kb的序列;
可选的,所述靶序列包括:60-120bp的序列;优选包括:以下任一种长度的序列:60bp、80bp、100bp、120bp,需要说明的是,在本实施例中只是列举上述长度序列,但在实际操作中并不局限于上述序列。
在一些实施例中,所述包含有靶序列的DNA序列来自以下任一种或几种样本:人源细胞、鲍曼不动杆菌Acinetobacter baumanniiATCC 19606、肺炎克雷伯菌KlebsiellapneumoniaeATCC 43816、大肠杆菌Escherichia coliATCC 11775、铜绿假单胞菌Pseudomonas aeruginosa ATCC 27853、金黄色葡萄球Staphylococcus aureusATCC43300。
102:获取dCas9-sgRNA复合物;
在一些实施例中,所述dCas9-sgRNA复合物的获取方法包括:
获取sgRNA;按照指定间隔长度从所述sgRNA中确定目标sgRNA;获取所述目标sgRNA的正向引物和反向引物;基于所述正向引物和反向引物,利用PCR技术合成体外转录用使用的模板DNA,得到PCR产物;对PCR产物进行纯化处理,得到纯化后的sgRNA;按照体系混合标准组装所述纯化后的sgRNA,得到所述dCas9-sgRNA复合物;
可选的,所述指定间隔长度包括以下任一种或几种:20bp、100bp、200bp;
可选的,所述获取sgRNA中sgRNA通过以下方法得到:确定靶序列;根据PAM序列确定所述靶序列上的sgRNA;从所述靶序列上的sgRNA中筛选出符合要求的sgRNA即为所述sgRNA;
可选的,所述筛选的标准包括以下任一种或几种:GC含量在区间(为25-75%)内、均聚物小于等于第一阈值(5)、双核甘酸重复小于等于第二阈值(3)、无发夹结构、无人基因组脱靶;其中,GC含量优选区间为25-75%,第一阈值优选为5,第二阈值优选为3;
可选的,所述纯化处理包括:利用固相介质纯化所述PCR产物,得到纯化后的sgRNA模板DNA;利用体外转录试剂盒进行体外转录,去除模板DNA,得到体外转录sgRNA;利用RNA纯化试剂盒纯化所述体外转录sgRNA,得到所述纯化后的sgRNA;
可选的,所述体系混合标准包括以下组分:sgRNA、dCas9-Biotin、反应缓冲液、无核酸酶水。在室温(25℃)孵育30min完成组装。
在一些实施例中,所述dCas9-sgRNA复合物包括无核酸酶活性的Cas9蛋白与sgRNA结合形成的复合物;
可选的,所述dCas9蛋白包括常规dCas9蛋白以及经过其他改造过程形成的各种dCas9蛋白。
其中,sgRNA对应的引物序列如下:
103:混合所述DNA序列和所述dCas9-sgRNA复合物,所述dCas9-sgRNA复合物捕获所述DNA序列中的靶序列,得到dCas9-sgRNA复合物与靶序列相结合的dCas9-sgRNA-DNA复合物;
在一些实施例中,所述方法还包括:利用固相介质捕获所述dCas9-sgRNA-DNA复合物,得到捕获后的固相介质;对所述固相介质进行清洗和纯化,得到纯化后的靶标DNA,即dCas9-sgRNA-DNA复合物;
对所述纯化后的靶标DNA进行建库、测序和数据分析,计算富集倍数;
可选的,所述富集倍数的计算方法包括:富集倍数=捕获后靶序列reads占比/未捕获靶序列reads占比;
可选的,所述固相介质为磁珠;所述磁珠表面固定的链霉亲和素。
捕获到磁珠表面的DNA-dCas9-sgRNA复合物可借助磁分离技术将dCas9-sgRNA结合的目标DNA从DNA文库或混合物中简单快速分离出来。
磁珠捕获的DNAdCas9-sgRNA复合物中的DNA,可借助各种DNA纯化技术进行纯化,纯化后的DNA可通过测序技术进行分析,解读其序列信息。
图2是本发明实施例提供的一种基于CRISPR-dCas9的DNA靶向捕获测序系统,包括:
第一获取单元201,用于获取包含有靶序列的DNA序列;所述靶序列包括:200-1000bp的序列、大于等于1000bp的序列、小于等于200bp的序列;
第二获取单元202,用于获取dCas9-sgRNA复合物;
捕获单元203,用于混合所述DNA序列和所述dCas9-sgRNA复合物,所述dCas9-sgRNA复合物捕获所述DNA序列中的靶序列,得到dCas9-sgRNA复合物与靶序列相结合的dCas9-sgRNA-DNA复合物。
图3是本发明实施例提供的一种计算机设备,所述设备包括:存储器和处理器;所述存储器用于存储程序指令;所述处理器用于调用程序指令,当程序指令被执行时,用于执行上述的方法的步骤。
本发明实施例还一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
本发明实施例还公开一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
具体地,实施例1,以超长核酸片段的靶向捕获测序实验为例说明整个过程:
1、实验材料:
样本:鲍曼不动杆菌Acinetobacter baumannii ATCC 19606、肺炎克雷伯菌Klebsiella pneumoniae ATCC 43816、大肠杆菌Escherichia coli ATCC 11775、铜绿假单胞菌Pseudomonas aeruginosa ATCC 27853、金黄色葡萄球Staphylococcus aureus ATCC43300和人源细胞。
试剂:微生物基因组提取试剂盒、dCas9蛋白、链霉亲和素磁珠、PCRmix、T7体外转录试剂盒、RNA纯化试剂盒、转座酶建库试剂盒等。
2、实验方法:
步骤1:为实验体系中的5个靶序列设计sgRNA序列。
首先,根据间隔区序列邻近基序(Protospacer Adjacent Motif,PAM)序列(NGG)寻找靶序列上所有可能的sgRNA,排除低质量sgRNA(考虑GC含量、均聚物、双核甘酸重复、发夹结构、人基因组脱靶等因素)后,然后按照特定间隔选择一组sgRNA(间隔包括20bp、100bp、200bp等)。所有的靶序列的sgRNA共同组成sgRNA库。
步骤2:用于体外转录的sgRNA模板链的制备。
根据上述sgRNA序列设计用于体外转录的sgRNA引物,所有的正向引物等质量混合在一起。通过PCR合成体外转录用使用的模板DNA。其中模板序列为:AAAAGCACCGACTCGGTGCCACTTTTTCAAGTTGATAACGGACTAGCCTTATTTTAACTTGCTATTTCTAGCTCTAAAAC。正向引物序列为:TTCTAATACGACTCACTATAGNNNNNNNNNNNNNNNNNNNNGTTTTAGAGCTAGA,其中N代表sgRNA中与靶DNA互补配对的序列。反向引物序列为:AAAAGCACCGACTCGGTGCC。
扩增体系为:
成分 50μl的反应体系
PCR Mix 12.5μl
10μM正向引物 2.5μl
10μM反向引物 2.5μl
1μM模板DNA 2μl
无核酸酶水 18μl
扩增条件为:
步骤3:PCR产物进行磁珠纯化。
反应结束后对PCR产物进行磁珠纯化,纯化步骤如下:取90μl AMPure XP磁珠置于PCR产物中,充分混匀后静置5min。将PCR管置于磁力架中分离磁珠和液体,待溶液澄清后,小心移除上清。保持PCR管始终置于磁力架中,加入200μl无核酸酶水新鲜配制的80%乙醇漂洗磁珠,室温孵育30sec后,小心移除上清。重复漂洗一次。用10μl移液器吸干净残留液体。保持PCR管始终置于磁力架中,室温下开盖干燥磁珠。加入22μl无核酸酶水,吹打至充分混匀,室温静置5min。将PCR管短暂离心并置于磁力架中静置,待溶液澄清后,小心移取20μl上清至新PCR管中。用Qubit测定回收产物浓度。
步骤4:sgRNA的体外转录。
利用T7体外转录试剂盒进行sgRNA的体外转录,步骤如下:清理试验台,防止核糖核酸酶的污染。按顺序向PCR管中添加如下试剂:10μl的NTP Buffer Mix、1μg上一步骤纯化的sgRNA模板DNA,2μl T7 RNA聚合酶Mix,用水补足30μl。反应条件为:37℃,16h。
反应结束后去除模板DNA:每30μl反应加20μl无核酸酶水,再加2μl的DNA酶,混合,37℃孵育15min。
步骤5:RNA的纯化。
使用RNA纯化试剂盒纯化RNA,利用Qubit测定sgRNA的浓度。
步骤6:dCas9-sgRNA复合物的组装。
按照下表体系混合各组分:
组分 用量
无核酸酶水 补足20μl
反应缓冲液 2μl
sgRNA 321.7ng
dCas9-Biotin 2μl
上述体系在室温(25℃)孵育30min完成组装。
步骤7:配制模拟样本,并提取基因组。
将A.baumannii ATCC 19606、K.pneumoniae ATCC 43816、E.coli ATCC 11775、P.aeruginosa ATCC 27853和S.aureus ATCC 43300菌株等量混合在一起,然后与人源细胞进行混合,制成模拟样本。利用微生物基因组提取试剂盒获得基因组核酸。
步骤8:dCas9-sgRNA复合物与模拟样本基因组孵育。
在PCR管中按照下表配置反应体系:
组分或操作 用量
反应缓冲液 2μl
模拟样本DNA 16μl
dCas9-sgRNA复合物 2μl
总体积 20μl
轻弹混匀并瞬离,在PCR仪上进行如下孵育:37℃,45min,实现dCas9-sgRNA复合物与靶序列的结合。
步骤9:亲和磁珠特异性捕获dCas9-sgRNA-DNA复合物。
取10μl链霉亲和素磁珠,用1×dCas9结合缓冲液清洗磁珠两次后悬浮于5μl 1×dCas9结合缓冲液中,并加入到上述20μl dCas9-sgRNA-DNA孵育混合物中,室温旋转结合10min。将PCR管置于磁分离架上,分离磁珠和上清。
步骤10:洗脱、文库构建与上机测序
1×结合缓冲液冲洗磁珠3次。用30μl 0.2%SDS重悬磁珠,室温孵育5min。纯化上清中的DNA。纯化步骤如下:取30μl AMPure XP Beads置于PCR产物中,充分混匀后静置5min。将PCR管置于磁力架中分离磁珠和液体,待溶液澄清后,小心移除上清。保持PCR管始终置于磁力架中,加入200μl无核酸酶水新鲜配制的80%乙醇漂洗磁珠,室温孵育30sec后,小心移除上清。重复漂洗一次。保持PCR管始终置于磁力架中,室温下开盖干燥磁珠。加入22μl无核酸酶水,吹打至充分混匀,室温静置5min。将PCR管短暂离心并置于磁力架中静置,待溶液澄清后,小心移取20μl上清至新PCR管中。用Qubit测定回收产物浓度。
利用转座酶建库试剂盒进行建库,测序平台为Illumina测序平台。
步骤11:下机数据分析
下机数据利用fastp软件去除接头和低质量序列,然后利用bwa进行序列比对,分别与人参考基因组、模拟样本的中微生物参考基因组和靶序列进行比对,然后统计比对结果,计算富集倍数(富集倍数=捕获后靶序列reads占比/未捕获靶序列reads占比)。
2、实验结果
如附图5所示,为提取后模拟样本核酸的琼脂糖凝胶电泳(M:Marker;1-3:模拟样本核酸),从图中可以看出,显示用于dCas9捕获的模拟样本核酸,提取后的核酸主峰>10kb;
如附图6所示,为每个靶序列的富集倍数(以单独加sgRNA和dCas9的作为对照);其具体展示的是实验体系中5个靶序列的富集倍数,从图中可以看出,Cas9富集流程可实现对靶序列平均6.6倍的富集,最高可达到25.9倍富集。
具体地,实施例2,以超短核酸片段的靶向捕获测序实验为例说明整个过程:
1、实验材料
样本:设计引物PCR扩增得到不同长度的靶序列sul2,选取的长度有:60bp、80bp、100bp和120bp。PCR扩增一段100bp非靶序列作为背景序列。将靶序列和非靶序列按照1:99的比例混合,用于捕获实验。
2、实验方法
在本实施例中,设计4条sgRNA用于捕获不同长度的靶序列。具体实施方式与实施例1中的dCas9捕获流程相同。
3、实验结果
如下表所示,为不同片段长度的靶序列未捕获和捕获后序列占比情况和富集倍数展示,从下表可以看出,dCas9捕获流程可实现对60bp-120bp核酸序列的富集,富集倍数平均为248.9倍,最高可达552倍富集。该结果说明本技术流程可实现对超短核酸序列的有效富集。
另外,在本实施例中,我们比较了不同sgRNA间隔的捕获效果(即平铺式sgRNA的靶向捕获实验),选取两个靶序列catB7和sul2作为测试基因。设计sgRNA集的时候选取的sgRNA彼此间的间隔为200bp、100bp和20bp。具体实施方式与实施例1中的dCas9捕获流程相同。
结果如图7所示,不同间隔的dCas9捕获流程均能实现对靶序列大于10倍的富集,且随着sgRNA的间隔变小,捕获效果增强。本实验说明dCas9捕获流程能够通过更密的sgRNA设计获得更好的捕获效果。
本实施案例表明,dCas9捕获流程可利用平铺式sgRNA的设计提升流程的捕获性能。相比于CRISPR-Cas9切割的方法,dCas9捕获流程可尽可能多地利用目标序列上的sgRNA,通过增加捕获位点,提升捕获性能。
超长或超短核酸片段的靶向捕获的意义在于:
目前的基因捕获技术多针对常规大小的核酸,如匹配二代测序技术的文库核酸(200-1000bp),但在实际临床研究和应用中,超短和超长核酸片段也有着不可替代的作用,为疾病研究和病原检测提供重要的遗传信息。超短核酸片段,如循环肿瘤DNA(circulatingtumor DNA,ctDNA),为液体活检提供了可能,使得癌症的早期检测和疾病监测更加便捷、准确。此外,循环自由DNA(circulating free DNA,cfDNA)的检测可用于诊断各种感染性疾病,包括病毒、细菌、真菌和寄生虫感染。通过分析血液中的cfDNA,可以检测到病原体的特定基因序列,从而帮助确定感染的类型和程度。这些短片段的分析使得临床研究能够更全面地理解疾病的分子基础,为精准医疗和治疗方案的制定提供了新的思路。
与此同时,超长核酸片段的研究也在基因组学、结构变异和遗传性疾病的研究中发挥着至关重要的作用。超长核酸片段序列的获取有助于深入挖掘基因组中的复杂结构变异,如基因融合等,揭示疾病的潜在机制,为新型治疗方法的发展奠定基础。对于病原检测而言,超长核酸序列分析可有助于更准确地病原菌鉴定和耐药基因注释。因此,超短和超长核酸片段的捕获测序可为临床研究注入新的活力,为更深入的疾病理解和治疗策略的制定带来新机会。
本发明是不同于探针捕获和多重扩增的一种新的靶向富集技术。本发明利用生物素标记的缺失核酸酶功活性而保留DNA结合能力的失活型Cas9(dCas9)进行靶标核酸的捕获,样本DNA提取后的核酸无需打断或者建库可直接进行捕获;不同于Cas9的捕获,由于dCas9丢失了核酸酶活性,因此sgRNA可以一定间隔平铺于目标序列上,提供更多的捕获位点,本发明验证sgRNA间隔越小捕获效果越好。本发明可实现对超长(>10kb)和超短的核酸片段(60bp)的捕获富集,适用于不同类型的核酸捕获,如较为完整的基因组核酸DNA和较短的游离DNA,结合三代和二代测序可获得更多的靶标序列信息并可用于肿瘤检测中的融合基因检测和靶向病原微生物检测中的序列物种注释、耐药基因检测和游离DNA的检测等。此外,本发明直接对提取后核酸进行捕获,无需提前构建文库,所使用的sgRNA无需特殊修饰,整体捕获操作流程简单。
本验证实施例的验证结果表明,为适应症分配固有权重相对于默认设置来说可以适度改善本方法的性能。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上对本发明所提供的一种计算机设备进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.基于CRISPR-dCas9的DNA靶向捕获测序方法,其特征在于,所述方法包括:
获取包含有靶序列的DNA序列;所述靶序列包括:200-1000bp的序列、大于等于1000bp的序列、小于等于200bp的序列;
获取dCas9-sgRNA复合物;
混合所述DNA序列和所述dCas9-sgRNA复合物,所述dCas9-sgRNA复合物捕获所述DNA序列中的靶序列,得到dCas9-sgRNA复合物与靶序列相结合的dCas9-sgRNA-DNA复合物。
2.根据权利要求1所述的基于CRISPR-dCas9的DNA靶向捕获测序方法,其特征在于,所述靶序列包括:大于等于10kb的序列;
可选的,所述靶序列包括:60-120bp的序列;优选包括:以下任一种长度的序列:60bp、80bp、100bp、120bp。
3.根据权利要求1所述的基于CRISPR-dCas9的DNA靶向捕获测序方法,其特征在于,所述dCas9-sgRNA复合物的获取方法包括:
获取sgRNA;
按照指定间隔长度从所述sgRNA中确定目标sgRNA;
获取所述目标sgRNA的正向引物和反向引物;
基于所述正向引物和反向引物,利用PCR技术合成体外转录用使用的模板DNA,得到PCR产物;
对PCR产物进行纯化处理,得到纯化后的sgRNA;
按照体系混合标准组装所述纯化后的sgRNA,得到所述dCas9-sgRNA复合物;
可选的,所述指定间隔长度包括以下任一种或几种:20bp、100bp、200bp;可选的,所述获取sgRNA中sgRNA通过以下方法得到:确定靶序列;根据PAM序列确定所述靶序列上的sgRNA;从所述靶序列上的sgRNA中筛选出符合要求的sgRNA即为所述sgRNA;
可选的,所述筛选的标准包括以下任一种或几种:GC含量在区间内、均聚物小于等于第一阈值、双核甘酸重复小于等于第二阈值、无发夹结构、无人基因组脱靶;
可选的,所述纯化处理包括:利用固相介质纯化所述PCR产物,得到纯化后的sgRNA模板DNA;利用体外转录试剂盒进行体外转录,去除模板DNA,得到体外转录sgRNA;利用RNA纯化试剂盒纯化所述体外转录sgRNA,得到所述纯化后的sgRNA;
可选的,所述体系混合标准包括以下组分:sgRNA、dCas9-Biotin、反应缓冲液、无核酸酶水。
4.根据权利要求1所述的基于CRISPR-dCas9的DNA靶向捕获测序方法,其特征在于,所述dCas9-sgRNA复合物包括无核酸酶活性的Cas9蛋白与sgRNA结合形成的复合物;
可选的,所述dCas9蛋白包括常规dCas9蛋白以及经过其他改造过程形成的各种dCas9蛋白。
5.根据权利要求1-4任一项所述的基于CRISPR-dCas9的DNA靶向捕获测序方法,其特征在于,所述包含有靶序列的DNA序列来自以下任一种或几种样本:人源细胞、鲍曼不动杆菌Acinetobacter baumannii ATCC 19606、肺炎克雷伯菌Klebsiella pneumoniae ATCC43816、大肠杆菌Escherichia coli ATCC 11775、铜绿假单胞菌Pseudomonas aeruginosaATCC 27853、金黄色葡萄球Staphylococcus aureus ATCC 43300。
6.根据权利要求1-4任一项所述的基于CRISPR-dCas9的DNA靶向捕获测序方法,其特征在于,所述方法还包括:利用固相介质捕获所述dCas9-sgRNA-DNA复合物,得到捕获后的固相介质;对所述固相介质进行清洗和纯化,得到纯化后的靶标DNA;
对所述纯化后的靶标DNA进行建库、测序和数据分析,计算富集倍数;
可选的,所述富集倍数的计算方法包括:富集倍数=捕获后靶序列reads占比/未捕获靶序列reads占比;
可选的,所述固相介质为磁珠;所述磁珠表面固定的为链霉亲和素。
7.基于CRISPR-dCas9的DNA靶向捕获测序系统,其特征在于,所述系统包括:
第一获取单元,用于获取包含有靶序列的DNA序列;所述靶序列包括:200-1000bp的序列、大于等于1000bp的序列、小于等于200bp的序列;
第二获取单元,用于获取dCas9-sgRNA复合物;
捕获单元,用于混合所述DNA序列和所述dCas9-sgRNA复合物,所述dCas9-sgRNA复合物捕获所述DNA序列中的靶序列,得到dCas9-sgRNA复合物与靶序列相结合的dCas9-sgRNA-DNA复合物。
8.一种计算机设备,其特征在于,所述设备包括:存储器和处理器;所述存储器用于存储程序指令;所述处理器用于调用程序指令,当程序指令被执行时,用于执行权利要求1-6任意一项所述的方法的步骤。
9.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的权利要求1-6任意一项所述的方法的步骤。
10.一种权利要求1-6任一项所述的基于CRISPR-dCas9的DNA靶向捕获测序方法在制备DNA检测、诊断及治疗试剂中的应用。
CN202410176777.7A 2024-02-08 2024-02-08 基于CRISPR-dCas9的DNA靶向捕获测序方法、系统和设备 Pending CN118006746A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410176777.7A CN118006746A (zh) 2024-02-08 2024-02-08 基于CRISPR-dCas9的DNA靶向捕获测序方法、系统和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410176777.7A CN118006746A (zh) 2024-02-08 2024-02-08 基于CRISPR-dCas9的DNA靶向捕获测序方法、系统和设备

Publications (1)

Publication Number Publication Date
CN118006746A true CN118006746A (zh) 2024-05-10

Family

ID=90951645

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410176777.7A Pending CN118006746A (zh) 2024-02-08 2024-02-08 基于CRISPR-dCas9的DNA靶向捕获测序方法、系统和设备

Country Status (1)

Country Link
CN (1) CN118006746A (zh)

Similar Documents

Publication Publication Date Title
JP6808617B2 (ja) 連続性を維持した転位
US9890375B2 (en) Isolated oligonucleotide and use thereof in nucleic acid sequencing
JP7457434B2 (ja) 核酸増幅のための方法
JP7379418B2 (ja) 腫瘍のディープシークエンシングプロファイリング
CN109536579B (zh) 单链测序文库的构建方法及其应用
US10494630B2 (en) Linker element and method of using same to construct sequencing library
US10718015B2 (en) Sequencing library, preparation method and use thereof
CA2953362A1 (en) Genomewide unbiased identification of dsbs evaluated by sequencing (guide-seq)
WO2013104106A1 (zh) 用于构建血浆dna测序文库的方法和试剂盒
WO2013064066A1 (zh) 全基因组甲基化高通量测序文库的构建方法及其应用
CN109576346B (zh) 高通量测序文库的构建方法及其应用
JP7054678B2 (ja) ゲノムdna断片の標的化された精製のための調製用電気泳動方法
EP3098324A1 (en) Compositions and methods for preparing sequencing libraries
WO2017054302A1 (zh) 测序文库及其制备和应用
CN111748606A (zh) 一种快速构建血浆dna测序文库的方法和试剂盒
WO2019084245A1 (en) METHODS AND COMPOSITIONS FOR PREPARING NUCLEIC ACID LIBRARIES
CN109584956A (zh) 一种利用iib型限制性内切酶进行微生物群落鉴定的方法
CN118006746A (zh) 基于CRISPR-dCas9的DNA靶向捕获测序方法、系统和设备
WO2018081666A1 (en) Methods of single dna/rna molecule counting
JP2024502028A (ja) 配列決定ライブラリー調製のための方法および組成物
CN112680794A (zh) 一种应用于ngs平台的超微量核酸样本建库方法
CN112080555A (zh) Dna甲基化检测试剂盒及检测方法
Benamozig et al. A detection method for the capture of genomic signatures: From disease diagnosis to genome editing
CN113957125B (zh) 适用于重亚硫酸盐测序的Cot DNA、其制备方法及其应用
CN111979226B (zh) 一种可批量进行体外脱靶检测及sgRNA筛选的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination