CN115948503A

CN115948503A - 基于crispr高效富集靶向序列的方法

Info

Publication number: CN115948503A
Application number: CN202310014071.6A
Authority: CN
Inventors: 曹振; 刘倩; 何嘉乐; 刘娜; 卢瑶
Original assignee: Yisheng Biotechnology Shanghai Co ltd
Current assignee: Yisheng Biotechnology Shanghai Co ltd
Priority date: 2023-01-05
Filing date: 2023-01-05
Publication date: 2023-04-11

Abstract

本发明提供了一种基于CRISPR高效富集靶向序列的方法，其步骤包括：设计并制备所述靶向序列的sgRNA库；对样本的DNA采用碱性磷酸酶进行封闭处理，制备获得封闭的DNA；将步骤(1)中制备的sgRNA库，与Cas蛋白以及步骤(2)获得的所述封闭的DNA一起孵育，进行靶向切割；在靶向切割后的DNA上连接生物素修饰的接头或用polyA修饰；链霉亲和素磁珠或oligo‑dT磁珠处理，扩增，获得靶向序列的文库。本发明方法适用范围广，灵敏度高，效率高，背景少，操作简便。相较于其他捕获技术，该技术涉及的CRISPR/Cas系统稳定性好、耗时短、DNA无需热变性、成本低，故适用于各种复杂样品的靶向序列富集。

Description

基于CRISPR高效富集靶向序列的方法

技术领域

本发明专利涉及一种基于CRISPR高效富集靶向序列的方法，属于生物技术领域。

背景技术

基因检测技术的不断发展和完善推动了临床诊断和研究的进步，二代和三代测序技术是目前市场上主流的测序技术，其优势在于通量高，灵敏度高，自动化程度高。人的基因组信息庞大，大约包含30亿个碱基对，而真正编码基因的区域占比不到4％，外显子区域及转录调控元件区域占比低于1％。而致病突变绝大多数富集在外显子区域及转录调控元件区域上，因此这些区域的基因信息对疾病的诊断和治疗具有关键的作用。由于这些区域占比太少，利用全基因组测序技术进行序列信息验证和突变类型分析具有极低的效率和准确率。通常对于一个位点信息的判断需要成百乃至上万的测序覆盖深度，这意味着利用全基因测序进行基因信息的有效分析往往需要超过数百G的测序数据，这极大的增加了二代测序和三代测序在基因诊断上的成本和普及难度，也造成了大量的不必要浪费。而对全基因组进行测序面临着成本高、数据分析复杂、周期长等问题。因此，开发一种捕获靶位点基因序列的技术，是二代和三代测序技术在基因治疗领域普及和应用的关键。基因捕获测序的主要优势在于可针对特定区域进行测序，有效降低了测序成本，提高了测序深度，更精确地发现特定区域遗传变异信息。与范围广泛的全基因组测序相比，靶向测序用于研究特定区域，提供了一种更加经济高效的策略，将重点放在那些最有可能参与所研究表型的区域，从而节省资源，并生成更小、更易于管理的数据集。

目前常用的基因捕获方法包括杂交捕获和多重PCR扩增，杂交捕获根据核酸分子碱基互补杂交原理，针对目标区域设计特异探针并将探针合成在固相或液相芯片上，然后打断基因组DNA，加上测序接头后与探针杂交，将基因组DNA目标区域捕获下来，回收目标DNA片段，直接构建高通量测序文库。杂交捕获的特点是能够对外显子组甚至更大的目标区域进行捕获，但操作流程复杂，需要依赖较多专门的仪器设备。扩增子测序是一种目标区域高通量测序技术，首先利用多重PCR扩增、富集样品基因组中目标区域的DNA片段，再进行文库构建和高通量测序。扩增子测序具有目的明确、应用灵活、价格低廉、分析简单等优点，但多重PCR体系中需要解决多个靶点扩增条件不兼容，灵敏度低，背景高等技术问题。

近年来，随着基因编辑技术CRISPR/Cas系统的发展，各类Cas蛋白被开发出来应用于不同的领域。一种切割活性完全失活的dCas9成为体外基因捕获的重要工具。这种方法结合了CRISPR/Cas9基因编辑系统的高特异性，也利用了dCas9带有的解旋酶活性，因此可以在室温下利用带有特殊修饰的dCas9和sgRNA对靶位点进行捕获。这种捕获方法相较于传统的探针杂交捕获技术，具有成本低、耗时短(2h)、捕获效率高、操作简单、DNA无需热变性等优点，但是dCas9自身与DNA的非特异性结合和sgRNA的脱靶效应严重阻碍了捕获效率和特异性。

发明内容

本发明的目的是提供一种基于CRISPR高效富集靶向序列的方法。

本发明采取的技术方案为：

一种基于CRISPR高效富集靶向序列的方法，其步骤包括：

(1)设计并制备所述靶向序列的sgRNA库；

(2)对样本的总DNA采用碱性磷酸酶进行封闭处理，制备获得封闭的DNA；

(3)将步骤(1)中制备的sgRNA库，与Cas蛋白以及步骤(2)获得的所述封闭的DNA一起孵育，进行靶向切割；

(4)在靶向切割后的DNA上连接生物素修饰的接头或用polyA修饰；

(5)链霉亲和素磁珠或oligo-dT磁珠处理，扩增，获得富集靶向序列的文库。

总DNA可以来源于RNA文库的DNA、基因组DNA文库的DNA，也可以是片段化的DNA。

优选的，步骤(1)具体为设计与靶向序列的DNA互补配对的sgRNA探针，并合成上游引物和下游引物，上游引物为在每条sgRNA探针的5’端添加含有T7启动子和保护碱基的序列TTCTAATACGACTCACTATA(SEQ ID No.243)，在T7启动子后面通常还要添加一到三个G，在每条sgRNA探针的3’端添加含有Cas蛋白骨架重叠区域的序列GTTTTAGAGCTAGA(SEQ IDNo.244)，下游引物的序列为AAAAGCACCGACTCGGTGCC(SEQ ID No.245)，PCR扩增双链DNA模板，体外转录获得sgRNA库。

优选的，步骤(2)中在DNA封闭处理后，用正钒酸钠或高温处理灭活酶活。

优选的，步骤(3)靶向切割后，加入核酸水解酶水解非靶基因的序列，然后终止核酸水解酶反应，纯化获得靶基因样本。

优选的，所述碱性磷酸酶为FastAP热敏感性碱性磷酸酶。

优选的，步骤(2)中碱性磷酸酶与总DNA投入量比例为1U/pmol-100U/pmol，碱性磷酸酶与总DNA的孵育时间为10-30min，孵育温度为37-50℃。

优选的，步骤(2)中总DNA投入量为1ng-10ug。

优选的，步骤(3)中所述sgRNA等摩尔量混合。

优选的，步骤(3)中孵育所用的缓冲液包括5mM-500mM三羟甲基氨基甲烷，10mM-1M氯化钠，1mM-100mM氯化镁，0.05mM-0.5mM二硫苏糖醇、0.1mM-1mM乙二胺四乙酸。

优选的，步骤(3)中孵育所用的缓冲液包括100mM三羟甲基氨基甲烷，100mM氯化钠，10mM氯化镁，0.1mM二硫苏糖醇、0.2mM乙二胺四乙酸。

优选的，所述Cas蛋白包括但不限于Cas9、Cas12、Cas13、Cas14。

优选的，步骤(3)中孵育时间为30-90min。更优选的，为60min。

优选的，所述靶向序列为乳腺癌基因，所述sgRNA的序列包括SEQ ID No.1-242所示的序列。

本发明还公开了一种基于CRISPR高效富集乳腺癌基因的测序试剂盒，包括sgRNA库，其sgRNA探针序列如SEQ ID No.1-242所示。

优选的，还包括Cas核酸酶、Cas核酸酶buffer、碱性磷酸酶。更优选的，Cas核酸酶为Cas9核酸酶。

本发明的有益效果为：

本发明的原理是基于CRISPR/Cas系统，设计靶向基因的sgRNA库，与Cas相关蛋白预结合，再与碱性磷酸酶封闭的样本进行孵育，通过靶序列切割后连接生物素修饰的接头或用polyA修饰，在链霉亲和素磁珠或oligo-dT磁珠筛选处理后扩增靶向序列达到富集目的。本发明的Cas复合物在预结合之前进行DNA封闭，减少了接头的非特异性连接，提高了靶向富集特异性；链霉亲和素磁珠或oligo-dT磁珠处理降低了背景干扰，适用于各类复杂DNA样本，拓宽了该技术使用范围。

本发明方法适用范围广，灵敏度高，效率高，背景少，操作简便。相较于其他捕获技术，该技术涉及的CRISPR/Cas系统稳定性好、耗时短、DNA无需热变性、程序简单、成本低，故适用于各种复杂样品的靶向序列富集。

附图说明

图1基于CRISPR高效富集靶向序列的技术流程和原理图。

图2Qsep验证sgRNA库的大小。

图3基于CRISPR高效富集靶向序列针对不同sgRNA投入量的效率比较，本图中未投入sgRNA。

图4基于CRISPR高效富集靶向序列针对不同sgRNA投入量的效率比较，本图中投入的sgRNA为1ng。

图5基于CRISPR高效富集靶向序列针对不同sgRNA投入量的效率比较，本图中投入的sgRNA为10ng。

图6基于CRISPR高效富集靶向序列针对不同sgRNA投入量的效率比较，本图中投入的sgRNA为100ng。

图7基于CRISPR高效富集靶向序列针对不同切割时间的效率比较，本图中切割时间为30min。

图8基于CRISPR高效富集靶向序列针对不同切割时间的效率比较，本图中切割时间为40min。

图9基于CRISPR高效富集靶向序列针对不同切割时间的效率比较，本图中切割时间为60min。

图10基于CRISPR高效富集靶向序列针对不同切割时间的效率比较，本图中切割时间为90min。

图11基于CRISPR高效富集靶向序列针对不同cDNA投入量的效率比较。

图12测序验证两种基因捕获技术对BRCA1/2基因的捕获效率和特异性。

具体实施方式

通过以下详细说明结合附图可以进一步理解本发明的特点和优点。图1展示了本发明的原理和技术流程。本发明所提供的实施例仅是对本发明方法的说明，而不以任何方式限制本发明揭示的其余内容。本实施例以乳腺癌相关基因作为示例，本实施例所使用的引物序列如表1所示。

表1sgRNA探针序列

实施例1：乳腺癌相关基因sgRNA pool制备及鉴定。

在本实施例中，我们制备了靶向乳腺癌相关基因的sgRNA库并进行鉴定。具体实施方式如下：

1)gRNA的设计：利用网站E-CRISPOR(http://crispor.tefor.net/crispor.py)对乳腺癌相关基因的CDS区域进行gRNA的设计，以约200bp/条的设计密度选中评分较高的gRNA，序列如表1。

2)sgRNA pool模板制备：按照表1进行引物合成(生工生物工程(上海)股份有限公司)，加DEPC水将每条引物稀释至10μM。

使用翌圣生物的

Gold PCR Master Mix(Cat#10149)进行sgRNA库模板的扩增，扩增体系：

Gold PCR Master Mix，1μL sgRNA引物F(10μM),1μL sgRNA引物R(10μM)，1μL Scaffold Template(1μM),加水补至50μL体系。程序：98℃3min；98℃，10sec；68℃，30sec；40个循环。

3)反应结束后，使用翌圣生物的

Smarter DNA Clean Beads(Cat#12600)进行DNA扩增产物回收。

4)取上述产物5μL进行核酸电泳鉴定扩增产物特异性。另取5μL sgRNA模板使用翊圣生物的T7 High Yield RNA Synthesis Kit(Cat#10623)对sgRNA进行体外转录。反应体系如下所示：

5)将上述反应液混合均匀，短暂离心至管底，37℃孵育4个小时。

6)反应完成后，每管加入2μL DNaseⅠ(RNase free)，37℃孵育15min以去除模板DNA。

7)转录后的RNA使用翌圣生物RNA Cleaner磁珠进行纯化(Cat#12602)，吸取2×磁珠加入RNA样品中，用移液器吹打6次充分混匀。室温孵育5min，使RNA结合到磁珠上。将样品置于磁力架上5min，待溶液澄清后，小心移除上清。保持样品置于磁力架上，加入200μL新鲜配制的80％乙醇漂洗磁珠，室温孵育30s，小心移除上清。重复此操作一次,开盖空气干燥磁珠5min，加入22μL RNase free H₂O，用移液器吹打6次以充分混匀，室温静置5min。将样品置于磁力架5min，待溶液澄清后，小心转移上清20μL至一个新的RNase free PCR管中，即获得sgRNA pool mix。

8)检测RNA大小、质量及产量：用Agilent 2100Bioanalyzer评估上述RNA完整度及质量，结果如图2所示，根据图2可知本实施例获得RNA完整度高、质量好；用Nanodrop测定转录的RNA产量。

实施例2：sgRNA投入量测试

1)制备cDNA

使用翌圣生物mRNA纯化试剂盒(Cat#12603)将mRNA从4μg完整度良好的总RNA中进行分离纯化。

2)使用翌圣生物DNA&RNA共建库试剂盒(Cat#12299)制备二链cDNA，先进行RNA变性处理，反应体系如下：

组分	体积
		Dt23VN	1μL
步骤1)制备获得的mRNA	14μL
		Total	15μL

使用移液器轻轻吹打混匀，瞬离将反应液离心至管底，70℃，5min，立即置于冰上3min；再进行第一链的合成，反应体系如下：

使用移液器轻轻吹打混匀，瞬离将反应液离心至管底，25℃，5min；42℃，30min；85℃，5min；4℃，hold，得到第一链cDNA；

进行第二链的合成，反应体系如下：

组分	体积
		1st Strand cDNA产物	25μL
2nd Reaction Buffer	7μL
		2nd Strand Enzyme Mix	3μL
Total	35μL

使用移液器轻轻吹打混匀，瞬离将反应液离心至管底，16℃，30min，得到二链cDNA。

3)使用碱性磷酸酶(Sigma Aldrich)处理步骤2)获得的二链cDNA，37℃，30min，加入1U正钒酸钠灭活酶活，得到去磷酸化DNA。

4)切割反应，Cas9核酸酶的来源为重组E.coli菌株，其克隆来自Streptococcuspyogenes的Cas9基因。对不同的sgRNA投入量分别进行切割反应，体系如下：

37℃，1h,加入1μL proteinase K，37℃，孵育15min，使用翌圣生物的

Smarter DNAClean Beads(Cat#12600)进行回收。

5)回收的DNA使用

dA-Tailing Module进行末端加A，使用翌圣生物快速DNA连接模块(Cat#12805)进行后续接头连接，其中所用接头经生物素修饰，链霉亲和素磁珠筛选产物，扩增，纯化后电泳鉴定并测序，不同sgRNA投入量富集比例如图3-6所示，100ng的sgRNA投入量具有更高的捕获效率和特异性。

实施例3切割时间的测试

在本实施例中，我们比较了不同切割反应时间(30-90min)在基于CRISPR高效富集靶向序列的捕获效果。结果如图7-10所示，切割反应时间为60min时具有更高的捕获效率和捕获特异性。

实施例4cDNA样本切割量

1)使用碱性磷酸酶(Sigma Aldrich)处理待捕获的cDNA，37℃，30min，加入1U正钒酸钠灭活酶活。

2)切割反应，体系如下：

去磷酸化DNA	1ng/10ng/100ng
		sgRNA pool mix	100ng
Cas 9 BF	2μL
		Cas9核酸酶	5pmol
补加DEPC水至	20μL

Smarter DNA Clean Beads(Cat#12600)进行回收。

3)回收的DNA使用

dA-Tailing ModμLe进行末端加A，使用翌圣生物快速DNA连接模块(Cat#12805)进行后续接头连接，纯化产物，扩增，纯化后电泳鉴定并测序，不同cDNA样本投入量富集比例如图11所示，10ng的cDNA投入量具有更高的捕获效率和特异性。

实施例5与多重PCR靶向捕获测序技术的比较

在本实施例中，我们比较两种基因捕获方式对BRCA1/2基因的捕获效果。使用的探针是表1中102-174号相对应的靶向BRCA1/2的sgRNA。具体实施方式如下

1)本实施例中CRISPR处理方式参照实施例1和实施例2。其中，使用常规试剂盒获得二链cDNA，sgRNA的用量为100ng，Cas9用量为5pmol，反应时间为60min。其中，使用未经碱性磷酸酶封闭和未用链霉亲和素磁珠筛选的方案作为对照。

2)多重PCR靶向捕获测序技术：使用

BRCA1/2基因检测试剂盒按照操作说明进行靶向捕获。

将回收的DNA进行NGS测序分析，两种基因捕获方式的比较见图12。可以看出，将样本预先进行碱性磷酸酶封闭处理，可以大幅提高靶向富集的特异性，采用链霉亲和素磁珠筛选，同样可以大幅提高靶向序列的占比。

综上，为解决目前基因捕获方式所遇到的难题，我们开发了一种基于CRISPR的新型靶向序列富集测序技术，该方法原理是基于CRISPR/Cas系统，设计靶向基因的sgRNA库,与Cas相关蛋白预结合，再与预先进行碱性磷酸酶封闭处理的样本进行孵育，通过靶序列切割后连接生物素修饰的接头或用polyA修饰，在链霉亲和素磁珠或oligo-dT磁珠筛选处理后扩增靶向序列达到富集目的，这种方法适用范围广，灵敏度高，效率高，背景少，操作简便。相较于其他捕获技术，该技术涉及的CRISPR/Cas系统稳定性好、耗时短、DNA无需热变性、程序简单、成本低，故适用于各种复杂样品的靶向序列富集。

Claims

1.一种基于CRISPR高效富集靶向序列的方法，其特征在于其步骤包括：

(1)设计并制备所述靶向序列的sgRNA库；

(3)将步骤(1)中制得的sgRNA库，与Cas蛋白以及步骤(2)获得的所述封闭的DNA一起孵育，进行靶向切割；

(5)链霉亲和素磁珠或oligo-dT磁珠处理，扩增，获得靶向序列的文库。

2.根据权利要求1所述的基于CRISPR高效富集靶向序列的方法，其特征在于：步骤(1)具体为设计与靶向序列的DNA互补配对的sgRNA探针，并合成上游引物和下游引物，上游引物为在每条sgRNA探针的5’端添加含有T7启动子和保护碱基的序列TTCTAATACGACTCACTATA，在每条sgRNA探针的3’端添加含有Cas蛋白骨架重叠区域的序列GTTTTAGAGCTAGA，下游引物的序列为AAAAGCACCGACTCGGTGCC，PCR扩增双链DNA模板，体外转录获得sgRNA库。

3.根据权利要求2所述的基于CRISPR高效富集靶向序列的方法，其特征在于：在所述上游引物的T7启动子后面还添加有一到三个G。

4.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法，其特征在于：步骤(2)中在DNA封闭处理后，用正钒酸钠或高温处理灭活酶活。

5.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法，其特征在于：步骤(3)靶向切割后，加入核酸水解酶水解非靶基因的序列，然后终止核酸水解酶反应，纯化获得靶基因样本。

6.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法，其特征在于：所述碱性磷酸酶为FastAP热敏感性碱性磷酸酶。

7.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法，其特征在于：步骤(2)中碱性磷酸酶与DNA投入量比例为1U/pmol-100U/pmol，碱性磷酸酶与DNA的孵育时间为10-30min，孵育温度为37-50℃。

8.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法，其特征在于：步骤(2)中总DNA投入量为1ng-10ug。

9.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法，其特征在于：步骤(3)中孵育所用的缓冲液包括5mM-500mM三羟甲基氨基甲烷，10mM-1M氯化钠，1mM-100mM氯化镁，0.05mM-0.5mM二硫苏糖醇、0.1mM-1mM乙二胺四乙酸。

10.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法，其特征在于：

步骤(3)中孵育时间为30-90min。

11.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法，其特征在于：所述靶向序列为乳腺癌基因，所述sgRNA探针的序列包括SEQ ID No.1-242所示的序列。

12.一种基于CRISPR高效富集乳腺癌基因的测序试剂盒，其特征在于：包括sgRNA库，其sgRNA探针序列如SEQ ID No.1-242所示。

13.根据权利要求12所述的测序试剂盒，其特征在于：还包括Cas核酸酶、Cas核酸酶buffer、碱性磷酸酶。