CN115948503A - 基于crispr高效富集靶向序列的方法 - Google Patents
基于crispr高效富集靶向序列的方法 Download PDFInfo
- Publication number
- CN115948503A CN115948503A CN202310014071.6A CN202310014071A CN115948503A CN 115948503 A CN115948503 A CN 115948503A CN 202310014071 A CN202310014071 A CN 202310014071A CN 115948503 A CN115948503 A CN 115948503A
- Authority
- CN
- China
- Prior art keywords
- crispr
- dna
- sgrna
- sequence
- targeting sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008685 targeting Effects 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 30
- 108091027544 Subgenomic mRNA Proteins 0.000 claims abstract description 50
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 31
- 239000011324 bead Substances 0.000 claims abstract description 23
- 102000002260 Alkaline Phosphatase Human genes 0.000 claims abstract description 19
- 108020004774 Alkaline Phosphatase Proteins 0.000 claims abstract description 19
- 238000003776 cleavage reaction Methods 0.000 claims abstract description 13
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims abstract description 10
- 108010090804 Streptavidin Proteins 0.000 claims abstract description 9
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 9
- 230000007017 scission Effects 0.000 claims abstract description 9
- 230000000903 blocking effect Effects 0.000 claims abstract description 7
- 229960002685 biotin Drugs 0.000 claims abstract description 5
- 235000020958 biotin Nutrition 0.000 claims abstract description 5
- 239000011616 biotin Substances 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims abstract description 3
- 108020004414 DNA Proteins 0.000 claims description 43
- 239000000523 sample Substances 0.000 claims description 27
- 238000012163 sequencing technique Methods 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000011534 incubation Methods 0.000 claims description 10
- 206010006187 Breast cancer Diseases 0.000 claims description 8
- 208000026310 Breast neoplasm Diseases 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 8
- 101710163270 Nuclease Proteins 0.000 claims description 7
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 claims description 6
- 102000004190 Enzymes Human genes 0.000 claims description 5
- 108090000790 Enzymes Proteins 0.000 claims description 5
- 238000013461 design Methods 0.000 claims description 5
- 108020004707 nucleic acids Proteins 0.000 claims description 5
- 102000039446 nucleic acids Human genes 0.000 claims description 5
- 108700019961 Neoplasm Genes Proteins 0.000 claims description 4
- 102000048850 Neoplasm Genes Human genes 0.000 claims description 4
- 239000000872 buffer Substances 0.000 claims description 4
- 238000000338 in vitro Methods 0.000 claims description 4
- 238000013518 transcription Methods 0.000 claims description 4
- 230000035897 transcription Effects 0.000 claims description 4
- IHIXIJGXTJIKRB-UHFFFAOYSA-N trisodium vanadate Chemical compound [Na+].[Na+].[Na+].[O-][V]([O-])([O-])=O IHIXIJGXTJIKRB-UHFFFAOYSA-N 0.000 claims description 4
- 238000011144 upstream manufacturing Methods 0.000 claims description 4
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 claims description 3
- 102000004157 Hydrolases Human genes 0.000 claims description 3
- 108090000604 Hydrolases Proteins 0.000 claims description 3
- 239000007983 Tris buffer Substances 0.000 claims description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 claims description 3
- 239000011780 sodium chloride Substances 0.000 claims description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 claims description 3
- 102000053602 DNA Human genes 0.000 claims description 2
- 230000001681 protective effect Effects 0.000 claims description 2
- 239000007853 buffer solution Substances 0.000 claims 1
- 230000000415 inactivating effect Effects 0.000 claims 1
- 238000007789 sealing Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 19
- 238000010453 CRISPR/Cas method Methods 0.000 abstract description 6
- 238000004925 denaturation Methods 0.000 abstract description 5
- 230000036425 denaturation Effects 0.000 abstract description 5
- 230000035945 sensitivity Effects 0.000 abstract description 4
- 239000002299 complementary DNA Substances 0.000 description 12
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 11
- 239000000203 mixture Substances 0.000 description 7
- 108091033409 CRISPR Proteins 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 239000000047 product Substances 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 108091007743 BRCA1/2 Proteins 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 238000007403 mPCR Methods 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 108020005004 Guide RNA Proteins 0.000 description 3
- 102000006382 Ribonucleases Human genes 0.000 description 3
- 108010083644 Ribonucleases Proteins 0.000 description 3
- 238000010009 beating Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000035484 reaction time Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 238000007671 third-generation sequencing Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 108091093088 Amplicon Proteins 0.000 description 2
- 108010067770 Endopeptidase K Proteins 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000007664 blowing Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012070 whole genome sequencing analysis Methods 0.000 description 2
- NOIIUHRQUVNIDD-UHFFFAOYSA-N 3-[[oxo(pyridin-4-yl)methyl]hydrazo]-N-(phenylmethyl)propanamide Chemical compound C=1C=CC=CC=1CNC(=O)CCNNC(=O)C1=CC=NC=C1 NOIIUHRQUVNIDD-UHFFFAOYSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 101100385364 Listeria seeligeri serovar 1/2b (strain ATCC 35967 / DSM 20751 / CCM 3970 / CIP 100100 / NCTC 11856 / SLCC 3954 / 1120) cas13 gene Proteins 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 108091036333 Rapid DNA Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 238000007605 air drying Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- -1 cas12 Proteins 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 238000006912 hydrolase reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 238000011027 product recovery Methods 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种基于CRISPR高效富集靶向序列的方法,其步骤包括:设计并制备所述靶向序列的sgRNA库;对样本的DNA采用碱性磷酸酶进行封闭处理,制备获得封闭的DNA;将步骤(1)中制备的sgRNA库,与Cas蛋白以及步骤(2)获得的所述封闭的DNA一起孵育,进行靶向切割;在靶向切割后的DNA上连接生物素修饰的接头或用polyA修饰;链霉亲和素磁珠或oligo‑dT磁珠处理,扩增,获得靶向序列的文库。本发明方法适用范围广,灵敏度高,效率高,背景少,操作简便。相较于其他捕获技术,该技术涉及的CRISPR/Cas系统稳定性好、耗时短、DNA无需热变性、成本低,故适用于各种复杂样品的靶向序列富集。
Description
技术领域
本发明专利涉及一种基于CRISPR高效富集靶向序列的方法,属于生物技术领域。
背景技术
基因检测技术的不断发展和完善推动了临床诊断和研究的进步,二代和三代测序技术是目前市场上主流的测序技术,其优势在于通量高,灵敏度高,自动化程度高。人的基因组信息庞大,大约包含30亿个碱基对,而真正编码基因的区域占比不到4%,外显子区域及转录调控元件区域占比低于1%。而致病突变绝大多数富集在外显子区域及转录调控元件区域上,因此这些区域的基因信息对疾病的诊断和治疗具有关键的作用。由于这些区域占比太少,利用全基因组测序技术进行序列信息验证和突变类型分析具有极低的效率和准确率。通常对于一个位点信息的判断需要成百乃至上万的测序覆盖深度,这意味着利用全基因测序进行基因信息的有效分析往往需要超过数百G的测序数据,这极大的增加了二代测序和三代测序在基因诊断上的成本和普及难度,也造成了大量的不必要浪费。而对全基因组进行测序面临着成本高、数据分析复杂、周期长等问题。因此,开发一种捕获靶位点基因序列的技术,是二代和三代测序技术在基因治疗领域普及和应用的关键。基因捕获测序的主要优势在于可针对特定区域进行测序,有效降低了测序成本,提高了测序深度,更精确地发现特定区域遗传变异信息。与范围广泛的全基因组测序相比,靶向测序用于研究特定区域,提供了一种更加经济高效的策略,将重点放在那些最有可能参与所研究表型的区域,从而节省资源,并生成更小、更易于管理的数据集。
目前常用的基因捕获方法包括杂交捕获和多重PCR扩增,杂交捕获根据核酸分子碱基互补杂交原理,针对目标区域设计特异探针并将探针合成在固相或液相芯片上,然后打断基因组DNA,加上测序接头后与探针杂交,将基因组DNA目标区域捕获下来,回收目标DNA片段,直接构建高通量测序文库。杂交捕获的特点是能够对外显子组甚至更大的目标区域进行捕获,但操作流程复杂,需要依赖较多专门的仪器设备。扩增子测序是一种目标区域高通量测序技术,首先利用多重PCR扩增、富集样品基因组中目标区域的DNA片段,再进行文库构建和高通量测序。扩增子测序具有目的明确、应用灵活、价格低廉、分析简单等优点,但多重PCR体系中需要解决多个靶点扩增条件不兼容,灵敏度低,背景高等技术问题。
近年来,随着基因编辑技术CRISPR/Cas系统的发展,各类Cas蛋白被开发出来应用于不同的领域。一种切割活性完全失活的dCas9成为体外基因捕获的重要工具。这种方法结合了CRISPR/Cas9基因编辑系统的高特异性,也利用了dCas9带有的解旋酶活性,因此可以在室温下利用带有特殊修饰的dCas9和sgRNA对靶位点进行捕获。这种捕获方法相较于传统的探针杂交捕获技术,具有成本低、耗时短(2h)、捕获效率高、操作简单、DNA无需热变性等优点,但是dCas9自身与DNA的非特异性结合和sgRNA的脱靶效应严重阻碍了捕获效率和特异性。
发明内容
本发明的目的是提供一种基于CRISPR高效富集靶向序列的方法。
本发明采取的技术方案为:
一种基于CRISPR高效富集靶向序列的方法,其步骤包括:
(1)设计并制备所述靶向序列的sgRNA库;
(2)对样本的总DNA采用碱性磷酸酶进行封闭处理,制备获得封闭的DNA;
(3)将步骤(1)中制备的sgRNA库,与Cas蛋白以及步骤(2)获得的所述封闭的DNA一起孵育,进行靶向切割;
(4)在靶向切割后的DNA上连接生物素修饰的接头或用polyA修饰;
(5)链霉亲和素磁珠或oligo-dT磁珠处理,扩增,获得富集靶向序列的文库。
总DNA可以来源于RNA文库的DNA、基因组DNA文库的DNA,也可以是片段化的DNA。
优选的,步骤(1)具体为设计与靶向序列的DNA互补配对的sgRNA探针,并合成上游引物和下游引物,上游引物为在每条sgRNA探针的5’端添加含有T7启动子和保护碱基的序列TTCTAATACGACTCACTATA(SEQ ID No.243),在T7启动子后面通常还要添加一到三个G,在每条sgRNA探针的3’端添加含有Cas蛋白骨架重叠区域的序列GTTTTAGAGCTAGA(SEQ IDNo.244),下游引物的序列为AAAAGCACCGACTCGGTGCC(SEQ ID No.245),PCR扩增双链DNA模板,体外转录获得sgRNA库。
优选的,步骤(2)中在DNA封闭处理后,用正钒酸钠或高温处理灭活酶活。
优选的,步骤(3)靶向切割后,加入核酸水解酶水解非靶基因的序列,然后终止核酸水解酶反应,纯化获得靶基因样本。
优选的,所述碱性磷酸酶为FastAP热敏感性碱性磷酸酶。
优选的,步骤(2)中碱性磷酸酶与总DNA投入量比例为1U/pmol-100U/pmol,碱性磷酸酶与总DNA的孵育时间为10-30min,孵育温度为37-50℃。
优选的,步骤(2)中总DNA投入量为1ng-10ug。
优选的,步骤(3)中所述sgRNA等摩尔量混合。
优选的,步骤(3)中孵育所用的缓冲液包括5mM-500mM三羟甲基氨基甲烷,10mM-1M氯化钠,1mM-100mM氯化镁,0.05mM-0.5mM二硫苏糖醇、0.1mM-1mM乙二胺四乙酸。
优选的,步骤(3)中孵育所用的缓冲液包括100mM三羟甲基氨基甲烷,100mM氯化钠,10mM氯化镁,0.1mM二硫苏糖醇、0.2mM乙二胺四乙酸。
优选的,所述Cas蛋白包括但不限于Cas9、Cas12、Cas13、Cas14。
优选的,步骤(3)中孵育时间为30-90min。更优选的,为60min。
优选的,所述靶向序列为乳腺癌基因,所述sgRNA的序列包括SEQ ID No.1-242所示的序列。
本发明还公开了一种基于CRISPR高效富集乳腺癌基因的测序试剂盒,包括sgRNA库,其sgRNA探针序列如SEQ ID No.1-242所示。
优选的,还包括Cas核酸酶、Cas核酸酶buffer、碱性磷酸酶。更优选的,Cas核酸酶为Cas9核酸酶。
本发明的有益效果为:
本发明的原理是基于CRISPR/Cas系统,设计靶向基因的sgRNA库,与Cas相关蛋白预结合,再与碱性磷酸酶封闭的样本进行孵育,通过靶序列切割后连接生物素修饰的接头或用polyA修饰,在链霉亲和素磁珠或oligo-dT磁珠筛选处理后扩增靶向序列达到富集目的。本发明的Cas复合物在预结合之前进行DNA封闭,减少了接头的非特异性连接,提高了靶向富集特异性;链霉亲和素磁珠或oligo-dT磁珠处理降低了背景干扰,适用于各类复杂DNA样本,拓宽了该技术使用范围。
本发明方法适用范围广,灵敏度高,效率高,背景少,操作简便。相较于其他捕获技术,该技术涉及的CRISPR/Cas系统稳定性好、耗时短、DNA无需热变性、程序简单、成本低,故适用于各种复杂样品的靶向序列富集。
附图说明
图1基于CRISPR高效富集靶向序列的技术流程和原理图。
图2Qsep验证sgRNA库的大小。
图3基于CRISPR高效富集靶向序列针对不同sgRNA投入量的效率比较,本图中未投入sgRNA。
图4基于CRISPR高效富集靶向序列针对不同sgRNA投入量的效率比较,本图中投入的sgRNA为1ng。
图5基于CRISPR高效富集靶向序列针对不同sgRNA投入量的效率比较,本图中投入的sgRNA为10ng。
图6基于CRISPR高效富集靶向序列针对不同sgRNA投入量的效率比较,本图中投入的sgRNA为100ng。
图7基于CRISPR高效富集靶向序列针对不同切割时间的效率比较,本图中切割时间为30min。
图8基于CRISPR高效富集靶向序列针对不同切割时间的效率比较,本图中切割时间为40min。
图9基于CRISPR高效富集靶向序列针对不同切割时间的效率比较,本图中切割时间为60min。
图10基于CRISPR高效富集靶向序列针对不同切割时间的效率比较,本图中切割时间为90min。
图11基于CRISPR高效富集靶向序列针对不同cDNA投入量的效率比较。
图12测序验证两种基因捕获技术对BRCA1/2基因的捕获效率和特异性。
具体实施方式
通过以下详细说明结合附图可以进一步理解本发明的特点和优点。图1展示了本发明的原理和技术流程。本发明所提供的实施例仅是对本发明方法的说明,而不以任何方式限制本发明揭示的其余内容。本实施例以乳腺癌相关基因作为示例,本实施例所使用的引物序列如表1所示。
表1sgRNA探针序列
实施例1:乳腺癌相关基因sgRNA pool制备及鉴定。
在本实施例中,我们制备了靶向乳腺癌相关基因的sgRNA库并进行鉴定。具体实施方式如下:
1)gRNA的设计:利用网站E-CRISPOR(http://crispor.tefor.net/crispor.py)对乳腺癌相关基因的CDS区域进行gRNA的设计,以约200bp/条的设计密度选中评分较高的gRNA,序列如表1。
2)sgRNA pool模板制备:按照表1进行引物合成(生工生物工程(上海)股份有限公司),加DEPC水将每条引物稀释至10μM。
使用翌圣生物的Gold PCR Master Mix(Cat#10149)进行sgRNA库模板的扩增,扩增体系:Gold PCR Master Mix,1μL sgRNA引物F(10μM),1μL sgRNA引物R(10μM),1μL Scaffold Template(1μM),加水补至50μL体系。程序:98℃3min;98℃,10sec;68℃,30sec;40个循环。
4)取上述产物5μL进行核酸电泳鉴定扩增产物特异性。另取5μL sgRNA模板使用翊圣生物的T7 High Yield RNA Synthesis Kit(Cat#10623)对sgRNA进行体外转录。反应体系如下所示:
5)将上述反应液混合均匀,短暂离心至管底,37℃孵育4个小时。
6)反应完成后,每管加入2μL DNaseⅠ(RNase free),37℃孵育15min以去除模板DNA。
7)转录后的RNA使用翌圣生物RNA Cleaner磁珠进行纯化(Cat#12602),吸取2×磁珠加入RNA样品中,用移液器吹打6次充分混匀。室温孵育5min,使RNA结合到磁珠上。将样品置于磁力架上5min,待溶液澄清后,小心移除上清。保持样品置于磁力架上,加入200μL新鲜配制的80%乙醇漂洗磁珠,室温孵育30s,小心移除上清。重复此操作一次,开盖空气干燥磁珠5min,加入22μL RNase free H2O,用移液器吹打6次以充分混匀,室温静置5min。将样品置于磁力架5min,待溶液澄清后,小心转移上清20μL至一个新的RNase free PCR管中,即获得sgRNA pool mix。
8)检测RNA大小、质量及产量:用Agilent 2100Bioanalyzer评估上述RNA完整度及质量,结果如图2所示,根据图2可知本实施例获得RNA完整度高、质量好;用Nanodrop测定转录的RNA产量。
实施例2:sgRNA投入量测试
1)制备cDNA
使用翌圣生物mRNA纯化试剂盒(Cat#12603)将mRNA从4μg完整度良好的总RNA中进行分离纯化。
2)使用翌圣生物DNA&RNA共建库试剂盒(Cat#12299)制备二链cDNA,先进行RNA变性处理,反应体系如下:
组分 | 体积 |
Dt23VN | 1μL |
步骤1)制备获得的mRNA | 14μL |
Total | 15μL |
使用移液器轻轻吹打混匀,瞬离将反应液离心至管底,70℃,5min,立即置于冰上3min;再进行第一链的合成,反应体系如下:
使用移液器轻轻吹打混匀,瞬离将反应液离心至管底,25℃,5min;42℃,30min;85℃,5min;4℃,hold,得到第一链cDNA;
进行第二链的合成,反应体系如下:
组分 | 体积 |
1st Strand cDNA产物 | 25μL |
2nd Reaction Buffer | 7μL |
2nd Strand Enzyme Mix | 3μL |
Total | 35μL |
使用移液器轻轻吹打混匀,瞬离将反应液离心至管底,16℃,30min,得到二链cDNA。
3)使用碱性磷酸酶(Sigma Aldrich)处理步骤2)获得的二链cDNA,37℃,30min,加入1U正钒酸钠灭活酶活,得到去磷酸化DNA。
4)切割反应,Cas9核酸酶的来源为重组E.coli菌株,其克隆来自Streptococcuspyogenes的Cas9基因。对不同的sgRNA投入量分别进行切割反应,体系如下:
5)回收的DNA使用dA-Tailing Module进行末端加A,使用翌圣生物快速DNA连接模块(Cat#12805)进行后续接头连接,其中所用接头经生物素修饰,链霉亲和素磁珠筛选产物,扩增,纯化后电泳鉴定并测序,不同sgRNA投入量富集比例如图3-6所示,100ng的sgRNA投入量具有更高的捕获效率和特异性。
实施例3切割时间的测试
在本实施例中,我们比较了不同切割反应时间(30-90min)在基于CRISPR高效富集靶向序列的捕获效果。结果如图7-10所示,切割反应时间为60min时具有更高的捕获效率和捕获特异性。
实施例4cDNA样本切割量
1)使用碱性磷酸酶(Sigma Aldrich)处理待捕获的cDNA,37℃,30min,加入1U正钒酸钠灭活酶活。
2)切割反应,体系如下:
去磷酸化DNA | 1ng/10ng/100ng |
sgRNA pool mix | 100ng |
Cas 9 BF | 2μL |
Cas9核酸酶 | 5pmol |
补加DEPC水至 | 20μL |
3)回收的DNA使用dA-Tailing ModμLe进行末端加A,使用翌圣生物快速DNA连接模块(Cat#12805)进行后续接头连接,纯化产物,扩增,纯化后电泳鉴定并测序,不同cDNA样本投入量富集比例如图11所示,10ng的cDNA投入量具有更高的捕获效率和特异性。
实施例5与多重PCR靶向捕获测序技术的比较
在本实施例中,我们比较两种基因捕获方式对BRCA1/2基因的捕获效果。使用的探针是表1中102-174号相对应的靶向BRCA1/2的sgRNA。具体实施方式如下
1)本实施例中CRISPR处理方式参照实施例1和实施例2。其中,使用常规试剂盒获得二链cDNA,sgRNA的用量为100ng,Cas9用量为5pmol,反应时间为60min。其中,使用未经碱性磷酸酶封闭和未用链霉亲和素磁珠筛选的方案作为对照。
将回收的DNA进行NGS测序分析,两种基因捕获方式的比较见图12。可以看出,将样本预先进行碱性磷酸酶封闭处理,可以大幅提高靶向富集的特异性,采用链霉亲和素磁珠筛选,同样可以大幅提高靶向序列的占比。
综上,为解决目前基因捕获方式所遇到的难题,我们开发了一种基于CRISPR的新型靶向序列富集测序技术,该方法原理是基于CRISPR/Cas系统,设计靶向基因的sgRNA库,与Cas相关蛋白预结合,再与预先进行碱性磷酸酶封闭处理的样本进行孵育,通过靶序列切割后连接生物素修饰的接头或用polyA修饰,在链霉亲和素磁珠或oligo-dT磁珠筛选处理后扩增靶向序列达到富集目的,这种方法适用范围广,灵敏度高,效率高,背景少,操作简便。相较于其他捕获技术,该技术涉及的CRISPR/Cas系统稳定性好、耗时短、DNA无需热变性、程序简单、成本低,故适用于各种复杂样品的靶向序列富集。
Claims (13)
1.一种基于CRISPR高效富集靶向序列的方法,其特征在于其步骤包括:
(1)设计并制备所述靶向序列的sgRNA库;
(2)对样本的总DNA采用碱性磷酸酶进行封闭处理,制备获得封闭的DNA;
(3)将步骤(1)中制得的sgRNA库,与Cas蛋白以及步骤(2)获得的所述封闭的DNA一起孵育,进行靶向切割;
(4)在靶向切割后的DNA上连接生物素修饰的接头或用polyA修饰;
(5)链霉亲和素磁珠或oligo-dT磁珠处理,扩增,获得靶向序列的文库。
2.根据权利要求1所述的基于CRISPR高效富集靶向序列的方法,其特征在于:步骤(1)具体为设计与靶向序列的DNA互补配对的sgRNA探针,并合成上游引物和下游引物,上游引物为在每条sgRNA探针的5’端添加含有T7启动子和保护碱基的序列TTCTAATACGACTCACTATA,在每条sgRNA探针的3’端添加含有Cas蛋白骨架重叠区域的序列GTTTTAGAGCTAGA,下游引物的序列为AAAAGCACCGACTCGGTGCC,PCR扩增双链DNA模板,体外转录获得sgRNA库。
3.根据权利要求2所述的基于CRISPR高效富集靶向序列的方法,其特征在于:在所述上游引物的T7启动子后面还添加有一到三个G。
4.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法,其特征在于:步骤(2)中在DNA封闭处理后,用正钒酸钠或高温处理灭活酶活。
5.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法,其特征在于:步骤(3)靶向切割后,加入核酸水解酶水解非靶基因的序列,然后终止核酸水解酶反应,纯化获得靶基因样本。
6.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法,其特征在于:所述碱性磷酸酶为FastAP热敏感性碱性磷酸酶。
7.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法,其特征在于:步骤(2)中碱性磷酸酶与DNA投入量比例为1U/pmol-100U/pmol,碱性磷酸酶与DNA的孵育时间为10-30min,孵育温度为37-50℃。
8.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法,其特征在于:步骤(2)中总DNA投入量为1ng-10ug。
9.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法,其特征在于:步骤(3)中孵育所用的缓冲液包括5mM-500mM三羟甲基氨基甲烷,10mM-1M氯化钠,1mM-100mM氯化镁,0.05mM-0.5mM二硫苏糖醇、0.1mM-1mM乙二胺四乙酸。
10.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法,其特征在于:
步骤(3)中孵育时间为30-90min。
11.根据权利要求1-3中任一项所述的基于CRISPR高效富集靶向序列的方法,其特征在于:所述靶向序列为乳腺癌基因,所述sgRNA探针的序列包括SEQ ID No.1-242所示的序列。
12.一种基于CRISPR高效富集乳腺癌基因的测序试剂盒,其特征在于:包括sgRNA库,其sgRNA探针序列如SEQ ID No.1-242所示。
13.根据权利要求12所述的测序试剂盒,其特征在于:还包括Cas核酸酶、Cas核酸酶buffer、碱性磷酸酶。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310014071.6A CN115948503A (zh) | 2023-01-05 | 2023-01-05 | 基于crispr高效富集靶向序列的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310014071.6A CN115948503A (zh) | 2023-01-05 | 2023-01-05 | 基于crispr高效富集靶向序列的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115948503A true CN115948503A (zh) | 2023-04-11 |
Family
ID=87290514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310014071.6A Pending CN115948503A (zh) | 2023-01-05 | 2023-01-05 | 基于crispr高效富集靶向序列的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115948503A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118006746A (zh) * | 2024-02-08 | 2024-05-10 | 北京博奥医学检验所有限公司 | 基于CRISPR-dCas9的DNA靶向捕获测序方法、系统和设备 |
-
2023
- 2023-01-05 CN CN202310014071.6A patent/CN115948503A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118006746A (zh) * | 2024-02-08 | 2024-05-10 | 北京博奥医学检验所有限公司 | 基于CRISPR-dCas9的DNA靶向捕获测序方法、系统和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107586835B (zh) | 一种基于单链接头的下一代测序文库的构建方法及其应用 | |
CN110093455B (zh) | 一种呼吸道病毒的检测方法 | |
WO2016082129A1 (zh) | 一种核酸的双接头单链环状文库的构建方法和试剂 | |
US20230056763A1 (en) | Methods of targeted sequencing | |
CN109593757B (zh) | 一种探针及其适用于高通量测序的对目标区域进行富集的方法 | |
CN106497920A (zh) | 一种用于非小细胞肺癌基因突变检测的文库构建方法及试剂盒 | |
EP3098324A1 (en) | Compositions and methods for preparing sequencing libraries | |
CN110343785B (zh) | 基于PCR-CRISPR-cas13a检测乙型肝炎病毒共价闭合环状DNA的试剂盒 | |
CN110734967B (zh) | 一种接头组合物及其应用 | |
CN107557450A (zh) | 一种快速构建高通量测序文库的试剂及方法及其应用 | |
CN113463202B (zh) | 一种新的rna高通量测序的方法、引物组和试剂盒及其应用 | |
CN109576346A (zh) | 高通量测序文库的构建方法及其应用 | |
CN112941635A (zh) | 一种提高文库转化率的二代测序建库试剂盒及其方法 | |
CN105734679A (zh) | 核酸靶序列捕获测序文库的制备方法 | |
WO2023193748A1 (zh) | 基于crispr技术的靶基因捕获的方法 | |
CN109182454A (zh) | 一种捕获基因组特定dna片段的方法 | |
WO2017215517A1 (zh) | 测序文库构建中5'和3'接头连接副产物的去除方法 | |
CN115948503A (zh) | 基于crispr高效富集靶向序列的方法 | |
St. John et al. | Rapid capture of DNA targets | |
CN113699214A (zh) | 基于基因捕获技术的测序方法 | |
CN113667714B (zh) | 一种目标区域捕获方法、试剂盒及测序方法 | |
CN116590392A (zh) | 一种在全基因组水平鉴定植物R-loop位点的方法 | |
CN116287124A (zh) | 单链接头预连接方法、高通量测序文库的建库方法及试剂盒 | |
CN117448300A (zh) | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 | |
CN110359096A (zh) | 一种利用生物样本直接构建靶向文库的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |