CN113897349A - 一种基于CRISPR/Cas12a的体外大片段DNA克隆方法及其应用 - Google Patents

一种基于CRISPR/Cas12a的体外大片段DNA克隆方法及其应用 Download PDF

Info

Publication number
CN113897349A
CN113897349A CN202010575747.5A CN202010575747A CN113897349A CN 113897349 A CN113897349 A CN 113897349A CN 202010575747 A CN202010575747 A CN 202010575747A CN 113897349 A CN113897349 A CN 113897349A
Authority
CN
China
Prior art keywords
cas12a
dna
fragment
cloning
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010575747.5A
Other languages
English (en)
Inventor
张立新
谭高翼
梁敏东
王为善
刘乐诗
曾晓倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China University of Science and Technology
Original Assignee
East China University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China University of Science and Technology filed Critical East China University of Science and Technology
Priority to CN202010575747.5A priority Critical patent/CN113897349A/zh
Priority to PCT/CN2020/120332 priority patent/WO2021258580A1/zh
Publication of CN113897349A publication Critical patent/CN113897349A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1051Gene trapping, e.g. exon-, intron-, IRES-, signal sequence-trap cloning, trap vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及包含CRISPR/Cas12a系统介导的大片段DNA体外克隆方法、试剂盒以及相关用途。所述DNA克隆的机理在于,采用Cas12a/crRNA在目标DNA两端进行特异性切割获得目标DNA序列,通过克隆目标DNA两端DNA序列构建克隆载体,利用Cas12a/crRNA对克隆载体切割获得线性化载体,通过DNA连接酶对切割后形成的粘性末端进行连接,从而实现对目标DNA的克隆。本发明的大片段DNA克隆方法、试剂盒及其相关的用途在克隆高GC含量(例如70%以上)大片段DNA(最高可达140kb)时不仅能节约时间和成本,而且阳性率高并具有市场应用的潜力。

Description

一种基于CRISPR/Cas12a的体外大片段DNA克隆方法及其应用
技术领域
本发明涉及分子生物学领域,具体涉及基于CRISPR/Cas12a的体外(in vitro)大片段DNA克隆方法、试剂盒及其应用。
背景技术
随着基因测序技术的不断进步和测序成本的不断降低,全基因组测序变得越来越容易,人们发现基因组中蕴藏着丰富的尚未开发的资源。尤其是随着新一代测序技术使得大量隐性次级代谢产物生物合成基因簇(biosynthetic gene clusters,BGC,其大小从几kb到上百kb)不断积累。例如,在微生物基因组或肠道宏基因组中发现了庞大的隐性生物合成基因簇(BGC),并且这些隐性BGC的激活或表达已成为一种天然产物发现最重要的方法。但是,大量的BGC来源自不适合遗传操作或不可培养的物种(例如一些微生物)。因此,高效地克隆这些大片段DNA克隆,是推进对基因组和宏基因组进行深度挖掘的关键步骤。
目前,对于大片段DNA(例如大于10kb)克隆,常用的克隆方法主要有以下几大类:1)基因组文库;2)基于重组酶的Red/ET和ExoCET系统;3)Gibson组装;4)利用酵母重组系统的TAR技术;以及5)CRIPR/Cas9介导的CATCH等(见下表1)。
基因组文库作为传统方法,在构建和筛选方面不但操作复杂、耗时、费力,而且目的DNA片段经常分散的位于几个不同的克隆上,在进行基因功能研究时往往需要对其进行亚克隆,删除多余序列或者需要将其缝合成一个完整地生物合成途径。
Rec/ET克隆技术的原理是:Rac噬菌体重组蛋白,即全长的RecE和RecT能够在大肠杆菌细胞内高效地介导线性DNA分子之间发生同源重组(线线重组)。其中,RecE是5’-3’核酸外切酶,RecT是单链DNA退火蛋白,RecE和RecT之间的蛋白-蛋白相互作用是线线重组所必须的,Rec/ET联合作用的线线重组效率是单独作用的1000倍。但是Rec/ET克隆技术很难从细菌基因组上克隆大于50kb的DNA片段,也无法从哺乳动物基因组上克隆DNA片段。这是由于Rec/ET克隆技术依赖于细胞内表达的RecET重组酶,只有当克隆载体和目的DNA片段同时进入一个大肠杆菌细胞内并相遇才能发生同源重组,这就导致了该技术的局限性:(1)受到基因组DNA片段大小的限制,比如无法从从细菌基因组中克隆大于50kb的DNA片段或者从哺乳动物(比如老鼠和人)中克隆大于10kb的基因组片段;(2)受到DNA片段数目的影响,对于多片段组装来说,当DNA片段数量超过4个以上时,组装效率急剧降低,目前RecET直接克隆技术最多只能组装5个DNA片段。
基于Rec/ET克隆技术,进一步开发了ExoCET克隆技术:在体外先用核酸外切酶处理基因组DNA和克隆载体,然后再将体外反应产物在RecET重组酶的存在下进行同源重组,从而建立了ExoCET克隆技术。ExoCET技术能够从细菌基因组上直接克隆>100kb的DNA片段,而且能够从哺乳动物细胞和人血中克隆>50kb的DNA片段。ExoCET技术还能组装至少20个以上的DNA片段,使其形成一个完整的质粒。然而,由于该技术基于基因重组进行克隆,对于高GC片段和重复序列会发生错配。
随着合成生物学技术的进步,大于10kb的DNA大片段还可以通过Gibson体外组装或者DNA assembler体内组装等方式由小片段组装而成。但是上述DNA组装需要PCR或者化学合成来制备小片段,容易引入随机突变并为后期基因功能研究带来不便。同时,上述方式对于要组装的DNA片段的量要求较高,需要采用纯度和浓度相对较高的目标DNA片段,不能用于直接从酶解的基因组DNA片段混合物中组装目的DNA片段。
近年来随着基因编辑技术(ZFN(锌指蛋白酶)、TALEN(转录激活因子样效应物核酸酶,transcription activator-like effector nucleases)以及CRISPR/Cas9等)的发展,人们进一步开发出了基于基因编辑技术的大片段DNA克隆技术。例如,Larionov等将CRISPR/cas9技术与酵母转化相关的重组(TAR)克隆技术联合使用,该方法可以提高TAR克隆的效率但不能显著提高克隆大片段DNA的克隆长度。并且由于YAC载体在酵母的拷贝数低,很难分离纯化以获得足量的DNA用于下一步克隆和基因编辑。
最近建立的CATCH(Cas9-Assisted Targeting of Chromosome Segments)技术利用Cas9体外切割和Gibson组装将DNA大片段克隆到BAC上。该方法目前只被应用于原核生物基因组,而且在对重组DNA进行限制性酶切鉴定之前需要先对菌落进行PCR预筛选。并且,CRISPR和Gibson技术联合的体外重组技术只能有效克隆100kb以下的DNA片段。
此外,基因编辑技术还可以和细菌的Red/ET克隆技术相结合用于克隆大片段的DNA。例如,Baker等将被CRISPR切割的DNA片段和线性载体一起转化到表达λ噬菌体Red/ET重组系统的细菌中DNA片段可以在细菌体内通过序列依赖的酶促反应拼装成单一的重组子。但是受到Red/ET克隆技术本身的局限,理论上也很难获得50kb以上的单个重组子。
用于体外克隆大片段DNA的现有技术(以BGC为例)
Figure BDA0002551303180000021
Figure BDA0002551303180000031
BAC:细菌人工染色体;ULCC:克隆能力上限;BGC:生物合成基因簇;NP:天然产物;CATCH:Cas9辅助的染色体片段靶向;TAR:转化相关重组;YA:酵母组装;GA:Gibson组装;ExoCET:核酸外切酶结合RecET重组。
因此,对于大片段DNA、特别是对于高GC含量样品,仍需要一种更为简单高效的基因簇克隆方法。
随着基因编辑技术的进展,CRISPR/Cas12a逐渐被人们所认识。CRISPR/Cas12a是II类CRISPR/Cas系统的单个RNA引导(crRNA)核酸内切酶。与Cas9不同的是,Cas12a识别T-rich protospacer-motif(PAM),而非Cas9的G-rich PAM,并产生粘性末端,有着广泛的应用前景。除基因组编辑应用程序外,CRISPR/Cas12a还广泛用于基于核酸的诊断应用程序,小分子检测等中。此外,值得注意的是,就其可编程的核酸内切酶活性以及4或5nt悬垂的DNA粘性末端而言,在DNA组装方面CRISPR/Cas12a具有明显的优势。2016年王晶团队率先报道了一种基于CRISPR/Cas12a的DNA序列的模块化组装方法C-Brick,实现了三种色素蛋白基因的组装和表达;随后又报道了DNA体外组转方法-CCTL,完成放线紫红素基因簇启动子的替换并使其产量大幅提高。然而,迄今并未有基于CRISPR/Cas12a的体外大片段DNA的克隆技术。
发明内容
为了解决上述问题,本发明一种基于CRISPR/Cas12a的大片段DNA克隆方法,用于克隆大的DNA片段。这一方法能够简单、快速并且高效地从DNA样品(例如,基因组)中克隆大片段DNA(例如,>10kb,甚至>100kb);更令人意想不到的是,该方法对于G+C含量较高(>60%)的大片段DNA的克隆尤其有效。
具体而言,本发明通过将CRISPR/Cas12a系统与克隆载体相结合,通过在目标DNA片段的末端或临近其末端产生的粘性末端与由所述目标DNA片段末端的同源臂形成的互补结合的粘性末端进行结合,使得大片段DNA能够高效地被克隆,并且保证了大片段DNA的完整性。
在第一方面,本发明提供了一种基于CRISPR/Cas12a系统的体外大片段DNA克隆方法,所述方法包括:
(1)捕获载体的构建以及切割:制备目标DNA片段的两端的同源臂,并将所述同源臂连接到载体中,从而得到所述捕获载体,其中,所述同源臂包含至少一个能够被Cas12a或其生物活性功能片段或变体识别的PAM位点;基于至少部分地互补结合至所述同源臂的crRNA,使用所述Cas12a或其生物活性功能片段或变体,对所述捕获载体进行切割,从而得到经切割的捕获载体;
(2)目标DNA片段的制备:基于所述crRNA并使用所述Cas12a或其生物活性功能片段或变体,对包含目标DNA片段的样品进行切割,得到所述目标DNA片段;以及
(3)连接以及转化:将所述经切割的捕获载体与所述目标DNA片段进行连接,并转入/导入宿主细胞中,得到具有所述目标DNA片段的重组宿主细胞。
在一个实施方式中,所述样品为分离的核酸样品,例如分离的DNA样品。作为一个实例,所述样品可为基因组和/或宏基因组,或者由基因组和/或宏基因组衍生而来的DNA样品(例如DNA文库,包括BAC文库和YAC文库)。
在一些实施方式中,本发明所述的克隆方法用于克隆生物合成基因簇。
所述生物合成基因簇可通过antiSMASH进行预测。
在一些实施方式中,本发明提供了基于CRISPR/Cas12a系统的体外生物合成基因簇(BGC)克隆方法,所述方法包括:
(1)BGC的预测:通过在线工具预测BGC;
(2)捕获载体的构建以及切割:制备所述BGC的两端的同源臂,并将所述同源臂连接到载体中,从而得到所述捕获载体,其中,所述同源臂包含至少一个能够被Cas12a或其生物活性功能片段或变体识别的PAM位点;基于至少部分地互补结合至所述同源臂的crRNA,使用所述Cas12a或其生物活性功能片段或变体,对所述捕获载体进行切割,从而得到经切割的捕获载体;
(3)BGC的制备:基于所述crRNA并使用所述Cas12a或其生物活性功能片段或变体,对包含所述BGC的样品进行切割,得到所述BGC;以及
(4)连接以及转化:将所述经切割的捕获载体与所述BGC进行连接,并转入/导入宿主细胞中,得到具有所述BGC的重组宿主细胞。
在优选的实施方式中,所述样品为放线菌基因组。例如,所述样品为链霉菌基因组。
在另外的方面,本发明还提供了提高CRISPR/Cas12a系统的切割效率的方法,所述方法包括在盐酸盐缓冲液中,在35℃-38℃、优选37℃的温度下进行40min-120min、优选50min-100min、更优选60min-80min。
此外,本发明还提供了用于体外大片段DNA克隆的试剂盒,所述试剂盒包含载体、Cas12a或其其生物活性功能片段或变体或者表达所述Cas12a或其其生物活性功能片段或变体的表达载体;以及使用说明书。
在优选的实施方式汇总,所述试剂盒还可包含用于CRISPR/Cas12a切割的缓冲液,所述缓冲液为盐酸盐缓冲液,pH为7.5-8.0、优选为7.9。
本发明涉及基于CRISPR/Cas12a系统介导的体外大片段DNA克隆方法、试剂盒以及相关用途,其优势在于可以快捷地对高GC含量的大片段DNA进行克隆,其操作简单、不依赖高昂的设备,节约时间和成本,且阳性率高并具有市场应用的潜力。
由于本发明的克隆方法还可用于生物合成基因簇(BGC)的基因组挖掘方法,还将其命名为CAT-FISHING(CRISPR/Cas12a-mediated fast direct biosynthetic genecluster cloning platform)。该方法不使用限制性内切酶对基因组进行随机切割,而是利用Cas12以及靶向crRNA精确切割目标片段。理论上,CAT-FISHING将成为高GC的大型BGC体外直接克隆的更简单、有效的方法。
附图说明
图1为根据本发明的克隆方法的工作原理示意图。LHA:左同源臂,RHA:右同源臂,BGC:生物合成基因簇。
图2为Cas12a酶切体系缓冲液优化结果。
图3为Cas12a酶切体系反应时间优化结果。
图4为Cas12a酶切体系PCR产物与Cas12a摩尔比优化结果。
图5为根据本发明的克隆方法和NEB限制性内切酶方法克隆效率的流程图。
图6为根据本发明的克隆方法获得的转化子的PCR验证及测序。A.PCR筛选的原理图。B.十个随机选择的克隆的PCR结果。"-"表示空白对照,以大肠杆菌DH10B的基因组为PCR模板。C.crRNA设计和粘性末端连接的原理图。使用了18nt间隔序列的crRNA,Cas12a主要在第14个碱基后切割,产生8nt的粘性末端。D.载体-片段连接处测序结果。
图7为根据本发明的克隆方法和NEB限制酶方法的克隆数和正确率的比较。
图8为50kb-BAC-up/dn-crRNA的优化结果。
图9示出了从BAC质粒中克隆不同长度的大型DNA片段。A.BAC质粒中50kb和80kb的目标片段图示。B.CRISPR/Cas12a消化后的BAC质粒的PFGE结果。
图10示出了通过PCR筛选含有pBAC2015-50 kb-BAC的正确克隆。A.pBAC2015-50kb-BAC质粒连接端及PCR产物示意图。F1、F2和F3是PCR产物,分别使用50-BAC-scr-up-F/R、50-BAC-scr-middle-F/R和BAC-scr-dn-F/R引物进行扩增。B、C和D.为PCR扩增结果,在三个独立重复实验中各筛选12个随机克隆进行PCR验证。
图11示出了通过PCR筛选含有pBAC2015-80 kb-BAC的正确克隆。A.pBAC2015-80kb-BAC质粒crRNA连接端及PCR产物示意图。F1、F2和F3是PCR产物,分别以80-BAC-scr-up-F/R、80-BAC-scr-middle-F/R和BAC-scr-dn-F/R引物进行扩增。B、C和D.为PCR扩增结果,在三个独立重复实验中各筛选12个随机克隆进行PCR验证。
图12示出了重组质粒酶切验证结果。A.pBAC2015-50 kb-BAC酶切验证结果。B.pBAC2015-80kb-BAC酶切验证结果。
图13示出了50kb和80kb目标片段的克隆数和阳性率。
图14示出了目标BGC通过根据本发明的体外克隆的操作流程。
图15示出了限制性内切酶验证五个随机选择的阳性克隆。A.Paulomycin基因簇克隆重组质粒的XhoI酶切图谱。B.Surugamides基因簇克隆重组质粒的SmLI酶切图谱。酶切条带由箭头指示。
具体实施方式
除非另有定义,本文使用的全部技术术语和科学术语具有与本文公开的内容所属领域的普通技术人员通常理解的含义相同的含义。尽管与本文所述的方法和材料类似或相同的方法和材料可用于本文公开的内容的实践或测试中,适合的方法和材料在下文中描述。本文提及的所有出版物、专利申请、专利和其它参考文献都以引用的方式将它们整体并入。另外,材料、方法和实例仅为说明性的,而不旨在进行限制。
所有专利、公开的专利申请、其它出版物、和来自GenBank和本文提到的其它数据库的序列,就相关的技术而言,通过引用以它们的整体并入。除非另外指出,所提供实施方式的实施将采用分子生物学等的常规技术,其在本领域技术人员的技术范围内。这些技术在文献中充分解释。见例如Molecular Cloning:A Laboratory Mannual,(J.Sambrook等,Cold Spring Harbor Laboratory,Cold Spring Harbor,N.Y.,1989);CurrentProtocolsin Molecular Biology(F.Ausubel等编辑,1987和最新的);EssentialMolecularBiology(Brown ed.,IRL Press 1991);Gene Expression Technology(Goeddel编辑,Academic Press 1991);Methods for Cloning and Analysis of EukaryoticGenes(Bothwell等编辑,Bartlett Publ.1990);Gene Transfer and Expression(Kriegler,Stockton Press 1990);Recombinant DNA Methodology(R.Wu等编辑,Academic Press1989);PCR:A PracticalApproach(M.McPherson等,IRL Press at OxfordUniversityPress 1991);Cell Culture for Biochemists(R.Adams编辑,ElsevierSciencePublishers 1990)。
为方便起见,在此收集了在说明书、实施例和所附权利要求中采用的某些术语。
如本文所用,术语“目标DNA片段”是指需要克隆的靶DNA片段,可以是基因组片段或者人工合成的外源片段,也可以是完整基因。
术语“基因组”包括自然发生的基因组和合成基因组,并包括遗传改造基因组,比如之前在实验室和自然中不存在的基因组,其包括修饰的基因组和包含来自多于一个种类的核酸和/或部分基因组的杂交基因组。术语“基因组”包括细胞器基因组(如,线粒体和叶绿体基因组)、自我复制生物的基因组(细胞基因组),其包括原核和真核生物、真菌、酵母、细菌(例如,支原体)、古细菌、脊椎动物、哺乳动物和其他生物,和病毒基因组以及依靠宿主增殖的其他基因组。基因组还包括没有落在任何已知林奈(Linnean)分类中的生物和合成生物的那些。示例性基因组可以是微生物基因组,比如包括细菌和酵母在内的单细胞生物的基因组。
“宏基因组”(Metagenome)(也称微生物环境基因组Microbial EnvironmentalGenome,或元基因组)是指环境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因,主要指环境样品中的细菌和真菌的基因组总和。
在本发明中,术语“大片段DNA”是指长度在10kb以上的DNA分子,例如,长度在20kb以上、30kb以上、40kb以上、50kb以上、60kb以上、70kb以上、80kb以上、90kb以上、100kb以上、105kb以上、110kb以上、115kb以上、120kb以上、125kb以上、130kb以上、135kb以上、或甚至140kb以上的DNA分子。
在本发明中,“高GC含量”是指核酸分子中的G+C含量高于60%,例如,65%以上,包括65%以上、70%以上、75%以上或80%以上。
本发明中,术语“载体”是指能够进行与外源片段的组装或能够插入外源片段的载体,通常含有复制起点和对于在宿主细胞中复制和/或维持所必需的其它实体的核酸序列。
所述载体可为环状质粒或线状载体,例如但不限于宿主特异性质粒、穿梭质粒、粘粒、细菌人工染色体(BAC)或酵母人工染色体(YAC)。所述载体也可为克隆载体或表达载体。作为宿主特异性质粒,载体可为仅能在大肠杆菌(Escherichia coli)、链霉菌(Streptomyces)、枯草芽孢杆菌(Bacillus subtilis)、谷氨酸棒状杆菌(Corynebacteriumglutamicum)、真菌(fungi)(例如,酿酒酵母(Saccharomyces cerevisiae)、裂殖酵母(S.pombe)、毕赤酵母(Pichia membranaefaciens))、哺乳动物细胞(mammalian cells)中复制的质粒。或者,载体可为穿梭质粒,例如大肠杆菌-酿酒酵母穿梭质粒、大肠杆菌-链霉菌穿梭质粒、大肠杆菌-枯草芽孢杆菌穿梭质粒、大肠杆菌-谷氨酸棒状杆菌穿梭质粒、细菌-哺乳动物细胞穿梭质粒、细菌-植物细胞穿梭质粒、大肠杆菌-丝状真菌穿梭质粒、大肠杆菌-链霉菌-酿酒酵母穿梭质粒、大肠杆菌-丝状真菌-酿酒酵母穿梭质粒、大肠杆菌-枯草芽孢杆菌-酿酒酵母穿梭质粒、大肠杆菌-谷氨酸棒状杆菌-酿酒酵母穿梭质粒、细菌-哺乳动物-酿酒酵母细胞穿梭质粒或细菌-植物细胞-酿酒酵母穿梭质粒。所述丝状真菌例如但不限于黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、黄曲霉(Aspergillusflavus)。或者,细菌人工染色体(BAC)或酵母人工染色体(YAC)。在本发明的实施方式中,所述载体可为本领域已知的载体。在优选的实施方式中,所述载体能够容纳大片段DNA,例如pCC2FOS(来自EpicentreBio)或pBAC2015(Wang H等,Nature Protocols,2016,11(7):1175-1190.)。
也可使用本领域技术人员已知的提供等同功能的其它形式的表达载体,例如自我复制的染色体外载体或整合入宿主基因组中的载体。
为本发明的目的,通过在比较窗口中比较两个比对的序列来计算“同一性”或“同源性”。序列的比对使得能够确定比较窗口中两个序列共有的位置(核苷酸或氨基酸)的数目。然后,将共有位置的数目除以比较窗口中的总位置数并乘以100,以获得同源性百分比。序列同一性百分比的确定可手动完成或者使用公知的计算机程序完成。
本文所使用的术语“互补”涉及核苷酸碱基G、A、T、C和U之间的氢键碱基配对形成偏好的等级制度(hierarchy),以使得当两种给定的多核苷酸或多核苷酸序列彼此退火时,在DNA中A与T配对、G与C配对,在RNA中G与C配对、A与U配对。本文所使用的“基本上互补”指核酸分子或其部分(例如,引物)在所述分子或其部分的全长内与第二核苷酸序列具有至少90%的互补性,例如,90%互补、95%互补、98%互补、99%互补或100%互补。
本文所使用的术语“可操作地连接”是指相对于该启动子调节的核酸序列(以控制该序列的转录起始和/或表达),启动子处于正确的功能定位和/或取向。
如本文中所用的术语“分离的(isolated)”就核酸或多肽而言是指与至少一种其它组分(例如,核酸或多肽)相分离的核酸或多肽,所述其它组分在其天然来源中与所述核酸或多肽一起存在,和/或当被细胞表达或就分泌多肽而言被细胞分泌时,所述组分将与所述核酸或多肽一起存在。化学合成的核酸或多肽或者使用体外转录/翻译合成的核酸或多肽被认为是“分离的”。
在本发明中,术语“左同源臂”和“上游同源臂”可互换使用;术语“右同源臂”和“下游同源臂”可互换使用。
不希望受到任何理论约束,本发明的大片段DNA克隆方法基于Cas12a/crRNA所产生的粘性末端之间的互补结合,使得能够提高大片段DNA克隆的效率(即,克隆所需时间短,而且阳性率高),同时确保了目标DNA片段的完整性。更令人预料不到的是,对于GC含量高(>60%)的序列,本发明的方法显示出类似的高效率的克隆。
在一个方面,本发明提供了基于CRISPR/Cas12a系统的体外大片段DNA克隆方法,所述方法包括:
(1)捕获载体的构建以及切割:制备目标DNA片段的两端的同源臂,并将所述同源臂连接到载体中,从而得到所述捕获载体,其中,所述同源臂包含至少一个能够被Cas12a或其生物活性功能片段或变体识别的PAM位点;基于至少部分地互补结合至所述同源臂的crRNA,使用所述Cas12a或其生物活性功能片段或变体,对所述捕获载体进行切割,从而得到经切割的捕获载体;
(2)目标DNA片段的制备:基于所述crRNA并使用所述Cas12a或其生物活性功能片段或变体,对包含目标DNA片段的样品进行切割,得到所述目标DNA片段;以及
(3)连接以及转化:将所述经切割的捕获载体与所述目标DNA片段进行连接,并转入/导入宿主细胞中,得到具有所述目标DNA片段的重组宿主细胞。
在一些实施方式中,所述同源臂距离所述目标DNA片段的5’末端或3’末端至少100bp,优选至少200bp、更优选至少500bp、进一步优选至少1kb、更优选至少1.2kb、更优选至少1.5kb。也就是说,以上游同源臂为例,其3’末端距离所述目标DNA片段的3’末端至少100bp,优选至少200bp、更优选至少500bp、进一步优选至少1kb、更优选至少1.2kb、更优选至少1.5kb。
同源臂的选取可非限制性地考虑,选择PAM位点(TTTN)丰富的序列,为crRNA提供更多选择余地。
在优选的实施方式中,所述同源臂的长度为100bp以上。例如,所述同源臂的长度为200bp以上、300bp以上、400bp以上、500bp以上、600bp以上、700bp以上、800bp以上、900bp以上、1000bp以上、1100bp以上、1200bp以上、1300bp以上、1400bp以上、或1500bp以上。在优选地实施方式中,所述同源臂的长度为800bp-1500bp,优选800bp-1200bp,更优选900bp-1200bp。
在一些实施方式中,所述同源臂包含1个、2个、3个、4个、5个或更多个能够被Cas12a或其生物活性功能片段或变体识别的PAM位点。优选,所述同源臂包含2个或3个能够被Cas12a或其生物活性功能片段或变体识别的PAM位点。
在本发明中,所述目标DNA片段的两端的同源臂可位于所述目标DNA片段之内、所述目标DNA片段之外或者包含所述目标DNA片段的5’末端或3’末端。
优选地,所述目标DNA片段的两端的同源臂位于所述目标DNA片段之外。
在本发明,所述同源臂的目的之一是用于形成能够与临近所述目标DNA片段的5’和3’端的粘性末端互补结合的粘性末端,因此,所述同源臂只要包含临近所述目标DNA片段的5’和3’端的序列中Cas12a酶切割所需的序列即可,其中,包括与所述crRNA至少部分互补(例如70%以上)结合的序列、PAM序列、和Cas12a酶切割的序列,以及它们之间的序列。需要注意的是,当临近所述目标DNA片段的5’和/或3’端的粘性末端位于所述目标DNA片段之内时,所述相对应的5’和/或3’端的同源臂除了旨在产生互补的粘性末端外还包含所述目标DNA片段的末端序列,以使所获的目标DNA片段完整。
用于连接所述同源臂的载体可基于具体所克隆的DNA片段的长度、所使用的宿主细胞、以及后续的操作(是否进行表达等)等因素进行决定。在本发明中,用于制备捕获载体的载体为环状质粒或线状载体。例如,所述捕获载体选自质粒、粘粒、细菌人工染色体(BAC)或酵母人工染色体(YAC)。在一些实施方式中,可选择BAC载体,或者其变体,例如pBAC2015载体。当需要在不同宿主细胞之间进行操作和/或表达时,可选择特异性的穿梭载体。
可通过本领域已知的技术(例如同源重组或酶切连接,例如Gibson连接)将所述同源臂连接到所述载体中。
根据Cas(CRISPR-associated proteins,CRISPR相关蛋白)基因的组成和效应蛋白组成的亚基数,CRISPR/Cas系统划分为两大类:class 1CRISPR/Cas系统利用多种效应蛋白复合物干扰靶基因;class 2CRISPR/Cas系统利用单一的核酸酶-核酸复合物切割外源核酸,从而抵御外侵,class 2系统简单高效,因而受到广泛关注。2类CRISPR/Cas系统的典型代表包括Cas9、Cas12a(Cpf1)和Cas13等,如今已成功应用于DNA编辑、基因调控及小分子检测等领域。
CRISPR/Cas12a系统具备以下特点:(1)Cas12a识别的PAM序列位于原间隔序列5'端,且富含T,如5'-TTTV(V=A,G或C)。此外Acidaminococcus sp Cas12a(AsCas12a)和Lachnospiraceae bacterium Cas12a(LbCas12a)也可以识别含胞嘧啶的PAM,例如5'-TCTA,5'-TCCA和5'-CCCA。除了TTV之外,Francisella novicida Cas12a(FnCas12a)也可以识别CTV(A/C/G)。经过设计的Cas12a可以识别更多的PAM序列,例如5'-TYCV,5'-TATV。(2)Cas12a能够切割RNA,将pre-crRNA加工产生成熟的crRNA,并使用该RNA切割靶基因,不需要RNase III的参与。(3)Cas12a只需要一个crRNA即可实现对目标基因的切割,不需要tracrRNA。(4)Cas12a切割dsDNA后形成粘性末端,有利于DNA的插入。(5)Cas12a切割位点离识别位点很远,为基因编辑的位置提供了更大的可选空间。
CRISPR/Cas系统中的CRISPR酶可与gRNA相互作用,从而形成gRNA-CRISPR酶复合体,即CRISPR复合体,并且可在gRNA的协作下允许引导序列接近包含PAM序列的靶序列。对于CRISPR/Cas12a,仅需要crRNA引导即可,而不需要tracrRNA。在本发明中,术语“gRNA”、“引导核酸”和/或“crRNA”可互换使用。
此处,第II类CRISPR酶与靶基因或核酸相互作用的能力依赖于PAM序列。PAM序列是存在于靶基因或核酸中的序列,其可被第II类CRISPR酶识别。PAM序列可根据第II类CRISPR酶的来源改变。即,取决于物种,存在能够被特异性识别的不同PAM序列。例如,由Cas12a酶识别的PAM序列还可为5'-TTT/N-3'(N为A、T、C或G)。然而,尽管通常理解根据如上所述的酶的来源来确定PAM,PAM可随着关于所述来源的酶的突变体的研究进展而改变。
Cas12a酶可为由以下衍生而来的Cas12a酶:链球菌(Streptococcus)、弯曲杆菌(Campylobacter)、Nitratifractor、葡萄球菌(Staphylococcus)、Parvibaculum、罗斯氏菌(Roseburia)、奈瑟菌(Neisseria)、葡糖醋杆菌(Gluconacetobacter)、固氮螺菌(Azospirillum)、Sphaerochaeta、乳杆菌(Lactobacillus)、真杆菌(Eubacterium)、棒状杆菌(Corynebacter)、肉食杆菌(Carnobacterium)、红细菌(Rhodobacter)、李斯特菌(Listeria)、Paludibacter、梭菌(Clostridium)、毛螺菌(Lachnospiraceae)、Clostridiaridium、纤毛菌(Leptotrichia)、弗朗西斯氏菌属(Francisella)、军团杆菌(Legionella)、脂环酸芽孢杆菌(Alicyclobacillus)、Methanomethyophilus、卟啉单胞菌(Porphyromonas)、普雷沃菌(Prevotella)、拟杆菌(Bacteroidetes)、创伤球菌(Helcococcus)、钩端螺旋体(Letospira)、脱硫弧菌(Desulfovibrio)、Desulfonatronum、丰佑菌(Opitutaceae)、肿块芽孢杆菌(Tuberibacillus)、芽孢杆菌(Bacillus)、短芽孢杆菌(Brevibacilus)、甲基杆菌(Methylobacterium)或氨基酸球菌(Acidaminococcus)。
在本发明中,Cas12a的生物活性功能片段或变体是指天然存在的Cas12a多肽的生物活性片段、变体或融合蛋白,包含与天然存在的Cas12a具有至少80%、85%并优选至少90%、95%、97%、98%、99%或100%同一性的氨基酸序列。本文所使用的“片段”或“变体”理解为包括表现出如本文所述的“生物活性”的生物活性片段或生物活性变体。即,Cas12a的生物活性片段或变体表现出可以被测量和测试的生物活性。例如,生物活性片段或变体表现出与天然(即野生或正常)Cas12a蛋白相同或基本相同的生物活性,并且此类生物活性可以通过该片段或变体例如在切割目标DNA序列方面进行评价。
此外,除野生型CRISPR酶的原始功能(即,切割双链DNA的功能)外,CRISPR酶的变体可进一步包含任选的功能结构域。此处,CRISPR酶突变体可具有除野生型CRISPR酶的原始功能以外的额外功能。
功能结构域可为具有甲基化酶活性、去甲基化酶活性、组蛋白修饰活性、RNA切割活性或核酸结合活性的结构域,或者为用于分离和纯化蛋白(包括肽)的标签或报告基因,但本发明不限于此。标签包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签;报告基因包括谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、萤光素酶、自发荧光蛋白(包括绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和蓝色荧光蛋白(BFP)),但本发明不限于此。
本文所使用的crRNA是指靶DNA特异性RNA,所述RNA可以与Cas12a蛋白形成复合物并将Cas12a蛋白引导至靶序列。
crRNA可以包含复数个结构域。每个结构域可以具有三维形式或活性形式的gRNA的链内或链间相互作用。在本发明的实施方式中,crRNA包含间隔序列,以及Cas12a蛋白的结合序列,例如,crRNA可由5'-[Cas12蛋白结合序列]-[间隔序列]-3'组成,但是本发明不限于此。在优选的实施方式中,所述结合序列和间隔序列之间还具有接头序列,所述接头序列的长度为1-15bp、优选2-10bp。
Cas12a蛋白的结合序列可为天然存在的物种中含有的Cas12a蛋白的结合序列、可由天然存在的物种中含有的Cas12a蛋白的结合序列衍生而来、或可与天然存在的物种中含有的Cas12a蛋白的结合序列具有部分或完全同源性。Cas12a蛋白的结合序列可为16-32个、18-25个、更优选20-21个、最优选21个碱基的序列,或包含16-32个、18-25个、更优选20-21个、最优选21个个碱基的序列。
Cas12a蛋白的结合序列可与如下菌的Cas12a蛋白的结合序列或由其衍生而来的Cas12a蛋白的结合序列具有部分(即至少50%以上)或完全同源性:俭菌(Parcubacteriabacterium)(GWC2011_GWC2_44_17)、毛螺菌(Lachnospiraceae bacterium)(MC2017)、Butyrivibrio proteoclasiicus、Peregrinibacteria bacterium(GW2011_GWA_33_10)、氨基酸球菌属(Acidaminococcus sp.)(BV3L6)、猕猴卟啉单胞菌(Porphyromonas macacae)、毛螺菌(ND2006)、Porphyromonas crevioricanis、解糖胨普雷沃菌(Prevotelladisiens)、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体(Leptospira inadai)、毛螺菌(MA2020)、新凶手弗朗西斯菌(Francisella novicida)(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌(Eubacterium eligens)。
间隔序列可为与靶序列具有互补性的核酸序列,例如具有至少70%、75%、80%、85%、90%或95%或更高(例如100%)的互补性或完全互补性。间隔序列可为15-50个、优选16-25个、更优选17-19个、最优选18个碱基的序列,或包含15-50个、优选16-25个、更优选17-19个、最优选18个碱基的序列。在优选的实施方式中,间隔序列优选为17-19个、例如17个、18个或19个碱基;在进一步优选的实施方式中,间隔序列优选为18个碱基。
在一个实施方式中,所述间隔序列可与所述靶序列具有0-5个错配的结合。例如,所述间隔序列可与所述靶序列具有0个、1个、2个、3个、4个或5个错配的结合。
此处,所述靶序列可为所述同源臂的PAM序列附近的碱基序列。例如,所述间隔序列能够至少部分地互补结合至所述同源臂中的所述PAM附近的连续的15-50bp、优选16-25bp、更优选17-19bp的靶核酸序列。在具体实施方式中,靶序列可为所述PAM的3'端或5'端的连续的15-50个、优选16-25个、更优选17-19个、最优选18个个碱基的序列。
在本发明的实施方式中,crRNA可通过体外转录或人工化学合成。crRNA的体外转录合成方法为本领域已知。用于crRNA体外逆转录的crRNA引物模板可包含三部分,5’端与目的基因片段反向互补的间隔序列,中间为Cas12a蛋白的结合序列,3’端则是体外转录时T7启动子的结合序列。5’间隔格序列的选取是crRNA设计的关键。可借助crRNA设计软件(例如,CRISPR RGEN Tools)设计该向导序列。
为了更好地实施本发明,可基于同源臂上的PAM选择切割效果优异的crRNA。
在本发明的实施方式中,目标DNA片段的长度可为10kb以上,例如,50kb以上、60kb以上、70kb以上、80kb以上、90kb以上、100kb、110kb以上、120kb以上、130kb以上或甚至140kb以上。在进一步的实施方式中,目标DNA片段的长度可为50kb-140kb。
在本发明的方法中,对于所述目标DNA片段的GC含量并无特别的要求。也就是说,所述目标DNA片段可具有60%以上(甚至70%以上的高GC含量)或60%以上的GC含量。
由于本发明的克隆方法中的切割和连接等操作均在体外进行,因此,本发明的克隆方法所针对的目标DNA片段不拘于其来源,其可为来自原核生物的DNA片段,也可以来源于真核生物的DNA片段。在一些实施方式中,其可为自然状态下存在的DNA片段,也可为非自然状态下存在的DNA片段,例如,人工合成的或者经修饰的DNA片段。
在一些实施方式中,目标DNA片段可包含于样品中。在一些实施方式中,样品可进一步包含蛋白质、细胞、流体、生物流体、保护剂、和/或其它物质。
在一些实施方式中,所述样品为分离的核酸样品。例如,所述分离的核酸样品为分离的DNA样品。
在一些实施方式中,所述样品为基因组和/或宏基因组,或者由基因组和/或宏基因组衍生而来的DNA样品(例如DNA文库,包括BAC文库和YAC文库)。
以非限制性实例的方式,样品可为DNA文库、基因组DNA、宏基因组DNA、或其它人工DNA,或它们的组合。在一些实施方式中,所述样品可为基于噬菌体的文库(例如,λ噬菌体、P1噬菌体和fosmid等)和人工染色体文库(如细菌人工染色体(BAS)文库、酵母人工染色体(YAC)、P1人工染色体(PAC)文库以及哺乳动物人工染色体(MAC)文库等)。在一些实施方式中,所述样品可为基因组文库或cDNA文库。
在一些实施方式中,样品可获得自哺乳动物细胞、病毒、细菌、真菌、酵母、原生动物、微生物、寄生虫等。在一些实施方式,样品可为细菌基因组,例如,放线菌基因组。
在一些实施方式中,样品可新鲜收集。在一些实施方式中,可在将样品用于本文所述的方法和试剂盒中之前,将所述样品储存。在一些实施方式中,样品是未经处理的样品。本文所使用的“未经处理的样品”是指除了稀释于溶液中和/或悬浮于溶液中外,未曾进行任何事先的样品预处理的生物样品。在一些实施方式中,样品可获得自哺乳动物细胞、病毒、细菌、真菌、酵母、原生动物、微生物、寄生虫等,并可在用于本文所述的方法和试剂盒之前对其进行保存或加工。以非限制性实例的方式,可将样品包埋于石蜡中、冷藏或冷冻。可在根据本文所述的方法和试剂盒对核酸进行处理之前,将冷冻的样品解冻。在一些实施方式中,样品可为加工过的或处理过的样品。用于处理或加工样品的示例性方法包括但不限于:离心、过滤、超声、均质化、加热、冷冻和解冻、与保护剂(例如,核酸酶抑制剂)接触,以及上述方法的任意组合。在一些实施方式中,可用化学试剂和/或生物试剂对样品进行处理。可采用化学试剂和/或生物试剂在加工和/或存储期间保护和/或保持样品或样品中所含核酸的稳定性。可替代地或额外地,可采用化学试剂和/或生物试剂使核酸从样品的其它组分中释放出。本领域技术人员熟知用于核酸处理和/或分析的样品加工、保存或处理方法和过程。
在一些实施方式中,可在用于本文所述的方法和试剂盒之前,对样品中存在的核酸进行分离、富集或纯化。从样品中分离、富集或纯化核酸的方法是本领域普通技术人员所公知的。以非限制性实例的方式,用于从各种样品类型中分离基因组DNA的试剂盒是可商购的(例如,目录号51104、51304、56504和56404;Qiagen;Germantown,MD)。
在一些的实施方式中,在根据本发明所述的方法和试剂盒对样品进行操作之前或者进行操作时,可将DNA样品包埋在低熔点琼脂糖中。通过使用低熔点琼脂糖对DNA进行包埋,可以避免对大片段DNA序列的机械剪切。
在优选的实施方式中,细菌基因组DNA通过如下方法分离:将待提取基因组的菌体用低熔点琼脂糖包埋;然后,使用溶菌酶和蛋白酶K对包埋后的菌体进行处理。
在优选的实施方式中,待提取基因组的菌体为新鲜培养的菌体。在优选的实施方式中,当所述细菌为链霉菌时,所述菌体为在30℃有氧培养24h-30h的菌丝体。
在优选的实施方式中,每个包埋块中的菌体量为4~5mg,溶菌酶裂解1~2h,可使蛋白酶K消化时间缩短至2h。
在本发明的实施方式中,所述目标DNA片段的序列信息可为已知,也可为未知。在可选的实施方式中,所述目标DNA两端的序列是已知的,或者可通过与其亲缘关系较近的物种的已知序列信息进行推测。例如,包含目标DNA的DNA样品具有完整的测序信息,或者具有部分的测序信息。
在步骤(1)中,在对所述捕获载体进行切割之前,还包括筛选和分离所述捕获载体的步骤。
为了筛选的目的,可在具有同源臂的捕获载体中引入选择标记中。所述筛选标记非限制性地选自:抗性选择标记、反向筛选基因(例如sacB基因)、lacZ选择系统被报告基因等。抗性标记是熟知的。技术人员能够为不同的宿主/供体组合确定合适的抗性标记。在一些实施方式中,筛选标记位于同源臂之间,或者所述筛选标记可位于载体上。在优选的实施方式中,筛选标记可为lacZ。在一个实施方式中,所述lacZ可位于5’和3’端同源臂之间。
此外,对多数捕获载体的分离可使用本领域公知的技术进行。
在本发明的实施方式中,Cas12a/crRNA酶切体系包含Cas12a蛋白和crRNA以及任选的适当的酶切缓冲液。
本发明所使用的Cas12a酶或其生物活性功能片段或变体可通过商购获得,也可通过本领域已知的蛋白纯化方法制备。对于本发明而言,优选Cas12a酶或其生物活性功能片段或变体具有Cas12a酶的切割双链DNA的功能。优选地,Cas12a可为LbCas12a。
在本发明中,用于Cas12a/crRNA酶切体系的缓冲液具有7.5-8.0的pH值,例如pH7.9。所述缓冲液优选为盐酸盐缓冲液。例如,所述盐酸盐缓冲液为含NaCl和/或Tris-HCl的盐酸盐缓冲液。所述用于Cas12a/crRNA酶切体系的缓冲液可包含Tris酸、钠盐和镁盐。在优选的实施方式中,所述缓冲液包含Tris-HCl、NaCl和MgCl2。在进一步优选的实施方式中,所述缓冲液包含10mM至50mM的Tris-HCl、50mM至100mM的NaCl和10mM的MgCl2。在一些实施方式中,用于Cas12a/crRNA酶切体系的缓冲液进一步包含牛血清蛋白。在一个优选的实施方式中,用于Cas12a/crRNA酶切体系的缓冲液包含100mM的NaCl、50mM的Tris-HCl、10mM的MgCl2和100μg/mL的牛血清白蛋白,其pH值为7.9。
在本发明中,用于Cas12a/crRNA酶切体系的缓冲液可使用可商购的产品,也可根据已知的方案进行配置。在一个优选的实施方式中,用于Cas12a/crRNA酶切体系的缓冲液可为商购的产品,例如,NEBuffer 3.1。
所述Cas12a/crRNA酶切可在35℃-38℃、优选37℃下进行。
其中,待酶切DNA与Cas12a的摩尔比可为1:25以上,例如,1:50以上、1:100以上、1:200以上、1:1000以上、1:2000以上、1:3000以上、1:5000以上、1:10000以上、或者1:20000以上。为了更好的切割效果,当目的片段比较长时,可适当增加Cas12a的量。例如,对于PCR片段或者捕获质粒或者简单样品(例如包含目标DNA片段<10kb的载体),待酶切DNA与Cas12a的摩尔比可为1:25以上,优选1:50、1:100或者1:200。对于基因组类样品或者包含目的片段在10kb以上(例如,20kb以上、50kb以上、60kb以上、70kb以上、80kb以上等)的载体样品时,待酶切DNA与Cas12a的摩尔比可为1:1000以上,例如,1:2000以上、1:5000以上、1:10000以上或者1:20000。
在本发明的实施方式中,根据待酶切DNA的不同,进行40min~180min的酶切。在优选的实施方式中,当对PCR片段或者捕获质粒或者简单样品(例如包含目标DNA片段<10kb的载体)进行切割时,进行40min-120min的酶切。当对样品或者目的片段在10kb以上(例如,20kb以上、50kb以上、60kb以上、70kb以上、80kb以上等)的载体样品进行切割时,进行80min-180min的酶切。
在酶切完成后,可使Cas12a失活。在优选的实施方式中,通过热处理(例如65℃以上)使Cas12a失活。在优选的实施方式中,通过阳离子螯合剂(例如EDTA)使Cas12a失活。
在一个优选的实施方式中,使用Cas12a对捕获载体在37℃进行60min酶切,其中,用于Cas12a/crRNA酶切体系的缓冲液为pH为7.9的盐酸盐缓冲液;所述捕获载体与Cas12a的摩尔比为1:25;酶切完成后,在85℃热处理10min使Cas12a失活。
在一个优选的实施方式中,使用Cas12a对包含目标DNA片段的样品在37℃进行60min酶切,其中,用于Cas12a/crRNA酶切体系的缓冲液为pH为7.9的盐酸盐缓冲液;所述样品与Cas12a的摩尔比为1:200;酶切完成后,在85℃热处理10min使LbCas12a失活。
在一个优选的实施方式中,使用Cas12a对包含目标DNA片段的样品在37℃进行120min酶切,其中,用于Cas12a/crRNA酶切体系的缓冲液为pH为7.9的盐酸盐缓冲液;所述包含目标DNA片段的样品与Cas12a的摩尔比为1:20000;酶切完成后,在85℃热处理10min使LbCas12a失活。
在一个优选的实施方式中,使用Cas12a对基因组在37℃进行120min酶切,其中,所述基因组包埋在低熔点琼脂糖中;用于Cas12a/crRNA酶切体系的缓冲液为pH为7.9的盐酸盐缓冲液;所述J1074基因组与Cas12a的摩尔比为1:20000;酶切完成后,在85℃热处理10min使LbCas12a失活。
在本发明中,切割后的目标DNA片段与切割后的具有同源臂的载体的连接通过连接酶进行,只要是用于粘性末端连接的连接酶均可。在一些实施方式中,所述连接酶选自于T4 DNA连接酶和Taq连接酶。
在优选的实施方式中,目标DNA片段和具有同源臂的载体以1:2-2:1的摩尔比混合进行连接。在进一步优选的实施方式中,目标DNA片段和具有同源臂的载体以2:1~1:1的摩尔比混合以进行连接。对于基因组而言,在不对目标DNA片段进行分离的情况下,估计目标DNA片段和具有同源臂的载体为1:(5-10)的摩尔比。
对于使用低熔点琼脂糖包埋块(其中所述低熔点琼脂糖的量为1wt%-2wt%)的情况,在步骤(3)之前,包括对低熔点琼脂糖包埋块进行消化的步骤。
当所述连接酶为T4 DNA连接酶时,所述连接可在4℃~25℃、优选16℃下进行;所述连接可进行1~12h。
在连接完成后,可通过热处理(例如65℃)使连接酶失活。
本发明中所使用的的宿主细胞可通过商购获得,也可通过本领域已知的方法制备。可以以本领域已知的方案将连接产物转入宿主细胞中,并进行筛选和验证。所述宿主细胞可根据需要选择,例如可为商业化的大肠杆菌、酵母细胞等。
在优选的实施方式中,电转化感受态细胞为大肠杆菌DH10b,其特征在于该菌株敲除了与重组相关的序列基因,有利于维持克隆得到稳定。
筛选获得带有克隆载体的转化子的技术为本领域技术人员已知。对于不带有筛选标记的克隆载体,可采用对一个或多个目的片段进行扩增的单重或多重PCR对转化子进行检测,从而筛选出包含目标DNA片段的克隆载体的转化子。
本发明所提供的一种基于CRISPR/Cas12a系统的体外大片段DNA克隆方法能够高效地实现基因簇的克隆。在本发明中,基因簇及其范围是由antiSMASH等在线工具预测出来的新型基因簇,然后通过本发明的方法将这些基因簇克隆,然后进行异源表达。
在另一方面方面,本发明提供了通过上述方法克隆大片段DNA的试剂盒,所述试剂盒可包含载体、Cas12a或其生物活性变体或者表达所述Cas12a或其生物活性变体的表达载体;以及使用说明书。
在优选的实施方式中,所述试剂盒进一步包含用于分离基因组的试剂、Cas12a核酸酶切缓冲液、crRNA体外转录试剂、宿主细胞、或上述物质的任意组合。
本发明涉及基于CRISPR/Cas12a系统介导的体外大片段DNA克隆方法、试剂盒以及相关用途,其优势在于可以快捷地对高GC含量的大片段DNA进行克隆,其操作简单、不依赖高昂的设备,节约时间和成本,且阳性率高并具有市场应用的潜力。
本文所述各方面的实施方式可由如下编号的段落说明:
[1].一种基于CRISPR/Cas12a系统的体外大片段DNA克隆方法,所述方法包括:
(1)捕获载体的构建以及切割:制备目标DNA片段的两端的同源臂,并将所述同源臂连接到载体中,从而得到所述捕获载体,其中,所述同源臂包含至少一个能够被Cas12a或其生物活性功能片段或变体识别的PAM位点;基于至少部分地互补结合至所述同源臂的crRNA,使用所述Cas12a或其生物活性功能片段或变体,对所述捕获载体进行切割,从而得到经切割的捕获载体;
(2)目标DNA片段的制备:基于所述crRNA并使用所述Cas12a或其生物活性功能片段或变体,对包含目标DNA片段的样品进行切割,得到所述目标DNA片段;以及
(3)连接以及转化:将所述经切割的捕获载体与所述目标DNA片段进行连接,并转入/导入宿主细胞中,得到具有所述目标DNA片段的重组宿主细胞。
[2].根据段落[1]所述的方法,其中,所述样品为分离的核酸样品。
[3].根据段落[2]所述的方法,其中,所述分离的核酸样品为分离的DNA样品。
[4].根据段落[1]-[3]中任一项所述的方法,其中,所述样品为基因组和/或宏基因组,或者由基因组和/或宏基因组衍生而来的DNA样品。
[5].根据段落[4]所述的方法,其中,所述由基因组和/或宏基因组衍生而来的DNA样品为DNA文库,包括BAC文库和YAC文库。
[6].根据段落[1]-[5]中任一项所述的方法,其中,所述目标DNA片段的两端的同源臂位于所述目标DNA片段之内、所述目标DNA片段之外或者包含所述目标DNA片段的5’末端或3’末端。
[7].根据段落[6]所述的方法,其中,所述目标DNA片段的两端的同源臂位于所述目标DNA片段之外。
[8].根据段落[7]所述的方法,其中,所述同源臂距离所述目标DNA片段的5’末端或3’末端至少100bp,优选至少200bp、更优选至少500bp、进一步优选至少1kb、更优选至少1.2kb、更优选至少1.5kb。
[9].根据段落[1]-[7]中任一项所述的方法,其中,所述同源臂的长度为100bp以上。
[10].根据段落[9]的方法,其中,所述同源臂的长度为200bp以上、300bp以上、400bp以上、500bp以上、600bp以上、700bp以上、800bp以上、900bp以上、1000bp以上、1100bp以上、1200bp以上、1300bp以上、1400bp以上、或1500bp以上。
[11].根据段落[9]的方法,其中,所述同源臂的长度为800bp-1500bp,优选800bp-1200bp,更优选900bp-1200bp。
[12].根据段落[1]-[11]中任一项所述的方法,其中,所述同源臂包含1个、2个、3个、4个、5个或更多个能够被Cas12a或其生物活性功能片段或变体识别的PAM位点。
[13].根据段落[1]-[12]中任一项所述的方法,其中,用于制备捕获载体的载体为环状质粒或线状载体。
[14].根据段落[1]-[13]中任一项所述的方法,其中,所述捕获载体选自质粒、粘粒、细菌人工染色体(BAC)或酵母人工染色体(YAC)。
[15].根据段落[1]-[14]中任一项所述的方法,其中,通过同源重组或酶切连接将所述同源臂连接到所述载体中。
[16].根据段落[1]-[15]中任一项所述的方法,其中,在步骤(1)中,在对所述捕获载体进行切割之前,还包括筛选和分离所述捕获载体的步骤。
[17].根据段落[1]-[16]中任一项所述的方法,其中,所述捕获载体包含选择标记。
[18].根据段落[17]所述的方法,其中,所述选择标记为耐药性选择标记、反向筛选基因或lacZ选择系统。
[19].根据段落[17]所述的方法,其中,所述选择标记可操作地连接在所述同源臂之间。
[20].根据段落[1]-[19]中任一项所述的方法,其中,所述crRNA包含间隔序列和结合序列,所述间隔序列能够至少部分地互补结合至所述同源臂,所述结合序列能够结合所述Cas12a或其生物活性功能片段或变体。
[21].根据段落[20]所述的方法,其中,所述间隔序列能够至少部分地互补结合至所述同源臂中的所述PAM附近的连续的15-50bp、优选16-25bp、更优选17-19bp的靶核酸序列。
[22].根据段落[21]所述的方法,其中,所述间隔序列与所述靶核酸序列具有至少70%以上、优选80%以上、更优选90%以上、进一步优选95%以上、最优选100%的互补性。
[23].根据段落[20]-[22]中任一项所述的方法,其中,所述间隔序列的长度为15-50nt、优选16-25nt、更优选17-19nt、最优选18nt。
[24].根据段落[20]所述的方法,其中,所述结合序列的长度为16-32bp、优选18-25bp、更优选20-21bp、最优选21bp。
[25].根据段落[20]-[24]中任一项所述的方法,其中,所述crRNA为5'-[结合序列]-[间隔序列]-3'。
[26].根据段落[20]-[25]中任一项所述的方法,其中,所述结合序列和间隔序列之间还具有接头序列,所述接头序列的长度为1-15bp、优选2-10bp。
[27].根据段落[1]-[26]中任一项所述的方法,其中,在步骤(1)中,所述切割在35℃-38℃、优选37℃的温度下进行40min-120min、优选50min-100min、更优选60min-80min。
[28].根据段落[1]-[27]中任一项所述的方法,其中,在步骤(1)中,所述Cas12a或其生物活性功能片段或变体与所述捕获载体的摩尔比为50:1以上、优选80:1以上、更优选100:1以上、进一步优选150:1以上、还优选200:1以上。
[29].根据段落[1]-[28]中任一项所述的方法,其中,在步骤(1)中,所述Cas12a或其生物活性功能片段或变体与所述crRNA的摩尔比为1:1以上、优选2:1以上、更优选4:1以上、进一步优选8:1以上、还优选10:1以上。
[30].根据段落[1]-[29]中任一项所述的方法,其中,在步骤(1)的切割步骤之前中,还包括对所述crRNA进行筛选的步骤。
[31].根据段落[1]-[29]中任一项所述的方法,其中,在步骤(1)中,还包括对所述Cas12a或其生物活性功能片段或变体进行失活的步骤;和/或对所述切割后的捕获载体进行分离的步骤。
[32].根据段落[31]所述的方法,其中,通过加热至65℃以上、优选75℃以上、更优选85℃以上来使所述Cas12a或其生物活性功能片段或变体失活。
[33].根据段落[32]所述的方法,其中,所述加热进行10min以上。
[34].根据段落[1]-[33]中任一项所述的方法,其中,在步骤(2)中,当所述样品为基因组或者宏基因组时,所述样品以低熔点琼脂糖包埋块的形式提供。
[35].根据段落[34]所述的方法,其中,所述低熔点琼脂糖包埋块的尺寸优选为50-150μL。
[36]根据段落[34]或[35]所述的方法,其中,所述以低熔点琼脂糖包埋块的形式提供的基因组或者宏基因组是通过如下方法提供的细菌基因组或者宏基因组:将待提取基因组的菌体用低熔点琼脂糖包埋为低熔点琼脂糖包埋块;然后,使用溶菌酶和蛋白酶K对包埋后的菌体进行处理。
[37]根据段落[36]所述的方法,其中,所述低熔点琼脂糖包埋块优选包含4mg~5mg所述菌体。
[38]根据段落[36]或[37]所述的方法,其中,所述低熔点琼脂糖包埋块用溶菌酶裂解1~2h。
[39]根据段落[36]或[37]所述的方法,其中,所述低熔点琼脂糖包埋块用蛋白酶K消化2~6h至包埋块完全透明。
[40].根据段落[1]-[39]中任一项所述的方法,其中,在步骤(2)中,所述切割在35℃-38℃、优选37℃的温度下进行80min-180min、优选100min-160min、更优选100min-140min。
[41].根据段落[1]-[40]中任一项所述的方法,其中,在步骤(2)中,所述Cas12a或其生物活性功能片段或变体与所述目标DNA片段的摩尔比为2000以上、优选5000以上、更优选10000以上、进一步优选20000以上。
[42].根据段落[1]-[41]中任一项所述的方法,其中,在步骤(2)中,还包括对所述Cas12a或其生物活性功能片段或变体进行失活的步骤;和/或对所述切割后的目标DNA片段进行分离的步骤。
[43].根据段落[1]-[41]中任一项所述的方法,其中,当所述样品为基因组或者宏基因组时,切割后无需对目标DNA片段进行分离和纯化。
[44].根据段落[1]-[43]中任一项所述的方法,其中,在步骤(1)和步骤(2)中,所述切割在pH7.5-8.0、优选pH7.9的缓冲液中进行。
[45].根据段落[44]所述的方法,其中,所述缓冲液为盐酸盐缓冲液。
[46].根据段落[45]所述的方法,其中,所述缓冲液包含10mM至50mM的Tris-HCl、50mM至100mM的NaCl。
[47].根据段落[44]-[46]中任一项所述的方法,其中,所述缓冲液包含包含100mM的NaCl、50mM的Tris-HCl、10mM的MgCl2和100μg/mL的牛血清白蛋白。
[48].根据段落[1]-[47]中任一项所述的方法,其中,在步骤(3)中,使用T4 DNA连接酶和Taq连接酶进行连接。
[49].根据段落[1]-[48]中任一项所述的方法,其中,在步骤(3)中,所述目标DNA片段与所述捕获载体以2:1~1:10的摩尔比混合以进行连接。
[50].根据段落[1]-[49]中任一项所述的方法,其中,对于使用低熔点琼脂糖包埋块的情况,在步骤(3)之前,包括对低熔点琼脂糖包埋块进行消化的步骤。
[51].根据段落[1]-[50]中任一项所述的方法,其中,在步骤(3)中,对于所述酶为T4 DNA连接酶的情况,所述连接在4℃-25℃、优选16℃的温度下进行1-12h。
[52].根据段落[1]-[51]中任一项所述的方法,其中,在步骤(3)中,通过电转化的方式将连接产物转入所述宿主细胞中。
[53].根据段落[52]所述的方法,其中,在电转化之前,对所述连接产物进行脱盐处理。
[54].根据段落[1]-[53]中任一项所述的方法,其中,所述宿主细胞选自大肠杆菌或酵母。
[55].根据段落[1]-[54]中任一项所述的方法,其中,所述目的DNA片段的长度为10kb以上。
[56].根据段落[55]所述的方法,其中,所述目的DNA片段的长度为50kb以上、60kb以上、70kb以上、80kb以上、90kb以上、100kb、110kb以上、120kb以上、130kb以上或甚至140kb以上。
[57].根据段落[55]所述的方法,其中,所述目的DNA片段的长度为10kb-140kb,优选50kb-140kb,更优选50kb-100kb,进一步优选50kb-90kb。
[58].根据段落[1]-[57]中任一项所述的方法,其中,所述样品为放线菌基因组。
[59].根据段落[58]所述的方法,其中,所述样品为链霉菌基因组。
[60].根据段落[1]-[59]中任一项所述的方法,用于克隆生物合成基因簇。
[61].根据段落[60]所述的方法,其中,所述生物合成基因簇通过antiSMASH进行预测。
[62].一种基于CRISPR/Cas12a系统的体外生物合成基因簇(BGC)克隆方法,所述方法包括:
(1)BGC的预测:通过在线工具预测BGC;
(2)捕获载体的构建以及切割:制备所述BGC的两端的同源臂,并将所述同源臂连接到载体中,从而得到所述捕获载体,其中,所述同源臂包含至少一个能够被Cas12a或其生物活性功能片段或变体识别的PAM位点;基于至少部分地互补结合至所述同源臂的crRNA,使用所述Cas12a或其生物活性功能片段或变体,对所述捕获载体进行切割,从而得到经切割的捕获载体;
(3)BGC的制备:基于所述crRNA并使用所述Cas12a或其生物活性功能片段或变体,对包含所述BGC的样品进行切割,得到所述BGC;以及
(4)连接以及转化:将所述经切割的捕获载体与所述BGC进行连接,并转入/导入宿主细胞中,得到具有所述BGC的重组宿主细胞。
[63].根据段落[62]所述的方法,其中,所述样品为放线菌基因组。
[64].根据段落[63]所述的方法,其中,所述样品为链霉菌基因组。
[65].一种提高CRISPR/Cas12a系统的切割效率的方法,所述方法包括在盐酸盐缓冲液,在35℃-38℃、优选37℃的温度下进行40min-120min、优选50min-100min、更优选60min-80min。
[66].根据段落[65]所述的方法,其中,Cas12a酶与待切割的片段的摩尔比为50:1以上、优选80:1以上、更优选100:1以上、进一步优选150:1以上、还优选200:1以上。
[67].根据段落[65]或[66]所述的方法,其中,所述盐酸盐缓冲液含有钠盐酸盐、镁盐酸盐和/或Tris-HCl。
[68].根据段落[65]-[67]中任一项所述的方法,其中,所述缓冲液的pH为7.5-8.0、优选为7.9。
[69].根据段落[68]所述的试剂盒,其中,所述缓冲液包含10mM至50mM的Tris-HCl、50mM至100mM的NaCl。
[70].根据段落[65]-[69]中任一项所述的试剂盒,其中,所述缓冲液包含100mM的NaCl、50mM的Tris-HCl、10mM的MgCl2和100μg/mL的牛血清白蛋白。
[71].一种用于体外大片段DNA克隆的试剂盒,所述试剂盒包含载体、Cas12a或其其生物活性功能片段或变体或者表达所述Cas12a或其其生物活性功能片段或变体的表达载体;以及使用说明书。
[72].根据段落[71]所述的试剂盒,其中,所述试剂盒还包含用于CRISPR/Cas12a切割的缓冲液,所述缓冲液为盐酸盐缓冲液,pH为7.5-8.0、优选为7.9。
[73].根据段落[72]所述的试剂盒,其中,所述缓冲液包含10mM至50mM的Tris-HCl、50mM至100mM的NaCl。
[74].根据段落[72]-[73]中任一项所述的试剂盒,其中,所述缓冲液包含100mM的NaCl、50mM的Tris-HCl、10mM的MgCl2和100μg/mL的牛血清白蛋白。
实施例
下面结合实施例和附图对本发明做进一步说明,但本发明不受下述实施例限制。本领域技术人员应该理解,对本申请技术特征所作的等同替换,或相应的改进,仍属于本申请的保护范围之内。除特别说明的以外,以下实施例采用的试剂均为市售产品,溶液的配制可以采用本领域常规技术。
在以下实施例中,所用的crRNA通过以下方式制备:
基于所需的crRNA序列,合成作为crRNA转录模板的寡聚核苷酸(5’端具有与目的基因片段反向互补的间隔序列、中间为Cas12a蛋白的集合序列,3’端为体外转录时T7启动子的结合序列),使用Taq DNA聚合酶PCR缓冲液(Thermo Fisher Scientific)退火;使用HiScribeTMT7快速高产RNA合成试剂盒(NEB)进行crRNA的体外转录;使用RNA Clean&ConcentratorTM-5试剂盒(Zymo Research)纯化得到的crRNA,然后使用NanoDrop 2000分光光度计(Thermo Fisher Scientific)进行定量。整个实验过程中均采用无RNase的材料(Axygen Scientific,Union City,CA,美国)。
在以下实施例中,同源臂片段与载体组装为捕获载体通过Ezmax组装进行,载体与片段的摩尔比一般为1:2。
在实施例中涉及到的本发明构建的质粒及其制备方法如下:
BAC质粒pBAC-ZL:以BAC质粒为骨架,大小为137kb,具有大小为128kb的插入序列,所述插入序列存在于DDBJ/EMBL/GenBank,检索号:AEYC00000000。
用于从pBAC-ZL克隆50kb的捕获质粒(pBAC2015-C50),以pBAC2015为骨架,上下游同源臂序列分别通过50kb-BAC-arm-up-F和50kb-BAC-arm-up-R(SEQ ID NO:1-SEQ ID NO:2,上游同源臂50kb-BAC-arm-up的序列为SEQ ID NO:3,990bp)以及BAC-arm-dn-F和BAC-arm-dn-R(SEQ ID NO:4-SEQ ID NO:5,下游同源臂50kb-BAC-arm-dn的序列为SEQ ID NO:6,228bp),在上下游同源臂之间有LacZ选择标记(其核酸序列由SEQ ID NO:7所示,620bp,上下游引物分别为BAC-lacZ-F(SEQ ID NO:8)和BAC-lacZ-R(SEQ ID NO:9))。
用于从pBAC-ZL克隆80kb的捕获质粒(pBAC2015-C80),以pBAC2015为骨架,上下游同源臂序列分别通过80kb-BAC-arm-up-F和80kb-BAC-arm-up-R(SEQ ID NO:10-SEQ IDNO:11,上游同源臂80kb-BAC-arm-up的序列为SEQ ID NO:12,880bp)以及BAC-arm-dn-F和BAC-arm-dn-R(SEQ ID NO:4-SEQ ID NO:5,下游同源臂80kb-BAC-arm-dn的序列为SEQ IDNO:6,228bp),在上下游同源臂之间有LacZ选择标记(其核酸序列由SEQ ID NO:7所示,620bp)。
实施例1.Cas12a切割的优化
1-1.关于Cas12a切割的缓冲液
缓冲液是影响酶切效率的一个重要因素。在其它条件未改变的前提下,不同的缓冲液溶液pH、离子强度等不同,Cas12a切割效率差异显著。
Cas12a蛋白如下制备:在pET28a中过表达LbCas12a蛋白,然后通过快速蛋白液相色谱(FPLC;AKTA Explorer 100,GE Healthcare)纯化,方法如Liang,Mindong等,“ACRISPR-Cas12a-derived biosensing platform for the highly sensitive detectionof diverse small molecules.”Nature communications vol.10,1 3672.14Aug.2019,doi:10.1038/s41467-019-11648-1的记载所述。
用于Cas12a切割的DNA片段通过如下制备:以捕获质粒pBAC2015-C50为模板,以正向引物(50kb-BAC-arm-up-F,SEQ ID No:1)和反向引物(BAC-lacZ-R,SEQ ID NO:9))作为引物进行PCR,获得长度为1610bp的测试片段1(即上游同源臂+lacZ)。
用于测试片段1切割的crRNA(50kb-BAC-up-crRNA,也称为测试片段1-crRNA)的序列如SEQ ID No:13所示。
使用购自New England Biolabs(NEB)的不同缓冲液cutsmart buffer(B7204S)、NEBuffer2.1(B7202S)、NEBuffer3.1(B7203S)以及NEBuffer4(B7004S)。
其中,NEBuffer 2.1和NEBuffer 3.1为盐酸缓冲液,二者区别在于盐离子浓度。中盐缓冲液NEBuffer 2.1(pH 7.9)成分为50mM氯化钠、10mM Tris-盐酸、10mM氯化镁、100μg/mL牛血清白蛋白;高盐缓冲液NEBuffer 3.1(pH 7.9)成分为100mM氯化钠、50mM Tris-盐酸、10mM氯化镁、100μg/mL牛血清白蛋白。NEBuffer 4和CutSmart Buffer均为醋酸缓冲液,NEBuffer 4(pH 7.9)成分为50mM乙酸钾、20mM Tris-乙酸、10mM乙酸镁、1mM二硫苏糖醇,CutSmart Buffer则是NEBuffer 4的升级版,不再含有二硫苏糖醇,并且加入了牛血清白蛋白。
作为酶切缓冲液加入酶切体系,所述酶切体系如下表所示,将各酶切体系在37℃反应1h。
表1
试剂 体系(μL)
1 缓冲液 5
2 Cas12a(10μM) 3.2
3 测试片段1-crRNA(10μM) 3.2
4 测试片段1 1μg
5 H<sub>2</sub>O To 50
通过核酸电泳分析酶切结果,其中,以未进行酶切的1kb测试片段1作为对照,结果如图2所示;其中,Casl2a在盐酸缓冲液NEBuffer 2.1和NEBuffer 3.1中有较高的切割活性,Cas12a在NEBuffer 3.1中的切割效率最佳,目的片段几乎被完全切割。然而在NEBuffer4与CutSmart Buffer中活性较差,胶图中有明显未被切割的目的片段。可见,对于Cas12a切割,其在高盐的盐酸盐缓冲液中具有更好的活性。
1-2.切割时间
同理,酶切体系中反应时间是影响切割效率的重要因素之一。在不改变其它条件的前提下,反应时间越长,Cas12a切割效率越高;但是随着反应时间的继续增加,可能引起Cas12a的非特异性切割。
使用测试片段1;同时使用与1-1相同的Cas12a蛋白和crRNA进行酶切反应,酶切体系如下表所示。所述酶切体系在37℃下分别反应20min、40min、60min以及80min。
表2
试剂 体系(μL)
1 NEBuffer 3.1 5
2 Cas12a(10μM) 3.2
3 测试片段1-crRNA(10μM) 3.2
4 测试片段1 1μg
5 H<sub>2</sub>O To 50
通过核酸电泳分析酶切结果,其中,以未进行酶切的1610bp的测试片段1作为对照,结果如图3所示。图3中结果表明,切割时间低于60分钟时,电泳结果显示有明显未被切割的目的PCR片段。切割时间延长至60分钟和80分钟时,Casl2a几乎完全切割目标PCR片段,且在60分钟和80分钟时的切割效率无明显差异。然而,酶解时间和酶解效率并非成正比,由于Casl2a存在非特异性切割及反式切割活性,反应时间过长目标片段也会出现降解。在另一实验中,对上述目标片段进行过夜酶切(大于12小时),电泳结果呈弥散状,无目标条带。
1-3.关于PCR片段和捕获质粒与Cas12a酶的摩尔比
进一步分析DNA模板和Cas12a酶摩尔比对切割效率的影响。
(1)测试片段1作为酶切模板
使用与1-1相同的测试片段1以及crRNA进行酶切反应,酶切体系如表2所示。其中,测试片段1与Cas12a蛋白摩尔比为1:12.5、1:25、1:50、1:100以及1:200。将各酶切体系在37℃进行60min。
切割结果如图4A,Control为模板PCR片段,模板-蛋白摩尔比在1:25-1:100时切割效果没有显著差异,模板DNA几乎被切割完全。当模板-蛋白摩尔比为1:12.5时,即Casl2a和crRNA添加量较少时,有大量模板DNA未被切割。
为了进一步优化切割体系中捕获质粒-蛋白的用量,使用与1-1相同的Cas12a蛋白,以及用于上游同源臂的crRNA(50kb-BAC-up-crRNA,SEQ ID No:13)和下游同源臂的crRNA(BAC-dn-crRNA,SEQ ID No:14),以捕捉质粒pBAC2015-C50为模板继续进行切割实验。分别选取模板-蛋白比例为1:25、1:50、1:100、1:200的4组体系进行切割效率的比较。反应体系见下表3。结果表明,当模板-蛋白摩尔比为1:25时,几乎没有双酶切产物,但相比于对照质粒(未切割),其超螺旋条带变暗,开环质粒条带变亮。上述现象说明,Cas12a用量过小,只有部分质粒模板被Casl2a单酶切,大量模板DNA未被切割,几乎没有质粒模板得到充分切割。模板-蛋白摩尔比在1:100时切割效率较好,无超螺旋质粒条带,但仍有较暗的单酶切质粒条带。当模板-蛋白摩尔比为1:200时,无超螺旋质粒条带和单酶切质粒,模板DNA几乎被完全切割,为了避免载体线性化不完全对后续T4连接实验的影响,最终将捕捉质粒:Casl2a/crRNA确定为1:200。
对于PCR片段或捕获质粒的Cas12a切割体系可采用下表3进行。
表3 PCR片段和捕获质粒的Cas12a切割体系
Figure BDA0002551303180000161
实施例2根据本发明的方法(也称为CAT-FISHING)的克隆效率评估
CAT-FISHING的原理是通过DNA连接酶对两个线性DNA片段的粘性末端进行连接。然而,与传统基于限制性核酸内切酶的DNA组装方法不同,这里的粘性末端由成对的crRNA引导的CRISPR/Cas12a切割产生。因此,本研究首先通过AmpR(氨苄霉素抗性基因)小片段捕捉实验,比较了应用商业化的NEB限制性内切酶和CRSIPR/Cas12a酶解产生的两种不同粘性末端在克隆组装中的效率,具体流程如图5。该步骤验证了CAT-FISHING基因操纵平台的可行性,同时完成了CAT-FISHING克隆效率的评估。
使用pGY2020(具有Chl抗性基因的pCC2-FOS质粒(购自EpicentreBio))以及pUC19质粒(购自NEB)。具体操作参见图5。其中所使用的crRNA为50kb-BAC-up-crRNA以及BAC-dn-crRNA。如图6A所示,通过pCC2-FOS质粒骨架组装的捕捉质粒pGY2020包含两个PAM位点(PAM1和PAM2)以及两个NEB限制性内切酶位点(EcoR I和Hind III)。我们分别利用CRISPR/Cas12a及NEB限制性内切酶对捕捉质粒和目的片段AmpR进行酶解,从琼脂糖凝胶电泳结果来看,两者对载体和目的片段的切割效果无明显差异。紧接着通过T4 DNA连接酶将目的片段克隆到捕捉质粒pGY2020中,转移全部连接产物与大肠杆菌感受态细胞混合,热激转化获得转化子。本实验设置了三组平行,分别对6个转化子平板计数,各挑取10个转化子摇菌并进行PCR验证。由18nt crRNA介导的Cas12a通常切割非互补链的14位,产生长度为8nt的粘性末端,但有时切点位置也会有摆动,造成连接处碱基缺失。为了进一步验证CAT-FISHING方法获得的克隆连接处是否完整,我们随机选择三个PCR阳性克隆进行基因测序。具体数据如表5。
表5 PCR片段捕捉结果
Figure BDA0002551303180000171
这两种克隆方法之间通过PCR结果获得的阳性率没有显著差异(表5、图7)。从测序结果来看,三个送测序样本连接处无碱基缺失及突变(图6D)。这些结果表明,CAT-FISHING能够以与商业化的NEB限制性内切酶相当的高的效率克隆目标DNA片段。
实施例3. 50kb和80kb DNA序列克隆以及酶切图谱分析
根据我们先前的研究,实验所用的crRNA是由DNA引物经体外转录制备的。crRNA引物模板由三部分组成,5’端18bp与目的基因片段反向互补的间隔序列,中间21bp为Cas12a蛋白的结合序列,3’端则是体外转录时T7启动子的结合序列。5’端引导序列的选取是crRNA设计的关键。我们借助crRNA设计软件CRISPR RGEN Tools设计该向导序列。从每个目的基因簇的上、下游同源臂中分别选取评分较高的crRNA,进行酶切实验,筛选最优crRNA。
图8是三条50kb-BAC-up-crRNA的优化结果。该实验比较在三对不同crRNA的介导下,Cas12a对50kb-BAC上游同源臂的双酶切效果,以捕获质粒pBAC2015-C50为模板。为了使结果更具说服力,设置了4组不同的Cas12a/crRNA:DNA的摩尔比。实验使用了相同的下游crRNA(BAC-dn-crRNA,序列为SEQ ID NO:14)。图中Control为50kb-BAC上游同源臂-lacZ-下游同源臂的PCR样品。结果显示,使用第三对crRNA时有较好的切割效果,两条目的条带清晰,模板残余量较少;使用第一对crRNA时DNA模板被Cas12a切割成数条大小不同的片段,说明在第一条上游crRNA特异性较差。第二对crRNA虽无非特异性,但在使用相同模板-蛋白摩尔比时,与第一对crRNA介导的切割效果相比,效率明显低,只有一条清晰可见的目的条带,大部分模板未得到充分切割。所以选取第三对crRNA应用于后续实验(50kb-BAC-up-crRNA和BAC-dn-crRNA)。
上述结果表明,crRNA对Cas12a切割效率有不可忽视的影响。所以,优化crRNA是CAT-FISHING技术中必不可少的步骤。通过该crRNA优化策略,我们最终筛选出7条相关的序列应用于后续实验,具体信息如表6。
表6 crRNA相关数据
Figure BDA0002551303180000172
为了进一步验证CAT-FISHING方法的可行性,我们将从137kb BAC质粒pBAC-ZL中进行高GC的大片段基因簇捕捉,以此来评估该方法在大型DNA片段上的克隆性能。如图9A所示,实验克隆了来自pBAC-ZL质粒上的两组目的基因片段,序列长度及GC含量分别为50kb(65%)、80kb(66%)。它们具有相同的终点,即下游crRNA相同,捕捉质粒pBAC2015-C50和pBAC2015-C80的下游同源臂也相同。
首先,实验中使用了BAC质粒专用试剂盒来制备高纯度的pBAC-ZL模板。并使用上述筛选的crRNA,对137kb BAC质粒的体外切割体时间及Casl2a/crRNA/DNA摩尔比进行进一步优化。最终将体外切割体时间和模板-蛋白摩尔比分别确定为120min和1:2000。切割体系见表7。在该切割条件下,经CRISPR/Cas12a消化的pBAC-ZL质粒,进行脉冲场凝胶电泳(PFGE)后可观察到明显的目的条带。如图9B,在50kb-BAC-up/dn-crRNA引导下pBAC-ZL被Cas12a切割成87kb和49kb两个片段。80kb-BAC-up/dn-crRNA介导的Cas12a将pBAC-ZL切割为57kb和79kb两个片段。捕获质粒的切割同实施例1。
将上述捕获质粒pBAC2015-C50或pBAC2015-C80和目的片段的酶切产物进行醇沉回收。
利用T4 DNA连接酶连接线性化捕捉载体和目的片段。与上文中PCR小片段捕捉不同,为了提高转化效率,大片段克隆采用电转化的方式导入受体细胞,由于电转化样品不能含有过多盐离子,所以反应结束后要将连接产物转移至脱盐胶中,进行脱盐处理,随后将全部的脱盐产物导入到DH10b中。
利用菌液PCR、酶切验证等方法筛选转化子,并统计阳性率。
表7 137kb BAC质粒的Cas12a切割体系
Figure BDA0002551303180000181
其中,可以使用CHEF-DR III仪(Bio-Rad,Richmond,CA)通过脉冲场凝胶电泳(PFGE)分析较大的DNA片段。电泳条件为在0.5×TBE缓冲液中,以0.5V琼脂糖在6V/cm的PFGE中进行1~25秒的切换脉冲时间,持续16~18h。
利用T4 DNA连接酶连接的体系如下:
Figure BDA0002551303180000182
脱盐:将连接样品转移至0.1M葡萄糖/1%琼脂糖凝胶中,在冰上脱盐1~2h后,该样品可用于电转化。
电转化:使用Bio-Rad GenePulser XcellTM系统在2mm电转杯中进行的(电穿孔条件:2500V,200Ω和25μF)。然后,向电转杯中的大肠杆菌细胞中加入1mL SOC培养基(色氨酸20g/L,酵母提取物5g/L,NaCl 0.5g/L,KCl 2.5mM,MgCl2 10mM,葡萄糖20mM),随后将混合物转移至15mL FalcomTM管中。在37℃下以200rpm振摇1小时后,收集菌株并将其涂布在选择性(含有氯霉素抗性及X·gal)LB琼脂平板上。将平板在37℃下孵育过夜,然后筛选转化体并使用如下的引物通过PCR进行验证。
通过优化后的CAT-FISHING技术,已经从pBAC-ZL质粒中成功克隆出50kb(GC65%)和80kb(GC 66%)两个目标DNA片段,如图10和图11所示。该实验设置了三组平行,分别对6个转化子平板计数,各挑取12个转化子通过三对引物(50kb 50-BAC-scr-up-F(SEQID No:16)和50-BAC-scr-up-R(SEQ ID No:17);50-BAC-scr-mid-F(SEQ ID No:18)和50-BAC-scr-mid-R(SEQ ID No:19);BAC-scr-down-F(SEQ ID No:20)和BAC-scr-down-R(SEQID No:21);80-BAC-scr-up-F(SEQ ID No:22)和80-BAC-scr-up-R(SEQ ID No:23);80-BAC-scr-mid-F(SEQ ID No:24)和80-BAC-scr-mid-R(SEQ ID No:25);BAC-scr-down-F(SEQ ID No:26)和BAC-scr-down-R(SEQ ID No:27))进行PCR验证。验证引物分别设计在目的片段的上游、中游和下游。具体数据如表8、图13。从而分别获得包含50kb和80kb片段的克隆载体pBAC2015-50kb-BAC和pBAC2015-80kb-BAC。
为排除重组质粒中目的片段不完整的情况,我们从PCR验证出的阳性克隆中分别转接2个转化子进行摇菌,提质粒,并酶切验证。50kb重组质粒用XcmI和KpnI&XbaI两组限制性内切酶进行验证。80kb重组质粒用SalI和SmlI进行酶切验证。结果如图12。关于克隆载体pBAC2015-50kb-BAC,XcmI酶谱有9条带,XbaI和KpnI酶谱有6条带,实际酶切结果与模拟图一致。关于pBAC2015-80kb-BAC,SalI和SmlI酶谱分别有40条或26条条带,大部分条带重叠在一起,酶切图谱中的主要条带(比较清晰)与模拟结果一致。
表8 50kb和80kb目标片段的克隆数和阳性率
Figure BDA0002551303180000191
综上,CAT-FISHING技术对于50kb的DNA片段的克隆,在几十到上百个转化子中,阳性率约为95%。对于80kb的DNA片段的捕捉效率则大幅下降,其转化子数量和阳性率都较50kb的低(图13)。但是,在几十个转化子中,仍有大约50%的转化子的PCR验证结果是正确的。以上结果表明,CAT-FISHING技术可以实现从137kb的pBAC-ZL质粒中高效克隆50kb和80kb的大片段基因簇。需要注意的是,对于80kb的DNA片段,克隆难度明显增大。
实施例4.生物合成基因簇克隆
4-1操作条件的优化
细菌基因组大小及序列复杂性远大于BAC的质粒,本实验中所用供体菌S.albusJ1074的基因组(GenBank Assembly:GCA_000359525.1)大小为6.8Mb,GC含量高达73%。从BAC质粒中抓簇时,模板137kb BAC是通过试剂盒提取的高纯度DNA,然而,基因组模板则是通过DNA包埋的方式制备,其纯度远低于BAC质粒模板。综合上述两个因素,我们对体外酶切条件和基因组包埋方法进行了优化。
参考137kb BAC质粒的切割条件,我们对基因组包埋块的酶切体时间及模板-蛋白的摩尔比进行了优化。切割结果显示,基因组-蛋白摩尔比为1:20000,切割2h后,目标条带可见,但仍有大量弥散。
接下来我们对基因组包埋条件进行了改进。为收集更优质的菌体,摇菌时使用含0.5%甘氨酸的TSB液体培养基,且S.albus J1074的摇菌时间不超过30h。控制每个包埋块的菌体量为4~5mg,溶菌酶裂解1~2h,蛋白酶K消化时间由12h缩短至2h(包埋块完全透明即可)。整个基因组包埋流程只需4~5h可完成。尽量使用新鲜的包埋块开展实验。具体基因组切割体系如表9。
链霉菌基因组包埋具体步骤如下:
向25mL TSB液体培养基(含0.5%甘氨酸)中加入25μL冻存孢子液,8层纱布封口。在30℃摇床中以220rpm的转速培养24h~30h,收集菌丝体。(摇瓶中要加入弹簧,避免结球影响裂解。)收集菌体:将培养好的菌液转移至称好重量的离心管中,6000rpm离心10min,弃上清,再次称重,得到菌体湿重;清洗菌体:加入10mL 0.3M蔗糖溶液,吹吸混匀,6000rpm离心5min,弃上清,重复此步骤2~3次;用TE25S缓冲液重悬到合适浓度(OD=1.8,1g/mL,2g/mL);取适量重悬液(100~200μL)离心收集菌体,控制菌体湿重在50mg左右;往菌悬液中加入450μL TE25S缓冲液重悬细胞,再加入500μL 1.5%低熔点琼脂糖,吹吸混匀;制备包埋块:将步骤(5)制备的菌液转移至模具中,每孔约100μL,4℃冷却30min;菌体裂解:取出包埋块置于TE缓冲液中,加入溶菌酶,使终浓度为2mg/mL,37℃温浴2h;释放核酸:弃去溶液,将胶块转入含有2mg/mL蛋白酶K的NDS溶液中,50℃处理2~6h,包埋块完全透明时即可停止反应;失活蛋白酶K:弃去溶液,在含有0.1mM PMSF的TE缓冲液中室温浸泡胶块1h;弃去溶液,再用TE缓冲液室温洗涤胶块3次,每次1h;弃去溶液,将胶块置于75%的乙醇溶液中,-20℃可长期保存。
表9基因组Cas12a切割体系
Figure BDA0002551303180000201
4-2从链霉菌J1074基因组中克隆大片段
接下来尝试从链霉菌J1074基因组克隆49kb的paulomycin基因簇(GC含量71%)、87kb的surugamides基因簇(GC含量76%)以及139kb的杀念珠菌素(candicidin)基因簇(GC含量75%)。
使用50kb-up-crRNA(SEQ ID No:28)和50kb-dn-crRNA(SEQ ID No:29)作为用于49kb片段的crRNA、80-up-crRNA(SEQ ID No:30)和80kb-dn-crRNA(SEQ ID No:31)作为用于87kb片段的crRNA,使用140-up-crRNA(SEQ ID No:32)和140kb-dn-crRNA(SEQ ID No:33)作为用于139kb片段的crRNA。
捕获载体以pBAC2015为基础,以及由用于49kb片段的引物(50kb-up-hom-arm-F(SEQ ID No:34)和50kb-up-hom-arm-R(SEQ ID No:35)以及50kb-dn-hom-arm-F(SEQ IDNo:36)和50kb-dn-hom-arm-R(SEQ ID No:37),上游同源臂49kb-up-hom-arm(SEQ ID No:38)和下游同源臂49kb-dn-hom-arm(SEQ ID No:39)分别为727bp和611bp)和用于87kb片段的引物((80kb-up-hom-arm-F(SEQ ID No:40)和80kb-up-hom-arm-R(SEQ ID No:41)以及80kb-dn-hom-arm-F(SEQ ID No:42)和80kb-dn-hom-arm-R(SEQ ID No:43),上游同源臂80kb-up-hom-arm(SEQ ID No:44)和下游同源臂80kb-dn-hom-arm(SEQ ID No:45)分别为984bp和870bp))获得的同源臂构建捕获载体pBAC2015-CS49和pBAC2015-CS87,其中,LacZ为选择标记,位于两个同源臂之间。通过与实施例1相同的参数对捕获载体pBAC2015-CS49和pBAC2015-CS87进行酶切以线性化。
如图14所示,利用CAT-FISHING技术进行基因簇克隆,从基因组分离到转化子筛选,整个流程只需2~3天。第一步,包埋块的制备,该步骤耗时4~5h。按照优化好的方法制备基因组包埋块,将准备用于切割的包埋块,用超纯水清洗两遍后,在100μL 1×NEBuffer3.1中浸泡30min。剩余的包埋块置于75℃乙醇中,-20℃冷冻保存。第二步,基因组的酶解,该步骤耗时2h。根据优化好的切割条件,利用相应的crRNA介导CRISPR/Cas12a对包埋块及捕捉质粒进行特异性切割。消化后的基因组包埋块,进行PFGE后可观察到目的条带。其中50kb-up/dn-crRNA介导的Cas12a切割包埋块后,产生49kb目的条带,80kb-up/dn-crRNA介导的Cas12a切割包埋块后,产生87kb目的条带。第三步,琼脂糖酶消化切割产物,耗时30min。将步骤二中酶切处理后的基因组包埋块转移至适量琼脂糖酶溶液中,42℃消化30min,使包埋块完全溶解,得到目的基因簇混合液。第四步,连接反应,耗时3~4h。目的基因簇混合液无需进行分离纯化等步骤,可直接用于酶连实验。取纯化后的线性化捕捉质粒和目的基因簇各500ng,。使用T4 DNA连接酶进行连接,连接体系30μL,反应1~2h。第五步,连接产物脱盐,耗时2h。将连接产物全部转移至配置好的脱盐胶中,4℃静置2h。第六步,电转化,耗时2h。将全部的脱盐产物(大概30μL),转移至170μL高浓度的大肠杆菌DH10b电转感受态中,冰上静置10min,转移至2mm电转杯中,按电压2500V、电容25μF、电阻200Ω的条件进行电转,迅速加入500μL SOC培养基,37℃孵育1h,将700μL菌液全部转移至含有X·gal和氯霉素抗性的LB平板,涂布均匀,于超净台吹干,37℃培养16~20h即可看到单克隆。电转所用感受态效率均在0.8~1×108cfu/μL。从而获得分别包含49kb的paulomycin基因簇、87kb的surugamides基因簇以及139kb的杀念珠菌素基因簇的克隆载体pBAC2015-49kb-J1074、pBAC2015-87kb-J1074和pBAC2015-139kb-J1074。
接下来是转化子验证和克隆效率的统计,耗时1~2天。首先对单克隆进行菌液PCR初筛,本实验,用于验证每个目标基因簇重组子的菌液PCR引物分别有三对,即50/80/140-scr-up-F/R、50/80/140-scr-middle-F/R)和50/80/140-scr-dn-F/R,见下表10。他们的扩增产物分别为位于目的基因簇上游、中游和下游。我们从三组不同大小基因簇的几百个转化子中分别挑取90~100个单克隆进行菌液PCR,结果显示,49kb的Paulomycin基因簇,87kb的Surugamides基因簇以及139kb的Candicidin基因簇均捕捉成功。
表10
Primer Sequence(5’-3’) 编号
140-scr-up-F AAGATGTCCAAGCGTGC SEQ ID No:46
140-scr-up-R AGCCGGCCTACCAGCTG SEQ ID No:47
140-scr-middle-F CCACCACGGACGACGAGA SEQ ID No:48
140-scr-middle-R AACTCGGTGAAGAGTTC SEQ ID No:49
140-scr-down-F TGGTCACCTTCCGGTCTTC SEQ ID No:50
140-scr-down-R AAAGGCCGGCCCATGAC SEQ ID No:51
80-scr-up-F GCAGCGAACTGCCTGGT SEQ ID No:52
80-scr-up-R CCGATGAGGTCGTTCAC SEQ ID No:53
80-scr-middle-F ATGCCCGTCAACTGCTCCTG SEQ ID No:54
80-scr-middle-R TGATTTCCCGACCGTTT SEQ ID No:55
80-scr-down-F GCCGGTTCAGGCGCGCT SEQ ID No:56
80-scr-down-R AGAAGGGCAAGTTGTGC SEQ ID No:57
50-scr-up-F TCCATTCCGTGCCATGCG SEQ ID No:58
50-scr-up-R GCGACGAGAGAGGATGTG SEQ ID No:59
50-scr-middle-F ACAAGGCTCCTGACAGG SEQ ID No:60
50-scr-middle-R GAGGTGGTGCACCTGG SEQ ID No:61
50-scr-down-F GTGTATCGCGCCGCTG SEQ ID No:62
50-scr-down-R CTATGCTCCAGACATC SEQ ID No:63
为了进一步验证重组克隆的完整性,我们PCR验证出的阳性克隆中各挑取5个转接并提质粒,进行酶切验证。利用SnapGene软件选取合适的限制性内切酶。Paulomycin基因簇重组质粒经Xho I酶切后,5个克隆的电泳条带都与预期一样(图15A)。Surugamides基因簇重组质粒的SmL I酶切验证结果也显示,5个克隆都正确(图15B)。然而,Candicidin基因簇的酶切数据则显示克隆不完整。具体数据已在表11中详细列出。
表11从基因组DNA中靶向克隆高GC基因簇的克隆效率。
Figure BDA0002551303180000211
Figure BDA0002551303180000221
*(可供选择的其他方案)使用商用电转感受态细胞ElectroMAXTM DH10BTM cell(Thermo Fisher Scientific,InvitrogenTM)可增加转化子的数量。
Surugamides基因簇在无簇底盘菌中的异源表达及产物分析
为了彻底检查CAT-FISHING捕获的这些BGC的序列和功能完整性,并证明通过该方法获得的基因组挖掘产物,能够用于新颖BSM的挖掘,我们将87kb Surugamides基因簇的克隆产物在无本底表达产物的链霉菌底盘菌株中进行表达。首先以pSET152(Gao Q等,2017)为模板扩增抗性基因-链霉菌复制子-整合酶-整合位点,即aac(3)IV-oriT-attP(ΦC31)-int(ΦC31),通过Redαβ线环重组技术将pBAC2015-87 kb-J1074上的氯霉素抗性基因替换为接合转移元件。然后,进行三亲们接合转移,使将87kb Surugamides基因簇整合到异源宿主S.albus Del14的染色体上。接下来,进行发酵,分离提取并检测化合物。
首先将链霉菌接合转移元件、复制子及筛选标记aac(3)IV-oriT-attP(+C31)-int(+C31),通过Rec/ET重组技术整合到重组质粒中。利用ET12567/pUB307介导的三亲结合转移,将DH10b中的目标质粒pBAC2015-87 kb-J1074-int整合到S.albus Del14的染色体中。验证结合子并在R5A培养基中进行放大发酵。在S.albus Del14-87 kb的发酵液中检测到SurugamidesA(RT=4.53分钟,m/z=912.6293)和其他组分(SurugamidesD、G、H和I)。LC-MS/MS分析进一步证实了SurugamidesA在S.albus Del14-87 kb中成功合成。
通过CAT-FISHING技术从白色链霉菌基因组上成功捕获了49kb的Paulomycin基因簇(GC含量=71%)和87kb的Surugamides基因簇(GC含量=76%)。
通过构建BAC文库进行抓簇时,通常数千个转化子中只能筛选出几个正确的克隆(即1/1000~1/2000)。与之相比,CAT-FISHING技术无疑是一种更为简便、迅速以及高效的BGC克隆方法。
以上结果表明,CAT-FISHING技术可有效克隆高GC的大片段BGC,可作为大型基因片段的体外操作平台被广泛应用。
上述实施方式为本发明的优选案例,并不用来限制本发明的保护范围。
序列表
<110> 华东理工大学
<120> 一种基于CRISPR/Cas12a的体外大片段DNA克隆方法及其应用
<130> 1
<160> 63
<170> PatentIn version 3.5
<210> 1
<211> 32
<212> DNA
<213> 人工序列
<400> 1
ttatctatgc tcgggggatg ccgcgtggta cc 32
<210> 2
<211> 40
<212> DNA
<213> 人工序列
<400> 2
acagacaagc tgtgaccgtc ggcggcatcc cgatcagcgc 40
<210> 3
<211> 990
<212> DNA
<213> 刺糖多孢菌(Saccharopolyspora spinosa)
<400> 3
ggatgccgcg tggtacctgc acgagctgac tcgggaactc ggtctgtcgg cgttcgtgtt 60
gttctcctcg gtcgcgggcc tgttcggcgg tgcggggcag agcaattacg ctgccggcaa 120
cgctttcctg gatgccttgg cgcattgccg gcaggcccag gggctgcccg cgctgtcgct 180
ggcctccggg ctgtgggcga gtatcgatgg aatggcgggc gacctcgctg cggcagatgt 240
ggagcggctg tcgcgggcag gcattggccc gctttcggca ccgggagggc tggccttgtt 300
cgacgctgcc gttggctcgg acgaaccgtt gctggcaccg gtgcgactgg atgtcgaagc 360
actgcgtgtg caggcccgat ccgtgcagac ccggattccg gaaatgctgc atggcatggc 420
aatggggcca agccgccgca ctccgttcac ttccagggtt gagccgttgc acgaacggct 480
ggccggattg tcggagggcg aacgtcggca gcaagtgctc cagcgcgtcc gcgccgatat 540
cgcggtggta ctggggcacg gcaggtcgag cgatgtggac atcgagaagc ctttggccga 600
gctgggtttc gactcgctga cggccatcga actccgcaac cgtctcgcta ccgccaccgg 660
actgcggctt cccgcgacgc tggccttcga ccacggcact gcggcggcac tcgcccagca 720
cgtgtgcgcg cagctaggca ccgcgaccgc gccggcaccg aggcgaaccg acgacaacga 780
cgccacggag cccgtgaggt cgctcttcca acaggcgtat gcggctggcc ggatacttga 840
cgggatggat ttggtgaagg tcgctgccca gttgcgaccg gtgttcggtt cgcctggcga 900
gctggaatcc ctgccgaaac ccgtccagct ttcccgtggt cccgaagagc ttgccttggt 960
gtgcatgccg gcgctgatcg ggatgccgcc 990
<210> 4
<211> 40
<212> DNA
<213> 人工序列
<400> 4
gcgcggggag aggcggtttg gacattgcac tccaccgctg 40
<210> 5
<211> 33
<212> DNA
<213> 人工序列
<400> 5
tagagaggat accggagatc ctttgatctt ttc 33
<210> 6
<211> 228
<212> DNA
<213> 刺糖多孢菌(Saccharopolyspora spinosa)
<400> 6
gacattgcac tccaccgctg atgacatcag tcgatcatag cacgatcaac ggcactgttg 60
caaatagtcg gtggtgataa acttatcatc cccttttgct gatggagctg cacatgaacc 120
aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 180
ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatct 228
<210> 7
<211> 620
<212> DNA
<213> 人工序列
<400> 7
gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc 60
agcgggtgtt ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact 120
gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat 180
caggcgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc 240
ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac 300
gccagggttt tcccagtcac gacgttgtaa aacgacggcc agtgccaagc ttgcatgcct 360
gcaggtcgac tctagaggat ccccgggtac cgagctcgaa ttcgtaatca tggtcatagc 420
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 480
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 540
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 600
gcgcggggag aggcggtttg 620
<210> 8
<211> 24
<212> DNA
<213> 人工序列
<400> 8
gacggtcaca gcttgtctgt aagc 24
<210> 9
<211> 25
<212> DNA
<213> 人工序列
<400> 9
caaaccgcct ctccccgcgc gttgg 25
<210> 10
<211> 33
<212> DNA
<213> 人工序列
<400> 10
ttatctatgc tcgggggtgg agctgcgcaa ccg 33
<210> 11
<211> 40
<212> DNA
<213> 人工序列
<400> 11
acagacaagc tgtgaccgtc tcctggggcg tgacaccacc 40
<210> 12
<211> 880
<212> DNA
<213> 刺糖多孢菌(Saccharopolyspora spinosa)
<400> 12
ggtggagctg cgcaaccggc tgaacaccgc caccgggatc cagctgcccg ccagcacgat 60
tttcgactac cccaatgccg agtcgctgtc gcgtcacctc tgcgccgagc ttttcccaac 120
ggagactacc gtggactcgg cccttgccga gctcgatcga atcgagcagc agctctcgat 180
gctcaccggc gaagcgcggg cacgggaccg aatcgcgaca cgactgcgag ccctccacga 240
gaagtggaac agcgcagctg aagtaccgac cggagccgat gtcctgagca cgctcgattc 300
ggcgacgcac gacgagatat tcgagttcat cgacaacgag ctcgacctgt cctgagcagt 360
tcctgcggaa cttcaagcgc cgaaatcggg tggaaatcac aatggccaat gaagaaaagc 420
tcttcggcta tctgaagaag gtaactgcgg acctgcatca gacccggcag cgcctgctcg 480
cggccgagag ccggagtcag gagccgatcg cgatcgtctc ggcgagctgc cgactgcccg 540
gcggcgtcga ctctcccgaa gcgctctggc aactcgtgcg cactggcacc gacgccatct 600
cggagttccc cgccgaccgg ggctgggatc tcggccggtt gtacgatccc gacccgaacc 660
accagggaac gtcgtacacg cgggccggcg gtttcctcgc aggagcgggc gatttcgacc 720
ccgccatgtt cgggatttcg ccgcgtgagg cgttggcgat ggacccgcag caacggttgt 780
tgctggagct gtcctgggag gccctcgaac gggcgggcat agacccgaca tccctgcgcg 840
gcagcaagac cggtgtcttc ggtggtgtca cgccccagga 880
<210> 13
<211> 38
<212> RNA
<213> 人工序列
<400> 13
gaauuucuac uguuguagau cggaauccgg gucugcac 38
<210> 14
<211> 38
<212> RNA
<213> 人工序列
<400> 14
gaauuucuac uguuguagau caacagugcc guugaucg 38
<210> 15
<211> 38
<212> RNA
<213> 人工序列
<400> 15
gaauuucuac uguuguagau ggcgcuugaa guuccgca 38
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<400> 16
ggcagtttca tcgtggcgta 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<400> 17
gcgggactca catgggtttt 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<400> 18
caatccgatg acacggcaca 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<400> 19
ccgtggttgt cgctgtactc 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<400> 20
tgccatcaac tcggcaagat 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<400> 21
tctttcgcga aggcttgagt 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<400> 22
tggtgtgttg tcgttgtcgg 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<400> 23
ggagatctgg gcgaactcct 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<400> 24
ggcagtttca tcgtggcgta 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<400> 25
gcgggactca catgggtttt 20
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<400> 26
tgccatcaac tcggcaagat 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<400> 27
tctttcgcga aggcttgagt 20
<210> 28
<211> 38
<212> RNA
<213> 人工序列
<400> 28
gaauuucuac uguuguagau cucacgcugc ccgcguac 38
<210> 29
<211> 38
<212> RNA
<213> 人工序列
<400> 29
gaauuucuac uguuguagau uuggcgaaau cucugucc 38
<210> 30
<211> 38
<212> RNA
<213> 人工序列
<400> 30
gaauuucuac uguuguagau cgggcgggcg cggccagg 38
<210> 31
<211> 38
<212> RNA
<213> 人工序列
<400> 31
gaauuucuac uguuguagau ccgaggaccg aaacugug 38
<210> 32
<211> 38
<212> RNA
<213> 人工序列
<400> 32
gaauuucuac uguuguagau ggccacaucg acgccuac 38
<210> 33
<211> 38
<212> RNA
<213> 人工序列
<400> 33
gaauuucuac uguuguagau gcacugcugg cggcgguc 38
<210> 34
<211> 59
<212> DNA
<213> 人工序列
<400> 34
cactcactca ccccggtcac atcgttatct atgctcggcg atcgcgctgg agtccttcg 59
<210> 35
<211> 59
<212> DNA
<213> 人工序列
<400> 35
tctcatgttt gaccgcttat ctggatctgc cctttccact cgacggcgac ccggtgctg 59
<210> 36
<211> 59
<212> DNA
<213> 人工序列
<400> 36
attgatttaa aacttcattt aatcctgtcg accgtcaagc ctgcatgtgc acccatgta 59
<210> 37
<211> 59
<212> DNA
<213> 人工序列
<400> 37
aggaaattta tcttgatcat ataaatagag aggataccgt gaccaagcgg tacgacttc 59
<210> 38
<211> 727
<212> DNA
<213> 白色链霉菌(Streptomyces albus)
<400> 38
cgatcgcgct ggagtccttc gacgccgtcc tcggcgagaa gccgaaccag aaggaccggc 60
tccgcgagga cgtctcggtg gccgccggcg acctcatcgc catcgactcg ctcgacgccg 120
agcccacctt cgacggcctg cgcaacgccg tccaggtcgg catccgctac atcgaggcgt 180
ggctgcgcgg cctcggcgcc gtcgccatct tcaacctgat ggaggacgcg gccaccgccg 240
agatctcccg ctcgcagatc tggcagtgga tcaacgccgg ggtcgaggtg gagcgcgacg 300
gcgccaccgt cctggtcacc cgtgagctgg cccgcgaggt ggcggccggg gaactggccg 360
cgatccgcgc cgagatcggc gaggacgcct tcaccgccgg ccgctggcag caggcccacg 420
acctgctgct gaccgtctcc ctcgacgacg actacgccga cttcctcacg ctgcccgcgt 480
acgagcagct ggtcggctga gctcgcccgg cacctccgca cgcgcctttg ccccggccct 540
cgccggggca aaggcgcgtg cgggcccggg tccgccgcac cgacggctct cagagcaccc 600
ggtcgagcgc caggcaggtc tcgtactccg gcagcagtcc ttgccgcccg gcctcggcca 660
gggtgggggc ctgccggtcg cgcgctgaca gcaccgggtc gccgtcgagt ggaaagggca 720
gatccag 727
<210> 39
<211> 611
<212> DNA
<213> 白色链霉菌(Streptomyces albus)
<400> 39
taatcctgtc gaccgtcaag cctgcatgtg cacccatgta ccgacccagt ccttctttat 60
ccgcagaggc gtccagtata gggtcaaccc tgcgcggggg aacctgaagg atgacaccgg 120
acagagattt cgccaagaag gcatatcatc cgggtagttg aggtatttcg ccggtggcgg 180
tcccgcccgg cgaaccgagc caccggacgc cccccccccc ccgcctcacc ccagatgccg 240
cgaccagtcc ggcgccgcgt ccggcttgcc gtgcagatcc ggtacgtgct ggagccaggc 300
gggccgggcc gcgcgggtgg ccgcggcccg ctcggcgtcg gcctcggcga gttgccgggc 360
cgaggggaac tccagcggca gccactcccc cgagacggcc gcccgctccg cgagctgatg 420
ggcgtacgcc tcgcgcagcg cgtccggcga ggagaagccc ggctcgtccc gcagccaggc 480
gtcggggacg agcgcggtca cctcgcgcag caggtcgagg gtgacccggg gtgccagttc 540
cgcgtcggcc tcggcgacca gcggggcgta cccgccgagg gcgtggtggc ggaagtcgta 600
ccgcttggtc a 611
<210> 40
<211> 39
<212> DNA
<213> 人工序列
<400> 40
catcgttatc tatgctcggg gatgtcgacg tccagggtg 39
<210> 41
<211> 38
<212> DNA
<213> 人工序列
<400> 41
cggtttgcgt attgggcaat tgattcgccg gcgttctg 38
<210> 42
<211> 39
<212> DNA
<213> 人工序列
<400> 42
tgataataat ggtttcttag ggaagcggtc tcctgaagc 39
<210> 43
<211> 41
<212> DNA
<213> 人工序列
<400> 43
ataaatagag aggataccgg ttttcccccg ttgatgagtg g 41
<210> 44
<211> 984
<212> DNA
<213> 白色链霉菌(Streptomyces albus)
<400> 44
gatgtcgacg tccagggtgc gcgggcccca gcgctcgtca cggacccggt ggaacgcctc 60
ctcgacggcc tgcgcgcgct ccagcagcga gccggggggc agcgtcgtcc ggatcaccgc 120
gacggcgttg aagtacgagg gctgggagcc ggggtcgacg ccccacggct ccgtctcgta 180
gacgggggag acggctttga cccgcaggcc gggggtgtcc tccagcgcgt cgacggcgcc 240
ctggagggtc tccaggcggt tgccgaggtt gctgccgagg gagatcacgg cggtcttcgg 300
gttggagagg gtcacgtcgg cggcgtccac ctgctcgacg acggaggccg ggaccggctg 360
cacggtgggg tcgctgctgt tcgggttcat acacggctcc gggtgatggt gacggtcacg 420
tcgtcgaacg ggacggtgat cggggcgtcc ggtttgtgga cggtgacctc gacctcctgg 480
accgcgtccg tcttcaggca ggtccgggcg atgcgctcgg ccagggtctc gatgaggttc 540
accggctcgc cctcgaccac ggccacgacc tcctcggcga cgacgccgta gtggacggtc 600
cgggtcaggt cgtcgctctc ggctgcgggc cgggtgtcca gaccgaggac gaggtcgacg 660
atgaaggtct ggccctcctc gcgctccttg ggaaagacac cgtggtgccc tcggcccttg 720
aggccgcgca gcgcgacacg atccacgcga atcactcctg ctcttgtcgt tgtcggcggg 780
cggtgcgcgg gtgcggccgg cccaccggcc tcaggcgagg ctaccggtgg ccaccggcac 840
ggcccgccca cggggtcggg acagcacggg gaagaaccgg ggaaccccac atgacgcgca 900
cctggccgcg cccgcccgga aaccggtccc ccaccctccg ggcagggacg gcgaagggcc 960
cctacccaga acgccggcga atca 984
<210> 45
<211> 870
<212> DNA
<213> 白色链霉菌(Streptomyces albus)
<400> 45
ggaagcggtc tcctgaagcg cacagggacc cgccttcatc tcggggcgcc gggcgctccc 60
gggcctcccg cagagaactc cacgttcccg ccggcgcagc gtaggtctcc cgttcgttcc 120
cgggccacag tttcggtcct cggtaaaccc tcccggcacc gggggagtcg gccgcctgtc 180
ccgtcgcgga cgggccggcg ggcggtcggg accaccgcca ccgcaccgga gaccggaacg 240
gcgagaatca gccaggtgcg cccctgatgg ccgaaggaca tgcctcggcc gggcgccggg 300
acgcggtggt cccgcccgca ccccgatggc cgggacacgc cccctcaagg ccgccctccg 360
gcgtcccccg cctccgggcc gaccctgcct cgggggcggc ggggacggcc cccggggagg 420
cgctgcccgg ccctgtggcc tcgtaactcg tagtgagggg agtgccacgt tcccgtgccc 480
cggggcggcc gggcggtccc gggggacgcc gtgcggcgcc gaaacccggg acccggaagg 540
gggccgggat ctttccccgg acgccgtccg gagccacacc tgaagaattc atgatcgagg 600
tggtgaatcg gccatggcgg ctcaaggaac gcggcactgt ccgcgcgcca cccgtcatgg 660
caccgtctgg aaaggtctgg acaggagcgg ccgcacgccg gcgcccctgc accagcacca 720
cgaggtattc gtgcgtatcc gtgcgtacgg cacccgcccc cggacaccgt ccggccgggc 780
gggcagcgga acagcgtctc caccgcgacc cggtggcggc ggtccggccg cgtgcctgcc 840
gcgggtgcac cactcatcaa cgggggaaaa 870
<210> 46
<211> 17
<212> DNA
<213> 人工序列
<400> 46
aagatgtcca agcgtgc 17
<210> 47
<211> 17
<212> DNA
<213> 人工序列
<400> 47
agccggccta ccagctg 17
<210> 48
<211> 18
<212> DNA
<213> 人工序列
<400> 48
ccaccacgga cgacgaga 18
<210> 49
<211> 17
<212> DNA
<213> 人工序列
<400> 49
aactcggtga agagttc 17
<210> 50
<211> 19
<212> DNA
<213> 人工序列
<400> 50
tggtcacctt ccggtcttc 19
<210> 51
<211> 17
<212> DNA
<213> 人工序列
<400> 51
aaaggccggc ccatgac 17
<210> 52
<211> 17
<212> DNA
<213> 人工序列
<400> 52
gcagcgaact gcctggt 17
<210> 53
<211> 17
<212> DNA
<213> 人工序列
<400> 53
ccgatgaggt cgttcac 17
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<400> 54
atgcccgtca actgctcctg 20
<210> 55
<211> 17
<212> DNA
<213> 人工序列
<400> 55
tgatttcccg accgttt 17
<210> 56
<211> 17
<212> DNA
<213> 人工序列
<400> 56
gccggttcag gcgcgct 17
<210> 57
<211> 17
<212> DNA
<213> 人工序列
<400> 57
agaagggcaa gttgtgc 17
<210> 58
<211> 18
<212> DNA
<213> 人工序列
<400> 58
tccattccgt gccatgcg 18
<210> 59
<211> 18
<212> DNA
<213> 人工序列
<400> 59
gcgacgagag aggatgtg 18
<210> 60
<211> 17
<212> DNA
<213> 人工序列
<400> 60
acaaggctcc tgacagg 17
<210> 61
<211> 16
<212> DNA
<213> 人工序列
<400> 61
gaggtggtgc acctgg 16
<210> 62
<211> 16
<212> DNA
<213> 人工序列
<400> 62
gtgtatcgcg ccgctg 16
<210> 63
<211> 16
<212> DNA
<213> 人工序列
<400> 63
ctatgctcca gacatc 16

Claims (10)

1.一种基于CRISPR/Cas12a系统的体外大片段DNA克隆方法,所述方法包括:
(1)捕获载体的构建以及切割:制备目标DNA片段的两端的同源臂,并将所述同源臂连接到载体中,从而得到所述捕获载体,其中,所述同源臂包含至少一个能够被Cas12a或其生物活性功能片段或变体识别的PAM位点;基于至少部分地互补结合至所述同源臂的crRNA,使用所述Cas12a或其生物活性功能片段或变体,对所述捕获载体进行切割,从而得到经切割的捕获载体;
(2)目标DNA片段的制备:基于所述crRNA并使用所述Cas12a或其生物活性功能片段或变体,对包含目标DNA片段的样品进行切割,得到所述目标DNA片段;以及
(3)连接以及转化:将所述经切割的捕获载体与所述目标DNA片段进行连接,并转入/导入宿主细胞中,得到具有所述目标DNA片段的重组宿主细胞。
2.根据权利要求1所述的方法,其中,所述样品为基因组和/或宏基因组,或者由基因组和/或宏基因组衍生而来的DNA样品。
3.根据权利要求1或2所述的方法,其中,所述同源臂距离所述目标DNA片段的5’末端或3’末端至少100bp,优选至少200bp、更优选至少500bp、进一步优选至少1kb、更优选至少1.2kb、更优选至少1.5kb。
4.根据权利要求1-3中任一项所述的方法,其中,所述同源臂的长度为100bp以上。
5.根据权利要求1-4中任一项所述的方法,其中,用于制备捕获载体的载体为环状质粒或线状载体。
6.根据权利要求1-5中任一项所述的方法,其中,所述crRNA包含间隔序列和结合序列,所述间隔序列能够至少部分地互补结合至所述同源臂,所述结合序列能够结合所述Cas12a或其生物活性功能片段或变体。
7.根据权利要求1-6中任一项所述的方法,其中,在步骤(1)和步骤(2)中,所述切割在pH7.5-8.0、优选pH7.9的盐酸盐缓冲液中进行。
8.根据权利要求1-7中任一项所述的方法,所述方法用于克隆生物合成基因簇。
9.一种提高CRISPR/Cas12a系统的切割效率的方法,所述方法包括在盐酸盐缓冲液中,在35℃-38℃、优选37℃的温度下利用CRISPR/Cas12a系统进行切割40min-120min、优选50min-100min、更优选60min-80min。
10.一种用于体外大片段DNA克隆的试剂盒,所述试剂盒包含载体、Cas12a或其其生物活性功能片段或变体或者表达所述Cas12a或其其生物活性功能片段或变体的表达载体;以及使用说明书,所述说明书用于说明如权利要求1-8中任一项的克隆方法的实施。
CN202010575747.5A 2020-06-22 2020-06-22 一种基于CRISPR/Cas12a的体外大片段DNA克隆方法及其应用 Pending CN113897349A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010575747.5A CN113897349A (zh) 2020-06-22 2020-06-22 一种基于CRISPR/Cas12a的体外大片段DNA克隆方法及其应用
PCT/CN2020/120332 WO2021258580A1 (zh) 2020-06-22 2020-10-12 一种基于CRISPR/Cas12a的体外大片段DNA克隆方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010575747.5A CN113897349A (zh) 2020-06-22 2020-06-22 一种基于CRISPR/Cas12a的体外大片段DNA克隆方法及其应用

Publications (1)

Publication Number Publication Date
CN113897349A true CN113897349A (zh) 2022-01-07

Family

ID=79186406

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010575747.5A Pending CN113897349A (zh) 2020-06-22 2020-06-22 一种基于CRISPR/Cas12a的体外大片段DNA克隆方法及其应用

Country Status (2)

Country Link
CN (1) CN113897349A (zh)
WO (1) WO2021258580A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114480467A (zh) * 2022-02-24 2022-05-13 江南大学 一种在棒状杆菌中辅助sacB基因编辑系统的CRISPR-cpf1筛选工具
CN116286941A (zh) * 2023-05-22 2023-06-23 中国农业科学院北京畜牧兽医研究所 一种毕赤酵母基因编辑单一质粒及改进的基因编辑方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106480083A (zh) * 2015-08-26 2017-03-08 中国科学院上海生命科学研究院 CRISPR/Cas9介导的大片段DNA拼接方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111088275B (zh) * 2018-10-23 2023-06-27 黄菁 Dna大片段的克隆方法
CN109666684A (zh) * 2018-12-25 2019-04-23 北京化工大学 一种CRISPR/Cas12a基因编辑系统及其应用
CN109706109A (zh) * 2019-01-30 2019-05-03 中国医学科学院病原生物学研究所 一种基于CRISPR/Cas和lambda Red重组系统的体内质粒编辑系统及其应用

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106480083A (zh) * 2015-08-26 2017-03-08 中国科学院上海生命科学研究院 CRISPR/Cas9介导的大片段DNA拼接方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
HAILONG WANG等: "RecET direct cloning and Redab recombineering of biosynthetic gene clusters, large operons or single genes for heterologous expression", NATURE PROTOCOLS, vol. 11, no. 7, pages 1175 - 1190, XP055607964, DOI: 10.1038/nprot.2016.054 *
MINDONG LIANG等: "Simple cloning of large natural product biosynthetic gene cluster by CRISPR/Cas12a-mediated fast direct capturing strategy", BIORXIV, pages 1 - 33 *
WENJUN JIANG等: "Cas9-Assisted Targeting of Chromosome segments CATCH enables one-step targeted cloning of large gene clusters", NATURE COMMUNICATIONS, vol. 6, pages 1 - 8 *
曾哲等: "基于基因组编辑技术的大片段克隆新策略", 生物工程学报, vol. 32, no. 4, pages 401 - 408 *
李青青: "由单条sgRNA介导的可编程酶CRISPR-Cpf1作为人工限制性内切酶在DNA装配中的应用", 中国优秀硕士学位论文全文数据库, pages 29 - 46 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114480467A (zh) * 2022-02-24 2022-05-13 江南大学 一种在棒状杆菌中辅助sacB基因编辑系统的CRISPR-cpf1筛选工具
CN114480467B (zh) * 2022-02-24 2023-08-25 江南大学 一种在棒状杆菌中辅助sacB基因编辑系统的CRISPR-cpf1筛选工具
CN116286941A (zh) * 2023-05-22 2023-06-23 中国农业科学院北京畜牧兽医研究所 一种毕赤酵母基因编辑单一质粒及改进的基因编辑方法
CN116286941B (zh) * 2023-05-22 2023-09-29 中国农业科学院北京畜牧兽医研究所 一种毕赤酵母基因编辑单一质粒及改进的基因编辑方法

Also Published As

Publication number Publication date
WO2021258580A1 (zh) 2021-12-30

Similar Documents

Publication Publication Date Title
CN110431229B (zh) 热稳定的Cas9核酸酶
JP7423520B2 (ja) Cas9ベースノックイン方針の効力を改善するための組成物及び方法
CN107922931B (zh) 热稳定的Cas9核酸酶
Ryan et al. Multiplex engineering of industrial yeast genomes using CRISPRm
US6660475B2 (en) Use of site-specific nicking endonucleases to create single-stranded regions and applications thereof
US7689366B2 (en) Integrated system for high throughput capture of genetic diversity
CN110358767B (zh) 一种基于CRISPR-Cas12a系统的运动发酵单胞菌基因组编辑方法及其应用
KR20240036729A (ko) 클래스 ii, 타입 v crispr 시스템
CN113897349A (zh) 一种基于CRISPR/Cas12a的体外大片段DNA克隆方法及其应用
WO2022156188A1 (en) Method for producing target dna sequence and cloning vector
Sandhu Recombinant DNA technology
Xin et al. Development and application of a CRISPR-dCpf1 assisted multiplex gene regulation system in Bacillus amyloliquefaciens LB1ba02
AU2013361289B2 (en) Compositions and methods for creating altered and improved cells and organisms
CN113166741A (zh) Dna文库的多重确定性组装
AU2022284808A1 (en) Class ii, type v crispr systems
Penewit et al. Genome editing in staphylococcus aureus by conditional recombineering and CRISPR/Cas9-mediated counterselection
Penewit et al. Recombineering in Staphylococcus aureus
JP3910248B2 (ja) トランスポゼースを用いるin vitro反応によるDNA入れ子型欠失の作製方法
Ganguly et al. Breaking the restriction barriers and applying CRISPRi as a gene silencing tool in Pseudoclostridium thermosuccinogenes. Microorganisms 2022; 10: 698
CN102533741B (zh) 猪假attp位点及其用途
García-Pedrajas et al. Rapid deletion plasmid construction methods for protoplast and Agrobacterium-based fungal transformation systems
JP2804436B2 (ja) ストレプトミセス属菌および大腸菌の新規の細菌プラスミドシャトルベクター
Evans II Establishment of a CRISPR-Cas9 System for Promoter Recombination in Cryptococcus deneoformans
US20020123100A1 (en) Binary BAC vector and uses thereof
CN112831517A (zh) 由番茄红素基因介导的改造的克隆载体及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination