CN111613272A - 程序化框架gRNA及其应用 - Google Patents

程序化框架gRNA及其应用 Download PDF

Info

Publication number
CN111613272A
CN111613272A CN202010438038.2A CN202010438038A CN111613272A CN 111613272 A CN111613272 A CN 111613272A CN 202010438038 A CN202010438038 A CN 202010438038A CN 111613272 A CN111613272 A CN 111613272A
Authority
CN
China
Prior art keywords
grna
framework
sequence
promoter
trna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010438038.2A
Other languages
English (en)
Other versions
CN111613272B (zh
Inventor
陆志科
马丽佳
宋庆凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Westlake University
Original Assignee
Westlake University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Westlake University filed Critical Westlake University
Priority to CN202010438038.2A priority Critical patent/CN111613272B/zh
Publication of CN111613272A publication Critical patent/CN111613272A/zh
Application granted granted Critical
Publication of CN111613272B publication Critical patent/CN111613272B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及一种程序化框架gRNA及其应用。与亲本框架gRNA相比,所述程序化框架gRNA在Tetraloop、Loop2和Tail中的任一结构中引入腺嘌呤/鸟嘌呤混合捕获序列修饰,其中所述腺嘌呤/鸟嘌呤混合捕获序列选自SEQ ID No:1‑9中的任一项。本发明还涉及包含程序化框架gRNA的gRNA表达盒或双gRNA表达盒。本发明还涉及包含所述程序化框架gRNA、gRNA表达盒或双gRNA表达盒的载体或细胞。本发明的程序化框架gRNA、gRNA表达盒或双gRNA表达盒可以替代亲本框架gRNA用于CRISPR筛选,CRISPR筛选得到的细胞群可用于构建单细胞测序用的文库。

Description

程序化框架gRNA及其应用
技术领域
本发明属于生物技术领域,具体而言,本发明涉及一种程序化框架gRNA及其在CRISPR筛选以及在单细胞测序建库中的应用。
背景技术
采用成簇的规律间隔短回文重复序列(clustered regularly interspacedshort palindromic repeats,CRISPR)进行系统性基因扰动是在高通量测序中研究基因功能的突破性技术。其中,实验试剂获得的简易性,技术的可扩展性以及灵活性,凸显了该系统的广泛应用前景。为了进一步扩展应用,可以对固有的CRISPR系统进行了拓展优化。拓展优化主要分为两大类:一类是使用具有独特功能的、新的或进化的核酸内切酶,例如,dCas9(dead Cas9),Cpf1和Cas13a。dCas9通常与其他效应蛋白融合在一起,包括转录激活因子或阻遏蛋白以及DNA修饰剂等,从而使CRISPR系统的编辑能力从改变DNA序列扩展到调控转录和表观遗传。另一类拓展优化是对框架gRNA(guide RNA scaffold,gRNA scaffold)进行改进。对Cas9/gRNA复合物的结构生物学研究已经证明,框架gRNA在二级结构上的Tetraloop、Loop2和Tail三个位置不直接与核酸内切酶相互作用,因此推测在这三个位置上添加序列可能不会影响Cas9/gRNA复合物的功能。譬如,在框架gRNA上添加RNA适体(RNA aptamer)序列可以招募转录效应子或荧光分子等,使得Cas9/gRNA复合物在靶向目标序列的同时,也同时具有了转录调控或者发荧光的功能。这大两类改进,扩充了CRISPR系统工具包,使其在原有的定点基因编辑功能之外,实现了包括DNA编辑,表观遗传修饰,转录调控和基因组成像等功能。然而,对于具体在这三个位置上添加何种序列,仍然需要本领域技术人员进一步的研究。
CRISPR技术自2013年开始被应用于遗传筛选。遗传筛选的主要目的是建立基因型和表型之间的关系。通常做法是构建大批量的基因突变体,通过观察突变体的表型,来找到对应的基因。由于在哺乳动物中构建突变体(尤其是定点突变)的效率很低,CRISPR技术的发明,推动遗传筛选进入了全新的时代。
在CRISPR筛选中最重要的需求之一是在单细胞分辨率下,把单个细胞的基因型、转录组和表型结合起来分析。要建立基因型和表型之间的联系,可以通过分析一群具有特定表型的细胞中富集或缺失的向导RNA(guide RNA,gRNA)来实现。如果要在单细胞水平再加入转录组的信息,则需要在转录组中包含gRNA的信息。因为gRNA同时也代表了细胞的基因型,所以基因型、转录组和表型三者的联系能够被起来。添加转录组信息的意义在于(1)转录组是细胞功能的重要分子特征;(2)同样表型的细胞其转录组可能并不相同,因此在单细胞水平分析细胞的转录组有助于我们更深入的理解基因组水平突变到表型水平变化的遗传信息传递过程。
建立单个细胞的基因型、转录组和表型三者关系的难点在于gRNA由RNA聚合酶III转录(Polymerase III,简写为Pol III),其转录本不携带poly(A)尾巴,所以不能在常规的反转录反应中通过oligo(dT)来富集。针对这个问题,目前已有的解决方案包括:
(1)在gRNA表达载体中插入一个与gRNA序列关联的条形码(barcode),这些条形码将被聚腺苷酸化,然后在逆转录(RT)过程中与内源性mRNA一起被捕获(例如,Perturb-seq,CRISP-seq,MOSAIC-seq)。然而,gRNA与条形码之间的解偶联是这类方法最大的问题;
(2)CROP-seq在病毒整合过程中产生了多腺苷酸化的gRNA拷贝,避免了潜在的解偶联。但是,表达载体能承受的插入序列长度有限,限制了其在多基因gRNA组合筛选中应用;
(3)2019年,10×Genomics公司推出了带有特征条形码(Featured Barcode)的单细胞3'RNA-seq试剂盒,最近的出版物对此进行了报道(参见Replogle,J.M.etal.Combinatorial single-cell CRISPR screens by direct guide RNA capture andtargeted sequencing.Nat Biotechnol,doi:10.1038/s41587-020-0470-y(2020))。他们在框架gRNA的Loop2和Tail区域设计了两个捕获序列(CS1、CS2,已公布在相应试剂盒的说明书中),这样,聚合酶III(Pol III)转录的gRNA将携带这些特定序列,并可以被工程化的10x GEM磁珠捕获。但是,这些“捕获序列”依赖于特殊的RT引物,与其他单细胞RNA-seq平台不兼容,仅适用于10×Genomics平台(下文中也称为10×平台)。
因此,本领域对于能够在单细胞分辨率下鉴定基因组扰动后的基因表达谱以及基因型的高度灵活且易于获取的框架gRNA存在需求。
发明内容
本发明旨在通过改造框架gRNA序列而构建一种程序化框架gRNA,使用所述程序化框架gRNA进行CRISPR筛选得到的细胞群能够用于单细胞测序建库,从而能够在单细胞分辨率下鉴定基因组扰动后的基因表达谱以及基因型。
框架gRNA是一种特殊的RNA序列。在一级序列上,框架gRNA 5’端的20个核苷酸序列称为spacer序列,用于识别基因组中互补的目标序列并与之结合。spacer序列代表gRNA的特异性,在gRNA文库中,通常只有代表了gRNA特异性的spacer序列在文库中每条序列之间都是不同的。这20个核苷酸的spacer序列与下游的几十个核苷酸一起,在二级结构上形成一些特殊的结构,与核酸酶(如Cas9)结合,将Cas核酸酶引导至目的序列进行基因编辑。这些二级序列包括Repeat、anti-repeat、Tetraloop、Loop2等。框架gRNA的结构示意图见图1a和图1e。
如图1e所示,框架gRNA由两部分组成:crRNA(guide+repeat)和tracrRNA(anti-repeat+茎环loop1/2/3+linker组成)。Tail位置指tracrRNA尾巴部位。
本发明人通过在框架gRNA中引入特殊捕获序列,为单细胞CRISPR筛选提供了一个直接“基因分型”的实验分析流程。这样就可以同时分析筛选后细胞的基因型、转录组和表型信息。具体而言,本发明人使用了一个腺嘌呤/鸟嘌呤(A/G)混合捕获序列(例如,SEQ IDNo:1-9)来模拟pol II转录物的poly(A)尾部,含有A/G混合捕获序列的gRNA转录本可以和内源mRNA一起被广泛使用的poly(dT)RT引物直接高效的捕获,同时,不影响原有CRISPR系统的基因敲除或基因激活效果,充分体现了本发明的程序化框架gRNA在多种scRNA-seq平台(如:Fluidigm C1,Clontech iCell8,10x Genomics Chromium,BGI DNBelab等)中的应用价值。
在第一方面,本发明提供了一种程序化框架gRNA(programmed gRNA scaffold)序列,与亲本框架gRNA相比,本发明的程序化框架gRNA在Tetraloop、Loop2和Tail中的任一结构中用腺嘌呤/鸟嘌呤(A/G)混合捕获序列进行修饰。其中,所述亲本框架gRNA为没有进行所述修饰的框架gRNA,其可以为野生型(WT)框架gRNA或其常见变种;所述腺嘌呤/鸟嘌呤(A/G)混合捕获序列为包含腺嘌呤和鸟嘌呤的捕获序列,其可以选自SEQ ID No:1-9中任一项,但不限于此;所述修饰为替换或插入,具体地,在Tetraloop和Loop2中的修饰为替换,即,用A/G混合捕获序列替换Tetraloop或Loop2,在Tail中的修饰为插入,即,在Tail中插入A/G混合捕获序列,更具体地,在Tail的polyT之前插入腺嘌呤/鸟嘌呤(A/G)混合捕获序列。
在优选的实施方案中,所述腺嘌呤/鸟嘌呤(A/G)混合捕获序列选自SEQ ID No:1、3或7。
在优选的实施方案中,所述腺嘌呤/鸟嘌呤(A/G)混合捕获序列为SEQ ID No:1。在另一个优选的实施方案中,所述腺嘌呤/鸟嘌呤(A/G)混合捕获序列为SEQ ID No:3。在更优选的实施方案中,所述腺嘌呤/鸟嘌呤(A/G)混合捕获序列为SEQ ID No:7。
Figure BDA0002503029290000051
通过所述程序化框架gRNA,可以在不加入其他RT引物的情况下作为单细胞RNA测序中代表细胞基因型的index gRNA,将scRNA-seq与CRISPR筛选相结合。本发明人研究发现,用一段混合的腺嘌呤/鸟嘌呤序列分别修饰亲本框架gRNA的三个不同位置(即,替换Tetraloop或Loop2,在Tail的polyT前插入),而不影响CRISPR/Cas9和CRISPRa系统的性能。同时,在不同的单细胞RNA-seq平台上,带有A/G混合捕获序列的gRNA转录本及内源性mRNA可以同时被poly(dT)有效捕获。本发明人的研究展示了一种高度灵活且易于获取的程序性框架gRNA,可在单细胞分辨率下鉴定基因组扰动后的基因表达谱以及基因型。
在一个实施方案中,与亲本框架gRNA相比,本发明的程序化框架gRNA在Tetraloop、Loop2和Tail中的任一结构中引入腺嘌呤/鸟嘌呤(A/G)混合捕获序列修饰;其中A/G混合捕获序列选自SEQ ID No:1-9中的任一项,所述修饰为替换或插入,具体地,在Tetraloop和Loop2中的修饰为替换,在Tail中的修饰为插入,更具体地,在Tail的polyT之前插入腺嘌呤/鸟嘌呤(A/G)混合捕获序列。
在一个实施方案中,A/G混合捕获序列的5’端和/或3’端可以带有接头序列。本领域技术人员应该理解,当A/G混合捕获序列替换短环Tetraloop(序列为GAAA)或Loop2(序列为GAAA)时,由于引入的A/G混合捕获序列较长且仍需要形成环,此时选择接头序列时通常考虑以下两点:(1)A/G混合捕获序列两端的接头序列中有可配对的碱基存在,形成茎(stem)结构,有益于A/G混合捕获序列形成的长环的稳定;(2)接头序列中包含能够与常用反转录引物(例如,oligo(dT)引物序列:5’-TTTTTTTTTTTTTTTTTTVN-3’,其中T的长度可变,一般在20~40个碱基左右,V代表除了T以外的任意碱基,N代表任意碱基)中的“VN”互补的碱基,为反转录引物提供引发位点(priming site),有利于提高反转录效率;当在Tail中插入A/G混合捕获序列时,通常出于减少空间位阻的考虑而选择合适的接头序列。因此,适用于本发明的接头序列没有特殊限制,基于上述教导和本发明示例性的接头序列,本领域的技术人员能够选择合适的接头序列。
在一个示例性而非限制性的实施方案中,当A/G混合捕获序列替换短环Tetraloop(序列为GAAA)时,A/G混合捕获序列5’端的接头序列可以为GCG,3’端的接头序列可以为C。其中5’端的接头序列中第一个G与3’端的接头序列C配对,该额外添加的碱基配对延伸了亲本框架gRNA中的stem长度,能够更好地稳定比亲本序列更大的环(由A/G混合捕获序列形成)。此外,5’端的接头序列中的第二和第三个碱基“CG”,将在反转录过程中起到更好的与反转录引物互补的作用。
在一个示例性而非限制性的实施方案中,当A/G混合捕获序列替换短环Loop2(序列为GAAA)时,A/G混合捕获序列5’端的接头序列可以为GGCCCG,3’端的接头序列可以为GGCC。
在另一个示例性而非限制性的实施方案中,当A/G混合捕获序列插入在Tail的polyT之前时,A/G混合捕获序列5’端的接头序列可以为TCGG。
由此可见,本发明的程序化框架gRNA具有在逆转录反应中被常规的RT引物oligo(dT)捕获的性质,进一步使gRNA转录本成为标记细胞基因型的index gRNA。
用于本发明时,术语“程序化框架gRNA”是指在亲本框架gRNA的基础上,在三个位置(即,Tetraloop、Loop2、Tail)中任一个中用A/G混合捕获序列进行修饰而构建的框架gRNA,称为“程序化框架gRNA”。Tetraloop、Loop2、Tail这三个位置是gRNA与Cas9核酸酶结合时的非关键位点。本发明人首次发现在其中用A/G混合捕获序列修饰而构建的程序化框架gRNA可以用于在CRISPR筛选后直接抓取gRNA转录本,其技术效果优于现有技术中对其中两个区域改造得到的框架gRNA(例如,10x Genomics公司在框架gRNA的Loop2和Tail区域中插入捕获序列CS1和CS2)。以引入SEQ ID No:1(AAAAAAAAGAAAAAAAGAAAAAAAGAAAAA,后文以8A8G表示)所示的A/G混合捕获序列为例,在亲本框架gRNA的Tetraloop、Loop2或Tail中引入8A8G混合捕获序列修饰的结构示意图分别显示在图1b、图1c和图1d中,相对应的不含5’端Spacer序列的程序化框架gRNA的序列分别显示在图9B、图9C和图9D中。
在一个实施方案中,本发明还提供包含本发明第一方面的程序化框架gRNA的载体,例如,包含本发明第一方面的程序化框架gRNA的表达载体。
在一个实施方案中,本发明还提供包含本发明第一方面的程序化框架gRNA的细胞。在另一个实施方案中,本发明还提供包含含有本发明第一方面的程序化框架gRNA的载体的细胞。
在本发明中,对细胞没有特别限制,可以是原核细胞或真核细胞,例如,但不限于,本领域常用的各种真核细胞或原核细胞,例如,K562细胞、Jurkat细胞、HEK293T细胞、酵母细胞、大肠杆菌细胞等。
在第二方面,本发明提供一种gRNA表达盒,其在5’至3’方向依次包含启动子、tRNA和程序化框架gRNA,其结构如式I所示,其中在启动子3’末端与程序化框架gRNA的5’末端(更具体地,为spacer序列的5’末端)之间添加tRNA:
Figure BDA0002503029290000081
其中从左至右为5’至3’方向,程序化框架gRNA表示本发明第一方面的程序化框架gRNA。
启动子可以根据研究需要选择,例如,但不限于,Pol III启动子或Pol II启动子等,优选Pol III启动子,更优选U6启动子,最优选人U6启动子。
tRNA可以根据研究需要选择,例如,但不限于人tRNA(Gln)(SEQ ID No:14)或水稻tRNA(Gly)(SEQ ID No:15)。
人tRNA(Gln)(SEQ ID No:14):
GGTTCCATGGTGTAATGGTTAGCACTCTGGACTCTGAATCCAGCGATCCGAGTTCAAATCTCGGTGGAACCT
水稻tRNA(Gly)(SEQ ID No:15):
AACAAAGCACCAGTGGTCTAGTGGTAGAATAGTACCCTGCCACGGTACAGACCCGGGTTCGATTCCCGGCTGGTGCA
在一个优选的实施方案中,启动子为U6启动子,即,所述gRNA表达盒的结构如式I’所示:
Figure BDA0002503029290000091
其中从左至右为5’至3’方向,U6表示U6启动子,程序化框架gRNA表示本发明第一方面的程序化框架gRNA。U6启动子优选为人U6启动子
tRNA可以根据研究需要选择,例如,但不限于人tRNA(Gln)(SEQ ID No:14)或水稻tRNA(Gly)(SEQ ID No:15)。
在一个实施方案中,本发明还提供包含本发明第二方面的gRNA表达盒的载体,例如,包含本发明第二方面的gRNA表达盒的表达载体。
在一个实施方案中,本发明还提供包含本发明第二方面的gRNA表达盒的细胞。在另一个实施方案中,本发明还提供包含含有本发明第二方面的gRNA表达盒的载体的细胞。
在第三方面,本发明提供一种双gRNA表达盒,其在5’至3’方向包含启动子、框架gRNA、tRNA和程序化框架RNA,其中tRNA序列位于框架gRNA与程序化框架gRNA之间,所述双gRNA表达盒的结构如式II所示:
Figure BDA0002503029290000092
其中从左至右为5’至3’方向,框架gRNA表示未经本发明的A/G混合捕获序列修饰的框架gRNA,例如,其不含5’Spacer序列的部分可以选自表1所示的序列去掉3’端polyT序列之后的序列(即,SEQ ID No:10或16-20,但需去掉3’端polyT序列);程序化框架gRNA表示本发明第一方面的程序化框架gRNA。
在式II中,程序化框架gRNA所对应的亲本框架gRNA与框架gRNA可以相同,也可以不同。然而,为避免在使用双gRNA表达盒建库过程中,框架gRNA与程序化框架gRNA之间发生重组,在不影响效率的前提下,程序化框架gRNA所对应的亲本框架gRNA通常与框架gRNA不同。
启动子可以根据研究需要选择,例如,但不限于,Pol III启动子或Pol II启动子等,优选Pol III启动子,更优选U6启动子,最优选人U6启动子。
tRNA可以根据研究需要选择,例如,但不限于人tRNA(Gln)(SEQ ID No:14)或水稻tRNA(Gly)(SEQ ID No:15)。
在一个实施方案中,启动子之后的框架gRNA也可以是本发明第一方面的程序化框架gRNA去掉3’端polyT的序列。考虑到当双gRNA表达盒中存在两个程序化框架gRNA时,与仅包含一个程序化框架gRNA的双gRNA表达盒相比,这种表达盒的序列变得更长,在构建gRNA表达载体的过程中容易引入重组,仅包含一个程序化框架gRNA的双gRNA表达盒即可实现CRISPR筛选后建库测序gRNA转录本的目的。
在一个优选的实施方案中,启动子为U6启动子,即,所述双gRNA表达盒的结构如式II’所示:
Figure BDA0002503029290000101
其中从左至右为5’至3’方向,U6表示U6启动子,框架gRNA表示未经本发明的A/G混合捕获序列修饰的框架gRNA,例如,其不含5’Spacer序列的部分可以选自表1所示的序列去掉3’端polyT序列之后的序列(即,SEQ ID No:10或16-20,但需去掉3’端polyT序列);程序化框架gRNA表示本发明第一方面的程序化框架gRNA。U6启动子优选为人U6启动子。
tRNA可以根据研究需要选择,例如,但不限于人tRNA(Gln)(SEQ ID No:14)或水稻tRNA(Gly)(SEQ ID No:15)。
在式II’中,程序化框架gRNA所对应的亲本框架gRNA与框架gRNA可以相同,也可以不同。然而,为避免在使用双gRNA表达盒建库过程中,框架gRNA与程序化框架gRNA之间发生重组,在不影响效率的前提下,程序化框架gRNA所对应的亲本框架gRNA通常与框架gRNA不同。
在一个实施方案中,所述双gRNA表达盒不含启动子的序列可以如下所示(以8A8G作为程序化框架gRNA中的A/G混合捕获序列为例):
Figure BDA0002503029290000111
其中5’端下划线的序列是不含A/G混合捕获序列的框架gRNA(其中nnnnnnnnnnnnnnnnnnnn表示spacer序列,其通常为20个核苷酸长,与靶基因互补,spacer序列根据研究目的而变化,因此此处用nnnnnnnnnnnnnnnnnnnn示意性表示spacer序列,spacer序列之后是表1中框架gRNA变种1(opt)去掉3’端TTTTTTT后的序列);tRNA序列是人tRNA(Gln)(SEQ ID No:14)(以方框框出);tRNA的3’末端紧接着一个程序化框架gRNA(以斜体表示),其中在Tail中插入SEQ ID No:1所示的A/G混合捕获序列(即,表3中RNaseMRP(8A8G-T2)对应的程序化框架gRNA(未显示5’端Spacer序列))。
在一个实施方案中,本发明还提供包含本发明第三方面的双gRNA表达盒的载体,例如,包含本发明第三方面的双gRNA表达盒的表达载体。
在一个实施方案中,本发明还提供包含本发明第三方面的双gRNA表达盒的细胞。在另一个实施方案中,本发明还提供包含含有本发明第三方面的双gRNA表达盒的载体的细胞。
本发明中提供的双gRNA表达盒最大的优势在于使用程序化框架gRNA代替了原框架gRNA,使用此设计可以同时进行多个基因的编辑,并且保持了原有框架gRNA的基因编辑效率。此外,多个基因的gRNA转录本可以被直接polydT引物直接补获,这样仅通过一次RNA-seq实验,就可以将转录组、基因型(gRNA)、表型联系在一起,大大提高了实验效率。
与10x Genomics公司发布的具有相同目的的单细胞3'RNA-seq试剂盒相比,10xGenomics公司设计的两个捕获序列(CS1、CS2)依赖于特殊的RT引物,与其他单细胞RNA-seq平台不兼容,仅适用于10×Genomics平台,并且捕获效率较本发明的技术方案差,原因是其特殊的RT引物可能会引物非特异性扩增,导致gRNA文库中包含其他非特异性序列,本发明人引入的A/G混合捕获序列及tRNA特异性引物提高了反应的特异性,解决了上述的非特异性捕获问题。
现有技术中还有一些不同方法旨在生成聚合酶II(Pol II)转录的gRNA拷贝或与gRNA相关的条形码,这些条形码将被聚腺苷酸化,然后在逆转录(RT)过程中与内源性mRNA一起被捕获(Dixit,A.et al.Perturb-Seq:Dissecting Molecular Circuits withScalable Single-Cell RNA Profiling of Pooled Genetic Screens.Cell 167,1853-1866e1817,doi:10.1016/j.cell.2016.11.038(2016);Jaitin,D.A.et al.DissectingImmune Circuits by Linking CRISPR-Pooled Screens with Single-Cell RNA-Seq.Cell 167,1883-1896e1815,doi:10.1016/j.cell.2016.11.039(2016);Datlinger,P.et al.Pooled CRISPR screening with single-cell transcriptome readout.NatMethods 14,297-301,doi:10.1038/nmeth.4177(2017);Adamson,B.et al.A MultiplexedSingle-Cell CRISPR Screening Platform Enables Systematic Dissection of theUnfolded Protein Response.Cell 167,1867-1882e1821,doi:10.1016/j.cell.2016.11.048(2016))。因此,基因型、转录组和表型可以在单个细胞分辨率下链接在一起。然而,大多数方法都涉及到复杂的克隆策略,有时还会发生gRNA barcode解偶联即sgRNA序列与barcode序列会发生重组,破坏原有的对应关系。CROP-seq技术解决了上述的解偶联问题,CROP-seq在病毒整合过程中产生了多腺苷酸化的gRNA,并且没有发生解偶联,但是,插入序列的大小限制了其在多基因gRNA组合筛选中应用。
在第四方面,本发明提供构建程序化RNA框架的方法,所述方法包括:在亲本框架gRNA的Tetraloop、Loop2或Tail位置中的任一个中引入腺嘌呤/鸟嘌呤(A/G)混合捕获序列修饰。其中,所述亲本框架gRNA为没有进行所述修饰的框架gRNA,其可以为野生型(WT)框架gRNA或其常见变种(例如,表1所示的序列,其中未显示5’端Spacer序列);所述腺嘌呤/鸟嘌呤(A/G)混合捕获序列为包含腺嘌呤和鸟嘌呤的捕获序列,其可以选自SEQ ID No:1-9,但不限于此;所述修饰为替换或插入,具体地,在Tetraloop和Loop2中的修饰为替换,即,用A/G混合捕获序列替换Tetraloop或Loop2,在Tail中的修饰为插入,即,在Tail中插入A/G混合捕获序列,更具体地,在Tail的polyT之前插入腺嘌呤/鸟嘌呤(A/G)混合捕获序列。
在一个实施方案中,在引入A/G混合捕获序列时,还包括引入合适的接头序列。换言之,A/G混合捕获序列的5’端和/或3’端可以带有接头序列。基于本发明第一方面的教导和示例性的接头序列,本领域技术能够选择合适的接头序列。
本发明在亲本框架gRNA中引入A/G混合捕获序列构成本发明的程序化框架gRNA所使用的构建方法可以为常规分子克隆方法,例如,可以包括酶切、连接、转化等常规技术。另外,本发明的程序化框架gRNA也可以通过合成法制备。
在第五方面,本发明提供构建包含程序化框架gRNA的gRNA表达盒的方法,所述方法包括在启动子3’末端与程序化框架gRNA的5’末端(更具体地,为spacer序列的5’末端)之间添加tRNA。所述包含程序化框架gRNA的gRNA表达盒具有式I或式I’所示的结构。
启动子可以根据研究需要选择,例如,但不限于,Pol III启动子或Pol II启动子等,优选Pol III启动子,更优选U6启动子,最优选人U6启动子。
tRNA可以根据研究需要选择,例如,但不限于人tRNA(Gln)(SEQ ID No:14)或水稻tRNA(Gly)(SEQ ID No:15)。
程序化框架gRNA为本发明第一方面所述的程序化框架gRNA。
构建包含程序化框架gRNA的gRNA表达盒的方法可以利用常规分子克隆方法,例如,可以包括酶切、连接、转化等常规技术,也可以利用合成法。
在第六方面,本发明提供构建包含程序化框架gRNA的双gRNA表达盒的方法,所述方法包括在启动子3’末端添加框架gRNA,在框架gRNA3’末端与程序化框架gRNA的5’末端(更具体地,为spacer序列的5’末端)之间添加tRNA。所述包含程序化框架gRNA的双gRNA表达盒具有式II或式II’所示的结构。
其中,框架gRNA表示未经本发明的A/G混合捕获序列修饰的框架gRNA,例如,其不含5’Spacer序列的部分可以选自表1所示的序列去掉3’端polyT序列之后的序列(即,SEQID No:10或16-20,但需去掉3’端polyT序列);程序化框架gRNA表示本发明第一方面的程序化框架gRNA。
在式II或式II’中,程序化框架gRNA所对应的亲本框架gRNA与框架gRNA可以相同,也可以不同。然而,为避免在使用双gRNA表达盒建库过程中,框架gRNA与程序化框架gRNA之间发生重组,在不影响效率的前提下,程序化框架gRNA所对应的亲本框架gRNA通常与框架gRNA不同。
启动子可以根据研究需要选择,例如,但不限于,Pol III启动子或Pol II启动子等,优选Pol III启动子,更优选U6启动子,最优选人U6启动子。
tRNA可以根据研究需要选择,例如,但不限于人tRNA(Gln)(SEQ ID No:14)或水稻tRNA(Gly)(SEQ ID No:15)。
在第七方面,本发明提供使用程序化框架gRNA进行CRISPR筛选的方法,所述方法包括使用本发明的程序化框架gRNA代替亲本框架gRNA进行CRISPR筛选。并且,也可以使用包含本发明的程序化框架gRNA的gRNA表达盒或双gRNA表达盒代替亲本框架gRNA进行CRISPR筛选。
在一个优选的实施方案中,本发明使用程序化框架gRNA进行CRISPR筛选的方法包括下述步骤:
a)合成gRNA文库:gRNA文库通常可以从商业化平台订购;b)构建gRNA表达载体文库:将步骤a)中合成的gRNA文库连接到gRNA表达载体中,得到质粒文库。gRNA表达载体需要包含分子克隆必要的元件,如抗性基因、多克隆位点、慢病毒复制需要的LTR区域(Longterminal repeat)、gRNA表达所需的pol III启动子(如U6启动子)等。同时,为了能够对CRISPR后的样品进行单细胞RNA-seq,在启动子的3’端与spacer序列的5’端之间必须包含一个可以在RNA水平上被剪切掉的固定序列,如tRNA序列;
c)构建慢病毒库:将步骤b)中构建的含有程序化框架gRNA的表达载体文库进行慢病毒包装,并测定病毒滴度MOI;
d)CRISPR筛选得到细胞群:将步骤c)得到的慢病毒库,以MOI≤0.3感染目的细胞(MOI≤0.3即保证一个病毒进入一个细胞),经过相应的筛选策略筛选后收集存活细胞,所收集的细胞群用于构建高通量测序文库。
在一个实施方案中,步骤d)中得到的细胞群能够直接用于RNA-seq建库测序。换言之,使用本发明添加A/G混合捕获序列的程序化框架gRNA可以直接用于RNA-seq文库的构建,其gRNA转录本可以直接被polyT捕获,不需要依赖专门的测序平台(例如,10×Genomics平台需要使用他们特有的CS1/CS2序列扩增才能测序gRNA转录本)。关于RNA-seq建库方法可以使用illumina TruseqRNA建库,利用Tn5转座酶建库等。
在一个实施方案中,在构建gRNA表达载体文库时,在启动子的3’末端与本发明的程序化框架gRNA的5’末端(更具体地,为spacer序列的5’末端)之间添加tRNA序列(即,构建本发明第二方面所述的gRNA表达盒),所得到的gRNA表达载体文库可以直接用于基与mRNA建库测序的试剂盒。
使用本发明的程序化框架gRNA,通过RNA-seq即可同时获得内源转录组信息、gRNA转录本。否则需要单独构建基于内源mRNA的RNA-seq文库及单独检测gRNA的文库(即,构建2个测序文库)。10×Genomics平台的试剂盒可以达到与本发明相同的目的,但是经过检测,本发明使用tRNA特异性引物进行特异性扩增,可以有更高效率的富集gRNA。
构建gRNA表达载体文库所用的表达载体可以根据研究需要进行选择,所述表达载体包含Pol III启动子,例如,U6启动子或H1启动子,优选U6启动子,更优选人U6启动子。
通常,gRNA可以被Pol II启动子或者Pol III启动子转录。然而,经Pol II启动子转录的转录本会进入真核mRNA加工流程,譬如5’capping、3’Tailing、RNA修饰等转录后加工流程。这些转录后加工会影响gRNA作用为guide RNA的性质,例如,导致gRNA离开细胞核进入细胞质而不能进行基因组编辑。因此,通常采用Pol III启动子转录gRNA。用于本发明的Pol III启动子可以是U6启动子或H1启动子,优选U6启动子,更优选人U6启动子。
其中在步骤b)中构建的gRNA表达载体中,表达载体可以包含式I’所示的gRNA表达盒,其中在U6启动子3’末端与程序化框架gRNA的5’末端(更具体地,为spacer序列的5’末端)之间添加tRNA:
Figure BDA0002503029290000161
其中从左至右为5’至3’方向,U6表示U6启动子,程序化框架gRNA表示本发明第一方面的程序化框架gRNA。tRNA可以根据研究需要选择,例如,但不限于人tRNA(Gln)(SEQ IDNo:14)或水稻tRNA(Gly)(SEQ ID No:15)。U6启动子优选为人U6启动子。
在步骤b)中构建的gRNA表达载体中,表达载体也可以包含式II’所示的双gRNA表达盒:
Figure BDA0002503029290000162
其中从左至右为5’至3’方向,U6表示U6启动子,框架gRNA表示未经本发明的A/G混合捕获序列修饰的框架gRNA,例如,其不含5’Spacer序列的部分可以选自表1所示的序列去掉3’端polyT序列之后的序列(即,SEQ ID No:10或16-20,但需去掉3’端polyT序列);程序化框架gRNA表示本发明第一方面的程序化框架gRNA。tRNA可以根据研究需要选择,例如,但不限于人tRNA(Gln)(SEQ ID No:14)或水稻tRNA(Gly)(SEQ ID No:15)。U6启动子优选为人U6启动子。
本发明在gRNA表达载体中引入tRNA,不仅可以提高gRNA的表达效果,而且可以用于串联表达多个gRNA的系统。但最重要的是在RNA-seq建库中可以为特异性富集gRNA的转录本提供特异性引物结合位点(即,上游扩增引物可以根据tRNA序列设计,下游扩增引物由于A/G混合捕获序列的引入可以直接使用polydT)。重要的是,tRNA必须位于U6启动子的3’末端和程序化框架gRNA的5’末端之间。因为这段序列在单细胞RNA-seq的建库过程中需要用到。我们用这段序列作为特异性的引物结合位点,大大提高了在每个细胞中找到gRNA序列的几率。这是我们的数据优于10×Genomics公司的数据的最重要的原因。tRNA的引入并结合本发明的程序化框架gRNA,使得我们可以做多个gRNA CRISPR文库筛选后的单细胞测序。这是现有的技术方案做不到的。具体而言,一方面,本发明的程序化框架gRNA携带A/G混合捕获序列,gRNA转录本可以与poly(dT)互补,从而被捕获,没有此类型的A/G捕获序列,仅通过一次RNA-seq是无法获得gRNA转录本信息的。另一方面,由于gRNA表达量相比于内源mRNA偏低,直接用来建库可能检测不到(测序平台的局限,仅测到表达高的mRNA),根据载体上的tRNA序列设计扩增引物,我们可以特异性的进行gRNA转录本的富集,避免了非gRNA序列的非特异性富集。10×Genomics的CS1/CS2可以进行gRNA转录本的扩增,但是它的引物不够特异,可能会扩增内源的其他转录本,从而降低了gRNA转录本的产出,导致测序测不到相应的gRNA转录本。
gRNA表达载体的构建方法为酶切、连接等常规分子克隆方法,所用的表达载体可以商购获得,所需的连接序列、tRNA序列等可以合成获得,例如,由通用生物公司合成。
步骤b)中构建用于筛选的gRNA表达载体文库的方法可以是通过Golden gate方法构建。本领域技术人员应该理解,不同实验所用的筛选文库内容不同,可根据具体实验要求设计,例如,可参考张峰博士研究的文库,主要是针对基因组设计多种gRNA(http:// sanjanalab.org/lib.html)。
步骤c)中构建慢病毒库(涉及慢病毒包装以及病毒转染等)按照本领域常规方法进行,例如,可参考Tiscornia G,Singer O,Verma I M.Production and purification oflentiviral vectors[J].Nature Protocols,2006,1(1):241-245,或Kutner R H,Zhang XY,Reiser J.Production,concentration and titration of pseudotyped HIV-1-basedlentiviral vectors[J].Nature Protocols,2009,4(4):495-505等。
步骤d)中,对步骤c)得到的包含用于筛选的gRNA表达载体文库的慢病毒库进行筛选,筛选策略的选择通常取决于研究需要,例如,筛选策略可以是药杀筛选。本发明的实施例中的筛选涉及两种方法,第一种是先使用嘌呤霉素初步筛选去除未感染病毒的细胞,再使用NK细胞杀伤感染文库病毒之后的细胞,收集NK杀伤后存活细胞进行建库测序;第二种是先使用嘌呤霉素及杀稻瘟菌素筛选去除未感染文库细胞,存活细胞使用相应激活剂激活后进行建库分析。本领域技术人员应该理解,筛选慢病毒库的方法并不限于上述方法,可以根据研究需要而选择合适的筛选策略,这在本领域技术人员的能力范围内。
在第八方面,本发明提供一种单细胞测序建库的方法,所述方法包括:(1)使用程序化框架gRNA进行CRISPR筛选得到细胞群;以及(2)由所述细胞群构建单细胞测序用的文库。
使用程序化框架gRNA进行CRISPR筛选得到的细胞群即为本发明第七方面的方法步骤d)得到的细胞群。
在一个实施方案中,使用程序化框架gRNA进行CRISPR筛选可以使用本发明第二方面的gRNA表达盒或本发明第三方面的双gRNA表达盒代替亲本框架gRNA进行。
本领域技术人员知晓,单细胞测序建库的方法有多种,例如,但不限于,SMART-seq2(2013),CEL-seq(2012),SCRB-seq(2014),Drop-seq(2015),In-Drop(2015),10×Genomics等,并且也有可商购的试剂盒,本领域技术人员可以根据实际需要选择合适的建库方法或试剂盒对使用程序化框架gRNA进行CRISPR筛选得到的细胞群建立单细胞测序用的文库。
在一个实施方案中,以RNA-seq建库为例:
1)分别收集用本发明的程序化框架gRNA进行CRISPR筛选之前和之后的细胞并提取RNA;
2)RNA分为两部分:
①以polydT-TSO引物进行mRNA逆转录(polydT-TSO引物序列为:AAGCAGTGGTATCAACGCAGAGTACTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT,其中TSO引物(AAGCAGTGGTATCAACGCAGAGTACGGG)在polydT的5’端,在逆转录酶的存在下,反转录得到的cDNA的3’端连接上TSO序列),然后将逆转录产物以TSO引物进行预扩增,随后用于建库(例如,参见Picelli S,Faridani O R,Bjorklund A K,et al.Full-length RNA-seq fromsingle cells using Smart-seq2[J].Nature Protocols,2014,9(1):171-181.);
②另一部分RNA用于gRNA文库构建,首先以polydT-TSO引物逆转录,由于gRNA转录本相比内源mRNA表达量低,可以采用根据tRNA设计的正向引物与TSO引物进行gRNA富集后在建库;
3)采用TruePrep DNA文库制备试剂盒V2(Vazyme#TD503)进行对步骤2)中的产物进行建库。
在转录组测序文库(RNA-seq)构建过程中,一般采用poly(dT)作为逆转录引物获得cDNA文库,此时,若框架gRNA上没有A/G混合序列,则gRNA转录本无法被获取,原因是gRNA多为PolyIII转录,无腺苷酸尾(Poly A尾),则polydT无法结合。使用本发明的程序化框架gRNA可以解决这个问题:本发明的程序化框架gRNA携带有A/G混合捕获序列,gRNA转录本可以与poly(dT)互补,从而被捕获,同时由于gRNA表达量相比于内源mRNA偏低,直接用来建库可能检测不到(测序平台的局限,仅测到表达高的mRNA),根据载体上的tRNA序列设计扩增引物,我们可以特异性的进行gRNA转录本的富集,避免了非gRNA序列的非特异性富集。
在另一个实施方案中,以10×Genomics平台为例:
1)使用Chromium单细胞3’试剂盒v3(PN-1000075)、Chromium单细胞B芯片试剂盒(PN-1000153)、Chromium i7 Multiplex试剂盒(PN-120262)制备测序文库,直到完成cDNA预扩增步骤;
2)将扩增得到的cDNA等分为两个40uL,其中一份样品按照上述10x试剂盒操作步骤进行:0.6×磁珠筛选后产物制备mRNA库,0.6×-1.2×双端筛选的产物制备index gRNA文库I;另一份等分样品先通过1.2x AMPure微珠纯化,然后用于制备另一个index gRNA文库(即,index gRNA文库II)。为了制备上述index gRNA文库I和II,采用巢式PCR富集gRNA扩增子,然后并入测序接头(单细胞测序方法:10x及C1系统步骤可以参照实施例3的iv和v)。本发明中引入的tRNA序列可以作为巢式PCR引物设计的来源,并且提供结合位点,用于gRNA转录本的扩增富集。
本发明中index gRNA文库的构建过程中采用tRNA特异性引物(tRNA_Read2)及P5_read1进行gRNA富集,随后用于建库。相比于10x平台的gRNA富集引物,采用本发明中tRNA_Read2及P5_read1可以更高效且特异的扩增gRNA转录本,减少了内源非特异性扩增,提高了gRNA文库的质量。这一步骤大大提高了gRNA转录本的检出效率。即使在10x自己的平台上,效率也要好于10x的原生系统,同时本方法不仅局限在使用10x测序平台,可适用于其他平台如C1等。
本发明中index gRNA文库有I和II两种方案,区别在于是否经过磁珠筛选,10x平台gRNA建库方案跟index gRNA I过程相同,都需经过筛选富集,但我们使用的根据tRNA设计的特异性富集引物较TSO引物富集效果更好。
在第九方面,本发明还提供一种用于单细胞测序的文库,所述文库由使用程序化框架gRNA进行CRISPR筛选得到的细胞群构建。
在第十方面,本发明提供第一方面的程序化框架gRNA在CRISPR筛选中的用途,筛选得到的细胞群可以用于构建单细胞测序用的文库。
本发明还提供第二方面的gRNA表达盒在CRISPR筛选中的用途,筛选得到的细胞群可以用于构建单细胞测序用的文库。
本发明还提供第三方面的双gRNA表达盒在CRISPR筛选中的用途,筛选得到的细胞群可以用于构建单细胞测序用的文库。
使用本发明的程序化框架gRNA、gRNA表达盒或双gRNA表达盒进行CRISPR筛选,筛选得到的细胞群尤其适用于构建用于单细胞测序的文库,适用于多种测序平台,并且由于tRNA的引入,能够特异性的进行gRNA转录本的富集,避免了非gRNA序列的非特异性富集。具体地,对于程序化框架gRNA而言,用一段混合的腺嘌呤/鸟嘌呤序列分别修饰亲本框架gRNA的三个不同位置(即,替换Tetraloop或Loop2,在Tail的polyT前插入),既不影响CRISPR/Cas9和CRISPRa系统的性能。同时,在高通量测序过程中,带有A/G混合捕获序列的gRNA转录本及内源性mRNA可以同时被poly(dT)有效捕获,可在表型已知的单细胞分辨率下鉴定基因组扰动后的基因表达谱以及基因型。于gRNA表达盒而言,将tRNA与程序化框架gRNA结合使用,一方面为gRNA富集提供了特异性的引物结合位点(可以根据tRNA设计),另一方面使用程序化框架gRNA可以直接捕获gRNA转录本(只有含有A/G混合捕获序列的程序化框架gRNA可以被polydT引物直接逆转录),解决了现框架gRNA转录本无法被polydT直接逆转捕获及无法特异性富集转录本的问题。于双gRNA表达盒而言,除上述gRNA表达盒的优势之外,可以同时进行多个基因的扰动,在单细胞分辨率下检测多基因扰动后,表型、基因型与基因表达谱之间的联系。
通过结合附图和下述实施例,本领域技术人员将更清楚地了解本发明的优点。
附图说明
图1显示常规框架gRNA(即,亲本框架gRNA)和本发明构建的程序化框架gRNA的结构示意图。
a显示常规框架gRNA(即,亲本框架gRNA)的结构示意图,其中显示了Tetraloop、Loop2和Tail结构;
b显示将Tetraloop替换为8A8G捕获序列(即,右上角的环)得到的程序化框架gRNA的结构示意图;
c显示将Loop2中替换为8A8G捕获序列(即,右侧第二个环)得到的程序化框架gRNA的结构示意图;
d显示在Tail中polyT之前插入8A8G捕获序列(即,右侧最下端的Tail(8A8G)所示的部分)得到的程序化框架gRNA的结构示意图;
e显示本领域现有的框架gRNA的详细结构示意图,图中示出了各部分的结构。
图2显示程序化框架gRNA的编辑效率。
a显示在亲本框架gRNA(WT)中引入30A和8A8G捕获序列后的相对CRISPR敲除效率,其中将亲本框架gRNA(WT)的CRISPR敲除效率设为1;
b显示使用Tail-8A8G框架对CXCR4、VEGFA和DMD进行的相对CRISPR敲除效率,其中8A8G捕获序列插入在这三种框架的Tail位置;
c显示通过RT-qPCR检测的A/G混合捕获序列在逆转录中的捕获效率,检测了30A和8A8G变体框架在Tail、Tetraloop和Loop2位置的情况,捕获效率针对亲本框架gRNA(WT)标准化;
d显示检测6个已知的VEGFA gRNA脱靶位点的脱靶效率。在检查的所有位点上,无论引入的位置如何,引入A/G混合捕获序列均不会增加脱靶率。
图3显示靶向不同基因验证CRISPR激活效果,使用RT-qPCR检测基因表达激活倍数(a),并且证明程序化框架gRNA可以应用于多基因扰动CRISPR系统(b)。
a显示在不同的靶向位点上使用程序化框架gRNA(Tail-8A8G)与使用亲本框架gRNA(WT)对基因表达激活倍数相当;
b显示使用单个基因激活表达盒(single gRNA)与使用多基因激活表达盒(multiplexed gRNA)对基因的激活表达效果相当。
图4显示在不同的单细胞RNA测序平台应用程序化框架gRNA的工作流程。
a显示使用10x单细胞3'试剂盒的测序方案;
b显示使用10x单细胞5'试剂盒的测序方案;
c显示使用SMART-seq/C1的测序方案。
图5显示程序化框架gRNA在单细胞CRISPR筛选中的作用。
a显示掺入tRNA的在Tail、Tetraloop或Loop2中引入A/G混合捕获序列的程序化框架gRNA编辑效率;
b显示收集CRISPR筛选后的细胞群并使用10x 3'单细胞RNA-seq试剂盒进行单细胞RNA测序的流程。
图6显示使用Fluidigm C1平台进行了小规模的演示的结果。
图7显示本发明引入A/G混合捕获序列(即,SEQ ID No:1-9)的程序化框架gRNA的基因编辑效果,(A)以引入8A8G(SEQ ID No:1)的程序化框架gRNA的基因敲除效率为1,将引入其他A/G混合捕获序列的程序化框架gRNA的基因敲除效率标准化;(B)本发明引入A/G混合捕获序列的程序化框架gRNA的基因敲除效率数据。其中A/G混合捕获序列插入在Tail的polyT之前。
图8显示使用本发明的程序化框架gRNA进行CRISPR筛选和单细胞测序的流程示意图。
图9显示亲本框架gRNA(A)、用8A8G(SEQ ID No:1)分别修饰Tetraloop(B)、Loop2(C)和Tail(D)构建的程序性框架gRNA的核苷酸序列,其中5’端Spacer序列未显示。
具体实施方式
本领域技术人员应该理解,本发明不限于本文中描述的特定方法学、实施方案和试剂,因为这些是示例性说明。还应理解本文中使用的术语仅为了描述具体实施方案,而并不意图限制本发明的范围,本发明的范围仅由所附权利要求书限定。
除非另外定义,本文中使用的所有技术和科学术语与本发明所属领域中普通技术人员通常的理解具有相同的含义。
此外,除非上下文另有要求,单数形式的术语应包括复数形式,复数形式的术语应包括单数形式。更具体地,如在本说明书和所附权利要求中所使用的,除非上下文另外明确指出,否则单数形式“一种”和“这种”包括复数指示物。
定义
为了更好地理解本发明,相关术语的定义和解释提供如下。
术语CRISPR(Clustered regularly interspaced short palindromic repeats)是原核生物基因组内的一段重复序列,是生命进化历史上,细菌和病毒进行斗争产生的免疫武器,简言之,感染病毒时,病毒能将其基因整合到细菌基因组上,并利用细菌的细胞工具为其基因复制服务,然而,细菌为了将病毒的外来入侵基因清除,进化出CRISPR-Cas9系统,利用这个系统,细菌可以不动声色地把整合的病毒基因从自己的染色体上切除,这是细菌特有的免疫系统。CRISPR技术是在20世纪90年代初发现的,之后随着研究的渗入,迅速成为人类生物学、农业和微生物学等领域最流行的基因编辑工具。
一般而言,“CRISPR系统”统称为转录物和涉及CRISPR相关(“Cas”)基因的表达或指导其活性的其他元件。在一些实施例中,CRISPR系统的一个或多个元件来源于I型、II型、或III型CRISPR系统。在一些实施方案中,CRISPR系统的一个或多个元件来源于包含内源CRISPR系统的特殊生物,如化脓链球菌。一般而言,CRISPR系统的特征为促进在靶序列的位点处的CRISPR复合物(在内源CRISPR系统的背景下也称为前间区)的形成的元件。在CRISPR复合物形成的背景下,“靶序列”是指指导序列被设计为对其具有互补性的序列,其中在靶序列与指导序列之间的杂交促进CRISPR复合物的形成。完全互补性不是必需的,条件是存在足够互补性以引起杂交并且促进一种CRISPR复合物的形成。一个靶序列可以包含任何多核苷酸,如DNA或RNA多核苷酸。在一些实施例中,靶序列位于细胞的细胞核或细胞质中。在一些实施例中,该靶序列可位于真核细胞的一个细胞器例如线粒体或叶绿体内。可被用于重组到包括该靶序列的靶基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在本发明中,外源的模板多核苷酸可被称为编辑模板。在本发明的一个方面,该重组是同源重组。
在CRISPR领域早期,gRNA的功能是由crRNA和tracrRNA两条序列协同实现的,后来经过改造,把crRNA和tracrRNA连在了一起,形成了整合的gRNA。
用于本文时,“程序化框架gRNA”是一种特殊的RNA序列,在一级序列上,框架gRNA5’端的20个核苷酸序列称为spacer序列,用于识别基因组中互补的目标序列并与之结合。spacer序列代表gRNA的特异性,在gRNA文库中,通常只有代表了gRNA特异性的spacer序列在文库中每条序列之间都是不同的。这20个核苷酸的spacer序列与下游的几十个核苷酸一起,在二级结构上形成一些特殊的结构,与核酸酶(如Cas9)结合,将Cas核酸酶引导至目的序列进行基因编辑。这些二级序列包括Repeat、anti-repeat、Tetraloop、Loop2等。框架gRNA的结构示意图见图1a和图1e。
用于本发明时,术语“程序化框架gRNA”是指在原框架gRNA的基础上,在三个不同位置(即,Tetraloop、Loop2、Tail)引入(例如,替换或插入)A/G混合捕获序列而构建的框架gRNA,称为“程序化框架gRNA”。这三个位置是非必要的Cas核酸酶结合位点,本发明人首次发现在其中添加A/G捕获序列后的构建的程序化框架gRNA可以用于后续的直接抓取gRNA转录本,其技术效果优于现有技术中对这三个区域改造得到的框架gRNA(例如,10x Genomics公司在框架gRNA的Loop2和Tail区域中插入捕获序列CS1和CS2)。以引入8A8G捕获序列为例,在亲本框架gRNA的Tetraloop、Loop2或Tail引入8A8G捕获序列的结构示意图分别显示在图1b、图1c和图1d中。
实验材料
A:质粒:lentiGuide-puro backbone(Addgene#52963)、lentiCas9-Blast(Addgene#52962)、lentiMPHv2(Addgene#89308)、lenti-dCAS-VP64 Blast(Addgene#61425)、pMD2.G(Addgene#12259)、psPAX2(Addgene#12260);
B:感受态细胞:StbL3;
C:细胞系:HEK293T、K562、Jurkat;
D:试剂耗材:QIAprep SpinMiniprep试剂盒(QIAGEN#27106)、杀稻瘟菌素(blasticidin)、潮霉素、高糖DMEM(SIGMA#D6429)、GlutaMax(Gibco#35050-061)、丙酮酸钠(Gibco#11360-070)、FBS(GEMINI#900-108)、青霉素/链霉素(Gibco#15140-122)、Lipofectamine3000(Invitrogen#L3000-015)、TIANamp基因组DNA试剂盒(TIANGEN#DP304-03)、NEBNext高保真2X PCR Master Mix(NEB#M0541S)、miRNeasy Mini试剂盒(Qiagen#217004)、具有gDNA Eraser的PrimeScript RT试剂盒(TAKARA#RR047A)、SYBR Green PCRMaster Mix(Life Technologies#4309155)、QIAquick核苷酸去除试剂盒(QIAGEN#28306)、用于Illumina的TruePrep DNA文库制备试剂盒V2(Vazyme#TD503)、AMPure XP beads、RPMI-1640、ImmunoCultTM人CD3/CD28 T细胞激活剂(STEMCELL)、CD69(FN50,Biolegend)、Chromium单细胞3’试剂盒v3(PN-1000075)、Chromium单细胞B芯片试剂盒(PN-1000153)、Chromium i7 Multiplex试剂盒(PN-120262)、用于mRNA测序的C1单细胞自动制备IFC(Fluidigm#100-5760);
E:仪器设备:流式细胞(SONY MA900)、荧光定量PCR仪(jena Qtower3G)、制备型超速离心机(Beckman XPN-100)、ProFlexTM PCR系统、Forma CO2培养箱、电热恒温培养箱、热循环仪(Eppendorf)、小型台式离心机、三层组合式振荡培养箱ZQZY-AS8等。
除非特别指明,实施例中所用的试剂、材料或仪器等均可商购得到。
实施例1.程序化gRNA表达载体构建
本发明设计的A/G捕获序列显示在表2中。
表2.本发明设计的A/G捕获序列
名称 SEQ ID No: 序列
8A8G 1 AAAAAAAAGAAAAAAAGAAAAAAAGAAAAA
6A3G 2 AAAAAAGAAGAAGAAGAAGAAGAAGAAGAA
6A4G 3 AAAAAAGAAAGAAAGAAAGAAAGAAAGAAA
6A5G 4 AAAAAAGAAAAGAAAAGAAAAGAAAAGAAA
6A6G 5 AAAAAAGAAAAAGAAAAAGAAAAAGAAAAA
7A6G 6 AAAAAAAGAAAAAGAAAAAGAAAAAGAAAA
8A6G 7 AAAAAAAAGAAAAAGAAAAAGAAAAAGAAA
9A6G 8 AAAAAAAAAGAAAAAGAAAAAGAAAAAGAA
10A6G 9 AAAAAAAAAAGAAAAAGAAAAAGAAAAAGA
Figure BDA0002503029290000281
Figure BDA0002503029290000291
Figure BDA0002503029290000301
Figure BDA0002503029290000311
Figure BDA0002503029290000321
首先,把带有本发明的A/G混合捕获序列的程序化框架gRNA序列(不含5’端Spacer序列)交杭州擎科生物技术有限公司合成,随后将合成的程序化框架gRNA序列克隆到lentiguide-puro载体中(lentiGuide-puro backbone,购自Addgene#52963,载体使用BsmbI及ECoRI进行双酶切,并且回收备用),测序验证。载体构建成功后,使用Golden gate将间隔体序列(spacer sequence)克隆到载体中,再次测序验证,具体步骤如下:
i.用BsmbI及ECoRI将载体lentiguide-puro backbone进行酶切,线性化的质粒待用。其中50μL的酶切反应体系如下:
DNA 1μg
10x Cutsmart缓冲液 5μL
BsmBI 1μL
EcoRI-HF 1μL
不含核酸酶的水 To 50μL
将上述反应体系在37℃反应3h,产物进行2%琼脂糖凝胶电泳并利用胶回收纯化试剂盒回收载体,回收浓度测定完毕后等待连接使用。
ii.将合成的带有A/G捕获序列的框架gRNA序列进行退火反应。
退火反应步骤如下:
a.混合等量的合成的不含5’端Spacer序列的程序化框架gRNA(10uM);根据后续应用计算所需程序化框架gRNA的量,本次体系:
Figure BDA0002503029290000331
其中F和R分别是指合成的不含5’端Spacer序列的程序化框架gRNA的单链:F指代top链,R指代bottom链,F与R互补,可以通过退火形成带有粘性末端的双链序列。
b.将上述退火反应体系在95℃2min;95℃至25℃,每秒降0.1℃,进行梯度退火反应。
iii.磷酸化
反应体系如下:
DNA 10μL步骤ii中产物
T4连接酶缓冲液(10×) 5μL
T4 PNK 1μL
不含核酸酶的水 补足50μL
反应条件:37℃30min;65℃20min。
iv.T4连接
反应体系如下:
Figure BDA0002503029290000341
反应条件:22℃,3h。
v.转化并测序:
采用化转感受态STBL3细胞进行转化。转化按照标准的热激转化法进行,将10μL步骤iv得到的连接产物加入STBL3感受态细胞中,42℃中热激1min,然后加入600μL无抗生素的LB培养基,在37℃130rpm摇床培养1小时,然后2000g离心2min,弃掉大部分上清,用剩余大约60μL上清将细胞沉淀重悬,用来涂板(含氨苄青霉素的固体LB培养基)。
vi.挑取单菌落,加入含氨苄青霉素的液体培养基摇菌培养,进行测序验证。
实施例2.细胞系构建
构建下述细胞系:HEK293T-Cas9、K562-Cas9、Jurkat-Cas9
a.慢病毒包装:按照磷酸钙转染法包装3种不同的慢病毒,目的质粒分别为lentiCas9-Blast(Addgene#52962)、lentiMPHv2(Addgene#89308)和lenti-dCAS-VP64Blast(Addgene#61425,辅助质粒为pMD2.G(Addgene#12259)和psPAX2(Addgene#12260);
b.稳定表达Cas9细胞系构建:将a中包装表达Cas9的慢病毒,按照高中低三个浓度分别转导HEK293T、K562、Jurkat细胞,慢病毒感染细胞48小时后进行药物筛选(杀稻瘟菌素(blastcidin)),构建成功的细胞可以存活,并且经过Western Blot验证可以稳定表达Cas9蛋白,此部分构建细胞用于CRISPR敲除(KO)实验;
c.稳定表达dCas9-MPH细胞系构建:将a中包装表达dCas9及MPH的慢病毒,按照高中低三个浓度分别转导HEK293T、K562、Jurkat细胞,慢病毒感染细胞48小时后进行药物筛选(blastcidin),构建成功的细胞可以存活,并且经过Western Blot验证可以稳定表达dCas9-MPH蛋白,此部分构建细胞用于CRISPRa实验。
实施例3.CRISPR敲除(KO)及CRISPR激活验证实验
i.CRISPR敲除(KO)实验:
将实施例1中构建的带有不同A/G捕获序列的框架gRNA的KO使用质粒转染HEK293T-Cas9细胞(Lipofectamine 3000(Invitrogen#L3000-015)),72小时后使用流式细胞仪分选出mkate2阳性细胞,分选所得细胞进行DNA提取(TIANamp基因组DNA试剂盒(TIANGEN#DP304-03)),PCR,最后送公司测序,获得测序结果使用TIDE工具(http:// tide.nki.nl)进行KO效率计算,最后验证原始框架gRNA引入本发明的A/G混合捕获序列是否会影响KO效果,PCR扩增体系及条件如下所示:
a.扩增体系:
Figure BDA0002503029290000351
Figure BDA0002503029290000361
扩增反应条件:
Figure BDA0002503029290000362
*TM为解链温度,其中EMX1:72℃;DYRK1A:56℃;VEGFA:67℃;DMD:60℃。
b.KO检测使用的引物序列
基因 正向引物 反向引物
EMX1 GGCTTGGCTTTGCTGGGGCTAG GACACGGAGAGCAGCTGGGAG
DMD TCTTTACCACTTCCACAATG GAGAGTAAAGTGATTGGTGG
CXCR4 GCCCTTAGCCCACTACTTCA GTCATCTGCCTCACTGACGT
VEGFA CTTCCCGTTCTCAGCTCCAC GGTTCACAGCCTGAAAATTACCC
ii.CRISPR激活实验
将实施例1中构建的带有不同A/G捕获序列的框架gRNA的CRISPRa使用质粒转染HEK293T-dCas9-MPH细胞(Lipofectamine 3000(Invitrogen#L3000-015)),48小时后使用流式细胞仪分选出mkate2阳性细胞,分选所得细胞进行RNA提取(miRNeasy Mini试剂盒(Qiagen#217004)),使用具有gDNA Eraser的PrimeScript RT试剂盒(PrimeScript RTreagent Kit with gDNA Eraser,TAKARA#RR047A)将200ng RNA进行逆转录反应,随后取2μL cDNA产物进行荧光定量PCR,并使用内参基因ACTB进行标准化,最后计算比较引入不同A/G混合捕获序列的载体与亲本框架gRNA的激活效果。
a.qPCR扩增体系
Figure BDA0002503029290000371
qPCR扩增条件:
Figure BDA0002503029290000372
b.检测引物及序列如下所示:
Figure BDA0002503029290000373
Figure BDA0002503029290000381
iii.不同框架gRNA抓捕效率检测
实验方法参照实施例3-ii。
逆转录所用引物及qPCR扩增引物如下:
Figure BDA0002503029290000382
实施例4.双gRNA表达文库筛选后基于10x平台的scRNA-seq(3’RNA-seq)
I.制备双基因敲除文库及筛选检测
载体采用双gRNA表达盒,将tRNA与程序化框架gRNA结合使用,其中tRNA序列位于框架gRNA与程序化框架gRNA之间(结构如式II’所示)。此设计方案,一方面为gRNA富集提供了特异性的扩增引物结合位点(根据tRNA设计,详见后续10x建库方案),另一方面使用程序化框架gRNA可以直接捕获gRNA转录本(只有含有A/G混合捕获序列的程序化框架gRNA可以被polydT引物直接逆转录)。采用Golden gate等方法将设计合成的筛选文库序列(共计12,472对sgRNA)克隆到双gRNA表达载体中。上述gRNA载体构建完成后获得一个载体混合库,将载体混合库使用商购的Endura电转感受态细胞电转扩增培养并收集菌落,并进行扩大培养,最后抽提质粒,即得到了扩增后的载体混合库,也就是含有双gRNA表达盒的文库。
随后将文库进行慢病毒包装、滴度检测。并且在含8ug/mL聚凝胺(polybrene)的RPMI-1640中以MOI≤0.3感染20×106个Jurkat-Cas9细胞。转导48小时后,通过流式细胞术(Cytoflex,Beckman)检测成功转导细胞中mKate2表达(病毒转导成功后,会在细胞中表达mkate2蛋白,此蛋白为红色荧光,可以使用流式细胞仪检测。)。感染成功后进行为期10天的嘌呤霉素及杀稻瘟菌素筛选。筛选期间,每两天更换浓度为2ug/ml的含有嘌呤霉素(puromycin)和杀稻瘟菌素(blasticidin)的培养基,细胞浓度维持在5×105个/mL。与此同时,通过流式细胞术监测细胞中mKate2的表达,直到mKate2阳性细胞的比例高于95%,这表明嘌呤霉素及杀稻瘟菌素首次筛选结束。首次筛选结束后使用ImmunoCultTM Human CD3/CD28 T Cell Activator(STEMCELL)活化筛选后细胞。以25μl/mL的剂量添加活化剂。刺激24小时后,收集细胞并对其早期激活标记CD69(FN50,Biolegend)染色,并使用FACS(Fusion,BD)分选2×106个CD69阴性(底部25%)细胞群用于后续的单细胞测序建库。
II.10x scRNA-seq(3’RNA-seq)测序文库构建
使用Chromium单细胞3’试剂盒v3(PN-1000075)、Chromium单细胞B芯片试剂盒(PN-1000153)、Chromium i7 Multiplex试剂盒(PN-120262)制备测序文库。详细操作按照Chromium单细胞3′试剂盒v3使用手册(10x Genomics,CG000184),直到完成cDNA预扩增步骤(1st PCR)。
随后,将扩增得到的cDNA等分为两个40uL。其中一份样品按照上述10x试剂盒操作步骤进行:0.6×磁珠筛选后产物制备mRNA库(按照Chromium用户指南制备mRNA库),0.6×-1.2×双端筛选的产物(洗脱于25uL)制备index gRNA文库I。另一份等分样品先通过1.2xAMPure微珠纯化(以25uL洗脱),然后用于制备另一个index gRNA文库(即,index gRNA文库II)。
为了制备上述index gRNA文库I和II,采用巢式PCR富集gRNA扩增子,然后并入测序接头:(1)每个样品都进行了8个PCR反应(2nd PCR)用于gRNA富集,每个反应包括3μL模板,25μL
Figure BDA0002503029290000391
UltraTMII
Figure BDA0002503029290000392
Master Mix(NEB#M0544S),2.5μL tRNA_Read2引物(10uM),2.5μL P5_read1引物(10uM)和50uL的无核酸酶水。PCR扩增条件为:1)98℃,30s;2)14个循环:98℃,10s;60℃,10s;72℃,10s;3)72℃,2min。合并反应后的PCR产物,使用0.7至1.0×磁珠纯化,最后用80μL无核酸酶水洗脱。(2)每个样品总共五个PCR反应(3rd PCR)制备文库。每个反应均包含来自2nd PCR的10uL纯化产物,25μL
Figure BDA0002503029290000401
UltraTMII
Figure BDA0002503029290000402
Master Mix,2.5μL P7_Read2_Index1(或index2)引物(10uM),2.5μL P5_read1引物(10uM)和50uL无核酸酶水。PCR扩增条件为:1)98℃,30s,2)5个循环:98℃,10s;54℃,15s;65℃,20s,3)72℃,2min。最后,通过0.7至1.0×磁珠双端筛选纯化所得到的index gRNA文库,并将其用于测序。详细的引物如下:
Figure BDA0002503029290000403
其中下划线的序列表示一段Read序列,是建库过程中引物结合的同源序列,用于结合到预扩增的模板cDNA上进行扩增;方框框出的序列表示建库测序使用的index序列,用于测序后区分并拆分出测序数据。
实施例5.基于Fluidigm C1平台的scRNA-seq
选用人U6启动子、框架gRNA、人tRNA(Gln)和程序化框架gRNA,构建双gRNA表达盒。所述双gRNA表达盒不含启动子的序列可以如下所示(以8A8G作为程序化框架gRNA中的A/G混合捕获序列):
Figure BDA0002503029290000404
Figure BDA0002503029290000411
其中5’端下划线的序列是不含A/G混合捕获序列的框架gRNA(其中nnnnnnnnnnnnnnnnnnnn表示spacer序列,其通常为20个核苷酸长,与靶基因互补,spacer序列根据研究目的而变化,因此此处用nnnnnnnnnnnnnnnnnnnn示意性表示spacer序列,spacer序列之后是表1中框架gRNA变种1(opt)去掉3’端TTTTTTT后的序列);tRNA序列是人tRNA(Gln)(SEQ ID No:14)(以方框框出);tRNA的3’末端紧接着一个程序化框架gRNA(以斜体表示),其中在Tail中插入SEQ ID No:1所示的A/G混合捕获序列(即,表3中RNaseMRP(8A8G-T2)对应的程序化框架gRNA(未显示5’端Spacer序列))。
接着,制备双gRNA筛选文库,构建成功后(构建方法等参照实施例4),进行慢病毒包装、滴度检测,随后在含8ug/mL聚凝胺(polybrene)的RPMI-1640中以MOI≤0.3感染20×106个K562-Cas9细胞。感染成功后进行为期8天的嘌呤霉素及杀稻瘟菌素筛选。筛选期间,每两天更换浓度为2ug/ml的含有嘌呤霉素(puromycin)和杀稻瘟菌素(blasticidin)的培养基,细胞浓度维持在5×105个/mL。与此同时,通过流式细胞术监测细胞中mKate2的表达,直到mKate2阳性细胞的比例高于95%,这表明嘌呤霉素及杀稻瘟菌素首次筛选结束。首次筛选结束后使用NK细胞进行杀伤(过夜),存活细胞继续培养1周,收集存活细胞用于C1平台测序建库。
使用Fluidigm C1单细胞自动制备系统和C1单细胞自动制备IFC制备mRNA序列的单细胞测序文库(Fluidigm#100-5760)。按照C1方案制备细胞。通过QIAquick核苷酸去除试剂盒(QIAGEN#28306)纯化从微流体芯片收集的cDNA。对于每个单独的细胞,通过用于Illumina的TruePrep DNA文库制备试剂盒V2(Vazyme#TD503)将1ng纯化产物用于文库制备。通过使用AMPure XP珠子进行0.7-1.5倍的双面选择来富集最终文库,并在25μL无核酸酶的H2O中洗脱,并将其用于测序。测序结果见表5。
图8显示了使用本发明的程序化框架gRNA进行CRISPR筛选和单细胞测序的流程示意图。
CRISPR筛选后数据解读:使用本发明的程序化框架gRNA进行CRISPR筛选得到的细胞群进行单细胞测序建库(实施例4和5),利用该测序文库,可以仅通过一次RNA-seq实验就可以将转录组、基因型、表型结合起来,解决了现有技术的局限性,优化了实验流程,提高了实验效率。可以这样理解:在CRISPR筛选后所获得的细胞群即代表经过相应筛选后的细胞表型信息,所得到的细胞群用于高通量测序文库的构建,由于程序化框架gRNA的应用,在后续高通量测序的过程中不仅能够检测到gRNA转录本的信息,还能够检测到内源基因转录组的信息,换言之,gRNA转录本信息即对应靶向的基因型信息,内源基因转录组信息即对应此细胞转录组信息。从而实现了仅通过一次RNA-seq实验,就可以在单细胞水平将转录组、基因型及表型信息联系起来的目标。
结果
1.引入A/G混合捕获序列的程序化框架gRNA的编辑效率及捕获效率检测
为了能够使用poly(dT)RT引物直接捕获gRNA转录本,本发明人首先探讨了将30个连续的腺苷(30A)引入到框架gRNA。该30A序列将成为gRNA转录本的一部分,并在逆转录中被poly(dT)引物所捕获。本发明人首先将30A引入到亲本框架gRNA(WT)的三个位置:Tetraloop,Loop2(L2)和Tail。本发明人将亲本框架gRNA(WT)和三种程序化后带有捕获序列(即,30个A,简写为30A,引入30A的位置与策略与8A8G完全相同)的gRNA(Tail-30A,Tetra-30A和L2-30A)转染到HEK293T-Cas9细胞中,并使用在线工具TIDE比较了它们的编辑效率。结果表明,在Tail位置插入30A时,编辑效率下降了24%,而在Tetraloop和Loop2中引入30A(即,用30A替换Tetraloop或Loop2)后,编辑效率分别下降了13%和12%(如图2a)。上述实验结果表明,poly(A)序列(例如,30A)直接引入到框架gRNA中会对编辑效率产生负面影响,尤其是引入在Tail位置负面影响更大。然后,本发明人寻找了可替代30A的捕获序列,这些序列可以最大程度地消除或降低对编辑效率的影响,同时保持poly(dT)引物的可捕获性。本发明人从Tail位置开始优化,因为在此位置添加序列不会干扰框架gRNA折叠,并且在不同应用中更具灵活性。因为在某些情况下,Tetraloop和Loop2通常被RNA适配子占据,以募集其他效应子。例如,CRISPR SAM系统等。本发明人还了解到长的poly(A)延伸可能会影响CRISPR编辑效率,因为poly(A)结合蛋白(PABP)可能会阻碍Cas9/gRNA复合物的正确形成。
本发明人推断理想的捕获序列可以是一个poly(A)与其他核苷酸混合的序列,其中连续的A保证了与poly(dT)引物的互补配对,而非A核苷酸的加入可以防止PABP的干扰。本发明人将鸟嘌呤G添加到poly(A)序列中,并用8A8G(AAAAAAAAGAAAAAAAGAAAAAAAGAAAAA,SEQ ID No:1)等A/G混合捕获序列(表1)替换了原来的30A序列,其中除了前八个连续的腺苷A外,每隔七个腺苷A中都掺入了一个鸟嘌呤G。新的在原有框架gRNA的Tail位置插入8A8G(Tail-8A8G)的突变体,相对于WT(野生型:即,原始未修饰的框架gRNA),编辑效率恢复到94%(见图2a)。然后,本发明人用“8A8G”混合捕获序列分别替换Tetraloop(Tetra-8A8G)和Loop2(L2-8A8G),并注意到该A/G混合捕获序列也恢复了编辑效率(见图2a)。此外,延长Loop2的茎长可以进一步略微提高编辑效率,这可能是由于延长的茎有助于稳定插入A/G混合捕获序列后形成的超大茎环结构。例如,在Loop2位置,当本发明人将Loop的互补区域从4bp延长到10bp时,延伸后的框架gRNA标记效果最好,本发明人推测这可能是由于修饰后的框架gRNA Tm增加到40℃而变得更加稳定,毕竟在大多数体内外实验温度为37℃。
为了测试修饰的框架gRNA是否可以与其他靶向位点很好地结合,本发明人使用Tail-8A8G框架对选自文献的其他三个靶标(CXCR4,VEGFA和DMD)进行了相同的分析。与EMX1相比,野生型框架gRNA的相对编辑效率与EMX1相当,但在不同的目标位点上有所不同(CXCR493.8%,VEGFA 81.6%,DMD 107.3%)(见图2b)。
接下来,本发明人通过RT-qPCR研究了A/G混合捕获序列在逆转录中的捕获效率(见图2c)。结果表明引入8A8G等混合捕获序列的程序化框架gRNA可以被poly(dT)有效捕获,捕获效率与“30A”框架(即,引入30A的框架gRNA)相似。同时,本发明人还检测了已知的VEGFA多个脱靶位点。据报道这些位点的脱靶率各不相同。结果表明,在本发明人检查的所有位点上,无论引入位置如何,引入A/G混合捕获序列均不会增加脱靶率(见图2d)。
总之,上述实验结果表明,引入8A8G等A/G混合捕获序列的程序化框架gRNA转录本可以被反转录poly(dT)引物直接捕获,同时保持CRISPR/Cas9基因组编辑的敲除效率。
2.程序化框架gRNA可与CRISPRa和多基因扰动系统兼容
本发明人测试了程序化框架gRNA(即,引入A/G混合捕获序列后)是否与其他类型的CRISPR扰动兼容。本发明人选择使用CRISPRa SAM系统,其中Tetraloop和Loop2都被MS2适体所占据(用于富集转录激活因子)。首先,本发明人测试了在应用程序化框架gRNA进行CRISPR激活后,靶向基因的表达可以提高多少。其中,A/G混合捕获序列被插入Tail位置的polyT之前(在CRISPR KO系统中已证明其工作良好)。
与敲除测定的结果相似,结果表明,Tail-8A8G可以在不同的靶向位点上将基因表达提高到与野生型SAM系统相当的激活水平(图3a)。考虑到程序化框架gRNA在组合基因扰动中的潜在应用,本发明人还研究了同时激活两个串联gRNA时8A8G框架的性能,如图3b所示,本发明人从同一表达盒中表达的两个多基因gRNA(2个不同的gRNA可以靶向不同的基因并提高基因表达水平)鉴定出相似的激活水平。上述结果表明含有8A8G等A/G混合捕获序列的程序化框架gRNA可与CRISPRa及多基因扰动CRISPR系统兼容。
本实验设计不同的spacer,靶向不同的目的基因。选取多个基因验证能够避免单一基因的偏差(基因表达激活本身存在差异),并且多个位点排除了位点的影响,更能证明使用程序化框架gRNA的基因激活效果与使用亲本框架gRNA无明显差异。
3.引入A/G混合捕获序列的程序性框架gRNA适用于不同单细胞RNA-seq平台
为了建立适用于多种平台的方法,本发明人探索了引入A/G混合捕获序列的程序化框架gRNA与Chromium 10x 3'和5'单细胞RNA-seq试剂盒以及Fluidigm C1平台的兼容性。这些平台涵盖了当前服务于不同通量范围的单细胞RNA测序方法(scRNA-seq)。
对于基于微型液滴的平台(如10x 3'和5'单细胞RNA-seq),来自同一滴细胞样品的转录本共享相同的细胞条形码(CBC),因此,可以从预扩增的cDNA中富集gRNA转录本,并将其作为单独的indexgRNA文库进行测序。来自相同细胞的indexgRNA和内源mRNA可以在后续的数据分析中通过CBC合并。考虑到这个原理,5'试剂盒很容易与本发明的程序化框架兼容。这些间隔子区作为扰动索引(index),位于10x条形码寡核苷酸与框架的可变区之间,因此可以直接从预扩增的cDNA富集(图4)。
然而,使用10x 3'试剂盒的应用程序需要对原始程序进行一些修改,因为没有用于相同目的的引物结合位点。本发明人通过将tRNA序列包含到gRNA表达盒中来解决这个问题。上述测序方案可参考图4。
实际上,在许多先前的研究中已经报道了将tRNA和gRNA结合使用以提高gRNA表达水平或处理来自同一转录本的多基因gRNA。要与10x 3'试剂盒配合使用并用作引物结合区,tRNA应位于U6启动子的下游和gRNA序列的上游。为此,本发明人首先测试了掺入tRNA的引入A/G混合捕获序列的程序化框架gRNA的编辑效率(图5a)。以8A8G(SEQ ID No:1)进行的试验的结果表明,无论在何处(Tail、Tetraloop或Loop2)引入8A8G混合捕获序列,人GlntRNA(SEQ ID No:14)都能保持编辑效率。为了也利用可以处理来自同一转录本的多基因gRNA的tRNA特性,本发明人设计了一个双gRNA表达盒,其中tRNA序列位于框架gRNA与程序化框架gRNA之间,并生成了一个CRISPR文库以使用10x 3'平台证明8A8G程序化框架gRNA的应用(图5b)。由于以前基于条形码的单细胞CRISPR-screen方法在传递多路复用的gRNA时受到限制,所以本发明人使用这个双gRNA表达盒进行单细胞CRISPR筛选来验证本发明技术方案的扩展功能,本发明人收集了CRISPR筛选后的细胞群,并使用10x 3'试剂盒进行了单细胞RNA测序建库以及单细胞测序(图5b)。引入8A8G混合捕获序列的gRNA转录物与腺苷酸化的内源转录物一起被poly(dT)捕获。从indexgRNA文库读取的3500万个测序读数中,有81.1%被映射回了参考序列(表4),而在使用CS2的10x 3'试剂盒中只有37%被成功比对。这可能是由于非特异性的CS2 RT产品(基因组内的其他cDNA非特异性结合扩增)与gRNA转录后的cDNA一起被用于构建文库。本发明人使用本发明的tRNA特异性引物及poly(dT)所得的框架gRNA转录本文库特异性更好,同时再次证明了含有A/G混合捕获序列的程序化框架gRNA可以直接被捕获且适用于10x平台。
表4.在10x平台单细胞测序的捕获效率
Figure BDA0002503029290000461
除了10x 3'scRNA-seq实验外,本发明人还使用Fluidigm C1系统进行了小规模的演示,该系统代表了相对较低的通量应用,并单独表征了细胞转录组,而不是依赖于细胞条形码。在本发明人用Fluidigm C1微流控芯片研究的所有73个细胞中,在93.2%(68个)细胞中成功鉴定出了含有A/G混合捕获序列的gRNA转录本,如图6所示。在图6中,使用在Fluidigm C1平台上进行的单细胞RNA-seq,本发明估测了每个单细胞中gRNA转录本的测序读数。在每个细胞中,将测序读数针对50万(即,0.5million)标准化,在所检测的一半的细胞中能够检测到超过5个gRNA转录本读数。
表5.基于Fluidigm C1平台的单细胞RNA-seq结果
Figure BDA0002503029290000471
Figure BDA0002503029290000481
Figure BDA0002503029290000491
4.含有不同A/G混合捕获序列的程序性框架gRNA的基因编辑效率
为了研究不同A/G混合捕获序列是否会对程序化框架gRNA的基因编辑效率产生影响,本发明人设计研究了9种不同的A/G混合捕获序列(SEQ ID No:1-9),由于潜在的A/G混合捕获序列的组合有多种,无法一一去设计验证,因此仅以图7的9种A/G混合捕获序列作为代表阐述此类A/G混合捕获序列的应用价值。
随后,通过将SEQ ID No:1-9所示的A/G混合捕获序列分别插入Tail的polyT之前,本发明人构建了9种程序化框架gRNA,并进行了基因敲除实验。结果显示在图7中,进一步分析可知,含有不同A/G混合捕获序列的程序化框架gRNA均保持了亲本框架gRNA的基因敲除功能,与亲本框架gRNA相比,基因编辑效果相似,并且含有不同A/G混合捕获序列的程序化框架gRNA对基因的编辑效率无明显差异。上述结果表明,本发明验证的9种A/G混合捕获序列都是适用的,它们代表示例性的A/G混合捕获序列,可能存在多种A/G混合捕获序列可以应用于本发明。
本领域技术人员将进一步认识到,在不脱离其精神或中心特征的情况下,本发明可以以其他具体形式来实施。由于本发明的前述描述仅公开了其示例性实施方案,应该理解的是,其他变化被认为是在本发明的范围内。因此,本发明不限于在此详细描述的特定实施方案。相反,应当参考所附权利要求来指示本发明的范围和内容。
序列表
<110> 西湖大学
<120> 程序化框架gRNA及其应用
<130> IDC206015
<160> 20
<170> PatentIn version 3.5
<210> 1
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> A/G混合捕获序列-8A8G
<400> 1
aaaaaaaaga aaaaaagaaa aaaagaaaaa 30
<210> 2
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> A/G混合捕获序列-6A3G
<400> 2
aaaaaagaag aagaagaaga agaagaagaa 30
<210> 3
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> A/G混合捕获序列-6A4G
<400> 3
aaaaaagaaa gaaagaaaga aagaaagaaa 30
<210> 4
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> A/G混合捕获序列-6A5G
<400> 4
aaaaaagaaa agaaaagaaa agaaaagaaa 30
<210> 5
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> A/G混合捕获序列-6A6G
<400> 5
aaaaaagaaa aagaaaaaga aaaagaaaaa 30
<210> 6
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> A/G混合捕获序列-7A6G
<400> 6
aaaaaaagaa aaagaaaaag aaaaagaaaa 30
<210> 7
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> A/G混合捕获序列-8A6G
<400> 7
aaaaaaaaga aaaagaaaaa gaaaaagaaa 30
<210> 8
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> A/G混合捕获序列-9A6G
<400> 8
aaaaaaaaag aaaaagaaaa agaaaaagaa 30
<210> 9
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> A/G混合捕获序列-10A6G
<400> 9
aaaaaaaaaa gaaaaagaaa aagaaaaaga 30
<210> 10
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 不含5'端Spacer序列的亲本框架gRNA
<400> 10
gtttgagagc tatgctggaa acagcatagc aagttcaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgctttt ttt 93
<210> 11
<211> 123
<212> DNA
<213> 人工序列
<220>
<223> 不含5'端Spacer序列的程序性框架gRNA,其中8A8G替换Tetraloop
<400> 11
gtttgagagc tatgctggcg aaaaaaaaga aaaaaagaaa aaaagaaaaa ccagcatagc 60
aagttcaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt 120
ttt 123
<210> 12
<211> 129
<212> DNA
<213> 人工序列
<220>
<223> 不含5'端Spacer序列的程序性框架gRNA,其中8A8G替换Loop2
<400> 12
gtttgagagc tatgctggaa acagcatagc aagttcaaat aaggctagtc cgttatcaac 60
ttggcccgaa aaaaaagaaa aaaagaaaaa aagaaaaagg ccaagtggca ccgagtcggt 120
gcttttttt 129
<210> 13
<211> 127
<212> DNA
<213> 人工序列
<220>
<223> 不含5'端Spacer序列的程序性框架gRNA,其中8A8G插入Tail的C与T碱基之间
<400> 13
gtttgagagc tatgctggaa acagcatagc aagttcaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgctcgg aaaaaaaaga aaaaaagaaa aaaagaaaaa 120
ttttttt 127
<210> 14
<211> 72
<212> DNA
<213> 人工序列
<220>
<223> 人tRNA(Gln)
<400> 14
ggttccatgg tgtaatggtt agcactctgg actctgaatc cagcgatccg agttcaaatc 60
tcggtggaac ct 72
<210> 15
<211> 77
<212> DNA
<213> 人工序列
<220>
<223> 水稻tRNA(Gly)
<400> 15
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgca 77
<210> 16
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 框架gRNA变种1(opt)(5'端Spacer未包含在内)
<400> 16
gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgctttt ttt 93
<210> 17
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 框架gRNA变种2(opt1)(5'端Spacer未包含在内)
<400> 17
gtttgagagc tatgctggaa acagcatagc aagttcaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgctttt ttt 93
<210> 18
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 框架gRNA变种3(opt2)(5'端Spacer未包含在内)
<400> 18
gtttcagagc tatgctggaa acagcatagc aagttgaaat aaggctagtc cgttatgaac 60
ttgaaaaagt ggcaccgagt cggtgctttt ttt 93
<210> 19
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 框架gRNA变种4(opt3)(5'端Spacer未包含在内)
<400> 19
gtttcagagc tatgctggaa acagcatagc aagttgaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgctttt ttt 93
<210> 20
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 框架gRNA变种5(opt4)(5'端Spacer未包含在内)
<400> 20
gtttcagagc tacagcagaa atgctgtagc aagttgaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgctttt ttt 93

Claims (23)

1.一种程序化框架gRNA,与亲本框架gRNA相比,所述程序化框架gRNA在Tetraloop、Loop2和Tail中的任一结构中引入腺嘌呤/鸟嘌呤(A/G)混合捕获序列修饰,其中所述腺嘌呤/鸟嘌呤(A/G)混合捕获序列选自SEQ ID No:1-9中的任一项。
2.根据权利要求1所述的程序化框架gRNA,其中所述修饰为替换或插入,具体地,在Tetraloop和Loop2中的修饰为替换,即,用A/G混合捕获序列替换Tetraloop或Loop2,在Tail中的修饰为插入,即,在Tail中插入A/G混合捕获序列,更具体地,在Tail的polyT之前插入腺嘌呤/鸟嘌呤(A/G)混合捕获序列。
3.根据权利要求1所述的程序化框架gRNA,其中所述腺嘌呤/鸟嘌呤(A/G)混合捕获序列的5’端和/或3’端带有接头序列。
4.根据权利要求1所述的程序化框架gRNA,其中所述腺嘌呤/鸟嘌呤(A/G)混合捕获序列选自SEQ ID No:1、3或7。
5.一种构建权利要求1-4中任一项所述的程序化框架gRNA的方法,所述方法包括在亲本框架gRNA的Tetraloop、Loop2或Tail的任一个中引入腺嘌呤/鸟嘌呤(A/G)混合捕获序列,其中腺嘌呤/鸟嘌呤(A/G)混合捕获序列选自SEQ ID No:1-9中的任一项。
6.包含权利要求1-4中任一项所述的程序化框架gRNA的载体。
7.一种gRNA表达盒,其在5’至3’方向依次包含启动子、tRNA和程序化框架gRNA,其结构如式I所示,其中在启动子3’末端与程序化框架gRNA的5’末端(更具体地,为spacer序列的5’末端)之间添加tRNA:
Figure FDA0002503029280000021
其中从左至右为5’至3’方向,程序化框架gRNA表示权利要求1-4中任一项所述的程序化框架gRNA。
8.根据权利要求7所述的gRNA表达盒,其中所述启动子为Pol III启动子或Pol II启动子,优选Pol III启动子,更优选U6启动子,最优选人U6启动子。
9.根据权利要求7所述的gRNA表达盒,其中所述tRNA选自人tRNA(Gln)(SEQ ID No:14)或水稻tRNA(Gly)(SEQ ID No:15)。
10.根据权利要求7所述的gRNA表达盒,其中所述启动子为U6启动子,并且所述tRNA选自人tRNA(Gln)(SEQ ID No:14)或水稻tRNA(Gly)(SEQ ID No:15)。
11.包含权利要求7-10中任一项所述的gRNA表达盒的载体。
12.一种双gRNA表达盒,其在5’至3’方向包含启动子、框架gRNA、tRNA和程序化框架RNA,其中tRNA序列位于框架gRNA与程序化框架gRNA之间,所述双gRNA表达盒的结构如式II所示:
Figure FDA0002503029280000022
其中从左至右为5’至3’方向,框架gRNA表示未经A/G混合捕获序列修饰的框架gRNA,程序化框架gRNA表示权利要求1-4中任一项所述的程序化框架gRNA。
13.根据权利要求12所述的双gRNA表达盒,其中所述启动子为Pol III启动子或Pol II启动子,优选Pol III启动子,更优选U6启动子,最优选人U6启动子。
14.根据权利要求12所述的双gRNA表达盒,其中所述tRNA选自人tRNA(Gln)(SEQ IDNo:14)或水稻tRNA(Gly)(SEQ ID No:15)。
15.根据权利要求12所述的双gRNA表达盒,其中所述启动子为U6启动子,并且所述tRNA选自人tRNA(Gln)(SEQ ID No:14)或水稻tRNA(Gly)(SEQ ID No:15)。
16.一种包含权利要求12-15中任一项所述的双gRNA表达盒的载体。
17.一种使用程序化框架gRNA进行CRISPR筛选的方法,所述方法包括使用权利要求1-4中任一项所述的程序化框架gRNA、权利要求7-10中任一项所述的gRNA表达盒或权利要求12-15中任一项所述的双gRNA表达盒代替亲本框架gRNA进行CRISPR筛选。
18.根据权利要求17所述的使用程序化框架gRNA进行CRISPR筛选的方法,其中CRISPR筛选得到的细胞群用于构建单细胞测序用的文库。
19.一种单细胞测序建库的方法,所述方法包括:
(1)通过权利要求17的方法进行CRISPR筛选得到细胞群;以及
(2)由所述细胞群构建单细胞测序用的文库。
20.一种用于单细胞测序的文库,所述文库由通过权利要求17的方法进行CRISPR筛选得到的细胞群构建。
21.包含权利要求1-4中任一项所述的程序化框架gRNA或权利要求6所述的载体的细胞。
22.包含权利要求7-10中任一项所述的gRNA表达盒或权利要求11所述的载体的细胞。
23.包含权利要求12-15中任一项所述的双gRNA表达盒或权利要求16所述的载体的细胞。
CN202010438038.2A 2020-05-21 2020-05-21 程序化框架gRNA及其应用 Active CN111613272B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010438038.2A CN111613272B (zh) 2020-05-21 2020-05-21 程序化框架gRNA及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010438038.2A CN111613272B (zh) 2020-05-21 2020-05-21 程序化框架gRNA及其应用

Publications (2)

Publication Number Publication Date
CN111613272A true CN111613272A (zh) 2020-09-01
CN111613272B CN111613272B (zh) 2023-10-13

Family

ID=72199507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010438038.2A Active CN111613272B (zh) 2020-05-21 2020-05-21 程序化框架gRNA及其应用

Country Status (1)

Country Link
CN (1) CN111613272B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113564197A (zh) * 2021-07-08 2021-10-29 上海师范大学 一种CRISPR/Cas9介导的植物多基因编辑载体的构建方法和应用
WO2022253277A1 (zh) * 2021-06-03 2022-12-08 中国农业大学 Type I-C CRISPR-Cas3系统及其应用

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006069584A2 (en) * 2004-12-29 2006-07-06 Exiqon A/S NOVEL OLIGONUCLEOTIDE COMPOSITIONS AND PROBE SEQUENCES USEFUL FOR DETECTION AND ANALYSIS OF microRNAs AND THEIR TARGET mRNAs
WO2013119770A1 (en) * 2012-02-08 2013-08-15 Dow Agrosciences Llc Data analysis of dna sequences
WO2016081798A1 (en) * 2014-11-20 2016-05-26 Children's Medical Center Corporation Methods relating to the detection of recurrent and non-specific double strand breaks in the genome
CN106637421A (zh) * 2016-10-28 2017-05-10 北京大学 双sgRNA文库的构建及其应用于高通量功能性筛选研究的方法
WO2018051347A1 (en) * 2016-09-14 2018-03-22 Yeda Research And Development Co. Ltd. Crisp-seq, an integrated method for massively parallel single cell rna-seq and crispr pooled screens
CN108103090A (zh) * 2017-12-12 2018-06-01 中山大学附属第医院 靶向RNA甲基化的RNA Cas9-m6A修饰载体系统及其构建方法和应用
WO2018209320A1 (en) * 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
EP3578658A1 (en) * 2018-06-08 2019-12-11 Johann Wolfgang Goethe-Universität Frankfurt Method for generating a gene editing vector with fixed guide rna pairs
WO2020006708A1 (en) * 2018-07-04 2020-01-09 Yale University Compositions and methods for enhancement of homology-directed repair mediated precise gene editing by programming dna repair with a single rna-guided endonuclease

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006069584A2 (en) * 2004-12-29 2006-07-06 Exiqon A/S NOVEL OLIGONUCLEOTIDE COMPOSITIONS AND PROBE SEQUENCES USEFUL FOR DETECTION AND ANALYSIS OF microRNAs AND THEIR TARGET mRNAs
WO2013119770A1 (en) * 2012-02-08 2013-08-15 Dow Agrosciences Llc Data analysis of dna sequences
WO2016081798A1 (en) * 2014-11-20 2016-05-26 Children's Medical Center Corporation Methods relating to the detection of recurrent and non-specific double strand breaks in the genome
WO2018051347A1 (en) * 2016-09-14 2018-03-22 Yeda Research And Development Co. Ltd. Crisp-seq, an integrated method for massively parallel single cell rna-seq and crispr pooled screens
CN106637421A (zh) * 2016-10-28 2017-05-10 北京大学 双sgRNA文库的构建及其应用于高通量功能性筛选研究的方法
WO2018209320A1 (en) * 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
CN108103090A (zh) * 2017-12-12 2018-06-01 中山大学附属第医院 靶向RNA甲基化的RNA Cas9-m6A修饰载体系统及其构建方法和应用
EP3578658A1 (en) * 2018-06-08 2019-12-11 Johann Wolfgang Goethe-Universität Frankfurt Method for generating a gene editing vector with fixed guide rna pairs
WO2020006708A1 (en) * 2018-07-04 2020-01-09 Yale University Compositions and methods for enhancement of homology-directed repair mediated precise gene editing by programming dna repair with a single rna-guided endonuclease

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
QI L S ET AL: "Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression" *
刘思也等: "一种新的有CRISPR/Cas系统介导的基因组靶向修饰技术" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022253277A1 (zh) * 2021-06-03 2022-12-08 中国农业大学 Type I-C CRISPR-Cas3系统及其应用
CN113564197A (zh) * 2021-07-08 2021-10-29 上海师范大学 一种CRISPR/Cas9介导的植物多基因编辑载体的构建方法和应用
CN113564197B (zh) * 2021-07-08 2024-03-15 上海师范大学 一种CRISPR/Cas9介导的植物多基因编辑载体的构建方法和应用

Also Published As

Publication number Publication date
CN111613272B (zh) 2023-10-13

Similar Documents

Publication Publication Date Title
Huang et al. Precision genome editing using cytosine and adenine base editors in mammalian cells
US20220119804A1 (en) Compositions, methods and apparatus for oligonucleotides synthesis
CN107502608B (zh) 用于敲除人ALDH2基因的sgRNA、ALDH2基因缺失细胞株的构建方法及应用
EP3653709A1 (en) Methods for modulating dna repair outcomes
CN108707635B (zh) 用于核苷酸序列修饰的组合物、方法与应用
US20220033811A1 (en) Method and kit for preparing complementary dna
JP2023532375A (ja) 改良されたrna編集方法
Xu et al. Targeted RNA editing: novel tools to study post-transcriptional regulation
CN111613272B (zh) 程序化框架gRNA及其应用
US20230257799A1 (en) Methods of identifying and characterizing gene editing variations in nucleic acids
Song et al. Direct-seq: programmed gRNA scaffold for streamlined scRNA-seq in CRISPR screen
EP3350326B1 (en) Compositions and methods for polynucleotide assembly
US11078483B1 (en) Methods for measuring and improving CRISPR reagent function
CN116829706A (zh) 基于引导编辑的精确的基因组删除和替换方法
WO2021058145A1 (en) Phage t7 promoters for boosting in vitro transcription
EP3999651A1 (en) Methods of performing guide-seq on primary human t cells
Li et al. Enrichment of prime-edited mammalian cells with surrogate PuroR reporters
US20240141325A1 (en) Generation of novel crispr genome editing agents using combinatorial chemistry
WO2024119461A1 (en) Compositions and methods for detecting target cleavage sites of crispr/cas nucleases and dna translocation
AU2018279569B2 (en) System for DNA editing and application thereof
Walton et al. CROPseq-multi: a versatile solution for multiplexed perturbation and decoding in pooled CRISPR screens
Zhu et al. Both A-to-G and C-to-T base editing in human cells with dual base editor (A&C-BEmax)
WO2023086670A2 (en) Screening of cas nucleases for altered nuclease activity
WO2022187697A1 (en) In vivo dna assembly and analysis
CN117015602A (zh) 分析细胞中蛋白质编码变体的表达

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40030035

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant