CN115725652A - 一种实现多碱基编辑的方法 - Google Patents

一种实现多碱基编辑的方法 Download PDF

Info

Publication number
CN115725652A
CN115725652A CN202111153709.1A CN202111153709A CN115725652A CN 115725652 A CN115725652 A CN 115725652A CN 202111153709 A CN202111153709 A CN 202111153709A CN 115725652 A CN115725652 A CN 115725652A
Authority
CN
China
Prior art keywords
sgrna
editing
dna
cell
grna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111153709.1A
Other languages
English (en)
Inventor
陈宇庭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN202111153709.1A priority Critical patent/CN115725652A/zh
Publication of CN115725652A publication Critical patent/CN115725652A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种实现多碱基编辑的方法,将gRNA阵列通过2~15个gRNA阵列、含有mCherry‑失活eGFP报告分子的质粒、编辑激活eGFP的sgRNA质粒与碱基编辑器共转染到细胞;或者,所述表达sgRNA的载体与碱基编辑器共转染到细胞。或者将gRNA阵列通过2~15个gRNA阵列、含有mCherry‑失活eGFP报告分子的质粒、编辑激活eGFP的sgRNA质粒共转染到诱导型碱基编辑器稳定的细胞;或者所述表达sgRNA的载体转染到诱导型碱基编辑器稳定的细胞。本发明从5个sgRNA表达盒开始组装,减少了组装时间;通过多个gRNA阵列转染,在单细胞内实现多个位点的同时靶向,筛选得到多位点编辑细胞的效率更高。

Description

一种实现多碱基编辑的方法
技术领域
本发明属于生物技术领域,具体涉及一种在实现多碱基编辑的方法。
背景技术
CRISPR–Cas技术通过设计导向RNA(gRNAs)进行特定基因的编辑或转录调控。尽管CRISPR–Cas技术具有普遍的实用性,但单个gRNA的使用限制了效率和生物技术的应用。因此,现在越来越多的研究不再采用单一的gRNA,而是使用多位点编辑或转录调控的多重复合策略。多重复合CRISPR技术,是许多gRNAs或Cas酶被表达,促进了生物工程应用,大大提高了基因编辑和转录调控的范围和效率。
目前,在单细胞中表达多个gRNA的方法主要有两种:一种方法是用单个RNA聚合酶启动子转录每个gRNA盒,然后通过Golden gate装配将多个gRNA表达盒克隆到单个质粒中。另一种方法是使用一个启动子将所有的gRNAs转录到一个转录本中,然后通过不同的策略进行处理以释放单个的gRNAs,这些策略要求每个gRNA的两侧都有可切割的RNA序列,例如自切割核酶序列(例如锤头状核酶和HDV核酶)、外源性切割因子识别序列(例如Cys4)和内源性RNA处理序列(例如tRNA序列和内含子)。
上述多重复合CRISPR技术,sgRNA表达盒组装周期长且效率低;单个细胞内靶向靶点数少且编辑效率低;获取多位点编辑的单克隆时,需要筛选大量克隆,工作量大、成本高。
发明内容
为了解决现有技术中的技术问题,本发明的目的是提出一种在实现多碱基编辑的方法。具体方案如下:
本发明第一方面提供一种实现多碱基编辑的方法,包括如下步骤:
步骤1:设计并合成gRNA阵列;或,
步骤1:设计并合成gRNA阵列,将2~15个gRNA阵列组装到表达载体,构建得到表达sgRNA的载体;
所述gRNA阵列包含依次串联的5个sgRNA表达盒,每个所述sgRNA表达盒在5’至3’方向依次包含启动子、sgRNA和polyT,所述sgRNA表达盒中sgRNA为靶向基因位点的sgRNA;
步骤2:将所述gRNA阵列通过如下方法转染到细胞中,实现多碱基编辑;
I:2~15个gRNA阵列或其转录产物、含有mCherry-失活eGFP报告分子的质粒、编辑激活eGFP的sgRNA质粒与碱基编辑器共转染到细胞;
II:所述表达sgRNA的载体或其转录产物与碱基编辑器共转染到细胞。
本发明第二方面提供一种实现多碱基编辑的方法,包括如下步骤:
步骤1:设计并合成gRNA阵列;或,
步骤1:设计并合成gRNA阵列,将2~15个gRNA阵列组装到表达载体,构建得到表达sgRNA的载体;
所述gRNA阵列包含依次串联的5个sgRNA表达盒,每个所述sgRNA表达盒在5’至3’方向依次包含启动子、sgRNA和polyT,所述sgRNA表达盒中sgRNA为靶向基因位点的sgRNA;
步骤2:将所述gRNA阵列通过如下方法转染到诱导型碱基编辑器稳定的细胞中,实现多碱基编辑;
I:2~15个gRNA阵列或其转录产物、含有mCherry-失活eGFP报告分子的质粒与编辑激活eGFP的sgRNA质粒共转染到诱导型碱基编辑器稳定的细胞;
II:所述表达sgRNA的载体或其转录产物转染到诱导型碱基编辑器稳定的细胞。
本发明上述的多碱基编辑的方法,还包括分离培养转染后细胞的单克隆,进行Sanger测序和EditR分析,选择高编辑效率的单克隆,通过方法I或II进行gRNA阵列的转染。
本发明上述的多碱基编辑的方法,所述表达sgRNA的载体为将10个gRNA阵列组装到表达载体所得;
所述方法I中gRNA阵列为10个;
所述细胞为哺乳动物细胞;优选地,所述哺乳动物细胞为人哺乳动物细胞;优选地,所述哺乳动物细胞为人胚胎肾细胞;优选地,所述哺乳动物细胞为人胚胎肾细胞293;
优选地,所述启动子为hU6;
优选地,所述表达sgRNA的载体表达报告分子;优选地,所述报告分子为红色荧光蛋白;
优选地,所述依次串联的5个sgRNA表达盒通过化学方法合成。
本发明上述的多碱基编辑的方法,I中每转染到1×105个细胞中,所述gRNA阵列每个的转染量为200ng,所述含有mCherry-失活eGFP报告分子的质粒的转染量为30ng,所述编辑激活eGFP的sgRNA质粒的转染量为10ng;
II中每转染到1×105个细胞中,所述表达sgRNA的载体的转染量为2μg。
本发明上述的多碱基编辑的方法,所述诱导型碱基编辑器稳定的细胞选自高编辑效率的诱导型碱基编辑器稳定的细胞单克隆;
优选地,所述高编辑效率的诱导型碱基编辑器稳定的细胞单克隆的筛选方法为:筛选诱导型碱基编辑器稳定的细胞单克隆,记为原始单克隆;将1个gRNA阵列转染到筛选的原始单克隆中,筛选高编辑效率的转染后单克隆;所述高编辑效率的转染后单克隆所对应的原始单克隆即为所述高编辑效率的诱导型碱基编辑器稳定的细胞单克隆;
优选地,所述诱导型碱基编辑器为多西环素诱导的碱基编辑器;优选地,为多西环素诱导的胞嘧啶碱基编辑器;
优选地,所述诱导型碱基编辑器稳定的细胞选自稳定表达PB-FNLS-BE3-NG1或PB-evoAPOBEC1-BE4max-NG的细胞。
本发明第三方面提供一种所述方法构建得到的表达sgRNA的载体。
本发明第四方面提供一种碱基编辑系统,包含2~15个所述的gRNA阵列或其转录产物,或者,所述的表达sgRNA的载体或其转录产物;
优选地,所述碱基编辑系统还包含碱基编辑器;所述碱基编辑器选自腺嘌呤碱基编辑器或胞嘧啶碱基编辑器;
优选地,所述碱基编辑器为胞嘧啶碱基编辑器。
本发明第五方面提供一种多碱基编辑的试剂盒,所述试剂盒包含权利要求8所述的碱基编辑系统;
优选地,所述试剂盒还包括含有mCherry-失活eGFP报告分子的质粒和编辑激活eGFP的sgRNA质粒。
本发明上述的多碱基编辑的方法在基因组重编码、多基因遗传病细胞构建或多基因遗传病治疗中的应用
本发明的有益效果:
1、本发明提供的实现多碱基编辑的方法,直接合成5个sgRNA表达盒,从5个sgRNA表达盒开始组装,减少了组装时间,增加了成功率;构建多个含有5个sgRNA表达盒的gRNA阵列进行转染,在单细胞内实现多个位点的同时靶向,筛选得到多位点编辑细胞的效率更高;通过少量单克隆培养筛选,即可在单细胞内实现高效的多位点编辑。
2、本发明通过将gBlocks转染至诱导型碱基编辑器稳定的细胞,在多西环素的诱导下,可实现碱基编辑器稳定持续表达,与瞬时表达相比,具有更高得到碱基编辑效率。作为一个优选的方案,本发明通过筛选高编辑效率的诱导型碱基编辑器稳定的细胞单克隆,进一步将gBlocks转染至筛选的高编辑效率单克隆中,可以进一步提高碱基编辑效率。
3、作为一个优选的方案,本发明将gBlocks与含有mCherry-失活eGFP报告分子的质粒、编辑激活eGFP的sgRNA质粒共转染哺乳动物细胞中,转染的报告分子的量约是每个gBlock的十分之一,当报告分子和相应的sgRNA同时转染至单个细胞时,通过gBlock转染到单细胞的靶向基因位点的sgRNAs较多。当报告分子和相应的sgRNA同时在一个单细胞并发生单碱基编辑后,能检测到绿色荧光,红色与绿色双荧光的细胞,即说明转染进去的sgRNAs较多且发生了编辑。通过流式细胞分选即可实现高编辑克隆的富集。
附图说明
图1为实施例1中gBlock-YC1和gBlockPC的结构示意图。
图2为实施例1中靶向基因座碱基编辑效率验证结果,其中,图2-a为gBlock-PC的编辑效率,图2-b为gBlock-YC1的编辑效率;点代表个体的生物复制,条代表平均值。
图3为实施例2中多西环素诱导的胞苷脱氨酶piggyBac结构示意图,其中,F,flag标签;NLS,核定位信号;cas9n-NG,Cas9D10A识别NG-PAM;APOBEC1,大鼠APOBEC1;evoAPOBEC1,进化的大鼠APOBEC1。
图4为实施例2中靶向基因座碱基编辑效率验证结果,其中,图4-a为gBlock-PC的编辑效率,图4-b为gBlock-YC1的编辑效率;点和三角形代表个体的生物复制,条形代表平均值。
图5为实施例3中evoAPOBEC1-BE4max-NG稳转细胞单克隆中胞嘧啶碱基编辑器的蛋白水平,其中,使用抗Cas9(上)和抗肌动蛋白(下)。
图6为实施例3中靶向基因座碱基编辑效率验证结果,其中,数值和误差线反映了四个独立实验的平均值和标准差。
图7为实施例4中gBlocks池导入evoAPOBEC1-BE4max-NG稳定细胞系。
图8为实施例4中基于外显子全序列分析的靶向基因座“C”突变频率的热图。
图9为实施例5中一体化质粒的构建流程图。
图10为实施例5中一体化质粒的琼脂糖凝胶电泳图;其中,左边是DNA梯,最右边的空向量为对照组;泳道5和7的箭头为22Kb。
图11为实施例6中3种不同递送方法下单细胞RNA测序的基本质量指标;其中,a为捕获的细胞数,b为每个单元的UMI数,c为每个细胞检测到的基因数。
图12为实施例6中基于单细胞RNAseq的不同修饰基因靶细胞在不同传递方式群体中的分布分析;其中,a,b,c为3个群体中编辑基因位点数量与细胞数量的关系;d为scRNAseq在3个群体中检测到的编辑基因位点数量分布的密度图,垂直线表示编辑基因位点的中值;e为针对每个基因位点,对不同编辑效率的修饰细胞进行分布分析,不同方法的计数。
图13为实施例6中单细胞测序分析不同递送方式sgRNA在单细胞内的编辑效率;其中,g为单个细胞中每个sgRNA的编辑效率;h为基于单细胞RNA-Seq转化为细胞群体RNA-Seq的三种传递方式下细胞群体中目标C编辑效率的热图,编辑效率以黑色强度表示。
图14为实施例7中Sanger测序进行单克隆筛选;其中,a为选取10个经过良好编辑的基因座,gBlocks的峰值数为3,只有一个克隆拥有全部10个gBlocks;b为3个编辑良好的基因座进行筛选,一半的克隆没有任何编辑,4个克隆拥有全部的3个编辑位点;c为通过Sanger测序和EditR对每个克隆的所有靶位点进行等位基因编辑;WT(野生型)-无等位基因编辑;HZ(杂合子)-部分等位基因编辑;HM(纯合)-所有等位基因编辑。
图15为实施例8中WGS鉴定高度修饰HEK293T克隆的遗传变化分析;其中,a为目标“C”的热图编辑将TAG转换为TAA的效率,依次为NC-阴性对照,方法2的克隆19、方法3的克隆21、在克隆19的基础上利用方法2进行第二次转染得到克隆19-1、19-16、19-21,与亲本HEK293T的序列相比,在高度修饰的克隆中检测到的外显子SNV(SNV位于外显子和剪接位点)或其他SNV的数量;与亲本HEK293T的序列相比,克隆19、克隆21、克隆19-1、克隆19-16、克隆19-21的总snv数分别为23084、70356、35700、42595和31530;c-在必需基因中检测到的外显子SNV数量;d-不同类型SNV变化的分布;e-样本间检测到的C>T或G>T SNV的突变率;f-样本和染色体间检测到的C>T或G>T SNV的突变率;g-在高度修饰的克隆中检测到的外显子indels或其他indels的数量;h-在样本中检测到的indels的突变率;i-样本和染色体间检测到的indels突变率。
图16为实施例8中外显子snv在必需基因中的染色体分布;其中,a-含有,b-不含有在选定的50个必需基因靶点;X轴表示每个染色体,y轴表示该染色体的计数,为了更好的展示,每个染色体上必需基因的外显子SNV的数量被标记在每个条的顶部。
具体实施方式
为了更清楚地理解本发明,现参照下列实施例及附图进一步描述本发明。实施例仅用于解释而不以任何方式限制本发明。实施例中,各原始试剂材料均可商购获得,未注明具体条件的实验方法为所属领域熟知的常规方法和常规条件,或按照仪器制造商所建议的条件。
单碱基编辑系统是一项结合了CRISPR/Cas9和胞嘧啶脱氨酶的碱基编辑系统。利用该系统可以在不产生双链DNA断裂的情况下,利用sgRNA将Cas9-胞嘧啶脱氨酶-尿嘧啶糖基化酶抑制子三者构成的融合蛋白靶向与gRNA(sgRNA中与目标DNA互补配对的序列)互补配对的靶位点,并将该靶位点的胞嘧啶(C)的氨基去除,从而使得C变成尿嘧啶(U),随着DNA的复制,U又会被胸腺嘧啶(T)替代,最终实现单碱基C→T的突变。
CBE(Cytosine base editor),胞嘧啶碱基编辑器。大鼠APOBEC1(rAPOBEC1)存在于广泛使用的BE3和BE4的CBE编辑器中,rAPOBEC1酶诱导DNA胞嘧啶(C)脱氨,该酶由Cas蛋白和gRNA复合物引导靶向特定位点。evoAPOBEC1为进化的APOBEC1。
本发明中所利用的靶向152个基因位点的150个sgRNAs序列如表1所示,表1中相同基因名称表示靶向的是两个位置,编号10、12和13的基因位点的sgRNA序列相同。
表1.靶向152个基因位点的150个sgRNAs
Figure BDA0003287897820000051
Figure BDA0003287897820000061
Figure BDA0003287897820000071
Figure BDA0003287897820000081
实施例1
1、gRNA阵列的合成
设计包含5个sgRNA表达盒的gBlock(即gRNA阵列),命名为gBlock-YC1,并由生物公司合成。gBlock-YC1携带5个基因位点(ORC3-1、ORC3-2、PTPA、PMSD13、NOP2-1)的sgRNA。每个表达盒在5’至3’方向依次包含hU6、sgRNA和polyT。5个基因位点的sgRNA的序列如表1。同时,以5个先前发表的sgRNAs(gBlock PC)作为阳性对照(Thuronyi,B.W.etal.Continuous evolution of base editors with expanded target compatibilityand improved activity.Nat Biotechnol 37,1070-1079(2019))。gBlock-PC携带5个内源性位点(HEK2、HEK3、HEK4、EMX1、RNF2)的sgRNA。gBlock-YC1和gBlock-PC的骨架质粒为puc57。gBlock-YC1和gBlockPC的结构如图1所示。
2、转染HEK293T细胞
将gBlock-YC1和gBlockPC分别与碱基编辑器质粒(evoAPOBEC1-BE4max-NG)瞬时共转染HEK293T细胞。使用Lipofectamine 3000(Thermo Fisher Scientific cat#L3000015)进行转染,转染方法参考使用说明书后做如下修改:将细胞接种至48孔板中,每孔5×104个细胞,加入250μl细胞培养液培养24h。对于单个gBlock质粒和碱基编辑器质粒,每孔共使用1ug DNA(碱基编辑器质粒750ng,单个gBlock质粒250ng)和Lipofectamine30002μl的体系经行转染。
对靶向基因座进行Sanger测序和EditR分析,获得C-to-T转换的频率(%),如图2。gBlock-PC和gBlock-YC1所靶向的基因座的编辑效率分别为40%-50%和20%-50%。表明gBlock-YC1可以保持较高的碱基编辑效率。
实施例2
1、构建多西环素诱导的CBE稳定细胞系
利用PB转座子技术构建两个多西环素诱导的PB-FNLS-BE3-NG1和PB-evoAPOBEC1-BE4max-NG稳定表达的HEK293T细胞系:将HEK293T细胞接种于6孔板,每孔5×105个细胞,培养24h后,按照Lipofectamine 3000的使用说明书进行转染,用1μg超级转座酶质粒(SBISystem Biosciences cat#PB210PA-1)转染4μgpiggyBac靶向碱基编辑器质粒。48h后,细胞用嘌呤霉素(2ug/ml)进行筛选。多克隆池筛选后培养7-10天,或克隆细胞系筛选后5-7天,通过流式细胞术将细胞分选到单细胞96孔中。长期培养时定期加入嘌呤霉素。
多西环素诱导的胞苷脱氨酶piggyBac结构如图3所示。
2、转染多西环素诱导的CBE稳定细胞系
将gBlock-PC和gBlock-YC1分别瞬时转染两种多西环素诱导的CBE稳定细胞系:将细胞接种于48孔聚(d-赖氨酸)板(Corning cat#354413)中,每孔1×105个细胞,并加入并加入300μl含多西环素(2μg/ml)培养基培养24h,每孔1μg gBlock-PC或gBlock-YC1和2μlLipofectamine 3000的体系进行转染。转染后,再加入多西环素培养5d,收集细胞进行基因组DNA编辑分析。
对靶向基因座进行Sanger测序和EditR分析,获得C-to-T转换的频率(%),如图4。gBlock-PC中sgRNAs的编辑效率在evoAPOBEC1-BE4max-NG稳定细胞系中约为60-70%,略高于在FNLS-BE3-NG稳定细胞系的45-65%。gBlock-YC1中sgRNAs的编辑效率在evoAPOBEC1-BE4max-NG稳定细胞系约为30-75%,显著高于在FNLS-BE3-NG稳定细胞系的20-40%。evoAPOBEC1-BE4max-NG稳定细胞系的碱基编辑效率更高。
为了获得更高的碱基编辑效率,本发明的一个优选实施方案采用evoAPOBEC1-BE4max-NG稳定细胞系进行gBlock的转染。
实施例3
1、从evoAPOBEC1-BE4max-NG稳定细胞系分选出单克隆
利用流式细胞仪从evoAPOBEC1-BE4max-NG稳定细胞系中分选出单克隆,得到克隆1,3,4,5,6,16,17,19,21,23,25,进行培养。在多西环素诱导5天后,进行蛋白质免疫印迹,进行了三次独立重复实验,每个克隆的胞嘧啶碱基编辑器的蛋白表达水平如图5,图5中免疫印迹图片是三个独立实验的代表。
2、转染单克隆
将gBlock-YC1瞬转到所得的单克隆中,设置四个平行实验。将单克隆细胞接种于48孔聚(d-赖氨酸)板(Corning cat#354413)中,每孔1×105个细胞,并加入300μl含多西环素(2μg/ml)培养基培养24h,每孔1μg gBlock-YC1和2μl Lipofectamine 3000的体系进行转染。转染后,再加入强力霉素培养5d,收集细胞进行基因组DNA编辑分析。
对靶向基因座进行Sanger测序和EditR分析,获得C.G-to-T.A转换的频率(%),如图6。克隆1中5个基因位点的编辑效率在11个克隆中最高的。
实施例4
10个gBlocks:所靶向基因位点是表1中编号1-52,sgRNA序列如表1所示。
20个gBlocks:所靶向基因位点是表1中编号1-102,sgRNA序列如表1所示。
30个gBlocks:所靶向基因位点是表1中编号1-152,sgRNA序列如表1所示。
将10、20和30个gBlocks池分别共转染到实施例3分选出的evoAPOBEC1-BE4max-NG稳定细胞系的克隆1中,如图7。具体地将10、20和30个gBlocks池分别递送到含有多西环素的培养基的稳转细胞系内或者不含多西环素的培养基培养的稳转细胞系内。
将细胞接种于48孔聚(d-赖氨酸)板(Corning cat#354413)中,每孔1×105个细胞,并加入300μl含多西环素(2μg/ml)培养基,20mM p53抑制剂(Stem Cell Technologiescat#72062)和20ng/ml人源重组bFGF(Stem Cell Technologies cat#78003)培养24h,对于10个gBlocks池,每孔采用200ng/gBlocks和3ul Lipofectamine 3000的体系进行转染,20ng绿色荧光蛋白作为转染对照;对于20个gBlocks池,每孔采用150ng/gBlocks和3ulLipofectamine 3000的体系进行转染,20ng绿色荧光蛋白作为转染对照;对于30个gBlocks池,每孔采用100ng/gBlocks和3ul Lipofectamine 3000的体系进行转染,20ng绿色荧光蛋白作为转染对照。转染后,再加入多西环素培养5d,收集细胞进行基因组DNA编辑分析。
通过全外显子测序(WES)分析,获得靶向基因座“C”突变频率的热图,如图8。与递送20个gBlocks和30个gBlocks相比,当递送10个gBlocks时,在52个基因位点中的多数位点的编辑效率是最好的。
为了获得更高的碱基编辑效率,本发明的一个优选实施方案一次递送10个gBlock。
实施例5
通过Golden gate assembly将10个gBlocks组装到含DsRed表达载体,如图9。
软件设计靶向基因位点的sgRNAs序列,串联并送商业公司合成多个gRNA阵列单元(gBlocks),每个gBlock阵列包含依次串联的5个sgRNA表达盒。所有gBlocks片段包括5个sgRNA表达框,并在两端含有IIS型BbsI限制性内酶酶切位点后,直接合成到PUC57克隆质粒中。两个具有BbsI酶切位点的寡核苷酸链SpeI-HF经退火后克隆到CMV启动子驱动荧光蛋白(DsRed)表达的目的载体中。用BbsI-HF分别酶切10gBlocks和目的质粒,用凝胶提取试剂盒(Zymo Research cat#11-301C)进行凝胶提取。用T4DNA连接酶(NEB cat#M0202S)在16℃过夜,将gBlocks片段与质粒连接。连接反应完成后,将2μl反应混合物转化到大肠杆菌NEBStable菌株。根据使用说明书,使用QIAprep spin纯化试剂盒(cat#27104)从菌液中分离质粒DNA。
通过琼脂糖凝胶电泳分析最终的一体化质粒中sgRNAs是否插入成功。选取九个质粒进行检测,九个质粒均用核酸内切酶spe1线性化,因为在多个sgRNAs插入位点的两侧都有一个SpeI位点,当多个sgRNAs在质粒中成功插入时,用SpeI酶切质粒后,在凝胶电泳上可以看到两条条带。一个片段长约为4479bp,另一个片段长约为22140bp。九个被检测的质粒中有两个具有正确的插入大小,sgRNAs插入成功。结果如图10。
通过sanger测序验证多个sgRNAs的插入。由测序结果可知,构建的一体化质粒含43个sgRNA,该质粒命名为43-all-in-one。
实施例6
采用以下3种方法将十个gRNA阵列递送到多西环素诱导的evoAPOBEC1-BE4max-NG稳定表达细胞系中:将细胞接种于48孔聚(d-赖氨酸)板(Corning cat#354413)中,每孔1×105个细胞,并加入300μl多四环素(2μg/ml)培养24h,每孔21μg质粒和3μl Lipofectamine3000的体系进行转染。转染后,再加入多四环素培养5d,收集细胞进行基因组DNA编辑分析。
方法1:10个gBlocks(每个200ng)、含有mCherry-失活eGFP报告分子的质粒eGFPL202 Reporter(addgene#119129)(30ng)和3ul Lipofectamine 3000。
方法2:10个gBlocks(每个200ng)、含有mCherry-失活eGFP报告分子的质粒(eGFPL202 Reporter,addgene#119129(30ng)、eGFP L202 gRNA(addgene#119132)(10ng)和3ull Lipofectamine 3000。
方法3:2ug 43-all-in-one质粒和3ul Lipofectamine 3000。
10个gBlocks:所靶向基因位点是表1中编号1-52,sgRNA序列如表1所示。
从每种方法下分离约1000个单细胞,3种不同递送方法下单细胞RNA测序的基本质量指标如图11。利用CRISPResso2软件,比对上HEK293T细胞中47个基因位点的38个,并观察到三种方法中随着单细胞内编辑位点数量的增加,细胞的数量而减少。方法2中多基因位点同时编辑的细胞数量最多,绘制细胞的种群密度图,分析每个目标的编辑效率以及目标位置的编辑事件呈双峰分布(图12)。
同时,分析每个细胞中所有靶向位点的编辑效率和每个递送方法下中所有靶向位点的总编辑效率,如图13。结果表明,方法2是三种递送方法中编辑效率最高的。
为了获得更高的碱基编辑效率,本发明的一个优选实施方案采用方法2进行gRNA阵列的递送。
实施例7
分别从实施例6的方法2和方法3转染的细胞群体中分离培养了28/96和24/96个单克隆。
对于方法2的克隆,挑选了10个容易编辑的基因座(表1中PSMD13,ANAPC5,BIRC5,WDR3,MASTL,RBX1,PPIE,RABGGTB,SNRPE,UQCRC1),进行PCR扩增,然后进行Sanger测序和EditR分析,发现4个克隆没有被转入任何gBlocks和24个克隆分别被转入1-10个不同数目的gBlocks,其中克隆19被转入了所有10个gBlocks。
对于方法3的克隆,使用3个容易编辑的基因座(表1中PSMD13,ANAPC5,BIRC5)进行筛选,发现13个克隆3个位置都没被编辑,11个克隆分别有几个位点被编辑,其中克隆11、20、21和24在3个位点都有编辑。
对两个高度修饰的克隆:克隆19(来自方法2)和克隆21(来自方法3)的所有靶向基因座进行了Sanger测序。结果所示,在克隆19中,在33/47个基因组位点上发现了TAG到TAA的转变,其中9个位点为纯合位点,14/47个位点为未编辑位点;在克隆21中,发现了27/40个位点发生了TAG到TAA转变,其中10个位点为纯合位点,13/40个位点为未编辑位点(图14)。
为了确定编辑效率是否可以随着随后的转染轮而提高,使用方法2将gBlocks转染到高度修饰的克隆19(来自方法2)中,并从22/96克隆中选择克隆19-1、19-16和19-21,与原始克隆19相比,在选择的基因座中有更高的编辑(Sanger/EditR)。
为了获得更高的碱基编辑效率,本发明的一个优选实施方案,采用实施例6中的方法2将十个gRNA阵列递送到细胞中,然后从转染的细胞群体中分离培养单克隆,再次采用实施例6中的方法2将十个gRNA阵列递送到分离培养的高度修饰的单克隆中。
实施例8
为了全面评估CBE全基因组TAG到TAA转化的靶向编辑和脱靶效率,对实施例7中高度修饰的克隆(19,21,19-1,19-16,19-21)和阴性对照(HEK293T细胞)进行30倍全基因组测序(WGS)。
在靶向编辑方面,在高度修饰的克隆中,有39/47个基因位点被比对上,其中28个位点有着较高编辑,克隆19-1、19-16、19-21在选择位点的编辑能力比克隆19有所提高,这一结果与实施例7的Sanger测序结果一致。
为了找出脱靶事件,分析高度修饰克隆(19,21,19-1,19-16,19-21)中的单核苷酸变异(SNVs)和插入/缺失(indels)。与对照组相比,减去靶向位置后,克隆19、克隆21、克隆19-1、克隆19-16、克隆19-21的SNVs分别为23084、70356、35700、42595和31530。进一步分析发现,277、805、419、470、358个SNVs分别位于外显子上,只有33、77、42、46、40个SNVs分别位于必需基因的外显子上。将SNVs分为不同的突变类型,发现C-to-T(G-to-A)转换是最常见的编辑(图15)。SNV突变率很低,但在每个克隆中都可以看到,并分布在每个染色体上。除SNVs外,在这些克隆中检测到的indels数分别为558、715、717、662、655,其中一小部分位于外显子,而没有在必需基因的外显子上。每个克隆和染色体的indel比率也都很低(图16)。
实施例9
采用方法2将十个gRNA阵列递送到实施例3分选出的evoAPOBEC1-BE4max-NG稳定细胞系的克隆1中:将细胞接种于48孔聚(d-赖氨酸)板(Corning cat#354413)中,每孔1×105个细胞,并加入300μl多四环素(2μg/ml)培养24h,每孔21μg质粒和3μl Lipofectamine3000的体系进行转染。转染后,再加入多四环素培养5d,收集细胞。
方法2:10个gBlocks(每个200ng)、含有mCherry-失活eGFP报告分子的质粒(eGFPL202 Reporter,addgene#119129(30ng)、eGFP L202 gRNA(addgene#119132)(10ng)和3ull Lipofectamine 3000。
在一个更优选的实施方案中,进一步包括从转染的细胞群体中分离培养单克隆,筛选高编辑效率的单克隆,再次采用方法2将这十个gRNA阵列递送到分离培养的高度修饰的单克隆中。转染后,再加入多四环素培养5d,收集细胞。根据实际的碱基编辑情况,重复该步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
SEQUENCE LISTING
<110> 深圳先进技术研究院
<120> 一种实现多碱基编辑的方法
<130> CP121010748C
<160> 150
<170> PatentIn version 3.3
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<400> 1
ccaaacctag cctattatcc 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<400> 2
agctctaata aaccgagcac 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<400> 3
ccctcctagc ccgacgtgac 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<400> 4
ggccctaggt gaggatgtca 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<400> 5
ccatctaaga tagcagcagc 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<400> 6
cctagctact tgggagtctg 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<400> 7
tctctagaga tggtttatca 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<400> 8
agaatctcta tgtcttttgg 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<400> 9
tttggctact tggtctcttc 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<400> 10
gatgcttcta gaagcctgga 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<400> 11
ttcgtcccta gctctgaagg 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<400> 12
cctttcctaa gacattgcta 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<400> 13
tggaggctac tccagaacca 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<400> 14
gaaaagctat actctagtgg 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<400> 15
tgtcctacag ctttgtccag 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<400> 16
ttcagttcta agtcaacgtt 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<400> 17
atctcctaat tcttcacaaa 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<400> 18
tgcctactca ttttcttcac 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<400> 19
atggtggcta tccacgatgg 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<400> 20
atagctaaac actcatcatt 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<400> 21
gccaactatg gcgtgacaga 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<400> 22
tcattctatt tgcctttttt 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<400> 23
gctttctagc agcctcccca 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<400> 24
ttgtgctaca gactaaatcc 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<400> 25
acaactaaag ttctgagcta 20
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<400> 26
gattcctaag actgtttgct 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<400> 27
cttttcctag tgcccatacc 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<400> 28
caaggctaag tcccacgtgc 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<400> 29
caatcttcta tttctctaaa 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<400> 30
tcctcgctac aggaagctgc 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<400> 31
tctttcctat ttcttcacac 20
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<400> 32
gaaacagcta caaaaccagt 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<400> 33
gagctctacg tcagcttcca 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<400> 34
gggctagttg aatttagcct 20
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<400> 35
ccaatctact cagtaacact 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<400> 36
catctaaaat cggggttttt 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<400> 37
acacacctaa gttgtgaaaa 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<400> 38
ctctcctaaa ctgcccctag 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<400> 39
tgaatctagc tcactagctc 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<400> 40
actgccacta gtctgtaggg 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<400> 41
tagaatctat aattctgttg 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<400> 42
agtctagatt ggtttaatct 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<400> 43
gaagctagga gttcaagact 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<400> 44
gcctggctac atcatggcag 20
<210> 45
<211> 20
<212> DNA
<213> 人工序列
<400> 45
atttctagtt ggagacactt 20
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<400> 46
gcactctagc ctgaacagag 20
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<400> 47
gtagctgcta tctcagaggc 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<400> 48
tactgtctaa tttttcttct 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列
<400> 49
ctccgtctaa ggagctggaa 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<400> 50
tcccgcctag aagcgcagcc 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<400> 51
cctgtctatg gcttaggatc 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<400> 52
ctttatctat tttgcagtgt 20
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<400> 53
caggggctac agggcatcca 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<400> 54
tggtcatcta tttccaggtg 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<400> 55
catgcctatt ctgcaggtgt 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<400> 56
gactacctag tagtcatcaa 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<400> 57
aggctaaggc gggcggatca 20
<210> 58
<211> 20
<212> DNA
<213> 人工序列
<400> 58
agactggcta cacaaactgt 20
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<400> 59
gtcttctatt tcctttcatt 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<400> 60
ctgttctatg ggtggtcaga 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<400> 61
cacctctagc atctcagctc 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<400> 62
ctgggtctag ttcagctgac 20
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<400> 63
aaagtctaga ggcagaaggc 20
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<400> 64
ccagcctagg tgacagagca 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<400> 65
gcccctaaaa ggcaaagcta 20
<210> 66
<211> 20
<212> DNA
<213> 人工序列
<400> 66
ctgctctaac tggccaccgg 20
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<400> 67
gtgagctatc gaaacaacct 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<400> 68
cagcatctac gagaagttct 20
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<400> 69
agtcgactaa ggcagaattt 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<400> 70
cactgcccta tctttgcata 20
<210> 71
<211> 20
<212> DNA
<213> 人工序列
<400> 71
caaaatctat tttccttcct 20
<210> 72
<211> 20
<212> DNA
<213> 人工序列
<400> 72
gcgtctaggt aatcttcctc 20
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<400> 73
cagcgctatt tatacctgga 20
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<400> 74
tgggggctac tgccggcagg 20
<210> 75
<211> 20
<212> DNA
<213> 人工序列
<400> 75
acatgctaga agtctgctgt 20
<210> 76
<211> 20
<212> DNA
<213> 人工序列
<400> 76
tttggactat gtgacaaggg 20
<210> 77
<211> 20
<212> DNA
<213> 人工序列
<400> 77
tgccactagt cctctagcac 20
<210> 78
<211> 20
<212> DNA
<213> 人工序列
<400> 78
ggcctacagg ctgtagaact 20
<210> 79
<211> 20
<212> DNA
<213> 人工序列
<400> 79
ttcactattt cttccgcttc 20
<210> 80
<211> 20
<212> DNA
<213> 人工序列
<400> 80
ccagctataa aaggcatgaa 20
<210> 81
<211> 20
<212> DNA
<213> 人工序列
<400> 81
cgtttctact catcggatcc 20
<210> 82
<211> 20
<212> DNA
<213> 人工序列
<400> 82
gtgtgcccta ggcgtagtat 20
<210> 83
<211> 20
<212> DNA
<213> 人工序列
<400> 83
acactcacta cacacgtttg 20
<210> 84
<211> 20
<212> DNA
<213> 人工序列
<400> 84
ttggctaatg gatccgagtt 20
<210> 85
<211> 20
<212> DNA
<213> 人工序列
<400> 85
caagtctagt tctgtggtgg 20
<210> 86
<211> 20
<212> DNA
<213> 人工序列
<400> 86
tcagctctac actctcgtag 20
<210> 87
<211> 20
<212> DNA
<213> 人工序列
<400> 87
tgatctctac ttcagatcca 20
<210> 88
<211> 20
<212> DNA
<213> 人工序列
<400> 88
aaggctacgt cccctgtcga 20
<210> 89
<211> 20
<212> DNA
<213> 人工序列
<400> 89
gacttcctag gatctgtgcc 20
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<400> 90
aagcaggcta ccttctccac 20
<210> 91
<211> 20
<212> DNA
<213> 人工序列
<400> 91
gctggctaat ggcccagctg 20
<210> 92
<211> 20
<212> DNA
<213> 人工序列
<400> 92
gccttcccta cacccaccct 20
<210> 93
<211> 20
<212> DNA
<213> 人工序列
<400> 93
ccccagccta ggccgccctc 20
<210> 94
<211> 20
<212> DNA
<213> 人工序列
<400> 94
aagagcctag gcagagagaa 20
<210> 95
<211> 20
<212> DNA
<213> 人工序列
<400> 95
cttctactgg gatacagcct 20
<210> 96
<211> 20
<212> DNA
<213> 人工序列
<400> 96
gattaactac attcttacag 20
<210> 97
<211> 20
<212> DNA
<213> 人工序列
<400> 97
gcccatctat cctgacctgt 20
<210> 98
<211> 20
<212> DNA
<213> 人工序列
<400> 98
ttcctcctaa agatccagga 20
<210> 99
<211> 20
<212> DNA
<213> 人工序列
<400> 99
gagtgctact gaaagtcgaa 20
<210> 100
<211> 20
<212> DNA
<213> 人工序列
<400> 100
ttggacccta ggtagttttc 20
<210> 101
<211> 20
<212> DNA
<213> 人工序列
<400> 101
gtcctagagg tggatccact 20
<210> 102
<211> 20
<212> DNA
<213> 人工序列
<400> 102
cagctacagg cgcagcctct 20
<210> 103
<211> 20
<212> DNA
<213> 人工序列
<400> 103
ctgtaggcta acgtggctgg 20
<210> 104
<211> 20
<212> DNA
<213> 人工序列
<400> 104
ttctctagaa gtcctgagac 20
<210> 105
<211> 20
<212> DNA
<213> 人工序列
<400> 105
atccctagaa aaagaatccc 20
<210> 106
<211> 20
<212> DNA
<213> 人工序列
<400> 106
aaaccctatg ttgtagccac 20
<210> 107
<211> 20
<212> DNA
<213> 人工序列
<400> 107
agctctaagg agcttgaaga 20
<210> 108
<211> 20
<212> DNA
<213> 人工序列
<400> 108
agatgctaga cttgcgtcag 20
<210> 109
<211> 20
<212> DNA
<213> 人工序列
<400> 109
gagggtctac tttgtggaga 20
<210> 110
<211> 20
<212> DNA
<213> 人工序列
<400> 110
gtcttctact ccaaaaactc 20
<210> 111
<211> 20
<212> DNA
<213> 人工序列
<400> 111
ctcacctatg tcagtttctt 20
<210> 112
<211> 20
<212> DNA
<213> 人工序列
<400> 112
ggccccctac cgatccatct 20
<210> 113
<211> 20
<212> DNA
<213> 人工序列
<400> 113
gcatctaaaa ccgcagtttc 20
<210> 114
<211> 20
<212> DNA
<213> 人工序列
<400> 114
tccctgctag aagaacttga 20
<210> 115
<211> 20
<212> DNA
<213> 人工序列
<400> 115
gctggctacg agtccggaac 20
<210> 116
<211> 20
<212> DNA
<213> 人工序列
<400> 116
ccgcctctac cagaagtccc 20
<210> 117
<211> 20
<212> DNA
<213> 人工序列
<400> 117
gaggcctagt cgagcaggga 20
<210> 118
<211> 20
<212> DNA
<213> 人工序列
<400> 118
tcgctaggac agacggatcc 20
<210> 119
<211> 20
<212> DNA
<213> 人工序列
<400> 119
tctgcctaat gtcggtaatg 20
<210> 120
<211> 20
<212> DNA
<213> 人工序列
<400> 120
gtcagctacc agcagggtcc 20
<210> 121
<211> 20
<212> DNA
<213> 人工序列
<400> 121
gtgattctaa cagcggagcc 20
<210> 122
<211> 20
<212> DNA
<213> 人工序列
<400> 122
tgtggtctag tgtgactttg 20
<210> 123
<211> 20
<212> DNA
<213> 人工序列
<400> 123
ttgttctaat gcttcttgtt 20
<210> 124
<211> 20
<212> DNA
<213> 人工序列
<400> 124
tgcacctaga agaaggtgtt 20
<210> 125
<211> 20
<212> DNA
<213> 人工序列
<400> 125
gcggctaggg ccaagcctgc 20
<210> 126
<211> 20
<212> DNA
<213> 人工序列
<400> 126
cggcccctac ttgccggcga 20
<210> 127
<211> 20
<212> DNA
<213> 人工序列
<400> 127
ggggccctag gagggggccc 20
<210> 128
<211> 20
<212> DNA
<213> 人工序列
<400> 128
gccaacccta tttcaggcag 20
<210> 129
<211> 20
<212> DNA
<213> 人工序列
<400> 129
ggacactact ggcaaaaggg 20
<210> 130
<211> 20
<212> DNA
<213> 人工序列
<400> 130
atggactagt gtctcggctt 20
<210> 131
<211> 20
<212> DNA
<213> 人工序列
<400> 131
ggtctctatg gtgggagcac 20
<210> 132
<211> 20
<212> DNA
<213> 人工序列
<400> 132
ggccgcctac aatttgtcca 20
<210> 133
<211> 20
<212> DNA
<213> 人工序列
<400> 133
ttctcatcta ttgataataa 20
<210> 134
<211> 20
<212> DNA
<213> 人工序列
<400> 134
agccactact tcttattcct 20
<210> 135
<211> 20
<212> DNA
<213> 人工序列
<400> 135
aggctctaag cactgccagg 20
<210> 136
<211> 20
<212> DNA
<213> 人工序列
<400> 136
aggttctagg agaagatgga 20
<210> 137
<211> 20
<212> DNA
<213> 人工序列
<400> 137
cttctagtgt tgggtccact 20
<210> 138
<211> 20
<212> DNA
<213> 人工序列
<400> 138
atttgctacc accaaaatct 20
<210> 139
<211> 20
<212> DNA
<213> 人工序列
<400> 139
tcttgtctac ttcttcctcc 20
<210> 140
<211> 20
<212> DNA
<213> 人工序列
<400> 140
ctgctgctac caggagctga 20
<210> 141
<211> 20
<212> DNA
<213> 人工序列
<400> 141
acctctagtg gtcatcaggc 20
<210> 142
<211> 20
<212> DNA
<213> 人工序列
<400> 142
tgtctctagt gtatgtctag 20
<210> 143
<211> 20
<212> DNA
<213> 人工序列
<400> 143
tgagtctaga ccttgtacag 20
<210> 144
<211> 20
<212> DNA
<213> 人工序列
<400> 144
gggctagttg ctggtccacc 20
<210> 145
<211> 20
<212> DNA
<213> 人工序列
<400> 145
caactctaca gacataattc 20
<210> 146
<211> 20
<212> DNA
<213> 人工序列
<400> 146
atactgctac tgctcattgg 20
<210> 147
<211> 20
<212> DNA
<213> 人工序列
<400> 147
aagtactaaa tattgctgag 20
<210> 148
<211> 20
<212> DNA
<213> 人工序列
<400> 148
ttatctactg tgaatcaatc 20
<210> 149
<211> 20
<212> DNA
<213> 人工序列
<400> 149
ttgtttctag tatctgcttc 20
<210> 150
<211> 20
<212> DNA
<213> 人工序列
<400> 150
ggaatctacg gctccagctc 20

Claims (10)

1.一种实现多碱基编辑的方法,其特征在于,包括如下步骤:
步骤1:设计并合成gRNA阵列;或,
步骤1:设计并合成gRNA阵列,将2~15个gRNA阵列组装到表达载体,构建得到表达sgRNA的载体;
所述gRNA阵列包含依次串联的5个sgRNA表达盒,每个所述sgRNA表达盒在5’至3’方向依次包含启动子、sgRNA和polyT,所述sgRNA表达盒中sgRNA为靶向基因位点的sgRNA;
步骤2:将所述gRNA阵列通过如下方法转染到细胞中,实现多碱基编辑;
I:2~15个gRNA阵列或其转录产物、含有mCherry-失活eGFP报告分子的质粒、编辑激活eGFP的sgRNA质粒与碱基编辑器共转染到细胞;
II:所述表达sgRNA的载体或其转录产物与碱基编辑器共转染到细胞。
2.一种实现多碱基编辑的方法,其特征在于,包括如下步骤:
步骤1:设计并合成gRNA阵列;或,
步骤1:设计并合成gRNA阵列,将2~15个gRNA阵列组装到表达载体,构建得到表达sgRNA的载体;
所述gRNA阵列包含依次串联的5个sgRNA表达盒,每个所述sgRNA表达盒在5’至3’方向依次包含启动子、sgRNA和polyT,所述sgRNA表达盒中sgRNA为靶向基因位点的sgRNA;
步骤2:将所述gRNA阵列通过如下方法转染到诱导型碱基编辑器稳定的细胞中,实现多碱基编辑;
I:2~15个gRNA阵列或其转录产物、含有mCherry-失活eGFP报告分子的质粒与编辑激活eGFP的sgRNA质粒共转染到诱导型碱基编辑器稳定的细胞;
II:所述表达sgRNA的载体或其转录产物转染到诱导型碱基编辑器稳定的细胞。
3.根据权利要求1或2所述的多碱基编辑的方法,其特征在于,还包括分离培养转染后细胞的单克隆,进行Sanger测序和EditR分析,选择高编辑效率的单克隆,通过方法I或II进行gRNA阵列的转染。
4.根据权利要求1或2所述的多碱基编辑的方法,其特征在于,所述表达sgRNA的载体为将10个gRNA阵列组装到表达载体所得;
所述方法I中gRNA阵列为10个;
所述细胞为哺乳动物细胞;优选地,所述哺乳动物细胞为人哺乳动物细胞;优选地,所述哺乳动物细胞为人胚胎肾细胞;优选地,所述哺乳动物细胞为人胚胎肾细胞293;
优选地,所述启动子为hU6;
优选地,所述表达sgRNA的载体表达报告分子;优选地,所述报告分子为红色荧光蛋白;
优选地,所述依次串联的5个sgRNA表达盒通过化学方法合成。
5.根据权利要求1或2所述的多碱基编辑的方法,其特征在于,I中每转染到1×105个细胞中,所述gRNA阵列每个的转染量为200ng,所述含有mCherry-失活eGFP报告分子的质粒的转染量为30ng,所述编辑激活eGFP的sgRNA质粒的转染量为10ng;
II中每转染到1×105个细胞中,所述表达sgRNA的载体的转染量为2μg。
6.根据权利要求2所述的多碱基编辑的方法,其特征在于,所述诱导型碱基编辑器稳定的细胞选自高编辑效率的诱导型碱基编辑器稳定的细胞单克隆;
优选地,所述高编辑效率的诱导型碱基编辑器稳定的细胞单克隆的筛选方法为:筛选诱导型碱基编辑器稳定的细胞单克隆,记为原始单克隆;将1个gRNA阵列转染到筛选的原始单克隆中,筛选高编辑效率的转染后单克隆;所述高编辑效率的转染后单克隆所对应的原始单克隆即为所述高编辑效率的诱导型碱基编辑器稳定的细胞单克隆;
优选地,所述诱导型碱基编辑器为多西环素诱导的碱基编辑器;优选地,为多西环素诱导的胞嘧啶碱基编辑器;
优选地,所述诱导型碱基编辑器稳定的细胞选自稳定表达PB-FNLS-BE3-NG1或PB-evoAPOBEC1-BE4max-NG的细胞。
7.一种权利要求1或2所述方法构建得到的表达sgRNA的载体。
8.一种碱基编辑系统,其特征在于,包含2~15个权利要求1或2所述的gRNA阵列或其转录产物,或者,权利要求7所述的表达sgRNA的载体或其转录产物;
优选地,所述碱基编辑系统还包含碱基编辑器;所述碱基编辑器选自腺嘌呤碱基编辑器或胞嘧啶碱基编辑器;优选地,所述碱基编辑器为胞嘧啶碱基编辑器。
9.一种多碱基编辑的试剂盒,其特征在于,所述试剂盒包含权利要求8所述的碱基编辑系统;
优选地,所述试剂盒还包括含有mCherry-失活eGFP报告分子的质粒和编辑激活eGFP的sgRNA质粒。
10.权利要求1或2所述的多碱基编辑的方法在基因组重编码、多基因遗传病细胞构建或多基因遗传病治疗中的应用。
CN202111153709.1A 2021-09-29 2021-09-29 一种实现多碱基编辑的方法 Pending CN115725652A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111153709.1A CN115725652A (zh) 2021-09-29 2021-09-29 一种实现多碱基编辑的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111153709.1A CN115725652A (zh) 2021-09-29 2021-09-29 一种实现多碱基编辑的方法

Publications (1)

Publication Number Publication Date
CN115725652A true CN115725652A (zh) 2023-03-03

Family

ID=85292451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111153709.1A Pending CN115725652A (zh) 2021-09-29 2021-09-29 一种实现多碱基编辑的方法

Country Status (1)

Country Link
CN (1) CN115725652A (zh)

Similar Documents

Publication Publication Date Title
CN107760715B (zh) 一种转基因载体及其构建方法和应用
US20200208141A1 (en) Methods and compositions comprising crispr-cpf1 and paired guide crispr rnas for programmable genomic deletions
CN116218836A (zh) 编辑rna的方法和组合物
CN109306361B (zh) 一种新的a/t到g/c碱基定点转换的基因编辑系统
CN109880851B (zh) 用于富集CRISPR/Cas9介导的同源重组修复细胞的筛选报告载体及筛选方法
KR20210106527A (ko) 바코드화 가이드 rna 구축물을 사용한 고효율의 유전자 스크리닝을 위한 조성물 및 방법
AU3901499A (en) Cell-free chimeraplasty and eukaryotic use of heteroduplex mutational vectors
US20020072097A1 (en) Molecular breeding of transposable elements
CN107893073B (zh) 一种筛选谷氨酰胺合成酶缺陷型hek293细胞株的方法
CN103834686A (zh) 高效克隆筛选表达载体、其制备方法及用途
US11946163B2 (en) Methods for measuring and improving CRISPR reagent function
CN106520829B (zh) 一种终止双等位基因转录的方法
KR20240099418A (ko) 세린 재조합효소
CN106544360B (zh) 一种终止lncRNA双等位基因转录的方法
US20070243616A1 (en) In vivo alteration of cellular dna
CN113249362A (zh) 经改造的胞嘧啶碱基编辑器及其应用
CN115725652A (zh) 一种实现多碱基编辑的方法
WO2023050158A1 (zh) 一种实现多碱基编辑的方法
WO2023050169A1 (zh) 一种在基因组上高通量实现tag到taa转换的方法
CN109628447B (zh) 特异靶向羊友好位点H11的sgRNA及其编码DNA和应用
WO2020036181A1 (ja) 細胞を単離又は同定する方法及び細胞集団
CN113151277A (zh) 鸡DF-1细胞IHH基因敲除稳定细胞株的构建方法及其特异性sgRNA
US20020094536A1 (en) Methods for making polynucleotide libraries, polynucleotide arrays, and cell libraries for high-throughput genomics analysis
KR20200026164A (ko) 세포의 유전체에서 표적 핵산을 변형시키는 방법
Philip et al. An adaptable plasmid scaffold for CRISPR-based endogenous tagging

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination