CN116769809A

CN116769809A - 密码子优化的Cas12i3蛋白编码基因及其应用

Info

Publication number: CN116769809A
Application number: CN202310509443.2A
Authority: CN
Inventors: 韩红兵; 汪林丽; 艾越
Original assignee: China Agricultural University
Current assignee: China Agricultural University
Priority date: 2023-05-08
Filing date: 2023-05-08
Publication date: 2023-09-19

Abstract

本发明公开了密码子优化的Cas12i3蛋白编码基因及其应用。具体地公开了DNA分子，所述DNA分子的核苷酸序列为SEQ ID No.3。本发明还公开了含有所述DNA分子的基因编辑系统，以及提高Cas12i3蛋白介导的基因编辑的效率的方法。本发明为了更好的将Cas12i3蛋白应用于哺乳动物基因编辑，设计了不同密码子优化方案，通过软件评估和实验验证，比较筛选出Cas12i3表达量和编辑效果好的密码子优化方案。本发明筛选到在哺乳动物中高效表达Cas12i3蛋白的密码子优化方案，可以极大地提高Cas12i3蛋白的编辑效率，为Cas12i3蛋白在哺乳动物中的广泛应用奠定了基础，有较大的实际应用价值。

Description

密码子优化的Cas12i3蛋白编码基因及其应用

技术领域

本发明属于基因工程技术领域，具体涉及密码子优化的Cas12i3蛋白编码基因及其应用。

背景技术

CRISPR/Cas是原核生物抵御病毒感染或噬菌体入侵产生的一种适应性免疫系统，由于Ⅱ型(如CRISPR/Cas9系统)和V型系统(如CRISPR/Cas12a系统)基因编辑系统组成相对简单，操作简便，编辑效率高，在基因编辑中得到了广泛的研究和应用。CRISPR/Cas9系统通过单向导RNA(single guide RNA，sgRNA)识别DNA靶标之后，Cas9通常会产生双链断裂。然后细胞会通过非同源末端连接机制进行修复和同源重组修复机制修复双链断裂，从而产生插入、缺失或者在有供体模板时产生基因插入和特定碱基改变。目前CRISPR/Cas9技术已广泛应用于微生物、动植物等诸多物种，CRISPR/Cas技术突破了传统育种的局限性，缩短了育种年限，加快了动物遗传改良进程。

中国发明专利CN111757889B中公开了一种Cas蛋白Cas12f.4，在本文中将其称为Cas12i3。该Cas蛋白可以在真核生物中进行编辑。Cas9蛋白和Cas12a蛋白大小约1300个氨基酸，而Cas12i3蛋白大小仅有1045个氨基酸。进一步优化Cas12i3蛋白编码基因以提高Cas12i3蛋白的表达量，开发更高效的基于Cas12i3蛋白的基因编辑系统，可以更好地将Cas12i3蛋白应用于哺乳动物基因编辑，为Cas12i3蛋白在哺乳动物中的广泛应用奠定基础，具有广泛的应用价值。

发明内容

本发明所要解决的技术问题是如何提高Cas12i3蛋白表达量和/或提高Cas12i3蛋白介导的基因编辑的效率。所要解决的技术问题不限于如所描述的技术主题，本领域技术人员通过以下描述可以清楚地理解本文未提及的其它技术主题。

为解决上述技术问题，本发明首先提供了DNA分子，所述DNA分子的核苷酸序列可为SEQ ID No.3。

所述DNA分子可为密码子优化的Cas12i3蛋白基因，其是根据哺乳动物偏好对Cas12i3蛋白编码基因进行的密码子优化。

本发明还提供了生物材料，所述生物材料可为下述任一种：

A1)含有所述DNA分子的表达盒；

A2)含有所述DNA分子的重组载体、或含有A1)所述表达盒的重组载体；

A3)含有所述DNA分子的重组微生物、或含有A1)所述表达盒的重组微生物、或含有A2)所述重组载体的重组微生物；

A4)含有所述DNA分子的重组宿主细胞、或含有A1)所述表达盒的重组宿主细胞、或含有A2)所述重组载体的重组宿主细胞。

进一步地，A1)所述表达盒、A2)所述重组载体、A3)所述重组微生物和A4)所述重组宿主细胞均可表达所述DNA分子。

上述生物材料中，所述宿主细胞可为哺乳动物细胞。

上述生物材料中，所述载体可为质粒、黏粒、噬菌体或病毒载体。

本文所述微生物可为细菌、真菌、放线菌、原生动物、藻类或病毒。其中，所述细菌可来自埃希氏菌属(Escherichia sp.)、欧文氏菌属(Erwinia sp.)、土壤杆菌属(Agrobacterium sp.)、黄杆菌属(Flavobacterium sp.)等但不限于此。所述真菌可为酵母，所述酵母可来自酵母属、克鲁维酵母属、毕赤酵母属等但不限于此。所述放线菌可来自链霉菌属(Streptomyces sp.)、诺卡菌属(Nocardia sp.)、小单孢菌属(Micromonosporasp.)等但不限于此。所述藻类可来自墨角藻属(Fucus sp.)、曲壳藻属(Achnanthes sp.)等但不限于此。所述病毒可为轮状病毒、疱疹病毒、流感病毒、腺病毒等但不限于此。

本文所述宿主细胞(也称为受体细胞)可为动物细胞。所述宿主细胞可理解为不仅是指特定的受体细胞，而且也指这种细胞的后代，且由于天然的、偶然的或有意的突变和/或改变，该子代可以不必与原始的亲代细胞完全一致，但仍包括在宿主细胞的范围中。合适的宿主细胞为本领域已知的，所述动物细胞可为哺乳动物细胞。在本发明的一个或多个实施方案中，所述哺乳动物细胞为绵羊成纤维细胞。

本发明还提供了所述DNA分子和/或所述生物材料的下述任一种应用：

B1)在提高Cas12i3蛋白表达量中的应用；

B2)在提高Cas12i3蛋白基因编辑效率中的应用；

B3)在Cas12i3蛋白介导的基因编辑中的应用；

B4)在制备Cas12i3蛋白介导的基因编辑系统中的应用；

B5)在制备Cas12i3蛋白介导的基因编辑产品中的应用。

本文所述基因编辑可为针对哺乳动物的基因编辑，或针对哺乳动物细胞的基因编辑。

本文所述基因编辑产品可包括细胞模型、动物模型、动物新品种等但不限于此。

本发明还提供了一种基因编辑系统，所述基因编辑系统可包括所述DNA分子和/或A2)所述重组载体。

进一步地，所述基因编辑系统还可包括向导RNA(guide RNA，gRNA)或gRNA表达载体。

所述gRNA表达载体可为含有编码所述gRNA的DNA分子的重组载体。

所述gRNA引导Cas12i3蛋白对目的细胞中的目的基因进行基因编辑。

本文所述基因编辑系统可为Cas12i3蛋白介导的基因编辑系统(CRISPR/Cas12i3基因编辑系统)，能精确定位靶向目的基因，产生切割，使目的基因DNA发生双链断裂。

本发明还提供了所述基因编辑系统在基因编辑、制备基因编辑产品或提高基因编辑效率中的应用。

本发明还提供了一种提高Cas12i3蛋白介导的基因编辑的效率的方法，所述方法可包括利用所述DNA分子、A2)所述重组载体和/或所述基因编辑系统进行基因编辑的步骤。

进一步地，所述方法可包括将所述DNA分子和编码gRNA的DNA分子构建到载体中，得到基因编辑载体，利用所述基因编辑载体对哺乳动物目的基因进行基因编辑。

本文所述基因编辑包括体外基因编辑、体内基因编辑、或其组合。

本文所述基因编辑可包括基因敲除、基因敲入、基因突变、基因片段替换或基因修饰。

进一步地，所述gRNA可靶向ZFX基因或tdTomato基因。

在本发明的一个实施方案中，所述gRNA的靶序列可为SEQ ID No.7。

所述ZFX基因为X连锁锌指蛋白基因(Zinc Finger Protein X-Linked)，是位于X染色体的单拷贝基因。所述ZFX基因(绵羊ZFX基因)的核苷酸序列可为GenBank AccessionNo.NC_056080.1的第22500545-22537460位(Update Date 4-Nov-2022)。

进一步地，所述gRNA可靶向tdTomato基因。

在本发明的一个实施方案中，所述gRNA的靶序列可为SEQ ID No.14。

所述tdTomato基因的核苷酸序列可为GenBank Accession No.KT878736.1的第2529-3959位(Update Date 06-OCT-2015)。

本发明还提供了一种提高Cas12i3蛋白表达量的方法，所述方法可包括构建含有所述DNA分子的重组表达载体，将所述重组表达载体导入宿主细胞，获得重组宿主细胞，培养所述重组宿主细胞的步骤。

进一步地，所述宿主细胞可为绵羊成纤维细胞。

本文所述Cas12i3蛋白的氨基酸序列可为SEQ ID No.1。

为了更好的将Cas12i3蛋白应用于哺乳动物基因编辑，本发明设计了不同密码子优化方案，通过软件评估和实验验证，比较筛选出Cas12i3表达量和编辑效果好的密码子优化方案。本发明筛选到在哺乳动物中高效表达Cas12i3蛋白的密码子优化方案，可以极大地提高Cas12i3蛋白的编辑效率，为Cas12i3蛋白在哺乳动物中的广泛应用奠定了基础，有较大的实际应用价值。

附图说明

图1为未进行哺乳动物密码子优化和4种哺乳动物密码子优化的Cas12i3密码子的密码子使用频率分布图和GC含量分布图。

图2为荧光显微镜观察未进行哺乳动物密码子优化和4种哺乳动物密码子优化的质粒转染24h后绵羊成纤维细胞中EGFP表达情况。

图3为流式分析未进行哺乳动物密码子优化和4种哺乳动物密码子优化的质粒转染24h、48h、72h后绵羊成纤维细胞中EGFP表达的流式散点图。

图4为流式分析未进行哺乳动物密码子优化和4种哺乳动物密码子优化的质粒转染24h、48h、72h后绵羊成纤维细胞中EGFP表达的柱形图。

图5为Western blot检测未进行哺乳动物密码子优化和4种哺乳动物密码子优化的质粒转染48h后的绵羊成纤维细胞中Cas12i3蛋白表达情况。

图6为T7E1检测未进行哺乳动物密码子优化和4种哺乳动物密码子优化的Cas12i3在绵羊成纤维细胞中的编辑效率(转染后48h)。

图7为流式分析未进行哺乳动物密码子优化和4种哺乳动物密码子优化的Cas12i3导致tdTomato标记的绵羊成纤维细胞中的tdTomato平均荧光强度淬灭的比例(转染后48h)。

图8为流式分析未进行哺乳动物密码子优化和4种哺乳动物密码子优化的Cas12i3导致tdTomato标记的绵羊成纤维细胞中的弱tdTomato荧光强度(<10³)的细胞数比例(转染后48h)。

图9为转染未进行哺乳动物密码子优化和Codon OptimWiz密码子优化的Cas12i3质粒后的的tdTomato标记的绵羊成纤维细胞的tdTomato荧光分布峰图(转染后48h)。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南，并不以任何方式构成对本发明的限制。

下述实施例中的实验方法，如无特殊说明，均为常规方法，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

定义

在本发明中，除非另有说明，否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且，本文中所用的分子遗传学、核酸化学、化学、分子生物学、生物化学、细胞培养、微生物学、细胞生物学、基因组学和重组DNA等操作步骤均为相应领域内广泛使用的常规步骤。同时，为了更好地理解本发明，下面提供相关术语的定义和解释。

gRNA

“向导RNA(guide RNA，gRNA)”、“成熟crRNA”可互换地使用并且具有本领域技术人员通常理解的含义。一般而言，向导RNA可以包含同向(Direct)重复序列和导向序列(guidesequence)，或者基本上由同向重复序列和导向序列(在内源性CRISPR系统背景下也称为间隔序列(spacer))组成。在某些情况下，导向序列是与靶序列具有足够互补性从而与所述靶序列杂交并引导CRISPR/Cas复合物与所述靶序列的特异性结合的任何多核苷酸序列。

Cas蛋白

一种核酸酶蛋白，“Cas蛋白”能与“Cas核酸酶”、“Cas酶”、“CRISPR/Cas蛋白”、“Cas效应蛋白”可以互换地使用。本发明所述的Cas蛋白选自V型Cas家族蛋白的Cas12i3蛋白。Cas蛋白与gRNA或成熟crRNA一旦与待检测特征序列(靶序列)结合形成的核糖核蛋白复合体，其包含杂交到靶序列上并且与Cas蛋白结合的导向序列。该核糖核蛋白复合体能够识别并切割能与该向导RNA或成熟crRNA杂交的多核苷酸。

靶序列

靶序列与“靶点序列”、“靶点识别序列”等可交换使用，靶点序列对应于spacer。靶序列决定了基因编辑的位置，决定了特异性。

密码子优化

密码子优化(Codon optimization)是指在不改变蛋白质氨基酸的情况，主要利用偏爱密码子(Preferred codons)，避免利用率低的稀有密码子，对目的基因进行优化的过程。密码子优化之后基因与原始序列呈现散发性多处突变。在蛋白质合成过程中，密码子扮演着将基因信息翻译为蛋白序列信息的重要角色。不同的物种翻译同样一个氨基酸可能使用不同的密码子，并且因物种不同而带有密码子偏好性。尽管目前尚未得知密码子偏好性的自然形成的原因，但是这种现象对于蛋白表达效率的影响是显著的。对于重组蛋白表达，为获得最佳表达效果，通常需要根据物种的密码子偏好性进行序列优化。特别是使用异源性的蛋白质表达系统时，由于来源于另一物种的目的基因需要在自然条件下不表达该基因的宿主中进行重组蛋白表达，这种优化因此显得更为重要。密码子优化还应用在改善mRNA稳定性，增强转录和翻译效率等方面。

密码子适应指数

密码子适应指数(Codon adaptation index，CAI)是指编码区同义密码子与最佳密码子使用频率的相符程度，取值在0～1之间。CAI可以用来评估外源基因在宿主内的表达水平，CAI越高，则外源基因在宿主内的表达水平越高。密码子适应指数分析工具的工作原理为：以高表达基因的序列为参考(参考序列)，评估目的基因与参考序列的密码子使用频率相符程度。如果分析得到的CAI很低，则基因在宿主细胞内的表达水平低。

稀有密码子

稀有密码子：遗传密码子有64种，但是绝大多数生物使用密码子具有偏好性，倾向于利用这些密码子中的一部分。被最频繁利用的称为最佳密码子，那些不被经常利用的称为稀有密码子。稀有密码子的使用频率是影响重组表达水平的一个重要因素，利用稀有密码子计算工具可以计算出目标序列的密码子使用频率，并且显示密码子使用频率的分布情况。根据分析结果对序列进行优化，可以有效提高重组蛋白的表达水平。在进行重组蛋白表达前，了解序列中稀有密码子的使用频率、分布情况并对序列进行优化是十分重要的。

载体

指在基因工程重组DNA技术中将DNA片段(目的基因)转移至受体细胞的一种能自我复制的DNA分子。三种最常用的载体是细菌质粒、噬菌体和动植物病毒。载体按功能可分为克隆载体和表达载体。克隆载体是最简单的载体，主要用来克隆和扩增DNA片段。主要有质粒载体、噬菌体载体、病毒载体。表达载体除具有克隆载体的基本元件外，还具有转录、翻译所必需的DNA元件，如启动子和终止子。本发明中涉及到的启动子有U6和CBh启动子，U6启动子属于pol III型启动子，它驱动的序列长度很小，目前常见的利用U6启动子进行表达的有gRNA和siRNA等。U6启动子驱动的序列，在遇到pol(U)时会终止。CBh启动子是人工构建的组合启动子，由巨细胞病毒(the cytomegalovirus，CMV)、早期增强子(early enhancerelement)、鸡β-肌动蛋白(chicken beta-actin)启动子和鸡β-肌动蛋白(chickenβ-actin，CBA)与鼠细小病毒(minute virus of mice，MMV)内含子的混合序列组成，用于驱动基因在哺乳动物载体的高水平表达。

T7E1酶切

T7E1全称为T7 Endonuclease I，是一种比较特殊的DNA内切酶，能识别并切割不完全配对的DNA、十字型结构DNA、Holliday结构等。T7E1常用于CRISPR/Cas、TALEN以及其它编辑工具形成的突变体检测。

下述实施例中的原代绵羊成纤维细胞为实验室自己分离。制备方法如下：取出生2周内的绵羊少许耳组织，放入PBS中。在超净台中，将耳组织放在75％酒精中消毒1min，PBS洗3遍，用无菌的剪子将耳组织剪碎至1mm3大小，加入200μL胎牛血清，移至细胞培养皿中，在37℃、5％ CO2培养箱中倒置放1h。小心加入完全培养基，添加时注意不要将组织块冲起。培养约1周后，从组织块爬出成纤维细胞。待长满后胰酶消化下来，扩大培养后，冻存备用。

下述实施例中的PX458载体来源于Addgene质粒共享信息库(编号为48138)。

实施例1、Cas12i3密码子优化方案的设计与评估

1、设计不同Cas12i3密码子优化方案

针对Cas12i3氨基酸序列(SEQ ID No.1)，除了未进行哺乳动物密码子优化序列(Unoptimized)外还设计了4种哺乳动物密码子优化方案(Codon OptimWiz、GeneOptimizer、Jcat和General Biol)。

Unoptimized表示未哺乳动物密码子优化方案，未优化的Cas12i3蛋白编码序列的核苷酸序列如SEQ ID No.2所示。

Codon OptimWiz、GeneOptimizer、Jcat和General Biol表示4种哺乳动物密码子优化方案，其中：按照Codon OptimWiz方案优化的Cas12i3蛋白编码序列的核苷酸序列如SEQ ID No.3所示；按照GeneOptimizer方案优化的Cas12i3蛋白编码序列的核苷酸序列如SEQ ID No.4所示；按照Jcat方案优化的Cas12i3蛋白编码序列的核苷酸序列如SEQ IDNo.5所示；按照General Biol方案优化的Cas12i3蛋白编码序列的核苷酸序列如SEQ IDNo.6所示。

2、软件评估不同密码子优化方案

密码子适应指数(Codon adaptation index，CAI)是指异源序列中密码子和宿主细胞最佳密码子使用频率的相符程度，理论上此数值越接近1，外源mRNA在宿主细胞中的蛋白表达越高。表1列出4种哺乳动物密码子优化方案下Cas12i3密码子在人和绵羊中的CAI，相较于Unoptimized，4种密码子优化的Cas12i3密码子在人和绵羊物种中的CAI均有所提高，尤其是Jcat和Codon OptimWiz方案的CAI为1或者接近1(Jcat方案在人和绵羊中的CAI分别为0.99和1.00，Codon OptimWiz方案在人和绵羊中的CAI分别为0.98和0.96)。密码子使用频率图显示Unoptimized有较多的稀有密码子，其他4种优化方案均有较大的改善，尤其是Jcat和Codon OptimWiz方案(图1)。

GC含量是影响表达的重要因素。相较于AT间的2个氢键，GC间存在3个氢键，所以GC含量是直接影响DNA的稳定性。高GC含量会间接降低蛋白质表达。表1列举出了5种密码子的GC含量，其范围为53.67％到63.22％。通过金斯瑞稀有密码子分析工具(https://www.genscript.com/tools/rare-codon-analysis)分析了5种密码子的整体GC含量分布。GC含量分布情况显示，Jcat有较多区域GC含量超过70％(GC含量低于30％或者高于70％可能会减低蛋白表达水平)，Unoptimized和Codon OptimWiz有少量区域GC含量超过70％，可能会影响Cas12i3表达(图1)。

表1、Cas12i3密码子CAI值

尽管Jcat和Codon OptimWiz方案在CAI方面的评估显示这两种密码子方案较为优秀，但由于同时这两种方案还受到GC含量的影响，因此还需进一步进行实验验证以筛选最优的哺乳动物密码子优化方案。

实施例2、不同密码子优化方案的Cas12i3表达量

1、载体构建

用限制性内切酶BbsI(NEB(北京)有限公司)和XbaI(NEB(北京)有限公司)双酶切PX458(U6-sgRNA-CBh-Cas9-T2A-EGFP-bGH polyA)以去除sgRNA支架序列。酶切体系：PX4585μg，BbsI 25units，XbaI 25units，cutsmart 10μL，ddH₂O补至100μL。反应条件：37℃孵育6h。通过回收试剂盒(广州美基生物科技有限公司，货号D2111-02)回收并检测浓度。合成引物5’-CACCACTAGTT-3’和5’-CTAGAACTAGT-3’退火生成与上述酶切后的线性PX458载体互补的DNA双链。退火体系：5’-CACCACTAGTT-3’(100μM)2.5μL，5’-CTAGAACTAGT-3’(100μM)2.5μL，T4 ligase buffer 1μL，ddH₂O补至10μL。退火程序：金属浴95℃5min，然后打开金属浴盖子，关闭金属浴，待冷却至室温。将回收后的线性PX458载体(BbsI和XbaI双酶切后)与退火产物通过T4连接酶试剂盒(宝日医生物技术有限公司)连接成U6-CBh-Cas9-T2A-EGFP-bGHpolyA。

通过限制性内切酶AgeI(NEB(北京)有限公司)和FseI(NEB(北京)有限公司)双酶切上述质粒U6-CBh-Cas9-T2A-EGFP-bGH polyA以去除Cas9编码序列。酶切体系：上述质粒(U6-CBh-Cas9-T2A-EGFP-bGH polyA)5μg，AgeI 20units，FseI 20units，cutsmart 10μL，ddH2O补至100μL。反应条件：37℃孵育6h。通过回收试剂盒(广州美基生物科技有限公司，货号D2111-02)回收并检测浓度。将该酶切产物(AgeI和FseI双酶切质粒U6-CBh-Cas9-T2A-EGFP-bGH polyA)、不同密码子优化的Cas12i3蛋白编码DNA(SEQ ID No.2、SEQ ID No.3、SEQ ID No.4、SEQ ID No.5和SEQ ID No.6)通过无缝克隆试剂盒进行组装得到的重组载体分别为U6-CBh-Cas12i3(Unoptimized)-T2A-EGFP-bGH polyA、CBh-Cas12i3(CodonOptimWiz)-T2A-EGFP-bGH polyA、U6-CBh-Cas12i3(GeneOptimizer)-T2A-EGFP-bGHpolyA、U6-CBh-Cas12i3(Jcat)-T2A-EGFP-bGH polyA和U6-CBh-Cas12i3(General Biol)-T2A-EGFP-bGH polyA。该载体在Cas12i3序列后通过T2A连接了荧光报告基因——EGFP，Cas12i3与EGFP在同一个开放阅读框(Open reading frame，ORF)进行转录与翻译，因此EGFP的表达能够间接反映Cas12i3的表达。

2、细胞电转染

将状态良好的绵羊成纤维细胞传到10cm培养皿中并培养至细胞汇合度为80％左右。胰酶消化收集细胞至EP管。用100μL电转液(北京英格恩生物科技有限公司，货号98668-20)悬浮并加入7μg质粒(上述构建的5种质粒)，混合均匀。放入Lonza Amaxa Nucleofector2B细胞核转染仪中，调至程序A-033，电转。电转结束后，立马加入500μL DMEM高糖培养基，37℃细胞培养箱静置10min。用含20％ FBS的完全培养基将细胞铺至6孔板中。6h后，换为含15％ FBS的完全培养基。

3、数据分析

在转染24h后，荧光显微镜观察结果显示，在4种密码子优化方案中，CodonOptimWiz方案有着最强的EGFP荧光，GeneOptimizer、Jcat和General Biol方案也有较强的EGFP荧光，Unoptimized有着最弱的EGFP荧光(图2)。

在转染24h、48h、72h后，将细胞消化下来并进行流式上机分析EGFP阳性细胞的EGFP荧光强度。结果显示，在24h、48h、72h均显示Condon OptimWiz方案的EGFP表达最高。Jcat方案也有较高的EGFP表达。然后是GeneOptimizer方案和General Biol方案。Unoptimized的EGFP表达最弱(图3和图4)。

在转染了未优化和4种密码子优化的质粒48h后，提取了细胞总蛋白，通过WesternBlot检测Cas12i3蛋白的表达，Western blot结果显示，Codon OptimWiz和Jcat的Cas12i3的表达最高，GeneOptimizer表达次之，General Biol和Unoptimized均显示较弱的表达(图5)。

实施例3、T7E1酶切法检测不同密码子优化方案的Cas12i3编辑效果

1、设计靶点序列

实施例2中构建的5种重组载体通过KpnI(NEB(北京)有限公司)和SpeI(NEB(北京)有限公司)双酶切并回收(U6启动子后有SpeI和KpnI酶切识别位点)。酶切体系：上述质粒5μg，SpeI 50units，KpnI 50units，cutsmart 10μL，ddH₂O补至100μL。反应条件：37℃孵育6h。然后加入5μL BeyoAP碱性磷酸酶(碧云天生物科技有限公司，货号D7027)，37℃继续孵育10min。通过回收试剂盒(广州美基生物科技有限公司，货号D2111-02)回收并检测浓度。

本发明选择绵羊内源基因ZFX(GenBank Accession No.NC_056080.1的第22500545-22537460位(Update Date 4-Nov-2022))，并设计了靶向ZFX基因的gRNA(gRNA1)的靶点序列，靶点序列为5’-CAGTACAGCAAGAGTGGATGAAT-3’(SEQ ID No.7)。通过下述引物(表2)扩增表达gRNA的DNA片段(5’-aaaggacgaaacaccGCTCTGACCACCTGAGAG AATGTGTGCATAGTCACACCAGTACAGCAAGAGTGGATGAATTTTTTTTgtacccgttacataa-3’(SEQ ID No.8)，其中大写字母标识的为直接重复序列+靶点序列+转录终止信号，小写字母标识的为载体同源序列。PCR扩增体系：F 1μL，R 1μL，PrimeSTAR 15μL，ddH₂O13μL。PCR扩增程序：98℃预变性3min；98℃变性10s，60℃退火15s，72℃延伸5s(33个循环)；72℃延伸5min。PCR完成后将PCR产物通过产物回收试剂盒(广州美基生物科技有限公司，货号D2111-02)进行回收并测定浓度。

表2、扩增表达gRNA的DNA片段所用引物(靶向ZFX基因)

通过无缝克隆试剂盒将上述表达gRNA的DNA片段(SEQ ID No.8)分别与SpeI和KpnI双酶切后的5种重组载体同源重组成带ZFX靶点的5种重组载体，即为基因编辑载体。

上述基因编辑载体含有ZFX基因编辑靶点和不同Cas12i3密码子(Unoptimized、Codon OptimWiz、GeneOptimizer、Jcat和General Biol)，在导入受体细胞后，其转录出的向导RNA通过碱基互补配对可以靶向ZFX基因，使ZFX基因靶点上下游的DNA双链断裂，不同密码子优化方案导致Cas12i3的表达量不同，导致不同的基因编辑效率。

2、电转染并T7E1酶切

通过电转染(电转步骤同实施例2中的电转步骤)将本实施例步骤1中的5种基因编辑载体分别转入绵羊成纤维细胞中，48h后通过基因组提取试剂盒(广州美基生物科技有限公司，货号D3018-02)提取基因组。将提取好的绵羊基因组，取100ng作为模板进行PCR扩增。扩增反应体系及扩增程序：扩增反应的总体积为50μL，使用表3中引物进行扩增，其各种成分分别为：DNA模板100ng，10μmol/L上下游引物各1μL，PrimeSTAR(宝日医生物科技有限公司)25μL，用灭菌去离子水补齐至50μL。PCR反应程序为：98℃预变性3min；98℃变性10s，60℃退火15s，72℃延伸30s(33个循环)；最后72℃延伸5min。PCR完成后将PCR产物通过产物回收试剂盒进行回收并测定浓度。

表3、靶点周围序列获取引物

取上一步PCR回收产物，配制酶切体系如下：扩增产物500ng，cutsmart 1.1μL，ddH₂O补至11.5μL。混合均匀后，按照杂交程序：95℃10min；-2℃/s降至85℃；-0.1℃/s降至25℃。加入0.5μL的T7E1(NEB(北京)有限公司)，37℃酶切15min，立即加入2μL LoadingBuffer，配制2％的琼脂糖进行电泳分析，在凝胶成像系统观察并分析酶切后结果。

通过琼脂糖凝胶电泳图观察到，Codon OptimWiz、GeneOptimizer和Jcat有着较高的编辑效率(分别为15.6％、15.8％、14.5％)，Unoptimized和General Biol编辑效率较低(分别为13.2％和8.2％)(图6)。

实施例4、流式分析法检测不同密码子优化方案的Cas12i3编辑效果

1、tdTomato红色荧光标记的绵羊成纤维细胞的构建

1-1、构建CRISPR/Cas9基因打靶载体

1-1-1、酶切PX458载体

酶切体系：PX458载体5μg，BbsI 50units，cutsmart 10μL，ddH₂O补齐至100μL。37℃条件下酶切5h。酶切完成后，将酶切产物通过产物纯化试剂盒(广州美基生物科技有限公司)进行纯化，得到纯化的PX458 BbsI酶切产物。针对山羊ZFY基因序列设计靶点(oligo)，按照表4合成靶点序列。

表4、sgRNA靶点序列

1-1-2、oligo退火

设计的oligo按照如下退火体系和退火程序进行退火，退火形成退火产物(双链DNA)。

退火体系：ZFY-sgRNA-F(100μM)2.5μL，ZFY-sgRNA-R(100μM)2.5μL，T4 ligasebuffer 1μL，ddH₂O补齐至10μL。退火程序：金属浴95℃5min，关闭金属浴，打开盖子，待其温度降至室温后取出。

1-1-3、连接

将上述退火产物稀释50倍，并按照如下连接体系和连接程序与步骤1-1-1中的PX458BbsI酶切产物进行连接。

连接体系：PX458 BbsI酶切产物90ng，退火产物(稀释后)1μL，T4 ligase 0.5μL，T4 ligase buffer 1μL，ddH₂O补齐至10μL。连接程序：25℃反应1h。

取上述连接产物10μL用于转化，挑菌测序并质粒大提，构建得到CRISPR/Cas9基因打靶载体(即sgRNA表达载体)，命名为PX458-ZFY-sgRNA。

1-2、构建供体质粒

本实验室保存有pCBh-tdTomato-SV40 polyA质粒，该质粒的构建过程：首先通过SpeI和XbaI双酶切pROSA26-promoter(Addgene 21710)，得到酶切后的pROSA26-promoter，将SEQ ID No.9(tdTomato-SV40 polyA序列)所示的DNA分子，通过无缝克隆组装技术与酶切后的pROSA26-promoter连接，得到pROSA26-tdTomato-SV40 polyA。再用KpnI和AgeI双酶切PX458获得CBh启动子，以pROSA26-tdTomato-SV40 polyA为模板，以引物F(5’-tttttttcaggttggaccggTGCCACCATGGACTAGTATGGTGAGCAAGGGCGA-3’)和引物R(5’-taccgtaagttatgtaacggggtacCCAGCTTTTGTTCCCTTTAGT-3’)扩增除ROSA26启动子以外的序列，将该序列与CBh启动子序列通过无缝克隆组装技术，构建得到pCBh-tdTomato-SV40polyA。

该质粒能够在原代山羊成纤维细胞中，正常表达红色荧光。以核酸酶在ZFY靶点切割的位置(PAM上游3-4bp处)两边的序列作为同源臂(左同源臂(HA-L)为925bp，核苷酸序列为SEQ ID No.10，右同源臂(HA-R)为958bp，核苷酸序列为SEQ ID No.11)。按照表5引物通过PCR扩增左右同源臂后，通过PCR产物回收试剂盒(美基生物科技有限公司)回收。

酶切质粒pCBh-tdTomato-SV40 polyA，通过无缝克隆组装技术将ZFY靶点的左右同源臂对应克隆至pCBh-tdTomato-SV40 polyA的两端，构建成质粒HA-L-CBh-tdTomato-SV40polyA-HA-R。紧接着在左右同源臂的外侧加入ZFY靶点的识别序列，构建HMEJ(同源臂介导的末端连接，Homology-mediated end joining)所需要的供体质粒类型。另外，构建的供体质粒上左右同源臂尽管来源于山羊，但与绵羊的对应位点有极高的同源性，通过NCBIBLAST，对比显示左同源臂的的同源性为96.11％，右同源臂的为同源性为97.66％。其中绵羊左同源臂的核苷酸序列为SEQ ID No.12，绵羊右同源臂的核苷酸序列为SEQ ID No.13。

表5、ZFY左右同源臂引物

1-3、构建tdTomato红色荧光标记的绵羊成纤维细胞

利用本实施例中构建的CRISPR/Cas9基因打靶载体PX458-ZFY-sgRNA和供体质粒HA-L-CBh-tdTomato-SV40polyA-HA-R(携带外源基因tdTomato基因，尽管同源臂来源于山羊，但与绵羊对应的同源臂有很高的同源性，因此预计可用于绵羊)将外源基因(tdTomato基因)通过HMEJ方法介导的重组定点整合到ZFY基因的打靶位点中，构建在ZFY基因中定点整合外源基因的绵羊成纤维细胞系。具体步骤如下：

1-3-1、基因编辑质粒和供体质粒共转染绵羊成纤维细胞

取构建好的供体质粒HA-L-CBh-tdTomato-SV40 polyA-HA-R 5000ng和携带ZFY靶点的基因打靶载体PX458(PX458-ZFY-sgRNA)9536ng(摩尔比1:1.5)通过电转(电转步骤同实施例2中步骤2的电转步骤，仅添加的质粒不同)至原代绵羊成纤维细胞，24h后通过流式分选tdTomato和EGFP阳性的原代绵羊成纤维细胞，并以约每皿500个细胞铺到细胞培养10cm细胞培养皿中。培养2周后，通过克隆环将细胞培养皿中的细胞单克隆消化至96孔板中培养。

1-3-2、定点整合tdTomato的绵羊成纤维细胞筛选

待96孔板的细胞克隆长满后，消化细胞，留一半原孔培养，另取一半细胞至1.5mL离心管中。12000rpm，离心3min，弃去上清，加入50μL的细胞鉴定裂解液(细胞鉴定裂解液配制：Tris-HCl(1M，PH＝8.0)2mL，Triton X-100 0.45mL，NP-40 0.45mL，蛋白酶K 0.02g，加入去离子水溶解并定容至50mL，0.22μm滤器过滤)，充分悬浮细胞，按以下程序裂解：65℃，30min；95℃，15min；16℃，∞。获得的裂解液作为DNA模版。按照表6设计引物并进行PCR鉴定。

表6、定点整合鉴定引物

扩增反应体系及扩增程序：扩增反应的总体积为50μL，其各种成分分别为：DNA模板1μL，10μmol/L上下游引物各1μL，PrimeSTAR(宝日医生物科技有限公司)10μL，用灭菌去离子水补齐至20μL。PCR反应程序为：98℃预变性3min；98℃变性10s，62℃退火15s，72℃延伸50s(33个循环)；最后72℃延伸5min。PCR结束后琼脂糖凝胶电泳检测结果。

结果显示，裂解了16个细胞单克隆，通过PCR鉴定到3个克隆为ZFY定点整合的细胞单克隆。同时通过荧光显微镜观察，三个克隆均发出红色的荧光。说明外源基因(tdTomato基因)在打靶位点处发生了定点整合，成功构建了tdTomato红色荧光标记的绵羊成纤维细胞。

2、设计靶点序列和构建基因编辑载体

本实施例选择上述步骤1构建的ZFY定点整合tdTomato的细胞克隆作为后续评估通过不同Cas12i3密码子优化方案对编辑效率的影响的细胞株。本实施例针对tdTomato编码序列(GenBank Accession No.KT878736.1的第2529-3959位(Update Date 06-OCT-2015))设计靶向tdTomato基因的gRNA(gRNA2)的靶点序列，靶点序列为5’-AAGACCATCTACATGGCCAAGAA-3’(SEQ ID No.14)。通过表7中的引物扩增表达gRNA序列的DNA片段(5’-aaaggacgaaacaccGCTCTGACCACCTGAGAGAATGTGTGCATAGTCACACAAGACCATCTACATGGCCAAGAATTTTTTTgtacccgttacataa-3’(SEQ ID No.15)，其中大写字母标识的为直接重复序列+靶点序列+转录终止信号，小写字母标识的为载体同源序列，并将PCR产物通过产物回收试剂盒(广州美基生物科技有限公司，货号D2111-02)进行回收并测定浓度。

表7扩增表达gRNA的DNA片段所用引物(靶向tdTomato基因)

通过无缝克隆试剂盒将上述表达gRNA的DNA片段(SEQ ID No.15)分别与实施例3中SpeI和KpnI双酶切后的5种重组载体同源重组成带tdTomato靶点的5种重组载体，即为基因编辑载体。

上述基因编辑载体含有tdTomato基因编辑靶点和不同Cas12i3密码子(Unoptimized、Codon OptimWiz、GeneOptimizer、Jcat和General Biol)，在导入受体细胞后，其转录出的向导RNA通过碱基互补配对可以靶向tdTomato基因，使tdTomato基因靶点上下游的DNA双链断裂，不同密码子优化方案导致Cas12i3的表达量不同，导致不同的基因编辑效率。

2、电转染并流式分析tdTomato荧光变化

通过电转染(电转步骤同实施例2中的电转步骤)将本实施例步骤2中的5种质粒转染到步骤1中构建的tdTomato红色荧光标记的绵羊成纤维细胞中，电转步骤同实施例2中的电转步骤。电转48h后，通过流式细胞仪分析不同Cas12i3密码子优化方案对EGFP阳性细胞(只看EGFP阳性细胞是因为上述5种基因编辑载体上均携带有EGFP表达序列，该序列是来源PX458载体，EGFP阳性细胞代表该细胞是成功转染质粒的细胞，有助减少细胞转染导致的误差)的tdTomato红色荧光强度的变化的影响，具体为计算tdTomato平均荧光强度淬灭的比例以及荧光强度较弱(EGFP阳性细胞中tdTomato荧光强度小于10³)的细胞数的占比。通过计算EGFP阳性细胞的tdTomato平均荧光强度淬灭的比例显示，在4种密码子优化方案中，Codon OptimWiz组tdTomato平均荧光强度淬灭的比例最高，并且显著地高于Unoptimzed组(图7)。表明Codon OptimWiz方案在tdTomato基因上具有较高的编辑效率，造成较多细胞中tdTomato蛋白功能失活，最终导致较多细胞红色荧光减弱甚至淬灭，使整体的细胞tdTomato荧光强度降低，即tdTomato平均荧光强度淬灭的比例较大。同样的，通过计算EGFP阳性细胞中的弱tdTomato荧光强度的(<10³)的细胞数占比显示，与Unoptimzed相比，CodonOptimiWiz方案提高了弱tdTomato荧光强度(<10³)的细胞数占比(图8)。同时流式分析显示Codon OptimWiz方案相比于Unoptimized，tdTomato荧光峰图整体向左平移(坐标轴从左到右表示tdTomato荧光强度由弱到强)(图9)，表明Codon OptimWiz方案在tdTomato基因上具有较高的编辑效率，造成较多细胞中tdTomato蛋白功能失活，最终导致红色荧光减弱甚至淬灭，造成整体细胞群的tdTomato荧光强度减弱。

以上结果显示，通过荧光显微镜观察EGFP荧光强度、流式分析EGFP的荧光强度、Western blot检测Cas12i3的表达方法来间接和直接检测Cas12i3的表达，4种Cas12i3的哺乳动物密码子优化方案中，Codon OptimWiz密码子优化方案均显示能够高效表达Cas12i3。另外，通过T7E1酶切法检测未优化和4种密码子优化方案在绵羊内源基因ZFX位点上的编辑效率以及通过流式分析在外源基因tdTomato的编辑效果，结果显示，相比于其它密码子优化方案，Codon OptimWiz有着相对更好的编辑效率。本发明设计了4种Cas12i3密码子优化方案，通过软件评估、实验验证证明其中的Codon OptimWiz密码子优化方案能够在哺乳动物细胞中高效表达Cas12i3蛋白并高效发挥编辑作用，对Cas12i3在哺乳动物细胞中的广泛应用奠定了基础。

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围，可以进行一些基本特征的应用。

Claims

1.DNA分子，其特征在于，所述DNA分子的核苷酸序列为SEQ ID No.3。

2.生物材料，其特征在于，所述生物材料为下述任一种：

A1)含有权利要求1所述DNA分子的表达盒；

A2)含有权利要求1所述DNA分子的重组载体、或含有A1)所述表达盒的重组载体；

A3)含有权利要求1所述DNA分子的重组微生物、或含有A1)所述表达盒的重组微生物、或含有A2)所述重组载体的重组微生物；

A4)含有权利要求1所述DNA分子的重组宿主细胞、或含有A1)所述表达盒的重组宿主细胞、或含有A2)所述重组载体的重组宿主细胞。

3.根据权利要求2所述的生物材料，其特征在于，所述宿主细胞为哺乳动物细胞。

4.权利要求1所述的DNA分子和/或权利要求2或3所述生物材料的下述任一种应用：

B1)在提高Cas12i3蛋白表达量中的应用；

B2)在提高Cas12i3蛋白基因编辑效率中的应用；

B3)在Cas12i3蛋白介导的基因编辑中的应用；

B4)在制备Cas12i3蛋白介导的基因编辑系统中的应用；

B5)在制备Cas12i3蛋白介导的基因编辑产品中的应用。

5.一种基因编辑系统，其特征在于，所述基因编辑系统包括权利要求1所述的DNA分子和/或权利要求2中所述的重组载体。

6.权利要求5所述的基因编辑系统在基因编辑、制备基因编辑产品或提高基因编辑效率中的应用。

7.一种提高Cas12i3蛋白介导的基因编辑的效率的方法，其特征在于，所述方法包括利用权利要求1所述的DNA分子、权利要求2中所述的重组载体和/或权利要求5所述的基因编辑系统进行基因编辑的步骤。

8.根据权利要求7所述的方法，其特征在于，所述方法包括将权利要求1所述的DNA分子和编码gRNA的DNA分子构建到载体中，得到基因编辑载体，利用所述基因编辑载体对哺乳动物目的基因进行基因编辑。

9.根据权利要求8所述的方法，其特征在于，所述gRNA靶向ZFX基因或tdTomato基因。

10.一种提高Cas12i3蛋白表达量的方法，其特征在于，所述方法包括构建含有权利要求1所述DNA分子的重组表达载体，将所述重组表达载体导入宿主细胞，获得重组宿主细胞，培养所述重组宿主细胞的步骤。