CN116640749A - 胞苷脱氨酶突变体及基于胞苷脱氨酶突变体构建的碱基编辑器 - Google Patents

胞苷脱氨酶突变体及基于胞苷脱氨酶突变体构建的碱基编辑器 Download PDF

Info

Publication number
CN116640749A
CN116640749A CN202210140362.5A CN202210140362A CN116640749A CN 116640749 A CN116640749 A CN 116640749A CN 202210140362 A CN202210140362 A CN 202210140362A CN 116640749 A CN116640749 A CN 116640749A
Authority
CN
China
Prior art keywords
lys
cbe
leu
mutant
cytidine deaminase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210140362.5A
Other languages
English (en)
Inventor
程田林
张淑倩
邱佳怡
陈金龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN202210140362.5A priority Critical patent/CN116640749A/zh
Publication of CN116640749A publication Critical patent/CN116640749A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04005Cytidine deaminase (3.5.4.5)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/55Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明属于基因编辑技术领域,涉及胞苷脱氨酶突变体及基于胞苷脱氨酶突变体构建的碱基编辑器。本发明通过在胞苷脱氨酶LjCDA1中引入不同突变,开发了新的胞苷脱氨酶突变体,通过将胞苷脱氨酶突变体融合于SpCas9为代表的突变型核酸酶的不同位点,得到的新融合蛋白,即碱基编辑器CBE,能对位于前间隔序列不同位置的胞嘧啶实现有效的C‑T碱基突变。本发明所获得的CBE变体具有多样化C‑T编辑碱基偏好性和活性窗口,相关的CBE变体其Cas非依赖的DNA脱靶效应和RNA脱靶效应均处于低水平甚至被清除。本发明可实现更广范围、更精细且安全性更高的C‑T单碱基替换,能有效拓宽单碱基编辑工具的应用,具有很高的应用价值。

Description

胞苷脱氨酶突变体及基于胞苷脱氨酶突变体构建的碱基编 辑器
技术领域
本发明属于基因编辑技术领域,尤其是涉及一种胞苷脱氨酶突变体及基于胞苷脱氨酶突变体构建的碱基编辑器。
背景技术
CRISPR/Cas9为代表的新型基因编辑技术在编辑效率方面具有优势,有效推动了基因编辑技术的发展和进步。2016年以来,研究者以CRISPR/Cas9、CRISPR/Cas12a(Cpf1)、CRISPR/Cas12f为基础,已经开发出多种DNA碱基编辑工具,可在基因组水平实现高效精准的点突变,且此过程中不会产生DNA双链断裂。目前碱基编辑器主要有两种:胞嘧啶碱基编辑器(CBE,可介导C·G--T·A突变)和腺嘌呤碱基编辑器(ABE,可介导A·T--G·C突变)。其中,CBE是将特定的胞嘧啶核苷脱氨酶(cytidine deaminase)与突变型核酸酶(如携带有D10A或突变的spCas9,称为nspCas9;或是功能失活型Cas12a或Cas12f,称为dCas12a或dCas12f)以及尿嘧啶糖基化酶抑制因子(UGI)融合,得到的融合蛋白可在sgRNA的引导下,介导C·G--T·A突变。
现有CBE工具中的脱氨酶多属于胞嘧啶核苷脱氨酶(cytidine deaminase)家族,胞嘧啶核苷脱氨酶本身对单链DNA(ssDNA)有高亲和性,这导致多数CBE工具存在Cas非依赖的DNA脱靶效应,因此有很大的安全隐患。虽然研究者采用多种策略对CBE工具进行优化,但依然缺少在RNA/DNA脱靶效应以及编辑窗口/精度等多个方面进行协同优化的CBE工具。完成RNA/DNA脱靶效应优化的CBE工具的活性窗口非常局限,极大的限制了CBE的应用前景(Nat Biotechnol,2020.38(5):620-628;Nat Commun,2020.11(1):2052;Nat Methods,2020.17(6):600-604)。
发明内容
为开发具有低水平RNA/DNA脱靶效应且多样化活性窗口的CBE工具,本发明提供胞苷脱氨酶突变体及基于胞苷脱氨酶突变体构建的碱基编辑器。
本发明通过开发筛选新的胞苷脱氨酶突变体,将胞苷脱氨酶突变体与nSpCas9为代表的突变型核酸酶的不同位点(N-末端、C-末端和内部插入位点)融合,得到的新融合蛋白,即为碱基编辑器CBE。
本发明开发出的碱基编辑器CBE可有效实现C-T单碱基替换,而且Cas非依赖的DNA脱靶效应和RNA脱靶效应均处于低水平甚至被清除。根据胞苷脱氨酶突变位置及突变特征的不同,新构建的碱基编辑器还具有不同的碱基偏好性和活性窗口。本发明能有效拓宽单碱基编辑工具的应用。
本发明的目的可以通过以下技术方案来实现:
本发明首先提供一种胞苷脱氨酶突变体,为基于胞苷脱氨酶LjCDA1进行的以下突变中的一种,所述胞苷脱氨酶LjCDA1的氨基酸序列如SEQ ID NO.1所示:
(1)LjCDA1的RL1(第25~30氨基酸)替换为A3A对应位置(第25~30氨基酸)的GI氨基酸,突变体命名为Lj-RL1(A3A);
(2)LjCDA1的RL1(第25~30氨基酸)替换为LpCDA1对应位置(第25~30氨基酸)的YKRSPS氨基酸,突变体命名为Lj-RL1(Lp);
(3)LjCDA1的RL1(第25~30氨基酸)替换为LpCDA1L1_1对应位置(第25~30氨基酸)的LHYAEG氨基酸,突变体命名为Lj-RL1(Lp1L1-1);
(4)LjCDA1的RL2(第125~136位氨基酸LYFENIKRNQIG)替换为AID对应位置(第125~136氨基酸)的LYFCEDRKAEPEG氨基酸,突变体命名为Lj-RL2(AID);
(5)LjCDA1的RL2(第125~136位氨基酸LYFENIKRNQIG)替换为APOBEC3F对应位置(第125~136氨基酸)的LYYFWDTDYQEG氨基酸,突变体命名为Lj-RL2(A3F);
(6)LjCDA1的RL2(第125~136位氨基酸LYFENIKRNQIG)替换为APOBEC3G对应位置(第125~136氨基酸)的IYDDQGRCQE氨基酸,突变体命名为Lj-RL2(A3G);
(7)LjCDA1的RL2(第125~136位氨基酸LYFENIKRNQIG)替换为LpCDA1L1_1对应位置(第125~136氨基酸)的IYDKDRAVDHRG氨基酸,突变体命名为Lj-RL2(Lp1L1-1)。
这些胞苷脱氨酶突变体为具有C-T单碱基编辑活性且低水平Cas非依赖的DNA脱靶效应的胞苷脱氨酶突变体。
本发明还提供一种碱基编辑器CBE,所述碱基编辑器CBE为将所述胞苷脱氨酶突变体融合于突变型核酸酶的不同位点,得到的新融合蛋白。
在本发明的一个实施方式中,所述突变型核酸酶选自nSpCas9或其突变体,其中nSpCas9的氨基酸序列如SEQ ID NO.2所示。
在本发明的一个实施方式中,所述碱基编辑器CBE为将所述胞苷脱氨酶突变体融合于nSpCas9的N-末端构建的CBE变体,所述nSpCas9序列如SEQ ID NO.2所示。
在本发明的一个实施方式中,所述nSpCas9的C末端融合有入核信号Nucleoplasmin NLS,所述Nucleoplasmin NLS序列如SEQ ID NO.3所示。
本发明还提供所述碱基编辑器CBE的构建方法,包括以下步骤:
将所述胞苷脱氨酶突变体融合于突变型核酸酶的不同位点,构建所述碱基编辑器CBE。
优选的,所述碱基编辑器CBE为将所述胞苷脱氨酶突变体融合于nSpCas9的N-末端构建的CBE变体,所述nSpCas9序列如SEQ ID NO.2所示,所述nSpCas9的C末端融合有入核信号Nucleoplasmin NLS,所述Nucleoplasmin NLS序列如SEQ ID NO.3所示。
本发明还提供所述碱基编辑器CBE的应用,所述碱基编辑器CBE介导C·G--T·A突变,用于DNA水平特定位点特定碱基的突变。
本发明还提供一种多核苷酸,编码所述胞苷脱氨酶突变体或编码所述碱基编辑器CBE。
本发明还提供一种载体,含有所述的多核苷酸。
本发明还提供一种宿主细胞,含所述碱基编辑器CBE,或含有所述载体。
本发明第还提供一种试剂盒,包含用于构建所述胞苷脱氨酶突变体或所述碱基编辑器CBE的试剂。
与现有技术相比,本发明的有益效果体现在以下方面:
本发明通过在胞苷脱氨酶LjCDA1中引入不同突变,开发了新的胞苷脱氨酶突变体,通过将胞苷脱氨酶突变体融合于SpCas9为代表的突变型核酸酶的不同位点,得到的新融合蛋白,即碱基编辑器CBE,能对位于前间隔序列不同位置的胞嘧啶实现有效的C-T碱基突变。本发明所获得的CBE变体具有多样化C-T编辑碱基偏好性和活性窗口,相关的CBE变体其Cas非依赖的DNA脱靶效应和RNA脱靶效应均处于低水平甚至被清除。
本发明的碱基编辑器具有非常低水平的DNA/RNA脱靶效应,且具有多样化的C-T编辑偏好性和活性窗口,可实现更广范围、更精细且安全性更高的C-T单碱基替换,能有效拓宽单碱基编辑工具的应用,具有很高的应用价值。本发明实现了RNA/DNA脱靶效应、碱基编辑偏好性及编辑窗口等多个方面的协同优化。
附图说明
图1.不同CBE变体的Cas非依赖型DNA脱靶效应检测。七鳃鳗来源的胞苷脱氨酶融合于nSpCas9蛋白的N-末端、C末端构建的CBE变体的Cas非依赖型DNA脱靶效应。采用R-loop实验检测Cas非依赖型DNA脱靶效应,利用sanger测序分析碱基编辑特征。所选位点为sasgRNA-5(a)和sasgRNA-6(b)。每组n=1。
图2.胞苷脱氨酶LjCDA1各突变体为基础的CBE变体的碱基编辑特性。LjCDA1各突变体融合于nSpCas9的N末端,获得CBE变体。利用sanger测序分析碱基编辑特征,检测碱基编辑特征所用的sgRNA为sgA(a)和sg-H4(b)。每组n=1。
图3.胞苷脱氨酶LjCDA1各突变体为基础的CBE变体的Cas非依赖型DNA脱靶效应。LjCDA1各突变体融合于nSpCas9的N末端,获得CBE变体。采用R-loop实验检测Cas非依赖型DNA脱靶效应,利用sanger测序分析碱基编辑特征,利用sanger测序分析碱基编辑特征。所选位点为sasgRNA-5(a)和sasgRNA-6(b)。每组n=1。
图4.优选CBE变体介导C-T编辑的活性窗口。选择8种sgRNA分别与各优选CBE变体共转染HEK293T细胞系,通过高通量扩增子测序分析碱基编辑的活性窗口。每组n=3个生物学重复。
图5.优选CBE变体介导C-T编辑的碱基偏好性。选择8种sgRNA分别与各优选CBE变体共转染HEK293T细胞系,通过高通量扩增子测序分析碱基编辑的碱基偏好性。每组n=3个生物学重复。
图6.全基因组测序分析优选CBE变体在DNA水平的脱靶效应。分别对C-T&G-A类型的SNVs(a)和总SNVs(b)进行统计分析。
图7.优选CBE变体的Cas非依赖的DNA脱靶效应。通过R-loop实验和高通量扩增子测序对优选CBE变体的Cas非依赖的DNA脱靶效应进行分析。R-loop 1~6分别对应sasgRNA1~6。图中每种sasgRNA均挑选有代表性的胞嘧啶位点。n=3个生物学重复。
图8.优选CBE变体的RNA水平脱靶效应。通过RNA-seq实验对优选CBE变体的RNA脱靶效应进行分析。n=4个生物学重复。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例1
不同胞苷脱氨酶为基础构建的CBE变体的Cas非依赖DNA脱靶效应筛选(R-loop实验)
已有研究在七鳃鳗中发现多种新的胞苷脱氨酶,在此基础上构建的CBE变体具有多样化的C-T编辑活性窗口(2019Nature Communications,Expanding C-T base editingtoolkit with diversified cytidine deaminases)。这部分CBE变体的Cas非依赖的DNA脱靶效应目前缺少系统性评估。申请人通过R-loop实验对部分优选CBE变体的Cas非依赖的DNA脱靶效应进行分析。
DNA水平的脱靶效应(Cas非依赖型脱靶效应)通过R-Loop实验进行分析。其基本原理是,dSaCas9与靶向基因组特定位点(位点X)的sasgRNA(sasgRNA-X)在细胞中共表达,会在位点X处诱导形成单链DNA(ssDNA)区域;此时,细胞内共表达的碱基编辑器(ABE或CBE)因其自身对ssDNA的亲和力,便可能结合ssDNA并介导C·G--T·A (CBE)或A·T--G·C(ABE)突变。
人源HEK293T细胞系复苏培养后以30%-50%密度铺12孔平板,24小时后采用脂质体共转染碱基编辑器的各优选表达载体(通过2A-EGFP元件同时表达EGFP)和失活型SaCas9(dSaCas9)-sasgRNA共表达载体(同时表达红色荧光蛋白),培养72小时后胰酶消化收取细胞,流式细胞分选双阳性细胞,通过裂解液裂解细胞提取基因组,之后针对sasgRNA位点设计引物进行定向扩增,扩增产物经sanger测序,进行数据分析了解sasgRNA位点处的C-T突变频率。为初步评估N-A3A-BE和C-A3A-BE及其突变体的Cas非依赖的DNA脱靶效应,研究中共选取2种不同的sasgRNA脱靶位点(sasgRNA-5:TCTGCTTCTCCAGCCCTGGC;sasgRNA-6:GATGTTCCAATCAGTACGCA)用于在DNA水平的脱靶效应分析(Cas非依赖型脱靶效应)。
结果显示,N-7-BE、N-12-BE在sasgRNA-5和sasgRNA-6两位点处无明显的C-T碱基编辑活性(图1a-b)。结合已有报道可知,N-7-BE的C-T编辑活性更强。因此,申请人后续对N-7-BE(重命名为N-Lj-BE)中的胞苷脱氨酶(LjCDA1)进行突变,构建一系列CBE变体,进一步分析其碱基编辑活性和Cas非依赖的脱靶效应。
实施例2
LjCDA1突变体、对应CBE变体构建及C-T点突变活性和Cas非依赖的DNA脱靶效应检测
合成人源密码子优化的LjCDA1序列(SEQ ID NO.1)。
LjCDA1突变体构建如下:
(1)LjCDA1的RL1(第25~30氨基酸)替换为A3A对应位置的GI氨基酸,突变体命名为Lj-RL1(A3A);
(2)LjCDA1的RL1(第25~30氨基酸)替换为LpCDA1对应位置(第25~30氨基酸)的YKRSPS氨基酸,突变体命名为Lj-RL1(Lp);
(3)LjCDA1的RL1(第25~30氨基酸)替换为LpCDA1L1_1对应位置(第25~30氨基酸)的LHYAEG氨基酸,突变体命名为Lj-RL1(Lp1L1-1);
(4)LjCDA1的RL2(第125~136氨基酸,LYFENIKRNQIG)替换为AID对应位置(第125~136氨基酸)的LYFCEDRKAEPEG氨基酸,突变体命名为Lj-RL2(AID);
(5)LjCDA1的RL2(第125~136氨基酸,LYFENIKRNQIG)替换为APOBEC3F对应位置(第125~136氨基酸)的LYYFWDTDYQEG氨基酸,突变体命名为Lj-RL2(A3F);
(6)LjCDA1的RL2(第125~136氨基酸,LYFENIKRNQIG)替换为APOBEC3G对应位置(第125~136氨基酸)的IYDDQGRCQE氨基酸,突变体命名为Lj-RL2(A3G);
(7)LjCDA1的RL2(第125~136氨基酸,LYFENIKRNQIG)替换为LpCDA1L1_1对应位置(第125~136氨基酸)的IYDKDRAVDHRG氨基酸,突变体命名为Lj-RL2(Lp1L1-1)。
各突变体分别融合于nSpCas9(D10A)(序列如SEQ ID NO.2所示)的N-末端构建CBE变体。此外,nSpCas9(D10A)的C末端融合有入核信号Nucleoplasmin NLS(序列如SEQ IDNO.3所示)。
其中,突变体Lj-RL1(A3A)融合于nSpCas9(D10A)(序列如SEQ ID NO.2所示)的N-末端,且nSpCas9(D10A)的C末端融合有入核信号Nucleoplasmin NLS(序列如SEQ ID NO.3所示),构建的CBE变体称之为N-Lj-RL1(A3A)-BE。
突变体Lj-RL1(Lp)融合于nSpCas9(D10A)(序列如SEQ ID NO.2所示)的N-末端,且nSpCas9(D10A)的C末端融合有入核信号Nucleoplasmin NLS(序列如SEQ ID NO.3所示),构建的CBE变体称之为N-Lj-RL1(Lp)-BE。
突变体Lj-RL1(Lp1L1-1)融合于nSpCas9(D10A)(序列如SEQ ID NO.2所示)的N-末端,且nSpCas9(D10A)的C末端融合有入核信号Nucleoplasmin NLS(序列如SEQ ID NO.3所示),构建的CBE变体称之为N-Lj-RL1(Lp1L1-1)-BE。
突变体Lj-RL2(AID)融合于nSpCas9(D10A)(序列如SEQ ID NO.2所示)的N-末端,且nSpCas9(D10A)的C末端融合有入核信号Nucleoplasmin NLS(序列如SEQ ID NO.3所示),构建的CBE变体称之为N-Lj-RL2(AID)-BE。
突变体Lj-RL2(A3F)融合于nSpCas9(D10A)(序列如SEQ ID NO.2所示)的N-末端,且nSpCas9(D10A)的C末端融合有入核信号Nucleoplasmin NLS(序列如SEQ ID NO.3所示),构建的CBE变体称之为N-Lj-RL2(A3F)-BE。
突变体Lj-RL2(A3G)融合于nSpCas9(D10A)(序列如SEQ ID NO.2所示)的N-末端,且nSpCas9(D10A)的C末端融合有入核信号Nucleoplasmin NLS(序列如SEQ ID NO.3所示),构建的CBE变体称之为N-Lj-RL2(A3G)-BE。
突变体Lj-RL2(Lp1L1-1)融合于nSpCas9(D10A)(序列如SEQ ID NO.2所示)的N-末端,且nSpCas9(D10A)的C末端融合有入核信号Nucleoplasmin NLS(序列如SEQ ID NO.3所示),构建的CBE变体称之为N-Lj-RL2(Lp1L1-1)-BE。
本实施例中利用2A肽段共表达融合蛋白与绿色荧光蛋白EGFP,用以指示融合蛋白的表达情况,并用于后续的流式细胞分选。
本实施例中还构建sgRNA表达载体,在表达特定sgRNA的同时表达UGI-2A-mCherry。UGI可以抑制尿嘧啶糖基化酶的活性,提高C-T突变效率,红色荧光蛋白mCherry用于指示载体表达情况,可用于后续的流式细胞分选。
为评估CBE变体碱基编辑活性的改变,将CBE变体(通过2A-EGFP元件同时表达EGFP)与单向导RNA(sgRNA)(sgRNA同时表达尿嘧啶糖基化酶抑制因子UGI和2A-mCherry)共转染至培养的293T细胞。细胞培养72小时后,通过FACS收集同时表达EGFP和mCherry的双阳性细胞。
本实施例中使用的sgRNA为sgA(序列为TGCCCCTCCCTCCCTGGCCC)和sg-H4(序列为GGCACTGCGGCTGGAGGTGG)。
收集的细胞抽提基因组,使用可特异性扩增sgA和sg-H4位点信息的引物进行定向PCR。PCR产物通过sanger测序验证CBE变体的碱基编辑活性改变。
结果显示,除N-Lj-RL1(A3A)-BE在sgA和sg-H4两位点均无明显活性外,其余CBE变体均有明显的C-T编辑活性。与N-Lj-BE相比,N-Lj-RL1(Lp)-BE的C-T编辑能力和活性窗口无明显改变(C3-C6);N-Lj-RL1(Lp1L1-1)-BE的C-T编辑能力明显减弱,且活性窗口明显变窄(C3)。N-Lj-RL2(AID)-BE的C-T编辑能力接近N-Lj-BE,但活性窗口明显变窄(C3);N-Lj-RL2(A3F)-BE的C-T编辑能力明显弱于N-Lj-BE,且活性窗口因位点而异(sgA处编辑C3,sg-H4处对C5的编辑能力更强),这反映出其具有一定碱基偏好性;N-Lj-RL2(A3G)-BE的C-T编辑能力弱于N-Lj-BE,且活性窗口因位点而异(sgA处编辑C3-C6,sg-H4处对C5的编辑能力更强),这反映出其具有一定碱基偏好性;N-Lj-RL2(Lp1L1-1)-BE的C-T编辑能力和活性窗口无明显改变(C3-C6)(图2a-b)。
DNA水平的脱靶效应(Cas非依赖型脱靶效应)通过R-Loop实验进行分析。其基本原理是,dSaCas9与靶向基因组特定位点(位点X)的sasgRNA(sasgRNA-X)在细胞中共表达,会在位点X处诱导形成单链DNA(ssDNA)区域;此时,细胞内共表达的碱基编辑器(ABE或CBE)因其自身对ssDNA的亲和力,便可能结合ssDNA并介导C·G--T·A(CBE)或A·T--G·C(ABE)突变。
人源HEK293T细胞系复苏培养后以30%-50%密度铺12孔平板,24小时后采用脂质体共转染碱基编辑器的各优选表达载体(通过2A-EGFP元件同时表达EGFP)和失活型SaCas9(dSaCas9)-sasgRNA共表达载体(同时表达红色荧光蛋白),培养72小时后胰酶消化收取细胞,流式细胞分选双阳性细胞,通过裂解液裂解细胞提取基因组,之后针对sasgRNA位点设计引物进行定向扩增,扩增产物经sanger测序,进行数据分析了解sasgRNA位点处的C-T突变频率。为初步评估N-A3A-BE和C-A3A-BE及其突变体的Cas非依赖的DNA脱靶效应,研究中共选取2种不同的sasgRNA脱靶位点(sasgRNA-5:TCTGCTTCTCCAGCCCTGGC;sasgRNA-6:GATGTTCCAATCAGTACGCA)用于在DNA水平的脱靶效应分析(Cas非依赖型脱靶效应)。
结果显示,N-Lj-BE及其突变体在检测的位点处均无明显的C-T编辑活性,表明N-Lj-BE及对应突变体的Cas非依赖型脱靶效应处于很低水平(图3a-b)。
实施例3
优选碱基编辑器CBE变体的活性窗口和碱基偏好性
本实施例中,优选N-Lj-BE、N-Lj-RL1(Lp1L1-1)-BE、N-Lj-RL2(AID)-BE、N-Lj-RL2(A3F)-BE、N-Lj-RL2(A3G)-BE和N-Lj-RL2(Lp1L1-1)-BE,分析其活性窗口和碱基偏好性。
为系统分析碱基编辑器的活性窗口和碱基偏好性,选择8种sgRNA(AAVS序列:GACCCTCAGCCGTGCTGCTC;S18序列:ACACACACACTTAGAATCTG;HEK4序列:GGCACTGCGGCTGGAGGTGG;EMX序列:GAGTCCGAGCAGAAGAAGAA;MSKC序列:CGTCGCCGATCTTCACAGGG;sgB序列:AGAGCCCCCCCTCAAAGAGA;UBE3A序列:GTACAGTTAGTACTCAGCAG;ZS2序列:GTGCGGCAAGAGCTTCAGCC)开展相关研究。将优选的CBE变体(通过2A-EGFP元件同时表达EGFP)与单向导RNA(sgRNA)(sgRNA同时表达尿嘧啶糖基化酶抑制因子UGI和2A-mCherry)共转染至培养的293T细胞。细胞培养72小时后,细胞培养72小时后,通过FACS收集同时表达EGFP和mCherry的双阳性细胞。
收集好的细胞抽提基因组,使用可特异性扩增目标sgRNA位点信息的引物进行定向PCR。PCR产物通过扩增子测序,以分析优选碱基编辑器的活性窗口和碱基偏好性(n=3次生物学重复)。
结果显示,N-Lj-BE的活性窗口为(C2-C7,在C2-C8范围内均有一定活性);N-Lj-RL1(Lp1L1-1)-BE的活性窗口为(C3),但编辑效率偏低,平均编辑效率<20%。N-Lj-RL2(AID)-BE的活性窗口为(C3)。N-Lj-RL2(A3F)-BE的活性窗口为(C3-C10),但编辑效率偏低,平均编辑效率<20%。N-Lj-RL2(A3G)-BE的活性窗口为(C3-C5)。N-Lj-RL2(Lp1L1-1)-BE的活性窗口为(C2-C5)。(图4)
此外,CBE变体的活性呈现出一定的碱基偏好性,N-Lj-BE对不同碱基位点的偏好性为:CN位点处,对CT(下划线为编辑位点)有一定偏好性,在CG位点编辑活性低;此外,在NC位点处,AC≈GC>CC≈TC。N-Lj-RL2(AID)-BE对不同碱基位点的偏好性为:CN位点处,CA≈CT>CC≈CG;NC位点处,偏好AC。N-Lj-RL2(A3F)-BE对不同碱基位点的偏好性为:CN位点处,CA≈CT>CC>CG;NC位点处,偏好AC。N-Lj-RL2(A3G)-BE对不同碱基位点的偏好性为:CN位点处,CT>CA>CC>CG;NC位点处,偏好AC,AC>CC>GC>TC。N-Lj-RL2(Lp1L1-1)-BE对不同碱基位点的偏好性为:CN位点处,CT≈CA≈CC>CG;NC位点处,AC≈CC>GC≈TC。(图5)
实施例4
优选碱基编辑器CBE变体在DNA水平的脱靶效应(全基因组测序分析)
本实施例中,优选N-Lj-BE,通过全基因组测序分析其在DNA水平的脱靶效应。
将优选的CBE变体(通过2A-EGFP元件同时表达EGFP)与单向导RNA(sgRNA)(sgRNA同时表达尿嘧啶糖基化酶抑制因子UGI和2A-嘌呤霉素抗性基因)共转染至培养的293T细胞。细胞培养24-48小时后,加入嘌呤霉素持续处理2-3天,挑选单细胞克隆至96孔板中。单细胞克隆扩增成功后转移至12孔板继续培养。细胞数量扩增成功后抽提基因组,使用可特异性扩增目标sgRNA位点信息的引物进行定向PCR。Sanger测序分析目标位点的碱基编辑情况,发生C-T碱基编辑细胞的基因组进行全基因组测序和SNVs分析。本实施例研究中选用的sgRNA序列为sg-RNF(序列信息:GTCATCTTAGTCATTACCTG)。
进行全基因组测序的样本数:nCas9(D10A)(n=3);N-Lj-BE(n=3)。
全基因组测序分析显示,与nCas9(D10A)相比,N-Lj-BE的总SNVs数量相当,C>T&G>A的SNVs数量也接近。以上结果表明,N-Lj-BE在DNA水平的脱靶效应处于低水平,且几乎无Cas非依赖的DNA脱靶效应(图6)。
实施例5
优选碱基编辑器CBE变体的Cas非依赖的DNA脱靶效应(R-loop实验验证)
本实施例中,优选N-Lj-BE、N-Lj-RL1(Lp1L1-1)-BE、N-Lj-RL2(AID)-BE、N-Lj-RL2(A3F)-BE、N-Lj-RL2(A3G)-BE和N-Lj-RL2(Lp1L1-1)-BE,利用R-loop实验分析其Cas非依赖的DNA脱靶效应。
DNA水平的脱靶效应(Cas非依赖型脱靶效应)通过R-Loop实验进行分析。其基本原理是,dSaCas9与靶向基因组特定位点(位点X)的sasgRNA(sasgRNA-X)在细胞中共表达,会在位点X处诱导形成单链DNA(ssDNA)区域;此时,细胞内共表达的碱基编辑器(ABE或CBE)因其自身对ssDNA的亲和力,便可能结合ssDNA并介导C·G--T·A (CBE)或A·T--G·C(ABE)突变。
人源HEK293T细胞系复苏培养后以30%-50%密度铺12孔平板,24小时后采用脂质体共转染碱基编辑器的各优选表达载体(通过2A-EGFP元件同时表达EGFP)和失活型SaCas9(dSaCas9)-sasgRNA共表达载体(同时表达红色荧光蛋白),培养72小时后胰酶消化收取细胞,流式细胞分选双阳性细胞,通过裂解液裂解细胞提取基因组,之后针对sasgRNA位点设计引物进行定向扩增,扩增产物经sanger测序,进行数据分析了解sasgRNA位点处的C-T突变频率。为初步评估优选CBE变体的Cas非依赖的DNA脱靶效应,研究中共选取6种不同的sasgRNA脱靶位点(sasgRNA-1:TGGTAGACAGCATGTGTCCTA;sasgRNA-2:ATTTACAGCCTGGCCTTTGGGG;sasgRNA-3:TGTCAGGTAATGTGCTAAACA;sasgRNA-4:GTGGAGGAGGGTGCATGGGGT;sasgRNA-5:TCTGCTTCTCCAGCCCTGGC;sasgRNA-6:GATGTTCCAATCAGTACGCA)用于在DNA水平的脱靶效应分析(Cas非依赖型脱靶效应)。
结果显示,仅N-Lj-BE、N-Lj-RL1(Lp1L1-1)-BE、N-Lj-RL2(AID)-BE、N-Lj-RL2(A3F)-BE、N-Lj-RL2(A3G)-BE和N-Lj-RL2(Lp1L1-1)-BE等优选CBE变体在sasgRNA-1~6的脱靶效应很低,最高位点<2%(图7)。结合全基因组测序数据结果可知,N-Lj-BE及变体的Cas非依赖的DNA脱靶效应可忽略不计。
实施例6
优选CBE变体在RNA水平的脱靶效应分析
本实施例中,优选N-Lj-BE、N-Lj-RL1(Lp1L1-1)-BE、N-Lj-RL2(AID)-BE、N-Lj-RL2(A3F)-BE、N-Lj-RL2(A3G)-BE和N-Lj-RL2(Lp1L1-1)-BE,利用RNA-seq分析RNA水平的脱靶效应。
为评估各优选工具在RNA水平的脱靶效应,将各优选表达载体(通过2A-EGFP元件同时表达EGFP)与单向导RNA(sgRNA)(sgRNA同时表达尿嘧啶糖基化酶抑制因子UGI和2A-puromycin)共转染至培养的293T细胞。转染后24小时加入嘌呤霉素筛选阳性细胞。嘌呤霉素处理48小时后,收集细胞提取总RNA进行RNA-seq实验。本方案使用的sgRNA为sg-NC(无靶向sgRNA)(n=4次生物学重复)。
RNA编辑是指在mRNA水平上改变遗传信息的过程。具体来说,它指的是mRNA分子中核苷酸的缺失、插入或化学修饰。这种修饰影响基因的表达,不同氨基酸的产生和开放阅读框的形成。在哺乳动物细胞中,主要存在两类RNA编辑,分别为A-I编辑和C-U编辑。这种RNA编辑是由RNA依赖的腺嘌呤脱氨酶介导的。
C-U编辑结果的分析显示,各CBE变体与阴性对照组(Cas9-D10A+sgRNA)有类似的RNA编辑位点数量(图8)。
上述的对实施例的描述是为便于该技术领域的普通技术人员能理解和使用发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。
序列表
<110> 复旦大学
<120> 胞苷脱氨酶突变体及基于胞苷脱氨酶突变体构建的碱基编辑器
<160> 3
<170> SIPOSequenceListing 1.0
<210> 1
<211> 217
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Gly Ser Ala Asn Ala Glu Tyr Val Arg Val Gly Glu Lys Leu Asp
1 5 10 15
Ser Cys Thr Phe Arg Thr Gln Phe Leu Asn Tyr Arg Arg Ser Arg Ser
20 25 30
Arg Arg Cys Cys Val Ile Phe Glu Leu Lys Arg Gln Asn Ser Arg Val
35 40 45
Arg Phe Trp Gly Tyr Ala Met Asn Lys Pro Trp Ser Asn Ala Asp Val
50 55 60
Gly Ile His Ala Glu Phe Phe Cys Ile Lys Lys Val Lys Lys Tyr Leu
65 70 75 80
Arg Lys Asn Pro Gly Ile Tyr Thr Ile Asn Trp Tyr Ser Ser Trp Ser
85 90 95
Pro Cys Ala Asn Cys Ala Glu Lys Ile Leu Asn Trp Tyr Asn Lys Lys
100 105 110
Leu Met Gly Lys Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr
115 120 125
Phe Glu Asn Ile Lys Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asn
130 135 140
Asn Gly Val Gly Leu Ala Ile Met Leu Gly Glu His Tyr Gln Trp Cys
145 150 155 160
Trp Asn Asn Tyr Ile Gln Thr Leu Gly Arg Asn Leu Asn Glu Asn Lys
165 170 175
Trp Leu Lys Lys Thr Ser Asn Arg Ala Arg Thr Arg Arg Ser Glu Leu
180 185 190
Ser Ile Met Ile His Val Lys Arg Leu His Thr Ala Arg Leu Leu Leu
195 200 205
Phe Lys Arg Leu Cys Gly Trp Phe Ser
210 215
<210> 2
<211> 1368
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 3
<211> 16
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15

Claims (10)

1.一种胞苷脱氨酶突变体,其特征在于,为基于胞苷脱氨酶LjCDA1进行的以下突变中的一种,所述胞苷脱氨酶LjCDA1的氨基酸序列如SEQ ID NO.1所示:
(1)LjCDA1的第25~30氨基酸替换为GI氨基酸;
(2)LjCDA1的第25~30氨基酸替换为YKRSPS氨基酸;
(3)LjCDA1的第25~30氨基酸替换为LHYAEG氨基酸;
(4)LjCDA1的第125~136位氨基酸LYFENIKRNQIG替换为LYFCEDRKAEPEG氨基酸;
(5)LjCDA1的第125~136位氨基酸LYFENIKRNQIG替换为LYYFWDTDYQEG氨基酸;
(6)LjCDA1的第125~136位氨基酸LYFENIKRNQIG替换为IYDDQGRCQE氨基酸;
(7)LjCDA1的第125~136位氨基酸LYFENIKRNQIG替换为IYDKDRAVDHRG氨基酸。
2.一种碱基编辑器CBE,其特征在于,所述碱基编辑器CBE为将权利要求1所述胞苷脱氨酶突变体融合于突变型核酸酶的不同位点,得到的新融合蛋白。
3.根据权利要求2所述的一种碱基编辑器CBE,其特征在于,所述突变型核酸酶选自nSpCas9或其突变体,其中nSpCas9的氨基酸序列如SEQ ID NO.2所示。
4.根据权利要求3所述的一种碱基编辑器CBE,其特征在于,所述碱基编辑器CBE为将所述胞苷脱氨酶突变体融合于nSpCas9的N-末端构建的CBE变体,所述nSpCas9序列如SEQ IDNO.2所示。
5.根据权利要求4所述的一种碱基编辑器CBE,其特征在于,所述nSpCas9的C末端融合有入核信号Nucleoplasmin NLS,所述Nucleoplasmin NLS序列如SEQ ID NO.3所示。
6.权利要求2-5中任一项所述碱基编辑器CBE的应用,其特征在于,所述碱基编辑器CBE介导C·G--T·A突变,用于DNA水平特定位点特定碱基的突变。
7.一种多核苷酸,其特征在于,编码权利要求1所述胞苷脱氨酶突变体或编码权利要求2所述碱基编辑器CBE。
8.一种载体,其特征在于,含有权利要求7所述的多核苷酸。
9.一种宿主细胞,其特征在于,含利要求2所述碱基编辑器CBE,或含有权利要求8所述载体。
10.一种试剂盒,其特征在于,包含用于构建权利要求1所述胞苷脱氨酶突变体或权利要求2所述碱基编辑器CBE的试剂。
CN202210140362.5A 2022-02-16 2022-02-16 胞苷脱氨酶突变体及基于胞苷脱氨酶突变体构建的碱基编辑器 Pending CN116640749A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210140362.5A CN116640749A (zh) 2022-02-16 2022-02-16 胞苷脱氨酶突变体及基于胞苷脱氨酶突变体构建的碱基编辑器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210140362.5A CN116640749A (zh) 2022-02-16 2022-02-16 胞苷脱氨酶突变体及基于胞苷脱氨酶突变体构建的碱基编辑器

Publications (1)

Publication Number Publication Date
CN116640749A true CN116640749A (zh) 2023-08-25

Family

ID=87638681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210140362.5A Pending CN116640749A (zh) 2022-02-16 2022-02-16 胞苷脱氨酶突变体及基于胞苷脱氨酶突变体构建的碱基编辑器

Country Status (1)

Country Link
CN (1) CN116640749A (zh)

Similar Documents

Publication Publication Date Title
Lee et al. Single C-to-T substitution using engineered APOBEC3G-nCas9 base editors with minimum genome-and transcriptome-wide off-target effects
CN107922931B (zh) 热稳定的Cas9核酸酶
CA3067951A1 (en) Nucleic acid-guided nucleases
AU2019319230B2 (en) Novel mutations that enhance the DNA cleavage activity of acidaminococcus sp. Cpf1
EA020657B1 (ru) Специализированная многосайтовая комбинаторная сборка
CN113234701B (zh) 一种Cpf1蛋白及基因编辑系统
CN115927271A (zh) 一种小型化碱基编辑器及其构建方法与应用
US20240002834A1 (en) Adenine base editor lacking cytosine editing activity and use thereof
CN114045277A (zh) 碱基编辑器及其构建方法与应用
CN116751764B (zh) 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用
McClain et al. Distinctive acceptor-end structure and other determinants of Escherichia coli tRNA Pro identity
CN116640749A (zh) 胞苷脱氨酶突变体及基于胞苷脱氨酶突变体构建的碱基编辑器
CA3234217A1 (en) Base editing enzymes
CN116355885A (zh) 脱氨酶突变体及基于脱氨酶突变体构建的碱基编辑器
KR20220077054A (ko) 티민-사이토신 서열 특이적 사이토신 교정 활성이 증진된 아데닌 염기교정 유전자가위 및 이의 용도
CN108728477A (zh) 一种高效的转座突变系统及构建方法
US20210292752A1 (en) Method for Isolating or Identifying Cell, and Cell Mass
CN116179513B (zh) 一种Cpf1蛋白及其在基因编辑中的应用
US20240018550A1 (en) Adenine base editor having increased thymine-cytosine sequence-specific cytosine editing activity, and use thereof
CN117487786A (zh) 一种安全性高的碱基编辑器及其构建方法与应用
Kulcsár et al. A cleavage rule for selection of increased-fidelity SpCas9 variants with high efficiency and no detectable off-targets
KR102421129B1 (ko) 신규 프로토스페이서 인접 모티프 서열 및 이를 이용한 세포의 유전체에서 표적 핵산을 변형시키는 방법
CN116751763B (zh) 一种Cpf1蛋白、V型基因编辑系统及应用
KR20220077053A (ko) 사이토신 교정 활성이 제거된 아데닌 염기교정 유전자가위 및 이의 용도
Kulcsár et al. Target-matched increased fidelity SpCas9 variants can edit any target without genome-wide off-target effects

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination