CN110804628A - 高特异性无脱靶单碱基基因编辑工具 - Google Patents

高特异性无脱靶单碱基基因编辑工具 Download PDF

Info

Publication number
CN110804628A
CN110804628A CN201910494323.3A CN201910494323A CN110804628A CN 110804628 A CN110804628 A CN 110804628A CN 201910494323 A CN201910494323 A CN 201910494323A CN 110804628 A CN110804628 A CN 110804628A
Authority
CN
China
Prior art keywords
leu
lys
glu
asp
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910494323.3A
Other languages
English (en)
Other versions
CN110804628B (zh
Inventor
杨辉
左二伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Center for Excellence in Brain Science and Intelligence Technology Chinese Academy of Sciences
Original Assignee
Shanghai Institutes for Biological Sciences SIBS of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Institutes for Biological Sciences SIBS of CAS filed Critical Shanghai Institutes for Biological Sciences SIBS of CAS
Priority to JP2021550263A priority Critical patent/JP2022522019A/ja
Priority to PCT/CN2019/119842 priority patent/WO2020173150A1/zh
Priority to EP19916605.9A priority patent/EP3940078A4/en
Priority to US17/435,004 priority patent/US20220136041A1/en
Publication of CN110804628A publication Critical patent/CN110804628A/zh
Application granted granted Critical
Publication of CN110804628B publication Critical patent/CN110804628B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/34Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04001Cytosine deaminase (3.5.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/914Hydrolases (3)
    • G01N2333/978Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/02Screening involving studying the effect of compounds C on the interaction between interacting molecules A and B (e.g. A = enzyme and B = substrate for A, or A = receptor and B = ligand for the receptor)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Epidemiology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Cell Biology (AREA)
  • Pathology (AREA)
  • Rheumatology (AREA)
  • Toxicology (AREA)
  • Urology & Nephrology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Endocrinology (AREA)
  • Diabetes (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及高特异性无脱靶单碱基基因编辑工具。揭示了一种降低单碱基编辑器的脱靶效应的方法。也揭示了一种分析单碱基基因编辑工具的靶向效应的方法(GOTI)。

Description

高特异性无脱靶单碱基基因编辑工具
技术领域
本发明属于基因编辑技术领域,更具体地,本发明涉及一种高特异性无 脱靶单碱基基因编辑工具。
背景技术
基因组编辑技术自问世以来受到人们的高度重视。CRISPR是规律间隔 性成簇短回文重复序列的简称,Cas是CRISPR相关蛋白的简称。CRISPR/Cas 最初是在细菌体内发现的,是细菌用来识别和摧毁抗噬菌体和其他病原体入 侵的防御系统。在CRISPR/Cas9系统中,酶Cas9在DNA靶位点上进行切割。 Cas9与sgRNA一起被称作Cas9-sgRNA系统。CRISPR/Cas9技术已被应用于 疾病模型建立、药物靶点筛选、并正在成为新一代基因治疗手段。
但是,CRISPR/Cas9的应用时,缺陷在于同源介导修复的低编辑效率。 本领域人员利用16个碱基长的XTEN接头(XTEN linker)将胞苷脱氨酶 APOBEC1与dCas9连接在一起,从而构建出第一代碱基编辑器(BE1)。为了 增加体内编辑效率,第二代碱基编辑器(BE2)系统除了将胞苷脱氨酶与dCas9 连接在一起之外,还将碱基切除修复抑制剂UGI与dCas9融合在一起,从而 将编辑效率提高三倍,最高达到20%左右。
为了将碱基编辑效率提高,本领域人员将dCas9换为Cas9n来模拟错配 修复,从而构建出第三代碱基编辑器(BE3)。BE3在非互补DNA链上产生切 口,细胞使用含尿嘧啶(U)的DNA链作为模板来进行修复,从而复制这种碱 基编辑。在人细胞系的多种靶基因中,这种BE3系统使得碱基编辑效率发生 显著性地提高,它的平均indel发生率仅为1.1%。对这些测试的靶基因而言, 这些数字是对Cas9介导的HDR的巨大改进;平均的HDR介导的编辑频率仅为0.5%,并且相比于之前的单碱基编辑,更多的indel被观察到。在多次 细胞分裂中,CRISPR碱基编辑持续存在,说明这种方法产生稳定的碱基编 辑。但是,这种BE3系统也会遭受脱靶编辑的影响。
基因组编辑具有治疗由致病突变诱导的遗传疾病的巨大潜力,对基因编 辑的脱靶效应进行综合分析对其实用性是非常必需的。同时,本领域还需要 进一步地找到解决脱靶问题的手段。
发明内容
本发明的目的在于提供一种高特异性无脱靶单碱基基因编辑工具。
在本发明的第一方面,提供一种降低单碱基编辑器的脱靶效应的方法, 包括:在单碱基编辑器系统中,对其中的胞嘧啶脱氨酶(cytidine deaminase enzyme(s))进行改造,弱化其与DNA的结合。
在一个优选例中,所述的改造是针对胞嘧啶脱氨酶的DNA结合区域的 改造;较佳地,所述的DNA结合区域为其与DNA(如ssDNA)结合的结构域。
在另一优选例中,所述的改造包括但不限于:基因突变,靶向性封闭或 阻滞(如以结合蛋白或抗体进行封闭或阻滞,或以竞争性结合分子进行封闭或 阻滞),干扰。
在另一优选例中,所述的单碱基编辑器系统为BE3基因编辑器系统。
在另一优选例中,所述的DNA为单链DNA(ssDNA)或双链 DNA(dsDNA)。
在另一优选例中,所述的胞嘧啶脱氨酶包括但不限于选自下组的酶:AID (如:人AID),APOBEC3G(如:人APOBEC3G),APOBEC1,APOBECA3A, CDA1(如:lamprey CDA1)。
在另一优选例中,所述弱化为显著性的弱化,例如该弱化使得胞嘧啶脱 氨酶与DNA(较佳地为ssDNA)的结合能力降低10%、20%、30%、40%、50%、 60%、70%、80%、90%或以上,或降低100%。
在另一优选例中,所述的胞嘧啶脱氨酶为APOBEC1;较佳地,所述的 改造为对该酶的第126位的氨基酸进行改造;更佳地,所述的改造为将其第 126位的R突变为E。
在另一优选例中,所述的改造还包括:对APOBEC1酶的第90位的氨基 酸进行改造;较佳地,所述的改造为将其第90位突变为Y。
在另一优选例中,所述的胞嘧啶脱氨酶为APOBECA3A,所述的改造为 对该酶的第130位的氨基酸进行改造;较佳地,所述的改造为将其第130位 的Y突变为F。
在本发明的另一方面,提供一种胞嘧啶脱氨酶的突变体,其DNA结合 区域发生改造,该改造使得其与DNA的结合被弱化,所述的DNA如单链 DNA。
在一个优选例中,所述的胞嘧啶脱氨酶包括但不限于选自下组的酶: AID,APOBEC3G,APOBEC1,APOBECA3A,CDA1。
在另一优选例中,所述的酶为APOBEC1;较佳地,所述改造发生在该 结构域的第126位上或其邻近的位置上;更佳地,所述的改造为将其第126 位的R突变为E。
在另一优选例中,所述的改造还发生在APOBEC1酶的第90位氨基酸上; 较佳地,所述的改造为将其第90位突变为Y。
在另一优选例中,所述的酶为APOBECA3A,所述改造发生在该酶的第 130位的氨基酸上或其邻近的位置上;较佳地,所述的改造为将其第130位 的Y突变为F。
在本发明的另一方面,提供分离的多核苷酸,所述的多核苷酸编码所述 的突变体。
在本发明的另一方面,提供一种载体,它含有所述的多核苷酸。
在本发明的另一方面,提供一种遗传工程化的宿主细胞,它含有所述的 载体,或基因组中整合有所述的多核苷酸。
在本发明的另一方面,提供一种单碱基编辑器,其包含所述的胞嘧啶脱 氨酶的突变体;较佳地所述的编辑器为BE3单碱基编辑器。
在本发明的另一方面,提供一种生产所述的胞嘧啶脱氨酶的突变体的方 法,包括步骤:(1)培养所述的宿主细胞,获得培养物;和(2)从培养物中分 离所述的胞嘧啶脱氨酶突变体。
在本发明的另一方面,提供所述的胞嘧啶脱氨酶突变体的用途,用于参 与基于单碱基编辑器系统的基因编辑,以降低基因编辑器的脱靶效应。
在一个优选例中,所述的胞嘧啶脱氨酶突变体的用途可以是非治疗性的 用途。
在本发明的另一方面,提供一种筛选对于降低单碱基编辑器的脱靶效应 有用的物质的方法,包括:(1)用候选物质处理胞嘧啶脱氨酶或其DNA结合 结构域以及DNA(如ssDNA)相互作用(结合)的体系;和(2)检测所述体系中胞 嘧啶脱氨酶DNA结合结构域与DNA相互作用情况;其中,若所述候选物质 抑制、阻滞或下调胞嘧啶脱氨酶或其DNA结合结构域与DNA的相互作用, 则表明该候选物质是对于降低基因编辑器的脱靶效应有用的物质。
在一个优选例中,所述的候选物质包括(但不限于):小分子化合物,针对 胞嘧啶脱氨酶或其DNA结合结构域或其编码核酸设计的结合分子(如抗体或 配体)、阻滞分子(如基于氨基酸修饰的阻滞剂)、干扰分子、基因编辑试剂、 核酸抑制物;和/或
在另一优选例中,所述的体系包括(但不限于):细胞体系(如表达胞嘧啶脱 氨酶或其DNA结合结构域以及含有DNA(如ssDNA)的细胞)(或细胞培养物体 系)、亚细胞体系、溶液体系、组织体系、器官体系或动物体系。
在本发明的另一方面,提供一种分析单碱基基因编辑工具的靶向效应的 方法(GOTI),述方法包括:(1)获取2-细胞阶段的胚胎,在其中一个细胞中 进行基因编辑操作;另一个细胞则不进行基因编辑操作;(2)在胚胎发育的 下游阶段,观测发生基因编辑的情况。
在一个优选例中,步骤(1)中,包括:将用于切割DNA靶位点的酶的 mRNA,CremRNA,以及相应sgRNA引入到所述的其中一个细胞中,进行 基因编辑。
在另一优选例中,所述的用于切割DNA靶位点的酶选自但不限于下组 的酶:Cas9,BE3,ABE7.10。
在另一优选例中,步骤(1)中,采用可检测标记物来标记所述的基因编辑 操作;较佳地,所述的可检测标记物包括但不限于:染色标记物、荧光信号 分子、报告基因;更佳地,所述的可检测标记物为tdTomato。
在另一优选例中,步骤(2)中,所述的胚胎发育的下游阶段包括但不限于: E9.5-E18.5的阶段。
在另一优选例中,步骤(2)中,所述观测发生基因编辑的情况包括:
分选发生基因编辑的细胞(如tdTomato阳性细胞)以及未发生基因编辑的 细胞(如tdTomato阴性细胞);
进行测序分析(如WGS分析);
利用单核苷酸变异(SNV)分析工具和/或indel分析工具进行分析;
比较发生编辑的细胞和未发生编辑的细胞来鉴定脱靶SNV和indel。
在另一优选例中,所述的SNV分析工具包括但不限于:Mutect2,Lofreq 和Strelka或其组合;或,所述的indel分析工具包括但不限于:Mutect2, Scalpel,Strelka或其组合。
在另一优选例中,采用流式细胞术进行发生基因编辑的细胞(如tdTomato 阳性细胞)以及未发生基因编辑的细胞(如tdTomato阴性细胞)的分选。
在另一优选例中,所述的分析单碱基基因编辑工具的靶向效应的方法 (GOTI)可以为非治疗性的方法。
在另一优选例中,所述的分析单碱基基因编辑工具的靶向效应的方法可 以为离体的方法。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显 而易见的。
附图说明
图1、在一个2-cell阶段胚胎的一个卵裂球中注射CRISPR-Cas9,BE3 或ABE7.10介导的基因编辑。(A)实验设计。(B)指定胚胎中的FACS分析。 (C)基于WGS的tdTomato+和tdTomato-细胞的靶向效率。在tdTomato+细胞 中Cas9,BE3和ABE7.10的靶向效率为66%+/-12%插入或者缺失(SEM,n= 5),83%+/-10%(SEM,n=4)和47%+分别为~18%(SEM,n=2)单碱基编辑。
图2、在BE3处理的小鼠胚胎中产生的大量脱靶SNV。(A)检测到的脱 靶SNV的总数的比较。Cre-,Cas9-,BE3-和ABE7.10处理的胚胎的SNV 数量为14+/-12(SEM,n=2),12+/-4(SEM,n=11),283+/分别为-32(SEM, n=6)和10+/-5SNV(SEM,n=4)。(B)突变类型的分布。每个细胞中的数字 表示所有突变中某种突变的比例。(C-D)C>T和G的比例>Cre,Cas9和BE3的A突变,以及ABE7.10的T>C和A>G突变。分析了两个Cre,11个Cas9,6 个BE3和4个ABE7.10样品。A)和(B)中的P值通过two-sided Wilcoxon。
图3、BE3诱导的脱靶SNV的特征。(A)与随机排列相比,脱靶基因SNV 在基因组的转录区域中富集。(B)含有脱靶SNV的基因表达显著高于4细胞 胚胎中的随机模拟基因。(C)从每个胚胎中鉴定的SNV是非重叠的。(D)由 GOTI检测到的SNV与Cas-OFFinder和CRISPOR预测的脱靶之间的重叠。 (A)和(B)中的P值通过two-sided Wilcoxon。
图4、BE3脱靶评估所构建的BE2系统。(a)质粒图谱。(b)来自WGS数 据的R126E突变BE3的靶向效率。(c)检测到的脱靶SNV的总数的比较。
图5、Apobec1点突变可以消除BE3的DNA和RNA脱靶。(a)BE3体系 中的APOBEC1;(b)BE3用量(BE3显微注射浓度)与靶向效率的关联性;(c) 测序确认靶向效率;(d)比较不同的突变体脱靶情况。显示BE3R126E, BE3R126E+W90YDNA脱靶明显降低;(e)突变体与脱靶效应的关联性分析。
具体实施方式
基因组编辑有望纠正致病突变。但是由于不同个体间的单核苷酸多态性, 基因编辑的脱靶效应很难确定。为了研究此类脱靶效应,本发明人开发了一 种名为GOTI(通过二细胞胚胎注射进行全基因组脱靶分析)的方法,通过使用 CRISPR-Cas9或单碱基编辑来编辑二细胞期动物胚胎的一个卵裂球来检测脱 靶突变。
因此,本发明提供了一种分析单碱基基因编辑工具的靶向效应的方法 (GOTI),所述方法包括:(1)获取2-细胞阶段的胚胎,在其中一个细胞中进行 基因编辑操作;(2)在胚胎发育的下游阶段,观测发生基因编辑的情况。
本发明的方法适用于多种单碱基基因编辑的方法中。在多种切割DNA 靶位点的酶参与的基因编辑中,均可采取本发明的方法。所述的切割DNA 靶位点的酶可以是本领域技术人员熟悉的多种参与此过程的酶,例如可以是 但不限于下组的酶:Cas9,BE3,ABE7.10。
在所述的GOTI方法中,可以采用可检测标记物来标记所述的基因编辑 操作,所述的可检测标记物包括但不限于:染色标记物、荧光信号分子、报 告基因。本发明的实施例中,采用了tdTomato,这是一种优选的方案,但是 其它的标记物也可被应用于本发明中。
作为本发明的优选方式,在胚胎发育的下游阶段,优选的是在E9.5-E18.5 天的阶段进行细胞的分选和测序。同时,在其它的发育阶段进行的操作也被 包含在本发明中。
作为本发明的优选方式,所述观测发生基因编辑的情况包括:分选发生 基因编辑的细胞(如tdTomato阳性细胞)以及未发生基因编辑的细胞(如 tdTomato阴性细胞);进行测序分析(如WGS分析);利用SNV分析工具和/ 或indel分析工具进行分析;比较发生编辑的细胞和未发生编辑的细胞来鉴 定脱靶SNV和indel。应理解,测序工具以及分析工具并不限于上述以及本 发明实施例中所列举的,其它的一些测序工具以及分析工具也可被应用于本 发明中。可以应用本领域中已知的多种方法进行细胞分选,例如但不限于磁 珠法、流式细胞术等。
本发明中,所述“动物”是指哺乳纲的动物,包含非人灵长类动物(猴、 猩猩)、家畜与农畜(例如,猪、绵羊、牛),鼠(小鼠),以及啮齿动物(例如, 小鼠、大鼠、兔)等。所述的动物是不包含人的动物;在有限的或特殊的情况 下,所述的动物也可以是人,但这仅被应用于并非涉及“人胚胎的商业应用” 的范畴内。
在本发明的具体实施例中,编辑与未编辑的卵裂球的子代细胞在E14.5 的全基因组序列的比较显示,在CRISPR-Cas9或腺嘌呤单碱基编辑的胚胎中, 单核苷酸突变(SNV)脱靶是罕见的,频率接近于自发突变率。相比之下,胞 嘧啶单碱基编辑诱导产生了超过20倍的脱靶单核苷酸突变。
本发明人进一步研究了导致单碱基编辑发生脱靶效应(如单核苷酸脱靶 变异)的原因。在观测到单碱基编辑工具BE3会导致大量的单核苷酸脱靶变 异(SNV)后,本发明人进行了大量的研究工作,最终确定这些脱靶变异是由 APOBEC1的过表达及其与DNA(如ssDNA)的结合引起的。在具体的实施例 中,本发明揭示一种解决方案,通过在APOBEC1上进行突变,如进行R126E 突变,来解决BE3诱导的脱靶效应。
根据上述,本发明中确定了一个对于降低单碱基编辑器的脱靶效应有用 的方法,包括:在单碱基编辑器系统中,对其中的胞嘧啶脱氨酶进行改造, 弱化其与DNA(如ssDNA)的结合。较佳地,所述的改造是针对胞嘧啶脱氨酶 的DNA结合区域的改造;更佳地,所述的DNA结合区域为其与DNA结合 的结构域。所述的单碱基编辑器例如是E3基因编辑器。
只要能发挥弱化的作用,针对胞嘧啶脱氨酶的多种改造方法都是可用 的。作为一些可选的方式,所述的改造可以是基因突变,靶向性封闭或阻滞(如 以结合蛋白或抗体进行封闭或阻滞,或以竞争性结合分子进行封闭或阻滞), 干扰等。
可应用于单碱基编辑器系统的多种胞嘧啶脱氨酶或与其同功能的酶都 可被本发明的方法改造,以降低其所在的单碱基编辑器系统的脱靶效应。例 如,所述的胞嘧啶脱氨酶包括但不限于选自下组的酶:AID(如:人AID), APOBEC3G(如:人APOBEC3G),APOBEC1,CDA1(如:lamprey CDA1)。
本发明中,所述的“弱化”是指胞嘧啶脱氨酶与DNA的相互作用(结合) 能力被下调或消除。例如该弱化使得胞嘧啶脱氨酶与DNA的结合能力降低 10%、20%、30%、40%、50%、60%、70%、80%、90%或以上,或降低100%。
作为本发明的优选方式,提供了一种具体的胞嘧啶脱氨酶APOBEC1(野 生型序列见SEQ ID NO:1,突变体见SEQ ID NO:4),对其DNA结合区域的 进行改造后,其所参与的单碱基编辑器系统的编辑结果发生了极为显著的变 化,脱靶效应显著性降低。较佳地,这种改造为对该酶的第126位的氨基酸 进行改造;更佳地,所述的改造为将其第126位的R突变为E。
在更为优选的方式中,针对APOBEC1的改造还发生在APOBEC1酶的 第90位氨基酸上;较佳地,所述的改造为将其第90位突变为Y。
作为本发明的另一优选方式,提供了一种具体的胞嘧啶脱氨酶 APOBECA3A(SEQID NO:37),针对APOBECA3A的改造发生在该酶的第130位的氨基酸上或其邻近的位置上;较佳地,所述的改造为将其(SEQ ID NO: 37)第130位的Y突变为F。
根据本发明人的新发现,进一步还提供一种筛选对于降低BE3基因编辑 器的脱靶效应有用的物质的方法,包括:(1)用候选物质处理胞嘧啶脱氨酶或 其DNA结合结构域以及DNA相互作用(结合)的体系;和(2)检测所述体系中 胞嘧啶脱氨酶DNA结合结构域与DNA相互作用情况;其中,若所述候选物 质抑制、阻滞或下调胞嘧啶脱氨酶或其DNA结合结构域与DNA的相互作用, 则表明该候选物质是对于降低BE3基因编辑器的脱靶效应有用的物质。
在本发明的优选方式中,在进行筛选时,为了更易于观察到胞嘧啶脱氨 酶或其DNA结合结构域以及DNA相互作用(结合)的改变,还可设置对照组, 所述的对照组可以是不添加所述候选物质的胞嘧啶脱氨酶或其DNA结合结 构域以及DNA相互作用(结合)的体系。
作为本发明的优选方式,所述的方法还包括:对获得的潜在物质进行进 一步的细胞实验和/或动物试验,以进一步选择和确定对于调节两者的相互作 用(结合)真正有用的物质。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于 说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实 验方法,通常按照常规条件如J.萨姆布鲁克等编著,分子克隆实验指南,第 三版,科学出版社,2002中所述的条件,或按照制造厂商所建议的条件。
材料和方法
1、包含GOTI方法的实验设计
分别将Cre,Cas9/BE3/ABE7.10的mRNA和sgRNA的混合物注射到2 细胞阶段胚胎的一个卵裂球中,该胚胎来自于野生型雌性小鼠X Ai9雄性小 鼠。Cre的作用产生嵌合胚胎,其中注射的细胞被tdTomato(红色)标记, tdTomato阳性表示发生了编辑,tdTomato阴性表示未编辑。通过FACS在 E14.5从嵌合胚胎中分离tdTomato阳性细胞和tdTomato阴性细胞,并分别用 于WGS。通过使用三种算法(用于SNV分析的Mutect2,Lofreq和Strelka, 以及用于indel分析的Mutect2,Scalpel和Strelka)比较tdTomato+细胞和 tdTomato-细胞来鉴定脱靶SNV和indel。SNV和插入缺失在图1A中表示为 有色点和交叉。Cre蛋白序列如SEQ IDNO:2所示,Cas9蛋白序列SEQ ID NO:3所示。
2、动物护理
雌性C57BL/6小鼠(4周龄)和杂合子Ai9(B6.Cg-Gt(ROSA)26Sortm9 (CAG-td-Tomato)Hze/J;JAX strain 007909)雄性小鼠用于胚胎收集。ICR雌性 小鼠作为受体。动物的使用和护理符合中国科学院上海生命科学研究院生物 医学研究伦理委员会的指导原则。
3、Cas9 mRNA,BE3 mRNA,ABE7.10 mRNA,Cre mRNA和sgRNA
使用引物Cas9F和R从px260质粒扩增出Cas9蛋白编码区域。纯化 T7-Cas9 PCR产物,并且使用mMESSAGE mMACHINE T7 ULTRA转录 mRNA。从px330质粒扩增出T7-sgRNA PCR,并使用MEGA Shortcript T7 试剂盒(Life Technologies)将其体外转录成RNA。通过PCR扩增将T7启动子 添加至Cre模板,纯化T7-Cre PCR产物,并使用mMESSAGE mMACHINE T7ULTRA试剂盒(Life Technologies)将其体外转录成mRNA。使用MEGA clear kit(LifeTechnologies)纯化Cas9mRNA,Cre mRNA和sgRNA,并在无RNase 的水中洗脱。
sgRNA序列(序列编号从上到下依次为:SEQ ID NO:5-11)
Figure BDA0002088058690000091
引物序列(序列编号从上到下依次为:SEQ ID NO:12-26)
Figure BDA0002088058690000101
4、2-细胞注射,胚胎培养和胚胎移植
将超排C57BL/6雌性(4周龄)与杂合的Ai9 B6.Cg-Gt(ROSA)26Sortm9(CAG-td-Tomato)Hze/J;JAX strain 007909)雄性交 配,hCG注射后23小时,从输卵管受精卵。对于2-cell编辑,Cas9 mRNA(50 ng/μl),BE3 mRNA(50ng/μl)或ABE7.10mRNA(50ng/μl),sgRNA(50ng/ μl)和Cre mRNA的混合物,使用具有恒定流量的FemtoJet显微注射器(Eppendorf),在hCG注射后48小时,在含有5μg/ml细胞松弛素B(CB)的 HEPES-CZB培养基的液滴中将RNA混合物注射到2-cell胚胎的一个卵裂球 的细胞质中。注射后的胚胎在含有氨基酸的KSOM培养基中于37℃,5%CO2 的空气中培养2小时,然后移植到转移到假孕ICR雌性的输卵管中。
5、单细胞PCR分析
解剖显微镜下使用自制玻璃毛细管,用acid Tyrode solution溶液消化 8-cell阶段小鼠胚胎去除透明带,然后将胚转移到0.25%胰蛋白酶中并轻轻移 液以分离单个卵裂球。最后,将卵裂球KSOM中洗涤中7至10次,并转移 到PCR管中。然后将含有0.1%吐温20,0.1%Triton X-100和4μg/ml蛋白 酶K的1.5μl裂解缓冲液移液到管中。将每个管离心以促进混合。将裂解液 在56℃的温度下孵育30分钟,然后在95℃下孵育5分钟。裂解程序的产物用作巢式PCR分析中的模板。所有操作中避免污染样品。
Nest PCR引物(序列编号从上到下依次为:SEQ ID NO:27-30)
Figure BDA0002088058690000111
6、T载体克隆和基因型检测
纯化PCR产物并连接到pMD18-T载体上并转化到感受态大肠杆菌菌株 DH5α中。在37℃过夜培养后,通过Sanger方法对随机选择的克隆进行测序。 通过从细胞中提取的基因组DNA的PCR确定突变体E14.5胚胎的基因型。 ExTaq在95℃下活化3分钟,PCR在95℃下进行34个循环30秒,62℃下 30秒,72℃下1分钟,最终在72℃下延伸5分钟。分钟。对于胚泡,用KSOM 洗涤6次后,将单个胚泡直接转移到含有1.5μl胚胎裂解缓冲液(0.1%吐温 20,0.1%Triton X-100和4μg/ml蛋白酶K)的PCR管中并孵育30分钟。在56 ℃时,95℃下灭活10分钟。使用巢引物组进行PCR扩增。ExTaq在95℃ 下活化3分钟,PCR在95℃下进行34个循环30秒,62℃下30秒,72℃下 1分钟,最终在72℃下延伸5分钟。分钟。使用0.5μg外侧PCR产物和内侧引物进行二次PCR。PCR在相同的反应混合物中进行。使用pMD-19t克 隆试剂盒(Takara)按照制造商的说明凝胶纯化和克隆PCR产物。从每次转化 中挑选菌落,然后进行Sanger测序以检测突变。
引物序列(序列编号从上到下依次为:SEQ ID NO:31-36)
Figure BDA0002088058690000112
7、流式分选
为了分离细胞,将剪碎的组织在5mL胰蛋白酶-EDTA(0.05%)的溶液中 在37℃下酶解30分钟。通过加入5ml含10%胎牛血清(FBS)的DMEM培养 基终止消化。然后使用1ml枪头反复吹打30-40次使胎儿组织均质化。将细 胞悬浮液离心6分钟(800rpm),将沉淀重悬于含10%FBS的DMEM培养基中。 最后,将细胞悬浮液通过40-μm细胞过滤器过滤,并通过FACS分离tdtomato +/tdtomato-细胞。使用第二轮流式细胞术和荧光显微镜分析评估,样品纯度 >95%判定合格。
8、全基因组测序和数据分析
根据制造商的说明,使用DNeasy血液和组织试剂盒(目录号69504, Qiagen)从细胞中提取基因组DNA。通过Illumina HiSeq X Ten以50倍的平 均覆盖率进行WGS。BWA(v0.7.12)用于将合格的测序读数映射到参考基因 组(mm10)。然后应用Picard工具(v2.3.0)对映射的BAM文件的重复项进行排 序和标记。为了高可信度地鉴定全基因组从头变异,本发明人分别使用三种 算法Mutect2(v3.5),Lofreq(v2.1.2)和Strelka(v2.7.1)进行单核苷酸变异 (25-27)。同时,分别运行Mutect2(v3.5),Scalpel(v0.5.3)和Strelka(v2.7.1)用 于检测全基因组从头插入缺失(25,27,28)。三种SNV或indel算法的重叠 被认为是真正的变体。在tdTomato+样品的定位BAM文件中鉴定变体,其中 tdTomato-样品在与对照相同的胚胎中,仅可鉴定tdTomato+样品中突变的变 体。例如,如果WT等位基因在某个坐标中是G,则tdTomato+细胞携带A, 并且tdTomato-细胞携带G,然后突变体A将被称为从头突变。然而,如果 tdTomato-细胞携带A,则无法鉴定突变体。为了进一步验证脱靶SNV仅在 tdTomato+样品中鉴定,本发明人还称tdTomato-样品中的变体与同一胚胎中 的tdTomato+样品作为对照,其中只有变体在tdTomato-细胞中突变但是在 WT中可以识别tdTomato+细胞。
WGS分析显示Cas9-Tyr-A和Cas9-Tyr-B组的tdTomato-细胞中的低水 平靶向编辑范围为0-6.3%,这可能是由假阴性FACS分选引起的(已知发生在 低水平)。因此,本发明人只考虑等位基因频率超过10%的变体在后续分析中 是可靠的。本发明人还标记了与UCSC重复区域和微卫星序列重叠的变体, 或存在于dbSNP(v138)和MGP(v3)数据库中。所有测序数据都保存在NCBI (SRA)。
9、模拟胚胎发育过程中的自发突变
为了估计从2细胞阶段到E14.5阶段的自发突变的数量,考虑到40的平 均测序覆盖率和10%的等位基因频率阈值,在计算机模拟中发现单核苷酸突 变。对于每一轮模拟,鉴于1.8x 10-10的突变率和小鼠核基因组的大小 (2,785,490,220bp),本发明人考虑了从2细胞阶段到16细胞阶段的复制过程, 对于16阶段后发生的突变-考虑等位基因频率,不会检测到细胞阶段。在每 次复制期间,每个细胞可以突变或不突变,并且一旦发生突变,分裂的细胞 将继承突变。然后随机选择累积突变及其野生型等位基因进行测序,深度为 40,将所选突变总计为每轮的自发突变数,并重复相同的过程10,000次。
10、Digenome-seq分析
如前所述(32)进行了多重Digenome-seq,包括Cas9-LacZ,Cas9-Pde6b, Cas9-Tyr-A和Cas9-Tyr-B。具体地,根据生产商说明书用TIANamp Genomic DNA Kit(Tiangen)从小鼠尾部纯化基因组DNA。PCR扩增每个基因的sgRNA 靶位点包括侧翼的基因组区域,并根据制造商的说明用Universal DNA Purification Kit(Tiangen)纯化PCR扩增产物。将Cas9蛋白(1μg)和sgRNA(1 μg)在室温下预孵育10分钟以形成RNP复合物。将DNA(4μg)与RNP复合物在反应缓冲液中于37℃温育3小时。随后加入RNase A(100μg/ml)以除去 sgRNA后,再次用Universal DNA纯化试剂盒(Tiangen)纯化消化的DNA。
使用Illumina HiSeq X Ten测序仪对文库进行WGS,并且在30x至40x 的测序深度下进行WGS。使用Digenome-seq2 (https://github.com/chizksh/digenome-toolkit2)计算鉴定DNA切割位点。通过 编辑距离用R包“Biostrings”分类鉴定的体外切割位点并列出。
实施例1、三种基因编辑工具的评估
利用GOTI的方法,用于评估三种常用的基因编辑工具,CRISPR-Cas9, 胞嘧啶碱基编辑器3(BE3,rAPOBEC1-nCas9-UGI)和腺嘌呤碱基编辑器 7.10(ABE7.10,TadA-TadA*-nCas9)诱导的脱靶效应(参考文献6-8)。
本发明人将CRISPR-Cas9,BE3或ABE7.10与Cre mRNA再加上相应的 sgRNA一起注射到来自Ai9(CAG-LoxP-Stop-LoxP-tdTomato)小鼠的二细胞胚 胎的一个卵裂球中(参考文献9-10)(图1A)。
利用流式细胞分选(FACS)分离E14.5天的胚胎,根据细胞中tdTomato进 行分选,此时整个胚胎可以容易地被消化以获得足够的单细胞(图1B)。
之后,对分离的tdTomato+和tdTomato-细胞分别进行全基因组测序 (WGS),并通过三种算法对tdTomato+样本鉴定SNV和indel,同时将来自于 同一个胚胎的tdTomato-样品作为参照(图1A)。
本发明人共设计了12个组:一个Cre组(仅Cre),六个包括或者不包括 sgRNA的Cas9组(Cas9,Cas9-LacZ,Cas9-Pde6b,Cas9-Tyr-A,Cas9-Tyr-B 和Cas9-Tyr-C),具有或不具有sgRNA的三个BE3组(BE3,BE3-Tyr-C, BE3-Tyr-D)(参考文献11)和具有或不具有sgRNA的两个ABE组(ABE7.10, ABE7.10-Tyr-E)。
本发明人通过Sanger测序验证了在8细胞和E14.5阶段胚胎的靶向效率。 为了进一步探索目的位点的编辑效率和潜在的全基因组脱靶效应,本发明人 对来自23个E14.5胚胎的46个样品进行了平均深度为47x的WGS(表1)。
表1、HiSeq X Ten sequencing的汇总
Figure BDA0002088058690000141
Figure BDA0002088058690000151
Cas9,BE3和ABE7.10在tdTomato+细胞中的活性分别通过靶向位点的 高indel和高SNV比例得到了证实(图1C;表2-3)。
表2、每个胚胎中SNVs和indels的WGS鉴定
Figure BDA0002088058690000152
*The sgRNA for Pde6b has one mismatch with the C57 genome(3),so therewas no on-target sites.
#Two types of on-target variants,shown in Fig.S4.
表3
Figure BDA0002088058690000153
对于脱靶效应,本发明人发现来自所有12个组的胚胎中仅有0-4个 indel(表2和4),并且它们都没有与预测的脱靶位点有重叠(表5)。
表4
Figure BDA0002088058690000161
表5
Figure BDA0002088058690000171
对于所有Cas9编辑的胚胎,不同Cas9组之间没有显著的SNV差异(平 均12个SNV/胚胎),并且与“Cre”组相比也没有明显的差异(平均14个SNV /胚胎)(表2)。
在Cre或Cas9处理的样品中检测到的SNV可能是由于发育期间基因组 复制期间的自发突变引起的,因为本发明人检测到的SNV的数目在模拟的自 发突变的范围内,并且相邻序列和靶向位点也没有序列相似性(参考文献 12)。
令人惊讶的是,本发明人在BE3编辑的胚胎中发现了平均283个SNV/ 胚胎,比在Cre或Cas9处理的胚胎中观察到的水平高至少20倍(图2A和表 2)。相比之下,ABE7.10平均只产生10个SNV/胚胎,频率接近自发突变率 (图2A和表2)。本发明人进一步比较了“BE3only”组中鉴定到的脱靶位点 与BE3-Tyr-C或BE3-Tyr-D中的脱靶位点,发现sgRNA的存在不会诱导产 生更高的SNV(P=0.21,Kruskal-Wallis检验)。此外,这些突变是在tdTomato+ 细胞而不是tdTomato-细胞中特异性鉴定到的(参见方法,表6)。
表6
Figure BDA0002088058690000181
Figure BDA0002088058690000191
值得注意的是,在BE3编辑的细胞中鉴定到的SNV超过90%都是从G 突变为A或从C突变为T,在Cre-,Cas9-或ABE7.10处理的细胞中未观察 到突变偏好性(图2B和C)。这种突变偏好性与APOBEC1本身(参考文献13) 的偏好性相同,表明这些突变不是自发的,而是由BE3编辑诱导的。以前的 研究表明,APOBEC家族的几个成员(包括APOBEC1)的作用需要单链DNA 的存在(参考文献14-16)。本发明人的分析也显示BE3诱导的SNV在转录区 域存在显著富集(图3A),尤其是在具有高表达的基因中(图3B。有趣的是, 没有任何脱靶位点在不同的BE3编辑的胚胎中共享或与预测的脱靶位点重合 (图3C和D)。
此外,在脱靶和目标位点之间未观察到序列相似性,而通过计算机预测 的脱靶位点显示与BE3的靶向位点存在很高的序列相似性。因此,BE3脱靶 SNV是sgRNA非依赖性的并且可能由APOBEC1的过表达引起。
在BE3诱导产生的1698个SNV中,26个位于外显子上,其中14个导 致非同义变化。本发明人通过PCR成功扩增了20个,并通过Sanger测序证 实了它们的存在(表7)。
表7
Figure BDA0002088058690000201
本发明人还发现1个SNV位于原癌基因,13个SNV位于抑癌基因上, 引起了对BE3编辑的致癌风险的担忧。本发明人猜测是否通过表达较低量的 BE3可以降低这种风险,然而,使用较少量的BE3会逐渐降低目标位点编辑 的效率(表8)。
表8
Figure BDA0002088058690000211
本发明人发现BE3诱导产生了许多新的SNV,这在以前的研究中没有报 道。可能的解释是,本发明中GOTI可以检测来自单个基因编辑的卵裂球的 细胞群,而之前的研究使用了大量的细胞池,其中编辑是不一样的,由于种 群平均导致随机脱靶的信号丢失。与BE3不同,ABE7.10诱导的SNV没有 增加,可能是由于TadA缺乏DNA结合能力(参考文献17)。BE3的脱靶效应 可能可以通过降低APOBEC1的DNA结合能力或使用不同形式的胞嘧啶脱氨 酶得到解决。总之,GOTI免于受不同个体之间的SNP干扰而用于检查各种 基因编辑工具的脱靶效应。
实施例2、APOBEC1酶对于脱靶效应的影响作用
如上,单碱基编辑工具BE3会导致大量的单核苷酸脱靶变异(SNV)。本 发明人预期这些脱靶变异是由APOBEC1的过表达及其与单链DNA(ssDNA) 的结合引起的。然而,单碱基基因编辑工具(BEs)已被广泛用于单个碱基的突 变研究,并且有成为纠正病原突变的潜力。本实施例中,本发明人测试解决 BE3的脱靶问题的可能性,从而使疾病相关的靶Cs能够被特异性地矫正。 野生型APOBEC1蛋白序列如SEQ ID NO:1所示。
为了进行BE3脱靶评估所构建的BE2系统如图4a,其中包括Apobec1 以及Sp nCas9酶、UGI酶,通过16AA(序列为SGSETPGTSESATPES(SEQ ID NO:38))和4AA(序列为SGGS(SEQID NO:39))两段肽进行连接。
本发明人首先减少注入胚胎的BE3 mRNA的量,并应用GOTI来检测脱 靶变体。随着BE3的注射减少,相应地降低了靶向位点基因编辑的效率(图 4b)。但是脱靶SNV的数量没有显著降低(图4c)。
作为替代方法,本发明人尝试对Apobec1蛋白上的ssDNA结合域进行 突变,观测是否可降低APOBEC1的脱靶活性。本发明人根据先前的研究将 相应的BE3相应氨基酸位点进行突变,并使用GOTI方法评估它们对靶向效 率和脱靶效应的影响(图4a)。
本发明人评估了基因编辑Tyr-C和Tyr-D靶位点不同突变的效率。首先 使用sgRNA-C和D评估突变体BE3,BE3-W90A(发生于Apobec1蛋白氨基 酸序列第90位上),BE3-W90F,BE3-R132E(发生于Apobec1蛋白氨基酸序 列第132位上),BE3-R126E(发生于Apobec1蛋白氨基酸序列第126位上) 和BE3-E63A(发生于Apobec1蛋白氨基酸序列第63位上)编辑活性。结果显 示,与BE3相比BE3-R126E突变在两个靶位点上编辑效率相差不大。突变 体BE3-R126E的活性也通过来自WGS的高靶向效率证实(图4b)。但是,值 得注意的是,与BE3相比,R126E突变胚胎中的脱靶SNV的数量显著减少, 并且与“仅Cre”相比没有发现显著差异(图4c)。此外,在R126E处理的两 个胚胎中相差不大。检测到的SNV数量接近自发突变率,并且没有SNV与 预测潜在的脱靶位点重叠,表明通过突变Apobec1 126精氨酸成为谷氨酸可显著降低BE3诱导的脱靶SNV。
基于上述,本发明人首次揭示一种解决方案,通过在APOBEC1上进行 突变,如进行R126E突变,来解决BE3诱导的脱靶效应。
本发明中建立的模块性表明GOTI适用于APOBEC1的其他突变版本或 胞苷脱氨酶的新工程化版本的进一步解决方案。
实施例3、突变优化研究
首先,本发明人将不同量的BE3 mRNA(50ng/μl和10ng/μl)与 sgRNA-Tyr-C或sgRNA-Tyr-D一起注入胚胎,并通过单细胞Sanger测序评 估靶向效率。
本发明人发现,使用较少量的BE3可显著降低靶向效率(72.6±5.3%,50 ng/μl;12.6±2.9%,10ng/μl。
然后本发明人应用GOTI方法进行全基因组脱靶评估,通过双细胞胚胎 注射(GOTI)进行全基因组脱靶分析,以检测BE3-Tyr-D处理的胚胎上的脱靶 变体,并且发现两种不同水平(分别注射50ng/nl和10ng/nl)的BE3 mRNA的 脱靶SNV的数量没有变化。
本发明人接下来检查了APOBEC1的DNA结合域处的点突变是否会降低 BE3的脱靶率。基于先前研究提出的DNA结合域,本发明人将各种点突变 引入BE3体系中的APOBEC1的推定DNA结合域,并评估它们对靶向效率 和脱靶率的影响(图5a)。对于点突变E63A,R126E和R132E,BE3的碱基编 辑效率在Tyr基因上的两个位点的靶向碱基编辑中评估,其中在2细胞小鼠 胚胎中具有相应的sgRNA Tyr-C和Tyr-D(图5b)。本发明人发现,与野生型 BE3相比,BE3-E63A或BE3-R132E在Tyr上的编辑效率都显著降低,而 BE3-R126E在两个靶位点都保持了高编辑效率。本发明人进一步证实, BE3-R126E的DNA靶向活性与HEK293T细胞中另外三个位点上的BE3相 似。有趣的是,BE3-R126E的编辑窗口缩小了。
本发明人接下来进行GOTI以评估BE3-R126E在具有或不具有 sgRNA(BE3-R126E,BE3-R126E-Tyr-C和BE3-R126E-Tyr-D)的三组, BE3-W90Y+R126E(YE1)-Tyr-C和BE3-W90F+R126E(FE1)-Tyr-C中的靶向效 率和脱靶频率。通过全基因组测序确认了靶向效率(图5c)。值得注意的是, 用BE3-R126E和BE3-W90Y+R126E(YE1)处理的胚胎中脱靶SNV的数量从 野生型BE3处理的胚胎中的283±2(n=6)显著降低至24±8(n=8;3 BE3-R126E),2BE3-R126E-Tyr-C,3BE3-R126E-Tyr-D,5 BE3-W90Y+R126E(YE1)和BE3-W90F+R126E(FE1),类似于未编辑的对照胚 胎中发现的(平均14个SNV,n=2,P=0.5),接近于自发突变(图5d)。此外, 本发明人没有观察到突变偏差和没有与预测的脱靶位点重叠的SNV,表明 BE3R126E诱导的脱靶SNV不存在。
本发明人进一步在293T细胞上检测BE3-W90Y+R126E(YE1), BE3-R126E在转录组水平脱靶情况。结果发现BE3-R126E可以显著降低RNA 的脱靶。BE3-W90Y+R126E(YE1)可以完全消除RNA的脱靶(图5e)。
图5d-e中,BE3(hA3A)是使用人的APOBECA3A(human APOBECA3A) 取代了BE3上的apobec1,构建的新的BE3编辑工具。BE3(hA3AY130F)是 在human APOBECA3A突变Y130转变为F,可以观测到这一突变显著减少 脱靶SNV的数量。
总之,通过应用GOTI方法评估脱靶SNV的量,能够证明通过突变基础 编辑器的脱氨酶的假定ssDNA结合域可以消除胞嘧啶碱基编辑器的DNA和RNA水平脱靶效应。
该结果表明,基础编辑器可以被设计成用于基因编辑和治疗应用的有效 且安全的工具。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文 献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容 之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样 落于本申请所附权利要求书所限定的范围。
参考文献:
1.G.J.Knott,J.A.Doudna,CRISPR-Cas guides the future of geneticengineering.Science 361,866-869(2018).
2.S.Q.Tsai,J.K.Joung,Defining and improving the genome-widespecificities of CRISPR- Cas9 nucleases.Nat Rev Genet 17,300-312(2016).
3.C.R.Lazzarotto et al.,Defining CRISPR-Cas9 genome-wide nucleaseactivities with CIRCLE-seq.Nat Protoc 13,2615-2642(2018).
4.K.R.Anderson et al.,CRISPR off-target analysis in geneticallyengineered rats and mice. Nat Methods 15,512-514(2018).
5.D.Kim et al.,Genome-wide target specificities of CRISPR RNA-guidedprogrammable deaminases.Nat Biotechnol 35,475-480(2017).
6.T.I.Cornu,C.Mussolino,T.Cathomen,Refining strategies to translategenome editing to the clinic.Nature Medicine 23,415-423(2017).
7.H.A.Rees,D.R.Liu,Base editing:precision chemistry on the genome andtranscriptome of living cells.Nat Rev Genet,(2018).
8.N.M.Gaudelli et al.,Programmablebase editing of A*T to G*C ingenomic DNA without DNA cleavage.Nature 5511,464-471(2017).
9.L.Madisen et al,A robust and high-throughput Cre reporting andcharacterization system for the whole mouse brain.Nat Neurosci 13,133-140(2010).
10.L.Wang et al.,CRISPR-Cas9-mediated genome editing in oneblastomere of two-cell embryosreveals a novel Tet3function in regulatingneocortical development.Cell Res 27, 815-829(2017).
11.K.Kim et al.,Highly efficient RNA-guided base editing in mouseembryos.Nat Biotechnol 35,435-437(2017).
12.J.W.Drake,B.Charlesworth,D.Charlesworth,J.F.Crow,Rates ofspontaneous mutation. Genetics 148,1667-1686(1998).
13.A.C.Komor,Y.B.Kim,M.S.Packer,J.A.Zuris,D.R.Liu,Programmableediting of a target base in genomic DNA without double-stranded DNAcleavage.Nature 533,420-424 (2016).
14.R.S.Harris,S.K.Petersen-Mahrt,M.S.Neuberger,RNA editing enzymeAPOBEC1 and some of its homologs can act as DNA mutators.Mol Cell 10,1247-1253(2002).
15.S.Rebhandl,M.Huemer,R.Greil,R.Geisberger,AlD/APOBEC deaminases andcancer. Oncoscience 2,320-333(2015).
16.L.B.Alexandrov et al.,Signatures of mutational processes in humancancer.Nature 500, 415-421(2013).
17.H.C.Losey,A.J.Ruthenburg,G.L.Verdine,Crystal structure ofStaphylococcus aureus tRNA adenosine deaminase TadA in complex withRNA.NatStruct Mol Biol 13,153-159 (2006).
18.S.Jin et al.,Cytosine,but not adenine,base editors induce genome-wide off-target mutations in rice.Science,in press(2019).
19.Y.B.Kim et al.,Increasing the genome-targeting scope and precisionof base editing with engineered Cas9-cytidine deaminase fusions.NatBiotechnol 35,371-376(2017).
20.X.Wang et al.,Efficient base editing in methylated regions with ahuman APOBEC3A- Cas9fusion.NatBiotechnol 36,946-949(2018).
21.J.M.Gehrke et al.,An APOBEC3A-Cas9base editor with minimizedbystander and off- target activities.Nat Biotechnol 36,977-982(2018).
序列表
<110> 中国科学院上海生命科学研究院
<120> 高特异性无脱靶单碱基基因编辑工具
<130> 191650Z1
<160> 39
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1710
<212> PRT
<213> APOBEC1野生型序列(APOBEC1)
<400> 1
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Arg Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
1010 1015 1020
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu
1025 1030 1035 1040
Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr
1045 1050 1055
Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu
1060 1065 1070
Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln
1075 1080 1085
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
1090 1095 1100
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val
1105 1110 1115 1120
Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile
1125 1130 1135
Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
1140 1145 1150
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr
1155 1160 1165
Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
1170 1175 1180
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile
1185 1190 1195 1200
Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1205 1210 1215
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1220 1225 1230
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1250 1255 1260
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr
1265 1270 1275 1280
Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1285 1290 1295
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1300 1305 1310
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1315 1320 1325
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
1330 1335 1340
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser
1345 1350 1355 1360
Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly
1365 1370 1375
Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys
1380 1385 1390
Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1395 1400 1405
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1410 1415 1420
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
1425 1430 1435 1440
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1445 1450 1455
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1460 1465 1470
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1490 1495 1500
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe
1505 1510 1515 1520
Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1525 1530 1535
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1540 1545 1550
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1555 1560 1565
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1570 1575 1580
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr
1585 1590 1595 1600
Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser
1605 1610 1615
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1620 1625 1630
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
1635 1640 1645
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
1650 1655 1660
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
1665 1670 1675 1680
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
1685 1690 1695
Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1700 1705 1710
<210> 2
<211> 359
<212> PRT
<213> Cre 蛋白序列(Cre )
<400> 2
Met Pro Lys Lys Lys Arg Lys Val Ser Asn Leu Leu Thr Val His Gln
1 5 10 15
Asn Leu Pro Ala Leu Pro Val Asp Ala Thr Ser Asp Glu Val Arg Lys
20 25 30
Asn Leu Met Asp Met Phe Arg Asp Arg Gln Ala Phe Ser Glu His Thr
35 40 45
Trp Lys Met Leu Leu Ser Val Cys Arg Ser Trp Ala Ala Trp Cys Lys
50 55 60
Leu Asn Asn Arg Lys Trp Phe Pro Ala Glu Pro Glu Asp Val Arg Asp
65 70 75 80
Tyr Leu Leu Tyr Leu Gln Ala Arg Gly Leu Ala Val Lys Thr Ile Gln
85 90 95
Gln His Leu Gly Gln Leu Asn Met Leu His Arg Arg Ser Gly Leu Pro
100 105 110
Arg Pro Ser Asp Ser Asn Ala Val Ser Leu Val Met Arg Arg Ile Arg
115 120 125
Lys Glu Asn Val Asp Ala Gly Glu Arg Ala Lys Gln Ala Leu Ala Phe
130 135 140
Glu Arg Thr Asp Phe Asp Gln Val Arg Ser Leu Met Glu Asn Ser Asp
145 150 155 160
Arg Cys Gln Asp Ile Arg Asn Leu Ala Phe Leu Gly Ile Ala Tyr Asn
165 170 175
Thr Leu Leu Arg Ile Ala Glu Ile Ala Arg Ile Arg Val Lys Asp Ile
180 185 190
Ser Arg Thr Asp Gly Gly Arg Met Leu Ile His Ile Gly Arg Thr Lys
195 200 205
Thr Leu Val Ser Thr Ala Gly Val Glu Lys Ala Leu Ser Leu Gly Val
210 215 220
Thr Lys Leu Val Glu Arg Trp Ile Ser Val Ser Gly Val Ala Asp Asp
225 230 235 240
Pro Asn Asn Tyr Leu Phe Cys Arg Val Arg Lys Asn Gly Val Ala Ala
245 250 255
Pro Ser Ala Thr Ser Gln Leu Ser Thr Arg Ala Leu Glu Gly Ile Phe
260 265 270
Glu Ala Thr His Arg Leu Ile Tyr Gly Ala Lys Asp Asp Ser Gly Gln
275 280 285
Arg Tyr Leu Ala Trp Ser Gly His Ser Ala Arg Val Gly Ala Ala Arg
290 295 300
Asp Met Ala Arg Ala Gly Val Ser Ile Pro Glu Ile Met Gln Ala Gly
305 310 315 320
Gly Trp Thr Asn Val Asn Ile Val Met Asn Tyr Ile Arg Asn Leu Asp
325 330 335
Ser Glu Thr Gly Ala Met Val Arg Leu Leu Glu Asp Gly Asp Tyr Pro
340 345 350
Tyr Asp Val Pro Asp Tyr Ala
355
<210> 3
<211> 1423
<212> PRT
<213> Cas9蛋白序列(Cas9)
<400> 3
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Ala Ala Asp Lys Lys Tyr Ser Ile Gly Leu
35 40 45
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
50 55 60
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
65 70 75 80
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
85 90 95
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
100 105 110
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
115 120 125
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
130 135 140
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
145 150 155 160
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
165 170 175
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
180 185 190
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
195 200 205
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
210 215 220
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
225 230 235 240
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
245 250 255
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
260 265 270
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
275 280 285
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
290 295 300
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
305 310 315 320
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
325 330 335
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
340 345 350
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
355 360 365
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
370 375 380
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
385 390 395 400
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
405 410 415
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
420 425 430
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
435 440 445
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
450 455 460
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
465 470 475 480
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
485 490 495
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
500 505 510
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
515 520 525
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
530 535 540
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
545 550 555 560
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
565 570 575
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
580 585 590
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
595 600 605
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
610 615 620
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
625 630 635 640
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
645 650 655
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
660 665 670
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
675 680 685
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
690 695 700
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
705 710 715 720
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
725 730 735
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
740 745 750
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
755 760 765
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
770 775 780
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
785 790 795 800
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
805 810 815
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
820 825 830
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
835 840 845
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
850 855 860
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
865 870 875 880
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
885 890 895
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
900 905 910
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
915 920 925
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
930 935 940
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
945 950 955 960
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
965 970 975
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
980 985 990
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
995 1000 1005
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1010 1015 1020
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr
1025 1030 1035 1040
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp
1045 1050 1055
Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1060 1065 1070
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu
1075 1080 1085
Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1090 1095 1100
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala
1105 1110 1115 1120
Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1125 1130 1135
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1140 1145 1150
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1155 1160 1165
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val
1170 1175 1180
Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys
1185 1190 1195 1200
Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn
1205 1210 1215
Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp
1220 1225 1230
Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1235 1240 1245
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1250 1255 1260
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1265 1270 1275 1280
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu
1285 1290 1295
Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1300 1305 1310
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys
1315 1320 1325
Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1330 1335 1340
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro
1345 1350 1355 1360
Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1365 1370 1375
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1380 1385 1390
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Lys
1395 1400 1405
Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1410 1415 1420
<210> 4
<211> 1710
<212> PRT
<213> APOBEC1突变型序列(APOBEC1 mutant)
<400> 4
Met Ser Ser Glu Thr Gly Pro Val Ala Val Asp Pro Thr Leu Arg Arg
1 5 10 15
Arg Ile Glu Pro His Glu Phe Glu Val Phe Phe Asp Pro Arg Glu Leu
20 25 30
Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile Asn Trp Gly Gly Arg His
35 40 45
Ser Ile Trp Arg His Thr Ser Gln Asn Thr Asn Lys His Val Glu Val
50 55 60
Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg Tyr Phe Cys Pro Asn Thr
65 70 75 80
Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp Ser Pro Cys Gly Glu Cys
85 90 95
Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg Tyr Pro His Val Thr Leu
100 105 110
Phe Ile Tyr Ile Ala Arg Leu Tyr His His Ala Asp Pro Glu Asn Arg
115 120 125
Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly Val Thr Ile Gln Ile Met
130 135 140
Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg Asn Phe Val Asn Tyr Ser
145 150 155 160
Pro Ser Asn Glu Ala His Trp Pro Arg Tyr Pro His Leu Trp Val Arg
165 170 175
Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile Leu Gly Leu Pro Pro Cys
180 185 190
Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln Leu Thr Phe Phe Thr Ile
195 200 205
Ala Leu Gln Ser Cys His Tyr Gln Arg Leu Pro Pro His Ile Leu Trp
210 215 220
Ala Thr Gly Leu Lys Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
225 230 235 240
Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly
245 250 255
Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro
260 265 270
Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys
275 280 285
Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu
290 295 300
Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys
305 310 315 320
Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys
325 330 335
Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu
340 345 350
Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp
355 360 365
Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys
370 375 380
Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu
385 390 395 400
Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly
405 410 415
Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu
420 425 430
Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser
435 440 445
Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg
450 455 460
Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly
465 470 475 480
Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe
485 490 495
Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys
500 505 510
Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp
515 520 525
Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile
530 535 540
Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro
545 550 555 560
Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu
565 570 575
Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys
580 585 590
Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
595 600 605
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu
610 615 620
Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu
625 630 635 640
Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His
645 650 655
Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp
660 665 670
Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu
675 680 685
Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
690 695 700
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp
705 710 715 720
Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile
725 730 735
Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu
740 745 750
Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu
755 760 765
Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu
770 775 780
Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn
785 790 795 800
Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile
805 810 815
Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn
820 825 830
Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
835 840 845
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val
850 855 860
Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu
865 870 875 880
Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys
885 890 895
Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
900 905 910
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
915 920 925
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
930 935 940
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln
945 950 955 960
Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala
965 970 975
Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
980 985 990
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala
995 1000 1005
Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg
1010 1015 1020
Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu
1025 1030 1035 1040
Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr
1045 1050 1055
Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu
1060 1065 1070
Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln
1075 1080 1085
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser
1090 1095 1100
Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val
1105 1110 1115 1120
Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile
1125 1130 1135
Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
1140 1145 1150
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr
1155 1160 1165
Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
1170 1175 1180
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile
1185 1190 1195 1200
Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe
1205 1210 1215
Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1220 1225 1230
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu
1235 1240 1245
Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1250 1255 1260
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr
1265 1270 1275 1280
Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1285 1290 1295
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1300 1305 1310
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1315 1320 1325
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val
1330 1335 1340
Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser
1345 1350 1355 1360
Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly
1365 1370 1375
Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys
1380 1385 1390
Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1395 1400 1405
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1410 1415 1420
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
1425 1430 1435 1440
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg
1445 1450 1455
Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1460 1465 1470
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys
1475 1480 1485
Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1490 1495 1500
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe
1505 1510 1515 1520
Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1525 1530 1535
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1540 1545 1550
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1555 1560 1565
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys
1570 1575 1580
Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr
1585 1590 1595 1600
Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser
1605 1610 1615
Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1620 1625 1630
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
1635 1640 1645
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu
1650 1655 1660
Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
1665 1670 1675 1680
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile
1685 1690 1695
Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1700 1705 1710
<210> 5
<211> 23
<212> DNA
<213> 导向RNA(sgRNA)
<400> 5
gcgaaggcac cgccctcttt tgg 23
<210> 6
<211> 23
<212> DNA
<213> 导向RNA(sgRNA)
<400> 6
ccagaagcca atgcacctat cgg 23
<210> 7
<211> 23
<212> DNA
<213> 导向RNA(sgRNA)
<400> 7
tgcgaatacg cccacgcgat ggg 23
<210> 8
<211> 23
<212> DNA
<213> 导向RNA(sgRNA)
<400> 8
ccaacctaag tagcagaaag tgg 23
<210> 9
<211> 23
<212> DNA
<213> 导向RNA(sgRNA)
<400> 9
gacctcagtt ccccttcaaa ggg 23
<210> 10
<211> 23
<212> DNA
<213> 导向RNA(sgRNA)
<400> 10
ctgtgccaag gcagaaaccc tgg 23
<210> 11
<211> 23
<212> DNA
<213> 导向RNA(sgRNA)
<400> 11
ccataacaga gactcttaca tgg 23
<210> 12
<211> 45
<212> DNA
<213> 引物(Primer)
<400> 12
taatacgact cactataggg agacagatca cctttcctat caacc 45
<210> 13
<211> 22
<212> DNA
<213> 引物(Primer)
<400> 13
tcggtatttc cagcacactg ga 22
<210> 14
<211> 21
<212> DNA
<213> 引物(Primer)
<400> 14
tccgcggccg ctaatacgac t 21
<210> 15
<211> 23
<212> DNA
<213> 引物(Primer)
<400> 15
tggttctttc cgcctcagaa gcc 23
<210> 16
<211> 41
<212> DNA
<213> 引物(Primer)
<400> 16
taatacgact cactataggg agatttcagg ttggaccggt g 41
<210> 17
<211> 20
<212> DNA
<213> 引物(Primer)
<400> 17
gacgtcagcg ttcgaattgc 20
<210> 18
<211> 22
<212> DNA
<213> 引物(Primer)
<400> 18
gaggtctata taagcagagc tc 22
<210> 19
<211> 23
<212> DNA
<213> 引物(Primer)
<400> 19
attaataact agcggccgct ccc 23
<210> 20
<211> 59
<212> DNA
<213> 引物(Primer)
<400> 20
taatacgact cactataggg gcgaaggcac cgccctcttt gttttagagc tagaaatag 59
<210> 21
<211> 59
<212> DNA
<213> 引物(Primer)
<400> 21
taatacgact cactataggg ccagaagcca atgcacctat gttttagagc tagaaatag 59
<210> 22
<211> 59
<212> DNA
<213> 引物(Primer)
<400> 22
taatacgact cactataggg gacctcagtt ccccttcaaa gttttagagc tagaaatag 59
<210> 23
<211> 59
<212> DNA
<213> 引物(Primer)
<400> 23
taatacgact cactataggg ctgtgccaag gcagaaaccc gttttagagc tagaaatag 59
<210> 24
<211> 59
<212> DNA
<213> 引物(Primer)
<400> 24
taatacgact cactataggg ccataacaga gactcttaca gttttagagc tagaaatag 59
<210> 25
<211> 59
<212> DNA
<213> 引物(Primer)
<400> 25
taatacgact cactataggg tgcgaatacg cccacgcgat gttttagagc tagaaatag 59
<210> 26
<211> 20
<212> DNA
<213> 引物(Primer)
<400> 26
aaaagcaccg actcggtgcc 20
<210> 27
<211> 21
<212> DNA
<213> 引物(Primer)
<400> 27
gttatcctca cactacttct g 21
<210> 28
<211> 21
<212> DNA
<213> 引物(Primer)
<400> 28
gtaatcctac caagagtctc a 21
<210> 29
<211> 20
<212> DNA
<213> 引物(Primer)
<400> 29
tcctcacact acttctgatg 20
<210> 30
<211> 20
<212> DNA
<213> 引物(Primer)
<400> 30
gtctcaagat ggaagatcac 20
<210> 31
<211> 21
<212> DNA
<213> 引物(Primer)
<400> 31
gttatcctca cactacttct g 21
<210> 32
<211> 21
<212> DNA
<213> 引物(Primer)
<400> 32
gtaatcctac caagagtctc a 21
<210> 33
<211> 20
<212> DNA
<213> 引物(Primer)
<400> 33
gtctgtgaca ctcattaacc 20
<210> 34
<211> 21
<212> DNA
<213> 引物(Primer)
<400> 34
cataggaggt gctaacaata c 21
<210> 35
<211> 20
<212> DNA
<213> 引物(Primer)
<400> 35
gtattgcctt ctgtggagtt 20
<210> 36
<211> 20
<212> DNA
<213> 引物(Primer)
<400> 36
tgaaccaatc agtccttgtt 20
<210> 37
<211> 1680
<212> PRT
<213> BE3-hA3A氨基酸(BE3-hA3A)
<400> 37
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1 5 10 15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
20 25 30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
35 40 45
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
50 55 60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65 70 75 80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
85 90 95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
100 105 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
115 120 125
Ile Tyr Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
130 135 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145 150 155 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
165 170 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
180 185 190
Ile Leu Gln Asn Gln Gly Asn Ser Gly Ser Glu Thr Pro Gly Thr Ser
195 200 205
Glu Ser Ala Thr Pro Glu Ser Asp Lys Lys Tyr Ser Ile Gly Leu Ala
210 215 220
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
225 230 235 240
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
245 250 255
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
260 265 270
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
275 280 285
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
290 295 300
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
305 310 315 320
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
325 330 335
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
340 345 350
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
355 360 365
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
370 375 380
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
385 390 395 400
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
405 410 415
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
420 425 430
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
435 440 445
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
450 455 460
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
465 470 475 480
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
485 490 495
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
500 505 510
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
515 520 525
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
530 535 540
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
545 550 555 560
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
565 570 575
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
580 585 590
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
595 600 605
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
610 615 620
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
625 630 635 640
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
645 650 655
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
660 665 670
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
675 680 685
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
690 695 700
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
705 710 715 720
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
725 730 735
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
740 745 750
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
755 760 765
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
770 775 780
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
785 790 795 800
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
805 810 815
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
820 825 830
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
835 840 845
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
850 855 860
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
865 870 875 880
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
885 890 895
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
900 905 910
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
915 920 925
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
930 935 940
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu
945 950 955 960
Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu
965 970 975
Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
980 985 990
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln
995 1000 1005
Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys
1010 1015 1020
Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln
1025 1030 1035 1040
Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val
1045 1050 1055
Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr
1060 1065 1070
Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1075 1080 1085
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys
1090 1095 1100
Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly
1105 1110 1115 1120
Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val
1125 1130 1135
Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
1140 1145 1150
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys
1155 1160 1165
Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
1170 1175 1180
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp
1185 1190 1195 1200
Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro
1205 1210 1215
Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1220 1225 1230
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala
1235 1240 1245
Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1250 1255 1260
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn
1265 1270 1275 1280
Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1285 1290 1295
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1300 1305 1310
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1315 1320 1325
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys
1330 1335 1340
Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val
1345 1350 1355 1360
Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu
1365 1370 1375
Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro
1380 1385 1390
Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1395 1400 1405
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1410 1415 1420
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
1425 1430 1435 1440
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr
1445 1450 1455
Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1460 1465 1470
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser
1475 1480 1485
Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1490 1495 1500
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala
1505 1510 1515 1520
Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1525 1530 1535
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1540 1545 1550
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1555 1560 1565
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly
1570 1575 1580
Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln
1585 1590 1595 1600
Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu
1605 1610 1615
Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
1620 1625 1630
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
1635 1640 1645
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn
1650 1655 1660
Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1665 1670 1675 1680
<210> 38
<211> 16
<212> PRT
<213> 连接肽(linker)
<400> 38
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1 5 10 15
<210> 39
<211> 4
<212> PRT
<213> 连接肽(linker)
<400> 39
Ser Gly Gly Ser
1

Claims (23)

1.一种降低单碱基编辑器的脱靶效应的方法,包括:在单碱基编辑器系统中,对其中的胞嘧啶脱氨酶进行改造,弱化其与DNA的结合。
2.如权利要求1所述的方法,其特征在于,所述的改造是针对胞嘧啶脱氨酶的DNA结合区域的改造;较佳地,所述的DNA结合区域为其与DNA结合的结构域。
3.如权利要求2所述的方法,其特征在于,所述的改造包括但不限于:基因突变,靶向性封闭或阻滞,干扰。
4.如权利要求1所述的方法,其特征在于,所述的单碱基编辑器系统为BE3基因编辑器系统;或
所述的DNA为单链DNA或双链DNA。
5.如权利要求1所述的方法,其特征在于,所述的胞嘧啶脱氨酶包括但不限于选自下组的酶:AID,APOBEC3G,APOBEC1,APOBECA3A,CDA1。
6.如权利要求5所述的方法,其特征在于,所述的胞嘧啶脱氨酶为APOBEC1;较佳地,所述的改造为对该酶的第126位的氨基酸进行改造;更佳地,所述的改造为将其第126位的R突变为E。
7.如权利要求6所述的方法,其特征在于,APOBEC1的改造还包括:对APOBEC1酶的第90位的氨基酸进行改造;更佳地,所述的改造为将其第90位突变为Y。
8.如权利要求5所述的方法,其特征在于,所述的胞嘧啶脱氨酶为APOBECA3A,所述的改造为对该酶的第130位的氨基酸进行改造;较佳地,所述的改造为将其第130位的Y突变为F。
9.一种胞嘧啶脱氨酶的突变体,其DNA结合区域发生改造,该改造使得其与DNA的结合被弱化,所述的DNA如单链DNA;较佳地,所述的胞嘧啶脱氨酶包括但不限于选自下组的酶:AID,APOBEC3G,APOBEC1,APOBECA3A,CDA1。
10.如权利要求9所述的突变体,其特征在于,所述的酶为APOBEC1;较佳地,所述改造发生在该结构域的第126位氨基酸上或其邻近的位置上;更佳地,所述的改造为将其第126位的R突变为E。
11.如权利要求9所述的突变体,其特征在于,所述的改造还发生在APOBEC1酶的第90位氨基酸上,更佳地,所述的改造为将其第90位突变为Y。
12.如权利要求9所述的突变体,其特征在于,所述的酶为APOBECA3A,所述改造发生在该酶的第130位的氨基酸上或其邻近的位置上;较佳地,所述的改造为将其第130位的Y突变为F。
13.分离的多核苷酸,其特征在于,所述的多核苷酸编码权利要求9-12任一所述的突变体。
14.一种单碱基编辑器,其包含权利要求9-12任一所述的胞嘧啶脱氨酶的突变体;较佳地所述的编辑器为BE3单碱基编辑器。
15.权利要求9-13任一所述的胞嘧啶脱氨酶突变体的用途,用于参与基于单碱基编辑器系统的基因编辑,以降低基因编辑器的脱靶效应。
16.一种筛选对于降低单碱基编辑器的脱靶效应有用的物质的方法,包括:
(1)用候选物质处理胞嘧啶脱氨酶或其DNA结合结构域以及DNA相互作用的体系;和
(2)检测所述体系中胞嘧啶脱氨酶DNA结合结构域与DNA相互作用情况;其中,若所述候选物质抑制、阻滞或下调胞嘧啶脱氨酶或其DNA结合结构域与DNA的相互作用,则表明该候选物质是对于降低基因编辑器的脱靶效应有用的物质。
17.一种分析单碱基基因编辑工具的靶向效应的方法,其特征在于,所述方法包括:
(1)获取2-细胞阶段的胚胎,在其中一个细胞中进行基因编辑操作;
(2)在胚胎发育的下游阶段,观测发生基因编辑的情况。
18.如权利要求17所述的方法,其特征在于,步骤(1)中,包括:将用于切割DNA靶位点的酶的mRNA,Cre mRNA,以及相应sgRNA引入到所述的其中一个细胞中,进行基因编辑。
19.如权利要求18所述的方法,其特征在于,所述的用于切割DNA靶位点的酶选自但不限于下组的酶:Cas9,BE3,ABE7.10。
20.如权利要求17所述的方法,其特征在于,步骤(1)中,采用可检测标记物来标记所述的基因编辑操作;较佳地,所述的可检测标记物包括但不限于:染色标记物、荧光信号分子、报告基因;更佳地,所述的可检测标记物为tdTomato。
21.如权利要求17所述的方法,其特征在于,步骤(2)中,所述的胚胎发育的下游阶段包括但不限于:E9.5-E18.5的阶段。
22.如权利要求17所述的方法,其特征在于,步骤(2)中,所述观测发生基因编辑的情况包括:
分选发生基因编辑的细胞以及未发生基因编辑的细胞);
进行测序分析;
利用单核苷酸变异分析工具和/或indel分析工具进行分析;
比较发生编辑的细胞和未发生编辑的细胞来鉴定脱靶SNV和indel。
23.如权利要求22所述的方法,其特征在于,所述的单核苷酸变异分析工具包括但不限于:Mutect2,Lofreq和Strelka或其组合;或,所述的indel分析工具包括但不限于:Mutect2,Scalpel,Strelka或其组合。
CN201910494323.3A 2019-02-28 2019-06-09 高特异性无脱靶单碱基基因编辑工具 Active CN110804628B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2021550263A JP2022522019A (ja) 2019-02-28 2019-11-21 単一塩基編集による非標的な単一ヌクレオチド変異及び当該変異を避ける高特異性オフターゲットのない単一塩基遺伝子編集ツール
PCT/CN2019/119842 WO2020173150A1 (zh) 2019-02-28 2019-11-21 单碱基编辑导致非靶向单核苷酸变异及避免该变异的高特异性无脱靶单碱基基因编辑工具
EP19916605.9A EP3940078A4 (en) 2019-02-28 2019-11-21 OFF-TARGET MONONUCLEOTIDE VARIANTS PRODUCED BY SINGLE-BASED GENE EDITING AND HIGH-SPECIFIC OFF-TARGET SINGLE-BASED GENE EDITING TOOL
US17/435,004 US20220136041A1 (en) 2019-02-28 2019-11-21 Off-Target Single Nucleotide Variants Caused by Single-Base Editing and High-Specificity Off-Target-Free Single-Base Gene Editing Tool

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910153546 2019-02-28
CN2019101535463 2019-02-28

Publications (2)

Publication Number Publication Date
CN110804628A true CN110804628A (zh) 2020-02-18
CN110804628B CN110804628B (zh) 2023-05-12

Family

ID=69487416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910494323.3A Active CN110804628B (zh) 2019-02-28 2019-06-09 高特异性无脱靶单碱基基因编辑工具

Country Status (5)

Country Link
US (1) US20220136041A1 (zh)
EP (1) EP3940078A4 (zh)
JP (1) JP2022522019A (zh)
CN (1) CN110804628B (zh)
WO (1) WO2020173150A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021175287A1 (zh) * 2020-03-04 2021-09-10 中国科学院遗传与发育生物学研究所 检测单碱基编辑系统随机脱靶效应的方法
WO2022110260A1 (zh) * 2020-11-24 2022-06-02 深圳市瑞吉生物科技有限公司 一种使目的基因沉默的CasRx制剂和方法
CN114634923A (zh) * 2022-04-07 2022-06-17 尧唐(上海)生物科技有限公司 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途
CN114807333A (zh) * 2022-05-31 2022-07-29 华南农业大学 一种识别基因编辑动物全基因组变异的方法
CN115838719A (zh) * 2022-03-17 2023-03-24 上海交通大学医学院 特异性促进腺嘌呤碱基编辑器活性的化合物、化学调控方法及其应用

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023153811A1 (ko) * 2022-02-08 2023-08-17 주식회사 툴젠 프라임 에디팅 시스템을 이용한 게놈 편집의 과정에서 발생 가능한 오프 타겟을 예측하는 방법
CN116516051A (zh) * 2023-04-21 2023-08-01 华中农业大学 ATAC-seq介导精准靶向编辑在水稻抗病中的应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170349913A1 (en) * 2016-06-02 2017-12-07 Sigma-Aldrich Co., Llc Using programmable dna binding proteins to enhance targeted genome modification
WO2018052247A1 (ko) * 2016-09-13 2018-03-22 주식회사 툴젠 시토신 디아미나제에 의한 dna에서의 염기 교정 확인 방법
CN108513575A (zh) * 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
CN108822217A (zh) * 2018-02-23 2018-11-16 上海科技大学 一种基因碱基编辑器
CN109295186A (zh) * 2018-09-30 2019-02-01 中山大学 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180258418A1 (en) * 2017-01-17 2018-09-13 Institute For Basic Science Method of identifying genome-wide off-target sites of base editors by detecting single strand breaks in genomic dna
KR20190130613A (ko) * 2017-03-23 2019-11-22 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제
JP2020521446A (ja) * 2017-05-25 2020-07-27 ザ ジェネラル ホスピタル コーポレイション 二部塩基エディター(bbe)構造およびii型−c−cas9ジンクフィンガー編集
WO2019005886A1 (en) * 2017-06-26 2019-01-03 The Broad Institute, Inc. CRISPR / CAS-CYTIDINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED EDITING OF NUCLEIC ACIDS
CN109136351A (zh) * 2017-06-27 2019-01-04 华中农业大学 一种通过扩增子高通量测序技术检测sgRNA活性和特异性的方法
WO2019041296A1 (zh) * 2017-09-01 2019-03-07 上海科技大学 一种碱基编辑系统及方法
CN107557394A (zh) * 2017-09-29 2018-01-09 南京鼓楼医院 降低CRISPR/Cas9介导的胚胎基因编辑脱靶率的方法
EP3728588A4 (en) * 2017-12-22 2022-03-09 The Broad Institute, Inc. CAS12A SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED RNA BASE EDITING
US20230193242A1 (en) * 2017-12-22 2023-06-22 The Broad Institute, Inc. Cas12b systems, methods, and compositions for targeted dna base editing
WO2019161783A1 (en) * 2018-02-23 2019-08-29 Shanghaitech University Fusion proteins for base editing
CN109868283B (zh) * 2019-02-21 2021-07-20 浙江农林大学 一种评估CRISPR/Cas9基因编辑效率或脱靶频率的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108513575A (zh) * 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
US20170349913A1 (en) * 2016-06-02 2017-12-07 Sigma-Aldrich Co., Llc Using programmable dna binding proteins to enhance targeted genome modification
WO2018052247A1 (ko) * 2016-09-13 2018-03-22 주식회사 툴젠 시토신 디아미나제에 의한 dna에서의 염기 교정 확인 방법
CN108822217A (zh) * 2018-02-23 2018-11-16 上海科技大学 一种基因碱基编辑器
CN109295186A (zh) * 2018-09-30 2019-02-01 中山大学 一种基于全基因组测序检测腺嘌呤单碱基编辑系统脱靶效应的方法及其在基因编辑中的应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LI X.S.等: "Base editing with a Cpf1-cytidine deaminase fusion", 《NATURE BIOTECHNOLOGY》 *
PUPING LIANG等: "Effective gene editing by high-fidelity base editor 2 in mouse zygotes", 《PROTEIN CELL》 *
刘佳慧等: "单碱基基因编辑系统的研究进展", 《世界科技研究与发展》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021175287A1 (zh) * 2020-03-04 2021-09-10 中国科学院遗传与发育生物学研究所 检测单碱基编辑系统随机脱靶效应的方法
WO2022110260A1 (zh) * 2020-11-24 2022-06-02 深圳市瑞吉生物科技有限公司 一种使目的基因沉默的CasRx制剂和方法
CN115838719A (zh) * 2022-03-17 2023-03-24 上海交通大学医学院 特异性促进腺嘌呤碱基编辑器活性的化合物、化学调控方法及其应用
CN115838719B (zh) * 2022-03-17 2023-10-31 上海交通大学医学院 特异性促进腺嘌呤碱基编辑器活性的化合物、化学调控方法及其应用
CN114634923A (zh) * 2022-04-07 2022-06-17 尧唐(上海)生物科技有限公司 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途
CN114634923B (zh) * 2022-04-07 2024-02-23 尧唐(上海)生物科技有限公司 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途
CN114807333A (zh) * 2022-05-31 2022-07-29 华南农业大学 一种识别基因编辑动物全基因组变异的方法

Also Published As

Publication number Publication date
WO2020173150A1 (zh) 2020-09-03
CN110804628B (zh) 2023-05-12
EP3940078A1 (en) 2022-01-19
JP2022522019A (ja) 2022-04-13
US20220136041A1 (en) 2022-05-05
EP3940078A4 (en) 2022-11-23

Similar Documents

Publication Publication Date Title
CN110804628B (zh) 高特异性无脱靶单碱基基因编辑工具
EP3523430B1 (en) Engineered nucleic acid-targeting nucleic acids
US10731142B2 (en) Thermostable Cas9 nucleases
EP3074515B1 (en) Somatic haploid human cell line
KR102271292B1 (ko) Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도
CN110592089B (zh) 用于切割靶dna的组合物及其用途
CA3111432A1 (en) Novel crispr enzymes and systems
EP3744844A1 (en) Extended single guide rna and use thereof
CN113881652B (zh) 新型Cas酶和系统以及应用
CN107406846A (zh) 通过电穿孔将Cas9 mRNA导入到哺乳动物的受精卵的方法
EP3387134A1 (en) Methods and compositions for enhanced nuclease-mediated genome modification and reduced off-target site effects
JP2018529353A (ja) 配列決定法による切断事象の包括的生体外報告(CIRCLE−seq)
JP2017517250A (ja) 標的エンドヌクレアーゼを用いる哺乳類ゲノムのエピジェネティック修飾
CN113337502B (zh) 一种gRNA及其用途
CN113881708A (zh) 对动物受精卵进行电转染基因编辑的方法及其应用
JP7210028B2 (ja) 遺伝子変異導入方法
WO2020087631A1 (zh) 基于C2c1核酸酶的基因组编辑系统和方法
CN113249362B (zh) 经改造的胞嘧啶碱基编辑器及其应用
Zuo et al. Base editing generates substantial off-target single nucleotide variants
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
JP7402453B2 (ja) 細胞を単離又は同定する方法及び細胞集団
CN107201365B (zh) 一种特异性敲除二氢叶酸还原酶基因的sgRNA序列及其应用
WO2021155607A1 (zh) 经改造的胞嘧啶碱基编辑器及其应用
WO2020228844A2 (zh) 一种检测双链断裂产生试剂活性的方法
US20230313205A1 (en) Fusion protein and use thereof in base editing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200603

Address after: 200031 No. 320, Yueyang Road, Shanghai, Xuhui District

Applicant after: Center for excellence and innovation of brain science and intelligent technology, Chinese Academy of Sciences

Address before: 200031 Yueyang Road, Shanghai, No. 319, No.

Applicant before: SHANGHAI INSTITUTES FOR BIOLOGICAL SCIENCES, CHINESE ACADEMY OF SCIENCES

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant