CN117925585A

CN117925585A - 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途

Info

Publication number: CN117925585A
Application number: CN202410261107.5A
Authority: CN
Inventors: 张红玲; 赖崇平
Original assignee: Yaotang Shanghai Biotechnology Co ltd
Current assignee: Yaotang Shanghai Biotechnology Co ltd
Priority date: 2022-04-07
Filing date: 2022-04-07
Publication date: 2024-04-26
Also published as: CN114634923B; CN114634923A; WO2023193536A1

Abstract

本发明公开了一种腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途。本发明提供了一种腺苷脱氨酶，其包含以下序列中的一种或多种：(i)如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列；(ii)与SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列具有至少80％同一性的氨基酸序列；(iii)在SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列等。本发明提供的腺苷脱氨酶，在构成碱基编辑器及用于碱基编辑器系统时，具有优异的编辑效率以及极窄的编辑窗口，促进了疾病的靶向治疗、以及在精准治疗中的应用。

Description

腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途

本申请是申请日为2022年4月7日，申请号为202210363757.1，发明名称为“腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途”的中国专利申请的分案申请。

技术领域

本发明属于生物技术领域，更具体地，本发明涉及腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途。

背景技术

如何精准、高效地对基因组进行修饰是生命科学领域研究的重要目标，而CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)/Cas9介导的基因编辑技术成为实现该目标的最强工具。传统的CRISPR/Cas9技术通过在靶点处产生DNA双链断裂(Double Strand Breaks,DSB)，从而诱发细胞内的同源重组(HomologousRecombination,HR)和非同源末端连接(Non-Homologous End Joining,NHEJ)修复途径，进而实现对基因组DNA的定点敲除、替换、插入等修饰。然而，DSB引发的DNA修复很难实现高效稳定的单碱基突变。

单核苷酸变异会导致大约2/3人类遗传病的发生，也是许多动植物重要性状变异的遗传基础，因此开发一种精准且能够高效实现单碱基替换的技术尤为重要，David R.Liu实验室开发的碱基编辑器就是为此而生的。David R.Liu实验室开发了三种不同的碱基编辑器，分别是胞嘧啶碱基编辑器(Cytosine Base Editor,CBE)、腺嘌呤碱基编辑器(Adenine Base Editor,ABE)和先导编辑器(Prime Editor)，这些碱基编辑器在工作时不依赖DSB的产生，也不需要供体DNA的参与。

以腺苷脱氨酶为基础的腺嘌呤碱基编辑技术主要是利用由切口酶Cas9n(D10A)或dCas9结合腺苷脱氨酶组成融合蛋白，在sgRNA的引导下，将位于碱基编辑活性窗口内的靶碱基腺嘌呤A脱氨形成次黄嘌呤I，再经DNA修复和复制后逐渐被替换为G，最终形成A向G的定向替换(A至G)。

但是目前的碱基编辑器存在位点依赖性的编辑效率的差异，并且编辑窗口较宽导致非必要的编辑，因此对现有碱基编辑器的改造十分必要。

发明内容

发明要解决的问题

本发明的目的在于克服上述缺点，提供了一种新的腺苷脱氨酶，以及包含该腺苷脱氨酶的碱基编辑器融合蛋白、碱基编辑器系统，以提高A·T到G·C的编辑效率并提高碱基编辑的精确性(缩小编辑窗口)。

用于解决问题的方案

在本发明的一些方面，提供了一种腺苷脱氨酶，其包含以下序列中的一种或多种：

(i)如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列；

(ii)与SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列具有至少80％、82％、85％、87％、90％、92％、95％、96％、97％、98％或99％同一性的氨基酸序列，并且其保留如SEQ IDNO:1或SEQ ID NO:2所示的氨基酸序列的脱氨活性；

(iii)在SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列，并且其保留如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列的脱氨活性；或者，

(iv)由核苷酸序列编码的氨基酸序列，所述核苷酸序列与编码如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列的多核苷酸序列在严格条件下杂交，并且所述氨基酸序列保留如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列的脱氨活性，所述严格条件是中等严格条件，中-高严格条件，高严格条件或非常高严格条件。

在一些实施方案中，所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点中的一个或多个发生的取代：

S15、D16、H17、F19、N20、D21、E22、Y23、W24、R26、H27、L29、K33、R34、A35、V41、V43、L47、L49、N59、A61、I62、A69、E72、G80、L81、V82、L83、Q84、N85、Y86、I89、D90、A91、T92、V95、F97、I112、S113、R114、L115、F117、V119、R120、N121、K123、R124、N132、V133、L134、N135、P137、G138和M139。

在另一些实施方案中，所述的取代为在如SEQ ID NO:2所示的氨基酸序列的以下位点中的一个或多个发生的取代：

K19、A20、R21、E22、V33、L34、D35、D36、A46、I47、T48、L49、V80、T81、F82、E83、P84、I97、K98、R99、G103、V104、S105、N106、S107、K108、R109、G110、L116、N117、V118、L119、N120、Y121、P122、G123、C144、Q145、F146、Y147、Q148、Q149、P150、R151、E152、V153、F154、N155。

在一些具体的实施方案中，所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点中的一个或多个发生的取代：S15T、D16E、H17K、F19Y、N20Q、E22D、Y23F、W24F、R26K、H27R、L29I、K33R、R34K、A35S、G80A、L81N、V82A、L83I、Q84N、N85S、Y86W、I89L、D90G、A91T、T92D、I112L、S113K、R114K、N132K、V133I、L134F、N135H、P137F、G138A和M139L。

在一些更具体的实施方案中，所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点的组合发生的取代：

(1)S15T、D16E、H17K、F19Y、N20Q；

(2)E22D、Y23F、W24F、R26K、H27R、L29I；

(3)K33R、R34K、A35S；

(4)G80A、L81N、V82A、L83I、Q84N、N85S、Y86W；

(5)I89L、D90G、A91T、T92D；

(6)I112L、S113K、R114K；

(7)N132K、V133I、L134F、N135H；和/或

(8)P137F、G138A、M139L。

在本发明的一些方面，提供了一种碱基编辑器融合蛋白，其包含上述的腺苷脱氨酶，以及核酸可编程核苷酸结合结构域。

在一些实施方案中，所述核酸可编程核苷酸结合结构域为Cas蛋白或AGO蛋白。

在一些实施方案中，所述碱基编辑器融合蛋白中还包括至少一条核定位信号序列。

在一些可选的实施方案中，所述碱基编辑器融合蛋白中还包括接头。在一些任选的实施方案中，所述接头包含如SEQ ID NO:3～12所示的序列中的一种或多种。

在一些具体的实施方案中，所述碱基编辑器融合蛋白包含以下序列中的一种或多种：

(i)如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列；

(ii)与SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列具有至少80％、82％、85％、87％、90％、92％、95％、96％、97％、98％或99％同一性的氨基酸序列，并且其保留如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性；

(iii)在SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列，并且其保留如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性；或者，

(iv)由核苷酸序列编码的氨基酸序列，所述核苷酸序列与编码如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的多核苷酸序列在严格条件下杂交，并且所述氨基酸序列保留如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性，所述严格条件是中等严格条件，中-高严格条件，高严格条件或非常高严格条件。

在一些更具体的实施方案中，所述的碱基编辑器融合蛋白包含SEQ ID NO:46～53所示序列中的任一种。

在本发明的一些方面，提供了一种多核苷酸，其编码上述的腺苷脱氨酶或者编码上述的碱基编辑器融合蛋白。

在本发明的一些方面，提供了一种载体，其包含上述的多核苷酸。

在本发明的一些方面，提供了一种细胞，其包含上述的腺苷脱氨酶、上述的碱基编辑器融合蛋白、上述的多核苷酸和上述的载体中的一种或多种。

在本发明的一些方面，提供了一种碱基编辑器系统，其包含上述的腺苷脱氨酶、核酸可编程核苷酸结合结构域、以及引导多核苷酸；或者，其包含上述的碱基编辑器融合蛋白，以及引导多核苷酸。

在本发明的一些方面，提供了一种药物组合物，其包含上述的腺苷脱氨酶、上述的碱基编辑器融合蛋白、上述的多核苷酸、上述的载体、上述的细胞和上述的碱基编辑器系统中的一种或多种，以及药学上可接受的载体。

在本发明的一些方面，提供了一种试剂盒，其包含上述的腺苷脱氨酶、上述的碱基编辑器融合蛋白、上述的多核苷酸、上述的载体、上述的细胞和上述的碱基编辑器系统中的一种或多种。

在本发明的一些方面，提供了一种递送系统，其包含上述的腺苷脱氨酶、上述的碱基编辑器融合蛋白、上述的多核苷酸、上述的载体、上述的细胞和上述的碱基编辑器系统中的一种或多种，以及递送介质。

在本发明的一些方面，提供了一种核酸的碱基编辑方法，其包括将待被编辑碱基的核酸与上述的碱基编辑器系统相接触的步骤。

在本发明的一些方面，提供了上述的腺苷脱氨酶、上述的碱基编辑器融合蛋白、上述的多核苷酸、上述的载体、上述的细胞、上述的碱基编辑器系统、上述的药物组合物或上述的递送系统在制备用于治疗与点突变相关或由点突变引起的疾病的药物中的用途。

发明的效果

本发明提供的新的腺苷脱氨酶，在构成碱基编辑器及用于碱基编辑器系统时，具有优异的编辑效率以及极窄的编辑窗口，促进了疾病的靶向治疗，并且促进了碱基编辑器在精准治疗中的应用。

附图说明

图1A和图1B分别为PHK09质粒图谱(图1A)以及p004V1-nCas9结构图(图1B)。

图2为p004V1-nCas9在位点1处A·T到G·C的编辑效率，其包括A～C，图2中的A为p004V1-nCas9和ABE8e在位点1的编辑效率的比较，编辑位置为sgRNA 5’端起+3，+5，+7，+8的腺嘌呤脱氧核苷酸，误差线表示平均值±SEM，每组样品3个生物学重复；图2中的B为碱基编辑器p004V1-nCas9转染后在位点1的测序结果；图2中的C为碱基编辑器ABE8e转染后在位点1的测序结果。

图3为p004V1-nCas9在位点17处A·T到G·C的编辑效率，其包括A～C，图3中的A为p004V1-nCas9和ABE8e在位点17的编辑效率的比较，编辑位置为sgRNA 5’端起+3，+4，+5，+7的腺嘌呤脱氧核苷酸，误差线表示平均值±SEM，每组样品3个生物学重复；图3中的B为碱基编辑器p004V1-nCas9转染后在位点17的测序结果；图3中的C为碱基编辑器ABE8e转染后在位点17的测序结果。

图4为p004V1-nCas9在位点18处A·T到G·C的编辑效率，其包括A～C，图4中的A为p004V1-nCas9和ABE8e在位点18的编辑效率的比较，编辑位置为sgRNA 5’端起+3，+5，+7，+9的腺嘌呤脱氧核苷酸，误差线表示平均值±SEM，每组样品3个生物学重复；图4中的B为碱基编辑器p004V1-nCas9转染后在位点18的测序结果；图4中的C为碱基编辑器ABE8e转染后在位点18的测序结果。

图5为p004V1-nCas9在PCSK9位点处A·T到G·C的编辑效率，其包括A～C，图5中的A为p004V1-nCas9和ABE8e在PCSK9位点的编辑效率的比较，编辑位置为sgRNA5’端起+6的腺嘌呤脱氧核苷酸，误差线表示平均值±SEM，每组样品3个生物学重复；图5中的B为碱基编辑器p004V1-nCas9转染后在PCSK9位点的测序结果；图5中的C为碱基编辑器ABE8e转染后在PCSK9位点的测序结果。

图6为004V1各个突变体-nCas9在不同位点的编辑效率。

图7为p005V1-nCas9质粒图谱。

图8为p005V1-nCas9在位点1处A·T到G·C的编辑效率，其包括A～C，图8中的A为p005V1-nCas9和ABE8e在位点1的编辑效率的比较，编辑位置为sgRNA 5’端起+3，+5，+7，+8的腺嘌呤脱氧核苷酸，误差线表示平均值±SEM，每组样品3个生物学重复；图8中的B为碱基编辑器p005V1-nCas9转染后在位点1的测序结果；图8中的C为碱基编辑器ABE8e转染后在位点1的测序结果。

具体实施方式

为了更容易理解本发明，以下具体定义了某些技术和科学术语。除非在本文中另有明确定义，本文使用的所有其它技术和科学术语都具有本发明所属领域的一般技术人员通常理解的含义。

本说明书中，使用“数值A～数值B”表示的数值范围是指包含端点数值A、B的范围。

本说明书中，使用“基本上”或“实质上”表示与理论模型或理论数据的标准偏差在5％、优选为3％、更优选为1％范围以内。

本说明书中，使用“可以”表示的含义包括了进行某种处理以及不进行某种处理两方面的含义。

本说明书中，“任选的”或“任选地”是指接下来描述的事件或情况可发生或可不发生，并且该描述包括该事件发生的情况和该事件不发生的情况。

本说明书中，所提及的“一些具体/优选的实施方案”、“另一些具体/优选的实施方案”、“实施方案”等是指所描述的与该实施方案有关的特定要素(例如，特征、结构、性质和/或特性)包括在此处所述的至少一种实施方案中，并且可存在于其它实施方案中或者可不存在于其它实施方案中。另外，应理解，所述要素可以任何合适的方式组合在各种实施方案中。

如本公开所使用的，术语“核酸”和“核酸分子”是指包含核碱基和酸性部分的化合物，例如核苷、核苷酸或核苷酸的聚合物。通常，聚合核酸，例如包含三个或更多个核苷酸的核酸分子是线性分子，其中相邻核苷酸通过磷酸二酯键相互连接。在一些实施方案中，“核酸”是指单个核酸残基(例如核苷酸和/或核苷)。在一些实施方案中，“核酸”是指包含三个或更多个单独核苷酸残基的寡核苷酸链。如本文所用，术语“寡核苷酸”和“多核苷酸”可互换使用以指核苷酸的聚合物(例如，至少三个核苷酸的串)。在一些实施方案中，“核酸”包括RNA以及单链和/或双链DNA。核酸可以是天然存在的，例如在基因组、转录物、mRNA、tRNA、rRNA、siRNA、snRNA、质粒、粘粒、染色体、染色单体或其他天然存在的核酸分子的上下文中。另一方面，核酸分子可以是非天然存在的分子，例如重组DNA或RNA、人工染色体、工程基因组或其片段，或合成的DNA、RNA、DNA/RNA杂交体、或包括非天然存在的核苷酸或核苷。此外，术语“核酸”、“DNA”、“RNA”和/或类似术语包括核酸类似物，例如具有除磷酸二酯骨架之外的其他骨架的类似物。核酸可以从天然来源纯化、使用重组表达系统产生和任选地纯化、化学合成等。在合适的情况下，例如在化学合成分子的情况下，核酸可以包含核苷类似物，例如具有化学修饰碱基的类似物或糖和骨架修饰。

如本公开所使用的，术语“多肽”、“肽”和“蛋白质”在本文中互换地使用并且为任意长度的氨基酸聚合物。该聚合物可以是线形或分支的，它可以包含修饰的氨基酸，并且它可以由非氨基酸隔断。该术语也包括已经被修饰(例如，二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作，如以标记组分缀合)的氨基酸聚合物。

如本公开所使用的，“融合蛋白”是指包含来自至少两种不同蛋白质的蛋白质结构域的杂化多肽。一种蛋白质可位于融合蛋白的氨基-末端(N-末端，N端)部分或羧基-末端(C-末端，C端)蛋白处，因此分别形成“氨基-末端融合蛋白”或“羧基-末端融合蛋白”。本文提供的任何蛋白质可通过本领域已知的任何方法产生。例如，本文提供的蛋白质可经由重组蛋白质表达和纯化来产生，这尤其适合于包含肽接头的融合蛋白。用于重组蛋白质表达和纯化的方法是公知的，并且包括以下中所述的那些：Green and Sambrook,MolecularCloning:A Laboratory Manual(4th ed.,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.(2012))，其全部内容通过引用并入本文。

如本公开所使用的，术语“CRISPR”是指成簇、规律间隔的短回文重复序列(Clustered regularly interspaced short palindromic repeats)，其来自微生物的免疫系统。

如本公开所使用的，术语“Cas蛋白”是指CRISPR-associated蛋白，Cas蛋白与CRISPR序列共同构成CRISPR/Cas系统，Cas蛋白具有与核酸酶相关的功能结构域，通过识别PAM(protospacer adjacent motif)在特定位置切割靶序列。

如本公开所使用的，术语“crRNA”包含重复序列(repeat)和间隔序列(spacer)，CRISPR转录形成长链的pre-CRISPR RNA(pre-crRNA)，pre-crRNA加工后得到包含一段重复区序列和一段间隔区序列的短的crRNA。在一些CRISPR/Cas系统中，crRNA由Cas蛋白作用于pre-crRNA得到。在另外一些CRISPR/Cas系统中，crRNA由Cas蛋白与tracrRNA(trans-activating crRNA)共同作用于pre-crRNA得到。

在不同的CRISPR/Cas系统中，crRNA可以单独作为引导RNA(guide RNA，gRNA)引导Cas蛋白定位到位于PAM序列附近的靶序列，或者crRNA与tracrRNA合并成为单一引导RNA(single guide RNA，sgRNA)引导Cas蛋白定位到位于PAM序列附近的靶序列。

如本公开所使用的，“crRNA的引导序列”是指crRNA中与目标核酸的靶序列杂交的序列，其对应由crRNA的间隔序列(spacer)形成。

如本公开所使用的，术语“靶序列”是指目标核酸中与crRNA互补或至少部分互补的核苷酸序列，Cas蛋白、crRNA与靶序列形成三元复合物后，Cas蛋白发挥对目标核酸中靶核酸链和/或非核苷酸链的特异性切割活性。在本公开中，“靶序列”与“靶核酸”、“靶多核苷酸”、“目标序列”、“目标核酸序列”可以互换地使用。

如本公开所使用的，术语“靶标链”(target strand)是指目标核酸中与crRNA杂交的核苷酸链；术语“非靶标链”(non-target strand)是指目标核酸中与crRNA不发生杂交配对的核苷酸链。

术语“Cas9”或“Cas9结构域”是指RNA引导的核酸酶，其包含Cas9蛋白或其片段(例如，包含Cas9的活性、无活性或部分活性的DNA切割结构域的蛋白，和/或gRNA Cas9的结合结构域)。Cas9核酸酶有时也称为CRISPR相关核酸酶9。如前所述，CRISPR是一种适应性免疫系统，可针对移动遗传元件(病毒、转座元件和接合质粒)提供保护。CRISPR簇包含众多短而保守的重复序列区(repeat)和间隔区(spacer)。CRISPR簇被转录并加工成pre-crRNA。在第II型CRISPR/cas9系统中，正确处理pre-crRNA需要转编码的小RNA(tracrRNA)、内源性核糖核酸酶3(RNase III)和Cas9蛋白。tracrRNA作为核糖核酸酶3辅助处理pre-crRNA的引导。随后，Cas9/crRNA/tracrRNA核酸内切切割与间隔序列互补的线性或环状dsDNA靶标。与crRNA不互补的靶标链通过核酸内切方式切割。在自然界中，DNA结合和切割通常需要蛋白质和两种RNA。然而，可以对单一引导RNA(single guide RNA,sgRNA)进行工程改造，以便将crRNA和tracrRNA的各个方面整合到单个RNA种类中。参见，如，Jinek M.等人，Science337:816-821(2012)，其全部内容以引用方式并入本文。Cas9识别CRISPR重复序列(PAM或原间隔序列临近基序)中的一个短基序，以帮助区分自我与非自我。Cas9核酸酶序列和结构是本领域技术人员众所周知的(参见，如“Complete genome sequence of an M1 strain ofStreptococcus pyogenes.”Ferretti等，Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001)；“CRISPR RNA maturation by trans-encoded small RNA and host factorRNase III.”Deltcheva E.等，Nature471:602-607(2011)；和“Aprogrammabledual-RNA-guided DNA endonuclease in adaptive bacterial immunity.”Jinek M.等，Science337:816-821(2012))。Cas9直向同源物已在各种物种中得到描述，包括但不限于化脓链球菌和嗜热链球菌。基于本公开内容，其他合适的Cas9核酸酶和序列对本领域技术人员来说是显而易见的，并且此类Cas9核酸酶和序列包括来自Chylinski,Rhun和Charpentier,“ThetracrRNA and Cas9 families of type IICRISPR-Cas immunity systems”(2013)RNABiology10:5,726-737中公开的生物体和基因座的Cas9序列；其全部内容在此引入作为参考。

核酸酶灭活的Cas9蛋白可互换地称为“dCas9”蛋白(核酸酶-“死的”Cas9或无核酸酶活性的Cas9)或催化灭活的Cas9。用于产生具有无活性DNA切割结构域的Cas9蛋白(或其片段)是已知的(参见，如Jinek等,Science.337:816-821(2012)；Qi等人“RepurposingCRISPR as an RNA-Guided Platform for Sequence-Specific Control of GeneExpression”(2013)Cell.28；152(5):1173-83)。例如，已知Cas9的DNA切割结构域包括两个子结构域，HNH核酸酶子结构域和RuvC子结构域。HNH子结构域切割与gRNA互补的链，而RuvC子结构域切割非互补链。这些子结构域内的突变可以使Cas9的核酸酶活性沉默。例如，突变D10A和H840A使化脓性链球菌Cas9的核酸酶活性完全灭活(Jinek等人,Science.337:816-821(2012)；Qi等人,Cell.28:152(5):1173-83(2013))。基于本领域的知识，另外的合适的无核酸酶活性的Cas9结构域对于本领域技术人员而言将是显而易见的。此类另外的示例性合适的无核酸酶活性的Cas9结构域包括但不限于D10A/H840A、D10A/D839A/H840A和D10A/D839A/H840A/N863A突变体结构域(参见例如Prashant等，Nature Biotechnology.2013；31(9)：833-838)。

Cas9切口酶能够切割双链DNA的一条链。可以通过将失活的突变引入到HNH子结构域或RuvC子结构域中来生成Cas9切口酶。例如，可以在酿脓链球菌Cas9的RuvC结构域中引入失活的突变(D10A)，而HNH结构域保持有活性，即位置840处的残基保持为组氨酸。此类Cas9变体能够基于gRNA确定的靶序列在特定位置处生成单链DNA断裂(切口)。本领域技术人员能够鉴定任何已知Cas9蛋白的RuvC和HNH结构域中的催化残基并引入失活的突变以生成相应的dCas9或nCas9。

同样地，对于其他Cas蛋白，本领域技术人员可以通过同样的方式获得相应的无核酸酶活性的Cas蛋白和切割双链DNA的一条链的切口酶。

如本公开所使用的，术语“脱氨酶”或“脱氨酶结构域”是指催化脱氨反应的蛋白质或酶。在一些实施方案中，脱氨酶是腺苷脱氨酶，其催化腺嘌呤水解脱氨为次黄嘌呤。在一些实施方案中，脱氨酶是腺苷脱氨酶，其催化腺苷或腺嘌呤(A)水解脱氨为肌苷(I)。在一些实施方案中，脱氨酶或脱氨酶结构域是分别催化腺苷或脱氧腺苷水解脱氨为肌苷或脱氧肌苷的腺苷脱氨酶。在一些实施方案中，腺苷脱氨酶催化脱氧核糖核酸(DNA)中腺苷的水解脱氨。

如本公开所使用的，术语“核酸可编程核苷酸结合结构域”、“核酸可编程DNA结合蛋白(Nucleic acid programmable DNA-binding protein,napDNAbp)”是指与核酸(例如，DNA或RNA)，例如引导多核苷酸(例如，gRNA)结合的蛋白质，所述核酸例如通过与靶核酸序列杂交将napDNAbp引导至特定核酸序列。例如，Cas9蛋白可以与引导RNA结合，该引导RNA将Cas9蛋白引导至与引导RNA互补的特定DNA序列。在一些实施方案中，napDNAbp是Cas9结构域，例如，核酸酶活性Cas9，Cas9切口酶(nCas9)或无核酸酶活性Cas9(dCas9)。核酸可编程DNA结合蛋白的实例包括但不限于Cas9(例如，dCas9和nCas9)、CasX、CasY、Cpf1、C2c1、C2c2、C2c3和Argonaute蛋白(AGO)。然而，应当理解，核酸可编程DNA结合蛋白也包括结合RNA的核酸可编程蛋白。例如，napDNAbp可以与将napDNAbp引导至RNA的核酸结合。其他核酸可编程DNA结合蛋白也在本公开内容的范围内，尽管它们可能未在本公开内容中具体描述。

如本公开所使用的，“碱基编辑器(Base Editor,BE)”或“核碱基编辑器”是指结合多核苷酸并具有核碱基修饰活性的试剂。在各种实施方案中，碱基编辑器包含核碱基修饰多肽(例如，脱氨酶)和与引导多核苷酸(例如，引导RNA)结合的核酸可编程核苷酸结合结构域(例如，核酸可编程DNA结合蛋白)。在各种实施方案中，所述试剂是包含具有碱基编辑活性的蛋白质结构域的生物分子复合物，即能够修饰核酸分子(例如，DNA、RNA)内的碱基(例如，A、T、C、G或U)。在一些实施方案中，所述多核苷酸可编程DNA结合结构域与脱氨酶结构域融合或连接。在一个实施方案中，所述试剂是包含具有碱基编辑活性的结构域的融合蛋白。在一些实施方案中，具有碱基编辑活性的结构域能够使核酸分子内的碱基脱氨基。在一些实施方案中，所述碱基编辑器能够使DNA分子内的一个或多个碱基脱氨基。在一些实施方案中，所述碱基编辑器是腺苷碱基编辑器(ABE)。

如本公开所使用的，“碱基编辑活性”是指用于化学改变多核苷酸内的碱基。在一个实施方案中，第一个碱基被转化为第二个碱基。在一个实施方案中，所述碱基编辑活性是腺苷或腺嘌呤脱氨酶活性，例如将靶标A·T转化为C·G。

在一些实施例中，碱基编辑活性通过编辑效率来评估。碱基编辑效率可以通过任何合适的方式来测量，例如，通过sanger测序或二代测序。在一些实施方案中，碱基编辑效率通过具有受碱基编辑器影响的核碱基转化的总测序读数的百分比来测量，例如，具有转化为A·T碱基对的目标C·G碱基对的总测序读数的百分比。在一些实施方案中，当在细胞群中进行碱基编辑时，碱基编辑效率通过具有受碱基编辑器影响的核碱基转化的总细胞的百分比来测量。

如本公开所使用的，术语“碱基编辑器系统”是指用于编辑目标核苷酸序列的核碱基的系统。在各种实施方案中，所述碱基编辑器系统包含(1)核酸可编程核苷酸结合结构域(例如Cas9)；(2)用于使所述核碱基脱氨基的脱氨酶结构域(例如腺苷脱氨酶)；(3)一种或多种引导多核苷酸(例如引导RNA)。

“引导多核苷酸”、“引导RNA”或“gRNA”是指可以特异性靶向目标序列并且可以与核酸可编程核苷酸结合结构域蛋白(例如Cas9)形成复合物的多核苷酸。在一个实施方案中，引导多核苷酸是引导RNA(gRNA)。gRNA可以作为两个或多个RNA的复合物存在，也可以作为单个RNA分子存在。以单个RNA分子形式存在的gRNA可称为单一引导RNA(sgRNA)，但“gRNA”可互换使用以指以单个分子或两个或更多个分子的复合物形式存在的引导RNA。通常，作为单个RNA种类存在的gRNA包括两个结构域：(1)与目标核酸具有同源性的结构域(例如，引导Cas9复合物与目标核酸的结合)；(2)结合Cas9蛋白的结构域。在一些实施方案中，结构域(2)对应于称为tracrRNA的序列，并且包括茎环结构。例如，在一些实施方案中，结构域(2)与Jinek et al.,Science 337:816-821(2012)中提供的tracrRNA相同或同源。gRNA的其他实例可以为在2013年9月6日提交的美国临时专利申请U.S.S.N.61/874,682(发明名称为“可切换的Cas9核酸酶及其用途(Switchable Cas9 Nucleases and Uses Thereof)”)和在2013年9月6日提交的美国临时专利申请U.S.S.N.61/874,746发明名称为“功能性核酸酶递送系统(Delivery System For Functional Nucleases)”中公开的。在一些实施方案中，gRNA包括结构域(1)和(2)中的两个或更多个，并且可以被称为“延伸的gRNA”。延伸的gRNA将结合两个或更多个Cas9蛋白并在两个或更多个不同区域结合目标核酸。gRNA包括与目标位点互补的核苷酸序列，其介导核酸酶/RNA复合物与所述目标位点的结合，提供核酸酶：RNA复合物的序列特异性。

根据本发明，所用氨基酸三字母代码和单字母代码如J.biol.chem，243，p3558(1968)中所述。

根据本发明，氨基酸“添加”指在氨基酸序列的C端或N端添加氨基酸。根据本发明，氨基酸“缺失”指可以从氨基酸序列中删除1、2或3个以上氨基酸。根据本发明，氨基酸“插入”指在氨基酸序列中的适当位置插入氨基酸残基，插入的氨基酸残基也可以全部或部分彼此相邻，或插入的氨基酸之间都不彼此相邻。

根据本发明，氨基酸“取代”指在氨基酸序列中的某个位置的某个氨基酸残基被其他氨基酸残基替代；其中，“取代”可以是保守氨基酸取代。

根据本发明，“保守修饰”、“保守取代”或“保守置换”是指具有类似特征(例如电荷、侧链大小、疏水性/亲水性、主链构象和刚性等)的其它氨基酸置换蛋白中的氨基酸，使得可频繁进行改变而不改变蛋白的生物学活性。本领域技术人员知晓，一般而言，多肽的非必需区域中的单个氨基酸置换基本上不改变生物学活性(参见Watson等(1987),MolecularBiology of the Gene，The Benjamin/Cummings Pub.Co.，第224页，(第4版))。另外，结构或功能类似的氨基酸的置换不大可能破环生物学活性。示例性保守取代于下表“示例性氨基酸保守取代”中陈述。

示例性氨基酸保守取代

原始残基	保守取代
		Ala(A)	Gly(G)；Ser(S)
Arg(R)	Lys(K)；His(H)
		Asn(N)	Gln(Q)；His(H)；Asp(D)
Asp(D)	Glu(E)；Asn(N)
		Cys(C)	Ser(S)；Ala(A)；Val(V)
Gln(Q)	Asn(N)；Glu(E)
		Glu(E)	Asp(D)；Gln(Q)
Gly(G)	Ala(A)
		His(H)	Asn(N)；Gln(Q)
Ile(I)	Leu(L)；Val(V)
		Leu(L)	Ile(I)；Val(V)
Lys(K)	Arg(R)；His(H)
		Met(M)	Leu(L)；Ile(I)；Tyr(Y)
Phe(F)	Tyr(Y)；Met(M)；Leu(L)
		Pro(P)	Ala(A)
Ser(S)	Thr(T)
		Thr(T)	Ser(S)
Trp(W)	Tyr(Y)；Phe(F)
		Tyr(Y)	Trp(W)；Phe(F)
Val(V)	Ile(I)；Leu(L)

又如，具有类似特征的氨基酸如下所示：

酸性残基	Asp(D)和Glu(E)
		碱性残基	Lys(K)、Arg(R)和His(H)
亲水性不带电荷的残基	Ser(S)、Thr(T)、Asn(N)和Gln(Q)
		脂肪族不带电荷的残基	Gly(G)、Ala(A)、Val(V)、Leu(L)和Ile(I)
非极性不带电荷的残基	Cys(C)、Met(M)和Pro(P)
		芳香族残基	Phe(F)、Tyr(Y)和Trp(W)

如本文可互换使用的术语“编码序列”或“蛋白质编码序列”是指编码蛋白质的多核苷酸片段。该区域或序列在靠近5'端的地方有一个起始密码子，在靠近3'端的地方有一个终止密码子。编码序列也可称为开放阅读框。

术语“核定位序列”、“核定位信号(Nuclear Localization Signal，NLS)”是指促进蛋白质输入细胞核的氨基酸序列。核定位序列是本领域已知的并且描述于例如Plank等人的国际PCT申请，PCT/EP2000/011690，2000年11月23日提交，2001年5月31日作为WO/2001/038547公布，其内容以引用方式并入本文以用于它们对示例性核定位序列的公开。在一些实施方案中，所述NLS是优化的NLS，例如由Koblan等人，Nature Biotech.2018doi:10.1038/nbt.4172所描述。

如本文所用，术语“接头”可指共价接头(例如，共价键)、非共价接头、化学基团或连接两个分子或部分(例如，蛋白质复合物或核糖核复合体的两个组分)的分子，例如，融合蛋白的两个结构域，如多核苷酸可编程DNA结合结构域(例如，dCas9)和脱氨酶结构域(例如，腺苷脱氨酶)。接头可以连接碱基编辑器系统的不同组分或组分的不同部分。例如，在一些实施方案中，接头可以连接多核苷酸可编程核苷酸结合结构域的引导多核苷酸结合结构域和脱氨酶的催化结构域。接头可以位于两个基团、分子或其他部分之间或两侧，并通过共价键或非共价相互作用连接到每一个，从而连接这两者。在一些实施方案中，所述接头可以是多核苷酸。在一些实施方案中，所述接头可以是DNA接头。在一些实施方案中，所述接头可以是RNA接头。

在一些实施方案中，接头可以是一个氨基酸或多个氨基酸(例如，肽或蛋白质)。在一些实施方案中，所述接头的长度可为约5至100个氨基酸，例如约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20至30、30至40、40至50、50至60、60至70、70至80、80至90或90至100个氨基酸的长度。在一些实施例中，接头的长度可为约100至150、150至200、200至250、250至300、300至350、350至400、400至450或450至500个氨基酸。也可以考虑更长或更短的接头。

如本公开所使用的，术语“切割”可以是指使核苷酸链中磷酸二酯键断裂。对于断裂的类型可以是单链断裂或双链断裂。

如本公开所使用的，术语“互补的”或“杂交的”用于指与碱基配对规则相关的“多核苷酸”和“寡核苷酸”(它们是可互换的术语，指的是核苷酸序列)。例如，序列“CAGT”与序列“GTCA”互补。互补可以是“部分的”或“全部的”。“部分”互补是指一个或多个核酸碱基根据碱基配对规则错配，核酸之间的“全部”或“完全”互补是指每个核酸碱基在碱基配对下均与另一个碱基匹配规则。核酸链之间的互补程度对核酸链之间的杂交效率和强度具有重要影响。这在扩增反应以及取决于核酸之间结合的检测方法中特别重要。

如本文所用，术语“杂交”是指使用核酸链通过碱基配对与互补链结合以形成杂交复合物的任何过程来配对互补核酸。

如本公开所使用的，术语“核酸序列”和“核苷酸序列”是指寡核苷酸或多核苷酸及其片段或部分，并且是指可以是单链或双链的基因组或合成来源的DNA或RNA，和代表有义或反义链。

如本公开所使用的，术语“序列同一性”和“同一性百分比”指两个或更多个多核苷酸或多肽之间相同(即同一)的核苷酸或氨基酸的百分比。两个或更多个多核苷酸或多肽之间的序列同一性可通过以下方法测定：将多核苷酸或多肽的核苷酸或氨基酸序列对准且经对准的多核苷酸或多肽中含有相同核苷酸或氨基酸残基的位置数目进行评分，将其与经对准的多核苷酸或多肽中含有不同核苷酸或氨基酸残基的位置数目进行比较。多核苷酸可例如通过含有不同核苷酸(即取代或突变)或缺失核苷酸(即一个或两个多核苷酸中的核苷酸插入或核苷酸缺失)而在一个位置处不同。多肽可例如通过含有不同氨基酸(即取代或突变)或缺失氨基酸(即一个或两个多肽中的氨基酸插入或氨基酸缺失)而在一个位置处不同。序列同一性可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中氨基酸残基的总数来计算。举例而言，可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中核苷酸或氨基酸残基的总数且乘以100来计算同一性百分比。

示例性的，当使用序列比较算法或通过目视检查测量以最大的对应性进行比较和比对时，两个或多个序列或子序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％核苷酸的“序列同一性”或“同一性百分比”。在某些实施方案中，所述序列在任一或两个相比较的生物聚合物(例如，多核苷酸)的整个长度上基本相同。

术语“载体”是指将核酸序列引入细胞中从而产生转化细胞的手段。载体包括质粒、转座子、噬菌体、病毒、脂质体和附加体。“表达载体”是包含待在受体细胞中表达的核苷酸序列的核酸序列。表达载体可以包括额外的核酸序列以促进和/或促进引入序列的表达，例如起始、终止、增强子、启动子和分泌序列。

如本公开所使用的，术语“个体”和“受试者”可互换地使用，是指哺乳动物。哺乳动物包括但不限于驯化动物(例如，奶牛、绵羊、猫、犬和马)、灵长类(例如，人和非人灵长类如猴)、兔和啮齿类(例如，小鼠和大鼠)。特别地，个体是人。

本文公开的方法可以在体外、离体、或体内进行，或者产品可以以体外、离体、或体内形式存在。术语“体外”是指在实验室条件或培养液中使用材料、生物物质、细胞和/或组织的实验；而术语“体内”是指使用完整多细胞有机体的实验和工序。在一些实施方案中，体内进行的方法可以在非人动物上进行。“离体”是指存在于有机体外或发生在有机体外，例如在人或动物体外的事件，例如可以在取自有机体的组织(例如整个器官)或细胞上存在或发生的事件。

如本公开所使用的，术语“药学上可接受的载体”是指药学上可接受的材料、组合物或媒介物，例如液体或固体填充剂、稀释剂、赋形剂、制造助剂(例如，润滑剂、滑石粉、硬脂酸镁、钙或锌或硬脂酸)或溶剂包封材料，涉及将化合物从身体的一个部位(例如，递送部位)运送或运输到另一个部位(例如，器官、组织或身体的一部分)。药学上可接受的载体是“可接受的”，意思是与制剂的其他成分相容并且对受试者的组织无害(例如，生理学相容的、无菌的、生理学的pH等)。可以充当药学上可接受的载体的材料的一些实例包括：(1)糖，例如乳糖、葡萄糖和蔗糖；(2)淀粉，如玉米淀粉和马铃薯淀粉；(3)纤维素及其衍生物，如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和醋酸纤维素；(4)粉末黄蓍胶；(5)麦芽；(6)明胶；(7)润滑剂，如硬脂酸镁、十二烷基硫酸钠和滑石粉；(8)赋形剂，如可可脂和栓剂蜡；(9)油，如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和豆油；(10)二醇，如丙二醇；(11)多元醇，如甘油、山梨糖醇、甘露醇和聚乙二醇(PEG)；(12)酯类，如油酸乙酯和月桂酸乙酯；(13)琼脂；(14)缓冲剂，如氢氧化镁和氢氧化铝；(15)海藻酸；(16)无热原水；(17)等渗盐水；(18)林格氏液；(19)乙醇；(20)pH缓冲溶液；(21)聚酯，聚碳酸酯和/或聚酸酐；(22)增量剂(bulking agent)，如多肽和氨基酸(23)血清成分，如血清白蛋白、高密度脂蛋白(high density lipoprotein,HDL)和低密度脂蛋白(low density lipoprotein，LDL)；(22)C2-C12醇，如乙醇；和(23)药物制剂中采用的其他无毒相容物质。润湿剂、着色剂、脱模剂、包衣剂、甜味剂、调味剂、芳香剂、防腐剂和抗氧化剂也可以存在于制剂中。诸如“赋形剂”、“药学上可接受的载体”等术语在本文中可互换使用。

如本文所用，术语“有效量”是指足以引起期望的生物学反应的生物活性剂的量。例如，在一些实施方案中，碱基编辑器的有效量可以指足以诱导由碱基编辑器突变的特异性结合的靶位点的突变的碱基编辑器的量。如本领域技术人员将理解的，试剂，例如碱基编辑器融合蛋白、脱氨酶、多核苷酸等的有效量可以随各种因素而变化，例如随期望的生物学反应，例如随待编辑的特定等位基因、基因组或靶位点，随靶定的细胞或组织和使用的试剂而变化。

术语“治疗”、“处理”是指如本文所述旨在逆转、缓解疾病或病症或其一种或多种症状、延迟疾病或病症或其一种或多种症状的发作或抑制疾病或病症或其一种或多种症状进展的临床干预。如本文所用，术语“治疗”、“处理”是指如本文所述旨在逆转、缓解疾病或病症或其一种或多种症状、延迟疾病或病症或其一种或多种症状的发作或抑制疾病或病症或其一种或多种症状进展的临床干预。在一些实施方案中，可以在一种或多种症状已经得以形成之后和/或疾病已经得到诊断之后施用治疗。在其他实施方案中，可以在没有症状的情况下施用治疗，例如用于预防或延迟症状的发作或抑制疾病的发作或进展。例如，可以在症状发作之前(例如，鉴于症状的历史和/或鉴于遗传或其他易感性因素)施用治疗于易感个体。治疗也可以在症状消退后继续进行，例如以预防或延迟其复发。

<腺苷脱氨酶>

在本发明的第一方面的一些实施方案中，提供了一种腺苷脱氨酶，其包含以下序列中的一种或多种：

(i)如下SEQ ID NO:1所示的氨基酸序列；

MYNAPRFFCRSAAVSDHEFNDEYWMRHALTLAKRAREEGEVPVGAVLV

LNNQVIGEGWNRAIGLHDPTAHAEIMALRQGGLVLQNYRLIDATLYVTFE

PCVMCAGAMVHSRISRLVFGVRNSKRGAAGSLINVLNYPGMNHRVEITEGILAESCSAMLCDFYRWPREVFNALKKARQEEG(腺苷脱氨酶004V1)

(ii)与SEQ ID NO:1所示的氨基酸序列具有至少80％、82％、85％、87％、90％、92％、95％、96％、97％、98％或99％同一性的氨基酸序列，并且其保留如SEQ ID NO:1所示的氨基酸序列的脱氨活性；

(iii)在SEQ ID NO:1所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列，并且其保留如SEQ ID NO:1所示的氨基酸序列的脱氨活性；或者，

(iv)由核苷酸序列编码的氨基酸序列，所述核苷酸序列与编码如SEQ ID NO:1所示的氨基酸序列的多核苷酸序列在严格条件下杂交，并且所述氨基酸序列保留如SEQ IDNO:1所示的氨基酸序列的脱氨活性，所述严格条件是中等严格条件，中-高严格条件，高严格条件或非常高严格条件。

进一步地，在一些实施方案中，所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点中的一个或多个发生的取代：

S15T、D16E、H17K、F19Y、N20Q、E22D、Y23F、W24F、R26K、H27R、L29I、K33R、R34K、A35S、G80A、L81N、V82A、L83I、Q84N、N85S、Y86W、I89L、D90G、A91T、T92D、I112L、S113K、R114K、N132K、V133I、L134F、N135H、P137F、G138A和M139L。

在一些具体的实施方案中，所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点的组合发生的取代：

(1)S15T、D16E、H17K、F19Y、N20Q(腺苷脱氨酶004V2)；

(2)E22D、Y23F、W24F、R26K、H27R、L29I(腺苷脱氨酶004V3)；

(3)K33R、R34K、A35S(腺苷脱氨酶004V4)；

(4)G80A、L81N、V82A、L83I、Q84N、N85S、Y86W(腺苷脱氨酶004V7)；

(5)I89L、D90G、A91T、T92D(腺苷脱氨酶004V8)；

(6)I112L、S113K、R114K(腺苷脱氨酶004V10)；

(7)N132K、V133I、L134F、N135H(腺苷脱氨酶004V12)；和/或

(8)P137F、G138A、M139L(腺苷脱氨酶004V13)。

本发明的第一方面的另一些实施方案中，提供了一种腺苷脱氨酶，其包含以下序列中的一种或多种：

(i)如下SEQ ID NO:2所示的氨基酸序列；

MSELNDAYWMKQALALAQKAREQGEVPVGAILVLDDEVIGQGWNRAITLHDPTAHAEIMALQQGGQIVQNYRLLNATLYVTFEPCVMCAGAMVHSRIKRLVYGVSNSKRGAAGSLLNVLNYPGMNHQIEITAGVMANECSEMLCQFYQQPREVFNAEREARRLNQPDRAD(腺苷脱氨酶005V1)

(ii)与SEQ ID NO:2所示的氨基酸序列具有至少80％、82％、85％、87％、90％、92％、95％、96％、97％、98％或99％同一性的氨基酸序列，并且其保留如SEQ ID NO:2所示的氨基酸序列的脱氨活性；

(iii)在SEQ ID NO:2所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列，并且其保留如SEQ ID NO:2所示的氨基酸序列的脱氨活性；或者，

(iv)由核苷酸序列编码的氨基酸序列，所述核苷酸序列与编码如SEQ ID NO:2所示的氨基酸序列的多核苷酸序列在严格条件下杂交，并且所述氨基酸序列保留如SEQ IDNO:2所示的氨基酸序列的脱氨活性，所述严格条件是中等严格条件，中-高严格条件，高严格条件或非常高严格条件。

在一些实施方案中，所述的取代为在如SEQ ID NO:2所示的氨基酸序列的以下位点中的一个或多个发生的取代：

在本发明中，“保留脱氨活性”的表述，例如“保留如SEQ ID NO:1所示的氨基酸序列的脱氨活性”、“保留如SEQ ID NO:2所示的氨基酸序列的脱氨活性”，可以是完全保留原始序列的腺苷脱氨酶的脱氨活性，也可以是部分保留原始序列的腺苷脱氨酶的脱氨活性，例如保留30％、40％、50％、60％、70％、80％、90％、95％、99％的脱氨活性。在另一些实施方案中，具有修改后的序列的腺苷脱氨酶，例如具有经氨基酸取代的序列的腺苷脱氨酶也可能具有高于原始序列的腺苷脱氨酶的脱氨活性。

本发明提供的腺苷脱氨酶可作用于任何多核苷酸，包括DNA、RNA和DNA-RNA杂交体。在某些实施方案中，腺苷脱氨酶可以使包含DNA的多核苷酸的靶标腺嘌呤(A)脱氨基。在某些实施方案中，腺苷脱氨酶可以使包含RNA的多核苷酸的靶标腺嘌呤(A)脱氨基。

在一些实施方案中，所述的取代为保守取代。

在本发明中，“中等严格条件”，“中-高严格条件”，“高严格条件”或“非常高严格条件”描述了核酸杂交和洗涤的条件。进行杂交反应的指导参见Current Protocols inMolecular Biology，John Wiley&Sons，N.Y.(1989)，6.3.1-6.3.6，其通过引用并入本文。在该文献中描述了含水的和非含水的方法，且可以使用任一种。例如，具体的杂交条件如下：(1)低严格性杂交条件在6×氯化钠/柠檬酸钠(SSC)中，在约45℃，然后在至少50℃，在0.2×SSC，0.1％SDS中洗涤2次(对于低严格性条件，可以将洗涤温度升高到55℃)；(2)中等严格性杂交条件在6×SSC，在约45℃，然后在60℃，在0.2×SSC，0.1％SDS中洗涤1次或多次；(3)高严格性杂交条件在6×SSC，在约45℃，然后在65℃，在0.2×SSC，0.1％SDS中洗涤1次或多次且优选；(4)非常高的严格性杂交条件是0.5M磷酸钠，7％SDS，在65℃，然后在65℃，在0.2×SSC，1％SDS中洗涤1次或多次。

<碱基编辑器融合蛋白>

本发明的第二方面提供了一种碱基编辑器融合蛋白，其包含本发明第一方面所述腺苷脱氨酶，以及核酸可编程核苷酸结合结构域。

在本发明中，核酸可编程核苷酸结合结构域当与结合的引导多核苷酸(例如，gRNA)结合时，可以特异性结合靶多核苷酸序列(即，通过结合的引导核酸的碱基和靶多核苷酸的碱基之间的互补碱基配对序列)，从而将碱基编辑器定位到需要编辑的目标核酸序列。在一些实施方案中，靶多核苷酸序列包含单链DNA或双链DNA。在一些实施方案中，所述靶多核苷酸序列包含RNA。在一些实施方案中，靶标多核苷酸序列包含DNA-RNA杂交体。应当理解，核酸可编程核苷酸结合结构域还可以包括结合RNA的核酸可编程蛋白。

在本发明的一些实施方案中，碱基编辑器中的核酸可编程核苷酸结合结构域是Cas蛋白或者AGO蛋白。所述Cas蛋白或AGO蛋白包括天然存在的Cas蛋白或AGO蛋白，以及其同源物或其修饰或工程化版本。例如，在一些实施方案中，Cas蛋白或AGO蛋白可以是包括与天然存在的Cas蛋白或AGO蛋白的氨基酸序列具有至少60％，至少65％，至少70％，至少75％，至少80％，至少85％，至少90％，至少95％，至少96％，至少97％，至少98％，至少99％或至少99.5％同一性的氨基酸序列的蛋白。在另一些实施方案中，Cas蛋白还包括其切口酶或无核酸酶活性形式的蛋白。

在一些实施方案中，可以作为核酸可编程核苷酸结合结构域的Cas蛋白的非限制实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas8a、Cas8b、Cas8c、Cas9(也已知为Csn1或Csx12)、Cas10、Cas10d、Cas12a/Cpfl、Cas12b/C2cl、Cas12c/C2c3、Cas12d/CasY、Cas12e/CasX、Cas12f(C2c10/Cas14)、Cas12g、Cas12h、Cas12i、Cas12j、Cas12k/C2c5、Cas12l、Cas12m、Cas12n、Cas13a(C2c2)、cas13b、Cas13c、Cas13d、Csy1、Csy2、Csy3、Csy4、Css1、Css2、Cse5e、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr2、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、Csx1、Csx1S、Csx11、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、II类Cas效应蛋白、V型Cas效应蛋白、VI类蛋白质、CARF、DinG、其同源物或其修饰或工程化版本。其他核酸可编程核苷酸结合结构域也在本公开的范围内，尽管它们可能未在本公开中具体列出。

在本发明的一些具体的实施方案中，Cas蛋白选自Cas9家族、Cas12家族和Cas13家族，例如但不限于Cas9、Cas12a(Cpf1)、Cas12b(C2c1)、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12f(C2c10/Cas14)、Cas12g、Cas12h、Cas12i、Cas12j、Cas12k(C2c5)、Cas12l、Cas12m、Cas12n、Cas13a(C2c2)、Cas13b、Cas13c、Cas13d、其同源物或其修饰或工程化版本。在本发明的一些具体的实施方案中，Cas蛋白包括上述Cas蛋白的无核酸酶活性形式，例如dCas9、dCas12a、dCas12b、dCas12c、dCas12d、dCas12e、dCas12f、dCas12g、dCas12h、dCas12i、dCas12j、dCas12k、dCas12l、dCas12m、dCas12n、dCas13a、dcas13b、dCas13c和dCas13d。在本发明的一些具体的实施方案中，Cas蛋白还包括上述蛋白的切口酶形式，例如但不限于nCas9。

在本发明的一些优选的实施方案中，核酸可编程核苷酸结合结构域为Cas9。在本发明的一些具体的实施方案中，Cas9是来自化脓性链球菌的Cas9(SpCas9)、金黄色葡萄球菌的Cas9(SaCas9)、嗜热链球菌1的Cas9(St1Cas9)。在本发明的一些优选的实施方案中，Cas9是来自化脓性链球菌的Cas9(SpCas9)。

在本发明的一些更优选的实施方案中Cas9可以是核酸酶活性Cas9、Cas9切口酶(nCas9)或无核酸酶活性Cas9(dCas9)。

在本发明的一些进一步优选的实施方案中，核酸可编程核苷酸结合结构域为Cas9切口酶(nCas9)。在本发明的另一些进一步优选的实施方案中，核酸可编程核苷酸结合结构域包含与本文提供的Cas9切口酶(nCas9)的氨基酸序列具有至少80％，至少85％，至少90％，至少95％，至少96％，至少97％，至少98％，至少99％或至少99.5％同一性的氨基酸序列。

在本发明的一些实施方案中，腺苷脱氨酶与核酸可编程核苷酸结合结构域直接融合/连接形成融合蛋白，或者通过接头融合/连接形成融合蛋白。腺苷脱氨酶与核酸可编程核苷酸的融合/连接顺序没有特别的限制，例如腺苷脱氨酶可以在碱基编辑器的N端，或者核酸可编程核苷酸结合结构域位于碱基编辑器的N端。

在腺苷脱氨酶与核酸可编程核苷酸结合结构域直接融合的实施方案中，示例性的碱基编辑器融合蛋白具有如下的结构：

NH₂-[腺苷脱氨酶]-[napDNAbp]-COOH；或

NH₂-[napDNAbp]-[腺苷脱氨酶]-COOH。

在腺苷脱氨酶与核酸可编程核苷酸结合结构域通过接头融合的实施方案中，示例性的碱基编辑器融合蛋白具有如下的结构：

NH₂-[腺苷脱氨酶]-[任选的接头]-[napDNAbp]-COOH；或

NH₂-[napDNAbp]-[任选的接头]-[腺苷脱氨酶]-COOH。

在一些实施方案中，核碱基编辑器的结构域通过包含以下氨基酸序列的接头融合：

在本发明的一些实施方案中，碱基编辑器中还包括至少一条核定位信号序列(NLS序列)，NLS序列的氨基酸序列选自：

KRTADGSEFESPKKKRKV(SEQ ID NO:13)、

KRPAATKKAGQAKKKK(SEQ ID NO:14)、

KKTELQTTNAENKTKKL(SEQ ID NO:15)、

KRGINDRNFWRGENGRKTR(SEQ ID NO:16)、

RKSGKIAAIVVKRPRK(SEQ ID NO:17)、

PKKKRKV(SEQ ID NO:18)、

MDSLLMNRRKFLYQFKNVRWAKGRRETY(SEQ ID NO:19)、

MKRTADGSEFESPKKKRKV(SEQ ID NO:20)、或

SGGSKRTADGSEFEPKKKRKV(SEQ ID NO:21)。

在本发明的一些实施方案中，核定位信号序列可以位于碱基编辑器的N端、C端、两端，或者位于腺苷脱氨酶与核酸可编程核苷酸结合结构域之间。在本发明的一些实施方案中，核定位信号序列可以直接融合于碱基编辑器中，或者通过接头融合在碱基编辑器中。包含核定位信号序列的碱基编辑器的示例性结构如下：

NH₂-[NLS]-[腺苷脱氨酶]-[napDNAbp]-COOH；

NH₂-[腺苷脱氨酶]-[NLS]-[napDNAbp]-COOH；

NH₂-[腺苷脱氨酶]-[napDNAbp]-[NLS]-COOH；

NH₂-[NLS]-[napDNAbp]-[腺苷脱氨酶]-COOH；

NH₂-[napDNAbp]-[NLS]-[腺苷脱氨酶]-COOH；

NH₂-[napDNAbp]-[腺苷脱氨酶]-[NLS]-COOH；

NH₂-[NLS]-[腺苷脱氨酶]-[任选的接头]-[napDNAbp]-COOH；

NH₂-[腺苷脱氨酶]-[任选的接头]-[NLS]-[任选的接头]-[napDNAbp]-COOH；

NH₂-[腺苷脱氨酶]-[任选的接头]-[napDNAbp]-[NLS]-COOH；

NH₂-[NLS]-[napDNAbp]-[任选的接头]-[腺苷脱氨酶]-COOH；

NH₂-[napDNAbp]-[任选的接头]-[NLS]-[任选的接头]-[腺苷脱氨酶]-COOH；

NH₂-[napDNAbp]-[任选的接头]-[腺苷脱氨酶]-[NLS]-COOH；

NH₂-[NLS]-[腺苷脱氨酶]-[任选的接头]-[napDNAbp]-[NLS]-COOH。

在本发明的一些优选的实施方案中，碱基编辑器具有如下的结构：

NH₂-[NLS]-[腺苷脱氨酶]-[任选的接头]-[napDNAbp]-[NLS]-COOH。

在本发明的一些进一步优选的实施方案中，所述碱基编辑器包含以下序列中的一种或多种：

(i)如SEQ ID NO:22所示的氨基酸序列；

(ii)与SEQ ID NO:22所示的氨基酸序列具有至少80％、82％、85％、87％、90％、92％、95％、96％、97％、98％或99％同一性的氨基酸序列，并且其保留如SEQ ID NO:22所示的氨基酸序列的结合多核苷酸和碱基编辑活性；

(iii)在SEQ ID NO:22所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列，并且其保留如SEQ ID NO:22所示的氨基酸序列的结合多核苷酸和碱基编辑活性；或者，

(iv)由核苷酸序列编码的氨基酸序列，所述核苷酸序列与编码如SEQ ID NO:22所示的氨基酸序列的多核苷酸序列在严格条件下杂交，并且所述氨基酸序列保留如SEQ IDNO:22所示的氨基酸序列的结合多核苷酸和碱基编辑活性，所述严格条件是中等严格条件，中-高严格条件，高严格条件或非常高严格条件。

004V1-nCas9的氨基酸序列(SEQ ID NO:22)：

在本发明中，基于腺苷脱氨酶004V1进行氨基酸取代获得腺苷脱氨酶004V2、腺苷脱氨酶004V3、腺苷脱氨酶004V4、腺苷脱氨酶004V7、腺苷脱氨酶004V8、腺苷脱氨酶004V10、腺苷脱氨酶004V12、腺苷脱氨酶004V13，具体如下：

名称	基于腺苷脱氨酶004V1(SEQ ID NO:1)存在的取代
		腺苷脱氨酶004V2	S15T、D16E、H17K、F19Y、N20Q
腺苷脱氨酶004V3	E22D、Y23F、W24F、R26K、H27R、L29I
		腺苷脱氨酶004V4	K33R、R34K、A35S
腺苷脱氨酶004V7	G80A、L81N、V82A、L83I、Q84N、N85S、Y86W
		腺苷脱氨酶004V8	I89L、D90G、A91T、T92D
腺苷脱氨酶004V10	I112L、S113K、R114K
		腺苷脱氨酶004V12	N132K、V133I、L134F、N135H
腺苷脱氨酶004V13	P137F、G138A、M139L

上述腺苷脱氨酶各自所构成的碱基编辑器序列如下：

004V2-nCas9的氨基酸序列如下所示(SEQ ID NO:46)：

004V3-nCas9的氨基酸序列如下所示(SEQ ID NO:47)：

004V4-nCas9的氨基酸序列如下所示(SEQ ID NO:48)：

004V7-nCas9的氨基酸序列如下所示(SEQ ID NO:49)：

/>

004V8-nCas9的氨基酸序列如下所示(SEQ ID NO:50)：

/>

004V10-nCas9的氨基酸序列如下所示(SEQ ID NO:51)：

004V12-nCas9的氨基酸序列如下所示(SEQ ID NO:52)：

/>

004V13-nCas9的氨基酸序列如下所示(SEQ ID NO:53)：

/>

其中，粗体序列表示源自nCas9的序列；斜体表示接头序列；双下划线序列表示核定位序列；单下划线序列是004V1-004V4、004V7-004V8、004V10、004V12或004V13脱氨酶序列；C端的星号代表终止密码子位置。

(i)如下SEQ ID NO:23所示的氨基酸序列；

(ii)与SEQ ID NO:23所示的氨基酸序列具有至少80％、82％、85％、87％、90％、92％、95％、96％、97％、98％或99％同一性的氨基酸序列，并且其保留如SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性；

(iii)在SEQ ID NO:23所示的氨基酸序列中添加、取代、缺失或插入1个或多个氨基酸残基的氨基酸序列，并且其保留如SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性；或者，

(iv)由核苷酸序列编码的氨基酸序列，所述核苷酸序列与编码如SEQ ID NO:23所示的氨基酸序列的多核苷酸序列在严格条件下杂交，并且所述氨基酸序列保留如SEQ IDNO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性，所述严格条件是中等严格条件，中-高严格条件，高严格条件或非常高严格条件。

005V1-nCas9的氨基酸序列(SEQ ID NO:23)：

/>

其中，粗体序列表示源自nCas9的序列；斜体表示接头序列；双下划线序列表示核定位序列；单下划线序列是005V1脱氨酶序列；C端的星号代表终止密码子位置。

在本发明中，“保留如SEQ ID NO:22所示的氨基酸序列的结合多核苷酸和碱基编辑活性”、“保留如SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性”可以是完全保留如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的碱基编辑器的结合多核苷酸和碱基编辑活性，也可以是部分保留其活性。在另一些实施方案中，具有修改序列的碱基编辑器也可以具有高于如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的碱基编辑器的结合多核苷酸和碱基编辑活性。

应当理解，本公开的碱基编辑器融合蛋白可以包含一个或多个附加特征。例如，在一些实施方案中，融合蛋白可包含抑制剂、细胞质定位序列、输出序列，例如核输出序列或其他定位序列，以及可用于溶解、纯化或检测融合的标签。本文提供的合适的标签包括但不限于生物素羧化酶载体蛋白(BCCP)标签、myc标签、钙调蛋白标签、FLAG标签、血凝素(HA)标签、多组氨酸标签，也称为组氨酸标签或His-标签、麦芽糖结合蛋白(MBP)-标签、nus-标签、谷胱甘肽-S-转移酶(GST)-标签、绿色荧光蛋白(GFP)-标签、硫氧还蛋白-标签、S-标签、Softags(例如，Softag 1、Softag 3)、链标签、生物素连接酶标签、Flash标签、V5标签和SBP标签。其他合适的序列对本领域技术人员来说是显而易见的。在一些实施方案中，融合蛋白包含一个或多个His标签。

<多核苷酸>

本发明的第三方面提供了一种多核苷酸，其编码本发明第一方面所述的腺苷脱氨酶或者编码本发明第二方面所述的碱基编辑器融合蛋白。

<表达载体>

本发明的第四方面提供了一种载体，其包含本发明第三方面所述的多核苷酸。在本发明的一些实施方案中，所述载体是哺乳动物表达载体。在一些实施方案中，所述表达载体选自腺相关病毒、逆转录病毒载体、腺病毒载体、慢病毒载体、仙台病毒载体和疱疹病毒载体中的一种或多种。在一些实施方案中，所述载体包含启动子。

<细胞>

本发明的第五方面提供了一种细胞，其包含本发明第一方面所述的腺苷脱氨酶、本发明第二方面所述的碱基编辑器融合蛋白、本发明第三方面所述的多核苷酸和本发明第四方面所述的载体中的一种或多种。在本发明的一些实施方案中，所述细胞是原核细胞、真核细胞，进一步地，可以是细菌细胞、植物细胞、昆虫细胞、人类细胞或哺乳动物细胞。

<碱基编辑器系统>

本发明的第六方面提供了一种碱基编辑器系统。在一些实施方案中，碱基编辑器系统包含本发明第一方面所述的腺苷脱氨酶、核酸可编程核苷酸结合结构域、以及引导多核苷酸。

在另一些实施方案中，碱基编辑器系统包含本发明第二方面所述的碱基编辑器融合蛋白，以及引导多核苷酸。

在本发明的一些实施方案中，引导多核苷酸为引导RNA(gRNA)，其是一种短的合成RNA，由Cas结合所需的骨架序列和用户定义的约20个核苷酸间隔序列组成，该间隔序列定义了要修改的基因组靶标。因此，技术人员可以改变Cas蛋白的基因组靶标特异性部分取决于gRNA靶向序列与基因组其余部分相比对基因组靶标的特异性。

在本发明的更具体的一些实施方案中，引导多核苷酸为sgRNA，其由Cas结合所需的骨架序列和用户定义的约20个核苷酸间隔序列组成。

针对不同来源或种类的Cas蛋白，可以选择不同的骨架序列。在本发明的一些更具体的具体实施方案中，其中，结合Cas9蛋白的结构域(SpCas9)，即sgRNA的骨架序列为(SEQID NO:24)：

GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC

<药物组合物、试剂盒、递送系统、用途及方法>

本发明第七方面提供了一种药物组合物，其包含本发明第一方面所述的腺苷脱氨酶、本发明第二方面所述的碱基编辑器融合蛋白、本发明第三方面所述的多核苷酸、本发明第四方面所述的载体、本发明第五方面所述的细胞和本发明第六方面所述的碱基编辑器系统中的一种或多种，以及药学上可接受的载体。

在一些实施方案中，所述的药学上可接受的载体可以是递送载体，例如脂质、阳离子脂质或其他具有药物递送功能的聚合物。

本发明第八方面提供了一种试剂盒，具体为一种疾病治疗试剂盒，其包含本发明第一方面所述的腺苷脱氨酶、本发明第二方面所述的碱基编辑器融合蛋白、本发明第三方面所述的多核苷酸、本发明第四方面所述的载体、本发明第五方面所述的细胞、本发明第六方面所述的碱基编辑器系统和本发明第七方面所述的药物组合物中的一种或多种。

本发明的第九方面提供了一种递送系统，其包含本发明第一方面所述的腺苷脱氨酶、本发明第二方面所述的碱基编辑器融合蛋白、本发明第三方面所述的多核苷酸、本发明第四方面所述的载体、本发明第五方面所述的细胞和本发明第六方面所述的碱基编辑器系统中的一种或多种，以及递送介质。

在一些实施方案中，所述递送介质可以为纳米颗粒、脂质体、外泌体、微囊泡或基因枪、细胞穿膜肽等。

本发明第十方面提供了本发明第一方面所述的腺苷脱氨酶在制备碱基编辑器或剪辑编辑器系统中的用途。

本发明第十一方面提供了本发明第一方面所述的腺苷脱氨酶、本发明第二方面所述的碱基编辑器融合蛋白、本发明第三方面所述的多核苷酸、本发明第四方面所述的载体、本发明第五方面所述的细胞、本发明第六方面所述的碱基编辑器系统或本发明第七方面所述的药物组合物、本发明第九方面所述的递送系统在制备用于治疗与点突变相关或由点突变引起的疾病的药物中的用途。

在一些实施方案中，所述药物可以将所述点突变进行校正。在一些实施方案中，所述点突变为G至A和/或C至T。

在一些实施方案中，与点突变相关或由点突变引起的疾病包括高胆固醇血症。在另一些实施方案中，所述疾病非限制性的实例包括梅尔-戈林综合征(Meier-Gorlinsyndrome)；塞克尔综合征(Seckel syndrome)；乔伯特综合征(Joubert syndrome)；莱伯氏先天性黑蒙症(Leber congenital amaurosis)；夏科-马里-图思病(Charcot-Marie-Toothdisease)，2型；夏科-马里-图思病，2型；乌谢尔综合征(Usher syndrome)，2C型；脊髓小脑性共济失调；长QT综合征2；西奥格林-拉尔逊氏综合征(-Larsson syndrome)；遗传性果糖尿病；遗传性果糖尿病；神经母细胞瘤；神经母细胞瘤；卡尔曼综合征(Kallmannsyndrome)1；卡尔曼综合征；异染性脑白质营养不良；雷特综合征(Rettsyndrome)；肌萎缩性侧索硬化症10型；李-佛美尼综合征(Li-Fraumeni syndrome)。

本发明第十二方面提供了核酸的碱基编辑方法，其包括将核酸与本发明第六方面所述的碱基编辑器系统相接触的步骤。

在一些实施方案中，核酸是DNA。进一步地，核酸是双链DNA。

在一些实施方案中，所述核酸包含与疾病相关的靶序列。

在一些实施方案中，所述靶序列包含与疾病相关的点突变。

在一些具体的实施方案中，所述靶序列包含G至A或C至T的与疾病或病症相关的点突变，并且其中突变A碱基的脱氨化导致与疾病或病症不相关的序列。

在一些实施方案中，所述靶序列编码蛋白质，并且其中所述点突变在密码子中，并且导致与野生型密码子相比由该突变密码子编码的氨基酸变化。

在一些实施方案中，所述靶序列位于剪接位点处，并且其中所述点突变导致与野生型转录物相比mRNA转录物的剪接变化。

在一些实施方案中，所述靶序列位于基因的启动子处，并且其中所述点突变导致基因表达增加。

在一些实施方案中，所述靶序列位于基因的启动子处，并且其中所述点突变导致基因表达减少。

在一些实施方案中，核酸位于生物体的基因组内。

在一些实施方案中，所述生物体为原核生物或真核生物或脊椎动物或哺乳动物。

在一些实施方案中，所述突变A碱基的脱氨化导致该突变密码子所编码的氨基酸变化，或导致编码野生型氨基酸的密码子，或导致mRNA转录物变化，或导致野生型mRNA转录物，或导致基因表达增加，或导致基因表达减少。

在一些实施方案中，所述接触在体外实施。

在一些实施方案中，所述接触在受试者体内实施。

在一些实施方案中，所述受试者已被诊断患有疾病或病症。

在一些实施方案中，所述疾病或病症与前蛋白转化酶枯草溶菌素9(PCSK9)基因的点突变相关。

在一些实施方案中，所述疾病包括高胆固醇血症。在另一些实施方案中，所述疾病包括非限制性的实例包括梅尔-戈林综合征(Meier-Gorlin syndrome)；塞克尔综合征(Seckel syndrome)；乔伯特综合征(Joubert syndrome)；莱伯氏先天性黑蒙症(Lebercongenital amaurosis)；夏科-马里-图思病(Charcot-Marie-Tooth disease)，2型；夏科-马里-图思病，2型；乌谢尔综合征(Usher syndrome)，2C型；脊髓小脑性共济失调；长QT综合征；西奥格林-拉尔逊氏综合征(-Larsson syndrome)；遗传性果糖尿病；遗传性果糖尿病；神经母细胞瘤；神经母细胞瘤；卡尔曼综合征(Kallmannsyndrome)；异染性脑白质营养不良；雷特综合征(Rettsyndrome)；肌萎缩性侧索硬化症10型；李-佛美尼综合征(Li-Fraumeni syndrome)。

本发明第十三方面提供了用于治疗患有与点突变相关或由点突变引起的疾病的方法，在一些实施方案中，提供的方法包括向患有此类疾病的受试者施用有效量的校正点突变或将失活性突变引入到疾病相关基因中的本发明第二方面所述的碱基编辑器融合蛋白、本发明第六方面所述的碱基编辑器系统、本发明第七方面所述的药物组合物、本发明第八方面所述的试剂盒、本发明第九方面所述的递送系统。

以下结合附图，通过实施例进一步说明本发明，但不作为对本发明的限制。以下提供了本发明实施方案中所使用的具体材料及其来源。但是，应当理解的是，这些仅仅是示例性的，并不意图限制本发明，与如下试剂和仪器的类型、型号、品质、性质或功能相同或相似的材料均可以用于实施本发明。下述实施例中所使用的实验方法如无特殊说明，均为常规方法。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

在以下实施例中，使用David R.Liu团队所进化出的高效碱基编辑器ABE8e(Richter MF,Zhao KT,Eton E,Lapinaite A,Newby GA,Thuronyi BW,Wilson C,KoblanLW,Zeng J,Bauer DE,Doudna JA,Liu DR.Phage-assisted evolution of an adeninebase editor with improved Cas domain compatibility and activity.NatBiotechnol.2020 Jul；38(7):883-891.doi:10.1038/s41587-020-0453-z.Epub 2020 Mar16.Erratum in:Nat Biotechnol.2020 May 20；:PMID:32433547；PMCID:PMC7357821.)作为对比，与包含本发明提供的腺苷脱氨酶的碱基编辑器进行比较，ABE8e是基于对ABE7.10(Gaudelli NM,Komor AC,Rees HA,Packer MS,Badran AH,Bryson DI,LiuDR.Programmable base editing of A·T to G·C in genomic DNA without DNAcleavage.Nature.2017 Nov 23；551(7681):464-471.doi:10.1038/nature24644.Epub2017 Oct 25.Erratum in:Nature.2018 May 2；:PMID:29160308；PMCID:PMC5726555.)的脱氨酶成分进行优化后得到的；根据前述团队所得出的实验结果，相对于ABE7.10的活性(以一级脱氨常数(first-order kinetics.deamination rate constants,kapp)表示)提高590倍。

具体地，在以下实施例中，ABE8e的氨基酸序列如下(SEQ ID NO:25)：

其中，粗体序列表示源自nCas9的序列；斜体表示接头序列；双下划线序列表示核定位序列；单下划线序列是ecTadA*脱氨酶序列；C端末尾*表示终止密码子位置。

相应地，ABE8e核苷酸序列如下(SEQ ID NO:26)：

atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtctctgaggtggagttttcccacgagtactggatgagacatgccctgaccctggccaagagggcacgggatgagagggaggtgcctgtgggagccgtgctggtgctgaacaatagagtgatcggcgagggctggaacagagccatcggcctgcacgacccaacagcccatgccgaaattatggccctgagacagggcggcctggtcatgcagaactacagactgattgacgccaccctgtacgtgacattcgagccttgcgtgatgtgcgccggcgccatgatccactctaggatcggccgcgtggtgtttggcgtgaggaactcaaaaagaggcgccgcaggctccctgatgaacgtgctgaactaccccggcatgaatcaccgcgtcgaaattaccgagggaatcctggcagatgaatgtgccgccctgctgtgcgatttctatcggatgcctagacaggtgttcaatgctcagaagaaggcccagagctccatcaactccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtctaa

在以下实施例中，ABE8e以及包含本发明提供的腺苷脱氨酶的碱基编辑器中所使用的napDNAbp均为nCas9，其氨基酸序列如下(SEQ ID NO:27)：

DKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

nCas9核苷酸序列如下(SEQ ID NO:28)：

gacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgac

在以下实施例中，包含本发明提供的包含腺苷脱氨酶和nCas9的碱基编辑器结构如下：

NH₂-[NLS]-[腺苷脱氨酶]-接头-[napDNAbp]-[NLS]-COOH。

在以下实施例中，所使用的其他序列见下表：

序号	名称	序列
			SEQ ID NO:29	位点1-sgRNA	gaacacaaagcatagactgc
SEQ ID NO:30	位点17-sgRNA	acaaagaggaagagagacg
			SEQ ID NO:31	位点18-sgRNA	acacacacacttagaatctg
SEQ ID NO:32	PCSK9-sgRNA	cccgcaccttggcgcagcgg
			SEQ ID NO:33	位点1-正向引物	cctcagcattcagccactaa
SEQ ID NO:34	位点1-反向引物	agaggcccattaacgtttgg
			SEQ ID NO:35	位点17-正向引物	ctggctgaccaagagtgaag
SEQ ID NO:36	位点17-反向引物	aatgagcctctggtggagat
			SEQ ID NO:37	位点18-正向引物	gagaggctgccaagctaaat
SEQ ID NO:38	位点18-反向引物	tggagctcaagatcacgttg
			SEQ ID NO:39	PCSK9-正向引物	gctagccttgcgttccg
SEQ ID NO:40	PCSK9-反向引物	gtccccaagatcgtgccaa

实施例

实施例1

本实施例采用腺苷脱氨酶004V1，将其与nCas9融合表达构成一种新的编辑窗口更窄的腺嘌呤碱基编辑器004V1-nCas9。

在本实施例中，腺嘌呤碱基编辑器004V1-nCas9构建策略为：将ABE8e中的腺苷脱氨酶替换为004V1，从而得到一种新的腺苷碱基编辑器004V1-nCas9。sgRNA及碱基编辑器的具体构建如下。

1、sgRNA表达载体(sgRNA质粒)构建

根据目标序列设计sgRNA并合成寡核苷酸(oligos)，所用到的sgRNA序列如SEQ IDNO:29～31所示。在每个sgRNA的上游序列5’端加CACC序列，下游序列的5’端加AAAC序列，因此用于合成的每个sgRNA上游序列形式为：5’-CACCXXXXXXXXXXXXXXXXXXXX(20nt)-3’，下游序列形式为：5’-AAACXXXXXXXXXXXXXXXXXXXX(20nt)-3’。经合成后，上、下游序列通过预设程序(95℃，5min；95℃-85℃以-2℃/s；85℃-25℃以-0.1℃/s；保持在4℃)进行退火，将退火产物连接到经过BsmBI(NEB：R0739L)线性化的PHK09载体(质粒图谱如图1A所示，实验室自有，其已包含sgRNA的骨架序列)上，PHK09载体的序列如下所示(SEQ ID NO:41)

TGAGCTGATACCGCTCGCCGCAGCCGAACGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTCTCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGCAGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGACCATGATTACGCCAAGCGCGCAATTAACCCTCACTAAAGGGAACAAAAGCTGGAGCTGCAAGCTTAATGTAGTCTTATGCAATACTCTTGTAGTCTTGCAACATGGTAACGATGAGTTAGCAACATGCCTTACAAGGAGAGAAAAAGCACCGTGCATGCCGATTGGTGGAAGTAAGGTGGTACGATCGTGCCTTATTAGGAAGGCAACAGACGGGTCTGACATGGATTGGACGAACCACTGAATTGCCGCATTGCAGAGATATTGTATTTAAGTGCCTAGCTCGATACATAAACGGGTCTCTCTGGTTAGACCAGATCTGAGCCTGGGAGCTCTCTGGCTAACTAGGGAACCCACTGCTTAAGCCTCAATAAAGCTTGCCTTGAGTGCTTCAAGTAGTGTGTGCCCGTCTGTTGTGTGACTCTGGTAACTAGAGATCCCTCAGACCCTTTTAGTCAGTGTGGAAAATCTCTAGCAGTGGCGCCCGAACAGGGACTTGAAAGCGAAAGGGAAACCAGAGGAGCTCTCTCGACGCAGGACTCGGCTTGCTGAAGCGCGCACGGCAAGAGGCGAGGGGCGGCGACTGGTGAGTACGCCAAAAATTTTGACTAGCGGAGGCTAGAAGGAGAGAGATGGGTGCGAGAGCGTCAGTATTAAGCGGGGGAGAATTAGATCGCGATGGGAAAAAATTCGGTTAAGGCCAGGGGGAAAGAAAAAATATAAATTAAAACATATAGTATGGGCAAGCAGGGAGCTAGAACGATTCGCAGTTAATCCTGGCCTGTTAGAAACATCAGAAGGCTGTAGACAAATACTGGGACAGCTACAACCATCCCTTCAGACAGGATCAGAAGAACTTAGATCATTATATAATACAGTAGCAACCCTCTATTGTGTGCATCAAAGGATAGAGATAAAAGACACCAAGGAAGCTTTAGACAAGATAGAGGAAGAGCAAAACAAAAGTAAGACCACCGCACAGCAAGCGGCCGCTGATCTTCAGACCTGGAGGAGGAGATATGAGGGACAATTGGAGAAGTGAATTATATAAATATAAAGTAGTAAAAATTGAACCATTAGGAGTAGCACCCACCAAGGCAAAGAGAAGAGTGGTGCAGAGAGAAAAAAGAGCAGTGGGAATAGGAGCTTTGTTCCTTGGGTTCTTGGGAGCAGCAGGAAGCACTATGGGCGCAGCGTCAATGACGCTGACGGTACAGGCCAGACAATTATTGTCTGGTATAGTGCAGCAGCAGAACAATTTGCTGAGGGCTATTGAGGCGCAACAGCATCTGTTGCAACTCACAGTCTGGGGCATCAAGCAGCTCCAGGCAAGAATCCTGGCTGTGGAAAGATACCTAAAGGATCAACAGCTCCTGGGGATTTGGGGTTGCTCTGGAAAACTCATTTGCACCACTGCTGTGCCTTGGAATGCTAGTTGGAGTAATAAATCTCTGGAACAGATTTGGAATCACACGACCTGGATGGAGTGGGACAGAGAAATTAACAATTACACAAGCTTAATACACTCCTTAATTGAAGAATCGCAAAACCAGCAAGAAAAGAATGAACAAGAATTATTGGAATTAGATAAATGGGCAAGTTTGTGGAATTGGTTTAACATAACAAATTGGCTGTGGTATATAAAATTATTCATAATGATAGTAGGAGGCTTGGTAGGTTTAAGAATAGTTTTTGCTGTACTTTCTATAGTGAATAGAGTTAGGCAGGGATATTCACCATTATCGTTTCAGACCCACCTCCCAACCCCGAGGGGACCCAGAGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCGGAGACGGACGTCTCTGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTAAGCTTGGCGTAACTAGATCTTGAGACAAATGGCAGTATTCATCCACAATTTTAAAAGAAAAGGGGGGATTGGGGGGTACAGTGCAGGGGAAAGAATAGTAGACATAATAGCAACAGACATACAAACTAAAGAATTACAAAAACAAATTACAAAAATTCAAAATTTTCGGGTTTATTACAGGGACAGCAGAGATCCACTTTGGCGCCGGCTCGAGGGGGCCCGGGTGCAAAGATGGATAAAGTTTTAAACAGAGAGGAATCTTTGCAGCTAATGGACCTTCTAGGTCTTGAAAGGAGTGGGAATTGGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGATCCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGGCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGGCCTCGCGCCGCCGTGTATCGCCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGACGTACGGCCACCATGACCGAGTACAAGCCCACGGTGCGCCTCGCCACCCGCGACGACGTCCCCAGGGCCGTACGCACCCTCGCCGCCGCGTTCGCCGACTACCCCGCCACGCGCCACACCGTCGATCCGGACCGCCACATCGAGCGGGTCACCGAGCTGCAAGAACTCTTCCTCACGCGCGTCGGGCTCGACATCGGCAAGGTGTGGGTCGCGGACGACGGCGCCGCCGTGGCGGTCTGGACCACGCCGGAGAGCGTCGAAGCGGGGGCGGTGTTCGCCGAGATCGGCCCGCGCATGGCCGAGTTGAGCGGTTCCCGGCTGGCCGCGCAGCAACAGATGGAAGGCCTCCTGGCGCCGCACCGGCCCAAGGAGCCCGCGTGGTTCCTGGCCACCGTCGGAGTCTCGCCCGACCACCAGGGCAAGGGTCTGGGCAGCGCCGTCGTGCTCCCCGGAGTGGAGGCGGCCGAGCGCGCCGGGGTGCCCGCCTTCCTGGAGACCTCCGCGCCCCGCAACCTCCCCTTCTACGAGCGGCTCGGCTTCACCGTCACCGCCGACGTCGAGGTGCCCGAAGGACCGCGCACCTGGTGCATGACCCGCAAGCCCGGTGCCTGAACGCGTTAAGTCGACAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCGTCGACTTTAAGACCAATGACTTACAAGGCAGCTGTAGATCTTAGCCACTTTTTAAAAGAAAAGGGGGGACTGGAAGGGCTAATTCACTCCCAACGAAGACAAGATCTGCTTTTTGCTTGTACTGGGTCTCTCTGGTTAGACCAGATCTGAGCCTGGGAGCTCTCTGGCTAACTAGGGAACCCACTGCTTAAGCCTCAATAAAGCTTGCCTTGAGTGCTTCAAGTAGTGTGTGCCCGTCTGTTGTGTGACTCTGGTAACTAGAGATCCCTCAGACCCTTTTAGTCAGTGTGGAAAATCTCTAGCAGTACGTATAGTAGTTCATGTCATCTTATTATTCAGTATTTATAACTTGCAAAGAAATGAATATCAGAGAGTGAGAGGAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGCTCTAGCTATCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGGACGTACCCAATTCGCCCTATAGTGAGTCGTATTACGCGCGCTCACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCAGCCTGAATGGCGAATGGGACGCGCCCTGTAGCGGCGCATTAAGCGCGGCGGGTGTGGTGGTTACGCGCAGCGTGACCGCTACACTTGCCAGCGCCCTAGCGCCCGCTCCTTTCGCTTTCTTCCCTTCCTTTCTCGCCACGTTCGCCGGCTTTCCCCGTCAAGCTCTAAATCGGGGGCTCCCTTTAGGGTTCCGATTTAGTGCTTTACGGCACCTCGACCCCAAAAAACTTGATTAGGGTGATGGTTCACGTAGTGGGCCATCGCCCTGATAGACGGTTTTTCGCCCTTTGACGTTGGAGTCCACGTTCTTTAATAGTGGACTCTTGTTCCAAACTGGAACAACACTCAACCCTATCTCGGTCTATTCTTTTGATTTATAAGGGATTTTGCCGATTTCGGCCTATTGGTTAAAAAATGAGCTGATTTAACAAAAATTTAACGCGAATTTTAACAAAATATTAACGCTTACAATTTAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAATACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAGGAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCTGTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGTGGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTTTTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCAAGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAGAAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATAACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCACAACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAACGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCGAACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGACCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGTGGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATTTTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGAGTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTTTCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGGATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACTGTTCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTCGCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGACTCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGCCCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCTATGAGAAAGCGCCACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGAGCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACCTCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGCAACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTATCCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAG

其中，sgRNA质粒构建中所使用的体系如下：

PHK09载体的线性化体系如下：PHK09载体3μg；缓冲液(NEB：R0539L)6μL；BsmBI 2μL；ddH₂O补齐到60μL，37℃酶切过夜。

sgRNA退火产物与线性化载体连接体系如下：T4连接酶缓冲液(NEB：M0202L)1μL，线性化载体20ng，经退火的oligo片段(10μM)5μL，T4连接酶(NEB：M0202L)0.5μL，ddH₂O补齐到10μL，16℃连接过夜。

将连接的载体转化大肠杆菌DH5a感受态细胞(唯地生物，DL1001)。具体流程如下：DH5α感受态细胞从-80℃拿出，迅速插入冰中，5分钟后待菌块融化，加入连接产物并用手拨打离心管底轻轻混匀，冰中静置25分钟。42℃水浴热激45秒，迅速放回冰中并静置2分钟。向离心管中加入700μl不含抗生素的无菌LB培养基，混匀后37℃，200rpm复苏60分钟。5000rpm离心一分钟收菌，留取100μl左右上清轻轻吹打重悬菌块并涂布到Amp抗生素的LB培养基上。将平板倒置放于37℃培养箱过夜培养。挑取单菌落，经过测序确认后对阳性克隆摇菌并提取质粒(TIANGEN：DP120-01)后测定浓度，-20℃冰箱中保存备用。

2、腺嘌呤碱基编辑器004V1-nCas9表达载体(p004V1-nCas9质粒)的构建

本实施例制备了腺嘌呤碱基编辑器表达载体p004V1-nCas9。004V1的核苷酸序列如SEQ ID NO:42所示。

004V1的核苷酸序列(SEQ ID NO:42)：

atgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggct

cgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccacc

gcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtga

tgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaa

ctaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtg

ttcaatgccctgaagaaggccagacaggaggagggc

上述004V1脱氨酶的核苷酸序列已根据人密码子使用的偏好性进行密码子优化，委托生工生物工程(上海)股份有限公司完成540bp的004V1基因人工合成工作并将合成的基因替换ABE8e序列的第63-560位核苷酸。

p004V1-nCas9质粒图谱如图1B所示。

其中，004V1-nCas9的氨基酸序列如SEQ ID NO:22所示。

004V1-nCas9的核苷酸序列如下所示(SEQ ID NO:43)：

atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc

3、细胞培养与转染

将HEK293T细胞(购自ATCC)接种于添加了10％FBS(v/v)的DMEM培养基中(Gibco,11965092)，其中含1％Penicillin Streptomycin(v/v)(Gibco,15140122)，在含有5％CO₂的37℃细胞培养箱中进行培养。用于转染的细胞，前一天接种于24孔细胞培养板中进行培养，第二天观察细胞，当细胞生长到细胞密度为80％左右时进行转染。24孔板每孔转染的质粒用量分别是p004V1-nCas9质粒0.4μg，sgRNA质粒0.4μg。将质粒混合后用25μl的减血清培养基(源培生物,L530KJ)培养基稀释，再加入2μl p3000试剂，吹打混匀作为试剂A，静置5分钟。同时，将2μl的Lipofectamine 3000转染试剂(Thermo,11668019)用25μl的减血清培养基稀释并混匀，作为试剂B，静置5分钟。将上述试剂A与试剂B混合并吹打均匀，静置20分钟。静置结束后将混合试剂逐滴加入待转染的24孔板细胞中，放回37℃培养箱培养。转染6小时后将培养基换为含有10％FBS的DMEM培养基。转染48小时后收集细胞进行编辑效率的检测。

4、本实施例的腺嘌呤碱基编辑器004V1-nCas9在内源基因位点编辑效率检测

将“3、细胞培养与转染”中所述细胞进行基因组抽提(TIANGEN，DP304-03)。根据实验需求设计引物，所用到的鉴定引物序列如SEQ ID NO:33～38所示。以基因组为模板，对靶点附近序列进行PCR扩增，扩增的PCR产物用于高通量深度测序(金唯智生物科技有限公司)或Sanger测序(铂尚生物技术(上海)有限公司)进行编辑效率的鉴定。用于目标位点序列扩增的体系如下：2×Taq Master Mix(Vazyme，P112-03)25μL；Primer-F(10pmol/μL)1μL；Primer-R(10pmol/μL)1μL；模板1μL；ddH₂O补齐到50μL。

基因编辑效果试验过程如下：

将p004V1-nCas9质粒分别与不同位点的sgRNA质粒共转到HEK293T细胞(ATCC购买)中，相比于将ABE8e质粒(addgene,Plasmid#138489)，发现在位点1和位点17处，p004V1-nCas9质粒的编辑效率与ABE8e相似(图2，图3)，而在位点18处p004V1-nCas9质粒的编辑效率明显优于ABE8e(图4)。

至于编辑窗口，位点1、位点17、位点18处p004V1-nCas9质粒的编辑窗口都小于ABE8e(参见图2～图4)。

基因编辑效率计算方法参见Kluesner MG,Nedveck DA,Lahr WS,Garbe JR,Abrahante JE,Webber BR,Moriarity BS.EditR:A Method to Quantify Base Editingfrom Sanger Sequencing.CRISPR J.2018Jun；1(3):239-250.doi:10.1089/crispr.2018.0014.PMID:31021262；PMCID:PMC6694769。本实施例相关结果如图2-4所示。

实施例2

本实施例中，将实施例1中获得的腺嘌呤碱基编辑器表达载体p004V1-nCas9应用到疾病治疗中。

前蛋白转化酶枯草溶菌素9(PCSK9)是kexin样前蛋白转化酶枯草溶菌素家族的第9个成员，由692个氨基酸残基组成。作为低密度脂蛋白受体(Low-Density LipoproteinReceptor,LDLR)的负调节剂，过量PCSK9与肝细胞表面LDLR结合后可加速其降解，导致肝细胞对低密度脂蛋白-胆固醇(Low-Density Lipoprotein Cholesterol,LDL-C)的摄取下降，进而增加外周循环的LDL-C水平，最终使血液中胆固醇水平升高。

1、sgRNA表达载体(sgRNA质粒)构建

本实施例中靶向PCSK9的sgRNA质粒的构建方式如实施例1中所述。所用到的sgRNA序列如SEQ ID NO:32所示。

2、细胞培养与转染

本实施例中HEK293T细胞的培养与转染方法与实施例1相同。

3、优化后的碱基编辑工具在PCSK9位点编辑效率检测

本实施例中编辑效率检测方法同实施例1中所述，所用到的鉴定引物序列如SEQID NO:39～40所示。

本实施例将腺嘌呤碱基编辑器表达载体p004V1-nCas9与靶向PCSK9的sgRNA质粒共转到HEK293T细胞中，如图5所示，相比于ABE8e腺嘌呤碱基编辑器，p004V1-nCas9的编辑效率优于ABE8e。说明p004V1-nCas9可以靶向治疗PCSK9高表达导致的高胆固醇血症。

实施例3

本实施例采用腺苷脱氨酶004V2、腺苷脱氨酶004V3、腺苷脱氨酶004V4、腺苷脱氨酶004V7、腺苷脱氨酶004V8、腺苷脱氨酶004V10、腺苷脱氨酶004V12、腺苷脱氨酶004V13采用与实施例1或实施例2相同的方法构建腺嘌呤碱基编辑器表达载体、sgRNA表达载体，并进行细胞培养及转染，检测编辑效率。

各腺苷脱氨酶的核苷酸序列如下：

004V2-nCas9的核苷酸序列(SEQ ID NO:54)

atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgacagagaaggaatatcaggatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc

004V3-nCas9的核苷酸序列(SEQ ID NO:55)

atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgattttttcatgaagcgcgcaattacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatac gtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggaca ttctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaac atcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc

004V4-nCas9的核苷酸序列(SEQ ID NO:56)

atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccagaaagtctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc

004V7-nCas9的核苷酸序列(SEQ ID NO:57)

atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcgccaatgccattaacagctggcggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatac gtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactggg accctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcac cgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc

004V8-nCas9的核苷酸序列(SEQ ID NO:58)

atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgctgggaacagacctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc

004V10-nCas9的核苷酸序列(SEQ ID NO:59)

atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagattgaagaaactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc

004V12-nCas9的核苷酸序列(SEQ ID NO:60)

atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaagatcttccactaccccggcatgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctg ggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggtt caacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc

004V13-nCas9的核苷酸序列(SEQ ID NO:61)

atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgtacaatgcccctagattcttttgtagatctgctgccgtgtctgatcatgagtttaacgatgagtactggatgagacacgccctgacactggccaagagggctcgggaggaaggagaggtgccagtgggagctgtgctggtgctgaataatcaggtcattggagaaggatggaatagagccatcggcctgcacgaccccaccgcccacgccgagatcatggccctgagacagggcggcctggtgctgcagaactaccggctgatcgacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcatagcagaatcagcagactggtgttcggcgtgagaaactcaaagagaggcgccgccggcagcctgatcaacgtgctgaactacttcgccctgaaccacagagtggagatcaccgagggcatcctggccgagagctgcagcgccatgctgtgcgacttctataggtggcctagggaggtgttcaatgccctgaagaaggccagacaggaggagggctccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc

本实施例具体结果如图6所示。其中，如图6所示，相比于ABE8e，004V2-nCas9、004V3-nCas9、004V4-nCas9、004V7-nCas9、004V8-nCas9、004V10-nCas9、004V12-nCas9、004V13-nCas9在位点1的编辑窗口明显变窄(+5，+7)，其中以004v12-nCas9的编辑窗口最窄，仅对位置+5处具有编辑活性，并且碱基编辑效率为46％，可以实现高效精准编辑。在位点18，004V1-nCas9的不同突变体的编辑效率都明显优于ABE8e。对于PCSK9位点，004V1-nCas9和004V3-nCas9的编辑效率也优于ABE8e。

实施例4

本实施例采用腺苷脱氨酶005V1，将其与nCas9融合表达构成一种新的编辑窗口更窄的腺嘌呤碱基编辑器005V1-nCas9。

在本实施例中，腺嘌呤碱基编辑器005V1-nCas9构建策略为：将ABE8e中的腺苷脱氨酶替换为005V1，从而得到一种新的腺苷碱基编辑器005V1-nCas9。

1、腺嘌呤碱基编辑器005V1-nCas9表达载体(p005V1-nCas9质粒)的构建

本实施例制备了腺嘌呤碱基编辑器表达载体p005V1-nCas9。005V1的核苷酸序列如SEQ ID NO:44所示。

005V1的核苷酸序列(SEQ ID NO:44)

ATGAGTGAGCTGAATGATGCTTACTGGATGAAACAGGCACTCGCTTTAGCTCAGAAGGCCCGGGAACAGGGAGAAGTTCCAGTGGGCGCTATTCTGGTGCTGGATGATGAAGTGATAGGACAGGGATGGAATAGAGCCATCACCCTGCACGACCCCACCGCCCACGCCGAGATCATGGCCCTGCAGCAGGGCGGCCAGATCGTGCAGAACTACCGGCTGCTGAACGCCACCCTGTACGTGACCTTCGAGCCCTGCGTGATGTGCGCCGGCGCCATGGTGCACAGCAGGATCAAGAGACTGGTCTACGGCGTGAGCAACTCAAAAAGAGGCGCCGCCGGCAGCCTGCTGAACGTGCTGAACTACCCCGGCATGAACCACCAGATCGAGATCACCGCCGGCGTGATGGCCAACGAGTGCAGCGAGATGCTGTGCCAGTTCTATCAGCAGCCTAGGGAAGTGTTCAATGCTGAGCGTGAGGCTAGGCGGCTGAACCAACCTGATAGAGCTGAC

上述005V1脱氨酶的核苷酸序列已根据人密码子使用的偏好性进行密码子优化，委托生工生物工程(上海)股份有限公司完成510bp的005V1基因人工合成工作并将合成的基因替换ABE8e序列的第63-560位核苷酸。p005V1-nCas9质粒图谱如图7所示。

其中，005V1-nCas9的氨基酸序列如SEQ ID NO:23所示。

005V1-nCas9的核苷酸序列如下所示(SEQ ID NO:45)：

atgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtcatgagtgagctgaatgatgcttactggatgaaacaggcactcgctttagctcagaaggcccgggaacagggagaagttccagtgggcgctattctggtgctggatgatgaagtgataggacagggatggaatagagccatcaccctgcacgaccccaccgcccacgccgagatcatggccctgcagcagggcggccagatcgtgcagaactaccggctgctgaacgccaccctgtacgtgaccttcgagccctgcgtgatgtgcgccggcgccatggtgcacagcaggatcaagagactggtctacggcgtgagcaactcaaaaagaggcgccgccggcagcctgctgaacgtgctgaactaccccggcatgaaccaccagatcgagatcaccgccggcgtgatggccaacgagtgcagcgagatgctgtgccagttctatcagcagcctagggaagtgttcaatgctgagcgtgaggctaggcggctgaaccaacctgatagagctgactccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtc

2、细胞培养与转染

本实施例中HEK293T细胞的培养与转染的方法同实施例1。

3、本实施例的腺嘌呤碱基编辑器005V1-nCas9在位点1编辑效率检测

本实施例中编辑效率检测方法如实施例1中所述，所用到的鉴定引物序列如SEQID NO:33～34所示。相关结果如图8所示。在位点1，ABE8e的编辑窗口为+3，+5，+7，+8，而005V1-nCas9的编辑窗口仅为+5。而且在+5处的编辑效率，005V1-nCas9与ABE8e相近，证明005V1-nCas9可以实现高效精准编辑。

以上示例性实施方式所呈现的描述仅用以说明本发明的技术方案，并不想要成为毫无遗漏的，也不想要把本发明限制为所描述的精确形式。显然，本领域的普通技术人员根据上述教导做出很多改变和变化都是可能的。选择示例性实施方式并进行描述是为了解释本发明的特定原理及其实际应用，从而使得本领域的其它技术人员便于理解、实现并利用本发明的各种示例性实施方式及其各种选择形式和修改形式。本发明的保护范围意在由所附权利要求书及其等效形式所限定。

Claims

1.一种腺苷脱氨酶，其包含以下序列中的一种或多种：

(i)如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列；

(iv)由核苷酸序列编码的氨基酸序列，所述核苷酸序列与编码如SEQ ID NO:1或SEQID NO:2所示的氨基酸序列的多核苷酸序列在严格条件下杂交，并且所述氨基酸序列保留如SEQ ID NO:1或SEQ ID NO:2所示的氨基酸序列的脱氨活性，所述严格条件是中等严格条件，中-高严格条件，高严格条件或非常高严格条件。

2.根据权利要求1所述的腺苷脱氨酶，其中，所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点中的一个或多个发生的取代：

S15、D16、H17、F19、N20、D21、E22、Y23、W24、R26、H27、L29、K33、R34、A35、V41、V43、L47、L49、N59、A61、I62、A69、E72、G80、L81、V82、L83、Q84、N85、Y86、I89、D90、A91、T92、V95、F97、I112、S113、R114、L115、F117、V119、R120、N121、K123、R124、N132、V133、L134、N135、P137、G138和M139；和/或，

所述的取代为在如SEQ ID NO:2所示的氨基酸序列的以下位点中的一个或多个发生的取代：

3.根据权利要求2所述的腺苷脱氨酶，所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点中的一个或多个发生的取代：S15T、D16E、H17K、F19Y、N20Q、E22D、Y23F、W24F、R26K、H27R、L29I、K33R、R34K、A35S、G80A、L81N、V82A、L83I、Q84N、N85S、Y86W、I89L、D90G、A91T、T92D、I112L、S113K、R114K、N132K、V133I、L134F、N135H、P137F、G138A和M139L；

优选地，所述的取代为在如SEQ ID NO:1所示的氨基酸序列的以下位点的组合发生的取代：

(1)S15T、D16E、H17K、F19Y、N20Q；

(2)E22D、Y23F、W24F、R26K、H27R、L29I；

(3)K33R、R34K、A35S；

(4)G80A、L81N、V82A、L83I、Q84N、N85S、Y86W；

(5)I89L、D90G、A91T、T92D；

(6)I112L、S113K、R114K；

(7)N132K、V133I、L134F、N135H；和/或

(8)P137F、G138A、M139L。

4.一种碱基编辑器融合蛋白，其包含如权利要求1～3中任一项所述的腺苷脱氨酶，以及核酸可编程核苷酸结合结构域。

5.根据权利要求4所述的碱基编辑器融合蛋白，其中，所述核酸可编程核苷酸结合结构域为Cas蛋白或AGO蛋白。

6.根据权利要求4或5所述的碱基编辑器融合蛋白，其中，所述碱基编辑器融合蛋白中还包括至少一条核定位信号序列；

可选地，所述碱基编辑器融合蛋白中还包括接头；

任选地，所述接头包含如SEQ ID NO:3～12所示的序列中的一种或多种。

7.根据权利要求4～6中任一项所述的碱基编辑器融合蛋白，其中，所述碱基编辑器融合蛋白包含以下序列中的一种或多种：

(i)如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列；

(ii)与SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列具有至少80％、82％、85％、87％、90％、92％、95％、96％、97％、98％或99％同一性的氨基酸序列，并且其保留如SEQ IDNO:22或SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性；

(iv)由核苷酸序列编码的氨基酸序列，所述核苷酸序列与编码如SEQ ID NO:22或SEQID NO:23所示的氨基酸序列的多核苷酸序列在严格条件下杂交，并且所述氨基酸序列保留如SEQ ID NO:22或SEQ ID NO:23所示的氨基酸序列的结合多核苷酸和碱基编辑活性，所述严格条件是中等严格条件，中-高严格条件，高严格条件或非常高严格条件。

8.根据权利要求7所述的碱基编辑器融合蛋白，其中，所述的碱基编辑器融合蛋白包含SEQ ID NO:46～53所示序列中的任一种。

9.一种多核苷酸，其编码如权利要求1～3中任一项所述的腺苷脱氨酶或者编码如权利要求4～8中任一项所述的碱基编辑器融合蛋白。

10.一种载体，其包含如权利要求9所述的多核苷酸。

11.一种细胞，其包含如权利要求1～3中任一项所述的腺苷脱氨酶、如权利要求4～8中任一项所述的碱基编辑器融合蛋白、如权利要求9所述的多核苷酸和如权利要求10所述的载体中的一种或多种。

12.一种碱基编辑器系统，其包含如权利要求1～3中任一项所述的腺苷脱氨酶、核酸可编程核苷酸结合结构域、以及引导多核苷酸；

或者，其包含如权利要求4～8中任一项所述的碱基编辑器融合蛋白，以及引导多核苷酸。

13.一种药物组合物，其包含如权利要求1～3中任一项所述的腺苷脱氨酶、如权利要求4～8中任一项所述的碱基编辑器融合蛋白、如权利要求9所述的多核苷酸、如权利要求10所述的载体、如权利要求11所述的细胞和如权利要求12所述的碱基编辑器系统中的一种或多种，以及药学上可接受的载体。

14.一种试剂盒，其包含如权利要求1～3中任一项所述的腺苷脱氨酶、如权利要求4～8中任一项所述的碱基编辑器融合蛋白、如权利要求9所述的多核苷酸、如权利要求10所述的载体、如权利要求11所述的细胞和如权利要求12所述的碱基编辑器系统中的一种或多种。

15.一种递送系统，其包含如权利要求1～3中任一项所述的腺苷脱氨酶、如权利要求4～8中任一项所述的碱基编辑器融合蛋白、如权利要求9所述的多核苷酸、如权利要求10所述的载体、如权利要求11所述的细胞和如权利要求12所述的碱基编辑器系统中的一种或多种，以及递送介质。

16.一种核酸的碱基编辑方法，其包括将待被编辑碱基的核酸与如权利要求12所述的碱基编辑器系统相接触的步骤。

17.如权利要求1～3中任一项所述的腺苷脱氨酶、如权利要求4～8中任一项所述的碱基编辑器融合蛋白、如权利要求9所述的多核苷酸、如权利要求10所述的载体、如权利要求11所述的细胞、如权利要求12所述的碱基编辑器系统、如权利要求13所述的药物组合物或如权利要求15所述的递送系统在制备用于治疗与点突变相关或由点突变引起的疾病的药物中的用途。