CN116829706A

CN116829706A - 基于引导编辑的精确的基因组删除和替换方法

Info

Publication number: CN116829706A
Application number: CN202180089154.0A
Authority: CN
Inventors: J·A·申杜尔; W·陈; J·崔
Original assignee: University of Washington
Current assignee: University of Washington
Priority date: 2020-11-05
Filing date: 2021-11-04
Publication date: 2023-09-29
Also published as: JP2023549125A; EP4240840A1; AU2021376350A9; WO2022098885A1; US20240011055A1; AU2021376350A1

Abstract

公开了用于基因组编辑的方法和相关的组合物。一方面，编辑双链DNA(dsDNA)的方法使用分别对dsDNA分子的正义链和反义链上的第一靶序列和第二靶序列具有特异性的第一编辑复合物和第二编辑复合物。每种编辑复合物包含与融合编辑器蛋白相关联的延伸的向导RNA，所述融合编辑器蛋白包含功能性切口酶结构域和功能性逆转录酶结构域。各自的向导RNA将它们的相关的融合编辑器蛋白引导至dsDNA，其在dsDNA的相对链上实施单链断裂。各个逆转录酶结构域产生3'突出端。dsDNA的修复切除置于两个单链断裂之间的部分dsDNA。公开了所述方法的多种配置和应用，提供灵活、简便、有效和精确的方法来实行基因操作。

Description

基于引导编辑的精确的基因组删除和替换方法

相关申请的交叉引用

本申请要求2020年11月5日提交的第63/110,304号临时申请的权益，该临时申请的公开内容通过引用以其整体并入本文。

关于序列表的声明

与本申请相关的序列表以文本格式提供，替代纸质副本，并且特此通过引用并入说明书中。包含序列表的文本文件的名称为3915-P1162WOUW_Seq_List_FINAL_20211101_ST25.txt。文本文件为28KB，于2021年11月1日创建，并随同说明书的提交经由EFS-web提交。

政府许可权利的声明

本发明是在国立卫生研究院(the National Institutes of Health)授予的批准号为UM1 HG009408的政府支持下完成的。政府对发明拥有某些权利。

背景

精确地操作基因组的能力可以实现对特定基因组序列，包括基因和调节元件的功能的研究。在过去的十年中，基于CRISPR-Cas9的技术已证明在这方面是变革性的，实现对基因组基因座的精确靶向，具有快速扩展的编辑或干扰模式的所有组成部分。其中，特定基因组序列的精确和不受限制的删除是特别重要的，在功能性基因组学和基因疗法两者中都有使用事例。

目前，用于对基因组删除编程的主导方法使用一对CRISPR单向导RNA(sgRNA)，其中每个靶向一个前间隔序列邻近基序(PAM)序列，产生一对邻近的DNA双链断裂(DSB)。在同时切割两个位点后，细胞DNA损伤修复因子经常通过非同源末端连接(NHEJ)连接基因组的两个末端而没有间隔序列(图1A)。尽管该方法很有效，但它有几个局限：1)诱导删除，特别是更长的删除的尝试经常导致在一个或两个DSB附近的短插入或删除(插入删除(indel)；通常小于10-bp)，有或没有预期的删除；2)其它非预期的突变，包括大的删除和更复杂的重排可能频繁发生，并且由于技术原因而未被检测到；3)DSB是细胞毒性损伤；和4)通过该方法编程的基因组删除的连接点受到天然存在的PAM位点分布的限制。尽管有这些限制，各种研究已经采用该策略从而发挥很大的作用，例如研究基因和调节元件的功能，以及面向基因疗法。然而，有限的精确度、DSB毒性和不能对任意删除编程已经妨碍了CRISPR-Cas9诱导的删除在功能性和治疗基因组学中的应用。

最近已经描述了“引导编辑”，其以各种方式扩展CRISPR-Cas9基因组编辑工具包(https://paperpile.com/c/gGxRnW/t6ebl)。引导编辑利用引导编辑器-2(Prime Editor-2)酶，其是与逆转录酶融合的Cas9切口酶(Cas9H840A)，和3'延伸的sgRNA(引导编辑sgRNA或pegRNA)。按照pegRNA分子中的模板RNA序列，引导编辑器-2酶和pegRNA复合物可以在基因组的一条链产生切口，并将3'单链DNA flap连接至有切口的位点。通过将同源序列包括至相邻区域，DNA损伤修复因子可以将3'-flap序列结合到基因组中。使用另外的sgRNA可进一步提高结合率，所述另外的sgRNA在相对链上制造切口，用3'-flap序列促进DNA修复，但经常伴随精确度降低(策略被称为PE3/PE3b)(图1B)。引导编辑的优点在于其编码待被靶向的两个位点和单个分子pegRNA内的修复性质。PE3策略已经被用于表明单个pegRNA/sgRNA对可以用于对5至80bp范围的删除编程，以适度的精确度(平均11％的非预期插入删除的比率)实现高效率(52-78％)。然而，PE3策略还在对大于100bp的删除编程中面临重大困难。此外，观察到大于20bp的删除的效率急剧下降。

因此，尽管基因组编辑领域中有进展，但仍需要简便、有效和精确的方法来实行基因操作(例如，删除和插入)。当前的公开内容解决这些和相关的需求。

概述

提供该概述来以简化形式介绍在以下详细描述中进一步描述的一系列构思。该概述不旨在确认所要求保护的主题的关键特征，也不旨在被用于帮助确定所要求保护的主题的范围。

一方面，本公开内容提供一种编辑具有正义链和反义链的双链DNA(dsDNA)分子的方法。所述方法包括使dsDNA分子与对dsDNA分子的正义链上的第一靶序列具有特异性的第一编辑复合物和对dsDNA分子的反义链上的第二靶序列具有特异性的第二编辑复合物接触。第一编辑复合物和第二编辑复合物各包含融合编辑器蛋白和与其相关联的延伸的向导RNA分子。融合编辑器各包含功能性切口酶结构域和功能性逆转录酶结构域。第一编辑复合物的延伸的向导RNA分子包含具有第一序列的第一向导结构域和在3'末端的第一延伸的结构域，所述第一序列与第一靶序列杂交。第二编辑复合物的延伸的向导RNA分子包含具有第二序列的第二向导结构域和在3'末端的第二延伸的结构域，所述第二序列与第二靶序列杂交。所述方法还包括允许第一编辑复合物的功能性切口酶结构域和第二编辑复合物的功能性切口酶结构域分别在第一靶序列和第二靶序列处的dsDNA分子的相对链中产生第一单链断裂和第二单链断裂。接下来，所述方法包括允许第一编辑复合物的功能性逆转录酶结构域使用第一延伸的结构域作为模板从第一单链断裂产生第一3'突出端，并且允许第二编辑复合物的功能性逆转录酶结构域使用第二延伸的结构域作为模板从第二单链断裂产生第二3'突出端。最后，所述方法包括通过切除最初置于第一单链断裂和第二单链断裂之间的部分dsDNA，并将第一3'突出端和第二3'突出端结合到修复的dsDNA分子中来修复dsDNA分子。

在一些实施方案中，第一编辑复合物的功能性切口酶结构域和第二编辑复合物的功能性切口酶结构域独立地是CRISPR相关的(Cas)酶、激烈火球菌(Pyrococcus furiosus)Argonaute等，或源自它们的功能性切口酶结构域。在一些实施方案中，Cas是Cas9、Cas12、Cas13、Cas3、CasΦ等。在一些实施方案中，第一编辑复合物的功能性逆转录酶结构域和第二编辑复合物的功能性逆转录酶结构域独立地是M-MLV RT、HIV RT、II组内含子RT(TGIRT)、superscript IV等，或其功能性结构域。

在一些实施方案中，相比第二靶序列的反向互补序列，第一靶序列置于正义链中的更靠5'的位置。在一些实施方案中，相比第二靶序列的反向互补序列，第一靶序列置于正义链中的更靠3'的位置。在一些实施方案中，第一3'突出端和第二3'突出端是彼此的反向互补序列，并且在修复步骤中杂交。

在一些实施方案中，第一3'突出端包含第一修复结构域，所述第一修复结构域具有对应于反义链中紧靠第二3'突出端的5'的序列的序列，并且其中第二3'突出端包含第二修复结构域，所述第二修复结构域具有对应于正义链中紧靠第一3'突出端的5'的序列的序列。在一些实施方案中，第一3'突出端还包含第一修复结构域的5'的插入序列，并且其中第二3'突出端包含第二修复结构域的5'的插入序列的反向互补序列。

在一些实施方案中，第一3'突出端包含第一修复结构域，所述第一修复结构域具有对应于紧靠第二单链断裂的3'的序列的序列，并且其中第二3'突出端包含第二修复结构域，所述第二修复结构域具有对应于紧靠第一单链断裂的3'的序列的序列，由此修复步骤导致对应于最初置于第一单链断裂和第二单链断裂之间的部分dsDNA的序列的倒置。

在一些实施方案中，第一3'突出端包含第一修复结构域，所述第一修复结构域具有对应于插入DNA片段的第一末端结构域的序列，其中第二3'突出端包含第二修复结构域，所述第二修复结构域具有对应于插入DNA片段的第二末端结构域的序列，并且其中第一末端结构域和第二末端结构域在插入DNA片段的相对末端或在较大的dsDNA分子内的不同位点。

在一些实施方案中，被切除的最初置于第一单链断裂和第二单链断裂之间的部分dsDNA分子为至少5个核苷酸长。在一些实施方案中，被切除的最初置于第一单链断裂和第二单链断裂之间的部分dsDNA分子为约10个核苷酸至1000000个核苷酸长。

在一些实施方案中，第一编辑复合物和/或第二编辑复合物包含被配置成增强3'-突出端产生效率的另外的功能性结构域。在一些实施方案中，第一编辑复合物和/或第二编辑复合物的融合编辑器蛋白包含被配置成使用产生的3'突出端增强DNA修复效率的另外的功能性结构域。

在一些实施方案中，第一向导结构域和第二向导结构域独立地为约20至约200个核苷酸长。在一些实施方案中，第一向导结构域和第二向导结构域独立地为约25至100个核苷酸长、约25至50个核苷酸长，或者约25至40个核苷酸长。

在一些实施方案中，第一向导结构域和第二向导结构域被配置成分别与第一编辑复合物和第二编辑复合物相容，和/或在第一向导结构域和/或第二向导结构域中的一个或多个核苷酸残基用2'-O-甲基化、锁核酸、肽核酸、或类似的功能性修饰的核酸部分修饰。

在一些实施方案中，第一延伸的结构域和第二延伸的结构域独立地为至少约10个核苷酸长。在一些实施方案中，第一延伸的结构域和第二延伸的结构域独立地为约10个核苷酸至约40个核苷酸长。

在一些实施方案中，所述方法在体外细胞中进行。在一些实施方案中，所述方法在体内细胞中进行。在一些实施方案中，所述方法是治疗方法，其包括基因组序列的删除、倒置基因组序列、染色体间重排和/或将新序列插入基因组的靶区域或靶位点。

在一些实施方案中，所述方法被扩展以涵盖多对第一编辑复合物和第二编辑复合物以在dsDNA分子中的多个位置处实施编辑。所述方法可以包括使dsDNA与多对第一编辑复合物和第二编辑复合物接触，其中每对第一编辑复合物和第二编辑复合物靶向dsDNA内不同对的第一靶序列和第二靶序列。

在一些实施方案中，所述方法包括汇聚多个pegRNA或多个编码pegRNA的核酸分子，并使包含dsDNA分子的细胞与多个pegRNA或多个编码pegRNA的核酸分子的库接触。在一些实施方案中，所述方法还包括使细胞与一种或多种融合编辑器蛋白或编码一种或多种融合编辑器蛋白的一种或多种核酸分子接触，并允许融合编辑器蛋白在细胞内表达和/或复合。

另一方面，本公开内容提供在细胞中编辑一个或多个双链DNA(dsDNA)分子的方法。所述方法包括使细胞与一对或多对第一编辑复合物和第二编辑复合物、或编码一对或多对第一复合物和第二复合物的组分的一种或多种核酸接触，并允许所述组分在细胞中表达和组装。对于一对或多对第一编辑复合物和第二编辑复合物中的每一对，适用以下：

第一编辑复合物对dsDNA分子的正义链上的第一靶序列具有特异性，并且第二编辑复合物对dsDNA分子的反义链上的第二靶序列具有特异性；

第一编辑复合物和第二编辑复合物各包含融合编辑器蛋白和与其相关联的延伸的向导RNA分子，其中融合编辑器各包含功能性切口酶结构域和功能性逆转录酶结构域；

第一编辑复合物的延伸的向导RNA分子包含具有第一序列的第一向导结构域和在3'末端的第一延伸的结构域，所述第一序列与第一靶序列杂交；以及

第二编辑复合物的延伸的向导RNA分子包含具有第二序列的第二向导结构域和在3'末端的第二延伸的结构域，所述第二序列与第二靶序列杂交。

所述方法包括(对于每对第一编辑复合物和第二编辑复合物)允许第一编辑复合物的功能性切口酶结构域和第二编辑复合物的功能性切口酶结构域分别在第一靶序列和第二靶序列处的dsDNA分子的相对链中产生第一单链断裂和第二单链断裂；允许第一编辑复合物的功能性逆转录酶结构域使用第一延伸的结构域作为模板从第一单链断裂产生第一3'突出端，并且允许第二编辑复合物的功能性逆转录酶结构域使用第二延伸的结构域作为模板从第二单链断裂产生第二3'突出端；以及通过切除最初置于第一单链断裂和第二单链断裂之间的部分dsDNA并将第一3'突出端和第二3'突出端结合到修复的dsDNA分子中来修复dsDNA分子。

在一些实施方案中，所述方法包括使细胞与多对第一编辑复合物和第二编辑复合物、或编码多对第一复合物和第二复合物的组分的多种核酸接触，并允许所述组分在细胞中表达和组装。每对第一编辑复合物和第二编辑复合物靶向细胞中的一个或多个dsDNA分子上不同的第一靶序列和第二靶序列。

另一方面，本公开内容提供包含如本文描述的第一编辑复合物和第二编辑复合物的试剂盒，其中正义链上的第一靶序列和反义链上的第二靶序列被间隔序列分开。第一编辑复合物和第二编辑复合物被配置成在靶dsDNA分子中在由第一编辑复合物和第二编辑复合物诱导的第一和/或第二单链断裂处删除间隔序列、倒置间隔序列和/或插入一个或多个新序列。

附图说明

当结合附图时，通过参考以下详细描述，当该公开内容的前述方面和许多伴随的优点变得更好理解时，其将变得更容易认识，其中：

图1A-1H。使用PRIME-Del的精确的游离基因的删除。(1A-1C)Cas9/成对的sgRNA删除策略(1A)、PE3(1B)和PRIME-Del(1C)的示意图。对于1C中的PRIME-Del，一对pegRNA编码在预期删除的每个末端但在相对链上要产生切口的位点以及3'flap。在说明的实施方案中，3'flap包含与由其它pegRNA靶向的区域互补的序列。施加字母名称以指示flap如何与被靶向的dsDNA序列杂交并被整合到修复的、编辑的序列中。(1D)在游离基因编码的eGFP基因内编程的删除的卡通表示(未按比例绘制)。(1E)测量在HEK293T细胞中24-bp、91-bp和546-bp删除实验的PRIME-Del介导的删除效率和错误频率(有或没有预期的删除)(n＝5次重复转染的平均值)。测序读数被分类为没有插入删除修饰(“无编辑”)、没有预期删除的插入删除错误、有预期删除的插入删除错误和没有错误的正确删除。(1F)使用三种方法测量546-bp删除实验的PRIME-Del介导的删除效率(n＝3次重复转染的平均值±SD)。(1G)跨来自546-bp删除实验的测序读数的插入、删除和置换错误频率。将读数与没有删除(顶部)或有(底部)删除的参考序列比对。图来自采用UMI折叠的单端读数，以减少测序错误；图6E中还以另外的重复和错误类别特异性比例显示。注意，两个3'-DNA-flap中仅有一个被缺少删除的扩增子(标记为‘野生型’)中的测序读数覆盖。(1H)在合并成对的末端测序读数后，跨来自546-bp删除实验的扩增子的插入、删除和置换错误频率。

图2A-2F。使用PRIME-Del对删除和插入的并发编程。(2A)被配置成在断裂位点之间插入序列的PRIME-Del策略变型的示意图。被编码的3'flap包含与由其它pegRNA靶向的区域互补的序列，如图1C中，但也包含待插入的另外的序列。另外的序列以对应于对应3'flap对的反向互补形式呈现，使得它们在修复步骤期间退火，产生插入的dsDNA序列。对应区域用字母名称指示，特别是采用由B/b指定的插入序列。(2B)采用Cas9和sgRNA对的用于删除的常规策略。潜在的删除连接点受到PAM位点的天然分布的限制。(2C)pegRNA对被设计成编码大小范围为3至30bp的五个插入连同eGFP中的546bp删除。(2D)在使用这些pegRNA对在HEK293T细胞中诱导并发的删除和插入中估算的删除效率和插入删除错误频率(有或没有预期删除)(n＝3次重复转染的平均值)。(2E)跨来自并发的546-bp删除和30-bp插入条件的测序读数绘制的代表性插入、删除和置换错误频率。图来自没有UMI校正的单端读数。注意，两个3'-DNA-flap中仅有一个被缺少删除的扩增子(标记为‘野生型’)中的测序读数覆盖。(2F)包含编程的删除也包含编程的插入的读数的百分比(n≥3次重复转染的平均值±SD)。

图3A-3G。使用PRIME-Del的精确的基因组删除。(3A)产生eGFP整合的HEK293T细胞系的示意图。(3B)在使用PRIME-Del对HEK293T细胞中基因组整合的eGFP进行并发的删除和插入中估算的删除效率和错误频率(n＝3次重复转染的平均值)。(3C)跨来自并发的546-bp删除和30-bp插入条件的测序读数绘制的代表性插入、删除和置换错误频率，所述条件针对基因组整合的eGFP。图来自没有UMI校正的单端读数。(3D)HPRT1基因内编程的删除的卡通表示。(3E)在HEK293T细胞中使用PRIME-Del或Cas9/成对的sgRNA(缩写为Cas9)策略测量的118-bp和252-bp删除的删除效率，使用基于独特分子标识符的测序测定(UMI)或液滴数字PCR(ddPCR)测定定量(n＝3次重复转染的平均值±SD)。(3F)使用Cas9/成对的sgRNA策略，在HPRT外显子1处跨来自118-bp删除(左)和252-bp删除(右)的测序读数绘制的代表性插入、删除和置换错误频率。不同的错误类别的着色与(3C)中的相同。(3G)与(3F)相同，但用于PRIME-Del策略。

图4A-4E。跨基因组表征PRIME-Del。(4A)PRIME-Del(左)和Cas9/成对的sgRNA(右)方法的跨基因组的不同删除的估算的删除效率和插入删除错误频率(n＝3次重复转染的平均值)。使用基于UMI的测序测定用于定量(除了FMR1*的富含GC的扩增子，其中添加的DMSO干扰UMI加成反应)。(4B)序列倒置事件的示意图，其是在Cas9/成对的sgRNA介导的删除中的已知错误模式。(4C)PRIME-Del(左)和Cas9/成对的gRNA(右)方法的跨基因组的不同删除的估算的倒置频率(n＝3次重复转染的平均值)。注意，以可观的频率观察到它们中的所有Cas9/成对的sgRNA介导的删除，除了一个，但是实际上未观察到这十个使用PRIME-Del的删除中的任一个的倒置。(4D)在HEK293T细胞中，采用基于ddPCR的测定测量的使用PRIME-Del(左)或Cas9/成对的sgRNA(右)在HPRT1处1-kb和10-kb删除的删除效率(n＝3次重复转染的平均值±SD)。(4E)使用对删除扩增子的测序测量的采用PRIME-Del(左)或Cas9/成对的sgRNA(右)在HPRT1基因上1-kb和10-kb删除的具有精确删除的读数的分数(n＝3次重复转染的平均值±SD)。

图5。在各种基因组编辑应用中使用PRIME-Del的潜在优点。PRIME-Del策略可用于对精确的基因组删除编程，而不在Cas9靶序列处产生短插入删除错误。精确的删除与在删除连接点处插入短的任意序列的能力相结合，可以实现活性蛋白结构域的稳健基因敲除，而不产生过早的框内终止密码子，过早的框内终止密码子可以触发无义介导的衰变(NMD)途径。PRIME-Del也可以实现用任意序列，诸如表位标签或RNA转录起始位点替换高达10kb的基因组区域。当并行编辑多个区域时，在PRIME-Del期间产生的单链断裂很可能对细胞毒性较小，潜在地促进其多重化(multiplexing)。

图6A-6E。采用靶向游离基因编码的eGFP的PRIME-Del删除的错误分布图。(6A)扩增子测序的样品制备示意图。在第二步中，使用附加测序接头的两步PCR扩增从基因组DNA扩增被靶向用于删除的片段周围的区域。(6B-6D)跨24-bp删除(6B)、91-bp删除(6C)和546-bp删除(6D)的测序读数的插入、删除和置换错误频率。这些基于单末端测序，每个实验重复五次，所有的在一次运行中被测序，覆盖。注意，除了24-bp删除，两个3'-DNA-flap中仅有一个被缺少删除的扩增子(标记为‘野生型’)中的测序读数覆盖。Y轴缩放比例对于每幅图是不同的。(6E)在重复扩增以实现独特分子标识符(UMI)校正后，跨546-bp删除的错误频率。通过取共享相同UMI的最频繁序列，将由UMI识别的PCR重复折叠成单个读数。这些基于单末端测序，每个实验重复三次，所有的在一次运行中被测序，覆盖。Y轴缩放比例对于每幅图是不同的。

图7A-7C。在游离基因或基因组编码的eGFP处具有并发的删除和插入的错误分布图。(7A)跨靶向游离基因编码的eGFP，来自并发的546-bp删除和不同插入条件的测序读数绘制的插入、删除和置换错误频率。这些基于单末端测序，每个实验重复三次，所有的在一次运行中被测序，覆盖。注意，两个3'-DNA-flap中仅有一个被缺少删除的扩增子(标记为‘野生型’)中的测序读数覆盖。在切口位点(黑色虚线)和插入末端(红色虚线)之间突出显示对应于删除连接点处插入的读数内的位置。Y轴缩放比例对于每幅图是不同的。(7B)与(7A)相同，但用于靶向eGFP的基因组整合的拷贝的实验。(7C)包含编程的删除也包含编程的插入的读数的百分比。类似于图2F，但用于靶向eGFP的基因组整合的拷贝的实验。误差条代表至少三次重复转染的标准偏差。

图8A-8D。定量天然HPRT1基因上的删除效率和错误频率。(8A、8B)跨来自以下的测序读数绘制的插入、删除和置换错误频率：(8A)使用Cas9/成对的gRNA策略在HPRT1上的118-bp或252-bp删除，(B)使用PRIME-Del策略在HPRT1上的118-bp或252-bp删除。与用于HPRT1条件的‘删除’参考比对的测序读数基于成对的末端测序，而所有其它条件基于单末端测序。每个实验在一次运行中对三次重复进行测序、覆盖。注意，两个3'-DNA-flap中仅有一个被缺少删除的扩增子(标记为‘野生型’)中的测序读数覆盖，并且y轴缩放比例对于每个插入、删除和置换图是不同的。(8C、8D)用于以下的液滴数字PCR(ddPCR)测定中的液滴荧光水平：(C)118-bp删除和(D)252-bp删除。FAM阳性液滴(检测精确的删除；上图)与HEX阳性液滴(检测基因组DNA浓度；下图)的比率用于测量采用PRIME-Del(左边三个孔)和Cas9/成对的gRNA(中间三个孔)方法的删除效率。对于每个探针组，运行阴性对照(NTC)以确保来自精确的删除的特异性信号。注意，相比HEX通道，FAM通道中的分离不太清楚(在阴性水平和阳性水平之间具有更显著的“降雨”模式)，可能是由于液滴内的PCR扩增效率低。该现象在Cas9/成对的gRNA样品中更明显，可能是由于如前描述的FAM探针退火到具有短(1bp)错配的删除连接点(Watry等人，Rapid,precise quantification of large DNA excisionsand inversions by ddPCR,Scientific Reports 2020)。

图9A-9H。在HPRT1外显子1的PRIME-Del编辑后的罕见长插入。(9A)进行对源自PRIME-Del编辑的HPRT1基因座的扩增子的成对的末端测序，以双向覆盖删除连接点，并使用15-bp UMI序列促进PCR重复的去除。这揭示了经检查看起来是两个3'flap序列的嵌合体的重复发生的长插入，在它们的富含GC的末端具有重叠(以紫色突出显示)。这里显示的是来自118-bp删除条件的代表性插入。指示了序列标识符。(9B-9D)采用Cas9/成对的gRNA的HPRT1 118-bp删除(9B)、采用PRIME-Del的HPRT1 118-bp删除(9C)或采用PRIME-Del的eGFP546-bp删除(9D)的插入序列长度的直方图。红色垂直线表示平均插入长度。(9E)与(9A)相同，但代表性插入来自252-bp删除条件，也是两个3'flap序列的嵌合体，在它们的富含GC的末端具有重叠。指示了序列标识符。(9F、9G)采用PRIME-Del(9F)或Cas9/成对的gRNA(9G)的HPRT1 252-bp删除的插入序列长度的直方图。(9H)采用PRIME-Del的长插入的潜在机制。成对的pegRNA的3'-flap的富含GC的末端(在118-bp删除的情况下为GCCCT，在252-bp删除的情况下为CGGC)退火至彼此，或退火至另一个富含GC的延伸，导致修复后的插入。

图10A-10E。PRIME-Del效率和准确性取决于同源臂长度。(10A)成对的pegRNA可以采用不同的RT模板长度来设计，这有效地改变同源臂长度以引导PRIME-Del中的编辑。(10B、10C)HPRT1外显子1的(10B)118-bp和(10C)252-bp删除使用不同同源臂长度得到的删除效率，相对于标准设计(32-bp RT模板；用于图3A-3G)归一化(n＝3次重复转染的平均值±SD)。使用来自在eGFP上进行546-bp删除得到的非同源RT模板序列(用于图1A-2F；表示为30/30eGFP)不导致删除。(10D、10E)HPRT1外显子1的(10D)118-bp和(10E)252-bp删除使用不同同源臂长度得到的PRIME-Del中的长插入频率，相对于标准设计归一化(n＝3次重复转染的平均值±SD)。

图11A-11C。汇聚的使用PRIME-Del的删除。(11A)在HPRT1基因内编程的、汇聚在一起用于转染的四个删除的卡通表示。(11B)在HEK293T细胞中使用PRIME-Del对HPRT1基因的3个重叠删除(118、252和469bp)的删除效率和错误频率。分别绘制三次重复转染。(11C)在单删除(左边三个孔)和汇聚的PRIME-Del(中间三个孔)之间比较1064-bp删除效率。对于三次重复转染而言，估算的在汇聚的PRIME-Del中的1064-bp删除的编辑效率为1.7％、1.9％和2.0％。

图12A-12F。延伸编辑时间窗口增强引导编辑和PRIME-Del效率。(12A)经由两步基因组整合稳定表达引导编辑器-2酶和pegRNA两者的示意图。(12B、12C)测量的在K562(PE2)细胞(12B)或HEK293T(PE2)细胞(12C)中，使用PRIME-Del(成对的pegRNA构建体)在基因组HPRT1外显子1处118-bp和252-bp删除的编辑效率或使用引导编辑(单pegRNA构建体)的CTT插入的编辑效率，作为在(多个)pegRNA初始转导后的时间的函数(n＝3次重复转染的平均值±SD)。(12D)测量的使用PRIME-Del(成对的pegRNA构建体)在基因组HPRT1外显子1处118-bp和252-bp删除的编辑效率或使用引导编辑(单pegRNA构建体)的CTT插入的编辑效率，作为在(多个)pegRNA初始转导后的时间的函数。将携带成对的pegRNA和引导编辑器-2酶的质粒3次(第0、9、18天；以黄色突出显示)转染到表达引导编辑器-2酶的HEK293T细胞(n＝3次重复转染的平均值±SD)。(12E)与(12A)相同，但是首先在第0天经由piggyBAC转座子系统将pegRNA整合到表达PE2的HEK293T(以绿色突出显示)，接着仅在第9和18天对携带引导编辑器-2酶的质粒进行两次另外的转染(以黄色突出显示)(n＝3次重复转染的平均值±SD)。(12F)(12C)中显示的实验的第二次重复，其中测量使用PRIME-Del在HPRT1外显子1处的118-bp和252-bp删除的删除效率，作为在(多个)pegRNA初始转导后的时间的函数(n＝3次重复转染的平均值±SD)。

图13示意性地说明被配置成在去除间隔序列后在断裂位点之间插入序列的PRIME-Del的实施方案。3'flap具有待插入的序列，每个flap(A和a)具有反向互补形式的序列，使得它们在修复步骤期间退火，导致在修复步骤之后被插入的dsDNA序列。对应区域用字母名称A/a指示。

图14示意性地说明了被配置成环化dsDNA片段的PRIME-Del的实施方案。相比对应于反义正义链(底部链)的第二靶序列的正义链中的反向互补序列，第一靶序列(顶部链)置于沿正义链更靠3'的位置。在该实施方案中，第一3'突出端flap(B)和第二3'突出端flap(a)指向外面并且彼此远离。在该取向上，修复导致在单链断裂的任一侧上(多个)dsDNA片段的切除，保留置于正义链的第一单链断裂和第二链中的第二单链断裂之间的部分dsDNA序列。在该被说明的实施方案中，每个3'flap(B和a)包含与被其它pegRNA靶向的保留的dsDNA区域互补的序列，如图1C中，尽管可以包括另外的插入序列或完全置换另外的插入序列，分别诸如图2A和13中。

详细描述

目前的删除基因组序列的方法基于CRISPR-Cas9和单向导RNA(sgRNA)对，但可能是低效率和不精确的，具有包括小插入删除以及非预期的大删除和更复杂的重排的错误。该公开内容提供一种基于引导编辑的方法，被称为“PRIME-Del”，其使用靶向相对DNA链的一对引导编辑sgRNA(pegRNA)诱导删除。pegRNA不仅对产生切口的位点编程，而且对修复的结果编程。如下文更详细描述的，相比CRISPR-Cas9和sgRNA对，PRIME-Del在对高达10kb的删除编程中实现显著更高的精确度，具有1-30％的编辑效率。PRIME-Del也可用于将基因组删除和插入结合，实现其连接点不落在前间隔序列邻近基序(PAM)位点的删除。最后，引导编辑组分的延伸表达可以在不损害精确度的情况下显著地提高效率。PRIME-Del将广泛地用于可靠、精确和灵活的对基因组删除和插入的编程，用于表位标记，和用于对基因组重排的编程。

根据前述，一方面，本公开内容提供一种编辑双链DNA(dsDNA)分子的方法。靶dsDNA的特征可以在于具有正义链和反义链，所述正义链和反义链具有通常为彼此的反向互补序列的序列。相对的链通过沃森-克里克(Watson-Crick)碱基配对相互杂交，赋予经典的双螺旋构型的dsDNA分子的稳定性。采用本发明的方法可以靶向任何dsDNA分子。示例性dsDNA是来自任何细胞、生物体或病毒的基因组DNA。在一些实施方案中，dsDNA是来自人细胞的基因组DNA。术语“正义和反义”可以任意地指定给任一链，并且除非另外指出，否则仅用于彼此区分相对的链。

所述方法包括使dsDNA分子与至少一对编辑复合物接触。所述对中的每个编辑复合物基于先前由Anzalone等人，Search-and-replace genome editing without double-strand breaks or donor DNA.Nature 576,149-157(2019)和Lin,Q.等人，Prime genomeediting in rice and wheat.Nat.Biotechnol.38,582–585(2020)公开的引导编辑构建体，其中每一篇都通过引用以其整体明确地并入本文。如下文更详细解释和图1B中说明的，引导编辑利用与逆转录酶融合的具有切口酶能力的编辑器酶。引导编辑构建体还包括3'-延伸的sgRNA，也被称为引导编辑sgRNA或pegRNA。当结合时，pegRNA赋予对靶序列的结合特异性，并且融合编辑器在dsDNA分子的一条链产生切口(即，引起连接相邻核苷酸的磷酸二酯键的断裂)。通过融合编辑器蛋白的转录酶结构域对pegRNA的一部分进行逆转录，将3'单链DNA flap连接至有切口的位点。

然而，在公开的方法中，使用一对编辑复合物，其中的每一个都特异性靶向相对链上的部分dsDNA。图1C中提供说明所述方法的一些实施方案的综述。特别地，dsDNA与第一编辑复合物和第二编辑复合物接触。第一编辑复合物对dsDNA分子的正义链上的第一靶序列具有特异性，并且第二编辑复合物对dsDNA分子的反义链上的第二靶序列具有特异性。术语“对……具有特异性”意指编辑复合物包含在正常条件下可以选择性地结合(例如，杂交于)靶序列的结构元件(例如，RNA序列)。第一编辑复合物和第二编辑复合物各独立地包含融合编辑器蛋白和与其相关联的延伸的向导RNA分子。

注意，为了简单起见，本说明书在单对编辑复合物的通常语境下说明编辑复合物的组分、它们的实施以及它们的用途。然而，该公开内容还涵盖包括使用多个编辑复合物对的实施方案。对于这些实施方案，将理解每个编辑复合物对可以与其他编辑复合物对不同，从而导致不同的靶向和/或编辑功能性。例如，赋予编辑复合物的特异靶向性的结构(下文描述的)可以在编辑复合物对之间变化。结果是在相同dsDNA分子中的多个靶位置处或在相同环境中的不同dsDNA分子中(例如，在相同细胞的不同染色体中)实施多个、不同的编辑。鉴于以下描述，如何采用多对编辑复合物来实施多重化的编辑将变得显而易见。例如通过仅汇聚不同的延伸的向导RNA分子(或编码延伸的向导RNA分子的核酸序列)，使得它们可以与融合编辑器蛋白复合，其中融合编辑器蛋白可以全部相同或不同。

一般而言，融合编辑器蛋白各包含相对于彼此处于任何取向的功能性切口酶结构域和功能性逆转录酶结构域，只要它们保持其功能性能力(如下文描述的)。将理解的是，对于第一编辑复合物和第二编辑复合物，各自的功能性切口酶结构域和功能性逆转录酶结构域可以相同或不同，只要它们保留其功能性能力。各个延伸的向导RNA分子的一般组织包含向导结构域和在3'末端延伸的结构域，所述向导结构域包含与dsDNA中期望的靶序列杂交的序列，所述在3'末端延伸的结构域具有被结合到被编辑的DNA中或以其它方式促进期望的修复模式的期望的序列。在一些实施方案中，第一和/或第二延伸的结构域包含两个亚结构域。第一亚结构域包含与有切口的链杂交的引物结合序列(PBS)。第一亚结构域在延伸的结构域(并且通常也是整个延伸的向导RNA分子)的3'-端。第二亚结构域包含逆转录模板(RTT)，其用作3'突出端的模板，使得其从RNA被逆转录为DNA以添加3'突出端。RTT在PBS和向导结构域之间。RTT序列是3'突出端的反向互补序列。

在许多实施方案中，第一编辑复合物和第二编辑复合物各自的延伸的向导RNA分子根据它们各自的靶序列或3'末端序列而包含不同的序列。更具体地，第一编辑复合物的延伸的向导RNA分子包含具有第一序列的第一向导结构域和在3'末端的第一延伸的结构域，所述第一序列与第一靶序列杂交。第二编辑复合物的延伸的向导RNA分子包含具有第二序列的第二向导结构域和在3'末端的第二延伸的结构域，所述第二序列与第二靶序列杂交。

在第一编辑复合物和第二编辑复合物与dsDNA分子中它们各自的靶点特异性结合后，所述方法包括允许第一编辑复合物的功能性切口酶结构域和第二编辑复合物的功能性切口酶结构域分别在第一靶序列和第二靶序列处的dsDNA分子的相对链中产生第一单链断裂和第二单链断裂(例如，切口)。在一些实施方案中，第一编辑复合物的功能性切口酶结构域在第一靶序列内(例如，在前间隔序列邻近基序(PAM)序列上游约3个碱基内)的正义链上产生切口。类似地，在一些实施方案中，第二编辑复合物的功能性切口酶结构域在第二靶序列内(例如，在前间隔序列邻近基序(PAM)序列上游约3个碱基内)的反义链上产生切口。

在分别由正义链和反义链上的第一编辑复合物和第二编辑复合物(即，经由各自的切口酶结构域)诱导第一单链断裂和第二单链断裂之后，所述方法包括允许第一编辑复合物的功能性逆转录酶结构域使用第一延伸的结构域作为模板从第一单链断裂产生第一3'突出端。类似地，所述方法包括允许第二编辑复合物的功能性逆转录酶结构域使用第二延伸的结构域作为模板从第二单链断裂产生第二3'突出端。

在第一切口和第二切口处分别延伸第一3'突出端和第二3'突出端后，dsDNA分子被修复。修复的结果可以取决于第一和第二靶序列的相对位置，并因此取决于第一断裂和第二断裂的相对取向和所导致的第一3'突出端和第二3'突出端的定位。为了说明这些构型，相对位置可以以正义链的5'至3'轴的语境来表达。在一个实施方案中，相比对应于反义正义链的第二靶序列的正义链中的反向互补序列，第一靶序列置于沿正义链的更靠5'的位置。在图1C中说明该实施方案。在该实施方案中，第一3'突出端和第二3'突出端指向内部并且朝向彼此。在该取向中，dsDNA修复导致最初置于正义链的第一单链断裂和第二链中的第二单链断裂之间的部分dsDNA的切除。第一3'突出端和第二3'突出端被整合到修复的dsDNA分子中。图1C中说明该修复方案的实施方案。在一些实施方案中，在该过程期间，两个3'突出端可经由先天的细胞DNA损伤修复能力被进一步延伸。

在一个供选择的实施方案中，相比对应于反义正义链的第二靶序列的正义链中的反向互补序列，第一靶序列置于沿正义链的更靠3'的位置。在该实施方案中，第一3'突出端和第二3'突出端指向外部并且彼此远离。以该取向，修复导致单链断裂任一侧上的(多个)dsDNA片段的切除，保留置于正义链的第一单链断裂和第二链中的第二单链断裂之间的部分dsDNA序列。第一3'突出端和第二3'突出端可被整合回到修复的dsDNA分子中，从而使置于正义链的第一单链断裂和第二链中的第二单链断裂之间的部分dsDNA序列环化。图14是表示使用PRIME-del的该环化过程的实施方案的示意图。

在一些实施方案中，第一3'突出端和第二3'突出端各包含是彼此的反向互补序列并且在修复步骤中杂交的核酸序列。图13中提供该实施方案的表示。先前存在于两个单链断裂点之间的部分dsDNA在修复期间被切除。具有反向互补序列的两个突出端杂交，并产生被功能性地插入dsDNA中代替切除的部分的双链分子。这导致置于第一单链断裂“上游”的原始dsDNA分子序列和第二单链断裂“下游”(相对于正义链方向)的原始dsDNA分子序列之间的插入序列。

在其他实施方案中，第一3'突出端包含第一修复结构域，所述第一修复结构域具有对应于邻近反义链中第二3'突出端且紧靠其5'的序列的序列。类似地，第二3'突出端包含第二修复结构域，所述第二修复结构域具有对应于邻近正义链中第一3'突出端且紧靠其5'的序列的序列。在该实施方案中，在修复步骤期间，相对链中的第一3'突出端和第二3'突出端彼此越过，并与邻近相对断裂点的剩余dsDNA部分杂交。图1C中说明该实施方案的一个版本。

在另外的实施方案中，突出端序列可包含多个序列，例如对应于促进修复的部分dsDNA的序列和构成将作为新序列被结合的新序列的序列。例如，第一3'突出端可进一步包含置于第一修复结构域的5'的插入序列。类似地，第二3'突出端包含对应的插入序列，即，第一3'突出端中的插入序列的反向互补序列，并且其置于第二3'突出端内的第二修复结构域的5'。在修复期间，两个插入序列结构域杂交。第一3'突出端的第一修复结构域越过第二断裂点，并与邻近第二断裂点的剩余dsDNA部分杂交。类似地，第二3'突出端的第二修复结构域越过第一断裂点，并与邻近第一断裂点的剩余dsDNA部分杂交。图2A中说明该实施方案的一个实例。

所述方法包括可以通过设计突出端序列来实施的其它变型。例如，所述方法可以以倒置位于第一靶结构域和第二靶结构域之间的序列取向的方式来实施。在实施这样的倒置的一个实施方案中，第一3'突出端包含第一修复结构域，所述第一修复结构域具有对应于紧靠第二单链断裂(即，在反义链中)的3'的序列的序列。类似地，第二3'突出端包含第二修复结构域，所述第二修复结构域具有对应于紧靠第一单链断裂(例如，在正义链中)的3'的序列的序列。另外说明的是，3'突出端各含有与插入dsDNA片段的相对端杂交的序列。结果，修复步骤导致对应于最初置于第一单链断裂和第二单链断裂之间的部分dsDNA的序列的倒置。在一些实施方案中，第一修复结构域具有与紧靠第二单链断裂的3'的序列相同(或基本上相同)的序列。类似地，在一些实施方案中，第二修复结构域具有与紧靠第一单链断裂的3'的序列相同(或基本上相同)的序列。

在一些实施方案中，所述方法可用于在靶dsDNA分子中的第一靶结构域和第二靶结构域之间插入来自外源的DNA片段(“插入DNA片段”)。被插入的插入DNA片段可以是线性DNA片段或源自环状DNA分子。为了促进插入，第一3'突出端包含第一修复结构域，所述第一修复结构域具有对应于插入DNA片段的第一结构域的序列。类似地，第二3'突出端包含第二修复结构域，所述第二修复结构域具有对应于插入DNA片段的第二末端结构域的序列。第一结构域和第二结构域可以是在插入DNA片段的相对末端处的末端结构域。供选择地，第一结构域和第二结构域中的一个或两个在最终含有插入DNA片段的较大dsDNA分子内的不同位点，例如内部位点处。在该供选择的实施方案中，第一结构域和第二结构域限定较大外部dsDNA源分子内的部分插入DNA片段的末端。

如下文所示，可以利用所述方法的各种实施方案从靶dsDNA分子中删除宽范围大小的内部dsDNA片段。所公开的方法可用于删除几乎任何长度的间隔序列，例如从短至约5或10个核苷酸至长至约1百万个核苷酸或更长，尽管反应在较长删除时可能表现出效率的一些降低。为了说明，在一些实施方案中，被切除的最初置于第一单链断裂和第二单链断裂之间的部分dsDNA为约5个核苷酸至约1百万个核苷酸、约10个核苷酸至约900000个核苷酸、约10个核苷酸至约800000个核苷酸、约10个核苷酸至约700000个核苷酸、约10个核苷酸至约700000个核苷酸、约10个核苷酸至约600000个核苷酸、约10个核苷酸至约500000个核苷酸、约10个核苷酸至约400000个核苷酸、约10个核苷酸至约300000个核苷酸、约10个核苷酸至约200000个核苷酸、约10个核苷酸至约100000个核苷酸、约10个核苷酸至约90000个核苷酸、约10个核苷酸至约80000个核苷酸、约10个核苷酸至约70000个核苷酸、约10个核苷酸至约60000个核苷酸、约10个核苷酸至约50000个核苷酸、约10个核苷酸至约40000个核苷酸、约10个核苷酸至约30000个核苷酸、约10个核苷酸至约20000个核苷酸、约10个核苷酸至约10000个核苷酸、约10个核苷酸至约9000个核苷酸、约10个核苷酸至约8000个核苷酸、约10个核苷酸至约7000个核苷酸、约10个核苷酸至约6000个核苷酸、约10个核苷酸至约5000个核苷酸、约10个核苷酸至约4000个核苷酸、约10个核苷酸至约3000个核苷酸、约10个核苷酸至约2000个核苷酸、约10个核苷酸至约1000个核苷酸，或其中的任何子范围。例如，被切除的最初置于第一单链断裂和第二单链断裂之间的部分dsDNA的长度为至少5个核苷酸，诸如长度为约5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000或更多个核苷酸，或者其中任何数量或范围。

在一些实施方案中，第一向导结构域和第二向导结构域独立地为约15至约200个核苷酸长。在示例性、非限制性实施例中，第一向导结构域和第二向导结构域独立地为约核苷酸长、约15至150个核苷酸长、约15至125个核苷酸长、约15至75个核苷酸长、约15至50个核苷酸长、约15至40个核苷酸长、约15至30个核苷酸长、约15至25个核苷酸长、约15至20个核苷酸长、约20至200个核苷酸长、约20至175个核苷酸长、约20至150个核苷酸长、约20至125个核苷酸长、约20至100个核苷酸长、约20至75个核苷酸长、约20至50个核苷酸长、约20至40个核苷酸长、约20至30个核苷酸长、约20至25个核苷酸长、约25至50个核苷酸长、约25至40个核苷酸长、约25至30个核苷酸长，以及其中任何数目或子范围。说明性的长度包括约18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200个核苷酸长。

在一些实施方案中，第一向导结构域和第二向导结构域中的一个或两个被配置成分别与第一编辑复合物和第二编辑复合物相容。在该上下文中，“相容”是指向导结构域被融合编辑器蛋白识别以形成编辑复合物的能力。例如，在一些实施方案中，(多个)向导结构域可以包含一个或多个采用2'-O-甲基化、锁核酸、肽核酸或类似的功能性修饰的核酸部分修饰的核苷酸残基。已知这些说明性修饰和其它修饰在引导编辑中促进识别和与融合编辑器蛋白的关联，并且被当前的公开内容涵盖。

第一延伸的结构域和第二延伸的结构域可以独立地为至少约10个核苷酸长。任一延伸的结构域的长度的任何实际上限很可能由基于引导编辑的方法中功能性逆转录结构域从延伸的结构域模板产生3'突出端的能力来规定。这样的功能性逆转录结构域可以容易地逆转录1000-2000个核苷酸长度。因此，延伸的结构域的长度可以独立地为约10至约2000个核苷酸。对于某些应用，延伸的结构域处于范围的较短端点可能是更典型的。说明性、非限制性范围包括约10至500个核苷酸长、约10至400个核苷酸长、约10至300个核苷酸长、约10至200个核苷酸长、约10至100个核苷酸长、约10至75个核苷酸长、约10至50个核苷酸长、约10至40个核苷酸长、约10至30个核苷酸长、和约10至20个核苷酸长，或其中的任何长度或子范围。说明性的长度包括约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200个核苷酸长。

应当理解，在一些实施方案中，第一延伸的向导RNA分子和/或第二延伸的向导RNA分子可被工程化以包括另外的功能性结构域。例如，(第一和/或第二)延伸的向导RNA分子可以进一步包含有助于3'-突出端产生效率的结构域。在一个实施方案中，延伸的向导RNA已经在3'末端(即，在本文描述的延伸的结构域中)结合了结构化RNA基序，其增强它们的稳定性并防止3'延伸的降解。这样的“抗降解”结构基序描述于例如Nelson,J.W.等人，Engineered pegRNA improve prime editing efficiency.Nat Biotechnol pp.1-9(2021)，其通过引用以其整体并入本文，并且包括修饰的前辫苷(prequeosine)1-1核糖开关适体(evopreQ1；Roth,A.等人，Ariboswitch selective for the queuosine precursorpreQ1 contains an unusually small aptamer domain.Nat.Struct.Mol.Biol.14,308–317(2007)；和Anzalone,A.V.等人，Reprogramming eukaryotic translation withligand-responsive synthetic RNA switches.Nat.Methods 13,453–458(2016)，其中每一篇通过引用以其整体并入本文)和假结(例如，来自莫洛尼(Moloney)鼠白血病病毒)。

功能性切口酶结构域可以是催化靶dsDNA序列中的单链断裂的任何功能性结构域。为了说明，本公开内容所涵盖的功能性切口酶结构域的实例包括CRISPR相关的(Cas)酶、激烈火球菌(Pyrococcus furiosus)Argonaute等，或源自其的功能性切口酶结构域。在一些实施方案中，切口酶结构域源自已经被修饰，诸如用以消除双链核酸酶功能性的酶。在该方面有用的Cas酶的非限制性实例包括Cas9(dCas9或nCas9)、Cas12、Cas13、Cas3、CasΦ等。参见，例如Pauch,P等人，CRISPR-CasΦfrom huge phages is a hypercompact genomeeditor,Science,369(6501):333-337(2020)，和WO2020/191242，其中每一篇通过引用以其整体并入本文。编码有用的Cas9(具有用于切口酶能力的H804A修饰)和具有5个点突变的M-MLV-rt的质粒序列可在Addgene保藏机构获得，目录号132775。其它有用的Cas9序列、结构和对该公开内容有用的优化是本领域中已知的。Cas9核酸酶序列和结构是本领域技术人员熟知的(参见，例如Ferretti等人，Complete genome sequence of an Ml strain ofStreptococcus pyogenes,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001)；DeltchevaE.等人，CRISPR RNA maturation by trans-encoded small RNA and host factor RNaseIII.Nature 471:602-607(2011)；和Jinek M.等人，Aprogrammable dual-RNA-guided DNAendonuclease in adaptive bacterial immunity.Science337:816-821(2012)，其中每一篇通过引用以其整体并入本文)。另外，Cas(例如Cas9)直系同源物已在各种物种中被描述，包括但不限于化脓性链球菌(S.pyogenes)和嗜热链球菌(S.thermophilus)。如所指出的，切口酶结构域可以包含修饰以确保结构域不实行双链断裂而是实行单链断裂。示例性修饰包括使酶结构域(例如Cas9核酸酶)中的一个核酸酶结构域(多个核酸酶结构域中的一个)失活，仅留下实行单链断裂的能力。

融合编辑器结构域还包含功能性逆转录酶(RT)结构域。功能性RT结构域可以是催化逆转录反应的任何功能性结构域。“逆转录酶”一般指一类聚合酶，其特征为RNA依赖性DNA聚合酶。历史上，逆转录酶已经被主要用于将mRNA转录成cDNA，然后可将cDNA克隆到载体中用于进一步操作，并且许多这样的酶(及其功能性结构域)是已知的并且被本公开内容涵盖。例如，禽成髓细胞瘤病毒(AMV)逆转录酶是第一个广泛使用的RNA依赖性DNA聚合酶(Verma,Biochem.Biophys.Acta 473:1(1977))。核糖核酸酶H是一种对RNA-DNA杂交体的RNA链具有特异性的进行性5'和3'核糖核酸酶(Perbal,A Practical Guide to MolecularCloning,New York:Wiley&Sons(1984))。另一种在分子生物学中广泛使用的逆转录酶是来源于莫洛尼鼠白血病病毒(M-MLV)的逆转录酶。参见，例如，Gerard,G.R.,DNA 5:271-279(1986)和Kotewicz,M.L.等人，Gene 35:249-258(1985)。基本上缺失核糖核酸酶H活性的M-MLV逆转录酶也已经被描述。参见，例如，第5,244,797号美国专利。在其它示例性、非限制性实施方案中，功能性逆转录酶结构域包括HIV RT、II组内含子RT(TGIRT)(参见，例如，InGex,St.Louis,MO)、superscript IV(例如，来自ThermoFisher Scientific,Waltham,MA)等，或其功能性结构域。Anzalone,A.V等人，Search-and-replace genome editingwithout double-strand breaks or donor DNA.Nature 576,149–157(2019)描述具有当前的公开内容所涵盖的功能性切口酶和RT结构域的融合蛋白，其通过引用以其整体并入本文。例如，野生型M-MLV RT和工程化的M-MLV RT结构域可以是有用的实施方案。此外，工程化的RT结构域可以改善本文公开的引导编辑和引导删除。WO2020/191242描述有用的RT结构域的另外的实例，WO2020/191242以其整体并入本文。该公开内容考虑使用任何这样的逆转录酶、其变体、突变体或片段。

在一些实施方案中，融合编辑器蛋白可包含另外的功能性结构域。例如，另外的功能性结构域可以是功能性酶结构域，诸如DNA修复蛋白结构域。在融合编辑器蛋白中包括DNA修复结构域可以增强在产生3'突出端后的DNA修复效率。这样的结构域的说明性、非限制性实例是来自Rad15的功能性DNA结合结构域或其同源物。参见，例如Song,M.等人，Generation of a more efficient prime editor 2by addition of the Rad51DNA-binding domain.Nat Commun 12,5617(2021)，通过引用以其整体并入本文。

所公开的方法可用于完成对被特异性靶向的dsDNA分子的许多修饰，诸如以完成删除、与插入组合的删除、间隔序列的倒置、序列的易位(例如，染色体间重排)、将框架保留编程到序列中、进入由于没有合适的PAM序列而不能用常规的基于CRISPR的方法进入的删除边界。所公开的方法可以在细胞中，例如在培养物中维持的细胞中进行。供选择地，前述方法可在体内进行。例如，所述方法可以是治疗方法，其包括基因组序列的删除、倒置基因组序列、染色体间重排和/或将新序列插入基因组的靶区域或靶位点。在治疗性实施方案中，根据本领域标准和已知的实践配制组合物用于适当的给予(例如全身性)。

编辑复合物可以被直接递送至细胞，或者可以以结合到用于细胞递送和表达的合适载体中的编码核酸的形式递送/给予。因此，在一些实施方案中，所述方法包括将一种或多种编码融合编辑器蛋白和编码延伸的向导RNA分子的多核苷酸，诸如结合到一种或多种载体中的一种或多种编码融合编辑器蛋白和编码延伸的向导RNA分子的多核苷酸、其一种或多种转录物和/或一种或多种由其转录的蛋白递送至靶细胞。合适的病毒和非病毒载体系统是已知的，并且可以由本领域普通技术人员实施。例如，示例性的非病毒载体递送系统包括DNA质粒、RNA(例如本文描述的载体的转录物)、裸核酸和与递送载体诸如脂质体复合的核酸。核酸的非病毒递送包括脂转染、核转染、显微注射、生物弹道、病毒体、脂质体、免疫脂质体、聚阳离子或脂质核酸缀合物、裸DNA、人工病毒体和药物增强的DNA摄取。

病毒载体递送系统包括DNA和RNA病毒，其在递送至细胞后具有游离基因的或整合的基因组。使用用于递送核酸的基于RNA或DNA病毒的系统利用高度进化的过程，用于将病毒靶向到体内的特定细胞并将病毒有效负载转移到细胞核。病毒载体可以直接给予患者(体内)，或者它们可以用于体外处理细胞，并且修饰的细胞可以任选地给予患者(离体)。常规的基于病毒的系统可包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒和单纯疱疹病毒载体。采用逆转录病毒、慢病毒和腺相关病毒基因转移方法在宿主基因组中整合是可能的，经常导致被插入的转基因的长期表达。就描述的编辑复合物、或融合编辑器和延伸的向导RNA组分(或编码核酸)的递送和配制策略而言，WO2020/191242中描述了各种适于在本方法中实施的递送和配制策略，其全部内容通过引用并入本文。

另一方面，本公开内容提供一种试剂盒。试剂盒包含本文描述的组合物的任何组合。在一些实施方案中，试剂盒包含如本文描述的一对不同的编辑复合物(即，第一编辑复合物和第二编辑复合物)、编码第一融合编辑器蛋白和第二融合编辑器蛋白和/或第一延伸的向导RNA分子和第二延伸的向导RNA分子的一种或多种核酸、或包含所述核酸的一种或多种载体。如上文描述的，第一编辑复合物和第二编辑复合物分别凭借第一延伸的向导RNA分子和第二延伸的向导RNA分子的第一向导结构域和第二向导结构域而对靶dsDNA分子上的第一靶序列和第二靶序列具有特异性。第一靶序列在靶dsDNA的正义链上，并且第二靶序列在dsDNA的反义链上。两个靶序列被间隔序列分开。如上文更详细地描述的，第一编辑复合物和第二编辑复合物被配置成在靶dsDNA分子中在由第一编辑复合物和第二编辑复合物诱导的第一单链断裂处和/或第二单链断裂处删除间隔序列、倒置间隔序列和/或插入一个或多个新序列。试剂盒还可以任选地包含各种缓冲液和试剂以促进本文描述的反应。例如，试剂盒可以包含dNTP、核糖核酸酶抑制剂、辅因子(例如MgCl₂)等。

在一些实施方案中，试剂盒可以包括一个或多个容器，其包含用于进行本文描述的基本方法的各种组分。在适用的情况下，试剂盒的每种组分可以以液体形式(例如溶液)或固体形式(例如粉末的或冻干的)提供。在一些实施方案中，一些组分可以是可重构的或可加工的，例如通过添加合适的溶剂。

在一些实施方案中，试剂盒还包括说明如何进行本文描述的方法的书面标注。

另外的定义

除非本文特意定义，否则本文使用的所有术语具有与其对于当前公开内容的领域中的技术人员而言相同的含义。对本领域的定义和术语，从业者特别关注Sambrook J.等人(编)，Molecular Cloning:A Laboratory Manual，第三版，Cold Spring Harbor Press，Plainsview，纽约(2001)；Ausubel,F.M.等人(编)，Current Protocols in MolecularBiology,John Wiley&Sons，纽约(2010)；Ran,F.A.等人，Genome engineering using theCRISPR-Cas9 system,Nature Protocols,8:2281–2308(2013)，以及Jiang,F.和Doudna,J.A.,CRISPR–Cas9 Structures and Mechanisms,Annual Review of Biophysics,46:505-529(2017)。

权利要求中使用术语“或”用于表示“和/或”，除非明确指出仅指可供选择的事物或者可供选择的事物是互相排斥的，尽管本公开内容支持仅指可供选择的事物和“和/或”的定义。

根据长期存在的专利法，除非特别注明，否则词语“一(a)”和“一(an)”在权利要求或说明书中与词语“包含(comprising)”结合使用时表示一或多。

除非上下文清楚地另有要求，否则在整个说明书和权利要求书中，词语“包含(comprise)”、“包含(comprising)”等应以包括性意义，而不是排他性或穷举性意义解释；也就是说，表示“包括但不限于”的意义。使用单数或复数的词语也分别包括复数和单数。另外，当在本申请中使用时，词语“本文”、“上文”和“下文”以及具有类似含义的词语应当指作为整体的本申请，而不是指本申请的任何特定部分。词语“约”表示在高于或低于所述参考数字的微小变化范围内的数字。例如，“约”可指高于或低于所示的参考数字10％、9％、8％、7％、6％、5％、4％、3％、2％或1％的范围内的数字。

术语“受试者”、“个体”和“患者”在本文中可互换使用，是指正被评估治疗和/或正被治疗的哺乳动物。在某些实施方案中，哺乳动物是人。术语“受试者”、“个体”和“患者”涵盖但不限于患有包含遗传畸变的癌症或疾病的个体。虽然受试者可以是人，但该术语也涵盖其它哺乳动物，特别是那些可用作用于人疾病的实验室模型的哺乳动物，例如小鼠、大鼠、狗、非人灵长类动物等。

术语“治疗”及其语法变体可以指在疾病或病症(例如，癌症、传染性疾病或自身免疫疾病)的治疗或改善或预防中任何成功的标志，包括任何客观或主观参数，诸如消除；缓解；减轻症状或使患者更耐受疾病状况；减缓退化或衰退的速率；或使退化的终点较不使人虚弱。

症状的治疗或改善可以基于客观或主观参数；包括由医生检查的结果。因此，术语“治疗”包括给予当前的公开内容的化合物或药剂以预防或延迟、以减轻、以改善临床结果、以减少症状的发生、以改善生活质量、以延长无病状态、以稳定、以延长存活、以阻止或抑制与疾病或病症(例如，癌症或遗传性疾病)相关的症状或病症的发展，或其任何组合。术语“治疗效果”是指减少、消除或预防受试者中的疾病或病症、疾病或病症的症状、或疾病或病症的副作用。

如本文使用的，术语“核酸”是指核苷酸单体单元或“残基”的聚合物。核酸的核苷酸单体亚基或残基各包含含氮碱基(即，核碱基)、五碳糖和磷酸酯基团。每个残基的身份在本文中通常参考每个残基的核碱基(或含氮碱基)结构的身份来显示。经典的核碱基包括腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、尿嘧啶(U)(在RNA中代替胸腺嘧啶(T)残基)和胞嘧啶(C)。然而，当前的公开内容的核酸可以包括任何修饰的核碱基、核碱基类似物和/或非经典核碱基，如本领域中所熟知的。对核酸单体或残基的修饰涵盖在核酸单体或残基结构中的任何化学变化，其导致非经典的亚基结构。这样的化学变化可以由例如表观遗传修饰(诸如对基因组DNA或RNA的表观遗传修饰)，或由辐射、化学或其它方式导致的损伤引起。可由修饰产生的非经典亚基的说明性和非限制性实例包括尿嘧啶(对于DNA)、5-甲基胞嘧啶、5-羟甲基胞嘧啶、5-醛基胞嘧啶(5-formethylcytosine)、5-羧基胞嘧啶、b-葡糖基-5-羟基-甲基胞嘧啶、8-氧代鸟嘌呤、2-氨基-腺苷、2-氨基-脱氧腺苷、2-硫代胸苷、吡咯并嘧啶、2-硫代胞苷，或脱碱基损伤。脱碱基损伤是沿着脱氧核糖骨架但缺少碱基的位置。已知的天然核苷酸类似物以类似于天然存在的核苷酸的方式与核酸杂交，诸如肽核酸(PNA)和硫代磷酸DNA。

提及序列同一性是说明两个聚合序列，诸如核酸或蛋白序列的相似性程度。本领域普通技术人员使用公认的算法和/或技术可以容易地完成序列同一性的确定。序列同一性通常通过在比较窗口上比较两个最佳比对的序列来确定，其中与参考序列(其不包含添加或删除)相比，比较窗口中的肽或多核苷酸序列部分可包含添加或删除(即空位)，用于两个序列的最佳比对。百分比计算如下：通过确定在两个序列中出现相同的氨基酸残基或核酸碱基的位置的数目来得到匹配位置的数目，将匹配位置的数目除以比较窗中位置的总数，并将结果乘以100以得到序列同一性的百分比。各种软件驱动的算法是容易获得的，诸如进行这样的比较的BLAST N或BLAST P。

公开了可用于所公开的方法和组合物、可与所公开的方法和组合物结合使用、可用于制备所公开的方法和组合物或是所公开的方法和组合物的产品的材料、组合物和组分。应理解，当公开这些材料的组合、子集、相互作用、组等时，具体考虑各个单一的和集合的组合中的每一种，即使可能没有明确公开对这些化合物的每一单个组合和排列的具体提及。该构思适用于该公开内容的所有方面，包括但不限于所述方法中的步骤。因此，任何前述实施方案的具体要素可以组合或置换为其它实施方案中的要素。例如，如果存在可以进行的各种附加步骤，则应理解，这些附加步骤中的每一个都可以与所公开的方法的任何特定方法步骤或方法步骤的组合一起来进行，并且每个这样的组合或组合的子集都被具体考虑并且应当被认为是公开的。另外，应理解，本文描述的实施方案可以使用任何合适的材料，例如本文别处描述的或本领域已知的那些来实施。

本文引用的出版物和它们被引用所针对的主题在此特意通过引用以其整体并入。

实施例

阐述以下实施例以便为本领域普通技术人员提供如何制备和使用本公开内容的各个方面和实施方案的完整公开内容和描述，并且不旨在限制发明人认为是其创新的内容的范围，它们也不旨在表示以下实验是全部进行的实验或仅有的进行的实验。

实施例1

该实施例描述被称为PRIME-Del的基于引导编辑的方法的开发，其使用靶向两条相对DNA链的成对的引导编辑gRNA(pegRNA)诱导精确的删除。

介绍

进行研究以确定是否一对pegRNA不仅可用于指定被切口的位点，而且可用于指定修复的结果。证明了由于新方法，可以对长于100bp的删除编程(图1C)。该策略被称为PRIME-Del，其被证明诱导长度高达10kb的序列的有效删除，具有比采用Cas9/成对的sgRNA或现存PE3策略所观察到的或所预期的高得多的精确度。进一步显示PRIME-Del可在删除位点并发地对短插入编程。并发的删除/插入可用于引入框内删除，以与删除并发地引入表位标签，并且，更一般地用于促进对不受PAM位点的内源性分布限制的删除的编程。通过填补这些空白，PRIME-Del扩展在单核苷酸分辨率(resolution)下研究基因组序列的生物学功能的工具包。

结果和讨论

PRIME-Del诱导在游离基因DNA中的精确的删除

通过对游离基因编码的eGFP基因的删除编程来测试PRIME-Del策略的可行性。设计了pegRNA对，其指定在pCMV-PE2-P2A-GFP质粒(Addgene#132776)的eGFP编码区域内的24-bp、91-bp和546-bp删除(图1D)。将每对pegRNA克隆到具有分开的启动子、人U6和H1序列的单个质粒中(Gasperini,M.等人，CRISPR/Cas9-Mediated Scanning for RegulatoryElements Required for HPRT1 Expression via Thousands of Large,ProgrammedGenomic Deletions.Am.J.Hum.Genet.101,192–205(2017))。用靶向eGFP的成对的pegRNA和pCMV-PE2-P2A-GFP质粒转染HEK293T细胞。转染后4-5天从细胞收获DNA(包括基因组DNA和残余质粒两者)，并PCR扩增eGFP区域。然后对PCR扩增子测序，以定量编程的删除的效率以及检测对所靶向的序列的非预期编辑。

删除效率计算为在与有或没有删除的参考序列比对的读数的总数中，与预期删除的参考序列比对的读数的数目。估算的删除效率范围从38％(24-bp删除)至77％(546-bp删除)，并且跨重复是一致的(注意：在整个该实施例中，术语‘重复’用于指独立的转染)(图1E)。该结果清楚地表明图1C中概述的PRIME-Del策略可以起作用。由于PCR和基于Illumina的测序两者都偏好较短的、编辑的模板，特别是对于546-bp删除，这些可能是对效率的过高估计，因为其在扩增子大小之间具有最大差异(野生型和删除扩增子分别为766-bp相对于220-bp)。为了解决这一点，采用两步PCR对来自546-bp删除实验的DNA重复进行扩增，首先经由线性扩增添加15bp独特分子标识符(UMI)，然后是第二指数期。经由线性PCR添加UMI旨在使删除效率估算中的PCR和测序偏差最小化(Kivioja,T.等人，Counting absolutenumbers of molecules using unique molecular identifiers.Nat.Methods 9,72–74(2011))。基于用相同UMI对读数折叠之后的测序数据以及基于产物大小分布(AgilentTapeStation)评估PRIME-Del效率。在重复去除后观察到删除效率略微降低，从73％至66％，与在TapeStation上测量的70％的效率相当(图1F)。这些结果表明效率的初始估算仅受到大小依赖性偏差的轻度影响。

对于这些测序数据中的大多数，仅单个读数在预期的删除位点上延伸。因此，难以将非预期的编辑结果(例如切口位点处的插入删除)与PCR或测序错误区分开来。为了部分解决这一点，沿着测序读数的长度，绘制了不同类别的错误(取代、插入、删除)的频率，用于与未编辑的序列(图1G，顶部)或预期的删除(图1G，底部)的序列比对。对于三个删除实验的所有重复(图6A-6E)，这些图谱显示低取代和插入删除比率，具有几乎相同的图谱，并且在引导编辑器-2酶切口位点或3'flap末端的任一位置处任何类别错误的比率中没有一致地升高超过1％，特别是在通过UMI折叠(图1G和6E)或采用更长的成对的末端测序读数重复测序(图1H)之后。

使用PRIME-Del的同时删除和短插入

据推断，因为3'-flap中的同源序列对删除编程，PRIME-Del可能潜在地被用于在删除连接点处并发地引入短插入(图2A)。期望的插入将以反向互补的方式被编码到pegRNA对中，仅在指定删除的同源序列的5'。采用用于对删除编程的常规策略，即采用Cas9和成对的sgRNA，删除连接点由sgRNA靶点来确定，其选择受到PAM位点的天然分布的限制(图2B)。采用PRIME-Del的同时删除和短(小于100bp)插入将提供至少三个相对于该常规策略的优点。首先，1-3个碱基的任意插入可以实现在编辑后维持阅读框，例如，用于旨在去除蛋白结构域的删除。第二，可以使用任意插入以有效地将一个或两个删除连接点从由PAM确定的切割位点移开，以碱基对的精确度提高对删除编程的灵活性。第三，在删除连接点处插入功能性序列可以实现采用PRIME-Del的基因组编辑与其他实验目标(例如，蛋白标记或插入转录起始位点)相结合。

为了测试该构思，设计了pegRNA对，其编码eGFP内在546-bp编程的删除的连接点处范围为3至30bp的五个插入(图2C)。尽管主要目的是测试插入长度对删除效率的影响，但是考虑到3-bp插入序列产生框内终止密码子，针对插入序列在分子生物学中的重要性选择插入序列。6-bp插入序列包括具有周围Kozak共有序列的起始密码子。12-bp插入序列包括GGACAT的m6A转录后修饰共有序列的串联重复(Dominissini,D.等人，Topology of thehuman and mouse m6A RNA methylomes revealed by m6A-seq.Nature 485,201–206(2012))。21-bp插入序列包括T7 RNA聚合酶启动子序列。当翻译时，30-bp插入序列编码框内FLAG-标签肽序列。估算的在HEK293T细胞中在游离基因的eGFP基因内同时的短插入和删除的效率与单独546-bp删除相当，各种编程的插入的范围为83％至90％(图2D)。而且，在删除连接点处和跨编程的插入的插入、删除和置换错误率与背景错误频率相当(图2E和7A)。如所预期的，绝大多数(＞99％)包含编程的删除的读数也包含插入(图2F)，表明按照编程的pegRNA序列产生的3'-DNA flap对的全长指定修复结果(图2A)。

PRIME-Del诱导基因组DNA中的精确的删除

受关于编辑游离基因的DNA的这些初始结果的鼓励，接着在整合到基因组中的eGFP基因的拷贝上测试了PRIME-Del。首先，通过慢病毒转导产生携带eGFP基因的多克隆HEK293T细胞，随后是流式分选以选择GFP阳性细胞(图3A)。然后，通过在无eGFP的情况下将pegRNA和引导编辑器-2酶(pCMV-PE2；Addgene#132775)转染到这些细胞，测试编码并发的删除和插入(在删除连接点处有或没有短插入的546-bp删除)的相同pegRNA对。尽管与游离基因的eGFP相比，编辑效率显著降低(7-17％；图3B)，但是明显与编辑相关的错误仍然无法检测(图3C和7B)。具体地，在切口位点或3'-DNA-flap结合位点处没有高于背景水平的错误类别累积的一致模式。此外，如先前注意到的，绝大多数具有546-bp删除的读数也包含编程的插入(图7C)。

为了在天然基因上测试PRIME-Del，设计了两对pegRNA，它们分别指定在HPRT1外显子1中118-bp和252-bp删除(图3D)。先前使用Cas9/成对的sgRNA策略进行了跨HPRT1基因座的扫描删除筛选(Gasperini,M.等人，CRISPR/Cas9-Mediated Scanning forRegulatory Elements Required for HPRT1 Expression via Thousands of Large,Programmed Genomic Deletions.Am.J.Hum.Genet.101,192–205(2017))。为了在对基因组删除编程中直接将PRIME-Del与Cas9/成对的sgRNA进行比较，采用相同的向导尝试了相同的删除，但在HEK293T细胞的转染中采用Cas9置换引导编辑器-2酶。使用两种独立的方法对得到的删除效率定量：第一，在标准PCR和测序读出之前，使用前述经由线性PCR步骤附加15-bp的独特分子标识符(UMI)序列的策略。通过共享的UMI折叠得到的测序读数，以使在PCR扩增和测序簇产生步骤中引入的可能的偏差最小化。第二，使用液滴数字PCR(ddPCR)，其在每个液滴内在PCR扩增和TaqMan探针的荧光读出之前将基因组DNA分到乳液液滴中。设计探针以在删除连接点处结合，这将在存在删除时特异性地产生荧光信号。报告探针的设计旨在对精确的编辑效率定量，因为在删除连接点处引入的错误不太可能在PCR期间诱导探针的有效结合(Watry,H.L.等人，Rapid,precise quantification of large DNAexcisions and inversions by ddPCR.Sci.Rep.10,14896(2020))。将来自删除的信号相对于来自检测RPP30基因拷贝数的参考信号归一化，所述参考信号先前已被表征并经常用作ddPCR测定中的标准(Watry,H.L.等人，Sci.Rep.10,14896(2020)，同上)。在HEK293T中，在HPRT1的外显子1处，观察到PRIME-Del和Cas9/成对的sgRNA策略的删除效率相当，118-bp和252-bp删除的效率范围为从5％至30％(图3E)。值得注意的是，与基于UMI的测序测定相比，观察到采用ddPCR测定的效率始终较低。尽管这可能是由于基于UMI的方法对效率的过高估计，但也注意到，基于在阳性和阴性液滴之间缺少荧光强度的清楚分离，靶区域的PCR扩增在ddPCR测定中可能是低效的(图8C和8D)。

如充分确定的(参见，例如，Canver,M.C.等人，Characterization of genomicdeletion efficiency mediated by clustered regularly interspaced shortpalindromic repeats(CRISPR)/Cas9 nuclease system in mammaliancells.J.Biol.Chem.289,21312–21324(2014)；Byrne,S.M.等人，Multi-kilobasehomozygous targeted gene replacement in human induced pluripotent stemcells.Nucleic Acids Res.43；和Gasperini,M.等人，CRISPR/Cas9-Mediated Scanningfor Regulatory Elements Required for HPRT1 Expression via Thousands of Large,Programmed Genomic Deletions.Am.J.Hum.Genet.101,192–205(2017))，无论有或没有预期的删除，Cas9/成对的sgRNA策略经常导致错误(大部分是短删除)(图3F、3G和8A)。在缺少预期的118-bp或252-bp删除的读数中，12％或12％还分别在可观察的靶位点处包含非预期的插入删除(这些是低估的，因为它们仅占两个靶位点中的一个)(图3F，顶部)。在包含预期的118-bp或252-bp删除的读数中，38％或34％还分别在删除连接点处包含非预期的插入删除(图3F，底部)。这样的连接错误是由NHEJ进行的易出错修复的确定结果。相比之下，采用PRIME-Del，非预期的插入删除要少见得多(图3G和8B)。在缺少预期的118-bp或252-bp删除的读数中，1.1％或0.5％还分别在可观察的靶位点处包含非预期的短插入删除(图3G，顶部)。在包含预期的118-bp或252-bp删除的读数中，12％或2.7％还分别在删除连接点处包含非预期的插入删除(图3G，底部)。ddPCR测量也表明PRIME-Del相对于Cas9/成对sgRNA策略的更高正确编辑效率的模式，其中PRIME-Del报告两种删除的高出几乎2倍的精确编辑的群。

对于PRIME-Del，例如，在HPRT1上的118-bp删除，在与预期删除相关联的删除连接点处可观的插入率的观察结果(图3G，底部，和8B)与较早的eGFP的观察结果形成对比，在较早的eGFP的观察结果中这些比率始终等同于背景。对错误模式的进一步研究揭示，这些错误对应于长插入(平均47-bp+/-12-bp；图9A-9H)。在118-bp删除连接点处最频繁的长插入是55-bp，一种在两个32-bp 3'-DNA flap序列之间的嵌合序列，在'GCCG'序列处重叠，表明其源于3'-DNA flap的富含GC的末端的退火。在252-bp删除连接点处观察到作为插入的类似的嵌合序列，在它们的3'-DNA flap内在'GCCG'处重叠。尽管如此，即使具有这些长插入，包含插入删除的所有读数的82％和91％与采用PRIME-Del的预期删除完全匹配，但采用Cas9/成对的sgRNA策略仅为38％和49％(图4A)。来自Cas9/成对的sgRNA策略的插入删除错误很可能被低估，因为该测序策略仅捕获在两个Cas9切割位点之一处的错误。

在将PRIME-Del应用于eGFP基因座中观察到的插入的结构和缺少类似的错误表明该问题可能通过替代的pegRNA设计来解决。作为一种方法，两个pegRNA的RT模板部分被缩短或延长。对于两个pegRNA的使用32-bp RT模板长度的118-bp删除，同源臂被缩短至17-bp和25-bp长，或延长至42-bp和46-bp长(图10A)。延长和缩短同源臂两者都导致删除效率降低(分别为采用用于短同源臂和长同源臂的标准设计观察到的效率的29％和26％)(图10B)。然而，在删除的产物中，延长同源臂也倾向于降低长插入错误频率(至标准设计的30％)，而缩短同源臂增加了插入错误频率(至标准设计的129％)(图10D)。采用252-bp删除观察到类似的趋势，其中缩短或延长同源臂降低了删除效率(图10C)，而延长同源臂提高了精确度(图10E)。作为进一步的对照，将RT模板的序列置换为用于对在eGFP的546-bp删除编程的序列，未诱导靶向HPRT1的118-bp和252-bp两个构建体的删除(图10B和10C)，强化PRIME-Del删除对由同源臂序列引导的DNA修复具有特异性的结论。

使用PRIME-Del在另外的天然基因座处进一步应用基因组删除，总共测试在7个基因座处的10个不同删除(图4A)。所有删除在HEK293T细胞中进行，对使用基于UMI的测序测定的删除效率和错误频率定量，并直接将PRIME-Del与Cas9/成对的sgRNA方法(即使用相同的向导但在Cas9中置换)进行比较。删除大小范围为HPRT1外显子1处的118bp至e-NMU(NMU基因的增强子)基因座处的710bp。在所有10个例子中，相比Cas9/成对的sgRNA方法，采用PRIME-Del观察到显著更低的错误率。在十个例子中的五个中，观察到相比Cas9/成对的sgRNA方法，采用PRIME-Del的精确删除更有效，表明更高的精确度一般不会损害删除效率。任一种方法都没有观察到在该范围(118至710bps)内删除大小和效率之间的强相关性。

当使用Cas9/成对的sgRNA方法时，两个DSB之间的序列倒置是充分记录的现象(Canver,M.C.等人，Characterization of genomic deletion efficiency mediated byclustered regularly interspaced short palindromic repeats(CRISPR)/Cas9nuclease system in mammalian cells.J.Biol.Chem.289,21312–21324(2014)；Mandal,P.K.等人，Efficient ablation of genes in human hematopoietic stem and effectorcells using CRISPR/Cas9.Cell Stem Cell 15,643–652(2014)；图4B)。为了理解使用PRIME-Del的倒置事件的频率，将测序读数与通过倒置两个切口位点之间的序列产生的参考进行比对。跨进行了PRIME-Del的7个基因座中的10个删除，观察到实际上没有与倒置的参考比对的读数(图4C)，而对于Cas9/成对的sgRNA对照，以高达2％的读数检测到倒置(图4C)。

为了评价PRIME-Del的长度限制，在HPRT1基因座处设计了两个另外的删除，大小为1064bp(1kb)和10204bp(10kb)。由于基于测序的测定不是非常适于检测大于1kb的扩增子，所以单独使用测序来对删除产物中的错误频率定量，并且使用ddPCR来测量精确的删除的效率，再次并排比较引导编辑器-2和Cas9。观察到虽然在HEK293T细胞中在PRIME-Del和Cas9/成对的sgRNA方法之间的删除效率是相当的(图4D)，但PRIME-Del实现高得多的精确度，这与诱导较短删除时的观察结果一致。对于1-kb删除，PRIME-Del和Cas9/成对的sgRNA方法都实现了接近3％的删除效率。对于10-kb删除，PRIME-Del和Cas9/成对的sgRNA方法分别实现了0.8％和1.6％的删除效率。对源自对删除后连接点具有特异性的PCR的扩增子进行测序后，1-kb和10-kb删除的分别为98％和97％的读数在采用PRIME-Del的连接点处缺少插入删除错误，而采用Cas9/成对的sgRNA策略仅47％和42％的读数缺少插入删除错误(图4E)。

为了测试PRIME-Del是否可以被“多重化”，汇聚编码成对的pegRNA的质粒，其对在HPRT1基因座处四种不同但重叠的删除(118、252、469和1064bp)编程。采用这些质粒连同编码引导编辑器-2酶的质粒转染HEK293T细胞。在将细胞孵育4天并提取基因组DNA后，使用基于测序的定量估算118-bp、252-bp和469-bp删除的效率为5.1％、8.5％和2.8％，以及使用ddPCR估算1064-bp删除的效率为2％(图11A-11C)。总之，据估算，18％的HPRT1基因座携带四个编程的删除之一，其与通过分开转染成对的pegRNA质粒的单一构建体进行的四个删除的平均效率相当(12％)。这些结果证明类似于Cas9/成对的sgRNA方法，PRIME-Del可通过使用汇聚的成对的pegRNA构建体而用于并发地对多个删除编程。

延长编辑时间提高引导编辑效率

与跟随NHEJ的Cas9介导的DSB相比，引导编辑和PRIME-Del两者都具有高编辑精确度，产生预期的编辑或保存原始的可编辑的序列。据推断，如果引导编辑和PRIME-Del的编辑效率受到细胞中PE2/pegRNA分子的瞬时可用性的限制，则通过稳定的基因组整合或供选择的重复转染来延长引导编辑器-2酶和pegRNA的表达，将随着时间提高成功编辑的比率，特别是如果不可编辑的“死端”结果没有同时出现。

为了促进延长的表达，生成表达引导编辑器-2酶的单克隆HEK293T和K562细胞系(分别称为HEK293T(PE2)和K562(PE2))并用携带pegRNA的慢病毒载体转导(图12A)。使用PRIME-Del(前述的在外显子1处的118-bp和252-bp删除)测试在HPRT1处两种不同的删除，以及使用标准引导编辑以将3-bp(CTT)插入合成的HEK3靶序列中(Anzalone,A.V.等人，Search-and-replace genome editing without double-strand breaks or donorDNA.Nature 576,149–157(2019))。在K562(PE2)中，使用引导编辑的CTT插入和使用PRIME-Del的118-bp或252-bp删除两者都观察到正确编辑的群随时间的稳定增加。CTT插入的终点引导编辑效率非常高，到首次将pegRNA转导到K562(PE2)细胞后19天达到90％的靶点具有正确编辑(图12B)。118-bp和252-bp删除到19天时，使用PRIME-Del的精确删除率也分别达到接近50％和25％。在HEK293T(PE2)细胞中，在前10天观察到较低的CTT插入效率，但最终到第19天达到80-90％(图12C)。出乎意料的是，在HEK293T(PE2)细胞中观察到PRIME-Del诱导的删除几乎缺失(图12C)。虽然不能排除引导编辑中的细胞类型特异性差异，但是怀疑引导编辑器-2酶和pegRNA的表达水平严重影响编辑效率，因为随后在HEK293T(PE2)细胞中的尝试已经导致随时间累积删除(图12D和12F)。总之，这些结果证实引导编辑或PRIME-Del组分的延伸表达可以提高效率，尽管其可能诱导引导编辑的更大的脱靶效应。

PRIME-Del的应用

该工作介绍PRIME-Del，一种用于引导编辑的成对的pegRNA策略，并且证明其实现对删除编程的高精确度，无论有或没有短的、编程的插入。在游离基因的、合成基因组的和天然基因组的基因座处测试长度范围为20至～10000-bp的删除。在HEK293T细胞中，采用单轮瞬时转染，对天然基因的编辑效率的范围为1-30％，尽管也观察到在K562细胞中引导编辑或PRIME-Del组分的延长的、高表达增强了编辑效率。对于在采用PRIME-Del靶向的七个基因组基因座处的12个删除，观察到高精确度的编辑，除了在HPRT1外显子1处，其中有时在删除连接点处观察到长插入(总读数的约5％)。在HPRT1外显子1处使用的pegRNA对的3'-DNA flap序列的富含GC的末端看来是长插入的基础。优化pegRNA设计可能能够消除该错误模式，并且显示延长同源臂倾向于降低长插入错误的频率。为了促进避免该特定的错误模式，开发了一种伴随的用于设计PRIME-Del成对的pegRNA序列的基于Python的网络工具，如果这样的序列存在于设计的pegRNA对中，则其通知用户。

然而，即使有这些插入错误，相比Cas9/成对的sgRNA策略，PRIME-Del始终表现出更高的精确度，即对于这里测试的所有12个基因组删除，PRIME-Del导致更少的错误结果。对于这些同样的12个例子，相比Cas9/成对的sgRNA方法，PRIME-Del针对五个例子表现出明显更高的精确删除效率(大于两倍)，针对五个例子表现出相当的效率(在两倍以内)，以及针对两个例子表现出明显更低的效率(小于一半)。总之，这些观察结果支持与Cas9/成对的sgRNA方法相比，PRIME-Del实现更高精确度而不损害编辑效率的观点。

PRIME-Del潜在的与设计相关的限制是相对于常规的Cas9/成对的sgRNA策略，它限制了可用的基因组前间隔序列对，因为它们需要出现在相对链上，PAM序列的取向朝向彼此(图1C)。然而，开发和优化一种几乎无PAM的(Walton,R.T.等人，Unconstrained genometargeting with near-PAMless engineered CRISPR-Cas9 variants.Science 368,290–296(2020))引导编辑酶(Kweon,J.等人，Engineered prime editors with PAMflexibility.Mol.Ther.(2021)doi:10.1016/j.ymthe.2021.02.022)将放宽该限制。另一个限制是由于它们较长的长度，相比克隆sgRNA对，克隆一对串联的pegRNA更有挑战性。这里使用的每个pegRNA的长度为135至140bp，使得将它们的独特组分串联地合成为单个的长寡核苷酸接近常规DNA合成技术的极限，特别是对于需要基于阵列合成成对的pegRNA文库的目标。

尽管有这些限制，相对于替代物，PRIME-Del跨几个潜在的应用领域提供明显优点(图5)。最直接地，PRIME-Del可用于精确地对高达至少10kb的删除编程；还没有确立上限的迹象。除了相比Cas9/成对的sgRNA策略，在删除连接点处观察到的低得多的插入删除错误率之外，诱导成对的切口不太可能局部导致大的、非预期的删除，全基因组的重排(染色体碎裂；参见Leibowitz,M.L.等人，Chromothripsis as an on-target consequence ofCRISPR–Cas9 genome editing.Nature Genetics(2021)doi:10.1038/s41588-021-00838-7)或脱靶编辑(Kosicki,M.等人，Repair of double-strand breaks induced by CRISPR-Cas9 leads to large deletions and complex rearrangements.Nat.Biotechnol.36,765–771(2018)，Anzalone,A.V.等人，Search-and-replace genome editing withoutdouble-strand breaks or donor DNA.Nature 576,149–157(2019)，Schene,I.F.等人，Nature communications 11.1(2020):1-8，Owens,D.D.G.等人，Microhomologies areprevalent at Cas9-induced larger deletions.Nucleic Acids Res.47,7402–7417(2019)，和Kim,D.Y.等人，Unbiased investigation of specificities of primeediting systems in human cells.Nucleic Acids Research(2020)doi:10.1093/nar/gkaa764)。这些特征有利于开发治疗方法，例如其中PRIME-Del删除致病区域，诸如在FMR1的5'-UTR中的CGG重复扩增，而没有对附近或远端序列的不期望的干扰(Khosravi,M.A.等人，Targeted deletion of BCL11A gene by CRISPR-Cas9 system for fetalhemoglobin reactivation:A promising approach for gene therapy of betathalassemia disease.Eur.J.Pharmacol.854,398–405(2019)，Dastidar,S.等人，Efficient CRISPR/Cas9-mediated editing of trinucleotide repeat expansion inmyotonic dystrophy patient-derived iPS and myogenic cells.Nucleic AcidsRes.46,8275–8298(2018))。

PRIME-Del还实现在编程的删除连接点处同时插入短序列，而基本上不损害其效率或精确度。插入短序列实现蛋白结构域的精确删除，同时保留天然阅读框，即避免过早的终止密码子，其否则可能引发复杂的无义介导的衰变(NMD)反应(El-Brolosy,M.A.等人，Genetic compensation triggered by mutant mRNA degradation.Nature 568,193–197(2019)，Ma,Z.等人，PTC-bearing mRNA elicits a genetic compensation response viaUpf3aand COMPASS components.Nature 568,259–263(2019))。此外，删除后插入生物活性序列很可能有利于将PRIME-Del与技术的结合，即通过插入可用作被编辑的基因组基因座内的分子手柄(molecular handle)的表位标签或T7启动子序列。

另外，与常规的Cas9/成对的sgRNA策略相比，预期通过基于引导编辑的PRIME-Del经由DNA损伤的毒性较小，这可以促进框架，诸如scanDel和crisprQTL的编程的基因组删除的多重化(Gasperini,M.等人，CRISPR/Cas9-Mediated Scanning for RegulatoryElements Required for HPRT1 Expression via Thousands of Large,ProgrammedGenomic Deletions.Am.J.Hum.Genet.101,192–205(2017)，Gasperini,M.等人，AGenome-wide Framework for Mapping Gene Regulation via Cellular Genetic Screens.Cell176,1516(2019))。为了研究转录中的非编码元件，高达约10kb的有效和精确的删除补充目前使用的用于CRISPR-干扰(CRISPRi)的失活的Cas9栓系的KRAB结构域，其不能控制靶区域周围表观遗传修饰的范围。因此，预计PRIME-Del可广泛应用于大规模并行的功能性测定中，从而以碱基对分辨率表征天然遗传元件。

方法

pegRNA/sgRNA设计

对于pegRNA/sgRNA设计，CRISPOR(Concordet,J.-P.&Haeussler,M.CRISPOR:intuitive guide selection for CRISPR/Cas9 genome editing experiments andscreens.Nucleic Acids Res.46,W242–W245(2018))最初用于在给定的感兴趣区域内选择20-bp CRISPR-Cas9间隔区。避免了被注释为无效的间隔区，包括U6/H1终止子和富含GC的序列，并且通常选择具有更高预测效率(U6转录的sgRNA的Doench评分(Doench,J.G.等人，Optimized sgRNA design to maximize activity and minimize off-target effectsof CRISPR-Cas9.Nat.Biotechnol.34,184–191(2016)))的间隔区。最初将pegRNA的RT模板部分的长度设定为30-bp，如果其以G或C结尾，则延长1至2-bp(Kim,Hui Kwon等人，“Predicting the efficiency of prime editing guide RNAs in human cells.”NatureBiotechnology 39.2,198-206(2021)，Anzalone,A.V.等人，Search-and-replace genomeediting without double-strand breaks or donor DNA.Nature 576,149–157(2019))。

用于PRIME-Del成对的pegRNA设计的网络工具

为了促进PRIME-Del成对的pegRNA设计，开发了基于Python的网络工具，其使设计过程自动化。该软件采用FASTA格式的序列文件作为输入，识别所提供的区域内所有可能的PAM序列，并最初产生所有潜在的成对的pegRNA序列以对删除编程。软件还可以任选地将使用Flashfry(McKenna,A.&Shendure,J.FlashFry:a fast and flexible tool for large-scale CRISPR target design.BMC Biol.16,74(2018)https://paperpile.com/c/gGxRnW/aYp1b)，CRISPOR或GPP sgRNA设计器(Concordet,J.-P.&Haeussler,M.CRISPOR:intuitive guide selection for CRISPR/Cas9 genome editing experiments andscreens.Nucleic Acids Res.46,W242–W245(2018))产生的评分的sgRNA文件作为输入；这是非常推荐的，用以识别有效的CRISPR-Cas9间隔区。对于FlashFry和CRISPOR，如CRISPOR推荐的，过滤掉MIT特异性得分(Hsu,P.D.等人，DNA targeting specificity of RNA-guided Cas9 nucleases.Nat.Biotechnol.31,827–832(2013))低于50的sgRNA间隔区。从最初产生的pegRNA对中，软件基于另外的用户提供的设计参数选择相关的pegRNA对。例如，用户可以定义删除大小范围。用户还可以定义期望删除的开始和结束位置，并且软件将过滤pegRNA对以呈现以那些坐标为中心的窗口。可以使用选项‘-精确的’(-p)设计其连接点不落在PAM位点的用于删除的pegRNA，选项‘-精确的’(-p)向两个pegRNA添加插入序列以促进期望的编辑。

PRIME-Del设计软件还能够使另外的设计约束被指定。除非用户另外指定，否则pegRNA RT模板长度(也被称为同源臂)被默认设置为30-bp。除非用户另外指定，否则pegRNA PBS长度被默认设置为距PE2切口位点13-bp。使用先前确认的参数预测相对于PAM序列的切口位置(Lindel(Chen,W.等人，Massively parallel profiling and predictivemodeling of the outcomes of CRISPR/Cas9-mediated double-strand breakrepair.Nucleic Acids Research vol.47,7989–8003(2019)))，并且如果预测的在非经典位置处产生切口的可能性大于25％，则相应地调整RT模板长度。过滤出包括RNA聚合酶III终止子序列(四个以上的连续T's)的PegRNA序列。如果在任一3'-DNA-flap中的5-bp中的4个以上是G或C，则软件产生警告信息。代码可在gituhub(github.com/shendurelab/Prime-del)获得，并且交互式网页可在primedel.uc.r.appspot.com/获得。

pegRNA克隆

在设计pegRNA对后，按照Anzalone等人(Anzalone,A.V.等人，Nature 576,149–157(2019))概述的Golden-Gate克隆策略，组装三个dsDNA片段和一个质粒骨架。第一dsDNA片段包含pegRNA-1间隔区序列，其从具有4-bp 5'-突出端的两个互补的合成单链DNA寡核苷酸(IDT)退火。第二dsDNA片段包含pegRNA-1sgRNA骨架序列，其从两个在4-bp突出端的末端具有5'-末端磷酸化的DNA寡核苷酸退火。第三dsDNA片段包含pegRNA-1RT模板序列和引物结合序列(PBS)、pegRNA-1终止子序列(六个连续的T's)和具有H1启动子序列的pegRNA-2序列。这是通过PCR扩增将pegRNA-1部分和pegRNA-2部分附加到基因片段(作为gBlocks从IDT购买)的两端而产生的。基因片段包含pegRNA-1终止子序列、H1启动子序列、pegRNA-2间隔区序列和pegRNA-2sgRNA骨架序列。正向引物包括BsmBI或BsaI限制性位点、pegRNA-1RT模板序列和PBS。反向引物包括pegRNA-2RT模板、PBS和BsmBI或BsaI限制性位点。使用1.0XAMPure(Beckman Coulter)纯化PCR片段(大小为300至400bp)，并与两个其它dsDNA片段和具有对应的突出端的线性化的骨架载体混合，所述线性化的骨架载体用于基于Golden-Gate的组装混合物(来自New England Biolabs的BsmBI或BsaI golden-gate组装混合物)。对于pegRNA克隆骨架，使用携带杀稻瘟菌素抗性基因的GG-受体质粒(Addgene#132777)或piggyBAC-运载载体。将每个构建体质粒转化到Stbl感受态大肠杆菌(E.coli)(NEBC3040H)中用于扩增，并使用小量制备试剂盒(Qiagen)纯化。使用Sanger测序(Genewiz)验证克隆。

组织培养、转染、慢病毒转导和单克隆系产生

HEK293T和K562细胞购自ATCC。在具有高浓度葡萄糖(GIBCO)、补充有10％胎牛血清(Rocky Mountain Biologicals)和1％青霉素-链霉素(GIBCO)的Dulbecco改良Eagle培养基中培养HEK293T细胞。在具有L-谷氨酰胺(Gibco)、补充有10％胎牛血清(RockyMountain Biologicals)和1％青霉素-链霉素(GIBCO)的RPMI 1640中培养K562细胞。HEK293T和K562细胞在37℃下采用5％CO₂生长。

为了瞬时转染，将约50000个细胞接种至24孔板中的每个孔并培养至70-90％汇合。为了引导编辑，按照来自供应商的推荐的方案，将375ng的引导编辑器-2酶质粒(Addgene#132775)和125ng的pegRNA或成对的pegRNA质粒混合，并采用转染试剂(Lipofectamine 3000)制备。对于使用Cas9/成对的sgRNA的删除，使用375ng的Cas9质粒(Addgene#52962)代替引导编辑器-2酶质粒。除非另有说明，否则在初始转染后将细胞培养四至五天，并且使用DNeasy Blood和Tissue试剂盒(Qiagen)或按照来自Anzalone等人的细胞裂解和蛋白酶方案(Anzalone,A.V.等人，Nature 576,149–157(2019))收获其基因组DNA。

对于慢病毒的产生，将约300000个细胞接种到6孔板中的每个孔，并培养至70-90％汇合。按照来自供应商的推荐的方案，将慢病毒质粒与ViraPower慢病毒表达系统(ThermoFisher)一起转染。按照相同的方案收获慢病毒，使用Peg-it病毒沉淀溶液(SBI)浓缩过夜，并在1-2天内用于转导K562或HEK293T细胞，而无冻融循环。

对于转座酶整合，按照来自供应商的推荐的方案，将500ng的运载质粒和100ng的Super piggyBAC转座酶表达载体(SBI)混合，并采用转染试剂(Lipofectamine 3000)制备。通过使用piggyBAC转座酶系统整合PE2产生表达引导编辑器-2酶的单细胞克隆，通过标记(嘌呤霉素抗性基因)选择，使用流式分选装置将单细胞分选到96孔板中，培养2-3周直至汇合，并通过单独转染CTT-插入pegRNA(Addgene#132778)并对HEK3靶基因座测序来筛选PE活性。

DNA测序文库制备

为了定量通过PRIME-Del产生的编程的删除效率和可能的错误，使用两步PCR从纯化的DNA(长度约200至约1000bp)扩增被靶向的区域，并使用Illumina测序平台(NextSeq或MiSeq)测序(图6A)。每个纯化的DNA样品包含野生型和编辑的DNA分子，使用相同的引物对通过每个PCR反应将其一起扩增。对于PCR扩增，为每个基因组基因座(扩增子)设计一对引物，其中有或没有删除的整个扩增子大小大于200bp，以避免在PCR扩增中、在PCR产物纯化中和在聚簇到测序流动池上中的潜在问题。

第一PCR反应(KAPA Robust)包括300ng纯化的基因组DNA或2μL细胞裂解物、0.04至0.4μM正向和反向引物，最终反应体积为50μL。第一PCR反应被编程为：1)在95℃下3分钟，2)在95℃下15秒，3)在65℃下10秒，4)在72℃下45秒，重复步骤2至4的25-28个循环，和5)在72℃下1分钟。引物包括在其3'末端的测序接头，将它们附加到扩增基因组DNA的PCR产物的两个末端。在第一PCR步骤后，在6％TBE凝胶上评估产物，并使用1.0X AMPure(BeckmanCoulter)纯化，并添加到第二PCR反应，第二PCR反应附加双样品索引和流动池连接器。第二PCR反应程序与第一PCR程序相同，除了运行5-10个循环。产物再次使用AMPure纯化，并在被变性用于测序运行之前在TapeStation(Agilent)上评估。对于产生大小为200至300bp的扩增子的长删除，在低(8pM)输入DNA浓度下使用Miseq测序平台以使在成簇期间替代长扩增子的短扩增子最小化，目标簇密度为300-400k/mm²。按照供应商方案，使用IlluminaNextSeq或MiSeq仪器对变性的文库进行测序。

为了附加15-bp的独特分子标识符(UMI)，第一PCR反应分两步进行：首先，在两个PCR循环中，在0.04至0.4μM单正向引物存在下，使用KAPA Robust聚合酶线性扩增基因组DNA。附加UMI的线性PCR反应被编程为：1)在95℃下3分钟15秒，2)在65℃下1分钟，3)在72℃下2分钟，重复步骤2和3的5个循环，4)在95℃下15秒，5)在65℃下1分钟，6)在72℃下2分钟，和重复步骤5和6的另外5个循环。使用1.5X AMPure净化该反应，并且使用正向和反向引物经受第二PCR。在该情况下，正向引物退火至UMI序列的上游，并且对基因组基因座不具有特异性。在PCR扩增后，将产物净化并添加到另一个PCR反应中，所述另一个PCR反应附加双样品索引和流动池连接器，类似于其它样品。

测序数据处理和分析

测序布局被设计成在每个方向上覆盖距离删除连接点至少50-bp(图6A)。在成对的末端测序的情况下，使用PEAR(Zhang,J.等人，PEAR:a fast and accurate IlluminaPaired-End reAd mergeR.Bioinformatics 30,614–620(2014))来合并具有默认参数和‘-e’标志(‘-e’flag)的成对的末端读数以使经验性基础频率失效。当测序读数中存在15-bpUMI时，使用自定义Python脚本来寻找共享相同UMI的所有读数，所述读数被折叠成具有最频繁序列的单个读数。一般使用CRISPResso2软件(Clement,K.等人，CRISPResso2provides accurate and rapid genome editing sequenceanalysis.Nat.Biotechnol.37,224–226(2019)https://paperpile.com/c/gGxRnW/2BRib)将得到的测序读数与两个参考序列(有或没有删除)进行比对。在CRISPResso2中使用默认比对参数，其中空位开放罚分为-20，空位延伸罚分为-2，以及在切割/切口位点插入插入删除的空位奖励值为1。对于不同的扩增子长度，在50至95之间探索用于读数比对的最小同源得分。使用自定义python和R脚本分析来自CRISPResso2的比对结果。

使用相同序列长度的两个参考序列(野生型和删除)进行比对，产生具有各自参考序列的两组读数。删除效率计算为与具有删除的参考序列比对的读数的总数相对于与任一参考比对的读数的总数的分数。基因组编辑具有三种类型的错误模式：置换、插入和删除。跨两个参考序列绘制每个错误频率，在每个这样的图中突出显示Cas9(H840A)切口位点和3'-DNA flap结合位点。

液滴数字PCR(ddPCR)测定

按照Bio-Rad Laboratories推荐的参数设计ddPCR探针。RPP30基因的预混合的参考探针和引物购自Bio-Rad Laboratories。探针和PCR引物购自Integrated DNATechnologies(IDT)。探针在其5'末端用FAM修饰，并包括双淬灭剂(IDT PrimeTime qPCR探针)。探针序列被特意设计成覆盖删除连接点，用于检测精确的删除产物(Hsu,P.D.等人，DNA targeting specificity of RNA-guided Cas9 nucleases.Nat.Biotechnol.31,827–832(2013))。为了检测每种删除，制备20X引物混合物，其由在50mM Tris-HCl缓冲液(在室温下pH 8.0)中的18μM正向引物、18μM反向引物和5μMFAM标记的探针组成。25μL ddPCR反应混合物由12.5μL的2X Supermix for Probes(无dUTP)(Bio-Rad Laboratories)、1.25μL的20X HEX修饰的RPP30参考混合物(Bio-Rad Laboratories)、1.25μL的20X FAM修饰的引物混合物、0.5μL包含基因组DNA的细胞裂解物和9.5μL无脱氧核糖核酸酶的水组成。将20μLddPCR反应混合物添加至70μL用于探针的液滴产生油中，并使用QX200液滴产生器(Bio-RadLaboratories)产生液滴。将液滴转移至ddPCR 96孔板(Bio-Rad Laboratories)并在96孔热循环仪(Eppendorf)上以以下程序运行：1)在95℃下10分钟，2)在94℃下30秒，3)在50℃下1分钟，重复步骤2和3的41个循环，4)在98℃上10分钟，和5)在装载到QX200液滴读取器之前冷却到4℃。对于在热循环仪上的所有步骤，温度跃变被限制为每秒1℃。使用QX200液滴读数器和Bio-Rad QuantaSoft Pro软件来使ddPCR实验可视化和分析ddPCR实验。删除效率取自FAM+(精确删除)相对于HEX+(用于基因组DNA加载的RPP30参考)事件的比率。

数据可用性

原始测序数据已上传到Sequencing Read Archive(SRA)上，并与相关的BioProject ID PRJNA692623一起是公众可获得的。选择的用于对基因组删除编程的质粒可从Addgene(ID 172655、172656、172657和172658)获得。

代码可用性

用于PRIME-Del的源代码可在github.com/shendurelab/Prime-del获得。用于设计用于PRIME-Del的pegRNA的交互式网页可在primedel.uc.r.appspot.com/获得。

序列表

表1：用于实验的pegRNA和gRNA的序列。

/>

表2：用于基因组DNA扩增的引物的序列。

/>

表3：用于液滴数字PCR(ddPCR)测定的引物和探针的序列。所有探针在5'末端用FAM修饰。

/>

虽然已经说明和描述了说明性实施方案，但是应理解，在不脱离本公开内容的精神和范围的情况下，可以在其中进行各种改变。

序列表

<110> 华盛顿大学

<120> 基于引导编辑的精确的基因组删除和替换方法

<130> FIC23210052P

<150> US 63/110,304

<151> 2020-11-05

<160> 100

<170> PatentIn version 3.5

<210> 1

<211> 139

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 1

cagggtcagc ttgccgtagg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgt aaacggccac aagttcagcg 120

tgtccgacgg caagctgac 139

<210> 2

<211> 139

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 2

caagttcagc gtgtccggcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgctgca gatgaacttc agggtcagct 120

tgccgtcgga cacgctgaa 139

<210> 3

<211> 139

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 3

cataggtcag ggtggtcacg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgt aaacggccac aagttcagcg 120

tgtccggacc accctgacc 139

<210> 4

<211> 139

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 4

caagttcagc gtgtccggcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaagc actgcactcc ataggtcagg 120

gtggtccgga cacgctgaa 139

<210> 5

<211> 139

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 5

catgtgatcg cgcttctcgt gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgt aaacggccac aagttcagcg 120

tgtccgagaa gcgcgatca 139

<210> 6

<211> 139

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 6

caagttcagc gtgtccggcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcactc cagcaggacc atgtgatcgc 120

gcttctcgga cacgctgaa 139

<210> 7

<211> 142

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 7

catgtgatcg cgcttctcgt gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgt aaacggccac aagttcagcg 120

tgtccggcta gaagcgcgat ca 142

<210> 8

<211> 142

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 8

caagttcagc gtgtccggcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcactc cagcaggacc atgtgatcgc 120

gcttctagcc ggacacgctg aa 142

<210> 9

<211> 145

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 9

catgtgatcg cgcttctcgt gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgt aaacggccac aagttcagcg 120

tgtccgccat ggagaagcgc gatca 145

<210> 10

<211> 145

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 10

caagttcagc gtgtccggcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcactc cagcaggacc atgtgatcgc 120

gcttctccat ggcggacacg ctgaa 145

<210> 11

<211> 151

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 11

catgtgatcg cgcttctcgt gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgt aaacggccac aagttcagcg 120

tgtccggaca taggactaag aagcgcgatc a 151

<210> 12

<211> 151

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 12

caagttcagc gtgtccggcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcactc cagcaggacc atgtgatcgc 120

gcttcttagt cctatgtccg gacacgctga a 151

<210> 13

<211> 160

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 13

catgtgatcg cgcttctcgt gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgt aaacggccac aagttcagcg 120

tgtccgtaat acgactcact atagggaaga agcgcgatca 160

<210> 14

<211> 160

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 14

caagttcagc gtgtccggcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcactc cagcaggacc atgtgatcgc 120

gcttcttccc tatagtgagt cgtattacgg acacgctgaa 160

<210> 15

<211> 169

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 15

catgtgatcg cgcttctcgt gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgt aaacggccac aagttcagcg 120

tgtccggcgg aggtgactac aaagacgatg acgacaagaa gcgcgatca 169

<210> 16

<211> 169

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 16

caagttcagc gtgtccggcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcactc cagcaggacc atgtgatcgc 120

gcttcttgtc gtcatcgtct ttgtagtcac ctccgccgga cacgctgaa 169

<210> 17

<211> 141

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 17

aacctctcgg ctttcccgcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaggg ccggcaggcc gagctgctca 120

ccacgacggg gaaagccgag a 141

<210> 18

<211> 141

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 18

agctgctcac cacgacgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacga gccctcaggc gaacctctcg 120

gctttccccg tcgtggtgag c 141

<210> 19

<211> 141

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 19

gcctgcaaac tggtaggcgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaggg ccggcaggcc gagctgctca 120

ccacgacgcc taccagtttg c 141

<210> 20

<211> 141

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 20

agctgctcac cacgacgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgg ctacctagtg agcctgcaaa 120

ctggtaggcg tcgtggtgag c 141

<210> 21

<211> 137

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 21

ggtggagggc cgcctctgag gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcagct cctccatctt ctcttcagcc 120

ctgctagcag aggcggc 137

<210> 22

<211> 137

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 22

tcttcagccc tgctagcgcc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttcg gtttcacttc cggtggaggg 120

ccgcctctgc tagcagg 137

<210> 23

<211> 140

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 23

caggacgtca cagtgaccga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttcg cgcacctcat ggaatccctt 120

ctgcagcgtc actgtgacgt 140

<210> 24

<211> 149

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 24

ggaatccctt ctgcagcacc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttct ccagcaggcg cagagagagc 120

aggacgtcac agtgacgctg cagaaggga 149

<210> 25

<211> 140

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 25

ctcttggagt gtctcctcat gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttcg cgcacctcat ggaatccctt 120

ctgcagcagg agacactcca 140

<210> 26

<211> 141

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 26

ggaatccctt ctgcagcacc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaagg cgggccaggc tctcttggag 120

tgtctcctgc tgcagaaggg a 141

<210> 27

<211> 143

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 27

ggcccagact gagcacgtga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcatat gaccacccac ctaattaaag 120

gagggcaagt cgtgctcagt ctg 143

<210> 28

<211> 137

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 28

attaaaggag ggcaagtgct gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgctcaa tccttggggc ccagactgag 120

cacgacttgc cctcctt 137

<210> 29

<211> 141

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 29

gcattttcag gaggaagcga gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcagtt aaggataact cagacacagg 120

cattccggct tcctcctgaa a 141

<210> 30

<211> 138

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 30

agacacaggc attccgggca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttca gaagagggtg cattttcagg 120

aggaagccgg aatgcctg 138

<210> 31

<211> 137

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 31

gagtccgagc agaagaagaa gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttta ttattcccat agggaagggg 120

gacattcttc tgctcgg 137

<210> 32

<211> 136

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 32

catagggaag ggggacactg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcagga agggcctgag tccgagcaga 120

agaatgtccc ccttcc 136

<210> 33

<211> 141

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 33

aagcatgatc agaacggttg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacac gcagtcctct tttcccaggg 120

ctcccccgcc taccagtttg c 141

<210> 34

<211> 139

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 34

ttcccagggc tcccccgagg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgg ctacctagtg agcctgcaaa 120

ctggtaggcg ggggagccc 139

<210> 35

<211> 140

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 35

aaggggcatg aagtttactg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaggt cagagtcctg gctctgtgac 120

tcagtgataa acttcatgcc 140

<210> 36

<211> 140

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 36

gctctgtgac tcagtgacct ggaatagaaa acaaaagttt aagttattct aaggccagtc 60

cggaatcatc ctaaaaagga ggcaccgagt cggtgcacat ggtacccatg aaggggcatg 120

aagtttatca ctgagtcaca 140

<210> 37

<211> 141

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 37

aagcatgatc agaacggttg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgg ctacctagtg agcctgcaaa 120

ctggtaggcc gttctgatca t 141

<210> 38

<211> 141

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 38

gcctgcaaac tggtaggcgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttg actattttag caagcatgat 120

cagaacggcc taccagtttg c 141

<210> 39

<211> 141

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 39

aggttggccc gtaatacctg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgg ctacctagtg agcctgcaaa 120

ctggtagggt attacgggcc a 141

<210> 40

<211> 141

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 40

gcctgcaaac tggtaggcgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcactt catgtattgt caggttggcc 120

cgtaataccc taccagtttg c 141

<210> 41

<211> 126

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 41

aacctctcgg ctttcccgcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcagct gctcaccacg acggggaaag 120

ccgaga 126

<210> 42

<211> 134

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 42

agctgctcac cacgacgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcctca ggcgaacctc tcggctttcc 120

ccgtcgtggt gagc 134

<210> 43

<211> 151

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 43

aacctctcgg ctttcccgcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgctgaa ccggccaggg ccggcaggcc 120

gagctgctca ccacgacggg gaaagccgag a 151

<210> 44

<211> 155

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 44

agctgctcac cacgacgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttca ggcggctgcg acgagccctc 120

aggcgaacct ctcggctttc cccgtcgtgg tgagc 155

<210> 45

<211> 126

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 45

gcctgcaaac tggtaggcgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcagct gctcaccacg acgcctacca 120

gtttgc 126

<210> 46

<211> 138

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 46

agctgctcac cacgacgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcta cctagtgagc ctgcaaactg 120

gtaggcgtcg tggtgagc 138

<210> 47

<211> 151

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 47

gcctgcaaac tggtaggcgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgctgaa ccggccaggg ccggcaggcc 120

gagctgctca ccacgacgcc taccagtttg c 151

<210> 48

<211> 148

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 48

agctgctcac cacgacgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcaatt cccacggcta cctagtgagc 120

ctgcaaactg gtaggcgtcg tggtgagc 148

<210> 49

<211> 139

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 49

aacctctcgg ctttcccgcg gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgt aaacggccac aagttcagcg 120

tgtccgggga aagccgaga 139

<210> 50

<211> 139

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 50

agctgctcac cacgacgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcactc cagcaggacc atgtgatcgc 120

gcttctcgtc gtggtgagc 139

<210> 51

<211> 139

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 51

gcctgcaaac tggtaggcgc gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcacgt aaacggccac aagttcagcg 120

tgtccgccta ccagtttgc 139

<210> 52

<211> 139

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 52

agctgctcac cacgacgcca gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgcactc cagcaggacc atgtgatcgc 120

gcttctcgtc gtggtgagc 139

<210> 53

<211> 42

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 53

gcgtcagatg tgtataagag acagatggtg agcaagggcg ag 42

<210> 54

<211> 41

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 54

ttcagacgtg tgctcttccg atctaagatg gtgcgctcct g 41

<210> 55

<211> 46

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 55

ttcagacgtg tgctcttccg atctacttgt acagctcgtc catgcc 46

<210> 56

<211> 57

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<220>

<221> misc_feature

<222> (25)..(39)

<223> n 是 a, c, g, 或 t

<400> 56

gcgtcagatg tgtataagag acagnnnnnn nnnnnnnnna tggtgagcaa gggcgag 57

<210> 57

<211> 59

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<220>

<221> misc_feature

<222> (25)..(39)

<223> n 是 a, c, g, 或 t

<400> 57

gcgtcagatg tgtataagag acagnnnnnn nnnnnnnnng cctgcttctc ctcagcttc 59

<210> 58

<211> 45

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 58

ttcagacgtg tgctcttccg atctcattcc cgaatctgcc ctcgg 45

<210> 59

<211> 60

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<220>

<221> misc_feature

<222> (25)..(39)

<223> n 是 a, c, g, 或 t

<400> 59

gcgtcagatg tgtataagag acagnnnnnn nnnnnnnnna gcctcggctt cttctgggag 60

<210> 60

<211> 45

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 60

ttcagacgtg tgctcttccg atctcattcc cgaatctgcc ctcgg 45

<210> 61

<211> 46

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 61

gcgtcagatg tgtataagag acagcgctca gctccgtttc ggtttc 46

<210> 62

<211> 46

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 62

ttcagacgtg tgctcttccg atctataagc catcgccgtc acttag 46

<210> 63

<211> 61

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<220>

<221> misc_feature

<222> (25)..(39)

<223> n 是 a, c, g, 或 t

<400> 63

gcgtcagatg tgtataagag acagnnnnnn nnnnnnnnnt ccaaggtgaa agcggaagta 60

g 61

<210> 64

<211> 44

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 64

ctgaaggtga tagcggtggc agatcggaag agcacacgtc tgaa 44

<210> 65

<211> 69

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<220>

<221> misc_feature

<222> (25)..(39)

<223> n 是 a, c, g, 或 t

<400> 65

gcgtcagatg tgtataagag acagnnnnnn nnnnnnnnng caagtaagca tgcatttgta 60

ggcttgatg 69

<210> 66

<211> 48

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 66

ttcagacgtg tgctcttccg atctgggttt tccagctgtt aagcacag 48

<210> 67

<211> 67

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<220>

<221> misc_feature

<222> (25)..(39)

<223> n 是 a, c, g, 或 t

<400> 67

gcgtcagatg tgtataagag acagnnnnnn nnnnnnnnnc gctccgaagg taaaagaaat 60

cattgag 67

<210> 68

<211> 52

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 68

ttcagacgtg tgctcttccg atcttctcct gtactctctg ccttatagag ac 52

<210> 69

<211> 64

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<220>

<221> misc_feature

<222> (25)..(39)

<223> n 是 a, c, g, 或 t

<400> 69

gcgtcagatg tgtataagag acagnnnnnn nnnnnnnnng ttccagaacc ggaggacaaa 60

gtac 64

<210> 70

<211> 48

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 70

ttcagacgtg tgctcttccg atcttgctgt ggagctggag gtagagac 48

<210> 71

<211> 60

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<220>

<221> misc_feature

<222> (25)..(39)

<223> n 是 a, c, g, 或 t

<400> 71

gcgtcagatg tgtataagag acagnnnnnn nnnnnnnnna gcctcggctt cttctgggag 60

<210> 72

<211> 45

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 72

ttcagacgtg tgctcttccg atctcattcc cgaatctgcc ctcgg 45

<210> 73

<211> 61

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<220>

<221> misc_feature

<222> (25)..(39)

<223> n 是 a, c, g, 或 t

<400> 73

gcgtcagatg tgtataagag acagnnnnnn nnnnnnnnnt tgggttggta actggatgtt 60

g 61

<210> 74

<211> 46

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 74

ttcagacgtg tgctcttccg atctgggttt tcatgtcctc tgcttc 46

<210> 75

<211> 60

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<220>

<221> misc_feature

<222> (25)..(39)

<223> n 是 a, c, g, 或 t

<400> 75

gcgtcagatg tgtataagag acagnnnnnn nnnnnnnnna gcctcggctt cttctgggag 60

<210> 76

<211> 51

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 76

ttcagacgtg tgctcttccg atctctctta caagccaagt actgtgctaa g 51

<210> 77

<211> 60

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<220>

<221> misc_feature

<222> (25)..(39)

<223> n 是 a, c, g, 或 t

<400> 77

gcgtcagatg tgtataagag acagnnnnnn nnnnnnnnna gcctcggctt cttctgggag 60

<210> 78

<211> 49

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 78

ttcagacgtg tgctcttccg atctgagcat ctccttttac aacctaagc 49

<210> 79

<211> 21

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 79

cctgcttctc ctcagcttca g 21

<210> 80

<211> 23

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 80

ttctcttccc acacgcagtc ctc 23

<210> 81

<211> 26

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 81

tctcggcttt ccccgtcgtg gtgagc 26

<210> 82

<211> 22

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 82

ttcccacggc tacctagtga gc 22

<210> 83

<211> 23

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 83

ttctcttccc acacgcagtc ctc 23

<210> 84

<211> 27

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 84

tgctcaccac gacgcctacc agtttgc 27

<210> 85

<211> 22

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 85

ttcccacggc tacctagtga gc 22

<210> 86

<211> 22

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 86

gagttacggc ggtgattcct gc 22

<210> 87

<211> 28

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 87

ctggtaggcc gttctgatca tgcttgct 28

<210> 88

<211> 22

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 88

ttcccacggc tacctagtga gc 22

<210> 89

<211> 23

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 89

tgctgtcttt cagtccccaa agc 23

<210> 90

<211> 28

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 90

ctggtagggt attacgggcc aacctgac 28

<210> 91

<211> 69

<212> DNA

<213> 智人(Homo sapiens)

<400> 91

ggcggctgcg acgagccctc aggcgaacct ctcggctttc ccgcgcggcg ccgcctcttg 60

ctgcgcctc 69

<210> 92

<211> 65

<212> DNA

<213> 智人(Homo sapiens)

<400> 92

gttatggcga cccgcagccc tggcgtcgtg gtgagcagct cggcctgccg gccctggccg 60

gttca 65

<210> 93

<211> 42

<212> DNA

<213> 智人(Homo sapiens)

<400> 93

ggcggctgcg acgagccctc aggcgaacct ctcggctttc cc 42

<210> 94

<211> 42

<212> DNA

<213> 智人(Homo sapiens)

<400> 94

cgtcgtggtg agcagctcgg cctgccggcc ctggccggtt ca 42

<210> 95

<211> 139

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 95

ggcggctgcg acgagccctc aggcgaacct ctcggctttc cccgtcgtgg tgagcagctc 60

ggcctgccgg ccctcaggcg aacctctcgg ctttccccgt cgtggtgagc agctcggcct 120

gccggccctg gccggttca 139

<210> 96

<211> 67

<212> DNA

<213> 智人(Homo sapiens)

<400> 96

gaaaattccc acggctacct agtgagcctg caaactggta gggcgcggcg ccgcctcttg 60

ctgcgcc 67

<210> 97

<211> 68

<212> DNA

<213> 智人(Homo sapiens)

<400> 97

tccgttatgg cgacccgcag ccctggcgtc gtggtgagca gctcggcctg ccggccctgg 60

ccggttca 68

<210> 98

<211> 42

<212> DNA

<213> 智人(Homo sapiens)

<400> 98

gaaaattccc acggctacct agtgagcctg caaactggta gg 42

<210> 99

<211> 42

<212> DNA

<213> 智人(Homo sapiens)

<400> 99

cgtcgtggtg agcagctcgg cctgccggcc ctggccggtt ca 42

<210> 100

<211> 140

<212> DNA

<213> 人工序列(Artificial sequence)

<220>

<223> 合成的(Synthetic)

<400> 100

gaaaattccc acggctacct agtgagcctg caaactggta ggcgtcgtgg tgagcagctc 60

ggcctgccgg ctacctagtg agcctgcaaa ctggtaggcg tcgtggtgag cagctcggcc 120

tgccggccct ggccggttca 140

Claims

1.一种编辑具有正义链和反义链的双链DNA(dsDNA)分子的方法，所述方法包括：

使dsDNA分子与对dsDNA分子的正义链上的第一靶序列具有特异性的第一编辑复合物和对dsDNA分子的反义链上的第二靶序列具有特异性的第二编辑复合物接触；

其中所述第一编辑复合物和第二编辑复合物各包含融合编辑器蛋白和与其相关联的延伸的向导RNA分子，其中所述融合编辑器各包含功能性切口酶结构域和功能性逆转录酶结构域；

其中所述第一编辑复合物的延伸的向导RNA分子包含具有第一序列的第一向导结构域和在3'端的第一延伸的结构域，所述第一序列与第一靶序列杂交；以及

其中所述第二编辑复合物的延伸的向导RNA分子包含具有第二序列的第二向导结构域和在3'端的第二延伸的结构域，所述第二序列与第二靶序列杂交；以及

允许所述第一编辑复合物的功能性切口酶结构域和所述第二编辑复合物的功能性切口酶结构域分别在所述第一靶序列和第二靶序列处的dsDNA分子的相对链中产生第一单链断裂和第二单链断裂；

允许所述第一编辑复合物的功能性逆转录酶结构域使用第一延伸的结构域作为模板从所述第一单链断裂产生第一3'突出端，并且允许所述第二编辑复合物的功能性逆转录酶结构域使用第二延伸的结构域作为模板从所述第二单链断裂产生第二3'突出端；

通过切除最初置于所述第一单链断裂和第二单链断裂之间的部分dsDNA并将所述第一3'突出端和第二3'突出端结合到修复的dsDNA分子中来修复dsDNA分子。

2.权利要求1所述的方法，其中所述第一编辑复合物的功能性切口酶结构域和所述第二编辑复合物的功能性切口酶结构域独立地是CRISPR相关的(Cas)酶、激烈火球菌Argonaute等，或源自它们的功能性切口酶结构域。

3.权利要求2所述的方法，其中所述Cas是Cas9、Cas12、Cas13、Cas3、CasΦ等。

4.权利要求1至权利要求3中之一所述的方法，其中所述第一编辑复合物的功能性逆转录酶结构域和所述第二编辑复合物的功能性逆转录酶结构域独立地是M-MLV RT、HIV RT、II组内含子RT(TGIRT)、superscript IV等，或其功能性结构域。

5.权利要求1至权利要求4中之一所述的方法，其中相比所述第二靶序列的反向互补序列，所述第一靶序列置于正义链中的更靠5'的位置。

6.权利要求1至权利要求4中之一所述的方法，其中相比所述第二靶序列的反向互补序列，所述第一靶序列置于正义链中的更靠3'的位置。

7.权利要求1至权利要求6中任一项所述的方法，其中所述第一3'突出端和第二3'突出端是彼此的反向互补序列，并且在修复步骤中杂交。

8.权利要求1至权利要求6中之一所述的方法，其中所述第一3'突出端包含第一修复结构域，所述第一修复结构域具有对应于紧靠反义链中第二3'突出端的5'的序列的序列，并且其中所述第二3'突出端包含第二修复结构域，所述第二修复结构域具有对应于紧靠正义链中第一3'突出端的5'的序列的序列。

9.权利要求8所述的方法，其中所述第一3'突出端还包含第一修复结构域的5'的插入序列，并且其中所述第二3'突出端包含第二修复结构域的5'的插入序列的反向互补序列。

10.权利要求1所述的方法，其中所述第一3'突出端包含第一修复结构域，所述第一修复结构域具有对应于紧靠第二单链断裂的3'的序列的序列，并且其中所述第二3'突出端包含第二修复结构域，所述第二修复结构域具有对应于紧靠第一单链断裂的3'的序列的序列，由此所述修复步骤导致对应于最初置于所述第一单链断裂和第二单链断裂之间的部分dsDNA的序列的倒置。

11.权利要求1所述的方法，其中所述第一3'突出端包含第一修复结构域，所述第一修复结构域具有对应于插入DNA片段的第一末端结构域的序列，其中所述第二3'突出端包含第二修复结构域，所述第二修复结构域具有对应于插入DNA片段的第二末端结构域的序列，并且其中所述第一末端结构域和第二末端结构域在插入DNA片段的相对末端或在较大的dsDNA分子内的不同位点。

12.权利要求1所述的方法，其中被切除的最初置于所述第一单链断裂和第二单链断裂之间的部分dsDNA分子为至少5个核苷酸长。

13.权利要求12所述的方法，其中被切除的最初置于所述第一单链断裂和第二单链断裂之间的部分dsDNA分子为约10个核苷酸至1000000个核苷酸长。

14.权利要求1所述的方法，其中所述第一编辑复合物和/或第二编辑复合物包含被配置成增强3'-突出端产生效率的另外的功能性结构域。

15.权利要求1所述的方法，其中所述第一编辑复合物和/或第二编辑复合物的融合编辑器蛋白包含被配置成使用产生的3'突出端增强DNA修复效率的另外的功能性结构域。

16.权利要求1所述的方法，其中所述第一向导结构域和第二向导结构域独立地为约20至约200个核苷酸长。

17.权利要求16所述的方法，其中所述第一向导结构域和第二向导结构域独立地为约25至100个核苷酸长、约25至50个核苷酸长，或者约25至40个核苷酸长。

18.权利要求1所述的方法，其中所述第一向导结构域和第二向导结构域被配置成分别与所述第一编辑复合物和第二编辑复合物相容，和/或在所述第一向导结构域和/或第二向导结构域中的一个或多个核苷酸残基用2'-O-甲基化、锁核酸、肽核酸、或类似的功能性修饰的核酸部分修饰。

19.权利要求1所述的方法，其中所述第一延伸的结构域和第二延伸的结构域独立地为至少约10个核苷酸长。

20.权利要求19所述的方法，其中所述第一延伸的结构域和第二延伸的结构域独立地为约10个核苷酸至约40个核苷酸长。

21.权利要求1所述的方法，其中所述方法在体外细胞中进行。

22.权利要求1所述的方法，其中所述方法在体内细胞中进行。

23.权利要求22所述的方法，其中所述方法是治疗方法，其包括基因组序列的删除、倒置基因组序列、染色体间重排、和/或将新序列插入基因组的靶区域或靶位点。

24.权利要求1至权利要求23中之一所述的方法，其中所述方法包括使所述dsDNA与多对第一编辑复合物和第二编辑复合物接触，其中每对第一编辑复合物和第二编辑复合物靶向所述dsDNA内的不同对的第一靶序列和第二靶序列。

25.权利要求24所述的方法，其中所述接触包括汇聚多个pegRNA或多个编码pegRNA的核酸分子，并使包含dsDNA分子的细胞与多个pegRNA或多个编码pegRNA的核酸分子的库接触。

26.权利要求25所述的方法，所述方法还包括使所述细胞与一种或多种融合编辑器蛋白或编码一种或多种融合编辑器蛋白的一种或多种核酸分子接触，并允许所述融合编辑器蛋白在细胞内表达和/或复合。

27.一种在细胞中编辑一个或多个双链DNA(dsDNA)分子的方法，所述方法包括使所述细胞与一对或多对第一编辑复合物和第二编辑复合物、或编码一对或多对第一复合物和第二复合物的组分的一种或多种核酸接触，并允许所述组分在细胞中表达和组装；

其中对于一对或多对第一编辑复合物和第二编辑复合物中的每一对：

所述第一编辑复合物对dsDNA分子的正义链上的第一靶序列具有特异性，并且所述第二编辑复合物对dsDNA分子的反义链上的第二靶序列具有特异性；

所述第一编辑复合物和第二编辑复合物各包含融合编辑器蛋白和与其相关联的延伸的向导RNA分子，其中所述融合编辑器各包含功能性切口酶结构域和功能性逆转录酶结构域；

所述第一编辑复合物的延伸的向导RNA分子包含具有第一序列的第一向导结构域和在3'末端的第一延伸的结构域，所述第一序列与第一靶序列杂交；以及

所述第二编辑复合物的延伸的向导RNA分子包含具有第二序列的第二向导结构域和在3'末端的第二延伸的结构域，所述第二序列与第二靶序列杂交；以及

对于每对第一编辑复合物和第二编辑复合物：

允许所述第一编辑复合物的功能性切口酶结构域和所述第二编辑复合物的功能性切口酶结构域分别在第一靶序列和第二靶序列处的dsDNA分子的相对链中产生第一单链断裂和第二单链断裂；

允许所述第一编辑复合物的功能性逆转录酶结构域使用第一延伸的结构域作为模板从所述第一单链断裂产生第一3'突出端，并且允许所述第二编辑复合物的功能性逆转录酶结构域使用第二延伸的结构域作为模板从所述第二单链断裂产生第二3'突出端；以及

28.权利要求27所述的方法，所述方法包括使所述细胞与多对第一编辑复合物和第二编辑复合物、或编码多对第一复合物和第二复合物的组分的多种核酸接触，并允许所述组分在细胞中表达和组装，其中每对第一编辑复合物和第二编辑复合物靶向所述细胞中的一个或多个dsDNA分子上不同的第一靶序列和第二靶序列。

29.一种试剂盒，其包含如权利要求1至权利要求20中之一所述的第一编辑复合物和第二编辑复合物，其中所述正义链上的第一靶序列和所述反义链上的第二靶序列被间隔序列分开，并且其中所述第一编辑复合物和第二编辑复合物被配置成在靶dsDNA分子中在由所述第一编辑复合物和第二编辑复合物诱导的第一和/或第二单链断裂处删除间隔序列、倒置间隔序列、和/或插入一个或多个新序列。