CN118339297A

CN118339297A - 与内含肽融合的转录激活因子样效应物

Info

Publication number: CN118339297A
Application number: CN202280060864.5A
Authority: CN
Inventors: 罗伯特·W·威廉斯; 萨拉·威尔森
Original assignee: Cibus Europe BV
Current assignee: Cibus Europe BV
Priority date: 2021-07-07
Filing date: 2022-07-07
Publication date: 2024-07-12
Also published as: US20240200043A1; KR20240054969A; AU2022308733A9; AU2022308733A1; CO2024001202A2; IL309972A; WO2023283597A1; JP2024523759A; EP4367248A1; CA3225278A1

Abstract

本公开的实施方式涉及编码与第一转录激活因子样效应物(TALE)的至少一部分融合的第一内含肽的多种核苷酸序列，编码与第二TALE的至少一部分融合的第一内含肽的第二核苷酸序列，以及编码与稀有切割核酸酶的至少一部分融合的第二内含肽的第三核苷酸序列。

Description

与内含肽融合的转录激活因子样效应物

以援引方式并入以电子方式提交的材料

通过援引以其全部内容并入的是与本文同时提交的计算机可读核苷酸/氨基酸序列表，即115kb大小的ASCII文本文件，并标识如下：“C1633112111_序列表”并于2022年7月7日创建。

背景技术

使用稀有切割(rare-cutting)核酸酶(诸如转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶(ZFN))的基因组编辑技术、成簇规律间隔短回文重复(CRISPR)以及相关的CRISPR相关蛋白9(Cas9)或Cpf1系统，加速了基础生物学研究、生物技术、育种和基因治疗。稀有切割核酸酶可用于生成缺失、插入和启动同源重组。TALEN包括稀有切割核酸酶和可靶向特定序列并在脱氧核糖核酸(DNA)中生成精确断裂的TALE。一种TALEN设计包括左半TALEN和右半TALEN，所述左半TALEN包括与识别第一结合位点后接间隔区的稀有切割核酸酶融合的左TALE，所述右半TALEN包括与识别第二结合位点的稀有切割核酸酶融合的右TALE。

发明内容

本公开涉及克服上述与TALE相关的挑战和需求。

各种方面都涉及多种核苷酸序列，包括编码与第一转录激活因子样效应物(TALE)的至少一部分融合的第一内含肽(intein)的第一核苷酸序列，编码与第二TALE的至少一部分融合的所述第一内含肽的第二核苷酸序列，以及编码与稀有切割核酸酶的至少一部分融合的第二内含肽的第三核苷酸序列。

在一些方面，所述第一核苷酸序列编码与所述第一TALE融合的所述第一内含肽，并且所述第二核苷酸序列编码与所述第二TALE融合的所述第一内含肽。在一些其他方面，所述第三核苷酸序列编码与所述稀有切割核酸酶融合的所述第二内含肽。

在一些方面，所述第一核苷酸序列编码与所述稀有切割核酸酶的第一部分和所述第一TALE融合的所述第一内含肽，并且所述第二核苷酸序列编码与所述稀有切割核酸酶的第一部分和所述第二TALE融合的所述第一内含肽。在一些方面，所述第三核苷酸序列编码与所述稀有切割核酸酶的第二部分融合的所述第二内含肽，其中，所述稀有切割核酸酶的第一部分和第二部分形成所述稀有切割核酸酶。

在一些方面，所述多种核苷酸序列各自包括单独的载体和/或位于单个表达构建体上。

在一些方面，所述第一内含肽和所述第二内含肽被配置成当接触时自剪接，并且作为响应，形成包括与所述稀有切割核酸酶结合的所述第一TALE的第一半转录激活因子样效应物核酸酶(TALEN)。在一些其他方面，所述第一内含肽和所述第二内含肽被配置成当接触时自剪接，并且作为响应，形成包括与所述稀有切割核酸酶结合的所述第二TALE的第二半TALEN。

在一些方面，所述第一内含肽和所述第二内含肽被配置成在接触时自剪接，并形成包括与所述第二内含肽结合的所述第一内含肽的剪接蛋白。

在一些方面，所述多种核苷酸序列中的每一个还编码启动子和终止子。

一些方面涉及一种方法，包括使细胞与以下接触：编码与第一转录激活因子样效应物(TALE)的至少一部分融合的第一内含肽的第一核苷酸序列，编码与第二TALE的至少一部分融合的所述第一内含肽的第二核苷酸序列，以及编码与稀有切割核酸酶的至少一部分融合的第二内含肽的第三核苷酸序列。方法还包括，响应于接触细胞，通过第一内含肽和第二内含肽剪接第一TALE、第二TALE和稀有切割核酸酶以形成：包括第一TALE和稀有切割核酸酶的第一半转录激活因子样效应物核酸酶(TALEN)和包括第二TALE和稀有切割核酸酶的第二半TALEN。

在一些方面，方法还包括翻译所述第一核苷酸序列、所述第二核苷酸序列和所述第三核苷酸序列，以形成与所述第一TALE融合的所述第一内含肽、与所述第二TALE融合的所述第一内含肽以及与所述稀有切割核酸酶融合的所述第二内含肽。

在一些方面，方法还包括使用第一半TALEN和第二半TALEN转化细胞。

在一些方面，所述第一核苷酸序列编码与所述第一TALE的C末端融合的N末端内含肽，所述第二核苷酸序列编码与所述第二TALE的C末端融合的所述N末端内含肽，并且所述第三核苷酸序列编码与所述稀有切割核酸酶的N末端融合的C末端内含肽或在所述稀有切割核酸酶的部分之间融合的所述C末端内含肽。

在一些方面，所述第一核苷酸序列编码与所述第一TALE的N末端融合的C末端内含肽，所述第二核苷酸序列编码与所述第二TALE的N末端融合的所述C末端内含肽，并且所述第三核苷酸序列编码与所述稀有切割核酸酶的C末端融合的N末端内含肽或在所述稀有切割核酸酶的部分之间融合的所述N末端内含肽。

在一些方面，剪接包括将第一内含肽与第二内含肽结合以形成：第一中间体，所述第一中间体包括与所述第二内含肽结合的所述第一内含肽，其中，所述第一内含肽与所述第一TALE融合，并且所述第二内含肽与所述稀有切割核酸酶融合；以及第二中间体，所述第二中间体包括与所述第二内含肽结合的所述第一内含肽，其中，所述第一内含肽与所述第二TALE融合，并且所述第二内含肽与所述稀有切割核酸酶融合。

在一些方面，剪接包括：将第一内含肽与第二内含肽结合，在与第一内含肽和第二内含肽相关的剪接位点处切割，并将第一TALE与稀有切割核酸酶结合并且将第二TALE与稀有切割核酸酶结合，以形成第一半TALEN和第二半TALEN。

在一些方面，剪接位点位于第一内含肽和第一TALE之间，第一内含肽和第二TALE之间，以及第二内含肽和稀有切割核酸酶或其部分之间。

一些方面涉及表达构建体，包括：编码与至少第一转录激活因子样效应物(TALE)融合的第一内含肽的第一核苷酸序列，编码与至少第二TALE融合的第一内含肽的第二核苷酸序列，以及编码与稀有切割核酸酶的至少一部分融合的第二内含肽的第三核苷酸序列。

在一些方面，第一核苷酸序列编码与第一TALE的C-末端融合的N-末端内含肽，第二核苷酸序列编码与第二TALE的C-末端融合的N-末端内含肽，并且第三核苷酸序列编码与稀有切割核酸酶的N-末端融合的或在稀有切割核酸酶的部分之间融合的C-末端内含肽。

在一些方面，第一核苷酸序列编码与第一TALE的N-末端融合的C-末端内含肽，第二核苷酸序列编码与第二TALE的N-末端融合的C-末端内含肽，并且第三核苷酸序列编码与稀有切割核酸酶的C-末端融合的或在稀有切割核酸酶的部分之间融合的N末端内含肽。

在一些方面，响应于由细胞对第一核苷酸序列、第二核苷酸序列和第三核苷酸序列的翻译，第一内含肽和第二内含肽被配置成彼此结合并自剪接以形成：包括与稀有切割核酸酶结合的第一TALE的第一半转录激活因子样效应物核酸酶(TALEN)、包括与稀有切割核酸酶结合的第二TALE的第二半TALEN，以及包括与第二内含肽结合的第一内含肽的剪接蛋白。

在一些方面，第一核苷酸序列、第二核苷酸序列以及第三核苷酸序列包括单独的载体或位于单个表达构建体上。

在一些方面，第一TALE包括第一多个TALE重复序列，其以组合形式与靶DNA序列中的第一核苷酸序列结合，并且第二TALE包括第二多个TALE重复序列，其以组合形式与靶DNA序列中的第二核苷酸序列结合。

在一些方面，第一核苷酸序列、第二核苷酸序列和第三核苷酸序列中的每一个还编码启动子和终止子。

各种方面都涉及由多种核苷酸序列转化的植物、植物部分或植物细胞，所述多种核苷酸序列，包括：编码与第一转录激活因子样效应物(TALE)的至少一部分融合的第一内含肽的第一核苷酸序列，编码与第二TALE的至少一部分融合的第一内含肽的第二核苷酸序列，以及编码与稀有切割核酸酶的至少一部分融合的第二内含肽的第三核苷酸序列。并且，其中经转化的植物、植物部分或植物细胞表达与第一TALE融合的第一内含肽、与第二TALE融合的第一内含肽以及与稀有切割核酸酶融合的第二内含肽。

在一些方面，与第一TALE融合的第一内含肽，与第二TALE融合的第一内含肽以及与稀有切割核酸酶融合的第二内含肽中的经表达的第一内含肽和第二内含肽自剪接以形成：包括与稀有切割核酸酶结合的第一TALE的第一半转录激活因子样效应物核酸酶(TALEN)、包括与稀有切割核酸酶结合的第二TALE的第二半TALEN，以及包括与第二内含肽结合的第一内含肽的剪接蛋白。

在一些方面，经转化的植物、植物部分或植物细胞呈现出：包括与所述稀有切割核酸酶结合的所述第一TALE的第一半转录激活因子样效应物核酸酶(TALEN)；包括与所述稀有切割酶结合的所述第二TALE的第二半TALEN；以及包括与所述第二内含肽结合的所述第一内含肽的剪接蛋白。

各种实施方式涉及由本文所述的方法、载体、表达构建体、核苷酸序列和/或系统转化的宿主细胞和/或生物。

各种实施方式涉及形成本文要求保护的核苷酸序列和/或系统的任何一种的方法。

附图说明

结合附图考虑以下详细描述，可更全面地理解各种示例性实施方式，其中：

图1A-1D是说明以下的图：与本公开一致的编码带有TALE的第一内含肽和编码带有稀有切割核酸酶的第二内含肽的实例核苷酸序列。

图2是说明与本公开一致的使用实例核苷酸序列生成TALEN的实例方法。

图3A-3B是说明与本公开一致的实例表达构建体的图。

图4是说明与本公开一致通过内含肽剪接形成TALEN的实例的流程图。

图5说明了示出与本公开一致的使用核苷酸序列编辑细胞得到的基因型分型的图像。

图6A-6C说明了与本公开一致来自YFP阴性对照、TALEN阳性对照和内含肽的基因组区域的完整图像。

图7说明了与本公开一致的使用不同质粒载体转化大豆外植体的实例结果。

图8A-8I说明了与本公开一致的使用不同质粒载体转化大麻外植体的结果。

具体实施方式

本公开的方面涉及各种方法、核苷酸序列、系统、表达构建体以及使用该核苷酸序列转化的宿主细胞和/或生物。虽然本发明不一定限于这些应用，但是通过使用该上下文讨论各种实施方式可以理解本发明的各种方面。

因此，在以下描述中，阐述了各种具体细节来描述本文所呈现的具体实施方式。然而，对于本领域技术人员来说显而易见的是，在下文没有给出所有具体细节的情况下，也可实施一种或多种其他实例和/或这些实施方式的变体。在其他情况下，没有详细地描述公知的特征，以免混淆本文实施方式的描述。为了便于说明，在不同的图中可使用相同的附图标记来指代相同的元件或相同元件的额外例子。

稀有切割核酸酶，诸如稀有切割内切核酸酶，可用于靶向特定基因或靶向多种基因。非限制性实例包括TALEN、工程化的归巢内切核酸酶、ZFN、兆核酸酶和CRISPR。稀有切割核酸酶可以是天然的或工程化的蛋白，其具有针对具有识别位点的核苷酸序列的内切核酸酶活性，有时称为靶序列，其长度为12-40个碱基对或更长。典型地，稀有切割核酸酶在识别位点内引起切割。在某些情况下，稀有切割核酸酶是融合蛋白，其包含与具有切割活性的核酸酶结构域融合的结合结构域。该结合结构域可被配置成与靶序列结合。稀有切割内切核酸酶结构域可被配置成在与靶位置相关的靶基因组基因座上诱导突变。TALEN和ZFN是结合结构域与核酸酶结构域(诸如FokI的内切核酸酶，有时称为Fok1)的融合蛋白的实例。可对TALEN进行基因工程改造，使其经由与核酸酶结构域融合的结合结构域对靶序列具有特异性，从而产生靶向特定选定DNA序列的嵌合核酸酶，并引导在靶序列处或附近切割DNA。这种DNA切割(双链断裂)可诱导突变，诸如精确且有效地敲除或改变基因功能。

根据本公开的实施方式涉及在包含TALE和核酸酶的核苷酸序列中使用内含肽。在一些实施方式中，半TALE和核酸酶彼此分离，并在翻译后，内含肽可将相应的半TALE剪接并连接到核酸酶上。通过使用包含半TALE和核酸酶的核苷酸序列的互补内含肽，与包含完整半TALE的核苷酸序列相比，递送至生物细胞并用于转化生物细胞的载体可具有更低的质粒大小，有时称为“运载物(cargo)大小”。减小的质粒大小可增加核苷酸序列的表达频率。此外，在包含TALE和核酸酶的核苷酸序列中使用内含肽可增加基因编辑材料向细胞递送的灵活性。

在一些实施方式中，不同的核苷酸序列可在共同的表达构建体(诸如质粒)上递送。虽然一起递送，但每个核苷酸序列编码不同的分子复合物，以与其他分子复合物分开转录并翻译。分子复合物是一起转录并翻译形成蛋白或融合蛋白的化合物或多种化合物的复合物。例如，第一核苷酸序列编码与第一内含肽融合的第一TALE的分子复合物，其一起经翻译并转录以形成包括经融合的第一TALE和第一内含肽的融合蛋白。与翻译和转录与第一TALE融合的核酸酶相比，所得分子复合物具有更小的运载物大小。如本文所用，融合蛋白包括和/或是指包括由经连接或固定在一起的独立基因编码的至少两个结构域的蛋白或蛋白复合物，使得上述基因作为单个单位一起转录和/或翻译，从而产生单个多肽。

在上述实施方式中的任一个中，分子复合物经转录并翻译，并然后经剪接形成TALEN以转化细胞。细胞内递送的分子复合物的减少的运载物大小可增加转录形式的分子复合物的转录形式的表达频率。此外，在包含TALE和核酸酶的分子复合物中使用内含肽可增加基因编辑材料向细胞递送的灵活性。例如，编码核酸酶的核苷酸序列可保持不变，只有对TALE的可变部分针对不同的靶标(例如，在第一和第二核苷酸序列中)进行了修改。

现在转到附图，图1A-1D是说明与本公开一致的编码带有TALE的第一内含肽和编码带有稀有切割核酸酶的第二内含肽的示例性核苷酸序列的图。

如图1A所示，多种核苷酸序列100编码与第一TALE 102的至少一部分融合的第一内含肽104，并且编码与稀有切割核酸酶108的至少一部分融合的第二内含肽106。如图1B进一步所示，第一TALE 102可包括TALEN-末端103、第一多个TALE重复序列105(示出为结合结构域)和TALE C-末端107。第一多个TALE重复序列105可以组合形式结合靶DNA序列中的第一核苷酸序列，并可被称为结合结构域。TALE重复序列可是在两个位置(位置12和13)处有所不同(有时被称为“重复可变双残基(RVD)”)的33至35个氨基酸长的重复序列的阵列。每个RVD识别单个核苷酸，并且因此多重复序列的阵列识别了与在阵列中的重复序列数目相应长度的独特核苷酸序列，有时称为“靶序列.”。阵列的RVD一起形成结合靶序列的结合结构域。

如图1B所示，另一多种核苷酸序列101可编码与第一TALE 102的至少一部分融合的第一内含肽104、与稀有切割核酸酶108的至少一部分融合的第二内含肽106，以及与第二TALE 110的至少一部分融合的第一内含肽112。第一内含肽104、112可包括编码同一内含肽的核苷酸序列(例如，内含肽序列出现两次)。第二TALE 110可包括TALE N-末端109、第二多个TALE重复序列111(示出为结合结构域)和TALE C-末端113。第二多个TALE重复序列111可组合形式结合靶DNA序列中的第二核苷酸序列，并可被称为结合结构域。

如图1B所示，多种核苷酸序列101可包括编码与第一TALE 102融合的第一内含肽104的第一核苷酸序列、编码与第二TALE 110融合的第一内含肽112的第二核苷酸序列，以及编码与稀有切割核酸酶108融合的第二内含肽106的第三核苷酸序列。然而，实例不限于此，并且第一和/或第二内含肽可与第一TALE 102、第二TALE 110和/或稀有切割核酸酶108的部分融合，如图1C进一步所示。

在一些实施方式中，多种核苷酸序列100、101可各自形成单独的载体。在一些实施方式中，多种核苷酸序列100、101可在单个表达构建体上形成，如图3A-3B所示。

第一内含肽104、112和第二内含肽106可被配置为在接触时自剪接。响应于自剪接，可形成包括与稀有切割核酸酶108结合的第一TALE 102的第一半TALEN。此外，可形成包括与稀有切割核酸酶108结合的第二TALE 110的第二半TALEN。此外，可形成包括与第二内含肽106结合的第一内含肽104、112的剪接蛋白。在一些实例中，剪接蛋白是反式剪接蛋白。在一些实例中，剪接蛋白是顺式剪接蛋白。

如本文所用，内含肽是从内含肽所结合的一种或多种其他蛋白上自切除的内部蛋白片段或元件，并且内含肽催化侧翼部件(有时称为外显肽)通过肽键连接。内含肽切除是一个翻译后过程，其可以不需要辅助酶或辅因子。类似于前mRNA的RNA内含子的剪接，将这种自切除过程称为“蛋白剪接”(Perler F等，Nucl Acids RES.22：1125-1127(1994))。第一内含肽104、112和第二内含肽106可分别包括彼此具有亲和力的N-末端内含肽和C-末端内含肽，并且它们在接触时结合在一起。第一内含肽104、112和第二内含肽106可称为反式剪接内含肽。对于反式剪接，一个内含肽是与N-外显肽结合的N-末端内含肽(例如，片段)，并且另一个内含肽是与C-外显肽结合的C-末端内含肽。N-末端内含肽和C-末端内含肽结合在一起，发生自剪接，并催化N-外显肽和C-外显肽的连接。在一些实例中，内含肽序列来源于集胞藻(Synechocystis sp)、酿酒酵母(Saccharomyces cerevisiae)、掘越氏热球菌(Pyrococcus horikoshii)、蟾分枝杆菌(Mycobacterium xenopi)、科达热球菌(Thermococcus kodakarensis)、詹氏甲烷球菌(Methanocaldococcus jannaschii)和点形念珠藻(Nostoc punctiforme)等。内含肽的实例包括Tfu pol-1内含肽、DNA聚合酶(DnaE)内含肽(例如，Ssp DnaE、Npu DnaE)、Gp41-1、Mxe GyrA、Mru RecA、MTU RecA、Tli Pol-2、Sce VMA和Ssp DNA解旋酶(Dna B)等。

在一些实施方式中，第一和第二内含肽104、112、106可以是正交内含肽(orthogonal intein)。例如，集胞藻的N-末端内含肽可与念珠藻的C-末端内含肽结合，和/或两种不同的N-末端内含肽可与同一C-末端内含肽结合。

如本文进一步说明的，诸如通过图1D，多种核苷酸序列100、101可各自进一步编码额外的元件，诸如启动子和/或终止子。

图1C说明了多种核苷酸序列115的实例，这些核苷酸序列编码与稀有切割核酸酶和TALE的一部分融合的内含肽。例如，第一核苷酸序列编码与融合至第一TALE 102的稀有切割核酸酶的第一部分108-1融合的第一内含肽104。第二核苷酸序列编码与稀有切割核酸酶的第二部分108-2融合的第二内含肽106。如图所示，稀有切割核酸酶的第一部分108-1融合到第一TALE 102和第一内含肽104之间。类似于多种核苷酸序列100、101，第一内含肽104和第二内含肽106可被配置成在接触时自剪接。响应于剪接，稀有切割核酸酶的第一和第二部分108-1、108-2可结合在一起以与第一TALE 102一起形成第一半TALEN。尽管图1C未说明，但在一些实施方式中，第三核苷酸序列可编码与融合至第二TALE的稀有切割核酸酶的第一部分108-1融合的第一内含肽104，并且响应于剪接，稀有切割核酸酶的第一和第二部分108-1、108-2可结合在一起以与第二TALE形成第二半TALEN。

图1D说明了多种核苷酸序列117的实例，其各自额外地包括启动子和终止子。例如，第一核苷酸序列编码第一启动子116、第一TALE 102、第一内含肽104、第一终止子118，以及任选地稀有切割核酸酶的一部分108-2。第二核苷酸序列编码第二启动子124、第二TALE 110、第一内含肽112、第二终止子126，以及任选地稀有切割核酸酶的一部分108-3。第三核苷酸序列编码第三启动子120、第二内含肽106、稀有切割核酸酶的至少一部分108-2以及第三终止子122。在一些实施方式中，第二内含肽106与稀有切割核酸酶的第二部分108-2融合，并且第一内含肽104、112分别与稀有切割核酸酶的第一部分108-1、108-3和第一TALE102或第二TALE 110融合。

然而，实施方式不限于此，并且在各种实施方式中，第一内含肽104、112可与第一TALE 102的第一部分和/或第二TALE 110的第一部分融合，和/或第二内含肽106与第一TALE 102的第二部分和/或第二TALE 110的第二部分(其与稀有切割核酸酶融合成单个核苷酸序列)融合。在其他实施方式中，第二内含肽106与稀有切割核酸酶融合成单个核苷酸序列。

作为非限制性实例，启动子可包括胭脂碱合酶启动子(NosPro)或T7启动子等。其他启动子实例可包括Sp6启动子、T3启动子、Ubi启动子、花椰菜花叶病毒(CaMV)35S启动子、ADHI启动子、ADH1启动子、GDS启动子、TEF1启动子、Gal1启动子、CaMKlla启动子、T7lac启动子、araBAD启动子、trp启动子、lac启动子、Ptac启动子等。

作为非限制性实例，终止子可包括Nos终止子(NosTerm)、CaMV终止子、t7S、tE9、tmas、tocs、tTr9、tpinIII、tORF25、ttml等。

图2是说明与本公开一致的使用实例核苷酸序列生成TALEN的实例方法。方法230中使用的核苷酸序列可包括图1A-1D中任一图的核苷酸序列100、101、115、117。

在232处，方法230包括将细胞与第一核苷酸序列、第二核苷酸序列和第三核苷酸序列接触。第一核苷酸序列编码与第一TALE的至少一部分融合的第一内含肽。第二核苷酸序列编码与第二TALE的至少一部分融合的第一内含肽。第三核苷酸序列编码与稀有切割核酸酶的至少一部分融合的第二内含肽。

在234处，响应于接触细胞，方法230包括，通过第一内含肽和第二内含肽剪接第一TALE、第二TALE和稀有切割核酸酶以形成包括第一TALE和稀有切割核酸酶的第一半TALEN和包括第二TALE和稀有切割核酸酶的第二半TALEN。第一和第二半TALEN可包括左半TALEN和右半TALEN。

例如，并且响应于将细胞与核苷酸序列接触，方法230可包括由细胞转录和/或翻译第一核苷酸序列、第二核苷酸序列和第三核苷酸序列。响应于转录和/或翻译，可形成或表达与第一TALE融合的第一内含肽、与第二TALE融合的第一内含肽以及与稀有切割核酸酶融合的第二内含肽。在各种实施方式中，可转录和/或翻译第一核苷酸序列、第二核苷酸序列和第三核苷酸序列中每一个的多个拷贝，产生与第一TALE融合的第一内含肽、与第二TALE融合的第一内含肽和与稀有切割核酸酶融合的第二内含肽中每一个的多个拷贝。

第一内含肽和第二内含肽在接触时可自剪接。剪接过程可导致在形成第一TALEN和第二TALEN之前形成中间体。例如，第一内含肽和第二内含肽可结合以形成第一中间体和第二中间体，如图4进一步所示。第一中间体可包括与第二内含肽结合的第一内含肽，其中第一内含肽与第一TALE融合，并且第二内含肽与稀有切割核酸酶融合。第二中间体可包括与第二内含肽结合的第一内含肽，其中第一内含肽与第二TALE融合，并且第二内含肽与稀有切割核酸酶融合。

如上所述，剪接包括内含肽之间的结合、剪接位点处的切割和部件之间的结合。例如，剪接包括：将第一内含肽与第二内含肽结合，在与第一内含肽和第二内含肽相关的剪接位点处切割，并将第一TALE与稀有切割核酸酶结合并且将第二TALE与稀有切割核酸酶结合，以形成第一半TALEN和第二半TALEN。在一些实例中，剪接可包括将稀有切割核酸酶的第一和第二部分相互结合以形成完整的稀有切割核酸酶。

剪接位点可在多种核苷酸序列的部件之间。例如，剪接位点可在第一内含肽和第一TALE之间、第一内含肽和第二TALE之间以及第二内含肽和稀有切割核酸酶或其部分之间。在一些实施方式中，剪接位点可在第二内含肽与稀有切割核酸酶的第一和第二部分的每一个之间。

在一些实施方式中，方法230还可包括使用第一半TALEN和第二半TALEN来转化细胞。例如，第一半TALEN和第二半TALEN可经由结合结构域与靶DNA序列结合，作为响应，第一半TALEN和第二半TALEN的内切核酸酶可在靶序列中或靶序列附近引起双链断裂。

各种实施方式涉及包括多种核苷酸序列的系统。在一些实施方式中，单个表达构建体可包括多种核苷酸序列中的每一个。在其他实施方式中和/或此外，每个核苷酸序列可形成单独的载体。

图3A-3B是说明与本公开一致的示例性表达构建体的图，诸如包括图1A-1D所示核苷酸序列的表达构建体。尽管图3A-3B说明了单个表达构建体340、360，但实施方式不限于此，并且各个核苷酸序列可位于单独的形成系统的载体上。

系统或表达构建体340、360包括上述第一核苷酸序列341-A、341-B、第二核苷酸序列343-A、343-B和第三核苷酸序列345-A、345-B。第一核苷酸序列341-A、341-B编码与第一TALE 303、305、307的至少一部分融合的第一内含肽304、362。第一TALE 303、305、307可包括TALE N-末端303、第一多个TALE重复序列(例如第一结合结构域(BD1)305)以及TALE C-末端307。第一多个TALE重复序列与靶DNA序列中的第一核苷酸序列结合。第一核苷酸序列341-A、341-B还包括第一启动子342和第一终止子344。第一启动子342可位于第一TALE303、305、307和第一内含肽304、362的上游，并且第一终止子344可位于第一TALE 303、305、307和第一内含肽304、362的下游。

第二核苷酸序列343-A、343-B编码与第二TALE 309、311、313的至少一部分融合的第一内含肽312、364。第二TALE 309、311、307可包括TALE N-末端309、第二多个TALE重复序列(例如第二结合结构域(BD2)311)以及TALE C-末端313。第二多个TALE重复序列与靶DNA序列中的第二核苷酸序列结合。第二核苷酸序列343-A、343-B还包括第二启动子346和第二终止子348。第二启动子346可位于第二TALE 309、311、313和第一内含肽312、364的上游，并且第二终止子348可位于第二TALE 309、311、313和第一内含肽312、364的下游。

第三核苷酸序列345-A、345-B编码与稀有切割核酸酶308的至少一部分融合的第二内含肽306、366。第三核苷酸序列345-A、345-B还包括第三启动子350和第三终止子352。第三启动子350可位于稀有切割核酸酶308和第二内含肽306、366的上游，并且第三终止子352可位于稀有切割核酸酶308和第二内含肽306、366的下游。

如图3A的表达构建体340所示，在一些实施方式中，第一核苷酸序列341-A编码与第一TALE 303、305、307的C-末端307融合的N-末端内含肽304。第二核苷酸序列343-A编码与第二TALE 309、311、313的C-末端313融合的N-末端内含肽312。并且，第三核苷酸序列345-A编码与稀有切割核酸酶308的N-末端融合的或在稀有切割核酸酶308的部分之间融合的C-末端内含肽306。在这样的实施方式中，第一TALE 303、305、307和第二TALE 309、311、313分别位于第一内含肽304、312的上游。第二内含肽306位于稀有切割核酸酶308的至少一部分的上游。

如图3B的表达构建体360所示，在一些实施方式中，第一核苷酸序列341-B编码与第一TALE303、305、307的N-末端303融合的C-末端内含肽362。第二核苷酸序列343-B编码与第二TALE 309、311、313的N-末端309融合的C-末端内含肽364。并且，第三核苷酸序列345-B编码与稀有切割核酸酶308的C-末端融合的或在稀有切割核酸酶308的部分之间融合的N-末端内含肽366。在这样的实施方式中，第一TALE 303、305、307和第二TALE 309、311、313分别位于第一内含肽362、364的下游。第二内含肽366位于稀有切割核酸酶308的至少一部分的下游。

如本文所用，表达构建体包括和/或是指核苷酸序列(例如，核酸序列或DNA序列)，其包括携带基因组编辑试剂(reagent)的一种或多种载体或双元载体。基因组编辑试剂可包括或编码核酸酶和/或TALE。在一些实施方式中，表达构建体可包括各种核苷酸序列，选择并排列这些核苷酸序列以促进基因组编辑试剂在细胞中的转运。例如，表达构建体可包括上述第一核苷酸序列、第二核苷酸序列和第三核苷酸序列。稀有切割核酸酶可包括FokI蛋白以及其他核酸酶。在一些实施方式中，表达构建体和/或载体可包括其他部件，诸如可检测标记、启动子和终止子。可检测标记可包括荧光蛋白、荧光团或与荧光团结合的核苷酸以及其他类型标记。

载体或双元载体包括以下或是指以下：包括一个或多个转基因(有时称为“插入片段(inserts)”)和主链的核酸序列。双元载体可包括表达盒，该表达盒包括转基因和将由转化细胞表达的调控序列。

如本文所用，结构域包括和/或是指蛋白序列的保守部分和可形成三维结构的蛋白的三级结构。结构域可由表达构建体进行编码。

如本文进一步说明的，响应于分别包括第一核苷酸序列341-A、341-B，第二核苷酸序列343-A、343-B和第三核苷酸序列345-A、345-B的表达构建体340、360的转录和/或翻译，可形成与第一TALE融合的第一内含肽、与第二TALE融合的第一内含肽和与稀有切割核酸酶融合的第二内含肽的每一个的多个拷贝。此外，相应的内含肽304、312、306、362、364、366可彼此结合并自接形成第一半TALEN和第二半TALEN。

在一些实施方式中，第一启动子342、第二启动子346和第三启动子350可包括相同的启动子。在其他实施方式中，第一启动子342、第二启动子346和第三启动子350可各自包括不同的启动子。在进一步的实施方式中，第一启动子342和第二启动子346可以是相同的启动子，并且第三启动子350可以是与第一启动子342和第二启动子346不同的启动子。例如，第三启动子350可以是比第一启动子342和第二启动子346更强的启动子，使得转录和/或翻译后，与第一TALE融合的第一内含肽和与第二TALE融合的第一内含肽的拷贝数相比，形成与稀有切割核酸酶融合的第二内含肽的额外的拷贝。

图4是说明与本公开一致的通过内含肽剪接形成TALEN的实例过程的流程图。

在使细胞群与多种核苷酸序列接触后，多种核苷酸序列被细胞转录和/或翻译以形成部件471、473和475，其包括与第一TALE 474融合的第一内含肽478-A、与第二TALE 482融合的第一内含肽478-B以及与稀有切割核酸酶483融合的第二内含肽481。尽管图4说明了部件471、473和475的单个拷贝，但是可形成部件471、473和475中每一个的多个拷贝。

部件471、473和475可彼此接触，并且作为响应，第一内含肽478-A、478-B分别与第二内含肽481的拷贝结合。响应于该结合，形成了第一中间体477和第二中间体479。第一中间体477包括与第二内含肽481结合的第一内含肽478-A，其中第一内含肽478-A与第一TALE474融合，并且第二内含肽481与稀有切割核酸酶483融合。第二中间体479包括与第二内含肽481结合的第一内含肽478-B，其中第一内含肽478-B与第二TALE 482融合，并且第二内含肽481与稀有切割核酸酶483融合。

在第一内含肽478-A、478-B分别与第二内含肽481的拷贝结合后，内含肽478-A、478-B、481自剪接以形成第一半TALEN 485、第二半TALEN 489和剪接蛋白487。例如，内含肽478-A、478-B、481可在与第一内含肽478-A、478-B和第二内含肽481相关的剪接位点处切割，将第一TALE 474与稀有切割核酸酶483结合，并将第二TALE 482与稀有切割核酸酶483结合。第一半TALEN 485可包括与接近第一TALE 474的C-末端的稀有切割核酸酶483结合的第一TALE 474。第二半TALEN 489可包括与接近第二TALE 474的C-末端的稀有切割核酸酶483结合的第二TALE 482。剪接蛋白487可包括与第二内含肽481结合的第一内含肽478(例如，478-A或478-B)。如本文所用，剪接蛋白包括和/或是指包括由独立基因编码的至少两个结构域的蛋白或蛋白复合物，该独立基因经分别地转录和/或翻译并剪接在一起形成单一单位，例如单一多肽。

如前所述，第一半TALEN 485和第二半TALEN 489可转化细胞。例如，各种实施方式涉及由本文所述的方法、载体、表达构建体、核苷酸序列和/或系统转化的宿主细胞和/或生物。在一些实施方式中，如2013年5月14日授权的题为“TAL效应物介导的DNA药物治疗(TALeffector-mediated DNA medication)”的美国专利8440431所述，可转化细胞和/或转化或再生生物，其全部内容出于教导目的并入本文。

如本文所用，使细胞群与多种核苷酸序列接触可包括将表达构建体递送至细胞群中。可经由不同的方法将表达构建体递送到细胞中，这些方法包括但不限于PEG介导的转化、农杆菌感染、电穿孔、粒子轰击或显微注射介导的原生质体转化及其组合。

在各种实施方式中，在将细胞群与多种核苷酸序列(诸如包括多种核苷酸序列的表达构建体)接触之前，可使用标准分子技术生成多种核苷酸序列。

在一些实例中，可筛选细胞群以鉴定被多种核苷酸序列和/或表达构建体遗传转化的靶细胞。如本文所用，靶细胞包括和/或是指表达多种核苷酸序列的细胞和/或此外表现或表达基因修饰的细胞。靶细胞可包括靶基因组座位处的预期突变。在一些实施方式中，可对细胞群进行筛选，并可经由可检测标记选择表达了表达构建体的靶细胞。对可检测标记的细胞群的筛选可包括从剩余的细胞群中分离出具有可检测标记的靶细胞。各种实施方式包括基于荧光激活细胞分选(FACS)的对转化细胞的选择。

因此，许多实施方式涉及DNA介导的细胞的基因编辑连同靶细胞选择的组合，该靶细胞接受使用FACS的半TALEN以及两种TALEN的荧光蛋白或荧光团标记。从FACS选择的细胞再生的生物可得到富集用于预期的基因编辑，从而减少瞬时基因表达通常所需的筛选工作。

本公开的各种实施方式涉及通过图2所述的方法230和/或使用图1A-1D、3A-3B和4所示的多种核苷酸序列或部件生成的非天然存在的宿主细胞和/或生物。例如，方法230可进一步包括培养用多种核苷酸序列转化的经鉴定的靶细胞，并从经培养的靶细胞再生生物，其中经再生的生物表达靶修饰。多种核苷酸序列和/或所得部件(例如，半TALEN和剪接蛋白)可从经再生的生物中去除(例如，划掉(crossed away))。

在一些实施方式中，并与方法230一致的，非天然存在的生物可通过基因组编辑技术生成，该技术包括使用多种核苷酸序列。多种核苷酸序列可以是单独的载体和/或在单个表达构建体上形成。基因组编辑技术可包括使细胞群与多种核苷酸序列接触，筛选细胞群以鉴定用多种核苷酸序列转化的靶细胞，以及任选地从经鉴定的靶细胞再生非天然存在的生物。

如本文所用，细胞和/或细胞群可来自各种不同类型的生物。实例细胞可来自哺乳动物、鸟、爬行动物、两栖动物、鱼、昆虫、甲壳动物、蛛形纲动物、棘皮动物、蠕虫、软体动物、海绵动物、植物、真菌、藻类、细菌等。

如本文所用，上游可包括与参考序列相比接近和/或更靠近核苷酸序列5′端的位置。相对地，下游可包括与参考序列相比接近和/或更靠近核苷酸序列3′端的位置。如本文所用，在前列出有形容词的序列，诸如稀有切割核酸酶序列、内含肽序列或TALE序列，包括或是指编码形容词或为形容词的核苷酸序列(例如，编码核酸酶或为核酸酶)。

现在描述用于针对预期基因编辑的富集和/或筛选细胞的不同实例方法。富集和/或筛选细胞可增加可能包含预期基因组编辑的细胞的表征。

可使用各种已知方法(诸如PEG介导的转化、电穿孔、轰击或微注射介导的转化)将多种核苷酸序列递送到细胞或其他组织中。对于具有细胞壁的较大组织(诸如胚胎)，可使用包被有DNA的金粒子的轰击(或基因枪法)作为递送方法。在核苷酸序列的递送后，FACS可用于选择荧光着色的阳性细胞。

对于粒子轰击转化，可将表达构建体包被到粒子诸如金粒子上。为了将核酸包被在金颗粒上，通过移液将不同体积的核酸溶液与固定量的金悬浮液混合。

但是实施方式不限于此，并且可使用各种粒子轰击转化方案。

为了方便起见，这里提供了说明书、实施例和所附权利要求中使用的某些术语。提供这些定义是为了帮助描述特定实施方式，而不是为了限制所要求保护的发明，因为本发明的范围仅由权利要求限定。

权利要求和说明书中使用的术语“或”除非明确表示仅指替代物或替代物是相互排斥的，否则用来意指“和/或”，，尽管本公开支持仅指替代物和“和/或”的定义。

除非上下文另有明确要求，否则在整个说明书和权利要求书中，词语“包括(include/including/comprise/comprising)”等应理解为开放和包括的含义，而不是封闭、排他或穷尽的含义。例如，术语“包括”可理解为表示“包括但不限于”。使用单数或复数的单词也分别包括复数和单数。除非特别指出，否则在权利要求或说明书中与词语“包括(including)”或“包括(including)”结合使用时，词语“一个/一种(a/an)”表示一个或多个/一种或多种。

如本文所用，术语“多肽”或“蛋白”包括和/或是指其中单体是通过酰胺键连接在一起的氨基酸残基的聚合物。当氨基酸是α-氨基酸时，可使用L-光学异构体或D-光学异构体，典型的是L异构体。如本文所用，术语多肽或蛋白涵盖任何氨基酸序列，并包括修饰的序列，诸如糖蛋白。除非另有说明，否则术语“多肽”特指天然存在的蛋白，以及经重组或合成产生的那些蛋白。

术语“核苷酸序列”包括和/或是指链或序列中的多种核苷酸。核苷酸包括和/或是指包括与磷酸基团连接的核苷酸(例如，带有碳糖的核酸碱基)的化合物。核苷酸序列有时可以被称为核酸，其中该序列的核苷酸形成核酸的构件。术语“核酸”包括和/或是指DNA或RNA核酸以及单链或双链形式的核酸序列，并且除非另有限制，否则包括以类似于天然存在的核苷酸的方式与核酸杂交的天然核苷酸的已知类似物。除非另有说明，特定的核苷酸序列或核酸序列包括其互补序列。

公开了可用于所公开的方法和组合物、可与所公开的方法和组合物结合使用、可用于制备所公开的方法和组合物或者是所公开的方法和组合物的产品的材料、组合物和组分。应当理解，当公开这些材料的组合、子集、相互作用、组等时，各种个体和集体组合中的每一种都是明确地考虑在内的，即使可能没有明确公开对这些化合物的每一种和每一个单个组合和排列的具体引用。该概念适用于本公开的所有方面，包括但不限于所述方法中的步骤。任何前述实施方式的特定元件可组合或替换其他实施方式中的元件。例如，如果有各种可执行的额外步骤，则这些额外步骤中的每一个都可用所公开方法的任何特定方法步骤或方法步骤的组合来执行，并且每个这样的组合或组合的子集都是具体预期和公开的。此外，应当理解，本文描述的实施方式可使用任何合适的材料诸如本文别处描述的或本领域已知的那些材料来实施。

根据2021年7月7日提交的美国临时申请号63/219,291，标题为“与内含肽融合的转录激活因子样效应物”的基础临时申请来实施各种实施方式；该专利要求保护并通过援引完全并入本文。例如，本文和/或临时申请中的实施方式可不同程度地(包括全部地)组合。除非特别指出，否则临时申请中讨论的实施方式并不旨在以任何方式限制总体技术公开或所要求保护的发明的任何部分。

虽然已经示出和描述了说明性实施例，但是应当理解，在不脱离本发明的范围的情况下，可对其进行各种改变。

实验性实施方式

各种实验性实施方式涉及设计不同的核酸载体，为便于参考，有时在本文中称为载体，并且其可包括前述表达构建体或其一部分，诸如DNA或mRNA构建体。这些载体编码与第一TALE的至少一部分融合的第一内含肽，与第二TALE的至少一部分融合的第一内含肽，以及与稀有切割核酸酶的至少一部分融合的第二内含肽。设计了特定的实验来示出上述载体的基因编辑。本文描述了所进行的大量实验。

在各种实验实施方式中，设计并构建了若干载体。载体包括与Ssp DnaE int-N肽序列融合的TAL效应物和与Ssp DnaE int-C肽序列融合的内切核酸酶。Ssp DnaE int-N和int-C肽序列一起构成了反式内含肽，这里称为内含肽。进行了特定的实验来示出来自这些内含肽载体联合活性的基因编辑。用于实验性实施方式的实例构建体和序列包括如SEQ IDNO：1-159所示的核苷酸序列。SEQ ID NO：1-164各自都是合成DNA。

不同的载体在下表1所示。表1中的核酸载体包括DNA构建体。

表1

表1中的构建体是在下面详细描述的实验性实施方式中生成的。质粒载体1和9编码靶向与Ssp DnaE int-N肽序列融合的基因BnFAD2的TAL效应物。质粒载体1(SEQ ID NO：1)编码启动子NosPro、靶向基因BnFAD2的TAL效应物、Ssp DnaE int-N肽序列、终止子NosTerm和左半TALEN(HT)骨架。质粒载体9(SEQ ID NO：9)编码启动子NosPro、靶向基因BnFAD2的TAL效应物、Ssp DnaE int-N肽序列、终止子NosTerm和右HT骨架。质粒载体17(SEQID NO：17)编码与FokI内切核酸酶融合的Ssp DnaE int-C肽序列。质粒载体17编码启动子NosPro、Ssp DnaE int-C肽序列、FokI内切核酸酶和终止子NosTerm。在实验性实施方式中，联合质粒载体1、9和17用于证明TALEN基因编辑活性。

质粒载体1的序列如SEQ ID NO：1所示，其编码Nos启动子(SEQ ID NO：2)、左TALEN-末端(SEQ ID NO：3)、BnFAD2(T03-L)结合结构域(SEQ ID NO：4)、左TALE C-末端(SEQ IDNO：5)、接头(SEQ ID NO：6)、Ssp DnaE int-N(SEQ ID NO：7)和Nos终止子(SEQ ID NO：8)。质粒载体9的序列如SEQ ID NO：9所示，其编码Nos启动子(SEQ ID NO：2)、右TALE N-末端(SEQ ID NO：10)、BnFAD2(T03-R)结合结构域(SEQ ID NO：11)、右TALE C-末端(SEQ ID NO：12)、接头(SEQ ID NO：6)、Ssp DnaE int-N(SEQ ID NO：7)和Nos终止子(SEQ ID NO：8)。质粒载体17的序列如SEQ ID NO：17所示，其编码Nos启动子(SEQ ID NO：2)、Ssp DnaE int-C(SEQ ID NO：18)、接头(AGCCGTTCC)、Fok1(SEQ ID NO：19)和Nos终止子(SEQ ID NO：8)。

将质粒载体1、9和17的基因编辑活性与质粒载体对照1和对照2进行比较。质粒载体对照1由左HT骨架中的启动子NosPro、靶向BnFAD2(T03-L)的TALEN和终止子NosTerm组成。质粒载体对照2由右HT骨架中的启动子NosPro、靶向BnFAD2(T03-R)的TALEN和终止子NosTerm组成。

启动子NosPro和终止子NosTerm基于来自根癌农杆菌(Agrobacteriumtumifaciens)的序列，TAL效应物基于黄单胞菌属(Xanthomonas)序列，BnFAD2(T03)靶向在甘蓝型油菜(Brassica napus)中发现的序列，FokI内切核酸酶基于海床黄杆菌(Flavobacterium okeanokoites)序列，并且Ssp DnaE int-C和int-N肽序列来自集胞藻(Synechocystis sp.)PCC6803。

表1的其余实例构建体描述如下。质粒载体13(如SEQ ID NO：13所示)和质粒载体15(如SEQ ID NO：15所示)是编码与Ssp DnaE int-N肽序列融合的TAL效应物的入门载体(entry vector)。质粒载体13编码左HT骨架中的启动子NosPro，TAL效应物，侧翼为金门克隆(Golden Gate cloning)的BsaI位点的lacZ盒，Ssp DnaE int-N序列和终止子NosTerm。质粒载体15编码右HT骨架中的启动子NosPro，TAL效应物，侧翼为金门克隆(Golden Gatecloning)的BsaI位点的lacZ盒，Ssp DnaE int-N序列和终止子NosTerm。

质粒载体13的序列如SEQ ID NO：13所示，其编码Nos启动子(SEQ ID NO：2)、左TALE N-末端(SEQ ID NO：3)、LacZ盒(SEQ ID NO：14)、左TALE C-末端(SEQ ID NO：5)、接头(SEQ ID NO：6)、Ssp DnaE int-N(SEQ ID NO：7)和Nos终止子(SEQ ID NO：8)。质粒载体15的序列如SEQ ID NO：15所示，其编码Nos启动子(SEQ ID NO：2)、右TALE N-末端(SEQ IDNO：10)、LacZ盒(SEQ ID NO：16)、右TALE c-末端(SEQ ID NO：12)、接头(SEQ ID NO：6)、SspDnaE int-N(SEQ ID NO：7)和Nos终止子(SEQ ID NO：8)。

如表2所示，进行了额外的实验来说明用表1的载体转化细胞。更具体地，使用表1所示的载体转化油菜(canola)原生质体。这些包括先前描述的载体SEQ ID NO：1、SEQ IDNO：9、SEQ ID NO：17、质粒载体对照1和质粒载体对照2。所有样品均各自用于转化200,000个原生质体，并且所有样品均作为生物学复制进行测试。样品A和D各自包括30ug的过程对照质粒，其在数据分析期间用作阴性对照。样品B和E各自包括30ug的对照载体，用于靶BnFAD2(T03)、质粒载体对照1和质粒载体对照的基因编辑。样品C和F包括30ug的三种内含肽质粒SEQ ID NO：1、SEQ ID NO：9和SEQ ID NO：17。将内含肽样品C和F与阳性对照样品B和E进行比较，以评估基因编辑效率。所有样品均使用相同的Illumina序列制备以用于分析。将载体用来转化油菜原生质体，以比较内含肽TALEN载体与不含内含肽序列的TALEN载体的基因编辑效率。表2说明了所进行的实验。

表2

为了进行油菜转化，在实验前30-60天，将10粒油菜种子用1.5mL的70％乙醇洗涤，并然后用1.8mL的无菌水洗涤。为了给种子灭菌，将种子用1.5mL的1％的次氯酸钠溶液洗涤，并然后用1.8mL无菌水洗涤额外的五次。吸胀后，将新灭菌的种子中的6粒种植在PlantCon中的8P-MS-G培养基上。种子在25C下以16/8小时的光/暗比进行孵育。

孵育30-60天后，使发芽的油菜小植株消化。使用无菌剪刀剪下4-6片油菜叶，并将叶置于包含50-100ul CPDS的培养皿中。用无菌直刃剃刀将叶切成0.5-1mm的碎片。向平皿中加入另外4mL的CPDS，并将平皿置于一个更大的100mm的培养皿中以确保无菌。将平皿移至真空室，并在30inHg下抽真空10分钟。10分钟后，平皿在25C下于黑暗中以25rpm孵育16小时。

16小时后，用4mL的W-5plus Carb100溶液洗涤原生质体消化物(digestion)，并将原生质体溶液通过Falcon 40um细胞过滤器轻轻移液至50mL的试管中。这个步骤再重复一次。然后将试管以100xg离心5分钟。离心后，弃去上清液，并将沉淀物(pellet)用4mL的W-5洗涤缓冲液进行重悬，再一次离心，并弃去剩余的上清液。然后，将经洗涤的沉淀物用2mL的W-5洗涤缓冲液重悬，并将20ul的悬浮液上样到血细胞计数器上进行细胞计数。对血细胞计数器的四个网格中进行细胞计数用以获得每个网格中原生质体的平均数量。样品中原生质体的总数计算如下：其中是先前计算的四个网格{a，b，c，d}的平均值。为了进行转化，将包含2mL的W-5缓冲液和原生质体悬浮液的50mL的试管以100xg离心5分钟。对于样品A-C，去除上清液，并以每1x10⁶个原生质体1mL室温1X MMG来添加室温1X MMG，并将相当于200,000个原生质体的体积加入1.5mL微量离心试管中，该试管包含每次转化所需的特定量的载体。对于样品D-F，在1.5mL微量离心试管中向200,000个原生质体以每1x10⁶个原生质体500ul室温2X MMG来添加室温2X MMG连同特定量的DNA载体。对于所有样品，通过缓慢上下吸取液体将原生质体悬浮液与载体混合。将原生质体和质粒载体在室温下孵育5分钟。5分钟后，向每个微量离心试管中加入1X体积的室温PEG，并上下吸取直至完全混合。然后将试管在室温下孵育20分钟。20分钟后，加入1.5mL的W-5洗涤缓冲液以重新悬浮原生质体。将试管以200xg离心5分钟，去除上清液，并添加额外的800ul的W-5洗涤缓冲液以重新悬浮细胞。将0.5-2mL的经洗涤的原生质体转移到6-24孔板中并孵育24-48小时。

为了评估基因编辑活性，通过将原生质体转移到1.5mL微量离心试管中来收获原生质体。将悬浮液以200xg离心5分钟，弃去上清液，并将试管置于液氮中两分钟。然后将试管储存在-80C下，直到提取原生质体DNA并通过Illumina进行分析。

表3示出了从用表1中描述的载体转化的原生质体中检测到的缺失。在样品A-F之间比较了基因编辑效率(此处以事件百分比显示)。样品A和D包括用表达YFP的载体转化的油菜原生质体，并作为阴性对照，其中预期没有编辑。样品B和E包括用靶向基因BnFAD2的TALEN转化的油菜原生质体。样品C和F包括用TAL效应物和FokI内切核酸酶(各自与SspDnaE int-N或int-C序列融合，也靶向BnFAD2)转化的油菜原生质体。

表3示出了NHEJ突变测定的结果，该测定检测了用上述载体转化的原生质体细胞群中的缺失或事件的数量。该测定扩增了包含靶BnFAD2的三个基因组区域，在表3中表示为Illumina 1、2和3。如图所示，TALEN内含肽样品产生的缺失的数量明显高于YFP阴性对照，尽管它们没有以与TALEN对照载体相同的频率产生缺失。

表3

实验测试了使用反式剪接内含肽作为减少TALEN载体的质粒运载物大小的方法，并且增加了在向细胞送基因编辑材料时的灵活性。如前所述，实验在油菜(甘蓝型油菜(Bn-Westar))原生质体中进行。FAD2基因中的具有TALEN T03.01的靶标，其具有有三个已知拷贝。使用扩增子测序对原生质体进行基因型分型，以检测三个FAD2基因拷贝中的编辑。下表4提供了所得序列覆盖范围的总结。

对于实验来说，每个内含肽样品的所有三个基因拷贝都有良好的覆盖率(例如，平均大于28,000个读长，范围在24,000至41,000个读长之间)。进行实验1和2以测试不同浓度的转化输入。具体地，实验2(“Mod”方法)使用了较高体积的较低浓度DNA。

下表4和表5提供了实验1和2的编辑百分比。在两项实验中，内含肽样品始终示出一些编辑水平比阴性对照更高，但比阳性对照更低。实验2(Mod方法，较低量的DNA)在阳性对照中具有更高的编辑百分比，但在内含肽样品中更低。可以理解的是，编辑百分比＝(具有编辑的读长数/分析的读长总数)*100。

表4.实验1编辑百分比

表5实验2编辑百分比

图5说明了示出与本公开一致的使用核苷酸序列编辑细胞得到的基因型分型的图像。更特别地，图5说明了阴性对照590、阳性对照591和内含肽592的基因组区域的比对图像。

图6A-6C说明了与本公开一致来自YFP阴性对照、TALEN阳性对照和内含肽的基因组区域的完整图像。例如，图6A说明了样品A YFP阴性对照的基因组区域的图像。图6B说明了样品B(+)BnFAD2(T03)TALEN阳性对照的基因组区域的图像。图6C说明了样品C(+)内含肽的基因组区域的图像。

使用额外的质粒载体进行各种实验来转化植物细胞，诸如油菜、大麻和/或大豆植物细胞。尽管实例描述了特定的植物细胞，但实施方式不限于此，并且可以包括任何类型的植物和/或植物以外的细胞，诸如哺乳动物细胞。使用了不同类型的内含肽，包括Ssp DNAE和Gp41-1、天然和非天然外显肽，以及对不同靶标具有特异性的结合结构域的TALE。实验还包括含有TALEN的阳性对照和无TALE的阴性对照。

使用额外的质粒载体进行了一些实验，以使用与不同基因(诸如合酶(ALS)转基因、脂肪酸脱饱和酶3(FAD3)转基因和生长调节因子(GRF)转基因)相关的TALE转化大豆植物细胞。用于实验性实施方式的实例构建体和序列包括如SEQ ID NO：92-159所示的核苷酸序列。下表6-8说明了不同的质粒载体。

表6

表7

表8

在各种实验中，使用上述质粒载体并根据Xiong，L，et al.，“A transientexpression system in soybean mesophyll protoplasts reveals the formation ofcytoplasmic GmCRY1 photobody-like structures”，Science China Life Sciences，2019，62(8)，1070-1077(其全部内容出于教导目的并入本文)中所述的方案转化大豆原生质体，并且此外还使用了其他质粒载体。在一些实例中，将240万个细胞在重复试管中组合，以每个生物学重复12x 200,000个细胞。鉴定出平均每平方180个，相当于使用4mL体积时的360万个细胞。按照方案的其余部分的描述继续进行。

样品如下：

各自两份生物复制(bioreplication)(例如样品1：1A和1B各自有20万个细胞；并且

每个样品#1-6都具有最终浓度为300ng/uL的质粒。

表9提供了测试的不同样品：

表9

**质粒载体152和质粒载体110使用较低的[dna]在实验1和2之间进行划分。对于质粒载体152(295ng/uL)以及对于质粒载体110(244ng/uL)。

每个样品的最终体积为220uL，以补偿移液误差，来自储备液浓度和体积如下所示。例如，下面描述了在10个平皿上制备的样品1-5原生质体(例如，每个样品2个)。原生质体总计包括1uL的溶液x1000mLx4mL(总体积)。表10提供了每次样品制备的总和。

表10

样品	体积
		1	491
2	829
		3	549
4	710
		5	119

上述结果得到总计3119个细胞(每uL)x1000(换算成mL)x 4(每份的总体积为4ml)＝1250万个细胞。将这些细胞以每份200,000个(320uL)进行划分。

例如，以下将细胞分成200,000个生物重复的试管，其中每组2个。进行洗涤和定量后：沉淀细胞，去除W5，然后使用2xMMG(100ul+100uL的以下所示DNA)。然后按照方案的其余部分的描述继续进行(加入PEG后，仍然使用100g持续5分钟而不是200g来进行最终旋转5min)。转化和洗涤后，转移到1mL的W5溶液中，置于暗处的24孔板中。样品如下：

a.各自两份生物重复(例如样品1：1A和1B各自有20万个细胞；并且

b.每个样品#1-6都具有最终浓度为300ng/uL的各自质粒。

下表11提供了不同组和不同样品中提供的额外质粒载体。每个样品被列为第1组样品1的1.1，并且A和B表示单独的生物重复。

表11

在上文中，表11中的第3组对应于表9。

图7说明了与本公开一致的使用不同质粒载体转化大豆外植体的实例结果。更特别地，使用共递送载体转化大豆原生质体，该共递送载体编码与第一内含肽融合的左TALE、与第一内含肽融合的右TALE和与第二内含肽融合的核酸酶。TALE包括与ALS、FAD3和GRF基因相关的结合结构域。

不同的质粒载体包括靶向ALS基因的第一组(例如，包括ALS-T04和ALS-T07以及质粒载体154、155、149、150、147、148、122、123、156、157、138、146、135、142、124和125)，靶向FAD3基因的第二组(例如，包括FAD3-T08和质粒载体110、152、137、145、134、141和126)，以及靶向GRF基因的第三组(例如，包括GRF-T03和GRF-T04以及质粒载体153、151、136、143、92、140、120、119、158、159、102、144、133、139、121和123)。在第一、第二和第三组的每一组中，相应的载体包括无内含肽(质粒载体组为：(质粒载体122和质粒载体123)、(质粒载体124和质粒载体125)、(质粒载体对照和质粒载体126)、(质粒载体120和质粒载体119)以及(质粒载体121和质粒载体123)，SSP DnaE的内含肽和非天然外显肽(质粒载体组为：(质粒载体154、质粒载体155和质粒载体127)，(质粒载体156、质粒载体157、质粒载体127)，(质粒载体110、质粒载体152、质粒载体127)，以及(质粒载体153、质粒载体151、质粒载体127)，SSP DnaE的内含肽和天然外显肽(质粒载体组为：(质粒载体154、质粒载体155和质粒载体132)、(质粒载体156、质粒载体157和质粒载体132)、(质粒载体158、质粒载体159和质粒载体132)、(质粒载体110、质粒载体152、质粒载体132)以及(质粒载体153、质粒载体151、质粒载体132)，GP41-1的内含肽和非天然外显肽(质粒载体组为：(质粒载体149、质粒载体150和质粒载体131)、(质粒载体138、质粒载体146和质粒载体131)、(质粒载体137、质粒载体145和质粒载体131)、(质粒载体102、质粒载体144和质粒载体131)和(质粒载体136、质粒载体143和质粒载体131)，以及GP41-1的内含肽和天然外显肽(质粒载体组为：(质粒载体147、质粒载体148和质粒载体130)、(质粒载体135、质粒载体142和质粒载体130)、(质粒载体134、质粒载体141和质粒载体130)、(质粒载体92、质粒载体140和质粒载体130)和(质粒载体144、质粒载体139和质粒载体130)。阴性对照质粒载体的实例包括质粒载体128(如SEQ IDNO：128所示)和质粒载体129(如SEQ ID NO：129所示)。

如上所述，在每个实验中可使用三个质粒载体来联合证明TALEN基因活性，三个质粒载体中的两个包括靶向与内含肽(例如，int-N或int-C)融合的基因(例如，左半和右半TAL效应物)的TAL效应物，并且第三个质粒载体包括与FokI内切核酸酶融合的内含肽(例如int-C或int-N)。不同的载体可包括靶向与Ssp DnaE int-N或gp41-1 int-N肽序列融合的基因GRF3、FAD3或ALS的TAL效应物。质粒载体92(SEQ ID NO：92)编码启动子NosPro、靶向基因GRF3的TAL效应物、天然Gp41-1 int-N肽序列、终止子NosTerm和左HT骨架。质粒载体102(SEQ ID NO：102)编码启动子NosPro、靶向基因GRF3的TAL效应物、非天然Gp41-1 int-N肽序列、终止子NosTerm和左HT骨架。质粒载体110(SEQ ID NO：110)编码启动子NosPro、靶向基因GRF3的TAL效应物、和Ssp DnaE int-N肽序列、终止子NosTerm和左HT骨架。

质粒载体92的序列如SEQ ID NO：92所示，其编码左半TALE盒(SEQ ID NO：93)，包括Nos启动子(SEQ ID NO：94)、内含肽TAL效应物融合体(SEQ ID NO：95)和Nos终止子(SEQID No：33)。内含肽TAL效应物融合体(SEQ ID NO：95)编码左TALE N-末端(SEQ ID NO：96)、GmGRF3(T03-L1)结合结构域(SEQ ID NO：97)、左TALE C-末端(SEQ ID NO：98)、接头(SEQID NO：99)、天然剪接位点int-N(SEQ ID NO：100)和Gp41-1 int-N肽序列(SEQ ID NO：101)。

质粒载体102的序列如SEQ ID NO：102所示，其编码左半TALE盒(SEQ ID NO：103)，包括Nos启动子(SEQ ID NO：94)、内含肽TAL效应物融合体(SEQ ID NO：104)和Nos终止子(SEQ ID No：33)。内含肽TAL效应物融合体(SEQ ID NO：104)编码左TALE N-末端(SEQ IDNO：105)、GmGRF3(T03-L1)结合结构域(SEQ ID NO：106)、左TALE C-末端(SEQ ID NO：107)、接头(SEQ ID NO：108)和Gp41-1 int-N肽序列(SEQ ID NO：109)。

质粒载体110的序列如SEQ ID NO：110所示，其编码左半TALE盒(SEQ ID NO：111)，包括Nos启动子(SEQ ID NO：94)、内含肽TAL效应物融合体(SEQ ID NO：112)和Nos终止子(SEQ ID No：33)。内含肽TAL效应物融合体(SEQ ID NO：112)编码左TALE N-末端(SEQ IDNO：113)、GmGRF3(T03-L1)结合结构域(SEQ ID NO：114)、左TALE C-末端(SEQ ID NO：115)、接头(SEQ ID NO：116)和Ssp DnaE int-N肽序列(SEQ ID NO：117)。

其余的实例结构如下所述。质粒载体118(如SEQ ID NO：118所示)是编码靶向GmGRF(T04)的右半TALEN的对照TALEN载体，以及质粒载体119(如SEQ ID NO：119所示)是编码靶向GmGRF(T03)的右半TALEN的对照TALEN载体。质粒载体120(如SEQ ID NO：120所示)是编码靶向GmGRF(T03)的左半TALEN的对照TALEN载体，以及质粒载体121(如SEQ ID NO：121所示)是编码靶向GmGRF(T04)的左半TALEN的对照TALEN载体。质粒载体122(如SEQ ID NO：122所示)是编码靶向GmALS(T04)的左半TALEN的对照TALEN载体，以及质粒载体123(如SEQID NO：123所示)是编码靶向GmALS(T04)的右半TALEN的对照TALEN载体。质粒载体124(如SEQ ID NO：124所示)是编码靶向GmALS(T07)的左半TALEN的对照TALEN载体，以及质粒载体125(如SEQ ID NO：125所示)是编码靶向GmALS(T07)的右半TALEN的对照TALEN载体。质粒载体126(如SEQ ID NO：126所示)是编码靶向GmFAD3(T08)的右半TALEN的对照TALEN载体。

质粒载体127(如SEQ ID NO：127所列)编码Ssp DnaE int-C肽序列，具有非天然外显肽和FokI内切核酸酶。如前所述，质粒载体128和129(如SEQ ID NO：128-129所示)是具有YFP的TALEN对照，其中质粒载体128包括左半TALEN，并且质粒载体129包括右半TALEN载体。质粒载体130(如SEQ ID NO：130所示)编码gp41-1 int-C肽序列，具有天然外显肽和FokI内切核酸酶。质粒载体131(如SEQ ID NO：131所示)编码gp41-1 int-C肽序列，具有非天然外显肽和FokI内切核酸酶。质粒载体132(如SEQ ID NO：132所示)是Ssp DnaE int-C肽序列，具有天然外显肽和FokI内切核酸酶。

质粒载体133(如SEQ ID NO：133所示)编码靶向与天然Gp41-1 int-N肽序列融合的基因GRF3(T04)的左半TAL效应物。质粒载体134(如SEQ ID NO：134所示)编码靶向与天然Gp41-1 int-N肽序列融合的基因FAD3(T08)的左半TAL效应物。质粒载体135(如SEQ ID NO：135所示)编码靶向与天然Gp41-1 int-N肽序列融合的基因ALS(T07)的左半TAL效应物。

质粒载体136(如SEQ ID NO：136所示)编码靶向与非天然Gp41-1 int-N肽序列融合的基因GRF3(T04)的左半TAL效应物。质粒载体137(如SEQ ID NO：137所示)编码靶向与非天然Gp41-1 int-N肽序列融合的基因FAD3(T08)的左半TAL效应物。质粒载体138(如SEQ IDNO：138所示)编码靶向与非天然Gp41-1 int-N肽序列融合的基因ALS(T07)的左半TAL效应物。

质粒载体139(如SEQ ID NO：139所示)编码靶向与天然Gp41-1 int-N肽序列融合的基因GRF3(T04)的右半TAL效应物。质粒载体140(如SEQ ID NO：140所示)编码靶向与天然Gp41-1 int-N肽序列融合的基因GRF3(T03)的右半TAL效应物。质粒载体141(如SEQ ID NO：141所示)编码靶向与天然Gp41-1 int-N肽序列融合的基因FAD3(T08)的右半TAL效应物。质粒载体142(如SEQ ID NO：142所示)编码靶向与天然Gp41-1 int-N肽序列融合的基因ALS(T07)的左半TAL效应物。

质粒载体143(如SEQ ID NO：143所示)编码靶向与非天然Gp41-1 int-N肽序列融合的基因GRF3(T04)的右半TAL效应物。质粒载体144(如SEQ ID NO：144所示)编码靶向与非天然Gp41-1 int-N肽序列融合的基因GRF3(T03)的右半TAL效应物。质粒载体145(如SEQ IDNO：145所示)编码靶向与非天然Gp41-1 int-N肽序列融合的基因FAD3(T08)的右半TAL效应物。质粒载体146(如SEQ ID NO：146所示)编码靶向与非天然Gp41-1 int-N肽序列融合的基因ALS(T07)的右半TAL效应物。

质粒载体147(如SEQ ID NO：147所示)编码靶向与天然Gp41-1 int-N肽序列融合的基因ALS(T04)的左半TAL效应物。质粒载体148(如SEQ ID NO：148所示)编码靶向与天然Gp41-1 int-N肽序列融合的基因ALS(T04)的右半TAL效应物。

质粒载体149(如SEQ ID NO：149所示)编码靶向与非天然Gp41-1 int-N肽序列融合的基因ALS(T04)的左半TAL效应物。质粒载体150(如SEQ ID NO：150所示)编码靶向与非天然Gp41-1 int-N肽序列融合的基因ALS(T04)的右半TAL效应物。

质粒载体151(如SEQ ID NO：151所示)编码靶向与Ssp DnaE int-N肽序列融合的基因GRF3(T04)的右半TAL效应物。质粒载体152(如SEQ ID NO：152所示)编码靶向与SspDnaE int-N肽序列融合的基因GRF3(T03)的右半TAL效应物。质粒载体153(如SEQ ID NO：153所示)编码靶向与Ssp DnaE int-N肽序列融合的基因GRF3(T04)的左半TAL效应物。

质粒载体154(如SEQ ID NO：154所示)编码靶向与Ssp DnaE int-N肽序列融合的基因ALS(T04)的左半TAL效应物。质粒载体155(如SEQ ID NO：155所示)编码靶向与SspDnaE int-N肽序列融合的基因ALS(T04)的右半TAL效应物。质粒载体156(如SEQ ID NO：156所示)编码靶向与Ssp DnaE int-N肽序列融合的基因ALS(T07)的左半TAL效应物。质粒载体157(如SEQ ID NO：157所示)编码靶向与Ssp DnaE int-N肽序列融合的基因ALS(T07)的右半TAL效应物

质粒载体158(如SEQ ID NO：158所示)编码靶向与Ssp DnaE int-N肽序列融合的基因FAD3(T08)的左半TAL效应物。质粒载体159(如SEQ ID NO：159所示)编码靶向与SspDnaE int-N肽序列融合的基因FAD3(T08)的右半TAL效应物。

例如，图7是比较92-159的不同质粒载体的编辑效率的图，说明了无内含肽、SSPDnaE的内含肽和非天然外显肽、SSP DnaE的内含肽和天然外显肽、GP41-1的内含肽和非天然外显肽以及GP41-1的内含肽和天然外显肽的编辑效率。

使用额外的质粒载体进行各种实验，以使用与不同基因相关的TALE(诸如八氢番茄红素脱饱和酶(PDS)转基因和四氢大麻酚酸合酶(THCAS)转基因)转化大麻植物细胞。

经由农杆菌属介导对大麻胚轴(EA)组织的转化来转化大麻植物细胞。简而言之，使用过氧化氢洗涤来对大麻种子进行灭菌。灭菌后，将种子在液体抗生素溶液中吸胀过夜。过夜吸胀后，从种子皮中移除大麻胚，并通过移除子叶和初生叶来收获EA组织。

然后将大麻EA组织置于包含液体感染溶液的培养皿中，该液体感染溶液由培养基和携带OD为0.2的目的双元载体的农杆菌属组成。将包含土壤杆菌属溶液中的EA的感染培养皿密封并超声处理40秒。超声后，将EA在感染培养基中保持一小时。一小时后，将EA从感染培养基中取出，并铺板在包含湿滤纸的新共培养培养皿上。将平皿密封并置于培养箱中在23C下16/8小时光照4天。共培养后，将EA铺板在包含再生培养基的平皿上。将包含EA的再生平皿密封，并置于培养箱中，在23C下16/8小时光照7天。可使用本领域公知的任何技术转化EA。

在再生培养基上7天后，将EA从培养基中取出并在-80C冷冻以使用任何公知的技术提取DNA。例如，DNA提取可如于2021年9月9日公开的并且标题为“具有高油酸的油菜(Canola with High Oleic Acid)”的美国公开2021/0277411中所述实施，其全部内容出于教导目的并入本文。

在各种实验中，用SEQ ID NO：20-91所示的质粒载体转化大麻植物细胞。使用上述大麻科转化方案并使用包含各自双元载体的细菌来转化大麻EA。在各种实施方式中，比较了不同质粒载体之间的编辑效率。不同的质粒载体包括靶向PDS基因的第一组(例如质粒载体91、20、46和87)和靶向THCAS基因的第二组(例如质粒载体90、88、89和65)。在第一组和第二组的每一组中，各自的载体包括无内含肽(例如，质粒载体90和91)、SSP DnaE的内含肽和天然外显肽(例如，质粒载体20和87)、GP41-1的内含肽和非天然外显肽(例如，质粒载体46和88)以及GP41-1的内含肽和天然外显肽(例如，质粒载体89和65)。

质粒载体20的序列如SEQ ID NO：20所示，其编码YFP盒(SEQ ID NO：21)、左半TALE盒(SEQ ID NO：25)、右半TALE盒(SEQ ID NO：34)和FokI盒(SEQ ID NO：41)。YFP盒编码FMV启动子(SEQ ID NO：22)、YFP蛋白(SEQ ID NO：23)和Rbcs终止子(SEQ ID NO：24)。左半TALE盒(SEQ ID NO：25)编码VaUbi3启动子(SEQ ID NO：26)、内含肽TAL效应物融合体(SEQ IDNO：27)和Nos终止子(SEQ ID NO：33)。内含肽TAL效应物融合体(SEQ ID NO：27)编码左TALEN-末端(SEQ ID NO：28)、CsPDS(T02-L1)结合结构域(SEQ ID NO：29)、左TALE C-末端(SEQID NO：30)、接头(SEQ ID NO：31)和Ssp DnaE int-N肽序列(SEQ ID NO：32)。右半TALE盒(SEQ ID NO：34)编码VaUbi3启动子(SEQ ID NO：26)、内含肽TAL效应物融合体(SEQ ID NO：35)和Nos终止子(SEQ ID NO：33)。内含肽TAL效应物融合体(SEQ ID NO：35)编码右TALE N-末端(SEQ ID NO：36)、CsPDS(T02-R1)结合结构域(SEQ ID NO：37)、右TALE C-末端(SEQ IDNO：38)、接头(SEQ ID NO：39)和Ssp DnaE int-N肽序列(SEQ ID NO：40)。FokI盒(SEQ IDNO：41)编码MtEF1a启动子(SEQ ID NO：42)、内含肽FokI融合体(SEQ ID NO：43)和Nos终止子(SEQ ID NO：33)。内含肽FokI融合体(SEQ ID NO：43)编码核定位信号(SEQ ID NO：44)、Ssp DnaE int-C肽序列(SEQ ID NO：45)、CFN(TGCTTCAAC)、接头(AGCCGTTCC)和FokI(SEQID NO：19)。

质粒载体46的序列如SEQ ID NO：46所示，其编码YFP盒(SEQ ID NO：21)、左半TALE盒(SEQ ID NO：47)、右半TALE盒(SEQ ID NO：54)和FokI盒(SEQ ID NO：61)。YFP盒编码FMV启动子(SEQ ID NO：22)、YFP蛋白(SEQ ID NO：23)和Rbcs终止子(SEQ ID NO：24)。左半TALE盒(SEQ ID NO：47)编码VaUbi3启动子(SEQ ID NO：26)、内含肽TAL效应物融合体(SEQ IDNO：48)和Nos终止子(SEQ ID NO：33)。内含肽TAL效应物融合体(SEQ ID NO：48)编码左TALEN-末端(SEQ ID NO：49)、CsPDS(T02-L1)结合结构域(SEQ ID NO：50)、左TALE C-末端(SEQID NO：51)、接头(SEQ ID NO：52)和Gp41-1 int-N肽序列(SEQ ID NO：53)。右半TALE盒(SEQID NO：54)编码VaUbi3启动子(SEQ ID NO：26)、内含肽TAL效应物融合体(SEQ ID NO：55)和Nos终止子(SEQ ID NO：33)。内含肽TAL效应物融合体(SEQ ID NO：55)编码右TALE N-末端(SEQ ID NO：56)、CsPDS(T02-R1)结合结构域(SEQ ID NO：57)、右TALE C-末端(SEQ ID NO：58)、接头(SEQ ID NO：59)和Gp41-1 int-N肽序列(SEQ ID NO：60)。FokI盒(SEQ ID NO：61)编码MtEF1a启动子(SEQ ID NO：42)、内含肽FokI融合体(SEQ ID NO：62)和Nos终止子(SEQID NO：33)。内含肽FokI融合体(SEQ ID NO：62)编码核定位信号(SEQ ID NO：63)、Gp41-1int-C肽序列(SEQ ID NO：64)、接头(AGCCGTTCC)和FokI(SEQ ID NO：19)。

质粒载体65的序列如SEQ ID NO：65所示，其编码YFP盒(SEQ ID NO：21)、左半TALE盒(SEQ ID NO：66)、右半TALE盒(SEQ ID NO：74)和FokI盒(SEQ ID NO：82)。YFP盒编码FMV启动子(SEQ ID NO：22)、YFP蛋白(SEQ ID NO：23)和Rbcs终止子(SEQ ID NO：24)。左半TALE盒(SEQ ID NO：66)编码VaUbi3启动子(SEQ ID NO：26)、内含肽TAL效应物融合体(SEQ IDNO：67)和Nos终止子(SEQ ID NO：33)。内含肽TAL效应物融合体(SEQ ID NO：67)编码左TALEN-末端(SEQ ID NO：68)、CsTHCAS(T22-L1)结合结构域(SEQ ID NO：69)、左TALE C-末端(SEQ ID NO：70)、接头(SEQ ID NO：71)、天然剪接位点int-N(SEQ ID NO：72)和Gp41-1int-N肽序列(SEQ ID NO：73)。右半TALE盒(SEQ ID NO：74)编码VaUbi3启动子(SEQ ID NO：26)、内含肽TAL效应物融合体(SEQ ID NO：75)和Nos终止子(SEQ ID NO：33)。内含肽TAL效应物融合体(SEQ ID NO：75)编码右TALE N-末端(SEQ ID NO：76)、CsTHCAS(T22-R1)结合结构域(SEQ ID NO：77)、右TALE C-末端(SEQ ID NO：78)、接头(SEQ ID NO：79)、天然剪接位点int-N(SEQ ID NO：80)和Gp41-1 int-N肽序列(SEQ ID NO：81)。FokI盒(SEQ ID NO：82)编码MtEF1a启动子(SEQ ID NO：42)、内含肽FokI融合体(SEQ ID NO：83)和Nos终止子(SEQID NO：33)。内含肽FokI融合体(SEQ ID NO：83)编码核定位信号(SEQ ID NO：84)、Gp41-1int-C肽序列(SEQ ID NO：85)、天然剪接位点int-C(SEQ ID NO：86)、接头(AGCCGTTCC)和FokI(SEQ ID NO：19)。

其余的实例构建体如下所述。质粒载体87(如SEQ ID NO：87所示)编码靶向THCAS的左和右TALE效应物，连同各自包括天然Ssp DnaE内含肽的FokI盒。质粒载体88(如SEQ IDNO：88所示)编码靶向THCAS的左和右TALE效应物，连同各自包括非天然Gp41-1内含肽的FokI盒。质粒载体89(如SEQ ID NO：89所示)编码靶向THCAS的左和右TALE效应物，连同各自包括天然Gp41-1内含肽的FokI盒。质粒载体90(如SEQ ID NO：90所示)是编码靶向THCAS基因的左半和右半TALEN的对照TALEN载体。质粒载体91(如SEQ ID NO：91所示)是编码靶向PDS基因的左半和右半TALEN的对照TALEN载体。

图8A-8I说明了与本公开一致的使用不同质粒载体转化大麻外植体的结果。图8A是比较第一组和第二组的不同质粒载体的编辑效率的图表，说明了以下项的编辑效率：无内含肽(例如，质粒载体90和91)、SSP DnaE的内含肽和天然外显肽(例如，质粒载体20和87)、GP41-1的内含肽和非天然外显肽(例如，质粒载体46和88)以及GP41-1的内含肽和天然外显肽(例如，质粒载体89和65)。

图8B-8C是比较第一组和第二组的不同质粒载体的编辑事件百分比的图，如图8A所示。图8D-8I是来自实验的外植体的图像，该实验评估了用与本公开一致的质粒载体20(图8D)、质粒载体46(图8E)、质粒载体89(图8F)、质粒载体87(图8G)、质粒载体88(图8H)和质粒载体65(图8I)的不同质粒载体对外植体的转化。

Claims

1.多种核苷酸序列，包括：

第一核苷酸序列，所述第一核苷酸序列编码与第一转录激活因子样效应物(TALE)的至少一部分融合的第一内含肽；

第二核苷酸序列，所述第二核苷酸序列编码与第二TALE的至少一部分融合的所述第一内含肽；以及

第三核苷酸序列，所述第三核苷酸序列编码与稀有切割核酸酶的至少一部分融合的第二内含肽。

2.根据权利要求1所述的多种核苷酸序列，其中，所述第一核苷酸序列编码与所述第一TALE融合的所述第一内含肽，并且所述第二核苷酸序列编码与所述第二TALE融合的所述第一内含肽。

3.根据权利要求2所述的多种核苷酸序列，其中，所述第三核苷酸序列编码与所述稀有切割核酸酶融合的所述第二内含肽。

4.根据权利要求1所述的多种核苷酸序列，其中，所述第一核苷酸序列编码与所述稀有切割核酸酶的第一部分和所述第一TALE融合的所述第一内含肽，并且所述第二核苷酸序列编码与所述稀有切割核酸酶的第一部分和所述第二TALE融合的所述第一内含肽。

5.根据权利要求4所述的多种核苷酸序列，其中，所述第三核苷酸序列编码与所述稀有切割核酸酶的第二部分融合的所述第二内含肽，其中，所述稀有切割核酸酶的第一部分和第二部分形成所述稀有切割核酸酶。

6.根据权利要求1所述的多种核苷酸序列，其中，所述多种核苷酸序列各自包括单独的载体和/或位于单个表达构建体上。

7.根据权利要求1所述的多种核苷酸序列，其中，所述第一内含肽和所述第二内含肽被配置成当接触时自剪接，并且作为响应，形成包括与所述稀有切割核酸酶结合的所述第一TALE的第一半转录激活因子样效应物核酸酶(TALEN)。

8.根据权利要求7所述的多种核苷酸序列，其中，所述第一内含肽和所述第二内含肽被配置成当接触时自剪接，并且作为响应，形成包括与所述稀有切割核酸酶结合的所述第二TALE的第二半TALEN。

9.根据权利要求1所述的多种核苷酸序列，其中，所述第一内含肽和所述第二内含肽被配置成在接触时自剪接，并形成包括与所述第二内含肽结合的所述第一内含肽的剪接蛋白。

10.根据权利要求1所述的多种核苷酸序列，其中，所述多种核苷酸序列中的每一个还编码启动子和终止子。

11.一种方法，包括：

使细胞与以下接触：

第三核苷酸序列，所述第三核苷酸序列编码与稀有切割核酸酶的至少一部分融合的第二内含肽；以及

响应于接触所述细胞，通过所述第一内含肽和所述第二内含肽剪接所述第一TALE、所述第二TALE和所述稀有切割核酸酶以形成：

包括所述第一TALE和所述稀有切割核酸酶的第一半转录激活因子样效应物核酸酶(TALEN)；以及

包括所述第二TALE和所述稀有切割酶的第二半TALEN。

12.根据权利要求11所述的方法，还包括翻译所述第一核苷酸序列、所述第二核苷酸序列和所述第三核苷酸序列，以形成与所述第一TALE融合的所述第一内含肽、与所述第二TALE融合的所述第一内含肽以及与所述稀有切割核酸酶融合的所述第二内含肽。

13.根据权利要求11所述的方法，还包括使用所述第一半TALEN和所述第二半TALEN转化所述细胞。

14.根据权利要求11所述的方法，其中，所述第一核苷酸序列编码与所述第一TALE的C末端融合的N末端内含肽，所述第二核苷酸序列编码与所述第二TALE的C末端融合的所述N末端内含肽，并且所述第三核苷酸序列编码与所述稀有切割核酸酶的N末端融合的C末端内含肽或在所述稀有切割核酸酶的部分之间融合的所述C末端内含肽。

15.根据权利要求11所述的方法，其中，所述第一核苷酸序列编码与所述第一TALE的N末端融合的C末端内含肽，所述第二核苷酸序列编码与所述第二TALE的N末端融合的所述C末端内含肽，并且所述第三核苷酸序列编码与所述稀有切割核酸酶的C末端融合的N末端内含肽或在所述稀有切割核酸酶的部分之间融合的所述N末端内含肽。

16.根据权利要求11所述的方法，其中，剪接包括使所述第一内含肽与所述第二内含肽结合以形成：

第一中间体，所述第一中间体包括与所述第二内含肽结合的所述第一内含肽，其中，所述第一内含肽与所述第一TALE融合，并且所述第二内含肽与所述稀有切割核酸酶融合；以及

第二中间体，所述第二中间体包括与所述第二内含肽结合的所述第一内含肽，其中，所述第一内含肽与所述第二TALE融合，并且所述第二内含肽与所述稀有切割核酸酶融合。

17.根据权利要求11所述的方法，其中，剪接包括：

使所述第一内含肽和所述第二内含肽结合；

切割与所述第一内含肽和所述第二内含肽相关的剪接位点；以及

使所述第一TALE和所述稀有切割核酸酶结合并且使所述第二TALE和所述稀有切割核酸酶结合以形成所述第一半TALEN和所述第二半TALEN。

18.根据权利要求17所述的方法，其中，所述剪接位点位于以下之间：

所述第一内含肽和所述第一TALE；

所述第一内含肽和所述第二TALE；以及

所述第二内含肽和所述稀有切割核酸酶或其部分。

19.一种表达构建体，包括：

第一核苷酸序列，所述第一核苷酸序列编码与至少第一转录激活因子样效应物(TALE)融合的第一内含肽；

第二核苷酸序列，所述第二核苷酸序列编码与至少第二TALE融合的所述第一内含肽；以及

20.根据权利要求19所述的表达构建体，其中，所述第一核苷酸序列编码与所述第一TALE的C末端融合的N末端内含肽，所述第二核苷酸序列编码与所述第二TALE的C末端融合的所述N末端内含肽，并且所述第三核苷酸序列编码与所述稀有切割核酸酶的N末端融合或在所述稀有切割核酸酶的部分之间融合的C末端内含肽。

21.根据权利要求19所述的表达构建体，其中，所述第一核苷酸序列编码与所述第一TALE的N末端融合的C末端内含肽，所述第二核苷酸序列编码与所述第二TALE的N末端融合的所述C末端内含肽，并且所述第三核苷酸序列编码与所述稀有切割核酸酶的C末端融合或在所述稀有切割核酸酶的部分之间融合的的N末端内含肽。

22.根据权利要求19所述的表达构建体，其中，响应于由细胞对所述第一核苷酸序列、所述第二核苷酸序列和所述第三核苷酸序列的翻译，所述第一内含肽和所述第二内含肽被配置成相互结合并自剪接以形成：

包括与所述稀有切割核酸酶结合的所述第一TALE的第一半转录激活因子样效应物核酸酶(TALEN)；

包括与所述稀有切割酶结合的所述第二TALE的第二半TALEN；以及

包括与所述第二内含肽结合的所述第一内含肽的剪接蛋白。

23.根据权利要求19所述的表达构建体，其中，所述第一核苷酸序列、所述第二核苷酸序列和所述第三核苷酸序列包括单独的载体或位于单个表达构建体上。

24.根据权利要求19所述的表达构建体，其中：

所述第一TALE包括第一多个TALE重复序列，其以组合的方式与靶DNA序列中的第一核苷酸序列结合；以及

所述第二TALE包括第二多个TALE重复序列，其以组合的方式与所述靶DNA序列中的第二核苷酸序列结合。

25.根据权利要求19所述的表达构建体，其中，所述第一核苷酸序列、所述第二核苷酸序列和所述第三核苷酸序列中的每一个还编码启动子和终止子。

26.由多种核苷酸序列转化的植物、植物部分或植物细胞，所述多种核苷酸序列包括：

其中，经转化的植物、植物部分或植物细胞表达与所述第一TALE融合的所述第一内含肽、与所述第二TALE融合的所述第一内含肽以及与所述稀有切割核酸酶融合的所述第二内含肽。

27.根据权利要求26所述的植物、植物部分或植物细胞，其中，与所述第一TALE融合的所述第一内含肽、与所述第二TALE融合的所述第一内含肽以及与所述稀有切割核酸酶融合的所述第二内含肽的经表达的第一内含肽和第二内含肽自剪接以形成：

包括与所述第二内含肽结合的所述第一内含肽的剪接蛋白。

28.根据权利要求26所述的植物、植物部分或植物细胞，其中，经转化的植物、植物部分或植物细胞呈现出：

包括与所述第二内含肽结合的所述第一内含肽的剪接蛋白。