CN112543808A

CN112543808A - 增强的hAT家族转座子介导的基因转移及相关组合物、系统和方法

Info

Publication number: CN112543808A
Application number: CN201980051568.7A
Authority: CN
Inventors: D·拉格斯帕达; B·莫里亚蒂; B·韦伯; N·奥托; S·库马尔; L·霍格达尔
Original assignee: B Mogen Biotechnologies Inc
Current assignee: B Mogen Biotechnologies Inc
Priority date: 2018-06-21
Filing date: 2019-06-21
Publication date: 2021-03-23
Also published as: CA3104288A1; JP2024041866A; EP3810764A2; WO2019246486A2; JP2021527427A; US20210277366A1; AU2019288669A1; US11760983B2

Abstract

本公开提供了各种TcBuster转座酶和转座子、系统和使用方法。

Description

增强的hAT家族转座子介导的基因转移及相关组合物、系统和方法

交叉引用

本申请要求于2018年6月21日提交的美国临时申请第62/688,278号的权益，所述申请以引用的方式整体并入本文中。

背景技术

可转座的遗传元件，也称为转座子，是可以在单个细胞内从一个基因组位置移动到另一个基因组位置的DNA节段。转座子可根据其转座机制分为两大类：转座可经由以下发生：(1)称为逆转座子的元件的RNA中间体的逆转录，以及(2)侧接DNA转座子的末端反向重复序列(TIR)的DNA的直接转座活性转座子编码转座所需的一种或多种蛋白质。天然活性DNA转座子具有转座酶基因。

hAT家族中的DNA转座子广泛分布于植物和动物中。已经鉴定出许多活性hAT转座子系统，并且发现它们是有功能的，包括但不限于Hermes转座子、Ac转座子、hobo转座子和Tol2转座子。hAT家族由两个家族构成，这两个家族根据其转座酶的一级序列分为AC亚家族和Buster亚家族。hAT家族的成员属于II类可转座元件。II类可移动元件使用转座的剪切和粘贴机制。hAT元件共享相似的转座酶、短末端反向重复序列和基因组靶标的8个碱基对的重复。

发明内容

在一方面，本文描述了一种突变TcBuster转座酶，其包含与全长SEQ ID NO:1至少70％同一的氨基酸序列，并且具有一个或多个来自表1.1的氨基酸置换。在一些实施方案中，突变TcBuster转座酶与SEQ ID NO:1相比包含增加在中性pH下的净电荷的氨基酸置换。在一些实施方案中，增加在中性pH下的净电荷的氨基酸置换包括向赖氨酸或精氨酸的置换。在一些实施方案中，增加在中性pH下的净电荷的氨基酸置换包括天冬氨酸或谷氨酸向中性氨基酸、赖氨酸或精氨酸的置换。在一些实施方案中，突变TcBuster转座酶包含一个或多个来自表4.1的氨基酸置换。在一些实施方案中，突变TcBuster转座酶进一步包含一个或多个来自表4的氨基酸置换。在一些实施方案中，突变TcBuster转座酶包含在以下中的氨基酸置换：DNA结合和寡聚化结构域；插入结构域；Zn-BED结构域；或其组合。在一些实施方案中，突变TcBuster转座酶与SEQ ID NO:1相比包含增加在催化结构域内或邻近处在中性pH下的净电荷的氨基酸置换。在一些实施方案中，突变TcBuster转座酶与SEQ ID NO:1相比包含增加在中性pH下的净电荷的氨基酸置换，其中当根据SEQ ID NO:1编号时，一个或多个氨基酸位于D223、D289或E589的邻近处。在一些实施方案中，邻近度为约80、75、70、60、50、40、30、20、10或5个氨基酸的距离。在一些实施方案中，邻近度为约70至80个氨基酸的距离。在一些实施方案中，突变TcBuster转座酶的氨基酸序列与全长SEQ ID NO:1至少80％、至少90％、至少95％、至少98％或至少99％同一。在一些实施方案中，突变TcBuster转座酶进一步包含一个或多个来自表2的氨基酸置换。在一些实施方案中，突变TcBuster转座酶进一步包含一个或多个来自表3的氨基酸置换。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶进一步包含氨基酸置换V377T、E469K和D189A。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶进一步包含氨基酸置换K573E和E578L。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶进一步包含氨基酸置换I452K。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶进一步包含氨基酸置换A358K。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶进一步包含氨基酸置换V297K。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶进一步包含氨基酸置换N85S。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶进一步包含氨基酸置换I452F、V377T、E469K和D189A。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶进一步包含氨基酸置换A358K、V377T、E469K和D189A。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶进一步包含氨基酸置换V377T、E469K、D189A、K573E和E578L。在一些实施方案中，突变TcBuster转座酶进一步包含一个或多个来自表1的氨基酸置换。在一些实施方案中，与具有氨基酸序列SEQ ID NO:1的野生型TcBuster转座酶相比，突变TcBuster转座酶具有提高的转座效率。在一些实施方案中，通过包括以下操作的测定来测量转座效率：将突变TcBuster转座酶或野生型TcBuster转座酶和含有报告货物盒的TcBuster转座子引入到细胞群中，以及检测所述报告货物盒在细胞群的基因组中的转座。

本文在一方面描述了一种融合转座酶，其包含TcBuster转座酶序列和一个或多个另外的核定位信号序列，其中TcBuster转座酶序列与全长SEQ ID NO:1具有至少70％同一性。在一些实施方案中，TcBuster转座酶序列与全长SEQ ID NO:1具有至少80％、至少90％、至少95％、至少98％或至少99％同一性。在一些实施方案中，TcBuster转座酶序列与SEQ IDNO:1相比包含增加在中性pH下的净电荷的一个或多个氨基酸置换。在一些实施方案中，所述一个或多个氨基酸置换包括用赖氨酸或精氨酸进行的置换。在一些实施方案中，所述一个或多个氨基酸置换包括用中性氨基酸、赖氨酸或精氨酸对天冬氨酸或谷氨酸进行的置换。在一些实施方案中，TcBuster转座酶序列包含一个或多个来自表4、表4.1或这两者的氨基酸置换。在一些实施方案中，TcBuster转座酶序列包含在以下中的一个或多个氨基酸置换：DNA结合和寡聚化结构域；插入结构域；Zn-BED结构域；或其组合。在一些实施方案中，TcBuster转座酶序列包含一个或多个来自表1、表1.1或这两者的氨基酸置换。在一些实施方案中，与具有氨基酸序列SEQ ID NO:1的野生型TcBuster转座酶相比，TcBuster转座酶序列具有提高的转座效率。在一些实施方案中，通过包括以下操作的测定来测量TcBuster转座酶序列的转座效率：将融合转座酶或野生型TcBuster转座酶和含有报告货物盒的TcBuster转座子引入到细胞群中，以及检测所述报告货物盒在细胞群的基因组中的转座。在一些实施方案中，TcBuster转座酶序列与SEQ ID NO:1相比包含增加在催化结构域内或邻近处在中性pH下的净电荷的一个或多个氨基酸置换。在一些实施方案中，TcBuster转座酶序列与SEQ ID NO:1相比包含增加在中性pH下的净电荷的一个或多个氨基酸置换，其中当根据SEQ ID NO:1编号时，所述一个或多个氨基酸置换位于D223、D289或E589的邻近处。在一些实施方案中，邻近度为约80、75、70、60、50、40、30、20、10或5个氨基酸的距离。在一些实施方案中，邻近度为约70至80个氨基酸的距离。在一些实施方案中，TcBuster转座酶序列包含一个或多个来自表2的氨基酸置换。在一些实施方案中，TcBuster转座酶序列包含一个或多个来自表3的氨基酸置换。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换V377T、E469K和D189A。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换K573E和E578L。在一些实施方案中，当根据SEQID NO:1编号时，TcBuster转座酶序列包含氨基酸置换I452K。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换A358K。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换V297K。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换N85S。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换I452F、V377T、E469K和D189A。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换A358K、V377T、E469K和D189A。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换V377T、E469K、D189A、K573E和E578L。在一些实施方案中，TcBuster转座酶序列与全长SEQ ID NO:1具有100％同一性。

本文在一方面描述了一种融合转座酶，其包含TcBuster转座酶序列和DNA序列特异性结合结构域，其中所述TcBuster转座酶序列具有如权利要求1-26中任一项所述的突变TcBuster的氨基酸序列。在一些实施方案中，DNA序列特异性结合结构域包含TALE结构域、锌指结构域、AAV Rep DNA结合结构域或其任何组合。在一些实施方案中，DNA序列特异性结合结构域包含TALE结构域。在一些实施方案中，TcBuster转座酶序列和DNA序列特异性结合结构域被接头分隔开。在一些实施方案中，接头包含至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少15、至少20或至少50个氨基酸。在一些实施方案中，接头包含SEQID NO:9。

本文在一方面描述了一种多核苷酸，其包含与全长SEQ ID NO:204或207至少约80％、85％、90％、95％或98％同一或互补的核酸序列。本文在一方面描述了一种多核苷酸，其编码本文所述的突变TcBuster转座酶。本文在一方面描述了一种多核苷酸，其编码本文所述的融合转座酶。在一些实施方案中，多核苷酸包含编码突变TcBuster转座酶或融合转座酶的DNA。在一些实施方案中，多核苷酸包含编码突变TcBuster转座酶或融合转座酶的信使RNA(mRNA)。在一些实施方案中，该mRNA是经化学修饰的。在一些实施方案中，多核苷酸包含编码可被突变TcBuster转座酶或融合转座酶识别的转座子的核酸序列。在一些实施方案中，多核苷酸存在于DNA载体中。在一些实施方案中，DNA载体包含小环质粒。在一些实施方案中，所述多核苷酸经密码子优化成在人细胞中表达。在一些实施方案中，多核苷酸包含与全长SEQ ID NO:204或207至少约70％、75％、80％、85％、90％、95％或98％同一或互补的核酸序列。在一些实施方案中，多核苷酸包含与全长SEQ ID NO:204或207至少约80％、85％、90％、95％或98％同一或互补的核酸序列。在一些实施方案中，多核苷酸包含与全长SEQ IDNO:204或207至少约95％同一或互补的核酸序列。在一些实施方案中，多核苷酸包含与全长SEQ ID NO:204或207100％同一或互补的核酸序列。

本公开的一个方面提供了一种突变TcBuster转座酶，其包含与全长SEQ ID NO:1至少70％同一的氨基酸序列，并且具有与SEQ ID NO:1相比包含增加在中性pH下的净电荷的一个或多个氨基酸置换。在一些实施方案中，与具有氨基酸序列SEQ ID NO:1的野生型TcBuster转座酶相比，突变TcBuster转座酶具有提高的转座效率。本公开的另一方面提供了一种突变TcBuster转座酶，其包含与全长SEQ ID NO:1至少70％同一的氨基酸序列，并且具有在以下中的一个或多个氨基酸置换：DNA结合和寡聚化结构域；插入结构域；Zn-BED结构域；或其组合。在一些实施方案中，与具有氨基酸序列SEQ ID NO:1的野生型TcBuster转座酶相比，突变TcBuster转座酶具有提高的转座效率。本公开的又一方面提供了一种突变TcBuster转座酶，其包含与全长SEQ ID NO:1至少70％同一的氨基酸序列并且具有一个或多个来自表1的氨基酸置换。在一些实施方案中，突变TcBuster转座酶与SEQ ID NO:1相比包含增加在催化结构域内或邻近处在中性pH下的净电荷的一个或多个氨基酸置换。在一些实施方案中，突变TcBuster转座酶与SEQ ID NO:1相比包含增加在中性pH下的净电荷的一个或多个氨基酸置换，并且当根据SEQ ID NO:1编号时，所述一个或多个氨基酸位于D223、D289或E589的邻近处。在一些实施方案中，邻近度为约80、75、70、60、50、40、30、20、10或5个氨基酸的距离。在一些实施方案中，邻近度为约70至80个氨基酸的距离。在一些实施方案中，突变TcBuster转座酶的氨基酸序列与全长SEQ ID NO:1至少80％、至少90％、至少95％、至少98％或至少99％同一。在一些实施方案中，所述一个或多个氨基酸置换包括向赖氨酸或精氨酸的置换。在一些实施方案中，所述一个或多个氨基酸置换包括天冬氨酸或谷氨酸向中性氨基酸、赖氨酸或精氨酸的置换。在一些实施方案中，突变TcBuster转座酶包含一个或多个来自表4的氨基酸置换。在一些实施方案中，突变TcBuster转座酶包含一个或多个来自表2的氨基酸置换。在一些实施方案中，突变TcBuster转座酶包含一个或多个来自表3的氨基酸置换。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶包含氨基酸置换V377T、E469K和D189A。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶包含氨基酸置换K573E和E578L。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶包含氨基酸置换I452K。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶包含氨基酸置换A358K。在一些实施方案中，当根据SEQ IDNO:1编号时，突变TcBuster转座酶包含氨基酸置换V297K。在一些实施方案中，当根据SEQID NO:1编号时，突变TcBuster转座酶包含氨基酸置换N85S。在一些实施方案中，当根据SEQID NO:1编号时，突变TcBuster转座酶包含氨基酸置换I452F、V377T、E469K和D189A。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶包含氨基酸置换A358K、V377T、E469K和D189A。在一些实施方案中，当根据SEQ ID NO:1编号时，突变TcBuster转座酶包含氨基酸置换V377T、E469K、D189A、K573E和E578L。在一些实施方案中，通过包括以下操作的测定测量转座效率：将突变TcBuster转座酶和含有报告货物盒的TcBuster转座子引入到细胞群中，以及检测所述报告货物盒在细胞群的基因组中的转座。

本公开的又一方面提供了一种融合转座酶，其包含TcBuster转座酶序列和DNA序列特异性结合结构域。在一些实施方案中，TcBuster转座酶序列与全长SEQ ID NO:1具有至少70％同一性。在一些实施方案中，DNA序列特异性结合结构域包含TALE结构域、锌指结构域、AAV Rep DNA结合结构域或其任何组合。在一些实施方案中，DNA序列特异性结合结构域包含TALE结构域。在一些实施方案中，TcBuster转座酶序列与全长SEQ ID NO:1具有至少80％、至少90％、至少95％、至少98％或至少99％同一性。在一些实施方案中，TcBuster转座酶序列与SEQ ID NO:1相比包含增加在中性pH下的净电荷的一个或多个氨基酸置换。在一些实施方案中，TcBuster转座酶序列包含在以下中的一个或多个氨基酸置换：DNA结合和寡聚化结构域；插入结构域；Zn-BED结构域；或其组合。在一些实施方案中，TcBuster转座酶序列包含一个或多个来自表1的氨基酸置换。在一些实施方案中，与具有氨基酸序列SEQ IDNO:1的野生型TcBuster转座酶相比，TcBuster转座酶序列具有提高的转座效率。在一些实施方案中，TcBuster转座酶序列与SEQ ID NO:1相比包含增加在催化结构域内或邻近处在中性pH下的净电荷的一个或多个氨基酸置换。在一些实施方案中，TcBuster转座酶序列与SEQ ID NO:1相比包含增加在中性pH下的净电荷的一个或多个氨基酸置换，并且当根据SEQID NO:1编号时，所述一个或多个氨基酸置换位于D223、D289或E589的邻近处。在一些实施方案中，邻近度为约80、75、70、60、50、40、30、20、10或5个氨基酸的距离。在一些实施方案中，邻近度为约70至80个氨基酸的距离。在一些实施方案中，TcBuster转座酶序列包含一个或多个来自表2的氨基酸置换。在一些实施方案中，TcBuster转座酶序列包含一个或多个来自表3的氨基酸置换。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换V377T、E469K和D189A。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换K573E和E578L。在一些实施方案中，当根据SEQ IDNO:1编号时，TcBuster转座酶序列包含氨基酸置换I452K。在一些实施方案中，当根据SEQID NO:1编号时，TcBuster转座酶序列包含氨基酸置换A358K。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换V297K。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换N85S。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换I452F、V377T、E469K和D189A。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换A358K、V377T、E469K和D189A。在一些实施方案中，当根据SEQ ID NO:1编号时，TcBuster转座酶序列包含氨基酸置换V377T、E469K、D189A、K573E和E578L。在一些实施方案中，TcBuster转座酶序列与全长SEQ ID NO:1具有100％同一性。在融合转座酶的一些实施方案中，TcBuster转座酶序列和DNA序列特异性结合结构域被接头分隔开。在一些实施方案中，接头包含至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少15、至少20或至少50个氨基酸。在一些实施方案中，接头包含SEQ ID NO:9。

本公开的又一方面提供了一种多核苷酸，其编码如本文所述的突变TcBuster转座酶。本公开的又一方面提供了一种多核苷酸，其编码如本文所述的融合转座酶。在一些实施方案中，多核苷酸包含编码突变TcBuster转座酶或融合转座酶的DNA。在一些实施方案中，多核苷酸包含编码突变TcBuster转座酶或融合转座酶的信使RNA(mRNA)。在一些实施方案中，该mRNA是经化学修饰的。在一些实施方案中，所述多核苷酸包含编码可被突变TcBuster转座酶或融合转座酶识别的转座子的核酸序列。在一些实施方案中，所述多核苷酸存在于DNA载体中。在一些实施方案中，所述DNA载体包含小环质粒。

本公开的又一方面提供了一种细胞，其产生如本文所述的突变TcBuster转座酶或融合转座酶。本公开的又一方面提供了一种含有如本文所述的多核苷酸的细胞。本公开的又一方面提供了一种方法，其包括：将如本文所述的突变TcBuster转座酶和可被所述突变TcBuster转座酶识别的转座子引入到细胞中。本公开的又一方面提供了一种方法，其包括：将如本文所述的融合转座酶和可被所述融合转座酶识别的转座子引入到细胞中。在方法的一些实施方案中，所述引入包括使细胞与编码突变TcBuster转座酶或融合转座酶的多核苷酸接触。在一些实施方案中，多核苷酸包含编码突变TcBuster转座酶或融合转座酶的DNA。在一些实施方案中，多核苷酸包含编码突变TcBuster转座酶或融合转座酶的信使RNA(mRNA)。在一些实施方案中，该mRNA是经化学修饰的。在方法的一些实施方案中，所述引入包括使细胞与含有转座子的DNA载体接触。在一些实施方案中，DNA载体包含小环质粒。在一些实施方案中，所述引入包括使细胞与含有转座子和编码突变TcBuster转座酶或融合转座酶的多核苷酸的质粒载体接触。在一些实施方案中，所述引入包括使细胞与作为纯化蛋白的突变TcBuster转座酶或融合转座酶接触。在方法的一些实施方案中，转座子包含位于两个反向重复序列之间的货物盒。在一些实施方案中，该两个反向重复序列的左反向重复序列包含与SEQ ID NO:3具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。在一些实施方案中，该两个反向重复序列的左反向重复序列包含SEQ ID NO:3。在一些实施方案中，该两个反向重复序列的右反向重复序列包含与SEQ IDNO:4具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。在一些实施方案中，该两个反向重复序列的右反向重复序列包含SEQ ID NO:4。在一些实施方案中，该两个反向重复序列的左反向重复序列包含与SEQ ID NO:5具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。在一些实施方案中，该两个反向重复序列的左反向重复序列包含SEQ ID NO:5。在一些实施方案中，该两个反向重复序列的右反向重复序列包含与SEQ ID NO:6具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。在一些实施方案中，该两个反向重复序列的右反向重复序列包含SEQ ID NO:6。在一些实施方案中，该两个反向重复序列的左反向重复序列包含与SEQ ID NO:205具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。在一些实施方案中，该两个反向重复序列的左反向重复序列包含SEQ ID NO:205。在一些实施方案中，该两个反向重复序列的右反向重复序列包含与SEQ ID NO:206具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少有99％同一性的序列。在一些实施方案中，该两个反向重复序列的右反向重复序列包含SEQ ID NO:206。在一些实施方案中，货物盒包含选自由以下组成的组的启动子：CMV、EFS、MND、EF1α、CAGCs、PGK、UBC、U6、H1和Cumate。在一些实施方案中，货物盒包含CMV启动子。在一些实施方案中，货物盒以正向方向存在。在一些实施方案中，货物盒以反向方向存在。在一些实施方案中，货物盒包含转基因。在一些实施方案中，该转基因编码选自由以下组成的组的蛋白质：细胞受体、免疫检查点蛋白、细胞因子及其任何组合。在一些实施方案中，该转基因编码选自由以下组成的组的细胞受体：T细胞受体(TCR)、B细胞受体(BCR)、嵌合抗原受体(CAR)或其任何组合。在一些实施方案中，所述引入包括借助于以下手段来转染细胞：电穿孔、显微注射、磷酸钙沉淀、阳离子聚合物、树枝状聚合物、脂质体、微粒轰击、fugene、直接声波加载、细胞挤压、光学转染、原生质体融合、穿刺转染(impalefection)、磁转染、核转染或其任何组合。在一些实施方案中，所述引入包括对细胞进行电穿孔。在方法的一些实施方案中，所述细胞是从受试者分离的原代细胞。在一些实施方案中，受试者是人。在一些实施方案中，受试者是患有疾病的患者。在一些实施方案中，受试者已经被诊断出患有癌症或肿瘤。在一些实施方案中，所述细胞是从受试者的血液中分离的。在一些实施方案中，所述细胞包括原代免疫细胞。在一些实施方案中，所述细胞包括原代白细胞。在一些实施方案中，所述细胞包括原代T细胞。在一些实施方案中，原代T细胞包括γδT细胞、辅助T细胞、记忆T细胞、天然杀伤T细胞、效应T细胞或其任何组合。在一些实施方案中，原代免疫细胞包括CD3+细胞。在一些实施方案中，所述细胞包括干细胞。在一些实施方案中，所述干细胞选自由以下组成的组：胚胎干细胞、造血干细胞、表皮干细胞、上皮干细胞、支气管干细胞、乳腺干细胞、间充质干细胞、肠干细胞、内皮干细胞、神经干细胞、嗅觉成体干细胞、神经嵴干细胞、睾丸细胞及其任何组合。在一些实施方案中，所述干细胞包括诱导性多能干细胞。

本公开的又一方面提供了一种治疗方法，其包括：(a)将转座子和识别转座子的如本文所述的突变TcBuster转座酶或融合转座酶引入到细胞中，从而产生经基因修饰的细胞；(b)将所述经基因修饰的细胞施用给需要该治疗的患者。在一些实施方案中，经基因修饰的细胞包含由转座子引入的转基因。在一些实施方案中，患者已经被诊断出患有癌症或肿瘤。在一些实施方案中，所述施用包括将经基因修饰的细胞输注到患者的血管中。

本公开的又一方面提供了一种用于基因组编辑的系统，其包含：如本文所述的突变TcBuster转座酶或融合转座酶，以及可被突变TcBuster转座酶或融合转座酶识别的转座子。本公开的又一方面提供了一种用于基因组编辑的系统，其包含：编码如本文所述的突变TcBuster转座酶或融合转座酶的多核苷酸，以及可被突变TcBuster转座酶或融合转座酶识别的转座子。在系统的一些实施方案中，所述多核苷酸包含编码突变TcBuster转座酶或融合转座酶的DNA。在一些实施方案中，所述多核苷酸包含编码突变TcBuster转座酶或融合转座酶的信使RNA(mRNA)。在一些实施方案中，该mRNA是经化学修饰的。在一些实施方案中，转座子存在于DNA载体中。在一些实施方案中，DNA载体包含小环质粒。在一些实施方案中，所述多核苷酸和转座子存在于同一质粒中。在一些实施方案中，转座子包括位于两个反向重复序列之间的货物盒。在一些实施方案中，该两个反向重复序列的左反向重复序列包含与SEQ ID NO:3具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。在一些实施方案中，该两个反向重复序列的左反向重复序列包含SEQID NO:3。在一些实施方案中，该两个反向重复序列的右反向重复包含与SEQ ID NO:4具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。在一些实施方案中，该两个反向重复序列的右反向重复包含SEQ ID NO:4。在一些实施方案中，该两个反向重复序列的左反向重复序列包含与SEQ ID NO:5具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。在一些实施方案中，该两个反向重复序列的左反向重复序列包含SEQ ID NO:5。在一些实施方案中，该两个反向重复序列的右反向重复序列包含与SEQ ID NO:6具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。在一些实施方案中，该两个反向重复序列的右反向重复序列包含SEQ ID NO:6。在一些实施方案中，该两个反向重复序列的左反向重复序列包含与SEQ ID NO:205具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。在一些实施方案中，该两个反向重复序列的左反向重复序列包含SEQ ID NO:205。在一些实施方案中，该两个反向重复序列的右反向重复序列包含与SEQ ID NO:206具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少有99％同一性的序列。在一些实施方案中，该两个反向重复序列的右反向重复序列包含SEQ ID NO:206。在一些实施方案中，货物盒包含选自由以下组成的组的启动子：CMV、EFS、MND、EF1α、CAGCs、PGK、UBC、U6、H1和Cumate。在一些实施方案中，货物盒包含CMV启动子。在一些实施方案中，货物盒包含转基因。在一些实施方案中，该转基因编码选自由以下组成的组的蛋白质：细胞受体、免疫检查点蛋白、细胞因子及其任何组合。在一些实施方案中，转基因编码选自由以下组成的组的细胞受体：T细胞受体(TCR)、B细胞受体(BCR)、嵌合抗原受体(CAR)或其任何组合。在一些实施方案中，货物盒以正向方向存在。在一些实施方案中，货物盒以反向方向存在。

以引用的方式并入

本专利说明书中提及的所有出版物、专利和专利申请都通过引用并入本文，引用的程度如同每篇单独的出版物、专利或专利申请被具体单独地指出通过引用并入本文的程度。如果通过引用并入的术语与本文定义的术语相冲突，则以本专利说明书为准。

附图说明

本公开的新颖特征在所附权利要求书中具体阐述。参考以下对利用了本公开的原理的说明性实施方案进行阐述的详细描述以及附图可获得对本公开的特征和优点的更好理解，在附图中：

图1示出了如根据用野生型(WT)TcBuster转座酶和示例性TcBuster转座子转染的细胞中mCherry阳性细胞的百分比所测量的几种示例性TcBuster转座子载体构建体的转座效率。

图2示出了示例性TcBuster IR/DR序列1(按出现顺序分别为SEQ ID NO 3-4)与序列2(按出现顺序分别为SEQ ID NO 5-6)的核苷酸序列比较。

图3A示出了用示例性TcBuster转座子Tn-8(含有puro-mCherry盒；在图1中示出)和WT TcBuster转座酶或V596A突变转座酶(含有V596A置换)转染后2周，HEK-293T细胞的代表性亮视野和荧光图像。转染后2天，将经转染的细胞铺在含有1μg/mL嘌呤霉素的6孔板中，固定并在转染后2周用结晶紫染色以用于集落定量。图3B示出了转染后2周在6孔板中的经转染细胞集落的代表性图片。图3C是示出转染后2周每种转染条件下的集落定量的图。

图4描绘了TcBuster转座酶与AC亚家族中的许多转座酶的氨基酸序列比对，其中仅示出了氨基酸保守区域(按出现顺序分别为SEQ ID NO 89-194)。

图5描绘了TcBuster转座酶与Buster亚家族中许多其他转座酶成员的氨基酸序列比对(按出现顺序分别为SEQ ID NO 195-203)。在蛋白质序列上方指示出某些示例性的氨基酸置换，在比对顶部示出的百分比是含有预期被置换为TcBuster序列的氨基酸的其他Buster亚家族成员的百分比，而在下方示出的百分比是在该位置处含有常规TcBuster氨基酸的其他Buster亚家族成员的百分比。

图6显示了用于测试TcBuster转座酶突变体的示例性表达载体pcDNA-DEST40的载体图。

图7是对如根据用TcBuster转座子Tn-8(在图1中示出)用示例性转座酶突变体转染的HEK-293T细胞中mCherry阳性细胞的百分比所测量的，示例性TcBuster转座酶突变体的转座效率进行量化的图。

图8描绘了一种示例性融合转座酶，其包含通过任选的接头联接的DNA序列特异性结合结构域和TcBuster转座酶序列。

图9是对如根据用TcBuster转座子Tn-8(在图1中示出)用含有标签的示例性转座酶转染的HEK-293T细胞中mCherry阳性细胞的百分比所测量的，含有不同标签的示例性TcBuster转座酶的转座效率进行量化的图。

图10A是对如根据GFP阳性细胞百分比所测量的人CD3+ T细胞中示例性TcBuster转座系统的转座效率进行量化的图。图10B是通过流式细胞术量化转染后2天和7天经转染的T细胞的活力的图。数据是相对于脉冲对照。

图11示出了注释出某些氨基酸的野生型TcBuster转座酶的氨基酸序列(SEQ IDNO:1)。

图12示出了含有氨基酸置换D189A/V377T/E469K的突变TcBuster转座酶的氨基酸序列(SEQ ID NO:78)。

图13示出了含有氨基酸置换D189A/V377T/E469K/I452K的突变TcBuster转座酶的氨基酸序列(SEQ ID NO:79)。

图14示出了含有氨基酸置换D189A/V377T/E469K/N85S的突变TcBuster转座酶的氨基酸序列(SEQ ID NO:80)。

图15示出了含有氨基酸置换D189A/V377T/E469K/A358K的突变TcBuster转座酶的氨基酸序列(SEQ ID NO:81)。

图16示出了含有氨基酸置换D189A/V377T/E469K/K573E/E578L的突变TcBuster转座酶的氨基酸序列(SEQ ID NO:13)。

具体实施方式

综述

DNA转座子可以通过非复制的“剪切和粘贴”机制易位。这需要通过催化酶，即转座酶来识别两个末端反向重复序列，该酶可以切割其靶标，且由此从其供体模板中释放DNA转座子。切除后，DNA转座子可随后整合到被相同转座酶切割的受体DNA中。在它们的天然构型中的一些中，DNA转座子侧接有两个反向重复序列，并且可含有编码催化转座的转座酶的基因。

对于使用DNA转座子的基因组编辑应用，期望设计一种转座子以开发基于两种不同质粒的二元系统，由此转座酶与含有侧接有反向重复序列的感兴趣基因的转座子DNA在物理上分离。转座子和转座酶质粒向靶细胞中的共同递送使得转座能够通过常规的剪切和粘贴机制进行。

TcBuster是DNA转座子的hAT家族的成员。该家族的其他成员包括SleepingBeauty和PiggBac。本文论述了与利用hAT家族转座子组分增强基因向人造血和免疫系统细胞的转移的协同途径有关的各种装置、系统和方法。本公开涉及改进的hAT转座酶、转座子载体序列、转座酶递送方法和转座子递送方法。在一个实施方式中，本研究鉴定了用于制造高活性hAT转座酶的特定通用位点。在另一个实施方式中，描述了用于制备保留基因组空间的最小尺寸的hAT转座子载体反向末端重复序列(ITR)的方法。在另一个实施方式中，描述了将hAT家族转座酶作为经化学修饰的体外转录的mRNA递送的改进方法。在另一个实施方式中，描述了将hAT家族转座子载体作为DNA的“微型”环递送的方法，其中实际上所有原核序列都已经通过重组方法去除。在另一个实施方式中，描述了使用与hAT转座酶融合的转录激活因子样(TAL)结构域来融合DNA序列特异性结合结构域的方法。这些改进可以单独地或组合地产生出乎意料的高水平的向所讨论的细胞类型的基因转移，以及转座子载体向目标序列的递送的改进。

突变TcBuster转座酶

本公开的一方面提供了一种突变TcBuster转座酶。与野生型TcBuster转座酶(SEQID NO:1)相比，突变TcBuster转座酶可包含一个或多个氨基酸置换。

突变TcBuster转座酶可以包含与野生型TcBuster转座酶(SEQ ID NO:1)的全长序列具有至少70％序列同一性的氨基酸序列。在一些实施方案中，突变TcBuster转座酶可以包含与野生型TcBuster转座酶(SEQ ID NO:1)的全长序列具有至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性的氨基酸序列。在一些情况下，突变TcBuster转座酶可以包含与野生型TcBuster转座酶(SEQ ID NO:1)的全长序列具有至少98％、至少98.5％、至少99％、至少99.1％、至少99.2％、至少99.3％、至少99.4％、至少99.5％、至少99.6％、至少99.7％、至少99.8％、至少99.9％或至少99.95％序列同一性的氨基酸序列。

如本文所用，术语“同一性百分比(％)”可指的是在比对候选序列和参考序列并引入缺口(如果必要的话)以实现最大的同一性百分比(即，可以在候选序列和参考序列之一或两者中引入缺口以实现最佳比对，而出于比较目的，可以忽略非同源序列)之后，候选序列中与参考序列的氨基酸(或核酸)残基同一的氨基酸(或核酸)残基的百分比。为了确定同一性百分比，比对可以通过本领域技术范围内的各种方式，例如，使用公开可用的计算机软件诸如BLAST、ALIGN或Megalign(DNASTAR)软件来实现。可以通过以下操作来计算两个序列的同一性百分比：使用BLAST将测试序列与比较序列进行比对，确定所比对的测试序列中与比较序列相同位置处的氨基酸或核苷酸同一的氨基酸或核苷酸的数目，以及将同一氨基酸或核苷酸的数目除以比较序列中的氨基酸或核苷酸的数目。

如本文所用，术语“互补序列(complement)”、“互补序列compleme nts”、“互补的”和“互补性”可指的是与给定序列完全互补并且可与给定序列杂交的序列。在一些情况下，如果与给定核酸杂交的序列在给定区域上的碱基序列能够互补地结合其结合伴侣的碱基序列，由此形成例如A-T、A-U、G-C和G-U碱基对，则所述与给定核酸杂交的序列被称为给定分子的“互补序列”或“反向互补序列。”一般来说，可与第二序列杂交的第一序列可与第二序列特异性或选择性地杂交，使得与第二序列或第二序列集的杂交是优选的(例如，在给定的条件集(诸如本领域常用的严格条件)下热力学更稳定)，以在杂交反应期间与非靶序列杂交。通常，可杂交的序列在其各自长度的全部或一部分上共享一定程度的序列互补性，诸如介于25％-100％之间的互补性，包括至少25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％和100％序列互补性。可以通过任何合适的比对算法来测量序列同一性(诸如出于评估互补性百分比的目的)，这些算法包括但不限于Needleman-Wunsch算法(例如，参见www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html上可得的EMBOSS Needle比对软件，任选使用默认设置)；BLAST算法(参见，例如blast.ncbi.nlm.nih.gov/Blast.cgi上可得的BLAST比对工具，任选使用默认设置)；或Smith-Waterman算法(例如，参见www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html上可得的EMBOSS Water比对软件，任选使用默认设置)。可以使用所选算法的任何合适参数(包括默认参数)来评估最佳比对。

互补性可以是完美的或大体的/充分的互补性。两个核酸之间的完美互补性可意味着这两个核酸可以形成双链体，其中双链体中的每个碱基都通过Watson-Crick配对与互补碱基键合。大体或充分的互补性可意味着一条链中的序列与相对链中的序列不完全和/或不完美地互补，但是在杂交条件集(例如，盐浓度和温度)下，两条链上的碱基之间发生足够的键合以形成稳定的杂交复合体。此类条件可以通过使用序列和标准数学计算预测杂交链的Tm或通过使用常规方法凭经验确定Tm来预测。

突变TcBuster转座酶可包含具有至少一个与野生型TcBuster转座酶(SEQ ID NO:1)的全长序列不同的氨基酸的氨基酸序列。在一些实施方案中，突变TcBuster转座酶可包含具有至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个或更多个与野生型TcBuster转座酶(SEQ ID NO:1)的全长序列不同的氨基酸的氨基酸序列。在一些情况下，突变TcBuster转座酶可包含具有至少5个、至少10个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少200个或至少300个与野生型TcBuster转座酶(SEQ ID NO:1)的全长序列不同的氨基酸的氨基酸序列。在一些情况下，突变TcBuster转座酶可包含具有至多3个、至多6个、至多12个、至多25个、至多35个、至多45个、至多55个、至多65个、至多75个、至多85个、至多95个、至多150个、至多250个或至多350个与野生型TcBuster转座酶(SEQ ID NO:1)的全长序列不同的氨基酸的氨基酸序列。

如图4所示，通常，野生型TcBuster转座酶可被视为从N末端至C末端包含ZnF-BED结构域(氨基酸76-98)、DNA结合和寡聚化结构域(氨基酸112-213)、第一催化结构域(氨基酸213-312)、插入结构域(氨基酸312-543)和第二催化结构域(氨基酸583-620)以及至少四个介于这些加注释的结构域之间的结构域间区域。除非另外指出，否则如本文所用的针对氨基酸的数字参考均根据SEQ ID NO:1。突变TcBuster转座酶可包含在这些结构域的任何一个或其任何组合中的一个或多个氨基酸置换。在一些情况下，突变TcBuster转座酶可包含在以下中的一个或多个氨基酸置换：ZnF-BED结构域、DNA结合和寡聚化结构域、第一催化结构域、插入结构域或其组合。突变TcBuster转座酶可包含在两个催化结构域的至少一个中的一个或多个氨基酸置换。

示例性突变TcBuster转座酶可包含一个或多个来自表1或表1.1的氨基酸置换。有时，突变TcBuster转座酶可包含至少一个来自表1或表1.1的氨基酸置换。突变TcBuster转座酶可包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少20个、至少30个或更多个来自表1或表1.1的氨基酸置换。

表1

表1.1

示例性突变TcBuster转座酶包含一个或多个来自表2的氨基酸置换或置换组合。有时，突变TcBuster转座酶可包含至少一个来自表2的氨基酸置换或置换组合。突变TcBuster转座酶可包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少20个、至少30个或更多个来自表2的氨基酸置换或置换组合。

表2

示例性突变TcBuster转座酶包含一个或多个来自表3的氨基酸置换或置换组合。有时，突变TcBuster转座酶可包含至少一个来自表3的氨基酸置换或置换组合。突变TcBuster转座酶可包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少20个、至少30个或更多个来自表3的氨基酸置换或置换组合。

表3

高活性突变TcBuster转座酶

本公开的另一方面在于提供一种高活性突变TcBuster转座酶。如本文所用的“高活性”突变TcBuster转座酶可指的是与具有氨基酸序列SEQ ID NO:1的野生型TcBuster转座酶相比具有提高的转座效率的任何突变TcBuster转座酶。

在一些实施方案中，与具有氨基酸序列SEQ ID NO:1的野生型TcBuster转座酶相比，高活性突变TcBuster转座酶在某些情况下可以具有提高的转座效率。例如，当用于催化具有特定类型的反向重复序列的转座子的转座时，高活性突变TcBuster转座酶可具有比野生型TcBuster转座酶更佳的转座效率。对于具有其他类型的反向重复序列的一些其他转座子而言，与野生型TcBuster转座酶相比，高活性突变TcBuster转座酶可能不具有提高的转座效率。在一些其他非限制性实例中，在某些转染条件下，与具有氨基酸序列SEQ ID NO:1的野生型TcBuster转座酶相比，高活性突变TcBuster转座酶可以具有提高的转座效率。不受限制地，当与野生型TcBuster转座酶相比时，当温度高于正常细胞培养温度时，高活性突变TcBuster转座酶可具有更佳的转座效率；高活性突变TcBuster转座酶在相对酸性或碱性水性介质中可具有更佳的转座效率；当执行特定类型的转染技术(例如电穿孔)时，高活性突变TcBuster转座酶可具有更佳的转座效率。

转座效率可以通过在宿主细胞群中发生的成功转座事件的百分比来衡量，该百分比用引入到宿主细胞群中的转座子和转座酶的量来进行归一化。在许多情况下，当比较两种或更多种转座酶的转座效率时，将相同的转座子构建体与该两种或更多种转座酶中的每种配对，以在相同或相似的转染条件下转染宿主细胞。宿主细胞中的转座事件的量可以通过各种途径来检查。例如，转座子构建体可被设计成含有位于反向重复序列之间的报告基因，并且对报告基因呈阳性的转染细胞可以被计数为发生成功的转座事件的细胞，这可以估计出转座事件的量。另一个非限制性实例包括对宿主细胞基因组进行测序以检查转座子的货物盒的插入。在一些实施方案中，当比较两个或更多个不同转座子的转座效率时，可将相同的转座酶与不同转座子中的每个配对以在相同或相似的转染条件下转染宿主细胞。可以利用类似的途径来测量转座效率。也可以采用本领域技术人员已知的其他方法来比较转座效率。

本文还提供了获得高活性突变TcBuster转座酶的方法。

一种示例性方法可以包括使TcBuster转座酶的氨基酸发生系统性突变以增加氨基酸序列的净电荷。有时，该方法可以包括执行系统性丙氨酸扫描，以便将在中性pH下带负电荷的天冬氨酸(D)或谷氨酸(E)突变为丙氨酸残基。方法可以包括系统性突变成在中性pH下带正电荷的赖氨酸(K)或精氨酸(R)残基。

不希望受特定理论的束缚，在中性pH下氨基酸序列的净电荷的增加可以提高TcBuster转座酶的转座效率。特别地，当净电荷在转座酶的催化结构域的邻近处增加时，预期转座效率会提高。可以预期，带正电荷的氨基酸可形成与DNA靶标的接触点，并允许催化结构域作用于DNA靶标。还可以预期，这些带正电荷的氨基酸的丧失可以降低转座酶中的切除或整合活性。

图11描绘了WT TcBuster转座酶的氨基酸序列，突出显示了可作为与DNA的接触点的氨基酸。在图11中，大写粗体字母表示催化三联体氨基酸；带框的字母表示当被替换为带正电荷的氨基酸时会增加转座的氨基酸；斜体和小写字母表示当被替换为不同氨基酸时会减少转座的带正电荷的氨基酸；粗斜体且带下划线的字母表示当被替换为带正电荷的氨基酸时增加转座，而当被替换为带负电荷的氨基酸时减少转座的氨基酸；带下划线的字母表示基于与Buster亚家族的蛋白质序列比对，可以是带正电荷的氨基酸的氨基酸。

突变TcBuster转座酶与SEQ ID NO:1相比可包含增加在中性pH下的净电荷的一个或多个氨基酸置换。有时，与SEQ ID NO:1相比包含增加在中性pH下的净电荷的一个或多个氨基酸置换的突变TcBuster转座酶可以是高活性的。有时，突变TcBuster转座酶可以包含向带正电荷的氨基酸(诸如但不限于赖氨酸(K)或精氨酸(R))的一个或多个置换。突变TcBuster转座酶可以包含用中性氨基酸或带正电荷的氨基酸对带负电荷的氨基酸(诸如但不限于天冬氨酸(D)或谷氨酸(E))的一个或多个置换。

一个非限制性实例包括突变TcBuster转座酶，其与SEQ ID NO:1相比包含增加在催化结构域内或邻近处在中性pH下的净电荷的一个或多个氨基酸置换。该催化结构域可以是第一催化结构域或第二催化结构域。该催化结构域还可包括转座酶的两个催化结构域。

本公开的示例性方法可以包括使被预测为与DNA非常邻近或直接接触的氨基酸发生突变。这些氨基酸可以是被鉴定为在hAT家族的一个或多个其他成员(例如，Buster和/或Ac亚家族的其他成员)中保守的经替换的氨基酸。可以例如通过参考晶体结构、预测的结构、突变分析、功能分析、与hAT家族的其他成员的比对，或任何其他合适的方法来鉴定经预测与DNA非常邻近或直接接触的氨基酸。

不希望受特定理论的束缚，像hAT转座酶家族的其他成员一样，TcBuster转座酶也具有DDE基序，该DDE基序可以是催化转座子运动的活性位点。预期D223、D289和E589构成活性位点，所述活性位点是酸性残基的三联体。DDE基序可以与二价金属离子配位，并且在催化反应中可能很重要。在一些实施方案中，突变TcBuster转座酶与SEQ ID NO:1相比可包含增加在中性pH下的净电荷的一个或多个氨基酸置换，并且当根据SEQ ID NO:1编号时，所述一个或多个氨基酸位于D223、D289或E589的邻近处。

在某些实施方案中，本文提供的突变TcBuster转座酶不包含催化三联体，即D223、D289或E589的任何破坏。突变TcBuster转座酶可不包含在D223、D289或E589处的任何氨基酸置换。突变TcBuster转座酶可以包含在D223、D289或E589处的氨基酸置换，但是此种置换不会破坏由催化三联体贡献的催化活性。

在一些情况下，术语“邻近度”可以指的是转座酶的一级结构中的线性距离的量度。例如，野生型TcBuster转座酶的一级结构中D223与D289之间的距离是66个氨基酸。在某些实施方案中，邻近度可以指的是约70至80个氨基酸的距离。在许多情况下，邻近度可以指的是约80、75、70、60、50、40、30、20、10或5个氨基酸的距离。

在一些情况下，术语“邻近度”可以指的是转座酶的二级或三级结构中(即，当转座酶折叠成其三维构型时)的空间关系的量度。蛋白质的二级结构可以指的是指蛋白质局部片段的三维形式。常见的二级结构元件包括α螺旋、β折叠、β转角和Ω环。在蛋白质折叠成其三维三级结构之前，二级结构元件可以作为中间体形成。蛋白质三级结构可以指的是指蛋白质的三维形状。蛋白质三级结构在生理或其他条件下可能表现出动态构型变化。三级结构将具有单一多肽链“主链”，其具有一个或多个蛋白质二级结构，即蛋白质结构域。氨基酸侧链可以许多方式相互作用和键合。特定蛋白质内的侧链的相互作用和键决定了其三级结构。在许多实施方式中，邻近度可以指的是约

约

约

约

约

约

约

约

约

约

约

约

约

约

约

约

或约

的距离。

中性pH可以是大约7的pH值。有时，中性pH可以是介于6.9与7.1之间、介于6.8与7.2之间、介于6.7与7.3之间、介于6.6与7.4之间、介于6.5与7.5之间、介于6.4与7.6之间、介于6.3与7.7之间、介于6.2与7.8之间、介于6.1与7.9之间、介于6.0与8.0之间、介于5与8之间或在从中得出的范围内的pH值。

与SEQ ID NO:1相比包含增加在中性pH下的净电荷的一个或多个氨基酸置换的非限制性示例性突变TcBuster转座酶包括包含来自表4、表4.1或这两者的氨基酸置换的组合中的至少一种组合的TcBuster转座酶。突变TcBuster转座酶可以包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少20个、至少30个或更多个来自表4、表4.1或这两者的氨基酸置换。

在一些实施方案中，突变TcBuster转座酶与SEQ ID NO:1相比可包含增加在非中性pH下的净电荷的一个或多个氨基酸置换。在一些情况下，净电荷在非中性pH下在催化结构域内或邻近处增加。在许多情况下，净电荷在非中性pH下在D223、D289或E589邻近处增加。非中性pH可以是低于7、低于6.5、低于6、低于5.5、低于5、低于4.5、低于4、低于3.5、低于3、低于2.5、低于2、低于1.5或低于1的pH值。非中性pH也可以是高于7、高于7.5、高于8、高于8.5、高于9、高于9.5或高于10的pH值。

表4

表4.1

在一个示例性实施方案中，方法可以包括使DNA结合和寡聚化结构域中的氨基酸发生系统性突变。不希望受特定理论的束缚，DNA结合和寡聚化结构域中的突变可以增加对DNA靶标的结合亲和力并促进转座酶的寡聚化活性，这因此可促进转座效率。更具体地，该方法可以包括使在DNA结合和寡聚化结构域(例如，氨基酸112至213)内或邻近处的氨基酸一个接一个地发生系统性突变。该方法还可以包括使在DNA结合和寡聚化结构域内或邻近处的多于一个氨基酸发生突变。该方法还可以包括使在DNA结合和寡聚化结构域内或邻近处的一个或多个氨基酸以及在DNA结合和寡聚化结构域外部的一个或多个氨基酸发生突变。

在一些实施方案中，该方法可以包括基于TcBuster与其他hAT家族转座酶(Ac、Hermes、Hobo、Tag2、Tam3、Hermes、Restless和Tol2)或者与Buster亚家族的其他成员(例如AeBuster1、AeBuster2、AeBuster3、BtBuster1、BtBuster2、CfBuster1和CfBuster2)的多重序列比对执行选择性氨基酸残基的合理替代。不受某一理论的束缚，某些氨基酸在其他hAT家族转座酶中(尤其是在活性转座酶中)的保守性可能表明它们对转座酶的催化活性的重要性。因此，用其他hAT家族中的保守氨基酸替代野生型TcBuster序列(SEQ ID NO:1)中的非保守氨基酸可产生高活性突变TcBuster转座酶。该方法可以包括获得TcBuster以及其他hAT家族转座酶的序列；将所述序列相对于在其他hAT家族转座酶中的不同保守对应物进行比对并鉴定TcBuster转座酶中的氨基酸；进行定点诱变以产生携带一个或多个突变的突变TcBuster转座酶。

基于与Buster亚家族的其他成员或hAT家族的其他成员的比对，高活性突变TcBuster转座酶可以包含一个或多个氨基酸置换。在许多情况下，所述一个或多个氨基酸置换可以是野生型TcBuster序列(SEQ ID NO:1)中非保守氨基酸被置换为保守氨基酸。突变TcBuster转座酶的非限制性实例包括包含至少一个来自表5、表5.1或这两者的氨基酸置换的TcBuster转座酶。突变TcBuster转座酶可以包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少20个、至少30个或更多个来自表5、表5.1或这两者的氨基酸置换。

另一个示例性方法可以包括使酸性氨基酸系统性地突变为碱性氨基酸并鉴定出高活性突变转座酶。

在一些情况下，突变TcBuster转座酶可以包含氨基酸置换V377T、E469K和D189A。突变TcBuster转座酶可以包含氨基酸置换K573E和E578L。突变TcBuster转座酶可以包含氨基酸置换I452K。突变TcBuster转座酶可以包含氨基酸置换A358K。突变TcBuster转座酶可以包含氨基酸置换V297K。突变TcBuster转座酶可以包含氨基酸置换N85S。突变TcBuster转座酶可以包含氨基酸置换N85S、V377T、E469K和D189A。突变TcBuster转座酶可以包含氨基酸置换I452F、V377T、E469K和D189A。突变TcBuster转座酶可以包含氨基酸置换A358K、V377T、E469K和D189A。突变TcBuster转座酶可以包含氨基酸置换V377T、E469K、D189A、K573E和E578L。

表5

表5.1

核定位信号

本公开的另一方面提供了一种融合TcBuster转座酶，其具有一个或多个另外的核定位信号(NLS)序列。野生型TcBuster转座酶(SEQ ID NO:1)含有两个推定的单组分(monopartite)NLS序列RKKR和KKRK。在本公开的一些实施方案中，如本文提供的融合TcBuster转座酶可包含通过氨基酸置换产生的另外的单组分NLS序列。在一些情况下，所述另外的单组分NLS序列可以具有序列K(K/R)X(K/R)，其中X表示任何氨基酸。在一些情况下，如本文提供的包含另外的单组分NLS序列的融合TcBuster转座酶与不具有所述另外的单组分NLS序列的其他方面同一的TcBuster转座酶相比，可以具有提高的转座效率。

在一些实施方案中，如本文提供的融合TcBuster转座酶包含至少1个、至少2个、至少3个、至少4个或至少5个另外的NLS序列。在一些情况下，所述另外的NLS序列包括表6中列出的序列。如本文所提供，所述另外的NLS序列可融合至TcBuster转座酶的N末端、C末端和/或内部。

如本文所提供的包含二组分NLS序列的示例性TcBuster转座酶可以具有NLS序列，如K(K/R)XXXXXXXXXXXX(K/R)(K/R)(K/R)(K/R)、K(K/R)XXXXXXXXXXX(K/R)(K/R)(K/R)(K/R)、K(K/R)XXXXXXXXXX(K/R)(K/R)(K/R)(K/R)、K(K/R)XXXXXXXXX(K/R)(K/R)(K/R)(K/R)、K(K/R)XXXXXXXX(K/R)(K/R)(K/R)(K/R)或K(K/R)XXXXXXX(K/R)(K/R)(K/R)(K/R)，其中X表示任何氨基酸。

表6.示例性核定位信号

具有DNA结合结构域的融合转座酶

本公开的另一方面提供了一种融合转座酶。融合转座酶可以包含TcBuster转座酶序列和DNA序列特异性结合结构域。

融合转座酶的TcBuster转座酶序列可以包含如本文所述的任何突变TcBuster转座酶的氨基酸序列。融合转座酶的TcBuster转座酶序列还可包含具有氨基酸序列SEQ IDNO:1的野生型TcBuster转座酶的氨基酸序列。

如本文所述的DNA序列特异性结合结构域可以是指适于在含有特异性序列基序的序列区域(“靶序列”)处结合至DNA分子的蛋白质结构域。例如，一个示例性DNA序列特异性结合结构域可以选择性地结合至序列基序TATA，而另一个示例性DNA序列特异性结合结构域可以选择性地结合至不同序列基序ATGCNTAGAT(SEQ ID NO:82)(N表示A、T、G和C中的任一者)。

如本文提供的融合转座酶可以指导转座子的序列特异性插入。例如，DNA序列特异性结合结构域可以基于所述结合结构域的结合特异性来指导融合转座酶结合至靶序列。结合至或限制于某个序列区域可以从空间上限制融合转座酶与转座子之间的相互作用，从而将催化的转座限制于邻近靶序列的序列区域。根据DNA结合结构域的大小、三维构型和序列结合亲和力，以及DNA结合结构域与TcBuster转座酶序列之间的空间关系，以及两个结构域之间的连接的灵活性，实际转座位点到靶序列的距离可以变化。融合转座酶构型的适宜设计可以将转座引导至所需的靶基因组区域。

根据应用目的，用于转座的靶基因组区域可以是任何特定的基因组区域。例如，有时，对于转座而言需要避免转录起始位点，其可能引起细胞的某个或某些重要内源基因的表达水平的不期望的或甚至有害的变化。融合转座酶可以含有DNA序列特异性结合结构域，该结构域可以将转座靶向至宿主基因组的安全港。安全港的非限制性实例可以包括HPRT、AAVS位点(例如AAVS1、AAVS2、ETC)、CCR5或Rosa26。安全港位点一般可以是指用于转基因插入的位点，该位点的使用对细胞的基因组完整性或细胞的健康和功能没有或几乎没有破坏作用。

DNA序列特异性结合结构域可以衍生自具有序列特异性的任何DNA结合蛋白，或者可以是具有序列特异性的任何DNA结合蛋白的变体。在许多情况下，DNA序列特异性结合结构域可以包含与天然存在的序列特异性DNA结合蛋白至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的氨基酸序列。DNA序列特异性结合结构域可以包含与天然存在的序列特异性DNA结合蛋白至少70％同一的氨基酸序列。天然存在的序列特异性DNA结合蛋白的非限制性实例包括但不限于来自各种来源的转录因子、特异性序列核酸酶和病毒复制蛋白。天然存在的序列特异性DNA结合蛋白也可以是来自各种来源的具有特异性结合能力的任何其他蛋白。DNA结合蛋白的选择和预测可以通过各种途径进行，所述途径包括但不限于使用可在线获得的计算预测数据库，如DP-Bind(http://lcg.rit.albany.edu/dp-bind/)或DNABIND(http://dnabind.szialab.org/)

术语“转录因子”可以是指通过与特定DNA序列结合来控制遗传信息从DNA到信使DNA的转录速率的蛋白质。可以在本文所述的融合转座酶中使用的转录因子可以基于原核转录因子或真核转录因子，只要它在与靶DNA分子结合时赋予序列特异性即可。诸如DBD(http://www.transcriptionfactor.org)的转录因子预测数据库可用于为本文的公开内容的应用选择适当的转录因子。

如本文所用的DNA序列特异性结合结构域可以包含来自天然存在的转录因子的一个或多个DNA结合结构域。转录因子DNA结合结构域的非限制性例子包括属于诸如以下的家族的DNA结合结构域：碱性螺旋-环-螺旋、碱性亮氨酸拉链(bZIP)、二组分反应调节子的C末端效应子结构域、AP2/ERF/GCC盒、螺旋-转角-螺旋、同源结构域蛋白、λ阻遏物样、srf样(血清反应因子)、配对盒、有翼螺旋、锌指、多结构域Cys2His2(C2H2)锌指、Zn2/Cys6或Zn2/Cys8核受体锌指。

DNA序列特异性结合结构域可以是与特定DNA序列结合的人工工程改造的氨基酸序列。此类人工设计的氨基酸序列的非限制性实例包括基于诸如以下的框架创建的序列：转录激活子样效应核酸酶(TALE)DNA结合结构域、锌指核酸酶、腺相关病毒(AAV)Rep蛋白和如本文所述的任何其他合适的DNA结合蛋白。

天然TALE是由黄单胞菌属细菌分泌的帮助感染植物物种的蛋白质。天然TALE可以通过结合至特定DNA序列并激活宿主基因的表达来辅助感染。一般而言，TALE蛋白由中央重复结构域组成，该结构域决定了DNA靶向特异性，并且可以迅速地从头合成。TALE具有含有重复残基序列的模块化DNA结合结构域(DBD)。在一些TALE中，每个重复区域都含有34个氨基酸。如本文所用的术语“TALE结构域”可以指代TALE的模块化DBD。每个重复区域的第12位和第13位的一对残基可以决定核苷酸的特异性，并且被称为重复可变双残基(RVD)。最后一个重复区域称为半重复，通常被截短为20个氨基酸。组合这些重复区域允许合成序列特异性的合成TALE。C末端通常含有将TALE引导至细胞核的核定位信号(NLS)，以及调节转录的功能结构域，诸如酸性激活结构域(AD)。内源性NLS可以被生物体特异性定位信号替代。例如，可以将源自猿猴病毒40大T抗原的NLS用于哺乳动物细胞中。RVDs HD、NG、NI和NN分别靶向C、T、A和G/A。RVD及其在某些情况下对核苷酸的结合偏好的列表可见于表7中。另外的TALE RVD也可以用于定制简并TALE-DNA相互作用。例如，NA对DNA的所有四种碱基都具有高亲和力。此外，N*(其中*是在第13个残基中具有缺失的RVD)可以适应包括甲基化胞嘧啶在内的DNA的所有字母。另外，S*可能具有结合至任何DNA核苷酸的能力。

许多在线工具可用于设计靶向特定DNA序列的TALE，例如TALE-NT(https://tale-nt.cac.cornell.edu/)、Mojo hand(http://www.talendesign.org/)。可商购获得的试剂盒还可帮助在蛋白质的N与C末端之间创建TALE重复区域的定制组装体。这些方法可用于组装定制DBD，然后将其克隆到含有功能结构域(例如TcBuster转座酶序列)的表达载体中。

表7 RVD结合偏好

TALE可以在实验室中从头合成，例如，通过将Golden Gate反应中的消化和连接步骤与II型限制酶组合来合成。可替代地，TALE可以通过许多不同的途径进行组装，所述途径包括但不限于不依赖连接的克隆(LIC)、快速的基于连接的可自动化固相高通量(FLASH)组装和迭代加帽组装(ICA)。

锌指(ZF)是约30个氨基酸，其可以结合至约3个核苷酸的有限组合。C2H2 ZF结构域可为最常见的ZF类型，并且似乎是真核细胞中表达最丰富的蛋白质之一。ZF是与其结构中的锌分子配位的小的、功能性且独立折叠的结构域。每个ZF中的氨基酸都可对特定核苷酸具有亲和力，从而导致每个指选择性地识别DNA的3-4个核苷酸。多个ZF可以排列成串联阵列，并识别DNA上的一组核苷酸。通过使用不同锌指的组合，可以靶向基因组内的独特DNA序列。可以产生各种长度的不同ZFP，这可以允许识别可能的64个三联体亚位点中几乎任何所需的DNA序列。

可以使用已建立的模块化组装指，诸如由Barbas和同事开发的一组模块化组装指结构域以及由ToolGen开发的另一组模块化组装指结构域来创建要与本公开结合使用的锌指。这两组结构域都覆盖所有3bp GNN、大多数ANN、许多CNN和一些TNN三联体(其中N可以是四个核苷酸中的任何一个)。两者都有一组不同的指，这可允许根据需要搜索和编码不同的ZF模块。还可以采用组合的基于选择的寡聚化池工程(OPEN)策略来最大程度地减少涉及蛋白质中的指位置和相邻指序列的模块化组装体的依赖于背景的影响。OPEN ZF阵列可从Zinc Finger Consortium Database公开获得。

AAV Rep DNA结合结构域是可与本公开的主题结合使用的另一种DNA序列特异性结合结构域。病毒顺式作用的反向末端重复序列(ITR)和反式作用的病毒Rep蛋白(Rep)据信是在辅助病毒不存在下介导AAV优先整合至宿主基因组的AAVS1位点中的因子。AAV Rep蛋白可以结合至AAVS1位点中的特定DNA序列。因此，位点特异性DNA结合结构域可以与如本文所述的TcBuster转座酶结构域融合在一起。

本文提供的融合转座酶可以包含TcBuster转座酶序列和标签序列。如本文提供的标签序列可以是指可用作融合蛋白的检测标签的任何蛋白质序列，诸如但不限于可被抗体识别的报告蛋白和亲和标签。报告蛋白包括但不限于荧光蛋白(例如GFP、RFP、mCherry、YFP)、β-半乳糖苷酶(β-gal)、碱性磷酸酶(AP)、氯霉素乙酰转移酶(CAT)、辣根过氧化物酶(HRP)。亲和标签的非限制性实例包括多组氨酸(His标签)、谷胱甘肽S-转移酶(GST)、麦芽糖结合蛋白(MBP)、钙调蛋白结合肽(CBP)、内含肽-壳多糖结合结构域(内含肽-CBD)、基于链霉亲和素/生物素的标签、表位标签如FLAG、HA、c-myc、T7、Glu-Glu等。

如本文提供的融合转座酶可以包含在不存在任何中间序列的情况下(例如，“背靠背”)融合在一起的TcBuster转座酶序列和DNA序列特异性结合结构域或标签序列。在一些情况下，如本文提供的融合转座酶可以包含通过接头序列联接的TcBuster转座酶序列和DNA序列特异性结合结构域或标签序列。图8是示例性融合转座酶的示意图，其包含通过接头联接的DNA序列特异性结合结构域和TcBuster转座酶序列。在示例性融合转座酶中，接头可以主要用作第一多肽与第二多肽之间的间隔子。接头可以是用于分隔开单个多肽中的多个结构域的短氨基酸序列。接头序列可以包含在天然多结构域蛋白中存在的接头。在一些情况下，接头序列可以包含人工创建的接头。接头序列的选择可以基于融合转座酶的应用。接头序列可以包含3、4、5、6、7、8、9、10或更多个氨基酸。在一些实施方案中，接头序列可以包含至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个或至少50个氨基酸。在一些实施方案中，接头序列可以包含至多4个、至多5个、至多6个、至多7个、至多8个、至多9个、至多10个、至多11个、至多12个、至多15个、至多20个、至多30个、至多40个、至多50个或至多100个氨基酸。在某些情况下，可能希望使用柔性接头序列，诸如但不限于Gly和Ser残基的延伸段(stretches)(“GS”接头)，如(GGGGS)n(n＝2-8)(SEQ ID NO:83)、(Gly)₈(SEQ ID NO:84)、GSAGSAAGSGEF(SEQ ID NO:85)、(GGGGS)₄(SEQ IDNO:86)。有时，可能希望使用刚性接头序列，诸如但不限于(EAAAK)n(n＝2-7)(SEQ ID NO:87)、富含Pro的序列，如(XP)n，其中X表示任何氨基酸。

在本文提供的示例性融合转座酶中，TcBuster转座酶序列可以与DNA序列特异性结合结构域或标签序列的N-末端融合。可替代地，TcBuster转座酶序列可以与DNA序列特异性结合结构域或标签序列的C-末端融合。在一些实施方案中，根据融合转座酶的应用，在TcBuster转座酶与DNA序列特异性结合结构域或标签序列之间可以存在第三结构域序列或更多的其他序列。

TcBuster的核苷酸序列

本公开的另一方面提供了编码如本文提供的TcBuster转座酶的多核苷酸，例如核苷酸序列。在一些实施方案中，如本文提供的多核苷酸包含一个或多个受到多核苷酸被递送至其细胞的生物体的翻译系统喜爱的密码子。例如，当将如本文提供的多核苷酸递送至人细胞用于基因组编辑目的时，所述多核苷酸可以包含一个或多个受到人(例如，智人)翻译系统喜爱的密码子。在一些实施方案中，编码如本文提供的TcBuster转座酶的多核苷酸中的一个或多个密码子可以是在多核苷酸被递送至其细胞的生物体中以较高频率发现的密码子。不受某一理论的束缚，在一些情况下，如本文提供的TcBuster转座酶以编码它的多核苷酸的形式被递送至靶细胞，并且靶细胞中的高频密码子与编码TcBuster转座酶的DNA中的天然密码子相比可被该细胞的翻译系统更有效地利用，从而导致TcBuster转座酶在靶细胞中的表达增加。

如本文提供的多核苷酸的某些实施方案可以包含被受到多核苷酸递送至其细胞的生物体所喜爱的密码子替代的至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个或至少200个密码子。所述多核苷酸的某些实施方案可以包含在智人中以高频率发现的一个或多个密码子，诸如表8中列出的具有高频率/千(或分数(fraction))的密码子。在一些情况下，如果表8中的密码子在智人中的频率/千为至少5、至少6、至少8、至少10、至少12、至少14、至少16、至少18、至少20、至少25或至少30，则选择这些密码子。在一些情况下，如果表8中的密码子在智人中的分数为至少0.1、至少0.12、至少0.14、至少0.16、至少0.18、至少0.2、至少0.22、至少0.24、至少0.26、至少0.28、至少0.3、至少0.35、至少0.4、至少0.45、至少0.5或至少0.55，则选择这些密码子。

在一些实施方案中，本文提供的多核苷酸经密码子优化成在靶物种的细胞，例如人细胞中表达。多核苷酸可经密码子优化成在靶物种的细胞中表达，例如，多核苷酸中的至少70％、75％、80％、85％、90％、95％、98％、99％或100％的密码子以高频率存在于靶物种中(以例如至少5、至少6、至少8、至少10、至少12、至少14、至少16、至少18、至少20、至少25或至少30的频率/千存在于靶物种中，或者以例如，至少0.1、至少0.12、至少0.14、至少0.16、至少0.18、至少0.2、至少0.22、至少0.24、至少0.26、至少0.28、至少0.3、至少0.35、至少0.4、至少0.45、至少0.5或至少0.55的分数存在于靶物种中)。在一些实施方案中，所述多核苷酸经密码子优化成在靶物种的细胞中表达，例如，多核苷酸中的至少80％、85％、90％、95％、98％、99％或100％的密码子以高频率存在于靶物种中(以例如至少20、至少25或至少30的频率/千存在于靶物种中，或者以至少0.2、至少0.22、至少0.24、至少0.26、至少0.28、至少0.3、至少0.35、至少0.4、至少0.45、至少0.5或至少0.55的分数存在于靶物种中)。

SEQ ID NO:204是经密码子优化成在人细胞中表达并编码野生型TcBuster转座酶的示例性DNA序列。SEQ ID NO:207是经密码子优化成在人细胞中表达并编码野生型TcBuster转座酶的示例性mRNA序列。本文提供的多核苷酸可以包含与全长SEQ ID NO:204或207至少约70％、75％、80％、85％、90％、95％或98％同一或互补的核苷酸序列。在一些实施方案中，所述多核苷酸具有与全长SEQ ID NO:204或207至少约80％、85％、90％、95％或98％同一或互补的核苷酸序列。在一些实施方案中，所述多核苷酸具有与全长SEQ ID NO:204或207至少约95％同一或互补的核苷酸序列。

表8.智人的密码子使用表

TcBuster转座子

本公开的另一方面提供了一种TcBuster转座子，其包含位于两个反向重复序列之间的货物盒。TcBuster转座子可以被本文所述的TcBuster转座酶识别，例如，TcBuster转座酶可以识别TcBuster转座子并催化TcBuster转座子转座到DNA序列中。

如本文可互换使用的术语“反向重复序列”、“末端反向重复序列”、“反向末端重复序列”可以是指短序列重复序列，其侧接天然转座子中的转座酶基因或人工工程改造的转座子中的货物盒。在相应的转座酶存在下动员转座子一般需要两个反向重复序列。如本文所述的反向重复序列可含有一个或多个直接重复(DR)序列。这些序列通常嵌入在元件的末端反向重复序列(TIR)中。如本文所用的术语“货物盒”可以是指反向重复序列之间的除含有TcBuster转座酶基因的天然核苷酸序列以外的核苷酸序列。货物盒可被人工工程改造。

本文所述的转座子可以含有侧接有IR/DR序列的货物盒。在一些实施方案中，所述重复序列中的至少一个含有至少一个直接重复序列。如图1和图2所示，转座子可含有侧接有IRDR-L-Seq1(SEQ ID NO:3)和IRDR-R-Seq1(SEQ ID NO:4)的货物盒。在许多情况下，左反向重复序列可以包含与IRDR-L-Seq1(SEQ ID NO:3)至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。有时，右反向重复序列可以包含与IRDR-R-Seq1(SEQ ID NO:4)至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。在其他情况下，右反向重复序列可以包含与IRDR-L-Seq1(SEQ ID NO:3)至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。有时，左反向重复序列可以包含与IRDR-R-Seq1(SEQ ID NO:4)至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。如本文所用的术语“左”和“右”可分别指代双链转座子的有义链上的货物盒的5'和3'侧。转座子也可能含有侧接有IRDR-L-Seq2(SEQ ID NO:5)和IRDR-R-Seq2(SEQ ID NO:6)的货物盒。在许多情况下，左反向重复序列可以包含与IRDR-L-Seq2(SEQ ID NO:5)至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。有时，右反向重复序列可以包含与IRDR-R-Seq2(SEQ ID NO:6)至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。在其他情况下，右反向重复序列可以包含与IRDR-L-Seq2(SEQ ID NO:5)至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。有时，左反向重复序列可以包含与IRDR-R-Seq2(SEQ ID NO:6)至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。可替代地，转座子可以含有侧接有IRDR-L-Seq3(SEQ ID NO:205)和IRDR-R-Seq3(SEQ ID NO:206)的货物盒。在许多情况下，左反向重复序列可以包含与IRDR-L-Seq3(SEQ ID NO:205)至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。有时，右反向重复序列可以包含与IRDR-R-Seq3(SEQ ID NO:206)至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。在其他情况下，右反向重复序列可以包含与IRDR-L-Seq3(SEQ ID NO:205)至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。有时，左反向重复序列可以包含与IRDR-R-Seq3(SEQ ID NO:206)至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。转座子可含有侧接有两个反向重复序列的货物盒，该反向重复序列具有与图2中给出的核苷酸序列不同的核苷酸序列，或本领域技术人员已知的各种序列的组合。本文所述的转座子的两个反向重复序列中的至少一个可含有与SEQ ID NO:3-6中的任一个至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、至少98％、至少99％或100％同一的序列。本文所述的转座子的反向重复序列中的至少一个可含有与SEQ ID NO:3或4至少80％同一的序列。本文所述的转座子的反向重复序列中的至少一个可含有与SEQ ID NO:5或6至少80％同一的序列。反向重复序列的选择可根据预期的转座效率、待修饰的细胞类型、待使用的转座酶以及许多其他因素而变化。

在许多实施方式中，可以使用保留基因组空间的最小尺寸的转座子载体反向末端重复序列。hAT家族转座子的ITR差异很大，左手和右手ITR有差异。在许多情况下，仅由100-200个核苷酸组成的较小ITR与较长的天然ITR一样在hAT转座子载体中有活性。在介导hAT家族转座时，这些序列可一致地减少。这些较短的ITR可以保留hAT转座子载体内的基因组空间。

本文提供的转座子的反向重复序列可以是约50至2000个核苷酸、约50至1000个核苷酸、约50至800个核苷酸、约50至600个核苷酸、约50至500个核苷酸、约50至400个核苷酸、约50至350个核苷酸、约50至300个核苷酸、约50至250个核苷酸、约50至200个核苷酸、约50至180个核苷酸、约50至160个核苷酸、约50至140个核苷酸、约50至120个核苷酸、约50至110个核苷酸、约50至100个核苷酸、约50至90个核苷酸、约50至80个核苷酸、约50至70个核苷酸、约50至60个核苷酸、约75至750个核苷酸、约75至450个核苷酸、约75至325个核苷酸、约75至250个核苷酸、约75至150个核苷酸、约75至95个核苷酸、约100至500个核苷酸、约100至400个核苷酸、约100至350个核苷酸、约100至300个核苷酸、约100至250个核苷酸、约100至220个核苷酸、约100至200个核苷酸，或在由其衍生的任何范围内的核苷酸。

在一些情况下，货物盒可以包含启动子、转基因或其组合。在包含启动子和转基因二者的货物盒中，转基因的表达可以由启动子引导。启动子可以是本领域技术人员可获得的任何类型的启动子。可以在TcBuster转座子中使用的启动子的非限制性实例包括EFS、CMV、MND、EF1ɑ、CAGGs、PGK、UBC、U6、H1和Cumate。有待在TcBuster转座中使用的启动子的选择取决于许多因素，诸如但不限于启动子的表达效率、有待基因修饰的细胞类型以及所需的转基因表达水平。

TcBuster转座子中的转基因可以是任何感兴趣的基因，并且是本领域技术人员而言可获得的。转基因可以源自自然界中的基因或是其变体，或者可以被人工设计。转基因可以与待修饰的细胞属于相同的物种来源，或者来自不同的物种。转基因可以是原核基因或真核基因。有时，转基因可以是源自非人动物、植物或人类的基因。转基因可以包含内含子。可替代地，转基因中的内含子可被去除或不存在。

在一些实施方案中，转基因可以编码蛋白质。示例性蛋白质包括但不限于细胞受体、免疫检查点蛋白、细胞因子或其任何组合。有时，如本文所述的细胞受体可包括但不限于T细胞受体(TCR)、B细胞受体(BCR)、嵌合抗原受体(CAR)或其任何组合。

如本文所述的货物盒可以不含编码任何类型的蛋白质产物的转基因，但是可含有用于其他目的的转基因。举例来说，例如当将货物盒插入宿主基因组中的基因的外显子中时，它可以用于在插入位点处产生移码。这可能导致基因产物被截断或无效突变。有时，货物盒可用于用外源核苷酸序列替代内源基因组序列，从而修饰宿主基因组。

本文所述的转座子可以具有在正向或反向方向上的货物盒。在许多情况下，货物盒具有其自身的方向性。例如，含有转基因的货物盒将具有5'至3'编码序列。含有启动子和基因插入的货物盒将在基因插入的5'位点上具有启动子。如本文所用的术语“正向方向”可以是指货物盒在双链转座子的有义链上保持其方向性的情况。如本文所用的术语“反向方向”可以是指货物盒在双链转座子的反义链上保持其方向性的情况。

用于基因组编辑的系统和使用方法

本公开的另一方面提供了一种用于基因组编辑的系统。系统可以包含TcBuster转座酶和TcBuster转座子。系统可用来编辑宿主细胞的基因组，从而进行以下操作：破坏或修饰宿主细胞的内源基因组区域，将外源基因插入宿主基因组中，用外源核苷酸序列替代内源核苷酸序列，或这些操作的任何组合。

用于基因组编辑的系统可以包含如本文所述的突变TcBuster转座酶或融合转座酶，以及可被突变TcBuster转座酶或融合转座酶识别的转座子。突变TcBuster转座酶或融合转座酶可以作为纯化的蛋白质提供。蛋白质生产和纯化技术是本领域技术人员已知的。纯化的蛋白质可以与转座子保存在不同的容器中，或者它们可以保存在同一容器中。

在许多情况下，用于基因组编辑的系统可以包含编码如本文所述的突变TcBuster转座酶或融合转座酶的多核苷酸，以及可被突变TcBuster转座酶或融合转座酶识别的转座子。有时，该系统的多核苷酸可以包含编码突变TcBuster转座酶或融合转座酶的DNA。可替代地或另外，该系统的多核苷酸可以包含编码突变TcBuster转座酶或融合转座酶的信使RNA(mRNA)。mRNA可以通过本领域普通技术人员熟知的许多途径产生，所述途径诸如但不限于体内转录和RNA纯化、体外转录和从头合成。在许多情况下，mRNA可以是经化学修饰的。经化学修饰的mRNA与未修饰或天然mRNA相比可具有降解抗性，或者可降解得更快。在许多情况下，mRNA的化学修饰可以使mRNA以更高的效率翻译。mRNA的化学修饰可以利用本领域技术人员可获得的公知技术或由商业供应商执行。

对于许多应用，安全性要求hAT转座酶表达的持续时间仅长到足以介导安全的转座子递送。而且，与转座子载体水平的高度一致的hAT转座酶表达的脉冲可以实现最大的基因递送。使用可获得的从DNA质粒模板中体外转录RNA分子的技术来进行实施。可以使用多种从DNA拷贝进行体外(例如无细胞)转录的方法来合成RNA分子。已经描述了这样做的方法，并且该方法可商购获得。例如，mMessage Machine体外转录试剂盒可通过lifetechnologies获得。

也有许多公司可以在收取服务费的基础上执行体外转录。我们还发现，用于hAT表达的经化学修饰的RNA对于基因转移特别有效。这些经化学修饰的RNA不会诱导细胞免疫应答，而使用专有方法生成的RNA也会避免细胞免疫应答。这些RNA制剂去除RNA二聚体(Clean-Cap)和细胞反应性(假单胞苷掺入)，在人T细胞中产生更好的瞬时基因表达，而在我们看来没有毒性(数据未示出)。可以使用许多描述的RNA转染方法中的任一种将RNA分子引入到细胞中，这通常对大多数细胞无毒。已经描述了这样做的方法，并且该方法可商购获得。例如，Amaxa核转染器、Neon电穿孔仪和Maxcyte平台。

如本文所述的转座子可以存在于表达载体中。在许多情况下，表达载体可以是DNA质粒。有时，表达载体可以是小环载体。如本文所用的术语“小环载体”可以是指不含大多数(如果不是全部)原核载体部分(例如，原核来源的控制序列或非功能序列)的小环状质粒衍生物。在某些情况下，可以通过使用如本文所述的“小环”减轻通过转染或电穿孔产生的对细胞的毒性。

可以通过可获得的公知分子克隆技术来制备小环载体。首先，可以产生细菌诸如大肠杆菌中的“亲本质粒”(带有插入物，诸如转座子构建体的细菌质粒)，然后可以诱导位点特异性重组酶。这些步骤之后，可以经由插入物两端的两个重组酶-靶标序列切除原核载体部分并回收所得的小环载体。可以将纯化的小环通过转染或脂质转染转移到受体细胞中，并通过例如喷射注射转移到分化的组织中。含有TcBuster转座子的小环的大小可为约1.5kb、约2kb、约2.2kb、约2.4kb、约2.6kb、约2.8kb、约3kb、约3.2kb、约3.4kb、约3.6kb、约3.8kb、约4kb、约4.2kb、约4.4kb、约4.6kb、约4.8kb、约5kb、约5.2kb、约5.4kb、约5.6kb、约5.8kb、约6kb、约6.5kb、约7kb、约8kb、约9kb、约10kb、约12kb、约25kb、约50kb或介于这些数字的任意两个之间的值。有时，含有如本文提供的TcBuster转座子的小环的大小可为至多2.1kb、至多3.1kb、至多4.1kb、至多4.5kb、至多5.1kb、至多5.5kb、至多6.5kb、至多7.5kb、至多8.5kb、至多9.5kb、至多11kb、至多13kb、至多15kb、至多30kb或至多60kb。

在某些实施方案中，如本文所述的系统可以含有编码如本文所述的突变TcBuster转座酶或融合转座酶的多核苷酸，以及转座子，它们存在于同一表达载体例如质粒中。

本公开的又一方面提供了一种基因工程改造的方法。基因工程改造方法可以包括将TcBuster转座酶和可被TcBuster转座酶识别的转座子引入到细胞中。基因工程改造方法也可以在无细胞的环境中进行。在无细胞环境中进行基因工程改造的方法可以包括将TcBuster转座酶、可被所述转座酶识别的转座子和靶核酸组合到容器(诸如孔或管)中。

本文所述的方法可以包括将本文提供的突变TcBuster转座酶和可被突变TcBuster转座酶识别的转座子引入到细胞中。基因组编辑方法可以包括：将本文提供的融合转座酶和可被融合转座酶识别的转座子引入到细胞中。

突变TcBuster转座酶或融合转座酶可作为蛋白质或经由编码突变TcBuster转座酶或融合转座酶的多核苷酸引入到细胞中。如上所讨论，所述多核苷酸可以包含编码突变TcBuster转座酶或融合转座酶的DNA或mRNA。

在许多情况下，TcBuster转座酶或融合转座酶可以作为蛋白质转染到宿主细胞中，并且该蛋白质的浓度可为至少0.05nM、至少0.1nM、至少0.2nM、至少0.5nM、至少1nM、至少2nM、至少5nM、至少10nM、至少50nM、至少100nM、至少200nM、至少500nM、至少1μM、至少2μM、至少5μM、至少7.5μM、至少10μM、至少15μM、至少20μM、至少25μM、至少50μM、至少100μM、至少200μM、至少500μM或至少1μM。有时，该蛋白质的浓度可为约1μM至约50μM、约2μM至约25μM、约5μM至约12.5μM或约7.5μM至约10μM。

在许多情况下，TcBuster转座酶或融合转座酶可以通过多核苷酸转染到宿主细胞中，并且该多核苷酸的浓度可为至少约5ng/ml、10ng/ml、20ng/ml、40ng/ml、50ng/ml、60ng/ml、80ng/ml、100ng/ml、120ng/ml、150ng/ml、180ng/ml、200ng/ml、220ng/ml、250ng/ml、280ng/ml、300ng/ml、500ng/ml、750ng/ml、1μg/ml、2μg/ml、3μg/ml、5μg/ml、50μg/ml、100μg/ml、150μg/ml、200μg/ml、250μg/ml、300μg/ml、350μg/ml、400μg/ml、450μg/ml、500μg/ml、550μg/ml、600μg/ml、650μg/ml、700μg/ml、750μg/ml或800μg/ml。有时，该多核苷酸的浓度可以为约5-25μg/ml、25-50μg/ml、50-100μg/ml、100-150μg/ml、150-200μg/ml、200-250μg/ml、250-500μg/ml、5-800μg/ml、200-800μg/ml、250-800μg/ml、400-800μg/ml、500-800μg/ml或可从其中衍生的任何范围。在许多情况下，转座子与转座酶存在于不同的表达载体中，并且转座子的浓度可为至少约5ng/ml、10ng/ml、20ng/ml、40ng/ml、50ng/ml、60ng/ml、80ng/ml、100ng/ml、120ng/ml、150ng/ml、180ng/ml、200ng/ml、220ng/ml、250ng/ml、280ng/ml、300ng/ml、500ng/ml、750ng/ml、1μg/ml、2μg/ml、3μg/ml、5μg/ml、50μg/ml、100μg/ml、150μg/ml、200μg/ml、250μg/ml、300μg/ml、350μg/ml、400μg/ml、450μg/ml、500μg/ml、550μg/ml、600μg/ml、650μg/ml、700μg/ml、750μg/ml或800μg/ml。有时，转座子的浓度可以为约5-25μg/ml、25-50μg/ml、50-100μg/ml、100-150μg/ml、150-200μg/ml、200-250μg/ml、250-500μg/ml、5-800μg/ml、200-800μg/ml、250-800μg/ml、400-800μg/ml、500-800μg/ml或可从其中衍生的任何范围。转座子与编码转座酶的多核苷酸的比率可能为至多10000、至多5000、至多1000、至多500、至多200、至多100、至多50、至多20、至多10、至多5、至多2、至多1、至多0.1、至多0.05、至多0.01、至多0.001、至多0.0001或介于其任意两者之间的任何数值。

在一些其他情况下，转座子和编码转座酶的多核苷酸存在于同一表达载体中，并且含有转座子和编码转座酶的多核苷酸二者的表达载体的浓度可为至少约5ng/ml、10ng/ml、20ng/ml、40ng/ml、50ng/ml、60ng/ml、80ng/ml、100ng/ml、120ng/ml、150ng/ml、180ng/ml、200ng/ml、220ng/ml、250ng/ml、280ng/ml、300ng/ml、500ng/ml、750ng/ml、1μg/ml、2μg/ml、3μg/ml、5μg/ml、50μg/ml、100μg/ml、150μg/ml、200μg/ml、250μg/ml、300μg/ml、350μg/ml、400μg/ml、450μg/ml、500μg/ml、550μg/ml、600μg/ml、650μg/ml、700μg/ml、750μg/ml或800μg/ml。有时，含有转座子和编码转座酶的多核苷酸二者的表达载体的浓度可以为约5-25μg/ml、25-50μg/ml、50-100μg/ml、100-150μg/ml、150-200μg/ml、200-250μg/ml、250-500μg/ml、5-800μg/ml、200-800μg/ml、250-800μg/ml、400-800μg/ml、500-800μg/ml或可从其中衍生的任何范围。

在一些情况下，可以改变可通过电穿孔引入到细胞中的多核酸的量以优化转染效率和/或细胞活力。在一些情况下，可以将少于约100pg的核酸添加至每个细胞样品(例如，一个或多个细胞被电穿孔)中。在一些情况下，可以将至少约100pg、至少约200pg、至少约300pg、至少约400pg、至少约500pg、至少约600pg、至少约700pg、至少约800pg、至少约900pg、至少约1微克、至少约1.5μg、至少约2μg、至少约2.5μg、至少约3μg、至少约3.5μg、至少约4μg、至少约4.5μg、至少约5μg、至少约5.5μg、至少约6μg、至少约6.5μg、至少约7μg、至少约7.5μg、至少约8μg、至少约8.5μg、至少约9μg、至少约9.5μg、至少约10μg、至少约11μg、至少约12μg、至少约13μg、至少约14μg、至少约15μg、至少约20μg、至少约25μg、至少约30μg、至少约35μg、至少约40μg、至少约45μg或至少约50μg核酸添加到每个细胞样品(例如，一个或多个细胞被电穿孔)中。例如，可以将1微克的dsDNA添加至每个细胞样品中以进行电穿孔。在一些情况下，最佳转染效率和/或细胞活力所需的多核酸(例如dsDNA)的量可能特定于细胞类型。

本文所公开的主题可应用于广泛的各种类型的宿主细胞的基因组编辑。在优选的实施方案中，宿主细胞可以来自真核生物。在一些实施方案中，所述细胞可以来自哺乳动物来源。在一些实施方案中，所述细胞可以来自人来源。

通常，所述细胞可以来自永生细胞系或原代细胞。

如本文可互换使用的术语“细胞系”和“永生细胞系”可以是指来自生物体的细胞群，其在正常情况下不会无限期地增殖，但是由于突变，可能已经逃避了正常的细胞衰老，而可以继续分裂。本文所提供的主题可以应用于一系列常见的已建立的细胞系，包括但不限于人BC-1细胞、人BJAB细胞、人IM-9细胞、人Jiyoye细胞、人K-562细胞、人LCL细胞、小鼠MPC-11细胞、人Raji细胞、人Ramos细胞、小鼠Ramos细胞、人RPMI8226细胞、人RS4-11细胞、人SKW6.4细胞、人树突状细胞、小鼠P815细胞、小鼠RBL-2H3细胞、人HL-60细胞、人NAMALWA细胞、人巨噬细胞、小鼠RAW 264.7细胞、人KG-1细胞、小鼠M1细胞、人PBMC细胞、小鼠BW5147(T200-A)5.2细胞、人CCRF-CEM细胞、小鼠EL4细胞、人Jurkat细胞、人SCID.adh细胞、人U-937细胞或其细胞的任意组合。

如本文所用的术语“原代细胞”及其语法等同物可以是指直接取自生物体的细胞，通常是取自多细胞生物体(诸如动物或植物)的活组织的细胞。在许多情况下，可以建立原代细胞以供在体外生长。在一些情况下，原代细胞可能刚刚从生物体中移出，并且在转染前尚未建立以供体外生长。在一些实施方案中，原代细胞也可以在体外扩增，即原代细胞还可包括由直接取自生物体的细胞的增殖产生的子代细胞。在这些情况下，子代细胞不像已建立的细胞系中的细胞那样表现出无限增殖特性。例如，宿主细胞可以是人原代T细胞，而在转染之前，该T细胞已经暴露于可能导致T细胞增殖和细胞群扩增的刺激因子。

待基因修饰的细胞可以是来自组织或器官的原代细胞，该组织或器官诸如但不限于脑、肺、肝、心脏、脾脏、胰腺、小肠、大肠、骨骼肌、平滑肌、皮肤、骨骼、脂肪组织、毛发、甲状腺、气管、胆囊、肾脏、输尿管、膀胱、主动脉、静脉、食道、隔膜、胃、直肠、肾上腺、支气管、耳、眼、视网膜、生殖器、下丘脑、喉、鼻、舌、脊髓或输尿管、子宫、卵巢、睾丸及其任何组合。在某些实施方案中，所述细胞可以包括但不限于血细胞、毛发细胞、角质形成细胞、促性腺激素细胞、促皮质激素细胞(corticotrope)、促甲状腺素细胞、促生长激素细胞(somatotrope)、促乳素细胞、嗜铬细胞、滤泡旁细胞、球细胞、黑素细胞、痣细胞、梅克尔细胞(merkel cell)、成牙本质细胞、成牙骨质细胞、角膜细胞、视网膜穆勒细胞、视网膜色素上皮细胞、神经元、胶质细胞、室管膜细胞、松果体细胞、肺细胞、克拉拉细胞、杯状细胞、G细胞、D细胞、肠嗜铬样细胞、胃主细胞、壁细胞、中心凹细胞(foveolar cell)、K细胞、D细胞、I细胞、帕内特细胞、肠细胞、微皱褶细胞、肝细胞、肝星状细胞、胆囊细胞、泡心细胞(centroacinar cell)、胰腺星状细胞、胰腺α细胞、胰腺β细胞、胰腺δ细胞、胰腺F细胞、胰腺ε细胞、甲状腺甲状旁腺、嗜酸性细胞(oxyphil cell)、尿道上皮细胞、成骨细胞、骨细胞、成软骨细胞、软骨细胞、成纤维细胞、纤维细胞、成肌细胞、肌细胞、肌卫星细胞、肌腱细胞、心肌细胞、成脂肪细胞、脂肪细胞、卡氏间质细胞(interstitial cell of cajal)、成血管细胞、内皮细胞、系膜细胞、近肾小球细胞、致密斑细胞、基质细胞、间质细胞、特络细胞(telocyte)、简单上皮细胞、足细胞、肾近端小管刷缘细胞、塞托利细胞(sertoli cell)、莱迪希细胞(leydig cell)、颗粒细胞、栓细胞(peg cell)、生殖细胞、精子卵子、淋巴细胞、髓样细胞、内皮祖细胞、内皮干细胞、成血管细胞、中胚层成血管细胞(mesoangioblast)、周细胞壁细胞及其任何组合。在许多情况下，待修饰的细胞可以是干细胞，诸如但不限于胚胎干细胞、造血干细胞、表皮干细胞、上皮干细胞、支气管肺泡干细胞、乳腺干细胞、间充质干细胞、肠干细胞、内皮干细胞、神经干细胞、嗅觉成体干细胞、神经嵴干细胞、睾丸细胞及其任何组合。有时，所述细胞可以是来源于任何类型的组织的诱导性多能干细胞。

在一些实施方案中，待基因修饰的细胞可以是哺乳动物细胞。在一些实施方案中，该细胞可以是免疫细胞。该细胞的非限制性实例可以包括B细胞、嗜碱性粒细胞、树突状细胞、嗜酸性粒细胞、γ-δT细胞、粒细胞、辅助T细胞、朗格汉斯细胞、淋巴样细胞、先天淋巴样细胞(ILC)、巨噬细胞、肥大细胞、巨核细胞、记忆T细胞、单核细胞、髓样细胞、自然杀伤T细胞、嗜中性粒细胞、前体细胞、浆细胞、祖细胞、调节性T细胞、T细胞、胸腺细胞、其任何分化或去分化的细胞，或其细胞的任何混合物或组合。在某些情况下，所述细胞可以是T细胞。在一些实施方案中，所述细胞可以是原代T细胞。在某些情况下，所述细胞可以是抗原呈递细胞(APC)。在一些实施方案中，所述细胞可以是原代APC。与本公开相关的APC可以是树突状细胞、巨噬细胞、B细胞、其他非专业APC或其任何组合。

在一些实施方案中，所述细胞可以是ILC(先天性淋巴样细胞)，并且所述ILC可以是第1组ILC、第2组ILC或第3组ILC。第1组ILC一般可被描述为受T-bet转录因子控制的细胞，其响应于细胞内病原体分泌1型细胞因子，诸如IFN-γ和TNF-α。第2组ILC一般可被描述为依赖于GATA-3和ROR-α转录因子的细胞，其响应于细胞外寄生虫感染产生2型细胞因子。第3组ILC一般可被描述为受ROR-γt转录因子控制的细胞，并产生IL-17和/或IL-22。

在一些实施方案中，所述细胞可以是对于给定因子呈阳性或阴性的细胞。在一些实施方案中，所述细胞可以是CD3+细胞、CD3-细胞、CD5+细胞、CD5-细胞、CD7+细胞、CD7-细胞、CD14+细胞、CD14-细胞、CD8+细胞、CD8-细胞、CD103+细胞、CD103-细胞、CD11b+细胞、CD11b-细胞、BDCA1+细胞、BDCA1-细胞、L-选择素+细胞、L-选择素-细胞、CD25+、CD25-细胞、CD27+、CD27-细胞、CD28+细胞、CD28-细胞、CD44+细胞、CD44-细胞、CD56+细胞、CD56-细胞、CD57+细胞、CD57-细胞、CD62L+细胞、CD62L-细胞、CD69+细胞、CD69-细胞、CD45RO+细胞、CD45RO-细胞、CD127+细胞、CD127-细胞、CD132+细胞、CD132-细胞、IL-7+细胞、IL-7-细胞、IL-15+细胞、IL-15-细胞、凝集素样受体G1阳性细胞、凝集素样受体G1阴性细胞或其分化或去分化的细胞。由细胞表达的因子的实例并非旨在限制，并且本领域技术人员将理解，所述细胞可对本领域已知的任何因子呈阳性或阴性。在一些实施方案中，所述细胞可对两个或更多个因子呈阳性。例如，所述细胞可以是CD4+和CD8+。在一些实施方案中，所述细胞可对两个或更多个因子呈阴性。例如，所述细胞可以是CD25-、CD44-和CD69-。在一些实施方案中，所述细胞可对一个或多个因子呈阳性，并且可对一个或多个因子呈阴性。例如，所述细胞可以是CD4+和CD8-。

应当理解，在本文所公开的任何方法中使用的细胞可以是本文所公开的任何细胞的混合物(例如，两种或更多种不同的细胞)。例如，本公开的方法可以包括细胞，并且所述细胞是CD4+细胞与CD8+细胞的混合物。在另一个实例中，本公开的方法可以包括细胞，并且所述细胞是CD4+细胞与幼稚细胞的混合物。

如本文所提供，转座酶和转座子可以通过多种方法引入到细胞中。如本文所用的术语“转染”及其语法等同物一般可以是指将核酸引入到真核细胞中的过程。可以与本主题结合使用的转染方法可以包括但不限于电穿孔、显微注射、磷酸钙沉淀、阳离子聚合物、树枝状聚合物、脂质体、微粒轰击、fugene、直接声波加载、细胞挤压、光学转染、原生质体融合、穿刺转染、磁转染、核转染或其任何组合。在许多情况下，可以通过电穿孔将本文所述的转座酶和转座子转染到宿主细胞中。有时，转染也可以通过电穿孔方法的变化形式，诸如核转染(也称为NucleofectorTM技术)来完成。如本文所用的术语“电穿孔”及其语法等同物可以是指借以将电场施加于细胞以增加细胞膜的渗透性，从而允许将化学品、药物或DNA引入到细胞中的过程。在电穿孔过程中，通常以非常短的时间段(例如5毫秒、10毫秒和50毫秒)的“脉冲”形式提供电场。如本领域技术人员所理解，电穿孔通过使用脉冲旋转电场暂时打开细胞外膜中的孔。用于体外和体内电穿孔的方法和设备也是众所周知的。可以根据被电穿孔的细胞类型和将要被细胞摄取的分子的物理特征(诸如脉冲强度、脉冲长度、脉冲数量)来选择各种电参数。

应用

本文所提供的主题，例如组合物(例如，突变TcBuster转座酶、融合转座酶、TcBuster转座子)、系统和方法可应用于现代生活的各个方面中与基因组编辑有关的广泛应用。

在某些情形下，本文所述的主题的优点可包括但不限于降低的成本、监管考虑因素、较低的免疫原性和低的复杂性。在一些情况下，本公开的显著优点是高转座效率。在许多情况下，本公开的另一个优点在于，本文所提供的转座系统可为“可调节的”，例如，可以将转座设计成靶向选择的基因组区域而不是随机插入。

一个非限制性实例涉及创建基因修饰的细胞以用于研究和临床应用。例如，如上所述，可以使用本文所提供的主题创建基因修饰的T细胞，其可以用于帮助人们对抗多种疾病，诸如但不限于癌症和感染性疾病。

一个具体的例子包括使用本文提供的方法产生基因修饰的原代白细胞，以及将基因修饰的原代白细胞施用于需要其的患者。基因修饰的原代白细胞的产生可包括将转座子和可识别转座子的如本文所述的突变TcBuster转座酶或融合转座酶引入到白细胞中，从而产生基因修饰的白细胞。在许多情况下，转座子可以包含转基因。所述转基因可以是细胞受体、免疫检查点蛋白、细胞因子及其任何组合。有时，细胞受体可以包括但不限于T细胞受体(TCR)、B细胞受体(BCR)、嵌合抗原受体(CAR)或其任何组合。在一些其他情况下，转座子和转座酶被设计为删除或修饰内源基因，例如细胞因子、免疫检查点蛋白、致癌基因或其任何组合。原代白细胞的基因修饰可被设计为促进针对使患者处于患病状态的感染性病原体或癌细胞的免疫力。

另一个非限制性实例涉及创建基因修饰的生物体以用于农业、食品生产、医药和制药。可以进行基因修饰的物种范围很广，包括但不限于植物和动物。基因修饰的生物体，诸如基因修饰的作物或牲畜，可以在其生理特性的某些方面被修饰。粮食作物中的实例包括对某些害虫、疾病或环境条件的抗性，腐败减少，或对化学处理剂的抗性(例如对除草剂的抗性)，或改善作物的营养物概况。非粮食作物中的实例包括药剂、生物燃料和其他工业上有用的物品的生产，以及用于生物修复。牲畜中的实例包括对某些寄生虫的抗性、某些营养元素的产生、生长速率的增加以及奶产量的增加。

如本文所用的与参考数值及其语法等同物有关的术语“约”及其语法等同物可包括值加上或减去该值的10％的范围。例如，量“约10”包括9至11的量。与参考数值有关的术语“约”还可以包括值加上或减去该值的10％、9％、8％、7％、6％、5％、4％、3％、2％或1％的范围。

实施例

以下实施例进一步说明所描述的实施方案，而不限制本公开的范围。

实施例1.材料和方法

此实施例描述了用于产生和评价示例性突变TcBuster转座酶的几种方法。

用于TcBuster突变体制备的定点诱变

通过hAT和buster亚家族的核苷酸序列和氨基酸比对鉴定出推定的高活性TcBuster(TcB)转座酶突变体。将Q5定点诱变试剂盒(New England BioLabs)用于所有定点诱变。PCR诱变后，用GeneJET PCR纯化试剂盒(Thermo Fisher Scientific)纯化PCR产物。使用T4 DNA连接酶(New England BioLabs)执行20uL纯化的PCR产物的连接反应。将5uL的连接反应物用于在DH10Beta细胞中转化。使用通过Sequetech进行的直接集落测序来确认所需突变的存在。使用ZymoPURE质粒小量制备试剂盒(Zymo Research)制备用于确认突变的DNA。

测量在HEK-293T细胞中的转染效率

转染前一天，将HEK-293T细胞以每孔300,000个细胞铺板于6孔板中。根据制造商说明书(Mirus Bio)，使用TransIT X2试剂，用500ng携带mCherry-嘌呤霉素盒的转座子和62.5ng TcB转座酶转染细胞。转染后两天，将细胞以3,000个细胞/孔的密度与嘌呤霉素(1ug/mL)一起一式三份重新铺板于6孔板中的DMEM完全培养基中，或者在不存在嘌呤霉素选择的情况下重新铺板。通过经嘌呤霉素处理的细胞(在药物选择下存活的每个细胞形成集落)的集落计数或流式细胞术来评估转基因的稳定整合。为了进行集落计数，在嘌呤霉素选择后两周，去除DMEM完全+嘌呤霉素培养基。用1X PBS洗涤细胞，并用1x结晶紫溶液将细胞染色10分钟。将板用PBS洗涤两次并对集落进行计数。

对于流式细胞术分析，通过检测在不存在药物选择的情况下生长的细胞中的mCherry荧光来评估转基因的稳定整合。在转染后的指定时间点收获转染的细胞，用PBS洗涤1次，然后重悬于200uL RDFII缓冲液中以供分析。使用Novocyte(Acea Biosciences)分析细胞，并使用PE-Texas红色通道评估mCherry表达。

HEK-293T细胞中TcB转座酶突变体的筛选

转染前一天，将HEK-293T细胞以每孔75,000个细胞铺板于24孔板中。根据制造商说明书(Mirus Bio)，一式两份地使用TransIT X2试剂用500ng转座子和125ng转座酶转染细胞。通过检测mCherry荧光评估转基因的稳定整合。转染后第14天收获细胞，用PBS洗涤1次，然后重悬于200uL RDFII缓冲液中。使用Novocyte(Acea Biosciences)分析细胞，并使用PE-Texas红色通道评估mCherry表达。

TcBuster转座子和转座酶在CD3+ T细胞中的转染

从leukopaks(StemCellTechnologies)中富集CD3+ T细胞并将其冷冻保存。将CD3+ T细胞解冻并在补充有人血清及IL-2、IL-15和IL-7细胞因子的X-Vivo-15培养基中用CD3/CD28 Dynabeads(ThermoFisher)激活2天。转染前，去除CD3/CD28珠，洗涤细胞，并使用Neon Transfection系统(ThermoFisher)用TcBuster转座子(载有TcBuster及Sleepingbeauty IR/DRs和GFP货物的小环)以及RNA形式的TcBuster或Sleeping Beauty转座酶进行电穿孔。作为活力对照，在无DNA或RNA的情况下对细胞进行“脉冲”电穿孔。转染后将电穿孔的细胞扩充21天，并通过流式细胞术评估GFP货物的活力稳定整合。通过SSC-A与FSC-A测量活力，并且针对仅脉冲的对照对该活力进行标准化，并在第2、7、14和21天使用FITC通道评估GFP表达。

实施例2.示例性转座子构建体

这项研究的目的是检查不同的示例性TcBuster转座子构建体的转座效率。发明人比较了10种TcBuster(TcB)转座子(Tn)构型(图1A)，以测试它们在哺乳动物细胞中的转座效率。这10种TcB Tn在所用的启动子(EFS与CMV)、IR/DR序列和转座子货物的方向方面有所不同。每种转座子均含有编码通过2A连接到抗药性基因嘌呤霉素的mCherry的同一的盒，使得可通过荧光和/或用嘌呤霉素进行选择来鉴定经转染的细胞。用10种TcB Tn中的一种和TcB野生型转座酶转染HEK-293T细胞(比例为1个转座子:1个转座酶)。通过在转染后检测mCherry荧光10-30天，通过流式细胞术评估转基因的稳定整合(图1B)。

已发现，在实验条件下，与EFS相比，使用CMV启动子大大提高了转基因mCherry的稳定表达。转座似乎仅在使用序列1IR/DR时发生。还发现，与正向方向相比，在反向方向上货物的转录促进了更大的转座活性。

通过流式细胞术，TcB Tn-8在测试的10个Tn中显示出最大的转座效率。为了证实TcB Tn-8的转座效率，用TcB Tn-8与WT转座酶或V596A突变型转座酶转染HEK-293T细胞。转染后两天，将细胞以3,000个细胞/孔的密度与嘌呤霉素(1ug/mL)一起一式三份重新铺板于6孔板中的DMEM完全培养基中。在选择两周后，在药物选择下存活的每个细胞形成集落，对其进行mCherry表达的评估(图3A)，并计数以证实转基因的稳定整合(图3B-C)。通过HEK-293T细胞中mCherry和嘌呤霉素抗性集落的表达证实了TcB-Tn 8的转座效率。

实施例3.示例性转座酶突变体

这项研究的目的是生成TcBuster转座酶突变体并检查其转座效率。

为此，发明人通过将野生型TcB转座酶与其他相似的转座酶的cDNA和氨基酸序列进行比较而产生了共有序列。为了进行该比较，通过比对13种类似的转座酶来使睡美人(sleeping beauty)复活，并通过比对来自8种不同生物体的SPIN样转座酶来使SPIN复活。SPIN和TcBuster是丰富的hAT转座酶家族的一部分。

hAT转座子家族由两个亚家族：AC(诸如hobo、hermes和Tol2)以及Buster亚家族(诸如SPIN和TcBuster)组成。将TcBuster的氨基酸序列与AC和Buster亚家族成员的氨基酸序列进行比对，以鉴定出在TcBuster中不保守的关键氨基酸，这些氨基酸可能是高活性置换的靶标。TcBuster与AC亚家族成员Hermes、Hobo、Tag2、Tam3、Herves、Restless和Tol2的比对使得我们能够鉴定出在TcBuster中可被替换的高度保守区域内的氨基酸(图4)。进一步地，TcBuster与Buster亚家族的序列比对产生大量可被替换的候选氨基酸(图5)。使用包含如表9中所列的位点突变的寡核苷酸生成候选TcB转座酶突变体。然后对突变体进行序列验证，将其克隆到pCDNA-DEST40表达载体(图6)中，并在转染前进行小量制备。

表9

为了检查TcB转座酶突变体的转座效率，用TcB Tn-8(mCherry-嘌呤霉素盒)与WT转座酶或V596A突变转座酶或候选转座酶突变体一式两份转染HEK-293T细胞。使细胞在DMEM完全培养基中生长(无药物选择)，并在转染后第14天通过流式细胞术评估mCherry表达。鉴定出超过20种转座效率高于野生型转座酶的TcB转座酶突变体(图7)。发现在这些检查的突变体中，与含有相应的单置换的突变体相比，一种含有三个氨基酸置换D189A、V377T和E469K的组合的突变转座酶导致转座活性的显著提高。具有高转座活性的突变体还包括K573E/E578L、I452F、A358K、V297K、N85S、S447E、E247K和Q258T等。

在这些检查的突变体中，发现在催化三联体氨基酸(D234、D289和E589)中的一者的邻近处向带正电荷的氨基酸(诸如赖氨酸(K)或精氨酸(R))的大多数置换增加了转座。另外，去除正电荷或添加负电荷减少了转座。这些数据表明，靠近催化结构域的氨基酸可能有助于促进TcB的转座活性，特别是当这些氨基酸突变为带正电荷的氨基酸时。

高活性TcBuster突变体D189A/V377T/E469K的氨基酸序列(SEQ ID NO:78)示于图12中。将对此突变体执行进一步的突变分析。如图13所示，将构建TcBuster突变体D189A/V377T/E469K/I452F(SEQ ID NO:79)。如图14所示，将构建TcBuster突变体D189A/V377T/E469K/N85S(SEQ ID NO:80)。如图15所示，将构建Tc Buster突变体D189A/V377T/E469K/S358K(SEQ ID NO:81)。如图16所示，将构建Tc Buster突变体D189A/V377T/E469K/K573E/E578L(SEQ ID NO:13)。在图12-16的每幅图中，TcBuster的结构域如下所示：ZnF-BED(小写字母)，DNA结合/寡聚化结构域(粗体字母)，催化结构域(带下划线的字母)和插入结构域(斜体字母)；核心D189A/V377T/E469K置换以较大号粗体、斜体且带下划线的字母表示；而另外的置换以大号粗体字母表示。如已描述的那样测试这些构建体中的每一种，并且预期它们与野生型TcBuster相比表现出高活性。

实施例4.含有标签的示例性融合转移酶

这项研究的目的是生成并检查融合TcBuster转座酶的转座效率。举例来说，将蛋白质标签GST或PEST结构域与TcBuster转座酶的N末端融合以产生融合TcBuster转座酶。使用由SEQ ID NO:10编码的柔性接头GGSGGSGGSGGSGTS(SEQ ID NO:9)将GST结构域/PEST结构域与TcBuster转座酶分隔开。此柔性接头的存在可以使融合蛋白中的非特异性相互作用最小化，从而提高它的活性。将示例性融合转座酶用如上所述的TcB Tn-8转染，并在第14天通过流式细胞术通过mCherry表达来测量转座效率。转座效率不受GFP或PEST结构域标签的影响(图9)，提示融合转座酶DNA结合结构域以引导TcBuster货物整合至选择的基因组位点(诸如安全港位点)，可能是TcBuster的可行选择，允许更安全的整合概况。

实施例5.包含TALE结构域的示例性融合转座酶

此项研究的目的是生成包含TALE结构域的融合TcBuster转座酶并检查该融合转座酶的转座活性。TALE序列(SEQ ID NO:11)被设计成靶向人基因组的人AAVS1(hAAVS1)位点。因此，将TALE序列与野生型TcBuster转座酶(SEQ ID NO:1)的N末端融合以产生融合转座酶。使用由SEQ ID NO:12编码的柔性接头Gly4Ser2(SEQ ID NO:88)来将TALE结构域与TcBuster转座酶序列分隔开。示例性融合转座酶具有氨基酸序列SEQ ID NO:8。

借助于电穿孔，将示例性融合转座酶用如上所述的TcB Tn-8转染到Hela细胞中。TcB Tn-8包含报告基因mCherry。转染效率可以在转染后2天通过流式细胞术检查，流式细胞术对mCherry阳性细胞进行计数。此外，将执行下一代测序以评估基因组中的mCherry基因插入位点。预期设计的TALE序列可以介导mCherry基因在hAAVS1位点附近的基因组位点处的靶标插入。

实施例6.在原代人T细胞中的转座效率

这项研究的目的是开发TcBuster转座子系统以工程改造原代CD3+ T细胞。为此，发明人将携带GFP转基因的示例性TcBuster转座子掺入到小环质粒中。将活化的CD3+ T细胞用TcB小环转座子和RNA转座酶(诸如WT TcBuster转座酶)以及如实施例2中所述的选择的示例性突变体电穿孔。在电穿孔后通过流式细胞术监测转基因表达21天。

已发现，与WT TcBuster转座酶和V596A突变体转座酶相比，在转染后14天，使用示例性突变体V377T/E469K和V377T/E469K/D189A将TcB转座子的转座提高了近两倍(图10A)。进一步地，与SB11(平均值＝8.4)相比，高活性突变体V377T/E469K和V377T/E469K/D189A的平均转座效率分别高出两倍(平均值＝20.2)和三倍(平均值＝24.1)。

接下来，在电穿孔后两天用小环TcB转座子和RNA转座酶评估CD3+ T细胞的活力。发现当用TcB小环和RNA转座酶转染CD3+ T细胞时，活力适度降低；然而，细胞到第7天迅速恢复活力(图10B)。这些实验证明根据本公开的一些实施方案的TcBuster转座子系统在原代T细胞的细胞工程改造中的能力。

实施例7.用于治疗癌症患者的嵌合抗原受体修饰的T细胞的生成

含有上述TcB Tn-8构建体的小环质粒可被设计成在转座子的反向重复序列之间携载嵌合抗原受体(CAR)基因。CAR可被设计成对B细胞抗原CD19具有特异性，并可与CD137(T细胞中的共刺激受体[4-1BB])和CD3-ζ(T细胞抗原受体的信号转导组分)信号结构域偶联。

自体T细胞将从患有癌症(例如白血病)的患者的外周血中获得。可以通过溶解红细胞并经由PERCOLL^TM梯度离心去除单核细胞来分离T细胞。可以使用抗CD3/抗CD28缀合珠(诸如DYNABEAD M-450 CD3/CD28T)，通过流式细胞术分离CD3+ T细胞。将根据GMP指导在标准条件下培养分离的T细胞。

将如上所述的那样使用包含氨基酸置换V377T、E469K、D189A、K573E和E578L的突变TcBuster转座酶(SEQ ID NO:13)和包含CAR的TcBuster Tn-8转座酶进行原代T细胞的基因修饰。在突变TcBuster转座酶和含CAR的Tn-8转座酶的存在下，对T细胞进行电穿孔。转染后，将用免疫刺激试剂(诸如抗CD3抗体及IL-2、IL-7和IL-15)处理T细胞以供活化和扩充。转染的验证将在转染后2周通过下一代测序进行。可以确定转染的T细胞中的转染效率和转基因负荷，以帮助设计治疗方案。如果测序结果未发现有风险的转基因插入位点，也将采取某些措施消除任何安全隐患。

将嵌合抗原受体修饰的T细胞(CAR-T细胞)输注回癌症患者将在验证转基因插入和CAR-T细胞体外扩充至临床所需水平后开始。

输注剂量将由许多因素决定，所述因素包括但不限于癌症的阶段、患者的治疗史，以及患者治疗当天的CBC(全血细胞计数)和生命体征。输注剂量可以递增或递减，这取决于疾病的进展、患者的排斥反应和许多其他医学因素。同时，在治疗方案期间，将执行定量聚合酶链反应(qPCR)分析以检测血液和骨髓中的嵌合抗原受体T细胞。qPCR分析可用于就给药策略和其他治疗计划做出医学决策。

表10氨基酸和核苷酸序列

尽管在此已经示出并描述了本发明的优选实施方案，但对于本领域技术人员明显的是，这些实施方案仅以示例的方式提供。本领域技术人员在不偏离本公开的情况下将会想到许多修改、改变和置换。应当理解，本文描述的主题的实施方案的各种替代方案可用于实施本文所公开的主题。意欲所附权利要求限定本发明的范围并且在这些权利要求及其等同物的范围内的方法和结构由此被涵盖。

Claims

1.一种突变TcBuster转座酶，其包含与全长SEQ ID NO:1至少70％同一的氨基酸序列并且具有一个或多个来自表1.1的氨基酸置换。

2.如权利要求1所述的突变TcBuster转座酶，其与SEQ ID NO:1相比包含增加在中性pH下的净电荷的氨基酸置换。

3.如权利要求2所述的突变TcBuster转座酶，其中所述增加在中性pH下的净电荷的氨基酸置换包含向赖氨酸或精氨酸的置换。

4.如权利要求2或3所述的突变TcBuster转座酶，其中增加在中性pH下的净电荷的氨基酸置换包含天冬氨酸或谷氨酸向中性氨基酸、赖氨酸或精氨酸的置换。

5.如权利要求1-4中任一项所述的突变TcBuster转座酶，其包含一个或多个来自表4.1的氨基酸置换。

6.如权利要求1-5中任一项所述的突变TcBuster转座酶，其进一步包含一个或多个来自表4的氨基酸置换。

7.如权利要求1-6中任一项所述的突变TcBuster转座酶，其包含在以下中的氨基酸置换：DNA结合和寡聚化结构域；插入结构域；Zn-BED结构域；或其组合。

8.如权利要求1-7中任一项所述的突变TcBuster转座酶，其与SEQ ID NO:1相比包含增加在催化结构域内或邻近处在中性pH下的净电荷的氨基酸置换。

9.如权利要求1-8中任一项所述的突变TcBuster转座酶，其与SEQ ID NO:1相比包含增加在中性pH下的净电荷的氨基酸置换，其中当根据SEQ ID NO:1编号时，所述一个或多个氨基酸位于D223、D289或E589的邻近处。

10.如权利要求8或9所述的突变TcBuster转座酶，其中邻近度为约80、75、70、60、50、40、30、20、10或5个氨基酸的距离。

11.如权利要求8或9所述的突变TcBuster转座酶，其中邻近度为约70至80个氨基酸的距离。

12.如权利要求1-11中任一项所述的突变TcBuster转座酶，其中所述突变TcBuster转座酶的氨基酸序列与全长SEQ ID NO:1至少80％、至少90％、至少95％、至少98％或至少99％同一。

13.如权利要求1-12中任一项所述的突变TcBuster转座酶，其进一步包含一个或多个来自表2的氨基酸置换。

14.如权利要求1-13中任一项所述的突变TcBuster转座酶，其进一步包含一个或多个来自表3的氨基酸置换。

15.如权利要求1-14中任一项所述的突变TcBuster转座酶，当根据SEQ ID NO:1编号时，所述突变TcBuster转座酶进一步包含氨基酸置换V377T、E469K和D189A。

16.如权利要求1-15中任一项所述的突变TcBuster转座酶，当根据SEQ ID NO:1编号时，所述突变TcBuster转座酶进一步包含氨基酸置换K573E和E578L。

17.如权利要求1-16中任一项所述的突变TcBuster转座酶，当根据SEQ ID NO:1编号时，所述突变TcBuster转座酶进一步包含氨基酸置换I452K。

18.如权利要求1-17中任一项所述的突变TcBuster转座酶，当根据SEQ ID NO:1编号时，所述突变TcBuster转座酶进一步包含氨基酸置换A358K。

19.如权利要求1-18中任一项所述的突变TcBuster转座酶，当根据SEQ ID NO:1编号时，所述突变TcBuster转座酶进一步包含氨基酸置换V297K。

20.如权利要求1-19中任一项所述的突变TcBuster转座酶，当根据SEQ ID NO:1编号时，所述突变TcBuster转座酶进一步包含氨基酸置换N85S。

21.如权利要求1-20中任一项所述的突变TcBuster转座酶，当根据SEQ ID NO:1编号时，所述突变TcBuster转座酶进一步包含氨基酸置换I452F、V377T、E469K和D189A。

22.如权利要求1-21中任一项所述的突变TcBuster转座酶，当根据SEQ ID NO:1编号时，所述突变TcBuster转座酶进一步包含氨基酸置换A358K、V377T、E469K和D189A。

23.如权利要求1-22中任一项所述的突变TcBuster转座酶，当根据SEQ ID NO:1编号时，所述突变TcBuster转座酶进一步包含氨基酸置换V377T、E469K、D189A、K573E和E578L。

24.如权利要求1-23中任一项所述的突变TcBuster转座酶，其进一步包含一个或多个来自表1的氨基酸置换。

25.如权利要求1-24中任一项所述的突变TcBuster转座酶，其中与具有氨基酸序列SEQID NO:1的野生型TcBuster转座酶相比，所述突变TcBuster转座酶具有提高的转座效率。

26.如权利要求25所述的突变TcBuster转座酶，其中通过包括以下操作的测定测量所述转座效率：将所述突变TcBuster转座酶或所述野生型TcBuster转座酶和含有报告货物盒的TcBuster转座子引入到细胞群中，以及检测所述报告货物盒在所述细胞群的基因组中的转座。

27.一种融合转座酶，其包含TcBuster转座酶序列和一个或多个另外的核定位信号序列，其中所述TcBuster转座酶序列与全长SEQ ID NO:1具有至少70％同一性。

28.如权利要求27所述的融合转座酶，其中所述TcBuster转座酶序列与全长SEQ IDNO:1具有至少80％、至少90％、至少95％、至少98％或至少99％同一性。

29.如权利要求27或28所述的融合转座酶，其中所述TcBuster转座酶序列与SEQ IDNO:1相比包含增加在中性pH下的净电荷的一个或多个氨基酸置换。

30.如权利要求29所述的融合转座酶，其中所述一个或多个氨基酸置换包括用赖氨酸或精氨酸进行的置换。

31.如权利要求29或30所述的融合转座酶，其中所述一个或多个氨基酸置换包括用中性氨基酸、赖氨酸或精氨酸对天冬氨酸或谷氨酸的置换。

32.如权利要求27-31中任一项所述的融合转座酶，其中所述TcBuster转座酶序列包含一个或多个来自表4、表4.1或这两者的氨基酸置换。

33.如权利要求27-32中任一项所述的融合转座酶，其中所述TcBuster转座酶序列包含在以下中的一个或多个氨基酸置换：DNA结合和寡聚化结构域；插入结构域；Zn-BED结构域；或其组合。

34.如权利要求27-33中任一项所述的融合转座酶，其中所述TcBuster转座酶序列包含一个或多个来自表1、表1.1或这两者的氨基酸置换。

35.如权利要求27-34中任一项所述的融合转座酶，其中与具有氨基酸序列SEQ ID NO:1的野生型TcBuster转座酶相比，所述TcBuster转座酶序列具有提高的转座效率。

36.如权利要求35所述的融合转座酶，其中通过包括以下操作的测定来测量所述TcBuster转座酶序列的转座效率：将所述融合转座酶或所述野生型TcBuster转座酶和含有报告货物盒的TcBuster转座子引入到细胞群中，以及检测所述报告货物盒在所述细胞群的基因组中的转座。

37.如权利要求27-36中任一项所述的融合转座酶，其中所述TcBuster转座酶序列与SEQ ID NO:1相比包含增加在催化结构域内或邻近处在中性pH下的净电荷的一个或多个氨基酸置换。

38.如权利要求27-37中任一项所述的融合转座酶，其中所述TcBuster转座酶序列与SEQ ID NO:1相比包含增加在中性pH下的净电荷的一个或多个氨基酸置换，其中当根据SEQID NO:1编号时，所述一个或多个氨基酸置换位于D223、D289或E589的邻近处。

39.如权利要求37或38所述的融合转座酶，其中邻近度为约80、75、70、60、50、40、30、20、10或5个氨基酸的距离。

40.如权利要求37或38所述的融合转座酶，其中邻近度为约70至80个氨基酸的距离。

41.如权利要求27-40中任一项所述的融合转座酶，其中所述TcBuster转座酶序列包含一个或多个来自表2的氨基酸置换。

42.如权利要求27-41中任一项所述的融合转座酶，其中所述TcBuster转座酶序列包含一个或多个来自表3的氨基酸置换。

43.如权利要求27-42中任一项所述的融合转座酶，其中当根据SEQ ID NO:1编号时，所述TcBuster转座酶序列包含氨基酸置换V377T、E469K和D189A。

44.如权利要求27-43中任一项所述的融合转座酶，其中当根据SEQ ID NO:1编号时，所述TcBuster转座酶序列包含氨基酸置换K573E和E578L。

45.如权利要求27-44中任一项所述的融合转座酶，其中当根据SEQ ID NO:1编号时，所述TcBuster转座酶序列包含氨基酸置换I452K。

46.如权利要求27-45中任一项所述的融合转座酶，其中当根据SEQ ID NO:1编号时，所述TcBuster转座酶序列包含氨基酸置换A358K。

47.如权利要求27-46中任一项所述的融合转座酶，其中当根据SEQ ID NO:1编号时，所述TcBuster转座酶序列包含氨基酸置换V297K。

48.如权利要求27-47中任一项所述的融合转座酶，其中当根据SEQ ID NO:1编号时，所述TcBuster转座酶序列包含氨基酸置换N85S。

49.如权利要求27-48中任一项所述的融合转座酶，其中当根据SEQ ID NO:1编号时，所述TcBuster转座酶序列包含氨基酸置换I452F、V377T、E469K和D189A。

50.如权利要求27-49中任一项所述的融合转座酶，其中当根据SEQ ID NO:1编号时，所述TcBuster转座酶序列包含氨基酸置换A358K、V377T、E469K和D189A。

51.如权利要求27-50中任一项所述的融合转座酶，其中当根据SEQ ID NO:1编号时，所述TcBuster转座酶序列包含氨基酸置换V377T、E469K、D189A、K573E和E578L。

52.如权利要求27-51中任一项所述的融合转座酶，其中所述TcBuster转座酶序列与全长SEQ ID NO:1具有100％同一性。

53.一种融合转座酶，其包含TcBuster转座酶序列和DNA序列特异性结合结构域，其中所述TcBuster转座酶序列具有如权利要求1-26中任一项所述的突变TcBuster的氨基酸序列。

54.如权利要求53所述的融合转座酶，其中所述DNA序列特异性结合结构域包含TALE结构域、锌指结构域、AAV Rep DNA结合结构域或其任何组合。

55.如权利要求53或54所述的融合转座酶，其中所述DNA序列特异性结合结构域包含TALE结构域。

56.如权利要求53-55中任一项所述的融合转座酶，其中所述TcBuster转座酶序列与所述DNA序列特异性结合结构域被接头分隔开。

57.如权利要求56所述的融合转座酶，其中所述接头包含至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个或至少50个氨基酸。

58.如权利要求56或57所述的融合转座酶，其中所述接头包含SEQ ID NO:9。

59.一种多核苷酸，其包含与全长SEQ ID NO:204或207至少约80％、85％、90％、95％或98％同一或互补的核酸序列。

60.一种多核苷酸，其编码如权利要求1-26中任一项所述的突变TcBuster转座酶。

61.一种多核苷酸，其编码如权利要求27-58中任一项所述的融合转座酶。

62.如权利要求59-61中任一项所述的多核苷酸，其中所述多核苷酸包含编码所述突变TcBuster转座酶或所述融合转座酶的DNA。

63.如权利要求59-62中任一项所述的多核苷酸，其中所述多核苷酸包含编码所述突变TcBuster转座酶或所述融合转座酶的信使RNA(mRNA)。

64.如权利要求63所述的多核苷酸，其中所述mRNA是经化学修饰的。

65.如权利要求59-64中任一项所述的多核苷酸，其中所述多核苷酸包含编码能够被所述突变TcBuster转座酶或所述融合转座酶识别的转座子的核酸序列。

66.如权利要求59-65中任一项所述的多核苷酸，其中所述多核苷酸存在于DNA载体中。

67.如权利要求66所述的多核苷酸，其中所述DNA载体包含小环质粒。

68.如权利要求59-67中任一项所述的多核苷酸，其中所述多核苷酸经密码子优化成在人细胞中表达。

69.如权利要求60-68中任一项所述的多核苷酸，其包含与全长SEQ ID NO:204或207至少约70％、75％、80％、85％、90％、95％或98％同一或互补的核酸序列。

70.如权利要求60-68中任一项所述的多核苷酸，其包含与全长SEQ ID NO:204或207至少约80％、85％、90％、95％或98％同一或互补的核酸序列。

71.如权利要求59-68中任一项所述的多核苷酸，其包含与全长SEQ ID NO:204或207至少约95％同一或互补的核酸序列。

72.如权利要求59-68中任一项所述的多核苷酸，其包含与全长SEQ ID NO:204或207100％同一或互补的核酸序列。

73.一种产生如权利要求1-58中任一项所述的突变TcBuster转座酶或融合转座酶的细胞。

74.一种含有如权利要求59-72中任一项所述的多核苷酸的细胞。

75.一种方法，其包括：将如权利要求1-26中任一项所述的突变TcBuster转座酶和能够被所述突变TcBuster转座酶识别的转座子引入到细胞中。

76.一种方法，其包括：将如权利要求27-58中任一项所述的融合转座酶和能够被所述融合转座酶识别的转座子引入到细胞中。

77.如权利要求75或76所述的方法，其中所述引入包括使所述细胞与编码所述突变TcBuster转座酶或所述融合转座酶的多核苷酸接触。

78.如权利要求77所述的方法，其中所述多核苷酸包含编码所述突变TcBuster转座酶或所述融合转座酶的DNA。

79.如权利要求77所述的方法，其中所述多核苷酸包含编码所述突变TcBuster转座酶或所述融合转座酶的信使RNA(mRNA)。

80.如权利要求79所述的方法，其中所述mRNA是经化学修饰的。

81.如权利要求75-80中任一项所述的方法，其中所述引入包括使所述细胞与含有所述转座子的DNA载体接触。

82.如权利要求81所述的方法，其中所述DNA载体包含小环质粒。

83.如权利要求77-82中任一项所述的方法，其中所述引入包括使所述细胞与含有所述转座子和编码所述突变TcBuster转座酶或所述融合转座酶的多核苷酸的质粒载体接触。

84.如权利要求75-83中任一项所述的方法，其中所述引入包括使所述细胞与作为纯化蛋白的所述突变TcBuster转座酶或所述融合转座酶接触。

85.如权利要求75-84中任一项所述的方法，其中所述转座子包含位于两个反向重复序列之间的货物盒。

86.如权利要求85所述的方法，其中所述两个反向重复序列的左反向重复序列包含与SEQ ID NO:3具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。

87.如权利要求85所述的方法，其中所述两个反向重复序列的左反向重复序列包含SEQID NO:3。

88.如权利要求85-87中任一项所述的方法，其中所述两个反向重复序列的右反向重复序列包含与SEQ ID NO:4具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。

89.如权利要求85-87中任一项所述的方法，其中所述两个反向重复序列的右反向重复序列包含SEQ ID NO:4。

90.如权利要求85所述的方法，其中所述两个反向重复序列的左反向重复序列包含与SEQ ID NO:5具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。

91.如权利要求85所述的方法，其中所述两个反向重复序列的左反向重复序列包含SEQID NO:5。

92.如权利要求85、90或91所述的方法，其中所述两个反向重复序列的右反向重复序列包含与SEQ ID NO:6具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。

93.如权利要求85、90或91所述的方法，其中所述两个反向重复序列的右反向重复序列包含SEQ ID NO:6。

94.如权利要求85所述的方法，其中所述两个反向重复序列的左反向重复序列包含与SEQ ID NO:205具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。

95.如权利要求85所述的方法，其中所述两个反向重复序列的左反向重复序列包含SEQID NO:205。

96.如权利要求85、94或95所述的方法，其中所述两个反向重复序列的右反向重复序列包含与SEQ ID NO:206具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。

97.如权利要求85、94或95所述的方法，其中所述两个反向重复序列的右反向重复序列包含SEQ ID NO:206。

98.如权利要求85-97中任一项所述的方法，其中所述货物盒包含选自由以下组成的组的启动子：CMV、EFS、MND、EF1α、CAGCs、PGK、UBC、U6、H1和Cumate。

99.如权利要求85-98中任一项所述的方法，其中所述货物盒包含CMV启动子。

100.如权利要求85-99中任一项所述的方法，其中所述货物盒以正向方向存在。

101.如权利要求85-99中任一项所述的方法，其中所述货物盒以反向方向存在。

102.如权利要求75-101中任一项所述的方法，其中所述引入包括借助于以下手段转染所述细胞：电穿孔、显微注射、磷酸钙沉淀、阳离子聚合物、树枝状聚合物、脂质体、微粒轰击、fugene、直接声波加载、细胞挤压、光学转染、原生质体融合、穿刺转染、磁转染、核转染或其任何组合。

103.如权利要求75-102中任一项所述的方法，其中所述引入包括对所述细胞进行电穿孔。

104.如权利要求75-103中任一项所述的方法，其中所述细胞是从受试者中分离的原代细胞。

105.如权利要求104所述的方法，其中所述受试者是人。

106.如权利要求104或105所述的方法，其中所述受试者是患有疾病的患者。

107.如权利要求104-106中任一项所述的方法，其中所述受试者已被诊断出患有癌症或肿瘤。

108.如权利要求104-107中任一项所述的方法，其中所述细胞是从所述受试者的血液中分离的。

109.如权利要求75-108中任一项所述的方法，其中所述细胞包括原代免疫细胞。

110.如权利要求75-109中任一项所述的方法，其中所述细胞包括原代白细胞。

111.如权利要求75-110中任一项所述的方法，其中所述细胞包括原代T细胞。

112.如权利要求111所述的方法，其中所述原代T细胞包括γδT细胞、辅助T细胞、记忆T细胞、自然杀伤T细胞、效应T细胞或其任何组合。

113.如权利要求109-112中任一项所述的方法，其中所述原代免疫细胞包括CD3+细胞。

114.如权利要求75-113中任一项所述的方法，其中所述细胞包括干细胞。

115.如权利要求114所述的方法，其中所述干细胞选自由以下组成的组：胚胎干细胞、造血干细胞、表皮干细胞、上皮干细胞、支气管干细胞、乳腺干细胞、间充质干细胞、肠干细胞、内皮干细胞、神经干细胞、嗅觉成体干细胞、神经嵴干细胞、睾丸细胞及其任何组合。

116.如权利要求114所述的方法，其中所述干细胞包括诱导性多能干细胞。

117.如权利要求85-116中任一项所述的方法，其中所述货物盒包含转基因。

118.如权利要求117所述的方法，其中所述转基因编码选自由以下组成的组的蛋白质：细胞受体、免疫检查点蛋白、细胞因子及其任何组合。

119.如权利要求117或118所述的方法，其中所述转基因编码选自由以下组成的组的细胞受体：T细胞受体(TCR)、B细胞受体(BCR)、嵌合抗原受体(CAR)或其任何组合。

120.一种治疗方法，其包括：

(a)将转座子和识别所述转座子的如权利要求1-58中任一项所述的突变TcBuster转座酶或融合转座酶引入到细胞中，从而产生基因修饰的细胞；以及

(b)将所述基因修饰的细胞施用给需要所述治疗的患者。

121.如权利要求120所述的方法，其中所述基因修饰的细胞包含由所述转座子引入的转基因。

122.如权利要求120或121所述的方法，其中所述患者已被诊断出患有癌症或肿瘤。

123.如权利要求120-122中任一项所述的方法，其中所述施用包括将所述基因修饰的细胞输注到所述患者的血管中。

124.一种用于基因组编辑的系统，其包含：如权利要求1-58中任一项所述的突变TcBuster转座酶或融合转座酶，以及能够被所述突变TcBuster转座酶或所述融合转座酶识别的转座子。

125.一种用于基因组编辑的系统，其包含：编码如权利要求1-58中任一项所述的突变TcBuster转座酶或融合转座酶的多核苷酸，以及能够被所述突变TcBuster转座酶或所述融合转座酶识别的转座子。

126.如权利要求125所述的系统，其中所述多核苷酸包含与SEQ ID NO:204或207至少80％同一或互补的核酸序列。

127.如权利要求125所述的系统，其中所述多核苷酸包含编码所述突变TcBuster转座酶或所述融合转座酶的DNA。

128.如权利要求125或127所述的系统，其中所述多核苷酸包含编码所述突变TcBuster转座酶或所述融合转座酶的信使RNA(mRNA)。

129.如权利要求128所述的系统，其中所述mRNA是经化学修饰的。

130.如权利要求124-129中任一项所述的系统，其中所述转座子存在于DNA载体中。

131.如权利要求130所述的系统，其中所述DNA载体包含小环质粒。

132.如权利要求125-131中任一项所述的系统，其中所述多核苷酸与所述转座子存在于同一质粒中。

133.如权利要求124-132中任一项所述的系统，其中所述转座子包含位于两个反向重复序列之间的货物盒。

134.如权利要求133所述的系统，其中所述两个反向重复序列的左反向重复序列包含与SEQ ID NO:3具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。

135.如权利要求133所述的系统，其中所述两个反向重复序列的左反向重复序列包含SEQ ID NO:3。

136.如权利要求133-135中任一项所述的系统，其中所述两个反向重复序列的右反向重复序列包含与SEQ ID NO:4具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。

137.如权利要求133-135中任一项所述的系统，其中所述两个反向重复序列的右反向重复序列包含SEQ ID NO:4。

138.如权利要求133所述的系统，其中所述两个反向重复序列的左反向重复序列包含与SEQ ID NO:5具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。

139.如权利要求133所述的系统，其中所述两个反向重复序列的左反向重复序列包含SEQ ID NO:5。

140.如权利要求133、138或139所述的系统，其中所述两个反向重复序列的右反向重复序列包含与SEQ ID NO:6具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。

141.如权利要求133、138或139所述的系统，其中所述两个反向重复序列的右反向重复序列包含SEQ ID NO:6。

142.如权利要求133所述的系统，其中所述两个反向重复序列的左反向重复序列包含与SEQ ID NO:205具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。

143.如权利要求133所述的系统，其中所述两个反向重复序列的左反向重复序列包含SEQ ID NO:205。

144.如权利要求133、142或143中任一项所述的系统，其中所述两个反向重复序列的右反向重复序列包含与SEQ ID NO:206具有至少50％、至少60％、至少80％、至少90％、至少95％、至少98％或至少99％同一性的序列。

145.如权利要求133、142或143中任一项所述的系统，其中所述两个反向重复序列的右反向重复序列包含SEQ ID NO:206。

146.如权利要求133-145中任一项所述的系统，其中所述货物盒包含选自由以下组成的组的启动子：CMV、EFS、MND、EF1α、CAGCs、PGK、UBC、U6、H1和Cumate。

147.如权利要求133-145中任一项所述的系统，其中所述货物盒包含CMV启动子。

148.如权利要求133-147中任一项所述的系统，其中所述货物盒包含转基因。

149.如权利要求148所述的系统，其中所述转基因编码选自由以下组成的组的蛋白质：细胞受体、免疫检查点蛋白、细胞因子及其任何组合。

150.如权利要求148或149所述的系统，其中所述转基因编码选自由以下组成的组的细胞受体：T细胞受体(TCR)、B细胞受体(BCR)、嵌合抗原受体(CAR)或其任何组合。

151.如权利要求133-150中任一项所述的系统，其中所述货物盒以正向方向存在。

152.如权利要求133-150中任一项所述的系统，其中所述货物盒以反向方向存在。