CN114026228A

CN114026228A - 用于识别序列的工程化大范围核酸酶的优化

Info

Publication number: CN114026228A
Application number: CN202080043031.9A
Authority: CN
Inventors: J·J·史密斯; 李慧
Original assignee: Precision Biosciences Inc
Current assignee: Precision Biosciences Inc
Priority date: 2019-05-07
Filing date: 2020-05-07
Publication date: 2022-02-08
Also published as: EP3966322A1; AU2020268394A1; US20220195407A1; CA3137975A1; WO2020227534A1; IL287752A; US20230340434A1; KR20220005555A; JP2022531459A; MX2021013502A

Abstract

本发明提供了衍生自I‑CreI的工程化大范围核酸酶，其在特定位置具有增加所述核酸酶对包含某些中心序列的识别序列的活性的置换。本发明还提供了使用此类工程化大范围核酸酶切割双链DNA的方法。本发明进一步提供了用于改善工程化大范围核酸酶对包含某些中心序列的识别序列的活性的方法。

Description

用于识别序列的工程化大范围核酸酶的优化

技术领域

本发明涉及分子生物学和重组核酸技术领域。特别地，本发明涉及针对包含中心序列的识别序列的工程化、I-CreI衍生的大范围核酸酶的优化。

通过EFS-WEB作为文本文件提交的序列表的引用

本申请包含序列表，该序列表已通过EFS-Web以ASCII格式提交，其全部内容通过引用并入本文。于2020年5月7日创建的所述ASCII副本被命名为P109070040WO00-SEQ-EPG，其大小为1,446千字节。

背景技术

基因组工程需要能够插入、缺失、置换和以其他方式操纵基因组内的特定基因序列，并且具有很多治疗和生物技术应用。开发有效的基因组修饰手段仍然是基因疗法、农业技术和合成生物学的主要目标(Porteus等，(2005),Nat.Biotechnol.23:967-73；Tzfira等，(2005),Trends Biotechnol.23:567-9；McDaniel等，(2005),Curr.Opin.Biotechnol.16:476-83)。实现这一目标的一种方法是利用位点特异性、罕见的切割核酸酶，如大范围核酸酶(即，归巢核酸内切酶)。

大范围核酸酶通常分为四个家族：LAGLIDADG(SEQ ID NO:2)家族、GIY-YIG家族、His-Cys盒家族和HNH家族。这些家族以影响催化活性和识别序列的结构基序为特征。例如，LAGLIDADG(SEQ ID NO:2)家族成员的特征在于具有一个或两个拷贝的保守LAGLIDADG(SEQID NO:2)基序(参见Chevalier等，(2001),Nucleic Acids Res.29(18):3757-3774)。具有单个拷贝的LAGLIDADG(SEQ ID NO:2)基序的LAGLIDADG(SEQ ID NO:2)大范围核酸酶形成同源二聚体，而发现具有两个拷贝的LAGLIDADG(SEQ ID NO:2)基序的成员是单体。

I-CreI(SEQ ID NO:1)是LAGLIDADG(SEQ ID NO:2)家族的成员，其识别和切割叶绿素染色体中的22个碱基对的识别序列。已将基因选择技术用于修改野生型I-CreI识别位点偏好(Sussman等，(2004),J.Mol.Biol.342:31-41；Chames等，(2005),Nucleic AcidsRes.33:e178；Seligman等，(2002),Nucleic Acids Res.30:3870-9,Arnould等，(2006),J.Mol.Biol.355:443-58)。此前例如在WO2007/047859中已公开了工程化I-CreI以靶向广泛不同的DNA位点的方法，包括在哺乳动物、酵母、植物、细菌和病毒基因组中的位点。

由I-CreI识别的DNA序列长度为22个碱基对。在SEQ ID NO:3中提供了天然存在的I-CreI识别位点的一个实例，但是该酶会以不同亲和性与多种相关序列结合。野生型I-CreI酶作为同型二聚体结合DNA，其中每个单体与九个碱基对的“半位点”直接接触。识别序列的两个半位点被四个碱基对的“中心序列”所分隔。这四个中心碱基不与酶直接接触。切割后，野生型I-CreI和工程化I-CreI衍生的大范围核酸酶，在识别序列的中心产生交错的双链断裂，导致产生4个碱基对3’-突出端(图1)。

本发明涉及大范围核酸酶识别序列中的中心的四个碱基对(即，中心序列)，其在切割后成为3’突出端。在莱茵衣藻(Chlamydomonas reinhardtii)23S rRNA基因中的天然I-CreI识别序列的情况下，中心序列是5’-GTGA-3’。很多已发表的关于I-CreI或其衍生物的研究使用采用天然5’-GTGA-3’中心序列或回文序列5’-GTAC-3’的DNA底物评估了该酶，无论是野生型还是基因工程的。Arnould等(Arnould等，(2007),J.Mol.Biol.371:49-65)报道了一组衍生自I-CreI的以不同效率切割DNA底物的基因工程化大范围核酸酶，具体取决于底物序列是否以5’-GTAC-3’、5’-TTGA-3’、5’-GAAA-3’或5’-ACAC-3’为中心。

此外，WO 2010/009147(‘147号公开文本)公开了工程化大范围核酸酶将根据中心序列以不同效率切割不同识别序列。‘147号公开文本描述了基于识别序列的中心序列进行工程化大范围核酸酶的靶向和切割的一般规则，以及切割此类序列的效率。

然而，‘147号公开文本没有描述是否可以修饰I-CreI衍生的大范围核酸酶以提高其切割具有特定中心序列的识别序列的活性和/或特异性。事实上，此前认为野生型I-CreI和I-CreI衍生的大范围核酸酶的亚基不直接与中心序列相互作用。因此，本发明通过鉴定允许优化I-CreI衍生的大范围核酸酶以识别和切割具有特定中心序列的识别序列的特定位置和残基来推进本领域。

发明内容

一个方面是一种工程化大范围核酸酶，其结合并切割包含中心序列的识别序列，所述中心序列由ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTAA组成，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQ ID NO:1的氨基酸序列，并且其中所述第一亚基和所述第二亚基各自在对应于SEQ ID NO:1的位置48、50、71、72、73和74的一个或多个位置处包含置换。

在一些实施方式中，中心序列由ACAA组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K或L残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、R、T、K或S残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G或R残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R或Q残基；和(e)在对应于SEQ ID NO:1的位置73的位置处的A或C残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、T、S或A残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、R、E、K或T残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G或A残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、R、S、P、N、G或A残基；(e)在对应于SEQ ID NO:1的位置73的位置处的V或I残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、T或A残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:11-33中任一项的残基48、50、71、72和73的残基。在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:11-33中任一项的残基239、241、262、263、264和265的残基。在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基；和(d)在对应于SEQ ID NO:1的位置154的位置处的S或G残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的G、A或S残基；(b)在对应于SEQ ID NO:1的位置66的位置处的Y或C残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；(d)在对应于SEQID NO:1的位置92的位置处的Q或R残基；(e)在对应于SEQ ID NO:1的位置117的位置处的E或G残基；和(f)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:11-33中任一项的残基19、80、139和154的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:11-33中任一项的残基19、66、80、92、117和139的残基。

另一个方面是一种用于在靶位点切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由ACAA组成的中心序列，所述方法包括将具有所述靶位点的所述双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由ACAG组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置50的位置处的R残基；(b)在对应于SEQ ID NO:1的位置71的位置处的G或R残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R、K、Q、P或T残基；和(d)在对应于SEQ ID NO:1的位置73的位置处的A或C残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置50的位置处的C残基；(b)在对应于SEQ ID NO:1的位置71的位置处的G、S或D残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R或G残基；(d)在对应于SEQ IDNO:1的位置73的位置处的R残基；和任选地(e)在对应于SEQ ID NO:1的位置73的位置之后位置处的R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:36-43中任一项的残基50、71、72和73的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ ID NO:1的位置54的位置处的F、I或L残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(d)在对应于SEQ ID NO:1的位置158的位置处的S或P残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的G、A或S残基；(b)在对应于SEQ ID NO:1的位置59的位置处的V或A残基；(c)在对应于SEQ ID NO:1的位置66的位置处的Y或H残基；(d)在对应于SEQID NO:1的位置80的位置处的Q残基；(e)在对应于SEQ ID NO:1的位置81的位置处的I或T残基；和(f)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:36-43中任一项的残基19、54、80和158的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:36-43中任一项的残基19、59、66、80、81和139的残基。

在一些实施方式中，第二亚基还包含插入对应于of SEQ ID NO:1的位置73和74的位置之间的R残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由ACAG组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由ACAT组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、S、I、L或N残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、S、R或K残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G或R残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R或T残基；和(e)在对应于SEQ ID NO:1的位置73的位置处的A或G残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的H、T、G、A、S、L或K残基；(b)在对应于SEQ ID NO:1的位置50的位置处的S、K、C、N R、G或Q残基；(c)在对应于SEQ ID NO:1的位71的位置处的S、G、R、T、K或E残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、K、A、S、R、H、G或N残基；(e)在对应于SEQ ID NO:1的位置73的位置处的H、A、C、S、G或R残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、C或A残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:46-67中任一项的残基48、50、71、72和73的残基。

在一些实施方式中，所述第二亚基包含应于SEQ ID NO:46-67中任一项的残基239、241、262、263、264和265的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；(b)在对应于SEQ ID NO:1的位置54的位置处的F或I残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的K、H或R残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置81的位置处的I或T残基；(d)在对应于SEQID NO:1的位置83的位置处的P或H残基；(e)在对应于SEQ ID NO:1的位置117的位置处的E或G残基；和(f)在对应于SEQ ID NO:1的位置139的位置处的K、R、T或H残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:46-67中任一项的残基19、54、80和139的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:46-67中任一项的残基19、80、81、83、117和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由ACAT组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由ACGA组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K残基；(b)在对应于SEQ ID NO:1的位置50的位置处的V、R、T、W或A残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G或P残基；(d)在对应于SEQID NO:1的位置72的位置处的R或P残基；和(e)在对应于SEQ ID NO:1的位置73的位置处的A残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、H、T、A、G或Q残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、S、C、I、V或G残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G；(d)在对应于SEQ ID NO:1的位置72的位置处的R或H残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:70-89中任一项的残基48、50、71、72和73的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:70-89中任一项的残基239、241、262、263、264和265的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的R残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:70-89中任一项的残基19、80和139的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:70-89中任一项的残基19、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由ACGA组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由ACGC组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、H、Q、L、A或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、R、K、S、T或C残基；(c)在对应于SEQ ID NO:1的位置71的位置处的a G、R或A残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、P或H残基；和(e)在对应于SEQ ID NO:1的位置73的位置处的A残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的H、K、L、A、S或N残基；(b)在对应于SEQ ID NO:1的位置50的位置处的S、E、K、I、N或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的S、G、K、A或R残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、R、A、S、H或G残基；(e)在对应于SEQID NO:1的位置73的位置处的H、T、V、I或C残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:92-118中任一项的残基48、50、71、72和73的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:92-118中任一项的残基239、241、262、263、264和265的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；和(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置87的位置处的F或L残基；和(d)在对应于SEQID NO:1的位置139的位置处的K、R、N、H或A残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:92-118中任一项的残基19和80的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:92-118中任一项的残基19、80、87和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由ACGC组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由ACGG组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置50的位置处的R或K残基；(b)在对应于SEQ ID NO:1的位置72的位置处的R残基；和(c)在对应于SEQ ID NO:1的位置73的位置处的A残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R或P残基；(c)在对应于SEQ ID NO:1的位置71的位置处的D残基；(d)在对应于SEQ ID NO:1的位置72的位置处的G残基；和(e)在对应于SEQ ID NO:1的位置73的位置处的R或G残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:121-135中任一项的残基50、72和73的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:121-135中任一项的残基239、241、262、263和264的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置54的位置处的F或L残基；和(b)在对应于SEQ ID NO:1的位置80的位置处的Q残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A残基；和(b)在对应于SEQ ID NO:1的位置80的位置处的Q残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:121-135中任一项的残基54和80的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:121-135中任一项的残基19和80的残基。

在一些实施方式中，第二亚基还包含插入对应于SEQ ID NO:1的位置73和74的位置之间的R残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由ACGG组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由ACGT组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、L、S或残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、R、C、S或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R残基；和(e)在对应于SEQ ID NO:1的位置73的位置处的A残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的H、K、L或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的S、C、Q、E或A残基；(c)在对应于SEQ ID NO:1的位置71的位置处的S、P、G、T、A、R或N残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、R、K或A残基；(e)在对应于SEQ ID NO:1的位置73的位置处的H、C、A或S残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:138-156中任一项的残基48、50、71、72和73的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:138-156中任一项的残基239、241、262、263、264和265的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置85的位置处的H或Y残基；和(d)在对应于SEQID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:138-156中任一项的残基19、80和139的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:138-156中任一项的残基19、80、85和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由ACGT组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由ATAA组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、A、H、S、L或Q残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、T、R、I、G、K、D、C或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、K、S、H或N残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、A、G、Q、H、L或S残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、T或C残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的S、T、A、K或N残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、K、E、A、C或T残基；(c)在对应于SEQ ID NO:1的位置71的位置处的S、G、K或R残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、R、Q、G、A、Y、S、N或K残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I、C或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:159-183中任一项的残基48、50、71、72、73和74的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:159-183中任一项的残基239、241、262、263、264和265的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置100的位置处的K或E残基；(d)在对应于SEQID NO:1的位置139的位置处的K或R残基；(e)在对应于SEQ ID NO:1的位置154的位置处的S或G残基；和(f)在对应于SEQ ID NO:1的位置172的位置处的S或A残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的G、S或残基；(b)在对应于SEQ ID NO:1的位置59的位置处的V或A残基；(c)在对应于SEQ ID NO:1的位置78的位置处的L残基；(d)在对应于SEQ IDNO:1的位置79的位置处的S残基；(e)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；(f)在对应于SEQ ID NO:1的位置118的位置处的S或F残基；和(g)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:159-183中任一项的残基19、80、100、139、154和172的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:159-183中任一项的残基19、59、78、79、80、118和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由ATAA组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由ATAG组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K或H残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R或H残基；(d)在对应于SEQ IDNO:1的位置72的位置处的R、G、S、A、P或Q残基；和(e)在对应于SEQ ID NO:1的位置73的位置处的A或C残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置50的位置处的C或R残基；(b)在对应于SEQ ID NO:1的位置72的位置处的G或S残基；和(c)在对应于SEQ ID NO:1的位置73的位置处的R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:186-199中任一项的残基48、50、71、72和73的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:186-199中任一项的残基241、263和264的残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的G或A残基；(b)在对应于SEQ ID NO:1的位置36的位置处的K或R残基；(c)在对应于SEQ ID NO:1的位置59的位置处的V或A残基；(d)在对应于SEQ IDNO:1的位置80的位置处的Q残基；和(e)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:186-199中任一项的残基19、80和139的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:186-199中任一项的残基19、36、59、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由ATAG组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由ATAT组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、H、C、A、S、D或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、N、C、R、K、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、H或I残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、A、N或Q残基；和(e)在对应于SEQID NO:1的位置73的位置处的A、C或S残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的H、K、A、S、R或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的S、C、K、R、Q或N残基；(c)在对应于SEQ ID NO:1的位置71的位置处的S、K、E、I、G或R残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、A、R、S、K、G或N残基；(e)在对应于SEQ ID NO:1的位置73的位置处的H、C、A、S或G残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、C或A残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:202-219中任一项的残基48、50、71、72和73的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:202-219中任一项的残基239、241、262、263、264和2653的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K、R或S残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的G或A残基；(b)在对应于SEQ ID NO:1的位置59的位置处的V或A残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q、E或K残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的K、R、P或N残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:202-219中任一项的残基19、80和139的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:202-219中任一项的残基19、59、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由ATAT组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由ATGA组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、A、H或L残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、T、E、S、C或V残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R、T、S、A或K残基；和(d)在对应于SEQ ID NO:1的位置73的位置处的A或S残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的H、K、R、A或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的S、I、R、C、A或Q残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R或H残基；(d)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:222-243中任一项的残基48、50、72和73的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:222-243中任一项的残基239、241、263、264和265的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置87的位置处的F或L残基；(d)在对应于SEQID NO:1的位置92的位置处的Q或R残基；和(e)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的G、A或S残基；(b)在对应于SEQ ID NO:1的位置59的位置处的V或A残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:222-243中任一项的残基19、80、87、92和139的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:222-243中任一项的残基19、59、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由ATGA组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由ATGG组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置50的位置处的R残基；(b)在对应于SEQ ID NO:1的位置71的位置处的G或S残基；(c)在对应于SEQ ID NO:1的位置72的位置处的P或G残基；和(d)在对应于SEQ IDNO:1的位置73的位置处的A或C残基；(e)在对应于SEQ ID NO:1的位置74的位置处的S或C残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置50的位置处的R残基；(b)在对应于SEQ ID NO:1的位置71的位置处的D或G残基；(c)在对应于SEQ ID NO:1的位置72的位置处的G残基；和(d)在对应于SEQ ID NO:1的位置73的位置处的R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:246-247中任一项的残基50、71、72、73和74的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:246-247中任一项的残基239、241、262、263和264的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ ID NO:1的位置80的位置处的E或Q残基；(c)在对应于SEQ ID NO:1的位置82的位置处的E或K残基；和(d)在对应于SEQID NO:1的位置139的位置处的R或K残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ ID NO:1的位置77的位置处的N残基；和(c)在对应于SEQ ID NO:1的位置80的位置处的Q或R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:246-247中任一项的残基19、80、82和139的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:246-247中任一项的残基19、77和80的残基。

在一些实施方式中，第二亚基还包含在对应于SEQ ID NO:1的位置73和74的位置之间插入的R残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由ATGG组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由TTGG组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置50的位置处的R残基；(b)在对应于SEQ ID NO:1的位置71的位置处的S残基；(c)在对应于SEQ ID NO:1的位置72的位置处的G残基；和(d)在对应于SEQ ID NO:1的位置73的位置处的R残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、T、E、K或R残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G或K残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、Q、K、R、H、A或S残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:250-266中任一项的残基50、71、72和73的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:250-266中任一项的残基239、241、262、263、264和265的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；和(b)在对应于SEQ ID NO:1的位置80的位置处的Q残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的G或A残基；(b)在对应于SEQ ID NO:1的位置66的位置处的Y或H残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q残基；(d)在对应于SEQ IDNO:1的位置85的位置处的H或R残基；和(e)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:250-266中任一项的残基19和80的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:250-266中任一项的残基19、66、80、85和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由TTGG组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由GCAA组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K或H残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、C、K、T或L残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、N、T、R、S或H残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、P、S、N、Q、G、A、T、M或V残基；(e)在对应于SEQID NO:1的位置73的位置处的T或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、C或A残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的S、A、K或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、C、T、K或E残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、A或H残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、G、S、A、E、N、K、H、R、C或Y残基；(e)在对应于SEQ ID NO:1的位置73的位置处的C、V或I残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:269-291中任一项的残基48、50、71、72、73和74的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:269-291中任一项的残基239、241、262、263、264和265的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的G或A残基；(b)在对应于SEQ ID NO:1的位置31的位置处的Q或P残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(d)在对应于SEQID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:269-291中任一项的残基19、80和139的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:269-291中任一项的残基19、31、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由GCAA组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由GCAT组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、A、H或R残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、V、R、K或S残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、A、H、R、T、N或S残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、T、G、S、Q、N或A残基；(e)在对应于SEQID NO:1的位置73的位置处的A、T、V或C残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的H、A、K、T、L或I残基；(b)在对应于SEQ ID NO:1的位置50的位置处的S、R、K、Q、H或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的S、K、R、A、G、T、H或Y残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、A、G、N、S、R、H、Q或K残基；(e)在对应于SEQ ID NO:1的位置73的位置处的H、C、G、S或A残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、C或A残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:294-313中任一项的残基48、50、71、72、73和74的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:294-313中任一项的残基239、241、262、263、264和265的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置139的位置处的K、H或R残基；和(d)在对应于SEQ ID NO:1的位置143的位置处的T或I残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的G、S或A残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置125的位置处的V或A残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的K、R或H残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:294-313中任一项的残基19、80、139和143的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:294-313中任一项的残基19、80、125和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由GCAT组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由GCGA组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置50的位置处的K或R残基；(b)在对应于SEQ ID NO:1的位置71的位置处的G、R、S、A或N残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R、N、G、A或Q残基；(d)在对应于SEQ ID NO:1的位置73的位置处的V、T或I残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、T、S、A或Q残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C或R残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R残基；(d)在对应于SEQID NO:1的位置73的位置处的V或I残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:316-325中任一项的残基50、71、72、73和74的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:316-325中任一项的残基239、241、263、264和265的残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的G、S或A残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:316-325中任一项的残基19和80的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:316-325中任一项的残基19、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由GCGA组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由GCAG组成。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K或H残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q或R残基；(c)在对应于SEQ ID NO:1的位置72的位置处的S或R残基；(d)在对应于SEQ IDNO:1的位置73的位置处的V或T残基；和

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:328-330中任一项的残基50、71、72、73和74的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:328-330中任一项的残基239、241、263、264和265的残基。

在一些实施方式中，所述第二亚基包含在对应于SEQ ID NO:1的位置80的位置处的E残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:328-330中任一项的残基80的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由GCAG组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由TCAA组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、T或C残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R或T残基；和(d)在对应于SEQ ID NO:1的位置72的位置处的R、S、P、T或G残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的S或K残基；(b)在对应于SEQ ID NO:1的位置50的位置处的K、R、C或E残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R、Q、N或S残基；(d)在对应于SEQ ID NO:1的位置73的位置处的I残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:333-340中任一项的残基48、50、71和72的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:333-340中任一项的残基239、241、263、264和265的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或S残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的G或S残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:333-340中任一项的残基19、80和139的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:333-340中任一项的残基19、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由TCAA组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由TTAA组成。

(a)在对应于SEQ ID NO:1的位置48的位置处的K、N、S或R残基；(b)在对应于SEQID NO:1的位置50的位置处的R、V、K或S残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、N、S或A残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、T、S、N、D、Q、K或A残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、S、A或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、K、R、T或E残基；(c)在对应于SEQ ID NO:1的位置72的位置处的T、K、R、A、S或Q残基；(d)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:343-357中任一项的残基48、50、71、72和74的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:343-357中任一项的残基239、241、263、264和265的残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的G、A或S残基；(b)在对应于SEQ ID NO:1的位置66的位置处的Y或H残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q残基；和(d)在对应于SEQID NO:1的位置139的位置处的R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:343-357中任一项的残基19、80和139的残基。

在一些实施方式中，所述第二亚基包含对应于SEQ ID NO:343-357中任一项的残基19、66、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由TTAA组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

另一个方面是一种用于增加工程化大范围核酸酶的切割活性的方法，所述工程化大范围核酸酶结合并切割识别序列，所述识别序列包含由ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTAA组成的中心序列，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQ ID NO:1的氨基酸序列、所述方法包括在对应于SEQ IDNO:1的位置48、50、71、72、73和74的一个或多个位置处修饰第一亚基和第二亚基中的每一个，其中当与对照工程化大范围核酸酶比较时，修饰的核酸酶具有增加的切割活性。

在所述方法的一些实施方式中，中心序列由ACAA组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K或L残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、R、T、K或S残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G或R残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R或Q残基；和(e)在对应于SEQ IDNO:1的位置73的位置处的A或C残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、T、S或A残基；(b)在对应于SEQ IDNO:1的位置50的位置处的C、R、E、K或T残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G或A残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、R、S、P、N、G或A残基；(e)在对应于SEQ ID NO:1的位置73的位置处的V或I残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、T或A残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:8-30中任一项的残基48、50、71、72和73的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:8-30中任一项的残基239、241、262、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基；和(d)在对应于SEQ ID NO:1的位置154的位置处的S或G残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的G、A或S残基；(b)在对应于SEQ IDNO:1的位置66的位置处的Y或C残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；(d)在对应于SEQ ID NO:1的位置92的位置处的Q或R残基；(e)在对应于SEQ ID NO:1的位置117的位置处的E或G残基；和(f)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:8-30中任一项的残基19、80、139和154的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:8-30中任一项的残基19、66、80、92、117和139的残基。

在所述方法的一些实施方式中，中心序列由ACAG组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置50的位置处的R残基；(b)在对应于SEQ ID NO:1的位置71的位置处的G或R残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R、K、Q、P或T残基；(d)在对应于SEQ ID NO:1的位置73的位置处的A或C残基；和任选地(e)在对应于SEQ IDNO:1的位置73的位置之后的位置处的R残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置50的位置处的C残基；(b)在对应于SEQ ID NO:1的位置71的位置处的G、S或D残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R或G残基；和(d)在对应于SEQ ID NO:1的位置73的位置处的R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:33-40中任一项的残基50、71、72和73的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:33-40中任一项的残基241、262、263和264的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ IDNO:1的位置54的位置处的F、I或L残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(d)在对应于SEQ ID NO:1的位置158的位置处的S或P残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的G、A或S残基；(b)在对应于SEQ IDNO:1的位置59的位置处的V或A残基；(c)在对应于SEQ ID NO:1的位置66的位置处的Y或H残基；(d)在对应于SEQ ID NO:1的位置80的位置处的Q残基；(e)在对应于SEQ ID NO:1的位置81的位置处的I或T残基；和(f)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:33-40中任一项的残基19、54、80和158的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:33-40中任一项的残基19、59、66、80、81和139的残基。

在所述方法的一些实施方式中，通过在对应于SEQ ID NO:1的位置73和74的位置之间插入R残基对第二亚基进行进一步修饰。

在所述方法的一些实施方式中，中心序列由ACAT组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、S、I、L或N残基；(b)在对应于SEQID NO:1的位置50的位置处的Q、S、R或K残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G或R残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R或T残基；和(e)在对应于SEQID NO:1的位置73的位置处的A或G残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的H、T、G、A、S、L或K残基；(b)在对应于SEQ ID NO:1的位置50的位置处的S、K、C、N R、G或Q残基；(c)在对应于SEQ ID NO:1的位置71的位置处的S、G、R、T、K或E残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、K、A、S、R、H、G或N残基；(e)在对应于SEQ ID NO:1的位置73的位置处的H、A、C、S、G或R残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、C或A残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:43-64中任一项的残基48、50、71、72和73的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:43-64中任一项的残基239、241、262、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；(b)在对应于SEQ IDNO:1的位置54的位置处的F或I残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的K、H或R残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置81的位置处的I或T残基；(d)在对应于SEQ ID NO:1的位置83的位置处的P或H残基；(e)在对应于SEQ ID NO:1的位置117的位置处的E或G残基；和(f)在对应于SEQ ID NO:1的位置139的位置处的K、R、T或H残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:43-64中任一项的残基19、54、80和139的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:43-64中任一项的残基19、80、81、83、117和139的残基。

在所述方法的一些实施方式中，中心序列由ACGA组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K残基；(b)在对应于SEQ ID NO:1的位置50的位置处的V、R、T、W或A残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G或P残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R或P残基；和(e)在对应于SEQ ID NO:1的位置73的位置处的A残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、H、T、A、G或Q残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、S、C、I、V或G残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R或H残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:67-89中任一项的残基48、50、71、72和73的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:67-89中任一项的残基239、241、262、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的R残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:67-89中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:67-89中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，中心序列由ACGC组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、H、Q、L、A或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、R、K、S、T或C残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R或A残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、P或H残基；和(e)在对应于SEQ ID NO:1的位置73的位置处的A残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的H、K、L、A、S或N残基；(b)在对应于SEQ ID NO:1的位置50的位置处的S、E、K、I、N或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的S、G、K、A或R残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、R、A、S、H或G残基；(e)在对应于SEQ ID NO:1的位置73的位置处的H、T、V、I或C残基；和(f)在对应于SEQID NO:1的位置74的位置处的S、A或T残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:92-118中任一项的残基48、50、71、72和73的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:92-118中任一项的残基239、241、262、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；和(b)在对应于SEQID NO:1的位置80的位置处的Q或E残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置87的位置处的F或L残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的K、R、N、H或A残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:92-118中任一项的残基19和80的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:92-118中任一项的残基19、80、87和139的残基。

在所述方法的一些实施方式中，中心序列由ACGG组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置50的位置处的R或K残基；(b)在对应于SEQ ID NO:1的位置72的位置处的R残基；和(c)在对应于SEQ ID NO:1的位置73的位置处的A残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R或P残基；(c)在对应于SEQ ID NO:1的位置71的位置处的D残基；(d)在对应于SEQ ID NO:1的位置72的位置处的G残基；和(e)在对应于SEQ ID NO:1的位置73的位置处的R或G残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:121-135中任一项的残基50、72和73的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:121-135中任一项的残基239、241、262、263和264的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置54的位置处的F或L残基；和(b)在对应于SEQ IDNO:1的位置80的位置处的Q残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A残基；和(b)在对应于SEQ IDNO:1的位置80的位置处的Q残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:121-135中任一项的残基54和80的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:121-135中任一项的残基19和80的残基。

在所述方法的一些实施方式中，通过对应于SEQ ID NO:1的位置73和74的位置之间插入R残基对第二亚基进行进一步修饰。

在所述方法的一些实施方式中，中心序列由ACGT组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、L、S或H残基；(b)在对应于SEQ IDNO:1的位置50的位置处的Q、R、C、S或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R残基；和(e)在对应于SEQ ID NO:1的位置73的位置处的A残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的H、K、L或S残基；(b)在对应于SEQ IDNO:1的位置50的位置处的S、C、Q、E或A残基；(c)在对应于SEQ ID NO:1的位置71的位置处的S、P、G、T、A、R或N残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、R、K或A残基；(e)在对应于SEQ ID NO:1的位置73的位置处的H、C、A或S残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:138-156中任一项的残基48、50、71、72和73的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:138-156中任一项的残基239、241、262、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置85的位置处的H或Y残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:138-156中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:138-156中任一项的残基19、80、85和139的残基。

在所述方法的一些实施方式中，中心序列由ATAA组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、A、H、S、L或Q残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、T、R、I、G、K、D、C或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、K、S、H或N残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、A、G、Q、H、L或S残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、T或C残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的S、T、A、K或N残基；(b)在对应于SEQID NO:1的位置50的位置处的R、K、E、A、C或T残基；(c)在对应于SEQ ID NO:1的位置71的位置处的S、G、K或R残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、R、Q、G、A、Y、S、N或K残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I、C或V残基；和(f)在对应于SEQ IDNO:1的位置74的位置处的S、A或T残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:159-183中任一项的残基48、50、71、72、73和74的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:159-183中任一项的残基239、241、262、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置100的位置处的K或E残基；(d)在对应于SEQ ID NO:1的位置139的位置处的K或R残基；(e)在对应于SEQ ID NO:1的位置154的位置处的S或G残基；和(f)在对应于SEQ ID NO:1的位置172的位置处的S或A残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的G、S或A残基；(b)在对应于SEQ IDNO:1的位置59的位置处的V或A残基；(c)在对应于SEQ ID NO:1的位置78的位置处的L残基；(d)在对应于SEQ ID NO:1的位置79的位置处的S残基；(e)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；(f)在对应于SEQ ID NO:1的位置118的位置处的S或F残基；和(g)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:159-183中任一项的残基19、80、100、139、154和172的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:159-183中任一项的残基19、59、78、79、80、118和139的残基。

在所述方法的一些实施方式中，中心序列由ATAG组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K或H残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R或H残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、G、S、A、P或Q残基；和(e)在对应于SEQ IDNO:1的位置73的位置处的A或C残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置50的位置处的C或R残基；(b)在对应于SEQ ID NO:1的位置72的位置处的G或S残基；和(c)在对应于SEQ ID NO:1的位置73的位置处的R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:186-199中任一项的残基48、50、71、72和73的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:186-199中任一项的残基241、263和264的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的G或A残基；(b)在对应于SEQ IDNO:1的位置36的位置处的K或R残基；(c)在对应于SEQ ID NO:1的位置59的位置处的V或A残基；(d)在对应于SEQ ID NO:1的位置80的位置处的Q残基；和(e)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:186-199中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:186-199中任一项的残基19、36、59、80和139的残基。

在所述方法的一些实施方式中，中心序列由ATAT组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、H、C、A、S、D或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、N、C、R、K、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、H或I残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、A、N或Q残基；和(e)在对应于SEQ ID NO:1的位置73的位置处的A、C或S残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的H、K、A、S、R或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的S、C、K、R、Q或N残基；(c)在对应于SEQ ID NO:1的位置71的位置处的S、K、E、I、G或R残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、A、R、S、K、G或N残基；(e)在对应于SEQ ID NO:1的位置73的位置处的H、C、A、S或G残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、C或A残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:202-219中任一项的残基48、50、71、72和73的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:202-219中任一项的残基239、241、262、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K、R或S残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的G或A残基；(b)在对应于SEQ IDNO:1的位置59的位置处的V或A残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q、E或K残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的K、R、P或N残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:202-219中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:202-219中任一项的残基19、59、80和139的残基。

在所述方法的一些实施方式中，中心序列由ATGA组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、A、H或L残基；(b)在对应于SEQ IDNO:1的位置50的位置处的R、T、E、S、C或V残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R、T、S、A或K残基；和(d)在对应于SEQ ID NO:1的位置72的位置处的A或S残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的H、K、R、A或S残基；(b)在对应于SEQID NO:1的位置50的位置处的S、I、R、C、A或Q残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R或H残基；(d)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:222-243中任一项的残基48、50、72和73的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:222-243中任一项的残基239、241、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置87的位置处的F或L残基；(d)在对应于SEQ ID NO:1的位置92的位置处的Q或R残基；和(e)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的G、A或S残基；(b)在对应于SEQ IDNO:1的位置59的位置处的V或A残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:222-243中任一项的残基19、80、87、92和139的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:222-243中任一项的残基19、59、80和139的残基。

在所述方法的一些实施方式中，中心序列由ATGG组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置50的位置处的R残基；(b)在对应于SEQ ID NO:1的位置71的位置处的G或S残基；(c)在对应于SEQ ID NO:1的位置72的位置处的P或G残基；(d)在对应于SEQ ID NO:1的位置73的位置处的A或C残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S或C残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置50的位置处的R残基；(b)在对应于SEQ ID NO:1的位置71的位置处的D或G残基；(c)在对应于SEQ ID NO:1的位置72的位置处的G残基；和(d)在对应于SEQ ID NO:1的位置73的位置处的R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:246-247中任一项的残基50、71、72和73的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:246-247中任一项的残基241、262、263和264的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ IDNO:1的位置80的位置处的E或Q残基；(c)在对应于SEQ ID NO:1的位置82的位置处的E或K残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的R或K残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ IDNO:1的位置77的位置处的N残基；和(c)在对应于SEQ ID NO:1的位置80的位置处的Q或。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:246-247中任一项的残基19、80、82和139的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:246-247中任一项的残基19、77、80的残基。

在所述方法的一些实施方式中，中心序列由TTGG组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置50的位置处的R残基；(b)在对应于SEQ ID NO:1的位置71的位置处的S残基；(c)在对应于SEQ ID NO:1的位置72的位置处的G残基；和(d)在对应于SEQ ID NO:1的位置73的位置处的R残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、T、E、K或残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G或K残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、Q、K、R、H、A或S残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:250-266中任一项的残基50、71、72和73的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:250-266中任一项的残基239、241、262、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；和(b)在对应于SEQ IDNO:1的位置80的位置处的Q残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的G或A残基；(b)在对应于SEQ IDNO:1的位置66的位置处的Y或H残基；(c)在对应于SEQ ID NO:1的位置480的位置处的Q残基；(d)在对应于SEQ ID NO:1的位置85的位置处的H或R残基；和(e)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:250-266中任一项的残基19和80的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:250-266中任一项的残基19、66、80、85和139的残基。

在所述方法的一些实施方式中，中心序列由GCAA组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K或H残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、C、K、T或L残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、N、T、R、S或H残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、P、S、N、Q、G、A、T、M或V残基；(e)在对应于SEQ ID NO:1的位置73的位置处的T或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、C或A残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的S、A、K或T残基；(b)在对应于SEQ IDNO:1的位置50的位置处的R、C、T、K或E残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、A或H残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、G、S、A、E、N、K、H、R、C或Y残基；(e)在对应于SEQ ID NO:1的位置73的位置处的C、V或I残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:269-291中任一项的残基48、50、71、72、73和74的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:269-291中任一项的残基239、241、262、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的G或A残基；(b)在对应于SEQ IDNO:1的位置31的位置处的Q或P残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:269-291中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:269-291中任一项的残基19、31、80和139的残基。

在所述方法的一些实施方式中，中心序列由GCAT组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、A、H或R残基；(b)在对应于SEQ IDNO:1的位置50的位置处的Q、V、R、K或S残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、A、H、R、T、N或S残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、T、G、S、Q、N或A残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、T、V或C残基；和(f)在对应于SEQ IDNO:1的位置74的位置处的S或A残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的H、A、K、T、L或I残基；(b)在对应于SEQ ID NO:1的位置50的位置处的S、R、K、Q、H或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的S、K、R、A、G、T、H或Y残基；(d)在对应于SEQ ID NO:1的位置72的位置处的T、A、G、N、S、R、H、Q或K残基；(e)在对应于SEQ ID NO:1的位置73的位置处的H、C、G、S或A残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、C或A残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:294-313中任一项的残基48、50、71、72、73和74的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:294-313中任一项的残基239、241、262、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或G残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置139的位置处的K、H或R残基；和(d)在对应于SEQ ID NO:1的位置143的位置处的T或I残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的G、S或A残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；(c)在对应于SEQ ID NO:1的位置125的位置处的V或A残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的K、R或H残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:294-313中任一项的残基19、80、139和143的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:294-313中任一项的残基19、80、125和139的残基。

在所述方法的一些实施方式中，中心序列由GCGA组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置50的位置处的K或R残基；(b)在对应于SEQ ID NO:1的位置71的位置处的G、R、S、A或N残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R、N、G、A或Q残基；(d)在对应于SEQ ID NO:1的位置73的位置处的V、T或I残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、T、S、A或Q残基；(b)在对应于SEQID NO:1的位置50的位置处的C或R残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R残基；(d)在对应于SEQ ID NO:1的位置73的位置处的V或I残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:316-325中任一项的残基50、71、72、73和74的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:316-325中任一项的残基239、241、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的G、S或A残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:316-325中任一项的残基19和80的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:316-325中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，中心序列由GCAG组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置50的位置处的R残基；(b)在对应于SEQ ID NO:1的位置71的位置处的S残基；(c)在对应于SEQ ID NO:1的位置72的位置处的G残基；(d)在对应于SEQ ID NO:1的位置73的位置处的残基；和

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K或H残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q或R残基；和(c)在对应于SEQ ID NO:1的位置72的位置处的S或R残基；

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:328-330中任一项的残基50、71、72、73和74的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:328-330中任一项的残基239、241、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以在对应于SEQ IDNO:1的位置80的位置处包含Q或E残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:328-330中任一项的残基80的残基。

在所述方法的一些实施方式中，中心序列由TCAA组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、T或C残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R或T残基；和(d)在对应于SEQ ID NO:1的位置72的位置处的R、S、P、T或G残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的S或K残基；(b)在对应于SEQ ID NO:1的位置50的位置处的K、R、C或E残基；(c)在对应于SEQ ID NO:1的位置72的位置处的R、Q、N或S残基；(d)在对应于SEQ ID NO:1的位置73的位置处的I残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:333-340中任一项的残基48、50、71和72的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:333-340中任一项的残基239、241、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或S残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的G或S残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:333-340中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:333-340中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，中心序列由TTAA组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、N、S或R残基；(b)在对应于SEQ IDNO:1的位置50的位置处的R、V、K或S残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、N、S或A残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、T、S、N、D、Q、K或A残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、S、A或T残基；(b)在对应于SEQ IDNO:1的位置50的位置处的C、K、R、T或E残基；(c)在对应于SEQ ID NO:1的位置72的位置处的T、K、R、A、S或Q残基；(d)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(e)在对应于SEQ ID NO:1的位置74的位置处的S或A残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:343-357中任一项的残基48、50、71、72和74的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:343-357中任一项的残基239、241、263、264和265的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A、G或S残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的G、A或S残基；(b)在对应于SEQ IDNO:1的位置66的位置处的Y或H残基；(c)在对应于SEQ ID NO:1的位置80的位置处的Q残基；和(d)在对应于SEQ ID NO:1的位置139的位置处的R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:343-357中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，对第二亚基进行修饰以包含对应于SEQ ID NO:343-357中任一项的残基19、66、80和139的残基。

另一个方面是一种工程化大范围核酸酶，所述工程化大范围核酸酶结合并切割包含中心序列的识别序列，所述中心序列由GTAA、GTAG、GTAT、GTGA、GTGC、GTGG或GTGT组成，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基包含衍生自SEQID NO:1的氨基酸序列，并且其中所述第一亚基在对应于SEQ ID NO:1的位置48、50、71、72、73和74的一个或多个位置处包含置换。

在一些实施方式中，中心序列由GTAA组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、S、A、R、N或T残基；(b)在对应于SEQ ID NO:1的位50的位置处的T、R、A、K或C残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、S、T、A、N、H或K残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、S、C、N、K、A、H、G、T、D、Y、P或Q残基；(e)在对应于SEQ ID NO:1的位置73的位置处的V、C、I或T残基；和(f)在对应于SEQ IDNO:1的位置74的位置处的S、A或T残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:360-389中任一项的残基48、50、71、72、73和74的残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:360-389中任一项的残基19、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由GTAA组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由GTAG组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置50的位置处的R或C残基；(b)在对应于SEQ ID NO:1的位置71的位置处的S或D残基；(c)在对应于SEQ ID NO:1的位置72的位置处的G或N残基；和(d)在对应于SEQID NO:1的位置473的位置处的R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:392-399中任一项的残基50、71、72和73的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或S残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:392-399中任一项的残基19、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由GTAG组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由GTAT组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、G、T、A、M、H、S、L或R残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、V、R、S、T、G、K、C或L残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、T、A、K、H、R、Y、L、S或N残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、K、S、Y、N、T、G、W、H或A残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、S或T残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或C残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:402-433中任一项的残基48、50、71、72、73和74的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或S残基；(b)在对应于SEQ ID NO:1的位置180的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K、R、T或H残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:402-433中任一项的残基19、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由GTAT组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由GTGA组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、A、G、R、S或H残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、V、C或S残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、V、S、A、T、N、D或H残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、T、S、G、H、K或Y残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、V或T残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、T、A或G残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:436-462中任一项的残基48、50、71、72、73和74的残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:436-462中任一项的残基19、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由GTGA组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由GTGC组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、L、H、A、R、N或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、S、V、K、I或G残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、S、N、I、R、A、E、Q、Y、T、K、F或V残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、K、G、H、P、S、C、N、T、A、M、D或Q残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、V、T、N、C或L残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:465-495中任一项的残基48、50、71、72、73和74的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A或S残基；(b)在对应于SEQ ID NO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K、T、S、R、H或V残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:465-495中任一项的残基19、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由GTGC组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由GTGG组成。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:498-501中任一项的残基50、71、72和73的残基。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置19的位置处的A残基；(b)在对应于SEQ ID NO:1的位置62的位置处的I残基；和(c)在对应于SEQ ID NO:1的位置80的位置处的Q残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:498-501中任一项的残基19、62和80的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由GTGG组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

在一些实施方式中，中心序列由GTGT组成。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、S、L、V、G、R或N残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、V、R、S、K、A、E或C残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、N、H、A或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、P、A、Q、K、T、G或V残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、S、C或T残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:504-529中任一项的残基48、50、71、72、73和74的残基。

在一些实施方式中，所述第一亚基包含对应于SEQ ID NO:504-529中任一项的残基19、80和139的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，所述识别序列包含由GTGT组成的中心序列，所述方法包括将具有靶位点的双链DNA与本文所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

另一个方面是一种用于增加工程化大范围核酸酶的切割活性的方法，所述工程化大范围核酸酶结合并切割包含中心序列的识别序列，所述中心序列由GTAA、GTAG、GTAT、GTGA、GTGC、GTGG或GTGT组成，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基包含衍生自SEQ ID NO:1的氨基酸序列，所述方法包括在对应于SEQ IDNO:1的位置48、50、71、72、73和74的一个或多个位置处修饰所述第一亚基，其中当与对照工程化大范围核酸酶比较时，所述修饰的核酸酶具有增加的切割活性。

在所述方法的一些实施方式中，中心序列由GTAA组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、S、A、R、N或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的T、R、A、K或C残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、S、T、A、N、H或K残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、S、C、N、K、A、H、G、T、D、Y、P或Q残基；(e)在对应于SEQ ID NO:1的位置473的位置处的V、C、I或T残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:360-389中任一项的残基48、50、71、72、73和74的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第二亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或S残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，中心序列由GTAG组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置50的位置处的R或C残基；(b)在对应于SEQ ID NO:1的位置71的位置处的S或D残基；(c)在对应于SEQ ID NO:1的位置72的位置处的G或N残基；和(d)在对应于SEQ ID NO:1的位置73的位置处的R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:392-399中任一项的残基50、71、72和73的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或S残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K或R残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:392-399中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:360-389中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，中心序列由GTAT组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、G、T、A、M、H、S、L或R残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、V、R、S、T、G、K、C或L残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、T、A、K、H、R、Y、L、S或N残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、K、S、Y、N、T、G、W、H、A残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、S或T残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或C残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:402-433中任一项的残基48、50、71、72、73和74的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或S残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K、R、T或H残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:402-433中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，中心序列由GTGA组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、A、G、R、S或H残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、V、C或S残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、V、S、A、T、N、D或H残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、T、S、G、H、K或Y残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、V或T残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、T、A或G残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:436-462中任一项的残基48、50、71、72、73和74的残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:436-462中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，中心序列由GTGC组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、L、H、A、R、N或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的R、S、V、K、I或G残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、S、N、I、R、A、E、Q、Y、T、K、F或V残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、K、G、H、P、S、C、N、T、A、M、D或Q残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、V、T、N、C或L残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:465-495中任一项的残基48、50、71、72、73和74的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A或S残基；(b)在对应于SEQ IDNO:1的位置80的位置处的Q或E残基；和(c)在对应于SEQ ID NO:1的位置139的位置处的K、T、S、R、H或V残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:465-495中任一项的残基19、80和139的残基。

在所述方法的一些实施方式中，中心序列由GTGG组成。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:498-501中任一项的残基50、71、72和73的残基。

在所述方法的一些实施方式中，所述方法还包括修饰第一亚基以包含一个或多个下述残基：(a)在对应于SEQ ID NO:1的位置19的位置处的A残基；(b)在对应于SEQ ID NO:1的位置62的位置处的I残基；和(c)在对应于SEQ ID NO:1的位置80的位置处的Q残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:498-501中任一项的残基19、62和80的残基。

在所述方法的一些实施方式中，中心序列由GTGT组成。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、S、L、V、G、R或N残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q、V、R、S、K、A、E或C残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、N、H、A或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的R、P、A、Q、K、T、G或V残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、S、C或T残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S、A或T残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:504-529中任一项的残基48、50、71、72、73和74的残基。

在所述方法的一些实施方式中，对第一亚基进行修饰以包含对应于SEQ ID NO:504-529中任一项的残基19、80和139的残基。

另一个方面是一种I-CreI衍生的工程化大范围核酸酶，所述工程化大范围核酸酶结合并切割包含中心序列的识别序列，所述中心序列由ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTAA组成，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQ ID NO:1的氨基酸序列，并且其中第一亚基和第二亚基各自在对应于SEQID NO:1的位置48、50、71、72、73和74的一个或多个位置处包含置换。

另一个方面是一种改良的工程化I-CreI衍生的大范围核酸酶，所述工程化大范围核酸酶结合并切割包含中心序列的识别序列，所述中心序列由ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTA组成，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQ ID NO:1的氨基酸序列，改良包含改善工程化I-CreI衍生的大范围核酸酶针对识别序列的切割活性的本文所述的任何氨基酸置换，所述识别序列包含ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTAA中心序列。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、D、G、H、I、K、L、N、Q、R、S或T残基；(b)在对应于SEQ IDNO:1的位置50的位置处的A、C、D、E、G、I、K、L、N、Q、R、S、T、V或W残基；(c)在对应于SEQ IDNO:1的位置71的位置处的A、C、G、H、I、K、N、P、R、S或T残基；(d)在对应于SEQID NO:1的位置72的位置处的A、D、G、H、K、L、M、N、P、Q、R、S、T或V残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、I、S、T或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A、C、T或S残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、I、K、L、N、Q、R、S或T残基；(b)在对应于SEQ IDNO:1的位置50的位置处的A、C、E、G、H、I、K、N、P、Q、R、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、D、E、G、H、I、K、N、P、Q、R、S、T或Y残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、C、E、G、H、I、K、M、N、P、Q、R、S、T、V或Y残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、H、I、R、S、T或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A、C、S或T残基。

在一些实施方式中，中心序列由ACAA、ACAG、ACAT、ACGC、ACGG或ACGT组成，其中第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、I、K、L、N、Q或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、K、Q、R、S、T、V或W残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、G、P或R残基；(d)在对应于SEQID NO:1的位置72的位置处的H、K、P、Q、R或T残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S残基。

在一些实施方式中，中心序列由ATAA、ATAG、ATAT、ATGA、ATGG组成，其中第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、D、G、H、K、L、N、Q、S或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、D、E、G、I、K、N、R、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、H、I、K、N、R或S残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、G、H、K、L、N、P、Q、R、S或T残基；(e)在对应于SEQ IDNO:1的位置73的位置处的A、C、S或T残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A、C或S残基。

在一些实施方式中，中心序列由GCAA、GCAT、GCGA或GCAG组成，其中第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的A、H、K或R残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、K、L、Q、R、S、T或V残基；(c)在对应于SEQID NO:1的位置71的位置处的A、G、H、N、R、S或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、G、H、M、N、P、Q、R、S、T或V残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、I、T或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A或S残基。

在一些实施方式中，中心序列由TTGG或TTAA组成，其中第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K、N、R或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、E、K、R、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、G、K、N、R或S残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、D、H、K、N、Q、R、S或T残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

在一些实施方式中，中心序列由TCAA组成，其中第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的A、G、H、K、N、Q、R或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、R、S或T残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、S或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的G、H、P、R、S或T残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A或S残基。

在一些实施方式中，中心序列由ACAA、ACAG、ACAT、ACGC、ACGG或ACGT组成，其中第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、K、L、N、Q、R、S或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、G、H、K、L、N、Q、R、S或残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、D、E、G、H、K、N、P、R、S或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、G、H、K、M、N、P、P、Q、R、S或T残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、H、I、R、S、T或V残基；(f)任选地，在紧随对应于SEQ ID NO:1的位置73的位置之后的位置(73B)处的R残基；和(g)在对应于SEQ ID NO:1的位置74的位置处的A、C、S或T残基。

在一些实施方式中，中心序列由ATAA、ATAG、ATAT、ATGA或ATGG组成，其中第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、K、N、Q、R、S或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、E、I、K、N、Q、R、S或T残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、C、E、I、K、N、Q、R、S或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、G、H、K、N、Q、R、S、T、V或Y残基；(e)在对应于SEQ IDNO:1的位置73的位置处的A、C、G、H、I、R、S或V残基；(f)任选地，在紧随对应于SEQ ID NO:1的位置73的位置之后的位置(73B)处的R残基；和(g)在对应于SEQ ID NO:1的位置74的位置处的A、C、S或T残基。

在一些实施方式中，中心序列由GCAA、GCAT、GCGA或GCAG组成，其中第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、I、K、L、N、Q、R、S或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、E、H、K、Q、R、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、G、H、K、R、S、T或Y残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、C、E、G、H、K、N、Q、R、S、T或残基；(e)在对应于SEQ IDNO:1的位置73的位置处的A、C、G、H、I、R、S或残基；和(f)在对应于SEQ ID NO:1的位置474的位置处的A、S或T残基。

在一些实施方式中，中心序列由TTGG或TTAA组成，其中第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的A、K、S或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、E、K、R或T残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、D、G、K、Q、R、S或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的G、I、R、S、T或V残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I、R或V残基；和(f)在对应于SEQID NO:1的位置74的位置处的A、S或T残基。

在一些实施方式中，中心序列由TCAA组成，其中第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、K、R或T残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的G、P、R、S或T残基；(e)在对应于SEQID NO:1的位置73的位置处的I或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

在一些实施方式中，(a)中心序列是ACAA和第一亚基包含对应于SEQ ID NO:11-33中任一项的残基48、50、71、72、73和74的残基，(b)中心序列是ACAG和第一亚基包含对应于SEQ ID NO:36-43中任一项的残基48、50、71、72、73和74的残基，(c)中心序列是ACAT和第一亚基包含对应于SEQ ID NO:46-47中任一项的残基48、50、71、72、73和74的残基，(d)中心序列是ACGA和第一亚基包含对应于SEQ ID NO:70-89中任一项的残基48、50、71、72、73和74的残基，(e)中心序列是ACGC和第一亚基包含对应于SEQ ID NO:92-118中任一项的残基48、50、71、72、73和74的残基，(f)中心序列是ACGG和第一亚基包含对应于SEQ ID NO:121-135中任一项的残基48、50、71、72、73和74的残基，(g)中心序列是ACGT和第一亚基包含对应于SEQ ID NO:138-156中任一项的残基48、50、71、72、73和74的残基，(h)中心序列是ATAA和第一亚基包含对应于SEQ ID NO:159-183中任一项的残基48、50、71、72、73和74的残基，(i)中心序列是ATAG和第一亚基包含对应于SEQ ID NO:186-199中任一项的残基48、50、71、72、73和74的残基，(j)中心序列是ATAT和第一亚基包含对应于SEQ ID NO:202-219中任一项的残基48、50、71、72、73和74的残基，(k)中心序列是ATGA和第一亚基包含对应于SEQ ID NO:222-243中任一项的残基48、50、71、72、73和74的残基，(l)中心序列是ATGG和第一亚基包含对应于SEQ ID NO:246-247中任一项的残基48、50、71、72、73和74的残基，(m)中心序列是TTGG和第一亚基包含对应于SEQ ID NO:250-266中任一项的残基48、50、71、72、73和74的残基，(n)中心序列是GCAA和第一亚基包含对应于SEQ ID NO:269-291中任一项的残基48、50、71、72、73和74的残基，(o)中心序列是GCAT和第一亚基包含对应于SEQ ID NO:294-313中任一项的残基48、50、71、72、73和74的残基，(p)中心序列是GCGA和第一亚基包含对应于SEQID NO:316-325中任一项的残基48、50、71、72、73和74的残基，(q)中心序列是GCAG和第一亚基包含对应于SEQ ID NO:328-330中任一项的残基48、50、71、72、73和74的残基，(r)中心序列是TCAA和第一亚基包含对应于SEQ ID NO:333-340中任一项的残基48、50、71、72、73和74的残基，或(s)中心序列是TTAA和第一亚基包含对应于SEQ ID NO:343-357中任一项的残基48、50、71、72、73和74的残基

在一些实施方式中，(a)中心序列是ACAA和第二亚基包含对应于SEQ ID NO:11-33中任一项的残基48、50、71、72、73和74的残基，(b)中心序列是ACAG和第二亚基包含对应于SEQ ID NO:36-43中任一项的残基48、50、71、72、73和74的残基，(c)中心序列是ACAT和第二亚基包含对应于SEQ ID NO:46-67中任一项的残基48、50、71、72、73和74的残基，(d)中心序列是ACGA和第二亚基包含对应于SEQ ID NO:70-89中任一项的残基48、50、71、72、73和74的残基，(e)中心序列是ACGC和第二亚基包含对应于SEQ ID NO:92-118中任一项的残基48、50、71、72、73和74的残基，(f)中心序列是ACGG和第二亚基包含对应于SEQ ID NO:121-135中任一项的残基48、50、71、72、73和74的残基，(g)中心序列是ACGT和第二亚基包含对应于SEQ ID NO:138-156中任一项的残基48、50、71、72、73和74的残基，(h)中心序列是ATAA和第二亚基包含对应于SEQ ID NO:159-183中任一项的残基48、50、71、72、73和74的残基，(i)中心序列是ATAG和第二亚基包含对应于SEQ ID NO:186-199中任一项的残基48、50、71、72、73和74的残基，(j)中心序列是ATAT和第二亚基包含对应于SEQ ID NO:202-219中任一项的残基48、50、71、72、73和74的残基，(k)中心序列是ATGA和第二亚基包含对应于SEQ ID NO:222-243中任一项的残基48、50、71、72、73和74的残基，(l)中心序列是ATGG和第二亚基包含对应于SEQ ID NO:246-247中任一项的残基48、50、71、72、73和74的残基，(m)中心序列是TTGG和第二亚基包含对应于SEQ ID NO:250-266中任一项的残基48、50、71、72、73和74的残基，(n)中心序列是GCAA和第二亚基包含对应于SEQ ID NO:269-291中任一项的残基48、50、71、72、73和74的残基，(o)中心序列是GCAT和第二亚基包含对应于SEQ ID NO:294-313中任一项的残基48、50、71、72、73和74的残基，(p)中心序列是GCGA和第二亚基包含对应于SEQID NO:316-325中任一项的残基48、50、71、72、73和74的残基，(q)中心序列是GCAG和第二亚基包含对应于SEQ ID NO:328-330中任一项的残基48、50、71、72、73和74的残基，(r)中心序列是TCAA和第二亚基包含对应于SEQ ID NO:333-340中任一项的残基48、50、71、72、73和74的残基，或(s)中心序列是TTAA和第二亚基包含对应于SEQ ID NO:343-357中任一项的残基48、50、71、72、73和74的残基。

另一个方面是一种用于在靶位点切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，其中所述识别序列包含由以下组成的中心序列：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTAA，其中所述方法包括使具有靶位点的双链DNA与本文所述的任何工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

另一个方面是一种用于在靶位点处切割双链DNA的改良的方法，所述靶位点包含大范围核酸酶识别序列，所述方法通过使具有所述靶位点的所述双链DNA与工程化I-CreI衍生的大范围核酸酶接触，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQ ID NO:1的氨基酸序列，其中所述识别序列包含由以下组成的中心序列：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTAA，所述改良包括：使用本文所述的工程化I-CreI衍生的大范围核酸酶，其中所述工程化I-CreI衍生的大范围核酸酶结合并切割所述识别序列。

另一个方面是一种用于增加结合并切割识别序列的I-CreI工程化大范围核酸酶的切割活性的方法，所述识别序列包含由以下组成的中心序列：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTAA，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQ ID NO:1的氨基酸序列，所述方法包括在对应于SEQ ID NO:1的位置48、50、71、72、73和74的一个或多个位置处修饰第一亚基和第二亚基中的每一个，其中当与对照工程化大范围核酸酶相比修饰的核苷酸具有增加的切割活性。

另一个方面是一种用于增加结合并切割识别序列的工程化I-CreI衍生的大范围核酸酶的切割活性的改良的方法，所述识别序列包含由以下组成的中心序列：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTAA，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQ ID NO:1的氨基酸序列，改良包含使用本文所述的工程化I-CreI衍生的大范围核酸酶，其中所述工程化I-CreI衍生的大范围核酸酶结合并切割所述识别序列。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、D、G、H、I、K、L、N、Q、R、S或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、D、E、G、I、K、L、N、Q、R、S、T、V或W残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、C、G、H、I、K、N、P、R、S或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、D、G、H、K、L、M、N、P、Q、R、S、T或V残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、I、S、T或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A、C、T或S残基。

在所述方法的一些实施方式中，修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、I、K、L、N、Q、R、S或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、E、G、H、I、K、N、P、Q、R、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、D、E、G、H、I、K、N、P、Q、R、S、T或Y残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、C、E、G、H、I、K、M、N、P、Q、R、S、T、V或Y残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、H、I、R、S、T或V残基；和(f)在对应于SEQ IDNO:1的位置74的位置处的A、C、S或T残基。

在所述方法的一些实施方式中，中心序列由ACAA、ACAG、ACAT、ACGC、ACGG或ACGT组成，并且其中修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ IDNO:1的位置48的位置处的A、C、G、H、I、K、L、N、Q或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、K、Q、R、S、T、V或W残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、G、P或R残基；(d)在对应于SEQ ID NO:1的位置72的位置处的H、K、P、Q、R或T残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S残基。

在所述方法的一些实施方式中，中心序列由ATAA、ATAG、ATAT、ATGA或ATGG组成，并且其中修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、D、G、H、K、L、N、Q、S或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、D、E、G、I、K、N、R、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的aG、H、I、K、N、R或S残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、G、H、K、L、N、P、Q、R、S或T残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、S或T残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A、C或S残基。

在所述方法的一些实施方式中，中心序列由GCAA、GCAT、GCGA或GCAG组成，并且其中修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的A、H、K或R残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、K、L、Q、R、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、G、H、N、R、S或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、G、H、M、N、P、Q、R、S、T或V残基；(e)在对应于SEQ IDNO:1的位置73的位置处的A、C、I、T或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A或S残基。

在所述方法的一些实施方式中，中心序列由TTGG或TTAA组成，并且其中修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K、N、R或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、E、K、R、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、G、K、N、R或S残基；(d)在对应于SEQ IDNO:1的位置72的位置处的A、D、H、K、N、Q、R、S或T残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

在所述方法的一些实施方式中，中心序列由TCAA组成，并且其中修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的A、G、H、K、N、Q、R或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、R、S或T残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、S或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的G、H、P、R、S或T残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A或S残基。

在所述方法的一些实施方式中，中心序列由ACAA、ACAG、ACAT、ACGC、ACGG或ACGT组成，并且其中修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ IDNO:1的位置48的位置处的A、C、G、H、K、L、N、Q、R、S或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、G、H、K、L、N、Q、R、S或T残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、D、E、G、H、K、N、P、R、S或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、G、H、K、M、N、P、P、Q、R、S或T残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、H、I、R、S、T或V残基；(f)任选地，在紧随对应于SEQ ID NO:1的位置73的位置之后的位置(73B)处的R残基；和(g)在对应于SEQ ID NO:1的位置74的位置处的A、C、S或T残基。

在所述方法的一些实施方式中，中心序列由ATAA、ATAG、ATAT、ATGA或ATGG组成，并且其中修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、K、N、Q、R、S或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、E、I、K、N、Q、R、S或T残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、C、E、I、K、N、Q、R、S或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、G、H、K、N、Q、R、S、T、V或Y残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、H、I、R、S或V残基；(f)任选地，在紧随对应于SEQ ID NO:1的位置73的位置之后的位置(73B)处的R残基；和(g)在对应于SEQ ID NO:1的位置74的位置处的A、C、S或T残基。

在所述方法的一些实施方式中，中心序列由GCAA、GCAT、GCGA或GCAG组成，并且其中修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、I、K、L、N、Q、R、S或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、E、H、K、Q、R、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、G、H、K、R、S、T或Y残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、C、E、G、H、K、N、Q、R、S、T或Y残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、H、I、R、S或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

在所述方法的一些实施方式中，中心序列由TTGG或TTAA组成，并且其中修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的A、K、S或T残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、E、K、R或T残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、D、G、K、Q、R、S或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的G、I、R、S、T或V残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I、R或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

在所述方法的一些实施方式中，中心序列由TCAA组成，并且其中修饰步骤包括修饰第二亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的K或S残基；(b)在对应于SEQ ID NO:1的位置50的位置处的C、K、R或T残基；(c)在对应于SEQID NO:1的位置71的位置处的G、R或T残基；(d)在对应于SEQ ID NO:1的位置72的位置处的G、P、R、S或T残基；(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

在所述方法的一些实施方式中：(a)中心序列是ACAA和第一亚基包含对应于SEQID NO:11-33中任一项的残基48、50、71、72、73和74的残基，(b)中心序列是ACAG和第一亚基包含对应于SEQ ID NO:36-43中任一项的残基48、50、71、72、73和74的残基，(c)中心序列是ACAT和第一亚基包含对应于SEQ ID NO:46-67中任一项的残基48、50、71、72、73和74的残基，(d)中心序列是ACGA和第一亚基包含对应于SEQ ID NO:70-89中任一项的残基48、50、71、72、73和74的残基，(e)中心序列是ACGC和第一亚基包含对应于SEQ ID NO:92-118中任一项的残基48、50、71、72、73和74的残基，(f)中心序列是ACGG和第一亚基包含对应于SEQID NO:121-135中任一项的残基48、50、71、72、73和74的残基，(g)中心序列是ACGT和第一亚基包含对应于SEQ ID NO:138-156中任一项的残基48、50、71、72、73和74的残基，(h)中心序列是ATAA和第一亚基包含对应于SEQ ID NO:159-183中任一项的残基48、50、71、72、73和74的残基，(i)中心序列是ATAG和第一亚基包含对应于SEQ ID NO:186-199中任一项的残基48、50、71、72、73和74的残基，(j)中心序列是ATAT和第一亚基包含对应于SEQ ID NO:202-219中任一项的残基48、50、71、72、73和74的残基，(k)中心序列是ATGA和第一亚基包含对应于SEQ ID NO:222-243中任一项的残基48、50、71、72、73和74的残基，(l)中心序列是ATGG和第一亚基包含对应于SEQ ID NO:246-247中任一项的残基48、50、71、72、73和74的残基，(m)中心序列是TTGG和第一亚基包含对应于SEQ ID NO:250-266中任一项的残基48、50、71、72、73和74的残基，(n)中心序列是GCAA和第一亚基包含对应于SEQ ID NO:269-291中任一项的残基48、50、71、72、73和74的残基，(o)中心序列是GCAT和第一亚基包含对应于SEQ ID NO:294-313中任一项的残基48、50、71、72、73和74的残基，(p)中心序列是GCGA和第一亚基包含对应于SEQ ID NO:316-325中任一项的残基48、50、71、72、73和74的残基，(q)中心序列是GCAG和第一亚基包含对应于SEQ ID NO:328-330中任一项的残基48、50、71、72、73和74的残基，(r)中心序列是TCAA和第一亚基包含对应于SEQ ID NO:333-340中任一项的残基48、50、71、72、73和74的残基，或(s)中心序列是TTAA和第一亚基包含对应于SEQ ID NO:343-357中任一项的残基48、50、71、72、73和74的残基。

在所述方法的一些实施方式中：(a)中心序列是ACAA和第二亚基包含对应于SEQID NO:11-33中任一项的残基48、50、71、72、73和74的残基，(b)中心序列是ACAG和第二亚基包含对应于SEQ ID NO:36-43中任一项的残基48、50、71、72、73和74的残基，(c)中心序列是ACAT和第二亚基包含对应于SEQ ID NO:46-67中任一项的残基48、50、71、72、73和74的残基，(d)中心序列是ACGA和第二亚基包含对应于SEQ ID NO:70-89中任一项的残基48、50、71、72、73和74的残基，(e)中心序列是ACGC和第二亚基包含对应于SEQ ID NO:92-118中任一项的残基48、50、71、72、73和74的残基，(f)中心序列是ACGG和第二亚基包含对应于SEQID NO:121-135中任一项的残基48、50、71、72、73和74的残基，(g)中心序列是ACGT和第二亚基包含对应于SEQ ID NO:138-156中任一项的残基48、50、71、72、73和74的残基，(h)中心序列是ATAA和第二亚基包含对应于SEQ ID NO:159-183中任一项的残基48、50、71、72、73和74的残基，(i)中心序列是ATAG和第二亚基包含对应于SEQ ID NO:186-199中任一项的残基48、50、71、72、73和74的残基，(j)中心序列是ATAT和第二亚基包含对应于SEQ ID NO:202-219中任一项的残基48、50、71、72、73和74的残基，(k)中心序列是ATGA和第二亚基包含对应于SEQ ID NO:222-243中任一项的残基48、50、71、72、73和74的残基，(l)中心序列是ATGG和第二亚基包含对应于SEQ ID NO:246-247中任一项的残基48、50、71、72、73和74的残基，(m)中心序列是TTGG和第二亚基包含对应于SEQ ID NO:250-266中任一项的残基48、50、71、72、73和74的残基，(n)中心序列是GCAA和第二亚基包含对应于SEQ ID NO:269-291中任一项的残基48、50、71、72、73和74的残基，(o)中心序列是GCAT和第二亚基包含对应于SEQ ID NO:294-313中任一项的残基48、50、71、72、73和74的残基，(p)中心序列是GCGA和第二亚基包含对应于SEQ ID NO:316-325中任一项的残基48、50、71、72、73和74的残基，(q)中心序列是GCAG和第二亚基包含对应于SEQ ID NO:328-330中任一项的残基48、50、71、72、73和74的残基，(r)中心序列是TCAA和第二亚基包含对应于SEQ ID NO:333-340中任一项的残基48、50、71、72、73和74的残基，或(s)中心序列是TTAA和第二亚基包含对应于SEQ ID NO:343-357中任一项的残基48、50、71、72、73和74的残基。

另一个方面是一种对识别序列具有特异性的I-CreI衍生的工程化大范围核酸酶，所述识别序列包含由以下组成的中心序列：GTAA、GTAG、GTAT、GTGA、GTGC、GTGG或GTGT，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中第一亚基包含衍生自SEQ ID NO:1的氨基酸序列，并且其中第一亚基包含在对应于SEQ ID NO:1的位置48、50、71、72、73和74的一个或多个位置处的置换。

另一个方面是一种改良的工程化I-CreI衍生的大范围核酸酶，其结合并切割包含由以下组成的中心序列的识别序列：GTAA、GTAG、GTAT、GTGA、GTGC、GTGG或GTGT，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQ ID NO:1的氨基酸序列，改良包含改善GTAA、GTAG、GTAT、GTGA、GTGC、GTGG或GTGT中心序列的切割活性的本文所述的任何氨基酸置换。

在一些实施方式中，所述第一亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、K、L、M、N、Q、R、S、T或V残基；(b)在对应于SEQ IDNO:1的位置50的位置处的A、C、E、G、I、K、L、Q、R、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、D、E、F、G、H、I、K、L、N、Q、R、S、T、V或Y残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、C、D、G、H、K、M、N、P、Q、R、S、T、V、W或Y残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、I、L、N、R、S、T或V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的A、C、G、S或T残基。

在一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G残基；(d)在对应于SEQ ID NO:1的位置72的位置处的S残基；(e)在对应于SEQ ID NO:1的位置73的位置处的V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S残基。

在一些实施方式中，(a)中心序列是GTAA和第一亚基包含对应于SEQ ID NO:360-389中任一项的残基48、50、71、72、73和74的残基，(b)中心序列是GTAG和第一亚基包含对应于SEQ ID NO:392-399中任一项的残基48、50、71、72、73和74的残基，(c)中心序列是GTAT和第一亚基包含对应于SEQ ID NO:402-433中任一项的残基48、50、71、72、73和74的残基，(d)中心序列是GTGA和第一亚基包含对应于SEQ ID NO:436-462中任一项的残基48、50、71、72、73和74的残基，(e)中心序列是GTGC和第一亚基包含对应于SEQ ID NO:465-495中任一项的残基48、50、71、72、73和74的残基，(f)中心序列是GTGG和第一亚基包含对应于SEQ ID NO:498-501中任一项的残基48、50、71、72、73和74的残基，或(g)中心序列是GTGT和第一亚基包含对应于SEQ ID NO:504-529中任一项的残基48、50、71、72、73和74的残基。

另一个方面是一种用于在靶位点处切割双链DNA的方法，所述靶位点包含大范围核酸酶识别序列，其中所述识别序列包含由以下组成的中心序列：GTAA、GTAG、GTAT、GTGA、GTGC、GTGG或GTGT，其中所述方法包括使具有靶位点的双链DNA与本文所述的任何工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割识别序列。

另一个方面是一种用于在靶位点处切割双链DNA的改良的方法，所述靶位点包含大范围核酸酶识别序列，所述方法通过使具有所述靶位点的所述双链DNA与工程化I-CreI衍生的大范围核酸酶接触，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQ ID NO:1的氨基酸序列，其中所述识别序列包含由以下组成的中心序列：GTAA、GTAG、GTAT、GTGA、GTGC、GTGG或GTGT，改良包括：使用本文所述的工程化I-CreI衍生的大范围核酸酶，其中所述工程化I-CreI衍生的大范围核酸酶结合并切割所述识别序列。

另一个方面是一种用于增加结合并切割识别序列的I-CreI衍生的工程化大范围核酸酶的切割活性的方法，所述识别序列包含由以下组成的中心序列：GTAA、GTAG、GTAT、GTGA、GTGC、GTGG或GTGT，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中第一亚基包含衍生自SEQ ID NO:1的氨基酸序列，所述方法包括在对应于SEQ ID NO:1的位置48、50、71、72、73和74的一个或多个位置处修饰第一亚基，其中与对照工程化大范围核酸酶相比修饰的核酸酶具有增加的切割活性。

另一个方面是一种用于增加结合并切割识别序列的工程化大范围核酸酶的切割活性的改良的方法，所述识别序列包含由以下组成的中心序列：GTAA、GTAG、GTAT、GTGA、GTGC、GTGG或GTGT，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQ ID NO:1的氨基酸序列，改良包括使用本文所述的工程化I-CreI衍生的大范围核酸酶，其中所述工程化I-CreI衍生的大范围核酸酶结合并切割所述识别序列。

在所述方法的一些实施方式中，修饰步骤包括修饰第一亚基以包含一个或多个以下残基：(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、K、L、M、N、Q、R、S、T或V残基；(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、E、G、I、K、L、Q、R、S、T或V残基；(c)在对应于SEQ ID NO:1的位置71的位置处的A、D、E、F、G、H、I、K、L、N、Q、R、S、T、V或Y残基；(d)在对应于SEQ ID NO:1的位置72的位置处的A、C、D、G、H、K、M、N、P、Q、R、S、T、V、W或Y残基；(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、I、L、N、R、S、T或V残基；和(f)在对应于SEQ IDNO:1的位置74的位置处的A、C、G、S或T残基。

在所述方法的一些实施方式中，所述第二亚基包含下述残基中的一个或多个：(a)在对应于SEQ ID NO:1的位置48的位置处的K残基；(b)在对应于SEQ ID NO:1的位置50的位置处的Q残基；(c)在对应于SEQ ID NO:1的位置71的位置处的G残基；(d)在对应于SEQ IDNO:1的位置72的位置处的S残基；(e)在对应于SEQ ID NO:1的位置73的位置处的V残基；和(f)在对应于SEQ ID NO:1的位置74的位置处的S残基。

在所述方法的一些实施方式中：(a)中心序列是GTAA和第一亚基包含对应于SEQID NO:360-389中任一项的残基48、50、71、72、73和74的残基，(b)中心序列是GTAG和第一亚基包含对应于SEQ ID NO:392-399中任一项的残基48、50、71、72、73和74的残基，(c)中心序列是GTAT和第一亚基包含对应于SEQ ID NO:402-433中任一项的残基48、50、71、72、73和74的残基，(d)中心序列是GTGA和第一亚基包含对应于SEQ ID NO:436-462中任一项的残基48、50、71、72、73和74的残基，(e)中心序列是GTGC和第一亚基包含对应于SEQ ID NO:465-495中任一项的残基48、50、71、72、73和74的残基，(f)中心序列是GTGG和第一亚基包含对应于SEQ ID NO:498-501中任一项的残基48、50、71、72、73和74的残基，或(g)中心序列是GTGT和第一亚基包含对应于SEQ ID NO:504-529中任一项的残基48、50、71、72、73和74的残基。

另一个方面是一种工程化I-CreI衍生的大范围核酸酶，其结合并切割包含选自以下的中心序列的识别序列：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTAA，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基或第二亚基的至少一个包含与SEQ ID NO:1的至少75％、至少80％、至少85％、至少88％、至少90％、至少92％、至少94％、至少96％、至少97％、至少98％或至少99％序列同一性，除了在对应于SEQ ID NO:1的位置48、50、71、72、73和74的一个或多个位置处的氨基酸置换以外。

在一些实施方式中，所述第一亚基或第二亚基的至少一个包含与SEQ ID NO:1的至少85％序列同一性，除了在对应于SEQ ID NO:1的位置48、50、71、72、73和74的一个或多个位置处的氨基酸置换以外。另一个方面是一种多核苷酸，所述多核苷酸包含编码本文所述的任何工程化大范围核酸酶的核酸序列。在一些实施方式中，所述多核苷酸是mRNA。

另一个方面是一种包含多核苷酸的重组DNA构建体，所述多核苷酸包含编码本文所述的任何工程化大范围核酸酶的核酸序列。在一些实施方式中，所述重组DNA构建体编码包含所述多核苷酸的重组病毒。在一些实施方式中，所述重组病毒是重组腺病毒、重组慢病毒、重组逆转录病毒或重组腺相关病毒(AAV)。在一些实施方式中，所述重组病毒是重组AAV。

另一个方面是一种包含多核苷酸的重组病毒，所述多核苷酸包含编码本文所述的任何工程化大范围核酸酶的核酸序列。在一些实施方式中，所述重组病毒是重组腺病毒、重组慢病毒、重组逆转录病毒或重组AAV。在一些实施方式中，所述重组病毒是重组AAV。在一些实施方式中，所述重组病毒是重组AAV。

另一个方面是一种用于产生遗传修饰的真核细胞的方法，所述遗传修饰的真核细胞在其染色体中具有破坏的靶序列，所述方法包括：将包含所述核酸序列的多核苷酸引入所述真核细胞中，所述核酸序列编码本文所述的任何工程化大范围核酸酶，其中所述工程化大范围核酸酶在所述真核细胞中被表达；其中所述工程化大范围核酸酶在识别序列处在所述染色体中产生切割位点，并且其中所述靶序列在所述切割位点处通过非同源末端连接被破坏。

在所述方法的一些实施方式中，所述核酸序列通过mRNA或重组病毒被引入所述真核细胞中。在所述方法的一些实施方式中，所述真核细胞是哺乳动物细胞。在所述方法的一些实施方式中，所述真核细胞是人细胞。在所述方法的一些实施方式中，所述真核细胞是植物细胞。

另一个方面是一种用于产生遗传修饰的真核细胞的方法，所述遗传修饰的真核细胞在其染色体中具有破坏的靶序列，所述方法包括：将本文所述的任何工程化大范围核酸酶引入真核细胞；其中所述工程化大范围核酸酶在识别序列处在所述染色体中产生切割位点，并且其中所述靶序列在所述切割位点处通过非同源末端连接被破坏。

在所述方法的一些实施方式中，所述真核细胞是哺乳动物细胞。在所述方法的一些实施方式中，所述真核细胞是人细胞。在所述方法的一些实施方式中，所述真核细胞是植物细胞。

另一个方面是一种用于产生遗传修饰的真核细胞的方法，所述遗传修饰的真核细胞包含插入所述遗传修饰的真核细胞的染色体中的感兴趣的外源性序列，所述方法包括将一个或多个包含以下的多核苷酸引入所述真核细胞中：(a)编码本文所述的任何工程化大范围核酸酶的第一核酸，其中所述工程化大范围核酸酶在所述真核细胞中被表达；和(b)包含所述感兴趣的序列的第二核酸序列；其中所述工程化大范围核酸酶在识别序列处在所述染色体中产生切割位点；并且其中感兴趣的序列在所述切割位点处被插入所述染色体中。

在所述方法的一些实施方式中，所述第二核酸序列还包含与所述切割位点侧翼的序列同源的序列，并且所述感兴趣的序列通过同源重组在所述切割位点处被插入。在所述方法的一些实施方式中，所述第一核酸序列通过mRNA或重组病毒被引入所述真核细胞中。在所述方法的一些实施方式中，所述第二核酸通过重组病毒被引入所述真核细胞中。在所述方法的一些实施方式中，所述真核细胞是哺乳动物细胞。在所述方法的一些实施方式中，所述真核细胞是人细胞。在所述方法的一些实施方式中，所述真核细胞是植物细胞。

另一个方面是一种用于产生遗传修饰的真核细胞的方法，所述遗传修饰的真核细胞包含插入所述遗传修饰的真核细胞的染色体中的感兴趣的外源性序列，所述方法包括：(a)将本文所述的任何工程化大范围核酸酶引入真核细胞；和(b)将包含核酸序列的多核苷酸引入所述真核细胞中，所述核酸序列包含所述感兴趣的序列；其中所述工程化大范围核酸酶在识别序列处在所述染色体中产生切割位点；并且其中感兴趣的序列在所述切割位点处被插入所述染色体中。

在所述方法的一些实施方式中，所述多核苷酸还包含与所述切割位点侧翼的序列同源的序列，并且所述感兴趣的序列通过同源重组在所述切割位点处被插入。在所述方法的一些实施方式中，所述多核苷酸通过重组病毒被引入所述真核细胞中。在所述方法的一些实施方式中，所述真核细胞是哺乳动物细胞。在所述方法的一些实施方式中，所述真核细胞是人细胞。在所述方法的一些实施方式中，所述真核细胞是植物细胞。

另一个方面是一种通过本文所述的任何方法制备的遗传修饰的真核细胞。

另一个方面是一种药物组合物，其包含药学上可接受的载体和本文所述的任何工程化大范围核酸酶或包含编码本文所述的任何工程化大范围核酸酶的核酸序列的多核苷酸。在一些实施方式中，所述多核苷酸是mRNA。在一些实施方式中，所述mRNA被包封在脂质纳米颗粒中。在一些实施方式中，所述药物组合物包含重组DNA构建体，所述重组DNA构建体包含所述多核苷酸。在一些实施方式中，所述药物组合物包含重组病毒，所述重组病毒包含所述多核苷酸。在一些实施方式中，所述重组病毒是重组AAV。

从以下本发明的具体实施方式、附图和所附权利要求中，本发明的这些和其他方面和实施方式对本领域的普通技术人员将是显而易见的。

附图说明

图1。22个碱基对野生型I-CreI识别序列的示意图。每个DNA半位点的碱基编号为-1至-9。包含中心序列的四碱基对的每条链编号为+1至+4。

图2。本文所述的工程化大范围核酸酶包含两个亚基。第一亚基包含与识别序列的第一识别半位点结合的第一高变(HVR1)区。类似地，所述第二亚基包含与识别序列的第二半位点结合的第二高变(HVR2)区。在其中重组大范围核酸酶是单链大范围核酸酶的实施方式中，可以将包含HVR1区的第一亚基定位为N末端或C末端亚基。同样地，可以将包含HVR2区的第二亚基定位为N末端或C末端亚基。

图3。在CHO细胞中用于评价靶向具有不同的四碱基对中心序列的测试识别序列的重组大范围核酸酶的报告基因测定的示意图。对于本文所述的重组大范围核酸酶，产生CHO细胞系，其中将报告基因表达盒稳定整合到细胞基因组中。报告基因表达盒按照5’到3’顺序包含：SV40早期启动子；GFP基因的5’2/3；本文所述工程化大范围核酸酶(例如，LOX 3-4；SEQ ID NO:6)的识别序列；CHO-23/24大范围核酸酶(WO/2012/167192)的识别序列；和GFP基因的3’2/3。在不存在DNA断裂诱导剂的情况下，用该表达盒转染的细胞不表达GFP。通过转导编码每种大范围核酸酶的mRNA引入大范围核酸酶。当在任一大范围核酸酶识别序列处诱导DNA断裂时，GFP基因的复制区彼此重组以产生功能性GFP基因。然后，通过流式细胞术确定GFP表达细胞的百分比，作为大范围核酸酶对基因组切割频率的间接指标。

图4。用野生型I-CreI大范围核酸酶(深色)覆盖的修饰的I-CreI衍生的大范围核酸酶(浅色)的晶体结构。变体大范围核酸酶具有修饰的残基Q50R、G71S、S72G和V73R，这增加了包含四碱基对中心序列GCAG的识别序列的变体大范围核酸酶切割活性。显示了来自变体I-CreI大范围核酸酶的核苷酸G和来自野生型I-CreI大范围核酸酶的核苷酸A。还提供了位置47、48、49、50、71、72和73的重叠比对，其排列在中心四碱基对中心序列的核苷酸周围。最后，小球描述了认为至少部分被残基48、50、71、72、73和74配位的重叠金属辅因子。

序列说明

SEQ ID NO:1显示了野生型I-CreI的氨基酸序列。

SEQ ID NO:2显示了LAGLIDADG基序的氨基酸序列。

SEQ ID NO:3显示了野生型I-CreI识别序列(正义)的核酸序列。

SEQ ID NO:4显示了野生型I-CreI识别序列(反义)的核酸序列。

SEQ ID NO:5显示了野生型I-CreI识别序列中心序列的核酸序列。

SEQ ID NO:6显示了LOX 3-4识别序列(正义)的核酸序列。

SEQ ID NO:7显示了LOX 3-4识别序列(反义)的核酸序列。

SEQ ID NO:8显示了LOX 3-4x.109大范围核酸酶的氨基酸序列。

SEQ ID NO:9显示了具有ACAA中心序列的LOX 3-4识别序列(正义)的核酸序列。

SEQ ID NO:10显示了具有ACAA中心序列的LOX 3-4识别序列(反义)的核酸序列。

SEQ ID NO:11显示了LOX 3-4m.680大范围核酸酶的氨基酸序列。

SEQ ID NO:12显示了LOX 3-4m.683大范围核酸酶的氨基酸序列。

SEQ ID NO:13显示了LOX 3-4m.684大范围核酸酶的氨基酸序列。

SEQ ID NO:14显示了LOX 3-4m.691大范围核酸酶的氨基酸序列。

SEQ ID NO:15显示了LOX 3-4m.693大范围核酸酶的氨基酸序列。

SEQ ID NO:16显示了LOX 3-4m.701大范围核酸酶的氨基酸序列。

SEQ ID NO:17显示了LOX 3-4m.708大范围核酸酶的氨基酸序列。

SEQ ID NO:18显示了LOX 3-4m.714大范围核酸酶的氨基酸序列。

SEQ ID NO:19显示了LOX 3-4m.731大范围核酸酶的氨基酸序列。

SEQ ID NO:20显示了LOX 3-4m.739大范围核酸酶的氨基酸序列。

SEQ ID NO:21显示了LOX 3-4m.741大范围核酸酶的氨基酸序列。

SEQ ID NO:22显示了LOX 3-4m.742大范围核酸酶的氨基酸序列。

SEQ ID NO:23显示了LOX 3-4m.743大范围核酸酶的氨基酸序列。

SEQ ID NO:24显示了LOX 3-4m.744大范围核酸酶的氨基酸序列。

SEQ ID NO:25显示了LOX 3-4m.747大范围核酸酶的氨基酸序列。

SEQ ID NO:26显示了LOX 3-4m.750大范围核酸酶的氨基酸序列。

SEQ ID NO:27显示了LOX 3-4m.756大范围核酸酶的氨基酸序列。

SEQ ID NO:28显示了LOX 3-4m.757大范围核酸酶的氨基酸序列。

SEQ ID NO:29显示了LOX 3-4m.759大范围核酸酶的氨基酸序列。

SEQ ID NO:30显示了LOX 3-4m.762大范围核酸酶的氨基酸序列。

SEQ ID NO:31显示了LOX 3-4m.765大范围核酸酶的氨基酸序列。

SEQ ID NO:32显示了LOX 3-4m.770大范围核酸酶的氨基酸序列。

SEQ ID NO:33显示了LOX 3-4m.771大范围核酸酶的氨基酸序列。

SEQ ID NO:34显示了具有ACAG中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:35显示了具有ACAG中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:36显示了LOX3-4m.775大范围核酸酶的氨基酸序列。

SEQ ID NO:37显示了LOX3-4m.776大范围核酸酶的氨基酸序列。

SEQ ID NO:38显示了LOX3-4m.785大范围核酸酶的氨基酸序列。

SEQ ID NO:39显示了LOX3-4m.788大范围核酸酶的氨基酸序列。

SEQ ID NO:40显示了LOX3-4m.815大范围核酸酶的氨基酸序列。

SEQ ID NO:41显示了LOX3-4m.831大范围核酸酶的氨基酸序列。

SEQ ID NO:42显示了LOX3-4m.856大范围核酸酶的氨基酸序列。

SEQ ID NO:43显示了LOX3-4m.863大范围核酸酶的氨基酸序列。

SEQ ID NO:44显示了具有ACAT中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:45显示了具有ACAT中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:46显示了LOX3-4m.869大范围核酸酶的氨基酸序列。

SEQ ID NO:47显示了LOX3-4m.873大范围核酸酶的氨基酸序列。

SEQ ID NO:48显示了LOX3-4m.877大范围核酸酶的氨基酸序列。

SEQ ID NO:49显示了LOX3-4m.883大范围核酸酶的氨基酸序列。

SEQ ID NO:50显示了LOX3-4m.885大范围核酸酶的氨基酸序列。

SEQ ID NO:51显示了LOX3-4m.886大范围核酸酶的氨基酸序列。

SEQ ID NO:52显示了LOX3-4m.893大范围核酸酶的氨基酸序列。

SEQ ID NO:53显示了LOX3-4m.901大范围核酸酶的氨基酸序列。

SEQ ID NO:54显示了LOX3-4m.910大范围核酸酶的氨基酸序列。

SEQ ID NO:55显示了LOX3-4m.917大范围核酸酶的氨基酸序列。

SEQ ID NO:56显示了LOX3-4m.919大范围核酸酶的氨基酸序列。

SEQ ID NO:57显示了LOX3-4m.922大范围核酸酶的氨基酸序列。

SEQ ID NO:58显示了LOX3-4m.925大范围核酸酶的氨基酸序列。

SEQ ID NO:59显示了LOX3-4m.929大范围核酸酶的氨基酸序列。

SEQ ID NO:60显示了LOX3-4m.930大范围核酸酶的氨基酸序列。

SEQ ID NO:61显示了LOX3-4m.933大范围核酸酶的氨基酸序列。

SEQ ID NO:62显示了LOX3-4m.937大范围核酸酶的氨基酸序列。

SEQ ID NO:63显示了LOX3-4m.941大范围核酸酶的氨基酸序列。

SEQ ID NO:64显示了LOX3-4m.942大范围核酸酶的氨基酸序列。

SEQ ID NO:65显示了LOX3-4m.945大范围核酸酶的氨基酸序列。

SEQ ID NO:66显示了LOX3-4m.949大范围核酸酶的氨基酸序列。

SEQ ID NO:67显示了LOX3-4m.950大范围核酸酶的氨基酸序列。

SEQ ID NO:68显示了具有ACGA中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:69显示了具有ACGA中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:70显示了LOX 3-4m.956大范围核酸酶的氨基酸序列。

SEQ ID NO:71显示了LOX 3-4m.961大范围核酸酶的氨基酸序列。

SEQ ID NO:72显示了LOX 3-4m.962大范围核酸酶的氨基酸序列。

SEQ ID NO:73显示了LOX 3-4m.963大范围核酸酶的氨基酸序列。

SEQ ID NO:74显示了LOX 3-4m.969大范围核酸酶的氨基酸序列。

SEQ ID NO:75显示了LOX 3-4m.971大范围核酸酶的氨基酸序列。

SEQ ID NO:76显示了LOX 3-4m.977大范围核酸酶的氨基酸序列。

SEQ ID NO:77显示了LOX 3-4m.982大范围核酸酶的氨基酸序列。

SEQ ID NO:78显示了LOX 3-4m.986大范围核酸酶的氨基酸序列。

SEQ ID NO:79显示了LOX 3-4m.993大范围核酸酶的氨基酸序列。

SEQ ID NO:80显示了LOX 3-4m.994大范围核酸酶的氨基酸序列。

SEQ ID NO:81显示了LOX 3-4m.1001大范围核酸酶的氨基酸序列。

SEQ ID NO:82显示了LOX 3-4m.1013大范围核酸酶的氨基酸序列。

SEQ ID NO:83显示了LOX 3-4m.1017大范围核酸酶的氨基酸序列。

SEQ ID NO:84显示了LOX 3-4m.1018大范围核酸酶的氨基酸序列。

SEQ ID NO:85显示了LOX 3-4m.1021大范围核酸酶的氨基酸序列。

SEQ ID NO:86显示了LOX 3-4m.1029大范围核酸酶的氨基酸序列。

SEQ ID NO:87显示了LOX 3-4m.1036大范围核酸酶的氨基酸序列。

SEQ ID NO:88显示了LOX 3-4m.1041大范围核酸酶的氨基酸序列。

SEQ ID NO:89显示了LOX 3-4m.1044大范围核酸酶的氨基酸序列。

SEQ ID NO:90显示了具有ACGC中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:91显示了具有ACGC中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:92显示了LOX 3-4m.1049大范围核酸酶的氨基酸序列。

SEQ ID NO:93显示了LOX 3-4m.1050大范围核酸酶的氨基酸序列。

SEQ ID NO:94显示了LOX 3-4m.1052大范围核酸酶的氨基酸序列。

SEQ ID NO:95显示了LOX 3-4m.1068大范围核酸酶的氨基酸序列。

SEQ ID NO:96显示了LOX 3-4m.1069大范围核酸酶的氨基酸序列。

SEQ ID NO:97显示了LOX 3-4m.1074大范围核酸酶的氨基酸序列。

SEQ ID NO:98显示了LOX 3-4m.1085大范围核酸酶的氨基酸序列。

SEQ ID NO:99显示了LOX 3-4m.1093大范围核酸酶的氨基酸序列。

SEQ ID NO:100显示了LOX 3-4m.1095大范围核酸酶的氨基酸序列。

SEQ ID NO:101显示了LOX 3-4m.1098大范围核酸酶的氨基酸序列。

SEQ ID NO:102显示了LOX 3-4m.1100大范围核酸酶的氨基酸序列。

SEQ ID NO:103显示了LOX 3-4m.1101大范围核酸酶的氨基酸序列。

SEQ ID NO:104显示了LOX 3-4m.1107大范围核酸酶的氨基酸序列。

SEQ ID NO:105显示了LOX 3-4m.1109大范围核酸酶的氨基酸序列。

SEQ ID NO:106显示了LOX 3-4m.1111大范围核酸酶的氨基酸序列。

SEQ ID NO:107显示了LOX 3-4m.1113大范围核酸酶的氨基酸序列。

SEQ ID NO:108显示了LOX 3-4m.1116大范围核酸酶的氨基酸序列。

SEQ ID NO:109显示了LOX 3-4m.1117大范围核酸酶的氨基酸序列。

SEQ ID NO:110显示了LOX 3-4m.1118大范围核酸酶的氨基酸序列。

SEQ ID NO:111显示了LOX 3-4m.1123大范围核酸酶的氨基酸序列。

SEQ ID NO:112显示了LOX 3-4m.1125大范围核酸酶的氨基酸序列。

SEQ ID NO:113显示了LOX 3-4m.1126大范围核酸酶的氨基酸序列。

SEQ ID NO:114显示了LOX 3-4m.1127大范围核酸酶的氨基酸序列。

SEQ ID NO:115显示了LOX 3-4m.1129大范围核酸酶的氨基酸序列。

SEQ ID NO:116显示了LOX 3-4m.1131大范围核酸酶的氨基酸序列。

SEQ ID NO:117显示了LOX 3-4m.1133大范围核酸酶的氨基酸序列。

SEQ ID NO:118显示了LOX 3-4m.1137大范围核酸酶的氨基酸序列。

SEQ ID NO:119显示了具有ACGG中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:120显示了具有ACGG中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:121显示了LOX 3-4m.1876大范围核酸酶的氨基酸序列。

SEQ ID NO:122显示了LOX 3-4m.1894大范围核酸酶的氨基酸序列。

SEQ ID NO:123显示了LOX 3-4m.1898大范围核酸酶的氨基酸序列。

SEQ ID NO:124显示了LOX 3-4m.1904大范围核酸酶的氨基酸序列。

SEQ ID NO:125显示了LOX 3-4m.1910大范围核酸酶的氨基酸序列。

SEQ ID NO:126显示了LOX 3-4m.1914大范围核酸酶的氨基酸序列。

SEQ ID NO:127显示了LOX 3-4m.1930大范围核酸酶的氨基酸序列。

SEQ ID NO:128显示了LOX 3-4m.1938大范围核酸酶的氨基酸序列。

SEQ ID NO:129显示了LOX 3-4m.1941大范围核酸酶的氨基酸序列。

SEQ ID NO:130显示了LOX 3-4m.1944大范围核酸酶的氨基酸序列。

SEQ ID NO:131显示了LOX 3-4m.1946大范围核酸酶的氨基酸序列。

SEQ ID NO:132显示了LOX 3-4m.1947大范围核酸酶的氨基酸序列。

SEQ ID NO:133显示了LOX 3-4m.1950大范围核酸酶的氨基酸序列。

SEQ ID NO:134显示了LOX 3-4m.1952大范围核酸酶的氨基酸序列。

SEQ ID NO:135显示了LOX 3-4m.1960大范围核酸酶的氨基酸序列。

SEQ ID NO:136显示了具有ACGT中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:137显示了具有ACGT中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:138显示了LOX 3-4m.1145大范围核酸酶的氨基酸序列。

SEQ ID NO:139显示了LOX 3-4m.1149大范围核酸酶的氨基酸序列。

SEQ ID NO:140显示了LOX 3-4m.1152大范围核酸酶的氨基酸序列。

SEQ ID NO:141显示了LOX 3-4m.1153大范围核酸酶的氨基酸序列。

SEQ ID NO:142显示了LOX 3-4m.1157大范围核酸酶的氨基酸序列。

SEQ ID NO:143显示了LOX 3-4m.1158大范围核酸酶的氨基酸序列。

SEQ ID NO:144显示了LOX 3-4m.1176大范围核酸酶的氨基酸序列。

SEQ ID NO:145显示了LOX 3-4m.1191大范围核酸酶的氨基酸序列。

SEQ ID NO:146显示了LOX 3-4m.1198大范围核酸酶的氨基酸序列。

SEQ ID NO:147显示了LOX 3-4m.1201大范围核酸酶的氨基酸序列。

SEQ ID NO:148显示了LOX 3-4m.1205大范围核酸酶的氨基酸序列。

SEQ ID NO:149显示了LOX 3-4m.1206大范围核酸酶的氨基酸序列。

SEQ ID NO:150显示了LOX 3-4m.1208大范围核酸酶的氨基酸序列。

SEQ ID NO:151显示了LOX 3-4m.1212大范围核酸酶的氨基酸序列。

SEQ ID NO:152显示了LOX 3-4m.1218大范围核酸酶的氨基酸序列。

SEQ ID NO:153显示了LOX 3-4m.1224大范围核酸酶的氨基酸序列。

SEQ ID NO:154显示了LOX 3-4m.1225大范围核酸酶的氨基酸序列。

SEQ ID NO:155显示了LOX 3-4m.1226大范围核酸酶的氨基酸序列。

SEQ ID NO:156显示了LOX 3-4m.1227大范围核酸酶的氨基酸序列。

SEQ ID NO:157显示了具有ATAA中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:158显示了具有ATAA中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:159显示了LOX 3-4m.1232大范围核酸酶的氨基酸序列。

SEQ ID NO:160显示了LOX 3-4m.1235大范围核酸酶的氨基酸序列。

SEQ ID NO:161显示了LOX 3-4m.1236大范围核酸酶的氨基酸序列。

SEQ ID NO:162显示了LOX 3-4m.1237大范围核酸酶的氨基酸序列。

SEQ ID NO:163显示了LOX 3-4m.1240大范围核酸酶的氨基酸序列。

SEQ ID NO:164显示了LOX 3-4m.1250大范围核酸酶的氨基酸序列。

SEQ ID NO:165显示了LOX 3-4m.1253大范围核酸酶的氨基酸序列。

SEQ ID NO:166显示了LOX 3-4m.1255大范围核酸酶的氨基酸序列。

SEQ ID NO:167显示了LOX 3-4m.1256大范围核酸酶的氨基酸序列。

SEQ ID NO:168显示了LOX 3-4m.1260大范围核酸酶的氨基酸序列。

SEQ ID NO:169显示了LOX 3-4m.1261大范围核酸酶的氨基酸序列。

SEQ ID NO:170显示了LOX 3-4m.1262大范围核酸酶的氨基酸序列。

SEQ ID NO:171显示了LOX 3-4m.1268大范围核酸酶的氨基酸序列。

SEQ ID NO:172显示了LOX 3-4m.1269大范围核酸酶的氨基酸序列。

SEQ ID NO:173显示了LOX 3-4m.1278大范围核酸酶的氨基酸序列。

SEQ ID NO:174显示了LOX 3-4m.1284大范围核酸酶的氨基酸序列。

SEQ ID NO:175显示了LOX 3-4m.1293大范围核酸酶的氨基酸序列。

SEQ ID NO:176显示了LOX 3-4m.1300大范围核酸酶的氨基酸序列。

SEQ ID NO:177显示了LOX 3-4m.1301大范围核酸酶的氨基酸序列。

SEQ ID NO:178显示了LOX 3-4m.1308大范围核酸酶的氨基酸序列。

SEQ ID NO:179显示了LOX 3-4m.1309大范围核酸酶的氨基酸序列。

SEQ ID NO:180显示了LOX 3-4m.1311大范围核酸酶的氨基酸序列。

SEQ ID NO:181显示了LOX 3-4m.1317大范围核酸酶的氨基酸序列。

SEQ ID NO:182显示了LOX 3-4m.1319大范围核酸酶的氨基酸序列。

SEQ ID NO:183显示了LOX 3-4m.1322大范围核酸酶的氨基酸序列。

SEQ ID NO:184显示了具有ATAG中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:185显示了具有ATAG中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:186显示了LOX 3-4m.1329大范围核酸酶的氨基酸序列。

SEQ ID NO:187显示了LOX 3-4m.1338大范围核酸酶的氨基酸序列。

SEQ ID NO:188显示了LOX 3-4m.1343大范围核酸酶的氨基酸序列。

SEQ ID NO:189显示了LOX 3-4m.1345大范围核酸酶的氨基酸序列。

SEQ ID NO:190显示了LOX 3-4m.1347大范围核酸酶的氨基酸序列。

SEQ ID NO:191显示了LOX 3-4m.1353大范围核酸酶的氨基酸序列。

SEQ ID NO:192显示了LOX 3-4m.1361大范围核酸酶的氨基酸序列。

SEQ ID NO:193显示了LOX 3-4m.1369大范围核酸酶的氨基酸序列。

SEQ ID NO:194显示了LOX 3-4m.1391大范围核酸酶的氨基酸序列。

SEQ ID NO:195显示了LOX 3-4m.1392大范围核酸酶的氨基酸序列。

SEQ ID NO:196显示了LOX 3-4m.1394大范围核酸酶的氨基酸序列。

SEQ ID NO:197显示了LOX 3-4m.1396大范围核酸酶的氨基酸序列。

SEQ ID NO:198显示了LOX 3-4m.1405大范围核酸酶的氨基酸序列。

SEQ ID NO:199显示了LOX 3-4m.1415大范围核酸酶的氨基酸序列。

SEQ ID NO:200显示了具有ATAT中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:201显示了具有ATAT中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:202显示了LOX 3-4m.2244大范围核酸酶的氨基酸序列。

SEQ ID NO:203显示了LOX 3-4m.2248大范围核酸酶的氨基酸序列。

SEQ ID NO:204显示了LOX 3-4m.2254大范围核酸酶的氨基酸序列。

SEQ ID NO:205显示了LOX 3-4m.2263大范围核酸酶的氨基酸序列。

SEQ ID NO:206显示了LOX 3-4m.2273大范围核酸酶的氨基酸序列。

SEQ ID NO:207显示了LOX 3-4m.2274大范围核酸酶的氨基酸序列。

SEQ ID NO:208显示了LOX 3-4m.2313大范围核酸酶的氨基酸序列。

SEQ ID NO:209显示了LOX 3-4m.2316大范围核酸酶的氨基酸序列。

SEQ ID NO:210显示了LOX 3-4m.2327大范围核酸酶的氨基酸序列。

SEQ ID NO:211显示了LOX 3-4m.2318大范围核酸酶的氨基酸序列。

SEQ ID NO:212显示了LOX 3-4m.2319大范围核酸酶的氨基酸序列。

SEQ ID NO:213显示了LOX 3-4m.2320大范围核酸酶的氨基酸序列。

SEQ ID NO:214显示了LOX 3-4m.2322大范围核酸酶的氨基酸序列。

SEQ ID NO:215显示了LOX 3-4m.2324大范围核酸酶的氨基酸序列。

SEQ ID NO:216显示了LOX 3-4m.2326大范围核酸酶的氨基酸序列。

SEQ ID NO:217显示了LOX 3-4m.2329大范围核酸酶的氨基酸序列。

SEQ ID NO:218显示了LOX 3-4m.2330大范围核酸酶的氨基酸序列。

SEQ ID NO:219显示了LOX 3-4m.2258大范围核酸酶的氨基酸序列。

SEQ ID NO:220显示了具有ATGA中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:221显示了具有ATGA中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:222显示了LOX3-4m.1417大范围核酸酶的氨基酸序列。

SEQ ID NO:223显示了LOX3-4m.1421大范围核酸酶的氨基酸序列。

SEQ ID NO:224显示了LOX3-4m.1432大范围核酸酶的氨基酸序列。

SEQ ID NO:225显示了LOX3-4m.1436大范围核酸酶的氨基酸序列。

SEQ ID NO:226显示了LOX3-4m.1437大范围核酸酶的氨基酸序列。

SEQ ID NO:227显示了LOX3-4m.1441大范围核酸酶的氨基酸序列。

SEQ ID NO:228显示了LOX3-4m.1450大范围核酸酶的氨基酸序列。

SEQ ID NO:229显示了LOX3-4m.1451大范围核酸酶的氨基酸序列。

SEQ ID NO:230显示了LOX3-4m.1453大范围核酸酶的氨基酸序列。

SEQ ID NO:231显示了LOX3-4m.1468大范围核酸酶的氨基酸序列。

SEQ ID NO:232显示了LOX3-4m.1469大范围核酸酶的氨基酸序列。

SEQ ID NO:233显示了LOX3-4m.1477大范围核酸酶的氨基酸序列。

SEQ ID NO:234显示了LOX3-4m.1478大范围核酸酶的氨基酸序列。

SEQ ID NO:235显示了LOX3-4m.1485大范围核酸酶的氨基酸序列。

SEQ ID NO:236显示了LOX3-4m.1486大范围核酸酶的氨基酸序列。

SEQ ID NO:237显示了LOX3-4m.1488大范围核酸酶的氨基酸序列。

SEQ ID NO:238显示了LOX3-4m.1491大范围核酸酶的氨基酸序列。

SEQ ID NO:239显示了LOX3-4m.1500大范围核酸酶的氨基酸序列。

SEQ ID NO:240显示了LOX3-4m.1501大范围核酸酶的氨基酸序列。

SEQ ID NO:241显示了LOX3-4m.1502大范围核酸酶的氨基酸序列。

SEQ ID NO:242显示了LOX3-4m.1505大范围核酸酶的氨基酸序列。

SEQ ID NO:243显示了LOX3-4m.1506大范围核酸酶的氨基酸序列。

SEQ ID NO:244显示了ATGG LOX 3-4识别序列(正义)的核酸序列。

SEQ ID NO:245显示了ATGG LOX 3-4识别序列(反义)的核酸序列。

SEQ ID NO:246显示了LOX 3-4m.1508大范围核酸酶的氨基酸序列。

SEQ ID NO:247显示了LOX 3-4m.1515大范围核酸酶的氨基酸序列。

SEQ ID NO:248显示了具有TTGG中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:249显示了具有TTGG中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:250显示了LOX 3-4m.1970大范围核酸酶的氨基酸序列。

SEQ ID NO:251显示了LOX 3-4m.1973大范围核酸酶的氨基酸序列。

SEQ ID NO:252显示了LOX 3-4m.1974大范围核酸酶的氨基酸序列。

SEQ ID NO:253显示了LOX 3-4m.1975大范围核酸酶的氨基酸序列。

SEQ ID NO:254显示了LOX 3-4m.1979大范围核酸酶的氨基酸序列。

SEQ ID NO:255显示了LOX 3-4m.1980大范围核酸酶的氨基酸序列。

SEQ ID NO:256显示了LOX 3-4m.1981大范围核酸酶的氨基酸序列。

SEQ ID NO:257显示了LOX 3-4m.1982大范围核酸酶的氨基酸序列。

SEQ ID NO:258显示了LOX 3-4m.1986大范围核酸酶的氨基酸序列。

SEQ ID NO:259显示了LOX 3-4m.1995大范围核酸酶的氨基酸序列。

SEQ ID NO:260显示了LOX 3-4m.1997大范围核酸酶的氨基酸序列。

SEQ ID NO:261显示了LOX 3-4m.2045大范围核酸酶的氨基酸序列。

SEQ ID NO:262显示了LOX 3-4m.2050大范围核酸酶的氨基酸序列。

SEQ ID NO:263显示了LOX 3-4m.2051大范围核酸酶的氨基酸序列。

SEQ ID NO:264显示了LOX 3-4m.2052大范围核酸酶的氨基酸序列。

SEQ ID NO:265显示了LOX 3-4m.2053大范围核酸酶的氨基酸序列。

SEQ ID NO:266显示了LOX 3-4m.2059大范围核酸酶的氨基酸序列。

SEQ ID NO:267显示了具有GCAA中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:268显示了具有GCAA中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:269显示了LOX 3-4m.1784大范围核酸酶的氨基酸序列。

SEQ ID NO:270显示了LOX 3-4m.1785大范围核酸酶的氨基酸序列。

SEQ ID NO:271显示了LOX 3-4m.1787大范围核酸酶的氨基酸序列。

SEQ ID NO:272显示了LOX 3-4m.1789大范围核酸酶的氨基酸序列。

SEQ ID NO:273显示了LOX 3-4m.1798大范围核酸酶的氨基酸序列。

SEQ ID NO:274显示了LOX 3-4m.1805大范围核酸酶的氨基酸序列。

SEQ ID NO:275显示了LOX 3-4m.1809大范围核酸酶的氨基酸序列。

SEQ ID NO:276显示了LOX 3-4m.1812大范围核酸酶的氨基酸序列。

SEQ ID NO:277显示了LOX 3-4m.1814大范围核酸酶的氨基酸序列。

SEQ ID NO:278显示了LOX 3-4m.1820大范围核酸酶的氨基酸序列。

SEQ ID NO:279显示了LOX 3-4m.1827大范围核酸酶的氨基酸序列。

SEQ ID NO:280显示了LOX 3-4m.1836大范围核酸酶的氨基酸序列。

SEQ ID NO:281显示了LOX 3-4m.1837大范围核酸酶的氨基酸序列。

SEQ ID NO:282显示了LOX 3-4m.1838大范围核酸酶的氨基酸序列。

SEQ ID NO:283显示了LOX 3-4m.1846大范围核酸酶的氨基酸序列。

SEQ ID NO:284显示了LOX 3-4m.1853大范围核酸酶的氨基酸序列。

SEQ ID NO:285显示了LOX 3-4m.1854大范围核酸酶的氨基酸序列。

SEQ ID NO:286显示了LOX 3-4m.1858大范围核酸酶的氨基酸序列。

SEQ ID NO:287显示了LOX 3-4m.1862大范围核酸酶的氨基酸序列。

SEQ ID NO:288显示了LOX 3-4m.1868大范围核酸酶的氨基酸序列。

SEQ ID NO:289显示了LOX 3-4m.1870大范围核酸酶的氨基酸序列。

SEQ ID NO:290显示了LOX 3-4m.1873大范围核酸酶的氨基酸序列。

SEQ ID NO:291显示了LOX 3-4m.1875大范围核酸酶的氨基酸序列。

SEQ ID NO:292显示了具有GCAT中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:293显示了具有GCAT中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:294显示了LOX 3-4m.1600大范围核酸酶的氨基酸序列。

SEQ ID NO:295显示了LOX 3-4m.1601大范围核酸酶的氨基酸序列。

SEQ ID NO:296显示了LOX 3-4m.1605大范围核酸酶的氨基酸序列。

SEQ ID NO:297显示了LOX 3-4m.1606大范围核酸酶的氨基酸序列。

SEQ ID NO:298显示了LOX 3-4m.1623大范围核酸酶的氨基酸序列。

SEQ ID NO:299显示了LOX 3-4m.1660大范围核酸酶的氨基酸序列。

SEQ ID NO:300显示了LOX 3-4m.1661大范围核酸酶的氨基酸序列。

SEQ ID NO:301显示了LOX 3-4m.1665大范围核酸酶的氨基酸序列。

SEQ ID NO:302显示了LOX 3-4m.1667大范围核酸酶的氨基酸序列。

SEQ ID NO:303显示了LOX 3-4m.1669大范围核酸酶的氨基酸序列。

SEQ ID NO:304显示了LOX 3-4m.1672大范围核酸酶的氨基酸序列。

SEQ ID NO:305显示了LOX 3-4m.1674大范围核酸酶的氨基酸序列。

SEQ ID NO:306显示了LOX 3-4m.1676大范围核酸酶的氨基酸序列。

SEQ ID NO:307显示了LOX 3-4m.1677大范围核酸酶的氨基酸序列。

SEQ ID NO:308显示了LOX 3-4m.1679大范围核酸酶的氨基酸序列。

SEQ ID NO:309显示了LOX 3-4m.1684大范围核酸酶的氨基酸序列。

SEQ ID NO:310显示了LOX 3-4m.1685大范围核酸酶的氨基酸序列。

SEQ ID NO:311显示了LOX 3-4m.1687大范围核酸酶的氨基酸序列。

SEQ ID NO:312显示了LOX 3-4m.1689大范围核酸酶的氨基酸序列。

SEQ ID NO:313显示了LOX 3-4m.1691大范围核酸酶的氨基酸序列。

SEQ ID NO:314显示了具有GCGA中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:315显示了具有GCGA中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:316显示了LOX 3-4m.1694大范围核酸酶的氨基酸序列。

SEQ ID NO:317显示了LOX 3-4m.1745大范围核酸酶的氨基酸序列。

SEQ ID NO:318显示了LOX 3-4m.1752大范围核酸酶的氨基酸序列。

SEQ ID NO:319显示了LOX 3-4m.1753大范围核酸酶的氨基酸序列。

SEQ ID NO:320显示了LOX 3-4m.1765大范围核酸酶的氨基酸序列。

SEQ ID NO:321显示了LOX 3-4m.1770大范围核酸酶的氨基酸序列。

SEQ ID NO:322显示了LOX 3-4m.1774大范围核酸酶的氨基酸序列。

SEQ ID NO:323显示了LOX 3-4m.1780大范围核酸酶的氨基酸序列。

SEQ ID NO:324显示了LOX 3-4m.1781大范围核酸酶的氨基酸序列。

SEQ ID NO:325显示了LOX 3-4m.1782大范围核酸酶的氨基酸序列。

SEQ ID NO:326显示了GCAG LOX 3-4识别序列(正义)的核酸序列。

SEQ ID NO:327显示了GCAG LOX 3-4识别序列(反义)的核酸序列。

SEQ ID NO:328显示了LOX 3-4m.494大范围核酸酶的氨基酸序列。

SEQ ID NO:329显示了LOX 3-4m.509大范围核酸酶的氨基酸序列。

SEQ ID NO:330显示了LOX 3-4m.524大范围核酸酶的氨基酸序列。

SEQ ID NO:331显示了具有TCAA中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:332显示了具有TCAA中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:333显示了LOX 3-4m.2157大范围核酸酶的氨基酸序列。

SEQ ID NO:334显示了LOX 3-4m.2165大范围核酸酶的氨基酸序列。

SEQ ID NO:335显示了LOX 3-4m.2189大范围核酸酶的氨基酸序列。

SEQ ID NO:336显示了LOX 3-4m.2207大范围核酸酶的氨基酸序列。

SEQ ID NO:337显示了LOX 3-4m.2225大范围核酸酶的氨基酸序列。

SEQ ID NO:338显示了LOX 3-4m.2229大范围核酸酶的氨基酸序列。

SEQ ID NO:339显示了LOX 3-4m.2235大范围核酸酶的氨基酸序列。

SEQ ID NO:340显示了LOX 3-4m.2238大范围核酸酶的氨基酸序列。

SEQ ID NO:341显示了具有TTAA中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:342显示了具有TTAA中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:343显示了LOX 3-4m.2071大范围核酸酶的氨基酸序列。

SEQ ID NO:344显示了LOX 3-4m.2077大范围核酸酶的氨基酸序列。

SEQ ID NO:345显示了LOX 3-4m.2082大范围核酸酶的氨基酸序列。

SEQ ID NO:346显示了LOX 3-4m.2086大范围核酸酶的氨基酸序列。

SEQ ID NO:347显示了LOX 3-4m.2087大范围核酸酶的氨基酸序列。

SEQ ID NO:348显示了LOX 3-4m.2102大范围核酸酶的氨基酸序列。

SEQ ID NO:349显示了LOX 3-4m.2111大范围核酸酶的氨基酸序列。

SEQ ID NO:350显示了LOX 3-4m.2116大范围核酸酶的氨基酸序列。

SEQ ID NO:351显示了LOX 3-4m.2125大范围核酸酶的氨基酸序列。

SEQ ID NO:352显示了LOX 3-4m.2132大范围核酸酶的氨基酸序列。

SEQ ID NO:353显示了LOX 3-4m.2138大范围核酸酶的氨基酸序列。

SEQ ID NO:354显示了LOX 3-4m.2141大范围核酸酶的氨基酸序列。

SEQ ID NO:355显示了LOX 3-4m.2142大范围核酸酶的氨基酸序列。

SEQ ID NO:356显示了LOX 3-4m.2145大范围核酸酶的氨基酸序列。

SEQ ID NO:357显示了LOX 3-4m.2151大范围核酸酶的氨基酸序列。

SEQ ID NO:358显示了具有GTAA中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:359显示了具有GTAA中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:360显示了LOX 3-4m.1大范围核酸酶的氨基酸序列。

SEQ ID NO:361显示了LOX 3-4m.2大范围核酸酶的氨基酸序列。

SEQ ID NO:362显示了LOX 3-4m.3大范围核酸酶的氨基酸序列。

SEQ ID NO:363显示了LOX 3-4m.4大范围核酸酶的氨基酸序列。

SEQ ID NO:364显示了LOX 3-4m.5大范围核酸酶的氨基酸序列。

SEQ ID NO:365显示了LOX 3-4m.6大范围核酸酶的氨基酸序列。

SEQ ID NO:366显示了LOX 3-4m.7大范围核酸酶的氨基酸序列。

SEQ ID NO:367显示了LOX 3-4m.8大范围核酸酶的氨基酸序列。

SEQ ID NO:368显示了LOX 3-4m.9大范围核酸酶的氨基酸序列。

SEQ ID NO:369显示了LOX 3-4m.10大范围核酸酶的氨基酸序列。

SEQ ID NO:370显示了LOX 3-4m.11大范围核酸酶的氨基酸序列。

SEQ ID NO:371显示了LOX 3-4m.12大范围核酸酶的氨基酸序列。

SEQ ID NO:372显示了LOX 3-4m.13大范围核酸酶的氨基酸序列。

SEQ ID NO:373显示了LOX 3-4m.14大范围核酸酶的氨基酸序列。

SEQ ID NO:374显示了LOX 3-4m.15大范围核酸酶的氨基酸序列。

SEQ ID NO:375显示了LOX 3-4m.16大范围核酸酶的氨基酸序列。

SEQ ID NO:376显示了LOX 3-4m.17大范围核酸酶的氨基酸序列。

SEQ ID NO:377显示了LOX 3-4m.18大范围核酸酶的氨基酸序列。

SEQ ID NO:378显示了LOX 3-4m.19大范围核酸酶的氨基酸序列。

SEQ ID NO:379显示了LOX 3-4m.20大范围核酸酶的氨基酸序列。

SEQ ID NO:380显示了LOX 3-4m.21大范围核酸酶的氨基酸序列。

SEQ ID NO:381显示了LOX 3-4m.22大范围核酸酶的氨基酸序列。

SEQ ID NO:382显示了LOX 3-4m.23大范围核酸酶的氨基酸序列。

SEQ ID NO:383显示了LOX 3-4m.24大范围核酸酶的氨基酸序列。

SEQ ID NO:384显示了LOX 3-4m.25大范围核酸酶的氨基酸序列。

SEQ ID NO:385显示了LOX 3-4m.26大范围核酸酶的氨基酸序列。

SEQ ID NO:386显示了LOX 3-4m.27大范围核酸酶的氨基酸序列。

SEQ ID NO:387显示了LOX 3-4m.28大范围核酸酶的氨基酸序列。

SEQ ID NO:388显示了LOX 3-4m.29大范围核酸酶的氨基酸序列。

SEQ ID NO:389显示了LOX 3-4m.30大范围核酸酶的氨基酸序列。

SEQ ID NO:390显示了具有GTAG中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:391显示了具有GTAG中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:392显示了LOX 3-4m.95大范围核酸酶的氨基酸序列。

SEQ ID NO:393显示了LOX 3-4m.96大范围核酸酶的氨基酸序列。

SEQ ID NO:394显示了LOX 3-4m.97大范围核酸酶的氨基酸序列。

SEQ ID NO:395显示了LOX 3-4m.102大范围核酸酶的氨基酸序列。

SEQ ID NO:396显示了LOX 3-4m.108大范围核酸酶的氨基酸序列。

SEQ ID NO:397显示了LOX 3-4m.111大范围核酸酶的氨基酸序列。

SEQ ID NO:398显示了LOX 3-4m.114大范围核酸酶的氨基酸序列。

SEQ ID NO:399显示了LOX 3-4m.123大范围核酸酶的氨基酸序列。

SEQ ID NO:400显示了具有GTAT中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:401显示了具有GTAT中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:402显示了LOX 3-4m.124大范围核酸酶的氨基酸序列。

SEQ ID NO:403显示了LOX 3-4m.125大范围核酸酶的氨基酸序列。

SEQ ID NO:404显示了LOX 3-4m.126大范围核酸酶的氨基酸序列。

SEQ ID NO:405显示了LOX 3-4m.127大范围核酸酶的氨基酸序列。

SEQ ID NO:406显示了LOX 3-4m.128大范围核酸酶的氨基酸序列。

SEQ ID NO:407显示了LOX 3-4m.129大范围核酸酶的氨基酸序列。

SEQ ID NO:408显示了LOX 3-4m.130大范围核酸酶的氨基酸序列。

SEQ ID NO:409显示了LOX 3-4m.131大范围核酸酶的氨基酸序列。

SEQ ID NO:410显示了LOX 3-4m.132大范围核酸酶的氨基酸序列。

SEQ ID NO:411显示了LOX 3-4m.133大范围核酸酶的氨基酸序列。

SEQ ID NO:412显示了LOX 3-4m.134大范围核酸酶的氨基酸序列。

SEQ ID NO:413显示了LOX 3-4m.135大范围核酸酶的氨基酸序列。

SEQ ID NO:414显示了LOX 3-4m.136大范围核酸酶的氨基酸序列。

SEQ ID NO:415显示了LOX 3-4m.137大范围核酸酶的氨基酸序列。

SEQ ID NO:416显示了LOX 3-4m.138大范围核酸酶的氨基酸序列。

SEQ ID NO:417显示了LOX 3-4m.139大范围核酸酶的氨基酸序列。

SEQ ID NO:418显示了LOX 3-4m.140大范围核酸酶的氨基酸序列。

SEQ ID NO:419显示了LOX 3-4m.141大范围核酸酶的氨基酸序列。

SEQ ID NO:420显示了LOX 3-4m.142大范围核酸酶的氨基酸序列。

SEQ ID NO:421显示了LOX 3-4m.143大范围核酸酶的氨基酸序列。

SEQ ID NO:422显示了LOX 3-4m.144大范围核酸酶的氨基酸序列。

SEQ ID NO:423显示了LOX 3-4m.145大范围核酸酶的氨基酸序列。

SEQ ID NO:424显示了LOX 3-4m.146大范围核酸酶的氨基酸序列。

SEQ ID NO:425显示了LOX 3-4m.147大范围核酸酶的氨基酸序列。

SEQ ID NO:426显示了LOX 3-4m.148大范围核酸酶的氨基酸序列。

SEQ ID NO:427显示了LOX 3-4m.149大范围核酸酶的氨基酸序列。

SEQ ID NO:428显示了LOX 3-4m.150大范围核酸酶的氨基酸序列。

SEQ ID NO:429显示了LOX 3-4m.151大范围核酸酶的氨基酸序列。

SEQ ID NO:430显示了LOX 3-4m.152大范围核酸酶的氨基酸序列。

SEQ ID NO:431显示了LOX 3-4m.153大范围核酸酶的氨基酸序列。

SEQ ID NO:432显示了LOX 3-4m.154大范围核酸酶的氨基酸序列。

SEQ ID NO:433显示了LOX 3-4m.155大范围核酸酶的氨基酸序列。

SEQ ID NO:434显示了具有GTGA中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:435显示了具有GTGA中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:436显示了LOX 3-4m.31大范围核酸酶的氨基酸序列。

SEQ ID NO:437显示了LOX 3-4m.32大范围核酸酶的氨基酸序列。

SEQ ID NO:438显示了LOX 3-4m.33大范围核酸酶的氨基酸序列。

SEQ ID NO:439显示了LOX 3-4m.35大范围核酸酶的氨基酸序列。

SEQ ID NO:440显示了LOX 3-4m.36大范围核酸酶的氨基酸序列。

SEQ ID NO:441显示了LOX 3-4m.37大范围核酸酶的氨基酸序列。

SEQ ID NO:442显示了LOX 3-4m.38大范围核酸酶的氨基酸序列。

SEQ ID NO:443显示了LOX 3-4m.39大范围核酸酶的氨基酸序列。

SEQ ID NO:444显示了LOX 3-4m.40大范围核酸酶的氨基酸序列。

SEQ ID NO:445显示了LOX 3-4m.41大范围核酸酶的氨基酸序列。

SEQ ID NO:446显示了LOX 3-4m.42大范围核酸酶的氨基酸序列。

SEQ ID NO:447显示了LOX 3-4m.43大范围核酸酶的氨基酸序列。

SEQ ID NO:448显示了LOX 3-4m.44大范围核酸酶的氨基酸序列。

SEQ ID NO:449显示了LOX 3-4m.46大范围核酸酶的氨基酸序列。

SEQ ID NO:450显示了LOX 3-4m.47大范围核酸酶的氨基酸序列。

SEQ ID NO:451显示了LOX 3-4m.48大范围核酸酶的氨基酸序列。

SEQ ID NO:452显示了LOX 3-4m.49大范围核酸酶的氨基酸序列。

SEQ ID NO:453显示了LOX 3-4m.50大范围核酸酶的氨基酸序列。

SEQ ID NO:454显示了LOX 3-4m.51大范围核酸酶的氨基酸序列。

SEQ ID NO:455显示了LOX 3-4m.52大范围核酸酶的氨基酸序列。

SEQ ID NO:456显示了LOX 3-4m.53大范围核酸酶的氨基酸序列。

SEQ ID NO:457显示了LOX 3-4m.54大范围核酸酶的氨基酸序列。

SEQ ID NO:458显示了LOX 3-4m.56大范围核酸酶的氨基酸序列。

SEQ ID NO:459显示了LOX 3-4m.57大范围核酸酶的氨基酸序列。

SEQ ID NO:460显示了LOX 3-4m.58大范围核酸酶的氨基酸序列。

SEQ ID NO:461显示了LOX 3-4m.59大范围核酸酶的氨基酸序列。

SEQ ID NO:462显示了LOX 3-4m.61大范围核酸酶的氨基酸序列。

SEQ ID NO:463显示了具有GTGC中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:464显示了具有GTGC中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:465显示了LOX 3-4m.156大范围核酸酶的氨基酸序列。

SEQ ID NO:466显示了LOX 3-4m.157大范围核酸酶的氨基酸序列。

SEQ ID NO:467显示了LOX 3-4m.158大范围核酸酶的氨基酸序列。

SEQ ID NO:468显示了LOX 3-4m.159大范围核酸酶的氨基酸序列。

SEQ ID NO:469显示了LOX 3-4m.160大范围核酸酶的氨基酸序列。

SEQ ID NO:470显示了LOX 3-4m.161大范围核酸酶的氨基酸序列。

SEQ ID NO:471显示了LOX 3-4m.162大范围核酸酶的氨基酸序列。

SEQ ID NO:472显示了LOX 3-4m.163大范围核酸酶的氨基酸序列。

SEQ ID NO:473显示了LOX 3-4m.164大范围核酸酶的氨基酸序列。

SEQ ID NO:474显示了LOX 3-4m.165大范围核酸酶的氨基酸序列。

SEQ ID NO:475显示了LOX 3-4m.166大范围核酸酶的氨基酸序列。

SEQ ID NO:476显示了LOX 3-4m.167大范围核酸酶的氨基酸序列。

SEQ ID NO:477显示了LOX 3-4m.168大范围核酸酶的氨基酸序列。

SEQ ID NO:478显示了LOX 3-4m.169大范围核酸酶的氨基酸序列。

SEQ ID NO:479显示了LOX 3-4m.170大范围核酸酶的氨基酸序列。

SEQ ID NO:480显示了LOX 3-4m.171大范围核酸酶的氨基酸序列。

SEQ ID NO:481显示了LOX 3-4m.172大范围核酸酶的氨基酸序列。

SEQ ID NO:482显示了LOX 3-4m.173大范围核酸酶的氨基酸序列。

SEQ ID NO:483显示了LOX 3-4m.174大范围核酸酶的氨基酸序列。

SEQ ID NO:484显示了LOX 3-4m.175大范围核酸酶的氨基酸序列。

SEQ ID NO:485显示了LOX 3-4m.176大范围核酸酶的氨基酸序列。

SEQ ID NO:486显示了LOX 3-4m.177大范围核酸酶的氨基酸序列。

SEQ ID NO:487显示了LOX 3-4m.178大范围核酸酶的氨基酸序列。

SEQ ID NO:488显示了LOX 3-4m.179大范围核酸酶的氨基酸序列。

SEQ ID NO:489显示了LOX 3-4m.180大范围核酸酶的氨基酸序列。

SEQ ID NO:490显示了LOX 3-4m.181大范围核酸酶的氨基酸序列。

SEQ ID NO:491显示了LOX 3-4m.182大范围核酸酶的氨基酸序列。

SEQ ID NO:492显示了LOX 3-4m.183大范围核酸酶的氨基酸序列。

SEQ ID NO:493显示了LOX 3-4m.184大范围核酸酶的氨基酸序列。

SEQ ID NO:494显示了LOX 3-4m.185大范围核酸酶的氨基酸序列。

SEQ ID NO:495显示了LOX 3-4m.186大范围核酸酶的氨基酸序列。

SEQ ID NO:496显示了具有GTGG中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:497显示了具有GTGG中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:498显示了LOX 3-4m.187大范围核酸酶的氨基酸序列。

SEQ ID NO:499显示了LOX 3-4m.192大范围核酸酶的氨基酸序列。

SEQ ID NO:500显示了LOX 3-4m.201大范围核酸酶的氨基酸序列。

SEQ ID NO:501显示了LOX 3-4m.203大范围核酸酶的氨基酸序列。

SEQ ID NO:502显示了具有GTGT中心序列的LOX 3-4识别序列(正义)的核酸。

SEQ ID NO:503显示了具有GTGT中心序列的LOX 3-4识别序列(反义)的核酸。

SEQ ID NO:504显示了LOX 3-4m.63大范围核酸酶的氨基酸序列。

SEQ ID NO:505显示了LOX 3-4m.64大范围核酸酶的氨基酸序列。

SEQ ID NO:506显示了LOX 3-4m.65大范围核酸酶的氨基酸序列。

SEQ ID NO:507显示了LOX 3-4m.66大范围核酸酶的氨基酸序列。

SEQ ID NO:508显示了LOX 3-4m.67大范围核酸酶的氨基酸序列。

SEQ ID NO:509显示了LOX 3-4m.68大范围核酸酶的氨基酸序列。

SEQ ID NO:510显示了LOX 3-4m.69大范围核酸酶的氨基酸序列。

SEQ ID NO:511显示了LOX 3-4m.70大范围核酸酶的氨基酸序列。

SEQ ID NO:512显示了具有LOX 3-4m.71中心序列的大范围核酸酶的氨基酸。

SEQ ID NO:513显示了具有LOX 3-4m.73中心序列的大范围核酸酶的氨基酸。

SEQ ID NO:514显示了LOX 3-4m.74大范围核酸酶的氨基酸序列。

SEQ ID NO:515显示了LOX 3-4m.75大范围核酸酶的氨基酸序列。

SEQ ID NO:516显示了LOX 3-4m.77大范围核酸酶的氨基酸序列。

SEQ ID NO:517显示了LOX 3-4m.78大范围核酸酶的氨基酸序列。

SEQ ID NO:518显示了LOX 3-4m.80大范围核酸酶的氨基酸序列。

SEQ ID NO:519显示了LOX 3-4m.83大范围核酸酶的氨基酸序列。

SEQ ID NO:520显示了LOX 3-4m.84大范围核酸酶的氨基酸序列。

SEQ ID NO:521显示了LOX 3-4m.85大范围核酸酶的氨基酸序列。

SEQ ID NO:522显示了LOX 3-4m.86大范围核酸酶的氨基酸序列。

SEQ ID NO:523显示了LOX 3-4m.87大范围核酸酶的氨基酸序列。

SEQ ID NO:524显示了LOX 3-4m.88大范围核酸酶的氨基酸序列。

SEQ ID NO:525显示了LOX 3-4m.89大范围核酸酶的氨基酸序列。

SEQ ID NO:526显示了LOX 3-4m.90大范围核酸酶的氨基酸序列。

SEQ ID NO:527显示了LOX 3-4m.91大范围核酸酶的氨基酸序列。

SEQ ID NO:528显示了LOX 3-4m.92大范围核酸酶的氨基酸序列。

SEQ ID NO:529显示了LOX 3-4m.93大范围核酸酶的氨基酸序列。

SEQ ID NO:530显示了多肽接头的氨基酸序列。

具体实施方式

1.1引用和定义

本文引用的专利和科学文献建立了本领域技术人员可用的知识。本文引用的授权美国专利、授权申请、公开的外国申请和包括GenBank数据库序列的参考文献通过引用并入本文，引用程度如同每一个被具体和单独地指出以通过引用并入。

本发明可以以不同的形式实施，并且不应该被解释为限于本文列出的实施方式。相反，提供这些实施方式以使本公开内容详细和完整，并将本发明的范围充分传达给本领域技术人员。例如，关于一个实施方式示出的特征可以被并入其他实施方式中，并且关于特定实施方式示出的特征可以从该实施方式中删除。此外，根据本公开内容，对本文提出的实施方式的许多变化和添加对于本领域技术人员将是明显的，其不脱离本发明。

除非另外定义，否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。在本发明的说明书中使用的术语仅用于描述特定实施方式的目的，而不旨在限制本发明。

本文提及的所有出版物、专利申请、专利和其他参考文献通过引用整体并入本文。

如本文所用，“一个/一种(a/an)”或“该(the)”可以指一个或多于一个。例如，“一个”细胞可以指单个细胞或多个细胞。

如本文所用，除非另外特别指出，否则词语“或”以“和/或”的包含性含义使用，而不是“任一/或”的排他性含义。

如本文所用，术语“核酸酶”和“核酸内切酶”可互换使用，指切割多核苷酸链内的磷酸二酯键的天然存在的或工程化的酶。

如本文所用，术语“切割”或“切割的”指靶序列内识别序列骨架内磷酸二酯键的水解，导致靶序列内的双链断裂，本文中称为“切割位点”。在本文所述的一些实施方式中，在对应于I-CreI(即，SEQ ID NO:1)的位置48、50、71、72、73、73B和74的一个或多个位置处的修饰或置换增加工程化大范围核酸酶的切割活性。

如本文所用，术语“大范围核酸酶”指在大于12个碱基对的识别序列处结合双链DNA的核酸内切酶。在一些实施方式中，针对本公开内容的大范围核酸酶的识别序列是22个碱基对。大范围核酸酶可以是来源于I-CreI(SEQ ID NO:1)的核酸内切酶，并且可以指相对于天然I-CreI已被修饰的I-CreI的工程化变体，例如，针对DNA结合特异性、DNA切割活性、DNA结合亲和性或二聚化性质。产生此类修饰的I-CreI变体的方法是本领域公知的(例如，WO2007/047859，通过引用整体并入)。如本文所用的大范围核酸酶作为异二聚体结合至双链DNA。大范围核酸酶也可以是“单链大范围核酸酶”，其中一对DNA结合结构域使用肽接头连接成单个多肽。术语“归巢核酸内切酶”与术语“大范围核酸酶”同义。本公开内容的大范围核酸酶当在细胞中表达时，尤其是在人免疫细胞中表达时，其基本上是无毒的，这样当使用本文所述的方法测量时，细胞可以被转染并维持在37℃而不会观察到对细胞活力的有害影响或大范围酶切割活性的显着降低。

如本文所用，术语“单链大范围核酸酶”指包含通过接头连接的核酸酶亚基对。单链大范围核酸酶具有以下组织：N-末端亚基-接头-C-末端亚基。两个大范围核酸酶亚基的氨基酸序列通常将是不同的，并且将结合不同DNA序列。因此，单链大范围核酸酶通常切割伪回文或非回文识别序列。在WO 2009/059195中公开了是单链大范围核酸酶的工程化I-CreI衍生的大范围核酸酶，以及用于产生其的方法，其通过引用并入本文。可以将单链大范围核酸酶称为“单链异二聚体”或“单链异二聚体大范围核酸酶”，但其实际上不是二聚体。为清楚起见，除非另有说明，否则术语“大范围核酸酶”可以指二聚体或单链大范围核酸酶。

如本文所用，术语“接头”指用于将两个核酸酶亚基连接成单个多肽的外源肽序列。接头可具有在天然蛋白质中发现的序列，或者可以是在任何天然蛋白质中未发现的人工序列。接头可以是柔性的并且缺乏二级结构或者可能具有在生理条件下形成特定三维结构的倾向。接头可以包括但不限于美国专利号8,445,251、9,340,777、9,434,931和10,041,053所涵盖的那些，其每一个的全部内容通过引用并入。在一些实施方式中，接头可以与SEQID NO:530具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更高序列同一性，所述SEQ ID NO:530显示了SEQ ID NO:11-33、36-43、46-67、70-89、92-118、121-135、138-156、159-183、186-199、202-219、222-243、246-247、250-266、269-291、294-313、316-325、328-330、333-340、343-357、360-389、392-399、402-433、436-462、465-495、498-501和504-529的残基154-195。

如本文所用，术语“高变区”是指大范围核酸酶单体或亚基内的局部序列，其包含具有相对高可变性的氨基酸。高变区可以包含约50-60个连续的残基、约53-57个连续的残基或者优选地约56个残基。在一些实施方式中，高变区的残基可以对应于SEQ ID NO:11-33、36-43、46-67、70-89、92-118、121-135、138-156、159-183、186-199、202-219、222-243、246-247、250-266、269-291、294-313、316-325、328-330、333-340、343-357、360-389、392-399、402-433、436-462、465-495、498-501和504-529的任一项的位置24-79或位置215-270。尽管位置48、50、71、72、73和74位于高变区内，但据认为这些位置影响中心序列的切割，并且不一定影响大范围核酸酶与特定识别序列位点的结合。因此，当设计针对具有相同中心序列的两个不同识别序列的两个大范围核酸酶时，可能不需要修饰两个大范围核酸酶之间的位置48、50、71、72、73和74。高变区可以包含一个或多个与识别序列中的DNA碱基接触的残基，并且可以被修饰以改变单体或亚基的碱基偏好。当大范围核酸酶与双链DNA识别序列结合时，高变区还可以包含一个或多个与DNA骨架结合的残基。可以修饰此类残基以改变大范围核酸酶对DNA骨架和靶识别序列的结合亲和性。在本发明的不同实施方式中，高变区可以包含1-20个残基，这些残基表现出可变性并且可以被修饰以影响碱基偏好和/或DNA结合亲和性。在特定实施方式中，高变区可以包含约15-20个之间的残基，这些残基表现出可变性并且可以被修饰以影响碱基偏好和/或DNA结合亲和性。在一些实施方式中，高变区内的可变残基对应于SEQ ID NO:11-33、36-43、46-67、70-89、92-118、121-135、138-156、159-183、186-199、202-219、222-243、246-247、250-266、269-291、294-313、316-325、328-330、333-340、343-357、360-389、392-399、402-433、436-462、465-495、498-501和504-529的任一项的位置24、26、28、30、32、33、38、40、42、44、46、68、70、75和77的一个或多个。在其他实施方式中，高变区内的可变残基对应于SEQ ID NO:11-33、36-43、46-67、70-89、92-118、121-135、138-156、159-183、186-199、202-219、222-243、246-247、250-266、269-291、294-313、316-325、328-330、333-340、343-357、360-389、392-399、402-433、436-462、465-495、498-501和504-529的任一项的位置215、217、219、221、223、224、229、231、233、235、237、259、261、266和268的一个或多个。

如本文所用，关于蛋白质，术语“重组”或“工程化”指由于将基因工程技术应用于编码蛋白质的核酸以及表达蛋白质的细胞或生物体而具有改变的氨基酸序列。关于核酸，术语“重组”或“工程化”是指由于应用基因工程技术而具有改变的核酸序列。基因工程技术包括但不限于PCR和DNA克隆技术；转染、转化和其他基因转移技术；同源重组；定点诱变；和基因融合。根据该定义，具有与天然存在的蛋白质相同的氨基酸序列但通过在异源宿主中克隆和表达产生的蛋白质并不被认为是重组或工程化的。

如本文所用，术语“野生型”是指相同类型基因的等位基因群中最常见的天然存在的等位基因(即，多核苷酸序列)，其中由野生型等位基因编码的多肽具有其原始功能。术语“野生型”还指由野生型等位基因编码的多肽。野生型等位基因(即多核苷酸)和多肽可与相对于野生型序列包含一个或更多个突变和/或替换的突变体或变体等位基因和多肽区分开来。鉴于野生型等位基因或多肽可以赋予生物体正常表型，因此在一些情况下，突变体或变体等位基因或多肽可赋予改变的表型。野生型核酸酶与重组或非天然存在的核酸酶是可区分的。术语“野生型”还可以指具有特定基因的野生型等位基因的细胞、生物体和/或受试者，或用于比较目的的细胞、生物体和/或受试者。

如本文所用，术语“遗传修饰的”指细胞或生物体，其中或其祖先的基因组DNA序列已通过重组技术被有意修饰。如本文所用，术语“遗传修饰的”包含术语“转基因”。

如本文所用，关于重组蛋白，术语“修饰”是指重组序列中的氨基酸残基相对于参考序列(例如，野生型或天然序列)的任何插入、缺失或置换。

如本文所用，术语“识别序列”指被本公开内容的野生型I-CreI或工程化I-CreI衍生的大范围核酸酶结合并切割的DNA序列。被I-CreI和所公开的工程化大范围核酸酶切割的所公开的识别序列通常长度为22个核苷酸。这些识别序列包含一对反向的，9碱基对的“半位点”(每个编号从－1到－9)，其被4碱基对的中心序列(编号+1、+2、+3和+4)所分隔(图1)。在单链大范围核酸酶的情况下，蛋白的N末端结构域识别、相互作用和/或接触一个半位点，以及蛋白的C末端结构域识别、相互作用和/或接触另一个半位点。由大范围核酸酶的切割产生四碱基对3’“突出端”。“突出端”或“粘性末端”是短的单链DNA片段，其可以通过对双链DNA序列进行核酸内切酶切割而产生。在衍生自I-CreI的大范围核酸酶和单链大范围核酸酶的情况下，突出端包含碱基10-13，所述碱基10-13包含22碱基对识别序列。因此，I-CreI大范围核酸酶识别序列可以根据式I定义：

X_-9X_-8X_-7X_-6X_-5X_-4X_-3X_-2X_-1N₊₁N₊₂N₊₃N₊₄X_-1X_-2X_-3X_-4X_-5X_-6X_-7X_-8X_-9，

其中X和N各自独立地为选自腺嘌呤核苷酸、胞嘧啶核苷酸、鸟嘌呤核苷酸和胸腺嘧啶核苷酸的核苷酸；其中N₊₁N₊₂N₊₃N₊₄是四碱基对中心序列。

如本文所用，术语“中心序列”是指在大范围核酸酶识别序列中分隔半位点的四个碱基对。这些碱基编号为+1至+4(图1和式1)。中心序列包含在大范围核酸酶切割后变成3’单链突出端的四个碱基。“中心序列”可指正义链或反义(相反)链的序列。大范围核酸酶是对称的并且同等地识别中心序列的正义和反义链上的碱基。例如，正义链上的序列A₊₁A₊₂A₊ ₃A₊₄被大范围核酸酶识别、相互作用和/或接触，反义链上的T₊₁T₊₂T₊₃T₊₄同样如此，因此，A₊ ₁A₊₂A₊₃A₊₄和T₊₁T₊₂T₊₃T₊₄在功能上等同(例如，两者都可被给定的大范围核酸酶切割)。因此，序列C₊₁T₊₂G₊₃C₊₄相当于其相反链序列G₊₁C₊₂A₊₃G₊₄，因为大范围核酸酶将其识别序列结合为对称的同型二聚体。在大多数情况下，大范围核酸酶的第一亚基识别、相互作用和/或接触给定中心序列的第一两个碱基对和反义链上的第二两个碱基对。例如，以A₊₁A₊₂A₊₃A₊₄作为中心序列，第一亚基将识别、相互作用和/或接触两个碱基对A₊₁A₊₂，第二亚基将识别、相互作用和/或接触反义链上的两个碱基对A₊₃A₊₄，即T₊₄T₊₃。

如本文所用，术语“识别半位点”、“识别序列半位点”或简单地“半位点”是指双链DNA分子中的核酸序列，其是同型二聚体或异型二聚体大范围核酸酶与单链大范围核酸酶结合(例如，识别)或通过单链大范围核酸酶的一个亚基结合的单体。

如本文所用，术语“中心序列半位点”或简单地“中心半位点”是指如本文所述的识别序列的四碱基对中心序列的5’两个碱基对或3’两个碱基对。例如，对于中心序列ACAG，中心序列的5’两个碱基对(即，5’中心半位点)是“AC”和3’两个碱基对(即，3’中心半位点)是“AG”(反向互补是“CT”)。

如本文所用，术语大范围核酸酶“衍生自I-CreI”或“I-CreI衍生自大范围核酸酶”指天然存在的I-CreI归巢核酸内切酶(SEQ ID NO:1)的重组变体，其已通过影响DNA结合特异性、DNA切割活性和/或DNA结合亲和性和/或二聚化性质中的一种或多种的一个或多个氨基酸插入、缺失和/或置换而被修饰。一些基因工程化的大范围核酸酶是本领域公知的(参见，例如，Porteus等，(2005),Nat.Biotechnol.23:967-73；Sussman等，(2004),J.Mol.Biol.342:31-41；Epinat等，(2003),Nucleic Acids Res.31:2952-62)以及合理设计此类变体的一般方法已公开在例如WO 2007/047859中。I-CreI衍生的大范围核酸酶包括其中ICreI被直接修饰的工程化蛋白，其中I-CreI衍生的大范围核酸酶被进一步修饰的工程化蛋白，和/或基于I-CreI衍生的序列合成产生的蛋白。如本文所用，术语“变体”旨在指基本上相似的序列。“变体”多肽旨在指通过在天然蛋白的一个或多个内部位点缺失或添加一个或多个氨基酸和/或在天然多肽的一个或多个位点置换一个或多个氨基酸而衍生自“天然”多肽的多肽。如本文所用，“天然”多核苷酸或多肽包含衍生变体的亲本序列。在一些实施方式中，“I-CreI衍生的大范围核酸酶”具体地包括在国际公开号WO2007/047859、WO2009059195、WO2010/009147、WO2012/167192、WO2015/138739、WO2016/179112、WO2017/044649、WO2017/062439、WO2017/062451、WO2017/112859、WO2017/192741、WO2018/071849、WO2018/195449、WO2019/005957、WO2019/089913、WO2019/200122和WO2019/200247，以及国际公开号PCT/US2019/068186和PCT/US2020/013198的任何一个的所公布的权利要求的范围内的任何工程化大范围核酸酶，其每一个的全部内容通过引用并入本文。在一些实施方式中，“I-CreI衍生的大范围核酸酶”具体地包括在美国专利号8,021,867、美国专利号8,119,361、美国专利号8,119,381、美国专利号8,124,369、美国专利号8,129,134、美国专利号8,133,697、美国专利号8,143,015、美国专利号8,143,016、美国专利号8,148,098、美国专利号8,163,514、美国专利号8,304,222、美国专利号8,377,674、美国专利号8,445,251、美国专利号9,340,777、美国专利号9,434,931、美国专利号10,041,053、美国专利号9,683,257、美国专利号10,287,626、美国专利号10,273,524、美国专利号9,683,257、美国专利号10,287,626、美国专利号10,273,524、美国专利号9,822,381、美国专利号10,603,363、美国专利号9,889,160、美国专利号9,889,161、美国专利号9,993,501、美国专利号9,993,502、美国专利号9,950,010、美国专利号9,950,011、美国专利号9,969,975、美国专利号10,093,899和美国专利号10,093,900的任何一个授权的权利要求的范围内的任何工程化大范围核酸酶，其每一个均通过引用并入本文。在一些实施方式中，工程化I-CreI衍生的大范围核酸酶包含与SEQ ID NO:1的I-CreI大范围核酸酶的残基2-153具有至少85％序列同一性的多肽，如美国专利号8,021,867、美国专利号8,119,361、美国专利号8,119,381、美国专利号8,124,369、美国专利号8,129,134、美国专利号8,133,697、美国专利号8,143,015、美国专利号8,143,016、美国专利号8,148,098、美国专利号8,163,514、美国专利号8,304,222、美国专利号8,377,674的每一个的授权权利要求中所述的。在一些实施方式中，工程化I-CreI衍生的大范围核酸酶包含与SEQ ID NO:1的I-CreI大范围核酸酶的残基2-153具有至少86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％序列同一性的多肽。

如本文所用，术语“DNA结合亲和性”或“结合亲和性”是指核酸酶与参考DNA分子(例如，识别序列或任意序列)非共价缔合的倾向。结合亲和性由解离常数Kd度量。如本文所使用的，如果核酸酶对参照识别序列的Kd相对于参照核酸酶增加或减少统计学上显著的百分比变化，则核酸酶具有“改变”的结合亲和性。

如本文所用，术语“特异性”是指核酸酶仅在称为识别序列的特定碱基对序列处或仅在一组特定识别序列处结合(例如，识别)和切割双链DNA分子的能力。一组识别序列将共享某些保守位置或序列基序，但可能在一个或多个位置简并。高度特异性的核酸酶只能切割一个或极少数识别序列。可以通过本领域公知的任何方法确定特异性。

如本文所用，术语“活性”指本发明的大范围核酸酶切割特定识别序列的速率。此类活性是可测量的酶促反应，涉及双链DNA的磷酸二酯键的水解。作用于特定NDA底物的大范围核酸酶的活性受大范围核酸酶对该特定DNA底物的亲和性或亲合力的影响，而亲和性或亲合力又受与DNA的序列特异性和非序列特异性相互作用的影响。

如本文所用，当提及大范围核酸酶时，术语“改变的特异性”指核酸酶结合并切割识别序列，所述识别序列在生理条件下不结合参考核酸酶(例如，野生型)并被其切割，或相对于参考核酸酶，识别序列的切割速率增加或降低生物学显著量(例如，至少2×或2×-10×)。

如本文关于氨基酸序列和核酸序列两者所使用的，术语“百分比同一性”、“序列同一性”、“百分比相似性”、“序列相似性”等是指基于使比对的氨基酸残基或核苷酸之间的相似性最大化的序列比对的两个序列的相似性程度的度量，并且其为相同或相似残基或核苷酸的数目、总残基或核苷酸的数目、以及序列比对中缺口的存在和长度的函数。多种算法和计算机程序可用于使用标准参数确定序列相似性。如本文所使用的，序列相似性是使用用于氨基酸序列的BLASTp程序和用于核酸序列的BLASTn程序测量的，两者均可通过国家生物技术信息中心(www.ncbi.nlm.nih.gov/)获得，并且在例如在以下中描述：Altschul等，(1990),J.Mol.Biol.215:403-410；Gish和States(1993),Nature Genet.3:266-272；Madden等，(1996),Meth.Enzymol.266:131-141；Altschul等，(1997),Nucleic AcidsRes.25:3389-3402)；Zhang等，(2000),J.Comput.Biol.7(1-2):203-14。如本文所用，两个氨基酸序列的百分比相似性是基于BLASTp算法的以下参数的得分：字长＝3；缺口空位罚分＝-11；缺口延伸罚分＝-1；和评分矩阵＝BLOSUM62。如本文所用的，两个核酸序列的百分比相似性是基于BLASTn算法的以下参数的得分：字长＝11；缺口空位罚分＝-5；缺口延伸罚分＝-2；匹配奖励＝1；和错配罚分＝-3。

如本文关于两个蛋白质或氨基酸序列的修饰所使用的，术语“对应于”用于表示第一蛋白质中的指定修饰是与第二蛋白质的修饰中相同氨基酸残基的替换，并且当两种蛋白质进行标准序列比对(例如，使用BLASTp程序)时，第一蛋白质中的修饰氨基酸位置与第二蛋白质中的修饰氨基酸位置对应或对齐。因此，如果在序列比对中残基X和Y彼此对应，则尽管X和Y可能是不同的数字，但第一蛋白质中残基“X”修饰成氨基酸“A”将对应于在第二蛋白质中残基“Y”修饰成氨基酸“A”。

如本文所用，术语“重组DNA构建体”、“重组构建体”、“表达盒”、“表达构建体”、“嵌合构建体”、“构建体”和“重组DNA片段”在本文中可互换地使用，并且是单链或双链多核苷酸。重组构建体包含单链或双链多核苷酸的人工组合，包括但不限于没有在自然界中发现的调控序列和编码序列。例如，重组DNA构建体可包含源自不同来源的调控序列和编码序列，或源自相同来源并以不同于自然界中发现的方式排列的调控序列和编码序列。这样的构建体可以单独使用或者可以与载体一起使用。

如本文所用，“载体”或“重组DNA载体”可以是包含能够在给定宿主细胞中转录和翻译多肽编码序列的复制系统和序列的构建体。如果使用载体，则载体的选择取决于将用于转化宿主细胞的方法，这是本领域技术人员公知的。载体可以包括但不限于质粒载体和重组AAV载体，或本领域已知的适合将编码本发明的大范围核酸酶的基因递送至靶细胞的任何其他载体。本领域技术人员熟知载体上必须存在以便成功转化、选择和繁殖包含本发明的任何分离的核苷酸或核酸序列的宿主细胞的遗传元件。在一些实施方式中，“载体”也可以指重组病毒载体(即，重组病毒)。重组病毒载体(例如，重组病毒)可以包括但不限于逆转录病毒载体(即，逆转录病毒)、慢病毒载体(即，慢病毒)、腺病毒载体(即，腺病毒)和腺相关病毒载体(例如，腺相关病毒(AAV))。

如本文所用，对变量的数值范围的叙述旨在传达可以用等于该范围内的任何值的变量来实践本发明。因此，对于固有离散的变量，变量可以等于该数值范围内的任何整数值，包括范围的终点。类似地，对于固有连续的变量，变量可以等于数值范围内的任何实数值，包括范围的终点。作为示例而非限制，如果变量是固有离散的，则被描述为具有在0和2之间的值的变量可以取值0、1或2；而如果变量固有连续，则可以取值0.0、0.1、0.01、0.001或≥0且≤2的任何其他实数值。

2.1本发明的原理

本发明部分基于I-CreI内的位置和残基的鉴定，所述位置和残基可被修饰以改善包含某些4碱基对中心序列的识别序列的切割活性。有四种DNA碱基(A、C、G和T)，因此有256种长度为四碱基对的可能的DNA序列。如在WO2010/009147中所描述的，这些可能的序列通过工程化的、I-CreI衍生的具有不同效率的大范围核酸酶切割。以前认为野生型I-CreI不与四碱基对中心序列明显接触或相互作用，因此，以前没有考虑I-CreI内残基的修饰可提高大范围核酸酶对具有给定中心序列的识别序列的切割效率和/或特异性。

然而，如本文所述，已经发现修饰I-CreI衍生的大范围核酸酶中的特定残基可以提高具有某些四碱基对中心序列的识别序列的切割效率。发现影响I-CreI衍生的大范围核酸酶切割中心序列的能力的位置包括对应于I-CreI的位置48、50、71、72、73、73B和74的位置。不受任何理论的束缚，认为这些序列有助于DNA双螺旋、水分子和/或必需的金属辅因子在大范围核酸酶结合口袋内的定位(参见图4所示的晶体结构)。应当理解，大范围核酸酶的高变区中残基的修饰不会明显影响本文所述的中心序列的切割，因为这些高变区残基主要与DNA骨架相互作用，从而允许大范围核酸酶结合特定的22碱基对识别序列。因此，结合不一定赋予大范围核酸酶的切割活性。例如，给定具有TCAA作为中心序列的识别序列，在对应于本文所述I-CreI的位置48、50、71、72、73、73B和74具有未修饰残基的大范围核酸酶将与其识别序列结合但不切割TCAA中心序列。如本文所述的大范围核酸酶中残基48、50、71、72、73、73B和74中的一个或多个的修饰然后将赋予或改善该中心序列(例如，TCAA)的切割活性。

如本文所证明的，这些特定残基的修饰大大增加了具有此前难以切割的特定中心序列的识别序列的切割效率。例如，中心序列TTGA(反向互补TCAA)和CCGT(反向互补ACGG)此前被描述为具有通过工程化大范围核酸酶的低切割效率(参见，Arnould,等，(2007).J.Mol.Biol.371:49-65和WO 2010/009147)。然而，通过根据本发明进行置换，新的工程化大范围核酸酶表现出包含TCAA(即，TTGA)中心序列的识别序列的切割增加38倍，和包含ACGG(即，CCGT)中心序列的识别序列的切割增加21倍(分别参见实施例23和实施例7)。因此，本发明提供了I-CreI衍生的工程化大范围核酸酶，其在特定位置具有置换，这增加了核酸酶对包含某些四碱基对中心序列的识别序列的活性。本发明还提供了使用这种工程化大范围核酸酶切割双链DNA的方法。本发明还提供了提高包含某些四碱基对中心序列的识别序列的工程化大范围核酸酶活性的方法。

2.2针对特定中心序列优化的工程化大范围核酸酶

本领域已知可以使用位点特异性核酸酶在活细胞的基因组中产生DNA断裂，并且这种DNA断裂可以通过与转基因DNA序列的同源重组导致基因组的永久修饰。已知使用核酸酶诱导靶基因座中的双链断裂可刺激同源重组，特别是侧翼为与基因组靶同源的序列的转基因DNA序列的同源重组。以这种方式，可将外源核酸序列插入靶基因座。

本领域已知可以使用位点特异性核酸酶在活细胞的基因组中产生DNA断裂，并且这种DNA断裂可以通过诱变NHEJ修复或通过与转基因DNA序列的同源重组导致基因组的永久修饰。NHEJ可以在切割位点产生诱变，导致等位基因失活。NHEJ相关诱变可通过产生早期终止密码子，产生异常非功能性蛋白质的移码突变或可触发机制如无义介导的mRNA衰变而使等位基因失活。使用核酸酶通过NHEJ诱导诱变可用于靶向野生型等位基因中存在的特定突变或序列。此外，已知使用核酸酶诱导靶基因座中的双链断裂可刺激同源重组，特别是侧翼为与基因组靶同源的序列的转基因DNA序列的同源重组。以这种方式，可将外源核酸序列插入靶基因座。这样的外源核酸可以编码所关注的任何序列或多肽。

如本文所公开的，用于实施本发明的核酸酶是大范围核酸酶。在一些实施方式中，用于实施本发明的核酸酶是单链大范围核酸酶。单链大范围核酸酶包含通过接头肽连接的N末端亚基和C末端亚基。两个结构域中的每一个识别并结合识别序列的一半(即，识别半位点)，并且DNA切割位点位于识别序列的中间，靠近两个亚基的界面。DNA链断裂偏移四个碱基对，使得DNA被大范围核酸酶切割产生一对四碱基对，3’单链突出端。在一些实施方式中，本发明的工程化大范围核酸酶已被工程化以结合并切割具有特定中心序列的识别序列。

本发明的工程化大范围核酸酶包含以下：包含第一高变(HVR1)区的第一亚基和包含第二高变(HVR2)区的第二亚基。此外，第一亚基与识别序列中的第一识别半位点结合，第二亚基与识别序列中的第二识别半位点结合。在其中所述工程化大范围核酸酶是单链大范围核酸酶的实施方式中，第一和第二亚基可以定向为使得包含HVR1区域并且结合第一半位点的第一亚基定位为N末端亚基，并且包含HVR2区域并且结合第二半位点的第二亚基定位为C末端亚基。在替代实施方式中，可以将第一和第二亚基定向以使得包含HVR1区域并结合第一个半位点的第一亚基定位为C末端亚基，并且包含HVR2区域并结合第二个半位点的第二亚基定位为N末端亚基。如本文所公开的，对大范围核酸酶的某些修饰(例如，在位置48、50、71、72、73、73B和74)赋予对具有某些四碱基对中心序列的识别序列的增加的切割。在SEQ ID NO:11-33、36-43、46-67、70-89、92-118、121-135、138-156、159-183、186-199、202-219、222-243、246-247、250-266、269-291、294-313、316-325、328-330、333-340、343-357、360-389、392-399、402-433、436-462、465-495、498-501和504-529中提供了证明改善包含某些中心序列的识别序列的切割的本发明示例性工程化大范围核酸酶。

在特定实施方式中，本发明的工程化大范围核酸酶是同二聚体或异二聚体，其中二聚体的两个亚基中的每一个衍生自SEQ ID NO:1(即，I-CreI)。本文公开的工程化大范围核酸酶可以在单个亚基中包含修饰(例如，置换)，或在两个亚基中包含修饰，其赋予工程化大范围核酸酶对于包含特定中心序列的识别序列的增加的活性(例如，增加的切割活性)。

在一些实例中，I-CreI衍生的大范围核酸酶的第一或第二亚基可以与野生型I-CreI(SEQ ID NO:1)具有至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少96％、至少97％、至少98％、至少99％或至少99.5％序列同一性。在一些实施方式中，任何所公开的工程化大范围核酸酶的第一和/或第二亚基可以与SEQ ID NO:1具有至少75％、至少80％、至少85％、至少88％、至少90％、至少92％、至少94％、至少96％、至少97％、至少98％或至少99％序列同一性，除了在对应于SEQ ID NO:1的位置48、50、71、72、73和74的一个或多个位置处的氨基酸置换以外。

在一些实施方式中，任何所公开的工程化大范围核酸酶的第一和/或第二亚基可以与SEQ ID NO:1具有至少75％、至少80％、至少85％、至少88％、至少90％、至少92％、至少94％、至少96％、至少97％、至少98％或至少99％序列同一性，除了在对应于SEQ ID NO:1的位置48、50、71、72、73、73B和74的一个或多个位置处的氨基酸置换以外。在特定实施方式中，第一或第二亚基的至少一个包含与SEQ ID NO:1具有至少85％序列同一性，除了在对应于SEQ ID NO:1的位置48、50、71、72、73、73B和74的一个或多个位置处的氨基酸置换以外。在一些实施方式中，在对应于SEQ ID NO:1的位置48、50、71、72、73、73B和74的所公开的工程化大范围核酸酶的第一和/或第二亚基的一个或多个位置处的置换是保守置换，如将一个氨基酸与具有类似性质的另一个氨基酸交换。在一些实施方式中，这些位置处的一个或多个带电荷的氨基酸(例如，K48)被类似带电荷的氨基酸置换。在一些实施方式中，这些位置(例如，Q50、S72和S74)处的一个或多个极性氨基酸被类似的极性氨基酸置换。在一些实施方式中，这些位置处的一个或多个带电疏水性酸(例如，G41和V73)被类似的疏水性氨基酸置换。

在一些实施方式中，在所公开的工程化大范围核酸酶的第一和/或第二亚基的一个或多个位置处的置换包括在对应于SEQ ID NO:1的位置48、50、71、72、73、73B和74的两个，三个或多于三个氨基酸位置处的置换。在一些实施方式中，在对应于SEQ ID NO:1的位置48和50的位置进行两个置换。不希望受到特定理论的束缚，认为SEQ ID NO:1的氨基酸位置48和40与水和镁离子形成配位序列。在一些实施方式中，在对应于SEQ ID NO:1的位置71、72、73和74的位置进行三个或四个置换。不希望受到特定理论的束缚，认为SEQ ID NO:1的氨基酸位置71－74(其作为环暴露在蛋白表面)一致起作用。

在特定实例中，工程化大范围核酸酶是单链大范围核酸酶，其中第一亚基和第二亚基通过多肽接头共价连接。在一些实施方式中，肽接头是根据SEQ ID NO:530的。

在特定实施方式中，第一亚基、第二亚基或这两个亚基可以在对应于野生型I-CreI(SEQ ID NO:1)的位置48、50、71、72、73、73B和74的一个或多个位置包含置换。尽管此前报道I-CreI衍生的大范围核酸酶不与四碱基对中心序列相互作用，但本文已证明在这些位置中的一个或多个处的修饰可增加核酸酶对包含特定中心序列的识别序列的活性(例如,切割活性)。本文还公开了可以在第一和/或第二亚基中的其他位置进行置换，这进一步优化工程化大范围核酸酶以获得具有特定中心序列的识别序列。

当产生针对具有特定中心序列的识别序列优化的I-CreI衍生的大范围核酸酶时，修饰对应于I-CreI(SEQ ID NO:1)的位置48、50、71、72、73、73B和74的一个或多个残基。下表1-90描述了本文举例说明的位置和残基。如所示的，“第一亚基”的残基和位置是指工程化大范围核酸酶的亚基的修饰，其结合、相互作用或识别(例如，结合，接触或通常定位在水和金属辅因子周围并与其配位)识别序列的半位点，所述识别序列是中心序列的位置+1和+2的5’上游。类似地，“第二亚基”的残基和位置是指工程化大范围核酸酶的亚基的修饰，其与识别序列的半位点相互作用(例如，结合、接触或通常定位在水和金属辅因子周围并与其配位)，所述识别序列的半位点在中心序列的位置+3和+4的3’下游。

在每个下表中，术语“I-CreI位置”指在野生型I-CreI单体中发现的残基的位置。术语“EN位置”是指在示例性工程化大范围核酸酶中对应于野生型I-CreI残基的残基的实际数字位置。例如，在示例性工程化大范围核酸酶中，核酸酶位置239在第二亚基内并且可以对应于野生型I-CreI的位置48。在一些实例中，将氨基酸插入改造的核酸酶序列中，并相应地改变核酸酶位置的编号。在这种情况下，相同的残基对应于野生型I-CreI残基，即使其在工程化大范围核酸酶中的编号已经改变。例如，在一些情况下，在工程化大范围核酸酶的位置73之后插入R残基，本文称为73B或264B。这使得位置74处的残基位于新的位置75处。在这种情况下，位置75仍然对应于野生型I-CreI的位置74。

在一些实施方式中，所公开的工程化I-CreI衍生的大范围核酸酶结合并切割识别序列，所述识别序列包含中心序列，所述中心序列选自以下：ACXX、TTXX、GCXX和TCXX；识别序列选自以下：XXTT、XXCT、XXAT、XXTC、XXGC、XXGG和XXGT；或识别序列选自以下：XXTT、XXCT、XXAT、XXTC、XXGC、XXGG和XXGT，其中X代表选自A、G、C或T的核苷酸。

在一些实施方式中，所公开的工程化I-CreI衍生的大范围核酸酶结合并切割识别序列，所述识别序列包含中心序列，所述中心序列选自以下：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA和TTAA。在特定实施方式中，所公开的工程化大范围核酸酶结合并切割选自以下的识别序列：ACAA、ACAG、ACAT、ACGC、ACGG和ACGT。在特定实施方式中，所公开的工程化大范围核酸酶结合并切割选自以下的识别序列：ATAA、ATAG、ATAT、ATGA和ATGG。在特定实施方式中，所公开的工程化大范围核酸酶结合并切割选自以下的识别序列：GCAA、GCAT、GCGA和GCAG。在特定实施方式中，所公开的工程化大范围核酸酶结合并切割识别序列TTGG或TTAA。

在特定实施方式中，所公开的工程化大范围核酸酶结合并切割选自ACAA、TTGG和GTAT的识别序列

下表中提供了每个中心序列。一些表提供了亚基中对应于I-CreI的位置48、50、71、72、73、73B和74的一个或多个位置处的经鉴定或例示的残基(例如，针对ACAA，表1和表3)。一些表提供了当靶向特定中心序列时可引入亚基中的一个或多个另外鉴定或例示的位置处的残基(例如，针对ACAA，表2和表4)。

表1：针对ACAA中心序列(第一亚基)的示例性残基

I-CreI位置	48	50	71	72
					EN位置	48	50	71	72
残基	K,L	C,R,T,K,S	G,R	R,Q

表2：针对ACAA中心序列(第一亚基)的示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,G	Q,E	K,R

表3：针对ACAA中心序列(第二亚基)的其他示例性残基

表4：针对ACAA中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	66	80	92	117	139
							EN位置	210	257	271	283	308	330
残基	G,A,S	Y,C	Q,E	Q,R	E,G	K,R

表5：针对ACAG中心序列(第一亚基)的示例性残基

I-CreI位置	50	71	72	73
					EN位置	50	71	72	73
残基	R	G,R	R,K,Q,P,T	A,C

表6：针对ACAG中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	54	80
					EN位置	19	54	80	158
残基	A,G	F,I,L	Q,E	S,P

表7：针对ACAG中心序列(第二亚基)的示例性残基

*是指在对应于I-CreI的位置73的位置后具有插入的工程化大范围核酸酶。

表8：针对ACAG中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	59	66	80	81	139
							EN位置	210	250	257	271	272	330
+1AA*	210	250	257	272*	273*	331*
							残基	G,A,S	V,A	Y,H	Q	I,T	K,R

表9：针对ACAT中心序列(第一亚基)的示例性残基

I-CreI位置	48	50	71	72	73
						EN位置	48	50	71	72	73
残基	K,S,I,L,N	Q,S,R,K	G,R	R,T	A,G

表10：针对ACAT中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	54	80	139
					EN位置	19	54	80	139
残基	A,G,S	F,I	Q,E	K,H,R

表11：针对ACAT中心序列(第二亚基)的示例性残基

表12：针对ACAT中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	80	81	83	117	139
							EN位置	210	271	272	274	308	330
残基	A,G,S	Q,E	I,T	P,H	E,G	K,R,T,H

表13：针对ACGA中心序列(第一亚基)的示例性残基

I-CreI位置	48	50	71	72	73
						EN位置	48	50	71	72	73
残基	K	V,R,T,W,A	G,P	R,P	A

表14：针对ACGA中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,G,S	Q,E	K,R

表15：针对ACGA中心序列(第二亚基)的示例性残基

表16：针对ACGA中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	210	271	330
残基	A,G	Q,E	K,R

表17：针对ACGC中心序列(第一亚基)的示例性残基

I-CreI位置	48	50	71	72	73
						EN位置	48	50	71	72	73
残基	K,H,Q,L,A,S	Q,R,K,S,T,C	G,R,A	R,P,H	A

表18：针对ACGC中心序列(第一亚基)的其他示例性残基

表19：针对ACGC中心序列(第二亚基)的示例性残基

表20：针对ACGC中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	80	87	139
					EN位置	210	271	278	330
残基	A,G	Q,E	F,L	K,R,N,H,A

表21：针对ACGG中心序列(第一亚基)的示例性残基

I-CreI位置	50	72	73
				EN位置	50	72	73
残基	R,K	R	A

表22：针对ACGG中心序列(第一亚基)的其他示例性残基

I-CreI位置	54	80
			EN位置	54	80
残基	F,L	Q

表23：针对ACGG中心序列(第二亚基)的示例性残基

I-CreI位置	48	50	71	72	73
							EN位置	239	241	262	263	264
+1AA*	239	241	262	263	264	264B*
							残基	K	R,P	D	G	R,G	R

表24：针对ACGG中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	80
			EN位置	210	271
+1AA*	210	272*
			残基	A	Q

表25：针对ACGT中心序列(第一亚基)的示例性残基

I-CreI位置	48	50	71	72	73
						EN位置	48	50	71	72	73
残基	K,L,S,H	Q,R,C,S,V	G	R	A

表26：针对ACGT中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,G	Q,E	K,R

表27：针对ACGT中心序列(第二亚基)的示例性残基

表28：针对ACGT中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	80	85	139
					EN位置	210	271	276	330
残基	A,G	Q,E	H,Y	K,R

表29：针对ATAA中心序列(第一亚基)的示例性残基

表30：针对ATAA中心序列(第一亚基)的其他示例性残基

表31：针对ATAA中心序列(第二亚基)的示例性残基

表32：针对ATAA中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	59	80	118	139
						EN位置	210	250	271	309	330
残基	G,S,A	V,A	Q,E	S,F	K,R

表33：针对ATAG中心序列(第一亚基)的示例性残基

I-CreI位置	48	50	71	72	73
						EN位置	48	50	71	72	73
残基	K,H	R	G,R,H	R,G,S,A,P,Q	A,C

表34：针对ATAG中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,G	Q,E	K,R

表35：针对ATAG中心序列(第二亚基)的示例性残基

I-CreI位置	50	72	73
				EN位置	241	263	264
残基	C,R	G,S	R

表36：针对ATAG中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	36	59	80	139
						EN位置	210	227	250	271	330
残基	G,A	K,R	V,A	Q	K,R

表37：针对ATAT中心序列(第一亚基)的示例性残基

表38：针对ATAT中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,G	Q,E	K,R,S

表39：针对ATAT中心序列(第二亚基)的示例性残基

表40：针对ATAT中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	59	80	139
					EN位置	210	250	271	330
残基	G,A,	V,A	Q,E,K	K,R,P,N

表41：针对ATGA中心序列(第一亚基)的示例性残基

I-CreI位置	48	50	72	73
					EN位置	48	50	72	73
残基	K,A,H,L	R,T,E,S,C,V	R,T,S,A,K	A,S

表42：针对ATGA中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	87	92	139
						EN位置	19	80	87	92	139
残基	A,G,S	Q,E	F,L	Q,R	K,R

表43：针对ATGA中心序列(第二亚基)的示例性残基

I-CreI位置	48	50	72	73	74
						EN位置	239	241	263	264	265
残基	H,K,R,A,S	S,I,R,C,A,Q	R,H	I,V	S,A,T

表44：针对ATGA中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	59	80	139
					EN位置	210	250	271	330
残基	G,A,S	V,A	Q,E	K,R

表45：针对ATGG中心序列(第一亚基)的示例性残基

I-CreI位置	50	71	72	73	74
						EN位置	48	50	72	73	74
残基	R	G,S	P,G	A,C	S,C

表46：针对ATGG中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	82	139
					EN位置	19	80	87	92
残基	G,A	E,Q	E,K	R,K

表47：针对ATGG中心序列(第二亚基)的示例性残基

I-CreI位置	48	50	71	72	73
							EN位置	239	241	262	263	264
+1AA*	239	241	262	263	264	264B
							残基	K	R	D,G	G	R	R或无R

表48：针对ATGG中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	77	80
				EN位置	210	268	271
+1AA*	210	269	272
				残基	A,G	N	Q,R

表49：针对GCAA中心序列(第一亚基)的示例性残基

表50：针对GCAA中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,G,S	Q,E	K,R

表51：针对GCAA中心序列(第二亚基)的示例性残基

表52：针对GCAA中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	31	80	139
					EN位置	210	222	271	330
残基	G,A	Q,P	Q,E	K,R

表53：针对GCAT中心序列(第一亚基)的示例性残基

表54：针对GCAT中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139	143
					EN位置	19	80	139	143
残基	A,G	Q,E	K,H,R	T,I

表55：针对GCAT中心序列(第二亚基)的示例性残基

表56：针对GCAT中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	80	125	139
					EN位置	210	271	316	330
残基	G,S,A	Q,E	V,A	K,R,H

表57：针对GCGA中心序列(第一亚基)的示例性残基

I-CreI位置	50	71	72	73	74
						EN位置	50	71	72	73	74
残基	K,R	G,R,S,A,N	R,N,G,A,Q	V,T,I	S,A

表58：针对GCGA中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80
			EN位置	19	80
残基	A,G,S	Q,E

表59：针对GCGA中心序列(第二亚基)的示例性残基

I-CreI位置	48	50	72	73	74
						EN位置	239	241	263	264	265
残基	K,T,S,A,Q	C,R	R	V,I	S,A

表60：针对GCGA中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	210	271	330
残基	G,S,A	Q,E	R

表61：针对GTAA中心序列(第一亚基)的示例性残基

表62：针对GTAA中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,S	Q,E	K,R

表63：针对GTAG中心序列(第一亚基)的示例性残基

I-CreI位置	50	71	72	73
					EN位置	50	71	72	73
残基	R,C	D,S	G,N	R

表64：针对GTAG中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,S	Q	K,R

表65：针对GTAT中心序列(第一亚基)的示例性残基

表66：针对GTAT中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,S	Q,E	K,R,T,H

表67：针对GTGA中心序列(第一亚基)的示例性残基

表68：针对GTGA中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,S	Q,E	K,R

表69：针对GTGC中心序列(第一亚基)的示例性残基

表70：针对GTGC中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,S	Q,E	K,T,S,R,H,V

表71：针对GTGG中心序列(第一亚基)的示例性残基

I-CreI位置	50	71	72	73
					EN位置	50	71	72	73
残基	Q,R	G,S,D	G,S	R,V

表72：针对GTGG中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	62	80
				EN位置	19	62	80
残基	A,G,S	I,V	Q,E

表73：针对GTGT中心序列(第一亚基)的示例性残基

表74：针对GTGT中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,S	Q,E	K,R

表75：针对TCAA中心序列(第一亚基)的示例性残基

I-CreI位置	48	50	71	72
					EN位置	48	50	71	72
残基	K,S	R,T,C	G,R,T	R,S,P,T,G

表76：针对TCAA中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,S	Q,E	K,R

表77：针对TCAA中心序列(第二亚基)的示例性残基

I-CreI位置	48	50	72	73	74
						EN位置	239	241	263	264	265
残基	S,K	K,R,C,E	R,Q,N,S	I	S,A

表78：针对TCAA中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	210	271	330
残基	G,S	Q,E	R

表79：针对TTAA中心序列(第一亚基)的示例性残基

表80：针对TTAA中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80	139
				EN位置	19	80	139
残基	A,G,S	Q,E	K,R

表81：针对TTAA中心序列(第二亚基)的示例性残基

I-CreI位置	48	50	72	73	74
						EN位置	239	241	257	263	264
残基	K,S,A,T	C,K,R,T,E	T,K,R,A,S,Q	I,V	S,A

表82：针对TTAA中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	66	80	139
					EN位置	210	257	271	330
残基	G,A,S	Y,H	Q	R

表83：针对TTGG中心序列(第一亚基)的示例性残基

I-CreI位置	50	71	72	73
					EN位置	50	71	72	73
残基	R	S	G	R

表84：针对TTGG中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80
			EN位置	19	80
残基	A,G	Q

表85：针对TTGG中心序列(第二亚基)的示例性残基

表86：针对TTGG中心序列(第二亚基)的其他示例性残基

I-CreI位置	19	66	80	85	139
						EN位置	210	257	271	276	330
残基	G,A	Y,H	Q	H,R	K,R

表87：针对GCAG中心序列(第一亚基)的示例性残基

I-CreI位置	50	71	72	73
					EN位置	50	71	72	73
残基	R	S	G	R

表88：针对GCAG中心序列(第一亚基)的其他示例性残基

I-CreI位置	19	80
			EN位置	19	80
残基	A	Q

表89：针对GCAG中心序列(第二亚基)的示例性残基

I-CreI位置	48	50	72	73
					EN位置	239	241	262	263
残基	K,H	Q,R	S,R	V,T

表90：针对GCAG中心序列(第二亚基)的其他示例性残基

I-CreI位置	80
		EN位置	271
残基	Q

根据上表1-90，存在某些常见残基，其可置换对应于SEQ ID NO:1(即，I-CreI)的残基48、50、71、72、73、73B和74以改善某些中心序列的切割。下面表91-110中所示的残基代表可以置换相应的野生型I-CreI残基的残基，基于对表1-90中有关中心序列的示例性残基的分析，预期所示中心序列的切割活性提高。在一些实施方式中，根据下表91和表92，切割选自ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、GCAA、GCAT、GCGA、GCAG、TTAA、TCAA和TTGG的中心序列的本文所述工程化大范围核酸酶在第一亚基和第二亚基中在位置48、50、71、72、73、73B和74处包含一个或多个残基。

表91：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、GCAA、GCAT、GCGA、GCAG、TTAA、TCAA和TTGG的常见残基(第一亚基)

表92：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、GCAA、GCAT、GCGA、GCAG、TTAA、TCAA和TTGG的常见残基(第二亚基)

进一步发现，对于第二中心序列的中心序列的相同的两个碱基对，第一亚基中特定的相同残基具有相似的残基，其可以在对应于I-CreI的位置48、50、71、72、73、73B和74的一个或多个位置被适当地置换。例如，大范围核酸酶切割具有前两个碱基对AC的中心序列ACAA和ACAG的第一亚基以更相似的方式被置换。因此，特定残基可以置换对应于I-CreI的位置48、50、71、72、73和74的位置，以提高中心序列ACAA、ACAG、ACAT、ACGA、ACGC、ACGG和ACGT的切割活性。在本文描述的一些实施方式中，工程化大范围核酸酶在对应于根据表和下表94的第一亚基和第二亚基中的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置具有一个或多个置换。

表93：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG和ACGT的常见残基(第一亚基)

表94：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG和ACGT的常见残基(第二亚基)

在一些其他实施方式中，可以用一个或多个残基置换对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置，以改善中心序列ATAA、ATAG、ATAT、ATGA和ATGG的切割活性，如在下表95和表96中所示的。

表95：ATAA、ATAG、ATAT、ATGA和ATGG的常见残基(第一亚基)

表96：ATAA、ATAG、ATAT、ATGA和ATGG的常见残基(第二亚基)

在一些其他实施方式中，可以用一个或多个残基置换对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置，以改善中心序列GCAA、GCAT、GCGA和GCAG的切割活性，如在下表97和表98中所示的。

表97：GCAA、GCAT、GCGA和GCAG的常见残基(第一亚基)

表98：GCAA、GCAT、GCGA和GCAG的常见残基(第二亚基)

在一些特定实施方式中，可以用一个或多个残基置换对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置，以改善中心序列TTAA和TTGG的切割活性，如在下表99和表100中所示的。

表99：TTAA和TTGG的常见残基(第一亚基)

表100：TTAA和TTGG的常见残基(第二亚基)

在一些其他实施方式中，可以用一个或多个残基置换对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置，以改善中心序列TCAA的切割活性，如在下表101和表102中所示的。

表101：TCAA的常见残基(第一亚基)

表102：TCAA的常见残基(第二亚基)

同样确定的是，第二中心序列的中心序列的相同的两个碱基对的第二亚基中的特定的相同残基具有类似的残基，其可以在对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处被适当地置换。例如，切割中心序列ACAA和ATAA的大范围核酸酶的第二亚基以类似的方式被置换，所述中心序列ACAA和ATAA具有第二两碱基对AA(反向互补TT)。因此，在一些实施方式中，可以用一个或多个残基置换对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置，以改善中心序列ACAA、ATAA、GCAA、TTAA和TCAA的切割活性，如在下表103中所示的。

表103：ACAA、ATAA、GCAA、TTAA、TCAA的其他常见残基(第二亚基)

在一些其他实施方式中，可以用一个或多个残基置换对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置，以改善中心序列ACAG、ATAG和GCAG的切割活性，如在下表104中所示的。

表104：ACAG、ATAG和GCAG的其他常见残基(第二亚基)

在一些其他实施方式中，可以用一个或多个残基置换对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置，以改善中心序列ACAT、ATAT和GCAT的切割活性，如在下表105中所示的。

表105：ACAT、ATAT和GCAT的其他常见残基(第二亚基)

在一些替代实施方式中，可以用一个或多个残基置换对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置，以改善中心序列ACGA、ATGA和GCGA的切割活性，如在下表106中所示的。

表106：ACGA、ATGA和GCGA的其他常见残基(第二亚基)

在一些替代实施方式中，可以用一个或多个残基置换对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置，以改善中心序列ACGA、ATGA和GCGA的切割活性，如在下表107中所示的。

表107：ACGC的其他常见残基(第二亚基)

在一些其他实施方式中，可以用一个或多个残基置换对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置，以改善中心序列ACGA、ATGA和GCGA的切割活性，如在下表108中所示的。

表108：ACGG、ATGG和TTGG的其他常见残基(第二亚基)

在一些实施方式中，可以用一个或多个残基置换对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置，以改善中心序列ACGT的切割活性，如在下表109中所示的。

表109：ACGT的其他常见残基(第二亚基)

在一些实施方式中，切割选自GTAA、GTAG、GTAT、GTGA、GTGC、GTGG和GTGT的中心序列的本文所述的工程化大范围核酸酶包含根据下表110的位置48,50,71,72,73,73B,and74处的在第一亚基中的一个或多个残基。这些大范围核酸酶的GT(反向互补AC)结合亚基没有改变，因为野生型SEQ ID NO:1(即，I-CreI)中心序列是GTGA。

表110：GTAA、GTAG、GTAT、GTGA、GTGC、GTGG和GTGT的常见残基

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ATAT，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ATAT，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73和74的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ATAA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ATAA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ATAG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ATAG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ATGA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ATGA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50和72的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ATGG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ATGG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、71、72、73、73B的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACAA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACAA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACAG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACAG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACAT，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACAT，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置48、50和73的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACGA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACGA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50和72的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACGC，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACGC，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACGG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACGG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、71、72、73和73B的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACGT，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列ACGT，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、71、72和73的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GCAA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GCAA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GCAT，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GCAT，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置48、50、72和73的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GCGA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GCGA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置48、50、72和73的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GCAG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GCAG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、71、72和73的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列TTAA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列TTAA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列TTGG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列TTGG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、71、72和73的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列TCAA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列TCAA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72、73和74的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GTAT，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第一亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GTGG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、71、72和73的位置处在第一亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GTGC，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第一亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GTAG，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50、71、72和73的位置处在第一亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GTGA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置48和50的位置处在第一亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GTAA，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第一亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列GTGT，其中所述工程化大范围核酸酶在对应于SEQ ID NO:1(即，I-CreI)的位置73的位置处在第一亚基中包含本文所述的置换。

此外，发现对应于位置48、50、71、72、73和74的某些位置更普遍地置换特定的中心序列。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA或ATGG，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置50、72、73的位置处在第一亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ATAA、ATAG、ATAT、ATGA或ATGG，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置50、72、73的位置处在第一亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含GCAA、GCAT、GCGA或GCAG，其中所述工程化大范围核酸酶如本文所述在对应于SEQ IDNO:1(即，I-CreI)的位置50的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含GCAA、GCAT、GCGA或GCAG，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置50、72、73的位置处在第一亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含TTAA和TTGG，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第一亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含TCAA，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ACAA、ATAA、TTAA或TCAA，其中所述工程化大范围核酸酶如本文所述在对应于SEQ IDNO:1(即，I-CreI)的位置50、72和73的位置处在第二亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ACAA、ATAA、TTAA或TCAA，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置50的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ACAG、ATAG或GCAG，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第二亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ACAG、ATAG或GCAG，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置50、71、72和73的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ACAT、ATAT或GCAT，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置50、72和73的位置处在第二亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ACAT、ATAT或GCAT，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73和74的位置处在第二亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ACAT、ATAT或GCAT，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置48、50、72和73的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ACGA、ATGA或GCGA，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置50和72的位置处在第二亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ACGA、ATGA或GCGA，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置48、50、72和73的位置处在第二亚基中包含本文所述的置换。

在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ACGG、ATGG或TTGG，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置50、71、72、73和73B的位置处在第二亚基中包含本文所述的置换。在本文所述的一些实施方式中，工程化大范围核酸酶切割中心序列，所述中心序列包含ACGG、ATGG或TTGG，其中所述工程化大范围核酸酶如本文所述在对应于SEQ ID NO:1(即，I-CreI)的位置50、71、72和73的位置处在第二亚基中包含本文所述的置换。

虽然上表描述了已经举例说明的残基和置换，但是I-Cre衍生的大范围核酸酶的残基可以用另外的氨基酸置换以导致包含特定中心序列的识别序列的活性增加。在一些实施方式中，在给定位置的修饰是保守置换，例如，将一个氨基酸与具有相似性质的另一个氨基酸交换。例如，带电荷的氨基酸可以被类似带电荷的氨基酸置换；极性氨基酸可以被类似的极性氨基酸置换；两亲性氨基酸可以用类似的两亲性氨基酸替代；亲水性氨基酸可以被类似的亲水性氨基酸置换；疏水性氨基酸可被类似的疏水性氨基酸置换。此外，示例性残基还包括氨基酸类似物和非天然存在的氨基酸，其具有与示例性氨基酸相似的性质。

2.3工程化大范围核酸酶变体

本发明的实施方式包括本文所述的工程化大范围核酸酶及其变体。本发明的其他实施方式包括包含编码本文所述大范围核酸酶的核酸序列的分离的多核苷酸，以及此类多核苷酸的变体。

实施方式所涵盖的变体多肽具有生物活性。即，其继续具有天然蛋白质的所需生物活性；例如，结合并切割识别序列的能力，所述识别序列包含为其设计的本文所述的中心序列。

此类变体可以例如由人的操纵产生。本文所述的实施方式的天然多肽的生物活性变体或识别半位点结合亚基的生物活性变体与天然I-CreI衍生多肽或天然I-CreI衍生亚基的氨基酸序列具有至少约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％或约99％的序列同一性，如通过本文别处描述的序列比对程序和参数所确定的。在一些情况下，序列同一性可以使用所有位置来确定，或者可替代地，仅使用除本文描述的对特定中心序列的工程化大范围核酸酶的活性有贡献的那些位置之外的位置来确定。实施方式的多肽或亚单位的生物活性变体可以与该多肽或亚单位相差少至约1-40个氨基酸残基、少至约1-20个、少至约1-10个、少至约5个、少至4个、3个、2个或甚至1个氨基酸残基。

实施方式的多肽可以以各种方式改变，包括氨基酸置换、缺失、截短和插入。这种操作的方法通常是本领域已知的。例如，氨基酸序列变体中的突变制备氨基酸序列变体。诱变和多核苷酸改变的方法是本领域熟知的。参见，例如，Kunkel(1985)Proc.Natl.Acad.Sci.USA 82:488-492；Kunkel等，(1987)Methods in Enzymol.154:367-382；美国专利号4,873,192；Walker和Gaastra编著，(1983)Techniques in MolecularBiology(MacMillan Publishing Company,New York)和其中引用的参考文献。在Dayhoff等(1978)Atlas of Protein Sequence and Structure(Natl.Biomed.Res.Found.,Washington,D.C.)的模型中可以找到关于不影响所关注的蛋白的生物活性的适当氨基酸置换的指导，其通过引用并入本文。保守性置换(如将一个氨基酸与另一个具有相似性质的氨基酸交换)可能是最佳的。

在一些实施方式中，本发明的工程化大范围核酸酶可以包含本文公开的HVR1和HVR2区的变体。亲本HVR区可以包含，例如，示例性工程化大范围核酸酶的残基24-79或残基215-270。因此，变体HVR可以包含与对对应于本文示例性工程化大范围核酸酶(即，SEQ IDNO:11-33、36-43、46-67、70-89、92-118、121-135、138-156、159-183、186-199、202-219、222-243、246-247、250-266、269-291、294-313、316-325、328-330、333-340、343-357、360-389、392-399、402-433、436-462、465-495、498-501和504-529)的残基24-79或残基215-270的氨基酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更高序列同一性的氨基酸序列，以使得变体HVR区保持工程化大范围核酸酶的生物活性(即，结合并切割识别序列)。此外，在本发明的一些实施方式中，变体HVR1区域或变体HVR2区域可包含对应于在亲本HVR中的特定位置发现的氨基酸残基的残基。在本文中，“对应于”是指变体HVR中的氨基酸残基是在亲本HVR序列中存在于相同相对位置(即，相对于亲本序列中的其余氨基酸)的相同氨基酸残基(即，分开的相同残基)。例如，如果亲本HVR序列在位置26包含丝氨酸残基，则“包含对应于”残基26的残基的变体HVR也将在相对于(即，对应于)亲本位置26的位置包含丝氨酸。

在特定实施方式中，本发明的工程化大范围核酸酶包含HVR1，所述HVR1与对应于SEQ ID NO:11-33、36-43、46-67、70-89、92-118、121-135、138-156、159-183、186-199、202-219、222-243、246-247、250-266、269-291、294-313、316-325、328-330、333-340、343-357、360-389、392-399、402-433、436-462、465-495、498-501或504-529的残基24-79的氨基酸序列具有至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更高序列同一性。

在某些实施方式中，本发明的工程化大范围核酸酶包含HVR2，所述HVR2与对应于SEQ ID NO:11-33、36-43、46-67、70-89、92-118、121-135、138-156、159-183、186-199、202-219、222-243、246-247、250-266、269-291、294-313、316-325、328-330、333-340、343-357、360-389、392-399、402-433、436-462、465-495、498-501或504-529的残基215-270的氨基酸序列具有至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更高序列同一性。

此前已经鉴定了野生型I-CreI大范围核酸酶的DNA识别结构域的大量氨基酸修饰(例如，U.S.8,021,867)，其单独或组合地导致工程化大范围核酸酶在DNA识别序列半位点内的单个碱基处具有改变的特异性，使得所得合理设计的大范围核酸酶具有不同于野生型酶的半位点特异性。表A提供了可以在工程化大范围核酸酶单体或亚单位中进行的潜在置换，以基于识别半位点的每个半位点位置(-1至-9)处存在的碱基来增强特异性。

表A：

粗体条目是野生型接触残基并且不构成本文所用的“修饰”。星号表示该残基与反义链上的碱基接触。

可以在工程化大范围核酸酶单体或亚单位中进行某些修饰以调节DNA结合亲和性和/或活性。例如，本文所述的工程化大范围核酸酶单体或亚单位可以在对应于I-CreI的位置19的残基处包含G、S或A(WO 2009001159)，在对应于I-CreI的位置66的残基处包含Y、R、K或D和/或在对应于I-CreI的位置80的残基处包含E、Q或K(US 8021867)。

对于多核苷酸，“变体”包括在天然多核苷酸内的一个或多个位点缺失和/或添加一个或多个核苷酸。本领域技术人员将认识到，将构建实施方式的核酸变体以维持开放阅读框。对于多核苷酸，保守变体包括由于遗传密码的简并性而编码实施方式的多肽之一的氨基酸序列的那些序列。变体多核苷酸包括合成衍生的多核苷酸，例如，通过使用定点诱变产生但仍编码工程化大范围核酸酶的那些，或外源核酸分子，或实施方式的模板核酸。一般而言，实施方式的特定多核苷酸的变体与该特定多核苷酸具有至少约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％或更高的序列同一性，如通过本文别处所述的序列比对程序和参数所确定的。实施方式的特定多核苷酸变体多核苷酸编码的多肽与参考多核苷酸编码的多肽之间的序列同一性百分比来评估实施方式的特定多核苷酸(即，参考多核苷酸)的变体。

预期本文所包括的蛋白序列的缺失、插入和置换不会产生多肽特征的根本改变。然而，当在进行置换、缺失或插入之前难以预测置换、缺失或插入的确切效果时，本领域技术人员将理解，该效果将通过筛选其预期活性的多肽来评价。例如，将筛选工程化大范围核酸酶的变体优先识别和切割包含特定中心序列的识别序列的能力。

2.4优化I-CreI衍生的大范围核酸酶的方法

本文提供了通过修饰I-CreI衍生的大范围核酸酶的对应于I-CreI(SEQ ID NO:1)的位置48、50、71、72、73、73B和74的至少一个位置来改善衍生自I-CreI的工程化大范围核酸酶的DNA切割活性特性的组合物和方法。DNA切割活性的改善可以指与适当的对照工程化大范围核酸酶相比增加约10％、25％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、100％或更多。如本文所用，对照工程化大范围核酸酶是指对相同识别序列具有特异性但在本文所列的一个或多个位置处缺乏来自野生型I-CreI的修饰或来自工程化I-CreI衍生的大范围核酸酶的修饰的工程化大范围核酸酶。在特定实施方式中，对照工程化大范围核酸酶是指工程化的I-CreI衍生的大范围核酸酶，该工程化的I-CreI衍生的大范围核酸酶对相同的识别序列具有特异性，但在对应于I-CreI的位置48、50、71、72、73、73B和74的一个或多个位置处缺乏修饰。

在给定位置处对工程化大范围核酸酶的修饰可以包括对工程化大范围核酸酶本身的修饰，对编码工程化大范围核酸酶的核酸序列的修饰，或对从SEQ ID NO:1或I-CreI衍生的大范围核酸酶的序列修饰的预定氨基酸序列的合成产生。衍生自I-CreI的工程化大范围核酸酶本身的修饰可以通过本领域已知的以位点特异性方式修饰氨基酸序列的任何方式进行。

在某些实施方式中，通过以位点特异性方式改变编码I-CreI衍生的大范围核酸酶的核酸序列来修饰衍生自I-CreI的工程化大范围核酸酶。这样的修饰可以编码I-CreI衍生的工程化大范围核酸酶的第一和/或第二亚基的核酸序列上单独进行。可以表达编码单个修饰亚基的核酸序列，随后用接头装配修饰亚基以产生I-CreI衍生的同源二聚体或异源二聚体工程化大范围核酸酶。在一些实施方式中，以位点特异性方式修饰编码I-CreI衍生的工程化大范围核酸酶的核酸序列，使得修饰的核酸序列的表达产生功能性修饰的I-CreI衍生的工程化大范围核酸酶。

核酸序列的位点特异性修饰可通过本领域已知的任何方法进行以产生位点特异性切割、缺失和/或置换。产生在给定位点修饰的工程改造的I-CreI衍生的核酸酶的方法是本领域已知的，包括同源重组、定点诱变和基因融合等。在具体的实施方式中，用于基因编辑的标准技术可用于在本文所述的一个或多个位置工程化I-CreI衍生的大范围核酸酶，其增加工程化的大范围核酸酶对包含特定中心序列的识别序列的活性。

在本发明的另一个方面是用于增加结合并切割大范围核酸酶识别序列的I-CreI衍生的工程化大范围核酸酶的切割活性的方法，其中所述大范围核酸酶识别序列包含四碱基对中心序列，所述四碱基对中心序列包含5’中心序列半位点和3’中心序列半位点，其中所述5’中心序列半位点包含AC、AT、CC、CT、GC、GT、TC或TT对，并且其中所述3’中心序列半位点包含AC、AT、CC、CT、GC、GT、TC或TT对，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQ ID NO:1(即，I-CreI)的氨基酸序列，

其中所述方法包括修饰所述第一亚基以包含对应于SEQ ID NO:1的位置48、50、71、72、73、73B和74的一个或多个残基，其中所述修饰基于所述中心序列的5’中心半位点，并且其中所述修饰选自表183中针对所述5’中心半位点中的每一个提供的残基。

并且任选地其中所述方法包括修饰所述第二亚基以包含对应于SEQ ID NO:1的位置48、50、71、72、73、73B和74的一个或多个残基，其中所述修饰基于所述中心序列的3’中心半位点，并且其中所述修饰选自表183中针对所述3’中心半位点中的每一个提供的残基。

在一些实施方式中，中心序列的5’中心半位点为AC对，并且第一亚基经修饰以在对应于表183中提供的5’中心半位点AC对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的5’中心半位点为AT对，并且第一亚基经修饰以在对应于表183中提供的5’中心半位点AT对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的5’中心半位点为CC对，并且第一亚基经修饰以在对应于表183中提供的5’中心半位点CC对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的5’中心半位点为CT对，并且第一亚基经修饰以在对应于表183中提供的5’中心半位点CT对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的5’中心半位点为GC对，并且第一亚基经修饰以在对应于表183中提供的5’中心半位点GC对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的5’中心半位点为GT对，并且第一亚基经修饰以在对应于表183中提供的5’中心半位点GT对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的5’中心半位点为TC对，并且第一亚基经修饰以在对应于表183中提供的5’中心半位点TC对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的5’中心半位点为TT对，并且第一亚基经修饰以在对应于表183中提供的5’中心半位点TT对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的3’中心半位点为AC对，并且第一亚基经修饰以在对应于表183中提供的3’中心半位点AC对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的3’中心半位点为AT对，并且第一亚基经修饰以在对应于表183中提供的3’中心半位点AT对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的3’中心半位点为CC对，并且第一亚基经修饰以在对应于表183中提供的3’中心半位点CC对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的3’中心半位点为CT对，并且第一亚基经修饰以在对应于表183中提供的3’中心半位点CT对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的3’中心半位点为GC对，并且第一亚基经修饰以在对应于表183中提供的3’中心半位点GC对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的3’中心半位点为GT对，并且第一亚基经修饰以在对应于表183中提供的3’中心半位点GT对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的3’中心半位点为TC对，并且第一亚基经修饰以在对应于表183中提供的3’中心半位点TC对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

在一些实施方式中，中心序列的3’中心半位点为TT对，并且第一亚基经修饰以在对应于表183中提供的3’中心半位点TT对的SEQ ID NO:1(即，I-CreI)的位置48、50、71、72、73、73B和74的位置处包含一个或多个残基。

2.5药物组合物

在一些实施方式中，本发明提供了包含药学上可接受的载体和本发明的工程化核酸酶，或药学上可接受的载体和包含编码本发明的工程化核酸酶的核酸的分离的多核苷酸的药物组合物。具体地，提供了包含药学上可接受的载体和治疗有效量的编码工程化大范围核酸酶或工程化大范围核酸酶肽的核酸的药物组合物。

在其他实施方式中，本发明提供了一种药物组合物，其包含药学上可接受的载体和本发明的遗传修饰的细胞。可以将遗传修饰的细胞递送到细胞所需的靶组织。

本发明的药物组合物可用于在需要根据本发明治疗的受试者中治疗患有疾病的受试者。

这样的药物组合物可以根据已知技术来制备。参见，例如Remington,The Scienceand Practice of Pharmacy(21st ed.2005)。在制造根据本发明的药物制剂时，通常将核酸酶多肽(或编码其的DNA/RNA或表达其的细胞)与药学上可接受的载体混合，并将所得的组合物施用于受试者。载体在与制剂中的任何其他成分相容的意义上必须是可接受的，并且必须对受试者无害。在一些实施方式中，本发明的药物组合物可进一步包含一种或多种可用于治疗受试者的疾病的另外的药剂或生物分子。同样，另外的药剂和/或生物分子可以作为单独的组合物共同施用。

在本发明的特定实施方式中，所述药物组合物包含病毒载体，所述病毒载体包含编码本文所述工程化核酸酶的核酸序列。这些载体是本领域已知的，包括逆转录病毒载体、慢病毒载体、腺病毒载体和腺相关病毒(AAV)载体(Vannucci,等，2013New Microbiol.36:1-22的综述)。可用于本发明的重组AAV载体可具有允许病毒转导进入靶细胞类型并由靶细胞表达核酸酶基因的任何血清型。例如，在一些实施方式中，重组AAV载体具有AAV2、AAV6、AAV8或AAV9血清型。在一些实施方式中，将病毒载体直接注射到靶组织中。在替代实施方式中，病毒载体通过循环系统全身递送。本领域已知不同的AAV载体倾向于定位于不同的组织。在肝靶组织中，已显示肝细胞的有效转导，例如用AAV血清型2、8和9(Sands(2011)Methods Mol.Biol.807:141-157)。因此，在一些实施方式中，AAV血清型是AAV2。在替代实施方式中，AAV血清型是AAV6。在其他实施方式中，AAV血清型是AAV8。在另外其他实施方式中，AAV血清型是AAV9。AAV载体也可以是自身互补的，使得其不需要宿主细胞中的第二链DNA合成(McCarty,等，(2001)Gene Ther.8:1248-54)。通过重组AAV载体递送的核酸可以包括左(5’)和右(3’)反向末端重复序列。

在本发明的特定实施方式中，药物组合物包含配制在脂质纳米颗粒内的本文所述的一种或多种mRNA(例如，编码工程化核酸酶的mRNA)。

包含脂质纳米颗粒的阳离子脂质，非阳离子脂质和/或脂质缀合物以及此类脂质彼此之间的相对摩尔比的选择基于所选脂质的特性，预期靶细胞的性质和待递送的mRNA的特性。其他考虑因素包括，例如，烷基链的饱和度，以及所选脂质的大小、电荷、pH、pKa、融合性和毒性。因此，可以相应地调节每种单独组分的摩尔比。

用于本发明方法的脂质纳米颗粒可通过本领域目前已知的各种技术制备。核酸-脂质颗粒及其制备方法公开于例如美国专利公开号20040142025和20070042031中，其公开内容出于所有目的以全文引用的方式并入本文中。

脂质纳米颗粒的适当尺寸的选择必须考虑靶细胞的位点和制造脂质纳米颗粒的应用。通常，脂质纳米颗粒的尺寸在约25至约500nm的范围内。在一些实施方式中，脂质纳米颗粒具有约50nm至约300nm或约60nm至约120nm的尺寸。脂质纳米颗粒的尺寸可以通过准电光散射(QELS)确定，如在Bloomfield,Ann.Rev.Biophys.Bioeng.,10:421^150(1981)中所描述的，其通过引用并入本文。本领域已知多种用于产生特定尺寸范围的脂质纳米颗粒群体的方法，例如，超声处理或均化。一种此类方法描述在美国专利号4,737,323中，其通过引用并入本文。

预期用于本发明的一些脂质纳米颗粒包含至少一种阳离子脂质，至少一种非阳离子脂质和至少一种缀合脂质。在更具体的实例中，脂质纳米颗粒可包含约50mol％至约85mol％的阳离子脂质，约13mol％至约49.5mol％的非阳离子脂质和约0.5mol％至约10mol％的脂质缀合物，并且以具有非层状(即，非双层)形态的方式产生。在其他具体实例中，脂质纳米颗粒可包含约40mol％至约85mol％的阳离子脂质、约13mol％至约49.5mol％的非阳离子脂质和约0.5mol％至约10mol％的脂质缀合物，并且以具有非层状(即，非双层)形态的方式产生。

阳离子脂质可以包括，例如，以下的一种或多种：棕榈酰基-油酰基-去甲精氨酸(PONA)、MPDACA、GUADACA、((6Z,9Z,28Z,31Z)-庚三烯-6,9,28,31-四烯-19-基4-(二甲基氨基)丁酸酯)(MC3)、LenMC3、CP-LenMC3、γ-LenMC3、CP-γ-LenMC3、MC3MC、MC2MC、MC3醚、MC4醚、MC3酰胺、Pan-MC3、Pan-MC4和Pan MC5、1,2-二亚油酰氧基-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油烯基氧基-N,N-二甲基氨基丙烷(DLenDMA)、2,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLin-K-C2-DMA；“XTC2”)、2,2-二亚油基-4-(3-二甲基氨基丙基)-[1,3]-二氧戊环(DLin-K-C3-DMA)、2,2-二亚油基-4-(4-二甲基氨基丁基)-[1,3]-二氧戊环(DLin-K-C4-DMA)、2,2-二亚油基-5-二甲基氨基甲基-[1,3]-二噁烷(DLin-K6-DMA)、2,2-二亚油基-4-N-甲基哌嗪并-[1,3]-二氧戊环(DLin-K-MPZ)、2,2-二亚油基-4-二甲基氨基甲基-[1,3]-二氧戊环(DLin-K-DMA)、1,2-二亚油基氨基甲酰氧基-3-二甲基氨基丙烷(DLin-C-DAP)、1,2-二亚油酰氧基-3-(二甲基氨基)乙酰氧基丙烷(DLin-DAC)、1,2-二亚油酰氧基-3-吗啉代丙烷(DLin-MA)、1,2-二亚油酰基-3-二甲基氨基丙烷(DLinDAP)、1,2-二亚油烯基硫代-3-二甲基氨基丙烷(DLin-S-DMA)、1-亚油酰基-2-亚油酰氧基-3-二甲基氨基丙烷(DLin-2-DMAP)、1,2-二亚油酰氧基-3-三甲基氨基丙烷盐酸盐(DLin-TMA.Cl)、1,2-二亚油酰基-3-三甲基氨基丙烷盐酸盐(DLin-TAP.Cl)、1,2-二亚油酰氧基-3-(N-甲基哌嗪基)丙烷(DLin-MPZ)、3-(N,N-二亚油基氨基)-1,2-丙二醇(DLinAP)、3-(N,N-二油烯基氨基)-1,2-丙二醇(DOAP)、1,2-二亚油基氧代-3-(2-N,N-二甲基氨基)乙氧基丙烷(DLin-EG-DMA)、N,N-二油基-N,N-二甲基氯化铵(DODAC)、1,2-二油烯基氧基-N,N-二甲基氨基丙烷(DODMA)、1,2-二硬脂基氧基-N,N-二甲基氨基丙烷(DSDMA)、N-(1-(2,3-二油烯基氧基)丙基)-N,N,N-三甲基氯化铵(DOTMA)、N,N-二硬脂基-N,N-二甲基溴化铵(DDAB)、N-(1-(2,3-二油酰氧基)丙基)-N,N,N-三甲基氯化铵(DOTAP)、3-(N-(N’,N’-二甲基氨基乙烷)-氨基甲酰基)胆固醇(DC-Chol)、N-(1,2-二肉豆蔻酰氧基丙-3-基)-N,N-二甲基-N-羟乙基溴化铵(DMRIE)、2,3-二油烯基氧基-N-[2(精胺-甲酰胺基)乙基]-N,N-二甲基-1-丙胺三氟乙酸盐(DOSPA)、二-十八烷基酰胺基甘氨酰基精胺(DOGS)、3-二甲氨基-2-(胆甾-5-烯-3-β-氧基丁-4-氧基)-1-(顺,顺-9,12)-十八碳二烯氧基)丙烷(CLinDMA)、2-[5’-(胆甾-5-烯-3-β-氧基)-3’-氧杂戊氧基]-3-二甲基-1-(顺,顺-9’,1-2’-十八碳二烯氧基)丙烷(CpLinDMA)、N,N-二甲基-3,4-二油酰氧基苄胺(DMOBA)、1,2-N,N’-二油烯基氨基甲酰基-3-二甲基氨基丙烷(DOcarbDAP)、1,2-N,N’-二亚油基氨基甲酰基-3-二甲基氨基丙烷(DLincarbDAP)或其混合物。阳离子脂质也可以是DLinDMA、DLin-K-C2-DMA(“XTC2”)、MC3、LenMC3、CP-LenMC3、γ-LenMC3，CP-γ-LenMC3、MC3MC、MC2MC、MC3醚、MC4醚、MC3酰胺、Pan-MC3、Pan-MC4、PanMC5或其混合物。

在各种实施方式中，阳离子脂质占颗粒中存在的总脂质的约50mol％至约90mol％、约50mol％至约85mol％、约50mol％至约80mol％、约50mol％至约75mol％、约50mol％至约70mol％、约50mol％至约65mol％或约50mol％至约60mol％。

在其他实施方式中，阳离子脂质占颗粒中存在的总脂质的约40mol％至约90mol％、约40mol％至约85mol％、约40mol％至约80mol％、约40mol％至约75mol％、约40mol％至约70mol％、约40mol％至约65mol％或约40mol％至约60mol％。

非阳离子脂质可以包含例如一种或多种阴离子脂质和/或中性脂质。在特定实施方式中，非阳离子脂质包含以下中性脂质组分之一：(1)胆固醇或其衍生物；(2)磷脂；或(3)磷脂和胆固醇或其衍生物的混合物。胆固醇衍生物的实例包括，但不限于，胆甾烷醇、胆甾烷酮、胆甾烯酮、粪甾醇、胆固醇基-2’-羟乙基醚、胆固醇基-4’-羟基丁基醚及其混合物。磷脂可以是中性脂质，包括但不限于，二棕榈酰磷脂酰胆碱(DPPC)、二硬脂酰磷脂酰胆碱(DSPC)、二油酰磷脂酰乙醇胺(DOPE)、棕榈酰油酰基-磷脂酰胆碱(POPC)、棕榈酰油酰基-磷脂酰乙醇胺(POPE)、棕榈酰油酰基-磷脂酰甘油(POPG)、二棕榈酰基-磷脂酰乙醇胺(DPPE)、二肉豆蔻酰基-磷脂酰乙醇胺(DMPE)、二硬脂酰基-磷脂酰乙醇胺(DSPE)、单甲基-磷脂酰乙醇胺、二甲基-磷脂酰乙醇胺、二反油酰基-磷脂酰乙醇胺(DEPE)、硬脂酰油酰基-磷脂酰乙醇胺(SOPE)、卵磷脂酰胆碱(EPC)及其混合物。在某些优选的实施方式中，磷脂是DPPC、DSPC或其混合物。

在一些实施方式中，非阳离子脂质(例如，一种或多种磷脂和/或胆甾醇)可以占颗粒中存在的总脂质的约10mol％至约60mol％、约15mol％至约60mol％、约20mol％至约60mol％、约25mol％至约60mol％、约30mol％至约60mol％、约10mol％至约55mol％、约15mol％至约55mol％、约20mol％至约55mol％、约25mol％至约55mol％、约30mol％至约55mol％、约13mol％至约50mol％、约15mol％至约50mol％或约20mol％至约50mol％。当非阳离子脂质是磷脂和胆固醇或胆固醇衍生物的混合物时，混合物可以占颗粒中存在的总脂质的高达约40、50或60mol％。

抑制颗粒聚集的共轭脂质可以包括例如以下的一种或多种：聚乙二醇(PEG)-脂质共轭物、聚酰胺(ATTA)-脂质共轭物、阳离子聚合物-脂质共轭物(CPL)或其混合物。在一个优选的实施方式中，核酸-脂质颗粒包含PEG-脂质共轭物或ATTA-脂质共轭物。在某些实施方式中，PEG-脂质共轭物或ATTA-脂质共轭物与CPL一起使用。抑制颗粒聚集的共轭脂质可以包含PEG-脂质，包括例如，PEG-二酰基甘油(AG)、PEG二烷氧基丙基(DAA)、PEG-磷脂、PEG-神经酰胺(Cer)或其混合物。PEG-DAA共轭物可以是PEG-二月桂酰氧基丙基(C12)、PEG-二肉豆蔻酰氧基丙基(C14)、PEG-二棕榈酰氧基丙基(C16)、PEG-二硬脂酰氧基丙基(C18)或其混合物。

适用于本发明的其他PEG-脂质共轭物包括，但不限于，mPEG2000-1,2-二-O-烷基-sn3-氨基甲酰基甘油酯(PEG-C-DOMG)。PCT申请号PCT/US08/88676中描述了PEG-C-DOMG的合成。适用于本发明的再其他的PEG-脂质共轭物包括，但不限于1-[8’-(1,2-二肉豆蔻酰基-3-丙氧基)-甲酰胺基-3’,6’-二氧杂辛烷基]氨基甲酰基-ω-甲基-聚(乙二醇)(2KPEG-DMG)。2KPEG-DMG的合成描述于美国专利号7,404,969中。

在一些情况中，抑制颗粒聚集的共轭脂质(例如，PEG-脂质共轭物)可以构成颗粒中存在的总脂质的约0.1mol％至约2mol％，约0.5mol％至约2mol％，约1mol％至约2mol％，约0.6mol％至约1.9mol％，约0.7mol％至约1.8mol％，约0.8mol％至约1.7mol％，约1mol％至约1.8mol％，约1.2mol％至约1.8mol％，约1.2mol％至约1.7mol％，约1.3mol％至约1.6mol％，约1.4mol％至约1.5mol％，或约1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2mol％(或其任何分数或其中的范围)。通常，在这样的情况中，PEG部分具有约2,000道尔顿的平均分子量。在其他情况中，抑制颗粒聚集的共轭脂质(例如，PEG-脂质共轭物)可以构成颗粒中存在的总脂质的约5.0mol％至约10mol％，约5mol％至约9mol％，约5mol％至约8mol％，约6mol％至约9mol％，约6mol％至约8mol％，或约5mol％、6mol％、7mol％、8mol％、9mol％或10mol％(或其任何分数或其中的范围)。通常，在这样的情况中，PEG部分具有约750道尔顿的平均分子量。

在其他实施方式中，组合物包含两性脂质体，其包含至少一种正电荷载体和至少一种负电荷载体，所述负电荷载体不同于所述正电荷载体，所述脂质体的等电点为4-8。该目的是由于制备的脂质体具有pH依赖性的、变化的电荷而实现的。

例如，当成膜或基于膜的阳离子电荷载体的量在低pH下超过阴离子电荷载体的量并且该比率在较高pH下反转时，形成具有所需性质的脂质体结构。当可电离组分的pKa值在4和9之间时总是如此。当介质的pH下降时，所有阳离子电荷载体带电更多并且所有阴离子电荷载体失去它们的电荷。

可用于两性脂质体的阳离子化合物包括上文先前所述的那些阳离子化合物。非限制性地，强阳离子化合物可以包括例如：DC-Chol3-β-[N-(N′,N′-二甲基甲烷)氨甲酰基]胆固醇、TC-Chol 3-β-[N-(N′,N′,N′-三甲基氨基乙基)氨甲酰基胆固醇、BGSC二胍-亚精胺-胆固醇、BGTC二胍-tren-胆固醇、DOTAP(1,2-二油酰氧基丙基)-N,N,N-三甲基氯化铵、DOSPER(1,3-二油酰氧基-2-(6-羧基-精胺基)-丙酰胺、DOTMA(1,2-二油酰氧基丙基)-N,N,N-三甲基氯化铵)

DORIE溴化(1,2-二油酰氧基丙基)-3-二甲羟乙铵、DOSC(1,2-二油酰基-3-琥珀酰-sn-甘油胆碱酯)、DOGSDSO(1,2-二油酰基-sn-甘油-3-琥珀酰-2-羟乙基二硫化鸟氨酸)、DDAB溴化二甲基二-十八铵、DOGS((C18)2GlySper3+)N,N-二-十八氨基-乙二醇-精胺

(C18)2Gly+N,N-二-十八氨基甘氨酸、CTAB溴化鲸蜡基三甲铵、CpyC氯化鲸蜡基吡啶盐、DOEPC 1,2-二油酰基-顺-甘油-3-乙基磷酸胆碱或其他O-烷基-磷脂酰胆碱或乙醇胺，赖氨酰胺、精氨酰胺或鸟氨酰胺和磷脂酰乙醇胺。

弱阳离子化合物的实例包括但不限于：His-Chol(组胺酰-胆固醇半琥珀酸酯)、Mo-Chol(吗啉-N-乙氨基-胆固醇半琥珀酸酯)或组胺酰-PE。

中性化合物的实例包括但不限于：胆固醇、神经酰胺、磷脂酰胆碱、磷脂酰乙醇胺、四醚脂质或二酰基甘油。

可用于两性脂质体的阴离子化合物包括本文前面所述的那些非阳离子化合物。非限制性地，弱阴离子化合物的实例可以包括：CHEMS(胆固醇半琥珀酸酯)，具有8至25个碳原子的烷基羧酸，或二酰基甘油半琥珀酸酯。其他弱阴离子化合物可包括天冬氨酸或谷氨酸和PE的酰胺以及PS及其与甘氨酸、丙氨酸、谷氨酰胺、天冬酰胺、丝氨酸、半胱氨酸、苏氨酸、酪氨酸、谷氨酸、天冬氨酸或其他氨基酸或氨基二羧酸的酰胺。根据相同的原理，羟基羧酸或羟基二羧酸和PS的酯也是弱阴离子化合物。

在一些实施方式中，两性脂质体包含缀合的脂质，例如上文所述的那些。有用的缀合脂质的具体实例包括但不限于PEG修饰的磷脂乙醇胺和磷脂酸，PEG-神经酰胺缀合物(例如，PEG-CerC14或PEG-CerC20)，PEG修饰的二烷基胺和PEG修饰的1,2－二酰氧基丙烷-3-胺。一些具体实例是PEG改性的二酰基甘油和二烷基甘油。

在一些实施方式中，中性脂质占约10mol％至约60mol％、约15mol％至约60mol％、约20mol％至约60mol％、约25mol％至约60mol％、约30mol％至约60mol％、约10mol％至约55mol％、约15mol％至约55mol％、约20mol％至约55mol％。颗粒中存在的总脂质的约25mol％至约55mol％、约30mol％至约55mol％、约13mol％至约50mol％、约15mol％至约50mol％或约20mol％至约50mol％。

在一些情况下，抑制颗粒聚集的缀合脂质(例如，PEG-脂质缀合物)包含约0.1mol％至约2mol％、约0.5mol％至约2mol％、约1mol％至约2mol％、约0.6mol％至约1.9mol％、约0.7mol％至约1.8mol％、约0.8mol％至约1.7mol％、约1mol％至约1.8mol％。颗粒中存在的总脂质的约1.2mol％至约1.8mol％、约1.2mol％至约1.7mol％、约1.3mol％至约1.6mol％、约1.4mol％至约1.5mol％，或约1、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9或2mol％(或其任何分数或其中的范围)。通常，在这种情况下，PEG部分具有约2，000道尔顿的平均分子量。在其他情况下，抑制颗粒聚集的缀合脂质(例如，PEG-脂质缀合物)可包含约5.0mol％至约10mol％、约5mol％至约9mol％、约5mol％至约8mol％、约6mol％至约9mol％、约6mol％至约8mol％，或约5mol％、6mol％、7mol％、8mol％、9mol％。或颗粒中存在的总脂质的10mol％(或其任何级分或其中的范围)。通常，在这种情况下，PEG部分具有约750道尔顿的平均分子量。

考虑到中性和共轭脂质的总量，两性脂质体的剩余平衡可以包含以各种比例配制的阳离子化合物和阴离子化合物的混合物。可选择阳离子与阴离子脂质的比率以实现所需的核酸包封性质，ζ电位，pKa或至少部分取决于带电脂质组分的存在的其他物理化学性质。

2.6用于产生重组病毒的方法

在一些实施方式中，本发明提供了重组病毒(即重组病毒载体；例如，重组AAV)用于本发明的方法中。重组AAV通常在哺乳动物细胞系如HEK-293中产生。因为从重组体病毒中除去病毒帽和rep基因以防止其自身复制从而为待递送的治疗性基因(例如，核酸酶基因)腾出空间，所以必须在包装细胞系中以反式提供这些。此外，有必要提供支持复制所必需的“辅助”(例如，腺病毒)组分(Cots等，(2013),Curr.Gene Ther.13(5):370-81)。通常，使用三重转染产生重组AAV载体，其中细胞系用编码“辅助”组分的第一质粒、包含cap和rep基因的第二质粒和包含病毒ITR的第三质粒转染，所述病毒ITR包含待包装至所述病毒中的干预DNA序列。然后通过冻-融循环、超声处理、去污剂或本领域已知的其他方法从细胞中分离包含包裹在衣壳中的基因组(ITR和插入靶基因)的病毒颗粒。然后使用氯化铯密度梯度离心或亲和色谱法纯化颗粒，并随后将其递送至细胞、组织或生物体(例如,人类患者)的靶基因。

因为重组AAV颗粒通常在细胞中产生(制造)，所以在实施本发明时必须采取预防措施以确保位点特异性大范围核酸酶不在包装细胞中表达。因为本发明的病毒基因组包含大范围核酸酶的识别序列，所以在包装细胞系中表达的任何大范围核酸酶在包装到病毒颗粒中之前能够切割病毒基因组。这将导致降低的包装效率和/或片段化基因组的包装。可以使用几种方法来防止大范围核酸酶在包装细胞中表达。

可以将大范围核酸酶置于在包装细胞中无活性的组织特异性启动子的控制下。例如，如果病毒载体开发用于将大范围核酸酶基因递送至肌肉组织，则可以使用肌肉特异性启动子。肌肉特异性启动子的实例包括C5-12(Liu,等，(2004)Hum Gene Ther.15:783-92)、肌肉特异性肌酸激酶(MCK)启动子(Yuasa等，(2002),Gene Ther9:1576-88)或平滑肌22(SM22)启动子(Haase等，(2013),BMC Biotechnol 13:49-54)。CNS(神经元)特异性启动子的实例包括NSE、突触蛋白和MeCP2启动子(Lentz等，(2012),Neurobiol Dis48:179-88)。肝特异性启动子的实例包括白蛋白启动子(如Palb)、人α1-抗胰蛋白酶(如Pa1AT)和血红素结合蛋白(如Phpx)(Kramer等，(2003),Mol Therapy 7:375-85)。眼特异性启动子的实例包括视蛋白和角膜上皮特异性K12启动子(Martin等，(2002),Methods28:(2):267-75)(Tong等，(2007),J Gene Med 9:956-66)。这些启动子或本领域已知的其他组织特异性启动子在HEK-293细胞中不具有高活性，并且因此在整合至本发明的病毒载体中时，预期不会在包装细胞中产生显著水平的大范围核酸酶基因表达。类似地，本发明的病毒载体考虑使用其他细胞系及使用不相容的组织特异性启动子(即，公知的HeLa细胞系(人上皮细胞)和使用肝特异性血红素结合蛋白启动子)。组织特异性启动子的其他实例包括：滑膜肉瘤PDZD4(小脑)、C6(肝)、ASB5(肌肉)、PPP1R12B(心脏)、SLC5A12(肾)、胆固醇调节APOM(肝脏)、ADPRHL1(心脏)和单基因畸形综合征TP73L(肌肉)(Jacox等，(2010),PLoS One5(8):e12274)。

载体可以包装来自不同物种的在其中不可能表达大范围核酸酶的细胞中。例如，可以使用在非哺乳动物包装细胞中无活性的哺乳动物启动子(如公知的巨细胞病毒-或SV40病毒-早期启动子)在微生物、昆虫或植物细胞中产生病毒颗粒。在优选实施方式中，使用如Gao等(Gao等，(2007),J Biotechnol 131(2):138-43)描述的杆状病毒系统在昆虫细胞中产生病毒颗粒。在哺乳动物启动子控制下的大范围核酸酶不太可能在这些细胞中表达(Airenne等，(2013),Mol Ther 21(4):739-49)。此外，昆虫细胞利用不同于哺乳动物细胞的mRNA剪接基序。因此，有可能将哺乳动物内含子(如人生长激素(HGH)内含子或SV40大T抗原内含子)并入大范围核酸酶的编码序列中。因为这些内含子在昆虫细胞中不能有效地从前mRNA转录产物剪接，所以昆虫细胞不表达功能性大范围核酸酶，因而包装全长基因组。相反，对其递送所得重组AAV颗粒的哺乳动物细胞正确地剪接前mRNA并表达功能性大范围核酸酶蛋白。Haifeng Chen报道了使用HGH和SV40大T抗原内含子来减弱昆虫包装细胞中毒性蛋白芽孢杆菌RNA酶(barnase)和白喉毒素片段A的表达，从而使得能够产生携带这些毒素基因的重组AAV载体(Chen(2012),Mol Ther Nucleic Acids 1(11):e57)。

核酸酶基因可以与诱导型启动子可操作地连接，使得核酸酶的表达需要小分子诱导物。诱导型启动子的实例包括Tet-On系统(Clontech；Chen等，(2015),BMC Biotechnol15(1):4))和RheoSwitch系统(Intrexon；Sowa等，(2011),Spine 36(10):E623-8)。两种系统以及本领域中已知的类似系统依赖于配体诱导的转录因子(分别为Tet阻遏物和蜕皮激素受体的变体)，其响应于小分子激活剂(分别为强力霉素或蜕皮激素)而激活转录。使用这种配体诱导的转录激活剂实施本发明包括：1)将大范围核酸酶基因置于响应相应转录因子的启动子的控制下，该大范围核酸酶基因具有转录因子的结合位点；和2)在包装的病毒基因组中包括编码转录因子的基因。后一步骤是必要的，因为如果转录激活剂也未提供给相同的细胞，则在重组AAV递送后大范围核酸酶不会在靶细胞或组织中表达。然后转录激活剂仅在用同源小分子激活剂处理的细胞或组织中诱导大范围核酸酶基因表达。该方法是有利的，因为它使得大范围核酸酶基因表达能够通过选择何时和对何种组织递送小分子诱导剂而以时间-空间方式进行调节。然而，要求将诱导子包括在病毒基因组中(这显著地限制承载能力)形成了该方法的缺点。

在另一个特定实施方式中，重组AAV颗粒在表达防止大范围核酸酶表达的转录阻遏物的哺乳动物细胞系中产生。转录阻遏物是本领域已知的，并且包括Tet-阻遏物、Lac-阻遏物、Cro阻遏物和Lambda阻遏物。许多核激素受体(如蜕皮激素受体)在缺乏其同源激素配体的情况下也充当转录阻遏物。为了实施本发明，用编码转录阻遏物的载体转染/转导包装细胞，并将病毒基因组(包装载体)中的大范围核酸酶基因与经修饰以包含阻遏物的结合位点的启动子可操作地连接，使得阻遏物使启动子沉默。编码转录阻遏物的基因可以置于多个位置。它可以在单独的载体上编码；它可以在ITR序列外并入包装载体中；它可以并入cap/rep载体或腺病毒辅助载体中；或者最优选地，它可以稳定地整合到包装细胞的基因组中使其组成型地表达。修饰常见哺乳动物启动子以并入转录阻遏物位点的方法是本领域已知的。例如，Chang和Roninson修饰强组成型CMV和RSV启动子以包含Lac阻遏物的操纵基因，并且证明从修饰启动子的基因表达在表达阻遏物的细胞中大大减弱(Chang和Roninson(1996),Gene 183:137-42)。非人转录阻遏物的使用确保大范围核酸酶基因的转录仅在表达阻遏物的包装细胞中被阻遏，而在用所得重组AAV载体转导的靶细胞或组织中不被阻遏。

实施例

通过以下实施例进一步说明本发明，这些实施例不应被理解为是限制性的。仅使用常规实验，本领域技术人员将认识到或能够确定本文所述的特定物质和程序的许多等同。这样的等同旨在被包括在以下实施例之后的权利要求的范围内。

实施例1

对具体特定四碱基对中心序列的识别序列具有特异性的工程化大范围核酸酶的表征

进行这些研究以鉴定I-CreI衍生的亚基内的位置和残基，其影响具有特定四碱基对中心序列的识别序列的核酸酶活性。本文评价的那些中心序列包括：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA、TTAA、GTAA、GTAG、GTAT、GTGA、GTGC、GTGG和GTGT。

为了进行这些研究，开发了利用称为LOX 3-4x.109的I-CreI衍生的大范围核酸酶的系统，其序列如SEQ ID NO:8中所示。此前，LOX 3-4x.109核酸酶在特定位置被工程化，以使得其针对称为LOX 3-4的识别序列具有特异性，其序列如SEQ ID NO:6所示。在这些研究中，对LOX 3-4识别序列和LOX 3-4x.109大范围核酸酶两者进行进一步修饰。修饰LOX3-4识别序列以用上述中心序列之一替换其中心序列(ACAT)。在下表111中提供了这些经修饰的LOX 3-4识别序列。

表111：使用不同中心序列修饰的LOX 3-4识别序列

然后在一个亚基或两个亚基中修饰LOX3-4x.109大范围核酸酶，以鉴定可能影响核酸酶识别和切割修饰的LOX3-4识别序列的能力的位置和残基。结构上，LOX3-4x.109包含衍生自SV40的N端核酸酶定位信号，第一I-CreI衍生亚基，接头序列和第二I-CreI衍生亚基。一个亚基与SEQ ID NO:6的LOX3识别半位点结合，而另一个亚基与SEQ ID NO:6的LOX4识别半位点结合。LOX3-4x.109的第一和第二亚基各自包含56个碱基对的高变区，分别称为HVR1和HVR2。第一亚基中的HVR1区由SEQ ID NO:8的残基24-79组成，而第二亚基中的HVR2区由SEQ ID NO:8的残基215-270组成。在这些研究中，在HVR区内和HVR区外的位置修饰LOX3-4x.109，以产生具有改变的活性，亲和性和/或特异性的新的大范围核酸酶。值得注意的是，最初从野生型I-CreI修饰以赋予LOX3-4的每个亚基特异性的LOX3-4x.109大范围核酸酶中的位置没有进一步修饰。因此，在这些研究中观察到的活性的任何改变都与中心序列有关。

使用CHO细胞报告系统(参见WO/2012/167192，图3)来确定在这些研究中产生的工程化大范围核酸酶是否能够识别并切割表87中的经修饰的LOX3-4识别序列。为了进行测定，产生一对CHO细胞报道细胞系，其携带整合到细胞基因组中的非功能性绿色荧光蛋白(GFP)基因表达盒。每个细胞系中的GFP基因被一对识别序列打断，使得大范围核酸酶对任一识别序列的细胞内切割将刺激同源重组事件，产生功能性GFP基因。在两种细胞系中，识别序列之一衍生自LOX3-4识别序列(即，表87中公开的那些序列)，并且第二识别序列被称为“CHO23/24”的对照大范围核酸酶特异性识别。包含衍生自LOX3-4识别序列和CHO23/24识别序列的识别序列的CHO报告细胞在本文中称为“测试细胞”。

用编码工程化大范围核酸酶的质粒DNA转染测试细胞，所述工程化大范围核酸酶已针对相应的中心序列进行了优化。例如，将编码针对ATAT中心序列优化的工程化大范围核酸酶的DNA转染到CHO细胞中，其中整合的LOX3-4识别序列包含ATAT中心序列。在一些实验中，转染LOX3-4x.109工程化大范围核酸酶(SEQ ID NO:8)作为用于切割修饰的LOX3-4识别序列的额外对照。根据生产厂商的说明书，使用Lipofectamine 2000(Thermofisher)在96孔板中用50ng质粒DNA转染4e5CHO细胞。转染后48小时，通过流式细胞术评估细胞以确定与未转染的阴性对照(LOX3-4bs)相比GFP阳性细胞的百分比。在一些情况下，发现在某些位置(包括对应于I-CreI的位置48、50、71、72、73和74的一个或多个位置)的特定残基的置换在包含表87中提供的修饰的LOX3-4识别序列的细胞系中产生GFP阳性细胞，频率显著超过阴性对照并且与CHO23/24阳性对照相当或超过CHO23/24阳性对照(参见实施例2-27)。

实施例2

包含ACAA四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有ACAA中心序列(SEQ ID NO:9)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表112和113中。CHO报告基因测定的结果提供于表114中。

在如下所示的修饰之后，观察到具有ACAA四碱基对中心序列的识别序列的切割的实质性改进。

表112：针对ACAA中心序列优化的大范围核酸酶(第一亚基-Lox3)

表113：针对ACAA中心序列优化的大范围核酸酶(第二亚基-Lox4)

表114：CHO iGFFP测定ATAA中心序列切割

实施例3

包含ACAG四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。此外，产生了两个工程化的大范围核酸酶，其在位置264后插入了另外的R残基，其对应于野生型I-CreI的位置73。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有ACAG中心序列(SEQ ID NO:34)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表115和116中。CHO报告基因测定的结果提供于表117中。

在如下所示的修饰之后，观察到具有ACAG四碱基对中心序列的识别序列的切割的实质性改进。

表115：针对ACAG中心序列优化的大范围核酸酶(第一亚基-Lox3)

表116：针对ACAG中心序列优化的大范围核酸酶(第二亚基-Lox4)

表117：CHO iGFFP测定ACAG中心序列切割

实施例4

包含ACAT四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有ACAT中心序列(SEQ ID NO:44)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表118和119中。CHO报告基因测定的结果提供于表120中。

如所预期的，LOX3-4x.109大范围核酸酶表现出针对通常由LOX3-4识别序列组成的ACAT中心序列的活性。另外，被修饰成包含下表中所述残基的新的大范围核酸酶继续切割LOX3-4识别序列。

表118：针对ACAT中心序列优化的大范围核酸酶(第一亚基-Lox3)

表119：针对ACAT中心序列优化的大范围核酸酶(第二亚基-Lox4)

表120：CHO iGFFP测定ACAT中心序列切割

实施例5

包含ACGA四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有ACGA中心序列(SEQ ID NO:68)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表121和122中。CHO报告基因测定的结果提供于表123中。

在如下所示的修饰之后，观察到具有ACGA四碱基对中心序列的识别序列的切割的实质性改进。

表121：针对ACGA中心序列优化的大范围核酸酶(第一亚基-Lox3)

表122：针对ACGA中心序列优化的大范围核酸酶(第二亚基-Lox4)

表123：CHO iGFFP测定ACGA中心序列切割

实施例6

包含ACGC四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有ACGC中心序列(SEQ ID NO:90)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表124和125中。CHO报告基因测定的结果提供于表126中。

在如下所示的修饰之后，观察到在大多数工程化核酸酶中具有ACGC四碱基对中心序列的识别序列的切割的实质性改进，而一些与LOX 3-4x.109相当。

表124：针对ACGC中心序列优化的大范围核酸酶(第一亚基-Lox3)

表125：针对ACGC中心序列优化的大范围核酸酶(第二亚基-Lox4)

表126：CHO iGFFP测定ACGC中心序列切割

实施例7

包含ACGG四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。另外，在位置264之后插入R残基，其对应于野生型I-CreI的位置73。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有ACGG中心序列(SEQ ID NO:119)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表127和128中。CHO报告基因测定的结果提供于表129中。

在如下所示的修饰之后，观察到具有ACGG四碱基对中心序列的识别序列的切割的实质性改进。

表127：针对ACGG中心序列优化的大范围核酸酶(第一亚基-Lox3)

表128：针对ACGG中心序列优化的大范围核酸酶(第二亚基-Lox4)

表129：CHO iGFFP测定ACGG中心序列切割

实施例8

包含ACGT四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有ACGT中心序列(SEQ ID NO:136)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表130和131中。CHO报告基因测定的结果提供于表132中。

被修饰为包含下表中列举的残基的新的大范围核酸酶继续切割具有ACGT四碱基对中心序列的LOX3-4识别序列或比LOX3-4x.109大范围核酸酶活性更高。

表130：针对ACGT中心序列优化的大范围核酸酶(第一亚基-Lox3)

表131：针对ACGT中心序列优化的大范围核酸酶(第二亚基-Lox4)

表132：CHO iGFFP测定ACGT中心序列切割

实施例9

包含ATAA四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有ATAA中心序列(SEQ ID NO:157)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表133和134中。CHO报告基因测定的结果提供于表135中。

在如下所示的修饰之后，观察到具有ATAA四碱基对中心序列的识别序列的切割的实质性改进。

表133：针对ATAA中心序列优化的大范围核酸酶(第一亚基-Lox3)

表134：针对ATAA中心序列优化的大范围核酸酶(第二亚基-Lox4)

表135：CHO iGFFP测定ATAA中心序列切割

实施例10

包含ATAG四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有ATAG中心序列(SEQ ID NO:184)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表136和137中。CHO报告基因测定的结果提供于表138中。

在如下所示的修饰之后，观察到具有ATAG四碱基对中心序列的识别序列的切割的实质性改进。

表136：针对ATAG中心序列优化的大范围核酸酶(第一亚基-Lox3)

表137：针对ATAG中心序列优化的大范围核酸酶(第二亚基-Lox4)

表138：CHO iGFFP测定ATAG中心序列切割

实施例11

包含ATAT四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有ATAT中心序列(SEQ ID NO:200)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表139和140中。CHO报告基因测定的结果提供于表141中。

在如下所示的修饰之后，观察到具有ATAT四碱基对中心序列的识别序列的切割的实质性改进。

表139：针对ATAT中心序列优化的大范围核酸酶(第一亚基-Lox3)

表140：针对ATAT中心序列优化的大范围核酸酶(第二亚基-Lox4)

*对于m.2258大范围核酸酶，第二亚基的测序是不完整的。

表141：CHO iGFFP测定ATAT中心序列切割

实施例12

包含ATGA四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有ATGA中心序列(SEQ ID NO:220)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表142和143中。CHO报告基因测定的结果提供于表144中。

在如下所示的修饰之后，观察到具有ATGA四碱基对中心序列的识别序列的切割的实质性改进。

表142：针对ATGA中心序列优化的大范围核酸酶(第一亚基-Lox3)

表143：针对ATGA中心序列优化的大范围核酸酶(第二亚基-Lox4)

表144：CHO iGFFP测定ATGA中心序列切割

实施例13

包含ATGG四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。另外，产生了一种工程化大范围核酸酶，该工程化大范围核酸酶在位置264之后插入了一个另外的R残基，该位置对应于野生型I-CreI的位置73。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有ATGG中心序列(SEQ ID NO:244)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表145和146中。CHO报告基因测定的结果提供于表147中。

在如下所示的修饰之后，观察到具有ATGG四碱基对中心序列的识别序列的切割的实质性改进。

表145：针对ATGG中心序列优化的大范围核酸酶(第一亚基-Lox3)

表146：针对ATGG中心序列优化的大范围核酸酶(第二亚基-Lox4)

表147：CHO iGFFP测定ACAG中心序列切割

实施例14

包含GCAA四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有GCAA中心序列(SEQ ID NO:267)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表148和149中。CHO报告基因测定的结果提供于表150中。

在如下所示的修饰之后，观察到具有GCAA四碱基对中心序列的识别序列的切割的实质性改进。

表148：针对GCAA中心序列优化的大范围核酸酶(第一亚基-Lox3)

表149：针对GCAA中心序列优化的大范围核酸酶(第二亚基-Lox4)

表150：CHO iGFFP测定GCAA中心序列切割

实施例15

包含GCAT四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有GCAT中心序列(SEQ ID NO:292)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表151和152中。CHO报告基因测定的结果提供于表153中。新的大范围核酸酶列举的残基的新的大范围核酸酶继续切割具有GCAT四碱基对中心序列的LOX3-4识别序列。

表151：针对GCAT中心序列优化的大范围核酸酶(第一亚基-Lox3)

表152：针对GCAT中心序列优化的大范围核酸酶(第二亚基-Lox4)

表153：CHO iGFFP测定GCAT中心序列切割

实施例16

包含GCGA四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有GCGA中心序列(SEQ ID NO:314)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表154和155中。CHO报告基因测定的结果提供于表156中。

在如下所示的修饰之后，观察到具有GCGA四碱基对中心序列的识别序列的切割的实质性改进。

表154：针对GCGA中心序列优化的大范围核酸酶(第一亚基-Lox3)

表155：针对GCGA中心序列优化的大范围核酸酶(第二亚基-Lox4)

表156：CHO iGFFP测定GCGA中心序列切割

实施例17

包含GTAA四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有GTAA中心序列(SEQ ID NO:358)的LOX3-4识别序列的切割。第一亚基中的置换提供在表157中。CHO报告基因测定的结果提供于表158中。被修饰成包含下表中所述残基的新的大范围核酸酶能够切割具有GTAA四碱基对中心序列的LOX3-4识别序列。

表157：针对GTAA中心序列优化的大范围核酸酶(第一亚基-Lox3)

表158：CHO iGFFP测定GTAA中心序列切割

实施例18

包含GTAG四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有GTAG中心序列(SEQ ID NO:390)的LOX3-4识别序列的切割。第一亚基中的置换提供在表159中。CHO报告基因测定的结果提供于表160中。被修饰成包含下表中所述残基的新的大范围核酸酶能够切割具有GTAG四碱基对中心序列的LOX3-4识别序列。

表159：针对GTAG中心序列优化的大范围核酸酶(第一亚基-Lox3)

表160：CHO iGFFP测定GTAG中心序列切割

实施例19

包含GTAT四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有GTAT中心序列(SEQ ID NO:400)的LOX3-4识别序列的切割。第一亚基中的置换提供在表161中。CHO报告基因测定的结果提供于表162中。被修饰成包含下表中所述残基的新的大范围核酸酶能够切割具有GTAT四碱基对中心序列的LOX3-4识别序列。

表161：针对GTAT中心序列优化的大范围核酸酶(第一亚基-Lox3)

表162：CHO iGFFP测定GTAT中心序列切割

实施例20

包含GTGA四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有GTGA中心序列(SEQ ID NO:434)的LOX3-4识别序列的切割。第一亚基中的置换提供在表163中。CHO报告基因测定的结果提供于表164中。被修饰成包含下表中所述残基的新的大范围核酸酶能够切割具有GTGA四碱基对中心序列的LOX3-4识别序列。

表163：针对GTGA中心序列优化的大范围核酸酶(第一亚基-Lox3)

表164：CHO iGFFP测定GTGA中心序列切割

实施例21

包含GTGC四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有GTGC中心序列(SEQ ID NO:463)的LOX3-4识别序列的切割。第一亚基中的置换提供在表165中。CHO报告基因测定的结果提供于表166中。被修饰成包含下表中所述残基的新的大范围核酸酶能够切割具有GTGC四碱基对中心序列的LOX3-4识别序列。

表165：针对GTGC中心序列优化的大范围核酸酶(第一亚基-Lox3)

表166.CHO iGFFP测定GTGC中心序列切割

实施例22

包含GTGG四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有GTGG中心序列(SEQ ID NO:496)的LOX3-4识别序列的切割。第一亚基中的置换提供在表167中。CHO报告基因测定的结果提供于表168中。被修饰成包含下表中所述残基的新的大范围核酸酶能够切割具有GTGG四碱基对中心序列的LOX3-4识别序列。

表167：针对GTGG中心序列优化的大范围核酸酶(第一亚基-Lox3)

表168：CHO iGFFP测定GTGG中心序列切割

实施例23

包含GTGT四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有GTGT中心序列(SEQ ID NO:502)的LOX3-4识别序列的切割。第一亚基中的置换提供在表169中。CHO报告基因测定的结果提供于表170中。被修饰成包含下表中所述残基的新的大范围核酸酶能够切割具有GTGT四碱基对中心序列的LOX3-4识别序列。

表169：针对GTGT中心序列优化的大范围核酸酶(第一亚基-Lox3)

表170：CHO iGFFP测定GTGT中心序列切割

实施例24

包含TCAA四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有TCAA中心序列(SEQ ID NO:331)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表171和172中。CHO报告基因测定的结果提供于表173中。

在如下所示的修饰之后，观察到具有TCAA四碱基对中心序列的识别序列的切割的实质性改进。

表171：针对TCAA中心序列优化的大范围核酸酶(第一亚基-Lox3)

表172：针对TCAA中心序列优化的大范围核酸酶(第二亚基-Lox4)

表173：CHO iGFFP测定TCAA中心序列切割

实施例25

包含TTAA四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有TTAA中心序列(SEQ ID NO:341)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表174和175中。CHO报告基因测定的结果提供于表176中。

在如下所示的修饰之后，观察到具有TTAA四碱基对中心序列的识别序列的切割的实质性改进。

表174：针对TTAA中心序列优化的大范围核酸酶(第一亚基-Lox3)

表175：针对TTAA中心序列优化的大范围核酸酶(第二亚基-Lox4)

表176：CHO iGFFP测定TTAA中心序列切割

实施例26

包含TTGG四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。N末端亚基识别四碱基对中心序列的AG部分的反向互补序列，即CT，而C末端亚基识别两碱基对中心序列的GC部分。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有TTGG中心序列(SEQ ID NO:248)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表177和178中。CHO报告基因测定的结果提供于表179中。

在如下所示的修饰之后，观察到具有TTGG四碱基对中心序列的识别序列的切割的实质性改进。

表177：针对TTGG中心序列优化的大范围核酸酶(第一亚基-Lox3)

表178：针对TTGG中心序列优化的大范围核酸酶(第二亚基-Lox4)

表179：CHO iGFFP测定TTGG中心序列切割

实施例27

包含GCAG四碱基对中心序列的工程化大范围核酸酶切割识别序列

通过在第一亚基中的一个或多个位置和第二亚基中的一个或多个位置处进行氨基酸置换来制备衍生自LOX3-4x.109大范围核酸酶的新型工程化大范围核酸酶。N末端亚基识别四碱基对中心序列的AG部分的反向互补序列，即CT，而C末端亚基识别两碱基对中心序列的GC部分。然后在根据实施例1所述的CHO报告基因测定中评价这些工程化大范围核酸酶对被修饰成具有GCAG中心序列(SEQ ID NO:326)的LOX3-4识别序列的切割。每个亚基中的置换分别提供在表180和181中。CHO报告基因测定的结果提供于表182中。

在如下所示的修饰之后，观察到具有GCAG四碱基对中心序列的识别序列的切割的实质性改进。

表180：针对GCAG中心序列优化的大范围核酸酶(CT识别第一亚基-Lox4)

表181：针对GCAG中心序列优化的大范围核酸酶(GC识别第二亚基-Lox3)

表182：CHO iGFFP测定GCAG中心序列切割

实施例28

I-CreI衍生的大范围核酸酶的N末端和C末端识别部分的置换

汇总实施例1-27中观察到的置换模式以确定氨基酸置换的子集，所述氨基酸置换可用于改善I-CreI衍生的大范围核酸酶对四碱基对中心序列的切割。因为大范围核酸酶的每个亚基识别存在于中心序列中的四个碱基中的两个，所以发现对第一亚基进行的置换可以与对第二亚基进行的置换配对。可以在48、50、71、72、73、73B和74的相应位置处置换WTI-CreI残基的氨基酸残基提供于下表183中。

使用这种方法，对于I-CreI大范围核酸酶的每个亚基，可以衍生出增强给定中心序列切割的氨基酸残基。制备在相应位置具有指定氨基酸的I-CreI大范围核酸酶预期将切割给定的中心序列。例如，切割中心序列ATAG的大范围核酸酶，对应于表183中提供的用于第一亚基的AT的I-CreI的位置48、50、71、72、73、73B和74的残基可与对应于表183中提供的用于第二亚基的CT(AG的反向互补)的I-CreI的位置48、50、71、72、73、73B和74的残基组合。在第一亚基和/或第二亚基中对应于I-CreI的位置48、50、71、72、73、73B和74的一个或多个残基对四个碱基对中心ATAG、ATAA、ATGA、ATGG、ACAA、ACAG、ACGA、ACGC、ACGG、TTGG、TCAA、GCAA、GCAT、GCGA、GCAG、GTAA、GTGA、GTGG、GTAG、GTAT和GTGC的示例性预测置换在下表184-205中提供。这些简化的预测位置对应于在此描述的实验测试的位置。在对应于I-CreI的位置48、50、71、72、73、73B和74的第一亚基和/或第二亚基中一个或多个残基对四个碱基对中心CCAG、CCGA、CCGC、CTAA、CTGA的示例性预测置换提供于下表206-210中。这些中心没有进行实验测试，但预计将被本文所述的工程化大范围核酸酶切割，其修饰如表206-210中所示。

表183：配对中心序列半位点的氨基酸序列

表184：针对ATAG的中心序列半位点的氨基酸序列

表185：针对ATAA的中心序列半位点的氨基酸序列

表186：针对ATGA的中心序列半位点的氨基酸序列

表187：针对ATGG的中心序列半位点的氨基酸序列

表188：针对ACAA的中心序列半位点的氨基酸序列

表189：针对ACAG的中心序列半位点的氨基酸序列

表190：针对ACGA的中心序列半位点的氨基酸序列

表191：针对ACGC的中心序列半位点的氨基酸序列

表192：针对ACGG的中心序列半位点的氨基酸序列

表193：针对TTAA的中心序列半位点的氨基酸序列

表194：针对TTGG的中心序列半位点的氨基酸序列

表195：针对TCAA的中心序列半位点的氨基酸序列

表196：针对GCAA的中心序列半位点的氨基酸序列

表197：针对GCAT的中心序列半位点的氨基酸序列

表198：针对GCGA的中心序列半位点的氨基酸序列

表199：针对GCAG的中心序列半位点的氨基酸序列

表200：针对GTAA的预期中心序列半位点的氨基酸序列

表201：针对GTGA的中心序列半位点的氨基酸序列

表202：针对GTGG的中心序列半位点的氨基酸序列

表203：针对GTAG的中心序列半位点的氨基酸序列

表204：针对GTAT的中心序列半位点的氨基酸序列

表205：针对GTGC的中心序列半位点的氨基酸序列

表206：针对CCAG的中心序列半位点的氨基酸序列

表207：针对CCGA的中心序列半位点的氨基酸序列

表208：针对CCGC的中心序列半位点的氨基酸序列

表209：针对CTAA的中心序列半位点的氨基酸序列

表210：针对CTGA的中心序列半位点的氨基酸序列

Claims

1.一种工程化I-CreI衍生的大范围核酸酶，其结合并切割包含选自以下的中心序列的识别序列：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTAA，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQ ID NO:1的氨基酸序列，并且其中所述第一亚基和所述第二亚基各自在对应于SEQ ID NO:1的位置48、50、71、72、73、73B和74的一个或多个位置处包含置换。

2.根据权利要求1所述的工程化大范围核酸酶，其中所述第一亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、D、G、H、I、K、L、N、Q、R、S或T残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、D、E、G、I、K、L、N、Q、R、S、T、V或W残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的A、C、G、H、I、K、N、P、R、S或T残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的A、D、G、H、K、L、M、N、P、Q、R、S、T或V残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、I、S、T或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A、C、T或S残基。

3.根据权利要求1或权利要求2所述的工程化大范围核酸酶，其中所述第二亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、I、K、L、N、Q、R、S或T残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、E、G、H、I、K、N、P、Q、R、S、T或V残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的A、D、E、G、H、I、K、N、P、Q、R、S、T或Y残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的A、C、E、G、H、I、K、M、N、P、Q、R、S、T、V或Y残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、H、I、R、S、T或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A、C、S或T残基。

4.根据权利要求1-3中任一项所述的工程化大范围核酸酶，其中所述中心序列由ACAA、ACAG、ACAT、ACGC、ACGG或ACGT组成，其中所述第一亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、I、K、L、N、Q或S残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、K、Q、R、S、T、V或W残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的A、G、P或R残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的H、K、P、Q、R或T残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的S残基。

5.根据权利要求1-3中任一项所述的工程化大范围核酸酶，其中所述中心序列由ATAA、ATAG、ATAT、ATGA、ATGG组成，其中所述第一亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、D、G、H、K、L、N、Q、S或T残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的C、D、E、G、I、K、N、R、S、T或V残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的G、H、I、K、N、R或S残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的A、G、H、K、L、N、P、Q、R、S或T残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、S或T残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A、C或S残基。

6.根据权利要求1-3中任一项所述的工程化大范围核酸酶，其中所述中心序列由GCAA、GCAT、GCGA或GCAG组成，其中所述第一亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的A、H、K或R残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的C、K、L、Q、R、S、T或V残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的A、G、H、N、R、S或T残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的A、G、H、M、N、P、Q、R、S、T或V残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、I、T或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A或S残基。

7.根据权利要求1-3中任一项所述的工程化大范围核酸酶，其中所述中心序列由TTGG或TTAA组成，其中所述第一亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的K、N、R或S残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的C、E、K、R、S、T或V残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的A、G、K、N、R或S残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的A、D、H、K、N、Q、R、S或T残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

8.根据权利要求1-3中任一项所述的工程化大范围核酸酶，其中所述中心序列由TCAA组成，其中所述第一亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的A、G、H、K、N、Q、R或S残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的C、R、S或T残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、S或T残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的G、H、P、R、S或T残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A或S残基。

9.根据权利要求1-4中任一项所述的工程化大范围核酸酶，其中所述中心序列由ACAA、ACAG、ACAT、ACGC、ACGG或ACGT组成，其中所述第二亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、K、L、N、Q、R、S或T残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、G、H、K、L、N、Q、R、S或T残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的A、D、E、G、H、K、N、P、R、S或T残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的A、G、H、K、M、N、P、P、Q、R、S或T残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、H、I、R、S、T或V残基；

(f)任选地，在紧随对应于SEQ ID NO:1的位置73的位置之后的位置(73B)处的R残基；和

(g)在对应于SEQ ID NO:1的位置74的位置处的A、C、S或T残基。

10.根据权利要求1-3或权利要求5中任一项所述的工程化大范围核酸酶，其中所述中心序列由ATAA、ATAG、ATAT、ATGA或ATGG组成，其中所述第二亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、K、N、Q、R、S或T残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、E、I、K、N、Q、R、S或T残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的A、C、E、I、K、N、Q、R、S或T残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的A、G、H、K、N、Q、R、S、T、V或Y残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、H、I、R、S或V残基；

(g)在对应于SEQ ID NO:1的位置74的位置处的A、C、S或T残基。

11.根据权利要求1-3或权利要求6中任一项所述的工程化大范围核酸酶，其中所述中心序列由GCAA、GCAT、GCGA或GCAG组成，其中所述第二亚基包含下述残基中的一个或多个：

(b)在对应于SEQ ID NO:1的位置50的位置处的C、E、H、K、Q、R、S、T或V残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的A、G、H、K、R、S、T或Y残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的A、C、E、G、H、K、N、Q、R、S、T或Y残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G、H、I、R、S或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

12.根据权利要求1-3或权利要求7中任一项所述的工程化大范围核酸酶，其中所述中心序列由TTGG或TTAA组成，其中所述第二亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的A、K、S或T残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的C、E、K、R或T残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的A、D、G、K、Q、R、S或T残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的G、I、R、S、T或V残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的I、R或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

13.根据权利要求1-3或权利要求8中任一项所述的工程化大范围核酸酶，其中所述中心序列由TCAA组成，其中所述第二亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的K或S残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的C、K、R或T残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的G、R或T残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的G、P、R、S或T残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

14.根据权利要求1所述的工程化大范围核酸酶，其中：

(a)所述中心序列是ACAA和所述第一亚基包含对应于SEQ ID NO:11-33中任一项的残基48、50、71、72、73和74的残基，

(b)所述中心序列是ACAG和所述第一亚基包含对应于SEQ ID NO:36-43中任一项的残基48、50、71、72、73和74的残基，

(c)所述中心序列是ACAT和所述第一亚基包含对应于SEQ ID NO:46-67中任一项的残基48、50、71、72、73和74的残基，

(d)所述中心序列是ACGA和所述第一亚基包含对应于SEQ ID NO:70-89中任一项的残基48、50、71、72、73和74的残基，

(e)所述中心序列是ACGC和所述第一亚基包含对应于SEQ ID NO:92-118中任一项的残基48、50、71、72、73和74的残基，

(f)所述中心序列是ACGG和所述第一亚基包含对应于SEQ ID NO:121-135中任一项的残基48、50、71、72、73和74的残基，

(g)所述中心序列是ACGT和所述第一亚基包含对应于SEQ ID NO:138-156中任一项的残基48、50、71、72、73和74的残基，

(h)所述中心序列是ATAA和所述第一亚基包含对应于SEQ ID NO:159-183中任一项的残基48、50、71、72、73和74的残基，

(i)所述中心序列是ATAG和所述第一亚基包含对应于SEQ ID NO:186-199中任一项的残基48、50、71、72、73和74的残基，

(j)所述中心序列是ATAT和所述第一亚基包含对应于SEQ ID NO:202-219中任一项的残基48、50、71、72、73和74的残基，

(k)所述中心序列是ATGA和所述第一亚基包含对应于SEQ ID NO:222-243中任一项的残基48、50、71、72、73和74的残基，

(l)所述中心序列是ATGG和所述第一亚基包含对应于SEQ ID NO:246-247中任一项的残基48、50、71、72、73和74的残基，

(m)所述中心序列是TTGG和所述第一亚基包含对应于SEQ ID NO:250-266中任一项的残基48、50、71、72、73和74的残基，

(n)所述中心序列是GCAA和所述第一亚基包含对应于SEQ ID NO:269-291中任一项的残基48、50、71、72、73和74的残基，

(o)所述中心序列是GCAT和所述第一亚基包含对应于SEQ ID NO:294-313中任一项的残基48、50、71、72、73和74的残基，

(p)所述中心序列是GCGA和所述第一亚基包含对应于SEQ ID NO:316-325中任一项的残基48、50、71、72、73和74的残基，

(q)所述中心序列是GCAG和所述第一亚基包含对应于SEQ ID NO:328-330中任一项的残基48、50、71、72、73和74的残基，

(r)所述中心序列是TCAA和所述第一亚基包含对应于SEQ ID NO:333-340中任一项的残基48、50、71、72、73和74的残基，或者

(s)所述中心序列是TTAA和所述第一亚基包含对应于SEQ ID NO:343-357中任一项的残基48、50、71、72、73和74的残基。

15.根据权利要求1-14中任一项所述的工程化大范围核酸酶，其中：

(a)所述中心序列是ACAA和所述第二亚基包含对应于SEQ ID NO:11-33中任一项的残基48、50、71、72、73和74的残基，

(b)所述中心序列是ACAG和所述第二亚基包含对应于SEQ ID NO:36-43中任一项的残基48、50、71、72、73和74的残基，

(c)所述中心序列是ACAT和所述第二亚基包含对应于SEQ ID NO:46-67中任一项的残基48、50、71、72、73和74的残基，

(d)所述中心序列是ACGA和所述第二亚基包含对应于SEQ ID NO:70-89中任一项的残基48、50、71、72、73和74的残基，

(e)所述中心序列是ACGC和所述第二亚基包含对应于SEQ ID NO:92-118中任一项的残基48、50、71、72、73和74的残基，

(f)所述中心序列是ACGG和所述第二亚基包含对应于SEQ ID NO:121-135中任一项的残基48、50、71、72、73和74的残基，

(g)所述中心序列是ACGT和所述第二亚基包含对应于SEQ ID NO:138-156中任一项的残基48、50、71、72、73和74的残基，

(h)所述中心序列是ATAA和所述第二亚基包含对应于SEQ ID NO:159-183中任一项的残基48、50、71、72、73和74的残基，

(i)所述中心序列是ATAG和所述第二亚基包含对应于SEQ ID NO:186-199中任一项的残基48、50、71、72、73和74的残基，

(j)所述中心序列是ATAT和所述第二亚基包含对应于SEQ ID NO:202-219中任一项的残基48、50、71、72、73和74的残基，

(k)所述中心序列是ATGA和所述第二亚基包含对应于SEQ ID NO:222-243中任一项的残基48、50、71、72、73和74的残基，

(l)所述中心序列是ATGG和所述第二亚基包含对应于SEQ ID NO:246-247中任一项的残基48、50、71、72、73和74的残基，

(m)所述中心序列是TTGG和所述第二亚基包含对应于SEQ ID NO:250-266中任一项的残基48、50、71、72、73和74的残基，

(n)所述中心序列是GCAA和所述第二亚基包含对应于SEQ ID NO:269-291中任一项的残基48、50、71、72、73和74的残基，

(o)所述中心序列是GCAT和所述第二亚基包含对应于SEQ ID NO:294-313中任一项的残基48、50、71、72、73和74的残基，

(p)所述中心序列是GCGA和所述第二亚基包含对应于SEQ ID NO:316-325中任一项的残基48、50、71、72、73和74的残基，

(q)所述中心序列是GCAG和所述第二亚基包含对应于SEQ ID NO:328-330中任一项的残基48、50、71、72、73和74的残基，

(r)所述中心序列是TCAA和所述第二亚基包含对应于SEQ ID NO:333-340中任一项的残基48、50、71、72、73和74的残基，或者

(s)所述中心序列是TTAA和所述第二亚基包含对应于SEQ ID NO:343-357中任一项的残基48、50、71、72、73和74的残基。

16.一种用于在包含大范围核酸酶识别序列的靶位点处切割双链DNA的方法，其中所述识别序列包含由以下组成的中心序列：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTAA，其中所述方法包括将具有所述靶位点的所述双链DNA与根据权利要求1-15中任一项所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割所述识别序列。

17.一种用于增加结合并切割识别序列的工程化大范围核酸酶的切割活性的方法，所述识别序列包含由以下组成的中心序列：ACAA、ACAG、ACAT、ACGA、ACGC、ACGG、ACGT、ATAA、ATAG、ATAT、ATGA、ATGG、TTGG、GCAA、GCAT、GCGA、GCAG、TCAA或TTAA，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基和所述第二亚基各自包含衍生自SEQID NO:1的氨基酸序列，所述方法包括在对应于SEQ ID NO:1的位置48、50、71、72、73和74的一个或多个位置处修饰所述第一亚基和所述第二亚基中的每一个，其中当与对照工程化大范围核酸酶比较时，所述修饰的核酸酶具有增加的切割活性。

18.根据权利要求17所述的方法，其中所述修饰步骤包括修饰所述第一亚基以包含下述残基中的一个或多个：

(f)在对应于SEQ ID NO:1的位置74的位置处的A、C、T或S残基。

19.根据权利要求17或权利要求18所述的方法，其中所述修饰步骤包括修饰所述第二亚基以包含下述残基中的一个或多个：

(f)在对应于SEQ ID NO:1的位置74的位置处的A、C、S或T残基。

20.根据权利要求17-19中任一项所述的方法，其中所述中心序列由ACAA、ACAG、ACAT、ACGC、ACGG或ACGT组成，并且其中所述修饰步骤包括修饰所述第一亚基以包含下述残基中的一个或多个：

(c)在对应于SEQ ID NO:1的位置71的位置处的A、G、P或R残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、G或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的S残基。

21.根据权利要求17-19中任一项所述的方法，其中所述中心序列由ATAA、ATAG、ATAT、ATGA或ATGG组成，并且其中所述修饰步骤包括修饰所述第一亚基以包含下述残基中的一个或多个：

(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、S或T残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A、C或S残基。

22.根据权利要求17-19中任一项所述的方法，其中所述中心序列由GCAA、GCAT、GCGA或GCAG组成，并且其中所述修饰步骤包括修饰所述第一亚基以包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的A、H、K或R残基；

(f)在对应于SEQ ID NO:1的位置74的位置处的A或S残基。

23.根据权利要求17-19中任一项所述的方法，其中所述中心序列由TTGG或TTAA组成，并且其中所述修饰步骤包括修饰所述第一亚基以包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的K、N、R或S残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

24.根据权利要求17-19中任一项所述的方法，其中所述中心序列由TCAA组成，并且其中所述修饰步骤包括修饰所述第一亚基以包含下述残基中的一个或多个：

(b)在对应于SEQ ID NO:1的位置50的位置处的C、R、S或T残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的G、R、S或T残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A或S残基。

25.根据权利要求17-20中任一项所述的方法，其中所述中心序列由ACAA、ACAG、ACAT、ACGC、ACGG或ACGT组成，并且其中所述修饰步骤包括修饰所述第二亚基以包含下述残基中的一个或多个：

(g)在对应于SEQ ID NO:1的位置74的位置处的A、C、S或T残基。

26.根据权利要求17-19或权利要求21中任一项所述的方法，其中所述中心序列由ATAA、ATAG、ATAT、ATGA或ATGG组成，并且其中所述修饰步骤包括修饰所述第二亚基以包含下述残基中的一个或多个：

(g)在对应于SEQ ID NO:1的位置74的位置处的A、C、S或T残基。

27.根据权利要求17-19或权利要求22中任一项所述的方法，其中所述中心序列由GCAA、GCAT、GCGA或GCAG组成，并且其中所述修饰步骤包括修饰所述第二亚基以包含下述残基中的一个或多个：

(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

28.根据权利要求17-19或权利要求23中任一项所述的方法，其中所述中心序列由TTGG或TTAA组成，并且其中所述修饰步骤包括修饰所述第二亚基以包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的A、K、S或T残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的C、E、K、R或T残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的I、R或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

29.根据权利要求17-19或权利要求24中任一项所述的方法，其中所述中心序列由TCAA组成，并且其中所述修饰步骤包括修饰所述第二亚基以包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的K或S残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的C、K、R或T残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的G、R或T残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的G、P、R、S或T残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的I或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A、S或T残基。

30.根据权利要求17-29中任一项所述的方法，其中：

31.根据权利要求17-30中任一项所述的方法，其中：

32.一种工程化大范围核酸酶，其结合并切割包含由以下组成的中心序列的识别序列：GTAA、GTAG、GTAT、GTGA、GTGC、GTGG或GTGT，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基包含源自SEQ ID NO:1的氨基酸序列，并且其中所述第一亚基在对应于SEQ ID NO:1的位置48、50、71、72、73和74的一个或多个位置处包含置换。

33.根据权利要求32所述的工程化大范围核酸酶，其中所述第一亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的A、C、G、H、K、L、M、N、Q、R、S、T或V残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的A、C、E、G、I、K、L、Q、R、S、T或V残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的A、D、E、F、G、H、I、K、L、N、Q、R、S、T、V或Y残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的A、C、D、G、H、K、M、N、P、Q、R、S、T、V、W或Y残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的A、C、I、L、N、R、S、T或V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的A、C、G、S或T残基。

34.根据权利要求32或权利要求33所述的工程化大范围核酸酶，其中所述第二亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的K残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的Q残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的G残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的S残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的S残基。

35.根据权利要求32-34中任一项所述的工程化大范围核酸酶，其中：

(a)所述中心序列是GTAA和所述第一亚基包含对应于SEQ ID NO:360-389中任一项的残基48、50、71、72、73和74的残基，

(b)所述中心序列是GTAG和所述第一亚基包含对应于SEQ ID NO:392-399中任一项的残基48、50、71、72、73和74的残基，

(c)所述中心序列是GTAT和所述第一亚基包含对应于SEQ ID NO:402-433中任一项的残基48、50、71、72、73和74的残基，

(d)所述中心序列是GTGA和所述第一亚基包含对应于SEQ ID NO:436-462中任一项的残基48、50、71、72、73和74的残基，

(e)所述中心序列是GTGC和所述第一亚基包含对应于SEQ ID NO:465-495中任一项的残基48、50、71、72、73和74的残基，

(f)所述中心序列是GTGG和所述第一亚基包含对应于SEQ ID NO:498-501中任一项的残基48、50、71、72、73和74的残基，或者

(g)所述中心序列是GTGT和所述第一亚基包含对应于SEQ ID NO:504-529中任一项的残基48、50、71、72、73和74的残基。

36.一种用于在包含大范围核酸酶识别序列的靶位点处切割双链DNA的方法，其中所述识别序列包含由以下组成的中心序列：GTAA、GTAG、GTAT、GTGA、GTGC、GTGG或GTGT，其中所述方法包括将具有所述靶位点的所述双链DNA与根据权利要求32-35中任一项所述的工程化大范围核酸酶接触，其中所述工程化大范围核酸酶结合并切割所述识别序列。

37.一种用于增加结合并切割识别序列的工程化大范围核酸酶的切割活性的方法，所述识别序列包含由以下组成的中心序列：GTAA、GTAG、GTAT、GTGA、GTGC、GTGG或GTGT，其中所述工程化大范围核酸酶包含第一亚基和第二亚基，其中所述第一亚基包含衍生自SEQ IDNO:1的氨基酸序列，所述方法包括在对应于SEQ ID NO:1的位置48、50、71、72、73和74的一个或多个位置处修饰所述第一亚基，其中当与对照工程化大范围核酸酶比较时，所述修饰的核酸酶具有增加的切割活性。

38.根据权利要求37所述的方法，其中所述修饰步骤包括修饰所述第一亚基以包含下述残基中的一个或多个：

(f)在对应于SEQ ID NO:1的位置74的位置处的A、C、G、S或T残基。

39.根据权利要求37或权利要求38所述的方法，其中所述第二亚基包含下述残基中的一个或多个：

(a)在对应于SEQ ID NO:1的位置48的位置处的K残基；

(b)在对应于SEQ ID NO:1的位置50的位置处的Q残基；

(c)在对应于SEQ ID NO:1的位置71的位置处的G残基；

(d)在对应于SEQ ID NO:1的位置72的位置处的S残基；

(e)在对应于SEQ ID NO:1的位置73的位置处的V残基；和

(f)在对应于SEQ ID NO:1的位置74的位置处的S残基。

40.根据权利要求37-39中任一项所述的方法，其中：

41.一种多核苷酸，其包含编码根据权利要求1-15或权利要求32-35中任一项所述的工程化大范围核酸酶的核酸序列。

42.根据权利要求41所述的多核苷酸，其中所述多核苷酸是mRNA。

43.一种包含多核苷酸的重组DNA构建体，所述多核苷酸包含编码根据权利要求1-15或权利要求32-35中任一项所述的工程化大范围核酸酶的核酸序列。

44.根据权利要求43所述的重组DNA构建体，其中所述重组DNA构建体编码包含所述多核苷酸的重组病毒。

45.根据权利要求44所述的重组DNA构建体，其中所述重组病毒是重组腺病毒、重组慢病毒、重组逆转录病毒或重组腺相关病毒(AAV)。

46.根据权利要求44或权利要求45所述的重组DNA构建体，其中所述重组病毒是重组AAV。

47.一种包含多核苷酸的重组病毒，所述多核苷酸包含编码根据权利要求1-15或权利要求32-35中任一项所述的工程化大范围核酸酶的核酸序列。

48.根据权利要求47所述的重组病毒，其中所述重组病毒是重组腺病毒、重组慢病毒、重组逆转录病毒或重组AAV。

49.根据权利要求48所述的重组病毒，其中所述重组病毒是重组AAV。

50.一种用于产生遗传修饰的真核细胞的方法，所述遗传修饰的真核细胞在其染色体中具有破坏的靶序列，所述方法包括：

将包含编码根据权利要求1-15或权利要求32-35中任一项所述的工程化大范围核酸酶的核酸序列的多核苷酸引入所述真核细胞中，其中所述工程化大范围核酸酶在所述真核细胞中被表达；

其中所述工程化大范围核酸酶在识别序列处在所述染色体中产生切割位点，并且其中所述靶序列在所述切割位点处通过非同源末端连接被破坏。

51.根据权利要求50所述的方法，其中所述核酸通过mRNA或重组病毒被引入所述真核细胞中。

52.根据权利要求50或权利要求51所述的方法，其中所述真核细胞是哺乳动物细胞。

53.根据权利要求50-52中任一项所述的方法，其中所述真核细胞是人细胞。

54.根据权利要求50或权利要求51所述的方法，其中所述真核细胞是植物细胞。

55.一种用于产生遗传修饰的真核细胞的方法，所述遗传修饰的真核细胞在其染色体中具有破坏的靶序列，所述方法包括：

将根据权利要求1-15或权利要求32-35中任一项所述的工程化大范围核酸酶引入所述真核细胞中；

56.根据权利要求55所述的方法，其中所述真核细胞是哺乳动物细胞。

57.根据权利要求55或权利要求56所述的方法，其中所述真核细胞是人细胞。

58.根据权利要求55所述的方法，其中所述真核细胞是植物细胞。

59.一种用于产生遗传修饰的真核细胞的方法，所述遗传修饰的真核细胞包含插入所述遗传修饰的真核细胞的染色体中的感兴趣的外源性序列，所述方法包括将一个或多个包含以下的多核苷酸引入所述真核细胞中：

(a)编码根据权利要求1-15或权利要求32-35中任一项所述的工程化大范围核酸酶的第一核酸，其中所述工程化大范围核酸酶在所述真核细胞中被表达；和

(b)包含所述感兴趣的序列的第二核酸序列；

其中所述工程化大范围核酸酶在识别序列处在所述染色体中产生切割位点；

并且其中所述感兴趣的序列在所述切割位点处被插入所述染色体中。

60.根据权利要求59所述的方法，其中所述第二核酸序列还包含与所述切割位点侧翼的序列同源的序列，并且所述感兴趣的序列通过同源重组在所述切割位点处被插入。

61.根据权利要求59或权利要求60所述的方法，其中所述第一核酸序列通过mRNA或重组病毒被引入所述真核细胞中。

62.根据权利要求59-61中任一项所述的方法，其中所述第二核酸通过重组病毒被引入所述真核细胞中。

63.根据权利要求59-62中任一项所述的方法，其中所述真核细胞是哺乳动物细胞。

64.根据权利要求59-63中任一项所述的方法，其中所述真核细胞是人细胞。

65.根据权利要求59-62中任一项所述的方法，其中所述真核细胞是植物细胞。

66.一种用于产生遗传修饰的真核细胞的方法，所述遗传修饰的真核细胞包含插入所述遗传修饰的真核细胞的染色体中的感兴趣的外源性序列，所述方法包括：

(a)将根据权利要求1-15或权利要求32-35中任一项所述的工程化大范围核酸酶引入所述真核细胞中；和

(b)将包含核酸序列的多核苷酸引入所述真核细胞中，所述核酸序列包含所述感兴趣的序列；

其中所述工程化大范围核酸酶在识别序列处在所述染色体中产生切割位点；并且

其中所述感兴趣的序列在所述切割位点处被插入所述染色体中。

67.根据权利要求66所述的方法，其中所述多核苷酸还包含与所述切割位点侧翼的序列同源的序列，并且所述感兴趣的序列通过同源重组在所述切割位点处被插入。

68.根据权利要求66或权利要求67所述的方法，其中所述多核苷酸通过重组病毒被引入所述真核细胞中。

69.根据权利要求66-68中任一项所述的方法，其中所述真核细胞是哺乳动物细胞。

70.根据权利要求66-69中任一项所述的方法，其中所述真核细胞是人细胞。

71.根据权利要求66-70中任一项所述的方法，其中所述真核细胞是植物细胞。

72.一种通过根据权利要求50-71中任一项所述的方法制备的遗传修饰的真核细胞。

73.一种药物组合物，其包含药学上可接受的载体和根据权利要求1-15或权利要求32-35中任一项所述的工程化大范围核酸酶或包含编码所述工程化大范围核酸酶的核酸序列的多核苷酸。

74.根据权利要求73所述的药物组合物，其中所述多核苷酸是mRNA。

75.根据权利要求74所述的药物组合物，其中所述mRNA被包封在脂质纳米颗粒中。

76.根据权利要求73-75中任一项所述的药物组合物，其中所述药物组合物包含重组DNA构建体，所述重组DNA构建体包含所述多核苷酸。

77.根据权利要求73-76中任一项所述的药物组合物，其中所述药物组合物包含重组病毒，所述重组病毒包含所述多核苷酸。

78.根据权利要求77所述的药物组合物，其中所述重组病毒是重组AAV。