CN101784658A

CN101784658A - 增强来自I-CreI的大范围核酸酶的切割活性的方法

Info

Publication number: CN101784658A
Application number: CN200880102206A
Authority: CN
Inventors: 西尔韦斯特·格里佐; 阿格内斯·古布勒; 克里斯托夫·佩雷斯-米绍
Original assignee: Cellectis SA
Current assignee: Cellectis SA
Priority date: 2007-06-06
Filing date: 2008-06-06
Publication date: 2010-07-21
Also published as: EP2171051A2; WO2008152524A3; US20140112904A9; WO2008152524A2; US20100203031A1; JP2010528649A; EP2770052A1; AU2008263502A1; CA2689305A1

Abstract

本发明提供了增强来自I-CreI的大范围核酸酶切割活性的方法，所述方法包括对选自以下的至少一个氨基酸残基进行定点突变：I-CreI的19位甘氨酸、54位苯丙氨酸、87位苯丙氨酸、79位丝氨酸、105位缬氨酸和132位异亮氨酸，本发明还提供了所述方法用于制造切割目的DNA靶标的大范围核酸酶的应用，用于基因组疗法(治疗遗传疾病)和基因组工程(产生转基因动物、转基因植物和重组细胞系)的应用。

Description

增强来自I-CreI的大范围核酸酶的切割活性的方法

本发明涉及用于增强来自I-CreI的大范围核酸酶的切割活性的方法，及其用于制造切割目的DNA靶标的大范围核酸酶的应用，用于基因组疗法(治疗遗传疾病)和基因组改造(制造转基因动物、转基因植物和重组细胞系)的应用。

同源重组是精确改造给定基因座的最佳途径。同源基因靶向策略已用于在染色体中敲除内源基因(Capecchi，M.R.，Science，1989，244，1288-1292；Smithies，O.Nat.Med.，2001，7，1083-1086)或敲入外源序列。其同样能够用于基因修正，通常用于修正与单基因疾病相关的突变。然而由于该过程的效率低(转染细胞的10^-6到10^-9)，事实上这种应用是困难的。最近十年中开发了若干方法来提高这一产率。(De Semir等，J；Gene Med.2003，5，625-639；De Semir D.和Aran J.，Gene Ther.2002，9，683-685；Sangiuolo等，BMC Med.Genet.，2002，3，8-；Goncz等，Gene Ther.，2001，8，961-965)。增强重组效率的一种精妙的策略是使用大范围核酸酶将DNA双链断裂递送进靶基因座中。

在自然界中，大范围核酸酶基本上以归巢内切核酸酶(HomingEndonuclease，HE)为代表。归巢内切核酸酶是一种广泛的天然大范围核酸酶家族，包括数百个蛋白质家族(Chevalier B.S.和B.L.Stoddard，NucleicAcids Res.，2001，29，3757-3774)。这些蛋白质由可动遗传因子编码，所述可动遗传因子通过称作“归巢”的过程增殖：内切核酸酶切割其中不存在该可动遗传因子的同源等位基因，从而刺激同源重组事件，所述事件将该可动DNA复制进受者基因座。先驱工作显示，它们可用于切割活细胞中的独特位点，从而将切割位点附近的基因靶向增强1000倍或者更多(Rouet等，Mol.Cell.Biol.，1994，14，8096-8106；Puchta等，Proc.Natl.Acad.Sci.U.S.A.，1996，93，5055-5060；Puchta等，Nucleic Acids Res.，1993，21，5034-5040；Elliott等，Mol.Cell.Biol.，1998，18，93-101；Cohen-Tannoudji等，Mol.Cell.Biol.，1998，18，1444-1448；Choulika等，Mol.Cell.Biol.，1995，15，1968-1973；Donoho等，Mol.Cell.Biol.，1998，18，4070-4078；Sargent等，Mol.Cell.Biol.，1997，17，267-277)。然而，该技术的使用受到天然大范围核酸酶种类(repertoire)的限制。因此，进行了大量研究来产生具有定制的特异性的大范围核酸酶，并且若干实验室已尝试改变天然大范围核酸酶的特异性(Chevalier等，Mol.Cell.，2002，10，895-905；Epinat等，Nucleic AcidsRes.，2003，31，2952-2962；Arnould等，J.Mol.Biol.，2006，355，443-458；Sussman等，J.Mol.Biol.，2004，342，31-41；Smith等，Nucleic Acids Res.，2006，34，e149；Seligman等，Genetics，1997，147，1653-1664；国际PCT申请WO 03/078619，WO 2004/031346，WO 2006/097784，WO 2006/097853.)。

可以通过进化分子改造(也称作定向进化或体外进化)来修饰酶特性(Arnold，F.H.和J.C.Moore，Adv.Biochem.Eng.Biotechnol.，1997，58，1-14；Rubingh，D.N.，Curr.Opin.Biotechnol.，1997，8，417-422)，并且若干研究描述了对稳定性(Giver等，Proc.Natl.Acad.Sci.U.S.A.，1998，95，12809-12813；Zhao，H和F.H.Arnold，Protein.Eng.，1999，12，47-53.)、活性(Taguchi等，Appl.Environ.Microbiol.，1998，64，492-495)、改变的底物特异性(Yano等，Proc.Natl.Acad.Sci.USA.，1998，95，5511-5515)和与表面正确相互作用的能力(Egmond等，Adv.Exp.Med.Biol.，1996，379，219-228)的成功优化。通常，定向进化依赖于或多或少的随机诱变，所述随机诱变通过PCR(Cadwell R.C.and G.F.Joyce，PCR Methods Applic.，1992，2，28-33.)和DNA改组(Temmer，W.P.，Proc.Natl.Acad.Sci.USA.，1994，91，10747-10751)实现，目的变体通过适宜的筛选方法来鉴定。

推理性设计(rational design)是一种完全不同的策略，其依赖于对结构特性和构效关系的深入了解(Scrutton等，Nature，1990，343，38-43；Craik等，Science，1985，228，291-297)。计算生物学的快速发展以及用于能量计算的强大软件的开发对这类途径给予了新的推动力(Schueler-Furman等，Science，2005，310，638-642)。计算研究可以用于设计新的蛋白质，包括大范围核酸酶(Chevalier等，Mol.Cell.2002，10，895-905；Ashworth等，Nature，2006，441，656-659)。然而，目前的许多蛋白质工程研究以杂合策略为基础，有时称作半推理的(Chica等，Curr.Opin.Biotechnol.，2005，16，378-384)。这些研究依赖于结构信息(Arnould等，J.Mol.Biol.，2006，355，443-458；Santoro，S.W.和P.G.Schultz，Proc.Natl.Acad.Sci.U.S.A.，2002，99，4185-4190；Rui等，J.Biol.Chem.，2004，279，46810-46817)和/或计算机研究(Hayes等，Proc.Natl.Acad.Sci.U.S.A.，2002，99，15926-15931)来显著降低待加工文库的复杂度。

最近，使用两步式策略定制LAGLIDADG大范围核酸酶的特异性，两个步骤均依赖于半推理性步骤(图1)。第一步是局部诱变蛋白质的DNA结合结构域中的特定残基，并通过筛选鉴定特异性改变的变体的集合(Arnould等，J.Mol.Biol.，2006，355，443-458；Smith等，Nucleic Acids Res.，2006，34，e149；国际PCT申请WO 2006/097784，WO 2006/097853，WO2007/049156)。第二步是依赖于这些蛋白质的模块性：其基于组合方法，其中装配来自不同局部改造的变体的突变组合，从而产生具有可预测特异性的全局改造蛋白质(Smith等，Nucleic Acids Res.，2006，34，e149；国际PCT申请WO 2007/049156)。所组合的亚结构域不是完全独立的功能单位，因此必须筛选许多不同的组合，从而找到具有预计活性的功能性蛋白质。因此，该第二步骤也可以被认为是半推理的步骤。

尽管这一策略显示了其产生具有针对选定靶标之新特异性的新大范围核酸酶的能力，但是经改造的大范围核酸酶的切割活性可能很弱，因此可能需要进一步的改造步骤以增强该活性。尽管许多先前的研究显示，以随机诱变为基础的定向进化能够导致蛋白质特性的大幅改善(Arnould等，J.Mol.Biol.，Epub，10May 2007)，但是这样的实验可能是耗时和费力的。因此，“便携式(portable)”特定突变的鉴定对制造新的高效大范围核酸酶而言会是极有帮助的，所述特定突变改进天然或经改造的大范围核酸酶的活性而与其底物特异性无关。

除了效力问题以外，特异性对许多应用而言是另一重要特性，特别是对治疗性应用而言。虽然I-SceI归巢内切核酸酶已表明毒性比ZEP的小(Alwin等，Mol.Ther.，2005，12，610-617；Porteus M.H.和BaltimoreD.，Science，2003，300，763；Porteus M.H.和Carroll D.，Nat.Biotechnol，2005，23，967-973)，这可能是由于其特异性较高，但是在非常高的剂量下其仍可能有害(Gouble等，J.Gene Med.，2006，8，616-622)。

迄今为止，大多数改造的内切核酸酶(ZFN和HE)是异二聚体，包括两种分别改造的单体，每种单体结合所述靶标的一半。通过两个单体在相同细胞中共表达而形成异二聚体(Porteus H.M.，Mol.Ther.，2006，13，438-446；Smith等，Nucleic acids Res.，2006，34，e149；国际PCT申请WO 2007/097854和WO 2007/049156)。然而，由于识别不同的靶标实际上与两种同二聚体的形成相关(Arnould等，J.Mol.Biol.，2006，355，443-458；Bibikova等，Genetics，2002，161，1169-1175)，所以单个同二聚体有时可导致非常高水平的毒性(Bibikova等，Genetics，2002，161，1169-1175)。因此，仍然限制单LAGLIDADG归巢内切核酸酶(例如I-CreI)广泛应用的因素的是下面这一事实：除了经改造的异二聚体以外，蛋白质还能形成同二聚体(Arnould等，J.Mol.Biol.，2006，355，443-458；国际PCT申请WO 2006/097853，WO 2006/097854，WO2006/097784；Smith等，Nucleic Acids Res.，2006，34，e149)，导致可能的位点外(off_site)切割。

该问题可仅通过抑制功能性同二聚体形成来解决，所述抑制在理论上可通过将两种单体融合在单链分子中来实现(Chevalier等，Mol.Cell.，2002，10，895-905；Epinat等，Nucleic Acids Res.，2005，33，5978-5990)。然而，这类设计是相对危险的，并且能够导致错误折叠的蛋白质(Epinat等，Nucleic Acids Res.，2005，33，5978-5990)。破坏个体同二聚体的功能性会是另一种解决方法。

本发明公开了能够增强来自I-CreI同二聚体大范围核酸酶的经改造大范围核酸酶活性的特定突变。另外，这些突变之一(G19S替换)破坏功能性同二聚体的形成。来自于I-CreI的经改造蛋白质通常是异二聚体，其含有分别改造的两种不同的单体。这样的异二聚体通过在靶细胞中共表达两种不同的单体来获得。因为这些单体也可以同二聚化，所以细胞中实际存在三种分子种类，唯一有用的是异二聚体，而另外两种能够导致额外的位点外切割。因此，G19S突变不仅改进蛋白质活性，而且也改进特异性。

因此，本发明涉及用于增强来自I-CreI的大范围核酸酶(原始大范围核酸酶)切割活性的方法，所述方法包括对选自以下的至少一个氨基酸残基进行位点特异性突变：I-CreI的19位甘氨酸(G19)、54位苯丙氨酸(F54)、87位苯丙氨酸(F87)、79位丝氨酸(S79)、105位缬氨酸(V105)和132位异亮氨酸(I132)。

定义

-氨基酸指天然或合成氨基酸，包括前述氨基酸的对映体和立体异构体。

多肽序列中的氨基酸残基在本文中根据单字母代码命名，其中，例如Q表示Gln或谷氨酰胺残基，R表示Arg或精氨酸残基，D表示Asp或天冬氨酸残基。

-酸性氨基酸指天冬氨酸(D)和谷氨酸(E)。

-碱性氨基酸指赖氨酸(K)、精氨酸(R)和组氨酸(H)。

-小氨基酸指甘氨酸(G)和丙氨酸(A)。

-芳香族氨基酸指苯丙氨酸(F)、色氨酸(W)和酪氨酸(Y)。

-核苷酸按如下命名：使用单字母代码命名核苷的碱基：a为腺嘌呤，t为胸腺嘧啶，c为胞嘧啶，g为鸟嘌呤。对于简并核苷酸而言，r表示g或a(嘌呤核苷酸)，k表示g或t，s表示g或c，w表示a或t，m表示a或c，y表示t或c(嘧啶核苷酸)，d表示g、a或t，v表示g、a或c，b表示g、t或c，h表示a、t或c，n表示g、a、t或c。

-“大范围核酸酶”意指具有12-45bp的双链DNA靶序列的内切核酸酶。所述大范围核酸酶是二聚体酶(其中每个结构域位于一个单体上)，或是在单一多肽上包含两个结构域的单体酶。

-“I-CreI”意指具有序列SWISSPROT P05725(对应于序列表中的SEQ ID NO：1)或pdb登录号1g9y(对应于序列表中的SEQ ID NO：48)的野生型I-CreI。

-“大范围核酸酶变体”或“变体”是指通过将野生型大范围核酸酶(天然大范围核酸酶)氨基酸序列中的至少一个残基替换为不同的氨基酸而获得的大范围核酸酶。

-“功能性变体”是指能够切割DNA靶序列的变体，优选地所述靶标是不被母体大范围核酸酶切割的新靶标。例如，这些变体在接触DNA靶序列的位置或与所述DNA靶标直接或间接相互作用的位置上具有氨基酸改变。

-“具有新特异性的大范围核酸酶变体”是指具有与母体大范围核酸酶不同的切割靶标模式的变体。等价且无差异地使用的术语“新特异性”、“经修饰的特异性”、“新切割特异性”、“新底物特异性”是指变体针对DNA靶序列中核苷酸的特异性。

-“大范围核酸酶结构域”是指这样的区域，其与大范围核酸酶DNA靶标的一半相互作用，并能够与相同大范围核酸酶的另一结构域结合，形成能够切割DNA靶标的功能性大范围核酸酶，所述另一结构域与所述DNA靶标的另一半相互作用。

-“结构域”或“核心结构域”是指“LAGLIDADG归巢内切核酸酶核心结构域”，它是LAGLIDADG家族归巢内切核酸酶的特征性α₁β₁β₂α₂β₃β₄α₃折叠，对应于约一百个氨基酸残基的序列。所述结构域包含在折叠成反向平行β-片层的四条β链(β₁、β₂、β₃、β₄)，所述β-片层与DNA靶标的一半相互作用。该结构域能够与另一LAGLIDADG归巢内切核酸酶结构域结合，形成能够切割DNA靶标的功能性内切核酸酶，所述另一结构域与所述DNA靶标的另一半相互作用。例如，在二聚体归巢内切核酸酶I-CreI(163个氨基酸)的情况下，LAGLIDADG归巢内切核酸酶核心结构域对应于残基6到94。

-“单链大范围核酸酶”是指包含通过肽间隔区连接的两个LAGLIDADG归巢内切核酸酶结构域或核心结构域的大范围核酸酶。单链大范围核酸酶能够切割嵌合DNA靶序列，所述靶序列包含各自母体大范围核酸酶靶序列中的不同一半。单链大范围核酸酶还称作单链衍生物、单链大范围核酸酶、单链大范围核酸酶衍生物或嵌合大范围核酸酶。

-“来自I-CreI的大范围核酸酶”是指I-CreI的功能性变体以及来自所述变体的单链大范围核酸酶。

-“亚结构域”是指LAGLIDADG归巢内切核酸酶核心结构域中的区域，其与归巢内切核酸酶DNA靶标半位点的不同部分相互作用。两个不同的亚结构域独立作用，并且一个亚结构域中的突变不改变另一亚结构域的结合和切割特性。因此，两个亚结构域结合归巢内切核酸酶DNA靶标半位点的不同部分。

-“β-发夹”是指LAGLIDADG归巢内切核酸酶核心结构域反向平行β-片层的两条连续β-链(β₁β₂或β₃β₄)，其通过环或转角相连。

“I-CreI位点”是指被I-CreI切割的22到24bp双链DNA序列。I-CreI位点包括野生型(天然)非回文I-CreI归巢位点和衍生的回文序列，如序列5’-t_-12c_-11a_-10a_-9a_-8a_-7c_-6g_-5t_-4c_-3g_-2t_-1a₊₁c₊₂g₊₃a₊₄c₊₅g₊₆t₊₇t₊₈t₊₉t₊₁₀g₊₁₁a₊₁₂也称为C1221(SEQ ID NO：2；图2)。

-“DNA靶标”、“DNA靶序列”、“靶序列”、“靶位点”、“靶标”、“位点”；“目的位点”；“识别位点”、“识别序列”、“归巢识别位点”、“归巢位点”、“切割位点”是指被LAGLIDADG归巢内切核酸酶(例如I-CreI)或来自I-CreI的变体或单链嵌合大范围核酸酶识别并切割的20到24bp双链回文、局部回文(假回文)或非回文的多核苷酸序列。这些术语是指大范围核酸酶要在其中诱导双链断裂(切割)的独特DNA位置，优选地为基因组位置。DNA靶标通过双链多核苷酸一条链的5′到3′序列来定义，如上文针对C1221所指出的。DNA靶标的切割分别发生在有义和反义链+2和-2位的核苷酸处。除非另有说明，否则I-Cre I大范围核酸酶变体对DNA靶标进行切割的位置对应于DNA靶标有义链上的切割位点。

-“DNA靶标半位点”、“半切割位点”或“半位点”是指DNA靶标中与各个LAGLIDADG归巢内切核酸酶核心结构域结合的部分。

-“嵌合DNA靶标”或“杂合DNA靶标”是指两条母体大范围核酸酶靶序列的不同一半的融合物。另外，所述靶标的至少一半可包含与至少两个独立的亚结构域结合的核苷酸组合(组合DNA靶标)。

-“载体”是指能够转运与之连接的另一核酸的核酸分子。

-“同源”是指一条序列与另一序列具有足够导致序列间同源重组的同一性，更具体地具有至少95％的同一性，优选97％的同一性，更优选99％的同一性。

-“同一性”是指两条核酸分子或多肽之间的序列同一性。可通过比较各序列中可为比较目的而排列的位置来测定同一性。当所比较序列中的一个位置被相同的碱基占据时，则这些分子在该位置上是相同的。核酸或氨基酸序列之间的相似性或同一性程度是核酸序列间共有的位置上相同或匹配的核苷酸数量的函数。可使用多种比对算法和/或程序计算两条序列之间的同一性，包括FASTA或BLAST，它们可作为GCG序列分析包(University of Wisconsin，Madison，Wis.)的一部分获得，并可以例如基于默认设定使用。

-“个体”包括哺乳动物，以及其他脊椎动物(例如鸟类、鱼和爬行动物)。本文使用的术语“哺乳动物”是指任何这样的脊椎动物，包括单孔类、有袋类和胎盘动物，它们对其幼仔哺乳，并且分娩活的幼仔(真哺乳亚纲(eutharian)或胎盘哺乳动物)或者产卵(后兽亚纲(metatharian)或非胎盘(nonplacental)哺乳动物)。哺乳动物物种的实例包括人和其他灵长类(例如猴、猩猩)、啮齿动物(例如大鼠、小鼠、豚鼠)和其他，例如：牛、猪和马。

-突变是指在多核苷酸(cDNA、基因)或多肽序列中替换、缺失、插入一个或多个核苷酸/氨基酸。所述突变可影响基因的编码序列或其调节序列。其还可影响基因组序列的结构或所编码mRNA的结构/稳定性。

-“位点特异性突变”是指核苷酸序列中特定核苷酸/密码子的突变，与随机突变相反。

本发明的方法根据本领域公知并且可商业获得的标准定点诱变方法进行。可以如下有利地进行：根据公知的重叠PCR技术扩增包含上文所述突变位置的重叠片段。

可以通过任何公知的体外或体内切割测定法来测量可以通过本发明方法获得的经改进大范围核酸酶的切割活性，例如国际PCT申请WO2004/067736；Epinat等，Nucleic Acids Res.，2003，31，2952-2962；Chames等，Nucleic Acids Res.，2005，33，e178；Arnould等，J.Mol.Biol.，2006，355，443-458；Arnould等，J.Mol.Biol.，Epub 10 May 2007中所述的测定法。

例如，可通过直接重复重组测定法，通过与原始大范围核酸酶的切割活性比较，使用报告载体在酵母或哺乳动物细胞中测量本发明变体的切割活性。报告载体在间插序列内包含报告基因的两个截短的非功能性拷贝(直接重复)和被原始大范围核酸酶切割的基因组DNA靶序列，所述间插序列克隆到酵母或哺乳动物表达载体中。大范围核酸酶的表达导致基因组DNA靶序列的切割。该切割诱导直接重复之间的同源重组，产生功能性报告基因(例如LacZ)，其表达可以通过合适的测定法监测。用与原始大范围核酸酶相比经改进的大范围核酸酶观察到更强的信号。

或者可以在哺乳动物细胞中使用染色体测定法，将经改进的大范围核酸酶对其基因组DNA靶标的活性与相同基因组基因座上I-CreI对I-CreI位点的活性进行比较(Arnould等，J.Mol.Biol.，Epub 10May 2007)。

在本发明方法的一个优选的实施方案中：

-19位的甘氨酸被替换为丝氨酸(G19S)或丙氨酸(G19A)，

-54位的苯丙氨酸被替换为亮氨酸(F54L)，

-87位的苯丙氨酸被替换为亮氨酸(F87L)，

-79位的丝氨酸被替换为甘氨酸(S79G)，

-105位的缬氨酸被替换为丙氨酸(V105A)，且

-132位的异亮氨酸被替换为缬氨酸(I132V)。

在本发明方法的另一个实施方案中，两个I-CreI单体均被突变；每个单体中的突变可以是相同或不同的。

例如，在一个单体中引入G19S或F87L突变，在另一单体中引入V105A或I132V突变。

在另一个优选的实施方案中，突变同一单体中的至少两个残基；双突变体具有与每一单突变体相比更高的切割活性。例如，一个单体同时具有V105A和I132V两个突变。

在所述方法的另一个优选的实施方案中，所述突变还破坏功能性同二聚体的形成。更优选地，所述突变是G19S突变。将G19S突变有利地引入异二聚体I-CreI变体的两个单体之一中，从而获得具有增强的切割活性和增强的切割特异性的大范围核酸酶。

另外，为了进一步增强切割活性，另一单体可以带有不同的突变，所述突变削弱功能性同二聚体的形成或者有助于异二聚体的形成。

原始大范围核酸酶可来自于野生型I-CreI(SEQ ID NO：1或48)或与SEQ ID NO：48具有至少85％同一性、优选至少90％同一性、更优选至少95％同一性的I-CreI骨架蛋白质，例如由SEQ ID NO：3(167个氨基酸)组成的骨架，所述骨架具有I-CreI 2位上的丙氨酸插入、D75N替换和C端AAD插入(164到166位)。

原始大范围核酸酶可在下述位置上包含一个或多个突变，所述位置与DNA靶序列接触，或与DNA主链或核苷酸碱基直接相互作用或通过水分子相互作用；这些残基是本领域公知的(Jurica等，Molecular Cell.，1998，2，469-476；Chevalier等，J.Mol.Biol.，2003，329，253-269)。优选所述突变修饰大范围核酸酶的切割特异性，并且产生具有新特异性的大范围核酸酶，其能够从目的基因上切割DNA靶标。更优选地，所述突变是对应于位于I-CreI氨基酸序列的26-40位的第一功能性亚结构域中的一个或多个氨基酸的替换，其改变对DNA靶标中±8-10位核苷酸的特异性，和/或所述突变是对应于位于I-CreI氨基酸序列的44-77位的第二功能性亚结构域中的替换，其改变对DNA靶标中±3至5位核苷酸的特异性，如前文所述(国际PCT申请WO 2006/097784、WO 2006/097853和WO2007/049156；Arnould等，J.Mol.Biol.，2006，355，443-458；Smith等，Nucleic Acids Res.，2006，34，e149)。所述替换有利地对应于I-CreI氨基酸序列的26、28、30、32、33、38和/或40、44、68、70、75和/或77位。所述替换可以是用选自A、D、E、G、H、K、N、P、Q、R、S、T、Y、C、V、L和W的氨基酸替换原始氨基酸。为了切割其中n_-4是t或者n₊₄是a的DNA靶标，所述变体在44位有利地是谷胺酰胺(Q)；为了切割其中n_-4是a或者n₊₄是t的DNA靶标，所述变体在44位有利地是丙氨酸(A)或天冬酰胺；为了切割其中n_-9是g或者n₊₉是c的DNA靶标，所述变体在38位有利地是精氨酸(R)或赖氨酸(K)。

原始大范围核酸酶可以是能够切割回文或假回文DNA靶序列的同二聚体。

或者，所述原始大范围核酸酶是由两个单体组成的异二聚体，每个单体在I-CreI的26到40位和/或44到77位包含不同的突变，并且所述大范围核酸酶能够切割目的非回文基因组DNA靶序列。

异二聚体大范围核酸酶有利地是专性异二聚体变体，其具有至少一对突变，其对应于第一和第二单体中使两个I-CreI单体之间发生分子间相互作用的对应残基，其中所述突变对的第一突变处于第一单体中，所述对的第二突变处于第二单体中，所述突变对防止每个单体形成功能性同二聚体，并且允许形成能够切割目的基因组DNA靶标的功能性异二聚体。

为了形成专性异二聚体，单体有利地具有至少一个以下突变对，分别针对第一和第二单体：

a)用碱性氨基酸(优选精氨酸)替换8位的谷氨酸(第一单体)，和用酸性氨基酸(优选谷氨酸)替换7位的赖氨酸(第二单体)；第一单体还可包含用精氨酸替换7和96位的至少一个赖氨酸残基。

b)用碱性氨基酸(优选精氨酸)替换61位的谷氨酸(第一单体)，和用酸性氨基酸(优选谷氨酸)替换96位的赖氨酸(第二单体)；第一单体还可包含用精氨酸替换7和96位的至少一个赖氨酸残基。

c)用芳香氨基酸(优选苯丙氨酸)替换97位的亮氨酸(第一单体)，和用小氨基酸(优选甘氨酸)替换54位的苯丙氨酸(第二单体)；第一单体还可包含用色氨酸替换54位的苯丙氨酸，第二单体还可包含用甲硫氨酸替换58位的亮氨酸或57位的赖氨酸，和

d)用碱性氨基酸(优选精氨酸)替换137位的天冬氨酸(第一单体)，和用酸性氨基酸(优选谷氨酸)替换51位的精氨酸(第二单体)。

例如，第一单体可具有突变D137R，第二单体可具有突变R51D。或者，第一单体可具有突变K7R、E8R、E61R、K96R和L97F，或者K7R、E8R、F54W、E61R、K96R和L97F，第二单体可具有突变K7E、F54G、L58M和K96E，或者K7E、F54G、K57M和K96E。

优选地，一个单体包含用酸性氨基酸(优选天冬氨酸)替换7位的赖氨酸残基(K7E)，另一单体包含用碱性氨基酸(优选赖氨酸)替换8位谷氨酸残基(E8K)。

更优选地，一个单体包含G19S突变和K7E突变而另一单体包含E8K突变，或一个单体包含G19S突变和E8K突变而另一单体包含K7E突变。

也可以在接触磷酸主链的位置上(例如最终C端环上)引入其他替换(137到143位；Prieto等，Nucleic Acids Res.，Epub 22 April 2007)。优选地，所述残基涉及所述DNA切割位点的结合和切割。更优选地，所述残基处于I-CreI的138、139、142或143位上。可以在一个变体中突变两个残基，条件是各个突变在选自以下的不同残基对中：138和139位残基对以及142和143位残基对。所引入的突变改变最终C端环中所述氨基酸与I-CreI位点中磷酸主链的相互作用。优选地，用疏水氨基酸替换138或139位上的残基，以避免与DNA切割位点的磷酸主链形成氢键。例如，用丙氨酸替换138位的残基，或用甲硫氨酸替换139位的残基。有利地用小氨基酸(例如甘氨酸)替换142或143位的残基，以减小这些氨基酸残基侧链的大小。更优选地，最终C端环中的所述替换改变了变体针对I-CreI位点中±1到2、±6到7和/或±11到12位的特异性。

另外，可以突变单体整条序列上的其他残基。突变的例子包括以下突变，以I-CreI氨基酸序列为参考：I24V，R70S，将75位上天冬氨酸突变成不带电的氨基酸，优选天冬酰胺(D75N)或缬氨酸(D75V)，以及单体序列C端一半(I-CreI的80到163位)中的替换。

另外，可以在单体的NH₂端和/或COOH端插入一个或多个残基。例如，在NH₂端引入甲硫氨酸残基，在NH₂端和/或COOH端引入标签(表位HA-标签(YPYDVPDYA；SEQ ID NO：49)或S-标签(KETAAAKFERQHMDS；SEQ ID NO：50)或多聚组氨酸序列)；所述标签可用于检测和/或纯化大范围核酸酶。在NH₂端引入标签时，标签序列可以替换变体最前面的氨基酸(变体的至少第一个甲硫氨酸，和最终的第二个氨基酸；标签从甲硫氨酸开始)或者插入变体的第一个(甲硫氨酸)与第二个氨基酸之间或者第一个与第三个氨基酸之间(不含甲硫氨酸的标签)。

变体也可以包含核定位信号(NLS)；所述NLS可用于将所述变体输入细胞核中。NLS的一个例子是KKKRK(SEQ ID NO：51)。NLS可以被恰好插入变体的第一甲硫氨酸后，或恰好插入N-端标签后。

本发明还涉及可通过上述方法获得的来自I-CreI的大范围核酸酶(经改进的大范围核酸酶)，所述大范围核酸酶至少包含选自G19S、G19A、F54L、F87L、S79G、V105A和I132V的突变，排除选自以下的I-CreI变体：

-I-CreI G19A、K28A、Y33S、Q38R、S40K、R70S、D75N

-I-CreI G19A、K28A、Q38R、S40K、R70S、D75N、F87L

-I-CreI G19A、K28A、Y33S、Q38R、S40K、D69G、R70S、D75N

-I-CreI Y33R、S40Q、Q44A、R70H、D75N、F87L、I132T、V151A

-I-CreI Y33R、S40Q、Q44A、R70H、D75N、F87L、F94L、V125A、E157G、K160R

-I-CreI Y33H、F54L、N86D、K100R、L104M、V105A、N136S、K159R

-I-CreI S32T、Y33H、Q44K、R68Y、R70S、I77R、Q92R、K96R、K107R、I132V、T140A、T143A

-I-CreI S32A、Y33H、Q44A、R68Y、R70S、D75Y、I77K、I132V

-I-CreI N2I、S32G、Y33H、Q44A、R68Y、R70S、D75Y、I77K、K96R、V105A

-I-CreI S32A、Y33H、F43L、Q44A、R68Y、R70S、D75Y、I77K、V105A、K159R

-I-CreI G19S、N30Q、Y33G、Q38C、R68N、R70S、S72F、I77R

-I-CreI Y33G、Q38C、R68N、R70S、I77R、F87L

-I-CreI N30Q、Y33G、Q38C、F54L、R68N、R70S、I77R

-I-CreI N30Q、Q31L、Y33G、Q38C、R68N、R70S、I77R、P83Q、F87L和

-I-CreI N30Q、Y33G、Q38C、R68N、R70S、I77R、V105A。

本发明包括来自I-CreI的大范围核酸酶，其与上文定义的序列具有至少85％的同一性，优选至少90％的同一性，更优选至少95％(96％、97％、98％、99％)的同一性，所述大范围核酸酶与原始大范围核酸酶(如上文定义的I-CreI或I-CreI变体)相比具有改进的切割活性。

本发明还涉及产生来自I-CreI的异二聚体大范围核酸酶的方法，所述大范围核酸酶基本不含由所述异二聚体大范围核酸酶中每种单体结合所产生的两种同二聚体的至少一种，所述方法包括在细胞中共表达来自I-CreI的异二聚体大范围核酸酶的两种单体，其中两种单体之一包含G19S突变。

根据所述方法的一个有利的实施方案，其他单体带有破坏功能性同二聚体形成或有助于异二聚体形成的其他突变，从而产生基本不含同二聚体的异二聚体大范围核酸酶。通过所述方法产生的来自I-CreI的异二聚体大范围核酸酶更具特异性，因为两个单体结合所产生的两种同二聚体中至少一种是没有功能的。另外，由于上文所述的G19突变的存在，所述大范围核酸酶具有增强的切割活性。

本发明还涉及可通过上文所述方法获得的来自I-CreI的异二聚体大范围核酸酶，所述核酸酶基本不含由所述异二聚体大范围核酸酶中每种单体结合所产生的两种同二聚体中的至少一种。

本发明的主题还包括来自如上所述的大范围核酸酶的单链嵌合大范围核酸酶(融合蛋白)。所述单链大范围核酸酶可包含两个I-CreI单体、两个I-CreI核心结构域(I-CreI的6到94位)或二者的组合。优选地，两个单体/核心结构域或二者的组合通过肽连接子连接。肽连接子的例子是SEQID NO：52和68。

本发明的大范围核酸酶包括如上文定义的改进的大范围核酸酶、异二聚体大范围核酸酶和单链嵌合衍生物。本发明的大范围核酸酶可包含上文定义的至少一个NLS和/或一个标签；所述NLS和/或标签可以在第一和/或第二单体中。

本发明的主题还包括编码如上所述的大范围核酸酶的多核苷酸片段；所述多核苷酸可编码同二聚体或异二聚体变体中的一个单体，或编码单链衍生物的两个结构域/单体。

本发明的主题还包括用于表达本发明大范围核酸酶的重组载体。所述重组载体包含至少一个上文所述编码变体或单链大范围核酸酶的多核苷酸片段。

在一个优选的实施方案中，所述载体包含两个不同的多核苷酸片段，每个片段各编码异二聚体变体的单体之一。

可在本发明中使用的载体包括但不限于病毒载体、质粒、RNA载体，或者可由染色体、非染色体、半合成或合成的核酸所组成的线性或环形DNA或RNA分子。优选的载体是能够自主复制与之连接的核酸的载体(附加型载体)和/或表达与之连接的核酸的载体(表达载体)。大量的合适载体是本领域技术人员已知的，并可以商品获得。

病毒载体包括逆转录病毒、腺病毒、细小病毒(parvovirus)(例如腺相关病毒)、冠状病毒、负链RNA病毒如正粘病毒(orthomyxovirus)(例如流感病毒)、杆状病毒(例如狂犬病毒和疱疹性口腔炎病毒(vesicularstomatitis virus))、副粘病毒(paramyxovirus)(例如麻疹病毒和仙台病毒(Sendai))、正链RNA病毒如小RNA病毒(picornavirus)和α病毒，以及双链DNA病毒，其包括腺病毒、疱疹病毒(例如1和2型单纯疱疹病毒、EB病毒、巨细胞病毒)和痘病毒(例如牛痘病毒、禽痘病毒和金丝雀痘病毒)。其他病毒包括例如诺瓦克病毒、披膜病毒(togavirus)、黄病毒(flavivirus)、呼肠孤病毒(reoviruses)、乳多空病毒(papovavirus)、嗜肝DNA病毒(hepadnavirus)和肝炎病毒。逆转录病毒的实例包括：禽白血病-肉瘤、哺乳动物C型、B型病毒、D型病毒、HTLV-BLV组、慢病毒、泡沫病毒(spumavirus)(Coffin，J.M.，Retroviridae：The viruses and their replication，In Fundamental Virology，第三版，B.N.Fields，等编辑，Lippincott-RavenPublishers，Philadelphia，1996)。

优选的载体包括慢病毒载体，尤其是自失活(self inactivacting)的慢病毒载体。

载体可包含选择标记，例如：用于真核细胞培养的新霉素磷酸转移酶、组氨醇脱氢酶、二氢叶酸还原酶、潮霉素磷酸转移酶、单纯疱疹病毒胸苷激酶、腺苷脱氨酶、谷氨酰胺合成酶和次黄嘌呤-鸟嘌呤磷酸核糖基转移酶；用于酿酒酵母(S.cerevisiae)的TRP1；大肠杆菌(E.coli)中的四环素、利福平或氨苄青霉素抗性。

优选地，所述载体是表达载体，其中编码本发明变体/单链衍生物的序列置于适当的转录和翻译控制元件的控制下，以允许产生或合成所述大范围核酸酶。因此，所述多核苷酸包含在表达盒中。更具体地，载体包含复制起点、与所述编码多核苷酸有效连接的启动子、核糖体结合位点、RNA剪接位点(使用基因组DNA时)、多腺苷酸化位点和转录终止位点。其还可包含增强子。启动子的选择将取决于多肽在其中表达的细胞。优选地，所述变体是异二聚体，编码各个单体的两多核苷酸包含在一个载体中，所述载体能够驱动两多核苷酸同时表达。合适的启动子包括组织特异性和/或诱导型启动子。诱导型启动子的例子是：由提高的重金属水平诱导的真核金属硫蛋白(metallothionine)启动子，应答于异丙基-β-D-硫代吡喃半乳糖苷(IPTG)诱导的原核lacZ启动子，和由提高的温度诱导的真核热休克启动子。组织特异性启动子的实例是骨骼肌肌酸激酶、前列腺特异性抗原(PSA)、α-抗胰蛋白酶、人表面活性剂(SP)A和B蛋白、β-酪蛋白和酸性乳清蛋白基因。

根据所述载体的另一有利的实施方案，其包含靶向构建体，所述靶向DNA构建体包含与如上述基因组DNA靶切割位点周围的区域具有同源性的序列。

或者，编码大范围核酸酶的载体和包含靶向DNA构建体的载体是不同的载体。

更优选地，靶向DNA构建体包含：

a)与如上述基因组DNA切割位点周围的区域具有同源性的序列，和

b)侧翼是a)中序列的待引入序列。

优选使用至少50bp、优选多于100bp、更优选多于200bp的同源序列。事实上，共有的DNA同源性位于断裂位点上游和下游的侧翼区域中，且待引入的DNA序列应位于两臂之间。对基因组治疗的目的而言，待引入的序列优选是修复目的基因中突变的序列(基因矫正或功能基因的恢复)。或者，其可以是用于以某种特定方式改变染色体DNA的任何其他序列，包括用于修饰特异序列、用于减弱或激活目的内源基因、用于失活或缺失目的内源基因或其部分、用于向目的位点中引入突变或用于引入外源基因或其部分的序列。

本发明还涉及通过上文所述的多核苷酸或载体(优选表达载体)修饰的原核或真核宿主细胞。

本发明还涉及非人转基因动物或转基因植物，其特征是其所有或部分细胞通过上文所述的多核苷酸或载体进行了修饰。

本文使用的“细胞”是指原核细胞如细菌细胞，或真核细胞如动物、植物或酵母细胞。

本发明的主题还包括上文所述可通过上文所述方法获得的具有19位突变的经改进的大范围核酸酶、一种或两种衍生的多核苷酸(优选包含在表达载体中)、细胞、转基因植物、非人转基因哺乳动物在与人β-2-微球蛋白和人XPC基因不同的基因座中用于分子生物学、体内或体外基因工程、以及体内或体外基因组工程中的非治疗目的的用途。

本发明的主题还包括上文所述可通过上文所述方法获得的具有54或105位突变的经改进的大范围核酸酶、一种或两种衍生的多核苷酸(优选包含在表达载体中)、细胞、转基因植物、非人转基因哺乳动物在与中国仓鼠次黄嘌呤磷酸核糖基转移酶和人β-2-微球蛋白基因不同的基因座中用于分子生物学、体内或体外基因工程、以及体内或体外基因组工程中的非治疗目的的用途。

本发明的主题还包括上文所述可通过上文所述方法获得的具有87位突变的经改进的大范围核酸酶、一种或两种衍生的多核苷酸(优选包含在表达载体中)、细胞、转基因植物、非人转基因哺乳动物在与人β-2-微球蛋白基因、人RAG2基因和人XPC基因不同的基因座中用于分子生物学、体内或体外基因工程、以及体内或体外基因组工程中的非治疗目的的用途。

本发明的主题还包括上文所述可通过上文所述方法获得的具有132位突变的经改进的大范围核酸酶、一种或两种衍生的多核苷酸(优选包含在表达载体中)、细胞、转基因植物、非人转基因哺乳动物在与中国仓鼠次黄嘌呤磷酸核糖基转移酶基因、人RAG2基因和人β-2-微球蛋白基因不同的基因座中用于分子生物学、体内或体外基因工程、以及体内或体外基因组工程中的非治疗目的的用途。

本发明的主题还包括上文所述可通过上文所述方法获得的具有79位突变的经改进的大范围核酸酶、一种或两种衍生的多核苷酸(优选包含在表达载体中)、细胞、转基因植物、非人转基因哺乳动物用于分子生物学、体内或体外基因工程、以及体内或体外基因组工程中的非治疗目的的用途。

本发明的主题还包括上文所述可通过上文所述方法获得的具有G19S突变的异二聚体大范围核酸酶、一种或两种衍生的多核苷酸(优选包含在表达载体中)、细胞、转基因植物、非人转基因哺乳动物用于分子生物学、体内或体外基因工程、以及体内或体外基因组工程中的非治疗目的的用途。

非治疗目的包括例如(i)用于蛋白质生产的包装细胞系中特异性基因座的基因打靶；(ii)用于植株改善和代谢工程的谷类植物中特异性基因座的基因打靶；(iii)用于除去基因修饰谷类植物中标志物的靶向重组，(iv)用于除去基因修饰微生物菌株中标志物的靶向重组(例如用于抗生素生产)。

根据所述用途的一个有利的实施方案，其用于诱导含有DNA靶序列之目的位点中的双链断裂，从而诱导DNA重组事件、DNA丢失或细胞死亡。

根据本发明，所述双链断裂是用于：修复特定序列、修饰特定序列、恢复功能性基因而替换突变基因，弱化或活化内源目的基因、将突变引入到目的位点中、引入外源基因或其部分、失活或消灭内源基因或其部分、使染色体臂易位或者使DNA不被修复并降解。

本发明的主题还涉及基因工程方法，其特征在于包括以下步骤：使包含上文所定义之DNA靶标的载体上目的位点中的双链核酸断裂，所述断裂通过使所述载体与上文所定义的大范围核酸酶相接触而实现，从而诱导与另一载体进行同源重组，所述另一载体与所述大范围核酸酶的切割位点周围的序列有同源性。

本发明的主题还涉及基因组工程方法，其特征在于包括以下步骤：1)使基因座处发生双链断裂，所述断裂通过使杂交DNA靶标与所述大范围核酸酶相接触而实现，其中所述基因座含有上文所定义的大范围核酸酶的至少一种DNA靶标；2)将所述断裂的基因组基因座维持在适于与靶向DNA构建体进行同源重组的条件下，所述构建体包含待引入到所述基因座中的序列，其两侧是与所靶向基因座有同源性的序列。

本发明的主题还涉及基因组工程方法，其特征在于包括以下步骤：1)使基因座处发生双链断裂，所述断裂通过使切割位点与上文所定义的所述大范围核酸酶相接触而实现，其中所述基因座含有上文所定义的大范围核酸酶的至少一种DNA靶标；2)将所述断裂的基因组基因座维持在适于与和所述切割位点周围区域有同源性的染色体DNA进行同源重组的条件下。

本发明的主题还包括上文所定义的至少一种大范围核酸酶、或一种或两种衍生的多核苷酸(优选包含在表达载体中)在制备用于在有此需求的个体中预防、改善或治疗遗传性疾病的药物中的用途，所述药物可以任意方式施用给所述个体。

本发明的主题还包括在有此需求的个体中预防、改善或治疗遗传性疾病的方法，所述方法包括以下步骤：以任意方式将包含上文所定义的至少一种大范围核酸酶的组合物施用给所述个体。

在该情况下，如上文所定义的大范围核酸酶的使用至少包括以下步骤：(a)在个体的体细胞组织中，在包含所述大范围核酸酶的至少一个识别和切割位点的基因之目的位点处诱导双链切割，和(b)向该个体中引入靶向DNA，其中所述靶向DNA包含(1)与切割位点周围区域有同源性的DNA，和(2)在该靶向DNA与染色体DNA之间发生重组时修复目的位点的DNA。在适于将靶向DNA引入目的位点的条件下将靶向DNA引入所述个体。

根据本发明，所述双链切割通过对个体施用所述大范围核酸酶而整体(in toto)诱导，或者通过将所述大范围核酸酶引入到取自个体的体细胞内并在修饰后放回所述个体内而进行离体诱导。

在所述用途的一个优选实施方案中，将所述大范围核酸酶与靶向DNA构建体组合，所述靶向DNA构建体包含修复基因中突变的序列，其两侧是与所述大范围核酸酶的基因组DNA切割位点周围的基因区域有同源性的序列，如上文所述。所述修复突变的序列是具有正确序列的基因片段或者是外显子敲入构建体。

就矫正基因而言，基因的切割发生在突变附近，优选在突变的500bp范围内。靶向构建体包含基因片段，其含有基因组DNA切割位点两侧至少200bp的同源序列(最小修复基质)用于修复切割，并含有用于修复突变的正确基因序列。因此，用于基因矫正的靶向构建体包含最小修复基质或由其组成；其优选为200pb到6000pb，更优选为1000pb到2000pb。

为了恢复功能基因，基因的切割发生在突变的上游。优选所述突变是该基因序列中第一个已知的突变，从而该基因中所有下游突变都可同时被矫正。所述靶向构建体包含基因组DNA切割位点下游的外显子，它们在框内融合(如同在cDNA中一样)，并在3′端具有多聚腺苷酸化位点以终止转录。待引入序列(外显子敲入构建体)的两侧是切割位点周围的内含子或外显子序列，从而允许所改造基因(外显子敲入基因)转录成为能编码功能性蛋白质的mRNA。例如，外显子敲入构建体的两侧是上游和下游的序列。

本发明的主题还包括上文所定义的至少一种大范围核酸酶、或一种或两种衍生的多核苷酸(优选包含在表达载体中)在制备用于在有此需求的个体中预防、改善或治疗由具有DNA中间体的传染原引起的疾病的药物中的用途，所述药物通过任意方式施用给所述个体。

本发明的主题还包括在有此需求的个体中预防、改善或治疗由具有DNA中间体的传染原引起的疾病的方法，所述方法至少包括以下步骤：通过任意方式将上文所定义的组合物施用给所述个体。

本发明的主题还包括上文所定义的至少一种大范围核酸酶、或一种或两种多核苷酸(优选包含在表达载体中)在体外用于抑制传染原的传播、灭活或消除传染原的用途，或者用于物品消毒的用途，其中所述传染原具有DNA中间体，存在于生物来源产品或旨在用于生物用途的产品中。

本发明的主题还包括组合物，其特征在于至少包含一种大范围核酸酶、一种或两种衍生的多核苷酸(优选包含在表达载体中)，如上文所述。

在所述组合物的一个优选实施方案中，其包含靶向DNA构建体，所述构建体包含修复目的位点的序列，其两侧是与如上所述的靶标基因座有同源性的序列。优选地，所述靶向DNA构建体被包含在重组载体中或被包含在表达载体中，所述载体包含编码所述大范围核酸酶的多核苷酸，如本发明中所定义。

本发明的主题还包括给产品或材料消毒以除去其中具有DNA中间体之传染原的方法，所述方法至少包括以下步骤：将生物来源产品、旨在用于生物用途的产品或物品与上文所定义的组合物接触一定时间，所述时间足以抑制所述传染原的传播、灭活或消除所述传染原。

在一个具体的实施方案中，所述传染原是病毒。例如，所述病毒是腺病毒(Ad11，Ad21)、疱疹病毒(HSV；VZV；EBV；CMV；6、7或8型疱疹病毒)、嗜肝DNA病毒(HBV)、乳多空病毒(HPV)、痘病毒或者逆转录病毒(HTLV、HIV)。

本发明的主题还包括产品，其至少含有大范围核酸酶或者编码所述大范围核酸酶的一种或两种表达载体，以及上述包含靶向构建体的载体，所述产品作为组合制剂同时、分别或依次使用，用于预防或治疗遗传性疾病。

对治疗的目的而言，以治疗有效量施用所述大范围核酸酶和可药用赋形剂。如果所施用的量是有生理意义的，则这样的组合被称作以“治疗有效量”施用。如果一种药剂的存在导致接受者生理状况可检测的变化，则它是有生理意义的。在本文中，如果一种药剂的存在导致目标疾病的一个或多个症状的严重程度减轻以及对损伤或异常的基因组矫正，则它是有生理意义的。

在本发明用途的一个实施方案中，所述大范围核酸酶基本上是非免疫原性的，即不引发或几乎不引发不利的免疫应答。根据本发明，可使用大量改善或消除这类有害免疫反应的方法。

在一个优选的实施方案中，所述大范围核酸酶基本不含N-甲酰基甲硫氨酸。

避免不想要的免疫反应的另一种方法是将大范围核酸酶与聚乙二醇(″PEG″)或聚丙二醇(″PPG″)(优选500到20,000道尔顿的平均分子量(MW))缀合。与PEG或PPG的缀合(如Davis等(US 4,179,337)所述)例如可提供具有抗病毒活性的非免疫原性生理活性水溶性内切核酸酶缀合物。Saifer等(US 5,006,333)中还描述了使用聚乙二醇-聚丙二醇共聚物的类似方法。

大范围核酸酶可作为多肽或者作为编码所述多肽的多核苷酸构建体/载体使用。通过本领域技术人员众所周知的任何适用于特定细胞类型的便利手段而在体外、离体或在体内将其(单独或者与至少一种合适的载体或运载体组合和/或与靶向DNA组合)引入细胞中。一旦进入细胞内，所述大范围核酸酶和包含靶标DNA和/或编码大范围核酸酶之核酸的载体(如果存在的话)被细胞从胞质输入或转移至核内的作用位点。

大范围核酸酶(多肽)可有利地与下述物质结合：脂质体、聚乙烯亚胺(PEI)、和/或膜易位肽(Bonetta，The Scientist，2002，16，38；Ford等，Gene Ther.，2001，8，1-4；Wadia和Dowdy，Curr.Opin.Biotechnol.，2002，13，52-56)；在后一种情况下，所述大范围核酸酶的序列与膜易位肽的序列融合(融合蛋白)。

可通过大量方法(例如注射、直接摄入、射弹轰击、脂质体、电穿孔)将包含靶标DNA和/或编码大范围核酸酶之核酸的载体引入细胞中。可使用表达载体在细胞中稳定或瞬时地表达大范围核酸酶。在真核细胞中进行表达的技术是本领域技术人员公知的(见Current Protocols in HumanGenetics：第12章“Vectors For Gene Therapy”& 第13章“DeliverySystems for Gene Therapy”)。任选地，可优选在重组蛋白中掺入核定位信号以确保其在核内表达。

可通过改造能够切割目的基因组DNA靶序列之变体的方法来获得来自I-CreI的大范围核酸酶(原始大范围核酸酶)，如之前Smith等NucleicAcids Res.，2006，34e149中所述，所述方法至少包括以下步骤：

(a)构建第一系列I-CreI变体，其在LAGLIDADG核心结构域的第一功能性亚结构域中含有至少一个替换，所述第一功能性亚结构域位于I-CreI的26到40位，

(b)构建第二系列I-CreI变体，其在LAGLIDADG核心结构域的第二功能性亚结构域中具有至少一个替换，所述第二功能性亚结构域位于I-CreI的44到77位，

(c)从步骤(a)的第一系列中选择和/或筛选能够切割突变体I-CreI位点的变体，在所述位点中(i)I-CreI位点中-10到-8位的核苷酸三联体已被存在于所述基因组靶标中-10到-8位的核苷酸三联体所替换，且(ii)+8到+10位的核苷酸三联体已被存在于所述基因组靶标的-10到-8位的核苷酸三联体的反向互补序列所替换，

(d)从步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体，在所述位点中(i)I-CreI位点中-5到-3位的核苷酸三联体已被存在于所述基因组靶标中-5到-3位的核苷酸三联体所替换，且(ii)+3到+5位的核苷酸三联体已被存在于所述基因组靶标中-5到-3位的核苷酸三联体的反向互补序列所替换，

(e)从步骤(a)的第一系列中选择和/或筛选能够切割突变体I-CreI位点的变体，在所述位点中(i)I-CreI位点中+8到+10位的核苷酸三联体已被存在于所述基因组靶标中+8到+10位的核苷酸三联体所替换，且(ii)-10到-8位的核苷酸三联体已被存在于所述基因组靶标中+8到+10位的核苷酸三联体的反向互补序列所替换，

(f)从步骤(b)的第二系列中选择和/或筛选能够切割突变体I-CreI位点的变体，在所述位点中(i)I-CreI位点中+3到+5位的核苷酸三联体已被存在于所述基因组靶标中+3到+5位的核苷酸三联体所替换，且(ii)-5到-3位的核苷酸三联体已被存在于所述基因组靶标中+3到+5位的核苷酸三联体的反向互补序列所替换，

(g)将来自步骤(c)和步骤(d)的两个变体中26到40位及44到77位中的突变在单个变体中组合，以获得切割下述序列的新的同二聚体I-CreI变体，所述序列中(i)-10到-8位的核苷酸三联体与存在于所述基因组靶标中-10到-8位的核苷酸三联体相同，(ii)+8到+10位的核苷酸三联体与存在于所述基因组靶标中-10到-8位的核苷酸三联体的反向互补序列相同，(iii)-5到-3位的核苷酸三联体与存在于所述基因组靶标中-5到-3位的核苷酸三联体相同，(iv)+3到+5位的核苷酸三联体与存在于所述基因组靶标中-5到-3位的核苷酸三联体的反向互补序列相同，

(h)将来自步骤(e)和步骤(f)的两个变体中26到40位及44到77位中的突变在单个变体中组合，以获得切割下述序列的新的同二聚体I-CreI变体，所述序列中(i)+3到+5位的核苷酸三联体与存在于所述基因组靶标中+3到+5位的核苷酸三联体相同，(ii)-5到-3位的核苷酸三联体与存在于所述基因组靶标中+3到+5位的核苷酸三联体的反向互补序列相同，(iii)该I-CreI位点中+8到+10位的核苷酸三联体已被存在于所述基因组靶标中+8到+10位的核苷酸三联体所替换，和(iv)-10到-8位的核苷酸三联体与存在于所述基因组靶标中+8到+10位的核苷酸三联体的反向互补序列相同，

(i)将步骤(g)与步骤(h)中获得的变体相组合以形成异二聚体，以及

(j)选择和/或筛选来自步骤(i)的能够切割所述基因组DNA靶标的异二聚体。

步骤(a)和(b)可包括引入其它突变以提高突变体的结合和/或切割性能，尤其是在与DNA靶序列接触或者与所述DNA靶标直接或间接相互作用的其它位置上。这些步骤可通过制备组合文库来实施，如PCT国际申请WO 2004/067736和Arnould等(J.Mol.Biol.，2006，355，443-458)中所述。

可通过使用体外或体内切割测定来进行步骤(c)、(d)、(e)、(f)和/或(j)中的选择和/或筛选，如PCT国际申请WO 2004/067736、Epinat等(NucleicAcids Res.，2003，31，2952-2962)、Chames等(Nucleic Acids Res.，2005，33，e178)和Arnould等(J.Mol.Biol.，2006，355，443-458)中所述。

优选地，通过重组介导的所述DNA双链断裂的修复在下述条件下在体内进行步骤(c)、(d)、(e)、(f)和/或(j)，在所述条件下，由所述变体产生的突变DNA靶序列中的双链断裂导致阳性选择标志物或报告基因的激活或者阴性选择标志物或报告基因的失活，如在PCT国际申请WO2004/067736、Epinat等(Nucleic Acids Res.，2003，31，2952-2962)、Chames等(Nucleic Acids Res.，2005，33，e178)和Arnould等(J.Mol.Biol.，2006，355，443-458)中所述。

可根据公知的重叠PCR技术，通过扩增包含两个亚结构域中之每一个的重叠片段来进行步骤(g)和(h)中的(分子内)突变组合。

通过定向诱变在步骤(g)或步骤(h)的组合变体上引入上文定义的19、54、79、105和/或132位上的突变。

步骤(i)中的(分子内)变体组合是通过共表达步骤(g)的一种变体和步骤(h)的一种变体从而允许形成异二聚体来进行的。例如，可通过编码所述变体的一种或两种重组表达载体修饰宿主细胞。然后在允许表达所述变体的条件下培养所述细胞，从而在所述宿主细胞中形成异二聚体，如先前在PCT国际申请WO 2006/097854和Arnould等(J.Mol.Biol.，2006，355，443-458)中所述的。

或者，可通过由源自上述改造大范围核酸酶变体之方法的方法引入下述修饰来获得本发明的异二聚体大范围核酸酶：

-在以下两种类型的原始骨架蛋白(scaffold protein)上进行步骤(a)和步骤(b)：具有G19S突变的第一I-CreI骨架(单体A)和不具有G19S突变的第二I-CreI骨架(单体B)；所述第二骨架可具有如上文所述破坏功能性同二聚体形成的其他突变，以及

-通过以下步骤进行步骤(c)-(f)的选择和/或筛选：将上文所述的单体A或B的变体文库转化到表达含有相应突变(分别来自单体B或A)的I-CreI突变体的宿主细胞中，以允许形成异二聚体，利用其中I-CreI位点的一半在±3至5位或±8至10位被修饰而另一半未被修饰的非回文DNA靶标选择功能性异二聚体变体。

通过将来自相同单体(A)或(B)的两种变体的突变组合在一个单体中来进行步骤(g)和(h)。

通过将步骤(g)中所得的来自单体(A或B)之一的变体与步骤(h)中所得的来自另一个单体的变体相组合来进行步骤(i)。

本发明的大范围核酸酶的用途以及使用所述大范围核酸酶的方法还包括上述使用编码所述大范围核酸酶的多核苷酸、载体、细胞、转基因植物或非人转基因哺乳动物。

根据本发明的用途和方法的另一有利的实施方案，所述大范围核酸酶、多核苷酸、载体、细胞、转基因植物或非人转基因哺乳动物与上述靶向DNA构建体联合。优选地，所述编码大范围核酸酶单体的载体包含如上所述的靶向DNA构建体。

编码本发明所述来自I-CreI的大范围核酸酶的两个单体的多核苷酸序列可通过本领域技术人员已知的任何方法制备。例如，通过使用特定引物的聚合酶链式反应从cDNA模板扩增它们。优选将所述cDNA的密码子选择成有助于所述蛋白质在期望的表达系统中表达。

能够切割来自目的基因组序列的DNA靶标的来自I-CreI的单链大范围核酸酶通过本领域公知的方法制备(Epinat等，Nucleic Acids Res.，2003，31，2952-62；Chevalier等，Mol.Cell.，2002，10，895-905；Steuer等，Chembiochem.，2004，5，206-13；国际PCT申请WO 03/078619和WO2004/031346)。任何这些方法都可用于构建本发明所述单链大范围核酸酶。

可通过公知的重组DNA和基因工程技术获得包含所述多核苷酸的重组载体并将其引入宿主细胞中。

可如下生产本发明所述来自I-CreI的大范围核酸酶：在适合单体共表达的条件下，在通过一种或两种表达载体修饰的转基因动物/植物或宿主细胞中共表达上文所述的两个I-CreI单体，并通过任何适当的手段从宿主细胞培养物或从转基因动物/植物中回收异二聚体大范围核酸酶。

本发明所述的单链大范围核酸酶是通过在适于融合蛋白表达的条件下，在利用一种表达载体修饰的转基因动物/植物或宿主细胞中，融合含有上文所述的两种单体的融合蛋白来制得的，并通过任何合适的方法从宿主细胞培养物或转基因动物/植物中回收所述单链大范围核酸酶。

本发明的主题还包括上文所述的至少一种可通过上文所述方法获得的来自I-CreI的大范围核酸酶作为用于制备其它大范围核酸酶的骨架的用途。例如，为了制备新的另一代归巢内切核酸酶，可在所述单体上进行另一轮诱变和选择/筛选。

除非另有说明，否则本发明的实施将使用本领域内的细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组DNA和免疫学的常规技术。这些技术在文献中有详尽解释。参阅，例如Current Protocolsin Molecular Biology(Frederick M.AUSUBEL，2000，Wiley和son Inc，Library of Congress，USA)；Molecular Cloning：A Laboratory Manual，第三版，(Sambrook等，2001，Cold Spring Harbor，New York：Cold SpringHarbor Laboratory Press)；Oligonucleotide Synthesis(M.J.Gait编辑，1984)；Mullis等美国专利号4,683,195；Nucleic Acid Hybridization(B.D.Harries & S.J.Higgins编辑1984)；Transcription And Translation(B.D.Hames & S.J.Higgins编辑1984)；Culture Of Animal Cells(R.I.Freshney，Alan R.Liss，Inc.，1987)；Immobilized Cells And Enzymes(IRLPress，1986)；B.Perbal，A Practical Guide To Molecular Cloning(1984)；the series，Methods In ENZYMOLOGY(主编J.Abelson和M.Simon，Academic Press，Inc.，New York)，尤其是第154和155卷(Wu等编辑)以及第185卷，″Gene Expression Technology″(D.Goeddel编辑)；GeneTransfer Vectors For Mammalian Cells(J.H.Miller和M.P.Calos编辑，1987，Cold Spring Harbor Laboratory)；Immunochemical Methods In CellAnd Molecular Biology(Mayer和Walker编辑，Academic Press，London，1987)；Handbook Of Experimental Immunology，第I-IV卷(D.M.Weir和C.C.Blackwell编辑，1986)；以及Manipulating the Mouse Embryo，(Cold Spring Harbor Laboratory Press，Cold Spring Harbor，N.Y.，1986)。

除了上述特征以外，本发明还包括在以下内容中显现的其他特征，所述内容涉及说明本发明的用于增强来自I-CreI的大范围核酸酶切割活性的方法的实施例及附图，在附图中：

-图1表示来自LAGLIDADG家族的归巢内切核酸酶的结构和用于改造它们的组合方法。

A.与其DNA靶标结合的I-CreI归巢内切核酸酶的三维结构。催化核心被两个αββαββα折叠包围，所述折叠在DNA大沟上形成鞍形相互作用界面。

B.改造I-CreI和其他LAGLIDADG归巢内切核酸酶之特异性的两步式方法。通过原始骨架的半推理诱变并筛选具有局部改变的特异性的功能性变体，产生新内切核酸酶的大集合。然后使用组合方法将这些突变体装配成具有完全重新设计的特异性的大范围核酸酶。通过在同一αββαββα折叠内组合两组突变来产生同二聚体蛋白质(“半-大范围核酸酶”)，共表达两种这样的“半-大范围核酸酶”能够产生切割目的靶标的异二聚体类型(“定制大范围核酸酶”)。

-图2展示了Rosa1靶序列及其衍生物。10GGG_P、5GAT_P和5TAT_P是发现被先前获得的I-CreI突变体切割的密切衍生物。它们与G1221(被I-CreI骨架蛋白质切割的回文序列)的区别在于带框的基序。C1221、10GGG_P、5GAT_P和5TAT_P首先被描述为24bp序列，但是结构数据提示，只有22bp与蛋白质/DNA相互作用相关。然而，仍在括号中标出了±12位。rosa1是位于小鼠ROSA26基因座8304位的DNA序列。在rosa1.2靶标中，靶标中部的GTTC序列被替换为存在于C1221中的碱基GTAC。rosa1.3是来自rosa1.2左侧部分的回文序列，rosa1.4是来自rosa1.2右侧部分的回文序列。如图中所示，来自10GGG_P、5GAT_P和5TAT_P的加框基序存在于靶标的rosa1系列中。

-图3展示了用于在酵母报告载体中gateway克隆DNA靶标的质粒pCLS1055的图谱。

-图4展示了用于大范围核酸酶ORF克隆和在酵母中表达的LEU2标记质粒pCLS0542的图谱。

-图5展示了I-CreI突变体对rosa1.3DNA靶标的切割。将首次筛选中找到的63个阳性结果重排于一个96孔板中，并通过二次筛选(以一式四份的方式)验证。圈出了在实施例1中选择的22个突变体。

-图6展示了I-CreI组合突变体对rosa1.4靶标的切割。将首次筛选中找到的69个阳性结果重排于一个96孔板中，并通过二次筛选(以一式四份的方式)验证。圈出了在实施例2中选择的15个突变体。

-图7展示了用于大范围核酸酶克隆和在酵母中表达的Kan^R标记质粒pCLS1107的图谱。

-图8展示了异二聚体I-CreI组合突变体对rosa1.2和rosa1靶标的切割。A.用rosa1.2靶标筛选I-CreI突变体组合的实例。B.用rosa1靶标筛选I-CreI突变体的相同组合。B5、B6、D5、D6、F5、F6、H5和H6：用pCLS1107空质粒DNA转化的、表达切割rosa1.3之I-CreI突变体的酵母菌株。

-图9展示了对rosa1靶标的切割。将一系列切割rosa1.4的I-CreI突变体随机诱变并与切割rosa1.3的突变体共表达。用rosa1靶标测试切割。在每个四点簇中，右侧的两个点对应于一式两份的切割rosa1的原始异二聚体之一，而左侧的两个点对应于与未突变的rosa1.3切割酶共表达的相同经突变的rosa1.4切割酶(突变体m14，在表III和IV中描述)。圈出了显示出改进的rosa1切割的两个优化突变体，对应于m13与MO_1(C10)或者m13与MO_2(E2)的共表达。MO_1和MO_2进一步描述于表V中。

-图10展示了对rosa1靶标的切割。随机诱变一系列切割rosa1.3的I-CreI突变体，并与切割rosa1.4的精细化突变体共表达。用rosa1靶标测试切割。圈出了显示有效rosa1切割的突变体。在滤膜中：

-B11对应于异二聚体S19 V24 Y44 R68 S70 N75 V77/E28 R33 R38 K40A44 H68 Q70 A105 R107 A151 G153 E158；

-C9对应于异二聚体S19 V24 Y44 R68 S70 Q75 I77/E28 R33 R38 K40A44 H68 Q70 A105 R107 A151 G153 E158；

-C11和E8对应于异二聚体V24 Y44 S68 S70 R75 I77 A105/E28 R33 R38K40 A44 H68 Q70 A105 R107 A151 G153 E158，和

-E6对应于异二聚体V24 Y44 S68 S70 R75 I77 G79/E28 R33 R38 K40A44 H68 Q70 A105 R107 A151 G153 E158。

H10是阴性对照，H11和H12是不同强度的阳性对照。为了比较改进切割rosa1.3靶标之突变体前后异二聚体针对rosa1靶标的活性：在每个簇中，右侧的两个点对应于实施例4中所述异二聚体之一，左侧的两个点对应于具有额外突变的异二聚体，如实施例5中所述。

-图11展示了针对rosa1.3回文靶标筛选实施例5中显示有效rosa1切割的精细化突变体(圈出)作为酵母中同二聚体。在滤膜中：

-B11对应于mO_1突变体(S19 V24 Y44 R68 S70 N75 V77)；C9对应于mO_2突变体(S19 V24 Y44 R68 S70 Q75 I77)；C11和E8对应于mO_3突变体(V24 Y44 S68 S70 R75 I77 A105)且E6对应于mO_4突变体(V24 Y44S68 S70 R75 I77 G79)。H10是阴性对照，H11和H12是不同强度的阳性对照。在每个簇中，右侧的两个点对应于实施例6中所述针对rosa1.3靶标筛选的同二聚体之一，左侧的两个点是阴性对照或不同强度的阳性对照。

-图12代表B2M系列的靶标。10GAA_P、10CTG_P、5TAG_P和5TTT_P是发现被先前获得的I-CreI突变体切割的密切衍生物。它们与G1221(被I-CreI骨架蛋白质切割的回文序列)的区别在于带框的基序。C1221、10GAA_P、10CTG_P、5TAG_P和5TTT_P首先被描述为24bp序列，但是结构数据说明只有22bp与蛋白质/DNA相互作用相关。然而，仍在括号中标出了±12位。B2M11.2和B2M11.3是通过一半靶标的镜像重复而从B2M11靶标获得的两个回文序列。如果我们认为B2M11.2和B2M11.3靶标中±11、±7和±6位上的核苷酸对切割没有影响，则进而可以认为这两个靶标是发现被I-CreI靶标切割的10NNN和5NNN靶标的组合。将所有靶标C1221靶标(被I-CreI切割的回文序列)进行比对。

-图13展示了组合突变体对B2M11.2靶标的切割。该图展示了用B2M11.2靶标首次筛选I-CreI组合突变体的一个例子。在第一层顶部滤膜中，B3位置(圈出)上阳性突变体的序列是KNAHQS/AYSYK(与表VIII的命名相同)。在第二层滤膜(底部)中，F7位置上的阳性突变体的序列是KNGHQS/AYSYK。在两图中，H12均对应于弱阳性对照(c)。

-图14展示了优化的突变体对B2M11.2靶标的切割。从两个突变体KNAHQS/AYSYK和KNGHQS/AYSYK的随机诱变获得切割B2M11.2的一系列I-CreI N75优化的突变体。用B2M11.2靶标测试切割。圈出切割B2M11.2的突变体，例如B3对应于32A33H44A68Y70S75Y77K/2Y53R66C(与表IX的命名相同)。H12是阳性对照。

-图15展示了组合突变体对B2M11.3靶标的切割。该图展示了用B2M11.3靶标首次筛选I-CreI组合突变体的例子。H10、H11和H12分别是阴性对照(C1)和两个不同强度的阳性对照(C2和C3)。在滤膜中，G5位置(圈出)上阳性突变体的序列是KQSGCS/QNSNR(与表X的命名法相同)。

-图16展示了异二聚体组合突变体对B2M11靶标的切割。该图展示了用B2M11靶标筛选I-CreI突变体的组合。在第5列中圈出一系列阳性异二聚体组合突变体。它们均对应于表XI中所列的32A33H44A68Y70S75Y77K132V/30Q33G38C68N70S75N77R异二聚体。

-图17展示了优化的异二聚体组合突变体对B2M11靶标的切割。将切割B2M11.3的一系列I-CreI N75优化突变体与切割B2M11.2的突变体共表达。例如，G9对应于30Q33G38C68N70S75N77R与32A33H44A68Y70S75Y77K2Y53R66C的异二聚体。用B2M11靶标测试切割。在每个四点簇中将相同的异二聚体组合测试两次(左侧的两个点)，但是点(右上方)对应于32A33H44A68Y70S75Y77K2Y53R66C/30Q33G38C68N70S75N77R对照(在对切割B2M11.3的大范围核酸酶进行随机诱变之前)。来自每个簇的第四个点对应于阴性对照(无大范围核酸酶)，或者对应于强阳性对照(I-SceI与I-SceI靶标)，或者对应于中等强度阳性对照(从改变了密码子使用的ORF表达的I-SceI蛋白，在该测定法中其与I-SceI靶标产生更低的信号)。

-图18展示了用于在gateway克隆后在哺乳动物细胞中表达大范围核酸酶的质粒pCLS1069的图谱。

-图19展示了用于在用于哺乳动物细胞的报告载体中gateway克隆DNA靶标的质粒pCLS1058。

-图20展示了哺乳动物细胞中报告系统的设计。起始密码子下游132bp被I-SceI切割位点中断的嘌呤霉素抗性基因处于EFIα启动子的控制下(1)。转基因在CHO-K1细胞中以单拷贝稳定表达。为了在相同的染色体环境中引入大范围核酸酶靶位点，修复基质由以下组成：i)无启动子的潮霉素抗性基因，ii)完整的lacZ表达盒和iii)两条同源序列臂(1.1kb和2.3kb)。构建了若干修复基质，其差别仅在于中断lacZ基因的识别位点(2)。因此，产生了非常相似的细胞系作为A1细胞系、I-SceI细胞系和I-CreI细胞系。当lacZ修复基质(长度2kb)与表达切割识别位点(3)的大范围核酸酶的载体共转染时，重建了功能性lacZ基因。可以从转染后蓝色菌落或灶点的数量推断大范围核酸酶诱导的重组水平。

-图21展示了用于在哺乳动物细胞中表达I-CreI N75的质粒pCLS1088的图谱。

-图22展示了切割HprCH3DNA靶标序列的大范围核酸酶的切割效率。在用修复基质和不同量的大范围核酸酶表达载体转染含有HprCH3染色体报告系统的CHO细胞后，检测LacZ基因的修复频率，所述表达载体编码原始的改造异二聚体(HprCH3.3/HprCH3.4)或其G19S衍生物(HprCH3.3/HprCh3.4G19S或HprCH3.3G19S/HprCh3.4)。

-图23展示了RAG1.10系列靶标。10GTT_P、10TGG_P、5CAG_P和5GAG_P是发现被先前获得的I-CreI突变体切割的密切衍生物。它们与G1221(被I-CreI骨架蛋白质切割的回文序列)的区别在于带框的基序。C1221、10GTT_P、10TGG_P、5CAG_P和5GAG_P首先被描述为24bp序列，但是结构数据说明只有22bp与蛋白质/DNA相互作用相关。然而，仍在括号中标出了±12位。RAG1.10.2和RAG1.10.3是通过一半靶标的镜像重复而从RAG1.10靶标获得的两个回文序列。如果我们认为RAG1.10.2和RAG1.10.3靶标中±11、±7和±6位上的核苷酸对切割没有影响，则进而可以认为这两个靶标是发现被I-CreI靶标切割的10NNN和5NNN靶标的组合。将所有靶标与I-CreI切割的回文序列C1221靶标进行比对。

-图24展示了在CHO细胞中的染色体外测定法中，含有或不含有G19S突变的M2和M3I-CreI突变体对RAG1.10、RAG1.10.2和RAG1.10.3靶标的切割。图A中展示了对回文靶标RAG1.10.2和RAG1.10.3的切割，而图B中展示了异二聚体大范围核酸酶对RAG1.10的切割。将相同实验中I-SceI对I-SceI靶标的切割作为阳性对照展示。

-图25展示了在CHO细胞中的染色体外测定法中，监测三种RAG1.10异二聚体针对三种RAG1.10靶标的活性。背景对应于用空载体转染细胞。将相同实验中I-SceI对S1234I-SceI靶标的切割作为阳性对照展示。

-图26展示了针对三种XPC靶标(C1、C3和C4)，对三种XPC单链分子X2-L1-H33、SCX1和SCX2进行酵母筛选。SCX1是X2(K7E)-L1-H33(E8K，G19S)分子，SCX2代表X2(E8K)-L1-H33(K7E，G19S)分子。对每个四点酵母簇而言，左侧两个点是实验结果，而右侧两个点是评价实验品质和有效性的多种内对照。

实施例1：产生切割rosa1.3的大范围核酸酶

该实施例显示，I-CreI突变体能够切割来自rosa1靶标左侧部分的回文形式rosa1.3DNA靶序列(图2)。本实施例中描述的靶序列是22bp回文序列。因此，仅以前11个核苷酸描述它们，随后是后缀P。例如，靶标rosa1.3还被记为caacatgatgt_P；SEQ ID NO：9。

rosa1.3靶标在±1、±2、±3、±4、±5、±7、±9、±10和±11位与5GAT_P相似，两条序列仅在±6和±8位不同。推测位置±6对结合和切割活性几乎没有影响。如Arnould等，J Mol Biol.2006；355，443-458和国际PCT申请WO 2006/097784和WO 2006/097853中所述，先前通过在24、44、68、70、75和77位诱变I-CreI N75获得了能够切割5GAT_P(caaaacgatgt_P；SEQ ID NO：5)的突变体。在该实施例中，检验了切割5GAT_P靶标的突变体是否也能够切割rosa1.3靶标。

1)材料和方法

国际PCT申请WO 2004/067736；Epinat等，Nucleic Acids Res.，2003，31，2952-2962；Chames等，Nucleic Acids Res.，2005，33，e178，和Arnould等，J.Mol.Biol.，2006，355，443-458中描述了在哺乳动物或酵母细胞中产生大范围核酸酶的方法和基于切割所诱导的重组的测定，其用于筛选具有改变的特异性的变体。这些测定产生可通过标准方法监测的功能性LacZ报告基因。

a)构建靶标载体

如下克隆靶标：侧翼是gateway克隆序列的对应于靶序列的寡核苷酸从Proligo定购：5’tggcatacaagtttcaacatgatgtacatcatgttgacaatcgtctgtca3’(SEQ ID NO：11)。使用Gateway方案(INVITROGEN)，将通过PCR扩增单链寡核苷酸而产生的双链靶DNA克隆进酵母报告载体(pCLS1055，图3)中。将酵母报告载体转化进酿酒酵母菌株FYBL2-7B(MATα，ura3Δ851，trp1Δ63，leu2Δ1，lys2Δ202)中。

b)I-CreI突变体

如先前Arnould等，J.Mol.Biol.，2006，355，443-458以及国际PCT申请WO 2006/097784和WO 2006/097853中所述，在突变了I-CreI中24、44、68、70、75和77位的文库中鉴定切割5GAT_P的I-CreI突变体。将它们克隆进DNA载体(pCLS0542，图4)中，并在酿酒酵母(Saccharomycescerevisiae)菌株FYC2-6A(MATα，trp1Δ63，leu2Δ1，his3Δ200)中表达。

c)接合表达大范围核酸酶的克隆并在酵母中筛选：

筛选如先前所述进行(Arnould等，J.Mol.Biol.2006，355，443-458)。使用菌落网格(gridder)(QpixII，GENETIX)进行接合。使用低网格密度(约4个点/cm²)将突变体在覆盖YPD平板的尼龙滤膜上划网格。在相同的滤膜上进行第二次划网格的过程从而印上第二层，所述第二层对每个靶标而言由具有不同报告子的酵母菌株组成。将膜置于富含固体琼脂YPD的培养基上，并在30℃孵育一夜，以允许接合。接着，将滤膜转移至合成培养基上并在37℃孵育五天，以选择带有表达载体和靶标载体的二倍体，所述合成培养基缺乏亮氨酸和色氨酸，并含有半乳糖(2％)作为碳源。5天后，将滤膜置于固体培养基上并在37℃孵育，以监测β-半乳糖苷酶活性，所述固体培养基在0.5M磷酸钠缓冲液pH 7.0中含有0.02％X-Gal、0.1％SDS、6％二甲基甲酰胺(DMF)、7mM β-巯基乙醇、1％琼脂糖。通过扫描分析结果，并使用合适的软件进行量化。

d)突变体测序

为了回收突变体表达质粒，使用标准方案提取酵母DNA并用于转化大肠杆菌。然后通过MILLEGEN SA对质粒进行突变体ORF的测序。或者，通过PCR从酵母DNA中扩增ORF(Akada等，Biotechniques，2000，28，668-670，672，674)并通过MILLEGEN SA直接对PCR产物进行测序。

2)结果

针对rosa1.3DNA靶标(caacatgatgt_P；SEQ ID NO：9)的切割，筛选先前在文库中鉴定的切割5GAT_P靶标的I-CreI突变体，所述文库中突变了I-CreI的24、44、68、70、75和77位。发现了总计63个阳性克隆，将其重排于96孔板中并通过二次筛选验证(图5)。在这些阳性克隆中选择了22个(在图5中圈出)。对这22个阳性克隆测序。结果它们对应于表I中描述的18种不同蛋白质。

表I：能切割rosa1.3DNA靶标的I-CreI突变体。

图5上的I-CreI突变体位置	名称	24、44、68、70、75和77位上的氨基酸(例如：VYRSYI代表V24、Y44、R68、S70、Y75和I77)
图5上的I-CreI突变体位置	名称	24、44、68、70、75和77位上的氨基酸(例如：VYRSYI代表V24、Y44、R68、S70、Y75和I77)	A1和F3	m1	VYRSYI
A3	m2	VYRSNI	A1和F3	m1	VYRSYI
A3	m2	VYRSNI	A5和B1	m3	VYDSRR
A9	m4	ITYSYR	A5和B1	m3	VYDSRR
A9	m4	ITYSYR	A11	m5	VYRSYQ
B3，D5和E6	m6	VYYSYR	A11	m5	VYRSYQ
B3，D5和E6	m6	VYYSYR	B8	m7	VYYSRA
B9	m8	VYRSNV	B8	m7	VYYSRA
B9	m8	VYRSNV	B10	m9	VNYSYR
B11	m10	VNYSYR+82T^＊	B10	m9	VNYSYR
B11	m10	VNYSYR+82T^＊	C3	m11	VYSSRV
C8	m12	VYNSRI	C3	m11	VYSSRV
C8	m12	VYNSRI	C11	m13	VYSSRI

图5上的I-CreI突变体位置	名称	24、44、68、70、75和77位上的氨基酸(例如：VYRSYI代表V24、Y44、R68、S70、Y75和I77)
图5上的I-CreI突变体位置	名称	24、44、68、70、75和77位上的氨基酸(例如：VYRSYI代表V24、Y44、R68、S70、Y75和I77)	D6	m14	VYRSQI
D9	m15	IYRSNI	D6	m14	VYRSQI
D9	m15	IYRSNI	D12	m16	VYYSRV
E1	m17	VYRSYT	D12	m16	VYYSRV
E1	m17	VYRSYT	E11	m18	VNSSRV

＊m10中的82T是预料外的突变，其可能是由于对酵母DNA测序之前的PCR反应。

实施例2：制造切割rosa1.4的大范围核酸酶

该实施例显示，I-CreI突变体能够切割来自rosa1靶标右侧部分的回文形式rosa1.4DNA靶序列(图2)。本实施例中描述的所有靶序列是22bp回文序列。因此，仅以前11个核苷酸描述它们，随后是后缀_P。例如，靶标rosa1.4还被记为tgggattatgt_P(SEQ ID NO：10)。

rosa1.4靶标在±1、±2、±3、±4、±5和±7位与5TAT_P相似，并在±1、±2、±7、±8、±9和±10位与10GGG_P相似。推测±6和±11位对结合和切割活性几乎没有影响。如Arnould等，J Mol.Biol.，2006；355，443-458以及国际PCT申请WO 2006/097784和WO 2006/097853中所述，先前通过在44、68、70位诱变I-CreI N75获得了能够切割5TAT_P的突变体。如Smith等，Nucleic Acids Research，2006，34，e149和国际PCT申请WO2007/049156中所述，通过在28、30、33、38、40和70位上诱变I-CreI N75获得了能够切割10GGG_P靶标的突变体。

两组蛋白质均在70位上被突变。然而，推测存在两个可分离的功能性亚结构域。这意味着该位置对针对靶标碱基±8到10的特异性几乎没有影响。

因此，为了检验组合突变体是否能够切割rosa1.4靶标，将来自切割5TAT_P(caaaactatgt_P；SEQ ID NO：6)的蛋白质44、68和70位的突变与来自切割10GGG_P(cgggacgtcgt_P；SEQ ID NO：4)的蛋白质的28、30、33、38和40突变相组合。

1)材料和方法

实验步骤如实施例1中所述和如下进行：

构建组合突变体

在Smith等，Nucleic Acids Res.，2006，34，e149；国际PCT申请WO2007/049156，和Arnould等，J.Mol.Biol.，2006，355，443-458；国际PCT申请WO 2006/097784和WO 2006/097853中分别针对10GGG_P或5TAT_P靶标鉴定了切割10GGG_P或5TAT_P的I-CreI突变体。为了产生含有来自两个系列的突变的来自I-CreI的编码序列，分别进行扩增I-CreI编码序列5’端(1-43位aa)或3’端(39-167位)的重叠PCR反应。对5’和3’两端而言，使用对载体(pCLS0542，图4)特异的引物Gal10F5’-gcaactttagtgctgacacatacagg-3’(SEQ ID NO：12)或Gal10R5’-acaaccttgattggagacttgacc-3′(SEQ ID NO：13)以及对I-CreI编码序列氨基酸39-43特异的引物assF 5’-ctannnttgaccttt-3’(SEQ ID NO：14)或assR5’-aaaggtcaannntag-3’(SEQ ID NO：15)(其中nnn编码40位残基)进行PCR扩增。合并用相同引物从扩增反应获得并且对40位残基而言具有相同编码序列的PCR片段。然后，将从使用引物Gal10F和assR或者assF和Gal10R的反应获得的每个PCR片段库以等摩尔比混合。最后，使用高效LiAc转化方案(Gietz，R.D.和R.A.Woods，Methods Enzymol.2002，350，87-96)，使用通过NcoI和EagI消化而线性化的75ng载体DNA(pCLS0542)和25ng两种重叠PCR片段的每种最终库，转化酵母酿酒酵母菌株FYC2-6A(MATα，trp1Δ63，leu2Δ1，his3Δ200)。通过酵母中的体内同源重组产生同时含有两组突变的完整编码序列。

2)结果

通过在I-CreI N75骨架上结合44、68和70位的突变和28、30、33、38和40位的突变来构建I-CreI组合突变体，得到复杂度2208的文库。组合突变体的例子展示于表II中。将该文库转化进酵母中，并针对对rosa1.4DNA靶标(tgggattatgt_P；SEQ ID NO：10)的切割筛选了3456个克隆(复杂度的1.5倍)。发现了总计69个阳性克隆，将其重排于96孔板中，并通过二次筛选验证(图6)。在这些阳性克隆中，选择了15个克隆(在图6中圈出)。测序后，结果这15个克隆对应于切割rosa1.4DNA靶标的8种不同的新内切核酸酶(表II)。

表II：组合变体对rosa1.4靶标的切割

＊仅展示了2208个组合中的105个。

+表明在测序的阳性克隆中发现了功能性组合突变体。

实施例3：产生切割rosa1的大范围核酸酶

在实施例1和2中鉴定了能够切割每种来自rosa1的回文靶标(rosa1.3和rosa1.4)的I-CreI突变体。在酵母中共表达这样的突变体对(一个切割rosa1.3，一个切割rosa1.4)。共表达后，应当存在三种活性分子种类：两种同二聚体和一种异二聚体。测试应当形成的异二聚体是否切割非回文的rosa1和rosa1.2DNA靶标。

1)材料和方法

a)在卡那霉素抗性载体中克隆突变体

为了在酵母中共表达两种I-CreI突变体，在用卡那霉素抗性基因标记的酵母表达载体(pCLS1107，图7)中亚克隆切割rosa1.4序列的突变体。通过使用对pCLS0542和pCLS1107通用的引物：Gal10F5’-gcaactttagtgctgacacatacagg-3’(SEQ ID NO：12)和Gal10R5’-acaaccttgattggagacttgacc-3’(SEQ ID NO：13)进行的PCR反应来扩增突变体。使用高效LiAc转化方案，使用约25ng PCR片段和经DraIII和NgoMIV消化而线性化的25ng载体DNA(pCLS1107)转化酵母酿酒酵母菌株FYC2-6A(MATα，trp1Δ63，leu2Δ1，his3Δ200)。通过在酵母中体内同源重组来产生I-CreI突变体的完整编码序列。然后将含有亚克隆到pCLS1107载体中的切割rosa1.4靶标的突变体的每个酵母菌株与表达rosa1.4靶标的酵母接合，进行验证。为了回收表达质粒的突变体，使用标准方案提取酵母DNA，并转化大肠杆菌和制备大肠杆菌DNA。

b)突变体共表达

用pCLS1107表达载体中编码切割rosa1.4靶标之突变体的DNA转化在pCLS0542表达载体中表达切割rosa1.3靶标之突变体的酵母菌株。在-L Glu+G418培养基上选择转化体。

c)接合大范围核酸酶共表达克隆并在酵母中筛选

使用菌落网格(gridder)(QpixII，GENETIX)进行接合。使用低网格密度(约4个点/cm²)将突变体在覆盖YPD平板的尼龙滤膜上划网格。在相同的滤膜上进行第二次划网格的过程从而印上第二层，所述第二层对每个靶标而言由具有不同报告子的酵母菌株组成。将膜置于富含固体琼脂YPD的培养基上，并在30℃孵育一夜，以允许接合。接着，将滤膜转移至合成培养基上并在37℃孵育五天，以选择带有表达载体和靶标载体的二倍体，所述合成培养基缺乏亮氨酸和色氨酸，添加G418，并含有半乳糖(2％)作为碳源。5天后，将滤膜置于固体琼脂糖培养基上并在37℃孵育，以监测β-半乳糖苷酶活性，所述固体琼脂糖培养基在0.5M磷酸钠缓冲液pH 7.0中含有0.02％X-Gal、0.1％SDS、6％二甲基甲酰胺(DMF)、7mM β-巯基乙醇、1％琼脂糖。通过扫描分析结果，并使用合适的软件进行量化。

2)结果

切割rosa1.3靶标(表I中所述m1到m18)的突变体和切割rosa1.4靶标(表II中所述)的八个突变体的共表达在所有情况下都导致对rosa1.2靶标的有效切割(筛选例子如图8A中所示)。测试的所有组合概括于表III中。大部分这些组合还能够切割rosa1天然靶标，所述rosa1天然靶标与rosa1.2序列的差别仅在于+1位的1bp(图2)。如图8B中所示，用rosa1天然靶标观察到的信号与用rosa1.2靶标观察到的信号相比较弱。切割rosa1DNA靶标的组合展示于表IV中。

表III：导致切割rosa 1.2靶标的组合

“+”表示切割rosa1.2靶标的异二聚体突变体。

表IV：导致切割rosa1靶标的组合

“+”表示异二聚体突变体切割了rosa1DNA靶标。

实施例4：通过对切割rosa1.4的蛋白质进行随机诱变并与切割rosa1.3的蛋白质进行装配来产生切割rosa1的大范围核酸酶

已通过将切割回文rosa1.3和rosa1.4靶标的突变体进行装配而鉴定了能够切割非回文rosa1.2和rosa1靶标的I-CreI突变体。然而，这些组合能够有效切割rosa1.2，但是难以切割与rosa1.2的差异仅在于1位的1bp的rosa1。用rosa1观察到的信号不足。

因此，对切割rosa1的蛋白组合进行了随机诱变，并筛选了有效切割rosa1的变体。根据与其靶标结合的I-CreI蛋白质的结构，4个中央碱基对(-2到2位)不与I-CreI蛋白接触(Chevalier，B.S.and B.L.Stoddard，Nucleic Acids Res.，2001，29，3757-3774；Chevalier等，Nat.Struct.Biol.，2001，8，312-316；Chevalier等，J.Mol.Biol.2003，329，253-269)。因此，难以合理地选择一组位置来诱变，在蛋白质的C端部分(最后83个氨基酸)或在整个蛋白质上进行了诱变。随机诱变产生高复杂度文库，并且通过仅对切割rosa1的异二聚体的两个组件之一进行诱变，来限制待测试变体文库的复杂度。

因此，随机诱变切割rosa1.4的蛋白质，并且测试与切割rosa1.3的蛋白质共表达时它们是否能够切割rosa1。

1)材料和方法

a)随机诱变

如JBS dNTP-诱变试剂盒中JENA BIOSCIENCE GmbH的方案所述，通过PCR在两步式PCR方法中以选择的突变体库为基础创建随机诱变文库，所述PCR使用Mn²⁺或作为8-氧代-dGTP和dPTP的dNTP衍生物。为了对整个蛋白质进行随机诱变，使用的引物是：preATGCreFor5’-gcataaattactatacttctatagacacgcaaacacaaatacacagcggcctt gccacc-3’；SEQID NO：16)和ICreIpostRev 5’-ggctcgaggagctcgtctagaggatcgctcgagttatcagtcggccgc-3’(SEQ ID NO：17)。为了对蛋白质的C端部分进行随机诱变，使用的引物是AA78a83For(5’-ttaagcgaaatcaagccg-3’；SEQ ID NO：18)和含dNTP衍生物的ICreIpostRev；使用无dNTP衍生物的引物preATGCreFor和AA78a83Rev(5’-cggcttgatttcgcttaa-3’；SEQ ID NO：19)，用高保真taq聚合酶扩增蛋白质的剩余部分。

通过使用对pCLS0542(图4)和pCLS1107(图7)通用的这些引物，通过PCR反应扩增突变体库。使用高效LiAc转化方案，使用约75ng PCR片段和经DraIII和NgoMIV消化而线性化的75ng载体DNA(pCLS1107)转化酵母酿酒酵母菌株FYC2-6A(MATα，trp1Δ63，leu2Δ1，his3Δ200)。通过在酵母中体内同源重组来产生I-CreI突变体的完整编码序列。通过如实施例1中所述的测序来验证具有阳性结果的克隆。

b)将亮氨酸表达载体中的突变体克隆进含有rosa1靶标的酵母菌株中

使用高效LiAc转化方案，用带有LEU2基因标记的pCLS0542载体中切割rosa1.3靶标的突变体转化酵母菌株FYBL2-7B(MAT a，ura3Δ851，trp1Δ63，leu2Δ1，lys2Δ202)，所述酵母菌株含有进入酵母报告载体pCLS1055(图3)的rosa1靶标。得到的酵母菌株用作如实施例3中所述接合测定法的靶标。

2)结果

将切割rosa1.4的四种突变体(根据表IV为ERRR/AHQ、ERRR/ARN、ERRK/AHQ和ERRK/VRA)合并，对整个蛋白质或蛋白质C端部分进行随机诱变并转化进酵母。然后将4464个转化克隆与酵母菌株接合，所述酵母菌株(i)在报告质粒中含有rosa1靶标，(ii)表达切割rosa1靶标的变体，其选自实施例1中所述变体。使用三种菌株，其表达I-CreI V24Y44 S68 S70 R75 I77(或VYSSRI)突变体，或I-CreI V24 Y44 R68 S70 Q75I77(或VYRSQI)突变体，或I-CreI V24 Y44 R68 S70 Y75 T77(或VYRSYT)突变体(见表I)。发现两个克隆在与这样的酵母菌株接合时与用相同酵母菌株诱变之前相比引发对rosa1靶标的更好的切割。总之，两种蛋白质在与VYSSRI、VYRSQI或VYRSYT(表V和图9)形成异二聚体时能够有效切割rosa1。有趣的是，两种蛋白质均含有A105和R107残基。

表V：展示对rosa1DNA靶标的强切割活性的功能性突变体组合

^＊通过随机诱变产生的突变为黑体

实施例5：通过随机诱变切割rosa1.3的蛋白质并与切割rosa1.4的精细化蛋白质装配而对切割rosa1的大范围核酸酶进行精细化

通过将切割rosa1.3的突变体与切割rosa1.4的精细化突变体装配来鉴定能够切割rosa1靶标的I-CreI突变体。为了提高大范围核酸酶的活性，对切割rosa1的异二聚体的第二组分进行随机诱变。在本实施例中，将切割rosa1.3的突变体随机诱变，然后筛选与实施例4所鉴定的切割rosa1.4的精细化变体相组合的切割rosa1的更有效的变体。

1)材料和方法

实验步骤如实施例4中所述，只是将PCR产物克隆进通过NcoI和EagI消化而线性化的pCLS0542载体(图4)中。

将Kan ^R 表达载体中的突变体克隆进含有rosa1靶标的酵母菌株中

使用高效LiAc转化方案，用pCLS1107载体中切割rosa1.4靶标的MO_1和MO_2精细化突变体转化酵母菌株FYBL2-7B(MAT a，ura3Δ851，trp1Δ63，leu2Δ1，lys2Δ202)，所述酵母菌株含有进入酵母报告载体(pCLS1055，图3)的rosa1靶标。得到的酵母菌株用作如实施例3中所述接合测定法的靶标。

2)结果

将切割rosa1.3的四种突变体的两个库(根据表IV，1号库：VYRSNI、VYYSYR、VYRSNV和VYNSRI和2号库：VYYSYR、VYSSRI、VYRSQI和VYRSYT)在所有蛋白质或蛋白质C端部分进行随机诱变并转化进酵母。然后将8928个转化克隆与酵母菌株接合，所述酵母菌株(i)在报告质粒中含有rosa1靶标，(ii)表达切割rosa1.4靶标的变体。使用两种这样的菌株，其表达I-CreI E28 R33 R38 R40 A44 H68 Q70 N75 A105 R107(或MO_1)突变体或者I-CreI E28 R33 R38 K40 A44 H68 Q70 N75 A105 R107A151 G153 E158(或MO_2)突变体。发现五个克隆在与这样的酵母菌株接合时与用相同酵母菌株诱变之前相比引发对rosa1靶标的更好的切割(图10)。测序后，发现它们对应于四种蛋白质。总之，鉴定了在与MO_1或MO_2形成异二聚体时能够有效切割rosa1的四种蛋白质(表VI)。

表VI：针对rosa1DNA靶标显示出强切割活性的功能性突变体组合

＊由随机诱变引起的突变为黑体。

通过对作为同二聚体切割rosa1.3靶标的I-CreI突变体库的随机诱变获得这4种新蛋白质(描述于实施例1和表I中)。有趣的是，与原始I-CreI突变体相比它们各自仅具有一个单氨基酸突变(G19S、V105A或S79G)(表VII)。例如，mO_2与m14的差异在于单个G19S突变。类似地，在本实施例中再次发现了实施例6中描述的A105突变，但是这次不与任何其他突变相关联。

这些3氨基酸突变提高了异二聚体针对rosa1靶标的活性(图10)。具有G19S突变时该效果特别显著。通过比较异二聚体针对rosa1靶标的活性而最好地展示了引入G19S突变所导致的改进，所述异二聚体是通过在酵母中共表达突变体m14与MO_1或MO_2(图9)以及突变体mO_2与MO_2(图10)形成的。因此，G19S突变本身似乎足以提高活性。

表VII：用于随机诱变的实施例1所述I-CreI突变体和实施例5中所述精细化突变体。

实施例1中所述原始突变体	实施例5中所述精制突变体
实施例1中所述原始突变体	实施例5中所述精制突变体	m2：VYRSNI
m6：VYYSYR		m2：VYRSNI
m6：VYYSYR		m8：VYRSNV	mO_1：VYRSNV+G19S
m12：VYNSRI		m8：VYRSNV	mO_1：VYRSNV+G19S
m12：VYNSRI		m13：VYSSRI	mO_3：VYSSRI+V105AmO_4：VYSSRI+S79G
m14：VYRSQI	mO_2：VYRSQI+G19S	m13：VYSSRI	mO_3：VYSSRI+V105AmO_4：VYSSRI+S79G
m14：VYRSQI	mO_2：VYRSQI+G19S	m17：VYRSYT

标出了24、44、68、70、75和77位的氨基酸(例如：VYRSYI代表V24、Y44、R68、S70、Y75和I77)。

^＊由随机诱变造成的突变为黑体。

实施例6：增强异二聚体针对rosa1靶标之活性、消除同二聚体针对rosa1.3回文靶标之活性的G19S突变。

在实施例5中鉴定了I-CreI精细化突变体，所述I-CreI精细化突变体在酵母中共表达形成异二聚体时能够有效切割rosa1靶标(图10)。实施例5显示，在异二聚体的组件之一中添加的G19S增强了其对rosa1靶标的活性(表VI、表VII、图9和图10)。该实施例显示，G19S突变消除了同二聚体对回文rosa1.3靶标的活性。

1)材料和方法

实验步骤如实施例1中所述。

2)结果

现在针对回文rosa1.3靶标，以同二聚体对酵母中表达的实施例5所述精细化I-CreI突变体进行筛选(图11)。带有突变V105A或S79G的突变体mO_3和mO_4作为同二聚体对rosa1.3靶标有活性。相反，带有G19S突变的突变体mO_1和mO_2作为同二聚体对rosa1.3回文靶标无活性。因为有效切割rosa1.3靶标的VYRSNV和VYRSQI突变体(见实施例1)与mO_1和m0_2各自的区别仅在于19位的G，所以这些结果显示，G19S突变足以显著破坏同二聚体蛋白质的活性。这些结果与mO_1和mO_2与其他蛋白质形成异二聚体时G19S位的效果相反，在上述情况下导致活性的提高(实施例5)。通过该步骤无法确定该活性丧失是否由该同二聚体形成、结合或切割中的缺陷导致。然而，19位是催化位点的一部分(Chevalier等，Biochemistry，2004，43，14015-14026)，并且Gly19与相邻的Asp20一起参与金属阳离子结合，这提示对切割步骤的直接影响。

除了效力问题以外，特异性对许多应用而言是另一重要特性，特别是对治疗性应用而言。因此，G19S突变会有力地提高特异性，所述突变消除或强烈降低带有该替换的同二聚体的活性。因为这一突变还在仅具有一个这类替换的异二聚体中提高活性，所以其将证明是改造具有更好一般特性的大范围核酸酶的珍贵工具，前提是这一突变将该特性赋予任何或至少若干来自I-CreI的大范围核酸酶，而不是仅赋予本实施例中所列的大范围核酸酶。

实施例7：产生切割B2M11.2的大范围核酸酶

本实施例显示，I-CreI突变体能够切割来自B2M11靶标左侧部分之回文形式的B2M11.2DNA靶序列(图12)。

本实施例中描述的靶序列是22bp回文序列。因此，仅以前11个核苷酸描述它们，随后是后缀_P。例如，靶标B2M11.2还被记为tgaaattaggt_P(SEQ ID NO：25)。

B2M11.2在±1、±2、±3、±4、±5和±7位与5TAG_P相似，并在±1、±2、±7、±8、±9和±10位与10GAA_P相似。推测位置±6和±11对结合和切割活性几乎没有影响。先前通过在44、68、70、75和77位诱变I-CreI N75获得了能够切割5TAG_P target(caaaactaggt_P；SEQ ID NO：22)的突变体(Arnould等，J.Mol.Biol.，2006，355，443-458以及国际PCT申请WO2006/097784和WO 2006/097853)。如先前在Smith等，Nucleic AcidsResearch，2006，34，e149中所述，通过在28、30、32、33、38、40位上诱变I-CreI N75和D75获得了能够切割10GAA_P靶标(cgaaacgtcgt_P；SEQID NO：20)的突变体。因此，组合这样的突变体对会允许切割B2M11.2靶标。

因此，为了检验组合的突变体是否能够切割B2M11.2靶标，将来自切割5TAG_P(caaaactaggt_P；SEQ ID NO：22)的蛋白质中44、68、70和77位的突变和来自切割10GAA_P(cgaaacgtcgt_P；SEQ ID NO：20)的蛋白质中28、30、32、33、38和40位突变组合。

1)材料和方法

a)构建靶标载体

如实施例1中所述使用下述寡核苷酸克隆靶标：5’tggcatacaagttttgttctcaggtacctgagaacaacaatcgtctgtca 3’(SEQ ID NO：27)，对应于从PROLIGO订购的侧翼是gateway克隆序列的靶序列。

b)构建组合突变体

在Smith等，Nucleic Acids Res.2006，34，e149；国际PCT申请WO2007/049156和Arnould等，J.Mol.Biol.，2006，355，443-458；国际PCT申请WO 2006/097784和WO 2006/097853中分别针对10GAA_P或5TAG_P靶标鉴定了切割10GAA_P或5TAG_P的I-CreI突变体。如实施例2中所述通过分别的重叠PCR反应产生含有来自两个系列的突变的来自I-CreI的编码序列。

c)接合大范围核酸酶表达克隆并在酵母中筛选

实验步骤如实施例1中所述。

d)突变体测序

实验步骤如实施例1中所述。

2)结果

通过在I-CreI N75或D75骨架上结合44、68、70、75和77位的突变和28、30、33、38和40位突变，构建I-CreI组合突变体，得到复杂度2014的文库。组合的例子展示于表VIII中。将这些文库转化进酵母中，并针对对B2M11.2DNA靶标(tgaaattaggt_P；SEQ ID NO：25)的切割筛选了4464个克隆(复杂度的2.2倍)。发现两个阳性克隆具有非常低的活性水平，其在测序和通过二次筛选验证后显示对应于两种不同的内切核酸酶(见表VIII)。阳性结果显示于图13中。

表VIII：组合变体对B2M11.2靶标的切割

^＊仅展示了2014个组合中的176个。

+表示在鉴定的阳性结果中发现了功能性突变体。

实施例8：通过随机诱变切割B2M11.2的大范围核酸酶来产生更高效地切割B2M11.2的大范围核酸酶。

通过装配切割回文10GAA_P和5TAG_P靶标的突变体来鉴定切割回文B2M11.2靶标的I-CreI突变体(实施例7)。然而，这些组合中仅有两个能够切割B2M11.2并且效率非常低。

因此，随机诱变切割B2M11.2的2个蛋白质组合，并筛选更高效地切割B2M11.2的变体。根据与其靶标结合的I-CreI蛋白质的结构，I-CreI蛋白质中用于第一组合方法的残基(28、30、32、33、38和40与44、68、70、75和77)之间不接触(Chevalier，B.S.和B.L.Stoddard，Nucleic AcidsRes.2001，29，3757-3774；Chevalier等，Nat.Struct.Biol.2001，8，312-316，Chevalier等，J.Mol.Biol.，2003，329，253-269)。因此，难以推理性地选择一组位置来诱变，在蛋白质的C端部分(最后83个氨基酸)或整个蛋白质上进行了诱变。

1)材料和方法

实验步骤如实施例5中所述。

2)结果

将切割B2M11.2的两个突变体(I-CreI 32G33H44A68Y70S75Y77K和I-CreI 32A33H44A68Y70S75Y77K，根据表VIII的命名法也称作KNGHQS/AYSYK和KNAHQS/AYSYK)合并，随机诱变并转化进酵母中。然后将4464个转化克隆与在报告质粒中含有B2M11.2靶标的酵母菌株接合。发现32个克隆在与该酵母菌株接合时引发B2M11.2靶标的切割，对应于至少14种不同的新内切核酸酶(见表IX)。阳性结果的例子展示于图14中。

表IX：针对B2M11.2靶标优化的突变体

优化的突变体B2M11.2^*	B2M11.2靶标
优化的突变体B2M11.2^*	B2M11.2靶标	I-CreI 32A33H44A68Y70S75Y77K/2Y53RI-CreI 32A33H44A68Y70S75Y77K/2Y53R66CI-CreI 32A33H44A68Y70S75Y77K/132VI-CreI 32G33H44A68Y70S75Y77K/2/96R105AI-CreI 32G33H44A68Y70S75Y77K/120GI-CreI 32A33H44A68Y70S75Y77K/43L105A159RI-CreI 32G33H44A68Y70S75Y77K/50RI-CreI 32G33H44A68Y70S75Y77K/49A50RI-CreI 32G33H44A68Y70S75Y77K/81V129A154GI-CreI 32G33H44A68Y70S75Y77K/129A161PI-CreI 32G33H44A68Y70S75Y77K/117GI-CreI 32G33H44A68Y70S75Y77K/81TI-CreI 32G33H44A68Y70S75Y77K/103T	++++++++++

+标明B2M11.2靶标的切割

＊通过随机诱变产生的突变为黑体。

实施例9：产生切割B2M11.3的大范围核酸酶

本实施例显示，I-CreI突变体能够切割来自B2M11.1靶标右侧部分的回文形式的B2M11.3DNA靶序列(图12)。本实施例中描述的所有靶序列是22bp回文序列。因此，仅以前11个核苷酸描述它们，随后是后缀P。例如，靶标B2M11.3还被记为tctgactttgt_P；SEQ ID NO：26。

B2M11.3在±1、±2、±3、±4、±5、±6和±7位与5TTT_P相似，并在±1、±2、±6、±7、±8、±9和±10位与10CTG_P相似。推测位置±11对结合和切割活性几乎没有影响。先前通过在44、68、70、75和77位诱变I-CreIN75获得了能够切割5TTT_P靶标(caaaactttgt_P；SEQ ID NO：23)的突变体(Arnould等，J.Mol.Biol.2006，355，443-458和国际PCT申请WO2006/097784，WO 2006/097853)。如Smith等，Nucleic Acids Res.，2006，34，e149中所述，通过在28、30、32、33、38、40和70位上诱变I-CreI N75和D75获得了能够切割10CTG_P靶标(cctgacgtcgt_P；SEQ ID NO：21)的突变体。因此，组合这样的突变体对会允许切割B2M11.3靶标。

两组蛋白质均在70位上被突变。然而，先前证明I-CreI中存在两个可分离的功能性结构域(Smith等，Nucleic Acids Res.，2006，34，e149)。这意味着，该位置对针对靶标碱基±10到8位的特异性几乎没有影响。因此，为了检验组合的突变体是否能够切割B2M11.3靶标，将来自切割5TTT_P(caaaactttgt_P；SEQ ID NO：23)的蛋白质中44、68、70、75和77位的突变与来自切割10CTG_P(cctgacgtcgt_P；SEQ ID NO：21)的蛋白质中的28、30、32、33、38、40突变相组合。

1)材料和方法

构建组合突变体

Smith等，Nucleic Acids Res.，2006，34，e149；国际PCT申请WO2007/049156，and Arnould等，J.Mol.Biol.，2006，355，443-458；国际PCT申请WO 2006/097784和WO 2006/097853中分别针对10GAA_P或5TAG_P靶标鉴定了切割10GAA_P或5TAG_P的I-CreI突变体。如实施例2中所述通过分别的重叠PCR反应，产生含有来自两个系列的突变的来自I-CreI的编码序列，只是克隆在通过DraIII和NgoMIV消化而线性化的酵母表达载体pCLS1107(Kan^R；图7)中进行。

2)结果

通过在I-CreI N75或D75骨架上将44、68、70、75和77位的突变与28、30、33、38和40位突变相组合，构建I-CreI组合突变体，得到复杂度1600的文库。组合突变体的例子展示于表X中。将该文库转化进酵母中，并针对对B2M11.3DNA靶标(tctgactttgt_P；SEQ ID NO：26)的切割筛选了3348个克隆(复杂度的2.1倍)。发现一个阳性克隆，其在测序和通过二次筛选验证后显示对应于新的内切核酸酶(见表X)。该阳性结果对B2M11.3靶标的切割显示于图15中。

表X：组合突变体对B2M11.3靶标的切割^＊

^＊仅展示了1600个组合中的240个。

+表示组合突变体对B2M11.3靶标的切割。

实施例10：通过共表达与切割B2M11.3的蛋白质装配在一起的切割B2M11.2的大范围核酸酶来产生切割B2M11的大范围核酸酶

在实施例7、8和9中鉴定了能够切割每个来自回文B2M11的靶标(B2M11.2和B2M11.3)的I-CreI突变体。将这样的突变体对(一个切割B2M11.2，一个切割B2M11.3)在酵母中共表达。共表达后，应当存在三种活性分子种类：两种同二聚体和一种异二聚体。测试应当形成的异二聚体是否切割B2M11靶标。

1)材料和方法

a)将pCLS0542中的优化突变体克隆进B2M11靶标酵母中

使用高效LiAc转化方案，用带有LEU2基因标记的pCLS0542载体(图4)中切割B2M11.2靶标的优化突变体转化酵母菌株FYBL2-7B(MATa，ura3Δ851，trp1Δ63，leu2Δ1，lys2Δ202)，所述酵母菌株含有进入酵母报告载体(pCLS1055，图3)的B2M11靶标。将突变体靶标酵母作为靶标，用于如实施例1和3中所述针对切割B2M11.3的突变体(在用卡那霉素标记的pCLS1107载体中)的接合测定(图7)。

b)接合大范围核酸酶共表达克隆并在酵母中筛选

实验步骤如实施例3中所述。

2)结果：

切割B2M11.2与B2M11.3的突变体的共表达在大部分情况下导致B2M11靶标的切割(图16)。功能性组合概括与表XI中。

表XI：导致B2M11靶标切割的组合

突变体B2M11.3	优化的突变体B2M11.2	B2M11靶标切割
突变体B2M11.3	优化的突变体B2M11.2	B2M11靶标切割	I-CreIK28Q30S32G33C38S40Q44N68S70N75R77(KQSGCS/QNSNR)	I-CreI 28K30N32A33H38Q40S44A68Y70S75Y77K/2Y53R66CI-CreI 28K30N32A33H38Q40S44A68Y70S75Y77K/2Y53RI-CreI 28K30N32A33H38Q40S 44A68Y70S75Y77K/132VI-CreI 28K30N32G33H38Q40S 44A68Y70S75Y77K/2I96R105AI-CreI 28K30N32G33H38Q40S 44A68Y70S75Y77K/120GI-CreI 28K30N32A33H38Q40S 44A68Y70S75Y77K/43L105A159RI-CreI 28K30N32G33H38Q40S 44A68Y70S75Y77K/50RI-CreI 28K30N32G33H38Q40S 44A68Y70S75Y77K/49A50RI-CreI 28K30N32G33H38Q40S 44A68Y70S75Y77K/81V129A154GI-CreI 28K30N32G33H38Q40S44A68Y70S75Y77K/129A161PI-CreI 28K30N32G33H38Q40S 44A68Y70S75Y77K/117GI-CreI 28K30N32G33H38Q40S 44A68Y70S75Y77K/81TI-CreI 28K30N32G33H38Q40S 44A68Y70S75Y77K/103T	+++++

+表示异二聚体突变体切割B2M11靶标

^＊通过随机诱变产生的突变为黑体

实施例11：通过随机诱变切割B2M11.3的大范围核酸酶并与切割B2M11.2的蛋白质共表达，产生更高效地切割B2M11的大范围核酸酶

通过共表达切割回文B2M11.2和B2M11.3靶标的突变体来鉴定切割回文B2M11靶标的I-CreI突变体(实施例7、8、9和10)。然而，能够切割B2M11的阳性组合的效率和数量很小。

因此，随机诱变切割B2M11.3的蛋白质，并筛选在与针对B2M11.2优化的突变体组合时更高效地切割B2M11的变体。根据与其靶标结合的I-CreI蛋白质的结构，I-CreI蛋白质中用于第一组合方法的残基(28、30、32、33、38和40与44、68、70、75和77)之间不发生接触(Chevalier，B.S.and B.L.Stoddard B L，Nucleic Acids Res.，2001，29，3757-3774；Chevalier等，Nat.Struct.Biol.2001，8，312-316；Chevalier等，J.Mol.Biol.2003，329，253-269)。因此，难以推理性地选择一组位置来诱变，在蛋白质的C端部分(最后83个氨基酸)或整个蛋白质上进行诱变。

1)材料和方法

如实施例4中所述进行随机诱变。制备突变体靶标酵母，并作为靶标用于实施例10中所述的接合测定。

2)结果

随机诱变切割B2M11.3的突变体(I-CreI30Q33G38C68N70S75N77R，根据表XI的命名法也称作KQSGCS/QNSNR)，并转化进酵母中。然后将6696个转化克隆与选自如实施例8中所述的酵母菌株接合，所述酵母菌株(i)在报告质粒中含有B2M11靶标(ii)表达切割B2M11.2靶标的优化变体。使用两个这样的菌株，其表达I-CreI 32A33H44A68Y70S75Y77K/132V突变体或I-CreI32G33H44A68Y70S75Y77K/2I96R105A突变体(见表XII)。发现101个克隆在与这样的酵母菌株接合时引发B2M11靶标的切割。在一个对照实验中，发现不与KQSGCS/QNSNR蛋白质共表达时这些克隆均不引发B2M11的切割。我们的结论是，101个阳性结果中含有在与KQSGCS/QNSNR形成异二聚体时能够切割B2M11的蛋白质。这样的异二聚体突变体的例子列于表XII中。这些阳性结果对B2M11靶标的切割的例子展示于图17中。

图XII：导致切割B2M11靶标的组合

优化的突变体B2M11.2^＊	优化的突变体B2M11.3^＊	B2M11靶标切割
优化的突变体B2M11.2^＊	优化的突变体B2M11.3^＊	B2M11靶标切割	I-CreI32G33H44A68Y70S75Y77K/2I96R105A或I-CreI32A33H44A68Y70S75Y77K/132V或I-CreI32A33H44A68Y70S75Y77K/2Y53R66C或I-CreI32G33H44A68Y70S75Y77K/120G	I-CreI 30Q33G38C68N70S77R/19S72FI-CreI 30Q33G38C68N70S77R/31L83Q87LI-CreI 30Q33G38C68N70S77R/43L117GI-CreI 30Q33G38C68N70S77R/49AI-CreI 30Q33G38C68N70S77R/50R107RI-CreI 30Q33G38C68N70S77R/54LI-CreI 30Q33G38C68N70S77R/56EI-CreI 30Q33G38C68N70S77R/57NI-CreI 30Q33G38C68N70S77R/59A60E163LI-CreI 30Q33G38C68N70S77R/60G100R155Q165TI-CreI 30Q33G38C68N70S77R/60NI-CreI 30Q33G38C68N70S77R/64AI-CreI 30Q33G38C68N70S77R/64D69GI-CreI 30Q33G38C68N70S77R/69E82EI-CreI 30Q33G38C68N70S77R/69GI-CreI 30Q33G38C68N70S77R/72P154GI-CreI 30Q33G38C68N70S77R/73II-CreI 30Q33G38C68N70S77R/73I156NI-CreI 30Q33G38C68N70S77R/103SI-CreI 30Q33G38C68N70S77R/103S147NI-CreI 30Q33G38C68N70S77R/105AI-CreI 30Q33G38C68N70S77R/110DI-CreI 30Q33G38C68N70S77R/110G153VI-CreI 30Q33G38C68N70S77R/111LI-CreI 30Q33G38C68N70S77R/142R161PI-CreI 30Q33G38C68N70S77R/153GI-CreI 30Q33G38C68N70S77R/153VI-CreI 30Q33G38C68N70S77R/156NI-CreI 30Q33G38C68N70S77R/156RI-CreI 30Q33G38C68N70S77R/157VI-CreI 30Q33G38C68N70S77R/158NI-CreI 30Q33G38C68N70S77R/80G94YI-CreI 30Q33G38C68N70S77R/81T83A117GI-CreI 30Q33G38C68N70S77R/81V159QI-CreI 30Q33G38C68N70S77R/82E107RI-CreI 30Q33G38C68N70S77R/85RI-CreI 30Q33G38C68N70S77R/87LI-CreI 30Q33G38C68N70S77R/92L135P142R164G165PI-CreI 30Q33G38C68N70S77R/96RI-CreI 30Q33G38C68Y70S77R/72T140MI-CreI 30Q33G38S68N70S77R	++++++++++++++++++++++++++++++++++++++++

+表示异二聚体变体切割B2M11靶标。

^＊由随机诱变导致的突变为黑体。

在改进的突变体中发现了若干不同的突变，其中G19S和V105A突变在前文描述。V105A突变不与任何其他的额外突变结合，表明其足以改进I-CreI 30Q33G38C68N70S77R蛋白质的活性。在实施例5中已经观察到，V105A突变足以改进切割rosa1靶标的完全不同的异二聚体的活性。因此，V105A突变发挥“便携式”基序的作用，其自身即能够增强不同I-CreI衍生物的活性。

实施例12：通过随机诱变切割B2M11.3的大范围核酸酶、与切割B2M11.2的蛋白质共表达和在CHO细胞中筛选，产生更高效地切割B2M11.2的大范围核酸酶

通过在酵母中的共表达切割回文B2M11.2和B2M11.3靶标的突变体(优化或未优化的)，鉴定更高效地切割回文B2M11靶标的I-CreI突变体(实施例11)。然而，在哺乳动物细胞中发挥功能的异二聚体是非常有用的，并且使用染色体外测定法得到的能够在哺乳动物细胞中切割B2M11的阳性组合的效率和数量可能与酵母细胞中不同。

因此，如实施例11中所述对切割B2M11.2的最佳蛋白质进行诱变，并且筛选在与针对B2M11.3优化的突变体相组合时以良好的效率切割B2M11的变体。根据与其靶标结合的I-CreI蛋白质的结构，I-CreI蛋白质中用于第一组合方法的残基(28、30、32、33、38和40与44、68、70、75和77)之间不发生接触(Chevalier B.S.和B.L.Stoddard，Nucleic AcidsRes.2001，29，3757-74；Chevalier等，Nat.Struct.Biol.2001，8，312-316；Chevalier等，J.Mol.Biol.2003，329，253-269)。因此，难以推理性地选择一组位置来诱变，在蛋白质的C端部分(最后83个氨基酸)或整个蛋白质上进行诱变。

1)材料和方法

a)通过随机诱变构建文库

如JBS dNTP-诱变试剂盒中JENA BIOSCIENCE GmbH的方案所述，通过PCR在两步式PCR方法中以选择的突变体库为基础创建随机诱变文库，所述PCR使用Mn²⁺或作为8-氧代-dGTP和dPTP的dNTP衍生物。使用的引物是：attB1-ICreIFor(5’-ggggacaagtttgtacaaaaaagcaggcttcgaaggagatagaaccatggccaataccaaatataacaaagagttcc-3’；SEQ ID NO：28)和attB2-ICreIRev(5’-ggggaccactttgtacaagaaagctgggtttagtcggccgccggggaggatttcttcttctcgc-3’；SEQ ID NO：29)。将获得的PCR产物体外克隆进来自INVITROGEN(pCLS1069，图18)的CHO Gateway表达载体pCDNA6.2中。同时，将用于文库的选定突变体以相同方式克隆在该载体中。通过测序(MILLEGEN)验证所克隆的突变体和阳性结果的文库克隆。

b)在用于CHO筛选的载体中构建B2M11靶标

通过两步式PCR从酵母靶标载体(如实施例1中所述)中扩增B2M11靶标，所述两步式PCR使用引物M1s(5’-aaaaagcaggctgattggcatacaagtt-3’；SEQ ID NO：30)和M2s(5’-agaaagctgggtgattgacagacgattg-3’；SEQ ID NO：31)，之后使用attB1adapbis(5’-ggggacaagtttgtacaaaaaagca-3’；SEQ ID NO：32)和attB2adapbis(5’-ggggaccactttgtacaagaaagct-3’；SEQ ID NO：33)。引物来自Proligo。使用Gateway方案(INVITROGEN)将最终的PCR克隆进CHO报告载体(pCLS1058，图19)中。通过测序(MILLEGEN)验证所克隆的靶标。

c)哺乳动物细胞中的染色体外测定

根据供应商(QIAGEN)的方案，用Polyfect转染试剂转染CHO细胞。每个测定中，用两种突变体各12.5ng(12.5ng切割回文B2M11.2靶标的突变体，和12.5ng切割回文B2M11.3靶标的突变体)共转染150ng靶标载体。转染后72小时去除培养基，并添加150μl裂解/暴露缓冲液用于β-半乳糖苷酶液体测定(1升缓冲液含有：100ml裂解缓冲液(Tris-HCl 10mM pH 7.5、NaCl 150mM、Triton X1000.1％、BSA 0.1mg/ml、蛋白酶抑制剂)，10ml Mg 100X缓冲液(MgCl₂ 100mM、β-巯基乙醇35％)，110ml ONPG 8mg/ml和780ml磷酸钠0.1M pH 7.5)。在37℃下孵育后，在420nm处测量光吸收。整个过程在自动化的Velocity11 BioCel平台上进行。

2)结果

将切割B2M11.2的优化突变体(如表XII中所述，I-CreI32G33H44A68Y70S75Y77K/120G、32A33H44A68Y70S75Y77K/2Y53R66C、32G33H44A68Y70S75Y77K/2I96R105A和32A33H44A68Y70S75Y77K/132V)随机诱变并转化进Gateway载体(图15)中。纯化了1920个转化克隆的DNA质粒，然后与CHO B2M11靶标载体和切割B2M11.3靶标的优化变体(选自实施例11所述变体)共转染。发现六十个克隆引发B2M11靶标的切割。

在对照实验中，发现这些克隆在不与切割B2M11.3靶标的优化变体共转染时均不引发B2M11切割。因此结论是，60个阳性结果中含有在与切割B2M11.3靶标的优化变体形成异二聚体时能够切割B2M11的蛋白质。这样的异二聚体突变体的例子列于表XIII中，将观察到的切割活性作为β-半乳糖苷酶活性的度量。再次发现了突变G19S和V105A，其为单独的(V105A)或与其他突变组合(G19S)。

表XIII：导致B2M11靶标切割的功能性突变体组合^＊

^＊数值是CHO细胞中染色体外测定的实验结果平均值(吸光度单位)。

实施例13：通过导致19位甘氨酸替换成丝氨酸(G19S)的定点诱变来精细化切割HprCH3靶位点的大范围核酸酶。

为了进一步确认G19S替换提高来自I-CreI的大范围核酸酶切割活性的能力，将该突变掺入切割22bp(非回文)靶序列HprCH3(tcgagatgtcatgaaagagatgga；SEQ ID NO：34)的异二聚体HprCH3.3(KNSHQS/QRRDI/42A43L)/HprCH34(KNTHQS/RYSNN/72T)中两种蛋白质的每一种中。HprCH3靶序列位于Criteculus griseus(中国仓鼠)HPRT基因的外显子3(17到38位)中。

为了评价原始的和G19S衍生突变体的切割活性，使用CHO细胞中的染色体报告系统(图20)。在该系统中，CMV启动子驱动的单拷贝LacZ基因被HprCH3位点中断，因此是非功能性的。用HprCH3.3/HprCH3.4的CHO表达质粒和LacZ修复质粒转染细胞系，这允许通过同源重组恢复功能性LacZ基因。先前已显示，双链断裂能够诱导同源重组；因此LacZ基因的修复频率指示了基因组HprCH3靶位点的切割效率。

1)材料和方法

a)定点诱变

为了向HprCH3.3和HprCH3.4编码序列中引入G19S替换，进行扩增I-CreI编码序列5′端(1-24位残基)或3′端(14-167位残基)的两个分别的重叠PCR反应。对5′和3′两端而言，PCR都使用下述引物进行：与载体具有同源性的引物CCM2For 5’-aagcagagctctctggctaactagagaacccactgcttactggcttatcgaccatggccaataccaaatataacaaagagttcc-3’(SEQ ID NO 35)或CCMRev 5’-tctgatcgattcaagtcagtgtctctctagatagcgagtcggccgccggggaggatttcttcttctcgc-3’SEQ ID NO 36)以及就含有替换突变G19S的14-24位氨基酸而言对I-CreI编码序列具有特异性的引物

G19SF 5’-gccggctttgtggactctgacggtagcatcatc-3’(SEQ ID NO 37)或

G19SR 5’-gatgatgctaccgtcagagtccacaaagccggc-3’(SEQ ID NO 38)。

得到的PCR产物彼此具有33bp的同源性。随后使用两种片段每一种的等分试样以及CCM2For和CCMRev引物，通过PCR装配片段。

b)在CHO表达载体中克隆突变体

将用SacI-XbaI消化的PCR产物克隆进质粒pCLS1088(图21)中相应的SacI-XbaI位点中，所述质粒是含有I-CreI N75编码序列的CHOgateway表达载体pCDNA6.2(INVITROGEN)。通过测序(MILLEGEN)验证HprCH3.3-G19S或HprCH3.4-G19S编码序列对I-CreI N75编码序列的替换。

c)哺乳动物细胞中的染色体测定

将带有报告系统的CHO细胞系以每10cm平皿2×10⁵个细胞接种于完全培养基中(Kaighn’s改良的F-12培养基(F12-K)，补充有2mM L-谷氨酰胺、青霉素(100UI/ml)、链霉素(100μg/ml)、两性霉素B(Fongizone)(0.25μg/ml)(INVITROGEN-LIFE SCIENCE)和10％FBS(SIGMA-ALDRICH CHIMIE))。第二天，用Polyfect转染试剂(QIAGEN)转染细胞。简言之，将2μg的lacz修复基质载体与不同量的大范围核酸酶表达载体共转染。在37℃孵育72小时后，将细胞在0.5％戊二醛中于4℃下固定10分钟，在含0.02％NP40的100mM磷酸盐缓冲液中洗涤两次，并用以下的染色缓冲液(10mM磷酸盐缓冲液、1mM MgCl₂、33mM K六氰基铁(III)、33mM K六氰基铁(II)、0.1％(v/v)X-Gal)染色。之后在37℃下孵育过夜，在光学显微镜下检查平板，并计数LacZ阳性细胞克隆的数量。LacZ修复的频率表述为LacZ+灶点数除以转染细胞数(5×10⁵)，并针对转染效率校准。

2)结果

使用染色体测定法，在含有HprCH3靶标的CHO细胞系中测试异二聚体的活性，所述异二聚体含有两种原始突变体(HprCH3.3/HprCH3.4)，或者含有两种G19S衍生突变体之一与相应原始突变体的组合(HprCH3.3/HprCh3.4G19S或HprCH3.3G19S/HprCh3.4)。该染色体测定法详尽地描述于最近的出版物(Arnoul等，J.Mol.Biol.Epub May 10，2007)中。简言之，首先产生带有单拷贝转基因的CHO细胞。该转基因含有I-SceI切割位点上游的人EF1α启动子(图20，步骤1)。其次，使用I-SceI大范围核酸酶在该基因座上引发DSB诱导的同源重组，并插入具有新大范围核酸酶切割位点的5.5kb盒(图20，步骤2)。该盒含有由CMV启动子驱动的非功能性LacZ开放读码框以及无启动子的潮霉素标记基因。通过含有待测试大范围核酸酶切割位点(此处为rosa1切割位点)的50bp插入而使LacZ基因本身失活。该细胞系随后可用于使用切割rosa1靶标的经改造I-CreI衍生物来评价DSB诱导的基因靶向效率(LacZ修复)(图20，步骤3)。

将该细胞系与修复基质和不同量的表达大范围核酸酶的载体共转染。LacZ基因的修复频率从使用原始改造异二聚体(HprCH3.3/HprCH3.4)时的最高2.0×10^-3，提高至使用HprCH3.3-G19S衍生突变体时的最高1.15×10^-2和使用HprCH3.4-G19S衍生突变体时的最高1.2×10^-2(图22)。

这些发现证实，G19S突变当仅存在于单体之一中时，其自身能够增强异二聚体的活性。这些结果证实了在实施例5中获得的结果，其中单个G19S替换显示增强切割rosa1靶标的完全不同的异二聚体的活性。另外，在对B2M11靶标具有增强活性的若干蛋白质中发现了G19S，尽管其与其他突变组合(见实施例11和12)。因此，G19S突变发挥“便携式”基序的作用，其自身或者与其他突变组合时能够增强不同I-CreI衍生物的活性。

然而，在用修复基质转化HprCH3.3G19S/HprCH3.4G19S异二聚体时未检测到LacZ+灶点，表明重组频率低于6.0×10^-6。这些发现证实了实施例6中用切割rosa1靶标的大范围核酸酶观察到的结果：其中单个G19S替换增强了活性，而处于异二聚体每个单体中各有G19S替换则导致非常强的活性降低。

实施例14：通过引入单个G19S替换来改进切割RAG1.10DNA序列的大范围核酸酶

通过随机诱变I-CreI突变体来进行的若干优化过程显示，若干改进的突变体带有相同的突变G19S，这表示用丝氨酸替换19位的甘氨酸。该突变具有双重功能，因为其不仅改进异二聚体的活性，而且还消除带有G19S突变之同二聚体的活性，因此增强来自I-CreI的大范围核酸酶的特异性(见实施例5、6、11、12和13)。

因此，向切割RAG1.10.2靶标的KRSNQS/AYSDR突变体(下文记为M2)和切割RAG1.10.3靶标的NNSSRR/YRSQV突变体(下文记为M3)中引入G19S突变。然后如实施例12和13中所述，在哺乳动物细胞中的染色体外和染色体测定法中针对RAG1.10、RAG1.10.2和RAG1.10.3靶标测试这些新的蛋白质(图23)。

1)材料和方法

a)引入G19S突变

使用两组引物进行两个重叠PCR反应：针对第一片段的Gal10F(5’-gcaactttagtgctgacacatacagg-3’；SEQ ID NO 12)和G19SRev(5’-gatgatgctaccgtcagagtccacaaagccggc-3’，SEQ ID NO 38)，以及针对第二片段的G19SFor(5’-gccggctttgtggactctgacggtagcatcatc-3’，SEQ ID NO·37))和Gal10R(5’-acaaccttgattggagacttgacc-3’，SEQ ID NO 13)。使用高效LiAc转化方案(Gietz，R.D.and R.A.Woods；Methods Enzymol.2002，350，87-96)，使用约25ng的每种PCR片段和通过NcoI和EagI消化而线性化的75ng载体DNA(pCLS0542)转化酵母酿酒酵母菌株FYC2-6A(MATα，trp1Δ63，leu2Δ1，his3Δ200)。通过在酵母中体内同源重组来产生含有G19S突变的完整编码序列。

b)突变体测序

为了回收突变体表达质粒，使用标准方案提取酵母DNA并用于转化大肠杆菌。然后通过MILLEGEN SA对质粒进行突变体ORF的测序。

c)将RAG1.10G19S突变体克隆进哺乳动物表达载体中

通过PCR扩增每种突变体ORF，所述PCR使用引物CCM2For：(5’-aagcagagctctctggctaactagagaacccactgcttactggcttatcgaccatggccaataccaaatataacaaagagttcc-3’，SEQ ID NO·39)和CCMRevBis：(5’-ctgctctagattagtcggccgccggggaggatttctto-3’，SEQ ID NO 40)。

用限制性酶SacI和XbaI消化PCR片段，然后连接进也用SacI和XbaI消化的载体pCLS1088(图21)中。通过测序(MILLEGEN)验证得到的克隆。

d)将不同的RAG1.10靶标克隆进载体中以用于染色体外测定

如下克隆目的靶标：寡核苷酸从Proligo定购，其对应于侧翼是gateway克隆序列的靶序列。使用Gateway方案(INVITROGEN)，将通过单链寡核苷酸的PCR扩增而产生的双链靶标DNA克隆进CHO报告载体(pCLS1058，图19)中。

e)CHO细胞中的染色体外测定

见实施例12

f)CHO细胞中的染色体测定

见实施例13

2)结果

使用CHO细胞中的染色体外测定，监测带有G19S突变的M2和M3I-CreI突变体(M2G19S和M3G19S)针对各自的靶标RAG1.10.2和RAG1.10.3(图23)的活性。以纯同二聚体方式测试突变体，或者以共转染带有和不带有G19S突变的突变体的方式测试突变体，后者允许检测两种异二聚体M2/M2G19S和M3/M3G19S针对其各自的RAG1.10.2和RAG1.10.3靶标的活性(图24A)。然后针对RAG1.10靶标测试不同的异二聚体M2/M3、M2G19S/M3和M2/M3G19S(图24B)。如从图23A和23B中可以看出，观察到了G19S突变的两个方面。首先，该突变消除异二聚体(M2G19S和M3G19S)对其回文靶标的活性。其次，在M3突变体中引入G19S突变大幅提高了M3/M3G19S异二聚体对RAG1.10.3靶标的切割活性。该效果实际上无法在M2突变体中得到证实，因为它在该测定中已经以饱和水平切割RAG1.10.2靶标。这一评论也适用于RAG1.10靶标，它以饱和水平被M2/M3异二聚体以及M2G19S/M3和M2/M3G19S异二聚体切割。

然后在CHO细胞中的染色体测定中测试最后这三种异二聚体。使用的系统描述于实施例13和图20中，但是在本实施例中，在报告菌株中引入RAG1.10切割位点而不是rosa1，并且使用表达每种大范围核酸酶的0.1μg每种载体转染细胞。表XIV概括了实验结果。在两个单体之一(M2或M3)中引入G19S时，观察到基因靶向频率提高大于两倍。

表XIV：在用于转染带有单拷贝CMV-LacZ盒之CHO细胞系的异二聚体性质的作用下LacZ的修复频率，所述盒中LacZ基因被RAG1.10DNA序列中断。

异二聚体	LacZ修复频率
异二聚体	LacZ修复频率	M2/M3	2.4×10^-3
M2G19S/M3	5.8×10^-3	M2/M3	2.4×10^-3
M2G19S/M3	5.8×10^-3	M2/M3G19S	5.2×10^-3
M2G19S/M3G19S	0	M2/M3G19S	5.2×10^-3

这些结果证实了实施例5、6、11、12和13中所述数据，显示G19S是便携式基序，其能够提高若干完全不同的异二聚体I-CreI改造衍生物的活性。另外，它们还证实该突变消除功能性同二聚体的形成，如在实施例6和13中用不同的大范围核酸酶所观察到的一样。该作用完全归因于各个单体中G19S突变的存在，因为M3/M3 G19S不光是有功能的，而且甚至比M3/M3同二聚体活性更强。总之，本文所示的多个实施例将G19S定义为能够提高来自I-CreI的经改造大范围核酸酶之活性和特异性的便携式基序。

实施例15：通过引入K7E、E8K和G19S突变来产生RAG1.10专性异二聚体。

实施例6、13和14显示，G19S突变不仅提高异二聚体活性，而且几乎完全消除G19S同二聚体的活性。因此这是用于专性异二聚体设计中的一种工具。考虑上文在实施例14中所述的两种RAG1.10异二聚体(M2和M3)，将K7E突变引入M2 G19S和M3 G19S变体中，将E8K突变引入M2和M3变体中。然后使用实施例12中描述的CHO染色体外测定法，针对三种RAG1.10靶标监测两种异二聚体M2 K7E，G19S/M3 E8K和M2E8K/M3 K7E，G19S的活性。

1)材料和方法

a)引入K7E和E8K突变

来自I-CreI的突变体M2和M3已被克隆进pCLS1088哺乳动物表达载体中(图21)。使用对M2和M3突变体DNA进行的两个重叠PCR反应引入每种突变。对K7E突变而言，第一PCR反应使用引物CMVFor(5’-cgcaaatgggcggtaggcgtg-3’；SEQ ID NO 53)和K7ERev(5’-gtacagcaggaactcttcgttatatttggtattgg-3’，SEQ ID NO 54)进行，第二反应使用引物K7EFor(5’-aataccaaatataacgaagagttcctgctgtacc-3’，SEQ ID NO 55)和V5epitopeRev(5’-cgtagaatcgagaccgaggagagg-3’，SEQ ID NO 56)进行。将两种PCR片段凝胶纯化，混合，并使用CMVFor和V5epitopeRev引物进行第三装配PCR。获得的PCR片段含有带有K7E突变的I-CreI突变体开放读码框。然后纯化PCR片段，用限制性酶SacI和XbaI消化，并连接进也通过SacI和XbaI消化的pCLS1088(图21)中。通过测序(MILLEGEN)验证得到的克隆M2K7E或M3K7E。

使用除两种引物E8KRev(5’-caggtacagcaggaactttttgttatatttgg-3’；SEQ ID NO：57)和E8KFor(5’accaaatataacaaaaagttcctgctgtacctgg-3’，SEQ ID NO.58)之外均完全相同的方案进行M2和M3突变体中E8K突变的引入。

b)引入G19S突变

使用对突变体DNA进行的两个重叠PCR反应引入G19S突变。第一PCR反应使用引物CMVFor(5’-cgcaaatgggcggtaggcgtg-3’，SEQ ID NO 53)和G19SRev(5’-gatgatgctaccgtcagagtccacaaagccggc-3’；SEQ ID NO 59)进行，第二反应使用引物G19SFor(5’-gccggctttgtggactctgacggtagcatcatc-3’，SEQ ID NO 60)和V5epitopeRev(5’-cgtagaatcgagaccgaggagagg-3’，SEQ ID NO 56)进行。将两种PCR片段凝胶纯化，混合，并使用CMVFor和V5epitopeRev引物进行第三装配PCR。获得的PCR片段含有带有G19S突变的I-CreI突变体的开放读码框。然后纯化PCR片段，用限制性酶SacI和XbaI消化，并连接进也通过SacI和XbaI消化的pCLS1088中。通过测序(MILLEGEN)验证得到的克隆M2K7E，G19S和M3K7E，G19S。

2)结果

使用先前所述的染色体外测定法(实施例12)，在CHO细胞中将两种异二聚体M2 K7E，G19S/M3 E8K(Het1)和M2 E8K/M3 K7E，G19S(Het2)对三种RAG1.10靶标的活性与原始M2/M3异二聚体的活性相比。图25显示，两种异二聚体Het1和Het2表现为专性异二聚体，因为同二聚体活性已被降至几乎检测不到的水平。另外，Het1和Het2对RAG1.10靶标具有与原始M2/M3异二聚体相同的活性水平。因此，K7E/E8K和G19S突变可用于有力地促进形成功能性异二聚体，而不是功能性同二聚体。

实施例16：K7E、E8K和G19S突变在单链分子设计中的用途

为了进一步验证G19S和K7E/E8K改进大范围核酸酶特异性的用途，将这些突变引入能够切割C1靶标(cgagatgtcacacagaggtacg；SEQ ID NO：61)的单链分子中，所述C1靶标是存在于人着色性干皮病(XPC)基因中的DNA序列。先前已描述了改造能够切割C1靶标的来自I-CreI的突变体(Arnould等，J.Mol.Biol.，EDub 10May 2007；国际PCT申请WO 2007/093836andWO 2007/093918)。单链构建体是X2-L1-H33，其中X2是能够切割回文C4靶标的来自I-CreI Y33H、Q38A、S40Q、Q44K、R68Q、R70S和D75N的突变体，H33是切割回文C3靶标的I-CreI Y33H突变体，L1是将X2突变体C端与H33突变体N端连接的22个氨基酸的连接子(-AA(GGGGS)4-；SEQ ID NO：68)。将K7E/E8K和G19S突变引入XPC单链分子中，产生两个新的单链分子SCX1和SCX2，分别为X2(K7E)-L1-H33(E8K，G19S)和X2(E8K)-L1-H33(K7E，G19S)。然后使用先前描述的酵母筛选测定法监测三种单链分子针对三种XPC靶标的活性。

1)材料和方法

a)将K7E、E8K和G19S突变引入XPC X2-L1-H33单链分子中

首先将G19S突变引入X2-L1-H33分子中。对克隆进pCLS0542酵母表达载体中的单链分子进行两个重叠PCR反应。第一PCR反应使用引物：Gal10F(5’-gcaactttagtgctgacacatacagg-3’；SEQ ID NO·12)和G19SRev60(5’-gcaatgatggagccatcagaatccacaaatccagc-3’，SEQ ID NO·62)，第二PCR反应使用引物G19SFor60(5’-gctggatttgtggattctgatggctccatcattgc-3’；SEQ ID NO：63)和Gal10R(5’-acaaccttgattggagacttgacc-3’，SEQ ID NO·13)。使用高效LiAc转化方案(Gietz RD和Woods R A Transformation of yeast by lithium acetate/single-strandedcarrier DNA/polyethylene glycol method.Methods Enzymol.2002；350：87-96)，使用约25ng每种PCR片段和通过NcoI和EagI消化而线性化的75ng载体DNA(pCLS0542)转化酿酒酵母菌株FYC2-6A(MATα，trp1Δ63，leu2Δ1，his3Δ200)。通过酵母中的体内同源重组产生含有G19S突变的完整编码序列。

在第二步骤中，通过进行三个重叠突变将K7E和E8K突变引入X2-L2-H33(G19S)分子中。对SCX1分子而言，3个PCR反应使用三个引物组，分别为：Gal10F和K7ERev

(5’-gtacagcaggaactcttcgttatatttggtattgg-3’，SEQ ID NO·54)，K7EFor

(5’-aataccaaatataacgaagagttcctgctgtacc-3’，SEQ ID NO 55)和E8KRevSC

(5’-aagatacagcaggaactttttgttagagccacc-3’，SEQ ID NO 64)，以及E8KForSc

(5’-ggtggctctaacaaaaagttcctgctgtatctt-3’，SEQ ID NO.65)和Gal10R。对SCX2分子而言，3个PCR反应使用三个引物组，分别为：Gal10F和E8KRev

(5’-caggtacagcaggaactttttgttatatttgg-3’，SEQ ID NO.57)，E8KFor

(5’-accaaatataacaaaaagttcctgctgtacctgg-3’，SEQ ID NO 58)和K7ERevSC

(5’-aagatacagcaggaactcttcgttagagccacc-3’SEQ ID NO 66)，以及K7EForSc

(5’-ggtggctctaacgaagagttcctgctgtatctt-3’，SEQ ID NO 67)和Gal10R。对两种构建体而言，使用高效LiAc转化方案(Gietz R D和Woods R A Transformation ofyeast by lithium acetate/single-stranded carrier DNA/polyethylene glycolmethod.Methods Enzymol.2002；350：87-96)，使用约25ng每种PCR片段和通过NcoI和EagI消化来线性化的75ng载体DNA(pCLS0542)转化酵母酿酒酵母菌株FYC2-6A(MATα，trp1Δ63，leu2Δ1，his3Δ200)。通过酵母中的体内同源重组产生SCX1或SCX2构建体的完整编码序列。

b)接合共表达大范围核酸酶的克隆并在酵母中筛选

使用菌落网格(QpixII，GENETIX)进行接合。使用低网格密度(约4个点/cm²)将突变体在覆盖YPD平板的尼龙滤膜上划网格。在相同的滤膜上进行第二次划网格的过程从而印上第二层，所述第二层对每个靶标而言由具有不同报告子的酵母菌株组成。将膜置于富含固体琼脂YPD的培养基上，并在30℃孵育一夜，以允许接合。接着，将滤膜转移至合成培养基上并在37℃孵育五天，以选择带有表达载体和靶标载体的二倍体，所述合成培养基缺乏亮氨酸和色氨酸，添加G418，并含有半乳糖(1％)作为碳源。5天后，将滤膜置于固体琼脂糖培养基上并在37℃孵育，以监测β-半乳糖苷酶活性，所述固体琼脂糖培养基在0.5M磷酸钠缓冲液pH 7.0中含有0.02％X-Gal、0.1％SDS、6％二甲基甲酰胺(DMF)、7mM β-巯基乙醇、1％琼脂糖。通过扫描分析结果，并使用合适的软件进行量化。

2)结果

图26展示了酵母筛选测定中三种单链分子X2-L1-H33、SCX1和SCX2针对三种XPC靶标的活性。原始单链分子具有针对C1和C3靶标的强切割活性，但是引入K7E/E8K和G19S突变以产生SCX1和SCX2分子促进了针对C1靶标的活性提高，并完全消除了针对C3靶标的切割活性。因此，在实施例15专性异二聚体设计中描述的突变K7E/E8K和G19S也可以成功地引入单链分子中，以改进其特异性而不影响其针对目的DNA靶标的切割活性。

实施例17：：通过引入单独或组合的V105A和I132V突变来改进切割HBB5DNA序列的大范围核酸酶

HBB5DNA序列(5’-ttggtctccttaaacctgtcttga-3’；SEQ ID NO：69)属于编码血红蛋白β-链的HBB基因。HBB5DNA序列位于HBB基因内含子1的开始处。将HBB5 DNA靶标分成两个半回文24bp DNA靶标，称为HBB5.3(5’-ttggtctcctgtacaggagaccaa-3’；SEQ ID NO.70)和HBB5.4(5’-tcaagacagggtaccctgtcttga-3’，SEQ ID NO 71)。通过在实施例1和2中详尽描述的半推理组合方法，我们能获得能够切割HBB5.3靶标的来自I-CreI的突变体。称作H3的该突变体与I-CreI野生型序列相比具有以下突变：30S33H38R44K68Y70S77T。使用与如实施例4中所示随机诱变产生的突变体优化相同的方法，获得了能够切割HBB5.4靶标的两种来自I-CreI的突变体。称作H4a和H4b的两种突变体与I-CreI野生型序列相比分别具有以下突变：19S32T44A70S75E77R80K96R和24V43L44A70S75E77R80K87L96R。随后突变体H3与H4a或H4b的酵母共表达导致异二聚体大范围核酸酶对HBB5DNA序列的切割。

为了评价多重优化突变对活性的影响，在H3突变体上引入单独或组合的突变V105A和I132V。然后在针对HBB5.1靶标的酵母重组测定法中用两种H4a和H4b配偶体测试获得的突变体。

1)材料和方法

a)引入V105A突变

使用两组引物对编码H3突变体的DNA进行两个重叠PCR反应：第一片段使用Gal10F(5’-gcaactttagtgctgacacatacagg-3’，SEQ ID NO 12))和V105ARev(5’-ttcgataattttcagagccaggtttgcctgttt-3’，SEQ ID NO 72)，第二片段使用V105AFor(5’-aaacaggcaaacctggctctgaaaattatcgaa-3’，SEQ ID NO·73)和Gal10R(5’-acaaccttgattggagacttgacc-3’，SEQ ID NO 13)。使用高效LiAc转化方案(Gietz，R.D.和R.A.Woods；Methods Enzymol.2002，350，87-96)，使用约25ng每种PCR片段和经NcoI和EagI消化而线性化的75ng载体DNA(pCLS0542)转化酵母酿酒酵母菌株FYC2-6A(MATα，trp1Δ63，leu2Δ1，his3Δ200)。通过在酵母中体内同源重组来产生含有V105A突变的完整编码序列。通过如实施例1中所述的测序来验证具有阳性结果的克隆。

b)引入I132V突变

使用两组引物对编码H3突变体的DNA进行两个重叠PCR反应：第一片段使用Gal10F(5’-gcaactttagtgctgacacatacagg-3’，SEQ ID NO 12)和I132VRev(5’-atcgttcagagctgcaacctgatccacccaggt-3’；SEQ ID NO·74)，第二片段使用I132VFor(5’acctgggtggatcaggttgcagctctgaacgat-3’，SEQ ID NO 75)和Gal10R(5’-acaaccttgattggagacttgacc-3’，SEQ ID NO 13)。使用高效LiAc转化方案(Gietz，R.D.and R.A.Woods；Methods Enzymol.2002，350，87-96)，使用约25ng每种PCR片段和经NcoI和EagI消化而线性化的75ng载体DNA(pCLS0542)转化酵母酿酒酵母菌株FYC2-6A(MATα，trp1Δ63，leu2Δ1，his3Δ200)。通过在酵母中体内同源重组来产生含有I132V突变的完整编码序列。通过对下述DNA进行这些相同的PCR反应获得双重突变体H3 V105 I132V，所述DNA编码带有V105突变的H3突变体。

c)突变体测序

2)结果

将三种来自H3的突变体(H3 V105A、H3 I132V和H3 V105A I132V)与H4a或H4b在酵母中共表达，并使用先前实施例(见实施例3)中已经描述的酵母重组测定法监测HBB5靶标的切割。表XV中所指数值与β-半乳糖苷酶活性直接相关，并因此与异二聚体HBB5大范围核酸酶的切割活性直接相关。

表XV：异二聚体大范围核酸酶对HBB5靶标的酵母切割，其中一个配偶体带有单独或组合的V105A和I132V突变

HBB5.3突变体	HBB5.4突变体	数值
HBB5.3突变体	HBB5.4突变体	数值	H3H3 V105AH3 I132VH3 V105A I132V	H4aH4aH4aH4a	0.340.470.490.77
H3H3 V105AH3 I132VH3 V105A I132V	H4bH4bH4bH4b	0.290.370.370.56	H3H3 V105AH3 I132VH3 V105A I132V	H4aH4aH4aH4a	0.340.470.490.77

在两种情况下(H4a或H4b)，在H3突变体上引入的突变V105A或I132V都提高了针对HBB5靶标的切割活性。同时引入两种突变时活性被进一步提高，显示它们可彼此独立地发挥作用。

序列表

<110>赛莱克蒂斯公司

<120>增强来自I-CreI的大范围核酸酶的切割活性的方法

<130>HLPcp1546/18

<160>75

<170>PatentIn version 3.3

<210>1

<211>163

<212>PRT

<213>莱茵衣藻

<400>1

Met Asn Thr Lys Tyr Asn Lys Glu Phe Leu Leu Tyr Leu Ala Gly Phe

1 5 10 15

Val Asp Gly Asp Gly Ser Ile Ile Ala Gln Ile Lys Pro Asn Gln Ser

20 25 30

Tyr Lys Phe Lys His Gln Leu Ser Leu Ala Phe Gln Val Thr Gln Lys

35 40 45

Thr Gln Arg Arg Trp Phe Leu Asp Lys Leu Val Asp Glu Ile Gly Val

50 55 60

Gly Tyr Val Arg Asp Arg Gly Ser Val Ser Asp Tyr Ile Leu Ser Glu

65 70 75 80

Ile Lys Pro Leu His Asn Phe Leu Thr Gln Leu Gln Pro Phe Leu Lys

85 90 95

Leu Lys Gln Lys Gln Ala Asn Leu Val Leu Lys Ile Ile Trp Arg Leu

100 105 110

Pro Ser Ala Lys Glu Ser Pro Asp Lys Phe Leu Glu Val Cys Thr Trp

115 120 125

Val Asp Gln Ile Ala Ala Leu Asn Asp Ser Lys Thr Arg Lys Thr Thr

130 135 140

Ser Glu Thr Val Arg Ala Val Leu Asp Ser Leu Ser Glu Lys Lys Lys

145 150 155 160

Ser Ser Pro

<210>2

<211>24

<212>DNA

<213>人工的

<220>

<223>I-CreI C1221 DNA靶标

<400>2

tcaaaacgtc gtacgacgtt ttga 24

<210>3

<211>167

<212>PRT

<213>人工的

<220>

<223>I-CreI N75 骨架

<400>3

Met Ala Asn Thr Lys Tyr Asn Lys Glu Phe Leu Leu Tyr Leu Ala Gly

1 5 10 15

Phe Val Asp Gly Asp Gly Ser Ile Ile Ala Gln Ile Lys Pro Asn Gln

20 25 30

Ser Tyr Lys Phe Lys His Gln Leu Ser Leu Thr Phe Gln Val Thr Gln

35 40 45

Lys Thr Gln Arg Arg Trp Phe Leu Asp Lys Leu Val Asp Glu Ile Gly

50 55 60

Val Gly Tyr Val Arg Asp Arg Gly Ser Val Ser Asn Tyr Ile Leu Ser

65 70 75 80

Glu Ile Lys Pro Leu His Asn Phe Leu Thr Gln Leu Gln Pro Phe Leu

85 90 95

Lys Leu Lys Gln Lys Gln Ala Asn Leu Val Leu Lys Ile Ile Glu Gln

100 105 110

Leu Pro Ser Ala Lys Glu Ser Pro Asp Lys Phe Leu Glu Val Cys Thr

115 120 125

Trp Val Asp Gln Ile Ala Ala Leu Asn Asp Ser Lys Thr Arg Lys Thr

130 135 140

Thr Ser Glu Thr Val Arg Ala Val Leu Asp Ser Leu Ser Glu Lys Lys

145 150 155 160

Lys Ser Ser Pro Ala Ala Asp

165

<210>4

<211>24

<212>DNA

<213>人工的

<220>

<223>10GGG_P DNA靶标

<400>4

tcgggacgtc gtacgacgtc ccga 24

<210>5

<211>24

<212>DNA

<213>人工的

<220>

<223>5GAT_P DNA靶标

<400>5

tcaaaacgat gtacatcgtt ttga 24

<210>6

<211>24

<212>DNA

<213>人工的

<220>

<223>5TAT_P DNA靶标

<400>6

tcaaaactat gtacatagtt ttga 24

<210>7

<211>22

<212>DNA

<213>人工的

<220>

<223>rosal DNA靶标

<400>7

caacatgatg ttcataatcc ca 22

<210>8

<211>22

<212>DNA

<213>人工的

<220>

<223>rosa1.2DNA靶标

<400>8

caacatgatg tacataatcc ca 22

<210>9

<211>22

<212>DNA

<213>人工的

<220>

<223>rosa1.3DNA靶标

<400>9

caacatgatg tacatcatgt tg 22

<210>10

<211>22

<212>DNA

<213>人工的

<220>

<223>rosa1.4DNA靶标

<400>10

tgggattatg tacataatcc ca 22

<210>11

<211>50

<212>DNA

<213>人工的

<220>

<223>寡核苷酸

<400>11

tggcatacaa gtttcaacat gatgtacatc atgttgacaa tcgtctgtca 50

<210>12

<211>26

<212>DNA

<213>人工的

<220>

<223>Gal10F引物

<400>12

gcaactttag tgctgacaca tacagg 26

<210>13

<211>24

<212>DNA

<213>人工的

<220>

<223>Gal10R引物

<400>13

acaaccttga ttggagactt gacc 24

<210>14

<211>15

<212>DNA

<213>人工的

<220>

<223>AssF引物

<220>

<221>misc_feature

<222>(4)..(6)

<223>n为a、c、g或t

<400>14

ctannnttga ccttt 15

<210>15

<211>15

<212>DNA

<213>人工的

<220>

<223>AssR引物

<220>

<221>misc_feature

<222>(10)..(12)

<223>n为a、c、g或t

<400>15

aaaggtcaan nntag 15

<210>16

<211>59

<212>DNA

<213>人工的

<220>

<223>preATGCreFor引物

<400>16

gcataaatta ctatacttct atagacacgc aaacacaaat acacagcggc cttgccacc 59

<210>17

<211>48

<212>DNA

<213>人工的

<220>

<223>ICreIpostRev引物

<400>17

ggctcgagga gctcgtctag aggatcgctc gagttatcag tcggccgc 48

<210>18

<211>18

<212>DNA

<213>人工的

<220>

<223>AA78a83For引物

<400>18

ttaagcgaaa tcaagccg 18

<210>19

<211>18

<212>DNA

<213>人工的

<220>

<223>AA78a83Rev

<400>19

cggcttgatt tcgcttaa 18

<210>20

<211>24

<212>DNA

<213>人工的

<220>

<223>10GAA_P DNA靶标

<400>20

tcgaaacgtc gtacgacgtt tcga 24

<210>21

<211>24

<212>DNA

<213>人工的

<220>

<223>10CTG_P DNA靶标

<400>21

tcctgacgtc gtacgacgtc agga 24

<210>22

<211>24

<212>DNA

<213>人工的

<220>

<223>5TAG_P DNA靶标

<400>22

tcaaaactag gtacctagtt ttga 24

<210>23

<211>24

<212>DNA

<213>人工的

<220>

<223>5TTT_P DNA靶标

<400>23

tcaaaacttt gtacaaagtt ttga 24

<210>24

<211>22

<212>DNA

<213>人工的

<220>

<223>B2M11 P DNA靶标

<400>24

tgaaattagg tacaaagtca ga 22

<210>25

<211>22

<212>DNA

<213>人工的

<220>

<223>B2M11.2DNA靶标

<400>25

tgaaattagg tacctaattt ca 22

<210>26

<211>22

<212>DNA

<213>人工的

<220>

<223>B2M11.3DNA靶标

<400>26

tctgactttg tacaaagtca ga 22

<210>27

<211>50

<212>DNA

<213>人工的

<220>

<223>寡核苷酸

<400>27

tggcatacaa gttttgttct caggtacctg agaacaacaa tcgtctgtca 50

<210>28

<211>77

<212>DNA

<213>人工的

<220>

<223>attB1-ICreIFor引物

<400>28

ggggacaagt ttgtacaaaa aagcaggctt cgaaggagat agaaccatgg ccaataccaa 60

atataacaaa gagttcc 77

<210>29

<211>64

<212>DNA

<213>人工的

<220>

<223>attB2-ICreIRev引物

<400>29

ggggaccact ttgtacaaga aagctgggtt tagtcggccg ccggggagga tttcttcttc 60

tcgc 64

<210>30

<211>28

<212>DNA

<213>人工的

<220>

<223>M1s引物

<400>30

aaaaagcagg ctgattggca tacaagtt 28

<210>31

<211>28

<212>DNA

<213>人工的

<220>

<223>M2s引物

<400>31

agaaagctgg gtgattgaca gacgattg 28

<210>32

<211>25

<212>DNA

<213>人工的

<220>

<223>attB1adapbis引物

<400>32

ggggacaagt ttgtacaaaa aagca 25

<210>33

<211>25

<212>DNA

<213>人工的

<220>

<223>attB2adapbis引物

<400>33

ggggaccact ttgtacaaga aagct 25

<210>34

<211>24

<212>DNA

<213>人工的

<220>

<223>HprCH3 DNA靶标

<400>34

tcgagatgtc atgaaagaga tgga 24

<210>35

<211>83

<212>DNA

<213>人工的

<220>

<223>CCM2For引物

<400>35

aagcagagct ctctggctaa ctagagaacc cactgcttac tggcttatcg accatggcca 60

ataccaaata taacaaagag ttc 83

<210>36

<211>69

<212>DNA

<213>人工的

<220>

<223>CCMRev引物

<400>36

tctgatcgat tcaagtcagt gtctctctag atagcgagtc ggccgccggg gaggatttct 60

tcttctcgc 69

<210>37

<211>33

<212>DNA

<213>人工的

<220>

<223>G19SF引物

<400>37

gccggctttg tggactctga cggtagcatc atc 33

<210>38

<211>33

<212>DNA

<213>人工的

<220>

<223>G19SR引物

<400>38

gatgatgcta ccgtcagagt ccacaaagcc ggc 33

<210>39

<211>84

<212>DNA

<213>人工的

<220>

<223>CCM2For引物

<400>39

aagcagagct ctctggctaa ctagagaacc cactgcttac tggcttatcg accatggcca 60

ataccaaata taacaaagag ttcc 84

<210>40

<211>38

<212>DNA

<213>人工的

<220>

<223>CCMRevBis引物

<400>40

ctgctctaga ttagtcggcc gccggggagg atttcttc 38

<210>41

<211>24

<212>DNA

<213>人工的

<220>

<223>10GTT_P DNA靶标

<400>41

tcgttacgtc gtacgacgta acga 24

<210>42

<211>24

<212>DNA

<213>人工的

<220>

<223>10TGG_P DNA靶标

<400>42

tctggacgtc gtacgacgtc caga 24

<210>43

<211>24

<212>DNA

<213>人工的

<220>

<223>5CAG_P DNA靶标

<400>43

tcaaaaccag gtacctggtt ttga 24

<210>44

<211>24

<212>DNA

<213>人工的

<220>

<223>5GAG_P DNA靶标

<400>44

tcaaaacgag gtacctcgtt ttga 24

<210>45

<211>22

<212>DNA

<213>人工的

<220>

<223>RAG1.10DNA靶标

<400>45

tgttctcagg tacctcagcc ag 22

<210>46

<211>22

<212>DNA

<213>人工的

<220>

<223>RAG1.10.2DNA靶标

<400>46

tgttctcagg tacctgagaa cg 22

<210>47

<211>22

<212>DNA

<213>人工的

<220>

<223>RAG1.10.3DNA靶标

<400>47

ttggctgagg tacctcagcc ag 22

<210>48

<211>163

<212>PRT

<213>莱茵衣藻

<400>48

Met Asn Thr Lys Tyr Asn Lys Glu Phe Leu Leu Tyr Leu Ala Gly Phe

1 5 10 15

Val Asp Gly Asp Gly Ser Ile Ile Ala Gln Ile Lys Pro Asn Gln Ser

20 25 30

Tyr Lys Phe Lys His Gln Leu Ser Leu Thr Phe Gln Val Thr Gln Lys

35 40 45

Thr Gln Arg Arg Trp Phe Leu Asp Lys Leu Val Asp Glu Ile Gly Val

50 55 60

Gly Tyr Val Arg Asp Arg Gly Ser Val Ser Asp Tyr Ile Leu Ser Glu

65 70 75 80

Ile Lys Pro Leu His Asn Phe Leu Thr Gln Leu Gln Pro Phe Leu Lys

85 90 95

Leu Lys Gln Lys Gln Ala Asn Leu Val Leu Lys Ile Ile Glu Gln Leu

100 105 110

Pro Ser Ala Lys Glu Ser Pro Asp Lys Phe Leu Glu Val Cys Thr Trp

115 120 125

Val Asp Gln Ile Ala Ala Leu Asn Asp Ser Lys Thr Arg Lys Thr Thr

130 135 140

Ser Glu Thr Val Arg Ala Val Leu Asp Ser Leu Ser Glu Lys Lys Lys

145 150 155 160

Ser Ser Pro

<210>49

<211>9

<212>PRT

<213>人工序列

<220>

<223>HA-tag

<400>49

Tyr Pro Tyr Asp Val Pro Asp Tyr Ala

1 5

<210>50

<211>15

<212>PRT

<213>人工序列

<220>

<223>S-tag

<400>50

Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser

1 5 10 15

<210>51

<211>5

<212>PRT

<213>人工序列

<220>

<223>NLS

<400>51

Lys Lys Lys Arg Lys

1 5

<210>52

<211>30

<212>PRT

<213>人工序列

<220>

<223>肽接头

<400>52

Gly Gly Ser Asp Lys Tyr Asn Gln Ala Leu Ser Lys Tyr Asn Gln Ala

1 5 10 15

Leu Ser Lys Tyr Asn Gln Ala Leu Ser Gly Gly Gly Gly Ser

20 25 30

<210>53

<211>21

<212>DNA

<213>人工序列

<220>

<223>引物

<400>53

cgcaaatggg cggtaggcgt g 21

<210>54

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>54

gtacagcagg aactcttcgt tatatttggt attgg 35

<210>55

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物

<400>55

aataccaaat ataacgaaga gttcctgctg tacc 34

<210>56

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物

<400>56

cgtagaatcg agaccgagga gagg 24

<210>57

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物

<400>57

caggtacagc aggaactttt tgttatattt gg 32

<210>58

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物

<400>58

accaaatata acaaaaagtt cctgctgtac ctgg 34

<210>59

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>59

gatgatgcta ccgtcagagt ccacaaagcc ggc 33

<210>60

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>60

gccggctttg tggactctga cggtagcatc atc 33

<210>61

<211>22

<212>DNA

<213>人工序列

<220>

<223>C1DNA靶标

<400>61

cgagatgtca cacagaggta cg 22

<210>62

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>62

gcaatgatgg agccatcaga atccacaaat ccagc 35

<210>63

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>63

gctggatttg tggattctga tggctccatc attgc 35

<210>64

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>64

aagatacagc aggaactttt tgttagagcc acc 33

<210>65

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>65

ggtggctcta acaaaaagtt cctgctgtat ctt 33

<210>66

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>66

aagatacagc aggaactctt cgttagagcc acc 33

<210>67

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>67

ggtggctcta acgaagagtt cctgctgtat ctt 33

<210>68

<211>22

<212>PRT

<213>人工序列

<220>

<223>肽接头

<400>68

Ala Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly

1 5 10 15

Ser Gly Gly Gly Gly Ser

20

<210>69

<211>24

<212>DNA

<213>人工序列

<220>

<223>HBB5靶标

<400>69

ttggtctcct taaacctgtc ttga 24

<210>70

<211>24

<212>DNA

<213>人工序列

<220>

<223>HBB5.3靶标

<400>70

ttggtctcct gtacaggaga ccaa 24

<210>71

<211>24

<212>DNA

<213>人工序列

<220>

<223>HBB5.4靶标

<400>71

tcaagacagg gtaccctgtc ttga 24

<210>72

<211>33

<212>DNA

<213>人工序列

<220>

<223>V105ARev引物

<400>72

ttcgataatt ttcagagcca ggtttgcctg ttt 33

<210>73

<211>33

<212>DNA

<213>人工序列

<220>

<223>V105AFor引物

<400>73

aaacaggcaa acctggctct gaaaattatc gaa 33

<210>74

<211>33

<212>DNA

<213>人工序列

<220>

<223>I132V Rev引物

<400>74

atcgttcaga gctgcaacct gatccaccca ggt 33

<210>75

<211>33

<212>DNA

<213>人工序列

<220>

<223>I132V For引物

<400>75

acctgggtgg atcaggttgc agctctgaac gat 33

Claims

1.用于增强来自I-CreI的大范围核酸酶的切割活性的方法，其特征是包括对I-CreI中选自以下的至少一个氨基酸残基进行位点特异性突变：19位甘氨酸(G19)、54位苯丙氨酸(F54)、87位苯丙氨酸(F87)、79位丝氨酸(S79)、105位缬氨酸(V105)和132位异亮氨酸(I132)。

2.权利要求1的方法，其中19位甘氨酸被改变为丝氨酸(G19S)或丙氨酸(G19A)，54位苯丙氨酸被改变为亮氨酸(F54L)，87位苯丙氨酸被改变为亮氨酸(F87L)，79位丝氨酸被改变为甘氨酸(S79G)，105位缬氨酸被改变为丙氨酸(V105A)，和/或132位异亮氨酸被改变为缬氨酸(I132V)。

3.权利要求1或权利要求2的方法，其中在所述来自I-CreI的大范围核酸酶的同一单体中突变选自G19、F54、F87、S79、V105和I132的至少两个氨基酸残基。

4.权利要求3的方法，其中在所述来自I-CreI的大范围核酸酶的同一单体中突变V105和I132残基。

5.权利要求1到4中任一项的方法，其中对所述来自I-CreI的大范围核酸酶的两个单体均进行突变。

6.权利要求5的方法，其中一单体具有G19S或F87L突变，另一单体同时具有V105A和I132V突变。

7.权利要求1到6中任一项的方法，其中所述来自I-CreI的大范围核酸酶是异二聚体。

8.权利要求7的方法，其中所述来自I-CreI的异二聚体大范围核酸酶由两个单体组成，每个单体包含在I-CreI的26到40位和/或44到77位上的不同突变，所述大范围核酸酶能够切割非回文的目的基因组DNA靶序列。

9.权利要求1到8中任一项的方法，其中所述来自I-CreI的大范围核酸酶在I-CreI的137到143位上包含一个或多个替换，所述替换改变了针对I-CreI位点中±1到2、±6到7和/或±11到12位核苷酸的特异性。

10.权利要求7到9中任一项的方法，其中所述来自I-CreI的异二聚体大范围核酸酶的两个单体之一包含G19S突变，所述突变破坏功能性同二聚体的形成。

11.权利要求10的方法，其中另一单体包含不同的突变，所述突变破坏功能性同二聚体的形成或有助于异二聚体的形成。

12.权利要求7到11中任一项的方法，其中所述来自I-CreI的异二聚体大范围核酸酶是专性异二聚体，其中一个单体包含D137R突变，另一单体包含R51D突变。

13.权利要求7到11中任一项的方法，其中所述来自I-CreI的异二聚体大范围核酸酶是专性异二聚体，其中一个单体包含K7E突变，另一单体包含E8K突变。

14.可通过权利要求1到13中任一项的方法获得的来自I-CreI的大范围核酸酶，所述大范围核酸酶至少包含选自G19S、G19A、F54L、F87L、S79G、V105A和I132V的突变，排除选自以下的I-CreI变体：

-I-CreI G19A，K28A，Y33S，Q38R，S40K，R70S，D75N，

-I-CreI G19A，K28A，Q38R，S40K，R70S，D75N，F87L，

-I-CreI G19A，K28A，Y33S，Q38R，S40K，D69G，R70S，D75N，

-I-CreI Y33R，S40Q，Q44A，R70H，D75N，F87L，I132T，V151A，

-I-CreI Y33R，S40Q，Q44A，R70H，D75N，F87L，F94L，V125A，E157G，K160R，

-I-CreI Y33H，F54L，N86D，K100R，L104M，V105A，N136S，K159R，

-I-CreI S32T，Y33H，Q44K，R68Y，R70S，I77R，Q92R，K96R，K107R，I132V，T140A，T143A，

-I-CreI S32A，Y33H，Q44A，R68Y，R70S，D75Y，I77K，I132V，

-I-CreI N2I，S32G，Y33H，Q44A，R68Y，R70S，D75Y，I77K，K96R，V105A，

-I-CreI S32A，Y33H，F43L，Q44A，R68Y，R70S，D75Y，I77K，V105A，K159R，

-I-CreI G19S，N30Q，Y33G，Q38C，R68N，R70S，S72F，I77R，

-I-CreI Y33G，Q38C，R68N，R70S，I77R，F87L，

-I-CreI N30Q，Y33G，Q38C，F54L，R68N，R70S，I77R，

-I-CreI N30Q，Q31L，Y33G，Q38C，R68N，R70S，I77R，P83Q，F87L，和

-I-CreI N30Q，Y33G，Q38C，R68N，R70S，I77R，V105A。

15.权利要求14的来自I-CreI的大范围核酸酶，其为异二聚体。

16.权利要求15的异二聚体大范围核酸酶，其可通过权利要求10或权利要求11的方法获得，所述异二聚体大范围核酸酶包含具有G19S突变的单体，并且在基本不含有由于所述具有G19S突变之单体结合而产生的同二聚体。

17.权利要求15或权利要求16的异二聚体大范围核酸酶，其包含具有K7E突变的一个单体和具有E8K突变的另一单体。

18.根据权利要求14到17中任一项的来自I-CreI的大范围核酸酶，其包含至少一个具有标签或核定位信号的单体。

19.单链大范围核酸酶，其包含根据权利要求14到18中任一项所述来自I-CreI的大范围核酸酶的第一和第二单体，二者通过肽连接子连接。

20.多核苷酸片段，其编码权利要求14到18中任一项的大范围核酸酶的一个单体，或编码根据权利要求19的单链大范围核酸酶。

21.重组载体，其包含至少一个权利要求20的多核苷酸片段。

22.表达载体，其包含各编码权利要求14到18中任一项所述大范围核酸酶的两个单体之一的两个多核苷酸片段，所述片段与允许产生这两种单体的调节序列有效连接。

23.表达载体，其包含编码根据权利要求19所述单链大范围核酸酶的多核苷酸片段，所述片段与允许产生所述单链大范围核酸酶的调节序列有效连接。

24.权利要求22或权利要求23的载体，其包含靶向DNA构建体，所述DNA构建体包含与权利要求8所定义之基因组DNA靶序列周围的区域具有同源性的序列。

25.权利要求24的载体，其中所述靶向DNA构建体包含：a)与权利要求8所定义之基因组DNA靶序列周围的区域共有同源性的序列，和b)待引入序列，其侧翼为a)中的序列。

26.宿主细胞，其包含权利要求20或权利要求22中定义的一个或两个多核苷酸片段，或包含根据权利要求21到25中任一项的载体。

27.包含权利要求20或权利要求22中定义的一个或两个多核苷酸片段的非人转基因动物。

28.包含权利要求20或权利要求22中定义的一个或两个多核苷酸片段的转基因植物。

29.药物组合物，其至少包含权利要求14到19中任一项所述大范围核酸酶、权利要求20或权利要求22中定义的一个或两个多核苷酸片段或者权利要求21到25中任一项的载体。

30.权利要求29的组合物，其还包含靶向DNA构建体，所述靶向DNA构建体包含修复目的基因组位点的序列，其侧翼是与所述基因组位点具有同源性的序列。

31.权利要求14到19中任一项的大范围核酸酶、权利要求20或权利要求22中定义的一个或两个多核苷酸片段、权利要求21到25中任一项的载体、权利要求26的宿主细胞、权利要求28的转基因植物、权利要求24的非人转基因哺乳动物用于非治疗目的的用途，其用于分子生物学，用于体内或体外基因工程，和用于体内或体外基因组工程。

32.权利要求14到19中任一项的大范围核酸酶、权利要求20或权利要求22中定义的一个或两个多核苷酸片段或者权利要求21到25中任一项的载体用于制备药物的用途，所述药物用于在有需要的个体中预防、改善或治疗遗传疾病，所述药物旨在通过任何手段对所述个体施用。

33.权利要求14到19中任一项的大范围核酸酶、权利要求20或权利要求22中定义的一个或两个多核苷酸片段或者权利要求21到25中任一项的载体用于制备药物的用途，所述药物用于在有需要的个体中预防、改善或治疗由具有DNA中间体的传染原所引起的疾病，所述药物旨在通过任何手段对所述个体施用。

34.权利要求14到19中任一项的大范围核酸酶、权利要求20或权利要求22中定义的一个或两个多核苷酸片段或者权利要求21到25中任一项的载体的体外用途，其用于在生物来源的产品或旨在用于生物用途的产品中抑制具有DNA中间体之传染原的增殖、灭活或消除所述传染原，或用于消毒物体。

35.权利要求33或权利要求34的用途，其中所述传染原是病毒。

36.权利要求31到35中任一项的用途，其中所述大范围核酸酶、多核苷酸、载体、细胞、转基因植物或非人转基因哺乳动物与权利要求24中定义的靶向DNA构建体相关联。

37.权利要求14到19中任一项的大范围核酸酶、权利要求20或权利要求22中定义的一个或两个多核苷酸片段或者权利要求21到25中任一项的载体作为骨架用于改造出其他大范围核酸酶的用途。

38.产生来自I-CreI的异二聚体大范围核酸酶的方法，所述大范围核酸酶基本不含有由于所述异二聚体大范围核酸酶的每种单体结合所产生的两种同二聚体中的至少一种，所述方法包括在细胞中共表达来自I-CreI的异二聚体大范围核酸酶的两种单体，其中两种单体之一包含G19S突变。