CN107686842A

CN107686842A - 一种靶多核苷酸编辑方法及其应用

Info

Publication number: CN107686842A
Application number: CN201610627960.XA
Authority: CN
Inventors: 周国华; 赵庆顺; 俆澍; 曹莎莎; 邹秉杰; 岳芸芸
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2016-08-03
Filing date: 2016-08-03
Publication date: 2018-02-13
Also published as: WO2018024119A1

Abstract

本发明涉及一种靶多核苷酸编辑方法，具体步骤包括针对目标靶基因，设计一对DNA寡核苷酸单链，使其与靶基因的正义和反义链分别互补，分别产生能够被一类识别靶序列结构并具有切割活性的核酸酶识别的结构，通过所述的核酸酶切割靶基因组DNA，实现对基因组的编辑。其中，所述被一类识别靶序列结构并具有切割活性的核酸酶识别的结构为3'‑Flap结构，DNA寡核苷酸单链的3'末端不与靶基因互补；重组的结构识别核酸内切酶，包含结构识别功能域、DNA切割功能域、连接二者的肽段和核定位信号。

Description

一种靶多核苷酸编辑方法及其应用

技术领域

本发明属于分子生物学领域，涉及一种基因组编辑方法及其应用，具体而言涉及一种对基因组进行靶向切割的技术。

背景技术

DNA编辑在许多体外或体内的分子生物学实验中都是至关重要的。由于II型限制性内切酶(REases)对目标核苷酸精致而准确的切割，使得它们成为这些实验中不可或缺的工具。迄今为止，已有3700种II型REases已经被开发，但只有262种不同核酸序列能够被这些酶识别(S,et al.Proc Natl Acad Sci U S A 2007,104:10358-10363.)。因此，这些有限的序列限制了DNA编辑操作中的各种需求。为了克服此限制，已经开发了以下几种方法。第一种方法涉及对现有REases的氨基酸序列进行突变，如Not I突变体，用蛋白质结构信息学帮助增加DNA序列识别的特异性(Buchholz F.CurrOpin Biotech 2009,20:383-389.)。第二种方法涉及构建一种将靶向识别结构域与DNA切割结构域结合融合的新型IIS型酶(也称为非正统酶)，如曾报道的Tst I和Bmr I(Chan S,et al.Nucleic Acids Res 2007,18,6238-6248.)。第三种方法涉及形成一种的新型核酸酶，其融合多个能识别不同DNA序列的限制性内切酶的切割结构域。例如，锌指核酸酶(ZFN)(Kim Y-G,et al.Proc Natl Acad Sci U S A 1996,93:1156-1160.)由一个DNA识别域和一个非特异性核酸内切酶构成。DNA识别域是由一系列锌指蛋白基序(zinc-fingers)串联组成从而形成锌指阵列(Zinc Finger Array，ZFA)，并识别靶DNA序列；非特异性核酸内切酶如Fok Ⅰ切割结构域可以在靶位点切割DNA。ZFN已经成功地在多种生物和细胞中被用于敲除或敲入基因(Bibikova M,et al.Genetics 2002,161:1169-1175；Li H,et al.Nature2011,475:217-221；Straimer J,et al.Nat Methods 2012,9:993-998；Urnov FD,RebarEJ,et al.Nat Rev Genet 2010,11:636-646；Kim JS,et al.Nat Methods 2010,7:91)。然而，ZFN很难针对任何所需的DNA序列，因为它们偏好识别富含G碱基的共有序列，并且对识别靶DNA序列的“活性的”锌指阵列的鉴定成本很高(Isalan M.Nat Methods 2012,9:32-34.)。另一个例子是转录激活因子样效应物核酸酶(transcription activator-likeeffector nucleases，TALEN)，它是将多种转录激活样(TAL)基序(Li L,et al.Mol Plant2013,6:1318-1330.)和FokⅠ切割结构域融合而成。每个TAL基序(Repeat)可以识别一个碱基核苷酸，因而，从理论上说，有多个基序组成的这种酶可以识别靶点中相应的任何序列，且使用一对TALENs已成功地敲除或敲入各种生物体和细胞的基因(Bloom K,et al.MolTher 2013,21:1889-1897；Christian M,et al.Genetics 2010,186:757-761；Sung YH,etal.Nat Biotechnol 2013,31:23-24；Tesson L,et al.Nat Biotechnol 2011,29:695-696.；Mussolino C,et al.Nucleic Acids Res 2011,39:9283-9293.)。但是，TALEN需要靶序列的5'末端有胸腺嘧啶核苷酸，其可被氨基末端隐性重复折叠(cryptic repeat fold)所识别(Mak AN,et al.Science 2012,335:716-719.)。第四种方法是RNA-指导的核酸内切酶(RNA-guided endonucleases，RGENs 如CRISPR–Cas系统)，其用RNA替代了多肽进而识别目的序列，并将酶引导至切割靶点(Horvath P,Science 2010,327:167-170.)。至此，使用RGENs也成功对人类基因组进行了基因编辑(Cho SW,et al.Nat Biotechnol 2013,31:230-232.；Cong L,et al.Science 2013,339:819-823.；Mali P,et al.Science 2013,339:823-826.)。相比ZFN和TALEN，RGEN具有明显优势，它采用合成的短RNA分子代替了蛋白去识别序列。但是，RGEN靶点受限于需要具有能被Cas9识别的PAM序列(Mojica FJ,etal.Microbiology 2009,155:733-740.)。综上所述，DNA序列的特异性限制了人工核酸内切酶在DNA编辑中的应用。

因此，开发一种不依赖于DNA序列且可切割所需序列的新型核酸内切酶具有极强的应用价值。能够识别特异DNA结构的侧翼核酸内切酶1(FEN-1)为该需求提供了可能(Harrington JJ,et al.EMBO J 1994,13:1235-1246.)。在DNA复制和修复过程中，FEN-1参与了清除RNA引物或损伤DNA的过程(Kaiser MW,et al.J Biol Chem.1999,274:21387-21394.；Kao HI,et al.J Biol Chem.2002,277:14379-14389.)。新合成的DNA和移位区域与模板链配对碱基竞争，从而导致双侧翼结构(double-flap structure)的形成(ReynaldoLP,J Mol Biol 2000,297:511-520.)。双侧翼结构具有一个单独的未配对的3'核苷酸(3'flap)。AfuFEN-1在结合到3'flap后会催化裂解磷酸二酯键(Chapados BR,et al.Cell2004,116:39-50.)。此外，Fok I是IIS型限制性内切酶，其由一个N末端的DNA识别结构域和C末端切割结构域(Fn1)组成。Fok I的双向特性已用于新型特异性人工核酸内切酶的开发(Li L,et al.Proc Natl Acad Sci U S A 1992,89:4275-4279.)，如ZFN或TALEN。

发明内容

因此，本发明中，申请人构建了由识别3'-Flap结构的FEN-1和切割DNA链的Fok I(Fn1)切割结构域所组成的结构指导的核酸内切酶(Structure-guided endonuclease，SGN)。3'-Flap结构由靶序列和人工引导DNA(guide DNA，gDNA)形成。根据结构引导识别，SGN可以切割任何所需的靶向DNA而不需要像type II REases、ZFN或TALEN那样改变核酸内切酶或肽单元(peptide units)，或像RGEN中对RNA分子有应用限制。

本发明的目的之一是提供了一种靶多核苷酸编辑方法，其特征在于：设计一对寡核苷酸探针，使其与靶多核苷酸的正义链和反义链分别结合，分别产生能够被核酸酶识别的目标序列结构，所述核酸酶切割靶多核苷酸，实现对靶多核苷酸的编辑。

在本发明的某个实施例中，所述的靶多核苷酸编辑方法中，所述靶多核苷酸是RNA或DNA，优选是基因组DNA，所述的基因组优选是斑马鱼基因组、哺乳动物基因组、人类基因组、或植物基因组。

在本发明的某个实施例中，所述的靶多核苷酸编辑方法中，所述一对寡核苷酸探针是DNA，优选所述一对寡核苷酸探针与靶多核苷酸的结合位点间隔0-100bp，优选间隔为10-70bp、20-60bp、32-50bp或40bp。

在本发明的某个实施例中，所述的靶多核苷酸编辑方法中，所述寡核苷酸探针的长度为20nt以上，优选长度为20-50nt或25nt。

在本发明的某个实施例中，所述的靶多核苷酸编辑方法中，所述的目标序列结构为5'突出核酸结构、3'突出核酸结构、切刻核酸结构、侵入核酸结构、三链核酸结构、Y型核酸结构、3'-Flap结构以及由错配或缺失核酸引起的鼓泡核酸结构中的至少一种的识别功能域，优选3'-Flap结构，DNA寡核苷酸单链的3'-末端不与目标基因组DNA互补。

在一个具体实施例中，所述寡核苷酸探针的5'端对靶多核苷酸特异，优选与靶多核苷酸互补；寡核苷酸探针的3'端不与靶多核苷酸互补，优选3'末端1个以上、1-20个、1-10个、1-5个、1-4个、1-3个、2个或1个碱基不与靶多核苷酸互补。

在本发明的某个实施例中，所述的核酸酶是重组结构识别核酸内切酶(SGN)，包含结构识别功能域、DNA切割功能域和连接二者的肽段；所述的结构识别功能域为能够识别结构为5'突出核酸结构、3'突出核酸结构、切刻核酸结构、侵入核酸结构、三链核酸结构、Y型核酸结构、3'-Flap结构以及由错配或缺失核酸引起的鼓泡核酸结构中的至少一种的识别功能域，优选选自TaqPol、TthPol、TaqExo、AfuFEN、PfuFEN、MjaFEN、MthFEN、E.coliMuts、Tthmuts和Taqmuts组成的组中任意一种酶的识别功能域或全酶片段；所述的切割功能域为IIS型核酸内切酶的切割功能域，优选Fok I的部分或全部肽段；所述的切割功能域还可选自TaqPol、TthPol、TaqExo、AfuFEN、PfuFEN、MjaFEN、MthFEN、E.coliMuts、Tthmuts和Taqmuts组成的组中任意一种酶的全酶片段的核酸内切酶结构域；所述的连接肽段为不影响结构识别与酶切功能的柔性肽段，优选甘氨酸或丝氨酸或其组合的串联组合。

在一个具体实施例中，所述的重组结构识别核酸内切酶含有核定位信号。

在一个具体实施例中，所述的重组结构识别核酸内切酶的氨基酸序列选自SEQ IDNo:1、SEQ ID No:2中任一个。

在另一个具体实施例中，所述的重组结构识别核酸内切酶的核酸序列选自SEQ IDNo:3、SEQ ID No:4、SEQ ID No:5中任一个。

在一个具体实施例中，所述基因组DNA是内源DNA或整合到基因组的外源DNA，优选所述靶多核苷酸编辑方法是在体实施的。

本发明的目的之二是提供一种寡核苷酸探针对，其特征在于该寡核苷酸探针对与靶多核苷酸的正义和反义链分别结合，分别产生能够被核酸酶识别的目标序列结构，所述目标序列结构能够被核酸酶识别，所述核酸酶切割靶多核苷酸，实现对靶多核苷酸的编辑。

在某个实施例中，所述一对寡核苷酸探针是DNA，优选与靶多核苷酸的结合位点间隔0-100bp，优选间隔为10-70bp、20-60bp、32-50bp或40bp。

在一个具体实施例中，一对寡核苷酸探针与靶多核苷酸的结合位点间隔bp长度优选为0bp、1bp、2bp、3bp、4bp、5bp、6bp、7bp、8bp、9bp、10bp、11bp、12bp、13bp、14bp、15bp、16bp、17bp、18bp、19bp、20bp、21bp、22bp、23bp、24bp、25bp、26bp、27bp、28bp、29bp、30bp、31bp、32bp、33bp、34bp、35bp、36bp、37bp、38bp、39bp、40bp、41bp、42bp、43v、44bp、45bp、46bp、47bp、48bp、49bp、50bp、51bp、52bp、53bp、54bp、55bp、56bp、57bp、58bp、59bp、60bp、61bp、62bp、63bp、64bp、65bp、66bp、67bp、68bp、69bp、70bp、71bp、72bp、73bp、74bp、75bp、76bp、77bp、78bp、79bp、80bp、81bp、82bp、83bp、84bp、85bp、86bp、87bp、88bp、89bp、90bp、91bp、92bp、93bp、94bp、95bp、96bp、97bp、98bp、99bp、100bp。

在某个实施例中，所述寡核苷酸探针的长度为20nt以上，优选长度为20-50nt或25nt。

在某个实施例中，所述寡核苷酸探针的5'端对靶多核苷酸特异，优选与靶多核苷酸互补；寡核苷酸探针的3'端不与靶多核苷酸互补，优选3'末端1个以上、1-20个、1-10个、1-5个、1-4个、1-3个、2个或1个碱基不与靶多核苷酸互补。

本发明还提供了用于靶多核苷酸编辑的系统，其特征在于所述系统包括本发明中所述的寡核苷酸探针对，优选包括本发明中所述的核酸酶。

本发明进一步提供了用于靶多核苷酸编辑的试剂盒，其特征在于所述试剂盒包括本发明中所述的寡核苷酸探针对，优选包括本发明中所述的核酸酶。

本发明的目的之三是提供了一种在靶多核苷酸中切割大片段的方法，其特征在于采用了本发明中所述的靶多核苷酸编辑方法。

在某个实施例中，一种在靶多核苷酸中切割大片段的方法中所述的大片段长度大于所述寡核苷酸探针对与靶多核苷酸的结合位点的间隔，优选所述的大片段长度大于所述间隔1-10000bp、1-3000bp、1-2000bp、1-1000bp、1-500bp、1-200bp或1-100bp。

本发明还提供了一种疾病细胞模型的制作方法，其特征在于采用了本发明中所述的靶多核苷酸编辑方法或施用了本发明中所述的寡核苷酸探针对或本发明中用于靶多核苷酸编辑的系统或本发明中用于靶多核苷酸编辑的试剂盒。

本发明还提供了一种疾病动物模型的制作方法，其特征在于采用了本发明中所述的靶多核苷酸编辑方法或施用了本发明中所述的寡核苷酸探针对或本发明中用于靶多核苷酸编辑的系统或本发明中用于靶多核苷酸编辑的试剂盒。

本发明还提供了一种植物突变体的制作方法，其特征在于采用了本发明中所述的靶多核苷酸编辑方法或施用了本发明中所述的寡核苷酸探针对或本发明中用于靶多核苷酸编辑的系统或本发明中用于靶多核苷酸编辑的试剂盒。

本发明的目的之四是提供了一种疾病治疗方法，其特征在于采用了本发明中所述的靶多核苷酸编辑方法或施用了本发明中所述的寡核苷酸探针对或本发明中用于靶多核苷酸编辑的系统或本发明中用于靶多核苷酸编辑的试剂盒。

在某个实施例中，所述的疾病选自遗传相关疾病或非遗传相关疾病，优选所述的遗传相关疾病选自癌症、自身免疫疾病、糖尿病、血液病、心脏病、抑郁症、阿尔茨海默病、哮喘和神经疾病中的任一种。

发明的有益效果

本发明的有益效果在于所建立一种基因组编辑方法，针对目标靶基因，通过设计一对DNA寡核苷酸单链，使其与目标基因的正义和反义链分别互补，分别产生能够被一类识别目标序列结构并具有切割活性的核酸酶识别的结构，通过所述的核酸酶切割目标基因组DNA，最终切除大片段DNA，实现对基因组目的序列的靶向切割并有益于目标蛋白功能的最大程度敲除。

SGN具有很多优势，首先在该系统中，可以较为容易地设计和合成的gDNA并根据需要调整其浓度；其次由SGN创建的大片段缺失突变的等位基因更可能产生无效的等位基因，而ZFN、TALEN、RGEN或新报道的NgAgo基因组编辑系统产生的突变是通过小的插入缺失造成的，该缺失仍然能够编码具有一些残留功能的截短蛋白质；另外在SGN系统中的gDNAs长度是可以调整的，以避免错误杂交。

附图说明

图1示出的是可用于体外实验的SGN编码序列和氨基酸序列的图。

图2示出的是pET28a(+)-SGN的质粒图谱图。

图3示出的是可用于体内斑马鱼显微注射中的携带有核定位信号的SGN编码序列和氨基酸序列(该蛋白质序列对应的编码序列是斑马鱼源化的密码子优化的)

图4示出的是携带有核定位信号的SGN编码序列和氨基酸序列(该蛋白质序列对应的编码序列是人源化的密码子优化的)

图5示出的是关于SGN能否切割靶DNA的体内和体外策略图。左图是体外实验，靶DNA用Cy5基团标记修饰。设计互补于靶DNA的gDNA，其3'末端有未配对的核苷酸以形成3'-Flap结构。SGN识别3'-Flap结构并切割靶DNA。切割的产物通过变性聚丙烯酰胺凝胶电泳(变性的-PAGE)和荧光成像进行分析。右图是使用的Tg(flk:eGFP)转基因斑马鱼或野生型斑马鱼胚胎研究SGN在体内的活性。设计一对gDNAs，其与靶转基因GFP或内源性基因的互补，且gDNA的3'末端有未配对的核苷酸以形成3'-Flap结构。将SGN的mRNA(含有细胞核定位信号编码序列)和一对识别目标基因的gDNAs显微注射入斑马鱼胚胎。所表达的SGN会识别3'-Flap结构并切割体内靶DNA。基因组DNA被消化并通过DNA修复途径被修复。为了检验该DNA编辑过程，进一步从斑马鱼胚胎中提取基因组DNA，然后进行GFP或内源性基因的目的序列的PCR扩增、克隆和测序，分析由SGN引起的突变。

图6示出的是关于SGN体外切割单链DNA的图。变性-PAGE示出由SGN切割产生的DNA产物。a-c：不同的单链靶DNA(S-1，S-2和S-3)与不同gDNA(gDNA-1、gDNA-2和gDNA-3)进行反应。泳道1：S加SGN；泳道2：S加gDNA；泳道3：S加gDNA和Fok I；泳道4：S加gDNA和FEN-1；泳道5：S加gDNA和SGN。NC：无酶对照组。泳道M：DNA标准品。序列图下的箭头示意的是根据切割产物大小的可能切割位点。

图7示出的是不同的未配对的3'核苷酸对SGN导致的DNA切割的效果。示意图(顶部)示出的是在单链DNA靶序列上gDNA的未配对3'核苷酸。实线箭头指示根据切割产物大小推测的可能切割位点。变性-PAGE结果(下部)显示了由SGN酶切的清晰切割产物，且在不同非配对类型的效率之间没有明显差异。(a)gDNA-1、gDNA-1-G、gDNA-1-T靶向S-1ssDNA；(b)gDNA-3、gDNA-3-G、gDNA-3-A靶向S-3ssDNA；(c)gDNA-4、gDNA-4-A、gDNA-4-T靶向S-4ssDNA；和(d)gDNA-5、gDNA-5-T、gDNA-5-G靶向S-5的ssDNA。

图8示出的是引导DNA(gDNA)的长度影响SGN切割DNA的图。序列下的实线箭头示意的是根据切割产物大小的可能切割位点，虚线箭头表示理论切割位点。变性-PAGE结果显示SGN切割后的产物。(a)gDNA-6-10nt、gDNA-6-15nt、gDNA-6-20nt、gDNA-6-25nt、gDNA-6-30nt、gDNA-6-35nt、gDNA-6-40nt、gDNA-6-45nt、gDNA-6-50nt、gDNA-6-55nt和gDNA-6-60nt分别靶向S-6ssDNA；(b)gDNA-7-10nt、gDNA-7-15nt、gDNA-7-20nt、gDNA-7-25nt、gDNA-7-30nt、gDNA-7-35nt、gDNA-7-40nt、gDNA-7-45nt、gDNA-7-50nt、gDNA-7-55nt和gDNA-7-60nt分别靶向S-7ssDNA。

图9示出的是关于SGN以二聚体形式发挥作用的实验结果图。DNA切割率和各种SGN浓度之间的关系。用各种浓度的SGN(0、0.127、0.25、0.37、0.50、0.62、1.00、2.00nM)切割固定浓度100nM的S-8。以切割速率(用单位之间t内产物P的产生确定)和对应的SGN浓度作图。图中进入平台期前的黑色实线方程式是y＝2.9684x^1.9255(y＝速率，x＝SGN浓度)，黑色的圆点表示各个SGN浓度下的平均速率。

图10示出的是关于确定SGN切割位点的图。(a)确定切割位点方法的示意图。小圆代表生物素。大圆代表链霉亲和素磁珠。生物素连接的线代表靶DNA，gDNA中黑色部分代表gDNA的3'末端的错配碱基。(b)I为信号强度。图中显示“GGAAGTGAC”的测序信号。S-1(上)测序鉴定的切割位点为实线箭头所示。(c)图中显示“GCCCTTC”的测序信号。S-2(上)测序鉴定的切割位点为实线箭头所示。

图11示出的是体外SGN切割双链DNA的图。变性-PAGE凝胶显示由一对gDNA引导SGN切割的产物(标识*所示)。不同的靶dsDNAs(S-1/S-9(a)、S-3/S-10(b)、S-5/S-11(c))与由不同的引导DNAs(gDNA1/gDNA9(a)、gDNA3/gDNA10(b)、gDNA5/gDNA11(c))引导的SGN分别反应。泳道1：S加SGN和gDNAs；泳道2：S加SGN；泳道3：S加gDNAs；泳道M：DNA链。*：指示切割产物。

图12示出的是关于SGN编辑斑马鱼基因组内目标基因的图。箭头指示的是大片段缺失发生的位置。(a)上图示出靶向转基因斑马鱼报告基因GFP的gDNAs所在位置。下图显示的是突变分子#5-15(表2)的部分测序峰图。(b)上图示出靶向目标内源性znf703基因的gDNAs所在位置。下图显示的是被编辑形成的突变分子的部分测序峰图，其中754bp和其后的11bp被缺失。(c)上图示出靶向目标内源性cyp26b1基因的gDNAs所在位置。下图显示的是被编辑形成的突变分子的部分测序峰图，其中2610bp被缺失。

图13 SGN编辑内源性基因形成大片段缺失的假设机制。一个gDNA杂交到斑马鱼或人的基因组DNA的单链，以形成3'-Flap结构；与单链人工靶DNA的切割机理相同，SGN结合至识别位点后切割斑马鱼基因组DNA的单链；斑马鱼基因组DNA单链被切割后形成切刻或切口(nick)结构并被SGN识别；一旦SGN分子结合到切刻结构，斑马鱼基因组DNA会被连续地切割成另一个新的具有切刻结构的切割产物。这意味着一旦切割开始时，它会一直重复；被破坏的基因组DNA在体内最终通过DNA修复途径修复从而形成突变分子。

图14示出的是关于SGN切割具有缺刻结构的双链DNA形成大的缺失片段。a：dsDNA片段示意图。切刻内切酶Nt.BstNBI的识别位点用灰色标识，切割位点用箭头表示。b：SGN切割产物用2％琼脂糖凝胶分离。泳道1：没有SGN的缺刻dsDNA片段；泳道2：有SGN的缺刻dsDNA片段；泳道M：DL-500marker(500,400,300,200,150,100and 50bp)；泳道3：没有SGN的dsDNA片段；泳道4：有SGN的dsDNA片段。*：指示大片段缺失的双链DNA。

具体实施方式

下面通过具体实施方式及实验数据对本发明作进一步的说明。尽管为了清楚的目的，在下文中使用了专用术语，但这些术语并不意味着定义或限制本发明的范围。

如本文中所使用，术语“多核苷酸”指代是核苷酸聚合成的链状化合物。

如本文中所使用，术语“靶多核苷酸”是指，任何一段欲加以改造或修复的目标核苷酸聚合成的链状化合物。靶多核苷酸附近的基因序列，允许外源序列在靶点处的整合，包括但不限于基因敲除(knock-out)、基因敲入(knock-in)。在具体实施方式中，靶多核苷酸是双链的DNA序列，包括，但不限于，细胞的染色体基因组中的DNA序列、细胞染色体基因组外的DNA序列(例如线粒体基因组)、质粒、病毒等的DNA序列。

“靶多核苷酸编辑”在某些具体实施例中指代是基因组编辑，包括由于核酸内切酶对靶基因的靶向切割导致细胞启动DNA损伤修复机制使得在没有外源供体DNA存在的情况下出现的靶基因的插入缺失突变，以及在外源供体存在的情况下外源供体靶向插入基因的基因组修饰。

“对靶多核苷酸特异”是指与靶多核苷酸结合，包括但不限于结合可以存在一定的错配率。

如本文中所使用，术语“寡核苷酸”指代是是一类只有60个以下碱基的短链核苷酸的总称(包括脱氧核糖核酸DNA或核糖核酸RNA内的核苷酸)。

如本文中所使用，术语“目标序列”指代是靶序列，在具体实施例中目标基因组和靶基因组是相同含义；类似地，在一些具体实施例中目标DNA和靶DNA是相同含义，其中在一些具体实施例中使用的底物DNA也指代靶DNA。

如本文中所使用，术语“核酸酶”指代是作用于水解核苷酸之间的磷酸二酯键的一种蛋白质。

引导DNA(guide DNA)：指代是寡脱氧核糖核酸单链，亦被称作寡核苷酸探针，其中5'序列对靶多核苷酸链特异，3'端有至少1个核苷酸不与靶多核苷酸单链互补，或错配。

如本文中所使用，术语“3'-Flap结构”也称为“3'侧翼结构”，指代是由于引导DNA(gDNA)5'端与靶多核苷酸互补形成双链但3'端不与靶多核苷酸单链互补而在错配位置形成的一种特殊DNA结构。

下述实施例中的实验方法，如无特殊说明，均为常规方法。

具体实施例：

实施例1 重组结构识别核酸内切酶的构建和的表达

本发明中构建了重组结构识别核酸内切酶(Structure-guided endonuclease，SGN)，该内切酶由识别3'-Flap结构的FEN-1和切割DNA链的Fok I(Fn1)切割结构域组成。其中，该序列由以下基因编码：C端是Fok I(196个氨基酸残基)，中间连接是甘氨酸-丝氨酸重复序列，和FEN-1酶。将该序列插入原核表达载体pET28a(+)中，以形成pET28a(+)-SGN。SGN的编码序列和氨基酸序列见图1、图3-4中示出，pET28a(+)-SGN的质粒图谱见图2中示出。在pET28a(+)-SGN构建体中，SGN基因位于T7启动子的下游。

pET28a(+)-SGN用CaCl₂热休克的方法转化到宿主细菌菌株Arctic Express中。首先，将细胞在37℃培养，然后在27℃环境下用IPTG(0.1mM)诱导16小时，进而表达SGN。收集经诱导细胞，用超声裂解并离心。将粗提取物用镍(Ni)亲和色谱柱纯化SGN。超速离心浓缩SGN，并用12％的十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)进行确认。获得的纯化SGN(序列见图1，其中氨基酸序列为SEQ ID No:1，核酸序列为SEQ ID No:3)用于实例中的体外实验。

申请人早先假设，一旦目标序列被FEN-1识别，SGN的Fn1结构域应能切割DNA链。用于验证SGN能否切割靶DNA的体内和体外策略见图5。在体外(图5，左图)，靶DNA用Cy5基团标记修饰。设计互补于靶DNA的gDNA，其3'末端有未配对的核苷酸以形成3'-Flap结构。SGN(图1)识别3'-Flap结构并切割靶DNA。切割的产物通过变性聚丙烯酰胺凝胶电泳(变性的-PAGE)和荧光成像进行分析。

然后，使用的Tg(flk:eGFP)斑马鱼胚胎研究SGN在体内的活性(图5，右图)。设计一对gDNAs，其与靶基因GFP正反义链分别互补，且gDNA的3'末端有未配对的核苷酸以形成3'-Flap结构。将SGN的mRNA(含有细胞核定位信号编码序列，图3，其中核酸序列为SEQ ID No:4，氨基酸序列为核酸序列为SEQ ID No:2)和一对识别目标基因的gDNAs显微注射入斑马鱼胚胎。所表达的SGN会识别3'-Flap结构并切割体内靶DNA。基因组DNA被消化并通过DNA修复途径被修复。为了检验该DNA编辑过程，我们从斑马鱼胚胎中提取基因组DNA，然后进行GFP目的序列的PCR扩增、克隆和测序，分析由SGN引起的突变。也可以采用上述类似实验方法进行野生型斑马鱼胚胎内源基因的突变。

在进行人类细胞实验时，我们将有真核生物启动子驱动的SGN(含核定位信号，图4，核酸序列为SEQ ID No:5，氨基酸序列为核酸序列为SEQ ID No:2)表达质粒和一对识别目标基因的gDNAs转染人的细胞系。所表达的SGN会识别3'-Flap结构并切割体内靶DNA。基因组DNA被消化并通过DNA修复途径被修复。为了检验该DNA编辑过程，我们从人细胞系中提取基因组DNA，然后对目标基因组序列进行PCR扩增、克隆和测序，分析由SGN引起的突变。

实施例2 SGN体外切割单链DNA

为了测试设计SGN是否可以切割DNA链，我们将1ng SGN、10pmol底物单链DNA(ssDNA)(S-1)和10pmol gDNA-1在10-μL的反应体系中进行孵育(所有的ssDNA和DNA寡核苷酸gDNA的序列示于表1)，10-μL的反应体系中还包括MOPS(10mM)、0.05％Tween-20、0.01％nonidet P-40和MgCl₂(7.5mM)。其中，用荧光Cy5基团在S-1的5'末端进行标记。且在SGN加入之前，先将混合物在95℃下孵育5分钟，55℃下孵育10分钟。然后再加入SGN，37℃反应2小时。

所述的gDNA-1与S-1形成3'-Flap结构。将SGN加入到该混合物中进行反应，然后将混合物通过变性的-PAGE分离并通过荧光成像。具体步骤为，将反应得到的产物在变性条件下用PAGE进行分析。上样缓冲液含有90％甲酰胺、0.5％EDTA，0.1％二甲苯蓝，和0.1％溴酚蓝。上样前，将样品(20μL)孵育在沸水5分钟，然后在冰上冷却。然后将样品在室温上样到20％PAGE凝胶上，并在包含有尿素(8.7M)和Tris-硼酸盐(89mM)的缓冲液中运行。电泳在9.6V/cm运行2小时。电泳后，将凝胶浸渍在10％乙醇固定20分钟。凝胶由Tanon5200多荧光成像仪成像(上海，中国)。

理论上，只有经标记的目标链(完整)和5'端用荧光染料Cy5标记的S-1的切割产物应被明显检测到。如图6a的泳道5，通过gDNA-1导向作用，SGN切割底物S-1，产生较小分子量的条带，图中用“切割产物”表示。而仅含有S-1加SGN(图6a的泳道1)、S-1加gDNA-1(图6a的泳道2)、S-1加Fok I和gDNA-1(图6a的泳道3)、或S加FEN-1和gDNA-1(图6a的泳道4)的反应中没有发生切割现象。该结果表明，SGN可以识别3'-Flap结构并切割的目的序列DNA链。

表1.DNA寡核苷酸模板、gDNA和PCR引物的序列

实施例3 SGN切割活性不依赖于目标序列

为证明SGN是否有DNA序列的偏好性，采用具有不同序列的ssDNAs(S-2、S-3，序列见表1)作为SGN的底物进行反应。10-μL的反应体系和条件同前述以S-1为底物的反应。

结果表明，当通过gDNA-2或gDNA-3引导下，SGN可分别将S-2或S-3切割(见图6b和图6c的泳道5)。而仅含有S加SGN(图6b和图6c的泳道1)、S加gDNA(图6b和图6c的泳道2)、S加Fok I和gDNA(图6b和图6c的泳道3)、或S加FEN-1和gDNA(图6b和图6c的泳道4)的反应中没有发生切割现象。该结果表明，SGN切割活性不依赖于目标序列但识别3'-Flap结构。

为了证明gDNA中未配对3'核苷酸的重要性，本发明中测试了所有类型的非配对3'核苷酸，包括C-T、G-T、T-T、C-A、G-A、A-A、C-C和G-G。如图7所示，不同非配对类型之间的效率没有明显的差异。先前报道中(Kaiser MW,et al.J Biol Chem.1999,274:21387-21394.)，古细菌FEN-1酶中所有四个天然碱基有大致相同的效率。本发明的结果与这一发现是一致的。然后，申请人测试了多个序列来揭示gDNA长度对切割效率的重要性，gDNA长度包括10、15、20、25、30、35、40、45、50、55、60个核苷酸(nt)。如图8所示，当gDNAs的长度超过20-nt时，SGN可以切割目标DNA。但当gDNAs的长度为10-nt或15-nt时，目标DNA没有发生裂解。根据对Fok I的结构的研究报道(Wah DA,et al.Proc Natl Acad Sci U S A 1998,95:10564-10569.)，当Fok I与DNA结合时，切割结构域会结合在距离识别位点13bp的位置。这一结果表明，该蛋白需要底物DNA上有足够的构象空间进行折叠和反应。然而，如在图6上部中灰色箭头所示的，当gDNAs的长度为10-nt的或15-nt的，理论上的切割位点过于接近目标DNA的3'末端，在蛋白质折叠过程中所需的构象或许没有足够的空间。

实施例4 距离非配对3'末端核苷酸9-10nt处是SGN切割活性位点

已证明活性的Fok I是以二聚体形式发挥作用(Wah DA,et al.Proc Natl AcadSci U S A 1998,95:10564-10569.)。为了研究是否SGN也是以二聚体形式工作，申请人用SGN对DNA切割，进行动力学实验。实验前，标记底物S-8，方法为在5'端标记荧光染料FAM和在3'端加猝灭剂，然后与SGN和gDNA-8共同孵育。通过绘制相对于各种浓度SGN的速率(图9)，发现当使用0.62nM SGN后反应速度达到平台期。但使用小于0.62nM SGN的速率/SGN浓度曲线方程式是y＝2.9684x^1.9255(y＝速率，x＝SGN浓度)，其中R平方为0.9866。这些结果证明了反应初始速度与酶浓度并不成正比，从而表明了SGN-催化反应不是相对于SGN的浓度的一阶反应，这也暗示SGN是以二聚体发挥作用的。此外，SGN是负责识别的3'-Flap结构的FEN-1以及负责DNA切割的Fok I切割结构域(Fn1)二者的融合蛋白。如先前报道(Wah DA,etal.Proc Natl Acad Sci U S A 1998,95:10564-10569.)，Fok I通过其切割结构域介导的二聚体切割靶DNA。Fok I工作模型中(Wah DA,et al.Proc Natl Acad Sci U S A 1998,95:10564-10569.)，Fok I分子结合在识别位点并招募另一个Fok I分子，它通过Fn1域提供第二催化中心。第一Fok I分子的Fn1在结合特定DNA后被激活，摆动成为一个二聚体开放构象，然后切割。因此，申请人推断，SGN的二聚化是通过Fn1介导的。

为确定由SGN产生的切割位点的位置，申请人使用焦磷酸测序(Zhou G,etal.Anal Chem.2006,78:4482-4489.)对切割的链进行测序(图10a)。

使用便携式生物发光分析仪(日立有限公司，日本)进行焦磷酸测序(Zhou G,etal.Anal Chem.2006,78:4482-4489.)。用链霉亲和素包被的琼脂糖珠收集生物素化的反应产物。待沉淀和洗涤后，将纯化的dsDNAs在碱缓冲液中变性，得到ssDNAs。然后将固定化的生物素化的链与测序引物在90℃的条件下退火5分钟。55℃反应10分钟，作为测序模板。焦磷酸测序混合物含有Tris-HAC(0.1M，pH 7.7)、EDTA(2mM)、Mg(Ac)₂(10mM)、0.1％BSA、DTT(1mM)、APS(2mM)、PVP(0.4g/L)、D-luciferin(0.4mM)、apyrase-Ⅶ(1.6U/mL)、外切Klenow片段(18U/mL)和萤火虫荧光素酶(1mM)。

靶序列(S-1和S-2)在5'末端用生物素修饰。底物DNAs与SGN孵育后，链霉素包被的琼脂糖珠被用于捕获生物素化的反应产物。然后将固定的生物素化的链与它的gDNA在85℃下退火5分钟，25℃下进行10分钟，然后用作测序模板。非配对的3'核苷酸不会发生延伸。因此，测序信号出现在切割位点(图10a)。如图10b所示，焦磷酸测序信号是GGAAGTGAC。结果表明，由SGN介导的S-1切割位点位于距离gDNA-6-20nt的3'末端核苷酸9nt的位置。针对S-2(图10c)的类似焦磷酸测序中，发现焦磷酸测序信号是GCCCTTC。由SGN介导的S-2切割位点位于距离gDNA-6-20nt的3'末端核苷酸10nt的位置。因此，该结果表明在切割位点距离gDNAs的3'端有9-10个核苷酸的间隔。

实施例5 SGN体外部分切割双链DNA(dsDNA)

既然SGN能够切割单链DNA且不依赖靶序列，而依赖由gDNA形成的3'-Flap的方式，因此SGN可具备在体外酶切双链DNA的能力。为证明SGN是否可以切割DNA，申请人进行了三个靶dsDNA的检测。

首先分别孵育包含5pmol S-1/S-9(S-1的互补链)或S-3/S-10(S-3的互补链)或S-5/S-11(S-5的互补链)的混合物以形成dsDNA，条件为95℃3分钟，然后从94℃1分钟开始以1℃/分钟的速率冷却到22℃保持1分钟。在这个过程中，互补链可以相互杂交，然后分别添加5pmol gDNA-1/gDNA-9或gDNA-3/gDNA-10或gDNA-5/gDNA-11，和10mM MOPS、0.05％Tween-20、0.01％nonidet P-40和7.5mM MgCl₂至混合物中，37℃孵育10分钟。最后加入1ng SGN37℃孵育2小时。

结果如图11a、b、c中泳道1所示，在包含SGN、一对gDNAs和DNA底物(S)的反应中，观察到更小分子量的条带，用“*”标记。但在只包含S和SGN(11a、b、c中泳道2)或只包含S和gDNA(11a、b、c中泳道3)的反应中，没有发生切割。这些结果说明了由一对gDNAs引导的SGN可以在体外部分切割dsDNA。

实施例6 SGN体内对基因组DNA的编辑

为确定SGN是否具有基因组编辑的活性，申请人将1-nL含有200pg的SGN mRNA(含有核定位信号编码序列，图3)和一对gDNAs(各50pg，序列见表1)的溶液通过显微注射入1-细胞期的Tg(flk1：EGFP)斑马鱼胚胎。在转基因斑马鱼的基因组中编码GFP的双链DNA的正义链和反义链上，gDNAs被间隔放置分别形成3'-Flap结构(图12a，顶部)。

突变的GFP分子用如之前文献所述的方法检测(Dong Z et al.PLoS One 2011,6:e28897.)。简言之，根据说明书(南京尧顺禹，中国)的步骤，用10μL的B液孵育斑马鱼胚胎，之后从随机挑选的5个胚胎中制备斑马鱼基因组DNA模板(65℃反应30分钟，95℃反应10分钟，16℃反应1分钟)。然后将1.0μL裂解溶液作为模板，用引物GFP F1和GFP R1(表1)在20μL的PCR混合物体系中扩增GFP分子。PCR程序为：94℃2分钟，35个循环(94℃30秒，60℃30秒，72℃30秒)，72℃进行10分钟。扩增子在pGEM-T中(Promega公司，USA)进行克隆。然后，随机选择48个阳性转化子，采用引物GFP F2和GFP R2(表1)以上面所述的方法进行PCR鉴定。接着，对阳性转化子中靶分子进行测序，以确定突变。

结果发现，当gDNA间隔0、8、18、32或50个bp，对从显微注射了gDNAs与SGN mRNA的斑马鱼胚胎中扩增出的基因组靶序列进行测序分析，分别揭示了2/48、0/47、3/46、18/44、12/47的突变比率(表2，表3)。结果表明，基因组中，SGN偏好于识别以32-50bp的间隔序列放置的gDNAs。

另一方面，用znf703和cyp26b1基因作为靶基因以验证SGN是否可以像ZFN或TALEN那样编辑内源基因。申请人分别向1-细胞期斑马鱼胚胎中显微注射了1-nL含有200pg的SGNmRNA(含有核定位信号编码序列)和一对gDNAs(各50pg，序列见表1)的溶液。用上述相似方法对突变的znf703和cyp26b1基因进行检测。简言之，1.0μL来自于5个胚胎的裂解溶液作为模板，分别用引物znf703F1和znf703R1、cyp26b1F和cyp26b1R(表1)在20μL的PCR混合物体系中扩增znf703和cyp26b1分子。PCR程序为：95℃3分钟，30个循环(95℃15秒，60℃15秒，72℃1分钟30秒)，72℃进行10分钟。为增加cyp26b1扩增的特异性，采用了引物cyp26b1Fin和cyp26b1Rin(表1)进行了巢式PCR。znf703扩增子和cyp26b1巢式PCR的扩增子分别在pGEM-T中(Promega公司，USA)进行克隆。然后，随机选择96个转化子，采用T7和Sp6引物对(表1)进行PCR(94℃2min，30个循环(94℃30秒，54℃30秒，72℃3分钟10秒)，72秒10分钟)。PCR产物稀释10倍后，分别用引物znf703 F和znf703 R、cyp26b1 Fin和cyp26b1 Rin(表1)再进行PCR检测，确定插入的片段是否来源于靶基因的突变等位基因。最后对阳性转化子靶分子进行测序鉴定突变基因型。

针对自znf703基因扩增出的等位基因片段的测序分析显示，gDNA-znf703-F和gDNA-znf703-R50引导下的SGN诱发了比例为1/96的等位基因突变(图12b、表2、表4)。发生基因组编辑的突变分子中754个核苷酸被移除，另外11个核苷酸也被删除(图12b，底部)。针对自cyp26b1基因扩增出的等位基因片段的测序分析表明，由gDNA-cyp26b1-F和gDNA-cyp26b1-R32引导的SGN引发了比例为3/29的突变(图12c、表2、表5)，发生基因组编辑的突变分子中伴随有2610个核苷酸大片段缺失突变(图12c，底部)。结果表明，SGN可以以低效率编辑斑马鱼基因组的内源基因。

表2.斑马鱼基因组中的目标基因经SGN编辑后形成的突变等位基因

发生基因靶向突变的比率：#1(2/48)、#2(0/47)、#3(3/46)；、#4(18/44)、#5(12/47)；、#6(1/96)和#7(3/29)。

表3.eGFP(720bp)编码序列和突变序列

表4.znf703野生序列和经SGN编辑后形成的突变序列

表5cyp26b1野生序列和经SGN编辑后形成的突变序列

实施例7 SGN在细胞系对人类基因组的编辑

为测试SGN是否可对人基因组进行编辑，申请人利用完全培养基(包含高糖DMEM(Hyclone)、10％FBS(Hyclone)和各100U/mL的青霉素和链霉素(Hyclone))培养人293T细胞。将细胞均匀地培养在6孔板中，每孔2mL完全培养基。待细胞密度长至90％左右时进行细胞转染。首先，将1μg人密码子优化的SGN表达载体(pW1-SGN)、各500ng的识别人MEIS2基因gDNA(gDNA-MEIS2-F、gDNA-MEIS2-R，间隔32bp序列，表1)，与250μL Opti-MEM(Gibco)培养基混匀室温放置5分钟。同时将10μL Lipo2000(Invitrogen)与250μL Opti-MEM(Gibco)培养基混匀室温放置5分钟。将转染载体与转染试剂共500μL混匀室温放置15分钟后，均匀添加到1个6孔板的孔中。转染后6小时，换液一次。转染后48小时，收集细胞，用与前述制备斑马鱼胚胎基因组DNA模板相同的试剂盒(南京尧顺禹，中国)制备细胞基因组DNA模板，使用引物对(MEIS2-F、MEIS2-R，表1)针对目标基因进行PCR扩增。PCR反应条件为95℃ 2分钟，30×(95℃1分钟，58℃ 1分钟，72℃ 45秒)，最后72℃延伸10分钟。扩增完成后，按前述相同方法将扩增产物重组入pGEM-T载体(Promega，美国)，转化产物涂板后第二天，每个平板挑选96个转化子，按前述同样方法进行PCR扩增，以鉴定插入产物是否含被编辑的基因组片段。将PCR产物条带大小明显小于野生型基因组片段的转化子送商业公司测序，结果有1/96的转化子发生了大片段缺失(表6)。

表6人MEIS2野生序列和经SGN编辑后形成的突变等位基因序列

实施例8 SGN在体内基因组编辑中的机制

已知通过ZFN、TALEN和RGEN创建的主要突变是引入小的缺失，但SGN却产生的是大片段的缺失。这里，申请人尝试说明这些大片段的缺失所依据的机制。如图13所示，1)一个gDNA杂交到斑马鱼或人的基因组DNA的单链，以形成3'-Flap结构；2)与单链人工靶DNA的切割机理相同，SGN结合至识别位点后切割斑马鱼基因组DNA的单链；3)斑马鱼或人基因组DNA单链被切割后形成有缺刻的结构；4)据报道(Hosfield DJ,et al.J Biol Chem.1998,273:27154-27161.)，FEN-1识别缺刻结构。因为SGN由FEN-1和Fn1组成，申请人认为，SGN可以识别一个带切刻的结构；5)一种SGN分子结合至该带切刻的结构并切割的基因组DNA的单链。切割的产物还具有带切刻的结构。这意味着一旦切割开始时，它会一直重复；和6)被破坏的基因组DNA在体内通过DNA修复途径修复从而形成突变分子。

为了验证提出的机理的可能性，申请人测试了缺刻dsDNA作为底物的反应。首先，将50μL含有dsDNA(1μg)、10×NEB缓冲液3(5μL)和1μL Nt.BstNBI(New England Biolabs，英国)的混合物在37℃孵育3小时。之后，将10μL含有纯化的缺刻dsDNA(50ng，来自第一步骤)、MOPS(10mM)、0.05％Tween-20、0.01％nonidet P-40、MgCl₂(7.5mM)和SGN(1ng)的混合物在37℃孵育2小时。最后，从第二步骤获得的切割产物用2％琼脂糖凝胶电泳进行分析。

用缺刻核酸内切酶消化400bp长的dsDNA形成单个链上均有切刻(图14a)，其中缺刻核酸内切酶使用的是Nt.BstNBI，该酶的识别为点是“GAGTC”并切割后续4个碱基。如图14b的泳道2中所示，缺刻dsDNA和SGN共孵育的反应中，可以观察到小分子量的产物条带，相反，包含缺刻dsDNA但不包含SGN的反应(泳道1)中，没有观察到该结果。相似地，包含dsDNA但不包含SGN的反应(泳道3)中，包含dsDNA但包含SGN的反应(泳道4)中，均没有观察到小分子量的产物条带。

这些提供了一些初步的证明以支持我们猜测的大片段缺失机制。但是，更深入的机制需要一些可能的结构修饰以提高SGN系统的精度和效率来进一步揭示。

讨论：

在这里，我们设计了一种结构导向核酸酶，在靶DNA和gDNA之间形成的3'-Flap结构的基础上，该酶可以识别靶DNA，并通过Fn1二聚体切割靶基因。目前可用的核酸内切酶表现出对序列的偏好。而本申请中，采用结构导向方式识别和捕获靶DNA，可以设计出满足任何靶DNA适合的gDNAs，并使用SGN切割靶DNA。在该系统中，可以较为容易地设计和合成gDNA并调整其浓度，而在RGEN系统中设计gRNA相对较为困难。日前，关于NgAgo基因组编辑系统一项最新研究(Gao F,et al.Nat Biotechnol 2016.)也说明DNA引导的优势。此外，区别于ZFN、TALEN、RGEN或新报道的NgAgo基因组编辑系统产生的突变是通过小插入缺失造成的，SGN系统可以在斑马鱼基因组和人基因组中产生大片段缺失，因为在突变基因中一个小的插入缺失仍然能够编码具有一些残留功能的截短蛋白质，由ZFN、TALEN、RGEN或NgAgo诱导的小片段插入缺失突变等位基因并不总是无效的等位基因或敲除的等位基因。与此相反，由SGN创建的大片段缺失突变的等位基因更可能产生无效的等位基因。

SGN的基因组DNA编辑应用中还有些问题需要进一步研究得到解决。目前，SGN系统的效率不高，因此，我们没有从cyp26b1和znf703基因实验中观察到脱靶的情况。但根据SGN的工作机制，如果引导DNA(gDNA)与基因组DNA产生错误杂交，那会有脱靶现象。幸运的是，相比NgAgo中引导DNA只能是23nt、24nt、或25nt的情况，在SGN系统中的gDNAs长度是可以调整的，以避免错误杂交。其他潜在的问题是FEN-1可以针对某些天然存在的DNA的结构，它或许不仅会导致脱靶效应，而且还有细胞毒性。但事实上，申请人并没有在斑马鱼实验中观察到特定的细胞死亡现象。此外，与典型双链相比，产生dsDNAs中特定结构的挑战也是不容忽视的。目前本发明中方法的效率受限于gDNA和基因组中正确位点之间的相互作用，形成一个3'-Flap结构。其他策略，例如使用PNA或LNA探针作为引导DNA和可能的SGN结构修饰，应该可被用来改善和提高SGN的切割效率。

结论：

总之，在本发明中，申请人构建了由识别3'-Flap结构的FEN-1和切割DNA链的FokI(Fn1)切割结构域所组成的结构指导的内切酶(Structure-guided endonuclease，SGN)。基于靶序列和人工引导DNA(guide DNA，gDNA)形成的3'-Flap结构，SGN可以识别靶DNA，并通过其Fn1二聚体切割靶点。实验结果表明，SGN可体外切割靶DNA。另外使用斑马鱼胚胎和人细胞系作为孵育体系，本发明证明了SGN可编辑内源基因。通过结构引导识别，任何期望的靶DNA都可被构建的核酸内切酶SGN所切割，而不需要改变核酸内切酶或其多肽单元(如II型REases、ZFN和TALEN)，或不受RNA分子使用的限制(如RGEN中)。它可以成为DNA编辑有用的替代工具。

以上，基于本发明的实施方式进行了说明，但本发明不限定于此，本领域的技术人员应该明白，在本发明的主旨的范围内能够以进行变形和变更的方式实施，这样的变形和变更的方式，理应属于本发明的保护范围。

Claims

1.一种靶多核苷酸编辑方法，其特征在于：设计一对寡核苷酸探针，使其与靶多核苷酸的正义链和反义链分别结合，分别产生能够被核酸酶识别的目标序列结构，所述核酸酶切割靶多核苷酸，实现对靶多核苷酸的编辑。

2.如权利要求1所述的方法，其中，所述靶多核苷酸是RNA或DNA，优选基因组DNA，优选所述的基因组是斑马鱼基因组、哺乳动物基因组、人类基因组、或植物基因组。

3.如权利要求1或2所述的方法，其中，所述一对寡核苷酸探针是DNA，优选所述一对寡核苷酸探针与靶多核苷酸的结合位点间隔0-100bp，优选间隔为10-70bp、20-60bp、32-50bp或40bp。

4.如权利要求1至3任一项所述的方法，其中，所述寡核苷酸探针的长度为20nt以上，优选长度为20-50nt或25nt。

5.如权利要求1至4任一项所述的方法，其中，所述的目标序列结构为5'突出核酸结构、3'突出核酸结构、切刻核酸结构、侵入核酸结构、三链核酸结构、Y型核酸结构、3'-Flap结构以及由错配或缺失核酸引起的鼓泡核酸结构中的至少一种的识别功能域，优选3'-Flap结构，DNA寡核苷酸单链的3'-末端不与目标基因组DNA互补。

6.如权利要求5所述的方法，其中，所述寡核苷酸探针的5'端对靶多核苷酸特异，优选与靶多核苷酸互补；寡核苷酸探针的3'端不与靶多核苷酸互补，优选3'末端1个以上、1-20个、1-10个、1-5个、1-4个、1-3个、2个或1个碱基不与靶多核苷酸互补。

7.如权利要求1至6任一项所述的方法，其中，所述的核酸酶是重组结构识别核酸内切酶(SGN)，包含结构识别功能域、DNA切割功能域和连接二者的肽段；所述的结构识别功能域为能够识别结构为5'突出核酸结构、3'突出核酸结构、切刻核酸结构、侵入核酸结构、三链核酸结构、Y型核酸结构、3'-Flap结构以及由错配或缺失核酸引起的鼓泡核酸结构中的至少一种的识别功能域，优选选自TaqPol、TthPol、TaqExo、AfuFEN、PfuFEN、MjaFEN、MthFEN、E.coliMuts、Tthmuts和Taqmuts组成的组中任意一种酶的识别功能域或全酶片段；所述的切割功能域为IIS型核酸内切酶的切割功能域，优选Fok I的部分或全部肽段；所述的切割功能域还可选自TaqPol、TthPol、TaqExo、AfuFEN、PfuFEN、MjaFEN、MthFEN、E.coliMuts、Tthmuts和Taqmuts组成的组中任意一种酶的全酶片段的核酸内切酶结构域；所述的连接肽段为不影响结构识别与酶切功能的柔性肽段，优选甘氨酸或丝氨酸或其组合的串联组合。

8.如权利要求7所述的方法，其中，所述的重组结构识别核酸内切酶含有核定位信号。

9.如权利要求7或8所述的方法，其中，所述的重组结构识别核酸内切酶的氨基酸序列选自SEQ ID No:1、SEQ ID No:2中任一个；所述重组结构识别核酸内切酶的核酸序列选自SEQ ID No:3、SEQ ID No:4、SEQ ID No:5中任一个。

10.权利要求1至9任一项所述的方法，其中，所述基因组DNA是内源DNA或整合到基因组的外源DNA，优选所述靶多核苷酸编辑方法是在体实施的。

11.一种寡核苷酸探针对，其特征在于该寡核苷酸探针对与靶多核苷酸的正义和反义链分别结合，分别产生能够被核酸酶识别的目标序列结构，所述目标序列结构能够被核酸酶识别，所述核酸酶切割靶多核苷酸，实现对靶多核苷酸的编辑。

12.如权利要求11所述的一种寡核苷酸探针对，其中，所述一对寡核苷酸探针是DNA，优选与靶多核苷酸的结合位点间隔0-100bp，优选间隔为10-70bp、20-60bp、32-50bp或40bp。

13.如权利要求11或12所述的一种寡核苷酸探针对，其中，所述寡核苷酸探针的长度为20nt以上，优选长度为20-50nt或25nt。

14.如权利要求1-13任一项所述的一种寡核苷酸探针对，其中，所述寡核苷酸探针的5'端对靶多核苷酸特异，优选与靶多核苷酸互补；寡核苷酸探针的3'端不与靶多核苷酸互补，优选3'末端1个以上、1-20个、1-10个、1-5个、1-4个、1-3个、2个或1个碱基不与靶多核苷酸互补。

15.用于靶多核苷酸编辑的系统，其特征在于所述系统包括权利要求1-14任一项中所述的寡核苷酸探针对，优选包括权利要求1-10任一项中所述的核酸酶。

16.用于靶多核苷酸编辑的试剂盒，其特征在于所述试剂盒包括权利要求1-14任一项中所述的寡核苷酸探针对，优选包括权利要求1-10任一项中所述的核酸酶。

17.一种在靶多核苷酸中切割大片段的方法，其特征在于采用了权利要求1-10任一项的靶多核苷酸编辑方法。

18.如权利要求17所述的方法，所述的大片段长度大于所述寡核苷酸探针对与靶多核苷酸的结合位点的间隔，优选所述的大片段长度大于所述间隔1-10000bp、1-3000bp、1-2000bp、1-1000bp、1-500bp、1-200bp或1-100bp。

19.一种疾病细胞模型的制作方法，其特征在于采用了权利要求1-10、17、18任一项的方法或施用了权利要求11-14任一项所述的寡核苷酸探针对或权利要求15所述的用于靶多核苷酸编辑的系统或权利要求16所述的用于靶多核苷酸编辑的试剂盒。

20.一种疾病动物模型的制作方法，其特征在于采用了权利要求1-10、17、18任一项的方法或施用了权利要求11-14任一项所述的寡核苷酸探针对或权利要求15所述的用于靶多核苷酸编辑的系统或权利要求16所述的用于靶多核苷酸编辑的试剂盒。

21.一种疾病治疗方法，其特征在于采用了权利要求1-10、17、18任一项的方法或施用了权利要求11-14任一项所述的寡核苷酸探针对或权利要求15所述的用于靶多核苷酸编辑的系统或权利要求16所述的用于靶多核苷酸编辑的试剂盒。

22.如权利要求21所述的疾病治疗方法，其中所述的疾病选自遗传相关疾病或非遗传相关疾病，优选所述的遗传相关疾病选自癌症、自身免疫疾病、糖尿病、血液病、心脏病、抑郁症、阿尔茨海默病、哮喘和神经疾病中的任一种。

23.一种植物突变体的制作方法，其特征在于采用了权利要求1-10、17、18任一项的方法或施用了权利要求11-14任一项所述的寡核苷酸探针对或权利要求15所述的用于靶多核苷酸编辑的系统或权利要求16所述的用于靶多核苷酸编辑的试剂盒。