CN112941107A

CN112941107A - 原核Argonaute蛋白的基因编辑应用

Info

Publication number: CN112941107A
Application number: CN202110365085.3A
Authority: CN
Inventors: 张智英; 邢佳妮; 麻丽霞; 闫强; 李鹏程; 徐坤; 程心珍; 闫娜娜; 孙永森; 李倩
Original assignee: Northwest A&F University
Current assignee: Northwest A&F University
Priority date: 2021-04-01
Filing date: 2021-04-01
Publication date: 2021-06-11
Anticipated expiration: 2041-04-01
Also published as: CN112941107B

Abstract

本发明公开了一种原核Argonaute蛋白的基因编辑应用，通过构建源于细菌的Argonaute蛋白的原核表达载体，以及在转化宿主细胞后对该Argonaute蛋白的表达载体和共转化载体的降解的检测以及基因组位点的检测，发现了其具有被特异性转录本激活并靶向特定DNA靶序列的能力，并且在真核细胞中转录的导向RNA的参与下，实现了对基因组靶序列进行inDel频率为3％的基因编辑。实验结果表明原核Argonaute蛋白可以用于细胞内基因编辑工具的开发。

Description

原核Argonaute蛋白的基因编辑应用

技术领域

本发明属于基因工程技术领域，涉及原核Argonaute(pAgo)蛋白的核酸酶特性以及通过其实现细胞内基因编辑工具的开发。

背景技术

基因编辑技术通常使用的基因编辑工具包括ZFNs(Kim,Skowron,zybalski 1996；Bitinaite et al.1998)和TALENs(Cermak et al.2011)，以及CRISPR/Cas9(Bikard etal.2012)。CRISPR/Cas9技术通过使用人工核酸酶对基因组DNA的目标位置引入双链断裂(Double strand breaks,DSBs)，利用细胞自身的修复途径，例如非同源末端连接(non-homologous end joining,NHEJ)，以及同源序列介导的同源重组(homologousrecombination,HR)来实现对目的基因序列的修改，能够比较精确的对生物体基因组特定目标基因位点进行修饰。但是CRISPR/Cas9技术也有一定缺陷，那就是对PAM序列的依赖(Garneau et al.2010)以及具有一定脱靶性(Zhang et al.2015)。对PAM序列的依赖使其在靶基因序列的选择上受到限制，脱靶性也造成了其在基因疾病治疗等领域应用时的潜在威胁。因此，开发出其他种类的基因编辑工具成为基因工程领域研究的重点。

原核Argonaute蛋白是细胞防御外源DNA入侵或者病毒感染的工具之一，具有降解外源DNA的能力，这一能力的发现始于荷兰瓦赫宁根大学的John van der Oost团队领衔发表的关于TtAgo作为一种以5'磷酸化的单链DNA(ssDNA)为导向序列的靶向切割互补的单链DNA序列的核酸酶(Swarts et al.2014)的研究报道。由于大多数原核Argonaute蛋白(pAgos)宿主菌的生存条件都较为极端，例如高热以及高盐，这就使得在宿主菌中研究其蛋白活性及其生理功能较为困难。

随着越来越多的关于古细菌、细菌的Argonaute蛋白与导向序列和靶序列在细胞外环境下共同孵育的实验的进行，证明了原核Argonaute蛋白的核酸切割活性。其中大多数原核Argonaute蛋白以DNA为酶作用底物(TtAgo(Swarts et al.2014)、PfAgo(Swarts etal.2015)、MpAgo(Doxzen and Doudna 2017；Kaya et al.2016)、MjAgo(Zander etal.2017)、CbAgo(Hegge et al.2019；Kuzmenko et al.2020)、RsAgo(Miyoshi etal.2016))，个别原核Argonaute蛋白也可以以RNA为酶作用底物(NgAgo(Qi et al.2016；Wuet al.2017)、RsAgo(Olovnikov et al.2013))；不同原核Argonaute蛋白的导向序列也不完全相同，有些需要导向序列的DNA 5'磷酸化修饰(TtAgo(Swarts et al.2014)、PfAgo(Swarts et al.2015)、MjAgo(Zander et al.2017)、CbAgo(Hegge et al.2019)、NgAgo(Qiet al.2016))，有些需要识别5'羟基化的DNA导向序列(MpAgo(Kaya et al.2016))。

目前已成功解析了多种pAgos的蛋白单体以及其与导向序列和靶序列的复合体的晶体结构(Liu et al.2018；Yuan et al.2005；Wang et al.2008)，获知了pAgos在与导向序列和靶序列结合的不同阶段的动态结构变化(Willkomm et al.2017)；并且获得了成熟的细胞外孵育实验条件，其中包括不同种类pAgos的反应温度、导向序列的长度和所需要的5'端修饰以及靶序列长度、形式和GC含量，还包括二价金属离子的类型(Ca²⁺、Mn²⁺、Mg²⁺)以及盐离子(Na⁺)浓度等。通过对在宿主菌以及异源表达的大肠杆菌中表达的pAgos所结合的核苷酸位点进行分离测序分析，获知了其所结合的短DNA和RNA的来源及在宿主菌和大肠杆菌基因组(Kuzmenko et al.2020；Hegge et al.2019)中的位置，以及与宿主菌中存在的天然大质粒(natural mega-plasmid)和原核表达载体的匹配区(Swarts et al.2014；Kuzmenko et al.2020；Hegge et al.2019)；并且结合CRISPR系统spacer序列获得的原理提出了不同于导向序列非依赖型的“切碎活性”(chopping activity)的新的pAgos获得导向序列的假设(Swarts et al.2017)。

尽管pAgos可以协同细胞内DSB修复机制，利用其自身核酸酶活性，帮助细胞抵御外源DNA的入侵(Kuzmenko et al.2020)，该过程类似于CRISPR系统获得spacer序列的原理，是由于复制叉的停顿，复制叉大量积累，复制过程中产生大量的DSB，募集RecBCD蛋白复合体至DNA断裂处，由chi位点的下游向上游处进行切割，期间由RecBCD蛋白在DNA断裂处产生的短的DNA片段作为CbAgo的导向核苷酸，引发CbAgo在多拷贝遗传元件，例如质粒、转座子以及基因组的重复位点之间进行切割。

但目前已公开的pAgos大部分来源于嗜热菌，在细胞外切割实验中反应温度高于65℃，甚至达到85℃、98℃(Swarts et al.2014；Swarts et al.2015；Zander etal.2017)，这样的温度条件下DNA双链呈解旋状态，实验结果无法完全反映其对双链DNA的作用。通过对嗜热菌来源的Argonaute蛋白在常温或低温下进行细胞外切割实验，已证实其无法满足被改造应用于哺乳动物细胞内基因组编辑的条件，例如，表现为低活性的切割和缺乏靶向性。而目前报道的其他来源的原核Argonaute蛋白，例如，源于丁酸梭菌(Clostridium butyricum)的Argonaute(CbAgo)蛋白以及源于格氏嗜盐碱杆菌(Natronobacterium gregoryi)的Argonaute(NgAgo)蛋白，其在更具代表性的生理条件(例如，37℃)下，并未获得在细胞内靶向切割DNA的结果。

发明内容

本发明的目的在于提供一种原核Argonaute蛋白的基因编辑应用。

为达到上述目的，本发明采用了以下技术方案：

一种基于pAgo的基因编辑系统，该基因编辑系统包括核酸酶表达载体，所述核酸酶表达载体包括通过启动子的调控实现表达的原核Argonaute蛋白基因序列，所述核酸酶表达载体表达的原核Argonaute蛋白具有被转录本激活并靶向该转录本对应DNA序列的核酸酶活性，例如，在原核Argonaute蛋白借助单链DNA片段结合其他共转载体转录形成的导向RNA后靶向切割真核细胞基因组DNA，或在原核细胞中外源性DNA的特异性转录本存在情况下靶向切割该外源性DNA及其他外源DNA(同样含有特异性启动子的载体DNA或噬菌体DNA)。

优选的，所述原核Argonaute蛋白基因序列选自NgAgo蛋白基因序列、TtAgo蛋白基因序列或选自根据目标宿主细胞(例如，哺乳动物细胞等真核细胞)的密码子偏好优化后的NgAgo、TtAgo蛋白基因序列(例如，hNgAgo蛋白基因序列)。

优选的，所述基因编辑系统还包括RNA导引激活序列表达载体，RNA导引激活序列表达载体包括通过启动子的调控实现作为所述转录本的RNA导引激活序列的表达的模板。

优选的，所述RNA导引激活序列选自目标宿主细胞基因组靶序列的同源序列，例如，导向RNA。

优选的，所述RNA导引激活序列的长度大于10nt，但是考虑到蛋白结合位阻效应和激活能力的实现，进一步优选为16～50nt。

优选的，所述启动子选自T7启动子、阿拉伯糖启动子、CMV启动子或U6类启动子(其中，T7启动子、阿拉伯糖启动子为特异性启动子)。

优选的，所述基因编辑系统还包括与RNA导引激活序列互补配对的单链DNA片段。

优选的，所述基因编辑系统中，核酸酶表达载体含量按物质的量计为单链DNA片段含量的3倍以内，从而使表达的原核Argonaute蛋白通过切碎活性得到足以用于耦联自身与RNA导引激活序列的单链DNA结合片段。

优选的，所述基因编辑系统还包括报告载体，所述报告载体包括用于表达报告基因(例如，红色荧光蛋白RFP等荧光蛋白基因)的表达盒，所述表达盒包括报告基因序列以及位于该序列上游的与目标宿主细胞基因组靶序列同源的序列。

优选的，所述基因编辑系统还包括用于进行同源重组修复的供体载体。

优选的，所述目标宿主细胞选自哺乳动物细胞等真核细胞，基因编辑系统采用转染试剂递送至细胞内，然后在细胞生理条件所允许范围内进行培养并表达原核Argonaute蛋白以及RNA导引激活序列。

本发明的有益效果体现在：

本发明发现了原核Argonaute蛋白具有被转录本激活并靶向特定DNA序列的能力，从而可以借助其核酸酶活性实现对诸如基因组靶序列所在位点进行切割，并且位点处无需PAM序列。实验结果表明原核Argonaute蛋白可以用于细胞内基因编辑工具的开发。

进一步的，借助大肠杆菌原核诱导表达系统(BL21/pET)，将原核Argonaute蛋白的表达载体转化大肠杆菌BL21(DE3)，经IPTG诱导，证明了TtAgo蛋白和NgAgo蛋白在大肠杆菌细胞内(37℃)具有特异性降解DNA的能力；在哺乳动物HEK 293T细胞中，通过共表达hNgAgo以及导向RNA，使得结合了小片段单链DNA的hNgAgo靶向基因组和报告载体中嵌入的相应基因靶序列并进行切割，通过高通量测序分析证明对基因组实现了靶向编辑。

附图说明

图1-1为表达载体pET28a-TtAgo(简称为pET28a-Tt)图谱。

图1-2为表达载体pET28a-NgAgo(简称pET28a-Ng)图谱。

图1-3为载体pUC57-delta dapD(简称pUC57-ΔdapD)图谱。

图1-4为载体pUC57-T7-delta dapD(简称pUC57-T7-ΔdapD)图谱。

图1-5为表达载体pcDNA3.1-CMV-hNgAgo(简称pcDNA3.1-CMV-hNg)图谱。

图1-6为表达载体pmsg-ALA gRNA(简称msgRNA-ALA)图谱。

图1-7为报告载体pPGR-AAVS1图谱。

图1-8为HEK 293T细胞中报告载体pPGR-AAVS1工作原理示意图。

图2-1为pET28a-TtAgo、pET28a-NgAgo在BL21(DE3)细胞中经IPTG诱导后质粒产量统计图。

图2-2为等体积来源于IPTG诱导不同时间、撤掉IPTG后继续培养以及未诱导的pET28a-TtAgo、pET28a-NgAgo质粒琼脂糖凝胶电泳图。

图2-3为pET28a-TtAgo、pET28a-NgAgo、pET28a转化后在LB+kan、LB+Kan+IPTG、LB、LB+IPTG培养板上的菌斑鉴定图。

图2-4为pET28a-TtAgo、pET28a-NgAgo的蛋白表达鉴定图。

图2-5为pET28a-pBAD-NgAgo、pET28a-pBAD-TtAgo转化后在LB+kan、LB+Kan+arabinose、LB、LB+arabinose培养板上的菌斑鉴定图。

图2-6为pET28a-LacP-TtAgo、pET28a-LacP-NgAgo、pET28a-rhaP-TtAgo、pET28a-rhaP-NgAgo转化后在LB+kan、LB+Kan+IPTG/LB+Kan+rha培养板上的菌斑鉴定图。

图2-7为pET28a-LacP-TtAgo、pET28a-LacP-NgAgo、pET28a-rhaP-NgAgo蛋白表达鉴定图。

图2-8为pET28a-NgAgo/pET28a-TtAgo与pUC57-ΔdapD/pUC57-T7-ΔdapD分别共同转化后在LB+Kan+Amp、LB+Kan+IPTG、LB+Amp+IPTG培养板上的菌斑鉴定图。

图2-9为pET28a-NgAgo与pUC57-ΔdapD/pUC57-T7-ΔdapD共同转化并经IPTG诱导4小时后pUC57骨架载体半定量琼脂糖凝胶电泳图(扩增引物dapD-F/R，扩增产物～200bp)；其中，泳道1、3：pET28a-NgAgo+pUC57-ΔdapD(未诱导)，泳道2、4：泳道1、3质粒+IPTG诱导4小时；泳道5、7：pET28a-NgAgo+pUC57-T7-ΔdapD(未诱导)；泳道6、8：泳道5、7质粒+IPTG诱导4小时。

图2-10为在大肠杆菌中表达NgAgo和TtAgo后T7噬菌体噬菌斑(PFU)形成数目统计。

图2-11为NgAgo和TtAgo降解T7噬菌体基因组DNA(Marker为M1)以及PCR鉴定T7噬菌体基因组DNA(Marker为M2)的琼脂糖凝胶电泳图。

图2-12为pcDNA3.1-CMV-hNg、msgRNA-ALA和pPGR-AAVS1共转染HEK 293T细胞后基因组编辑结果统计，其中：靶序列的参考序列为ctgtcccctccaccccacag。

具体实施方式

以下结合附图和实施例对本发明作进一步的详细说明。所述实施例仅用于解释本发明，而非对本发明保护范围的限制。

本发明在实验室常用的工程菌，例如大肠杆菌BL21(DE3)中重新构建源于嗜热菌(Thermus thermophiles)HB27菌株的TtAgo蛋白和源于格氏嗜盐碱杆菌(Natronobacterium gregoryi)的NgAgo蛋白的表达系统，并利用这些原核Argonaute蛋白在细胞内的活性与对外源DNA(例如，质粒DNA等)入侵后产生的表型，研究原核Argonaute蛋白在体内的新的工作机制，以期将其改造并应用于原核细胞和真核细胞的基因编辑。

(一)TtAgo、NgAgo表达载体及其他相关工具载体构建

1.原核表达载体pET28a-TtAgo、pET28a-NgAgo构建

将人工合成的TtAgo基因(GenBank ID:AP008227)克隆于pUC57-simple载体中的EcoRV位点之间(由上海闪晶分子生物科技有限公司合成并克隆)。然后利用两端带有酶切位点的引物扩增TtAgo基因开放阅读框的序列并插入于原核表达载体pET28a(优宝生物，VT1207)的NdeI和HindIII之间，使得插入的TtAgo基因开放阅读框5’端含有Thrombin site位点以及用于蛋白检测的6×His-tag标签，并由IPTG诱导型T7启动子(T7 promoter，T7P)调控表达，经转化大肠杆菌DH5α感受态细胞(C1100，索莱宝)从而获得pET28a-TtAgo(图1-1)。其中，TtAgo基因开放阅读框如SEQ.ID.NO.1所示；扩增引物为：

NdeI-Tt-F：5’-ggaattcCATATGAACCACCTTGGAAAAACGGAAG-3’

HindIII-TAA-TtV685-R：5’-cccAAGCTTttaAACGAAGAAGAGCTTTTCCC-3’

参见图1-2，pET28a-NgAgo具有与pET28a-TtAgo相同的元件结构，仅是表达的目标蛋白不同，pET28a-NgAgo的相应质粒由山西大学张婷婷博士赠予，其中，NgAgo基因开放阅读框如SEQ.ID.NO.2所示。

pET28-TtAgo、pET28-NgAgo中还含有卡那霉素(Kanamycin，Kan)抗性基因(KanR)。

2.原核表达载体pET28a-pBAD-TtAgo、pET28a-pBAD-NgAgo构建

阿拉伯糖诱导型启动子(araBAD promoter，pBAD)及相关阿拉伯糖操纵子C蛋白编码序列(araC)克隆自pKD46载体((优宝生物，VT1692)，扩增引物为：

BglII-araC-R：5’-caAGATCTCCCCGAAAAGTGCC-3’

XbaI-pBAD-R：5’-tgcTCTAGAGAATTCCCAAAAAA-3’

将扩增产物替代pET28a-TtAgo中原T7启动子序列以及乳糖操作子(lacoperator，LacO)序列，经转化大肠杆菌DH5α感受态细胞获得pET28a-pBAD-TtAgo；将扩增产物替代pET28a-NgAgo中原T7启动子序列以及LacO序列，经转化大肠杆菌DH5α感受态细胞获得pET28a-pBAD-NgAgo。

3.载体pUC57-ΔdapD、pUC57-T7-ΔdapD构建

以大肠杆菌BL21(DE3)(C1400，索莱宝)基因组DNA为模板，利用以下引物扩增200bp dapD序列(dapD-200)：

XhoI-dapD-F：5’-aatCTCGAGCCGTATTAATGATAATCAGG-3’

HindIII-dapD-R：5’-aatAAGCTTCATATGCGCCGA-3’

将扩增产物(目的片段为dapD-200)克隆于实验室保存的pUC57-simple载体(P0088,淼灵平台)中的XhoI/HindIII位点之间，所得载体命名为pUC57-ΔdapD(图1-3)。

以pUC57-ΔdapD为模板，用引物HindIII-dapD-R和dapD-overlap-F扩增片段1A，用引物XhoI-T7P-dapD-F和dapD-T7P-overlap-R扩增片段2A，将片段1A和2A回收，以1:1的比例混合(总DNA量50～100ng)，作为重叠PCR的模板，用引物XhoI-T7P-dapD-F和HindIII-dapD-R扩增出序列T7P-dapD(由T7启动子序列和上述dapD-200串联组成)，用XhoI和HindIII对pUC57-ΔdapD载体和切胶回收后的重叠PCR产物酶切，然后经连接、转化，最终获得pUC57-T7-ΔdapD载体(图1-4)。

XhoI-T7P-dapD-F：5’-aatCTCGAGTAATACGACTCACTATAGGGCCGTATTAATGATAATCAGG-3’

dapD-T7P-overlap-R：5’-CCTGATTATCATTAATACGG-3’

dapD-overlap-F：5’-CCGTATTAATGATAATCAGG-3’

pUC57-ΔdapD、pUC57-T7-ΔdapD中还含有氨苄青霉素(Amp)抗性基因(AmpR)。

4.载体pcDNA3.1-CMV-hNgAgo、pmsg-ALA gRNA、pPGR-AAVS1构建

(1)pcDNA3.1-CMV-hNgAgo由华南师范大学任充华博士赠予(PMID：29584750)，其是将密码子人源化的NgAgo基因(hNgAgo基因)开放阅读框替换实验室原有Cas9通用表达载体pcDNA3.1-NLS-SpCas9中的Cas9元件(由CMV启动子调控表达)而得到(参见图1-5)。

(2)pPGR-AAVS1的具体构建步骤如下：

2.1从载体pTLR repair vector(addgene:#64322)中扩增P2A-RFP-pA元件(其中，pA代表polyA，RFP代表RFP基因开放阅读框)；扩增引物为：

P2A-RFP-pA-F(PstI)：5’-AAGCTGCAGTAGACGCGTTGGCCACGAAC-3’

P2A-RFP-Pa-R(XhoI)：5’-TAACTCGAGCCATAGAGCCCACCGCATCC-3’；

后续用PstI和XhoI酶切P2A-RFP-pA元件扩增产物用于pPGR-AAVS1组装；

从载体pB-CMV-DsRed-CAG-puro(AAVS1)-T2A-GFP(PMID：25725802)中扩增T2A-GFP元件(其中，GFP代表GFP基因开放阅读框)；扩增引物为：

T2A-GFP-F(BglII)：5’-TGGAGATCTGGCAGTGGAGAGGGCAGAGG-3’

T2A-GFP-R(PstI)：5’-CTACTGCAGCTTGTACAGCTCGTCCATGC-3’；

2.2将AAVS1基因靶序列插入GFP基因开放阅读框中；

以扩增T2A-GFP元件所得产物为模板，利用引物T2A-GFP-F(BglII)和AAVS1-R(BamHI)扩增片段1B；利用引物AAVS1-F(HindIII)和T2A-GFP-R(PstI)扩增片段2B；将片段1B和2B回收后混合作为模板，用引物T2A-GFP-F(BglII)和T2A-GFP-R(PstI)扩增片段3B，在片段3B中AAVS1基因靶序列替换了以上T2A-GFP元件中GFP基因的部分序列。后续用BglII和PstI酶切片段3B用于pPGR-AAVS1组装。

AAVS1-R(BamHI)：5’-CTGTGGGGTGGAGGGGACAGGGATCCGAAGAAGATGGTGCGCTCC-3’

AAVS1-F(HindIII)：5’-CTGTCCCCTCCACCCCACAGTGGAAGCTTCACAAGCTGGAGTACAACTAC-3’；

2.3组装PCR扩增后元件(P2A-RFP-pA元件、片段3B)于骨架载体pB-CBh-puro中，得到载体pPGR-AAVS1，其中，所述骨架载体包括由CBh启动子(pCBh)调控的嘌呤霉素(puromycin)抗性基因(puroR)表达盒以及由T7启动子调控的AmpR表达盒。

载体pPGR-AAVS1(图1-7)中重组表达盒pCBh-PuroR-T2A-GFP(AAVS1target)-P2A-TagRFP-bGH polyA，是在原嘌呤霉素抗性基因表达盒的嘌呤霉素抗性基因开放阅读框后，由T2A剪切肽序列串联因插入了AAVS1基因靶序列而无法正常表达的绿色荧光蛋白GFP的基因序列(来自片段3B)，在该基因序列后再由P2A剪切肽序列串联因整个开放阅读框移码造成转录提前终止而无法正常表达的红色荧光蛋白RFP的基因序列(来自P2A-RFP-pA元件)，从而完成对原嘌呤霉素抗性基因表达盒的重组。若通过原核Argonaute蛋白的作用，所述靶序列处产生双链断裂(DSBs)并由哺乳动物细胞内NHEJ修复机制修复，那么修复过程中产生的碱基插入和缺失(InDels)，会有三分之一概率恢复重组表达盒整个开放阅读框的转录及翻译，使得重组表达盒中的RFP基因序列正常表达红色荧光蛋白，实现对基因编辑细胞的标记(故RFP基因序列也称为TagRFP)。

(3)msgRNA-ALA是采用实验室前期构建的由U6启动子调控表达的短片段RNA(20nt)的表达载体(PMID：27941919)。所述短片段RNA的转录模板(AAVS1a sgRNA，参见图1-6)在msgRNA-ALA中为两段，之间通过LIG4 shRNA序列连接，而转录产物中LIG4 shRNA序列的对应部分在细胞内完成切割，从而形成所述短片段RNA。所述短片段RNA的转录模板可以根据哺乳动物细胞基因组目标基因编辑位点序列不同进行调整，并作为激活所述细胞内表达的原核Argonaute蛋白的靶向切割活性的元件。

(二)在大肠杆菌BL21(DE3)中表达TtAgo以及NgAgo的实验

1.pET28a-TtAgo、pET28a-NgAgo、pET28a经电转化BL21(DE3)感受态，挑取在LB+Kan培养板上生长的单克隆接种于LB+Kan液体培养基中培养至OD₆₀₀约为0.5，然后将菌液一分为二，一份立即置于4℃冰箱保存，以停止细菌生长，待提取质粒(诱导前组)；另一份加入终浓度为0.5mM的IPTG诱导3小时(诱导后组)，诱导结束后测量菌液OD₆₀₀值，并与诱导前组菌液一起提取质粒，并统计质粒产量(ng/OD₆₀₀)。参见图2-1，经过IPTG诱导，pET28a-TtAgo、pET28a-NgAgo的质粒产量(ng/OD₆₀₀)经过IPTG诱导3小时后显著降低；对照组空载体(pET28a)经过IPTG诱导3小时后，质粒产量显著增加。

2.同样将pET28a-TtAgo、pET28a-NgAgo经电转化BL21(DE3)感受态，挑取在LB+Kan培养板上生长的单克隆接种于LB+Kan液体培养基中培养至OD₆₀₀约为0.5，然后将菌液一分为二，一份用终浓度为0.5mM的IPTG诱导(诱导组)，一份不添加IPTG(未诱导组)，诱导组分别取在37℃培养2小时、3小时和4小时的菌液提取质粒，未诱导组进行同样的操作。诱导组质粒产量(ng/OD₆₀₀)会随着培养时间的增加而降低，未诱导组在培养期间质粒产量逐渐增加。参见图2-2，取等量的从等体积菌液中提取的质粒直接进行琼脂糖凝胶电泳检测，可以发现IPTG诱导下，质粒浓度随着培养时间的延长而减少。将IPTG诱导4小时后的菌液通过离心，水洗细胞沉淀并更换为新鲜的不含IPTG的LB+Kan液体培养基，继续培养2小时后取菌液提取质粒，同时对不添加IPTG持续培养5、6小时后的菌液提取质粒；在取等量的从等体积菌液中提取的质粒进行琼脂糖凝胶电泳检测后发现，IPTG诱导4小时后撤掉诱导剂(IPTG)并继续培养2小时并不能恢复质粒产量。

以上结果表明，在BL21(DE3)中经IPTG诱导噬菌体T7启动子调控表达TtAgo蛋白、NgAgo蛋白后，会导致蛋白自身表达载体(pET28a-TtAgo、pET28a-NgAgo)的丢失，并且IPTG诱导表达TtAgo以及NgAgo蛋白导致的质粒(表达载体)丢失是不可逆的。

3.菌斑实验：从LB+Kan培养板上生长的转化有pET28a-TtAgo、pET28a-NgAgo、pET28a的大肠杆菌BL21(DE3)中分别各挑取3个单克隆，接种于LB+Kan液体培养基中，培养至菌液OD₆₀₀大约为0.5左右，将菌液稀释100倍，再以100倍稀释为梯度，倍比稀释至10^-6。取5μL稀释后的菌悬液点在LB+Kan、LB+Kan+IPTG、LB、LB+IPTG培养板上，其中，IPTG终浓度为0.1mM。待培养板表面液滴吹干后，将培养板倒置于37℃恒温培养箱中培养20小时，观察菌斑形成。菌斑实验结果(图2-3)表明IPTG诱导表达TtAgo以及NgAgo蛋白对BL21(DE3)的生长无明显影响，即对BL21(DE3)的基因组DNA无作用。

4.蛋白鉴定：从LB+Kan培养板上生长的转化有表达载体pET28a-TtAgo、pET28a-NgAgo的大肠杆菌BL21(DE3)中分别各挑取1个单克隆，接种于LB+Kan液体培养基中，过夜培养至菌液饱和，第二天将饱和菌液以1:50的比例接种于10mL LB+Kan液体培养基中培养至菌液OD₆₀₀至0.5左右时，在菌液中加入终浓度为0.5mM的IPTG，在37℃诱导4小时。诱导结束后离心收集菌体，并用灭菌水水洗菌体后，将菌体冻存于-80℃(待超声波破碎，提取蛋白)。将冷冻后的菌体重悬于400μL超声波破碎缓冲液(50mM Tris-HCl、150mM NaCl以及5％glycerol，pH 8.0)中，并加入终浓度为1mM的蛋白酶抑制剂(PMSF)。用手持超声波破碎仪(Hielscher，UP50H)配以5mm的探头，以60％的振幅，间歇0.5s进行菌体破碎，全程操作应置于冰上，以减少超声波破碎带来的热量造成的蛋白质降解。破碎至离心管中液体由混浊状态变得清亮即可。4℃离心10分钟，分离蛋白上清和沉淀，取40μL上清与10μL 5×SDS-PAGE上样缓冲液混合，并用30μL 5×SDS-PAGE上样缓冲液重悬沉淀，将混有上样缓冲液的蛋白上清样品和沉淀样品置于沸水中加热煮沸约10分钟，瞬时离心将管壁的液体离心至管底，置于4℃冰箱短期内保存，待上样检测。其中，5×SDS-PAGE上样缓冲液配方为：250mM Tris-HCl(pH 6.8)、10％(W/V)SDS、0.5％(W/V)BPB、50％(V/V)glycerol以及5％(V/V)2-ME。

将样品上样10％的聚丙烯酰胺变性胶(SDS-PAGE)，经电泳、转膜及封闭后，一抗采用抗His标签鼠单克隆抗体(1:10000；Proteintech，Cat#66005-1-Ig)，在水平摇床上室温孵育1.5小时，用TBST杂交清洗液清洗PVDF膜3次，每次10分钟。二抗采用羊抗鼠多克隆抗体(1:2000；CWBIO，Cat#CW0102S)，在水平摇床上室温孵育1小时，同样用TBST杂交清洗液清洗PVDF膜3次，每次10分钟。然用镊子夹取PVDF膜边缘置于滤纸上，吸干膜表面水分。与ECL发光液混合，置于凝胶成像仪(MicroChemi，DNR)中曝光，检测目的蛋白条带。

参见图2-4，实验结果与TtAgo蛋白、NgAgo蛋白预期分子量一致，并且蛋白在上清和全菌中有高效表达，说明在37℃表达的TtAgo蛋白和NgAgo蛋白没有对细菌生长产生影响，即表达的蛋白对细胞没有毒性，未见蛋白以包含体的形式在沉淀中大量表达。

5.将表达载体pET28a-pBAD-NgAgo、pET28a-pBAD-TtAgo经阿拉伯糖诱导，菌斑实验结果表明同样可以导致蛋白自身表达载体的丢失(图2-5)。但是将T7启动子更换为乳糖启动子(LacP)以及鼠李糖启动子(rhaP)后，对于所得的相应表达载体(pET28a-LacP-TtAgo、pET28a-LacP-NgAgo以及pET28a-rhaP-TtAgo、pET28a-rhaP-NgAgo)，尽管NgAgo及TtAgo蛋白在IPTG诱导或鼠李糖诱导后有表达(图2-7)，但是并不降解蛋白自身表达载体(图2-6)。

以上结果表明，TtAgo以及NgAgo蛋白细胞内的核酸酶活性需要由特异性启动子(例如，T7启动子、pBAD)调控下表达的RNA激活。

6.以上实验中发现，TtAgo以及NgAgo蛋白只降低含有特异性启动子转录本的细胞中蛋白自身表达质粒产量，即具有启动子特异性识别并被特异性转录本激活核酸酶功能的特性，进一步将pET28a-TtAgo、pET28a-NgAgo分别与具有氨苄青霉素抗性的pUC57载体共转化，其中一个pUC57载体中只克隆有200bp的大肠杆菌dapD基因片段(XhoI/HindIII)，即pUC57-ΔdapD；另一个pUC57载体中克隆有T7启动子序列以及相同的200bp大肠杆菌dapD基因片段(XhoI/HindIII)，即pUC57-T7-ΔdapD，具体实验操作如下：将pUC57-ΔdapD和pUC57-T7-ΔdapD分别与pAgo表达质粒(pET28a-NgAgo或pET28a-TtAgo)共转化大肠杆菌BL21(DE3)感受态，挑取LB+Kan+Amp培养板上生长的单克隆接种于LB+Kan+Amp液体培养基中培养至菌液OD₆₀₀约为0.5，将菌液一分为二，一份用终浓度为0.5mM的IPTG在37℃诱导4小时，一份不添加IPTG，在37℃持续培养4小时，分别提取质粒。以提取的混合质粒为模板，分别扩增载体上的dapD基因片段(采用经典PCR三步法扩增，每5个循环取出一管扩增产物，共25个循环)，对混合质粒中以pUC57-simple为骨架的质粒进行半定量，扩增引物为：

dapD-F：5’-CCGTATTAATGATAATCAGG-3’

dapD-R：5’-CATATGCGCCGATGTTGACG-3’

对扩增产物直接进行琼脂糖凝胶电泳检测，可以发现IPTG诱导后pAgo表达质粒与pUC57-T7-ΔdapD共转化组的dapD基因片段的扩增产物浓度在循环数5、10、15时，明显低于pAgo表达质粒与pUC57-ΔdapD质粒共转化组，并且共转化pUC57-T7-ΔdapD组的扩增产物在相同循环数下，IPTG诱导后的扩增产物浓度也低于未诱导，说明IPTG诱导pAgo(NgAgo或TtAgo)的表达可以同时降低含有T7启动子的共转质粒(例如，pUC57-T7-ΔdapD)含量，对不含有T7启动子的共转质粒(例如，pUC57-ΔdapD)产量无影响(图2-9)。通过菌斑实验可得知，IPTG诱导表达的TtAgo以及NgAgo蛋白对BL21(DE3)的生长无明显影响，即对BL21(DE3)的基因组DNA无作用，对自身表达载体以及共转化的pUC57-T7-ΔdapD载体的菌斑形成有影响(图2-8)。

以上结果表明，pAgo表达质粒表达的TtAgo及NgAgo蛋白，可以在细胞内靶向含有特异性启动子(例如，噬菌体T7启动子)的共转载体，TtAgo以及NgAgo蛋白对特异性转录本的识别同样可以适用于共转载体。

7.将pET28a-TtAgo、pET28a-NgAgo分别转化大肠杆菌BL21(DE3)感受态细胞后，挑取转化有pET28a-TtAgo、pET28a-NgAgo的单克隆，以及未转化载体的BL21(DE3)单克隆，分别接种于LB+Kan以及LB液体培养基中，在37℃培养至菌液OD₆₀₀为0.5左右，在pET28a-NgAgo、pET28a-TtAgo转化组菌液中加入终浓度为0.5mM的IPTG诱导TtAgo蛋白表达2小时，诱导2小时后再次测量菌液OD₆₀₀值，取0.5OD(～2.5×10⁸个细胞)细胞与100μL噬菌体储存液(phage stock)混匀，在37℃孵育30分钟后将所得噬菌体与BL21(DE3)细胞混合液加入4mL 0.8％的上层琼脂糖培养基中，混合均匀后侵倒于尚未凝固的LB培养板上，待上层凝固后，将培养板倒置于37℃培养箱中，大约4小时后可观察到噬菌斑的形成，对实验组(pET28a-TtAgo及pET28a-NgAgo转化组)和对照组(未转化载体，BL21(DE3)空细胞)进行噬菌斑计数及统计分析。结果显示(图2-10)，与BL21(DE3)空细胞相比，TtAgo蛋白、NgAgo蛋白的表达可以极显著地降低噬菌斑的数目(约10⁴个数量级)，说明TtAgo蛋白和NgAgo蛋白对于外源入侵的T7噬菌体DNA有降解作用，破坏了T7噬菌体基因组DNA。通过对实验组以及对照组噬菌体基因组DNA的琼脂糖凝胶电泳检测可以发现，实验组噬菌体基因组DNA呈现弥散状态并且都为短片段，而对照组噬菌体基因组DNA为线性化的单一条带且大小也与目的条带大小一致；用引物扩增T7噬菌体基因组T7p17基因：

T7p17-F：5’-ATGGCTAAGAAGATTTTCAC-3’

T7p17-R：5’-TTAGAAGTCTCCGTCTTCGT-3’

T7p17-F/R特异性的在T7噬菌体侵染的BL21(DE3)空细胞中扩增出目的条带(～699bp)，在T7噬菌体侵染的pET28a-TtAgo、pET28a-NgAgo转化组和未加T7噬菌体的BL21(DE3)空细胞中没有扩增出目的条带(图2-11)。

8.综合以上实验结果为基于原核Argonaute蛋白(pAgo蛋白)的基因编辑工具的开发提供了数据支持，具体说明如下。本发明将源于Natrono bacterium gregoryi的NgAgo蛋白以及源于Thermus thermophiles HB27菌株的TtAgo蛋白重新构建于实验室常见的大肠杆菌BL21(DE3)中，并进行原核表达；发现NgAgo蛋白以及TtAgo蛋白在37℃具有核酸酶活性，并且该活性是被特异性启动子的转录产物激活，所述特异性启动子包括驱动pAgo基因表达的噬菌体T7启动子等；T7启动子控制表达的pAgo基因转录本(RNA)能够激活已经翻译形成的pAgo蛋白的核酸酶活性，表现为可以降解pAgo蛋白的表达载体，导致质粒产量的下降或者细胞完全丢失质粒；与含有特异性启动子的另一载体共转化后，可以导致两个载体的丢失，相反的，若共转化载体不含有特异性启动子，即不会产生特异性启动子的转录本，那么在相同条件下，pAgo蛋白的表达只会使得pAgo蛋白表达载体产量下降而共转载体产量不受影响；噬菌体T7启动子表达的TtAgo蛋白和NgAgo蛋白通过降解T7噬菌体基因组DNA来保护宿主细菌不受噬菌体的侵染，表现为极显著地降低T7噬菌体形成的噬菌斑的数目；这些结果都与pAgo蛋白(例如，NgAgo、TtAgo)作为细菌与古细菌的防御系统的报道一致。也就是说，原核Argonaute蛋白具有被改造为新一代基因编辑工具的潜力。

(三)哺乳动物真核细胞转染实验

1.hNgAgo靶向编辑HEK 293T细胞AAVS1a基因位点的实验操作

1)通过对上述NgAgo蛋白依据目标编辑细胞的种属内密码子偏好性进行优化后得到hNgAgo基因开放阅读框(如SEQ.ID.NO.3所示)，并获得hNgAgo蛋白表达载体。

2)实验分组

组I(外加DNA序列)：将hNgAgo蛋白表达载体(pcDNA3.1-CMV-hNgAgo)、表达导向RNA的载体(pmsg-ALA gRNA)、与AAVS1基因靶序列互补配对的单链DNA(ssDNA)以及报告载体(pPGR-AAVS1)共转染HEK 293T细胞。转染HEK 293T细胞时，ssDNA:hNgAgo蛋白表达载体＝1:3(ssDNA用量不建议小于此比例)，ssDNA用量为100nM。

组II(无外加DNA序列)：将pcDNA3.1-CMV-hNgAgo、pmsg-ALA gRNA以及pPGR-AAVS1共转染HEK 293T细胞。

3)转染步骤参照转染试剂Hieff(上海翊圣生物科技有限公司)的使用说明，转染48小时(培养条件：37℃，5％CO₂)后在倒置显微镜下观察红色荧光细胞数目(代表了编辑效率)。

4)哺乳动物细胞基因组提取及靶序列编辑的检测

转染48小时后参照基因组提取试剂盒(Tiangen)操作说明提取细胞基因组；扩增基因组AAVS1a基因靶序列所在位点上下游各100bp的基因序列，扩增引物两端带有barcode序列用于后续高通量测序，扩增引物如下：

AAVS1a-F：5’-ACAGCATGTTTGCTGCCTCCAG-3’

AAVS1a-R：5’-CTAACAGGAGGTGGGGGTTAGA-3’

2.实验结果及分析

参见图1-8，由pcDNA3.1-CMV-hNgAgo利用其CMV启动子调控表达的hNgAgo蛋白(人源化的NgAgo蛋白)，与由pmsg-ALA gRNA利用其U6启动子表达的导向RNA一起，靶向HEK293T细胞中人基因组AAVS1a基因位点同时靶向报告载体相应序列，其中，位点序列为ctgtcccctccaccccacag(位点仅具有靶序列，没有PAM序列)。报告载体pPGR-AAVS1中GFP基因序列被插入的靶序列打断，靶序列处发生DSB后通过非同源性末端连接(Non-homologousend joining，NHEJ)进行修复(假如提供供体载体，还可以进行同源重组修复，但考虑到同源重组修复效率较低，故未考虑供体载体)。修复后GFP基因序列中产生的碱基插入或缺失，可以作为产生DNA断裂的依据(若下游由P2A串联的完整的RFP基因序列恢复转录及翻译，则表达的红色荧光蛋白对此予以显示)。

各分组阳性率结果：参见图2-12，PCR扩增基因组AAVS1a基因位点上下游各100bp后，二代测序结果总读数为490764，删除频率低于0.001的结果，统计InDel频率。结果表明，组I中hNgAgo蛋白在导向RNA的作用下，靶向人基因组AAVS1a基因位点的InDels频率(即编辑效率)约为3％；组II中没有在位点附近位置检测到InDels。

对组I和组II结果差异进行分析：由于组II中没有提供单链DNA作为hNgAgo蛋白chopping的底物(通过chopping形成DNA短序列)，而只有结合了足够多的仍与导向RNA互补配对的DNA短序列后，经导向RNA的激活，hNgAgo蛋白才会在靶序列附近进行切割。

(四)原核Argonaute蛋白在哺乳动物细胞内实现基因编辑的作用机制

本发明通过对前人对于Argonaute复合体(Ago Complex)的结构解析和结构转换以及一系列体外(in-vitro)DNA、基因组DNA切割实验的结果进行总结分析，同时根据在原核细胞和真核细胞中实验获得的结果，提出原核Argonaute蛋白(pAgo蛋白)在细胞生理状态下靶向切割外源DNA(载体DNA或者噬菌体DNA)和细胞基因组的工作原理：pAgo蛋白在细胞内表达后通过固有的切碎(chopping)功能对外源入侵的DNA或宿主菌基因组进行非特异性和低活性的切割，产生微量小片段单链DNA并结合在pAgo蛋白上，这些小片段单链DNA具有有限的导向作用(无靶向性)，结合这些DNA的pAgo蛋白作为类似于哺乳生物免疫监测系统存在于细胞内(处于待激活状态)，pAgo蛋白的核酸酶活性需要外源入侵基因表达的RNA来激活。而且这种激活依赖于pAgo蛋白结合的单链DNA与表达的RNA的配对。激活后的pAgo蛋白以结合的单链DNA为导向(靶向性提高)，能够迅速高效降解外源入侵的DNA以及切割基因组上作为靶序列的同源序列。

总之，本发明利用原核Argonaute蛋白在原核细胞和真核细胞中都实现了其核酸酶活性，为其进一步在基因编辑中的应用奠定了基础。相较于大部分已报道的pAgos蛋白研究都是基于结构分析以及细胞外(in-vitro)DNA切割试验，本发明中的数据主要都来源于细胞内实验(蛋白质在体外环境和细胞中实际的工作环境是有很大差别的，DNA的存在方式也存在差异)，突破了对于原核Argonaute蛋白作为核酸酶的功能活性的认知，实验结果(靶向切割活性及编辑效率)也更具有说服力。

<110> 西北农林科技大学

<120> 原核Argonaute蛋白的基因编辑应用

<160> 25

<210>1

<211> 2058

<212> DNA

<213> TtAgo

<400> 1

atgaaccacc ttggaaaaac ggaagtgttc ctaaaccgct tcgccctacg gcctctgaac 60

cccgaggagc tcaggccttg gcgcctcgag gtggttctgg accctcctcc ggggcgggag 120

gaggtgtatc cccttctcgc ccaggtggcc cgccgggcgg ggggcgtcac ggtgcgcatg 180

ggagacggcc tcgcctcctg gtcgccccct gaggtcctgg tcttggaggg caccttggcg 240

cggatggggc agacctacgc ctaccgcctc taccccaagg ggaggaggcc tctggacccc 300

aaggacccgg gggagcggag cgtgctttcg gccttggccc gaaggctcct tcaggagcgc 360

ctcaggcgcc tcgagggggt ctgggtggag gggcttgcgg tgtaccggag ggagcacgcc 420

cgggggcccg ggtggcgggt gcttgggggg gcggtcttgg acctttgggt ctccgactcg 480

ggggcgttcc tcctggaggt ggaccccgct taccggatcc tctgcgagat gtccctcgag 540

gcctggcttg cccaaggcca ccctctgccc aaacgggtcc ggaacgccta cgaccggcgc 600

acctgggagc ttctccggct gggagaggaa gaccccaagg agctccccct cccgggcggc 660

ttaagcctcc tggactacca cgcttccaag ggccgcctcc agggccggga aggggggcgg 720

gtggcctggg tggcggaccc aaaggatccg cgaaagccaa tcccccatct gacgggcctt 780

ttggtgcccg tccttaccct ggaagacctt catgaagagg agggaagcct ggccctctcc 840

ttgccttggg aagagcggcg tcgacggacc cgggagatcg ccagctggat cggccggcgc 900

ctggggctgg gcacacctga ggcggtgcgc gcccaggcgt accgcttgag catccccaag 960

ctcatgggca gaagagccgt gagcaagcct gcggacgccc tccgcgtggg gttttaccgg 1020

gcccaggaaa ccgccctggc cctcttgcgc ctggacgggg cccaaggatg gccggagttt 1080

ctccggcggg ccttgctccg ggcctttggg gcgagcgggg cttccctccg tttgcacacc 1140

ctccacgccc atccctccca aggcctggct ttccgcgagg cgctgcggaa ggccaaggag 1200

gagggggtcc aggccgtgct ggtcctcacc ccgcccatgg cctgggaaga ccgcaaccgc 1260

ctgaaggccc ttctcctcag ggaaggcctt cccagccaaa tcctcaacgt ccccctccgg 1320

gaggaggaac gccaccgctg ggagaacgcc ctcctgggcc tcctggccaa ggcggggctt 1380

caggtggtgg ccctgagcgg cgcctatccg gcggagcttg ccgtgggctt tgacgctggc 1440

ggaagggagt cctttcgctt cgggggcgcg gcctgcgccg tgggcgggga cggcggccac 1500

ctcctctgga ccctccccga ggcccaggcc ggggagcgga tcccccagga ggtggtctgg 1560

gacctcttgg aggagaccct ctgggccttc agacgcaagg cggggaggct tccttcccgg 1620

gtcctcctcc ttcgggacgg ccgtgtgccc caggacgagt tcgccctggc cttggaggcc 1680

cttgcccggg aaggcatagc ctacgacttg gtttcggtgc gcaagtcggg aggggggcgg 1740

gtctaccccg tgcaggggcg cctggcggac gggctttacg tccccttgga ggacaagacc 1800

tttcttctcc tcaccgtcca ccgggacttc cggggcacgc cccgacccct gaagctggtg 1860

cacgaggcgg gggacacgcc cctcgaggcc ctggcccacc agattttcca tctgacccgc 1920

ctctacccgg cgagcggttt cgccttcccc cggcttcccg ctccccttca cctggccgac 1980

cgcctggtga aggaggtggg ccggttgggg atccgtcacc tcaaggaggt ggaccgggaa 2040

aagctcttct tcgtttaa 2058

<210>2

<211> 2664

<212> DNA

<213> NgAgo

<400> 2

atgacagtga ttgacctcga ttcgaccacc accgcagacg aactgacatc gggacacacg 60

tacgacatct cagtcacgct caccggtgtc tacgataaca ccgacgagca gcatcctcgc 120

atgtctctcg cattcgagca ggacaacggc gagcggcgtt acattaccct gtggaagaac 180

acgacaccca aggatgtctt tacatacgac tacgccacgg gctcgacgta catcttcact 240

aacatcgact acgaagtgaa ggacggctac gagaatctga ctgcaacata ccagacgacc 300

gtcgagaacg ctaccgctca ggaagtcggg acgactgacg aggacgaaac gttcgcgggc 360

ggcgagccgc tcgaccatca cttggacgac gcgctcaatg agacgccaga cgacgcggag 420

acagagagcg actcaggcca tgtgatgacc tcgttcgcct cccgcgacca actccctgag 480

tggacgctgc atacgtatac gctaacagcc acagacggcg caaagacgga cacggagtac 540

gcgcgacgaa ccctcgcata cacggtacgg caggaactct ataccgacca tgatgcggct 600

ccggttgcaa ctgacgggct aatgcttctc acgccagagc cgctcggcga gaccccgctt 660

gacctcgatt gcggtgtccg ggtcgaggcg gacgagactc ggacactcga ttacaccacg 720

gccaaagacc ggttactcgc ccgcgaactc gtcgaagagg ggctcaaacg ctccctctgg 780

gatgactacc tcgttcgcgg catcgatgaa gtcctctcaa aggagcctgt gctgacttgc 840

gatgagttcg acctacatga gcggtatgac ctctctgtcg aagtcggtca cagtgggcgg 900

gcgtaccttc acatcaactt ccgccaccgg ttcgtaccga agctgacgct cgcagacatc 960

gatgatgaca acatctatcc tgggctccgg gtgaagacga cgtatcgccc ccggcgagga 1020

catatcgtct ggggtctgcg ggacgagtgc gccaccgact cgctcaacac gctgggaaac 1080

cagtccgtcg ttgcatacca ccgcaacaat cagacaccta ttaacactga cctcctcgac 1140

gctatcgagg ccgctgaccg gcgagtcgtc gaaacccgac gtcaagggca cggcgatgat 1200

gctgtctcat tcccccaaga actgcttgcg gtcgaaccga atacgcacca aattaagcag 1260

ttcgcctccg acggattcca ccaacaggcc cgctcaaaga cgcgtctctc ggcctcccgc 1320

tgcagcgaga aagcgcaagc gttcgccgag cggcttgacc cggtgcgtct caatgggtcc 1380

acggtagagt tctcctcgga gtttttcacc gggaacaacg agcagcaact gcgcctcctc 1440

tacgagaacg gtgagtcggt tctgacgttc cgcgacgggg cgcgtggtgc gcaccccgac 1500

gagacattct cgaaaggtat cgtcaatcca ccagagtcgt tcgaggtggc cgtagtactg 1560

cccgagcagc aggcagatac ctgcaaagcg cagtgggaca cgatggctga cctcctcaac 1620

caagctggcg cgccaccgac acggagcgag accgtccaat atgatgcgtt ctcctcgcca 1680

gagagcatca gcctcaatgt ggctggagcc atcgacccta gcgaggtaga cgcggcattc 1740

gtcgtactgc cgccggacca agaaggattc gcagacctcg ccagtccgac agagacgtac 1800

gacgagctga agaaggcgct tgccaacatg ggcatttaca gccagatggc gtacttcgac 1860

cggttccgcg acgcgaaaat attctatact cgtaacgtgg cactcgggct gctggcagcc 1920

gctggcggcg tcgcattcac aaccgaacat gcgatgcctg gggacgcaga tatgttcatt 1980

gggattgatg tctctcggag ctaccccgag gacggtgcca gcggccagat aaacattgcc 2040

gcgacggcga ccgccgtcta caaggatgga actatcctcg gccactcgtc cacccgaccg 2100

cagctcgggg agaaactaca gtcgacggat gttcgtgaca ttatgaagaa tgccatcctc 2160

ggctaccagc aggtgaccgg tgagtcgccg acccatatcg tcatccaccg tgatggcttc 2220

atgaacgaag acctcgaccc cgccacggaa ttcctcaacg aacaaggcgt cgagtacgac 2280

atcgtcgaaa tccgcaagca gccccagaca cgcctgctgg cagtctccga tgtgcagtac 2340

gatacgcctg tgaagagcat cgccgctatc aaccagaacg agccacgggc aacggtcgcc 2400

accttcggcg cacccgaata cttagcgaca cgcgatggag gcggccttcc ccgcccaatc 2460

caaattgaac gagtcgccgg cgaaaccgac atcgagacgc tcactcgcca agtctatctg 2520

ctctcccagt cgcatatcca ggtccataac tcgactgcgc gcctacccat caccaccgca 2580

tacgccgacc aggcaagtac tcacgcgacc aagggttacc tcgtccagac cggagcgttc 2640

gagtctaatg tcggattcct ttaa 2664

<210>3

<211> 2664

<212> DNA

<213> hNgAgo

<400> 3

atgacagtga tagatctgga ttcaacaaca accgcagacg agcttacgtc tggacatact 60

tatgatatca gcgtcactct taccggggtc tacgataaca ctgacgagca gcacccccgc 120

atgtcccttg ctttcgaaca agacaatggc gagcgacgct acataaccct ctggaagaac 180

acaactccca aggacgtctt cacttacgat tatgccacag gcagtacgta tattttcact 240

aatattgact acgaggtcaa ggacggttat gaaaacctta ccgccaccta ccaaacaacg 300

gttgaaaatg ctacagctca agaagtcggc accacggatg aagacgaaac atttgccggg 360

ggcgaaccat tggatcacca cctggatgat gcactgaacg agacccccga tgatgcggaa 420

acggaaagtg attcaggcca tgtaatgaca tcattcgcgt cacgcgatca gctgccggag 480

tggacattgc acacatacac tctcacggcc acggatgggg ctaaaacaga tacggaatac 540

gcgagaagaa ctctggctta cactgttcgg caagaacttt ataccgacca cgacgcagca 600

ccagtggcca ccgacggctt gatgcttctc actcctgagc ctctgggaga gacccctctt 660

gatcttgatt gtggcgtgcg cgttgaggct gacgagacaa ggacgttgga ttacacaacc 720

gcaaaagata gacttctcgc tcgggaactt gtggaggagg ggttgaaacg gtctctttgg 780

gacgattacc tcgtgagggg catagatgaa gtcctgtcaa aggagcccgt gttgacttgt 840

gatgagtttg acctgcacga gcgctatgac ctgtctgtcg aggttggtca ttctggccgg 900

gcttatcttc acattaactt ccgccaccgc ttcgtaccga agctcacgct tgcagacata 960

gatgacgaca acatttatcc ggggttgcgg gtgaaaacaa cctacagacc tcgccgaggc 1020

catatagtct ggggtctccg cgacgaatgt gcgaccgact cccttaatac tttgggtaat 1080

cagtcagtag tagcttatca ccgcaataac cagacaccaa tcaataccga ccttctcgat 1140

gctattgaag ccgcagaccg cagagtcgtc gaaacgcgca ggcaaggaca tggggatgac 1200

gccgtatcat tcccccagga gcttctcgca gtagaaccta atacacatca aataaagcag 1260

ttcgcctccg acgggtttca tcagcaggct aggtctaaga cccgactcag tgcatcaaga 1320

tgttcagaaa aagcacaagc atttgcggag cggcttgacc ctgtgcgatt gaacgggtct 1380

acggtggaat tctcttctga gttcttcacg gggaacaacg agcaacagct ccggttgttg 1440

tacgaaaacg gcgaatccgt gttgaccttt cgggatggtg ccaggggggc ccatcccgac 1500

gaaacattta gtaagggaat agtcaatcca ccagagtcat ttgaggtagc agtcgtgctg 1560

cctgaacagc aggctgacac atgtaaagcc cagtgggaca ctatggcaga cctcttgaat 1620

caggcgggcg ctcctcctac tcgatcagag acggttcaat atgatgcgtt ctcttctcct 1680

gaaagtattt ctctcaatgt agccggtgcg atagacccgt cagaagtcga tgcagcgttc 1740

gtcgttctgc cccctgatca ggagggtttc gctgatcttg cttctccaac cgaaacctat 1800

gacgaactga aaaaagcact tgcgaacatg ggcatttatt ctcaaatggc atacttcgat 1860

cgctttcggg acgctaagat tttctacacc aggaacgttg ccttgggttt gctggcagca 1920

gcgggcggcg tcgcttttac gacagaacac gcgatgcctg gagatgcgga catgtttatt 1980

ggaattgatg tgagccgaag ctatccggaa gatggggcgt caggtcagat taatatagcg 2040

gctaccgcga cggccgtcta taaggacggt acgatattgg gtcactcttc cacgaggcct 2100

caactcggag aaaagctcca atcaactgac gtcagagata taatgaagaa tgcgatattg 2160

ggctatcagc aagtgacggg tgaatcccct acccatattg ttatccatcg cgacggattt 2220

atgaacgaag atttggatcc cgcgactgag tttctcaacg aacagggtgt ggagtatgac 2280

attgtggaga ttaggaaaca accccaaaca cggctcttgg ccgtgtcaga cgtccagtac 2340

gatacgcctg tgaagtcaat tgcagccatc aatcagaacg aaccccgggc gaccgttgcg 2400

acctttggag ctccggagta tcttgcgact cgcgatggcg gagggttgcc gagaccgata 2460

cagatagaga gggtcgccgg cgaaacggat atagaaacgc tcacacgcca agtatacctt 2520

ctttctcaat ctcatatcca ggtgcacaac tcaacggctc gcttgcccat aacgacggca 2580

tacgctgacc aggcgtcaac gcatgcgacg aagggttatc tggtacaaac gggggcgttc 2640

gagagtaacg tcggtttttt gtaa 2664

<210>4

<211> 35

<212> DNA

<213> NdeI-Tt-F

<400> 4

ggaattccat atgaaccacc ttggaaaaac ggaag 35

<210>5

<211> 32

<212> DNA

<213> HindIII-TAA-TtV685-R

<400> 5

cccaagcttt taaacgaaga agagcttttc cc 32

<210>6

<211> 22

<212> DNA

<213> BglII-araC-R

<400> 6

caagatctcc ccgaaaagtg cc 22

<210>7

<211> 23

<212> DNA

<213> XbaI-pBAD-R

<400> 7

tgctctagag aattcccaaa aaa 23

<210>8

<211> 29

<212> DNA

<213> XhoI-dapD-F

<400> 8

aatctcgagc cgtattaatg ataatcagg 29

<210>9

<211> 21

<212> DNA

<213> HindIII-dapD-R

<400> 9

aataagcttc atatgcgccg a 21

<210>10

<211> 49

<212> DNA

<213> XhoI-T7P-dapD-F

<400> 10

aatctcgagt aatacgactc actatagggc cgtattaatg ataatcagg 49

<210>11

<211> 20

<212> DNA

<213> dapD-T7P-overlap-R

<400> 11

cctgattatc attaatacgg 20

<210>12

<211> 20

<212> DNA

<213> dapD-overlap-F

<400> 12

ccgtattaat gataatcagg 20

<210>13

<211> 29

<212> DNA

<213> P2A-RFP-pA-F(PstI)

<400> 13

aagctgcagt agacgcgttg gccacgaac 29

<210>14

<211> 29

<212> DNA

<213> P2A-RFP-Pa-R(XhoI)

<400> 14

taactcgagc catagagccc accgcatcc 29

<210>15

<211> 29

<212> DNA

<213> T2A-GFP-F(BglII)

<400> 15

tggagatctg gcagtggaga gggcagagg 29

<210>16

<211> 29

<212> DNA

<213> T2A-GFP-R(PstI)

<400> 16

ctactgcagc ttgtacagct cgtccatgc 29

<210>17

<211> 45

<212> DNA

<213> AAVS1-R(BamHI)

<400> 17

ctgtggggtg gaggggacag ggatccgaag aagatggtgc gctcc 45

<210>18

<211> 50

<212> DNA

<213> AAVS1-F(HindIII)

<400> 18

ctgtcccctc caccccacag tggaagcttc acaagctgga gtacaactac 50

<210>19

<211> 20

<212> DNA

<213> dapD-F

<400> 19

ccgtattaat gataatcagg 20

<210>20

<211> 20

<212> DNA

<213> dapD-R

<400> 20

catatgcgcc gatgttgacg 20

<210>21

<211> 20

<212> DNA

<213> T7p17-F

<400> 21

atggctaaga agattttcac 20

<210>22

<211> 20

<212> DNA

<213> T7p17-R

<400> 22

ttagaagtct ccgtcttcgt 20

<210>23

<211> 22

<212> DNA

<213> AAVS1a-F

<400> 23

acagcatgtt tgctgcctcc ag 22

<210>24

<211> 22

<212> DNA

<213> AAVS1a-R

<400> 24

ctaacaggag gtgggggtta ga 22

<210>25

<211> 20

<212> DNA

<213> AAVS1a基因位点

<400> 25

ctgtcccctc caccccacag 20

Claims

1.一种基于pAgo的基因编辑系统，其特征在于：该基因编辑系统包括核酸酶表达载体，所述核酸酶表达载体包括通过启动子的调控实现表达的原核Argonaute蛋白基因序列，所述核酸酶表达载体表达的原核Argonaute蛋白具有被转录本激活并靶向该转录本对应DNA序列的核酸酶活性。

2.根据权利要求1所述一种基于pAgo的基因编辑系统，其特征在于：所述原核Argonaute蛋白基因序列选自NgAgo蛋白基因序列、TtAgo蛋白基因序列或选自根据目标宿主细胞的密码子偏好优化后的NgAgo、TtAgo蛋白基因序列。

3.根据权利要求1所述一种基于pAgo的基因编辑系统，其特征在于：所述基因编辑系统还包括RNA导引激活序列表达载体，RNA导引激活序列表达载体包括通过启动子的调控实现作为所述转录本的RNA导引激活序列的表达的模板。

4.根据权利要求3所述一种基于pAgo的基因编辑系统，其特征在于：所述RNA导引激活序列选自目标宿主细胞基因组靶序列的同源序列。

5.根据权利要求3所述一种基于pAgo的基因编辑系统，其特征在于：所述RNA导引激活序列的长度大于10nt。

6.根据权利要求3所述一种基于pAgo的基因编辑系统，其特征在于：所述核酸酶表达载体中，启动子选自T7启动子、阿拉伯糖启动子或CMV启动子；所述RNA导引激活序列表达载体中，启动子选自U6类启动子。

7.根据权利要求3所述一种基于pAgo的基因编辑系统，其特征在于：所述基因编辑系统还包括与RNA导引激活序列互补配对的单链DNA片段。

8.根据权利要求7所述一种基于pAgo的基因编辑系统，其特征在于：所述基因编辑系统中，核酸酶表达载体含量按物质的量计为单链DNA片段含量的3倍以内。

9.根据权利要求1所述一种基于pAgo的基因编辑系统，其特征在于：所述基因编辑系统还包括报告载体和/或用于进行同源重组修复的供体载体，所述报告载体包括报告基因表达盒，所述报告基因表达盒包括报告基因序列以及位于该序列上游的与目标宿主细胞基因组靶序列同源的序列。

10.根据权利要求2、4或9所述一种基于pAgo的基因编辑系统，其特征在于：所述目标宿主细胞选自真核细胞。