CN110832074A

CN110832074A - CRISPR-Cas核酸内切酶在植物基因组工程中的应用

Info

Publication number: CN110832074A
Application number: CN201880044965.7A
Authority: CN
Inventors: A·赫梅尔; Z·瓦格齐帕瓦拉
Original assignee: KWS SAAT SE and Co KGaA
Current assignee: KWS SAAT SE and Co KGaA
Priority date: 2017-05-03
Filing date: 2018-05-03
Publication date: 2020-02-21
Also published as: US20200407737A1; EP3619305A1; WO2018202800A1

Abstract

本发明涉及CRISPR/CasX系统在植物中用于基因组工程的应用，以及涉及用于此类方法的组合物。

Description

CRISPR-Cas核酸内切酶在植物基因组工程中的应用

背景技术

1、技术领域

本发明涉及用于在植物细胞中进行基因编辑的材料和方法，尤其涉及用于基因编辑的方法，该方法包括例如但不限于使用核酸向导的CRISPR/CasX系统。

2、背景及相关技术

精确修饰真核细胞中遗传物质的能力使得能够在医学、制药、农业、基础研究和其他领域具有广泛的高价值应用。从根本上说，基因组工程通过在真核生物基因组的特定位置处引入预定义的遗传变异(诸如删除、插入、突变或取代特定的核酸序列)来提供该能力。这些改变可以是基因或位置特异性的。然而，在真核细胞中常规引入靶向遗传变异的一个重要障碍是没有突变、插入或重排，而基因组中没有先兆断裂来刺激变化。例如，由植物中位点特异性核酸酶(SSN)的表达引起的靶向双链断裂(DSB)可以将同源重组(HR)的频率增加至少二至三个数量级(Puchta等人，美国国家科学院院刊93：5055-5060，1996)。因此，在靶向诱变、编辑或插入的有效基因编辑方面的最新技术成就取决于在真核基因组中特定位置处引入基因组单链或双链断裂的能力。因此，有效的可编程核酸内切酶系统或SSN是稳健的基因编辑的基础。已用于基因编辑的SSN的示例包括归巢核酸内切酶(也称为大范围核酸酶)、锌指核酸酶(ZFN)、转录激活因子样效应子核酸酶(TALEN)以及成簇的规律间隔的短回文重复(CRISPR)/CRISPR相关(CAS)核酸酶。在这些系统中，CRISPR/Cas的独特之处在于其向导RNA组分，该组分能够实现比使用其他系统所需的蛋白质改造更快的靶标重编程。

为了有效地产生遗传变异而定向导入染色体DSB的需求使得SSN在基因编辑中必不可少。像CRISPR/Cas9核酸酶一样，CRISPR/CasX核酸内切酶(“CRISPR/CasX”)通过使用核酸向导指定靶序列，然后由CRISPR/CasX蛋白组分裂解该靶序列，来参与针对外来核酸的防御。具体来讲，CRISPR/CasX可通过与设计或合成的核酸-靶向核酸形成复合物来结合并裂解靶核酸，其中靶核酸的裂解可在靶核酸中引入双链断裂。就像Cas9系统一样，CRISPR/CasX核酸向导为编程核酸内切酶序列特异性提供了一种便捷的方法。

最近一种这样的CRISPR/CAX系统被证明适用于人类细胞中的基因编辑。参见Burstein等人，来自未培养微生物的新型CRISPR-Cas系统。Nature(2017)542(7640)：237-241。以前尚未证明在植物中CRISPR/CasX系统的应用。因此，本发明部分基于令人惊奇的发现，即CRISPR/CasX在适于植物和植物细胞的生长和培养的温度下作为核酸内切酶具有活性，并且进一步令人惊奇的发现，即该核酸内切酶可用于植物细胞中的基因编辑。

发明内容

如背景技术部分中所指定的，在本领域中有很大的需求来识别基因组工程的技术，特别是用于植物中的基因组工程技术，并利用这种理解来开发用于这种工程的新颖方法和组合物。本发明满足了这一需求和其他需求。本发明的实施方案总体上涉及用于基因组工程的方法和组合物，并且更具体地涉及CRISPR/CasX系统的应用，包括例如但不限于来自δ变形菌(Deltaproteobacteria)和浮霉菌(Planctomycetes)的CRISPR/CasX蛋白系统在植物中进行基因组工程。

本发明部分基于以下发现：CRISPR/CasX家族的核酸向导的核酸内切酶可以用于植物基因组工程。CRISPR/CasX核酸内切酶系统具有CRISPR/Cas9系统的优势，因为可以使用简单的单链核酸对其进行编程以实现靶标特异性。因此，可以使用CRISPR/CasX核酸内切酶系统而不受限制地对真核细胞的遗传物质进行靶向修饰，该靶向修饰包括靶向插入和缺失、靶向序列置换、靶向小规模和大规模基因组重排(包括倒位或染色体重排)、内源序列的靶向编辑和外源序列的靶向整合。这些修饰可以独立进行，也可以作为细胞内的同时或顺序多重修饰来进行。因此，可以利用CRISPR/CasX核酸内切酶系统将许多有价值的性状引入到植物中。

本发明还提供了一种修饰存在于植物细胞中的遗传物质的方法。该方法可以包括向细胞内递送靶向细胞遗传物质序列的靶向核酸的核酸，以及向植物细胞内递送CRISPR/CasX核酸内切酶。然后，靶向核酸的核酸可以指导CRISPR/CasX核酸内切酶在由该靶向核酸的核酸指定的靶向位点处或附近的细胞遗传物质中产生断裂。通过非同源末端连接(NHEJ)或同源重组(HR)介导的途径修复断裂可导致植物细胞遗传物质中的靶向修饰。

可以通过任何合适的方法将靶向核酸的核酸和/或CRISPR/CasX核酸内切酶一起或分别递送到植物细胞中，这包括例如但不限于通过细菌DNA转移，诸如农杆菌转化、通过微粒轰击、通过聚乙二醇(PEG)转化、通过例如病毒载体的转染、通过电穿孔或通过另一种合适的方法(包括机械引入方法)。可选地，靶向核酸的核酸和/或CRISPR/CasX核酸内切酶可以通过Ensifer或在T-DNA中递送。可选地，可将CRISPR/CasX核酸内切酶的表达盒稳定整合到植物基因组中，用于在植物细胞及其衍生物中的可遗传表达。

除了向导RNA分子的优点外，CRISPR/CasX核酸内切酶由于其小尺寸也有助于其递送。来自δ变形菌(Deltaproteobacteria)(NCBI登录号MGPG01000094，座标4319..9866)的野生型(WT)蛋白为980个氨基酸，约为化脓性链球菌Cas9大小的2/3。来自浮霉菌(Planctomycetes)的野生型(WT)蛋白(NCBI登录号MHYZ01000150，坐标1..5586)为1035个氨基酸，也约为化脓链球菌Cas9大小的2/3。这些CRISPR/CasX核酸内切酶的大小减小至少提供以下优势：简化克隆和载体装配；增加核酸酶在细胞中的表达水平；并减少在高度大小敏感的平台(诸如病毒(包括DNA或RNA病毒))表达蛋白质的挑战。

本文描述了CRISPR/CasX在植物基因组工程中的应用。如所证明的，并且作为一般方法，瞬时测试系统(诸如原生质体)可用于分析、验证和优化在游离和内源或转基因染色体靶标上的核酸酶活性。也可以在再生组织或生殖组织中进行修饰，从而能够生产经基因编辑的植物和植物系，用于基础研究和农业应用。

像其他核酸向导的核酸内切酶一样，CRISPR/CasX SSN通常至少需要两个组分才能在植物细胞中进行靶向诱变：5’磷酸化的单链向导RNA和CRISPR/CasX核酸内切酶蛋白。在一些实施方案中，还存在Cas1、Cas2和Cas4组分，如Burstein，D等人，“来自未培养微生物的CRISPR-Cas系统”自然(2017)542：237-241中所述的。对于靶向的编辑、插入或序列替换，还可以将编码所需序列变化的DNA模板提供给植物细胞，以通过NHEJ或HR修复途径来引入变化。成功的编辑事件最常见的检测是通过表型变化(诸如通过导致可见表型的基因敲除或基因导入)、基于PCR的方法(诸如通过富集PCR、PCR消化或T7EI或Surveyor核酸内切酶测定法)、或所靶向的下一代测序(NGS；也称为深度测序)进行检测。例如，转基因植物可以编码有缺陷的GUS：NPTII报道分子。同样，基于PCR的方法可用于确定基因组靶位点是否包含靶向突变或供体序列，和/或在供体的5'和3'端是否已发生精确重组。

CRISPR/CasX系统的一个优势是它在适合于植物和植物细胞生长和培养的温度下具有功能，所述温度诸如(例如)但不限于约20℃至约35℃，优选约23℃至约32℃，并且最优选约25℃至约28℃。

在一个方面，提供了一种用于修饰植物细胞中至少一个染色体基因或染色体外基因的表达的方法，该方法包括向细胞中引入：

(a)(i)成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA)，或(ii)嵌合的cr/tracrRNA杂合体(sgRNA)，其中，crRNA或sgRNA靶向基因内或该基因编码的RNA分子内的序列；以及

(b)CRISPR/CasX核酸内切酶分子，其中所述CRISPR/CasX核酸内切酶能够在crRNA或sgRNA所靶向的序列处或附近引入双链断裂或单链断裂。

在一些实施方案中，CRISPR/CasX核酸内切酶分子能够在crRNA或sgRNA靶向的序列处或序列附近引入单链断裂。

在一些实施方案中，crRNA包含约23个核苷酸的重复序列和约20个核苷酸的间隔区序列，其中间隔区序列与靶核酸相互作用。在一些实施方案中，crRNA或tracrRNA或sgRNA包含非常规和/或修饰的核苷酸和/或包含非常规和/或修饰的主链化学成份。在一些实施方案中，crRNA或tracrRNA或sgRNA包含一种或多种修饰，该修饰选自由以下项构成的组：锁核酸(LNA)碱基、主链中的核苷酸间硫代磷酸酯键、2’-O-甲基RNA碱基、解锁核酸(UNA)碱基、5-甲基dC碱基、5-羟基丁炔-2’-脱氧尿苷碱基、5-硝基吲哚碱基、脱氧肌苷碱基、8-氮杂-7-脱氮鸟苷碱基、5’末端处的双脱氧-T、3’末端处的反向dT以及和3’末端处的双脱氧胞苷。

在一些实施方案中，将crRNA、tracrRNA或sgRNA作为编码所述RNA并与指导细胞中所述RNA产生的启动子可操作地连接的DNA分子引入细胞中。

在一些实施方案中，CRISPR/CasX核酸内切酶分子是δ变形菌(Deltaproteobacteria)核酸内切酶或其突变体或衍生物。CRISPR/CasX核酸内切酶分子包含SEQ ID No：1的氨基酸序列，与SEQ ID No：1具有至少85％的序列同一性的序列，与SEQID No：1具有至少90％的序列同一性的序列或与SEQ ID NO：1具有至少95％序列同一性的序列。

在一些实施方案中，CRISPR/CasX核酸内切酶分子是浮霉菌(Planctomycetes)核酸内切酶或其突变体或衍生物。CRISPR/CasX核酸内切酶分子包含SEQ ID No：2的氨基酸序列，与SEQ ID No：2具有至少85％的序列同一性的序列，与SEQ ID No：2具有至少90％的序列同一性的序列或与SEQ ID NO：2具有至少95％序列同一性的序列。

在一些实施方案中，CRISPR/CasX核酸内切酶分子被修饰以便在与其修饰前的最佳温度不同的温度下具有活性。修饰的CRISPR/CasX核酸内切酶分子可以在适合于植物或植物细胞的生长和培养的温度下具有活性。修饰的CRISPR/CasX核酸内切酶分子可以在约20℃至约35℃的温度下具有活性。修饰的CRISPR/CasX核酸内切酶分子可以在约23℃至约32℃的温度下具有活性。修饰的CRISPR/CasX核酸内切酶分子可以在约25℃至约28℃的温度下具有活性。

在一些实施方案中，CRISPR/CasX核酸内切酶分子作为DNA分子被递送至细胞，该DNA分子包含CRISPR/CasX核酸内切酶编码序列，该编码序列可操作地连接至指导所述CRISPR/CasX核酸内切酶在细胞中产生的启动子。DNA分子可以瞬时存在于细胞中。可以将DNA分子稳定地掺入到细胞或祖细胞的核或质体基因组序列中，从而提供CRISPR/CasX核酸内切酶分子的可遗传表达。可以将DNA分子稳定地掺入到细胞或祖细胞的叶绿体基因组中，从而提供CRISPR/CasX核酸内切酶分子的可遗传表达。在一些实施方案中，启动子选自由组成型启动子、诱导型启动子和细胞型特异性启动子或组织型特异性启动子构成的组。该启动子可以通过自杀外显子的选择性剪接来激活。

在一些实施方案中，CRISPR/CasX核酸内切酶分子作为编码所述CRISPR/CasX核酸内切酶的mRNA分子被递送至细胞。在一些实施方案中，CRISPR/CasX核酸内切酶分子作为蛋白质被递送至细胞。

在一些实施方案中，CRISPR/CasX核酸内切酶分子具有一个或多个定位信号、检测标签、检测报道分子和纯化标签。在一些实施方案中，CRISPR/CasX核酸内切酶分子包含一个或多个定位信号。CRISPR/CasX核酸内切酶分子可以包含至少一个具有酶活性的另外的蛋白质结构域。该额外的蛋白质结构域可以具有选自以下的酶活性：核酸外切酶、解旋酶，DNA双链断裂的修复、转录(共)活化物、转录(共)阻遏物、甲基化酶、脱甲基酶及其任意组合。

在一些实施方案中，该方法包括递送包含在引入细胞之前装载有crRNA/tracrRNA或sgRNA的CRISPR/CasX核酸内切酶分子的预组装复合物。

在一些实施方案中，通过选自由以下构成的组的方法将DNA或RNA递送至细胞：微粒轰击、聚乙二醇(PEG)介导的转化、电穿孔、花粉管介导的接合子的导入，以及由一种或多种细胞穿透肽(CPPs)介导的递送。DNA可以在T-DNA中递送至细胞。DNA的递送可以通过细菌介导的转化来进行。DNA的递送可以通过农杆菌或Ensifer进行。

在一些实施方案中，DNA或RNA通过病毒递送至细胞。该病毒可以是双生病毒或烟草脆裂病毒。

在一些实施方案中，植物是单子叶植物。在一些实施方案中，植物是双子叶植物。

在各种实施方案中，植物细胞来源于选自由以下的物种构成的组：大麦(Hordeumvulgare)、球茎大麦(Hordeum bulbusom)、双色高粱(Sorghum bicolor)、甘蔗(Saccharumofficinarium)、玉米(Zea mays)、谷子(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、黑小麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops tauschii)、Daucus glochidiatus、甜菜(Betavulgaris)、Daucus pusillus、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、茸毛烟草(Nicotianatomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffeacanephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、桑树(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、小拟南芥(Olmarabidopsis pumila)、硬毛南芥(Arabis hirsute)、欧洲油菜(Brassicanapus)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、柑桔(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、野生鹰嘴豆(Cicerbijugum)、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolusvulgaris)、大豆(Glycine max)、棉属(Gossypium sp.)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏槿(Torenia fournieri)、洋葱(Allium cepa)、葱(Alliumfistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthustuberosus)和韭菜(Allium tuberosum)，以及属于上述植物之一的任何品种或亚种。

在一些实施方案中，靶序列选自由以下项构成的组：乙酰乳酸合酶(ALS)基因、烯醇丙酮酸磷酸合酶基因(EPSPS)基因、雄性育性基因、雄性不育基因、雌性育性基因、雌性不育基因、雄性恢复基因、雌性恢复基因、与不育性状有关的基因、与生育性状有关的基因、与除草剂抗性有关的基因、与除草剂耐受性有关的基因、与真菌抗性有关的基因、与病毒抗性有关的基因、与昆虫抗性有关的基因抗性、与耐旱性有关的基因、与耐冷性有关的基因、与耐寒性相关的基因、与氮利用效率相关的基因、与磷利用效率相关的基因、与水分利用效率相关的基因和与作物或生物质产量相关的基因、以及这些基因的任何突变体。雄性不育基因可以选自由MS45、MS26和MSCA1构成的组。

在另一方面，提供了一种通过以上各方面或实施方案中的任一项的方法产生的植物细胞，以及源自该植物细胞的完整植物或其后代。

在另一方面，提供了一种组合物，该组合物包含：

(a)(i)成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA)，或

(ii)嵌合cr/tracrRNA杂合体(sgRNA)，其中crRNA或sgRNA靶向染色体植物基因序列或染色体外植物基因序列或由所述基因编码的RNA分子内；和/或

(b)CRISPR/CasX核酸内切酶分子，其中CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度下，在crRNA或sgRNA靶向的序列处或附近引入双链断裂或单链断裂。

在一些实施方案中，crRNA包含约23个核苷酸的重复序列和约20个核苷酸的间隔区序列；该间隔区序列与靶核酸相互作用。

在一些实施方案中，crRNA或tracrRNA或sgRNA包含非常规和/或修饰的核苷酸和/或包含非常规和/或修饰的主链化学成份。crRNA、tracrRNA或sgRNA可以包含一个或多个修饰，该修饰选自由以下项构成的组：锁核酸(LNA)碱基、主链中的核苷酸间硫代磷酸酯键、2’-O-甲基RNA碱基、解锁核酸(UNA)碱基、5-甲基dC碱基、5-羟基丁炔-2’-脱氧尿苷碱基、5-硝基吲哚碱基、脱氧肌苷碱基、8-氮杂-7-脱氮鸟嘌呤碱基、5’末端处的双脱氧-T、3’末端处的反向dT、3’末端处的双脱氧胞苷。

在一些实施方案中，CRISPR/CasX核酸内切酶分子是Planctomycetes核酸内切酶或其突变体或衍生物。CRISPR/CasX核酸内切酶分子包含SEQ ID No：2的氨基酸序列，与SEQID No：2具有至少85％的序列同一性的序列，与SEQ ID No：2具有至少90％的序列同一性的序列或与SEQ ID NO：2具有至少95％序列同一性的序列。

在一些实施方案中，CRISPR/CasX核酸内切酶分子包含一种或多种选自由定位信号、检测标签、检测报道分子和纯化标签构成的组的元件。在一些实施方案中，CRISPR/CasX核酸内切酶分子被修饰为表达切口酶活性或具有核酸靶向活性而没有任何切口酶或核酸内切酶活性。

在一些实施方案中，CRISPR/CasX核酸内切酶分子包含至少一个具有酶活性的另外的蛋白质结构域。该至少一个另外的蛋白质结构域可具有选自由以下项构成的组的酶活性：核酸外切酶、解旋酶、DNA双链断裂的修复、转录(共)活化物、转录(共)阻遏物、甲基化酶、脱甲基酶和任意其组合。

在一些实施方案中，靶序列选自由以下项构成的组的植物序列：乙酰乳酸合酶(ALS)基因、烯醇丙酮酸磷酸合酶基因(EPSPS)基因、雄性育性基因、雄性不育基因、雌性育性基因、雌性不育基因、雄性恢复基因、雌性恢复基因、与不育性状有关的基因、与生育性状有关的基因、与除草剂抗性有关的基因、与除草剂耐受性有关的基因、与真菌抗性有关的基因、与病毒抗性有关的基因、与昆虫抗性有关的基因抗性、与耐旱性有关的基因、与耐冷性有关的基因、与耐寒性相关的基因、与氮利用效率相关的基因、与磷利用效率相关的基因、与水利用效率相关的基因和与作物或生物质产量相关的基因、以及这些基因的任何突变体。雄性不育基因可以选自由MS45、MS26和MSCA1构成的组。

在一些实施方案中，植物是单子叶的。在一些实施方案中，植物是双子叶的。植物细胞可来源于选自由以下项构成的组的物种：大麦(Hordeum vulgare)、球茎大麦(Hordeumbulbusom)、双色高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zeamays)、谷子(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticumaestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、黑小麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeummarinum)、节节麦(Aegilops tauschii)、Daucus glochidiatus、甜菜(Beta vulgaris)、Daucus pusillus、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptusgrandis)、美花烟草(Nicotiana sylvestris)、茸毛烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanumlycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitisvinifera)、Erythrante guttata、Genlisea aurea、黄瓜(Cucumis sativus)、桑树(Morusnotabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamine flexuosa)、北美独行菜(Lepidiumvirginicum)、荠菜(Capsella bursa pastoris)、小拟南芥(Olmarabidopsis pumila)、硬毛南芥(Arabis hirsute)、欧洲油菜(Brassica napus)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicaria subsp.sativa)、柑桔(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜苜蓿(Medicagotruncatula)、Cicer yamashitae、野生鹰嘴豆(Cicer bijugum)、鹰嘴豆(Cicerarietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、棉属(Gossypium sp.)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏槿(Torenia fournieri)、洋葱(Allium cepa)、葱(Allium fistulosum)、大蒜(Alliumsativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus)和韭菜(Alliumtuberosum)，以及属于上述植物之一的任何品种或亚种。

在另一方面，提供了一种试剂盒，该试剂盒包括：(a)(i)成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA)，或(ii)嵌合的cr/tracrRNA杂合体(sgRNA)，其中，crRNA或sgRNA靶向植物基因内或该基因编码的RNA分子内的序列；(b)CRISPR/CasX核酸内切酶分子，其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度下，在crRNA或sgRNA靶向的序列处或其附近引入双链断裂或单链断裂，以及任选的(c)使用说明。

在另一方面，提供了一种试剂盒，该试剂盒包括：(a)(i)编码成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活crRNA(tracrRNA)的核酸分子，或(ii)编码嵌合cr/tracrRNA杂合体的核酸分子(sgRNA)，其中crRNA或sgRNA靶向植物基因内或由该基因编码的RNA分子内的序列；(b)编码CRISPR/CasX核酸内切酶分子的核酸分子，其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度下，在crRNA或sgRNA靶向的序列处或其附近引入双链断裂或单链断裂，以及任选的(c)使用说明。

在另一方面，提供了一种试剂盒，该试剂盒包括：(a)(i)编码成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)的核酸分子和编码反式激活crRNA(tracrRNA)的核酸分子，或(ii)编码嵌合cr/tracrRNA杂合体的核酸分子(sgRNA)，其中crRNA或sgRNA靶向植物基因内或由该基因编码的RNA分子内的序列；(b)编码CRISPR/CasX核酸内切酶分子的核酸分子，其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度下，在crRNA或sgRNA靶向的序列处或其附近引入双链断裂或单链断裂，以及任选的(c)使用说明。

在另一方面，本发明提供了一种宿主细胞，该宿主细胞包含如任一前述方法中所述的CRISPR/CasX核酸内切酶，以及如任一前述方法中所述的至少一种靶向核酸的核酸。

在另一方面，本发明提供了一种载体，该载体包含核酸，其编码如任一前述方法中所述的CRISPR/CasX核酸内切酶和如任一前述方法中所述的至少一种靶向核酸的核酸。

在另一方面，本发明提供了一种用于在植物中治疗病害和/或病症和/或预防昆虫感染/侵染的方法，该方法包括通过使用任一前述方法来修饰所述植物的染色体或染色体外遗传物质。

可治疗的病害和/或病症的非限制性示例包括炭疽病茎腐病、曲霉穗腐病、普通玉米穗腐病、玉米穗病(不常见)、普通玉米锈病、二倍体穗腐病、二倍体茎腐病、霜霉病、眼斑病、镰刀菌穗腐病、镰刀菌茎腐病、赤霉素耳腐病、赤霉菌茎腐病、戈斯枯萎病和叶枯病、灰色叶斑病、丝黑穗病、北方玉米叶枯病、褐斑病、腐霉病、南方叶斑病、南方锈病和斯图尔特的细菌性枯萎病和枯萎病及其组合。

可直接或间接引起病害和/或病症的昆虫的非限制性示例包括粘虫、亚洲园林甲虫、小地老虎、棕纹蝽、褐臭蝽、普通茎螟、玉米臭虫、玉米穗虫、玉米叶蚜虫、玉米根虫、玉米根虫蚕丝、欧洲玉米螟、秋天粘虫、葡萄肖叶甲、啤酒花蛀虫、日本甲虫、秋季行军粘虫(Scouting for Fall Armyworm)、种子玉米甲虫、种子玉米蛆、南方玉米叶甲虫、西南玉米螟、红蜘蛛、甘蔗甲虫、西豆角虫、蛴螬和线虫及其组合。本发明的方法还适用于防止植物被任何此类昆虫感染和/或侵染。

在另一方面，本发明提供了一种影响植物中至少一个性状的方法，所述性状选自由以下项构成的组：不育性、育性、除草剂抗性、除草剂耐受性、真菌抗性、病毒抗性、昆虫抗性、干旱耐受性、耐冷性或耐寒性、氮利用效率、磷利用效率、水利用效率和作物或生物质产量，所述方法包括通过使用任何前述方法来修饰所述植物的染色体或染色体外遗传物质。

通过结合所附具体实施方式和权利要求阅读以下说明书，本发明的这些和其他目的、特征和优点将变得更加显而易见。

具体实施方式

为了便于对本发明各种实施方案的原理和特征的理解，下面解释各个例示性实施方案。尽管详细解释了本发明的示例性实施方案，但是应当理解，也可以设想出其他实施方案。因此，无意于将本发明的范围局限于以下具体实施方式或示例中阐述的部件的构造和布置的细节。本发明能够实施其他实施方案，并能够以各种方式实施或执行。另外，在描述示例性实施方案时，为了清楚起见，将采用特定术语。

还必须注意，如本说明书和所附权利要求书中所使用的，单数形式“一个”、“一种”和“该”包括复数引用，除非上下文另外明确指出。例如，对部件的引用也旨在包括多个部件的组合。对包含“一种”成分的组合物的引用旨在包括除所提及的成分之外的其他成分。换句话讲，术语“一个”、“一种”和“该”不表示数量的限制，而是表示所引用的项目存在“至少一个”。

同样，在描述示例性实施方案时，为了清楚起见将采用术语。旨在使每个术语都考虑到本领域技术人员所理解的最广泛的含义，并且包括以相似方式操作以实现相似目的的所有技术等同物。

范围在本文中可表示为从“约”或“大约”或“基本上”一个特定值和/或至“约”或“大约”或“基本上”另一特定值。当表达此类范围时，其他示例性实施方案包括从一个特定值和/或到另一特定值。此外，术语“约”是指在特定值的可接受误差范围内，如本领域普通技术人员所确定的那样，这将部分取决于如何测量或确定该值，即测量系统的局限性。例如，根据本领域的惯例，“约”可以表示在可接受的标准偏差内。可选地，“约”可以是指给定值的至多±20％、优选地至多±10％、更优选地至多±5％、并且更优选地至多±1％的范围。可选地，特别是关于生物系统或过程，该术语可以指在数值的一定数量级内，优选在数值的2倍内。在本申请和权利要求书中描述了特定值的情况下，除非另有说明，否则术语“约”是隐含的，并且在本上下文中表示该特定值在可接受的误差范围内。

类似地，如本文所用，“基本上不含”某物或“基本上纯的”以及类似特征可包括“至少基本上不含”某物或“至少基本上纯的”以及“完全不含”或“完全纯的”。

“包含”或“含有”或“包括”是指在组合物或制品或方法中至少存在指定的化合物、元素、颗粒或方法步骤，但不排除其他化合物、材料、颗粒、方法步骤，即使其他此类化合物、材料、颗粒、方法步骤具有与指定功能相同的功能。

在整个说明书中，可以识别出具有特定值或参数的各种组件，但是，这些项目被作为示例性实施方案提供。实际上，示例性实施方案不限制本发明的各个方面和概念，因为可以实现许多可比较的参数、大小、范围和/或数值。术语“第一”、“第二”等，“主要”、“次级”等不表示任何顺序、数量或重要性，而是用于将一个要素与另一个要素区分开来。

注意，如“具体地”、“优选地”、“典型地”、“大体地”和“通常地”的术语在本文中没有被用来限制所要求保护的发明的范围，或暗示某些特征对于所要求保护的发明的结构或功能是关键的、必要的或者甚至重要的。相反，这些术语仅旨在强调在本发明的特定实施方案中可以使用或可以不使用的替代或附加特征。还应注意，在本文中使用如“基本上”和“约”之类的术语来表示不确定性的固有程度，该不确定性可归因于任何定量比较结果、值、测量结果或其他表示法。

本文所公开的量纲和值不应理解为严格限于所述的精确数值。相反，除非另外指明，否则每个这样的量纲旨在表示所列举的值和围绕该值的功能上等效的范围。例如，公开为“50mm”的量纲旨在表示“约50mm”。

还应理解，提及一个或多个方法步骤并不排除在明确标识的那些步骤之间存在其他方法步骤或中间方法步骤。类似地，还应理解的是，在组合物中提及一种或多种组分并不排除存在与明确鉴定的组分之外的其它的组分。

在下文中描述的构成本发明的各种元件的材料旨在是例示性的而非限制性的。与本文所述的材料将执行相同或相似功能的许多合适的材料旨在包含在本发明的范围内。例如，本文中未描述的此类其他材料可以包括但不限于例如在本发明开发之后开发的材料。

根据本发明，可以采用本领域技术范围内的常规分子生物学、微生物学和重组DNA技术。文献中对这种技术进行了充分的解释。参见例如，Sambrook、Fritsch&Maniatis，分子克隆：实验手册，第二版(1989)，冷泉港实验室出版社，纽约冷泉港(本文简称“Sambrook等人，1989”)；DNA克隆：实用方法，第一卷和第二卷(D.N.Glover编辑1985)；寡核苷酸合成(M.J.Gait编辑1984)；核酸杂交(B.D.Hames&S.J.Higgins编辑(1985)；转录和翻译(B.D.Hames&S.J.Higgins,编辑(1984)；动物细胞培养(R.I.Freshney,编辑(1986)；固定化细胞和酶(IRL Press,(1986)；B.Perbal，分子克隆的实用指南(1984)；F.M.Ausubel等人(编辑)，分子生物学的当前协议，约翰威利父子公司(1994)；等等。

定义

如本文所用，“核酸”是指多核苷酸，并且包括脱氧核糖核苷酸或核糖核苷酸碱基的单链聚合物或双链聚合物。核酸还可包括片段和修饰的核苷酸。因此，术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用，以表示单链或双链的RNA和/或DNA的聚合物，任选含有合成的，非天然或改变的核苷酸碱基。核苷酸(通常以其5’-单磷酸形式存在)用其单字母名称表示如下：“A”代表腺苷或脱氧腺苷(分别代表RNA或DNA)；“C”代表胞嘧啶或脱氧胞嘧啶；“G”代表鸟苷或脱氧鸟苷；“U”代表尿苷；“T”代表脱氧胸苷；“R”代表嘌呤(A或G)；“Y”代表嘧啶(C或T)；“K”代表G或T；“H”代表A或C或T；“I”代表肌苷；以及“N”代表任何核苷酸。核酸可包含核苷酸。核酸对于细胞可以是外源的或内源的。核酸可以存在于无细胞的环境中。核酸可以是基因或其片段。核酸可以是DNA。核酸可以是RNA。核酸可包含一种或多种类似物(例如，改变的主链、糖或核碱基)。类似物的一些非限制性示例包括：5-溴尿嘧啶、肽核酸、异种核酸、吗啉代、锁核酸、乙二醇核酸、苏糖核酸、双脱氧核苷酸、虫草素、7-脱氮-GTP、荧光团(例如与糖链接的若丹明或氟丁香)、含有硫醇的核苷酸、生物素联接的核苷酸、荧光碱基类似物、CpG岛、甲基7-鸟苷、甲基化的核苷酸、肌苷、硫代尿苷、假尿嘧啶、二氢尿苷、喹啉和怀俄苷。

如本文所用，术语“CRISPR/CasX”、“CasX”、“CasX核酸内切酶”和CRISPR/CasX核酸内切酶可以互换使用。CRISPR/CasX或CasX可以指CRISPR/CasX的任何修饰的(例如，缩短、突变、延长)多肽序列或同源物，包括变体、修饰、融合(如本文所定义)和/或酶失活形式的CRISPR/CasX。CRISPR/CasX可以进行密码子优化。CRISPR/CasX可以是CRISPR/CasX的密码子优化同源物。CRISPR/CasX可以是酶失活的、部分活性的、组成性活性的、完全活性的、诱导活性的、在不同温度下有活性的和/或更具活性的(例如，比蛋白质或多肽的野生型同源物更多)。在一些情况下，CRISPR/CasX(例如，变体、突变和/或酶失活性的CRISPR/CasX)可以靶向靶核酸。CRISPR/CasX可以与短的靶向核酸或向导核酸结合，从而为通过蛋白质的核酸内切酶活性裂解的靶核酸提供特异性。CRISPR/CasX可以单独提供，或可以以其与靶向核酸或向导核酸预先关联的复合物形式提供。在一些情况下，CRISPR/CasX可以是如本文所述的融合蛋白，例如与mNeonGreen融合的CRISPR/CasX。

如本文所用，术语“δ变形菌(Deltaproteobacteria)CRISPR/CasX”用于指从δ变形菌(Deltaproteobacteria)分离的适于基因组编辑的RNA向导的核酸内切酶。δ变形菌(Deltaproteobacteria)是革兰氏阴性细菌的一类，包括以下目和科：Syntrophorhabdaceae、蛭弧菌目(Bdellovibrionales)、噬菌弧菌科(Bacteriovoracaceae)、蛭弧菌科(Bdellovibrionaceae)、脱硫盒菌目(Desulfarculales)、脱硫盒菌科(Desulfarculaceae)、脱硫杆菌目(Desulfobacterales)、脱硫杆菌科(Desulfobacteraceae)、Desulfobulbaceae、Nitrospinaceae、脱硫弧菌目(Desulfovibrionales)、Desulfohalobiaceae、Desulfomicrobiaceae、Desulfonatronaceae、硫弧菌科(Desulfovibrionaceae)、硫还原菌目(Desulfurellales)、硫还原菌科(Desulfurellaceae)、除硫单胞菌目(Desulfuromonadales)、除硫单胞菌科(Desulfuromonadaceae)、地杆菌科(Geobacteraceae)、粘球菌目(Myxococcales)[粘细菌]、孢囊杆菌科(Cystobacteraceae)、粘液球菌科(Myxococcaceae)、Haliangiaceae、Kofleriaceae、侏囊菌科(Nannocystaceae)、Phaselicystidaceae、多囊粘菌科(Polyangiaceae)、互营杆菌目(Syntrophobacterales)、互营菌科(Syntrophaceae)、互营杆菌科(Syntrophobacteraceae)。

如本文所用，术语“浮霉菌(Planctomycetes)CRISPR/CasX”用于指从浮霉菌(Planctomycetes)目中分离的适合基因组编辑的RNA向导的核酸内切酶。浮霉菌(Planctomycetes)是水生细菌的门，该门包括Phycisphaerae和Planctomycetes纲。CRISPR/CasX可以由tracrRNA和crRNA向导。CRISPR/CasX可以由sgRNA(单向导RNA)向导，其中tracrRNA使用四环(tetraloop)连接到crRNA。crRNA的转录加工导致包含约23个重复序列核苷酸和20个相邻间隔区序列核苷酸，其中间隔区序列可与靶标DNA的特定序列杂交，并能有效地将CRISPR/CasX向导至靶标DNA的特定序列。参见Burstein等人，来自未培养微生物的新型CRISPR-Cas系统。Nature(2017)542(7640)：237-241作进一步描述，特别是图3e和第239页右栏。

在一些实施方案中，序列TTCN位于质粒靶标中的前间区序列的5’。在一些实施方案中，序列TTCA位于质粒靶标中的前间区序列的5’。

CRISPR/CasX在装载有向导RNA时，有效地产生位点特异性的DNA双链断裂。CRISPR/CasX在适合植物基因组工程的温度下具有活性。CRISPR/CasX的示例性氨基酸序列在本文中以SEQ ID NO：1-3提供。CRISPR/CasX在还适合于植物和植物细胞的生长和培养的温度范围内起作用，诸如但不限于，约20℃至约35℃，优选约23℃至约32℃，最优选约25℃至约28℃。CRISPR/CasX可用于本文所述的任何实施方案中。

如本文所用，“间隔区”、“靶向核酸的核酸”或“靶向核酸的向导核酸”或“向导-RNA”可互换使用，并且可以指可结合本公开的CRISPR/CasX蛋白并与靶核酸杂交的核酸。靶向核酸的核酸可以是RNA，包括但不限于一种或多种单链RNA。CRISPR/CasX可以由tracrRNA和crRNA向导。CRISPR/CasX可以由sgRNA(单向导RNA)向导，其中tracrRNA使用四环连接到crRNA。crRNA的转录加工可导致包含约23个核苷酸的重复序列，以及20个核苷酸的相邻间隔区序列。

靶向核酸的核酸可以位点特异性结合靶核酸。靶向核酸的核酸的一部分可以与靶核酸的一部分互补。靶向核酸的核酸可包含可称为“核酸靶向片段”的片段。靶向核酸的核酸可包含可称为“蛋白质结合片段”的片段。核酸靶向片段和蛋白质结合片段可以是靶向核酸的核酸的相同片段。靶向核酸的核酸可以包含修饰的核苷酸，修饰的主链或两者。靶向核酸的核酸可以包含肽核酸(PNA)。

如本文所用，“供体多核苷酸”可以指在基因组工程、靶核酸工程或本公开的任何其他方法期间可以整合到位点的核酸。

如本文所用，“融合物”可以指包含一个或多个非天然序列(例如，部分)的蛋白质和/或核酸。融合物可以在修饰蛋白质的N-末端或C-末端处，或两者处。融合物可以是转录和/或翻译融合。融合物可以包含一个或多个相同的非天然序列。融合物可以包含一个或多个不同的非天然序列。融合物可以是嵌合体。融合物可包含核酸亲和标签。融合物可包含条形码。融合物可包含肽亲和标签。融合物可提供CRISPR/CasX的亚细胞定位(例如，用于靶向核的核定位信号(NLS)、用于靶向线粒体的线粒体定位信号、用于靶向叶绿体的叶绿体定位信号、内质网状(ER)保留信号等)。融合物可提供可用于追踪或纯化的非天然序列(例如亲和标签)。融合物可以是小分子，诸如生物素，也可以是染料、诸如

染料、Cyanine3染料、Cyanine5染料。融合物可以提供增加或降低的稳定性。在一些实施方案中，融合物可包含可检测标记(包括可提供可检测信号的部分)。可以提供可检测信号的合适的可检测标记和/或部分可以包括但不限于酶、放射性同位素、特异性结合对的成员；荧光团；荧光报道分子或荧光蛋白；量子点；等等。融合物可包含FRET对的成员，或荧光团/量子点供体/受体对。融合物可包含酶。合适的酶可包括但不限于辣根过氧化物酶、萤光素酶、β-半乳糖苷酶等。融合物可包含荧光蛋白。合适的荧光蛋白可包括但不限于绿色荧光蛋白(GFP)(例如，来自维多利亚水母的GFP、来自日本鳗鲡的荧光蛋白或其突变体或衍生物)、红色荧光蛋白、黄色荧光蛋白、黄绿色荧光蛋白(例如，来源于四聚体荧光蛋白中的mNeonGreen，该四聚体荧光蛋白来自头索动物文昌鱼(Branchiostoma lanceolatum))多种荧光和有色蛋白中的任何一种。融合物可包含纳米颗粒。合适的纳米颗粒可包括荧光或发光纳米颗粒、以及磁性纳米颗粒。纳米颗粒的任何光学或磁性或特性可被检测。

融合物可包含解旋酶、核酸酶(例如FokI)、核酸内切酶、核酸外切酶(例如5’核酸外切酶和/或3’核酸外切酶)、连接酶、切口酶、核酸酶解旋酶(例如Cas3)、DNA甲基转移酶(例如Dam)、或DNA脱甲基酶、组蛋白甲基转移酶、组蛋白脱甲基酶、乙酰酶(包括例如但不限于组蛋白乙酰化酶)、脱乙酰基酶(包括例如但不限于组蛋白脱乙酰基酶)、磷酸酶、激酶、转录(共)激活物、转录(共)因子、RNA聚合酶亚基、转录阻遏物、DNA结合蛋白、DNA结构蛋白、长非编码RNA、DNA修复蛋白(例如，涉及修复单链和/或双链断裂的蛋白，例如参与碱基切除修复的蛋白质，核苷酸切除修复、错配修复、NHEJ、HR、微同源介导的末端连接(MMEJ)和/或其他非同源末端连接(ANHEJ)，诸如但不限于，HR调节器和HR复杂装配信号)、标记蛋白、报道蛋白、荧光蛋白、配体结合蛋白(例如mCherry或重金属结合蛋白)、信号肽(例如Tat信号序列)、靶向蛋白或肽、亚细胞定位序列(例如核定位序列、叶绿体定位序列)和/或抗体表位、或其任何组合。

如本文所用，“基因组工程”可以指修饰靶核酸的过程。基因组工程可以指将非天然核酸整合到天然核酸中。基因组工程可以指将CRISPR/CasX和靶向核酸的核酸靶向靶核酸。基因组工程可以指靶核酸的裂解和靶核酸的重新连接而在靶核酸中没有外源序列的整合或靶核酸中的缺失。天然核酸可以包含基因。非天然核酸可包含供体多核苷酸。核酸内切酶可以在所需的基因座(或基因位点)处产生靶向的DNA双链断裂，并且植物细胞可以使用供体多核苷酸修复双链断裂，从而将修饰稳定地并入到植物基因组中。

在本公开的这些方法中，CRISPR/CasX蛋白或其复合物可在核酸(例如基因组DNA)中引入双链断裂。双链断裂可刺激细胞的内源性DNA修复途径(例如同源重组(HR)和/或非同源末端连接(NHEJ)或A-NHEJ(替代性非同源末端连接)。可以将外来、外源和/或替代核酸的突变、缺失、改变和整合引入双链DNA断裂的位点。

如本文所用，术语“分离的”可以指通过人工存在于其天然环境之外并且因此不是自然产物的核酸或多肽。分离的可以指基本纯的。分离的核酸或多肽可以纯化形式存在和/或可在非天然环境中存在，例如在转基因细胞中。

如本文所用，“非天然”可以指在天然核酸或蛋白质中未发现的核酸或多肽序列。非天然可以指亲和标签。非天然可以指融合物。非天然可以指包含突变、插入和/或缺失的天然存在的核酸或多肽序列。非天然序列可以表现出和/或编码如下的活性(例如酶活性、甲基转移酶活性、乙酰基转移酶活性、激酶活性、泛素化活性等)，该活性也可以通过与非天然序列融合的核酸和/或多肽序列表现出来。非天然核酸或多肽序列可以通过基因工程与天然存在的核酸或多肽序列(或其变体)联接，以产生编码嵌合核酸和/或多肽的嵌合核酸和/或多肽序列。非天然序列可以指3'杂交延伸序列。

如本文所用，“核苷酸”通常可以指碱基糖磷酸酯的组合。核苷酸可包含合成核苷酸。核苷酸可包含合成核苷酸类似物。核苷酸可以是核酸序列的单体单元(例如脱氧核糖核酸(DNA)和核糖核酸(RNA))。术语核苷酸可包括核糖核苷三磷酸腺苷三磷酸(ATP)、尿苷三磷酸(UTP)、胞嘧啶三磷酸(CTP)、鸟苷三磷酸(GTP)和脱氧核糖核苷三磷酸，诸如dATP、dCTP、dITP、dUTP、dGTP、dTTP或其衍生物。此类衍生物可包括，例如但不限于，[αS]dATP、7-脱氮-dGTP和7-脱氮-dATP、以及在包含它们的核酸分子上赋予核酸酶抗性的核苷酸衍生物。本文所用的术语核苷酸可以指双脱氧核糖核苷三磷酸(ddNTP)及其衍生物。双脱氧核糖核苷三磷酸的说明性示例可包括但不限于ddATP、ddCTP、ddGTP、ddITP和ddTTP。核苷酸可以是未标记的，也可以通过众所周知的技术可检测地标记。标记也可以用量子点进行。可检测的标记可包括例如放射性同位素、荧光标记、化学发光标记、生物发光标记和酶标记。核苷酸的荧光标记可包括但不限于荧光素、5-羧基荧光素(FAM)、2’7’-二甲氧基-4’5-二氯-6-羧基荧光素(JOE)、若丹明、6-羧基若丹明(R6G)、N，N，N'，N’-四甲基6-羧基若丹明(TAMRA)、6-羧基-X-若丹明(ROX)、4-(4’二甲基氨基苯基偶氮)苯甲酸(DABCYL)、Cascade蓝、俄勒冈绿、德克萨斯红、花菁和5-(2’-氨基乙基)氨基萘-1-磺酸(EDANS)。

如本文所用，“重组”可指源自特定宿主(例如细胞)外源的序列，或如果源自相同来源，则从其原始形式修饰的序列。细胞中的重组核酸可包括特定细胞内源的核酸，但是已经通过例如使用定点诱变进行了修饰。术语“重组”可包括天然存在的DNA序列的非天然存在的多个拷贝。因此，术语“重组”可指与细胞是异源或异源的核酸，或与细胞同源但在细胞内通常找不到该核酸的位置或形式的核酸。类似地，当在多肽或氨基酸序列的上下文中使用时，外源多肽或氨基酸序列可以是源自特定细胞外源的多肽或氨基酸序列，或者如果源自相同来源，则从其原始形式修饰的多肽或氨基酸序列。

如本文所用，术语“特异性”可指两个分子的相互作用，其中该分子之一通过例如化学或物理手段特异性地与第二分子结合。示例性的特异性结合相互作用可指抗原-抗体结合、抗生物素蛋白-生物素结合、碳水化合物和凝集素、互补核酸序列(例如杂交)、互补肽序列(包括通过重组方法形成的肽序列)、效应子和受体分子、酶辅因子和酶、酶抑制剂和酶等。“非特异性”可指两个分子之间的非特异性相互作用。

如本文所用，“靶核酸”或“靶位点”通常可指本公开的方法中要靶向的靶核酸。靶核酸可指核染色体/基因组序列或染色体外序列(例如附加型序列、小环序列、线粒体序列、叶绿体序列、原生质体序列、质体序列等)，靶核酸可以是DNA。靶核酸可以是单链DNA。靶核酸可以是双链DNA。靶核酸可以是单链或双链RNA。靶核酸在本文中可以与“靶核苷酸序列”和/或“靶多核苷酸”互换使用。

如本文所用，在核酸或多肽序列的上下文中，“序列同一性”或“同一性”是指当在指定的比较窗口上进行最大对应性比对时，两个序列中的相同的核酸碱基或氨基酸残基。

如本文所用，术语“序列同一性百分比”是指通过在比较窗口上比较两个最佳比对的序列而确定的值，其中比较窗口中的多核苷酸或多肽序列的一部分与参考序列(不包含添加或缺失)相比可包括添加或缺失(即缺口)，以用于两个序列的最佳比对。通过确定两个序列中出现同一核酸碱基或氨基酸残基的位置数以得出匹配位置数，将匹配位置数除以比较窗口中的位置总数来计算百分比，并将结果乘以100以得出序列同一性的百分比。百分比序列同一性的有用示例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％或95％或50％至100％的任何整数百分比。

如本文所用，术语“植物”是指整株植物、植物器官、植物组织、种子、植物细胞、种子及其后代。植物细胞包括但不限于来自以下的细胞：种子、悬浮培养物、胚胎、受精卵、分生组织区域、愈伤组织、叶、根、芽、配子体、原生质体、质体、孢子体、花粉和小孢子。植物部位包括分化和未分化的组织，该组织包括但不限于根、茎、枝、叶、花粉、种子、花、人类和/或其他哺乳动物可食用的部分(例如稻米、玉米棒，块茎)、肿瘤组织以及各种形式的细胞和培养物(例如单细胞、原生质体、质体、胚胎、受精卵和愈伤组织)。

“植物组织”涵盖植物细胞，并且可以在植物中或在植物器官，组织或细胞培养物中。植物组织还指此类植物、种子、后代、繁殖体的任何克隆，无论是有性或无性繁殖的，以及其中任何一种的后代，诸如插条或种子。术语“植物器官”是指构成植物的形态和功能上不同的部分的植物组织或一组组织。术语“基因组”是指存在于生物体、病毒或细胞器的每个细胞中的遗传物质(基因和非编码序列)的完整补充；和/或从一个亲本作为(单倍体)单元继承的完整染色体组。“后代”包括植物的任何后续世代。

如本文所用，术语“转基因植物”包括：例如在其基因组中包含通过转化步骤引入的异源多核苷酸的植物。异源多核苷酸可以稳定地整合在基因组内，从而使多核苷酸传递给相继的世代。异源多核苷酸可单独或作为重组DNA构建体的一部分整合到基因组中。转基因植物还可以在其基因组内包含一个以上的异源多核苷酸。每个异源多核苷酸可赋予转基因植物不同的性状。异源多核苷酸可包括源自外来物种的序列，或者如果源自相同物种，则可从其天然形式进行实质上修饰。转基因可包括任何细胞、细胞系、愈伤组织、组织、植物部位或植物，其基因型已因异源核酸的存在而改变，包括最初如此改变的转基因以及由最初转基因的有性杂交或无性繁殖产生的转基因。通过常规植物育种方法，通过本文所述的不导致外源多核苷酸插入的基因组编辑程序，或通过自然发生的事件(诸如随机交叉受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变)来改变基因组(染色体或染色体外)不被认为是转基因的。

在本公开的某些实施方案中，可育植物是产生存活的雄配子和雌配子并且是自育(self-fertile)的植物。此类自育植物可产生后代植物，而没有任何其他配子和配子中含有的遗传物质的贡献。本公开的其他实施方案可涉及使用不自育的植物，因为该植物不产生存活或以其他方式能够受精的雄配子或雌配子或两者。如本文所用，“雄性不育植物”是不产生存活或以其他方式能够受精的雄配子的植物。如本文所用，“雌性不育植物”是不产生有存活或以其他方式能够受精的雌配子的植物。人们认识到，雄性不育植物和雌性不育植物可以分别是雌性可育的和雄性可育的。进一步认识到，雄性可育(但雌性不育)植物与雌性可育植物杂交时可产生存活的子代，而雌性可育(但雄性不育)植物与雄性可育植物杂交时可产生存活的子代。

如本文所用，术语“质粒”、“载体”和“盒”是指染色体外元件，该元件通常携带不属于细胞中心代谢部分的基因，并且通常是以双链DNA的形式。此类元件可以是以源自任何来源的单链或双链DNA或RNA的线性或环状形式的自主复制序列、基因组整合序列、噬菌体或核苷酸序列，其中多个核苷酸序列已经连接或重组成能够将目的多核苷酸引入细胞的独特结构。“转化盒”是指包含基因并且除该基因外还具有促进特定宿主细胞转化的元件的指定载体。“表达盒”是指包含基因并且除该基因之外还具有允许该基因在宿主中表达的元件的指定载体。

用于稳定整合到植物细胞的基因组中的表达盒可包含一种或多种以下元件：可用于在植物细胞中表达RNA和/或CasX酶的启动子元件；增强表达的5’非翻译区；内含子元件，以进一步增强某些细胞(诸如单子叶植物细胞)中的表达；多克隆位点，为插入向导RNA和/或CasX基因序列和其他所需元件提供方便的限制性位点；3’非翻译区，以提供有效终止表达的转录物。

术语“重组DNA分子”、“重组构建体”、“表达构建体”、“构建体”、“构建体”和“重组DNA构建体”在本文可互换使用。重组构建体包含核酸片段的人工组合，例如在自然界中并非全部一起发现的调节和编码序列。例如，构建体可包含源自不同来源的调节序列和编码序列，或源自相同来源但以与自然界发现的不同方式排列的调节序列和编码序列。此类构建体可以单独使用或与载体结合使用。如果使用载体，则载体的选择取决于本领域技术人员众所周知的将用于转化宿主细胞的方法。例如，可以使用质粒载体。T7载体(pSF-T7)可用于允许产生带帽RNA，以用于转染到细胞中。技术人员充分了解为了成功转化、选择和繁殖宿主细胞，载体上必须存在遗传元件。技术人员还将认识到，不同的独立转化事件可能导致不同的表达水平和模式(Jones等人，(1985)EMBO J 4：241 1-2418；De Almeida等人，(1989)分子遗传学218：78-86)，因此通常筛选多个事件，以获得显示所需表达水平和模式的品系。此类筛选可通过标准的分子生物学、生化和其他测定来完成，这些测定包括DNA的Southern分析、mRNA表达的Northern分析、PCR、实时定量PCR(qPCR)、逆转录PCR(RT-PCR)、蛋白质表达的免疫印迹分析、酶或活性测定和/或表型分析。其他技术(诸如S1 RNase保护、引物延伸、原位杂交、酶染色和免疫染色)也可用于检测多肽和/或多核苷酸的存在或表达。

如本文所用，术语“表达”是指前体或成熟形式的功能性终产物(例如，mRNA、向导RNA或蛋白质)的产生。

如本文所用，术语“引入”是指向细胞内提供核酸(例如表达构建体)或蛋白质。“引入”包括提及将核酸掺入到真核或原核细胞中，其中核酸可掺入到细胞的基因组中，并且“引入”包括提及向细胞瞬时提供核酸或蛋白质。“引入”包括提及稳定或瞬时转化方法以及有性杂交。因此，在将核酸片段(例如重组DNA构建体/表达构建体)插入细胞中的上下文中的“引入”是指“转染”或“转化”或“转导”，并包括将核酸片段掺入真核或原核细胞，其中核酸片段可掺入细胞基因组(例如，核染色体、质粒、质体、叶绿体或线粒体DNA)，转化为自主复制子、或瞬时表达(例如，转染的mRNA)。

如本文所用，术语“成熟”蛋白是指翻译后经加工的多肽(即，已去除存在于初级翻译产物中的任何前肽原或前肽的多肽)。“前体”蛋白是指mRNA翻译的主要产物(即，前肽原和前肽仍然存在)。前肽原和前肽可以是但不限于细胞内定位信号。

如本文所用，术语“稳定转化”是指核酸片段转移到宿主生物的基因组中，“稳定转化”包括核基因组和细胞器基因组，导致遗传学上稳定的遗传。相反，“瞬时转化”是指核酸片段转移到宿主生物的核或其他含DNA的细胞器中，导致基因表达而没有整合或稳定的遗传。包含转化的核酸片段的宿主生物被称为“转基因”生物。基因改良种质的商业开发也已进入将多种性状引入农作物的阶段，通常被称为基因叠加法。用这种方法，可以将赋予不同目的特性的多个基因导入植物中。基因叠加可以通过许多手段完成，其包括但不限于共转化、重转化以及与目的不同基因杂交的品系。

如本文所用，术语“经杂交”或“杂交”或“杂交中”是指配子通过授粉融合以产生后代(即细胞、种子或植物)。该术语包括有性杂交(一种植物对另一种植物的授粉)和自交(自花授粉，即当花粉和胚珠(或小孢子和大孢子)来自同一植物或遗传上相同的植物)。

如本文所用，术语“基因渗入”是指遗传基因座的所需等位基因从一个遗传背景向另一遗传背景的传递。例如，所需等位基因在指定基因座处的基因渗入可以通过两个亲本植物之间的有性杂交传递给至少一种后代植物，其中至少一种亲本植物在其基因组内具有所需的等位基因。或者，例如，等位基因的传递可通过两个供体基因组之间的重组发生，例如在融合的原生质体中，其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需的等位基因可以是例如转基因、修饰的(突变或编辑的)天然等位基因，或标记物或QTL的选定等位基因。

如本文所用，术语“杂交”是指在常规条件下杂交，如Sambrook等人，(1989)所述，优选是在严格的条件下进行。严格的杂交条件是例如但不限于：在65℃下的4×SSC中杂交。然后在65℃下的0.1×SSC中多次洗涤，持续共约一个小时。较不严格的杂交条件是例如但不限于：在37℃下的4×SSC中杂交，然后在室温下的1×SSC中多次洗涤。“严格杂交条件”也可以是例如但不限于：在68℃下杂交。在0.25M磷酸钠、pH 7.2、7％SDS、1mM EDTA和1％BSA中溶解16小时，然后在68℃下用2×SSC和0.1％SDS洗涤两次。

本发明的CRISPR/CasX核酸内切酶

CRISPR/CasX可能会在靶核酸(例如基因组DNA)中引入双链断裂。双链断裂可以刺激细胞的内源性DNA修复途径(例如HR、NHEJ、A-NHEJ或MMEJ)。NHEJ可以修复裂解的靶核酸，而无需同源模板。这可导致靶核酸的缺失。同源重组(HR)可以用同源模板发生。同源模板可包含与靶核酸裂解位点侧翼的序列同源的序列。在靶核酸被CRISPR/CasX裂解后，裂解位点可以被破坏(例如，该位点可能无法用原始的靶向核酸的核酸和CRISPR/CasX进行另一轮裂解)。

CRISPR/CasX可包含核酸结合结构域。核酸结合结构域可包含接触核酸的区域。核酸结合结构域可包含核酸。核酸结合结构域可包含蛋白质物质。核酸结合结构域可包含核酸和蛋白质物质。核酸结合结构域可包含DNA。核酸结合结构域可包含单链DNA。核酸结合结构域的示例可包括但不限于：螺旋-转-螺旋结构域、锌指结构域、亮氨酸拉链(bZIP)结构域、有翼的螺旋结构域、有翼的螺旋转螺旋结构域、螺旋-环-螺旋结构域、HMG-box结构域、Wor3结构域、免疫球蛋白结构域、B3结构域和TALE结构域。核酸结合结构域可以是CRISPR/CasX蛋白的结构域。CRISPR/CasX蛋白可以是真核CRISPR/CasX或原核CRISPR/CasX。CRISPR/CasX蛋白可结合RNA或DNA，也可结合RNA和DNA。CRISPR/CasX蛋白可裂解RNA或DNA，或裂解RNA和DNA两者。在一些情况下，CRISPR/CasX蛋白结合DNA并裂解DNA。在一些情况下，CRISPR/CasX蛋白结合双链DNA并裂解双链DNA。在一些情况下，两个或更多个核酸结合结构域可以联接在一起。将多个核酸结合结构域联接在一起可以提供增加的多核苷酸靶向特异性。可以通过一个或多个接头联接两个或多个核酸结合结构域。该接头可以是柔性接头。接头长度可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40或更多个氨基酸。接头结构域可包含甘氨酸和/或丝氨酸，并且在一些实施方案中可由甘氨酸和/或丝氨酸组成或可基本上由甘氨酸和/或丝氨酸组成。接头可以是可包含核苷酸的核酸接头。核酸接头可以将两个DNA结合结构域联接在一起。核酸接头的长度最多为5、10、15、20、25、30、35、40、45或50个或更多个核苷酸。核酸接头的长度可以是至少5、10、15、30、35、40、45或50或更多个核苷酸。

核酸结合结构域可以结合核酸序列。核酸结合结构域可以通过杂交与核酸结合。核酸结合结构域可以被工程化(例如，工程化以与基因组中的序列杂交)。可以通过分子克隆技术(例如，定向进化、位点特异性突变和合理诱变)来工程化核酸结合结构域。

CRISPR/CasX可包含核酸裂解结构域。核酸裂解结构域可以是来自任何核酸裂解蛋白的核酸裂解结构域。核酸裂解结构域可以源自核酸酶。合适的核酸裂解结构域包括核酸内切酶的核酸裂解结构域(例如AP核酸内切酶、RecBCD核酸内切酶、T7核酸内切酶、T4核酸内切酶IV、Bal 31核酸内切酶、核酸内切酶I(内切I)、微球菌核酸酶、核酸内切酶II(内切VI、外切核酸酶)、外切核酸酶、限制性核酸酶、内切核糖核酸酶、外切核糖核酸酶、RNA酶(例如，RNA酶I、RNA酶II或RNA酶III)。核酸结合结构域可以是CRISPR/CasX蛋白的结构域。CRISPR/CasX蛋白可以是真核CRISPR/CasX或原核CRISPR/CasX。CRISPR/CasX蛋白可结合RNA或DNA，或结合RNA和DNA两者。CRISPR/CasX蛋白可裂解RNA或DNA，或裂解RNA和DNA两者。在一些情况下，CRISPR/CasX蛋白结合DNA并裂解DNA。在一些情况下，CRISPR/CasX蛋白结合双链DNA并裂解双链DNA。在一些情况下，核酸裂解结构域可以源自FokI核酸内切酶。CRISPR/CasX可包含多个核酸裂解结构域。核酸裂解结构域可以联接在一起。可以通过接头将两个或更多个核酸裂解域联接。在一些实施方案中，该接头可以是如本文所述的柔性接头。接头长度可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40或更多个氨基酸。在一些实施方案中，CRISPR/CasX可包含多个核酸裂解结构域。

CRISPR/CasX可以在核酸(例如基因组DNA)中引入双链断裂。双链断裂可刺激细胞的内源性DNA修复途径(例如同源重组和非同源末端连接(NHEJ)或另选的非同源末端连接(A-NHEJ))。NHEJ可以修复裂解的靶核酸，而无需同源模板。这可导致靶核酸的缺失。同源重组(HR)可以用同源模板发生。同源模板可包含与靶核酸裂解位点侧翼的序列同源的序列。在靶核酸被CRISPR/CasX裂解后，裂解位点可以被破坏(例如，该位点可能无法用原始的靶向核酸的核酸和CRISPR/CasX进行另一轮裂解)。

在一些情况下，同源重组可将外源多核苷酸序列插入靶核酸裂解位点。外源多核苷酸序列可称为供体多核苷酸。在本公开的方法的一些情况下，可以将供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分插入靶核酸裂解位点。供体多核苷酸可以是外源多核苷酸序列。供体多核苷酸可以是在靶核酸裂解位点天然不存在的序列。载体可包含供体多核苷酸。由于NHEJ和/或HR对靶DNA的修饰可导致例如突变、缺失、改变、整合、基因校正、基因替换、基因标记、转基因插入、核苷酸缺失、基因破坏和/或基因突变。将非天然核酸整合到基因组DNA中的过程可以称为基因组工程。

在一些情况下，CRISPR/CasX可包含与野生型示例性CRISPR/CasX(例如SEQ IDNO：1-2)具有至多10％、至多15％、至多20％、至多30％、至多40％、至多50％、至多60％、至多70％、至多75％、至多80％、至多85％、至多90％、至多95％、至多99％或100％的氨基酸序列同一性的氨基酸序列。

在一些情况下，CRISPR/CasX可包含与野生型示例性CRISPR/CasX(例如SEQ IDNO：1-2)具有至少10％、至少15％、至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少99％或100％的氨基酸序列同一性的氨基酸序列。

在一些情况下，CRISPR/CasX可包含与野生型示例性CRISPR/CasX(例如SEQ IDNOS：1-2)的核酸酶结构域具有至多10％、至多15％、至多20％、至多30％、至多40％、至多50％、至多60％、至多70％、至多75％、至多80％、至多85％、至多90％、至多95％、至多99％或100％的氨基酸序列同一性的氨基酸序列。

本文公开的CRISPR/CasX蛋白可包含一种或多种修饰。该修饰可包括翻译后修饰。靶核酸的修饰可发生在离CRISPR/CasX蛋白羧基末端或氨基末端的至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或更多个氨基酸处。CRISPR/CasX蛋白的修饰可发生在离CRISPR/CasX蛋白羧基末端或氨基末端至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或更多个氨基酸处。该修饰可能由于编码CRISPR/CasX蛋白的核酸的修饰而发生。示例性的修饰可包括甲基化、脱甲基、乙酰化、脱乙酰基、泛素化、脱泛素化、脱氨基化、烷基化、脱嘌呤化、氧化、嘧啶二聚体形成、转座、重组、链伸长、连接、糖基化。磷酸化、去磷酸化、腺苷酸化、去腺苷酸化、SUMOylation、deSUMOylation、核糖基化、去核糖基化、肉豆蔻酰基化、重塑、裂解、氧化还原、水解和异构化。

CRISPR/CasX可包含野生型示例性CRISPR/CasX的修饰形式。野生型示例性CRISPR/CasX的修饰形式可包含降低CRISPR/CasX的核酸裂解活性的氨基酸变化(例如，缺失、插入或取代)。可选地，氨基酸变化可导致CRISPR/CasX的核酸裂解活性增加。可选地，氨基酸变化可导致CRISPR/CasX具有活性的温度的变化。

CRISPR/CasX蛋白可包含一个或多个突变。CRISPR/CasX蛋白可包含氨基酸修饰(例如，取代、缺失、添加等，及其组合)。CRISPR/CasX蛋白可包含一个或多个非天然序列(例如，如本文所定义的融合物)。氨基酸修饰可包含一个或多个非天然序列(例如，如本文定义的融合物、亲和标签)。氨基酸修饰可能基本上不改变核酸内切酶的活性。包含氨基酸修饰和/或融合的CRISPR/CasX可保留野生型CRISPR/CasX的至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约97％或100％的活性。本公开的修饰(例如，突变)可通过定点突变产生。突变可包括取代、添加和缺失或其任何组合。在一些情况下，该突变将突变的氨基酸转化为丙氨酸。在一些情况下，该突变将突变的氨基酸转化为另一个氨基酸(例如，甘氨酸、丝氨酸、苏氨酸、半胱氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸、脯氨酸、苯丙氨酸、酪氨酸、色氨酸、天冬氨酸、谷氨酸、天冬酰胺、谷氨酰胺、组氨酸、赖氨酸或精氨酸)。该突变可将突变的氨基酸转化为非天然氨基酸(例如硒代甲硫氨酸)。该突变可将突变的氨基酸转化为氨基酸模拟物(例如，磷酸化模拟物)。该突变可以是保守突变。例如，该突变可将突变的氨基酸转化为类似于突变氨基酸的大小、形状、电荷、极性、构象和/或旋转异构体的氨基酸(例如半胱氨酸/丝氨酸突变、赖氨酸/天冬酰胺突变、组氨酸/苯丙氨酸突变)。

在一些情况下，CRISPR/CasX可以靶向核酸。CRISPR/CasX可以靶向DNA。在一些情况下，CRISPR/CasX被修饰以表达切口酶活性。在一些情况下，将CRISPR/CasX修饰为靶向核酸，但是不具有酶活性(例如，不具有核酸内切酶或切口酶活性)。在一些情况下，对CRISPR/CasX进行修饰以表达以下一种或多种具有或不具有核酸内切酶活性的活性：切口酶、核酸外切酶、DNA修复(例如DNA DSB修复)、解旋酶、转录(共)激活、转录(共)抑制、甲基化酶和/或脱甲基酶。

在一些情况下，CRISPR/CasX在适合植物和植物细胞生长和培养的温度下具有活性，诸如但不限于约20℃至约35℃，优选约23℃至约32℃，最优选约25℃至约28℃。通过将DSB靶向整合的报道基因和内源基因座，可以在植物叶片组织中进行概念验证实验。然后，该技术可适用于原生质体和整个植物以及基于病毒的递送系统。最后，可以通过将DSB靶向同一基因组内的多个位点来证明多重基因组工程。

CRISPR/CasX可包含一个或多个非天然序列(例如，如本文所讨论的融合物)。在一些情况下，CRISPR/CasX的非天然序列包含可改变转录的部分。转录可增加或减少。转录可改变至少约1倍、2倍、3倍、4倍、5倍、10倍、15倍或20倍或更多。转录最多可改变约1倍、2倍、3倍、4倍、5倍、10倍、15倍或20倍或更多。该部分可以是转录因子。当CRISPR/CasX是包含可改变转录的非天然序列的融合CRISPR/CasX时，该融合CRISPR/CasX与野生型CRISPR/CasX相比，CRISPR/CasX可包含降低的酶活性。

作为非限制性示例，CRISPR/CasX可结合靶向核酸的核酸(例如，单链DNA、单链RNA)，该靶向核酸的核酸将其向导至与靶向核酸的核酸互补的靶核酸，其中该靶核酸包含dsDNA(例如，质粒、基因组DNA等)，从而在靶核酸中进行位点特异性裂解。

在本发明的一些实施方案中，这些方法和组合物包含来自δ变形菌(Deltaproteobacteria)细菌的CRISPR/CasX，并且所述方法和组合物在适合于植物和植物细胞的生长和培养的温度下使用，诸如但不限于约20℃至约35℃，优选约23℃至约32℃，最优选约25℃至约28℃。

在本发明的一些实施方案中，这些方法和组合物包含来自浮霉菌(Planctomycetes)细菌的CRISPR/CasX，并且所述方法和组合物在适合于植物和植物细胞生长和培养的温度下使用，诸如但不限于约20℃至约35℃，优选约23℃至约32℃，最优选约25℃至约28℃。

在本发明的一些实施方案中，CRISPR/CasX与靶向核酸的核酸分开提供。在其他实施方案中，以复合物的形式提供CRISPR/CasX，其中靶向核酸的核酸与CRISPR/CasX预先关联。

在本发明的一些实施方案中，将CRISPR/CasX作为表达盒的一部分提供在合适的载体上，该载体被配置用于在所需的宿主细胞(例如植物细胞或植物原生质体)中表达CRISPR/CasX。该载体可允许CRISPR/CasX的瞬时表达。可选地，该载体可允许表达盒和/或CRISPR/CasX稳定地保持在宿主细胞中，诸如但不限于，通过整合到宿主细胞基因组中，包括稳定整合到基因组中。在一些实施方案中，宿主细胞是祖细胞，从而提供了CRISPR/CasX的可遗传表达。包含在表达盒中的CRISPR/CasX可以是如下所述的异源多肽。

在其他实施方案中，CRISPR/CasX作为异源多肽单独提供，或作为转录或翻译融合物(与CRISPR/CasX的N末端和C末端结构域中的任一者或两者)提供，如本文所讨论的，具有一个或多个功能结构域，诸如但不限于定位信号(例如核定位信号、叶绿体定位信号)、表位标签、抗体和/或功能蛋白，诸如但不限于报道蛋白(例如，荧光报道蛋白，诸如mNeonGreen和GFP)、参与DNA断裂修复的蛋白(例如DNA DSB)、切口酶、解旋酶、核酸外切酶、转录(共)激活物、转录(共)阻遏物、甲基化酶和/或脱甲基酶。

示例性的定位信号可包括但不限于SV40核定位信号(Hicks等人，1993)。其他非经典类型的核定位信号也可适于与本文提供的方法一起使用，诸如hnRNP A1的酸性M9结构域或PY-NLS基序信号(Dormann等人，2012)。还可以掺入定位信号以允许核酸酶运输到其他亚细胞区室，诸如线粒体或叶绿体。将CasX组分靶向叶绿体可通过在表达构建体中掺入编码叶绿体转运肽(CTP)或质体转运肽的序列来实现，该序列可操作地连接到编码CasX蛋白的序列的5’区。

在其他实施方案中，CRISPR/CasX作为蛋白质提供。还在其他实施方案中，CRISPR/CasX作为核酸提供，诸如但不限于mRNA。

在任何上述实施方案中，可针对在植物中的表达优化CRISPR/CasX，包括但不限于植物优选的启动子、植物组织特异性启动子和/或植物优选的密码子优化，如本文更详细讨论的。

在任何上述实施方案中，CRISPR/CasX可作为与某些植物基因和/或性状相关的目的多核苷酸或多肽的融合物(例如，转录和/或翻译融合物)存在。此类植物基因和/或性状包括例如但不限于：乙酰乳酸合酶(ALS)基因、烯醇丙酮基莽草酸酯(enolpyruvylshikimate)磷酸合酶基因(EPSPS)基因、雄性育性基因(例如MS45、MS26或MSCA1)、除草剂抗性基因、雄性不育基因、雌性育性基因、雌性不育基因、雄性或雌性恢复基因、以及与不育、生育力、除草剂抗性、除草剂耐受性、非生物胁迫(诸如真菌抗性、病毒抗性)的性状相关的基因、或昆虫抗性、非生物胁迫(诸如干旱耐受性、耐冷性或耐寒性)、氮利用效率、磷利用效率、水分利用效率和作物或生物质产量(例如，作物或生物质产量的提高或降低)及此类基因突变体。此类突变体包括例如但不限于：氨基酸取代、缺失、插入、密码子优化和调节序列变化以改变基因表达谱。

本发明的靶向核酸的核酸(靶向核酸的向导核酸)

本文公开了靶向核酸的核酸(靶向核酸的向导核酸)，该核酸可指导相关多肽(例如CRISPR/CasX蛋白，包括SEQ ID NO:1-2之一)的活性向导靶核酸内的指定靶序列。靶向核酸的核酸可包含核苷酸。靶向核酸的核酸可以是单链RNA(ssRNA)。

靶向核酸的核酸可包含一种或多种修饰(例如，碱基修饰、主链修饰)，以提供具有新的或增强的特征(例如，改善的稳定性)的核酸。除了改善稳定性之外或独立于改善稳定性，一种或多种修饰可以以用户偏爱的方式改变靶向核酸的核酸的结合特异性(例如，对特定错配具有更大或更小的特异性或耐受性或缺乏耐受性)。无论是提高稳定性还是改变结合特异性或两者，一种或多种修饰都保留了靶向核酸的核酸与CRISPR/CasX和靶核酸两者相互作用的能力。靶向核酸的核酸可包含核酸亲和标签。核苷可以是碱基糖的组合。核苷的碱基部分可以是杂环碱基。此类杂环碱基的两种最常见的类别是嘌呤和嘧啶。核苷酸可以是核苷，核苷酸还包括与核苷的糖部分共价联接的磷酸基团。对于那些包括戊呋喃糖基糖的核苷，磷酸基团可以联接到糖的2’、3’或5’羟基部分。在形成靶向核酸的核酸时，磷酸基团可将相邻的核苷彼此共价联接以形成线性聚合化合物。进而，该线性聚合化合物的各自末端可以进一步连接以形成环状化合物；然而，线性化合物通常是合适的。另外，线性化合物可具有内部核苷酸碱基互补性，并且因此可以根据产生完全或部分双链化合物的方式折叠。在靶向核酸的核酸内，磷酸基团通常可被称为形成靶向核酸的核酸的核苷间主链。靶向核酸的核酸的键或主链可以是3’至5’磷酸二酯键。

靶向核酸的核酸可以是ssRNA。在一个优选的实施方案中，靶向核酸的核酸是短ssRNA。在一些实施方案中，ssRNA的长度为50个核苷酸或更少，长度优选为40个核苷酸或更少，长度最优选为30个核苷酸或更少。在一个特定优选的实施方案中，靶向核酸的核酸是长度为20、21、22、23、24、25、26、27、28、29或30个核苷酸的5’-磷酸化的ssRNA。

修饰的主链可包括在主链中保留磷原子的那些主链和在主链中不具有磷原子的那些主链。其中含有磷原子的合适修饰的靶向核酸的核酸主链可包括：例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯，诸如3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、次膦酸酯、包括3’-氨基氨基膦酸酯和氨基烷基膦酰胺酸酯的氨基磷酸酯、二氨基磷酸酯、硫代膦酸氨基酸酯、硫代烷基膦酸酯、硫代烷基磷酸三酯、硒代磷酸酯和硼酸酯磷酸酯、和具有正常的3’-5’连接、2’-5’连接类似物的硼烷磷酸酯、以及具有相反极性的硼烷磷酸酯，其中一个或多个核苷酸间键是3’至3’、5’至5’或2’至2’键。具有相反极性的合适靶向核酸的核酸可在3'最核苷酸间键处包含单个3’至3’键(即，其中核碱基缺失或具有羟基取代的单个反核苷残基)。也可以包括各种盐(例如氯化钾或氯化钠)、混合盐和游离酸形式。靶向核酸的核酸可包含一个或多个硫代磷酸酯和/或杂原子核苷间键。靶向核酸的核酸可包含吗啉代主链结构。例如，核酸可包含6-元吗啉代环取代核糖环。在这些实施方案的一些中，二氨基磷酸酯或其他非磷酸二酯核苷间键可取代磷酸二酯键。靶向核酸的核酸可包含多核苷酸主链，该主链由短链烷基或环烷基核苷间键、混合的杂原子和烷基或环烷基核苷间键或一个或多个短链杂原子或杂环核苷间键形成。这些主链可包括具有吗啉代键(部分由核苷的糖部分形成)的主链；硅氧烷主链；硫化物，亚砜和砜主链；形成乙酰基和硫代甲酰胺基主链；亚甲基甲酰基和硫代甲酰基主链；核糖乙酰基主链；含有烯烃的主链；氨基磺酸盐主链；亚甲基亚氨基和亚甲基肼基主链；磺酸盐和磺酰胺主链；酰胺主链；其他具有混合的N、O、S和CH2组成部分。

靶向核酸的核酸可包含核酸模拟物。术语“模拟物”可旨在包括多核苷酸中仅呋喃糖环或呋喃糖环和核苷酸间键都被非呋喃糖基团取代的多核苷酸，仅呋喃糖环的取代也可以称为糖替代物。可以保留杂环碱基部分或修饰的杂环碱基部分，以与适当的靶核酸杂交。一种此类核酸可以是肽核酸(PNA)。在PNA中，多核苷酸的糖-主链可以被含有酰胺的主链，特别是氨基乙基甘氨酸主链取代。核苷酸可保留并且直接或间接结合至主链酰胺部分的氮杂氮原子。PNA化合物中的主链可包含两个或多个连接的氨基乙基甘氨酸单元，该单元使PNA具有含酰胺的主链。杂环碱基部分可直接或间接结合到主链酰胺部分的氮杂氮原子上。

靶向核酸的核酸可包含连接的吗啉代单元(即吗啉代核酸)，该单元具有附接到吗啉代环上的杂环碱基。联接基团可联接吗啉代核酸中的吗啉代单体单元。基于非离子吗啉代的寡聚化合物与细胞蛋白的相互作用可能较少。基于吗啉代的多核苷酸可以是靶向核酸的核酸的非离子模拟物。可以使用不同的联接基团连接吗啉代类中的各种化合物。另一类多核苷酸模拟物可称为环己烯基核酸(CeNA)。通常存在于核酸分子中的呋喃糖环可以被环己烯基环取代。可以制备CeNA DMT(二甲氧基三苯甲基)保护的亚磷酰胺单体，并使用亚磷酰胺化学方法用于低聚化合物的合成。将CeNA单体掺入核酸链可提高DNA/RNA杂合体的稳定性。CeNA寡腺苷酸可以与核酸补体形成复合物，该复合物稳定性与天然复合物相似。进一步的修饰可包括LNA，其中2’-羟基与糖环的4’碳原子键，从而形成2’-C、4’-C-甲醛键，从而形成双环糖部分。该键可以是亚甲基(-CH ₂-)，该亚甲基是桥接2’氧原子和4’碳原子的基团，其中n为1或2。LNA和LNA类似物可与互补核酸显示非常高的双链热稳定性(Tm＝+3℃至+10℃)，具有对3’-核酸外切酶降解的稳定性和良好的溶解性。

靶向核酸的核酸可包含一个或多个取代的糖部分。合适的多核苷酸可包含选自以下的糖取代基：OH；F；O-、S-或N-烷基；O-、S-或N-烯基；O-、S-或N-炔基；或O-烷基-O-烷基，其中所述烷基、烯基和炔基可以是取代或未取代的C₁-C₁₀烷基或C₂-C₁₀烯基和炔基。特别合适的是O((CH₂)_nO)_mCH₃、O(CH2)_nOCH₃、O(CH₂)_nNH₂、O(CH₂)_nCH₃、O(CH₂)_nONH₂、和O(CH₂)_nON((CH₂)_nCH₃)₂，其中n和m为1至约10。糖取代基可选自：C1至C10低级烷基、取代的低级烷基、烯基、炔基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH₃、OCN、Cl、Br、CN、CF₃、OCF₃、SOCH₃、SO₂CH₃、ONO₂、NO₂、N₃、NH₂、杂环烷基、杂环烷基芳基、氨基烷基氨基、聚烷基氨基、取代的甲硅烷基、RNA裂解基团、报道基团、嵌入剂、用于改善靶向核酸的核酸的药代动力学性质的基团、或用于改善药效学的基团靶向核酸的核酸的性质以及具有相似性质的其他取代基。合适的修饰可以包括2’-甲氧基乙氧基(2’-O-CH₂CH₂OCH₃，也称为2’-O-(2-甲氧基乙基)或2’-MOE，即烷氧基烷氧基)。进一步合适的修饰可以包括2’-二甲基氨基乙氧基乙氧基(即，O(CH₂)₂ON(CH₃)₂基团，也称为2'-DMAOE)和2’-二甲基氨基乙氧基乙氧基(也称为2’-O-二甲基-氨基-乙氧基-乙基或2’-DMAEOE)，即2’-O-CH₂-O-CH₂-N(CH₃)₂。其他合适的糖取代基可包括甲氧基(-O-CH₃)、氨基丙氧基(-O CH₂CH₂CH₂NH₂)、烯丙基(-CH₂-CH＝C-)、-O-烯丙基(-O-CH₂-CH＝CH₂)和氟(F)。2’-糖取代基可以在阿拉伯糖(上)位置或核糖(下)位置。合适的2’-阿拉伯糖基修饰是2’-F。还可以在寡聚化合物的其他位置，特别是在3’末端核苷上或在2’至5’联接的核苷酸中糖的3’位置和5’末端核苷酸的5’位置进行类似的修饰。寡聚化合物还可具有糖模拟物(诸如环丁基部分)取代戊呋喃糖基糖。

靶向核酸的核酸还可包括核碱基(通常简称为“碱基”)修饰或取代。如本文所用，“未修饰的”或“天然的”核碱基可包括嘌呤碱基(例如腺嘌呤(A)和鸟嘌呤(G))以及嘧啶碱基(例如胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U))。修饰的核碱基可包括其他合成和天然核碱基，诸如5-甲基胞嘧啶(5-me-C)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、6-甲基和腺嘌呤和鸟嘌呤的其他烷基衍生物、2-丙基以及腺嘌呤和鸟嘌呤的其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶和2-硫胞嘧啶、5-卤尿嘧啶和胞嘧啶、5-丙炔基(--C＝C--CH₃)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物、6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶、5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶、8-卤代、8-氨基、8-硫醇、8-硫烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤、5-卤代(特别是5-溴代)、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-F-腺嘌呤、2-氨基腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-去氮杂鸟嘌呤和7-去氮杂腺嘌呤以及3-去氮杂鸟嘌呤和3-去氮杂腺嘌呤。修饰的核碱基可包括三环嘧啶，诸如吩恶嗪胞苷(1H-嘧啶(5,4-b)(1,4)苯并嗪-2(3H)-one)、吩噻嗪胞苷(1H-嘧啶(5,4-b)(1,4)苯并硫氮-2(3H)-one)、G-clamps(诸如取代的吩恶嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶(5,4-(b)(1,4)苯并恶嗪-2(3H)-one))、咔唑胞苷(2H-嘧啶(4,5-b)吲哚-2-one)、吡啶并吲哚胞苷(氢吡啶(3'，2'：4,5)吡咯并(2,3-d)嘧啶-2-one)。

杂环碱基部分可包括其中嘌呤或嘧啶碱基被其他杂环取代的那些部分，例如7-脱氮-腺嘌呤、7-脱氮鸟嘌呤、2-氨基吡啶和2-吡啶酮。核糖核酸酶可用于增加多核苷酸化合物的结合亲和力。这些核糖核酸酶可包括5-取代的嘧啶、6-氮杂嘧啶和N-2、N-6和O-6取代的嘌呤，包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶取代可以使核酸双链体稳定性提高0.6oC至1.2oC，并且可以是合适的碱基取代(例如，在与2’-O-甲氧基乙基糖修饰结合时)。

靶向核酸的核酸的修饰可包括将可增强靶向核酸的活性、细胞分布或细胞摄取的一个或多个部分或共轭物化学联接至靶向核酸的核酸。这些部分或共轭物可包括与官能团诸如伯羟基或仲羟基共价结合的共轭基团。共轭基团可包括但不限于嵌入剂、报道分子、多胺、聚酰胺、聚乙二醇、聚醚、增强低聚物的药代动力学性质的基团和可以增强低聚物的药代动力学性质的基团。共轭基团可包括但不限于胆固醇、脂质、磷脂、生物素、吩嗪、叶酸、菲啶、蒽醌、吖啶、荧光素、若丹明、香豆素和染料。增强药效学性质的基团包括改善摄取，增强对降解的抗性和/或加强与靶核酸的序列特异性杂交的基团。可以增强药代动力学性质的基团包括改善核酸吸收、分布、代谢或排泄的基团。共轭部分可包括但不限于脂质部分，诸如胆固醇部分、胆酸硫醚(例如，己基-S-三苯甲基硫醇)、硫代胆固醇、脂族链(例如十二烷二醇或十一烷基残基)、磷脂例如二十六烷基-rac-甘油或三乙基铵1,2-二-O-十六烷基-rac-甘油-3-H-膦酸盐)、多胺或聚乙二醇链或金刚烷乙酸、棕榈基部分或十八胺或己氨基-羰基-氧胆固醇部分。修饰还可以包括“蛋白质转导域”或PTD(即，细胞穿透肽(CPP))。PTD可以指有助于穿越脂质双层、胶束、细胞膜、细胞器膜或囊泡膜的多肽、多核苷酸、碳水化合物或有机或无机化合物。PTD可以附接到另一个分子上，该分子的范围可从小极性分子到大分子和/或纳米颗粒，并且可以促进分子穿过膜，例如从细胞外空间到细胞内空间，或者从细胞质到细胞器内。如WO2008/043156、US 20130185823和WO2015089419中所述，可以使用各种类型的纳米颗粒。PTD可与多肽的氨基末端共价联接。PTD可与多肽的羧基末端共价联接。PTD可与核酸共价联接。示例性的PTD可包括但不限于最小肽蛋白转导结构域；聚精氨酸序列，其包含足以指导进入细胞的多个精氨酸(例如，3、4、5、6、7、8、9、10或10-50个精氨酸)、VP22结构域、聚赖氨酸和转运蛋白、3个精氨酸残基至50个精氨酸残基的精氨酸均聚物。PTD可以是可激活的CPP(ACPP)。ACPP可包含通过可裂解的联接基连接至匹配的聚阴离子(例如G1u9或“E9”)的聚阳离子CPP(例如Arg9或“R9”)，这可以将净电荷降低至几乎为零，从而抑制粘附和摄取细胞。裂解联接基后，聚阴离子可以释放出来，从而局部暴露聚精氨酸及其固有的粘附性，从而“激活”ACPP穿过膜。

靶向核酸的核酸的其他修饰可包括5’帽、3’聚腺苷酸尾、核糖开关序列、稳定性控制序列、形成dsRNA双链体的序列、将靶向核酸的核酸靶向亚细胞位置的修饰或序列、提供追踪的修饰或序列、提供蛋白质结合位点的修饰或序列、5-甲基dC核苷酸、2,6-二氨基嘌呤核苷酸、2’-氟核苷酸、2’-氟U核苷酸；2’-O-甲基RNA核苷酸、硫代磷酸酯键、到胆固醇分子的键、到聚乙二醇分子的键、到间隔区分子的键、5’至3’共价键或它们的任意组合。

靶向核酸的核酸的长度可以是至少约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个或更多个核苷酸。靶向核酸的核酸的长度可以是至多约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个或更多个核苷酸。在一些情况下，靶向核酸的核酸的长度为20、21、22、23、24、25、26、27、28、29或30个核苷酸。在一些情况下，靶向核酸的核酸在5’末端或3’末端或两末端处被磷酸化。

靶向核酸的核酸可包含5’脱氧胞嘧啶。靶向核酸的核酸可以在靶向核酸的核酸的5’末端处包含脱氧胞嘧啶-脱氧腺苷。在一些实施方案中，任何核苷酸可存在于5’末端处，和/或可包含修饰的主链或本文讨论的其他修饰。靶向核酸的核酸可包含5’磷酸化的末端。

靶向核酸的核酸可与该靶核酸完全互补(例如，可杂交)。靶向核酸的核酸可与该靶核酸部分互补。例如，靶向核酸的核酸可以在该靶向核酸的核酸的区域上与该靶核酸具有至少30、40、50、60、70、80、90、95或100％互补。靶向核酸的核酸在该靶向核酸的核酸的区域上可以与该靶核酸至多30、40、50、60、70、80、90、95或100％互补。

靶向核酸的核酸的一段核苷酸可与靶核酸互补(例如，可杂交)。至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个连续核苷酸的片段可与靶核酸互补。至多2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个连续核苷酸的片段可以与靶核酸互补。

与靶核酸完全互补的靶向核酸的核酸的一部分可以从至少核苷酸2延伸至核苷酸17(从靶向核酸的核酸的5’末端算起)。与靶核酸完全互补的靶向核酸的核酸的一部分可以从至少核苷酸3延伸至核苷酸20，核苷酸4延伸至核苷酸18，核苷酸5延伸至核苷酸16，核苷酸6延伸至核苷酸14，核苷酸7延伸至核苷酸12，核苷酸6延伸至核苷酸16，核苷酸6延伸至核苷酸18或核苷酸6延伸至核苷酸20。

靶向核酸的核酸可与靶核酸杂交。靶向核酸的核酸可与该靶向核酸的核酸和靶核酸之间的错配杂交(例如，靶向核酸的核酸中的核苷酸可不与靶核酸杂交)。当与靶核酸杂交时，靶向核酸的核酸可包含至少1、2、3、4、5、6、7、8、9或10个或更多个错配。当与靶核酸杂交时，靶向核酸的核酸可包含至多1、2、3、4、5、6、7、8、9或10个或更多个错配。

靶向核酸的核酸可以在相对于设计的靶向核酸的核酸的5’末端的第1和第2、第2和第3、第3和第4、第4和第5、第5和第6、第6和第7、第7和第8、第8和第9、第9和第10、第10和第11、第11和第12、第12和第13、第13和第14、第14和第15、第15和第16、第16和第17、第17和第18、第18和第19、第19和第20、第20和第21、第21和第22、第22和23、第23和第24或第24和第25个核苷酸之间的键处指导靶核酸的裂解。设计的靶向核酸的核酸可以指导靶核酸在相对于设计的靶向核酸的核酸的5’末端的第10和第11个核苷酸(t10和t11)之间的键处的裂解。靶核酸裂解位点最佳裂解的精确设计可以通过质粒靶掺入裂解位点的初步测试来确定。

如本文所讨论的，靶向核酸的核酸可以是ssRNA。在一个优选的实施方案中，靶向核酸的核酸是短ssRNA。在一些实施方案中，ssRNA的长度为50个核苷酸或更少，长度优选为40个核苷酸或更少，长度最优选为30个核苷酸或更少。在一个特定优选的实施方案中，靶向核酸的核酸的长度为20、21、22、23、24、25、26、27、28、29或30个核苷酸。

本发明的靶核酸

靶核酸可以包含与一种或多种设计的靶向核酸的核酸至少部分互补的一种或多种序列。靶核酸可以是基因、基因的5’末端、基因的3’末端、调节元件(例如启动子、增强子)、假基因、非编码DNA、微卫星、内含子、外显子、染色体DNA、线粒体DNA、有义DNA、反义DNA、核苷酸DNA、叶绿体DNA或RNA等其他核酸实体的一部分或全部。靶核酸可以是质粒DNA的一部分或全部。质粒DNA或其部分可以是负超螺旋的。靶核酸可以是体外或体内的。

靶核酸可包含低GC含量区域内的序列。靶核酸可以是负超螺旋的。因此，作为非限制性示例，靶核酸可包含至少约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％或65％或更高的GC含量。靶核酸可包含至多约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％或65％或更高的GC含量。

包含特定GC含量的区域可以是与设计的靶向核酸的核酸杂交的靶核酸的长度。包含GC含量的区域可以比与设计的靶向核酸的核酸杂交的区域的长度更长或更短。包含GC含量的区域可比与设计的靶向核酸的核酸杂交的区域的长度长或短为至少30、40、50、60、70、80、90或100个或更多个核苷酸。包含GC含量的区域可比与设计的靶向核酸的核酸杂交的区域的长度长或短为至多30、40、50、60、70、80、90或100个或更多个核苷酸。

在一些实施方案中，在植物基因组内发现靶核酸。植物可以是单子叶植物或双子叶植物。单子叶植物的非限制性示例包括玉米、水稻、高粱、黑麦、大麦、小麦、小米、燕麦、甘蔗、草皮草或柳枝稷。双子叶植物的非限制性示例包括大豆、低芥酸菜子、苜蓿、向日葵、棉花、烟草、花生、马铃薯、冬季油菜籽、春季油菜籽、甜菜、饲料甜菜、红甜菜、向日葵、烟草、拟南芥或红花。在一些实施方案中，靶核酸包含乙酰乳酸合酶(ALS)基因(包括其突变体)、烯醇丙酮基莽草酸酯磷酸合酶基因(EPSPS)基因(包括EPSPS基因的突变体，诸如但不限于T102I/P106A、T102I/P106S、T102I/P106C、G101A/A192T和G101A/A144D)、雄性育性(MS45、MS26或MSCA1)基因(包括其突变体)、雄性不育基因、不育恢复基因、除草剂抗性基因、除草剂耐受基因、真菌抗性基因、病毒抗性基因、昆虫抗性基因、与植物产量增加或减少(例如，生物质或种子)相关的基因、与干旱、寒冷或寒冷抗性/耐受性相关的基因、氮、磷或水的利用效率、或WO2015/026883中描述的另一个靶位点。靶核酸可包括与以下性状中的一个或多个相关的基因：除草剂抗性、除草剂耐受性、生物胁迫抗性、真菌抗性、病毒抗性、昆虫抗性、植物产量增加或减少(例如生物质或种子)、非生物抗逆性、氮利用效率、磷利用效率、水分利用效率和抗旱性。靶核酸可包括突变，诸如但不限于，氨基酸取代、缺失、插入、密码子优化和调节序列变化以改变基因表达谱。靶核酸可进一步包括如下文所述与本发明一起使用的任何核酸。

与本发明一起使用的核酸/多肽

可以提供任何目的核酸，在靶核酸处将其整合到宿主细胞基因组(例如植物细胞或原生质体)中，或瞬时保持在宿主细胞内，并通过使用本发明的方法和组合物在宿主细胞中表达。此类核酸可以是非天然的。目的核酸可以包括突变，诸如但不限于，氨基酸取代、缺失、插入、调节序列变化以改变基因表达谱，如本文讨论的转录和/或翻译融合和/或密码子优化。一种或多种目的核酸可用于本文所述的方法和组合物中。一种或多种核酸可作为与CRISPR/CasX的融合物(例如，转录和/或翻译融合物)存在。

目的核酸/多肽包括但不限于，抗除草剂编码序列、耐除草剂编码序列、杀虫/抗昆虫编码序列、杀线虫编码序列，抗微生物编码序列、抗真菌/真菌抗性编码序列、抗病毒/病毒抗性编码序列(包括RNA和DNA病毒)、非生物和生物胁迫耐受性编码序列、或修饰植物性状(诸如产量，谷物品质，营养成分、淀粉品质和数量、固氮和/或利用率、脂肪酸、以及油含量和/或组合物的序列)。

其他目的多核苷酸包括不育和/或育性基因，诸如但不限于，雄性不育和雄性育性基因。目的更具体的多核苷酸包括但不限于：提高作物产量的基因、降低作物产量的基因、提高作物需求的多核苷酸、编码赋予对非生物胁迫(诸如干旱、氮、温度、盐度、有毒金属或微量元素)抗性的蛋白质的基因、或赋予对毒素(诸如杀虫剂和除草剂抗性的基因、或赋予对生物胁迫(诸如真菌、病毒、细菌、昆虫和线虫攻击)抗性的基因，以及与这些生物体相关的病害的发展，以及赋予除草剂耐受性的基因。目的基因的一般类别包括，例如涉及信息的那些基因(诸如锌指)，涉及通信的那些基因(诸如激酶)，以及涉及管家的那些基因(诸如热激蛋白)。

与非生物胁迫耐受性有关的基因的示例包括：如WO 00/04173或WO/2006/045633中所述的能够降低植物细胞或植物中聚(ADP-核糖)聚合酶(PARP)基因的表达和/或活性的转基因；能够减少植物或植物细胞的PARG编码基因的表达和/或活性的转基因，如WO 2004/090140中所述；以及编码烟碱酰胺腺嘌呤二核苷酸挽救合成途径的植物功能性酶的转基因，包括烟碱酰胺酶，烟酸磷酸核糖基转移酶，烟酸单核苷酸腺苷酸转移酶，烟酰胺腺嘌呤二核苷酸合成酶或烟碱酰胺磷酸核糖基转移酶，涉及碳水化合物生物合成的酶，涉及多果糖生产的酶，尤其是菊粉和果聚糖型的酶。

例如，在WO 2013122472中描述了改善抗旱性的基因的示例。功能泛素蛋白连接酶蛋白(UPL)蛋白，更具体的讲是UPL3的缺乏或含量降低，可以减少对水的需求或以其他方式提高所述植物的抗旱性。例如，美国2009/0144850、美国2007/0266453和WO 2002/083911中公开了具有增加耐旱性的转基因植物的其他示例。US2009/0144850描述了由于DR02核酸的表达改变而显示出耐旱表型的植物。US2007/0266453描述了由于DR03核酸的表达改变而显示出耐旱表型的植物，并且WO2002/083911描述了由于在保卫细胞中表达的ABC转运蛋白的活性降低而对干旱胁迫具有增强的耐受性的植物。在正常的生长条件下，DREB1A在转基因植物中的过度表达可激活许多胁迫耐受基因的表达，从而提高了对干旱、盐分负荷和冻结的耐受性。

例如，更具体的转基因类别包括编码重要性状的基因，这些特状包括农艺学、昆虫抗性、抗病性、除草剂抗性、生育力或不育性、谷物特性和商业产品。目的基因通常包括涉及油、淀粉、碳水化合物或营养物质代谢的那些基因；以及影响籽粒大小、蔗糖负载等的那些基因，这些基因可以堆叠或与其他性状结合使用，诸如但不限于本文所述的除草剂抗性。由任何前述多核苷酸编码的多肽也可用于本文的方法和组合物中，诸如但不限于掺入宿主细胞(例如植物细胞或原生质体)中、与CRISPR/CasX的融合物中和/或掺入具有CRISPR/CasX的表达盒中。一种或多种多肽可存在于所述方法或组合物中。

除了使用传统的育种方法外，还可从遗传学上改变农艺学上重要的性状，诸如油、蔗糖、淀粉和蛋白质含量。这些修饰包括增加油酸、饱和和不饱和油的含量、增加赖氨酸和硫的含量、提供必需氨基酸以及淀粉的修饰。在美国专利号5,703,049、5,885,801、5,885,802、和5,990,389中描述了角硫(Hordothionin)蛋白的修饰，通过引用并入本文。另一个例子是美国专利号5,850,016中所述的大豆2S白蛋白编码的赖氨酸和/或富含硫的种子蛋白，以及大麦中的胰凝乳蛋白酶抑制剂，如Williamson等人所述，欧洲杂志生物化学(1987)165：99-106，其公开内容通过引用并入本文。

商业性状也可以编码在目的多核苷酸上，该多核苷酸可增加例如，用于乙醇生产的淀粉或蔗糖，或提供蛋白质的表达。转化植物的另一个重要的商业应用是生产聚合物和生物塑料，诸如美国专利号5,602,321中所述的。诸如β-酮硫醇酶、PHBase(聚羟基丁酸合酶)和乙酰乙酰辅酶A还原酶等基因(参见Schubert等人，J.细菌素(1988)170：5837-5847)促进了聚羟基链烷酸酯(PHA)的表达。

本文所述的CasX系统和方法可用于在内源DNA序列中引入靶向的双链断裂(DSB)。DSB激活细胞DNA修复途径，可利用该途径在断裂位点附近实现所需的DNA序列修饰。当内源基因的失活可以赋予或有助于所需性状时，这是令人感兴趣的。在特定的实施方案中，在DSB的位点促进与模板序列的同源重组，以便引入目的基因。

在特定的实施方案中，获得非转基因的遗传上修饰的植物、植物部分或细胞，因为没有外源DNA序列被掺入到植物的任何植物细胞的基因组中。仅确保内源基因的修饰以及植物基因组中没有引入或保留外源基因；所得的转基因作物不包含外源基因，因此基本上可以认为是非转基因的。

编码序列的衍生物可以通过定点诱变来制备，以增加编码的多肽中预选氨基酸的水平。例如，编码大麦高赖氨酸多肽(BHL)的基因源自大麦胰凝乳蛋白酶抑制剂，1996年11月1日提交的美国专利申请序列号08/740,682和WO 98/20133，其公开内容通过引用并入本文。其他蛋白质包括富含蛋氨酸的植物蛋白质，诸如来自葵花籽的蛋白质(Lilley等人，(1989)人类食品和动物饲料中植物蛋白利用的世界大会记录，编辑Applewhite(美国石油化学家协会，伊利诺伊州香槟)，自费出版497-502；通过引用并入本文)；玉米(Pedersen等人，J.生物化学(1986)261：6279；Kirihara等人，基因(1988)71：359；两者均通过引用并入本文)；和稻(Musumura等人，植物分子生物学(1989)12：123，通过引用并入本文)。其他在农业上重要的基因编码乳胶、Floury2、生长因子、种子贮藏因子和转录因子。

提高作物产量的多核苷酸包括矮化基因，诸如Rht1和Rht2(Peng等人，自然(1999)400：256-261)，以及增加植物生长的那些基因，诸如铵诱导的谷氨酸脱氢酶。改善作物需求的多核苷酸包括，例如，使植物具有降低的饱和脂肪含量的多核苷酸，提高植物的营养价值的多核苷酸以及增加谷物蛋白的多核苷酸。改善耐盐性的多核苷酸是那些在比引入了耐盐基因的植物的天然环境更高的盐度环境中增加或允许植物生长的多核苷酸。

影响氨基酸生物合成的多核苷酸/多肽包括，例如邻氨基苯甲酸合酶(AS；EC4.1.3.27)其催化从芳香族氨基酸途径到植物、真菌和细菌中色氨酸生物合成的第一反应分支。在植物中，色氨酸生物合成的化学过程在叶绿体中区分开。参见例如，USPub.2008/0050506，通过引用并入本文。其他目的序列包括分支酸盐(Chorismate)丙酮酸裂解酶(CPL)，其是指编码催化分支酸盐转化为丙酮酸和pHBA的酶的基因。最具表征的CPL基因已从大肠杆菌中分离出来，其GenBank登录号为M96268。参见美国专利号7,361,811，其通过引用并入本文。

目的多核苷酸序列可编码涉及提供病害抗性或害虫抗性的蛋白质。“病害抗性”或“害虫抗性”意指植物避免作为植物-病原体相互作用产生的有害症状。害虫抗性基因可编码对具有高产量阻力的害虫的抗性，诸如根虫、地老虎、欧洲玉米螟等。病害抗性和害虫抗性基因(诸如溶菌酶或天蚕素)用于抗菌保护；或蛋白质(诸如防御素、葡聚糖酶或几丁质酶)用于抗真菌保护；或用于控制线虫或昆虫的苏云金芽孢杆菌内毒素、蛋白酶抑制剂、胶原酶、凝集素或糖苷酶都是有用的基因产物的示例。编码病害抗性性状的基因包括解毒基因，诸如针对伏马菌素的解毒基因(美国专利号5,792,931)；无毒(avr)和病害抗性(R)基因(Jones等人，科学(1994)266：789；Martin等人，科学(1993)262：1432；和Mindrinos等人，细胞(1994)78：1089)；等等。昆虫抗性基因可编码对具有高产量阻力的害虫的抗性，诸如根虫、地老虎、欧洲玉米螟等。此类基因包括例如苏云金芽孢杆菌有毒蛋白质基因(美国专利号5,366,892、5,747,450、5,736,514、5,723,756、5,593,881；以及Geiser等人，基因(1986)48：109)；等等。

可以用克隆的抗性基因转化植物以工程化对特定病原体菌株具有抗性的植物。参见例如，Jones等人，科学266：789(1994)(番茄抗黄枝菌Cf-9基因的克隆)；Martin等人,科学262：1432(1993)(番茄Pto基因对丁香假单胞菌的抗性，番茄编码蛋白激酶)；Mindrinos等人，细胞78：1089(1994)。可以用赋予对害虫(诸如大豆孢囊线虫)的抗性的克隆抗性基因转化植物。参见例如，PCT专利申请WO 96/30517和PCT专利申请WO 93/19181。可用编码苏云金芽孢杆菌蛋白的基因转化植物。参见例如，Geiser等人，基因48：109(1986)。可以用涉及凝集素产生的基因转化植物。参见例如，Van Damme等人，植物分子生物学24：25(1994)。

可以用编码维生素结合蛋白的基因(诸如抗生物素蛋白)转化植物。参见PCT专利申请US93/06487，该申请描述了抗生物素蛋白和抗生物素蛋白同系物作为针对害虫的杀幼虫剂的应用。可以用编码酶抑制剂(诸如蛋白酶或蛋白酶抑制剂或淀粉酶抑制剂)的基因转化植物。参见例如，Abe等人，J.生物化学262：16793(1987)，Huub等人，植物分子生物学21：985(1993)；Sumitani等人，Sumitani等人，生物科学，生物技术，生物化学57：1243(1993)和美国专利5,494,813。可以用编码昆虫特异性激素或信息素(诸如蜕皮类固醇或幼年激素)、该激素变体、基于该激素的模拟物或该激素拮抗剂或激动剂的基因转化植物。参见例如Hammock等人，自然344：458(1990)。

可以用编码昆虫特异性肽或神经肽的基因转化植物，该基因一经表达就会破坏受影响害虫的生理。参见例如，Regan，J.生物化学269：9(1994)和Pratt等人，Biochem.Biophys.Res.Comm.163：1243(1989)。另见美国专利号5,266,317。可以用编码蛋白质和多肽的基因转化植物，这些蛋白质和多肽是蛇、黄蜂或任何其他生物自然产生的昆虫特异性毒液的一部分。例如，参见Pang等人，基因116：165(1992)。可以用编码负责引起单萜、倍半萜、类固醇、异羟肟酸、苯丙烷类衍生物或另一种具有杀虫活性的非蛋白质分子超积累的酶的基因转化植物。可以用编码参与生物活性分子的修饰(包括翻译后修饰)的酶的基因转化植物；例如，糖酵解酶；蛋白水解酶、脂解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几丁质酶和葡聚糖酶，无论是天然的还是合成的。参见PCT专利申请WO93/02197，Kramer等人，昆虫生物化学分子生物23：691(1993)和Kawalleck等人,植物分子生物学21：673(1993)。

可以用编码刺激信号转导的分子的基因转化植物。例如参见Botella等人，植物分子生物学24：757(1994)，和Griess等人，植物生理学104：1467(1994)。可以用编码病毒侵入性蛋白质或由其衍生的复合毒素的基因转化植物。参见Beachy等人,Ann.rev.植物病理学28:451(1990)。可以用编码由病原体或寄生虫自然产生的发育抑制蛋白的基因转化植物。参见Lamb等人，生物/技术10：1436(1992)和Toubart等人，植物杂志2：367(1992)。可以用编码由植物自然产生的发育抑制蛋白的基因转化植物。例如，Logemann等人，生物/技术10：305(1992)。

“除草剂抗性蛋白”或由“编码除草剂抗性的核酸分子”的表达产生的蛋白质包括赋予细胞与不表达该蛋白质的细胞相比，耐受更高浓度的除草剂能力的蛋白质，或与不表达该蛋白质的细胞相比，可耐受一定浓度的除草剂更长的时间段。除草剂抗性性状可通过以下基因引入植物中：编码对乙酰乳酸合酶(ALS)作用抑制的除草剂抗性的基因，特别是磺酰脲型除草剂；编码对谷氨酰胺合酶作用抑制的除草剂抗性的基因，诸如膦丝菌素或basta(例如bar基因)、草甘膦(例如EPSP合酶基因和GAT基因)、HPPD抑制剂(例如HPPD基因)或本领域已知的其它此类基因。参见例如，美国专利号7,626,077、5,310,667、5,866,775、6,225,114、6,248,876、7,169,970；6,867,293和美国临时申请号61/401,456，其各自通过引用并入本文。bar基因编码对除草剂basta的抗性，nptII基因编码对卡那霉素和遗传霉素的抗性，以及ALS基因突变体编码对除草剂氯磺隆的抗性。

不育基因也可在表达盒中编码，并提供物理去雄的替代方法，特别是玉米。以此类方式使用的基因的示例包括雄性育性基因，诸如MS26(参见例如，美国专利7,098,388、7,517,975和7,612,251)、MS45(参见例如美国专利5,478,369和6,265,640)或MSCA1(参见例如美国专利7,919,676)。其他基因包括激酶和那些编码对雄性或雌性配子体发育有毒的化合物的基因。

此外，已经认识到目的多核苷酸还可包含与目的靶向基因序列的信使RNA(mRNA)的至少一部分互补的反义序列。构建反义核苷酸以与相应的mRNA杂交。

只要序列与相应的mRNA杂交并干扰该mRNA表达，就可以进行反义序列的修饰。以这种方式，可以使用与相应的反义序列具有70％、80％或85％的序列同一性的反义构建体。此外，部分反义核苷酸可用于破坏靶基因的表达。通常，可以使用至少50个核苷酸，100个核苷酸，200个核苷酸或更大的序列。

另外，目的多核苷酸也可以以有义方向用于抑制植物中内源基因的表达。使用有义方向的多核苷酸抑制植物中基因表达的方法是本领域已知的。这些方法通常涉及用DNA构建体转化植物，该DNA构建体包含启动子，该启动子驱动在植物中的表达，该启动子可操作地连接至对应于内源基因转录本的核苷酸序列的至少一部分。通常，此类核苷酸序列与内源基因的转录物的序列具有基本的序列同一性，通常大于约65％的序列同一性，约85％的序列同一性或大于约95％的序列同一性。参见美国专利号5,283,184和5,034,323；其全文以引用方式并入本文。

目的多核苷酸也可以是表型标记物。表型标记物是可筛选的或包括视觉标记物和可选标记物的可选标记物，无论该标记物是阳性还是阴性可选标记物。可以使用任何表型标记物。具体地讲，可选择的或可筛选的标记物包含DNA片段，该DNA片段通常在特定条件下允许人们识别、或选择或针对包含它的分子或细胞。这些标记物可编码活性，诸如但不限于RNA、肽或蛋白质的产生，或者可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。

选择标记物的示例包括但不限于包含限制性酶位点的DNA片段；编码对其它有毒化合物(包括抗生素，诸如壮观霉素、氨苄青霉素、卡那霉素、四环素、Basta、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT))产生抗性的产物的DNA片段；编码在受体细胞中其他方面缺乏的产物的DNA片段(例如tRNA基因、营养缺陷型标记物)；编码易于识别的产物的DNA片段(例如表型标记物，诸如β-半乳糖苷酶，GUS；荧光蛋白，诸如绿色荧光蛋白(GFP)、青色(CFP)、黄色(YFP)、红色(RFP)、黄绿色荧光蛋白(mNeonGreen)和细胞表面蛋白)；产生用于PCR的新引物位点(例如，两个先前未并置的DNA序列并置)，包含未被限制性内切酶或其他DNA修饰酶、化学物质作用或已被作用的DNA序列；以及包含特定修饰(例如甲基化)所需的允许其识别的DNA序列。另外的选择标记物包括赋予除草剂化合物抗性的基因，诸如草铵膦铵盐、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸盐(2,4-D)。参见例如，Yarranton，生物技术进展(1992)3：506-11；Christopherson等人，美国国家科学院院刊，美国(1992)89：6314-8；Yao等人，细胞(1992)71：63-72；Reznikoff，分子微生物学(1992)6：2419-22；Hu等人，细胞(1987)48：555-66；Brown等人，细胞(1987)49：603-12；Figge等人，细胞(1988)52：713-22；Deuschle等人，美国国家科学院院刊，美国(1989)86：5400-4；Fuerst等人，美国国家科学院院刊，美国(1989)86：2549-53；Deuschle等人，科学(1990)248：480-3；Gossen,博士论文，海德堡大学(1993)；Reines等人，美国国家科学院院刊，美国(1993)90：1917-21；Labow等人，分子细胞生物学(1990)10：3343-56；Zambretti等人，美国国家科学院院刊，美国(1992)89：3952-6；Bairn等人，美国国家科学院院刊，美国(1991)88：5072-6；Wyborski等人，核酸研究(1991)19：4647-53；Hillen and Wissman，分子结构生物学(1989)10：143-62；Degenkolb等人，抗菌物化学疗法(1991)35：1591-5；Kleinschnidt等人，生物化学(1988)27：1094-104；Bonin博士论文，海德堡大学(1993)；Gossen等人，美国国家科学院院刊，美国(1992)89：5547-51；Oliva等人，抗菌药化学疗法(1992)36：913-9；Hlavka等人，实验药理学手册(1985)，第78卷(柏林斯普林格出版社)；Gill等人，自然(1988)334：721-4。

外源性产物包括植物酶和产物以及来自其他来源的那些产物，包括原核生物和其他真核生物。此类产物包括酶、辅因子、激素等。可以增加蛋白质的水平，特别是具有改善的氨基酸分布以改善植物的营养价值的修饰的蛋白质的水平。这是通过表达具有增强的氨基酸含量的此类蛋白质来实现的。转基因、重组DNA分子、目的DNA序列和目的多核苷酸可包含一种或多种用于基因沉默的DNA序列。涉及植物中DNA序列表达的基因沉默方法是本领域已知的，这些方法包括但不限于共抑制、反义抑制、双链RNA(dsRNA)干扰、发夹RNA(hpRNA)干扰、含内含子的发夹RNA(ihpRNA)干扰、转录基因沉默和micro RNA(miRNA)干扰。

在一些实施方案中，必须优化核酸以在植物中表达。如本文所用，“植物优化的核苷酸序列”是针对植物中的表达增加，特别是针对植物或一种或多种目的植物中的表达增加而优化的核苷酸序列。例如，植物优化的核苷酸序列可通过修饰编码蛋白质的核苷酸序列来合成，该蛋白质诸如(例如)本文公开的双链断裂诱导剂(例如核酸内切酶)，使用一种或多种植物优选的密码子来提高表达。参见例如，Campbell和Gowri，植物生理学(1990)92：1-11讨论了宿主偏好的密码子用法。

合成植物优选基因的方法在本领域是可用的。参见例如，美国专利号5,380,831和5,436,391，以及Murray等人，核酸研究(1989)17：477-498，以引用方式并入本文。已知其他序列修饰可增强植物宿主中的基因表达。这些修饰包括(例如)消除：一个或多个编码杂多聚腺苷酸化信号的序列，一个或多个外显子-内含子剪接位点信号，一个或多个转座子样重复序列，以及其他可能对基因表达有害的充分表征的序列。序列的G-C含量可调节至给定植物宿主的平均水平，如参照宿主植物细胞中表达的已知基因所计算的。可能的话，对序列进行修饰以避免一个或多个预测的发夹次级mRNA结构。因此，本公开的“植物优化的核苷酸序列”包含一个或多个此类序列修饰。

与本发明一起使用的转化方法

用于将核苷酸序列和多肽引入生物中的多种方法是已知的，这些方法包括(例如)转化、有性杂交以及将多肽、DNA或mRNA引入细胞中。

在一些实施方案中，本发明包含植物育种，这些植物包含一种或多种转基因性状。最常见地，由于细菌转化系统，诸如(例如)但不限于，基于农杆菌、基因枪、嫁接、昆虫载体，DNA磨蚀或其他常用程序的那些转化系统，转基因性状随机插入整个植物基因组。最近，已经开发了能够定向转基因插入的基因靶向方案。一种重要的技术是位点特异性整合(SSI)，可将转基因靶向到与先前插入的转基因相同的染色体位置。定制设计的大范围核酸酶和定制设计的锌指大范围核酸酶可以使研究人员设计出靶向特定染色体位置的核酸酶，并且这些试剂可以将转基因靶向由这些核酸酶裂解的染色体位点。

当前使用的用于真核基因组(例如植物基因组)的精确基因工程的系统依赖于归巢核酸内切酶，大范围核酸酶，锌指核酸酶和转录激活因子样效应子核酸酶(TALEN)，这需要对每个新的靶基因进行全新的蛋白质工程。本文所述的高度特异性的CRISPR/CasX核酸内切酶系统更易于定制，因此，当目标是修饰许多不同靶序列时，该系统将更加有用。

植物中的转化方法可包括直接和间接转化方法。通过任何上述方法递送到植物细胞中可进一步包括使用一种或多种细胞穿透肽(CPP)。适用于转化的细胞包括但不限于质体和原生质体。

合适的直接转化方法包括，例如但不限于，PEG诱导的DNA摄取、花粉管介导的直接引入受精胚胎/受精卵、脂质体介导的转化、生物弹射法、借助于粒子轰击、电穿孔或显微注射。间接方法包括，例如但不限于，细菌介导的转化(例如农杆菌介导的转化技术)或使用病毒载体的病毒感染。在生物射弹转化的情况下，可以使用生物射弹装置将核酸酶引入植物组织，该装置可将微粒加速至300m/s至600m/s的速度，以穿透植物细胞壁和细胞膜。将蛋白质或RNA引入植物的另一种方法是通过靶细胞的超声处理。脂质体或原生质球融合物也可用于将外源材料引入植物。电穿孔可用于将外源物质引入原生质体、全细胞和组织中。

示例性病毒载体包括但不限于来自DNA病毒的载体，该DNA病毒诸如但不限于双生病毒、卷心菜卷曲病毒、豆黄矮病毒、小麦矮病毒、番茄卷曲病毒、玉米条纹病毒、烟草叶卷曲病毒、番茄金黄色花叶病毒或蚕豆坏死性黄色病毒、或RNA病毒的载体(例如但不限于烟草脆裂病毒(例如烟草拨浪鼓病毒、烟草花叶病毒))、马铃薯X病毒或大麦条纹花叶病毒。

而且，穿梭载体或二元载体可以(例如)通过农杆菌介导的转化稳定地整合到植物基因组中。然后可通过遗传杂交和分离去除CRISPR/CasX转基因，以生产非转基因但经基因修饰的植物或农作物。在农杆菌介导的转化的情况下，标记盒可以邻近侧翼T-DNA边界或位于侧翼T-DNA边界之间，并包含在二元载体中。在另一个实施方案中，标记盒可位于T-DNA的外部。可选择的标记盒也可位于与表达盒相同的T-DNA边界之内或附近，或者可以在二元载体(例如2T-DNA系统)上的第二T-DNA之内的其他地方。

本文公开的方法和组合物可用于将外源序列插入植物细胞基因组中的预定位置。因此，可以通过靶向重组将编码(例如)病原体抗性蛋白、代谢途径的酶、受体或转录因子的基因插入植物基因组中有利于其表达的区域。

用于将组合物接触，提供和/或引入到各种生物中的方法是已知的，这些方法包括但不限于稳定的转化方法、瞬时转化方法、病毒介导的方法和有性繁殖。稳定转化表明引入的多核苷酸整合到生物的基因组中，并能够被其子代遗传。瞬时转化表明引入的组合物仅在生物体中临时表达或存在。将多核苷酸和多肽引入植物中的方案可根据转化靶向的植物或植物细胞的类型而改变，诸如单子叶植物或双子叶植物。将多核苷酸和多肽引入植物细胞并随后插入植物基因组的合适方法包括(除本文列出的方法外)聚乙二醇介导的转化、微粒轰击、花粉管介导的受精胚胎/受精卵的引入、显微注射(Crossway等人，生物技术(1986)4：320-34和美国专利号6,300,543)，分生组织转变(美国专利号5,736,369)，电穿孔(Riggs等人，美国国家科学院院刊，美国(1986)83：5602-6)，农杆菌介导的转化(美国专利号5,563,055和5,981,840)，直接基因转移(Paszkowski等人，EMBO J.(1984)3：2717-22)，和弹道粒子加速(美国专利号4,945,050、5,879,918、5,886,244、5,932,782；Tomes等人，(1995)在植物细胞、组织和器官培养物中，通过微粒轰击直接将DNA转移到完整的植物细胞中：基本方法，编辑Gamborg&Phillips(柏林斯普林格出版社)；McCabe等人，生物技术(1988)6：923-6；Weissinger等人，Ann Rev Genet(1988)22：421-77；Sanford等人，微粒科学与技术(1987)5：27-37(onion)；Christou等人，植物生理学(1988)87：67-74(大豆)；Finer和McMullen，体外培养细胞(1991)27P：175-82(大豆)；Singh等人，理论与应用遗传学(1998)96：319-24(大豆)；Datta等人，生物技术(1990)8：736-40(稻)；Klein等人，美国国家科学院院刊，美国(1988)85：4305-9(玉米)；Klein等人，生物技术(1988)6：559-63(玉米)；美国专利号5,240,855、5,322,783和5,324,646；Klein等人，植物生理学(1988)91：440-4(玉米)；Fromm等人，生物技术(1990)8：833-9(玉米)；Hooykaas-Van Slogteren等人，自然(1984)311：763-4；美国专利号5,736,369(谷物)；Bytebier等人，美国国家科学院院刊，美国(1987)84：5345-9(百合科)；De Wet等人(1985)在”胚珠组织的实验操作”中，编辑Chapman等人，(朗文，纽约)，第197-209页(花粉)；Kaeppler等人，植物细胞报告(1990)9：415-8)和Kaeppler等人，理论与应用遗传学(1992)84：560-6(晶须介导的转化)；D'Halluin等人，植物细胞(1992)4：1495-505(电穿孔)；Li等人，植物细胞报告(1993)12：250-5；Christou和Ford Annals Botany(1995)75：407-13(稻)和Osjoda等人，自然生物技术(1996)14：745-50(农杆菌感染玉米)。

或者，可以将DNA构建体与合适的T-DNA侧翼区组合，并引入常规的根癌土壤杆菌宿主载体中。农杆菌介导的转化技术，包括解毒和使用二元载体，在科学文献中已有很好的描述。参见例如，Horsch等人(1984)科学233：496-498，和Fraley等人(1983)美国国家科学院院刊，美国80：4803。当使用二元T DNA载体的细菌感染细胞时，根癌土壤杆菌宿主的毒力功能将指导将构建体和邻近标记物插入植物细胞DNA中(Bevan(1984)核酸研究12：8711-8721)或共同培养程序(Horsch等人(1985)科学227：1229-1231)。农杆菌转化系统还可用于将DNA转化以及转移到单子叶植物和植物细胞中。参见Hernalsteen等人(1984)EMBO J 3：3039-3041；Hooykass-Van Slogteren等人(1984)自然311：763-764；Grimsley等人(1987)自然325：1677-179；Boulton等人(1989)植物分子生物学12：31-40；和Gould等人(1991)植物生理学95：426(-434)。

或者，可通过使植物与病毒或病毒核酸接触而将多核苷酸引入植物中。通常，此类方法涉及将多核苷酸掺入病毒DNA或RNA分子内。在一些实施方案中，可以首先合成目的多肽作为病毒多蛋白的一部分，该病毒多蛋白随后在体内或体外通过蛋白水解加工以产生所需的重组蛋白。将多核苷酸引入植物并表达其中编码的涉及病毒DNA或RNA分子的蛋白质的方法是已知的，参见例如美国专利号5,889,191、5,889,190、5,866,785、5,589,367和5,316,931。

在其他实施方案中，将编码CasX蛋白的RNA多核苷酸引入植物细胞中，然后由宿主细胞翻译和加工，以产生足以修饰细胞的量的蛋白(在至少一个向导RNA的存在下)，但是在经过一段预期的时间或一个或多个细胞分裂后，这种情况不会持续。将mRNA引入植物原生质体以进行瞬时表达的方法是本领域技术人员已知的(参见比如Gallie，植物细胞报告(1993)，13；119-122)。瞬时转化方法包括但不限于将多肽(诸如双链断裂诱导剂)直接引入生物体，将多核苷酸(诸如DNA和/或RNA多核苷酸)以及RNA转录本(诸如编码双链断裂诱导剂的mRNA)引入生物体。此类方法包括(例如)显微注射或粒子轰击。参见例如，Crossway等人，Mol.Gen.Genet.(1986)202：179-85；Nomura等人，植物科学(1986)44：53-8；Hepler等人，美国国家科学院院刊，美国(1994)91：2176-80；以及Hush等人，J.细胞科学(1994)107：775-84。

对于粒子轰击或原生质体转化，表达系统可包含一个或多个分离的线性片段，或者可以是较大构建体的一部分，该较大构建体可能包含细菌复制元件、细菌选择标记物或其他可检测元件。包含编码向导和/或CasX的多核苷酸的表达盒可与标记盒物理联接或可与编码标记盒的第二核酸分子混合。标记盒由表达可检测或可选择标记物的必要元件组成，该标记物允许有效选择转化细胞。

在某些实施方案中，令人感兴趣的是将CasX CRISPR系统的一种或多种组分直接递送至植物细胞，例如以产生非转基因植物。一种或多种CasX组分可以在植物或植物细胞外部制备，并递送到细胞中。比如，可以在引入植物细胞之前在体外制备CasX蛋白。CasX蛋白可通过本领域技术人员已知的多种方法来制备，这些方法包括重组生产。表达后，将CasX蛋白分离，根据需要重新折叠、纯化并可选地进行处理，以去除任何纯化标签，诸如His标签。一旦获得粗制、部分纯化或更完全纯化的CasX蛋白，就可以将该蛋白引入植物细胞中。在特定实施方案中，将CasX蛋白与靶向目的基因的向导RNA混合以形成预组装的核糖核蛋白，其可以通过电穿孔，轰击，化学转染和本文所述其他递送方式中的任何一种或多种方式递送至植物细胞。

本发明的基因构建体

本公开进一步提供了表达构建体，诸如但不限于表达盒，用于在宿主(例如植物、植物细胞或植物部位)中表达CRISPR/CasX系统，该系统能够结合并在靶位点产生双链断裂。在一个实施方案中，本发明的表达构建体包含与编码CRISPR/CasX基因的核苷酸序列可操作地连接的启动子和与本发明的向导核酸可操作地连接的启动子。该启动子能够驱动宿主(例如植物)细胞中可操作联接的核苷酸序列的表达。在另一个实施方案中，CRISPR/CasX基因包含一种或多种本文所述的转录和/或翻译融合物。在一些实施方案中，表达盒允许CRISPR/CasX系统的瞬时表达，而在其他实施方案中，表达盒允许CRISPR/CasX系统诸如(例如)但不限于，通过整合到宿主细胞基因组中而稳定地保持在宿主细胞内。

启动子是DNA的一个区域，该区域参与RNA聚合酶和其他蛋白质的识别和结合以启动转录。启动子在本领域中众所周知是高度特异性的，并且适合在同一生物体内的特定界、属、物种、甚至特定组织中使用。启动子可以是组成型活性或诱导型；每种的示例是本领域众所周知的。例如，植物启动子是能够在植物细胞中启动转录的启动子，有关植物启动子的综述，参见Potenza等人，In Vitro Cell Dev Biol(2004)40：1-22。组成型植物启动子是能够在植物的全部或几乎所有发育阶段表达其在所有或几乎所有植物组织中控制的开放阅读框(ORF)的启动子(称为“组成型表达”)。组成型启动子包括，例如Rsyn7启动子的核心启动子和WO99/43838以及美国专利号6,072,050中公开的其他组成型启动子；核心CaMV 35S启动子(Odell等人，自然(1985)313：810-2)；大米肌动蛋白(McElroy等人，植物细胞(1990)2：163-71)；ubiquitin(Christensen等人，植物分子生物学(1989)12：619-32；Christensen等人，植物分子生物学(1992)18：675-89)；pEMU(Last等人，理论与应用遗传学(1991)81：581-8)；MAS(Velten等人，EMBO杂志(1984)3：2723-30)；ALS启动子(美国专利号5,659,026)等。其他组成型启动子在例如美国专利号5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、5,608,142和6,177,611中描述。

在一些实施方案中，可使用诱导型启动子。病原体感染后诱导的病原体诱导型启动子包括但不限于，调节PR蛋白、SAR蛋白、β-1,3-葡聚糖酶、几丁质酶等表达的启动子。或者，可将编码CasX核酸内切酶的序列可操作地连接至组成型、细胞特异性或通过自杀外显子的可变剪接而激活的启动子。

化学调节的启动子可用于通过应用外源化学调节剂来调节植物中基因的表达。该启动子可以是化学诱导型启动子，其中该化学试剂的应用诱导基因表达，或者是化学抑制型启动子，其中该化学试剂的应用抑制基因表达。化学诱导型启动子包括但不限于，由苯磺酰胺除草剂安全剂激活的玉米ln2-2启动子(De Veylder等人，Plant Cell Physiol(1997)38：568-77)，玉米GST启动子(被用作芽前除草剂的疏水亲电化合物激活的GST-II-27，WO93/01294)和被水杨酸激活的烟草PR-1a启动子(Ono等人，生物技术，生物化学(2004)68：803-7)。其他化学调节的启动子包括类固醇响应性启动子(参见例如，糖皮质激素诱导型启动子(Schena等人，美国国家科学院院刊，美国(1991)88：10421-5；McNellis等人，植物杂志(1998)14：247-257)；四环素诱导型和四环素抑制型启动子(Gatz等人，Mol Gen Genet(1991)227：229-37；美国专利号5,814,618和5,789,156)。

可使用诱导型启动子，该启动子允许时空控制基因编辑或基因表达可使用能量的形式。能量的形式可包括但不限于声能、电磁辐射、化学能和/或热能。光诱导系统(光色素，LOV域或隐色色素)的示例，诸如以序列特异性方式指导转录活性变化的光诱导转录效应子(LITE)。光诱导系统的组件可包括Cpf1 CRISPR酶、光响应性细胞色素异二聚体(例如来自拟南芥)和转录激活/抑制域。

组织优选的启动子可用于靶向特定植物组织内的增强表达。组织优选的启动子包括：例如Kawamata等人，植物细胞生理学(1997)38：792-803；Hansen等人，Mol Gen Genet(1997)254：337-43；Russell等人，转基因研究(1997)6：157-68；Rinehart等人，植物生理学1(1996)12：1331-41；Van Camp等人，植物生理学(1996)112：525-35；Canevascini等人，植物生理学(1996)112：513-524；Lam，Results Probl Cell Differ(1994)20：181-96；和Guevara-Garcia等人，植物学杂志(1993)4：495-505。叶优选的启动子包括：例如Yamamoto等人，植物学杂志(1997)12：255-65；Kwon等人，植物生理学(1994)105：357-67；Yamamoto等人，植物生理学(1994)35：773-8；Gotor等人，植物学杂志(1993)3：509-18；Orozco等人，植物分子生物学(1993)23：1 129-38；Matsuoka等人，美国国家科学院院刊，美国(1993)90：9586-90；Simpson等人，EMBO杂志(1958)4：2723-9；Timko等人，自然(1988)318：57-8。根优选的启动子包括：例如Hire等人，植物分子生物学(1992)20：207-18(大豆根特异性谷氨酰胺合成酶基因)；Miao等人，植物细胞(1991)3：11-22(胞质谷氨酰胺合成酶(GS))；Keller和Baumgartner，植物细胞(1991)3：1051-61(豆芽GRP 1.8基因的根特异性控制元件)；Sanger等人，植物分子生物学(1990)14：433-43(根癌农杆菌甘露糖合成酶的根特异性启动子(MAS))；Bogusz等人，植物细胞(1990)2：633-41(分离自山梨属和苔藓的根特异性启动子)；Leach和Aoyagi，植物科学(1991)79：69-76(发根基因rolC和rolD根诱导基因)；Teeri等人，EMBO J(1989)8：343-50(农杆菌诱导的致伤TR1’和TR2’基因)；VfENOD-GRP3基因启动子(Kuster等人，植物分子生物学(1995)29：759-72)；和rolB promoter(Capana等人，植物分子生物学(1994)25：681-91；菜豆素基因(Murai等人，科学(1983)23：476-82；Sengopta-Gopalen等人，美国国家科学院院刊，美国(1988)82：3320-4)。另见美国专利号5,837,876、5,750,386、5,633,363、5,459,252、5,401,836、5,110,732和5,023,179。

在一些实施方案中，使用DNA依赖性RNA聚合酶II启动子或DNA依赖性RNA聚合酶III启动子。在一些实施方案中，单子叶植物启动子用于驱动单子叶植物中的表达。在各种其他实施方案中，双子叶植物启动子用于驱动双子叶植物中的表达。

种子优选的启动子包括在种子发育过程中有活性的种子特异性启动子，以及在种子发芽过程中有活性的种子发芽启动子。参见Thompson等人，BioEssays(1989)10：108。种子优选的启动子包括但不限于Cim1(细胞分裂素诱导的信息)；cZ19B1(maize19kDa zein)；和milps(肌醇-1-磷酸合酶)；(WO00/11177；以及美国专利6,225,529)。对于双子叶植物，种子优选的启动子包括但不限于：豆β-菜豆蛋白、油菜籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科素等。对于单子叶植物，种子优选的启动子包括但不限于：玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDaγ玉米醇溶蛋白、蜡质、皱缩1、皱缩2、球蛋白1、油质蛋白和裸核。另见WO00/12733，其中公开了来自END1和END2基因的种子优选的启动子。

表型标记物是可筛选的或可选择的标记物，该标记物包括视觉标记物和可选择的标记物，无论其是阳性还是阴性的可选择标记物。可以使用任何表型标记物。具体地讲，可选择的或可筛选的标记物包含DNA片段，该DNA片段通常在特定条件下允许人们识别、或选择或针对包含它的分子或细胞。这些标记物可编码活性，诸如但不限于RNA、肽或蛋白质的产生，或者可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。

选择标记物的示例包括但不限于包含限制性酶位点的DNA片段；编码对其它有毒化合物(包括抗生素，诸如壮观霉素、氨苄青霉素、卡那霉素、四环素、Basta、新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT))产生抗性的产物的DNA片段；编码在受体细胞中其他方面缺乏的产物的DNA片段(例如tRNA基因、营养缺陷型标记物)；编码易于识别的产物的DNA片段(例如表型标记物，诸如β-半乳糖苷酶，GUS；荧光蛋白，诸如绿色荧光蛋白(GFP)、青色(CFP)、黄色(YFP)、黄绿色(mNeonGreen)、红色(RFP)以及细胞表面蛋白)；产生用于PCR的新引物位点(例如，两个先前未并置的DNA序列并置)，包含未被限制性内切酶或其他DNA修饰酶、化学物质作用或已被作用的DNA序列；以及包含特定修饰(例如甲基化)所需的允许其识别的DNA序列。

另外的选择标记物包括赋予除草剂化合物抗性的基因，诸如草铵膦铵盐、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸盐(2,4-D)。参见例如Yarranton，生物技术进展(1992)3：506-1 1；Christopherson等人，美国国家科学院院刊，美国(1992)89：6314-8；Yao等人，细胞(1992)71：63-72；Reznikoff，分子微生物学(1992)6：2419-22；Hu等人，细胞(1987)48：555-66；Brown等人，细胞(1987)49：603-12；Figge等人，细胞(1988)52：713-22；Deuschle等人，美国国家科学院院刊，美国(1989)86：5400-4；Fuerst等人，美国国家科学院院刊，美国(1989)86：2549-53；Deuschle等人，科学(1990)248：480-3；Gossen，(1993)博士论文，海德堡大学；Reines等人，美国国家科学院院刊，美国(1993)90：1917-21；Labow等人，分子细胞生物学(1990)10：3343-56；Zambretti等人，美国国家科学院院刊，美国(1992)89：3952-6；Bairn等人，美国国家科学院院刊，美国(1991)88：5072-6；Wyborski等人，核酸研究(1991)19：4647-53；Hillen and Wissman，分子结构生物学(1989)10：143-62；Degenkolb等人，抗菌药化学疗法(1991)35：1591-5；Kleinschnidt等人，生物化学(1988)27：1094-104；Bonin，(1993)博士论文，海德堡大学；Gossen等人，美国国家科学院院刊，美国(1992)89：5547-51；Oliva等人，抗菌药化学疗法(1992)36：913-9；Hlavka等人，实验药理学手册，(1985)第78卷(德国斯普林格出版社)；Gill等人，自然(1988)334：721-4。

根据标记物基因的性质，可以使用基于可选择标记物的细胞的各种选择程序。在特定的实施方案中，使用可选择的标记物，即允许基于标记物的表达直接选择细胞的标记物。可选择标记物可赋予阳性或阴性选择，并且在存在外部底物的条件下是有条件的或无条件的(Miki等人2004，107(3)：193-232)。最常见的是，将抗生素或除草剂抗性基因用作标记物，由此通过在含有抑制量的标记物基因赋予抗性的抗生素或除草剂的培养基上生长工程化植物材料来进行选择。此类基因的示例是赋予抗生素抗性的基因(诸如潮霉素(hpt)和卡那霉素(nptII))、以及赋予除草剂抗性的基因(诸如膦丝菌素(bar)、氯嘧磺隆(als)、aroA、草甘膦乙酰转移酶(GAT)基因)、来自链霉菌属物种的膦丝菌素乙酰转移酶(PAT)基因和ACCase抑制剂编码基因。排毒基因也可用作标记物，其示例包括编码膦丝菌素乙酰转移酶、膦丝菌素乙酰转移酶和羟苯基丙酮酸双加氧酶(HPPD)抑制剂的酶。

还可通过筛选可见标记物的活性来鉴定转化的植物和植物细胞，该可见标记物通常是能够处理有色底物的酶(例如β-葡糖醛酸糖苷酶、萤光素酶、B或C1基因)。此类选择和筛选方法是本领域技术人员众所周知的。

本发明的转基因植物、植物部分、细胞和种子

在本发明的一个优选的实施方案中，提供了包括转基因植物的转基因部分的转基因植物，特别是转基因种子和转基因细胞。转基因植物的转基因部分可进一步包括可以收获的那些部分，诸如但不限于甜菜的甜菜根、水稻的米粒和玉米的玉米棒。

为了生产携带整合的核酸构建体的转基因种子，可以使转基因植物自交。或者，可以将转基因植物与相似的转基因植物或携带一种或多种不同于本发明的基因构建体核酸的转基因植物杂交，或与已知植物育种方法的非转基因植物杂交以生产转基因种子。这些种子可用于提供本发明的转基因植物的后代，包含来自本发明的基因构建体整合的核酸。

转化植物细胞的合适方法在植物生物技术中是已知的，并且在本文中进行了描述。可以培养转化的植物细胞以再生整个植物，该植物具有转化的基因型并因此具有所需的表型。这些方法中的每一种都可用于将选择的核酸优选地引入载体到植物细胞中以获得本发明的转基因植物。转化方法可包括直接和间接转化方法，并且适用于双子叶植物和主要用于单子叶植物。该植物可以是单子叶植物(例如小麦、玉米或狗尾草)，或者该植物可以是双子叶植物(例如番茄、大豆、烟草、马铃薯或拟南芥)。

本文所述的方法也可以与单子叶植物一起使用，诸如属于以下目的单子叶植物：泽泻目(Alismatales)、水瞥目(Hydrocharitales)、茨藻目(Najadales)、霉草目(Triuridales)、鸭跖草目(Commelinales)、谷精草目(Eriocaulales)、帚灯草目(Restionales)、禾本目(Poales)、灯心草目(Juncales)、莎草目(Cyperales)、香蒲目(Typhales)、凤梨目(Bromeliales)、姜目(Zingiberales)、槟榔目(Arecales)、环花草目(Cyclanthales)、露兜树目(Pandanales)、天南星目(Arales)、百合目(Lilliales)和兰目(Orchid ales)的植物，或者属于裸子植物门的植物，例如，松果菊、银杏、苏铁和片麻岩。

本文所述的方法可与双子叶植物一起使用，该双子叶植物属于例如以下目：Magniolales、八角目(Illiciales)、月桂目(Laurales)、胡椒目(Piperales)、亚里士多德目(Aristochiales)、睡莲目(Nymphaeales)、毛茛目(Ranunculales)、蒲公英目(Papeverales)、沙棘目(Sarraceniaceae)、荆芥目(Trochodendrales)、金缕梅目(Hamamelidales)、优生目(Eucomiales)、莱特纳目(Leitneriales)、杨梅目(Myricales)、山毛榉目(Fagales)、木麻黄目(Casuarinales)、石竹目(Caryophyllales)、肉穗果目(Batales)、蓼目(Polygonales)、蓝雪目(Plumbaginales)、五桠果目(Dilleniales)、山茶目(Theales)、锦葵目(Malvales)、荨麻目(Urticales)、玉蕊目(Lecythidales)、紫堇目(Violales)、杨柳目(Salicales)、白花菜目(Capparales)、欧石楠目(Ericales)、岩梅目(Diapensales)、柿树目(Ebenales)、报春花目(Primulales)、蔷薇目(Rosales)、豆目(Fabales)、川草目(Podostemales)、小二仙草目(Haloragales)、桃金娘目(Myrtales)、山茱萸目(Cornales)、山龙眼目(Proteales)、San tales、大花草目(Rafflesiales)、卫矛目(Celastrales)、大戟目(Euphorbiales)、鼠李目(Rhamnales)、无患子目(Sapindales)、胡桃目(Juglandales)、牻牛儿苗目(Geraniales)、远志目(Polygalales)、伞形目(Umbellales)、龙胆目(Gentianales)、花葱目(Polemoniales)、唇形目(Lamiales)、车前草目(Plantaginales)、玄参目(Scrophulariales)、桔梗目(Campanulales)、茜草目(Rubiales)、川绿断目(Dipsacales)、以及菊目(Asterales)。

本文所述的方法可用于广泛范围的植物，这些植物包括但不限于来自以下属的物种：芦笋属、燕麦属、芸苔属、柑橘属、西瓜属、辣椒属、南瓜属、胡萝卜属、甘氨酸属、大麦属、莴苣属、番茄属、苹果属、木薯属、烟草属、稻属、鳄梨属、豌豆属、梨属、李属、萝卜属、黑麦属、茄属、高粱属、小麦属、葡萄属、豇豆属和玉米属。

为一种或多种标记物选择转化的植物细胞，这些细胞包括原生质体和质体，这些标记物已经用本发明的核酸转化到植物中，并且包括优选介导抗生素抗性的基因，诸如新霉素磷酸转移酶II介导的基因NPTII，该基因NPTII编码卡那霉素抗性。或者，可以使用除草剂抗性基因。随后，转化的细胞再生为完整的植物。DNA转移和再生后，可以对植物进行检查，例如定量PCR以确定本发明核酸的存在。

在一些实施方案中，可将抗生素抗性和/或除草剂抗性选择标记物与CRISPR/CasX系统共引入植物细胞中，以通过同源重组进行靶向的基因修复/校正和敲入(基因插入和置换)。结合不同的供体DNA片段，CRISPR/CasX系统可用于修饰各种农艺性状以进行遗传改良。

具有引入序列的细胞可使用常规条件生长或再生为植物，参见(例如)McCormick等人，植物行细胞报告(1986)5：81-4。然后这些植物可以生长，并用相同的转化菌株或不同的转化或未转化的菌株授粉，从而鉴定出具有所需特性和/或包含引入的多核苷酸或多肽的后代。可以生长两个或更多个世代以确保稳定地维持和遗传多核苷酸，并收获种子。

可以使用任何植物，包括单子叶植物和双子叶植物。可以使用的单子叶植物的示例包括但不限于：玉米(Zea mays)、稻米(Oryza sativa)、黑麦(Secale graine)、高粱(Sorghum bicolor、Sorghum vulgare)、小米(例如珍珠粟(青草(Penensetum glaucum)、粟(Panicum miliaceum)、谷子(Setaria italica)、小米(Eleusine coracana)、小麦(Triticum aestivum)、甘蔗(Saccharum spp.)、燕麦(Avena)、大麦(Hordeum)、柳枝switch(Panicum virgatum)、菠萝(Ananas comosus)、香蕉(Musa spp.)、棕榈、观赏植物、草皮草和其他草。可以使用的双子叶植物的示例包括但不限于：大豆(Glycine max)、油菜(Brassica napus和B.campestris)、苜蓿(Medicago sativa)、烟草(Nicotiana tabacum)、拟南芥(Arabidopsis thaliana)、向日葵(Helianthus annuus)、甜菜(Beta vulgaris)、棉花(Gossypium arboreum)和花生(Arachis hypogaea)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)等，可以使用的其他单子叶植物包括油棕(Elaeisguineensis)、苏丹草(Sorghum×drummondii)和黑麦(Secale cereale)。可以使用的其他双子叶植物包括红花(Carthamus tinctorius)、咖啡(Coffea arabica和Coffeacanephora)、苋菜(Amaranthus spp.)和油菜籽(Brassica napus和Brassicanapobrassica；高芥酸和菜籽油)。

与本发明的方法和组合物一起使用的另外的非限制性示例性植物包括：大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、双色高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、谷子(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secalecereale)、黑小麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodiumdistachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops tauschii)、Daucusglochidiatus、甜菜(Beta vulgaris)、Daucus pusillus、Daucus muricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotiana sylvestris)、茸毛烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythrante guttata、Genliseaaurea、黄瓜(Cucumis sativus)、桑树(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、须弥芥(Crucihimalayahimalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamineflexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、小拟南芥(Olmarabidopsis pumila)、硬毛南芥(Arabis hirsute)、欧洲油菜(Brassicanapus)、甘蓝(Brassica oleracea)、芜菁(Brassica rapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicariasubsp.sativa)、柑桔(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populustrichocarpa)、蒺藜苜蓿(Medicago truncatula)、Cicer yamashitae、野生鹰嘴豆(Cicerbijugum)、鹰嘴豆(Cicer arietinum)、Cicer reticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolusvulgaris)、大豆(Glycine max)、棉属(Gossypium sp.)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏槿(Torenia fournieri)、洋葱(Allium cepa)、葱(Alliumfistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthustuberosus)和韭菜(Allium tuberosum)，以及属于上述植物之一的任何品种或亚种。

与本发明一起使用的治疗方法

本发明的方法提供了一种用于治疗病害和/或病症(诸如但不限于由昆虫引起的病害)的方法。本发明的方法还提供了一种用于预防植物中的昆虫感染和/或侵染(例如，昆虫抗性)的方法。

通过本发明方法可治疗的病害和/或病症的非限制性示例包括炭疽病茎腐病、曲霉穗腐病、普通玉米穗腐病、玉米穗病(不常见)、普通玉米锈病、二倍体穗腐病、二倍体茎腐病、霜霉病、眼斑病、镰刀菌穗腐病、镰刀菌茎腐病、赤霉素耳腐病、赤霉菌茎腐病、戈斯枯萎病和叶枯病、灰色叶斑病、丝黑穗病、北方玉米叶枯病、褐斑病、腐霉病、南方叶斑病、南方锈病和斯图尔特细菌性枯萎病和枯萎病及其组合。

通过本发明的可直接或间接引起病害和/或病症的昆虫的非限制性示例包括粘虫、亚洲园林甲虫、小地老虎、棕纹蝽、褐臭蝽、普通茎螟、玉米臭虫、玉米穗虫、玉米叶蚜虫、玉米根虫、玉米根虫蚕丝、欧洲玉米螟、秋天粘虫、葡萄肖叶甲、啤酒花蛀虫、日本甲虫、秋季行军粘虫(Scouting for Fall Armyworm)、种子玉米甲虫、种子玉米蛆、南方玉米叶甲虫、西南玉米螟、红蜘蛛、甘蔗甲虫、西豆角虫、蛴螬和线虫及其组合。本发明的方法还适用于防止植物被任何此类昆虫感染和/或侵染。

植物病害的其他非限制性示例列于WO 2013/046247，并在以下重现：

水稻病害：稻瘟病菌、米氏科氏菌、茄属根瘤菌、富士赤霉菌；

小麦病害：小麦白粉病(Erysiphe graminis)、禾谷镰刀菌(Fusariumgraminearum)、燕麦镰刀菌(F.avenaceum)、大刀镰刀菌(F.culmorum)、微座孢属斑病(Microdochium nivale)、条形柄锈菌(Puccinia striiformis)、小麦秆锈菌(P.graminis)、小麦叶锈病菌(P.recondita)、雪腐镰刀菌(Micronectriella nivale)、斑疹伤寒菌(Typhula sp.)、黑粉菌(Ustilago tritici)、网腥黑粉菌(Tilletia caries)、小麦基腐病菌(Pseudocercosporella herpotrichoides)、叶枯病(Mycosphaerellagraminicola)、颖枯壳针孢(Stagonospora nodorum)、偃麦草核腔菌(Pyrenophoratritici-repentis)；

大麦病害：小麦白粉病(Erysiphe graminis)、禾谷镰刀菌(Fusariumgraminearum)、燕麦镰刀菌(F.avenaceum)、大刀镰刀菌(F.culmorum)、微座孢属斑病(Microdochium nivale)、条形柄锈菌(Puccinia striiformis)、小麦秆锈菌(P.graminis)、大麦褐锈病(P.hordei)、大麦散黑穗病(Ustilago nuda)、大麦云纹病菌(Rhynchosporium secalis)、大麦网斑病(Pyrenophora teres)、禾旋孢腔菌(Cochliobolus sativus)、大麦条纹病(Pyrenophora graminea)、立枯丝核菌(Rhizoctonia solani)；

玉米病害：玉蜀黍黑粉菌(Ustilago maydis)、异旋孢腔菌(Cochliobolusheterostrophus)、高粱胶尾孢(Geoeocercospora sorghi)、玉米锈病(Pucciniapolysora)、玉米灰斑病菌(Cercospora zeae-maydis)、立枯丝核菌(Rhizoctoniasolani)；

柑橘类病害：间座壳菌(Diaporthe citri)、疮痂病(Elsinoe fawcetti)、指状青霉(Penicillium digitatum)、意大利青霉(P.italicum)、寄生疫霉(Phytophthoraparasitica)、柑桔褐腐疫霉(Phytophthora citrophthora)；

苹果病害：苹果链核盘菌(Monilinia mali)、苹果腐烂病(Valsa ceratosperma)、白叉丝单囊壳(Podosphaera leucotricha)、斑点落叶病菌(Alternaria alternata applepathotype)、黑星病(Venturia inaequalis)、炭疽菌(Colletotrichum acutatum)、恶疫霉菌(Phytophtora cactorum)；

梨病害：星病菌(Venturia nashicola)、梨黑星病(V.pirina)、斑病菌(Alternaria alternata Japanese pear pathotype)、梨胶锈菌(Gymnosporangiumharaeanum)、恶疫霉菌(Phytophtora cactorum)；

桃子病害：桃褐腐病菌(Monilinia fructicola)、疮痂病(Caradosporiumcarpophilum)、拟茎点霉(Phomopsis sp.)；

葡萄病害：痂囊腔菌(Elsinoe ampelina)、围小丛壳菌(Glomerella cingulata)、Uninula necator、葡萄锈病菌(Phakopsora ampelopsidis)、葡萄球座菌(Guignardiabidwellii)、霜霉病(Plasmopara viticola)；

柿子病害：柿炭疽病(Gloesporium kaki)、柿角斑病(Cercospora kaki)、Mycosphaerela nawae；

葫芦病害：葫芦科刺盘孢(Colletotrichum lagenarium)、白粉病菌(Sphaerotheca fuliginea)、蔓枯病(Mycosphaerella melonis)、尖孢镰刀菌(Fusariumoxysporum)、霜霉病菌(Pseudoperonospora cubensis)、疫霉菌(Phytophthora sp.)、腐霉菌(Pythium sp.)；

番茄病害：茄链格孢(Alternaria solani)、黄枝孢霉(Cladosporium fulvum)、致病疫霉(Phytophthora infestans)；

茄子病害：茄子褐纹病(Phomopsis vexans)、白粉病菌(Erysiphecichoracearum)；

十字花科类蔬菜病害：链格孢菌(Alternaria japonica)、白菜白斑病菌(Cercosporella brasicae)、根肿病(Plasmodiophora brasicae)、寄生孢霉(Peronosporaparasitica)；

大葱病害：葱柄锈菌(Puccinia allii)、霜霉病(Peronospora destructor)；

大豆病害：大豆紫斑病菌(Cercospora kikuchii)、痂囊腔菌属甘氨酸(Elsinoeglycines)、海洋红树林内生真菌(Diaporthe phaseolorum var.sojae)、大豆壳针孢(Septoria glycines)、细毛角斑病菌(Cercospora sojina)、大豆锈菌(Phakopsorapachyrhizi)、大豆疫霉菌(Phytophthora sojae)、立枯丝核菌(Rhizoctonia solani)、褐斑病菌(Corynespora casiicola)、核盘菌(Sclerotinia sclerotiorum)；

芸豆病害：林地炭疽病(Colletrichum lindemthianum)；

花生病害：花生黑斑病菌(Cercospora personata)、褐斑病菌(Cercosporaarachidicola)、齐整小核菌(Sclerotium rolfsii)；

豌豆病害：豌豆白粉菌(Erysiphe pisi)；

马铃薯病害：茄链格孢(Alternaria solani)、疫霉菌(Phytophthorainfestans)、马铃薯绯腐病菌(Phytophthora erythroseptica)、马铃薯粉痂菌(Spongospora subterranean)、f.sp.Subterranean；

草莓病害：白粉病(Sphaerotheca humuli),炭疽病(Glomerella cingulata)；

茶病害：茶网饼病菌(Exobasidium reticulatum)、白星病(Elsinoeleucospila)、拟盘菌(Pestalotiopsis sp.)、炭疽病(Colletotrichum theae-sinensis)；

烟草病害：烟草赤星病菌(Alternaria longipes)、烟草白粉病(Erysiphecichoracearum)、刺盘孢(Colletotrichum tabacum)、烟草霜霉病(Peronosporatabacina)、烟草疫霉菌(Phytophthora nicotianae)；

油菜病害：核盘菌(Sclerotinia sclerotiorum)、立枯丝核菌(Rhizoctoniasolani)；

棉花病害：立枯丝核菌(Rhizoctonia solani)；

甜菜病害：白尾孢(Cercospora beticola)、水稻纹枯病(Thanatephoruscucumeris)、水稻纹枯病(Thanatephorus cucumeris)、丝囊霉(Aphanomycescochlioides)；

玫瑰病害：蔷薇双壳菌(Diplocarpon rosae)、单丝壳菌(Sphaerothecapannosa)、霜霉病(Peronospora sparsa)；

菊花和菊科病害：莴苣盘梗霉(Bremia lactuca)、菊壳针孢(Septoriachrysanthemi-indici)、菊花白锈病(Puccinia horiana)；

各种植物的病害：瓜果腐霉(Pythium aphanidermatum)、德巴利腐霉(Pythiumdebarianum)、禾生腐霉菌(Pythium graminicola)、畸雌腐霉(Pythium irregulare)、极腐霉(Pythium ultimum)、葡萄孢菌(Botrytis cinerea)、核盘菌(Sclerotiniasclerotiorum)；

萝卜病害：黑斑病菌(Alternaria brassicicola)；

结缕草病害：内果硬核菌(Sclerotinia homeocarpa)、立枯丝核菌(Rhizoctoniasolani)；

香蕉病害：香蕉黑条叶斑病菌(Mycosphaerella fijiensis)、香蕉褐条斑小球壳菌(Mycosphaerella musicola)；

向日葵病害：单轴霉(Plasmopara halstedii)；

由曲霉属(Aspergillus spp.)、青霉属(Penicillium spp.)、镰刀菌属(Fusariumspp.)、赤霉菌属(Gibberella spp.)、木霉属(Tricoderma spp.)、Thielaviopsis spp.、根霉属、毛霉菌、伏革菌属、Rhoma spp.、丝核菌属、Diplodia spp.等引起的种子病害或各种植物生长初期的病害。

Polymixa spp.、奥氏菌属(Olpidium spp.)介导的各种植物的病毒病等。

创造营养改良作物和功能性食品的方法

本文所述的CasX系统和方法可用于生产营养改良的农作物。在一些实施方案中，本文提供的方法适于生产“功能性食品”，即可以提供超出其包含的传统营养素的健康益处的改良食品或食品成分，和/或“营养食品”，即可以被认为是食品或食品的一部分并提供健康益处的物质，包括病害的预防和治疗。该营养食品可用于预防和/或治疗癌症、糖尿病、心血管病害和高血压中的一种或多种病害。

例如，营养改善的农作物可诱导或增加了以下一种或多种化合物的合成：类胡萝卜素，诸如各种水果和蔬菜中的α-胡萝卜素或β-胡萝卜素；叶黄素；番茄和番茄制品中存在的番茄红素；玉米黄质，存在于柑橘和玉米中；膳食纤维、β-葡聚糖、脂肪酸(例如omega-3、共轭亚油酸、GLA和CVD)；黄酮类化合物(例如小麦中存在的羟基肉桂酸酯)；黄酮醇；儿茶素；单宁；芥子油苷；吲哚；异硫氰酸盐，诸如萝卜硫烷；酚类，诸如葡萄中的斯蒂芬类、咖啡酸、阿魏酸和表儿茶素；玉米、大豆、小麦和木油中存在的植物甾烷醇/甾醇；果聚糖；菊糖；菊芋中的低聚果糖；大豆中存在的皂苷；植物雌激素；亚麻、黑麦和蔬菜中存在的木脂素；二烯丙基硫；烯丙基甲基三硫化物；二硫代硫酮；和单宁，诸如原花青素。

诱导或增加的合成可通过直接引入一种或多种编码上述化合物合成中涉及的蛋白质的基因而发生。或者，可以修饰植物的代谢，以便增加一种或多种上述化合物的产量。例如，可以工程化植物以表达硬脂基-ACP去饱和酶的反义基因以增加植物的硬脂酸含量。可将植物工程化成表达突变形式的DNA，以阻止上述化合物之一的降解。拟南芥可被工程化以在强启动子的控制下表达Tfs C1和R，从而带来高的花色素苷积聚率。参见Bruce等人，2000，Plant Cell 12：65-80。Tf RAP2.2及其相互作用伴侣SINAT2的表达增加可以增加拟南芥叶片中的类胡萝卜素形成作用。在拟南芥中表达Tf Dof1可诱导编码碳骨架酶的基因的上调、氨基酸含量的显著增加和Glc水平的降低。

本文提供的方法可用于产生变应原水平降低的植物。在特定的实施方案中，这些方法包含修饰负责植物变应原产生的一种或多种基因的表达。在一些实施方案中，CasX可用于破坏或下调植物细胞(诸如黑麦草植物细胞)中的Lol p5基因的表达，并从中再生植物，以便降低所述植物的花粉的变应原性。本文所述的CasX系统和方法可用于鉴定然后编辑或沉默编码此类豆类的致敏蛋白的基因。在花生，大豆，小扁豆，豌豆，羽扇豆，四季豆和绿豆中可能已经鉴定了一些此类的基因。参见Nicolaou等人，2011年《过敏与临床免疫学》的最新观点；11：3(222)。

增强生物燃料生产的方法

本文所述的CasX系统和方法可用于增强植物中生物燃料的生产。可以从有机物质中提取可再生的生物燃料，这些有机物质的能量是通过固碳过程获得的，或者是通过使用用或转化生物质制得的。此类生物质可以直接用于生物燃料，或者可以通过热转化、化学转化和生化转化而转化为方便的含能量物质。至少可以生产两种类型的生物燃料：生物乙醇和生物柴油。生物乙醇主要是通过纤维素(淀粉)的糖发酵过程生产的，该纤维素大部分来自玉米和甘蔗。另一方面，生物柴油主要来自油料作物，诸如油菜籽、棕榈和大豆。

如本文所述的使用CasX CRISPR系统的方法可用于改变细胞壁的性质，以便促进关键的水解剂的进入，从而更有效地释放糖以进行发酵。在特定的实施方案中，纤维素和/或木质素的生物合成被修饰。纤维素是细胞壁的主要成分。纤维素和木质素的生物合成是共同调节的。通过减少植物中木质素的比例，可增加纤维素的比例。在特定的实施方案中，本文所述的方法用于下调植物中木质素的生物合成，以便增加可发酵的碳水化合物。更具体而言，本文所述的方法用于下调至少第一木质素生物合成基因，该基因选自由以下项构成的组：4-香豆酸3-羟化酶(C3H)、苯丙氨酸氨裂合酶(PAL)、肉桂酸4-羟化酶(C4H)、羟肉桂酸转移酶(HCT)、咖啡酸O-甲基转移酶(COMT)、咖啡酰辅酶A 3-O-甲基转移酶(CCoAOMT)、阿魏酸5-羟化酶(F5H)、肉桂醇脱氢酶(CAD)、肉桂酰辅酶A还原酶(CCR)、4-香豆酸酯-CoA连接酶(4CL)、单木酚-木脂蛋白特异性糖基转移酶和醛脱氢酶(ALDH)、如WO2008/064289中所公开的。本文公开的方法可用于产生与Cas1L同源的突变，以减少多糖乙酰化。

在US2015/0152398、US2016/0145631、US2015/089681、WO2016/205749和WO2016/196655中找到了用于本发明的其他方法和组合物。

实施例

还通过以下示例描述和证明本发明。但是，在说明书中任何地方使用这些和其他示例仅是说明性的，绝不限制本发明或任何示例性术语的范围和含义。同样，本发明不限于本文描述的任何特定的优选实施例。实际上，在阅读本说明书后，本发明的许多修改和变化对本领域技术人员而言是显而易见的，并且在不脱离本发明的精神或范围的情况下，可以进行各种变化。因此，本发明仅由所附权利要求的条款以及那些权利要求所赋予的等同物的全部范围来限制。

实施例1：用于植物优化表达的CasX和测量核酸内切酶活性的盒。

为了测试CasX核酸内切酶在植物细胞中的活性，将δ变形菌CasX蛋白序列(NCBI登录号MGPG01000094，SEQ ID NO：1)修改为在植物中最佳翻译起始的N末端MASS序列，紧接着是SV40 NLS序列和C-末端核糖核酸NLS序列，紧接着是用于抗体检测的HA标签，以形成2NLS-CRISPR/CasX(SEQ ID NO：5)。为了证明2NLS-CRISPR/CasX核酸内切酶在植物细胞中的活性，将这种优化的蛋白与密码子一起进行反翻译，以在植物中高效表达，然后置于强组成型表达盒中。设计了类似的盒，用于表达2NLS-CRISPR/CasX核酸内切酶，并具有与绿色荧光报道分子(SEQ ID NO：3)的C末端翻译融合。这些表达盒(SEQ ID NO：7&SEQ ID No：8)被克隆到最小的质粒载体主链，诸如pBlueScript主链。

产生第三质粒作为载体，以共递送用于测试核酸内切酶活性的游离型靶标。该载体包含针对tdTomato荧光报道分子的强组成型表达盒，随后是核酸内切酶靶标的克隆位点，之后是相对于tdTomato报道分子而言超出框架的mNeonGreen编码序列。靶位点的核酸内切酶裂解导致NHEJ修复，并且这些修复事件的一些频率将产生导致mNeonGreen蛋白表达的移码。通过比较表达tdTomato和mNeonGreen的细胞群体相对于仅表达tdTomato的细胞群体，可以测量在不同条件下，或不同核酸酶或不同向导RNA下的相对裂解效率。这种类型的测试构建体通常称为“交通灯报道分子”(TLR)。

实施例2：表达的2NLS-CRISPR/CasX的正确亚细胞定位和游离靶标的切割。

为了证明2NLS-CRISPR/CasX植物优化基因的稳健表达和正确的亚细胞定位，将含有2NLS-CRISPR/CasX-mNeonGreen表达盒(SEQ ID NO：8)的质粒用PEG转化为从幼叶中分离的原生质体转化为从玉米和烟草植物幼叶分离的原生质体，并监测亚细胞积累。mNeonGreen报道分子的强核信号表明核酸内切酶蛋白表达稳健且亚细胞定位正确。

为了证明CRISPR/CasX在单子叶植物和双子叶植物细胞中以及在植物优化温度下的活性，从玉米和本氏烟草植物的幼叶中分离了原生质体，并用含有2NLS-CRISPR/CasX表达盒和带有核酸内切酶靶标的TLR的载体进行了转化。另外，各种长度的5’-磷酸化的单链RNA被共转化为适当靶序列的向导RNA。转化后，将细胞在18℃和37℃之间的各种温度下孵育至少24小时(25℃至28℃是植物生长的最佳温度)。通过流式细胞术评估相对核酸酶活性，以比较表达tdTomato和mNeonGreen的细胞群相对于仅表达tdTomato的细胞群。

实施方案3：CRISPR/CasX在原生质体中的染色体位点靶向突变。

为了证明CRISPR/CasX在染色体靶标处诱导靶向突变的效用，从玉米植物的幼叶中分离原生质体并用含有2NLS-CRISPR/CasX或2NLS-CRISPR/CasX-mNeonGreen表达盒的载体转化。此外，将5’-磷酸化的单链RNA共转化为玉米基因组中适当靶序列的向导RNA。可通过基于PCR的检测，通过PCR扩增的靶标的靶向下一代测序(NGS；也称为深度测序)或通过整合的tdTomato荧光报道分子的信号缺失来鉴定靶标突变。

为了证明CRISPR/CasX在染色体靶标上诱导多重编辑事件的效用，通过两个5’-磷酸化的单链向导RNA分子的共转化重复了相同的实验。通过基于PCR的检测，通过PCR扩增的靶标的靶向NGS或通过整合tdTomato荧光报道分子的信号缺失来鉴定靶向突变。

实施方案4：CRISPR/CasX在再生组织中定向诱变染色体位点，随后进行植物再生和突变遗传。

为了证明使用CRISPR/CasX产生可遗传的基因编辑事件，将含有除草剂选择标记物的载体和含有2NLS-CRISPR/CasX表达盒的载体与5’-磷酸化的单链RNA一起轰击玉米愈伤组织，作为针对染色体靶标的向导RNA。从被轰击的组织中再生出小植物，并通过表型、基于PCR的测序方法和针对染色体靶标突变的测序方法进行筛选。带有目标突变的植物进行自交，后代进行突变遗传筛选。

实施方案5：CRISPR/CasX在原生质体中基因编辑的应用。

为了证明CRISPR/CasX在植物细胞中染色体靶标处进行基因编辑的效用，从玉米植物的幼叶中分离出原生质体，并用含有2NLS-CRISPR/CasX表达盒、5’-磷酸化的单链RNA的载体转化为适合染色体靶序列的向导RNA和用于染色体靶标正确修复的DNA修复模板。通过流式细胞术评估基因编辑，以鉴定表达源自模板的靶向修复的荧光报道分子信号的细胞数量。通过PCR扩增和测序确认正确的修复。

实施方案6：含有修饰碱基的向导RNA在用CRISPR/CasX进行原生质体中定向诱变的应用。

为了证明CRISPR/CasX与包含修饰碱基的向导RNA的组合使用，从玉米植物的幼叶中分离了原生质体，并用含有2NLS-CRISPR/CasX表达盒且带有或不带有具有核酸内切酶靶标的TLR的载体转化。此外，含有修饰碱基的5'-磷酸化单链RNA被共转化为适当靶序列的向导RNA。通过流式细胞术评估使用有和没有各种修饰的向导RNA的相对核酸酶活性，以将表达tdTomato和mNeonGreen的细胞群与仅表达tdTomato的细胞群进行比较。通过基于PCR的检测，通过PCR扩增的靶标的靶向NGS或通过整合的tdTomato荧光报道分子的信号缺失，评估染色体靶标处的核酸酶活性。

序列表

SEQ ID NO：1：来自δ变形菌(Deltaproteobacteria)的CRISPR/CasX，NCBI登录号MGPG01000094

SEQ ID NO：2：来自浮霉菌(Planctomycetes)的CasX，NCBI登录号MHYZ01000150

SEQ ID NO：3：来自δ变形菌(Deltaproteobacteria)的CRISPR/CasX与mNeonGreen融合

SEQ ID NO：4：与mNeonGreen融合的来自浮霉菌(Planctomycetes)的CasX

SEQ ID NO：5：来自δ变形菌(Deltaproteobacteria)的2NLS-CRISPR/CasX，具有N末端和C末端序列修饰，用于最佳翻译、核定位和抗体检测

SEQ ID NO：6：来自浮霉菌(Planctomycetes)的2NLS-CRISPR/CasX，具有N末端和C末端序列修饰，用于最佳翻译、核定位和抗体检测

SEQ ID NO：7：来自δ变形菌(Deltaproteobacteria)的CRISPR/CasX的强组成型表达盒；专有的强组成型启动子构型，可驱动此编码DNA序列的表达。

SEQ ID NO：8：与mNeonGreen融合的来自δ变形菌(Deltaproteobacteria)的CRISPR/CasX的强组成型表达盒；专有的强组成型启动子构型，可驱动此编码DNA序列的表达。

***本发明的范围不受本文所述的具体实施方案的限制。实际上，除了本文所描述那些之外，根据前述描述，本发明的各种修改对于本领域技术人员将变得显而易见。此类修改旨在落入所附权利要求书的范围内。

本文引用的所有专利、申请、出版物、测试方法、文献和其他材料通过引用整体并入本文，就如同物理上存在于本说明书中一样。

序列表

<110> KWS SAAT SE

<120> CRISPR-Cas核酸内切酶在植物基因组工程中的应用

<130> KWS0262PCT

<150> US 62/500,639

<151> 2017-05-03

<160> 8

<170> PatentIn version 3.5

<210> 1

<211> 977

<212> PRT

<213> delta proteobacterium

<400> 1

Val Ala Leu His Pro Arg Leu Glu Arg Lys Ile Lys Glu Phe Leu Pro

1 5 10 15

Thr Tyr Arg Leu Gly Val Asp Leu Gly Glu Ala Ala Gly Gly Leu Ala

20 25 30

Leu Ile His Asn Asn Asn Ile Leu His Ala Glu Thr Phe Thr Asp Phe

35 40 45

His Glu Ala Thr Leu Glu Thr Lys Arg Ala Leu Arg Arg Gly Arg Arg

50 55 60

Thr Arg His Ala Lys Lys Met Arg Leu Ala Arg Leu Arg Ser Trp Ile

65 70 75 80

Leu Arg Gln Cys Ile Pro Ala His Val Thr Gly Ala Glu Ile Lys Asp

85 90 95

Ser Tyr Ser Arg Leu Pro Asp Pro Tyr Arg Leu Met Lys Asp Lys Lys

100 105 110

Tyr Gln Thr Leu Pro Gly Phe Tyr Glu Val Lys Gly Gln Asn Pro Glu

115 120 125

Lys Ser Pro Thr Trp Ile Asp Lys Ala Lys Ala Gly Glu Val Asp Ala

130 135 140

Glu Gly Phe Val Ile Ala Leu Thr His Ile Leu Gln Lys Arg Gly Tyr

145 150 155 160

Lys Tyr Asp Gly Lys Glu Phe Ser Asp Tyr Asp Asp Ser Arg Leu Ile

165 170 175

Asp Phe Ile Asp Ser Cys Ala Met Leu Ala Glu Ala Pro Glu Met Arg

180 185 190

Lys Ala Leu Glu Asp Glu Ile Met Arg Arg Glu Val Gly Glu Lys Glu

195 200 205

Lys Pro Lys Leu His Glu Ala Phe Asp Asn Ala Leu Asn Arg Gln Arg

210 215 220

Glu Arg Lys Lys Ala Leu Pro Arg Gln Val Arg Glu Lys Asp Met Glu

225 230 235 240

Asp Met Val Asp Val Phe Gly Arg Arg Trp Gln Leu Ser Gln Glu Ile

245 250 255

Ile Ala Asn Trp Lys Ser Gln Leu Thr Gly Leu Leu Asn Lys Val Val

260 265 270

Arg Glu Ala Arg Tyr Asp Asn Arg Leu Lys Ser Gly Cys Ser Trp Cys

275 280 285

Gly Lys Lys Thr Pro Arg Leu Ala Lys Pro Glu Ile Arg Glu Leu Ala

290 295 300

Phe Glu Ala Ala Val Gly Asn Leu Arg Ile Arg Glu Arg Asp Gly Arg

305 310 315 320

Asp Arg Pro Ile Ser Asp Glu Glu Arg Asn Pro Leu Arg Gly Trp Phe

325 330 335

Gln Arg Arg Arg Glu Asn His Asp Tyr Ser Arg Ala Thr Lys Asn Thr

340 345 350

Pro Ile Glu Glu Arg Ala Pro Ser Glu Asp Asn Ile Arg Thr Tyr Leu

355 360 365

Glu Gln Ile Gly Val Lys Lys Ala Trp Ile Arg Lys Lys Lys Gly Lys

370 375 380

Glu Lys Trp Lys Phe Asp Phe Ala Met Leu Pro Gln Leu Asp Asn Leu

385 390 395 400

Ile Asn Lys Glu Ala Arg Lys Gly Arg Ala Arg Leu Cys Val Glu His

405 410 415

Met Arg Met Gln Ala Glu Gly Lys Thr Met Lys Asp Ala Asp Val Asp

420 425 430

Trp Gln Ser Met Arg Lys Arg Asn Ala Pro Asn Pro Arg Arg Glu Gln

435 440 445

His Asp Ala Arg Val Leu Lys Arg Ile Glu Arg Leu Ile Phe Asn Arg

450 455 460

Gly Lys Lys Gly Thr Asp Ala Trp Arg His Gly Pro Ile Ala Val Ile

465 470 475 480

Thr Leu Glu Val Pro Met Pro Val Asp Leu Glu Arg Ala Arg Glu Lys

485 490 495

Glu Gln Val Glu Arg Lys Pro Leu Asn Leu Arg Gln Arg Leu His Ala

500 505 510

Glu Thr Glu Gly Val Cys Ile Tyr Cys Gly Glu Asn Val His Asp Arg

515 520 525

Thr Met His Leu Glu His Ile Val Pro Gln Ala Lys Gly Gly Pro Asp

530 535 540

Val Gln Met Asn Arg Ile Ala Ser Cys Pro Lys Cys Asn Ala Asp Arg

545 550 555 560

Asp Thr Gly Lys Lys Asp Met Leu Pro Ser Glu Trp Leu Thr Gly Asp

565 570 575

Lys Trp Asn Val Phe Lys Ser Arg Val Met Ser Leu Asn Leu Pro Pro

580 585 590

Leu Lys Lys Gln Leu Leu Leu Leu Glu Pro Gly Ser Lys Tyr Pro Asn

595 600 605

Asp Pro Thr Pro Leu Ala Arg Val Ser Ala Arg Trp Arg Ala Phe Ala

610 615 620

Ala Asp Ile Met Trp Leu Phe Asp Glu Tyr Ser Val Pro Val Pro Thr

625 630 635 640

Leu Asn Tyr Glu Lys Asp Lys Pro His Ile Gln Val Val Arg Gly Asn

645 650 655

Leu Thr Ser Arg Leu Arg Arg Asp Trp Arg Trp Lys Asp His Glu Ala

660 665 670

Thr Val Glu Asn Phe Pro Asp Lys Arg Arg Thr Asp Leu Tyr Asn His

675 680 685

Ala Gln Asp Ala Ala Ile Leu Ala Ala Ile Pro Pro His Thr Trp Gln

690 695 700

Glu Gln Ile Phe Ser Asp Met Ala Val Arg Pro Cys Ala Lys Lys Asp

705 710 715 720

Glu Gln Gly Asn Ile Leu Lys Asn Glu Lys Glu Met Arg Pro Arg Pro

725 730 735

Gly Ile Ala Ala Leu Ala Leu Ala Pro Glu Trp Ala Asp Tyr Glu Arg

740 745 750

Thr Gln Lys Glu Leu Lys Arg Pro Met Val His Thr Leu Gly Lys Leu

755 760 765

Lys Ala Thr Trp Arg Arg Gln Ile Met Asp Leu Ser Phe Tyr Gln Asn

770 775 780

Pro Thr Asp Asn Asp Gly Pro Leu Phe Ile Arg Lys Val Asp Ala Lys

785 790 795 800

Thr Gly Lys Arg Glu Thr Lys Glu Val Gln Lys Gly Gly Leu Val Val

805 810 815

Gln Val Pro His Tyr Asp Gly Thr Ser Gly Lys Arg Lys Val Gln Ile

820 825 830

Lys Pro Ile Gln Ser Asn Ala Ile Ile Leu Trp His Asp Pro Ser Gly

835 840 845

Arg Lys Asp Asn Leu Asn Ile Ser Ile Glu Arg Pro Ala Ala Ile Lys

850 855 860

Lys Phe Val Lys His Pro Val Asp Pro Pro Ile Ala Ser Asp Ala Ile

865 870 875 880

Ile Leu Gly Arg Ile Glu Arg Ala Ser Thr Leu Trp Leu Arg Glu Gly

885 890 895

Lys Gly Thr Val Glu Leu Lys Ala Asp Lys Lys Ser Val Arg Ser Ser

900 905 910

Val Val Met Pro Glu Gly Ile Tyr Arg Val Lys Glu Leu Gly Ser Asn

915 920 925

Gly Val Ile Val Val Gln Glu Asn Ala Val Ser Lys Glu Leu Ala Asn

930 935 940

Lys Leu Gly Ile Ser Asp Asp Gln Phe Ser Lys Val Pro Glu Arg Ala

945 950 955 960

Leu Gly Lys Lys Glu Leu Ala Glu Tyr Phe Lys Gly Asn Gln Arg Ser

965 970 975

Gly

<210> 2

<211> 978

<212> PRT

<213> Planctomyces sp.

<400> 2

Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys

1 5 10 15

Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu

20 25 30

Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu

35 40 45

Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg

50 55 60

Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala

65 70 75 80

Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu

85 90 95

Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys

100 105 110

Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe

115 120 125

Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln

130 135 140

Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn

145 150 155 160

Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu

165 170 175

Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg

180 185 190

Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro

195 200 205

Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro

210 215 220

Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe

225 230 235 240

Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys

245 250 255

Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn

260 265 270

Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys

275 280 285

Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp

290 295 300

Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala

305 310 315 320

Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu

325 330 335

Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys

340 345 350

Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn

355 360 365

Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser

370 375 380

Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly

385 390 395 400

Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys

405 410 415

Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu

420 425 430

Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln

435 440 445

Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val

450 455 460

Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu

465 470 475 480

Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala

485 490 495

Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln

500 505 510

Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn

515 520 525

Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys

530 535 540

Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile

545 550 555 560

Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe

565 570 575

Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln

580 585 590

Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser

595 600 605

Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg

610 615 620

Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu

625 630 635 640

Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile

645 650 655

Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp

660 665 670

Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro

675 680 685

Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr

690 695 700

Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser

705 710 715 720

Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg

725 730 735

Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met

740 745 750

Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg

755 760 765

Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr

770 775 780

Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys

785 790 795 800

Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr

805 810 815

Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr

820 825 830

Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu

835 840 845

Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys

850 855 860

Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn

865 870 875 880

Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu

885 890 895

Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys

900 905 910

Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn

915 920 925

Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr

930 935 940

Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu

945 950 955 960

Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro

965 970 975

Ala Val

<210> 3

<211> 1213

<212> PRT

<213> 人工序列

<220>

<223> 与mNeonGreen融合的来自Deltaproteobacteria的CRISPR/CasX

<400> 3

Val Ala Leu His Pro Arg Leu Glu Arg Lys Ile Lys Glu Phe Leu Pro

1 5 10 15

Thr Tyr Arg Leu Gly Val Asp Leu Gly Glu Ala Ala Gly Gly Leu Ala

20 25 30

Leu Ile His Asn Asn Asn Ile Leu His Ala Glu Thr Phe Thr Asp Phe

35 40 45

His Glu Ala Thr Leu Glu Thr Lys Arg Ala Leu Arg Arg Gly Arg Arg

50 55 60

Thr Arg His Ala Lys Lys Met Arg Leu Ala Arg Leu Arg Ser Trp Ile

65 70 75 80

Leu Arg Gln Cys Ile Pro Ala His Val Thr Gly Ala Glu Ile Lys Asp

85 90 95

Ser Tyr Ser Arg Leu Pro Asp Pro Tyr Arg Leu Met Lys Asp Lys Lys

100 105 110

Tyr Gln Thr Leu Pro Gly Phe Tyr Glu Val Lys Gly Gln Asn Pro Glu

115 120 125

Lys Ser Pro Thr Trp Ile Asp Lys Ala Lys Ala Gly Glu Val Asp Ala

130 135 140

Glu Gly Phe Val Ile Ala Leu Thr His Ile Leu Gln Lys Arg Gly Tyr

145 150 155 160

Lys Tyr Asp Gly Lys Glu Phe Ser Asp Tyr Asp Asp Ser Arg Leu Ile

165 170 175

Asp Phe Ile Asp Ser Cys Ala Met Leu Ala Glu Ala Pro Glu Met Arg

180 185 190

Lys Ala Leu Glu Asp Glu Ile Met Arg Arg Glu Val Gly Glu Lys Glu

195 200 205

Lys Pro Lys Leu His Glu Ala Phe Asp Asn Ala Leu Asn Arg Gln Arg

210 215 220

Glu Arg Lys Lys Ala Leu Pro Arg Gln Val Arg Glu Lys Asp Met Glu

225 230 235 240

Asp Met Val Asp Val Phe Gly Arg Arg Trp Gln Leu Ser Gln Glu Ile

245 250 255

Ile Ala Asn Trp Lys Ser Gln Leu Thr Gly Leu Leu Asn Lys Val Val

260 265 270

Arg Glu Ala Arg Tyr Asp Asn Arg Leu Lys Ser Gly Cys Ser Trp Cys

275 280 285

Gly Lys Lys Thr Pro Arg Leu Ala Lys Pro Glu Ile Arg Glu Leu Ala

290 295 300

Phe Glu Ala Ala Val Gly Asn Leu Arg Ile Arg Glu Arg Asp Gly Arg

305 310 315 320

Asp Arg Pro Ile Ser Asp Glu Glu Arg Asn Pro Leu Arg Gly Trp Phe

325 330 335

Gln Arg Arg Arg Glu Asn His Asp Tyr Ser Arg Ala Thr Lys Asn Thr

340 345 350

Pro Ile Glu Glu Arg Ala Pro Ser Glu Asp Asn Ile Arg Thr Tyr Leu

355 360 365

Glu Gln Ile Gly Val Lys Lys Ala Trp Ile Arg Lys Lys Lys Gly Lys

370 375 380

Glu Lys Trp Lys Phe Asp Phe Ala Met Leu Pro Gln Leu Asp Asn Leu

385 390 395 400

Ile Asn Lys Glu Ala Arg Lys Gly Arg Ala Arg Leu Cys Val Glu His

405 410 415

Met Arg Met Gln Ala Glu Gly Lys Thr Met Lys Asp Ala Asp Val Asp

420 425 430

Trp Gln Ser Met Arg Lys Arg Asn Ala Pro Asn Pro Arg Arg Glu Gln

435 440 445

His Asp Ala Arg Val Leu Lys Arg Ile Glu Arg Leu Ile Phe Asn Arg

450 455 460

Gly Lys Lys Gly Thr Asp Ala Trp Arg His Gly Pro Ile Ala Val Ile

465 470 475 480

Thr Leu Glu Val Pro Met Pro Val Asp Leu Glu Arg Ala Arg Glu Lys

485 490 495

Glu Gln Val Glu Arg Lys Pro Leu Asn Leu Arg Gln Arg Leu His Ala

500 505 510

Glu Thr Glu Gly Val Cys Ile Tyr Cys Gly Glu Asn Val His Asp Arg

515 520 525

Thr Met His Leu Glu His Ile Val Pro Gln Ala Lys Gly Gly Pro Asp

530 535 540

Val Gln Met Asn Arg Ile Ala Ser Cys Pro Lys Cys Asn Ala Asp Arg

545 550 555 560

Asp Thr Gly Lys Lys Asp Met Leu Pro Ser Glu Trp Leu Thr Gly Asp

565 570 575

Lys Trp Asn Val Phe Lys Ser Arg Val Met Ser Leu Asn Leu Pro Pro

580 585 590

Leu Lys Lys Gln Leu Leu Leu Leu Glu Pro Gly Ser Lys Tyr Pro Asn

595 600 605

Asp Pro Thr Pro Leu Ala Arg Val Ser Ala Arg Trp Arg Ala Phe Ala

610 615 620

Ala Asp Ile Met Trp Leu Phe Asp Glu Tyr Ser Val Pro Val Pro Thr

625 630 635 640

Leu Asn Tyr Glu Lys Asp Lys Pro His Ile Gln Val Val Arg Gly Asn

645 650 655

Leu Thr Ser Arg Leu Arg Arg Asp Trp Arg Trp Lys Asp His Glu Ala

660 665 670

Thr Val Glu Asn Phe Pro Asp Lys Arg Arg Thr Asp Leu Tyr Asn His

675 680 685

Ala Gln Asp Ala Ala Ile Leu Ala Ala Ile Pro Pro His Thr Trp Gln

690 695 700

Glu Gln Ile Phe Ser Asp Met Ala Val Arg Pro Cys Ala Lys Lys Asp

705 710 715 720

Glu Gln Gly Asn Ile Leu Lys Asn Glu Lys Glu Met Arg Pro Arg Pro

725 730 735

Gly Ile Ala Ala Leu Ala Leu Ala Pro Glu Trp Ala Asp Tyr Glu Arg

740 745 750

Thr Gln Lys Glu Leu Lys Arg Pro Met Val His Thr Leu Gly Lys Leu

755 760 765

Lys Ala Thr Trp Arg Arg Gln Ile Met Asp Leu Ser Phe Tyr Gln Asn

770 775 780

Pro Thr Asp Asn Asp Gly Pro Leu Phe Ile Arg Lys Val Asp Ala Lys

785 790 795 800

Thr Gly Lys Arg Glu Thr Lys Glu Val Gln Lys Gly Gly Leu Val Val

805 810 815

Gln Val Pro His Tyr Asp Gly Thr Ser Gly Lys Arg Lys Val Gln Ile

820 825 830

Lys Pro Ile Gln Ser Asn Ala Ile Ile Leu Trp His Asp Pro Ser Gly

835 840 845

Arg Lys Asp Asn Leu Asn Ile Ser Ile Glu Arg Pro Ala Ala Ile Lys

850 855 860

Lys Phe Val Lys His Pro Val Asp Pro Pro Ile Ala Ser Asp Ala Ile

865 870 875 880

Ile Leu Gly Arg Ile Glu Arg Ala Ser Thr Leu Trp Leu Arg Glu Gly

885 890 895

Lys Gly Thr Val Glu Leu Lys Ala Asp Lys Lys Ser Val Arg Ser Ser

900 905 910

Val Val Met Pro Glu Gly Ile Tyr Arg Val Lys Glu Leu Gly Ser Asn

915 920 925

Gly Val Ile Val Val Gln Glu Asn Ala Val Ser Lys Glu Leu Ala Asn

930 935 940

Lys Leu Gly Ile Ser Asp Asp Gln Phe Ser Lys Val Pro Glu Arg Ala

945 950 955 960

Leu Gly Lys Lys Glu Leu Ala Glu Tyr Phe Lys Gly Asn Gln Arg Ser

965 970 975

Gly Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ser Leu Pro Ala

980 985 990

Thr His Glu Leu His Ile Phe Gly Ser Ile Asn Gly Val Asp Phe Asp

995 1000 1005

Met Val Gly Gln Gly Thr Gly Asn Pro Asn Asp Gly Tyr Glu Glu

1010 1015 1020

Leu Asn Leu Lys Ser Thr Lys Gly Asp Leu Gln Phe Ser Pro Trp

1025 1030 1035

Ile Leu Val Pro His Ile Gly Tyr Gly Phe His Gln Tyr Leu Pro

1040 1045 1050

Tyr Pro Asp Gly Met Ser Pro Phe Gln Ala Ala Met Val Asp Gly

1055 1060 1065

Ser Gly Tyr Gln Val His Arg Thr Met Gln Phe Glu Asp Gly Ala

1070 1075 1080

Ser Leu Thr Val Asn Tyr Arg Tyr Thr Tyr Glu Gly Ser His Ile

1085 1090 1095

Lys Gly Glu Ala Gln Val Lys Gly Thr Gly Phe Pro Ala Asp Gly

1100 1105 1110

Pro Val Met Thr Asn Ser Leu Thr Ala Ala Asp Trp Cys Arg Ser

1115 1120 1125

Lys Lys Thr Tyr Pro Asn Asp Lys Thr Ile Ile Ser Thr Phe Lys

1130 1135 1140

Trp Ser Tyr Thr Thr Gly Asn Gly Lys Arg Tyr Arg Ser Thr Ala

1145 1150 1155

Arg Thr Thr Tyr Thr Phe Ala Lys Pro Met Ala Ala Asn Tyr Leu

1160 1165 1170

Lys Asn Gln Pro Met Tyr Val Phe Arg Lys Thr Glu Leu Lys His

1175 1180 1185

Ser Lys Thr Glu Leu Asn Phe Lys Glu Trp Gln Lys Ala Phe Thr

1190 1195 1200

Asp Val Met Gly Met Asp Glu Leu Tyr Lys

1205 1210

<210> 4

<211> 1214

<212> PRT

<213> 人工序列

<220>

<223> 与mNeonGreen融合的来自Planctomycetes的CasX

<400> 4

Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys

1 5 10 15

Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu

20 25 30

Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu

35 40 45

Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg

50 55 60

Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala

65 70 75 80

Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu

85 90 95

Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys

100 105 110

Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe

115 120 125

Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln

130 135 140

Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn

145 150 155 160

Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu

165 170 175

Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg

180 185 190

Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro

195 200 205

Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro

210 215 220

Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe

225 230 235 240

Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys

245 250 255

Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn

260 265 270

Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys

275 280 285

Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp

290 295 300

Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala

305 310 315 320

Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu

325 330 335

Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys

340 345 350

Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn

355 360 365

Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser

370 375 380

Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly

385 390 395 400

Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys

405 410 415

Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu

420 425 430

Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln

435 440 445

Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val

450 455 460

Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu

465 470 475 480

Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala

485 490 495

Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln

500 505 510

Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn

515 520 525

Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys

530 535 540

Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile

545 550 555 560

Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe

565 570 575

Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln

580 585 590

Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser

595 600 605

Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg

610 615 620

Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu

625 630 635 640

Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile

645 650 655

Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp

660 665 670

Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro

675 680 685

Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr

690 695 700

Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser

705 710 715 720

Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg

725 730 735

Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met

740 745 750

Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg

755 760 765

Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr

770 775 780

Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys

785 790 795 800

Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr

805 810 815

Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr

820 825 830

Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu

835 840 845

Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys

850 855 860

Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn

865 870 875 880

Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu

885 890 895

Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys

900 905 910

Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn

915 920 925

Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr

930 935 940

Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu

945 950 955 960

Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro

965 970 975

Ala Val Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ser Leu Pro

980 985 990

Ala Thr His Glu Leu His Ile Phe Gly Ser Ile Asn Gly Val Asp Phe

995 1000 1005

Asp Met Val Gly Gln Gly Thr Gly Asn Pro Asn Asp Gly Tyr Glu

1010 1015 1020

Glu Leu Asn Leu Lys Ser Thr Lys Gly Asp Leu Gln Phe Ser Pro

1025 1030 1035

Trp Ile Leu Val Pro His Ile Gly Tyr Gly Phe His Gln Tyr Leu

1040 1045 1050

Pro Tyr Pro Asp Gly Met Ser Pro Phe Gln Ala Ala Met Val Asp

1055 1060 1065

Gly Ser Gly Tyr Gln Val His Arg Thr Met Gln Phe Glu Asp Gly

1070 1075 1080

Ala Ser Leu Thr Val Asn Tyr Arg Tyr Thr Tyr Glu Gly Ser His

1085 1090 1095

Ile Lys Gly Glu Ala Gln Val Lys Gly Thr Gly Phe Pro Ala Asp

1100 1105 1110

Gly Pro Val Met Thr Asn Ser Leu Thr Ala Ala Asp Trp Cys Arg

1115 1120 1125

Ser Lys Lys Thr Tyr Pro Asn Asp Lys Thr Ile Ile Ser Thr Phe

1130 1135 1140

Lys Trp Ser Tyr Thr Thr Gly Asn Gly Lys Arg Tyr Arg Ser Thr

1145 1150 1155

Ala Arg Thr Thr Tyr Thr Phe Ala Lys Pro Met Ala Ala Asn Tyr

1160 1165 1170

Leu Lys Asn Gln Pro Met Tyr Val Phe Arg Lys Thr Glu Leu Lys

1175 1180 1185

His Ser Lys Thr Glu Leu Asn Phe Lys Glu Trp Gln Lys Ala Phe

1190 1195 1200

Thr Asp Val Met Gly Met Asp Glu Leu Tyr Lys

1205 1210

<210> 5

<211> 1006

<212> PRT

<213> 人工序列

<220>

<223> N-和C-末端序列修改以优化翻译、核定位以及抗体检测的来自Deltaproteobacteria的2NLS-CRISPR/CasX

<400> 5

Met Ala Ser Ser Val Ala Leu His Pro Arg Leu Glu Arg Lys Ile Lys

1 5 10 15

Glu Phe Leu Pro Thr Tyr Arg Leu Gly Val Asp Leu Gly Glu Ala Ala

20 25 30

Gly Gly Leu Ala Leu Ile His Asn Asn Asn Ile Leu His Ala Glu Thr

35 40 45

Phe Thr Asp Phe His Glu Ala Thr Leu Glu Thr Lys Arg Ala Leu Arg

50 55 60

Arg Gly Arg Arg Thr Arg His Ala Lys Lys Met Arg Leu Ala Arg Leu

65 70 75 80

Arg Ser Trp Ile Leu Arg Gln Cys Ile Pro Ala His Val Thr Gly Ala

85 90 95

Glu Ile Lys Asp Ser Tyr Ser Arg Leu Pro Asp Pro Tyr Arg Leu Met

100 105 110

Lys Asp Lys Lys Tyr Gln Thr Leu Pro Gly Phe Tyr Glu Val Lys Gly

115 120 125

Gln Asn Pro Glu Lys Ser Pro Thr Trp Ile Asp Lys Ala Lys Ala Gly

130 135 140

Glu Val Asp Ala Glu Gly Phe Val Ile Ala Leu Thr His Ile Leu Gln

145 150 155 160

Lys Arg Gly Tyr Lys Tyr Asp Gly Lys Glu Phe Ser Asp Tyr Asp Asp

165 170 175

Ser Arg Leu Ile Asp Phe Ile Asp Ser Cys Ala Met Leu Ala Glu Ala

180 185 190

Pro Glu Met Arg Lys Ala Leu Glu Asp Glu Ile Met Arg Arg Glu Val

195 200 205

Gly Glu Lys Glu Lys Pro Lys Leu His Glu Ala Phe Asp Asn Ala Leu

210 215 220

Asn Arg Gln Arg Glu Arg Lys Lys Ala Leu Pro Arg Gln Val Arg Glu

225 230 235 240

Lys Asp Met Glu Asp Met Val Asp Val Phe Gly Arg Arg Trp Gln Leu

245 250 255

Ser Gln Glu Ile Ile Ala Asn Trp Lys Ser Gln Leu Thr Gly Leu Leu

260 265 270

Asn Lys Val Val Arg Glu Ala Arg Tyr Asp Asn Arg Leu Lys Ser Gly

275 280 285

Cys Ser Trp Cys Gly Lys Lys Thr Pro Arg Leu Ala Lys Pro Glu Ile

290 295 300

Arg Glu Leu Ala Phe Glu Ala Ala Val Gly Asn Leu Arg Ile Arg Glu

305 310 315 320

Arg Asp Gly Arg Asp Arg Pro Ile Ser Asp Glu Glu Arg Asn Pro Leu

325 330 335

Arg Gly Trp Phe Gln Arg Arg Arg Glu Asn His Asp Tyr Ser Arg Ala

340 345 350

Thr Lys Asn Thr Pro Ile Glu Glu Arg Ala Pro Ser Glu Asp Asn Ile

355 360 365

Arg Thr Tyr Leu Glu Gln Ile Gly Val Lys Lys Ala Trp Ile Arg Lys

370 375 380

Lys Lys Gly Lys Glu Lys Trp Lys Phe Asp Phe Ala Met Leu Pro Gln

385 390 395 400

Leu Asp Asn Leu Ile Asn Lys Glu Ala Arg Lys Gly Arg Ala Arg Leu

405 410 415

Cys Val Glu His Met Arg Met Gln Ala Glu Gly Lys Thr Met Lys Asp

420 425 430

Ala Asp Val Asp Trp Gln Ser Met Arg Lys Arg Asn Ala Pro Asn Pro

435 440 445

Arg Arg Glu Gln His Asp Ala Arg Val Leu Lys Arg Ile Glu Arg Leu

450 455 460

Ile Phe Asn Arg Gly Lys Lys Gly Thr Asp Ala Trp Arg His Gly Pro

465 470 475 480

Ile Ala Val Ile Thr Leu Glu Val Pro Met Pro Val Asp Leu Glu Arg

485 490 495

Ala Arg Glu Lys Glu Gln Val Glu Arg Lys Pro Leu Asn Leu Arg Gln

500 505 510

Arg Leu His Ala Glu Thr Glu Gly Val Cys Ile Tyr Cys Gly Glu Asn

515 520 525

Val His Asp Arg Thr Met His Leu Glu His Ile Val Pro Gln Ala Lys

530 535 540

Gly Gly Pro Asp Val Gln Met Asn Arg Ile Ala Ser Cys Pro Lys Cys

545 550 555 560

Asn Ala Asp Arg Asp Thr Gly Lys Lys Asp Met Leu Pro Ser Glu Trp

565 570 575

Leu Thr Gly Asp Lys Trp Asn Val Phe Lys Ser Arg Val Met Ser Leu

580 585 590

Asn Leu Pro Pro Leu Lys Lys Gln Leu Leu Leu Leu Glu Pro Gly Ser

595 600 605

Lys Tyr Pro Asn Asp Pro Thr Pro Leu Ala Arg Val Ser Ala Arg Trp

610 615 620

Arg Ala Phe Ala Ala Asp Ile Met Trp Leu Phe Asp Glu Tyr Ser Val

625 630 635 640

Pro Val Pro Thr Leu Asn Tyr Glu Lys Asp Lys Pro His Ile Gln Val

645 650 655

Val Arg Gly Asn Leu Thr Ser Arg Leu Arg Arg Asp Trp Arg Trp Lys

660 665 670

Asp His Glu Ala Thr Val Glu Asn Phe Pro Asp Lys Arg Arg Thr Asp

675 680 685

Leu Tyr Asn His Ala Gln Asp Ala Ala Ile Leu Ala Ala Ile Pro Pro

690 695 700

His Thr Trp Gln Glu Gln Ile Phe Ser Asp Met Ala Val Arg Pro Cys

705 710 715 720

Ala Lys Lys Asp Glu Gln Gly Asn Ile Leu Lys Asn Glu Lys Glu Met

725 730 735

Arg Pro Arg Pro Gly Ile Ala Ala Leu Ala Leu Ala Pro Glu Trp Ala

740 745 750

Asp Tyr Glu Arg Thr Gln Lys Glu Leu Lys Arg Pro Met Val His Thr

755 760 765

Leu Gly Lys Leu Lys Ala Thr Trp Arg Arg Gln Ile Met Asp Leu Ser

770 775 780

Phe Tyr Gln Asn Pro Thr Asp Asn Asp Gly Pro Leu Phe Ile Arg Lys

785 790 795 800

Val Asp Ala Lys Thr Gly Lys Arg Glu Thr Lys Glu Val Gln Lys Gly

805 810 815

Gly Leu Val Val Gln Val Pro His Tyr Asp Gly Thr Ser Gly Lys Arg

820 825 830

Lys Val Gln Ile Lys Pro Ile Gln Ser Asn Ala Ile Ile Leu Trp His

835 840 845

Asp Pro Ser Gly Arg Lys Asp Asn Leu Asn Ile Ser Ile Glu Arg Pro

850 855 860

Ala Ala Ile Lys Lys Phe Val Lys His Pro Val Asp Pro Pro Ile Ala

865 870 875 880

Ser Asp Ala Ile Ile Leu Gly Arg Ile Glu Arg Ala Ser Thr Leu Trp

885 890 895

Leu Arg Glu Gly Lys Gly Thr Val Glu Leu Lys Ala Asp Lys Lys Ser

900 905 910

Val Arg Ser Ser Val Val Met Pro Glu Gly Ile Tyr Arg Val Lys Glu

915 920 925

Leu Gly Ser Asn Gly Val Ile Val Val Gln Glu Asn Ala Val Ser Lys

930 935 940

Glu Leu Ala Asn Lys Leu Gly Ile Ser Asp Asp Gln Phe Ser Lys Val

945 950 955 960

Pro Glu Arg Ala Leu Gly Lys Lys Glu Leu Ala Glu Tyr Phe Lys Gly

965 970 975

Asn Gln Arg Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln

980 985 990

Ala Lys Lys Lys Lys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala

995 1000 1005

<210> 6

<211> 1007

<212> PRT

<213> 人工序列

<220>

<223> N-和C-末端序列修改以优化翻译、核定位以及抗体检测的来自Planctomycetes的2NLS-CRISPR/CasX

<400> 6

Met Ala Ser Ser Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg

1 5 10 15

Arg Leu Val Lys Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro

20 25 30

Met Lys Thr Leu Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg

35 40 45

Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser

50 55 60

Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu

65 70 75 80

Met Lys Lys Ala Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp

85 90 95

Pro Val Gly Leu Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile

100 105 110

Asp Gln Arg Lys Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr

115 120 125

Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr

130 135 140

Lys Leu Glu Gln Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe

145 150 155 160

Gly Arg Cys Asn Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro

165 170 175

His Lys Pro Glu Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys

180 185 190

Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu

195 200 205

Ser Asn His Pro Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys

210 215 220

Ala Ser Gly Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala

225 230 235 240

Val Ala Ser Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln

245 250 255

Lys Val Ile Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile

260 265 270

Ala Ser Ala Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln

275 280 285

Pro His Thr Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln

290 295 300

Ile Val Ile Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly

305 310 315 320

Arg Asp Glu Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe

325 330 335

Pro Leu Val Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val

340 345 350

Cys Asn Val Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val

355 360 365

Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro

370 375 380

Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg

385 390 395 400

Tyr Gln Phe Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu

405 410 415

Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys

420 425 430

Val Glu Gly Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser

435 440 445

Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys

450 455 460

Ala Ser Phe Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe

465 470 475 480

Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly

485 490 495

Lys Pro Phe Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly

500 505 510

Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val

515 520 525

Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys

530 535 540

Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe

545 550 555 560

Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val

565 570 575

Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe

580 585 590

Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu

595 600 605

Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr

610 615 620

Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala

625 630 635 640

Leu Thr Phe Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro

645 650 655

Met Asn Leu Ile Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile

660 665 670

Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser

675 680 685

Leu Gly Asn Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu

690 695 700

Lys Gln Arg Thr Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala

705 710 715 720

Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp

725 730 735

Asp Met Val Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr

740 745 750

Gln Asp Ala Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg

755 760 765

Gln Gly Lys Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu

770 775 780

Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr

785 790 795 800

Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn

805 810 815

Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys

820 825 830

Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu

835 840 845

Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln

850 855 860

Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu

865 870 875 880

Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu

885 890 895

Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu

900 905 910

Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln

915 920 925

Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu

930 935 940

Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg

945 950 955 960

Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu

965 970 975

Val Trp Lys Pro Ala Val Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly

980 985 990

Gln Ala Lys Lys Lys Lys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala

995 1000 1005

<210> 7

<211> 3560

<212> DNA

<213> Artificial Sequence

<220>

<223> 来自Deltaproteobacteria的CRISPR/CasX的强组成型表达盒

<400> 7

atggcgagca gcgtggcgct gcatccgcgc ctggaacgca aaattaaaga atttctgccg 60

acctatcgcc tgggcgtgga tctgggcgaa gcggcgggcg gcctggcgct gattcataac 120

aacaacattc tgcatgcgga aacctttacc gattttcatg aagcgaccct ggaaaccaaa 180

cgcgcgctgc gccgcggccg ccgcacccgc catgcgaaaa aaatgcgcct ggcgcgcctg 240

cgcagctgga ttctgcgcca gtgcattccg gcgcatgtga ccggcgcgga aattaaagat 300

agctatagcc gcctgccgga tccgtatcgc ctgatgaaag ataaaaaata tcagaccctg 360

ccgggctttt atgaagtgaa aggccagaac ccggaaaaaa gcccgacctg gattgataaa 420

gcgaaagcgg gcgaagtgga tgcggaaggc tttgtgattg cgctgaccca tattctgcag 480

aaacgcggct ataaatatga tggcaaagaa tttagcgatt atgatgatag ccgcctgatt 540

gattttattg atagctgcgc gatgctggcg gaagcgccgg aaatgcgcaa agcgctggaa 600

gatgaaatta tgcgccgcga agtgggcgaa aaagaaaaac cgaaactgca tgaagcgttt 660

gataacgcgc tgaaccgcca gcgcgaacgc aaaaaagcgc tgccgcgcca ggtgcgcgaa 720

aaagatatgg aagatatggt ggatgtgttt ggccgccgct ggcagctgag ccaggaaatt 780

attgcgaact ggaaaagcca gctgaccggc ctgctgaaca aagtggtgcg cgaagcgcgc 840

tatgataacc gcctgaaaag cggctgcagc tggtgcggca aaaaaacccc gcgcctggcg 900

aaaccggaaa ttcgcgaact ggcgtttgaa gcggcggtgg gcaacctgcg cattcgcgaa 960

cgcgatggcc gcgatcgccc gattagcgat gaagaacgca acccgctgcg cggctggttt 1020

cagcgccgcc gcgaaaacca tgattatagc cgcgcgacca aaaacacccc gattgaagaa 1080

cgcgcgccga gcgaagataa cattcgcacc tatctggaac agattggcgt gaaaaaagcg 1140

tggattcgca aaaaaaaagg caaagaaaaa tggaaatttg attttgcgat gctgccgcag 1200

ctggataacc tgattaacaa agaagcgcgc aaaggccgcg cgcgcctgtg cgtggaacat 1260

atgcgcatgc aggcggaagg caaaaccatg aaagatgcgg atgtggattg gcagagcatg 1320

cgcaaacgca acgcgccgaa cccgcgccgc gaacagcatg atgcgcgcgt gctgaaacgc 1380

attgaacgcc tgatttttaa ccgcggcaaa aaaggcaccg atgcgtggcg ccatggcccg 1440

attgcggtga ttaccctgga agtgccgatg ccggtggatc tggaacgcgc gcgcgaaaaa 1500

gaacaggtgg aacgcaaacc gctgaacctg cgccagcgcc tgcatgcgga aaccgaaggc 1560

gtgtgcattt attgcggcga aaacgtgcat gatcgcacca tgcatctgga acatattgtg 1620

ccgcaggcga aaggcggccc ggatgtgcag atgaaccgca ttgcgagctg cccgaaatgc 1680

aacgcggatc gcgataccgg caaaaaagat atgctgccga gcgaatggct gaccggcgat 1740

aaatggaacg tgtttaaaag ccgcgtgatg agcctgaacc tgccgccgct gaaaaaacag 1800

ctgctgctgc tggaaccggg cagcaaatat ccgaacgatc cgaccccgct ggcgcgcgtg 1860

agcgcgcgct ggcgcgcgtt tgcggcggat attatgtggc tgtttgatga atatagcgtg 1920

ccggtgccga ccctgaacta tgaaaaagat aaaccgcata ttcaggtggt gcgcggcaac 1980

ctgaccagcc gcctgcgccg cgattggcgc tggaaagatc atgaagcgac cgtggaaaac 2040

tttccggata aacgccgcac cgatctgtat aaccatgcgc aggatgcggc gattctggcg 2100

gcgattccgc cgcatacctg gcaggaacag atttttagcg atatggcggt gcgcccgtgc 2160

gcgaaaaaag atgaacaggg caacattctg aaaaacgaaa aagaaatgcg cccgcgcccg 2220

ggcattgcgg cgctggcgct ggcgccggaa tgggcggatt atgaacgcac ccagaaagaa 2280

ctgaaacgcc cgatggtgca taccctgggc aaactgaaag cgacctggcg ccgccagatt 2340

atggatctga gcttttatca gaacccgacc gataacgatg gcccgctgtt tattcgcaaa 2400

gtggatgcga aaaccggcaa acgcgaaacc aaagaagtgc agaaaggcgg cctggtggtg 2460

caggtgccgc attatgatgg caccagcggc aaacgcaaag tgcagattaa accgattcag 2520

agcaacgcga ttattctgtg gcatgatccg agcggccgca aagataacct gaacattagc 2580

attgaacgcc cggcggcgat taaaaaattt gtgaaacatc cggtggatcc gccgattgcg 2640

agcgatgcga ttattctggg ccgcattgaa cgcgcgagca ccctgtggct gcgcgaaggc 2700

aaaggcaccg tggaactgaa agcggataaa aaaagcgtgc gcagcagcgt ggtgatgccg 2760

gaaggcattt atcgcgtgaa agaactgggc agcaacggcg tgattgtggt gcaggaaaac 2820

gcggtgagca aagaactggc gaacaaactg ggcattagcg atgatcagtt tagcaaagtg 2880

ccggaacgcg cgctgggcaa aaaagaactg gcggaatatt ttaaaggcaa ccagcgcagc 2940

ggcaaacgcc cggcggcgac caaaaaagcg ggccaggcga aaaaaaaaaa atatccgtat 3000

gatgtgccgg attatgcgta atctagaggt acctgatcat gagtaattag ctcgaatttc 3060

cccgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 3120

gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 3180

tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 3240

tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 3300

tctatgttac tagatcgctc gacgcggccg ccatggcctc tagtggatca cctagggtcg 3360

atcgacaagc tcgagtttct ccataataat gtgtgagtag ttcccagata agggaattag 3420

ggttcctata gggtttcgct catgtgttga gcatataaga aacccttagt atgtatttgt 3480

atttgtaaaa tacttctatc aataaaattt ctaattccta aaaccaaaat ccagtactaa 3540

aatccagatc ccccgaatta 3560

<210> 8

<211> 4889

<212> DNA

<213> Artificial Sequence

<220>

<223> 与mNeonGreen融合的来自Deltaproteobacteria的CRISPR/CasX，强组成型表达盒

<400> 8

gtggcgctgc atccgcgcct ggaacgcaaa attaaagaat ttctgccgac ctatcgcctg 60

ggcgtggatc tgggcgaagc ggcgggcggc ctggcgctga ttcataacaa caacattctg 120

catgcggaaa cctttaccga ttttcatgaa gcgaccctgg aaaccaaacg cgcgctgcgc 180

cgcggccgcc gcacccgcca tgcgaaaaaa atgcgcctgg cgcgcctgcg cagctggatt 240

ctgcgccagt gcattccggc gcatgtgacc ggcgcggaaa ttaaagatag ctatagccgc 300

ctgccggatc cgtatcgcct gatgaaagat aaaaaatatc agaccctgcc gggcttttat 360

gaagtgaaag gccagaaccc ggaaaaaagc ccgacctgga ttgataaagc gaaagcgggc 420

gaagtggatg cggaaggctt tgtgattgcg ctgacccata ttctgcagaa acgcggctat 480

aaatatgatg gcaaagaatt tagcgattat gatgatagcc gcctgattga ttttattgat 540

agctgcgcga tgctggcgga agcgccggaa atgcgcaaag cgctggaaga tgaaattatg 600

cgccgcgaag tgggcgaaaa agaaaaaccg aaactgcatg aagcgtttga taacgcgctg 660

aaccgccagc gcgaacgcaa aaaagcgctg ccgcgccagg tgcgcgaaaa agatatggaa 720

gatatggtgg atgtgtttgg ccgccgctgg cagctgagcc aggaaattat tgcgaactgg 780

aaaagccagc tgaccggcct gctgaacaaa gtggtgcgcg aagcgcgcta tgataaccgc 840

ctgaaaagcg gctgcagctg gtgcggcaaa aaaaccccgc gcctggcgaa accggaaatt 900

cgcgaactgg cgtttgaagc ggcggtgggc aacctgcgca ttcgcgaacg cgatggccgc 960

gatcgcccga ttagcgatga agaacgcaac ccgctgcgcg gctggtttca gcgccgccgc 1020

gaaaaccatg attatagccg cgcgaccaaa aacaccccga ttgaagaacg cgcgccgagc 1080

gaagataaca ttcgcaccta tctggaacag attggcgtga aaaaagcgtg gattcgcaaa 1140

aaaaaaggca aagaaaaatg gaaatttgat tttgcgatgc tgccgcagct ggataacctg 1200

attaacaaag aagcgcgcaa aggccgcgcg cgcctgtgcg tggaacatat gcgcatgcag 1260

gcggaaggca aaaccatgaa agatgcggat gtggattggc agagcatgcg caaacgcaac 1320

gcgccgaacc cgcgccgcga acagcatgat gcgcgcgtgc tgaaacgcat tgaacgcctg 1380

atttttaacc gcggcaaaaa aggcaccgat gcgtggcgcc atggcccgat tgcggtgatt 1440

accctggaag tgccgatgcc ggtggatctg gaacgcgcgc gcgaaaaaga acaggtggaa 1500

cgcaaaccgc tgaacctgcg ccagcgcctg catgcggaaa ccgaaggcgt gtgcatttat 1560

tgcggcgaaa acgtgcatga tcgcaccatg catctggaac atattgtgcc gcaggcgaaa 1620

ggcggcccgg atgtgcagat gaaccgcatt gcgagctgcc cgaaatgcaa cgcggatcgc 1680

gataccggca aaaaagatat gctgccgagc gaatggctga ccggcgataa atggaacgtg 1740

tttaaaagcc gcgtgatgag cctgaacctg ccgccgctga aaaaacagct gctgctgctg 1800

gaaccgggca gcaaatatcc gaacgatccg accccgctgg cgcgcgtgag cgcgcgctgg 1860

cgcgcgtttg cggcggatat tatgtggctg tttgatgaat atagcgtgcc ggtgccgacc 1920

ctgaactatg aaaaagataa accgcatatt caggtggtgc gcggcaacct gaccagccgc 1980

ctgcgccgcg attggcgctg gaaagatcat gaagcgaccg tggaaaactt tccggataaa 2040

cgccgcaccg atctgtataa ccatgcgcag gatgcggcga ttctggcggc gattccgccg 2100

catacctggc aggaacagat ttttagcgat atggcggtgc gcccgtgcgc gaaaaaagat 2160

gaacagggca acattctgaa aaacgaaaaa gaaatgcgcc cgcgcccggg cattgcggcg 2220

ctggcgctgg cgccggaatg ggcggattat gaacgcaccc agaaagaact gaaacgcccg 2280

atggtgcata ccctgggcaa actgaaagcg acctggcgcc gccagattat ggatctgagc 2340

ttttatcaga acccgaccga taacgatggc ccgctgttta ttcgcaaagt ggatgcgaaa 2400

accggcaaac gcgaaaccaa agaagtgcag aaaggcggcc tggtggtgca ggtgccgcat 2460

tatgatggca ccagcggcaa acgcaaagtg cagattaaac cgattcagag caacgcgatt 2520

attctgtggc atgatccgag cggccgcaaa gataacctga acattagcat tgaacgcccg 2580

gcggcgatta aaaaatttgt gaaacatccg gtggatccgc cgattgcgag cgatgcgatt 2640

attctgggcc gcattgaacg cgcgagcacc ctgtggctgc gcgaaggcaa aggcaccgtg 2700

gaactgaaag cggataaaaa aagcgtgcgc agcagcgtgg tgatgccgga aggcatttat 2760

cgcgtgaaag aactgggcag caacggcgtg attgtggtgc aggaaaacgc ggtgagcaaa 2820

gaactggcga acaaactggg cattagcgat gatcagttta gcaaagtgcc ggaacgcgcg 2880

ctgggcaaaa aagaactggc ggaatatttt aaaggcaacc agcgcagcgg catggtgagc 2940

aaaggcgaag aagataacat ggcgagcctg ccggcgaccc atgaactgca tatttttggc 3000

agcattaacg gcgtggattt tgatatggtg ggccagggca ccggcaaccc gaacgatggc 3060

tatgaagaac tgaacctgaa aagcaccaaa ggcgatctgc agtttagccc gtggattctg 3120

gtgccgcata ttggctatgg ctttcatcag tatctgccgt atccggatgg catgagcccg 3180

tttcaggcgg cgatggtgga tggcagcggc tatcaggtgc atcgcaccat gcagtttgaa 3240

gatggcgcga gcctgaccgt gaactatcgc tatacctatg aaggcagcca tattaaaggc 3300

gaagcgcagg tgaaaggcac cggctttccg gcggatggcc cggtgatgac caacagcctg 3360

accgcggcgg attggtgccg cagcaaaaaa acctatccga acgataaaac cattattagc 3420

acctttaaat ggagctatac caccggcaac ggcaaacgct atcgcagcac cgcgcgcacc 3480

acctatacct ttgcgaaacc gatggcggcg aactatctga aaaaccagcc gatgtatgtg 3540

tttcgcaaaa ccgaactgaa acatagcaaa accgaactga actttaaaga atggcagaaa 3600

gcgtttaccg atgtgatggg catggatgaa ctgtataaaa tggtgagtaa aggagaagaa 3660

gataacatgg cttcgcttcc agccacacat gagcttcaca tcttcggttc catcaacggc 3720

gttgacttcg atatggtcgg acaaggcact gggaacccta atgacggata cgaagagctg 3780

aacctcaaga gcaccaaagg tgatcttcag ttttctccat ggattctggt gccacacatt 3840

ggctacggat tccatcaata ccttccatac cctgacggaa tgagtccatt ccaagcagcc 3900

atggttgatg gctccggata ccaagtccac aggacaatgc agtttgagga cggtgcttcg 3960

ctcaccgtca actaccgtta cacttacgaa gggagccaca tcaaaggaga agcccaagtg 4020

aaggggacag gctttcctgc tgatggacct gtcatgacca actccttaac tgccgctgat 4080

tggtgccggt ccaagaaaac ctaccctaac gacaagacca tcattagtac cttcaaatgg 4140

tcttacacca caggcaatgg caagagatat cgctctacag ccaggactac ctacacattc 4200

gctaaaccaa tggccgctaa ctaccttaag aaccaaccca tgtacgtgtt ccgtaagact 4260

gagttgaaac attccaagac cgaacttaac ttcaaggagt ggcagaaggc atttaccgac 4320

gtaatgggca tggatgaact atacaaataa tctagaggta cctgatcatg agtaattagc 4380

tcgaatttcc ccgatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt 4440

gccggtcttg cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt 4500

aacatgtaat gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta 4560

tacatttaat acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc 4620

gcggtgtcat ctatgttact agatcgctcg acgcggccgc catggcctct agtggatcac 4680

ctagggtcga tcgacaagct cgagtttctc cataataatg tgtgagtagt tcccagataa 4740

gggaattagg gttcctatag ggtttcgctc atgtgttgag catataagaa acccttagta 4800

tgtatttgta tttgtaaaat acttctatca ataaaatttc taattcctaa aaccaaaatc 4860

cagtactaaa atccagatcc cccgaatta 4889

Claims

1.一种用于修饰植物细胞中至少一个染色体基因或染色体外基因表达的方法，所述方法包含将以下项引入所述细胞中：

(a)(i)成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA)，或(ii)嵌合的cr/tracrRNA杂合体(sgRNA)，其中所述crRNA或sgRNA包含与该基因内的或由该基因编码的RNA分子内的靶序列互补的序列；以及

(b)CRISPR/CasX核酸内切酶分子，其中所述CRISPR/CasX核酸内切酶能够在所述crRNA或sgRNA所靶向的序列处、所靶向的序列之内或所靶向的序列附近引入双链断裂或单链断裂。

2.根据权利要求1所述的方法，其中所述crRNA包含约23个核苷酸的重复序列和约20个核苷酸的间隔区序列，其中所述间隔区序列与所述靶核酸相互作用。

3.根据权利要求1或权利要求2所述的方法，其中所述crRNA或tracrRNA或sgRNA包含非常规和/或修饰的核苷酸和/或包含非常规和/或修饰的主链化学成份。

4.根据权利要求3所述的方法，其中crRNA或tracrRNA或sgRNA包含一种或多种修饰，所述修饰选自：锁核酸(LNA)碱基、主链中的核苷酸间硫代磷酸酯键、2’-O-甲基RNA碱基、解锁核酸(UNA)碱基、5-甲基dC碱基、5-羟基丁炔-2’-脱氧尿苷碱基、5-硝基吲哚碱基、脱氧肌苷碱基、8-氮杂-7-脱氮鸟苷碱基、5’末端处的双脱氧-T、3’末端处的反向dT以及和3’末端处的双脱氧胞苷。

5.根据权利要求1或权利要求2所述的方法，其中将所述crRNA、tracrRNA或sgRNA作为编码所述RNA并与指导所述RNA在细胞中产生的启动子可操作地连接的DNA分子引入所述细胞中。

6.根据权利要求1至5中任一项所述的方法，其中所述CRISPR/CasX核酸内切酶分子是δ变形菌(Deltaproteobacteria)核酸内切酶或其突变体或衍生物。

7.根据权利要求1至5中任一项所述的方法，其中所述CRISPR/CasX核酸内切酶分子包含SEQ ID NO：1的氨基酸序列或与SEQ ID NO：1具有至少85％序列同一性的序列。

8.根据权利要求1至5中任一项所述的方法，其中，所述CRISPR/CasX核酸内切酶分子是浮霉菌(Planctomycetes)核酸内切酶或其突变体或衍生物。

9.根据权利要求1至5中任一项所述的方法，其中所述CRISPR/CasX核酸内切酶分子包含SEQ ID NO：2的氨基酸序列或与SEQ ID NO：2具有至少85％序列同一性的序列。

10.根据权利要求1至9中任一项所述的方法，其中所述CRISPR/CasX核酸内切酶分子被修饰以使其在不同于修饰前的最佳温度的温度具有活性。

11.根据权利要求10所述的方法，其中所述修饰的CRISPR/CasX核酸内切酶分子在适合于植物或植物细胞的生长和培养的温度具有活性。

12.根据权利要求10所述的方法，其中所述修饰的CRISPR/CasX核酸内切酶分子在约20℃至约35℃的温度具有活性。

13.根据权利要求12所述的方法，其中所述修饰的CRISPR/CasX核酸内切酶分子在约23℃至约32℃的温度具有活性。

14.根据权利要求13所述的方法，其中所述修饰的CRISPR/CasX核酸内切酶分子在约25℃至约28℃的温度具有活性。

15.根据权利要求1至14中任一项所述的方法，其中所述CRISPR/CasX核酸内切酶分子作为DNA分子被递送至所述细胞，所述DNA分子包含可操作地连接至指导所述CRISPR/CasX核酸内切酶在细胞中产生的启动子的CRISPR/CasX核酸内切酶编码序列。

16.根据权利要求15所述的方法，其中所述DNA分子瞬时存在于所述细胞中。

17.根据权利要求15所述的方法，其中所述DNA分子被稳定地掺入到所述细胞或祖先细胞的核基因组或质体基因组序列中，从而提供所述CRISPR/CasX核酸内切酶分子的可遗传的表达。

18.根据权利要求1至14中任一项所述的方法，其中所述CRISPR/CasX核酸内切酶分子作为编码所述CRISPR/CasX核酸内切酶的mRNA分子被递送至所述细胞。

19.根据权利要求1至14中任一项所述的方法，其中所述CRISPR/CasX核酸内切酶分子作为蛋白质被递送至所述细胞。

20.根据权利要求1-19中任一项所述的方法，其中所述CRISPR/CasX核酸内切酶分子包含一种或多种选自以下的元件：定位信号、检测标签、检测报道分子和纯化标签。

21.根据权利要求20所述的方法，其中所述CRISPR/CasX核酸内切酶分子包含一个或多个定位信号。

22.根据权利要求1至21中任一项所述的方法，其中所述CRISPR/CasX核酸内切酶分子包含至少一个具有酶促活性的另外的蛋白质结构域。

23.根据权利要求22所述的方法，其中所述至少一个另外的蛋白质结构域具有选自以下的酶活性：核酸外切酶、解旋酶、DNA双链断裂的修复、转录(共)激活物、转录(共)阻遏物、甲基化酶、脱甲基化酶及其任何组合。

24.根据权利要求1至4、6至14和19至23中任一项所述的方法，其中所述方法包含递送包含在引入所述细胞之前装载有所述crRNA/tracrRNA或sgRNA的所述CRISPR/CasX核酸内切酶分子的预组装复合物。

25.根据权利要求5和15至17中任一项所述的方法，其中所述启动子选自组成型启动子、诱导型启动子以及细胞型特异性启动子或组织型特异性启动子。

26.根据权利要求5和15至17中任一项所述的方法，其中所述启动子通过自杀外显子的选择性剪接而被激活。

27.根据权利要求1-26中任一项所述的方法，其中所述DNA或RNA通过选自以下的方法递送至所述细胞：微粒轰击、聚乙二醇(PEG)介导的转化、电穿孔、花粉管介导的合子引入和由一种或多种细胞穿透肽(CPP)介导的递送。

28.根据权利要求1至26中任一项所述的方法，其中所述DNA通过细菌介导的转化被递送至所述细胞。

29.根据权利要求28所述的方法，其中所述DNA在T-DNA中被递送至所述细胞，并且其中所述递送经由农杆菌(Agrobacterium)或剑菌(Ensifer)。

30.根据权利要求1至26中任一项所述的方法，其中所述DNA或RNA通过病毒递送至所述细胞。

31.根据权利要求30所述的方法，其中所述病毒是双生病毒或烟草脆裂病毒。

32.根据权利要求1至31中任一项所述的方法，其中所述植物是单子叶植物。

33.权利要求1至31中任一项所述的方法，其中所述植物是双子叶植物。

34.根据权利要求1至31中任一项所述的方法，其中所述植物细胞来源于选自以下的物种：大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、双色高粱(Sorghumbicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、谷子(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、黑小麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilopstauschii)、Daucus glochidiatus、甜菜(Beta vulgaris)、Daucus pusillus、Daucusmuricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、茸毛烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanumtuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythranteguttata、Genlisea aurea、黄瓜(Cucumis sativus)、桑树(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsisthaliana)、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalayawallichii)、弯曲碎米荠(Cardamine flexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、小拟南芥(Olmarabidopsis pumila)、硬毛南芥(Arabishirsute)、欧洲油菜(Brassica napus)、甘蓝(Brassica oleracea)、芜菁(Brassicarapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicaria subsp.sativa)、柑桔(Citrus sinensis)、麻风树(Jatrophacurcas)、毛果杨(Populus trichocarpa)、蒺藜苜蓿(Medicago truncatula)、Ciceryamashitae、野生鹰嘴豆(Cicer bijugum)、鹰嘴豆(Cicer arietinum)、Cicerreticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanusscarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、棉属(Gossypiumsp.)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏槿(Toreniafournieri)、洋葱(Allium cepa)、葱(Allium fistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus)和韭菜(Allium tuberosum)，以及属于上述植物之一的任何品种或亚种。

35.根据权利要求1至34中任一项所述的方法，其中所述靶序列选自由以下项组成的组：乙酰乳酸合酶(ALS)基因、烯醇丙酮酸磷酸合酶基因(EPSPS)基因、雄性育性基因、雄性不育基因、雌性育性基因、雌性不育基因、雄性恢复基因、雌性恢复基因、与不育性状有关的基因、与生育性状有关的基因、与除草剂抗性有关的基因、与除草剂耐受性有关的基因、与真菌抗性有关的基因、与病毒抗性有关的基因、与昆虫抗药性有关的基因抗性、与耐旱性有关的基因、与耐冷性有关的基因、与耐寒性相关的基因、与氮利用效率相关的基因、与磷利用效率相关的基因、与水利用效率相关的基因和与作物或生物质产量相关的基因、以及这些基因的任何突变体。

36.根据权利要求35所述的方法，其中雄性不育基因选自MS45、MS26和MSCA1。

37.根据权利要求1至36中任一项所述的方法修饰的植物细胞。

38.衍生自根据权利要求37所述的植物细胞的细胞、整株植物或其后代。

39.一种组合物，所述组合物包括：(a)(i)成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA)，或(ii)嵌合的cr/tracrRNA杂合体(sgRNA)，其中，所述crRNA或sgRNA靶向染色体植物基因序列或染色体外植物基因序列或靶向由所述基因编码的RNA分子内；和/或(b)CRISPR/CasX核酸内切酶分子，其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度，在crRNA或sgRNA靶向的序列处或其附近引入双链断裂或单链断裂。

40.根据权利要求39所述的组合物，其中所述crRNA包含约23个核苷酸的重复序列和约20个核苷酸的间隔区序列，其中所述间隔区序列与所述靶核酸相互作用。

41.根据权利要求39或权利要求40所述的组合物，其中所述crRNA或tracrRNA或sgRNA包含非常规和/或修饰的核苷酸和/或包含非常规和/或修饰的主链化学成份。

42.根据权利要求41所述的组合物，其中crRNA或tracrRNA或sgRNA包含一种或多种修饰，所述修饰选自：锁核酸(LNA)碱基、主链中的核苷酸间硫代磷酸酯键、2’-O-甲基RNA碱基、解锁核酸(UNA)碱基、5-甲基dC碱基、5-羟基丁炔-2’-脱氧尿苷碱基、5-硝基吲哚碱基、脱氧肌苷碱基、8-氮杂-7-脱氮鸟苷碱基、5’末端处的双脱氧-T、3’末端处的反向dT和3’末端处的双脱氧胞苷。

43.根据权利要求39至42中任一项所述的组合物，其中所述CRISPR/CasX核酸内切酶分子是δ变形菌(Deltaproteobacteria)核酸内切酶或其突变体或衍生物。

44.根据权利要求39至42中任一项所述的组合物，其中所述CRISPR/CasX核酸内切酶分子包含SEQ ID NO：1的氨基酸序列或与SEQ ID NO：1具有至少85％序列同一性的序列。

45.根据权利要求39至42中任一项所述的组合物，其中所述CRISPR/CasX核酸内切酶分子是浮霉菌(Planctomycetes)核酸内切酶或其突变体或衍生物。

46.根据权利要求39至42中任一项所述的组合物，其中所述CRISPR/CasX核酸内切酶分子包含SEQ ID NO：2的氨基酸序列或与SEQ ID NO：2具有至少85％序列同一性的序列。

47.根据权利要求39至46中任一项所述的组合物，其中所述CRISPR/CasX核酸内切酶分子被修饰以使其在不同于修饰前的最佳温度的温度具有活性。

48.根据权利要求47所述的组合物，其中所述修饰的CRISPR/CasX核酸内切酶分子在适合于植物或植物细胞的生长和培养的温度具有活性。

49.根据权利要求47所述的组合物，其中所述修饰的CRISPR/CasX核酸内切酶分子在约20℃至约35℃的温度具有活性。

50.根据权利要求49所述的组合物，其中所述修饰的CRISPR/CasX核酸内切酶分子在约23℃至约32℃的温度具有活性。

51.根据权利要求50所述的组合物，其中所述修饰的CRISPR/CasX核酸内切酶分子在约25℃至约28℃的温度具有活性。

52.根据权利要求39至51中任一项所述的组合物，其中所述CRISPR/CasX核酸内切酶分子包含一种或多种选自以下的元件：定位信号、检测标签、检测报道分子和纯化标签。

53.根据权利要求39至52中任一项所述的组合物，其中所述CRISPR/CasX核酸内切酶分子被修饰为表达切口酶活性或具有核酸靶向活性而没有任何切口酶或核酸内切酶活性。

54.根据权利要求39至53中任一项所述的组合物，其中所述CRISPR/CasX核酸内切酶分子包含至少一个具有酶促活性的另外的蛋白质结构域。

55.根据权利要求54所述的组合物，其中所述至少一个另外的蛋白质结构域具有选自以下的酶活性：核酸外切酶、解旋酶、DNA双链断裂的修复、转录(共)激活物、转录(共)阻遏物、甲基化酶、脱甲基化酶及其任何组合。

56.根据权利要求39至55中任一项所述的组合物，其中所述靶序列选自以下的植物序列：乙酰乳酸合酶(ALS)基因、烯醇丙酮酸磷酸合酶基因(EPSPS)基因、雄性育性基因、雄性不育基因、雌性育性基因、雌性不育基因、雄性恢复基因、雌性恢复基因、与不育性状有关的基因、与生育性状有关的基因、与除草剂抗性有关的基因、与除草剂耐受性有关的基因、与真菌抗性有关的基因、与病毒抗性有关的基因、与昆虫抗药性有关的基因抗性、与耐旱性有关的基因、与耐冷性有关的基因、与耐寒性相关的基因、与氮利用效率相关的基因、与磷利用效率相关的基因、与水分利用效率相关的基因和与作物或生物质产量相关的基因、以及这些基因的任何突变体。

57.根据权利要求56所述的组合物，其中雄性不育基因选自MS45、MS26和MSCA1。

58.根据权利要求39至57中任一项所述的组合物，其中所述植物是单子叶植物。

59.权利要求39至57中任一项所述的组合物，其中所述植物是双子叶植物。

60.根据权利要求39至57中任一项所述的组合物，其中所述植物细胞来源于选自以下的物种：大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、双色高粱(Sorghumbicolor)、甘蔗(Saccharum officinarium)、玉米(Zea mays)、谷子(Setaria italica)、小粒野生稻(Oryza minuta)、水稻(Oriza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secale cereale)、黑小麦(Triticale)、苹果(Malus domestica)、二穗短柄草(Brachypodium distachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilopstauschii)、Daucus glochidiatus、甜菜(Beta vulgaris)、Daucus pusillus、Daucusmuricatus、野胡萝卜(Daucus carota)、巨桉(Eucalyptus grandis)、美花烟草(Nicotianasylvestris)、茸毛烟草(Nicotiana tomentosiformis)、普通烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanum lycopersicum)、马铃薯(Solanumtuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythranteguttata、Genlisea aurea、黄瓜(Cucumis sativus)、桑树(Morus notabilis)、Arabidopsis arenosa、琴叶拟南芥(Arabidopsis lyrata)、拟南芥(Arabidopsisthaliana)、须弥芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalayawallichii)、弯曲碎米荠(Cardamine flexuosa)、北美独行菜(Lepidium virginicum)、荠菜(Capsella bursa pastoris)、小拟南芥(Olmarabidopsis pumila)、硬毛南芥(Arabishirsute)、欧洲油菜(Brassica napus)、甘蓝(Brassica oleracea)、芜菁(Brassicarapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncacea)、黑芥菜(Brassica nigra)、芝麻菜(Eruca vesicaria subsp.sativa)、柑桔(Citrus sinensis)、麻风树(Jatrophacurcas)、毛果杨(Populus trichocarpa)、蒺藜苜蓿(Medicago truncatula)、Ciceryamashitae、野生鹰嘴豆(Cicer bijugum)、鹰嘴豆(Cicer arietinum)、Cicerreticulatum、Cicer judaicum、木豆(Cajanus cajanifolius)、蔓草虫豆(Cajanusscarabaeoides)、菜豆(Phaseolus vulgaris)、大豆(Glycine max)、棉属(Gossypiumsp.)、紫云英(Astragalus sinicus)、百脉根(Lotus japonicas)、夏槿(Toreniafournieri)、洋葱(Allium cepa)、葱(Allium fistulosum)、大蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus)和韭菜(Allium tuberosum)，以及属于上述植物之一的任何品种或亚种。

61.一种试剂盒，所述试剂盒包括：(a)(i)成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA)，或(ii)嵌合的cr/tracrRNA杂合体(sgRNA)，其中所述crRNA或sgRNA靶向植物基因内或所述基因编码的RNA分子内的序列；(b)CRISPR/CasX核酸内切酶分子，其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度，在crRNA或sgRNA靶向的序列处或其附近引入双链断裂或单链断裂，以及任选的(c)使用说明。

62.一种试剂盒，所述试剂盒包括：(a)(i)编码成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)和反式激活的crRNA(tracrRNA)的核酸分子，或(ii)编码嵌合cr/tracrRNA杂合体的核酸分子(sgRNA)，其中所述crRNA或sgRNA靶向植物基因内或由所述基因编码的RNA分子内的序列；(b)编码CRISPR/CasX核酸内切酶分子的核酸分子，其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度，在所述crRNA或sgRNA靶向的所述序列处或其附近引入双链断裂或单链断裂，以及任选的(c)的使用说明。

63.一种试剂盒，所述试剂盒包括：(a)(i)编码成簇的规律间隔的短回文重复序列(CRISPR)RNA(crRNA)的核酸分子和编码反式激活的crRNA(tracrRNA)的核酸分子，或(ii)编码嵌合cr/tracrRNA杂合体的核酸分子(sgRNA)，其中所述crRNA或sgRNA靶向植物基因内或由所述基因编码的RNA分子内的序列；(b)编码CRISPR/CasX核酸内切酶分子的核酸分子，其中所述CRISPR/CasX核酸内切酶能够在适合于植物或植物细胞生长和培养的温度，在所述crRNA或sgRNA靶向的序列处或其附近引入双链断裂或单链断裂，以及任选的(c)的使用说明。