CN107667171A

CN107667171A - 真菌基因组修饰系统及使用方法

Info

Publication number: CN107667171A
Application number: CN201580076187.6A
Authority: CN
Inventors: B·S·鲍尔; J·陈; 葛晶; X·顾; S·M·马德里; D·宋; M·宋; M·沃德
Original assignee: Danisco USA Inc
Current assignee: Danisco USA Inc; Danisco US Inc
Priority date: 2014-12-16
Filing date: 2015-12-15
Publication date: 2018-02-06
Also published as: MX2017008036A; BR112017012850A2; MX2017007928A; US20180002710A1; AU2015364632A1; JP6814141B2; KR102350404B1; DK3234152T3; KR20170089931A; US20170369891A1; EP3234152B1; WO2016100568A1; EP3234151A1; AU2015364629A1; WO2016100272A1; CA2971187A1; US20190093114A1; JP6814143B2; CA2971248A1; JP2018504895A

Abstract

提供了用于在丝状真菌细胞的基因组中的靶位点处进行基因组修饰的组合物和方法。这些方法和组合物涉及用于对该靶位点进行修饰或改变的指导多核苷酸/Cas内切核酸酶系统。还提供了其中正在被修饰的丝状真菌细胞具有缺陷的非重组末端连接途径的方面。

Description

真菌基因组修饰系统及使用方法

相关申请的交叉引用

本申请要求均于2014年12月16日提交的PCT专利申请序列号PCT/CN 2014/093914、PCT/CN 2014/093916和PCT/CN 2014/093918的优先权，这些专利通过引用以其全文特此结合。

序列表

将按照37 C.F.R.§1.52(e)、经由EFS提交的序列表通过引用结合在此。经由EFS提交的序列表文本文件包含于2015年12月3日创建的文件“40532-WO-PCT-4_2015-832final_ST25.txt”，其大小为165千字节。

发明背景

细菌和古细菌已经进化了适应性免疫防御，被称为成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)系统，该Cas系统能以序列特异性方式在DNA中引入双链断裂。Cas系统通过包括短RNA序列(tracrRNA和crRNA)和RNA依赖性内切核酸酶(Cas内切核酸酶)的核糖核蛋白复合物的活性执行它们的功能，该RNA依赖性内切核酸酶靶向特定DNA序列(通过与crRNA的一部分的同源性，被称为可变靶向结构域)并且在靶标中产生双链断裂。CRISPR基因座首先在大肠杆菌(E.coli)中被识别(Ishino等人(1987)J.Bacterial.[细菌学杂志]169:5429-5433；Nakata等人(1989)J.Bacterial.[细菌学杂志]171:3553-3556)，其中相似的散置的短序列重复随后在许多细菌物种中被鉴定出，这些细菌物种包括但不限于地中海富盐菌(Haloferax mediterranei)、化脓性链球菌(Streptococcus pyogenes)、鱼腥藻(Anabaena)和结核分枝杆菌(Mycobacterium tuberculosis)(Groenen等人(1993)Mol.Microbiol.[分子微生物学]10:1057-1065；Hoe等人(1999)Emerg.Infect.Dis.[新发传染病]5:254-263；Masepohl等人(1996)Biochim.Biophys.Acta[生物化学生物物理学报]1307:26-30；Mojica等人(1995)Mol.Microbiol.[分子微生物学]17:85-93)。

众所周知，在基因组DNA中的特定靶位点处诱导剪切可以用于在该位点处或附近引入修饰。例如，当靶向的DNA位点含有双链断裂时，已显示用于基因靶向的同源重组被增强(参见，例如Rudin等人，Genetics[遗传学]122:519-534；Smih等人，Nucl.Acids Res.[核酸研究]23:5012-5019)。鉴于Cas系统的位点特异性性质，已经描述了基于这些系统的基因组修饰/工程化技术，包括在哺乳动物细胞中的那些(参见，例如Hsu等人；Cell[细胞]第157卷，p1262-1278，2014年6月5日，标题为“用于基因组工程的CRISPR-Cas9的开发与应用(Development and Applications of CRISPR-Cas9for Genome Engineering)”)。基于Cas的基因组工程的功能来自于通过设计重组crRNA(或等效功能的多核苷酸)(其中crRNA的DNA靶向区域(可变靶向结构域)与基因组内所希望的靶位点同源)并且将其与Cas内切核酸酶(通过任何方便的方法)组合成宿主细胞中的功能性复合物来靶向复杂基因组内几乎任何特定位置的能力。

虽然已经将基于Cas的基因组工程技术应用于许多不同的宿主细胞类型，但是在真菌细胞中有效利用这样的系统已被证明是困难的。因此，仍然需要开发有效率且有效的基于Cas的基因组工程方法和用于修饰/改变真菌细胞中的基因组靶位点的组合物。

简要概述

提供了使用促进供体DNA与真菌细胞(例如丝状真菌细胞)中的基因组座位的同源重组的指导RNA/Cas内切核酸酶系统的组合物和方法。

本披露的方面涉及供体DNA与真菌细胞中的基因组座位进行同源重组的方法。在一些实施例中，该方法包括：a)向真菌细胞的群体中引入Cas内切核酸酶、指导RNA和供体DNA，该供体DNA包含与真菌细胞的基因组座位具有同源性的区域，其中该Cas内切核酸酶和指导RNA能够形成使得Cas内切核酸酶能够在真菌细胞的基因组座位中或附近的靶位点处起作用的复合物；并且b)从群体中鉴定至少一个供体DNA与基因组座位已经发生同源重组的真菌细胞，其中Cas内切核酸酶、指导RNA或两者被瞬时地引入真菌细胞的群体中。

在一个方面中，本披露涉及供体DNA与真菌细胞中的基因组座位进行同源重组的方法，该方法包括：a)向真菌细胞中引入Cas内切核酸酶、指导RNA和供体DNA，该供体DNA包含与真菌细胞的基因组座位具有同源性的区域，其中该Cas内切核酸酶和指导RNA能够形成使得Cas内切核酸酶能够在真菌细胞的基因组座位中或附近的靶位点处起作用的复合物；并且b)鉴定在真菌细胞中供体DNA与基因组座位是否已经发生了同源重组，其中Cas内切核酸酶、指导RNA或两者被瞬时地引入真菌细胞的群体中。

我们已发现，在一些实施例中，在真菌细胞中抑制在靶位点处(即，Cas内切核酸酶活性的位点)的非同源末端连接(NHEJ)机制或使其失活增强了供体DNA在基因组座位处的同源重组。因此，本发明的方面包括在真菌细胞中的靶位点处的非同源末端连接(NHEJ)机制是未激活的、无功能的或减弱的条件下进行如本文所述的同源重组方法。

在丝状真菌细胞中的靶位点处致使NHEJ途径无功能(失活)或减少NHEJ途径能以任何方便的方式实现，并且可以是宿主细胞的长期(或稳定)表型或短期(或瞬时)表型。例如，NHEJ途径的长期失活可以通过涉及NHEJ途径的一个或多个基因的染色体遗传改变来实现，使得其活性与宿主细胞相比被减少或消除(例如，在NHEJ途径中的基因缺失)。这导致获得具有希望的遗传改变(供体DNA和在希望的位置处的基因组DNA之间的同源重组)的子代细胞，该子代细胞仍然具有无功能/失活或减少的NHEJ途径。可替代地，阻断宿主细胞中靶位点处的NHEJ途径的功能或使其减少可以暂时地进行。例如，NHEJ途径的瞬时失活可以通过向宿主细胞中引入表达抑制性RNA或显性负性蛋白质的瞬时重组DNA构建体来实现，该抑制性RNA或显性负性蛋白质的表达抑制NHEJ途径的一种或多种特异性组分的表达或活性。

在获得具有希望的遗传改变的子代细胞后，可以从子代细胞中消除瞬时重组DNA构建体，例如通过去除用于维持瞬时重组DNA构建体的选择压力。以这种方式，希望的子代细胞将具有正常功能的NHEJ途径。可以被致使无功能或具有减少的活性的NHEJ途径组分的实例包括ku80、ku70、rad50、mre11、xrs2、lig4、xrs或其任何希望的组合。在一个具体实施例中，真菌细胞具有失活或减少的ku80的表达和/或活性。这里应当注意的是，当涉及NHEJ途径的特定组分时，术语“无功能”涵盖组分不存在于细胞中(例如通过基因缺失)的情况以及组分存在但是无功能(例如，无功能的突变蛋白质)的情况。

可替代地，人们可以使用具有切口内切核酸酶活性(即在靶位点处仅切割一条DNA链；本文中也被称为Cas切口酶)而不是双链断裂活性的Cas内切核酸酶。在靶位点处诱导缺口不像双链断裂那样在靶位点处激活NHEJ途径，但是确实改善了目的基因组座位(包含Cas切口酶的靶位点或在其附近的基因组座位)和供体DNA之间的同源重组。Cas切口酶的实例包括如下所述的Cas内切核酸酶变体。

已经描述了若干种不同类型的CRISPR-Cas系统，并且这些CRISPR-Cas系统可以被分类为I型、II型和III型CRISPR-Cas系统(参见，例如Liu和Fan，CRISPR-Cas system:apowerful tool for genome editing[CRISPR-Cas系统：用于基因组编辑的有力工具]，Plant Mol Biol[植物分子生物学](2014)85:209-218中的描述)。在某些方面，CRISPR-Cas系统是使用Cas9内切核酸酶或其变体(包括例如Cas切口酶)的II型CRISPR-Cas系统。Cas9内切核酸酶可以是任何方便的Cas9内切核酸酶，包括但不限于来自以下细菌物种的Cas9内切核酸酶及其功能片段：链球菌属(Streptococcus)物种(例如，化脓性链球菌(S.pyogenes)、变异链球菌(S.mutans)和嗜热链球菌(S.thermophilus))；弯曲杆菌属物种(Campylobacter)物种(例如，空肠弯曲杆菌(C.jejuni))；奈瑟氏菌属(Neisseria)物种(例如，脑膜炎奈瑟球菌(N.meningitides))；弗朗西斯氏菌属(Francisella)物种(例如，新凶手弗朗西斯菌(F.novicida))；以及巴斯德氏菌属(Pasteurella)物种(例如，多杀巴斯德菌(P.multocida))。可以使用许多其他种类的Cas9。例如，可以使用含有与SEQ ID NO:45和48至53中任一项具有至少70％同一性的氨基酸序列的功能性Cas9内切核酸酶或其变体，例如与SEQ ID NO:45和48至53中的任一项具有至少80％同一性、至少90％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性、并且包括多达100％同一性。

在某些实施例中，将Cas内切核酸酶和/或指导RNA引入真菌细胞中包括将一种或多种DNA构建体引入到真菌细胞中，该DNA构建体包含用于Cas内切核酸酶的表达盒、指导RNA或两者。该一种或多种DNA构建体一旦在真菌细胞中就表达Cas内切核酸酶和/或指导RNA。在某些实施例中，DNA构建体是环状DNA构建体，其包括：Cas内切核酸酶的表达盒、指导RNA的表达盒和供体DNA，其中Cas内切核酸酶可以是双链断裂Cas内切核酸酶或Cas切口酶。

在某些实施例中，该引入步骤包括将Cas内切核酸酶多肽、指导RNA或两者直接引入真菌细胞中。可以使用直接引入和使用DNA构建体的任何组合(例如，根据需要同时或依次地将具有用于Cas内切核酸酶的表达盒的DNA构建体引入真菌细胞中并且将指导RNA直接引入细胞中)。

在某些本文所述的方法中，在DNA构建体中的Cas表达盒包括为了在真菌细胞中表达而优化的Cas内切核酸酶编码基因。例如，为了在丝状真菌细胞中表达而优化的Cas内切核酸酶编码基因包括与SEQ ID NO:44具有至少70％序列同一性的序列(编码来自化脓性链球菌的Cas9；SEQ ID NO:45)。

在一些情况下，Cas内切核酸酶有效地连接到一个或多个核靶向信号(也被称为核定位信号/序列；NLS)。SEQ ID NO:7和SEQ ID NO:8分别提供了在N-末端和C-末端具有NLS序列的丝状真菌细胞优化的Cas9基因和所编码的氨基酸序列的实例。许多不同的NLS在真核生物中是已知的。它们包括单分型、双分型和三分型。可以使用任何适合的NLS，单分型略微更适合，其中实例包括SV40NLS、来自里氏木霉blr2(蓝光调节剂2)基因的NLS、或两者的组合。

在某些实施例中，供体DNA包含目的多核苷酸序列，并且其中在基因组座位处的同源重组导致将目的多核苷酸序列插入基因组座位中。

在这些方法的一些实施例中，引入步骤包括向真菌细胞中引入包含编码如本文所述的可选择标记或表型标记的序列的DNA构建体。在某些实施例中，DNA构建体包含编码可选择标记的序列和供体DNA两者。在一些实施例中，DNA构建体包含编码Cas内切核酸酶的序列、编码可选择标记的序列和供体DNA。在一些实施例中，DNA构建体包含编码指导RNA的序列、编码可选择标记的序列和供体DNA。在具体实施例中，DNA构建体包含编码Cas内切核酸酶的序列、编码指导RNA的序列、编码可选择标记的序列和供体DNA。在某些实施例中，DNA构建体是线性DNA构建体。在某些实施例中，DNA构建体是环状DNA构建体。

可用于本发明方法中的真菌细胞可以是丝状真菌细胞种类。在某些实施例中，该真菌细胞是真菌亚门(Eumycotina)或盘菌亚门(Pezizomycotina)真菌细胞。在一些实施例中，真菌细胞选自木霉属(Trichoderma)、青霉属(Penicillium)、曲霉属(Aspergillus)、腐质霉属(Humicola)、金孢子菌属(Chrysosporium)、镰孢属(Fusarium)、脉孢菌属(Neurospora)、毁丝霉属(Myceliophthora)、嗜热真菌属(Thermomyces)、肉座菌属(Hypocrea)、和裸胞壳属(Emericella)。特别感兴趣的是丝状真菌里氏木霉(Trichodermareesei)、产黄青霉(P.chrysogenum)、嗜热毁丝霉(M.thermophila)、疏棉状嗜热丝孢菌(Thermomyces lanuginosus)、米曲霉(A.oryzae)和黑曲霉(A.niger)。还可以使用其他真菌细胞，包括酵母的物种。

由所披露方法的使用者选择的靶位点可以位于目的基因的选自下组的区域中，该组由以下各项组成：可读框、启动子、调节序列、终止序列、调节元件序列、剪接位点、编码序列、聚泛素化位点、内含子位点和内含子增强基序。目的基因的实例包括编码以下各项的基因：乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。与参与细胞信号传导、形态学、生长速率和蛋白质分泌的基因一样，编码调节蛋白(例如转录因子、抑制子、调节其他蛋白质(例如激酶)的蛋白质、参与翻译后修饰(例如糖基化)的蛋白质)的靶基因可以经受Cas介导的编辑。在这方面不旨在限制。

在某些实施例中，供体DNA与基因组座位的同源重组导致靶序列处或附近的DNA序列的修饰，其中该修饰选自下组，该组由以下各项组成：一个或多个核苷酸的缺失、一个或多个核苷酸的插入、编码目的蛋白质的表达盒的插入、一个或多个核苷酸的取代、及其任何组合。在一些实施例中，该修饰最初存在于供体DNA中。在某些实施例中，由表达盒编码的目的蛋白质是酶。在具体实施例中，目的蛋白质是半纤维素酶、过氧化物酶、蛋白酶、纤维素酶、木聚糖酶、脂肪酶、磷脂酶、酯酶、角质酶、果胶酶、角蛋白酶、还原酶、氧化酶、酚氧化酶、脂氧合酶、木质素酶、支链淀粉酶、鞣酸酶、戊聚糖酶、甘露聚糖酶、β-葡聚糖酶、阿拉伯糖苷酶、透明质酸酶、软骨素酶、漆酶、淀粉酶、葡糖淀粉酶、其变体、其功能片段、或其两种或更多种的杂合物或混合物。在又其他具体实施例中，目的蛋白质是肽激素、生长因子、凝血因子、趋化因子、细胞因子、淋巴因子、抗体、受体、粘附分子、微生物抗原、其变体、其功能片段、或其两种或更多种的杂合物或混合物。

在这些方法的一些实施例中，鉴定在目的位点处或附近具有基因组修饰的真菌细胞的步骤包括在对同源重组或修饰进行选择或筛选的条件下培养来自步骤(a)的细胞的群体。这些条件包括抗生素选择条件、选择或筛选营养缺陷型细胞的条件等。在一些实施例中，鉴定步骤包括在用于筛选不稳定的转化体的条件下培养来自步骤(a)的细胞的群体。

如前述权利要求中任一项所述的方法，其中该引入步骤包括向这些真菌细胞中引入包含编码可选择标记的序列和该供体DNA的DNA构建体，并且其中该鉴定步骤包括在对已经丢失可选择标记但仍保留该供体DNA的不稳定的转化体进行筛选的条件下培养来自步骤(a)的细胞的群体。

本披露的其他方面涉及通过上文所述方法产生的重组真菌细胞以及在执行这些方法中用作亲本宿主细胞的重组真菌细胞。

因此，在某些实施例中，本披露的方面包括重组真菌细胞，该重组真菌细胞包含含有Cas内切核酸酶的表达盒的第一重组DNA构建体。在某些实施例中，重组真菌细胞中的NHEJ途径是无功能的(失活)或减少的，例如，在NHEJ途径的一种或多种组分失活、无功能或具有减少的活性(例如，ku80、ku70、rad50、mre11、xrs2、lig4、xrs或其组合)的情况下。例如，真菌细胞可以具有失活的/减少的ku80的活性形式。在某些其他实施例中，重组真菌细胞中的NHEJ途径是有功能的。

在某些实施例中，从表达盒表达的Cas内切核酸酶是Cas9内切核酸酶或其变体。可替代地，从表达盒表达的Cas内切核酸酶是Cas切口酶。

如上所述，在一些情况下，Cas内切核酸酶是Cas9内切核酸酶(或其变体)。Cas9内切核酸酶可以是任何方便的Cas9内切核酸酶，包括但不限于来自以下细菌物种的Cas9内切核酸酶及其功能片段：链球菌属(Streptococcus)物种(例如，化脓性链球菌(S.pyogenes)、变异链球菌(S.mutans)和嗜热链球菌(S.thermophilus))；弯曲杆菌属(Campylobacter)物种(例如，空肠弯曲杆菌(C.jejuni))；奈瑟氏菌属(Neisseria)物种(例如，脑膜炎奈瑟球菌(N.meningitides))；弗朗西斯氏菌属(Francisella)物种(例如，新凶手弗朗西斯菌(F.novicida))；巴斯德氏菌属(Pasteurella)物种(例如，多杀巴斯德菌(P.multocida))。可以使用许多其他种类的Cas9。在某些本文所述的真菌细胞中，第一重组DNA构建体包括为了在真菌细胞中表达而优化的Cas内切核酸酶基因。例如，为了在丝状真菌细胞中表达而优化的Cas内切核酸酶编码基因包括与SEQ ID NO:44具有至少70％序列同一性的序列(编码来自化脓性链球菌的Cas9；SEQ ID NO:45)。在一些情况下，Cas内切核酸酶多肽被有效地连接到一个或多个核靶向信号(也被称为核定位信号/序列；NLS)。可以使用任何方便的NLS，其中实例包括SV40NLS(SEQ ID NO:46)、来源于里氏木霉blr2(蓝光调节子2)基因的NLS(SEQ ID NO:47)、或两者的组合。在一些实施例中，重组DNA构建体包含与编码Cas9内切核酸酶或其变体的丝状真菌细胞优化的多核苷酸序列可操作地连接的启动子。

在某些方面，上文所述的重组真菌细胞进一步包括能够表达指导RNA(任选地通过表达盒)的第二重组DNA构建体，其中指导RNA和Cas内切核酸酶能够形成使得Cas内切核酸酶在重组真菌细胞的基因组中的靶位点处起作用的复合物，其中“起作用”意指Cas内切核酸酶如预期的切割DNA(进行双链切割或切口)。在一些实施例中，重组DNA构建体或指导RNA的表达盒包含在真子囊菌纲(Euascomycete)或盘菌纲(Pezizomycete)中有功能的DNA聚合酶III依赖性启动子，其中该启动子被可操作地连接至编码指导RNA的DNA。在一些实施例中，该启动子来源于木霉属(Trichoderma)U6snRNA基因。在某些实施例中，该启动子包含与SEQ ID NO:40或41具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％同一性的核苷酸序列。在具体实施例中，该启动子包含SEQ ID NO:40或41的序列。在一些实施例中，重组DNA构建体或指导RNA的表达盒包含具有来自木霉属U6snRNA基因的内含子序列的、编码指导RNA的DNA。在一些实施例中，来源于木霉属U6snRNA基因的内含子序列包含与SEQ ID NO:42具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％同一性的核苷酸序列。在具体实施例中，来源于木霉属U6snRNA基因的内含子序列包含SEQ ID NO:42的序列。

在一些情况下，重组真菌细胞进一步包括含有目的多核苷酸(所披露的方法的使用者意图经由同源重组在基因组中的靶位点处或附近将其插入真菌细胞的基因组中)的供体DNA。因此，在某些实施例中，真菌细胞具有插入在靶位点处/附近的目的多核苷酸。在一些情况下，与基因组座位的序列相比，供体DNA包含在与真菌细胞的基因组座位具有同源性的区域中的以下修饰中的至少一种：一个或多个核苷酸的缺失、一个或多个核苷酸的插入、编码目的蛋白质的表达盒的插入、一个或多个核苷酸的取代、及其任何组合。

如上所述，我们已经证明，Cas靶向的同源重组在Cas靶位点处的NHEJ途径是无功能的、减少的或被抑制的细胞中得到增强。然而，对于成功或甚至高效的Cas-靶向的同源重组发生，不需要具有无功能的、减少的或被抑制的NHEJ途径。

在一些实施例中，重组真菌细胞包含含有编码如本文所述的可选择标记或表型标记的序列的DNA构建体。在某些实施例中，DNA构建体包含如本文所述的编码可选择标记的序列和供体DNA。在一些实施例中，DNA构建体包含编码如本文所述的Cas内切核酸酶的序列、编码可选择标记的序列和供体DNA。在一些实施例中，DNA构建体包含编码如本文所述的指导RNA的序列、编码可选择标记的序列和供体DNA。在具体实施例中，DNA构建体包含编码Cas内切核酸酶的序列、编码指导RNA的序列、编码可选择标记的序列和供体DNA。在某些实施例中，DNA构建体是线性DNA构建体。在某些实施例中，DNA构建体是环状DNA构建体。在某些实施例中，DNA构建体至少部分地整合到真菌细胞的基因组中或与真菌细胞的基因组同源重组。在具体实施例中，在DNA构建体中包含的至少部分或全部供体DNA整合到真菌细胞的基因组中或与真菌细胞的基因组同源重组，但是编码可选择标记的序列、编码Cas内切核酸酶的序列、或编码指导RNA的序列不整合到真菌细胞的基因组中或不与真菌细胞的基因组同源重组。

可用于本发明方法中的真菌细胞包括丝状真菌细胞种类，这些丝状真菌细胞种类选自木霉属(Trichoderma)、青霉属(Penicillium)、曲霉属(Aspergillus)、腐质霉属(Humicola)、金孢子菌属(Chrysosporium)、镰孢属(Fusarium)、脉孢菌属(Neurospora)、毁丝霉属(Myceliophthora)、嗜热真菌属(Thermomyces)、肉座菌属(Hypocrea)、和裸胞壳属(Emericella)。特别感兴趣的是丝状真菌里氏木霉(Trichoderma reesei)、产黄青霉(P.chrysogenum)、嗜热毁丝霉(M.thermophila)、疏棉状嗜热丝孢菌(Thermomyceslanuginosus)、米曲霉(A.oryzae)和黑曲霉(A.niger)。还可以使用其他真菌细胞，包括酵母的物种。

由所披露方法的使用者选择的靶位点可以位于目的基因的选自下组的区域中，该组由以下各项组成：可读框、启动子、调节序列、终止序列、调节元件序列、剪接位点、编码序列、聚泛素化位点、内含子位点和内含子增强基序。目的基因的实例包括编码以下各项的基因：乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、奇异果甜蛋白、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。在这方面不旨在限制。

本发明的某些方面包括重组多核苷酸，该重组多核苷酸包括与编码丝状真菌细胞优化的Cas9内切核酸酶的核苷酸序列可操作地连接的启动子序列，其中该丝状真菌细胞优化的Cas9内切核酸酶当与指导RNA复合时能够结合丝状真菌基因组中的基因组靶序列并在其中产生双链断裂。与其编码亲本天然Cas9的核苷酸序列相比，丝状真菌细胞优化的Cas9内切核酸酶基因的实例包括SEQ ID NO:44和SEQ ID NO:7及其在丝状真菌细胞中具有改进的表达的同义变体。

另外的重组多核苷酸序列包括具有与异源基因可操作地连接的丝状真菌细胞来源的RNA聚合酶III(pol III)驱动的启动子序列的那些。在一些实施例中，丝状真菌细胞来源的RNA pol III驱动的启动子序列包含U6基因启动子，例如SEQ ID NO:40、SEQ ID NO:41或其功能变体。在一些情况下，重组多核苷酸进一步包含来源于RNA pol III转录的基因(例如，来自U6基因，例如SEQ ID NO:42)的异源序列中的内含子和/或来自RNA pol III转录的基因(例如，来自U6基因，例如SEQ ID NO:43)的转录终止子。在一个具体实施例中，异源序列编码指导RNA。

在本文中示出了本披露的方法和组合物的另外的实施例。

附图说明

从形成本申请的一部分的以下详细说明和附图中可以更全面地理解本披露。

图1描绘了推定的里氏木霉U6基因的核苷酸序列(SEQ ID NO:1)。指示了目的元件，包括TATA框(已加下划线)、转录起始位点(向下箭头)、A-框(已加下划线)、内含子(前向箭头)、B-框(下划线；在基因的内含子内)、与人类U6基因相同的序列(为粗体斜体)和终止子(已加下划线)。

图2显示了pTrex2gHyg-Mo Cas质粒的示意图。

图3显示了p219M质粒的示意图。

图4显示了已示出PCR引物位点和内含子区域的里氏木霉ad3A基因的示意图。

图5显示了已示出PCR引物和内含子区域的里氏木霉葡糖淀粉酶基因(TrGA)的示意图。

图6显示了包含端粒序列的pTrex2gHygMoCasgPyr2TS6质粒的示意图。

图7显示了pET30a-Cas9-D10A切口酶的质粒图。

图8A和8B显示了pMD18T(T7-Spy-TrGA_sgF1)(图8A)和pMD18T(T7-Spy-TrGA_sgR1)(图8B)的质粒图。

图9是显示SpyCas9核酸酶测定的结果的琼脂糖凝胶。泳道1，DNA梯度；泳道2，对照；泳道3和4，在TrGA_sgR1存在下的SpyCas9测定；泳道5和6，在TrGA_sgF1存在下的SpyCas9测定。

图10是显示SpyCas9(D10A)测定的结果的琼脂糖凝胶。泳道1，DNA梯度；泳道2，仅使用TrGA_sgF1的SpyCas9(D10A)；泳道3，仅使用TrGA_sgR1的SpyCas9(D10A)；泳道4，使用两种RNA的SpyCas9(D10A)。

图11是TrGA缺失盒的示意图。

图12显示了具有在Vogel淀粉琼脂上生长的转化体的形态的24孔板。具有生长阻滞表型的转化体由圆圈表示。3个对照的形态显示在右下角的正方形中。“cellu”＝具有另外的内切葡聚糖酶-3、内切葡聚糖酶-4、内切葡聚糖酶-5、内切葡聚糖酶-6、甘露聚糖酶-1的缺失的里氏木霉的四缺失菌株；“ΔAA”＝具有α-淀粉酶基因缺失的里氏木霉的“cellu”菌株；“ΔGA”＝具有葡糖淀粉酶基因缺失的里氏木霉的“cellu”菌株；并且“empty”＝没有细胞(空的孔)。显示了所选择的克隆#1至#9。

图13A和13B.里氏木霉中TrGA缺失的确认。(图13A)显示野生型和TrGA缺失菌株中TrGA基因座的结构、以及引物Fw1、R3、KOF1(5’-gaacaatcttctttgcaatgttggtc-3’)(SEQ IDNO:79)、KOR2(5’-ggcagactacaagtctactagtactac-3’)(SEQ ID NO:58)、R1(5’-gaggaagtcctgcttgtaggcaggc-3’)(SEQ ID NO:80)和F4(5’-cgacagagcagtcatatggggatacg-3’)(SEQ ID NO:81)的结合位点的示意图。(图13B)显示PCR结果的琼脂糖凝胶。使用在140伏特下运行30min的0.8％琼脂糖凝胶分析PCR产物。

图14显示了pTrexMoCasGATS11-HDR的质粒图。

发明内容

本披露包括可用于促进供体DNA与真菌细胞中的基因组座位的同源重组的组合物和方法。这些方法使用功能性指导RNA/Cas内切核酸酶复合物，该复合物识别希望的靶位点并在该位点处引入双链断裂或切口，从而促进和/或增强在靶位点处或附近的同源重组。在某些方面，在真菌细胞中的靶位点处的非同源末端连接(NHEJ)机制是没有激活的、无功能的或减少的，我们在本文中证实其提高了希望的同源重组事件的效率。

在更详细地描述本发明组合物和方法之前，应当理解，本发明组合物和方法不限于所描述的具体实施例，因此当然可以变化。还应当理解，在此使用的术语仅是出于描述具体实施例的目的，并且不旨在进行限制，因为本发明组合物和方法的范围将仅由所附权利要求书限制。

在提供了一系列值的情况下，应理解每个中间值为到下限的十分之一单位(除非上下文清晰地另外指示)，该范围的上限与下限之间以及在该陈述范围内的任何其他陈述的或中间值均被涵盖在本发明的组合物和方法之内。这些较小范围的上限和下限可以被独立地包括在所述较小的范围内，并且也被涵盖在本发明的组合物和方法之内，服从所陈述范围中任何特别排除的限值。在所陈述的范围包括一个或者全部两个限值的情况下，排除那些包括的限值的任一个或者全部两个的范围也包括在本发明的组合物和方法中。

本文提供了某些范围，其中数值前面是术语“约”。术语“约”在本文中用于为其后面的确切数字以及与该术语后面的数字接近或近似的数字提供文字支持。在确定数字是否接近或近似于具体叙述的数字时，接近或近似的未列举的数字可以是在呈现其的上下文中提供具体叙述的数字的实质性等值的数字。例如，关于数值，术语“约”是指数值的-10％至+10％的范围，除非术语在上下文中另有具体定义。在另一个实例中，短语“约6的pH值”是指pH值为从5.4至6.6，除非pH值另有具体定义。

本文提供的标题并非对本发明的组合物和方法的各个方面或实施例进行限制，这些方面或实施例可通过将说明书作为一个整体来参考而得到。因此，将说明书作为一个整体参考时，下面即将定义的术语被定义得更全面。

将本文件分为若干部分以便于阅读；然而，读者将领会的是，在一个部分中进行的陈述可能适用于其他部分。以这种方式，用于本披露的不同部分的标题不应被解释为限制。

除非另有定义，本文使用的所有技术和科学术语具有与本发明组合物和方法所属领域的普通技术人员通常理解的相同含义。虽然类似于或等同于本文描述的那些的任何方法和材料也可以用于本发明组合物和方法的实践或测试中，但现在将对代表性示例方法和材料进行描述。

在本说明书中引用的所有公开物和专利都通过引用结合在此，就好像每个单独的公开物或专利被具体地并单独地指示为通过引用结合，并且通过引用结合在此从而结合引用的公开物来披露和描述这些方法和/或材料。任何公开物的引用内容是针对其在申请日之前的披露，并且不能理解为承认因为先前发明而本发明组合物和方法不能获得比这些公开物更早的申请日。此外，所提供的公开日期可能与实际公开日期不同，实际公开日期可能需要独立地证实。

根据这一详细说明，以下缩写和定义适用。应当注意单数形式“一个/一种(a/an)”和“该(the)”包括复数个指示物，除非上下文中清楚地另外指出。因此，例如提及“酶”包括多个这样的酶，并且提及“剂量”包括提及一个或多个剂量以及本领域技术人员已知的其等效物，等等。

进一步注意的是，权利要求书可以撰写以排除任何可选择的要素。因此，该陈述意在作为使用与权利要求要素的叙述有关的排他性术语例如“单独”、“仅”等或利用“否定型”限定的前提基础。

如将对于本领域技术人员显而易见的是，在阅读本披露时，本文描述和展示的单独实施例中的每一个具有离散的组分和特征，这些组分和特征可以在不偏离本文所述的本发明组合物和方法的范围或精神的情况下容易地与任何其他几个实施例的任何一个的特征分离或组合。可以按照所叙述的事件的顺序或按照逻辑上可行的任何其他顺序来进行任何叙述的方法。

定义

如本文中所使用，被称为“Cas内切核酸酶”或具有“Cas内切核酸酶活性”的多肽涉及由Cas基因编码的CRISPR相关(Cas)多肽，其中当与一种或多种指导多核苷酸功能耦合时，该Cas蛋白能够切割靶DNA序列(参见，例如名称为“CRISPR-Cas系统和用于改变基因产物的表达的方法(CRISPR-Cas systems and methods for altering expression of geneproducts)”的美国专利8697359)。保留指导多核苷酸指导的内切核酸酶活性的Cas内切核酸酶的变体也包括在该定义中，包括具有切口内切核酸酶活性的Cas变体，即它们在双链DNA靶位点处引入单链缺口(参见下文定义)。(应当注意的是迄今为止鉴定的野生型Cas内切核酸酶在靶位点处引入双链断裂。)通过指导多核苷酸指导Cas内切核酸酶识别和切割双链DNA中的特异性靶位点，例如在细胞基因组中的靶位点。已经描述了若干种不同类型的CRISPR-Cas系统，并且这些CRISPR-Cas系统可以被分类为I型、II型和III型CRISPR-Cas系统(参见，例如Liu和Fan，CRISPR-Cas system:a powerful tool for genome editing[CRISPR-Cas系统：用于基因组编辑的有力工具]，Plant Mol Biol[植物分子生物学](2014)85:209-218中的描述)。在某些方面，CRISPR-Cas系统是使用Cas9内切核酸酶或其变体(包括例如Cas切口酶)的II型CRISPR-Cas系统。Cas9内切核酸酶可以是任何方便的Cas9内切核酸酶，包括但不限于来自以下细菌物种的Cas9内切核酸酶及其功能片段：链球菌属(Streptococcus)物种(例如，化脓性链球菌(S.pyogenes)、变异链球菌(S.mutans)和嗜热链球菌(S.thermophilus))；弯曲杆菌属(Campylobacter)物种(例如，空肠弯曲杆菌(C.jejuni))；奈瑟氏菌属(Neisseria)物种(例如，脑膜炎奈瑟球菌(N.meningitides))；弗朗西斯氏菌属(Francisella)物种(例如，新凶手弗朗西斯菌(F.novicida))；巴斯德氏菌属(Pasteurella)物种(例如，多杀巴斯德菌(P.multocida))。可以使用许多其他种类的Cas9。例如，可以使用含有与SEQ ID NO:45和48至53中任一项具有至少70％同一性的氨基酸序列的功能性Cas9内切核酸酶或其变体，例如与SEQ ID NO:45和48至53中的任一项具有至少80％同一性、至少90％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性、并且包括多达100％同一性。在其他实施例中，该Cas内切核酸酶或其变体是II型CRISPR-Cas系统的Cpf1内切核酸酶。Cpf1介导具有与Cas9不同的特征的强大的DNA干扰。Cpf1缺乏tracrRNA并且利用富含T的前间区序列邻近基序。它经由交错的DNA双链断裂切割DNA。参见，例如Zetsche等人，Cell[细胞](2015)163:759-771。

如本文中所使用，“Cas缺口酶”是一种Cas内切核酸酶，该Cas内切核酸酶当与一种或多种指导多核苷酸功能耦合时，能够将单链切口引入靶标双链DNA序列中的Cas内切核酸酶。可以通过使在亲本Cas内切核酸酶中的两个核酸酶结构域中的一个失活(例如，通过定点诱变)重组地产生Cas切口。Cas切口酶的一个非限制性实例是在Sander和Joung(NatureBiotechnology[自然生物技术]，2013,1-9)中描述的Cas9切口酶，其中RuvC结构域被D10A突变失活。如上所述，通用术语“Cas内切核酸酶”涵盖双链切割和切口Cas多肽两者。例如，如果指导RNA被描述为能够将Cas内切核酸酶指导到希望的靶位点，那么对于双链切割Cas内切核酸酶和切口Cas多肽(如下文所定义)两者都将这样做。

如本文中所使用，术语“指导多核苷酸”涉及可以与Cas内切核酸酶形成复合物的多核苷酸序列，并且使得Cas内切核酸酶能够识别并且切割DNA靶位点。指导多核苷酸可以是单分子或双分子。指导多核苷酸序列可以是RNA序列、DNA序列或其组合(RNA-DNA组合序列)。任选地，指导多核苷酸可以包含至少一种核苷酸、磷酸二酯键或连接修饰，例如但不限于锁核酸(LNA)、5-甲基dC、2,6-二氨基嘌呤、2'-氟代A、2’-氟代U、2'-O-甲基RNA、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18(六乙二醇链)分子的连接、或导致环化的5'至3'共价连接。仅包含核糖核酸的指导多核苷酸也被称为“指导RNA”。

指导多核苷酸可以是双分子(也被称为双链体指导多核苷酸)，其包含与靶DNA(下面也称为“前间区序列”或“靶位点”)中的核苷酸序列互补的第一核苷酸序列结构域(被称为可变靶向结构域或VT结构域)以及与Cas内切核酸酶多肽相互作用的第二核苷酸序列结构域(被称为Cas内切核酸酶识别结构域或CER结构域)。双分子指导多核苷酸的CER结构域包含沿着互补区域杂交的两个单独的分子。两个单独的分子可以是RNA、DNA和/或RNA-DNA组合序列。在一些实施例中，包含连接到CER结构域的VT结构域的双链体指导多核苷酸的第一个分子被称为“crDNA”(当由DNA核苷酸的连续延伸构成时)或“crRNA”(当由RNA核苷酸的连续延伸构成时)或“crDNA-RNA”(当由DNA和RNA核苷酸的组合构成时)。cr核苷酸(crNucleotide)可以包含在细菌和古细菌中天然存在的crRNA的片段。在一个实施例中，存在于本文披露的cr核苷酸中、在细菌和古细菌中天然存在的crRNA的片段的大小可以在但不限于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸的范围内。在一些实施例中，包含CER结构域的双链体指导多核苷酸的第二个分子被称为“tracrRNA”(当由RNA核苷酸的连续延伸构成时)或“tracrDNA”(当由DNA核苷酸的连续延伸构成时)或“tracrDNA-RNA”(当由DNA和RNA核苷酸的组合构成时)。在某些实施例中，指导RNA/Cas9内切核酸酶复合物的RNA是包含双链体crRNA-tracrRNA的双链体化的RNA。

指导多核苷酸还可以是单分子，其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列结构域(被称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的第二核苷酸结构域(被称为Cas内切核酸酶识别结构域或CER结构域)。“结构域”意指可以为RNA、DNA和/或RNA-DNA组合序列的核苷酸的连续延伸。单指导多核苷酸的VT结构域和/或CER结构域可以包含RNA序列、DNA序列或RNA-DNA组合序列。在一些实施例中，单指导多核苷酸包含连接到tracr核苷酸(包含CER结构域)的cr核苷酸(包含与CER结构域连接的VT结构域)，其中该连接是包含RNA序列、DNA序列或RNA-DNA组合序列的核苷酸序列。由来自cr核苷酸和tracr核苷酸的序列构成的单指导多核苷酸可以被称为“单指导RNA”(当由RNA核苷酸的连续延伸构成时)或“单指导DNA”(当由DNA核苷酸的连续延伸构成时)或“单指导RNA-DNA”(当由RNA和DNA核苷酸的组合构成时)。在本披露的一个实施例中，单指导RNA包含可以与II型Cas内切核酸酶形成复合物的、II型CRISPR/Cas系统的crRNA或crRNA片段以及tracrRNA或tracrRNA片段，其中该指导RNA/Cas内切核酸酶复合物可以将Cas内切核酸酶指导到真菌细胞基因组靶位点，使Cas内切核酸酶能够在基因组靶位点处引入双链断裂。

使用单指导多核苷酸相对于双链体指导多核苷酸的一个方面是仅需要制备一个表达盒以便在靶细胞中表达单指导多核苷酸。

术语“可变靶向结构域”或“VT结构域”在本文中可互换使用，并且包括与双链DNA靶位点的一条链(核苷酸序列)互补的核苷酸序列。在第一个核苷酸序列结构域(VT结构域)与靶序列之间的％互补是至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、63％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或是100％互补的。VT结构域可以是至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸长度。在一些实施例中，VT结构域包含12至30个核苷酸的连续延伸。VT结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列或其任何组合构成。

术语指导多核苷酸的“Cas内切核酸酶识别结构域”或“CER结构域”在本文中可互换使用，并且包括与Cas内切核酸酶多肽相互作用的核苷酸序列(例如指导多核苷酸的第二核苷酸序列结构域)。CER结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如本文所述的修饰)或其任何组合构成。

连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包含RNA序列、DNA序列或RNA-DNA组合序列。在一个实施例中，连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以是至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个核苷酸长度。在另一个实施例中，连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包含四环序列，例如但不限于GAAA四环序列。

指导多核苷酸、VT结构域和/或CER结构域的核苷酸序列修饰可以选自但不限于下组，该组由以下各项组成：5'帽、3'聚腺苷酸化尾巴、核糖开关序列、稳定性控制序列、形成dsRNA双链体的序列、将指导多核苷酸靶向亚细胞位置的修饰或序列、提供跟踪的修饰或序列、为蛋白质提供结合位点的修饰或序列、锁核酸(LNA)、5-甲基dC核苷酸、2,6-二氨基嘌呤核苷酸、2'-氟代A核苷酸、2'-氟代U核苷酸、2'-O-甲基RNA核苷酸、硫代磷酸酯键、与胆固醇分子的键合、与聚乙二醇分子的键合、与间隔区18分子的键合、5'至3'共价键、或其任何组合。这些修饰可以导致至少一个另外的有益特征，其中该另外的有益特征选自以下各项的组：修饰或调节的稳定性、亚细胞靶向、跟踪、荧光标记、蛋白质或蛋白质复合物的结合位点、与互补靶序列的修饰的结合亲和力、对细胞降解的修饰的抗性、以及增加的细胞通透性。

如本文中所使用，术语“指导多核苷酸/Cas内切核酸酶系统”(和等效物)包括能够在DNA靶位点处引入双链断裂的Cas内切核酸酶和指导多核苷酸(单或双)的复合物。Cas内切核酸酶在DNA靶位点附近解开DNA双链体，并且在通过指导RNA识别靶序列时切割两条DNA链，但只有当前间区序列邻近基序(PAM)适当地朝向靶序列的3'末端时。

术语“功能片段”、“功能等同的片段”、“功能等同片段”等可互换使用，并且是指保留亲本多肽的定性酶活性的亲本多肽的一部分或子序列。例如，Cas内切核酸酶的功能片段保留与指导多核苷酸一起产生双链断裂的能力。这里，应当注意到，如与亲本多肽相比，功能片段可能具有改变的定量酶活性。

术语“功能变体”、“功能上等同的变体”、“功能等同变体”等可互换使用，并且是指保留亲本多肽的定性酶活性的亲本多肽的变体。例如，Cas内切核酸酶的功能变体保留与指导多核苷酸一起产生双链断裂或切口(取决于所讨论的变体)的能力。这里，应当注意到，如与亲本多肽相比，功能变体可能具有改变的定量酶活性。

可以经由任何方便的方法(包括定点诱变和合成构建)获得这些片段和变体。

当应用于真菌细胞时，术语“基因组”不仅涵盖在细胞核内发现的染色体DNA，而且涵盖在细胞的亚细胞组分(例如线粒体)内发现细胞器DNA。

“密码子修饰的基因”或“密码子偏好的基因”或“密码子优化的基因”是其密码子使用频率被设计为模拟宿主细胞的偏好的密码子使用频率的基因。进行核酸改变以密码子优化基因是“同义的”，这意味着它们不改变亲本基因的编码多肽的氨基酸序列。然而，天然基因和变体基因二者都可以针对特定宿主细胞进行密码子优化，因此在这方面不意图限制。

“编码序列”是指编码特定氨基酸序列的多核苷酸序列。“调节序列”是指位于编码序列的上游(5'非编码序列)、内部或下游(3'非编码序列)的核苷酸序列，并且其影响相关的编码序列的转录、RNA加工或稳定性、或翻译。调节序列可以包括但不限于：启动子、翻译前导序列、5'非翻译序列、3'非翻译序列、内含子、聚腺苷酸化靶序列、RNA加工位点、效应子结合位点和茎-环结构。

“启动子”是指能够控制编码序列或功能性RNA表达的DNA序列。启动子序列由近端和更远端的上游元件组成，后一元件通常被称为增强子。“增强子”是可以促进启动子活性的DNA序列，并且可以是启动子的固有元件或被插入以增强启动子的水平或组织特异性的异源元件。启动子可以全部来源于天然基因，或者由来源于在自然界存在的不同启动子的不同元件构成，和/或包含合成的DNA区段。本领域技术人员应当理解，不同的启动子可能指导基因在不同组织或细胞类型中、或在不同的发育阶段、或者响应于不同的环境条件中的表达。进一步认识到，由于在大多数情况下调节序列的确切边界尚未完全限定，一些变异的DNA片段可能具有相同的启动子活性。如在本领域中熟知的，启动子可以根据其强度和/或它们有活性的条件进行分类，例如组成型启动子、强启动子、弱启动子、诱导型/阻抑型启动子、组织特异性/发育调节性启动子、细胞周期依赖性启动子等。

“RNA转录物”是指由RNA聚合酶催化的DNA序列转录产生的产物。“信使RNA”或“mRNA”是指不含内含子并且可以被细胞翻译成蛋白质的RNA。“cDNA”是指使用酶逆转录酶与mRNA模板互补并由其合成的DNA。“正义”RNA是指包含mRNA并且可以在细胞内或体外翻译成蛋白质的RNA转录物。“反义RNA”是指与靶初级转录物或mRNA的全部或部分互补、并且在某些条件下阻断靶基因的表达的RNA转录物(参见，例如美国专利号5,107,065)。反义RNA的互补性可以是与特定基因转录物的任何部分，即在5'非编码序列、3'非编码序列、内含子或编码序列处。“功能性RNA”是指反义RNA、核酶RNA、或不能被翻译成多肽但对细胞加工有影响的其他RNA。术语“补体”和“反向互补体”在本文中关于mRNA转录物可互换使用，并且意在限定信使的反义RNA。

如本文中所使用，“功能附接”或“可操作地连接”意指具有已知或期望的活性的多肽或多核苷酸序列的调节区域或功能结构域(例如启动子、增强子区域、终止子、信号序列、表位标签等)按这样一种方式附接于或连接于靶标(例如，基因或多肽)：以允许调节区域或功能结构域根据其已知或期望的活性来控制该靶标的表达、分泌或功能的方式。例如，当启动子能够调节编码序列的表达(即，该编码序列在启动子的转录控制下)时，启动子与该编码序列可操作地连接。

本文中使用的标准重组DNA和分子克隆技术是本领域熟知的。

“PCR”或“聚合酶链式反应”是用于特定DNA区段的合成的技术，由一系列重复变性、退火和延伸循环组成，并且是本领域熟知的。

当用于提及生物组分或组合物(例如细胞、核酸、多肽/酶、载体等)时，术语“重组体”表示生物组分或组合物处于自然界中未发现的状态。换句话说，生物组分或组合物已经通过人类干预从其天然状态改变。例如，重组细胞涵盖表达在其天然亲本(即非重组)细胞中未发现的一种或多种基因的细胞、以不同于其天然亲本细胞的量表达一种或多种天然基因的细胞、和/或在不同于其天然亲本细胞的条件下表达一种或多种天然基因的细胞。重组核酸可以通过一个或多个核苷酸与天然序列不同、有效地连接到异源序列(例如异源启动子、编码非天然或变体信号序列的序列等)、缺乏内含子序列、和/或处于分离的形式。重组多肽/酶可以通过一个或多个氨基酸与天然序列不同，可以与异源序列融合，可以被截短或具有氨基酸的内部缺失，能以在天然细胞中未发现的方式表达(例如，来自重组细胞，该重组细胞由于细胞中存在编码多肽的表达载体而过量表达多肽)，和/或处于分离的形式。需要强调的是，在一些实施例中，重组多核苷酸或多肽/酶具有与其野生型对应物相同但处于非天然形式(例如，处于分离或富集的形式)的序列。

术语“质粒”、“载体”和“盒”是指携带目的多核苷酸序列的额外的染色体元件，例如将在细胞中表达的目的基因(“表达载体”或“表达盒”)。这样的元件通常处于双链DNA的形式，并且可以是来源于任何来源的、单链或双链DNA或RNA的、处于直链或环状形式的自主复制序列、基因组整合序列、噬菌体、或核苷酸序列，其中许多核苷酸序列已经被连接或重组成能够将目的多核苷酸引入细胞中的独特构造。目的多核苷酸序列可以是编码将在靶细胞中表达的多肽或功能性RNA的基因。表达盒/载体通常包含具有可操作地连接的元件的基因，这些元件允许该基因在宿主细胞中表达。

如本文中所使用，术语“表达”是指处于前体或成熟形式的功能性终产物(例如，mRNA、指导RNA或蛋白质)的产生。

在将多核苷酸或多肽插入细胞(例如，重组DNA构建体/表达构建体)的背景下，“引入”是指用于执行这样的任务的任何方法，并且包括为了实现所希望的生物分子的引入的“转染”、“转化”、“转导”、物理手段等的任何方法。

“瞬时地引入”、“瞬时引入的”、“瞬时的引入”、“瞬时表达”等意指将生物分子以非永久性方式引入宿主细胞(或宿主细胞的群体)中。关于双链DNA，瞬时的引入包括其中引入的DNA不整合到宿主细胞的染色体中并因此在生长期间不被传递到所有子代细胞的情况，以及其中在所希望的时间使用任何方便的方法(例如，使用cre-lox系统、通过去除附加型DNA构建体的正选择压力、通过使用选择培养基促进整合的多核苷酸的全部或部分从染色体中环出，等等)将可能已经整合到染色体中的引入的DNA分子除去的情况。在这方面不旨在限制。通常，将RNA(例如，指导RNA、信使RNA、核糖酶等)或多肽(例如，Cas多肽)引入宿主细胞中被认为是瞬时的，因为这些生物分子在细胞生长期间不被复制并且不明确地传递到子代细胞。关于Cas/指导RNA复合物，瞬时的引入包括当瞬时地引入这两种组分中的任一种时的情况，因为需要两种生物分子都发挥靶向的Cas内切核酸酶活性。因此，Cas/指导RNA复合物的瞬时的引入包括瞬时地引入Cas内切核酸酶和指导RNA中的任一种或两种的实施例。例如，具有其中瞬时地引入了指导RNA的、Cas内切核酸酶的基因组整合的表达盒(并且因此不是瞬时地引入)的宿主细胞可以被称为已经瞬时地引入了Cas/指导RNA复合物(或系统)，因为功能性复合物以瞬时的方式存在于宿主细胞中。在某些实施例中，该引入步骤包括：(i)获得稳定表达Cas内切核酸酶的亲本真菌细胞群体，和(ii)将指导RNA瞬时地引入亲本真菌细胞群体中。相反地，该引入步骤可以包括：(i)获得稳定表达指导RNA的亲本真菌细胞群体，和(ii)将Cas内切核酸酶瞬时地引入亲本真菌细胞群体中。

“成熟”蛋白质是指翻译后加工的多肽(即，从其中已经除去存在于初级翻译产物中的任何前肽(pre-peptide)或原肽(propeptide)的一种多肽)。“前体”蛋白质是指mRNA的翻译的初级产物(即，仍存在前肽或原肽)。前肽或原肽可以是但不限于细胞内定位信号。

“稳定的转化”是指将核酸片段转移到宿主生物体的基因组中，包括细胞核和细胞器基因组二者，导致遗传上稳定的遗传(有时所得的宿主细胞在本文中被称为“稳定的转化体”)。相比之下，“瞬时的转化”是指将核酸片段转移到宿主生物体的细胞核或其他含DNA的细胞器中，导致基因表达而没有整合或稳定的遗传(有时在本文中被称为“不稳定的转化”，并且有时所得的宿主细胞在本文中被称为“不稳定的转化体”)。含有转化的核酸片段的宿主生物体被称为“转基因”生物体。

如本文中所使用，“真菌细胞”、“真菌”、“真菌宿主细胞”等包括门子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(由Hawksworth等人，在：Ainsworth and Bisby's Dictionary of TheFungi,8th edition,1995,CAB International,University Press,Cambridge,UK[真菌的安斯沃思和拜斯比词典，第8版，1995年，英国剑桥CAB国际集团，大学出版社])以及卵菌门(Oomycota)(如在Hawksworth等人，同上引用的)和所有有丝分裂孢子真菌(Hawksworth等人，同上)。在某些实施例中，真菌宿主细胞是酵母细胞，其中“酵母”意指产子囊酵母(内孢霉目(Endomycetales))、产担子酵母、和属于不完全菌纲(Fungi Imperfecti)(芽孢纲(Blastomycetes)))的酵母。因此，酵母宿主细胞包括假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或耶氏酵母属(Yarrowia)细胞。酵母的种类包括但不限于以下各项：卡尔斯伯酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉斯酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)、乳酸克鲁维酵母(Kluyromomyces lactis)和解脂耶氏酵母(Yarrowia lipolytica)细胞。

术语“丝状真菌细胞”包括真菌亚门(Eumycotina)或盘菌亚门(Pezizomycotina)的所有丝状形式。丝状真菌属的合适的细胞包括但不限于：支顶孢属、曲霉属、金孢子菌属、棒囊壳属、毛壳菌属、镰孢属、赤霉菌属、腐质霉属、大角间座壳属(Magnaporthe)、毁丝霉属、脉孢菌属、拟青霉属、青霉属、Scytaldium、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属、弯颈霉属、肉座菌属和木霉属的细胞。

丝状真菌物种的合适细胞包括但不限于：泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、卢克诺文思金孢子菌(Chrysosporium lucknowense)、杆孢状镰孢菌(Fusarium bactridioides)、谷类镰孢菌(Fusarium cerealis)、克地镰孢菌(Fusariumcrookwellense)、黄色镰孢菌(Fusarium culmorum)、禾谷镰孢菌(Fusariumgraminearum)、禾赤镰孢菌(Fusarium graminum)、异孢镰孢菌(Fusarium heterosporum)、合欢木镰孢菌(Fusarium negundi)、尖孢镰孢菌、多枝镰孢菌、粉红镰孢菌、接骨木镰孢菌、肤色镰孢菌、拟枝孢镰孢菌、硫色镰孢菌、圆镰孢菌、拟丝孢镰孢菌、镶片镰孢菌、特异腐质霉、柔毛腐质霉、红褐肉座菌(Hypocrea jecorina)、嗜热毁丝霉、粗壮脉纹孢菌、间型脉孢菌、产紫青霉、变灰青霉(Penicillium canescens)、离生青霉(Penicillium solitum)、绳状青霉(Penicillium funiculosum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、黄色蠕形霉(Talaromyces flavus)、土生梭孢壳、哈茨木霉、康氏木霉、长柄木霉、里氏木霉和绿色木霉的细胞。

术语“靶位点”、“靶序列”、“基因组靶位点”、“基因组靶序列”(和等效物)在本文中可互换使用，并且是指真核细胞的基因组中的多核苷酸序列，其中Cas内切核酸酶切割期望促进基因组修饰，例如，与供体DNA的同源重组。然而，使用这个术语的上下文可以稍微改变其含义。例如，Cas内切核酸酶的靶位点通常是具有高特异性的，并且通常可以被定义为确切的核苷酸序列/位置，然而在一些情况下，所希望的基因组修饰的靶位点可以比仅DNA切割发生的位点更广泛地进行定义，例如希望同源重组的基因组座位或区域。因此，在某些情况下，经由Cas/指导RNA的活性发生的基因组修饰DNA切割被描述为发生在靶位点“处或附近”。靶位点可以是真菌细胞基因组中的内源性位点，或者可替代地，靶位点可以与真菌细胞异源，从而不是基因组中天然存在的，或者与其在自然界中存在的地方相比，靶位点可以发现于异源基因组位置中。在某些其他情况下，当供体DNA包含与真菌细胞的基因组座位具有同源性的区域时，引入真菌细胞的Cas内切核酸酶和指导RNA能够形成使得Cas内切核酸酶能够在真菌细胞的基因组座位内或附近的靶位点处起作用的复合物。在一些实施例中，基因组DNA上的Cas内切核酸酶切割位点(或靶位点)位于供体DNA和基因组座位之间的同源区域，该区域中可能发生同源重组。在其他实施例中，切割位点在供体DNA和基因组座位之间的同源区域附近，其可以距离同源区域从1bp至约10kb的任何位置，例如距离同源区域的位点1bp、2bp、5bp、10bp、20bp、50bp、100bp、250bp、500bp、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb或10kb。

如本文中所使用，“核酸”意指多核苷酸，并且包括脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。核酸还可以包括片段和修饰的核苷酸。因此，术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用以表示单链或双链的RNA和/或DNA的聚合物，任选地含有合成的、非天然的或改变的核苷酸碱基。核苷酸(通常以其5'-单磷酸酯形式发现)以单字母名称表示如下：“A”表示腺苷或脱氧腺苷(分别用于RNA或DNA)，“C”表示胞苷或脱氧胞苷，“G”表示鸟苷或脱氧鸟苷，“U”表示尿苷，“T”表示脱氧胸苷，“R”表示嘌呤(A或G)，“Y”表示嘧啶(C或T)，“K”表示G或T，“H”表示A或C或T，“I”表示肌苷，并且“N”表示任何核苷酸。

术语“来源于”涵盖术语“起源于”、“获得自”、“可获得自”、“分离自”和“产生自”，并且通常表示一种指定的材料在另一种指定的材料中找到其起源或具有可以参考另一种指定的材料来描述的特征。

如本文中所使用，术语“杂交条件”是指进行杂交反应的条件。这些条件通常根据杂交在其下测量的条件的“严格”度来分类。严格度可以是基于例如结合复合物或探针的核酸的解链温度(Tm)。例如，“最大严格”典型地发生在约Tm-5℃(低于探针的Tm 5℃)；“高严格”发生在低于Tm约5℃-10℃；“中等严格”发生在低于探针的Tm约10℃-20℃；并且“低严格”发生在低于Tm约20℃-25℃。可替代地，或另外，杂交条件可以基于杂交的盐或离子强度条件，和/或基于一次或多次严格洗涤，例如：6X SSC＝非常低严格；3X SSC＝低至中严格；1X SSC＝中严格；以及0.5X SSC＝高严格。在功能上，最大严格条件可以用于鉴定与杂交探针具有严格同一性或近乎严格同一性的核酸序列；而高严格条件用于鉴定与探针具有约80％或更高序列同一性的核酸序列。对于需要高选择性的应用，通常希望使用相对严格的条件来形成杂交(例如，使用相对较低的盐和/或高温条件)。

如在此所用，术语“杂交”是指通过碱基配对将核酸链与互补链连接的过程，如本领域已知的。更具体地，“杂交”是指如在印迹杂交技术和PCR技术期间发生的，一条核酸链与互补链形成双链体(即碱基对)的过程。如果两个序列在中至高严格杂交和洗涤条件下彼此特异性杂交，则认为核酸序列可与参考核酸序列“选择性杂交”。杂交条件是基于结合复合物或探针的核酸的解链温度(Tm)。例如，“最大严格”典型地发生在约Tm-5℃(低于探针的Tm 5℃)；“高严格”发生在低于Tm约5℃-10℃；“中等严格”发生在低于探针的Tm约10℃-20℃；并且“低严格”发生在低于Tm约20℃-25℃。在功能上，最大严格条件可以用于鉴定与杂交探针具有严格同一性或近乎严格同一性的序列；而中等或低严格杂交可用于鉴定或检测多核苷酸序列同系物。

中等和高严格杂交条件是本领域公知的。例如，中等严格杂交可以在包括20％甲酰胺、5×SSC(150mM NaCl、15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5×登哈特氏溶液(Denhardt’s solution)、10％葡聚糖硫酸酯和20mg/mL变性剪切的鲑鱼精子DNA的溶液中在37℃下过夜孵育来进行，随后在约37℃-50℃下在1x SSC中洗涤过滤器。高严格杂交条件可以是在65℃和0.1X SSC(其中1X SSC＝0.15M NaCl、0.015M柠檬酸钠，pH 7.0)下的杂交。可替代地，高严格杂交条件可以在约42℃下在50％甲酰胺、5X SSC、5X登哈特溶液、0.5％SDS和100μg/mL变性载体DNA中进行，随后在室温下在2X SSC和0.5％SDS中洗涤两次并且在42℃下在0.1X SSC和0.5％SDS中再洗涤两次。并且非常高的严格杂交条件可能是在68℃和0.1X SSC下的杂交。如果需要，本领域技术人员知道如何调节温度、离子强度等以适应因素如探针长度等等。

在至少两种核酸或多肽的背景下，“基本相似”或“基本上同一”意指多核苷酸或多肽包含与亲本或参照序列具有至少90％，至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或甚至至少99％同一性的序列，或不包括只是为了规避本说明书而不添加功能的氨基酸取代、插入、缺失或修饰。

在核酸或多肽序列的上下文中的“序列同一性”或“同一性”是指在两个序列中的核酸碱基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。

“序列同一性百分比”是指通过在比较窗口上比较两个最佳比对的序列所确定的值，其中与参比序列(其不包含添加或缺失)比较两个序列的最佳比对时，该多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即空位)。通过以下方式计算该百分比：确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目，将匹配位置的数目除以比较窗口中的位置的总数目，然后将该结果乘以100以产生序列同一性百分比。百分比序列同一性的有用实例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％或95％，或从50％至100％的任何整数百分比。这些同一性可以使用本文所述的任何程序来确定。

可以使用设计用于检测同源序列的各种比较方法来确定序列比对和百分比同一性或相似性计算，这些比较方法包括但不限于LASERGENE生物信息学计算套件(威斯康辛州麦迪逊市DNASTAR公司)的MegAlign^TM程序。在本应用程序的上下文中，应当理解，在将序列分析软件用于分析的情况下，分析结果将基于所引用程序的“默认值”，除非另有规定。如本文中所使用，“默认值”将意味着在初次初始化时最初与软件一起加载的任何一组值或参数。

“Clustal V比对方法”对应于标记有Clustal V的比对方法(由Higgins和Sharp，(1989)CABIOS 5:151-153；Higgins等人，(1992)Comput Appl Biosci[计算机在生物科学中的应用]8:189-191描述的)并且在LASERGENE生物信息学计算套件(威斯康辛州麦迪逊市DNASTAR公司)的MegAlign^TM程序中找到。对于多重比对，默认值对应于空位罚分(GAPPENALTY)＝10和空位长度罚分(GAP LENGTH PENALTY)＝10。使用Clustal方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数是KTUPLE＝1、空位罚分＝3、窗口(WINDOW)＝5、以及存储的对话框(DIAGONALS SAVED)＝5。对于核酸，这些参数是KTUPLE＝2、空位罚分＝5、窗口＝4、以及存储的对话框＝4。在使用Clustal V程序比对序列之后，可以通过查看同一程序中的“序列距离”表来获得“百分比同一性”。

“Clustal W比对方法”对应于标记有Clustal W的比对方法(由Higgins和Sharp，(1989)CABIOS 5:151-153；Higgins等人，(1992)Comput Appl Biosci[计算机在生物科学中的应用]8:189-191描述的)并且在LASERGENE生物信息学计算套件(威斯康辛州麦迪逊市DNASTAR公司)的MegAlign^TMv6.1程序中找到。多重比对的默认参数(空位罚分＝10、空位长度罚分＝0.2、延迟发散序列(Delay Divergen Seqs，％)＝30、DNA转换权重＝0.5、蛋白质权矩阵＝Gonnet系列、DNA权矩阵＝IUB)。在使用Clustal W程序比对序列之后，可以通过查看同一程序中的“序列距离”表来获得“百分比同一性”。

除非另有说明，本文中提供的序列同一性/相似性值是指使用GAP版本10(GCG，Accelrys公司，圣地亚哥，加利福尼亚州)使用以下参数获得的值：核苷酸序列的％同一性和％相似性使用空位创建罚分权重为50、空位长度延伸罚分权重为3、以及nwsgapdna.cmp打分矩阵；氨基酸序列的％同一性和％相似性使用空位创建罚分权重为8、空位长度延伸罚分为2、以及BLOSUM62打分矩阵(Henikoff和Henikoff，(1989)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:10915)。GAP使用Needleman和Wunsch(1970)J Mol Biol[分子生物学杂志]48:443-53的算法来找到使匹配数目最大化并且使空位数目最小化的两个完整序列的比对。GAP考虑所有可能的比对和空位位置，并且创建具有最大数目的配对碱基和最小空位的比对，使用以配对碱基为单位的空位创建罚分和空位延伸罚分。

本领域技术人员很清楚地理解，许多水平的序列同一性可用于鉴定来自其他物种的多肽或天然或合成修饰的多肽，其中这样的多肽具有相同或相似的功能或活性。百分比同一性的有用实例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％或95％，或从50％至100％的任何整数百分比。实际上，从50％至100％的任何整数氨基酸同一性可以用于描述本披露，例如51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％。

“基因”包括编码并且能够表达功能分子(例如是但不限于特定多肽(例如酶)或功能性RNA分子(例如，指导RNA、反义RNA、核糖酶等))的核酸片段，并且包括在编码序列之前(5'非编码序列)和/或之后(3'非编码序列)的调节序列。“天然基因”是指自然界中发现的具有其自身调节序列的基因。重组基因是指由可以来自不同生物体或相同生物体的不同基因的调节序列调节的基因。

“突变基因”是通过人为干预已经改变的基因。这样的“突变基因”具有通过至少一个核苷酸添加、缺失或取代而与相应的非突变基因的序列不同的序列。在本披露的某些实施例中，突变基因包含由如本文所披露的指导多核苷酸/Cas内切核酸酶系统引起的改变。突变的真菌细胞是包含突变基因的真菌细胞。

如本文中所使用，“靶向突变”是通过使用如本文中所披露的或本领域已知的方法来改变天然基因内的靶序列而进行的天然基因中的突变，所述方法涉及能够在靶序列的DNA中诱导双链断裂的双链断裂诱导剂。

术语“供体DNA”或“供体核酸序列”或“供体多核苷酸”是指包含目的多核苷酸序列的多核苷酸，该目的多核苷酸序列通常结合Cas/指导多核苷酸复合物的活性(其中指导多核苷酸限定靶位点，如上所述)将在靶位点处或附近被插入或将替换在靶位点处或附近的区域。因此，当与在靶位点处或附近将被替换/编辑的核苷酸序列相比时，供体DNA中目的多核苷酸序列可以包括将在靶位点处或附近被插入的新颖区域和/或经修饰的多核苷酸序列。在某些实施例中，供体DNA构建体进一步包含位于目的多核苷酸序列侧翼的第一和第二同源区域。供体DNA的第一和第二同源区域与分别存在于真菌细胞基因组的靶位点中或侧翼的第一和第二基因组区域享有同源性。“同源”意指DNA序列是类似的。例如，在供体DNA上发现的“与基因组区域同源的区域”是与真菌细胞基因组中给定的“基因组序列”具有相似序列的DNA区域。同源区域可以具有足以促进在切割的靶位点处的同源重组的任何长度。例如，同源区域可以包含至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基长度，使得同源区域具有足够同源性以便与相应的基因组区域进行同源重组。“足够的同源性”表示两个多核苷酸序列具有足够的结构相似性以充当同源重组反应的底物。结构相似性包括每个多核苷酸片段的总长度以及多核苷酸的序列相似性。序列相似性可以通过在序列的整个长度上的百分比序列同一性和/或通过包含局部相似性(例如具有100％序列同一性的连续核苷酸)的保守区域以及在序列长度的一部分上的百分比序列同一性来描述。

由靶标和供体多核苷酸享有的同源性或序列同一性的量可以变化，并且包括总长度和/或在约1-20bp、20-50bp、50-100bp、75-150bp、100-250bp、150-300bp、200-400bp、250-500bp、300-600bp、350-750bp、400-800bp、450-900bp、500-1000bp、600-1250bp、700-1500bp、800-1750bp、900-2000bp、1-2.5kb、1.5-3kb、2-4kb、2.5-5kb、3-6kb、3.5-7kb、4-8kb、5-10kb、或多达并包括靶位点的总长度的范围内具有单位整数值的区域。这些范围包括该范围内的每个整数，例如1-20bp的范围包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20bp。同源性的量也可以通过在两个多核苷酸的完整比对长度上的百分比序列同一性来描述，其包括约至少50％、55％、60％、65％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的百分比序列同一性。足够的同源性包括多核苷酸长度、总体百分比序列同一性和任选地连续核苷酸的保守区域或局部百分比序列同一性的任何组合，例如，足够的同源性可以被描述为与靶标基因座的区域具有至少80％序列同一性的75-150bp的区域。足够的同源性也可以通过两个多核苷酸在高严格条件下特异性杂交的预测能力来描述，参见，例如Sambrook等人(1989)MolecularCloning:A Laboratory Manual,(Cold Spring Harbor Laboratory Press,NY)[分子克隆：实验手册(纽约州冷泉港实验室出版)]；Current Protocols in Molecular Biology[分子生物学现代方法]，Ausubel等人，编辑(1994)Current Protocols,(GreenePublishing Associates,Inc.and John Wiley&Sons,Inc)[现代方法(格林出版联合公司和约翰威利父子公司)]；以及Tijssen(1993)Laboratory Techniques in Biochemistryand Molecular Biology--Hybridization with Nucleic Acid Probes,(Elsevier,NewYork)[生物化学和分子生物学实验技术一核酸探针杂交(纽约州爱思唯尔出版社)]。

如本文中所使用，“基因组区域”是存在于靶位点任一侧上的真菌细胞的基因组中的染色体区段，或者可替代地，还包含靶位点的一部分。基因组区域可以包含至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基，使得基因组区域具有足够的同源性以便与相应的同源区域进行同源重组。

如本文中所使用，“同源重组”包括在同源位点处的两个DNA分子之间的DNA片段的交换，并且在本领域中有很好的描述。

表型标记是可筛选或可选择标记，其包括视觉标记和可选择标记，无论其是阳性还是阴性可选择标记。可以使用任何表型标记。具体地，可选择或可筛选的标记包含允许人们通常在特定条件下鉴定或选择含有它的分子或细胞或对其进行选择的DNA区段。这些标记可以编码活性，例如但不限于RNA、肽或蛋白质的产生，或可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。

可选择标记的实例包括但不限于包含限制酶位点的DNA区段；编码对以下各项提供抗性的产物的DNA区段：另外的毒性化合物和抗生素，例如氯嘧磺隆乙酯、苯来特、巴斯塔(Basta)、和潮霉素磷酸转移酶(HPT)；编码另外在受体细胞中缺少的产物的DNA区段(例如，tRNA基因、营养缺陷型标记、显性异源标记-amdS)；编码可以容易地鉴定的产物的DNA区段(例如，表型标记例如β-半乳糖苷酶、GUS；荧光蛋白，例如绿色荧光蛋白(GFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)和细胞表面蛋白)；产生用于PCR的新引物位点(例如，以前未并列的两个DNA序列的并列)，包含通过限制性内切核酸酶或其他DNA修饰酶、化学品等不起作用或起作用的DNA序列；并且包含允许其鉴定的特异性修饰(例如，甲基化)所需的DNA序列。

用于修饰真菌细胞基因组的方法

提供使用指导RNA/Cas内切核酸酶系统用于促进供体DNA与真菌细胞(例如丝状真菌细胞)中的基因组座位的同源重组的方法。

本披露的方面包括通过将Cas内切核酸酶/指导多核苷酸复合物连同包括与基因组座位具有同源性的区域的供体DNA一起瞬时地引入细胞中而使DNA序列与真菌细胞基因组中的基因组座位进行同源重组的方法。Cas内切核酸酶/指导多核苷酸复合物能够在真菌细胞的基因组中希望的靶位点处起作用，其中“起作用”意指由指导多核苷酸(如上所定义)中的序列指导的Cas内切核酸酶在靶位点处切割DNA的任一条或两条链。

能以任何方便的方式进行Cas内切核酸酶、指导多核苷酸和供体DNA的引入，这些方式包括转染、转导、转化、电穿孔、粒子轰击、细胞融合技术等。这些组件中的每一个可以如用户希望的同时或顺序地引入。例如，可以首先用Cas表达DNA构建体稳定转染真菌细胞，随后将指导多核苷酸引入稳定的转染子(直接地或使用表达指导多核苷酸的DNA构建体)。这种设置甚至可能是有利的，因为使用者可以产生稳定的Cas转染子真菌细胞群体，其中可以单独地引入不同的指导多核苷酸(在一些情况下，如果希望的话，可以将多于一个指导多核苷酸引入相同的细胞中)。在一些实施例中，使用者获得表达Cas的真菌细胞，因此使用者不需要将能够表达Cas内切核酸酶的重组DNA构建体引入细胞中，而只需要将指导多核苷酸引入表达Cas的细胞中。

在某些实施例中，通过引入包含编码指导多核苷酸的表达盒(或基因)的重组DNA构建体，将指导多核苷酸引入真菌细胞中。在一些实施例中，将表达盒有效地连接到真核RNA pol III启动子。这些启动子是特别感兴趣的，因为通过RNA pol III的转录不会导致在RNA聚合酶II从RNA pol II依赖性启动子转录时发生的5'帽结构的添加或聚腺苷酸化。在某些实施例中，RNA pol III启动子是丝状真菌细胞U6聚合酶III启动子(例如，SEQ IDNO:40及其功能变体，例如SEQ ID NO:41；下面进行进一步详细的描述)。

当在宿主细胞的基因组DNA中诱导双链断裂(例如，通过在靶位点处的Cas内切核酸酶/指导RNA复合物的活性，具有双链内切核酸酶活性的复合物)时，细胞的DNA修复机制被激活以修复断裂，该断裂由于其易出错的性质，可以在双链断裂位点处产生突变。将断裂的末端合在一起的最常见的修复机制是非同源末端连接(NHEJ)途径(Bleuyard等人，(2006)DNA Repair[DNA修复]5:1-12)。染色体的结构完整性通常通过修复来保存，但缺失、插入或其他重排是可能的(Siebert和Puchta，(2002)Plant Cell[植物细胞]14:1121-31；Pacher等人，(2007)Genetics[遗传学]175:21-9)。

令人惊讶地，我们已发现在丝状真菌中，在双链断裂处的转化的DNA的非同源插入高度优于在双链断裂处染色体DNA两个末端之间的简单末端连接。因此，在通过用含有一个或多个DNA构建体的表达盒进行转化来提供Cas内切核酸酶或指导RNA的情况下，那些DNA构建体或其片段以很高的频率插入双链断裂处。这种插入发生在Cas内切核酸酶或指导RNA表达构建体上的DNA序列与双链断裂周围的序列之间不存在同源性的情况下。当希望供体DNA和基因组座位之间进行同源重组时，这个过程也是有问题的，因为整个供体DNA的插入优于同源重组。我们已发现即使当处于包含预期在真菌细胞中自主维持的端粒序列的载体的形式时，转化的DNA的不希望的插入也会发生。

通过转化被摄取的DNA可以在基因组中以稳定的方式整合，或者其可以瞬时维持。瞬时维持可以通过不稳定的表型识别。例如，可以通过选择存在于转化的DNA上的标记基因来识别DNA摄取。在转化和选择之后，转化体可以在非选择性条件下生长数代，然后转移回到选择性条件。稳定的转化体在转移回到选择性条件之后将能够生长，然而不稳定的转化体由于转化的DNA的丢失，在转移回到选择性条件之后将不能生长。如在下面实例部分中显示的，我们已经证明可以在真菌细胞/不稳定的转化体中瞬时表达Cas内切核酸酶和/或指导RNA。

在希望不稳定的转化体的实施例中，可以使用具有促进自主复制的端粒序列的质粒。也可以使用被设计成自主复制的其他类型的质粒，例如具有自主复制序列、着丝粒序列或其他序列的质粒。令人惊讶的是，在里氏木霉中，我们已发现可以使用没有已知的复制起点、自主复制序列、着丝粒或端粒序列的质粒。通过筛选关于可选择标记显示不稳定表型的转化体，获得没有载体DNA插入的有效靶位点基因修饰(例如，与供体DNA中的同源区域的同源重组)。

本披露的某些实施例包括将Cas内切核酸酶表达盒和第一可选择标记整合到真菌的基因组中，任选地侧翼是重复序列以允许随后除去(环出)表达盒和第一可选择标记，以产生表达Cas内切核酸酶的宿主细胞。能以许多方式将这些细胞用于获得目的遗传修饰，包括与供体DNA的同源重组。

例如，可以用包含含有第二可选择标记(和任选的单独的供体DNA)的指导RNA表达盒的DNA构建体来转化表达Cas内切核酸酶的宿主细胞。使用第二可选择标记选择的宿主细胞将表达来自该DNA构建体的指导RNA，这使得能够具有Cas内切核酸酶活性并靶向基因组中所限定的目的位点。对这些宿主细胞筛选关于第二可选择标记显示不稳定表型的转化体将能够在没有DNA构建体插入的情况下获得具有修饰的目的位点(例如与供体DNA的同源重组)的宿主细胞。

作为另一个实例，可以诱导表达Cas内切核酸酶的宿主细胞以摄取体外合成的指导RNA以使得能够具有Cas内切核酸酶活性并能靶向到基因组中所限定的位点。在一些情况下，希望诱导指导RNA和携带可选择标记基因的单独的DNA构建体的摄取，以允许选择已经摄取DNA并且以很高的频率期望同时摄取指导RNA的那些细胞。如上所述，获得对关于可选择标记显示不稳定表型的那些转化体筛选没有载体DNA插入的目的遗传修饰(例如与供体DNA的同源重组)。

作为又另一个实例，可以使用表达Cas内切核酸酶的宿主细胞来产生可以将Cas内切核酸酶(反向)提供给“靶标菌株”的“辅助菌株”。简言之，例如通过来自每个菌株的原生质体的融合或取决于丝状真菌的种类通过菌丝的接合，可以在辅助菌株和靶标菌株之间产生异核体。异核体的维持将取决于合适的营养性或其他标记基因或在每个亲本菌株中的突变，并且在合适的选择性培养基上生长，使得亲本菌株不能生长，而异核体由于互补性而能够生长。在异核体形成时或随后，通过转染引入指导RNA(以及任选地供体DNA)。指导RNA可以直接引入或经由具有Cas内切核酸酶表达盒和可选择标记基因的DNA构建体引入。Cas内切核酸酶从辅助菌株细胞核中的基因表达，并且存在于异核体的细胞质中。Cas内切核酸酶与指导RNA缔合以产生活性复合物，该复合物靶向基因组中的一个或多个希望的靶位点。随后，从异核体中回收孢子并且对这些孢子进行选择或筛选以回收在靶位点处或附近具有修饰(例如，在基因组座位处与供体DNA的同源重组)的靶标菌株。在使用表达盒引入指导RNA的情况下，选择指导RNA表达构建体不能稳定维持于其中的异核体。

如上所述，本披露的方法包括将DNA构建体引入与Cas/指导RNA复合物的靶位点的每一侧上的染色体DNA的区域具有DNA序列同源性的细胞(或供体DNA)中。意图是为了使DNA片段(例如，线性DNA片段)通过同源整合/同源重组来整合、修复靶位点处的DNA的切割，以及在大多数情况下，在希望的基因座处(即，在Cas/指导RNA复合物的靶位点处或附近)向基因组引入变化。在许多生物体中，染色体DNA中的双链断裂刺激了该位点处的线性DNA片段的同源整合。令人惊讶的是，在具有功能性NHEJ途径的丝状真菌中，我们已发现，即使当引入供体片段时，在双链断裂处通过非同源插入将DNA插入高度优于线性DNA片段的同源重组。

关于真菌细胞中的DNA修复，我们已发现在存在功能性NHEJ途径的情况下，易错修复高度优于在双链断裂位点的同源重组。换句话说，关于丝状真菌细胞中双链断裂的DNA修复，我们已发现在存在功能性NHEJ途径的情况下，DNA在断裂处的非同源插入高度优于(1)不具有DNA插入的非同源末端连接和(2)在双链断裂位点处与供体DNA的同源重组。因此，在本发明的某些方面，在群体中的真菌细胞的靶位点处的非同源末端连接(NHEJ)途径的功能被抑制、没有被激活、是无功能的或减少的。这可以以任何方便的方式实现，其中一些在下面描述。

在一些实施例中，在真菌细胞的靶位点处的非同源末端连接(NHEJ)途径的功能通过改变真菌宿主细胞而被抑制、没有激活、无功能或减少，这样使得NHEJ途径的一个或多个组分是无功能的或具有降低的活性(例如，从基因组中缺失或突变为无功能的或具有较少的活性)。真菌细胞的这种改变可以通过任何方便的手段来实现，这些手段包括基因缺失、基因突变、显性干扰重组蛋白的表达、基因置换、基因表达抑制，例如使用反义RNA/RNAi方法等。在某些方面，NHEJ途径的一个或多个组分选自下组，该组由以下各项组成：ku80、ku70、rad50、mre11、xrs2、lig4和xrs。仅作为一个实例，可用于本发明的方面中的真菌细胞包括抑制ku80的表达和/或活性的遗传修饰。

在另外的实施例中，通过使用具有DNA切口活性的Cas内切核酸酶(即，它在靶位处点仅切割DNA的一条链(也称为Cas切口酶))，在真菌细胞中的靶位点处的非同源末端连接(NHEJ)途径的功能被抑制、没有激活、无功能或减少。与DNA中的双链断裂不同，缺口不会激活NHEJ途径，但是足以促进与具有一个或多个同源区域的供体DNA在切割位点处或附近的同源重组。许多Cas切口酶是野生型Cas内切核酸酶的重组变体，已经在本领域中描述(参见例如上文的定义)并且可以用于所披露的方法。

在一些情况下，供体DNA包括与真菌细胞基因组中相应的第一和第二区域同源的第一区域和第二区域，其中同源区域通常包括或围绕基因组DNA被Cas内切核酸酶切割的靶位点。这些同源区域促进与其相应的同源基因组区域的同源重组，导致在供体DNA和基因组之间的DNA交换。因此，所提供的方法导致供体DNA的目的多核苷酸在真菌细胞基因组中的靶位点中的切割位点处或附近的整合，从而改变原始靶位点，从而产生改变的基因组靶位点。

在给定的基因组区域和在供体DNA上发现的相应的同源区域之间的结构相似性可以是允许同源重组发生的任何程度的序列同一性。例如，由供体DNA的“同源区域”和真菌细胞基因组的“基因组区域”享有的同源性或序列同一性的量可以是至少50％、55％、60％、65％、70％、75％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或甚至100％的序列同一性，使得序列进行同源重组。

供体DNA上的同源区域可以与靶位点侧翼的任何序列具有同源性。虽然在一些实施例中，同源区域与紧邻靶位点侧翼的基因组序列享有显著的序列同源性，但是应当认识到同源区域可以被设计为与可能进一步使5'或3’靠近靶位点的区域具有足够的同源性。在又其他实施例中，同源区域还可以与靶位点的片段以及下游基因组区域具有同源性。在一个实施例中，第一同源区域进一步包含靶位点的第一片段，并且第二同源区域包含靶位点的第二片段，其中第一片段和第二片段不相似。

与Cas内切核酸酶和指导多核苷酸表达构建体一样，供体DNA可以通过任何方便的手段引入(如本文别处讨论的)。

在某些实施例中，Cas内切核酸酶是Cas9内切核酸酶(参见，例如WO 2013141680，名称为“通过Cas9-crRNA复合物的RNA指导的DNA切割(RNA-directed DNA Cleavage bythe Cas9-crRNA Complex)”)。Cas9内切核酸酶的实例包括来自以下各项中的那些：链球菌属(Streptococcus)物种(例如，化脓性链球菌(S.pyogenes)、变异链球菌(S.mutans)和嗜热链球菌(S.thermophilus))；弯曲杆菌属(Campylobacter)物种(例如，空肠弯曲杆菌(C.jejuni))；奈瑟氏菌属(Neisseria)物种(例如，脑膜炎奈瑟球菌(N.meningitides))；弗朗西斯氏菌属(Francisella)物种(例如，新凶手弗朗西斯菌(F.novicida))；巴斯德氏菌属(Pasteurella)物种(例如，多杀巴斯德菌(P.multocida))(参见，例如在如下文献中描述的Cas9内切核酸酶：Fonfara等人，Nucleic Acids Res.[核酸研究]，2013，第1-14页，通过引用结合在此)。在一些实施例中，Cas内切核酸酶由优化的Cas9内切核酸酶基因(例如为了在真菌细胞中表达而被优化)编码(例如，Cas9编码基因含有SEQ ID NO:44，例如SEQ ID NO:7，如下所述)。

在某些情况下，Cas内切核酸酶基因被可操作地连接至编码核定位信号的一种或多种多核苷酸，使得在细胞中表达的Cas内切核酸酶/指导多核苷酸复合物被有效地转运到细胞核。可以使用任何方便的核定位信号，例如，编码SV40核定位信号的多核苷酸存在于Cas密码子区域的上游并与其同框，并且编码来源于里氏木霉blr2(蓝光调节子2)基因的核定位信号的多核苷酸存在于Cas密码子区域的下游并与其同框。可以使用其他核定位信号。

在本披露的某些实施例中，指导多核苷酸是指导RNA，该指导RNA包括可以与II型Cas内切核酸酶形成复合物的、II型CRISPR/Cas系统的crRNA区域(或crRNA片段)和tracrRNA区域(或tracrRNA片段)。如上所述，指导RNA/Cas内切核酸酶复合物可以将Cas内切核酸酶指导至真菌细胞基因组靶位点，使得Cas内切核酸酶能够将双链断裂引入基因组靶位点。在一些情况下，指导RNA/Cas9内切核酸酶复合物的RNA是包含crRNA和单独的tracrRNA的双链体。在其他情况下，指导RNA是包括crRNA区域和tracrRNA区域二者的单个RNA分子(有时被称为融合的指导RNA)。使用融合的指导RNA相对于双链体crRNA-tracrRNA的一个优点是仅需要制备一个表达盒来表达融合的指导RNA。

在本文披露的方法中使用的宿主细胞可以是来自以下各项的任何真菌宿主细胞：门子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(由Hawksworth等人，在：Ainsworth and Bisby's Dictionary of TheFungi,8th edition,1995,CAB International,University Press,Cambridge,UK[真菌的安斯沃思和拜斯比词典，第8版，1995年，英国剑桥CAB国际集团，大学出版社])以及卵菌门(Oomycota)(如在Hawksworth等人，同上中引用的)和所有有丝分裂孢子真菌(Hawksworth等人，同上)。在某些实施例中，真菌宿主细胞是酵母细胞，例如假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或耶氏酵母属(Yarrowia)细胞。酵母的种类包括但不限于以下各项：卡尔斯伯酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉斯酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)、乳酸克鲁维酵母(Kluyromomyces lactis)和解脂耶氏酵母(Yarrowia lipolytica)细胞。在另外的实施例中，真菌细胞是丝状真菌细胞，包括但不限于木霉属(Trichoderma)、青霉属(Penicillium)、曲霉属(Aspergillus)、腐质霉属(Humicola)、金孢子菌属(Chrysosporium)、镰孢属(Fusarium)、脉孢菌属(Neurospora)、毁丝霉属(Myceliophthora)、肉座菌属(Hypocrea)和裸胞壳属(Emericella)的物种。例如，丝状真菌里氏木霉和黑曲霉可用于所披露的方法的方面。

实际上，可以使用所披露的方法靶向在真菌细胞基因组中的任何位点，只要靶位点包括所需的前间区序列邻近基序(PAM)。在化脓性链球菌Cas9的情况下，PAM具有序列NGG(5'至3'；其中N为A、G、C或T)，因此不对基因组中靶位点的选择施加显著的限制。其他已知的Cas9内切核酸酶具有不同的PAM位点(参见，例如在Fonfara等人，Nucleic Acids Res.[核酸研究]，2013，第1-14页(通过引用结合在此)中描述的Cas9内切核酸酶PAM位点)。

靶位点的长度可以变化，并且包括例如为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸长度的靶位点。还有可能靶位点可以是回文的，即，一条链上的序列与在互补链上以相反方向的读取相同。切割位点可以在靶序列内，或者切割位点可以在靶序列之外。在另一种变异中，切割可以发生在彼此正好相对的核苷酸位置处，以产生平端切割，或者在其他情况下，切口可以交错以产生单链突出端，也称为“粘性末端”，其可以是5'悬突或3'悬突。

在一些情况下，还可以使用真菌细胞基因组中的活性变体靶序列，这意味着靶位点与指导多核苷酸中的相关序列(在指导多核苷酸的crRNA序列内)不是100％相同。这样的活性变体可以包含与给定靶位点至少65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的序列同一性，其中活性变体靶序列保留生物活性，因此能够被Cas内切核酸酶识别和切割。测量由内切核酸酶引起的靶位点的双链断裂的测定是本领域已知的，并且通常测量试剂在含有识别位点的DNA底物上的总体活性和特异性。

目的靶位点包括位于目的基因的区域内的靶位点。目的基因内的区域的非限制性实例包括可读框、启动子、转录调节元件、翻译调节元件、转录终止序列、mRNA剪接位点、蛋白质编码序列、内含子位点和内含子增强基序。

在某些实施例中，真菌细胞的基因组的修饰导致可以被检测到的表型效应，并且在许多情况下是用户的期望结果。非限制性实例包括获得可选择的细胞生长表型(例如抗生素的抗性或敏感性、营养缺陷特征的获得或丧失、生长速率的增加或降低等)、表达可检测标记(例如，荧光标记、细胞表面分子、显色酶等)，以及分泌酶(该酶的活性可以在培养上清液中进行检测)。

当真菌细胞的基因组的修饰导致表型效应时，通常使用包括目的多核苷酸的供体DNA，该目的多核苷酸是(或编码)表型标记。可以使用任何方便的表型标记，包括任何可选择或可筛选的标记，其允许人们通常在特定培养条件下鉴定或选择含有该标记的真菌细胞或对其进行鉴定或选择。因此，在本发明的一些方面，具有希望的基因组修饰的真菌细胞的鉴定包括在对靶位点处具有修饰的细胞进行选择或筛选的条件下培养已经接受了Cas内切核酸酶和指导多核苷酸(和任选地供体DNA)的真菌细胞群体。可以使用任何类型的选择系统，包括评估真菌细胞中酶活性的增益或丧失(也称为可选择标记)，例如抗生素抗性的获得或营养缺陷型标记的获得/丧失。

在一些情况下，使用任何方便的方法直接检测真菌细胞中的基因组修饰，这些方法包括测序、PCR、DNA印迹、限制酶分析等，包括此类方法的组合。

在一些实施例中，使用所披露的方法靶向特定基因用于修饰，包括编码以下酶的基因：例如，乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。

执行本文所描述的方法存在许多变化。例如，Cas表达盒可以被整合到真菌宿主细胞的基因组中，而不是使该表达盒作为外源序列而存在。产生这种亲本细胞系将允许使用者简单地引入希望的指导RNA(例如，作为指导RNA表达载体)，该指导RNA然后靶向目的基因组位点，如本文其他地方所详述的。在这些实施例中的一些实施例中，整合的Cas基因可以被设计为包括其侧翼的多核苷酸重复序列，用于随后从基因组中的环出/去除(如果需要的话)。

真菌细胞的组合物

本发明的方面包括可用于实施上述方法的转基因真菌细胞以及所产生的具有修饰的基因组的真菌细胞。因此，本发明的实施例包括通过本文所述方法的任何方面产生的重组真菌细胞以及用于产生它们的任何亲本真菌细胞。

本发明的某些实施例涉及包含Cas内切核酸酶的重组真菌细胞，其中该Cas内切核酸酶从细胞中的重组DNA构建体(第一重组DNA构建体)表达。在一些实施例中，重组真菌细胞具有无功能的或活性降低的NHEJ途径。在上文中详细描述的Cas内切核酸酶和编码其的多核苷酸的实施例可用于这一部分中的真菌细胞组合物中(其中几个在下文中列出)。这种真菌细胞可用作产生具有所希望的目的基因组修饰的真菌细胞的亲本，其中产生基因组修饰包括将指导多核苷酸(例如经由表达盒)引入细胞中，从而允许形成驱动遗传修饰的Cas/指导多核苷酸复合物(如上所述)。在某些方面，NHEJ途径的一个或多个组分在重组真菌细胞中是无功能的或具有降低的活性，例如ku80、ku70、rad50、mre11、xrs2、lig4、xrs及其组合。在一个具体实施例中，重组真菌细胞具有抑制ku80的表达和/或活性的遗传修饰。可以使用任何方便的遗传修饰以实现一个或多个NHEJ途径组分的破坏，包括但不限于基因缺失、基因突变、显性干扰重组蛋白的表达、基因置换、基因表达抑制，例如使用反义RNA/RNAi方法等。

在某些方面，重组真菌细胞进一步包括能够表达指导RNA的第二重组DNA构建体，其中指导RNA和Cas内切核酸酶能够形成复合物，其使得Cas内切核酸酶能够在重组真菌细胞的基因组中的靶位点处引入双链断裂。在上文中详细描述的指导多核苷酸和编码其的多核苷酸的实施例可用于这一部分中的真菌细胞组合物中(其中几个在下文中列出)。指导RNA的表达可以由真核RNA pol III启动子驱动，其中某些实施例中，RNA pol III启动子是丝状真菌细胞U6基因启动子(例如，如在下文进一步详细描述的SEQ ID NO:40或SEQ IDNO:41)及其功能变体。这一复合物的作用可以导致在真菌细胞的靶位点处(如上所述)的基因组DNA序列的修饰，从而产生在靶位点处(或附近)具有修饰的真菌细胞。该修饰可以包括一个或多个核苷酸的缺失、一个或多个核苷酸的插入、一个或多个核苷酸的取代或其任何组合。在一些实施例中，真菌细胞进一步包括具有目的多核苷酸的供体DNA。在供体DNA中目的多核苷酸可以存在于靶位点处(或附近)的基因组中(或插入基因组中，例如通过同源重组)，这是由Cas/指导多核苷酸复合物在靶位点处的作用驱动的过程。

在某些实施例中，由重组多核苷酸编码的Cas内切核酸酶是Cas9内切核酸酶。可以编码任何Cas9内切核酸酶，包括但不限于来自以下细菌物种的Cas9内切核酸酶及其功能片段：链球菌属(Streptococcus)物种(例如，化脓性链球菌(S.pyogenes)、变异链球菌(S.mutans)和嗜热链球菌(S.thermophilus))；弯曲杆菌属(Campylobacter)物种(例如，空肠弯曲杆菌(C.jejuni))；奈瑟氏菌属(Neisseria)物种(例如，脑膜炎奈瑟球菌(N.meningitides))；弗朗西斯氏菌属(Francisella)物种(例如，新凶手弗朗西斯菌(F.novicida))；巴斯德氏菌属(Pasteurella)物种(例如，多杀巴斯德菌(P.multocida))(参见，例如在如下文献中描述的Cas9内切核酸酶：Fonfara等人，Nucleic Acids Res.[核酸研究]，2013，第1-14页，通过引用结合在此)。在一些实施例中，编码Cas内切核酸酶基因的多核苷酸是已经为了在丝状真菌宿主细胞中表达而优化的多核苷酸，例如SEQ ID NO:44(其是化脓性链球菌Cas9内切核酸酶的丝状真菌细胞密码子优化的版本)或SEQ ID NO:7(其含有SEQ ID NO:44并且还包括N-末端和C-末端NLS序列)中所显示的多核苷酸。可以使用另外的密码子优化的Ca9基因，包括SEQ ID NO:44或SEQ ID NO:7的同义变体。如上所述，Cas内切核酸酶可以被有效地连接到一个或多个核定位信号，其功能是增强Cas内切核酸酶到其作用位点(即在细胞核中)的细胞质至细胞核运输。可以使用任何方便的核定位信号，包括SV40核定位信号、来源于里氏木霉blr2(蓝光调节子2)基因的核定位信号或两者的组合。

多种多样的丝状真菌宿主细胞中的任何一种可用于本发明中，包括来自以下各项的真菌宿主细胞：门子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(由Hawksworth等人，在：Ainsworth andBisby's Dictionary of The Fungi,8th edition,1995,CAB International,UniversityPress,Cambridge,UK[真菌的安斯沃思和拜斯比词典，第8版，1995年，英国剑桥CAB国际集团，大学出版社])以及卵菌门(Oomycota)(如在Hawksworth等人，同上中引用的)和所有有丝分裂孢子真菌(Hawksworth等人，同上)。在某些实施例中，真菌宿主细胞是酵母细胞，例如假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或耶氏酵母属(Yarrowia)细胞。酵母的种类包括但不限于以下各项：卡尔斯伯酵母(Saccharomycescarlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉斯酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomycesoviformis)、乳酸克鲁维酵母(Kluyromomyces lactis)和解脂耶氏酵母(Yarrowialipolytica)细胞。在另外的实施例中，真菌细胞是丝状真菌细胞，包括但不限于木霉属(Trichoderma)、青霉属(Penicillium)、曲霉属(Aspergillus)、腐质霉属(Humicola)、金孢子菌属(Chrysosporium)、镰孢属(Fusarium)、脉孢菌属(Neurospora)、毁丝霉属(Myceliophthora)、嗜热真菌属(Thermomyces)、肉座菌属(Hypocrea)和裸胞壳属(Emericella)的物种。例如，丝状真菌里氏木霉、产黄青霉、嗜热毁丝霉、疏棉状嗜热丝孢菌、米曲霉和黑曲霉都可用于本披露的方面中。

如上所述，本发明总体上涉及可用于修饰丝状真菌细胞基因组中目的靶位点的方法和组合物。具体的目的靶位点由这些方法和组合物的使用者确定，并且包括位于目的基因区域内的位点，包括：启动子、调节序列、终止序列、调节元件序列、剪接位点、编码序列、聚泛素化位点、内含子位点和内含子增强基序。另外，任何目的基因可以由使用者选择，包括但不限于：乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。

重组多核苷酸

本发明的方面涉及可用于本文所述的方法和组合物中的重组多核苷酸。

本披露的实施例包括具有与编码Cas内切核酸酶的真菌细胞优化的核苷酸序列可操作地连接的启动子序列的重组多核苷酸DNA构建体。本披露的实施例包括具有与编码Cas内切核酸酶的真菌细胞优化的核苷酸序列或编码Cas内切核酸酶的细菌细胞优化的核苷酸序列可操作地连接的启动子序列的重组多核苷酸DNA构建体。如上所述，在真菌细胞优化的核苷酸序列以及细菌细胞优化的核苷酸序列中编码的Cas内切核酸酶当与指导RNA复合时能够在在靶位点处起作用。任何Cas内切核酸酶可以由优化的核苷酸序列编码，包括但不限于Cas9内切核酸酶，例如来自化脓性链球菌的Cas9。在某些实施例中，将真菌细胞优化的核苷酸序列优化用于在丝状真菌细胞中表达。例如，丝状真菌细胞优化的序列可以编码Cas9内切核酸酶并且包含SEQ ID NO:44中所示的核苷酸序列(100％同一性)，或者编码Cas9内切核酸酶并且包含与SEQ ID NO:44具有至少60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％同一性的核苷酸序列。在某些实施例中，将细菌细胞优化的核苷酸序列优化用于在大肠杆菌细胞中表达。例如，大肠杆菌细胞优化的序列可以编码Cas9内切核酸酶并且包含SEQ ID NO:65中所示的核苷酸序列(100％同一性)，或者编码Cas9内切核酸酶并且包含与SEQ ID NO:65具有至少60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％同一性的核苷酸序列。

本披露的实施例进一步涉及木霉属RNA聚合酶III驱动的启动子。通过RNA polIII从RNA pol III指导的启动子的基因转录不会导致在RNA聚合酶II从RNA pol II依赖性启动子转录时发生的5'帽结构的添加或聚腺苷酸化。如下面实例中所述，我们已经鉴定了在里氏木霉与U6基因相关的RNA pol III驱动的启动子序列、以及转录终止序列。完整的启动子序列在SEQ ID NO:40中列出，并且终止序列在SEQ ID NO:43中列出。另外，鉴定了较短版本的U6基因RNA pol III驱动的启动子，并且将其列于SEQ ID NO:41中。因此，本发明的方面包括如下启动子，该启动子用作RNA pol III驱动的启动子并且具有与SEQ ID NO:40或SEQ ID NO:41具有至少60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或至多100％同一性的核苷酸序列。这种RNA pol III指导的启动子序列可用于表达任何目的异源序列。因此，本披露的方面包括具有与目的异源序列可操作地连接的里氏木霉来源的RNA pol III驱动的启动子序列的重组多核苷酸序列。在某些实施例中，异源序列是编码指导多核苷酸(例如tracrRNA、crRNA或单指导RNA)的序列。靶向特定目的基因组位点的编码指导RNA的多核苷酸在实例中被详细描述并且包括SEQ IDNO:2至6。在某些实施例中，重组多核苷酸进一步包括转录终止序列，该转录终止序列在目的异源序列的下游位点处(其中“下游”是指转录的方向，如本领域常见的)有效地连接到目的异源序列(其有效地连接到RNA pol III启动子)。在一些实施例中，终止序列包括在SEQID NO:43中所显示的多核苷酸序列或其功能变体。因此，在某些实施例中，重组多核苷酸包括有效地连接到与终止子可操作地连接的目的异源序列(例如，指导RNA)的RNA pol III启动子。

本文中披露的组合物和方法的非限制性实例或实施例如下：

1.一种用于使供体DNA与丝状真菌细胞中的基因组座位进行同源重组的方法，该方法包括：

a)向真菌细胞的群体中引入Cas内切核酸酶、指导RNA以及包含与真菌细胞的基因组座位具有同源性的区域的供体DNA，其中该Cas内切核酸酶和指导RNA能够形成使得该Cas内切核酸酶能够在这些真菌细胞的基因组座位内或附近的靶位点处起作用的复合物；并且

b)从该群体中鉴定其中该供体DNA与该基因组座位已经发生了同源重组的至少一个真菌细胞，

其中该Cas内切核酸酶、该指导RNA或两者被瞬时地引入该真菌细胞的群体中。

2.如实施例1所述的方法，其中在这些真菌细胞中的靶位点处的非同源末端连接(NHEJ)机制是未激活的、无功能的或减弱的。

3.如实施例2所述的方法，其中在这些真菌细胞中的非同源末端连接(NHEJ)途径包含一种或多种无功能的或活性降低的组分。

4.如实施例3所述的方法，其中该一种或多种无功能的或活性降低的组分选自下组，该组由以下各项组成：ku80、ku70、rad50、mre11、xrs2、lig4、xrs及其组合。

5.如实施例4所述的方法，其中该一种或多种无功能的或活性降低的组分是ku80。

6.如前述实施例中任一项所述的方法，其中该Cas内切核酸酶是Cas切口酶。

7.如实施例1-5中任一项所述的方法，其中该Cas内切核酸酶是Cas9内切核酸酶或其变体。

8.如实施例7所述的方法，其中该Cas9内切核酸酶或其变体包含来自选自下组的物种的全长Cas9或其功能片段，该组由以下各项组成：链球菌属(Streptococcus)物种，化脓性链球菌(S.pyogenes)、变异链球菌(S.mutans)、嗜热链球菌(S.thermophilus)；弯曲杆菌属(Campylobacter)物种，空肠弯曲杆菌(C.jejuni)；奈瑟氏菌属(Neisseria)物种，脑膜炎奈瑟球菌(N.meningitides)；弗朗西斯氏菌属(Francisella)物种，新凶手弗朗西斯菌(F.novicida)；以及巴斯德氏菌属(Pasteurella)物种，多杀巴斯德菌(P.multocida)。

9.如实施例8所述的方法，其中该Cas9内切核酸酶或其变体包含与SEQ ID NO:45和48至53中任一项具有至少70％同一性的氨基酸序列。

10.如前述实施例中任一项所述的方法，其中该供体DNA包含目的多核苷酸序列，并且其中在基因组座位处的同源重组导致将该目的多核苷酸序列插入该基因组座位中。

11.如前述实施例中任一项所述的方法，其中该引入步骤包括将包含Cas内切核酸酶的表达盒的DNA构建体引入这些真菌细胞中。

12.如前述实施例中任一项所述的方法，其中该引入步骤包括将包含指导RNA的表达盒的DNA构建体引入这些真菌细胞中。

13.如前述实施例中任一项或实施例48-54中任一项所述的方法，其中该引入步骤包括向这些真菌细胞中引入包含编码可选择标记的序列的DNA构建体。

14.如实施例13所述的方法，其中该DNA构建体包含编码该可选择标记的序列和该供体DNA两者。

15.如前述实施例中任一项所述的方法，其中该引入步骤包括向这些真菌细胞中引入DNA构建体，该DNA构建体包含：编码该Cas内切核酸酶的序列、编码该指导RNA的序列、编码可选择标记的序列和该供体DNA。

16.如实施例11至15中任一项所述的方法，其中该DNA构建体是线性DNA构建体。

17.如实施例11至15中任一项所述的方法，其中该DNA构建体是环状DNA构建体。

18.如实施例11和15-17中任一项所述的方法，其中该Cas内切核酸酶的表达盒或编码该Cas内切核酸酶的序列包含为了在丝状真菌细胞中表达而优化的Cas编码序列。

19.如实施例18所述的方法，其中该Cas编码序列是包含与SEQ ID NO:44具有至少70％同一性的多核苷酸序列的Cas9编码序列。

20.如实施例1至10、12至14、和16-17中任一项所述的方法，其中该引入步骤包括将该Cas内切核酸酶直接引入这些真菌细胞中。

21.如实施例1至11、13至14、和16至20中任一项所述的方法，其中该引入步骤包括将该指导RNA直接引入这些真菌细胞中。

22.如前述实施例中任一项所述的方法，其中该Cas内切核酸酶被可操作地连接至核定位信号。

23.如前述实施例中任一项所述的方法，其中该真菌细胞是真菌亚门或盘菌亚门真菌细胞。

24.如前述实施例中任一项所述的方法，其中该真菌细胞选自下组，该组由以下各项组成：木霉属、青霉属、曲霉属、腐质霉属、金孢子菌属、镰孢属、毁丝霉属、脉孢菌属、肉座菌属和裸胞壳属。

25.如前述实施例中任一项所述的方法，其中该靶位点位于选自下组的目的基因的区域中，该组由以下各项组成：可读框、启动子、调节序列、终止序列、调节元件序列、剪接位点、编码序列、聚泛素化位点、内含子位点和内含子增强基序。

26.如前述实施例中任一项所述的方法，其中该同源重组导致在靶位点处或附近的DNA序列的修饰，其中该修饰选自下组，该组由以下各项组成：一个或多个核苷酸的缺失、一个或多个核苷酸的插入、编码目的蛋白质的表达盒的插入、一个或多个核苷酸的取代、及其任何组合。

27.如前述实施例中任一项所述的方法，其中该鉴定步骤包括在对同源重组或修饰进行选择或筛选的条件下培养来自步骤(a)的细胞的群体。

28.如前述实施例中任一项所述的方法，其中该鉴定步骤包括在用于筛选不稳定的转化体的条件下培养来自步骤(a)的细胞的群体。

29.如前述实施例中任一项所述的方法，其中该引入步骤包括向这些真菌细胞中引入包含编码可选择标记的序列和该供体DNA的DNA构建体，并且其中该鉴定步骤包括在对已经丢失该可选择标记但仍保留该供体DNA的不稳定的转化体进行筛选的条件下培养来自步骤(a)的细胞的群体。

30.一种重组丝状真菌细胞，其通过前述实施例中任一项所述的方法产生。

31.一种重组丝状真菌细胞，其包含含有Cas内切核酸酶的表达盒的第一重组DNA构建体。

32.如实施例30或31所述的重组真菌细胞，其中该重组丝状真菌细胞包含在NHEJ途径中的一种或多种无功能的或活性降低的组分。

33.如实施例32所述的重组真菌细胞，其中该NHEJ途径的一种或多种组分选自下组，该组由以下各项组成：ku80、ku70、rad50、mre11、xrs2、lig4和xrs。

34.如实施例33所述的重组真菌细胞，其中该真菌细胞包含抑制ku80的表达和/或活性的遗传修饰。

35.如实施例31所述的重组真菌细胞，其中该Cas内切核酸酶是Cas切口酶。

36.如实施例30至35中任一项所述的重组真菌细胞，该重组真菌细胞进一步包含含有指导RNA的表达盒的第二重组DNA构建体，其中该指导RNA和Cas内切核酸酶能够形成使得Cas内切核酸酶能够在重组丝状真菌细胞的基因组中的靶位点处起作用的复合物。

37.如实施例30至36中任一项所述的重组真菌细胞，该重组真菌细胞进一步包含含有目的多核苷酸的供体DNA。

38.如实施例30至37中任一项所述的重组真菌细胞，其中该Cas内切核酸酶是Cas9内切核酸酶或其变体。

39.如实施例38所述的重组真菌细胞，其中该Cas9内切核酸酶或其变体包含与SEQID NO:45和48至53中任一项具有至少70％同一性的氨基酸序列。

40.如实施例31至39中任一项所述的重组真菌细胞，其中该Cas内切核酸酶的表达盒包含与SEQ ID NO:44具有至少70％同一性的多核苷酸序列。

41.如实施例31至40中任一项所述的重组真菌细胞，其中该Cas内切核酸酶的表达盒包含为了在丝状真菌细胞中表达而优化的Cas内切核酸酶基因。

42.如实施例31至41中任一项所述的重组真菌细胞，其中该Cas内切核酸酶被可操作地连接至核定位信号。

43.如实施例42所述的重组真菌细胞，其中该核定位信号选自下组，该组由以下各项组成：SV40核定位信号(SEQ ID NO:46)、来源于里氏木霉blr2(蓝光调节因子2)基因的核靶向信号(SEQ ID NO:47)、以及两者的组合。

44.如实施例30至43中任一项所述的重组真菌细胞，其中该真菌细胞是选自下组的丝状真菌细胞，该组由以下各项组成：木霉属、青霉属、曲霉属、腐质霉属、金孢子菌属、镰孢属、毁丝霉属、脉孢菌属、肉座菌属和裸胞壳属。

45.一种重组DNA构建体，其包含与编码Cas9内切核酸酶或其变体的丝状真菌细胞优化的多核苷酸序列可操作地连接的启动子。

46.如实施例45所述的重组DNA构建体，其中该丝状真菌细胞优化的多核苷酸序列与SEQ ID NO:44具有至少70％同一性。

47.如实施例12所述的方法，其中该指导RNA的表达盒包含在真子囊菌纲或盘菌纲中有功能的DNA聚合酶III依赖性启动子，并且其中该启动子被可操作地连接至编码该指导RNA的DNA。

48.如实施例47所述的方法，其中该启动子来源于木霉属U6 snRNA基因。

49.如实施例48所述的方法，其中该启动子包含与SEQ ID NO:40或41具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％同一性的核苷酸序列。

50.如实施例49所述的方法，其中该启动子包含SEQ ID NO:40或41的序列。

51.如实施例12和47-50中任一项所述的方法，其中该指导RNA的表达盒包含具有来自木霉属U6snRNA基因的内含子序列的编码指导RNA的DNA。

52.如实施例51所述的方法，其中来源于木霉属U6snRNA基因的内含子序列包含与SEQ ID NO:42具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％同一性的核苷酸序列。

53.如实施例52所述的方法，其中来源于木霉属U6snRNA基因的内含子序列包含SEQ ID NO:42的序列。

实例

在以下实例中，除非另有说明，份数和百分比以重量计，并且度数为摄氏度。应当理解的是，尽管这些实例说明了本披露的实施例，但仅是通过说明的方式给出的。从上述讨论和这些实例，本领域技术人员可以对本披露进行各种改变和修改以使其适应各种用途和条件。这样的修改也旨在落入所附权利要求的范围内。

A部分：通过表达载体引入Cas/指导RNA

实例1：里氏木霉U6snRNA基因的鉴定

希望地是RNA聚合酶III指导的启动子用于在里氏木霉中生产指导RNA，而不添加由使用RNA聚合酶II依赖性启动子产生的5'帽结构或聚腺苷酸化。然而，还没有描述在里氏木霉中有功能的RNA聚合酶III依赖性启动子。考虑对来自其他物种的已知RNA聚合酶III依赖性启动子检测其在包括来自酿酒酵母snr52基因、人U6snRNA基因或玉米U6snRNA基因的5'上游区域的里氏木霉中起作用的能力。

更理想的是鉴定将作为RNA聚合酶III依赖性启动子起作用的天然的里氏木霉序列。使用BLAST算法，使用编码人类U6小核RNA(snRNA；基因库登录号M14486)的DNA序列来搜索里氏木霉v2基因组序列(www.jgi.doe.gov)。鉴定了与人类序列相似的短的里氏木霉DNA序列的区域。周围DNA序列的检查以及与酵母(特别是粟酒裂殖酵母)的U6基因的比较(Marck等人，2006，Nucleic Acids Research[核酸研究]34:1816-1835)允许以此推定鉴定里氏木霉U6基因的许多特征(SEQ ID NO:1，如下所示)。转录序列和终止子的起始被鉴定为上游TATA框。内含子明显地中断转录区域，并且可以在转录区域内识别可能的A-框和B-框启动子元件，后者可以在内含子内识别。(参见图1)。AAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCGCCTTCGGGCATTTGGTCAATTTATAACGATACAGGTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGCTAACAGGTCAACAGAGAAGATTAGCATGGCCCCTGCACTAAGGATGACACGCTCACTCAAAGAGAAGCTAAACATTTTTTTTCTCTTCCAAGTCGTGATGGTTATCTTTTTGCTTAGAGAATCTATTCTTGTGGACGATTAGTATTGGTAAATCCCTGCTGCACATTGCGGCGGATGGTCTCAACGGCATAATACCCCATTCGTGATGCAGCGGTGATCTTCAATATGTAGTGTAATACGTTGCATACACCACCAGGTTCGGTGCCTCCTGTATGTACAGTACTGTAGTTCGACTCCTCCGCGCAGGTGGAAACGATTCCCTAGTGGGCAGGTATTTTGGCGGGGTCAAGAA(SEQID NO:1)

实例2：靶向里氏木霉基因的sgRNA序列

已经显示单指导RNA(sgRNA)分子可以与化脓性链球菌Cas9蛋白质相互作用，以便将该内切核酸酶在体内靶向至真核生物基因组中的特定基因座。sgRNA是一种被设计为tracrRNA和crRNA之间的天然观察到的融合物的杂交分子，该杂交分子将作为化脓性链球菌II型CRISPR-Cas系统的组分(Gasiunas等人(2012)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]109:E2579-86；Jinek等人(2012)Science[科学]337:816-21；Mali等人(2013)Science[科学]339:823-26以及Cong等人(2013)Science[科学]339:819-23)。sgRNA的前20个核苷酸与基因组中的靶位点互补。还需要另外的序列，即前间区序列邻近基序(PAM)存在于与sgRNA-互补区相邻的基因组中的靶位点处。在化脓性链球菌Cas9的情况下，PAM具有序列NGG(其中N是A、G、C或T)。

在这些实验中使用的sgRNA的序列如下所示，其中设计为与靶位点互补的20个核苷酸显示为N残基(SEQ ID NO:2)(N＝A、G、C或U)。

NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGGUGC

设计sgRNA以靶向里氏木霉基因组中的不同基因座。在命名为靶位点1(TS1)的位点处靶向里氏木霉ad3A基因(磷酸核糖基酰氨基咪唑-琥珀酸甲酰胺合酶)的sgRNA序列(称为gAd3A TS1)如下所示(SEQ ID NO:3)。与里氏木霉基因组序列互补的20个核苷酸区域以小写字母表示。

guccucgagcaaaaggugccGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGGUGC

在命名为靶位点2(TS2)的位点处靶向里氏木霉gla1(葡糖淀粉酶)基因的sgRNA序列(称为gTrGA TS2)如下所示(SEQ ID NO:4)。与里氏木霉基因组序列互补的20个核苷酸区域以小写字母表示。

guucagugcaauaggcgucuGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGGUGC

在命名为靶位点11(TS11)的位点处靶向里氏木霉gla1(葡糖淀粉酶)基因的sgRNA序列(称为gTrGA TS11)如下所示(SEQ ID NO:5)。与里氏木霉基因组序列互补的20个核苷酸区域以小写字母表示。

gccaauggcgacggcagcacGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGGUGC

在命名为靶位点6(TS6)的位点处靶向里氏木霉pyr2(乳清酸磷酸核糖基转移酶)基因的sgRNA(称为gPyr2TS6)的序列如下所示(SEQ ID NO:6)。与里氏木霉基因组序列互补的20个核苷酸区域以小写字母表示。

gcacagcgggaugcccuuguGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGGUGC

实例3：在里氏木霉中表达的Cas9DNA和蛋白质序列

设计、合成并测试密码子优化的化脓性链球菌Cas9编码基因(包括NLS序列)，用于在里氏木霉中进行表达(SEQ ID NO:7)。所编码的蛋白质(SEQ ID NO:8)具有N-末端SV40核定位信号(NLS；SEQ ID NO:46)和来自里氏木霉blr2(蓝光调节子2)基因的C-末端NLS(SEQID NO:47；两者在下面SEQ ID NO:8中都加有下划线)。

SEQ ID NO:7

atggcaccgaagaagaagcgcaaggtgatggacaagaagtacagcatcggcctcgacatcggcaccaactcggtgggctgggccgtcatcacggacgaatataaggtcccgtcgaagaagttcaaggtcctcggcaatacagaccgccacagcatcaagaaaaacttgatcggcgccctcctgttcgatagcggcgagaccgcggaggcgaccaggctcaagaggaccgccaggagacggtacactaggcgcaagaacaggatctgctacctgcaggagatcttcagcaacgagatggcgaaggtggacgactccttcttccaccgcctggaggaatcattcctggtggaggaggacaagaagcatgagcggcacccaatcttcggcaacatcgtcgacgaggtggcctaccacgagaagtacccgacaatctaccacctccggaagaaactggtggacagcacagacaaggcggacctccggctcatctaccttgccctcgcgcatatgatcaagttccgcggccacttcctcatcgagggcgacctgaacccggacaactccgacgtggacaagctgttcatccagctcgtgcagacgtacaatcaactgttcgaggagaaccccataaacgctagcggcgtggacgccaaggccatcctctcggccaggctctcgaaatcaagaaggctggagaaccttatcgcgcagttgccaggcgaaaagaagaacggcctcttcggcaaccttattgcgctcagcctcggcctgacgccgaacttcaaatcaaacttcgacctcgcggaggacgccaagctccagctctcaaaggacacctacgacgacgacctcgacaacctcctggcccagataggagaccagtacgcggacctcttcctcgccgccaagaacctctccgacgctatcctgctcagcgacatccttcgggtcaacaccgaaattaccaaggcaccgctgtccgccagcatgattaaacgctacgacgagcaccatcaggacctcacgctgctcaaggcactcgtccgccagcagctccccgagaagtacaaggagatcttcttcgaccaatcaaaaaacggctacgcgggatatatcgacggcggtgccagccaggaagagttctacaagttcatcaaaccaatcctggagaagatggacggcaccgaggagttgctggtcaagctcaacagggaggacctcctcaggaagcagaggaccttcgacaacggctccatcccgcatcagatccacctgggcgaactgcatgccatcctgcggcgccaggaggacttctacccgttcctgaaggataaccgggagaagatcgagaagatcttgacgttccgcatcccatactacgtgggcccgctggctcgcggcaactcccggttcgcctggatgacccggaagtcggaggagaccatcacaccctggaactttgaggaggtggtcgataagggcgctagcgctcagagcttcatcgagcgcatgaccaacttcgataaaaacctgcccaatgaaaaagtcctccccaagcactcgctgctctacgagtacttcaccgtgtacaacgagctcaccaaggtcaaatacgtcaccgagggcatgcggaagccggcgttcctgagcggcgagcagaagaaggcgatagtggacctcctcttcaagaccaacaggaaggtgaccgtgaagcaattaaaagaggactacttcaagaaaatagagtgcttcgactccgtggagatctcgggcgtggaggatcggttcaacgcctcactcggcacgtatcacgacctcctcaagatcattaaagacaaggacttcctcgacaacgaggagaacgaggacatcctcgaggacatcgtcctcaccctgaccctgttcgaggaccgcgaaatgatcgaggagaggctgaagacctacgcgcacctgttcgacgacaaggtcatgaaacagctcaagaggcgccgctacactggttggggaaggctgtcccgcaagctcattaatggcatcagggacaagcagagcggcaagaccatcctggacttcctcaagtccgacgggttcgccaaccgcaacttcatgcagctcattcacgacgactcgctcacgttcaaggaagacatccagaaggcacaggtgagcgggcagggtgactccctccacgaacacatcgccaacctggccggctcgccggccattaaaaagggcatcctgcagacggtcaaggtcgtcgacgagctcgtgaaggtgatgggccggcacaagcccgaaaatatcgtcatagagatggccagggagaaccagaccacccaaaaagggcagaagaactcgcgcgagcggatgaaacggatcgaggagggcattaaagagctcgggtcccagatcctgaaggagcaccccgtggaaaatacccagctccagaatgaaaagctctacctctactacctgcagaacggccgcgacatgtacgtggaccaggagctggacattaatcggctatcggactacgacgtcgaccacatcgtgccgcagtcgttcctcaaggacgatagcatcgacaacaaggtgctcacccggtcggataaaaatcggggcaagagcgacaacgtgcccagcgaggaggtcgtgaagaagatgaaaaactactggcgccagctcctcaacgcgaaactgatcacccagcgcaagttcgacaacctgacgaaggcggaacgcggtggcttgagcgaactcgataaggcgggcttcataaaaaggcagctggtcgagacgcgccagatcacgaagcatgtcgcccagatcctggacagccgcatgaatactaagtacgatgaaaacgacaagctgatccgggaggtgaaggtgatcacgctgaagtccaagctcgtgtcggacttccgcaaggacttccagttctacaaggtccgcgagatcaacaactaccaccacgcccacgacgcctacctgaatgcggtggtcgggaccgccctgatcaagaagtacccgaagctggagtcggagttcgtgtacggcgactacaaggtctacgacgtgcgcaaaatgatcgccaagtccgagcaggagatcggcaaggccacggcaaaatacttcttctactcgaacatcatgaacttcttcaagaccgagatcaccctcgcgaacggcgagatccgcaagcgcccgctcatcgaaaccaacggcgagacgggcgagatcgtctgggataagggccgggatttcgcgacggtccgcaaggtgctctccatgccgcaagtcaatatcgtgaaaaagacggaggtccagacgggcgggttcagcaaggagtccatcctcccgaagcgcaactccgacaagctcatcgcgaggaagaaggattgggacccgaaaaaatatggcggcttcgacagcccgaccgtcgcatacagcgtcctcgtcgtggcgaaggtggagaagggcaagtcaaagaagctcaagtccgtgaaggagctgctcgggatcacgattatggagcggtcctccttcgagaagaacccgatcgacttcctagaggccaagggatataaggaggtcaagaaggacctgattattaaactgccgaagtactcgctcttcgagctggaaaacggccgcaagaggatgctcgcctccgcaggcgagttgcagaagggcaacgagctcgccctcccgagcaaatacgtcaatttcctgtacctcgctagccactatgaaaagctcaagggcagcccggaggacaacgagcagaagcagctcttcgtggagcagcacaagcattacctggacgagatcatcgagcagatcagcgagttctcgaagcgggtgatcctcgccgacgcgaacctggacaaggtgctgtcggcatataacaagcaccgcgacaaaccaatacgcgagcaggccgaaaatatcatccacctcttcaccctcaccaacctcggcgctccggcagccttcaagtacttcgacaccacgattgaccggaagcggtacacgagcacgaaggaggtgctcgatgcgacgctgatccaccagagcatcacagggctctatgaaacacgcatcgacctgagccagctgggcggagacaagaagaagaagctcaagctctag

SEQ ID NO:8

MAPKKKRKVMDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDK KKKLKL

实例4：Cas9表达载体的构建

将上文所示的编码Cas9的合成DNA序列插入pENTR/D-TOPO中，以使其位于侧翼的attL1和attL2位点之间，使得能够通过Invitrogen^TM 克隆技术(纽约州格兰德艾兰市赛默飞世尔科技公司(Thermo Fisher Scientific Inc.,Grand Island,NY))将其转移到合适的表达载体中。可获得Gateway兼容的表达载体pTrex2gHyg，其包含以下特征：来自里氏木霉pki1(丙酮酸激酶)基因的启动子区域和来自里氏木霉cbh1(纤维二糖水解酶I)基因的终止子区域被Gateway克隆位点分离；细菌潮霉素磷酸转移酶基因与粗糙脉孢菌cpc1(交叉途径对照1)启动子区域以及构巢曲霉trpC(具有谷氨酰胺氨基转移酶、吲哚甘油磷酸酯合酶和磷酸核糖基邻氨基苯甲酸异构酶活性的三功能蛋白)终止子区域功能连接；并且将细菌载体序列在大肠杆菌中进行选择和维持。使用Gateway克隆程序将cas9基因克隆到pTrex2gHyg中以给出pTrex2gHyg MoCas(参见图2)。

实例5：sgRNA表达载体的构建

获得编码以不同的推定RNA聚合酶III依赖性启动子和终止子为侧翼的gAd3A TS1sgRNA的合成DNA序列。这些合成DNA序列中的每一个在任一末端还具有限制酶识别位点(EcoRI和BamHI)。

以下序列编码具有酿酒酵母snr52启动子和酿酒酵母sup4终止子的gAd3A TS1sgRNA(已加下划线)(表示为gAd3A TS1-1；SEQ ID NO:9)：

gaattcggatccTCTTTGAAAAGATAATGTATGATTATGCTTTCACTCATATTTATACAGAAACTTGATGTTTTCTTTCGAGTATATACAAGGTGATTACATGTACGTTTGAAGTACAACTCTAGATTTTGTAGTGCCCTCTTGGGCTAGCGGTAAAGGTGCGCATTTTTTCACACCCTACAATGTTCTGTTCAAAAGATTTTGGTCAAACGCTGTAGAAGTGAAAGTTGGTGCGCATGTTTCGGCGTTCGAAACTTCTCCGCAGTGAAAGATAAATGATCgtcctcgagcaaaaggtgccGTTTTAG AGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTGTTTTTTATGTCTgaattcggatcc

以下序列编码具有里氏木霉U6启动子和终止子的gAd3A TS1 sgRNA(已加下划线)(表示为gAd3A TS1-2；SEQ ID NO:10)：

gaattcggatccAAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCgtcctcgagcaaaaggtgccGTTTTAGAGCTAGAAATAGCAAGTTA AAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTTCTCTTgaattcggatcc

以下序列编码具有里氏木霉U6启动子、终止子和内含子(斜体)的gAd3A TS1sgRNA(已加下划线)(表示为gAd3A TS1-3；SEQ ID NO:11)：

gaattcggatccAAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCgtcctcgagcaaaaggtgccGTTTTAGAGCTAGA AATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTTCTCTTgaattcggatcc

质粒p219M(图3)是包含里氏木霉pyr4(乳清酸核苷一磷酸盐脱羧酶)基因的大肠杆菌载体，该载体包括其天然的启动子和终止子。将该载体用EcoRI和BamHI消化，并将末端脱磷酸化。将上述合成的DNA分子中的每一个用EcoRI和BamHI消化，并且与切割的p219M连接以产生一系列含有sgRNA表达盒和pyr4基因的载体。每个载体以其编码的sgRNA的名称命名(例如，p219M gAd3A TS1-1并入具有酿酒酵母snr52启动子和sup4终止子的gAd3A表达盒)。

获得具有较短的里氏木霉U6启动子区域的指导RNA表达盒作为合成DNA。这里提供了一个包括用于sgRNA在TS11处靶向里氏木霉gla1基因的序列的实例(SEQ ID NO:12；内含子序列加有下划线)。

AATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCgccaatggcgacggcagcacGTTTTAGAGCTAGAGTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGC TAACAGAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTTCTCTT

使用引物gRNA fwd aflII(5’-cgtcagcttaaGAATTCCTAAAGAAACAGCATGAAATGG；SEQID NO:13)和gRNA rev sfiI(5’-cgtcagggccacgtgggccAAGAGAAAAAAAAGCACCACCGACTCGG；SEQ ID NO:14)，通过PCR扩增上述gRNA表达盒。这些引物向指导RNA表达盒的5'末端添加aflII位点且向3'末端添加sfiI位点。根据制造商的指示，使用凯杰PCR纯化试剂盒(QiagenPCR Purification Kit)纯化PCR产物。然后将PCR产物用SfiI和AflII消化，并在凯杰PCR纯化试剂盒上再次清洗。质粒pTrex2g/Hyg MoCas用SfiI和AflII消化，并且使用罗氏快速碱性磷酸酶试剂盒(Roche Rapid alkaline phosphatase kit)(印第安纳州罗氏诊断公司(Roche Diagnostics Corp.,IN))进行脱磷酸化。最终使用罗氏快速DNA连接酶试剂盒(Roche Rapid DNA ligase kit)将消化的质粒和PCR产物进行连接以产生pTrex2g/HygMoCas gTrGA TS11B。以类似的方式将其他sgRNA表达盒插入pTrex2g/Hyg MoCas中。

实例6：里氏木霉中Cas9介导的基因失活

下面描述了一系列实验，其中用两个单独的表达载体共转化(一个用于生产Cas9，并且一个用于生产gRNA)，或者用表达Cas9和gRNA两者的单一载体转化里氏木霉菌株。这些实验证明，只有当U6内含子也存在于gRNA转录区域内时，来自里氏木霉U6基因的5'上游区域才能促进gRNA转录。实验还表明，靶向基因失活可以在里氏木霉转化体中高效发生。

ad3A基因的失活

使用来源于公开可获得的菌株RL-P37的里氏木霉菌株，其中编码四种主要的分泌纤维素酶的基因(cbh1、cbh2、egl1、和egl2)被缺失。该菌株也缺乏功能性pyr4基因。使用基因枪转化(如US 20060003408A1中所述)、用相等量的pTrex2gHyg MoCas(图2)以及p219MgAd3A TS1-1、p219M gAd3A TS1-2或p219M gAd3A TS1-3的混合物进行共转化。在含有2％葡萄糖、100mg/L潮霉素B和200mg/L腺嘌呤的Vogel基本培养基的琼脂板上选择转化体。在第一板上选择后，将转化体菌落挑取到相同选择性培养基的新鲜板上。在第二平板上的生长期间，能够区分稳定和不稳定的潮霉素抗性转化体。稳定的转化体生长更快，菌落具有光滑的轮廓，并且菌丝体更密集。不稳定的转化体生长更慢，具有较不密集的菌丝体，并且菌落具有粗糙的不规则轮廓。在第二板上生长后，将转化体转移到具有葡萄糖、不具有潮霉素且具有14mg/L腺嘌呤的Vogel培养基中，以便筛选展现出红色/棕色的那些转化体，表明它们是腺嘌呤营养缺陷体。用p219M gAd3A TS1-1获得5个稳定的和23个不稳定的转化体，并且全部为腺嘌呤原养型微生物。用p219M gAd3A TS1-2获得11个稳定的和38个不稳定的转化体，并且11个稳定的和29个不稳定的转化体全部为腺嘌呤原养型微生物。用p219M gAd3ATS1-3获得19个稳定的和2个不稳定的转化体，并且全部为腺嘌呤营养缺陷体。显然，用gAd3A TS1-3仅获得腺嘌呤营养缺陷体，该gAd3A TS1-3使用里氏木霉U6启动子、内含子和终止子来控制sgAd3A TS1的转录。腺嘌呤营养缺陷体表示在天然的里氏木霉ad3A基因座处的靶向Cas9切割。可以得出结论，Cas9介导的基因失活是有效的，因为所测试的具有gAd3ATS1-3的转化体全部是腺嘌呤营养缺陷体。

为了确定具有pTrex2gHyg MoCas和p219M gAd3A TS1-3的共转化体中ad3A基因座处的突变，从10个稳定的腺嘌呤营养缺陷型转化体中提取基因组DNA。将这个DNA用作使用若干种不同的引物对的PCR的模板，这些引物对设计来产生跨越Cas9靶位点或处于靶位点的上游或下游的产物。根据制造商的指示，将PfuUltra II Fusion HS DNA聚合酶(加利福尼亚州圣克拉拉市安捷伦科技公司(Agilent Technologies,Santa Clara,CA))用于PCR。在每种情况下，延伸时间是由制造商针对如下所述的PCR产物的预期大小建议的。通过琼脂糖凝胶电泳评估PCR产物的大小。

使用扩增TS1靶位点5'侧的区域的Ad3 5'fwd+Ad3 5'rev引物(分别为5’-tgaacacagccaccgacatcagc[SEQ ID NO:15]和5’-gctggtgagggtttgtgctattg[SEQ ID NO:16])，在所有转化体中获得预期大小(872bp)的PCR产物。

使用扩增TS1靶位点5'侧的区域的Ad3 5'fwd+Ad3a 5005rev引物(分别为5’-tgaacacagccaccgacatcagc[SEQ ID NO:15]和5’-gattgcttgggaggaggacat[SEQ ID NO:17])，在所有转化体中获得预期大小(1214bp)的PCR产物。

使用扩增TS1靶位点3'侧的区域的Ad3 3’fwd+Ad3 3’rev引物(分别为5’-cgaggccactgatgaagttgttc[SEQ ID NO:18]和5’-cagttttccaaggctgccaacgc[SEQ ID NO:19])，在所有转化体中获得预期大小(904bp)的PCR产物。

使用扩增TS1靶位点3’侧的区域的Ad3a 5003 fwd+Ad3mid rev引物(分别为5’-ctgatcttgcaccctggaaatc[SEQ ID NO:20]和5’-ctctctatcatttgccaccctcc[SEQ ID NO:21])，在所有转化体中获得预期大小(757bp)的PCR产物。

上述PCR结果表明，基因组DNA制备具有足以从Cas9靶位点的上游或下游获得PCR产物的质量。

使用跨越ad3A中TS1靶位点的Adfrag fwd+Adfrag rev引物(分别为5’-ctccattcaccctcaattctcc[SEQ ID NO:22]和5’-gttcccttggcggtgcttggatc[SEQ ID NO:23])，任何转化体都不能获得PCR产物。假定没有由Cas9活性引起大的尺寸变化的这种PCR产物的预期大小为大约764bp。

使用跨越ad3A中TS1靶位点的Adfrag fwd+Ad3 3’rev引物(分别为5’-ctccattcaccctcaattctcc[SEQ ID NO:22]和5’-cagttttccaaggctgccaacgc[SEQ ID NO:19])，任何转化体都不能获得PCR产物。假定没有由Cas9活性引起大的尺寸变化的这种PCR产物的预期大小为大约2504bp。

使用跨越ad3A中TS1靶位点的Ad3a 2k fwd+Ad3a 2k rev引物(分别为5’-caatagcacaaaccctcaccagc[SEQ ID NO:24]和5’-gaacaacttcatcagtggcctcg[SEQ ID NO:25])，任何转化体都不能获得PCR产物。假定没有由Cas9活性引起大的尺寸变化的这种PCR产物的预期大小为大约1813bp。

使用跨越TS1靶位点的Adfrag fwd+Ad3mid rev引物(分别为5’-ctccattcaccctcaattctcc[SEQ ID NO:22]和5’-ctctctatcatttgccaccctcc[SEQ ID NO:21])，这些转化体中的5个也没有产生PCR产物。假定没有由Cas9活性引起大的尺寸变化的这种PCR产物的预期大小为大约1438bp。

基于已公开的数据，Cas9介导的基因失活通常涉及在靶位点处的DNA中双链断裂的易错修复。最终的结果是在靶位点处的小的缺失或插入(indel)。来自PCR分析的上述结果是令人惊讶的，因为不可能获得跨越靶位点的预期大小的PCR产物，表明ad3A的失活不是由于靶位点处的小的插入或缺失(indel)引起的。相反，这些数据与ad3A的失活是由染色体重排或在靶位点处大的插入引起的可能性一致。

葡糖淀粉酶(GA)基因的失活

使用来源于公开可获得的菌株RL-P37的里氏木霉菌株，其中编码四种主要的分泌纤维素酶的基因(cbh1、cbh2、egl1、和egl2)被缺失。该菌株也缺乏功能性pyr4基因。该菌株使用基因枪方法、用相等量的pTrex2gHyg MoCas和p219M gTrGA TS2的混合物进行共转化。在含有1％葡萄糖、100ug/ml潮霉素B和2mg/ml尿苷的Vogel基本培养基的琼脂板上选择转化体。在第一板上选择后，将转化体菌落挑取到相同选择性培养基的新鲜板上。在第二板上生长期间，可以区分稳定和不稳定的潮霉素抗性转化体。获得了17个稳定的和4个不稳定的转化体。将这些转化体转移到没有葡萄糖并具有1％不溶性淀粉的Vogel琼脂平板上，以针对所分泌的葡糖淀粉酶的存在或不存在进行筛选。能够分泌葡糖淀粉酶的菌落生长良好并形成孢子。不能分泌葡糖淀粉酶的菌落生长了非常稀疏的菌丝体并且是可明显区分的。17个稳定的转化体中的14个不能分泌葡糖淀粉酶，并且全部4个不稳定的转化体都不分泌葡糖淀粉酶。

为了确定具有pTrex2gHyg MoCas和p219M gTrGA TS2的共转化体中gla1(葡糖淀粉酶)基因座处的突变，从5个稳定的不生产葡糖淀粉酶的转化体中提取基因组DNA。将这个DNA用作使用不同的引物对的PCR的模板，这些引物对设计来产生跨越Cas9靶位点或处于靶位点的上游或下游的产物。根据制造商的指示，将PfuUltra II Fusion HS DNA聚合酶(安捷伦科技公司(Agilent Technologies))用于PCR。在每种情况下，延伸时间是由制造商针对如下所述的PCR产物的预期大小建议的。通过琼脂糖凝胶电泳评估PCR产物的大小。

使用跨越gla1中TS2靶位点的glaA+glaB引物(分别为5’-ccgttagttgaagatccttgccg[SEQ ID NO:26]和5’-gtcgaggatttgcttcatacctc[SEQ ID NO:27])，任何转化体都不能获得PCR产物。假定没有由Cas9活性引起大的尺寸变化的这种PCR产物的预期大小为大约1371bp。

使用扩增TS2靶位点5'侧的区域的glaA+glaJ引物(分别为5’-ccgttagttgaagatccttgccg[SEQ ID NO:26]和5’-tgccgactttgtccagtgattcg[SEQ ID NO:30])，在所有转化体中获得预期大小(364bp)的条带。

使用扩增TS2靶位点3'侧的区域的glaK+glaB引物(分别为5’-ttacatgtggacgcgagatagcg[SEQ ID NO:31]和5’-gtcgaggatttgcttcatacctc[SEQ ID NO:27])，在这些转化体中的4个中获得预期大小(520bp)的条带。使用该引物对，这些转化体中的一个没有给出PCR产物。

使用来源于RL-P37并且具有无活性的pyr4基因的里氏木霉菌株进行旨在证明通过靶向Cas9作用来使gla1基因失活的单独实验。使用聚乙二醇介导的程序(如下所述)，用pTrex2gHyg MoCas gTrGA TS11转化该菌株的原生质体。在具有2％葡萄糖、2mg/ml尿苷、1.1M山梨糖醇和100μg/ml潮霉素B的Vogel基本培养基的琼脂板上选择转化体。在第一板上选择后，将转化体菌落挑取到没有山梨糖醇的相同选择性培养基的新鲜板上。在第二板上生长期间，可以区分稳定和不稳定的潮霉素抗性转化体。将转化体转移到不具有葡萄糖且具有1％不溶性淀粉的Vogel琼脂板上，以针对所分泌的葡糖淀粉酶的存在或不存在进行筛选。选择不分泌葡糖淀粉酶的5个稳定的转化体(命名为B#1、B#2、B#4、B#5和B#6)用于进一步分析。从这些转化体中的每一个提取基因组DNA。

使用基因组DNA作为模板和引物gla1repF和gla1repR(分别为5’-gtgtgtctaatgcctccaccac[SEQ ID NO:32]和5’-gatcgtgctagcgctgctgttg[SEQ ID NO:23])进行PCR，其从跨越TS11靶位点的野生型gla1基因座产生983bp的产物。PCR条件包括随着每个PCR循环逐渐降低引物退火温度以及长的延伸时间以确定在靶位点处是否存在大的插入。具体的PCR条件如下。

步骤1：94℃持续1分钟

步骤2：94℃持续25秒

步骤3：63℃持续30秒(每循环温度降低0.2℃)

步骤4：70℃持续8分钟

步骤2-4重复另外24次

步骤5：保持在4℃

从两个转化体(B#1和B#6)获得大于12kb的明确的PCR产物，表明在跨越靶位点的DNA区域中增加了大于11kb。其他三个转化体只产生了在琼脂糖凝胶电泳上显示为低强度条带的非特异性PCR产物。来自B#6的>12kb PCR产物的序列分析表明，在TS11靶位点处插入了来源于质粒pTrex2gHyg MoCas gTrGA TS11的DNA。

使用基因组DNA样品B#2、B#4和B#5以及引物对1553R和1555F(分别为5’-CCGTGATGGAGCCCGTCTTCT[SEQ ID NO:34]和5’-CGCGGTGAGTTCAGGCTTTTTC[SEQ ID NO:35])进行PCR。引物1553R与靶位点11的3'侧的gla1基因结合。引物1555F在质粒pTrex2gHygMoCas gTrGA TS11上的潮霉素磷酸转移酶(hygB)基因的起始密码子附近结合。如上所述使用相同的PCR条件。对于转化体B#4和B#5，分别获得了4.5kb和6.5kb的PCR产物。只有具有hygB基因的质粒已经插入gla1基因中才能获得PCR产物。推测，在转化体B#4和B#5中插入的质粒DNA如此大以致于使用引物gla1repF和gla1repR不可能获得PCR产物。

总之，PCR数据表明，通过在gla1基因的靶位点处插入大的Cas9区段和指导RNA表达载体，出现了具有葡糖淀粉酶失活的稳定的潮霉素抗性转化体。

pyr2基因的失活

用质粒pTrex2gHyg MoCas的包括靶向里氏木霉pyr2基因内的不同位置的指导RNA表达盒的衍生物，通过PEG介导的原生质体转化产生了里氏木霉菌株QM6a或RL-P37的转化体。该基因的失活赋予尿苷营养缺陷体和对5-氟乳清酸(FOA)的抗性。最初在含有潮霉素B的培养基上选择转化体。一旦转移到含有潮霉素B的新鲜琼脂板上，它们就被记分为稳定的或不稳定的。然后将转化体转移到具有2mg/ml尿苷和1.2mg/ml FOA的Vogel基本培养基的琼脂板上。在FOA存在下生长的能力暗示由于Cas9介导的pyr2基因失活引起的尿苷营养缺陷体。

从一些FOA抗性潮霉素稳定的和不稳定的转化体中提取基因组DNA用于PCR分析。用于该分析的引物是设计以扩增跨越靶位点且具有大约0.8kb长度的pyr2基因座区域的pyr2F(5’-gtataagagcaggaggagggag[SEQ ID NO:36])和pyr2R(5’-gaacgcctcaatcagtcagtcg[SEQ ID NO:37])。

在显示为FOA抗性的QM6a转化体中，使用具有足以扩增假定其大小与野生型菌株相似的pyr2基因座的区域的扩增时间的PCR方案测试了18个稳定和5个不稳定的潮霉素抗性转化体。没有一个稳定的转化体使用这个短延伸时间产生了PCR产物，然而不稳定的转化体中有2个的确产生了PCR产物。这两个PCR产物的DNA序列分析显示，在预期的靶位点处一个具有单个核苷酸缺失，另一个具有111nt缺失。

在显示为FOA抗性的RL-P37转化体中，使用具有短延伸时间的PCR方案测试了4个稳定和2个不稳定的潮霉素抗性转化体。没有一个稳定的转化体使用这个短延伸时间产生了PCR产物，然而全部两个不稳定的转化体的确产生了PCR产物。这两个PCR产物的DNA序列分析显示，在预期的靶位点处一个具有单个核苷酸缺失，且另一个具有134nt的插入。该插入由pTrex2gHyg载体的两个小片段组成。

使用先前所述的设计使得能够扩增假定在pyr2基因座的靶位点处插入了大的DNA片段的pyr2基因座区域的PCR方案分析了不同的6个稳定的潮霉素抗性RL-P37转化体。全部6个转化体用这个长延伸时间方案产生了大的PCR产物(在大约5kb与>12kb之间，取决于转化体)。这些PCR产物中的5个的DNA序列分析显示，pTrex2gHyg载体DNA或其片段在所有情况下都被整合。

总之，这些数据表明，由Cas9引起的双链断裂的修复主要涉及在稳定的转化体中整合大的载体片段。这可能是非常有效的基因失活方法。这也证明，在Cas9切割和双链断裂形成之后，携带功能基因并且与靶位点不具有序列同源性的DNA片段或载体可以在靶位点处以位点特异性方式整合。相比之下，在不稳定的转化体中，小的缺失或插入(indel)与由Cas9引起的基因失活有关联。如果载体整合是不希望的，这是基因失活的首选方法。

实例7：使用具有端粒的表达载体表达cas9和sgRNA

构建了包含里氏木霉端粒序列的Cas9和指导RNA表达载体pTrex2gHyg MoCASgPyr2TS6的版本(显示于图6中)。将下面显示的DNA序列(SEQ ID NO:38)插入载体中。加有下划线的区域包含重复的端粒序列，每个序列朝向该片段的中心阅读。中心部分是具有启动子和终止子的细菌卡那霉素抗性基因，该基因使得能够在大肠杆菌中进行选择以确保维持端粒重复序列。在木霉属中，具有端粒的载体有望在每一末端用端粒序列线性化，并且应该以低拷贝数自主维持，尽管偶尔也可能整合到染色体DNA中。

tcaggaaatagctttaagtagcttattaagtattaaaattatatatatttttaatataactatatttctttaataaa taggtattttaagctttatatataaatataataataaaataatatattatatagctttttattaataaataaaatag ctaaaaatataaaaaaaatagctttaaaatacttatttttaattagaattttatatatttttaatatataagatctt ttacttttttataagcttcctaccttaaattaaatttttacttttttttactattttactatatcttaaataaaggc tttaaaaatataaaaaaaatcttcttatatattataagctataaggattatatatatatttttttttaatttttaaa gtaagtattaaagctagaattaaagttttaattttttaaggctttatttaaaaaaaggcagtaatagcttataaaag aaatttctttttcttttatactaaaagtactttttttttaataaggttagggttagggtttactcacaccgaccatc ccaaccacatcttagggttagggttagggttagggttagggttagggttagggttagggtaagggtttaaacaaagccacgttgtgtctcaaaatctctgatgttacattgcacaagataaaaatatatcatcatgaacaataaaactgtctgcttacataaacagtaatacaaggggtgttatgagccatattcaacgggaaacgtcttgctcgaggccgcgattaaattccaacatggatgctgatttatatgggtataaatgggctcgcgataatgtcgggcaatcaggtgcgacaatctatcgattgtatgggaagcccgatgcgccagagttgtttctgaaacatggcaaaggtagcgttgccaatgatgttacagatgagatggtcagactaaactggctgacggaatttatgcctcttccgaccatcaagcattttatccgtactcctgatgatgcatggttactcaccactgcgatccccgggaaaacagcattccaggtattagaagaatatcctgattcaggtgaaaatattgttgatgcgctggcagtgttcctgcgccggttgcattcgattcctgtttgtaattgtccttttaacagcgatcgcgtatttcgtctcgctcaggcgcaatcacgaatgaataacggtttggttgatgcgagtgattttgatgacgagcgtaatggctggcctgttgaacaagtctggaaagaaatgcataagcttttgccattctcaccggattcagtcgtcactcatggtgatttctcacttgataaccttatttttgacgaggggaaattaataggttgtattgatgttggacgagtcggaatcgcagaccgataccaggatcttgccatcctatggaactgcctcggtgagttttctccttcattacagaaacggctttttcaaaaatatggtattgataatcctgatatgaataaattgcagtttcatttgatgctcgatgagtttttctaatcagaattggttaattggttgtaacactggcagagcattacgctgacttgacgggacggcggctttgttgaataaatcgaacttttgctgagttgaaggatcagatcacgcatcttcccgacaacgcagaccgttccgtggcaaagcaaaagttcaaaatcaccaactggtccacctacaacaaagctctcatcaaccgtggctccctcactttctggctggatgatggggcgattcaggcctggtatgagtcagcaacaccttcttcacgaggcagacctcagcggtttaaacctaaccctaaccctaac cctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaacctaaccctaat ggggtcgatctgaaccgaggatgagggttctatagactaatctacaggccgtacatggtgtgattgcagatgcgacg ggcaaggtgtacagtgtccagaaggaggagagcggcataggtattgtaatagaccagctttacataataatcgcctg ttgctactgactgatgaccttcttccctaaccagtttcctaattaccactgcagtgaggataaccctaactcgctct ggggttattattatactgattagcaggtggcttatatagtgctgaagtactataagagtttctgcgggaggaggtgg aaggactataaactggacacagttagggatagagtgatgacaagacctgaatgttatcctccggtgtggtatagcga attggctgaccttgcagatggtaatggtttaggcagggtttttgcagagggggacgagaacgcgttctgcgatttaa cggctgctgccgccaagctttacggttctctaatgggcggccgc(SEQ ID NO:38)

通过PEG-介导的原生质体转化将该载体插入里氏木霉菌株RL-P37中。针对潮霉素抗性选择转化体，并且将其转移到具有潮霉素的新鲜琼脂板上。大多数转化体显示出不稳定的潮霉素抗性表型。将各个转化的菌落转移到含有2mg/ml尿苷和1.2mg/ml 5-氟乳清酸的基本培养基琼脂板上，以选择能够生长并因此具有Pyr阴性表型的那些。142个不稳定的转化体中的8个(6％)是Pyr阴性。通过PCR对pyr2基因座的分析和对这些转化体中的三个的测序显示，两个在靶位点处具有小的缺失(分别为1bp和27bp)并且一个具有1bp缺失连同来源于pTrex2gHyg MoCAS gPyr2TS6的细菌载体部分的68bp的插入。尽管使用设计以扩增大的DNA片段的PCR条件，其他5个转化体也没有产生PCR产物[PCR条件：步骤1：94℃持续1分钟；步骤2：94℃持续25秒；步骤3：63℃持续30秒(每循环温度降低0.2℃)步骤4：70℃持续8分钟；步骤2-4重复另外24次；步骤5：保持在4℃。聚合酶：PfuUltra II Fusion HS DNA聚合酶(安捷伦科技公司(Agilent Technologies))]。

这些结果表明，Cas9和指导RNA从自主复制的载体中的表达使得Cas9能够靶向特定的基因座(在这个情况下为pyr2)。所得的基因失活可以发生而不在靶位点处插入载体DNA。

实例8：通过同源整合的基因编辑

将里氏木霉菌株T4(1)7用于以下的实验。这是通过针对增加的纤维素酶生产力筛选的来源于RL-P37并且具有使pyr2基因失活从而使菌株成为尿苷营养缺陷体的单个点突变的菌株。

设计并定制了称为Gla1rep、具有下面所显示的序列(SEQ ID NO:39)的合成DNA片段。

gtgtgtctaatgcctccaccacaggaaccaaaccggctttgacctctgggaagaagtcaatgggagctcattctttactgttgccaaccagcaccgaggtatgaagcaaatcctcgacattcgctgctactgcacatgagcattgttactgaccagctctacagcacttgtcgagggcgccactcttgctgccactcttggccagtcgggaagcgcttattcatctgttgctccccaggttttgtgctttctccaacgattctgggtgtcgtctggtggatacgtcgactccaacagtatgtcttttcactgtttatatgagattggccaatactgatagctcgcctctagtcaacaccaacgagggcaggactggcaaggatgtcaactccgtcctgacttccatccacaccttcgatcccaaccttggctgtgacgcaggcaccttccagccatgcagtgacaaagcgctctccaacctcaaggttgttgtcgactccttccgctccatctacggcgtgaacaagggcattcctgCGgtgctgccgtcgccattggccggtatgcagaggatgtgtactacaacggcaacccttggtatcttgctacatttgctgctgccgagcagctgtacgatgccatctacgtctggaagaagacgggctccatcacggtgaccgccacctccctggccttcttccaggagcttgttcctggcgtgacggccgggacctactccagcagctcttcgacctttaccaacatcatcaacgccgtctcgacatacgccgatggcttcctcagcgaggctgccaagtacgtccccgccgacggttcgctggccgagcagtttgaccgcaacagcggcactccgctgtctgcgcttcacctgacgtggtcgtacgcctcgttcttgacagccacggcccgtcgggctggcatcgtgcccccctcgtgggccaacagcagcgctagcacgatc

Gla1rep序列是在ORF内982bp的gla1基因座。它跨越TS11靶位点(已加下划线)。就在TS11靶位点上游的野生型Gla1基因的“CCG”PAM序列中的单个“C”核苷酸已被缺失，以在Gla1编码序列中产生框位移并破坏与TS11相邻的PAM，从而防止被Cas9切割。PAM的剩余两个核苷酸以大写字母粗体字体显示。

使用引物gla1rep F和gla1rep R(分别为5’-gtgtgtctaatgcctccaccac[SEQ IDNO:32]和5’-gatcgtgctagcgctgctgttg[SEQ ID NO:33])，通过PCR扩增Gla1rep片段用于转化。

通过PEG介导的方法，用pTrex2gHyg MoCas gTrGA TS11B(2ug)加Gla1rep(8ug)共转化里氏木霉菌株T4(1)7的原生质体。在含有50μg/ml潮霉素B、2mg/ml尿苷和1.1M山梨糖醇的Vogel基本培养基的琼脂板上选择转化体。除了TS11指导RNA的表达盒相对于质粒的其余部分处于相反的方向之外，质粒pTrex2gHyg MoCas gTrGA TS11B与pTrex2gHyg MoCasgTrGA TS11相同。

将转化体挑取到具有尿苷和潮霉素的Vogel基本培养基的新鲜琼脂板上，并且可以区分稳定的和不稳定的潮霉素抗性表型。将转化体转移到具有尿苷和1％不溶性淀粉作为唯一碳源的Vogel基本培养基的琼脂板上，以便记下葡糖淀粉酶阳性或阴性表型。大约83％的稳定的潮霉素抗性转化体对于葡糖淀粉酶生产是阴性的，然而15％的不稳定的潮霉素抗性转化体对于葡糖淀粉酶生产是阴性的。将具有葡糖淀粉酶阴性表型的7个不稳定的转化体转移到非选择性琼脂培养基(Vogel+尿苷)中并允许生长1周。当随后挑取到Vogel+尿苷+潮霉素的板上时，它们全部都是潮霉素敏感性的，证明潮霉素抗性基因的丧失与pTrex2gHyg MoCas gTrGA TS11B相关联。

从使用pTrex2gHyg MoCas gTrGA TS11B加Gla1rep获得的5个不稳定的潮霉素敏感性和葡糖淀粉酶阴性转化体(转化体#31、107、114、118和120)中分离基因组DNA，并将其在PCR(如上所述的程序)中用作模板，该PCR使用引物glaA和glaD(分别为5’-ccgttagttgaagatccttgccg[SEQ ID NO:26]和5’-gagagacgcaggatgactcaaag[SEQ ID NO:28])，该引物被设计以扩增跨越TS11或glaK[SEQ ID NO:31](参见上文)和glaH 5’-tgccgtgggtcattggcatattc[SEQ ID NO:29]的大约3.2kb。使用gla1rep F和gla1rep R(分别为5’-gtgtgtctaatgcctccaccac[SEQ ID NO:32]和5’-gatcgtgctagcgctgctgttg[SEQ IDNO:33])作为引物对PCR产物进行测序以确定在靶位点TS11处的改变。这些转化体中的一个显示PCR和测序结果与Gla1rep在gla1基因座处的同源重组一致，该同源重组在与TS11相关的PAM处引入单bp缺失并使gla1基因失活。这些转化体中的两个在TS11靶位点处具有小的indel，然而另外两个将Gla1rep片段插入Cas9切割位点而不是跨越该位点的同源整合。

重复上述实验，在该实验中用pTrex2gHyg MoCas gTrGA TS11A(与pTrex2gHygMoCas gTrGA TS11B相同，除了指导RNA表达盒在载体内处于相反方向之外)加上设计成通过同源重组在gla1基因座处整合的线性DNA片段共转化原生质体。然而，代替使用982bpGla1rep DNA片段作为供体用于在葡糖淀粉酶基因中的靶位点TS11处进行同源重组，使用更长的大约2kb的称为Gla1repL的片段。Gla1repL的中心部分与Gla1rep是相同的序列，但是片段的5'和3'末端延伸以包括gla1基因座的更多的上游和下游部分。在本实验中使用里氏木霉菌株RL-P37，而不是上述使用的菌株T4(1)7。作为对照，用Gla1repL和pTrex2gHygMoCas共转化原生质体，以确定在不存在活性Cas9的情况下Gla1repL在gla1基因座处整合的频率。在转化和表型筛选后，转化体可以被分为以下几类。

从用pTrex2gHyg MoCas gTrGA TS11A加Gla1repL获得的5个稳定和5个不稳定的潮霉素敏感性和葡糖淀粉酶阴性转化体(稳定的转化体#51、52、60、61和67；不稳定的转化体338、41、65、66和68)中分离出基因组DNA，并将其在使用引物glaA和glaD的PCR中作为模板(参见上文)。如果在gla1基因中的靶位点TS11处没有发生插入或大的缺失，则PCR产物预期为3.2kb。

5个稳定的转化体中的3个(#52、60和61)产生大约3.2kb的PCR产物，然而其他2个产生更大的产物，表明在TS11处插入了DNA。使用glarepF作为引物对大约3.2kb的3个PCR产物进行测序。对于两个转化体(#52和61)，测序结果与Gla1repL在gla1基因座处通过同源重组的整合是一致的，并且其他的具有难以解释的混合信号。

5个不稳定的转化体中只有1个(#66)产生大约3.2kb的PCR产物，然而其他4个产生更大的产物，表明在TS11处插入了DNA。使用glarepF作为引物对大约3.2kb的一个PCR产物进行测序，并且结果与Gla1repL在gla1基因座处通过同源重组的整合一致。

总之，这些结果表明线性DNA片段的同源整合可以通过在靶标基因座处的Cas9切割来刺激。然而，通过非同源末端连接(NHEJ)的DNA的小的indel或大的插入也是屡见不鲜。使用更大的同源线性DNA片段有助于提高在靶位点处的同源整合相对于其他事件的频率。可以在不稳定的潮霉素抗性转化体中获得在靶位点处的同源整合，通过允许在不含潮霉素的培养基上生长随后可以将基于pTrex2g MoCas的载体从这些转化体中除去。

实例9：在里氏木霉的NHEJ缺陷型菌株中的基因编辑

使用来源于里氏木霉的“四缺失菌株”(来源于RL-P37并且具有纤维二糖水解酶1、纤维二糖水解酶2、内切葡聚糖酶1和内切葡聚糖酶2基因缺失(Δcbh1、Δcbh2、Δegl1和Δegl2菌株；参见WO 92/06184和WO 05/001036))并且在天然内切葡聚糖酶-3和β-葡糖苷酶-1基因中具有缺失的菌株(MAD6)进行设计以确定非同源末端连接(NHEJ)DNA插入在Cas9靶位点处的作用的实验。该MAD6菌株也缺失了一个与ku80直系同源、对用于DNA重组的主要NHEJ途径是必需的天然基因(对于如何制得MAD6菌株的描述，参见US 20130149742 A1“丝状真菌宿主菌株和DNA构建体及其使用方法(Filamentous fungal host strains and DNAconstructs,and methods of use thereof)”)。用pTrex2gHyg MoCAS gTrGA TS11B加上述的供体Gla1rep片段共转化该菌株。该片段通过在gla1基因座上的同源重组的整合将使gla1基因失活，并通过从PAM序列中缺失一个bp来去除TS11靶位点。通过PEG介导的方法从原生质体获得转化体。在含有1.1M山梨糖醇和100ug/mL潮霉素B的Vogel基本培养基上选择转化体。在转移到具有潮霉素的基本培养基的新鲜琼脂板上的91个转化体中，仅有4个具有稳定的潮霉素抗性表型(通过其在非选择性条件下生长一段时间之后重新涂板到具有潮霉素的培养基上时生长的能力确认)。将所有转化体转移到具有1％不溶性淀粉作为唯一碳源的Vogel基本培养基中，并且17个(18％)显示为葡糖淀粉酶阴性，包括4个稳定的转化体。PCR和DNA序列分析显示，如果供体Gla1rep通过同源重组在gla1基因座处整合，则13个不稳定的转化体中的12个和稳定的转化体中的一个预期在TS11PAM处具有单bp缺失。即使其具有葡糖淀粉酶阴性表型，其他不稳定的转化体也具有野生型gla1序列。其他三个稳定的转化体没有产生具有对gla1基因座预期的大小的明显的PCR产物，并且在这些转化体中可能发生载体或供体Gla1rep插入。将所有不稳定的葡糖淀粉酶阴性转化体在不含潮霉素的培养基上生长，并转移回具有潮霉素的培养基上。没有一个能够生长，表明它们已经丢失了pTrex2gHyg MoCAS gTrGA TS11B载体。

这些结果清楚地说明，在NHEJ缺陷的菌株中，载体或供体DNA片段在Cas9靶位点处的插入被最小化。结果，高频率的具有高特异性的基因编辑(单bp的缺失)能够通过供体DNA片段在具有Cas9和指导RNA的瞬时表达的不稳定的转化体中的同源重组来实现。

B部分：Cas切口酶/指导RNA的直接引入

实例10：CRISPR SpyCas9-D10A切口酶在大肠杆菌中的异源表达

合成大肠杆菌密码子优化的化脓性链球菌Cas9-D10A(SpyCas9-D10A)切口酶基因，并将其通过捷瑞公司(Generay)(中国上海)在NcoI和HindIII位点插入表达载体pET30a中，产生质粒pET30a-SpyCas9-D10A切口酶(图7)。如图7中的质粒图所示，表达盒的全长编码序列在5'至3’方向上包含编码N-末端His6标签/凝血酶/S·Tag^TM/肠激酶区域的序列(SEQ ID NO:68；包括甲硫氨酸的起始密码子)、编码SV40核定位信号的序列(SEQ ID NO:69)、编码SpyCas9-D10A切口酶的序列(SEQ ID NO:65)和编码BLR2核定位信号的序列(SEQID NO:70)，全部都是可操作地连接。该整个编码序列显示于SEQ ID NO:54中。由SEQ IDNO:68编码的N-末端His6标签/凝血酶/S·Tag^TM/肠激酶区域的氨基酸序列显示于SEQ IDNO:67(包括位置1处的甲硫氨酸)，由SEQ ID NO:69编码的SV40核定位信号的氨基酸序列显示于SEQ ID NO:46，由SEQ ID NO:65编码的SpyCas9-D10A切口酶的氨基酸序列显示于SEQID NO:66，并且由SEQ ID NO:70编码的BLR2核定位信号的氨基酸序列显示于SEQ ID NO:47中。由SEQ ID NO:54编码的氨基酸序列显示于SEQ ID NO:55中。

将ET30a-SpyCas9-D10A切口酶质粒转化到Rosetta2(De3)plysS大肠杆菌菌株(德国达姆施塔市默克集团EMD生物科学公司(EMD Biosciences,Inc.,MerckKGaA,Darmstadt,Germany)中，并且将转化产物涂抹到补充有34ppm氯霉素和50ppm卡那霉素的卢里亚(Luria)琼脂板上。挑取菌落并且将其在250ml摇瓶中的25ml的InvitrogenMagicMedia^TM(赛默飞世尔科技公司(Thermo Fisher Scientific Inc.))中在30℃、300rpm下发酵24小时。

来自化脓性链球菌的野生型Cas9蛋白的氨基酸序列(SpyCas9-D10A序列从其来源)在SEQ ID NO:45中列出。

实例11：SpyCas9-D10A的纯化

为了纯化SpyCas9(D10A)，应用了亲和力、疏水相互作用和尺寸排阻层析步骤的组合。获得2升粗制的肉汤并将其离心。将细胞沉淀并重新悬浮于400ml裂解缓冲液(20mMHEPES(pH 7.5)、500mM NaCl、0.1％Triton X-100、1mM DTT和1mM TCEP，购自罗氏公司(Roche)的蛋白酶抑制剂混合物)中，并且经由超声波发生器(35％功率，20min，2s打开/3s关闭)(SCIENT2-II D，中国浙江省宁波新芝生物技术有限公司(Ningbo ScientzBiotechnology Co.,LTD.,Zhejiang,China))裂解。通过在20,000g下离心40min来清除裂解物。

在旋转培养箱(中国海门市麒麟贝尔实验室仪器有限公司(Kylin-BellLab.Instruments Co.,Ltd.Haimen,China))中，将澄清的裂解液在Ni-NTA树脂(GE医疗集团(GE Healthcare))上在4℃、30rpm下孵育过夜。在离心后，将树脂转移到XK26/20柱(GE医疗集团(GE Healthcare))并且连接到AKTA Explorer系统(GE医疗集团)上。在用平衡缓冲液(20mM HEPES(pH 7.5)、300mM NaCl、0.1％Triton X-100)和洗涤缓冲液(平衡缓冲液中的25mM咪唑)充分洗涤后，用在平衡缓冲液中的50、250和500mM咪唑洗脱靶标蛋白质。在50和250mM咪唑洗脱液中发现具有相对高的纯度的希望的蛋白质，将其合并并且单独进行进一步处理。

向从亲和步骤收集的活性级分中添加硫酸铵至0.6M，并且加载到20ml苯基-琼脂糖HP柱(GE医疗集团(GE Healthcare))上。该柱用在HEPES缓冲液(pH 7.5)中的0.6M至0.0M硫酸铵的梯度进行洗脱。通过SDS-PAGE凝胶评估每个级分的纯度，其揭示目的蛋白质主要存在于流出级分中。

最后，通过尺寸排阻色谱法在Superdex 20016/60柱(GE医疗集团(GEHealthcare))上在20mM HEPES pH 7.5、150mM KCl和10％甘油中进一步纯化蛋白质。将含有蛋白质的纯的级分合并，并且使用Amicon 30KDa膜过滤器(密理博公司(Millipore))浓缩。将两个批次的纯化蛋白质(分别来自50mM咪唑和250mM咪唑洗脱液)在具有150mM KCl和40％甘油的20mM HEPES缓冲液中在pH 7.5、-20℃储存直到使用。

实例12：切口酶体外测定

制备底物DNA片段用于体外切口酶切割测定

使用来自Zymo研究公司(Zymo Research Corporation)(加利福尼亚州尔湾)的ZF真菌/细菌DNA小量制备试剂盒(ZF Fungal/Bacterial DNA miniprep kit)，从来源于RL-P37并且具有纤维二糖水解酶1、纤维二糖水解酶2、内切葡聚糖酶1和内切葡聚糖酶2基因缺失(Δcbh1、Δcbh2、Δegl1和Δegl2菌株；也被称为“四缺失菌株”；参见WO 92/06184和WO05/001036)的里氏木霉菌株提取基因组DNA。使用KOD-Plus PCR试剂盒(日本东洋纺有限公司(Toyobo Co.,LTD,Japan))以及正向引物和反向引物(5’-gactgtctccaccatgtaatttttc-3’(SEQ ID NO:57)和5’-ggcagactacaagtctactagtactac-3’(SEQ ID NO:58))各0.4μM，使用1ng提取的基因组DNA作为模板，通过PCR扩增含有里氏木霉葡糖淀粉酶(TrGA)基因(基因ID：18483895)及其部分5'-UTR(SEQ ID NO:56)的DNA片段。将PCR产物纯化，并且用来自Zymo研究公司(Zymo Research Corporation)的DNA Clean&Concentrator^TM-5试剂盒将其浓缩，并且通过NanoDrop^TM分光光度计(赛默飞世尔科技公司(Thermo Fisher ScientificInc.))确定其DNA浓度。

SEQ ID NO:56(下面)显示了底物DNA片段的核苷酸序列。UTR序列以小写字母显示，而TrGA基因以大写字母显示。两个所选择的VT结构域TrGA_sgF1和TrGA_sgR1分别以粗体和下划线显示(注意这些序列重叠)。

gactgtctccaccatgtaatttttccctgcgactccatataacgccggatcgtgaaattttcttctttcttttccttccttctcaacaaacaacggatctgtgctttgcggtcccctgcgttcacgcgtcagggtcgactgctctgcagctcgataactccatggagccatcaacttgctatggtgtcaatcatcctatcgacaggtccaagaacaagccggcctccggctgcctcattcgctgtcgcaagacggcttgagtgttgtggctggaggattcgggggccccatattccaacccttttttccaaggccgtcggccggtgaggttgaggaaaaccatgggttgcctacatattatcgatgctggtgtttggtagtagcaatgtttgcggtggcagtttgagccgagcctcgtcttgggcttctgacccaggcaacgccatctgactagctgcgccgaaggaaggatgattcattgtacgacgccagtcaatggaatcttcaagtaaaagcccgacgaaccgaccatgtcagatatcagaattctcctggctggtggggttggttggagactgcttacggagtcgatgcctcgtgactgtcatggccgcgtccagcctcctgggactctgtccgatattatgacacgagtaaagcctgcatgatgtcagtttgctgcgtctcatgtcgagaacaacacacctggtgctacataggcaatactacctcgtagcttcaaagttgactgttttgctttgatgtctttgatcatgcccatccatcccttgtcttgcagtgcatgtggatctctacgtccagacggggagaaagcttgtctgtgataaagtacgatgatgcattgatgcctgtggctacggcccttttatccccatcgtcatgcatctctatattaatccaggagactctcctcctggcatgggtgagtacaagtgacgaggacatgtagaagcagagccacgcaacgtcttgacatctgtacctattttgggccaaaaatcgagacccaccagctcgtcctaccttacatgtgaagatcttagcccacaatcctactgttttactagtattactgcacagctgtcatcacgagtcctcggttgcttgtgaaacccagctcagctcctgagcacatgcagtaacgccgactcggcgtcatttcgccacacccaatttggacctgagggatgctggaagctgctgagcagatcccgttaccgattcatggcactactacatccatacgcagcaaacatgggcttgggcttggcttctcaatgcaaaattgcccgcaaaagtcccggcattgtcgatgcagagatgcagatttcagcgggcgattctagggtagggcgactactactactaataccacctagtcagtatgtatctagcaccggaggctaggcggttagtggacgggaacctggtcattccatcgcaaccaggatcccgcacttcgttgcgcttctgcccccacggggcgggagttggcagaggcagaatgcggagcagccccttgtctgccctggccggggcctgttgaagcaagcagacgagagcagagcggttgagaagcggtggttgacgcttgacggtacgaagacgagcgagaatcccgttaagccgaggctgggctcccccccccgtcatcatcatgcccatcctgctcttccagcccactcgtctccctgcctcgtcgcctcccctccctcccccgattagctgcgcatgttctcctgacagcgtgactaatgacgcgttgccagcccattcgcctgacgcatcccggcatctgagtctagctcgtcacgctggcaatcttggcccaggcagagcagcaagacggcgggcatgattgggccgtgccctggcgggcatcagctggccatccgctgccacccgagaccgcatcaccgacttgtcggatctctccgagcagcaggaggctgatcctggccggcgagacgattgaaaagggctgccgggcccggagcaggacagcggcgagagcgagcgagagagaggaaaagaagaaggtcgactgtcttattttcagccagccccggctcaacagaagcagaggagaaggcgaacgacgtcaacgacgacgacgacgacgacgaagacggtgaagtccgttagttgaagatccttgccgtcacaacaccatctcgtggatattgctttcccctgccgttgcgttgccacctgttccctctttctcttccccccttcttcctcattccgagcgctactggttcctactccgcagccttcggttgtgcctttctctttgtcgaccattgcaccgcccgtcgcggcacttgggccccggagaattcggccctttcgcagcattttggccctcagttccccatggggacggtccacacttcctctcttggccctgcagaccttttgtcgtcggtccgagtcggaagaagctcagtcttgagcgcttgagtagcatctacgcgcgaatcactggacaaagtcggcaagacgaagccgtcgtcgcctgctgctgctgctgttactgcgacaggcgctccgactgggggcatcggcataataaaaagatgcccgccttcgccatggacctggccatgagccactcggcatcggctctctctctcaacgcttcctctcacacatcctccttcattccgcccatcATGCACGTCCTGTCGACTGCGGTGCTGCTCGGCTCCGTTGCCGTTCAAAAGGTCCT GACGTCACCAAGAGGTCTGTTGACGACTTCATCAGCACCGAGACGCCTATTGCACTGAACAATCTTCTTTGCAATGTTGGTCCTGATGGATGCCGTGCATTCGGCACATCAGCTGGTGCGGTGATTGCATCTCCCAGCACAATTGACCCGGACTGTAAGTTGGCCTTGATGAACCATATCATATATCGCCGAGAAGTGGACCGCGTGCTGAGACTGAGACAGACTATTACATGTGGACGCGAGATAGCGCTCTTGTCTTCAAGAACCTCATCGACCGCTTCACCGAAACGTACGATGCGGGCCTGCAGCGCCGCATCGAGCAGTACATTACTGCCCAGGTCACTCTCCAGGGCCTCTCTAACCCCTCGGGCTCCCTCGCGGACGGCTCTGGTCTCGGCGAGCCCAAGTTTGAGTTGACCCTGAAGCCTTTCACCGGCAACTGGGGTCGACCGCAGCGGGATGGCCCAGCTCTGCGAGCCATTGCCTTGATTGGATACTCAAAGTGGCTCATCAACAACAACTATCAGTCGACTGTGTCCAACGTCATCTGGCCTATTGTGCGCAACGACCTCAACTATGTTGCCCAGTACTGGTCAGTGCTTGCTTGCTCTTGAATTACGTCTTTGCTTGTGTGTCTAATGCCTCCACCACAGGAACCAAACCGGCTTTGACCTCTGGGAAGAAGTCAATGGGAGCTCATTCTTTACTGTTGCCAACCAGCACCGAGGTATGAAGCAAATCCTCGACATTCGCTGCTACTGCACATGAGCATTGTTACTGACCAGCTCTACAGCACTTGTCGAGGGCGCCACTCTTGCTGCCACTCTTGGCCAGTCGGGAAGCGCTTATTCATCTGTTGCTCCCCAGGTTTTGTGCTTTCTCCAACGATTCTGGGTGTCGTCTGGTGGATACGTCGACTCCAACAGTATGTCTTTTCACTGTTTATATGAGATTGGCCAATACTGATAGCTCGCCTCTAGTCAACACCAACGAGGGCAGGACTGGCAAGGATGTCAACTCCGTCCTGACTTCCATCCACACCTTCGATCCCAACCTTGGCTGTGACGCAGGCACCTTCCAGCCATGCAGTGACAAAGCGCTCTCCAACCTCAAGGTTGTTGTCGACTCCTTCCGCTCCATCTACGGCGTGAACAAGGGCATTCCTGCCGGTGCTGCCGTCGCCATTGGCCGGTATGCAGAGGATGTGTACTACAACGGCAACCCTTGGTATCTTGCTACATTTGCTGCTGCCGAGCAGCTGTACGATGCCATCTACGTCTGGAAGAAGACGGGCTCCATCACGGTGACCGCCACCTCCCTGGCCTTCTTCCAGGAGCTTGTTCCTGGCGTGACGGCCGGGACCTACTCCAGCAGCTCTTCGACCTTTACCAACATCATCAACGCCGTCTCGACATACGCCGATGGCTTCCTCAGCGAGGCTGCCAAGTACGTCCCCGCCGACGGTTCGCTGGCCGAGCAGTTTGACCGCAACAGCGGCACTCCGCTGTCTGCGCTTCACCTGACGTGGTCGTACGCCTCGTTCTTGACAGCCACGGCCCGTCGGGCTGGCATCGTGCCCCCCTCGTGGGCCAACAGCAGCGCTAGCACGATCCCCTCGACGTGCTCCGGCGCGTCCGTGGTCGGATCCTACTCGCGTCCCACCGCCACGTCATTCCCTCCGTCGCAGACGCCCAAGCCTGGCGTGCCTTCCGGTACTCCCTACACGCCCCTGCCCTGCGCGACCCCAACCTCCGTGGCCGTCACCTTCCACGAGCTCGTGTCGACACAGTTTGGCCAGACGGTCAAGGTGGCGGGCAACGCCGCGGCCCTGGGCAACTGGAGCACGAGCGCCGCCGTGGCTCTGGACGCCGTCAACTATGCCGATAACCACCCCCTGTGGATTGGGACGGTCAACCTCGAGGCTGGAGACGTCGTGGAGTACAAGTACATCAATGTGGGCCAAGATGGCTCCGTGACCTGGGAGAGTGATCCCAACCACACTTACACGGTTCCTGCGGTGGCTTGTGTGACGCAGGTTGTCAAGGAGGACACctggcagtcgtaatgaatcggcaaggggtagtactagtagacttgtagtctgcc(SEQID NO:56)

体外转录

鉴定了TrGA基因中的两个VT结构域TrGA_sgF1和TrGA_sgR1及其特异性PAM，用于下游活性和转化实验。用TrGA_sgF1(SEQ ID NO:59)或TrGA_sgR1(SEQ ID NO:60)合成含有T7启动子和单指导RNA序列的寡核苷酸，并且由捷瑞公司(Generay)将其插入pMD18T载体，分别产生pMD18T(T7-Spy-TrGA_sgF1)(图8A)或pMD18T(T7-Spy-TrGA_sgR1)(图8B)。用正向引物和反向引物(5’-tgatgacggtgaaaacctc-3’(SEQ ID NO:71)和5’-aaaagcaccgactcgg-3’(SEQ ID NO:72))各0.4μM，通过PCR从pMD18T(T7-Spy-TrGA_sgF1)或pMD18T(T7-Spy-TrGA_sgR1)扩增用于体外转录的DNA片段。将PCR产物纯化，并且用来自Zymo研究公司(ZymoResearch Corporation)的DNA Clean&Concentrator^TM-5试剂盒将其浓缩，并且通过NanoDrop^TM分光光度计确定其DNA浓度。

用上述特异性PCR产物作为模板，根据制造商的说明书，使用来自英杰公司(Invitrogen)、赛默飞世尔科技公司(Thermo Fisher Scientific Inc.)的MEGAshortscript^TM T7转录试剂盒通过体外转录产生VT结构域TrGA_sgF1或TrGA_sgR1的RNA。使用来自英杰公司(Invitrogen)、赛默飞世尔科技公司(Thermo Fisher ScientificInc.)的MEGAclear^TMTranscription Clean-Up试剂盒纯化转录的RNA。通过NanoDropTM测量RNA浓度。

进行SpyCas9体外测定以证实合成的单指导RNA的功能。为了开始测定，将1μg纯化的SpyCas9、200ng底物DNA片段和200ng单指导RNA(或水作为对照)在含有50mM HEPES pH7.3、150mM KCl、0.5mM DTT和10mM MgCl2的15μl反应缓冲液中混合在一起。测定在37℃下进行20min，随后添加2μg蛋白酶K(西格玛公司(Sigma)，目录号P6556)。将反应在40℃下继续进行20min，并且通过在80℃下另外孵育20min来终止。而且，使用0.8％琼脂糖凝胶分析反应结果，在140伏特下运行30min，并将结果示于图9中。在图9中，泳道1是DNA梯度(分子量显示在左侧)，泳道2是对照SpyCas9反应(无指导RNA)，泳道3和4显示在TrGA_sgR1存在下的SpyCas9，并且泳道5和6显示在TrGA_sgF1存在下的SpyCas9。完整DNA底物(SEQ ID NO:56)的大小为4.9Kb(泳道2)，而在任一种sgRNA存在下的切割产物的大小为2.8Kb和2.1Kb。如图9所示，在特异性单指导RNA存在下，SpyCas9可以成功地将底物DNA片段切割成希望的大小，从而证实了合成的RNA的正确功能。

SEQ ID NO:59(下面)显示了用于T7启动子、CER结构域和VT结构域TrGA_sgF1的转录的寡核苷酸序列。VT结构域以大写字母显示，而T7启动子和CER结构域区域分别以粗体和小写字母显示。

GGGAAGACCAGGATCAAGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc

SEQ ID NO:60(下面)显示了用于T7启动子、CER结构域和VT结构域TrGA_sgR1的转录的寡核苷酸序列。VT结构域以大写字母显示，而T7启动子和CER结构域区域分别以粗体和小写字母显示。

GGACAGACCGCTTGATCCgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgc

用纯化的SpyCas9(D10A)进行体外切口酶切割测定

体外切口酶切割测定是两步反应。对于第一步骤，将1μg纯化的SpyCas9(D10A)、200ng底物DNA片段和200ng单指导RNA(或水作为对照)在含有50mM HEPES pH 7.3、150mMKCl、0.5mM DTT和10mM MgCl2的15μl反应缓冲液中混合在一起。如SpyCas9核酸酶测定中所描述的进行该反应。在第一步骤反应终止后，添加1μg的SpyCas9(D10A)和200ng的特异性单指导RNA。在重复该第一步骤反应之后，随后使用0.8％琼脂糖凝胶分析反应结果，在140伏特下运行30min，并将结果示于图10中。在图10中，泳道1是DNA梯度(分子量显示在左侧)，泳道2显示SpyCas9(D10A)与底物DNA和单独的TrGA_sgF1的反应，泳道3显示SpyCas9(D10A)与底物DNA和单独的TrGA_sgR1的反应，并且泳道4显示SpyCas9(D10A)与底物DNA和两种sgRNA的反应。完整的DNA底物(SEQ ID NO:56)的大小将为4.9Kb，而具有两种sgRNA的切割产物的大小将为2.8Kb和2.1Kb。如图10所示，底物DNA片段仅在两种RNA的存在下切割(泳道4)，表明SpyCas9(D10A)是有活性的切口酶。

实例13：体内切口酶摄取实验

原生质体制备

对于原生质体制备，将具有另外的内切葡聚糖酶-3、内切葡聚糖酶-4、内切葡聚糖酶-5、内切葡聚糖酶-6、甘露聚糖酶-1和α-淀粉酶基因的缺失、但是具有正常的NHEJ机制的里氏木霉的四缺失菌株(如上所述)的5×10⁸个孢子(在30℃下在PDA板上生长5天)接种到在具有4个挡板的250ml摇瓶中的50ml萌发培养基(在美国专利号8,679,815中描述的配方)中，并在27℃、170rpm下孵育17小时。通过将液体体积转移到50ml锥形管中并以3000rpm旋转10分钟来回收菌丝体。轻轻倒出上清液，将菌丝体沉淀使用1.2M MgSO₄-10mM磷酸钠缓冲液洗涤两次，并且重新悬浮于1.2M MgSO₄-10mM磷酸钠缓冲液(pH 5.8，50mg/ml)中的15ml裂解酶缓冲液(溶解来自哈茨木霉的裂解酶(西格玛公司(Sigma)目录#L1412))中。将细胞悬浮液转移到具有4个挡板的250ml摇瓶中，并且在室温下以200rpm振摇至少2小时。通过在玻璃漏斗中折叠的Miracloth(卡比化学公司(Calbiochem)货号475855)过滤将原生质体收获到Greiner管中。在过滤的原生质体上方小心地添加0.6M山梨糖醇-0.1M Tris-HCl缓冲液。通过以4000rpm离心15分钟收集原生质体。将含有原生质体的中间相转移到新管中，并且添加至少等体积的1.2M山梨糖醇-10mM Tris-HCl缓冲液。通过以4000rpm离心5分钟收集原生质体，并且使用1.2M山梨糖醇、10mM Tris-HCl缓冲液将其洗涤两次。将沉淀重悬于至少1ml 1.2M山梨糖醇-10mM Tris-HCl pH 7.5-10mM CaCl₂缓冲液中，并且在显微镜下计数原生质体的数量。将原生质体悬浮液用4份的1.2M山梨糖醇-10mM Tris-HCl-10mM CaCl₂和1份的25％PEG6000-50mM CaCl₂-10mM Tris-HCl稀释到5×10⁸/ml为止，用于将来的转化。

缺失盒的制备

构建TrGA缺失盒并将其在图11中示意性地描绘出。它包含pyr2表达盒(包括pyr2启动子、pyr2CDS和pyr2终止子)、500bp重复序列，用于随后的环出(侧翼为5'和3’TrGA同源区域)。

可以在不具有葡萄糖和具有1％不溶性淀粉(Vogel淀粉培养基)的Vogel琼脂板上筛选TrGA敲除转化体。与具有完整TrGA基因的菌株相比，TrGA敲除转化体在该培养基上生长很差。TrGA敲除盒的核苷酸序列长度为4248个碱基对：碱基1-1000对应于TrGA 5’同源区域；碱基1001-2730对应于pyr2表达盒；碱基2739-3248对应于500bp重复；并且碱基3249-4248对应于TrGA 3’同源区域。TrGA敲除盒的核苷酸序列提供为SEQ ID NO:61(显示如下)。

ccctgcctcgtcgcctcccctccctcccccgattagctgcgcatgttctcctgacagcgtgactaatgacgcgttgccagcccattcgcctgacgcatcccggcatctgagtctagctcgtcacgctggcaatcttggcccaggcagagcagcaagacggcgggcatgattgggccgtgccctggcgggcatcagctggccatccgctgccacccgagaccgcatcaccgacttgtcggatctctccgagcagcaggaggctgatcctggccggcgagacgattgaaaagggctgccgggcccggagcaggacagcggcgagagcgagcgagagagaggaaaagaagaaggtcgactgtcttattttcagccagccccggctcaacagaagcagaggagaaggcgaacgacgtcaacgacgacgacgacgacgacgaagacggtgaagtccgttagttgaagatccttgccgtcacaacaccatctcgtggatattgctttcccctgccgttgcgttgccacctgttccctctttctcttccccccttcttcctcattccgagcgctactggttcctactccgcagccttcggttgtgcctttctctttgtcgaccattgcaccgcccgtcgcggcacttgggccccggagaattcggccctttcgcagcattttggccctcagttccccatggggacggtccacacttcctctcttggccctgcagaccttttgtcgtcggtccgagtcggaagaagctcagtcttgagcgcttgagtagcatctacgcgcgaatcactggacaaagtcggcaagacgaagccgtcgtcgcctgctgctgctgctgttactgcgacaggcgctccgactgggggcatcggcataataaaaagatgcccgccttcgccatggacctggccatgagccactcggcatcggctctctctctcaacgcttcctctcacacatcctccttcattccgcccatcatggtttaaacctcgagtttataagtgacaacatgctctcaaagcgctcatggctggcacaagcctggaaagaaccaacacaaagcatactgcagcaaatcagctgaattcgtcaccaattaagtgaacatcaacctgaaggcagagtatgaggccagaagcacatctggatcgcagatcatggattgcccctcttgttgaagatgagaatctagaaagatggcggggtatgagataagagcgatgggggggcacatcatcttccaagacaaacaacctttgcagagtcaggcaatttttcgtataagagcaggaggagggagtccagtcatttcatcagcggtaaaatcactctagacaatcttcaagatgagttctgccttgggtgacttatagccatcatcatacctagacagaagcttgtgggatactaagaccaacgtacaagctcgcactgtacgctttgacttccatgtgaaaactcgatacggcgcgcctctaaattttatagctcaaccactccaatccaacctctgcatccctctcactcgtcctgatctactgttcaaatcagagaataaggacactatccaaatccaacagaatggctaccacctcccagctgcctgcctacaagcaggacttcctcaaatccgccatcgacggcggcgtcctcaagtttggcagcttcgagctcaagtccaagcggatatccccctacttcttcaacgcgggcgaattccacacggcgcgcctcgccggcgccatcgcctccgcctttgcaaagaccatcatcgaggcccaggagaaggccggcctagagttcgacatcgtcttcggcccggcctacaagggcatcccgctgtgctccgccatcaccatcaagctcggcgagctggcgccccagaacctggaccgcgtctcctactcgtttgaccgcaaggaggccaaggaccacggcgagggcggcaacatcgtcggcgcttcgctcaagggcaagagggtcctgattgtcgacgacgtcatcaccgccggcaccgccaagagggacgccattgagaagatcaccaaggagggcggcatcgtcgccggcatcgtcgtggccctggaccgcatggagaagctccccgctgcggatggcgacgactccaagcctggaccgagtgccattggcgagctgaggaaggagtacggcatccccatctttgccatcctcactctggatgacattatcgatggcatgaagggctttgctacccctgaggatatcaagaacacggaggattaccgtgccaagtacaaggcgactgactgattgaggcgttcaatgtcagaagggagagaaagactgaaaaggtggaaagaagaggcaaattgttgttattattattattctatctcgaatcttctagatcttgtcgtaaataaacaagcgtaactagctagcctccgtacaactgcttgaatttgatacccgtatggagggcagttattttattttgtttttcaagattttccattcgccgttgaactcgtctcacatcgcgtgtattgcccggttgcccatgtgttctcctactaccccaagtccctcacgggttgtctcactttctttctcctttatcctccctattttttttcaagtcagcgacagagcagtcatatggggatacgtgcaactgggactcacaacaggccatcttatggcctaatagccggcgttggatccactagtcaattggtttaaacagcacatgcagtaacgccgactcggcgtcatttcgccacacccaatttggacctgagggatgctggaagctgctgagcagatcccgttaccgattcatggcactactacatccatacgcagcaaacatgggcttgggcttggcttctcaatgcaaaattgcccgcaaaagtcccggcattgtcgatgcagagatgcagatttcagcgggcgattctagggtagggcgactactactactaataccacctagtcagtatgtatctagcaccggaggctaggcggttagtggacgggaacctggtcattccatcgcaaccaggatcccgcacttcgttgcgcttctgcccccacggggcgggagttggcagaggcagaatgcggagcagccccttgtctgccctggccggggcctgttgaagcaagcagacgagagcagagcggttgagaagcggtggttgacgcttgacggtacgaagacgagcgagaatcccgttaagccgaggctgggctaattaattaatgaatcggcaaggggtagtactagtagacttgtagtctgccggattattgattggagttggtcagtagaatgaaccacgggaatattcggtcaccgggacatttgggatatagcgtttcgagaagctgctggttgcagcacattggagaaggatgcccttttacgacttataccgctatgccgggtatattaatttagccgttatgaaactcaaagagacgatgataatgatgacgagtaattgttcgtttcaatttcgaaagctgactcccacgaagaatatgccaatgacccacggcatgaagcctgaactgggcgtgtgtaacactttaatttgcctgacggcggacaaaacaaaggcggcagcaatgttgagaccgtgtgataaaccaaggttcccgagggagagagagagagagagagagagagagctaggtgaaagaatgagtccgcctttgagtcatcctgcgtctctctctccccctctctcactctctgtatcccatcaacctcttccctgttccttctcctatcgcatccatgcgtttgcatcttccatttcattctttccccttgagccccatctatgcaaactcatcatccggcgcctcgatggaatccttgaccttgatgagaatcgccgtcatccaaggctccagcctgctcgtgcggtcgaactggaacagcagctcgctaaactcatcctggctgtggttgtcgacggcgttgcacaggtcctcgagcagcttgtacttgtattgagaggagaactcggggtccttttggcggtaggactcgacggcgcggcgggtgccgaccatgtcgcccgtggcgaggtggcagatgccggccttgaagcagtaggtcgagaggctccacttcatggtgccgttgccgatcatggtgttgatgatgcggtcgtacgtctcgatggcgccgtagtagtcgccgtcgagggcggcgaggtcggcgtactgcgtccagagctt

转化

为了使用Spycas9切口酶预混物和缺失盒敲除里氏木霉中的TrGA基因，将储存缓冲液(20mM HEPES pH 7.5、150mM KCl和40％甘油)中的25μg Spycas9切口酶蛋白与溶解于3μl无核酸酶的NEB缓冲液3(新英格兰生物实验室(New England Biolabs))中的20μgsgRNA(TrGA_sgR1)轻轻地混合，以获得30μl预混物，并且在室温下孵育30min。将30μl预混物添加到具有20μg(20μl)缺失盒的200μL原生质体(1×10⁸)中并且在冰上保持30min。在冰上孵育30min后，将原生质体添加到冷却的熔化的山梨糖醇/Vogel琼脂(1.1M山梨糖醇在具有2％葡萄糖的基本Vogel琼脂中)中用作基本Vogel琼脂板的顶层(Davis等人，(1970)Methods in Enzymology[酶学方法]17A，第79-143页；以及Davis、Rowland，NEUROSPORA,CONTRIBUTIONS OF A MODEL ORGANISM[脉胞菌属-模式生物的贡献]，Oxford UniversityPress[牛津大学出版社](2000))。将板在30℃下孵育一周。详细步骤在美国专利号8,679,815(通过引用结合在此)中有描述。

选择90个转化体并且将其接种到四个具有1ml新鲜Vogel琼脂/孔的24孔板中，其旁边为3个对照：具有另外的内切葡聚糖酶-3、内切葡聚糖酶-4、内切葡聚糖酶-5、内切葡聚糖酶-6、甘露聚糖酶-1的缺失的四缺失菌株(上述的里氏木霉菌株；图12中的“cellu”)、具有另外的α-淀粉酶基因的缺失(AA缺失；图12中的ΔAA)的“cellu”菌株、以及具有另外的葡糖淀粉酶基因缺失(GA缺失；图12中的ΔGA)的“cellu”菌株。在一周以后，将转化体转移到另外的四个具有1ml新鲜Vogel淀粉琼脂/孔的24孔板中。在一周以后，观察这90个菌株的形态。在Vogel淀粉板中，47个转化体与“cellu”菌株和具有AA缺失(ΔAA)的“cellu”菌株相比具有生长阻滞，但是看起来与具有GA缺失(ΔGA)的“cellu”菌株相似(图12)。与具有葡萄糖作为碳源的常规Vogel琼脂相比，在Vogel淀粉琼脂上唯一的碳源是淀粉。葡糖淀粉酶不断从淀粉的非还原性末端水解a-1,4糖苷键，导致葡萄糖的产生，该葡萄糖可以被真菌菌株利用。当葡糖淀粉酶缺失时，由于葡萄糖的可用性有限，可以观察到生长阻滞。

菌株验证

在90种菌株中有47种在Vogel淀粉琼脂中表现出生长阻滞。随机从它们中选择九个(参见图12，从#1到#9)以使用Fw1(5’-cactactacatccatacgcagcaaacatgg-3’(SEQ IDNO:62))和R3(5’-ggtcaagaagcacatgccagagttcg-3’(SEQ ID NO:63))作为引物进行PCR筛选。图13A显示野生型和TrGA缺失菌株的基因组座位以及引物退火位点(箭头表示当在PCR反应中使用时的聚合方向)。

用引物对FW1和R3通过PCR对9个菌株进行了预筛选。用于扩增PCR产物的PCR条件如下：步骤1：95℃持续5min。步骤2：95℃持续30秒。步骤3：60℃持续30秒。步骤4：68℃持续3min。重复步骤2、3和4进行另外29个循环。步骤5：68℃持续10min。在理想条件下，从PCR预筛选中可以预期有两个PCR片段(1.9-kb和5.2-kb)。在这个结果中，5.2-kb产物不能清楚地观察到。然而，与来自cellulighter(C1)的孢子的5.1-kb产物和来自cellulighter加TrGA缺失盒(C2)的孢子的PCR产物相比，1.9-kb片段可以确凿地证实TrGA缺失盒通过同源重组整合在TrGA基因座处(图13B，顶部凝胶)。

从9个染色体中选择两个(#1和#3)以便分别用引物对FW1/R1、F4/R3和KOF1/KOR2进行进一步的PCR确认。当与来自C2(cellulighter加TrGA缺失盒的孢子)的结果相比，从#1和#3的孢子获得2.0-kb和2.2-kb片段时，用引物对FW1/R1和F4/R3通过PCR进一步证实了TrGA缺失盒通过同源重组整合在TrGA基因座(图13B，左下凝胶)。当从#1和#3的孢子没有得到PCR产物，而从cellulighter(C1)扩增到2.1kb的产物时，使用另一对引物KOF1和KOR2进行PCR也证实了该结果(图13B，右下凝胶，前4个泳道，包括分子量标记)。

通过使用引物TrGAF2(5’gactgtctccaccatgtaatttttc 3’(SEQ ID NO:64))和R3(SEQ ID NO:63)获得了TrGA基因座整个区域的来自#1和#3的孢子的PCR产物，并且确定了它们的DNA序列。测序结果显示TrGA基因已被pyr2表达盒替换(参见图13B中的PCR结果，右下凝胶，最后2个泳道；测序结果的数据未示出)。

上述结果表明SpyCas9切口酶和sgRNA能够促进丝状真菌中的同源重组，允许丝状真菌里氏木霉上的基于同源重组的基因缺失。具体来说，90个转化体中有47个(约52％)在Vogel淀粉板上显示出生长阻滞，表明TrGA基因已被破坏。通过PCR产物测序验证了预期的同源重组事件，证实了缺失盒通过同源重组成功地并入宿主细胞中的TrGA基因座，结果TrGA基因被pyr2表达盒替换。我们的数据表明，除了供体DNA(即，将在目的基因组座位处同源重组的DNA)之外，直接将功能性SpyCas9切口酶复合物引入靶标真菌细胞中，真菌中的同源重组比例可以显著增加。

C部分：在单一表达载体上引入Cas/指导RNA和供体DNA

实例14：通过使用含有用于基因编辑的定向同源供体片段的cas9表达质粒从gla1 基因中缺失单个碱基

在本实例中，通过将含有单个碱基缺失的同源gla1供体片段结合到质粒pTrex2gHyg MoCas gTrGA TS11B中(在实例8中所描述的)指导基因破坏。通过将大约1kb合成的DNA片段Gla1rep(SEQ ID NO:39，在图14中标记为“Tr-gla 1kb同源片段”)插入质粒pTrex2gHygMoCasgTrGATS11B的独特的EcoRV限制位点中来产生质粒pTrexMoCasGATS11-HDR(图14)。EcoRV位点位于pSL1180序列和潮霉素抗性标记(hph)的粗糙脉孢菌cpc1启动子之间的多接头序列中。使用引物1556F(5’-ATGCGCAAATTTAAAGCGCTGATgtgtgtctaatgcctccaccac[SEQ ID NO:73])和1557R(5’-ATATGGATCTGCGCGCGATCGATgatcgtgctagcgctgctgttg[SEQ ID NO:74])扩增Gla1rep和附加物同源尾部以重叠pTrex2gHygMoCasgTrGATS11B中的EcoRV位点的两侧，以促进该片段与EcoRV切割的pTrex2gHygMoCasgTrGATS11B质粒的Gibson组装(使用NEB Gibson组装预混物，马萨诸塞州比佛利的新英格兰生物实验室(NewEngland Biolabs,Beverly,MA))。

使用原生质体和PEG介导的DNA摄取，使用pTrexMoCasGATS11-HDR质粒来转化里氏木霉菌株RL-P37(具有正常的NHEJ机制的菌株)。该菌株对于pyr2是营养缺陷型的，对于本实验是偶然的，但是需要在所有生长培养基中包含尿苷(2g/L)。

转化体最初在Vogel基本培养基+1.2M山梨糖醇+75ppm潮霉素的选择性培养基琼脂板上生长。生长之后，将稳定的和不稳定的表型的80个转化体转移到Vogel淀粉培养基的第二琼脂板上。在第二板上生长之后，使用淀粉清除区的存在或不存在作为报告子来确定gla1基因是否被破坏。将转化体从第二板转移到Vogel基本培养基的非选择性第三板上。在生长几天之后，将转化体从Vogel基本培养基的第三板转移到Vogel基本培养基+75ppm潮霉素B的选择性第四板上。在这些第四板上，转化体可以进行生长以确定在第二和第三板的非选择性培养基上生长之后，转化体是否保持在含有潮霉素的培养基上生长的能力。

据发现，80个转化体中只有11个在Vogel淀粉培养基上产生了清除区，表明gla1破坏，并且在Vogel基本培养基+75ppm潮霉素的第四潮霉素选择性板上不生长。这些转化体推测具有gla1基因的改变，并且没有将来自质粒的潮霉素标记结合到其基因组中。

从这11个gla1-转化体中、从第三Vogel基本培养基板的菌丝体分离出基因组DNA。将引物glaK(SEQ ID NO:31)和glaH(SEQ ID NO:29)用于从基因组DNA来PCR扩增gla1基因以确定TS11基因座的状态。分离PCR产物并且使用引物1538F 5’-CCACCACAGGAACCAAACC(SEQ ID NO:75)、1539R 5’-CTGCGACGGAGGGAATGACG(SEQ ID NO:76)、1540F 5’-GGGCAGGACTGGCAAGGATGT(SEQ ID NO:77)和1541R 5’-GCCGTCACGCCAGGAACAAG(SEQ ID NO:78)进行测序。

测序结果揭示，这11个gla1-转化体中有8个含有Gla1rep序列的单个碱基缺失。两个gla1-转化体在9个和100个碱基的TS11基因座处含有gla1缺失。一个gla1-转化体在TS11处包含470个碱基的插入。

将供体Gla1rep片段结合到质粒pTrex2gHyg MoCas TrGA TS11中产生了指导基因编辑的单一质粒。高频率的潮霉素不稳定的转化体含有gla1基因中的单个碱基缺失，其被工程化到供体Gla1rep片段中。在第一选择性琼脂培养基Vogel基本培养基+75ppm潮霉素B上产生了不稳定的转化体，其随后丢失了转化的cas9质粒。这样的菌株更有利，因为它们不具有将基因编辑质粒NHEJ结合到基因组中的不便。

在另外的数据在这里未示出的实验中，使用与本文所述相同的同源整合方法，将gla1的取代突变成功地引入里氏木霉菌株P37中，其中gla1同源DNA片段含有取代的核苷酸而不是插入pTrex2gHyg MoCas gTrGA TS11B中的缺失。

这些结果证明了产生将同源片段与cas9和靶位点指导RNA一起并入的单一cas9编辑质粒的用途。产生了在靶向基因座处指导特异性cas9靶向切割和基因编辑的同源重组的单一质粒载体。通过筛选不稳定的潮霉素抗性转化体，将质粒DNA向靶标基因座的NHEJ插入的发生率最小化。此外，通过在本实例中筛选不稳定的潮霉素抗性转化体，可以发现通过同源重组已经将同源供体片段并入靶基因座中的转化体。然而，这样的转化体已经随意地丢失了指导靶向重组的质粒。

虽然前述组合物和方法已经通过说明和实例的方式出于清楚理解的目的在一些细节方面进行了描述，但是对于本领域的普通技术人员而言根据本文的传授内容显而易见的是可以对其进行某些改变和修改而不偏离所附权利要求的精神或范围。

因此，前面仅仅举例说明了本发明组合物和方法的原理。将了解的是本领域技术人员将能够设计不同的安排，这些不同的安排虽然没有在此明确地描述或显示，但体现本发明组合物和方法的原理并且被包括在其精神和范围之内。此外，本文叙述的所有实例和条件性语言主要旨在帮助读者理解诸位发明人所贡献的本发明的组合物和方法的原理和概念以推动本领域发展，并且将被视为而不限于这些具体叙述的实例和条件。此外，本文中叙述本发明组合物和方法的原理、方面、以及实施例的所有陈述连同其具体实例旨在涵盖其结构和功能等效物两者。另外，预期此类等效物包括当前已知的等效物以及将来开发的等效物两者，即不论结构如何而执行相同功能的任何开发的要素。因此，本发明的组合物和方法的范围不是旨在受限于本文显示和描述的示例性实施例。

序列：

SEQ ID NO:1

推定的里氏木霉U6基因

AAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCGCCTTCGGGCATTTGGTCAATTTATAACGATACAGGTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGCTAACAGGTCAACAGAGAAGATTAGCATGGCCCCTGCACTAAGGATGACACGCTCACTCAAAGAGAAGCTAAACATTTTTTTTCTCTTCCAAGTCGTGATGGTTATCTTTTTGCTTAGAGAATCTATTCTTGTGGACGATTAGTATTGGTAAATCCCTGCTGCACATTGCGGCGGATGGTCTCAACGGCATAATACCCCATTCGTGATGCAGCGGTGATCTTCAATATGTAGTGTAATACGTTGCATACACCACCAGGTTCGGTGCCTCCTGTATGTACAGTACTGTAGTTCGACTCCTCCGCGCAGGTGGAAACGATTCCCTAGTGGGCAGGTATTTTGGCGGGGTCAAGAA

SEQ ID NO:2

sgRNA的序列(N是与靶位点互补的序列)

SEQ ID NO:3

sgRNA:gAd3A TS1

SEQ ID NO:4

sgRNA:gTrGA TS2

SEQ ID NO:5

sgRNA:gTrGA TS11

SEQ ID NO:6

sgRNA:gPyr2TS6

SEQ ID NO:7

密码子优化的化脓性链球菌Cas9编码基因；具有N-末端和C-末端NLS序列

SEQ ID NO:8

由SEQ ID NO:7编码的化脓性链球菌Cas9具有N-末端和C-末端NLS序列

MAPKKKRKVMDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDKKKKLKL

SEQ ID NO:9

合成的DNA：gAd3A TS1-1(gAd3A TS1 sgRNA(SEQ ID NO:3)，具有酿酒酵母snr52启动子和酿酒酵母sup4终止子)

gaattcggatccTCTTTGAAAAGATAATGTATGATTATGCTTTCACTCATATTTATACAGAAACTTGATGTTTTCTTTCGAGTATATACAAGGTGATTACATGTACGTTTGAAGTACAACTCTAGATTTTGTAGTGCCCTCTTGGGCTAGCGGTAAAGGTGCGCATTTTTTCACACCCTACAATGTTCTGTTCAAAAGATTTTGGTCAAACGCTGTAGAAGTGAAAGTTGGTGCGCATGTTTCGGCGTTCGAAACTTCTCCGCAGTGAAAGATAAATGATCgtcctcgagcaaaaggtgccGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTGTTTTTTATGTCTgaattcggatcc

SEQ ID NO:10

合成的DNA：gAd3A TS1-2(gAd3A TS1 sgRNA(SEQ ID NO:3)，具有里氏木霉U6启动子和终止子)

gaattcggatccAAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCgtcctcgagcaaaaggtgccGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTTCTCTTgaattcggatcc

SEQ ID NO:11

合成的DNA：gAd3A TS1-3(gAd3A TS1 sgRNA(SEQ ID NO:3)，具有里氏木霉U6启动子、终止子和内含子)

gaattcggatccAAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCgtcctcgagcaaaaggtgccGTTTTAGAGCTAGAGTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGCTAACAGAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTTCTCTTgaattcggatcc

SEQ ID NO:12

获得具有较短的里氏木霉U6启动子区域的指导RNA表达盒作为合成DNA。这里提供了一个包括用于sgRNA在TS11处靶向里氏木霉gla1基因的序列的实例。

AATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCgccaatggcgacggcagcacGTTTTAGAGCTAGAGTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGCTAACAGAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTTCTCTT

SEQ ID NO:13

引物：gRNA fwd aflII

cgtcagcttaagAATTCCTAAAGAAACAGCATGAAATGG

SEQ ID NO:14

引物：gRNA rev sfiI

cgtcagggccacgtgggccAAGAGAAAAAAAAGCACCACCGACTCGG

SEQ ID NO:15

引物：Ad3 5'fwd

tgaacacagccaccgacatcagc

SEQ ID NO:16

引物：Ad3 5'rev

gctggtgagggtttgtgctattg

SEQ ID NO:17

引物：Ad3a 5005rev

gattgcttgggaggaggacat

SEQ ID NO:18

引物：Ad3 3’fwd

cgaggccactgatgaagttgttc

SEQ ID NO:19

引物：Ad3 3’rev

Cagttttccaaggctgccaacgc

SEQ ID NO:20

引物：Ad3a 5003 fwd

ctgatcttgcaccctggaaatc

SEQ ID NO:21

Ad3mid rev

ctctctatcatttgccaccctcc

SEQ ID NO:22

引物：Adfrag fwd

ctccattcaccctcaattctcc

SEQ ID NO:23

引物：Adfrag rev

gttcccttggcggtgcttggatc

SEQ ID NO:24

引物：Ad3a 2k fwd

caatagcacaaaccctcaccagc

SEQ ID NO:25

Ad3a 2k rev

gaacaacttcatcagtggcctcg

SEQ ID NO:26

引物：glaA

ccgttagttgaagatccttgccg

SEQ ID NO:27

引物：glaB

gtcgaggatttgcttcatacctc

SEQ ID NO:28

引物：glaD

gagagacgcaggatgactcaaag

SEQ ID NO:29

引物：glaH

tgccgtgggtcattggcatattc

SEQ ID NO:30

引物：glaJ

tgccgactttgtccagtgattcg

SEQ ID NO:31

引物：glaK

ttacatgtggacgcgagatagcg

SEQ ID NO:32

引物：gla1repF

gtgtgtctaatgcctccaccac

SEQ ID NO:33

引物：gla1repR

gatcgtgctagcgctgctgttg

SEQ ID NO:34

引物：1553R

CCGTGATGGAGCCCGTCTTCT

SEQ ID NO:35

引物：1555F

CGCGGTGAGTTCAGGCTTTTTC

SEQ ID NO:36

引物：pyr2F

gtataagagcaggaggagggag

SEQ ID NO:37

引物：pyr2R

gaacgcctcaatcagtcagtcg

SEQ ID NO:38

在里氏木霉端粒序列之间的细菌卡那霉素抗性基因(具有启动子和终止子)

tcaggaaatagctttaagtagcttattaagtattaaaattatatatatttttaatataactatatttctttaataaataggtattttaagctttatatataaatataataataaaataatatattatatagctttttattaataaataaaatagctaaaaatataaaaaaaatagctttaaaatacttatttttaattagaattttatatatttttaatatataagatcttttacttttttataagcttcctaccttaaattaaatttttacttttttttactattttactatatcttaaataaaggctttaaaaatataaaaaaaatcttcttatatattataagctataaggattatatatatatttttttttaatttttaaagtaagtattaaagctagaattaaagttttaattttttaaggctttatttaaaaaaaggcagtaatagcttataaaagaaatttctttttcttttatactaaaagtactttttttttaataaggttagggttagggtttactcacaccgaccatcccaaccacatcttagggttagggttagggttagggttagggttagggttagggttagggtaagggtttaaacaaagccacgttgtgtctcaaaatctctgatgttacattgcacaagataaaaatatatcatcatgaacaataaaactgtctgcttacataaacagtaatacaaggggtgttatgagccatattcaacgggaaacgtcttgctcgaggccgcgattaaattccaacatggatgctgatttatatgggtataaatgggctcgcgataatgtcgggcaatcaggtgcgacaatctatcgattgtatgggaagcccgatgcgccagagttgtttctgaaacatggcaaaggtagcgttgccaatgatgttacagatgagatggtcagactaaactggctgacggaatttatgcctcttccgaccatcaagcattttatccgtactcctgatgatgcatggttactcaccactgcgatccccgggaaaacagcattccaggtattagaagaatatcctgattcaggtgaaaatattgttgatgcgctggcagtgttcctgcgccggttgcattcgattcctgtttgtaattgtccttttaacagcgatcgcgtatttcgtctcgctcaggcgcaatcacgaatgaataacggtttggttgatgcgagtgattttgatgacgagcgtaatggctggcctgttgaacaagtctggaaagaaatgcataagcttttgccattctcaccggattcagtcgtcactcatggtgatttctcacttgataaccttatttttgacgaggggaaattaataggttgtattgatgttggacgagtcggaatcgcagaccgataccaggatcttgccatcctatggaactgcctcggtgagttttctccttcattacagaaacggctttttcaaaaatatggtattgataatcctgatatgaataaattgcagtttcatttgatgctcgatgagtttttctaatcagaattggttaattggttgtaacactggcagagcattacgctgacttgacgggacggcggctttgttgaataaatcgaacttttgctgagttgaaggatcagatcacgcatcttcccgacaacgcagaccgttccgtggcaaagcaaaagttcaaaatcaccaactggtccacctacaacaaagctctcatcaaccgtggctccctcactttctggctggatgatggggcgattcaggcctggtatgagtcagcaacaccttcttcacgaggcagacctcagcggtttaaacctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaacctaaccctaatggggtcgatctgaaccgaggatgagggttctatagactaatctacaggccgtacatggtgtgattgcagatgcgacgggcaaggtgtacagtgtccagaaggaggagagcggcataggtattgtaatagaccagctttacataataatcgcctgttgctactgactgatgaccttcttccctaaccagtttcctaattaccactgcagtgaggataaccctaactcgctctggggttattattatactgattagcaggtggcttatatagtgctgaagtactataagagtttctgcgggaggaggtggaaggactataaactggacacagttagggatagagtgatgacaagacctgaatgttatcctccggtgtggtatagcgaattggctgaccttgcagatggtaatggtttaggcagggtttttgcagagggggacgagaacgcgttctgcgatttaacggctgctgccgccaagctttacggttctctaatgggcggccgc

SEQ ID NO:39

合成的DNA：Gla1rep

SEQ ID NO:40

全长U6基因启动子序列(不包括转录起始位点)

AAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATC

SEQ ID NO:41

截短的/较短的U6基因启动子序列(不包括转录起始位点)

AATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATC

SEQ ID NO:42

U6基因内含子

GTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGCTAA

CAG

SEQ ID NO:43

U6基因转录终止序列

TTTTTTTTCTCTT

SEQ ID NO:44

丝状真菌细胞密码子优化的化脓性链球菌Cas9编码基因；无NLS

atggacaagaagtacagcatcggcctcgacatcggcaccaactcggtgggctgggccgtcatcacggacgaatataaggtcccgtcgaagaagttcaaggtcctcggcaatacagaccgccacagcatcaagaaaaacttgatcggcgccctcctgttcgatagcggcgagaccgcggaggcgaccaggctcaagaggaccgccaggagacggtacactaggcgcaagaacaggatctgctacctgcaggagatcttcagcaacgagatggcgaaggtggacgactccttcttccaccgcctggaggaatcattcctggtggaggaggacaagaagcatgagcggcacccaatcttcggcaacatcgtcgacgaggtggcctaccacgagaagtacccgacaatctaccacctccggaagaaactggtggacagcacagacaaggcggacctccggctcatctaccttgccctcgcgcatatgatcaagttccgcggccacttcctcatcgagggcgacctgaacccggacaactccgacgtggacaagctgttcatccagctcgtgcagacgtacaatcaactgttcgaggagaaccccataaacgctagcggcgtggacgccaaggccatcctctcggccaggctctcgaaatcaagaaggctggagaaccttatcgcgcagttgccaggcgaaaagaagaacggcctcttcggcaaccttattgcgctcagcctcggcctgacgccgaacttcaaatcaaacttcgacctcgcggaggacgccaagctccagctctcaaaggacacctacgacgacgacctcgacaacctcctggcccagataggagaccagtacgcggacctcttcctcgccgccaagaacctctccgacgctatcctgctcagcgacatccttcgggtcaacaccgaaattaccaaggcaccgctgtccgccagcatgattaaacgctacgacgagcaccatcaggacctcacgctgctcaaggcactcgtccgccagcagctccccgagaagtacaaggagatcttcttcgaccaatcaaaaaacggctacgcgggatatatcgacggcggtgccagccaggaagagttctacaagttcatcaaaccaatcctggagaagatggacggcaccgaggagttgctggtcaagctcaacagggaggacctcctcaggaagcagaggaccttcgacaacggctccatcccgcatcagatccacctgggcgaactgcatgccatcctgcggcgccaggaggacttctacccgttcctgaaggataaccgggagaagatcgagaagatcttgacgttccgcatcccatactacgtgggcccgctggctcgcggcaactcccggttcgcctggatgacccggaagtcggaggagaccatcacaccctggaactttgaggaggtggtcgataagggcgctagcgctcagagcttcatcgagcgcatgaccaacttcgataaaaacctgcccaatgaaaaagtcctccccaagcactcgctgctctacgagtacttcaccgtgtacaacgagctcaccaaggtcaaatacgtcaccgagggcatgcggaagccggcgttcctgagcggcgagcagaagaaggcgatagtggacctcctcttcaagaccaacaggaaggtgaccgtgaagcaattaaaagaggactacttcaagaaaatagagtgcttcgactccgtggagatctcgggcgtggaggatcggttcaacgcctcactcggcacgtatcacgacctcctcaagatcattaaagacaaggacttcctcgacaacgaggagaacgaggacatcctcgaggacatcgtcctcaccctgaccctgttcgaggaccgcgaaatgatcgaggagaggctgaagacctacgcgcacctgttcgacgacaaggtcatgaaacagctcaagaggcgccgctacactggttggggaaggctgtcccgcaagctcattaatggcatcagggacaagcagagcggcaagaccatcctggacttcctcaagtccgacgggttcgccaaccgcaacttcatgcagctcattcacgacgactcgctcacgttcaaggaagacatccagaaggcacaggtgagcgggcagggtgactccctccacgaacacatcgccaacctggccggctcgccggccattaaaaagggcatcctgcagacggtcaaggtcgtcgacgagctcgtgaaggtgatgggccggcacaagcccgaaaatatcgtcatagagatggccagggagaaccagaccacccaaaaagggcagaagaactcgcgcgagcggatgaaacggatcgaggagggcattaaagagctcgggtcccagatcctgaaggagcaccccgtggaaaatacccagctccagaatgaaaagctctacctctactacctgcagaacggccgcgacatgtacgtggaccaggagctggacattaatcggctatcggactacgacgtcgaccacatcgtgccgcagtcgttcctcaaggacgatagcatcgacaacaaggtgctcacccggtcggataaaaatcggggcaagagcgacaacgtgcccagcgaggaggtcgtgaagaagatgaaaaactactggcgccagctcctcaacgcgaaactgatcacccagcgcaagttcgacaacctgacgaaggcggaacgcggtggcttgagcgaactcgataaggcgggcttcataaaaaggcagctggtcgagacgcgccagatcacgaagcatgtcgcccagatcctggacagccgcatgaatactaagtacgatgaaaacgacaagctgatccgggaggtgaaggtgatcacgctgaagtccaagctcgtgtcggacttccgcaaggacttccagttctacaaggtccgcgagatcaacaactaccaccacgcccacgacgcctacctgaatgcggtggtcgggaccgccctgatcaagaagtacccgaagctggagtcggagttcgtgtacggcgactacaaggtctacgacgtgcgcaaaatgatcgccaagtccgagcaggagatcggcaaggccacggcaaaatacttcttctactcgaacatcatgaacttcttcaagaccgagatcaccctcgcgaacggcgagatccgcaagcgcccgctcatcgaaaccaacggcgagacgggcgagatcgtctgggataagggccgggatttcgcgacggtccgcaaggtgctctccatgccgcaagtcaatatcgtgaaaaagacggaggtccagacgggcgggttcagcaaggagtccatcctcccgaagcgcaactccgacaagctcatcgcgaggaagaaggattgggacccgaaaaaatatggcggcttcgacagcccgaccgtcgcatacagcgtcctcgtcgtggcgaaggtggagaagggcaagtcaaagaagctcaagtccgtgaaggagctgctcgggatcacgattatggagcggtcctccttcgagaagaacccgatcgacttcctagaggccaagggatataaggaggtcaagaaggacctgattattaaactgccgaagtactcgctcttcgagctggaaaacggccgcaagaggatgctcgcctccgcaggcgagttgcagaagggcaacgagctcgccctcccgagcaaatacgtcaatttcctgtacctcgctagccactatgaaaagctcaagggcagcccggaggacaacgagcagaagcagctcttcgtggagcagcacaagcattacctggacgagatcatcgagcagatcagcgagttctcgaagcgggtgatcctcgccgacgcgaacctggacaaggtgctgtcggcatataacaagcaccgcgacaaaccaatacgcgagcaggccgaaaatatcatccacctcttcaccctcaccaacctcggcgctccggcagccttcaagtacttcgacaccacgattgaccggaagcggtacacgagcacgaaggaggtgctcgatgcgacgctgatccaccagagcatcacagggctctatgaaacacgcatcgacctgagccagctgggcggagac

SEQ ID NO:45

由SEQ ID NO:44编码的化脓性链球菌Cas9无NLS

MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

SEQ ID NO:46

SV40NLS

PKKKRKV

SEQ NO:47

里氏木霉blr2(蓝光调节子2)基因NLS

KKKKLKL

SEQ ID NO:48

嗜热链球菌(Streptococcus thermophilus)LMD-9Cas9

MTKPYSIGLDIGTNSVGWAVTTDNYKVPSKKMKVLGNTSKKYIKKNLLGVLLFDSGITAEGRRLKRTARRRYTRRRNRILYLQEIFSTEMATLDDAFFQRLDDSFLVPDDKRDSKYPIFGNLVEEKAYHDEFPTIYHLRKYLADSTKKADLRLVYLALAHMIKYRGHFLIEGEFNSKNNDIQKNFQDFLDTYNAIFESDLSLENSKQLEEIVKDKISKLEKKDRILKLFPGEKNSGIFSEFLKLIVGNQADFRKCFNLDEKASLHFSKESYDEDLETLLGYIGDDYSDVFLKAKKLYDAILLSGFLTVTDNETEAPLSSAMIKRYNEHKEDLALLKEYIRNISLKTYNEVFKDDTKNGYAGYIDGKTNQEDFYVYLKKLLAEFEGADYFLEKIDREDFLRKQRTFDNGSIPYQIHLQEMRAILDKQAKFYPFLAKNKERIEKILTFRIPYYVGPLARGNSDFAWSIRKRNEKITPWNFEDVIDKESSAEAFINRMTSFDLYLPEEKVLPKHSLLYETFNVYNELTKVRFIAESMRDYQFLDSKQKKDIVRLYFKDKRKVTDKDIIEYLHAIYGYDGIELKGIEKQFNSSLSTYHDLLNIINDKEFLDDSSNEAIIEEIIHTLTIFEDREMIKQRLSKFENIFDKSVLKKLSRRHYTGWGKLSAKLINGIRDEKSGNTILDYLIDDGISNRNFMQLIHDDALSFKKKIQKAQIIGDEDKGNIKEVVKSLPGSPAIKKGILQSIKIVDELVKVMGGRKPESIVVEMARENQYTNQGKSNSQQRLKRLEKSLKELGSKILKENIPAKLSKIDNNALQNDRLYLYYLQNGKDMYTGDDLDIDRLSNYDIDHIIPQAFLKDNSIDNKVLVSSASNRGKSDDVPSLEVVKKRKTFWYQLLKSKLISQRKFDNLTKAERGGLSPEDKAGFIQRQLVETRQITKHVARLLDEKFNNKKDENNRAVRTVKIITLKSTLVSQFRKDFELYKVREINDFHHAHDAYLNAVVASALLKKYPKLEPEFVYGDYPKYNSFRERKSATEKVYFYSNIMNIFKKSISLADGRVIERPLIEVNEETGESVWNKESDLATVRRVLSYPQVNVVKKVEEQNHGLDRGKPKGLFNANLSSKPKPNSNENLVGAKEYLDPKKYGGYAGISNSFTVLVKGTIEKGAKKKITNVLEFQGISILDRINYRKDKLNFLLEKGYKDIELIIELPKYSLFELSDGSRRMLASILSTNNKRGEIHKGNQIFLSQKFVKLLYHAKRISNTINENHRKYVENHKKEFEELFYYILEFNENYVGAKKNGKLLNSAFQSWQNHSIDELCSSFIGPTGSERKGLFELTSRGSAADFEFLGVKIPRYRDYTPSSLLKDATLIHQSVTGLYETRIDLAKLGEGSEQ ID NO:49

变异链球菌(Streptococcus mutans)UA159Cas9

MKKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKSHIEKNLLGALLFDSGNTAEDRRLKRTARRRYTRRRNRILYLQEIFSEEMGKVDDSFFHRLEDSFLVTEDKRGERHPIFGNLEEEVKYHENFPTIYHLRQYLADNPEKVDLRLVYLALAHIIKFRGHFLIEGKFDTRNNDVQRLFQEFLAVYDNTFENSSLQEQNVQVEEILTDKISKSAKKDRVLKLFPNEKSNGRFAEFLKLIVGNQADFKKHFELEEKAPLQFSKDTYEEELEVLLAQIGDNYAELFLSAKKLYDSILLSGILTVTDVGTKAPLSASMIQRYNEHQMDLAQLKQFIRQKLSDKYNEVFSDVSKDGYAGYIDGKTNQEAFYKYLKGLLNKIEGSGYFLDKIEREDFLRKQRTFDNGSIPHQIHLQEMRAIIRRQAEFYPFLADNQDRIEKLLTFRIPYYVGPLARGKSDFAWLSRKSADKITPWNFDEIVDKESSAEAFINRMTNYDLYLPNQKVLPKHSLLYEKFTVYNELTKVKYKTEQGKTAFFDANMKQEIFDGVFKVYRKVTKDKLMDFLEKEFDEFRIVDLTGLDKENKVFNASYGTYHDLCKILDKDFLDNSKNEKILEDIVLTLTLFEDREMIRKRLENYSDLLTKEQVKKLERRHYTGWGRLSAELIHGIRNKESRKTILDYLIDDGNSNRNFMQLINDDALSFKEEIAKAQVIGETDNLNQVVSDIAGSPAIKKGILQSLKIVDELVKIMGHQPENIVVEMARENQFTNQGRRNSQQRLKGLTDSIKEFGSQILKEHPVENSQLQNDRLFLYYLQNGRDMYTGEELDIDYLSQYDIDHIIPQAFIKDNSIDNRVLTSSKENRGKSDDVPSKDVVRKMKSYWSKLLSAKLITQRKFDNLTKAERGGLTDDDKAGFIKRQLVETRQITKHVARILDERFNTETDENNKKIRQVKIVTLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVIGKALLGVYPQLEPEFVYGDYPHFHGHKENKATAKKFFYSNIMNFFKKDDVRTDKNGEIIWKKDEHISNIKKVLSYPQVNIVKKVEEQTGGFSKESILPKGNSDKLIPRKTKKFYWDTKKYGGFDSPIVAYSILVIADIEKGKSKKLKTVKALVGVTIMEKMTFERDPVAFLERKGYRNVQEENIIKLPKYSLFKLENGRKRLLASARELQKGNEIVLPNHLGTLLYHAKNIHKVDEPKHLDYVDKHKDEFKELLDVVSNFSKKYTLAEGNLEKIKELYAQNNGEDLKELASSFINLLTFTAIGAPATFKFFDKNIDRKRYTSTTEILNATLIHQSITGLYETRIDLNKLGGD

SEQ ID NO:50

空肠弯曲杆菌(Campylobacter jejuni)Cas9

MARILAFDIGISSIGWAFSENDELKDCGVRIFTKVENPKTGESLALPRRLARSARKRLARRKARLNHLKHLIANEFKLNYEDYQSFDESLAKAYKGSLISPYELRFRALNELLSKQDFARVILHIAKRRGYDDIKNSDDKEKGAILKAIKQNEEKLANYQSVGEYLYKEYFQKFKENSKEFTNVRNKKESYERCIAQSFLKDELKLIFKKQREFGFSFSKKFEEEVLSVAFYKRALKDFSHLVGNCSFFTDEKRAPKNSPLAFMFVALTRIINLLNNLKNTEGILYTKDDLNALLNEVLKNGTLTYKQTKKLLGLSDDYEFKGEKGTYFIEFKKYKEFIKALGEHNLSQDDLNEIAKDITLIKDEIKLKKALAKYDLNQNQIDSLSKLEFKDHLNISFKALKLVTPLMLEGKKYDEACNELNLKVAINEDKKDFLPAFNETYYKDEVTNPVVLRAIKEYRKVLNALLKKYGKVHKINIELAREVGKNHSQRAKIEKEQNENYKAKKDAELECEKLGLKINSKNILKLRLFKEQKEFCAYSGEKIKISDLQDEKMLEIDHIYPYSRSFDDSYMNKVLVFTKQNQEKLNQTPFEAFGNDSAKWQKIEVLAKNLPTKKQKRILDKNYKDKEQKNFKDRNLNDTRYIARLVLNYTKDYLDFLPLSDDENTKLNDTQKGSKVHVEAKSGMLTSALRHTWGFSAKDRNNHLHHAIDAVIIAYANNSIVKAFSDFKKEQESNSAELYAKKISELDYKNKRKFFEPFSGFRQKVLDKIDEIFVSKPERKKPSGALHEETFRKEEEFYQSYGGKEGVLKALELGKIRKVNGKIVKNGDMFRVDIFKHKKTNKFYAVPIYTMDFALKVLPNKAVARSKKGEIKDWILMDENYEFCFSLYKDSLILIQTKDMQEPEFVYYNAFTSSTVSLIVSKHDNKFETLSKNQKILFKNANEKEVIAKSIGIQNLKVFEKYIVSALGEVTKAEFRQREDFKK

SEQ ID NO:51

脑膜炎奈瑟球菌(Neisseria meningitides)Cas9

MAAFKPNSINYILGLDIGIASVGWAMVEIDEEENPIRLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRTRRLLKREGVLQAANFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVAGNAHALQTGDFRTPAELALNKFEKESGHIRNQRSDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLKDRIQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTLEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSAKRLDEGVSVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPAKAFAEPFYKYDKAGNRTQQVKAVRVEQVQKTGVWVRNHNGIADNATMVRVDVFEKGDKYYLVPIYSWQVAKGILPDRAVVQGKDEEDWQLIDDSFNFKFSLHPNDLVEVITKKARMFGYFASCHRGTGNINIRIHDLDHKIGKNGILEGIGVKTALSFQKYQIDELGKEIRPCRLKKRPPVR

SEQ ID NO:52

土拉弗朗西斯菌新凶手亚种(Francisella tularensis subsp.novicida)Cas9MNFKILPIAIDLGVKNTGVFSAFYQKGTSLERLDNKNGKVYELSKDSYTLLMNNRTARRHQRRGIDRKQLVKRLFKLIWTEQLNLEWDKDTQQAISFLFNRRGFSFITDGYSPEYLNIVPEQVKAILMDIFDDYNGEDDLDSYLKLATEQESKISEIYNKLMQKILEFKLMKLCTDIKDDKVSTKTLKEITSYEFELLADYLANYSESLKTQKFSYTDKQGNLKELSYYHHDKYNIQEFLKRHATINDRILDTLLTDDLDIWNFNFEKFDFDKNEEKLQNQEDKDHIQAHLHHFVFAVNKIKSEMASGGRHRSQYFQEITNVLDENNHQEGYLKNFCENLHNKKYSNLSVKNLVNLIGNLSNLELKPLRKYFNDKIHAKADHWDEQKFTETYCHWILGEWRVGVKDQDKKDGAKYSYKDLCNELKQKVTKAGLVDFLLELDPCRTIPPYLDNNNRKPPKCQSLILNPKFLDNQYPNWQQYLQELKKLQSIQNYLDSFETDLKVLKSSKDQPYFVEYKSSNQQIASGQRDYKDLDARILQFIFDRVKASDELLLNEIYFQAKKLKQKASSELEKLESSKKLDEVIANSQLSQILKSQHTNGIFEQGTFLHLVCKYYKQRQRARDSRLYIMPEYRYDKKLHKYNNTGRFDDDNQLLTYCNHKPRQKRYQLLNDLAGVLQVSPNFLKDKIGSDDDLFISKWLVEHIRGFKKACEDSLKIQKDNRGLLNHKINIARNTKGKCEKEIFNLICKIEGSEDKKGNYKHGLAYELGVLLFGEPNEASKPEFDRKIKKFNSIYSFAQIQQIAFAERKGNANTCAVCSADNAHRMQQIKITEPVEDNKDKIILSAKAQRLPAIPTRIVDGAVKKMATILAKNIVDDNWQNIKQVLSAKHQLHIPIITESNAFEFEPALADVKGKSLKDRRKKALERISPENIFKDKNNRIKEFAKGISAYSGANLTDGDFDGAKEELDHIIPRSHKKYGTLNDEANLICVTRGDNKNKGNRIFCLRDLADNYKLKQFETTDDLEIEKKIADTIWDANKKDFKFGNYRSFINLTPQEQKAFRHALFLADENPIKQAVIRAINNRNRTFVNGTQRYFAEVLANNIYLRAKKENLNTDKISFDYFGIPTIGNGRGIAEIRQLYEKVDSDIQAYAKGDKPQASYSHLIDAMLAFCIAADEHRNDGSIGLEIDKNYSLYPLDKNTGEVFTKDIFSQIKITDNEFSDKKLVRKKAIEGFNTHRQMTRDGIYAENYLPILIHKELNEVRKGYTWKNSEEIKIFKGKKYDIQQLNNLVYCLKFVDKPISIDIQISTLEELRNILTTNNIAATAEYYYINLKTQKLHEYYIENYNTALGYKKYSKEMEFLRSLAYRSERVKIKSIDDVKQVLDKDSNFIIGKITLPFKKEWQRLYREWQNTTIKDDYEFLKSFFNVKSITKLHKKVRKDFSLPISTNEGKFLVKRKTWDNNFIYQILNDSDSRADGTKPFIPAFDISKNEIVEAIIDSFTSKNIFWLPKNIELQKVDNKNIFAIDTSKWFEVETPSDLRDIGIATIQYKIDNNSRPKVRVKLDYVIDDDSKINYFMNHSLLKSRYPDKVLEILKQSTIIEFESSGFNKTIKEMLGMKLAGIYNETSNN

SEQ ID NO:53

多杀巴斯德菌(Pasteurella multocida)Cas9

MQTTNLSYILGLDLGIASVGWAVVEINENEDPIGLIDVGVRIFERAEVPKTGESLALSRRLARSTRRLIRRRAHRLLLAKRFLKREGILSTIDLEKGLPNQAWELRVAGLERRLSAIEWGAVLLHLIKHRGYLSKRKNESQTNNKELGALLSGVAQNHQLLQSDDYRTPAELALKKFAKEEGHIRNQRGAYTHTFNRLDLLAELNLLFAQQHQFGNPHCKEHIQQYMTELLMWQKPALSGEAILKMLGKCTHEKNEFKAAKHTYSAERFVWLTKLNNLRILEDGAERALNEEERQLLINHPYEKSKLTYAQVRKLLGLSEQAIFKHLRYSKENAESATFMELKAWHAIRKALENQGLKDTWQDLAKKPDLLDEIGTAFSLYKTDEDIQQYLTNKVPNSVINALLVSLNFDKFIELSLKSLRKILPLMEQGKRYDQACREIYGHHYGEANQKTSQLLPAIPAQEIRNPVVLRTLSQARKVINAIIRQYGSPARVHIETGRELGKSFKERREIQKQQEDNRTKRESAVQKFKELFSDFSSEPKSKDILKFRLYEQQHGKCLYSGKEINIHRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLASENQNKGNQTPYEWLQGKINSERWKNFVALVLGSQCSAAKKQRLLTQVIDDNKFIDRNLNDTRYIARFLSNYIQENLLLVGKNKKNVFTPNGQITALLRSRWGLIKARENNNRHHALDAIVVACATPSMQQKITRFIRFKEVHPYKIENRYEMVDQESGEIISPHFPEPWAYFRQEVNIRVFDNHPDTVLKEMLPDRPQANHQFVQPLFVSRAPTRKMSGQGHMETIKSAKRLAEGISVLRIPLTQLKPNLLENMVNKEREPALYAGLKARLAEFNQDPAKAFATPFYKQGGQQVKAIRVEQVQKSGVLVRENNGVADNASIVRTDVFIKNNKFFLVPIYTWQVAKGILPNKAIVAHKNEDEWEEMDEGAKFKFSLFPNDLVELKTKKEYFFGYYIGLDRATGNISLKEHDGEISKGKDGVYRVGVKLALSFEKYQVDELGKNRQICRPQQRQPVR

SEQ ID NO:54

在质粒pET30a-Cas9-D10A切口酶中的合成的Cas9-D10A切口酶基因的核苷酸序列。编码N-末端His6标签的寡核苷酸以下划线和斜体表示，编码SV40核定位信号的寡核苷酸以斜体和灰色高亮显示，并且编码BLR核定位信号的寡核苷酸以下划线和灰色高亮显示。

atgtcttctggtctggtgccacgcggttctggtatgaaagaaaccgctgctgctaaattcgaacgccagcacatggacagcccagatctgggtaccgacgacgacgacaaggccatggccccaaaaaagaaacgcaaggttatggataaaaaatacagcattggtctggccatcggaaccaacagcgttgggtgggcagtaataacagatgaatacaaagtgccgtcaaaaaaatttaaggttctggggaatacagatcgccacagcataaaaaagaatctgattggggcattgctgtttgattcgggtgagacagctgaggccacgcgtctgaaacgtacagcaagaagacgttacacacgtcgtaaaaatcgtatttgctacttacaggaaattttttctaacgaaatggccaaggtagatgatagtttcttccatcgtctcgaagaatcttttctggttgaggaagataaaaaacacgaacgtcaccctatctttggcaatatcgtggatgaagtggcctatcatgaaaaataccctacgatttatcatcttcgcaagaagttggttgatagtacggacaaagcggatctgcgtttaatctatcttgcgttagcgcacatgatcaaatttcgtggtcatttcttaattgaaggtgatctgaatcctgataactctgatgtggacaaattgtttatacaattagtgcaaacctataatcagctgttcgaggaaaaccccattaatgcctctggagttgatgccaaagcgattttaagcgcgagactttctaagtcccggcgtctggagaatctgatcgcccagttaccaggggaaaagaaaaatggtctgtttggtaatctgattgccctcagtctggggcttaccccgaacttcaaatccaattttgacctggctgaggacgcaaagctgcagctgagcaaagatacttatgatgatgacctcgacaatctgctcgcccagattggtgaccaatatgcggatctgtttctggcagcgaagaatctttcggatgctatcttgctgtcggatattctgcgtgttaataccgaaatcaccaaagcgcctctgtctgcaagtatgatcaagagatacgacgagcaccaccaggacctgactcttcttaaggcactggtacgccaacagcttccggagaaatacaaagaaatattcttcgaccagtccaagaatggttacgcgggctacatcgatggtggtgcatcacaggaagagttctataaatttattaaaccaatccttgagaaaatggatggcacggaagagttacttgttaaacttaaccgcgaagacttgcttagaaagcaacgtacattcgacaacggctccatcccacaccagattcatttaggtgaacttcacgccatcttgcgcagacaagaagatttctatcccttcttaaaagacaatcgggagaaaatcgagaagatcctgacgttccgcattccctattatgtcggtcccctggcacgtggtaattctcggtttgcctggatgacgcgcaaaagtgaggaaaccatcaccccttggaactttgaagaagtcgtggataaaggtgctagcgcgcagtcttttatagaaagaatgacgaacttcgataaaaacttgcccaacgaaaaagtcctgcccaagcactctcttttatatgagtactttactgtgtacaacgaactgactaaagtgaaatacgttacggaaggtatgcgcaaacctgcctttcttagtggcgagcagaaaaaagcaattgtcgatcttctctttaaaacgaatcgcaaggtaactgtaaaacagctgaaggaagattatttcaaaaagatcgaatgctttgattctgtcgagatctcgggtgtcgaagatcgtttcaacgcttccttagggacctatcatgatttgctgaagataataaaagacaaagactttctcgacaatgaagaaaatgaagatattctggaggatattgttttgaccttgaccttattcgaagatagagagatgatcgaggagcgcttaaaaacctatgcccacctgtttgatgacaaagtcatgaagcaattaaagcgccgcagatatacggggtggggccgcttgagccgcaagttgattaacggtattagagacaagcagagcggaaaaactatcctggatttcctcaaatctgacggatttgcgaaccgcaattttatgcagcttatacatgatgattcgcttacattcaaagaggatattcagaaggctcaggtgtctgggcaaggtgattcactccacgaacatatagcaaatttggccggctctcctgcgattaagaaggggatcctgcaaacagttaaagttgtggatgaacttgtaaaagtaatgggccgccacaagccggagaatatcgtgatagaaatggcgcgcgagaatcaaacgacacaaaaaggtcaaaagaactcaagagagagaatgaagcgcattgaggaggggataaaggaacttggatctcaaattctgaaagaacatccagttgaaaacactcagctgcaaaatgaaaaattgtacctgtactacctgcagaatggaagagacatgtacgtggatcaggaattggatatcaatagactctcggactatgacgtagatcacattgtccctcagagcttcctcaaggatgattctatagataataaagtacttacgagatcggacaaaaatcgcggtaaatcggataacgtcccatcggaggaagtcgttaaaaagatgaaaaactattggcgtcaactgctgaacgccaagctgatcacacagcgtaagtttgataatctgactaaagccgaacgcggtggtcttagtgaactcgataaagcaggatttataaaacggcagttagtagaaacgcgccaaattacgaaacacgtggctcagatcctcgattctagaatgaatacaaagtacgatgaaaacgataaactgatccgtgaagtaaaagtcattaccttaaaatctaaacttgtgtccgatttccgcaaagattttcagttttacaaggtccgggaaatcaataactatcaccatgcacatgatgcatatttaaatgcggttgtaggcacggcccttattaagaaataccctaaactcgaaagtgagtttgtttatggggattataaagtgtatgacgttcgcaaaatgatcgcgaaatcagaacaggaaatcggtaaggctaccgctaaatactttttttattccaacattatgaatttttttaagaccgaaataactctcgcgaatggtgaaatccgtaaacggcctcttatagaaaccaatggtgaaacgggagaaatcgtttgggataaaggtcgtgactttgccaccgttcgtaaagtcctctcaatgccgcaagttaacattgtcaagaagacggaagttcaaacagggggattctccaaagaatctatcctgccgaagcgtaacagtgataaacttattgccagaaaaaaagattgggatccaaaaaaatacggaggctttgattcccctaccgtcgcgtatagtgtgctggtggttgctaaagtcgagaaagggaaaagcaagaaattgaaatcagttaaagaactgctgggtattacaattatggaaagatcgtcctttgagaaaaatccgatcgactttttagaggccaaggggtataaggaagtgaaaaaagatctcatcatcaaattaccgaagtatagtctttttgagctggaaaacggcagaaaaagaatgctggcctccgcgggcgagttacagaagggaaatgagctggcgctgccttccaaatatgttaattttctgtaccttgccagtcattatgagaaactgaagggcagccccgaagataacgaacagaaacaattattcgtggaacagcataagcactatttagatgaaattatagagcaaattagtgaattttctaagcgcgttatcctcgcggatgctaatttagacaaagtactgtcagcttataataaacatcgggataagccgattagagaacaggccgaaaatatcattcatttgtttaccttaaccaaccttggagcaccagctgccttcaaatatttcgataccacaattgatcgtaaacggtatacaagtacaaaagaagtcttggacgcaaccctcattcatcaatctattactggattatatgagacacgcattgatctttcacagctgggcggagacaagaagaaaaaactgaaactg

SEQ ID NO:55

从质粒pET30a-Cas9-D10A切口酶(由SEQ ID NO:54编码)表达的Cas9-D10A切口酶蛋白质的氨基酸序列。N-末端His6标签以下划线和斜体显示，突变的氨基酸以粗体下划线显示(D10A)，SV40核定位信号以斜体和灰色显示，并且BLR核定位信号以下划线和灰色显示。mssglvprgsgmketaaakferqhmdspdlgtddddkammdkkysigligtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd

SEQ ID NO:56

底物DNA片段的核苷酸序列。UTR序列以小写字母显示，而TrGA基因以大写字母显示。两个所选择的VT结构域TrGA_sgF1和TrGA_sgR1分别以粗体和下划线显示。

gactgtctccaccatgtaatttttccctgcgactccatataacgccggatcgtgaaattttcttctttcttttccttccttctcaacaaacaacggatctgtgctttgcggtcccctgcgttcacgcgtcagggtcgactgctctgcagctcgataactccatggagccatcaacttgctatggtgtcaatcatcctatcgacaggtccaagaacaagccggcctccggctgcctcattcgctgtcgcaagacggcttgagtgttgtggctggaggattcgggggccccatattccaacccttttttccaaggccgtcggccggtgaggttgaggaaaaccatgggttgcctacatattatcgatgctggtgtttggtagtagcaatgtttgcggtggcagtttgagccgagcctcgtcttgggcttctgacccaggcaacgccatctgactagctgcgccgaaggaaggatgattcattgtacgacgccagtcaatggaatcttcaagtaaaagcccgacgaaccgaccatgtcagatatcagaattctcctggctggtggggttggttggagactgcttacggagtcgatgcctcgtgactgtcatggccgcgtccagcctcctgggactctgtccgatattatgacacgagtaaagcctgcatgatgtcagtttgctgcgtctcatgtcgagaacaacacacctggtgctacataggcaatactacctcgtagcttcaaagttgactgttttgctttgatgtctttgatcatgcccatccatcccttgtcttgcagtgcatgtggatctctacgtccagacggggagaaagcttgtctgtgataaagtacgatgatgcattgatgcctgtggctacggcccttttatccccatcgtcatgcatctctatattaatccaggagactctcctcctggcatgggtgagtacaagtgacgaggacatgtagaagcagagccacgcaacgtcttgacatctgtacctattttgggccaaaaatcgagacccaccagctcgtcctaccttacatgtgaagatcttagcccacaatcctactgttttactagtattactgcacagctgtcatcacgagtcctcggttgcttgtgaaacccagctcagctcctgagcacatgcagtaacgccgactcggcgtcatttcgccacacccaatttggacctgagggatgctggaagctgctgagcagatcccgttaccgattcatggcactactacatccatacgcagcaaacatgggcttgggcttggcttctcaatgcaaaattgcccgcaaaagtcccggcattgtcgatgcagagatgcagatttcagcgggcgattctagggtagggcgactactactactaataccacctagtcagtatgtatctagcaccggaggctaggcggttagtggacgggaacctggtcattccatcgcaaccaggatcccgcacttcgttgcgcttctgcccccacggggcgggagttggcagaggcagaatgcggagcagccccttgtctgccctggccggggcctgttgaagcaagcagacgagagcagagcggttgagaagcggtggttgacgcttgacggtacgaagacgagcgagaatcccgttaagccgaggctgggctcccccccccgtcatcatcatgcccatcctgctcttccagcccactcgtctccctgcctcgtcgcctcccctccctcccccgattagctgcgcatgttctcctgacagcgtgactaatgacgcgttgccagcccattcgcctgacgcatcccggcatctgagtctagctcgtcacgctggcaatcttggcccaggcagagcagcaagacggcgggcatgattgggccgtgccctggcgggcatcagctggccatccgctgccacccgagaccgcatcaccgacttgtcggatctctccgagcagcaggaggctgatcctggccggcgagacgattgaaaagggctgccgggcccggagcaggacagcggcgagagcgagcgagagagaggaaaagaagaaggtcgactgtcttattttcagccagccccggctcaacagaagcagaggagaaggcgaacgacgtcaacgacgacgacgacgacgacgaagacggtgaagtccgttagttgaagatccttgccgtcacaacaccatctcgtggatattgctttcccctgccgttgcgttgccacctgttccctctttctcttccccccttcttcctcattccgagcgctactggttcctactccgcagccttcggttgtgcctttctctttgtcgaccattgcaccgcccgtcgcggcacttgggccccggagaattcggccctttcgcagcattttggccctcagttccccatggggacggtccacacttcctctcttggccctgcagaccttttgtcgtcggtccgagtcggaagaagctcagtcttgagcgcttgagtagcatctacgcgcgaatcactggacaaagtcggcaagacgaagccgtcgtcgcctgctgctgctgctgttactgcgacaggcgctccgactgggggcatcggcataataaaaagatgcccgccttcgccatggacctggccatgagccactcggcatcggctctctctctcaacgcttcctctcacacatcctccttcattccgcccatcATGCACGTCCTGTCGACTGCGGTGCTGCTCGGCTCCGTTGCCGTTCAAAAGGTCCT GACGTCACCAAGAGGTCTGTTGACGACTTCATCAGCACCGAGACGCCTATTGCACTGAACAATCTTCTTTGCAATGTTGGTCCTGATGGATGCCGTGCATTCGGCACATCAGCTGGTGCGGTGATTGCATCTCCCAGCACAATTGACCCGGACTGTAAGTTGGCCTTGATGAACCATATCATATATCGCCGAGAAGTGGACCGCGTGCTGAGACTGAGACAGACTATTACATGTGGACGCGAGATAGCGCTCTTGTCTTCAAGAACCTCATCGACCGCTTCACCGAAACGTACGATGCGGGCCTGCAGCGCCGCATCGAGCAGTACATTACTGCCCAGGTCACTCTCCAGGGCCTCTCTAACCCCTCGGGCTCCCTCGCGGACGGCTCTGGTCTCGGCGAGCCCAAGTTTGAGTTGACCCTGAAGCCTTTCACCGGCAACTGGGGTCGACCGCAGCGGGATGGCCCAGCTCTGCGAGCCATTGCCTTGATTGGATACTCAAAGTGGCTCATCAACAACAACTATCAGTCGACTGTGTCCAACGTCATCTGGCCTATTGTGCGCAACGACCTCAACTATGTTGCCCAGTACTGGTCAGTGCTTGCTTGCTCTTGAATTACGTCTTTGCTTGTGTGTCTAATGCCTCCACCACAGGAACCAAACCGGCTTTGACCTCTGGGAAGAAGTCAATGGGAGCTCATTCTTTACTGTTGCCAACCAGCACCGAGGTATGAAGCAAATCCTCGACATTCGCTGCTACTGCACATGAGCATTGTTACTGACCAGCTCTACAGCACTTGTCGAGGGCGCCACTCTTGCTGCCACTCTTGGCCAGTCGGGAAGCGCTTATTCATCTGTTGCTCCCCAGGTTTTGTGCTTTCTCCAACGATTCTGGGTGTCGTCTGGTGGATACGTCGACTCCAACAGTATGTCTTTTCACTGTTTATATGAGATTGGCCAATACTGATAGCTCGCCTCTAGTCAACACCAACGAGGGCAGGACTGGCAAGGATGTCAACTCCGTCCTGACTTCCATCCACACCTTCGATCCCAACCTTGGCTGTGACGCAGGCACCTTCCAGCCATGCAGTGACAAAGCGCTCTCCAACCTCAAGGTTGTTGTCGACTCCTTCCGCTCCATCTACGGCGTGAACAAGGGCATTCCTGCCGGTGCTGCCGTCGCCATTGGCCGGTATGCAGAGGATGTGTACTACAACGGCAACCCTTGGTATCTTGCTACATTTGCTGCTGCCGAGCAGCTGTACGATGCCATCTACGTCTGGAAGAAGACGGGCTCCATCACGGTGACCGCCACCTCCCTGGCCTTCTTCCAGGAGCTTGTTCCTGGCGTGACGGCCGGGACCTACTCCAGCAGCTCTTCGACCTTTACCAACATCATCAACGCCGTCTCGACATACGCCGATGGCTTCCTCAGCGAGGCTGCCAAGTACGTCCCCGCCGACGGTTCGCTGGCCGAGCAGTTTGACCGCAACAGCGGCACTCCGCTGTCTGCGCTTCACCTGACGTGGTCGTACGCCTCGTTCTTGACAGCCACGGCCCGTCGGGCTGGCATCGTGCCCCCCTCGTGGGCCAACAGCAGCGCTAGCACGATCCCCTCGACGTGCTCCGGCGCGTCCGTGGTCGGATCCTACTCGCGTCCCACCGCCACGTCATTCCCTCCGTCGCAGACGCCCAAGCCTGGCGTGCCTTCCGGTACTCCCTACACGCCCCTGCCCTGCGCGACCCCAACCTCCGTGGCCGTCACCTTCCACGAGCTCGTGTCGACACAGTTTGGCCAGACGGTCAAGGTGGCGGGCAACGCCGCGGCCCTGGGCAACTGGAGCACGAGCGCCGCCGTGGCTCTGGACGCCGTCAACTATGCCGATAACCACCCCCTGTGGATTGGGACGGTCAACCTCGAGGCTGGAGACGTCGTGGAGTACAAGTACATCAATGTGGGCCAAGATGGCTCCGTGACCTGGGAGAGTGATCCCAACCACACTTACACGGTTCCTGCGGTGGCTTGTGTGACGCAGGTTGTCAAGGAGGACACctggcagtcgtaatgaatcggcaaggggtagtactagtagacttgtagtctgcc

SEQ ID NO:57

SEQ ID NO:56的正向引物：

5’-gactgtctccaccatgtaatttttc-3’

SEQ ID NO:58

TrGA引物KOR2；SEQ ID NO:56的反向引物：

5’-ggcagactacaagtctactagtactac-3’

SEQ ID NO:59

用于T7启动子、CER结构域和VT结构域TrGA_sgF1的转录的寡核苷酸序列。VT结构域以大写字母显示，而T7启动子和CER结构域分别以粗体和小写字母显示。

SEQ ID NO:60

用于T7启动子、CER结构域和VT结构域TrGA_sgR1的转录的寡核苷酸序列。VT结构域以大写字母显示，而T7启动子和CER结构域分别以粗体和小写字母显示。

SEQ ID NO:61

TrGA敲除盒的核苷酸序列：

ccctgcctcgtcgcctcccctccctcccccgattagctgcgcatgttctcctgacagcgtgactaatgacgcgttgccagcccattcgcctgacgcatcccggcatctgagtctagctcgtcacgctggcaatcttggcccaggcagagcagcaagacggcgggcatgattgggccgtgccctggcgggcatcagctggccatccgctgccacccgagaccgcatcaccgacttgtcggatctctccgagcagcaggaggctgatcctggccggcgagacgattgaaaagggctgccgggcccggagcaggacagcggcgagagcgagcgagagagaggaaaagaagaaggtcgactgtcttattttcagccagccccggctcaacagaagcagaggagaaggcgaacgacgtcaacgacgacgacgacgacgacgaagacggtgaagtccgttagttgaagatccttgccgtcacaacaccatctcgtggatattgctttcccctgccgttgcgttgccacctgttccctctttctcttccccccttcttcctcattccgagcgctactggttcctactccgcagccttcggttgtgcctttctctttgtcgaccattgcaccgcccgtcgcggcacttgggccccggagaattcggccctttcgcagcattttggccctcagttccccatggggacggtccacacttcctctcttggccctgcagaccttttgtcgtcggtccgagtcggaagaagctcagtcttgagcgcttgagtagcatctacgcgcgaatcactggacaaagtcggcaagacgaagccgtcgtcgcctgctgctgctgctgttactgcgacaggcgctccgactgggggcatcggcataataaaaagatgcccgccttcgccatggacctggccatgagccactcggcatcggctctctctctcaacgcttcctctcacacatcctccttcattccgcccatcatggtttaaacctcgagtttataagtgacaacatgctctcaaagcgctcatggctggcacaagcctggaaagaaccaacacaaagcatactgcagcaaatcagctgaattcgtcaccaattaagtgaacatcaacctgaaggcagagtatgaggccagaagcacatctggatcgcagatcatggattgcccctcttgttgaagatgagaatctagaaagatggcggggtatgagataagagcgatgggggggcacatcatcttccaagacaaacaacctttgcagagtcaggcaatttttcgtataagagcaggaggagggagtccagtcatttcatcagcggtaaaatcactctagacaatcttcaagatgagttctgccttgggtgacttatagccatcatcatacctagacagaagcttgtgggatactaagaccaacgtacaagctcgcactgtacgctttgacttccatgtgaaaactcgatacggcgcgcctctaaattttatagctcaaccactccaatccaacctctgcatccctctcactcgtcctgatctactgttcaaatcagagaataaggacactatccaaatccaacagaatggctaccacctcccagctgcctgcctacaagcaggacttcctcaaatccgccatcgacggcggcgtcctcaagtttggcagcttcgagctcaagtccaagcggatatccccctacttcttcaacgcgggcgaattccacacggcgcgcctcgccggcgccatcgcctccgcctttgcaaagaccatcatcgaggcccaggagaaggccggcctagagttcgacatcgtcttcggcccggcctacaagggcatcccgctgtgctccgccatcaccatcaagctcggcgagctggcgccccagaacctggaccgcgtctcctactcgtttgaccgcaaggaggccaaggaccacggcgagggcggcaacatcgtcggcgcttcgctcaagggcaagagggtcctgattgtcgacgacgtcatcaccgccggcaccgccaagagggacgccattgagaagatcaccaaggagggcggcatcgtcgccggcatcgtcgtggccctggaccgcatggagaagctccccgctgcggatggcgacgactccaagcctggaccgagtgccattggcgagctgaggaaggagtacggcatccccatctttgccatcctcactctggatgacattatcgatggcatgaagggctttgctacccctgaggatatcaagaacacggaggattaccgtgccaagtacaaggcgactgactgattgaggcgttcaatgtcagaagggagagaaagactgaaaaggtggaaagaagaggcaaattgttgttattattattattctatctcgaatcttctagatcttgtcgtaaataaacaagcgtaactagctagcctccgtacaactgcttgaatttgatacccgtatggagggcagttattttattttgtttttcaagattttccattcgccgttgaactcgtctcacatcgcgtgtattgcccggttgcccatgtgttctcctactaccccaagtccctcacgggttgtctcactttctttctcctttatcctccctattttttttcaagtcagcgacagagcagtcatatggggatacgtgcaactgggactcacaacaggccatcttatggcctaatagccggcgttggatccactagtcaattggtttaaacagcacatgcagtaacgccgactcggcgtcatttcgccacacccaatttggacctgagggatgctggaagctgctgagcagatcccgttaccgattcatggcactactacatccatacgcagcaaacatgggcttgggcttggcttctcaatgcaaaattgcccgcaaaagtcccggcattgtcgatgcagagatgcagatttcagcgggcgattctagggtagggcgactactactactaataccacctagtcagtatgtatctagcaccggaggctaggcggttagtggacgggaacctggtcattccatcgcaaccaggatcccgcacttcgttgcgcttctgcccccacggggcgggagttggcagaggcagaatgcggagcagccccttgtctgccctggccggggcctgttgaagcaagcagacgagagcagagcggttgagaagcggtggttgacgcttgacggtacgaagacgagcgagaatcccgttaagccgaggctgggctaattaattaatgaatcggcaaggggtagtactagtagacttgtagtctgccggattattgattggagttggtcagtagaatgaaccacgggaatattcggtcaccgggacatttgggatatagcgtttcgagaagctgctggttgcagcacattggagaaggatgcccttttacgacttataccgctatgccgggtatattaatttagccgttatgaaactcaaagagacgatgataatgatgacgagtaattgttcgtttcaatttcgaaagctgactcccacgaagaatatgccaatgacccacggcatgaagcctgaactgggcgtgtgtaacactttaatttgcctgacggcggacaaaacaaaggcggcagcaatgttgagaccgtgtgataaaccaaggttcccgagggagagagagagagagagagagagagagctaggtgaaagaatgagtccgcctttgagtcatcctgcgtctctctctccccctctctcactctctgtatcccatcaacctcttccctgttccttctcctatcgcatccatgcgtttgcatcttccatttcattctttccccttgagccccatctatgcaaactcatcatccggcgcctcgatggaatccttgaccttgatgagaatcgccgtcatccaaggctccagcctgctcgtgcggtcgaactggaacagcagctcgctaaactcatcctggctgtggttgtcgacggcgttgcacaggtcctcgagcagcttgtacttgtattgagaggagaactcggggtccttttggcggtaggactcgacggcgcggcgggtgccgaccatgtcgcccgtggcgaggtggcagatgccggccttgaagcagtaggtcgagaggctccacttcatggtgccgttgccgatcatggtgttgatgatgcggtcgtacgtctcgatggcgccgtagtagtcgccgtcgagggcggcgaggtcggcgtactgcgtccagagcttSEQ ID NO:62

Fw1(5’-cactactacatccatacgcagcaaacatgg-3’)以及

SEQ ID NO:63

R3(5’-ggtcaagaagcacatgccagagttcg-3’)

SEQ ID NO:64

TrGAF2(5’gactgtctccaccatgtaatttttc 3’)

SEQ ID NO:65

大肠杆菌密码子优化的Cas9-D10A切口酶基因(无终止密码子)atggataaaaaatacagcattggtctggccatcggaaccaacagcgttgggtgggcagtaataacagatgaatacaaagtgccgtcaaaaaaatttaaggttctggggaatacagatcgccacagcataaaaaagaatctgattggggcattgctgtttgattcgggtgagacagctgaggccacgcgtctgaaacgtacagcaagaagacgttacacacgtcgtaaaaatcgtatttgctacttacaggaaattttttctaacgaaatggccaaggtagatgatagtttcttccatcgtctcgaagaatcttttctggttgaggaagataaaaaacacgaacgtcaccctatctttggcaatatcgtggatgaagtggcctatcatgaaaaataccctacgatttatcatcttcgcaagaagttggttgatagtacggacaaagcggatctgcgtttaatctatcttgcgttagcgcacatgatcaaatttcgtggtcatttcttaattgaaggtgatctgaatcctgataactctgatgtggacaaattgtttatacaattagtgcaaacctataatcagctgttcgaggaaaaccccattaatgcctctggagttgatgccaaagcgattttaagcgcgagactttctaagtcccggcgtctggagaatctgatcgcccagttaccaggggaaaagaaaaatggtctgtttggtaatctgattgccctcagtctggggcttaccccgaacttcaaatccaattttgacctggctgaggacgcaaagctgcagctgagcaaagatacttatgatgatgacctcgacaatctgctcgcccagattggtgaccaatatgcggatctgtttctggcagcgaagaatctttcggatgctatcttgctgtcggatattctgcgtgttaataccgaaatcaccaaagcgcctctgtctgcaagtatgatcaagagatacgacgagcaccaccaggacctgactcttcttaaggcactggtacgccaacagcttccggagaaatacaaagaaatattcttcgaccagtccaagaatggttacgcgggctacatcgatggtggtgcatcacaggaagagttctataaatttattaaaccaatccttgagaaaatggatggcacggaagagttacttgttaaacttaaccgcgaagacttgcttagaaagcaacgtacattcgacaacggctccatcccacaccagattcatttaggtgaacttcacgccatcttgcgcagacaagaagatttctatcccttcttaaaagacaatcgggagaaaatcgagaagatcctgacgttccgcattccctattatgtcggtcccctggcacgtggtaattctcggtttgcctggatgacgcgcaaaagtgaggaaaccatcaccccttggaactttgaagaagtcgtggataaaggtgctagcgcgcagtcttttatagaaagaatgacgaacttcgataaaaacttgcccaacgaaaaagtcctgcccaagcactctcttttatatgagtactttactgtgtacaacgaactgactaaagtgaaatacgttacggaaggtatgcgcaaacctgcctttcttagtggcgagcagaaaaaagcaattgtcgatcttctctttaaaacgaatcgcaaggtaactgtaaaacagctgaaggaagattatttcaaaaagatcgaatgctttgattctgtcgagatctcgggtgtcgaagatcgtttcaacgcttccttagggacctatcatgatttgctgaagataataaaagacaaagactttctcgacaatgaagaaaatgaagatattctggaggatattgttttgaccttgaccttattcgaagatagagagatgatcgaggagcgcttaaaaacctatgcccacctgtttgatgacaaagtcatgaagcaattaaagcgccgcagatatacggggtggggccgcttgagccgcaagttgattaacggtattagagacaagcagagcggaaaaactatcctggatttcctcaaatctgacggatttgcgaaccgcaattttatgcagcttatacatgatgattcgcttacattcaaagaggatattcagaaggctcaggtgtctgggcaaggtgattcactccacgaacatatagcaaatttggccggctctcctgcgattaagaaggggatcctgcaaacagttaaagttgtggatgaacttgtaaaagtaatgggccgccacaagccggagaatatcgtgatagaaatggcgcgcgagaatcaaacgacacaaaaaggtcaaaagaactcaagagagagaatgaagcgcattgaggaggggataaaggaacttggatctcaaattctgaaagaacatccagttgaaaacactcagctgcaaaatgaaaaattgtacctgtactacctgcagaatggaagagacatgtacgtggatcaggaattggatatcaatagactctcggactatgacgtagatcacattgtccctcagagcttcctcaaggatgattctatagataataaagtacttacgagatcggacaaaaatcgcggtaaatcggataacgtcccatcggaggaagtcgttaaaaagatgaaaaactattggcgtcaactgctgaacgccaagctgatcacacagcgtaagtttgataatctgactaaagccgaacgcggtggtcttagtgaactcgataaagcaggatttataaaacggcagttagtagaaacgcgccaaattacgaaacacgtggctcagatcctcgattctagaatgaatacaaagtacgatgaaaacgataaactgatccgtgaagtaaaagtcattaccttaaaatctaaacttgtgtccgatttccgcaaagattttcagttttacaaggtccgggaaatcaataactatcaccatgcacatgatgcatatttaaatgcggttgtaggcacggcccttattaagaaataccctaaactcgaaagtgagtttgtttatggggattataaagtgtatgacgttcgcaaaatgatcgcgaaatcagaacaggaaatcggtaaggctaccgctaaatactttttttattccaacattatgaatttttttaagaccgaaataactctcgcgaatggtgaaatccgtaaacggcctcttatagaaaccaatggtgaaacgggagaaatcgtttgggataaaggtcgtgactttgccaccgttcgtaaagtcctctcaatgccgcaagttaacattgtcaagaagacggaagttcaaacagggggattctccaaagaatctatcctgccgaagcgtaacagtgataaacttattgccagaaaaaaagattgggatccaaaaaaatacggaggctttgattcccctaccgtcgcgtatagtgtgctggtggttgctaaagtcgagaaagggaaaagcaagaaattgaaatcagttaaagaactgctgggtattacaattatggaaagatcgtcctttgagaaaaatccgatcgactttttagaggccaaggggtataaggaagtgaaaaaagatctcatcatcaaattaccgaagtatagtctttttgagctggaaaacggcagaaaaagaatgctggcctccgcgggcgagttacagaagggaaatgagctggcgctgccttccaaatatgttaattttctgtaccttgccagtcattatgagaaactgaagggcagccccgaagataacgaacagaaacaattattcgtggaacagcataagcactatttagatgaaattatagagcaaattagtgaattttctaagcgcgttatcctcgcggatgctaatttagacaaagtactgtcagcttataataaacatcgggataagccgattagagaacaggccgaaaatatcattcatttgtttaccttaaccaaccttggagcaccagctgccttcaaatatttcgataccacaattgatcgtaaacggtatacaagtacaaaagaagtcttggacgcaaccctcattcatcaatctattactggattatatgagacacgcattgatctttcacagctgggcggagac

SEQ ID NO:66

来自化脓性链球菌的Cas9-D10A切口酶的氨基酸序列；由SEQ ID NO:65编码

mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd

SEQ ID NO:67

N-末端His6标签/凝血酶/S·Tag^TM/肠激酶区域氨基酸序列(具有起始甲硫氨酸)

mhhhhhhssglvprgsgmketaaakferqhmdspdlgtddddkama

SEQ ID NO:68

N-末端His6标签/凝血酶/S·Tag^TM/肠激酶区域多核苷酸序列(具有起始密码子)；编码SEQ ID NO:67

atgcaccatcatcatcatcattcttctggtctggtgccacgcggttctggtatgaaagaaaccgctgctgctaaattcgaacgccagcacatggacagcccagatctgggtaccgacgacgacgacaaggccatggcc

SEQ ID NO:69

SV40NLS编码序列(编码SEQ ID NO:46)

ccaaaaaagaaacgcaaggtt

SEQ ID NO:70

BLR核定位信号编码序列(编码SEQ ID NO:47)

Aagaagaaaaaactgaaactg

SEQ ID NO:71

tgatgacggtgaaaacctc

SEQ ID NO:72

aaaagcaccgactcgg

SEQ ID NO:73

Gla1rep引物1556F

ATGCGCAAATTTAAAGCGCTGATgtgtgtctaatgcctccaccac

SEQ ID NO:74

Gla1rep引物1557R

ATATGGATCTGCGCGCGATCGATgatcgtgctagcgctgctgttg

SEQ ID NO:75

测序引物1538F

CCACCACAGGAACCAAACC

SEQ ID NO:76

测序引物1539R

CTGCGACGGAGGGAATGACG

SEQ ID NO:77

测序引物1540F

GGGCAGGACTGGCAAGGATGT

SEQ ID NO:78

测序引物1541R

GCCGTCACGCCAGGAACAAG

SEQ ID NO:79

TrGA引物KOF1

gaacaatcttctttgcaatgttggtc

SEQ ID NO:80

Pyr2引物R1

gaggaagtcctgcttgtaggcaggc

SEQ ID NO:81

Pyr2引物F4

cgacagagcagtcatatggggatacg

Claims

a)向丝状真菌细胞的群体中引入Cas内切核酸酶、指导RNA以及包含与该真菌细胞的基因组座位具有同源性的区域的供体DNA，其中该Cas内切核酸酶和指导RNA能够形成使得该Cas内切核酸酶能够在这些真菌细胞的基因组座位中或附近的靶位点处起作用的复合物；并且

2.如权利要求1所述的方法，其中在这些真菌细胞中的靶位点处的非同源末端连接(NHEJ)机制是未激活的、无功能的或减弱的。

3.如权利要求2所述的方法，其中在这些真菌细胞中的非同源末端连接(NHEJ)途径包含一种或多种无功能的或活性降低的组分。

4.如权利要求3所述的方法，其中该一种或多种无功能的或活性降低的组分选自下组，该组由以下各项组成：ku80、ku70、rad50、mre11、xrs2、lig4、xrs及其组合。

5.如权利要求4所述的方法，其中该一种或多种无功能的或活性降低的组分是ku80。

6.如前述权利要求中任一项所述的方法，其中该Cas内切核酸酶是Cas切口酶。

7.如权利要求1-5中任一项所述的方法，其中该Cas内切核酸酶是Cas9内切核酸酶或其变体。

8.如权利要求7所述的方法，其中该Cas9内切核酸酶或其变体包含来自选自下组的物种的全长Cas9或其功能片段，该组由以下各项组成：链球菌属物种(Streptococcus sp.)，化脓性链球菌(S.pyogenes)、变异链球菌(S.mutans)、嗜热链球菌(S.thermophilus)；弯曲杆菌属物种(Campylobacter sp.)，空肠弯曲杆菌(C.jejuni)；奈瑟氏菌属物种(Neisseriasp.)，脑膜炎奈瑟球菌(N.meningitides)；弗朗西斯氏菌属物种(Francisella sp.)，新凶手弗朗西斯菌(F.novicida)；巴斯德氏菌属物种(Pasteurella sp)；以及巴斯德氏菌属(Pasteurella sp)物种，多杀巴斯德菌(P.multocida)。

9.如权利要求8所述的方法，其中该Cas9内切核酸酶或其变体包含与SEQ ID NO:45和48至53中任一项具有至少70％同一性的氨基酸序列。

10.如前述权利要求中任一项所述的方法，其中该供体DNA包含目的多核苷酸序列，并且其中在该基因组座位处的同源重组导致将该目的多核苷酸序列插入该基因组座位中。

11.如前述权利要求中任一项所述的方法，其中该引入步骤包括将包含该Cas内切核酸酶的表达盒的DNA构建体引入这些真菌细胞中。

12.如前述权利要求中任一项所述的方法，其中该引入步骤包括将包含该指导RNA的表达盒的DNA构建体引入这些真菌细胞中。

13.如前述权利要求中任一项或权利要求48-54中任一项所述的方法，其中该引入步骤包括向这些真菌细胞中引入包含编码可选择标记的序列的DNA构建体。

14.如权利要求13所述的方法，其中该DNA构建体包含编码该可选择标记的序列和该供体DNA两者。

15.如前述权利要求中任一项所述的方法，其中该引入步骤包括向这些真菌细胞中引入DNA构建体，该DNA构建体包含：编码该Cas内切核酸酶的序列、编码该指导RNA的序列、编码可选择标记的序列和该供体DNA。

16.如权利要求11至15中任一项所述的方法，其中该DNA构建体是线性DNA构建体。

17.如权利要求11至15中任一项所述的方法，其中该DNA构建体是环状DNA构建体。

18.如权利要求11和15-17中任一项所述的方法，其中该Cas内切核酸酶的表达盒或编码该Cas内切核酸酶的序列包含为了在该丝状真菌细胞中表达而优化的Cas编码序列。

19.如权利要求18所述的方法，其中该Cas编码序列是包含与SEQ ID NO:44具有至少70％同一性的多核苷酸序列的Cas9编码序列。

20.如权利要求1至10、12至14、和16-17中任一项所述的方法，其中该引入步骤包括将该Cas内切核酸酶直接引入这些真菌细胞中。

21.如权利要求1至11、13至14、和16至20中任一项所述的方法，其中该引入步骤包括将该指导RNA直接引入这些真菌细胞中。

22.如前述权利要求中任一项所述的方法，其中该Cas内切核酸酶被可操作地连接至核定位信号。

23.如前述权利要求中任一项所述的方法，其中该丝状真菌细胞是真菌亚门(Eumycotina)或盘菌亚门(Pezizomycotina)真菌细胞。

24.如前述权利要求中任一项所述的方法，其中该真菌细胞选自下组，该组由以下各项组成：木霉属(Trichoderma)、青霉属(Penicillium)、曲霉属(Aspergillus)、腐质霉属(Humicola)、金孢子菌属(Chrysosporium)、镰孢属(Fusarium)、毁丝霉属(Myceliophthora)、脉孢菌属(Neurospora)、肉座菌属(Hypocrea)和裸胞壳属(Emericella)。

25.如前述权利要求中任一项所述的方法，其中该靶位点位于选自下组的目的基因的区域内，该组由以下各项组成：可读框、启动子、调节序列、终止序列、调节元件序列、剪接位点、编码序列、聚泛素化位点、内含子位点和内含子增强基序。

26.如前述权利要求中任一项所述的方法，其中该同源重组导致在靶位点处或附近的DNA序列的修饰，其中该修饰选自下组，该组由以下各项组成：一个或多个核苷酸的缺失、一个或多个核苷酸的插入、编码目的蛋白质的表达盒的插入、一个或多个核苷酸的取代、及其任何组合。

27.如前述权利要求中任一项所述的方法，其中该鉴定步骤包括在对该同源重组或该修饰进行选择或筛选的条件下培养来自步骤(a)的细胞的群体。

28.如前述权利要求中任一项所述的方法，其中该鉴定步骤包括在用于筛选不稳定的转化体的条件下培养来自步骤(a)的细胞的群体。

29.如前述权利要求中任一项所述的方法，其中该引入步骤包括向这些真菌细胞中引入包含编码可选择标记的序列和该供体DNA的DNA构建体，并且其中该鉴定步骤包括在对已经丢失可选择标记但仍保留该供体DNA的不稳定的转化体进行筛选的条件下培养来自步骤(a)的细胞的群体。

30.一种重组丝状真菌细胞，其通过如前述权利要求中任一项所述的方法产生。

32.如权利要求30或31所述的重组真菌细胞，其中该重组丝状真菌细胞包含在NHEJ途径中的一种或多种无功能的或活性降低的组分。

33.如权利要求32所述的重组真菌细胞，其中该NHEJ途径的一种或多种组分选自下组，该组由以下各项组成：ku80、ku70、rad50、mre11、xrs2、lig4和xrs。

34.如权利要求30至33中任一项所述的重组真菌细胞，该重组真菌细胞进一步包含含有目的多核苷酸的供体DNA。