CN107257859A

CN107257859A - 真菌基因组修饰系统及使用方法

Info

Publication number: CN107257859A
Application number: CN201580076199.9A
Authority: CN
Inventors: B·S·鲍尔; J·陈; 葛晶; X·顾; S·S·金; S·M·马德里; D·宋; M·宋; M·沃德
Original assignee: Danisco USA Inc
Current assignee: Danisco USA Inc; Danisco US Inc
Priority date: 2014-12-16
Filing date: 2015-12-16
Publication date: 2017-10-17
Also published as: MX2017007930A; JP2017537647A; JP6814141B2; US11427829B2; CA2971248A1; US20180002710A1; KR102350402B1; CN107667171A; MX2017007928A; US20170369891A1; BR112017012837A2; CA2971187A1; US11098314B2; BR112017012850A2; US20190093114A1; CA2971248C; AU2015364629B2; KR20170087521A; JP6814142B2; AU2015362784B2

Abstract

提供了用于在丝状真菌细胞基因组中的靶位点处进行基因组修饰的组合物和方法。这些方法和组合物涉及用于在丝状真菌宿主细胞基因组中的靶位点处促进DNA序列的修饰的指导多核苷酸/Cas内切核酸酶系统。

Description

真菌基因组修饰系统及使用方法

相关申请的交叉引用

本申请要求全部在2014年12月16日提交的PCT专利申请系列号PCT/CN 2014/093918、PCT/CN 2014/093916、和PCT/CN 2014/093914的优先权，这些专利以其全文通过引用并入本文。

序列表

将按照37C.F.R.§1.52(e)、经由EFS提交的序列表通过引用结合在此。经由EFS提交的序列表文本文件包含于2015年12月13日创建的文件“40532-WO-PCT-6_2015-868_Final_ST25.txt”，其大小为151千字节。

发明背景

细菌和古生菌已经演变出称为成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)系统的适应性免疫防御，这些系统能以序列特异性方式在DNA中引入双链断裂。Cas系统通过核糖核蛋白复合物的活性来发挥其功能，该核糖核蛋白复合物包含靶向特异性DNA序列(通过与称为可变靶向结构域的crRNA的一部分的同源性)并在靶标中产生双链断裂的短RNA序列(tracrRNA和crRNA)和RNA依赖型内切核酸酶(Cas内切核酸酶)。CRISPR基因座首先在大肠杆菌中被识别(Ishino et al.(1987)J.Bacterial.169:5429-5433；Nakata et al.(1989)J.Bacterial.171:3553-3556[Ishino等人，(1987)细菌学杂志，169:5429-5433；Nakata等人，(1989)细菌学杂志，171:3553-3556])，随后在许多细菌物种中鉴定了相似的间隔短序列重复序列，这些细菌物种包括但不限于：地中海富盐菌、化脓性链球菌、鱼腥藻属、和结核分枝杆菌(Groenen et al.(1993)Mol.Microbiol.10:1057-1065；Hoe et al.(1999)Emerg.Infect.Dis.5:254-263；Masepohl et al.(1996)Biochim.Biophys.Acta 1307:26-30；Mojica et al.(1995)Mol.Microbiol.17:85-93[Groenen等人，(1993)分子微生物学，10:1057-1065；Hoe等人，(1999)新发传染病，5:254-263；Masepohl等人，(1996)生物物理学报1307:26-30；Mojica等人，(1995)分子微生物学，17:85-93])。

众所周知，在基因组DNA中的特定靶位点处诱导切割可用于在该位点处或其附近引入修饰。例如，当靶向的DNA位点包含双链断裂时，已显示用于基因靶向的同源重组被增强(参见，例如，Rudin et al.,Genetics 122:519-534；Smih et al.,Nucl.Acids Res.23:5012-5019[Rudin等人，遗传学，122:519-534；Smih等人，核酸研究，23:5012-5019])。鉴于Cas系统的位点特异性，已经描述了基于这些系统的基因组修饰/工程技术，包括在哺乳动物细胞中(参见，例如，Hsu et al.；Cell vol.157,p1262-1278,5June 2014entitled“Development and Applications of CRISPR-Cas9for Genome Engineering”[Hsu等人；细胞，第157卷，第1262-1278页，2014年6月5日，题为“用于基因组工程化的CRISPR-Cas9的开发与应用”])。基于Cas的基因组工程的力量来自于通过设计重组crRNA(或等效功能多核苷酸)并将其与Cas内切核酸酶(通过任何适合的方法)组合成宿主细胞中的功能复合物来靶向复合物基因组内几乎任何特定位置的能力，其中crRNA的DNA靶向区域(可变靶向结构域)与基因组中所需的靶位点同源。

虽然基于Cas的基因组工程技术已经应用于许多不同的宿主细胞类型，但是已证明在真菌细胞中有效使用这种系统是困难的。因此，仍然需要开发用于修饰/改变真菌细胞中的基因组靶位点的高效和有效的基于Cas的基因组工程方法和组合物。

简要概述

提供了涉及采用指导RNA/Cas内切核酸酶系统用于在真菌细胞例如丝状真菌细胞的基因组中的靶位点处修饰DNA序列的组合物和方法。

本披露的方面涉及用于在真菌细胞基因组中的靶位点处修饰DNA序列的方法。在一些实施例中，该方法包括：a)向真菌细胞群体中引入Cas内切核酸酶和指导RNA，其中该Cas内切核酸酶和指导RNA能够形成复合物，该复合物使得该Cas内切核酸酶能够在该真菌细胞基因组中的靶位点处引入双链断裂；并且b)从该群体鉴定在该靶位点处具有DNA序列的修饰的至少一个真菌细胞，其中将该Cas内切核酸酶、该指导RNA、或二者瞬时引入该真菌细胞群体中。

在一方面，本披露涉及一种用于修饰真菌细胞基因组中的靶位点处的DNA序列的方法，该方法包括：a)向真菌细胞中引入Cas内切核酸酶和指导RNA，其中该Cas内切核酸酶和指导RNA能够形成复合物，该复合物使得该Cas内切核酸酶能够在该真菌细胞基因组中的靶位点处引入双链断裂；并且b)鉴定在该真菌细胞中是否发生了靶位点DNA序列的修饰，其中将该Cas内切核酸酶、该指导RNA、或二者瞬时引入该真菌细胞中。

在另一方面，本披露涉及用于在真菌细胞基因组中的靶位点处修饰DNA序列的方法。在一些实施例中，该方法包括：a)向真菌细胞群体中引入Cas内切核酸酶和指导RNA，其中该Cas内切核酸酶和指导RNA能够形成复合物，该复合物使得该Cas内切核酸酶能够在该真菌细胞基因组中的靶位点处引入双链断裂；并且b)从该群体鉴定在该靶位点处具有DNA序列的修饰的至少一个真菌细胞，其中将该Cas内切核酸酶和该指导RNA均非瞬时引入该真菌细胞群体中。

在又另一方面，本披露涉及一种用于修饰真菌细胞基因组中的靶位点处的DNA序列的方法，该方法包括：a)向真菌细胞中引入Cas内切核酸酶和指导RNA，其中该Cas内切核酸酶和指导RNA能够形成复合物，该复合物使得该Cas内切核酸酶能够在该真菌细胞基因组中的靶位点处引入双链断裂；并且b)鉴定在该真菌细胞中是否发生了靶位点DNA序列的修饰，其中将该Cas内切核酸酶和该指导RNA均非瞬时引入该真菌细胞中。

在本文所述的方法的某些实施例中，在所述靶位点处的DNA序列的修饰选自下组，该组由以下各项组成：一个或多个核苷酸的缺失、一个或多个核苷酸的插入、一个或多个核苷酸的取代、及其任何组合。

在某些实施例中，鉴定步骤包括在用于对该靶位点处的DNA序列的修饰进行选择或筛选的条件下培养来自步骤(a)的真菌细胞群体或真菌细胞。在某些实施例中，鉴定步骤包括在用于筛选不稳定转化体的条件下培养来自步骤(a)的真菌细胞群体或真菌细胞。

已经描述了若干种不同类型的CRISPR-Cas系统，并且这些系统可被分类为I型、II型、和III型CRISPR-Cas系统(参见，例如，Liu和Fan的如下描述：CRISPR-Cas system:apowerful tool for genome editing.Plant Mol Biol(2014)85:209-218[CRISPR-Cas系统：一个强大的基因组编辑工具，植物分子生物学(2014)85:209-218])。在某些实施例中，Cas内切核酸酶或其变体是II型CRISPR-Cas系统的Cas9内切核酸酶。Cas9内切核酸酶可以是任何适合的Cas9内切核酸酶，包括但不限于来自以下细菌物种的Cas9内切核酸酶及其功能片段：链球菌属物种(例如，化脓性链球菌、变异链球菌、和嗜热链球菌)，弯曲杆菌属物种(例如，空肠弯曲杆菌)、奈瑟氏菌属物种(例如，脑膜炎奈瑟球菌)、弗朗西斯氏菌属物种(例如，新凶手弗朗西斯氏菌)、和巴斯德菌属物种(例如，多杀巴斯德菌)。可以使用许多其他物种的Cas9。例如，可以采用包含与SEQ ID NO:1至7中任一项具有至少70％同一性(例如，与SEQ ID NO:1至7中任一项具有至少80％同一性、至少90％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性，并且包括高达100％同一性)的氨基酸序列的功能性Cas9内切核酸酶或其变体。在其他实施例中，Cas内切核酸酶或其变体是II型CRISPR-Cas系统的Cpf1内切核酸酶。Cpf1介导具有与Cas9不同的特征的强大的DNA干扰。Cpf1缺乏tracrRNA并且利用富含T的前间区序列邻近基序。它通过交错的DNA双链断裂切割DNA。参见，例如，Zetsche etal.,Cell(2015)163:759-771[Zetsche等人，(2015)163:759-771]。

将Cas内切核酸酶或指导RNA引入真菌细胞群体可以使用任何适合的方法实现，该任何适合的方法包括：转染、转导、转化、电穿孔、粒子轰击(生物射弹粒子递送)、和细胞融合技术。

在某些实施例中，将该Cas内切核酸酶和/或该指导RNA引入真菌细胞包括将包含Cas内切核酸酶、指导RNA、或两者的表达盒的一种或多种DNA构建体引入该真菌细胞中。一旦在进入真菌细胞中，一个或多个DNA构建体表达Cas内切核酸酶和/或指导RNA。在某些实施例中，该DNA构建体是线性DNA构建体。在某些实施例中，该DNA构建体是环状DNA构建体。在某些实施例中，该DNA构建体是重组DNA构建体。

在某些实施例中，引入步骤包括将Cas内切核酸酶多肽、指导RNA、或两者直接引入该真菌细胞中。可以采用直接引入和使用DNA构建体的任何组合(例如，将具有Cas内切核酸酶的表达盒的DNA构建体引入真菌细胞并直接将指导RNA引入细胞中，根据需要同时或依次进行)。

在本文所述方法的某些实施例中，DNA构建体中的Cas表达盒包含针对在真菌细胞中表达而优化的Cas内切核酸酶编码基因。例如，针对在丝状真菌细胞中表达而优化的Cas内切核酸酶编码基因包含与SEQ ID NO:8(编码来自化脓性链球菌的Cas9；SEQ ID NO:1)具有至少70％序列同一性(例如，与SEQ ID NO:8具有至少80％同一性、至少90％同一性、至少95％同一性、至少96％同一性、至少97％同一性、至少98％同一性、至少99％同一性，并且包括高达100％同一性)的序列。

在一些情况下，Cas内切核酸酶有效地连接到一个或多个核靶向信号(也称为核定位信号/序列；NLS)。SEQ ID NO:9和SEQ ID NO:10分别提供了在N-和C-末端具有NLS序列的丝状真菌细胞优化的Cas9基因和所编码的氨基酸序列的实例。许多不同的NLS在真核生物中是已知的。它们包括单分型、双分型和三分型。可以使用任何适合的NLS，单分型略微更适合，其中实例包括SV40NLS、来自里氏木霉blr2(蓝光调节剂2)基因的NLS、或两者的组合。在一些实施例中，DNA构建体是重组DNA构建体，并且包含有效地连接到编码Cas9内切核酸酶或其变体的丝状真菌细胞优化的多核苷酸序列上的启动子。

在本文所述的方法的某些实施例中，将包含编码指导RNA的序列并能够表达该指导RNA的DNA构建体或表达盒引入真菌细胞群体或真菌细胞中。在一些实施例中，DNA构建体或表达盒包含在真子囊菌纲或盘菌纲中具有功能的RNA聚合酶III依赖型启动子，其中该启动子有效地连接到编码指导RNA的序列。在一些实施例中，该启动子源自木霉属U6snRNA基因。在某些实施例中，该启动子包含与SEQ ID NO:11或12具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、或99％同一性的核苷酸序列。在具体实施例中，该启动子包含SEQ ID NO:11或12的序列。在一些实施例中，指导RNA的DNA构建体或表达盒包含具有来自木霉属U6snRNA基因的内含子序列的、编码指导RNA的DNA。在一些实施例中，源自木霉属U6snRNA基因的内含子序列包含与SEQ ID NO:90具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、或99％的同一性的核苷酸序列。在具体实施例中，源自木霉属U6snRNA基因的内含子序列包含SEQ ID NO:90的序列。

在某些实施例中，在真菌细胞基因组或真菌细胞中靶位点处的DNA序列的修饰由非同源末端连接(NHEJ)引起，不存在供体DNA或存在也被引入这些真菌细胞或该真菌细胞中的供体DNA。在某些其他实施例中，靶位点处DNA序列的修饰是由同源重组引起的，任选地通过也被引入这个或这些真菌细胞中的供体DNA的存在引起。在一些实施例中，修饰(例如，一个或多个核苷酸的缺失、一个或多个核苷酸的插入、编码目的蛋白质的表达盒的插入、或一个或多个核苷酸的取代)最初存在于供体DNA中。在一些实施例中，该供体DNA与Cas/指导RNA复合物的靶位点的每侧、每侧处或其附近的染色体DNA的区域的序列同源性超过至少。在一些其他实施例中，该供体DNA与Cas/指导RNA复合物的靶位点的每侧、每侧处或其附近的染色体DNA的区域不具有序列同源性。在某些实施例中，供体DNA包含编码目的蛋白质的表达盒。在某些实施例中，由表达盒编码的目的蛋白质是酶。在具体实施例中，目的蛋白质是半纤维素酶、过氧化物酶、蛋白酶、纤维素酶、木聚糖酶、脂肪酶、磷脂肪酶、酯酶、角质酶、果胶酶、角蛋白酶、还原酶、氧化酶、酚氧化酶、脂氧合酶、木质素酶、支链淀粉酶、鞣酸酶、戊聚糖酶、甘露聚糖酶、β-葡聚糖酶、阿拉伯糖苷酶、透明质酸酶、软骨素酶、漆酶、淀粉酶、葡糖淀粉酶、其变体、其功能片段、或其两种或更多种的混杂物或混合物。在又其他具体实施例中，目的蛋白质是肽激素、生长因子、凝血因子、趋化因子、细胞因子、淋巴因子、抗体、受体、粘附分子、微生物抗原、其变体、其功能片段、或其两种或更多种的混杂物或混合物。

在其中需要供体DNA和真菌细胞基因组之间的同源重组的某些实施例中，真菌细胞中的NHEJ途径是无功能的(失活的)或退化的，例如，其中NHEJ途径的一种或多种组分是失活的、无功能的、或具有降低的活性(例如，ku80、ku70、rad50、mre11、xrs2、lig4、xrs、或其组合)。例如，真菌细胞可以具有失活/活性降低形式的ku80。在某些其他实施例中，真菌细胞中的NHEJ途径是有功能的。

可用于主题方法中的真菌细胞可以是丝状真菌细胞物种。在某些实施例中，该真菌细胞是真菌亚门或盘菌亚门真菌细胞。在一些实施例中，该真菌细胞选自木霉属、青霉属、曲霉属、腐质霉属、金孢子菌属、镰孢霉属、脉孢菌属、毁丝霉属、嗜热丝孢菌属、肉座菌属、和裸胞壳属。丝状真菌里氏木霉、产黄青霉、嗜热毁丝霉、疏棉状嗜热丝孢菌、米曲霉和黑曲霉是特别令人感兴趣的。还可以采用其他真菌细胞，包括酵母物种。

用户通过所披露的方法选择的靶位点可以位于选自下组的目的基因的区域内，该组由以下各项组成：可读框、启动子、调节序列、终止序列、调节元件序列、剪接位点、编码序列、聚泛素化位点、内含子位点、和内含子增强基序。目的基因的实例包括编码以下各项的基因：乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。编码调节蛋白如转录因子、阻遏物、修饰其他蛋白质的蛋白质如激酶、涉及翻译后修饰(如糖基化)的蛋白质的靶基因，连同涉及细胞信号传导、形态学、生长速度、和蛋白质分泌的基因可以经受Cas介导的编辑。在这方面不意图进行限制。

在这些方法的一些实施例中，鉴定在目的位点处具有基因组修饰的真菌细胞的步骤包括在用于选择或筛选该靶位点处的修饰的条件下培养来自步骤(a)的细胞群体。此类条件包括抗生素选择条件、选择或筛选营养缺陷型细胞的条件等。

在某些实施例中，该引入步骤包括：(i)获得稳定表达该Cas内切核酸酶的亲本真菌细胞群体，并且(ii)将该指导RNA瞬时引入该亲本真菌细胞群体中。相反，该引入步骤可以包括：(i)获得稳定表达该指导RNA的亲本真菌细胞群体，并且(ii)将该Cas内切核酸酶瞬时引入该亲本真菌细胞群体中。

本披露的方面涉及通过上述方法产生的重组真菌细胞以及在进行这些方法中作为亲本宿主细胞使用的那些。

本披露的方面进一步包括可以用于上述或本文披露的方法中的工程化核酸，例如重组DNA构建体。在一方面，工程化核酸编码Cas内切核酸酶或其变体。在一些实施例中，由该工程化核酸编码的Cas内切核酸酶或其变体包含与SEQ ID NO:1至7中任一项具有至少70％、75％、80％、85％、90％、或95％同一性的氨基酸序列。在一些实施例中，该工程化核酸包含针对在丝状真菌中表达进行了密码子优化的多核苷酸序列。在一些实施例中，该工程化核酸包含与SEQ ID NO:8具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％、或99％同一性多核苷酸序列。在具体实施例中，该核酸包含SEQ ID NO:8的序列。在一些实施例中，该工程化核酸包含用于表达Cas内切核酸酶或其变体的启动子。

在另一方面，该工程化核酸编码指导RNA。在一些实施例中，编码指导RNA的核酸包含在丝状真菌细胞、真子囊菌纲或盘菌纲中具有功能的RNA聚合酶III依赖型启动子。在一些实施例中，该启动子源自木霉属U6snRNA基因。在具体实施例中，启动子包含与SEQ IDNO:11或12或其功能片段具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、或99％同一性的核苷酸序列。在具体实施例中，该核酸包含SEQ ID NO:11或12的序列。在一些实施例中，编码指导RNA的核酸具有有效地连接至至少一个异源序列或编码指导RNA的序列上的启动子，其中该启动子作为RNA聚合酶III(pol III)依赖型启动子在丝状真菌细胞中起作用以表达异源序列，并且包含与SEQ ID NO:11或12具有至少80％序列同一性(例如，80％、85％、90％、95％、98％、99％、100％、或其间的任何值)的多核苷酸序列或其功能片段。在某些实施例中，异源序列或编码指导RNA的序列包含源自木霉属U6snRNA基因的内含子序列。在具体实施例中，该异源序列或编码指导RNA的序列包含含有U6B-Box序列(例如，具有GTTCGTTTC多核苷酸序列的B-Box序列)的内含子。该内含子可以具有与SEQID NO:90具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、或99％同一性的核苷酸序列。在具体实施例中，该内含子包含与SEQ ID NO:90至少80％序列同一的多核苷酸序列。在具体实施例中，该核酸包含SEQ ID NO:90的序列。在一些实施例中，该编码指导RNA的核酸包含RNA聚合酶III依赖型启动子和源自如本文所述的木霉属U6snRNA基因的内含子序列。在一些实施例中，该工程化的核酸或重组DNA构建体进一步包括异源序列下游的转录终止序列，例如SEQ ID NO:91所示的序列或其衍生物。

在某些实施例中，包含在编码Cas内切核酸酶的工程化核酸和/或编码指导RNA的工程化核酸中的启动子源自丝状真菌细胞。丝状真菌细胞可以选自多种丝状真菌细胞中的任一种，其中具体实例包括里氏木霉和黑曲霉。在一些情况下，该启动子源自核糖体RNA(rRNA)启动子。

与启动子有效地连接的重组DNA构建体可编码功能RNA。在某些方面，例如，异源序列编码指导RNA多核苷酸，例如，包括以下各项的指导RNA：(i)与靶DNA(可变靶向结构域)中的多核苷酸序列互补的第一核苷酸序列结构域；和(ii)与Cas内切核酸酶(CER结构域)相互作用的第二核苷酸序列结构域。

本披露的方面包括具有重组DNA构建体的载体，该重组DNA构建体具有有效地连接至如本文所述的至少一个异源序列上的启动子。该载体可以进一步包括Cas内切核酸酶的表达盒。

本披露进一步提供了包含重组DNA构建体的丝状真菌细胞，该重组DNA构建体具有有效地连接至如本文所述的至少一个异源序列上的启动子。在丝状真菌细胞中表达异源序列的方法，该方法通过以下步骤进行：a)将具有有效地连接至至少一个异源序列(例如，作为载体)的启动子的重组DNA构建体导入丝状真菌细胞中，并且b)在允许表达重组DNA构建体(或载体)中的异源序列的条件下培养步骤a)的丝状真菌细胞。

本披露的方法和组合物的另外实施例在本文中示出。

附图的简要说明

从以下的详细描述和附图可以更全面地理解本披露，以下的详细描述和附图构成本申请的一部分。

图1描绘了假定的里氏木霉U6基因(SEQ ID NO:22)的核苷酸序列。指示出了目的元素，包括TATA框(已加下划线)、转录起始位点(向下的箭头)、A框(已加下划线)、内含子(前向箭头)、B框(已加下划线；在基因的内含子内)、与人U6基因相同的序列(为粗体斜体)、和终止子(已加下划线)。

图2显示了pTrex2gHyg-Mo Cas质粒的示意图。

图3显示了p219M质粒的示意图。

图4显示了具有所示PCR引物位点和内含子区域的里氏木霉ad3A基因的示意图。

图5显示了具有所示PCR引物和内含子区域的里氏木霉葡糖淀粉酶基因(TrGA)的示意图。

图6显示了包括端粒序列的pTrex2gHygMoCasgPyr2TS6质粒的示意图。

图7.pET30a-SpyCas9的质粒图谱。

图8A显示pSM1指导的质粒图谱，该pSM1指导用于灵活克隆与序列模式GGN18NGG或GN19NGG匹配的任何潜在的指导RNA可变靶向(VT)结构域。图8B小图A中是pSM1指导质粒的单分子指导RNA表达盒区域的更详细的图谱，并且显示了T7启动子、转录起始位点、Bsa1的II型限制性内切核酸酶位点(用于插入所需的VT结构域，例如使用退火的寡核苷酸)、CER结构域(其包括转录终止序列TTTTT；未显示)和编码单分子指导RNA的完整区域的布局。限制性酶DRA1用于在体外转录前将该质粒线性化。当转录时，指导RNA的CER结构域将形成能够结合到同源Cas9多肽的发夹结构，从而产生可在DNA靶位点处诱导双链断裂的功能性Cas9/指导RNA复合物(一种具有与VT结构域互补的序列和适当的PAM位点的复合物)。

图9A显示了用于产生线性化DNA底物的pXA3质粒的图谱。该质粒包含xyr1基因的编码序列(SEQ ID NO:89)，并且通过用限制性酶NdeI消化线性化，以产生DNA底物。

图9B显示了指导RNA/Cas9切割测定(通过溴化乙锭染色进行可视化)的结果。Xyr1特异性体外切割测定的琼脂糖凝胶分析示于该图中。泳道1示出了分子量标记；泳道2示出了在Cas9和指导RNA不存在下线性化质粒底物(包含xyr1基因)；泳道3示出了在具有xyr1TaVT结构域的Cas9和指导RNA存在下质粒底物的切割；泳道4示出了在具有xyr1Tc VT的Cas9和指导RNA存在下质粒底物的切割。线性化质粒底物和切割产物的位置在右侧指示出。

图10.来自对FOA具有抗性并且需要尿苷用于生长的菌株的pyr4基因的序列分析。与野生型序列(K21对照T4；SEQ ID NO:68)的比对揭示了在pyr4基因的靶位点处存在序列修饰(少量(1-2bp)或许多(68bp)核苷酸的插入)。SEQ ID NO:69至77分别是菌株T4 4-3、T44-13、T4 4-11、T4 4-12、T4 4-18、T4 4-20、T4 4-19、T4 4-4、和T4 4-7的序列。菌株T4 4-13(SEQ ID NO:70)和T4 4-12(SEQ ID NO:72)在靶位点处与野生型序列没有变化。

图11A和11B.通过摄取体外形成的Cas9/指导RNA复合物在靶位点处的DNA序列修饰。图11A显示了对FOA具有抗性并且需要尿苷用于生长的两个菌株(T4 2.2和T4 4.1)的pyr4特异性PCR产物(涵盖靶位点)的琼脂糖凝胶分析，这两个菌株在直接引入体外形成的Cas9/指导RNA复合物随后在Vogel的尿苷/FOA平板上生长后进行分离。菌株T4.22(泳道2)显示了比T4 4.1克隆(泳道3；其相当于对照，如图B，泳道2所示)分子量更低的PCR产物，表明pyr4基因中的大缺失。图11B显示了与图11A中相似的PCR/琼脂糖凝胶分析，但显示了T4菌株4.1、4.2、4.3、和4.4，所有这些都对FOA具有抗性，并且需要尿苷用于生长。菌株4.3(泳道5)显示了比对照(C+；泳道2)分子量更低的pyr4基因的PCR产物。

图12.源自克隆T4 2.2(图11A中所示)和T4 2.4的pyr4基因的序列分析。序列分析显示了T4 2.2克隆(顶部比对)在引入的Cas9/指导RNA复合物的靶位点处具有611个碱基对的缺失。将对应于指导RNA的VT结构域序列的序列框出，并且将PAM位点圈出。底部比对显示了在分离的T4 2.4菌株的靶位点处的pyr4基因中的1个碱基对插入(“G”残基)。在比对上方将对应于指导RNA的VT结构域序列的序列用一条线指示出，并且将PAM位点圈出。SEQ IDNO:78至81分别是9-96(T42.2菌株)、Pyr Tr(野生型序列)、查询序列(野生型序列)、和主题序列(T4 2.4菌株)的序列。

图13.源自克隆T4 4.1和4.2(顶部比对)，4.3(底部比对)和4.4(中间比对)的pyr4基因的序列分析(其在图11B中示出)。野生型pyr4序列是所有比对的第一序列(顶部)，并且在所有比对的底部显示共有序列(SEQ ID NO:82)。顶部比对显示了T4 4.1克隆(比对的第三序列；SEQ ID NO:84)具有T核苷酸的插入，而T4 4.2克隆(比对中的第二序列；SEQ IDNO:83)在pyr4基因的靶位点处具有G核苷酸的插入。(该比对中的共有序列与SEQ ID NO:82相同。)中间比对显示了T4 4.4克隆(比对中的第二序列；SEQ ID NO:85)在pyr4基因的靶位点处具有A核苷酸的缺失。(该比对中的共有序列与SEQ ID NO:85相同。)底部比对显示了T44.3克隆(比对中的第二序列；SEQ ID NO:86)中的pyr4基因序列在靶位点处突然发散。(该比对中的共有序列是SEQ ID NO:87；图13中的共有序列中的空位由SEQ ID NO:87中的“N”表示。)进一步的比对分析(未显示)证实T4 4.3克隆在引入的Cas9/指导RNA复合物的靶位点处具有988个碱基对的缺失。

发明详细说明

本披露包括可用于在真菌细胞基因组中的靶位点处修饰DNA序列的组合物和方法。这些方法采用功能性指导RNA/Cas内切核酸酶复合物，其识别所需的靶位点并在位点处引入双链断裂。这种双链断裂的修复可以在靶位点处引入对DNA序列的修饰。

在更详细地描述本发明组合物和方法之前，应当理解，本发明组合物和方法不限于所描述的具体实施例，并且因此当然可以变化。还应当理解，在此使用的术语仅是出于描述具体实施例的目的，并且不旨在进行限制，因为本发明组合物和方法的范围将仅由所附权利要求书限制。

在提供了一系列值的情况下，应理解每个中间值为到下限的十分之一单位(除非上下文清晰地另外指示)，该范围的上限与下限之间以及在该陈述范围内的任何其他陈述的或中间值均被涵盖在本发明的组合物和方法之内。这些较小范围的上限和下限可以被独立地包括在所述较小的范围内，并且也被涵盖在本发明的组合物和方法之内，服从所陈述范围中任何特别排除的限值。在所陈述的范围包括一个或者全部两个限值的情况下，排除那些包括的限值的任一个或者全部两个的范围也包括在本发明的组合物和方法中。

本文提供了某些范围，其中数值前面是术语“约”。术语“约”在本文中用于为其后面的确切数字以及与该术语后面的数字接近或近似的数字提供文字支持。在确定数字是否接近或近似于具体叙述的数字时，接近或近似的未列举的数字可以是在呈现其的上下文中提供具体叙述的数字的实质性等值的数字。例如，关于数值，术语“约”是指数值的-10％至+10％的范围，除非术语在上下文中另有具体定义。在另一个实例中，短语“约6的pH值”是指pH值为从5.4至6.6，除非pH值另有具体定义。

本文提供的标题并非对本发明的组合物和方法的各个方面或实施例进行限制，这些方面或实施例可通过将说明书作为一个整体来参考而得到。因此，将说明书作为一个整体参考时，下面即将定义的术语被定义得更全面。

将本文件分为若干部分以便于阅读；然而，读者将领会的是，在一个部分中进行的陈述可能适用于其他部分。以这种方式，用于本披露的不同部分的标题不应被解释为限制。

除非另有定义，本文使用的所有技术和科学术语具有与本发明组合物和方法所属领域的普通技术人员通常理解的相同含义。虽然类似于或等同于本文描述的那些的任何方法和材料也可以用于本发明组合物和方法的实践或测试中，但现在将对代表性示例方法和材料进行描述。

在本说明书中引用的所有公开物和专利都通过引用并入本文，就好像每个单独的公开物或专利被确切地并单独地指示为通过引用结合，并且通过引用结合在此从而与引用的公开物结合来披露和描述这些方法和/或材料。任何公开物的引用内容是针对其在申请日之前的披露，并且不能理解为承认因为先前发明而本发明组合物和方法不能获得比这些公开物更早的申请日。此外，所提供的公开日期可能与实际公开日期不同，实际公开日期可能需要独立地证实。

根据此详细描述，适用下列简称和定义。应当注意单数形式“一个/一种(a/an)”和“该(the)”包括复数个指示物，除非上下文中清楚地另外指出。因此，例如提及“酶”包括多个这样的酶，并且提及“剂量”包括提及一个或多个剂量以及本领域技术人员已知的其等效物，等等。

进一步注意的是，权利要求书可以被撰写为排除任何可选择的要素。因此，该陈述意在作为使用与权利要求要素的叙述有关的排他性术语例如“单独”、“仅”等或利用“否定型”限定的前提基础。

如将对于本领域技术人员显而易见的是，在阅读本披露时，本文描述和展示的单独实施例中的每一个具有离散的组分和特征，这些组分和特征可以在不偏离本文所述的本发明组合物和方法的范围或精神的情况下容易地与任何其他几个实施例的任何一个的特征分离或组合。可以按照所叙述的事件的顺序或按照逻辑上可行的任何其他顺序来进行任何叙述的方法。

定义

如本文所用，称为“Cas内切核酸酶”或具有“Cas内切核酸酶活性”的多肽涉及由Cas基因编码的CRISPR相关(Cas)多肽，其中当与一种或多种指导多核苷酸功能性偶联时，Cas蛋白能够切割靶DNA序列(参见，例如，题为“CRISPR-Cas systems and methods foraltering expression of gene products[用于改变基因产物表达的CRISPR-Cas系统和方法]”的美国专利8697359)。保留指导多核苷酸定向内切核酸酶活性的Cas内切核酸酶的变体也包括在该定义中。在本文详述的供体DNA插入方法中采用的Cas内切核酸酶是在靶位点处向DNA中引入双链断裂的内切核酸酶。通过指导多核苷酸指导Cas内切核酸酶识别并切割双链DNA中的特异性靶位点，例如在细胞基因组的靶位点处。

如本文所用，术语“指导多核苷酸”涉及可以与Cas内切核酸酶形成复合物的多核苷酸序列，并且使得Cas内切核酸酶能够识别并切割DNA靶位点。指导多核苷酸可以是单分子或双分子。指导多核苷酸序列可以是RNA序列、DNA序列、或其组合(RNA-DNA组合序列)。任选地，指导多核苷酸可以包含至少一种核苷酸、磷酸二酯键或连接修饰，如但不限于锁核酸(LNA)、5-甲基dC、2,6-二氨基嘌呤、2’-氟代A、2’-氟代U、2'-O-甲基RNA、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18(六乙二醇链)分子的连接、或导致环化的5'至3'共价连接。仅包含核糖核酸的指导多核苷酸也被称为“指导RNA”。

指导多核苷酸可以是双分子(也称为双链体指导多核苷酸)，其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的第二核苷酸序列结构域(称为Cas内切核酸酶识别结构域或CER结构域)。双分子指导多核苷酸的CER结构域包含沿着互补区域杂交的两个单独的分子。两个单独的分子可以是RNA、DNA和/或RNA-DNA组合序列。在一些实施例中，包括连接到CER结构域上的VT结构域的双链体指导多核苷酸的第一分子被称为“crDNA”(当由DNA核苷酸的连续延伸构成时)或“crRNA”(当由RNA核苷酸的连续延伸构成时)或“crDNA-RNA”(当由DNA和RNA核苷酸的组合构成时)。cr核苷酸可以包含天然存在于细菌和古生菌中的crRNA的片段。在一个实施例中，存在于本文披露的crN核苷酸中的细菌和古生菌中天然存在的crRNA的片段的大小可以在以下范围内，但不限于其：2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。在一些实施例中，包含CER结构域的双链体指导多核苷酸的第二个分子被称为“tracrRNA”(当由RNA核苷酸的连续延伸构成时)或“tracrDNA”(当由DNA核苷酸的连续延伸构成时)或“tracrDNA-RNA”(当由DNA和RNA核苷酸的组合构成时)。在某些实施例中，指导该RNA/Cas9内切核酸酶复合物的RNA是包括双链体crRNA-tracrRNA的双链RNA。

指导多核苷酸还可以是单分子，其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的第二核苷酸结构域(称为Cas内切核酸酶识别结构域或CER结构域)。“结构域”意指可以为RNA、DNA和/或RNA-DNA组合序列的核苷酸的连续延伸。单指导多核苷酸的VT结构域和/或CER结构域可以包含RNA序列、DNA序列或RNA-DNA组合序列。在一些实施例中，单指导多核苷酸包含连接到tracr核苷酸(包括CER结构域)的cr核苷酸(包含与CER结构域连接的VT结构域)，其中该连接是包含RNA序列、DNA序列或RNA-DNA组合序列的核苷酸序列。由来自cr核苷酸和tracr核苷酸的序列构成的单指导多核苷酸可以被称为“单指导RNA”(当由RNA核苷酸的连续延伸构成时)或“单指导DNA”(当由DNA核苷酸的连续延伸构成时)或“单指导RNA-DNA”(当由RNA和DNA核苷酸的组合构成时)。在本披露的一个实施例中，单指导RNA包含可与II型Cas内切核酸酶形成复合物的II型CRISPR/Cas系统的crRNA或crRNA片段和tracrRNA或tracrRNA片段，其中该指导RNA/Cas内切核酸酶复合物可以将Cas内切核酸酶指导到真菌细胞基因组靶位点，使Cas内切核酸酶能够在基因组靶位点引入双链断裂。

相对于双链体指导多核苷酸，使用单指导多核苷酸的一个方面是仅需要使一个表达盒在靶细胞中表达单指导多核苷酸。

术语“可变靶向结构域”或“VT结构域”在本文中可互换使用，并且包含与双链DNA靶位点的一条链(核苷酸序列)互补的核苷酸序列。第一核苷酸序列结构域(VT结构域)与靶序列之间的互补％为至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、63％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％互补的。VT结构域可以是至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸长度。在一些实施例中，VT结构域包含12至30个核苷酸的连续延伸。该VT结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列或其任意组合构成。

术语指导多核苷酸的“Cas内切核酸酶识别结构域”或“CER结构域”在本文中可互换使用，并且包含与Cas内切核酸酶多肽相互作用的核苷酸序列(如指导多核苷酸的第二核苷酸序列结构域)。CER结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如本文所述的修饰)或其任意组合构成。

连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包含RNA序列、DNA序列或RNA-DNA组合序列。在一个实施例中，连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列长度可以是至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个核苷酸。在另一个实施例中，连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包括四环序列，如但不限于GAAA四环序列。

指导多核苷酸、VT结构域和/或CER结构域的核苷酸序列修饰可以选自但不限于下组，该组由以下各项组成：5’帽、3’多腺苷酸化的尾巴、核糖开关序列、稳定性控制序列、形成dsRNA双链体的序列、将指导多核苷酸靶向亚细胞位置的修饰或序列、提供跟踪的修饰或序列、提供蛋白质结合位点的修饰或序列、锁核酸(LNA)、5-甲基dC核苷酸、2,6-二氨基嘌呤核苷酸、2’-氟A核苷酸、2’-氟U核苷酸；2’-O-甲基RNA核苷酸、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18分子的连接、5’至3’共价键、或其任何组合。这些修饰可以导致至少一个另外的有益特征，其中该另外的有益特征选自下组：经修饰或调节的稳定性、亚细胞靶向、跟踪、荧光标记、蛋白质或蛋白质复合物的结合位点、修饰的对互补靶序列的结合亲和力、修饰的细胞降解抗性、和增加的细胞通透性。

如本文所用，术语“指导多核苷酸/Cas内切核酸酶系统”(和等同物)包括能够将双链断裂引入DNA靶序列的Cas内切核酸酶和指导多核苷酸(单链或双链)的复合物。该Cas内切核酸酶在基因组靶位点极为贴近处解开DNA双链体，并在通过指导RNA识别靶序列时切割两条DNA链，但只有当正确的前间区序列邻近基序(PAM)在靶序列的3'末端适当地定向时才进行上述切割。

术语“功能片段”、“功能等同的片段”、“功能等同片段”等可互换使用，并且是指亲本生物序列的部分或子序列，例如，保留亲本多肽的定性酶活性的多肽。例如，Cas内切核酸酶的功能片段保留与指导多核苷酸产生双链断裂的能力。本文注意到，与亲本多肽相比，功能片段可能具有改变的定量酶活性。其他实例包括保留促进转录的能力的基因启动子的功能片段、保留促进转录的能力的内含子的功能片段和编码酶的功能片段的酶编码基因序列的功能片段。

术语“功能变体”、“功能等同的变体”、“功能等同变体”等可互换使用，并且是指保留亲本多肽的定性酶活性的亲本多肽的变体。例如，Cas内切核酸酶的功能变体保留与指导多核苷酸产生双链断裂的能力。本文注意到，与亲本多肽相比，功能变体可能具有改变的定量酶活性。

片段和变体可以通过任何适合的方法获得，该任何适合的方法包括定点诱变和合成构建。

术语“基因组”当应用于真菌细胞时不仅涵盖在细胞核内发现的染色体DNA，还涵盖在细胞的亚细胞组分(例如线粒体)内发现的细胞器DNA。

“密码子修饰的基因”或“密码子优选的基因”或“密码子优化的基因”是其密码子使用频率被设计为模拟宿主细胞优选密码子使用频率的基因。对基因进行密码子优化的核酸变化是“同义的”，这意味着它们不改变亲本基因的编码多肽的氨基酸序列。然而，天然和变体基因都可以针对特定宿主细胞进行密码子优化，并且因此在这方面不意图进行限制。

“编码序列”是指编码特定氨基酸序列的多核苷酸序列。“调节序列”是指位于一种编码序列的上游(5'非编码序列)、内部、或下游(3'非编码序列)的核苷酸序列，并且这些核苷酸序列影响相关编码序列的转录、RNA加工或稳定性、或翻译。调控序列可以包括但不限于：启动子、翻译前导序列、5’非翻译序列、3’非翻译序列、内含子、聚腺苷酸化靶序列、RNA加工位点、效应子结合位点、和茎-环结构。

“启动子”是指能够控制编码序列或功能RNA表达的DNA序列。该启动子序列由近端元件和更远端的上游元件组成，后者的元件通常被称为增强子。“增强子”是DNA序列，它可以促进启动子的活性并且可以是该启动子或插入的异源元件的固有元件(以增强启动子的水平或组织特异性)。启动子可以全部源自天然基因，或者由源自于在自然界存在的不同启动子的不同元件构成，和/或包含合成的DNA区段。本领域技术人员应理解，不同启动子可在不同组织或细胞类型中或在发育的不同阶段或因响应不同的环境条件指导基因的表达。进一步认识到，由于在大多数情况下调节序列的确切边界尚未完全定义，一些变型的DNA片段可能具有相同的启动子活性。如本领域众所周知的，启动子可以根据其强度和/或它们在其下具有活性的条件进行分类，例如组成型启动子、强启动子、弱启动子、诱导型/抑制性启动子、组织特异性/发育调节启动子、细胞周期依赖型启动子等。

“RNA转录物”是指由RNA聚合酶催化的DNA序列转录产生的产物。“信使RNA”或“mRNA”是指没有内含子并可被细胞翻译成蛋白质的RNA。“cDNA”是指与mRNA模板互补并使用逆转录酶从mRNA模板合成的DNA。“正义”RNA是指包含mRNA并且可以在细胞内或体外翻译成蛋白质的RNA转录物。“反义RNA”是指与所有或部分靶标初级转录物或mRNA互补，并且在某些条件下阻断靶基因的表达的RNA转录物(参见，例如，美国专利号5,107,065)。反义RNA可以与特异性基因转录物的任何部分，即，5’非编码序列、3’非编码序列、内含子、或编码序列互补。“功能RNA”是指反义RNA、核酶RNA、或不能翻译成多肽但对细胞过程有影响的其他RNA。关于mRNA转录物，术语“补体”和“反向补体”在本文中可以互换使用，并且意在定义信息的反义RNA。

如本文所用，“功能附接”或“有效地连接”意指具有已知或所期望活性的多肽或多核苷酸序列的调节区域或功能结构域(如启动子、增强子区、终止子、信号序列、表位标签等)按这样一种方式附接于或连接于靶标(例如，基因或多肽)，以允许调节区域或功能结构域根据其已知或期望的活性来控制该靶标的表达、分泌或功能。例如，当启动子能够调节编码序列的表达时(即，该编码序列处于启动子的转录控制之下)，则该启动子与该编码序列是有效地连接的。

本文使用的标准重组DNA和分子克隆技术是本领域众所周知的。

“PCR”或“聚合酶链式反应”是用于合成特异性DNA区段并由一系列重复变性、退火、和延伸循环组成的技术，并且是本领域众所周知的。

当用于提及生物组分或组合物(例如，细胞、核酸、多肽/酶、载体等)时，术语“重组体”表示生物组分或组合物处于自然界中未发现的状态。换句话说，生物组分或组合物已经通过人类干预从其天然状态进行了修饰。例如，重组细胞涵盖表达在其天然亲本(即非重组)细胞中未发现的一个或多个基因的细胞，以与其天然亲本细胞不同的量表达一个或多个天然基因的细胞、和/或在不同于其天然亲本细胞的条件下表达一种或多种天然基因的细胞。重组核酸可以与天然序列相差一个或多个核苷酸，有效地连接到异源序列(例如，异源启动子、编码非天然或变体信号序列的序列等)，没有内含子序列，和/或处于分离的形式。重组多肽/酶可以与天然序列相差一个或多个氨基酸，可以与异源序列融合，可以被截短或具有氨基酸的内部缺失，能以在天然细胞中未发现的方式表达(例如，从重组细胞，该重组细胞由于在细胞中存在编码多肽的表达载体而过表达多肽)，和/或处于分离的形式。需要强调的是，在一些实施例中，重组多核苷酸或多肽/酶具有与其野生型对应物相同但处于非天然形式(例如，处于分离或富集形式)的序列。

术语“工程化”当用于提及生物组分或组合物(例如，细胞、核酸、多肽/酶、载体等)时，表明生物组分或组合物是由人设计的，并且至少不是完全源自自然界中的生物组分或组合物或与其完全相同，至于设计“工程化”生物组分或组合物的人在设计时就意识到了这点。工程化生物组分或组合物，例如工程化核酸，可以源自不同天然存在的生物组分或组合物的各个部分。工程化生物组分或组合物可以是重组生物组分或组合物。

术语“质粒”，“载体”和“盒”是指携带目的多核苷酸序列的额外的染色体元件，例如有待在细胞中表达的目的基因(“表达载体”或“表达盒”)。此类元件通常是处于双链DNA的形式，并且可以是源自任何来源的直链或环状的单链或双链DNA或RNA的自主复制序列、基因组整合序列、噬菌体、或核苷酸序列，其中许多核苷酸序列已经连接或重组成能够将目的多核苷酸引入细胞的独特构造。目的多核苷酸序列可以是编码有待于在靶细胞中表达的多肽或功能RNA的基因。表达盒/载体通常包含具有可操作连接元件的基因，这些可操作连接元件允许该基因在宿主细胞中表达。

如本文所用的术语“表达”是指处于前体或成熟形式的功能终产物(例如，mRNA、指导RNA、或蛋白质)的产生。

在将多核苷酸或多肽插入细胞(例如，重组DNA构建体/表达构建体)的上下文中，“引入的”是指执行这样的任务的任何方法，并且包括“转染”、“转化”、“转导”的任何手段，物理手段等，以实现所需生物分子的引入。

“瞬时引入(introduced transiently、transiently introduced、transientintroduction)”、“瞬时表达”等意味着将生物分子以非永久性方式引入宿主细胞(或宿主细胞群体)。关于双链DNA，瞬时引入包括其中引入的DNA不整合到宿主细胞的染色体中并因此在生长期间不被传递到所有子代细胞的情况以及其中使用任何适合的方法，在期望的时间去除可能整合到染色体中的引入的DNA分子的情况(例如，采用cre-lox系统，通过去除附加型DNA构建体的阳性选择压力，通过使用选择介质促进全部或部分整合的多核苷酸从染色体中环出等)。在这方面不意图进行限制。通常，将RNA(例如，指导RNA、信使RNA、核酶等)或多肽(例如，Cas多肽)引入宿主细胞被认为是瞬时的，因为这些生物分子不被复制并在细胞生长期间无限期地传递给子代细胞。关于Cas/指导RNA复合物，瞬时引入包括瞬时引入任一组分的情况，因为需要两种生物分子来发挥靶向Cas内切核酸酶活性。因此，Cas/指导RNA复合物的瞬时引入包括其中瞬时引入Cas内切核酸酶和指导RNA中的一个或两个的实施例。例如，可以说具有指导RNA瞬时引入其中的Cas内切核酸酶的基因组整合的表达盒的(并且因此不是瞬时引入的)宿主细胞具有瞬时引入的Cas/指导RNA复合物(或系统)，因为功能复合物以瞬时方式存在于宿主细胞中。在某些实施例中，该引入步骤包括：(i)获得稳定表达该Cas内切核酸酶的亲本真菌细胞群体，并且(ii)将该指导RNA瞬时引入该亲本真菌细胞群体中。相反，该引入步骤可以包括：(i)获得稳定表达该指导RNA的亲本真菌细胞群体，并且(ii)将该Cas内切核酸酶瞬时引入该亲本真菌细胞群体中。

“成熟”蛋白质是指翻译后加工的多肽(即，已经除去存在于主要翻译产物中的任何前原肽或前肽的多肽)。“前体”蛋白质是指mRNA的翻译的初级产物(即，仍存在前原肽和前肽)。前原肽和前肽可以是但不限于细胞内定位信号。

“稳定转化”是指将核酸片段转移到宿主生物体的基因组(包括核基因组和细胞器基因组)中，导致遗传上稳定的遗传(所得宿主细胞在本文中有时称为“稳定转化体”)。相比之下，“瞬时转化”是指将核酸片段转移到宿主生物体的细胞核或其他含DNA的细胞器中，导致基因表达而没有整合或稳定的遗传(有时在本文称为“不稳定转化”，并且所得宿主细胞在本文中有时称为“不稳定转化体”)。包含转化的核酸片段的宿主生物体称为“转基因”生物体。

如本文所用的，“真菌细胞”、“真菌”、“真菌宿主细胞”等包括子囊菌门、担子菌门、壶菌门和接合菌门(如Hawksworth et al.,In,Ainsworth and Bisby's Dictionary ofThe Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK[Hawksworth等人，在：Ainsworth和Bisby的真菌词典，第8版，1995，国际CAB，大学出版社，剑桥，英国]定义的)以及卵菌门(如在Hawksworth等人中所引用，上文)和所有有丝分裂孢子真菌(Hawksworth等人，上文)。在某些实施例中，真菌宿主细胞是酵母细胞，其中“酵母”意指产子囊酵母(内孢霉目)、产担子酵母、和属于不完全菌纲(芽孢菌纲)的酵母。因此，酵母宿主细胞包括假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属、或亚罗酵母属细胞。酵母物种包括但不限于以下各项：卡尔斯伯酵母、酿酒酵母、糖化酵母、道格拉斯酵母、克鲁弗酵母、诺地酵母、卵形酵母、产乳糖酶酵母、和解脂耶氏酵母细胞。

术语“丝状真菌细胞”包括所有丝状形式的真菌亚门或盘菌亚门。丝状真菌属的合适细胞包括但不限于：枝顶孢属、曲霉属、金孢子菌属、棒囊壳属、毛壳菌属、镰孢霉属、赤霉属、腐质霉属、大毁壳属、毁丝霉属、脉孢菌属、拟青霉属、青霉属、柱顶孢属(Scytaldium)、踝节菌属、嗜热子嚢菌属、梭孢壳菌属、弯颈霉属、肉座菌属、和木霉属的细胞。

丝状真菌物种的合适细胞包括但不限于：泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、卢克诺文思金孢子菌(Chrysosporium lucknowense)、红褐肉座菌、杆孢状镰孢菌(Fusarium bactridioides)、谷类镰孢菌(Fusarium cerealis)、克地镰孢菌(Fusarium crookwellense)、黄色镰孢菌(Fusarium culmorum)、禾谷镰孢菌(Fusarium graminearum)、禾赤镰孢菌(Fusarium graminum)、异孢镰孢菌(Fusariumheterosporum)、合欢木镰孢菌(Fusarium negundi)、尖孢镰孢菌、多枝镰孢菌、粉红镰孢菌、接骨木镰孢菌、肤色镰孢菌、拟枝孢镰孢菌、硫色镰孢菌、圆镰孢菌、拟丝孢镰孢菌、镶片镰孢菌、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗壮脉纹孢菌、间型脉孢菌、产紫青霉菌、变灰青霉菌、离生青霉菌(Penicillium solitum)、绳状青霉菌(Penicilliumfuniculosum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、黄篮状菌(Talaromycesflavus)、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、和绿色木霉的细胞。

术语“靶位点”、“靶序列”、“基因组靶位点”、“基因组靶序列”(和等同物)在本文中可互换使用，并且是指真核细胞的基因组中的多核苷酸序列，在该多核苷酸序列处，需要进行Cas内切核酸酶切割以促进基因组修饰，例如在靶位点处DNA序列的修饰。然而，使用这个术语的上下文可以稍微改变其含义。例如，Cas内切核酸酶的靶位点通常是极具特异性的，并且通常可以被定义为确切的核苷酸位置，而在某些情况下，所需基因组修饰的靶位点可以比仅DNA切割发生的位点更广泛地定义。靶位点可以是真菌细胞基因组中的内源性位点，或者可替代地，靶位点可以与真菌细胞异源，并且从而不会天然存在于基因组中，或者与自然界发生的位点相比，可以在异源基因组位置中发现靶位点。

如本文所用，“核酸”意指多核苷酸，并且包括脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。核酸还可以包括片段和修饰的核苷酸。因此，术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用以表示单链或双链的RNA和/或DNA的聚合物，任选包含合成的、非天然的、或改变的核苷酸碱基。核苷酸(通常发现处于其5’-单磷酸形式)可以通过单字母名称表示如下：“A”用于腺苷或脱氧腺苷(分别针对RNA或DNA)，“C”用于胞嘧啶或脱氧胞嘧啶，“G”用于鸟苷或脱氧鸟苷，“U”用于尿苷，“T”用于脱氧胸苷，“R”用于嘌呤(A或G)，“Y”用于嘧啶(C或T)，“K”用于G或T，“H”用于A或C或T，“I”用于肌苷，并且“N”用于任何核苷酸。

术语“源自”涵盖术语“起源于”、“从...获得”、“可从...获得”、“从...分离”和“从...产生”，并且通常表示一个指定的材料在另一个指定的材料中找到其起源或具有可以参考另一指定材料来描述的特征。

如在此所用，术语“杂交条件”是指进行杂交反应的条件。这些条件通常根据杂交在其下测量的条件的“严格”度来分类。严格度可以是基于例如结合复合物或探针的核酸的解链温度(Tm)。例如，“最大严格”通常发生在约Tm-5℃(低于探针的Tm 5℃)；“高严格”发生在低于Tm约5℃-10℃；“中等严格”发生在低于探针的Tm约10℃-20℃；并且“低严格”发生在低于Tm约20℃-25℃。可替代地，或另外，杂交条件可以基于杂交的盐或离子强度条件，和/或基于一个或多个严格洗涤，例如：6X SSC＝非常低严格；3X SSC＝低至中严格；1X SSC＝中严格；以及0.5X SSC＝高严格。在功能上，最大严格条件可以用于鉴定与杂交探针具有严格同一性或近乎严格同一性的核酸序列；而高严格条件用于鉴定与探针具有约80％或更高序列同一性的核酸序列。对于需要高选择性的应用，通常希望使用相对严格的条件来形成杂交体(例如，使用相对较低的盐和/或高温条件)。

如在此所用，术语“杂交”是指通过碱基配对将核酸链与互补链连接的过程，如本领域已知的。更具体来说，“杂交”是指在印迹杂交技术和PCR技术期间发生的，一条核酸与互补链形成双链体，即碱基对的过程。如果两个序列在中至高严格杂交和洗涤条件下彼此特异性杂交，则认为核酸序列可与参考核酸序列“选择性杂交”。杂交条件是基于结合复合物或探针的核酸的解链温度(Tm)。例如，“最大严格”通常发生在约Tm-5℃(低于探针的Tm5°)；“高严格”在低于Tm约5℃-10℃；“中等严格”在低于探针的Tm约10℃-20℃；以及“高严格”在低于Tm约20℃-25℃。在功能上，最大严格条件可以用于鉴定与杂交探针具有严格同一性或近乎严格同一性的序列；而中等或低严格杂交可用于鉴定或检测多核苷酸序列同系物。

中等和高严格杂交条件是本领域公知的。例如，中等严格杂交可以在37℃下在包含20％甲酰胺，5×SSC(150mM NaCl，15mM柠檬酸三钠)，50mM磷酸钠(pH 7.6)，5×登哈特溶液，10％葡聚糖硫酸盐和20mg/ml变性剪切的鲑鱼精子DNA的溶液中过夜孵育，然后在约37℃-50℃下以1x SSC洗涤滤器来进行。高严格杂交条件可以是在65℃和0.1X SSC(其中1XSSC＝0.15M NaCl，0.015M柠檬酸钠，pH 7.0)下的杂交。可替代地，高严格杂交条件可以在约42℃下在50％甲酰胺，5X SSC，5X登哈特溶液，0.5％SDS和100μg/mL变性载体DNA中进行，随后在室温下在2X SSC和0.5％SDS中洗涤两次，并在42℃下在0.1X SSC和0.5％SDS中再洗涤两次。并且非常高的严格杂交条件可能是在68℃和0.1X SSC下的杂交。如果需要，本领域技术人员知道如何调节温度、离子强度等以适应因素如探针长度等等。

在至少两种核酸或多肽的上下文中，“基本相似”或“基本上同一”意指多核苷酸或多肽包含与亲本或参照序列具有至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或甚至至少99％同一性的序列，或不包含只是为了规避本说明书而不添加功能的氨基酸取代、插入、缺失或修饰。

在核酸或多肽序列的上下文中，“序列同一性”或“同一性”是指在两个序列中的核酸碱基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。

术语“序列同一性百分比”是指通过在比较窗口上比较两个最佳比对的序列所确定的值，其中与参比序列(其不包含添加或缺失)比较两个序列的最佳比对时，该多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即，空位)。通过以下方式计算该百分比：确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目，将匹配位置的数目除以比较窗口中的位置的总数目，然后将该结果乘以100以产生序列同一性百分比。序列同一性百分比的有用实例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％或95％、或从50％到100％的任何整数百分比。这些同一性可以使用本文所描述的任何程序来确定。

可以使用设计用于检测同源序列的各种比较方法来确定序列比对和同一性或相似性百分比计算，这些比较方法包括但不限于LASERGENE生物信息学计算套件的MegAlign^TM程序(DNASTAR公司，麦迪逊，威斯康辛州)。在本申请的上下文中，应当理解，在序列分析软件用于分析时，分析结果将基于所引用程序的“默认值”，除非另有规定。如本文所用的，“默认值”将意味着在初次初始化时最初与软件一起加载的任何一组值或参数。

“Clustal V比对方法”对应于如下比对方法，该比对方法标记为Clustal V(由Higgins and Sharp,(1989)CABIOS 5:151-153；Higgins et al.,(1992)Comput ApplBiosci 8:189-191[Higgins和Sharp，(1989)CABIOS5:151-153；Higgins等人，(1992)计算机应用于生物科学8:189-191]所描述的)并在LASERGENE生物信息学计算套件的MegAlign^TM程序(DNASTAR公司，麦迪逊，威斯康辛州)中找到。对于多重比对，默认值对应于空位罚分＝10和空位长度罚分＝10。使用Clustal方法进行逐对比对和蛋白质序列的同一性百分比计算的默认参数是KTUPLE＝1、空位罚分＝3、窗口(WINDOW)＝5、以及存储的对话框(DIAGONALS SAVED)＝5。对于核酸，这些参数是KTUPLE＝2、空位罚分＝5、窗口＝4、以及存储的对话框＝4。使用Clustal V程序比对序列后，可以通过查看同一程序中的“序列距离”表来获得“同一性百分比”。

“Clustal W比对方法”对应于如下比对方法，该比对方法标记为Clustal W(由Higgins and Sharp,(1989)CABIOS 5:151-153；Higgins et al.,(1992)Comput ApplBiosci 8:189-191[Higgins和Sharp，(1989)CABIOS 5:151-153；Higgins等人，(1992)计算机应用于生物科学8:189-191]所描述的)并在LASERGENE生物信息学计算套件的MegAlign^TMv6.1程序(DNASTAR公司，麦迪逊，威斯康辛州)中找到。多重比对的默认参数(空位罚分＝10，空位长度罚分＝0.2，延迟发散序列(％)＝30，DNA转换重量＝0.5，蛋白质权矩阵＝Gonnet系列，DNA权矩阵＝IUB)。使用Clustal W程序比对序列后，可以通过查看同一程序中的“序列距离”表来获得“同一性百分比”。

除非另有说明，本文提供的序列同一性/相似性值是指使用GAP版本10(GCG，Accelrys公司，圣迭哥，加利福尼亚州)使用以下参数获得的值：对于核苷酸序列的同一性％和相似性％，使用50的空位产生罚分权重和3的空位长度延伸罚分权重，以及nwsgapdna.cmp评分矩阵；对于氨基酸序列的同一性％和相似性％，使用8的空位产生罚分权重和2的空位长度延伸罚分，以及BLOSUM62评分矩阵(Henikoff and Henikoff,(1989)Proc.Natl.Acad.Sci.USA 89:10915[Henikoff和Henikoff，(1989)美国国家科学院院刊89:10915])。GAP使用Needleman and Wunsch,(1970)J Mol Biol 48:443-53[Needleman和Wunsch，(1970)分子生物学杂志48:443-53]的算法，以找到使匹配数量最大化并使空位数量最小化的两个完整序列的比对。GAP考虑所有可能的比对和空位位置，并使用空位产生罚分和空位延伸罚分以匹配的碱基为单位产生具有最大匹配碱基数量和最少空位的比对。

本领域技术人员很清楚，多水平的序列同一性可用于鉴定来自其他物种的或天然或合成修饰的多肽，其中所述多肽具有相同或相似的功能或活性。同一性百分比的有用实例包括但不限于50％、55％、60％、65％、70％、75％、80％、85％、90％或95％、或从50％到100％的任何整数百分比。实际上，从50％至100％的任何整数氨基酸同一性可用于描述本披露，如51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％。

“基因”包括编码并能够表达功能分子的核酸片段，所述功能分子如但不限于特异性多肽(例如，酶)或功能RNA分子(例如，指导RNA、反义RNA，核酶等)，并且包括编码序列之前(5’非编码序列)和/或之后(3’非编码序列)的调节序列。“天然基因”是指自然界中发现的具有其自身调节序列的基因。重组基因是指由可以来自不同生物体或相同生物体的不同基因的调节序列调控的基因。

“突变基因”是通过人为干预已经改变的基因。这样的“突变基因”具有通过至少一个核苷酸添加、缺失或取代而与相应的非突变基因的序列不同的序列。在本披露的某些实施例中，突变基因包含由如本文披露的指导多核苷酸/Cas内切核酸酶系统产生的改变。突变的真菌细胞是包含突变基因的真菌细胞。

如本文所用，“靶向突变”是通过使用涉及双链断裂诱导剂的方法改变天然基因内的靶序列而制备的天然基因中的突变，该双链断裂诱导剂能够诱导本文所披露的或本领域已知的靶序列的DNA中的双链断裂。

术语“供体DNA”或“供体核酸序列”或“供体多核苷酸”是指包含在靶位点处或其附近待插入的或用于替代靶位点处或其附近的区域的目的多核苷酸序列的多核苷酸，其通常与Cas/指导多核苷酸复合物的活性相关(其中该指导多核苷酸定义靶位点，如以上详述)。因此，当与在靶位点处或其附近待替代/编辑的核苷酸序列相比时，供体DNA中目的多核苷酸序列可以包含在靶位点处或其附近待插入的新区域和/或修饰的多核苷酸序列。在某些实施例中，供体DNA构建体进一步包含位于目的多核苷酸序列侧翼的第一和第二同源性区域。供体DNA的第一和第二同源性区域与分别存在于真核细胞基因组的靶位点中或位于其侧翼的第一和第二基因组区域享有同源性。“同源性”意指相似的DNA序列。例如，在供体DNA上发现的“与基因组区域同源的区域”是与真菌细胞基因组中给定的“基因组区域”具有相似序列的DNA区域。同源性区域可以具有足以在切割的靶位点促进同源重组的任何长度。例如，同源性区域可以包括至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100个或更多个碱基长度，这样使得同源性区域具有足够的同源性，以便与相应的基因组区域进行同源重组。“足够的同源性”表示两个多核苷酸序列具有足够的结构相似性，以充当同源重组反应的底物。结构相似性包括每个多核苷酸片段的总长度以及多核苷酸的序列相似性。序列相似性可以通过在序列全长上的序列同一性百分比，和/或通过包含局部相似性的保守区域(如具有100％序列同一性的连续核苷酸)和在序列长度的一部分上的序列同一性百分比来描述。

靶标和供体多核苷酸享有的同源性或序列同一性的量可以变化并且包括具有在约1-20bp、20-50bp、50-100bp、75-150bp、100-250bp、150-300bp、200-400bp、250-500bp、300-600bp、350-750bp、400-800bp、450-900bp、500-1000bp、600-1250bp、700-1500bp、800-1750bp、900-2000bp、1-2.5kb、1.5-3kb、2-4kb、2.5-5kb、3-6kb、3.5-7kb、4-8kb、5-10kb、或高达并包括靶位点的全长范围内的单位整数值的总长度和/或区域。这些范围包括该范围内的每个整数，例如1-20bp的范围包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20bp。同源性的量也可以通过两个多核苷酸的完整比对长度上的序列同一性百分比来描述，该序列同一性百分比包括约至少50％、55％、60％、65％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的序列同一性百分比。足够的同源性包括多核苷酸长度、总体序列同一性百分比、和任选地连续核苷酸的保守区域或局部序列同一性百分比的任何组合，例如，足够的同源性可被描述为与靶基因座的区域具有至少80％序列同一性的75-150bp的区域。足够的同源性也可以通过两个多核苷酸在高严格条件下特异性杂交的预测能力来描述，参见，例如Sambrook et al.,(1989)Molecular Cloning:A Laboratory Manual[Sambrook等人，(1989)分子克隆：实验室手册](冷泉港实验室出版社，纽约州)；Current Protocols in Molecular Biology,Ausubel etal.,Eds(1994)Current Protocols[当前分子生物学，Ausubel等人，编辑(1994)当前试验方案](格林出版协会公司(Greene Publishing Associates,Inc.)和约翰威立公司)；和Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes[Tijssen(1993)生物化学和分子生物学实验室技术-与核酸探针杂交](爱思唯尔(Elsevier)，纽约)。

“表型标记”是可筛选或可选择的标记，其包括视觉标记和可选择标记，无论其是阳性还是阴性可选择标记。可以使用任何表型标记。具体地，可选择或可筛选的标记包括允许人们通常在特定条件下对于或针对包含其的分子或细胞进行鉴定、选择、或筛选的DNA区段。这些标记可以编码活性，例如但不限于RNA、肽或蛋白质的产生，或可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。

可选择的标记的实例包括但不限于包含限制性酶位点的DNA区段；编码提供对其他有毒化合物和抗生素(如氯嘧黄隆、苯菌灵、巴斯塔、和潮霉素磷酸转移酶(HPT))的抗性的产物的DNA区段；编码在受体细胞中缺少的产物的DNA区段(例如，tRNA基因、营养缺陷型标记、显性异源标记amdS)；编码可以容易地被鉴定的产物的DNA区段(例如，表型标记如β-半乳糖苷酶、GUS；荧光蛋白如绿色荧光蛋白(GFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)和细胞表面蛋白)；产生用于PCR的新引物位点(例如，以前未并列的两个DNA序列的并列)，包含通过限制性内切核酸酶或其他DNA修饰酶、化学品等不起作用或起作用的DNA序列；并且包含允许其鉴定的特异性修饰(例如，甲基化)所需的DNA序列。

用于修饰真菌细胞基因组的方法和组合物

提供了采用指导RNA/Cas内切核酸酶系统用于在真菌细胞例如丝状真菌细胞的基因组中的靶位点处修饰DNA序列的方法。

本披露的方面包括通过将Cas内切核酸酶/指导多核苷酸复合物瞬时引入细胞用于修饰真菌细胞基因组中的靶位点处的DNA序列的方法。Cas内切核酸酶/指导多核苷酸复合物能够在真菌细胞基因组中的靶位点处引入双链断裂，并且该断裂的修复可导致序列修饰(例如，插入或缺失)。

Cas内切核酸酶或指导多核苷酸(或其他生物分子)的引入能以任何适合的方式完成，该任何适合的方式包括：转染、转导、转化、电穿孔、粒子轰击(生物射弹粒子递送)、和细胞融合技术等。这些组件中的每一个可以根据用户的需要同时或依次引入。例如，可以首先用Cas表达DNA构建体稳定转染真菌细胞，随后将指导多核苷酸引入稳定的转染子(直接或使用表达DNA构建体的指导多核苷酸)。这种设置甚至可能是有利的，因为用户可以产生稳定的Cas转染真菌细胞群体，其中可以独立地引入不同的指导多核苷酸(在一些情况下，如果需要这样做，可以将多于一个的指导多核苷酸引入相同的细胞中)。在一些实施例中，由用户获得表达Cas的真菌细胞，并且因此用户不需要将能够表达Cas内切核酸酶的重组DNA构建体引入细胞中，而只需要将指导多核苷酸引入表达Cas的细胞中。

在某些实施例中，通过引入包含编码指导多核苷酸的表达盒(或基因)的重组DNA构建体，将指导多核苷酸引入真菌细胞中。在一些实施例中，表达盒有效地连接到真核RNApol III启动子。这些启动子是特别令人感兴趣的，因为通过RNA pol III的转录不会导致在通过RNA聚合酶II从RNA pol II依赖型启动子转录时发生的5’帽结构的添加或聚腺苷酸化。在某些实施例中，RNA pol III启动子是丝状真菌细胞U6聚合酶III启动子(例如，SEQID NO:11及其功能变体，例如，SEQ ID NO:12)。

当在宿主细胞的基因组DNA中诱导双链断裂时(例如，通过靶位点处的Cas内切核酸酶/指导RNA复合物的活性，该复合物具有双链内切核酸酶活性)，细胞的DNA修复机制被激活以修复断裂，由于其易出错的性质，该断裂可能在双链断裂位点产生突变。将破坏的末端连接在一起的最常见的修复机制是非同源末端连接(NHEJ)途径(Bleuyard et al.,(2006)DNA Repair 5:1-12[Bleuyard等人，(2006)DNA修复5:1-12])。染色体的结构完整性通常通过修复来维护，但可能发生缺失、插入或其他重排(Siebert and Puchta,(2002)Plant Cell 14:1121-31；Pacher et al.,(2007)Genetics 175:21-9[Siebert和Puchta，(2002)植物细胞14:1121-31；Pacher等人，(2007)遗传学175:21-9])。

令人惊讶的是，我们发现在丝状真菌中，双链断裂处的转化DNA的非同源插入相比双链断裂时染色体DNA两末端之间的简单末端连接是高度有利的。因此，在通过用包含DNA构建体或构建体的表达盒进行转化来提供Cas内切核酸酶或指导RNA的情况下，在双链断裂处以高频插入那些DNA构建体或其片段。在Cas内切核酸酶或指导RNA表达构建体上的DNA序列与双链断裂周围的序列之间不存在同源性的情况下，该插入发生。

通过转化摄取的DNA可以在基因组中以稳定的方式整合，或者它可以瞬时维持。瞬时维持可以被不稳定的表型识别。例如，可以通过选择存在于转化DNA上的标记基因来识别DNA摄取。转化和选择后，转化体可以在非选择性条件下生长若干代，然后转移回至选择性条件。稳定的转化体在转移回至选择性条件后将能够生长，而由于转化DNA的丢失，不稳定转化体在转移回至选择性条件后将不能生长。我们已经证明可以在真菌细胞中瞬时表达Cas内切核酸酶和/或指导RNA。

在需要不稳定转化体的实施例中，可以使用具有促进自主复制的端粒序列的质粒。还可以采用设计用于自主复制的其他类型的质粒，如具有自主复制序列、着丝粒序列或其他序列的那些。令人惊讶的是，在里氏木霉中，我们发现人们可以使用没有已知的复制起点、自主复制序列、着丝粒或端粒序列的质粒。通过筛选相对于可选择标记显示出不稳定表型的转化体，获得没有载体DNA插入的有效的靶位点基因修饰。

本披露的某些实施例包括将Cas内切核酸酶表达盒和第一可选择标记整合到真菌的基因组中，任选地侧接重复序列，以允许表达盒和第一可选择标记的随后的除去(环出)，以产生表达Cas内切核酸酶的宿主细胞。能以许多方式使用这些细胞，以获得目的遗传修饰，包括在期望的靶位点处修饰DNA序列。

例如，可以用包括包含第二可选择标记的指导RNA表达盒的DNA构建体转化表达Cas的内切核酸酶的宿主细胞。针对使用第二可选择标记所选择的宿主细胞将从此DNA构建体表达该指导RNA，其使得实现Cas内切酶活性并靶向到基因组中所定义的目的靶位点。筛选相对于第二可选择标记显示不稳定表型的转化体的这些宿主细胞将能够在没有DNA构建体插入的情况下获得具有修饰的目的位点的宿主细胞。

作为另一个实例，可以诱导表达Cas的内切核酸酶的宿主细胞以摄取体外合成的指导RNA，从而使得Cas内切酶具有活性并能靶向到基因组中所定义的位点。在一些情况下，希望诱导携带可选择标记基因的指导RNA和单独DNA构建体两者的摄取，以允许选择已经摄取DNA并且在高频率下，预期同时已经摄取指导RNA的那些细胞。如上所述，实现了对相对于没有载体DNA插入的目的遗传修饰的可选择标记显示不稳定表型的那些转化体的筛选。

作为又另一个实例，可以使用表达Cas内切核酸酶的宿主细胞来产生可以将Cas内切核酸酶反向提供到“靶菌株”的“辅助菌株”。简而言之，可以在辅助菌株和靶菌株之间产生异核体，例如通过来自每个菌株的原生质体的融合或取决于丝状真菌的物种通过菌丝的吻合。异核体的维持将取决于每个亲本菌株中合适的营养或其他标记基因或突变，以及在合适的选择性培养基上的生长，这样使得亲本菌株不能生长，而由于互补，该异核体能够生长。在异核体形成时或随后，通过转染引入指导RNA。该指导RNA可以直接引入或通过具有Cas内切核酸酶表达盒和可选择标记基因的DNA构建体引入。Cas内切核酸酶从辅助菌株细胞核中的基因表达，并存在于异核体的细胞质中。Cas内切核酸酶与指导RNA结合以产生靶向基因组中所需靶位点的活性复合物，以诱导DNA序列的修饰。随后，从异核体中回收孢子并进行选择或筛选，以回收在靶位点处具有DNA序列的修饰的靶菌株。在使用表达盒引入指导RNA的情况下，选择指导RNA表达构建体不能稳定维持于其中的异核体。

在某些实施例中，Cas内切核酸酶是Cas9内切核酸酶(参见例如WO 2013141680，题为“RNA-directed DNA Cleavage by the Cas9-crRNA Complex[通过Cas9-crRNA复合物的RNA指导的DNA切割]”)。Cas9内切核酸酶的实例包括来自链球菌属物种(例如，化脓性链球菌、变异链球菌、和嗜热链球菌)，弯曲杆菌属物种(例如，空肠弯曲杆菌)，奈瑟氏菌属物种(例如，脑膜炎奈瑟球菌)，弗朗西斯氏菌属物种(例如，新凶手弗朗西斯氏菌)，和巴斯德菌属物种(例如，多杀巴斯德菌)的那些(参见，例如，Fonfara et al.,Nucleic Acids Res.,2013,pages 1-14[Fonfara等人，核酸研究，2013，第1-14页]中描述的Cas9内切核酸酶；其通过引用并入本文)。在一些实施例中，Cas内切核酸酶由优化的Cas9内切核酸酶基因编码，例如针对在真菌细胞中表达而被优化(例如，包含SEQ ID NO:8的Cas9编码基因，例如，SEQID NO:9，如下所述)。

在某些情况下，Cas内切核酸酶基因有效地连接至编码核定位信号的一种或多种多核苷酸，这样使得在细胞中表达的Cas内切核酸酶/指导多核苷酸复合物被有效地转运到细胞核。可以使用任何适合的核定位信号，例如，编码存在于Cas密码子区域上游以及在框内的SV40核定位信号的多核苷酸，以及编码源自里氏木霉blr2(蓝光调节剂2)基因、存在于Cas密码子区域下游以及在框内的核定位信号的多核苷酸。可以采用其他核定位信号。

在本披露的某些实施例中，指导多核苷酸是指导RNA，该指导RNA包含可形成具有II型Cas内切核酸酶的复合物的II型CRISPR/Cas系统的crRNA区域(或crRNA片段)和tracrRNA区域(或tracrRNA片段)。如上所述，指导RNA/Cas内切核酸酶复合物可将Cas内切核酸酶指导至真菌细胞基因组靶位点，使得Cas内切核酸酶能够在基因组靶位点处引入双链断裂。在某些情况下，指导RNA/Cas9内切核酸酶复合物的RNA是包括crRNA和单独tracrRNA的双链体。在其他情况下，指导RNA是包括crRNA区域和tracrRNA区域的单个RNA分子(有时在本文称为融合的指导RNA)。使用融合的指导RNA与双链体crRNA-tracrRNA的一个优点是仅需要制备一个表达盒来表达融合的指导RNA。

本文所披露的方法中所采用的宿主细胞可以是来自以下各门的任何真菌宿主细胞：子囊菌门、担子菌门、壶菌门和接合菌门(如Hawksworth et al.,In,Ainsworth andBisby’s Dictionary of The Fungi,8th edition,1995,CAB International,UniversityPress,Cambridge,UK[Hawksworth等人，在：Ainsworth和Bisby的真菌词典，第8版，1995，国际CAB，大学出版社，剑桥，英国]定义的)以及卵菌门(如在Hawksworth等人中所引用，上文)和所有有丝分裂孢子真菌(Hawksworth等人，上文)。在某些实施例中，真菌宿主细胞是酵母细胞，例如假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属、或亚罗酵母属细胞。酵母物种包括但不限于以下各项：卡尔斯伯酵母、酿酒酵母、糖化酵母、道格拉斯酵母、克鲁弗酵母、诺地酵母、卵形酵母、产乳糖酶酵母、和解脂耶氏酵母细胞。在另外的实施例中，真菌细胞是丝状真菌细胞，包括但不限于以下物种：木霉属、青霉属、曲霉属、腐质霉属、金孢子菌属、镰孢霉属、脉孢菌属、毁丝霉属、肉座菌属、和裸胞壳属。例如，丝状真菌里氏木霉和黑曲霉可用于所披露的方法的方面。

实际上，真菌细胞基因组中的任何位点可以使用所披露的方法靶向，只要靶位点包括所需的前间区序列邻近基序或PAM。在化脓性链球菌Cas9的情况下，PAM具有序列NGG(5’至3’；其中N为A、G、C或T)，并且因此不会对基因组中靶位点的选择产生重大限制。其他已知的Cas9内切核酸酶具有不同的PAM位点(参见，例如，Fonfara et al.,Nucleic AcidsRes.,2013,pages 1-14[Fonfara等人，核酸研究，2013，第1-14页]中描述的Cas9内切核酸酶PAM位点：其通过引用并入本文)。

靶位点长度可以变化，并且包括，例如，至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或更多个核苷酸长度的靶位点。还可能的是，靶位点可以是回文的，也就是说，一条链上的序列与在互补链上以相反方向的读取相同。切割位点可以在靶序列内，或者切割位点可以在靶序列之外。在另一个变型中，切割可以发生在彼此直接相对的核苷酸位置处，以产生钝端切割，或者在其他情况下，切口可以交错以产生单链突出端，也称为“粘性末端”，其可以是5’突出端、或3’突出端。

在一些情况下，还可以使用真菌细胞基因组中的活性变体靶序列，这意味着靶位点与指导多核苷酸(在指导多核苷酸的crRNA序列内)的相关序列不是100％相同的。这种活性变体可以与给定靶位点包含至少65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性，其中活性变体靶序列保留生物活性，并且因此能够被Cas内切核酸酶识别并切割。通过内切核酸酶测量靶位点的双链断裂的测定是本领域已知的，并且通常测量试剂在包含识别位点的DNA底物上的总体活性和特异性。

目的靶位点包括位于目的基因区域内的那些靶位点。目的基因内的区域的非限制性实例包括可读框、启动子、转录调控元件、翻译调控元件、转录终止序列、mRNA剪接位点、蛋白质编码序列、内含子位点、和内含子增强基序。

在某些实施例中，真菌细胞基因组的修饰导致如下表型效应，该表型效应可以被检测到，并且在许多情况下，是用户的希望结果。非限制性实例包括获得可选择的细胞生长表型(例如，对抗生素的抗性或敏感性、营养缺陷特性的增加或丧失，生长速率的增加或降低等)、可检测标记的表达(例如，荧光标记、细胞表面分子、显色酶等)，以及可以在培养基上清液中检测其活性的酶的分泌。

在一些情况下，使用任何适合的方法直接检测真菌细胞中的基因组修饰，该任何适合的方法包括测序、PCR、DNA印迹、限制性酶分析等，包括这些方法的组合。

在一些实施例中，使用所披露的方法将特异性基因靶向用于修饰，这些特异性基因包括编码以下酶的基因，例如：乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。

存在许多用于实现本文描述的变型。例如，替代作为外源序列存在于真菌宿主细胞中的Cas表达盒，该盒可以整合到真菌宿主细胞的基因组中。产生这种亲本细胞系将允许用户简单地引入所需的指导RNA(例如，作为指导RNA表达载体)，该指导RNA然后将靶向目的基因组位点，如本文其他地方所详述。在这些实施例中的一些中，整合的Cas基因可被设计为包括位于其侧翼的多核苷酸重复序列，用于随后需要时从基因组环出/去除。

本文披露的组合物和方法的非限制性实例或实施例如下：

1.一种用于在丝状真菌细胞基因组中的靶位点处修饰DNA序列的方法，该方法包括：

a)向丝状真菌细胞群体中引入Cas内切核酸酶和指导RNA，其中该Cas内切核酸酶和指导RNA能够形成复合物，该复合物使得该Cas内切核酸酶能够在该真菌细胞基因组中的靶位点处引入双链断裂；并且

b)从该群体鉴定在该靶位点处具有DNA序列的修饰的至少一个真菌细胞，

其中将该Cas内切核酸酶、该指导RNA、或二者瞬时引入该真菌细胞群体中。

2.如实施例1所述的方法，其中在所述靶位点处的DNA序列的修饰选自下组，该组由以下各项组成：一个或多个核苷酸的缺失、一个或多个核苷酸的插入、一个或多个核苷酸的取代、及其任何组合。

3.如实施例1或2所述的方法，其中使用选自下组的方法实现将该Cas内切核酸酶引入该真菌细胞群体中，该组由以下各项组成：转染、转导、转化、电穿孔、粒子轰击(生物射弹粒子递送)、和细胞融合技术。

4.如任一前述实施例所述的方法，其中使用选自下组的方法实现将该指导RNA引入该真菌细胞群体中，该组由以下各项组成：转染、转导、转化、电穿孔、粒子轰击(生物射弹粒子递送)、和细胞融合技术。

5.如任一前述实施例所述的方法，其中该鉴定步骤包括在用于对该靶位点处的DNA序列的修饰进行选择或筛选的条件下培养来自步骤(a)的真菌细胞群体。

6.如任一前述实施例所述的方法，其中该鉴定步骤包括在用于筛选不稳定转化体的条件下培养来自步骤(a)的细胞群体。

7.如任一前述实施例所述的方法，其中该Cas内切核酸酶是Cas9内切核酸酶或其变体。

8.如实施例7所述的方法，其中该Cas9内切核酸酶或其变体包含来自选自下组的物种的全长Cas9或其功能片段，该组由以下各项组成：链球菌属物种，化脓性链球菌、变异链球菌、嗜热链球菌；弯曲杆菌属物种，空肠弯曲杆菌；奈瑟氏菌属物种，脑膜炎奈瑟球菌；弗朗西斯氏菌属物种，新凶手弗朗西斯氏菌；和巴斯德菌属物种，多杀巴斯德菌。

9.如实施例8所述的方法，其中该Cas9内切核酸酶或其变体包含与SEQ ID NO:1至7中任一项具有至少70％同一性的氨基酸序列或其功能片段。

10.如任一前述实施例所述的方法，其中该引入步骤包括将包含该Cas内切核酸酶的表达盒的DNA构建体引入该真菌细胞中。

11.如任一前述实施例所述的方法，其中该引入步骤包括将包含该指导RNA的表达盒的DNA构建体引入该真菌细胞中。

12.如实施例1至9和11中任一项所述的方法，其中该引入步骤包括直接将该Cas内切核酸酶引入该真菌细胞中。

13.如实施例1至10和12中任一项所述的方法，其中该引入步骤包括直接将该指导RNA引入该真菌细胞中。

14.如实施例10所述的方法，其中该Cas内切核酸酶的表达盒包含针对在该真菌细胞中的表达所优化的Cas编码序列。

15.如实施例14所述的方法，其中该Cas编码序列是包含与SEQ ID NO:8至少70％同一的多核苷酸序列的Cas9编码序列或其功能片段。

16.如任一前述实施例所述的方法，其中该Cas内切核酸酶有效地连接到核定位信号上。

17.如实施例11所述的方法，其中该指导RNA的表达盒包含在真子囊菌纲或盘菌纲中具有功能的RNA聚合酶III依赖型启动子，并且其中该启动子有效地连接到编码该指导RNA的DNA上。

18.如实施例17所述的方法，其中该启动子源自木霉属U6snRNA基因。

19.如实施例17或18所述的方法，其中该启动子包含与SEQ ID NO:11或12或其功能片段具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、或99％同一性的核苷酸序列。

20.如实施例19所述的方法，其中该启动子包含SEQ ID NO:11或12的序列。

21.如实施例11和17-20中任一项所述的方法，其中该指导RNA的表达盒包含具有来自木霉属U6snRNA基因的内含子序列的、编码指导RNA的DNA。

22.如实施例21所述的方法，其中该源自木霉属U6snRNA基因的内含子序列包含与SEQ ID NO:90或其功能片具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、或99％的同一性的核苷酸序列。

23.如实施例22所述的方法，其中该源自木霉属U6snRNA基因的内含子序列包含SEQ ID NO:90的序列。

24.如任一前述实施例所述的方法，其中该丝状真菌细胞是真菌亚门或盘菌亚门真菌细胞。

25.如任一前述实施例所述的方法，其中丝状真菌细胞选自下组，该组由以下各项组成：木霉属、青霉属、曲霉属、腐质霉属、金孢子菌属、镰孢霉属、毁丝霉属、脉孢菌属、肉座菌属、和裸胞壳属。

26.如任一前述实施例所述的方法，其中该靶位点位于选自下组的目的基因的区域内，该组由以下各项组成：可读框、启动子、调节序列、终止序列、调节元件序列、剪接位点、编码序列、聚泛素化位点、内含子位点、和内含子增强基序。

27.如实施例1、2、4-9、11、13、和16-19中任一项所述的方法，其中该引入步骤包括：(i)获得稳定表达该Cas内切核酸酶的亲本真菌细胞群体，并且(ii)将该指导RNA瞬时引入该亲本真菌细胞群体中。

28.如实施例1-3、5-10、12、和14-19中任一项所述的方法，其中该引入步骤包括：(i)获得稳定表达该指导RNA的亲本真菌细胞群体，并且(ii)将该Cas内切核酸酶瞬时引入该亲本真菌细胞群体中。

29.如任一前述实施例所述的方法，其中该靶位点处DNA序列的修饰不是由同源重组引起的。

30.如任一前述实施例所述的方法，其中该方法不涉及将供体DNA引入该真菌细胞群体中。

31.一种通过任一前述实施例所述的方法产生的重组真菌细胞。

32.一种编码Cas内切核酸酶或其变体的工程化核酸，其中该Cas内切核酸酶或其变体包含与SEQ ID NO:1至7或其功能片段中任一项具有至少70％、75％、80％、85％、90％、或95％同一性的氨基酸序列，并且其中该核酸包含与SEQ ID NO:8或其功能片段至少70％、75％、80％、85％、90％、95％、96％、97％、98％、或99％同一的多核苷酸序列。

33.如实施例32所述的工程化核酸，其中该核酸包含SEQ ID NO:8的序列。

34.一种编码指导RNA的工程化核酸，该指导RNA使得Cas内切核酸酶能够在该丝状真菌细胞基因组中的靶位点处引入双链断裂，其中该编码指导RNA的核酸包含在真子囊菌纲或盘菌纲中具有功能的RNA聚合酶III依赖型启动子，并且该启动子源自木霉属U6snRNA基因。

35.如实施例34所述的工程化核酸，其中该启动子包含与SEQ ID NO:11或12或其功能片段具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％、或100％同一性的核苷酸序列。

36.一种编码指导RNA的工程化核酸，该指导RNA使得Cas内切核酸酶能够在该丝状真菌细胞基因组中的靶位点处引入双链断裂，其中该编码指导RNA的核酸包含具有源自木霉属U6snRNA基因的内含子序列的、编码指导RNA的DNA。

37.如实施例36所述的工程化核酸，其中该源自木霉属U6snRNA基因的内含子序列包含与SEQ ID NO:90或其功能片具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、或100％的同一性的核苷酸序列。

38.如实施例34或36所述的工程化核酸，其中该编码指导RNA的核酸包含源自木霉属U6snRNA基因的启动子和源自木霉属U6snRNA基因的内含子序列，其中该启动子包含与SEQ ID NO:11或12或其功能片段具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％、或100％同一性的核苷酸序列，并且其中该源自木霉属U6snRNA基因的内含子序列包含与SEQ ID NO:90或其功能片段具有至少60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％、或100％同一性的核苷酸序列。

实例

在以下实例中，除非另有说明，份数和百分比以重量计，并且度是摄氏度。应当理解，这些实施例，虽然表示本披露的实施例，但仅以举例说明的方式给出。从上述讨论和这些实例，本领域技术人员可以对本披露进行各种改变和修改以使其适应各种用法和条件。这类修改也旨在落入所附权利要求书的范围内。

部分A：通过表达载体进行Cas/指导RNA的引入

实例1：里氏木霉U6 snRNA基因的鉴定

需要RNA聚合酶III定向启动子用于在里氏木霉中产生指导RNA，而不添加由使用RNA聚合酶II依赖型启动子产生的5'帽结构或聚腺苷酸化。然而，已经描述了在里氏木霉中有功能的RNA聚合酶III依赖型启动子。考虑测试来自其他物种的已知RNA聚合酶III依赖型启动子在里氏木霉中的能力，这些启动子包含来酿酒酵母snr52基因的5’上游区域、人类U6snRNA基因、或玉米U6snRNA基因。

更理想的是鉴定将作为RNA聚合酶III依赖型启动子起作用的天然的里氏木霉序列。使用编码人类U6核小RNA(snRNA；GenBank登录号M14486)的DNA序列，使用BLAST算法来搜索里氏木霉v2基因组序列(www.jgi.doe.gov)。鉴定与人类序列相似的里氏木霉DNA序列的短区域。周围DNA序列的检查和与酵母，特别是粟酒裂殖酵母的U6基因的比较(Marck etal.,2006,Nucleic Acids Research 34:1816-1835)允许推定鉴定里氏木霉U6基因的许多特征(SEQ ID NO:22，如下所示)。转录序列和终止子的开始被鉴定为上游TATA框。内含子明显地中断转录区域，并且可以在转录区域内识别可能的A框和B框启动子元件，后者在内含子内。(参见图1)。

AAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCGCCTTCGGGCATTTGGTCAATTTATAACGATACAGGTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGCTAACAGGTCAACAGAGAAGATTAGCATGGCCCCTGCACTAAGGATGACACGCTCACTCAAAGAGAAGCTAAACATTTTTTTTCTCTTCCAAGTCGTGATGGTTATCTTTTTGCTTAGAGAATCTATTCTTGTGGACGATTAGTATTGGTAAATCCCTGCTGCACATTGCGGCGGATGGTCTCAACGGCATAATACCCCATTCGTGATGCAGCGGTGATCTTCAATATGTAGTGTAATACGTTGCATACACCACCAGGTTCGGTGCCTCCTGTATGTACAGTACTGTAGTTCGACTCCTCCGCGCAGGTGGAAACGATTCCCTAGTGGGCAGGTATTTTGGCGGGGTCAAGAA(SEQID NO:22)

实例2：靶向里氏木霉基因的sgRNA序列

已经显示出单指导RNA(sgRNA)分子可以与化脓性链球菌Cas9蛋白质相互作用，以将该内切核酸酶体内靶向真核生物基因组中的特异性基因座(REFS)。该sgRNA是一种杂交分子，该杂交分子被设计为观察到天然为化脓性链球菌II型CRISPR-Cas系统的组分的、tracrRNA和crRNA之间的融合物(Gasiunas et al.(2012)Proc.Natl.Acad.Sci.USA 109:E2579-86,Jinek et al.(2012)Science 337:816-21,Mali et al.(2013)Science 339:823-26,and Cong et al.(2013)Science 339:819-23[Gasiunas等人，(2012)，美国国家科学院院刊，109:E2579-86，Jinek等人，(2012)，科学，337:816-21，Mali等人，(2013)，科学，339:823-26，和Cong等人，(2013)，科学，339:819-23])。sgRNA的前20个核苷酸与基因组中的靶位点互补。还需要在与sgRNA互补区域相邻的基因组中的靶位点存在的另外的序列(PAM，前间区序列邻近基序)。在化脓性链球菌Cas9的情况下，PAM具有序列NGG(其中N是A、G、C或T)。

这些实验中使用的sgRNA的序列如下所示，其中被设计为与靶位点互补的20个核苷酸显示为N残基(SEQ ID NO:23)(N＝A、G、C或U)。

NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGGUGC

设计sgRNA以靶向里氏木霉基因组中的不同基因座。以下显示了靶向表示为靶位点1(TS1)的位点处的里氏木霉ad3A(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)基因的sgRNA(称为gAd3A TS1)的序列(SEQ ID NO:24)。与里氏木霉基因组序列互补的20个核苷酸区域以小写字母显示。

guccucgagcaaaaggugccGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGGUGC

以下显示了靶向表示为靶位点2(TS2)的位点处的里氏木霉gla1(葡糖淀粉酶)基因的sgRNA(称为gTrGA TS2)的序列(SEQ ID NO:25)。与里氏木霉基因组序列互补的20个核苷酸区域以小写字母显示。

guucagugcaauaggcgucuGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGGUGC

以下显示了靶向表示为靶位点11(TS11)的位点处的里氏木霉gla1(葡糖淀粉酶)基因的sgRNA(称为gTrGA TS11)的序列(SEQ ID NO:26)。与里氏木霉基因组序列互补的20个核苷酸区域以小写字母显示。

gccaauggcgacggcagcacGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGGUGC

以下显示了靶向表示为靶位点6(TS6)的位点处的里氏木霉pyr2(乳清酸磷酸核糖基转移酶)基因的sgRNA(称为gPyr2TS6)的序列(SEQ ID NO:27)。与里氏木霉基因组序列互补的20个核苷酸区域以小写字母显示。

gcacagcgggaugcccuuguGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGGUGC

实例3：用于在里氏木霉中表达的Cas9DNA和蛋白质序列

对密码子优化的、编码化脓性链球菌Cas9的基因(包括NLS序列)进行设计、合成并针对在里氏木霉中的表达进行测试(SEQ ID NO:9)。所编码的蛋白质(SEQ ID NO:10)具有N-末端SV40核定位信号(NLS；SEQ ID NO:19)和源自里氏木霉blr2(蓝光调节剂2)基因的C末端NLS(SEQ ID NO:20；两者在以下SEQ ID NO:10中均已被加下划线)。SEQ ID NO:9

atggcaccgaagaagaagcgcaaggtgatggacaagaagtacagcatcggcctcgacatcggcaccaactcggtgggctgggccgtcatcacggacgaatataaggtcccgtcgaagaagttcaaggtcctcggcaatacagaccgccacagcatcaagaaaaacttgatcggcgccctcctgttcgatagcggcgagaccgcggaggcgaccaggctcaagaggaccgccaggagacggtacactaggcgcaagaacaggatctgctacctgcaggagatcttcagcaacgagatggcgaaggtggacgactccttcttccaccgcctggaggaatcattcctggtggaggaggacaagaagcatgagcggcacccaatcttcggcaacatcgtcgacgaggtggcctaccacgagaagtacccgacaatctaccacctccggaagaaactggtggacagcacagacaaggcggacctccggctcatctaccttgccctcgcgcatatgatcaagttccgcggccacttcctcatcgagggcgacctgaacccggacaactccgacgtggacaagctgttcatccagctcgtgcagacgtacaatcaactgttcgaggagaaccccataaacgctagcggcgtggacgccaaggccatcctctcggccaggctctcgaaatcaagaaggctggagaaccttatcgcgcagttgccaggcgaaaagaagaacggcctcttcggcaaccttattgcgctcagcctcggcctgacgccgaacttcaaatcaaacttcgacctcgcggaggacgccaagctccagctctcaaaggacacctacgacgacgacctcgacaacctcctggcccagataggagaccagtacgcggacctcttcctcgccgccaagaacctctccgacgctatcctgctcagcgacatccttcgggtcaacaccgaaattaccaaggcaccgctgtccgccagcatgattaaacgctacgacgagcaccatcaggacctcacgctgctcaaggcactcgtccgccagcagctccccgagaagtacaaggagatcttcttcgaccaatcaaaaaacggctacgcgggatatatcgacggcggtgccagccaggaagagttctacaagttcatcaaaccaatcctggagaagatggacggcaccgaggagttgctggtcaagctcaacagggaggacctcctcaggaagcagaggaccttcgacaacggctccatcccgcatcagatccacctgggcgaactgcatgccatcctgcggcgccaggaggacttctacccgttcctgaaggataaccgggagaagatcgagaagatcttgacgttccgcatcccatactacgtgggcccgctggctcgcggcaactcccggttcgcctggatgacccggaagtcggaggagaccatcacaccctggaactttgaggaggtggtcgataagggcgctagcgctcagagcttcatcgagcgcatgaccaacttcgataaaaacctgcccaatgaaaaagtcctccccaagcactcgctgctctacgagtacttcaccgtgtacaacgagctcaccaaggtcaaatacgtcaccgagggcatgcggaagccggcgttcctgagcggcgagcagaagaaggcgatagtggacctcctcttcaagaccaacaggaaggtgaccgtgaagcaattaaaagaggactacttcaagaaaatagagtgcttcgactccgtggagatctcgggcgtggaggatcggttcaacgcctcactcggcacgtatcacgacctcctcaagatcattaaagacaaggacttcctcgacaacgaggagaacgaggacatcctcgaggacatcgtcctcaccctgaccctgttcgaggaccgcgaaatgatcgaggagaggctgaagacctacgcgcacctgttcgacgacaaggtcatgaaacagctcaagaggcgccgctacactggttggggaaggctgtcccgcaagctcattaatggcatcagggacaagcagagcggcaagaccatcctggacttcctcaagtccgacgggttcgccaaccgcaacttcatgcagctcattcacgacgactcgctcacgttcaaggaagacatccagaaggcacaggtgagcgggcagggtgactccctccacgaacacatcgccaacctggccggctcgccggccattaaaaagggcatcctgcagacggtcaaggtcgtcgacgagctcgtgaaggtgatgggccggcacaagcccgaaaatatcgtcatagagatggccagggagaaccagaccacccaaaaagggcagaagaactcgcgcgagcggatgaaacggatcgaggagggcattaaagagctcgggtcccagatcctgaaggagcaccccgtggaaaatacccagctccagaatgaaaagctctacctctactacctgcagaacggccgcgacatgtacgtggaccaggagctggacattaatcggctatcggactacgacgtcgaccacatcgtgccgcagtcgttcctcaaggacgatagcatcgacaacaaggtgctcacccggtcggataaaaatcggggcaagagcgacaacgtgcccagcgaggaggtcgtgaagaagatgaaaaactactggcgccagctcctcaacgcgaaactgatcacccagcgcaagttcgacaacctgacgaaggcggaacgcggtggcttgagcgaactcgataaggcgggcttcataaaaaggcagctggtcgagacgcgccagatcacgaagcatgtcgcccagatcctggacagccgcatgaatactaagtacgatgaaaacgacaagctgatccgggaggtgaaggtgatcacgctgaagtccaagctcgtgtcggacttccgcaaggacttccagttctacaaggtccgcgagatcaacaactaccaccacgcccacgacgcctacctgaatgcggtggtcgggaccgccctgatcaagaagtacccgaagctggagtcggagttcgtgtacggcgactacaaggtctacgacgtgcgcaaaatgatcgccaagtccgagcaggagatcggcaaggccacggcaaaatacttcttctactcgaacatcatgaacttcttcaagaccgagatcaccctcgcgaacggcgagatccgcaagcgcccgctcatcgaaaccaacggcgagacgggcgagatcgtctgggataagggccgggatttcgcgacggtccgcaaggtgctctccatgccgcaagtcaatatcgtgaaaaagacggaggtccagacgggcgggttcagcaaggagtccatcctcccgaagcgcaactccgacaagctcatcgcgaggaagaaggattgggacccgaaaaaatatggcggcttcgacagcccgaccgtcgcatacagcgtcctcgtcgtggcgaaggtggagaagggcaagtcaaagaagctcaagtccgtgaaggagctgctcgggatcacgattatggagcggtcctccttcgagaagaacccgatcgacttcctagaggccaagggatataaggaggtcaagaaggacctgattattaaactgccgaagtactcgctcttcgagctggaaaacggccgcaagaggatgctcgcctccgcaggcgagttgcagaagggcaacgagctcgccctcccgagcaaatacgtcaatttcctgtacctcgctagccactatgaaaagctcaagggcagcccggaggacaacgagcagaagcagctcttcgtggagcagcacaagcattacctggacgagatcatcgagcagatcagcgagttctcgaagcgggtgatcctcgccgacgcgaacctggacaaggtgctgtcggcatataacaagcaccgcgacaaaccaatacgcgagcaggccgaaaatatcatccacctcttcaccctcaccaacctcggcgctccggcagccttcaagtacttcgacaccacgattgaccggaagcggtacacgagcacgaaggaggtgctcgatgcgacgctgatccaccagagcatcacagggctctatgaaacacgcatcgacctgagccagctgggcggagacaagaagaagaagctcaagctctag

SEQ ID NO:10

MAPKKKRKVMDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDK KKKLKL

实例4：Cas9表达载体的构建

将编码以上显示的Cas9的合成DNA序列插入pENTR/D-TOPO中，这样使得其位于侧翼attL1和attL2位点之间，以使得能够通过Gateway克隆(英杰公司(InVitrogen))转移到合适的表达载体中。Gateway兼容的表达载体pTrex2gHyg是可用的，其包括以下特征：通过Gateway克隆位点分离的来自里氏木霉pki1(丙酮酸激酶)基因的启动子区域和来自里氏木霉cbh1(纤维二糖水解酶I)基因的终止子区域，与粗糙脉孢菌cpc1(交叉途径对照1)启动子区域和构巢曲霉trpC(具有谷氨酰胺酰胺转移酶的三官能蛋白，吲哚甘油磷酸酯合酶和磷酸核糖基邻氨基苯甲酸异构酶活性)终止子区域功能相关的细菌潮霉素磷酸转移酶基因，以及用于在大肠杆菌中选择和维持的细菌载体序列。使用Gateway克隆程序(英杰公司)将cas9基因克隆到pTrex2gHyg中，以给出pTrex2gHyg MoCas(参见图2)。

实例5：sgRNA表达载体的构建

获得编码侧接有不同的推定的RNA聚合酶III依赖型启动子和终止子的gAd3ATS1sgRNA的合成DNA序列。这些合成DNA序列中的每一个在任一末端处也具有限制性酶识别位点(EcoRI和BamHI)。

编码具有酿酒酵母snr52启动子和酿酒酵母sup4终止子的gAd3A TS1 sgRNA(表示为gAd3A TS1-1；SEQ ID NO:28)(已加下划线)：gaattcggatccTCTTTGAAAAGATAATGTATGATTATGCTTTCACTCATATTTATACAGAAACTTGATGTTTTCTTTCGAGTATATACAAGGTGATTACATGTACGTTTGAAGTACAACTCTAGATTTTGTAGTGCCCTCTTGGGCTAGCGGTAAAGGTGCGCATTTTTTCACACCCTACAATGTTCTGTTCAAAAGATTTTGGTCAAACGCTGTAGAAGTGAAAGTTGGTGCGCATGTTTCGGCGTTCGAAACTTCTCCGCAGTGAAAGATAAATGATCgtcctcgagcaaaaggtgccGTTTTAG AGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTGTTTTTTATGTCTgaattcggatcc

以下序列编码具有里氏木霉U6启动子和终止子的gAd3A TS1 sgRNA(表示为gAd3ATS1-2；SEQ ID NO:29)(已加下划线)：gaattcggatccAAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCgtcctcgagcaaaaggtgccGTTTTAGAGCTAGAAATAGCAAGTTA AAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTTCTCTTgaattcggatcc

以下序列编码具有里氏木霉U6启动子、终止子和内含子的gAd3A TS1sgRNA(斜体)(表示为gAd3A TS1-3；SEQ ID NO:30)(已加下划线)：

gaattcggatccAAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCgtcctcgagcaaaaggtgccGTTTTAGAGCTAGAGTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGCTAACAGAATAGCAAGTTAAAATAAGGCTAGTCCGTTAT CAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTTCTCTTgaattcggatcc

质粒p219M(图3)是包含里氏木霉pyr4(乳清酸核苷单磷酸脱羧酶)基因的大肠杆菌载体，该基因包括其天然启动子和终止子。将该载体用EcoRI和BamHI消化，并将末端脱磷酸化。用EcoRI和BamHI消化上述合成的DNA分子，并与切割的p219M连接以产生一系列包含sgRNA表达盒和pyr4基因的载体。每个载体以其编码的sgRNA的名称命名(例如，p219MgAd3A TS1-1将gAd3A表达盒与酿酒酵母snr52启动子和sup4终止子合并)。

获得具有较短里氏木霉U6启动子区域的指导RNA表达盒作为合成DNA。这里提供了实例，该实例包括在TS11处靶向里氏木霉gla1基因的sgRNA的序列(SEQ ID NO:31；内含子序列已加下划线)。

AATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCgccaatggcgacggcagcacGTTTTAGAGCTAGAGTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGC TAACAGAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTTCTCTT

使用引物gRNA fwd aflII(5’-cgtcagcttaagaattcctaaagAAACAGCATGAAATGG；SEQID NO:32)和gRNA rev sfi(5’-cgtcagggccacgtgggccAAGAGAAAAAAAAGCACCACCGACTCGG；SEQ ID NO:33)，通过PCR扩增以上gRNA表达盒。这些引物向指导RNA表达盒的5’末端添加了aflII并且向3’末端添加了sfiI位点。根据制造商的指示，使用Qiagen PCR纯化试剂盒纯化PCR产物。然后将PCR产物用SfiI和AflII消化，并在Qiagen PCR纯化试剂盒上再次清洗。将质粒pTrex2g/Hyg MoCas用SfiI和AflII消化，并使用罗氏(Roche)快速碱性磷酸酶试剂盒(罗氏诊断公司，印第安纳州)进行去磷酸化。最终使用罗氏快速DNA连接酶试剂盒将消化的质粒和PCR产物进行连接以产生pTrex2g/Hyg MoCas gTrGA TS11B。以类似的方式将其他sgRNA表达盒插入pTrex2g/Hyg MoCas中。

实例6：里氏木霉中Cas9介导的基因失活

下面描述了一系列实验，其中将里氏木霉菌株用两个独立的表达载体共转化，一个用于产生Cas9并且另一个用于产生gRNA，或用单个载体转化以表达Cas9和gRNA两者。这些实验证明，只有当U6内含子也存在于gRNA转录区域内时，来自里氏木霉U6基因的5’上游区域才能促进gRNA转录。实验还证明，靶向的基因失活可以在里氏木霉转化体中以高效率发生。

ad3A基因的失活

使用源自公开可得的菌株RL-P37的里氏木霉的菌株，在该菌株中编码四种主要分泌的纤维素酶的基因(cbh1、cbh2、egl1、和egl2)是缺失的。该菌株也缺少功能pyr4基因。使用生物射弹转化(如US 20060003408 A1中所述)，与等量的pTrex2gHyg MoCas和p219MgAd3ATS1-1、p219M gAd3ATS1-2或p219M gAd3ATS1-3之一的混合物共转化。在包含2％葡萄糖、100mg/L潮霉素B和200mg/L腺嘌呤的Vogel基本培养基的琼脂平板上选择转化体。在第一平板上选择后，将转化体菌落挑选到相同选择性培养基的新鲜平板上。在第二平板上的生长期间，能够区分稳定和不稳定的潮霉素抗性转化体。稳定的转化体生长更快，菌落具有光滑的轮廓，并且菌丝体密度更高。不稳定的转化体生长较慢，具有较小密度的菌丝体并且菌落具有粗糙的不规则轮廓。在第二平板上生长后，将转化体转移到具有葡萄糖、没有潮霉素并且具有14mg/L腺嘌呤的Vogel培养基中，以筛选显示红色/棕色的那些，这表明它们是腺嘌呤营养缺陷体。用p219M gAd3ATS1-1获得五个稳定的和23个不稳定的转化体，并且全部为腺嘌呤原养型生物。用p219M gAd3ATS1-2获得十一个稳定的和38个不稳定的转化体，并且所有11个稳定的和29个不稳定的转化体是腺嘌呤原养型生物。用p219M gAd3ATS1-3获得十九个稳定的和2个不稳定的转化体，并且全部为腺嘌呤营养缺陷体。显然，仅用gAd3ATS1-3获得腺嘌呤营养缺陷体，该gAd3ATS1-3使用里氏木霉U6启动子、内含子和终止子来控制sgAd3A TS1的转录。腺嘌呤营养缺陷型表示天然的里氏木霉ad3A基因座上靶向的Cas9切割。可以得出结论，Cas9介导的基因失活是有效的，因为所有测试的具有gAd3ATS1-3的转化体都是腺嘌呤营养缺陷体。

为了确定具有pTrex2gHyg MoCas和p219M gAd3ATS1-3的共转化体中ad3A基因座处的突变，从10个稳定的腺嘌呤营养缺陷型转化体中提取出基因组DNA。使用被设计用于产生产物的若干种不同的引物对，将该DNA用作PCR的模板，这些产物跨越Cas9靶位点或在靶位点的上游或下游。根据制造商的指示，将PfuUltra II融合HS DNA聚合酶(安捷伦科技公司(Agilent Technologies))用于PCR。在每种情况下，延伸时间是制造商针对如以下所述PCR产物的预期大小所建议的延伸时间。通过琼脂糖凝胶电泳评价PCR产物的大小。

使用扩增TS1靶位点5’侧区域的Ad3 5’fwd+Ad3 5’rev引物(分别为5’-tgaacacagccaccgacatcagc[SEQ ID NO:34]和5’-gctggtgagggtttgtgctattg[SEQ ID NO:35])在所有转化体中获得预期大小(872bp)的PCR产物。

使用扩增TS1靶位点5’侧区域的Ad3 5'fwd+Ad3a 5005rev引物(分别为5’-tgaacacagccaccgacatcagc[SEQ ID NO:34]和5’-gattgcttgggaggaggacat[SEQ ID NO:36])在所有转化体中获得预期大小(1214bp)的PCR产物。

使用扩增TS1靶位点3’侧区域的Ad3 3’fwd+Ad3 5’rev引物(分别为5’-cgaggccactgatgaagttgttc[SEQ ID NO:37]和5’-cagttttccaaggctgccaacgc[SEQ ID NO:38])在所有转化体中获得预期大小(904bp)的PCR产物。

使用扩增TS1靶位点3’侧区域的Ad3a 5003fwd+Ad3mid rev引物(分别为5’-ctgatcttgcaccctggaaatc[SEQ ID NO:39]和5’-ctctctatcatttgccaccctcc[SEQ ID NO:40])在所有转化体中获得预期大小(757bp)的PCR产物。

以上PCR结果证明，基因组DNA制备具有足以从Cas9靶位点的上游或下游获得PCR产物的质量。

对于使用跨越ad3A中的TS1靶位点的Adfrag fwd+Adfrag rev引物(分别为5’-ctccattcaccctcaattctcc[SEQ ID NO:41]和5’-gttcccttggcggtgcttggatc[SEQ ID NO:42])的任何转化体，不能获得PCR产物。假定没有由Cas9活性引起的大尺寸变化的PCR产物的预期大小约为764bp。

对于使用跨越ad3A中的TS1靶位点的Adfrag fwd+Ad3 3’rev引物(分别为5’-ctccattcaccctcaattctcc[SEQ ID NO:41]和5’-cagttttccaaggctgccaacgc[SEQ ID NO:38])的任何转化体，不能获得PCR产物。假定没有由Cas9活性引起的大尺寸变化的PCR产物的预期大小约为2504bp。

对于使用跨越ad3A中的TS1靶位点的Ad3a 2k fwd+Ad3a 2k rev引物(分别为5’-caatagcacaaaccctcaccagc[SEQ ID NO:43]和5’-gaacaacttcatcagtggcctcg[SEQ ID NO:44])的任何转化体，不能获得PCR产物。假定没有由Cas9活性引起的大尺寸变化的PCR产物的预期大小约为1813bp。

使用跨越TS1靶位点的Adfrag fwd+Ad3mid rev引物(分别为5’-ctccattcaccctcaattctcc[SEQ ID NO:41]和5’-ctctctatcatttgccaccctcc[SEQ ID NO:40])，五个转化体也未给出PCR产物。假定没有由Cas9活性引起的大尺寸变化的PCR产物的预期大小约为1438bp。

基于已发表的数据，Cas9介导的基因失活通常涉及在靶位点处的DNA中双链断裂的易错修复。最终的结果是在靶位点处的小缺失或插入(插入缺失)。来自PCR分析的上述结果令人惊讶，因为不可能获得跨越靶位点的预期大小的PCR产物，表明ad3A的失活不是由于靶位点处小插入或缺失(插入缺失)而导致的。相反，这些数据与通过靶位点处染色体重排或大插入引起的ad3A的失活的可能性一致。

葡糖淀粉酶(GA)基因的失活

使用源自公开可得的菌株RL-P37的里氏木霉的菌株，在该菌株中编码四种主要分泌的纤维素酶的基因(cbh1、cbh2、egl1、和egl2)是缺失的。该菌株也缺少功能pyr4基因。用等量的pTrex2gHyg MoCas和p219M gTrGA TS2的混合物，使用生物射弹法共同转化该菌株。在包含1％葡萄糖、100ug/ml潮霉素B和2mg/ml尿苷的Vogel基本培养基的琼脂平板上选择转化体。在第一平板上选择后，将转化体菌落挑选到相同选择性培养基的新鲜平板上。在第二平板上的生长期间，能够区分稳定和不稳定的潮霉素抗性转化体。获得了十七个稳定的和4个不稳定的转化体。将这些转化体转移到没有葡萄糖并具有1％不溶性淀粉的Vogel琼脂平板上，以针对所分泌的葡糖淀粉酶的存在或不存在进行筛选。能够分泌葡糖淀粉酶的菌落生长良好并形成孢子。不能分泌葡糖淀粉酶的菌落伴有非常稀疏的菌丝体生长并且是可明显区分的。17个稳定转化体中的十四个不能分泌葡糖淀粉酶，并且所有4个不稳定的转化体均不分泌葡糖淀粉酶。

为了确定具有pTrex2gHyg MoCas和p219M gTrGA TS2的共转化体中gla1(葡糖淀粉酶)基因座处的突变，从5个稳定的非产葡糖淀粉酶转化体中提取出基因组DNA。使用被设计用于产生产物的不同的引物对，将该DNA用作PCR的模板，这些产物跨越Cas9靶位点或在靶位点的上游或下游。根据制造商的指示，将PfuUltra II融合HS DNA聚合酶(安捷伦科技公司)用于PCR。在每种情况下，延伸时间是制造商针对如以下所述PCR产物的预期大小所建议的延伸时间。通过琼脂糖凝胶电泳评价PCR产物的大小。

对于使用跨越gla1中的TS2靶位点的glaA+glaB引物(分别为5’-ccgttagttgaagatccttgccg[SEQ ID NO:45]和5’-gtcgaggatttgcttcatacctc[SEQ ID NO:46])的任何转化体，不能获得PCR产物。假定没有由Cas9活性引起的大尺寸变化的PCR产物的预期大小约为1371bp。

使用扩增TS2靶位点5’侧区域的glaA+glaJ引物(分别为5’-ccgttagttgaagatccttgccg[SEQ ID NO:45]和5’-tgccgactttgtccagtgattcg[SEQ ID NO:47])在所有转化体中获得预期大小(364bp)的条带。

使用扩增TS2靶位点3’侧区域的glaK+glaB引物(分别为5’-ttacatgtggacgcgagatagcg[SEQ ID NO:48]和5’-gtcgaggatttgcttcatacctc[SEQ ID NO:46])在转化体中的4个中获得预期大小(520bp)的条带。使用该引物对，转化体中的一个没有给出PCR产物。

使用源自RL-P37的并具有无活性pyr4基因的里氏木霉菌株实施旨在通过靶向Cas9作用来使gla1基因失活的单独实验。使用聚乙二醇介导的程序(如下所述)，用pTrex2gHyg MoCas gTrGA TS11转化该菌株的原生质体。在具有2％葡萄糖、2mg/ml尿苷、1.1M山梨醇和100ug/ml潮霉素B的Vogel基本培养基的琼脂平板上选择转化体。在第一平板上选择后，将转化体菌落挑选到没有山梨醇的相同选择性培养基的新鲜平板上。在第二平板上的生长期间，能够区分稳定和不稳定的潮霉素抗性转化体。将这些转化体转移到没有葡萄糖并具有1％不溶性淀粉的Vogel琼脂平板上，以针对所分泌的葡糖淀粉酶的存在或不存在进行筛选。选择不分泌葡糖淀粉酶的5个稳定转化体(命名为B#1、B#2、B#4、B#5和B#6)进行进一步分析。从这些转化体中的每一个中提取基因组DNA。

使用基因组DNA作为模板和引物gla1repF和gla1repR(分别为5’-gtgtgtctaatgcctccaccac[SEQ ID NO:49]和5’-gatcgtgctagcgctgctgttg[SEQ ID NO:50])进行PCR，其从跨越TS11靶位点的野生型gla1基因座产生983bp的产物。PCR条件包括在每个PCR循环以及长的延伸时间中逐渐降低引物退火温度，以确定靶位点处是否存在大的插入。具体的PCR条件如下。

步骤1：94℃持续1分钟

步骤2：94℃持续25秒

步骤3：63℃持续30秒(每循环温度降低0.2℃)

步骤4：70℃持续8分钟

步骤2-4再重复24次

步骤5：保持在4℃

从两个转化体(B#1和B#6)获得大于12kb的明确的PCR产物，表明在跨越靶位点的DNA区域中增加了大于11kb。其他三个转化体只给出在琼脂糖凝胶电泳上显示为低强度条带的非特异性PCR产物。来自B#6的>12kb PCR产物的序列分析证明，将源自质粒pTrex2gHygMoCas gTrGA TS11的DNA插入TS11靶位点。

使用基因组DNA样品B#2、B#4、和B#5以及引物对1553R和1555F(分别为5’-CCGTGATGGAGCCCGTCTTCT[SEQ ID NO:51]和5’-CGCGGTGAGTTCAGGCTTTTTC[SEQ ID NO:52])进行PCR。引物1553R与靶位点11的3’侧的gla1基因结合。引物1555F结合在质粒pTrex2gHygMoCas gTrGA TS11上的潮霉素磷酸转移酶(hygB)基因的起始密码子附近。如上所述使用相同的PCR条件。分别获得转化体B#4和B#5的4.5kb和6.5的PCR产物。只有带有hygB基因的质粒插入到gla1基因中才能获得PCR产物。据推测，转化体B#4、和B#5中插入的质粒DNA非常大，使得不可能使用引物gla1repF和gla1repR获得PCR产物。

总之，PCR数据证明，葡糖淀粉酶失活的稳定的潮霉素抗性转化体是通过在gla1基因的靶位点处插入大区段Cas9和指导RNA表达载体而产生的。

pyr2基因的失活

通过将原生质体用质粒pTrex2gHyg MoCas的衍生物进行PEG介导的转化来产生里氏木霉菌株QM6a或RL-P37的转化体，该质粒的衍生物包括靶向里氏木霉pyr2基因内不同位置的指导RNA表达盒。该基因的失活赋予尿苷营养缺陷型和对5-氟乳清酸(FOA)的抗性。最初在包含潮霉素B的培养基上选择转化体。当转移到包含潮霉素B的新鲜琼脂平板上时，它们被评分为稳定的或不稳定的。然后将转化体转移到具有2mg/ml尿苷和1.2mg/ml FOA的Vogel基本培养基的琼脂平板上。在FOA存在下生长的能力是由于Cas9介导的pyr2基因失活而引起尿苷营养缺陷型的指示。

从一些FOA抗性潮霉素稳定和不稳定转化体中提取基因组DNA用于PCR分析。用于该分析的引物是设计用于扩增跨越靶位点的并且长度约0.8kb的pyr2基因座区域的pyr2F(5’-gtataagagcaggaggagggag[SEQ ID NO:53])和pyr2R(5’-gaacgcctcaatcagtcagtcg[SEQ ID NO:54])。

在显示为FOA抗性的QM6a转化体中，采用如下延伸时间，使用PCR方案测试18个稳定和5个不稳定的潮霉素抗性转化体，该延伸时间足以扩增假定其大小类似于野生型菌株的大小的pyr2基因座的区域。在此短延伸时间内没有一个稳定的转化体给出PCR产物，而2个不稳定转化体确实给出了PCR产物。这两个PCR产物的DNA序列分析显示出，一个具有单个核苷酸缺失，并且另一个在预期的靶位点处具有111个核苷酸的缺失。

在显示为FOA抗性的RL-P37转化体中，在短延伸时间内使用PCR方案测试4种稳定的和2种不稳定的潮霉素抗性转化体。在此短延伸时间内没有一个稳定的转化体给出PCR产物，而两个不稳定转化体都确实给出了PCR产物。这两个PCR产物的DNA序列分析显示出，一个具有单个核苷酸缺失，并且另一个在预期的靶位点处插入了134个核苷酸。该插入由pTrex2gHyg载体的两个小片段组成。

使用先前描述的PCR方案分析6种不同的稳定的潮霉素抗性RL-P37转化体，该PCR方案被设计为使得能够扩增pyr2基因座的区域，假定在pyr2基因座的靶位点处插入了大的DNA片段。在该长延伸时间方案的情况下，所有6个转化体都给出了大的PCR产物(取决于转化体，在约5kb和>12之间)。这些PCR产物中的5个的DNA序列分析显示，在所有情况下整合了pTrex2gHyg载体DNA或其片段。

总之，这些数据表明，由Cas9引起的双链断裂的修复主要涉及在稳定转化体中整合大载体片段。这可能是非常有效的基因失活方法。这也证明带有功能基因并且与靶位点无序列同源性的DNA片段或载体可以在Cas9切割和双链断裂形成之后的靶位点处以位点特异性方式整合。相比之下，在不稳定转化体中，小缺失或插入(插入缺失)与Cas9引起的基因失活有关。如果载体整合是不希望的，这是基因失活的首选方法。

实例7：使用具有端粒的表达载体表达cas9和sgRNA

构建Cas9和指导RNA表达载体pTrex2gHyg MoCAS gPyr2TS6的型式，其包含里氏木霉端粒序列(图6中所示)。将下面显示的DNA序列(SEQ ID NO:55)插入载体中。带下划线的区域包含重复的端粒序列，每个朝向该片段的中心读入。中心部分是具有启动子和终止子的细菌卡那霉素抗性基因，这使得能够在大肠杆菌中进行选择以确保维持端粒重复序列。在木霉属中，具有端粒的载体有望在每一末端用端粒序列线性化，并且应该以低拷贝数自主维持，尽管偶尔也可能整合到染色体DNA中。

tcaggaaatagctttaagtagcttattaagtattaaaattatatatatttttaatataactatatttctttaataaa taggtattttaagctttatatataaatataataataaaataatatattatatagctttttattaataaataaaatag ctaaaaatataaaaaaaatagctttaaaatacttatttttaattagaattttatatatttttaatatataagatctt ttacttttttataagcttcctaccttaaattaaatttttacttttttttactattttactatatcttaaataaaggc tttaaaaatataaaaaaaatcttcttatatattataagctataaggattatatatatatttttttttaatttttaaa gtaagtattaaagctagaattaaagttttaattttttaaggctttatttaaaaaaaggcagtaatagcttataaaag aaatttctttttcttttatactaaaagtactttttttttaataaggttagggttagggtttactcacaccgaccatc ccaaccacatcttagggttagggttagggttagggttagggttagggttagggttagggtaagggtttaaacaaagccacgttgtgtctcaaaatctctgatgttacattgcacaagataaaaatatatcatcatgaacaataaaactgtctgcttacataaacagtaatacaaggggtgttatgagccatattcaacgggaaacgtcttgctcgaggccgcgattaaattccaacatggatgctgatttatatgggtataaatgggctcgcgataatgtcgggcaatcaggtgcgacaatctatcgattgtatgggaagcccgatgcgccagagttgtttctgaaacatggcaaaggtagcgttgccaatgatgttacagatgagatggtcagactaaactggctgacggaatttatgcctcttccgaccatcaagcattttatccgtactcctgatgatgcatggttactcaccactgcgatccccgggaaaacagcattccaggtattagaagaatatcctgattcaggtgaaaatattgttgatgcgctggcagtgttcctgcgccggttgcattcgattcctgtttgtaattgtccttttaacagcgatcgcgtatttcgtctcgctcaggcgcaatcacgaatgaataacggtttggttgatgcgagtgattttgatgacgagcgtaatggctggcctgttgaacaagtctggaaagaaatgcataagcttttgccattctcaccggattcagtcgtcactcatggtgatttctcacttgataaccttatttttgacgaggggaaattaataggttgtattgatgttggacgagtcggaatcgcagaccgataccaggatcttgccatcctatggaactgcctcggtgagttttctccttcattacagaaacggctttttcaaaaatatggtattgataatcctgatatgaataaattgcagtttcatttgatgctcgatgagtttttctaatcagaattggttaattggttgtaacactggcagagcattacgctgacttgacgggacggcggctttgttgaataaatcgaacttttgctgagttgaaggatcagatcacgcatcttcccgacaacgcagaccgttccgtggcaaagcaaaagttcaaaatcaccaactggtccacctacaacaaagctctcatcaaccgtggctccctcactttctggctggatgatggggcgattcaggcctggtatgagtcagcaacaccttcttcacgaggcagacctcagcggtttaaacctaaccctaaccctaac cctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaacctaaccctaat ggggtcgatctgaaccgaggatgagggttctatagactaatctacaggccgtacatggtgtgattgcagatgcgacg ggcaaggtgtacagtgtccagaaggaggagagcggcataggtattgtaatagaccagctttacataataatcgcctg ttgctactgactgatgaccttcttccctaaccagtttcctaattaccactgcagtgaggataaccctaactcgctct ggggttattattatactgattagcaggtggcttatatagtgctgaagtactataagagtttctgcgggaggaggtgg aaggactataaactggacacagttagggatagagtgatgacaagacctgaatgttatcctccggtgtggtatagcga attggctgaccttgcagatggtaatggtttaggcagggtttttgcagagggggacgagaacgcgttctgcgatttaa cggctgctgccgccaagctttacggttctctaatgggcggccgc(SEQ ID NO:55)

通过PEG-介导的原生质体转化将该载体插入里氏木霉菌株RL-P37中。针对潮霉素抗性，选择转化体，并将其转移到具有潮霉素的新鲜琼脂平板上。大多数转化体显示出不稳定的潮霉素抗性表型。将个体、经转化的菌落转移到包含2mg/ml尿苷和1.2mg/ml 5-氟乳清酸的基本培养基琼脂平板上，以选择能够生长并因此具有Pyr-负表型的那些。142个中的八个(6％)不稳定转化体是Pyr-负的。通过PCR的pyr2基因座的分析和这些转化体中的三个的测序显示，两个在靶位点具有小的缺失(分别为1bp和27bp)，并且一个具有1bp缺失(与源自pTrex2gHyg MoCAS gPyr2TS6的细菌载体部分的68bp的插入组合)。尽管使用设计用于扩增大DNA片段的PCR条件，但其他5个转化体没有给出PCR产物[PCR条件：步骤1：94℃持续1分钟；步骤2：94℃持续25秒；步骤3：63℃持续30秒(每循环温度降低0.2℃)；步骤4：70℃持续8分钟；步骤2-4再重复24次；步骤5：保持在4℃。聚合酶：PfuUltra II融合HS DNA聚合酶(安捷伦科技公司)]。

这些结果表明Cas9和指导RNA从自主复制载体的表达使Cas9能够靶向特异性基因座(在这种情况下为pyr2)。所产生的基因失活可以在靶位点处无载体DNA插入的情况下而发生。

部分B：直接引入Cas和/或指导RNA

实例8：CRISPR SpyCas9在大肠杆菌中的异源表达

合成大肠杆菌密码子优化的化脓性链球菌Cas9(SpyCas9)基因，并将其通过捷瑞公(Generay)(上海，中国)插入到表达载体pET30a的NcoI和HindIII位点处，得到质粒pET30a-SpyCas9(图7)。如图8A中的质粒图谱所示，以5'至3'取向，表达盒的完整编码序列包含全部处于可操作连接中的编码N末端His6标签/凝血酶/S·Tag^TM/肠激酶区域的序列(SEQ ID NO:13；包括起始密码子甲硫氨酸)、编码SV40核定位信号的序列(SEQ ID NO:14)、编码SpyCas9的序列(SEQ ID NO:15)、和编码BLR核定位信号的序列(SEQ ID NO:16)。该整个编码序列示于SEQ ID NO:17中。由SEQ ID NO:13编码的N端His6标签/凝血酶/S·Tag^TM/肠激酶区域的氨基酸序列示于SEQ ID NO:18(包括位置1的甲硫氨酸)，由SEQ ID NO:14编码的SV40核定位信号的氨基酸序列示于SEQ ID NO:19，由SEQ ID NO:15编码的SpyCas9的氨基酸序列示于SEQ ID NO:1，并且由SEQ ID NO:16编码的BLR核定位信号的氨基酸序列示于SEQ ID NO:20。由SEQ ID NO:17编码的氨基酸序列示于SEQ ID NO:21。

将pET30a-SpyCas9质粒转化到Rosetta2(De3)plysS大肠杆菌菌株(EMD生物科学公司(EMD Biosciences，Inc.)，默克集团(Merck KGaA)，达姆施塔特，德国)中，并且将转化产物扩散到补充有34ppm氯霉素和50ppm的卡那霉素的卢里亚琼脂(LuriaAgar)平板上。挑取菌落并在具有25ml英杰MagicMedia^TM大肠杆菌表达培养基(赛默飞世尔科技公司(Thermo Fisher Scientific Inc.)，格兰德艾兰(Grand Island)，纽约州)的250ml摇瓶中培养24小时。

实例9：SpyCas9的纯化

为了纯化SpyCas9，应用亲和、疏水相互作用和尺寸排阻层析步骤的组合。简而言之，将表达SpyCas9的大肠杆菌细胞(Rosetta2(De3)plysS，如上所述)在具有25mlMagicMedia^TM的250ml摇瓶中培养24小时，并通过离心收获。将细胞(约40克)沉淀并重新悬浮于400ml裂解缓冲液(20mM HEPES，pH 7.5，500mM NaCl，0.1％Triton X-100，1mM DTT和1mM TCEP，购自罗氏的蛋白酶抑制剂混合物)中，并通过超声波发生器(35％功率，20min，2s开/3s关)(SCIENT2-II D，宁波新芝生物科技有限公司(Ningbo Scientz BiotechnologyCo.，LTD))进行裂解。通过在20000g下离心40min来清除裂解物。

将约400ml澄清的裂解液与5ml Ni-NTA树脂(GE医疗集团(GE Healthcare))在4℃下用旋转培养箱(其林贝尔仪器制造有限公司(Kylin-Bell Lab.Instruments Co.,Ltd.)，海门，中国)以30rpm/min在震荡下孵育过夜。离心后，将树脂转移到XK26/20柱(GE医疗集团)并连接到AKTA探测器系统(GE医疗集团)。在用平衡缓冲液(20mM HEPES，pH 7.5，300mMNaCl，0.1％Triton X-100)随后用洗涤缓冲液(平衡缓冲液中的25mM咪唑)充分洗涤后，用平衡缓冲液中的250mM咪唑洗脱靶蛋白。

向从亲和步骤收集的活性级分中添加硫酸铵至终浓度为0.8M，并将其加载到20ml苯基-琼脂糖HP柱(GE医疗集团)上。用50mM HEPES缓冲液(pH 7.5)中的0.8M至0.0M硫酸铵的梯度洗脱该柱，并收集该贯流。

最后，通过在20mM HEPES pH 7.5、150mM KCl和10％甘油中在Superdex 20016/60柱(GE医疗集团)上的尺寸排阻色谱进一步纯化蛋白质。合并具有最高纯度的级分，并通过Amicon 30KDa膜滤器(密理博公司(Millipore))浓缩。将最终的蛋白质样品储存在-20℃冷冻器中的40％甘油中直至使用。

实例10：指导RNA设计和表达载体克隆

我们使用Cas9靶标寻检器来识别可行的靶位点。在里氏木霉xyr1基因(参与木聚糖降解的转录因子木聚糖酶调节剂1(蛋白质ID 122208))以及里氏木霉的pyr4基因(乳清苷-5'-单磷酸脱羧酶(蛋白质ID 74020))的正义或反义链上鉴定出具有适当PAM位点的靶序列。使用该程序，我们鉴定了所有20个核苷酸长的靶序列，随后是与序列模式GGN18NGG或GN19NGG匹配的3核苷酸PAM序列(NGG)。使用里氏木霉基因组序列数据库(genome.jgi-psf.org/Trire2/Trire2.home)进行局部比对检索基本工具(BLAST)，以检查20-nt序列的唯一性并避免靶标效应。使用以下序列产生两个xyr1特异性靶位点(xyr1Ta和xyr1Tc)和一个pyr4特异性靶位点(pyr4TS2)的pSM1指导质粒(图8A中所示)的体外指导RNA表达构建体。显示了具有相关PAM位点的靶序列以及用于退火和克隆到BSA1限制性位点的pSM1指导质粒中的寡核苷酸：

Xyr1 Ta

(1)靶序列(5’-3’，PAM用粗体加下划线表示)：

GCAGCACCTCGCACAGCATG(SEQ ID NO:56)

(2)寡核苷酸1：TAGGCAGCACCTCGCACAGCATG(SEQ ID NO:57)

(3)寡核苷酸2：AAACCATGCTGTGCGAGGTGCT(SEQ ID NO:58)

Xyr1 Tc

(1)靶序列(5’-3’，PAM用粗体加下划线表示)：

GCTGCCAGGAAGAATTCAAC(SEQ ID NO:59)

(2)寡核苷酸1：TAGGCTGCCAGGAAGAATTCAAC(SEQ ID NO:60)

(3)寡核苷酸2：AAACGTTGAATTCTTCCTGGCA(SEQ ID NO:61)

Pyr4 TS2

(1)靶序列(5’-3’，PAM用粗体加下划线表示)：

GCTCAAGACGCACTACGACA(SEQ ID NO:62)

(2)寡核苷酸1：TAGGCTCAAGACGCACTACGACA(SEQ ID NO:63)

(3)寡核苷酸2：AAACTGTCGTAGTGCGTCTTGAGC(SEQ ID NO:64)

以下序列显示源自相应的pSM1指导质粒构建体的模板序列，用于转录三个指导RNA中的每个(即，对于以上xyr1Ta、xyr1Tc和pyr4TS2靶位点)。以下每个序列显示T7启动子(粗体)、VT结构域(以大写字母显示)、CER结构域(以小写字母显示)、和转录终止子(用粗体加下划线表示)。

Xyr1 Ta(SEQ ID NO:65)

GCAGCACCTCGCACAGCATGgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcacg

Xyr1Tc(SEQ ID NO:66)

GCTGCCAGGAAGAATTCAACgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcacg

Pyr4TS2(SEQ ID NO:67)

GCTCAAGACGCACTACGACAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcacg

实例11：体外DNA切割测定

根据制造商的说明书，使用来自赛默飞世尔科技公司(Thermo Fisher)的MEGAshortscript^TMT7转录试剂盒从Xyr1Ta和xyr1Tc的模板体外生产指导RNA。体外转录在37℃下进行至少5小时。使用来自赛默飞世尔科技公司的MEGAclear^TM转录净化试剂盒纯化转录的指导RNA。用NanoDrop^TM(赛默飞世尔科技公司)测量RNA浓度。使用变性脲-PAGE凝胶(10％)确认产生的指导RNA的质量(数据未显示)。

将纯化的Cas9蛋白质(200ng)用以下各项孵育：(1)单独300ng底物DNA(底物DNA是用NdeI线性化的质粒pXA3[图9A中所示]，pXA3包含具有20bp靶序列和两个xyr1指导RNA的适当间隔的PAM位点的xyr1基因[SEQ ID NO:89])(2)在100ng体外合成的xyr1Ta指导RNA存在下，300ng底物DNA；和(3)在100ng体外合成的xyr1Tc指导RNA存在下，300ng底物DNA。反应在NEB缓冲液3中，在20ul反应体积中，在37℃下进行1h。(1X NEB3缓冲液组分由100mMNaCl、50mM Tris-HCl、10mM MgCl2、10mM MgCl2、1mM DTT组成，pH 7.9，在25℃。)

如图9B中所示，具有纯化的SpyCas9的xyr1特异性指导RNA的每个可以成功地将底物DNA切割成预期的片段(泳道3和4)，证实合成的指导RNA/Cas9复合物的功能。泳道1示出了分子量标记；泳道2示出了在Cas9和指导RNA不存在下NdeI线性化的质粒pXA3底物；泳道3示出了在具有xyr1Ta VT结构域的Cas9和指导RNA存在下线性化质粒pXA3底物的切割；泳道4示出了在具有xyr1Tc VT结构域的Cas9和指导RNA存在下线性化质粒pXA3底物的切割；线性化质粒pXA3底物和产物的位置在右侧指示出。

实例12：指导RNA引入表达Cas9的真菌细胞

方法

(i)原生质体制备

针对原生质体制备，将5×108个所需的里氏木霉菌株的孢子接种到具有4个挡板的250ml摇瓶中的50ml发芽培养基(美国专利号8,679,815中所述的配方)中，并在27℃下以170rpm孵育17小时。通过将液体体积转移到50ml锥形管中并以3000rpm旋转10分钟来回收菌丝体。将上清液倾析，并将菌丝球用1.2M MgSO4-10mM磷酸钠缓冲液洗涤两次，并重悬于15ml裂解酶缓冲液(将来自哈茨木霉(西格玛目录号L1412)的裂解酶溶解于1.2M MgSO4-10mM磷酸钠缓冲液(pH 5.8)的)中。将细胞悬浮液转移到具有4个挡板的250ml摇瓶中，并在室温下以200rpm震荡至少2小时。通过在玻璃漏斗中折叠的Miracloth(Calbiochem货号475855)经过滤收获原生质体到格雷纳(Greiner)管中。将0.6M山梨醇-0.1M Tris-HCl缓冲液添加到过滤的原生质体的顶部。通过以4000rpm离心15分钟收集原生质体。将包含原生质体的中间相转移到新管中并添加至少等体积的1.2M山梨醇-10mM Tris-HCl缓冲液。通过以4000rpm离心5分钟收集原生质体，并用1.2M山梨醇-10mM Tris-HCl缓冲液洗涤两次。将沉淀重新悬浮于至少1ml 1.2M山梨醇-10mM Tris-HCl pH 7.5-10mM CaCl2缓冲液中，并在显微镜下计数原生质体数。使用4份1.2M山梨醇-10mM Tris-HCl-10mM CaCl2和1份25％PEG6000-50mM CaCl2-10mM Tris-HCl稀释原生质体悬浮液，直至5×108个/ml用于随后的转化。

(ii)转化

将所需的货物(例如，DNA构建体、指导RNA、Cas9/指导RNA复合物等)添加到200μL原生质体(约1×108个)中并在冰上保持30分钟。孵育后，将原生质体添加到冷却的熔融山梨醇/Vogel琼脂(基本Vogel琼脂的1.1M山梨醇)中作为基本Vogel平板的顶层(Davis etal.,(1970)Methods in Enzymology 17A,pp.79-143and Davis,Rowland,NEUROSPORA,CONTRIBUTIONS OF A MODEL ORGANISM,Oxford University Press,(2000)[Davis等人，(1970)酶学方法17A，第79-143页和Davis，Rowland，脉孢菌属，模式生物的贡献，牛津大学出版社，(2000)])。将板在30℃下孵育一周。详细步骤在美国专利号8,679,815(其通过引用并入本文)中有描述。

实验

如上所述，将具有失活的pyr2基因(编码乳清酸磷酸核糖转移酶，蛋白质ID21435)(菌株T4mpg1Δpyr2)的里氏木霉菌株的原生质体用如下DNA构建体转化，该DNA构建体包含用于Cas9的在丙酮酸激酶(pki)启动子的控制下的表达盒和用于来自里氏木霉的pyr2基因的在其天然启动子的控制下的表达盒。通过选择具有功能pyr2基因的细胞(在Vogels培养基上不补充尿苷下的生长)，鉴定了将Cas9-pyr2盒整合到基因组中并组成型表达Cas9基因的转化体。

通过上述原生质体转化方法将二十(20)ug如上所述的体外合成的Pyr4TS2指导RNA(靶位点5'GCTCAAGACGCACTACGACA3'，SEQ ID NO:92)导入表达Cas9的里氏木霉细胞中。通过测序和比对，分析来自对FOA有抗性并且需要尿苷以生长的分离菌株的pyr4基因显示在pyr4基因靶位点存在DNA序列的变化。序列变化包括若干个核苷酸(1-2个核苷酸；克隆T44-3、T44-11、T44-18、T44-19、T44-4、和T44-7)连同较大片段(68个核苷酸；克隆T44-20)的插入(图10)。这表明可以使用将指导RNA直接、瞬时引入表达Cas的真菌宿主细胞来修饰细胞基因组中所需靶位点处的DNA序列。

实例13：体内SpyCas9/指导RNA摄取实验

为了在体外形成Cas9/指导RNA复合物，将纯化的Cas9蛋白质20μg与Pyr4TS2指导RNA 20μg在20mM Hepes、100mM NaCl、5mM MgCl2、0.1mM EDTA pH 6.5(终体积为40μL)中混合，并且在室温下孵育15-30分钟，以允许复合物形成。将Cas9/指导RNA复合物如上所述转化到里氏木霉原生质体中，并在Vogel尿苷FOA平板上生长。

从该转化中分离的菌株的PCR分析示于图11A和B中。图11A显示了两个分离的菌株(P372.2和P374.1；对FOA均有抗性并且需要尿苷用于生长)的pyr4特异性PCR产物(涵盖靶位点)的琼脂糖凝胶分析。菌株P372.2(泳道2)显示了比T44.1克隆(泳道3；其相当于对照，如图11B，泳道2所示)分子量更低的PCR产物，表明pyr4基因中的大缺失。图11B显示了与图11A中相似的PCR/琼脂糖凝胶分析，并且包括P37菌株4.1、4.2、4.3、和4.4的分析(所有这些菌株都对FOA具有抗性，并且需要尿苷用于生长)。菌株4.3(泳道5)显示了比对照(C+；泳道2)分子量更低的pyr4基因的PCR产物，表明pyr4基因中的大的缺失。

源自克隆T42.2(图11A中所示)和T42.4(图11A或11B中未示出)的pyr4基因的序列分析示于图12中。注意，野生型pyr4序列是比对中的第一序列(顶部)。该分析显示了T4 2.2克隆(顶部比对)在引入的Cas9/指导RNA复合物的靶位点处具有611个碱基对的缺失。将对应于指导RNA的VT结构域序列的序列框出，并且将PAM位点圈出。底部比对显示了在分离的T4 2.4菌株的靶位点处的pyr4基因中的1个碱基对插入(“G”残基)。在比对上方将对应于指导RNA的VT结构域序列的序列用一条线指示出，并且将PAM位点圈出。

图13显示了源自克隆P37 4.1和4.2(顶部比对)，4.3(底部比对)和4.4(中间比对)的pyr4基因的序列分析(其在图11B中示出)。野生型pyr4序列是所有比对的第一序列(顶部)，并且在所有比对的底部显示共有序列。顶部比对显示了P37 4.1克隆(比对的第三序列)具有T核苷酸的插入，而P37 4.2克隆(比对中的第二序列)在pyr4基因的靶位点处具有G核苷酸的插入。中间比对显示了P37 4.4克隆(比对的第二序列)在pyr4基因的靶位点处具有A核苷酸的缺失。底部比对显示了P37 4.3克隆(比对的第二序列)中的pyr4基因序列在靶位点处突然发散。进一步的比对分析(未显示)证实P37 4.3克隆在引入的Cas9/指导RNA复合物的靶位点处具有988个碱基对的缺失。

这表明可以使用将Cas9/指导RNA复合物直接、瞬时引入真菌宿主细胞来修饰细胞基因组中所需靶位点处的DNA序列。

虽然前述组合物和方法已经通过说明和实例的方式出于清楚理解的目的在一些细节方面进行了描述，但是对于本领域的普通技术人员而言根据本文的传授内容显而易见的是可以对其进行某些改变和修改而不偏离所附权利要求的精神或范围。

因此，前面仅仅举例说明了本发明组合物和方法的原理。将了解的是本领域技术人员将能够设计不同的安排，这些不同的安排虽然没有在此明确地描述或显示，但体现本发明组合物和方法的原理并且被包括在其精神和范围之内。此外，本文叙述的所有实例和条件性语言主要旨在帮助读者理解诸位发明人所贡献的本发明的组合物和方法的原理和概念以推动本领域发展，并且将被视为而不限于这些具体叙述的实例和条件。此外，本文中叙述本发明组合物和方法的原理、方面、以及实施例的所有陈述连同其具体实例旨在涵盖其结构和功能等效物两者。另外，预期此类等效物包括当前已知的等效物以及将来开发的等效物两者，即不论结构如何而执行相同功能的任何开发的要素。因此，本发明的组合物和方法的范围不是旨在受限于本文显示和描述的示例性实施例。

序列：

SEQ ID NO:1

化脓性链球菌Cas9，无NLS(由SEQ ID NO:8和SEQ ID NO:15所编码)

MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

SEQ ID NO:2

嗜热链球菌LMD-9Cas9

MTKPYSIGLDIGTNSVGWAVTTDNYKVPSKKMKVLGNTSKKYIKKNLLGVLLFDSGITAEGRRLKRTARRRYTRRRNRILYLQEIFSTEMATLDDAFFQRLDDSFLVPDDKRDSKYPIFGNLVEEKAYHDEFPTIYHLRKYLADSTKKADLRLVYLALAHMIKYRGHFLIEGEFNSKNNDIQKNFQDFLDTYNAIFESDLSLENSKQLEEIVKDKISKLEKKDRILKLFPGEKNSGIFSEFLKLIVGNQADFRKCFNLDEKASLHFSKESYDEDLETLLGYIGDDYSDVFLKAKKLYDAILLSGFLTVTDNETEAPLSSAMIKRYNEHKEDLALLKEYIRNISLKTYNEVFKDDTKNGYAGYIDGKTNQEDFYVYLKKLLAEFEGADYFLEKIDREDFLRKQRTFDNGSIPYQIHLQEMRAILDKQAKFYPFLAKNKERIEKILTFRIPYYVGPLARGNSDFAWSIRKRNEKITPWNFEDVIDKESSAEAFINRMTSFDLYLPEEKVLPKHSLLYETFNVYNELTKVRFIAESMRDYQFLDSKQKKDIVRLYFKDKRKVTDKDIIEYLHAIYGYDGIELKGIEKQFNSSLSTYHDLLNIINDKEFLDDSSNEAIIEEIIHTLTIFEDREMIKQRLSKFENIFDKSVLKKLSRRHYTGWGKLSAKLINGIRDEKSGNTILDYLIDDGISNRNFMQLIHDDALSFKKKIQKAQIIGDEDKGNIKEVVKSLPGSPAIKKGILQSIKIVDELVKVMGGRKPESIVVEMARENQYTNQGKSNSQQRLKRLEKSLKELGSKILKENIPAKLSKIDNNALQNDRLYLYYLQNGKDMYTGDDLDIDRLSNYDIDHIIPQAFLKDNSIDNKVLVSSASNRGKSDDVPSLEVVKKRKTFWYQLLKSKLISQRKFDNLTKAERGGLSPEDKAGFIQRQLVETRQITKHVARLLDEKFNNKKDENNRAVRTVKIITLKSTLVSQFRKDFELYKVREINDFHHAHDAYLNAVVASALLKKYPKLEPEFVYGDYPKYNSFRERKSATEKVYFYSNIMNIFKKSISLADGRVIERPLIEVNEETGESVWNKESDLATVRRVLSYPQVNVVKKVEEQNHGLDRGKPKGLFNANLSSKPKPNSNENLVGAKEYLDPKKYGGYAGISNSFTVLVKGTIEKGAKKKITNVLEFQGISILDRINYRKDKLNFLLEKGYKDIELIIELPKYSLFELSDGSRRMLASILSTNNKRGEIHKGNQIFLSQKFVKLLYHAKRISNTINENHRKYVENHKKEFEELFYYILEFNENYVGAKKNGKLLNSAFQSWQNHSIDELCSSFIGPTGSERKGLFELTSRGSAADFEFLGVKIPRYRDYTPSSLLKDATLIHQSVTGLYETRIDLAKLGEG

SEQ ID NO:3

变异链球菌UA159Cas9

MKKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKSHIEKNLLGALLFDSGNTAEDRRLKRTARRRYTRRRNRILYLQEIFSEEMGKVDDSFFHRLEDSFLVTEDKRGERHPIFGNLEEEVKYHENFPTIYHLRQYLADNPEKVDLRLVYLALAHIIKFRGHFLIEGKFDTRNNDVQRLFQEFLAVYDNTFENSSLQEQNVQVEEILTDKISKSAKKDRVLKLFPNEKSNGRFAEFLKLIVGNQADFKKHFELEEKAPLQFSKDTYEEELEVLLAQIGDNYAELFLSAKKLYDSILLSGILTVTDVGTKAPLSASMIQRYNEHQMDLAQLKQFIRQKLSDKYNEVFSDVSKDGYAGYIDGKTNQEAFYKYLKGLLNKIEGSGYFLDKIEREDFLRKQRTFDNGSIPHQIHLQEMRAIIRRQAEFYPFLADNQDRIEKLLTFRIPYYVGPLARGKSDFAWLSRKSADKITPWNFDEIVDKESSAEAFINRMTNYDLYLPNQKVLPKHSLLYEKFTVYNELTKVKYKTEQGKTAFFDANMKQEIFDGVFKVYRKVTKDKLMDFLEKEFDEFRIVDLTGLDKENKVFNASYGTYHDLCKILDKDFLDNSKNEKILEDIVLTLTLFEDREMIRKRLENYSDLLTKEQVKKLERRHYTGWGRLSAELIHGIRNKESRKTILDYLIDDGNSNRNFMQLINDDALSFKEEIAKAQVIGETDNLNQVVSDIAGSPAIKKGILQSLKIVDELVKIMGHQPENIVVEMARENQFTNQGRRNSQQRLKGLTDSIKEFGSQILKEHPVENSQLQNDRLFLYYLQNGRDMYTGEELDIDYLSQYDIDHIIPQAFIKDNSIDNRVLTSSKENRGKSDDVPSKDVVRKMKSYWSKLLSAKLITQRKFDNLTKAERGGLTDDDKAGFIKRQLVETRQITKHVARILDERFNTETDENNKKIRQVKIVTLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVIGKALLGVYPQLEPEFVYGDYPHFHGHKENKATAKKFFYSNIMNFFKKDDVRTDKNGEIIWKKDEHISNIKKVLSYPQVNIVKKVEEQTGGFSKESILPKGNSDKLIPRKTKKFYWDTKKYGGFDSPIVAYSILVIADIEKGKSKKLKTVKALVGVTIMEKMTFERDPVAFLERKGYRNVQEENIIKLPKYSLFKLENGRKRLLASARELQKGNEIVLPNHLGTLLYHAKNIHKVDEPKHLDYVDKHKDEFKELLDVVSNFSKKYTLAEGNLEKIKELYAQNNGEDLKELASSFINLLTFTAIGAPATFKFFDKNIDRKRYTSTTEILNATLIHQSITGLYETRIDLNKLGGD

SEQ ID NO:4

空肠弯曲杆菌Cas9

MARILAFDIGISSIGWAFSENDELKDCGVRIFTKVENPKTGESLALPRRLARSARKRLARRKARLNHLKHLIANEFKLNYEDYQSFDESLAKAYKGSLISPYELRFRALNELLSKQDFARVILHIAKRRGYDDIKNSDDKEKGAILKAIKQNEEKLANYQSVGEYLYKEYFQKFKENSKEFTNVRNKKESYERCIAQSFLKDELKLIFKKQREFGFSFSKKFEEEVLSVAFYKRALKDFSHLVGNCSFFTDEKRAPKNSPLAFMFVALTRIINLLNNLKNTEGILYTKDDLNALLNEVLKNGTLTYKQTKKLLGLSDDYEFKGEKGTYFIEFKKYKEFIKALGEHNLSQDDLNEIAKDITLIKDEIKLKKALAKYDLNQNQIDSLSKLEFKDHLNISFKALKLVTPLMLEGKKYDEACNELNLKVAINEDKKDFLPAFNETYYKDEVTNPVVLRAIKEYRKVLNALLKKYGKVHKINIELAREVGKNHSQRAKIEKEQNENYKAKKDAELECEKLGLKINSKNILKLRLFKEQKEFCAYSGEKIKISDLQDEKMLEIDHIYPYSRSFDDSYMNKVLVFTKQNQEKLNQTPFEAFGNDSAKWQKIEVLAKNLPTKKQKRILDKNYKDKEQKNFKDRNLNDTRYIARLVLNYTKDYLDFLPLSDDENTKLNDTQKGSKVHVEAKSGMLTSALRHTWGFSAKDRNNHLHHAIDAVIIAYANNSIVKAFSDFKKEQESNSAELYAKKISELDYKNKRKFFEPFSGFRQKVLDKIDEIFVSKPERKKPSGALHEETFRKEEEFYQSYGGKEGVLKALELGKIRKVNGKIVKNGDMFRVDIFKHKKTNKFYAVPIYTMDFALKVLPNKAVARSKKGEIKDWILMDENYEFCFSLYKDSLILIQTKDMQEPEFVYYNAFTSSTVSLIVSKHDNKFETLSKNQKILFKNANEKEVIAKSIGIQNLKVFEKYIVSALGEVTKAEFRQREDFKK

SEQ ID NO:5

脑膜炎奈瑟球菌Cas9

MAAFKPNSINYILGLDIGIASVGWAMVEIDEEENPIRLIDLGVRVFERAEVPKTGDSLAMARRLARSVRRLTRRRAHRLLRTRRLLKREGVLQAANFDENGLIKSLPNTPWQLRAAALDRKLTPLEWSAVLLHLIKHRGYLSQRKNEGETADKELGALLKGVAGNAHALQTGDFRTPAELALNKFEKESGHIRNQRSDYSHTFSRKDLQAELILLFEKQKEFGNPHVSGGLKEGIETLLMTQRPALSGDAVQKMLGHCTFEPAEPKAAKNTYTAERFIWLTKLNNLRILEQGSERPLTDTERATLMDEPYRKSKLTYAQARKLLGLEDTAFFKGLRYGKDNAEASTLMEMKAYHAISRALEKEGLKDKKSPLNLSPELQDEIGTAFSLFKTDEDITGRLKDRIQPEILEALLKHISFDKFVQISLKALRRIVPLMEQGKRYDEACAEIYGDHYGKKNTEEKIYLPPIPADEIRNPVVLRALSQARKVINGVVRRYGSPARIHIETAREVGKSFKDRKEIEKRQEENRKDREKAAAKFREYFPNFVGEPKSKDILKLRLYEQQHGKCLYSGKEINLGRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLGSENQNKGNQTPYEYFNGKDNSREWQEFKARVETSRFPRSKKQRILLQKFDEDGFKERNLNDTRYVNRFLCQFVADRMRLTGKGKKRVFASNGQITNLLRGFWGLRKVRAENDRHHALDAVVVACSTVAMQQKITRFVRYKEMNAFDGKTIDKETGEVLHQKTHFPQPWEFFAQEVMIRVFGKPDGKPEFEEADTLEKLRTLLAEKLSSRPEAVHEYVTPLFVSRAPNRKMSGQGHMETVKSAKRLDEGVSVLRVPLTQLKLKDLEKMVNREREPKLYEALKARLEAHKDDPAKAFAEPFYKYDKAGNRTQQVKAVRVEQVQKTGVWVRNHNGIADNATMVRVDVFEKGDKYYLVPIYSWQVAKGILPDRAVVQGKDEEDWQLIDDSFNFKFSLHPNDLVEVITKKARMFGYFASCHRGTGNINIRIHDLDHKIGKNGILEGIGVKTALSFQKYQIDELGKEIRPCRLKKRPPVR

SEQ ID NO:6

土拉弗朗西斯菌新凶手亚种Cas9

MNFKILPIAIDLGVKNTGVFSAFYQKGTSLERLDNKNGKVYELSKDSYTLLMNNRTARRHQRRGIDRKQLVKRLFKLIWTEQLNLEWDKDTQQAISFLFNRRGFSFITDGYSPEYLNIVPEQVKAILMDIFDDYNGEDDLDSYLKLATEQESKISEIYNKLMQKILEFKLMKLCTDIKDDKVSTKTLKEITSYEFELLADYLANYSESLKTQKFSYTDKQGNLKELSYYHHDKYNIQEFLKRHATINDRILDTLLTDDLDIWNFNFEKFDFDKNEEKLQNQEDKDHIQAHLHHFVFAVNKIKSEMASGGRHRSQYFQEITNVLDENNHQEGYLKNFCENLHNKKYSNLSVKNLVNLIGNLSNLELKPLRKYFNDKIHAKADHWDEQKFTETYCHWILGEWRVGVKDQDKKDGAKYSYKDLCNELKQKVTKAGLVDFLLELDPCRTIPPYLDNNNRKPPKCQSLILNPKFLDNQYPNWQQYLQELKKLQSIQNYLDSFETDLKVLKSSKDQPYFVEYKSSNQQIASGQRDYKDLDARILQFIFDRVKASDELLLNEIYFQAKKLKQKASSELEKLESSKKLDEVIANSQLSQILKSQHTNGIFEQGTFLHLVCKYYKQRQRARDSRLYIMPEYRYDKKLHKYNNTGRFDDDNQLLTYCNHKPRQKRYQLLNDLAGVLQVSPNFLKDKIGSDDDLFISKWLVEHIRGFKKACEDSLKIQKDNRGLLNHKINIARNTKGKCEKEIFNLICKIEGSEDKKGNYKHGLAYELGVLLFGEPNEASKPEFDRKIKKFNSIYSFAQIQQIAFAERKGNANTCAVCSADNAHRMQQIKITEPVEDNKDKIILSAKAQRLPAIPTRIVDGAVKKMATILAKNIVDDNWQNIKQVLSAKHQLHIPIITESNAFEFEPALADVKGKSLKDRRKKALERISPENIFKDKNNRIKEFAKGISAYSGANLTDGDFDGAKEELDHIIPRSHKKYGTLNDEANLICVTRGDNKNKGNRIFCLRDLADNYKLKQFETTDDLEIEKKIADTIWDANKKDFKFGNYRSFINLTPQEQKAFRHALFLADENPIKQAVIRAINNRNRTFVNGTQRYFAEVLANNIYLRAKKENLNTDKISFDYFGIPTIGNGRGIAEIRQLYEKVDSDIQAYAKGDKPQASYSHLIDAMLAFCIAADEHRNDGSIGLEIDKNYSLYPLDKNTGEVFTKDIFSQIKITDNEFSDKKLVRKKAIEGFNTHRQMTRDGIYAENYLPILIHKELNEVRKGYTWKNSEEIKIFKGKKYDIQQLNNLVYCLKFVDKPISIDIQISTLEELRNILTTNNIAATAEYYYINLKTQKLHEYYIENYNTALGYKKYSKEMEFLRSLAYRSERVKIKSIDDVKQVLDKDSNFIIGKITLPFKKEWQRLYREWQNTTIKDDYEFLKSFFNVKSITKLHKKVRKDFSLPISTNEGKFLVKRKTWDNNFIYQILNDSDSRADGTKPFIPAFDISKNEIVEAIIDSFTSKNIFWLPKNIELQKVDNKNIFAIDTSKWFEVETPSDLRDIGIATIQYKIDNNSRPKVRVKLDYVIDDDSKINYFMNHSLLKSRYPDKVLEILKQSTIIEFESSGFNKTIKEMLGMKLAGIYNETSNN

SEQ ID NO:7

多杀巴斯德菌Cas9

MQTTNLSYILGLDLGIASVGWAVVEINENEDPIGLIDVGVRIFERAEVPKTGESLALSRRLARSTRRLIRRRAHRLLLAKRFLKREGILSTIDLEKGLPNQAWELRVAGLERRLSAIEWGAVLLHLIKHRGYLSKRKNESQTNNKELGALLSGVAQNHQLLQSDDYRTPAELALKKFAKEEGHIRNQRGAYTHTFNRLDLLAELNLLFAQQHQFGNPHCKEHIQQYMTELLMWQKPALSGEAILKMLGKCTHEKNEFKAAKHTYSAERFVWLTKLNNLRILEDGAERALNEEERQLLINHPYEKSKLTYAQVRKLLGLSEQAIFKHLRYSKENAESATFMELKAWHAIRKALENQGLKDTWQDLAKKPDLLDEIGTAFSLYKTDEDIQQYLTNKVPNSVINALLVSLNFDKFIELSLKSLRKILPLMEQGKRYDQACREIYGHHYGEANQKTSQLLPAIPAQEIRNPVVLRTLSQARKVINAIIRQYGSPARVHIETGRELGKSFKERREIQKQQEDNRTKRESAVQKFKELFSDFSSEPKSKDILKFRLYEQQHGKCLYSGKEINIHRLNEKGYVEIDHALPFSRTWDDSFNNKVLVLASENQNKGNQTPYEWLQGKINSERWKNFVALVLGSQCSAAKKQRLLTQVIDDNKFIDRNLNDTRYIARFLSNYIQENLLLVGKNKKNVFTPNGQITALLRSRWGLIKARENNNRHHALDAIVVACATPSMQQKITRFIRFKEVHPYKIENRYEMVDQESGEIISPHFPEPWAYFRQEVNIRVFDNHPDTVLKEMLPDRPQANHQFVQPLFVSRAPTRKMSGQGHMETIKSAKRLAEGISVLRIPLTQLKPNLLENMVNKEREPALYAGLKARLAEFNQDPAKAFATPFYKQGGQQVKAIRVEQVQKSGVLVRENNGVADNASIVRTDVFIKNNKFFLVPIYTWQVAKGILPNKAIVAHKNEDEWEEMDEGAKFKFSLFPNDLVELKTKKEYFFGYYIGLDRATGNISLKEHDGEISKGKDGVYRVGVKLALSFEKYQVDELGKNRQICRPQQRQPVR

SEQ ID NO:8

丝状真菌细胞密码子优化的化脓性链球菌Cas9编码基因；无NLS

atggacaagaagtacagcatcggcctcgacatcggcaccaactcggtgggctgggccgtcatcacggacgaatataaggtcccgtcgaagaagttcaaggtcctcggcaatacagaccgccacagcatcaagaaaaacttgatcggcgccctcctgttcgatagcggcgagaccgcggaggcgaccaggctcaagaggaccgccaggagacggtacactaggcgcaagaacaggatctgctacctgcaggagatcttcagcaacgagatggcgaaggtggacgactccttcttccaccgcctggaggaatcattcctggtggaggaggacaagaagcatgagcggcacccaatcttcggcaacatcgtcgacgaggtggcctaccacgagaagtacccgacaatctaccacctccggaagaaactggtggacagcacagacaaggcggacctccggctcatctaccttgccctcgcgcatatgatcaagttccgcggccacttcctcatcgagggcgacctgaacccggacaactccgacgtggacaagctgttcatccagctcgtgcagacgtacaatcaactgttcgaggagaaccccataaacgctagcggcgtggacgccaaggccatcctctcggccaggctctcgaaatcaagaaggctggagaaccttatcgcgcagttgccaggcgaaaagaagaacggcctcttcggcaaccttattgcgctcagcctcggcctgacgccgaacttcaaatcaaacttcgacctcgcggaggacgccaagctccagctctcaaaggacacctacgacgacgacctcgacaacctcctggcccagataggagaccagtacgcggacctcttcctcgccgccaagaacctctccgacgctatcctgctcagcgacatccttcgggtcaacaccgaaattaccaaggcaccgctgtccgccagcatgattaaacgctacgacgagcaccatcaggacctcacgctgctcaaggcactcgtccgccagcagctccccgagaagtacaaggagatcttcttcgaccaatcaaaaaacggctacgcgggatatatcgacggcggtgccagccaggaagagttctacaagttcatcaaaccaatcctggagaagatggacggcaccgaggagttgctggtcaagctcaacagggaggacctcctcaggaagcagaggaccttcgacaacggctccatcccgcatcagatccacctgggcgaactgcatgccatcctgcggcgccaggaggacttctacccgttcctgaaggataaccgggagaagatcgagaagatcttgacgttccgcatcccatactacgtgggcccgctggctcgcggcaactcccggttcgcctggatgacccggaagtcggaggagaccatcacaccctggaactttgaggaggtggtcgataagggcgctagcgctcagagcttcatcgagcgcatgaccaacttcgataaaaacctgcccaatgaaaaagtcctccccaagcactcgctgctctacgagtacttcaccgtgtacaacgagctcaccaaggtcaaatacgtcaccgagggcatgcggaagccggcgttcctgagcggcgagcagaagaaggcgatagtggacctcctcttcaagaccaacaggaaggtgaccgtgaagcaattaaaagaggactacttcaagaaaatagagtgcttcgactccgtggagatctcgggcgtggaggatcggttcaacgcctcactcggcacgtatcacgacctcctcaagatcattaaagacaaggacttcctcgacaacgaggagaacgaggacatcctcgaggacatcgtcctcaccctgaccctgttcgaggaccgcgaaatgatcgaggagaggctgaagacctacgcgcacctgttcgacgacaaggtcatgaaacagctcaagaggcgccgctacactggttggggaaggctgtcccgcaagctcattaatggcatcagggacaagcagagcggcaagaccatcctggacttcctcaagtccgacgggttcgccaaccgcaacttcatgcagctcattcacgacgactcgctcacgttcaaggaagacatccagaaggcacaggtgagcgggcagggtgactccctccacgaacacatcgccaacctggccggctcgccggccattaaaaagggcatcctgcagacggtcaaggtcgtcgacgagctcgtgaaggtgatgggccggcacaagcccgaaaatatcgtcatagagatggccagggagaaccagaccacccaaaaagggcagaagaactcgcgcgagcggatgaaacggatcgaggagggcattaaagagctcgggtcccagatcctgaaggagcaccccgtggaaaatacccagctccagaatgaaaagctctacctctactacctgcagaacggccgcgacatgtacgtggaccaggagctggacattaatcggctatcggactacgacgtcgaccacatcgtgccgcagtcgttcctcaaggacgatagcatcgacaacaaggtgctcacccggtcggataaaaatcggggcaagagcgacaacgtgcccagcgaggaggtcgtgaagaagatgaaaaactactggcgccagctcctcaacgcgaaactgatcacccagcgcaagttcgacaacctgacgaaggcggaacgcggtggcttgagcgaactcgataaggcgggcttcataaaaaggcagctggtcgagacgcgccagatcacgaagcatgtcgcccagatcctggacagccgcatgaatactaagtacgatgaaaacgacaagctgatccgggaggtgaaggtgatcacgctgaagtccaagctcgtgtcggacttccgcaaggacttccagttctacaaggtccgcgagatcaacaactaccaccacgcccacgacgcctacctgaatgcggtggtcgggaccgccctgatcaagaagtacccgaagctggagtcggagttcgtgtacggcgactacaaggtctacgacgtgcgcaaaatgatcgccaagtccgagcaggagatcggcaaggccacggcaaaatacttcttctactcgaacatcatgaacttcttcaagaccgagatcaccctcgcgaacggcgagatccgcaagcgcccgctcatcgaaaccaacggcgagacgggcgagatcgtctgggataagggccgggatttcgcgacggtccgcaaggtgctctccatgccgcaagtcaatatcgtgaaaaagacggaggtccagacgggcgggttcagcaaggagtccatcctcccgaagcgcaactccgacaagctcatcgcgaggaagaaggattgggacccgaaaaaatatggcggcttcgacagcccgaccgtcgcatacagcgtcctcgtcgtggcgaaggtggagaagggcaagtcaaagaagctcaagtccgtgaaggagctgctcgggatcacgattatggagcggtcctccttcgagaagaacccgatcgacttcctagaggccaagggatataaggaggtcaagaaggacctgattattaaactgccgaagtactcgctcttcgagctggaaaacggccgcaagaggatgctcgcctccgcaggcgagttgcagaagggcaacgagctcgccctcccgagcaaatacgtcaatttcctgtacctcgctagccactatgaaaagctcaagggcagcccggaggacaacgagcagaagcagctcttcgtggagcagcacaagcattacctggacgagatcatcgagcagatcagcgagttctcgaagcgggtgatcctcgccgacgcgaacctggacaaggtgctgtcggcatataacaagcaccgcgacaaaccaatacgcgagcaggccgaaaatatcatccacctcttcaccctcaccaacctcggcgctccggcagccttcaagtacttcgacaccacgattgaccggaagcggtacacgagcacgaaggaggtgctcgatgcgacgctgatccaccagagcatcacagggctctatgaaacacgcatcgacctgagccagctgggcggagac

SEQ ID NO:9

丝状真菌细胞密码子优化的化脓性链球菌Cas9编码基因；具有N-和C-末端NLS序列

SEQ ID NO:10

具有N-和C-末端NLS序列的化脓性链球菌Cas9(由SEQ ID NO:9编码)

MAPKKKRKVMDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDKKKKLKL

SEQ ID NO:11

全U6基因启动子序列(不包括转录起始位点)

AAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATC

SEQ ID NO:12

截短/较短U6基因启动子序列(不包括转录起始位点)

AATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATC

SEQ ID NO:13

N末端His6标签/凝血酶/S·Tag^TM/肠激酶区域多核苷酸序列(具有起始密码子)；编码SEQ ID NO:18

atgcaccatcatcatcatcattcttctggtctggtgccacgcggttctggtatgaaagaaaccgctgctgctaaattcgaacgccagcacatggacagcccagatctgggtaccgacgacgacgacaaggccatggcc

SEQ ID NO:14

SV40NLS编码序列(编码SEQ ID NO:19)

ccaaaaaagaaacgcaaggtt

SEQ ID NO:15

大肠杆菌密码子优化的Cas9基因(无终止密码子)

atggataaaaaatacagcattggtctggatatcggaaccaacagcgttgggtgggcagtaataacagatgaatacaaagtgccgtcaaaaaaatttaaggttctggggaatacagatcgccacagcataaaaaagaatctgattggggcattgctgtttgattcgggtgagacagctgaggccacgcgtctgaaacgtacagcaagaagacgttacacacgtcgtaaaaatcgtatttgctacttacaggaaattttttctaacgaaatggccaaggtagatgatagtttcttccatcgtctcgaagaatcttttctggttgaggaagataaaaaacacgaacgtcaccctatctttggcaatatcgtggatgaagtggcctatcatgaaaaataccctacgatttatcatcttcgcaagaagttggttgatagtacggacaaagcggatctgcgtttaatctatcttgcgttagcgcacatgatcaaatttcgtggtcatttcttaattgaaggtgatctgaatcctgataactctgatgtggacaaattgtttatacaattagtgcaaacctataatcagctgttcgaggaaaaccccattaatgcctctggagttgatgccaaagcgattttaagcgcgagactttctaagtcccggcgtctggagaatctgatcgcccagttaccaggggaaaagaaaaatggtctgtttggtaatctgattgccctcagtctggggcttaccccgaacttcaaatccaattttgacctggctgaggacgcaaagctgcagctgagcaaagatacttatgatgatgacctcgacaatctgctcgcccagattggtgaccaatatgcggatctgtttctggcagcgaagaatctttcggatgctatcttgctgtcggatattctgcgtgttaataccgaaatcaccaaagcgcctctgtctgcaagtatgatcaagagatacgacgagcaccaccaggacctgactcttcttaaggcactggtacgccaacagcttccggagaaatacaaagaaatattcttcgaccagtccaagaatggttacgcgggctacatcgatggtggtgcatcacaggaagagttctataaatttattaaaccaatccttgagaaaatggatggcacggaagagttacttgttaaacttaaccgcgaagacttgcttagaaagcaacgtacattcgacaacggctccatcccacaccagattcatttaggtgaacttcacgccatcttgcgcagacaagaagatttctatcccttcttaaaagacaatcgggagaaaatcgagaagatcctgacgttccgcattccctattatgtcggtcccctggcacgtggtaattctcggtttgcctggatgacgcgcaaaagtgaggaaaccatcaccccttggaactttgaagaagtcgtggataaaggtgctagcgcgcagtcttttatagaaagaatgacgaacttcgataaaaacttgcccaacgaaaaagtcctgcccaagcactctcttttatatgagtactttactgtgtacaacgaactgactaaagtgaaatacgttacggaaggtatgcgcaaacctgcctttcttagtggcgagcagaaaaaagcaattgtcgatcttctctttaaaacgaatcgcaaggtaactgtaaaacagctgaaggaagattatttcaaaaagatcgaatgctttgattctgtcgagatctcgggtgtcgaagatcgtttcaacgcttccttagggacctatcatgatttgctgaagataataaaagacaaagactttctcgacaatgaagaaaatgaagatattctggaggatattgttttgaccttgaccttattcgaagatagagagatgatcgaggagcgcttaaaaacctatgcccacctgtttgatgacaaagtcatgaagcaattaaagcgccgcagatatacggggtggggccgcttgagccgcaagttgattaacggtattagagacaagcagagcggaaaaactatcctggatttcctcaaatctgacggatttgcgaaccgcaattttatgcagcttatacatgatgattcgcttacattcaaagaggatattcagaaggctcaggtgtctgggcaaggtgattcactccacgaacatatagcaaatttggccggctctcctgcgattaagaaggggatcctgcaaacagttaaagttgtggatgaacttgtaaaagtaatgggccgccacaagccggagaatatcgtgatagaaatggcgcgcgagaatcaaacgacacaaaaaggtcaaaagaactcaagagagagaatgaagcgcattgaggaggggataaaggaacttggatctcaaattctgaaagaacatccagttgaaaacactcagctgcaaaatgaaaaattgtacctgtactacctgcagaatggaagagacatgtacgtggatcaggaattggatatcaatagactctcggactatgacgtagatcacattgtccctcagagcttcctcaaggatgattctatagataataaagtacttacgagatcggacaaaaatcgcggtaaatcggataacgtcccatcggaggaagtcgttaaaaagatgaaaaactattggcgtcaactgctgaacgccaagctgatcacacagcgtaagtttgataatctgactaaagccgaacgcggtggtcttagtgaactcgataaagcaggatttataaaacggcagttagtagaaacgcgccaaattacgaaacacgtggctcagatcctcgattctagaatgaatacaaagtacgatgaaaacgataaactgatccgtgaagtaaaagtcattaccttaaaatctaaacttgtgtccgatttccgcaaagattttcagttttacaaggtccgggaaatcaataactatcaccatgcacatgatgcatatttaaatgcggttgtaggcacggcccttattaagaaataccctaaactcgaaagtgagtttgtttatggggattataaagtgtatgacgttcgcaaaatgatcgcgaaatcagaacaggaaatcggtaaggctaccgctaaatactttttttattccaacattatgaatttttttaagaccgaaataactctcgcgaatggtgaaatccgtaaacggcctcttatagaaaccaatggtgaaacgggagaaatcgtttgggataaaggtcgtgactttgccaccgttcgtaaagtcctctcaatgccgcaagttaacattgtcaagaagacggaagttcaaacagggggattctccaaagaatctatcctgccgaagcgtaacagtgataaacttattgccagaaaaaaagattgggatccaaaaaaatacggaggctttgattcccctaccgtcgcgtatagtgtgctggtggttgctaaagtcgagaaagggaaaagcaagaaattgaaatcagttaaagaactgctgggtattacaattatggaaagatcgtcctttgagaaaaatccgatcgactttttagaggccaaggggtataaggaagtgaaaaaagatctcatcatcaaattaccgaagtatagtctttttgagctggaaaacggcagaaaaagaatgctggcctccgcgggcgagttacagaagggaaatgagctggcgctgccttccaaatatgttaattttctgtaccttgccagtcattatgagaaactgaagggcagccccgaagataacgaacagaaacaattattcgtggaacagcataagcactatttagatgaaattatagagcaaattagtgaattttctaagcgcgttatcctcgcggatgctaatttagacaaagtactgtcagcttataataaacatcgggataagccgattagagaacaggccgaaaatatcattcatttgtttaccttaaccaaccttggagcaccagctgccttcaaatatttcgataccacaattgatcgtaaacggtatacaagtacaaaagaagtcttggacgcaaccctcattcatcaatctattactggattatatgagacacgcattgatctttcacagctgggcggagac

SEQ ID NO:16

BLR2核定位信号编码序列(编码SEQ ID NO:20)

aagaagaaaaaactgaaactg

SEQ ID NO:17

质粒pET30a-SpyCas9中SpyCas9合成基因的核苷酸序列。编码N末端His6标签、SV40核定位信号、和BLR核定位信号的寡核苷酸分别以粗体加下划线，斜体加下划线和下划线显示。

atgtcttctggtctggtgccacgcggttctggtatgaaagaaaccgctgctgctaaattcgaacgccagcacatggacagcccagatctgggtaccgacgacgacgacaaggccatggcc atggataaaaaatacagcattggtctggatatcggaaccaacagcgttgggtgggcagtaataacagatgaatacaaagtgccgtcaaaaaaatttaaggttctggggaatacagatcgccacagcataaaaaagaatctgattggggcattgctgtttgattcgggtgagacagctgaggccacgcgtctgaaacgtacagcaagaagacgttacacacgtcgtaaaaatcgtatttgctacttacaggaaattttttctaacgaaatggccaaggtagatgatagtttcttccatcgtctcgaagaatcttttctggttgaggaagataaaaaacacgaacgtcaccctatctttggcaatatcgtggatgaagtggcctatcatgaaaaataccctacgatttatcatcttcgcaagaagttggttgatagtacggacaaagcggatctgcgtttaatctatcttgcgttagcgcacatgatcaaatttcgtggtcatttcttaattgaaggtgatctgaatcctgataactctgatgtggacaaattgtttatacaattagtgcaaacctataatcagctgttcgaggaaaaccccattaatgcctctggagttgatgccaaagcgattttaagcgcgagactttctaagtcccggcgtctggagaatctgatcgcccagttaccaggggaaaagaaaaatggtctgtttggtaatctgattgccctcagtctggggcttaccccgaacttcaaatccaattttgacctggctgaggacgcaaagctgcagctgagcaaagatacttatgatgatgacctcgacaatctgctcgcccagattggtgaccaatatgcggatctgtttctggcagcgaagaatctttcggatgctatcttgctgtcggatattctgcgtgttaataccgaaatcaccaaagcgcctctgtctgcaagtatgatcaagagatacgacgagcaccaccaggacctgactcttcttaaggcactggtacgccaacagcttccggagaaatacaaagaaatattcttcgaccagtccaagaatggttacgcgggctacatcgatggtggtgcatcacaggaagagttctataaatttattaaaccaatccttgagaaaatggatggcacggaagagttacttgttaaacttaaccgcgaagacttgcttagaaagcaacgtacattcgacaacggctccatcccacaccagattcatttaggtgaacttcacgccatcttgcgcagacaagaagatttctatcccttcttaaaagacaatcgggagaaaatcgagaagatcctgacgttccgcattccctattatgtcggtcccctggcacgtggtaattctcggtttgcctggatgacgcgcaaaagtgaggaaaccatcaccccttggaactttgaagaagtcgtggataaaggtgctagcgcgcagtcttttatagaaagaatgacgaacttcgataaaaacttgcccaacgaaaaagtcctgcccaagcactctcttttatatgagtactttactgtgtacaacgaactgactaaagtgaaatacgttacggaaggtatgcgcaaacctgcctttcttagtggcgagcagaaaaaagcaattgtcgatcttctctttaaaacgaatcgcaaggtaactgtaaaacagctgaaggaagattatttcaaaaagatcgaatgctttgattctgtcgagatctcgggtgtcgaagatcgtttcaacgcttccttagggacctatcatgatttgctgaagataataaaagacaaagactttctcgacaatgaagaaaatgaagatattctggaggatattgttttgaccttgaccttattcgaagatagagagatgatcgaggagcgcttaaaaacctatgcccacctgtttgatgacaaagtcatgaagcaattaaagcgccgcagatatacggggtggggccgcttgagccgcaagttgattaacggtattagagacaagcagagcggaaaaactatcctggatttcctcaaatctgacggatttgcgaaccgcaattttatgcagcttatacatgatgattcgcttacattcaaagaggatattcagaaggctcaggtgtctgggcaaggtgattcactccacgaacatatagcaaatttggccggctctcctgcgattaagaaggggatcctgcaaacagttaaagttgtggatgaacttgtaaaagtaatgggccgccacaagccggagaatatcgtgatagaaatggcgcgcgagaatcaaacgacacaaaaaggtcaaaagaactcaagagagagaatgaagcgcattgaggaggggataaaggaacttggatctcaaattctgaaagaacatccagttgaaaacactcagctgcaaaatgaaaaattgtacctgtactacctgcagaatggaagagacatgtacgtggatcaggaattggatatcaatagactctcggactatgacgtagatcacattgtccctcagagcttcctcaaggatgattctatagataataaagtacttacgagatcggacaaaaatcgcggtaaatcggataacgtcccatcggaggaagtcgttaaaaagatgaaaaactattggcgtcaactgctgaacgccaagctgatcacacagcgtaagtttgataatctgactaaagccgaacgcggtggtcttagtgaactcgataaagcaggatttataaaacggcagttagtagaaacgcgccaaattacgaaacacgtggctcagatcctcgattctagaatgaatacaaagtacgatgaaaacgataaactgatccgtgaagtaaaagtcattaccttaaaatctaaacttgtgtccgatttccgcaaagattttcagttttacaaggtccgggaaatcaataactatcaccatgcacatgatgcatatttaaatgcggttgtaggcacggcccttattaagaaataccctaaactcgaaagtgagtttgtttatggggattataaagtgtatgacgttcgcaaaatgatcgcgaaatcagaacaggaaatcggtaaggctaccgctaaatactttttttattccaacattatgaatttttttaagaccgaaataactctcgcgaatggtgaaatccgtaaacggcctcttatagaaaccaatggtgaaacgggagaaatcgtttgggataaaggtcgtgactttgccaccgttcgtaaagtcctctcaatgccgcaagttaacattgtcaagaagacggaagttcaaacagggggattctccaaagaatctatcctgccgaagcgtaacagtgataaacttattgccagaaaaaaagattgggatccaaaaaaatacggaggctttgattcccctaccgtcgcgtatagtgtgctggtggttgctaaagtcgagaaagggaaaagcaagaaattgaaatcagttaaagaactgctgggtattacaattatggaaagatcgtcctttgagaaaaatccgatcgactttttagaggccaaggggtataaggaagtgaaaaaagatctcatcatcaaattaccgaagtatagtctttttgagctggaaaacggcagaaaaagaatgctggcctccgcgggcgagttacagaagggaaatgagctggcgctgccttccaaatatgttaattttctgtaccttgccagtcattatgagaaactgaagggcagccccgaagataacgaacagaaacaattattcgtggaacagcataagcactatttagatgaaattatagagcaaattagtgaattttctaagcgcgttatcctcgcggatgctaatttagacaaagtactgtcagcttataataaacatcgggataagccgattagagaacaggccgaaaatatcattcatttgtttaccttaaccaaccttggagcaccagctgccttcaaatatttcgataccacaattgatcgtaaacggtatacaagtacaaaagaagtcttggacgcaaccctcattcatcaatctattactggattatatgagacacgcattgatctttcacagctgggcggagacaagaagaaaaaactgaaactg

SEQ ID NO:18

N末端His6标签/凝血酶/S·Tag^TM/肠激酶区域氨基酸序列(具有起始甲硫氨酸)；

Mhhhhhhssglvprgsgmketaaakferqhmdspdlgtddddkama

SEQ ID NO:19

SV40NLS

PKKKRKV

SEQ NO:20

里氏木霉blr2(蓝光调节剂2)基因NLS

KKKKLKL

SEQ ID NO:21

从质粒pET30a-SpyCas9所表达的SpyCas9蛋白质的氨基酸序列。N末端His6标签、SV40核定位信号、和BLR核定位信号分别以粗体加下划线，斜体加下划线和下划线显示。

mssglvprgsgmketaaakferqhmdspdlgtddddkamamdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdkkkklkl

SEQ ID NO:22

假定的里氏木霉U6基因

AAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCGCCTTCGGGCATTTGGTCAATTTATAACGATACAGGTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGCTAACAGGTCAACAGAGAAGATTAGCATGGCCCCTGCACTAAGGATGACACGCTCACTCAAAGAGAAGCTAAACATTTTTTTTCTCTTCCAAGTCGTGATGGTTATCTTTTTGCTTAGAGAATCTATTCTTGTGGACGATTAGTATTGGTAAATCCCTGCTGCACATTGCGGCGGATGGTCTCAACGGCATAATACCCCATTCGTGATGCAGCGGTGATCTTCAATATGTAGTGTAATACGTTGCATACACCACCAGGTTCGGTGCCTCCTGTATGTACAGTACTGTAGTTCGACTCCTCCGCGCAGGTGGAAACGATTCCCTAGTGGGCAGGTATTTTGGCGGGGTCAAGAA

SEQ ID NO:23

sgRNA的序列(N是与靶位点互补的序列)

SEQ ID NO:24

sgRNA:gAd3A TS1

SEQ ID NO:25

sgRNA:gTrGA TS2

SEQ ID NO:26

sgRNA:gTrGA TS11

SEQ ID NO:27

sgRNA:gPyr2 TS6

SEQ ID NO:28

合成DNA：gAd3A Ts1-1(具有酿酒酵母snr52启动子和酿酒酵母sup4终止子的gAd3A TS1sgRNA(SEQ ID NO:3))

gaattcggatccTCTTTGAAAAGATAATGTATGATTATGCTTTCACTCATATTTATACAGAAACTTGATGTTTTCTTTCGAGTATATACAAGGTGATTACATGTACGTTTGAAGTACAACTCTAGATTTTGTAGTGCCCTCTTGGGCTAGCGGTAAAGGTGCGCATTTTTTCACACCCTACAATGTTCTGTTCAAAAGATTTTGGTCAAACGCTGTAGAAGTGAAAGTTGGTGCGCATGTTTCGGCGTTCGAAACTTCTCCGCAGTGAAAGATAAATGATCgtcctcgagcaaaaggtgccGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTGTTTTTTATGTCTgaattcggatcc

SEQ ID NO:29

合成DNA：gAd3A TS1-2(具有里氏木霉U6启动子和终止子的gAd3A TS1 sgRNA(SEQID NO:3))

gaattcggatccAAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCgtcctcgagcaaaaggtgccGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTTCTCTTgaattcggatcc

SEQ ID NO:30

合成DNA：gAd3A TS1-3(具有里氏木霉U6启动子、终止子和内含子的gAd3ATS1sgRNA(SEQ ID NO:3))

gaattcggatccAAAAAACACTAGTAAGTACTTACTTATGTATTATTAACTACTTTAGCTAACTTCTGCAGTACTACCTAAGAGGCTAGGGGTAGTTTTATAGCAGACTTATAGCTATTATTTTTATTTAGTAAAGTGCTTTTAAAGTAAGGTCTTTTTTATAGCACTTTTTATTTATTATAATATATATTATATAATAATTTTAAGCCTGGAATAGTAAAGAGGCTTATATAATAATTTATAGTAATAAAAGCTTAGCAGCTGTAATATAATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCgtcctcgagcaaaaggtgccGTTTTAGAGCTAGAGTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGCTAACAGAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTTCTCTTgaattcggatcc

SEQ ID NO:31

获得具有较短里氏木霉U6启动子区域的指导RNA表达盒作为合成DNA。这里提供了实例，该实例包括在TS11处靶向里氏木霉gla1基因的sgRNA的序列。

AATTCCTAAAGAAACAGCATGAAATGGTATTATGTAAGAGCTATAGTCTAAAGGCACTCTGCTGGATAAAAATAGTGGCTATAAGTCTGCTGCAAAACTACCCCCAACCTCGTAGGTATATAAGTACTGTTTGATGGTAGTCTATCgccaatggcgacggcagcacGTTTTAGAGCTAGAGTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGCTAACAGAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGGTGCTTTTTTTTCTCTT

SEQ ID NO:32

引物：gRNA fwd aflII

cgtcagcttaagAATTCCTAAAGAAACAGCATGAAATGG

SEQ ID NO:33

引物：gRNA rev sfiI

cgtcagggccacgtgggccAAGAGAAAAAAAAGCACCACCGACTCGG

SEQ ID NO:34

引物：Ad3 5'fwd

tgaacacagccaccgacatcagc

SEQ ID NO:35

引物：Ad3 5'rev

gctggtgagggtttgtgctattg

SEQ ID NO:36

引物：Ad3a 5005rev

gattgcttgggaggaggacat

SEQ ID NO:37

引物：Ad3 3’fwd

cgaggccactgatgaagttgttc

SEQ ID NO:38

引物：Ad3 3’rev

Cagttttccaaggctgccaacgc

SEQ ID NO:39

引物：Ad3a 5003fwd

ctgatcttgcaccctggaaatc

SEQ ID NO:40

Ad3mid rev

ctctctatcatttgccaccctcc

SEQ ID NO:41

引物：Adfrag fwd

ctccattcaccctcaattctcc

SEQ ID NO:42

引物：Adfrag rev

gttcccttggcggtgcttggatc

SEQ ID NO:43

引物：Ad3a 2k fwd

caatagcacaaaccctcaccagc

SEQ ID NO:44

Ad3a 2k rev

gaacaacttcatcagtggcctcg

SEQ ID NO:45

引物：glaA

ccgttagttgaagatccttgccg

SEQ ID NO:46

引物：glaB

gtcgaggatttgcttcatacctc

SEQ ID NO:47

引物：glaJ

tgccgactttgtccagtgattcg

SEQ ID NO:48

引物：glaK

ttacatgtggacgcgagatagcg

SEQ ID NO:49

引物：gla1repF

gtgtgtctaatgcctccaccac

SEQ ID NO:50

引物：gla1repR

gatcgtgctagcgctgctgttg

SEQ ID NO:51

引物：1553R

CCGTGATGGAGCCCGTCTTCT

SEQ ID NO:52

引物：1555F

CGCGGTGAGTTCAGGCTTTTTC

SEQ ID NO:53

引物：pyr2F

gtataagagcaggaggagggag

SEQ ID NO:54

引物：pyr2R

gaacgcctcaatcagtcagtcg

SEQ ID NO:55

在里氏木霉端粒序列之间的细菌卡那霉素抗性基因(具有启动子和终止子)

tcaggaaatagctttaagtagcttattaagtattaaaattatatatatttttaatataactatatttctttaataaataggtattttaagctttatatataaatataataataaaataatatattatatagctttttattaataaataaaatagctaaaaatataaaaaaaatagctttaaaatacttatttttaattagaattttatatatttttaatatataagatcttttacttttttataagcttcctaccttaaattaaatttttacttttttttactattttactatatcttaaataaaggctttaaaaatataaaaaaaatcttcttatatattataagctataaggattatatatatatttttttttaatttttaaagtaagtattaaagctagaattaaagttttaattttttaaggctttatttaaaaaaaggcagtaatagcttataaaagaaatttctttttcttttatactaaaagtactttttttttaataaggttagggttagggtttactcacaccgaccatcccaaccacatcttagggttagggttagggttagggttagggttagggttagggttagggtaagggtttaaacaaagccacgttgtgtctcaaaatctctgatgttacattgcacaagataaaaatatatcatcatgaacaataaaactgtctgcttacataaacagtaatacaaggggtgttatgagccatattcaacgggaaacgtcttgctcgaggccgcgattaaattccaacatggatgctgatttatatgggtataaatgggctcgcgataatgtcgggcaatcaggtgcgacaatctatcgattgtatgggaagcccgatgcgccagagttgtttctgaaacatggcaaaggtagcgttgccaatgatgttacagatgagatggtcagactaaactggctgacggaatttatgcctcttccgaccatcaagcattttatccgtactcctgatgatgcatggttactcaccactgcgatccccgggaaaacagcattccaggtattagaagaatatcctgattcaggtgaaaatattgttgatgcgctggcagtgttcctgcgccggttgcattcgattcctgtttgtaattgtccttttaacagcgatcgcgtatttcgtctcgctcaggcgcaatcacgaatgaataacggtttggttgatgcgagtgattttgatgacgagcgtaatggctggcctgttgaacaagtctggaaagaaatgcataagcttttgccattctcaccggattcagtcgtcactcatggtgatttctcacttgataaccttatttttgacgaggggaaattaataggttgtattgatgttggacgagtcggaatcgcagaccgataccaggatcttgccatcctatggaactgcctcggtgagttttctccttcattacagaaacggctttttcaaaaatatggtattgataatcctgatatgaataaattgcagtttcatttgatgctcgatgagtttttctaatcagaattggttaattggttgtaacactggcagagcattacgctgacttgacgggacggcggctttgttgaataaatcgaacttttgctgagttgaaggatcagatcacgcatcttcccgacaacgcagaccgttccgtggcaaagcaaaagttcaaaatcaccaactggtccacctacaacaaagctctcatcaaccgtggctccctcactttctggctggatgatggggcgattcaggcctggtatgagtcagcaacaccttcttcacgaggcagacctcagcggtttaaacctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaaccctaacctaaccctaatggggtcgatctgaaccgaggatgagggttctatagactaatctacaggccgtacatggtgtgattgcagatgcgacgggcaaggtgtacagtgtccagaaggaggagagcggcataggtattgtaatagaccagctttacataataatcgcctgttgctactgactgatgaccttcttccctaaccagtttcctaattaccactgcagtgaggataaccctaactcgctctggggttattattatactgattagcaggtggcttatatagtgctgaagtactataagagtttctgcgggaggaggtggaaggactataaactggacacagttagggatagagtgatgacaagacctgaatgttatcctccggtgtggtatagcgaattggctgaccttgcagatggtaatggtttaggcagggtttttgcagagggggacgagaacgcgttctgcgatttaacggctgctgccgccaagctttacggttctctaatgggcggccgc

SEQ ID NO:56

Xyr1 Ta靶序列(5’-3’，PAM用粗体加下划线表示)：

GCAGCACCTCGCACAGCATG

SEQ ID NO:57

Xyr1 Ta(2)寡核苷酸1

TAGGCAGCACCTCGCACAGCATG

SEQ ID NO:58

Xyr1 Ta寡核苷酸2

AAACCATGCTGTGCGAGGTGCT

SEQ ID NO:59

Xyr1 Tc靶序列(5’-3’，PAM用粗体加下划线表示)：

GCTGCCAGGAAGAATTCAAC

SEQ ID NO:60

Xyr1 Tc寡核苷酸1

TAGGCTGCCAGGAAGAATTCAAC

SEQ ID NO:61

Xyr1 Tc寡核苷酸2

AAACGTTGAATTCTTCCTGGCA

SEQ ID NO:62

Pyr4 TS2靶序列(5’-3’，PAM用粗体加下划线表示)：

GCTCAAGACGCACTACGACA

SEQ ID NO:63

Pyr4TS2寡核苷酸1

TAGGCTCAAGACGCACTACGACA

SEQ ID NO:64

Pyr4TS2寡核苷酸2

AAACTGTCGTAGTGCGTCTTGAGC

SEQ ID NO:65

Xyr1Ta

SEQ ID NO:66

Xyr1 Tc

SEQ ID NO:67

Pyr4 TS2

SEQ ID NO:68

K21对照T4

tggcccgtcgattgtcgtgctcaagacgcactacgacatggtctcgg

SEQ ID NO:69

T4 4-3

tggcccgtcgattgtcgtgctcaagacgcactacgCGacatggtctcgg

SEQ ID NO:70

T4 4-13

tggcccgtcgattgtcgtgctcaagacgcactacgacatggtctcgg

SEQ ID NO:71

T4 4-11

tggcccgtcgattgtcgtgctcaagacgcactacgGacatggtctcgg

SEQ ID NO:72

T4 4-12

tggcccgtcgattgtcgtgctcaagacgcactacgacatggtctcgg

SEQ ID NO:73

T4 4-18

tggcccgtcgattgtcgtgctcaagacgcactacgGacatggtctcgg

SEQ ID NO:74

T4 4-20

tggcccgtcgattgtcgtgctcaagacgcactacgAGCCGACAGGGCGCCTGGCTAAATCCAAGGTCAAGACAGGCTGGTGGTTGTTTAGTGCGAGTCCTCTGacatggtctcgg

SEQ ID NO:75

T4 4-19

tggcccgtcgattgtcgtgctcaagacgcactacgGacatggtctcgg

SEQ ID NO:76

T4 4-4

tggcccgtcgaatgttgtggtcaaggcgcccttcgGacatggtctcgg

SEQ ID NO:77

T4 4-7

tggcccgtcgattgtcgtgctcaagacgcactacgGacatggtctcgg

SEQ ID NO:78

9-96

CCGCTGACGGCTTACCTGTTCAAGCTCATGGACCTCAAGGCGTCCAACCTGTGCCTGAGCGCCGACGTGCCGACAGCGCGCGAGCTGCTGTACCTGGCCGACAAGATTGGCCCGTCGATTGTCGTGCTCAAGACGCACTACGCAGGCCTGCGTCGAGGCCGCCCGGGAGCACAAGGACTTTGTCATG

SEQ ID NO:79

Pyr4 Tr

CCGCTGACGGCTTACCTGTTCAAGCTCATGGACCTCAAGGCGTCCAACCTGTGCCTGAGCGCCGACGTGCCGACAGCGCGCGAGCTGCTGTACCTGGCCGACAAGATTGGCCCGTCGATTGTCGTGCTCAAGACGCACTACGACATGGTCTCGGGCTGGGACTTCCACCCGGAGACGGGCACGGGAGCCCAGCTGGCGTCGCTGGCGCGCAAGCACGGCTTCCTCATCTTCGAGGACCGCAAGTTTGGCGACATTGGCCACACCGTCGAGCTGCAGTACACGGGCGGGTCGGCGCGCATCATCGACTGGGCGCACATTGTCAACGTCAACATGGTGCCCGGCAAGGCGTCGGTGGCCTCGCTGGCCCAGGGCGCCAAGCGCTGGCTCGAGCGCTACCCCTGCGAGGTCAAGACGTCCGTCACCGTCGGCACGCCCACCATGGACTCGTTTGACGACGACGCCGACTCCAGGGACGCCGAGCCCGCCGGCGCCGTCAACGGCATGGGCTCCATTGGCGTCCTGGACAAGCCCATCTACTCGAACCGGTCCGGCGACGGCCGCAAGGGCAGCATCGTCTCCATCACCACCGTCACCCAGCAGTACGAGTCCGTCTCCTCGCCCCGGTTAACAAAGGCCATCGCCGAGGGCGACGAGTCGCTCTTCCCGGGCATCGAGGAGGCGCCGCTGAGCCGCGGCCTCCTGATCCTCGCCCAAATGTCCAGCCAGGGCAACTTCATGAACAAGGAGTACACGCAGGCCTGCGTCGAGGCCGCCCGGGAGCACAAGGACTTTGTCATG

SEQ ID NO:80

查询序列

ctggccgacaagattggcccgtcgattgtcgtgctcaagacgcactacgacatggtctc

SEQ ID NO:81

主题序列

ctggccgacaagattggcccgtcgattgtcgtgctcaagacgcactacgGacatggtctc

SEQ ID NO:82

Pyr4 Tr

gacagcgcgcgagctgctgtacctggccgacaagattggcccgtcgattgtcgtgctcaagacgcactacgacatggtctcgggctgggacttccacccgg

SEQ ID NO:83

P37#13 4.2rc

gacagcgcgcgagctgctgtacctggccgacaagattggcccgtcgattgtcgtgctcaagacgcactacgGacatggtctcgggctgggacttccacccgg

SEQ ID NO:84

P37 4.1#12rc

gacagcgcgcgagctgctgtacctggccgacaagattggcccgtcgattgtcgtgctcaagacgcactacgTacatggtctcgggctgggacttccacccgg

SEQ ID NO:85

P37#15 4.4rc

gacagcgcgcgagctgctgtacctggccgacaagattggcccgtcgattgtcgtgctcaagacgcactacgcatggtctcgggctgggacttccacccgg

SEQ ID NO:86

P37#14 4.3

SEQ ID NO:87

共有序列(缺失比对)

Gacagcgcgcgagctgctgtacctggccgacaagattggcccgtcgattgtcgtgctcaagacgcannangnnnnggnnnnnggnngggannncnancngg

SEQ ID NO:88

野生型pyr4全编码序列

Atggcaccacacccgacgctcaaggccaccttcgcggccaggagcgagacggcgacgcacccgctgacggcttacctgttcaagctcatggacctcaaggcgtccaacctgtgcctgagcgccgacgtgccgacagcgcgcgagctgctgtacctggccgacaagattggcccgtcgattgtcgtgctcaagacgcactacgacatggtctcgggctgggacttccacccggagacgggcacgggagcccagctggcgtcgctggcgcgcaagcacggcttcctcatcttcgaggaccgcaagtttggcgacattggccacaccgtcgagctgcagtacacgggcgggtcggcgcgcatcatcgactgggcgcacattgtcaacgtcaacatggtgcccggcaaggcgtcggtggcctcgctggcccagggcgccaagcgctggctcgagcgctacccctgcgaggtcaagacgtccgtcaccgtcggcacgcccaccatggactcgtttgacgacgacgccgactccagggacgccgagcccgccggcgccgtcaacggcatgggctccattggcgtcctggacaagcccatctactcgaaccggtccggcgacggccgcaagggcagcatcgtctccatcaccaccgtcacccagcagtacgagtccgtctcctcgccccggttaacaaaggccatcgccgagggcgacgagtcgctcttcccgggcatcgaggaggcgccgctgagccgcggcctcctgatcctcgcccaaatgtccagccagggcaacttcatgaacaaggagtacacgcaggcctgcgtcgaggccgcccgggagcacaaggactttgtcatgggcttcatctcgcaggagacgctcaacaccgagcccgacgatgcctttatccacatgacgcccggctgccagctgccccccgaagacgaggaccagcagaccaacggatcggtcggtggagacggccagggccagcagtacaacacgccgcacaagctgattggcatcgccggcagcgacattgccattgtgggccggggcatcctcaaggcctcagaccccgtagaggaggcagagcggtaccgatcagcagcgtggaaagcctacaccgagaggctgctgcgatag

SEQ ID NO:89

Xyr1基因编码序列

atgttgtccaatcctctccgtcgctattctgcctaccccgacatctcctcggcgtcatttgacccgaactaccatggctcacagtcgcatctccactcgatcaacgtcaacacattcggcaacagccacccctatcccatgcagcacctcgcacagcatgcggagctttcgagttcacgcatgataagggccagtccggtgcagccaaagcagcgccagggctctcttattgctgccaggaagaattcaacGGGtactgctgggcccattcggcggaggatcagtcgcgcttgtgaccagtgcaaccagcttcgtaccaagtgcgatggcttacacccatgtgcccattgtataggtatgtcccttttcctctacacagtgatgctgcgctcaagcacatgtactgatcgatcttgtttagaattcggccttggatgcgaatatgtccgagagagaaagaagcgtggcaaagcttcgcgcaaggatattgctgcccagcaagccgcggcggctgcagcacaacactccggccaggtccaggatggtccagaggatcaacatcgcaaactctcacgccagcaaagcgaatcttcgcgtggcagcgctgagcttgcccagcctgcccacgacccgcctcatggccacattgagggctctgtcagctccttcagcgacaatggcctttcccagcatgctgccatgggcggcatggatggcctggaagatcaccatggccacgtcggagttgatcctgccctgggccgaactcagctggaagcgtcatcagcaatgggcctgggcgcatacggtgaagtccaccccggctatgagagccccggcatgaatggccatgtgatggtgcccccgtcgtatggcgcgcagaccaccatggccgggtattccggtatctcgtatgctgcgcaagccccgagtccggctacgtatagcagcgacggtaactttcgactcaccggtcacatccatgattacccgctggcaaatgggagctcgccctcatggggagtctcgctggcctcgccttcgaaccagttccagcttcagctctcgcagcccatcttcaagcaaagcgatttgcgatatcctgtgcttgagcctctgctgcctcacctgggaaacatcctccccgtgtctttggcgtgcgatctgattgacctgtacttctcctcgtcttcatcagcacagatgcacccaatgtccccatacgttctgggcttcgtcttccggaagcgctccttcttgcaccccacgaacccacgaaggtgccagcccgcgctgcttgcgagcatgctgtgggtggcggcacagactagcgaagcgtccttcttgacgagcctgccgtcggcgaggagcaaggtctgccagaagctgctcgagctgaccgttgggcttcttcagcccctgatccacaccggcaccaacagcccgtctcccaagactagccccgtcgtcggtgctgctgccctgggagttcttggggtggccatgccgggctcgctgaacatggattcactggccggcgaaacgggtgcttttggggccatagggagccttgacgacgtcatcacctatgtgcacctcgccacggtcgtctcggccagcgagtacaagggcgccagcctgcggtggtggggtgcggcatggtctctcgccagagagctcaagcttggccgtgagctgccgcctggcaatccacctgccaaccaggaggacggcgagggccttagcgaagacgtggatgagcacgacttgaacagaaacaacactcgcttcgtgacggaagaggagcgcgaagagcgacggcgagcatggtggctcgtttacatcgtcgacaggcacctggcgctctgctacaaccgccccttgtttcttctggacagcgagtgcagcgacttgtaccacccgatggacgacatcaagtggcaggcaggcaaatttcgcagccacgatgcagggaactccagcatcaacatcgatagctccatgacggacgagtttggcgatagtccccgggcggctcgcggcgcacactacgagtgccgcggtcgtagcatttttggctacttcttgtccttgatgacaatcctgggcgagattgtcgatgtccaccatgctaaaagccacccccggttcggcgttggattccgctccgcgcgggattgggacgagcaggttgctgaaatcacccgacacctggacatgtatgaggagagcctcaagaggttcgtggccaagcatctgccattgtcctcaaaggacaaggagcagcatgagatgcacgacagtggagcggtaacagacatgcaatctccactctcggtgcggaccaacgcgtccagccgcatgacggagagcgagatccaggccagcatcgtggtggcttacagcacccatgtgatgcatgtcctccacatcctccttgcggataagtgggatcccatcaaccttctagacgacgacgacttgtggatctcgtcggaaggattcgtgacggcgacgagccacgcggtatcggctgccgaagctattagccagattctcgagtttgaccctggcctggagtttatgccattcttctacggcgtctatctcctgcagggttccttcctcctcctgctcatcgccgacaagctgcaggccgaagcgtctccaagcgtcatcaaggcttgcgagaccattgttagggcacacgaagcttgcgttgtgacgctgagcacagagtatcaggtaagccctatcagttcaaacgtctatcttgctgtgaatcaaagactgacttggacatcagcgcaactttagcaaggttatgcgaagcgcgctggctctgattcggggccgtgtgccggaagatttagctgagcagcagcagcgacgacgcgagcttcttgcactataccgatggactggtaacggaaccggtctggccctctaa

SEQ ID NO:90

U6内含子

GTTCGTTTCGGCTTTTCCTCGGAACCCCCAGAGGTCATCAGTTCGAATCGCTAACAG

SEQ ID NO:91

U6基因转录终止序列

TTTTTTTTCTCTT

SEQ ID NO:92

用于Pyr4Ts2指导RNA的靶序列

GCTCAAGACGCACTACGACA

Claims

2.如权利要求1所述的方法，其中在所述靶位点处的DNA序列的修饰选自下组，该组由以下各项组成：一个或多个核苷酸的缺失、一个或多个核苷酸的插入、一个或多个核苷酸的取代、及其任何组合。

3.如权利要求1或2所述的方法，其中使用选自下组的方法实现将该Cas内切核酸酶引入该真菌细胞群体中，该组由以下各项组成：转染、转导、转化、电穿孔、粒子轰击(生物射弹粒子递送)、和细胞融合技术。

4.如任一前述权利要求所述的方法，其中使用选自下组的方法实现将该指导RNA引入该真菌细胞群体中，该组由以下各项组成：转染、转导、转化、电穿孔、粒子轰击(生物射弹粒子递送)、和细胞融合技术。

5.如任一前述权利要求所述的方法，其中该鉴定步骤包括在用于对该靶位点处的DNA序列的修饰进行选择或筛选的条件下培养来自步骤(a)的真菌细胞群体。

6.如任一前述权利要求所述的方法，其中该鉴定步骤包括在用于筛选不稳定转化体的条件下培养来自步骤(a)的细胞群体。

7.如任一前述权利要求所述的方法，其中该Cas内切核酸酶是Cas9内切核酸酶或其变体。

8.如权利要求7所述的方法，其中该Cas9内切核酸酶或其变体包含来自选自下组的物种的全长Cas9或其功能片段，该组由以下各项组成：链球菌属物种(Streptococcus sp.)，化脓性链球菌(S.pyogenes)、变异链球菌(S.mutans)、嗜热链球菌(S.thermophilus)；弯曲杆菌属物种(Campylobacter sp.)，空肠弯曲杆菌(C.jejuni)；奈瑟氏菌属物种(Neisseriasp.)，脑膜炎奈瑟球菌(N.meningitides)；弗朗西斯氏菌属物种(Francisella sp.)，新凶手弗朗西斯氏菌(F.novicida)；和巴斯德菌属物种(Pasteurella sp.)，多杀巴斯德菌(P.multocida)。

9.如权利要求8所述的方法，其中该Cas9内切核酸酶或其变体包含与SEQ ID NO:1至7中任一项具有至少70％同一性的氨基酸序列。

10.如任一前述权利要求所述的方法，其中该引入步骤包括将包含该Cas内切核酸酶的表达盒的DNA构建体引入该真菌细胞中。

11.如任一前述权利要求所述的方法，其中该引入步骤包括将包含该指导RNA的表达盒的DNA构建体引入该真菌细胞中。

12.如权利要求1至9和11中任一项所述的方法，其中该引入步骤包括直接将该Cas内切核酸酶引入该真菌细胞中。

13.如权利要求1至10和12中任一项所述的方法，其中该引入步骤包括直接将该指导RNA引入该真菌细胞中。

14.如权利要求10所述的方法，其中该Cas内切核酸酶的表达盒包含针对在该真菌细胞中的表达所优化的Cas编码序列。

15.如权利要求14所述的方法，其中该Cas编码序列是包含与SEQ ID NO:8至少70％同一的多核苷酸序列的Cas9编码序列。

16.如任一前述权利要求所述的方法，其中该Cas内切核酸酶有效地连接到核定位信号上。

17.如权利要求11所述的方法，其中该指导RNA的表达盒包含在真子囊菌纲(Euascomycete)或盘菌纲(Pezizomycete)中具有功能的RNA聚合酶III依赖型启动子，并且其中该启动子有效地连接到编码该指导RNA的DNA上。

18.如权利要求17所述的方法，其中该启动子源自木霉属(Trichoderma)U6 snRNA基因。

19.如权利要求17或18所述的方法，其中该启动子包含与SEQ ID NO:11或12具有至少70％同一性的核苷酸序列。

20.如权利要求11和17-19中任一项所述的方法，其中该指导RNA的表达盒包含具有来自木霉属U6 snRNA基因的内含子序列的、编码指导RNA的DNA。

21.如权利要求20所述的方法，其中源自木霉属U6 snRNA基因的该内含子序列包含与SEQ ID NO:90具有至少70％同一性的核苷酸序列。

22.如任一前述权利要求所述的方法，其中该丝状真菌细胞是真菌亚门或盘菌亚门真菌细胞。

23.如任一前述权利要求所述的方法，其中丝状真菌细胞选自下组，该组由以下各项组成：木霉属(Trichoderma)、青霉属(Penicillium)、曲霉属(Aspergillus)、腐质霉属(Humicola)、金孢子菌属(Chrysosporium)、镰孢霉属(Fusarium)、毁丝霉属(Myceliophthora)、脉孢菌属(Neurospora)、肉座菌属(Hypocrea)、和裸胞壳属(Emericella)。

24.如任一前述权利要求所述的方法，其中该靶位点位于选自下组的目的基因的区域内，该组由以下各项组成：可读框、启动子、调节序列、终止序列、调节元件序列、剪接位点、编码序列、聚泛素化位点、内含子位点、和内含子增强基序。

25.如权利要求1、2、4-9、11、13、和16-19中任一项所述的方法，其中该引入步骤包括：(i)获得稳定表达该Cas内切核酸酶的亲本真菌细胞群体，并且(ii)将该指导RNA瞬时引入该亲本真菌细胞群体中。

26.如权利要求1-3、5-10、12、和14-19中任一项所述的方法，其中该引入步骤包括：(i)获得稳定表达该指导RNA的亲本真菌细胞群体，并且(ii)将该Cas内切核酸酶瞬时引入该亲本真菌细胞群体中。

27.如任一前述权利要求所述的方法，其中该靶位点处的DNA序列的修饰不是由同源重组引起的。

28.如任一前述权利要求所述的方法，其中该方法不涉及将供体DNA引入该真菌细胞群体中。

29.一种通过任一前述权利要求所述的方法产生的重组真菌细胞。

30.一种编码Cas内切核酸酶或其变体的工程化核酸，其中该Cas内切核酸酶或其变体包含与SEQ ID NO:1至7中任一项至少70％同一的氨基酸序列，并且其中该核酸包含与SEQID NO:8至少70％同一的多核苷酸序列。

31.一种编码指导RNA的工程化核酸，所述指导RNA使得Cas内切核酸酶能够在丝状真菌细胞基因组中的靶位点处引入双链断裂，其中该编码指导RNA的核酸包含在真子囊菌纲或盘菌纲中具有功能的RNA聚合酶III依赖型启动子，并且该启动子源自木霉属U6 snRNA基因。

32.如权利要求31所述的工程化核酸，其中该启动子包含与SEQ ID NO:11或12具有至少70％同一性的核苷酸序列。

33.一种编码指导RNA的工程化核酸，该指导RNA使得Cas内切核酸酶能够在丝状真菌细胞基因组中的靶位点处引入双链断裂，其中该编码指导RNA的核酸包含具有源自木霉属U6snRNA基因的内含子序列的、编码指导RNA的DNA。

34.如权利要求33所述的工程化核酸，其中源自木霉属U6 snRNA基因的该内含子序列包含与SEQ ID NO:90具有至少70％同一性的核苷酸序列。

35.如权利要求31或33所述的工程化核酸，其中该编码指导RNA的核酸包含源自木霉属U6 snRNA基因的启动子和源自木霉属U6 snRNA基因的内含子序列两者，其中该启动子包含与SEQ ID NO:11或12具有至少70％同一性的核苷酸序列，并且其中该源自木霉属U6 snRNA基因的内含子序列包含与SEQ ID NO:90具有至少70％同一性的核苷酸序列。