CN108738328A

CN108738328A - 用于丝状真菌宿主细胞的crispr-cas系统

Info

Publication number: CN108738328A
Application number: CN201680014237.2A
Authority: CN
Inventors: 伯纳德·迈瑞克; 瑞内·维尔瓦尔; 比安卡·伊丽莎白·玛丽亚·吉勒森; 约翰尼斯·安德列什·劳博斯; 伊冯·艾琳·妮加德; 鲁洛夫·阿里基·兰斯·博芬贝格; 阿诺德·雅各布·马蒂厄·德莱森; 卡斯滕·波尔
Original assignee: Rijksuniversiteit Groningen; DSM IP Assets BV
Current assignee: Rijksuniversiteit Groningen; DSM IP Assets BV
Priority date: 2015-01-06
Filing date: 2016-01-06
Publication date: 2018-11-02
Anticipated expiration: 2036-01-06
Also published as: CN108738328B

Abstract

本发明涉及分子生物学和细胞生物学的领域。更具体地，本发明涉及一种用于丝状真菌宿主细胞的CRISPR‑CAS系统。

Description

用于丝状真菌宿主细胞的CRISPR-CAS系统

发明领域

本发明涉及分子生物学和细胞生物学的领域。更具体地，本发明涉及一种用于丝状真菌宿主细胞的CRISPR-CAS系统。

发明背景

基因组学技术和分析方法的最新进展显著加速了例如对与范围广泛的生物功能和疾病相关联的遗传因子进行编目和图谱化的能力。精确的基因组工程化技术对于通过允许各遗传元件的选择性干扰而使得因果性遗传变异的系统性反向工程成为可能，其也是推进合成生物学、生物技术应用和医学应用需要的。虽然基因组编辑技术，诸如设计师锌指、转录激活子样效应因子核酸酶(TALEN)或归巢大范围核酸酶(homing meganuclease)可用于产生靶向的基因组干扰，但是仍然需要负担得起的、易于建立的、可扩展的并且便于靶向基因组内的多个位置的新的基因组工程技术。工程化大范围核酸酶对于大多数学术研究者一直是具有挑战性的，因为这些酶的DNA识别和切割功能缠结在单结构域中。也已经证明稳健地构建工程化锌指阵列对于许多实验室是困难的，这是由于需要考虑阵列中各指结构域之间的环境依赖性效应。因此，对于用于靶向具有一系列广泛应用的宿主细胞内的特异性序列的替代性且稳健的技术存在着迫切需要。

发明概述

本发明解决上述需要并且提供了这种技术。本发明是基于CRISPR-Cas系统，其不要求产生靶标特异性序列的定制蛋白，而是需要单一Cas酶，所述单一Cas酶可通过向导多核苷酸而进行编程来识别特异性多核苷酸靶标；换句话说，可以使用所述向导多核苷酸分子将Cas酶募集到特异性多核苷酸靶标。将CRISPR-Cas系统添加到基因组学技术和分析方法的组库中可以显著简化分子学生物领域中现有的方法。

本发明提供了一种非天然存在或工程化的组合物，其包含含有向导多核苷酸和Cas蛋白的CRISPR-Cas系统来源，其中向导多核苷酸包含基本上为宿主细胞中靶多核苷酸的反向互补体的序列，并且向导多核苷酸可以引导Cas蛋白结合在宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物。

本发明还涉及一种调节细胞中多核苷酸的表达的方法，所述方法包括使宿主细胞接触根据本发明的组合物，其中向导多核苷酸引导Cas蛋白结合在宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物。

本发明还涉及一种宿主细胞，其包括根据本发明的组合物。

本发明还涉及一种产生宿主细胞的方法，所述方法包括使宿主细胞接触根据本发明的组合物，其中向导多核苷酸引导Cas蛋白结合在宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物。

本发明还涉及一种用于产生目标化合物的方法，所述方法包括在有利于目标化合物的条件下培养根据本发明的宿主细胞，以及任选地纯化或分离目标化合物。

附图简述

图1示出了典型的向导多核苷酸的示例。两种向导多核苷酸为包含向导序列(crRNA)和向导多核苷酸结构组分的向导RNA。在上图中，向导多核苷酸结构组分由彼此杂交的两个单独分子构成；单个组分可以称之为tracr序列和tracr伴侣序列。在下图中，向导多核苷酸结构组分由具有内部杂交的单一分子构成。这个图改编自Sander和Joung,2014和Mali等人,2013。

图2示出了如何构建向导多核苷酸(向导RNA自加工核酶缩写为gRSR)。锤头状核酶和HDV核酶切割RNA分子，形成最终的且功能性的成熟向导多核苷酸(向导RNA)。

图3示出了载体pEBA520的质粒图谱。

图4示出了载体BG-AMA-1的质粒图谱。

图5示出了载体BG-AMA-2的质粒图谱。

图6示出了载体BG-AMA-3的质粒图谱。

图7示出了载体BG-AMA-4的质粒图谱。

图8示出了fwnA6基因的基因组序列、负责特异性靶向基因组的并入gRSR中的20bp和供体DNA的比对，所述供体DNA促进通过HDR修复双链切割，从而引入fAMA6中的移码和/或PAM序列中的点突变(CGG至CCG)。

图9示出了载体BG-AMA5的质粒图谱。

图10示出了载体BG-AMA6的质粒图谱。

图11示出了从分别对应于表3所示的转化6和8的转化平板获得的照片。在左侧，一个平板来自转化6，其带有形成黑色孢子的菌落；在右侧，一个平板来自转化8，其带有黑色孢子菌落和白色/浅黄褐色孢子菌落。

图12示出了来源于来自参考野生型序列、设计的供体DNA、亲本菌株和来自表3的转化4和8的转化体的序列数据的比对。结果清楚地显示了在fwnA6基因组位置具有突变的转化体。

图13示出了从菌落获得的放大照片，其显示黑色孢子和白色/浅黄褐色孢子的混合物，作为关于来自表3的转化4和8的原始黑色孢子转化体观察到的孢子颜色变化的实例。

图14示出了来源于来自参考野生型序列、设计的供体DNA、亲本菌株和菌落的序列数据的比对，所述菌落带有源于来自表3的转化4和8的黑色孢子转化体的黑色孢子或白色/浅黄褐色孢子。结果显示了来源于GBA301和GBA302的菌株中的突变种类。

图15示出了载体TOPO供体DNA fwnA的质粒图谱。

图16示出了载体BG-AMA7的质粒图谱。

图17示出了载体pEBA513的质粒图谱。

图18示出了载体BG-AMA8的质粒图谱。

图19示出了载体BG-AMA9的质粒图谱。

图20示出了用于核实gRSR盒组装到AMA-质粒中的菌落PCR的示意图。(A)示出了gRSR fwnA盒在AMA质粒和BG-AMA6中的正确组装。(B)示出了在环状质粒BG-AMA5中没有gRSR fwnA盒的组装。

图21示出了电泳凝胶的图像，核实了gRSR fwnA盒正确组装到AMA质粒中。

图22示出了串联连接的gRSR(核酶-向导RNA-核酶)片段的示意图。

图23示出了用标记hygB替代nicB的示意图。

图24示出了载体BG-AMA10的质粒图谱。

图25示出了载体BG-AMA11的质粒图谱。

图26示出了载体BG-AMA12的质粒图谱。

图27示出了在不同培养基上对转化体进行复制铺板。

图28示出了载体BG-AMA16的质粒图谱。

图29示出了在不同培养基上对转化体进行复制铺板。

图30示出了可用于将终止密码子引入R.emersonii的amdS基因中的载体“TOPO供体DNA amdS_终止”的图谱。

图31示出了可用于缺失R.emersonii的amdS基因的载体“TOPO供体DNA amdS_缺失”的图谱。紧邻起始密码子的5'且紧邻amdS基因的终止密码子的3'的500bp侧翼基因组DNA序列与247bp非编码序列(命名为INT)一起被包括在供体DNA中。

图32示出了供体DNA序列相对于amdS基因的基因组序列的位置的表示。靶位点1代表向导RNA的基因组靶标。缺失示出了TOPO供体DNA amdS_缺失的供体DNA中存在的侧翼的位置。

图33示出了载体BG-AMA13的图谱，其可用于利用Pc_FP017启动子表达CAS9和利用Pc_tef启动子表达向导RNA。

图34示出了具有受Anid_tef启动子控制的CAS9表达盒的载体BG-AMA14的图谱，其可被用作金门反应(golden gate reaction)的骨架以获得向导RNA盒。

图35示出了载体BG-AMA15的图谱，其可用于利用Anid_tef启动子表达CAS9和利用Pc_tef启动子表达向导RNA。

图36示出了对不同转化体的基因组amdS基因座进行测序之后获得的序列与amdS基因的参考基因组序列的比对。不同的代码，如1_A01_01代表所分析的不同转化体。

图37示出了进行的PCR的凝胶图，其显示了在基因组DNA内在amdS基因座引入了amdS-缺失供体DNA。下面的条带表明amdS基因座在基因组DNA中被缺失。

图38示出了对含有TAA突变的不同转化体的基因组amdS基因座进行测序之后获得的序列与amdS基因的基因组序列的比对。不同的代码，如74_B10_04代表所分析的不同转化体。

图39示出了载体pDest PKS17DD的质粒图谱。

图40示出了表型筛选：培养皿，其中底部的两个划线菌落显示出pKS17敲除表型(白色孢子)，与其中不存在pKS17敲除表型(黑色孢子)的顶部菌落相反。

图41示出了CRISPR-CAS9的MOCLO模块化克隆设置。

图42示出了以两种方式(A和B)表示的载体pYN2-4的质粒图谱。

图43示出了对Pks17突变的白色孢子表型特征的筛选。一些转化体显示出白色孢子表型：转移至R-Agar之后，两个培养皿在包含菌落。圆圈指示白色菌落。

图44示出了要转化到P.chrysogenum的片段的设置。pDSM-YN-2、hCas9(Cas9表达盒)-gRNA(单gRNA表达盒)和sgRNA-amdS片段通过同源重组在体内重组。这导致Cas9蛋白和向导RNA的表达，随后是通过CRISPR-Cas系统在Pks17开放阅读框中的基因组切割，供体DNA的整合以及因此的Pks17基因缺失。

图45示出了45个菌落中28个菌落的菌落PCR的琼脂糖凝胶电泳。结果证实了供体DNA整合在分析的所有菌落的宿主细胞的基因组中。

序列表的描述

SEQ ID NO:1列出了Aspergillus niger CBS 513.88的基因组。

SEQ ID NO:2列出了Penicillium chrysogenum Wisconsin 54-1255的基因组。

SEQ ID NO:3列出了Rasamsonia emersonii CBS393.64的基因组。

SEQ ID NO:4-6空。

SEQ ID NO:7列出了Mortierella alpina ATCC 32222的基因组。

SEQ ID NO:8-94空。

实施例1-41中的序列

SEQ ID NO:95列出了质粒pEBA520。

SEQ ID NO:96列出了正向引物DBC-05797。

SEQ ID NO:97列出了反向引物DBC-10681。

SEQ ID NO:98列出了质粒pRPBdsRED7354。

SEQ ID NO:99列出了正向引物DBC-10680。

SEQ ID NO:100列出了反向引物DBC-05796。

SEQ ID NO:101列出了模板ccdB盒。

SEQ ID NO:102列出了质粒BG-AMA1。

SEQ ID NO:103列出了启动子片段Pc.FP017。

SEQ ID NO:104列出了CAS9的编码序列。

SEQ ID NO:105列出了终止子序列Pc.FT029。

SEQ ID NO:106列出了骨架载体5a。

SEQ ID NO:107列出了产生的载体BG-C19。

SEQ ID NO:108列出了正向引物DBC-13112。

SEQ ID NO:109列出了反向引物DBC-13114。

SEQ ID NO:110列出了质粒BG-AMA2。

SEQ ID NO:111列出了启动子片段Pc.PAF。

SEQ ID NO:112列出了启动子片段Te.FP036。

SEQ ID NO:113列出了终止子序列Pc20g04380。

SEQ ID NO:114列出了gBlock自加工核酶。

SEQ ID NO:115列出了质粒BG-AMA-3。

SEQ ID NO:116列出了质粒BG-AMA-4。

SEQ ID NO:117列出了正向引物DBC-05795。

SEQ ID NO:118列出了反向引物DBC-05796。

SEQ ID NO:119列出了gBlock供体DNA fwnA6。

SEQ ID NO:120列出了正向引物DBC-12195。

SEQ ID NO:121列出了反向引物DBC-12196。

SEQ ID NO:122列出了正向引物DBC-13318。

SEQ ID NO:123列出了反向引物DBC-13319。

SEQ ID NO:124列出了测序引物DBC-13320。

SEQ ID NO:125列出了产生的载体BG-C20。

SEQ ID NO:126列出了质粒BG-AMA-5。

SEQ ID NO:127列出了启动子片段An.TEF。

SEQ ID NO:128列出了质粒BG-AMA-6。

SEQ ID NO:129列出了质粒供体DNA fwnA6。

SEQ ID NO:130列出了A.nidulans TEF启动子。

SEQ ID NO:131列出了质粒BG-AMA7。

SEQ ID NO:132列出了Cas9/phleo片段。

SEQ ID NO:133列出了用于核实Cas9开放阅读框的存在的正向PCR引物。

SEQ ID NO:134列出了用于核实Cas9开放阅读框的存在的反向PCR引物。

SEQ ID NO:135列出了质粒pEBA513。

SEQ ID NO:136列出了质粒BG-AMA8。

SEQ ID NO:137列出了质粒BG-AMA9。

SEQ ID NO:138列出了具有重叠的gRSR fwnA盒。

SEQ ID NO:139列出了用于核实gRSR fwnA片段组装到AMA质粒中的正向PCR引物。

SEQ ID NO:140列出了用于核实gRSR fwnA片段组装到AMA质粒中的反向PCR引物。

SEQ ID NO:141列出了用于核实向导RNA组装到AMA质粒中的反向PCR引物。

SEQ ID NO:142列出了供体DNA nicB。

SEQ ID NO:143列出了用于从克隆载体PCR扩增供体DNA的正向引物。

SEQ ID NO:144列出了用于从克隆载体PCR扩增供体DNA的反向引物。

SEQ ID NO:145列出了gBlock nicB单个。

SEQ ID NO:146列出了质粒BG-AMA10。

SEQ ID NO:147列出了gRNAfwnA多重。

SEQ ID NO:148列出了gRNAnicB多重。

SEQ ID NO:149列出了质粒BG-AMA11。

SEQ ID NO:150列出了gRSR fwnA+接头多重。

SEQ ID NO:151列出了正向PCR引物。

SEQ ID NO:152列出了质粒BG-AMA12。

SEQ ID NO:153列出了正向引物供体DNA侧翼。

SEQ ID NO:154列出了反向引物供体DNA侧翼。

SEQ ID NO:155列出了正向引物供体DNA侧翼。

SEQ ID NO:156列出了反向引物供体DNA侧翼。

SEQ ID NO:157列出了正向引物供体DNA侧翼。

SEQ ID NO:158列出了反向引物供体DNA侧翼。

SEQ ID NO:159列出了正向引物供体DNA侧翼。

SEQ ID NO:160找出反向引物供体DNA侧翼。

SEQ ID NO:161列出了供体DNA

SEQ ID NO:162列出了供体DNA

SEQ ID NO:163列出了供体DNA

SEQ ID NO:164列出了供体DNA

SEQ ID NO:165列出了amdS表达盒。

SEQ ID NO:166列出了用于扩增amdS表达盒的正向PCR引物。

SEQ ID NO:167列出了用于扩增amdS表达盒的反向PCR引物。

SEQ ID NO:168列出了gBlock gRSR片段。

SEQ ID NO:169列出了质粒BG-AMA16。

SEQ ID NO:170列出了用于将终止密码子引入R.emersonii的amdS基因中的gBlock的核苷酸序列。

SEQ ID NO:171列出了用于缺失R.emersonii的amdS基因的gBlock的核苷酸序列。

SEQ ID NO:172列出了用于将终止密码子引入克隆到TOPO Zero Blunt载体中的R.emersonii的amdS基因中的gBlock的核苷酸序列。

SEQ ID NO:173列出了用于缺失克隆到TOPO Zero Blunt载体中的R.emersonii的amdS基因的gBlock的核苷酸序列。

SEQ ID NO:174列出了Pc_tef启动子的核苷酸序列。

SEQ ID NO:175列出了向导RNA的gBlock的核苷酸序列。

SEQ ID NO:176列出了含有受Pc_FP017启动子控制的CAS9表达盒的AMA质粒的核苷酸序列。

SEQ ID NO:177列出了用于扩增CAS9表达盒的正向引物的核苷酸序列。

SEQ ID NO:178列出了受Pc_tef启动子控制的向导RNA盒和受PC_FP017启动子控制的CAS9表达构建体的核苷酸序列。

SEQ ID NO:179列出了含有Anid_tef启动子的CAS9的AMA质粒的核苷酸序列。

SEQ ID NO:180列出了受Pc_tef启动子控制的向导RNA盒和受Anid_tef启动子控制的CAS9表达构建体的核苷酸序列。

SEQ ID NO:181列出了用于扩增amdS基因的基因组DNA的正向引物的核苷酸序列。

SEQ ID NO:182列出了用于扩增amdS基因的基因组DNA的反向引物的核苷酸序列。

SEQ ID NO:183列出了用于扩增amdS基因座的基因组DNA的正向引物的核苷酸序列。

SEQ ID NO:184列出了用于扩增amdS基因座的基因组DNA的反向引物的核苷酸序列。

SEQ ID NO:185列出了引入的终止突变的序列反应的正向引物的核苷酸序列。

SEQ ID NO:186列出了用于扩增amdS_终止供体DNA的正向引物的核苷酸序列。

SEQ ID NO:187列出了用于扩增amdS_终止供体DNA的反向引物的核苷酸序列。

SEQ ID NO:188列出了用于扩增amdS_缺失供体DNA的正向引物的核苷酸序列。

SEQ ID NO:189列出了用于扩增amdS_缺失供体DNA的反向引物的核苷酸序列。

SEQ ID NO:190列出了pDEST-PKS17。

SEQ ID NO:191列出了正向引物184。

SEQ ID NO:192列出了反向引物189。

SEQ ID NO:193列出了gRNA Pks17>846r。

SEQ ID NO:194列出了gRNA尾巴。

SEQ ID NO:195列出了正向寡核苷酸pPks17>846r。

SEQ ID NO:196列出了反向寡核苷酸gRNA pPks17>846r。

SEQ ID NO:197列出了CAS9表达盒。

SEQ ID NO:198列出了gRNA表达盒“U6”)。

SEQ ID NO:199列出了gRNA表达盒“U3”)。

SEQ ID NO:200列出了gRNA表达盒“tRNA-Met”)。

SEQ ID NO:201列出了gRNA表达盒“tRNA-Leu”)。

SEQ ID NO:202列出了5'侧翼AMA1。

SEQ ID NO:203列出了3'侧翼AMA1。

SEQ ID NO:204列出了pYN2-4。

SEQ ID NO:205列出了gRNA Pks17>235r。

SEQ ID NO:206列出了正向寡核苷酸gRNA pPks17>235r。

SEQ ID NO:207列出了反向寡核苷酸gRNA pPks17>235r。

SEQ ID NO:208列出了gRNA表达盒“U6 pKS17-235”)。

SEQ ID NO:209列出了120bp的供体DNA。

SEQ ID NO:210列出了gRNA尾巴长。

SEQ ID NO:211列出了正向寡核苷酸gRNA Pks17 235长。

SEQ ID NO:212列出了反向寡核苷酸Pks17 235长。

SEQ ID NO:213列出了U6启动子。

SEQ ID NO:214列出了U6终止子。

SEQ ID NO:215列出了gRNA表达盒“U6 pKS17>235长”)。

SEQ ID NO:216列出了tRNA-Met启动子。

SEQ ID NO:217列出了tRNA-Met终止子。

SEQ ID NO:218列出了gRNA表达盒“tRNA-Met pKS17>235长”。

SEQ ID NO:219列出了tRNA-Leu启动子。

SEQ ID NO:220列出了tRNA-Leu终止子。

SEQ ID NO:221列出了gRNA表达盒“tRNA-Leu pKS17>235长”。

SEQ ID NO:222列出了utp25启动子。

SEQ ID NO:223列出了utp25终止子。

SEQ ID NO:224列出了gRNA表达盒“utp25 pKS17>235长”。

SEQ ID NO:225列出了正向引物pks17_5'_BpiI_F。

SEQ ID NO:226列出了反向引物pks17_5'_BpiI_R。

SEQ ID NO:227列出了正向引物pks17_3'_BpiI_F。

SEQ ID NO:228列出了反向引物pks17_3'_BpiI_R。

SEQ ID NO:229列出了正向引物pks17_1kb_F。

SEQ ID NO:230列出了反向引物pks17_1kb_R。

SEQ ID NO:231列出了靶向pKS17的供体DNA 2kb不含标记的DNA片段。

SEQ ID NO:232列出了xlnA CAS9表达盒。

SEQ ID NO:233列出了pDSM-YN2载体。

SEQ ID NO:234列出了引物5'_F。

SEQ ID NO:235列出了引物5'_R。

SEQ ID NO:236列出了HR pDSM-YN2载体的5'侧翼区。

SEQ ID NO:237列出了引物3'-F。

SEQ ID NO:238列出了引物3'_R。

SEQ ID NO:239列出了pDSM-YN2载体的3'侧翼区。

SEQ ID NO:240列出了pYN2_18_A_5'-XlnA-Cas9-Utp25_Pks17。

SEQ ID NO:241列出了pYN2_19_A_5'XlnA-Cas9-U6_Pks17。

SEQ ID NO:242列出了pYN2_20_A_5'-XlnA-Cas9-tRNA-Leu_Pks17。

SEQ ID NO:243列出了pYN2_21_A_5'-XlnA-Cas9-tRNA-Met_Pks17。

SEQ ID NO:244列出了pYN2_22_B_Utp25_Pks17-amdS-3'。

SEQ ID NO:245列出了pYN2_23_B_U6_Pks17-amdS-3'。

SEQ ID NO:246列出了pYN2_24_B_tRNA_Leu_Pks17-amdS-3'。

SEQ ID NO:247列出了pYN2_25_B_tRNA_Met_Pks17-amdS-3')。

SEQ ID NO:248列出了pks17_0.25kb_F。

SEQ ID NO:249列出了pks17_0.25kb_R。

SEQ ID NO:250列出了体外gRNA合成的模板。

SEQ ID NO:251列出了pYN2_28_Xyl-Cas9_AMDS_3。

发明详述

在第一方面，本发明提供了非天然存在或工程化的组合物，其包含含有向导多核苷酸和Cas蛋白的CRISPR-Cas系统的来源，其中向导多核苷酸包含基本上为宿主细胞中靶多核苷酸的反向互补体的向导序列，并且向导多核苷酸能够引导Cas蛋白结合在宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物，其中向导序列基本上为宿主细胞基因组中的5’-(N)yPAM-3’多核苷酸序列靶标的(N)y部分的反向互补体，其中y为8-30，更优选10-30、更优选15-30、更优选17-27、更优选17-20的整数，更优选为17、18、19、20、21、22、23、24、25、26或27，其中PAM为前间区序列邻近基序(protospacer adjacent motif)，其中宿主细胞为真核细胞，所述真核细胞是丝状真菌，优选Aspergillus、Penicillium、Rasamsonia或Mortierella，并且其中PAM优选为选自以下的序列：5’-XGG-3’、5’-XGGXG-3’、5’-XXAGAAW-3’、5’-XXXXGATT-3’、5’-XXAGAA-3’、5’-XAAAAC-3’，其中X可以为任何核苷酸或其类似物，优选X可以为任何核苷酸；并且W为A或T。

Aspergillus、Penicillium、Rasamsonia和Mortierella的优选基因组分别为由SEQ ID NO:1-3和7表示的基因组。基因组中的未知或不清楚的核苷酸(诸如用“n”示出的核苷酸)优选被排除作为多核苷酸序列靶标。

在本文中的组合物、来源、CRISPR-Cas系统、向导多核苷酸、Cas蛋白、靶多核苷酸、宿主细胞和CRISPR-Cas复合物被称为根据本发明的组合物、来源、CRISPR-Cas系统、向导多核苷酸、Cas蛋白、靶多核苷酸、宿主细胞和CRISPR-Cas复合物。为了完整起见，因为不使用数量词修饰在本文他处限定为“至少一种/个”，所以根据本发明的组合物包含至少一个，即一个、两个、三个或更多个向导多核苷酸和/或至少一种，即一种、两种、三种或更多种Cas蛋白的来源。因此，本发明方便提供多重CRISPR-Cas系统。这种多重CRISPR-Cas系统可方便地用于引入供体多核苷酸、缺失多核苷酸和将多核苷酸文库插入到宿主细胞的基因组中。在本文中，多重CRISPR-Cas系统可以是指使用一种或多种Cas蛋白、一个或多个向导多核苷酸和/或一个或多个供体多核苷酸。在本文中，当单一向导多核苷酸和多种供体多核苷酸组合使用时，其中供体多核苷酸被构造成使得它们将被引入到单一靶基因座中，使用术语“单重(singleplex)”。

术语“CRISPR系统”、“CRISPR-Cas系统”和“CRISPR酶系统”可在本文中互换使用，并且在本发明的所有实施方案的背景下是指与靶多核苷酸一起形成CRISPR-Cas复合物所需的元件集合；这些元件包括但不限于Cas蛋白和向导多核苷酸。

术语“CRISPR-Cas复合物”在本发明的所有实施方案的背景下是指包含与靶多核苷酸杂交并且与Cas蛋白复合的向导多核苷酸的复合物。在最简单的形式中，在使用非突变Cas蛋白(诸如但不限于酿脓链球菌(Streptococcus pyogenes)的Cas9蛋白)的情况下，CRISPR-Cas复合物的形成导致靶多核苷酸中或其附近(例如，在距靶多核苷酸1、2、3、4、5、6、7、8、9、10、20、50个或更多个碱基对之内)的一个或两个多核苷酸链的切割。通常，根据本发明的靶多核苷酸(在下文限定的)与PAM序列(在下文限定的)相关联，并且PAM序列优选紧邻靶多核苷酸的下游(3’)；CRISPR-Cas复合物的形成通常导致PAM序列的上游(5’)3个碱基对的一个或两个多核苷酸链的切割。

术语“非天然存在的组合物”在本发明的所有实施方案的背景下是指其在本发明中使用的形式不是天然存在的组合物。单独的元件可以例如本身或与其他元件组合地天然存在，但是非天然存在的组合物包含例如相比于天然组合物多的或少的至少一个元件。

术语“工程化组合物”在本发明的所有实施方案的背景下是指这样的一种组合物，其中至少一个元件已被以使得所得元件不是天然存在的方式工程化，即被人修饰。因而，由于包括至少一个工程化元件，工程化组合物不是天然存在的。

术语“多核苷酸”、“核苷酸序列”和“核酸”可在本文中互换使用，并且在本发明的所有实施方案的背景下是指具有任何长度的核苷酸的聚合形式，是脱氧核糖核苷酸或核糖核苷酸或其混合物或类似物。多核苷酸可具有任何三维结构，且可执行已知或未知的任何功能。以下各项是多核苷酸的非限制性实例：基因或基因片段的编码区或非编码区、由连锁分析定义的多个基因座(一个基因座)、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶、cDNA、重组多核苷酸、分枝多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针、寡核苷酸以及引物。多核苷酸可以包含一个或多个修饰核苷酸，诸如甲基化核苷酸和核苷酸类似物或核苷酸等同物，其中核苷酸类似物或等同物被限定为具有修饰碱基的残基，和/或修饰骨架，和/或非天然的核苷间连接，或这些修饰的组合。优选的核苷酸类似物和等同物在章节“一般定义”中描述。根据需要，对核苷酸结构的修饰可以在多核苷酸组装之前或之后引入。多核苷酸可以在聚合之后诸如通过与标记化合物缀合来进一步修饰。

根据本发明的向导多核苷酸至少包含向导序列，所述向导序列能够与靶多核苷酸杂交并且能够引导CRISPR-Cas系统与靶多核苷酸序列特异性结合以形成CRISPR-Cas复合物。为了能够形成活性CRISPR-Cas复合物，向导多核苷酸还优选包含具有特异性二级结构并且允许Cas蛋白与向导多核苷酸的结合的序列。这种序列在本领域中已知为tracrRNA、tracr序列、tracr支架或向导多核苷酸结构组分，这些术语可在本文中互换使用，其中tracr是反式激活CRISPR的缩写；因此tracrRNA意指反式激活CRISPR RNA。原始CRISPR-Cas系统中的tracrRNA是将crRNA(向导序列)连接至Cas核酸酶的内源性细菌RNA，能够结合任何crRNA。向导多核苷酸结构组分可以由单个多核苷酸分子组成或可以由彼此杂交的两个或更多个分子组成；向导多核苷酸结构组分的这种杂交的组分可以称为tracr序列和tracr伴侣序列。

因此，向导多核苷酸还优选包含tracr序列和/或tracr伴侣序列。向导多核苷酸为根据以上本文列出的多核苷酸的一般定义的多核苷酸；优选的向导多核苷酸包含核糖核苷酸，更优选的向导多核苷酸为RNA(向导RNA)。典型的向导多核苷酸结构的两个示例绘示在图1中。

在本发明的背景下，如果目的序列优选在如同宿主细胞中的生理条件下能够与靶序列或靶多核苷酸杂交，则称向导序列基本上为所述靶序列或所述靶多核苷酸的反向互补体。当使用适合的比对算法进行最佳比对时，向导序列与其相应靶序列之间的互补程度优选为高于50％、60％、75％、80％、85％、90％、95％、97.5％、99％序列同一性。可以使用用于比对序列的任何合适算法，优选如本文中在“序列同一性”部分所定义的算法确定最佳比对。当靶多核苷酸为双链多核苷酸时，目的序列，诸如向导序列，可以能够与靶多核苷酸的任一条链，例如编码链或非编码链杂交。

优选地，根据本发明的向导序列靶向靶标中独特的靶序列。优选地，根据本发明的向导序列与靶多核苷酸中紧邻PAM序列的8、9、10、11、12、13、14、15、16、17、18、19或20个，更优选8、9、10、11或12个核苷酸具有100％序列同一性。

根据本发明的向导序列的长度优选为8-30、更优选10-30、更优选15-30、更优选17-27、更优选17-20个、更优选17、18、19、20、21、22、23、24、25、26或27个核苷酸。向导序列引导CRISPR-Cas系统与靶序列序列特异性结合以形成CRISPR-Cas复合物的能力可以通过任何适合的测定来评估。例如，CRISPR系统的足以形成CRISPR-Cas复合物的组分(包括有待测试的向导序列)可以诸如通过用编码CRISPR-Cas系统的组分的载体进行转染来提供给具有对应靶序列的宿主细胞，随后诸如通过Surveyor测定(由Integrated DNATechnologies,Leuven Belgium分配的突变检测试剂盒)或另一种序列分析测定诸如测序评估靶序列内的优先切割。靶多核苷酸的切割可以在试管中通过以下方式进行评价：通过提供靶多核苷酸、CRISPR-Cas系统的组分(包括有待测试的向导序列)和不同于测试向导序列的对照向导序列，并且在测试向导序列反应与对照向导序列反应之间比较靶序列处的结合或切割速率。其他测定是可行的，并且是本领域技术人员已知的。

据信向导多核苷酸结构组分是为形成活性CRISPR-Cas复合物所必需的。据信向导多核苷酸结构组分不一定可操作地连接至向导序列；然而，向导多核苷酸结构组分可以可操作地连接至向导多核苷酸内的向导序列。根据本发明的向导多核苷酸结构组分可包含野生型向导多核苷酸结构组分的全部或一部分(例如，野生型tracr序列的约或超过约20、26、32、45、48、54、63、67、85或更多个核苷酸)或由所述全部或部分组成，所述根据本发明的向导多核苷酸结构组分形成CRISPR-Cas复合物的一部分；例如通过根据本发明的tracr序列的至少一部分与根据本发明的tracr伴侣序列的全部或一部分的杂交，并且优选可操作地连接至根据本发明的向导序列。根据本发明的tracr序列与根据本发明的tracr伴侣序列具有足够的互补性以杂交，优选在如宿主细胞中的生理条件下杂交，并且有利于CRISPR-Cas复合物的形成。对于根据本发明的靶序列，据信不需要完全的互补性，前提条件是存在足以具有功能性的互补性。优选地，当最佳比对时，根据本发明的tracr序列沿根据本发明的tracr伴侣序列的长度具有至少50％、60％、70％、80％、90％、95％或99％序列同一性。可以使用用于比对序列的任何合适算法，优选如本文中在“序列同一性”下所定义的算法，来确定最佳比对。

一般来讲，根据本发明的tracr伴侣序列包括与根据本发明的tracr序列具有足够互补性以促进靶序列处CRISPR-Cas复合物的形成的任何序列，其中CRISPR-Cas复合物包含与根据本发明的tracr序列杂交的根据本发明的tracr伴侣序列。根据本发明的tracr序列与根据本发明的tracr伴侣序列的互补程度优选根据tracr伴侣序列和tracr序列沿两条序列中的最短者的长度的最佳比对进行限定。可以使用用于比对序列的任何合适算法，优选如本文中在“序列同一性”下所定义的算法，来确定最佳比对。

优选地，关于根据本发明的tracr伴侣序列和根据本发明的tracr序列，将二级结构考虑在内，诸如tracr序列或tracr伴侣序列内的自身互补性。优选地，当最佳比对时，根据本发明的tracr序列与根据本发明的tracr伴侣序列之间沿两条序列中的较短者的长度的互补程度为高于50％、60％、75％、80％、85％、90％、95％、97.5％、99％序列同一性。优选地，根据本发明的tracr伴侣序列的长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50个或更多个核苷酸。优选地，根据本发明的tracr序列的长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50个或更多个核苷酸。优选地，根据本发明的tracr序列和根据本发明的tracr伴侣序列即向导多核苷酸结构组分包含在单一转录物内，使得两者之间的杂交产生包含二级结构诸如发夹的杂交复合物。当tracr序列和tracr伴侣序列不包含在单一转录物中时，也可形成这种杂交复合物。根据本发明的tracr序列和/或根据本发明的tracr伴侣序列和/或根据本发明的向导多核苷酸结构组分中用于形成发夹结构的优选成环序列的长度为四个核苷酸，并且最优选具有序列GAAA；可以使用更长或更短的环序列，也可以使用替代性序列。这些环序列优选地包含核苷酸三联体(例如，AAA)和一个额外核苷酸(例如C或G)。成环序列的实例包括CAAA和AAAG。优选地，根据本发明的tracr序列和/或根据本发明的tracr伴侣序列或其杂交复合物和/或根据本发明的向导多核苷酸结构组分包含或能够形成至少两个或更多个发夹。更优选地，根据本发明的tracr序列和/或根据本发明的tracr伴侣序列或其杂交复合物和/或根据本发明的向导多核苷酸结构组分包含或能够形成两个、三个、四个或五个发夹。优选地，根据本发明的tracr序列和/或根据本发明的tracr伴侣序列或其杂交复合物和/或根据本发明的向导多核苷酸结构组分包含或能够形成至多五个发夹。优选地，根据本发明的tracr序列和根据本发明的tracr伴侣序列或根据本发明的tracr序列与根据本发明的tracr伴侣序列的杂交复合物和/或根据本发明的向导多核苷酸结构组分的单一转录物还包含转录终止序列；优选地所述转录终止序列为多聚T序列，例如六个T核苷酸。正如所说，向导多核苷酸结构组分是本领域中技术人员已知的；背景信息可例如见于Gaj等人,2013中。

在根据本发明的所有实施方案的背景下，术语“靶多核苷酸”是指根据本发明的靶序列，根据本发明的向导序列被设计成与所述靶序列具有互补性，其中根据本发明的靶序列与根据本发明的向导序列之间的杂交促进CRISPR-Cas复合物的形成。并不一定需要完全互补，只要存在引起杂交并且促进CRISPR-Cas复合物形成的足够互补性。优选地，根据本发明的向导序列靶向靶标中独特的靶序列。优选地，根据本发明的向导序列与靶多核苷酸中紧邻PAM序列的8、9、10、11、12、13、14、15、16、17、18、19或20个，更优选8、9、10、11或12个核苷酸具有100％序列同一性。根据本发明的靶多核苷酸可以包括任何多核苷酸诸如DNA或RNA多核苷酸并且可以是单链或双链的。当靶多核苷酸为双链多核苷酸时，根据本发明的向导序列可以能够与靶多核苷酸的任一条链，例如编码链或非编码链杂交。

根据本发明的靶多核苷酸可以位于细胞的细胞核或细胞质中。根据本发明的靶多核苷酸可以位于宿主细胞的细胞器中，例如线粒体或叶绿体中。根据本发明的靶多核苷酸可以包含在基因组中，可以包含在染色体中，或可以在染色体外，可以包含在人工染色体诸如酵母人工染色体(YAC)中，可以存在于任何染色体实体或染色体外实体，诸如常染色体型复制实体诸如附加体型质粒或载体中。根据本发明的靶多核苷酸对于宿主细胞可以是天然的或外来的。

根据本发明的靶多核苷酸优选与前间区序列邻近基序(PAM)相关联，所述前间区序列邻近基序为由CRISPR-Cas复合物识别的短多核苷酸。优选地，靶多核苷酸和PAM被连接，其中PAM优选紧邻靶多核苷酸的下游(3’)。PAM的确切序列和长度可以不同，例如不同的Cas蛋白可需要不同的PAM。根据本发明的一个优选PAM是长度为2至8个核苷酸的多核苷酸。一种优选的PAM选自：5’-XGG-3’、5’-XGGXG-3’、5’-XXAGAAW-3’、5’-XXXXGATT-3’、5’-XXAGAA-3’、5’-XAAAAC-3’，其中X可以是任何核苷酸或其类似物，优选为任何核苷酸；并且W为A或T。一种更优选的PAM为5’-XGG-3’。PAM优选与Cas蛋白匹配。最广泛使用的CAS/CRISPR系统衍生自酿脓链球菌并且匹配的PAM序列5’-XGG-3’紧邻靶序列的下游(3’)定位。对于脑膜炎奈瑟氏菌(Neisseria meningitides)Cas蛋白的一种优选PAM为5’-XXXXGATT-3’；对于嗜热链球菌(Streptococcus thermophilus)Cas蛋白的一种优选PAM为5’-XXAGAA-3’；对于齿垢密螺旋体(Treponema denticola)的一种优选PAM为5’-XAAAAC-3’。优选PAM匹配于使用的Cas蛋白。根据本发明的Cas蛋白可以被工程化为匹配这样的PAM，该PAM不同于匹配野生型Cas蛋白的天然PAM。因此，根据本发明的CRISPR-Cas系统可以用于定制的特异性靶向。

术语“杂交”是指其中一个或多个多核苷酸反应形成经由核苷酸残基的碱基之间氢键键合而稳定化的复合物的反应。氢键可以通过沃森-克里克碱基配对、Hoogstein键合或以任何其他序列特异性方式形成。该复合物可包含形成双链体结构的两条链、形成多链复合物的三条或更多条链、单一自杂交链或这些的任何组合。杂交反应可以构成更大规模的方法中的步骤，诸如用酶切割多核苷酸。优选的杂交条件是如根据本发明的宿主细胞内的生理条件。

术语“来源”在本发明的所有实施方案的背景下是指包含向导多核苷酸和Cas蛋白的CRISPR-Cas系统的任何来源。向导多核苷酸和Cas蛋白可以存在于分别的来源中。在这种情况下，根据本发明的组合物包含含有向导多核苷酸来源和Cas蛋白来源的CRISPR-Cas系统。任何来源意指向导多核苷酸和Cas蛋白可以以其可在CRISPR-Cas系统内起作用的形式存在。向导多核苷酸和/或Cas蛋白可以其活性形式提供并且可以自非活性形式或从另一实体提供。向导多核苷酸可以例如存在于另一多核苷酸上或者可以由被转录以提供实际的向导多核苷酸的多核苷酸编码。Cas蛋白可以由被转录和/或翻译以提供实际的Cas蛋白的多核苷酸(例如DNA或mRNA)编码。编码多核苷酸可以存在于本文限定的核酸构建体中和/或本文限定的载体中。这种核酸构建体和载体在本文中称为根据本发明的核酸构建体和根据本发明的载体。

优选地，在根据本发明的组合物中，Cas蛋白由多核苷酸编码和/或向导多核苷酸由多核苷酸编码或存在于多核苷酸上。

优选地，在根据本发明的组合物中，Cas蛋白由多核苷酸编码和/或向导多核苷酸由另一个多核苷酸编码或存在于另一个多核苷酸上，并且一个或多个多核苷酸包含在载体中。

优选地，在根据本发明的组合物中，向导多核苷酸由被转录以提供实际的向导多核苷酸的多核苷酸编码。因此，在一个实施方案中，在根据本发明的组合物中，优选地，向导多核苷酸以编码所述向导多核苷酸的多核苷酸的形式存在并且在宿主细胞中转录所述向导多核苷酸后获得向导多核苷酸。

优选地，在根据本发明的组合物中，编码向导多核苷酸的多核苷酸与载体具有序列同一性，使得有利于编码向导多核苷酸的多核苷酸与所述载体的重组，其中重组优选为宿主细胞中的体内重组并且其中载体优选为线性的。因此，在一个实施方案中，在根据本发明的组合物中，优选地，编码向导多核苷酸的多核苷酸与第一载体具有序列同一性的一个或多个区域以允许编码向导多核苷酸的多核苷酸与所述第一载体之间同源重组，以产生包含编码向导多核苷酸的多核苷酸的第二载体，其中重组优选为宿主细胞中的体内重组并且其中第一载体优选为线性载体。本领域的技术人员知道如何提供线性载体；其可例如原样合成或者可通过限制性酶消化环状载体提供。允许设计与载体具有同源性的若干个不同的编码向导多核苷酸的多核苷酸，而无需将编码向导多核苷酸的每个多核苷酸克隆到载体中。

优选地，根据本发明的这种组合物包含至少两个不同的多核苷酸，各自编码相应的不同向导多核苷酸，其中所述至少两个多核苷酸还彼此具有序列同一性，使得有利于编码不同向导多核苷酸的多核苷酸与所述载体的重组，其中重组优选为宿主细胞中的体内重组并且其中载体优选为线性载体。因此，在一个实施方案中，根据本发明的组合物优选包含至少两个不同的多核苷酸，各自编码相应的不同向导多核苷酸，其中所述至少两个多核苷酸还彼此具有序列同一性，以允许编码不同向导多核苷酸的多核苷酸相互同源重组并且与所述(第一)载体同源重组，以产生包含各自编码向导多核苷酸的所述至少两个多核苷酸的第二载体，其中重组优选为宿主细胞中的体内重组并且其中(第一)载体优选为线性载体。在一个实施方案中，向导多核苷酸优选在其与靶多核苷酸的序列同一性方面是不同的。

在一个变型的实施方案中，编码向导多核苷酸的多核苷酸与载体或编码向导多核苷酸自身的另一个多核苷酸不具有序列同一性，但是额外的多核苷酸存在于根据本发明的组合物中，以有利于将编码向导多核苷酸的多核苷酸组装到载体中和/或各自编码相应的不同向导多核苷酸的两个不同多核苷酸的复合物的组装。

因此，提供了根据本发明的组合物，其中存在额外的多核苷酸组，所述多核苷酸组与编码向导多核苷酸的多核苷酸以及与载体具有序列同一性，使得有利于编码向导多核苷酸的多核苷酸与所述载体的重组，其中重组优选为宿主细胞中的体内重组并且其中载体优选为线性的。此外，提供了根据本发明的组合物，其中存在另外的多核苷酸，所述另外的多核苷酸与编码向导多核苷酸的多核苷酸并且与编码另外且不同的向导多核苷酸的另外且不同的多核苷酸具有序列同一性，使得有利于编码向导多核苷酸的多核苷酸与所述载体的重组，其中重组优选为宿主细胞中的体内重组并且其中载体优选为线性的。

优选地，在根据本发明的组合物中，Cas蛋白由多核苷酸编码并且向导多核苷酸由另一个多核苷酸编码或存在于另一个多核苷酸上，并且多核苷酸包含在一个载体中。

优选地，在根据本发明的组合物中，Cas蛋白由包含在载体中的多核苷酸编码并且向导多核苷酸由包含在另一个载体中的另一个多核苷酸编码或存在于所述另一个多核苷酸上。优选地，编码Cas蛋白的载体为低拷贝载体并且编码向导多核苷酸的载体为高拷贝载体。这允许Cas蛋白与向导多核苷酸的差异性表达；Cas蛋白可以例如以比向导多核苷酸低的水平表达。在本文中，优选地，低拷贝载体是以至多10、9、8、7、6、5、4、3、2个或最优选1个拷贝/宿主细胞的量存在的载体。在本文中，优选地，高拷贝载体是以至少10个、15个、至少20、25、30、35、40、45、50、55、60、70、80、90或至少100个拷贝/宿主细胞的量存在的载体。

本发明因此提供了提供向导多核苷酸和Cas蛋白本身或其编码在或存在于载体上的可行性。在后者的情况中，编码多核苷酸可各自在单独的载体上或可以均在单一载体上。如本文他处示出的，本发明还提供了外源性多核苷酸，其也称为供体多核苷酸、供体DNA(当多核苷酸为DNA时)或修复模板，在CRISPR-Cas复合物切割靶多核苷酸后，所述外源性多核苷酸与靶多核苷酸重组，产生了经修饰的靶多核苷酸。这种外源性多核苷酸在本文中称为根据本发明的外源性多核苷酸并且可以是单链或双链的。因此，根据本发明的组合物还可包含根据本发明的外源性多核苷酸；根据本发明的组合物可包含一个或多个不同的外源性多核苷酸。此类一个或多个不同的外源性多核苷酸可以编码不同的表达产物或可以编码相同的表达产物，同时外源性多核苷酸的一部分与靶多核苷酸的一部分具有序列同一性。在一个实施方案中，根据本发明的组合物包含一个或多个不同的外源性多核苷酸，所述外源性多核苷酸包含与靶多核苷酸具有序列同一性的一个或多个区域，以允许在CRISPR-Cas复合物切割靶多核苷酸后与切割的靶多核苷酸的同源重组，产生经修饰的靶多核苷酸。根据本发明的此类组合物实现了如在本文他处所称的根据本发明的多重CRISPR-CAS系统。在一个实施方案中，在根据本发明的组合物中，其中存在至少两个不同的外源性多核苷酸，其在CRISPR-Cas复合物切割靶多核苷酸后与靶多核苷酸重组产生经修饰的靶多核苷酸，所述至少两个不同的外源性多核苷酸可以彼此具有序列同一性，使得有利于所述不同的外源性多核苷酸的重组，其中重组优选为宿主细胞中的体内重组。在一个实施方案中，根据本发明的组合物包含至少两个不同的外源性多核苷酸，所述至少两个不同的外源性多核苷酸中的每个包含与另一个外源性多核苷酸并且任选地与靶多核苷酸具有序列同一性的至少一个区域，以允许在CRISPR-Cas复合物切割靶多核苷酸后所述至少两个不同的外源性多核苷酸相互同源重组并且与切割的靶多核苷酸同源重组，产生经修饰的靶多核苷酸，其中重组优选为宿主细胞中的体内重组。根据本发明的此类组合物实现了如在本文他处描述的单重CRISPR-Cas系统。在一个变型的实施方案中，存在额外的多核苷酸，所述额外的多核苷酸与外源且不同的多核苷酸具有序列同一性，使得有利于外源且不同的多核苷酸的重组，并且其中重组优选为宿主细胞中的体内重组。在这个变型的实施方案中，一个或多个额外的多核苷酸可以仅与外源性多核苷酸具有序列同一性，使得可形成这些多核苷酸的复合物。作为替代地或组合地，一个或多个额外的多核苷酸可以与外源性多核苷酸具有序列同一性并且与靶多核苷酸的一部分具有序列同一性，使得外源性多核苷酸或外源性多核苷酸的复合物可被引入到靶多核苷酸中。

根据本发明的外源性多核苷酸可以存在于载体上或可以以本身的形式存在，可以由另一个多核苷酸编码，或可以可操作地连接至向导多核苷酸并且可以与跟向导序列相关联的PAM上游(即在PAM的5’侧)的靶多核苷酸的一部分具有序列同一性，或可以与跟向导序列相关联的PAM下游(即在PAM的5’侧)的靶多核苷酸的一部分具有序列同一性。对于外源性多核苷酸，载体可以是单独的载体。携带外源性多核苷酸的载体可以是下文描述的任何载体。外源性多核苷酸可以存在于包含编码根据本发明的Cas蛋白的多核苷酸和/或包含向导多核苷酸或编码根据本发明的向导多核苷酸的多核苷酸的载体上。因此，在一个实施方案中，本发明提供了根据本发明的组合物，其中编码根据本发明的Cas蛋白的多核苷酸、向导多核苷酸或编码根据本发明的向导多核苷酸的多核苷酸存在于单一载体上，所述载体还可以包含表达编码产物所需的任何元件诸如启动子和终止子元件。这种单一(所有在一个中)载体具有下述优点：为CRISPR-Cas系统所需的所有组分一起存在；此外，单一转化事件，任选地与供体多核苷酸组合，足以将组分引入到宿主细胞中。在一个实施方案中，提供了根据本发明的组合物，其中根据本发明的Cas蛋白由存在于载体上的多核苷酸编码，并且根据本发明的向导多核苷酸以本身的形式存在(例如，作为PCR片段、限制性片段或合成片段)，向导多核苷酸可以可操作地连接至根据本发明的外源性多核苷酸，其中向导多核苷酸和/或可操作连接的外源性多核苷酸与载体具有序列同一性，使得允许向导多核苷酸和/或可操作连接的外源性多核苷酸与载体在宿主细胞中进行体内重组。优选地，体内重组产生包含向导多核苷酸和/或可操作连接的外源性多核苷酸的第二载体。在向导多核苷酸和外源性多核苷酸可操作地连接并且向导多核苷酸与诸如上文所述的载体具有序列同一性的情况下，当向导多核苷酸与载体重组时外源性多核苷酸被释放。为了上文所述的目的，载体可以被适当的限制性酶(诸如SapI)消化，使得有利于消化的载体与向导多核苷酸和/或可操作连接的外源性多核苷酸之间的体内重组。这个实施方案增强了效率，因为其消除了对载体-插入序列组装步骤的需要。这个实施方案设想到，可以使用多个不同的向导多核苷酸，或者可以使用可操作地连接至多个不同的外源性多核苷酸的多个不同的向导多核苷酸，即向导多核苷酸或可操作地连接至多个不同的外源性多核苷酸的向导多核苷酸的文库。这种多重CRISPR-Cas系统可方便地用于引入供体多核苷酸序列、缺失多核苷酸和将多核苷酸文库插入到宿主细胞的基因组中。

在本发明的所有实施方案的背景下，载体可以是任何载体(例如质粒或病毒)，其可方便地进行重组DNA过程并且可介导根据本发明的多核苷酸的表达。载体的选择通常将取决于载体与待引入所述载体的宿主细胞的相容性。优选的载体是本文实施例中使用的载体。载体可以是线性多核苷酸或线性或闭合的环状质粒。载体可以是自主复制载体，即作为染色体外实体存在的载体，其复制独立于染色体复制，例如质粒、染色体外元件、微型染色体或人工染色体。

优选地，在根据本发明的组合物中，至少一个载体是自主复制载体，优选AMA载体。自主维持的克隆载体和AMA载体优选包含AMA1序列(参见例如Aleksenko和Clutterbuck1997)或其功能性变体或等同物。

载体可以是当引入到宿主细胞中时整合到基因组中并且与其已整合进入其中的染色体一起复制的载体。整合性载体可整合在宿主细胞的染色体的随机位置或预先确定的靶基因座处。优选的整合性载体包含DNA片段，其与宿主细胞基因组中的预先确定的靶基因座的DNA序列同源，以使载体的整合靶向这个预先确定的基因座。为了促进靶向整合，载体优选在转化细胞之前被线性化。优选进行线性化使得载体的至少一个末端，但是优选两个末端的侧翼为与靶基因座同源的序列。靶基因座侧翼的同源序列的长度为优选至少30bp、优选至少50bp、优选至少0.1kb、甚至优选至少0.2kb、更优选至少0.5kb、甚至更优选至少1kb、最优选至少2kb。优选地，靶向整合到宿主细胞基因组中，即整合在预先确定的靶基因座中的效率通过增强宿主细胞的同源重组能力来增大。

载体中的同源侧翼DNA序列(其与靶基因座同源)可以衍生自高度表达的基因座，这意指它们衍生自能够在宿主细胞中具有高表达水平的基因。本文将能够高水平表达的基因、即高表达基因定义为，在例如诱导条件下其mRNA可构成细胞总mRNA的至少0.5％(w/w)的基因，或者，其基因产物可构成细胞总蛋白质的至少1％(w/w)的基因，或在分泌基因产物的情况下，可分泌到至少0.1g/l的水平的基因(例如，如EP 357 127 B1中所述)。

举例给出一些优选的高表达真菌基因：来自Aspergilli、Chrysosporium或Trichoderma的淀粉酶、葡糖淀粉酶、醇脱氢酶、木聚糖酶、甘油醛磷酸脱氢酶或纤维二糖水解酶(cbh)基因。用于这些目的的最优选的高表达基因是葡糖淀粉酶基因，优选A.niger葡糖淀粉酶基因、A.oryzae TAKA-淀粉酶基因、A.nidulans gpdA基因、Trichoderma reeseicbh基因，优选cbh1、Chrysosporium lucknowense cbh基因或来自P.chrysogenum的cbh基因。

根据本发明的多核苷酸的多于一个拷贝可以插入到微生物宿主细胞中以介导由所述多核苷酸编码的产物的产生。这可以通过以下方式完成：优选通过将多核苷酸的多个拷贝整合到宿主细胞的基因组中，更优选通过将多核苷酸的整合靶向在先前段落中限定的高度表达的基因座中的一个处。另选地，多个拷贝的整合可以通过包括具有根据本发明的多核苷酸的可扩增的选择性标记基因来实现，使得含有选择性标记基因的扩增拷贝(和由此核酸序列的另外拷贝)的细胞可以通过在适当的选择剂存在下培养细胞来进行选择。为了进一步增加根据本发明的多核苷酸的拷贝数量，可以使用如WO98/46772中描述的基因转化技术。

当编码根据本发明的Cas蛋白的根据本发明的多核苷酸和/或根据本发明的向导多核苷酸整合到宿主细胞基因组中时，当例如发生期望的基因组编辑时，可希望将多核苷酸从基因组中切除。多核苷酸的切除可以通过本领域的技术人员已知的任何手段进行，一种优选的手段为使用Amds作为选择标记并且用例如氟乙酰胺进行反选择以从基因组中切除多核苷酸,诸如EP0635574中所述。用于切除的另一手段将是使用熟知的Cre/lox系统；编码根据本发明的Cas蛋白的多核苷酸序列可以例如侧翼为lox66/71或loxP/loxP。用于切除的另一手段将是使用根据本发明的CRISPR-Cas系统。

根据本发明的载体可以是单一载体或质粒或包括两个或更多个载体或质粒的载体系统，所述两个或更多个载体或质粒一起含有待引入到宿主细胞中的根据本发明的多核苷酸。

根据本发明的载体可以含有允许容易地选择转化的细胞的一个或多个选择性标记。在一个实施方案中，在根据本发明的组合物中，一个或多个或所有载体包含选择性标记，优选每个载体包含不同的选择性标记。选择性标记是其产物提供了杀生物剂或病毒抗性、重金属抗性、对营养缺陷型的原营养等的基因。选择性标记可以在载体上作为表达盒而引入到细胞中或可以引入在单独载体上。

在丝状真菌细胞中使用的选择性标记可以选自包括但不限于以下各项的组：amdS(乙酰胺酶)、argB(鸟氨酸氨基甲酰转移酶)、bar(草胺膦乙酰转移酶)、bleA(腐草霉素结合)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、NAT或NTC(诺尔丝菌素)和trpC(邻氨基苯甲酸合酶)、KanMX(抗G418/遗传霉素；选择标记kanMX是由在来自棉阿舒囊霉(Ashbya gossypii)的强TEF启动子的控制下的细菌氨基糖苷磷酸转移酶(来自转座子Tn903的kanr)组成的杂合基因；哺乳动物细胞、酵母和其他真核细胞在用kanMX标记转化时获得遗传霉素(＝G418，类似于卡那霉素的氨基糖苷抗生素)抗性；在酵母中，kanMX标记避免了营养缺陷标记的需要；此外，kanMX标记使得大肠杆菌抗卡那霉素)以及来自其他物种的等同物。优选用于Aspergillus和Penicillium细胞中的是amdS(参见例如EP 635574B1、EP0758020A2、EP1799821A2、WO 97/06261A2)和A.nidulans或A.oryzae的pyrG基因和Streptomyces hygroscopicus的bar基因。更优选使用amdS基因，甚至更优选来自A.nidulans或A.nige的amdS基因。最优选的选择性标记基因是与A.nidulans gpdA启动子融合的A.nidulans amdS编码序列(参见EP635574B1)。其他优选的AmdS标记是WO2006/040358中描述的那些。还可以使用来自其它丝状真菌的AmdS基因(WO 97/06261)。可用于原核宿主细胞中的标记包括ATP合成酶、亚基9(oliC)、乳清酸核苷-5'-磷酸脱羧酶(pvrA)、氨苄青霉素抗性基因(大肠杆菌)、新霉素、卡那霉素、四环素、壮观霉素、红霉素、氯霉素、腐草霉素(芽孢杆菌(Bacillus))的抗性基因和编码β-葡萄糖醛酸酶(GUS)的大肠杆菌uidA基因。载体可用于体外，例如用于在体外转录系统中体外产生RNA或用于转染或转化宿主细胞。

可用于转化大多数丝状真菌和酵母的通用标记基因诸如乙酰胺酶基因或cDNA(来自构巢曲霉(A.nidulans)、米曲霉(A.oryzae)或黑曲霉(A.niger)的amdS、niaD、facA基因或cDNA)或提供对抗生素如G418、潮霉素、博来霉素、卡那霉素、甲氨蝶呤、腐草霉素或苯菌灵抗性(benA)的抗性的基因。另选地，可使用特异性选择标记，诸如需要相应突变宿主菌株的营养缺陷型标记：例如D-丙氨酸消旋酶(来自芽孢杆菌)、URA3(来自酿酒酵母或来自其他酵母的类似基因)、pyrG或pyrA(来自构巢曲霉或黑曲霉)、argB(来自构巢曲霉或黑曲霉)或trpC。在一个优选的实施方案中，在引入表达构建体后从转化的宿主细胞中缺失选择标记，以获得无选择标记基因的能够产生多肽的转化宿主细胞。

用于连接上述元件以构建根据本发明的载体的程序为本领域中的技术人员众所周知的(参见，例如Sambrook&Russell,Molecular Cloning:ALaboratory Manual,第3版,CSHL Press,Cold Spring Harbor,NY,2001；和Ausubel等人,Current Protocols inMolecular Biology,Wiley InterScience,NY,1995)。

在本发明的所有实施方案的背景下的Cas蛋白是指适于本发明的目的的任何Cas蛋白。Cas蛋白可具有酶活性或可不具有酶活性。Cas蛋白的非限制性示例包括Casl、CaslB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csxl2)、CaslO、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、CsxlO、Csxl6、CsaX、Csx3、Csxl、CsxlS、Csfl、Csf2、Csf3、Csf4、其同源物或其经修饰版本。这些Cas蛋白为本领域的技术人员所熟知；例如酿脓链球菌Cas9蛋白的氨基酸序列可以见于SwissProt数据库中目录号Q99ZW2。优选地，根据本发明的非经修饰的Cas蛋白具有DNA切割活性，诸如例如Cas9。优选地，根据本发明的Cas蛋白为Cas9，并且可以是来自酿脓链球菌或肺炎链球菌(S.pneumoniae)的Cas9。优选地，根据本发明的Cas蛋白引导在靶多核苷酸的位置处的一条或两条多核苷酸链的切割，诸如靶多核苷酸内和/或靶多核苷酸的反向互补体内。在本文中，靶多核苷酸的位置处被限定为在距靶多核苷酸的第一或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个或更多个核苷酸内；更优选地，在距靶多核苷酸的第一或最后一个核苷酸1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个或更多个核苷酸内；甚至更优选地，在距靶多核苷酸的第一或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50个核苷酸内。因此，根据本发明的Cas蛋白优选引导在下述位置处的一条或多条多核苷酸链的切割：在距靶多核苷酸的第一或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个或更多个核苷酸内；更优选地，在距靶多核苷酸的第一或最后一个核苷酸1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个或更多个核苷酸内；甚至更优选地，在距靶多核苷酸的第一或最后一个核苷酸1、2、3、4、5、6、7、8、9、10、15、20、25、50个核苷酸内。通常，根据本发明的靶多核苷酸与PAM序列(在本文他处限定的)相关联，并且PAM序列优选紧邻靶序列的下游(3’)；CRISPR-Cas复合物的形成通常导致PAM序列的上游(5’)3个碱基对的一个或两个多核苷酸链的切割。

优选地，根据本发明的组合物中的Cas蛋白具有引导靶多核苷酸的位置处的两条多核苷酸链的切割的活性。Cas核酸酶活性通常通过两个单独的催化结构域即RuvC和HNH进行。每个结构域切割一条多核苷酸链，每个结构域可以通过单点突变失活。由此根据本发明的Cas蛋白可以方便地相对于对应的野生型Cas蛋白进行突变，使得突变型Cas蛋白具有改变的核酸酶活性并且缺乏切割靶多核苷酸的一条或两条链的能力。在本发明的实施方案中，根据本发明的Cas蛋白的改变的核酸酶活性优选鉴于野生型Cas蛋白来测定，并且优选在相同或基本相同的条件下测定；本领域技术人员知道如何测定Cas蛋白的核酸酶活性。例如，来自酿脓链球菌的Cas9的RuvC I催化结构域中的天冬氨酸至丙氨酸替换(D10A)将Cas9从切割两条链的核酸酶的转化为切口酶，在本文中将所述切口酶定义为切割靶多核苷酸的单条链的Cas蛋白。使得Cas9变为切口酶的其他突变示例包括但不限于H840A、N854A和N863A。在本发明的背景下，具有切口酶活性的Cas蛋白可以通过同源重组，优选根据Ran等人,2013的双切口技术用于基因组编辑。因此，根据本发明的一个优选Cas蛋白包含至少一个突变，使得蛋白质相比于对应的野生型Cas蛋白具有改变的核酸酶活性，优选具有引导靶序列的位置处的单条多核苷酸链的切割的活性。这种所谓的切口酶突变体可方便地用于双链体背景中，即用于根据本发明的组合物中，所述根据本发明的组合物包含RuvC突变的Cas蛋白切口酶突变体和NHN突变的Cas蛋白切口酶突变体，使得一种Cas蛋白突变体切口靶多核苷酸的一条链并且另一种Cas蛋白突变体切口靶多核苷酸的另一条链。根据使用的两个向导多核苷酸，两种不同的CRISPR-Cas复合物有效地使得在多核苷酸靶标中产生两个单链切口；这些切口可以是若干个核苷酸，多至5、10、20、30个或更多个的间隔。这种双切口方法极大地增强了NEJH的特异性。关于双切口的背景信息可见于例如Ran等人,2013中。

根据本发明的Cas蛋白可以包含Cas9的两个或更多个突变型催化结构域，诸如RuvC I、RuvC II和/或RuvC III以使得突变型Cas9基本缺乏所有DNA切割活性。在一些实施方案中，D10A突变与H840A、N854A或N863A突变中的一种或多种结合以产生基本缺乏所有DNA切割活性的Cas9酶。优选地，当突变型酶的DNA切割活性相对于其非突变形式小约25％、10％、5％、1％、0.1％、0.01％或更小时，Cas被认为是基本缺乏所有DNA切割活性的。基本缺乏所有酶切割活性的Cas蛋白可以方便地用于基因沉默或下调表达，因为CRISPR-CAS复合物将阻碍靶多核苷酸的转录。其他突变可以是有用的；其中Cas9或其他Cas蛋白来自非酿脓链球菌的物种，可以进行对应氨基酸的突变来实现类似的效应；本领域的技术人员知道如何鉴定这些对应的氨基酸。

根据本发明的Cas蛋白可以是融合蛋白并且包含至少一个异源功能结构域，这种结构域优选为具有FokI活性的结构域，诸如由Aggarwal等人(Aggarwal,A.K.；Wah,D.A.；Hirsch,J.A.；Dorner,L.F.；Schildkraut,I.(1997)."Structure of the multimodularendonuclease FokI bound to DNA".Nature 388(6637):97–100)所述。酶FokI天然存在于海床黄杆菌(Flavobacterium okeanokoites)中并且是细菌IIS型限制性内切核酸酶，其由N-末端DNA结合结构域和在C末端处的非特异性DNA切割结构域组成(Durai等人,2005)。当FokI蛋白通过其DNA结合结构域在5'-GGATG-3':3'-CATCC-5'识别位点处结合双链DNA时，DNA切割结构域被激活并且在无需另外的序列特异性的情况下切割识别位点的最近核苷酸的下游的第一条链9个核苷酸和上游的第二条链13个核苷酸(Wah等人,1998。Cas9-FokI融合蛋白已尤其描述于Guilinger等人,2014和Tsai等人,2014中。

除Cas蛋白之外，根据本发明的Cas融合蛋白可以包含1、2、3、4、5、6、7、8、9、10个或更多个结构域。可以融合至Cas蛋白的蛋白结构域的示例包括但不限于，表位标签、报道基因序列、以及具有以下活性中的一种或多种活性的蛋白结构域：甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白(historic)修饰活性、RNA切割活性以及核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感血球凝集素(HA)标签、Myc标签、VSV-G标签、以及硫氧还蛋白(Trx)标签。报道基因的实例包括但不限于，谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、萤光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、以及自身荧光蛋白(包括蓝色荧光蛋白(BFP))。Cas蛋白可以融合至编码结合DNA分子或结合其他细胞分子的蛋白质或蛋白质片段的基因序列，该蛋白质包括但不限于，麦芽糖结合蛋白(MBP)、S-标签、Lex A DNA结合结构域(DBD)融合物、GAL4DNA结合结构域融合物、以及单纯疱疹病毒(HSV)BP 16蛋白融合物。可以形成包含CRISPR酶的融合蛋白的一部分的额外结构域描述于US20110059502中。经标签化Cas蛋白可用于鉴定靶多核苷酸的位置。一种优选的根据本发明的Cas融合蛋白包含如上文所定义的FokI结构域。

一种优选的根据本发明的Cas蛋白包含核定位序列，优选异源的核定位序列。这种核定位序列还称为核定位信号。优选地，这种核定位信号赋予CRISPR-Cas复合物足够的力量来驱动所述CRISPR-Cas复合物以可检测量聚集在宿主细胞的核中。在不希望受到理论约束的情况下，据信核定位序列不是为宿主细胞中的CRISPR-Cas活性所必需的，但是包括此类序列增强系统的活性，特别是对于靶向至核中的核酸分子而言。这种核定位序列优选存在于Cas蛋白中，但是也可存在于任何其他地方，使得有利于将CRISPR-Cas系统靶向至核。一种优选的核定位序列为SV40核定位序列。

在根据本发明的组合物中和任何其他实施方案中，编码Cas蛋白的多核苷酸优选针对其将在其中表达的宿主细胞进行密码子优化，更优选地，编码Cas蛋白的多核苷酸是经密码子对优化的。一般来讲，密码子优化是指在维持天然氨基酸序列的情况下通过以下方式修饰核酸序列来增强在目标宿主细胞中的表达的方法：通过用该宿主细胞的基因中更频繁使用或最频繁使用的密码子替换天然序列的至少一个密码子(例如，超过1、2、3、4、5、10、15、20、25、50或更多个密码子)。多种物种对于特定氨基酸的某些密码子表现出特定偏倚性。密码子偏倚性(生物体之间密码子使用的差异)常常与信使RNA(mRNA)的翻译效率相关，而该翻译效率则被认为依赖于(除其他之外)被翻译的密码子的特性和特定转移RNA(tRNA)分子的可获得性。细胞中选定的tRNA的优势度通常是肽合成中最频繁使用的密码子的反映。因此，基因可以被定制用于基于密码子优化在给定生物体中最佳基因表达。密码子使用表易于获得，例如在“密码子使用数据库”，并且这些表可以通过多种方式来调整适用。参见例如Nakamura,Y.等人,2000。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可得的，诸如基因制造(Gene Forge)(宾夕法尼亚州雅各布斯的Aptagen公司(Aptagen；Jacobus,PA))也是可得的。优选地，编码Cas蛋白的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50个、或更多个、或所有密码子)对应于特定氨基酸的最频繁使用的密码子。密码子优化的优选方法描述于WO2006/077258和WO2008/000632)中。WO2008/000632解决了密码子对优化。密码子对优化是一种这样的方法，其中编码多肽的核苷酸序列已相对于其密码子使用(特别是使用的密码子对)进行修饰，以获得编码多肽的核苷酸序列的改善表达和/或编码的多肽的改善的产生。密码子对被定义为编码序列中的一组两个连续的三联体(密码子)。根据本发明的组合物中的来源中的Cas蛋白的量可以变化并且可以针对最佳性能进行优化。可方便的是，避免宿主细胞中的Cas蛋白的水平太高，因为Cas蛋白的高水平可能对宿主细胞具有毒性，甚至在不存在向导多核苷酸的情况下(参见例如Ryan等人2014和Jacobs等人,2014)。本领域的技术人员知道如何调控表达水平，诸如通过选择较弱的启动子、阻抑型启动子或诱导型启动子用于表达Cas蛋白。适用于表达蛋白的启动子的示例示出在本文中的其他地方。

在其中根据本发明的向导多核苷酸由多核苷酸编码的根据本发明的组合物中，向导多核苷酸的表达可以通过可操作连接至编码多核苷酸的启动子促进。这种启动子可以是本领域技术人员已知的任何合适启动子。可以使用若干种类型的启动子。可方便的是使用RNA聚合酶III启动子或RNA聚合酶II启动子。关于RNA聚合酶III及其启动子的背景信息可以见于例如Marck等人,2006中。在一些情况下，诸如在酿酒酵母、粟酒裂殖酵母(S.pombe)中，RNA聚合酶III启动子包括转录区域中的启动子元件。因此，可方便的是使用RNA聚合酶II启动子；这些是本领域的技术人员已知的并且综述于例如Kornberg 1999中。然而，来自RNA聚合酶II的转录物常常具有复杂的转录终止子并且转录物为聚腺苷酸化的；这可阻碍对向导多核苷酸的要求，因为向导多核苷酸的5’和3’末端均需要被精确限定，以便实现产生功能性CRISPR-Cas系统所需的二级结构。然而，这些缺点可被避开。在使用RNA聚合酶II启动子的情况下，编码向导多核苷酸的多核苷酸也可编码自加工核酶并且可以可操作地连接至RNA聚合酶II启动子；这样，多核苷酸编码包含向导多核苷酸的前向导多核苷酸和自加工核酶，其中当转录时，向导多核苷酸通过自加工核酶从前向导多核苷酸转录物释放。包含可操作地连接至RNA聚合酶II启动子的编码根据本发明的前向导多核苷酸的多核苷酸的优选构建体是本文中实施例1-41中示出的那些。关于此类构建体的背景信息可见于例如Gao等人,2014等中。

优选地，在其中向导多核苷酸由多核苷酸编码的根据本发明的组合物中，所述多核苷酸可操作地连接至H1RNA聚合酶III启动子，优选人H1RNA聚合酶III启动子。

优选地，在其中向导多核苷酸由多核苷酸编码的根据本发明的组合物中，所述多核苷酸可操作地连接至U6RNA聚合酶III启动子，优选人U6RNA聚合酶III启动子。

优选地，在其中向导多核苷酸由多核苷酸编码的根据本发明的组合物中，所述多核苷酸可操作地连接至SNR52p RNA聚合酶III启动子，优选酵母SNR52p RNA聚合酶III启动子。当宿主是酵母宿主细胞，诸如酵母属(Saccharomyces)或克鲁维酵母属(Kluyveromyce)时，优选使用这种启动子。

优选地，在其中向导多核苷酸由多核苷酸编码的根据本发明的组合物中，所述多核苷酸可操作地连接至RNA聚合酶II启动子并且编码包含向导多核苷酸的前向导多核苷酸和自加工核酶，其中当转录时，向导多核苷酸通过自加工核酶从前向导多核苷酸转录物释放。包含可操作地连接至RNA聚合酶II启动子的编码根据本发明的前向导多核苷酸的多核苷酸的优选构建体是本文中实施例1-41中示出的那些。方便地，多个前向导多核苷酸和多个自加工核酶可以由单一多核苷酸编码，所述单一多核苷酸可操作地连接至一个或多个RNA聚合酶II启动子。

根据本发明的第一方面的组合物可方便地用于调节宿主细胞中多核苷酸的表达。因此，在第二方面中，本发明提供了一种调节宿主细胞中多核苷酸的表达的方法，所述方法包括使宿主细胞接触根据本发明的第一方面的组合物，其中向导多核苷酸引导Cas蛋白结合在宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物。

在本发明的背景下术语“表达”在本文中定义为多核苷酸从多核苷酸模板转录(例如，DNA模板多核苷酸转录成mRNA多核苷酸转录物或其他RNA转录物)的过程和/或mRNA转录物随后翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸转录物衍生自基因组模板DNA，则在宿主细胞中表达可以包括mRNA转录物的剪接。在本文中术语“调节表达”是指在使用相同条件测定时与其中表达未被调节的亲本宿主细胞相比表达增加或减少。减少的表达可以是转录物诸如mRNA的减少量和/或翻译产物诸如多肽的减少量。因此，增加的表达可以是转录物诸如mRNA的提高量和/或翻译产物诸如多肽的提高量。

优选地，CRISPR-Cas复合物切割靶多核苷酸的位置处的一条或两条多核苷酸链，使得调节基因产物的表达。CRISPR-Cas复合物还可以具有改变的核酸酶活性并且基本缺乏切割靶多核苷酸的一条或两条链的能力；在这种情况下，表达通过复合物与靶多核苷酸的结合调节。基本缺乏所有酶活性的Cas蛋白可以方便地用于基因沉默或下调表达，因为CRISPR-Cas复合物将阻碍靶多核苷酸的转录。另选地，Cas蛋白可被修饰成用于目标基因的可编程转录激活或沉默的转录因子(Larson等人,2013)。

根据本发明的第一方面的组合物可方便地用于多核苷酸的缺失。在一个实施方案中，当根据本发明的第一方面的组合物包含至少一个或两个向导多核苷酸的来源和/或至少一种Cas蛋白的来源时，形成至少一种CRISPR-Cas复合物或两种不同的CRISPR-Cas复合物，所述复合物切割靶多核苷酸的一个位置处或不同位置处的一条或两条多核苷酸链，从而使得从靶多核苷酸缺失多核苷酸片段。优选地，包含至少一个或两个向导多核苷酸和/或至少一种Cas蛋白的来源的根据本发明的这种组合物另外包含如下文定义的外源性多核苷酸，所述外源性多核苷酸与向导多核苷酸靶向的至少一个或两个靶多核苷酸至少部分地互补。待缺失的这种多核苷酸片段或已缺失的片段的长度可以是若干个核苷酸至数千个核苷酸，可以缺失整个基因或可以缺失基因簇。因此，本发明提供了一种调节宿主细胞中的多核苷酸的表达的方法，其中从靶多核苷酸缺失多核苷酸片段。

在一个实施方案中，调节表达的方法包括切割靶多核苷酸的至少一个位置处的一条或两条多核苷酸链，然后通过与外源性多核苷酸同源重组来修饰靶多核苷酸。在这种情况下，根据本发明的第一方面的组合物优选还包含这种外源性多核苷酸。这种修饰可导致至少一个核苷酸在靶多核苷酸中的插入、缺失或替换，其中插入或替换核苷酸可源自外源性多核苷酸。修饰也可在外源性多核苷酸是非整合实体时进行，诸如Dong等人和Beetham等人中所述的；在这种情况下，靶多核苷酸被修饰但没有外源性多核苷酸的核苷酸被引入到靶多核苷酸中。因此，当根据本发明的Cas蛋白以蛋白形式转化时，所得宿主是非重组宿主细胞。外源性多核苷酸可以是任何目标多核苷酸，诸如下文所定义的编码目标化合物的多核苷酸，或这种多核苷酸的一部分或其变体。这种外源性多核苷酸在本文中称为根据本发明的外源性多核苷酸并且可以是单链或双链的。

本领域的技术人员可以对根据本发明的组合物和方法考虑到各种应用。基因组中的多核苷酸(或基因)可以使用根据本发明的组合物和方法进行修饰、编辑或破坏。例如，当使用切割靶多核苷酸的两条链的完全活性的Cas蛋白时和当不存在外源性多核苷酸作为合适的修复模板时，双链断裂通过非同源末端连接修复(NHEJ)进行修复。在NHEJ期间，可发生一个或若干个核苷酸的插入和/或缺失(其在一些情况下可被理解为替换)，将它们在修复位点处随机插入或缺失；这是NHEJ的特征。这种插入和/或缺失可以影响编码序列的阅读框，使得基因产物中产生氨基酸变化或在(提前)终止密码子发生或剪接位点改变的情况下甚至产生截短型蛋白质。

在存在外源性多核苷酸作为修复模板时，基因组中多核苷酸(或基因)可以使用根据本发明的组合物和方法、使用同源末端连接修复(HEJ)(也称为同源定向修复(HDR))进行修饰、编辑或破坏。例如，当存在与靶多核苷酸(即在双链断裂的上游(5’)和下游(3’))具有序列同一性的外源性多核苷酸以及根据本发明的CRISPR-Cas系统时，HDR将外源性多核苷酸的对应核苷酸引入(或实际重新产生)在靶多核苷酸中的双链断裂处。优选地，根据本发明的外源性多核苷酸不含有其后是功能性PAM序列的靶序列自身，以避免外源性靶多核苷酸自身或经修饰的靶多核苷酸被CRISPR-CAS系统(再)切割的风险。

在本发明的一些实施方案中，当根据本发明的CRISPR-Cas系统包含外源性多核苷酸(供体多核苷酸、供体DNA、修复模板)时，根据本发明的CRISPR-Cas系统优选包含由一个或多个单独多核苷酸或载体编码或存在于一个或多个单独多核苷酸或载体上的两个或更多个向导多核苷酸，并且提供两个或更多个外源性多核苷酸以及能够形成两种或更多种CRISPR-CAS复合物的CRISPR-Cas系统。在根据本发明的一个方法中，根据本发明的这种CRISPR-Cas系统可方便地用于调节两个或更多个靶多核苷酸处的表达，即一种靶向多个靶位点的方法。根据本发明的这种CRISPR-Cas系统将随机在一个或多个靶多核苷酸处形成一种、两种或更多种CRISPR-CAS复合物。这种方法可以任选地与一个或多个外源性多核苷酸结合用于在宿主细胞的基因组中产生一个或多个插入、缺失、替换，或用于通过形成的CRISPR-CAS复合物调节基因的表达。

在本发明的一些实施方案中，当根据本发明的CRISPR-Cas系统包含外源性多核苷酸(供体多核苷酸、修复模板)时，外源性多核苷酸和向导多核苷酸可以由单一多核苷酸编码或存在于单一多核苷酸上。这使得能够合成两个或更多个此类组合多核苷酸和甚至文库合成此类组合多核苷酸。这种文库可以库的形式提供并且用于形成载体和/或多核苷酸的文库，在所述文库中，向导多核苷酸和外源性多核苷酸一起由一个多核苷酸编码或存在于一个多核苷酸上。这种库使得根据本发明的CRISPR-Cas系统能够用于类似文库的多重系统中。在根据本发明的这种CRISPR-Cas系统中，外源性多核苷酸和向导多核苷酸可以直接连接或可以通过接头多核苷酸隔开。

在一个实施方案中，向导多核苷酸和外源性多核苷酸通过下述接头多核苷酸连接：所述接头多核苷酸编码或呈现向导多核苷酸的编码或呈现gRNA 3’序列和终止子的右侧翼，或编码或呈现向导多核苷酸的编码或呈现gRNA 5’序列和启动子的左侧翼。这使得能够合成两个或更多个此类组合多核苷酸和甚至文库合成此类组合多核苷酸。此类组合多核苷酸可以进一步加工形成具有一个或多个功能性向导多核苷酸(含有启动子和终止子)的组合多核苷酸。

在一个实施方案中，向导多核苷酸和外源性多核苷酸通过下述接头多核苷酸连接：所述接头多核苷酸编码或呈现向导多核苷酸的编码或呈现gRNA 3’序列和终止子的右侧翼和所述向导多核苷酸的多核苷酸靶标，或编码或呈现所述向导多核苷酸的多核苷酸靶标和向导多核苷酸的编码或呈现gRNA 5’序列和启动子的左侧翼，其中体内CRISPR-Cas系统可在组合多核苷酸处形成以切割组合多核苷酸。

在一个实施方案中，根据本发明的一个或多个组合多核苷酸可以与编码根据本发明的Cas蛋白的一个或多个载体重组(例如通过直接克隆或体内重组)。一个或多个此类重组载体能够形成一种或多种CRISPR-CAS复合物。

根据本发明的这个方面的宿主细胞可以是如本文定义的任何宿主细胞。优选的宿主细胞是经修饰的宿主细胞，其中与对应的野生型宿主细胞相比，与非同源末端连接(NHEJ)相关联的组分的表达被改变，优选与NHEJ相关联的组分的表达被降低。与NHEJ相关联的优选组分为酵母Ku70和Ku80及其在根据本发明的优选非哺乳动物宿主细胞中相应同源物。与NHEJ相关联的另一优选组分为酵母LIG4及其在根据本发明的优选非哺乳动物宿主细胞中相应同源物。

在根据本发明的这个方面的一个方法中，优选的宿主细胞包含编码如本文他处所定义的目标化合物的多核苷酸。

在根据本发明的这个方面的一个方法中，宿主细胞可以是重组宿主细胞或可以是非重组宿主细胞。

在根据本发明的这个方面的宿主细胞中调节多核苷酸的表达的方法产生经修饰的宿主细胞，所述经修饰的宿主细胞优选包含根据本发明的第一方面的组合物的组分。因此，在第三方面中，本发明提供了包含根据本发明的第一方面的组合物的宿主细胞。这种宿主细胞可以是如本文定义的任何宿主细胞，并且还可以包含编码如本文他处所定义的目标化合物的多核苷酸。

在第四方面，本发明提供了一种产生宿主细胞的方法，所述方法包括使宿主细胞接触根据本发明的第一方面的组合物，其中向导多核苷酸引导Cas蛋白结合在宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物。在一个实施方案中，接触根据本发明的第一方面的组合物可以两步进行，其中首先使宿主细胞接触根据本发明的Cas蛋白的来源，并且随后使宿主细胞接触根据本发明的向导多核苷酸的来源和任选的根据本发明的外源性多核苷酸。在本发明的这个实施方案中的宿主细胞可以是如本文定义的任何类型的宿主细胞，并且可以包含编码如本文他处所定义的目标化合物的多核苷酸。产生根据本发明的宿主细胞的一个优选方法包括产生后代宿主细胞的步骤，其中在所述后代宿主细胞中，不再存在根据本发明的CRISPR-Cas系统的组分。一个另外优选的宿主细胞是经修饰的宿主细胞，其中与对应的野生型宿主细胞相比，如上文示出的与NHEJ相关联的组分的表达被改变，优选与NHEJ相关联的组分的表达被降低。

根据本发明的第一方面的组合物可以是如本文定义的任何这种组合物。宿主细胞与根据本发明的组合物接触可以通过本领域的技术人员已知的任何手段进行。根据本发明的宿主细胞可以简单地引入到包含根据本方面的组合物的溶液中。可以使用将根据本发明的组合物递送至宿主细胞中的特定手段。本领域的技术人员知晓此类方法(参见例如Sambrook&Russell；Ausubel，同上)，其包括但不限于电穿孔法、粒子轰击或微粒轰击、原生质体法和土壤杆菌(Agrobacterium)介导的转化(AMT)。优选地，对丝状真菌使用原生质体方法。除其它之外，J.R.S.Fincham,Transformation in fungi.1989,Microbiologicalreviews.53,148-170描述了转化程序。转化可涉及由原生质体形成、原生质体的转化和细胞壁的再生以本身已知的方式组成的过程。转化Aspergillus细胞的合适程序描述于EP238 023和Yelton等,1984,Proceedings of the National Academy of Sciences USA81:1470-1474中。使用Agrobacterium tumefaciens转化Aspergillus和其他丝状真菌宿主细胞的合适程序描述于例如De Groot等人,Agrobacterium tumefaciens-mediatedtransformation of filamentous fungi.Nat Biotechnol.1998,16:839-842中，勘误在Nat Biotechnol 1998 16:1074中。Malardier等人,1989,Gene 78:147156或WO 96/00787中描述了转化Fusarium物种的合适方法。可被应用的其它方法，例如使用基因枪转化的方法描述于Christiansen等人,Biolistic transformation of the obligate plantpathogenic fungus,Erysiphe graminis f.sp.hordei.1995,Curr Genet.29:100-102中。酵母可以使用本领域中已知的任何方法转化，诸如使用由Becker和Guarente,In Abelson,J.N.和Simon,1983；Hinnen等人,1978和Gietz RD,Woods RA.2002所述的程序。

优选地，CRISPR-Cas复合物切割靶多核苷酸的位置处的一条或两条多核苷酸链，使得调节基因产物的表达。CRISPR-Cas复合物还可以具有改变的核酸酶活性并且缺乏切割靶多核苷酸的一条或两条链的能力；在这种情况下，表达通过复合物与靶多核苷酸的结合调节。

在一个实施方案中，当根据本发明的第一方面的组合物包含至少一个或两个向导多核苷酸的来源和/或至少一种Cas蛋白的来源时，形成至少一种CRISPR-Cas复合物或两种不同的CRISPR-CAS复合物，所述复合物切割靶多核苷酸的一个位置处或不同位置处的一条或两条多核苷酸链，从而使得从靶多核苷酸缺失多核苷酸片段。优选地，包含至少一个或两个向导多核苷酸和/或至少一种Cas蛋白的来源的根据本发明的这种组合物另外包含如下文定义的外源性多核苷酸，所述外源性多核苷酸与向导多核苷酸靶向的至少一个或两个靶多核苷酸至少部分地互补。待缺失的这种多核苷酸片段或已缺失的片段的长度可以从若干个核苷酸至数千个核苷酸，可以缺失整个基因或可以缺失基因簇。因此，本发明提供了一种调节宿主细胞中的多核苷酸的表达的方法，其中从靶多核苷酸缺失多核苷酸片段。

在一个实施方案中，其中从靶多核苷酸缺失多核苷酸片段的调节宿主细胞中的多核苷酸的表达的方法包括使宿主细胞接触如本文所述的组合物，其中向导多核苷酸引导Cas蛋白结合在宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物。优选地，其中从靶多核苷酸缺失多核苷酸片段的调节宿主细胞中的多核苷酸的表达的方法包括使宿主细胞接触如本文所述的组合物，其中向导多核苷酸引导Cas蛋白结合在宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物，其中宿主细胞是在与NHEJ相关联的组分上有缺陷的经修饰的宿主细胞。在另一优选实施方案中，其中从靶多核苷酸缺失多核苷酸片段的调节宿主细胞中的多核苷酸的表达的方法包括使宿主细胞接触如本文所述的组合物，其中向导多核苷酸引导Cas蛋白结合在宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物，其中宿主细胞是在与NHEJ相关联的组分上有缺陷的经修饰的宿主细胞，其中如本文所述的组合物不包含外源性或供体多核苷酸。在一个优选的实施方案中，与NHEJ相关联的组分是酵母Ku70或酵母Ku80或酵母LIG4或其在根据本发明的宿主细胞中相应同源物。在调节宿主细胞中的多核苷酸的表达的方法的另一个实施方案中，组合物包含在AMA载体中。

因此，在一个实施方案中，本发明涉及一种调节细胞中的多核苷酸的表达的方法，其中从靶多核苷酸缺失多核苷酸片段，所述方法包括使宿主细胞接触如本文所述但优选不包含如本文定义的供体多核苷酸的组合物，其中向导多核苷酸引导Cas蛋白结合在宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物，其中宿主细胞在与NHEJ相关联的组分上有缺陷，优选酵母Ku70或酵母Ku80或酵母LIG4或其在所述宿主细胞中的相应同源物。

出人意料地，已发现，在如本文所述的其中从靶多核苷酸缺失多核苷酸片段的调节细胞中的多核苷酸的表达的方法中，在涉及NHEJ的基因缺陷的宿主细胞中，当同源区域存在于预期切割位点的两个位点处并且其中如本文所述的组合物不包含供体DNA时，可通过使用CRISPR/CAS9系统以可控方式获得宿主细胞基因组中的缺失。

因此，在一个实施方案中，本发明涉及一种调节细胞中的多核苷酸的表达的方法，其中从靶多核苷酸缺失多核苷酸片段，所述方法包括使宿主细胞接触包含含有向导多核苷酸和Cas蛋白的CRISPR-Cas系统的来源的非天然存在或工程化的组合物，其中向导多核苷酸包含基本上是为宿主细胞中靶多核苷酸的反向互补体的向导序列并且向导多核苷酸可以引导Cas蛋白结合在宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物，其中向导序列基本上为宿主细胞的基因组中5’-(N)yPAM-3’多核苷酸序列靶标的(N)y部分的反向互补体，其中y为8-30的整数，其中PAM为前间区序列邻近基序，其中宿主细胞为真核细胞，所述真核细胞是丝状真菌，优选Aspergillus、Penicillium、Rasamsonia或Mortierella，并且其中PAM优选为选自以下的序列：5’-XGG-3’、5’-XGGXG-3’、5’-XXAGAAW-3’、5’-XXXXGATT-3’、5’-XXAGAA-3’、5’-XAAAAC-3’，其中X可以为任何核苷酸或其类似物，优选X可以为任何核苷酸；并且W为A或T，但在本文中所述组合物优选不包含如本文定义的供体多核苷酸，其中向导多核苷酸引导Cas蛋白结合在宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物，其中宿主细胞在与NHEJ相关联的组分上有缺陷，优选酵母Ku70或酵母Ku80或酵母LIG4或其在宿主细胞中相应同源物，其中Cas蛋白具有引导靶多核苷酸的位置处的两条多核苷酸链的切割的活性，并且其中切割发生于这样的基因组的区域中，所述区域包含在由Cas蛋白切割后彼此重组的两个同源区之间，从而导致包含在所述区之间的多核苷酸的缺失。

优选地，两个同源区之间的同源程度是允许同源重组的同源程度。优选地，两个同源区在同源区的整个长度上具有至少60％、70％、80％、90％、99％或100％序列同一性。已出人意料地发现，甚至在丝状真菌中同源区的长度可以是非常短的，在丝状真菌中通常至少1kb或几个kb的长度是允许同源重组所必需的。因此，在一个优选的实施方案中，同源区的长度优选为至多1kb、至多0.5kb、至多100bp、至多50bp、至多40bp、至多30bp、至多20bp、至多10bp。

优选地，两个同源区之间的距离为至多10kb、至多9、至多8kb、至多7kb、至多6kb、至多5kb、至多4kb、至多3kb、至多2kb、至多1kb、至多0.5kb、至多100bp、至多50bp、至多40bp、至多30、20、10kb。

在一方面，本发明涉及一种软件算法，其能够鉴定包含于在PAM位点附近约7-20bp的同源区之间的基因组中的PAM位点，以设计靶向一个或多个PAM位点并且在不使用供体DNA的情况下产生多核苷酸缺失的方法。

上述方法可用于以设计方式有效地去除多核苷酸序列。例如，在将Cas9表达盒引入在基因组DNA后并且在CRISPR/CAS9系统介导若干轮修饰之后，可以通过引入靶向Cas9表达盒中的位点的gRNA而从基因组去除CAS9，并且其中Cas9表达盒包含在如上文定义的两个同源区之间，优选100-bp长，更优选20-bp、15-bp长或更短，以及切割出Cas9开放阅读框或表达盒的大部分。

上述方法还可用于基因的瞬时灭活。例如，可例如通过以下使得基因例如Ku70多核苷酸变为非功能性：在包含分别在5’末端和3’末端处的两个同源区的Ku70基因的ORF中插入多核苷酸序列，其中优选同源区为100-bp长，更优选20-bp、15-bp长或更短。Ku70基因可以同样如上所述那样在不使用供体DNA的情况下使用CRISPR-Cas9系统再次变得具有功能性。

在一个实施方案中，调节表达的方法包括切割靶多核苷酸的至少一个位置处的一条或两条多核苷酸链，然后通过与外源性多核苷酸同源重组来修饰靶多核苷酸。在这种情况下，根据本发明的第一方面的组合物优选还包含这种外源性多核苷酸。这种修饰可导致靶多核苷酸中至少一个核苷酸的插入、缺失或替换，其中插入或替换核苷酸可以或可以不源自外源性多核苷酸。在一个实施方案中，外源性多核苷酸包含与靶多核苷酸同源的区域。优选地，这些同源区之间的同源程度是允许同源重组的同源程度。优选地，同源区在同源区的整个长度上具有至少60％、70％、80％、90％、99％或100％序列同一性。在一个实施方案中，其中宿主细胞在如本文定义的涉及NHEJ的组分上有缺陷，同源区优选为至多1kb、至多0.5kb、至多100bp、至多50bp、至多40bp、至多30bp、至多20bp、至多10bp。修饰也可在外源性多核苷酸是非整合实体时产生；在这种情况下，靶多核苷酸被修饰但没有外源性的多核苷酸的核苷酸被引入到靶多核苷酸中。因此，当根据本发明的Cas蛋白以蛋白形式转化时，所得宿主是非重组宿主。在根据本发明的这个方面的一个方法中，宿主细胞因此可以是重组宿主细胞或可以是非重组宿主细胞。外源性多核苷酸可以是任何目标多核苷酸，诸如本文所定义的编码目标化合物的多核苷酸，或这种多核苷酸的一部分或其变体。

在第五方面，本发明提供了一种产生目标化合物的方法，所述方法包括在有利于目标化合物的条件下培养根据本发明的第三方面或第四方面的宿主细胞或可通过根据本发明的第二方面的方法获得的宿主细胞，或可通过根据本发明的第四方面获得的宿主细胞，并且任选地纯化或分离目标化合物。

在本发明的所有实施方案的背景下的目标化合物可以为任何生物化合物。生物化合物可以是生物质或生物聚合物或代谢物。生物化合物可由构成生物合成或代谢途径的单一多核苷酸或一系列多核苷酸编码或可以是单一多核苷酸的产物或一系列多核苷酸的产物的直接结果，多核苷酸可以为基因，一系列多核苷酸可以为基因簇。在本发明的所有实施方案，编码目标生物化合物或与目标生物化合物相关联的生物合成或代谢途径的单一多核苷酸或一系列多核苷酸是根据本发明的组合物和方法的优选靶标。生物化合物可以对宿主细胞是天然的或对宿主细胞是异源的。

本文将术语“异源生物化合物”定义为对于细胞并非天然的生物化合物；或其中已经进行结构修饰以改变天然生物化合物的天然生物化合物。

本文将术语“生物聚合物”定义为相同、相似或不相似的亚单位(单体)的链(或聚合物)。生物聚合物可以是任何生物聚合物。生物聚合物可例如是但不限于核酸、聚胺、多元醇、多肽(或聚酰胺)或多糖。

生物聚合物可以是多肽。所述多肽可以是具有目标生物活性的任何多肽。术语“多肽”在本文中并非意在指特定长度的编码产物，因此涵盖肽、寡肽和蛋白质。术语多肽是指任何长度的氨基酸的聚合物。该聚合物可以是线性或支化的，它可以包含经修饰氨基酸，并且它可以被非氨基酸中断。所述术语也涵盖已加以修饰的氨基酸聚合物；例如二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作(如与标记性组分缀合)。如本文所用，术语“氨基酸”包括天然和/或非天然或合成的氨基酸，包括甘氨酸和D或L光学异构体二者，以及氨基酸类似物和肽模拟物。多肽进一步包括以上提到的多肽的天然存在的等位和工程化变体及杂合多肽。所述多肽对于宿主细胞可以是天然的或可以是异源的。多肽可以是胶原或明胶，或其变体或杂合体。多肽可以是抗体或其部分、抗原、凝集因子、酶、激素或激素变体、受体或其部分、调控蛋白、结构蛋白、报告子或转运蛋白、涉及分泌过程的蛋白质、涉及折叠过程的蛋白质、伴侣蛋白、肽氨基酸转运体、糖基化因子、转录因子、合成肽或寡肽、细胞内蛋白。细胞内蛋白可以是酶，诸如蛋白酶、神经酰胺酶、环氧化物水解酶、氨基肽酶、酰基转移酶、醛缩酶、羟化酶、氨基肽酶、脂肪酶。多肽也可以是细胞外分泌的酶。这种酶可以属于以下各项的组：氧化还原酶、转移酶、水解酶、裂解酶、异构酶、连接酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、葡聚糖酶、酯酶。所述酶可以是碳水化合物酶，例如纤维素酶诸如葡聚糖内切酶、β-葡聚糖酶、纤维二糖水解酶或β-葡糖苷酶、半纤维素酶或果胶分解酶诸如木聚糖酶、木糖苷酶、甘露聚糖酶、半乳聚糖酶、半乳糖苷酶、果胶甲基酯酶、果胶裂解酶、果胶酸裂解酶、多聚半乳糖醛酸内切酶、多聚半乳糖醛酸外切酶、鼠李糖半乳糖醛酸酶、阿拉伯聚糖酶、阿拉伯呋喃糖酶、阿糖基木聚糖水解酶、半乳醣醛酸酶、裂解酶或淀粉水解酶；水解酶、异构酶或连接酶、磷酸酶诸如植酸酶、酯酶(诸如脂肪酶)、蛋白水解酶、氧化还原酶(诸如氧化酶)、转移酶或异构酶。所述酶可以是植酸酶。所述酶可以是氨基肽酶、天冬酰胺酶、淀粉酶、麦芽糖淀粉酶、碳水化合物酶、羧肽酶、内切蛋白酶、金属蛋白酶、丝氨酸蛋白酶、过氧化氢酶、几丁质酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、蛋白质脱氨酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷脂酶、半乳糖脂酶、叶绿素酶、多酚氧化酶、核糖核酸酶、谷氨酰胺转移酶或葡萄糖氧化酶、己糖氧化酶、单加氧酶。在一个实施方案中，目标化合物可以是酶组合物，其包含至少两种酶活性，通常多于两种活性，例如三种、四种、五种、六种、七种、八种、九种或更多种。酶组合物可以包含纤维素分解和/或半纤维素分解酶活性，并且可以具有改变例如降解非淀粉碳水化合物材料(例如木质纤维素)的能力。酶组合物可以包含至少一种纤维素酶和至少一种半纤维素酶。此外，酶组合物可包含辅助酶活性，即直接或间接导致木质纤维素降解的额外的活性。因此，酶组合物可包含内切葡聚糖酶活性和/或纤维二糖水解酶活性和/或β-葡糖苷酶活性。酶组合物可包含一个或多个这些种类中的多于一种的酶活性。WO2011/000949中描述了能够降解非淀粉碳水化合物材料(例如木质纤维素)的酶组合物的实例及其生产。根据本发明，目标化合物可以是具有改善的分泌特征的多肽或酶，如WO2010/102982中所述。根据本发明，目标化合物可以是融合或杂合的多肽，另一多肽在所述多肽或其片段的N末端或C末端处融合。融合的多肽通过将编码一种多肽的核酸序列(或其一部分)与编码另一多肽的核酸序列(或其一部分)融合来产生。

产生融合多肽的技术在本领域中已知，并且包括连接编码多肽的编码序列，以致其在框内并且融合多肽的表达受相同启动子和终止子的控制。杂合多肽可包含从至少两种不同多肽获得的部分或完整多肽序列的组合，其中一种或多种所述多肽可以与宿主细胞异源。在例如WO2010/121933中描述了融合多肽和信号序列融合物的示例。

生物聚合物可以是多糖。多糖可为任何多糖，包括但不限于粘多糖(例如，肝素和透明质酸)和含氮多糖(例如，几丁质)。在一个优选的选项中，多糖为透明质酸。

编码目标化合物或编码参与根据本发明的目标化合物的产生的化合物的多核苷酸可编码参与初级代谢物或次级代谢物，诸如有机酸、类胡萝卜素、(β-内酰胺)抗生素和维生素的合成的酶。这种代谢物可视为根据本发明的生物化合物。

术语“代谢物”涵盖初级代谢物和次级代谢物；代谢物可为任何代谢物。优选的代谢物为柠檬酸、葡糖酸、己二酸、富马酸、衣康酸和琥珀酸。

代谢物可由诸如在生物合成或代谢途径中的一个或多个基因编码。初级代谢物是与能量代谢、生长和结构相关的细胞的主要或一般代谢的产物。次级代谢物是次级代谢的产物(参见例如R.B.Herbert,The Biosynthesis of Secondary Metabolites,Chapmanand Hall,New York,1981)。

初级代谢物可以是但不限于氨基酸、脂肪酸、核苷、核苷酸、糖、甘油三酯或维生素。

次级代谢物可以是但不限于生物碱、香豆素、类黄酮、聚酮、奎宁、类固醇、肽或萜。次级代谢物可以是抗生素、拒食素、引诱剂、杀菌剂、杀真菌剂、激素、杀虫剂或杀鼠剂。优选的抗生素为头孢菌素和β-内酰胺类。其他优选代谢物为外代谢物。外代谢物的示例为Aurasperone B、Funalenone、Kotanin、Nigragillin、Orlandin、其他萘并-γ-吡喃酮、吡喃黑杆菌素A(Pyranonigrin A)、Tensidol B、伏马菌素B2和赭曲霉素A。

生物化合物也可以是选择标记的产物。选择标记为目标多核苷酸的产物，所述产物提供了杀生物剂或病毒抗性、重金属抗性、对营养缺陷型的原营养等。选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨基甲酰转移酶)、bar(草胺膦乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、trpC(邻氨基苯甲酸合酶)、ble(腐草霉素抗性蛋白)、hyg(潮霉素)、NAT或NTC(诺尔丝菌素)及其等效物。

根据本发明，目标化合物优选为目标化合物列表中描述的多肽。

根据本发明的另一个实施方案，目标化合物优选为代谢物。

根据本发明的宿主细胞可以已经能够产生目标化合物。也可为突变微生物宿主细胞提供编码多肽的同源或异源核酸构建体，其中多肽可为目标化合物或参与目标化合物的产生的多肽。本领域的技术人员知道如何修饰微生物宿主细胞使得其能够产生目标化合物。

一般定义

贯穿本说明书和所附权利要求书，词语“包含”、“包括”和“具有”都解释为包含在内。即，这些词意在可能包含上下文允许但没有具体描述的其他成分或整体。

没有数量词修饰时在本文中用于指代一个/种或多于一个/种(即一或至少一)对象。通过举例，“元件”可以意指一个/种元件或多于一个/种元件。

词语“约”或“大约”在结合数值(例如，约10)使用时优选意指值可以是比所述值(10)多或少1％的给定值。

优选的核苷酸类似物或等同物包括修饰的骨架。此类骨架的示例通过以下各项提供：吗啉代骨架；氨基甲酸酯骨架；硅氧烷骨架；硫化物、亚砜和砜骨架；甲酰乙酰基和硫代甲酰乙酰基骨架；亚甲基甲酰乙酰基骨架；核糖乙酰基骨架；含烯烃的骨架；氨基磺酸酯、磺酸酯和磺酰胺骨架；亚甲基亚胺基和亚甲基肼基骨架；以及酰胺骨架。进一步优选的是，骨架中残基之间的连接不包括磷原子，诸如通过短链烷基或环烷基核苷间键、混合杂原子和烷基或环烷基核苷间键或一个或多个短链杂原子或杂环核苷间键形成的连接。

一个优选的核苷酸类似物或等同物包括肽核酸(PNA)，其具有经修饰的聚酰胺骨架(Nielsen等人(1991)Science 254,1497-1500)。基于PNA的分子在碱基对识别方面是DNA分子的真实模拟物。PNA的骨架由通过肽键连接的N-(2-氨乙基)-甘氨酸单元构成，其中核碱基通过亚甲基羰基键连接至骨架。替代性骨架包含一碳延长的吡咯烷PNA单体(Govindaraju和Kumar(2005)Chem.Commun,495–497)。因为PNA分子的骨架不含有带电的磷酸酯基团，所以PNA-RNA杂交体通常分别比RNA-RNA或RNA-DNA杂交体更稳定(Egholm等人(1993)Nature 365,566-568)。

另一优选骨架包括吗啉代核苷酸类似物或等同物，其中核糖或脱氧核糖被6元环吗啉代环置换。一个最优选的核苷酸类似物或等同物包含二氨基磷酸酯吗啉代寡核苷酸(PMO)，其中核糖或脱氧核糖被6元环吗啉代环置换，并且相邻吗啉代环之间阴离子磷酸二酯键被非离子的二氨基磷酸酯键置换。

另一优选的核苷酸类似物或等同物包含磷酸二酯键中的至少一个非桥联氧的取代。这种修饰稍微使碱基对不稳定，但是添加了对核酸酶降解的显著抗性。优选的核苷酸类似物或等同物包含硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、H-膦酸酯、甲基和其他烷基膦酸酯包括3’-亚烷基膦酸酯、5'-亚烷基膦酸酯和手性膦酸酯、亚膦酸酯、氨基磷酸酯包括3'-氨基氨基磷酸酯和氨烷基氨基磷酸酯、硫羰氨基磷酸酯、硫羰磷酸烷基酯、硫羰烷基磷酸三酯、硒代磷酸酯或硼磷酸酯。

另一优选的核苷酸类似物或等同物包含一个或多个糖部分，其在2'、3'和/或5'位置处是单取代或二取代的，诸如-OH；-F；取代的或未取代的、直链或支链的低级(C1-C10)烷基、烯基、炔基、烷芳基、烯丙基、芳基或芳烷基，它们可插入有一个或多个杂原子；O-、S-或N-烷基；O-、S-或N-烯基；O-、S-或N-炔基；O-、S-或N-烯丙基；O-烷基-O-烷基、-甲氧基、-氨基丙氧基；氨氧基(aminoxy)、甲氧基乙氧基；-二甲基氨氧基乙氧基；和-二甲基氨基乙氧基乙氧基。糖部分可以是吡喃糖或其衍生物、或脱氧吡喃糖或其衍生物，优选核糖或其衍生物，或脱氧核糖或其衍生物。此类优选的衍生化糖部分包含锁核酸(LNA)，其中2’-碳原子连接至糖环的3’或4’碳原子，从而形成双环糖部分。优选的LNA包括2'-O,4'-C-亚乙基桥联的核酸(Morita等人2001.Nucleic Acid Res Supplement No.1:241-242)。这些取代基使得核苷酸类似物或等同物具有RNase H和核酸酶抗性，并且增加对靶标的亲和力。

在本发明的背景下，本文将氨基酸或核酸序列的“序列同一性”或“一致性”定义为通过比较序列确定的两种或更多种氨基酸(肽、多肽或蛋白质)序列或两种或更多种核酸(核苷酸、寡核苷酸、多核苷酸)序列之间的关系。在本领域中，同一性还意指氨基酸或核苷酸序列之间的序列相关程度，视情况通过此类序列串之间的匹配确定。在本发明内，与特定序列的序列同一性优选意指在所述特定多肽或多核苷酸序列的整个长度上的序列同一性。

两种氨基酸序列之间的“相似性”通过将一种肽或多肽的氨基酸序列及其保守氨基酸替换与第二种肽或多肽的序列比较来确定。在一个优选的实施方案中，在如本文所鉴定的整个序列(SEQ ID NO:)上计算同一性或相似性。“同一性”和“相似性”可以容易地通过已知方法计算，这些已知方法包括但不限于以下各项中所述的那些：ComputationalMolecular Biology,Lesk,A.M.编,Oxford University Press,New York,1988；Biocomputing:Informatics and Genome Projects,Smith,D.W.编,Academic Press,NewYork,1993；Computer Analysis of Sequence Data,部分I,Griffin,A.M.和Griffin,H.G.编,Humana Press,New Jersey,1994；Sequence Analysis in Molecular Biology,vonHeine,G.,Academic Press,1987；和Sequence Analysis Primer,Gribskov,M.和Devereux,J.编,M Stockton Press,New York,1991；以及Carillo,H.和Lipman,D.,SIAMJ.Applied Math.,48:1073(1988)。

设计了用于确定同一性的优选方法，以得出测试序列之间的最大匹配。可公开获得的计算机程序中编纂了确定同一性和相似性的方法。确定两种序列之间的同一性和相似性的优选计算机程序方法包括例如GCG程序包(Devereux,J.等人,Nucleic AcidsResearch 12(1):387(1984))、BestFit、BLASTP、BLASTN和FASTA(Altschul,S.F等人,J.Mol.Biol.215:403-410(1990)。BLAST X程序可自NCBI和其它来源(BLAST Manual,Altschul,S.等人,NCBI NLM NIH Bethesda,MD 20894；Altschul,S.等人,J.Mol.Biol.215:403-410(1990)公开获得。熟知的Smith Waterman算法也可用于确定同一性。

用于多肽序列比较的优选参数包括以下：算法：Needleman和Wunsch,J.Mol.Biol.48:443-453(1970)；比较矩阵：来自Hentikoff和Hentikoff,Proc.Natl.Acad.Sci.USA.89:10915-10919(1992)的BLOSSUM62；空位罚分：12；和空位长度罚分：4。可与这些参数一起使用的程序可以从位于威斯康星州麦迪逊(Madison,WI)的遗传计算机组(Genetics Computer Group)的“Ogap”程序公共获得。前述参数是用于氨基酸比较(同时对末端空位不罚分)的默认参数。

用于核酸比较的优选参数包括以下：算法：Needleman和Wunsch,J.Mol.Biol.48:443-453(1970)；比较矩阵：匹配＝+10，错配＝0；空位罚分：50；和空位长度罚分：3。可从位于威斯康星州麦迪逊的遗传计算机组的Gap程序获得。上文给出的是用于核酸比较的默认参数。

任选地，在确定氨基酸相似性的程度中，技术人员还可考虑所谓的“保守”氨基酸替换，如技术人员将清楚的。保守氨基酸替换是指具有类似侧链的残基的可互换性。例如，具有脂肪族侧链的一组氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸；具有脂肪族-羟基侧链的一组氨基酸是丝氨酸和苏氨酸；具有含酰胺侧链的一组氨基酸是天冬酰胺和谷氨酰胺；具有芳香族侧链的一组氨基酸是苯丙氨酸、酪氨酸和色氨酸；具有碱性侧链的一组氨基酸是赖氨酸、精氨酸和组氨酸；并且具有含硫侧链的一组氨基酸是半胱氨酸和甲硫氨酸。优选的保守氨基酸替换组为：缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸以及天冬酰胺-谷氨酰胺。本文公开的氨基酸序列的替换变体是其中所公开序列中的至少一个残基已被去除并且在其位置插入不同的残基的那些。优选地，氨基酸变化是保守的。针对每种天然存在的氨基酸的优选保守替换如下：Ala至ser；Arg至lys；Asn至gln或his；Asp至glu；Cys至ser或ala；Gln至asn；Glu至asp；Gly至pro；His至asn或gln；Ile至leu或val；Leu至ile或val；Lys至arg；gln或glu；Met至leu或ile；Phe至met；leu或tyr；Ser至thr；Thr至ser；Trp至tyr；Tyr至trp或phe；以及Val至ile或leu。

根据本发明的多核苷酸由核苷酸序列表示。根据本发明的多肽由氨基酸序列表示。根据本发明的核酸构建体被定义为分离自天然存在的基因或已被修饰成含有以原本不天然存在的方式组合或并置的多核苷酸区段的多核苷酸。任选地，存在于根据本发明的核酸构建体中的多核苷酸可操作地连接至一种或多种控制序列，所述一种或多种控制序列引导宿主细胞中或无细胞系统中的编码产物的产生或表达。

如本文提供的序列信息不应狭隘地解释为需要包含错误鉴定的碱基。技术人员能够识别此类错误鉴定的碱基并且知道如何校正此类错误。

本发明的所有实施方案，即根据本发明的组合物、调节表达的方法、包含根据本发明的组合物的宿主细胞、产生根据本发明的宿主细胞的方法、根据本发明的宿主细胞和产生根据本发明的目标化合物的方法优选是指宿主细胞，不是无细胞体外系统；换句话讲，根据本发明的CRISPR-Cas系统优选宿主细胞系统，而非无细胞体外系统。

在本发明的所有实施方案，例如根据本发明的组合物、调节表达的方法、包含根据本发明的组合物的宿主细胞、产生根据本发明的宿主细胞的方法、根据本发明的宿主细胞和产生根据本发明的目标化合物的方法中，根据本发明的宿主细胞可以是单倍体、二倍体或多倍体宿主细胞。

根据本发明的宿主细胞是丝状真菌宿主细胞。本文所定义的丝状真菌包括Eumycota和Oomycota亚门的所有丝状形式(由Hawksworth等人在Ainsworth and Bisby'sDictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中定义)。

丝状真菌宿主细胞可以是Trichocomaceae分类单元的任何丝状形式的细胞(由Houbraken和Samson在Studies in Mycology 70:1–51.2011中定义)。在另一个优选的实施方案中，丝状真菌宿主细胞可以是包含在Trichocomaceae分类单元中的3个科：Aspergillaceae、Thermoascaceae和Trichocomaceae中任一种的任何丝状形式的细胞。

丝状真菌的特征为由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其它复杂多糖构成的菌丝壁。营养生长通过菌丝伸长进行且碳分解代谢绝对好氧。丝状真菌菌株包括但不限于，Acremonium,Agaricus,Aspergillus,Aureobasidium,Chrysosporium,Coprinus,Cryptococcus,Filibasidium,Fusarium,Humicola,Magnaporthe,Mortierella,Mucor,Myceliophthora,Neocallimastix,Neurospora,Paecilomyces,Penicillium,Piromyces,Panerochaete,Pleurotus,Schizophyllum,Talaromyces,Rasamsonia,Thermoascus,Thielavia,Tolypocladium和Trichoderma的菌株。根据本发明的优选丝状真菌宿主细胞来自选自Acremonium,Aspergillus,Chrysosporium,Myceliophthora,Penicillium,Talaromyces,Rasamsonia,Thielavia,Fusarium和Trichoderma的属；更优选来自选自Aspergillus niger,Acremonium alabamense,Aspergillus awamori,Aspergillusfoetidus,Aspergillus sojae,Aspergillus fumigatus,Talaromyces emersonii,Rasamsonia emersonii,Rasamsonia emersonii CBS127450,Rasamsonia emersoniiCBS393.64,Aspergillus oryzae,Chrysosporium lucknowense,Fusarium oxysporum,Mortierella alpina,Mortierella alpina ATCC 32222,Myceliophthora thermophila,Trichoderma reesei,Thielavia terrestris,Penicillium chrysogenum andP.chrysogenum Wisconsin 54-1255(ATCC28089)的种；甚至更优选地，根据本发明的丝状真菌宿主细胞是Aspergillus niger。当根据本发明的宿主细胞是Aspergillus niger宿主细胞时，宿主细胞优选为CBS 513.88、CBS124.903或其衍生物。

丝状真菌的若干菌株在许多培养物保藏机构易于被公众获得，例如美国典型培养物保藏中心(American Type Culture Collection(ATCC)),德国微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM)),真菌生物多样性中心(Centraalbureau Voor Schimmelcultures(CBS))，农业研究服务专利培养物保藏北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center(NRRL))和俄罗斯莫斯科的俄罗斯科学院全俄微生物菌种保藏中心(All-Russian Collection of Microorganisms of Russian Academy ofSciences(俄语缩写为VKM，英语缩写为RCM))。作为根据本发明的宿主细胞的优选菌株是Aspergillus niger CBS 513.88,CBS124.903,Aspergillus oryzae ATCC 20423,IFO4177,ATCC 1011,CBS205.89,ATCC 9576,ATCC14488-14491,ATCC 11601,ATCC12892,P.chrysogenum CBS 455.95,P.chrysogenum Wisconsin54-1255(ATCC28089),Penicillium citrinum ATCC 38065,Penicillium chrysogenum P2,Thielaviaterrestris NRRL8126,Rasamsonia emersonii CBS393.64,Rasamsonia emersoniiCBS127450,Talaromyces emersonii CBS 124.902,Acremonium chrysogenum ATCC 36225或ATCC 48272,Trichoderma reesei ATCC 26921或ATCC 56765或ATCC 26921,Aspergillus sojae ATCC11906,Myceliophthora thermophila C1,Garg27K,VKM-F 3500D,Chrysosporium lucknowense C1,Garg 27K,VKM-F 3500 D,ATCC44006及其衍生株。

优选地，且更优选地，当根据本发明的微生物宿主细胞是丝状真菌宿主细胞时，根据本发明的宿主细胞还在其基因组中包含一个或多个修饰，使得宿主细胞如果与亲本宿主细胞相比并且在相同条件下测量时，在产生选自以下各项的至少一种产物方面缺陷：葡糖淀粉酶(glaA)、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶(amyBI和amyBII)、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调控子prtT、PepA、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE。

草酸水解酶(oahA)是许多宿主细胞中草酸合成途径的组分。oahA缺陷的宿主细胞将草酸缺陷。草酸在许多应用例如食品应用中是不需要的副产物。此外，草酸降低了生成这种组分的宿主细胞的培养基培养的pH，导致产率降低；即草酸缺陷的宿主细胞产率升高。因此，如果根据本发明所述的宿主细胞oahA缺陷是有利的。oahA缺陷宿主细胞和产生所述宿主细胞的优选方法在WO 2000/50576和WO2004/070022中有大量描述。产生oahA缺陷宿主细胞的一个优选方法为WO 2000/50576中描述的破坏重组方法。优选地，根据本发明所述的宿主细胞oahA缺陷。优选地，oahA为真菌oahA。更优选地，oahA为来自Aspergillus的oahA。甚至更优选，oahA为来自Aspergillus niger的oahA。甚至更优选，oahA为来自Aspergillusniger CBS 513.88的oahA。最优选地，oahA包含An10g00820的序列。

prtT为真核细胞中蛋白酶的转录激活子。最近在WO 00/20596、WO 01/68864、WO2006/040312和WO 2007/062936中已经描述了蛋白酶的几种真菌转录激活子。这些转录激活子分离自黑曲霉(A.niger)、烟曲霉(A.fumigatus)、产黄青霉(P.chrysogenum)和米曲霉(A.oryzae)。蛋白酶基因的这些转录激活子可用于改进在宿主细胞中生成多肽的方法，其中所述多肽对蛋白酶降解敏感。当根据本发明所述的宿主细胞prtT缺陷时，宿主细胞将产生较少受prtT转录控制的蛋白酶。因此当根据本发明所述的宿主细胞prtT缺陷时有利。prtT缺陷宿主和产生这些宿主的优选方法在WO 01/68864、WO 2006/040312中有大量描述。WO 01/68864和WO 2006/040312描述了破坏prtT编码序列的重组和传统方法。WO 2007/062936描述了蛋白酶启动子中prtT结合位点的破坏。结合位点的破坏阻碍了prtT与结合位点的结合。因此，蛋白酶的转录未经prtT激活并且生成较少蛋白酶。

优选地，根据本发明所述的宿主细胞包含编码prtT的多核苷酸，所述多核苷酸包含修饰，使得当在可比较条件下培养时，与来源的亲本细胞相比，所述宿主细胞在prtT的生成上缺陷。优选地，prtT为真菌prtT。更优选地，prtT为来自Aspergillus的prtT。甚至更优选，prtT为来自Aspergillus niger的prtT。甚至更优选，prtT为来自Aspergillus nigerCBS 513.88的prtT。最优选地，prtT包含An04g06940的序列。

术语“葡糖淀粉酶”(glaA)与术语“淀粉葡萄糖苷酶”相同并且在本文中定义为具有糊精6-α-D-葡聚糖水解酶活性的酶，其催化在1,4-连接的α-D-葡萄糖残基和末端1,4-连接的α-D-葡萄糖残基链中分支点处1,6-α-D-葡糖苷键的内水解。可通过测定对硝基苯酚(paranitrofenol)从底物对硝基苯-α-D-吡喃葡萄糖苷的释放(Sigma)，按AGIU/ml测量葡糖淀粉酶活性。这样产生黄色，可使用分光光度计在405nm下测量其吸光度。1AGIU是在pH4.3和60℃下，每分钟由可溶性淀粉底物生成1μmol葡萄糖的酶量。在WO98/46772中可找到所述测定法的更多详情。

优选地，根据本发明所述的宿主细胞包含编码glaA的多核苷酸，所述多核苷酸包含修饰，使得当在可比较条件下培养时，与来源的亲本细胞相比，所述宿主细胞在glaA的生成上缺陷。优选地，glaA为真菌glaA。更优选地，glaA为来自Aspergillus的glaA。甚至更优选，glaA为来自Aspergillus niger的glaA。甚至更优选，glaA为来自Aspergillus nigerCBS 513.88的glaA。最优选地，glaA包含An03g06550的序列。

本文将术语“α-淀粉酶”定义为在水的存在下，催化具有三个或更多个α-1,4-连接的葡萄糖单元的多糖内水解为麦芽-寡糖的1,4-α-D-葡聚糖的葡聚糖水解酶活性。为测定(中性)α-淀粉酶活性，根据供应商的方法使用Megazyme谷类α-淀粉酶试剂盒(Megazyme,CERALPHA α淀粉酶测定试剂盒，目录参考号K-CERA，2000-2001年)。测量的活性基于在过量葡糖淀粉酶和α-葡糖苷酶的存在下，在pH为7.0时，非还原封端对硝基苯麦芽庚糖苷的水解。形成的对硝基苯酚的量是对样品中存在的α-淀粉酶活性的度量。

本文将术语“酸稳定性α-淀粉酶”(amyA)定义为具有α-淀粉酶活性，在酸性pH范围内活性最佳的酶。为测定酸稳定性α-淀粉酶活性，也根据供应商的方法但是在酸性pH下使用Megazyme谷类α-淀粉酶试剂盒(Megazyme,CERALPHA α淀粉酶测定试剂盒，目录参考号K-CERA，2000-2001年)。测量的活性基于在过量葡糖淀粉酶和α-葡糖苷酶的存在下，在4.5的pH下，非还原封端对硝基苯麦芽庚糖苷的水解。形成的对硝基苯酚的量是对样品中存在的酸稳定性α-淀粉酶活性的度量。

优选地，根据本发明所述的宿主细胞包含编码AmyA的多核苷酸，所述多核苷酸包含修饰，其中当在可比较条件下培养时，与来源的亲本细胞相比，所述宿主细胞amyA缺陷。优选地，amyA为真菌amyA。更优选地，amyA为来自Aspergillus的amyA。甚至更优选，amyA为来自Aspergillus niger的amyA。甚至更优选，amyA为来自Aspergillus niger CBS 513.88的amyA。最优选地，amyA包含An11g03340的序列。

本文将术语“中性α-淀粉酶活性”(amy)定义为具有α-淀粉酶活性，在中性pH范围内活性最佳的酶。

优选地，根据本发明所述的宿主细胞包含编码AmyB的多核苷酸，所述多核苷酸包含修饰，其中当在可比较条件下培养时，与来源的亲本细胞相比，所述宿主细胞amyBI和/或amyBII缺陷。更优选地，根据本发明所述的宿主细胞amyBI和amy BII缺陷。优选地，amyB为真菌amyB。更优选地，amyB为来自Aspergillus的amyB。甚至更优选，amyB为来自Aspergillus niger的amyBI。甚至更优选，amyB为来自Aspergillus niger CBS 513.88的amyBI。最优选地，amyBI包含An12g06930的序列。甚至更优选，amyB为来自Aspergillusniger的amyBII。甚至更优选，amyB为来自Aspergillus niger CBS 513.88的amyBII。最优选地，amyBII包含An05g02100的序列。

本文将术语毒素相关多核苷酸定义为编码负责至少一种毒素或毒素中间化合物的生物合成或分泌的化合物或生化途径的基因簇、多个基因、基因或其部分。所述化合物可例如为可以是酶的多肽。

用于生成目标多肽的宿主细胞的许多宿主细胞，尤其是丝状真菌宿主细胞，包括具有编码多种毒素生物合成所涉及的酶的基因。例如，环匹阿尼酸、曲酸、3-硝基丙酸和黄曲霉毒素是在例如黄曲霉(Aspergillus flavus)中形成的已知毒素。类似地，在许多丝状真菌中，例如在镰孢属(例如镶片镰孢霉(Fusarium venenatum))和木霉属中形成单端孢烯(trichothecene)；赭曲霉素可由Aspergillus niger生成。最近，对工业Aspergillusniger宿主菌株基因组的测序揭示了无活性伏马菌素基因簇(Pel等人，“Genomesequencing and analysis of the versatile cell factory Aspergillus niger CBS513.88”.Nat Biotechnol.2007年2月；25(2):221-231)。目标化合物发酵期间这种毒素的形成非常不合需要，因为这些毒素可对操作人员、消费者和环境造成健康危害。因此，毒素缺陷的宿主细胞使得目标化合物的生成无毒。因为没有毒素必须从产物中去除，所以无毒化合物更易于生成。此外，对化合物的监管批准程序更简单。

优选地，根据本发明所述的宿主细胞包含编码化合物(其可为例如可以是酶的多肽)或生化途径的毒素相关多核苷酸，所述毒素相关多核苷酸包含修饰，其中当在可比较条件下培养时，与来源的亲本细胞相比，所述宿主细胞在所述毒素或毒素中间化合物的生成上缺陷。优选地，毒素或毒素中间化合物为真菌毒素或毒素中间化合物。更优选地，毒素或毒素中间化合物为来自Aspergillus的毒素或毒素中间化合物。甚至更优选，毒素或毒素中间化合物为来自Aspergillus niger的毒素或毒素中间化合物。甚至更优选，毒素或毒素中间化合物为来自Aspergillus niger CBS 513.88的毒素或毒素中间化合物。甚至更优选，毒素或毒素中间化合物为伏马菌素或伏马菌素中间化合物。甚至更优选，毒素或毒素中间化合物为赭曲霉素或赭曲霉素中间化合物。最优选地，毒素或毒素中间化合物为赭曲霉素或伏马菌素或赭曲霉素或伏马菌素中间化合物。

优选地，毒素相关多核苷酸编码真菌毒素或毒素中间化合物的生成中所涉及的化合物(例如其可为可以是酶的多肽)或生化途径。更优选地，所述毒素或毒素中间化合物来自Aspergillus。甚至更优选地，所述毒素或毒素中间化合物来自Aspergillus niger。甚至更优选地，所述毒素或毒素中间化合物来自Aspergillus niger CBS 513.88。甚至更优选地，所述毒素或毒素中间化合物是伏马菌素或伏马菌素中间化合物；甚至更优选地，伏马菌素B或伏马菌素B中间化合物；甚至更优选地，伏马菌素B2或伏马菌素B2中间化合物。优选地，毒素相关多核苷酸包含来自An01g06820至An01g06930的伏马菌素簇的序列；更优选地，毒素相关多核苷酸包含An01g06930的序列。二者择一地或相组合，当毒素或毒素中间化合物是伏马菌素或伏马菌素中间化合物时，毒素相关多核苷酸编码赭曲霉素或赭曲霉素中间化合物中所涉及的化合物(例如其可为可以是酶的多肽)或生化途径；更优选地，赭曲霉素A或赭曲霉素A中间化合物；更优选地，毒素相关多核苷酸包含来自An15g07880至An15g07930的簇的序列；最优选地，毒素相关多核苷酸包含An15g07910的序列和/或An15g07920的序列。

优选地，根据本发明所述的宿主细胞包含至少一种编码化合物(例如其可为可以是酶的多肽)或生化途径的毒素相关多核苷酸，所述毒素相关多核苷酸包含至少一个修饰，其中当在可比较条件下培养时，与来源的亲本细胞相比，所述宿主细胞在毒素或毒素中间化合物的生成上缺陷。更优选地，根据本发明所述的宿主细胞包含两种毒素相关多核苷酸，所述两种毒素相关多核苷酸各包含至少一个修饰，其中当在可比较条件下培养时，与来源的亲本细胞相比，所述宿主细胞优选在伏马菌素和赭曲霉素的生成上缺陷。甚至更优选，根据本发明所述的突变微生物宿主细胞包含三种或更多种毒素相关多核苷酸，所述三种或更多种毒素相关多核苷酸各包含至少一个修饰，其中当在可比较条件下培养时，与来源的亲本细胞相比，所述宿主细胞优选在伏马菌素、赭曲霉素和至少一种另外的毒素或毒素中间化合物的生成上缺陷。

优选地，根据本发明所述的宿主细胞在其基因组中包含一个或更多个修饰，以导致主要细胞外天冬氨酸蛋白酶PepA生成上的缺陷。优选地，根据本发明所述的宿主细胞包含编码主要细胞外天冬氨酸蛋白酶PepA的pepA基因的破坏；更优选地，pepA为来自Aspergillus的pepA；甚至更优选，pepA为来自Aspergillus niger的pepA；甚至更优选地，pepA为来自Aspergillus niger CBS 513.88的pepA；最优选地，pepA包含An14g04710的序列。

优选地，通过使细胞在NHEJ(非同源重组)组分上缺陷来提高多核苷酸靶向整合到根据本发明所述的宿主细胞基因组中预定位点的效率。优选地，根据本发明所述的宿主细胞包含编码含修饰的NHEJ组分的多核苷酸，其中当在相同条件下培养时，与来源的亲本细胞相比，所述宿主细胞在所述NHEJ组分的生成上缺陷。

待修饰的NHEJ组分可为本领域中技术人员已知的任何NHEJ组分。优选的待修饰NHEJ组分选自酵母KU70、KU80、MRE11、RAD50、RAD51、RAD52、XRS2、SIR4、LIG4的丝状真菌同源物的组。更优选的待修饰NHEJ组分为酵母KU70和KU80的丝状真菌同源物，优选hdfA(酵母KU70的同源物)或其同源物和hdfB(酵母KU80的同源物)或其同源物。最优选的待修饰NHEJ组分为KU70或hdfA或其同源物。另一优选的待修饰NHEJ组分为KU80或hdfB或其同源物。另一优选的待修饰NHEJ组分为酵母LIG4的丝状真菌同源物或其同源物。获得这种缺陷NHEJ中所涉组分的宿主细胞的方法为技术人员已知并且在WO2005/095624中有大量描述。优选地，hdfA基因为来自Aspergillus niger的hdfA基因，更优选为来自Aspergillus niger的根据WO2005/095624的SEQ ID NO:1的hdfA。在另一优选实施方式中，hdfB基因为来自Aspergillus niger的hdfB基因，更优选为来自Aspergillus niger的根据WO2005/095624的SEQ ID NO:4的hdfB。

当根据本发明所述的宿主细胞为丝状真菌宿主细胞时，所述宿主细胞优选另外在其基因组中包含一个或更多个修饰，以导致hdf A基因(如WO 2005/095624的SEQ ID NO:3所示)和/或hdfB基因(如WO 2005/095624的SEQ ID NO:6所示)编码的产物生成上的缺陷。根据本发明所述的宿主细胞优选进一步包含hdfA和/或hdfB基因的破坏。在WO 2005/095624中已经描述了缺陷hdfA和/或hdfB基因编码的产物的丝状真菌宿主细胞。

当根据本发明所述的宿主细胞为丝状真菌宿主细胞时，所述宿主细胞优选还在其基因组中包含导致非核糖体肽合酶npsE、优选WO2012/001169的SEQ ID NO:38中所示的npsE生成缺陷的修饰。在WO2012/001169中已经描述了非核糖体肽合酶npsE生成缺陷的这种宿主细胞(npsE具有WO2012/001169的SEQ ID NO:35中所示的基因组序列，SEQ ID NO:36中所示的编码序列，SEQ ID NO:37中所示的mRNA和SEQ ID NO:38中所示的nrps蛋白质)。

根据本发明的宿主细胞优选还包含位于其基因组的修饰，所述修饰导致在产生α-淀粉酶amyC、优选WO2014/013073的SEQ ID NO:4和8中所示的成熟AmyC蛋白质方面存在缺陷。WO2014/013073中已描述了在产生α-淀粉酶amyC方面存在缺陷的这种宿主细胞。amyC具有如WO2014/013073的SEQ ID NO:1或5中所示的基因组序列、SEQ ID NO:2或6中所示的编码序列、SEQ ID NO:3或7中所示的AmyC蛋白质和SEQ ID NO:4和8中所示的成熟AmyC蛋白质。

根据本发明的宿主细胞优选还包含位于其基因组的修饰，所述修饰导致在产生AgsE蛋白质、优选WO2014/013074的SEQ ID NO:3中所示或所含的成熟AgsE蛋白质方面存在缺陷。WO2014/013074中已描述了在产生AgsE蛋白质方面存在缺陷的这种宿主细胞。AgsE具有如WO2014/013074的SEQ ID NO:1中所示的基因组序列、SEQ ID NO:2中所示的编码序列、SEQ ID NO:3中所示的AgsE蛋白质和SEQ ID NO:3中所示的成熟AgsE蛋白质。

如果与亲本宿主细胞相比并且在相同条件下测量，选自葡糖淀粉酶(glaA)、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶(amyBI和amyBII)、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调节子prtT、PepA、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC的至少一种产物生成上的缺陷可以已经在根据本发明所述的宿主细胞所来源的亲本宿主细胞中存在，根据本发明所述的宿主细胞在选自以下的另一种产物上有缺陷：葡糖淀粉酶(glaA)、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶(amyBI和amyBII)、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调节子prtT、PepA、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

如果与亲本宿主细胞相比并且在相同条件下测量，选自葡糖淀粉酶(glaA)、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶(amyBI和amyBII)、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调节子prtT、PepA、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC、蛋白质AgsE的至少一种产物生成上的缺陷可以已经在根据本发明所述的宿主细胞所来源的亲本宿主细胞中存在，根据本发明所述的宿主细胞在选自以下的另一种产物上有缺陷：葡糖淀粉酶(glaA)、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶(amyBI和amyBII)、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调节子prtT、PepA、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC、蛋白质AgsE。

如果与亲本宿主细胞相比并且在相同条件下测量，根据本发明所述的优选的宿主细胞包含glaA和任选至少另一种选自以下的产物生成上的缺陷：酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶(amyBI和amyBII)、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调节子prtT、PepA、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

如果与亲本宿主细胞相比并且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含glaA、PepA和任选至少另一种选自以下的产物生成上的缺陷：酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶(amyBI和amyBII)、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调节子prtT、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

如果与亲本宿主细胞相比并且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含glaA、PepA、酸稳定性α-淀粉酶(amyA)和任选至少另一种选自以下的产物生成上的缺陷：中性α-淀粉酶(amyBI和amyBII)、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调节子prtT、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

如果与亲本宿主细胞相比并且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和任选至少另一种选自以下的产物生成上的缺陷：中性α-淀粉酶amyBII、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调节子prtT、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

如果与亲本宿主细胞相比并且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII和任选至少另一种选自以下的产物生成上的缺陷：草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调节子prtT、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

如果与亲本宿主细胞相比并且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物和任选至少另一种选自以下的产物生成上的缺陷：草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调节子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

如果与亲本宿主细胞相比并且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、草酸水解酶(oahA)和任选至少另一种选自以下的产物生成上的缺陷：毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调节子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

如果与亲本宿主细胞相比并且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、草酸水解酶(oahA)、赭曲霉素、伏马菌素和任选至少另一种选自以下的产物生成上的缺陷：蛋白酶转录调节子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

如果与亲本宿主细胞相比并且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、草酸水解酶(oahA)、赭曲霉素、伏马菌素、蛋白酶转录调节子prtT和任选至少另一种选自以下的产物生成上的缺陷：基因hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

如果与亲本宿主细胞相比并且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、草酸水解酶(oahA)、赭曲霉素、伏马菌素、蛋白酶转录调节子prtT、非核糖体肽合酶npsE和任选至少另一种选自以下的产物生成上的缺陷：基因hdfB编码的产物、淀粉酶amyC。

如果与亲本宿主细胞相比并且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、草酸水解酶(oahA)、赭曲霉素、伏马菌素、蛋白酶转录调节子prtT、淀粉酶amyC和任选至少另一种选自以下的产物生成上的缺陷：基因hdfB编码的产物、非核糖体肽合酶npsE。

如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含降低的淀粉酶背景并包含在产生glaA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII方面的缺陷。这种宿主细胞优选还包含在产生KU70或KU80的丝状真菌同源物方面的缺陷。这种宿主细胞优选还包含在产生毒素方面的缺陷。这种宿主细胞优选还包含在产生KU70或KU80的丝状真菌同源物方面的缺陷和在产生毒素方面的缺陷。

如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含降低的淀粉酶背景并包含在产生glaA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII以及amyC方面的缺陷。这种宿主细胞优选还可包含在产生KU70或KU80的丝状真菌同源物方面的缺陷。这种宿主细胞优选还包含在产生毒素方面的缺陷。这种宿主细胞优选还包含在产生KU70或KU80的丝状真菌同源物方面的缺陷和在产生毒素方面的缺陷。

根据本发明所述的优选的宿主细胞是丝状真菌宿主细胞，如果与亲本宿主细胞相比且在相同条件下测量，其包含在产生glaA和任选至少另一种选自以下的产物生成上的缺陷：酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶(amyBI和amyBII)、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调控子prtT、PepA、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC、蛋白质AgsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA和任选至少另一种选自以下的产物生成上的缺陷：酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶(amyBI和amyBII)、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调控子prtT、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC、蛋白质AgsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)和任选至少另一种选自以下的产物生成上的缺陷：中性α-淀粉酶(amyBI和amyBII)、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调控子prtT、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC、蛋白质AgsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和任选至少另一种选自以下的产物生成上的缺陷：中性α-淀粉酶amyBII、草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调控子prtT、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC、蛋白质AgsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII和任选至少另一种选自以下的产物生成上的缺陷：草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调控子prtT、基因hdfA和/或hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC、蛋白质AgsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物和任选至少另一种选自以下的产物生成上的缺陷：草酸水解酶(oahA)、毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调控子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC、蛋白质AgsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、草酸水解酶(oahA)和任选至少另一种选自以下的产物生成上的缺陷：毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调控子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC、蛋白质AgsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、草酸水解酶(oahA)、蛋白质AgsE和任选至少另一种选自以下的产物生成上的缺陷：毒素(优选赭曲霉素和/或伏马菌素)、蛋白酶转录调控子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、草酸水解酶(oahA)、蛋白质AgsE、毒素(优选赭曲霉素和/或伏马菌素)和任选至少另一种选自以下的产物生成上的缺陷：蛋白酶转录调控子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、草酸水解酶(oahA)、蛋白质AgsE、毒素(优选赭曲霉素和/或伏马菌素)、淀粉酶amyC和任选至少另一种选自以下的产物生成上的缺陷：蛋白酶转录调控子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、毒素(优选赭曲霉素和/或伏马菌素)和任选至少另一种选自以下的产物生成上的缺陷：草酸水解酶(oahA)、蛋白酶转录调控子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC、蛋白质AgsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、毒素(优选赭曲霉素和/或伏马菌素)、淀粉酶amyC和任选至少另一种选自以下的产物生成上的缺陷：草酸水解酶(oahA)、蛋白酶转录调控子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE、蛋白质AgsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、毒素(优选赭曲霉素和/或伏马菌素)、非核糖体肽合酶npsE和任选至少另一种选自以下的产物生成上的缺陷：草酸水解酶(oahA)、蛋白酶转录调控子prtT、基因hdfB编码的产物、淀粉酶amyC、蛋白质AgsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、毒素(优选赭曲霉素和/或伏马菌素)、蛋白质AgsE和任选至少另一种选自以下的产物生成上的缺陷：草酸水解酶(oahA)、蛋白酶转录调控子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、毒素(优选赭曲霉素和/或伏马菌素)、蛋白质AgsE、淀粉酶amyC和任选至少另一种选自以下的产物生成上的缺陷：草酸水解酶(oahA)、蛋白酶转录调控子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、毒素(优选赭曲霉素和/或伏马菌素)、蛋白质AgsE、非核糖体肽合酶npsE和任选至少另一种选自以下的产物生成上的缺陷：草酸水解酶(oahA)、蛋白酶转录调控子prtT、基因hdfB编码的产物、淀粉酶amyC。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、毒素(优选赭曲霉素和/或伏马菌素)、淀粉酶amyC、非核糖体肽合酶npsE和任选至少另一种选自以下的产物生成上的缺陷：草酸水解酶(oahA)、蛋白酶转录调控子prtT、蛋白质AgsE、基因hdfB编码的产物。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、毒素(优选赭曲霉素和/或伏马菌素)、蛋白质AgsE、淀粉酶amyC、非核糖体肽合酶npsE和任选至少另一种选自以下的产物生成上的缺陷：草酸水解酶(oahA)、蛋白酶转录调控子prtT、基因hdfB编码的产物。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、毒素(优选赭曲霉素和/或伏马菌素)、草酸水解酶(oahA)和任选至少另一种选自以下的产物生成上的缺陷：蛋白酶转录调控子prtT、基因hdfB编码的产物、非核糖体肽合酶npsE、淀粉酶amyC、蛋白质AgsE。

在一个实施方式中，如果与亲本宿主细胞相比且在相同条件下测量，根据本发明所述的宿主细胞包含在产生glaA、PepA、酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII、基因hdfA编码的产物、毒素(优选赭曲霉素和/或伏马菌素)、草酸水解酶(oahA)、非核糖体肽合酶npsE和任选至少另一种选自以下的产物生成上的缺陷：蛋白酶转录调控子prtT、基因hdfB编码的产物、淀粉酶amyC、蛋白质AgsE。

如果与亲本宿主细胞相比并且在相同条件下测量，根据本发明所述的进一步优选的宿主细胞包含更低的α-淀粉酶背景并且包含酸稳定性α-淀粉酶(amyA)、中性α-淀粉酶amyBI和amyBII以及任选淀粉酶amyC生成上的缺陷。这种突变微生物细胞也可以包含KU70或KU80的丝状真菌同源物。这种宿主细胞优选还包含毒素生成上的缺陷。这种宿主细胞优选还包含KU70或KU80的丝状真菌同源物生成上的缺陷和毒素生成上的缺陷。

当根据本发明所述的宿主细胞为丝状真菌宿主细胞时，所述宿主细胞优选还包含至少两个基本同源的DNA结构域，其适于整合编码目标化合物的多核苷酸或根据本发明所述的多核苷酸的一个或更多个拷贝，其中改造所述至少两个基本同源DNA结构域中的至少一个以与其来源的基本同源DNA结构域相比，对编码目标化合物的多核苷酸具有更强的整合偏好，并且其中改造的基本同源DNA结构域所来源的基本同源DNA结构域的基因转换频率比所述至少两个基本同源DNA结构域中的另一个高至少10％。在WO2011/009700中已经广泛描述了这种宿主细胞。本文也将含有这些基本同源DNA结构域的两个或更多个拷贝的菌株称为含两个或更多个扩增子的菌株。除其它之外，例如，在van Dijck等，2003,RegulatoryToxicology and Pharmacology 28；27-35:On the safety of a new generation of DSMAspergillus niger enzyme production strains中描述了包含这种扩增子的宿主细胞的实例。在van Dijck等中，描述了包含7个扩增葡糖淀粉酶基因座，即7个扩增子的黑曲霉菌株。根据本发明所述的优选的宿主细胞为丝状真菌宿主细胞，优选黑曲霉宿主细胞，其包含两个或更多个扩增子，优选两个或更多个ΔglaA扩增子，更优选包含2、3、4、5、6、7个ΔglaA扩增子，其中已经改造具有最高基因转换频率的扩增子以与其来源的扩增子相比，对编码目标化合物的多核苷酸或根据本发明所述的多核苷酸具有更高的整合偏好。扩增子的改造可根据WO2011/009700(其以引用的方式全部并入本文)中描述的任一种方法进行。本文将包含两个或更多个扩增子并且其中已经改造一个扩增子以与其来源的扩增子相比对编码目标化合物的多核苷酸具有更高的整合偏好的宿主细胞称为包含经改造扩增子的宿主细胞。WO2011/009700中描述的含有经改造扩增子的宿主细胞为包含3个ΔglaA扩增子——BamHI截短扩增子、SalI截短扩增子和BglII截短扩增子——的宿主细胞并且其中已经改造BamHI扩增子以与其来源的BamHI扩增子相比，对根据本发明所述的多核苷酸或者编码目标化合物的多核苷酸具有更高的整合偏好。

当根据本发明所述的突变微生物宿主细胞为丝状真菌宿主细胞时，根据本发明所述的宿主细胞优选还包含Sec61的修饰。优选的SEC61修饰是产生SEC61单向突变体的修饰，即其中从头合成的蛋白质可经由SEC61进入ER，但是蛋白质不能经由SEC61离开ER的突变体。这种修饰在WO2005/123763中有大量描述。在一个优选实施方式中，突变微生物宿主细胞包含如WO2005/123763的SEQ ID NO:3中所示的Sec61中的修饰。最优选地，SEC 61修饰是其中在WO2005/123763的SEQ ID NO:3中，丝氨酸376经色氨酸置换的S376W突变。

优选在基因组中的修饰在本文中解释为一个或多个修饰。优选在根据本发明的宿主细胞基因组中的修饰可通过以下方式进行：

a)对亲本宿主细胞进行重组遗传操纵技术；和/或

b)对亲本宿主细胞进行(传统的)诱变；和/或

c)使亲本宿主细胞经受抑制性化合物或组合物。本文将宿主细胞基因组的修饰定义为导致宿主细胞基因组中多核苷酸序列变化的任何事件。

优选地，根据本发明的宿主细胞优选在在其基因组中具有这样的修饰，在相同条件下分析时，如果与未被修饰的亲本宿主细胞相比，所述修饰使得减少或不生成如本文所定义的不期望化合物。

修饰可通过本领域的技术人员已知的任何手段来引入，诸如但不限于传统菌株改良、随机诱变然后选择。也可通过定点诱变引入修饰。

修饰可通过引入(插入)、替换(置换)或去除(缺失)多核苷酸序列中的一个或更多个核苷酸完成。可实现编码不期望化合物诸如多肽的多核苷酸的完全或部分缺失。不期望化合物可以是本文他处列出的任何不期望化合物，它也可以是合成不期望化合物诸如代谢物的生物途径中的蛋白质和/或酶。另选地，编码所述不期望化合物的多核苷酸可以被不编码所述不期望化合物或编码所述不期望化合物的部分或完全失活形式的多核苷酸序列部分或完全置换。在另一另选方案中，可将一个或多个核苷酸插入编码所述不期望化合物的多核苷酸中，从而导致所述多核苷酸破坏并且由破坏多核苷酸编码的所述不期望化合物随之而来的部分或完全失活。

在一个实施方案中，根据本发明的突变微生物宿主细胞在其基因组中包含选自以下的修饰：

a)编码不期望化合物的多核苷酸完全或部分缺失，

b)编码不期望化合物的多核苷酸被不编码所述不期望化合物或编码所述不期望化合物的部分或完全失活形式的多核苷酸置换，

c)通过在多核苷酸序列中插入一个或更多个核苷酸来破坏编码不期望化合物的多核苷酸，以及由经破坏多核苷酸编码的所述不期望化合物随之而来的部分或完全失活。

这种修饰可例如在编码序列或转录或翻译所述不期望化合物所需的调控元件中。例如，可插入或去除核苷酸，以便使得终止密码子引入、起始密码子去除或编码序列的开放阅读框变化或移码。编码序列或其调控元件的修饰可通过定点或随机诱变、DNA改组法、DNA重新组装法、基因合成(参见例如Young和Dong,(2004),Nucleic Acids Research 32,(7)electronic access http://nar.oupjournals.org/cgi/reprint/32/7/e59或Gupta等人(1968),Proc.Natl.Acad.Sci USA,60:1338-1344；Scarpulla等人(1982),Anal.Biochem.121:356-365；Stemmer等人(1995),Gene 164:49-53)或PCR产生的诱变根据本领域中已知的方法实现。随机诱变程序的示例在本领域中众所周知，诸如例如化学(例如NTG)诱变或物理(例如UV)诱变。定点诱变程序的示例为QuickChange^TM定点诱变试剂盒(Stratagene Cloning Systems,La Jolla,CA)、‘The Altered II体外诱变系统’(Promega公司)或通过使用如Gene.1989年4月15日；77(1):51-9.(Ho SN,Hunt HD,HortonRM,Pullen JK,Pease LR“Site-directed mutagenesis by overlap extension usingthe polymerase chain reaction”)中描述的PCR或使用如Molecular Biology:CurrentInnovations and Future Trends.(编者A.M.Griffin和H.G.Griffin.ISBN 1-898486-01-8；1995Horizon Scientific Press,PO Box 1,Wymondham,Norfolk,U.K.)中描述的PCR的重叠延伸。

优选的修饰方法基于重组遗传操纵技术，诸如部分或完全基因置换或部分或完全基因缺失。

例如，在置换多核苷酸、核酸构建体或表达盒的情况下，可在待置换的靶基因座引入适当DNA序列。适当DNA序列优选存在于克隆载体上。优选的整合性克隆载体包含与多核苷酸同源和/或与待置换的基因座侧翼的多核苷酸具有同源性以用于向这个预先确定基因座靶向整合克隆载体的DNA片段。为了促进靶向整合，克隆载体优选在细胞转化之前被线性化。优选地，进行线性化使得克隆载体的至少一端，但是优选两端侧翼为与待置换的DNA序列((或侧翼序列)同源的序列。这个过程称为同源重组并且这种技术也可用于实现(部分)基因缺失。

例如，与内源性多核苷酸对应的多核苷酸可由缺陷多核苷酸置换，所述缺陷多核苷酸是不能产生(全功能性)多肽的多核苷酸。通过同源重组，缺陷多核苷酸置换了内源性多核苷酸。可期望的是，缺陷多核苷酸也编码标记，该标记可用于选择其中核酸序列已经被修饰的转化体。

另选地或与提到的其他技术相结合，可使用基于粘粒在大肠杆菌中体内重组的技术，如A rapid method for efficient gene replacement in the filamentous fungusAspergillus nidulans(2000)Chaveroche,M-K.,Ghico,J-M.和d’Enfert C；Nucleicacids Research,第28卷,第22期中所述的。

可替代地，可通过已建立的反义技术，使用与多核苷酸的核酸序列互补的核苷酸序列进行修饰，其中所述宿主细胞产生较少或不产生蛋白质，诸如本文所述的具有淀粉酶活性，优选α淀粉酶活性并由本文所述多核苷酸编码的多肽。更特别地，可通过引入与多核苷酸的核酸序列互补、可在细胞中转录并且能够与细胞中产生的mRNA杂交的核苷酸序列来减少或消除宿主细胞中多核苷酸的表达。在允许互补的反义核苷酸序列与mRNA杂交的条件下，翻译的蛋白质的量由此被减少或消除。在Appl.Environ.Microbiol.2000年2月；66(2):775-82(Characterization of a foldase,protein disulfide isomerase A,in theprotein secretory pathway of Aspergillus niger.Ngiam C,Jeenes DJ,Punt PJ,VanDen Hondel CA,Archer DB)或(Zrenner R,Willmitzer L,Sonnewald U.Analysis of theexpression of potato uridinediphosphate-glucose pyrophosphorylase and itsinhibition by antisense RNA.Planta.(1993)；190(2):247-52.)中示出了表达反义RNA的示例。

导致不期望化合物产生减少或不产生的修饰优选是由于编码所述不期望化合物的mRNA的产生在与未被修饰的亲本微生物宿主细胞相比并且在相同条件下测量的情况下减少。

可经由RNA干扰(RNAi)技术(Mouyna等人,2004)获得导致由编码不期望化合物的多核苷酸转录的mRNA量减少的修饰。在这种方法中，表达将受影响的核苷酸序列的相同有义和反义部分克隆在对方后面且之间有核苷酸间隔子，并且被插入表达载体中。这种分子经转录后，小核苷酸片段的形成将导致将受到影响的mRNA的靶向降解。特定mRNA的消除可达到不同程度。WO2008/053019、WO2005/05672A1、WO2005/026356A1、Oliveira等人、Crook等人2014、和/或Barnes等人中描述的RNA干扰技术可用于这一目的。

可通过不同方法，例如用针对所述不期望化合物的抗体或化学抑制剂或蛋白抑制剂或物理抑制剂(Tour O.等人,(2003)Nat.Biotech:Genetically targetedchromophore-assisted light inactivation.第21卷,第12期:1505-1508)或肽抑制剂或反义分子或RNAi分子(R.S.Kamath_等人,(2003)Nature:Systematic functionalanalysis of the Caenorhabditis elegans genome using RNAi.vol.421,231-237)获得导致不期望化合物产生减少或不产生的修饰。

附加到以上提到的技术或作为替代性方案，也可借助于替代性信号序列(Ramonde Lucas,J.,Martinez O,Perez P.,Isabel Lopez,M.,Valenciano,S.和Laborda,F.TheAspergillus nidulans carnitine carrier encoded by the acuH gene isexclusively located in the mitochondria.FEMS Microbiol Lett.2001年6月24日；201(2):193-8.)或滞留信号(Derkx,P.M.和Madrid,S.M.The foldase CYPB is a componentof the secretory pathway of Aspergillus niger and contains the endoplasmicreticulum retention signal HEEL.Mol.Genet.Genomics.2001年12月；266(4):537-545)，或通过使不期望化合物诸如多肽靶向能够与参与细胞分泌途径的细胞膜结构融合的过氧化物酶体从而导致多肽分泌到细胞外(例如WO2006/040340中所述)来抑制不期望化合物的活性，或使不期望化合物诸如蛋白质重新定位。

另选地或与以上提到的技术相结合，也可例如通过紫外或化学诱变(Mattern,I.E.,van Noort J.M.,van den Berg,P.,Archer,D.B.,Roberts,I.N.和van den Hondel,C.A.,Isolation and characterization of mutants of Aspergillus niger deficientin extracellular proteases.Mol Gen Genet.1992年8月；234(2):332-6.)或通过使用抑制本文所述的不期望多肽的酶活性的抑制剂(例如野尻霉素，其起到β-葡糖苷酶抑制剂的作用(Carrel F.L.Y.和Canevascini G.Canadian Journal of Microbiology(1991)37(6):459-464；Reese E.T.,Parrish F.W.和Ettlinger M.Carbohydrate Research(1971)381-388))获得不期望化合物的产生减少或不产生。

在本发明的一个实施方案中，根据本发明的宿主细胞基因组中的修饰是编码不期望化合物的多核苷酸的至少一个位置中的修饰。

本文将细胞在产生化合物，例如不期望化合物(诸如不期望多肽和/或酶)的缺陷定义为已优选在其基因组中被修饰以导致以下表型特征的突变型微生物宿主细胞，其中与未被修饰的亲本宿主细胞相比，在相同条件下分析时，所述细胞：a)产生更少的不期望化合物或基本不产生不期望化合物和/或b)产生具有降低活性或降低的比活性的不期望化合物或没有活性或没有比活性的不期望化合物，和这些可能性中一种或更多种的组合。

与未被修饰的亲本宿主细胞相比，在相同条件下测量时，优选地根据本发明的经修饰的宿主细胞产生少1％的不期望化合物、少至少5％的不期望化合物、少至少10％的不期望化合物、少至少20％的不期望化合物、少至少30％的不期望化合物、少至少40％的不期望化合物、少至少50％的不期望化合物、少至少60％的不期望化合物、少至少70％的不期望化合物、少至少80％的不期望化合物、少至少90％的不期望化合物、少至少91％的不期望化合物、少至少92％的不期望化合物、少至少93％的不期望化合物、少至少94％的不期望化合物、少至少95％的不期望化合物、少至少96％的不期望化合物、少至少97％的不期望化合物、少至少98％的不期望化合物、少至少99％的不期望化合物、少至少99.9％的不期望化合物或最优选少至少100％的不期望化合物。

本文对作为现有技术给出的对专利文献或其他资料的引用不视为承认所述文献和资料是已知的或其包含的信息是作为在任何权利要求的优先权日时公知常识的一部分。

本文列出的每个参考文献的公开内容全文以引用的方式并入本文。

本发明进一步通过以下实施例中进行说明：

实施例

在丝状真菌中的功能性的且有效的CRISPR/CAS9系统

在丝状真菌中CRISPR/CAS9系统的基本原理

自从出现关于CRISPR/CAS9的第一个出版物和专利(Mali等人,2013)，这种突破性技术的广泛传播使用以指数级增长(Hsu等人,2014)。使用CRISPR/CAS9创建人细胞系中的基因组修饰在出版物中占优势，其可通过所述技术的可能医疗应用容易地解释。在其他生物体中使用CRISPR/CAS9方法不太丰富并且对于丝状真菌未示出。本专利申请除其它之外描述了针对丝状真菌起有效作用的CRISPR/CAS9系统的建立和使用，所述CRISPR/CAS9系统使用例如侧翼为自加工核酶的向导RNA、一步金门克隆技术和特别改造的AMA载体，其使得所述系统适合于大范围丝状真菌中低输出和高输出的基因组修饰。图2绘示了实施例中缩写为gRSR的向导RNA自加工核酶(Gao和Zhao,2014)在形成功能性体内向导RNA中的结构和功能。

实施例描述了使用CAS9与靶向fwnA6的gRSR片段的组合证明CRISPR/CAS9在A.niger中的功能的实验。供体DNA片段用于在参与孢子色素形成的fwnA6基因中引入移码突变。在孢子突变的菌株将具有从黑色到浅黄褐色的孢子颜色变化(等，2011)。

菌株

在所述实施例中，使用Aspergillus niger菌株GBA 301(ΔglaA、ΔpepA)和Aspergillus niger GBA 302(ΔglaA、ΔpepA、ΔhdfA)。专利申请WO2011/009700中描述了GBA 301和GBA 302的构建，其通过引用并入本文。

实施例1：从pDSM-JAK-109载体构建pEBA520

使用载体pDSM-JAK-109(WO2012123429中所述的构建，其通过引用并入本文)作为亲本质粒，其中利用KpnI和HindIII限制性位点将腐草霉素抗性标记替换为cre-重组酶表达盒。随后，使用BamHI和SmaI位点，将Ds-RED-SKL编码区替换为潮霉素抗性标记编码区。片段由DNA2.0(Menlo Park,CA,USA)合成和克隆。这两个步骤产生了起始载体pEBA513，其构建和使用还描述在WO2013/135729中，其被用于以下克隆步骤。使用pEBA513作为亲本质粒，其中潮霉素抗性标记被ble编码区替换(使用BamHI和SmaI限制性位点)。ble编码序列由DNA2.0(Menlo Park,CA,USA)合成。所得质粒被命名为pEBA520(SEQ ID NO:95)并用于以下实施例中。pEBA520的质粒图谱可以在图3中找到。

实施例2：构建BG-AMA1载体

质粒pEBA520含有显性的选择性ble标记盒，其在丝状真菌中赋予腐草霉素抗性；Cam基因，其在E.coli中提供氯霉素抗生素抗性；AMA部分，其用于在丝状真菌中自主复制和由PglaA(葡糖淀粉酶)启动子控制的Cre基因。通过以下方法替换Cre基因：使用限制酶KpnI和HindIII从载体上切下该片段，随后进行Gibson克隆反应，向载体中添加两个新片段。片段1含有dsRED表达盒，其将使包含带有dsRED的AMA载体的菌株具有清晰可检测的荧光信号。片段2包含侧翼为BsaI位点的ccdB反选择基因。BsaI位点可以用于金门组装中，如专利申请WO2013/144257中步骤1所述那样，该专利申请通过引用并入本文，ccdB反选择有助于克隆效率，提高金门克隆后正确克隆的百分比。

使用正向引物5797(SEQ ID NO:96)和反向引物10681(SEQ ID NO:97)PCR扩增dsRED表达盒。PCR中使用的模板是含有dsRED表达盒的质粒pRPBdsRED7354(SEQ ID NO:98)。使用正向引物10680(SEQ ID NO:99)和反向引物5796(SEQ ID NO:100)从含有ccdB片段的质粒66218(SEQ ID NO:101)PCR扩增ccdB片段。根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR以产生具有同源性的片段。利用来自Macherey Nagel的PCR纯化试剂盒并根据手册使用来纯化所有PCR片段。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。利用来自Macherey Nagel的凝胶提取试剂盒并根据标准实验流程使用，在琼脂糖电泳后从凝胶上切下利用KpnI和HindIII切割的载体片段并纯化。将经纯化的片段用于Gibson克隆反应中。使用New England Biolabs的Gibson组装试剂盒根据手册进行Gibson重组。反应之后，将混合物转化到抗ccdB E.coli细胞中。利用限制酶分析核实几个克隆，将具有正确条带谱的克隆命名为BG-AMA1(SEQ ID NO:102)并用于以下实施例中。BG-AMA1的质粒图谱可以在图4中找到。

实施例3：组装BG-C19CAS9表达盒

使用金门克隆方法组合启动子、开放阅读框和终止子序列来构建CAS9表达盒，如专利申请WO2013/144257中步骤1所述那样。这三个片段在DNA2.0(Menlo Park,CA,USA)合成并且在标准克隆载体中递送。第一片段是在Aspergillus niger中有功能的启动子片段Pc.FP017(SEQ ID NO:103)。第二片段是编码CAS9蛋白质的开放阅读框(SEQ ID NO:104)。第三片段是在A.niger中有功能的终止子Pc.FT029(SEQ ID NO:105)。利用金门反应将三个单独的DNA片段克隆到接收骨架载体5a(SEQ ID NO:106)中。这导致含有有功能的CAS9表达盒的名为BG-C19的载体(SEQ ID NO:107)。利用限制酶分析核实BG-C19载体，并用于以下实施例中。

实施例4：在BG-AMA1中克隆CAS9表达盒以产生BG-AMA2

使用Gibson克隆(Gibson等人，2009)将来自BG-C19载体的CAS9表达盒克隆到BG-AMA1质粒中。根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR以产生具有同源性的片段。使用BG-C19作为模板以及均具有30bp侧翼(与BG-AMA1同源)的正向引物DBC-13112(SEQ ID NO:108)和反向引物DBC-13114(SEQ ID NO:109)PCR扩增CAS9表达盒。利用KpnI切开载体BG-AMA1。利用来自Macherey Nagel的PCR纯化试剂盒并根据手册使用来纯化所有片段--PCR片段和切开的载体。使用NanoDrop(ND-1000分光光度计，ThermoScientific)测量DNA浓度。

使用New England Biolabs的Gibson组装试剂盒根据手册进行Gibson重组。转化到E.coli中之后，利用限制酶分析核实几个克隆，将具有正确条带谱的克隆命名为BG-AMA2(SEQ ID NO:110)，其含有有功能的CAS9表达盒。利用限制酶分析核实BG-AMA2载体并用于以下实施例中。BG-AMA2的质粒图谱可以在图5中找到。

实施例5：组装以A.niger fwnA6为基因组靶标的向导RNA自加工核酶(gRSR)表达盒

使用金门克隆方法组合启动子、开放阅读框和终止子序列来构建gRSR盒，如专利申请WO2013/144257中步骤1所述那样。在DNA2.0(Menlo Park,CA,USA)合成两个启动子Pc.PAF(SEQ ID NO:111)和Te.FP036(SEQ ID NO:112)以及终止子Pc.Pc20g04380(SEQ IDNO:113)片段并在标准克隆载体中递送。在IDT(基因片段,Integrated DNATechnologies,Inc)合成自加工核酶片段(SEQ ID NO:114)并作为dsDNA gBlock片段递送。

利用金门反应将三个单独的DNA片段克隆到接收骨架载体BG-AMA2中。在使用Pc.PAF启动子的情况下，这导致名为BG-AMA3的载体(SEQ ID NO:115)；在使用Te.FP036启动子的情况下，这导致BG-AMA4(SEQ ID NO:116)。通过E.coli菌落PCR核实BG-AMA3和BG-AMA4载体。使用正向引物DBC-05795(SEQ ID NO:117)和反向引物DBC-05796(SEQ ID NO:118)，根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR。图6中示出了BG-AMA3的质粒图谱，图7中示出了BG-AMA4的质粒图谱。

实施例6：BG-AMA3，BG-AMA4和供体DNA片段的扩增和纯化

利用Macherey Nagel的Nucleobond Xtra midi试剂盒根据手册从E.coli培养物中分离BG-AMA2、BG-AMA3和BG-AMA4质粒。在IDT(基因片段,Integrated DNATechnologies,Inc)合成gBlock片段，其含有用于期望突变的供体DNA(SEQ ID NO:119)。使用正向引物DBC-12195(SEQ ID NO:120)和反向引物DBC-12196(SEQ ID NO:121)，根据标准PCR流程，利用Phusion聚合酶(New England Biolabs)从gBlock PCR扩增供体DNA。使用来自Macherey Nagel的PCR纯化试剂盒根据手册纯化PCR片段。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。图8示出了fwnA6基因的基因组序列、负责特异性靶向基因组的并入gRSR中的20bp和供体DNA的比对，所述供体DNA促进通过HDR修复双链切割，从而在fwnA6中引入移码和/或PAM序列中引入点突变(CGG至CCG)。

实施例7：转化到A.niger GBA 301和GBA 302中

表1显示了在每个单独转化中转化到各菌株中的DNA的具体量。

基本上如WO1999/32617和WO1998/46772中所述进行原生质体转化，其通过引用并入本文。

表1：转化图表

转化	菌株	AMA质粒	供体DNA
				1	GBA 301	0.5μg BG-AMA2	0μg
2	GBA 301	0.5μg BG-AMA2	0.5μg
				3	GBA 301	0.5μg BG-AMA2	1.5μg
4	GBA 301	0.5μg BG-AMA2	4μg
				5	GBA 301	0.5μg BG-AMA3	0μg
6	GBA 301	0.5μg BG-AMA3	0.5μg
				7	GBA 301	0.5μg BG-AMA3	1.5μg
8	GBA 301	0.5μg BG-AMA3	4μg
				9	GBA 301	0.5μg BG-AMA4	0μg
10	GBA301	0.5μg BG-AMA4	0.5μg
				11	GBA 301	0.5μg BG-AMA4	1.5μg
12	GBA 301	0.5μg BG-AMA4	4μg
				13	GBA 302	0.5μg BG-AMA2	0μg
14	GBA302	0.5μg BG-AMA2	0.5μg
				15	GBA302	0.5μg BG-AMA2	1.5μg
16	GBA302	0.5μg BG-AMA2	4μg
				17	GBA 302	0.5μg BG-AMA3	0μg
18	GBA302	0.5μg BG-AMA3	0.5μg
				19	GBA 302	0.5μg BG-AMA3	1.5μg
20	GBA302	0.5μg BG-AMA3	4μg
				21	GBA 302	0.5μg BG-AMA4	0μg
22	GBA302	0.5μg BG-AMA4	0.5μg
				23	GBA 302	0.5μg BG-AMA4	1.5μg
24	GBA302	0.5μg BG-AMA4	4μg

转化后，将原生质体涂布在含有50μg/ml腐草霉素的再生培养基上，并在30℃下孵育4-6天。

实施例8：进行菌落PCR SDS/LiAC以产生DNA片段用于测序

将孢子涂布在PDA平板上，并在培养箱中在30℃下孵育2-3天。用接种环取一片菌落并放入Eppendorf杯中的50μl Glucanex^TM溶液(50mg/ml Glucanex^TM溶解在KC缓冲液(60g/l KCl、2g/l柠檬酸，用KOH/HCl调节至pH 6.2)中)中。将其在37℃下孵育1小时。该步骤之后，加入300μl DNA稀释缓冲液(0.58g/l NaCl、0.29g/l EDTA、1.58g/l Tris/HCl，pH7.5)，并在水浴或带加热盖的PCR装置中将混合物煮5分钟。随后，用移液器从溶液上部吸取5μl模板(不混合)并加入PCR-混合物中。如下进行PCR：根据标准PCR流程，使用正向引物DBC-13318(SEQ ID NO:122)和反向引物DBC-13319(SEQ ID NO:123)，使用Phusion聚合酶(New England Biolabs)扩增基因组fwnA6位置。使用来自Macherey Nagel的PCR纯化试剂盒根据手册纯化PCR片段。

实施例9：对fwnA6中的基因组突变进行测序

使用正向引物DBC-13320(SEQ ID NO:124)和fwnA6序列片段作为模板，使用Applied Biosystems的BigDye Terminator v3.1循环测序试剂盒根据手册进行PCR测序。根据供应商手册，通过乙醇/EDTA沉淀来清洗测序PCR产物。将fwnA6序列PCR片段沉淀在10μl Applied Biosystems的HiDi甲酰胺中，然后利用Applied Biosystems的3500基因分析仪(Sanger测序仪)使用悬浮液进行序列分析。

在对照菌株中没有发现突变。含有孢子颜色变化的转化体显示如图28所述的预期移码突变。结果显示：CRISPR/CAS9系统在菌株中有功能，并且确实提高了引入预期突变的效率。

实施例10：组装BG-C20CAS9表达盒

使用如实施例3所述的金门克隆方法构建CAS9表达盒。在DNA2.0(Menlo Park,CA,USA)合成三个片段，并在标准克隆载体中递送。第一片段是在Aspergillus niger中有功能的启动子片段Pc.FP017(SEQ ID NO:103)。第二片段是编码CAS9蛋白质的开放阅读框(SEQID NO:104)。第三片段是在A.niger中有功能的终止子Pc.FT029(SEQ ID NO:105)。利用金门反应将三个单独的DNA片段克隆到接收骨架载体5a(SEQ ID NO:106)中。这导致含有有功能的CAS9表达盒的名为BG-C20的载体(SEQ ID NO:125)。使用限制酶分析核实BG-C20载体，并用于以下实施例中。

实施例11：在BG-AMA1中克隆CAS9表达盒以产生BG-AMA5

如实施例4所述，使用Gibson克隆(Gibson等人，2009)将来自BG-C20载体的CAS9表达盒克隆到BG-AMA1质粒中。使用BG-C20作为模板以及均具有30bp侧翼(与BG-AMA1同源)的正向引物DBC-13112(SEQ ID NO:108)和反向引物DBC-13114(SEQ ID NO:109)PCR扩增CAS9表达盒。利用KpnI切开载体BG-AMA1。如实施例4所述，纯化所有片段--PCR片段和切开的载体，并测量DNA浓度。

使用New England Biolabs的Gibson组装试剂盒根据手册进行Gibson重组。转化到E.coli中之后，利用限制酶分析核实几个克隆，将具有正确条带谱的克隆命名为BG-AMA5(SEQ ID NO:126)，其含有有功能的CAS9表达盒。利用限制酶分析核实BG-AMA5载体并用于以下实施例中。BG-AMA5的质粒图谱可以在图9中找到。

实施例12：组装由Aspergillus niger Tef启动子表达的以A.niger fwnA6为基因组靶标的向导RNA自加工核酶(gRSR)表达盒

如实施例5所述构建gRSR盒。在DNA2.0(Menlo Park,CA,USA)合成启动子An.TEF(SEQ ID NO:127)和终止子Pc.Pc20g04380片段(SEQ ID NO:113)并在标准克隆载体中递送。在IDT(基因片段,Integrated DNA Technologies,Inc)合成自加工核酶片段(SEQ ID NO:114)，并作为dsDNA gBlock片段递送。

利用金门反应将三个单独的DNA片段克隆到接收骨架载体BG-AMA5中。这导致名为BG-AMA6的载体(SEQ ID NO:128)。通过E.coli菌落PCR核实BG-AMA6载体。使用正向引物DBC-05795(SEQ ID NO:117)和反向引物DBC-05796(SEQ ID NO:118)，根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR。图10中示出了BG-AMA6的质粒图谱。

实施例13：扩增并纯化BG-AMA5、BG-AMA6和供体DNA片段

利用Macherey Nagel的Nucleobond Xtra midi试剂盒根据手册从E.coli培养物中分离BG-AMA5和BG-AMA6质粒。在IDT(基因片段,Integrated DNATechnologies,Inc)合成gBlock片段，其含有用于期望突变的供体DNA(SEQ ID NO:119)。使用正向引物DBC-12195(SEQ ID NO:120)和反向引物DBC-12196(SEQ ID NO:121)，根据标准PCR流程，利用Phusion聚合酶(New England Biolabs)从gBlock PCR扩增供体DNA。使用来自Macherey Nagel的PCR纯化试剂盒根据手册纯化PCR片段。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。如实施例6中已述，图8示出了fwnA6基因的基因组序列的比对。

实施例14：转化到A.niger GBA 301和GBA 302中

表2显示了在每个单独转化中转化到各菌株中的DNA的具体量。GBA 302对应于菌株GBA301，其中基因ku70被敲除。

如实施例7所述进行原生质体转化。

表2：所进行转化的概述

转化	菌株	AMA质粒	供体DNA
				1	GBA 301	1μg BG-AMA5	0μg
2	GBA 301	1μg BG-AMA5	4μg
				3	GBA 301	1μg BG-AMA6	0μg
4	GBA 301	1μg BG-AMA6	4μg
				5	GBA 302	1μg BG-AMA5	0μg
6	GBA 302	1μg BG-AMA5	4μg
				7	GBA 302	1μg BG-AMA6	0μg
8	GBA 302	1μg BG-AMA6	4μg

转化后，将原生质体涂布在含有25μg/ml腐草霉素的再生培养基平板上并在30℃下孵育4-6天。

转化结果可见表3。

表3：转化结果

对来自所有转化平板的转化体进行计数，并对fwnA突变的白色/浅黄褐色孢子表型特性进行评分。图11示出了从两个转化平板(一个平板来自转化6和一个平板来自转化8)获得的照片以说明获得的结果的差异。结果显示：在转化4和8中，约20％的转化体具有白色/浅黄褐色孢子表型(在表3中表示为“％fwnA6”)。这些转化使用BG-AMA6，其含有CAS9和gRSR盒，与供体DNA组合。相比之下，对照转化2和6没有产生具有白色/浅黄褐色孢子表型的任何菌落。这些转化使用BG-AMA5，含有CAS9但不含gRSR盒，与供体DNA组合。

结果显示：含有gRSR盒和供体DNA的CRISPR/CAS9系统在转化期间在转化4和8中有功能，并且导致相当有效地引入预期突变。

实施例15：进行菌落PCR SDS/LiAC以产生DNA片段用于测序

将孢子涂布在含有25μg/ml腐草霉素的PDA平板上，并在培养箱中在30℃下孵育2-3天。对于每个检测的菌落，用接种环取菌落样品并放入Eppendorf杯中的25μl Glucanex^TM溶液(50mg/ml Glucanex^TM溶解在KC缓冲液(60g/l KCl、2g/l柠檬酸，用KOH/HCl调节至pH6.2)中。在37℃下孵育1小时之后，向每个杯中加入75μl DNA稀释缓冲液(0.58g/l NaCl、0.29g/l EDTA、1.58g/l Tris/HCl，pH7.5)，随后在带加热盖的PCR装置中煮5分钟。煮沸之后，加入100μl millQ水，并通过用移液器来回吸移三次非常温和地混合。随后，用移液器从溶液上部小心吸取5μl染色体DNA模板，并加入每个反应的PCR-混合物中(不从底部吸取细胞碎片)。如下进行PCR反应：根据标准PCR流程，使用正向引物DBC-13320(SEQ ID NO:124)和反向引物DBC-13319(SEQ ID NO:123)，使用Phusion聚合酶(NewEngland Biolabs)扩增基因组fwnA6位置。使用来自Macherey Nagel的PCR纯化试剂盒根据手册纯化PCR片段。

实施例16：对fwnA6中的基因组突变进行测序

使用反向引物DBC-13319和fwnA6序列片段作为模板，使用Applied Biosystems的BigDye Terminator v3.1循环测序试剂盒根据手册进行PCR测序。根据供应商手册，通过乙醇/EDTA沉淀来清洗测序PCR产物。将fwnA6序列PCR片段沉淀物溶解在10μl AppliedBiosystems的HiDi甲酰胺中，然后利用Applied Biosystems的3500基因分析仪(Sanger测序仪)使用悬浮液进行序列分析。

在具有黑色孢子的菌株中没有发现突变。含有孢子颜色变化的转化体在约80％的情况下显示预期移码突变。这些转化体中有一半还含有PAM序列变化。其余20％显示其他突变类型的变异。图12显示了几个测序的白色/浅黄褐色菌落的比对。

结果显示：与供体DNA一起应用的CRISPR/CAS9(CAS9和gRSR盒)系统在菌株中有功能，并且导致相当有效地引入预期突变。

实施例17：生长另外几代之后，从使用BG-AMA6的转化中检验具有黑色孢子的转化体

将具有黑色孢子的转化体从BG-AMA6转化平板转移到含有25μg/ml腐草霉素的PDA平板之后，进行了有趣的观察。在30℃下孵育4-6天后，出现黑色的孢子菌落和白色/浅黄褐色的孢子菌落。相较之下，在使用BG-AMA5的转化中，转移到新平板之后，黑色孢子菌落保持100％的黑色孢子菌落。作为示例，图13示出了具有黑色和白色/浅黄褐色孢子的混合群体的菌落的放大图像。使用与实施例15和16中所述相同的方法进行测序，进一步检验几个白色/浅黄褐色菌落和一些黑色孢子菌落。结果显示在基因组fwnA6位置处的多种突变。显然，由BG-AMA6质粒表达的CRISPR/CAS9系统在细胞中仍然有活性，于基因组的fwnA6处切割，这导致几代后fwnA6基因的突变。在没有可用的供体DNA的情况下，因为其在该阶段已经降解和/或稀释，菌株利用其双链DNA修复机制修复由CAS9产生的双链断裂直至在fwnA6基因中产生突变，使得通过PAM位点的突变或编码的向导-多核苷酸分子的特异性多核苷酸靶标的突变，该位点对于CRISPR/CAS9而言不可用。图14显示了测序结果的比对。

测序结果显示了立即产生的突变和通过转化平板上的表型筛选以及在选择压力下重新涂板后更大规模的生长之后获得的突变的差异。在直接来自GBA301和GBA302菌株背景的fwnA6表型(白色/浅黄褐色孢子)转化平板的菌落中观察到的突变高频率地包含由供体DNA递送的突变。更大规模的生长之后，观察到的突变通常不是供体DNA引入的。对于两种不同的菌株背景，观察到了突变模式发生的差异。

延长生长后获得的菌株的测序结果相较于野生型GBA301菌株中产生的测序结果显示出包含ku70基因敲除的GBA302的修复机制产生的突变的差异。在源自GBA301的菌株中，主要引入的是在fwnA6基因的特定位置插入了核碱基。

对于GBA301而言，在约5/8的情况下，在距离PAM序列+3和+4的核苷酸之间的预期切割位置添加或移除核苷酸，而在另外3/8的情况下，观察到约10-20个核苷酸缺失。在源自GBA302的菌株中，却观察到长度为42个核碱基的多核苷酸或45个核碱基的多核苷酸缺失(图14)。此外，图12显示了相同的42个核苷酸缺失(对于样品“8A fwnA6表型”而言)，这表明：在该样品中，修复在没有供体DNA帮助的情况下发生，但使用与图14相同的修复机制。具有相同长度的多核苷酸序列在不同样品是相同的。进一步分析该数据显示：在切割位点的两个位点的相同序列上(即对于42个核苷酸缺失而言为相同的9-bp“gtcttcttc”序列或对于45个核苷酸缺失而言为相同的6-bp“tcttct”序列)发生独特的重组作用。这些结果表明：在参与NHEJ的基因有缺陷的宿主细胞(例如丝状真菌宿主细胞)中，可以通过在预期切割位点的两个位点使用CRISPR/CAS9系统和同源多核苷酸序列，以受控的方式获得宿主细胞基因组中的缺失，所述CRISPR/CAS9系统优选从AMA质粒表达的CRISPR/CAS9系统，优选不包含供体DNA的CRISPR/CAS9系统，最优选从AMA-质粒表达且不包含供体DNA的CRISPR/CAS9系统。

所述结果对于各种基因组修饰都是有意义的，例如，能够使用以文库为基础的诱变的方法。这可以存在于例如菌株改善计划或大规模敲除研究中。

实施例18：供体DNA作为PCR片段或作为质粒，其与CRISPR/CAS9和gRSR片段组合

该实施例描述了：与基于质粒的供体DNA相比，当使用供体DNA PCR片段时，使用Cas9与靶向fwnA的gRSR片段的组合，CRISPR/CAS9在A.niger中的功能。PCR产生的供体DNA被用于向参与孢子颜色形成的fwnA基因中有效引入移码突变。fwnA基因中有突变的菌株具有黑色至浅黄褐色的孢子颜色变化(等，2011)。

供体DNA

在IDT(基因片段,Integrated DNA Technologies,Inc)合成gBlock片段，其含有具有期望突变的供体DNA(SEQ ID NO:119)。使用Invitrogen的Zero Blunt TOPOPCR克隆试剂盒将这种基于gBlock的DNA克隆到TOPO Zero Blunt载体(SEQ ID NO:129)中。图15示出了称为“TOPO供体DNA fwnA”的所得载体的质粒图谱。使用如SEQ ID NO:120所示的正向引物和如SEQ ID NO:121所示的反向引物，根据标准PCR流程，利用Phusion聚合酶(New England Biolabs)从TOPO载体PCR扩增供体DNA。使用来自Macherey Nagel的PCR纯化试剂盒，根据制造商的说明书，纯化PCR片段。使用NanoDrop(ND-1000分光光度计，ThermoScientific)测量DNA浓度。如实施例6中已述，图8示出了fwnA基因的基因组序列与设计的供体DNA的比对。

构建BG-AMA7

在DNA2.0(Menlo Park,CA,USA)合成启动子Anid.TEF片段(SEQ ID NO:130)和终止子Pc.Pc20g04380片段(SEQ ID NO:113)，并在两个单独的标准克隆载体中递送。在IDT(基因片段,Integrated DNA Technologies,Inc)合成含有基因组靶标的自加工核酶片段(SEQ ID NO:114)，并作为gBlock双链DNA片段递送。使用Invitrogen的ZeroBlunt TOPO PCR克隆试剂盒将该gBlock片段克隆到TOPO Zero Blunt载体中。

使用所述三个单独的DNA载体来获得启动子-、自加工核酶-和终止子片段，随后利用金门反应(根据专利申请WO2013/144257中的实施例1)将其克隆到接受骨架载体BG-AMA5(实施例8中所述的SEQ ID NO:126)中。这导致名为BG-AMA7的载体(SEQ ID NO:131)。图16中示出了BG-AMA7的质粒图谱。通过E.coli菌落PCR核实BG-AMA7载体以核实克隆的gRSRfwnA盒的大小。使用如SEQ ID NO:117所示的正向引物和如SEQ ID NO:118所示的反向引物，根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR。

质粒分离具有或不具有向导RNA的Cas9AMA质粒

使用Macherey Nagel的Nucleobond Xtra midi试剂盒，根据制造商的说明书，从E.coli培养物中分离质粒BG-AMA5(实施例8中所述的SEQ ID NO:126)、质粒BG-AMA6(实施例9中描述的SEQ ID NO:128)和质粒BG-AMA7(SEQ ID NO:131)。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。

转化

表4显示了转化中使用的AMA质粒的概述。

表5显示了在每个单独转化中转化到菌株GBA 301中的DNA的具体量。

如实施例4所述进行原生质体转化。

表4：所用AMA质粒的概述

表5：所进行转化的概述

转化	菌株	AMA质粒	供体DNA
				1	GBA 301	1.5μg BG-AMA5	0μg
2	GBA 301	1.5μg BG-AMA5	4μg PCR-片段
				3	GBA 301	1.5μg BG-AMA5	1μg topO-载体
4	GBA 301	1.5μg BG-AMA5	4μg topO-载体
				5	GBA 301	1.5μg BG-AMA6	0μg
6	GBA 301	1.5μg BG-AMA6	4μg PCR-片段
				7	GBA 301	1.5μg BG-AMA6	1μg topO-载体
8	GBA 301	1.5μg BG-AMA6	4μg topO-载体
				9	GBA 301	1.5μg BG-AMA7	0μg
10	GBA 301	1.5μg BG-AMA7	4μg PCR-片段
				11	GBA 301	1.5μg BG-AMA7	1μg topO-载体
12	GBA 301	1.5μg BG-AMA7	4μg topO-载体

转化后，将原生质体涂布在含有50μg/ml腐草霉素(InvivoGen)的再生培养基平板上，并在30℃下孵育4-6天。随后判定表型(孢子颜色)并由转化平板直接评分。

转化后孢子颜色表型评估的结果可见表6。

表6：转化的结果。fwnA表型的数目表示在转化体总数中鉴定的浅黄褐色菌落的数目。

对来自所有转化平板的转化体进行计数，并对fwnA突变的浅黄褐色孢子表型特征进行评分。

发现供体DNA(基于质粒或PCR片段)存在与否对所得转化体的总量的小影响。由于转化中存在的DNA的量增加，所以更经常观察到更高量的转化体。向导RNA存在/不存在(表B中的转化1-4相对于5-12)对转化频率没有影响。

当存在CRISPR/CAS9但不存在向导RNA时，在添加或不添加供体DNA的情况下，没有观察到fwnA表型转化体(表B中的转化1-4，结果见表C)。利用gRSR的结果显示：在转化5和9中，平均15％的转化体在用向导RNA转化AMA-质粒并且不添加供体DNA时具有fwnA表型。这指示发生了fwnA中的靶向突变。这可能源自不精确的非同源末端连接(NHEJ)-介导的修复，其可以在DSB的位点产生可变长度的插入和/或缺失突变(Sander和Joung，2014)。在利用Cas9盒、向导RNA盒和供体DNA转化的情况下(转化6-8和10-12)，获得了平均38％的fwnA表型突变体，与不存在供体DNA时的频率相比有明显改善。因此，在转化中包括供体DNA增加了靶向修饰(在这种情况下是fwnA表型突变体)的数目。

当比较转化5-12时，结果显示，对于各种类型的所用供体DNA，靶向修饰的性能相同(在这种情况下是fwnA表型突变体的百分比)。用于转化中使用的两类供体DNA(基于质粒或PCR-片段)和向导RNA的表达的同源启动子(A.niger TEF启动子)和异源启动子(A.nidulans TEF启动子)同样有效。取决于应用，相较于使用和分离质粒DNA，使用PCR片段作为供体(PCR扩增可以自动化并且可以更容易地以高通量进行)可以具有特定的益处。当在多重方法中使用CRISPR-Cas系统(使用靶向不同基因座的2个或更多个向导RNA)时，将所有供体DNA放在一个质粒上可能是有益的。

进行菌落PCR SDS/LiAC以产生DNA片段用于测序

将孢子涂布在PDA平板(Difco)上，并在培养箱中在30℃下孵育2-3天。如实施例32所述进行菌落PCR SDS/LiAC以获得模板材料，用于通过PCR片段测序来核实在fwnA中获得的遗传修饰。

通过测序确认fwnA中的基因组突变

如实施例33所述进行所有处理。对于每个转化，对最多10个显示fwnA表型的转化体进行测序。表7中列出了与转化体总数相比含有设计的5bp缺失的转化体的百分比。

表7：测序结果表示为与转化体总数相比，含有设计的5bp缺失的转化体的百分比。

转化6-8和10-12的结果显示了具有设计的5bp缺失的转化体的百分比的相同效应。看起来对用于转化中使用的那类供体DNA(基于质粒或PCR-片段)和向导RNA的表达的启动子没有影响。

实施例19：在三种不同的A.niger菌株中使用(和组装)gRSR fwnA片段

该实施例描述了与CRISPR/Cas9系统中的AMA质粒上存在的gRSR fwnA相比单独的gRSR fwnA片段的用途。将单独的gRSR fwnA片段转化到A.niger菌株中时，使用无向导RNA的环状AMA质粒，并与无向导RNA的线性化AMA质粒进行比较。对于该实施例，使用具有整合的Cas9表达盒和腐草霉素标记(GBA 301-CAS9/Phleo)的A.niger菌株GBA 301，以及GBA302(＝具有ΔhdfA的GBA 301)。PCR产生的供体DNA被用于向参与孢子色素形成的fwnA基因中引入移码突变。具有孢子突变的菌株将具有从黑色到浅黄褐色的孢子颜色变化(等人，2011)。

获得具有随机整合的Cas9/phleo片段的菌株GBA 301

利用BsaI-HF(New England Biolabs)+HpaI(New England Biolabs)切割质粒BG-AMA5(实施例8中描述的SEQ ID NO:126)。使用QIAquick凝胶提取试剂盒(Qiagen)，根据制造商的说明书，从凝胶中分离与腐草霉素标记(Cas9/phleo)部分结合的Cas9表达盒(SEQID NO:132)。通过如实施例4中所述的原生质体转化将0.84μg Cas9/phleo片段转化到菌株GBA 301中。转化后，将原生质体涂布在含有50μg/ml腐草霉素(InvivoGen)的再生培养基平板上，并在30℃下孵育4-6天

将获得的转化体的孢子涂布在含有25μg/ml腐草霉素的PDA平板(Difco)上，并在培养箱中在30℃下孵育2-3天。使用如SEQ ID NO:133所示的正向引物和如SEQ ID NO:134所示的反向引物，如实施例12所述进行菌落PCR，以核实Cas9开放阅读框的存在。

供体DNA

在IDT(基因片段,Integrated DNA Technologies,Inc)合成gBlock片段，其含有具有期望突变的供体DNA(SEQ ID NO:119)。使用Invitrogen的Zero Blunt TOPOPCR克隆试剂盒将基于该gBlock的DNA(SEQ ID NO:129)克隆到TOPO Zero Blunt载体中。图101示出了被称为“TOPO供体DNA fwnA”的所得载体的质粒图谱。使用如SEQ ID NO:120所示的正向引物和如SEQ ID NO:121所示的反向引物，根据标准PCR流程，使用Phusion DNA聚合酶(New England Biolabs)从TOPO载体PCR扩增供体DNA。使用来自Macherey Nagel的PCR纯化试剂盒，根据制造商的说明书，纯化PCR片段。使用NanoDrop(ND-1000分光光度计，ThermoScientific)测量DNA浓度。如实施例6中已述，图8示出了fwnA基因的基因组序列的比对。

构建BG-AMA8载体

实施例8中描述了质粒pEBA513(SEQ ID NO:135)的构建。质粒图谱可以在图17中找到。

质粒pEBA513含有显性的选择性hygB标记盒，其在丝状真菌中赋予潮霉素抗性；Cam基因，其在E.coli中提供氯霉素抗生素抗性；AMA部分，其用于在丝状真菌中自主复制和由PglaA(葡糖淀粉酶)启动子控制的Cre基因。通过以下方法用下文所述的两个片段替换Cre基因：使用限制酶KpnI(New England Biolabs)和HindIII(New England Biolabs)从载体上切下2480bp的片段，随后进行Gibson克隆反应，向载体中添加两个新片段。片段1含有dsRED表达盒，其将使包含带有dsRED的AMA载体的菌株具有清晰可检测的荧光信号。片段2包含侧翼为BsaI位点的ccdB反选择基因。BsaI位点可以用于金门组装中，如专利申请WO2013/144257中步骤1所述那样，ccdB反选择有助于克隆率，提高金门克隆后正确克隆的百分比。

使用如SEQ ID NO:96所示的正向引物和如SEQ ID NO:97所示的反向引物进行PCR扩增dsRED表达盒。使用如SEQ ID NO:98所示的含有dsRED表达盒的质粒作为PCR中的模板。使用如SEQ ID NO:99所示的正向引物和如SEQ ID NO:100所示的反向引物，从包含ccdB片段的SEQ ID NO:101所示的质粒PCR扩增ccdB片段。根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR以产生具有同源性的片段。利用来自Macherey Nagel的PCR纯化试剂盒并根据制造商的说明书，使用来纯化所有PCR片段。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。利用来自Macherey Nagel的凝胶提取试剂盒并根据标准实验流程使用，在琼脂糖电泳后从凝胶上切下利用KpnI和HindIII限制消化的载体片段并纯化。将经纯化的片段用于Gibson克隆反应中。使用New England Biolabs的Gibson组装试剂盒，根据制造商的说明书，进行Gibson重组。反应之后，将1/4混合物转化到抗ccdB E.coli细胞中。利用限制酶分析核实几个克隆，将具有正确条带谱的克隆命名为BG-AMA8(SEQ ID NO:136)。BG-AMA8的质粒图谱可以在图18中找到。

构建BG-AMA9载体

在DNA2.0(Menlo Park,CA,USA)合成启动子An.TEF片段(SEQ ID NO:127)和终止子片段Pc.Pc20g04380(SEQ ID NO:113)并在两个单独的标准克隆载体中递送。在IDT(基因片段,Integrated DNA Technologies,Inc)合成自加工合成含有基因组靶标(SEQ ID NO:114)的核酶片段并作为gBlock双链DNA片段递送。使用Invitrogen的ZeroBlunt TOPO PCR克隆试剂盒将该gBlock片段克隆到TOPO Zero Blunt载体中。

使用所述三个单独的DNA载体来获得启动子-、自加工核酶-和终止子片段，随后利用金门反应(根据专利申请WO2013/144257中的实施例1)将其克隆到接受骨架载体BG-AMA8(SEQ ID NO:136)中。这导致名为BG-AMA9的载体(SEQ ID NO:137)。图19中示出了BG-AMA9的质粒图谱。通过E.coli菌落PCR核实BG-AMA9载体以核实克隆的gRSR fwnA盒的大小。使用如SEQ ID NO:117所示的正向引物和如SEQ ID NO:118所示的反向引物，根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR。

质粒分离具有或不具有向导RNA的Cas9 AMA质粒

使用Macherey Nagel的Nucleobond Xtra midi试剂盒，根据制造商的说明书，从E.coli培养物中分离质粒BG-AMA5(实施例28中所述的SEQ ID NO:126)、质粒BG-AMA6(实施例9中描述的SEQ ID NO:128)、质粒BG-AMA8(SEQ ID NO:136)和质粒BG-AMA9(SEQ ID NO:137)。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。

扩增gRSR fwnA盒

使用质粒BG-AMA6(SEQ ID NO:128)作为PCR扩增与接受载体(SEQ ID NO:138)具有50bp重叠的gRSR fwnA盒的模板。使用如SEQ ID NO:117所示的正向引物和如SEQ ID NO:118所示的反向引物，根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR。利用QIAquick凝胶提取试剂盒(Qiagen)，根据制造商的说明书，从凝胶中分离具有重叠的gRSR fwnA盒。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。

线性化质粒BG-AMA5和BG-AMA8

用BsaI-HF(New England Biolabs)切割BG-AMA5(SEQ ID NO:126)和BG-AMA8(SEQID NO.136)。使用QIAquick Gel Extraction Kit(Qiagen)，根据制造商的说明书，从凝胶中分离两种载体。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。

转化

表8显示了转化中使用的AMA质粒的概述。

表9显示了在每个单独转化中转化到菌株GBA 301、具有随机整合的Cas9/phleo片段的GBA 301或GBA 302中的DNA的具体量。

如实施例4所述进行原生质体转化。

表8：所用AMA质粒的概述

表9：所进行转化的概述

对GBA 301GBA 301-CAS9/Phleo(用CAS9(和腐草霉素标记)转化的GBA 301)和GBA302进行转化。使用不同的AMA质粒(参见表8)，作为环状质粒或用BsaI线性化。gRSR fwnA表达盒要么在转化中不添加(用x表示)，其作为与线性化的BG-AMA5或BG-AMA8质粒具有重叠的PCR片段添加，要么存在于(环状)AMA质粒上。作为供体DNA，如下表所示，包含期望突变的PCR片段包括在一些转化中。共进行了27次转化。该表中显示的行号和列号参见表8。

转化后，对于转化1-9和19-27，将原生质体涂布在含有50μg/ml腐草霉素(InvivoGen)的再生培养基平板上。将转化10-18的原生质体涂布在含有60μg/ml潮霉素B(InvivoGen)的再生培养基平板上。将所有板在30℃下孵育4-6天。随后判定表型(孢子颜色)并由转化平板直接评分。

转化后孢子颜色表型评估的结果见表10。

表10：27个转化实验的结果。

第1、3、5列表示含有fwnA表型的转化体的数目和获得的转化体总数。第2、4和6列表示在转化体总数中鉴定的含有fwnA表型的浅黄褐色菌落的百分比。

对来自所有转化平板的转化体进行计数，并对fwnA突变的浅黄褐色孢子表型特征进行评分(第1、2、3、4、5和6列)。

在存在或不存在供体DNA的情况下，当转化中不包括向导RNA表达盒时，没有获得具有fwnA表型的菌落(行A、B和E)。这表明供体DNA在基因组DNA中的预期基因座上至少不能以高效率整合。

观察到：相较于线性化的AMA-质粒(行E、F和G)，使用环状AMA-质粒(行A、C和D)时获得了更多转化体。

第2列(菌株GBA 301)中的结果表明：当在供体DNA(D和G行)存在的情况下，转化作为与AMA载体具有重叠的单独片段的向导RNA时，相较于转化含有向导RNA的AMA质粒(行I-21％fwnA表型)，获得了较高百分比的fwnA表型转化体(平均46％)。然而，当不添加供体DNA时，也获得了较高百分比的fwnA表型转化体(将行C、F与行H相比)。这指示可能发生了fwnA中的靶向突变。这可能来自不精确的非同源末端连接(NHEJ)-介导的修复，其可以在DSB的位点产生可变长度的插入和/或缺失突变(Sander和Joung，2014)。使用作为与线性化AMA质粒具有重叠的单独片段的向导RNA并且不存在供体DNA时获得了最高百分比的fwnA表型转化体(52％)(第2列，行F)。

第4列(菌株GBA 301-Cas9/Phleo)中的结果显示：当存在供体DNA时，当与AMA载体具有重叠的向导RNA PCR片段和线性化的AMA-质粒组合转化时(行G-69％)，相较于存在于AMA-质粒上的向导RNA(行I-54％)和与AMA-载体具有重叠的向导RNA片段和环状AMA-质粒的组合(行D-43％)，获得了较高百分比的fwnA表型转化体。使用整合在基因组中的CAS9盒、作为单独片段递送的向导RNA和线性化AMA-质粒，并且在不存在供体DNA的情况下，获得了最高百分比的fwnA表型转化体(91％)(第4列，行F)。

第6列(菌株GBA 302)中的结果显示：与GBA 301和GBA 301-Cas9/Phleo菌株背景相比，一般而言，转化体的总量较低。对于GBA 302，在不存在供体DNA但存在向导RNA的情况下，没有获得fwnA表型转化体(行C、F和H)。因此，这些结果表明：在不存在hdfA(引起非同源末端连接(NHEJ)通路缺陷的突变)的情况下，在向导RNA靶位点发生低百分比的突变。当向导RNA在AMA质粒上时(行I-72％)，相较于利用作为单独片段的向导RNA的fwnA表型转化体的百分比，获得了略微较高百分比的fwnA表型转化体(行D和G–均为62％)。

进行菌落PCR SDS/LiAC以产生DNA片段用于测序

将转化1-27的孢子涂布在PDA平板(Difco)上，并在培养箱中在30℃下孵育2-3天。根据实施例12的描述进行菌落PCR SDS/LiAC以产生DNA片段用于测序(确认fwnA中的基因组突变)。

通过测序确认fwnA中的基因组突变

如实施例33所述进行所有处理。对于每个转化，对最多10个显示fwnA表型的转化体进行测序。表11中列出了与转化体总数相比含有设计的5bp缺失的转化体的百分比(图28示出了fwnA基因的基因组序列的比对)。

表11：测序结果表示为与转化体总数相比，含有设计的5bp缺失的转化体的百分比。

与GBA302(NHEJ缺陷)菌株背景相比，使用菌株GBA 301和GBA 301-Cas9/Phleo时，转化体的总量看起来更高。

使用菌株GBA 301时，利用环状AMA质粒和作为片段的向导RNA获得了最高百分比(47％)的含有设计的5bp缺失的转化体(行A，第1列)。

使用基因组DNA中整合有Cas9的菌株GBA301时，利用线性化的AMA质粒和作为PCR片段的向导RNA获得了最高百分比(68％)的含有设计的5bp缺失的转化体(行B，第2列)。这也许是因为所使用的线性化AMA-质粒(不含Cas9的AMA质粒)比其他两种菌株中使用的线性化AMA-质粒小约4.5kb。

使用菌株GBA 302时，利用在环状AMA质粒上的向导RNA获得了最高百分比(72％)的含有设计的5bp缺失的转化体(行C，第3列)。

通常，当使用菌株GBA 302(ΔhdfA)，随后使用具有整合的Cas9的菌株GBA 301，随后使用含有最低百分比的具有设计的5bp缺失的转化体的菌株GBA 301时，获得最高百分比的具有设计的5bp缺失的转化体。当使菌株含有整合在基因组中的Cas9和ΔhdfA的组合时，可以甚至进一步提高转化效率。

核实A.niger中向导RNA中AMA质粒的组装

将来自转化平板的孢子涂布在含有25μg/ml腐草霉素(转化4、7、22和25)或30μg/ml潮霉素B(转化13和16)的PDA平板上，并在培养箱中在30℃下孵育2-3天。对于每个转化，使用2个黑色孢子表型转化体和最多10个显示fwnA表型的转化体进行菌落PCR。根据实施例32的描述，使用如SEQ ID NO:139所示的正向引物(在gRSR fwnA盒中)和如SEQ ID NO:140所示的反向引物(在dsRED盒中)来进行菌落PCR SDS/LiAC以核实gRSR fwnA片段组装到AMA-质粒中。

表12：菌落PCR的结果表示为与所检测的转化体总数相比，显示gRSR fwnA片段正确组装到AMA-质粒中的转化体的数目和百分比。

表12中的结果显示：除了在1种转化(转化13-菌株GBA 301-Cas9/phleo)的情况下，当使用环状AMA-质粒与gRSR fwnA PCR片段的组合时，所有检测的转化体均不显示gRSRfwnA盒组装到AMA质粒中(转化4和22)。

当使用线性化AMA质粒与gRSR fwnA PCR片段(包括2个黑色孢子表型转化体)的组合时，菌株GBA 302的所有检测的转化体均显示gRSR fwnA盒正确组装到AMA质粒中(转化25)。在菌株GBA 301(转化7)的情况下，17％所检测的转化体在AMA-质粒中含有组装的gRSRfwnA盒；在菌株GBA 301-Cas9/phle(转化16)的情况下，33.3％所检测的转化体的在AMA-质粒中含有组装的gRSR fwnA盒。

在第二菌落PCR SDS/LiAC(根据实施例32中的描述进行)中使用与显示向导RNA正确组装到AMA质粒中的转化25的转化体相同的模板，使用转化22的一些转化体作为负对照，并使用如SEQ ID NO:117所示的正向引物和如SEQ ID NO:141所示的反向引物。PCR反应的示意图可以在图20A和20B中找到。所进行的菌落PCR的凝胶电泳图像可以在图21中找到。

电泳凝胶的结果(图21)显示：转化22的转化体(具有环状AMA-质粒与gRSR fwnA片段的组合的菌株GBA 302)的PCR产物具有与使用的BG-AMA5质粒相同的ccdB+dsRED的尺寸。

利用如SEQ ID NO:211+212所示的引物组合时显示正确组装的10个所检测转化体中的5个再次显示gRSR fwnA盒正确装配到AMA质粒中。利用其他5个转化体时没有获得PCR条带。不存在PCR条带可能是由大PCR产物与使用菌落PCR方法的组合引起的。

实施例20：通过在一个步骤中使用CRISPR-CAS系统(多重)在A.niger的基因组DNA中的两个不同基因座中产生突变

本实施例描述了在一个步骤中使用CRISPR/CAS9系统与靶向fwnA和nicB的两个不同的gRSR片段的组合。对于两个靶标，添加供体DNA以引入移码突变(靶向fwnA)或被选择性标记(靶向nicB)替换。

fwnA基因参与孢子形成。fwnA基因中有突变的菌株具有黑色至浅黄褐色的孢子颜色变化(等，2011)。

nicB基因参与烟酰胺形成。其中nicB基因被选择性标记替换的菌株需要在基本培养基中补充烟酰胺以能够生长(Verdoes等人，1994)，并且会赋予菌株选择性抗性标记表型。

gRSR片段利用或不利用两个不同的gRSR片段之间的50bp接头串联连接并置于启动子和终止子之间。串联连接的gRSR片段的示意图可以在图22中找到(Zhao等人，网页信息2013-2014)。

供体DNA fwnA基因

在IDT(基因片段,Integrated DNA Technologies,Inc)合成gBlock片段，其含有具有期望突变的供体DNA(SEQ ID NO:119)。使用Invitrogen的Zero Blunt TOPOPCR克隆试剂盒将基于这种gBlock的DNA克隆到TOPO Zero Blunt载体(SEQ ID NO:129)中。图15示出了称为“TOPO供体DNA fwnA”的所得载体的质粒图谱。使用如SEQ ID NO:120所示的正向引物和如SEQ ID NO:121所示的反向引物，根据标准PCR流程，利用Phusion聚合酶(New England Biolabs)从TOPO载体PCR扩增供体DNA。使用来自Macherey Nagel的PCR纯化试剂盒，根据制造商的说明书，纯化PCR片段。使用NanoDrop(ND-1000分光光度计，ThermoScientific)测量DNA浓度。如实施例6中已述，图8示出了fwnA6基因的基因组序列与设计的供体DNA的比对。

供体DNA nicB基因

在DNA2.0(Menlo Park,CA,USA)合成用于用GFP盒替换nicB基因(SEQ ID NO:142)的供体DNA，并在标准克隆载体中递送。使用如SEQ ID NO:143所示的正向引物和如SEQ IDNO:144所示的反向引物，根据标准PCR流程，利用Phusion聚合酶(New England Biolabs)从克隆载体PCR扩增供体DNA。使用来自Macherey Nagel的PCR纯化试剂盒，根据制造商的说明书，纯化PCR片段。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。图23示出了用hygB表达盒替换nicB基因的示意图。

构建BG-AMA10载体

在DNA2.0(Menlo Park,CA,USA)合成启动子An.TEF片段(SEQ ID NO:127)和终止子片段Pc.Pc20g04380(SEQ ID NO:113)，并在两个单独的标准克隆载体中递送。在IDT(基因片段,Integrated DNA Technologies,Inc)合成含有nicB的基因组靶标的自加工核酶片段(SEQ ID NO:145)，并作为gBlock双链DNA片段递送。使用Invitrogen的Zero Blunt TOPO PCR克隆试剂盒将该gBlock片段克隆到TOPO Zero Blunt载体中。

使用所述三个单独的DNA载体来获得启动子-、自加工核酶-和终止子片段，随后利用金门反应(根据专利申请WO2013/144257中的实施例1)将其克隆到接受骨架载体BG-AMA5(实施例8中所述的SEQ ID NO:126)中。这导致名为BG-AMA10的载体(SEQ ID NO:146)。图24中示出了BG-AMA10的质粒图谱。通过E.coli菌落PCR核实BG-AMA10载体的正确尺寸，通过DNA测序核实克隆的gRSR fwnA盒的正确性。使用如SEQ ID NO:117所示的正向引物和如SEQID NO:118所示的反向引物，根据标准PCR流程，使用Phusion聚合酶(New EnglandBiolabs)进行PCR。

构建BG-AMA11载体

在DNA2.0(Menlo Park,CA,USA)合成启动子An.TEF片段(SEQ ID NO:127)和终止子Pc.Pc20g04380片段(SEQ ID NO:113)，并在两个单独的标准克隆载体中递送。在IDT(基因片段,Integrated DNA Technologies,Inc)合成fwnA自加工核酶片段(SEQID NO:147)和nicB自加工核酶片段(SEQ ID NO:148)，并作为两个单独的双链gBlock片段递送。使用Invitrogen的Zero Blunt TOPO PCR克隆试剂盒将这些gBlock片段克隆到TOPOZero Blunt载体中。使用所述四个单独的DNA载体来获得启动子-、自加工核酶-和终止子片段，随后利用金门反应(根据专利申请WO2013/144257中的实施例1)将其克隆到接受骨架载体BG-AMA5(实施例8中所述的SEQ ID NO:126)中。这导致名为BG-AMA11的载体(SEQ ID NO:149)。图25中示出了BG-AMA11的质粒图谱。

通过E.coli菌落PCR核实BG-AMA11载体的正确尺寸，通过DNA测序核实克隆的gRSRfwnA/nicB盒的正确性。使用如SEQ ID NO:117所示的正向引物和如SEQ ID NO:118所示的反向引物，根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR。

构建BG-AMA12载体

在DNA2.0(Menlo Park,CA,USA)合成启动子An.TEF片段(SEQ ID NO:127)和终止子片段Pc.Pc20g04380(SEQ ID NO:113)，并在两个单独的标准克隆载体中递送。在IDT(基因片段,Integrated DNA Technologies,Inc)合成fwnA自加工核酶片段(SEQID NO:147)和nicB自加工核酶片段(SEQ ID NO:148)，并作为两个单独的gBlock双链DNA片段递送。使用Invitrogen的Zero Blunt TOPO PCR克隆试剂盒将这些gBlock片段克隆到TOPO Zero Blunt载体中。

使用所述四个单独的DNA载体来获得启动子-、自加工核酶-和终止子片段，随后利用金门反应(根据专利申请WO2013/144257中的实施例1)将其克隆到接受骨架载体BG-AMA5(实施例8中所述的SEQ ID NO:126)中。这导致名为BG-AMA12的载体(SEQ ID NO:152)。图26中示出了BG-AMA12的质粒图谱。

通过E.coli菌落PCR核实BG-AMA12载体的正确尺寸，通过DNA测序核实克隆的gRSRfwnA+linker/nicB盒的正确性。使用如SEQ ID NO:117所示的正向引物和如SEQ ID NO:118所示的反向引物，根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR。

质粒分离AMA质粒

使用Macherey Nagel的Nucleobond Xtra midi试剂盒，根据制造商的说明书，从E.coli培养物中分离质粒BG-AMA5(实施例28中所述的SEQ ID NO:126)、质粒BG-AMA6(实施例9中描述的SEQ ID NO:128)、质粒BG-AMA10(SEQ ID NO:146)、质粒BG-AMA11(SEQ ID NO:149)和质粒BG-AMA12(SEQ ID NO:152)。使用NanoDrop(ND-1000分光光度计，ThermoScientific)测量DNA浓度。

转化

表13显示了转化中使用的AMA质粒的概述。

表13：所用AMA质粒的概述

表14显示了在每个单独转化中转化到菌株GBA 302(ΔhfdA)中的DNA的具体量。如实施例4所述进行原生质体转化。

表14：所进行转化的概述

转化	菌株	AMA质粒	供体DNA fwnA	供体DNA nicB
					1	GBA 302	1.5μg BG-AMA5	0μg	0μg
2	GBA 302	1.5μg BG-AMA6	0μg	0μg
					3	GBA 302	1.5μg BG-AMA10	0μg	0μg
4	GBA 302	1.5μg BG-AMA11	0μg	0μg
					5	GBA 302	1.5μg BG-AMA12	0μg	0μg
6	GBA 302	1.5μg BG-AMA5	4μg PCR-片段	4μg PCR-片段
					7	GBA 302	1.5μg BG-AMA6	4μg PCR-片段	4μg PCR-片段
8	GBA 302	1.5μg BG-AMA10	4μg PCR-片段	4μg PCR-片段
					9	GBA 302	1.5μg BG-AMA11	4μg PCR-片段	4μg PCR-片段
10	GBA 302	1.5μg BG-AMA12	4μg PCR-片段	4μg PCR-片段

转化后，将原生质体涂布在含有60μg/ml潮霉素B(Invitrogen)和1mg/l烟酰胺(Sigma)的再生培养基平板上。将所有平板在30℃下孵育4-6天。随后判定表型(孢子颜色)并由转化平板直接评分。

转化后孢子颜色表型评估的结果见表15。

表15：转化的结果。fwnA表型的百分比表示在转化体总数中鉴定的浅黄褐色菌落的数目。

基于潮霉素选择来自所有转化平板的转化体，因此将nicB供体DNA盒整合到基因组内。对获得的所有转化体进行计数，并对fwnA突变的浅黄褐色孢子表型特征进行评分。

表15中的结果显示：当转化中没有添加供体DNA时(转化1-5)，没有获得菌落，这与预期一致。

当不存在向导RNA时(转化6)，获得了9个菌落。菌落具有潮霉素抗性，因此它们融合了nicB供体DNA。这些菌落都没有fwnA表型。

在转化7(仅存在fwnA的向导RNA)中，获得了6个能够在含有潮霉素的平板上生长的转化体，其中三分之一(2个转化体)具有fwnA表型。

当使用含有Cas9和gRSR nicB的质粒BG-AMA10时(转化8)，获得了多数转化体(50)，这表明提高了nicB供体DNA盒的整合效率。这些转化体中有一个菌落显示fwnA表型(转化体总数的2％)。由于不存在fwnA基因的向导RNA，所以fwnA表型可能是由fwnA供体DNA的同源重组引起的。

如在转化7中，对于转化9和10而言，也获得了最高百分比(21-33％)的具有fwnA表型的转化体。在所有这些转化中，存在fwnA的向导RNA。

进行菌落PCR SDS/LiAC以产生DNA片段用于测序

将转化9和10中显示fwnA突变表型的孢子涂布在PDA平板(Difco)上，并在培养箱中在30℃下孵育2-3天。根据实施例12的描述，使用如SEQ ID SEQ ID：151所示的正向引物和如SEQ ID NO:123所示的反向引物，进行菌落PCR SDS/LiAC以产生DNA片段用于测序(确认fwnA中的基因组突变)。

通过测序确认fwnA中的基因组突变

根据实施例13的描述，使用正向引物SEQ ID SEQ ID 151进行所有处理。序列结果可以在表16中找到。

表16：测序结果表示为在获得的具有fwnA表型的转化体总数中含有设计的5bp缺失或其它突变的转化体的百分比。

表16的结果显示：转化9中的两个所检测转化体(fwnA转化体总数的100％)均在fwnA基因中具有设计的5bp缺失。

在转化10中，1个转化体(fwnA转化体总数的33％)在fwnA基因中具有精确设计的5bp缺失，显示了本发明方法的适用性。

通过复制铺板确认nicB中的基因组突变

将转化6-10中最多10个转化体(包括显示fwnA表型的所有转化体)的孢子涂布在PDA平板(Difco)上，并在培养箱中在30℃下孵育2-3天。

将PDA平板上的孢子用于复制铺板在PDA平板(Difco)、基本培养基平板和含有1mg/l烟酰胺(Sigma)的基本培养基平板上。将板在培养箱中在30℃孵育2-3天。随后判定需要烟酰胺以在基本培养基上生长的转化体，并由复制平板评分。

复制铺板的结果可以在表17中找到。复制铺板平板的图片可以在图27中找到。

表17：复制铺板的结果表示为具有fwnA表型的转化体、烟酰胺营养缺陷型转化体和具有双重表型的突变体相对于转化体总数的百分比

表17中的结果显示：在转化6和7中(不存在nicB基因的向导RNA)，50-67％的(潮霉素抗性)转化体需要烟酰胺才能生长，这表明nicB基因发生突变并暗示供体DNA的同源整合。

在转化8中(仅存在nicB的向导RNA)，所有10个检测的转化体均需要烟酰胺才能生长。这些转化体中有一个具有fwnA表型，因此所有获得的转化体的2％在fwnA和nicB基因中均有突变。这清楚显示了使用gRSR导致靶向供体DNA的改进。

在转化9和10中，90-100％的获得的转化体需要烟酰胺才能在基本培养基上生长，包括所有获得的fwnA表型转化体。这意味着：对于几乎所有存在针对nicB和fwnA基因的导向RNA的潮霉素抗性菌落，都发生了两个所选择基因的双重突变。这意味着串联gRSR盒明显提供了在菌株中产生多个靶向突变的益处，其中使用CRISPR/CAS9和供体DNA，并在转化后任选地进行直接选择或表型筛选以整合至少一种供体DNA和/或(基因组)靶DNA的靶向修饰。

实施例21：作为具有不同侧翼长度的PCR片段与CRISPR/CAS9和gRSR片段的组合的供体DNA

本实施例描述了使用CAS9与靶向fwnA基因的gRSR片段的组合时，CRISPR/CAS9在A.niger中的功能。根据本发明的变体包括例如当使用具有不同侧翼长度的供体DNA PCR片段时。供体DNA被用于向参与孢子颜色形成的fwnA基因中引入移码突变。fwnA基因中有突变的菌株具有黑色至浅黄褐色的孢子颜色变化(等，2011)。

供体DNA

在IDT(基因片段,Integrated DNA Technologies,Inc)合成gBlock片段，其含有具有期望突变的供体DNA(SEQ ID NO:119)。使用Invitrogen的Zero Blunt TOPOPCR克隆试剂盒将基于这种gBlock的DNA克隆到TOPO Zero Blunt载体(SEQ ID NO:129)中。图15示出了称为“TOPO供体DNA fwnA”的所得载体的质粒图谱。根据标准PCR流程，利用Phusion聚合酶(New England Biolabs)从TOPO载体PCR扩增供体DNA。用于获得具有不同侧翼长度的供体DNA引物的SEQ ID NO以可以在表18中找到。使用来自Macherey Nagel的PCR纯化试剂盒，根据制造商的说明书，纯化PCR片段。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。如实施例6中已述，图8示出了具有500bp侧翼的fwnA6基因的基因组序列的比对。

表18：用于扩增供体DNA的引物和所得fwnA供体DNA的SEQ ID NO:的概述

质粒分离具有/不具有向导RNA的Cas9 AMA质粒

使用Macherey Nagel的Nucleobond Xtra midi试剂盒，根据制造商的说明书，从E.coli培养物中分离质粒BG-AMA5(实施例8中所述的SEQ ID NO:126)和质粒BG-AMA6(实施例9中描述的SEQ ID NO:128)。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。转化

表19显示了转化中使用的AMA质粒的概述。这些载体含有CRISPR/CAS9盒和任选的向导RNA盒。表20显示了在每个单独转化中转化到菌株GBA 301和GBA 302的供体DNA的具体量。

如实施例4所述进行原生质体转化。

表19：所用AMA质粒的概述

表20：所进行转化的概述

转化后，将原生质体涂布在含有50μg/ml腐草霉素的再生培养基平板上，并在30℃下孵育4-6天。随后判定表型(孢子颜色)并由转化平板直接评分。

转化后孢子颜色表型评估的结果见表21。

表21：转化的结果被表示为具有fwnA表型的菌落的数目相对于转化体的总数以及另外的fwnA表型转化体相对于转化体总数的百分比。

对来自所有转化平板的转化体进行计数，并对浅黄褐色孢子表型特征进行评分作为对fwnA突变的特有说明。

在不存在向导RNA的情况下和存在具有500bp侧翼的供体DNA的情况下，获得了一个显示fwnA表型的转化体(转化2)。

在转化7(含有Cas9、向导RNA但不含供体DNA的GBA 301)中，27.6％的转化体具有fwnA表型。在转化19(含有Cas9、向导RNA但不含供体DNA的GBA 302)中，没有获得具有fwnA表型的转化体。这显示：在NHEJ野生型背景(KU70/KU80wt)中，CAS9和fwnA特异性向导RNA足以对fwnA基因进行足量的靶向修饰。

当比较转化8-12(含有Cas9、向导RNA和具有不同侧翼长度的供体DNA的GBA 301)时，结果显示：在几乎所有的转化中，在fwnA表型转化体的百分比(30-37％)方面获得了相同的效果。只有在使用具有350bp侧翼长度的供体DNA时，具有fwnA表型的转化体的百分比略高(49％)。这显示：使用本发明的CAS9和向导RNA时，可以利用长(500bp)的供体DNA，也可以利用很短(55bp)的供体DNA进行靶向修饰。特别地，与现有技术的靶向修饰技术(其中需要长侧翼，例如≥1kb的单一PCR片段用于成功进行靶向整合和修饰)相比，在具有NHEJ野生型背景的菌株中使用短(50-100bp)侧翼，或者不使用供体DNA进行靶向和靶向修饰是实际的益处。

当比较转化20-24(含有Cas9、向导RNA和具有不同侧翼长度的供体DNA的GBA 302)时，结果显示：在几乎所有的转化中，在fwnA表型转化体的百分比方面获得了相同的效果。也许在使用具有55bp侧翼长度的供体DNA时，具有fwnA表型的转化体的百分比略高。这显示：在具有减少的NHEJ(KU突变)的菌株中使用本发明的CAS9和向导RNA时，可以利用长(500bp)的供体DNA，也可以利用很短(55bp)的供体DNA进行靶向修饰。特别地，与现有技术的靶向修饰技术(参见WO2005/095624的实施例7，其中需要1kb的单一PCR片段用于成功进行靶向整合，而较短的侧翼相当不成功)相比，使用短(50-100bp)侧翼进行靶向和靶向修饰是实际的益处。此外，如果与例如WO2013135728、WO2013/135729和WO2013/135732中详细描述的其它有利的靶向修饰技术相比，本发明的方法代表对丝状真菌中靶向修饰的良好改进。该实施例还表明：无论宿主菌株的NHEJ系统(因突变受损的NHEJ的野生型)修饰如何，本发明的CAS9和向导RNA连同长供体DNA和/或短供体DNA一起提供了稳健且非常有用的菌株修饰方法。

进行菌落PCR SDS/LiAC以产生DNA片段用于测序

将转化1-24的孢子涂布在PDA平板(Difco)上，并在培养箱中在30℃下孵育2-3天。根据实施例12的描述进行菌落PCR SDS/LiAC以产生DNA片段用于测序(确认fwnA中的基因组突变)。

通过测序确认fwnA中的基因组突变

根据实施例13的描述进行所有处理。对于每个转化，对最多10个显示fwnA表型的转化体进行测序。表22中列出了与转化体总数相比含有设计的5bp缺失的转化体的百分比以及与fwnA表型转化体总数相比设计的5bp缺失的百分比。

表22：测序结果被表示为与fwnA表型转化体总数相比含有设计的5bp缺失的转化体的百分比以及与转化体总数相比设计的5bp缺失的百分比。

菌株GBA 301的结果显示：与其他转化(行A-D，第1列和第2列)相比，通过使用具有55bp侧翼的供体DNA(行E，第1列和第2列)，获得的设计的5bp缺失的百分比显著降低。这显示：在具有NHEJ野生型背景的菌株中，本发明的CAS9和向导RNA可与小(55bp)侧翼和较长(500bp)侧翼的供体DNA一起使用。可以使用55bp的短侧翼，但与较长侧翼的供体DNA相比，靶向修饰和期望修饰的效率降低。

当使用菌株GBA 302(第3列)时，几乎所有获得的fwnA表型转化体都含有设计的5bp缺失。当使用55bp的侧翼(行E，第4列)时，获得了最低百分比(约19％)的设计的5bp缺失；当使用350bp的侧翼(行E，第4列)时，获得了最高百分比(约32％)的设计的5bp缺失。这显示：在具有受损的NHEJ背景的菌株中，本发明的CAS9和向导RNA可与小(55bp)侧翼和较长(500bp)侧翼的供体DNA一起使用。短侧翼和长侧翼(55bp-500bp)都可以有效地用于在该背景中进行靶向修饰。在具有表型的突变体中，期望的/精确的修饰％甚至增加，使得这成为用于DNA的精确和正确靶向修饰的非常有效的方法。

特别地，使用小侧翼的供体DNA是菌株修饰的真正改进，避免了劳动密集且成本密集地构建用于有效靶向修饰DNA或宿主菌株的大侧翼。

实施例22：在Penicillium chrysogenum中检测与自加工核酶组合的CRISPR-Cas系统

本实施例描述了使用Cas9与靶向乙酰胺基因(amdS)的自加工核酶片段(gRSR片段)的组合时，CRISPR/CAS9在P.chrysogenum中的功能。

乙酰胺酶表达盒的功能是表达将乙酰胺转化成氨和乙酸盐的酶：乙酰胺酶。宿主菌株的这种转化能力很差。含有乙酰胺酶表达盒的遗传修饰菌株(转化体)的这种转化能力得到提高。乙酰胺酶表达盒被用作转化体选择标记。

已经丢失了amdS基因或在amdS基因中具有突变的Penicillium chrysogenum菌株在乙酰胺存在的情况下不生长，利用amdS的Penicillium chrysogenum转化描述于WO1998/46772中。

在所述实例中，使用P.chrysogenum DS17690，其是P.chrysogenum Wis 54-1255野生型菌株(Wisconsin 54-1255又名ATCC 28089)的衍生物。

获得具有随机整合的amdS盒的P.chrysogenum菌株

在DNA2.0(Menlo Park,CA,USA)合成具有靶向HEL-Y的约2Kb侧翼的amdS表达盒(SEQ ID NO:165)，并在标准骨架载体中递送。使用如SEQ ID NO:166所示的正向引物和如SEQ ID NO:167所示的反向引物，根据标准PCR流程，利用Phusion聚合酶(New EnglandBiolabs)进行amdS盒的PCR扩增。使用来自Macherey Nagel的PCR纯化试剂盒，根据制造商的说明书，纯化PCR片段。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。

通过原生质体转化将0.25μg PCR扩增的amdS盒转化到菌株DS17690中。根据既定方案进行P.chrysogenum原生质体的制备及其转化(Cantoral等，1987Bio/Technol.5,494-497)。转化后，将原生质体涂布在含有0.1％乙酰胺(Sigma)的再生培养基平板上，并在25℃下孵育4-6天。第一次孵育之后，将菌落从再生平板转移到可发生孢子形成的葡萄糖限制的确定的乙酰胺培养基中，所述培养基包含以下成分(以g/l计)：葡萄糖，5.0；乳糖，36；Na₂SO₄，2,9；K₂HPO₄，4.8；KH₂PO₄，5.2；乙酰胺，1.0(Sigma)；1号琼脂，17.5(Oxoid)；补充有10ml含有以下成分的微量元素溶液(以g/l计):FeSO₄·7H₂O，24.84；MgSO₄·7H₂O，0.0125；EDTA，31.25；C₆H₆Na₂O₇，43.75；ZnSO₄·7H₂O，2.5；CaCl₂·2H₂O，1.6；MgSO₄·H₂O，3.04；H₃BO₃，0.0125；CuSO₄·5H₂O，0.625；Na₂MoO·2H₂O，0.0125；CoSO₄·7H₂O，0.625。除非另有说明，所有化学品均来自Merck。将溶液调节至pH 6.5。将平板在培养箱中在30℃下孵育2-3天。

使用标准PCR流程核实菌株以正确整合amdS盒(数据未显示)。

获得的转化体DS17690+amdS被用于核实本实施例中的CRISPR/CAS9系统。

构建BG-AMA16载体

在DNA2.0(Menlo Park,CA,USA)合成启动子An.TEF片段(SEQ ID NO:127)和终止子Pc.Pc20g04380片段(SEQ ID NO:113)，并在两个单独的标准克隆载体中递送。在IDT(基因片段,Integrated DNA Technologies,Inc)合成含有基因组靶标的自加工核酶片段(SEQ ID NO:168)，并作为gBlock双链DNA片段递送。使用Invitrogen的ZeroBlunt TOPO PCR克隆试剂盒将该gBlock片段克隆到TOPO Zero Blunt载体中。

使用所述三个单独的DNA载体来获得启动子-、自加工核酶-和终止子片段，随后利用金门反应(根据专利申请WO2013/144257中的实施例1)将其克隆到接受骨架载体BG-AMA5(实施例8中所述的SEQ ID NO:126)中。这导致名为BG-AMA16的载体(SEQ ID NO:169)。图28中示出了BG-AMA16的质粒图谱。通过E.coli菌落PCR核实BG-AMA16载体以核实克隆的gRSRfwnA盒的大小。使用如SEQ ID NO:117所示的正向引物和如SEQ ID NO:118所示的反向引物，根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR。

质粒分离具有或不具有向导RNA的Cas9 AMA质粒

使用Macherey Nagel的Nucleobond Xtra midi试剂盒，根据制造商的说明书，从E.coli培养物中分离质粒BG-AMA5(实施例8中所述的SEQ ID NO:126)和质粒BG-AMA16(SEQID NO:169)。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。

转化

表23显示了转化中使用的AMA质粒的概述。

表24显示了在每个单独转化中转化到菌株DS17690中的DNA的具体量。

如Cantoral等人,1987Bio/Technol.5,494-497中所述进行原生质体转化。

表23：所用AMA质粒的概述

表24：所进行转化的概述

转化	菌株	AMA质粒
			1	DS17690+amdS	1.5μg BG-AMA5
2	DS17690+amdS	1.5μg BG-AMA16

转化后，将原生质体涂布在含有50μg/ml腐草霉素(InvivoGen)的再生培养基平板上，并在25℃下孵育4-6天。第一次孵育之后，将菌落从再生平板转移到可发生孢子形成的葡萄糖限制的确定的乙酰胺培养基中，所述培养基包含以下成分(以g/l计)：葡萄糖，5.0；乳糖，36；尿素，4.5；Na₂SO₄，2,9；(NH₄)₂SO₄，1,1；K₂HPO₄，4.8；KH₂PO₄，5.2；1号琼脂(Oxoid)，17.5；腐草霉素(InvivoGen)，0.1；补充有10ml含有以下成分的微量元素溶液(以g/l计):FeSO₄·7H₂O，24.84；MgSO₄·7H₂O，0.0125；EDTA，31.25；C₆H₆Na₂O₇，43.75；ZnSO₄·7H₂O，2.5；CaCl₂·2H₂O，1.6；MgSO₄·H₂O，3.04；H₃BO₃，0.0125；CuSO₄·5H₂O，0.625；Na₂MoO·2H₂O，0.0125；CoSO₄·7H₂O，0.625。所有化学品均来自Merck或指出不同。将溶液调节至pH 6.5。将平板在25℃下孵育2-3天。

转换结果见表25。

表25：转化结果被表示为转化平板上转化体的数目。

转化	菌株	AMA质粒	转化体的数目
				1	DS17690+amdS	1.5μg BG-AMA5	>1000
2	DS17690+amdS	1.5μg BG-AMA16	>1000

第一次孵育之后，将单个菌落从再生平板转移到可发生孢子形成的葡萄糖限制的确定的乙酰胺培养基中，所述培养基包含以下成分(以g/l计)：葡萄糖，5.0；乳糖，36；尿素，4.5；Na₂SO₄，2,9；(NH₄)₂SO₄，1,1；K₂HPO₄，4.8；KH₂PO₄，5.2；1号琼脂(Oxoid)，17.5；腐草霉素(InvivoGen)，0.1；补充有10ml含有以下成分的微量元素溶液(以g/l计):FeSO₄·7H₂O，24.84；MgSO₄·7H₂O，0.0125；EDTA，31.25；C₆H₆Na₂O₇，43.75；ZnSO₄·7H₂O，2.5；CaCl₂·2H₂O，1.6；MgSO₄·H₂O，3.04；H₃BO₃，0.0125；CuSO₄·5H₂O，0.625；Na₂MoO·2H₂O，0.0125；CoSO₄·7H₂O，0.625。所有化学品均来自Merck或指出不同。将溶液调节至pH 6.5。将平板在25℃下孵育2-3天。

在存在或不存在向导RNA的情况下，使用AMA质粒在转化体的量方面具有相同的效果。大量获得的转化体表明AMA-质粒的摄取非常有效。

复制铺板以核实amdS基因的功能

将单个菌落的孢子涂布在葡萄糖限制的确定的腐草霉素培养基和葡萄糖限制的确定的乙酰胺培养基上，并在培养箱中于25℃下孵育4-6天。

复制平板的图片可以在图29中找到。能够在葡萄糖限制的确定的腐草霉素培养基和葡萄糖限制的确定的乙酰胺培养基上生长的转化体的数目以及不能在葡萄糖限制的确定的乙酰胺培养基上生长的转化体的百分比。

表26：复制铺板的结果被表示为在腐草霉素或乙酰胺存在的情况下能够生长的转化体的数目，以及在乙酰胺存在的情况下不能生长的转化体的百分比。

图29中的图片显示：转化的亲本菌株不能在含有腐草霉素的平板上生长，但可以在乙酰胺存在的情况下下生长。

来自转化1(无向导RNA)的用于复制铺板的所有转化体均能够在腐草霉素和乙酰胺存在的情况下生长。这表明：AMA质粒被吸收且amdS基因仍然有功能。

来自转化2(向导RNA amdS)的用于复制铺板的所有转化体均能够在腐草霉存在的情况下生长，但不能在乙酰胺存在的情况下生长。这表明：AMA质粒被吸收且amdS基因不再存在或发生突变。这还表明：与自身加工核酶组合的CRISPR/CAS9系统在靶向amdS基因方面有功能。

Rasamsonia(Talaromyces)emersonii实施例

以下两个实施例描述了当使用供体DNA PCR片段时，使用Cas9与靶向amdS的向导RNA自加工核酶片段(gRSR片段)的组合，CRISPR/CAS9在R.emersonii中的功能。R.emersonii的amdS序列是NCBI Genbank(NCBI参考序列XM_013475101.1，网站：www.ncbi.nlm.nih.gov/nucleotide/915165068？report＝genbank&log$＝nuclalign&blast_rank＝1&RID＝8MX12BM7015)。供体DNA被用于向amdS中引入终止密码子突变或参与乙酰胺降解的amdS基因的缺失。如EP06035574所述，具有突变的菌株能够在氟代乙酰胺上生长。

Rasamsonia(Talaromyces)emersonii菌株于1964年12月保藏在真菌生物多样性中心,Uppsalalaan 8,P.O.Box 85167,NL-3508AD乌特勒支,荷兰，检索号为CBS 393.64。在本实施例中可以同样使用其它合适的菌株来显示本发明的效果和优点。例如Rasamsonia(Talaromyces)emersonii菌株TEC-101(也被称为FBG 101，其于2010年6月30日保藏在真菌生物多样性中心,Uppsalalaan 8,P.O.Box 85167,NL-3508 AD乌特勒支,荷兰，检索号为CBS 127450)或TEC-210是合适的Rasamsonia菌株，其描述于WO2011/000949中。

实施例23：CRISPR-Cas系统在Rasamsonia emersonii中的功能

供体DNA

在IDT(基因片段,Integrated DNA Technologies,Inc)合成gBlock片段，其含有用于amdS基因的期望突变，即引入TAA终止密码子的供体DNA(SEQ ID NO:170)或用于amdS基因缺失的供体DNA(SEQ ID NO:171)。使用Invitrogen的Zero Blunt TOPO PCR克隆试剂盒将基于该gBlock的DNA克隆到TOPO Zero Blunt载体中。图30A示出了被称为“TOPO供体DNA amdS_终止”的所得载体的质粒图谱，图31B示出了“TOPO供体DNA amdS_缺失”(SEQ ID NO:173)。图32C示出了供体DNA与amdS基因的基因组序列的比对。

构建BG-AMA13载体

在DNA2.0(Menlo Park,CA,USA)合成启动子Pc.TEF片段(SEQ ID NO:174)和终止子Pc.Pc20g04380片段(SEQ ID NO:113)，并在两个单独的标准克隆载体中递送。在IDT(基因片段,Integrated DNA Technologies,Inc)合成自加工核酶片段(SEQ IDNO:175)，并作为双链DNA片段递送。使用Invitrogen的Zero Blunt TOPO PCR克隆试剂盒将该gBlock片段克隆到TOPO Zero Blunt载体中。

使用所述三个单独的DNA载体来获得启动子-、自加工核酶-和终止子片段，随后利用金门反应(根据专利申请WO2013/144257中的实施例1)将其克隆到接受骨架载体BG-AMA5(实施例11中所述的SEQ ID NO:126)中。这导致名为BG-AMA13的载体(SEQ ID NO:176)。图33中示出了BG-AMA13的质粒图谱。通过E.coli菌落PCR核实BG-AMA13载体以核实克隆的gRSR amdS盒的大小。使用如SEQ ID NO:117所示的正向引物和如SEQ ID NO:118所示的反向引物，根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR。

组装BG-C21CAS9表达盒

使用金门克隆方法构建CAS9表达盒。在DNA2.0(Menlo Park,CA,USA)合成三个片段，并在标准克隆载体中递送。第一片段是在Rasamsonia emersonii中有功能的启动子片段Anid_TEF(SEQ ID NO:130)。第二片段是编码CAS9蛋白质的开放阅读框(SEQ ID NO:104)。第三片段是在R.emersonii中有功能的终止子Pc_FT029(SEQ ID NO:105)。所述三个单独的DNA片段被用于获得启动子、CAS9和终止子片段，随后利用金门反应将其克隆到接收骨架载体5a(SEQ ID NO:106)中。使用New England Biolabs的Gibson组装试剂盒，根据制造商的说明书进行Gibson重组。这导致含有有功能的CAS9表达盒的名为BG-C21的载体(SEQID NO:177)。使用限制酶分析核实BG-C21载体。

在BG-AMA1中克隆CAS9表达盒以产生BG-AMA14

如实施例11所述，使用Gibson克隆(Gibson等人，2009)将来自BG-C21载体的CAS9表达盒克隆到BG-AMA1质粒中。使用BG-C21作为模板以及均具有30bp侧翼(与BG-AMA1同源)的如SEQ ID NO:178所示的正向引物和如SEQ ID NO:109所示的反向引物PCR扩增CAS9表达盒。利用KpnI(New England Biolabs)切开载体BG-AMA1。如实施例11所述，纯化所有片段、PCR片段和切开的载体并测量DNA浓度。

使用New England Biolabs的Gibson组装试剂盒，根据据制造商的说明书进行Gibson重组。转化到E.coli中之后，利用限制酶分析核实几个克隆，将具有正确条带谱的克隆命名为BG-AMA14(SEQ ID NO:179)，其含有有功能的CAS9表达盒。BG-AMA14的质粒图谱可以在图34中找到。利用限制酶分析核实BG-AMA14载体。

构建BG-AMA15

使用所述三个单独的DNA载体来获得启动子-、自加工核酶-和终止子片段，随后利用金门反应(根据专利申请WO2013/144257中的实施例1)将其克隆到接受骨架载体BG-AMA14(SEQ ID NO:179)中。使用New England Biolabs的Gibson组装试剂盒，根据据制造商的说明书进行Gibson重组。这导致名为BG-AMA15的载体(SEQ ID NO:180)。图35中示出了BG-AMA15的质粒图谱。通过E.coli菌落PCR核实BG-AMA15载体以核实克隆的gRSR amdS盒的大小。使用如SEQ ID NO:117所示的正向引物和如SEQ ID NO:118所示的反向引物，根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)进行PCR。

质粒分离具有或不具有gRNA的Cas9 AMA质粒

使用Macherey Nagel的Nucleobond Xtra midi试剂盒，根据制造商的说明书，从E.coli培养物中分离BG-AMA5(实施例11中所述的SEQ ID NO:126)、BG-AMA13(SEQ ID NO:176)、BG-AMA14(SEQ ID NO:179)和BG-AMA15(SEQ ID NO:180)。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。

转化到R.emersonii

表27显示了转化中使用的AMA质粒的概述。

表28显示了在每个单独转化中转化到R.emersonii菌株TEC-210(WO2011/000949)中的DNA的具体量。

原生质体转化、标记和选择性培养基的使用可以在WO2011/054899中找到。

以下是本实施例中使用的培养基和溶液：

马铃薯葡萄糖琼脂，PDA(Fluka，目录号70139)：每升：马铃薯提取物4克；葡萄糖20克；Bacto琼脂15克；pH 5.4；在120℃下灭菌20分钟。

Rasamsonia琼脂培养基：每升：3号盐级分15g；纤维素30克；Bacto蛋白胨7.5克；谷物粉15克；KH2PO4 5克；CaCl2.2aq 1克；Bacto琼脂20克；pH 6.0；在120℃下灭菌20分钟。

盐级分组合物：“3号盐级分”与WO98/37179的表1的公开内容相符。与该表的组合物的差异为：CaCl2.2aq 1.0g/l，KCl 1.8g/L，柠檬酸1aq0.45g/L(螯合剂)。

表27：转化到R.emersonii中所用AMA质粒的概述

表28：所进行转化的概述。在所有转化中，均使用R.emersonii菌株TEC-210。使用两种不同的CAS9表达盒：版本1：Pc.FP017.pro-Cas9-Pc.FT029.ter和版本2：Anid_tef.pro-Cas9-Pc.FT029.ter。

转化后，将原生质体涂布在含有100μg/ml腐草霉素的再生培养基平板上，并将板在42℃下孵育6-7天。

在表29中可以找到转化的概述。在所有转化中，在平板上发现了多于250个单独的转化体。

表29：转化结果。在所有转化中，均使用R.emersonii菌株TEC-210。使用两种不同的CAS9表达盒：版本1：Pc.FP017.pro-Cas9-Pc.FT029.ter和版本2：Anid_tef.pro-Cas9-Pc.FT029.ter。

在存在或不存在(基于质粒的)供体DNA的情况下或者在存在或不存在gRNA的情况下，在获得的转化体的量方面没有发现明显的效果。

进行菌落PCR以获得用于测序的DNA片段或以核实amdS基因座缺失

将孢子涂布在Rasamsonia琼脂培养基上，并在培养箱中在42℃下孵育6-7天。用接种环取一片菌落并放入Eppendorf管中的50μl Glucanex^TM溶液(50mg/ml Glucanex^TM溶解在KC缓冲液(60g/l KCl、2g/l柠檬酸，用KOH/HCl调节至pH 6.2)中)中。将混合物在37℃下孵育1小时。该步骤之后，加入300μl DNA稀释缓冲液(0.58g/l NaCl、0.29g/l EDTA、1.58g/l Tris/HCl，pH7.5)，并在水浴或带加热盖的PCR装置中将混合物煮5分钟。随后，用移液器从溶液上部吸取5μl模板(不混合)并加入PCR-混合物中。如下进行PCR：根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)，使用从不同转化体分离的基因组DNA和作为对照的非转化菌株作为模板DNA，以获得两个不同的PCR片段：使用如SEQ ID NO:181所示的正向引物和如SEQ ID NO:182所示的反向引物获得了PCR片段1，PCR片段1被用于通过测序测定amdS基因座(供体_amds_终止)上终止密码子的引入。使用如SEQ ID NO:183所示的正向引物和如SEQ ID NO:184所示的反向引物获得了PCR片段2，PCR片段2被用于通过将样品加载在0.8％琼脂糖凝胶上来确认amdS基因座的缺失。此外，如下所述对PCR片段2进行测序。在测序反应之前，使用来自Macherey Nagel的PCR纯化试剂盒，根据制造商的说明书纯化PCR片段1和2。

使用SEQ ID NO:185所示的正向引物和amdS序列片段(PCR片段1或PCR片段2)作为模板，利用Applied Biosystems的BigDye Terminator v3.1循环测序试剂盒，根据手册进行用于测序的PCR。根据供应商手册，通过乙醇/EDTA沉淀来清洗测序PCR产物。将amdS序列PCR片段沉淀物溶解在10μl Applied Biosystems的HiDi甲酰胺中，然后利用AppliedBiosystems的3500Genetic Analyzer(Sanger Sequencer)使用悬浮液进行序列分析。

对于每个转化，对最多15个转化体进行测序。表30中列出了核实的转化体总数中含有设计的TAA突变或基因座缺失的转化体的百分比。

表30：测序结果。在所有转化中，均使用R.emersonii菌株TEC-210。使用两种不同的CAS9表达盒：版本1：Pc.FP017.pro-Cas9-Pc.FT029.ter和版本2：Anid_tef.pro-Cas9-Pc.FT029.ter。N.a.数据不可用，未进行测序反应。

没有发现具有amdS基因的缺失或设计的TAA突变(在amdS基因中引入终止密码子)的转化体，这表明没有供体DNA被引入到R.emersonii菌株TEC-210的基因组DNA中。然而，测序结果显示：一些转化体在PAM序列上游的三号位和四号位之间含有胸腺嘧啶(T)核苷酸插入(参见图36)。值得注意的是，仅在转化了向导RNA表达盒的那些转化体中发现了T插入(表30)。以前的工作显示：CAS9切割DNA并在PAM序列上游三个碱基对的位置制造双链断裂(Jinek等，2012)。已知在双链断裂位点的突变可能起因于不精确的非同源末端连接(NHEJ)介导的修复，其可产生可变长度的插入和/或缺失突变(Sander和Joung，2014)。观察到：在转化了含有CAS9表达盒和向导RNA表达盒的载体的一些转化体中发现了在PAM序列上游3个碱基对位置处的T插入，由此可以推断出：CAS9和向导RNA可以在R.emersonii中有功能地表达，并且CRISPR/CAS9系统在R.emersonii中有活性。

实施例24：在Rasamsonia emersonii中使用CRISPR-Cas系统整合供体DNA

本实施例描述了当使用供体DNA PCR片段时，使用Cas9与靶向amdS的向导RNA自加工核酶片段(gRSR片段)的组合，CRISPR/CAS9在R.emersonii中的功能。R.emersonii的amdS序列描述于Uniprot(A0A0F4Z505)或NCBI Genbank(www.ncbi.nlm.nih.gov/nuccore/802095377？itemid＝8&sat＝37&sat_key＝269418918)。供体DNA被用于向amdS中引入终止密码子突变或参与乙酰胺降解的amdS基因的缺失。如EP06035574所述，具有突变的菌株能够在氟代乙酰胺上生长。

供体DNA

在IDT(基因片段,Integrated DNA Technologies,Inc,Leuven,Belgium)合成gBlock片段，其含有用于amdS基因的期望突变，即引入TAA终止密码子的供体DNA(SEQ ID NO:170)或用于amdS基因缺失的供体DNA(SEQ ID NO:171)。使用Invitrogen的Zero Blunt TOPO PCR克隆试剂盒将基于该gBlock的DNA克隆到TOPO Zero Blunt载体中。图30示出了被称为“TOPO供体DNA amdS_终止”的所得载体的质粒图谱，图31示出了“TOPO供体DNA amdS_缺失”(SEQ ID NO:173)。图32示出了供体DNA序列与amdS基因的基因组序列的比对。根据标准PCR流程，使用如SEQ ID NO:186所示的正向引物和如SEQ ID NO:187所示的反向引物，利用Phusion聚合酶(New England Biolabs)从TOPO载体PCR扩增amdS_终止供体DNA。根据标准PCR流程，使用如SEQ ID NO:188所示的正向引物和如SEQ ID NO:189所示的反向引物，利用Phusion聚合酶(New England Biolabs)从TOPO载体PCR扩增amdS_缺失供体DNA。使用来自Macherey Nagel的PCR纯化试剂盒，根据制造商的说明书纯化PCR片段。使用NanoDrop(ND-1000分光光度计，Thermo Scientific)测量DNA浓度。

构建BG-AMA13

如实施例23所述构建CAS9表达盒。

构建BG-AMA15

如实施例23所述构建CAS9表达盒。

质粒分离具有或不具有gRNA的Cas9 AMA质粒

转化到R.emersonii

实施例23中的表27显示了转化中使用的AMA质粒的概述。如WO2013135732A1所述使Rasamsonia emersonii的(DNA修复非同源末端连接(NHEJ)通路所需的)ku80基因缺失。这导致了Rasamsonia emersonii TEC-210Δku80菌株。

表28显示了在每个单独转化中转化到Rasamsonia emersonii TEC-210Δku80菌株中的DNA的具体量。

原生质体转化、标记和选择性培养基的使用可以在WO2011/054899中找到，并且还示于实施例23。

表31：所进行转化的概述。在所有转化中，均使用Rasamsonia emersonii TEC-210Δku80菌株。使用两种不同的CAS9表达盒：版本1：Pc.FP017.pro-Cas9-Pc.FT029.ter和版本2:Anid_tef.pro-Cas9-Pc.FT029.ter。

在表32中可以找到转化的概述。没有供体DNA的转化看起来导致更多的转化体。在存在或不存在gRNA的情况下，在获得的转化体的量方面没有发现明显的效果。

表32：转化结果。在所有转化中，均使用Rasamsonia emersonii TEC-210 Δku80菌株。使用两种不同的CAS9表达盒：版本1：Pc.FP017.pro-Cas9-Pc.FT029.ter和版本2：Anid_tef.pro-Cas9-Pc.FT029.ter。

进行菌落PCR以获得用于测序的DNA片段或以核实amdS基因座缺失

将孢子涂布在Rasamsonia琼脂培养基上，并在培养箱中在42℃下孵育6-7天。用接种环取一片菌落并放入Eppendorf管中的50μl Glucanex^TM溶液(50mg/ml Glucanex^TM溶解在KC缓冲液(60g/l KCl、2g/l柠檬酸，用KOH/HCl调节至pH 6.2)中)中。将混合物在37℃下孵育1小时。该步骤之后，加入300μl DNA稀释缓冲液(0.58g/l NaCl、0.29g/l EDTA、1.58g/lTris/HCl，pH7.5)，并在水浴或带加热盖的PCR装置中将混合物煮5分钟。随后，用移液器从溶液上部吸取5μl模板(不混合)并加入PCR混合物中。如下进行PCR：根据标准PCR流程，使用Phusion聚合酶(New England Biolabs)，使用从不同转化体分离的基因组DNA和作为对照的非转化菌株作为模板DNA，以获得两个不同的PCR片段：使用如SEQ ID NO:181所示的正向引物和如SEQ ID NO:182所示的反向引物获得了PCR片段1，PCR片段1被用于通过测序测定amdS基因座(供体_amds_终止)上终止密码子的引入。在测序反应之前，使用来自MachereyNagel的PCR纯化试剂盒，根据制造商的说明书纯化PCR片段1。使用如SEQ ID NO:183所示的正向引物和如SEQ ID NO:184所示的反向引物获得了PCR片段2，PCR片段2被用于通过将样品加载在0.8％琼脂糖凝胶上来确认amdS基因座的缺失(参见图37为例)。约6％的用amdS缺失供体DNA转化的转化体含有amdS基因座缺失(表33，转化5)。

对amdS中的靶位点进行测序以通过供体DNA(终止密码子)的整合来核实基因组突变

使用SEQ ID NO:185所示的正向引物和amdS序列片段(PCR片段1或PCR片段2)作为模板，利用Applied Biosystems的BigDye Terminator v3.1循环测序试剂盒，根据手册进行用于测序的PCR。根据供应商手册，通过乙醇/EDTA沉淀来清洗测序PCR产物。将amdS序列PCR片段沉淀物溶解在10μl Applied Biosystems的HiDi甲酰胺中，然后利用AppliedBiosystems的3500Genetic Analyzer(Sanger测序仪)使用悬浮液进行序列分析。

表33中列出了核实的转化体总数中含有设计的TAA突变的转化体的百分比。

表33：测序结果。在所有转化中，均使用Rasamsonia emersonii TEC-210 Δku80菌株。使用两种不同的CAS9表达盒：版本1：Pc.FP017.pro-Cas9-Pc.FT029.ter和版本2:Anid_tef.pro-Cas9-Pc.FT029.ter。

在对照转化体(没有添加供体DNA)中没有发现预期的突变(意为终止密码子引入或amdS基因座缺失)，并且当使用Cas9表达盒版本2时，没有发现预期的突变。在向导RNA表达盒存在的情况下，当使用由Pc.FP017启动子表达的CAS9时(表33，转录6)，约4％的用amdS_终止供体DNA转化的转化体显示出预期的TAA突变。图38示出了这种突变与amdS基因座的基因组序列的比对。结果显示：CRISPR-Cas系统在菌株中有功能，并且可被用于引入点突变或部分基因组DNA缺失，而不需要向基因组DNA中引入标记盒。

其它Penicillium chrysogenum实施例

实施例中使用的培养基

R琼脂含有0.52％v/v甘油、0.75％v/v甜菜糖蜜、0.5％酵母提取物、300mM NaCl、0.2m MgSO₄.7H₂O、0.44mM KH₂PO₄、3.3μM NH₄Fe(SO₄)₂.12H₂O、0.4μM CuSO₄.5H₂O、1.45mMCaSO₄.2H₂O和2％琼脂。在需要时，加入NaNO₃至终浓度为0.1％。

菌株

P.chrysogenum DS17690(于2008年4月15日保藏在真菌生物多样性中心,乌特勒支,荷兰，保藏号为CBS122850)是一种青霉素高产菌株。

P.chrysogenum DS54465是DS17690的衍生物，其中P.chrysogenum KU70同源物已被缺失(Snoek等人(2009)Fungal Genetics and Biology 46,418-426)。

P.chrysogenum DS68530是DS54465的衍生物，其包含编码amdS标记的基因的缺失。通过使用EP 0635574B1中所述的“MARKER-GENE FREE”方法来构建该菌株。

实施例25：Pks17表型

为了判定Pks17是否参与分生孢子色素生物合成，使Pks17基因缺失。为了缺失Pks17，使用图39所示的质粒pDEST-PKS17(SEQ ID NO:190)。缺失盒含有pGpdA启动子、amdS选择标记和AT-终止子，其侧翼是Pks17开放阅读框的约2.2kb的上游侧翼和下游侧翼。通过使用正向引物184(SEQ ID NO:191)和反向引物189(SEQ ID NO:192)从载体扩增缺失盒来进行实验。在到P.chrysogenum DS68530的转化中使用3μg具有1.0kb侧翼的PCR扩增的缺失盒。在乙酰胺培养基上进行转化体选择，并在于乙酰胺琼脂上进行1轮纯化后，将单个菌落放到YGG琼脂上用于孢子形成。如图40所示，具有成功KO的菌落在孢子形成后展示白色孢子。没有观察到其他表型变化。该基因的敲除可被用作良好的基于表型的筛选，因此被用于评估CRISPR-Cas9系统。

实施例26：gRNA的选择

选择靶gRNA序列>846r(SEQ ID NO:193)用于PKS17。

将gRNA尾巴(SEQ ID NO:194)加入生物信息分析中，并将最终的gRNA分子整理为互补的正向寡核苷酸(SEQ ID NO:195)和反向寡核苷酸(SEQ ID NO:196)。

实施例27：构建P.chrysogenum CAS9表达盒

使用MOCLO克隆方法(Weber等，2011)构建CAS9表达盒。图41示出了“0级”MOCLO目标载体中用于连接每个较小片段的精确的4bp悬突。CAS9表达盒含有pGpdA启动子、CAS9开放阅读框和Act1终止子。MOCLO克隆步骤之后，组合的元件形成CAS9表达盒(SEQ ID NO:197)。利用限制酶分析和测序核实“0级”标准目标载体中的表达盒以证实精确的序列。根据MOCLO克隆方法，所产生的载体现在被称为“1级”载体，并在以下实施例中用于进一步克隆。

实施例28：在P.chrysogenum基因组中构建靶向Pks17的P.chrysogenum gRNA表达盒

使用MOCLO克隆方法(Weber等，2011)构建四种gRNA表达盒。图41示出了“0级”MOCLO目标载体中用于连接每个较小片段的精确的4bp悬突。

一个gRNA表达盒含有聚合酶III启动子U6、靶向Pks17的gRNA 846r序列和U6终止子片段。克隆步骤之后，这些组合的元件形成gRNA表达盒“U6”(SEQ ID NO:198)。

第二gRNA表达盒含有聚合酶III启动子U3、靶向Pks17的gRNA序列和U3终止子片段。克隆步骤之后，这些组合的元件形成gRNA表达盒“U3”(SEQ ID NO:199)。

第三gRNA表达盒含有聚合酶III tRNA-Met启动子、靶向Pks17的gRNA序列和tRNA-Met终止子片段。克隆步骤后，这些组合的元件形成gRNA表达盒“tRNA-Met”(SEQ ID NO:200)。

第四gRNA表达盒含有聚合酶III tRNA-Leu启动子、靶向Pks17的gRNA序列和tRNA-Leu终止子片段。克隆步骤之后，这些组合的元件形成gRNA表达盒“tRNA-Leu”(SEQ ID NO:201)。

利用限制酶分析和测序核实“0级”标准目标载体中的所有gRNA表达盒以证实其精确序列。根据MOCLO克隆方法，所产生的载体现在被称为“1级”载体，并用于下文所述的克隆步骤中。

实施例29：克隆5'和3'AMA1同源侧翼

使用MOCLO克隆方法(Weber等，2011)构建在P.chrysogenum中与AMA1载体同源重组所需的两个同源侧翼。图41示出了“0级”MOCLO目标载体中用于连接每个较小片段的精确的4bp悬突。MOCLO克隆步骤之后，组合的元件形成5'AMA1同源侧翼(SEQ ID NO:202)和3'AMA1同源侧翼(SEQ ID NO:203)。利用限制酶分析和测序核实“0级”标准目标载体中的两个侧翼以证实精确的序列。根据MOCLO克隆方法，所产生的载体现在被称为“1级”载体，并用于下文所述的克隆步骤中。

实施例30：将“1级”部分克隆到“2级”载体中

在之前的实施例中产生的“1级”载体被用于下一个MOCLO克隆步骤中。在一步反应中按照以下顺序将片段克隆到“2级”载体中：首先是5'侧翼，然后是CAS9表达盒，接着是其中一个gRNA表达盒，最后是3'侧翼。以这种方式产生了4个载体，一个载体对应于每个不同的gRNA表达盒。5'侧翼-CAS9-U6-3'侧翼组合、5'侧翼-CAS9-U3-3'侧翼组合、5'侧翼-CAS9-tRNA-Met-3'侧翼组合和5'侧翼-CAS9-tRNA-Leu-3'侧翼组合。使用限制酶分析核实所得载体。5'侧翼-CAS9-U6-3'侧翼组合的正确克隆被命名为pYN2_4(SEQ ID NO:204)并用于实施例30中。pYN2_4的质粒图谱见图42，以两种方法表示(A和B)。

实施例31：转化到P.chrysogenum

对于转化到P.chrysogenum DS68530，使用两个线性化载体：上文所述的pYN2_4和载体pDSM-JAK-109(WO/2012/123429中描述的结构，其通过引用并入本文)。在转化前，通过使用DraIII进行限制性消化将pYN2_4载体线性化，通过使用KpnI进行限制性消化将pDSMJAK109线性化。将片段转化到P.chrysogenum中会导致两个片段的体内同源重组和能够在细胞中存活的环状质粒的形成，这归因于位于pDSM-JAK-109片段上的腐草霉素抗性标记和AMA1序列。根据确立的流程进行P.chrysogenum原生质体的制备及其转化(Cantoral等，1987Bio/Technol.5,494-497)。转化后，将原生质体涂布在含有15μg/ml腐草霉素的再生培养基平板上，并在25℃下孵育4-6天。在第一次孵育后，将菌落从再生平板转移到可发生孢子形成的R-琼脂平板上。在25℃下生长4-7天后，针对Pks17突变的白色孢子表型特征对转化体进行评分。许多转化体显示白色孢子表型。图43示出了平板上具有白色(圆形)和绿色菌落的转化体。对照转化导致具有超过100个仅具有wt表型的菌落的平板，这意味着没有白色菌落(数据未示出)。结果显示：CRISPR-Cas系统在转化中有功能，提高了引入Pks17突变的效率，并使Pks17无功能。

深色菌落的进一步生长显示：一些菌落出现了异质性，这表明CRISPR-Cas系统在进一步生长期间有活性，从而导致其它Pks17缺失突变体(数据未示出)。

实施例32：利用靶向Pks17的供体DNA转化到P.chrysogenum

对于该实施例，选择靶gRNA序列>235r(SEQ ID NO:205)用于PKS17。将gRNA尾巴(SEQ ID NO:194)加入生物信息分析中，并将最终的gRNA分子整理为互补的正向寡核苷酸(SEQ ID NO:206)和反向寡核苷酸(SEQ ID NO:207)。

使用U6启动子和终止子，通过与先前在实施例27中所述相同的方式克隆第二gRNA靶标，产生了gRNA表达盒gRNA表达盒“U6pKS17-235”(SEQ ID NO:208)。在该实验中，使用供体DNA。供体DNA是120bp的DNA分子(SEQ ID NO:209)。除了以下变化：A217T、G220T和C235T，其序列与基因Pc21g16000-PKS17的ORF的第181bp至第300bp相同。A217T、G220T用于引入两个终止密码子，C235T用于破坏NGG-PAM。供体DNA被整理为单链互补寡核苷酸，其通过在煮沸后逐渐冷却至室温而退火。使用Zymoprep DNA Clean&Concentrator Kit纯化供体DNA。

为了转化到P.chrysogenum(DS68530)，使用两个线性化载体：上文所述的pYN2_4和载体pDSM-JAK-109(WO/2012/123429中描述的结构，其通过引用并入本文)以及120bp的供体DNA片段。在转化前，通过使用DraIII进行限制性消化将pYN2_4载体线性化，通过使用KpnI进行限制性消化将pDSMJAK109线性化。将片段转化到P.chrysogenum中会导致两个片段的体内同源重组和能够在细胞中存活的环状质粒的形成，这归因于位于pDSM-JAK-109片段上的腐草霉素抗性标记和AMA1序列。根据确立的流程进行P.chrysogenum原生质体的制备及其转化(Cantoral等，1987Bio/Technol.5,494-497)。转化后，将原生质体涂布在含有15μg/ml腐草霉素的再生培养基平板上，并在25℃下孵育4-6天。转化后，将菌落从再生平板转移到可发生孢子形成的R-琼脂平板上。在25℃下生长4-7天后，针对Pks17突变的白色孢子表型特征对转化体进行评分。许多转化体显示白色孢子表型。对照转化导致具有超过100个仅具有wt表型的菌落的平板，这意味着没有白色菌落。结果显示：CRISPR-Cas系统在转化中有功能，并提高了引入Pks17突变的效率。通过菌落PCR挑选几个菌落，随后对包含设计的修饰靶标的200bp片段进行SANGER测序，可以看出：以靶向方式引入了预期突变。

实施例33：构建靶向Pks17的第二系列gRNA表达盒

gRNA靶标>235r被选择用于本实验并与较长的gRNA尾巴(SEQ ID NO:210)组合。将尾巴加入生物信息分析中，并将gRNA>235r分子的MOCLO克隆中使用的片段整理为互补的正向寡核苷酸(SEQ ID NO:211)和反向寡核苷酸(SEQ ID NO:212)。得到的具有较长尾巴的gRNA>235r被称为gRNA>235r长。将gRNA>235r长构建体整理为在组装到0级载体之前退火的寡核苷酸。通过在连接酶缓冲液(ThermoScientific，USA)中混合等量的正向寡核苷酸和反向寡核苷酸使寡核苷酸退火(所有寡核苷酸均购自Sigma Aldrich，UK)。将混合物在100℃下孵育5分钟，然后通过在75个循环中逐渐降低1℃持续30秒来冷却至25℃。

在该实施例中，克隆了4种不同的启动子和终止子组合用于在P.chrysogenum中体内转录gRNA>235r长。如之前在实施例27中所述进行克隆，使用RNA聚合酶III U6启动子(SEQ ID NO:213)和U6终止子(SEQ ID NO:214)，产生了gRNA表达盒“U6pKS17>235长”(SEQID NO:215)；使用tRNA-Met启动子(SEQ ID NO:27)和RNA聚合酶III tRNA-Met终止子(SEQID NO:216)，产生了“tRNA-Met pKS17>235长”(SEQ ID NO:217)；使用RNA聚合酶III tRNA-Leu启动子(SEQ ID NO:219)和tRNA-Leu终止子(SEQ ID NO:220)，产生了“tRNA-Leu pKS17>235长”的(SEQ ID NO:221)；使用RNA聚合酶II utp25启动子(SEQ ID NO:222)和utp25终止子(SEQ ID NO:223)，产生了“utp25pKS17>235长”(SEQ ID NO:224)。根据MOCLO克隆方法，所产生的载体现在称为“1级”载体。

实施例34：构建用于缺失pKS17ORF的供体DNA

本实施例中使用的供体DNA是2049bp的无标记DNA片段。其序列与pKS17的ORF的5'侧翼上约1kb的侧翼区和3'侧翼上1kb的侧翼区相同。使用MOCLO模块克隆系统构建供体DNA片段。使用针对5'侧翼区的正向引物pks17_5'_BpiI_F(SEQ ID NO:225)和反向引物pks17_5'_BpiI_R(SEQ ID NO:226)以及针对3'侧翼区的正向引物pks17_3'_BpiI_F(SEQ ID NO:227)和反向引物pks17_3'_BpiI_R(SEQ ID NO:228)，从P.chrysogenum DS68530的基因组DNA(gDNA)PCR扩增片段。在标准克隆载体中组合两个片段后，使用正向引物pks17_1kb_F(SEQ ID NO:229)和反向引物pks17_1kb_R(SEQ ID NO:230)，通过PCR扩增产生用于转化到P.chrysogenum的最终供体DNA片段。在加入到转化混合物中之前，用PCR净化试剂盒(SigmaAldrich，UK)纯化通过PCR扩增的最终供体DNA(SEQ ID NO:231)。

实施例35：构建P.chrysogenum xlnA启动子CAS9表达盒

使用MOCLO克隆方法(Weber等，2011)构建表达盒“xlnA-CAS9”。图41示出了“0级”MOCLO目标载体中用于连接每个较小片段的精确的4bp悬突。由gBlocks(IDT，USA)扩增来自A.nidulans的xlnA的木糖诱导型启动子及其终止子。由通过Addgene获得的构建体PCR扩增来自Staphylococcus pyogenes的Cas9开放阅读框。MOCLO克隆步骤之后，组合的元件形成xlnA-CAS9表达盒(SEQ ID NO:232)。利用限制酶分析和测序核实标准目标载体中的表达盒以证实精确的序列。根据MOCLO克隆方法，所产生的载体现在被称为“1级”载体。

实施例36：构建pDSM-YN2AMA1质粒

在被用作起始载体的载体pDSM-JAK-109中，使用限制酶NotI和NsiI以及标准克隆程序，将dsRED荧光标记转换为受A.nidulans 40S启动子控制的mKate。这导致“pDSM-YN2”载体(SEQ ID NO:233)，使用限制酶分析对其进行核实和证实。在加入到转化混合物中之前，利用SnaBI和AgeI将pDSM-YN2载体线性化，并利用PCR净化试剂盒(Sigma Aldrich，UK)纯化。

实施例37：构建用于与pDSM-YN2AMA1载体同源重组的侧翼区

为了产生与pDSM-YN2AMA1载体的同源性以用于在转化到P.chrysogenum期间体内同源重组，将1kb的5'和3'侧翼区克隆为单独的1级模块。将这些连接到gRNA和CAS9表达盒，最后用于在转化到P.chrysogenum期间通过体内同源重组并入pDSM-YN2AMA1载体中。利用针对5'侧翼区(SEQ ID NO:236)的被称为5'_F(SEQ ID NO:234)和5'_R(SEQ ID NO:235)的引物以及针对3'侧翼区(SEQ ID NO:239)的被称为3'_F(SEQ ID NO:237)和3'_R(SEQ IDNO:238)的引物PCR扩增两个侧翼。将扩增的片段克隆到MOCLO“0级”标准目标载体中，并利用限制酶分析和测序核实以证实构建体。根据MOCLO克隆方法，所产生的载体被称为“1级”载体。

实施例38：产生用于转化的最终CAS9、gRNA载体

MOCLO方案允许使用金门技术构建多基因构建体。MOCLO克隆被用于由先前构建的1级载体产生最终载体。对于实施例32中所述的4种gRNA表达盒变体中的每一种，制备两个单独的载体。一个含有与pDSM-YN2同源的5'侧翼、xlnA-CAS9表达盒和以pKS17为靶标的gRNA表达盒变体之一。字母“A”被添加到这些载体的名称中。第二个含有以pKS17为靶标的gRNA表达盒变体、gpd-amdS标记盒和pDSM-YN2 AMA1载体的3'侧翼区。字母“B”被添加到这些载体的名称中。根据MOCLO方法构建后，产生了共8个载体。

以下列出了所述载体及其各自的序列ID。

“A”载体

-pYN2_18_A_5’-XlnA-Cas9-Utp25_Pks17(SEQ ID NO:232)

-pYN2_19_A_5’XlnA-Cas9-U6_Pks17(SEQ ID NO:233)

-pYN2_20_A_5’-XlnA-Cas9-tRNA-Leu_Pks17(SEQ ID NO:234)

-pYN2_21_A_5’-XlnA-Cas9-tRNA-Met_Pks17(SEQ ID NO:235)

“B”载体

-pYN2_22_B_Utp25_Pks17-amdS-3’(SEQ ID NO:236)

-pYN2_23_B_U6_Pks17-amdS-3’(SEQ ID NO:237)

-pYN2_24_B_tRNA_Leu_Pks17-amdS-3’(SEQ ID NO:238)

-pYN2_25_B_tRNA_Met_Pks17-amdS-3’(SEQ ID NO:239)

在加入到转化混合物中之前，利用在骨架中切割两次的MreI将载体线性化，并在消化后利用PCR净化试剂盒(Sigma Aldrich，UK)纯化。

实施例39：使用CRISPR-Cas，在P.chrysogenum中无标记缺失PKS17

P.chrysogenum DS68530菌株被用于转化。DS68530(ΔhdfA)菌株在NHEJ方面有缺陷，因此在存在供体DNA的情况下，HR是这些细胞修复DSB的优选方法。

转化以下片段：

-线性化AMA1载体pDSM-YN2(参见实施例35)

-来自A载体的线性化片段(参见实施例37)

-来自B载体的相应线性化片段(参见实施例37)

-2kb供体DNA片段(参见实施例33)。

对于每个片段，在转化混合物中使用1μg DNA。制备并转化四种不同的混合物，一种用于utp25gRNA表达盒，一种用于U6表达盒，一种用于tRNA_Leu，一种用于tRNA-Met。转化图示请参见图44。

根据确立的流程进行P.chrysogenum原生质体的制备及其转化(Cantoral等，1987Bio/Technol.5,494-497)。转化后，将原生质体涂布在含有乙酰胺作为唯一氮源的再生培养基平板上，然后在25℃下孵育4-6天。

将片段转化到P.chrysogenum导致pDSM-YN2片段、来自“A”载体的线性化片段和来自相应的“B”载体的线性化片段的体内同源重组。由于AMA1序列和对amdS标记的选择，形成了能够在细胞中存活的环状质粒。由于同源重组，载体还并入了CAS9表达盒和靶向Pks17的gRNA表达盒。所得质粒表达CAS9和gRNA。这导致根据本发明的活性CRISPR-CASs系统能够在基因组上的Pks17基因座特异性切割。供体DNA片段能够通过在CAS9介导的双链断裂处同源重组以及修复断裂和缺失Pks17 ORF而整合。转化后，将原生质体在含有1M蔗糖和0.1％乙酰胺作为唯一氮源的回收平板上在25℃和增加的湿度下孵育5-6天。将来自转化平板的菌落转移至R-琼脂。获得的菌落显示属于Pks17缺失表型的特征性白色孢子，其中一些保持野生型背景绿色孢子，从而导致浅白色/绿色菌落。为了确认供体DNA在基因组中的整合，使用正向寡核苷酸pks17_0.25kb_F(SEQ ID NO:148)和反向寡核苷酸pks17_0.25kb_R(SEQ IDNO:249)以及Phire Plant Direct PCR Kit(ThermoScientific，USA)进行菌落PCR。菌落PCR显示：在所分析的45个菌落中，所有菌落均通过供体DNA被修复，从而导致完整的Pks17ORF被移除，如通过553bp的条带所示(参见图45，用于分析约一半的菌落在琼脂糖凝胶上的PCR结果)。结果显示：对于转化中使用的每个启动子gRNA组合而言，与供体DNA组合的CRISPR-Cas系统是有功能的，并且使得能够有效进行无标记缺失Pks17ORF。

实施例40：体外gRNA合成

通过将20bp前间区序列(>235r)融合到T7启动子序列和77bp gRNA尾巴，将gRNA模板构建为DNA寡核苷酸。最终的120bp序列(SEQ ID NO:250)被用作体外gRNA合成的模板。使用Ambion MegaScript RNA合成试剂盒(ThermoFisher，USA)合成gRNA，将0.75μg gRNA模板和0.25μl SUPERase In RNase抑制剂(20U/μL，ThermoFisher)加入到10μl gRNA合成反应中，并在37℃下孵育至少6小时。对于合成对照，通过在2％琼脂糖凝胶上电泳来分析0.5μlgRNA合成混合物，gRNA被直接用于转化实验而无需任何进一步的纯化。

实施例41：使用CRISPR-Cas和体外合成的gRNA在P.chrysogenum中无标记缺失pKS17

P.chrysogenum DS68530菌株被用于转化。DS68530(ΔhdfA)菌株在NHEJ方面有缺陷，因此HR是这些细胞修复DSB的优选方法。

转化以下片段：

-线性化AMA1载体pDSM-YN2(参见实施例35)

-MreI线性化载体pYN2_28_Xyl-Cas9_AMDS_3(SEQ ID NO:251)

-体外转录的gRNA(参见实施例40)

-2kb供体DNA片段(参见实施例33)。

对于每个DNA片段，在转化混合物中使用1μg DNA，使用0.75μg体外合成的gRNA。

将片段转化到P.chrysogenum导致pDSM-YN2片段和含有xlnA-CAS9表达盒和amdS的线性化片段的体内同源重组。由于AMA1序列和对amdS标记的选择，形成了能够在细胞中存活的环状质粒。将与pks17的3'-和5'-侧翼区具有1kb同源的无标记供体DNA盒和靶向pks17的体外合成的sgRNA同时加入到原生质体中，并通过将原生质体涂布在含20g/l D-木糖的乙酰胺选择培养基上来诱导Cas9的表达，其中xlnA启动子显示导致高表达(数据未示出)。在DS17690菌株的88个菌落中，共20个(23％)菌落清楚地显示白色表型。许多绿色菌落明显是混合群体，可能也含有白色突变体。实际上，通过菌落PCR证实了所有白色菌落均并入了无标记的供体DNA。结果显示：当使用体外转录和产生的gRNA时，与供体DNA组合的CRISPR-Cas系统也有功能，从而使得能够无标记缺失Pks17ORF。

参考文献

Aleksenko和Clutterbuck.Fungal Genet.Biol.1997 21:373-397.Autonomousplasmid replication in Aspergillus nidulans:AMA1and MATE elements.

Barnes等,siRNA as a molecular tool for use in Aspergillus niger(2008)Biotechnology Letters 30(5):885-890.

Becker和Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to YeastGenetics and Molecular Biology,Methods in Enzymology,Volume 194,182-187,Academic Press,Inc.,New York.

Beetham PR,Kipp PB,Sawycky XL,Arntzen CJ和May GD.PNAS 1999,96,8774-8778.A tool for functional plant genomics:Chimeric RNA/DNA oligonucleotidescause in vivo gene-specific mutations.

Cantoral et al.,1987Bio/Technol.5,494-497.

Christianson TW,Sikorski RS,Dante M,Shero JH,Hieter P.Gene.1992Jan 2；110(1):119-22.Multifunctional yeast high-copy-number shuttle vectors.

Crook NC,Schmitz AC,Alper HS.ACS Synth Biol.2014 16；3(5):307-13.Optimization of a yeast RNA interference system for controlling geneexpression and enabling rapid metabolic engineering.

DiCarlo JE,Norville JE,Mali P,Rios X,Aach J,Church GM.Nucleic AcidsRes.2013Apr；41(7):4336-43..Genome engineering in Saccharomyces cerevisiaeusing CRISPR-Cas systems.

Dong C,Beetham P,Vincent K and Sharp P.2006Plant Cell Rep 25:457-465.Oligonucleotide-directed gene repair in wheat using a transient plasmidrepair assay system.

Durai S,Mani M,Kandavelou K,Wu J,Porteus M,Chandrasegaran S.NucleicAcids Res 2005 33(18):5978–90.Zinc finger nucleases:custom-designed molecularscissors for genome engineering of plant and mammalian cells.

Gaj T,Gersbach,C和Barbas C.Trends in Biotechnology,2013,Vol.31,No.7397-405.ZFN,TALEN,and CRISPR/Cas-based methods for genome engineering.

Gao Y和Zhao Y.J Integr Plant Biol.2014Apr；56(4):343-9.Self-processingof ribozyme-flanked RNAs into guide RNAs in vitro and in vivo for CRISPR-mediated genome editing.

Gietz RD,Woods RA.Methods Enzymol.2002；350:87-96.Transformation ofyeast by lithium acetate/single-stranded carrier DNA/polyethylene glycolmethod.

Goldstein,A.L.,and McCusker,J.H.Yeast 1999.15,1541-15.Three newdominant drug resistance cassettes for gene disruption in Saccharomycescerevisiae.

Guilinger JP,Thompson DB,Liu DR.Nat Biotechnol.2014 577–582.Fusion ofcatalytically inactive Cas9to FokI nuclease improves the specificity ofgenome modification.

Güldener,U.,Heck,S.,Fiedler,T.,Beinhauer,J.,和Hegemann,J.H.NucleicAcids Research 1996.24,2519-2524.A new efficient gene disruption cassette forrepeated use in budding yeast.

Hsu PD,Lander ES,Zhang F.Cell.2014Jun 5；157(6):1262-78.Developmentand applications of CRISPR-Cas9for genome engineering.

Ito et al.,1983,Journal of Bacteriology 153:163.

Jacobs JZ,Ciccaglione KM,Tournier V,Zaratiegui M.Nat Commun.2014Oct29；5:5344.Implementation of the CRISPR-Cas9system in fission yeast.

Jinek M,Chylinski K,Fonfara I,Hauer M,Doudna JA,CharpentierE.Science.A programmable dual-RNA-guided DNA endonuclease in adaptivebacterial immunity.2012Aug 17；337(6096):816-21.

TR,Park J,Arentshorst M,van Welzen AM,Lamers G,Vankuyk PA,Damveld RA,van den Hondel CA,Nielsen KF,Frisvad JC,Ram AF.Fungal GenetBiol.2011May；48(5):544-53.The molecular and genetic basis of conidialpigmentation in Aspergillus niger.

Kornberg R.Trends in Cell Biology 1999 9(12):M46Eukaryotictranscriptional control.

Kuijpers et al.Microbial Cell Factories 2013,12:47.A versatile,efficient strategy for assembly of multi-fragment expression vectors inSaccharomyces cerevisiae using 60bp synthetic recombination sequences.

Larson,M.H.；Gilbert,L.A.；Wang,X；Lim,W.A.；Weissman,J.S.；Qi,L.S.NatureProtocols 2013 8(11)2180–96.CRISPR interference(CRISPRi)for sequence-specificcontrol of gene expression.

M,Kristjuhan K,Kristjuhan A.Biotechniques.2011May；50(5):325-8.Extraction of genomic DNA from yeasts for PCR-based applications.

Mali P,Yang L,Esvelt KM,Aach J,Guell M,DiCarlo JE,Norville JE,ChurchGM.Science.2013Feb 15；339(6121):823-6.RNA-guided human genome engineering viaCas9.

Marck C,Kachouri-Lafond R,Lafontaine I,Westhof E,Dujon B,GrosjeanH.Nucleic Acids Res.2006Apr 5；34(6):1816-35.The RNA polymerase III-dependentfamily of genes in hemiascomycetes:comparative RNomics,decoding strategies,transcription and evolutionary implications.

Mouyna I,Henry C,Doering TL,LatgéJP.FEMS Microbiol Lett.2004Aug 15；237(2):317-24.Gene silencing with RNA interference in the human pathogenicfungus Aspergillus fumigatus.

Nakamura,Y.等.Nucl.Acids Res.2000 28:292.Codon usage tabulated fromthe international DNA sequence databases:status for the year 2000.

Oliveira等,Efficient cloning system for construction of genesilencing vectors in Aspergillus niger(2008)Appl.Microbiol.and Biotechnol.80(5):917-924.

Ran FA,Hsu PD,Lin CY,Gootenberg JS,Konermann S,Trevino AE,Scott DA,Inoue A,Matoba S,Zhang Y,Zhang F.Cell 2013 154,1380-1389.Double nicking byRNA-guided CRISPR Cas9for enhanced genome editing specificity.

Sander JD,Joung JK.Nat Biotechnol.2014Apr；32(4):347-55.doi:10.1038/nbt.2842.Epub 2014Mar 2.CRISPR-Cas systems for editing,regulating andtargeting genomes.

Sikorski RS,Hieter P.Genetics.1989May；122(1):19-27.A system ofshuttle vectors and yeast host strains designed for efficient manipulation ofDNA in Saccharomyces cerevisiae.

Snoek et al.(2009)Fungal Genetics and Biology 46,418–426.

Ryan OW,Skerker JM,Maurer MJ,Li X,Tsai JC,Poddar S,Lee ME,DeLoache W,Dueber JE,Arkin AP,Cate JH.Elife.2014.19；3.03703.

Tsai SQ,Wyvekens N,Khayter C,等.Nat Biotechnol.2014 32(6):569–576.Dimeric CRISPR RNA-guided FokI nucleases for highly specific genomeediting.

Verdoes,J.C.等.Characterization of an efficient gene cloning strategyfor Aspergillus niger based on an autonomously replicating plasmid:cloning ofthe nicB gene of A.niger.Gene 1994,146:159-165.

Wah,D.A.；J.Bitinaite,Schildkraut,I.,Aggarwal,A.K.Proc Natl Acad SciUSA 1998 95(18):10564–9.Structure of FokI has implications for DNA cleavage.

Weber et al.(2011)A Modular Cloning System for Standardized Assemblyof Multigene Constructs.www.plosone.org 1February 2011|Volume 6|Issue 2|e16765.

Zhang G,Kong II,Kim H,Liu J,Cate JH,Jin YS.Appl EnvironMicrobiol.2014Dec 15；80(24):7694-701.doi:10.1128/AEM.02310-14.Epub 2014Oct3.Construction of a quadruple auxotrophic mutant of an industrial polyploidySaccharomyces cerevisiae using RNA-guided Cas9nuclease.

Zhao等,webpage info 2013-2014:Web page:

labs.biology.ucsd.edu/zhao/CRISPR_web/RGR_design_home_frame_set.html.

PCT/RO/134表

Claims

1.一种非天然存在或工程化的组合物，其包含含有向导多核苷酸和Cas蛋白的CRISPR-Cas系统的来源，其中所述向导多核苷酸包含基本上为宿主细胞中靶多核苷酸的反向互补体的向导序列，并且所述向导多核苷酸能够引导所述Cas蛋白结合在所述宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物，其中所述向导序列基本上为所述宿主细胞的基因组中的5’-(N)yPAM-3’多核苷酸序列靶标的(N)y部分的反向互补体，其中y为8-30的整数，其中PAM为前间区序列邻近基序，其中所述宿主细胞为真核细胞，所述真核细胞是丝状真菌，优选Aspergillus、Penicillium、Rasamsonia或Mortierella，并且其中PAM优选为选自以下的序列：5’-XGG-3’、5’-XGGXG-3’、5’-XXAGAAW-3’、5’-XXXXGATT-3’、5’-XXAGAA-3’、5’-XAAAAC-3’，其中X可以为任何核苷酸或其类似物，优选X可以为任何核苷酸；并且W为A或T。

2.根据权利要求1所述的组合物，其中所述Cas蛋白由多核苷酸编码和/或所述向导多核苷酸由多核苷酸编码或存在于多核苷酸上。

3.根据权利要求1或2所述的组合物，其中所述Cas蛋白由多核苷酸编码和/或所述向导多核苷酸由另一多核苷酸编码或存在于另一个多核苷酸上，并且一个或多个所述多核苷酸包含在载体中。

4.根据前述权利要求中任一项所述的组合物，其中所述向导多核苷酸由被转录以提供实际的向导多核苷酸的多核苷酸编码。

5.根据前述权利要求中任一项所述的组合物，其中编码向导多核苷酸的多核苷酸与载体具有序列同一性，使得有利于编码向导多核苷酸的所述多核苷酸与所述载体的重组，其中所述重组优选为所述宿主细胞中的体内重组。

6.根据权利要求5所述的组合物，其包含至少两个不同的多核苷酸，所述多核苷酸各自编码相应的不同向导多核苷酸，其中所述至少两个多核苷酸还彼此具有序列同一性，使得有利于编码不同向导多核苷酸的所述多核苷酸与所述载体的重组，其中所述重组优选为所述宿主细胞中的体内重组。

7.根据前述权利要求中任一项所述的组合物，其中存在与编码向导多核苷酸的多核苷酸和载体具有序列同一性的另外一组多核苷酸，使得有利于编码向导多核苷酸的所述多核苷酸与所述载体的重组，其中所述重组优选为所述宿主细胞中的体内重组。

8.根据权利要求1-3中任一项所述的组合物，其中所述Cas蛋白由多核苷酸编码并且所述向导多核苷酸由另一多核苷酸编码或存在于另一个多核苷酸上，并且所述多核苷酸包含在一个载体中。

9.根据权利要求1-3中任一项所述的组合物，其中所述Cas蛋白由包含在载体中的多核苷酸编码，并且所述向导多核苷酸由包含在另一载体中的另一多核苷酸编码或存在于包含在另一载体中的另一多核苷酸上。

10.根据权利要求9所述的组合物，其中一个或更多个或所有载体包含选择性标记，优选每个载体包含不同的选择性标记。

11.根据前述权利要求中任一项所述的组合物，其还包含在CRISPR-Cas复合物切割所述靶多核苷酸后与所述靶多核苷酸重组产生经修饰的靶多核苷酸的一个或更多个不同的外源性多核苷酸。

12.根据前述权利要求中任一项所述的组合物，其中存在至少两个不同的外源性多核苷酸，所述外源性多核苷酸在所述CRISPR-Cas复合物切割所述靶多核苷酸后与所述靶多核苷酸重组产生经修饰的靶多核苷酸，其中所述至少两个不同的外源性多核苷酸彼此具有序列同一性，使得有利于所述不同的外源性多核苷酸的重组，其中所述重组优选为所述宿主细胞中的体内重组。

13.根据权利要求11所述的组合物，其中存在另外且不同的外源性多核苷酸，所述外源性多核苷酸在所述CRISPR-Cas复合物切割所述靶多核苷酸后与所述靶多核苷酸重组产生经修饰的靶多核苷酸，其中存在与所述外源性且不同的多核苷酸具有序列同一性的额外多核苷酸，使得有利于所述外源性且不同的多核苷酸的重组，并且其中所述重组优选为所述宿主细胞中的体内重组。

14.根据前述权利要求中任一项所述的组合物，其中一个或更多个外源性多核苷酸可操作地连接至所述向导多核苷酸。

15.根据权利要求3-14中任一项所述的组合物，其中至少一个载体为自主复制载体，优选AMA载体。

16.根据前述权利要求中任一项所述的组合物，其中所述Cas蛋白包含至少一种核定位序列，优选异源的核定位序列。

17.根据前述权利要求中任一项所述的组合物，其中所述Cas蛋白具有引导所述靶序列的位置处的两条多核苷酸链的切割的活性。

18.根据前述权利要求中任一项所述的组合物，其中所述Cas蛋白包含至少一个突变，使得所述蛋白相比于对应的野生型Cas蛋白具有改变的核酸酶活性，优选具有引导所述靶序列的位置处的单条多核苷酸链的切割的活性。

19.根据前述权利要求中任一项所述的组合物，其中编码Cas蛋白的多核苷酸针对所述宿主细胞进行密码子优化，优选进行密码子对优化。

20.根据前述权利要求中任一项所述的组合物，其中所述向导多核苷酸由可操作地连接至RNA聚合酶II或III启动子，优选人H1RNA聚合酶III启动子、人U6RNA聚合酶III启动子或酵母SNR52p RNA聚合酶III启动子的多核苷酸编码。

21.根据权利要求1-20中任一项所述的组合物，其中可操作地连接至RNA聚合酶II启动子的多核苷酸编码包含所述向导多核苷酸的前向导多核苷酸和自加工核酶，其中当转录时，所述向导多核苷酸通过所述加工核酶从前向导多核苷酸转录物释放。

22.根据前述权利要求中任一项所述的组合物，其中所述宿主细胞在NHEJ(非同源末端连接)组分上存在缺陷。

23.根据权利要求22所述的组合物，其中所述组合物不包含在所述CRISPR-Cas复合物切割所述靶多核苷酸后与所述靶多核苷酸重组的外源多核苷酸。

24.一种调节细胞中多核苷酸的表达的方法，所述方法包括使宿主细胞接触根据权利要求1-23中任一项所述的组合物，其中所述向导多核苷酸引导所述Cas蛋白结合在所述宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物。

25.根据权利要求24所述的方法，其中所述宿主细胞包含编码目标化合物的多核苷酸。

26.根据权利要求24或25所述的方法，其中所述宿主细胞是重组宿主细胞。

27.一种宿主细胞，其包含根据权利要求1-23中任一项所述的组合物。

28.一种产生宿主细胞的方法，所述方法包括使宿主细胞接触根据权利要求1-23中任一项所述的组合物，其中所述向导多核苷酸引导所述Cas蛋白结合在所述宿主细胞中的靶多核苷酸处以形成CRISPR-Cas复合物。

29.根据权利要求28所述的方法或根据权利要求27所述的宿主细胞，其中所述宿主细胞包含编码目标化合物的多核苷酸。

30.根据权利要求28或29所述的方法或根据权利要求27所述的宿主细胞，其中所述宿主细胞是重组宿主细胞。

31.根据权利要求28-30中任一项所述的方法或根据权利要求27所述的宿主细胞，其中所述宿主细胞在NHEJ(非同源末端连接)组分上存在缺陷。

32.一种生产目标化合物的方法，所述方法包括在有利于所述目标化合物生产的条件下培养能够通过根据权利要求28-31中任一项所述方法获得的宿主细胞或根据权利要求27所述的宿主细胞或根据权利要求28-31中任一项所述的方法产生的宿主细胞，以及任选地纯化或分离所述目标化合物。