CN107849562B - 基因组编辑系统及使用方法 - Google Patents
基因组编辑系统及使用方法 Download PDFInfo
- Publication number
- CN107849562B CN107849562B CN201680043665.8A CN201680043665A CN107849562B CN 107849562 B CN107849562 B CN 107849562B CN 201680043665 A CN201680043665 A CN 201680043665A CN 107849562 B CN107849562 B CN 107849562B
- Authority
- CN
- China
- Prior art keywords
- dna
- sequence
- polynucleotide
- fusarium
- cas endonuclease
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
提供了用于在丝状真菌细胞的基因组中的靶位点处进行基因组编辑的组合物和方法。所披露的方法和组合物涉及指导多核苷酸/Cas内切核酸酶系统和具有针对该真菌细胞基因组基因座的较短同源臂(即,少于500bp)的供体多核苷酸。
Description
相关申请的交叉引用
本申请要求于2015年7月28日提交的美国临时专利申请序列号62/198,049的优先权,将其以其全文通过引用特此结合。
序列表
经由EFS同此提交的序列表文本文件包含于2016年7月27日创建的文件“NB40972-WO-PCT_SEQ_LISTING.txt”,其大小为22千字节。本序列表符合37C.F.R.§1.52(e),并以其全文通过引用结合在此。
技术领域
本披露总体涉及分子生物学、遗传学、生物化学、基因组编辑和丝状真菌的领域。在某些实施例中,本披露针对在微生物细胞中用于同源重组的组合物及其方法,以及在通过此类方法衍生的微生物细胞中用于同源重组的组合物及其方法。在其他实施例中,本披露针对用于编辑微生物细胞的基因组的组合物及其方法。
背景技术
众所周知,在基因组DNA中的特定靶位点处诱导切割可以用于在该靶位点处或附近引入修饰。例如,当靶向的DNA位点含有双链断裂时,已显示用于基因靶向的同源重组被增强(参见,例如Rudin等人,1989;Smih等人)。
鉴于Cas系统的位点特异性性质,已经描述了基于这些系统的基因组修饰/工程化技术,包括在哺乳动物细胞中的那些(参见,例如Hsu等人,2014)。当如预期发挥功能时,基于Cas的基因组工程通过设计重组crRNA(或等效功能的多核苷酸)(其中crRNA的DNA靶向区域(即可变靶向结构域)与基因组内所希望的靶位点同源)并且通过将crRNA与Cas内切核酸酶(通过任何方便和常规手段)在宿主细胞中组合成功能性复合物来授予靶向复杂基因组内几乎任何特定位置的能力。
尽管基于Cas的基因组工程化技术已经应用于许多不同宿主细胞类型(甚至在丝状真菌细胞中)(参见,例如Liu等人,2015),但是这些技术已知具有限制。例如,基因编辑的功效是菌株依赖性的,并且对于供体DNA构建等通常需要多个分子操作步骤。
因此,仍然需要开发更有效的、更有效率的或另外更稳健的或更灵活的基于Cas的基因组编辑方法及其组合物,这些方法及其组合物用于修饰/改变微生物细胞中的基因组靶位点。
发明内容
本披露总体上针对用于编辑丝状真菌细胞的基因组的方法。更具体地,在某些实施例中,本披露针对用于丝状真菌细胞中基因组编辑的方法,该方法包括向丝状真菌细胞中引入Cas内切核酸酶、指导多核苷酸、和供体多核苷酸,其中该供体多核苷酸包含至少一个同源臂,其中该同源臂是少于500个核苷酸的长度并且包含与真菌细胞的靶向的基因组基因座同源的序列,其中该Cas内切核酸酶和指导多核苷酸形成复合物,该复合物使Cas内切核酸酶能够在真菌细胞的靶向的基因组基因座处或附近起作用。在某些实施例中,将该供体多核苷酸插入(并入)真菌细胞的靶向的基因组基因座中。
在某些其他实施例中,该供体多核苷酸进一步包含目的核苷酸序列,该目的核苷酸序列在同源臂上游(5’)并有效地连接至同源臂或者在同源臂下游(3’)并有效地连接至同源臂。该目的核苷酸序列可以包含单个核苷酸、两个核苷酸、三个核苷酸等。在其他实施例中,目的核苷酸序列是通常包含五个(5)或更多个核苷酸的多核苷酸。在某些实施例中,该同源臂是少于350个核苷酸的长度。在其他实施例中,该同源臂是少于150个核苷酸的长度。在某些其他实施例中,该同源臂是在100个至40个核苷酸之间的长度。
在具体的实施例中,将该目的核苷酸序列插入(并入)真菌细胞的靶向的基因组基因座中。在其他实施例中,该插入的供体核酸或多核苷酸导致选自由以下各项组成的组的基因组修饰:DNA缺失、DNA断裂、DNA插入、DNA倒位、DNA点突变、DNA置换、DNA敲入、DNA敲除和DNA敲低。
在又其他实施例中,该供体多核苷酸包含同源臂上游(5’)并有效地连接至目的核苷酸序列以及同源臂下游(3’)并有效地连接至相同的目的核苷酸序列,其中两个同源臂的至少一个是少于500个核苷酸的长度。在具体的实施例中,将该目的核苷酸序列插入真菌细胞的靶向的基因组基因座中。在某些实施例中,至少一个同源臂是少于350个核苷酸的长度。在某些其他实施例中,至少一个同源臂是少于150个核苷酸的长度。在另一个实施例中,至少一个同源臂是在100个至40个核苷酸之间的长度。在其他实施例中,两个同源臂都是少于500个核苷酸。在某些其他实施例中,该目的核苷酸序列包含至少一个异源的核苷酸。在又其他实施例中,该目的核苷酸序列包含异源的多核苷酸序列。
在其他实施例中,该Cas内切核酸酶是Cas切口酶或其功能变体。在具体的实施例中,该Cas内切核酸酶是Cas9内切核酸酶或其功能变体。在其他实施例中,该Cas9内切核酸酶是从选自由以下各项组成的组的属衍生的Cas9内切核酸酶:链球菌属物种(Streptococcus sp.)、弯曲杆菌属物种(Campylobacter sp.)、奈瑟氏菌属物种(Neisseria sp.)、弗朗西斯氏菌属物种(Francisella sp.)和巴斯德氏菌属物种(Pasteurella sp.)。
在其他实施例中,该引入步骤包括引入多核苷酸构建体,该多核苷酸构建体包含用于在真菌细胞中表达Cas内切核酸酶(或其功能变体)的表达盒。在另一个实施例中,该引入步骤包括引入多核苷酸构建体,该多核苷酸构建体包含用于在真菌细胞中表达指导多核苷酸的表达盒。在另一个实施例中,该引入步骤包括向该真菌细胞中引入环状多核苷酸构建体,该环状多核苷酸构建体包含用于Cas内切核酸酶的表达盒、用于指导RNA的表达盒、以及供体DNA。在另一个实施例中,该引入步骤包括向该真菌细胞中直接引入指导多核苷酸或Cas内切核酸酶。
在某些实施例中,该Cas内切核酸酶(或其功能变体)有效地连接至核定位信号。
在其他实施例中,该供体多核苷酸是双链DNA。在某些其他实施例中,该供体多核苷酸是单链DNA。
在其他实施例中,该丝状真菌细胞选自由以下各项组成的属:木霉属、青霉属、曲霉属、腐质霉属、金孢子菌属、镰孢霉属、毁丝霉属、脉孢菌属、和裸胞壳属。
本披露的其他实施例针对通过本文披露的方法和组合物产生的重组丝状真菌细胞。
附图说明
图1A-1C:描绘在pyr4基因座(TS2)中具有19个核苷酸插入序列的100-mer单链供体模板。图1A:pyr4基因组基因座靶位点2(TS2)的示意图。1F和1R、MH179和180是用于分析的PCR引物。100个碱基的单链寡核苷酸是供体模板。图1B:单链供体DNA的100-nt上链。该19-nt插入序列将产生2个限制性位点(Pme1、Pac1),并且在3个不同阅读框中的终止密码子(TAA)将在pyr4基因座内产生功能丧失突变。图1C:用于同源重组的供体模板:100个碱基单链寡核苷酸:在1C-1中,100-nt上链序列,并且在1C-2中,100-nt下链序列(与靶位点互补的链)。
图2A-2C:描绘了使用100个碱基单链DNA模板的同源定向修复和基因组编辑的效率。图2A:使用引物1F和1R(SEQ ID NO:12和13),对从FOA抗性菌落提取的DNA进行PCR扩增。跨越pyr4基因中的靶位点TS2的PCR扩增产生1.2kb的产物。图2B:PCR产物的限制性消化显示Pac1的存在。图2C:PCR产物的限制性消化显示Pme1的存在。
图3A-3C:描绘了使用200个碱基单链DNA模板的同源定向修复和基因组编辑的效率。图3A:200个碱基的单链DNA模板的序列。图3B:使用引物1F和1R(SEQ ID NO:12和13),对从FOA抗性菌落提取的DNA进行PCR扩增。跨越pyr4基因中的靶位点TS2的PCR扩增产生1.2kb的产物。图3C:PCR产物的限制性消化显示Pac1的存在。
图4:描绘了野生型pyr4基因和来自FOA抗性菌株的pyr4基因的序列比对,表明使用100个(A)和200个(B)碱基的单链DNA模板的Cas9介导的同源定向修复。
图5:描绘了具有插入密码子和侧翼同源臂的双链DNA模板的序列。
图6A-6C:描绘了730bp长度的双链DNA供体修复模板。图6A:显示730bp双链DNA的示意图。图6B:使用引物(SEQ ID NO:14和15)从FOA抗性菌落的基因组DNA对跨越TS2的pyr4基因的基因座进行的PCR扩增。图6C:通过使用PacI对PCR产物进行的限制性内切酶消化。
图7A-7C:描绘了1100bp长度的双链DNA供体修复模板。图7A:显示1100bp双链DNA的示意图。图7B:使用引物(SEQ ID NO:14和15),从FOA抗性菌落的基因组DNA对跨越TS2的pyr4基因座的PCR扩增。图7C:通过使用PacI对PCR产物进行的限制性内切酶消化。
图8:描绘了pSB-SpyCas9表达载体。
图9A-9B:描绘了在显示高水平的Cas9生产的枯草芽孢杆菌(Bacillus sutbilis)中对细胞内表达的Cas9的SDS-PAGE分析。图9A描绘了SDS-PAGE的蛋白质印迹。图9B描绘了根据实例8的考马斯亮蓝染色的SDS-PAGE。
图10描绘了根据实例10的表达盒,其显示在单个质粒中的2kb同源臂、Cas9基因和指导RNA,用于链霉菌属MIB基因的Cas9-介导的靶向断裂。
图11描绘了用于MIB基因的靶向断裂的、在单个质粒中显示Cas9基因、指导RNA、但没有2kb同源臂的表达盒。根据实例10的描述,缺乏同源臂允许使用超聚体(ultramer)作为供体用于同源重组。
具体实施方式
概述
在某些实施例中,本披露涉及在微生物细胞中用于有效同源重组的方法及其组合物。在某些其他实施例中,本披露针对在微生物细胞中用于基因组编辑的方法及其组合物。在其他实施例中,本披露涉及通过本披露的此类方法和组合物制得的微生物细胞。
缩写和首字母缩略词
除非另有说明,以下缩写/首字母缩略词具有以下含义:
cDNA 互补DNA
DNA 脱氧核糖核酸
EDTA 乙二胺四乙酸
kDa 千道尔顿
MW 分子量
PEG 聚乙二醇
ppm 百万分率,例如μg蛋白质/克干固体
RNA 核糖核酸
SDS-PAGE 十二烷基硫酸钠-聚丙烯酰氨凝胶电泳
sp. 物种
Tm 解链温度
w/v 重量/体积
w/w 重量/重量
℃ 摄氏度
H2O 水
g或gm 克
μg 微克
mg 毫克
kg 千克
μL和μl 微升
mL和ml 毫升
mm 毫米
μm 微米
M 摩尔
mM 毫摩尔
μM 微摩尔
U 单位
sec 秒
min(s) 一分钟/多分钟
hr(s) 一小时/多小时
Tris-HCl 三(羟甲基)氨基甲烷盐酸盐
HEPES 4-(2-羟乙基)-1-哌嗪乙磺酸
CV 柱体积
定义
在描述本发明的组合物和方法之前,定义以下术语和短语。在此未定义的术语应当符合其在本领域中所已知和使用的普通含义。
在提供了一系列值的情况下,应理解每个中间值为到下限的十分之一单位(除非上下文中另有清楚地指示),该范围的上限与下限之间以及在该陈述范围内的任何其他陈述的或中间值均被涵盖在本发明的组合物和方法之内。这些较小范围的上限和下限可以被独立地包括在所述较小的范围内,并且也被涵盖在本发明的组合物和方法之内,服从所陈述范围中任何特别排除的限值。在所陈述的范围包括一个或者全部两个限值的情况下,排除那些包括的限值的任一个或者全部两个的范围也包括在本发明的组合物和方法中。
本文提供了某些范围,其中数值前面是术语“约”。术语“约”在本文中用于为其后面的确切数字以及与该术语后面的数字接近或近似的数字提供文字支持。在确定数字是否接近或近似于具体叙述的数字时,接近或近似的未列举的数字可以是在呈现其的上下文中提供具体叙述的数字的实质性等值的数字。例如,关于数值,术语“约”是指数值的-10%至+10%的范围,除非术语在上下文中另有具体定义。在另一个实例中,短语“约6的pH值”是指pH值为从5.4至6.6,除非pH值另有具体定义。
本文提供的标题并非对本发明的组合物和方法的各个方面或实施例进行限制,这些方面或实施例可通过将说明书作为一个整体来参考而得到。因此,将说明书作为一个整体参考时,下面即将定义的术语被定义得更全面。
将本文件组织成若干部分以便于阅读;然而,读者将领会的是,在一个部分中进行的陈述可能适用于其他部分。以这种方式,用于本披露的不同部分的标题不应被解释为限制。
除非另有定义,本文使用的所有技术和科学术语具有与本发明组合物和方法所属领域的普通技术人员通常理解的相同含义。虽然类似于或等同于本文描述的那些的任何方法和材料也可以用于本发明组合物和方法的实践或测试中,但现在将对代表性示例方法和材料进行描述。
在本说明书中引用的所有出版物和专利都通过引用结合在此,就好像每个单独的出版物或专利被具体地并单独地指示为通过引用结合,并且通过引用结合在此从而结合引用的出版物来披露和描述这些方法和/或材料。任何出版物的引用是针对其在申请日之前的披露内容,并且不应该理解为承认因为先前的披露内容而本发明的组合物和方法无权享有比这些出版物更早的申请日。此外,所提供的公开日期可能与实际公开日期不同,实际公开日期可能需要独立地证实。
根据这一详细说明,以下缩写和定义适用。应当注意单数形式“一个/一种(a/an)”和“该(the)”包括复数个指示物,除非上下文中另有清楚地指示。因此,例如提及“酶”包括多个这样的酶,并且提及“剂量”包括提及一个或多个剂量以及本领域技术人员已知的其等效物,等等。
进一步注意的是,权利要求书可以撰写以排除任何可选择的要素。因此,该陈述旨在作为使用与权利要求要素的叙述有关的排他性术语如“单独”、“仅”、“不包括”、“排除”等或使用“否定性”限定的前提基础。
进一步注意的是,如本文所用的术语“基本上由……组成”是指一种组合物,其中该术语之后的一种或多种组分在存在其他已知的一种或多种组分的情况下为总体组合物的以重量计小于30%的总量,并且不会有助于或干扰一种或多种组分的作用或活性。
进一步注意的是,如本文所使用的术语“包含”意指包括但不限于在术语“包含”之后的一种或多种组分。在术语“包含”之后的组分是必需的或强制性的,但是包含一种或多种组分的组合物可以进一步包括其他非强制性或可选择的一种或多种组分。
还要注意的是,如本文所使用的术语“由……组成”意指包括且限于术语“由……组成”之后的一种或多种组分。因此,术语“由……组成”之后的一种或多种组分是必需的或强制性的,且组合物中不存在一种或多种其他组分。
如将对于本领域技术人员显而易见的是,在阅读本披露时,本文描述和展示的单独实施例中的每一个具有离散的组分和特征,这些组分和特征可以在不偏离本文所述的本发明组合物和方法的范围或精神的情况下容易地与任何其他几个实施例的任何一个的特征分离或组合。可以按照所叙述的事件的顺序或按照逻辑上可行的任何其他顺序来进行任何叙述的方法。
如本文所用,称为“Cas内切核酸酶”或具有“Cas内切核酸酶活性”的多肽涉及由Cas基因编码的CRISPR相关的(Cas)多肽,其中当与一种或多种指导多核苷酸功能性偶联时,Cas多肽能够切割靶DNA序列(参见,例如美国专利8,697,359)。保留指导多核苷酸指导的内切核酸酶活性的Cas内切核酸酶的变体也包括在该定义中。在本文详述的供体DNA插入方法中采用的Cas内切核酸酶是在靶位点处向DNA中引入双链断裂的内切核酸酶。通过指导多核苷酸指导Cas内切核酸酶识别和切割双链DNA中的特异性靶位点(例如在细胞基因组中的靶位点)。
如本文所用,术语“基因组编辑”是基因工程的类型,其中使用人工工程改造的核酸酶、或“分子剪刀”从基因组中插入、置换或去除DNA。其是以序列特异性方式来阐述基因或蛋白质的功能和作用的有用的工具。
如本文所用,术语“指导多核苷酸”涉及可以与Cas内切核酸酶形成复合物的多核苷酸序列,并且使得Cas内切核酸酶能够识别并切割DNA靶位点。指导多核苷酸可以是单分子或双分子。指导多核苷酸序列可以是RNA序列、DNA序列或其组合(RNA-DNA组合序列)。任选地,指导多核苷酸可以包含至少一种核苷酸、磷酸二酯键或连接修饰,例如但不限于锁核酸(LNA)、5-甲基dC、2,6-二氨基嘌呤、2’-氟代A、2’-氟代U、2’-O-甲基RNA、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18(六乙二醇链)分子的连接、或导致环化的5’至3’共价连接。仅包含核糖核酸的指导多核苷酸也被称为“指导RNA”。
指导多核苷酸可以是双分子(也称为双链体指导多核苷酸),其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的第二核苷酸序列结构域(称为Cas内切核酸酶识别结构域或CER结构域)。双分子指导多核苷酸的CER结构域包含沿着互补区域杂交的两个单独的分子。两个单独的分子可以是RNA、DNA和/或RNA-DNA组合序列。在一些实施例中,包含连接到CER结构域的VT结构域的双链体指导多核苷酸的第一个分子被称为“crDNA”(当由DNA核苷酸的连续延伸构成时)或“crRNA”(当由RNA核苷酸的连续延伸构成时)或“crDNA-RNA”(当由DNA和RNA核苷酸的组合构成时)。cr核苷酸可以包含在细菌和古细菌中天然存在的crRNA的片段。在一个实施例中,存在于在此披露的cr核苷酸中的细菌和古细菌中天然存在的crRNA的片段的大小范围可以是,但并不限于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。在一些实施例中,包含CER结构域的双链体指导多核苷酸的第二个分子被称为“tracrRNA”(当由RNA核苷酸的连续延伸构成时)或“tracrDNA”(当由DNA核苷酸的连续延伸构成时)或“tracrDNA-RNA”(当由DNA和RNA核苷酸的组合构成时)。在某些实施例中,指导RNA/Cas9内切核酸酶复合物的RNA是包含双链体crRNA-tracrRNA的双链体化的RNA。
指导多核苷酸还可以是单分子,其包含与靶DNA中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的第二核苷酸结构域(称为Cas内切核酸酶识别结构域或CER结构域)。“结构域”意指可以为RNA、DNA和/或RNA-DNA组合序列的核苷酸的连续延伸。单指导多核苷酸的VT结构域和/或CER结构域可以包含RNA序列、DNA序列或RNA-DNA组合序列。在一些实施例中,单指导多核苷酸包含连接到tracr核苷酸(包含CER结构域)的cr核苷酸(包含与CER结构域连接的VT结构域),其中该连接是包含RNA序列、DNA序列或RNA-DNA组合序列的核苷酸序列。由来自cr核苷酸和tracr核苷酸的序列构成的单指导多核苷酸可以被称为“单指导RNA”(当由RNA核苷酸的连续延伸构成时)或“单指导DNA”(当由DNA核苷酸的连续延伸构成时)或“单指导RNA-DNA”(当由RNA和DNA核苷酸的组合构成时)。在本披露的一个实施例中,单指导RNA包含可以与II型Cas内切核酸酶形成复合物的、II型CRISPR/Cas系统的crRNA或crRNA片段以及tracrRNA或tracrRNA片段,其中该指导RNA/Cas内切核酸酶复合物可以将Cas内切核酸酶指导到真菌细胞基因组靶位点,使Cas内切核酸酶能够在基因组靶位点处引入双链断裂。
相对于双链体指导多核苷酸,使用单指导多核苷酸的一个方面是仅需要使一个表达盒在靶细胞中表达单指导多核苷酸。
术语指导多核苷酸的“Cas内切核酸酶识别结构域”或“CER结构域”在此可互换地使用,并且包括与Cas内切核酸酶多肽相互作用的核苷酸序列(例如指导多核苷酸的第二核苷酸序列结构域)。CER结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如在此所述的修饰)或其任何组合构成。
连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包含RNA序列、DNA序列或RNA-DNA组合序列。在一个实施例中,连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以是至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个核苷酸的长度。在另一个实施例中,连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包含四核苷酸环序列,例如但不限于GAAA四核苷酸环序列。
指导多核苷酸、和/或CER结构域的核苷酸序列修饰可以选自但不限于由以下各项组成的组:5’帽、3’聚腺苷酸尾、核糖开关序列、稳定性控制序列、形成dsRNA双链体的序列、将指导多核苷酸靶向亚细胞位置的修饰或序列、提供跟踪的修饰或序列、提供蛋白质结合位点的修饰或序列、锁核酸(LNA)、5-甲基dC核苷酸、2,6-二氨基嘌呤核苷酸、2’-氟代A核苷酸、2’-氟代U核苷酸、2’-O-甲基RNA核苷酸、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18分子的连接、5’至3’共价连接、或其任何组合。这些修饰可以产生至少一个另外的有益特征,其中该另外的有益特征选自由以下各项组成的组:修改的或调节的稳定性、亚细胞靶向、跟踪、荧光标记、用于蛋白质或蛋白质复合物的结合位点、对互补靶序列的修改的结合亲和力、对细胞降解的修改的抗性和增加的细胞通透性。
如本文所用,术语“指导多核苷酸/Cas内切核酸酶系统”(和等同物)包括能够将双链断裂引入DNA靶序列的Cas内切核酸酶和指导多核苷酸(单链或双链)的复合物。该Cas内切核酸酶在基因组靶位点极为贴近处解开DNA双链体,并在通过指导RNA识别靶序列时切割两条DNA链,但只有当正确的前间区序列邻近基序(PAM)在靶序列的3’末端适当地定向时才进行上述切割。
如本文所用,术语“功能片段”、“功能等同的片段”、“功能等同片段”等可互换使用,并且是指保留亲本多肽的定性酶活性的亲本多肽的一部分或子序列。例如,Cas内切核酸酶的功能片段保留与指导多核苷酸一起产生双链断裂的能力。这里应注意的是,与亲本多肽相比,功能片段可能具有改变的定量酶活性。
相关地,术语“功能变体”、“功能上等同的变体”、“功能等同变体”等可互换使用,并且是指保留亲本多肽的定性酶活性的亲本多肽的变体。例如,Cas内切核酸酶的功能变体保留与指导多核苷酸一起产生双链断裂的能力。这里应注意的是,与亲本多肽相比,功能变体可能具有改变的定量酶活性。
片段和变体可以经由任何方便的方法获得,该任何方便的方法包括定点诱变和合成构建。
如本文所用,术语“密码子修饰的基因”或“密码子偏好的基因”或“密码子优化的基因”是其密码子使用的频率被设计为模拟宿主细胞的偏好的密码子使用的频率的基因。进行核酸改变以密码子优化基因是“同义的”,这意味着它们不改变亲本基因的编码多肽的氨基酸序列。然而,天然基因和变体基因二者都可以针对特定宿主细胞进行密码子优化,因此在这方面不意图限制。
如本文所用,术语“编码序列”是指编码特异性氨基酸序列的多核苷酸序列。“调节序列”是指位于编码序列的上游(5’非编码序列)、内部或下游(3’非编码序列)的核苷酸序列,并且其影响相关的编码序列的转录、RNA加工或稳定性、或翻译。调节序列可以包括但不限于:启动子、翻译前导序列、5’非翻译序列、3’非翻译序列、内含子、聚腺苷酸化靶序列、RNA加工位点、效应子结合位点、和茎-环结构。
如本文所用,术语“启动子”是指能够控制编码序列或功能性RNA的表达的DNA序列。启动子序列由近端元件和较远端上游元件组成,后一元件通常称为增强子。“增强子”是可以刺激启动子活性的DNA序列,并且可以是启动子的固有元件或被插入以增强启动子的水平或组织特异性的异源元件。启动子可以全部来源于天然基因,或者由来源于在自然界存在的不同启动子的不同元件构成,和/或包含合成的DNA区段。本领域技术人员应当理解,不同的启动子可能引导基因在不同组织或细胞类型中、或在不同发育阶段、或者响应于不同环境条件的表达。还认识到,由于在大多数情况下调节序列的确切界限仍未完全限进一步认识到,由于在大多数情况下调节序列的确切边界尚未完全限定,一些变异的DNA片段可能具有相同的启动子活性。如在本领域中熟知的,启动子可以根据其强度和/或它们有活性的条件进行分类,例如组成型启动子、强启动子、弱启动子、诱导型/阻抑型启动子、组织特异性/发育调节性启动子、细胞周期依赖性启动子等。
如本文所用,术语“RNA转录物”是指由DNA序列的RNA聚合酶催化的转录产生的产物。“信使RNA”或“mRNA”是指不含内含子并且可以被细胞翻译成蛋白质的RNA。“cDNA”是指使用酶逆转录酶与mRNA模板互补并由其合成的DNA。“正义”RNA是指包含mRNA并且可以在细胞内或体外翻译成蛋白质的RNA转录物。“反义RNA”是指与靶初级转录物或mRNA的全部或部分互补、并且在某些条件下阻断靶基因的表达的RNA转录物(参见,例如美国专利号5,107,065)。反义RNA的互补性可以是与特定基因转录物的任何部分,即在5’非编码序列、3’非编码序列、内含子或编码序列处。“功能性RNA”是指反义RNA、核酶RNA、或不能被翻译成多肽但对细胞加工有影响的其他RNA。术语“补体”和“反向互补体”在本文中关于mRNA转录物可互换使用,并且意在限定信使的反义RNA。
如本文所用,术语“功能附接”或“有效地连接”意指具有已知或期望的活性的多肽或多核苷酸序列的调节区域或功能结构域(例如启动子、增强子区域、终止子、信号序列、表位标签等)按这样一种方式附接于或连接于靶标(例如,基因或多肽):以允许调节区域或功能结构域根据其已知或期望的活性来控制该靶标的表达、分泌或功能的方式。例如,当启动子能够调节编码序列的表达(即,该编码序列在启动子的转录控制下)时,启动子与该编码序列有效地连接。
如本文所用,术语“PCR”或“聚合酶链式反应”是用于合成特定DNA区段的技术,由一系列重复变性、退火和延伸循环组成,并且是本领域熟知的。
如本文所用,当用于提及生物组分或组合物(例如细胞、核酸、多肽/酶、载体等)时,术语“重组体”表示生物组分或组合物处于自然界中未发现的状态。换句话说,生物组分或组合物已经通过人类干预从其天然状态改变。例如,重组细胞涵盖表达在其天然亲本(即非重组)细胞中未发现的一种或多种基因的细胞、以不同于其天然亲本细胞的量表达一种或多种天然基因的细胞、和/或在不同于其天然亲本细胞的条件下表达一种或多种天然基因的细胞。重组核酸可以通过一个或多个核苷酸与天然序列不同、有效地连接到异源序列(例如异源启动子、编码非天然或变体信号序列的序列等)、缺乏内含子序列、和/或处于分离的形式。重组多肽/酶可以通过一个或多个氨基酸与天然序列不同,可以与异源序列融合,可以被截短或具有氨基酸的内部缺失,能以在天然细胞中未发现的方式表达(例如,来自由于细胞中存在编码多肽的表达载体而过量表达多肽的重组细胞),和/或处于分离的形式。需要强调的是,在一些实施例中,重组多核苷酸或多肽/酶具有与其野生型对应物同一但处于非天然形式(例如,处于分离或富集的形式)的序列。
如本文所用,术语“质粒”、“载体”和“盒”是指携带目的多核苷酸序列(例如将在细胞中表达的目的基因)的额外的染色体元件(“表达载体”或“表达盒”)。这样的元件通常处于双链DNA的形式,并且可以是来源于任何来源的、单链或双链DNA或RNA的、处于直链或环状形式的自主复制序列、基因组整合序列、噬菌体、或核苷酸序列,其中许多核苷酸序列已经被连接或重组成能够将目的多核苷酸引入细胞中的独特构造。目的多核苷酸序列可以是编码将在靶细胞中表达的多肽或功能性RNA的基因。表达盒/载体通常包含具有有效地连接的元件的基因,这些元件允许该基因在宿主细胞中表达。
如本文所用,术语“表达”是指处于前体或成熟形式的功能性终产物(例如,mRNA、指导RNA或蛋白质)的产生。
如本文所用,在将多核苷酸或多肽插入细胞(例如,重组DNA构建体/表达构建体)的上下文中,术语“引入”是指用于执行这样的任务的任何方法,并且包括为了实现所希望的生物分子的引入的“转染”、“转化”、“转导”、物理手段等的任何方法。
“瞬时引入(introduced transiently、transiently introduced、transientintroduction)”、“瞬时表达”等意味着将生物分子以非永久性方式引入宿主细胞(或宿主细胞群体)。关于双链DNA,瞬时引入包括其中引入的DNA不整合到宿主细胞的染色体中并因此在生长期间不被传递到所有子代细胞的情况,以及其中在所希望的时间使用任何方便的方法(例如,使用cre-lox系统、通过去除附加型DNA构建体的正选择压力、通过使用选择培养基促进整合的多核苷酸的全部或部分从染色体中环出,等等)将可能已经整合到染色体中的引入的DNA分子除去的情况。在这方面不旨在限制。通常,将RNA(例如,指导RNA、信使RNA、核糖酶等)或多肽(例如,Cas多肽)引入宿主细胞中被认为是瞬时的,因为这些生物分子在细胞生长期间不被复制并且不明确地传递到子代细胞。关于Cas/指导RNA复合物,瞬时引入包括当瞬时地引入这两种组分中的任一种的情况,因为需要两种生物分子都发挥靶向的Cas内切核酸酶活性。因此,Cas/指导RNA复合物的瞬时引入包括瞬时地引入Cas内切核酸酶和指导RNA中的任一种或两种的实施例。例如,具有其中瞬时地引入了指导RNA的、Cas内切核酸酶的基因组整合的表达盒(并且因此不是瞬时地引入)的宿主细胞可以被称为已经瞬时地引入了Cas/指导RNA复合物(或系统),因为功能性复合物以瞬时的方式存在于宿主细胞中。
如本文所用,术语“成熟”蛋白质是指翻译后加工的多肽(即,从其中已经除去存在于初级翻译产物中的任何前肽(pre-peptide)或原肽(propeptide)的一种多肽)。“前体”蛋白质是指mRNA的翻译的初级产物(即,仍存在前肽或原肽)。前肽和原肽可以是(但不限于)细胞内定位信号。
如本文所用,术语“真菌细胞”、“真菌”、“真菌宿主细胞”等包括门子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)(如由Hawksworth等人,1995所定义的)、以及卵菌门(Oomycota)(Hawksworth等人,1995)以及所有有丝分裂孢子真菌(Hawksworth等人,1995)。在某些实施例中,真菌宿主细胞是酵母细胞,其中术语“酵母”意指产子囊酵母(内孢霉目(Endomycetales))、产担子酵母、和属于不完全菌纲(Fungi Imperfecti)(芽孢纲(Blastomycetes)))的酵母。因此,酵母宿主细胞包括假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或耶氏酵母属(Yarrowia)细胞。酵母的种类包括但不限于:卡尔斯伯酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉斯酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)、乳酸克鲁维酵母(Kluyromomyces lactis)和解脂耶氏酵母(Yarrowia lipolytica)。
如本文所用,术语“丝状真菌细胞”包括真菌亚门的所有丝状形式。丝状真菌属的合适细胞包括但不限于:枝顶孢属、曲霉属、短梗霉属、烟管菌属、拟蜡菌属、金孢属、鬼伞属、革盖菌属、棒囊壳属、毛壳菌属、隐球菌属、线黑粉菌属、镰刀菌属、赤霉菌属、腐质霉属、梨孢菌属(Magnaporthe)、毛霉属、毁丝霉属、毛霉属、新美鞭菌属、脉孢菌属、拟青霉属、青霉菌属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、柱顶孢属、裂褶菌属、孢子丝菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属、和木霉属的细胞。
丝状真菌物种的合适细胞包括但不限于:泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、卢克诺文思金孢子菌(Chrysosporium lucknowense)、杆孢状镰孢菌(Fusarium bactridioides)、谷类镰孢菌(Fusarium cerealis)、克地镰孢菌(Fusariumcrookwellense)、黄色镰孢菌(Fusarium culmorum)、禾谷镰孢菌(Fusariumgraminearum)、禾赤镰孢菌(Fusarium graminum)、异孢镰孢菌(Fusarium heterosporum)、合欢木镰孢菌(Fusarium negundi)、尖孢镰孢菌、多枝镰孢菌、粉红镰孢菌、接骨木镰孢菌、肤色镰孢菌、拟枝孢镰孢菌、硫色镰孢菌、圆镰孢菌、拟丝孢镰孢菌、镶片镰孢菌、黑刺烟管菌、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、卡内基拟蜡菌(Ceriporiopsiscaregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsispannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsissubrufa)、虫拟蜡菌、灰盖鬼伞、毛革盖菌、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗壮脉纹孢菌、间型脉孢菌、产紫青霉菌、变灰青霉菌、离生青霉菌(Penicilliumsolitum)、绳状青霉菌(Penicillium funiculosum)、黄孢原毛平革菌(Phanerochaetechrysosporium)、射脉侧菌(Phlebia radiate)、刺芹侧耳、黄篮状菌(Talaromycesflavus)、土生梭孢霉、长绒毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、和绿色木霉的细胞。
如本文所用,术语“靶位点”、“靶序列”、“基因组靶位点”、“基因组靶序列”(及其等同物)在本文中可互换使用,并且是指真核细胞的基因组中的多核苷酸序列,其中期望Cas内切核酸酶切割会促进基因组修饰,例如,供体DNA的插入和随后的目的基因组区域的缺失。然而,使用这个术语的上下文可以稍微改变其含义。例如,Cas内切核酸酶的靶位点通常是具有高特异性的,并且通常可以被定义为确切的核苷酸位置,然而在一些情况下,所希望的基因组修饰的靶位点可以比仅DNA切割发生的位点更广泛地进行定义,例如有待于从基因组中缺失的基因组基因座或区域。因此,在某些情况下,经由Cas/指导RNA的活性发生的基因组修饰DNA切割被描述为发生在靶位点“处或附近”。靶位点可以是真菌细胞基因组中的内源性位点,或者可替代地,靶位点可以与真菌细胞异源,从而不是基因组中天然存在的,或者与其在自然界中存在的地方相比,靶位点可以发现于异源基因组位置中。
如本文所用,术语“核酸”意指多核苷酸,并且包括脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。核酸还可以包括片段和/或修饰的核苷酸。因此,术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用以表示单链的或双链的RNA和/或DNA的聚合物,任选地包含合成的、非天然的或改变的核苷酸碱基。核苷酸(通常发现处于其5’-单磷酸形式)可以通过其单字母名称表示如下:“A”用于腺苷或脱氧腺苷(分别针对RNA或DNA),“C”用于胞嘧啶或脱氧胞嘧啶,“G”用于鸟苷或脱氧鸟苷,“U”用于尿苷,“T”用于脱氧胸苷,“R”用于嘌呤(A或G),“Y”用于嘧啶(C或T),“K”用于G或T,“H”用于A或C或T,“I”用于肌苷,并且“N”用于任何核苷酸。
如本文所用,术语“来源于”涵盖术语“起源于”、“获得自”、“可获得自”、“分离自”和“产生自”,并且通常表示一种指定的材料在另一种指定的材料中找到其起源或具有可以参考另一种指定的材料来描述的特征。
如本文所用,在至少两种核酸或多肽的上下文中,术语“基本相似”或“基本上同一”意指多核苷酸或多肽包含与亲本或参考序列至少90%,至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%同一的序列,或不包括只是为了规避本说明书而不添加功能的氨基酸取代、插入、缺失或修饰。
如本文所用,在核酸或多肽序列的上下文中,术语“序列同一性”或“同一性”是指在两个序列中的核酸碱基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。
如本文所用,术语“序列同一性的百分比”是指通过在比较窗口上比较两个最佳比对的序列所确定的值,其中与参考序列(其不包含添加或缺失)比较两个序列的最佳比对时,该多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即空位)。通过以下方式计算该百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数目,然后将该结果乘以100以产生序列同一性的百分比。百分比序列同一性的有用实例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或从50%至100%的任何整数百分比。可以使用在此描述的任何程序确定这些同一性。
序列比对和百分比同一性或相似性计算可以使用设计用于检测同源序列的多种比较方法来确定,这些方法包括但不限于LASERGENE生物信息计算包(DNASTAR公司,麦迪逊,威斯康星州)的MegAlignTM程序。在此申请的上下文中,应当理解的是,在使用序列分析软件来分析的情况下,分析的结果将基于参考的程序的“默认值”,除非另有说明。如本文所用,“默认值”将意指当第一次初始化时,最初加载该软件的任何一组值或参数。
如本文所用,术语“Clustal V比对方法”对应于标记有Clustal V的比对方法(Higgins和Sharp,1989;Higgins等人,1992)并且在LASERGENE生物信息学计算套件(DNASTAR公司,麦迪逊,威斯康辛州)的MegAlignTM程序中找到。对于多重比对,默认值对应于空位罚分(GAP PENALTY)=10和空位长度罚分(GAP LENGTH PENALTY)=10。使用Clustal方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE=1、空位罚分=3、窗口(WINDOW)=5、以及存储的对角线(DIAGONALS SAVED)=5。对于核酸,这些参数是KTUPLE=2、空位罚分=5、窗口=4、以及存储的对角线=4。使用Clustal V程序比对序列后,可能通过查看同一程序中的“序列距离”表来获得“百分比同一性”。
如本文所用,术语“Clustal W比对方法”对应于标记有Clustal W的比对方法(Higgins和Sharp,1989;Higgins等人,1992)并且在LASERGENE生物信息学计算套件(DNASTAR公司,麦迪逊,威斯康辛州)的MegAlignTM v6.1程序中找到。用于多重比对的默认参数(空位罚分=10、空位长度罚分=0.2、延迟发散序列(Delay Divergen Seqs,%)=30、DNA转换权重=0.5、蛋白质权矩阵=Gonnet系列、DNA权矩阵=IUB)。使用Clustal W程序比对序列后,可能通过查看同一程序中的“序列距离”表来获得“百分比同一性”。
除非另行说明,否则在此提供的序列同一性/相似性值是指使用采用以下参数的GAP版本10((GCG,Accelrys公司,圣地亚哥,加利福尼亚州)获得的值:核苷酸序列的%同一性和%相似性采用50的空位产生罚分权重和3的空位长度延伸罚分权重以及nwsgapdna.cmp评分矩阵;氨基酸序列的%同一性和%相似性采用8的空位产生罚分权重和2的空位长度延伸罚分权重以及BLOSUM62评分矩阵(Henikoff和Henikoff,1989)。GAP使用Needleman和Wunsch(1970)的算法来找到使匹配数目最大化并且使空位数目最小化的两个完整序列的比对。GAP考虑所有可能的比对和空位位置,并且使用匹配碱基的单位中的空位产生罚分和空位延伸罚分,产生具有最大数目的匹配碱基和最少的空位的比对。
本领域技术人员很清楚地理解,许多水平的序列同一性在鉴定来自其他物种的多肽或修饰的天然的或合成的多肽中是有用的,其中这样的多肽具有相同或相似的功能或活性。百分比同一性的有用实例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或从50%至100%的任何整数百分比。实际上,在描述本披露中,从50%至100%的任何整数氨基酸同一性会是有用的,例如51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。
如本文所用,术语“基因”包括编码并且能够表达功能分子(例如但不限于特定多肽(例如酶)或功能性RNA分子(例如,指导RNA、反义RNA、核糖酶等))的核酸片段,并且包括在编码序列之前(5’非编码序列)和/或之后(3’非编码序列)的调节序列。“天然基因”是指自然界中发现的具有其自身调节序列的基因。
如本文所用,术语“成熟的基因”是已经通过人为干涉改变的基因。这样的“突变基因”具有通过至少一个核苷酸添加、缺失或取代而与相应的非突变基因的序列不同的序列。在本披露的某些实施例中,突变的基因包含如本文披露的指导多核苷酸/Cas内切核酸酶系统导致的改变。突变的真菌细胞是包含突变基因的真菌细胞。
如本文所用,术语“靶向突变”是通过使用涉及双链断裂诱导剂的方法改变天然基因内的靶序列而造成的天然基因中的突变,该双链断裂诱导剂能够在如在此披露的或本领域技术人员已知的靶序列的DNA中诱导双链断裂。
术语“多核苷酸修饰模板”是指当与待编辑的核苷酸序列相比时,包括至少一个核苷酸修饰的多核苷酸。例如,核苷酸修饰可以包括:(i)至少一个核苷酸的替换、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任何组合。任选地,多核苷酸修饰模板可以进一步包含位于至少一个核苷酸修饰侧翼的同源核苷酸序列,其中侧翼同源核苷酸序列为待编辑的希望的核苷酸序列提供了充足同源性。侧翼同源序列在本文中可替代地称为“同源臂”。
如本文所用,术语“供体DNA”、“供体核酸序列”和“供体多核苷酸”是指包含将被插入Cas内切核酸酶的靶位点的“目的多核苷酸”(即,与Cas内切核酸酶/指导多核苷酸复合物的活性相关)的多核苷酸修饰模板。在某些实施例中,供体DNA构建体包含至少一个同源的区域(“同源臂”),该同源的区域侧翼于目的多核苷酸(即,该同源臂在目的多核苷酸的上游(5’)或下游(3’))。因此,在某些实施例中,包含至少一个同源臂的供体DNA构建体与存在于或侧翼于真菌细胞基因组的(Cas)靶位点中的基因组区域享有同源性。在其他实施例中,供体DNA构建体包含侧翼于目的多核苷酸的上游(5’)同源臂和下游(3’)同源臂两者。因此,在本披露的其他实施例中,供体DNA构建体包含第一同源臂,其在上游(5’)并有效地连接至目的多核苷酸,并包含第二同源臂,其在下游(3’)并有效地连接至目的多核苷酸。供体DNA构建体的第一同源臂和第二同源臂分别与真菌细胞基因组的(Cas)靶位点的第一基因组区域和第二基因组区域享有同源性。因此,在具体的实施例中,供体DNA(或多核苷酸修饰模板)包含被与靶位点上的序列异源的目的多核苷酸序列(或目的碱基对)分离的两个同源序列(即,5’和3’同源臂)。在基因组靶位点和两个供体DNA同源臂之间的同源重组典型地导致在靶位点处的序列的编辑。
“同源”意指类似的DNA序列。例如,在供体DNA上发现的“与基因组序列同源的区域”是与真菌细胞基因组中给定的“基因组序列”具有相似序列的DNA区域。总的来说,与基因组座位中的基因组序列同源的序列和基因组序列本身有时在本文中被称为“重复序列”。同源区域可以具有足以经由重复序列和同源基因组序列之间的同源重组(其可以在选择性培养条件下选择)来促进环出靶标区域的环出的任何长度。
例如,重复序列(同源臂)可以包含至少50-55、50-60、50-65、50-70、50-75、50-80、50-85、50-90、50-95、50-100、50-200、50-300、50-400、50-500、50-600、50-700、50-800、50-900、50-1000、50-1100、50-1200、50-1300、50-1400、50-1500、50-1600、50-1700、50-1800、50-1900、50-2000、50-2100、50-2200、50-2300、50-2400、50-2500、50-2600、50-2700、50-2800、50-2900、50-3000、50-3100或更多个碱基长度。“足够的同源性”表示两个多核苷酸序列(例如供体DNA和真菌细胞基因组中的正向重复序列)具有足够的结构相似性以便例如在适当的选择性培养条件下使在重复序列之间的序列环出。结构相似性包括每个多核苷酸片段的总长度以及多核苷酸的序列相似性。序列相似性可以通过在序列的整个长度上的百分比序列同一性和/或通过包含局部相似性(例如具有100%序列同一性的连续核苷酸)的保守区域以及在至少一个序列长度的一部分上的百分比序列同一性来描述。
如本文所用,术语“基因组区域”或“基因组基因座”是在真菌细胞的基因组中的染色体的区段,该区段存在于靶位点(例如,包括基因组缺失靶标和与供体DNA中的重复序列同源的基因组重复序列)任一侧,或者可替代地也包含靶位点的一部分。基因组区域可以包含至少50-55、50-60、50-65、50-70、50-75、50-80、50-85、50-90、50-95、50-100、50-200、50-300、50-400、50-500、50-600、50-700、50-800、50-900、50-1000、50-1100、50-1200、50-1300、50-1400、50-1500、50-1600、50-1700、50-1800、50-1900、50-2000、50-2100、50-2200、50-2300、50-2400、50-2500、50-2600、50-2700、50-2800、50-2900、50-3000、50-3100或更多个碱基。
如本文所用,术语“基因组缺失靶标”和等同物是根据本披露的方面用户想要缺失的真菌基因组中的序列(例如,参见图1)。“环出靶标区域”和等同物是在正向重复序列(例如,基因组重复序列以及在供体DNA中与该基因组重复序列同源的重复序列)之间的区域,该区域通过在真菌基因组中正向重复序列之间的同源重组而环出。在某些实施例中,环出靶标区域包括基因组缺失靶标和在真菌基因组中的靶位点处插入的供体DNA上的可选择标记。表型标记是可筛选或可选择标记,其包括视觉标记和可选择标记,无论其是阳性还是阴性可选择标记。可以使用任何表型标记。具体地,可选择或可筛选标记包含允许人们通常在特定条件下鉴定或选择包含它的分子或细胞或对其进行选择的DNA区段。这些标记可以编码活性,例如但不限于RNA、肽或蛋白质的产生,或可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。
可选择标记的实例包括但不限于:包含限制性内切酶位点的DNA区段;编码对以下各项提供抗性的产物的DNA区段:另外的毒性化合物和抗生素,例如氯嘧磺隆乙酯、苯来特、Basta、和潮霉素磷酸转移酶(HPT);编码另外在受体细胞中缺少的产物的DNA区段(例如,tRNA基因、营养缺陷型标记、显性异源标记-amdS);编码可以容易鉴定的产物的DNA区段(例如,表型标记例如β-半乳糖苷酶(GUS);荧光蛋白,例如绿色荧光蛋白(GFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)和细胞表面蛋白);产生用于PCR的新引物位点(例如,以前未并列的两个DNA序列的并列),包含通过限制性内切核酸酶或其他DNA修饰酶、化学品等不起作用或起作用的DNA序列,并且包含允许其鉴定的特异性修饰(例如,甲基化)所需的DNA序列。
如本文所用,术语“信号序列”是与蛋白质的N-末端部分附接的氨基酸序列,该氨基酸序列有利于蛋白质在细胞外的分泌。细胞外的蛋白质的成熟形式缺乏在分泌过程中被切除的信号序列。
如本文所用,术语“多肽”和“蛋白质”可互换地使用,是指包含通过肽键连接的氨基酸残基的任何长度的聚合物。本文中使用用于氨基酸残基的常规一字母或三字母代码。聚合物可以是线性的或支化的,它可以包含修饰的氨基酸,并且它可以被非氨基酸中断。该术语还涵盖已经自然地或通过干预被修饰的氨基酸聚合物;这些修饰是例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操纵或修饰,例如与标记组分轭合。定义中还包括例如含有一个或多个氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。
“异源的”核酸构建体或序列具有不是其被表达的细胞天然的或以天然形式存在的序列的一部分。关于控制序列,异源的是指在自然界中不起调节与其目前正在调节的基因的表达相同的基因的功能的控制序列(即启动子或增强子)。通常,异源的核酸序列对于它们以天然状态存在的细胞或部分基因组不是内源的,并且已经通过感染、转染、转化、显微注射、电穿孔等添加到细胞中。“异源的”核酸构建体可以含有与在天然细胞中发现的控制序列/DNA编码序列组合相同或不同的控制序列/DNA编码序列组合。
如本文所用,术语“宿主细胞”包括任何真菌,无论是单细胞生物体、来源于多细胞生物体并且被置于组织培养物中的细胞、或作为多细胞生物体的一部分存在的细胞,其易于用根据本披露的核酸构建体转化。这样的宿主细胞(例如酵母和其他真菌细胞)或细菌可以用于复制DNA并产生由如在本披露中使用的核苷酸序列编码的多肽。用于本发明的合适的宿主细胞通常是丝状真菌或酵母。特别优选的是来自丝状真菌的细胞,该丝状真菌优选是曲霉属例如黑曲霉和塔宾曲霉(A.tubingensis)。其他优选的生物体包括米曲霉、泡盛曲霉、里氏木霉、绿色木霉和长柄木霉中的任何一种。
如本文所用,在将核酸序列插入细胞的上下文中,术语“引入”意指本领域已知的“转染”、“转化”或“转导”。
如本文所用,“转化的”意指已经通过使用重组DNA技术转化的细胞。转化通常通过将一个或多个核苷酸序列插入细胞中而发生。所插入的核苷酸序列可以是异源的核苷酸序列,即对于待转化的细胞而言不是天然的序列,例如融合蛋白。
如本文所用,术语“表达”是指基于核酸序列产生多肽的过程。该过程包括转录和翻译。
用于修饰微生物细胞基因组的方法和组合物
本披露涉及在微生物细胞中用于同源重组的方法,以及通过此类方法制得的微生物细胞。本披露也涉及在微生物细胞中用于基因组编辑的方法。
1.基因编辑的方法
在某些实施例中,本披露的真菌是生物技术应用的用于生产蛋白质的微生物,所述蛋白质包括不同的水解酶(例如纤维素酶和木聚糖酶)。例如,红褐肉座菌(Hypocreajecorina)(同义词里氏木霉)可以说是研究最多的分解纤维素的真菌,并且其纤维素酶和半纤维素酶目前处于将可再生的木质纤维素生物质酶促转化为生物燃料的调查研究前沿。因此,需要开发有效的分子工具来进一步促进工业蛋白质/纤维素生产并获得有关纤维素酶或半纤维素酶基因调控机制的新见解。
通过同源重组(HR)的基因靶向是研究基因的功能并改变真菌菌株的特征以用于不同应用的关键技术。然而,与具有高同源基因(HR)靶向速率的酵母酿酒酵母相反,非同源末端连接(NHEJ)途径(Bleuyard等人,2006)似乎是在其他真菌(包括各种丝状真菌)中DNA整合的主要模式,导致链的直接连接而无序列同源性。
当靶向的DNA位点含有双链断裂时,已显示用于基因靶向的HR被增强(参加,例如Rudin等人,1989;Smith等人)。II型成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关的基因(Cas)系统(目前最流行的基因组编辑工具)可以催化靶DNA中的双链断裂(DSB),该靶DNA由匹配指导RNA(gRNA)的前间区的20-bp序列和邻近下游5’-NGG核苷酸序列(称为前间区序列邻近基序(PAM))组成(参见,例如Cong等人,2013)。
在过去2年中,许多研究已经证明CRISPR/Cas9系统是强大的基因组编辑方法,其有助于多种生物体中基因组的遗传改变。尽管基于Cas的基因组工程技术已经应用于许多不同的宿主细胞类型,甚至在丝状真菌细胞中(Liu等人,2015),但是它们具有局限性,例如包括,基因编辑是cas9表达的微生物菌株依赖性的,对于供体DNA构建等需要多个分子操作步骤。
因此,基于前述的,本领域仍然需要开发更稳健有效以及高效的基于Cas的基因组编辑方法及其组合物,用于在微生物细胞中修饰/改变基因组靶位点。
2.基因编辑所需的供体DNA中的短同源臂
本文提供了使用指导RNA/Cas内切核酸酶系统用于在微生物细胞(例如,丝状真菌细胞)的基因组中的靶位点处插入具有一个或多个短同源臂的供体DNA的方法。
在第一方面,本披露提供在微生物细胞(例如,丝状真菌细胞)的基因组中,经由供体DNA与此类微生物细胞中的靶向的基因组基因座的同源重组,用于靶向基因编辑的改进方法。此类方法包括:(a)向微生物细胞群体引入包含Cas内切核酸酶、指导RNA、和与微生物细胞的基因组基因座具有同源性的结构域的供体DNA,其中该供体DNA中的一个或全部两个同源臂的长度是短的,范围从40bp至500bp,如例如从40bp至450bp、或从45bp至400bp、或50bp至350bp、或55bp至300bp等等,其中该Cas内切核酸酶和指导RNA能够形成复合物,该复合物能够使Cas内切核酸酶在靶位点上、在微生物细胞的基因组基因座中或其附近起作用,以及(b)从微生物细胞群体中鉴定至少一种供体DNA与基因组基因座已经发生同源重组的微生物细胞;其中该Cas内切核酸酶、该指导RNA或两者被引入微生物细胞群体中。
在第二方面,本披露提供在微生物细胞中进行基因组编辑的方法,该方法包括:(a)向微生物细胞群体中引入Cas内切核酸酶、指导RNA、和包含与微生物细胞的基因组基因座具有同源性的结构域的供体DNA,其中该供体DNA中的至少一个同源臂的长度是短的,范围从40bp至500bp,如例如从45bp至450bp、从50bp至400bp、从55bp至350bp、从55bp至300bp等等,其中该Cas内切核酸酶和指导RNA能够形成复合物,该复合物能够使Cas内切核酸酶在靶位点上、在微生物细胞的基因组的基因组基因座中或其附近起作用;以及(b)从微生物细胞群体中鉴定至少一种在基因组基因座中的靶位点处已经发生DNA修饰的微生物细胞,其中该Cas内切核酸酶、该指导RNA或两者被引入微生物细胞群体中。
将Cas内切核酸酶/指导多核苷酸复合物与供体DNA一起引入细胞中对于在微生物细胞的基因组中的靶位点处的多核苷酸中产生双链断裂的精确修复通常是必需的。如本文所提供的Cas系统的成分可以根据用户的需要同时或顺序引入。
A.引入Cas内切核酸酶
出于本披露的目的,能够以任何方便的方式实现Cas内切核酸酶的引入,所述方式包括转染、转导、转化、电穿孔、粒子轰击、细胞融合技术等。
可替代地,人们可以使用具有使内切核酸酶产生切口的活性(即在靶位点处仅切割一条DNA链;本文中也被称为“Cas切口酶”)而不是双链断裂的活性的Cas内切核酸酶。在靶位点处诱导缺口不像双链断裂那样在靶位点处激活非同源末端连接(NHEJ)途径,但是其可能改善了目的基因组基因座(包含Cas切口酶的靶位点或在Cas切口酶的靶位点附近的基因组基因座)与供体DNA之间的同源重组。Cas切口酶的实例包括如下所述的Cas内切核酸酶变体。
在某些实施例中,该Cas内切核酸酶(包括,例如Cas切口酶)是Cas9内切核酸酶(参见,例如PCT公开号WO 2013/141680)。Cas9内切核酸酶的实例包括来自以下的那些:链球菌属物种(Streptococcus sp.)(例如,酿脓链球菌(S.pyogenes)、变异链球菌(S.mutans)和嗜热链球菌(S.thermophilus))、弯曲杆菌属物种(Campylobacter sp.)(例如,空肠弯曲杆菌(C.jejuni))、奈瑟氏菌属物种(Neisseria sp.)(例如,脑膜炎奈瑟氏菌(N.meningitides))、弗朗西斯氏菌属物种(Francisella sp.)(例如,新凶手弗朗西斯菌(F.novicida))、和巴斯德氏菌属物种(Pasteurella sp.)(例如,多杀巴斯德菌(P.multocida))(参见,例如,描述于Fonfara等人,2013中的Cas9内切核酸酶)。在一些实施例中,该Cas内切核酸酶由优化的Cas9内切核酸酶基因(例如密码子优化的用于在真菌细胞中表达)编码。
在某些情况下,Cas内切核酸酶基因有效地连接至编码核定位信号的一种或多种多核苷酸,这样使得在细胞中表达的Cas内切核酸酶/指导多核苷酸复合物被有效地转运到细胞核。可以使用任何方便的核定位信号,例如,存在于Cas编码区的上游(5’)并与其同框(即,有效地连接)的编码SV40核定位信号的多核苷酸,以及存在于Cas编码区的下游(3’)并与其同框(即,有效地连接)的编码来源于里氏木霉blr2(蓝光调节子2)基因的核定位信号的多核苷酸。可以使用其他核定位信号。
在一些实施例中,用户获得表达Cas的微生物细胞,因此用户不需要将能够表达Cas内切核酸酶的重组DNA构建体引入细胞中,而只需要将指导多核苷酸引入表达Cas的细胞中。例如,可以首先用Cas表达DNA构建体稳定转染真菌细胞,随后将指导多核苷酸引入稳定的Cas表达细胞(直接地或使用表达指导多核苷酸的DNA构建体)。该设置提供某些优势,因为用户可以产生稳定的表达Cas的真菌细胞群体,在真菌细胞中可以独立地引入不同的指导多核苷酸。在其他实施例中,可以将超过一种指导多核苷酸引入相同的表达Cas9的细胞。
作为又另一个实例,可以使用表达Cas内切核酸酶的宿主细胞来产生可以将Cas内切核酸酶反向提供到“靶菌株”的“辅助菌株”。简言之,例如通过来自每个菌株的原生质体的融合或取决于丝状真菌的种类通过菌丝的接合,可以在辅助菌株和靶菌株之间产生异核体。异核体的维持将取决于合适的营养性和/或其他标记基因或在每个亲本菌株中的突变,并且在合适的选择性培养基上生长,使得亲本菌株不能生长,然而异核体由于互补性能够生长。在异核体形成时或随后,通过转染引入指导RNA和供体DNA。指导RNA可以直接引入或经由具有Cas内切核酸酶表达盒和可选择标记基因的DNA构建体引入。该Cas内切核酸酶从辅助菌株细胞核中的基因表达,并且存在于异核体的细胞质中。Cas内切核酸酶与指导RNA缔合以产生活性复合物,该复合物靶向供体DNA被插入的、基因组中的一个或多个希望的靶位点。随后,从异核体中回收孢子并且对这些孢子进行选择或筛选以回收在靶位点处插入了供体DNA的靶菌株。在使用表达盒引入指导RNA的情况下,选择指导RNA表达构建体不能稳定维持于其中的异核体。
在一些实施例中,将Cas内切核酸酶直接地转染到微生物细胞中。在其他实施例中,将包含用于Cas内切核酸酶的表达盒的DNA载体转化到微生物细胞中。
i.DNA载体
可以构建包含编码Cas内切核酸酶的核酸的DNA构建体,使得其适合于在宿主细胞中表达。由于遗传密码中已知的简并性,编码相同氨基酸序列的不同多核苷酸可以用常规技术进行设计和制备。也已知的是,取决于期望的宿主细胞,在尝试表达之前可能需要密码子优化。
可以将编码本披露的Cas内切核酸酶的多核苷酸整合到载体中。可以使用已知的转化技术(例如以下披露的那些)将载体转移至宿主细胞中。
合适的载体可以是可以转化到宿主细胞中并在宿主细胞内复制的载体。例如,包含编码本披露的Cas内切核酸酶的核酸的载体可以在作为繁殖和扩增载体的手段的细菌宿主细胞中转化并复制。也可以将载体适当地转化到表达宿主中,使得编码多核苷酸表达为功能性Cas内切核酸酶。
代表性的有用载体是可以插入宿主的基因组中的pTrex3gM(参见美国专利申请公开号US 2013/0323798)和pTTT(参见美国专利申请公开号2011/0020899)。可以用常规技术修饰载体pTrex3gM和pTTT两者,使得它们包含并表达编码本发明的Cas内切核酸酶的多核苷酸。
对于此目的有用的载体典型地包括克隆载体的组分,例如像允许载体在选择的宿主生物体中自主复制的元件和用于选择目的的一个或多个表型可检测的标记。表达载体通常包含控制核苷酸序列,例如启动子、操纵子、核糖体结合位点、翻译起始信号以及任选地抑制子基因或一个或多个激活子基因。此外,表达载体可以包含编码氨基酸序列的序列,该氨基酸序列能够将Cas内切核酸酶靶向宿主细胞细胞器(例如细胞核)。对于在控制序列的指导下进行表达,将Cas内切核酸酶的核酸序列以关于表达的适当方式与控制序列有效地连接。
可以将编码本发明的Cas内切核酸酶的多核苷酸有效地连接至允许在宿主细胞中转录的启动子上。启动子可以是在选择的宿主细胞中显示转录活性的任何DNA序列,并且可以来源于编码与宿主细胞同源或异源的蛋白质的基因、以及可诱导地或组成性地表达的基因。(尤其是在细菌宿主细胞中)用于指导编码Cas内切核酸酶的DNA序列的转录的启动子的实例包括大肠杆菌(E.coli)的乳糖操纵子的启动子、天蓝色链霉菌(Streptomycescoelicolor)琼脂酶基因dagA或celA启动子、地衣芽孢杆菌(Bacillus licheniformis)淀粉酶基因(amyL)的启动子、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)麦芽糖淀粉酶基因(amyM)的启动子、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)淀粉酶(amyQ)的启动子、枯草芽孢杆菌xylA和xylB基因的启动子等等。
对于在真菌宿主中转录,有用的启动子的实例包括来源于编码以下的基因的那些:米曲霉TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸性稳定α-淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉脂肪酶、米曲霉碱性蛋白质、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶等等。当编码Cas内切核酸酶的基因在细菌物种(例如大肠杆菌)中表达时,可以从例如包括T7启动子和λ噬菌体启动子的噬菌体启动子中选择合适的启动子。沿着这些思路,用于在酵母物种中表达的合适启动子的实例包括但不限于酿酒酵母的Gal 1和Gal 10启动子和巴斯德毕赤酵母(Pichia pastoris)AOX1或AOX2启动子。在丝状真菌宿主细胞中的表达通常涉及cbh1,其是来自里氏木霉的内源诱导型启动子或组成型糖酵解启动子(例如pki)。例如,参见Liu等人,2008。
出于本发明的目的,通常不分泌Cas9。当然,Cas9被靶向并保留在细胞核中,使得DNA编辑发生在细胞核内。在一些实施例中,可以将核定位信号(NLS)添加或融合至Cas9序列。然而,在其他实施例中,例如,在细菌中,这样的NLS序列的融合或添加是可选的。
表达载体还可以包含合适的转录终止子,以及在真核生物中,包含有效地连接至编码Cas内切核酸酶的DNA序列的聚腺苷酸化序列。终止序列和聚腺苷酸化序列可以适当地来源于与启动子相同的来源。
该载体可以进一步包含使得该载体能够在宿主细胞中复制的DNA序列。此类序列的实例是质粒pUC19、pACYC177、pUB110、pE194、pAMB1和pIJ702的复制起点。
载体还可以包含可选择标记,例如其产物弥补分离的宿主细胞中的缺陷的基因,例如来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或者赋予抗生素抗性(例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性)的基因。此外,载体可以包含曲霉属选择标记,例如amdS、argB、niaD和xxsC,引起潮霉素抗性的标记,或者选择可以通过共转化(如本领域已知的)实现。参见,例如公开的PCT申请号WO 91/17243。
用于分别连接编码Cas内切核酸酶的DNA构建体、启动子、终止子和其他元件并将它们插入到含有复制所需的信息的合适载体中的程序是本领域技术人员已知的且容易获得的。参见,例如Sambrook等人,第2版,冷泉港实验室,1989,和第3版,2001。
ii.转化的方法
将DNA构建体或载体引入宿主细胞中包括技术例如转化;电穿孔;核显微注射;转导;转染,例如脂质转染介导的和DEAE-糊精介导的转染;与磷酸钙DNA沉淀一起孵育;用DNA包被的微粒高速轰击;和原生质体融合。通用转化技术是本领域已知的。参见,例如Sambrook等人(2001),同上。异源蛋白质在木霉属中的表达描述于例如美国专利号6,022,725。对于曲霉属菌株的转化,还参考了Cao等人(2000)。用载体系统构建遗传稳定的转化体,由此将编码Cas内切核酸酶的核酸稳定整合到宿主细胞染色体中。然后通过已知技术选择并纯化转化体。
用于转化的木霉属物种的制备例如可以涉及从真菌菌丝体制备原生质体(例如,参见Campbell等人,1989)。菌丝体可以从发芽的营养孢子获得。使用消化细胞壁的酶处理菌丝体,产生原生质体。通过悬浮培养基中渗透稳定剂的存在来保护原生质体。这些稳定剂包括山梨糖醇、甘露糖醇、氯化钾、硫酸镁等。通常这些稳定剂的浓度在0.8M与1.2M之间变化,例如山梨糖醇的1.2M溶液可以用于悬浮培养基中。
取决于钙离子浓度,将DNA摄取到宿主木霉属物种菌株中。通常,在摄取溶液中使用在约10mM至50mM之间的CaCl2。另外的合适的化合物包括缓冲系统,例如TE缓冲液(10mMTris,pH 7.4;1mM EDTA)或10mM MOPS(pH 6.0)和聚乙二醇。据信聚乙二醇使细胞膜融合,从而允许培养基的内容物被递送至木霉属物种菌株的细胞质中。此融合时常留下整合到宿主染色体中的多个拷贝的质粒DNA。
通常,使用已经进行了渗透性处理的原生质体或细胞转化木霉属的物种,通常以105至107/mL、特别是2x 106/mL的密度进行。可以将100μL体积的在合适的溶液(例如1.2M山梨糖醇和50mM CaCl2)中的这些原生质体或细胞与所希望的的DNA混合。通常,向摄取溶液中添加高浓度的PEG。可以将从0.1至1体积的25%PEG 4000添加到原生质体悬浮液中;然而,向原生质体悬浮液中添加约0.25体积是有用的。也可以将添加剂例如二甲亚砜、肝素、亚精胺、氯化钾等添加到摄取溶液中以促进转化。类似的程序可用于其他真菌宿主细胞。参见,例如美国专利号6,022,725。
B.引入指导RNA
在一些实施例中,能以任何方便的方式进行指导多核苷酸的引入,所述方式包括转染、转导、转化、电穿孔、粒子轰击、细胞融合技术等。
在某些实施例中,通过引入包含编码指导多核苷酸的表达盒(或基因)的重组DNA构建体,将指导多核苷酸引入真菌细胞中。在一些实施例中,将表达盒有效地连接至真核RNA pol III启动子。这些启动子是特别感兴趣的,因为通过RNA pol III的转录不会导致在RNA聚合酶II从RNA pol II依赖性启动子转录时发生的5’帽结构的添加或聚腺苷酸化。在某些实施例中,该RNA pol III启动子是丝状真菌细胞U6聚合酶III启动子。
作为另一个实例,可以诱导表达Cas内切核酸酶的宿主细胞以摄取体外合成的指导RNA,从而使得Cas内切核酸酶能够具有活性并靶向基因组中限定的位点。在一些情况下,希望诱导携带可选择标记基因的指导RNA和单独DNA构建体两者的摄取,以允许选择已经摄取DNA并且在高频率下,预期同时已经摄取指导RNA的那些细胞。如上所述,获得对关于可选择标记显示不稳定表型的那些转化体筛选没有载体DNA插入的目的遗传修饰(例如与供体DNA的同源重组)。
例如,可以用包含含有第二可选择标记(和任选的单独的供体DNA)的指导RNA表达盒的DNA构建体来转化表达Cas内切核酸酶的宿主细胞。使用第二可选择标记选择的宿主细胞将表达来自该DNA构建体的指导RNA,这使得Cas内切核酸酶能够具有活性并靶向基因组中限定的目的靶位点。
在本披露的某些实施例中,指导多核苷酸是指导RNA,该指导RNA包括可以与II型Cas内切核酸酶形成复合物的、II型CRISPR/Cas系统的crRNA区域(或crRNA片段)和tracrRNA区域(或tracrRNA片段)。如上所述,指导RNA/Cas内切核酸酶复合物可以将Cas内切核酸酶指导至微生物细胞基因组靶位点,使得Cas内切核酸酶能够将双链断裂引入基因组靶位点。在一些情况下,指导RNA/Cas9内切核酸酶复合物的RNA是包含crRNA和单独的tracrRNA的双链体。在其他情况下,指导RNA是包括crRNA区域和tracrRNA区域二者的单个RNA分子(例如融合)(有时本文被称为融合的指导RNA)。使用融合的指导RNA相对于双链体crRNA-tracrRNA的一个优点是仅需要制备一个表达盒来表达融合的指导RNA。
C.引入供体DNA
当在宿主细胞的基因组DNA中诱导双链断裂(例如,通过在靶位点处的Cas内切核酸酶/指导RNA复合物的活性,该复合物具有双链内切核酸酶活性)时,细胞的DNA修复机制被激活以修复断裂,该断裂由于其易出错的性质,可以在双链断裂位点处产生突变。将断裂的末端结合在一起的最常见的修复机制是非同源末端连接(NHEJ)途径。染色体的结构完整性通常通过修复来保存,然而缺失、插入或其他重排是可能的(Siebert和Puchta,2002;Pacher等人,2007)。
对于靶特异性基因编辑,例如基因插入、基因置换和其他序列整合,供体DNA包括与真菌细胞基因组中相应的第一区域和第二区域同源的第一区域和第二区域(即,同源臂),其中所述同源的区域通常包括或围绕基因组DNA被Cas内切核酸酶切割的靶位点。这些同源区域促进与其相应的同源基因组区域的同源重组,导致在供体DNA和基因组之间的DNA交换。因此,所提供的方法导致供体DNA的目的多核苷酸在真菌细胞基因组中的靶位点中的切割位点处或附近的整合,从而改变原始靶位点,从而产生改变的基因组靶位点。
在给定的基因组区域和在供体DNA上发现的相应的同源的区域之间的结构相似性可以是允许同源重组发生的任何程度的序列同一性。例如,由供体DNA的“同源区域”和真菌细胞基因组的“基因组区域”享有的同源性或序列同一性的量可以是至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性,使得序列进行同源重组。
供体DNA上的同源的区域可以与靶位点侧翼的任何序列具有同源性。虽然在一些实施例中,同源的区域与紧邻靶位点侧翼的基因组序列共享显著的序列同源性,但是应当认识到同源的区域可以被设计为与可能更靠近靶位点的5”或3’的区域具有足够的同源性。在又其他实施例中,同源的区域还可以与靶位点的片段以及下游基因组区域具有同源性。在一个实施例中,第一同源的区域进一步包含靶位点中的第一片段,并且第二同源的区域包含靶位点中的第二片段,其中第一片段和第二片段不同。
同源臂的长度也对转染和重组的功效和效率有贡献。本领域通常已知,这样的长度的范围是从0.5kb至1kb以便实现靶向的编辑。
在本披露中令人惊讶地发现,在某些丝状真菌中,在长度上短至100bp或更短(例如,短至80bp或更少、短至60bp或更少、或甚至短至40bp或更少)的同源臂可以用于实现由指导RNA/Cas内切核酸酶复合物刺激的高效的同源重组。此外,虽然传统双链供体DNA(dsDNA)将起到介导靶向基因编辑的作用,但是如本文所例示的,本披露的单链供体DNA(ssDNA)在介导由指导RNA/Cas内切核酸酶复合物刺激的同源重组中等同表现,尤其是当使用较短的同源臂(即同源臂短至100bp或更少)时。因此,充分地简化多步骤分子操作和由Cas系统介导的靶向基因编辑。
D.微生物分子
在本文披露的方法和组合物中使用的微生物分子可以是来自以下的任何真菌宿主细胞:门子囊菌门、担子菌门、壶菌门、和接合菌门(如由Hawksworth等人,1995所定义的)、以及卵菌门(Hawksworth等人,1995)以及所有有丝分裂孢子真菌(Hawksworth等人,1995)。在某些实施例中,微生物宿主细胞是酵母细胞,例如假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或耶氏酵母属(Yarrowia)细胞。酵母的物种包括但不限于:卡尔斯伯酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉斯酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)、乳酸克鲁维酵母(Kluyromomyces lactis)和解脂耶氏酵母(Yarrowia lipolytica)。
在一些实施例中,微生物细胞是丝状真菌细胞,包括但不限于:枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球菌属(Cryptococcus)、线黑粉菌属(Filibasidium)、镰孢霉属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃壶菌属(Piromyces)、裂褶菌属(Schizophyllum)、篮状菌属(Talaromyces)、嗜热子嚢菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)或Rasamsonia的物种。在另一个优选的实例中,丝状真菌细胞选自棘孢曲霉(Aspergillus acufeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillus oryzae)、杆孢状镰孢(Fusarium bactridioides)、谷类镰孢菌(Fusarium cerealis)、克地镰孢菌(Fusarium crookwellense)、黄色镰孢菌(Fusariumculmorum)、禾谷镰孢菌(Fusarium graminearum)、禾赤镰孢菌(Fusarium graminum)、异孢镰孢菌(Fusarium heterosporum)、合欢木镰孢菌(Fusarium negundi)、尖孢镰孢菌(Fusarium oxysporum)、多枝镰孢菌(Fusarium reticulatum)、粉红镰孢菌(Fusariumroseum)、接骨木镰孢菌(Fusarium sambucinum)、肤色镰孢菌(Fusarium sarcochroum)、拟枝孢镰孢菌(Fusarium sporotrichioides)、硫色镰孢菌(Fusarium sulphureum)、圆镰孢菌(Fusarium torulosum)、拟丝孢镰孢菌(Fusarium trichothecioides)、镶片镰孢菌(Fusarium venenatum)、特异腐质霉(Humicola insolens)、柔毛腐质霉(Humicolalanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(TrichodermaIongibrachiatum)、里氏木霉(Trichoderma reesei)、绿色木霉(Trichoderma viride)、Rasamsonia argillacea、Rasamsonia brevistipitata、Rasamsonia byssochlamydoides、Rasamsonia cylindrospora、Rasamsonia composticola、Rasamsonia eburnean或埃默森蓝状菌(Rasamsonia emersonii)。
在某些实施例中,微生物宿主细胞是细菌细胞,例如嗜碱芽孢杆菌(Bacillusalkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短小芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、凝结芽孢杆菌(Bacilluscoagulans)、灿烂芽胞杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽胞杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、或苏云金芽孢杆菌(Bacillus thuringiensis)或链霉菌属(Streptomyces)(如例如变铅青链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus))或革兰氏阴性细菌(如例如大肠杆菌或假单胞菌属物种(Pseudomonas sp.))。
对于上述物种,可以理解的是,本披露和源物种将涵盖此类生物体的完全状态和不完全状态两者,及其的其他分类学等同物(例如无性型),而不管它们已知的物种名称。本领域技术人员将容易地识别此类源物种的适当等同物的身份。
上述物种的菌株容易地在许多培养物保藏中心为公众所获得,所述培养物保藏中心例如是美国典型培养物保藏中心(ATCC)、德国微生物菌种保藏中心(Deutsche Sammlungvon Mikroorganismen und Zellkulturen GmbH,DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures,CBS)和美国农业研究服务专利培养物保藏中心北部地区研究中心(NRRL)。
E.基因组编辑的潜在靶标
在一些实施例中,使用所披露的方法靶向特定基因用于修饰,包括编码酶(例如,乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合)的基因。
存在许多用于实现本文描述的方法的变型。例如,Cas表达盒可以被整合到真菌宿主细胞的基因组中,而不是使该Cas表达盒作为外源序列存在。产生这种亲本细胞系将允许用户简单地引入所希望的指导RNA(例如,作为指导RNA表达载体),该指导RNA然后靶向目的基因组位点,如本文其他地方所详述的。在这些实施例中的一些实施例中,整合的Cas基因可以被设计为包括其侧翼的多核苷酸重复序列,用于随后从基因组中的环出/去除(如果需要的话)。
F.通过Cas内切核酸酶/指导多核苷酸复合物实现基因编码
实际上,可以使用所披露的方法和组合物靶向在微生物细胞基因组中的任何位点,只要靶位点包括所需的前间区序列邻近基序(以下为“PAM”)。在酿脓链球菌Cas9的情况下,PAM具有序列NGG(5’至3’;其中N为A、G、C或T),因此不对基因组中靶位点的选择产生重大限制。其他已知的Cas9内切核酸酶具有不同的PAM位点(参见,例如描述于Fonfara等人,2013中的Cas9内切核酸酶PAM位点)。
至少一个靶位点的长度可以变化,并且包括例如为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸长度的靶位点。还有可能靶位点可以是回文的(即,在一条链上的序列与在互补链上以相反方向的读取相同)。切割位点可以在靶序列内,或者切割位点可以在靶序列之外。在另一种变异中,切割可以发生在彼此正好相对的核苷酸位置处,以产生平端切割,或者在其他情况下,切口可以交错以产生单链突出端,也称为“粘性末端”,其可以是5’突出端抑或或3’突出端。
在一些情况下,还可以使用真菌细胞基因组中的活性变体靶序列,这意味着靶位点与指导多核苷酸(在指导多核苷酸的crRNA序列内)的相关序列不是100%相同的。此类活性变体可以与给定靶位点包含至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,其中活性变体靶序列保留生物活性,并且因此能够被Cas内切核酸酶识别并切割。通过内切核酸酶测量靶位点的双链断裂的测定是本领域已知的,并且通常测量试剂在包含识别位点的DNA底物上的总体活性和特异性。
目的靶位点包括位于目的基因区域内的那些靶位点。目的基因内的区域的非限制性实例包括可读框、启动子、转录调节元件、翻译调节元件、转录终止序列、mRNA剪接位点、蛋白质编码序列、内含子位点、内含子增强基序等。
G.用所希望的基因组编辑鉴定微生物细胞
在某些实施例中,微生物细胞的基因组的修饰导致可以被检测到的表型效应,并且在许多情况下是用户的期望结果。非限制性实例包括获得可选择的细胞生长表型(例如对抗生素的抗性或敏感性、营养缺陷特征的获得或丧失、生长速率的增加或降低等)、表达可检测标记(例如,荧光标记、细胞表面分子、显色酶等)、以及分泌酶(该酶的活性可以在培养上清液中进行检测)。
当微生物细胞的基因组的修饰导致表型效应时,通常使用包括目的多核苷酸的供体DNA,该目的多核苷酸是(或编码)表型标记。可以使用任何方便的表型标记,包括任何可选择或可筛选的标记,其允许人们通常在特定培养条件下鉴定或选择含有该标记的真菌细胞或对其进行鉴定或选择。因此,在本发明的一些方面,对具有所希望的基因组修饰的微生物细胞的鉴定包括在对靶位点处具有修饰的细胞进行选择的条件下培养已经接受了Cas内切核酸酶和指导多核苷酸(和任选地供体DNA)的微生物细胞群体。可以使用任何类型的选择系统,包括评估真菌细胞中酶活性的增加或丧失(也称为可选择标记),例如抗生素抗性的获得或营养缺陷型标记的获得/丧失。
在一些情况下,使用任何方便的方法直接检测微生物细胞中的基因组修饰,所述方法包括测序、PCR、DNA印迹、限制性内切酶分析等,包括此类方法的组合。
通过以下实例进一步描述本披露,所述实例不应被解释为限制本披露的范围。
实例
根据以下实例可以进一步理解本发明的方法和组合物的方面,所述实例不应被解释为限制性的。材料和方法的修改对本领域技术人员而言是显而易见的。
实例1
制备供体模板
实例1.1制备单链寡核苷酸
由整合DNA技术公司(Integrated DNA Technologies(IDT))生产二十(20)nmole的不同长度的单链DNA片段(ssDNA):70-核苷酸、100-核苷酸和200-核苷酸,包括上链和下链两者(SEQ ID NO:1-6),所述单链DNA片段是作为冷冻干燥的脱盐DNA。这些70-nt、100-nt和200-nt单链DNA片段分别含有约23-24-核苷酸、40-41-核苷酸、和90-91-核苷酸的侧翼序列。尽管本实例中下面列出的序列标记有“上链”或“下链”的标示,据信这样的标示并不是严格必要的,因为在该实例中进行了双链断裂,并且任一条链可以起到修复模板的作用。然而,据信当使用如本文所述的Cas切口酶时,修复的效率取决于用作修复模板的链。
SEQ ID NO:1-70个碱基的单个上链寡核苷酸
GTCGTGCTCAAGACGCACTACGACGTTTAAACCTTAATTAAGCATGGTCTCGGGCTGGGACTTCCACCCG
SEQ ID NO:2-70个碱基的单个下链寡核苷酸
CGGGTGGAAGTCCCAGCCCGAGACCATGCTTAATTAAGGTTTAAACGTCGTAGTGCGTCTTGAGCACGAC
SEQ ID NO:3-100个碱基的单个上链寡核苷酸
AAGATTGGCCCGTCGATTGTCGTGCTCAAGACGCACTACGACGTTTAAACCTTAATTAAGCATGGTCTCGGGCTGGGACTTCCACCCGGAGACGGGCACG
SEQ ID NO:4-100个碱基的单个下链寡核苷酸
CGTGCCCGTCTCCGGGTGGAAGTCCCAGCCCGAGACCATGCTTAATTAAGGTTTAAACGTCGTAGTGCGTCTTGAGCACGACAATCGACGGGCCAATCTT
SEQ ID NO:5-200个碱基的单个上链寡核苷酸
GCCTGAGCGCCGACGTGCCGACAGCGCGCGAGCTGCTGTACCTGGCCGACAAGATTGGCCCGTCGATTGTCGTGCTCAAGACGCACTACGACGTTTAAACCTTAATTAAGCATGGTCTCGGGCTGGGACTTCCACCCGGAGACGGGCACGGGAGCCCAGCTGGCGTCGCTGGCGCGCAAGCACGGCTTCCTCATCTTCGA
SEQ ID NO:6-200个碱基的单个下链寡核苷酸
TCGAAGATGAGGAAGCCGTGCTTGCGCGCCAGCGACGCCAGCTGGGCTCCCGTGCCCGTCTCCGGGTGGAAGTCCCAGCCCGAGACCATGCTTAATTAAGGTTTAAACGTCGTAGTGCGTCTTGAGCACGACAATCGACGGGCCAATCTTGTCGGCCAGGTACAGCAGCTCGCGCGCTGTCGGCACGTCGGCGCTCAGGC
实例1.2制备双链寡核苷酸
由整合DNA技术公司(Integrated DNA Technologies(IDT))生产作为200ng DNA片段的不同长度的双链供体DNA模板:330bp、730bp、和1100bp。
每个双链供体模板含有19-核苷酸插入序列,将其用于替代整个靶位点TS2序列(SEQ ID NO:10)。
330bp的双链供体模板(SEQ ID NO:7)具有152bp的上游侧翼序列和159bp的下游侧翼序列。
730bp的双链供体模板(SEQ ID NO:8)具有352bp的上游侧翼序列和359bp的下游侧翼序列。
1100bp的双链供体模板(SEQ ID NO:9)具有562bp的上游侧翼序列和529bp的下游侧翼序列。
在上游与下游侧翼序列之间的插入序列含有在3个阅读框中的3个终止密码子以及限制性切割位点Pme1和Pac1。
实例2
靶位点选择和sgRNA合成
实例2.1靶位点选择
如以上实例1所述,选择pyr 4标记基因以使用CRISPR-Cas9系统在包括单链寡核苷酸和双链DNA的外源供体模板的存在下测试同源修复。用SEQ ID NO:10的23-bp序列(其包含PAM(TGG)位点)选择具有基序G-N20-GG的靶位点。
由IDT生产作为DNA片段的用于sgRNA合成的模板,所述模板具有列于SEQ ID NO:11中的序列,该模板含有T7启动子序列,接着是没有PAM位点的20个碱基的靶位点(以斜体和下划线文本表示)、指导RNA支架,接着是终止子位点(TTTTT)。
实例2.2生产sgRNA
使用MEGA shortscriptTM试剂盒(阿姆比恩公司(Ambion),产品号AM 1354)在体外生产指导RNA。体外转录在37℃下进行至少5小时。将所得RNA使用Qiagen RNeasy Plusmini kit(凯杰公司(Qiagen))纯化。使用纳米滴定(Nano drop)来确定生产的RNA的量。
实例3
指导RNA和单链模板的转化
通过针对增加的纤维素酶生产力并且具有使pyr2基因失活从而使菌株成为尿苷营养缺陷体的单个点突变进行筛选,从RL-P37获得里氏木霉菌株。如在PCT国际申请号PCT/CN 2014/093918中描述的,用含有在丙酮酸激酶(pki)启动子的控制下的酿脓链球菌Cas9的表达盒和在其天然启动子的控制下的来自里氏木霉的pyr2基因的表达盒的DNA构建体转化该菌株。通过选择具有功能pyr2基因的细胞(在Vogels培养基上不补充尿苷下的生长),鉴定了将Cas9-pyr2盒整合到基因组中并组成型表达Cas9基因的转化体。
从里氏木霉菌株制备原生质体。使该菌株在PDA板上在30℃生长持续5天。将孢子收集并接种在250mL、4-挡板摇瓶中的50mL YEG(5g/L酵母提取物加20g/L葡萄糖)肉汤中,并在37℃在200rpm孵育16-20小时。
通过将液体体积转移至50ml锥形管中并以2,500rpm旋转10分钟来回收菌丝体。倾析上清液。然后将该菌丝体沉淀物转移至250mL、0.22微米CA康宁过滤瓶中的含有2g裂解酶(西格玛公司)的40mL溶液中。其后,将该混合物在30℃在200rpm孵育2小时以产生用于转化的原生质体。
通过无菌神奇滤布(miracloth)过滤收获原生质体至50mL锥形管中。然后通过在2,000rpm旋转5分钟使其沉淀,并抽吸。将该原生质体沉淀物用50mL的1.2M山梨糖醇洗涤一次,旋转沉降,抽吸,并用25mL的山梨糖醇/CaCl2再次洗涤。
计数原生质体,然后在2,000rpm沉淀5分钟,倾析上清液,并将原生质体沉淀物再悬浮于足以产生1.25×108原生质体/毫升的原生质体浓度的量的山梨糖醇/CaCl2中,产生原生质体溶液。
将高达15μg的体外合成的指导RNA(1.2μg/μL)和2μL的0.1mM单链DNA模板的等分试样放入15mL锥形管中并将管置于冰上。然后将200μL原生质体悬浮液与50μL PEG溶液一起添加至每个转化等分试样中。将管轻轻混合并在冰上孵育20分钟。将在4mL体积中的PEG溶液添加至转化等分试样管中,并将它们在室温孵育5分钟。将3.5mL体积中的山梨糖醇/CaCl2溶液添加至管中(产生8ml的总体积)。将转化混合物分成2个等分试样,每个含有约4mL。将含有1.0mg/mL尿苷的Vogels山梨糖醇熔化的顶层琼脂(通过维持在50℃来保持熔化)与转化反应混合,然后将其铺板,并在30℃孵育4-5天。
使用由Vogels与1.8mg/mL FOA(Zymo研究公司)和0.5mg/mL尿苷组成的覆盖琼脂进行选择。使用与2μL的0.1mM单链DNA模板而不是指导RNA孵育的原生质体进行对照。
实例4
FOA抗性转化体的表征
使用热苯酚提取方案从在FOA-尿苷板上生长的里氏木霉菌落中分离基因组DNA。将少量菌丝体(约0.25cm2带琼脂的菌丝体)转移至600μL埃彭道夫管中,研磨并再悬浮于120μL裂解缓冲液中。通过混合200μL的1M Tris(pH 8)、200μL的3M乙酸钠(pH 5.8)和200μL的苯酚:氯仿:异戊醇混合物(25:24:1,v/v)制备裂解缓冲液,并用10mM Tris-HCl(pH 8)、和0.1mM EDTA制备1,800μL的TE缓冲液。随后将氯仿(120μL)添加至裂解的菌丝体,通过涡旋混合并在恒温混合器中在72℃孵育6分钟。然后将裂解物短暂地混合并在最大速度离心3分钟。将水性相转移至含有100μL异丙醇的管中,混合并离心10分钟。将沉淀物用1mL 70%乙醇洗涤并离心。将沉淀物再悬浮于60μL TE缓冲液中,在72℃孵育并用作PCR的模板。
在25μL反应体积中,使用1μL的基因组DNA、0.1μL每个50μM引物(正向引物和反向引物)、0.25μL的PCR核苷酸混合物和0.25μL PfuUltra II DNA聚合酶(安捷伦技术公司(Agilent Technologies))进行PCR反应。
使用以下引物跨越pyr4靶位点TS2进行PCR。引物对具有:
SEQ ID NO:12-1F:5’-CCATCTTGGCTGACGAAAAAGGTCTG-3’;以及
SEQ ID NO:13-1R:5’-CATGCAAAGATACACATCAATCGCAGCTG-3’。
当使用单链DNA作为供体模板时使用这些引物。
引物对:
SEQ ID NO:14-MH179 5’-CATCGACTACTGCTGCTCTGCTC-3’;以及
SEQ ID NO:15-MH1805’ATCGCAGCTGGGGTACAATCATC-3’
被用于进行PCR,该PCR是使用双链DNA作为供体模板对来自转化的菌落进行的PCR。使用0.8%琼脂糖凝胶通过电泳分析PCR产物。使用Qiaquick PCR纯化试剂盒(凯杰公司(Qiagen);目录号28104)对PCR产物进行纯化。
由Sequetech公司(山景城,加利福尼亚州)使用测序引物pMH094(SEQ ID NO:16)进行DNA测序
使用5μL的PCR产物和来自新英格兰生物实验室(New England Biolabs)的限制性内切酶(Pac1,目录号R5547S,Pme1,目录号R0560S),在37℃以20μL体积进行限制性消化持续15分钟。在1%琼脂糖凝胶上通过电泳分析反应产物。
实例5
使用100个核苷酸的单链寡核苷酸作为供体DNA模板的CAS9-介导的同源定向修复
供体DNA模板(100-核苷酸)包括两个单链DNA:(1)SEQ ID NO:4,其是下链(并且是与SEQ ID NO:10的靶位点TS2互补的链);和(2)SEQ ID NO:3,其是上链并且是与TS2相同的链。
SEQ ID NO:3和4各自包含由40-核苷酸(5’)同源臂和41-核苷酸(3’)同源臂侧翼的19-核苷酸终止密码子序列(如图1所示)。
还设计了具有位于19-核苷酸插入序列侧翼的23-24个核苷酸同源臂的70个碱基的单链DNA(SEQ ID NO:1和2),和具有位于19-核苷酸插入序列侧翼的90-91个核苷酸同源臂的200个碱基的单链DNA(SEQ ID NO:5和6)。
在分离的10株FOA抗性菌株的5株中,获得了含有限制性位点Pme1和Pac1的1,200-bp PCR产物并对其进行测序。使用100个碱基的单链寡核苷酸,在50%的FOA抗性菌落中观察到高效的断裂和修复,所述单链寡核苷酸具有位于pyr4基因座的终止密码子插入侧翼的40-核苷酸5’同源臂和41-核苷酸3’同源臂(如图2所示)。
图4A中描绘了DNA序列比对,使用单链DNA作为供体模板以通过同源重组(HR)进行修复。将从FOA抗性菌株扩增的PCR产物进行纯化并使用SEQ ID NO:16进行测序。单个修复事件的序列分析揭示了pyr4基因在10个克隆中的5个中含有单链DNA修复模板。
剩余的5个克隆含有插入缺失,表明DSB的位点特异性诱导和经由非同源末端连接(NHEJ)途径的修复。测序结果与图2中的限制性消化结果一致。
通过Pac1和Pme1消化的PCR产物表明经由同源定向修复(HDR)途径的同源重组已经发生并导致存在具有2个限制性位点的19-核苷酸的插入序列。
实例6
使用200个碱基的单链寡核苷酸作为供体DNA模板的CAS9-介导的同源定向修复
分离来自10个FOA抗性菌落的菌丝体并进行基因组DNA提取。结果显示于图3中。
在转化实验中使用200个碱基单链DNA的序列(SEQ ID NO:6)。使用琼脂糖凝胶电泳(0.8%琼脂糖凝胶)来分析使用1F和1R引物(SEQ ID NO:12和13)获得的PCR产物(1.2kb带)。使用Pac1的限制性消化揭示10个PCR产物中的4个中存在Pac1位点。在40%的菌株中观察到同源定向修复的频率(如图3所示)。
纯化所有10个PCR产物并使用测序引物SEQ ID NO:16进行DNA测序。图4B呈现了单个修复事件的此类测序和分析的结果,其揭示了pyr4基因在10个克隆中的4个中含有单链DNA修复模板。
剩余的6个克隆含有插入缺失,表明Cas9诱导的DSB,和使用非同源末端连接(NHEJ)途径的修复。
测序结果与如图3中显示的限制性消化结果一致。这些结果证实,除了NHEJ修复途径之外,在200个核苷酸单链DNA供体模板的存在下的同源定向修复(HDR)的刺激由Cas9介导的双链断裂诱导。总之,90-91个碱基的同源侧翼序列能够刺激真菌中通过HDR的修复。
实例7
使用双链DNA作为供体DNA模板的CAS9介导的同源定向修复
双链DNA模板传统上用于基因置换实验,其中侧翼同源序列的最小长度为500bp。此实例的目的是测试具有从150bp至高达500bp(SEQ ID NO:7、8和9)的较短侧翼同源序列的双链DNA模板是否也可以诱导同源重组。
图5描绘了使用的双链DNA模板,每个包含插入密码子和几乎对称的侧翼同源臂。
PCR产物的琼脂糖凝胶电泳表明存在在图6的凝胶B(泳道2和4)中隐约可见的异乎寻常地更高的分子量带。这可能反映了可能由供体模板或非特异性重组产物的多联体化引起的异常修复事件。
在凝胶C中,PCR产物的限制性内切酶消化表明在pyr4基因内存在Pac1位点。这在10个产物中的4个中观察到,表明40%的实验/菌落具有Cas9介导的同源定向修复并且60%的实验/菌落具有NHEJ相关的修复。
使用具有约500bp的对称同源臂的1,100-bp双链供体模板进行基因置换实验。该供体DNA也含有具有限制性位点的终止插入,其用于诊断和确认FOA抗性菌落。
对从单个FOA抗性菌落的基因组DNA扩增的每个PCR产物进行琼脂糖凝胶分析。
如图6所示,琼脂糖凝胶B(泳道4和8)显示与来自对照样品(C)的那些产物相比具有低分子量的PCR产物,表明pyr4基因中有大的缺失。用Pac1的限制性消化证明,除了样品#5(如琼脂糖凝胶C泳道5所示),大部分PCR产物不被Pac1消化或不可被Pac1消化。这表明HDR以低频率发生,而主要发生NHEJ修复途径。
实例8
在曲霉属中使用CRISPR-CAS9和供体DNA模板(ssODN)的同源定向修复
使用Cas9,使用塔宾曲霉(Aspergillus tubigensis)过量生产菌株3M-43/pyrA(参见Nikolaev等人,2013)进行基因组编辑,目标是断裂L-阿拉伯糖醇脱氢酶(LDA)途径。如在Nikolaev等人(2013)中所述,当在合适的条件下培养时,预期L-阿拉伯糖醇脱氢酶基因途径的断裂导致通过该菌株生产的木聚糖酶增加。
Nikolaev等人(2013)进一步报道,来自LDA断裂的塔宾曲霉菌株3M-43的增加的木聚糖酶生产由转录因子xlnR介导;并且使用常规的基因置换策略,在80次尝试中的单个所得菌株含有断裂的xlnR基因,表明常规的基因置换策略(尽管可行)效率低下,并且主要缺乏稳健性。
在本实例中,可以从整合DNA技术公司(Integrated DNA Technologies(IDT))购买上链和下链中的100-200个碱基的超聚体。具有SEQ ID NO:17-20的四(4)种不同的单链寡核苷酸也可以通过IDT制备,用作Cas9诱导的双链断裂的同源定向修复的供体模板。
更具体地,SEQ ID NO:17是100个碱基超聚体上链,其具有19个碱基终止密码子插入(以大写字母表示)、具有在5’末端的44个碱基的同源臂和在3’末端的37个碱基的同源臂:
5’-
atcagccgtgcgtgtgaccagtgtaaccaactccgaacgaaatgCGTTTAAACCTTAATTAAGcgacg ggcagcat
ccgtgcgctcattgcattggtagg-3’
SEQ ID NO:18是100个碱基超聚体下链,其具有19个碱基终止密码子插入(以大写字母表示)、具有在5’末端的37个碱基的同源臂和在3’末端的44个碱基的同源臂:
5’-
cctaccaatgcaatgagcgcacggatgctgcccgtcgCTTAATTAAGGTTTAAACGcatttcgttcggagttggttaca
ctggtcacacgcacggctgat-3’
SEQ ID NO:19是200个碱基超聚体上链,其具有19个碱基终止密码子插入(以大写字母表示)、具有在5’末端的94个碱基的同源臂和在3’末端的87个碱基的同源臂:
5’-ctcgctctgccgtccgcaaaacctcgtcttcagctccggttcgccgccgaatcagccgtgcgtgtgaccagtgtaaccaactccgaacgaaatgCGTTTAAACCTTAATTAAGcgacgggcagcatccgtgcgctcattgcattggtaggcttccgctctttctccgatgccggcgatgaggcggacgcttgactgacct-3’
SEQ ID NO:20是200个碱基超聚体下链,其具有19个碱基终止密码子插入(以大写字母表示)、具有在5’末端的87个碱基的同源臂和在3’末端的94个碱基的同源臂:
5’-AggtcagtcaagcgtccgcctcatcgccggcatcggagaaagagcggaagcctaccaatgcaatgagcgcacggatgctgcccgtcgCTTAATTAAGGTTTAAACGcatttcgttcggagttggttacactggtcacacg
cacggctgattcggcggcgaaccggagctgaagacgaggttttgcggacggcagagcgag-3’
如上所述,100个碱基长的寡核苷酸可以含有分别由44个和37个碱基的5’和3’同源臂(SEQ ID NO:17和18)侧翼的19个碱基长的终止密码子。
200个碱基长的寡核苷酸还可以含有由分别在5’和3’具有94个和87个碱基的同源臂(SEQ ID NO:19和20)侧翼的19个碱基的终止密码子插入。
可以使用密码子优化的Cas9基因(即,如本文所提供的,针对里氏木霉表达进行密码子优化)构建Cas9表达载体pGdpA:Cas9。构巢曲霉甘油醛-3-磷酸脱氢酶基因(gpdA)启动子(gpdA mRNA的5’非翻译区)和构巢曲霉trp C终止子可以用于驱动Cas9编码序列的表达。可以将黑曲霉pyrA基因的3.9kg Xba1片段插入pGpd:Cas9质粒中,用作选择标记。
可以使用2μg的具有pyrA选择的如此构建的Cas9表达载体、20μg体外合成的指导RNA和100μM的100个或200个碱基单链超聚体进行真菌共转化,所述超聚体含有在三个阅读框中SEQ ID NO:21的终止密码子:SEQ ID NO:21(CGTTTAAACCTTAATTAAG)。
xlnR基因编码锌双核簇Zn2Cys6蛋白。可以选择20-bp靶序列(SEQ ID NO:22):SEQID NO:22:(CAACTCCGAACGAAATGCGA)。
SEQ ID NO:22位于PAM位点“CGG”之前作为Cas9诱导的双链断裂的靶位点,因为它位于靠近xlnR的N末端的锌双核DNA结合结构域内。
用于体外合成指导RNA的、含有T7启动子(加下划线)、20-bp靶位点(大写字母)、tracr序列的模板序列(SEQ ID NO:23)可以作为gblock从IDT公司定购,并且然后可以使用Megashort Script试剂盒(阿姆比恩公司(Ambion))在体外合成指导RNA。
SEQ ID NO:23是用于gRNA体外合成的模板:
cgcgaaattaatacgactcactataggCAACTCCGAACGAAATGCGAgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgctttttttaa
通过用来自塔宾曲霉3M-43/pyrA菌株的原生质体以及如上所述的具有pryA选择的Cas9表达载体(以2μg的量)、体外合成的指导RNA(以20μg的量)、和100个碱基或200个碱基单链超聚体供体模板制备转化混合物进行共转化。然后将如此制备的转化混合物接种在含有每升6g NaNO3、1.5g KH2PO4、0.5g MgSO4·7H2O、0.5g KCl、Vishniac微量元素、1.5%琼脂和20g果糖作为碳源的基本培养基板(pH 6.0)上。
然后将培养后在基本琼脂板上出现的菌落转移至含有D-木糖和木聚糖作为碳源的新的基本琼脂板上。
若干个转化体将表现出在D-木糖上减少的生长或者甚至完全不存在木聚糖酶活性,如可以根据基于木聚糖的琼脂板上的晕圈形成来测定或估计。减低的生长或完全不存在木聚糖酶活性是转录因子断裂成功的良好指标。
在3%甜菜渣(SBP)底物和麦麸(WB)上在液体培养物中在34℃生长5天后,也可以筛选菌落的木聚糖内切酶(EXL)活性。在xlnR基因中的一个或多个突变可以通过木聚糖酶活性的不存在确定。在表现xlnR基因敲除表型的菌落中,用使用SEQ ID NO:24(正向引物)和SEQ ID NO:25(反向引物)的基因组DNA和xlnR基因特异性引物的PCR也可以确认这样的缺失或突变。在所有的转化体中都可以产生约3,820kb大小的PCR产物。那些在D-木糖上生长减少且不存在木聚糖酶活性的转化体将显示含有pme1和pac1位点的PCR产物。可以使用限制性消化来确认这些位点的存在,产生约1,100bp和2,700bp大小的2个带。这些带将确认成功的Cas9诱导的双链断裂和在塔宾曲霉中使用单链寡核苷酸作为供体修复模板的同源定向修复。
结果将还表明,与在真菌菌株中修饰或断裂基因的常规手段相比,使用CRISPR-Cas9策略是在丝状真菌菌株(如曲霉菌)中实现基因编辑的更为有效的手段。
实例9
CAS9在枯草芽孢杆菌中的表达
1.在图8中列出的pSB-SpyCas9表达载体的构建
将携带SpyCas9基因(SEQ ID NO:26)的SpeI-HindIII片段(4.2kb)连接到用相同的酶切割的pSB中(产生5.6kb的片段)。更具体地,SEQ ID NO:26的多核苷酸是酿脓链球菌M1GAS(基因座Spy_1046)的Cas9的序列,该序列具有NdeI-XhoI片段和用粗体文本标记的BsrDI限制性位点。C-末端加下划线的文本标记核定位序列和十-His标签。
然后使用连接混合物转化枯草芽孢杆菌C2987细胞,并且获得约100个转化体。挑取八(8)个菌落,并在小量制备后确认其序列。然后将那些合并并用于转化CB20-1和枯草芽孢杆菌168细胞。
挑取Spy-Cas9(A和B)的两个转化体并在用LB和10ppm新霉素制备的各个2-mL预培养物中生长。使用1mL体积的预培养物接种35mL具有10ppm新霉素的格兰特II培养基(Grant’s ll Medium)。然后使培养物在37℃生长约63小时,以280rpm振荡,并使用增强密封在Ultra-Yield烧瓶中保持在70%的湿度。
培养完成后,将培养液离心,将细胞沉淀物和上清液分别储存。从每个培养物中的1mL细胞中取出细胞沉淀物,并将沉淀物悬浮在0.5mL的缓冲液P1中。然后将五(5)mLReady-Lyse(T4溶菌酶)添加至每个混合物中。将这些混合物在37℃孵育约0.5小时。
观察到培养物在0.5小时结束时变粘稠。添加5mL体积的Omnicleave核酸酶,并且再进行另外的0.5小时孵育。当样品仍浑浊时,作为裂解的结果,混合物具有降低的粘度。然后将裂解的细胞沉淀物放在SDS-PAGE上,使用蛋白质印迹进行His-标签检测。观察到SpyCas9的表达。
2.靶向和编辑枯草芽孢杆菌的phrA基因
参与枯草芽孢杆菌早期孢子形成途径的phrA基因的序列如下面SEQ ID NO:27所示,其中靶向位点加下划线。
ATGAAATCTAAATGGATGTCAGGTTTGTTGCTCGTTGCGGTCGGGTTCAGCTTTACTCAGGTGATGGT TCTACTTTAGATTTACCTACAGTCCAAACAACGAGCAACGCCAGCCCAAGTCGAAATGAGTCCACTACCAAGATGCAGGTGAAACAGCAAACACAGAAGGGAAAACATTTCATATTGCGGCACGCAATCAAACATGATACGTCCACTTTGTCGTTTGTGTCTTCCCTTTTGTAAAGTATAACGCCGTGCGTTAGTTTGTACT(SEQ ID NO:27)
预期phrA基因的缺失会引起不受控制的RapA磷酸酶活性,其结果是不启动孢子形成(参见Proc.Natl.Acad.Sci.USA[美国国家科学院院刊],94(1997):8612-8616)。
上文加下划线并且在本文中呈现为SEQ ID NO:28的、包括PAM位点“AGG”的靶向序列被用作Cas9活性的靶位点。在没有PAM位点核苷酸的20-bp phrA序列之前添加T7启动子,并将指导支架序列添加至3’末端。将所得的序列用作体外指导RNA合成的模板,该体外指导RNA合成应用MegaShort Script试剂盒(阿姆比恩公司(Ambion))和RNAEasy试剂盒(凯杰公司(Qiagen)),该RNAEasy试剂盒用于指导RNA纯化。
从芽孢杆菌遗传库存中心(Bacillus Genetic Stock Center)获得野生型枯草芽孢杆菌菌株168(trpC2)。然后将包含具有2个超聚体(154个碱基的单链上链和下链寡核苷酸,含有具有19个碱基终止密码子插入的完整phrA开放阅读框)和如上所述的体外合成的指导RNA的Cas9表达质粒的转化混合物在Schaeffer的孢子形成培养基中在37℃生长约30小时。
将没有Cas9表达质粒的对照菌株与表达Cas9的菌株进行比较。计算Cas9和非Cas9的孢子形成的百分比并将其表示为孢子计数与活细胞计数的比率。观察到在Cas9菌株中孢子形成被消除,这表明phrA基因的断裂。
将SEQ ID NO:29(正向引物)和SEQ ID NO:30(反向引物)的引物对用于菌落PCR。
phrA基因的PCR扩增和随后的使用PmeI或PacI的限制性消化在4%琼脂糖凝胶上显示约70-80个碱基的双重带。这表明使用供体单链寡核苷酸实现了phrA基因的同源定向修复。
实例10
酿脓链球菌CAS9在变铅青链霉菌中的表达
在文献中,在三种不同类型的链霉菌属菌株中报道了Cas9介导的靶向染色体缺失,具有在70%至100%范围内的不同的效率(参见,ACS Synthetic Biology[ACS合成生物学](2015)19:4(6)723-728)。该报道的研究使用了几千个碱基长度的供体模板。密码子优化用于在变铅青链霉菌中表达的、编码酿脓链球菌Cas9的基因列于SEQ ID NO:31中。
在本实验中,包括以单链寡核苷酸形式的超聚体的供体模板被设计为在链霉菌中影响Cas9介导的基因编辑。具体而言,CRISPR-Cas9可以用于缺失两个链霉菌基因sco7700和sco7701,这两个基因属于负责甲基异莰醇(MIB)生物合成的双基因操纵子。甲基异莰醇是由链霉菌属产生的挥发性有机化合物,其被认为是潮湿土壤特有的气味以及在大规模发酵工厂中经常被认为是不希望的甚至是有问题的许多令人不愉快的味道或气味的原因。参见,J.Am.Chem.Soc.[美国化学学会杂志](2008)16:130(28):8908-8909。
图10描绘了具有Cas9基因和指导RNA序列以及SEQ ID NO:32的20bp靶位点的表达盒,其中质粒中的2kb同源修复供体作为对照。图11描绘了不含2kb同源修复供体模板的表达盒,以便允许使用具有终止密码子的200个碱基的超聚体。
使用两(2)μg的Cas9-gRNA表达盒和100μM的200个碱基寡核苷酸的超聚体(SEQ IDNO:33)使sco7700和sco7701基因断裂。
使用在30℃培养的50mL培养物中没有气味来确认MIB基因的断裂。MIB基因的PCR扩增、随后进一步进行PmeI或PacI限制性消化,更准确地说,验证了MIB基因的断裂。
参考文献
PCT公开号WO 1991/17243
PCT公开号WO 2013/141680
PCT国际申请号PCT/CN 2014/093918
美国专利申请公开号2011/0020899
美国专利申请公开号2013/0323798
美国专利号5,107,065
美国专利号6,022,725
美国专利号8,697,359
Bleuyard et al.,DNA Repair 5:1-12,2006.
ACS Synthetic Biology(2015)19:4(6)723-8
J.Am.Chem.Soc.(2008)16:130(28):8908-9.
Sambrook et al.,MOLECULAR CLONING:A LABORATORY MANUAL,2nd ed.,ColdSpring Harbor,1989,and 3rd ed.,2001.
Cong et al.,Science,339:819-823,2013.
Siebert and Puchta,Plant Cell 14:1121-1131,2002.
Fonfara et al.,Nucleic Acids Res.,pages 1-14,2013.
Pacher et al.,Genetics 175:21-29,2007.
Cao et al.,Science 9:991-1001,2000.
Campbell et al.,Curr.Genet.16:53-56,1989.
Fonfara et al.,Nucleic Acids Res.,pages 1-14,2013.
Hawksworth et al.,“Ainsworth and Bisby’s Dictionary of The Fungi”,8thedition,1995,CAB International,University Press,Cambridge,UK.
Henikoff and Henikoff,Proc.Natl.Acad.Sci.USA 89:10915,1989.
Higgins and Sharp,CABIOS 5:151-153,1989.
Higgins et al.,Comput.Appl.Biosci.8:189-191,1992.
Hsu et al.,“Development and Applications of CRISPR-Cas9for GenomeEngineering”,Cell 157:1262-1278,2014.
Liu et al.,“Efficient genome editing in filamentous fungusTrichoderma reesei using the CRISPR/Cas9 system”,Cell Discovery,Vol.1(No.15007),2015.
Liu et al.,Acta Biochim.Biophys.Sin(Shanghai)40(2):158-165,2008.
Needleman and Wunsch,J.Mol.Biol.48:443-453,1970.
Nikolaev et al.,Biotechnol.J.(8):905-911,2013.
Rudin et al.,“Genetic and Physical Analysis of Double-Strand BreakRepair and Recombination in Saccharomyces Cerevisiae”,Genetics 122:519-534,1989.
Smith et al.,Nucl.Acids Res.23:5012-5019.
Claims (15)
1.一种用于在丝状真菌细胞中进行基因组编辑的方法,所述方法包括向所述丝状真菌细胞中引入Cas内切核酸酶、指导多核苷酸、和供体多核苷酸,其中所述供体多核苷酸包含至少一个同源臂,其中所述同源臂是少于 150个核苷酸的长度并且包含与所述真菌细胞的靶向的基因组基因座同源的序列,其中所述Cas内切核酸酶和所述指导多核苷酸形成复合物,所述复合物使得所述Cas内切核酸酶能够在所述真菌细胞的靶向的基因组基因座处或附近起作用,并且其中所述供体多核苷酸是单链DNA。
2.如权利要求1所述的方法,其中将所述供体多核苷酸插入所述真菌细胞的靶向的基因组基因座中,任选地其中所述插入的供体多核苷酸包含基因组修饰,所述基因组修饰选自由以下组成的组:DNA缺失、DNA断裂、DNA插入、DNA倒位、DNA点突变、DNA置换、DNA敲入、DNA敲除和DNA敲低。
3.如权利要求1所述的方法,其中所述供体多核苷酸进一步包含目的核苷酸序列,所述目的核苷酸序列是在上游5’并有效地连接至所述同源臂或者在下游3’并有效地连接至所述同源臂。
4.如权利要求3所述的方法,其中将所述目的核苷酸序列插入所述真菌细胞的靶向的基因组基因座中,任选地其中所述插入的目的核苷酸序列包含基因组修饰,所述基因组修饰选自由以下组成的组:DNA缺失、DNA断裂、DNA插入、DNA倒位、DNA点突变、DNA置换、DNA敲入、DNA敲除和DNA敲低。
5.如权利要求1所述的方法,其中所述同源臂是在100个至40个核苷酸之间的长度。
6.如权利要求1所述的方法,其中所述供体多核苷酸包含在目的核苷酸序列上游5’并有效地连接至所述目的核苷酸序列的同源臂以及在相同的目的核苷酸序列下游3’并有效地连接至所述相同的目的核苷酸序列的同源臂,其中所述两个同源臂中的至少一个是少于150个核苷酸的长度。
7.如权利要求6所述的方法,其中将所述目的核苷酸序列插入所述真菌细胞的靶向的基因组基因座中。
8.如权利要求6所述的方法,其中至少一个同源臂是在100个至40个核苷酸之间的长度。
9.如权利要求6所述的方法,其中两个同源臂均少于500个核苷酸。
10.如权利要求3或权利要求6所述的方法,其中所述目的核苷酸序列包含至少一个异源的核苷酸,或其中所述目的核苷酸序列包含异源的多核苷酸序列。
11.如权利要求1所述的方法,其中所述Cas内切核酸酶是Cas切口酶或其功能变体。
12.如权利要求1所述的方法,其中所述Cas内切核酸酶是Cas9内切核酸酶或其功能变体,任选地其中所述Cas9内切核酸酶是选自由以下组成的组的物种:链球菌属物种(Streptococcus sp.)、弯曲杆菌属物种(Campylobacter sp.)、奈瑟氏菌属物种(Neisseria sp.)、弗朗西斯氏菌属物种(Francisella sp.)和巴斯德氏菌属物种(Pasteurella sp.)。
13.如权利要求1所述的方法,其中
(i)所述引入步骤包括引入多核苷酸构建体,所述多核苷酸构建体包含用于在所述真菌细胞中表达所述Cas内切核酸酶或其功能变体的表达盒;
(ii)其中所述引入步骤包括引入多核苷酸构建体,所述多核苷酸构建体包含用于在所述真菌细胞中表达指导RNA的表达盒;
(iii)所述引入步骤包括向所述真菌细胞中引入环状多核苷酸构建体,所述环状多核苷酸构建体包含用于所述Cas内切核酸酶的表达盒、用于指导RNA的表达盒、以及供体DNA;或者
(iv)其中所述引入步骤包括向所述真菌细胞中直接引入所述指导多核苷酸或Cas内切核酸酶。
14.如权利要求1所述的方法,其中所述Cas内切核酸酶或其功能变体有效地连接至核定位信号。
15.如权利要求1所述的方法,其中所述丝状真菌细胞选自由以下组成的属:木霉属(Trichoderma)、青霉属(Penicillium)、曲霉属(Aspergillus)、腐质霉属(Humicola)、金孢子菌属(Chrysosporium)、镰孢属(Fusarium)、毁丝霉属(Myceliophthora)、脉孢菌属(Neurospora)和裸胞壳属(Emericella)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562198049P | 2015-07-28 | 2015-07-28 | |
US62/198,049 | 2015-07-28 | ||
PCT/US2016/044489 WO2017019867A1 (en) | 2015-07-28 | 2016-07-28 | Genome editing systems and methods of use |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107849562A CN107849562A (zh) | 2018-03-27 |
CN107849562B true CN107849562B (zh) | 2021-10-26 |
Family
ID=56682266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680043665.8A Active CN107849562B (zh) | 2015-07-28 | 2016-07-28 | 基因组编辑系统及使用方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20180208945A1 (zh) |
EP (1) | EP3329001B1 (zh) |
JP (1) | JP6937740B2 (zh) |
CN (1) | CN107849562B (zh) |
DK (1) | DK3329001T3 (zh) |
WO (1) | WO2017019867A1 (zh) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2853829C (en) | 2011-07-22 | 2023-09-26 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9737604B2 (en) | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
US9228207B2 (en) | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
EP4063503A1 (en) | 2014-02-11 | 2022-09-28 | The Regents of the University of Colorado, a body corporate | Crispr enabled multiplexed genome engineering |
US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
JP2019518478A (ja) | 2016-06-24 | 2019-07-04 | ザ リージェンツ オブ ザ ユニバーシティ オブ コロラド,ア ボディー コーポレイトTHE REGENTS OF THE UNIVERSITY OF COLORADO,a body corporate | バーコードを付けたコンビナトリアルライブラリーを生成する方法 |
EP3484994A4 (en) * | 2016-07-13 | 2020-01-22 | DSM IP Assets B.V. | CRISPR-CAS-SYSTEM FOR AN ALGENE CELL |
IL308426A (en) | 2016-08-03 | 2024-01-01 | Harvard College | Adenosine nuclear base editors and their uses |
US11661590B2 (en) | 2016-08-09 | 2023-05-30 | President And Fellows Of Harvard College | Programmable CAS9-recombinase fusion proteins and uses thereof |
CN110114461A (zh) | 2016-08-17 | 2019-08-09 | 博德研究所 | 新型crispr酶和系统 |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
SG11201903089RA (en) | 2016-10-14 | 2019-05-30 | Harvard College | Aav delivery of nucleobase editors |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
US11898179B2 (en) | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
EP3592777A1 (en) | 2017-03-10 | 2020-01-15 | President and Fellows of Harvard College | Cytosine to guanine base editor |
JP7191388B2 (ja) | 2017-03-23 | 2022-12-19 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子 |
WO2018204777A2 (en) | 2017-05-05 | 2018-11-08 | The Broad Institute, Inc. | Methods for identification and modification of lncrna associated with target genotypes and phenotypes |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US10011849B1 (en) | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US20200208146A1 (en) * | 2017-07-12 | 2020-07-02 | Mayo Foundation For Medical Education And Research | Materials and methods for efficient targeted knock in or gene replacement |
US11866726B2 (en) | 2017-07-14 | 2024-01-09 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
CN111801345A (zh) | 2017-07-28 | 2020-10-20 | 哈佛大学的校长及成员们 | 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
WO2019099982A1 (en) * | 2017-11-17 | 2019-05-23 | The Johns Hopkins University | Compositions and methods for efficient genome editing |
AU2018386002B2 (en) | 2017-12-15 | 2024-07-25 | Danisco Us Inc | CAS9 variants and methods of use |
WO2019131505A1 (ja) * | 2017-12-26 | 2019-07-04 | 国立大学法人徳島大学 | 糸状菌細胞に対するタンパク質導入法およびその成果物 |
US20210071202A1 (en) * | 2018-03-29 | 2021-03-11 | Jichi Medical University | Genome editing method, composition, cell, cell preparation, and method for producing cell preparation |
US11981892B2 (en) | 2018-04-16 | 2024-05-14 | University Of Massachusetts | Compositions and methods for improved gene editing |
EP3874051A1 (en) * | 2018-10-31 | 2021-09-08 | Novozymes A/S | Genome editing by guided endonuclease and single-stranded oligonucleotide |
WO2020191243A1 (en) | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
CN113874076A (zh) * | 2019-03-28 | 2021-12-31 | 因特利亚治疗公司 | 包括ttr向导rna和对rna引导的dna结合剂进行编码的多核苷酸的组合物和方法 |
WO2020236967A1 (en) | 2019-05-20 | 2020-11-26 | The Broad Institute, Inc. | Random crispr-cas deletion mutant |
EP3987024A4 (en) | 2019-06-20 | 2023-11-01 | University Of Massachusetts | COMPOSITIONS AND METHODS FOR IMPROVED GENE EDITING |
US20220298501A1 (en) | 2019-08-30 | 2022-09-22 | The Broad Institute, Inc. | Crispr-associated mu transposase systems |
WO2021086606A1 (en) | 2019-10-28 | 2021-05-06 | Danisco Us Inc | Microbial host cells for the production of heterologous cyanuric acid hydrolases and biuret hydrolases |
DE112021002672T5 (de) | 2020-05-08 | 2023-04-13 | President And Fellows Of Harvard College | Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz |
WO2022095929A1 (en) * | 2020-11-06 | 2022-05-12 | The University Of Hong Kong | Transferable type i-f crispr-cas genome editing system |
CN114410635B (zh) * | 2022-03-29 | 2022-06-14 | 中国科学院天津工业生物技术研究所 | 威尼斯镰刀菌内源U6启动子及其基于CRISPR/Cas9的基因编辑方法 |
CN117025651B (zh) * | 2023-10-08 | 2023-12-19 | 西北农林科技大学深圳研究院 | 一种欧文氏菌中漆酶基因敲除的方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5107065A (en) | 1986-03-28 | 1992-04-21 | Calgene, Inc. | Anti-sense regulation of gene expression in plant cells |
AU639570B2 (en) | 1990-05-09 | 1993-07-29 | Novozymes A/S | A cellulase preparation comprising an endoglucanase enzyme |
EP0562003B2 (en) | 1990-12-10 | 2015-04-01 | Danisco US Inc. | Improved saccharification of cellulose by cloning and amplification of the beta-glucosidase gene of trichoderma reesei |
US8592194B2 (en) | 2007-10-09 | 2013-11-26 | Danisco Us Inc. | Glucoamylase variants with altered properties |
WO2013141680A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
MX2014013402A (es) | 2012-05-11 | 2014-11-26 | Danisco Inc | Uso de alfa-amilasa de aspergillus clavatus para sacarificacion. |
SG11201503059XA (en) * | 2012-10-23 | 2015-06-29 | Toolgen Inc | Composition for cleaving a target dna comprising a guide rna specific for the target dna and cas protein-encoding nucleic acid or cas protein, and use thereof |
SG11201504523UA (en) * | 2012-12-12 | 2015-07-30 | Broad Inst Inc | Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
CA2913865C (en) * | 2013-05-29 | 2022-07-19 | Cellectis | A method for producing precise dna cleavage using cas9 nickase activity |
WO2015054507A1 (en) * | 2013-10-10 | 2015-04-16 | Pronutria, Inc. | Nutritive polypeptide production systems, and methods of manufacture and use thereof |
NL2013178B1 (en) * | 2014-07-14 | 2016-09-13 | Van Oossanen & Ass B V | Vessel comprising an aft foil oriented to provide a forwardly directed component of lift force. |
AU2015362784B2 (en) * | 2014-12-16 | 2021-05-13 | Danisco Us Inc | Fungal genome modification systems and methods of use |
DK3234160T3 (da) * | 2014-12-16 | 2019-12-02 | Danisco Us Inc | Sammensætninger og fremgangsmåder til hjælper-stamme-medieret svampegenommodifikation |
WO2016110453A1 (en) * | 2015-01-06 | 2016-07-14 | Dsm Ip Assets B.V. | A crispr-cas system for a filamentous fungal host cell |
-
2016
- 2016-07-28 JP JP2018503753A patent/JP6937740B2/ja active Active
- 2016-07-28 WO PCT/US2016/044489 patent/WO2017019867A1/en active Application Filing
- 2016-07-28 CN CN201680043665.8A patent/CN107849562B/zh active Active
- 2016-07-28 EP EP16750569.2A patent/EP3329001B1/en active Active
- 2016-07-28 US US15/746,479 patent/US20180208945A1/en not_active Abandoned
- 2016-07-28 DK DK16750569.2T patent/DK3329001T3/da active
Also Published As
Publication number | Publication date |
---|---|
JP6937740B2 (ja) | 2021-09-22 |
EP3329001B1 (en) | 2021-09-22 |
CN107849562A (zh) | 2018-03-27 |
US20180208945A1 (en) | 2018-07-26 |
WO2017019867A1 (en) | 2017-02-02 |
DK3329001T3 (da) | 2021-12-20 |
JP2018525983A (ja) | 2018-09-13 |
EP3329001A1 (en) | 2018-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107849562B (zh) | 基因组编辑系统及使用方法 | |
AU2015362784B2 (en) | Fungal genome modification systems and methods of use | |
CN107223157B (zh) | 用于辅助菌株介导的真菌基因组修饰的组合物和方法 | |
US11396665B2 (en) | CRISPR-CAS system for a filamentous fungal host cell | |
US11149268B2 (en) | Assembly system for a eukaryotic cell | |
CN108738328B (zh) | 用于丝状真菌宿主细胞的crispr-cas系统 | |
EP3384002A1 (en) | Method of producing proteins in filamentous fungi with decreased clr2 activity | |
US20240102070A1 (en) | Fungal strains comprising enhanced protein productivity phenotypes and methods thereof | |
US20230174998A1 (en) | Compositions and methods for enhanced protein production in filamentous fungal cells | |
EP3227430B1 (en) | Fungal host strains, dna constructs, and methods of use | |
WO2024102556A1 (en) | Filamentous fungal strains comprising enhanced protein productivity phenotypes and methods thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |