CN111511908A - 温度敏感性cas9蛋白 - Google Patents

温度敏感性cas9蛋白 Download PDF

Info

Publication number
CN111511908A
CN111511908A CN201880070805.XA CN201880070805A CN111511908A CN 111511908 A CN111511908 A CN 111511908A CN 201880070805 A CN201880070805 A CN 201880070805A CN 111511908 A CN111511908 A CN 111511908A
Authority
CN
China
Prior art keywords
bacillus
host cell
temperature
nos
tscas9
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880070805.XA
Other languages
English (en)
Inventor
C.安德森
P.E.佩德森
M.D.拉斯穆森
C.约尔特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes AS
Original Assignee
Novozymes AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes AS filed Critical Novozymes AS
Publication of CN111511908A publication Critical patent/CN111511908A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/35Fusion polypeptide containing a fusion for enhanced stability/folding during expression, e.g. fusions with chaperones or thioredoxin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01001Alpha-amylase (3.2.1.1)

Abstract

本发明涉及II类Cas9蛋白的温度敏感性变体、编码所述变体的多核苷酸、包含编码所述变体的多核苷酸的核酸构建体和表达载体、表达所述变体的宿主细胞、使用所述变体瞬时阻遏和表达一个或多个基因组靶序列的方法以及所述变体、多核苷酸、核酸构建体、表达载体、宿主细胞和方法的用途。

Description

温度敏感性CAS9蛋白
对序列表的引用
本申请含有处于计算机可读形式的序列表,将其通过引用并入本文。
技术领域
本发明涉及II类Cas9蛋白的温度敏感性变体、编码所述变体的多核苷酸、包含编码所述变体的多核苷酸的核酸构建体和表达载体、表达所述变体的宿主细胞、使用所述变体表达和抑制一个或多个基因组靶序列的方法以及所述变体、多核苷酸、核酸构建体、表达载体、宿主细胞和方法的用途。
背景技术
所谓的CRISPR-Cas9基因组编辑系统已被广泛用作一种工具来修饰多种生物的基因组。CRISPR-Cas9系统的力量在于其简单性,可在特异性目的基因中靶向和编辑单个碱基对。Cas9蛋白是双RNA指导的核酸内切酶,其核酸酶活性由所谓的指导RNA(gRNA)分子引导。通过改变gRNA的20bp序列窗口以匹配靶DNA序列来选择Cas9靶序列。当与gRNA分子复合时,Cas9蛋白然后将结合其靶DNA序列并使用两个催化结构域产生双-链断裂。Cas9可以进一步被工程化为在两个催化结构域中的任一个中含有单个氨基酸突变。在这种情况下,Cas9作为切割酶起作用,即具有单链切割活性。
除了其在基因组编辑中使用外,CRISPR-Cas9系统还用于控制基因表达。这种应用,通常被称为CRISPR抑制或CRISPRi,允许基因的序列特异性抑制或激活。CRISPR干扰利用了一种缺乏内切酶活性的无催化活性的(死)Cas9变体(称作Cas9d)。Cas9d-gRNA复合物保留了与靶DNA序列结合的能力,但不会在DNA链中引入任何断裂。通过改变gRNA序列,可以控制Cas9d-gRNA复合物的靶DNA序列,从而调节任何生物中几乎任何基因的表达。然而,由于Cas9d-gRNA复合物和靶DNA之间形成的复合物(Cas9d-gRNA-DNA复合物)非常稳定且难以逆转,CRISPR抑制仍然不适合于基因表达的瞬时控制。
当暴露于蓝光时,同型二聚体类球红细菌(Rhodobacter sphaeroides)光-氧-电压结构域多肽(RsLOV)解离为两个多肽单体,每个单体由176个氨基酸组成。当与其他多肽融合或插入它们时,RsLOV可以赋予它们光敏性。一些RsLOV-Cas9/Cas9d杂交构建体已经显示对光和温度都敏感(Richter F.等人,2016,Engineering of temperature-and light-switchable Cas9变体[温度和光可变换的Cas9变体的工程],Nucleic Acids Research[核酸研究],2016,第44卷,第20期,第10003–10014页)。
WO 2013/176772表明融合蛋白由Cas9和各种异源多肽组成。异源多肽可以赋予Cas9融合蛋白额外的特性。
发明内容
本发明提供了II类Cas9蛋白的温度敏感性变体、编码所述变体的多核苷酸、包含编码所述变体的多核苷酸的核酸构建体和表达载体、表达所述变体的宿主细胞、使用所述变体表达和抑制一个或多个基因组靶序列的方法以及所述变体、多核苷酸、核酸构建体、表达载体、宿主细胞和方法的用途。
本发明基于以下令人惊讶的发现:在化脓链球菌(S.pyogenes)Cas9蛋白中引入特定的氨基酸改变会产生温度敏感性Cas9变体(tsCas9)。当体内与适合的指导RNA和靶基因组序列一起采用这些tsCas9变体时,tsCas9-gRNA复合物的初始形成以及形成的tsCas9-gRNA-DNA变得对温度敏感。因此,tsCas9变体的gRNA和DNA结合特性可以通过向上和/或向下转换温度来控制,其取决于所希望的温度。
因此,在第一方面中,本发明涉及一种II类Cas9蛋白的温度敏感性变体(tsCas9),所述变体包含对蛋白质稳定性或对II类Cas9蛋白、一个或多个指导RNA(gRNA)和一个或多个相对应的基因组靶序列之间形成的复合物的稳定性重要的一个或多个氨基酸的至少一个改变,其中,所述至少一个改变是1-10个氨基酸的取代、插入或缺失;优选地,所述至少一个改变是1-10个氨基酸的取代或缺失;最优选地,所述至少一个改变是取代。
在第二方面中,本发明涉及编码第一方面的tsCas9的多核苷酸。
在第三方面中,本发明涉及包含第二方面的多核苷酸的核酸构建体。
在第四方面中,本发明涉及包含第二方面的多核苷酸的核酸构建体。
在第五方面中,本发明涉及包含如第一方面中定义的tsCas9的宿主细胞,如第二方面中定义的多核苷酸,如第三方面中定义的核酸构建体,和/或如第四方面中定义的表达载体。
在第六方面中,本发明涉及诱导一个或多个目的基因组靶序列表达的方法,所述方法包括以下步骤:
a)提供一种根据第五方面所述的宿主细胞,所述宿主细胞进一步包含一个或多个适合的gRNA和一个或多个目的基因组靶序列;
b)在所述tsCas9的解离温度下培养所述宿主细胞,由此所述tsCas9与所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成的复合物解离;以及随后
c)将温度降低到所述tsCas9的限制性温度并培养所述宿主细胞,由此诱导所述一个或多个靶序列的表达。
在第七方面,本发明涉及抑制一个或多个目的基因组靶序列的方法,所述方法包括以下步骤:
a)提供一种根据第五方面所述的宿主细胞,所述宿主细胞进一步包含一个或多个适合的gRNA和一个或多个目的基因组靶序列;
b)在所述tsCas9的限制性温度下培养所述宿主细胞,其中所述一个或多个目的基因组靶序列被表达;以及随后
c)将温度降低到所述tsCas9的许可温度,由此所述tsCas9、所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成复合物,并由此抑制所述一个或多个基因组靶序列的表达。
本发明还涉及根据第一方面的tsCas9,根据第二方面的多核苷酸,根据第三方面的的核酸构建体,根据第四方面的表达载体,根据第五方面的宿主细胞,和/或根据第六方面和第七方面的方法的用途。
附图说明
图1显示了两个反平行amyL基因拷贝插入到实例1中提及的地衣芽孢杆菌(B.licheniformis)SJ4671菌株中的示意图。所述拷贝间隔约2.5Kb,其来源于枯草芽孢杆菌(B.subtilis)染色体(SEQ ID NO:3)的非功能性DNA。
图2显示了实例1中SJ4671菌株中的在xyl基因座(SEQ ID NO:4)处插入的amyL基因的额外的拷贝的示意图。
图3显示了实例1中在gnt基因座(SEQ ID NO:5)处插入以形成菌株SJ6026的amyL基因的额外的拷贝的示意图。
图4显示了实例1中在mprL基因座(SEQ ID NO:6)处插入以形成菌株MOL2173的prsA基因的示意图。
图5显示了实例2中的表达盒的示意图,所述表达盒由整合在forD基因座处并从forD启动子表达的cas9d基因、从PamyQsc启动子转录的gDNA(P4199)和赋予氯霉素抗性的cat基因(SEQ ID NO:7)组成。
图6a和6b分别显示了两个地衣芽孢杆菌菌株PP5007和PP5021的图示。
图7显示了使用实例3中的PP5007和PP5021菌株的α-淀粉酶表达(有抑制或无抑制)。
图8显示了在实例4中在amyE基因座处插入的DNA片段的示意图,其中编码绿色荧光蛋白的GFP基因从amyL变体启动子P4199表达。此外,从PamyQ共有启动子(PamyQsc)表达gDNA(P4199),显示了整合后amyE基因座的最终图谱。
图9显示了在实例5中在具有编码cas9d蛋白的cas9d基因的pel基因座处插入的表达盒的示意图。
图10显示了实例5中构建的菌株PP5336的示意图。
图11显示了在不同温度下测试实例8中不同变体克隆的GFP荧光的实例。
图12a、12B、12c、12d、12e和12f显示了在不同温度下在液体培养物中对实例9中Cas9d变体的测试。
图13a和13b显示了在温度转换后在液体培养物中测试实例9中的Cas9d变体。
图14显示了与启动子P4199的启动子区域结合以抑制与P4199启动子可操作地连接的基因表达的CRISPRi复合物的图示示意图。
图15显示了地衣芽孢杆菌菌株的分批给料实验,所述菌株含有Cas9d的温度敏感性变体、gDNA(P4199)和从P4199启动子表达的淀粉酶的四个拷贝。培养物在接种后在30℃或42℃下孵育两天。然后将温度分别转换到42℃和30℃,并且培养物再继续生长三天。取样测量淀粉酶活性。
图16显示了地衣芽孢杆菌菌株的分批给料实验,所述菌株含有Cas9d的温度敏感性变体、gDNA(P4199)和从P4199启动子表达的淀粉酶的四个拷贝。培养物在接种后在30℃或42℃下孵育两天。然后将温度从42℃转换到35℃、37℃和39℃,或从30℃转换到42℃。培养物TM(P)093还经历转换到48℃持续一个短段时间。培养物再继续生长三天。取样测量淀粉酶活性。
图17显示了含有Cas9d和gDNA(gfp)的温度敏感性变体的枯草芽孢杆菌菌株孵育后GFP的测量。每个菌株培养两个重复。数据显示了构建的变体的温度敏感性增加的趋势,所述趋势与在平板上观察到的趋势极为一致。
图18显示了地衣芽孢杆菌菌株的分批给料实验,所述菌株含有Cas9d的温度敏感性变体、gDNA(P4199)和从P4199启动子表达的淀粉酶的四个拷贝。培养物在接种后在30℃或44℃下孵育两天。然后将温度分别转换到44℃和30℃,并且培养物再继续生长三天。取样测量淀粉酶活性。
定义
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由可读框确定,该可读框以起始密码子(例如ATG、GTG或TTG)开始并且以终止密码子(例如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。最少,控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的特异性限制位点的目的,这些控制序列可以提供有多个接头。
II类Cas9蛋白的温度敏感性变体:术语“II类Cas9蛋白的温度敏感性变体”和“tsCas9”在本文中可互换使用。
许可温度:术语“许可温度”意指温度或温度范围,其中tsCas9表现为其野生型亲本。许可温度是指tsCas9能够与一个或多个gRNA和相对应的一个或多个目的基因组靶序列形成复合物,并且在Cas9的情况下剪切靶序列,在Cas9切割酶的情况下切割靶序列,或在称为Cas9d的无效核酸酶Cas9变体的情况下保持与靶序列结合的温度或温度范围。许可温度范围主要由宿主细胞的选择、II类Cas9蛋白的特定温度敏感性变体以及所应用的一个或多个gRNA定义。
解离温度:术语“离解温度”意指其中本发明的tsCas9、一个或多个gRNA和相对应的一个或多个目的基因组靶序列之间形成的复合物解离的温度或温度范围。
限制性温度:术语“限制性温度”意指其中本发明的II类Cas9蛋白的温度敏感性变体不能与一个或多个gRNA和相对应的一个或多个目的基因组靶序列形成复合物的温度或温度范围。
表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰、以及分泌。
表达载体:术语“表达载体”意指直链或环状DNA分子,其包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的控制序列。
宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不完全相同的任何亲本细胞子代。
分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质;(2)至少部分地从与它天然相关的一个或多个或所有天然存在的成分中去除的任何物质,包括但不限于:任何酶、变体、核酸、蛋白质、肽或辅因子;(3)相对于在自然界中发现的物质经过人为改变的任何物质;或(4)相对于与它天然相关的其他组分通过增加该物质的量(例如,在宿主细胞中的重组生产;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关联的启动子更强的启动子)而改变的任何物质。
成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。在本领域中已知的是,宿主细胞可以产生由相同多核苷酸表达的两种或更多种不同的成熟多肽(即,具有不同的C-末端和/或N-末端氨基酸)的混合物。在本领域中还已知的是,不同的宿主细胞以不同的方式加工多肽,且因此表达多核苷酸的一种宿主细胞当与表达相同多核苷酸的另一种宿主细胞相比时可产生不同的成熟多肽(例如,具有不同的C-末端和/或N-末端氨基酸)。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码成熟多肽的多核苷酸。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成包含核酸的区段,或是合成的,该核酸分子包含一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指如下构型,在所述构型中,控制序列被放置在相对于多核苷酸的编码序列适当的位置处,使得所述控制序列引导所述编码序列的表达。
序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联度通过参数“序列同一性”或“序列互补性”来描述。
出于本发明的目的,使用如在EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件包(The European Molecular Biology Open Software Suite),Rice等人,2000,TrendsGenet.[遗传学趋势]16:276-277)(优选5.0.0版或更新版)的尼德尔程序中所实施的尼德曼-翁施算法(Needleman-Wunsch algorithm)(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列同一性。所使用的参数是空位开放罚分10、空位延伸罚分0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用尼德尔标记的“最长同一性”的输出(使用非简化(-nobrief)选项获得)作为同一性百分比并且如下计算:
(同一的残基x 100)/(比对长度-比对中的空位总数)
出于本发明的目的,使用如在EMBOSS软件包(EMBOSS:The European MolecularBiology Open Software Suite[EMBOSS:欧洲分子生物学开放软件套件],Rice等人,2000,同上)(优选5.0.0版本或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,同上)来确定两个核苷酸序列之间的序列同一性(或相应的序列互补性)。所使用的参数是空位开放罚分10、空位延伸罚分0.5、以及EDNAFULL(NCBINUC4.4的EMBOSS版本)取代矩阵。使用尼德尔标记的“最长同一性”的输出(使用非简化(-nobrief)选项获得)作为同一性百分比并且如下计算:
(同一的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)
为了确定两个互补序列的互补性百分比,需要将两个序列中的一个转换为其互补序列,然后可以使用上述提及的第一序列和第二转换序列之间的同一性百分比计算互补性百分比。
严格条件:术语“非常低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃、于5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。最后在45℃使用2X SSC、0.2%SDS将运载体材料洗涤三次,每次15分钟。
术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃、于5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。最后在50℃使用2X SSC、0.2%SDS将运载体材料洗涤三次,每次15分钟。
术语“中严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃、于5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。最后在55℃使用2X SSC、0.2%SDS将运载体材料洗涤三次,每次15分钟。
术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃、于5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。最后在60℃使用2X SSC、0.2%SDS将运载体材料洗涤三次,每次15分钟。
术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。最后在65℃使用2X SSC、0.2%SDS将运载体材料洗涤三次,每次15分钟。
术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。最后在70℃使用2X SSC、0.2%SDS将运载体材料洗涤三次,每次15分钟。
变体:本发明涉及SEQ ID NO:2的成熟多肽的变体,这些变体包含至少一个氨基酸改变,即在一个或多个(例如,若干个)位置处的至少一个取代、缺失和/或插入。在实施例中,引入SEQ ID NO:2的成熟多肽中的改变的数目多达10个,例如1、2、3、4、5、6、7、8、9或10个。改变包括保守取代,其中氨基酸被另一个具有类似理化特性的氨基酸取代;非保守取代,其中氨基酸被另一个具有不同理化特性的氨基酸取代;典型地1-30个氨基酸的小插入;典型地1至30个氨基酸的小缺失;小的氨基-末端或羧基末端延伸,例如氨基末端的甲硫氨酸残基;多达20-25个残基的小接头肽;或小的延伸,其通过改变净电荷或另一官能(例如聚组氨酸段、抗原表位或结合结构域)来促进纯化。
保守取代的实例是在下组之内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。常见的取代包括但不限于Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
在温度敏感性蛋白质变体的上下文中,保守取代也可以被定义为在变体的许可温度下对蛋白质稳定性没有不利影响的取代。
变体命名惯例
出于本发明的目的,将SEQ ID NO:2中披露的成熟多肽用以确定另一种II类Cas9蛋白中的相对应的氨基酸残基。将另一种II类Cas9蛋白的氨基酸序列与SEQ ID NO:2中披露的成熟多肽进行比对,并且基于所述比对,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件包(EMBOSS:The European Molecular Biology Open Software Suite),Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277)(优选版本5.0.0或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)可以确定与SEQ ID NO:2中披露的成熟多肽中的任何氨基酸残基相对应的氨基酸位置编号。所使用的参数是空位开放罚分10、空位延伸罚分0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。
可以通过使用若干计算机程序,使用其对应默认参数比对多个多肽序列来确定在另一种II类Cas9蛋白中的对应氨基酸残基的鉴别,所述计算机程序包括但不限于MUSCLE(通过对数预期的多序列比较;版本3.5或更新版本;Edgar,2004,Nucleic Acids Research[核酸研究]32:1792-1797),MAFFT(版本6.857或更新版本;Katoh和Kuma,2002,NucleicAcids Research[核酸研究]30:3059-3066;Katoh等人,2005,Nucleic Acids Research[核酸研究]33:511-518;Katoh和Toh,2007,Bioinformatics[生物信息学]23:372-374;Katoh等人,2009,Methods in Molecular Biology[分子生物学方法]537:39-64;Katoh和Toh,2010,Bioinformatics[生物信息学]26:1899-1900),以及采用ClustalW(1.83或更新版本;Thompson等人,1994,Nucleic Acids Research[核酸研究]22:4673-4680)的EMBOSS EMMA。
当其他蛋白质与SEQ ID NO:2的成熟多肽相背离,这样使得传统的基于序列的比较方法不能检测其相互关系时(Lindahl和Elofsson,2000,J.Mol.Biol.[分子生物学杂志]295:613-615),可使用其他成对序列比较算法。在基于序列的搜索中较高的敏感度可使用搜索程序来获得,这些搜索程序利用多肽家族的概率表现(谱)来搜索数据库。例如,PSI-BLAST程序通过迭代数据库搜索过程来产生多个谱,并且能够检测远距离同源物(Atschul等人,1997,Nucleic Acids Res.[核酸研究]25:3389-3402)。如果多肽的家族或超家族具有在蛋白结构数据库中的一个或多个代表,可以实现甚至更高的敏感度。程序如GenTHREADER(Jones,1999,J.Mol.Biol.[分子生物学杂志]287:797-815;McGuffin和Jones,2003,Bioinformatics[生物信息学]19:874-881)利用来自多种来源(PSI-BLAST、二级结构预测、结构比对谱、以及溶剂化势)的信息作为预测查询序列的结构折叠的神经网络的输入。类似地,Gough等人,2000,J.Mol.Biol.[分子生物学杂志]313:903-919的方法可用于将未知结构的序列与存在于SCOP数据库中的超家族模型进行比对。这些比对进而可以用于产生多肽的同源性模型,并且使用出于该目的而开发的多种工具可以评估此类模型的准确度。
对于已知结构的蛋白质,若干工具和资源可用于检索并产生结构比对。例如,蛋白质的SCOP超家族已经在结构上进行比对,并且那些比对是可访问且可下载的。可以使用多种算法如距离比对矩阵(Holm和Sander,1998,Proteins[蛋白质]33:88-96)或组合延伸(Shindyalov和Bourne,1998,Protein Engineering[蛋白质工程]11:739-747)比对两种或更多种蛋白质结构,并且这些算法的实施可以另外用于查询具有感兴趣结构的结构数据库,以便发现可能的结构同源物(例如,Holm和Park,2000,Bioinformatics[生物信息学]16:566-567)。
在描述本发明的变体中,为了便于参考,对以下所述的命名法进行了改编。采用了已接受的IUPAC单字母或三字母的氨基酸缩写。
取代:对于氨基酸取代,使用以下命名法:原始氨基酸、位置、被取代的氨基酸。因此,将在位置226处的苏氨酸被丙氨酸取代表示为“Thr226Ala”或“T226A”。多个突变通过加号(“+”)分开,例如“Gly205Arg+Ser411Phe”或“G205R+S411F”代表在位置205和位置411处的甘氨酸(G)和丝氨酸(S)分别被精氨酸(R)和苯丙氨酸(F)取代。
缺失:对于氨基酸缺失,使用以下命名法:原始氨基酸、位置、*。因此,将在位置195处的甘氨酸的缺失表示为“Gly195*”或“G195*”。多个缺失由加号(“+”)分开,例如,“Gly195*+Ser411*”或“G195*+S411*”。
插入:对于氨基酸插入,使用以下命名法:原始氨基酸、位置、原始氨基酸、插入的氨基酸。因此,将在位置195处的甘氨酸之后插入赖氨酸表示为“Gly195GlyLys”或“G195GK”。多个氨基酸的插入被表示为[原始氨基酸、位置、原始氨基酸、插入的氨基酸#1、插入的氨基酸#2;等]。例如,将在位置195处的甘氨酸之后插入赖氨酸和丙氨酸表示为“Gly195GlyLysAla”或“G195GKA”。
在此类情况下,通过将小写字母添加至在所插入的一个或多个氨基酸残基之前的氨基酸残基的位置编号而对所插入的一个或多个氨基酸残基进行编号。在以上实例中,该序列因此会是:
<u>亲本:</u> <u>变体:</u>
195 195 195a 195b
G G-K-A
多种改变:包含多种改变的变体由加号(“+”)分开,例如,“Arg170Tyr+Gly195Glu”或“R170Y+G195E”代表在位置170和位置195处的精氨酸和甘氨酸分别被酪氨酸和谷氨酸取代。
不同改变:在可于一个位置处引入不同改变的情况下,不同的改变由逗号分开,例如,“Arg170Tyr,Glu”和R170Y,E代表用酪氨酸或谷氨酸取代在位置170处的精氨酸。因此,“Tyr167Gly,Ala+Arg170Gly,Ala”表示以下变体:
“Tyr167Gly+Arg170Gly”,
“Tyr167Gly+Arg170Ala”,
“Tyr167Ala+Arg170Gly”,和
“Tyr167Ala+Arg170Ala”。
具体实施方式
本发明提供利用CRISPR-Cas9系统的多功能性和精确性来表达一个或多个目的基因组靶序列表达和抑制一个或多个目的基因组靶序列表达的手段和方法。本发明基于以下令人惊讶的发现,在Cas9蛋白中引入特定的氨基酸取代会产生不稳定、温度敏感性Cas9变体。当在基因组编辑或CRISPR抑制中采用这些温度敏感性Cas9变体时,初始Cas9-gRNA复合物以及Cas9-gRNA-DNA复合物的稳定性也变得不稳定和温度敏感。因此,通过在CRISPR抑制中应用温度敏感性Cas9变体,可以通过转换温度来控制Cas9变体的gRNA和DNA结合特性。
因此,在一个方面,本发明涉及一种II类Cas9蛋白的温度敏感性变体(tsCas9),所述变体包含对蛋白质稳定性或对II类Cas9蛋白、一个或多个指导RNA(gRNA)和一个或多个相对应的基因组靶序列之间形成的复合物的稳定性重要的一个或多个氨基酸的至少一个改变,其中,所述至少一个改变是1-10个氨基酸的取代、插入或缺失;优选地,所述至少一个改变是1-10个氨基酸的取代或缺失;最优选地,所述至少一个改变是取代。
温度敏感性变体
本发明提供一种II类Cas9蛋白的温度敏感性变体,其包含至少一个氨基酸改变(例如,至少一个取代、插入和/或缺失),所述氨基酸改变位于对II类Cas9蛋白稳定性或对II类Cas9蛋白、一个或多个gRNA、和一个或多个基因组靶序列之间形成的复合物的稳定性重要的位置。II类Cas9蛋白的温度敏感性变体可从任何亲本II类Cas9蛋白获得。优选地,从化脓链球菌Cas9(SEQ ID NO:2)获得温度敏感性变体。
II类Cas9蛋白的温度敏感性变体可以是切割酶或无效核酸酶变体。优选地,此类变体包含对应于SEQ ID NO:2的位置10和/或位置840的位置中的氨基酸改变。更优选地,此类变体包含天冬氨酸取代丙氨酸,D10A和/或组氨酸取代丙氨酸,H840A。
优选地,所述至少一个氨基酸改变发生在亲本II类Cas9蛋白质序列内的位置中,即所述至少一个氨基酸改变不是N-末端或C-末端延伸、插入或融合。
对II类Cas9蛋白稳定性或对II类Cas9蛋白、一个或多个gRNA和一个或多个基因组靶序列之间形成的复合物的稳定性重要的位置中的至少一个改变可以发生在选自由以下组成的组的位置中:SEQ ID NO:2的T13、N14、S29、K31、F32、L35、K44、N46、S55、E57、T62、R63、K65、R66、R69、R70、R71、Y72、R74、R75、R78、S104、F105、V107、E108、R115、H116、V126、H129、Y136、H160、K163、F164、R165、P176、S179、E223、N235、E260、D261、D269、T310、P316、Y325、H328、H329、K336、R340、Y347、F351、F352、I363、D364、R403、P411、Q413、I414、Y430、F432、I448、Y450、P454、L455、R457、N459、S460、R461、F462、R467、T472、F491、M495 N497、Y515、R557、G582、R653、T657、R661、Q695、H698、S719、L720、H721、K735、L738、K742、M751、R765 S777、E779、D850、Q894、E910、L911、F916、K918、Q920、T924、R925、Q926、K929、Q933、R951、S960、S964、K968、R976、V982、Y1013、G1030、A1032、K1085、M1089、P1090、Q1091、T1098、E1099、V1100、T1102、G1103、F1105、K1107 E1108、S1109、K1113、R11414、N1115、S1116、D1117、K1118、K1123、K1124、F1134、D1135、W1126、K1135、R1171、K1197、K1211、S1216、E1219、E1243、R1279、D1284、P1301、H1311、R1333、K1334、R1335、T1337、S1338、H1349、Y1356和T1358。
优选地,所述至少一个改变发生在对II类Cas9蛋白质-蛋白质相互作用重要的位置,包括但不限于对应于SEQ ID NO:2的P176、S179、E223、E260、D261、T310、P316、P411、Q413、I414、Y430、F432、R457、N459、R461、R557、R653、E910、L911、R951、K1123、W1126、P1301和H1311的位置。
还优选地,所述至少一个改变发生在对II类Cas9蛋白和一个或多个gRNA之间相互作用重要的位置中,包括但不限于:对应于SEQ ID NO:2的S29、K31、F32、L35、K44、N46、E57、T62、R63、K65、R66、R69、R70、R71、Y72、R74、R75、R78、S104、F105、V107、E108、R115、H116、V126、H129、Y136、H160、K163、F164、R165、Y325、H328、H329、K336、R340、Y347、F351、F352、I363、D364、R403、I448、P454、L455、R457、N459、S460、R461、F462、R467、T472、Y515、R661、S719、L720、H721、K735、L738、K742、M751、S777、E779、D850、K918、Q933、V982、K1085、M1089、P1090、Q1091、T1098、E1099、V1100、T1102、G1103、F1105、E1108、K1113、K1123、K1124、F1134、R1171、K1197、K1211、R1279、H1349、Y1356和T1358的位置。
还优选地,所述至少一个改变发生在对II类Cas9蛋白和一个或多个基因组靶序列之间相互作用重要的位置中,包括但不限于,对应于SEQ ID NO:2的T13、N14、S55、D269、Y450、F491、M495、N497、G582、T657、R661、Q695、H698、R765、S777、Q894、F916、K918、Q920、T924、R925、Q926、K929、S960、S964、K968、R976、Y1013、G1030、A1032、K1107、E1108、S1109、R1114、N1115、S1116、D1117、K1118、D1135、S1216、E1219、E1243、D1284、R1333、K1334、R1335、T1337和S1338的位置。
还优选地,所述至少一个改变发生在对II类Cas9蛋白质-蛋白质相互作用和/或对II类Cas9蛋白和一个或多个gRNA之间相互作用重要的位置中,包括但不限于,对应于SEQID NO:2的S29、K31、F32、L35、K44、N46、E57、T62、R63、K65、R66、R69、R70、R71、Y72、R74、R75、R78、S104、F105、V107、E108、R115、H116、V126、H129、Y136、H160、K163、F164、R165、P176、S179、E223、E260、D261、T310、P316、Y325、H328、H329、K336、R340、Y347、F351、F352、I363、D364、R403、P411、Q413、I414、Y430、F432、I448、P454、L455、R457、N459、S460、R461、F462、R467、T472、Y515、R557、R653、R661、S719、L720、H721、K735、L738、K742、M751、S777、E779、D850、E910、L911、K918、Q933、R951,V982、K1085、M1089、P1090、Q1091、T1098、E1099、V1100、T1102、G1103、F1105、E1108、K1113、K1123、K1124、F1134、W1126、R1171、K1197、K1211、R1279、P1301、H1311、H1349、Y1356和T1358的位置。
还优选地,所述至少一个改变发生在对II类Cas9蛋白质-蛋白质相互作用和/或对II类Cas9蛋白和一个或多个基因组靶序列之间相互作用重要的位置中,包括但不限于,对应于SEQ ID NO:2的T13、N14、S55、P176、S179、E223、E260、D261、D269、T310、P316、P411、Q413、I414、Y430、F432、Y450、R457、N459、R461、F491、M495、N497、R557、G582、R653、T657、R661、Q695、H698、R765、S777、Q894、E910、L911、F916、K918、Q920、T924、R925、Q926、K929、R951、S960、S964、K968、R976、Y1013、G1030、A1032、K1107、E1108、S1109、R1114、N1115、S1116、D1117、K1118、K1123、W1126、D1135、S1216、E1219、E1243、D1284、P1301、H1311、R1333、K1334、R1335、T1337和S1338的位置。
还优选地,所述至少一个改变发生在对II类Cas9蛋白和一个或多个gRNA之间相互作用和/或对II类Cas9蛋白和一个或多个基因组靶序列之间相互作用重要的位置中,包括但不限于,对应于SEQ ID NO:2的T13、N14、S29、K31、F32、L35、K44、N46、S55、E57、T62、R63、K65、R66、R69、R70、R71、Y72、R74、R75、R78、S104、F105、V107、E108、R115、H116、V126、H129、Y136、H160、K163、F164、R165、D269、Y325、H328、H329、K336、R340、Y347、F351、F352、I363、D364、R403、I448、Y450、P454、L455、R457、N459、S460、R461、F462、R467、T472、F491、M495、N497、Y515、G582、T657、R661、Q695、H698、S719、L720、H721、K735、L738、K742、M751、R765、S777、E779、D850、Q894、F916、K918、Q920、T924、R925、Q926、K929、Q933、S960、S964、K968、R976、V982、Y1013、G1030、A1032、K1085、M1089、P1090、Q1091、T1098、E1099、V1100、T1102、G1103、F1105、K1107、E1108、S1109、K1113、R1114、N1115、S1116、D1117、K1118、K1123、K1124、F1134、D1135、R1171、K1197、K1211、S1216、E1219、E1243、R1279、D1284、R1333、K1334、R1335、T1337、S1338、H1349、Y1356和T1358的位置。
更优选地,所述至少一个氨基酸改变发生在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的S104、F105、V107、P176、S179、E223、N235、E260、D261、T310、P316、P411、Q413、I414、Y430、F432、R457、N459、P475、W476、R557、R653、Q739、E910、L911、R951、K1123、W1126S和H1311;最优选地,所述至少一个改变是在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的S104、F105、V107、P176、S179、E223、E260、D261、T310、P316、P411、Q413、I414、Y430、F432、R457、N459、P475、W476、R557、R653、Q739、E910、L911、R951、K1123、W1126S和H1311。
所述至少一个氨基酸改变(发生在对II类Cas9蛋白稳定性或对II类Cas9蛋白、一个或多个gRNA和一个或多个基因组靶序列之间形成的复合物的稳定性重要的位置中)可以选自由以下组成的组:T13S、T13A、N14D、N14S、N14A、S29A、S29G、S29T、S29V、K31R、K31Q、K31H、K31M、K31L、F32Y、F32H、F32H、F32L、F32I、F32M、L35V、L35A、L35T、L35I、L35M、L35F、L35H、K44R、K44Q、K44H、K44M、K44L、K44D、K44N、K44H、K44M、K44L、N46D、N46S、N46T、N46Q、S55A、E57Q、E57D、E57N、E57H、T62S、T62A、T62V、T62P、R63K、R63H、R63Q、R63E、K65R、K65H、K65Q、K65M、K65L、R66K、R66H、R66Q、R66E、R69K、R69H、R69Q、R69E、R70K、R70H、R70Q、R70E、R71K、R71H、R71Q、R71E、Y72F、Y72H、Y72L、Y72M、Y72I、Y72W、R74K、R74H、R74Q、R74E、R75K、R75H、R75Q、R75E、R78K、R78H、R78Q、R78E、S104A、S104A、S104T、S104V、F105H、F105L、F105M、F105I、F105Y、F105W、V107S、V107A、V107I、V107L、V107T、E108Q、E108D、E108N、R115K、R115H、R115Q、R115E、H116F、H116Y、H116Q、H116E、H116N、H116D、H116S、H116T、V126I、V126L、V126A、V126T、V126S、H129F、H129Y、H129Q、H129E、H129N、H129D、H129S、H129T、Y136F、Y136H、Y136L、Y136M、Y136I、Y136W、H160F、H160Y、H160Q、H160E、H160N、H160D、H160S、H160T、K163R、K163H、K163Q、K163E、K163M、K163L、F164Y、F164H、F164M、F164L、F164I、F164W、R165K、R165H、R165Q、R165E、P176A、P176G、P176S、P176T、P176V、S179A、S179G、S179T、S179V、S179P、E223Q、E223D、E223N、E223H、E223S、E223A、E223I、E223L、E223T、E223V、E223P、E223K、E223Y、E223W、E223F、E223G、E223C、E223R、N235NGSGAGGSY、E260Q、E260S、D261N、D261S、D269N、D269S、D269A、T310A、T310G、P316G、P316D、Y325F、Y325H、Y325L、Y325M、Y325I、Y325W、H328F、H328Y、H328Q、H328E、H328N、H328D、H328S、H328T、H329F、H329Y、H329Q、H329E、H329N、H329D、H329S、H329T、K336R、K336H、K336M、K336L、R340K、R340H、R340Q、R340E、Y347F、Y347H、Y347M、Y347L、Y347I、F351H、F351Y、F351M、F351L、F351I、F351W、F352H、F352Y、F352M、F352L、F352I、F352W、I363F、I363L、I363M、I363V、I363A、I363T、D364E、D364Q、D364H、D364N、D364S、D364T、R403K、R403H、R403Q、R403E、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、I448L、I448M、I448V、I448A、Y450H、Y450L、Y450F、P454A、P454G、P454S、P454T、P454V、L455I、L455V、L455M、L455T、L455N、L455F、L455A、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、S460A、S460G、S460T、S460V、R461K、R461H、R461Q、R461E、R461S、F462Y、F462H、F462L、F462I、F462V、F462W、R467K、R467H、R467Q、R467E、T472A、T472P、T472S、T472V、F491H、F491L、M495K、M495Q、M495L、N497D、N497Q、N497E、N497S、Y515F、Y515H、Y515M、Y515L、R557K、R557S、G582A、G582S、G582T、G582V、R653H、R653N、T657S、T657A、T657N、R661K、R661H、R661Q、R661E、Q695E、Q695N、Q695D、H698F、H698Q、H698N、S719A、S719T、S719V、L720I、L720V、L720M、L720T、L720N、L720F、L720A、H721F、H721Y、H721Q、H721E、H721N、H721D、H721S、H721T、K735R、K735Q、K735H、K735M、K735L、L738I、L738V、L738M、L738T、L738N、L738F、L738A、K742R、K742Q、K742H、K742M、K742L、M751L、M751I、M751V、M751T、M751K、R765K、R765H、R765Q、S777A、S777N、S777D、E779Q、E779H、E779D、E779N、D850N、D850S、D850A、Q894E、Q894N、Q894S、E910Q、E910S、L911V、L911A、F916H、F916L、F916M、F916I、F916A、K918Q、K918R、K918H、K918M、K918L、Q920E、Q920N、Q920S、Q920A、T924S、T924A、R925K、R925H、R925Q、Q926K、Q926E、Q926N、Q926D、K929R、K929H、K929Q、Q933E、Q933H、Q933K、Q933N、R951Q、R951S、S960A、S964A、K968Q、K968H、K968M、K968L、R976K、R976Q、R976H、V982A、V982T、V982L、V982I、Y1013F、Y1013H、G1030A、G1030S、G1030T、G1030V、A1032G、A1032S、A1032T、A1032V、K1085R、K1085Q、K1085H、K1085M、K1085L、M1089L、M1089I、M1089V、M1089T、M1089K、P1090A、P1090G、P1090S、P1090T、P1090V、Q1091D、Q1091S、Q1091E、Q1091H、Q1091K、Q1091N、T1098A、T1098P、T1098S、T1098V、E1099、E1099Q、E1099D、E1099N、E1099H、V1100A、V1100G、V1100T、V1100S、V1100I、V1100L、T1102A、T1102P、T1102S、T1102V、G1103A、G1103P、G1103S、F1105Y、F1105H、F1105L、F1105I、F1105V、F1105W、K1107R、K1107Q、K1107M、E1108Q、E1108D、E1108N、S1109A、S1109T、S1109N、S1109D、K1113R、K1113Q、K1113H、K1113M、K1113L、R1114K、R1114Q、R1114H、N1115D、N1115A、N1115S、S1116A、D1117N、D1117S、D1117A、K1118Q、K1118H、K1118M、K1118L、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、K1124R、K1124Q、K1124H、K1124M、K1124L、W1126Y、W1126S、F1134Y、F1134H、F1134L、F1134I、F1134V、F1134W、D1135N、D1135S、D1135A、R1171K、R1171H、R1171Q、R1171E、K1197R、K1197Q、K1197H、K1197M、K1197L、K1211R、K1211Q、K1211H、K1211M、K1211L、S1216A、E1219Q、E1219D、E1219N、E1243Q、E1243D、E1243N、E1243S、E1243A、R1279K、R1279H、R1279Q、R1279E、D1284N、D1284S、D1284A、P1301S、P1301G、H1311Y、H1311S、R1333K、R1333Q、R1333H、K1334R、K1334Q、K1334M、K1334L、R1335K、R1335Q、R1335H、T1337A、T1337S、S1338A、H1349F、H1349Y、H1349Q、H1349E、H1349N、H1349D、H1349S、H1349T、Y1356F、Y1356W、Y1356H、Y1356Q、Y1356E、Y1356N、Y1356D、Y1356S、Y1356T、T1358A、T1358P、T1358S和T1358V。
优选地,所述至少一个氨基酸改变发生在对II类Cas9蛋白质-蛋白质相互作用重要的位置中并且选自由以下组成的组:P176A、P176G、P176S、P176T、P176V、S179A、S179G、S179T、S179V、S179P、E223Q、E223D、E223N、E223H、E223S、E223A、E223I、E223L、E223T、E223V、E223P、E223K、E223Y、E223W、E223F、E223G、E223C、E223R、E260Q、E260S、D261N、D261S、T310A、T310G、P316G、P316D、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、R461K、R461H、R461Q、R461E、R461S、R557K、R557S、R653H、R653N、E910Q、E910S、L911V、L911A、R951Q、R951S、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、P1301S、P1301G、H1311Y和H1311S。
还优选地,所述至少一个氨基酸改变发生在对II类Cas9蛋白和一个或多个gRNA之间相互作用重要的位置中并且选自由以下组成的组:S29A、S29G、S29T、S29V、K31R、K31Q、K31H、K31M、K31L、F32Y、F32H、F32H、F32L、F32I、F32M、L35V、L35A、L35T、L35I、L35M、L35F、L35H、K44R、K44Q、K44H、K44M、K44L、E57Q、K44D、K44N、K44H、K44M、K44L、N46D、N46S、N46T、N46Q、E57Q、E57D、E57N、E57H、T62S、T62A、T62V、T62P、R63K、R63H、R63Q、R63E、K65R、K65H、K65Q、K65M、K65L、R66K、R66H、R66Q、R66E、R69K、R69H、R69Q、R69E、R70K、R70H、R70Q、R70E、R71K、R71H、R71Q、R71E、Y72F、Y72H、Y72L、Y72M、Y72I、Y72W、R74K、R74H、R74Q、R74E、R75K、R75H、R75Q、R75E、R78K、R78H、R78Q、R78E、S104A、S104A、S104T、S104V、F105H、F105L、F105M、F105I、F105Y、F105W、V107S、V107A、V107I、V107L、V107T、E108Q、E108D、E108N、R115K、R115H、R115Q、R115E、H116F、H116Y、H116Q、H116E、H116N、H116D、H116S、H116T、V126I、V126L、V126A、V126T、V126S、H129F、H129Y、H129Q、H129E、H129N、H129D、H129S、H129T、Y136F、Y136H、Y136L、Y136M、Y136I、Y136W、H160F、H160Y、H160Q、H160E、H160N、H160D、H160S、H160T、K163R、K163H、K163Q、K163E、K163M、K163L、F164Y、F164H、F164M、F164L、F164I、F164W、R165K、R165H、R165Q、R165E、Y325F、Y325H、Y325L、Y325M、Y325I、Y325W、H328F、H328Y、H328Q、H328E、H328N、H328D、H328S、H328T、H329F、H329Y、H329Q、H329E、H329N、H329D、H329S、H329T、K336R、K336H、K336M、K336L、R340K、R340H、R340Q、R340E、Y347F、Y347H、Y347M、Y347L、Y347I、F351H、F351Y、F351M、F351L、F351I、F351W、F352H、F352Y、F352M、F352L、F352I、F352W、I363F、I363L、I363M、I363V、I363A、I363T、D364E、D364Q、D364H、D364N、D364S、D364T、R403K、R403H、R403Q、R403E、I448L、I448M、I448V、I448A、P454A、P454G、P454S、P454T、P454V、L455I、L455V、L455M、L455T、L455N、L455F、L455A、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、S460A、S460G、S460T、S460V、R461K、R461H、R461Q、R461E、R461S、F462Y、F462H、F462L、F462I、F462V、F462W、R467K、R467H、R467Q、R467E、T472A、T472P、T472S、T472V、Y515F、Y515H、Y515M、Y515L、R661K、R661H、R661Q、R661E、S719A、S719T、S719V、L720I、L720V、L720M、L720T、L720N、L720F、L720A、H721F、H721Y、H721Q、H721E、H721N、H721D、H721S、H721T、K735R、K735Q、K735H、K735M、K735L、L738I、L738V、L738M、L738T、L738N、L738F、L738A、K742R、K742Q、K742H、K742M、K742L、M751L、M751I、M751V、M751T、M751K、S777A、S777N、S777D、E779Q、E779H、E779D、E779N、D850N、D850S、D850A、K918Q、K918R、K918H、K918M、K918L、Q933E、Q933H、Q933K、Q933N、V982A、V982T、V982L、V982I、K1085R、K1085Q、K1085H、K1085M、K1085L、M1089L、M1089I、M1089V、M1089T、M1089K、P1090A、P1090G、P1090S、P1090T、P1090V、Q1091D、Q1091S、Q1091E、Q1091H、Q1091K、Q1091N、T1098A、T1098P、T1098S、T1098V、E1099、E1099Q、E1099D、E1099N、E1099H、V1100A、V1100G、V1100T、V1100S、V1100I、V1100L、T1102A、T1102P、T1102S、T1102V、G1103A、G1103P、G1103S、F1105Y、F1105H、F1105L、F1105I、F1105V、F1105W、E1108Q、E1108D、E1108N、K1113R、K1113Q、K1113H、K1113M、K1113L、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、K1124R、K1124Q、K1124H、K1124M、K1124L、F1134Y、F1134H、F1134L、F1134I、F1134V、F1134W、R1171K、R1171H、R1171Q、R1171E、K1197R、K1197Q、K1197H、K1197M、K1197L、K1211R、K1211Q、K1211H、K1211M、K1211L、R1279K、R1279H、R1279Q、R1279E、H1349F、H1349Y、H1349Q、H1349E、H1349N、H1349D、H1349S、H1349T、Y1356F、Y1356W、Y1356H、Y1356Q、Y1356E、Y1356N、Y1356D、Y1356S、Y1356T、T1358A、T1358P、T1358S和T1358V。
还优选地,所述至少一个氨基酸改变发生在对II类Cas9蛋白和一个或多个基因组靶序列之间相互作用重要的位置中并且选自由以下组成的组:T13S、T13A、N14D、N14S、N14A、S55A、D269N、D269S、D269A、Y450H、Y450L、Y450F、F491H、F491L、M495K、M495Q、M495L、N497D、N497Q、N497E、N497S、G582A、G582S、G582T、G582V、T657S、T657A、T657N、R661K、R661H、R661Q、R661E、Q695E、Q695N、Q695D、H698F、H698Q、H698N、R765K、R765H、R765Q、S777A、S777N、S777D、Q894E、Q894N、Q894S、F916H、F916L、F916M、F916I、F916A、K918Q、K918R、K918H、K918M、K918L、Q920E、Q920N、Q920S、Q920A、T924S、T924A、R925K、R925H、R925Q、Q926K、Q926E、Q926N、Q926D、K929R、K929H、K929Q、S960A、S964A、K968Q、K968H、K968M、K968L、R976K、R976Q、R976H、Y1013F、Y1013H、G1030A、G1030S、G1030T、G1030V、A1032G、A1032S、A1032T、A1032V、K1107R、K1107Q、K1107M、E1108Q、E1108D、E1108N、S1109A、S1109T、S1109N、S1109D、R1114K、R1114Q、R1114H、N1115D、N1115A、N1115S、S1116A、D1117N、D1117S、D1117A、K1118Q、K1118H、K1118M、K1118L、D1135N、D1135S、D1135A、S1216A、E1219Q、E1219D、E1219N、E1243Q、E1243D、E1243N、E1243S、E1243A、D1284N、D1284S、D1284A、R1333K、R1333Q、R1333H、K1334R、K1334Q、K1334M、K1334L、R1335K、R1335Q、R1335H、T1337A、T1337S和S1338A。
还优选地,所述至少一个氨基酸改变发生在对II类Cas9蛋白质-蛋白质相互作用重要的位置中和/或对II类Cas9蛋白和一个或多个gRNA之间相互作用重要的位置中,所述改变选自由以下组成的组:S29A、S29G、S29T、S29V、K31R、K31Q、K31H、K31M、K31L、F32Y、F32H、F32H、F32L、F32I、F32M、L35V、L35A、L35T、L35I、L35M、L35F、L35H、K44R、K44Q、K44H、K44M、K44L、E57Q、K44D、K44N、K44H、K44M、K44L、N46D、N46S、N46T、N46Q、E57Q、E57D、E57N、E57H、T62S、T62A、T62V、T62P、R63K、R63H、R63Q、R63E、K65R、K65H、K65Q、K65M、K65L、R66K、R66H、R66Q、R66E、R69K、R69H、R69Q、R69E、R70K、R70H、R70Q、R70E、R71K、R71H、R71Q、R71E、Y72F、Y72H、Y72L、Y72M、Y72I、Y72W、R74K、R74H、R74Q、R74E、R75K、R75H、R75Q、R75E、R78K、R78H、R78Q、R78E、S104A、S104A、S104T、S104V、F105H、F105L、F105M、F105I、F105Y、F105W、V107S、V107A、V107I、V107L、V107T、E108Q、E108D、E108N、R115K、R115H、R115Q、R115E、H116F、H116Y、H116Q、H116E、H116N、H116D、H116S、H116T、V126I、V126L、V126A、V126T、V126S、H129F、H129Y、H129Q、H129E、H129N、H129D、H129S、H129T、Y136F、Y136H、Y136L、Y136M、Y136I、Y136W、H160F、H160Y、H160Q、H160E、H160N、H160D、H160S、H160T、K163R、K163H、K163Q、K163E、K163M、K163L、F164Y、F164H、F164M、F164L、F164I、F164W、R165K、R165H、R165Q、R165E、P176A、P176G、P176S、P176T、P176V、S179A、S179G、S179T、S179V、S179P、E223Q、E223D、E223N、E223H、E223S、E223A、E223I、E223L、E223T、E223V、E223P、E223K、E223Y、E223W、E223F、E223G、E223C、E223R、E260Q、E260S、D261N、D261S、T310A、T310G、P316G、P316D、Y325F、Y325H、Y325L、Y325M、Y325I、Y325W、H328F、H328Y、H328Q、H328E、H328N、H328D、H328S、H328T、H329F、H329Y、H329Q、H329E、H329N、H329D、H329S、H329T、K336R、K336H、K336M、K336L、R340K、R340H、R340Q、R340E、Y347F、Y347H、Y347M、Y347L、Y347I、F351H、F351Y、F351M、F351L、F351I、F351W、F352H、F352Y、F352M、F352L、F352I、F352W、I363F、I363L、I363M、I363V、I363A、I363T、D364E、D364Q、D364H、D364N、D364S、D364T、R403K、R403H、R403Q、R403E、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、I448L、I448M、I448V、I448A、P454A、P454G、P454S、P454T、P454V、L455I、L455V、L455M、L455T、L455N、L455F、L455A、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、S460A、S460G、S460T、S460V、R461K、R461H、R461Q、R461E、R461S、F462Y、F462H、F462L、F462I、F462V、F462W、R467K、R467H、R467Q、R467E、T472A、T472P、T472S、T472V、Y515F、Y515H、Y515M、Y515L、R557K、R557S、R653H、R653N、R661K、R661H、R661Q、R661E、S719A、S719T、S719V、L720I、L720V、L720M、L720T、L720N、L720F、L720A、H721F、H721Y、H721Q、H721E、H721N、H721D、H721S、H721T、K735R、K735Q、K735H、K735M、K735L、L738I、L738V、L738M、L738T、L738N、L738F、L738A、K742R、K742Q、K742H、K742M、K742L、M751L、M751I、M751V、M751T、M751K、S777A、S777N、S777D、E779Q、E779H、E779D、E779N、D850N、D850S、D850A、E910Q、E910S、L911V、L911A、K918Q、K918R、K918H、K918M、K918L、Q933E、Q933H、Q933K、Q933N、R951Q、R951S、V982A、V982T、V982L、V982I、K1085R、K1085Q、K1085H、K1085M、K1085L、M1089L、M1089I、M1089V、M1089T、M1089K、P1090A、P1090G、P1090S、P1090T、P1090V、Q1091D、Q1091S、Q1091E、Q1091H、Q1091K、Q1091N、T1098A、T1098P、T1098S、T1098V、E1099、E1099Q、E1099D、E1099N、E1099H、V1100A、V1100G、V1100T、V1100S、V1100I、V1100L、T1102A、T1102P、T1102S、T1102V、G1103A、G1103P、G1103S、F1105Y、F1105H、F1105L、F1105I、F1105V、F1105W、E1108Q、E1108D、E1108N、K1113R、K1113Q、K1113H、K1113M、K1113L、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、K1124R、K1124Q、K1124H、K1124M、K1124L、F1134Y、F1134H、F1134L、F1134I、F1134V、F1134W、R1171K、R1171H、R1171Q、R1171E、K1197R、K1197Q、K1197H、K1197M、K1197L、K1211R、K1211Q、K1211H、K1211M、K1211L、R1279K、R1279H、R1279Q、R1279E、P1301S、P1301G、H1311Y、H1311S、H1349F、H1349Y、H1349Q、H1349E、H1349N、H1349D、H1349S、H1349T、Y1356F、Y1356W、Y1356H、Y1356Q、Y1356E、Y1356N、Y1356D、Y1356S、Y1356T、T1358A、T1358P、T1358S和T1358V。
还优选地,所述至少一个氨基酸改变发生在对II类Cas9蛋白质-蛋白质相互作用重要的位置中和/或对II类Cas9蛋白和一个或多个基因组靶序列之间相互作用重要的位置中,所述改变选自由以下组成的组:T13S、T13A、N14D、N14S、N14A、S55A、P176A、P176G、P176S、P176T、P176V、S179A、S179G、S179T、S179V、S179P、E223Q、E223D、E223N、E223H、E223S、E223A、E223I、E223L、E223T、E223V、E223P、E223K、E223Y、E223W、E223F、E223G、E223C、E223R、E260Q、E260S、D261N、D261S、D269N、D269S、D269A、T310A、T310G、P316G、P316D、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、Y450H、Y450L、Y450F、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、R461K、R461H、R461Q、R461E、R461S、F491H、F491L、M495K、M495Q、M495L、N497D、N497Q、N497E、N497S、R557K、R557S、G582A、G582S、G582T、G582V、R653H、R653N、T657S、T657A、T657N、R661K、R661H、R661Q、R661E、Q695E、Q695N、Q695D、H698F、H698Q、H698N、R765K、R765H、R765Q、S777A、S777N、S777D、Q894E、Q894N、Q894S、E910Q、E910S、L911V、L911A、F916H、F916L、F916M、F916I、F916A、K918Q、K918R、K918H、K918M、K918L、Q920E、Q920N、Q920S、Q920A、T924S、T924A、R925K、R925H、R925Q、Q926K、Q926E、Q926N、Q926D、K929R、K929H、K929Q、R951Q、R951S、S960A、S964A、K968Q、K968H、K968M、K968L、R976K、R976Q、R976H、Y1013F、Y1013H、G1030A、G1030S、G1030T、G1030V、A1032G、A1032S、A1032T、A1032V、K1107R、K1107Q、K1107M、E1108Q、E1108D、E1108N、S1109A、S1109T、S1109N、S1109D、R1114K、R1114Q、R1114H、N1115D、N1115A、N1115S、S1116A、D1117N、D1117S、D1117A、K1118Q、K1118H、K1118M、K1118L、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、D1135N、D1135S、D1135A、S1216A、E1219Q、E1219D、E1219N、E1243Q、E1243D、E1243N、E1243S、E1243A、D1284N、D1284S、D1284A、P1301S、P1301G、H1311Y、H1311S、R1333K、R1333Q、R1333H、K1334R、K1334Q、K1334M、K1334L、R1335K、R1335Q、R1335H、T1337A、T1337S和S1338A。
还优选地,所述至少一个氨基酸改变发生在对II类Cas9蛋白和一个或多个gRNA之间相互作用重要的位置中和/或对II类Cas9蛋白和一个或多个基因组靶序列之间相互作用重要的位置中,所述改变选自由以下组成的组:T13S、T13A、N14D、N14S、N14A、S29A、S29G、S29T、S29V、K31R、K31Q、K31H、K31M、K31L、F32Y、F32H、F32H、F32L、F32I、F32M、L35V、L35A、L35T、L35I、L35M、L35F、L35H、K44R、K44Q、K44H、K44M、K44L、E57Q、K44D、K44N、K44H、K44M、K44L、N46D、N46S、N46T、N46Q、S55A、E57Q、E57D、E57N、E57H、T62S、T62A、T62V、T62P、R63K、R63H、R63Q、R63E、K65R、K65H、K65Q、K65M、K65L、R66K、R66H、R66Q、R66E、R69K、R69H、R69Q、R69E、R70K、R70H、R70Q、R70E、R71K、R71H、R71Q、R71E、Y72F、Y72H、Y72L、Y72M、Y72I、Y72W、R74K、R74H、R74Q、R74E、R75K、R75H、R75Q、R75E、R78K、R78H、R78Q、R78E、S104A、S104A、S104T、S104V、F105H、F105L、F105M、F105I、F105Y、F105W、V107S、V107A、V107I、V107L、V107T、E108Q、E108D、E108N、R115K、R115H、R115Q、R115E、H116F、H116Y、H116Q、H116E、H116N、H116D、H116S、H116T、V126I、V126L、V126A、V126T、V126S、H129F、H129Y、H129Q、H129E、H129N、H129D、H129S、H129T、Y136F、Y136H、Y136L、Y136M、Y136I、Y136W、H160F、H160Y、H160Q、H160E、H160N、H160D、H160S、H160T、K163R、K163H、K163Q、K163E、K163M、K163L、F164Y、F164H、F164M、F164L、F164I、F164W、R165K、R165H、R165Q、R165E、D269N、D269S、D269A、Y325F、Y325H、Y325L、Y325M、Y325I、Y325W、H328F、H328Y、H328Q、H328E、H328N、H328D、H328S、H328T、H329F、H329Y、H329Q、H329E、H329N、H329D、H329S、H329T、K336R、K336H、K336M、K336L、R340K、R340H、R340Q、R340E、Y347F、Y347H、Y347M、Y347L、Y347I、F351H、F351Y、F351M、F351L、F351I、F351W、F352H、F352Y、F352M、F352L、F352I、F352W、I363F、I363L、I363M、I363V、I363A、I363T、D364E、D364Q、D364H、D364N、D364S、D364T、R403K、R403H、R403Q、R403E、I448L、I448M、I448V、I448A、Y450H、Y450L、Y450F、P454A、P454G、P454S、P454T、P454V、L455I、L455V、L455M、L455T、L455N、L455F、L455A、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、S460A、S460G、S460T、S460V、R461K、R461H、R461Q、R461E、R461S、F462Y、F462H、F462L、F462I、F462V、F462W、R467K、R467H、R467Q、R467E、T472A、T472P、T472S、T472V、F491H、F491L、M495K、M495Q、M495L、N497D、N497Q、N497E、N497S、Y515F、Y515H、Y515M、Y515L、G582A、G582S、G582T、G582V、T657S、T657A、T657N、R661K、R661H、R661Q、R661E、Q695E、Q695N、Q695D、H698F、H698Q、H698N、S719A、S719T、S719V、L720I、L720V、L720M、L720T、L720N、L720F、L720A、H721F、H721Y、H721Q、H721E、H721N、H721D、H721S、H721T、K735R、K735Q、K735H、K735M、K735L、L738I、L738V、L738M、L738T、L738N、L738F、L738A、K742R、K742Q、K742H、K742M、K742L、M751L、M751I、M751V、M751T、M751K、R765K、R765H、R765Q、S777A、S777N、S777D、E779Q、E779H、E779D、E779N、D850N、D850S、D850A、Q894E、Q894N、Q894S、F916H、F916L、F916M、F916I、F916A、K918Q、K918R、K918H、K918M、K918L、Q920E、Q920N、Q920S、Q920A、T924S、T924A、R925K、R925H、R925Q、Q926K、Q926E、Q926N、Q926D、K929R、K929H、K929Q、Q933E、Q933H、Q933K、Q933N、S960A、S964A、K968Q、K968H、K968M、K968L、R976K、R976Q、R976H、V982A、V982T、V982L、V982I、Y1013F、Y1013H、G1030A、G1030S、G1030T、G1030V、A1032G、A1032S、A1032T、A1032V、K1085R、K1085Q、K1085H、K1085M、K1085L、M1089L、M1089I、M1089V、M1089T、M1089K、P1090A、P1090G、P1090S、P1090T、P1090V、Q1091D、Q1091S、Q1091E、Q1091H、Q1091K、Q1091N、T1098A、T1098P、T1098S、T1098V、E1099、E1099Q、E1099D、E1099N、E1099H、V1100A、V1100G、V1100T、V1100S、V1100I、V1100L、T1102A、T1102P、T1102S、T1102V、G1103A、G1103P、G1103S、F1105Y、F1105H、F1105L、F1105I、F1105V、F1105W、K1107R、K1107Q、K1107M、E1108Q、E1108D、E1108N、S1109A、S1109T、S1109N、S1109D、K1113R、K1113Q、K1113H、K1113M、K1113L、R1114K、R1114Q、R1114H、N1115D、N1115A、N1115S、S1116A、D1117N、D1117S、D1117A、K1118Q、K1118H、K1118M、K1118L、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、K1124R、K1124Q、K1124H、K1124M、K1124L、F1134Y、F1134H、F1134L、F1134I、F1134V、F1134W、D1135N、D1135S、D1135A、R1171K、R1171H、R1171Q、R1171E、K1197R、K1197Q、K1197H、K1197M、K1197L、K1211R、K1211Q、K1211H、K1211M、K1211L、S1216A、E1219Q、E1219D、E1219N、E1243Q、E1243D、E1243N、E1243S、E1243A、R1279K、R1279H、R1279Q、R1279E、D1284N、D1284S、D1284A、R1333K、R1333Q、R1333H、K1334R、K1334Q、K1334M、K1334L、R1335K、R1335Q、R1335H、T1337A、T1337S、S1338A、H1349F、H1349Y、H1349Q、H1349E、H1349N、H1349D、H1349S、H1349T、Y1356F、Y1356W、Y1356H、Y1356Q、Y1356E、Y1356N、Y1356D、Y1356S、Y1356T、T1358A、T1358P、T1358S和T1358V。
更优选地,所述至少一个氨基酸改变选自由以下组成的组:S104A、F105H、V107S、P176S、S179A、E223A、N235NGSGAGGSY、E260Q、D261N、T310A、T310G、P316G、P316D、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、R457K、N459S、P475S、W476H、R557K、R653H、Q739S、E910S、L911A、R951Q、K1123S、W1126S和H1311Y;最优选地,所述至少一个氨基酸改变选自由以下组成的组:S104A、F105H、V107S、P176S、S179A、E223A、E260Q、D261N、T310A、T310G、P316G、P316D、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、R457K、N459S、P475S、W476H、R557K、R653H、Q739S、E910S、L911A、R951Q、K1123S、W1126S和H1311Y。
甚至更优选地,所述至少一个氨基酸改变包括N235NGSGAGGSY;S104A、F105H和V107S;P176S和S179A;E223A;T310A和P316G;P411A、Q413N和I414V;P411A、Q413N、I414V、R457K和N495S;Y430F和F432H;R457K和N495S;P475S和W476H;R557K;R653H;R951Q;S104A、F105H、V107S、P176S、S179A、E223S、E260Q、D261N、R653H、Q739S和H1311Y;S104A、F105H、V107S、E260Q、D261N、T310A、P316G、Y430F、F432H、Q739S和H1311Y;S104A、F105H、V107S、T310A、P316G、Q739S和R951Q;S104A、F105H、V107S、E260Q、D261N、Y430F、F432H和Q739S;S104A、F105H、V107S、Q739S、R951Q和H1311Y;S104A、F105H、V107S、P411A、Q413N和I414V;S104A、F105H、V107S、P411A、Q413N、I414V、R457K和N459S;T310G P316D;P411G、Q413A和I414A;Y430V和F432V;E910S和L911A;以及K1123S和W1126S;最优选地,所述至少一个氨基酸改变包括S104A、F105H和V107S;P176S和S179A;E223A;T310A和P316G;P411A、Q413N和I414V;P411A、Q413N、I414V、R457K和N495S;Y430F和F432H;R457K和N495S;P475S和W476H;R557K;R653H;R951Q;S104A、F105H、V107S、P176S、S179A、E223S、E260Q、D261N、R653H、Q739S和H1311Y;S104A、F105H、V107S、E260Q、D261N、T310A、P316G、Y430F、F432H、Q739S和H1311Y;S104A、F105H、V107S、T310A、P316G、Q739S和R951Q;S104A、F105H、V107S、E260Q、D261N、Y430F、F432H和Q739S;S104A、F105H、V107S、Q739S、R951Q和H1311Y;S104A、F105H、V107S、P411A、Q413N和I414V;S104A、F105H、V107S、P411A、Q413N、I414V、R457K和N459S;T310GP316D;P411G、Q413A和I414A;Y430V和F432V;E910S和L911A;以及K1123S和W1126S。
优选地,所述至少一个氨基酸改变包括N235NGSGAGGSY。
优选地,所述至少一个氨基酸改变包括S104A、F105H和V107S。
优选地,所述至少一个氨基酸改变包括P176S和S179A。
优选地,所述至少一个氨基酸改变包括E223A。
优选地,所述至少一个氨基酸改变包括T310A和P316G。
优选地,所述至少一个氨基酸改变包括P411A、Q413N和I414V。
优选地,所述至少一个氨基酸改变包括P411A、Q413N、I414V、R457K和N495S。
优选地,所述至少一个氨基酸改变包括Y430F和F432H。
优选地,所述至少一个氨基酸改变包括R457K和N495S。
优选地,所述至少一个氨基酸改变包括P475S和W476H。
优选地,所述至少一个氨基酸改变包括R557K。
优选地,所述至少一个氨基酸改变包括R653H。
优选地,所述至少一个氨基酸改变包括R951Q。
优选地,所述至少一个氨基酸改变包括S104A、F105H、V107S、P176S、S179A、E223S、E260Q、D261N、R653H、Q739S和H1311Y。
优选地,所述至少一个氨基酸改变包括S104A、F105H、V107S、E260Q、D261N、T310A、P316G、Y430F、F432H、Q739S和H1311Y。
优选地,所述至少一个氨基酸改变包括S104A、F105H、V107S、T310A、P316G、Q739S和R951Q。
优选地,所述至少一个氨基酸改变包括S104A、F105H、V107S、E260Q、D261N、Y430F、F432H和Q739S。
优选地,所述至少一个氨基酸改变包括S104A、F105H、V107S、Q739S、R951Q和H1311Y。
优选地,所述至少一个氨基酸改变包括S104A、F105H、V107S、P411A、Q413N和I414V。
优选地,所述至少一个氨基酸改变包括S104A、F105H、V107S、P411A、Q413N、I414V、R457K和N459S。
优选地,所述至少一个氨基酸改变包括T310G和P316D。
优选地,所述至少一个氨基酸改变包括P411G、Q413A和I414A。
优选地,所述至少一个氨基酸改变包括Y430V和F432V。
优选地,所述至少一个氨基酸改变包括E910S和L911A。
优选地,所述至少一个氨基酸改变包括K1123S和W1126S;
本发明的温度敏感性变体的特征在于许可温度或温度范围,其中所述变体表现为野生型蛋白并且能够与一个或多个gRNA和一个或多个目的基因组靶序列形成复合物,并且特征在于限制性温度或温度范围,其中所述变体呈现突变表型并且不能与一个或多个gRNA和一个或多个目的基因组靶序列形成复合物。许可和限制性温度或温度范围取决于给定tsCas9的热稳定性和给定宿主细胞的温度要求。通常,许可温度和限制性温度在从25℃至45℃的范围内。优选地,许可温度和限制性温度或温度范围应分开至少1℃。可替代地,许可温度和限制性温度范围可以重叠。
取决于宿主细胞,许可温度可以是选自以下的温度:25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃和45℃。
许可温度还可以是选自以下的温度范围:25-28℃、26-29℃、27-30℃、28-31℃、29-32℃、30-33℃、31-34℃、32-35℃、33-36℃、34-37℃、35-38℃、36-39℃、37-40℃、38-41℃、39-42℃、40-43℃、41-44℃和42-45℃。
许可温度还可以是选自以下的温度范围:25-29℃、26-30℃、27-31℃、28-32℃、29-33℃、30-34℃、31-35℃、32-36℃、33-37℃、34-38℃、35-39℃、36-40℃、37-41℃、38-42℃、39-43℃、40-44℃、41-45℃。
许可温度还可以是选自以下的温度范围:25-30℃、26-31℃、27-32℃、28-33℃、29-34℃、30-35℃、31-36℃、32-37℃、33-38℃、34-39℃、35-40℃、36-41℃、37-42℃、38-42℃、39-44℃和40-45℃。
许可温度还可以是选自以下的温度范围:25-31℃、26-32℃、27-33℃、28-34℃、29-35℃、30-36℃、31-37℃、32-38℃、33-39℃、34-40℃、35-41℃、36-42℃、37-43℃、38-44℃和39-45℃。
许可温度还可以是选自以下的温度范围:25-32℃、26-33℃、27-34℃、28-35℃、29-36℃、30-37℃、31-38℃、32-39℃、33-40℃、34-41℃、35-42℃、36-43℃、37-44℃和38-45℃。
许可温度还可以是选自以下的温度范围:25-33℃、26-34℃、27-35℃、28-36℃、29-37℃、30-38℃、31-39℃、32-40℃、33-41℃、34-42℃、35-43℃、36-44℃和37-45℃。
许可温度还可以是选自以下的温度范围:25-34℃、26-35℃、27-36℃、28-37℃、29-38℃、30-39℃、31-40℃、32-41℃、33-42℃、34-43℃、35-44℃和36-45℃。
许可温度还可以是选自以下的温度范围:25-35℃、26-36℃、27-37℃、28-38℃、29-39℃、30-40℃、31-41℃、32-42℃、33-43℃、34-44℃和35-45℃。
对于芽胞杆菌属(Bacillus)宿主细胞,许可温度范围选自:30-32℃、30-33℃、29-32℃、30-34℃、29-33℃、30-35℃、29-34℃、30-36℃、28-34℃、31-35℃、28-35℃、26-34℃和27-34℃。优选地,许可温度范围选自:30-32℃、29.5-32.5℃、29-33℃、28.5-33.5℃、28-34℃、27.5-34.5℃、27-35℃、26.5-35.5℃和26-36℃。更优选地,许可温度范围选自:29-33℃、28.5-33.5℃、28-34℃、27.5-34.5℃和27-35℃。甚至更优选地,许可温度范围选自:28.5-33.5℃、28-34℃和27.5-34.5℃。最优选地,所述许可温度范围是28-34℃。
取决于宿主细胞,限制性温度可以是选自以下的温度:25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃和45℃。
限制性温度还可以是选自以下的温度范围:25-28℃、26-29℃、27-30℃、28-31℃、29-32℃、30-33℃、31-34℃、32-35℃、33-36℃、34-37℃、35-38℃、36-39℃、37-40℃、38-41℃、39-42℃、40-43℃、41-44℃和42-45℃。
限制性温度还可以是选自以下的温度范围:25-29℃、26-30℃、27-31℃、28-32℃、29-33℃、30-34℃、31-35℃、32-36℃、33-37℃、34-38℃、35-39℃、36-40℃、37-41℃、38-42℃、39-43℃、40-44℃、41-45℃。
限制性温度还可以是选自以下的温度范围:25-30℃、26-31℃、27-32℃、28-33℃、29-34℃、30-35℃、31-36℃、32-37℃、33-38℃、34-39℃、35-40℃、36-41℃、37-42℃、38-42℃、39-44℃和40-45℃。
限制性温度还可以是选自以下的温度范围:25-31℃、26-32℃、27-33℃、28-34℃、29-35℃、30-36℃、31-37℃、32-38℃、33-39℃、34-40℃、35-41℃、36-42℃、37-43℃、38-44℃和39-45℃。
限制性温度还可以是选自以下的温度范围:25-32℃、26-33℃、27-34℃、28-35℃、29-36℃、30-37℃、31-38℃、32-39℃、33-40℃、34-41℃、35-42℃、36-43℃、37-44℃和38-45℃。
限制性温度还可以是选自以下的温度范围:25-33℃、26-34℃、27-35℃、28-36℃、29-37℃、30-38℃、31-39℃、32-40℃、33-41℃、34-42℃、35-43℃、36-44℃和37-45℃。
限制性温度还可以是选自以下的温度范围:25-34℃、26-35℃、27-36℃、28-37℃、29-38℃、30-39℃、31-40℃、32-41℃、33-42℃、34-43℃、35-44℃和36-45℃。
限制性温度还可以是选自以下的温度范围:25-35℃、26-36℃、27-37℃、28-38℃、29-39℃、30-40℃、31-41℃、32-42℃、33-43℃、34-44℃和35-45℃。
对于芽胞杆菌属宿主细胞,限制性温度范围选自:38-40℃、38-41℃、37-40℃、38-42℃、37-41℃、37-42℃、36-40℃、36-41℃、36-42℃和35-43℃。优选地,限制性温度范围选自:39-40℃、38.5-41.5℃、38-42℃、37.5-42℃、38-42.5℃、36.5-41.5℃、36.5-42℃、37-42℃、37-42.5℃和36-43℃。更优选地,限制性温度范围选自:38-42℃、37.5-42℃、38-42.5℃、36.5-41.5℃、36.5-42℃、37-42℃、37-42.5℃、36-43℃和36-44℃。甚至更优选地,限制性温度范围选自:36.5-41.5℃、36.5-42℃、37-42℃和37-42.5℃。最优选地,所述限制性温度范围是37-42℃。
在优选的实施例中,许可温度是28-34℃,并且限制性温度是37-42℃。
此外,在优选的实施例中,许可温度是28-34℃,并且限制性温度是37-44℃。
此外,在优选的实施例中,许可温度是27-36℃,并且限制性温度是37-42℃。
此外,在优选的实施例中,许可温度是27-36℃,并且限制性温度是37-44℃。
本发明的tsCas9的特征进一步在于解离温度或温度范围,其中tsCas9、一个或多个gRNA、和相对应的一个或多个目的基因组靶序列之间形成的复合物解离。解离温度可以是选自以下的范围:40-50℃、41-50℃、42-50℃、43-50℃、44-50℃和45-50℃。优选地,解离温度范围选自:41-50℃、42-50℃和43-50℃。更优选地,解离温度范围选自:41-50℃、41.5-50℃、42-50℃、42.5-50℃和43-50℃。甚至更优选地,解离温度范围选自41.5-50℃、42-50℃和42.5-50℃。最优选地,所述解离温度范围是42-50℃。
温度敏感性变体的制备
本发明还涉及获得II类Cas9蛋白的温度敏感性变体的方法,所述方法包括:(a)将对II类Cas9蛋白稳定性或对II类Cas9蛋白、一个或多个gRNA和一个或多个基因组靶序列之间形成的复合物的稳定性重要的一个或多个(例如,若干个)位置处的改变引入亲本II类Cas9蛋白,并且,任选地,(b)回收所述变体。
可以使用本领域已知的任何诱变程序来制备变体,如定点诱变、合成基因构建、半合成基因构建、随机诱变、改组等。
定点诱变是在编码该亲本的多核苷酸中的一个或多个限定位点处引入一个或多个(例如,若干个)突变的技术。
通过涉及使用包含所希望的突变的寡核苷酸引物的PCR可以体外实现定点诱变。也可以通过盒式诱变进行体外定点诱变,所述盒式诱变涉及由限制酶在包括编码亲本的多核苷酸的质粒中的位点处切割并且随后将包含突变的寡核苷酸连接在多核苷酸中。通常,消化质粒和寡核苷酸的限制性酶是相同的,从而允许质粒和插入物的粘性末端彼此连接。参见例如,Scherer和Davis,1979,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]76:4949-4955;和Barton等人,1990,Nucleic Acids Res.[核酸研究]18:7349-4966。
还可以通过本领域中已知的方法在体内实现定点诱变。参见例如,美国专利申请公布号2004/0171154;Storici等人,2001,Nature Biotechnol.[自然生物技术]19:773-776;Kren等人,1998,Nat.Med.[自然医学]4:285-290;以及Calissano和Macino,1996,Fungal Genet.Newslett.[真菌遗传学时事通讯]43:15-16)。
可以在本发明中使用任何定点诱变程序。存在可用于制备变体的许多可商购的试剂盒。
合成基因构建需要设计的多核苷酸分子的体外合成以编码感兴趣的多肽。基因合成可以利用多种技术来进行,如由Tian等人(2004,Nature[自然]432:1050-1054)所述的基于多路微芯片的技术、以及其中在光可编程的微流芯片上合成并组装寡核苷酸的类似技术。
使用已知的诱变、重组和/或改组方法,随后进行相关的筛选程序可以做出单或多氨基酸取代、缺失和/或插入并对其进行测试,该相关的筛选程序例如由Reidhaar-Olson和Sauer,1988,Science[科学]241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2152-2156;WO 95/17413;或WO 95/22625披露的那些。其他可以使用的方法包括易错PCR、噬菌体展示(例如Lowman等人,1991,Biochemistry[生物化学]30:10832-10837;美国专利号5,223,409;WO 92/06204)以及区域定向诱变(Derbyshire等人,1986,Gene[基因]46:145;Ner等人,1988,DNA 7:127)。
诱变/改组方法可以与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等人,1999,Nature Biotechnology[自然生物技术]17:893-896)。可从宿主细胞回收编码活性多肽的诱变的DNA分子,并使用本领域的标准方法快速测序。这些方法允许快速确定多肽中各个氨基酸残基的重要性。
通过组合合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的多方面来实现半合成基因构建。半合成构建典型地是利用合成的多核苷酸片段的过程结合PCR技术。因此,基因的限定区域可以从头合成,而其他区域可以使用位点特异性诱变引物来扩增,而还有其他区域可以进行易错PCR或非易错PCR扩增。然后可以对多核苷酸子序列进行改组。
多核苷酸
本发明还涉及编码II类Cas9蛋白的温度敏感性变体的多核苷酸。在优选的实施例中,编码tsCas9的多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少80%,例如,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。
本发明还涉及编码II类Cas9蛋白的温度敏感性变体的分离的多核苷酸。用于分离或克隆多核苷酸的技术是本领域已知的且包括从基因组DNA或cDNA或其组合进行分离。来自基因组DNA的多核苷酸的克隆可以例如通过使用众所周知的聚合酶链反应(PCR)或用以对具有共有的结构特征的克隆的DNA片段进行检测的表达库抗体筛选来实现。参见例如,Innis等人,1990,PCR:A Guide to Methods and Application[PCR:方法和应用指南],Academic Press[学术出版社],纽约。可以使用其他核酸扩增程序例如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。这些多核苷酸可以克隆自链球菌属(Streptococcus)的菌株或相关生物,并且因此,例如可以是所述多核苷酸多肽编码区的等位基因变体或物种变体。
编码本发明的温度敏感性变体的多核苷酸的修饰对于合成实质上类似于这种变体的多肽可能是必需的。术语“基本上类似”于该多肽是指多肽的非天然存在的形式。
核酸构建体
本发明还涉及核酸构建体,这些核酸构建体包含可操作地连接至一个或多个控制序列的本发明的多核苷酸,在与控制序列相容的条件下,该一个或多个控制序列指导该编码序列在适合的宿主细胞中的表达。
可用许多方式操作该多核苷酸以提供多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可以是理想的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
该控制序列可为启动子,即,被宿主细胞识别用于表达编码本发明的多肽的多核苷酸的多核苷酸。该启动子包含介导多肽的表达的转录控制序列。该启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括变体、截短型及杂合型启动子,并且可以从编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
用于在细菌宿主细胞中指导本发明核酸构建体的转录的合适启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(Agaisse和Lereclus,1994,Molecular Microbiology[分子微生物学]13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon等人,1988,Gene[基因]69:301-315)、天蓝链霉菌琼脂水解酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Natl.Acad.Sci.USA[美国国家科学院院刊]75:3727-3731)以及tac启动子(DeBoer等人,1983,Natl.Acad.Sci.USA[美国国家科学院院刊]80:21-25)。其他启动子描述于Gilbert等人,1980,Scientific American[科学美国人]242:74-94的“Usefulproteins from recombinant bacteria[来自重组细菌的有用蛋白质]”;和在Sambrook等人,1989,同上。串联启动子的实例披露于WO 99/43835中。
在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的适合启动子的实例是从以下的基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖孢镰孢菌胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢菌淀粉葡糖苷酶(WO 00/56900)、镶片镰孢菌Daria(WO 00/56900)、镶片镰孢菌Quinn(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延伸因子,连同NA2-tpi启动子(来自编码中性α-淀粉酶的曲霉属基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的曲霉属基因的未翻译的前导序列替换未翻译的前导序列;非限制性实例包括来自黑曲霉中性α-淀粉酶基因的修饰的启动子,其中已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替换未翻译的前导序列);及其变体、截短型、以及杂合型启动子。其他启动子在美国专利号6,011,147中描述。
在酵母宿主中,有用的启动子从以下各项的基因获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。酵母宿主细胞的其他有用的启动子由Romanos等人,1992,Yeast[酵母]8:423-488描述。
控制序列也可以是由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接至编码该多肽的多核苷酸的3’-末端。在宿主细胞中有功能的任何终止子可用于本发明中。
细菌宿主细胞的优选终止子从以下的基因获得:克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)、和大肠杆菌核糖体RNA(rrnB)。
用于丝状真菌宿主细胞的优选终止子从以下的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延伸因子。
酵母宿主细胞的优选终止子是从以下各项的基因中获得的:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用的终止子由Romanos等人(1992,同上)描述。
控制序列还可以是启动子下游和基因的编码序列上游的mRNA稳定子区域,其增加所述基因的表达。
适合的mRNA稳定子区的实例从以下获得:苏云金芽孢杆菌cryIIIA基因(WO 94/25612)和枯草芽孢杆菌SP82基因(Hue等人,1995,Journal of Bacteriology[细菌学杂志]177:3465-3471)。
控制序列也可以是前导序列,即对宿主细胞翻译很重要的mRNA的非翻译区域。该前导子可操作地连接至编码该多肽的多核苷酸的5'-末端。可以使用在宿主细胞中有功能的任何前导序列。
用于丝状真菌宿主细胞的优选前导序列从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
酵母宿主细胞的适合的前导序列从以下酶的基因获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列还可以是一种多腺苷酸化序列,可操作地连接至该多核苷酸的3’-末端并且当转录时由宿主细胞识别为将多腺苷酸残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中有功能的任何多腺苷酸化序列。
用于丝状真菌宿主细胞的优选多腺苷酸化序列从以下酶的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖孢镰孢胰蛋白酶样蛋白酶。
酵母宿主细胞的有用的多腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.[分子细胞生物学]15:5983-5990描述。
控制序列也可为编码与多肽的N-末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5’-端可以固有地含有在翻译阅读框架中与编码多肽的编码序列的区段天然地连接的信号肽编码序列。可替代地,编码序列的5'-端可以含有相对于编码序列为外源的信号肽编码序列。在编码序列天然地不含信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以单纯地替换天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
用于细菌宿主细胞的有效信号肽编码序列是从芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA的基因获得的信号肽编码序列。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews[微生物评论]57:109-137描述。
用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶。
用于酵母宿主细胞的有用的信号肽从酿酒酵母α-因子和酿酒酵母转化酶的基因获得。其他的有用的信号肽编码序列由Romanos等人(1992,同上)描述。
控制序列还可以是编码位于多肽的N-末端的前肽的前肽编码序列。所得的多肽被称为前体酶或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。
在信号肽序列和前肽序列两者都存在的情况下,该前肽序列位于紧邻多肽的N-末端且该信号肽序列位于紧邻该前肽序列的N-末端。
还可希望的是添加调节序列,该调节序列调节宿主细胞生长相关的多肽的表达。调节序列的实例是引起基因表达以响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。原核系统中的调节序列包括lac、tac、和trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是允许基因扩增的那些序列。在真核系统中,这些调节序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸将与调节序列可操作地连接。
表达载体
本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。不同的核苷酸和控制序列可以连接在一起以产生重组表达载体,该重组表达载体可以包括一个或多个便利的限制酶切位点以允许在这些位点处插入或取代编码该多肽的多核苷酸。可替代地,可以通过将多核苷酸或包含所述多核苷酸的核酸构建体插入用于表达的适当载体中而表达所述多核苷酸。在产生表达载体时,编码序列如此位于载体中,使得编码序列与用于表达的适当控制序列可操作地连接。
重组表达载体可以是可以方便地经受重组DNA程序并且可以引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性或闭合环状质粒。
载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的总DNA,或可以使用转座子。
载体优选地含有允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标记。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。
细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因、或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素、或四环素抗性)的标记。酵母宿主细胞的适合的标记包括但不限于:ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞中的选择性标记包括但不限于:adeA(磷酸核糖酰氨基咪唑-琥珀酸甲酰胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'磷酸脱羧酶)、sC(硫酸腺苷酰基转移酶)、以及trpC(邻氨基苯甲酸合酶)、以及其等同物。优选的用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选的用于木霉属细胞的是adeA、adeB、amdS、hph以及pyrG基因。
选择性标记可以是如WO 2010/039889中所述的双选择性标记系统。在一个方面,双选择性标记是hph-tk双选择性标记系统。
载体优选地含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到宿主细胞基因组中,该载体可以依靠编码该多肽的多核苷酸序列或用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可含有用于指导通过同源重组而整合入宿主细胞基因组中的染色体中的精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性,整合元件应当含有足够数目的核酸,例如100至10,000个碱基对、400至10,000个碱基对和800至10,000个碱基对,所述核酸与相应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,载体可以通过非同源重组整合入宿主细胞的基因组中。
为了自主复制,载体还可以另外包含复制起点,所述复制起点使得载体在讨论中的宿主细胞中自主复制成为可能。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、和pACYC184的复制起点,以及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060、和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合、及ARS4与CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene[基因]98:61-67;Cullen等人,1987,Nucleic Acids Res.[核酸研究]15:9163-9175;WO00/24883)。可以根据WO 00/24883中披露的方法完成AMA1基因的分离和包含该基因的质粒或载体的构建。
可将本发明多核苷酸的多于一个拷贝插入宿主细胞以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或通过包括一个与该多核苷酸一起的可扩增的选择性标记基因可以获得该多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。
用于连接以上所述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见例如,Sambrook等人,1989,同上)。
宿主细胞
本发明还涉及重组宿主细胞,其包含本发明的多核苷酸可操作地连接于一个或多个指导本发明变体的产生的调控序列。将包含多核苷酸的构建体或载体引入到宿主细胞中,这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体,如早前所描述。
术语“宿主细胞”涵盖因复制期间出现的突变而与亲本细胞不完全相同的任何亲本细胞子代。宿主细胞的选择在很大程度上将取决于编码变体的基因及其来源。
宿主细胞可以是在本发明的变体的重组产生中有用的任何细胞,例如,原核或真核细胞。
原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于:芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属(Geobacillus)、乳杆菌属、乳球菌属、大洋芽孢杆菌属、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括但不限于弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属、以及脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于:嗜碱芽孢杆菌(Bacillus alkalophilus)、高地芽孢杆菌(Bacillus altitudinis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、植物解淀粉芽孢杆菌(B.amyloliquefaciensplantarum)亚种、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、甲基营养型芽孢杆菌(Bacillus methylotrophicus)、短小芽孢杆菌(Bacillus pumilus)、沙福芽孢杆菌(Bacillus safensis)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)和苏云金芽孢杆菌(Bacillusthuringiensis)细胞。
细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于类马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)以及马链球菌兽疫亚种(Streptococcus equisubsp.Zooepidemicus)细胞。
细菌宿主细胞还可以是任何链霉菌属细胞,包括但不限于:不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌以及浅青紫链霉菌细胞。
所述细菌宿主细胞还可以是任何乳杆菌属细胞,包括但不限于:嗜酸乳杆菌(Lactobacillus acidophilus)、淀粉乳杆菌(Lactobacillus amylovorus)、短乳杆菌(Lactobacillus brevis)、副干酪乳杆菌(Lactobacillus(para)casei)、纤维二糖乳杆菌(Lactobacillus cellobiosus)、卷曲乳杆菌(Lactobacillus crispatus)、弯曲乳杆菌(Lactobacillus curvatus)、德氏乳杆菌保加利亚亚种(Lactobacillus delbrueckiisubsp.bulgaricus)、德氏乳杆菌乳酸亚种(L.delbrueckii subsp.lactis)、发酵乳杆菌(Lactobacillus fermentum)、禾口鸡乳杆菌(Lactobacillus gallinarum)、格氏乳杆菌(Lactobacillus gasseri)、瑞士乳杆菌(Lactobacillus helveticus)、约氏乳杆菌(Lactobacillus johnsonii)、植物乳杆菌(Lactobacillus plantarum)、罗伊氏乳杆菌(Lactobacillus reuteri)、雷曼氏乳酸杆菌(Lactobacillus rhamnosus)、和唾液乳杆菌(Lactobacillus salivarius)细胞。
所述细菌宿主细胞还可以是任何乳球菌属细胞,包括但不限于:韩中大乳球菌(Lactococcus chungangensis)、福尔摩沙乳球菌(Lactococcus formosensis)、富士山乳球菌(Lactococcus fujiensis)、格氏乳球菌(Lactococcus garvieae)、乳酸乳球菌(Lactococcus lactis)、鱼乳球菌(Lactococcus piscium)、植物乳球菌(Lactococcusplantarum)、棉子糖乳球菌(Lactococcus raffinolactis)、和台湾乳球菌(Lactococcustaiwanensis)。
细菌宿主细胞还可以是任何埃希氏杆菌属细胞。在一个优选的实施例中,所述细菌宿主细胞是大肠杆菌。
将DNA引入芽孢杆菌属细胞中可以通过以下来实现:原生质体转化(参见,例如,Chang和Cohen,1979,Mol.Gen.Genet.[分子遗传学与基因组学]168:111-115)、感受态细胞转化(参见例如,Young和Spizizen,1961,J.Bacteriol.[细菌学杂志]81:823-829;或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.[分子生物学杂志]56:209-221)、电穿孔(参见例如,Shigekawa和Dower,1988,Biotechniques[生物技术]6:742-751)或接合(参见例如,Koehler和Thorne,1987,J.Bacteriol.[细菌学杂志]169:5271-5278)。将DNA引入大肠杆菌细胞中可以通过以下方式来实现:原生质体转化(参见例如,Hanahan,1983,J.Mol.Biol.[分子生物学杂志]166:557-580)或电穿孔(参见例如,Dower等人,1988,Nucleic Acids Res.[核酸研究]16:6127-6145)。将DNA引入链霉菌属细胞中可以通过以下方式来实现:原生质体转化、电穿孔(参见例如,Gong等人,2004,Folia Microbiol.(Praha)[叶线形微生物学(布拉格)]49:399-405)、接合(参见例如,Mazodier等人,1989,J.Bacteriol.[细菌学杂志]171:3583-3585)、或转导(参见例如,Burke等人,2001,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]98:6289-6294)。将DNA引入假单孢菌属细胞中可以通过以下方式来实现:电穿孔(参见例如,Choi等人,2006,J.Microbiol.Methods[微生物学方法杂志]64:391-397)或接合(参见例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.[应用与环境微生物学]71:51-57)。将DNA引入链球菌属细胞中可以通过以下方式来实现:天然感受态(natural competence)(参见例如,Perry和Kuramitsu,1981,Infect.Immun.[感染与免疫]32:1295-1297)、原生质体转化(参见例如,Catt和Jollick,1991,Microbios[微生物学]68:189-207)、电穿孔(参见例如,Buckley等人,1999,Appl.Environ.Microbiol.[应用与环境微生物学]65:3800-3804)、或接合(参见例如,Clewell,1981,Microbiol.Rev.[微生物学评论]45:409-436)。然而,可以使用本领域已知的将DNA引入宿主细胞中的任何方法。
宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。对于真核宿主细胞,本发明的温度敏感性变体必须包含至少一个融合到tsCas9蛋白的核定位序列(NLS),以确保其在细胞的核中的定位;优选地,猴病毒40(SV40)T抗原核定位信号(NLS)融合到tsCas9蛋白的N-末端和/或C-末端。
宿主细胞可以是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人,于:Ainsworth and Bisby'sDictionary of The Fungi[安斯沃思和拜斯比真菌词典],第8版,1995,国际应用生物科学中心(CAB International),大学出版社(University Press),剑桥(Cambridge),英国)所定义的。
真菌宿主细胞可以为酵母细胞。如本文所用的“酵母”包括产子囊酵母(内孢霉目)、产担子酵母及属于半知菌纲(芽孢纲)的酵母。由于对酵母的分类将来可能变化,出于本发明的目的,酵母应当按照Biology and Activities of Yeast[酵母的生物学与活性](Skinner,Passmore和Davenport编辑,Soc.App.Bacteriol.Symposium Series No.9[应用细菌学学会专题论文集系列9],1980)中所描述的定义。
酵母宿主细胞可以是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁弗酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或耶氏酵母属(Yarrowia)细胞,如乳酸克鲁维酵母(Kluyveromyces lactis)、卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)或解脂耶氏酵母(Yarrowia lipolytica)细胞。
真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门的所有丝状形式(如由Hawksworth等人,1995(同上)所定义的)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸来进行的,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding)来进行的,而碳分解代谢可以是发酵性的。
丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢菌、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametesvillosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化、以及细胞壁再生的方法以本身已知的方式转化。用于转化曲霉属和木霉属宿主细胞的适合程序描述于以下文献中:EP 238023,Yelton等人,1984,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:1470-1474以及Christensen等人,1988,Bio/Technology[生物/技术]6:1419-1422。用于转化镰孢属物种的适合方法由Malardier等人,1989,Gene[基因]78:147-156和WO 96/00787描述。可以使用由以下文献描述的程序转化酵母:Becker和Guarente,在Abelson,J.N.和Simon,M.I.编辑,Guide to Yeast Genetics and Molecular Biology[酵母遗传学与分子生物学指南],Methods in Enzymology[酶学方法],第194卷,第182-187页,AcademicPress,Inc.[学术出版社有限公司],纽约);Ito等人,1983,J.Bacteriol.[细菌学杂志]153:163;以及Hinnen等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:1920。
诱导或抑制表达的方法
本发明还涉及诱导或抑制一个或多个目的基因组靶序列的表达的方法。
在优选的方面,本发明涉及诱导一个或多个目的基因组靶序列表达的方法,所述方法包括以下步骤:
a)提供一种本发明的宿主细胞,所述宿主细胞进一步包含一个或多个适合的gRNA和一个或多个目的基因组靶序列;
b)在所述tsCas9的解离温度下培养所述宿主细胞,由此所述tsCas9与所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成的复合物解离;以及随后
c)将温度降低到所述tsCas9的限制性温度并培养所述宿主细胞,由此诱导所述一个或多个靶序列的表达。
诱导一个或多个目的基因组靶序列的表达的方法还可以包括在提供所述宿主细胞之后和步骤(b)之前的以下步骤:在所述tsCas9的所述许可温度下培养所述宿主细胞,由此所述tsCas9、所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成复合物,由此抑制所述一个或多个基因组靶序列的表达。
可能是有意义的是仅瞬时诱导所述一个或多个目的基因组靶序列的表达。因此,在优选实施例中,诱导一个或多个目的基因组靶序列的表达的方法可以进一步包括以下额外的步骤:
d)将温度升至所述tsCas9的许可温度,其中所述tsCas9、所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成复合物,并培养所述宿主细胞,由此抑制所述一个或多个目的基因组靶序列的表达。
在另一优选的方面,本发明涉及抑制一个或多个目的基因组靶序列的方法,所述方法包括以下步骤:
a)提供一种本发明的宿主细胞,所述宿主细胞进一步包含一个或多个适合的gRNA和一个或多个目的基因组靶序列;
b)在所述tsCas9的限制性温度下培养所述宿主细胞,其中所述一个或多个目的基因组靶序列被表达;以及随后
c)将温度降低到所述tsCas9的许可温度,由此所述tsCas9、所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成复合物,并由此抑制所述一个或多个基因组靶序列的表达。
抑制一个或多个目的基因组靶序列的表达的方法还可以包括在提供所述宿主细胞之后和步骤(b)之前的以下步骤:在所述tsCas9的解离温度下培养所述宿主细胞,以确保在宿主细胞中在所述tsCas9、所述一个或多个gRNA和所述一个或多个目的基因组靶序列之间不形成复合物。
可能是有意义的是仅瞬时抑制所述一个或多个目的基因组靶序列的表达。因此,在优选实施例中,抑制一个或多个目的基因组靶序列的表达的方法可以进一步包括以下额外的步骤:
d)将温度升高到所述tsCas9的解离温度,由此使所述复合物解离;以及随后
e)将温度降低到所述tsCas9的限制性温度,由此诱导所述一个或多个靶序列的表达。
对于诱导或抑制表达的方法,宿主细胞优选地为芽胞杆菌属宿主细胞;优选地,所述宿主细胞选自由以下组成的芽孢杆菌属物种的组:嗜碱芽孢杆菌、高地芽孢杆菌、解淀粉芽孢杆菌、植物解淀粉芽孢杆菌亚种、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、甲基营养型芽孢杆菌、短小芽孢杆菌、沙福芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌;更优选地,所述宿主细胞是地衣芽孢杆菌。
对于芽胞杆菌属宿主细胞,许可温度是选自以下的范围:30-32℃、30-33℃、29-32℃、30-34℃、29-33℃、30-35℃、29-34℃、30-36℃、28-34℃、31-35℃、28-35℃、26-34℃和27-34℃。优选地,许可温度范围选自:30-32℃、29.5-32.5℃、29-33℃、28.5-33.5℃、28-34℃、27.5-34.5℃、27-35℃、26.5-35.5℃和26-36℃。更优选地,许可温度范围选自:29-33℃、28.5-33.5℃、28-34℃、27.5-34.5℃和27-35℃。甚至更优选地,许可温度范围选自:28.5-33.5℃、28-34℃和27.5-34.5℃。最优选地,所述许可温度范围是28-34℃。
对于芽胞杆菌属宿主细胞,限制性温度是选自以下的范围:38-40℃、38-41℃、37-40℃、38-42℃、37-41℃、37-42℃、36-40℃、36-41℃、36-42℃和35-43℃。优选地,限制性温度范围选自:39-40℃、38.5-41.5℃、38-42℃、37.5-42℃、38-42.5℃、36.5-41.5℃、36.5-42℃、37-42℃、37-42.5℃和36-43℃。更优选地,限制性温度范围选自:38-42℃、37.5-42℃、38-42.5℃、36.5-41.5℃、36.5-42℃、37-42℃、37-42.5℃、36-43℃和36-44℃。甚至更优选地,限制性温度范围选自:36.5-41.5℃、36.5-42℃、37-42℃和37-42.5℃。最优选地,限制性温度范围是37-42℃,
在优选的实施例中,许可温度是28-34℃,并且限制性温度是37-42℃。
对于诱导或抑制表达的方法,tsCas9具有选自以下范围的解离温度:40-50℃、41-50℃、42-50℃、43-50℃、44-50℃和45-50℃。优选地,解离温度范围选自:41-50℃、42-50℃和43-50℃。更优选地,解离温度范围选自:41-50℃、41.5-50℃、42-50℃、42.5-50℃和43-50℃。甚至更优选地,解离温度范围选自41.5-50℃、42-50℃和42.5-50℃。最优选地,所述解离温度范围是42-50℃。
指导RNA
CRISPR-Cas9基因组编辑中的gRNA构成了可重复编程的部分,使得系统如此通用。在天然化脓链球菌系统中,gRNA实际上是两种RNA多核苷酸的复合物,第一crRNA含有约20个核苷酸,其确定了Cas9酶的特异性和与crRNA杂交以形成与Cas9相互作用的RNA复合物的tracr RNA(参见Jinek等人,2012,A programmable dual-RNA-guided DNA endonucleasein adaptive bacterial immunity[在自适应细菌免疫中的可编程双重-RNA-指导的DNA核酸内切酶],Science[科学]337:816-821)。术语crRNA和tracrRNA在本文中与术语tracr-配对RNA和tracr RNA可互换地使用。
由于CRISPR-Cas9系统的发现,单一多核苷酸gRNA已经被开发并成功应用,与天然两部分gRNA复合物一样有效。
在优选的实施例中,所述单一gRNA或RNA复合物包含第一RNA,所述第一RNA包含与所述一个或多个基因组靶序列至少85%互补并且能够与所述一个或多个基因组靶序列杂交的20个或更多个核苷酸;优选地,所述20个或更多个核苷酸与所述一个或多个基因组靶序列至少90%、95%、97%、98%、99%或甚至100%互补并且能够与所述一个或多个基因组靶序列杂交。
在另一个优选的实施例中,芽孢杆菌属宿主细胞包含单一gRNA,所述单一gRNA包含单个多核苷酸形式的第一和第二RNA,并且其中当彼此杂交时,tracr配对序列和tracr序列形成茎环结构。
基因组靶序列
可以被诱导或抑制的一个或多个目的基因组靶序列的长度为至少20个核苷酸,以允许其与对应的20个核苷酸序列的gRNA杂交。所述至少一个基因组靶序列可以位于基因组中的任何位置,但通常位于编码序列或可读框内。
所述一个或多个目的基因组靶序列应侧接针对II类Cas9蛋白的功能性PAM序列。有关PAM序列的综述,参见,例如,Shah等人,2013,Protospacer recognition motifs[原型间隔子识别基序],RNA Biol.[RNA生物学]10(5):891–899。
优选地,所述一个或多个基因组靶序列包含在编码多肽的可读框中或包含在启动子区域中。还优选地,所述一个或多个目的基因组靶序列编码一个或多个选自由以下组成的组的酶:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;优选地,所述一个或多个酶是α-淀粉酶、α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、天冬酰胺酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、绿色荧光蛋白、葡聚糖转移酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、和木聚糖酶。
优选地,如果微生物宿主细胞是芽孢杆菌宿主细胞,则待阻遏的一个或多个目的基因组靶序列包含mecA和/或yjbH基因或其同系物,如本文列举的。待阻遏的其他优选的目的基因组靶序列包含蛋白酶编码基因,尤其是如果表达,则可以降解重组产生的多肽的细胞溶质、分泌或膜结合蛋白酶。
产生温度敏感性变体的方法
本发明还涉及产生本发明的变体的方法,这些方法包括:(a)在适合于所述变体的表达的条件下培养本发明的宿主细胞;并且(b)回收所述变体。
使用本领域已知的方法在适合于产生变体的营养介质中培养宿主细胞。例如,可以通过摇瓶培养,或者在适合的培养基中并在允许变体表达和/或分离的条件下在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批给料发酵或固态发酵)来培养细胞。使用本领域中已知的程序,培养发生在包含碳和氮来源及无机盐的适合的营养培养基中。适合的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中)制备。如果变体被分泌到营养介质中,则变体可以直接从培养基中回收。如果变体没有分泌,则它可以从细胞裂解液中回收。
可以使用本领域已知的对这些变体特异的方法检测这些变体。这些检测方法包括但不限于:特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来确定该变体的活性。
可以使用本领域已知的方法回收该变体。例如,可以通过多种常规程序从营养介质中回收该变体,这些常规程序包括但不限于收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀。
可以通过本领域中已知的多种程序来纯化变体以获得基本上纯的变体,这些程序包括但不限于色谱法(例如,离子交换色谱、亲和色谱、疏水作用色谱、色谱聚焦、以及尺寸排阻色谱)、电泳程序(例如,制备型等电点聚焦)、差别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(参见例如,Protein Purification[蛋白质纯化],Janson和Ryden编辑,VCH出版社(VCH Publishers),纽约,1989)。
在可替代的方面,没有回收变体,而是将表达变体的本发明的宿主细胞用作变体的来源。
通过以下实例进一步描述本发明,所述实例不应理解为对本发明的范围进行限制。
实例
材料与方法
材料
用作缓冲液和底物的化学品是至少试剂级的商业产品。
使用标准教科书程序,采用商业热循环仪和来自商业供应商的Ready-To-Go PCRbeads,Phusion聚合酶或RED-TAQ聚合酶进行PCR扩增。
LB琼脂:参见EP 0 506 780。
LBPSG琼脂板含有LB琼脂,补充有磷酸盐(0.01M K3PO4)、葡萄糖(0.4%)和淀粉(0.5%);参见EP 0 805 867 B1。
TY(液体肉汤培养基;参见WO 94/14968,第16页。
寡核苷酸引物获得自DNA技术(奥尔胡斯,丹麦)。用可商购的试剂盒和试剂,使用标准教科书程序进行DNA操作(质粒和基因组DNA制备、限制性消化、纯化、连接、DNA测序)。
在一些情况下,使用来自通用电气医疗集团(GE Healthcare)的TempliPhi试剂盒,在等温滚环扩增反应中扩增连接混合物。
使用两步式程序(Yasbin等人,1975,J.Bacteriol.[细菌学杂志]121:296-304.)或一步式程序将DNA引入到枯草芽孢杆菌经提炼的天然感受态细胞中,其中将来自琼脂板的细胞材料再悬浮于Spizisen 1培养基(12ml)(WO 2014/052630)中,在37℃以200rpm振荡约4小时,将DNA添加至400微升等分试样中,并且在选择性琼脂板上铺板之前,将这些等分试样在所希望的温度下,以150rpm振荡另外1小时。
使用含有pLS20的经修饰的枯草芽孢杆菌供体菌株PP3724,基本上如之前所描述的(EP 2029732 B1),通过来自枯草芽孢杆菌的接合,将DNA引入到地衣芽孢杆菌中,其中甲基化酶基因M.bli1904II(US 20130177942)从在amyE基因座处的三联启动子表达,pBC16衍生的orfβ和枯草芽孢杆菌comS基因(和卡那霉素抗性基因)从在alr基因座处的三联启动子表达(使得需要D-丙氨酸菌株),并且枯草芽孢杆菌comS基因(和cat基因)从在pel基因座处的三联启动子表达。
枯草芽孢杆菌JA1343:JA1343是PL1801的孢子形成阴性衍生物(WO 2005042750)。部分spollAC基因已经被删除,以获得孢子形成阴性表型。
实例中描述的所有构建都是从基因艺术-赛默飞世尔科技公司(GeneArt-ThermoFisher Scientific)订购的合成DNA片段组装而成。如实例中所述,片段通过序列重叠延伸(SOE)进行组装。
根据先前描述的方法(美国专利号5,843,720),通过染色体整合与切割将本专利中使用的温度敏感性质粒并入地衣芽孢杆菌的基因组中。含质粒的地衣芽孢杆菌转化子在50℃在具有红霉素的LBPG选择性培养基上生长,以迫使载体在相同的序列处整合到染色体上。基于其在50℃、在LBPG+红霉素选择性培养基上生长的能力来选择所希望的整合体。然后,使整合体于37℃无选择性地生长在LBPG培养基中,以允许切割整合的质粒。将细胞铺在LBPG板上并且针对红霉素-敏感性进行筛选。检查敏感性克隆是否正确整合了所需的构建体。
根据先前描述的方法(Pitcher等人,同上)或通过使用从凯杰公司(Qiagen)可商购的QIAamp DNA血液试剂盒,从以上若干红霉素敏感分离株中制备基因组DNA。
标准分批给料培养程序
所有生长培养基通过本领域中已知的方法进行灭菌。除非另外描述,使用自来水。在下面的配方中提及的成分浓度是任何接种之前的浓度。
第一接种物培养基:SSB4琼脂。大豆蛋白胨SE50MK(DMV)10g/l;蔗糖10g/l;
磷酸氢二钠,2H20 5g/l;磷酸二氢钾2g/l;柠檬酸0,2g/L;维生素(硫胺盐酸盐11,4mg/l;核黄素0,95mg/l;烟酰胺7,8mg/l;泛酸钙9,5mg/l;吡哆醛-HCI1,9mg/l;D-生物素0,38mg/l;叶酸2.9mg/l);痕量金属(MnS04,H20 9.8mg/l;FeS04,7H20 39,3mg/l;CuS04,5H20 3,9mg/l;ZnS04,7H20 8,2mg/l);琼脂25g/l。使用去离子水。使用NaOH将pH调节至pH7.3至7.4。
转移缓冲液。M-9缓冲液(使用去离子水):磷酸氢二钠,2H20 8.8g/l;磷酸二氢钾3g/l;氯化钠4g/l;硫酸镁,7H20 0.2g/l。
接种物摇瓶培养基(浓度是接种之前的浓度):PRK-50:1 10g/l大豆粒;磷酸氢二钠,2H20 5g/l;在灭菌之前,使用NaOH/H3P04将pH调节至8.0。
制备培养基(浓度是接种之前的浓度):胰蛋白胨(来自Difco的酪蛋白水解物)30g/l;硫酸镁,7H20 4g/l;磷酸氢二钾7g/l;磷酸氢二钠,2H20 7g/l;硫酸二铵4g/l;硫酸钾5g/l;柠檬酸0.78g/L;维生素(硫胺盐酸盐34.2mg/l;核黄素2.8mg/l;烟酰胺23.3mg/l;泛酸钙28.4mg/l;吡哆醛-HCI 5.7mg/l;D-生物素1.1mg/l;叶酸2.5mg/l);痕量金属(MnS04,H20 39.2mg/l;FeS04,7H20 157mg/l;CuS04,5H20 15.6mg/l;ZnS04,7H20 32,8mg/l);消泡剂(SB2121)1.25ml/I;在灭菌之前,使用NaOH/H3P04将pH调节至6.0。
补料培养基:蔗糖708g/l;
接种步骤:首先,在37℃下,使菌株在SSB-4琼脂斜面上生长1天。然后,使用M-9缓冲液洗涤琼脂,并且在650nm处测量所得细胞悬浮液的光密度(OD)。使用OD(650nm)x ml细胞悬浮液=0.1的接种物来接种接种物摇瓶(PRK-50)。将摇瓶在37℃下、在300rpm处孵育20小时。通过用来自该摇瓶的生长培养物接种主发酵罐来开始主发酵罐(发酵器)中的发酵。接种体积是制备培养基的11%(对于720ml制备培养基而言,是80ml)。
使用配备以下项的标准实验室发酵罐:温度控制系统,使用氨水和磷酸的pH控制,用于贯穿整个发酵过程测量氧饱和度的溶氧电极。
发酵参数:温度:38℃;使用氨水和磷酸将pH保持在6.8与7.2之间;对照:6.8(氨水);7.2磷酸;
通气:1.5升/min/kg培养液重量。
搅拌:1500rpm。
补料策略:0hr。接种之后,0.05g/min/kg初始培养液;8hr。接种之后,0.156g/min/kg初始培养液;结束:接种之后,0.156g/min/kg初始培养液。
实验装置:在恒定搅拌下将培养运行五天,并且在此时期,在线跟踪氧张力。并排比较不同菌株。
在全培养液细胞培养物上进行GFP荧光测量。将培养物稀释并在来自分子仪器公司(Molecular Devices)的SpectraMax M2上直接测量
菌株
PP3724:含有pLS20,其中甲基化酶基因M.bli1904II(US 20130177942)从在amyE基因座处的三联启动子表达,pBC16衍生的orfβ和枯草芽孢杆菌comS基因(和卡那霉素抗性基因)从在alr基因座处的三联启动子表达(使得需要D-丙氨酸菌株),并且枯草芽孢杆菌comS基因(和cat基因)从在pel基因座处的三联启动子表达。
PL1801:这种菌株是具有分别编码碱性蛋白酶和中性蛋白酶的破坏的aprE和nprE基因的枯草芽孢杆菌DN 1885(迪德瑞辰(Diderichsen),B.,韦德斯特德(Wedsted),U.,赫泽高(Hedegaard),L.,延森(Jensen),B.R.,
Figure BDA0002473241340000521
C.(1990)(aldB的克隆,所述aldB编码α-乙酰乳酸脱羧酶,一种来自短芽孢杆菌的胞外酶)细菌学杂志(J.Bacterid.),172,4315-4321)。
A164:这种菌株是一种枯草芽孢杆菌野生型分离株(ATCC 6051a)。
JA1343:这种菌株是具有破坏的spollAC基因(sigF)的枯草芽孢杆菌PL1801。所述基因型是:aprE,nprE,amyE,spollAC。
SJ4671:地衣芽孢杆菌菌株有两个在染色体上的原始amyL基因座处整合的amyL基因拷贝。两个拷贝以相反的方向插入,使得两个拷贝的转录是反向平行的。所述拷贝间隔约2.5Kb,其来源于枯草芽孢杆菌染色体(US6100063)的非功能性DNA。
SJ6026:这种地衣芽孢杆菌菌株有四个在amyL、xyl和gnt基因座处整合的amyL基因拷贝。
MOL2173:这种地衣芽孢杆菌菌株有四个在amyL、xyl和gnt基因座处整合的amyL基因拷贝和一个在mprL基因座处插入的额外的prsA基因。
MOL2212:这种地衣芽孢杆菌菌株是MOL2173利福平抗性分离株。
PP2307:这种枯草芽孢杆菌菌株是JA1343,其具有插入pel基因的表达盒,所述pel基因含有驱动comS的P3启动子和卡那霉素标记。
PP5007:这种地衣芽孢杆菌菌株是MOL2212,其中天然catL基因被灭活。所述菌株是氯霉素敏感型。
PP5021:这种地衣芽孢杆菌菌株是PP5007,其中在forD基因座处插入含有cas9d、gDNA(P4199)和cat的表达盒。
PP5168:这种菌株是枯草芽孢杆菌菌株JA1343,其具有插入pel基因座处的gfp基因、gDNA(P4199)和spec标记。
PP5336:这种菌株是枯草芽孢杆菌菌株PP5168,其具有插入amyE基因座处的cas9d基因、gDNA(GFP)和cat标记。
PP5200:这种菌株为枯草芽孢杆菌PP5168株,其具有插入pel基因座处的cas9d基因、gDNA(GFP)和cat标记。
C1-C48:这些菌株为枯草芽孢杆菌株PP5168,其具有插入pel基因座处的温度敏感性cas9d基因变体、gDNA(GFP)和cat标记。
PP5360:这种地衣芽孢杆菌菌株是PP5007,其中在forD基因座处插入含有温度敏感性cas9d变体C30、gDNA(P4199)和cat基因的表达盒。
PP5541:这种地衣芽孢杆菌菌株是PP5007,其中在forD基因座处插入含有温度敏感性cas9d变体C25、gDNA(P4199)和cat基因的表达盒。
PP5542:这种地衣芽孢杆菌菌株是PP5007,其中在forD基因座处插入含有温度敏感性cas9d变体C33、gDNA(P4199)和cat基因的表达盒。
BKQ3746:这种地衣芽孢杆菌菌株是PP5007,其中在forD基因座处插入含有温度敏感性cas9d变体C38、gDNA(P4199)和cat基因的表达盒。
BKQ3748:这种地衣芽孢杆菌菌株是PP5007,其中在forD基因座处插入含有温度敏感性cas9d变体C40、gDNA(P4199)和cat基因的表达盒。
BKQ3750:这种地衣芽孢杆菌菌株是PP5007,其中在forD基因座处插入含有温度敏感性cas9d变体C42、gDNA(P4199)和cat基因的表达盒。
BKQ3752:这种地衣芽孢杆菌菌株是PP5007,其中在forD基因座处插入含有温度敏感性cas9d变体C43、gDNA(P4199)和cat基因的表达盒。
质粒
pC194:从金黄色葡萄球菌(Staphylococcus aureus)中分离的质粒(Horinouchi和Weisblum,1982)。
pE194:从金黄色葡萄球菌中分离的质粒(Horinouchi和Weisblum,1982)。
pUB110:分离的质粒来自(McKenzie等人,1986)
pPPamyL-attP:在实例6中为本发明构建的质粒。所述质粒通过合成序列组装制备,以产生载体,所述载体含有:(1)编码地衣芽孢杆菌α-淀粉酶的amyL基因,其前接用于整合的cry3A稳定子(2)WO 2006042548中描述的来自TP901-1的attP和整合酶(int)。所述整合酶促进了地衣芽孢杆菌宿主质粒上attP位点和染色体上attB位点的整合。
实例1.地衣芽孢杆菌宿主MOL2212的构建
MOL2212的完整构建是在若干连续步骤中通过如上所述的顺序质粒整合而进行的。
通过PCR扩增合成DNA组装用于整合的质粒。将纯化的PCR产物用于随后的PCR反应中,以使用剪接重叠PCR(SOE)使用Phusion热启动DNA聚合酶系统(赛默科技公司)如下产生单个质粒。PCR扩增反应混合物含有六种凝胶纯化的PCR产物各50ng,并用热循环仪来组装和扩增质粒。将所得的SOE产物直接用于转化枯草芽孢杆菌宿主JA1343,以建立质粒,所述质粒随后用作运载体将DNA转移和整合到地衣芽孢杆菌染色体上的特定基因座。
地衣芽孢杆菌菌株SJ4671(US6100063)被用作宿主菌株用于插入α-淀粉酶基因amyL的额外拷贝。SJ4671菌株已经具有两个在染色体上的原始amyL基因座处整合的amyL基因拷贝。两个拷贝以相反的方向插入,使得两个拷贝的转录是反向平行的。所述拷贝间隔约2.5Kb,其来源于枯草芽孢杆菌染色体(图1和SEQ ID NO:3)的非功能性DNA。
SJ4671菌株与质粒接合用于进一步插入两个以上的amyL基因拷贝;在xyl基因座(图2和SEQ ID NO:4)处插入一个拷贝,并在gnt基因座(图3和SEQ ID NO:5)处插入一个拷贝。这种中间菌株命名为SJ6026,并含有α-淀粉酶基因amyL的四个拷贝,稳定整合入地衣芽孢杆菌染色体。
SJ6026菌株通过插入编码来自地衣芽孢杆菌分子伴侣的prsA基因的额外的拷贝进一步进行了工程化。PrsA分子伴侣的过表达描述于文献中以进一步提高α-淀粉酶的生产率。额外的prsA基因被插入mprL基因座处。这种插入导致来自地衣芽孢杆菌的PrsA分子伴侣的过表达和mprL产物金属蛋白酶(图4和SEQ ID NO:6)的敲除。这种四拷贝amyL且两拷贝prsA的菌株命名为MOL2173。
最终菌株命名为MOL2212,是MOL2173的衍生物,其中rpoB基因中的自发突变被分离为一个利福平耐药菌株。
实例2.地衣芽孢杆菌菌株PP5007和PP5021的构建
将MOL2212菌株用作转化质粒(用于失活天然catL基因)的宿主菌株。分离到氯霉素敏感性克隆,并保存为PP5007。
PP5007菌株通过转化整合在forD基因座并插入表达盒(由从forD启动子表达的cas9d基因、从PamyQsc启动子转录的gDNA(P4199)和赋予氯霉素抗性的cat基因(图5和SEQID NO:7)组成)的质粒进一步工程化。gDNA(P4199)被转录成gRNA(P4199),gRNA(P4199)指导Cas9d至P4199启动子并抑制转录。最终菌株PP5021中的所有四个amyL基因拷贝均表达自P4199启动子,并且Cas9d-gRNA复合物可以通过结合并且与P4199靶的强相互作用潜在地抑制α-淀粉酶的表达。
图6中显示了两株地衣芽孢杆菌菌株PP5007和PP5021的图示。
图13中显示了与P4199启动子区域结合的CRISPRi复合物的图示。
实例3.使用PP5007和PP5021菌株表达α-淀粉酶
如上所述,对于实例2中所述的地衣芽孢杆菌菌株在不同温度下在分批给料培养中的α-淀粉酶生产率进行了测试。PP5007菌株具有来自四个拷贝(无CRISPRi复合物的抑制并可以用作克隆和激活CRISPRi复合物情况下的PP5021的阳性对照)的淀粉酶的完全表达。图7清楚地显示,无论培养温度在37℃或44℃(三角形、星形和菱形数据点),PP5007菌株允许淀粉酶的完全表达。相反,当菌株PP5021在37℃培养时,淀粉酶的生产率接近于零(正方形),这显示通过gRNA(P4199)形成的CRISPRi复合物和Cas9d可以非常有效地抑制来自37℃下染色体上所有四个拷贝的淀粉酶的表达。
用PP5021菌株开始另一种培养,并在整个过程(X个数据点)中保持44℃的高温。令人惊讶的是,淀粉酶表达的抑制并没有非常有效,并且允许淀粉酶的大量生产达到37℃培养实验中所见的大量生产的几乎75%。对这些结果的解释是,P4199启动子处的CRISPRi抑制复合物在44℃下形成的效率不如当细胞生长在37℃低温下的效率。自始至终保持高水平的温度会改变动力学,部分地阻止淀粉酶的抑制,并允许淀粉酶在这些条件下的表达。
在另一个具有PP5021的实验中,培养开始于37℃下,并在过度生长培养后变为44℃,然后变回37℃,并最终在培养结束时达到44℃。从图7(实心圈)中的数据来看,显然,在37℃和44℃之间改变温度不会影响CRISPRi复合物对淀粉酶表达的抑制。在整个培养过程中,淀粉酶的生产率仍然非常低,并且结论是一旦CRISPRi抑制复合物在37℃下形成,它就不能通过温度突然变化到44℃而去抑制。
有了这些信息,我们想筛选出去稳定的Cas9d定点变体,所述变体比当前的Cas9d蛋白具有更适合的温度诱导曲线。在这个实例中的实验显示,在与gRNA和靶DNA的Cas9d复合物形成中已经存在一些温度敏感性,但是需要44℃的相对高温来部分阻止CRISPRi复合物的形成和抑制。同时,一旦CRISPRi抑制复合物形成,当前可用的Cas9d蛋白就不能在高温下灭活,并且因此在培养过程中去抑制(诱导)将非常困难,或者至少在培养过程中需要非常高的温度,这与芽孢杆菌属生物的生长生理不相容。
因此,筛选对温度敏感的Cas9d蛋白有两个目标:
1)在比野生型Cas9d更低的温度下获得阻止CRISPRi复合物形成(Cas9d-gRNA)的去稳定Cas9d蛋白。在这种情况下,这将使温度范围更适合芽胞杆菌属生物培养过程中的生理。就芽胞杆菌属而言,在30-33℃下完全抑制(功能性CRISPRi复合物)和在37℃下完全诱导(非功能性CRISPRi复合物)可以是对上述当前已知野生型(wt)Cas9d所示实验的一个有吸引力的替代方案,所述实验需要高于44℃的温度灭活。对于其他生物和过程,可替代的温度范围可以是有吸引力的,并且可能是通过定点突变Cas9d来设计。
2)Cas9d蛋白变体的获得允许通过改变温度立即去稳定和去抑制。当前的Cas9d分子与gRNA和靶DNA形成复合物,所述复合物一旦建立就具有更高的温度稳定性。筛选Cas9d变体是非常有价值的,即使它已经与gRNA和DNA靶点复合在一起,也可以去稳定。此类Cas9d变体将例如允许设置温度诱导系统,其中在培养过程中允许细胞生物质在CRISPRi抑制基因表达的温度下积累,并且然后通过将温度升高到CRISPRi复合物去稳定的水平来诱导表达。
实例4.枯草芽孢杆菌中GFP和gDNA(P4199)的染色体整合
将DNA片段插入amyE基因座,其中编码绿色荧光蛋白的GFP基因从由WO1993010249中先前描述的amyL变体启动子P4199表达。此外,从US 6255076中描述的PamyQ共有启动子(PamyQsc)表达gDNA(P4199)。gDNA(P4199)表达具有间隔序列的gRNA(P4199),所述gRNA将CRISPRi复合物指导至P4199启动子上的序列。还包括大观霉素标记来对整合进行选择。用于整合的DNA作为合成DNA订购(基因艺术-赛默飞世尔科技公司),并克隆到如材料和方法部分所述的整合载体中。在图8中显示了amyE基因座的最终图谱。所述基因座的核苷酸序列可在SEQ ID NO:8中找到。
用于PCR扩增的条件如下:使用Phusion热启动DNA聚合酶系统(赛默科技公司(Thermo Scientific))通过PCR扩增对应的DNA片段。PCR扩增反应混合物含有1ul(约0.1ug)的模板DNA、2ul的正义引物(20pmol/ul)、2ul的反义引物(20pmol/ul)、10ul的5XPCR缓冲液(具有7,5mM MgCl2、8ul的dNTP混合物(各1.25mM)、37ul水和0.5ul(2U/ul)DNA聚合酶混合物)。使用热循环仪来扩增片段。根据制造商的说明书,使用QIAGEN QIAquick凝胶提取试剂盒(凯杰公司(Qiagen,Inc.),巴伦西亚,加利福尼亚州),用1x TBE缓冲液从1.2%琼脂糖凝胶中纯化PCR产物。
将PCR产物用于随后的PCR反应中,以使用剪接重叠PCR(SOE)使用Phusion热启动DNA聚合酶系统(赛默科技公司)如下产生单个质粒。PCR扩增反应混合物含有两种凝胶纯化的PCR产物和合成片段各50g,并用热循环仪组装DNA进行整合。所得到的SOE产物直接用于转化枯草芽孢杆菌宿主PP2307,通过大观霉素选择而建立整合。
最终的构建体具有从P4199启动子表达的GFP基因和从染色体(amyE基因座)上的PamyQsc启动子表达的gRNA。所述菌株命名为PP5168(图8)。
实例5.枯草芽孢杆菌中cas9d和gDNA(GFP)的染色体整合
在pel基因座插入表达盒,其具有编码Cas9d蛋白的cas9d基因(Sander等人,Nature Biotechnology[自然生物技术]32,347–355,2014)。
是从P4199*启动子表达的。P4199启动子先前描述于WO 1993010249中。P4199*启动子具有从G到A的单个碱基变化,所述变化破坏用于CRISPR识别gRNA(P4199)的PAM位点。此外,从US 6255076中描述的PamyQ共有启动子(PamyQsc)表达gDNA(GFP)。gDNA(GFP)表达具有间隔序列的gRNA(GFP),所述gRNA将CRISPRi复合物指导至GFP基因上的编码序列(参见图9)。还包括氯霉素抗性标记来选择校正整合。用于整合的DNA作为合成DNA订购(基因艺术-赛默飞世尔科技公司),并克隆到如材料和方法部分所述的整合载体中。在图9中显示了pel基因座的最终图谱。所述基因座的核苷酸序列可在SEQ ID NO:9中找到。
PCR产物如实例1中所述制备并用于随后的PCR反应中,以使用剪接重叠PCR(SOE)使用Phusion热启动DNA聚合酶系统(赛默科技公司)如下产生单个质粒。PCR扩增反应混合物含有两种凝胶纯化的PCR产物和合成片段各50g,并用热循环仪组装并扩增DNA进行整合。将所得到的SOE产物直接用于对枯草芽孢杆菌PP5168的转化(实例4)。通过对氯霉素抗性的筛选,将含有cas9d基因和gDNA(GFP)的DNA片段插入pel基因座处。
所述菌株命名为PP5336,并表达Cas9d蛋白、GFP蛋白、gRNA(P4199)和gRNA(GFP)。显示GFP的表达被启动子(P4199)和GFP基因内部的CRISPR抑制所阻断的图示请参见图10。由于CRISPRi复合物(Cas9d-gRNA)抑制GFP的表达,PP5336菌株在45℃以下无色。在高于45℃的温度下,由于无法在升高的温度下形成CRISPRi复合物,所述菌株显示绿色荧光。PP5336菌株的荧光特性表明,所述菌株是筛选Cas9d温度敏感性变体的良好候选物。
实例6.枯草芽孢杆菌中cas9d的变体文库
如前所述,在pel基因座处插入了与实例5中所述的表达盒同一的表达盒的文库。基于实例7中进一步描述的Cas9结构(PDB:5F9R),提出了Cas9d蛋白的不同位点定点变体。如WO 2006042548中先前描述,通过SOE-PCR引入定点变体,并克隆为DNA片段,所述DNA片段具有与枯草芽孢杆菌pel基因座同一的侧翼DNA。如实例5中所述,通过转化进入感受态PP5168而引入不同变体的库。pel基因座的最终图谱如图9已示,其唯一的区别是Cas9d中不同的氨基酸变化。Cas9d中提议的定点变体可发现于表1中。
Figure BDA0002473241340000591
实例7.影响Cas9-gRNA-DNA复合物热稳定性的氨基酸改变的鉴定
分析了具有指导RNA(gRNA)和DNA片段的复合物中化脓链球菌Cas9的蛋白质结构(PDB:5F9R),以鉴别对所述复合物热稳定性至关重要的氨基酸。这些氨基酸的变化将导致Cas9中不稳定的结构域-结构域相互作用、离子位点、柔性区(例如具有高b因子、盐桥、氢键和疏水区域)。其他氨基酸的变化会使与gRNA的相互作用以及与DNA的相互作用不稳定。
当应用选择性筛选系统时,这些变化可以单独引入,或作为选项包括在一个或多个文库中。Cas9是具有超过1300个氨基酸的大分子,并且因此只有通过同时引入若干个取代,才可能对于某些生物系统而言充分的不稳定。
不同概念内的氨基酸改变可以在表2-4中发现。
Figure BDA0002473241340000592
Figure BDA0002473241340000601
Figure BDA0002473241340000602
Figure BDA0002473241340000611
Figure BDA0002473241340000621
Figure BDA0002473241340000622
Figure BDA0002473241340000631
实例8.通过GFP荧光筛选枯草芽孢杆菌中cas9d文库
将表1中列出的不同定点Cas9d变体的文库转化入PP5168并铺板于LBPG+6ug/ml的氯霉素上以针对在如实例2中所述的染色体pel基因座处的整合进行选择。将板在34℃下孵育过夜,并对所有克隆进行绿色荧光测试。所有正确克隆的变体都没有显示荧光,并且与野生型cas9d对照菌株PP5336相同。将不同cas9d变体的单独的转化子在新鲜板LBPG+6ug/ml氯霉素上重新划线,并在30℃、34℃、37℃、40℃、42℃、45℃下孵育过夜。第二天,不同的变体克隆在不同的温度下进行荧光测试。图11显示了板及其GFP荧光的实例。列出了不同变体的定性数据的表可见于表5中,其中荧光水平评分从零到四。零分对应无荧光,并且四分为最高荧光。
Figure BDA0002473241340000641
作为阳性对照,菌株PP5168在所有板上都显示全荧光(得分为四)。具有Cas9d蛋白的PP5336菌株在高达42℃时显示对GFP荧光的完全抑制,并在45℃下显示对GFP荧光的轻微去抑制(荧光评分为二分)。两种Cas9d变体C24和C25已分别在37℃和34℃下显示去抑制。Cas9d变体C28、C29、C30、C31、C33、C34在40℃下开始显示去抑制并且变体C26、C27、C32、C35和C36在42℃下开始显示去抑制。即使在相同种类的变体之间,也可以看到荧光中的差异。两个变体C28和C29在37℃下从零荧光到40℃下的满分四,而变体C31必须达到45℃才能显示满分四。
表中的所有Cas9d变体都显示了去抑制模式,作为对温度的响应,这与原始Cas9d序列非常不同。这将允许Cas9d的特定设计,其与CRISPRi抑制和诱导将发生的生物和过程相匹配。
实例9.液体培养物中Cas9d变体的测试
在实例8中筛选Cas9d变体的枯草芽孢杆菌菌株也在液体培养物中进行了测试,以确定是否可以如平板上的固体培养基所示观察到对温度的响应。将三株对照菌株PP5168、PP5336和PP2307及单独的13个变体克隆首先接种于新鲜的TY培养基中,并在从30℃到45℃的六个单独的温度范围下孵育18小时。菌株PP2307是其中无GFP基因存在的盲对照。阳性对照菌株PP5168在所有温度下都显示预期的荧光。所述菌株没有整合在染色体处的Cas9d基因,并且不能形成抑制性CRISPRi复合物以沉默GFP基因。因此,无论生长和温度如何,所述菌株都能表达GFP。具有wt cas9d基因的PP5336菌株可以形成CRISPRi复合物,并在所有温度(图12a和12b)下抑制GFP荧光蛋白的表达,除了如图12f中所见的45℃下。这与来自实例7(在固体琼脂培养基上测试相同的两个菌株PP5168和PP5336)的结果非常一致。对PP5336菌株的结果的结论是wt Cas9d蛋白在高达42℃的温度下可以形成稳定的CRISPRi复合物,但在45℃下,所述复合物没有功能,并且不能抑制GFP的表达。在液体培养基中生长的13个Cas9d变体也显示与在琼脂板上观察到的相似的模式。在所述实验中,C25板上对温度最敏感的变体也去抑制,并且已经在30℃下显示升高的荧光。变体C24在37℃下开始显示升高的荧光。这两种变体在40℃下及高于40℃显示强烈的去抑制。变体C28、C29、C30和C33在37℃和40℃之间显示去抑制,并且变体C26和C31在42℃下显示强烈的去抑制。变体C27、C32、C35和C36在42℃下显示适度的去抑制,在45℃下显示完全的去抑制。
所述实验结论是,13个定点Cas9d变体均显示与原始Cas9d非常不同的稳定性特性。在固体培养基和流式培养物中,所有变体都显示不同程度的温度敏感性增加。
这一发现表明,可以以改变Cas9d-gRNA抑制剂复合物的温度稳定性的方式来将Cas9d蛋白工程化。可采用改变的温度范围来通过温度的转换来控制Cas9d-gRNA复合物的可用性,所述温度的转换适合所选的宿主生物和优选生长参数的生理条件。
实例10.在流体培养物中测试cas9d变体-温度转换
本实验中将三株对照菌株PP5168、PP5336和PP2307及单独的13个变体克隆首先接种于新鲜的TY培养基中并在30℃下孵育18小时。然后将培养物分成两份,并分别在42℃和45℃下孵育。18小时后,稀释培养物并分析其GFP荧光。结果显示于图13a中。目的是确定温度的突然变化是否可以在抑制剂复合物与靶DNA的结合的情况下使抑制剂复合物不稳定。图13中的结果显示,变体C25、C26、C30和C33对温度变化反应非常有效,并且由于不稳定的抑制剂复合物和GFP基因的去抑制,GFP水平增加。
这一发现清楚地显示,可以将Cas9d蛋白工程化,当其已经与其靶DNA结合时,所述Cas9d蛋白改变了Cas9d-gRNA抑制剂复合物的温度稳定性。可采用改变的温度范围来通过温度的转换来控制Cas9d-gRNA复合物的可用性,所述温度的转换适合所选的宿主生物和优选生长参数的生理条件。通过选择合适的Cas9d变体并将其与适合的温度曲线相组合,就可以控制Cas9d-gRNA复合物的功效并改变其与所选择的DNA靶点的亲和力。通过这种方式,可以通过简单的温度变化来调节任何靶基因。
实例11.具有温度敏感性cas9d变体C25、C30和C33的地衣芽孢杆菌菌株的构建。
将在实例6中描述的枯草芽孢杆菌(C25、C30和C33)的Cas9d最佳定点变体的子集转移到地衣芽孢杆菌菌株PP5007,以研究所述生物体中的抑制曲线。通过SOE-PCR在质粒上分别克隆了Cas9d的三个不同变体。所得到的质粒通过接合分别引入地衣芽孢杆菌PP5007。由从forD启动子表达的cas9d基因、从PamyQsc启动子转录的gDNA(P4199)和赋予氯霉素抗性的cat基因组成的表达盒的染色体插入是通过同源重组获得的,从而产生如图5所示的染色体结构。gDNA(P4199)被转录成gRNA(P4199),gRNA(P4199)指导Cas9d至P4199启动子并抑制转录。所有四个amyL基因拷贝均表达自P4199启动子,并且Cas9d-gRNA复合物可以通过结合并且与P4199靶点的强相互作用潜在地抑制α-淀粉酶的表达,如图6所述。
最终地衣芽孢杆菌菌株命名如下:
PP5541–Cas9d变体C25
PP5360–Cas9d变体C30
PP5542–Cas9d变体C33
除了表1中所述的Cas9d中的氨基酸取代之外,所有三个菌株都与实例3中所述的PP5021相同。在枯草芽孢杆菌中筛选出Cas9d变体作为温度敏感性变体。
实例12.地衣芽孢杆菌PP5541、PP5360和PP5542中α-淀粉酶的表达-温度转换。
如上所述,对于实例11中所述的地衣芽孢杆菌菌株在不同温度下在分批给料培养中的α-淀粉酶生产率进行了测试。当菌株在42℃下生长全部五天(图15)时,观察到的全部淀粉酶生产率,显示所有三个变体的Cas9d抑制复合物的完全的去抑制。在另一组实验中,所述菌株在30℃或42℃下生长两天。然后将温度分别转换到42℃和30℃,以观察P4199启动子对淀粉酶表达的影响。每天取培养物样品测定淀粉酶活性。结果如图15所示,其显示了在48小时时对温度转换的明显影响。当菌株在30℃下生长前两天时,具有gRNA(P4199)的Cas9d变体的存在导致淀粉酶生产率的抑制。当温度升高到42℃时,所有三个菌株的淀粉酶生产率都有所增加,PP5541(C25)对升高的温度响应最强。这些数据表明,当温度升高时,对从P4199启动子的转录的抑制被去抑制,并且变体C25对温度最敏感。这与枯草芽孢杆菌中相同Cas9d变体在平板上所观察到的结果非常一致。
当在42℃下开始培养时,观察到所有测试菌株的淀粉酶生产率良好(图15)。两天后当温度降低到30℃时,淀粉酶的生产率明显降低,表明从P4199启动子的转录受到抑制。总之,培养的地衣芽孢杆菌菌株确认了Cas9d变体在用于地衣芽孢杆菌适用的温度区间内的温度敏感性。
实例13.地衣芽孢杆菌Cas9d变体C25的α-淀粉酶表达曲线
在实例11和12中,地衣芽孢杆菌菌株PP5541进一步测试了α-淀粉酶生产率和对分批给料培养中温度转换的响应。当菌株在42℃下在三个单独的发酵过程中的前两天生长时,观察到全淀粉酶生产率(图16)。然后,在三种发酵过程中,温度分别降低转换到35℃、37℃或39℃。在图16中显示了降到35℃和37℃有效地抑制淀粉酶的表达,而降到39℃仍然允许一些表达。
实例14.基于温度敏感性变体C25的枯草芽孢杆菌Cas9d变体文库。
为了获得具有温度敏感性增加的Cas9d变体,如实例5所述构建了基于Cas9d变体C25的表达盒文库,并将其在pel基因座处插入染色体中。Cas9d蛋白的不同定点变体是,除了在C25中发现的氨基酸取代S104A、F105H、V107S之外,还基于实例7中描述的Cas9结构(PDB:5F9R)。如WO 2006042548中先前描述,通过SOE-PCR引入定点变体,并克隆为DNA片段,所述DNA片段具有与枯草芽孢杆菌pel基因座同一的侧翼DNA。如实例5中所述,通过转化进入感受态PP5168而引入不同变体的库。pel基因座的最终图谱如图9所示,唯一的不同是密码子修饰以适合Cas9d中不同的氨基酸变化。在LBPGS+6ug/ml氯霉素板上进行初步筛选鉴定改进的温度敏感性Cas9d变体并在30℃、34℃、37℃和42℃下孵育过夜。第二天,在34℃、37℃和42℃下鉴定并分离出看上去比C25更具热敏性的绿色克隆。通过测序确定选择的菌株的氨基酸取代。所得到的Cas9d中的定点变体如表6所示。
Figure BDA0002473241340000681
实例15.通过枯草芽孢杆菌中的GFP荧光筛选改进的温度敏感性Cas9d菌株
将表6中列出的具有不同定点Cas9d变体的已鉴定菌株划线到LBPG+6ug/ml氯霉素平板上,并在30℃、34℃、37℃和42℃下孵育过夜。第二天,不同的变体克隆在不同的温度下进行荧光测试,如图11所示。列出了不同变体的定性数据的表可见于表7中,其中荧光水平评分从零到四。零分对应无荧光,并且四分为最高荧光。
Figure BDA0002473241340000691
作为阳性对照,菌株PP5168在所有板上都显示全荧光(得分为四)。具有Cas9d蛋白的菌株PP5200在高达42℃时显示GFP荧光的完全抑制。Cas9d变体C38和C43在30℃下已经显示轻微的去抑制。Cas9d变体C37、C39、C40和C42在34℃下显示起始去抑制,而C41在37℃下显示去抑制。基于C25构建的所有Cas9d变体与C25相比显示更高的温度敏感性,在37℃时得分为4。
实例16.液体培养物中改进的Cas9d变体的测试。
实例14中所述的具有Cas9d变体的枯草芽孢杆菌菌株也在液体培养物中进行测试,以确定对温度的响应。将表达wt Cas9d的菌株PP5336、表达Cas9d的温度敏感性变体的C25和单独的七个变体首先接种于新鲜的TY培养基中,并在30℃、34℃、37℃和42℃下孵育18小时。每个菌株接种两个独立的培养物。在液体培养基中生长的七个改进的Cas9d变体显示与在琼脂板上观察到的相似的模式(图17)。在42℃下,所有菌株都显示显著的高GFP活性,并且数据是为了说明图17中未包括的原因。在这项实验中,平板上鉴定的对温度最敏感的变体C38也被去抑制,并且在34℃下已经显示高荧光。
实验结论是,改进的七个定点Cas9d变体均显示不同于Cas9d C25变体的稳定性特性。在固体培养基和流式培养物中,所有变体都显示不同程度的温度敏感性增加。
实例17.枯草芽孢杆菌中另外的Cas9d的变体文库。
为了获得另外的Cas9d温度敏感性变体(其氨基酸取代也可以是Cas9d的去稳定,与实例6中描述的氨基酸取代类似),构建了如实施例6中描述的并在pel基因座处插入的表达盒的文库。Cas9d蛋白的不同定点变体基于实例7中进一步描述的Cas9结构(PDB:5F9R)。如WO 2006042548中先前描述,通过SOE-PCR引入定点变体,并克隆为DNA片段,所述DNA片段具有与枯草芽孢杆菌pel基因座同一的侧翼DNA。如实例5中所述,通过转化进入感受态PP5168而引入不同变体的库。pel基因座的最终图谱如图9已示,其唯一的区别是Cas9d中不同的氨基酸变化。在LBPGS板上进行初步筛选鉴定改进的温度敏感性Cas9d变体并在30℃和42℃下孵育过夜。第二天,鉴定并分离出在42℃下的绿色克隆。所得到的Cas9d中的定点变体如表8所示。
Figure BDA0002473241340000701
实例18.通过枯草芽孢杆菌中的GFP荧光筛选新的温度敏感性Cas9d菌株
将表8中列出的具有不同定点Cas9d变体的已鉴定菌株划线到LBPG+6ug/ml氯霉素平板上,并在30℃、34℃、37℃和42℃下孵育过夜。第二天,将不同的变体克隆在不同的温度下以类似于图11中所示的方法进行荧光测试。列出了不同变体的定性数据的表可见于表9中,其中荧光水平评分从零到四。零分对应无荧光,并且四分为最高荧光。
Figure BDA0002473241340000702
作为阳性对照,菌株PP5168在所有板上都显示全荧光(得分为四)。具有wt Cas9d蛋白的PP5200菌株在高达42℃时显示GFP荧光的完全抑制。Cas9d变体C44在30℃下已经显示轻微的去抑制,Cas9d变型C46、C47和C48在34℃下显示去抑制,并且C45在37℃下显示去抑制。
实例19.具有温度敏感性cas9d变体C38、C40、C42和C43的地衣芽孢杆菌菌株的构建
选择四个温度敏感性cas9d变体(C38、C40、C42和C43)进行质粒构建,用于在地衣芽孢杆菌forD基因座中的染色体整合。将实例2中描述的地衣芽孢杆菌PP5007菌株用作插入温度敏感性cas9d变体和从PamyQsc启动子表达的gDNA(P4199)的亲本菌株。类似于实例2中所述,用被选择的Cas9变体构建质粒。然后所得到的质粒通过接合引入地衣芽孢杆菌PP5007。由从forD启动子表达的cas9d基因、从PamyQsc启动子转录的gDNA(P4199)和赋予氯霉素抗性的cat基因组成的表达盒的染色体插入是通过同源重组获得的,从而产生如图5所示的染色体结构。构建的菌株示出于表10中。gDNA(P4199)被转录成gRNA(P4199),gRNA(P4199)指导Cas9d至P4199启动子并抑制转录。菌株BKQ3746、BKQ3748、BKQ3750和BKQ3752中的所有四个amyL基因拷贝均表达自P4199启动子,并且Cas9d-gRNA复合物可以通过结合并且与P4199靶点的强相互作用潜在地抑制α-淀粉酶的表达,如图6所述。
Figure BDA0002473241340000711
实例20.地衣芽孢杆菌BKQ3746、BKQ3748、BKQ3750和BKQ3752中α-淀粉酶的表达-温度转换。
如上所述,对于实例18中所述的地衣芽孢杆菌菌株在温度转换后在分批给料培养中的α-淀粉酶生产率进行了测试。所述菌株在30℃或44℃下生长两天。然后将温度分别转换到44℃和30℃,以观察P4199启动子对淀粉酶表达的影响。每天取培养物样品测定淀粉酶活性。结果如图18所示,其显示了对温度转换的明显影响。当菌株在30℃下生长前两天时,具有gRNA(P4199)的Cas9d变体的存在导致淀粉酶生产率的抑制,虽然发现表达Cas9d变体C38的BKQ3746有漏洞。当温度升高到44℃时,淀粉酶的生产率增加,其中BKQ3746(C38)>BKQ3752(C43)>BKQ3750(C42)>BKQ3748(C40)>PP5541(C25)。这些数据表明,当温度升高时,对从P4199启动子的转录的抑制被去抑制。这与枯草芽孢杆菌中相同Cas9d变体在平板上所观察到的结果非常一致。当在44℃下开始培养时,观察到所有测试菌株的淀粉酶生产率良好(图18)。两天后当温度降低到30℃时,淀粉酶的生产率明显降低,表明从P4199启动子的转录受到抑制。
总之,培养的地衣芽孢杆菌菌株确认了所用Cas9d变体在用于地衣芽孢杆菌适用的温度区间内的温度敏感性。
优选的实施例
1)一种II类Cas9蛋白的温度敏感性变体(tsCas9),所述变体包含对蛋白质稳定性或对所述II类Cas9蛋白、一个或多个指导RNA(gRNA)和一个或多个相对应的基因组靶序列之间形成的复合物的稳定性重要的一个或多个氨基酸的至少一个改变,其中,所述至少一个改变是1-10个氨基酸的取代、插入或缺失;优选地,所述至少一个改变是1-10个氨基酸的取代或缺失;最优选地,所述至少一个改变是取代。
2)根据第一实施例所述的tsCas9,所述变体是切割酶或核酸酶无效变体;优选地,所述tsCas9包含对应于SEQ ID NO:2的位置10和/或位置840的氨基酸的改变;更优选地,所述变体包含天冬氨酸取代丙氨酸,D10A和/或组氨酸取代丙氨酸,H840A。
3)根据实施例1-2中任一项所述的tsCas9,其中所述至少一个改变是在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的T13、N14、S29、K31、F32、L35、K44、N46、S55、E57、T62、R63、K65、R66、R69、R70、R71、Y72、R74、R75、R78、S104、F105、V107、E108、R115、H116、V126、H129、Y136、H160、K163、F164、R165、P176、S179、E223、N235、E260、D261、D269、T310、P316、Y325、H328、H329、K336、R340、Y347、F351、F352、I363、D364、R403、P411、Q413、I414、Y430、F432、I448、Y450、P454、L455、R457、N459、S460、R461、F462、R467、T472、F491、M495 N497、Y515、R557、G582、R653、T657、R661、Q695、H698、S719、L720、H721、K735、L738、K742、M751、R765 S777、E779、D850、Q894、E910、L911、F916、K918、Q920、T924、R925、Q926、K929、Q933、R951、S960、S964、K968、R976、V982、Y1013、G1030、A1032、K1085、M1089、P1090、Q1091、T1098、E1099、V1100、T1102、G1103、F1105、K1107 E1108、S1109、K1113、R11414、N1115、S1116、D1117、K1118、K1123、K1124、F1134、D1135、W1126、K1135、R1171、K1197、K1211、S1216、E1219、E1243、R1279、D1284、P1301、H1311、R1333、K1334、R1335、T1337、S1338、H1349、Y1356和T1358。
4)根据实施例1-3中任一项所述的tsCas9,其中所述至少一个氨基酸改变是在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的P176、S179、E223、E260、D261、T310、P316、P411、Q413、I414、Y430、F432、R457、N459、R461、R557、R653、E910、L911、R951、K1123、W1126、P1301和H1311。
5)根据实施例1-3中任一项所述的tsCas9,其中所述至少一个氨基酸改变是在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的S29、K31、F32、L35、K44、N46、E57、T62、R63、K65、R66、R69、R70、R71、Y72、R74、R75、R78、S104、F105、V107、E108、R115、H116、V126、H129、Y136、H160、K163、F164、R165、Y325、H328、H329、K336、R340、Y347、F351、F352、I363、D364、R403、I448、P454、L455、R457、N459、S460、R461、F462、R467、T472、Y515、R661、S719、L720、H721、K735、L738、K742、M751、S777、E779、D850、K918、Q933、V982、K1085、M1089、P1090、Q1091、T1098、E1099、V1100、T1102、G1103、F1105、E1108、K1113、K1123、K1124、F1134、R1171、K1197、K1211、R1279、H1349、Y1356和T1358。
6)根据实施例1-3中任一项所述的tsCas9,其中所述至少一个氨基酸改变是在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的T13、N14、S55、D269、Y450、F491、M495、N497、G582、T657、R661、Q695、H698、R765、S777、Q894、F916、K918、Q920、T924、R925、Q926、K929、S960、S964、K968、R976、Y1013、G1030、A1032、K1107、E1108、S1109、R1114、N1115、S1116、D1117、K1118、D1135、S1216、E1219、E1243、D1284、R1333、K1334、R1335、T1337和S1338。
7)根据实施例1-3中任一项所述的tsCas9,其中所述至少一个氨基酸改变是在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的S29、K31、F32、L35、K44、N46、E57、T62、R63、K65、R66、R69、R70、R71、Y72、R74、R75、R78、S104、F105、V107、E108、R115、H116、V126、H129、Y136、H160、K163、F164、R165、P176、S179、E223、E260、D261、T310、P316、Y325、H328、H329、K336、R340、Y347、F351、F352、I363、D364、R403、P411、Q413、I414、Y430、F432、I448、P454、L455、R457、N459、S460、R461、F462、R467、T472、Y515、R557、R653、R661、S719、L720、H721、K735、L738、K742、M751、S777、E779、D850、E910、L911、K918、Q933、R951,V982、K1085、M1089、P1090、Q1091、T1098、E1099、V1100、T1102、G1103、F1105、E1108、K1113、K1123、K1124、F1134、W1126、R1171、K1197、K1211、R1279、P1301、H1311、H1349、Y1356和T1358。
8)根据实施例1-3中任一项所述的tsCas9,其中所述至少一个氨基酸改变是在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的T13、N14、S55、P176、S179、E223、E260、D261、D269、T310、P316、P411、Q413、I414、Y430、F432、Y450、R457、N459、R461、F491、M495、N497、R557、G582、R653、T657、R661、Q695、H698、R765、S777、Q894、E910、L911、F916、K918、Q920、T924、R925、Q926、K929、R951、S960、S964、K968、R976、Y1013、G1030、A1032、K1107、E1108、S1109、R1114、N1115、S1116、D1117、K1118、K1123、W1126、D1135、S1216、E1219、E1243、D1284、P1301、H1311、R1333、K1334、R1335、T1337和S1338。
9)根据实施例1-3中任一项所述的tsCas9,其中所述至少一个氨基酸改变是在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的T13、N14、S29、K31、F32、L35、K44、N46、S55、E57、T62、R63、K65、R66、R69、R70、R71、Y72、R74、R75、R78、S104、F105、V107、E108、R115、H116、V126、H129、Y136、H160、K163、F164、R165、D269、Y325、H328、H329、K336、R340、Y347、F351、F352、I363、D364、R403、I448、Y450、P454、L455、R457、N459、S460、R461、F462、R467、T472、F491、M495、N497、Y515、G582、T657、R661、Q695、H698、S719、L720、H721、K735、L738、K742、M751、R765、S777、E779、D850、Q894、F916、K918、Q920、T924、R925、Q926、K929、Q933、S960、S964、K968、R976、V982、Y1013、G1030、A1032、K1085、M1089、P1090、Q1091、T1098、E1099、V1100、T1102、G1103、F1105、K1107、E1108、S1109、K1113、R1114、N1115、S1116、D1117、K1118、K1123、K1124、F1134、D1135、R1171、K1197、K1211、S1216、E1219、E1243、R1279、D1284、R1333、K1334、R1335、T1337、S1338、H1349、Y1356和T1358。
10)根据实施例1-3中任一项所述的tsCas9,其中所述至少一个改变是在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的S104、F105、V107、P176、S179、E223、N235、T310、P316、P411、Q413、I414、Y430、F432、R457、N459、P475、W476、R557、R653和R951。
11)根据实施例1-3中任一项所述的tsCas9,其中所述至少一个氨基酸改变选自由以下组成的组:T13S、T13A、N14D、N14S、N14A、S29A、S29G、S29T、S29V、K31R、K31Q、K31H、K31M、K31L、F32Y、F32H、F32H、F32L、F32I、F32M、L35V、L35A、L35T、L35I、L35M、L35F、L35H、K44R、K44Q、K44H、K44M、K44L、K44D、K44N、K44H、K44M、K44L、N46D、N46S、N46T、N46Q、S55A、E57Q、E57D、E57N、E57H、T62S、T62A、T62V、T62P、R63K、R63H、R63Q、R63E、K65R、K65H、K65Q、K65M、K65L、R66K、R66H、R66Q、R66E、R69K、R69H、R69Q、R69E、R70K、R70H、R70Q、R70E、R71K、R71H、R71Q、R71E、Y72F、Y72H、Y72L、Y72M、Y72I、Y72W、R74K、R74H、R74Q、R74E、R75K、R75H、R75Q、R75E、R78K、R78H、R78Q、R78E、S104A、S104A、S104T、S104V、F105H、F105L、F105M、F105I、F105Y、F105W、V107S、V107A、V107I、V107L、V107T、E108Q、E108D、E108N、R115K、R115H、R115Q、R115E、H116F、H116Y、H116Q、H116E、H116N、H116D、H116S、H116T、V126I、V126L、V126A、V126T、V126S、H129F、H129Y、H129Q、H129E、H129N、H129D、H129S、H129T、Y136F、Y136H、Y136L、Y136M、Y136I、Y136W、H160F、H160Y、H160Q、H160E、H160N、H160D、H160S、H160T、K163R、K163H、K163Q、K163E、K163M、K163L、F164Y、F164H、F164M、F164L、F164I、F164W、R165K、R165H、R165Q、R165E、P176A、P176G、P176S、P176T、P176V、S179A、S179G、S179T、S179V、S179P、E223Q、E223D、E223N、E223H、E223S、E223A、E223I、E223L、E223T、E223V、E223P、E223K、E223Y、E223W、E223F、E223G、E223C、E223R、N235NGSGAGGSY、E260Q、E260S、D261N、D261S、D269N、D269S、D269A、T310A、T310G、P316G、P316D、Y325F、Y325H、Y325L、Y325M、Y325I、Y325W、H328F、H328Y、H328Q、H328E、H328N、H328D、H328S、H328T、H329F、H329Y、H329Q、H329E、H329N、H329D、H329S、H329T、K336R、K336H、K336M、K336L、R340K、R340H、R340Q、R340E、Y347F、Y347H、Y347M、Y347L、Y347I、F351H、F351Y、F351M、F351L、F351I、F351W、F352H、F352Y、F352M、F352L、F352I、F352W、I363F、I363L、I363M、I363V、I363A、I363T、D364E、D364Q、D364H、D364N、D364S、D364T、R403K、R403H、R403Q、R403E、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、I448L、I448M、I448V、I448A、Y450H、Y450L、Y450F、P454A、P454G、P454S、P454T、P454V、L455I、L455V、L455M、L455T、L455N、L455F、L455A、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、S460A、S460G、S460T、S460V、R461K、R461H、R461Q、R461E、R461S、F462Y、F462H、F462L、F462I、F462V、F462W、R467K、R467H、R467Q、R467E、T472A、T472P、T472S、T472V、F491H、F491L、M495K、M495Q、M495L、N497D、N497Q、N497E、N497S、Y515F、Y515H、Y515M、Y515L、R557K、R557S、G582A、G582S、G582T、G582V、R653H、R653N、T657S、T657A、T657N、R661K、R661H、R661Q、R661E、Q695E、Q695N、Q695D、H698F、H698Q、H698N、S719A、S719T、S719V、L720I、L720V、L720M、L720T、L720N、L720F、L720A、H721F、H721Y、H721Q、H721E、H721N、H721D、H721S、H721T、K735R、K735Q、K735H、K735M、K735L、L738I、L738V、L738M、L738T、L738N、L738F、L738A、K742R、K742Q、K742H、K742M、K742L、M751L、M751I、M751V、M751T、M751K、R765K、R765H、R765Q、S777A、S777N、S777D、E779Q、E779H、E779D、E779N、D850N、D850S、D850A、Q894E、Q894N、Q894S、E910Q、E910S、L911V、L911A、F916H、F916L、F916M、F916I、F916A、K918Q、K918R、K918H、K918M、K918L、Q920E、Q920N、Q920S、Q920A、T924S、T924A、R925K、R925H、R925Q、Q926K、Q926E、Q926N、Q926D、K929R、K929H、K929Q、Q933E、Q933H、Q933K、Q933N、R951Q、R951S、S960A、S964A、K968Q、K968H、K968M、K968L、R976K、R976Q、R976H、V982A、V982T、V982L、V982I、Y1013F、Y1013H、G1030A、G1030S、G1030T、G1030V、A1032G、A1032S、A1032T、A1032V、K1085R、K1085Q、K1085H、K1085M、K1085L、M1089L、M1089I、M1089V、M1089T、M1089K、P1090A、P1090G、P1090S、P1090T、P1090V、Q1091D、Q1091S、Q1091E、Q1091H、Q1091K、Q1091N、T1098A、T1098P、T1098S、T1098V、E1099、E1099Q、E1099D、E1099N、E1099H、V1100A、V1100G、V1100T、V1100S、V1100I、V1100L、T1102A、T1102P、T1102S、T1102V、G1103A、G1103P、G1103S、F1105Y、F1105H、F1105L、F1105I、F1105V、F1105W、K1107R、K1107Q、K1107M、E1108Q、E1108D、E1108N、S1109A、S1109T、S1109N、S1109D、K1113R、K1113Q、K1113H、K1113M、K1113L、R1114K、R1114Q、R1114H、N1115D、N1115A、N1115S、S1116A、D1117N、D1117S、D1117A、K1118Q、K1118H、K1118M、K1118L、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、K1124R、K1124Q、K1124H、K1124M、K1124L、W1126Y、W1126S、F1134Y、F1134H、F1134L、F1134I、F1134V、F1134W、D1135N、D1135S、D1135A、R1171K、R1171H、R1171Q、R1171E、K1197R、K1197Q、K1197H、K1197M、K1197L、K1211R、K1211Q、K1211H、K1211M、K1211L、S1216A、E1219Q、E1219D、E1219N、E1243Q、E1243D、E1243N、E1243S、E1243A、R1279K、R1279H、R1279Q、R1279E、D1284N、D1284S、D1284A、P1301S、P1301G、H1311Y、H1311S、R1333K、R1333Q、R1333H、K1334R、K1334Q、K1334M、K1334L、R1335K、R1335Q、R1335H、T1337A、T1337S、S1338A、H1349F、H1349Y、H1349Q、H1349E、H1349N、H1349D、H1349S、H1349T、Y1356F、Y1356W、Y1356H、Y1356Q、Y1356E、Y1356N、Y1356D、Y1356S、Y1356T、T1358A、T1358P、T1358S和T1358V。
12)根据实施例11所述的tsCas9,其中所述至少一个氨基酸改变选自由以下组成的组:P176A、P176G、P176S、P176T、P176V、S179A、S179G、S179T、S179V、S179P、E223Q、E223D、E223N、E223H、E223S、E223A、E223I、E223L、E223T、E223V、E223P、E223K、E223Y、E223W、E223F、E223G、E223C、E223R、E260Q、E260S、D261N、D261S、T310A、T310G、P316G、P316D、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、R461K、R461H、R461Q、R461E、R461S、R557K、R557S、R653H、R653N、E910Q、E910S、L911V、L911A、R951Q、R951S、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、P1301S、P1301G、H1311Y和H1311S。
13)根据实施例11所述的tsCas9,其中所述至少一个氨基酸改变选自由以下组成的组:S29A、S29G、S29T、S29V、K31R、K31Q、K31H、K31M、K31L、F32Y、F32H、F32H、F32L、F32I、F32M、L35V、L35A、L35T、L35I、L35M、L35F、L35H、K44R、K44Q、K44H、K44M、K44L、E57Q、K44D、K44N、K44H、K44M、K44L、N46D、N46S、N46T、N46Q、E57Q、E57D、E57N、E57H、T62S、T62A、T62V、T62P、R63K、R63H、R63Q、R63E、K65R、K65H、K65Q、K65M、K65L、R66K、R66H、R66Q、R66E、R69K、R69H、R69Q、R69E、R70K、R70H、R70Q、R70E、R71K、R71H、R71Q、R71E、Y72F、Y72H、Y72L、Y72M、Y72I、Y72W、R74K、R74H、R74Q、R74E、R75K、R75H、R75Q、R75E、R78K、R78H、R78Q、R78E、S104A、S104A、S104T、S104V、F105H、F105L、F105M、F105I、F105Y、F105W、V107S、V107A、V107I、V107L、V107T、E108Q、E108D、E108N、R115K、R115H、R115Q、R115E、H116F、H116Y、H116Q、H116E、H116N、H116D、H116S、H116T、V126I、V126L、V126A、V126T、V126S、H129F、H129Y、H129Q、H129E、H129N、H129D、H129S、H129T、Y136F、Y136H、Y136L、Y136M、Y136I、Y136W、H160F、H160Y、H160Q、H160E、H160N、H160D、H160S、H160T、K163R、K163H、K163Q、K163E、K163M、K163L、F164Y、F164H、F164M、F164L、F164I、F164W、R165K、R165H、R165Q、R165E、Y325F、Y325H、Y325L、Y325M、Y325I、Y325W、H328F、H328Y、H328Q、H328E、H328N、H328D、H328S、H328T、H329F、H329Y、H329Q、H329E、H329N、H329D、H329S、H329T、K336R、K336H、K336M、K336L、R340K、R340H、R340Q、R340E、Y347F、Y347H、Y347M、Y347L、Y347I、F351H、F351Y、F351M、F351L、F351I、F351W、F352H、F352Y、F352M、F352L、F352I、F352W、I363F、I363L、I363M、I363V、I363A、I363T、D364E、D364Q、D364H、D364N、D364S、D364T、R403K、R403H、R403Q、R403E、I448L、I448M、I448V、I448A、P454A、P454G、P454S、P454T、P454V、L455I、L455V、L455M、L455T、L455N、L455F、L455A、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、S460A、S460G、S460T、S460V、R461K、R461H、R461Q、R461E、R461S、F462Y、F462H、F462L、F462I、F462V、F462W、R467K、R467H、R467Q、R467E、T472A、T472P、T472S、T472V、Y515F、Y515H、Y515M、Y515L、R661K、R661H、R661Q、R661E、S719A、S719T、S719V、L720I、L720V、L720M、L720T、L720N、L720F、L720A、H721F、H721Y、H721Q、H721E、H721N、H721D、H721S、H721T、K735R、K735Q、K735H、K735M、K735L、L738I、L738V、L738M、L738T、L738N、L738F、L738A、K742R、K742Q、K742H、K742M、K742L、M751L、M751I、M751V、M751T、M751K、S777A、S777N、S777D、E779Q、E779H、E779D、E779N、D850N、D850S、D850A、K918Q、K918R、K918H、K918M、K918L、Q933E、Q933H、Q933K、Q933N、V982A、V982T、V982L、V982I、K1085R、K1085Q、K1085H、K1085M、K1085L、M1089L、M1089I、M1089V、M1089T、M1089K、P1090A、P1090G、P1090S、P1090T、P1090V、Q1091D、Q1091S、Q1091E、Q1091H、Q1091K、Q1091N、T1098A、T1098P、T1098S、T1098V、E1099、E1099Q、E1099D、E1099N、E1099H、V1100A、V1100G、V1100T、V1100S、V1100I、V1100L、T1102A、T1102P、T1102S、T1102V、G1103A、G1103P、G1103S、F1105Y、F1105H、F1105L、F1105I、F1105V、F1105W、E1108Q、E1108D、E1108N、K1113R、K1113Q、K1113H、K1113M、K1113L、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、K1124R、K1124Q、K1124H、K1124M、K1124L、F1134Y、F1134H、F1134L、F1134I、F1134V、F1134W、R1171K、R1171H、R1171Q、R1171E、K1197R、K1197Q、K1197H、K1197M、K1197L、K1211R、K1211Q、K1211H、K1211M、K1211L、R1279K、R1279H、R1279Q、R1279E、H1349F、H1349Y、H1349Q、H1349E、H1349N、H1349D、H1349S、H1349T、Y1356F、Y1356W、Y1356H、Y1356Q、Y1356E、Y1356N、Y1356D、Y1356S、Y1356T、T1358A、T1358P、T1358S和T1358V。
14)根据实施例11所述的tsCas9,其中所述至少一个氨基酸改变选自由以下组成的组:T13S、T13A、N14D、N14S、N14A、S55A、D269N、D269S、D269A、Y450H、Y450L、Y450F、F491H、F491L、M495K、M495Q、M495L、N497D、N497Q、N497E、N497S、G582A、G582S、G582T、G582V、T657S、T657A、T657N、R661K、R661H、R661Q、R661E、Q695E、Q695N、Q695D、H698F、H698Q、H698N、R765K、R765H、R765Q、S777A、S777N、S777D、Q894E、Q894N、Q894S、F916H、F916L、F916M、F916I、F916A、K918Q、K918R、K918H、K918M、K918L、Q920E、Q920N、Q920S、Q920A、T924S、T924A、R925K、R925H、R925Q、Q926K、Q926E、Q926N、Q926D、K929R、K929H、K929Q、S960A、S964A、K968Q、K968H、K968M、K968L、R976K、R976Q、R976H、Y1013F、Y1013H、G1030A、G1030S、G1030T、G1030V、A1032G、A1032S、A1032T、A1032V、K1107R、K1107Q、K1107M、E1108Q、E1108D、E1108N、S1109A、S1109T、S1109N、S1109D、R1114K、R1114Q、R1114H、N1115D、N1115A、N1115S、S1116A、D1117N、D1117S、D1117A、K1118Q、K1118H、K1118M、K1118L、D1135N、D1135S、D1135A、S1216A、E1219Q、E1219D、E1219N、E1243Q、E1243D、E1243N、E1243S、E1243A、D1284N、D1284S、D1284A、R1333K、R1333Q、R1333H、K1334R、K1334Q、K1334M、K1334L、R1335K、R1335Q、R1335H、T1337A、T1337S和S1338A。
15)根据实施例11所述的tsCas9,其中所述至少一个氨基酸改变选自由以下组成的组:S29A、S29G、S29T、S29V、K31R、K31Q、K31H、K31M、K31L、F32Y、F32H、F32H、F32L、F32I、F32M、L35V、L35A、L35T、L35I、L35M、L35F、L35H、K44R、K44Q、K44H、K44M、K44L、E57Q、K44D、K44N、K44H、K44M、K44L、N46D、N46S、N46T、N46Q、E57Q、E57D、E57N、E57H、T62S、T62A、T62V、T62P、R63K、R63H、R63Q、R63E、K65R、K65H、K65Q、K65M、K65L、R66K、R66H、R66Q、R66E、R69K、R69H、R69Q、R69E、R70K、R70H、R70Q、R70E、R71K、R71H、R71Q、R71E、Y72F、Y72H、Y72L、Y72M、Y72I、Y72W、R74K、R74H、R74Q、R74E、R75K、R75H、R75Q、R75E、R78K、R78H、R78Q、R78E、S104A、S104A、S104T、S104V、F105H、F105L、F105M、F105I、F105Y、F105W、V107S、V107A、V107I、V107L、V107T、E108Q、E108D、E108N、R115K、R115H、R115Q、R115E、H116F、H116Y、H116Q、H116E、H116N、H116D、H116S、H116T、V126I、V126L、V126A、V126T、V126S、H129F、H129Y、H129Q、H129E、H129N、H129D、H129S、H129T、Y136F、Y136H、Y136L、Y136M、Y136I、Y136W、H160F、H160Y、H160Q、H160E、H160N、H160D、H160S、H160T、K163R、K163H、K163Q、K163E、K163M、K163L、F164Y、F164H、F164M、F164L、F164I、F164W、R165K、R165H、R165Q、R165E、P176A、P176G、P176S、P176T、P176V、S179A、S179G、S179T、S179V、S179P、E223Q、E223D、E223N、E223H、E223S、E223A、E223I、E223L、E223T、E223V、E223P、E223K、E223Y、E223W、E223F、E223G、E223C、E223R、E260Q、E260S、D261N、D261S、T310A、T310G、P316G、P316D、Y325F、Y325H、Y325L、Y325M、Y325I、Y325W、H328F、H328Y、H328Q、H328E、H328N、H328D、H328S、H328T、H329F、H329Y、H329Q、H329E、H329N、H329D、H329S、H329T、K336R、K336H、K336M、K336L、R340K、R340H、R340Q、R340E、Y347F、Y347H、Y347M、Y347L、Y347I、F351H、F351Y、F351M、F351L、F351I、F351W、F352H、F352Y、F352M、F352L、F352I、F352W、I363F、I363L、I363M、I363V、I363A、I363T、D364E、D364Q、D364H、D364N、D364S、D364T、R403K、R403H、R403Q、R403E、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、I448L、I448M、I448V、I448A、P454A、P454G、P454S、P454T、P454V、L455I、L455V、L455M、L455T、L455N、L455F、L455A、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、S460A、S460G、S460T、S460V、R461K、R461H、R461Q、R461E、R461S、F462Y、F462H、F462L、F462I、F462V、F462W、R467K、R467H、R467Q、R467E、T472A、T472P、T472S、T472V、Y515F、Y515H、Y515M、Y515L、R557K、R557S、R653H、R653N、R661K、R661H、R661Q、R661E、S719A、S719T、S719V、L720I、L720V、L720M、L720T、L720N、L720F、L720A、H721F、H721Y、H721Q、H721E、H721N、H721D、H721S、H721T、K735R、K735Q、K735H、K735M、K735L、L738I、L738V、L738M、L738T、L738N、L738F、L738A、K742R、K742Q、K742H、K742M、K742L、M751L、M751I、M751V、M751T、M751K、S777A、S777N、S777D、E779Q、E779H、E779D、E779N、D850N、D850S、D850A、E910Q、E910S、L911V、L911A、K918Q、K918R、K918H、K918M、K918L、Q933E、Q933H、Q933K、Q933N、R951Q、R951S、V982A、V982T、V982L、V982I、K1085R、K1085Q、K1085H、K1085M、K1085L、M1089L、M1089I、M1089V、M1089T、M1089K、P1090A、P1090G、P1090S、P1090T、P1090V、Q1091D、Q1091S、Q1091E、Q1091H、Q1091K、Q1091N、T1098A、T1098P、T1098S、T1098V、E1099、E1099Q、E1099D、E1099N、E1099H、V1100A、V1100G、V1100T、V1100S、V1100I、V1100L、T1102A、T1102P、T1102S、T1102V、G1103A、G1103P、G1103S、F1105Y、F1105H、F1105L、F1105I、F1105V、F1105W、E1108Q、E1108D、E1108N、K1113R、K1113Q、K1113H、K1113M、K1113L、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、K1124R、K1124Q、K1124H、K1124M、K1124L、F1134Y、F1134H、F1134L、F1134I、F1134V、F1134W、R1171K、R1171H、R1171Q、R1171E、K1197R、K1197Q、K1197H、K1197M、K1197L、K1211R、K1211Q、K1211H、K1211M、K1211L、R1279K、R1279H、R1279Q、R1279E、P1301S、P1301G、H1311Y、H1311S、H1349F、H1349Y、H1349Q、H1349E、H1349N、H1349D、H1349S、H1349T、Y1356F、Y1356W、Y1356H、Y1356Q、Y1356E、Y1356N、Y1356D、Y1356S、Y1356T、T1358A、T1358P、T1358S和T1358V。
16)根据实施例11所述的tsCas9,其中所述至少一个氨基酸改变选自由以下组成的组:T13S、T13A、N14D、N14S、N14A、S55A、P176A、P176G、P176S、P176T、P176V、S179A、S179G、S179T、S179V、S179P、E223Q、E223D、E223N、E223H、E223S、E223A、E223I、E223L、E223T、E223V、E223P、E223K、E223Y、E223W、E223F、E223G、E223C、E223R、E260Q、E260S、D261N、D261S、D269N、D269S、D269A、T310A、T310G、P316G、P316D、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、Y450H、Y450L、Y450F、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、R461K、R461H、R461Q、R461E、R461S、F491H、F491L、M495K、M495Q、M495L、N497D、N497Q、N497E、N497S、R557K、R557S、G582A、G582S、G582T、G582V、R653H、R653N、T657S、T657A、T657N、R661K、R661H、R661Q、R661E、Q695E、Q695N、Q695D、H698F、H698Q、H698N、R765K、R765H、R765Q、S777A、S777N、S777D、Q894E、Q894N、Q894S、E910Q、E910S、L911V、L911A、F916H、F916L、F916M、F916I、F916A、K918Q、K918R、K918H、K918M、K918L、Q920E、Q920N、Q920S、Q920A、T924S、T924A、R925K、R925H、R925Q、Q926K、Q926E、Q926N、Q926D、K929R、K929H、K929Q、R951Q、R951S、S960A、S964A、K968Q、K968H、K968M、K968L、R976K、R976Q、R976H、Y1013F、Y1013H、G1030A、G1030S、G1030T、G1030V、A1032G、A1032S、A1032T、A1032V、K1107R、K1107Q、K1107M、E1108Q、E1108D、E1108N、S1109A、S1109T、S1109N、S1109D、R1114K、R1114Q、R1114H、N1115D、N1115A、N1115S、S1116A、D1117N、D1117S、D1117A、K1118Q、K1118H、K1118M、K1118L、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、D1135N、D1135S、D1135A、S1216A、E1219Q、E1219D、E1219N、E1243Q、E1243D、E1243N、E1243S、E1243A、D1284N、D1284S、D1284A、P1301S、P1301G、H1311Y、H1311S、R1333K、R1333Q、R1333H、K1334R、K1334Q、K1334M、K1334L、R1335K、R1335Q、R1335H、T1337A、T1337S和S1338A。
17)根据实施例11所述的tsCas9,其中所述至少一个氨基酸改变选自由以下组成的组:T13S、T13A、N14D、N14S、N14A、S29A、S29G、S29T、S29V、K31R、K31Q、K31H、K31M、K31L、F32Y、F32H、F32H、F32L、F32I、F32M、L35V、L35A、L35T、L35I、L35M、L35F、L35H、K44R、K44Q、K44H、K44M、K44L、E57Q、K44D、K44N、K44H、K44M、K44L、N46D、N46S、N46T、N46Q、S55A、E57Q、E57D、E57N、E57H、T62S、T62A、T62V、T62P、R63K、R63H、R63Q、R63E、K65R、K65H、K65Q、K65M、K65L、R66K、R66H、R66Q、R66E、R69K、R69H、R69Q、R69E、R70K、R70H、R70Q、R70E、R71K、R71H、R71Q、R71E、Y72F、Y72H、Y72L、Y72M、Y72I、Y72W、R74K、R74H、R74Q、R74E、R75K、R75H、R75Q、R75E、R78K、R78H、R78Q、R78E、S104A、S104A、S104T、S104V、F105H、F105L、F105M、F105I、F105Y、F105W、V107S、V107A、V107I、V107L、V107T、E108Q、E108D、E108N、R115K、R115H、R115Q、R115E、H116F、H116Y、H116Q、H116E、H116N、H116D、H116S、H116T、V126I、V126L、V126A、V126T、V126S、H129F、H129Y、H129Q、H129E、H129N、H129D、H129S、H129T、Y136F、Y136H、Y136L、Y136M、Y136I、Y136W、H160F、H160Y、H160Q、H160E、H160N、H160D、H160S、H160T、K163R、K163H、K163Q、K163E、K163M、K163L、F164Y、F164H、F164M、F164L、F164I、F164W、R165K、R165H、R165Q、R165E、D269N、D269S、D269A、Y325F、Y325H、Y325L、Y325M、Y325I、Y325W、H328F、H328Y、H328Q、H328E、H328N、H328D、H328S、H328T、H329F、H329Y、H329Q、H329E、H329N、H329D、H329S、H329T、K336R、K336H、K336M、K336L、R340K、R340H、R340Q、R340E、Y347F、Y347H、Y347M、Y347L、Y347I、F351H、F351Y、F351M、F351L、F351I、F351W、F352H、F352Y、F352M、F352L、F352I、F352W、I363F、I363L、I363M、I363V、I363A、I363T、D364E、D364Q、D364H、D364N、D364S、D364T、R403K、R403H、R403Q、R403E、I448L、I448M、I448V、I448A、Y450H、Y450L、Y450F、P454A、P454G、P454S、P454T、P454V、L455I、L455V、L455M、L455T、L455N、L455F、L455A、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、S460A、S460G、S460T、S460V、R461K、R461H、R461Q、R461E、R461S、F462Y、F462H、F462L、F462I、F462V、F462W、R467K、R467H、R467Q、R467E、T472A、T472P、T472S、T472V、F491H、F491L、M495K、M495Q、M495L、N497D、N497Q、N497E、N497S、Y515F、Y515H、Y515M、Y515L、G582A、G582S、G582T、G582V、T657S、T657A、T657N、R661K、R661H、R661Q、R661E、Q695E、Q695N、Q695D、H698F、H698Q、H698N、S719A、S719T、S719V、L720I、L720V、L720M、L720T、L720N、L720F、L720A、H721F、H721Y、H721Q、H721E、H721N、H721D、H721S、H721T、K735R、K735Q、K735H、K735M、K735L、L738I、L738V、L738M、L738T、L738N、L738F、L738A、K742R、K742Q、K742H、K742M、K742L、M751L、M751I、M751V、M751T、M751K、R765K、R765H、R765Q、S777A、S777N、S777D、E779Q、E779H、E779D、E779N、D850N、D850S、D850A、Q894E、Q894N、Q894S、F916H、F916L、F916M、F916I、F916A、K918Q、K918R、K918H、K918M、K918L、Q920E、Q920N、Q920S、Q920A、T924S、T924A、R925K、R925H、R925Q、Q926K、Q926E、Q926N、Q926D、K929R、K929H、K929Q、Q933E、Q933H、Q933K、Q933N、S960A、S964A、K968Q、K968H、K968M、K968L、R976K、R976Q、R976H、V982A、V982T、V982L、V982I、Y1013F、Y1013H、G1030A、G1030S、G1030T、G1030V、A1032G、A1032S、A1032T、A1032V、K1085R、K1085Q、K1085H、K1085M、K1085L、M1089L、M1089I、M1089V、M1089T、M1089K、P1090A、P1090G、P1090S、P1090T、P1090V、Q1091D、Q1091S、Q1091E、Q1091H、Q1091K、Q1091N、T1098A、T1098P、T1098S、T1098V、E1099、E1099Q、E1099D、E1099N、E1099H、V1100A、V1100G、V1100T、V1100S、V1100I、V1100L、T1102A、T1102P、T1102S、T1102V、G1103A、G1103P、G1103S、F1105Y、F1105H、F1105L、F1105I、F1105V、F1105W、K1107R、K1107Q、K1107M、E1108Q、E1108D、E1108N、S1109A、S1109T、S1109N、S1109D、K1113R、K1113Q、K1113H、K1113M、K1113L、R1114K、R1114Q、R1114H、N1115D、N1115A、N1115S、S1116A、D1117N、D1117S、D1117A、K1118Q、K1118H、K1118M、K1118L、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、K1124R、K1124Q、K1124H、K1124M、K1124L、F1134Y、F1134H、F1134L、F1134I、F1134V、F1134W、D1135N、D1135S、D1135A、R1171K、R1171H、R1171Q、R1171E、K1197R、K1197Q、K1197H、K1197M、K1197L、K1211R、K1211Q、K1211H、K1211M、K1211L、S1216A、E1219Q、E1219D、E1219N、E1243Q、E1243D、E1243N、E1243S、E1243A、R1279K、R1279H、R1279Q、R1279E、D1284N、D1284S、D1284A、R1333K、R1333Q、R1333H、K1334R、K1334Q、K1334M、K1334L、R1335K、R1335Q、R1335H、T1337A、T1337S、S1338A、H1349F、H1349Y、H1349Q、H1349E、H1349N、H1349D、H1349S、H1349T、Y1356F、Y1356W、Y1356H、Y1356Q、Y1356E、Y1356N、Y1356D、Y1356S、Y1356T、T1358A、T1358P、T1358S和T1358V。
18)根据实施例11所述的tsCas9,其中所述至少一个氨基酸改变选自由以下组成的组:S104A、F105H、V107S、P176S、S179A、E223A、N235NGSGAGGSY、E260Q、D261N、T310A、T310G、P316G、P316D、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、R457K、N459S、P475S、W476H、R557K、R653H、Q739S、E910S、L911A、R951Q、K1123S、W1126S和H1311Y;优选地,所述至少一个氨基酸改变选自由以下组成的组:S104A、F105H、V107S、P176S、S179A、E223A、E260Q、D261N、T310A、T310G、P316G、P316D、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、R457K、N459S、P475S、W476H、R557K、R653H、Q739S、E910S、L911A、R951Q、K1123S、W1126S和H1311Y。
19)根据实施例11所述的tsCas9,其中所述至少一个氨基酸改变包括N235NGSGAGGSY;S104A、F105H和V107S;P176S和S179A;E223A;T310A和P316G;P411A、Q413N和I414V;P411A、Q413N、I414V、R457K和N495S;Y430F和F432H;R457K和N495S;P475S和W476H;R557K;R653H;R951Q;S104A、F105H、V107S、P176S、S179A、E223S、E260Q、D261N、R653H、Q739S和H1311Y;S104A、F105H、V107S、E260Q、D261N、T310A、P316G、Y430F、F432H、Q739S和H1311Y;S104A、F105H、V107S、T310A、P316G、Q739S和R951Q;S104A、F105H、V107S、E260Q、D261N、Y430F、F432H和Q739S;S104A、F105H、V107S、Q739S、R951Q和H1311Y;S104A、F105H、V107S、P411A、Q413N和I414V;S104A、F105H、V107S、P411A、Q413N、I414V、R457K和N459S;T310G和P316D;P411G、Q413A和I414A;Y430V和F432V;E910S和L911A;以及K1123S和W1126S;优选地,所述至少一个氨基酸改变包括S104A、F105H和V107S;P176S和S179A;E223A;T310A和P316G;P411A、Q413N和I414V;P411A、Q413N、I414V、R457K和N495S;Y430F和F432H;R457K和N495S;P475S和W476H;R557K;R653H;R951Q;S104A、F105H、V107S、P176S、S179A、E223S、E260Q、D261N、R653H、Q739S和H1311Y;S104A、F105H、V107S、E260Q、D261N、T310A、P316G、Y430F、F432H、Q739S和H1311Y;S104A、F105H、V107S、T310A、P316G、Q739S和R951Q;S104A、F105H、V107S、E260Q、D261N、Y430F、F432H和Q739S;S104A、F105H、V107S、Q739S、R951Q和H1311Y;S104A、F105H、V107S、P411A、Q413N和I414V;S104A、F105H、V107S、P411A、Q413N、I414V、R457K和N459S;T310G和P316D;P411G、Q413A和I414A;Y430V和F432V;E910S和L911A;以及K1123S和W1126S。
20)根据前述实施例中任一项所述的tsCas9,其具有选自由以下组成的组的许可温度范围:30-32℃、30-33℃、29-32℃、30-34℃、29-33℃、30-35℃、29-34℃、30-36℃、28-34℃、31-35℃、28-35℃、26-34℃和27-34℃;优选地,所述许可温度范围选自由以下组成的组:30-32℃、29.5-32.5℃、29-33℃、28.5-33.5℃、28-34℃、27.5-34.5℃、27-35℃、26.5-35.5℃和26-36℃;更优选地,所述许可温度范围选自由以下组成的组:29-33℃、28.5-33.5℃、28-34℃、27.5-34.5℃和27-35℃;甚至更优选地,所述许可温度范围选自由以下组成的组:28.5-33.5℃、28-34℃和27.5-34.5℃;最优选地,所述许可温度范围是28-34℃。
21)根据前述实施例中任一项所述的tsCas9,其具有选自由以下组成的组的限制性温度范围:38-40℃、38-41℃、37-40℃、38-42℃、37-41℃、37-42℃、36-40℃、36-41℃、36-42℃和35-43℃;优选地,所述限制性温度范围选自由以下组成的组:39-40℃、38.5-41.5℃、38-42℃、37.5-42℃、38-42.5℃、36.5-41.5℃、36.5-42℃、37-42℃、37-42.5℃和36-43℃;更优选地,所述限制性温度范围选自由以下组成的组:38-42℃、37.5-42℃、38-42.5℃、36.5-41.5℃、36.5-42℃、37-42℃、37-42.5℃、36-43℃和36-44℃;甚至更优选地,所述限制性温度范围选自由以下组成的组:36.5-41.5℃、36.5-42℃、37-42℃和37-42.5℃;最优选地,所述限制性温度范围是37-42℃。
22)根据前述实施例中任一项所述的tsCas9,其具有选自由以下组成的组的解离温度范围:40-50℃、41-50℃、42-50℃、43-50℃、44-50℃和45-50℃;优选地,所述解离温度范围选自由以下组成的组:41-50℃、42-50℃和43-50℃;更优选地,所述解离温度范围选自由以下组成的组:41-50℃、41.5-50℃、42-50℃、42.5-50℃和43-50℃;甚至更优选地,所述解离温度范围选自由以下组成的组:41.5-50℃、42-50℃和42.5-50℃;最优选地,所述解离温度范围是42-50℃。
23)一种多核苷酸,所述多核苷酸编码根据实施例1-22中任一项所述的tsCas9。
24)根据实施例23所述的多核苷酸,所述多核苷酸与SEQ ID NO:1具有至少80%序列同一性。
25)一种核酸构建体,所述核酸构建体包含根据实施例23-24中任一项所述的多核苷酸。
26)一种表达载体,所述表达载体包含根据实施例23-24中任一项所述的多核苷酸。
27)一种宿主细胞,所述宿主细胞包含如实施例1-22中任一项所定义的tsCas9,如实施例23-24中任一项所定义的多核苷酸,如实施例25中定义的核酸构建体,和/或如实施例26中定义的表达载体。
28)根据实施例27所述的宿主细胞,所述宿主细胞是真核或原核宿主细胞。
29)根据实施例27-28中任一项所述的宿主细胞,所述宿主细胞是选自由以下组成的组的微生物宿主细胞:细菌、真菌、酵母和古细菌宿主细胞。
30)根据实施例27-29中任一项所述的宿主细胞,所述宿主细胞是选自由以下组成的组的细菌宿主细胞:芽胞杆菌属、埃希氏菌属、乳杆菌属、乳球菌属、链球菌属和链霉菌属细胞;优选地,所述宿主细胞选自由以下组成的组:嗜碱芽孢杆菌枯草杆菌、高地芽孢杆菌、解淀粉芽孢杆菌、植物解淀粉芽孢杆菌亚种、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、甲基营养型芽孢杆菌、短小芽孢杆菌、沙福芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、苏云金芽孢杆菌、大肠杆菌、嗜酸乳杆菌、淀粉乳杆菌、短乳杆菌、副干酪乳杆菌、纤维二糖乳杆菌、卷曲乳杆菌、弯曲乳杆菌、德氏乳杆菌保加利亚亚种、德氏乳杆菌乳酸亚种、发酵乳杆菌、禾口鸡乳杆菌、格氏乳杆菌、瑞士乳杆菌、约氏乳杆菌、植物乳杆菌、罗伊氏乳杆菌、雷曼氏乳酸杆菌、唾液乳杆菌、韩中大乳球菌、福尔摩沙乳球菌、富士山乳球菌、格氏乳球菌、乳酸乳球菌、鱼乳球菌、植物乳球菌、棉子糖乳球菌、台湾乳球菌、似马链球菌、酿脓链球菌、乳房链球菌、马链球菌兽疫亚种、不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌;更优选地,所述宿主细胞是地衣芽孢杆菌。
31)根据实施例27-30中任一项所述的宿主细胞,所述宿主细胞是选自由以下组成的组的真菌宿主细胞:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、线黑粉菌科、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属和木霉属细胞;优选地,所述丝状真菌宿主细胞选自由以下组成的组:泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporiumlucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporiumzonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢菌、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、和绿色木霉细胞。
32)根据实施例27-31中的任一项所述的宿主细胞,所述宿主细胞是选自由以下组成的组的酵母宿主细胞:假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母菌属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)和耶氏酵母属(Yarrowia)细胞;优选地,所述宿主细胞选自由以下组成的组:乳酸克鲁维酵母(Kluyveromyces lactis)、巴斯德毕赤酵母(Pichiapastoris)、卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomycesnorbensis)、卵形酵母(Saccharomyces oviformis)、和解脂耶氏酵母(Yarrowialipolytica)细胞。
33)如实施例27-32中任一项所述的宿主细胞,其中所述tsCas9是核酸酶无效变体;优选地,所述变体包含对应于SEQ ID NO:2的位置10和位置840的位置中的氨基酸改变;更优选地,所述变体包含天冬氨酸取代丙氨酸,D10A和组氨酸取代丙氨酸,H840A。
34)一种诱导一个或多个目的基因组靶序列表达的方法,所述方法包括以下步骤:
a)提供根据实施例33所述的宿主细胞,所述宿主细胞进一步包含一个或多个适合的gRNA和一个或多个目的基因组靶序列;
b)在所述tsCas9的解离温度下培养所述宿主细胞,由此所述tsCas9与所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成的复合物解离;以及随后
c)将温度降低到所述tsCas9的限制性温度并培养所述宿主细胞,由此诱导所述一个或多个靶序列的表达。
35)根据实施例34所述的方法,其中所述解离温度是42-50℃且所述限制性温度是37-42℃。
36)根据实施例34-35中任一项所述的方法,所述方法包括在提供所述宿主细胞之后和步骤(b)之前的以下步骤:在所述tsCas9的所述许可温度下培养所述宿主细胞,由此所述tsCas9、所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成复合物,由此抑制所述一个或多个基因组靶序列的表达。
37)根据实施例34-36中任一项所述的方法,所述方法包括以下另外的步骤:
d)将温度升至所述tsCas9的许可温度,其中所述tsCas9、所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成复合物,并培养所述宿主细胞,由此抑制所述一个或多个目的基因组靶序列的表达。
38)根据实施例36-37中任一项所述的方法,其中所述许可温度是28-34℃。
39)一种抑制一个或多个目的基因组靶序列的方法,所述方法包括以下步骤:
a)提供根据实施例33所述的宿主细胞,所述宿主细胞进一步包含一个或多个适合的gRNA和一个或多个目的基因组靶序列;
b)在所述tsCas9的限制性温度下培养所述宿主细胞,其中所述一个或多个目的基因组靶序列被表达;以及随后
c)将温度降低到所述tsCas9的许可温度,由此所述tsCas9、所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成复合物,并由此抑制所述一个或多个基因组靶序列的表达。
40)根据实施例39所述的方法,其中所述许可温度是28-34℃且所述限制性温度是37-42℃。
41)根据实施例39-40中任一项所述的方法,所述方法包括在提供所述宿主细胞之后和步骤(b)之前的以下步骤:在所述tsCas9的解离温度下培养所述宿主细胞,以确保在宿主细胞中在所述tsCas9、所述一个或多个gRNA和所述一个或多个目的基因组靶序列之间不形成复合物。
42)根据实施例39-41中任一项所述的方法,所述方法包括以下另外的步骤:
d)将温度升高到所述tsCas9的解离温度,由此使所述复合物解离;以及随后
e)将温度降低到所述tsCas9的限制性温度,由此诱导所述一个或多个靶序列的表达。
43)根据实施例41-42中任一项所述的方法,其中所述解离温度是42-50℃。
44)根据实施例34-43中任一项所述的方法,其中所述一个或多个目的基因组靶序列包含至少20个核苷酸并进一步包含或侧接针对II类Cas9蛋白的功能性PAM序列;优选地,所述一个或多个基因组靶序列包含在编码多肽的可读框中或包含在启动子区域中。
45)根据实施例34-44中任一项所述的方法,其中所述一个或多个目的基因组靶序列编码一个或多个选自由以下组成的组的酶:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;优选地,所述一个或多个酶是α-淀粉酶、α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、天冬酰胺酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、绿色荧光蛋白、葡聚糖转移酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、和木聚糖酶。
46)根据实施例34-45中任一项所述的方法,其中所述宿主细胞是真核或原核细胞;优选地,所述宿主细胞是微生物宿主细胞;甚至更优选地,所述宿主细胞是真菌、细菌或古细菌细胞。
47)根据实施例34-46中任一项所述的方法,其中所述宿主细胞是芽胞杆菌属宿主细胞;优选地,所述宿主细胞选自由以下组成的芽孢杆菌属物种的组:嗜碱芽孢杆菌、高地芽孢杆菌、解淀粉芽孢杆菌、植物解淀粉芽孢杆菌亚种、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、甲基营养型芽孢杆菌、短小芽孢杆菌、沙福芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌;更优选地,所述宿主细胞是地衣芽孢杆菌。
48)根据实施例34-47中任一项所述的方法,其中所述一个或多个gRNA包含第一RNA,所述第一RNA包含与所述一个或多个基因组靶序列至少85%互补并且能够与所述一个或多个基因组靶序列杂交的20个或更多个核苷酸;优选地,所述20个或更多个核苷酸与所述一个或多个基因组靶序列至少90%、95%、97%、98%、99%或甚至100%互补并且能够与所述一个或多个基因组靶序列杂交。
49)根据实施例1-22中的任一项所述的tsCas9、根据实施例23-24中的任一项所述的多核苷酸、根据实施例25所述的核酸构建体、根据实施例26所述的表达载体、根据实施例27-33中的任一项所述的宿主细胞、和/或根据实施例34-48中的任一项所述的方法在药物或化妆品中的用途。
50)根据实施例1-22中的任一项所述的tsCas9、根据实施例23-24中的任一项所述的多核苷酸、根据实施例25所述的核酸构建体、根据实施例26所述的表达载体、根据实施例27-33中的任一项所述的宿主细胞、和/或根据实施例34-48中的任一项所述的方法在医学上或生物技术研究或生产中的用途。
51)根据实施例1-22中的任一项所述的tsCas9、根据实施例23-24中的任一项所述的多核苷酸、根据实施例25所述的核酸构建体、根据实施例26所述的表达载体、根据实施例27-33中的任一项所述的宿主细胞、和/或根据实施例34-48中的任一项所述的方法在基因组编辑、基因表达的调节或CRISPR抑制中的用途。
52)根据实施例1-22中的任一项所述的tsCas9、根据实施例23-24中的任一项所述的多核苷酸、根据实施例25所述的核酸构建体、根据实施例26所述的表达载体、根据实施例27-33中的任一项所述的宿主细胞、和/或根据实施例34-48中的任一项所述的方法在酶研究、开发和/或生产中的用途。
序列表
<110> 诺维信公司(Novozymes A/S)
<120> 温度敏感性CAS9蛋白
<130> 14616-WO-PCT
<160> 9
<170> PatentIn 3.5版
<210> 1
<211> 4107
<212> DNA
<213> 酿脓链球菌
<400> 1
atggacaaaa aatacagcat cggcctggat attggcacaa attcagttgg ctgggcagtt 60
atcacagacg aatataaagt tccgagcaaa aaatttaaag tcctgggcaa tacagatcgc 120
catagcatca aaaaaaacct gattggcgca ctgctgtttg attcaggcga aacagcagaa 180
gcaacaagac ttaaaagaac agcaagacgc agatatacaa gacgcaaaaa tcgcatttgc 240
tatctgcaag aaatctttag caacgaaatg gcgaaagtcg acgacagctt ttttcataga 300
ctggaagaat catttctggt cgaagaagat aaaaaacacg aacgccatcc gatttttggc 360
aacattgttg atgaagtcgc gtatcatgaa aaatacccga caatttatca tctgcgcaaa 420
aaactggttg acagcacaga taaagcagat cttcgcctga tttatctggc actggcacat 480
atgatcaaat ttagaggcca ttttctgatc gaaggcgatc tgaatccgga taattcagat 540
gtcgacaaac tgtttattca gctggtccag acatataacc agctgtttga agaaaatccg 600
attaatgcat caggcgttga tgcaaaagca attctgtcag caagactgtc aaaatcaaga 660
cgcctggaaa atctgattgc acaactgcct ggcgaaaaaa aaaatggact gtttggcaat 720
cttattgcac tgtcactggg cctgacaccg aactttaaat caaattttga tctggcggaa 780
gatgcgaaac tgcaactttc aaaagatacg tatgatgacg atctggataa tctgctggcg 840
caaattggcg atcaatatgc agatcttttt ctggcagcga aaaatctgtc agatgcaatt 900
ctgctgtcag atattctgcg cgtcaataca gaaattacaa aagcaccgct gagcgcgagc 960
atgattaaaa gatatgatga acatcatcag gacctgacac tgctgaaagc actggttaga 1020
caacaactgc cggaaaaata caaagaaatc ttttttgatc agagcaaaaa cggctatgca 1080
ggctatattg atggcggagc atcacaagaa gaattttaca aatttatcaa accgatcctg 1140
gaaaaaatgg atggaacaga agaactgctg gttaaactga atcgcgaaga tttactgaga 1200
aaacagcgca catttgataa tggctcaatt ccgcatcaaa ttcatctggg cgaactgcat 1260
gcgattctta gacgccaaga agatttttat ccgtttctga aagacaaccg ggaaaaaatt 1320
gaaaaaatcc tgacatttcg catcccgtat tatgtcggac cgctggcaag aggcaattca 1380
agatttgcat ggatgacacg caaaagcgaa gaaacaatta caccgtggaa ttttgaagaa 1440
gtcgttgata aaggcgcaag cgcacaatca tttattgaac gcatgacgaa ctttgacaaa 1500
aacctgccga atgaaaaagt cctgccgaaa cattcactgc tgtatgaata ctttacggtc 1560
tataatgaac tgacgaaagt caaatatgtc acagaaggca tgagaaaacc ggcatttctg 1620
tcaggcgaac agaaaaaagc gattgtcgat cttctgttta aaacgaaccg caaagtcaca 1680
gtgaaacagc tgaaagaaga ttactttaaa aaaatcgaat gctttgatag cgtcgaaatc 1740
tcaggcgtcg aagatagatt taatgcaagc ctgggcacat atcatgatct gctgaaaatc 1800
atcaaagata aagattttct ggataacgaa gaaaacgaag atatcctgga agatattgtg 1860
ctgacactga cgctttttga agatcgcgaa atgattgaag aacgcctgaa aacatatgcg 1920
cacctgtttg atgataaagt catgaaacaa cttaaacgca gacgctatac aggctggggc 1980
agactttcaa gaaaactgat taacggcatt cgcgataaac aaagcggcaa aacaatcctg 2040
gattttctga aatcagatgg ctttgcgaat cgcaatttta tgcagctgat tcatgatgac 2100
agcctgacgt ttaaagaaga tattcagaaa gcacaagttt caggccaagg cgattcactg 2160
catgaacata ttgcaaatct ggcaggctca ccggcaatca aaaaaggcat tctgcaaaca 2220
gttaaagtcg tcgatgaact ggttaaagtt atgggcagac ataaaccgga aaacatcgtt 2280
attgaaatgg cacgcgaaaa tcagacaaca caaaaaggac agaaaaattc acgcgaacgg 2340
atgaaaagaa ttgaagaagg cattaaagaa ctgggcagcc aaatcctgaa agaacatccg 2400
gttgaaaata cacagctgca gaacgaaaaa ctgtatctgt attatctgca gaatggacgc 2460
gatatgtatg tcgatcaaga actggatatt aatcgcctga gcgattatga tgtggatcat 2520
attgttccgc agagctttct taaagatgat agcatcgata acaaagtcct gacacgctca 2580
gataaaaaca gaggcaaatc agataatgtc ccgtcagaag aggttgtcaa aaaaatgaaa 2640
aactactggc gtcaactgct gaacgcgaaa cttattacac aacgcaaatt tgacaatctg 2700
acaaaagcag aaagaggcgg actgtcagaa cttgataaag cgggttttat caaaagacag 2760
ctggtcgaaa cacgccagat tacaaaacat gttgcgcaaa ttctggatag ccgcatgaac 2820
acaaaatatg acgaaaacga taaactgatc cgggaagtca aagtcattac gctgaaatca 2880
aaactggtca gcgattttcg caaagacttt cagttttaca aagtccgcga aatcaacaac 2940
taccatcatg cacatgatgc atatctgaat gcagttgtcg gcacagcgct tatcaaaaaa 3000
taccctaaac tggaaagcga atttgtctac ggcgactata aagtctatga tgtccgcaaa 3060
atgattgcga aaagcgaaca agaaattggc aaagcgacag cgaaatactt tttttacagc 3120
aacatcatga acttttttaa aacggaaatc acactggcga acggcgaaat tagaaaaaga 3180
ccgcttattg aaacgaacgg tgaaacaggc gaaattgttt gggataaagg cagagatttt 3240
gcaacagtta gaaaagttct gagcatgccg caagtcaaca tcgtgaaaaa aacagaagtt 3300
cagacaggcg gatttagcaa agaatcaatt cttccgaaac gcaactcaga caaactgatt 3360
gcgcgtaaaa aagactggga cccgaaaaaa tacggtggct ttgattcacc gacagttgca 3420
tattcagttc tggttgttgc gaaagtggaa aaaggcaaat ccaaaaaact taaaagcgtg 3480
aaagaacttc tgggcatcac aattatggaa cgctcgagct ttgaaaaaaa cccgatcgac 3540
tttctggaag ccaaaggcta taaagaagtg aaaaaagacc ttattatcaa actgccgaaa 3600
tacagcctgt ttgaactgga aaatggcaga aaacgcatgc tggcatcagc aggcgaactt 3660
cagaaaggca atgaactggc actgccgtca aaatatgtta actttctgta tctggcgagc 3720
cattacgaaa aacttaaagg ctcaccggaa gataacgaac agaaacaact gtttgtcgaa 3780
cagcataaac attacctgga cgaaatcatc gaacaaatca gcgaattttc aaaacgcgtt 3840
attctggcag atgcgaacct ggataaagtt cttagcgcat ataacaaaca ccgggataaa 3900
ccgattagag aacaagcgga aaatatcatt cacctgttta cactgacaaa tcttggcgca 3960
ccggcagcgt ttaaatactt tgatacaaca attgaccgca aacgctacac aagcacaaaa 4020
gaagttctgg acgcaacact gattcatcaa tcaattacag gcctttatga aacgcgcatt 4080
gatctgtcac aactgggagg cgattga 4107
<210> 2
<211> 1368
<212> PRT
<213> 酿脓链球菌
<400> 2
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 3
<211> 9936
<212> DNA
<213> 人工序列
<220>
<223> MOL2212-amyL基因座
<400> 3
tctagacctt ctttgtgctt ggaagcagag cccaatatta tcccgaaacg ataaaacgga 60
tgctgaagga aggaaacgaa gtcggcaacc attcctggga ccatccgtta ttgacaaggc 120
tgtcaaacga aaaagcgtat caggagatta acgacacgca agaaatgatc gaaaaaatca 180
gcggacacct gcctgtacac ttgcgtcctc catacggcgg gatcaatgat tccgtccgct 240
cgctttccaa tctgaaggtt tcattgtggg atgttgatcc ggaagattgg aagtacaaaa 300
ataagcaaaa gattgtcaat catgtcatga gccatgcggg agacggaaaa atcgtcttaa 360
tgcacgatat ttatgcaacg ttcgcagatg ctgctgaaga gattattaaa aagctgaaag 420
caaaaggcta tcaattggta actgtatctc agcgcatgca gcaggtagtt ctatcaaacc 480
gtgaattgac agtatataga gaagatattt ctcgcctggc tgatcaagaa cagcagacgc 540
tgattgatgc ttttatgact aaggatcggg aaaaaggatt tgatttgcaa aaagatcctt 600
taatgcgtct tgcccttttt gatagaggag acagccaata tacatgtgtc tggacacatc 660
accatatcat catggatggg tggtgtctcg gcattattct taaagagttt ttcagcatgt 720
atgattcgct caaaaataac tcacctgtac agcttggcag cacggtgccg tacagccgtt 780
atattgaatg gctcggagaa caagatcaag aagagactgc tgcctactgg agcgaatatt 840
tgaaggagta cggcaatact gcttctattc cccgaataaa gcgccgcacg gcagacggga 900
attataaagc cgaccaggtc agcttttcat tagcgccgga tatggttgag aaactgacag 960
aggctgccca aaactgggga gtgacattaa acacgctgtt tatgagtatt tggggcgtgc 1020
tgctccatcg atataatgct gcagatgatg ccgtttttgg ctccgtcatt tcgggacgcc 1080
cgtcagcgat tgacgggatt gaatcaatgg tcggtttgtt tatcaatact gttccagtgc 1140
gaatccgatc tgcggaaggc ataacatttt cttcgctggt caaagccgtg caggaggata 1200
ttttatcatc tgaacagcat gggtattatc cgctttatga gattcaaaac catagtccat 1260
tgaagcaagg gttgatcgat catatttttg tttttgaaaa ttaccctgta cagcttcatc 1320
aggcattaag cgtggagagt gaaaatgacg aaggcgctct gaagctgagt gacatttcaa 1380
tgtcggaaca aaccaattac gactttaata tcgttatcgt tccgggagaa tcattttata 1440
tcaaattcag ctacaacgca gacgtttacg agcgggagga gatgctgagg attcaggggc 1500
atctaaagca agcactggat tgcattttga caaatcccga tgttgccgtc agtgacatca 1560
atatcgtgcc gccggaggag caacaggtta tccaattgtt taacgaaact gagcgtcctt 1620
atgtgaacaa aacgataccc caattgtttg aggaacaagc tcacaaaaca cctgaagctg 1680
ctgcattgaa aatgggaaac gagtgctgga cctatcgcca gttacaagta agagccaatc 1740
agattgcgca cgccctgata gaaaaaggcg ttggatctgg ggatatcgtt gctgtaatga 1800
tgggccggtc aatggaaatg cctgcagctc tgcttgggat ttggaaagca ggcggcgctt 1860
atatgccgct tgatccacat tttccagcag aacgtctttc ttttcttctg aaggacagtc 1920
aagcggctca attgctgata gaagaagacc ttatttcctt gatccctccg tcctatgaag 1980
gaaatacgat aacgatagaa catacagaaa gttaccaaac agaagcgcca aatatgccgc 2040
caggtgatct agcctacttg atctatacgt cgggaacgac ggggcgccct aaaggggttt 2100
tagttgatca tcacggtatt gccaatacat tgcaatggag acgggaagag tatagcatga 2160
ccgaacagga tatatccctc catttgtttt cgtacgtgtt tgacggctgt gtaacgagct 2220
tatttacccc gcttttatct ggtgcgtgcg tactgctgac aacagatgac gaagcgaagg 2280
atgtgctggc ccttaagcga aaaatagccc gttataaggt cagccacatg atcattgttc 2340
cttccctgta cagggtgtta ttggaagtga tgactgctga cgatgcaaaa agtcttcgta 2400
ttgtgacatt tgcgggtgaa gcggtcacgc ctgatctgct tgagttgaat caaataattt 2460
gtccttctgc tgaactggca aatgaatacg ggcccacaga aaacagtgtg gcaacaacaa 2520
tattgcggca tctgaataaa aaagagagga tcacgatcgg acacccgatc agaaacacaa 2580
aagtatttgt tttgcacgga aatcaaatgc agccgatcgg cgcggcgggt gaactgtgta 2640
tttccggcgc gggtcttgcg agaggatact acaaacagca agagctgaca cagaaagcat 2700
tctccgatca tccattcctt gaaggggagc gtttataccg aacaggtgat gcaggccgct 2760
ttttgcctga tggaacgatt gaatatattg gacgttttga tgatcaagtg aaaattaggg 2820
gttatcgtat tgaactgaga gagattgaaa cagttcttcg acaagcaccg ggggtaaaag 2880
aagcagcggt actggcccgt gatgtttctg ctgaggaaaa ggagctcgtt gcttatatcg 2940
ttccggaaaa gggaaacagc ctcccagatt tgtatcagca tcttgccggg acattgccgt 3000
cctatatgat cccagcaagt attatcaaca tcagccagat gccattaaca tccagcggca 3060
gatcacccgc gataccgtca ttttcgacac atttctttct ttgctacatc agataacgtt 3120
gccatttcat ccccgcctta cctagggatt ctaaactgtc agcaatattc ctgagggctt 3180
atgacacttt gttaaaatta attataaaat gtaatcaacg aaatttataa gacgggcaaa 3240
ataaaaaaac ggatttcctt caggaaatcc gtcctctctg ctcttctatc tttgaacata 3300
aattgaaacc gacccgccgt ttacgtgaaa ctctccccag ccttccgaat tgatgacaac 3360
cggctccgaa cggtttccgg taatgtcatg ccatgtctca ccggcgtttt gccggccgac 3420
atacattcgc tttgccccac cgggtccgtc tgttattaat gccgccaaac ctgaatttgc 3480
aaccgagctg tcgccttccc ttgtccagcc gacaatgtca tggtggtcga aataatcatg 3540
ctgtgctccg tacgcatact gttttctcgc ttttaagatc ggttcaattt tgtgtttcaa 3600
ggcaggaatt tcgcgctggg agtctccttt cgtcccgtac atatccccgt agaaaacctg 3660
agggtatcca gattcccttg tgagaataaa agcgtaagca agcggcttaa accatgtttg 3720
gacagtcgac tcaagcgatt gccccggctg tgtatcatgg ttatcgacaa atgtaaccga 3780
tttcaacgga tgcttggaaa cgaccgtacc cttcagcaat ttcctcatat catagccgcc 3840
tccctgtgtc gatgcagcat ggaactgata atgaagcggc acgtcaaaca ctgaatgatt 3900
aaaatttgtt ttgttcaaat agttttccag cgcgcccaag tcattctgcc aatattcagc 3960
taccgtaaac atttccttcc ccgttttttc cctgacatga ttaacccaat cccgcaaaaa 4020
agaaaattta atgtgtttga cagcatcaag acggtttccg tccaattgca gttcattggc 4080
ataccaagtg ccccatctct taatttctgc tgcgacatca ggatggtcat aatcgatgtc 4140
ggcatacatc aaataatcat agttgccgtt ttcattggaa acttcccaat cccaagcctt 4200
tccttgaaac ttatagatgc ggttcagctt tcgggactcg tcccaatcgg ttccgtcaaa 4260
atggtaccaa tgccatttaa aatcgctgta tgtgctgccg gcccccggaa aatgaaaatg 4320
tgtccaggct ttaattaggt gttctcctga gattacgcgg ttgcggtcag cgggatcgac 4380
ttcaaccgcg gttacatctt cggtcgcatc agcgccgcct ttgtggttga tgaccacatc 4440
cccgtaaacg ttaatgtcgc gggaatgaag acttttgatc gcagattgca gctctccttt 4500
tgtgccgtac tttgtccgaa ccgtcccttt ttgatgaaac tcccctaaat cataaaggtc 4560
gtaagcaccg tagcccacat ccgcttggct cgttccctta tatgccgggg gaatccagac 4620
ggcagtaata ccgtgttcag ccaaatatgc cgagtcgttt tgcaaacgct tccaatgttg 4680
gccgtcattg ggcatgtacc attcaaaata ctgcatcagc gtcccattaa gatttgccgc 4740
cgctgctgca gaatgaggca gcaagaagat gagcgcaaat aacagcgtca gcaatcgggc 4800
gtaaagccgt ttttgttgtt tcatgattct cctccccttt caatgtgata catatgatat 4860
tgtataaata ttccgaattt ttaacaagta ccattttccc tatattttct tccaagatct 4920
gtcgaccgcg gctagagcgg ccgcacgcgt gctagccatg gcttttacaa tagaaggaaa 4980
agtcaccccg cagttttttc aaaacagcat caacgctctt gtagaaagac atgatatttt 5040
cagaacgatt tttatcagcc aaaatgtttc ctccccccag caggttgttc tgagagaacg 5100
aaatgtcatc gtactggaag aagacattac tcatttaaac gaggcggagc aatcacagtt 5160
tatcgagcaa tggaaagaaa aggaccggga ccgggggttt catttgcaaa aggatgtgct 5220
catgcgcatc gctctgattc aaacaggaga gagccagtac tcttgcattt ggacctttca 5280
tcatatcatg atggacggtt ggtgcctcag cattgtgcta aaggagtttc tgcatattta 5340
cgcatcttat gtaaatgcat ccccaataac attggagccg gtccagccat acggaaagta 5400
tatcaaatgg ctgatggagc aagacaaaga gcaggcggtt tcttattggg atcattatct 5460
ttccggccac gaacagcaaa ccgtgctccc gaagcagaaa aaaacaaagg gaaaaagcag 5520
gcaggaacac gttacatttt cattctctaa ggaagaaagc agcaggcttt cagagcttgc 5580
tgctagagaa gaagtgacac tcagtacgat ttttcatacc atttggggca ttctgctgca 5640
aaaatataat aataacgatg acgccgtatt cggttctgtc atttcaggaa gacccgcaga 5700
aatcgaaggc attgaacata tggtaggtct tttcattaat acgatgccgg ttcgggtgca 5760
gggggcaaaa acgccttttc ttcaacttat aaaagatatg caaaaagacc gtcttgccgc 5820
tgaagcgtac agctaccacc ctttatatga gattcaatcc cgctcagctg ttaagcaagg 5880
gctgattgat catattctcg tatttgaaaa ctatccggtg cagcaagaga ttcaaatgct 5940
gaacaaacag gaacatgctt ctgatctttt tcagattcat aatttcactg tcgcagatga 6000
aaccaactac agcttttatc ttatggtggc gccaggggaa gaaattcata tcaaaatgaa 6060
ctatgatgcg gagcagcacg atcggtcttt tgtgctctct gtcaaagagc atcttctgaa 6120
tgctgtatca caaatcttaa ataatccgaa tcttccacct gaagaaatcg atatcacgac 6180
agatactgaa aagcggcagc tgattggaga aatcacagat caaacaccag tttacgaaac 6240
catccatgcc atgtttgaaa agcaagcgga aaagacacca gatgctcatg ctgtaattga 6300
tcaagcctgc tcattaacat acagagaact gaataaagcg gctaacagat tggcacggca 6360
tttacgaatg aaaggcgttg tgagacagga acccgttgcg attatgatgg aacgctcagc 6420
ggcgtttatc acaggtgttc ttggtatctt gaaagcaggc ggcgccattg ttccggttga 6480
tccgcattac cctgctgaca gaatccgtta tattctgcat gattgcggct gttcgcatgt 6540
tgtttcacaa gcgcatcttc cctcatcgtt agaagacaat tacattatca ctcatccaga 6600
agatatcgaa agcaaagtag acggcagtaa cataaagtca gtcaacaatg ctgacgatct 6660
gctgtatatg atttatacat caggcacaac aggtaaacca aagggtgttc aatttgagca 6720
tcgaaacatg gctaacttgc tgaagttcga atatactcac tccggcattg actttgaagc 6780
agatgttctg caatttgcga cgccttcctt cgacgtctgc tatcaagaaa tattttctgc 6840
gcttctgaaa ggcggcacac tccacatcgt gccagaagcc ataaaaagag atgtgcctca 6900
gctgtttgca tttataaaca agcatcagac gaatattgtg tttctcccaa ctgcttttat 6960
caaaatgatt ttcagcgagc gagaacttgc gaactcgttt cctgatggcg tcaaacacct 7020
gatcgcagcc ggggaacaat taatgatttc agaccttttc caagatgtgt tgcgtaaacg 7080
cggcatacac ctgcacaatc attacggacc ttcagaaact catgtggtat ctacgtatac 7140
cattcatcct ggagacccta ttcctgagct tccgccaatc ggtaaaccga taggctgtac 7200
tgatctatat attttgaatc atcaaaaaca gcttcagcca tgcggcgtac caggcgaact 7260
ctatatttcc ggcgcaagtg ttgccagagg atatgtcaat cacgataaac tgacaagcga 7320
caaattttca tccgatccat tcaagcctga tgtgatcatg taccggacag gtgatttggc 7380
cagacggctt gaagacggca acatcgaata tatcggacgg gcagacaatc aagtgaaaat 7440
cagaggttat cgaattgagc cgcaagaaat cgaagtcacg ctaatgaatc atccggacat 7500
tagtgaggct gccattctca tctggcaaga tcaaaacggt gaacatgaat tatgcgctta 7560
ctattgcagt gtacaaaagc tgaacacaat agatttacgc agttatatgg ctagtgagct 7620
cccagaatac atgattccgg cgaaatggat atgggttgac agcatacctc ttaccccaaa 7680
cggaaaagta gatcgcgcag cacttccgga gccagatgct tcaatcagcg gaaacccata 7740
tactgcccct cgaaatctgt tagaggccat ggctagcacg cgtgcggccg ccgcggtcga 7800
cagatcttgg aagaaaatat agggaaaatg gtacttgtta aaaattcgga atatttatac 7860
aatatcatat gtatcacatt gaaaggggag gagaatcatg aaacaacaaa aacggcttta 7920
cgcccgattg ctgacgctgt tatttgcgct catcttcttg ctgcctcatt ctgcagcagc 7980
ggcggcaaat cttaatggga cgctgatgca gtattttgaa tggtacatgc ccaatgacgg 8040
ccaacattgg aagcgtttgc aaaacgactc ggcatatttg gctgaacacg gtattactgc 8100
cgtctggatt cccccggcat ataagggaac gagccaagcg gatgtgggct acggtgctta 8160
cgacctttat gatttagggg agtttcatca aaaagggacg gttcggacaa agtacggcac 8220
aaaaggagag ctgcaatctg cgatcaaaag tcttcattcc cgcgacatta acgtttacgg 8280
ggatgtggtc atcaaccaca aaggcggcgc tgatgcgacc gaagatgtaa ccgcggttga 8340
agtcgatccc gctgaccgca accgcgtaat ctcaggagaa cacctaatta aagcctggac 8400
acattttcat tttccggggg ccggcagcac atacagcgat tttaaatggc attggtacca 8460
ttttgacgga accgattggg acgagtcccg aaagctgaac cgcatctata agtttcaagg 8520
aaaggcttgg gattgggaag tttccaatga aaacggcaac tatgattatt tgatgtatgc 8580
cgacatcgat tatgaccatc ctgatgtcgc agcagaaatt aagagatggg gcacttggta 8640
tgccaatgaa ctgcaattgg acggaaaccg tcttgatgct gtcaaacaca ttaaattttc 8700
ttttttgcgg gattgggtta atcatgtcag ggaaaaaacg gggaaggaaa tgtttacggt 8760
agctgaatat tggcagaatg acttgggcgc gctggaaaac tatttgaaca aaacaaattt 8820
taatcattca gtgtttgacg tgccgcttca ttatcagttc catgctgcat cgacacaggg 8880
aggcggctat gatatgagga aattgctgaa gggtacggtc gtttccaagc atccgttgaa 8940
atcggttaca tttgtcgata accatgatac acagccgggg caatcgcttg agtcgactgt 9000
ccaaacatgg tttaagccgc ttgcttacgc ttttattctc acaagggaat ctggataccc 9060
tcaggttttc tacggggata tgtacgggac gaaaggagac tcccagcgcg aaattcctgc 9120
cttgaaacac aaaattgaac cgatcttaaa agcgagaaaa cagtatgcgt acggagcaca 9180
gcatgattat ttcgaccacc atgacattgt cggctggaca agggaaggcg acagctcggt 9240
tgcaaattca ggtttggcgg cattaataac agacggaccc ggtggggcaa agcgaatgta 9300
tgtcggccgg caaaacgccg gtgagacatg gcatgacatt accggaaacc gttcggagcc 9360
ggttgtcatc aattcggaag gctggggaga gtttcacgta aacggcgggt cggtttcaat 9420
ttatgttcaa agatagaaga gcagagagga cggatttcct gaaggaaatc cgttttttta 9480
ttttgcccgt cttataaatt tctttgatta cattttataa ttaattttaa caaagtgtca 9540
tcagccctca ggaaggactt gctgacagtt tgaatcgcat aggtaaggcg gggatgaaat 9600
ggcaacgtta tctgatgtag caaagaaagc aaatgtgtcg aaaatgacgg tatcgcgggt 9660
gatcaatcat cctgagactg tgacggatga attgaaaaag cttgttcatt ccgcaatgaa 9720
ggagctcaat tatataccga actatgcagc aagagcgctc gttcaaaaca gaacacaggt 9780
cgtcaagctg ctcatactgg aagaaatgga tacaacagaa ccttattata tgaatctgtt 9840
aacgggaatc agccgcgagc tggaccgtca tcattatgct ttgcagcttg tcacaaggaa 9900
atctctcaat atcggccagt gcgacggcat tattgc 9936
<210> 4
<211> 3276
<212> DNA
<213> 人工序列
<220>
<223> MOL2212-xyl基因座
<220>
<221> 尚未归类的特征
<222> (3139)..(3139)
<223> n是a、c、g或t
<400> 4
gaattcaaaa gccgcttccg ccctggcttt cgctttatcc aaaggatgtg tcagccggtt 60
ccacgcccgg aacatcgtcc cgtcgccgaa agggtctttc ccgtccgcat caaaggtatg 120
ccaatacgca acagcgaagc gaaggtgttc cttcatcgtt ttgccgccga caaattcatc 180
agggttgtaa tatttaaatg cgtaaggatt ttccgaatcg gccccttcat actcaatcat 240
tccgatattt ctaaaaaaca ttccgatctc ccccttcact tttccttgca aacgttaaaa 300
aacaatgttt gtttaaccat taaactaact tccttgtatg tattttacag gatcaattaa 360
tcgctttcaa tggaaatagc cgcggatcga tgctagcaga tcttggaaga aaatataggg 420
aaaatggtac ttgttaaaaa ttcggaatat ttatacaata tcatatgtat cacattgaaa 480
ggggaggaga atcatgaaac aacaaaaacg gctttacgcc cgattgctga cgctgttatt 540
tgcgctcatc ttcttgctgc ctcattctgc agcagcggcg gcaaatctta atgggacgct 600
gatgcagtat tttgaatggt acatgcccaa tgacggccaa cattggaagc gtttgcaaaa 660
cgactcggca tatttggctg aacacggtat tactgccgtc tggattcccc cggcatataa 720
gggaacgagc caagcggatg tgggctacgg tgcttacgac ctttatgatt taggggagtt 780
tcatcaaaaa gggacggttc ggacaaagta cggcacaaaa ggagagctgc aatctgcgat 840
caaaagtctt cattcccgcg acattaacgt ttacggggat gtggtcatca accacaaagg 900
cggcgctgat gcgaccgaag atgtaaccgc ggttgaagtc gatcccgctg accgcaaccg 960
cgtaatctca ggagaacacc taattaaagc ctggacacat tttcattttc cgggggccgg 1020
cagcacatac agcgatttta aatggcattg gtaccatttt gacggaaccg attgggacga 1080
gtcccgaaag ctgaaccgca tctataagtt tcaaggaaag gcttgggatt gggaagtttc 1140
caatgaaaac ggcaactatg attatttgat gtatgccgac atcgattatg accatcctga 1200
tgtcgcagca gaaattaaga gatggggcac ttggtatgcc aatgaactgc aattggacgg 1260
aaaccgtctt gatgctgtca aacacattaa attttctttt ttgcgggatt gggttaatca 1320
tgtcagggaa aaaacgggga aggaaatgtt tacggtagct gaatattggc agaatgactt 1380
gggcgcgctg gaaaactatt tgaacaaaac aaattttaat cattcagtgt ttgacgtgcc 1440
gcttcattat cagttccatg ctgcatcgac acagggaggc ggctatgata tgaggaaatt 1500
gctgaagggt acggtcgttt ccaagcatcc gttgaaatcg gttacatttg tcgataacca 1560
tgatacacag ccggggcaat cgcttgagtc gactgtccaa acatggttta agccgcttgc 1620
ttacgctttt attctcacaa gggaatctgg ataccctcag gttttctacg gggatatgta 1680
cgggacgaaa ggagactccc agcgcgaaat tcctgccttg aaacacaaaa ttgaaccgat 1740
cttaaaagcg agaaaacagt atgcgtacgg agcacagcat gattatttcg accaccatga 1800
cattgtcggc tggacaaggg aaggcgacag ctcggttgca aattcaggtt tggcggcatt 1860
aataacagac ggacccggtg gggcaaagcg aatgtatgtc ggccggcaaa acgccggtga 1920
gacatggcat gacattaccg gaaaccgttc ggagccggtt gtcatcaatt cggaaggctg 1980
gggagagttt cacgtaaacg gcgggtcggt ttcaatttat gttcaaagat agaagagcag 2040
agaggacgga tttcctgaag gaaatccgtt tttttatttt gcccgtctta taaatttcgt 2100
tgattacatt ttataattaa ttttaacaaa gtgtcataag ccctcaggaa tattgctgac 2160
agtttagaat ccctaggtaa ggcggggatg aaatggcaac gttatctgat gtagcaaaga 2220
aagaaatgtg tcgaaaatga cggtatcgcg ggtgatctgc ggccgcacgc gtgtcgacag 2280
tactgaaata gaggaaaaaa taagttttca aaatttgtta tactataata aattcacagc 2340
ttcaaagcaa tggagtgatt gacattgaat acagcggatc aagcccttgt aaaaaaaatg 2400
aacaaagccc tgatttttga gcagattatt gaaaacggac ccgtctcaag ggccaaactt 2460
tcggaaataa caggattaaa taaagcgacc gtttcctccc aagtgtcttc cctgcttcaa 2520
aaggacatca tttatgaaac cggccccggc gagtcaagcg gcggcagaag gcccgttatg 2580
ctgaaattca atcgaaaagc cggctatgcg gtcggtgtag atgtcggaac caattatata 2640
attgttgcgt taaccgacct tgaagggcat ttgattgaac aattcgaacg aacgcttgat 2700
gaagaagaca ttcaggcgac agaagaggca ttaatcgaat tgacggggct tgccgttgac 2760
aaaataccgc cttccccatt cggattgacc ggaatcggcg tgtgcgtgcc cggcttggtg 2820
gacaacgaac ggcatgtagt ctttacgcca aataagccga tccatttgat tccgataaaa 2880
gaaaaactgg aagaaaggtt cggcgttccc attttaattg aaaacgaagc caacgccggc 2940
gccgttggcg agaaggaata cggggaaggc ggccagcttg agcatgccgt gtttgtcagc 3000
attaataccg ggatcggttt agggatttta atgaatggaa aattgtttag aggtgtgcaa 3060
ggtttttccg gagaagccgg gcacatgtcc attcactttg acggtccgtt atgccggtgc 3120
ggaaatagag gctgctggna gctctacgct tcagaaaaag ccgtcttctc tcactatgca 3180
gaagcttgca tgcctgcagg tcgattcaca aaaaataggc acacgaaaaa caagttaagg 3240
gatgcagttt atgcatccct taacttactt attaaa 3276
<210> 5
<211> 3521
<212> DNA
<213> 人工序列
<220>
<223> MOL2212-gnt基因座
<400> 5
gcagcggttc gtttaatcgg gaatgcctcg acttcgatgg tcatctccct gttggtcgcg 60
atctatacga tggggatcgc cagaaagatc ccgatcaaac aagtgatgga ttcctgttca 120
accgccatta cacaaatcgg aatgatgctc ttgatcatcg ggggcggcgg cgccttcaaa 180
caagtcttga tcaatggcgg agtaggcgac tatgtagctg aattattcaa aggaacagcc 240
atgtcgccga tcttgctcgc ctgggtcatc gccgcaattc tgcgcatctc cttaggatcc 300
gcgacagttg ctgcattaag cacaaccgga ctcgttcttc cgatgctcgg acaaagcgat 360
gtcaatcttg cgctggttgt gcttgcaaca ggggccggaa gtgtaatcgc ttcccatgtc 420
aatgacgcag gcttctggat gttcaaagag tatttcggac taagcatgaa agagacattt 480
gccacctgga cactgcttga aaccattatc gcggtggccg gattaggatt tactttattg 540
ttaagcctat ttgtataaaa aagatcaccc gcgataccgt cattttcgac acatttcttt 600
ctttgctaca tcagataacg ttgccatttc atccccgcct tacctaggga ttctaaactg 660
tcagcaatat tcctgagggc ttatgacact ttgttaaaat taattataaa atgtaatcaa 720
cgaaatttat aagacgggca aaataaaaaa acggatttcc ttcaggaaat ccgtcctctc 780
tgctcttcta tctttgaaca taaattgaaa ccgacccgcc gtttacgtga aactctcccc 840
agccttccga attgatgaca accggctccg aacggtttcc ggtaatgtca tgccatgtct 900
caccggcgtt ttgccggccg acatacattc gctttgcccc accgggtccg tctgttatta 960
atgccgccaa acctgaattt gcaaccgagc tgtcgccttc ccttgtccag ccgacaatgt 1020
catggtggtc gaaataatca tgctgtgctc cgtacgcata ctgttttctc gcttttaaga 1080
tcggttcaat tttgtgtttc aaggcaggaa tttcgcgctg ggagtctcct ttcgtcccgt 1140
acatatcccc gtagaaaacc tgagggtatc cagattccct tgtgagaata aaagcgtaag 1200
caagcggctt aaaccatgtt tggacagtcg actcaagcga ttgccccggc tgtgtatcat 1260
ggttatcgac aaatgtaacc gatttcaacg gatgcttgga aacgaccgta cccttcagca 1320
atttcctcat atcatagccg cctccctgtg tcgatgcagc atggaactga taatgaagcg 1380
gcacgtcaaa cactgaatga ttaaaatttg ttttgttcaa atagttttcc agcgcgccca 1440
agtcattctg ccaatattca gctaccgtaa acatttcctt ccccgttttt tccctgacat 1500
gattaaccca atcccgcaaa aaagaaaatt taatgtgttt gacagcatca agacggtttc 1560
cgtccaattg cagttcattg gcataccaag tgccccatct cttaatttct gctgcgacat 1620
caggatggtc ataatcgatg tcggcataca tcaaataatc atagttgccg ttttcattgg 1680
aaacttccca atcccaagcc tttccttgaa acttatagat gcggttcagc tttcgggact 1740
cgtcccaatc ggttccgtca aaatggtacc aatgccattt aaaatcgctg tatgtgctgc 1800
cggcccccgg aaaatgaaaa tgtgtccagg ctttaattag gtgttctcct gagattacgc 1860
ggttgcggtc agcgggatcg acttcaaccg cggttacatc ttcggtcgca tcagcgccgc 1920
ctttgtggtt gatgaccaca tccccgtaaa cgttaatgtc gcgggaatga agacttttga 1980
tcgcagattg cagctctcct tttgtgccgt actttgtccg aaccgtccct ttttgatgaa 2040
actcccctaa atcataaagg tcgtaagcac cgtagcccac atccgcttgg ctcgttccct 2100
tatatgccgg gggaatccag acggcagtaa taccgtgttc agccaaatat gccgagtcgt 2160
tttgcaaacg cttccaatgt tggccgtcat tgggcatgta ccattcaaaa tactgcatca 2220
gcgtcccatt aagatttgcc gccgctgctg cagaatgagg cagcaagaag atgagcgcaa 2280
ataacagcgt cagcaatcgg gcgtaaagcc gtttttgttg tttcatgatt ctcctcccct 2340
ttcaatgtga tacatatgat attgtataaa tattccgaat ttttaacaag taccattttc 2400
cctatatttt cttccaagat cttccttcag gttatgacca tctgtgccag ttcgtaatgt 2460
ctggtcaact ttccgactct gagaaacttc tggaatcgct agagaatttc tggaatggga 2520
ttcaggagtg gacagaacga cacggatata tagtggatgt gtcaaaacgc ataccatttt 2580
gaacgatgac ctctaataat tgttaatcat gttggagctc agtgagagcg aagcgaacac 2640
ttgatttttt aattttctat cttttatagg tcattagagt atacttattt gtcctataaa 2700
ctatttagca gcataataga tttattgaat aggtcattta agttgagcat attagaggag 2760
gaaaatcttg gagaaatatt tgaagaaccc gagaaaaatc tttcttatgg tcacagcagg 2820
caaaccggtt gattctgtta tcgactcgct cgttcctctg cttgaagaag gggatgtcat 2880
catggacggc ggcaactccc actacgaaga tacggaacga agatatgaca gtttgaaagc 2940
gaaaggtatc ggctacttgg gaatcggcat ttccggcggc gaagtcggcg ctttaaaagg 3000
cccatccatt atgcccggcg gagatcggga cgtctacgaa aaagcagctc cgattctcac 3060
aaaaatcgcc gcccaagtag aaggagatcc atgctgtgtc tacatcggtc caaaaggcgc 3120
ggggcatttt gttaaaatgg tgcacaacgg catcgaatac gcagacatgc agcttatcgc 3180
tgaagcgtat acatttttaa gagaaaagct tcttttgccg atagatgaaa tcgctgacat 3240
tttcgacacg tggaatcaag gagagctgaa aagctattta atcgaaatca cggcagagat 3300
cctgaggaaa aaggatgagc gaacgggcgc tccgctcatc gacgtcatcc tcgacaaaac 3360
cggccaaaaa ggcacgggca aatggacgag cctgcaggcc atcgacaacg gcattccatc 3420
atcaattatc acggaatccc tgtttgcccg ttacctgtca tcattaaaag acgaacggac 3480
agctgccgaa aacgtattgg ccgggcctga aacagaagaa c 3521
<210> 6
<211> 2323
<212> DNA
<213> 人工序列
<220>
<223> MOL2212-prsA基因座
<220>
<221> 尚未归类的特征
<222> (1005)..(1005)
<223> n是a、c、g或t
<220>
<221> 尚未归类的特征
<222> (1390)..(1390)
<223> n是a、c、g或t
<400> 6
aattcattcc gccttttgaa gcggagtagt gaacattttt cggtctcgga atttgctgat 60
gaacgctgga tatattgagt atgcttcctt tcatgcggcg gtccgccata tattttaagg 120
cttcgcgtgc gcagagaaac gcaccggtta aattaacgtc gatcactttc tgccactcat 180
caagctcaag ttcgtgcgga aaggcgcccg cgccgttaaa tcctgaatta ttgaccataa 240
catcaagtga accaaagtgt tcaactgctg aattaatcag ctttttcacg tcctcttcgg 300
aagacacgtc agcttctatc gcaagggcgt ttccgcccgc tgcttgaata ttgtcgacgg 360
cttcccgtgc gcctccggga tcgctgtgat aattgacaac cacattcatc ttttcttttc 420
caaaccgttc tgcaaccgcc ttgcctatac cttttgaaga gccggtcaca attgctgttt 480
ttccttttaa atcactatac aacctaaaca cccctcaatt tcttttctcc atgtacatta 540
cccggtatca gctagcagat ccatgagtag aagcgccata tcggcgcttt tcttttggaa 600
gaaaatatag ggaaaatggt acttgttaaa aattcggaat atttatacaa tatcatatgt 660
tacacattga aaggggagga gaatcatgaa acaacaaaaa cggctttacg cccgattgtg 720
aattcataat tcccctctgt tgaaaatctt tttacagcat gtcagaatat gatatgatac 780
aattcaaagg aaagtttaaa ctgttatgat taggagtgtt tgcatttatg aagaagattg 840
caattgcggc gattacagcg acaagcgtgc tggctctcag cgcatgcagc gggggagatt 900
ctgaggttgt tgcggaaaca aaagctggaa atattacaaa agaagacctt tatcaaacat 960
taaaagacaa tgccggagcg gacgcactga acatgcttgt tcagnaaaaa gtactcgatg 1020
ataaatacga tgtctccgac aaagaaatcg acaaaaagct gaacgagtac aaaaaatcaa 1080
tgggtgacca gctcaaccag ctcattgacc aaaaaggcga agacttcgtc aaagaacaga 1140
tcaaatacga acttctgatg caaaaagccg caaaggataa cataaaagta accgatgatg 1200
acgtaaaaga atattatgac ggcctgaaag gcaaaatcca cttaagccac attcttgtga 1260
aagaaaagaa aacggctgaa gaagttgaga aaaagctgaa aaaaggcgaa aaattcgaag 1320
accttgcaaa agagtattca actgacggta cagccgaaaa aggcggcgac ctcggctggg 1380
tcggcaaagn cgataacatg gacaaggatt tcgtcaaagc ggcatttgct ttgaaaaccg 1440
gcgaaatcag cggacctgtg aaatcccaat tcggctatca catcattaaa aaagacgaag 1500
aacgcggcaa atatgaagac atgaaaaaag agcttaaaaa agaagtccaa gaacaaaagc 1560
aaaatgatca aactgaactg caatccgtca ttgacaaact tgtcaaagat gctgatttaa 1620
aagtaaaaga caaagagttg aaaaaacaag tcgaccagcg tcaagctcag acaagcagca 1680
gcagctgacg ccaaaaaagc tgtcctcccc tcgttggggt cggacagctt tttttatgcg 1740
atggaatggc tgtcagctgc aggtacccgg gtctagagtc gacgcggccg tatacttaat 1800
ttcctttaag cctgtacttt ttgccatcta ttgatatcgt gaaatttgaa ggaccgctga 1860
tcggcaaata atagacaagc tgaaactccg cttcctcacc aggtttaatg gttttccagc 1920
ttgatagagt cactctgatg cggtggaaat ctcctgtcag tccgccaatg ttcggtcccg 1980
tatgcccttt agaaatcact tcaacatgat cgccgctcca gcttctaaac cgaggggaag 2040
tggatgtcgg cgcatcaaat tcgataaaag aacctcccgt aatcgtgaca tcgctgttgt 2100
tgatcagctt catcaccggg tggatcgggt aattttgatc tcctaacgga aagttcgtca 2160
actctacttc tgcatctagt gattcatcag gcaaaggtga tgtgctgagt cgattatcgt 2220
atggtgttga tccgagaatt tatgatactc gttctcgtta aggtattgcc gataccgtat 2280
tctcctttac tgccgtttcg ttcgggatac cagtcataat cag 2323
<210> 7
<211> 6165
<212> DNA
<213> 人工序列
<220>
<223> forD:cas9d-gDNA(p4199)-cat基因座
<400> 7
cggatcaaat gatcttcagg agtcagcata atacatccag ttcaggtaga taagatttga 60
atttggtgac ttgcttttgt tcttcttctt tcattttctg actaatccaa actggaaaaa 120
gcaggtcttt taacagatta ggaggtttct gacatgcacc attcggtcac taaccgaatg 180
cagtaaagga cactgtggtg cttgccagcc attagggtat tgaggaggtg atcaaaatgc 240
taggtgacag tatttcgtcg aagtggacaa gtcgtgacca aatgacctcg gatcgagggt 300
tggtcatgga ggaaaaaatt gatgtctggt gacaaagagg agtcatgatc atggcaccgc 360
caacgaggga aaaaactctt cccgcatcga cacggtatgt gggcggtgac aaactaactt 420
atagagtaaa tttattagtc gaatgaaaga cgcgctaaaa atgaggaggg aagcgaatgg 480
acaaaaaata cagcatcggc ctggctattg gcacaaattc agttggctgg gcagttatca 540
cagacgaata taaagttccg agcaaaaaat ttaaagtcct gggcaataca gatcgccata 600
gcatcaaaaa aaacctgatt ggcgcactgc tgtttgattc aggcgaaaca gcagaagcaa 660
caagacttaa aagaacagca agacgcagat atacaagacg caaaaatcgc atttgctatc 720
tgcaagaaat ctttagcaac gaaatggcga aagtcgacga cagctttttt catagactgg 780
aagaatcatt tctggtcgaa gaagataaaa aacacgaacg ccatccgatt tttggcaaca 840
ttgttgatga agtcgcgtat catgaaaaat acccgacaat ttatcatctg cgcaaaaaac 900
tggttgacag cacagataaa gcagatcttc gcctgattta tctggcactg gcacatatga 960
tcaaatttag aggccatttt ctgatcgaag gcgatctgaa tccggataat tcagatgtcg 1020
acaaactgtt tattcagctg gtccagacat ataaccagct gtttgaagaa aatccgatta 1080
atgcatcagg cgttgatgca aaagcaattc tgtcagcaag actgtcaaaa tcaagacgcc 1140
tggaaaatct gattgcacaa ctgcctggcg aaaaaaaaaa tggactgttt ggcaatctta 1200
ttgcactgtc actgggcctg acaccgaact ttaaatcaaa ttttgatctg gcggaagatg 1260
cgaaactgca actttcaaaa gatacgtatg atgacgatct ggataatctg ctggcgcaaa 1320
ttggcgatca atatgcagat ctttttctgg cagcgaaaaa tctgtcagat gcaattctgc 1380
tgtcagatat tctgcgcgtc aatacagaaa ttacaaaagc accgctgagc gcgagcatga 1440
ttaaaagata tgatgaacat catcaggacc tgacactgct gaaagcactg gttagacaac 1500
aactgccgga aaaatacaaa gaaatctttt ttgatcagag caaaaacggc tatgcaggct 1560
atattgatgg cggagcatca caagaagaat tttacaaatt tatcaaaccg atcctggaaa 1620
aaatggatgg aacagaagaa ctgctggtta aactgaatcg cgaagattta ctgagaaaac 1680
agcgcacatt tgataatggc tcaattccgc atcaaattca tctgggcgaa ctgcatgcga 1740
ttcttagacg ccaagaagat ttttatccgt ttctgaaaga caaccgggaa aaaattgaaa 1800
aaatcctgac atttcgcatc ccgtattatg tcggaccgct ggcaagaggc aattcaagat 1860
ttgcatggat gacacgcaaa agcgaagaaa caattacacc gtggaatttt gaagaagtcg 1920
ttgataaagg cgcaagcgca caatcattta ttgaacgcat gacgaacttt gacaaaaacc 1980
tgccgaatga aaaagtcctg ccgaaacatt cactgctgta tgaatacttt acggtctata 2040
atgaactgac gaaagtcaaa tatgtcacag aaggcatgag aaaaccggca tttctgtcag 2100
gcgaacagaa aaaagcgatt gtcgatcttc tgtttaaaac gaaccgcaaa gtcacagtga 2160
aacagctgaa agaagattac tttaaaaaaa tcgaatgctt tgatagcgtc gaaatctcag 2220
gcgtcgaaga tagatttaat gcaagcctgg gcacatatca tgatctgctg aaaatcatca 2280
aagataaaga ttttctggat aacgaagaaa acgaagatat cctggaagat attgtgctga 2340
cactgacgct ttttgaagat cgcgaaatga ttgaagaacg cctgaaaaca tatgcgcacc 2400
tgtttgatga taaagtcatg aaacaactta aacgcagacg ctatacaggc tggggcagac 2460
tttcaagaaa actgattaac ggcattcgcg ataaacaaag cggcaaaaca atcctggatt 2520
ttctgaaatc agatggcttt gcgaatcgca attttatgca gctgattcat gatgacagcc 2580
tgacgtttaa agaagatatt cagaaagcac aagtttcagg ccaaggcgat tcactgcatg 2640
aacatattgc aaatctggca ggctcaccgg caatcaaaaa aggcattctg caaacagtta 2700
aagtcgtcga tgaactggtt aaagttatgg gcagacataa accggaaaac atcgttattg 2760
aaatggcacg cgaaaatcag acaacacaaa aaggacagaa aaattcacgc gaacggatga 2820
aaagaattga agaaggcatt aaagaactgg gcagccaaat cctgaaagaa catccggttg 2880
aaaatacaca gctgcagaac gaaaaactgt atctgtatta tctgcagaat ggacgcgata 2940
tgtatgtcga tcaagaactg gatattaatc gcctgagcga ttatgatgtg gatgctattg 3000
ttccgcagag ctttcttaaa gatgatagca tcgataacaa agtcctgaca cgctcagata 3060
aaaacagagg caaatcagat aatgtcccgt cagaagaggt tgtcaaaaaa atgaaaaact 3120
actggcgtca actgctgaac gcgaaactta ttacacaacg caaatttgac aatctgacaa 3180
aagcagaaag aggcggactg tcagaacttg ataaagcggg ttttatcaaa agacagctgg 3240
tcgaaacacg ccagattaca aaacatgttg cgcaaattct ggatagccgc atgaacacaa 3300
aatatgacga aaacgataaa ctgatccggg aagtcaaagt cattacgctg aaatcaaaac 3360
tggtcagcga ttttcgcaaa gactttcagt tttacaaagt ccgcgaaatc aacaactacc 3420
atcatgcaca tgatgcatat ctgaatgcag ttgtcggcac agcgcttatc aaaaaatacc 3480
ctaaactgga aagcgaattt gtctacggcg actataaagt ctatgatgtc cgcaaaatga 3540
ttgcgaaaag cgaacaagaa attggcaaag cgacagcgaa atactttttt tacagcaaca 3600
tcatgaactt ttttaaaacg gaaatcacac tggcgaacgg cgaaattaga aaaagaccgc 3660
ttattgaaac gaacggtgaa acaggcgaaa ttgtttggga taaaggcaga gattttgcaa 3720
cagttagaaa agttctgagc atgccgcaag tcaacatcgt gaaaaaaaca gaagttcaga 3780
caggcggatt tagcaaagaa tcaattcttc cgaaacgcaa ctcagacaaa ctgattgcgc 3840
gtaaaaaaga ctgggacccg aaaaaatacg gtggctttga ttcaccgaca gttgcatatt 3900
cagttctggt tgttgcgaaa gtggaaaaag gcaaatccaa aaaacttaaa agcgtgaaag 3960
aacttctggg catcacaatt atggaacgct cgagctttga aaaaaacccg atcgactttc 4020
tggaagccaa aggctataaa gaagtgaaaa aagaccttat tatcaaactg ccgaaataca 4080
gcctgtttga actggaaaat ggcagaaaac gcatgctggc atcagcaggc gaacttcaga 4140
aaggcaatga actggcactg ccgtcaaaat atgttaactt tctgtatctg gcgagccatt 4200
acgaaaaact taaaggctca ccggaagata acgaacagaa acaactgttt gtcgaacagc 4260
ataaacatta cctggacgaa atcatcgaac aaatcagcga attttcaaaa cgcgttattc 4320
tggcagatgc gaacctggat aaagttctta gcgcatataa caaacaccgg gataaaccga 4380
ttagagaaca agcggaaaat atcattcacc tgtttacact gacaaatctt ggcgcaccgg 4440
cagcgtttaa atactttgat acaacaattg accgcaaacg ctacacaagc acaaaagaag 4500
ttctggacgc aacactgatt catcaatcaa ttacaggcct ttatgaaacg agcattgatc 4560
tgtcacaact gggaggcgat tgatgctgtc cagactgtcc gctgtgtaaa aaaaaggaat 4620
aaaggggggt tgacattatt ttactgatat gtataatata atttgtataa gaaaatgaat 4680
ggtacttgtt aaaaattgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt 4740
tatcaacttg aaaaagtggc accgagtcgg tgctttgcgg ccgcagatct gggaccaata 4800
ataatgacta gagaagaaag aatgaagatt gttcatgaaa ttaaggaacg aatattggat 4860
aaagtgggat atttttaaaa tatatattta tgttacagta atattgactt ttaaaaaagg 4920
attgattcta atgaagaaag cagacaagta agcctcctaa attcacttta gataaaaatt 4980
taggaggcat atcaaatgaa ctttaataaa attgatttag acaattggaa gagaaaagag 5040
atatttaatc attatttgaa ccaacaaacg acttttagta taaccacaga aattgatatt 5100
agtgttttat accgaaacat aaaacaagaa ggatataaat tttaccctgc atttattttc 5160
ttagtgacaa gggtgataaa ctcaaataca gcttttagaa ctggttacaa tagcgacgga 5220
gagttaggtt attgggataa gttagagcca ctttatacaa tttttgatgg tgtatctaaa 5280
acattctctg gtatttggac tcctgtaaag aatgacttca aagagtttta tgatttatac 5340
ctttctgatg tagagaaata taatggttcg gggaaattgt ttcccaaaac acctatacct 5400
gaaaatgctt tttctctttc tattattcca tggacttcat ttactgggtt taacttaaat 5460
atcaataata atagtaatta ccttctaccc attattacag caggaaaatt cattaataaa 5520
ggtaattcaa tatatttacc gctatcttta caggtacatc attctgtttg tgatggttat 5580
catgcaggat tgtttatgaa ctctattcag gaattgtcag ataggcctaa tgactggctt 5640
ttataatatg agataatgcc gactggctag catggcaaga cccagaaaag ttctgggaga 5700
tcccgctttg cataagcgta ttatagtgga tgacgcgggc tttgttgttt acacttcttg 5760
cacctgctga cggcaatcat ccctatctat gaaatcgaga tttcagcagg ccgttatttt 5820
cgagagagtt aaatctatat tcattgtttt tattttggta aggacatacc ggattttagg 5880
tttggattac cggtcgagtt agcttgtctt ttcgcccact accgtgtcga tgcgggagca 5940
atttaccaga agcacttacc gattgatagt tttttattcc ggtgattgca aagtttcata 6000
aactctgaga attcaatagg ggtaataccc cgctttgagg ggcgcggcat tttatgcgcc 6060
ccgagtattt attcttaaaa tttttaaatt aatgtatcta tataaaaagg agatgctttc 6120
ggtgtactgc caaagcatct ccacaaaaga tagtgcatat ctgca 6165
<210> 8
<211> 3629
<212> DNA
<213> 人工序列
<220>
<223> amyE:GFP-gDNA(p4199).dna基因座
<400> 8
aatgtgttac acctgttttg taattctcaa ggaaaacatg aggcgctttt gcaatatcat 60
caggataaag cacagctaca gacctggcat tgatcgtgcc tgtcagttta ccatcgttca 120
cttgaaatga acccgctcca gctttattgt catacctgcc atcaggcaat tttgttgccg 180
tattgataga gacagaggat gaacctgcat ttgccagcac aacgccatgt gagccgcgct 240
gattcataaa tatctggttg tttccattcg ggttcgagag ttcctcaggc tgtccagcca 300
tcacattgtg aaatctattg accgcagtga tagcctgatc ttcaaataaa gcactcccgc 360
gatcgcctat ttggcttttc cccgggaacc tcacaccatt tccgcctccc tcaggtctgg 420
aaaagaaaag aggcgtactg cctgaacgag aagctatcac cgcccagcct aaacggatat 480
catcatcgct catccatgtc tgtagacaaa ttgtgaaagg atgtacttaa acgctaacgg 540
tcagctttat tgaacagtaa tttaagtata tgtccaatct agggtaagta aattgagtat 600
caatataaac tttatatgaa cataatcaac gaggtgaaat catgagcaat ttgattaacg 660
gaaaaatacc aaatcaagcg attcaaacat taaaaatcgt aaaagattta tttggaagtt 720
caatagttgg agtatatcta tttggttcag cagtaaatgg tggtttacgc atttacagcg 780
atgtagatgt tctagtcgtc gtgaatcata gtttacctca attaactcga aaaaaactaa 840
cagaaagact aatgactata tcaggaaaga ttggaaatac ggattctgtt agaccacttg 900
aagttacggt tataaatagg agtgaagttg tcccttggca atatcctcca aaaagagaat 960
ttatatacgg tgagtggctc aggtgtggat ttgagaatgg acaaattcag gaaccaagct 1020
atgatcctga tttggctatt gttttagcac aagcaagaaa gaatagtatt tctctatttg 1080
gtcctgattc ttcaagtata cttgtctccg tacctttgac agatattcga agagcaatta 1140
aggattcttt gccagaacta attgagggga taaaaggtga tgagcgtaat gtaattttaa 1200
ccctagctcg aatgtggcaa acagtgacta ctggtgaaat tacctcgaaa gatgtcgctg 1260
cggaatgggc tatacctctt ttacctaaag agcatgtaac tttactggat atagccagaa 1320
aaggctatcg gggagagtgt gatgataagt gggaaggact atattcaaag gtgaaagcac 1380
tcgttaagta tatgaaaaat tctatagaaa cttctctcaa ttaggctaat tttattgcaa 1440
taacaggtgc ttacttttaa aactactgat ttattgataa atattgaaca atttttggga 1500
agaataaagc gtcctcttgt gaaattagag aacgctttat tactttaatt tagtgaaaca 1560
atttgtaact attgaaaata gaaagaaatt gttccttcga tagtttatta atattagtgg 1620
agctcagtga gagcgaagcg aacacttgat tttttaattt tctatctttt ataggtcatt 1680
agagtatact tatttgtcct ataaactatt tagcagcata atagatttat tgaataggtc 1740
atttaagttg agcatattag gggaggaaaa tcttggagaa atatttgaag aacccgagat 1800
ctagatcagg taccgcaacg ttcgcagatg ctgctgaaga gattattaaa aagctgaaag 1860
caaaaggcta tcaattggta actgtatctc agcttgaaga agtgaagaag cagagaggct 1920
attgaataaa tgagtagaaa gcgccatatc ggcgcttttc ttttggaaga aaatataggg 1980
aaaatggtac ttgttaaaaa ttcggaatat ttatacaata tcatatgtat cacattgaaa 2040
ggaggaggga agctttatga gtaaaggaga agaacttttc actggagttg tcccaattct 2100
tgttgaatta gatggcgatg ttaatgggca aaaattctct gttagtggag agggtgaagg 2160
tgatgcaaca tacggaaaac ttacccttaa atttatttgc actactggga agctacctgt 2220
tccatggcca acgcttgtca ctactctcac ttatggtgtt caatgctttt ctagataccc 2280
agatcatatg aaacagcatg actttttcaa gagtgccatg cccgaaggtt atgtacagga 2340
aagaactata ttttacaaag atgacgggaa ctacaagaca cgtgctgaag tcaagtttga 2400
aggtgatacc cttgttaata gaatcgagtt aaaaggtatt gattttaaag aagatggaaa 2460
cattcttgga cacaaaatgg aatacaatta taactcacat aatgtataca tcatggcaga 2520
caaaccaaag aatggcatca aagttaactt caaaattaga cacaacatta aagatggaag 2580
cgttcaatta gcagaccatt atcaacaaaa tactccaatt ggcgatggcc ctgtcctttt 2640
accagacaac cattacctgt cccaccaatc tgccctttcc aaagatccca acgaaaagag 2700
agatcacatg atccttcttg agtttgtaac agctgctggg attacacatg gcatggatga 2760
actatacaaa taatgctgtc cagactgtcc gctgtgtaaa aaaaaggaat aaaggggggt 2820
tgacattatt ttactgatat gtataatata atttgtataa gaaaatgaat ggtacttgtt 2880
aaaaattgtt ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg 2940
aaaaagtggc accgagtcgg tgctttgcgg ccgcgtcgat tgacactaaa gggatccaga 3000
agcggcaaca cgctaatcaa taaaaaaacg ctgtgcggtt aaagggcaca gcgttttttg 3060
tgtatgaatc gaaaaagaga acagatcgca ggtctcaaaa atcgagcgta aagggctgat 3120
ccgcggccgc gcgtcaacaa tgacctttat gccatattct tcagcggctg cacacatttc 3180
tttaaattct tgttcagtac ctaagtaacg gttgccaatt tgatacgatg tcggctgata 3240
cagccagtac cagttcgaca tgcttttatc tccttgattc ccttccttta cttggttaat 3300
cggagatgtc tgaatggctg tatatcctgc atcatgaata tccttcatat tgtgttttaa 3360
cgtattgaac gaccaattcc atgcatgaag aatggttccg cttttgatcg acggtgctgt 3420
aagctcattc gatttgttcg ccgtttcagc actcgcagcc gccggtcctg ccagaaccaa 3480
atgaaacagc aataaaaatc cagcgaataa cggcagtaaa gaggttttga atcgttttgc 3540
aaacattctt gacactcctt atttgatttt ttgaagactt acttcggagt caaaaatccc 3600
tcttacttca ttcttccgct tcctccttt 3629
<210> 9
<211> 6881
<212> DNA
<213> 人工序列
<220>
<223> pel:cas9d-gDNA(GFP)基因座
<400> 9
taggccacca gacgttggga tccaatgatg gctggggcgc gtactcgacc ggcacgacag 60
gcggatcaaa agcatcctcc tcaaatgtgt ataccgtcag caacagaaac cagcttgtct 120
cggcattagg gaaggaaacg aacacaacgc caaaaatcat ttatatcaag ggaacgattg 180
acatgaacgt ggatgacaat ctgaagccgc ttggcctaaa tgactataaa gatccggagt 240
atgatttgga caaatatttg aaagcctatg atcctagcac atggggcaaa aaagagccgt 300
cgggaacaca agaagaagcg agagcacgct ctcagaaaaa ccaaaaagca cgggtcatgg 360
tggatatccc tgcaaacacg acgatcgtcg gttcagggac taacgctaaa gtcgtgggag 420
gaaacttcca aatcaagagt gataacgtca ttattcgcaa cattgaattc caggatgcct 480
atgactattt tccgcaatgg ttgtaaaacg acggccagtg aattctgatc aaatggttca 540
gtgagagcga agcgaacact tgatttttta attttctatc ttttataggt cattagagta 600
tacttatttg tcctataaac tatttagcag cataatagat ttattgaata ggtcatttaa 660
gttgagcata ttagaggagg aaaatcttgg agaaatattt gaagaacccg aggatctaga 720
tcaggtaccg caacgttcgc agatgctgct gaagagatta ttaaaaagct gaaagcaaaa 780
ggctatcaat tggtaactgt atctcagctt gaagaagtga agaagcagag aggctattga 840
ataaatgagt agaaagcgcc atatcggcgc ttttcttttg gaagaaaata tagggaaaat 900
ggtacttgtt aaaaattcga aatatttata caatatcata tgtatcacat tgaaagggga 960
ggagaatcat ggacaaaaaa tacagcatcg gcctggctat tggcacaaat tcagttggct 1020
gggcagttat cacagacgaa tataaagttc cgagcaaaaa atttaaagtc ctgggcaata 1080
cagatcgcca tagcatcaaa aaaaacctga ttggcgcact gctgtttgat tcaggcgaaa 1140
cagcagaagc aacaagactt aaaagaacag caagacgcag atatacaaga cgcaaaaatc 1200
gcatttgcta tctgcaagaa atctttagca acgaaatggc gaaagtcgac gacagctttt 1260
ttcatagact ggaagaatca tttctggtcg aagaagataa aaaacacgaa cgccatccga 1320
tttttggcaa cattgttgat gaagtcgcgt atcatgaaaa atacccgaca atttatcatc 1380
tgcgcaaaaa actggttgac agcacagata aagcagatct tcgcctgatt tatctggcac 1440
tggcacatat gatcaaattt agaggccatt ttctgatcga aggcgatctg aatccggata 1500
attcagatgt cgacaaactg tttattcagc tggtccagac atataaccag ctgtttgaag 1560
aaaatccgat taatgcatca ggcgttgatg caaaagcaat tctgtcagca agactgtcaa 1620
aatcaagacg cctggaaaat ctgattgcac aactgcctgg cgaaaaaaaa aatggactgt 1680
ttggcaatct tattgcactg tcactgggcc tgacaccgaa ctttaaatca aattttgatc 1740
tggcggaaga tgcgaaactg caactttcaa aagatacgta tgatgacgat ctggataatc 1800
tgctggcgca aattggcgat caatatgcag atctttttct ggcagcgaaa aatctgtcag 1860
atgcaattct gctgtcagat attctgcgcg tcaatacaga aattacaaaa gcaccgctga 1920
gcgcgagcat gattaaaaga tatgatgaac atcatcagga cctgacactg ctgaaagcac 1980
tggttagaca acaactgccg gaaaaataca aagaaatctt ttttgatcag agcaaaaacg 2040
gctatgcagg ctatattgat ggcggagcat cacaagaaga attttacaaa tttatcaaac 2100
cgatcctgga aaaaatggat ggaacagaag aactgctggt taaactgaat cgcgaagatt 2160
tactgagaaa acagcgcaca tttgataatg gctcaattcc gcatcaaatt catctgggcg 2220
aactgcatgc gattcttaga cgccaagaag atttttatcc gtttctgaaa gacaaccggg 2280
aaaaaattga aaaaatcctg acatttcgca tcccgtatta tgtcggaccg ctggcaagag 2340
gcaattcaag atttgcatgg atgacacgca aaagcgaaga aacaattaca ccgtggaatt 2400
ttgaagaagt cgttgataaa ggcgcaagcg cacaatcatt tattgaacgc atgacgaact 2460
ttgacaaaaa cctgccgaat gaaaaagtcc tgccgaaaca ttcactgctg tatgaatact 2520
ttacggtcta taatgaactg acgaaagtca aatatgtcac agaaggcatg agaaaaccgg 2580
catttctgtc aggcgaacag aaaaaagcga ttgtcgatct tctgtttaaa acgaaccgca 2640
aagtcacagt gaaacagctg aaagaagatt actttaaaaa aatcgaatgc tttgatagcg 2700
tcgaaatctc aggcgtcgaa gatagattta atgcaagcct gggcacatat catgatctgc 2760
tgaaaatcat caaagataaa gattttctgg ataacgaaga aaacgaagat atcctggaag 2820
atattgtgct gacactgacg ctttttgaag atcgcgaaat gattgaagaa cgcctgaaaa 2880
catatgcgca cctgtttgat gataaagtca tgaaacaact taaacgcaga cgctatacag 2940
gctggggcag actttcaaga aaactgatta acggcattcg cgataaacaa agcggcaaaa 3000
caatcctgga ttttctgaaa tcagatggct ttgcgaatcg caattttatg cagctgattc 3060
atgatgacag cctgacgttt aaagaagata ttcagaaagc acaagtttca ggccaaggcg 3120
attcactgca tgaacatatt gcaaatctgg caggctcacc ggcaatcaaa aaaggcattc 3180
tgcaaacagt taaagtcgtc gatgaactgg ttaaagttat gggcagacat aaaccggaaa 3240
acatcgttat tgaaatggca cgcgaaaatc agacaacaca aaaaggacag aaaaattcac 3300
gcgaacggat gaaaagaatt gaagaaggca ttaaagaact gggcagccaa atcctgaaag 3360
aacatccggt tgaaaataca cagctgcaga acgaaaaact gtatctgtat tatctgcaga 3420
atggacgcga tatgtatgtc gatcaagaac tggatattaa tcgcctgagc gattatgatg 3480
tggatgctat tgttccgcag agctttctta aagatgatag catcgataac aaagtcctga 3540
cacgctcaga taaaaacaga ggcaaatcag ataatgtccc gtcagaagag gttgtcaaaa 3600
aaatgaaaaa ctactggcgt caactgctga acgcgaaact tattacacaa cgcaaatttg 3660
acaatctgac aaaagcagaa agaggcggac tgtcagaact tgataaagcg ggttttatca 3720
aaagacagct ggtcgaaaca cgccagatta caaaacatgt tgcgcaaatt ctggatagcc 3780
gcatgaacac aaaatatgac gaaaacgata aactgatccg ggaagtcaaa gtcattacgc 3840
tgaaatcaaa actggtcagc gattttcgca aagactttca gttttacaaa gtccgcgaaa 3900
tcaacaacta ccatcatgca catgatgcat atctgaatgc agttgtcggc acagcgctta 3960
tcaaaaaata ccctaaactg gaaagcgaat ttgtctacgg cgactataaa gtctatgatg 4020
tccgcaaaat gattgcgaaa agcgaacaag aaattggcaa agcgacagcg aaatactttt 4080
tttacagcaa catcatgaac ttttttaaaa cggaaatcac actggcgaac ggcgaaatta 4140
gaaaaagacc gcttattgaa acgaacggtg aaacaggcga aattgtttgg gataaaggca 4200
gagattttgc aacagttaga aaagttctga gcatgccgca agtcaacatc gtgaaaaaaa 4260
cagaagttca gacaggcgga tttagcaaag aatcaattct tccgaaacgc aactcagaca 4320
aactgattgc gcgtaaaaaa gactgggacc cgaaaaaata cggtggcttt gattcaccga 4380
cagttgcata ttcagttctg gttgttgcga aagtggaaaa aggcaaatcc aaaaaactta 4440
aaagcgtgaa agaacttctg ggcatcacaa ttatggaacg ctcgagcttt gaaaaaaacc 4500
cgatcgactt tctggaagcc aaaggctata aagaagtgaa aaaagacctt attatcaaac 4560
tgccgaaata cagcctgttt gaactggaaa atggcagaaa acgcatgctg gcatcagcag 4620
gcgaacttca gaaaggcaat gaactggcac tgccgtcaaa atatgttaac tttctgtatc 4680
tggcgagcca ttacgaaaaa cttaaaggct caccggaaga taacgaacag aaacaactgt 4740
ttgtcgaaca gcataaacat tacctggacg aaatcatcga acaaatcagc gaattttcaa 4800
aacgcgttat tctggcagat gcgaacctgg ataaagttct tagcgcatat aacaaacacc 4860
gggataaacc gattagagaa caagcggaaa atatcattca cctgtttaca ctgacaaatc 4920
ttggcgcacc ggcagcgttt aaatactttg atacaacaat tgaccgcaaa cgctacacaa 4980
gcacaaaaga agttctggac gcaacactga ttcatcaatc aattacaggc ctttatgaaa 5040
cgagcattga tctgtcacaa ctgggaggcg attgatgctg tccagactgt ccgctgtgta 5100
aaaaaaagga ataaaggggg gttgacatta ttttactgat atgtataata taatttgtat 5160
aagaaaatgt ctgttagtgg agagggtgag ttttagagct agaaatagca agttaaaata 5220
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgctttgc ggccgcagat 5280
ctgggaccaa taataatgac tagagaagaa agaatgaaga ttgttcatga aattaaggaa 5340
cgaatattgg ataaagtggg atatttttaa aatatatatt tatgttacag taatattgac 5400
ttttaaaaaa ggattgattc taatgaagaa agcagacaag taagcctcct aaattcactt 5460
tagataaaaa tttaggaggc atatcaaatg aactttaata aaattgattt agacaattgg 5520
aagagaaaag agatatttaa tcattatttg aaccaacaaa cgacttttag tataaccaca 5580
gaaattgata ttagtgtttt ataccgaaac ataaaacaag aaggatataa attttaccct 5640
gcatttattt tcttagtgac aagggtgata aactcaaata cagcttttag aactggttac 5700
aatagcgacg gagagttagg ttattgggat aagttagagc cactttatac aatttttgat 5760
ggtgtatcta aaacattctc tggtatttgg actcctgtaa agaatgactt caaagagttt 5820
tatgatttat acctttctga tgtagagaaa tataatggtt cggggaaatt gtttcccaaa 5880
acacctatac ctgaaaatgc tttttctctt tctattattc catggacttc atttactggg 5940
tttaacttaa atatcaataa taatagtaat taccttctac ccattattac agcaggaaaa 6000
ttcattaata aaggtaattc aatatattta ccgctatctt tacaggtaca tcattctgtt 6060
tgtgatggtt atcatgcagg attgtttatg aactctattc aggaattgtc agataggcct 6120
aatgactggc ttttataata tgagataatg ccgactgtac tttttacagt cggttttcta 6180
acgatacatt aataggtacg aaaaagcaac tttttttgcg cttaaaacca gtcataccaa 6240
taacttaagg gtaactagcc tcgccggaaa gagcgaaaat gcctcacatt tgtgccacct 6300
aaaaaggagc gatttacata tgagttatgc agtttgtaga atgcaaaaag tgaaatcagc 6360
tggactaaaa ggggccgcag agtagaatgg aaaaggggat cggaaaacaa gtatatagga 6420
ggagacctat ttatggcttc agaaaaagac gcaggaaaac agtcagcagt aaagcttgtt 6480
ccattgctta ttactgtcgc tgtgggacta atcatctggt ttattcccgc tccgtccgga 6540
cttgaaccta aagcttggca tttgtttgcg atttttgtcg caacaattat cggctttatc 6600
tccaagccct tgccaatggg tgcaattgca atttttgcat tggcggttac tgcactaact 6660
ggaacactat caattgagga tacattaagc ggattcggga ataagaccat ttggcttatc 6720
gttatcgcat tctttatttc ccggggattt atcaaaaccg gtctcggtgc gagaatttcg 6780
tatgtattcg ttcagaaatt cggaaaaaaa acccttggac tttcttattc actgctattc 6840
agtgatttaa tactttcacc tgctattcca agtaatacgg c 6881

Claims (37)

1.一种II类Cas9蛋白的温度敏感性变体(tsCas9),所述变体包含对蛋白质稳定性或对所述II类Cas9蛋白、一个或多个指导RNA(gRNA)和一个或多个相对应的基因组靶序列之间形成的复合物的稳定性重要的一个或多个氨基酸的至少一个改变,其中,所述至少一个改变是1-10个氨基酸的取代、插入或缺失;优选地,所述至少一个改变是1-10个氨基酸的取代或缺失;最优选地,所述至少一个改变是取代。
2.根据权利要求1所述的tsCas9,所述变体是切割酶或核酸酶无效变体;优选地,所述tsCas9包含对应于SEQ ID NO:2的位置10和/或位置840的氨基酸的改变;更优选地,所述变体包含天冬氨酸取代丙氨酸,D10A和/或组氨酸取代丙氨酸,H840A。
3.根据前述权利要求中任一项所述的tsCas9,其中所述至少一个改变是在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的T13、N14、S29、K31、F32、L35、K44、N46、S55、E57、T62、R63、K65、R66、R69、R70、R71、Y72、R74、R75、R78、S104、F105、V107、E108、R115、H116、V126、H129、Y136、H160、K163、F164、R165、P176、S179、E223、N235、E260、D261、D269、T310、P316、Y325、H328、H329、K336、R340、Y347、F351、F352、I363、D364、R403、P411、Q413、I414、Y430、F432、I448、Y450、P454、L455、R457、N459、S460、R461、F462、R467、T472、F491、M495 N497、Y515、R557、G582、R653、T657、R661、Q695、H698、S719、L720、H721、K735、L738、K742、M751、R765 S777、E779、D850、Q894、E910、L911、F916、K918、Q920、T924、R925、Q926、K929、Q933、R951、S960、S964、K968、R976、V982、Y1013、G1030、A1032、K1085、M1089、P1090、Q1091、T1098、E1099、V1100、T1102、G1103、F1105、K1107 E1108、S1109、K1113、R11414、N1115、S1116、D1117、K1118、K1123、K1124、F1134、D1135、W1126、K1135、R1171、K1197、K1211、S1216、E1219、E1243、R1279、D1284、P1301、H1311、R1333、K1334、R1335、T1337、S1338、H1349、Y1356和T1358。
4.根据前述权利要求中任一项所述的tsCas9,其中所述至少一个改变是在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的S104、F105、V107、P176、S179、E223、N235、E260、D261、T310、P316、P411、Q413、I414、Y430、F432、R457、N459、P475、W476、R557、R653、Q739、E910、L911、R951、K1123、W1126S和H1311;优选地所述至少一个改变是在对应于选自由以下组成的组的位置的位置中:SEQ ID NO:2的S104、F105、V107、P176、S179、E223、E260、D261、T310、P316、P411、Q413、I414、Y430、F432、R457、N459、P475、W476、R557、R653、Q739、E910、L911、R951、K1123、W1126S和H1311。
5.根据权利要求1-3中任一项所述的tsCas9,其中所述至少一个氨基酸改变选自由以下组成的组:T13S、T13A、N14D、N14S、N14A、S29A、S29G、S29T、S29V、K31R、K31Q、K31H、K31M、K31L、F32Y、F32H、F32H、F32L、F32I、F32M、L35V、L35A、L35T、L35I、L35M、L35F、L35H、K44R、K44Q、K44H、K44M、K44L、K44D、K44N、K44H、K44M、K44L、N46D、N46S、N46T、N46Q、S55A、E57Q、E57D、E57N、E57H、T62S、T62A、T62V、T62P、R63K、R63H、R63Q、R63E、K65R、K65H、K65Q、K65M、K65L、R66K、R66H、R66Q、R66E、R69K、R69H、R69Q、R69E、R70K、R70H、R70Q、R70E、R71K、R71H、R71Q、R71E、Y72F、Y72H、Y72L、Y72M、Y72I、Y72W、R74K、R74H、R74Q、R74E、R75K、R75H、R75Q、R75E、R78K、R78H、R78Q、R78E、S104A、S104A、S104T、S104V、F105H、F105L、F105M、F105I、F105Y、F105W、V107S、V107A、V107I、V107L、V107T、E108Q、E108D、E108N、R115K、R115H、R115Q、R115E、H116F、H116Y、H116Q、H116E、H116N、H116D、H116S、H116T、V126I、V126L、V126A、V126T、V126S、H129F、H129Y、H129Q、H129E、H129N、H129D、H129S、H129T、Y136F、Y136H、Y136L、Y136M、Y136I、Y136W、H160F、H160Y、H160Q、H160E、H160N、H160D、H160S、H160T、K163R、K163H、K163Q、K163E、K163M、K163L、F164Y、F164H、F164M、F164L、F164I、F164W、R165K、R165H、R165Q、R165E、P176A、P176G、P176S、P176T、P176V、S179A、S179G、S179T、S179V、S179P、E223Q、E223D、E223N、E223H、E223S、E223A、E223I、E223L、E223T、E223V、E223P、E223K、E223Y、E223W、E223F、E223G、E223C、E223R、N235NGSGAGGSY、E260Q、E260S、D261N、D261S、D269N、D269S、D269A、T310A、T310G、P316G、P316D、Y325F、Y325H、Y325L、Y325M、Y325I、Y325W、H328F、H328Y、H328Q、H328E、H328N、H328D、H328S、H328T、H329F、H329Y、H329Q、H329E、H329N、H329D、H329S、H329T、K336R、K336H、K336M、K336L、R340K、R340H、R340Q、R340E、Y347F、Y347H、Y347M、Y347L、Y347I、F351H、F351Y、F351M、F351L、F351I、F351W、F352H、F352Y、F352M、F352L、F352I、F352W、I363F、I363L、I363M、I363V、I363A、I363T、D364E、D364Q、D364H、D364N、D364S、D364T、R403K、R403H、R403Q、R403E、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、I448L、I448M、I448V、I448A、Y450H、Y450L、Y450F、P454A、P454G、P454S、P454T、P454V、L455I、L455V、L455M、L455T、L455N、L455F、L455A、R457K、R457H、R457Q、R457E、R457S、N459D、N459E、N459Q、N459H、N459S、N459T、N459A、S460A、S460G、S460T、S460V、R461K、R461H、R461Q、R461E、R461S、F462Y、F462H、F462L、F462I、F462V、F462W、R467K、R467H、R467Q、R467E、T472A、T472P、T472S、T472V、F491H、F491L、M495K、M495Q、M495L、N497D、N497Q、N497E、N497S、Y515F、Y515H、Y515M、Y515L、R557K、R557S、G582A、G582S、G582T、G582V、R653H、R653N、T657S、T657A、T657N、R661K、R661H、R661Q、R661E、Q695E、Q695N、Q695D、H698F、H698Q、H698N、S719A、S719T、S719V、L720I、L720V、L720M、L720T、L720N、L720F、L720A、H721F、H721Y、H721Q、H721E、H721N、H721D、H721S、H721T、K735R、K735Q、K735H、K735M、K735L、L738I、L738V、L738M、L738T、L738N、L738F、L738A、K742R、K742Q、K742H、K742M、K742L、M751L、M751I、M751V、M751T、M751K、R765K、R765H、R765Q、S777A、S777N、S777D、E779Q、E779H、E779D、E779N、D850N、D850S、D850A、Q894E、Q894N、Q894S、E910Q、E910S、L911V、L911A、F916H、F916L、F916M、F916I、F916A、K918Q、K918R、K918H、K918M、K918L、Q920E、Q920N、Q920S、Q920A、T924S、T924A、R925K、R925H、R925Q、Q926K、Q926E、Q926N、Q926D、K929R、K929H、K929Q、Q933E、Q933H、Q933K、Q933N、R951Q、R951S、S960A、S964A、K968Q、K968H、K968M、K968L、R976K、R976Q、R976H、V982A、V982T、V982L、V982I、Y1013F、Y1013H、G1030A、G1030S、G1030T、G1030V、A1032G、A1032S、A1032T、A1032V、K1085R、K1085Q、K1085H、K1085M、K1085L、M1089L、M1089I、M1089V、M1089T、M1089K、P1090A、P1090G、P1090S、P1090T、P1090V、Q1091D、Q1091S、Q1091E、Q1091H、Q1091K、Q1091N、T1098A、T1098P、T1098S、T1098V、E1099、E1099Q、E1099D、E1099N、E1099H、V1100A、V1100G、V1100T、V1100S、V1100I、V1100L、T1102A、T1102P、T1102S、T1102V、G1103A、G1103P、G1103S、F1105Y、F1105H、F1105L、F1105I、F1105V、F1105W、K1107R、K1107Q、K1107M、E1108Q、E1108D、E1108N、S1109A、S1109T、S1109N、S1109D、K1113R、K1113Q、K1113H、K1113M、K1113L、R1114K、R1114Q、R1114H、N1115D、N1115A、N1115S、S1116A、D1117N、D1117S、D1117A、K1118Q、K1118H、K1118M、K1118L、K1123R、K1123Q、K1123H、K1123M、K1123L、K1123S、K1124R、K1124Q、K1124H、K1124M、K1124L、W1126Y、W1126S、F1134Y、F1134H、F1134L、F1134I、F1134V、F1134W、D1135N、D1135S、D1135A、R1171K、R1171H、R1171Q、R1171E、K1197R、K1197Q、K1197H、K1197M、K1197L、K1211R、K1211Q、K1211H、K1211M、K1211L、S1216A、E1219Q、E1219D、E1219N、E1243Q、E1243D、E1243N、E1243S、E1243A、R1279K、R1279H、R1279Q、R1279E、D1284N、D1284S、D1284A、P1301S、P1301G、H1311Y、H1311S、R1333K、R1333Q、R1333H、K1334R、K1334Q、K1334M、K1334L、R1335K、R1335Q、R1335H、T1337A、T1337S、S1338A、H1349F、H1349Y、H1349Q、H1349E、H1349N、H1349D、H1349S、H1349T、Y1356F、Y1356W、Y1356H、Y1356Q、Y1356E、Y1356N、Y1356D、Y1356S、Y1356T、T1358A、T1358P、T1358S和T1358V。
6.根据权利要求5所述的tsCas9,其中所述至少一个氨基酸改变选自由以下组成的组:S104A、F105H、V107S、P176S、S179A、E223A、N235NGSGAGGSY、E260Q、D261N、T310A、T310G、P316G、P316D、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、R457K、N459S、P475S、W476H、R557K、R653H、Q739S、E910S、L911A、R951Q、K1123S、W1126S和H1311Y;优选地,所述至少一个氨基酸改变选自由以下组成的组:S104A、F105H、V107S、P176S、S179A、E223A、E260Q、D261N、T310A、T310G、P316G、P316D、P411A、P411G、Q413N、Q413A、I414V、I414A、Y430F、Y430V、F432H、F432V、R457K、N459S、P475S、W476H、R557K、R653H、Q739S、E910S、L911A、R951Q、K1123S、W1126S和H1311Y。
7.根据权利要求5-6中任一项所述的tsCas9,其中所述至少一个氨基酸改变包括N235NGSGAGGSY;S104A、F105H和V107S;P176S和S179A;E223A;T310A和P316G;P411A、Q413N和I414V;P411A、Q413N、I414V、R457K和N495S;Y430F和F432H;R457K和N495S;P475S和W476H;R557K;R653H;R951Q;S104A、F105H、V107S、P176S、S179A、E223S、E260Q、D261N、R653H、Q739S和H1311Y;S104A、F105H、V107S、E260Q、D261N、T310A、P316G、Y430F、F432H、Q739S和H1311Y;S104A、F105H、V107S、T310A、P316G、Q739S和R951Q;S104A、F105H、V107S、E260Q、D261N、Y430F、F432H和Q739S;S104A、F105H、V107S、Q739S、R951Q和H1311Y;S104A、F105H、V107S、P411A、Q413N和I414V;S104A、F105H、V107S、P411A、Q413N、I414V、R457K和N459S;T310G和P316D;P411G、Q413A和I414A;Y430V和F432V;E910S和L911A;和K1123SW1126S;优选地,所述至少一个氨基酸改变包括S104A、F105H和V107S;P176S和S179A;E223A;T310A和P316G;P411A、Q413N和I414V;P411A、Q413N、I414V、R457K和N495S;Y430F和F432H;R457K和N495S;P475S和W476H;R557K;R653H;R951Q;S104A、F105H、V107S、P176S、S179A、E223S、E260Q、D261N、R653H、Q739S和H1311Y;S104A、F105H、V107S、E260Q、D261N、T310A、P316G、Y430F、F432H、Q739S和H1311Y;S104A、F105H、V107S、T310A、P316G、Q739S和R951Q;S104A、F105H、V107S、E260Q、D261N、Y430F、F432H和Q739S;S104A、F105H、V107S、Q739S、R951Q和H1311Y;S104A、F105H、V107S、P411A、Q413N和I414V;S104A、F105H、V107S、P411A、Q413N、I414V、R457K和N459S;T310G和P316D;P411G、Q413A和I414A;Y430V和F432V;E910S和L911A;和K1123S W1126S。
8.一种多核苷酸,所述多核苷酸编码根据权利要求1-7中任一项所述的tsCas9。
9.根据权利要求8所述的多核苷酸,所述多核苷酸与SEQ ID NO:1具有至少80%序列同一性。
10.一种核酸构建体,所述核酸构建体包含根据权利要求8-9中任一项所述的多核苷酸。
11.一种表达载体,所述表达载体包含根据权利要求8-9中任一项所述的多核苷酸。
12.一种宿主细胞,所述宿主细胞包含如权利要求1-7中任一项所定义的tsCas9,如权利要求8-9中任一项所定义的多核苷酸,如权利要求10中定义的核酸构建体,和/或如权利要求11中定义的表达载体。
13.根据权利要求12所述的宿主细胞,所述宿主细胞是真核或原核宿主细胞。
14.根据权利要求12-13中的任一项所述的宿主细胞,所述宿主细胞是选自由以下组成的组的微生物宿主细胞:细菌、真菌、酵母和古细菌宿主细胞。
15.根据权利要求12-14中的任一项所述的宿主细胞,所述宿主细胞是选自由以下组成的组的细菌宿主细胞:芽胞杆菌属、埃希氏菌属、乳杆菌属、乳球菌属、链球菌属和链霉菌属细胞;优选地,所述宿主细胞选自由以下组成的组:嗜碱芽孢杆菌枯草杆菌、高地芽孢杆菌、解淀粉芽孢杆菌、植物解淀粉芽孢杆菌亚种、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、甲基营养型芽孢杆菌、短小芽孢杆菌、沙福芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、苏云金芽孢杆菌、大肠杆菌、嗜酸乳杆菌、淀粉乳杆菌、短乳杆菌、副干酪乳杆菌、纤维二糖乳杆菌、卷曲乳杆菌、弯曲乳杆菌、德氏乳杆菌保加利亚亚种、德氏乳杆菌乳酸亚种、发酵乳杆菌、禾口鸡乳杆菌、格氏乳杆菌、瑞士乳杆菌、约氏乳杆菌、植物乳杆菌、罗伊氏乳杆菌、雷曼氏乳酸杆菌、唾液乳杆菌、韩中大乳球菌、福尔摩沙乳球菌、富士山乳球菌、格氏乳球菌、乳酸乳球菌、鱼乳球菌、植物乳球菌、棉子糖乳球菌、台湾乳球菌、似马链球菌、酿脓链球菌、乳房链球菌、马链球菌兽疫亚种、不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌;更优选地,所述宿主细胞是地衣芽孢杆菌。
16.根据权利要求12-15中任一项所述的宿主细胞,所述宿主细胞是选自由以下组成的组的真菌宿主细胞:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、线黑粉菌科、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属和木霉属细胞;优选地,所述丝状真菌宿主细胞选自由以下组成的组:泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌、干拟蜡菌、卡内基拟蜡菌、浅黄拟蜡孔菌、潘诺希塔拟蜡菌、环带拟蜡菌、微红拟蜡菌、虫拟蜡菌、狭边金孢子菌、嗜角质金孢子菌、卢克诺文思金孢子菌、粪状金孢子菌、租金孢子菌、女王杜香金孢子菌、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛革盖菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢菌、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌、射脉菌、刺芹侧耳、土生梭孢壳霉、长域毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、和绿色木霉细胞。
17.根据权利要求12-16中的任一项所述的宿主细胞,所述宿主细胞是选自由以下组成的组的酵母宿主细胞:假丝酵母属、汉逊酵母属、克鲁维酵母菌属、毕赤酵母属、酵母菌属、裂殖酵母属和耶氏酵母属细胞;优选地,所述宿主细胞选自由以下组成的组:乳酸克鲁维酵母、巴斯德毕赤酵母、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母和解脂耶氏酵母细胞。
18.根据权利要求12-17中任一项所述的宿主细胞,其中所述tsCas9是核酸酶无效变体;优选地,所述变体包含对应于SEQ ID NO:2的位置10和位置840的位置中的氨基酸改变;更优选地,所述变体包含天冬氨酸取代丙氨酸,D10A和组氨酸取代丙氨酸,H840A。
19.一种诱导一个或多个目的基因组靶序列表达的方法,所述方法包括以下步骤:
a)提供根据权利要求18所述的宿主细胞,所述宿主细胞进一步包含一个或多个适合的gRNA和一个或多个目的基因组靶序列;
b)在所述tsCas9的解离温度下培养所述宿主细胞,由此所述tsCas9与所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成的复合物解离;以及随后
c)将温度降低到所述tsCas9的限制性温度并培养所述宿主细胞,由此诱导所述一个或多个靶序列的表达。
20.根据权利要求19所述的方法,其中所述解离温度为42-50℃,所述限制性温度为37-42℃。
21.根据权利要求19-20中任一项所述的方法,所述方法包括提供所述宿主细胞之后和步骤(b)之前的以下步骤:在所述tsCas9的所述许可温度下培养所述宿主细胞,由此所述tsCas9、所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成复合物,由此抑制所述一个或多个基因组靶序列的表达。
22.根据权利要求19-21中任一项所述的方法,所述方法包括另外的步骤:
d)将温度升至所述tsCas9的许可温度,其中所述tsCas9、所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成复合物,并培养所述宿主细胞,由此抑制所述一个或多个目的基因组靶序列的表达。
23.根据权利要求21-22中任一项所述的方法,其中所述许可温度为28-34℃。
24.一种抑制一个或多个目的基因组靶序列的方法,所述方法包括以下步骤:
a)提供根据权利要求18所述的宿主细胞,所述宿主细胞进一步包含一个或多个适合的gRNA和一个或多个目的基因组靶序列;
b)在所述tsCas9的限制性温度下培养所述宿主细胞,其中所述一个或多个目的基因组靶序列被表达;以及随后
c)将温度降低到所述tsCas9的许可温度,由此所述tsCas9、所述一个或多个合适的gRNA和所述一个或多个目的基因组靶序列在所述宿主细胞中形成复合物,并由此抑制所述一个或多个基因组靶序列的表达。
25.根据权利要求24所述的方法,其中所述许可温度为28-34℃并且所述限制性温度为37-42℃。
26.根据权利要求24-25中任一项所述的方法,所述方法包括提供所述宿主细胞之后和步骤(b)之前的以下步骤:在所述tsCas9的解离温度下培养所述宿主细胞,以确保在宿主细胞中在所述tsCas9、所述一个或多个gRNA和所述一个或多个目的基因组靶序列之间不形成复合物。
27.根据权利要求24-26中任一项所述的方法,所述方法包括另外的步骤:
d)将温度升高到所述tsCas9的解离温度,由此使所述复合物解离;以及随后
e)将温度降低到所述tsCas9的限制性温度,由此诱导所述一个或多个靶序列的表达。
28.根据权利要求26-27中任一项所述的方法,其中所述解离温度为42-50℃。
29.根据权利要求19-28中任一项所述的方法,其中所述一个或多个目的基因组靶序列包含至少20个核苷酸并进一步包含或侧接针对II类Cas9蛋白的功能性PAM序列;优选地,所述一个或多个基因组靶序列包含在编码多肽的可读框中或包含在启动子区域中。
30.根据权利要求19-29中任一项所述的方法,其中所述一个或多个目的基因组靶序列编码一个或多个选自由以下组成的组的酶:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;优选地,所述一个或多个酶是α-淀粉酶、α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、天冬酰胺酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、绿色荧光蛋白、葡聚糖转移酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、和木聚糖酶。
31.根据权利要求19-30中任一项所述的方法,其中所述宿主细胞是真核或原核细胞;优选地,所述宿主细胞是微生物宿主细胞;甚至更优选地,所述宿主细胞是真菌、细菌或古细菌细胞。
32.根据权利要求19-31中的任一项所述的方法,其中所述宿主细胞是芽胞杆菌属宿主细胞;优选地,所述宿主细胞选自由以下组成的芽孢杆菌属物种的组:嗜碱芽孢杆菌、高地芽孢杆菌、解淀粉芽孢杆菌、植物解淀粉芽孢杆菌亚种、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、甲基营养型芽孢杆菌、短小芽孢杆菌、沙福芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌;更优选地,所述宿主细胞是地衣芽孢杆菌。
33.根据权利要求19-32中任一项所述的方法,其中所述一个或多个gRNA包含第一RNA,所述第一RNA包含与所述一个或多个基因组靶序列至少85%互补并且能够与所述一个或多个基因组靶序列杂交的20个或更多个核苷酸;优选地,所述20个或更多个核苷酸与所述一个或多个基因组靶序列至少90%、95%、97%、98%、99%或甚至100%互补并且能够与所述一个或多个基因组靶序列杂交。
34.根据权利要求1-7中的任一项所述的tsCas9、根据权利要求8-9中的任一项所述的多核苷酸、根据权利要求10所述的核酸构建体、根据权利要求11所述的表达载体、根据权利要求12-18中的任一项所述的宿主细胞、和/或根据权利要求19-33中的任一项所述的方法在药物或化妆品中的用途。
35.根据权利要求1-7中的任一项所述的tsCas9、根据权利要求8-9中的任一项所述的多核苷酸、根据权利要求10所述的核酸构建体、根据权利要求11所述的表达载体、根据权利要求12-18中的任一项所述的宿主细胞、和/或根据权利要求19-33中的任一项所述的方法在医学上或生物技术研究或生产中的用途。
36.根据权利要求1-7中的任一项所述的tsCas9、根据权利要求8-9中的任一项所述的多核苷酸、根据权利要求10所述的核酸构建体、根据权利要求11所述的表达载体、根据权利要求12-18中的任一项所述的宿主细胞、和/或根据权利要求19-33中的任一项所述的方法在基因组编辑、基因表达的调节或CRISPR抑制中的用途。
37.根据权利要求1-7中的任一项所述的tsCas9、根据权利要求8-9中的任一项所述的多核苷酸、根据权利要求10所述的核酸构建体、根据权利要求11所述的表达载体、根据权利要求12-18中的任一项所述的宿主细胞、和/或根据权利要求19-33中的任一项所述的方法在酶研究、开发和/或生产中的用途。
CN201880070805.XA 2017-11-10 2018-11-07 温度敏感性cas9蛋白 Pending CN111511908A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17201135 2017-11-10
EP17201135.5 2017-11-10
PCT/EP2018/080508 WO2019092042A1 (en) 2017-11-10 2018-11-07 Temperature-sensitive cas9 protein

Publications (1)

Publication Number Publication Date
CN111511908A true CN111511908A (zh) 2020-08-07

Family

ID=60421566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880070805.XA Pending CN111511908A (zh) 2017-11-10 2018-11-07 温度敏感性cas9蛋白

Country Status (4)

Country Link
US (2) US20200318086A1 (zh)
EP (1) EP3707252A1 (zh)
CN (1) CN111511908A (zh)
WO (1) WO2019092042A1 (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3497214B1 (en) 2016-08-09 2023-06-28 President and Fellows of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3615672A1 (en) 2017-04-28 2020-03-04 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
JP2020524497A (ja) 2017-06-09 2020-08-20 エディタス・メディシン,インコーポレイテッド 操作されたcas9ヌクレアーゼ
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US20230021641A1 (en) * 2018-08-23 2023-01-26 The Broad Institute, Inc. Cas9 variants having non-canonical pam specificities and uses thereof
US20220154157A1 (en) * 2019-02-06 2022-05-19 Emendobio Inc. New engineered high fidelity cas9
AU2020242032A1 (en) 2019-03-19 2021-10-07 Massachusetts Institute Of Technology Methods and compositions for editing nucleotide sequences
CN110331104B (zh) * 2019-07-05 2020-12-18 四川大学 一种植物乳杆菌cv10d1及其应用
US20210261932A1 (en) * 2020-01-24 2021-08-26 The General Hospital Corporation Crispr-cas enzymes with enhanced on-target activity
US20210284978A1 (en) * 2020-01-24 2021-09-16 The General Hospital Corporation Unconstrained Genome Targeting with near-PAMless Engineered CRISPR-Cas9 Variants
EP4103705A4 (en) * 2020-02-14 2024-02-28 Ohio State Innovation Foundation NUCLEOBASE EDITORS AND METHODS OF USE THEREOF
KR20230019843A (ko) 2020-05-08 2023-02-09 더 브로드 인스티튜트, 인코퍼레이티드 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
CN112626049B (zh) * 2020-12-14 2022-04-01 安徽省农业科学院水稻研究所 一种在水稻基因打靶中识别特异位点的SpCas9-NRRH突变体及其应用
CA3227004A1 (en) * 2021-08-06 2023-02-09 The Broad Institute, Inc. Improved prime editors and methods of use

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013176772A1 (en) * 2012-05-25 2013-11-28 The Regents Of The University Of California Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5989870A (en) 1986-04-30 1999-11-23 Rohm Enzyme Finland Oy Method for cloning active promoters
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
DK639689D0 (da) 1989-12-18 1989-12-18 Novo Nordisk As Indfoering af dna i celler
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
WO1993010249A1 (en) 1991-11-14 1993-05-27 Novo Nordisk A/S A bacillus promoter derived from a variant of a bacillus licheniformis x-amylase promoter
DK153992D0 (da) 1992-12-22 1992-12-22 Novo Nordisk As Metode
FR2704860B1 (fr) 1993-05-05 1995-07-13 Pasteur Institut Sequences de nucleotides du locus cryiiia pour le controle de l'expression de sequences d'adn dans un hote cellulaire.
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
CN1192108C (zh) 1994-06-03 2005-03-09 诺沃奇梅兹生物技术有限公司 纯化的毁丝霉属漆酶及编码该酶的核酸
CN1151762A (zh) 1994-06-30 1997-06-11 诺沃诺尔迪斯克生物技术有限公司 非毒性、非产毒性、非致病性镰孢属表达系统及所用启动子和终止子
AU4431196A (en) 1995-01-23 1996-08-14 Novo Nordisk A/S Dna integration by transposition
WO1996029418A1 (en) 1995-03-22 1996-09-26 Novo Nordisk A/S Introduction of dna into bacillus strains by conjugation
US6100063A (en) 1998-02-12 2000-08-08 Novo Nordisk A/S Procaryotic cell comprising at least two copies of a gene
US5955310A (en) 1998-02-26 1999-09-21 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide in a bacillus cell
DE69932345T2 (de) 1998-10-26 2007-07-19 Novozymes A/S Erstellung und durchmusterung von interessierenden dna-banken in zellen von filamentösen pilzen
EP2278016B1 (en) 1999-03-22 2012-09-26 Novozymes Inc. Promoter sequences derived from Fusarium Venenatum and uses thereof
ATE375388T1 (de) 2001-07-27 2007-10-15 Us Gov Health & Human Serv Systeme zur stellengerichteten in-vivo-mutagenese mit oligonukleotiden
EP1687433A1 (en) 2003-10-31 2006-08-09 Novozymes A/S Method for stable gene-amplification in a bacterial host cell
EP1805296B1 (en) 2004-10-22 2009-09-16 Novozymes A/S Stable genomic integration of multiple polynucleotide copies
DK2029732T3 (da) 2006-05-31 2010-02-01 Novozymes As Chloramphenicolresistensselektion i Bacillus licheniformis
ATE533838T1 (de) 2006-11-29 2011-12-15 Novozymes Inc Verfahren zur verbesserten einführung von dna in bakterienzellen
CN102224245B (zh) 2008-09-30 2016-01-13 诺维信股份有限公司 在丝状真菌细胞中使用阳性和阴性选择性基因的方法
CN104619721A (zh) 2012-09-27 2015-05-13 诺维信股份有限公司 具有改进的转化效率的细菌突变体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013176772A1 (en) * 2012-05-25 2013-11-28 The Regents Of The University Of California Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BERES,S.B.等: "hypothetical cytosolic protein [Streptococcus pyogenes MGAS10270]" *
FLORIAN RICHTER 等: "Engineering of temperature- and light-switchable Cas9 variants" *
LEI S. QI 等: "Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression" *

Also Published As

Publication number Publication date
US20240101988A1 (en) 2024-03-28
EP3707252A1 (en) 2020-09-16
WO2019092042A1 (en) 2019-05-16
US20200318086A1 (en) 2020-10-08

Similar Documents

Publication Publication Date Title
CN111511908A (zh) 温度敏感性cas9蛋白
KR102375732B1 (ko) 바실러스 리체니포르미스에서 단백질 생산을 증가시키기 위한 조성물 및 방법
US20190185847A1 (en) Improving a Microorganism by CRISPR-Inhibition
CN113939588A (zh) 温度敏感性的rna指导的内切核酸酶
DK2689015T3 (en) A process for the production of secreted polypeptides
US20170114091A1 (en) Resolubilization of protein crystals at low ph
EP2089524A1 (en) Dnase expression recombinant host cells
WO2016180928A1 (en) Bacillus licheniformis host cell with deleted lantibiotic gene(s)
AU2003222165A1 (en) Methods for producing secreted polypeptides having l-asparaginase activity
CN113366113A (zh) 同源折叠酶共表达
AU2019382494A1 (en) Polypeptides having lipase activity and use thereof for wheat separation
CN111630165A (zh) 通过抑制条件性必需基因进行反向选择
US20220267783A1 (en) Filamentous fungal expression system
CN116897160A (zh) 在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法和组合物
US20220025422A1 (en) Improved Filamentous Fungal Host Cells
WO2020260061A1 (en) Counter-selection by inhibition of conditionally essential genes
WO2020173817A1 (en) Calcite binding proteins
US20220170003A1 (en) Means And Methods For Improving Protease Expression
JP6085190B2 (ja) 変異微生物及びそれを用いた有用物質の生産方法
US20110306139A1 (en) Mutant Cells Suitable For Recombinant Polypeptide Production

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination