CN110997908A - 工程化的cas9核酸酶 - Google Patents

工程化的cas9核酸酶 Download PDF

Info

Publication number
CN110997908A
CN110997908A CN201880049977.9A CN201880049977A CN110997908A CN 110997908 A CN110997908 A CN 110997908A CN 201880049977 A CN201880049977 A CN 201880049977A CN 110997908 A CN110997908 A CN 110997908A
Authority
CN
China
Prior art keywords
polypeptide
target
domain
fusion protein
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880049977.9A
Other languages
English (en)
Inventor
B·E·斯坦伯格
D·切尔奇内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Editas Medicine Inc
Original Assignee
Editas Medicine Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Editas Medicine Inc filed Critical Editas Medicine Inc
Publication of CN110997908A publication Critical patent/CN110997908A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Abstract

本披露涉及Cas9核酸酶变体以及产生和使用此类变体的方法。

Description

工程化的CAS9核酸酶
相关申请的交叉引用
本申请要求2017年6月9日提交的美国临时申请号62/517,811和2018年5月1日提交的美国临时申请号62/665,388的优先权,两者通过援引以其全文并入本文。
序列表
本说明书参考了序列表(2018年6月8日以名称“2011271-0077_SL.txt”的.txt文件电子提交)。所述.txt文件生成于2018年6月4日并且大小为41,513个字节。将序列表的全部内容通过援引并入本文。
技术领域
本披露涉及用于编辑靶核酸序列或调节靶核酸序列的表达的CRISPR/Cas相关方法和组分。更具体地,本披露涉及具有改变和改善的靶特异性的工程化Cas9核酸酶。
背景技术
CRISPR(成簇规律间隔短回文重复序列)在细菌和古核生物中作为适应性免疫系统进化,以防御病毒攻击。在暴露于病毒后,病毒DNA的短区段被整合进CRISPR基因座中。RNA是从包括病毒序列的CRISPR基因座的一部分转录。该RNA含有与病毒基因组互补的序列,介导将RNA指导的核酸酶蛋白如Cas9或Cpf1靶向病毒基因组中的靶序列。RNA指导的核酸酶反过来切割并因此使病毒靶标沉默。
CRISPR系统已经过改造,用于在真核细胞中的基因组编辑。这些系统通常包括蛋白质组分(RNA指导的核酸酶)和核酸组分(通常称为指导RNA或“gRNA”)。这两种组分形成复合物,所述复合物与由系统的两种组分识别或互补的特定靶DNA序列相互作用,并任选地编辑或改变靶序列,例如通过位点特异性DNA切割进行。
诸如此类的核酸酶作为用于治疗遗传性疾病的工具的价值已得到广泛认可。例如,美国食品药品监督管理局(FDA)于2016年11月15日举行了科学委员会会议,讨论了此类系统的使用及其产生的潜在监管考虑。在这次会议上,FDA指明,虽然可定制Cas9/指导RNA(gRNA)核糖核蛋白(RNP)复合物以在目的基因座处产生精确编辑,但这些复合物也可与其他“脱靶”基因座相互作用并在其他“脱靶”基因座处切割。脱靶切割(“脱靶”)的可能性就使用这些核酸酶的治疗方法的批准而言,又至少引起了潜在的监管考虑。
发明内容
本披露通过部分地提供工程化的RNA指导的核酸酶来解决潜在的监管考虑,所述工程化的RNA指导的核酸酶例如相对于野生型核酸酶表现出就靶向DNA序列而言改善的特异性。改善的特异性可以是,例如,相对于野生型RNA指导的核酸酶和/或另一种变异核酸酶,(i)DNA的增加的中靶结合、切割和/或编辑和/或(ii)DNA的降低的脱靶结合、切割和/或编辑。
一方面,本披露提供了分离的酿脓链球菌(Staphylococcus pyogenes)Cas9(SPCas9)多肽,其相对于野生型SPCas9在以下位置中的一个或多个处包含氨基酸取代:D23、D1251、Y128、T67、N497、R661、Q695、和/或Q926。在一些实施例中,分离的SPCas9多肽包含与SEQ ID NO:13的氨基酸序列具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列,其中所述多肽在SEQ ID NO:13的以下位置中的一个或多个处包含氨基酸取代:D23、D1251、Y128、T67、N497、R661、Q695、和/或Q926。
在一些实施例中,分离的多肽包含以下氨基酸取代中的一个或多个:D23A、Y128V、T67L、N497A、D1251G、R661A、Q695A、和/或Q926A。在一些实施例中,分离的多肽包含以下氨基酸取代:D23A/Y128V/D1251G/T67L。
在另一方面,本披露提供了融合蛋白,其包含与异源功能域以及任选的间插接头融合的本文所述的分离的多肽,其中所述接头不干扰融合蛋白的活性。在一些实施例中,异源功能域选自由以下组成的组:VP64、NF-κB p65、Krueppel相关框(KRAB)域、ERF阻遏域(ERD)、mSin3A相互作用域(SID)、异染色质蛋白1(HP1)、DNA甲基转移酶(DNMT)、TET蛋白、组蛋白乙酰转移酶(HAT)、组蛋白脱乙酰酶(HDAC)、组蛋白甲基转移酶(HMT)、或组蛋白脱甲基酶(HDM)、MS2、Csy4、λN蛋白和FokI。
在另一方面,本披露特征在于基因组编辑系统,其包含本文所述的分离的多肽。
在另一方面,本披露特征在于编码本文所述的分离的多肽的核酸。在另一方面,本披露特征在于包含核酸的载体。
在另一方面,本披露特征在于组合物,其包含本文所述的分离的多肽、本文所述的基因组编辑系统、本文所述的核酸和/或本文所述的载体、以及任选地药学上可接受的运载体。
在另一方面,本披露特征在于改变细胞的方法,其包括使细胞与这种组合物接触。在另一方面,本披露特征在于治疗患者的方法,其包括向患者施用这种组合物。
在另一方面,本披露特征在于多肽,其包含与SEQ ID NO:13至少约80%相同(例如,至少约85%、90%、92%、94%、95%、96%、97%、98%、或99%相同),并在SEQ ID NO:13的位置D23、T67、Y128和D1251中的一个或多个处具有氨基酸取代的氨基酸序列。在一些实施例中,多肽在D23处包含氨基酸取代。在一些实施例中,多肽在D23处包含氨基酸取代,并且在T67、Y128或D1251处包含至少一个氨基酸取代。在一些实施例中,多肽在D23处包含氨基酸取代,并且在T67、Y128或D1251处包含至少两个取代。在一些实施例中,多肽在T67处包含氨基酸取代。在一些实施例中,多肽在T67处包含氨基酸取代,并且在D23、Y128或D1251处包含至少一个氨基酸取代。在一些实施例中,多肽在T67处包含氨基酸取代,并且在D23、Y128或D1251处包含至少两个取代。在一些实施例中,多肽在Y128处包含氨基酸取代。在一些实施例中,多肽在Y128处包含氨基酸取代,并且在D23、T67或D1251处包含至少一个氨基酸取代。在一些实施例中,多肽在Y128处包含氨基酸取代,并且在D23、T67或D1251处包含至少两个取代。在一些实施例中,多肽在D1251处包含氨基酸取代。在一些实施例中,多肽在D1251处包含取代,并且在D23、T67或Y128处包含至少一个氨基酸取代。在一些实施例中,多肽在D1251处包含氨基酸取代,并且在D23、T67或Y128处包含至少两个取代。在一些实施例中,多肽在D23、T67、Y128和D1251处包含氨基酸取代。在一些实施例中,多肽还包含至少一个另外的本文所述的氨基酸取代。
在一些实施例中,当多肽与靶双链DNA(dsDNA)接触时,脱靶编辑率(rate of off-target editing)低于观察到的野生型SPCas9对靶标的脱靶编辑率。在一些实施例中,多肽的脱靶编辑率比野生型SPCas9的低约5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%或95%。在一些实施例中,脱靶编辑率是通过评估脱靶位点处的插入缺失(indel)的水平(例如,小数或百分比)来测量的。
在另一方面,本披露特征在于融合蛋白,其包含多肽和核定位序列、细胞穿透肽序列和/或亲和标签中的一个或多个。在另一方面,本披露特征在于融合蛋白,其包含与异源功能域以及任选的间插接头融合的融合多肽,其中所述接头不干扰融合蛋白的活性。
在一些实施例中,异源功能域是转录反式激活域。在一些实施例中,转录反式激活域来自VP64或NFk-B p65。在一些实施例中,异源功能域是转录沉默子或转录抑制域。在一些实施例中,转录抑制域是Krueppel相关盒(KRAB)域、ERF阻遏域(ERD)或mSin3A相互作用域(SID)。在一些实施例中,转录沉默子是异染色质蛋白1(HP1)。在一些实施例中,异源功能域是修饰DNA的甲基化状态的酶(例如,DNA甲基转移酶(DNMT)或TET蛋白)。在一些实施例中,TET蛋白是TETI。在一些实施例中,异源功能域是修饰组蛋白亚基的酶(例如,组蛋白乙酰转移酶(HAT)、组蛋白脱乙酰酶(HDAC)、组蛋白甲基转移酶(HMT)或组蛋白脱甲基酶)。在一些实施例中,异源功能域是生物系链(例如,MS2、Csy4或λN蛋白)。在一些实施例中,异源功能域是Fokl。
在另一方面,本披露特征在于编码本文所述多肽的分离的核酸。在另一方面,本披露特征在于包含此类分离的核酸的载体。在另一方面,本披露特征在于包含此类载体的宿主细胞。
在另一方面,本披露特征在于多肽,其包含与SEQ ID NO:13至少约80%相同(例如,至少约85%、90%、92%、94%、95%、96%、97%、98%、或99%相同)的氨基酸序列,并包含以下氨基酸取代中的一个或多个:D23A、T67L、Y128V和D1251G。在一些实施例中,多肽包含D23A;和/或多肽包含D23A和T67L、Y128V和D1251G中的至少一个;和/或多肽包含D23A和T67L、Y128V和D1251G中的至少两个;和/或多肽包含T67L;和/或多肽包含T67L和D23A、Y128V和D1251G中的至少一个;和/或多肽包含T67L和D23A、Y128V和D1251G中的至少两个;和/或多肽包含Y128V;和/或多肽包含Y128V和D23A、T67L和D1251G中的至少一个;和/或多肽包含Y128V和D23A、T67L和D1251G中的至少两个;和/或多肽包含D1251G;和/或多肽包含D1251G和D23A、T67L和Y128V中的至少一个;和/或多肽包含D1251G和D23A、T67L和Y128V中的至少两个;和/或多肽包含D23A、T67L、Y128V和D1251G。
在一些实施例中,多肽与靶双链DNA(dsDNA)靶标接触时,脱靶编辑率低于观察到的野生型SPCas9对靶标的脱靶编辑率。在一些实施例中,多肽的脱靶编辑率比野生型SPCas9的低约5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%或95%。在一些实施例中,脱靶编辑率是通过评估脱靶位点处的插入缺失的水平(例如,小数或百分比)来测量的。
在另一方面,本披露特征在于融合蛋白,其包含多肽和核定位序列、细胞穿透肽序列和/或亲和标签中的一个或多个。
在另一方面,本披露特征在于融合蛋白,其包含与异源功能域以及任选的间插接头融合的融合多肽,其中所述接头不干扰融合蛋白的活性。在一些实施例中,异源功能域是转录反式激活域(例如,来自VP64或NFk-B p65的反式激活域)。在一些实施例中,异源功能域是转录沉默子或转录抑制域(例如,Krueppel相关盒(KRAB)域、ERF阻遏域(ERD)或mSin3A相互作用域(SID))。在一些实施例中,转录沉默子是异染色质蛋白1(HP1)。在一些实施例中,异源功能域是修饰DNA的甲基化状态的酶(例如,DNA甲基转移酶(DNMT)或TET蛋白)。在一些实施例中,TET蛋白是TETI。在一些实施例中,异源功能域是修饰组蛋白亚基的酶(例如,组蛋白乙酰转移酶(HAT)、组蛋白脱乙酰酶(HDAC)、组蛋白甲基转移酶(HMT)或组蛋白脱甲基酶)。在一些实施例中,异源功能域是生物系链(例如,MS2、Csy4或λN蛋白)。在一些实施例中,异源功能域是Fokl。
在另一方面,本披露特征在于编码此类多肽的分离的核酸。在另一方面,本披露特征在于包含此类分离的核酸的载体。在另一方面,本披露特征在于包含此类载体的宿主细胞。
在另一方面,本披露特征在于对细胞群进行基因工程的方法,所述方法包括在所述细胞中表达本披露的多肽(例如,本文所述的变体核酸酶)以及指导核酸或使所述细胞与所述多肽以及指导核酸接触,从而改变所述细胞中至少多个的基因组,所述指导核酸具有与所述细胞的基因组的靶核酸上的靶序列互补的区域。
在一些实施例中,多肽的脱靶编辑率低于观察到的野生型SPCas9对靶序列的脱靶编辑率。在一些实施例中,多肽的脱靶编辑率比野生型SPCas9的低约5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%或95%。在一些实施例中,脱靶编辑率是通过评估脱靶位点处的插入缺失的水平(例如,小数或百分比)来测量的。
在一些实施例中,多肽和指导核酸以核糖核酸蛋白(RNP)施用。在一些实施例中,RNP以1x 10-4μM至1μM RNP的剂量施用。
在另一方面,本披露特征在于编辑双链DNA(dsDNA)分子的群体的方法,所述方法包括使dsDNA分子与本披露的多肽(例如,本文所述的变体核酸酶)以及指导核酸和指导核酸接触,从而对多个所述dsDNA分子进行编辑,所述指导核酸具有与所述dsDNA分子的靶序列互补的区域。
在一些实施例中,多肽的脱靶编辑率低于观察到的野生型SPCas9对靶序列的脱靶编辑率。在一些实施例中,多肽的脱靶编辑率比野生型SPCas9的低约5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%或95%。在一些实施例中,脱靶编辑率是通过评估脱靶位点处的插入缺失的水平(例如,小数或百分比)来测量的。
在一些实施例中,多肽和指导核酸以核糖核酸蛋白(RNP)施用。在一些实施例中,RNP以1x 10-4μM至1μM RNP的剂量施用。
附图说明
图1描述了如实例1所述获得的高选择的Cas9突变体的体外裂解物切割测定的结果。突变体表现出仅在CORD6靶标上切割,而野生型酶有效地裂解两个靶标(即CORD6靶标和野生型靶标)。对应于切割产物的条带由三角形表示。
图2显示了一个示意图,概述了针对显示已知脱靶位点处活性的核酸酶进行选择的进化策略。在每个循环中,通过诱变方法生成文库,然后对中靶切割进行一轮阳性选择,之后针对包含不同脱靶位点的合并的噬菌体进行一轮阴性选择。
图3描述了示例性Cas9文库质粒和pSelect靶噬菌粒。
图4描述了使用靶向和非靶向Cas9以及tse2作为阳性选择剂进行阳性选择的示例性结果。
图5描述了使用野生型Cas9和具有tse2作为阳性选择剂的突变体Cas9的文库进行阳性选择的示例性结果。
图6描述了用氯霉素(“Cm”)作为阴性选择剂,使用野生型Cas9和突变体Cas9的文库的阴性选择的示例性结果。
图7描绘了野生型Cas的阳性和阴性选择的连续轮次以进化选择性Cas9突变体的示例性结果。
图8A和8B描述了使用中靶序列底物(图8A)和在四个位置与中靶底物不同的脱靶底物(图8B)的生化切割测定的结果。
图9A和9B描述了体内切割测定的结果,其中在用增加剂量的Cas9/指导RNA核糖核蛋白复合物(RNP)浓度处理的T细胞中评估中靶基因组序列(图9A)和已知脱靶基因组序列(图9B)的切割。
图10描述了在单一RNP浓度下在图9A和9B中描绘的T细胞实验中的中靶切割与脱靶切割的比率。
图11描述了通过密码子位置并根据氨基酸取代,酿脓链球菌Cas9多肽中突变的频率。
图12描绘了体外编辑测定的结果,其中在用增加剂量的野生型酿脓链球菌Cas9或变体Cas9/指导RNA核糖核蛋白复合物(RNP)处理的人T细胞中评估中靶基因组序列和已知的脱靶基因组序列的切割。
图13描述了体外编辑测定的结果,其中在用包含野生型酿脓链球菌Cas9(WTSPCas9)或三种不同变体Cas9蛋白之一的RNP处理的人T细胞中评估了中靶基因组序列的切割。
图14A-14C描绘了体外编辑测定的结果,其中在用增加剂量的包含野生型或变体Cas9蛋白的RNP处理的人T细胞中评估了三个中靶基因组序列的切割。
图15A和15B描绘了体外编辑测定的结果,其中在用增加剂量的野生型酿脓链球菌Cas9(“SpCas9”)或三种不同变体Cas9之一/指导RNA核糖核蛋白复合物(RNP)处理的人T细胞中评估中靶基因组序列(图15A)和已知的脱靶基因组序列(图15B)的切割。
图16显示了一个示意图,概述了针对显示已知脱靶位点处活性的核酸酶进行选择的进化策略。通过诱变生成Cas9突变体的噬菌粒文库,然后对中靶切割进行一轮阳性选择,之后对脱靶切割进行一轮阴性选择。
图17显示了酿脓链球菌和脑膜炎奈瑟氏球菌Cas9序列的比对。
图18A和18B描述了野生型Cas9和两种Cas9变体的脱靶切割。
具体实施方式
定义
在整个说明书中,采用了以下段落中定义的几个术语。在本说明书的正文中还可以找到其他定义。
如本文所用,在本文中关于数值使用的术语“约”和“大约”包括在任一方向上落在(大于或小于)所述数值的20%、10%、5%或1%范围内的数值,除非另有说明或从上下文中明显看出为其他情况(这种数值将超过可能值的100%的情况除外)。
如本文所用,术语“切割(cleavage)”是指DNA分子的共价主链的断裂。切割可通过多种方法引发,包括但不限于磷酸二酯键的酶促水解或化学水解。单链切割和双链切割都是可能的,并且由于两个独立的单链切割事件的结果,可能发生双链切割。DNA切割可导致产生平末端或粘性末端。
如本文所用,“保守取代”是指在以下组内的氨基酸之中进行的氨基酸的取代:i)蛋氨酸、异亮氨酸、亮氨酸、缬氨酸,ii)苯丙氨酸、酪氨酸、色氨酸,iii)赖氨酸、精氨酸、组氨酸,iv)丙氨酸、甘氨酸,v)丝氨酸、苏氨酸,vi)谷氨酰胺、天冬酰胺和vii)谷氨酸、天冬氨酸。在一些实施例中,保守氨基酸取代是指不改变在其中进行氨基酸取代的蛋白质的相对电荷或大小特征的氨基酸取代。
如本文所用,“融合蛋白”是指通过两个或更多个最初分离的蛋白或其部分的连接而产生的蛋白。在一些实施例中,接头或间隔子将存在于每种蛋白质之间。.
如本文所用,关于多肽域的术语“异源的”是指多肽域并非天然地一起存在(例如,在同一多肽中)的事实。例如,在人工产生的融合蛋白中,来自一个多肽的多肽域可以与来自不同多肽的多肽域融合。这两个多肽域相对于彼此而言被认为是“异源的”,因为它们并非天然地一起存在。
如本文所用,术语“宿主细胞”是根据本发明操纵的细胞,例如,将核酸引入其中的细胞。“转化的宿主细胞”是已经经历转化以使其吸收了外源物质,例如外源遗传物质,例如外源核酸的细胞。
如本文所用,术语“同一性”是指聚合物分子之间,例如核酸分子(例如DNA分子和/或RNA分子)之间和/或多肽分子之间的总体相关性。在一些实施例中,如果聚合物分子的序列为至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%相同,则认为它们彼此“基本上相同”。例如,两个核酸或多肽序列的同一性百分比计算可通过出于最佳比较目的比对两个序列来进行(例如,对于最佳比对,可以在第一和第二序列中的一个或两个中引入缺口;而出于比较目的,可以忽略不相同的序列)。在某些实施例中,为了比较目的而比对的序列的长度是参考序列长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或基本上100%。然后比较在相应位置的核苷酸。序列的比较和两个序列之间同一性百分比的确定可以使用数学算法来完成。如本领域众所周知的,可以使用多种算法中的任何一种来比较氨基酸或核酸序列,包括可在商业计算机程序中获得的那些算法,例如用于核苷酸序列的BLASTN和用于氨基酸序列的BLASTP、有缺口的BLAST和PSI-BLAST。示例性的此类程序描述于以下中:Altschul等人,Basic local alignment search tool[基本局部比对搜索工具],J.Mol.Biol.[分子生物学杂志],215(3):403-410,1990;Altschul等人,Methods inEnzymology[酶学方法];Altschul等人,Nucleic Acids Res.[核酸研究]25:3389-3402,1997;Baxevanis等人,Bioinformatics:A Practical Guide to the Analysis of Genesand Proteins[生物信息学:基因和蛋白质分析实用指南],威利出版社(Wiley),1998;和Misener等人,(编辑),Bioinformatics Methods and Protocols(Methods in MolecularBiology,Vol.132),[生物信息学方法和方案(分子生物学方法第132卷)]瑚玛娜出版社(Humana Press),1999。
如本文在多核苷酸的上下文中所使用的,术语“文库”是指两个或更多个不同的多核苷酸的群体。在一些实施例中,文库包含至少两个包含编码核酸酶的不同序列的多核苷酸和/或至少两个包含编码指导RNA的不同序列的多核苷酸。在一些实施例中,文库包括至少101、至少102、至少103、至少104、至少105、至少106、至少107、至少108、至少109、至少1010、至少1011、至少1012、至少1013、至少1014、或至少1015个不同的多核苷酸。在一些实施例中,文库的成员可以包含随机序列,例如完全或部分随机序列。在一些实施例中,文库包含彼此不相关的多核苷酸,例如包含完全随机序列的核酸。在其他实施例中,文库的至少一些成员可以是相关的,例如,它们可以是特定序列的变体或衍生物。
如本文所用,术语“可操作地连接”是指并置,其中所描述的组分处于允许它们以其预期方式发挥功能的关系中。与功能元件“可操作地连接”的调节元件以这样的方式相关联:在与调节元件相容的条件下实现功能元件的表达和/或活性。在一些实施例中,“可操作地连接”的调节元件与目的编码元件是相连的(例如,共价连接的);在一些实施例中,调节元件反式作用于目的功能元件或以其他方式起作用。
如本文所用,术语“核酸酶”是指能够切割核酸的核苷酸亚基之间的磷酸二酯键的多肽;术语“核酸内切酶”是指能够切割多核苷酸链内的磷酸二酯键的多肽。
如本文所用,术语“核酸”、“核酸分子”或“多核苷酸”在本文可互换使用。它们是指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸的聚合物,并且除非另有说明,否则包括能以与天然存在的核苷酸相似的方式起作用的天然核苷酸的已知类似物。所述术语涵盖具有合成骨架的核酸样结构,以及扩增产物。DNA和RNA两者都是多核苷酸。聚合物可包括天然核苷(即腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷),核苷类似物(例如2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、C5-丙炔基胞苷、C5-丙炔基尿苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-甲基胞嘧啶、7-脱氮杂腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、O(6)-甲基鸟嘌呤和2-硫代胞苷),化学修饰的碱基,生物修饰的碱基(例如甲基化的碱基),插层的碱基,修饰的糖(例如2’-氟核糖、核糖、2’-脱氧核糖、阿拉伯糖和己糖)或经修饰的磷酸基团(例如,硫代磷酸和5’-N-亚磷酰胺键)。
如本文所用,术语“寡核苷酸”是指一串核苷酸或其类似物。寡核苷酸可以通过许多方法获得,包括例如化学合成、限制酶消化或PCR。如本领域技术人员将理解的,寡核苷酸的长度(即,核苷酸的数目)可以广泛地变化,这通常取决于寡核苷酸的预期功能或用途。在整个说明书中,每当寡核苷酸由字母序列表示(选自四个碱基字母:A、C、G和T,分别代表腺苷、胞苷、鸟苷和胸苷)时,核苷酸从左到右均以5’到3’的顺序显示。在某些实施例中,寡核苷酸的序列包括一个或多个本文所述的简并残基。
如本文所用,术语“脱靶”是指RNA指导的核酸酶对DNA的非预料或非预期区域的结合、切割和/或编辑。在一些实施例中,当DNA区域与打算或预期结合、切割和/或编辑的DNA区域相差1、2、3、4、5、6、7或更多个核苷酸时,其是脱靶区域。
如本文所用,术语“中靶”是指RNA指导的核酸酶对DNA的预料或预期区域的结合、切割和/或编辑。
如本文所用,术语“多肽”通常具有其本领域公认的氨基酸聚合物的含义。此术语也用于指多肽的特定功能类别,例如像核酸酶、抗体等。
如本文所用,术语“调节元件”是指控制或影响基因表达的一个或多个方面的DNA序列。在一些实施例中,调节元件是或包括启动子、增强子、沉默子和/或终止信号。在一些实施例中,调节元件控制或影响诱导型表达。
如本文所用,术语“靶位点”是指限定结合分子将结合的核酸的一部分的核酸序列,条件是存在足以结合的条件。在一些实施例中,靶位点是本文所述的核酸酶与之结合和/或被这种核酸酶切割的核酸序列。在一些实施例中,靶位点是本文所述的指导RNA与之结合的核酸序列。靶位点可以是单链或双链的。在二聚化的核酸酶(例如,包含Fokl DNA切割域的核酸酶)的背景下,靶位点通常包含左半位点(与核酸酶的一个单体结合)、右半位点(与核酸酶的第二个单体结合)和在其中进行切割的两个半位点之间的间隔序列。在一些实施例中,左半位点和/或右半位点长度在10-18个核苷酸之间。在一些实施例中,两个半位点中的一个或两个较短或较长。在一些实施例中,左半位点和右半位点包含不同的核酸序列。在锌指核酸酶的背景下,在一些实施例中,靶位点可包含两个半位点,每个半位点的长度为6-18bp,侧翼为4-8bp长的未指定的间隔区。在TALEN的情况下,在一些实施例中,靶位点可包括两个半位点位点,每个半位点位点的长度为10-23bp,侧翼为10-30bp长的未指定的间隔区。在RNA指导的(例如,RNA可编程的)核酸酶的背景下,靶位点通常包含与RNA可编程的核酸酶的指导RNA互补的核苷酸序列,以及邻近于指导RNA互补序列的3’末端或5’末端处的原型间隔子邻近基序(PAM)。对于RNA指导的核酸酶Cas9,在一些实施例中,靶位点可以是16-24个碱基对加上3-6个碱基对的PAM(例如,NNN,其中N代表任何核苷酸)。RNA指导的核酸酶、例如Cas9的示例性靶位点是本领域技术人员已知的、并且包括但不限于NNG、NGN、NAG、NGA、NGG、NGAG和NGCG,其中N代表任何核苷酸。另外,来自不同物种(例如嗜热链球菌而不是酿脓链球菌)的Cas9核酸酶识别包含序列NGGNG的PAM。已知另外的PAM序列,包括但不限于NNAGAAW和NAAR(参见,例如,Esvelt和Wang,Molecular Systems Biology[分子系统生物学],9:641(2013),其全部内容通过援引并入本文)。例如,RNA指导的核酸酶例如像Cas9的靶位点可以包含[Nz]-[PAM]结构,其中每个N独立地是任何核苷酸,且z是1到50之间的整数。在一些实施例中,z是至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少25、至少30、至少35、至少40、至少45、或至少50。在一些实施例中,z是5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、或50。在一些实施例中,Z是20。
如本文所用,术语“变体”是指这样的实体,其与参考实体(例如,野生型序列)显示出显著的结构同一性,但是在一个或多个化学部分的存在或水平下与参考实体相比在结构上不同。在许多实施例中,变体在功能上也与其参考实体不同。通常,特定实体是否被恰当地视为参考实体的“变体”是基于其与参考实体的结构同一性程度。如本领域技术人员将理解的,任何生物学或化学参考实体都具有某些特征性结构元件。根据定义,变体是共有一个或多个此类特征性结构元件的独特化学实体。仅举几个实例,多肽可具有特征性序列元件,所述特征性序列元件包含在线性或三维空间中相对于彼此具有指定位置和/或有助于特定生物学功能的多个氨基酸;核酸可具有特征性序列元件,所述特征性序列元件包含在线性或三维空间中相对于另一个具有指定位置的多个核苷酸残基。例如,由于氨基酸序列的一个或多个差异和/或共价附接于多肽主链的化学部分(例如,碳水化合物、脂质等)的一个或多个差异,变体多肽可以不同于参考多肽。在一些实施例中,变体多肽显示与参考多肽(例如,本文所述的核酸酶)至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的总体序列同一性。可替代地或另外地,在一些实施例中,变体多肽不与参考多肽共享至少一个特征序列元件。在一些实施例中,参考多肽具有一种或多种生物学活性。在一些实施例中,变体多肽共享参考多肽的一种或多种生物学活性,例如核酸酶活性。在一些实施例中,变体多肽缺乏参考多肽的生物学活性中的一种或多种。在一些实施例中,与参考多肽相比,变体多肽显示降低水平的一种或多种生物学活性(例如,核酸酶活性,例如脱靶核酸酶活性)。在一些实施例中,如果目的多肽除特定位置处具有少量序列改变之外具有与亲本相同的氨基酸序列,则认为所述目的多肽是亲本或参考多肽的“变体”。通常,与亲本相比,变体中少于20%、15%、10%、9%、8%、7%、6%、5%、4%、3%、2%的残基被取代。在一些实施例中,变体与亲本相比具有10、9、8、7、6、5、4、3、2或1个取代的残基。通常,变体具有很少数量(例如,少于5、4、3、2或1个)数量的取代的功能残基(即,参与特定生物活性的残基)。在一些实施例中,与亲本相比,变体具有不超过5、4、3、2或1个添加或缺失,并且通常不具有添加或缺失。此外,任何添加或缺失典型地小于约25、约20、约19、约18、约17、约16、约15、约14、约13、约10、约9、约8、约7、约6个残基,并且通常少于约5、约4、约3或约2个残基。在一些实施例中,亲本或参考多肽是天然存在的。
概述
本披露部分地涵盖发现RNA指导的核酸酶相对于野生型核酸酶表现出对靶向DNA序列的改进的特异性。本文提供了此类RNA指导的核酸酶变体、包含此类核酸酶变体的组合物和系统、以及产生此类核酸酶变体的方法和使用此类核酸酶变体例如编辑一个或多个靶核酸的方法。
RNA指导的核酸酶
根据本披露的RNA指导的核酸酶包括但不限于天然存在的2类的CRISPR核酸酶,例如Cas9和Cpf1,以及由其衍生或获得的其他核酸酶。例如,从其衍生或获得的其他核酸酶包括变体核酸酶。在一些实施例中,变体核酸酶包含一种或多种改变的酶学性质,例如改变的核酸酶活性或改变的解旋酶活性(如与天然存在的或其他参考核酸酶分子(包括已经被工程化或改变的核酸酶分子相比))。在一些实施例中,变体核酸酶可以具有切口酶活性或没有切割活性(与双链核酸酶活性相反)。在另一个实施例中,变体核酸酶具有改变其大小的改变,例如减小其大小的氨基酸序列的缺失(例如,对一种或多种或对任何核酸酶活性具有或不具有显著影响)。在另一个实施例中,变体核酸酶可以识别不同的PAM序列。在一些实施例中,不同的PAM序列是除参考核酸酶的内源性野生型PI域识别的PAM序列以外的PAM序列,例如非典型序列。
在功能方面,RNA指导的核酸酶被定义为如下的那些核酸酶:(a)与gRNA相互作用(例如复合);和(b)与gRNA一起缔合或任选地切割或修饰DNA的靶区域,所述靶区域包含(i)与gRNA的靶向域互补的序列,以及任选地,(ii)称为“原型间隔子邻近基序”或“PAM”的另一序列,其更详细地描述于下文中。RNA指导的核酸酶在广义上可以由其PAM特异性和切割活性来定义,尽管在共享相同PAM特异性或切割活性的各个RNA指导的核酸酶之间可能存在变异。技术人员将了解,本披露的一些方面涉及可以使用具有某种PAM特异性和/或切割活性的任何适宜RNA指导的核酸酶实施的系统、方法和组合物。为此,除非另外指明,否则术语RNA指导的核酸酶应理解为通用术语,并不限于RNA指导的核酸酶的任何特定类型(例如,Cas9与Cpf1)、种类(例如,酿脓链球菌与金黄色葡萄球菌)或变体(例如,全长与截短或分裂;天然存在的PAM特异性与工程化PAM特异性等)。
PAM序列的名称来源于其与“原型间隔子”序列的顺序关系,所述原型间隔子序列与gRNA靶向域(或“间隔子”)互补。与原型间隔子一起,PAM序列定义特定RNA指导的核酸酶/gRNA组合的靶区域或序列。
多种RNA指导的核酸酶可能需要PAM与原型间隔子之间的不同顺序关系。通常,如相对于指导RNA靶向域可视化的,Cas9识别原型间隔子3’的PAM序列。
另一方面,Cpf1通常识别原型间隔子5’的PAM序列。
除了识别PAM和原型间隔子的特定顺序定向以外,RNA指导的核酸酶还可以识别特定PAM序列。例如,金黄色葡萄球菌Cas9识别NNGRRT或NNGRRV的PAM序列,其中N个残基紧靠由gRNA靶向域所识别区域的3’。酿脓链球菌Cas9识别NGG PAM序列。并且新凶手弗朗西斯菌(F.novicida)Cpf1识别TTN PAM序列。已鉴别多种RNA指导的核酸酶的PAM序列,并且鉴别新颖PAM序列的策略已描述于Shmakov等人,2015,Molecular Cell[分子细胞]60,385-397,2015年11月5日中。还应注意,工程化RNA指导的核酸酶可具有与参考分子的PAM特异性不同的PAM特异性(例如,在工程化RNA指导的核酸酶的情形中,参考分子可以是衍生出RNA指导的核酸酶的天然存在的变体,或与工程化RNA指导的核酸酶具有最大氨基酸序列同源的天然存在的变体)。
除了其PAM特异性以外,RNA指导的核酸酶可通过其DNA切割活性来表征:天然存在的RNA指导的核酸酶典型地在靶核酸中形成DSB,但是已产生仅生成SSB的工程化变体(上文所讨论)(Ran和Hsu等人,Cell[细胞]154(6),1380-1389,2013年9月12日(“Ran”),通过援引并入本文),或完全不切割的工程化变体。
Cas9
已确定酿脓链球菌Cas9的晶体结构(Jinek等人,Science[科学]343(6176),1247997,2014(“Jinek 2014”),以及与单分子指导RNA和靶DNA复合的金黄色葡萄球菌Cas9的晶体结构(Nishimasu 2014;Anders等人,Nature[自然].2014年9月25日;513(7519):569-73(“Anders 2014”);和Nishimasu 2015)。
天然存在的Cas9蛋白包含两个叶:识别(REC)叶和核酸酶(NUC)叶;每一叶包含特定的结构和/或功能域。REC叶包含富精氨酸桥螺旋(BH)域,以及至少一个REC域(例如REC1域和任选地REC2域)。REC叶与其他已知蛋白不共享结构相似性,指示其是独特的功能域。不希望受限于任何理论,突变分析提出BH和REC域的特殊功能作用:BH域似乎在gRNA:DNA识别中起作用,而REC域被认为与gRNA的重复:抗重复双链体相互作用并且介导Cas9/gRNA复合物的形成。
NUC叶包含RuvC域、HNH域和PAM相互作用(PI)域。RuvC域与逆转录病毒整合酶超家族成员共享结构相似性,并且切割靶核酸的非互补(即底部)链。其可从两个或更多个分裂RuvC基序(例如酿脓链球菌和金黄色葡萄球菌中的RuvC I、RuvCII和RuvCIII)形成。同时,HNH域在结构上与HNN内切核酸酶基序类似,并且切割靶核酸的互补(即顶部)链。顾名思义,PI域有助于PAM特异性。
虽然Cas9的某些功能与上文所述的特定域相关(但不一定完全取决于所述域),但这些和其他功能可以由其他Cas9域或任一叶上的多个域来介导或影响。例如,在酿脓链球菌Cas9中,如在Nishimasu 2014中所述,gRNA的重复:抗重复双链体落在REC叶与NUC叶之间的沟中,并且双链体中的核苷酸与BH、PI和REC域中的氨基酸相互作用。第一茎环结构中的一些核苷酸也与多个域(PI、BH和REC1)中的氨基酸相互作用,第二和第三茎环(RuvC和PI域)中的一些核苷酸也是如此。
变体Cas9核酸酶
本披露包括例如相对于野生型核酸酶对其靶标具有增加的特异性水平的变体RNA指导的核酸酶。例如,相对于野生型核酸酶,本披露的变体RNA指导的核酸酶表现出增加水平的中靶结合、编辑和/或切割活性。另外地或可替代地,相对于野生型核酸酶,本披露的变体RNA指导的核酸酶表现出降低水平的脱靶结合、编辑和/或切割活性。
本文所述的变体核酸酶包括酿脓链球菌Cas9和脑膜炎奈瑟氏球菌(Neisseriameningitidis或N.meningitidis)(SEQ ID NO:14)的变体。野生型酿脓链球菌Cas9的氨基酸序列作为SEQ ID NO:13提供。相对于野生型核酸酶,变体核酸酶可以在单个位置或多个位置,例如在2、3、4、5、6、7、8、9、10或更多个位置处包含氨基酸取代。在一些实施例中,变体核酸酶包含与野生型核酸酶至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的氨基酸序列。
一种或多种野生型氨基酸可以被丙氨酸取代。另外地或可替代地,一种或多种野生型氨基酸可以被保守的变体氨基酸取代。另外地或可替代地,一种或多种野生型氨基酸可以被非保守的变体氨基酸取代。
例如,相对于野生型核酸酶(例如,SEQ ID NO:13),本文所述的变体核酸酶可以包含在以下位置中的一、二、三、四、五、六、七或全部八个处的取代:D23、D1251、Y128、T67、N497、R661、Q695和/或Q926(例如,这些位置中一个或所有位置处的丙氨酸保守和/或非保守取代)。相对于野生型核酸酶,示例性变体核酸酶可包含以下取代中的一、二、三、四、五、六、七或全部八个:D23A、D1251G、Y128V、T67L、N497A、R661A、Q695A和/或Q926A。相对于野生型核酸酶,本披露的特定核酸酶变体包含以下取代:D23A、D1251G、Y128V和T67L。
在一些实施例中,变体核酸酶包含与SEQ ID NO:13至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并包括以下取代中的一、二、三、四、五、六、七或全部八个的氨基酸序列:D23A、D1251G、Y128V、T67L、N497A、R661A、Q695A和/或Q926A。例如,变体核酸酶可包含与SEQ ID NO:13至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同并包括以下取代的氨基酸序列:D23A、D1251G、Y128V和T67L。
除了在D23、D1251、Y128、T67、N497、R661、Q695和/或Q926的一、二、三、四、五、六、七或全部八个处的取代(例如,D23A、D1251G、Y128V、和T67L),酿脓链球菌Cas9变体还可以在以下位置中的一个或多个处包括取代:L169;Y450;M495;W659;M694;H698;A728;E1108;V1015;R71;Y72;R78;R165;R403;T404;F405;K1107;S1109;R1114;S1116;K1118;D1135;S1136;K1200;S1216;E1219;R1333;R1335;T1337;Y72;R75;K76;L101;S104;F105;R115;H116;I135;H160;K163;Y325;H328;R340;F351;D364;Q402;R403;I1110;K1113;R1122;Y1131;R63;R66;R70;R71;R74;R78;R403;T404;N407;R447;I448;Y450;K510;Y515;R661;V1009;Y1013;K30;K33;N46;R40;K44;E57;T62;R69;N77;L455;S460;R467;T472;I473;H721;K742;K1097;V1100;T1102;F1105;K1123;K1124;E1225;Q1272;H1349;S1351;和/或Y1356,例如美国专利9,512,446中所述的取代。
在一些实施例中,酿脓链球菌变体可以在以下位置中的一个或多个处包括取代:N692、K810、K1003、R1060和G1218。在一些实施例中,酿脓链球菌变体包括以下取代中的一个或多个:N692A、K810A、K1003A、R1060A和G1218R。
表1列出了根据本披露的某些实施例的示例性酿脓链球菌Cas9突变体,其包含3至5个取代。为了清楚起见,本披露涵盖在本披露的上文和其他地方列出的位点中的1、2、3、4、5或更多个位点处具有突变的Cas9变体蛋白。示例性的三、四、五突变体在表1中给出并且描述于以下中,例如Chen等人,Nature[自然]550:407-410(2017);Slaymake等人,Science[科学]351:84-88(2015);Kleinstiver等人,Nature[自然]529:490-495;Kleinstiver等人,Nature[自然]523:481-485(2015);Kleinstiver等人,Nature Biotechnology[自然生物技术]33:1293-1298(2015)。
表1:
位置
D1135V/R1335Q/T1337R
D1135E/R1335Q/T1337R
D1135V/G1218R/R1335E/T1337R
N497A/R661A/Q695A/Q926A
D1135E/N497A/R661A/Q695A/Q926A
N497A/R661A/Q695A/Q926A/L169A
N497A/R661A/Q695A/Q926A/Y450A
K810A/K1003A/R1060A
K848A/K1003A/R1060A
N692A/M694A/Q695A/H698A
酿脓链球菌Cas9变体还可以包括会降低或破坏Cas9的核酸酶活性的一个或多个氨基酸取代基:D10、E762、D839、H983或D986和H840或N863。例如,酿脓链球菌Cas9可包括氨基酸取代D10A/D10N和H840A/H840N/H840Y,以使蛋白质的核酸酶部分催化失活。这些位置处的取代基可以是丙氨酸或其他残基,例如谷氨酰胺、天冬酰胺、酪氨酸、丝氨酸或天冬氨酸,例如E762Q、H983N、H983Y、D986N、N863D、N863S或N863H(Nishimasu等人,Cell[细胞]156,935-949(2014);WO 2014/152432)。在一些实施例中,变体在D10A或H840A处包含单个氨基酸取代,其产生单链切口酶。在一些实施例中,变体多肽在D10A和H840A处包括使核酸酶活性失活的氨基酸取代(例如,称为死亡Cas9或dCas9)。本文所述的变体核酸酶还包括脑膜炎奈瑟氏球菌(N.meningitidis)的变体(Hou等人,PNAS Early Edition[PNAS早期版]2013,1-6;通过援引并入本文)。野生型脑膜炎奈瑟氏球菌Cas9的氨基酸序列作为SEQ IDNO:14提供)。脑膜炎奈瑟氏球菌和酿脓链球菌Cas9序列的比较表明某些区域是保守的(参见WO 2015/161276)。因此,本披露包括脑膜炎奈瑟氏球菌Cas9变体,其在酿脓链球菌Cas9的上下文中包括本文所述的一种或多种取代,例如在脑膜炎奈瑟球菌Cas9的一个或多个对应氨基酸位置处的取代。例如,分别对应于酿脓链球菌氨基酸位置D23、D1251、Y128、T67、R661、Q695和/或Q926的在脑膜炎奈瑟氏球菌氨基酸位置D29、D983、L101、S66、Q421、E459、Y671处的取代(图17)。
相对于野生型核酸酶,变体脑膜炎奈瑟氏球菌核酸酶可以在单个位置或多个位置,例如在2、3、4、5、6、7、8、9、10或更多个位置处包含氨基酸取代。在一些实施例中,变体脑膜炎奈瑟氏球菌核酸酶包含与野生型核酸酶至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的氨基酸序列。
变体核酸酶保留了野生型核酸酶的一种或多种功能活性,例如,切割双链DNA的能力、切割DNA的单链的能力(例如,切口酶)、靶向DNA而不切割DNA的能力(例如,死亡核酸酶)、和/或与指导核酸相互作用的能力。在一些实施例中,变体核酸酶具有与野生型核酸酶相同或大约相同水平的中靶活性。在一些实施例中,变体核酸酶具有相对于野生型核酸酶而言改善的一种或多种功能活性。例如,本文所述的变体核酸酶可以表现出增加水平的中靶活性(例如相对于野生型,为10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、125%、150%、175%、200%或更高)和/或降低水平的脱靶活性(例如为野生型活性的90%、80%、70%、60%、50%、40%、30%、20%、10%或5%)。在一些实施例中,当本文所述的变体核酸酶与双链DNA(dsDNA)(例如,靶dsDNA)接触时,脱靶编辑(例如脱靶编辑率)低于野生型核酸酶对靶dsDNA的观察到或测得的脱靶编辑率。例如,变体核酸酶的脱靶编辑率可以比野生型核酸酶低约5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%或95%。
可以使用本领域中已知的任何方法来评估变体核酸酶的活性(例如,中靶和/或脱靶活性),例如GUIDE-seq(指导-序列,参见例如,Tsai等人(Nat.Biotechnol.[自然生物技术]33:187-197(2015));CIRCLE-seq(参见,例如,Tsai等人,Nature Methods[自然方法]14:607-614(2017));Digenome-seq(参见,例如,Kim等人,Nature Methods[自然方法]12:237-243(2015));或ChIP-seq(参见,例如,O’Geen等人,Nucleic Acids Res.[核酸研究]43:3389-3404(2015))。在一些实施例中,脱靶编辑率通过确定脱靶位点处的插入缺失的%来评估。
如本领域普通技术人员众所周知的,存在用于将取代引入多肽的氨基酸序列中的多种方法。可以将编码变体核酸酶的核酸引入病毒或非病毒载体中以在宿主细胞(例如人细胞、动物细胞、细菌细胞、酵母细胞、昆虫细胞)中表达。在一些实施例中,将编码变体核酸酶的核酸可操作地连接至用于核酸酶表达的一个或多个调节域。如本领域普通技术人员将认识到的那样,合适的细菌和真核启动子是本领域众所周知的,并且描述于例如Sambrook等人,Molecular Cloning,A Laboratory Manual[分子克隆:实验室手册](2001年第3版);Kriegler,Gene Transfer and Expression:A Laboratory Manual[基因转移和表达:实验室手册](1990);和Current Protocols in Molecular Biology[分子生物学实验指南](Ausubel等人编,2010)中。用于表达工程化的蛋白的细菌表达系统是在例如大肠杆菌、芽孢杆菌属物种和沙门氏菌属中可得的(Paiva等人,1983,Gene[基因]22:229-235)。
Cpf1
与crRNA复合的氨基酸球菌属物种(Acidaminococcus sp.)Cpf1和包括TTTN PAM序列的双链(ds)DNA靶标的晶体结构已经由Yamano等人解析(Cell[细胞].2016年5月5日;165(4):949-962(“Yamano”),通过援引并入本文)。Cpf1像Cas9一样,具有两个叶:REC(识别)叶和NUC(核酸酶)叶。REC叶包括REC1和REC2域,其缺少与任何已知蛋白质结构的相似性。同时,NUC叶包括三个RuvC域(RuvC-I、-II和-III)和BH域。然而,与Cas9相反,Cpf1 REC叶缺少HNH域,并且包括同样缺少与已知蛋白质结构的相似性的其他域:结构上独特的PI域、三个楔形(WED)域(WED-I、-II和-III)和核酸酶(Nuc)域。
虽然Cas9和Cpf1共享结构和功能的相似性,但应了解,某些Cpf1活性是由与任何Cas9域不同的结构域介导的。例如,靶DNA的互补链的切割似乎是由Nuc域介导,所述Nuc域在顺序上和空间上与Cas9的HNH域不同。另外,Cpf1 gRNA的非靶向部分(把手)采用假结(pseudoknot)结构,而不是Cas9 gRNA中由重复:抗重复双链体形成的茎环结构。
编码RNA指导的核酸酶的核酸
本文提供编码RNA指导的核酸酶(例如Cas9、Cpf1或其功能片段)的核酸。先前已经描述了编码RNA指导的核酸酶的示例性核酸(参见,例如,Cong等人,Science[科学].2013年2月15日;339(6121):819-23(“Cong 2013”);Wang等人,PLoS One[公共科学图书馆综合].2013年12月31日;8(12):e85650(“Wang 2013”);Mali 2013;Jinek 2012)。
在一些情形中,编码RNA指导的核酸酶的核酸可以是合成的核酸序列。例如,合成核酸分子可以经化学修饰。在某些实施例中,编码RNA指导的核酸酶的mRNA将具有一种或多种(例如,所有)以下特性:其可以被加帽;多聚腺苷酸化;以及经5-甲基胞苷和/或假尿苷取代。
合成的核酸序列也可以经密码子优化,例如,至少一个非常见密码子或较不常见的密码子已经常见密码子替代。例如,合成核酸可以引导经优化信使mRNA的合成,例如,针对在哺乳动物表达系统中的表达进行优化,例如,本文所述。密码子优化的Cas9编码序列的实例呈现于WO 2016/073990(“Cotta-Ramusino”)中。
另外,或可替代地,编码RNA指导的核酸酶的核酸可包含核定位序列(NLS)。核定位序列是本领域中已知的。
指导RNA(gRNA)分子
术语“指导RNA”和“gRNA”是指促进RNA指导的核酸酶例如Cas9或Cpf1与靶序列例如细胞中的基因组序列或游离序列特异性结合(或“靶向”)的任何核酸。gRNA可以是单分子的(包含单个RNA分子,也可替代性地称为嵌合分子),或是模块化的(包含超过一个,且通常包含两个单独的RNA分子,例如crRNA和tracrRNA,它们通常例如通过双链化相互关联)。gRNA及其组分在整个文献中都有描述,例如在Briner等人(Molecular Cell[分子细胞]56(2),333-339,2014年10月23日(“Briner”),将其通过援引并入本文)和在Cotta-Ramusino中。
在细菌和古细菌中,II型CRISPR系统通常包含RNA指导的核酸酶蛋白(例如Cas9)、包括与外来序列互补的5’区的CRISPR RNA(crRNA)和包括与crRNA的3’区互补并形成双链体的5’区的反式激活crRNA(tracrRNA)。虽然并非旨在受限于任何理论,但认为此双链体有助于形成Cas9/gRNA复合物,并且是所述复合物的活性所需的。在II型CRISPR系统经改适用于基因编辑中时,发现crRNA和tracrRNA可以接合成单一单分子或嵌合指导RNA,在一个非限制性实例中借助桥接crRNA(在其3’末端)和tracrRNA(在其5’末端)的互补区的四核苷酸(例如GAAA)“四环(tetraloop)”或“接头”序列来接合。(Mali等人Science.[科学]2013年2月15日;339(6121):823-826(“Mali 2013”);Jiang等人Nat Biotechnol[自然生物技术].2013年3月;31(3):233-239(“Jiang”);和Jinek等人,2012Science[科学]8月17日;337(6096):816-821(“Jinek 2012”),全部通过援引并入本文)。
指导RNA不论是单分子的或模块化的都包括“靶向域”,所述靶向域与靶序列内的靶标域完全或部分互补,所述靶序列是例如期望编辑的细胞基因组中的DNA序列。靶向域在文献中通过多种名称来提及,包括但不限于“指导序列”(Hsu等人,Nat Biotechnol.[自然生物技术]2013年9月;31(9):827-832,(“Hsu”),通过援引并入本文),“互补性区”(Cotta-Ramusino),“间隔区”(Briner),并统称为“crRNA”(Jiang)。不论给予其何种名称,靶向域典型地长度为10-30个核苷酸,并且在某些实施例中长度为16-24个核苷酸(例如,长度为16、17、18、19、20、21、22、23或24个核苷酸),并且在Cas9 gRNA情况下位于5’末端处或5’末端附近,并且在Cpf1gRNA情况下位于3’末端处或3’末端附近。
除了靶向域以外,gRNA典型地(但不一定,如下文所讨论)包括多个可影响gRNA/Cas9复合物的形成或活性的域。例如,如上文所提及,通过gRNA的第一和第二互补性域形成的双链化结构(也称为重复:抗重复双链体)与Cas9的识别(REC)叶相互作用,并且可以介导Cas9/gRNA复合物的形成。(Nishimasu等人,Cell[细胞]156,935-949,2014年2月27日(“Nishimasu 2014”)和Nishimasu等人,Cell[细胞]162,1113-1126,2015年8月27日(“Nishimasu 2015”),将这两篇文献通过援引并入本文)。应注意,第一和/或第二互补性域可含有一个或多个多聚腺苷酸段,其可以由RNA聚合酶识别为终止信号。因此,第一和第二互补性域的序列任选地经修饰以消除这些段,并促进gRNA的体外转录的完成,例如通过使用如Briner中所述的A-G交换、或通过使用A-U交换来修饰。对第一和第二互补性域的这些和其他类似修饰在本披露的范围内。
与第一和第二互补性域一起,Cas9 gRNA典型地包括两个或更多个其他双链化区域,该两个或更多个其他双链化区域在体内但不一定在体外参与核酸酶活性。(Nishimasu2015)。在第二互补性域的3’部分附近的第一茎环一被不同地称为“近端域”(Cotta-Ramusino)、“茎环1”(Nishimasu 2014和2015)以及“连结(nexus)”(Briner)。一个或多个其他茎环结构通常存在于gRNA的3’末端附近,其数目依物种而变:酿脓链球菌gRNA典型地包括2个3’茎环(总计4个茎环结构,包括重复:抗重复双链体),而金黄色葡萄球菌和其他物种仅具有一个(总计3个茎环结构)。对根据物种组织化的保守茎环结构(更通常地,和gRNA结构)的描述于Briner中提供。
虽然前述说明集中于用于Cas9的gRNA,但应了解,已经(或可能在未来)发现或发明其他RNA指导的核酸酶,其利用在一些方面与针对这一点描述的那些gRNA不同的gRNA。例如,Cpf1(“来自普雷沃菌属(Prevotella)和弗朗西斯菌属(Franciscella)1的CRISPR”)是新近发现的RNA指导的核酸酶,其发挥功能不需要tracrRNA。(Zetsche等人,2015,Cell[细胞]163,759-771 2015年10月22日(“Zetsche I”),通过援引并入本文)。用于Cpf1基因组编辑系统的gRNA通常包括靶向域和互补性域(替代性地称为“把手”)。还应注意,在与Cpf1一起使用的gRNA中,靶向域通常存在于3’末端处或附近,而不是如上文结合Cas9 gRNA所述的5’末端(把手位于Cpf1gRNA的5’末端处或附近)。
但本领域技术人员将了解,虽然在来自不同原核物种的gRNA之间或在Cpf1与Cas9gRNA之间可能存在结构差异,但gRNA的操作原理通常是一致的。因为这种操作一致性,gRNA可在广义上通过其靶向域序列来定义,并且技术人员将了解,可将给定靶向域序列并入任何适宜gRNA中,包括单分子或嵌合gRNA,或包括一种或多种化学修饰和/或序列修饰(取代、额外核苷酸、截短等)的gRNA。因此,为了便于呈现本披露,gRNA可仅在其靶向域序列方面加以描述。
更通常地,技术人员将了解,本披露的一些方面涉及可以使用多个RNA指导的核酸酶实施的系统、方法和组合物。为此,除非另外指定,否则术语gRNA应理解为不仅涵盖那些与Cas9或Cpf1的特定种类相容的gRNA,还涵盖可以用于任何RNA指导的核酸酶的任何适宜gRNA。通过说明,在某些实施例中,术语gRNA可以包括与存在于2类CRISPR系统(例如II型或V型或CRISPR系统)中的任何RNA指导的核酸酶或从其衍生或改适的RNA指导的核酸酶一起使用的gRNA。
选择方法
本披露还提供了基于竞争的选择策略,其将在一组条件中选择具有最大适应性的变体(例如,在变体/突变体文库中)。本发明的选择方法可用于例如定向进化策略,例如涉及一轮或多轮诱变然后进行选择的策略。在某些实施例中,与当前多肽和/或多肽进化策略通常观察到的相比,当前披露的方法允许更高通量的定向进化策略。
基于与噬菌粒中DNA靶位点结合的选择
一方面,本披露提供基于是否结合DNA靶位点来选择目的多肽或多核苷酸的版本(version)的方法。这些方法通常包括以下步骤:(a)提供多核苷酸的文库,其中所述文库中的不同多核苷酸编码不同版本的目的多肽或用作不同版本的目的多核苷酸的模板;(b)将多核苷酸的文库引入宿主细胞,使得每个转化的宿主细胞包括编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板的多核苷酸;(c)提供多种噬菌体,所述噬菌体包含编码第一选择剂并包含DNA靶位点的噬菌粒;(d)在培养条件下将步骤(b)的转化的宿主细胞与多种噬菌体一起孵育,使得所述多种噬菌体感染转化的宿主细胞,其中第一选择剂的表达赋予被感染的宿主细胞以存活优势或劣势;和(e)选择在(d)中表现出存活优势(例如本文所述的存活优势)的宿主细胞。例如,步骤(d)的存活基于以下概述的各种方案。
在DNA靶位点的结合降低了由噬菌粒编码或包含在其上的选择剂(如本文进一步讨论的)的表达。如本文进一步讨论的,选择剂可赋予存活劣势或存活优势。通过在DNA靶位点处结合介导的选择剂的转录抑制,可以发生选择剂表达的降低。在一些实施例中,通过在DNA靶位点处或附近切割噬菌粒而发生选择剂(selection agent)表达的降低。例如,目的多肽或多核苷酸既可以结合也可以切割DNA。某些类型的酶与特定的DNA识别位点结合,并在结合位点处或附近切割DNA。因此,DNA切割的位点可以与DNA结合位点相同或不同。在DNA切割位点不同于DNA结合位点的一些实施例中,两个位点彼此靠近(例如,在20、15、10或5个碱基对之内)。另外地或可替代地,两个位点不在彼此的20、15、10或5个碱基对内。
当涉及切割时,它可以是噬菌粒的一条链(也称为“切口”)或两条链的切割,如下所述,噬菌粒在宿主细胞内部时以双链质粒的形式复制。
在某些实施例中,在DNA靶位点处的结合增加了由噬菌粒编码的或模板在噬菌粒上的选择剂的表达。例如,通过在DNA靶位点处的结合介导的选择剂的转录激活,可以发生选择剂表达的增加。
可以选择与DNA靶位点结合的多肽或多核苷酸的版本,例如,由于用这种版本转化的宿主细胞表现出维持细胞生长动力学、增加细胞生长动力学(例如增加细胞分裂)和/或逆转细胞生长动力学的降低(例如,从细胞生长动力学的降低至少部分拯救);而用不与DNA靶位点结合的版本转化的宿主细胞则不表现出细胞生长动力学的增加(例如,表现出细胞生长动力学和/或细胞分裂的减少)和/或被杀死。在某些实施例中,选择与DNA靶位点结合的多肽或多核苷酸的版本,因为用这种版本转化的宿主细胞能存活,而用不结合DNA靶位点的版本转化的宿主细胞不能存活。
可以选择不与DNA靶位点结合的多肽或多核苷酸的版本,例如,由于用这种版本转化的宿主细胞表现出维持细胞生长动力学、增加细胞生长动力学(例如增加细胞分裂)和/或逆转细胞生长动力学的降低(例如,从细胞生长动力学的降低至少部分拯救);而用与DNA靶位点结合的版本转化的宿主细胞则不表现出细胞生长动力学的增加(例如,表现出细胞生长动力学和/或细胞分裂的减少)和/或被杀死。在某些实施例中,选择不结合DNA靶位点的多肽或多核苷酸的版本,因为用这种版本转化的宿主细胞能存活,而用结合DNA靶位点的版本转化的宿主细胞不能存活。
在替代性实施例中,可以构建编码Cas9蛋白的噬菌粒(例如,pEvol_CAS)和靶向靶序列的gRNA以及噬菌体起点F1元件(图16)。在一些实施例中,噬菌粒组成型表达β-内酰胺酶(其赋予对氨苄青霉素(AmpR)或类似抗生素例如羧苄青霉素的抗性),以及控制Cas9的表达的诱导型阿拉伯糖启动子(Ara)。在一些实施例中,可以将pEvol_CAS包装到辅助噬菌体中以引入转化的宿主细胞中。也可以构建质粒,例如pSelect_MUT和pSelect_WT,其各自包含潜在的靶位点。可替代地或另外地,这些质粒还可以包含组成型表达的氯霉素抗性基因(CmR)和在lac启动子控制下的细菌毒素,从而允许通过例如IPTG(异丙基β-D-1-硫代吡喃半乳糖苷)诱导毒素表达。
为了设计等位基因特异性,可以使用例如pEvol_CAS噬菌粒作为诱变的初始模板,以及针对每个密码子并允许调整突变率的全面且无偏的诱变方法来生成Cas9突变体的噬菌粒文库。
可替代地或另外地,在一些实施例中,每一轮进化包括在竞争性培养物中对pEvol_CAS突变体的噬菌粒文库进行对含有例如pSelect_MUT或pSelect_WT的大肠杆菌的切割的阳性选择。例如,可以使用噬菌体包装pEvol_CAS突变体来感染含有pSelect_MUT或pSelect_WT的细菌,并且可以在氨苄青霉素的液体培养物中培养该细菌。
在一些实施例中,在初始孵育和感染后,可以通过添加例如IPTG来诱导毒素表达以评估使用毒素进行的阳性选择的严格度。在一些实施例中,可以通过添加阿拉伯糖来诱导Cas9和指导RNA的表达。在阳性选择过程中,细菌可被液体培养物中存在的噬菌体连续感染,从而对切割靶标提出了持续的挑战。
在一些实施例中,在初始孵育和感染后,使用抗生素例如氯霉素进行的阴性选择的严格度。在一些实施例中,可以通过添加阿拉伯糖诱导Cas9和指导RNA的表达。在阴性选择过程中,细菌可被液体培养物中存在的噬菌体连续感染,从而对切割靶标提出了持续的挑战。
另一方面,这些方法通常包括以下步骤:(a)提供编码第一选择剂并包括DNA靶位点的多核苷酸;(b)将多核苷酸引入宿主细胞,使得每个转化的宿主细胞包括编码第一选择剂和DNA靶位点的多核苷酸;(c)提供包含编码多核苷酸文库的噬菌粒的多种噬菌体,其中所述文库中的不同多核苷酸编码不同版本的目的多肽或用作不同版本的目的多核苷酸的模板;(d)在培养条件下将步骤(b)的转化的宿主细胞与多种噬菌体一起孵育,使得所述多种噬菌体感染转化的宿主细胞,其中第一选择剂的表达赋予被感染的宿主细胞以存活优势或劣势;和(e)选择在(d)中表现出存活优势(例如本文所述的存活优势)的宿主细胞。例如,步骤(d)的存活基于以上概述的各种方案。
当结合降低不利选择剂的表达时,基于DNA靶位点处的结合进行选择
在某些实施例中,选择剂在宿主细胞中赋予存活劣势(例如,细胞生长动力学的降低(例如,生长延迟)和/或细胞分裂的抑制)和/或杀死宿主细胞,而在DNA靶位点处的结合降低选择剂的表达。于是,存活是基于DNA靶位点处的结合:用与DNA靶位点结合的、来自文库的多核苷酸(编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板)转化的宿主细胞表现出维持细胞生长动力学、增加细胞生长动力学(例如增加细胞分裂)和/或逆转细胞生长动力学的降低(例如,从细胞生长动力学的降低至少部分拯救)。同时,用不与DNA靶位点结合的、来自文库的多核苷酸(编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板)转化的宿主细胞表现出存活劣势(例如,细胞生长动力学的降低(例如,生长延迟)和/或细胞分裂的抑制)、不能存活和/或被杀死)。
在一些实施例中,通过在DNA靶位点处或附近切割噬菌粒,例如通过切割噬菌粒的一条链(“切口”)或两条链来降低选择剂的表达。
文库中的多核苷酸可包括例如抗生素抗性基因,并且选择剂(由噬菌粒编码或其模板在噬菌粒上)抑制抗生素抗性基因的产物。在这种选择过程中的培养条件可以包括例如暴露于抗生素抗性基因对其产生抗性的抗生素。在一个实例中,抗生素抗性基因编码β-内酰胺酶,抗生素是氨苄青霉素或青霉素或另一种β-内酰胺抗生素,而选择剂是β-内酰胺酶抑制蛋白(BLIP)。
当结合会降低有利选择剂的表达时,基于DNA靶位点处的结合的缺乏进行选择
在某些实施例中,选择剂在宿主细胞中赋予存活优势(例如,维持细胞生长动力学、增加细胞生长动力学(例如,增加细胞分裂)和/或逆转细胞生长动力学的降低(例如,从细胞生长动力学的降低至少部分拯救),而在DNA靶位点处的结合降低选择剂的表达。于是,存活是基于DNA靶位点处的结合的缺乏:用不与DNA靶位点结合的、来自文库的多核苷酸(编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板)转化的宿主细胞表现出维持细胞生长动力学、增加细胞生长动力学(例如增加细胞分裂)和/或逆转细胞生长动力学的降低(例如,从细胞生长动力学的降低至少部分拯救)。同时,用与DNA靶位点结合的、来自文库的多核苷酸(编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板)转化的宿主细胞表现出存活劣势(例如,细胞生长动力学的降低(例如,生长延迟)、细胞分裂的抑制、不能存活和/或被杀死)。
在一些实施例中,通过在DNA靶位点处或附近切割噬菌粒,例如通过切割噬菌粒的一条链(“切口”)或两条链来降低选择剂的表达。
当结合增加有利选择剂的表达时,基于DNA靶位点处的结合进行选择
在某些实施例中,选择剂在宿主细胞中赋予存活优势(例如,维持细胞生长动力学、增加细胞生长动力学(例如,增加细胞分裂)和/或逆转细胞生长动力学的降低(例如,从细胞生长动力学的降低至少部分拯救),而在DNA靶位点处的结合增加选择剂的表达。于是,存活是基于DNA靶位点处的结合:用与DNA靶位点结合的、来自文库的多核苷酸(编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板)转化的宿主细胞表现出维持细胞生长动力学、增加细胞生长动力学(例如增加细胞分裂)和/或逆转细胞生长动力学的降低(例如,从细胞生长动力学的降低至少部分拯救)。同时,用不与DNA靶位点结合的、来自文库的多核苷酸(编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板)转化的宿主细胞表现出存活劣势(例如,细胞生长动力学的降低(例如,生长延迟)、细胞分裂的抑制、不能存活和/或被杀死)。
当结合会增加不利选择剂的表达时,基于DNA靶位点处的结合的缺乏进行选择
在某些实施例中,选择剂在宿主细胞中赋予存活劣势(例如,细胞生长动力学的降低(例如,生长延迟)和/或细胞分裂的抑制)和/或杀死宿主细胞,而在DNA靶位点处的结合增加选择剂的表达。于是,存活是基于DNA靶位点处的结合的缺乏:用不与DNA靶位点结合的、来自文库的多核苷酸(编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板)转化的宿主细胞表现出维持细胞生长动力学、增加细胞生长动力学(例如增加细胞分裂)和/或逆转细胞生长动力学的降低(例如,从细胞生长动力学的降低至少部分拯救)。同时,用与DNA靶位点结合的、来自文库的多核苷酸(编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板)转化的宿主细胞表现出存活劣势(例如,细胞生长动力学的降低(例如,生长延迟)、细胞分裂的抑制、不能存活和/或被杀死)。
基于在选择剂存在下与宿主细胞基因组中的DNA靶位点的结合进行选择
一方面,本披露提供基于选择剂存在下是否结合DNA靶位点来选择目的多肽或多核苷酸的版本的方法。
如本文进一步讨论的,这些方法通常包括以下步骤:(a)提供多核苷酸的文库,其中所述文库中的不同多核苷酸编码不同版本的目的多肽或多核苷酸;(b)将多核苷酸的文库引入宿主细胞,使得每个转化的宿主细胞包括编码目的多肽或多核苷酸版本的多核苷酸,其中宿主细胞基因组包括DNA靶位点;(c)提供包含编码第一选择剂的噬菌粒的多种噬菌体,其中所述第一选择剂是第一选择多核苷酸;(d)在培养条件下将步骤(b)的转化的宿主细胞与多种噬菌体一起孵育,使得所述多种噬菌体感染转化的宿主细胞,其中在第一选择剂存在下DNA靶位点的结合赋予被感染宿主细胞的存活优势或劣势;和(e)选择在步骤(d)中存活的宿主细胞。
步骤(d)中的存活是基于以下概述的各种方案。
DNA靶位点可以例如在宿主细胞基因组中。另外地或可替代地,DNA靶位点可以在宿主细胞的必需存活基因中。另外地或可替代地,DNA靶位点可以在其产物阻止存活基因表达的基因中。
在一些实施例中,选择多核苷酸是用于CRISPR相关(Cas)核酸酶的指导RNA。
当结合将是不利的时,存活是基于DNA靶位点处的结合的缺乏
在某些实施例中,在选择剂(其为多核苷酸)存在下宿主细胞中DNA靶位点处的结合是不利的(例如,因为在DNA靶位点处的结合导致宿主细胞中必需的存活基因的破坏)。于是,存活是基于DNA靶位点处的结合的缺乏:用不与DNA靶位点结合的、来自文库的多核苷酸(编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板)转化的宿主细胞存活。同时,用与DNA靶位点结合的、来自文库的多核苷酸(编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板)转化的宿主细胞不能存活。
当结合将是有利的时,存活是基于DNA靶位点处的结合
在某些实施例中,在选择剂(其为多核苷酸)存在下宿主细胞中DNA靶位点处的结合是有利的(例如,因为在DNA靶位点处的结合导致宿主细胞中存活基因的表达)。于是,存活是基于DNA靶位点处的结合:用与DNA靶位点结合的、来自文库的多核苷酸(编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板)转化的宿主细胞存活。同时,用不与DNA靶位点结合的、来自文库的多核苷酸(编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板)转化的宿主细胞不能存活。
基于多肽表达的诱导进行选择
一方面,本披露提供基于调节或控制多肽表达来选择目的多肽或多核苷酸的版本的方法。
如本文进一步讨论的,这些方法通常包括以下步骤:(a)提供多核苷酸的文库,其中所述文库中的不同多核苷酸编码不同版本的目的多肽或用作不同版本的目的多核苷酸的模板;(b)将多核苷酸的文库引入宿主细胞,使得每个转化的宿主细胞包括编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板的多核苷酸;(c)诱导多肽的表达以控制培养物中存在的多肽的量;(d)提供多种噬菌体,所述噬菌体包含编码第一选择剂并包含DNA靶位点的噬菌粒;(e)在培养条件下将步骤(b)的转化的宿主细胞与多种噬菌体一起孵育,使得所述多种噬菌体感染转化的宿主细胞,其中第一选择剂的表达赋予被感染的宿主细胞以存活优势或劣势;和(f)选择在步骤(d)中存活的宿主细胞。步骤(d)中的存活是基于本文所述的各种方案。
多核苷酸可以包括诱导型启动子(例如本文所述的诱导型启动子),并且通过使多核苷酸与本文所述的一种或多种诱导剂接触来诱导表达。例如,多核苷酸可以包括阿拉伯糖启动子,并且可以通过使多核苷酸与阿拉伯糖接触来诱导多核苷酸的表达。在另一个实例中,多核苷酸可以包括tac启动子,并且可以通过使多核苷酸与IPTG接触来诱导多核苷酸的表达。在又另一个实例中,多核苷酸可以包括rhaBAD启动子,并且可以通过使多核苷酸与鼠李糖接触来诱导多核苷酸的表达。
多核苷酸的文库
本披露的方法可以例如从提供多核苷酸的文库(例如质粒文库)的步骤开始,其中文库中的不同多核苷酸编码不同版本的目的多肽(或,在目的多核苷酸的情况下,文库包括不同版本的目的多核苷酸和/或用作不同版本的目的多核苷酸的模板的不同版本的目的多核苷酸)。
本文所述的文库可包括例如可操作地连接至诱导型启动子的多核苷酸。例如,启动子的诱导可以诱导多核苷酸编码的多肽的表达。在一些实施例中,启动子的诱导(以诱导由多核苷酸编码的多肽的表达)影响选择方法的效率。例如,相对于不使用诱导型启动子的选择方法的效率,可以提高和/或增加选择方法的效率。
可以例如通过使用或购买现有的文库来获得这样的文库,诸如商业上可得的和/或可通过公众收藏获得的文库。可替代地或另外地,文库可以从诱变方法获得。例如,可以通过随机诱变方法或综合诱变方法,例如在整个用于诱变的预定的靶区域中随机靶向多核苷酸的方法来获得文库。
文库也可以通过靶向诱变方法获得。例如,目的多核苷酸或目的多肽的子区域可被靶向诱变。另外地或可替代地,可以将全部目的多核苷酸或全部目的多肽靶向诱变。
尽管目的多肽或多核苷酸通常具有DNA结合能力,但可以预期并非文库中不同多核苷酸编码的目的多肽或多核苷酸的所有版本都必然能够结合DNA。此外,在由文库中的不同多核苷酸编码的目的多肽或多核苷酸的那些形式中,预期它们结合DNA的能力可能不同。实际上,本披露的选择方法涉及区分能够和不能结合DNA靶位点的目的多肽或多核苷酸的版本。在某些实施例中,目的多肽或多核苷酸的许多或甚至大多数版本不结合DNA。
类似地,在目的多肽或多核苷酸可以切割DNA的实施例中,并非目的多肽或多核苷酸的所有版本都必然可以切割DNA。
宿主细胞
本披露的方法可以包括,在提供多核苷酸的文库的步骤之后,使得每个转化的宿主细胞包括编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板的多核苷酸。
宿主细胞通常是指可以吸收外源物质例如核酸(例如DNA和RNA)、多肽或核糖核蛋白的细胞。宿主细胞可以是例如单细胞生物,例如像微生物;或真核细胞,例如酵母细胞、哺乳动物细胞(例如在培养物中)等。
在一些实施例中,宿主细胞是原核细胞,例如细菌细胞,例如细菌大肠杆菌。细菌细胞可以是革兰氏阴性或革兰氏阳性,并且可以属于细菌(以前称为真细菌)域或古核生物(以前称为古细菌)域。这些细菌类型中的任何一种都适合作为宿主细胞,只要它们可以在实验室中生长并吸收外源材料即可。
宿主细胞可以是有能力的或使得有能力的细菌细胞,例如,因为它们能够或被制成能够吸收外源材料,例如遗传材料。
存在多种机制,可以通过所述多种机制将外源材料(例如遗传材料)引入宿主细胞。例如,在细菌中,存在三种通用机制,分类为转化(摄取和掺入胞外核酸(例如DNA))、转导(例如,通过质粒或感染细胞的病毒如噬菌体将遗传物质从一种细胞转移到另一种细胞)、和接合(核酸在两个临时连接的细胞之间的直接转移)。已经通过转化将遗传物质引入其中的宿主细胞通常被称为“转化的宿主细胞”。
在一些实施例中,通过转化将多核苷酸的文库引入宿主细胞。用于转化宿主细胞的方案是本领域已知的。例如,对于细菌细胞,有基于电穿孔的方法、基于脂质转染的方法、基于热休克的方法、基于玻璃珠搅拌的方法、基于化学转化的方法、基于用外源材料(例如DNA或RNA包覆的颗粒进行轰击的方法等。本领域普通技术人员将能够基于宿主细胞制造商提供的技术和/或方案来选择方法。
例如,转化的宿主细胞各自可包括编码目的多肽的一个版本或用作目的多核苷酸的一个版本的模板的多核苷酸。
可将多核苷酸的文库引入宿主细胞群中,使得转化的宿主细胞群共同包括文库的所有成员。也就是说,对于文库中的每个版本的多核苷酸,群体中的至少一个宿主细胞包括该版本的多核苷酸,使得文库中的多核苷酸的所有版本都在转化的宿主细胞群中表示。
噬菌体
在将多核苷酸的文库引入宿主细胞的步骤之后,本披露的方法可包括提供多种噬菌体,所述噬菌体包含编码第一选择剂并包含DNA靶位点的噬菌粒。
噬菌体是感染细菌并将其基因组(和/或包装在噬菌体中的任何噬菌粒)注入细菌细胞质中的病毒。通常,尽管存在复制缺陷型噬菌体,噬菌体在细菌内复制。
在一些实施例中,在允许噬菌体感染转化的宿主细胞的条件下,将包含本文所述的噬菌粒的多种噬菌体与转化的宿主细胞一起孵育。噬菌体可以具有复制能力,例如,噬菌体在转化的宿主细胞内复制,并且复制的病毒颗粒以病毒体的形式释放于培养基中,从而允许其他宿主细胞被噬菌体再感染。
病毒体可以从宿主细胞中释放出来而无需裂解宿主细胞。
在一些实施例中,多个噬菌体连续感染(感染和再感染)转化的宿主细胞,从而对宿主细胞发起连续的挑战。
噬菌体可以是“辅助噬菌体”,因为相比噬菌体DNA它们优先包装噬菌粒。例如,噬菌体可以优先以超过噬菌体DNA至少3:1、至少4:1、至少5:1、至少6:1、至少7:1、至少8:1、至少9:1或至少10:1倍包装噬菌粒。
在一些实施例中,噬菌体通常不裂解其宿主细胞,例如,在将转化的宿主细胞与多个噬菌体一起孵育的条件下,噬菌体不裂解其宿主细胞。
噬菌体可以是丝状噬菌体。丝状噬菌体通常感染革兰氏阴性细菌(其尤其包括大肠杆菌、铜绿假单胞菌、淋病奈瑟氏球菌和鼠疫耶尔森氏菌)并且具有单链DNA基因组。
例如,丝状噬菌体可以是Ff噬菌体,其感染携带F附加体的大肠杆菌。这种噬菌体的实例包括但不限于M13噬菌体、f1噬菌体、fd噬菌体及其衍生物和变体。
另外地或可替代地,噬菌体可以是M13噬菌体或其衍生物或变体,例如,噬菌体可以是M13KO7,其是M13的具有卡那霉素抗性标记和p15A复制起点的衍生物。M13KO7已经被表征为具有大约10:1的高噬菌粒与噬菌体包装比,从而用作有用的辅助噬菌体。
另外地或可替代地,噬菌体可以是VCSM13,其是M13KO7的衍生物。
噬菌体也可以是f1噬菌体或其衍生物或变体。例如,噬菌体可以是R408,它是f1的衍生物,没有任何抗生素选择标记。
另外地或可替代地,噬菌体可以是CM13,其是M13KO7的一种衍生物,据报道比M13KO7更可靠地产生病毒体。
包含不同噬菌粒的噬菌体的池也可以用于本披露的方法中。例如,如本文进一步讨论的,当期望例如选择在一个以上的脱靶位点处抗结合和/或切割时,可以将不同的脱位靶标呈现在同一噬菌体池中所包含的不同噬菌粒上。
噬菌粒
噬菌粒是具有从f1噬菌体复制的f1起点的环状质粒,因此可以作为质粒复制并通过噬菌体包装成单链DNA。噬菌粒还包含用于双链复制的复制起点(例如,在宿主细胞内部时)。
适用于本发明的噬菌粒通常编码选择剂或用作选择剂的模板,并包含DNA靶位点。因此,用于本发明的噬菌粒通常包含与编码选择剂或用作选择剂模板的基因元件可操作地连接并驱动其表达的调节元件。
如上所述,DNA靶位点可包含在噬菌粒内的任何地方。例如,DNA靶位点可以位于调节元件内、位于基因元件内、位于调节元件和基因元件两者的外部和远侧、或位于两个元件的外部但靠近至少一个元件。
DNA靶位点的位置可以取决于实施例。例如,DNA靶位点可以位于调节元件内。例如,在其中目的多肽是转录因子(例如转录激活物或阻遏物)并且选择是基于转录因子是否结合DNA靶位点的实施例中,这种定位可能是合适的。
对DNA靶位点位于何处没有限制,因为目的多肽在噬菌粒内任何地方的结合都会增加或减少选择剂的表达。例如,目的多肽在DNA靶位点处的结合可导致在DNA靶位点处或附近的噬菌粒的切割。噬菌粒内任何地方的噬菌粒的切割将引起噬菌粒的线性化,这将导致噬菌粒不在宿主细胞内复制,因此废除了选择剂的表达。
噬菌粒可以使用本领域已知的方法包装到噬菌体中,包括噬菌体制造商提供的方案。例如,常用的方案是制备所需噬菌粒构建体的双链质粒版本,将双链质粒转化入宿主细胞如细菌中,然后用可将双链质粒包装为单链噬菌粒的辅助噬菌体接种这种转化的宿主细胞的培养物。
培养条件
在提供包含编码第一选择剂并包括DNA靶位点的噬菌粒的多个噬菌体的步骤之后,本披露的方法可以包括在培养条件下将转化的宿主细胞(将多核苷酸的文库引入其中)连同多种噬菌体一起孵育使用,使得多种噬菌体感染转化的宿主细胞的步骤。通常,取决于实施例,这些条件是其中第一选择剂的表达赋予存活劣势或存活优势的条件。
在某些实施例中,培养条件是竞争性培养条件。“竞争性培养条件”是指一群生物体(例如宿主细胞)一起生长并且必须竞争相同的有限资源(例如营养物、氧等)的条件。
宿主细胞可以在没有或几乎没有新营养物输入的环境中孵育。例如,可以在没有或几乎没有新氧输入的环境中,例如在诸如烧瓶的密封容器中孵育宿主细胞。
另外地或可替代地,可以将宿主细胞在整个孵育过程中充分混合的培养基中孵育,例如摇动液体培养。通常,在这种充分混合的条件下,宿主细胞具有相似的营养需求,并且随着营养物和/或氧被不断增长的群体消耗,它们将竞争营养物和/或氧(对于有氧生物而言)。
另外地或可替代地,可以在近似恒定的温度下,例如在最适合宿主细胞类型的温度下孵育宿主细胞。例如,对于某些细菌物种(包括大肠杆菌),通常将宿主细胞在37℃左右的温度下孵育。在一些实施例中,将宿主细胞在37℃上下5℃、4℃、3℃、2℃或1℃内,例如在约37℃下孵育。
可以在摇动的液体培养物中孵育宿主细胞。这种摇动通常足够剧烈以防止营养物的不均匀分布和/或某些宿主细胞在培养物底部沉降。例如,可以将宿主细胞以至少100rpm(每分钟转数)、至少125rpm、至少150rpm、至少175rpm、至少200rpm、至少225rpm、至少250rpm、至少275rpm、或至少300rpm摇动。在一些实施例中,宿主细胞在100rpm和400pm之间,例如在200和350rpm之间,例如在大约300rpm下摇动。
在将多种噬菌体引入培养物中之前,可以将宿主细胞孵育一段时间。这段时间可以例如允许宿主细胞群体在引入多种噬菌体之前从储存中恢复和/或达到特定的理想密度。在引入多种噬菌体之前的这段时间中,可以使用选择压力,也可以不使用选择压力。
培养条件可包括,例如,经一段时间,例如至少4小时、至少8小时、至少12小时或至少16小时,将宿主细胞与噬菌体一起连续孵育。另外地或可替代地,培养条件可以包括将宿主细胞与噬菌体一起连续孵育直至宿主细胞的生长饱和。
培养条件可允许噬菌体连续感染宿主细胞。即,在孵育期间,宿主细胞被感染并连续地被再感染(如果它们存活)。
另外地或可替代地,选择压力被引入培养物中。例如,特别是对于用外源DNA(例如质粒)转化的宿主细胞,可以引入选择压力以有利于那些保持外源DNA的宿主细胞。常用的方案包括使用一种或多种抗生素作为选择压力,以及在有待维持的外源DNA中的相应抗生素抗性基因。所述选择压力可以与涉及本文所讨论的选择剂的相同或不同,并且在一些实施例中,两者例如依次和/或同时使用。
在一些实施例中,在转化的宿主细胞与噬菌体一起孵育的至少一段时间内,培养条件包括暴露于一种或多种抗生素,一些宿主细胞由于存在于噬菌粒上的抗生素抗性基因、文库中的多核苷酸或两者而可能对所述一种或多种抗生素具有抗性。例如,文库中的噬菌粒和多核苷酸都可以具有抗生素抗性基因,例如,抗生素抗性基因可以相同或不同。如果噬菌粒包含一个抗生素抗性基因(赋予对“第一抗生素”的抗性的“第一抗生素抗性基因”)并且多核苷酸包含另一个抗生素抗性基因(赋予对“第二抗生素”的抗性的“第二抗生素抗性基因”),培养条件可以包括多种方案中的任何一种。作为非限制性实例,这些条件可以包括:1)同时暴露于第一抗生素和第二抗生素;2)相继暴露于第二抗生素持续一段时间(例如,在将噬菌体引入培养物之前先孵育宿主细胞的时间段内),然后暴露于i)第一抗生素或ii)第一抗生素和第二抗生素两者(例如,在宿主细胞与噬菌体一起孵育的时间段内);或3)在孵育过程中暴露于相关抗生素中的仅一种(例如第一抗生素)。
选择剂
本文所述的方法可包括提供多个噬菌体的步骤,所述噬菌体包含编码或用作选择剂模板的噬菌粒。取决于实施例,在宿主细胞与噬菌体一起孵育的条件下,选择剂可以赋予宿主细胞存活优势或存活劣势。在宿主细胞与噬菌体孵育的条件下,选择剂可以将细胞生长动力学的增加或细胞生长动力学的降低赋予宿主细胞。
选择剂可以是例如多肽和/或多核苷酸。
在一些实施例中,选择剂赋予宿主细胞存活优势。
在一些实施例中,选择剂由宿主细胞存活必需的基因编码。这样的必需存活基因的实例包括但不限于参与脂肪酸生物合成的基因;参与氨基酸生物合成的基因;参与细胞分裂的基因;参与总体调节功能的基因;参与蛋白质翻译和/或修饰的基因;参与转录的基因;参与蛋白质降解的基因;编码热休克蛋白的基因;参与ATP运输的基因;参与肽聚糖合成的基因;参与DNA复制、修复和/或修饰的基因;参与tRNA修饰和/或合成的基因;和编码核糖体组分和/或参与核糖体合成的基因)。例如,在大肠杆菌中,许多必需存活基因是本领域已知的,包括但不限于accD(乙酰辅酶A羧化酶,羧基转移酶组分,β亚基)、acpS(辅酶A:载脂蛋白-[酰基-载体-蛋白]泛酰巯基乙胺磷酸转移酶)、asd(天冬氨酸-半醛脱氢酶)、dapE(N-琥珀酰-二氨基庚二酸脱酰基酶)、dnaJ(带DnaK的分子伴侣;热休克蛋白)、dnaK(分子伴侣Hsp70)、era(GTP结合蛋白)、frr(核糖体释放因子)、ftsI(隔膜形成;青霉素结合蛋白3;肽聚糖合成酶)、ftsL细胞分裂蛋白;隔膜壁向内生长);ftsN(必需细胞分裂蛋白);ftsZ(细胞分裂;形成圆周环;微管蛋白样GTP结合蛋白和GTP酶)、gcpE、grpE(噬菌体λ复制;宿主DNA合成;热休克蛋白;蛋白质修复)、hflB(降解sigma32,整合膜肽酶,细胞分裂蛋白)、infA(蛋白链起始因子IF-1)、lgt(磷脂酰甘油原脂蛋白二酰基甘油基转移酶;主要膜磷脂)、lpxC(UDP-3-O-酰基N-乙酰基葡糖胺脱乙酰基酶;脂质A生物合成)、map(蛋氨酸氨基肽酶)、mopA(GroEL,分子伴侣Hsp60,肽依赖性ATP酶,热休克蛋白)、mopB(GroES,10Kd分子伴侣结合pres.Mg-ATP中的Hsp60,抑制其ATP酶活性)、msbA ATP结合转运蛋白;htrB的多拷贝抑制剂)、murA(胞壁质生物合成的第一步;UDP-N-葡糖胺1-羧基乙烯基转移酶)、murI(谷氨酸消旋酶、D-谷氨酸和肽聚糖的生物合成所必需)、nadE(NAD合成酶,相比谷氨酰胺偏好NH3)、nusG(转录抗终止中的组分)、parC(DNA拓扑异构酶IV亚基A)、ppa(无机焦磷酸酶)、proS(脯氨酸tRNA合成酶)、pyrB(天冬氨酸氨基甲酰基转移酶,催化亚基)、rpsB(30S核糖体亚基蛋白S2)、trmA(tRNA(尿嘧啶5-)-甲基转移酶)、ycaH、ycfB、yfiL、ygjD(假定的O-唾液酸糖蛋白内肽酶)、yhbZ(假定的GTP结合因子)、yihA和yjeQ。大肠杆菌中的其他必需基因包括Gerdes 2003的“大肠杆菌MG1655中的必需基因的实验确定和系统级分析”中列出的那些基因,例如在增补表1、2和6中的那些。
在一些实施例中,选择剂由抗生素抗性基因编码,如下文进一步讨论的。例如,培养条件可以包括暴露于抗生素抗性基因对其提供抗性的抗生素。
在一些实施例中,选择剂抑制赋予存活劣势的基因产物。
在某些实施例中,选择剂赋予宿主细胞存活劣势。选择剂可能对宿主细胞有毒。例如,选择剂可以是毒素,许多毒素是本领域已知的,并且许多毒素已经在各种细菌物种中鉴定出来。此类毒素的实例包括但不限于ccdB、FlmA、fst、HicA、Hok、Ibs、Kid、LdrD、MazF、ParE、SymE、Tisb、TxpA/BrnT、XCV2162、yafO、Zeta和tse2。例如,选择剂可以是在大肠杆菌中发现的ccdB。在其他实例中,选择剂是tse2。
选择剂可能有毒,因为它会产生有毒物质。例如,有毒物质的产生只能在另一种试剂的存在下发生,该试剂的存在可以外部控制或可以不受外部控制。
另外地或可替代地,选择剂可以抑制赋予存活优势的基因产物。作为非限制性实例,选择剂可以是β-内酰胺酶抑制蛋白(BLIP),其尤其抑制β-内酰胺酶,例如氨苄青霉素和青霉素。
诱导剂
本文所述的方法可包括提供多核苷酸的文库的步骤,其中该文库中的不同多核苷酸编码不同版本的目的多肽(或在目的多核苷酸的情况下,用作不同版本的目的多核苷酸的模板)。多核苷酸可以包括例如调节元件,例如可以控制多肽表达的启动子。调节元件可以是诱导型启动子,并且表达可以由诱导剂诱导。这样的诱导剂和/或诱导的表达可以增加或改善选择效率。
诱导剂可以是多肽和/或多核苷酸。诱导剂也可以是小分子、光、温度或胞内代谢物。
在一些实施例中,诱导剂是阿拉伯糖、脱水四环素、乳糖、IPTG、丙酸酯、蓝光(470nm)红光(650nm)、绿光(532nm)或L-鼠李糖。例如,诱导剂可以是阿拉伯糖。
编码不同版本Cas9分子的多核苷酸的文库
在一些实施例中,本发明的方法和组合物可以与编码不同版本的Cas9分子或Cas9多肽的多核苷酸的文库(例如,横跨Cas9分子或Cas9多肽的全部或部分的Cas9突变体的全面且无偏见的文库)一起使用。在某些实施例中,本发明的方法和组合物可以用于基于特定性质选择文库的一个或多个成员。在典型的实施例中,Cas9分子或Cas9多肽具有与gRNA分子相互作用,并且与所述gRNA分子一起定位至核酸中的位点的能力。其他活性(例如,PAM特异性、切割活性、或解旋酶活性)在Cas9分子和Cas9多肽中可以更广泛地变化。
在一些实施例中,本发明的方法和组合物可以用于选择Cas9分子或Cas9多肽的一种或多种版本,所述版本包括改变的酶学性质,例如改变的核酸酶活性或改变的解旋酶活性(与天然存在的或其他参考Cas9分子(包括已经过工程化或更改的Cas9分子)相比))。如本文所述,参考Cas9分子或Cas9多肽的突变版本可以具有切口酶活性或没有切割活性(与双链核酸酶活性相反)。在实施例中,本发明的方法和组合物可以用于选择Cas9分子或Cas9多肽的一种或多种版本,所述版本具有改变其大小的改变,例如减小其大小的氨基酸序列的缺失(例如,对一种或多种或对任何Cas9活性具有或不具有显著影响)。在实施例中,本发明的方法和组合物可以用于选择识别不同PAM序列的Cas9分子或Cas9多肽的一种或多种版本(例如,可以选择识别不同于参考Cas9分子的内源性野生型PI域所识别的PAM序列的Cas9分子版本)。
可以使用任何方法来制备具有不同版本的Cas9分子或Cas9多肽的文库,例如通过改变亲本(例如天然存在的)Cas9分子或Cas9多肽,以提供经改变的Cas9分子或Cas9多肽的文库。例如,可以相对于亲本Cas9分子(例如,天然存在的或工程化的Cas9分子)引入一个或多个突变或差异。此类突变和差异包括:取代(例如保守取代或非必需氨基酸取代);插入;或缺失。在实施例中,本发明文库中的Cas9分子或Cas9多肽相对于参考(例如,亲本)Cas9分子可以包含一个或多个突变或差异,例如,至少1、2、3、4、5、10、15、20、30、40或50个突变但少于200、100或80个突变。
指导RNA分子的文库
在一些实施例中,本披露的方法和组合物可以与指导RNA分子和/或编码指导RNA分子的多核苷酸的文库一起使用。例如,可以提供和/或产生包括各自编码指导RNA的DNA分子的文库,所述指导RNA具有(i)本文所述的不同靶向域;(ii)本文所述的不同的第一和/或第二互补域;和/或(iii)本文所述的不同茎环。如本文所述,可将文库引入宿主细胞。在一些实施例中,还将编码RNA指导的核酸酶,例如Cas9分子或Cas9多肽的核酸引入到宿主细胞中。
在某些实施例中,本披露的方法和组合物可用于基于特定性质,例如定位于核酸中的位点和/或与Cas9分子或Cas9多肽相互作用和/或将Cas9分子或Cas9多肽定位到核酸中的位点的能力,来选择指导RNA文库的一个或多个成员。
可以使用任何方法来制备具有不同版本的指导RNA的文库,例如,通过改变亲本(例如,天然存在的)指导RNA,以提供改变的指导RNA的文库。例如,可以相对于亲本指导RNA(例如,天然存在的或工程化的指导RNA)引入一个或多个突变或差异。此类突变和差异包括:取代;插入;或缺失。在一些实施例中,本披露的文库中指导RNA相对于参考,例如亲本指导RNA可以包含一个或多个突变或差异,例如,至少1、2、3、4、5、10、15、20、30、40或50个突变但少于200、100或80个突变。
DNA靶位点
通常,用于特定发明方法的DNA靶位点可以取决于DNA靶位点的物理位置(例如,在某些方面,DNA靶位点可以位于噬菌粒上,而在其他方面,DNA靶位点可以位于宿主细胞基因组中)、目的多肽或多核苷酸的性质、选择过程的性质和/或选择过程的所需结果。DNA靶位点可以位于多种类型的核苷酸序列内。例如,在一些实施例中,DNA靶位点可位于未转录的元件内、位于编码多肽或用作多核苷酸的模板(例如,非编码RNA)的元件内、位于控制多肽的表达的调节元件内等。
如本文所述,在一些实施例中,DNA靶位点可以位于噬菌粒上。在一些实施例中,DNA靶位点可以位于质粒上。在选择过程依赖于噬菌粒或质粒的切割(或不切割)的情况下,DNA靶位点可以位于噬菌粒或质粒上的任何位置,因为选择取决于噬菌粒或质粒的线性化(以及随后的破坏),所述线性化可能是由于噬菌粒或质粒上任何位置的切割所致。在选择过程依赖于选择剂表达的抑制(或激活)的情况下,DNA靶位点可以位于驱动选择剂表达的调节元件内。在一些实施例中,调节元件可以是诱导型调节元件。
如本文所述,在一些实施例中,DNA靶位点可以位于宿主细胞基因组内。在选择过程依赖于宿主细胞存活必需的内源基因(“必需基因”)的切割的情况下,DNA靶位点可以例如位于必需基因的编码或调节元件内。在选择过程依赖于必需基因的抑制的情况下,DNA靶位点可以位于宿主细胞基因组中与目的多肽结合时导致必需基因被抑制的任何位置(例如,必需基因的在调节元件内,在必需基因的启动子和编码区之间等)。
DNA靶位点的特定核苷酸序列(即与位于噬菌粒上或是宿主细胞基因组内的位点分离并分开)通常取决于目的多肽的性质、选择过程的性质和选择过程的期望结果。举例来说,当目的多肽是识别第一核苷酸序列的参考核酸酶(例如,大范围核酸酶、TALEN或锌指核酸酶)且本发明方法用于选择参考核酸酶的一个或多个经修饰版本(其选择性结合不同于第一核苷酸序列(例如在1、2、3个等碱基处)的第二核苷酸序列)时,本发明的方法可涉及在阳性选择步骤使用与第二核苷酸序列相对应的DNA靶位点和在阴性选择步骤中使用与第一核苷酸序列相对应的DNA靶位点(即,选择结合第二核苷酸序列但不结合第一核苷酸序列的参考核酸酶的版本)。
对于Cas分子(例如,Cas9分子),将部分基于Cas分子上的PAM和用于将Cas分子定位在DNA靶位点处的gRNA的靶向域的序列确定DNA靶位点。举例来说,当目的多肽是识别第一PAM序列的Cas9分子且本发明方法用于选择参考Cas9分子的一个或多个经修饰版本(其选择性识别不同于第一PAM序列(例如在1、2、3个等碱基处)的第二PAM序列)时,本发明的方法可涉及在阳性选择步骤使用与第二PAM序列相对应的DNA靶位点和在阴性选择步骤中使用与第一PAM序列相对应的DNA靶位点(即,选择识别第二PAM序列但不识别第一PAM序列的参考Cas9分子的版本)。在两种情况下,DNA靶位点还将包括与用于将Cas9分子定位在DNA靶位点处的gRNA的靶向域的序列互补的序列。
在一些实施例中,本文提供的方法可用于评估PAM变体通过RNA指导的核酸酶例如酿脓链球菌Cas9直接切割靶位点的能力。
在一些实施例中,文库包含多个核酸模板,所述模板进一步包括含有与靶位点相邻的PAM变体的核苷酸序列。在一些实施例中,PAM序列包含序列NGA、NGAG、NGCG、NNGRRT、NNGRRA或NCCRRC。
本文提供的一些方法允许针对任何给定靶位点同时评估多个PAM变体,并且在一些实施例中,与变体酿脓链球菌Cas9组合进行。因此,从此类方法获得的数据可用于汇编介导特定靶位点的切割的PAM变体(与野生型酿脓链球菌Cas9或变体酿脓链球菌Cas9组合)的列表。在一些实施例中,测序方法用于产生定量测序数据,并且可以确定由特定PAM变体介导的特定靶位点的切割的相对丰度。
抗生素抗性基因
在某些实施例中,文库和/或噬菌粒中的质粒包含抗生素抗性基因。在一些实施例中,抗生素抗性基因赋予对杀死或抑制细菌例如大肠杆菌生长的抗生素的抗性。此类抗生素的非限制性实例包括氨苄青霉素、博来霉素、羧苄青霉素、氯霉素、红霉素、卡那霉素、青霉素、多粘菌素B、壮观霉素、链霉素和四环素。多种抗生素抗性基因盒是本领域已知的和/或可商购的,例如作为质粒中的元件。例如,存在许多具有ampR(氨苄青霉素抗性)、bleR(博来霉素抗性)、carR(羧苄青霉素抗性)、cmR(氯霉素抗性)、kanR(卡那霉素抗性)和/或tetR(四环素抗性)的质粒或基因元件。抗生素抗性基因的另一个实例是β-内酰胺酶。
在一些实施例中,噬菌粒包含第一抗生素抗性基因,并且文库中的质粒包含第二抗生素抗性基因。在一些实施例中,第一抗生素抗性基因不同于第二抗生素抗性基因。例如,在一些实施例中,第一抗生素抗性基因是cmR(氯霉素抗性)基因,且第二抗生素抗性基因是ampR(氨苄青霉素抗性)基因。
调节元件
在某些实施例中,基因元件(例如像,编码选择剂的那些、抗生素抗性基因、多肽、多核苷酸等)可操作地连接至调节元件,以允许表达一种或多种其他元件,例如选择剂、抗生素抗性基因、多肽、多核苷酸等。
在一些实施例中,噬菌粒包括驱动所述噬菌粒上的一种或多种基因元件例如选择剂的表达的调节元件。
在一些实施例中,文库中的多核苷酸包括调节元件,所述调节元件驱动多核苷酸上的一个或多个基因元件(例如,目的多肽或多核苷酸,以及如果存在的话,编码选择剂如抗生素抗性基因的基因元件)的表达。
存在各种各样的基因调节元件。所使用的调节元件的类型可以取决于例如宿主细胞、要表达的基因的类型、其他因素(例如使用的转录因子)等。
基因调节元件包括但不限于增强子、启动子、操纵子、终止子等,以及它们的组合。作为非限制性实例,调节元件可包含启动子和操纵子两者。
在一些实施例中,调节元件是组成型的,因为它在细胞中的所有情况下都是有活性的。例如,诸如组成型启动子的组成型元件可以用于表达基因产物而无需额外的调节。
在一些实施例中,调节元件是诱导型的,即,其仅响应于特定刺激才是有活性的。
例如,可以通过在IPTG(异丙基β-D-1-硫代吡喃半乳糖苷)的作用下使其具有活性来诱导lac操纵子。另一个实例是在阿拉伯糖存在下使其具有活性的阿拉伯糖启动子。
在一些实施例中,调节元件是双向型的,它可以驱动序列中位于其另一侧的基因的表达。因此,在一些实施例中,至少两个基因元件的表达可以由相同的基因元件驱动。
用作调节元件的基因片段在本领域中是容易获得的,并且许多可以从供应商处购得。例如,已经包含用以表达目的基因片段的一种或多种调节元件的表达质粒或其他载体是容易获得的。
分析多肽和/或多核苷酸的选定版本
一轮或多轮选择后,可以从在选择中存活下来的宿主细胞中回收多肽和/或多核苷酸的选定版本并进行分析。在使用一个以上进化循环(诱变后进行一个或多个选择轮次)的示意图中,此分析可以在每次循环结束时或仅在某些循环中进行。
分析类型的实例包括但不限于测序、结合和/或切割测定(包括体外测定)、宿主细胞类型以外的细胞类型中选定版本的活性的验证。
作为非限制性实例,可以进行下一代(也称为高通量测序)以对所有或大多数所选变体进行测序。
在一些实施例中,进行深度测序,这意味着每个核苷酸在测序过程中被读取几次,例如以大于至少7、至少10、至少15、至少20或更大的深度读取,其中如下计算深度(D):
D=N×L/G (等式1),
其中N是读段的数目,L是原始基因组的长度,且G是进行测序的多核苷酸的长度。
在一些实施例中,使用桑格(Sanger)测序分析至少一些选定版本。
序列分析可用于例如检查指示选定版本的富集的氨基酸残基或核苷酸。
可替代地或另外地,可以从例如单个宿主细胞集落(例如细菌集落)中对所选版本的样品进行测序。
结合和/或切割测定是本领域已知的。这些测定中的一些是在体外进行的,例如使用细胞组分或分离的分子(例如多肽、多核苷酸或核糖核蛋白)而不是整个细胞。
在一些实施例中,进行用于DNA底物的结合和/或切割的体外测定。在一些实施例中,测定测试从一轮或多轮选择存活的宿主细胞中提取的裂解物的活性。在一些实施例中,测定测试从一轮或多轮选择存活的宿主细胞中提取的多肽、多核苷酸和/或核糖核蛋白、或其复合物的活性。
在一些实施例中,分析包括进行一种或多种测定以测试文库中所选版本的多核苷酸的产物(例如,由所选版本编码的多肽或其模板为所选版本的多核苷酸)的一种或多种功能。
用途
在一些实施例中,本发明的选择方法与产生质粒文库的诱变方法一起使用。任何诱变方法可以与本发明的选择方法一起使用。
在一些实施例中,使用一轮诱变,然后进行一轮或多轮选择。该循环可以进行一次,或者可以例如作为定向进化策略的一部分重复一次或多次,其中将在一个循环中选择的目的多肽和/或多核苷酸的版本在下一个循环的轮次中诱变。循环可以根据需要重复多次,例如直到获得的目的多肽和/或多核苷酸的选定版本满足特定标准和/或直到获得满足特定标准的所需数目的选定多肽和/或多核苷酸。
在一些实施例中,在一个循环中,一轮诱变之后是一轮阳性选择(例如,针对裂解和/或结合DNA靶位点的目的多肽和/或多核苷酸的版本)。
在一些实施例中,在一个循环中,一轮诱变之后是一轮阳性选择,其后是一轮阴性选择(例如,针对不切割和/或不结合DNA靶位点的目的多肽和/或多核苷酸的版本)。
在一些实施例中,在一个循环中,一轮诱变之后是一轮阴性选择,其后是一轮阳性选择。
在其中执行超过一轮的实施例中,就诱变和选择轮次而言,循环不必具有相同的示意图。另外,其他细节在两次循环之间不必相同,例如,诱变的方法在一次循环至下次循环之间不必相同,选择轮次的确切条件或示意图也不必相同。
因此,本披露的选择方法可以用于选择具有期望的结合和/或切割位点特异性的目的多肽和/或多核苷酸。
例如,选择方法可用于选择结合一个等位基因但不结合另一等位基因的目的多肽和/或多核苷酸。例如,区分疾病等位基因和野生型等位基因的能力可用于例如基于基因编辑、基因抑制和/或基因激活技术来开发疗法。在一些实施例中,例如,进行阳性选择以选择识别一个等位基因(例如,疾病等位基因)的目的多肽或多核苷酸,然后进行阴性选择以选择识别另一个等位基因(例如,野生型等位基因)的目的多肽或多核苷酸。在一些实施例中,进行阴性选择以选择识别一个等位基因(例如,野生型等位基因)的目的多肽和/或多核苷酸,然后进行阳性选择以选择识别其他等位基因(例如,疾病等位基因)的目的多肽或多核苷酸。
如实例中所示,本发明的选择方法已用于进化方案中,以进化出具有区分仅一个碱基改变的等位基因的能力的多肽。
作为另一个实例,例如,与天然存在的目的多肽和/或多核苷酸相比,选择方法可以用于选择具有改变的结合偏好的目的多肽和/或多核苷酸。例如,某些DNA结合蛋白(包括酶)具有非常有限的结合特异性,因此限制了它们的用途。选择和/或进化具有改变的结合特异性(例如,与天然存在的目的多肽和/或多核苷酸的结合特异性相比)的位点特异性DNA结合域或蛋白质可以增加其使用范围。
在一些实施例中,进行阳性选择以选择识别一个DNA靶位点(例如,期望的新靶位点)的目的多肽和/或多核苷酸,然后进行阴性选择以选择识别另一个DNA靶位点(例如天然靶位点)的目的多肽和/或多核苷酸。
在一些实施例中,进行阳性选择以选择识别一个DNA靶位点(例如,期望的新靶位点)的目的多肽和/或多核苷酸,并且不进行阴性选择。
在一些实施例中,进行阴性选择以选择识别一个DNA靶位点(例如天然靶位点)的目的多肽和/或多核苷酸,然后进行阳性选择以选择识别另一个DNA靶位点(例如,所需的新靶位点)的目的多肽和/或多核苷酸。
作为另一个实例,选择方法可以用于选择具有降低的脱靶活性的目的多肽或多核苷酸。尽管某些DNA结合蛋白被分类为对特定识别序列具有特异性,但有些可能表现出混杂性,因为它们在某种程度上与一个或多个脱靶位点结合。
在一些实施例中,例如,进行阴性选择以选择不识别一个或多个脱靶位点的目的多肽或多核苷酸。当期望针对超过一个的脱靶位点进行选择时,在一些实施例中,使用包含不同噬菌粒的噬菌体池,其中每个不同的噬菌粒均包含对应于脱靶位点之一的DNA靶位点。由于在孵育步骤中宿主细胞可能会被各种噬菌体一次又一次地感染,因此能够在单轮阴性选择中针对多个脱靶处的结合或切割进行选择。
在一些实施例中,例如,进行阳性选择以选择识别特定识别序列的目的多肽或多核苷酸,然后进行阴性选择以选择识别一个或多个脱靶位点的目的多肽和/或多核苷酸。在一些实施例中,进行阴性选择以选择识别一个或多个脱靶位点的目的多肽或多核苷酸,然后进行阳性选择以选择识别特定识别序列的目的多肽或多核苷酸。
在其中在一个循环中使用超过一轮选择(例如,阳性选择轮然后是阴性选择轮)的一些实施例中,方法包括在选择轮之间使宿主细胞粒化(例如,通过离心)的步骤。这样的粒化步骤可以例如去除在先前的选择轮次中使用的试剂(例如抗生素、基因表达的诱导物如IPTG等)。
使用本文所述方法鉴定的变体核酸酶可用于遗传工程化细胞群。为了改变或设计细胞群,可将细胞与本文所述的变体核酸酶或能够表达变体核酸酶的载体和指导核酸接触。如本领域中已知的,指导核酸将具有与细胞基因组的靶核酸上的靶序列互补的区域。在一些实施例中,变体核酸酶和指导核酸以核糖核酸蛋白(RNP)施用。在一些实施例中,RNP以1x 10-4μM至1μM RNP的剂量施用。在一些实施例中,少于1%、少于5%、少于10%、少于15%或少于20%的改变包括细胞群中脱靶序列的改变。在一些实施例中,大于70%、大于75%、大于80%、大于85%、大于90%、大于95%、大于98%、大于99%的交替包括细胞群中的中靶序列的变化。
使用本文所述方法鉴定的变体核酸酶可用于编辑双链DNA(dsDNA)分子的群体。为了编辑dsDNA分子的群体,可使分子与本文所述的变体核酸酶和指导核酸接触。如本领域已知的,指导核酸将具有与dsDNA的靶序列互补的区域。在一些实施例中,变体核酸酶和指导核酸以核糖核酸蛋白(RNP)施用。在一些实施例中,RNP以1x 10-4μM至1μM RNP的剂量施用。在一些实施例中,少于1%、少于5%、少于10%、少于15%或少于20%的编辑包括dsDNA分子群体中脱靶序列的编辑。在一些实施例中,大于70%、大于75%、大于80%、大于85%、大于90%、大于95%、大于98%、大于99%的编辑包括dsDNA分子的群体中的中靶序列的编辑。
基因组编辑系统的实施方式:递送、配制和施用途径
如上文所讨论的,本披露的基因组编辑系统可以用任何适宜方式来实施,意味着此类系统的组分(包括但不限于RNA指导的核酸酶(例如本文所述的RNA指导的核酸酶变体)、gRNA和任选供体模板核酸)可以用任何适宜形式或形式的组合来递送、配制或施用,从而在细胞、组织或受试者中(例如,离体或体内)导致基因组编辑系统的转导、表达或引入和/或引起所需的修复结果。表2和3展示基因组编辑系统实施方式的若干非限制性实例。但本领域技术人员将了解,这些列表不是全面性的,并且其他实施方式是可能的。在一些实施例中,本文所述的一种或多种组分在体内递送/施用。在一些实施例中,本文所述的一种或多种组分离体递送/施用。例如,在一些实施例中,将本文所述的编码RNA指导的核酸酶变体的RNA(例如,mRNA)体内或离体递送/施用至细胞。在一些实施例中,本文所述的RNA指导的核酸酶变体以与gRNA或不与gRNA一起的核糖核蛋白(RNP)复合物体内或离体递送/施用至细胞。尤其参照表2,该表列示包含单一gRNA和任选供体模板的基因组编辑系统的若干示例性实施方式。然而,根据本披露的基因组编辑系统可以并入多个gRNA、多个RNA指导的核酸酶(例如,本文所述的多个RNA指导的核酸酶变体)和其他组分例如蛋白质,并且基于表2中所示的原理多种实施方式对于技术人员将是显而易见的。在表2中,“[N/A]”指示基因组编辑系统不包括所指示的组分。
表2
Figure BDA0002379002290000481
Figure BDA0002379002290000491
表3总结了用于如本文所述的基因组编辑系统的组分的各种递送方法。同样,该列表旨在是示例性而不是限制性的。
表3
Figure BDA0002379002290000501
基因组编辑系统的基于核酸的递送
可以通过本领域已知的方法或如本文所述将编码根据本披露的基因组编辑系统的各种元件的核酸施用于受试者或递送至细胞。例如,编码RNA指导的核酸酶(例如,本文所述的RNA指导的核酸酶变体)和/或编码gRNA的DNA,以及供体模板核酸可以由例如载体(例如,病毒或非病毒载体)、基于非载体的方法(例如,使用裸DNA或DNA复合物)或其组合递送。
编码基因组编辑系统或其组分的核酸可以作为裸DNA或RNA(例如mRNA)直接递送至细胞,例如借助转染或电穿孔来递送,或者可以缀合至促进靶细胞(例如,红细胞、HSC)摄取的分子(例如,N-乙酰半乳糖胺)。也可以使用核酸载体,例如表3中总结的载体。
核酸载体可以包含编码基因组编辑系统组分(例如RNA指导的核酸酶(例如本文所述的RNA指导的核酸酶变体)、gRNA和/或供体模板)的一个或多个序列。载体还可以包含编码信号肽(例如,用于核定位、核仁定位或线粒体定位)的序列,其与编码蛋白质的序列缔合(例如插入其中或与其融合)。作为一个实例,核酸载体可以包括Cas9编码序列,其包括一个或多个核定位序列(例如,来自SV40)。
核酸载体还可以包括任何适宜数目的调节/控制元件,例如,启动子、增强子、内含子、多聚腺苷酸化信号、科扎克(Kozak)共有序列或内部核糖体进入位点(IRES)。这些元件为本领域中所熟知,并且描述于Cotta-Ramusino中。
根据本披露的核酸载体包括重组病毒载体。示例性病毒载体展示于表3中,并且其他适宜病毒载体以及其使用和产生描述于Cotta-Ramusino中。还可以使用本领域已知的其他病毒载体。另外,可以使用病毒颗粒来递送呈核酸和/或肽形式的基因组编辑系统组分。例如,可以组装“空”病毒颗粒以含有任何适宜负荷。病毒载体和病毒颗粒也可以经工程化以并入靶向配体,从而改变靶组织特异性。
除了病毒载体以外,可以使用非病毒载体来递送编码根据本披露的基因组编辑系统的核酸。非病毒核酸载体的一个重要分类是纳米颗粒,其可以是有机的或无机的。纳米颗粒为本领域所熟知,并且概述于Cotta-Ramusino中。可以使用任何适宜的纳米颗粒设计来递送基因组编辑系统组分或编码此类组分的核酸。例如,在本披露的某些实施例中,有机(例如脂质和/或聚合物)纳米颗粒可以适合用作递送媒介物。用于纳米颗粒配制物和/或基因转移的示例性脂质显示于表4中,并且表5列示用于基因转移和/或纳米颗粒配制物的示例性聚合物。
表4:用于基因转移的脂质
Figure BDA0002379002290000521
Figure BDA0002379002290000531
表5:用于基因转移的聚合物
聚合物 缩写
聚乙二醇 PEG
聚乙烯亚胺 PEI
二硫代双(琥珀酰亚胺基丙酸酯) DSP
二甲基-3,3’-二硫代双丙亚氨酸酯 DTBP
聚(乙烯亚胺)双氨基甲酸酯 PEIC
聚(L-赖氨酸) PLL
组氨酸修饰的PLL
聚(N-乙烯基吡咯烷酮) PVP
聚(丙烯亚胺) PPI
聚(酰胺基胺) PAMAM
聚(酰胺基乙烯亚胺) SS-PAEI
三亚乙基四胺 TETA
聚(β-氨基酯)
聚(4-羟基-L-脯氨酸酯) PHP
聚(烯丙基胺)
聚(α-[4-氨基丁基]-L-乙醇酸) PAGA
聚(D,L-乳酸-共-乙醇酸) PLGA
聚(N-乙基-4-乙烯基溴化吡啶鎓)
聚(磷腈) PPZ
聚(磷酸酯) PPE
聚(氨基磷酸酯) PPA
聚(N-2-羟基丙基甲基丙烯酰胺) pHPMA
聚(2-(二甲基氨基)甲基丙烯酸乙酯) pDMAEMA
聚(2-氨乙基丙烯磷酸酯) PPE-EA
壳聚糖
半乳糖基化壳聚糖
N-十二烷基化的壳聚糖
组蛋白
胶原
葡聚糖-精胺 D-SPM
非病毒载体任选地包括靶向修饰以改进摄取和/或选择性靶向某些细胞类型。这些靶向修饰可以包括例如细胞特异性抗原、单克隆抗体、单链抗体、适体、聚合物、糖(例如,N-乙酰半乳糖胺(GalNAc))和细胞穿透肽。此类载体还任选地使用致融性和核内体去稳定肽/聚合物,经历酸触发的构象变化(例如,加速负荷的核内体逃逸),和/或并入刺激可裂解的聚合物,例如用于在细胞区室中释放。例如,可以使用在还原性细胞环境中裂解的基于二硫化物的阳离子型聚合物。
在某些实施例中,除了基因组编辑系统的组分(例如,本文所述的RNA指导的核酸酶组分和/或gRNA组分)以外,递送一种或多种核酸分子(例如,DNA分子)。在实施例中,核酸分子是在递送基因组编辑系统一个或多个组分的同时进行递送的。在实施例中,核酸分子是在递送基因组编辑系统的一个或多个组分之前或之后(例如,小于约30分钟、1小时、2小时、3小时、6小时、9小时、12小时、1天、2天、3天、1周、2周或4周)递送。在实施例中,核酸分子是通过与递送基因组编辑系统的一个或多个组分(例如,RNA指导的核酸酶组分和/或gRNA组分)不同的方式来递送。该核酸分子可以通过本文所述的任何递送方法来递送。例如,核酸分子可以通过病毒载体(例如,整合缺陷型慢病毒)来递送,并且RNA指导的核酸酶分子组分和/或gRNA组分可以通过电穿孔来递送,例如,使得可以降低由核酸(例如,DNA)引起的毒性。在实施例中,核酸分子编码治疗性蛋白质(例如,本文所述的蛋白质)。在实施例中,核酸分子编码RNA分子(例如,本文所述的RNA分子)。
RNP和/或编码基因组编辑系统组分的RNA的递送
可以通过本领域已知的方法将RNP(gRNA和RNA指导的核酸酶(例如,本文所述的RNA指导的核酸酶变体)的复合物)和/或编码RNA指导的核酸酶(例如,本文所述的RNA指导的核酸酶变体)和/或gRNA的RNA(例如,mRNA)递送至细胞中或施用于受试者,其中一些方法描述于Cotta-Ramusino中。在体外,可以例如通过显微注射、电穿孔、瞬时细胞压缩或挤压来递送编码RNA指导的核酸酶(例如本文所述的RNA指导的核酸酶变体)和/或gRNA的RNA(例如mRNA)(参见,例如,Lee 2012)。还可以使用脂质介导的转染、肽介导的递送、GalNAc或其他缀合物介导的递送和其组合进行体外和体内递送。
在体外,通过电穿孔递送包含将细胞与编码RNA指导的核酸酶和/或gRNA的RNA(例如mRNA)(具有或不具有供体模板核酸分子)在盒、室或比色皿中混合,并且施加一个或多个限定持续时间和幅度的电脉冲。用于电穿孔的系统和方案为本领域中已知,并且任何适宜的电穿孔工具和/或方案可以结合本披露的各个实施例使用。
施用途径
可以通过任何适宜模式或途径(局部或全身)将基因组编辑系统或使用此类系统改变或操作的细胞施用于受试者。全身施用模式包括口服和肠胃外途径。肠胃外途径包括例如静脉内、骨髓内、动脉内、肌内、真皮内、皮下、鼻内和腹膜内途径。可以修饰或配制全身施用的组分以靶向例如,HSC、造血干细胞/祖细胞或红系祖细胞或前体细胞。
局部施用模式包括例如骨髓内注射至骨小梁中或股骨内注射到髓隙中,以及输注至门静脉中。在一个实施例中,与当全身施用(例如,静脉内)相比时,显著较少量的组分(与全身途径相比)可以在局部施用(例如,直接进入骨髓)时发挥作用。局部施用模式可以降低或消除在全身性施用治疗有效量的组分时可能发生的潜在毒副作用的发生率。
可以以周期性推注(例如静脉内)的形式,或者从内部储库或外部储库(例如从静脉注射袋或可植入泵)持续输注提供施用。组分可以局部施用,例如,通过从持续释放药物递送装置中持续释放。
此外,可以将组分配制成允许经延长的时段释放。释放系统可以包括生物可降解材料或通过扩散释放所并入组分的材料的基质。所述组分可以在释放系统中均匀或者非均匀分配。多种释放系统可以是有用的,然而,选择适当的系统将取决于具体应用所需要的释放速率。不可降解和可降解的释放系统均可以被使用。适宜释放系统包括聚合物和聚合基质、非聚合基质或无机和有机赋形剂和稀释剂,例如但不限于碳酸钙和糖(例如,海藻糖)。释放系统可以是天然的或合成的。然而,合成释放系统是优选的,因为其通常更可靠、更具可重现性并且产生更明确的释放曲线。可以选择释放系统材料,使得具有不同分子量的组分是通过穿过材料扩散或通过材料降解而释放。
代表性的合成生物可降解聚合物包括例如:聚酰胺,例如聚(氨基酸)和聚(肽);聚酯,例如聚(乳酸)、聚(乙醇酸)、聚(乳酸-共-乙醇酸)和聚(己内酯);聚(酸酐);聚原酸酯;聚碳酸酯;和其化学衍生物(取代、添加化学基团,例如,烷基、亚烷基、羟化、氧化和本领域技术人员常规进行的其他修饰)、共聚物和其混合物。代表性的合成非生物可降解聚合物包括例如:聚醚,例如聚(氧化乙烯)、聚(乙二醇)和聚(环氧丁烷);乙烯基聚合物-聚丙烯酸酯和聚甲基丙烯酸酯,例如甲基、乙基、其他烷基、甲基丙烯酸羟乙酯、丙烯酸和甲基丙烯酸和其他,例如聚(乙烯醇)、聚(乙烯基吡咯烷酮)和聚(乙酸乙烯酯);聚(氨酯);纤维素和其衍生物,例如烷基、羟烷基、醚、酯、硝化纤维素和各种醋酸纤维素;聚硅氧烷;和其任何化学衍生物(取代、添加化学基团,例如,烷基、亚烷基、羟化、氧化和本领域技术人员常规进行的其他修饰)、共聚物和其混合物。
也可以使用聚(丙交酯共乙交酯)微球。典型地,微球是由乳酸和乙醇酸的聚合物构成,其经结构化以形成空心球体。球体的直径可以是约15-30微米,并且可以加载本文所述的组分。
组分的多模或差别递送
技术人员将理解,基因组编辑系统的不同组分可以一起递送或分开递送,同时或不同时递送。可能尤其期望基因组编辑系统组分的分开和/或异步递送以提供对基因组编辑系统功能的时间或空间控制并限制由其活性引起的某些效应。
如本文所用,不同或差别模式是指递送模式,这些递送模式赋予受试组分分子(例如,RNA指导的核酸酶分子、gRNA、模板核酸或有效负载)不同的药效学或药物代谢动力学特性。例如,递送模式可以导致不同的组织分布,不同的半衰期或不同的时间分布,例如,在所选区室、组织或器官中。
一些递送的模式(例如,通过例如通过自主复制或插入细胞核酸中而在细胞或细胞子代中持续存在的核酸载体来递送)导致组分更持久的表达和存在。实例包括病毒(例如,AAV或慢病毒)递送。
举例来说,基因组编辑系统的组分(例如,RNA指导的核酸酶和gRNA)可以通过在所递送组分在体内或在特定区室、组织或器官中的所得半衰期或持久性方面不同的模式进行递送。在实施例中,gRNA可以通过此类模式进行递送。RNA指导的核酸酶分子组分可以通过导致在身体或特定区室或组织或器官中更低持久性或更少暴露的模式进行递送。
更一般地说,在实施例中,第一递送模式被用于递送第一组分并且第二递送模式被用于递送第二组分。第一递送模式赋予第一药效学或药物代谢动力学特性。第一药效学特性可以是例如组分或编码该组分的核酸在体内、区室、组织或器官中的分布、持久性或暴露。第二递送模式赋予第二药效学或药物代谢动力学特性。第二药效学特性可以是例如组分或编码该组分的核酸在体内、区室、组织或器官中的分布、持久性或暴露。
在某些实施例中,第一药效学或药物代谢动力学特性(例如,分布、持久性或暴露)比第二药效学或药物代谢动力学特性更受限。
在某些实施例中,第一递送模式经选择以优化(例如,最小化)药效学或药物代谢动力学特性(例如,分布、持久性或暴露)。
在某些实施例中,第二递送模式经选择以优化(例如,最大化)药效学或药物代谢动力学特性(例如,分布、持久性或暴露)。
在某些实施例中,第一递送模式包含使用相对持久的元件,例如,核酸,例如,质粒或病毒载体,例如,AAV或慢病毒。由于此类载体相对持久,从其转录的产物将相对持久。
在某些实施例中,第二递送模式包含相对瞬时元件,例如,RNA或蛋白质。
在某些实施例中,第一组分包含gRNA,并且递送模式相对持久,例如,gRNA是从质粒或病毒载体(例如,AAV或慢病毒)转录。这些基因的转录将具有极小生理学意义,因为这些基因不编码蛋白质产物,并且这些gRNA不能够单独起作用。第二组分(RNA指导的核酸酶分子)是以瞬时方式递送,例如,作为编码蛋白质的mRNA或作为蛋白质递送,从而确保完整的RNA指导的核酸酶分子/gRNA复合物仅在短时间段内存在并有活性。
此外,这些组分可以不同的分子形式或用不同的互为补充以增强安全性和组织特异性的递送载体进行递送。
差别递送模式的使用可以增强性能、安全性和/或功效,例如,可以减少最终脱靶修饰的可能性。通过较不持久的模式递送免疫原性组分(例如,Cas9分子)可以降低免疫原性,因为来自细菌源Cas酶的肽通过MHC分子展示于细胞表面上。两部分式递送系统可以改善这些缺点。
差别递送模式可以用于将组分递送至不同但重叠的靶区域。在靶区域的重叠以外,活性复合物的形成被最小化。因此,在实施例中,第一组分(例如,gRNA)是通过第一递送模式进行递送,其导致第一空间(例如,组织)分布。第二组分(例如,RNA指导的核酸酶分子)是通过第二递送模式进行递送,其导致第二空间(例如,组织)分布。在一个实施例中,第一模式包括选自脂质体、纳米颗粒(例如,聚合物纳米颗粒)、以及核酸(例如,病毒载体)的第一元件。第二模式包含选自该组的第二元件。在实施例中,第一递送模式包括第一靶向元件(例如,细胞特异性受体或抗体),并且第二递送模式不包括该元件。在某些实施例中,第二递送模式包括第二靶向元件(例如,第二细胞特异性受体或第二抗体)。
当在病毒递送载体、脂质体或聚合纳米颗粒中递送RNA指导的核酸酶分子时,存在递送至多个组织并且在多个组织中具有治疗活性的可能性,但此时可能希望仅靶向单一组织。两部分式递送系统可以解决这一挑战并且增强组织特异性。如果将gRNA分子和RNA指导的核酸酶分子包装于具有不同但重叠的组织向性的分开的递送运载体中,那么完全功能复合物仅在两种载体所靶向的组织中形成。
本文提及的所有出版物、专利申请、专利和其他参考文献以其整体通过援引并入本文。另外,所述材料、方法和实例仅是说明性的并不旨在是限制性的。除非另外定义,本文所使用的所有技术术语和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同的含义。尽管可以在本发明的实践或测试中使用类似于或等同于本文描述的那些的方法和材料,但是下文描述了适合的方法和材料。
通过以下实例进一步说明本披露。提供这些实例仅出于说明目的。它们不应以任何方式解释为限制本披露的范围或内容。
实例
实例1:等位基因特异性Cas9向单个碱基对突变的进化赋予锥体杆体营养不良6 (CORD6)
本实例表明,本发明的选择方法可用于进化策略中,以进化出位点特异性核酸酶,其对与野生型非疾病等位基因相比差异仅在于点突变(单碱基变化)的疾病等位基因具有特异性。
Cas9或其他靶向核酸酶在杂合序列的等位基因特异性切割中的使用受到混杂活性的阻碍,尤其是等位基因之间存在一个碱基差异的情况。我们旨在设计Cas9突变体,该突变体可以选择性地仅切割一个等位基因,此处选择性地切割视网膜鸟苷酸环化酶(GUCY2D)蛋白中具有R838S突变的等位基因,从而赋予CORD6疾病表型。我们构建了质粒pEvol_CORD6,其编码Cas9蛋白和靶向CORD6序列TAACCTGGAGGATCTGATCC(SEQ ID NO:1)的gRNA。pEvol_CORD6还组成型表达赋予对氨苄青霉素的抗性的β-内酰胺酶。还构建了两个噬菌粒(含有噬菌体起点f1元件的质粒)pSelect_CORD6和pSelect_GUCY2DWT,分别包含潜在的靶位点
Figure BDA0002379002290000591
(SEQ ID NO:2)和
Figure BDA0002379002290000592
(SEQ ID NO:3)。粗体表示R838S突变的位点。选择突变的位点为靶向野生型Cas9 PAM的第六个位置(
Figure BDA0002379002290000593
)。在此实例中,我们选择了邻近在第六位置上带有A的经修饰PAM(即
Figure BDA0002379002290000594
)切割的Cas9突变体(“阳性选择”),同时还选择了邻近在第六位置上带有C的经修饰PAM(即
Figure BDA0002379002290000595
)切割的Cas9突变体(“阴性选择”)。
pSelect_CORD6和pSelect_GUCY2DWT各自还包含组成型表达的氯霉素抗性基因和位于lac启动子的控制下的ccdB(细菌毒素),从而可以通过IPTG(异丙基β-D-1-硫代吡喃半乳糖苷)诱导ccdB表达。
将pSelect_CORD6和pSelect_GUCY2DWT分别包装到辅助噬菌体中。
为了设计等位基因特异性,使用针对每个密码子并允许调整突变率的全面且无偏的诱变方法,使用pEvol_CORD6质粒作为诱变的初始模板,生成了Cas9突变体的两个大肠杆菌细菌文库。对一个文库进行调整,使其具有每个Cas9多肽3个氨基酸突变的中位数(“低”突变率),另一个具有每个Cas9多肽5个氨基酸突变的中位数(“高”突变率)。
在进化的每一轮中,我们在不断被噬菌体挑战的竞争性培养物中将pEvol_CORD6突变体的每个细菌文库首先对切割含有pSelect_CORD6的噬菌体进行阳性选择,然后针对切割pSelect_GUCY2DWT进行阴性选择,如下:
为了感染细菌,将包装有适当pSelect质粒的噬菌体添加到含有pEvol_CORD6突变体的文库的饱和细菌中,并将细菌文库在氨苄青霉素液体培养物中进行培养。对于每个文库,整个文库都在相同的液体培养物中进行培养。
在此初始孵育和感染后,通过添加1mM IPTG(其诱导ccdB)进行阳性选择。然后将培养物生长过夜,例如至少12小时。然后沉淀细胞,去除一定IPTG。然后,通过在第二次过夜培养过程中在50μg/ml氯霉素(其由两种pSelect质粒组成型表达)存在下且在IPTG不存在下使细菌生长进行阴性选择。在阳性和阴性选择过程中,细菌都被液体培养物中存在的噬菌体连续感染,因此对切割(阳性选择情况下)或不切割(阴性选择情况下)提出了连续的挑战。
阴性选择后,来自所有选定文库成员的合并的质粒DNA被用作下一诱变反应的模板。我们以这种方式重复了三轮诱变(生成文库)、阳性选择和阴性选择。通过对每个文库施加双重选择压力,对包含对CORD6等位基因具有特异性的PAM的Cas9突变体进行了严格选择。
每次进化循环中在阴性选择轮后,对从合并的选定文库成员中分离的质粒DNA进行PacBio下一代测序。在仅第一次进化循环后,我们发现一个特定的突变体约占群体的20%,表明具有高选择强度。我们着手使用含有突变蛋白的大肠杆菌细胞裂解物在含有野生型或突变体的GUCY2D序列的扩增子上测试该突变体的切割活性。我们仅在CORD6扩增子上观察到了切割(图1)。对该突变体的PAM偏好的进一步分析还表明,对第六位A而不是C的特异性高两倍。这种高选择的突变体的活性证实了设计的选择性压力,并展示了通过无偏诱变方法和竞争性选择策略实现了等位基因特异性Cas9突变体的成功工程化。
实例2:使用已知的脱靶,具有降低的脱靶活性的Cas9的进化
本实例描述了如何能够在进化策略中使用本发明的选择方法以降低位点特异性DNA结合酶的脱靶活性。
脱靶切割是Cas9靶向DNA切割的常见副产物。为了减轻这种影响,可以在我们的系统中将对中靶切割的选择(“阳性选择”)与针对已知或潜在脱靶序列的选择(“阴性选择”)结合。脱靶,例如通过GUIDE-SEQ或其他方法发现的脱靶,可以以知情的方式进行反选择。可替代地,可以选择潜在的脱靶(例如单碱基对错配)的文库。用这种方法,可以将特定指导物通过与已经进化为减少脱靶切割的Cas9组合修整(tailored)为优先在适当的位置进行切割。
在这种情况下,进化是通过如下进行:首先选择阳性选择中的中靶切割,然后针对指定脱靶的混合噬菌体群体进行阴性选择,之后进行任选的深度测序验证(图2)。该进化算法可以经数轮重复。
实例3:等位基因特异性Cas9的进化
本实例表明,本发明的选择方法可用于进化策略中,以进化出位点特异性核酸酶,其对与野生型非疾病等位基因相比差异仅在于点突变(单碱基变化)的疾病等位基因具有特异性。然而,本发明的选择方法还可用于进化位点特异性核酸酶,其相比于等位基因(例如,野生型或非疾病等位基因)对差异超过单个碱基改变的另一等位基因(例如,突变体或疾病等位基因)具有特异性。
Cas9或其他靶向核酸酶在杂合序列的等位基因特异性切割中的使用受到混杂活性的阻碍,尤其是等位基因之间存在一个碱基差异的情况。我们旨在设计Cas9突变体,该突变体将选择性地仅切割一种等位基因(例如等位基因1,突变体等位基因),而不切割差异为单个碱基的等位基因(例如等位基因2,野生型等位基因)。我们还旨在提高选择Cas9突变体的方法的效率,以实现对一个等位基因的切割的最大区分。最大程度区分Cas9突变体的选择可以通过控制例如选择过程中存在的Cas9的量和/或提高阳性和阴性选择的效率来实现。选择系统中Cas9的量可通过例如使用表达Cas9的质粒的较低拷贝数来控制。在一些实施例中,通过将Cas9的表达置于诱导型启动子的控制下来控制Cas9的量。在一些实施例中,诱导型启动子是阿拉伯糖启动子(图3)。
阳性和阴性选择过程可能依赖于毒素分子的诱导型表达和/或对诸如抗生素的药物的抗性的表达。例如,当从质粒诱导毒素表达时,只有包含识别并切割质粒中合适靶标(例如等位基因1,突变体等位基因)的Cas9突变体的细胞才能存活。包含不能识别并切割适当靶标的Cas9的细胞会被毒素杀死。该阳性选择步骤针对所有能够识别并切割适当靶标(例如等位基因1,突变体等位基因)的Cas9分子进行选择。
在另一个实施例中,当用抗生素处理细胞时,仅杀死包含Cas9的细胞,Cas9切割了质粒中赋予抗生素抗性的不适当靶标。包含不能识别不适当靶标(例如等位基因2,野生型等位基因)的Cas9的细胞保持对抗生素的抗性并存活。该阴性选择步骤针对能够识别并切割不适当靶标(例如等位基因2,野生型等位基因)的Cas9分子进行选择。
阳性和阴性选择步骤用于鉴定高选择性Cas9分子的效用至少部分取决于细胞杀伤的高度区分。选择过程中细胞生长动力学的比较可以表征最佳Cas9分子的选择效率。
使用tse2进行选择的效率
构建了质粒pEvol_CAS,其编码Cas9蛋白和靶向靶序列的gRNA。还构建了质粒pEvol_NONTARGETING(pEvol_非靶向),其编码Cas9蛋白和非靶向gRNA。两种质粒都组成型表达β-内酰胺酶(其赋予对氨苄青霉素的抗性(AmpR))和诱导型阿拉伯糖启动子(Ara)抗性,以及控制Cas9的表达的诱导型阿拉伯糖启动子(Ara)。还构建了噬菌粒(含有噬菌体起点f1元件的质粒)pSelect_MUT和pSelect_WT,其各自包含潜在的靶位点。所述噬菌粒还包含在lac启动子控制下的组成型表达的氯霉素抗性基因(CmR)和tse2(细菌毒素),其允许通过IPTG(异丙基β-D-1-硫代吡喃半乳糖苷)诱导tse2表达。将pSelect_MUT和pSelect_WT各自分别包装到辅助噬菌体中。
为了设计等位基因特异性,使用针对每个密码子并允许调整突变率的全面且无偏的诱变方法,使用pEvol_CAS质粒作为诱变的初始模板,生成了Cas9突变体的两个大肠杆菌细菌文库。对一个文库进行调整,使其具有每个Cas9多肽3个氨基酸突变的中位数(“低”突变率),另一个具有每个Cas9多肽5个氨基酸突变的中位数(“高”突变率)。
在进化的每一轮中,我们在不断被噬菌体挑战的竞争性培养物中将pEvol_CAS突变体的每个细菌文库针对切割含有pSelect_MUT的噬菌体进行阳性选择,如下:
为了感染细菌,将包装pSelect_MUT质粒的噬菌体添加到含有pEvol_CAS突变体或pEvol_NONTARGETING的文库的细菌中,并将细菌文库在氨苄青霉素液体培养物中进行培养。对于每个文库,整个文库都在相同的液体培养物中进行培养。
在此初始孵育和感染后,通过向pEvol_CAS培养物的子部分和pEvol_NONTARGETING培养物的子部分中添加1mM IPTG(诱导tse2表达)来评估使用tse2进行阳性选择的严格性。通过添加阿拉伯糖诱导Cas9和指导RNA的表达。在用IPTG处理过的pEvol_CAS培养物中,未诱导Cas9和指导RNA的表达。然后将培养物生长过夜,例如至少12小时。在阳性选择过程中,细菌被液体培养物中存在的噬菌体连续感染,从而对切割靶标提出了持续的挑战。
如图4所示,由于tse2的诱导,表达tse2但不表达Cas9(-Cas+tse2)或表达非靶向指导RNA(+非靶向Cas+tse2)的培养物表现出明显的生长滞后。相比之下,培养物诱导表达tse2、也表达Cas9和靶向指导RNA(+Cas+tse2)(预期将切割靶标并抑制tse2的表达),显示在大约7小时内迅速生长。表达Cas9和靶向或非靶向指导RNA、但不诱导表达tse2的培养物在最初的6小时内显示出快速的细胞生长。这些数据表明,当不存在Cas9或指导RNA不识别靶标时,tse2具有显著的细胞杀伤作用。这些数据还表明适当靶向的Cas9和指导RNA抵消了tse2表达诱导的影响。
通过调节Cas9表达进行选择的效率
使用pEvol_WTCAS质粒作为诱变的初始模板,以及针对每个密码子并允许调整突变率的全面且无偏见的诱变方法,生成了质粒文库pEvol_CASLIBRARY(pEvol_CAS文库)。质粒编码Cas9蛋白和靶向靶序列的gRNA。还构建了编码野生型Cas9蛋白和靶向gRNA的质粒pEvol_WTCAS。两种质粒都组成型表达β-内酰胺酶(其赋予对氨苄青霉素的抗性(AmpR))和诱导型阿拉伯糖启动子(Ara)抗性,以及控制Cas9的表达的诱导型阿拉伯糖启动子(Ara)。如上所述,还构建了噬菌粒(含有噬菌体起点f1元件的质粒)pSelect_MUT和pSelect_WT,它们含有潜在的靶位点。
为了感染细菌,将包装pSelect_MUT质粒的噬菌体添加到含有pEvol_CASLIBRARY突变体或pEvol_WTCAS的文库的饱和细菌中,并将细菌文库在氨苄青霉素液体培养物中进行培养。对于每个文库,整个文库都在相同的液体培养物中进行培养。
在此初始孵育和感染后,通过向pEvol_CASLIBRARY培养物的子部分和pEvol_WTCAS培养物的子部分中添加1mM IPTG(诱导tse2表达)来评估使用tse2和野生型Cas或Cas文库进行阳性选择的严格性。通过添加阿拉伯糖诱导Cas9和gRNA的表达。在用IPTG处理过的pEvol_CASLIBRARY和pEvol_WT CAS培养物中,未诱导Cas9和gRNA表达。然后将培养物生长过夜,例如至少12小时。在阳性选择过程中,细菌被液体培养物中存在的噬菌体连续感染,从而对切割靶标提出了持续的挑战。
如图5所示,表达tse2但不表达野生型Cas9(-WTCas+tse2)或突变体Cas9文库(-Cas文库+tse2)的培养物由于tse2的诱导而显示出显著的生长滞后。然而,野生型Cas9培养物比突变体Cas9文库培养物显示出更大的生长滞后,表明即使在没有阿拉伯糖的情况下,Cas9突变体的泄露表达(leaky expression)。相比之下,诱导培养物以表达tse2,但也表达Cas9和靶向指导RNA(+WTcas+tse2或+Cas文库+tse2),预期所述培养物将切割靶标并抑制tse2的表达,显示在大约7小时内迅速生长。表达野生型Cas9或Cas9文库突变体但未诱导表达tse2的培养物在最初的6小时内显示出快速的细胞生长。表达带有或不带有tse2的野生型Cas9的培养物之间的细胞生长差异小于表达带有或不带有tse2的Cas9文库突变体的培养物之间的细胞生长差异。这些数据表明Cas9文库突变体比野生型Cas9具有更高的切割活性。这些数据还证实当不存在Cas9时,tse2具有明显的细胞杀伤作用。
在过夜培养过程中,在50μg/ml氯霉素存在下使细菌生长也可以进行阴性选择(pSelect_MUT和pSelect_WT噬菌粒组成型表达对氯霉素的抗性)。对照培养物未用氯霉素处理。在阴性选择过程中,细菌不断地被液体培养物中存在的噬菌体感染,从而对切割适当的靶标(等位基因1,突变体等位基因)而不切割不适当的靶标(等位基因2,野生型等位基因)提出了连续的挑战。由于通过脱靶切割消除了对氯霉素的抗性,野生型Cas9(WTCas+Cm)和突变体Cas9文库(文库+Cm)均显示出显著的生长滞后(图6)。但是,由于选择了未表现出脱靶作用并保持了氯霉素抗性的Cas9突变体,突变体Cas9文库突变体显示出生长的恢复。
文库进化
文库进化的连续轮次产生了对切割靶标具有高选择性水平的Cas9突变体。当培养物诱导表达tse2时,生长滞后的连续减少证明了这一点。图7显示了与表达不诱导tse2的野生型Cas9的培养物(WTcas-tse2)的生长相比时,当诱导tse2时野生型Cas9培养物(WTcas+tse2)的显著生长滞后和显著的阴性Δ(delta)。经过一轮诱变后,细胞生长的Δ降低(例如,第1轮+tse2对比第1轮-tse2)。经过三轮诱变,对于诱导表达tse2的培养物和尚未诱导表达tse2的培养物,细胞生长曲线几乎相同。这些数据表明,tse2的使用和诱变的选择轮次可以生成对中靶切割具有高选择性的突变体Cas9。
实例4:酿脓链球菌Cas9的进化,以减少脱靶切割
如下面的实例将进一步说明的,本披露的系统和方法可用于选择多种核酸酶特征。使用本文披露的选择方法已经从诱变的文库中鉴定了酿脓链球菌cas9变体,所述变体保持了中靶切割效率,但是在脱靶基因座处的切割减少,从而提供了一种潜在地拯救用于治疗用途的混杂的指导物的手段。突变体酿脓链球菌Cas9文库是使用随机靶标扫描诱变(SMART)生成的。然后将文库转化到大肠杆菌中,并用噬菌体进行挑战(三轮阳性和阴性选择)。阳性选择步骤利用阳性选择质粒,所述质粒包含切割盒,所述切割盒包括针对人类基因组基因座的指导RNA的中靶序列(SEQ ID NO:4),所述人类基因组基因座具有由GUIDE-Seq确定的多个脱靶,如表6中所示:
表6:用于阳性和阴性选择的靶位点
阳性/阴性可选靶标 序列
阳性(靶上) GTCTGGGCGG TGCTACAACT NGG(SEQ ID NO 4)
阴性(脱靶1) AACTGGGTGG TGCTCCAACT CGG(SEQ ID NO 5)
阴性(脱靶2) AACGGGGCGG TACTACAACT TGG(SEQ ID NO 6)
阴性(脱靶3) GTCTGGTGGT GCTACAACTT GG(SEQ ID NO 7)
阴性(脱靶4) ACCTGGACGG TGATACAACC CGG(SEQ ID NO 8)
单个阴性选择步骤利用四个合并的构建体,每个构建体包含独特的脱靶,所述脱靶与中靶序列的区别在于四个残基(SEQ ID NO:5-7)。在阳性和阴性选择步骤之后,选择克隆并通过下一代测序(NGS)进行测序,并比对读段以鉴定相对于未突变的酿脓链球菌Cas9(SEQ ID NO:13)最常见的突变的氨基酸残基。利用中靶和脱靶底物进行的体外切割试验表明,克隆表现出与WT Cas9相当的中靶切割效率(图8A),但是同时少数克隆相对于WT表现出减少的脱靶切割,其他克隆在体外表现出基本上相同的脱靶切割效率(图8B)。如图9A和9B所示,还对人T细胞中的基因组靶上和脱靶基因座进行了靶上和脱靶分析。WT和突变体Cas9/指导RNA核糖核蛋白复合物(RNP)以跨>2log范围的不同浓度递送,收获基因组DNA并扩增靶上和脱靶位点,并通过下一代测序进行测序。如图10中所示,相对于WT Cas9,几个突变体克隆表现出略微降低的中靶切割活性,同时还表现出比WT明显更低的脱靶切割。这些数据一起确定了本文所述的噬菌体选择方法可以通过选择补偿性Cas9突变体蛋白而成功地用于减少脱靶切割(用特定gRNA观察到的)。
表2列出了在此筛选中鉴定出的克隆中突变的选定氨基酸残基,以及可以在每个位置取代以产生具有降低的脱靶活性的突变体的残基:
表7:表现出较低的脱靶切割活性的酿脓链球菌Cas9突变体中突变的位置
位置 取代
D23 A
D1251 G
Y128 V
T67 L
N497 A
R661 A
Q695 A
Q926 A
表8列出了根据本披露的某些实施例的示例性的单、双和三酿脓链球菌Cas9突变体。为了清楚起见,本披露涵盖在表8中列出的位点中的1、2、3、4、5或更多位点处具有突变的Cas9变体蛋白,尽管为便于展示在表中仅列出了单、双和三突变体。
表8:酿脓链球菌Cas9氨基酸突变体的选定位置
Figure BDA0002379002290000671
Figure BDA0002379002290000681
Figure BDA0002379002290000691
Figure BDA0002379002290000701
Figure BDA0002379002290000711
在不限制前述内容的情况下,本披露涵盖以下突变体:
D23A(突变体1)
Y128V
D1251G(突变体2)
T67L(突变体3)
D23A、Y128V(突变体4)
D23A、D1251G(突变体5)
D23A、Y128V、D1251G、T67L(突变体6)
N497A/R661A/Q695A/Q926A(突变体7)
本披露还涵盖包含本文所述的突变体酿脓链球菌Cas9的基因组编辑系统。
在本披露的某些实施例中,本文所述的分离的SpCas9变体蛋白与异源功能域以及任选的间插接头融合,其中所述接头不干扰融合蛋白的活性。在一些实施例中,异源功能域是转录激活域。在一些实施例中,转录激活域来自VP64或NF-κB p65。在一些实施例中,异源功能域是转录沉默子或转录抑制域。在一些实施例中,转录抑制域是Krueppel相关盒(KRAB)域、ERF阻遏域(ERD)或mSin3A相互作用域(SID)。在一些实施例中,转录沉默子是异染色质蛋白1(HP1),例如,HP1α或HP1β。在一些实施例中,异源功能域是修饰DNA的甲基化状态的酶。在一些实施例中,修饰DNA的甲基化状态的酶是DNA甲基转移酶(DNMT)或TET蛋白。在一些实施例中,TET蛋白是TET1。在一些实施例中,异源功能域是修饰组蛋白亚基的酶。在一些实施例中,修饰组蛋白亚基的酶是组蛋白乙酰转移酶(HAT)、组蛋白脱乙酰酶(HDAC)、组蛋白甲基转移酶(HMT)或组蛋白脱甲基酶。在一些实施例中,异源功能域是生物系链。在一些实施例中,生物系链是MS2、Csy4或λN蛋白。在一些实施例中,异源功能域是FokI。
除了涵盖编码本文所述变体SpCas9蛋白的分离的核酸之外,本披露还涵盖包含此类分离的核酸的病毒和非病毒载体,所述载体任选地可操作地连接至用于表达本文所述的变体SpCas9蛋白的一个或多个调节域。本披露还包括宿主细胞,例如哺乳动物宿主细胞,其包含本文所述的核酸,并任选表达本文所述的变体SpCas9蛋白中的一种或多种。
本文所述的变体SpCas9蛋白可以用于改变细胞的基因组(例如通过在细胞中表达本文所述的分离的变体SaCas9或SpCas9蛋白)以及具有与该细胞的基因组的选定部分互补的区域的指导RNA。可替代地或另外地,本披露进一步涵盖通过使细胞与本文所述的蛋白质变体和具有与该细胞的基因组的选定部分互补的区域的指导RNA接触来改变(例如,选择性地改变)细胞基因组的方法。在一些实施例中,细胞是干细胞,例如胚胎干细胞、间充质干细胞或诱导的多能干细胞;在存在于生命的动物内;或存在于胚(例如哺乳动物、昆虫或鱼(例如斑马鱼)的胚)或胚细胞中。
在一些实施例中,分离的蛋白质或融合蛋白包含核定位序列、细胞穿透肽序列和/或亲和标签中的一个或多个。
此外,本披露涵盖用于改变细胞中的双链DNA(dsDNA)分子的方法,例如体外方法、离体和体内方法。所述方法包括使dsDNA分子与本文所述的变体蛋白中的一种或多种以及具有与dsDNA分子的选定部分互补的区域的指导RNA接触。
实例5:酿脓链球菌Cas9的进化,以减少脱靶切割
如下面的实例将进一步说明的,本披露的系统和方法可用于选择多种核酸酶特征。使用本文披露的选择方法已经从诱变的文库中鉴定了酿脓链球菌cas9变体,所述变体保持了中靶切割效率,但是在脱靶基因座处的切割减少,从而提供了一种潜在地拯救用于治疗用途的混杂的指导物的手段。突变体酿脓链球菌Cas9文库是使用随机靶标扫描诱变(SMART)生成的。然后将文库转化到大肠杆菌中,并用噬菌体进行挑战(三轮阳性和阴性选择)(图1和2)。在阳性和阴性选择步骤之后,选择克隆并通过下一代测序(NGS)进行测序,并比对读段以鉴定相对于未突变的酿脓链球菌Cas9(SEQ ID NO:13)最常见的突变的氨基酸残基。确定了通过密码子位置和根据氨基酸取代鉴定的突变的频率(图11)。在RuvC域(例如D23A)、REC域(例如T67L、Y128V)和PAM相互作用域(PI)(例如D1251G)中鉴定出突变。制备包含4种不同突变(D23A、T67L、Y128V和D1251G)的组合的表达构建体,并在体外测试人T细胞中的中靶和脱靶编辑效率。在这个实例中,包含突变D23A、Y128V、D1251G和T67L的构建体被命名为“Mut6”或“SpartaCas”。
使用Mut6和野生型酿脓链球菌Cas9对T细胞中的基因组靶上和脱靶基因座进行了体外剂量反应研究,如图12中所示。野生型或突变体Cas9/指导RNA核糖核蛋白复合物(RNP)以跨>2log范围的不同浓度递送。如图12中所示,Mut6构建体表现出与野生型酿脓链球菌Cas9相当的中靶切割活性,同时还表现出比野生型大幅降低的脱靶切割。
在6个不同基因座(位点A、位点B、位点C、位点D、位点E和位点F)处的靶上编辑使用野生型酿脓链球菌Cas9(WT SPCas9)、“SpartaCas”(突变体6)和两个已知的突变体酿脓链球菌Cas9蛋白eCas(Slaymaker等人Science[科学](2015)351:84-88)和HF1 Cas9(Kleinstiver等人Nature[自然](2016)529:490-495)来评估。将1μm(基因座1和2)或5μm(基因座3-6)野生型或突变体Cas9/指导RNA RNP递送至人T细胞中。编辑效率是基因座依赖性的。在所有基因座上,SpartaCas的编辑效率均高于HF1 Cas9,而在6个基因座中的4个上,其编辑效率也高于eCas(图13)。
使用野生型酿脓链球菌Cas9(“Spy”)、野生型金黄色葡萄球菌Cas9(“Sau”)、野生型氨基酸球菌属Cpf1(“AsCpf1”)、SpartaCas(“Mut6”或“S6”)和包括人T细胞中的HF1Cas9、eCas9和
Figure BDA0002379002290000741
Cas9(“AltR Cas9”)(www.idtdna.com)的可替代的突变体酿脓链球菌Cas9蛋白进行进一步的中靶编辑剂量反应研究。中靶编辑是靶标依赖性的而SpartaCas表现出高效率的中靶编辑(图14A-14C)。
以范围在从0.03125μM至4μM的RNP剂量,进一步评估SpartaCas(Mut6)的中靶和脱靶切割效率。中靶切割与野生型酿脓链球菌Cas9相当,而脱靶切割显著降低(图15)。
实例6:使用GUIDE-seq评估酿脓链球菌Cas9变体的脱靶切割
使用以下方法,使用GUIDE-Seq评估野生型Cas9、eCas和SpartaCas的脱靶切割。
RNP的复合
将RNP与由集成DNA技术(Integrated DNA Technologies)合成的两部分式gRNA复合。以1:1的crRNA与tracrRNA比,将所有指导物退火至200uM的终浓度。使RNP复合以达到1:2的酶与指导物比。使用1:1体积比的100uM酶和200uM gRNA以达到50uM的最终RNP浓度。使RNP在室温下复合30分钟。然后将RNP跨8个浓度连续稀释2倍。将RNP在-80℃下冷冻直至核转染。
T细胞的培养
用Lonza X-Vivo 15培养基培养T细胞。解冻细胞并用Dynabeads人T激活剂CD3/CD28培养以进行T细胞扩增和激活。解冻后第二天,将细胞从珠子上除去。将细胞继续培养至第4天,然后离心分离细胞进行核转染。核转染后第2天,将细胞体积分成两半,放入新的板中,使得它们有继续扩增的空间。
T细胞核转染
使用BioRad T-20细胞计数器对细胞进行计数。将细胞与锥虫蓝1:1混合并计数。将所需的细胞总数(每孔足以容纳500k细胞)等分到独立的管中,然后以1500RPM离心5分钟。然后将细胞重悬于Lonza P2核转染溶液中。然后将细胞以每孔20uL接种在Lonza 96孔核转染板中。然后将细胞和RNP板移到BioMek FX机器人上。使用96孔头将每个RNP的2uL转移并混合到核转染板中。然后将核转染板立即移至Lonza穿梭系统,在其中用DS-130脉冲编码进行核转染。然后将细胞立即移到BioMek FX,在其中将所述细胞转移到预热的96孔未处理培养基板中并混合。然后将细胞板置于37℃下孵育。
gDNA提取
在第4天,将细胞以2000RPM在其板中离心5分钟。然后将培养基倒出。然后将细胞沉淀重悬于Agencourt DNAdvance裂解液中。在BioMek FX上使用DNAdvance方案提取gDNA。
GUIDE-seq
GUIDE-seq是基于Tsai等人(Nat.Biotechnol.[自然生物技术]33:187-197(2015))的方案进行的并如下改适为适用于T细胞。将10uL的4.4uM的RNP与4uL的100uMdsODN和6uL的1xH150缓冲液合并,总体积为20uL。将RNP放置在冰上直至核转染。使用BioRad T-20细胞计数器对T细胞进行计数。将细胞与锥虫蓝1:1混合并计数。将所需的细胞总数(每小池(cuvette)足以容纳200万个细胞)等分到独立的管中,然后以1500RPM离心5分钟。然后将细胞重悬于80uL的Lonza P2溶液中。然后将细胞吸移到它们各自的小池中,并将20uL的RNP/dsODN添加到每个小池中,并将整个溶液轻轻混合。然后使用CA-137脉冲编码对细胞进行核转染。然后立即将细胞吸移到预温热的未涂布培养基板中。然后将细胞板置于37℃下孵育。仅使用双向读取,使用Tsai等人(Nat.Biotechnol.[自然生物技术]33:187-197(2015))的方案进行gDNA提取和分析。
结果
图18A和18B分别描绘了“位点G”和“位点H”的脱靶切割。如图18A和18B中所示,相对于野生型Cas9,SpartaCas和eCas均减少了脱靶的总数。此外,剩余的大多数脱靶的读段计数均下降(以青色显示)。
等同物
应理解,虽然已经结合其详细描述,对本发明进行了描述,但前面的描述旨在说明而非限制本发明的范围,本发明的范围由所附的权利要求书的范围限定。其他方面、优点以及修改都在以下权利要求书的范围之内。
序列表
编码酿脓链球菌的Cas9分子的示例性密码子优化的核酸序列(SEQ ID NO:9)。
Figure BDA0002379002290000761
Figure BDA0002379002290000771
编码金黄色葡萄球菌的Cas9分子的示例性密码子优化的核酸序列(SEQ ID NO:10)。
Figure BDA0002379002290000772
Figure BDA0002379002290000781
编码金黄色葡萄球菌的Cas9分子的示例性密码子优化的核酸序列(SEQ ID NO:11)。
Figure BDA0002379002290000782
Figure BDA0002379002290000791
编码金黄色葡萄球菌的Cas9分子的示例性密码子优化的核酸序列(SEQ ID NO:12)。
Figure BDA0002379002290000792
Figure BDA0002379002290000801
示例性酿脓链球菌Cas9氨基酸序列(SEQ ID NO:13)。
Figure BDA0002379002290000802
Figure BDA0002379002290000811
示例性脑膜炎奈瑟氏球菌Cas9氨基酸序列(SEQ ID NO:14)。
Figure BDA0002379002290000812
序列表
<110> 爱迪塔斯医药公司(Editas Medicine, Inc.)
<120> 工程化的CAS9核酸酶
<130> 2011271-0077
<150> 62/517811
<151> 2017-06-09
<150> 62/665388
<151> 2018-05-01
<160> 14
<170> PatentIn 3.5版
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的寡核苷酸
<400> 1
taacctggag gatctgatcc 20
<210> 2
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的寡核苷酸
<400> 2
taacctggag gatctgatcc gggaga 26
<210> 3
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的寡核苷酸
<400> 3
taacctggag gatctgatcc gggagc 26
<210> 4
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的寡核苷酸
<220>
<221> 尚未归类的特征
<222> (21)..(21)
<223> n是a、c、g、或t
<400> 4
gtctgggcgg tgctacaact ngg 23
<210> 5
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的寡核苷酸
<400> 5
aactgggtgg tgctccaact cgg 23
<210> 6
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的寡核苷酸
<400> 6
aacggggcgg tactacaact tgg 23
<210> 7
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的寡核苷酸
<400> 7
gtctggtggt gctacaactt gg 22
<210> 8
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的寡核苷酸
<400> 8
acctggacgg tgatacaacc cgg 23
<210> 9
<211> 4107
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的寡核苷酸
<400> 9
atggataaaa agtacagcat cgggctggac atcggtacaa actcagtggg gtgggccgtg 60
attacggacg agtacaaggt accctccaaa aaatttaaag tgctgggtaa cacggacaga 120
cactctataa agaaaaatct tattggagcc ttgctgttcg actcaggcga gacagccgaa 180
gccacaaggt tgaagcggac cgccaggagg cggtatacca ggagaaagaa ccgcatatgc 240
tacctgcaag aaatcttcag taacgagatg gcaaaggttg acgatagctt tttccatcgc 300
ctggaagaat cctttcttgt tgaggaagac aagaagcacg aacggcaccc catctttggc 360
aatattgtcg acgaagtggc atatcacgaa aagtacccga ctatctacca cctcaggaag 420
aagctggtgg actctaccga taaggcggac ctcagactta tttatttggc actcgcccac 480
atgattaaat ttagaggaca tttcttgatc gagggcgacc tgaacccgga caacagtgac 540
gtcgataagc tgttcatcca acttgtgcag acctacaatc aactgttcga agaaaaccct 600
ataaatgctt caggagtcga cgctaaagca atcctgtccg cgcgcctctc aaaatctaga 660
agacttgaga atctgattgc tcagttgccc ggggaaaaga aaaatggatt gtttggcaac 720
ctgatcgccc tcagtctcgg actgacccca aatttcaaaa gtaacttcga cctggccgaa 780
gacgctaagc tccagctgtc caaggacaca tacgatgacg acctcgacaa tctgctggcc 840
cagattgggg atcagtacgc cgatctcttt ttggcagcaa agaacctgtc cgacgccatc 900
ctgttgagcg atatcttgag agtgaacacc gaaattacta aagcacccct tagcgcatct 960
atgatcaagc ggtacgacga gcatcatcag gatctgaccc tgctgaaggc tcttgtgagg 1020
caacagctcc ccgaaaaata caaggaaatc ttctttgacc agagcaaaaa cggctacgct 1080
ggctatatag atggtggggc cagtcaggag gaattctata aattcatcaa gcccattctc 1140
gagaaaatgg acggcacaga ggagttgctg gtcaaactta acagggagga cctgctgcgg 1200
aagcagcgga cctttgacaa cgggtctatc ccccaccaga ttcatctggg cgaactgcac 1260
gcaatcctga ggaggcagga ggatttttat ccttttctta aagataaccg cgagaaaata 1320
gaaaagattc ttacattcag gatcccgtac tacgtgggac ctctcgcccg gggcaattca 1380
cggtttgcct ggatgacaag gaagtcagag gagactatta caccttggaa cttcgaagaa 1440
gtggtggaca agggtgcatc tgcccagtct ttcatcgagc ggatgacaaa ttttgacaag 1500
aacctcccta atgagaaggt gctgcccaaa cattctctgc tctacgagta ctttaccgtc 1560
tacaatgaac tgactaaagt caagtacgtc accgagggaa tgaggaagcc ggcattcctt 1620
agtggagaac agaagaaggc gattgtagac ctgttgttca agaccaacag gaaggtgact 1680
gtgaagcaac ttaaagaaga ctactttaag aagatcgaat gttttgacag tgtggaaatt 1740
tcaggggttg aagaccgctt caatgcgtca ttggggactt accatgatct tctcaagatc 1800
ataaaggaca aagacttcct ggacaacgaa gaaaatgagg atattctcga agacatcgtc 1860
ctcaccctga ccctgttcga agacagggaa atgatagaag agcgcttgaa aacctatgcc 1920
cacctcttcg acgataaagt tatgaagcag ctgaagcgca ggagatacac aggatgggga 1980
agattgtcaa ggaagctgat caatggaatt agggataaac agagtggcaa gaccatactg 2040
gatttcctca aatctgatgg cttcgccaat aggaacttca tgcaactgat tcacgatgac 2100
tctcttacct tcaaggagga cattcaaaag gctcaggtga gcgggcaggg agactccctt 2160
catgaacaca tcgcgaattt ggcaggttcc cccgctatta aaaagggcat ccttcaaact 2220
gtcaaggtgg tggatgaatt ggtcaaggta atgggcagac ataagccaga aaatattgtg 2280
atcgagatgg cccgcgaaaa ccagaccaca cagaagggcc agaaaaatag tagagagcgg 2340
atgaagagga tcgaggaggg catcaaagag ctgggatctc agattctcaa agaacacccc 2400
gtagaaaaca cacagctgca gaacgaaaaa ttgtacttgt actatctgca gaacggcaga 2460
gacatgtacg tcgaccaaga acttgatatt aatagactgt ccgactatga cgtagaccat 2520
atcgtgcccc agtccttcct gaaggacgac tccattgata acaaagtctt gacaagaagc 2580
gacaagaaca ggggtaaaag tgataatgtg cctagcgagg aggtggtgaa aaaaatgaag 2640
aactactggc gacagctgct taatgcaaag ctcattacac aacggaagtt cgataatctg 2700
acgaaagcag agagaggtgg cttgtctgag ttggacaagg cagggtttat taagcggcag 2760
ctggtggaaa ctaggcagat cacaaagcac gtggcgcaga ttttggacag ccggatgaac 2820
acaaaatacg acgaaaatga taaactgata cgagaggtca aagttatcac gctgaaaagc 2880
aagctggtgt ccgattttcg gaaagacttc cagttctaca aagttcgcga gattaataac 2940
taccatcatg ctcacgatgc gtacctgaac gctgttgtcg ggaccgcctt gataaagaag 3000
tacccaaagc tggaatccga gttcgtatac ggggattaca aagtgtacga tgtgaggaaa 3060
atgatagcca agtccgagca ggagattgga aaggccacag ctaagtactt cttttattct 3120
aacatcatga atttttttaa gacggaaatt accctggcca acggagagat cagaaagcgg 3180
ccccttatag agacaaatgg tgaaacaggt gaaatcgtct gggataaggg cagggatttc 3240
gctactgtga ggaaggtgct gagtatgcca caggtaaata tcgtgaaaaa aaccgaagta 3300
cagaccggag gattttccaa ggaaagcatt ttgcctaaaa gaaactcaga caagctcatc 3360
gcccgcaaga aagattggga ccctaagaaa tacgggggat ttgactcacc caccgtagcc 3420
tattctgtgc tggtggtagc taaggtggaa aaaggaaagt ctaagaagct gaagtccgtg 3480
aaggaactct tgggaatcac tatcatggaa agatcatcct ttgaaaagaa ccctatcgat 3540
ttcctggagg ctaagggtta caaggaggtc aagaaagacc tcatcattaa actgccaaaa 3600
tactctctct tcgagctgga aaatggcagg aagagaatgt tggccagcgc cggagagctg 3660
caaaagggaa acgagcttgc tctgccctcc aaatatgtta attttctcta tctcgcttcc 3720
cactatgaaa agctgaaagg gtctcccgaa gataacgagc agaagcagct gttcgtcgaa 3780
cagcacaagc actatctgga tgaaataatc gaacaaataa gcgagttcag caaaagggtt 3840
atcctggcgg atgctaattt ggacaaagta ctgtctgctt ataacaagca ccgggataag 3900
cctattaggg aacaagccga gaatataatt cacctcttta cactcacgaa tctcggagcc 3960
cccgccgcct tcaaatactt tgatacgact atcgaccgga aacggtatac cagtaccaaa 4020
gaggtcctcg atgccaccct catccaccag tcaattactg gcctgtacga aacacggatc 4080
gacctctctc aactgggcgg cgactag 4107
<210> 10
<211> 3159
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的寡核苷酸
<400> 10
atgaaaagga actacattct ggggctggac atcgggatta caagcgtggg gtatgggatt 60
attgactatg aaacaaggga cgtgatcgac gcaggcgtca gactgttcaa ggaggccaac 120
gtggaaaaca atgagggacg gagaagcaag aggggagcca ggcgcctgaa acgacggaga 180
aggcacagaa tccagagggt gaagaaactg ctgttcgatt acaacctgct gaccgaccat 240
tctgagctga gtggaattaa tccttatgaa gccagggtga aaggcctgag tcagaagctg 300
tcagaggaag agttttccgc agctctgctg cacctggcta agcgccgagg agtgcataac 360
gtcaatgagg tggaagagga caccggcaac gagctgtcta caaaggaaca gatctcacgc 420
aatagcaaag ctctggaaga gaagtatgtc gcagagctgc agctggaacg gctgaagaaa 480
gatggcgagg tgagagggtc aattaatagg ttcaagacaa gcgactacgt caaagaagcc 540
aagcagctgc tgaaagtgca gaaggcttac caccagctgg atcagagctt catcgatact 600
tatatcgacc tgctggagac tcggagaacc tactatgagg gaccaggaga agggagcccc 660
ttcggatgga aagacatcaa ggaatggtac gagatgctga tgggacattg cacctatttt 720
ccagaagagc tgagaagcgt caagtacgct tataacgcag atctgtacaa cgccctgaat 780
gacctgaaca acctggtcat caccagggat gaaaacgaga aactggaata ctatgagaag 840
ttccagatca tcgaaaacgt gtttaagcag aagaaaaagc ctacactgaa acagattgct 900
aaggagatcc tggtcaacga agaggacatc aagggctacc gggtgacaag cactggaaaa 960
ccagagttca ccaatctgaa agtgtatcac gatattaagg acatcacagc acggaaagaa 1020
atcattgaga acgccgaact gctggatcag attgctaaga tcctgactat ctaccagagc 1080
tccgaggaca tccaggaaga gctgactaac ctgaacagcg agctgaccca ggaagagatc 1140
gaacagatta gtaatctgaa ggggtacacc ggaacacaca acctgtccct gaaagctatc 1200
aatctgattc tggatgagct gtggcataca aacgacaatc agattgcaat ctttaaccgg 1260
ctgaagctgg tcccaaaaaa ggtggacctg agtcagcaga aagagatccc aaccacactg 1320
gtggacgatt tcattctgtc acccgtggtc aagcggagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaatgata tcattatcga gctggctagg 1440
gagaagaaca gcaaggacgc acagaagatg atcaatgaga tgcagaaacg aaaccggcag 1500
accaatgaac gcattgaaga gattatccga actaccggga aagagaacgc aaagtacctg 1560
attgaaaaaa tcaagctgca cgatatgcag gagggaaagt gtctgtattc tctggaggcc 1620
atccccctgg aggacctgct gaacaatcca ttcaactacg aggtcgatca tattatcccc 1680
agaagcgtgt ccttcgacaa ttcctttaac aacaaggtgc tggtcaagca ggaagagaac 1740
tctaaaaagg gcaataggac tcctttccag tacctgtcta gttcagattc caagatctct 1800
tacgaaacct ttaaaaagca cattctgaat ctggccaaag gaaagggccg catcagcaag 1860
accaaaaagg agtacctgct ggaagagcgg gacatcaaca gattctccgt ccagaaggat 1920
tttattaacc ggaatctggt ggacacaaga tacgctactc gcggcctgat gaatctgctg 1980
cgatcctatt tccgggtgaa caatctggat gtgaaagtca agtccatcaa cggcgggttc 2040
acatcttttc tgaggcgcaa atggaagttt aaaaaggagc gcaacaaagg gtacaagcac 2100
catgccgaag atgctctgat tatcgcaaat gccgacttca tctttaagga gtggaaaaag 2160
ctggacaaag ccaagaaagt gatggagaac cagatgttcg aagagaagca ggccgaatct 2220
atgcccgaaa tcgagacaga acaggagtac aaggagattt tcatcactcc tcaccagatc 2280
aagcatatca aggatttcaa ggactacaag tactctcacc gggtggataa aaagcccaac 2340
agagagctga tcaatgacac cctgtatagt acaagaaaag acgataaggg gaataccctg 2400
attgtgaaca atctgaacgg actgtacgac aaagataatg acaagctgaa aaagctgatc 2460
aacaaaagtc ccgagaagct gctgatgtac caccatgatc ctcagacata tcagaaactg 2520
aagctgatta tggagcagta cggcgacgag aagaacccac tgtataagta ctatgaagag 2580
actgggaact acctgaccaa gtatagcaaa aaggataatg gccccgtgat caagaagatc 2640
aagtactatg ggaacaagct gaatgcccat ctggacatca cagacgatta ccctaacagt 2700
cgcaacaagg tggtcaagct gtcactgaag ccatacagat tcgatgtcta tctggacaac 2760
ggcgtgtata aatttgtgac tgtcaagaat ctggatgtca tcaaaaagga gaactactat 2820
gaagtgaata gcaagtgcta cgaagaggct aaaaagctga aaaagattag caaccaggca 2880
gagttcatcg cctcctttta caacaacgac ctgattaaga tcaatggcga actgtatagg 2940
gtcatcgggg tgaacaatga tctgctgaac cgcattgaag tgaatatgat tgacatcact 3000
taccgagagt atctggaaaa catgaatgat aagcgccccc ctcgaattat caaaacaatt 3060
gcctctaaga ctcagagtat caaaaagtac tcaaccgaca ttctgggaaa cctgtatgag 3120
gtgaagagca aaaagcaccc tcagattatc aaaaagggc 3159
<210> 11
<211> 3159
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的寡核苷酸
<400> 11
atgaagcgga actacatcct gggcctggac atcggcatca ccagcgtggg ctacggcatc 60
atcgactacg agacacggga cgtgatcgat gccggcgtgc ggctgttcaa agaggccaac 120
gtggaaaaca acgagggcag gcggagcaag agaggcgcca gaaggctgaa gcggcggagg 180
cggcatagaa tccagagagt gaagaagctg ctgttcgact acaacctgct gaccgaccac 240
agcgagctga gcggcatcaa cccctacgag gccagagtga agggcctgag ccagaagctg 300
agcgaggaag agttctctgc cgccctgctg cacctggcca agagaagagg cgtgcacaac 360
gtgaacgagg tggaagagga caccggcaac gagctgtcca ccaaagagca gatcagccgg 420
aacagcaagg ccctggaaga gaaatacgtg gccgaactgc agctggaacg gctgaagaaa 480
gacggcgaag tgcggggcag catcaacaga ttcaagacca gcgactacgt gaaagaagcc 540
aaacagctgc tgaaggtgca gaaggcctac caccagctgg accagagctt catcgacacc 600
tacatcgacc tgctggaaac ccggcggacc tactatgagg gacctggcga gggcagcccc 660
ttcggctgga aggacatcaa agaatggtac gagatgctga tgggccactg cacctacttc 720
cccgaggaac tgcggagcgt gaagtacgcc tacaacgccg acctgtacaa cgccctgaac 780
gacctgaaca atctcgtgat caccagggac gagaacgaga agctggaata ttacgagaag 840
ttccagatca tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa gcagatcgcc 900
aaagaaatcc tcgtgaacga agaggatatt aagggctaca gagtgaccag caccggcaag 960
cccgagttca ccaacctgaa ggtgtaccac gacatcaagg acattaccgc ccggaaagag 1020
attattgaga acgccgagct gctggatcag attgccaaga tcctgaccat ctaccagagc 1080
agcgaggaca tccaggaaga actgaccaat ctgaactccg agctgaccca ggaagagatc 1140
gagcagatct ctaatctgaa gggctatacc ggcacccaca acctgagcct gaaggccatc 1200
aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgctat cttcaaccgg 1260
ctgaagctgg tgcccaagaa ggtggacctg tcccagcaga aagagatccc caccaccctg 1320
gtggacgact tcatcctgag ccccgtcgtg aagagaagct tcatccagag catcaaagtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaacgaca tcattatcga gctggcccgc 1440
gagaagaact ccaaggacgc ccagaaaatg atcaacgaga tgcagaagcg gaaccggcag 1500
accaacgagc ggatcgagga aatcatccgg accaccggca aagagaacgc caagtacctg 1560
atcgagaaga tcaagctgca cgacatgcag gaaggcaagt gcctgtacag cctggaagcc 1620
atccctctgg aagatctgct gaacaacccc ttcaactatg aggtggacca catcatcccc 1680
agaagcgtgt ccttcgacaa cagcttcaac aacaaggtgc tcgtgaagca ggaagaaaac 1740
agcaagaagg gcaaccggac cccattccag tacctgagca gcagcgacag caagatcagc 1800
tacgaaacct tcaagaagca catcctgaat ctggccaagg gcaagggcag aatcagcaag 1860
accaagaaag agtatctgct ggaagaacgg gacatcaaca ggttctccgt gcagaaagac 1920
ttcatcaacc ggaacctggt ggataccaga tacgccacca gaggcctgat gaacctgctg 1980
cggagctact tcagagtgaa caacctggac gtgaaagtga agtccatcaa tggcggcttc 2040
accagctttc tgcggcggaa gtggaagttt aagaaagagc ggaacaaggg gtacaagcac 2100
cacgccgagg acgccctgat cattgccaac gccgatttca tcttcaaaga gtggaagaaa 2160
ctggacaagg ccaaaaaagt gatggaaaac cagatgttcg aggaaaagca ggccgagagc 2220
atgcccgaga tcgaaaccga gcaggagtac aaagagatct tcatcacccc ccaccagatc 2280
aagcacatta aggacttcaa ggactacaag tacagccacc gggtggacaa gaagcctaat 2340
agagagctga ttaacgacac cctgtactcc acccggaagg acgacaaggg caacaccctg 2400
atcgtgaaca atctgaacgg cctgtacgac aaggacaatg acaagctgaa aaagctgatc 2460
aacaagagcc ccgaaaagct gctgatgtac caccacgacc cccagaccta ccagaaactg 2520
aagctgatta tggaacagta cggcgacgag aagaatcccc tgtacaagta ctacgaggaa 2580
accgggaact acctgaccaa gtactccaaa aaggacaacg gccccgtgat caagaagatt 2640
aagtattacg gcaacaaact gaacgcccat ctggacatca ccgacgacta ccccaacagc 2700
agaaacaagg tcgtgaagct gtccctgaag ccctacagat tcgacgtgta cctggacaat 2760
ggcgtgtaca agttcgtgac cgtgaagaat ctggatgtga tcaaaaaaga aaactactac 2820
gaagtgaata gcaagtgcta tgaggaagct aagaagctga agaagatcag caaccaggcc 2880
gagtttatcg cctccttcta caacaacgat ctgatcaaga tcaacggcga gctgtataga 2940
gtgatcggcg tgaacaacga cctgctgaac cggatcgaag tgaacatgat cgacatcacc 3000
taccgcgagt acctggaaaa catgaacgac aagaggcccc ccaggatcat taagacaatc 3060
gcctccaaga cccagagcat taagaagtac agcacagaca ttctgggcaa cctgtatgaa 3120
gtgaaatcta agaagcaccc tcagatcatc aaaaagggc 3159
<210> 12
<211> 3159
<212> DNA
<213> 人工序列
<220>
<223> 化学合成的寡核苷酸
<400> 12
atgaagcgca actacatcct cggactggac atcggcatta cctccgtggg atacggcatc 60
atcgattacg aaactaggga tgtgatcgac gctggagtca ggctgttcaa agaggcgaac 120
gtggagaaca acgaggggcg gcgctcaaag aggggggccc gccggctgaa gcgccgccgc 180
agacatagaa tccagcgcgt gaagaagctg ctgttcgact acaaccttct gaccgaccac 240
tccgaacttt ccggcatcaa cccatatgag gctagagtga agggattgtc ccaaaagctg 300
tccgaggaag agttctccgc cgcgttgctc cacctcgcca agcgcagggg agtgcacaat 360
gtgaacgaag tggaagaaga taccggaaac gagctgtcca ccaaggagca gatcagccgg 420
aactccaagg ccctggaaga gaaatacgtg gcggaactgc aactggagcg gctgaagaaa 480
gacggagaag tgcgcggctc gatcaaccgc ttcaagacct cggactacgt gaaggaggcc 540
aagcagctcc tgaaagtgca aaaggcctat caccaacttg accagtcctt tatcgatacc 600
tacatcgatc tgctcgagac tcggcggact tactacgagg gtccagggga gggctcccca 660
tttggttgga aggatattaa ggagtggtac gaaatgctga tgggacactg cacatacttc 720
cctgaggagc tgcggagcgt gaaatacgca tacaacgcag acctgtacaa cgcgctgaac 780
gacctgaaca atctcgtgat cacccgggac gagaacgaaa agctcgagta ttacgaaaag 840
ttccagatta ttgagaacgt gttcaaacag aagaagaagc cgacactgaa gcagattgcc 900
aaggaaatcc tcgtgaacga agaggacatc aagggctatc gagtgacctc aacgggaaag 960
ccggagttca ccaatctgaa ggtctaccac gacatcaaag acattaccgc ccggaaggag 1020
atcattgaga acgcggagct gttggaccag attgcgaaga ttctgaccat ctaccaatcc 1080
tccgaggata ttcaggaaga actcaccaac ctcaacagcg aactgaccca ggaggagata 1140
gagcaaatct ccaacctgaa gggctacacc ggaactcata acctgagcct gaaggccatc 1200
aacttgatcc tggacgagct gtggcacacc aacgataacc agatcgctat tttcaatcgg 1260
ctgaagctgg tccccaagaa agtggacctc tcacaacaaa aggagatccc tactaccctt 1320
gtggacgatt tcattctgtc ccccgtggtc aagagaagct tcatacagtc aatcaaagtg 1380
atcaatgcca ttatcaagaa atacggtctg cccaacgaca ttatcattga gctcgcccgc 1440
gagaagaact cgaaggacgc ccagaagatg attaacgaaa tgcagaagag gaaccgacag 1500
actaacgaac ggatcgaaga aatcatccgg accaccggga aggaaaacgc gaagtacctg 1560
atcgaaaaga tcaagctcca tgacatgcag gaaggaaagt gtctgtactc gctggaggcc 1620
attccgctgg aggacttgct gaacaaccct tttaactacg aagtggatca tatcattccg 1680
aggagcgtgt cattcgacaa ttccttcaac aacaaggtcc tcgtgaagca ggaggaaaac 1740
tcgaagaagg gaaaccgcac gccgttccag tacctgagca gcagcgactc caagatttcc 1800
tacgaaacct tcaagaagca catcctcaac ctggcaaagg ggaagggtcg catctccaag 1860
accaagaagg aatatctgct ggaagaaaga gacatcaaca gattctccgt gcaaaaggac 1920
ttcatcaacc gcaacctcgt ggatactaga tacgctactc ggggtctgat gaacctcctg 1980
agaagctact ttagagtgaa caatctggac gtgaaggtca agtcgattaa cggaggtttc 2040
acctccttcc tgcggcgcaa gtggaagttc aagaaggaac ggaacaaggg ctacaagcac 2100
cacgccgagg acgccctgat cattgccaac gccgacttca tcttcaaaga atggaagaaa 2160
cttgacaagg ctaagaaggt catggaaaac cagatgttcg aagaaaagca ggccgagtct 2220
atgcctgaaa tcgagactga acaggagtac aaggaaatct ttattacgcc acaccagatc 2280
aaacacatca aggatttcaa ggattacaag tactcacatc gcgtggacaa aaagccgaac 2340
agggaactga tcaacgacac cctctactcc acccggaagg atgacaaagg gaataccctc 2400
atcgtcaaca accttaacgg cctgtacgac aaggacaacg ataagctgaa gaagctcatt 2460
aacaagtcgc ccgaaaagtt gctgatgtac caccacgacc ctcagactta ccagaagctc 2520
aagctgatca tggagcagta tggggacgag aaaaacccgt tgtacaagta ctacgaagaa 2580
actgggaatt atctgactaa gtactccaag aaagataacg gccccgtgat taagaagatt 2640
aagtactacg gcaacaagct gaacgcccat ctggacatca ccgatgacta ccctaattcc 2700
cgcaacaagg tcgtcaagct gagcctcaag ccctaccggt ttgatgtgta ccttgacaat 2760
ggagtgtaca agttcgtgac tgtgaagaac cttgacgtga tcaagaagga gaactactac 2820
gaagtcaact ccaagtgcta cgaggaagca aagaagttga agaagatctc gaaccaggcc 2880
gagttcattg cctccttcta taacaacgac ctgattaaga tcaacggcga actgtaccgc 2940
gtcattggcg tgaacaacga tctcctgaac cgcatcgaag tgaacatgat cgacatcact 3000
taccgggaat acctggagaa tatgaacgac aagcgcccgc cccggatcat taagactatc 3060
gcctcaaaga cccagtcgat caagaagtac agcaccgaca tcctgggcaa cctgtacgag 3120
gtcaaatcga agaagcaccc ccagatcatc aagaaggga 3159
<210> 13
<211> 1368
<212> PRT
<213> 酿脓链球菌
<400> 13
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 14
<211> 1081
<212> PRT
<213> 脑膜炎奈瑟氏球菌
<400> 14
Ala Ala Phe Lys Pro Asn Ser Ile Asn Tyr Ile Leu Gly Leu Asp Ile
1 5 10 15
Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Glu Glu
20 25 30
Asn Pro Ile Arg Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg Ala
35 40 45
Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu Ala
50 55 60
Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu Arg
65 70 75 80
Thr Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asn Phe
85 90 95
Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln Leu
100 105 110
Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser Ala
115 120 125
Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg Lys
130 135 140
Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys Gly
145 150 155 160
Val Ala Gly Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr Pro
165 170 175
Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile Arg
180 185 190
Asn Gln Arg Ser Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu Gln
195 200 205
Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn Pro
210 215 220
His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met Thr
225 230 235 240
Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly His
245 250 255
Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr Thr
260 265 270
Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile Leu
275 280 285
Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr Leu
290 295 300
Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala Arg
305 310 315 320
Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg Tyr
325 330 335
Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala Tyr
340 345 350
His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys Lys
355 360 365
Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr Ala
370 375 380
Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys Asp
385 390 395 400
Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser Phe
405 410 415
Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val Pro
420 425 430
Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile Tyr
435 440 445
Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu Pro
450 455 460
Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala Leu
465 470 475 480
Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly Ser
485 490 495
Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser Phe
500 505 510
Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys Asp
515 520 525
Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe Val
530 535 540
Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu Gln
545 550 555 560
Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly Arg
565 570 575
Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe Ser
580 585 590
Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly Ser
595 600 605
Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn Gly
610 615 620
Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu Thr
625 630 635 640
Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys Phe
645 650 655
Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr Val
660 665 670
Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr Gly
675 680 685
Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn Leu
690 695 700
Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp Arg
705 710 715 720
His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala Met
725 730 735
Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala Phe
740 745 750
Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln Lys
755 760 765
Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met Ile
770 775 780
Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala Asp
785 790 795 800
Thr Leu Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser Arg
805 810 815
Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg Ala
820 825 830
Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys Ser
835 840 845
Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu Thr
850 855 860
Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg Glu
865 870 875 880
Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys Asp
885 890 895
Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys Ala
900 905 910
Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val Gln
915 920 925
Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn Ala
930 935 940
Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr Leu
945 950 955 960
Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp Arg
965 970 975
Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp Asp
980 985 990
Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu Val
995 1000 1005
Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys His
1010 1015 1020
Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp His
1025 1030 1035
Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys Thr
1040 1045 1050
Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys Glu
1055 1060 1065
Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg
1070 1075 1080

Claims (94)

1.一种分离的酿脓链球菌Cas9(SPCas9)多肽,其相对于野生型SPCas9在以下位置中的一个或多个处包含氨基酸取代:D23、D1251、Y128、T67、N497、R661、Q695、和/或Q926。
2.一种分离的SPCas9多肽,其包含与SEQ ID NO:13的氨基酸序列具有至少80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列,其中所述多肽在SEQ ID NO:13的以下位置中的一个或多个处包含氨基酸取代:D23、D1251、Y128、T67、N497、R661、Q695、和/或Q926。
3.如权利要求1或2所述的分离的多肽,其包含以下氨基酸取代中的一个或多个:D23A、Y128V、T67L、N497A、D1251G、R661A、Q695A、和/或Q926A。
4.如权利要求1-3中任一项所述的分离的多肽,其中所述多肽包含以下氨基酸取代:D23A/Y128V/D1251G/T67L。
5.一种融合蛋白,其包含与异源功能域以及任选的间插接头融合的如权利要求1-4中任一项所述的分离的多肽,其中所述接头不干扰所述融合蛋白的活性。
6.如权利要求5所述的融合蛋白,其中所述异源功能域选自由以下组成的组:VP64、NF-κB p65、Krueppel相关框(KRAB)域、ERF阻遏域(ERD)、mSin3A相互作用域(SID)、异染色质蛋白1(HP1)、DNA甲基转移酶(DNMT)、TET蛋白、组蛋白乙酰转移酶(HAT)、组蛋白脱乙酰酶(HDAC)、组蛋白甲基转移酶(HMT)、或组蛋白脱甲基酶(HDM)、MS2、Csy4、λN蛋白和FokI。
7.一种基因组编辑系统,其包含如权利要求1-4中任一项所述的分离的多肽。
8.一种核酸,其编码如权利要求1-4中任一项所述的分离的多肽。
9.一种载体,其包含如权利要求8所述的核酸。
10.一种组合物,其包含如权利要求1-4中任一项所述的分离的多肽、如权利要求7所述的基因组编辑系统、如权利要求8所述的核酸和/或如权利要求9所述的载体,以及任选地药学上可接受的运载体。
11.一种改变细胞的方法,其包括使所述细胞与如权利要求10所述的组合物接触。
12.一种治疗患者的方法,其包括向所述患者施用如权利要求10所述的组合物。
13.一种多肽,其包含与SEQ ID NO:13至少80%相同的氨基酸序列,并且在SEQ ID NO:13的位置D23、T67、Y128和D1251中的一个或多个处具有氨基酸取代。
14.如权利要求13所述的多肽,其中所述多肽在D23处包含氨基酸取代。
15.如权利要求13所述的多肽,其中所述多肽在D23处包含氨基酸取代,并且在T67、Y128或D1251处包含至少一个氨基酸取代。
16.如权利要求13所述的多肽,其中所述多肽在D23处包含氨基酸取代,并且在T67、Y128或D1251处包含至少两个取代。
17.如权利要求13所述的多肽,其中所述多肽在T67处包含氨基酸取代。
18.如权利要求13所述的多肽,其中所述多肽在T67处包含氨基酸取代,并且在D23、Y128或D1251处包含至少一个氨基酸取代。
19.如权利要求13所述的多肽,其中所述多肽在T67处包含氨基酸取代,并且在D23、Y128或D1251处包含至少两个取代。
20.如权利要求13所述的多肽,其中所述多肽在Y128处包含氨基酸取代。
21.如权利要求13所述的多肽,其中所述多肽在Y128处包含氨基酸取代,并且在D23、T67或D1251处包含至少一个氨基酸取代。
22.如权利要求13所述的多肽,其中所述多肽在Y128处包含氨基酸取代,并且在D23、T67或D1251处包含至少两个取代。
23.如权利要求13所述的多肽,其中所述多肽在D1251处包含氨基酸取代。
24.如权利要求13所述的多肽,其中所述多肽在D1251处包含取代,并且在D23、T67或Y128处包含至少一个氨基酸取代。
25.如权利要求13所述的多肽,其中所述多肽在D1251处包含氨基酸取代,并且在D23、T67或Y128处包含至少两个取代。
26.如权利要求13所述的多肽,其中所述多肽在D23、T67、Y128和D1251处包含氨基酸取代。
27.如权利要求13-26中任一项所述的多肽,其中当所述多肽与靶双链DNA(dsDNA)接触时,脱靶编辑率低于观察到的野生型SPCas9对靶标的脱靶编辑率。
28.如权利要求27所述的多肽,其中所述多肽的脱靶编辑率比野生型SPCas9的低约5%、10%、15%、20%、25%、30%、40%、50%、60%、70%或80%。
29.如权利要求27或28所述的多肽,其中脱靶编辑率是通过评估脱靶位点处的插入缺失的水平(例如,小数或百分比)来测量的。
30.一种融合蛋白,其包含如权利要求13所述的多肽,以及核定位序列、细胞穿透肽序列和/或亲和标签中的一个或多个。
31.一种融合蛋白,其包含与异源功能域以及任选的间插接头融合的如权利要求13所述的多肽,其中所述接头不干扰所述融合蛋白的活性。
32.如权利要求31所述的融合蛋白,其中所述异源功能域是转录反式激活域。
33.如权利要求32所述的融合蛋白,其中所述转录反式激活域来自VP64或NFk-B p65。
34.如权利要求31所述的融合蛋白,其中所述异源功能域是转录沉默子或转录抑制域。
35.如权利要求34所述的融合蛋白,其中所述转录抑制域是Krueppel相关盒(KRAB)域、ERF阻遏域(ERD)或mSin3A相互作用域(SID)。
36.如权利要求34所述的融合蛋白,其中所述转录沉默子是异染色质蛋白1(HP1)。
37.如权利要求31所述的融合蛋白,其中所述异源功能域是修饰DNA的甲基化状态的酶。
38.如权利要求37所述的融合蛋白,其中所述修饰DNA的甲基化状态的酶是DNA甲基转移酶(DNMT)或TET蛋白。
39.如权利要求38所述的融合蛋白,其中所述TET蛋白是TETI。
40.如权利要求31所述的融合蛋白,其中所述异源功能域是修饰组蛋白亚基的酶。
41.如权利要求40所述的融合蛋白,其中所述修饰组蛋白亚基的酶是组蛋白乙酰转移酶(HAT)、组蛋白脱乙酰酶(HDAC)、组蛋白甲基转移酶(HMT)或组蛋白脱甲基酶。
42.如权利要求31所述的融合蛋白,其中所述异源功能域是生物系链。
43.如权利要求42所述的融合蛋白,其中所述生物系链是MS2、Csy4或λN蛋白。
44.如权利要求31所述的融合蛋白,其中所述异源功能域是Fokl。
45.一种分离的核酸,其编码如权利要求13-29中任一项所述的多肽。
46.一种载体,其包含如权利要求45所述的分离的核酸。
47.一种宿主细胞,其包含如权利要求46所述的载体。
48.一种多肽,其包含与SEQ ID NO:13至少80%相同的氨基酸序列,并包含以下氨基酸取代中的一个或多个:D23A、T67L、Y128V和D1251G。
49.如权利要求48所述的多肽,其中所述多肽包含D23A。
50.如权利要求48所述的多肽,其中所述多肽包含D23A,并且包含T67L、Y128V和D1251G中的至少一个。
51.如权利要求48所述的多肽,其中所述多肽包含D23A,并且包含T67L、Y128V和D1251G中的至少两个。
52.如权利要求48所述的多肽,其中所述多肽包含T67L。
53.如权利要求48所述的多肽,其中所述多肽包含T67L和D23A、Y128V和D1251G中的至少一个。
54.如权利要求48所述的多肽,其中所述多肽包含T67L和D23A、Y128V和D1251G中的至少两个。
55.如权利要求48所述的多肽,其中所述多肽包含Y128V。
56.如权利要求48所述的多肽,其中所述多肽包含Y128V,并且包含D23A、T67L和D1251G中的至少一个。
57.如权利要求48所述的多肽,其中所述多肽包含Y128V,并且包含D23A、T67L和D1251G中的至少两个。
58.如权利要求48所述的多肽,其中所述多肽包含D1251G。
59.如权利要求48所述的多肽,其中所述多肽包含D1251G,并且包含D23A、T67L和Y128V中的至少一个。
60.如权利要求48所述的多肽,其中所述多肽包含D1251G,并且包含D23A、T67L和Y128V中的至少两个。
61.如权利要求48所述的多肽,其中所述多肽包含D23A、T67L、Y128V和D1251G。
62.如权利要求48-61中任一项所述的多肽,其中当所述多肽与双链DNA(dsDNA)靶标接触时,脱靶编辑率低于观察到的野生型SPCas9对靶标的脱靶编辑率。
63.如权利要求62所述的多肽,其中所述多肽的脱靶编辑率比野生型SPCas9的低约5%、10%、15%、20%、30%、40%、50%、60%、70%或80%。
64.如权利要求62所述的多肽,其中脱靶编辑率是通过评估脱靶位点处的插入缺失的水平(例如,小数或百分比)来测量的。
65.一种融合蛋白,其包含如权利要求48所述的多肽,以及核定位序列、细胞穿透肽序列和/或亲和标签中的一个或多个。
66.一种融合蛋白,其包含与异源功能域以及任选的间插接头融合的如权利要求48所述的多肽,其中所述接头不干扰所述融合蛋白的活性。
67.如权利要求66所述的融合蛋白,其中所述异源功能域是转录反式激活域。
68.如权利要求67所述的融合蛋白,其中所述转录反式激活域来自VP64或NFk-B p65。
69.如权利要求66所述的融合蛋白,其中所述异源功能域是转录沉默子或转录抑制域。
70.如权利要求69所述的融合蛋白,其中所述转录抑制域是Krueppel相关盒(KRAB)域、ERF阻遏域(ERD)或mSin3A相互作用域(SID)。
71.如权利要求69所述的融合蛋白,其中所述转录沉默子是异染色质蛋白1(HP1)。
72.如权利要求66所述的融合蛋白,其中所述异源功能域是修饰DNA的甲基化状态的酶。
73.如权利要求72所述的融合蛋白,其中所述修饰DNA的甲基化状态的酶是DNA甲基转移酶(DNMT)或TET蛋白。
74.如权利要求73所述的融合蛋白,其中所述TET蛋白是TETI。
75.如权利要求66所述的融合蛋白,其中所述异源功能域是修饰组蛋白亚基的酶。
76.如权利要求75所述的融合蛋白,其中所述修饰组蛋白亚基的酶是组蛋白乙酰转移酶(HAT)、组蛋白脱乙酰酶(HDAC)、组蛋白甲基转移酶(HMT)或组蛋白脱甲基酶。
77.如权利要求66所述的融合蛋白,其中所述异源功能域是生物系链。
78.如权利要求77所述的融合蛋白,其中所述生物系链是MS2、Csy4或λN蛋白。
79.如权利要求66所述的融合蛋白,其中所述异源功能域是Fokl。
80.一种分离的核酸,其编码如权利要求48-64中任一项所述的多肽。
81.一种载体,其包含如权利要求80所述的分离的核酸。
82.一种宿主细胞,其包含如权利要求81所述的载体。
83.一种对细胞群进行基因工程的方法,
所述方法包括在所述细胞中表达指导核酸和如权利要求13-29和48-64中任一项所述的多肽或使所述细胞与指导核酸和如权利要求13-29和48-64中任一项所述的多肽接触,从而改变所述细胞中至少多个的基因组,所述指导核酸具有与所述细胞的基因组的靶核酸上的靶序列互补的区域。
84.如权利要求83所述的方法,其中所述多肽的脱靶编辑率低于观察到的野生型SPCas9对靶序列的脱靶编辑率。
85.如权利要求84所述的方法,其中所述多肽的脱靶编辑率比野生型SPCas9的低约5%、10%、15%、20%、25%、30%、40%、50%、60%、70%或80%。
86.如权利要求84或85所述的方法,其中脱靶编辑率是通过评估脱靶位点处的插入缺失的水平(例如,小数或百分比)来测量的。
87.如权利要求83-86中任一项所述的方法,其中所述多肽和指导核酸以核糖核酸蛋白(RNP)施用。
88.如权利要求87所述的方法,其中所述RNP以1x 10-4μM至1μM RNP的剂量施用。
89.一种编辑双链DNA(dsDNA)分子的群体的方法,
所述方法包括使所述dsDNA分子与指导核酸和如权利要求13-28和47-62中任一项所述的多肽接触,从而对多个所述dsDNA分子进行编辑,所述指导核酸具有与所述dsDNA分子的靶序列互补的区域。
90.如权利要求89所述的方法,其中所述多肽的脱靶编辑率低于观察到的野生型SPCas9对靶序列的脱靶编辑率。
91.如权利要求90所述的方法,其中所述多肽的脱靶编辑率比野生型SPCas9的低约5%、10%、15%、20%、25%、30%、40%、50%、60%、70%或80%。
92.如权利要求90或91所述的方法,其中脱靶编辑率是通过评估脱靶位点处的插入缺失的水平(例如,小数或百分比)来测量的。
93.如权利要求89-92中任一项所述的方法,其中所述多肽和指导核酸以核糖核酸蛋白(RNP)施用。
94.如权利要求93所述的方法,其中所述RNP以1x 10-4μM至1μM RNP的剂量施用。
CN201880049977.9A 2017-06-09 2018-06-08 工程化的cas9核酸酶 Pending CN110997908A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762517811P 2017-06-09 2017-06-09
US62/517,811 2017-06-09
US201862665388P 2018-05-01 2018-05-01
US62/665,388 2018-05-01
PCT/US2018/036695 WO2018227114A1 (en) 2017-06-09 2018-06-08 Engineered cas9 nucleases

Publications (1)

Publication Number Publication Date
CN110997908A true CN110997908A (zh) 2020-04-10

Family

ID=62779085

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880049977.9A Pending CN110997908A (zh) 2017-06-09 2018-06-08 工程化的cas9核酸酶

Country Status (9)

Country Link
US (3) US10428319B2 (zh)
EP (1) EP3635104A1 (zh)
JP (2) JP2020524497A (zh)
KR (1) KR20200016892A (zh)
CN (1) CN110997908A (zh)
AU (1) AU2018279829B2 (zh)
CA (1) CA3065813A1 (zh)
MX (1) MX2019014640A (zh)
WO (1) WO2018227114A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
AU2018279829B2 (en) 2017-06-09 2024-01-04 Editas Medicine, Inc. Engineered Cas9 nucleases
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
CA3084733A1 (en) 2017-12-14 2019-06-20 Crispr Therapeutics Ag Materials and methods for treatment of autosomal dominant cone-rod dystrophy
US11713455B2 (en) 2019-02-05 2023-08-01 Cardea Bio, Inc. Enhanced selection of efficient targeted genome manipulating agents
AU2020311438A1 (en) * 2019-07-11 2021-12-16 Arbor Biotechnologies, Inc. Novel CRISPR DNA targeting enzymes and systems
CN112538471B (zh) * 2020-12-28 2023-12-12 南方医科大学 一种CRISPR SpCas9(K510A)突变体及其应用
EP4284932A1 (en) * 2021-02-01 2023-12-06 Epsilen Bio S.r.l. Gene silencing
EP4286401A1 (en) * 2022-06-03 2023-12-06 Technische Universität Dresden Use of an artificial protein or of a nucleic acid encoding the artificial protein for providing a functional ribonucleoprotein complex

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016205613A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Crispr enzyme mutations reducing off-target effects
WO2017040348A1 (en) * 2015-08-28 2017-03-09 The General Hospital Corporation Engineered crispr-cas9 nucleases
WO2017070633A2 (en) * 2015-10-23 2017-04-27 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing

Family Cites Families (178)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030044787A1 (en) 2000-05-16 2003-03-06 Joung J. Keith Methods and compositions for interaction trap assays
US7476500B1 (en) 2001-03-19 2009-01-13 President And Fellows Of Harvard College In vivo selection system for enzyme activity
DK2341149T3 (en) 2005-08-26 2017-02-27 Dupont Nutrition Biosci Aps Use of CRISPR-associated genes (Cas)
US8546553B2 (en) 2008-07-25 2013-10-01 University Of Georgia Research Foundation, Inc. Prokaryotic RNAi-like system and methods of use
KR101759586B1 (ko) 2008-08-22 2017-07-19 상가모 테라퓨틱스, 인코포레이티드 표적화된 단일가닥 분할 및 표적화된 통합을 위한 방법 및 조성물
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
US9404098B2 (en) 2008-11-06 2016-08-02 University Of Georgia Research Foundation, Inc. Method for cleaving a target RNA using a Cas6 polypeptide
WO2011091324A2 (en) 2010-01-22 2011-07-28 The Scripps Research Institute Methods of generating zinc finger nucleases having altered activity
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
PE20190844A1 (es) 2012-05-25 2019-06-17 Emmanuelle Charpentier Modulacion de transcripcion con arn de direccion a adn generico
WO2013188638A2 (en) 2012-06-15 2013-12-19 The Regents Of The University Of California Endoribonucleases and methods of use thereof
JP2015527889A (ja) 2012-07-25 2015-09-24 ザ ブロード インスティテュート, インコーポレイテッド 誘導可能なdna結合タンパク質およびゲノム撹乱ツール、ならびにそれらの適用
WO2014022702A2 (en) 2012-08-03 2014-02-06 The Regents Of The University Of California Methods and compositions for controlling gene expression by rna processing
KR101656237B1 (ko) 2012-10-23 2016-09-12 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
WO2014085830A2 (en) 2012-11-30 2014-06-05 The Parkinson's Institute Screening assays for therapeutics for parkinson's disease
SG10202107423UA (en) 2012-12-06 2021-08-30 Sigma Aldrich Co Llc Crispr-based genome modification and regulation
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
EP2848690B1 (en) 2012-12-12 2020-08-19 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
ES2883590T3 (es) 2012-12-12 2021-12-09 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas
SG10201801969TA (en) 2012-12-12 2018-04-27 Broad Inst Inc Engineering and Optimization of Improved Systems, Methods and Enzyme Compositions for Sequence Manipulation
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
ES2701749T3 (es) 2012-12-12 2019-02-25 Broad Inst Inc Métodos, modelos, sistemas y aparatos para identificar secuencias diana para enzimas Cas o sistemas CRISPR-Cas para secuencias diana y transmitir resultados de los mismos
US20140242664A1 (en) 2012-12-12 2014-08-28 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions for sequence manipulation
EP3252160B1 (en) 2012-12-12 2020-10-28 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
US8993233B2 (en) 2012-12-12 2015-03-31 The Broad Institute Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
SG11201504621RA (en) 2012-12-17 2015-07-30 Harvard College Rna-guided human genome engineering
AU2014207618A1 (en) 2013-01-16 2015-08-06 Emory University Cas9-nucleic acid complexes and uses related thereto
NZ712727A (en) 2013-03-14 2017-05-26 Caribou Biosciences Inc Compositions and methods of nucleic acid-targeting nucleic acids
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
JP6980380B2 (ja) 2013-03-15 2021-12-15 ザ ジェネラル ホスピタル コーポレイション 短縮ガイドRNA(tru−gRNA)を用いたRNA誘導型ゲノム編集の特異性の増大
CN115261411A (zh) 2013-04-04 2022-11-01 哈佛学院校长同事会 利用CRISPR/Cas系统的基因组编辑的治疗性用途
EP3730615A3 (en) 2013-05-15 2020-12-09 Sangamo Therapeutics, Inc. Methods and compositions for treatment of a genetic condition
EP3004339B1 (en) 2013-05-29 2021-07-07 Cellectis New compact scaffold of cas9 in the type ii crispr system
US9873907B2 (en) 2013-05-29 2018-01-23 Agilent Technologies, Inc. Method for fragmenting genomic DNA using CAS9
ES2883131T3 (es) 2013-05-29 2021-12-07 Cellectis Métodos para la modificación de células T para inmunoterapia utilizando el sistema de nucleasa CAS guiado por ARN
EP3004349B1 (en) 2013-05-29 2018-03-28 Cellectis S.A. A method for producing precise dna cleavage using cas9 nickase activity
US9267135B2 (en) 2013-06-04 2016-02-23 President And Fellows Of Harvard College RNA-guided transcriptional regulation
MY197877A (en) 2013-06-04 2023-07-22 Harvard College Rna-guided transcriptional regulation
EP3417880A1 (en) 2013-06-05 2018-12-26 Duke University Rna-guided gene editing and gene regulation
EP3011034B1 (en) 2013-06-17 2019-08-07 The Broad Institute, Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components
CA2915837A1 (en) 2013-06-17 2014-12-24 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
EP3011032B1 (en) 2013-06-17 2019-10-16 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
DK3011029T3 (da) 2013-06-17 2020-03-16 Broad Inst Inc Administration, modificering og optimering af tandem-guidesystemer, fremgangsmåder og sammensætninger til sekvensmanipulering
EP3725885A1 (en) 2013-06-17 2020-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
US10011850B2 (en) 2013-06-21 2018-07-03 The General Hospital Corporation Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing
CA2917638A1 (en) 2013-07-09 2015-01-15 President And Fellows Of Harvard College Multiplex rna-guided genome engineering
CN110819658B (zh) 2013-07-10 2024-03-22 哈佛大学校长及研究员协会 用于RNA向导的基因调节和编辑的正交Cas9蛋白
US9663782B2 (en) 2013-07-19 2017-05-30 Larix Bioscience Llc Methods and compositions for producing double allele knock outs
US10563225B2 (en) 2013-07-26 2020-02-18 President And Fellows Of Harvard College Genome engineering
US20150044772A1 (en) 2013-08-09 2015-02-12 Sage Labs, Inc. Crispr/cas system-based novel fusion protein and its applications in genome editing
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
WO2015048577A2 (en) 2013-09-27 2015-04-02 Editas Medicine, Inc. Crispr-related methods and compositions
US9074199B1 (en) 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
WO2015089486A2 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
CA2932472A1 (en) 2013-12-12 2015-06-18 Massachusetts Institute Of Technology Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
KR20160097327A (ko) 2013-12-12 2016-08-17 더 브로드 인스티튜트, 인코퍼레이티드 유전자 산물, 구조 정보 및 유도성 모듈형 cas 효소의 발현의 변경을 위한 crispr-cas 시스템 및 방법
WO2015086798A2 (en) 2013-12-13 2015-06-18 Cellectis New method of selection of algal-transformed cells using nuclease
WO2015103153A1 (en) 2013-12-31 2015-07-09 The Regents Of The University Of California Cas9 crystals and methods of use thereof
WO2015161276A2 (en) 2014-04-18 2015-10-22 Editas Medicine, Inc. Crispr-cas-related methods, compositions and components for cancer immunotherapy
WO2015188056A1 (en) 2014-06-05 2015-12-10 Sangamo Biosciences, Inc. Methods and compositions for nuclease design
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
ES2780904T3 (es) 2014-08-17 2020-08-27 Broad Inst Inc Edición genómica usando nickasas Cas9
EP3215617A2 (en) 2014-11-07 2017-09-13 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
AU2015349692B2 (en) 2014-11-21 2021-10-28 Regeneron Pharmaceuticals, Inc. Methods and compositions for targeted genetic modification using paired guide RNAs
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
WO2016106244A1 (en) 2014-12-24 2016-06-30 The Broad Institute Inc. Crispr having or associated with destabilization domains
US20180155708A1 (en) 2015-01-08 2018-06-07 President And Fellows Of Harvard College Split Cas9 Proteins
EP3245232B1 (en) 2015-01-12 2021-04-21 The Regents of The University of California Heterodimeric cas9 and methods of use thereof
HRP20231022T1 (hr) 2015-01-28 2023-12-08 Caribou Biosciences, Inc. Hibridni polinukleotidi crispr dna/rna i načini uporabe
WO2016141224A1 (en) 2015-03-03 2016-09-09 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
WO2016161207A1 (en) 2015-03-31 2016-10-06 Exeligen Scientific, Inc. Cas 9 retroviral integrase and cas 9 recombinase systems for targeted incorporation of a dna sequence into a genome of a cell or organism
US11214779B2 (en) 2015-04-08 2022-01-04 University of Pittsburgh—of the Commonwealth System of Higher Education Activatable CRISPR/CAS9 for spatial and temporal control of genome editing
EP3284749A4 (en) 2015-04-13 2018-11-14 The University of Tokyo Set of polypeptides exhibiting nuclease activity or nickase activity with dependence on light or in presence of drug or suppressing or activating expression of target gene
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
CN106011104B (zh) 2015-05-21 2019-09-27 清华大学 利用拆分Cas系统进行基因编辑和表达调控方法
WO2016196655A1 (en) 2015-06-03 2016-12-08 The Regents Of The University Of California Cas9 variants and methods of use thereof
WO2016205745A2 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Cell sorting
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
WO2016205749A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems
US10648020B2 (en) 2015-06-18 2020-05-12 The Broad Institute, Inc. CRISPR enzymes and systems
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
WO2017015015A1 (en) 2015-07-17 2017-01-26 Emory University Crispr-associated protein from francisella and uses related thereto
US10612011B2 (en) 2015-07-30 2020-04-07 President And Fellows Of Harvard College Evolution of TALENs
US9926546B2 (en) 2015-08-28 2018-03-27 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
EP3350203A4 (en) 2015-09-17 2019-06-26 The Regents of The University of California CAS9 VARIANTS POLYPEPTIDES COMPRISING INTERNAL INSERTIONS
EP3353297A1 (en) 2015-09-24 2018-08-01 Crispr Therapeutics AG Novel family of rna-programmable endonucleases and their uses in genome editing and other applications
WO2017066588A2 (en) 2015-10-16 2017-04-20 Temple University - Of The Commonwealth System Of Higher Education Methods and compositions utilizing cpf1 for rna-guided gene editing
WO2017070605A1 (en) 2015-10-22 2017-04-27 The Broad Institute Inc. Type vi-b crispr enzymes and systems
WO2017081288A1 (en) 2015-11-11 2017-05-18 Lonza Ltd Crispr-associated (cas) proteins with reduced immunogenicity
WO2017099494A1 (ko) 2015-12-08 2017-06-15 기초과학연구원 Cpf1을 포함하는 유전체 교정용 조성물 및 그 용도
US20190264186A1 (en) 2016-01-22 2019-08-29 The Broad Institute Inc. Crystal structure of crispr cpf1
WO2017136335A1 (en) 2016-02-01 2017-08-10 The Regents Of The University Of California Self-inactivating endonuclease-encoding nucleic acids and methods of using the same
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
US20200291370A1 (en) 2016-03-18 2020-09-17 President And Fellows Of Harvard College Mutant Cas Proteins
US20200172935A1 (en) 2016-04-16 2020-06-04 Ohio State Innovation Foundation Modified cpf1 mrna, modified guide rna, and uses thereof
EP3445856A1 (en) 2016-04-19 2019-02-27 The Broad Institute Inc. Novel crispr enzymes and systems
SG10202010311SA (en) 2016-04-19 2020-11-27 Broad Inst Inc Novel Crispr Enzymes and Systems
US20190161743A1 (en) 2016-05-09 2019-05-30 President And Fellows Of Harvard College Self-Targeting Guide RNAs in CRISPR System
WO2017197238A1 (en) 2016-05-12 2017-11-16 President And Fellows Of Harvard College Aav split cas9 genome editing and transcriptional regulation
EP3472311A4 (en) 2016-06-17 2020-03-04 Montana State University BIDIRECTIONAL TARGETING FOR GENOMEDITATION
KR20230156150A (ko) 2016-06-17 2023-11-13 더 브로드 인스티튜트, 인코퍼레이티드 제vi형 crispr 오솔로그 및 시스템
US20190100745A1 (en) 2016-06-20 2019-04-04 Pioneer Hi-Bred International, Inc. Novel cas systems and methods of use
US10927383B2 (en) 2016-06-30 2021-02-23 Ethris Gmbh Cas9 mRNAs
AU2017302551B2 (en) 2016-07-26 2023-04-27 The General Hospital Corporation Variants of CRISPR from Prevotella and Francisella 1 (Cpf1)
US11352647B2 (en) 2016-08-17 2022-06-07 The Broad Institute, Inc. Crispr enzymes and systems
EP3500967A1 (en) 2016-08-17 2019-06-26 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
WO2018035387A1 (en) 2016-08-17 2018-02-22 The Broad Institute, Inc. Novel crispr enzymes and systems
CN109890962A (zh) 2016-09-07 2019-06-14 旗舰创业股份有限公司 用于调节基因表达的方法和组合物
WO2018053053A1 (en) 2016-09-13 2018-03-22 The Broad Institute, Inc. Proximity-dependent biotinylation and uses thereof
EP3530737A4 (en) 2016-09-13 2020-04-29 Toolgen Incorporated METHOD FOR IDENTIFYING DNA BASE EDITING USING CYTOSINE DEAMINASE
EA201990861A1 (ru) 2016-09-30 2019-09-30 Те Риджентс Оф Те Юниверсити Оф Калифорния Рнк-направляемые модифицирующие нуклеиновые кислоты ферменты и способы их применения
KR20230169449A (ko) 2016-09-30 2023-12-15 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 Rna-가이드된 핵산 변형 효소 및 이의 사용 방법
JP2019533996A (ja) 2016-10-07 2019-11-28 インテグレイテツド・デイー・エヌ・エイ・テクノロジーズ・インコーポレイテツド S.ピオゲネスcas9変異遺伝子及びこれによってコードされるポリペプチド
US11242542B2 (en) 2016-10-07 2022-02-08 Integrated Dna Technologies, Inc. S. pyogenes Cas9 mutant genes and polypeptides encoded by same
IT201600102542A1 (it) 2016-10-12 2018-04-12 Univ Degli Studi Di Trento Plasmide e sistema lentivirale contenente un circuito autolimitante della Cas9 che ne incrementa la sicurezza.
EP3525832A4 (en) 2016-10-14 2020-04-29 The General Hospital Corp. SITE SPECIFIC NUCLEASES WITH EPIGENETIC REGULATION
AU2017342543A1 (en) 2016-10-14 2019-05-02 President And Fellows Of Harvard College AAV delivery of nucleobase editors
US11840694B2 (en) 2016-10-17 2023-12-12 Nanyang Technological University Truncated CRISPR-Cas proteins for DNA targeting
WO2018089664A1 (en) 2016-11-11 2018-05-17 The Regents Of The University Of California Variant rna-guided polypeptides and methods of use
WO2018098383A1 (en) 2016-11-22 2018-05-31 Integrated Dna Technologies, Inc. Crispr/cpf1 systems and methods
WO2018209712A1 (en) 2017-05-19 2018-11-22 Tsinghua University Engineering of a minimal sacas9 crispr/cas system for gene editing and transcriptional regulation optimized by enhanced guide rna
US11674128B2 (en) 2016-12-12 2023-06-13 Tsinghua University Engineering of a minimal SaCas9 CRISPR/Cas system for gene editing and transcriptional regulation optimized by enhanced guide RNA
WO2018109101A1 (en) 2016-12-14 2018-06-21 Wageningen Universiteit Thermostable cas9 nucleases
CN110312792B (zh) 2016-12-14 2024-04-09 瓦赫宁根大学 热稳定的Cas9核酸酶
EP3555284B1 (en) 2016-12-16 2021-12-01 The Rockefeller University Compositions and methods using cas9 with enhanced spacer acquisition function
US20200190699A1 (en) 2016-12-19 2020-06-18 Editas Medicine, Inc. Assessing nuclease cleavage
EP3889258A1 (en) 2016-12-19 2021-10-06 Editas Medicine, Inc. Emulsion-based screening methods
JP7229923B2 (ja) 2017-01-06 2023-02-28 エディタス・メディシン、インコーポレイテッド ヌクレアーゼ切断を評価する方法
IT201700016321A1 (it) * 2017-02-14 2018-08-14 Univ Degli Studi Di Trento Mutanti di cas9 ad alta specificita' e loro applicazioni.
US11111492B2 (en) 2017-03-06 2021-09-07 Florida State University Research Foundation, Inc. Genome engineering methods using a cytosine-specific Cas9
CN110913881A (zh) 2017-03-14 2020-03-24 加利福尼亚大学董事会 工程化crispr cas9免疫隐身
WO2018172556A1 (en) 2017-03-24 2018-09-27 Curevac Ag Nucleic acids encoding crispr-associated proteins and uses thereof
US20210047633A1 (en) 2017-03-29 2021-02-18 Editas Medicine, Inc. Selection methods
CN108690845B (zh) 2017-04-10 2021-04-27 中国科学院动物研究所 基因组编辑系统和方法
WO2018191715A2 (en) 2017-04-14 2018-10-18 Synthetic Genomics, Inc. Polypeptides with type v crispr activity and uses thereof
US11591589B2 (en) 2017-04-21 2023-02-28 The General Hospital Corporation Variants of Cpf1 (Cas12a) with altered PAM specificity
US11667677B2 (en) 2017-04-21 2023-06-06 The General Hospital Corporation Inducible, tunable, and multiplex human gene regulation using CRISPR-Cpf1
EP3615665A1 (en) 2017-04-24 2020-03-04 DuPont Nutrition Biosciences ApS Novel anti-crispr genes and proteins and methods of use
WO2018213351A1 (en) 2017-05-16 2018-11-22 The Regents Of The University Of California Thermostable rna-guided endonucleases and methods of use thereof
US11371030B2 (en) 2017-05-31 2022-06-28 The University Of Tokyo Modified Cas9 protein and use thereof
US20200140835A1 (en) 2017-06-06 2020-05-07 The General Hospital Corporation Engineered CRISPR-Cas9 Nucleases
AU2018279829B2 (en) 2017-06-09 2024-01-04 Editas Medicine, Inc. Engineered Cas9 nucleases
US10392616B2 (en) 2017-06-30 2019-08-27 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
CA3069296A1 (en) 2017-07-07 2019-01-10 Toolgen Incorporated Target-specific crispr mutant
US11208640B2 (en) 2017-07-21 2021-12-28 Arizona Board Of Regents On Behalf Of Arizona State University Modulating human Cas9-specific host immune response
MX2020001821A (es) 2017-08-15 2020-09-18 Intellia Therapeutics Inc Ácidos nucleicos estabilizados que codifican el ácido ribonucleico mensajero (arnm).
JP2020532967A (ja) 2017-08-23 2020-11-19 ザ ジェネラル ホスピタル コーポレイション 変更されたPAM特異性を有する遺伝子操作されたCRISPR−Cas9ヌクレアーゼ
WO2019046540A1 (en) 2017-08-31 2019-03-07 New York Genome Center, Inc. METHODS AND COMPOSITIONS COMPRISING CRISPR-CPF1 AND APPROVED GUIDING CRISPR RNAES FOR PROGRAMMABLE GENOMIC DELETIONS
WO2019049913A1 (ja) 2017-09-05 2019-03-14 国立大学法人 東京大学 改変されたCas9タンパク質及びその用途
WO2019051419A1 (en) 2017-09-08 2019-03-14 University Of North Texas Health Science Center MODIFIED CASE VARIANTS9
WO2019060469A2 (en) 2017-09-19 2019-03-28 Massachusetts Institute Of Technology CAS9 STREPTOCOCCUS CANIS AS A GENOMIC ENGINEERING PLATFORM WITH NEW PAM SPECIFICITY
CN111373041A (zh) 2017-09-26 2020-07-03 伊利诺伊大学理事会 用于基因组编辑和调节转录的crispr/cas系统和方法
GB201716590D0 (en) 2017-10-10 2017-11-22 Univ Wageningen Thermostable cas9 nucleases with reduced off-target activity
WO2019083532A1 (en) 2017-10-26 2019-05-02 Excision Biotherapeutics Inc IDENTIFICATION OF GENE EDITION PROTEINS AND GENE EXCISION (TYPE CAS9 AND ARGONAUTE) FROM OTHER ORGANISMS
EP3704254A4 (en) 2017-11-01 2021-09-01 The Regents of The University of California CAS12C COMPOSITIONS AND METHOD OF USE
US20200255858A1 (en) 2017-11-01 2020-08-13 Jillian F. Banfield Casy compositions and methods of use
WO2019089808A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Class 2 crispr/cas compositions and methods of use
RU2020117711A (ru) 2017-11-01 2021-12-02 Те Риджентс Оф Те Юниверсити Оф Калифорния КОМПОЗИЦИИ И СПОСОБЫ ПРИМЕНЕНИЯ CasZ
US20200291395A1 (en) 2017-11-02 2020-09-17 Arbor Biotechnologies, Inc. Novel crispr-associated transposon systems and components
MA50578A (fr) 2017-11-09 2021-09-15 Vertex Pharma Systèmes crispr/cas pour le traitement de dmd
CN111511908A (zh) 2017-11-10 2020-08-07 诺维信公司 温度敏感性cas9蛋白
WO2019099943A1 (en) 2017-11-16 2019-05-23 Astrazeneca Ab Compositions and methods for improving the efficacy of cas9-based knock-in strategies
US20210079366A1 (en) 2017-12-22 2021-03-18 The Broad Institute, Inc. Cas12a systems, methods, and compositions for targeted rna base editing
WO2019126716A1 (en) 2017-12-22 2019-06-27 The Broad Institute, Inc. Cas12b systems, methods, and compositions for targeted rna base editing
WO2019126709A1 (en) 2017-12-22 2019-06-27 The Broad Institute, Inc. Cas12b systems, methods, and compositions for targeted dna base editing
EP3727469A4 (en) 2017-12-22 2021-12-01 The Broad Institute, Inc. NEW CRISPR ENZYMES AND SYSTEMS
US20220307001A1 (en) 2018-02-27 2022-09-29 President And Fellows Of Harvard College Evolved cas9 variants and uses thereof
US20230242891A1 (en) 2018-03-14 2023-08-03 Arbor Biotechnologies, Inc. Novel crispr dna and rna targeting enzymes and systems
PT3765615T (pt) 2018-03-14 2023-08-28 Arbor Biotechnologies Inc Novas enzimas e sistemas de direcionamento de dna crispr
WO2019183150A1 (en) 2018-03-19 2019-09-26 Casebia Therapeutics Limited Liability Partnership Novel rna-programmable endonuclease systems and uses thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016205613A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Crispr enzyme mutations reducing off-target effects
WO2017040348A1 (en) * 2015-08-28 2017-03-09 The General Hospital Corporation Engineered crispr-cas9 nucleases
WO2017070633A2 (en) * 2015-10-23 2017-04-27 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
KLEINSTIVER BP ET AL.: "Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition" *
KLEINSTIVER BP ET AL.: "Engineered CRISPR-Cas9 nucleases with altered PAM specificities" *
KLEINSTIVER BP. ET AL.: "High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects" *
SLAYMAKER IM. ET AL.: "Rationally engineered Cas9 nucleases with improved specificity" *

Also Published As

Publication number Publication date
CA3065813A1 (en) 2018-12-13
US11098297B2 (en) 2021-08-24
WO2018227114A1 (en) 2018-12-13
KR20200016892A (ko) 2020-02-17
US20180355332A1 (en) 2018-12-13
AU2018279829A1 (en) 2020-01-02
JP2024001075A (ja) 2024-01-09
US10428319B2 (en) 2019-10-01
EP3635104A1 (en) 2020-04-15
US20200056164A1 (en) 2020-02-20
MX2019014640A (es) 2020-10-05
AU2018279829B2 (en) 2024-01-04
JP2020524497A (ja) 2020-08-20
US20220177861A1 (en) 2022-06-09

Similar Documents

Publication Publication Date Title
US20220177861A1 (en) Engineered cas9 nucleases
US20220106600A1 (en) Crispr-cas-related methods, compositions and components for cancer immunotherapy
US20230018543A1 (en) Crispr/cas-mediated gene conversion
US20210403926A1 (en) Methods and compositions for efficient delivery of nucleic acids and rna-based antimicrobials
US11242525B2 (en) CRISPR/CAS-related methods and compositions for treating sickle cell disease
EP3443086B1 (en) Cas9 fusion molecules, gene editing systems, and methods of use thereof
KR102532663B1 (ko) 베타 이상헤모글로빈증의 치료를 위한 crispr/cas-관련 방법 및 조성물
KR102535217B1 (ko) Cas9 분자/가이드 rna 분자 복합체의 평가
KR102604903B1 (ko) 내인성 및 공급원 DNA의 원-샷 가이드 RNA(ogRNA) 표적화를 위한 시스템 및 방법
CA3040030A1 (en) Self-limiting cas9 circuitry for enhanced safety (slices) plasmid and lentiviral system thereof
US20210115475A1 (en) Systems and methods for modulating chromosomal rearrangements
EP3443088A1 (en) Grna fusion molecules, gene editing systems, and methods of use thereof
AU2002234572B2 (en) A method for in vitro molecular evolution of protein function
US6958213B2 (en) Method for in vitro molecular evolution of protein function
US20210047633A1 (en) Selection methods
EP4117714A1 (en) Compositions and methods for modifying a target nucleic acid
WO2023019164A2 (en) High-throughput precision genome editing in human cells
WO2022204268A2 (en) Novel crispr enzymes, methods, systems and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination