CN107208079B - 整合转基因的位点定向crispr/重组酶组合物和方法 - Google Patents

整合转基因的位点定向crispr/重组酶组合物和方法 Download PDF

Info

Publication number
CN107208079B
CN107208079B CN201580064960.7A CN201580064960A CN107208079B CN 107208079 B CN107208079 B CN 107208079B CN 201580064960 A CN201580064960 A CN 201580064960A CN 107208079 B CN107208079 B CN 107208079B
Authority
CN
China
Prior art keywords
leu
lys
asp
glu
arg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580064960.7A
Other languages
English (en)
Other versions
CN107208079A (zh
Inventor
R·雁如·蔡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Applied StemCell Inc
Original Assignee
Applied StemCell Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Applied StemCell Inc filed Critical Applied StemCell Inc
Publication of CN107208079A publication Critical patent/CN107208079A/zh
Application granted granted Critical
Publication of CN107208079B publication Critical patent/CN107208079B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/85Fusion polypeptide containing an RNA binding domain
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

本申请公开了靶向的嵌合多肽、其组合物、表达载体及其使用方法,用于产生转基因细胞、组织、植物和动物。本发明的组合物、载体和方法也可用于基因治疗和细胞治疗技术。所述嵌合多肽包括CRISPR‑Cas结构域和重组酶结构域。

Description

整合转基因的位点定向CRISPR/重组酶组合物和方法
相关申请的交叉引用
本申请要求2014年12月5日提交的美国临时专利申请62/088,440的优先权,其公开内容在此参考并入。
发明领域
本发明通常涉及用于将转基因整合到细胞基因组中的组合物和方法。
背景技术
来源于成簇的、规律间隔的短回文重复序列(CRISPR)-Cas系统的RNA导向的Cas9核酸酶提供了用于编辑多种生物体的基因组的通用工具。然而,目前基于CRISPR-Cas系统的技术具有有限的插入大片段DNA的能力,并且无法在非分裂细胞(如神经元)或具有DNA同源重组缺陷的细胞中进行基于同源性的编辑,例如靶向转基因插入。因此,仍然需要新的基因组工程技术,所述技术可负担得起,易于建立并且能够在非分裂细胞或具有DNA同源重组缺陷的细胞中编辑基因组。
发明简述
本申请公开了靶向的嵌合多肽,包括其组合物、表达载体及其使用方法,用于产生转基因细胞、组织、植物和动物。本发明的组合物、载体和方法也可用于基因治疗和细胞治疗技术。
一方面,本公开涉及嵌合多肽。该多肽包括:1)CRISPR-Cas结构域和2)重组酶结构域。在各种实施方式中,CRISPR-Cas结构域能够结合向导RNA,其中所述向导RNA能够与靶DNA序列杂交,并且重组酶结构域包含位点特异性重组酶、其突变体或其片段。
在一些实施方式中,CRISPR-Cas结构域包含II型Cas9蛋白(SEQ ID NO:1)或其片段。在某些实施方式中,CRISPR-Cas结构域不具有核酸内切酶活性。在某些实施方式中,CRISPR-Cas结构域是失去催化能力的Cas9(dCas9)。在某些实施方式中,CRISPR-Cas结构域包含SEQ ID.1的氨基酸序列。
在一些实施方式中,重组酶结构域包含位点特异性重组酶。在一些实施方式中,位点特异性重组酶是酪氨酸重组酶。酪氨酸重组酶的实例包括但不限于Cre、Flp和λ整合酶。在一些实施方式中,位点特异性重组酶是丝氨酸重组酶。丝氨酸重组酶的实例包括γ-δ解离酶、Tn3解离酶(SEQ ID NO:2)、Sin解离酶、Gin转化酶、Hin转化酶、Tn5044解离酶、IS607转座酶和整合酶。在一些实施方式中,位点重组酶是选自Bxb1、wBeta、BL3、phiR4、A118、TG1、MR11、phi370、SPBc、TP901-1、phiRV、FC1、K38、phiBT1和phiC31(SEQ ID NO.3)的整合酶。
在某些实施方式中,重组酶结构域包含如上所述的位点特异性重组酶的突变型或片段。在某些实施方案中,突变体具有改变的靶特异性。在一些实施方式中,突变体具有降低的靶特异性。在某些实施方式中,重组酶结构域包含重组酶的活化突变体,包括但不限于Tn3的活化突变体和phiC31的活化突变体。在某些实施方式中,重组酶结构域是重组酶的活化突变体的催化结构域。在某些实施方式中,重组酶结构域包含Tn3的活化突变体的催化结构域。在某些实施方式中,重组酶结构域具有选自如表1所列的SEQ ID NO:5及其变体的氨基酸序列。
在某些实施方式中,多肽还包含连接CRISPR-Cas结构域和重组酶结构域的接头。在某些实施方式中,接头具有苏氨酸-丝氨酸的氨基酸序列。
另一方面,本申请公开了包含上文所公开的多肽和向导RNA的组合物。在某些实施方式中,组合物还包含供体DNA,所述供体DNA含有位点特异性重组酶识别的第一核苷酸序列和转基因。
另一方面,本申请公开了组合物,所述组合物包含一种或多种载体,所述载体包含(i)编码上文所公开的多肽的第一核苷酸序列;和(ii)编码向导RNA的第二核苷酸序列,其中第一和第二核苷酸位于相同或不同的载体上。在某些实施方式中,组合物还包含供体DNA,其包含由上文所公开的多肽识别的第三核苷酸序列和转基因。在某些实施方式中,组合物还包含编码位点特异性重组酶的第四核苷酸序列。
本申请的另一方面涉及将转基因整合到细胞的基因组中的方法。在某些实施方式中,该方法包括向细胞中引入上文所公开的组合物。在某些实施方式中,细胞是真核细胞,例如哺乳动物或人细胞。在某些实施方式中,细胞是单细胞胚胎。
通过以下描述、所附权利要求和附图,可以更好的理解本发明的这些和其它特征、方面和优点。
附图简述
图1是在靶序列上形成的gRNA导向的Cas-重组酶嵌合多肽复合物(CasR复合物)的示意图,以介导供体DNA和靶DNA之间的重组。通常,靶DNA包括与重组酶识别位点相似的序列(靶位点)。复合物包含两个嵌合多肽(CasR),每个嵌合多肽包括CRISPR-Cas结构域(gRNA结合结构域)和重组酶结构域。CRISPR-Cas结构域能够与向导RNA结合。Cas结构域和重组酶结构域通过肽接头连接。当结合到与靶位点侧翼序列杂交的向导RNA时,两个CasR分别到达靶位点,其中重组酶结构域在靶位点形成二聚体。然后在靶位点形成重组酶或重组酶结构域的四聚体,并通过结合其同源位点而被激活,并介导供体DNA和靶DNA之间的重组。
图2A是在靶序列上形成的位点定向重组酶复合物以介导供体DNA和靶DNA之间的重组的另一个实施方式。复合物包含与靶DNA中的第一序列杂交的第一CRISPR-Cas系统向导RNA,与靶DNA中的第二序列杂交的第二CRISPR-Cas系统向导RNA和至少两个位点定向的修饰多肽,所述多肽包含能够结合第一或第二CRISPR-Cas系统向导RNA的向导RNA结合结构域和重组酶结构域。gRNA结合结构域和重组酶结构域通过肽接头连接。当位点导向修饰多肽通过向导RNA结合结构域与向导RNA结合后,位点定向修饰多肽到达靶序列。在靶序列上形成重组酶或重组酶结构域的四聚体,并通过结合其同源位点而被激活,并介导供体DNA和靶DNA之间的重组。同源位点位于辅助DNA或供体载体上。
图2B示出了在靶序列处形成的位点定向重组酶复合物以介导供体DNA和靶DNA之间的重组的另一个实施方式。以整合酶为例说明了位点定向CRISPR/重组酶如何用于转基因插入。当位点定向修饰多肽通过向导RNA结合结构域与向导RNA结合后,其到达靶序列。在靶序列上形成整合酶或其结构域的四聚体或具有改变的靶特异性的变体,并通过与其同源位点attP和attB结合而激活,并介导供体DNA与靶DNA之间的重组。attP位点位于辅助DNA上或attB位点位于供体载体上。
图3说明用于测试CasR介导C位点重组的能力的大肠杆菌菌落颜色重组测定。含有底物质粒的菌株用CasR表达质粒和gRNA表达质粒共转化。在补充有1%半乳糖、卡那霉素(选择底物质粒或其离析度积)和氨苄青霉素和/或氯霉素(选择pCasR表达质粒)的MacConkey-半乳糖指示板(MacConkey琼脂碱(Difco))上选择转化体。淡色(galK-)菌落表示重组(离析)能力,而红色(galK+)菌落表明缺乏离析。
图4示出了Tn3 res位点I和类似于Tn3 res位点I的6个22bp的含TATA的序列,其与位点I的中心TATA比对。与含TATA序列的中心12bp内的位点I相同的碱基由下划线标出。
图5示出了I位点和C位点。
发明详述
在上述发明概述和发明详述,以及以下权利要求书和附图中,参考了本发明的特定特征(包括方法步骤)。应当理解,本说明书中的本发明的公开内容包括这些特定特征的所有可能的组合。例如,在本发明的特定方面或实施例或特定权利要求的上下文中公开特定特征的情况下,该特定特征也可以在可能的范围内,与本发明的其他特定方面和实施例结合和/或在其他特定方面和实施例的上下文中以及在本发明的一般方面使用该特征。
术语“包括”及其语法等效物在本文中用于表示任选存在其它组分、成分、步骤等。例如,一件物品“包含”(或“其包含”)组分A、B和C可以由组分A,B和C组成(即仅含有),或不仅可以含有组分A,B和C而且还有一个或多个其他组分。
在本文中提及包括两个或多个定义的步骤的方法的情况下,所定义的步骤可以以任何顺序或同时进行(除非上下文排除了该可能性),并且该方法可以包括一个或多个在任何定义的步骤之前、在两个定义的步骤之间或在所有定义的步骤之后执行的其他步骤(除非上下文排除了该可能性)。
在提供数值范围的情况下,应当理解,除非上下文另有明确规定,至该下限单位的十分之一、在该范围的上限和下限之间以及在所述范围内的任何其他所述值或中间值,这些中间值均包含在本公开中,包括在所述范围内的任何明确排除的限制。如果所述范围包括一个或两个限制,则不包括这些限制中的一个或两个的范围也包括在本公开中。
应当理解,为了说明的简单和清楚,在适当的情况下,在不同的图中已经重复了参考数字以指示对应的或类似的元件。此外,阐述了许多具体细节,以便提供对本文所述实施例的透彻理解。然而,本文描述的实施例可以在没有其具体细节的情况下实施。在其他情况下,尚未详细描述方法、程序和组件,以免模糊所描述的相关功能。而且,描述不被认为是限制本文中描述的实施范围。应当理解,除非另有说明,否则本公开中阐述的实施例的描述和表征不应被视为相互排斥。
在本公开中使用以下定义:
术语“核酸分子”和“多核苷酸”可互换使用,并且是指任何长度的核苷酸的聚合形式,脱氧核糖核苷酸或核糖核苷酸或其类似物。多核苷酸可以具有任意三维结构,并且可以表现任意已知或未知的功能。多核苷酸的非限制性实例包括基因、基因片段、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、核酶、cDNA、重组多核苷酸,支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离RNA、核酸探针和引物。
如本文所用,术语“载体”是指能够在不同遗传环境之间传输与其可操作连接的另一种核酸的核酸分子。优选的载体是能够自主复制和表达存在于它们可操作连接的DNA区段中的结构基因产物的载体。因此,载体优选含有前面所述的复制子和选择标记。载体包括但不必限于表达载体。
如本文所用,术语“表达载体”是指已经通过插入或掺入异源DNA(例如编码本文融合蛋白的核酸或本文提供的表达盒)处理的本领域已知的质粒、病毒、噬菌粒或其他载体。这些表达载体通常含有用于在细胞中有效转录插入的核酸的启动子序列。表达载体通常含有复制起点、启动子,以及允许转化细胞表型选择的特定基因。
一方面,本公开提供了可用于在细菌和哺乳动物细胞中重组DNA的CRISPR-Cas重组酶(CasR)。CasR包含CRISPR-Cas结构域和重组酶结构域。CRISPR-Cas结构域通过向导RNA介导CasR对特异性靶序列的识别,重组酶结构域进行重组。
如本文所用,术语“重组酶”或“位点特异性重组酶”是指促进特异性靶位点之间的DNA重排的高度专门的酶家族(Greindley等人.,2006;Esposito,D.,and Scocca,J.J.,Nucleic Acids Research 25,3605-3614(1997);Nunes-Duby,S.E.,等人,Nucleic AcidsResearch 26,391-406(1998);Stark,W.M.,等人,Trends in Genetics 8,432-439(1992))。几乎所有的位点定向重组酶可以归类为两个结构和机制上不同的组之一:酪氨酸(例如Cre、Flp和λ整合酶)或丝氨酸(例如phiC31整合酶、γ-δ解离酶,Tn3解离酶和Gin转化酶)重组酶。两个重组酶家族都识别由两个反向重复的结合元件组成的靶位点,这些结合元件位于发生DNA断裂和再连接的间隔序列两侧。重组过程需要两个重组酶单体与每个靶位点的同时结合:两个DNA结合二聚体(四聚体)然后连接形成突触形复合体,导致交叉和链交换。可能是通过重构四聚体的三/四级结构,在Tn3解离酶中含有活化突变的“高度活跃”形式的Tn3解离酶可以在28bp的核心位点催化链交换,而不需要辅助位点,据推测是通过四聚体的三级/四级结构构象完成的。
本文所用的“位点定向重组酶活性”或“位点定向重组”是指通常由位点特异性重组酶介导的第一核酸序列与第二核酸序列的序列特异性重组。通常,位点特异性重组发生在由重组酶识别的特定定义的序列上。与随机整合相比,位点定向重组酶在特定序列(例如,重组酶附着位点)以更高效率发生。
在某些实施方式中,位点特异性重组酶是Tn3解离酶。在某些实施方式中,位点特异性重组酶是Gin转化酶。在某些实施方式中,位点特异性重组酶是选自Bxb1、wBeta、BL3phiR4、A118、TG1、MR11、phi370、SPBc、TP901-1、phiRV、FC1、K38、phiBT1和phiC31的整合酶。
在一些实施方式中,重组酶结构域包含位点特异性重组酶或其片段的变体(突变体),其中所述变体具有改变的靶特异性。已经建立了改变重组酶的靶特异性的方法。例如,Buchholz和Stewart通过易错聚合酶链反应、DNA改组和基于lacZ的蓝/白复合筛选产生具有增强的热稳定性的Flp变体的随机诱变(Buchholz等,1998)。在另一个实例中,在存在缺陷的整合宿主因子活性的情况下通过选择(Miller等,1980)和逆转分析(Wu等,1997),鉴定了λ-整合酶的辅助因子独立变体。在另一个例子中,Voziyanov等人(2002)开发了一个双重报告筛选,可以直接读取单个突变对Flp特异性的影响,并确定了许多具有改变的靶特异性的Flp变体。在另一个例子中,Buchholze和Stewart开发了一种称为底物连接蛋白进化(SLiPE)的技术,将各个重组酶变体物理连接到其DNA底物(Buchholz和Stewart,2001)。在一些实施方式中,位点特异性重组酶的变体具有降低的靶特异性。
最近,已经鉴定了几种丝氨酸重组酶(例如Tn3)的突变体,其不需要辅助因子用于重组(Proudfoot等人,2001,Zinc Finger Recombinases with Adaptable DNA SequenceSpecificity。PloS ONE 6(4):e19537)。这说明丝氨酸重组酶的天然DNA结合结构域(DBD)可以用专门设计的ZFP替换以产生嵌合的锌指重组酶(ZFR)。ZFR由来自丝氨酸重组酶的解离酶/转化酶家族的活化的催化结构域和可以被专门设计用于识别几乎任意DNA序列的锌指DNA结合结构域组成。ZFR在由重组酶催化结构域识别的中心20-bp核心序列侧翼的双倒置锌指结合位点(ZFBS)组成的特异性ZFR靶位点之间催化重组。与锌指核酸酶(ZFN)和TAL效应核酸酶(TALEN)相反,ZFR自主作用,可以在人和小鼠细胞中切割并整合转基因,而不激活细胞DNA损伤反应途径。基本上,可以产生能够识别大量的序列的ZFR,然而,缺乏能够识别所有可能的DNA三联体的锌指结构域限制了这些酶的潜在的模块化靶向能力。
在肽或蛋白质中,氨基酸的合适的保守取代是本领域技术人员已知的,并且通常可以制备而不改变所得分子的生物活性。本领域技术人员认识到,通常,多肽的非必要区域中的单个氨基酸取代基本上不改变生物活性(参见例如Watson等人,Molecular Biologyof the Gene,第4版,1987,Benjamin/Cummings,p.224)。特别地,这种保守变体具有修饰的氨基酸序列,使得所述改变基本上不改变蛋白质(保守变体)的结构和/或活性,例如抗体活性、酶活性或受体活性。这些包括对氨基酸序列的保守修饰变化,即氨基酸取代、对于蛋白质活性不重要的那些残基的添加或缺失,或用具有相似性质的残基(例如,酸性、碱性、正电荷或负电荷、极性或非极性等)取代氨基酸,使得甚至关键氨基酸的取代基本上不改变结构和/或活性。提供功能相似氨基酸的保守取代表是本领域公知的。例如,选择保守取代的一个示例性指南包括(原始残基,然后是示例性取代):丙氨酸/甘氨酸或丝氨酸;精氨酸/赖氨酸;天冬酰胺/谷氨酰胺或组氨酸;天冬氨酸/谷氨酸;半胱氨酸/丝氨酸;谷氨酰胺/天冬酰胺;甘氨酸/天冬氨酸;甘氨酸/丙氨酸或脯氨酸;组氨酸/天冬酰胺或谷氨酰胺;异亮氨酸/亮氨酸或缬氨酸;亮氨酸/异亮氨酸或缬氨酸;赖氨酸/精氨酸或谷氨酰胺或谷氨酸;甲硫氨酸/亮氨酸或酪氨酸或He;苯丙氨酸/甲硫氨酸或亮氨酸或酪氨酸;丝氨酸/苏氨酸;苏氨酸/丝氨酸;色氨酸/酪氨酸;酪氨酸/色氨酸或苯丙氨酸;缬氨酸/异亮氨酸或亮氨酸。替代的示例性指南使用以下六组,每组含有彼此保守取代的氨基酸:(1)丙氨酸(A或Ala)、丝氨酸(S或Ser)、苏氨酸(T或Thr);(2)天冬氨酸(D或Asp)、谷氨酸(E或Glu);(3)天冬酰胺(N或Asn)、谷氨酰胺(Q或Gln);(4)精氨酸(R或Arg)、赖氨酸(K或Lys);(5)异亮氨酸(I或He)、亮氨酸(L或Leu)、甲硫氨酸(M或Met)、缬氨酸(V或Val);和(6)苯丙氨酸(F或Phe)、酪氨酸(Y或Tyr)、色氨酸(W或Trp);(也参见例如Creighton(1984)Proteins,W.H.Freeman and Company;Schulz and Schimer(1979)Principles of Protein Structure,Springer-Verlag)。本领域技术人员将理解,上述取代不是唯一可能的保守取代。例如,出于某些目的,可以将所有带电荷的氨基酸视为彼此的保守取代,无论它们是正电荷还是负电荷。另外,在编码序列中改变,添加或删除单个氨基酸或小百分比氨基酸的个体取代、缺失或添加也可以被认为是“保守修饰的变体”,当三维结构和待传递的蛋白质功能通过这种变化来保存。
通常,“CRISPR-Cas系统”或“CRISPR系统”共同指涉及CRISPR相关(“Cas”)基因的表达或导向活性的转录物和的其它元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分的tracrRNA)、tracr-mate序列(包括在内源CRISPR系统的背景中的“直接重复”和tracrRNA加工的部分直接重复)、指导序列(在内源CRISPR系统的背景中也称为“间隔子”),或来自CRISPR基因座的其他序列和转录物。在一些实施方式中,CRISPR系统的一个或多个元件来自I型、II型或III型CRISPR系统。在一些实施方式中,CRISPR系统的一个或多个元件来自包含内源性CRISPR系统(例如化脓链球菌)的特定生物体。通常,CRISPR系统的特征在于促进在靶序列的位点(在内源性CRISPR系统的背景中也被称为原间隔子)的CRISPR复合物的形成。
通常,“CRISPR-Cas向导RNA”或“向导RNA”是指指导CRISPR复合物与靶序列进行序列特异性结合的RNA。向导RNA通常包含(i)与靶多核苷酸序列具有足够互补性以与靶序列杂交的引导序列和(ii)反式激活性cr(tracr)伴侣序列。在一些实施方式中,当使用合适的比对算法进行最佳比对时,引导序列及其相应靶序列之间的互补程度为约为或大于50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。可以使用用于比对序列的任何合适的算法来确定最佳比对,其非限制性实例包括Smith-Waterman算法、Needleman-Wunsch算法、基于Burrows-Wheeler变换的算法(例如,Burrows Wheeler Aligner)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies、ELAND(Illumina,San Diego,Calif)、SOAP(可从soap.genomics.org.cn获得)和Maq(可从maq.sourceforge.net获得)。在一些实施方式中,引导序列长度约为或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸。在一些实施方式中,引导序列长度小于约75、50、45、40、35、30、25、20、15、12或更少的核苷酸。引导序列引导CRISPR复合物与靶序列的序列特异性结合的能力可以通过任何合适的测定来评估。例如,足以形成CRISPR复合物的CRISPR系统的组分,包括待测试的引导序列,可以提供给具有相应靶序列的宿主细胞,例如通过用编码CRISPR序列的组分的载体转染,然后评估在靶序列中的优选切割,例如通过如本文所述的Surveyor测定。类似地,靶多核苷酸序列的切割可以通过在测试试管中提供靶序列、CRISPR复合物的组分,包括待测试的引导序列和与测试引导序列不同的对照引导序列,并且比较在测试和对照引导序列反应之间的靶序列处的结合或切割速率来进行评估。其他测定是可能的,并且本领域技术人员将想到。
在形成CRISPR复合物的背景中,“靶序列”或“靶DNA的序列”是指引导序列被设计为与其具有互补性的序列,其中靶序列和引导序列杂交促进形成CRISPR复合物。完全互补不是必需的,只要有足够的互补性能引起杂交并促进CRISPR复合物的形成。靶序列可以包含任何多核苷酸,例如DNA或RNA多核苷酸或DNA/RNA杂交多核苷酸。在一些实施方式中,靶序列位于细胞的细胞核或细胞质中。在一些实施方式中,靶序列可以在真核细胞的细胞器内,例如线粒体或叶绿体。
可以选择引导序列来靶向任何靶序列。在一些实施方式中,靶序列是细胞基因组内的序列。示例性靶序列包括在靶基因组中独特的靶序列。例如,对于化脓性链球菌Cas9,基因组中唯一的靶序列可以包括形式为MMMMMMMMNNNNNNNNNNNNXGG的Cas9靶位点,其中NNNNNNNNNNNNXGG(N是A、G、T或C;X可以是任何核苷酸)在基因组中唯一存在。对于嗜热链球菌CRISPR1Cas9,基因组中唯一的靶序列可以包括形式为MMMMMMMMNNNNNNNNNNNNXXAGAAW的Cas9靶位点,其中NNNNNNNNNNNNXXAGAAW(SEQ ID NO:2)(N是A、G、T或C;X可以是任何核苷酸;和W是A或T)在基因组中唯一存在。在这些序列的每一个中,“M”可以是A、G、T或C,并且在将序列识别为唯一时不需要考虑。
在一些实施方式中,选择引导序列以减少引导序列内的二级结构的程度。二级结构可以通过任何合适的多核苷酸折叠算法来确定。一些程序是基于计算最小吉布斯自由能。一个这样的算法的例子是mFold,如Zuker和Stiegler(Nucleic Acids Res.9(1981),133-148)所述。另一个示例折叠算法是在维也纳大学理论化学研究所开发的在线网络服务器RNAfold,使用质心结构预测算法(参见例如AR Gruber等人,2008,Cell 106(1):23-24;以及PA Carr和GM Church,2009,Nature Biotechnology 27(12):1151-62)。
如本文所用,tracr匹配序列包括与tracr序列具有足够互补性的任何序列以促进以下各项中的一个或多个:(1)在含有相应的tracr序列的细胞中切除侧翼为tracr mate序列的引导序列;和(2)在靶序列上形成CRISPR复合物,其中CRISPR复合物包含与tracr序列杂交的tracr匹配序列。一般来说,互补程度是指tracr匹配序列和tracr序列沿着两个序列中较短者的长度的最佳比对。可以通过任何合适的比对算法来确定最佳比对,并且还可以解释二级结构,例如tracr序列或tracr匹配序列中的自互补性。在一些实施方式中,当最佳比对时,沿着两个序列较短者的长度,tracr序列和tracr匹配序列之间的互补程度大约为或大于约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%或更高。
在一些实施方式中,向导RNA包含与tracr序列融合的引导序列,即,tracr序列和tracr匹配序列包含在单个转录子内,使得两者之间的杂交产生具有二级结构(如发夹)的转录子。在一些实施方式中,所述tracr序列长度约为或大于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50个或更多个核苷酸。用于发夹结构的优选的环形成序列的长度为四个核苷酸,最优选具有序列GAAA。然而,可以使用更长或更短的环序列,作为替代序列。序列优选包括核苷酸三联体(例如AAA)和另外的核苷酸(例如C或G)。环形成序列的实例包括CAAA和AAAG。在本申请的一个实施方式中,向导RNA具有至少两个或更多个发夹。在优选的实施方式中,向导RNA具有2、3、4或5个发夹。在本发明的另一个实施方式中,向导RNA具有至多5个发夹。在一些实施方式中,向导RNA还包括转录终止序列、优选多聚胸腺嘧啶(T)序列,例如6个胸腺嘧啶(T)核苷酸。在一些实施方式中,所述tracr序列是包含tracr匹配序列的转录子的单独转录子。
在一些实施方式中,CRISPR-Cas结构包含Cas蛋白。Cas蛋白的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2.Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4,其同系物,或其修饰版本。这些酶是已知的;例如,可以以登录号Q99ZW2在SwissProt数据库中找到化脓性链球菌Cas9蛋白(SEQ ID NO.1)的氨基酸序列。在一些实施方式中,未修饰的Cas蛋白具有DNA切割活性。在一些实施方式中,Cas蛋白引导靶序列(例如靶序列内和/或靶序列的互补链内)位置处的一条或两条链的切割。在一些实施方式中,Cas蛋白质引导一条或两条链在距离靶序列的第一个或最后一个核苷酸的约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多的碱基对处的切割。在一些实施方式中,Cas蛋白质突变,使得突变的Cas蛋白缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力。例如,来自化脓性链球菌的Cas9的RuvC I催化结构域中的天冬氨酸至丙氨酸取代(D10A)将Cas9从将两条链切割的核酸酶转化成切口酶(切割单链)。使Cas9为切口酶的突变的其它实例包括但不限于H840A、N854A和N863A。在一些实施方式中,Cas蛋白的片段缺少DNA切割活性,例如,该片段不含Cas蛋白的催化结构域(例如,Cas9的RuvC I、RuvC II和RuvC III结构域)。在一些实施方式中,Cas9(RuvC I、RuvC II和RuvC III)的两个或多个催化结构域可能突变以产生基本上缺乏所有DNA切割活性的突变的Cas9。在一些实施方式中,D10A突变与一个或多个H840A,N854A或N863A突变组合以产生基本上缺乏所有DNA切割活性的Cas9酶。在一些实施方式中,当突变酶的DNA切割活性相对于其非突变形式小于约25%、10%、5%、1%、0.1%、0.01%或更低时,认为Cas蛋白基本上缺乏所有DNA切割活性。其他突变可能是有用的;其中Cas9或其他Cas蛋白来自除化脓性链球菌以外的物种,可能会产生相应氨基酸的突变以达到类似的效果。
在一些实施方式中,重组酶活性的位点由CRISPR-Cas系统向导RNA确定。在与向导RNA结合后,将位点定向修饰多肽定向到靶序列,并在重组酶的重组位点如整合酶附着位点,attP和attB存在下发挥重组酶活性。例如,Cas9向导RNA可以引导包含Cas9和phiC31的多肽以在靶序列形成复合物。在其同源attP和attB位点的存在下,phiC31整合酶被激活以介导供体DNA和靶序列之间的位点特异性重组,导致DNA序列与靶序列的整合。
在一些实施方式中,供体DNA包含在靶序列待插入的转基因和整合酶的野生型重组附着位点。
本文所用的“重组位点”是指由重组酶识别和使用的重组位点。例如,λ是感染大肠杆菌的温和噬菌体。该噬菌体具有一个用于重组的附着位点(attP),大肠杆菌细菌基因组具有一个用于重组的附着位点(attB)。这两个位点都是λ整合酶的野生型重组位点。在本发明的上下文中,野生型重组位点发生在同源噬菌体/细菌系统中。因此,野生型重组位点可以来自同源系统并与异源序列相关联,例如,attB位点可以置于其它系统中,作为整合酶的底物。
在一些实施方式中,位点定向修饰多肽中的整合酶是细菌噬菌体phiC31。噬菌体phiC31的野生型attB和attP识别位点的长度通常为约34至40个核苷酸(Groth等,ProcNatl AcadSci USA 97:5995-6000(2000))。这些位点通常排列如下:AttB包含第一DNA序列attB5'、核心区域和第二DNA序列attB3',相对顺序为5'至3'attB5'-核心区域-attB3'。AttP包含第一DNA序列attP5'、核心区域和第二DNA序列attP3',相对顺序为5'至3'attP5'-核心区域-attP3'的顺序。phiC31的attP和attB的核心区域具有序列5'-TTG-3'。
在一些实施方式中,组合物还包含辅助DNA,其包含由位点特异性重组酶识别的第二核苷酸序列。预期辅助DNA有助于形成包含向导RNA的复合物,在靶DNA序列上的一个或多个位点定向修饰多肽,其中复合物在介导供体DNA和靶DNA之间的重组中起作用,导致在供体DNA中的DNA序列插入到靶DNA中。在一些实施方式中,辅助DNA与向导RNA中的序列杂交。在这种情况下,在辅助DNA的存在下,在供体DNA上结合第二核苷酸序列的至少两个重组酶结构域与在辅助DNA上结合第一核苷酸序列的至少两个重组酶结构域相互作用,从而形成用于促进供体DNA和靶DNA之间的交叉和链交换的四聚体。
在一些实施方式中,组合物还包含重组酶或其片段。通过向导RNA结合结构域与向导RNA结合后,位点定向修饰多肽到达靶序列。在靶序列上形成重组酶或重组酶结构域的四聚体并通过结合其同源位点而被激活,并介导供体DNA和靶DNA之间的重组。
在一些实施方式中,组合物还包含能够与靶DNA中的第二序列杂交的第二CRISPR-Cas系统向导RNA。靶DNA中的第二序列与靶DNA中的第一序列距离约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50个核苷酸。
另一方面,本申请公开了包含一种或多种载体的组合物,所述载体包含(i)编码上述多肽的第一核苷酸序列;和(ii)编码向导RNA的第二核苷酸序列。
如本文所用,术语“载体”是指包含特别令人感兴趣的基因或核酸序列的多核苷酸分子。通常,构造还包括适当的调控序列。例如,多核苷酸分子可以包括位于编码向导RNA的核苷酸序列的5'-侧翼区的调控序列和/或编码位点定向修饰多肽的核苷酸序列,其以能在宿主细胞中表达所需的转录子/基因的方式可操作地连接到编码序列。
可以使用本领域已知的方法制备包含编码向导RNA的核苷酸序列和/或编码位点定向修饰多肽的核苷酸序列的载体。例如,多核苷酸分子可以作为较大质粒的一部分制备。这样的制备允许以本领域已知的有效方式克隆和分离正确的构建体。用于制备质粒和转化宿主生物体的各种方法在本领域是已知的(参见例如Molecular Cloning A LaboratoryManual,第二版,Sambrook,Fritsch和Maniatis编辑,Cold Spring Harbor Laboratory出版,1989)。
在一些实施方式中,一种或多种载体还包含编码重组酶的核苷酸序列。位点定向修饰多肽通过向导RNA结合结构域与向导RNA结合后达到靶序列。重组酶或重组酶结构域或重组酶变体的四聚体通过结合其同源位点而被激活,或活化的重组酶的四聚体在靶序列上形成并通过结合其同源结合位点而被激活,并介导供体DNA与靶DNA之间的重组。
在另一方面,本申请公开了将DNA序列整合到细胞基因组中的方法,包括将包含一种或多种载体的组合物引入细胞中,所述载体包含:(i)编码第一CRISPR-Cas系统向导RNA的第一核苷酸序列,其中第一向导RNA能够与靶DNA中的第一序列杂交;和(ii)编码位点定向修饰多肽的第二核苷酸序列,其中所述位点定向修饰多肽包含:(a)能够结合所述向导RNA的向导RNA结合部分;和(b)重组结构域;(iii)供体DNA,其包含:(a)由所述位点特异性重组酶识别的第三核苷酸序列;和(b)转基因。
在一些实施方式中,将包含编码向导RNA的核苷酸序列和/或编码位点定向修饰多肽的核苷酸序列的一种或多种载体导入宿主细胞,使得组合物的元件的表达导致复合物在靶位点形成。例如,复合物包含与靶DNA中的第一序列杂交的第一CRISPR-Cas系统向导RNA、与靶DNA中的第二序列杂交的第二CRISPR-Cas系统向导RNA和至少两个包含向导RNA结合结构域和重组酶结构域的位点定向修饰多肽。位点定向修饰多肽通过向导RNA结合结构域与向导RNA结合后到达靶序列。在靶序列上形成重组酶结构域的四聚体并通过结合其同源位点而被激活,并介导供体DNA与靶DNA之间的重组。
可以使用常规的基于病毒和非病毒的基因转移方法将载体引入非人哺乳动物细胞、非人靶组织或非人单细胞胚胎。这些方法可用于将编码组合物组分的核酸施用于培养基或宿主生物体中的非人细胞。非病毒载体递送系统包括DNA质粒、RNA(例如本文所述载体的转录子)、裸核酸和与递送载体(例如脂质体)络合的核酸,与递送载体(例如脂质体)络合的蛋白质。病毒载体递送系统包括DNA和RNA病毒,其在递送至细胞后具有游离的或整合的基因组。关于基因治疗步骤的综述,参见Anderson,Science 256:808-813(1992);Nabel&Felgner,TIBTECH 11:211-217(1993);Mitani&Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology andNeuroscience 8:35-36(1995);Kremer&Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada et al.,in Current Topics in Microbiology and ImmunologyDoerfler and Bihm(eds)(1995);and Yu et al.,Gene Therapy 1:13-26(1994)。
核酸的非病毒递送方法包括脂质转染、核转染、电穿孔、显微注射、基因枪法、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、人工病毒粒子和DNA摄取增强剂。脂质转染在例如美国专利号5,049,386、4,946,787;和4,897,355中描述)和脂质转染试剂为市售(例如,TransfectamTM和LipofectinTM)。适用于多核苷酸有效受体识别脂质转染的阳离子和中性脂质包括Feigner,WO 91/17424;WO 91/16024。递送可以是至细胞(例如体外或离体给药)或靶组织(例如体内给药)。
包括靶向脂质体如免疫脂蛋白复合物的脂质:核酸复合物的制备是本领域技术人员所熟知的(参见例如Crystal,Science 270:404-410(1995);Blaese等人,Cancer GeneTher.2:291-297(1995);Behr等人,Bioconjugate Chem.5:382-389(1994);Remy等人,Bioconjugate Chem.5:647-654(1994);Gao等人,Gene Therapy 2:710-722(1995);Ahmad等人,Cancer Res.52:4817-4820(1992);美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028和4,946,787)。
显微注射用于将DNA、RNA或肽递送到非人单细胞胚胎的细胞核和细胞质中。本领域技术人员已熟知(参见Manipulating the mouse embryo;A laboratory manual,第四版,2014)。
用于递送核酸的基于RNA或DNA病毒的系统的使用利用高度进化的过程将病毒靶向身体中的特定细胞并将病毒有效负载运送到细胞核。病毒载体可以直接施用于患者(在体内),或者它们可以用于在体外治疗细胞,并且修饰的细胞可以任选地施用于患者(在体内)。常规的基于病毒的系统可以包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒和单纯疱疹病毒载体。逆转录病毒、慢病毒和腺相关病毒基因转移方法能够整合进宿主基因组中,通常导致插入的转基因的长期表达。另外,在许多不同的细胞类型和靶组织中观察到较高的转导效率。
逆转录病毒的向性(tropism)可以通过掺入外来的衣壳蛋白来改变,扩大靶细胞的潜在目标群体。慢病毒载体是能够转导或感染非分裂细胞并且通常产生高病毒滴度的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择取决于靶组织。逆转录病毒载体由顺式作用的长末端重复序列组成,其包装能力高达6-10kb外源序列。最小的顺式作用LTR足以进行复制和载体包装,然后将其用于将治疗基因整合到靶细胞中以提供永久转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的基因)(参见例如Buchscher等人,J.Virol.66:2731-2739(1992);Johann等人,J.Virol.66:1635-1640(1992);Sommnerfelt等人,Virol.176:58-59(1990);Wilson等人,J.Virol.63:2374-2378(1989);Miller等人,J.Virol.65:2220-2224(1991);PCT/US94/05700)。在优选瞬时表达的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中具有非常高的转导效率,并且不需要细胞分裂。使用这样的载体,获得了高滴度和表达水平。该载体可以在相对简单的系统中大量生产。腺相关病毒(“AAV”)载体也可用于转导具有靶核酸的细胞,例如核酸和肽的体外产生,以及用于体内和离体基因治疗程序(参见例如,West等人,Virology 160:38-47(1987);美国专利号4,797,368;WO 93/24641;Kotin,Human Gene Therapy 5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994)。重组AAV载体的构建描述于许多出版物中,包括美国专利号5,173,414;Tratschin等人,Mol.Cell.Biol.5:3251-3260(1985);Tratschin等人,Mol.Cell.Biol.4:2072-2081(1984);Hermonat&Muzyczka,PNAS 81:6466-6470(1984);和Samulski等人,J.Virol.63:03822-3828(1989)。
包装细胞通常用于形成能感染宿主细胞的病毒颗粒。这样的细胞包括包装腺病毒的293细胞,和包装逆转录病毒的ψ2细胞或PA317细胞。用于基因治疗的病毒载体通常通过产生将核酸载体包装到病毒颗粒中的细胞系来产生。载体通常含有包装和随后整合到宿主中所需的最小病毒序列,其他病毒序列被待表达的多核苷酸的表达盒替代。缺失的病毒功能通常由包装细胞系反向提供。例如,用于基因治疗的AAV载体通常仅具有包装和整合入宿主基因组所需的来自AAV基因组的ITR序列。病毒DNA包装在细胞系中,其含有编码其他AAV基因的辅助质粒,即rep和cap,但缺少ITR序列。细胞系也可能被腺病毒感染为辅助者。辅助病毒促进AAV载体的复制和来自辅助质粒的AAV基因的表达。由于缺乏ITR序列,辅助质粒未被大量包装。可以通过例如腺病毒比AAV更敏感的热处理来减少腺病毒的污染。将核酸递送到细胞的其它方法是本领域技术人员已知的。参见例如US20030087817,其通过引用并入本文。
细胞系的实例包括但不限于C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panel、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、HepG2、HeLaB、HeLaT4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮细胞、BALB/3T3小鼠胚胎成纤维细胞、3T3Swiss、3T3-L1、132-d5人胎儿成纤维细胞、10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1细胞、BEAS-2B、bEnd.3、BHK-21、BR293.BxPC3.C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHODhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CMLT1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCK11、MOR/0.2R、MONO-MAC6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT2、RenCa、RIN-5F、RMA/RMAS、Saos-2cells、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、Vero细胞、WM39、WT-49、X63、YAC-1、YAR及其转基因品种。
实施例1
本实施例说明活性CasR突变体,其包括嵌合Cas9蛋白的变体和Tn3解离酶(CasTn3)的活性突变体的催化结构域。在重组测定中使用含有被CasTn3识别和结合的序列Tn3 res位点I的底物质粒测试CasTn3的介导重组的能力。潜在的靶序列(C位点)包含22bp的Tn3 res位点I,其侧翼是通过合适的gRNA被dCas9结构域识别的17bp基序。然后构建底物质粒,其中两个相同的C位点被galK标记基因分离。如果大肠杆菌细胞中CasTn3介导的重组删除galK,则MacConkey-半乳糖指示板上的菌落是淡色的,而galK+菌落是红色的。
“祖细胞”CasTn3的表达质粒产生如下。具有p15a复制起点(pEK76)的解离酶表达质粒来自pACYC184(Chang AC,Cohen SN(1978)Construction and characterization ofamplifiable multicopy DNA cloning vehicles derived from the P15A crypticminiplasmid.J Bacteriol 134:1141–1156.),通过向pACYC184 AvaI位点插入来自pAT5的SspI-EcoRV解离编码片段(Arnold PH,Blake DG,Grindley NDF,Boocock MR,Stark WM(1999)Mutants of Tn3 resolvase which do not require accessory binding sitesfor recombination activity.EMBO J 18:1407–1414)。然后通过在pEK76中唯一的NdeI和Asp718位点之间插入dCas9的含有ORF的片段来产生CasTn3表达质粒(pCasTn3)。
本文所用的“祖细胞”CasTn3由包含七个突变R2A E56K G101S D102Y M103IQ105L V107F的Tn3解离酶催化结构域(残基1-148)组成,其后是2-氨基酸接头TS,然后是dCas9。TS接头的密码子引入了一个独特的SpeI限制性酶切位点。
被设计为由CasTn3识别的C位点由22bp的Tn3 res位点I组成,其侧翼是由dCas9识别的20bp基序。本文所用的C位点(C1tn3C1)的序列如图5所示。具有在galK标记基因侧翼的两个C位点的重组底物质粒如图3所示。
然后使用重组的大肠杆菌菌落颜色测定来测试CasTn3介导C-位点重组的能力。在Akopian A,He J,Boocock MR,Stark WM(2003)Chimeric recombinases with designedDNA sequence recognition.Proc Natl AcadSci USA 100:8688–8691中已经描述了重组的大肠杆菌菌落颜色测定。简单来说,用CasTn3表达质粒和gRNA表达质粒共转化含有底物质粒的菌株。在MacConkey-半乳糖指示板(补充有1%半乳糖、卡那霉素(选择底物质粒或其离析度积)的MacConkey琼脂碱(Difco))和氨苄青霉素和/或氯霉素(以选择pCasTn3表达质粒)中选择转化体。淡色((galK-)菌落表示重组(离析)能力,而红色(galK+)菌落表明缺乏离析。
为了分析重组的DNA产物,含有底物质粒的菌株用CasTn3表达质粒和gRNA表达质粒共转化。在L-琼脂平板上用适当的抗生素选择生长转化体。在37℃下培养后,用L-培养基从板上洗涤细胞,并使用Qiagen miniprep试剂盒从细胞中纯化质粒DNA。通过1.2%琼脂糖凝胶电泳后的溴化乙锭染色观察DNA。为了更准确地定量重组程度(导致galK基因的缺失),将回收的质粒DNA用于转化菌株DS941,在具有卡那霉素的MacConkey琼脂平板上选择含有质粒的转化体,测定淡色(galK-)菌落(总共>100)的百分比。
结果显示C1Tn3C1被CasTn3解离。
实施例2
本实施例证明CasTn3可用于靶向不对称C位点。本文所用的底物质粒与实施例1类似,只是它含有由22bp的Tn3 res位点I组成的C-位点,其侧翼是由dCas9识别的两个不同的17bp基序。本文所用的C位点的序列(C1tn3C2)如图4所示。
为了测试CasTn3靶向不对称C-位点的重组能力,含有底物质粒的菌株用CasTn3表达质粒和分别表达识别C1和C2的gRNA的两个gRNA表达质粒共转化。在MacConkey-半乳糖指示板(MacConkey琼脂碱(Difco))上补充有1%半乳糖、卡那霉素(以选择底物质粒或其解离产物)和氨苄青霉素和/或氯霉素(以分别选择pCasTn3表达质粒和gRNA表达质粒)。淡色(galK-))菌落表示重组(解离)能力,而红色(galK+)菌落表示缺乏解离。
如实施例1中那样分析重组的DNA产物。
结果显示CasTn3可以介导不对称C位点的重组。
实施例3
该实施例说明鉴定可促进与Tn3 res位点I相似但不相同的潜在靶序列重组的CasTn3变体。
通常,使用与Tn3 res位点I相似并且对于解离酶活性可能是最优的一系列潜在靶序列(如图4所示)。这些潜在的靶序列以TATA基序为中心超过12bp,并且包括与一个方向相同的12个碱基对中的至少8个。制备“C1resC1”位点,每个包含22bp的潜在Tn3 res位点,其侧翼是通过相应的gRNA被dCas9结构域识别的17bp基序。
为了找到可以在潜在的C1resC1位点促进重组的CasTn3变体,使用两个易错PCR方案对Tn3的整个催化结构域进行随机诱变,并制备表达突变型CasTn3的质粒文库(参见Burke ME,Arnold PH,He J,Wenwieser SVCT,Rowland SJ,等人.(2004)Activatingmutations of Tn3 resolvase marking interfaces important in recombinationcatalysis and its regulation.MolMicrobiol 51:937–948)。为了筛选出专门重组的CasTn3突变体,含有重组底物质粒的DS941细胞用突变表达质粒和gRNA表达质粒文库转化。在MacConkey板上选择转化体的等分试样(目标是每个板约1000个菌落;30-60个板)。挑选淡色的菌落,并在MacConkey平板上划线,以确认菌落的颜色。使用从阳性分离物纯化的质粒DNA转化相同的DS941-底物质粒菌株。如果MacConkey板上的转化体菌落都是淡色的,则CasTn3被认为是一个专门重组突变体,因此分离表达质粒,并对CasTn3阅读框进行测序。
使用C1resC1底物质粒的文库筛选产生多个活性突变体,如下表1所示。从细胞中回收DNA显示具有单一保守变化I77L的一个突变体在C1resC1底物上具有显着的重组活性。
可以使用新鉴定的CasTn3突变体作为诱变模板和其他C1resC1测试底物重复诱变筛选程序。分离出几种活性突变体,其促进C1resC1位点的有效重组。因此,突变因而扩大而不是改变特异性。
表1.在潜在靶序列中促进重组的活性突变体。
Figure GDA0002982285500000181
该表显示从诱变的CasTn3的文库中分离的突变体。左侧列给出突变体,其他列显示MacConkey琼脂菌落检测中每个突变体的表型,使用具有两个相同CresC位点的底物。W,“白”(淡色)菌落;R,红色菌落。
实施例4
本实施例说明了CasR介导的非相同位点之间的重组。
对于任意选定的基因组位点处的转基因整合,只有一个重组位点(所述基因组的)必须由“设计者”CasR靶向。另一个位点(在转基因DNA上)可以通过任意具有相容催化结构域的重组酶来进行,并且可以优化整合效率和特异性。为了模拟这种情况,生成具有不一致的位点对的底物。C1tn3C1位点在其中心处具有CasTn3催化结构域(Tn3 res位点I)22bp的天然靶序列,从而有效地重组具有两个这样位点的底物。为了分析C1tn3C1与其他非相同位点之间的重组,制作了一组六个C1tn3C1x C1res1C1,其中res1表示CasTn3的天然靶序列的22bp中心的变体。这些质粒被有效地重组。
为了示出配对位点不需要是C位点,制备了含有与Tn3 res位点I配对的C1res1C1位点的底物。当活化的Tn3解离酶变体(NM解离酶;Olorunniji FJ,He J,Wenwieser SVCT,Boocock MR,Stark WM(2008)Synapsis and catalysis by activated Tn3 resolvasemutants.Nucleic Acids Res 36:7181–7191.)和CasTn3-1共表达时,C1resC1×位点I底物重组是有效的,而单独的NM解离酶或单独的CasTn3-1不促进重组。
最后,设计底物来模拟如上所述的转基因整合,其中通过两个gRNA的组合作用靶向一个“基因组”重组位点,另一个“转基因”位点被活化的重组酶识别。对于“基因组”位点,我们选择使用C1res1C2。如上述实验所用,对于“转基因”位点使用Tn3 res位点I。结果表明,C1res1C2×位点I重组需要NM解离酶、CasTn3和两个gRNA的表达。
序列表
<110> 应用干细胞有限公司
<120> 整合转基因的位点定向CRISPR/重组酶组合物和方法
<130> 044903-8005WO01
<160> 5
<170> PatentIn 3.5版
<210> 1
<211> 1368
<212> PRT
<213> 化脓性链球菌
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 4104
<212> DNA
<213> 化脓性链球菌
<400> 2
atggacaaga agtatagcat cgggctggac attggaacga actcggttgg ttgggctgtg 60
attacggacg aatacaaggt gccatccaag aagtttaagg tcctgggaaa caccgaccgt 120
cactcaatca agaagaatct cattggagcc ctgctcttcg atagtgggga gaccgccgaa 180
gctactcgac tgaagcgaac ggctcgccgg cgttatacac gacgcaagaa tcgcatctgc 240
tacctccagg agattttcag caacgaaatg gctaaggttg atgactcatt ctttcatcga 300
ctcgaagaaa gtttcttggt cgaggaggat aagaagcacg agcgccatcc gatctttggt 360
aacattgtgg atgaggttgc ctatcacgaa aagtacccaa ctatctatca tcttcgtaag 420
aagctggtcg atagcacgga caaggctgat ttgcgactta tctacctggc actcgcgcac 480
atgattaagt tccgcggcca ttttcttatc gagggtgacc tgaaccccga taattctgac 540
gttgataagc tcttcatcca gttggtccaa acctacaatc agctgtttga ggaaaaccct 600
attaatgcat ctggcgtgga cgccaaggct atcctttcgg cgcgcctgtc taagtcgcgg 660
cgtttggaga accttatcgc acaactcccc ggcgaaaaga agaacggcct cttcggtaat 720
ttgattgcgt tgtcacttgg tctgactcct aacttcaaga gtaattttga cctggcagag 780
gatgcgaagc tccagttgtc taaggatacg tatgatgacg atctcgacaa cttgcttgcc 840
caaatcggtg accagtacgc tgatcttttc ctggccgcta agaatctctc agatgcaatc 900
ctgctcagtg acattttgcg ggtcaacacc gagattacta aggcccccct gtcagctagt 960
atgatcaagc ggtatgatga gcaccatcag gacctcacct tgcttaaggc cctcgtgcgt 1020
cagcaattgc ctgagaagta caaggaaatc ttctttgacc aatccaagaa cggatacgca 1080
gggtatattg atggcggtgc gagccaggag gaattctaca agtttatcaa gccgattttg 1140
gagaagatgg acggcactga ggaactgctc gtcaagctga atcgcgaaga tttgcttcgt 1200
aagcaacgaa cgttcgacaa cggctccatc ccgcaccaga ttcatctggg cgagctccac 1260
gccatccttc gacgccagga agatttctac ccatttctga aggacaaccg tgagaagatc 1320
gaaaagattc ttacattccg aatcccctac tatgtgggac ctttggcccg tgggaattcc 1380
cgatttgctt ggatgacccg aaagagcgag gaaaccatca ctccgtggaa cttcgaggaa 1440
gtcgtggaca agggtgcatc cgcgcagagc ttcattgagc ggatgaccaa ttttgataag 1500
aaccttccga atgaaaaggt cctgccaaag cattcgctgc tctacgagta tttcaccgtg 1560
tataacgaac tgactaaggt caagtacgtg acggagggaa tgcggaagcc agccttcctc 1620
tcaggggaac aaaagaaggc tatcgtcgat ttgcttttta agaccaatcg taaagtgact 1680
gttaagcagc tgaaggagga ttatttcaag aagattgaat gtttcgactc cgtcgagatc 1740
agcggcgtgg aagatcgctt taacgcttcc ctcggtacct accacgacct gctcaagatc 1800
attaaggaca aggatttcct cgataacgag gaaaatgagg acatcttgga agatattgtc 1860
ctcacgttga cactttttga ggaccgcgaa atgatcgagg aacggctcaa gacatatgcc 1920
catttgttcg acgataaggt gatgaagcag ctgaagcggc gtcgatacac cggatggggt 1980
cgccttagcc ggaagctgat caacggcatt cgagataagc aatctggtaa gactatcttg 2040
gatttcctta agtcggacgg cttcgccaac cgcaatttta tgcagcttat tcacgacgat 2100
tccctgacgt tcaaggagga catccagaag gcacaagtct caggacaagg ggattccctg 2160
cacgagcata tcgccaacct ggctggatcc ccggcgatca agaaggggat tcttcagacc 2220
gtcaaggttg tcgacgagct ggtcaaggtg atgggccgtc ataagccaga aaacatcgtg 2280
attgagatgg cccgagaaaa tcagaccact caaaagggtc agaagaacag ccgcgagcgg 2340
atgaagcgga tcgaggaagg cattaaggaa cttggttctc agatcctgaa ggagcaccct 2400
gttgaaaaca cacagctcca aaatgagaag ctgtatctct actatttgca aaatggacgc 2460
gacatgtacg tcgatcagga gctcgacatt aaccggttgt cggactacga tgttgaccat 2520
atcgtcccgc aatccttcct taaggacgat agcattgata acaaggtgct gactcgctca 2580
gataagaacc ggggcaagtc cgacaatgtt ccaagcgagg aagtggttaa gaagatgaag 2640
aactactggc gccaattgct taatgccaag ctcatcacac agcgcaagtt tgacaacttg 2700
accaaggccg agcggggagg gctgagtgaa ctcgataagg ctggcttcat caagcgtcaa 2760
ctcgtggaga cgcgacagat cacaaagcac gttgctcaga ttctggactc ccggatgaac 2820
acaaagtacg acgagaatga taagctcatc cgtgaagtta aggtcattac cctcaagtct 2880
aagttggtgt cggatttccg caaggacttc caattttata aggttcggga gatcaacaat 2940
tatcaccatg cacatgatgc gtacctcaac gcagtcgtgg gaactgcgct catcaagaag 3000
tatcccaagt tggagtccga attcgtctac ggggattata aggtttacga cgtccgcaag 3060
atgatcgcca agagtgagca ggaaattggc aaggccacgg ctaagtattt cttttactcc 3120
aacatcatga atttctttaa gacggagatc acactcgcca atggagaaat ccgtaagcga 3180
cctttgattg agaccaacgg cgagactggt gaaatcgttt gggataaggg gcgcgacttc 3240
gctaccgtgc ggaaggttct gagcatgccg caagtcaata tcgtcaagaa aaccgaggtg 3300
cagacaggcg gtttctctaa ggaatcgatt cttccaaagc gtaactctga caagctgatc 3360
gctcgaaaga aggattggga ccccaagaag tatggagggt tcgattctcc tacagtggca 3420
tactcggttc tcgttgtcgc gaaggttgag aagggaaagt ctaagaagct gaagtcggtc 3480
aaggaactgc tcgggatcac cattatggag cgctccagct tcgaaaagaa tcccatcgac 3540
tttctcgagg ccaagggcta taaggaagtc aagaaggatc ttatcattaa gctgcctaag 3600
tactctttgt tcgagcttga aaacggtcga aagcgaatgc tcgcatcggc aggagagttg 3660
cagaagggga atgaattggc acttccctca aagtacgtga acttcctgta tctcgcgtcc 3720
cactacgaga agctgaaggg tagccctgag gacaacgaac agaagcaact ttttgttgag 3780
caacacaagc attatctgga tgagatcatt gaacagattt cagagttcag taagcgcgtc 3840
atcctcgccg atgctaatct cgacaaggtg ttgtcggcct acaacaagca ccgtgacaag 3900
ccgatccgag agcaggctga aaatatcatt catctgttca ccctcactaa cttgggagca 3960
ccagcagcgt tcaagtattt tgatacgaca atcgaccgta agcgatacac gtccacaaag 4020
gaggtgcttg atgcgaccct gattcatcaa tccatcactg ggctctatga aacccgtatc 4080
gaccttagtc aactgggggg cgac 4104
<210> 3
<211> 185
<212> PRT
<213> 大肠杆菌
<400> 3
Met Arg Leu Phe Gly Tyr Ala Arg Val Ser Thr Ser Gln Gln Ser Leu
1 5 10 15
Asp Leu Gln Val Arg Ala Leu Lys Asp Ala Gly Val Lys Ala Asn Arg
20 25 30
Ile Phe Thr Asp Lys Ala Ser Gly Ser Ser Thr Asp Arg Glu Gly Leu
35 40 45
Asp Leu Leu Arg Met Lys Val Glu Glu Gly Asp Val Ile Leu Val Lys
50 55 60
Lys Leu Asp Arg Leu Gly Arg Asp Thr Ala Asp Met Ile Gln Leu Ile
65 70 75 80
Lys Glu Phe Asp Ala Gln Gly Val Ala Val Arg Phe Ile Asp Asp Gly
85 90 95
Ile Ser Thr Asp Gly Asp Met Gly Gln Met Val Val Thr Ile Leu Ser
100 105 110
Ala Val Ala Gln Ala Glu Arg Arg Arg Ile Leu Glu Arg Thr Asn Glu
115 120 125
Gly Arg Gln Glu Ala Lys Leu Lys Gly Ile Lys Phe Gly Arg Arg Arg
130 135 140
Thr Val Asp Arg Asn Val Val Leu Thr Leu His Gln Lys Gly Thr Gly
145 150 155 160
Ala Thr Glu Ile Ala His Gln Leu Ser Ile Ala Arg Ser Thr Val Tyr
165 170 175
Lys Ile Leu Glu Asp Glu Arg Ala Ser
180 185
<210> 4
<211> 148
<212> PRT
<213> 人工序列
<220>
<223> Tn解离酶催化结构域
<400> 4
Met Arg Leu Phe Gly Tyr Ala Arg Val Ser Thr Ser Gln Gln Ser Leu
1 5 10 15
Asp Leu Gln Val Arg Ala Leu Lys Asp Ala Gly Val Lys Ala Asn Arg
20 25 30
Ile Phe Thr Asp Lys Ala Ser Gly Ser Ser Thr Asp Arg Glu Gly Leu
35 40 45
Asp Leu Leu Arg Met Lys Val Glu Glu Gly Asp Val Ile Leu Val Lys
50 55 60
Lys Leu Asp Arg Leu Gly Arg Asp Thr Ala Asp Met Ile Gln Leu Ile
65 70 75 80
Lys Glu Phe Asp Ala Gln Gly Val Ala Val Arg Phe Ile Asp Asp Gly
85 90 95
Ile Ser Thr Asp Gly Asp Met Gly Gln Met Val Val Thr Ile Leu Ser
100 105 110
Ala Val Ala Gln Ala Glu Arg Arg Arg Ile Leu Glu Arg Thr Asn Glu
115 120 125
Gly Arg Gln Glu Ala Lys Leu Lys Gly Ile Lys Phe Gly Arg Arg Arg
130 135 140
Thr Val Asp Arg
145
<210> 5
<211> 148
<212> PRT
<213> 人工序列
<220>
<223> Tn解离酶催化结构域突变体
<400> 5
Met Ala Leu Phe Gly Tyr Ala Arg Val Ser Thr Ser Gln Gln Ser Leu
1 5 10 15
Asp Leu Gln Val Arg Ala Leu Lys Asp Ala Gly Val Lys Ala Asn Arg
20 25 30
Ile Phe Thr Asp Lys Ala Ser Gly Ser Ser Thr Asp Arg Glu Gly Leu
35 40 45
Asp Leu Leu Arg Met Lys Val Lys Glu Gly Asp Val Ile Leu Val Lys
50 55 60
Lys Leu Asp Arg Leu Gly Arg Asp Thr Ala Asp Met Ile Gln Leu Ile
65 70 75 80
Lys Glu Phe Asp Ala Gln Gly Val Ala Val Arg Phe Ile Asp Asp Gly
85 90 95
Ile Ser Thr Asp Ser Tyr Ile Gly Leu Met Phe Val Thr Ile Leu Ser
100 105 110
Ala Val Ala Gln Ala Glu Arg Arg Arg Ile Leu Glu Arg Thr Asn Glu
115 120 125
Gly Arg Gln Glu Ala Lys Leu Lys Gly Ile Lys Phe Gly Arg Arg Arg
130 135 140
Thr Val Asp Arg
145

Claims (13)

1.一种多肽,其包含:
(i)能够结合向导RNA的失去催化能力的CRISPR-Cas结构域,其氨基酸序列是在SEQ IDNO:1上进行D10A突变和选自H840A、N854A、N863A和其组合的第二突变后获得的序列,其中所述向导RNA能够与靶DNA序列杂交;和
(ii)包含丝氨酸重组酶的重组酶结构域,其中所述重组酶结构域的氨基酸序列是SEQID NO:5或SEQ ID NO:5变体,所述SEQ ID NO:5变体中的突变为以下突变组合之一:(1)I77L,I3P和V108A;(2)I77L和L135R;(3)I77L,S12R和I103V;(4)I77L和E132A;(5)I77L,I3L和L135R;(6)I77L,I3S和E132A;或(7)I77L,N127H和E132A。
2.根据权利要求1所述的多肽,还包含连接CRISPR-Cas结构域和重组酶结构域的接头。
3.根据权利要求2所述的多肽,其中所述接头具有苏氨酸-丝氨酸的氨基酸序列。
4.一种组合物,其包含权利要求1所述的多肽和向导RNA。
5.根据权利要求4所述的组合物,还包含供体DNA,所述供体DNA包含由所述丝氨酸重组酶识别的第一核苷酸序列和转基因。
6.一种组合物,其包含:
(i)编码权利要求1所述多肽的第一核苷酸序列;和
(ii)编码向导RNA的第二核苷酸序列;
其中所述第一和第二核苷酸位于相同或不同的载体上。
7.根据权利要求6所述的组合物,还包含供体DNA,所述供体DNA包含由所述丝氨酸重组酶识别的第一核苷酸序列和转基因。
8.根据权利要求6所述的组合物,还包含编码所述丝氨酸重组酶的第三核苷酸序列。
9.将转基因整合到细胞基因组中的非疾病诊断和治疗目的的方法,包括将权利要求6所述的组合物引入非人细胞。
10.根据权利要求9所述的方法,其中所述组合物还包含编码所述丝氨酸重组酶的第三核苷酸序列。
11.根据权利要求9所述的方法,其中所述非人细胞是真核细胞。
12.根据权利要求9所述的方法,其中所述非人细胞是哺乳动物细胞。
13.根据权利要求9所述的方法,其中所述非人细胞是单细胞胚胎。
CN201580064960.7A 2014-12-05 2015-12-07 整合转基因的位点定向crispr/重组酶组合物和方法 Active CN107208079B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462088440P 2014-12-05 2014-12-05
US62/088,440 2014-12-05
PCT/US2015/064352 WO2016090385A1 (en) 2014-12-05 2015-12-07 Site-directed crispr/recombinase compositions and methods of integrating transgenes

Publications (2)

Publication Number Publication Date
CN107208079A CN107208079A (zh) 2017-09-26
CN107208079B true CN107208079B (zh) 2021-06-29

Family

ID=56092610

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580064960.7A Active CN107208079B (zh) 2014-12-05 2015-12-07 整合转基因的位点定向crispr/重组酶组合物和方法

Country Status (4)

Country Link
US (1) US10975392B2 (zh)
CN (1) CN107208079B (zh)
HK (1) HK1243455A1 (zh)
WO (1) WO2016090385A1 (zh)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2853829C (en) 2011-07-22 2023-09-26 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
EP3215617A2 (en) 2014-11-07 2017-09-13 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
CA2999500A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
US10167457B2 (en) 2015-10-23 2019-01-01 President And Fellows Of Harvard College Nucleobase editors and uses thereof
WO2017165826A1 (en) 2016-03-25 2017-09-28 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
US11236313B2 (en) 2016-04-13 2022-02-01 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
IL308426A (en) 2016-08-03 2024-01-01 Harvard College Adenosine nuclear base editors and their uses
CN109804066A (zh) 2016-08-09 2019-05-24 哈佛大学的校长及成员们 可编程cas9-重组酶融合蛋白及其用途
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
AU2017342543A1 (en) 2016-10-14 2019-05-02 President And Fellows Of Harvard College AAV delivery of nucleobase editors
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
JP7191388B2 (ja) 2017-03-23 2022-12-19 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
EP3658573A1 (en) 2017-07-28 2020-06-03 President and Fellows of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
EP3697906A1 (en) 2017-10-16 2020-08-26 The Broad Institute, Inc. Uses of adenosine base editors
AU2019406778A1 (en) * 2018-12-17 2021-07-22 Massachusetts Institute Of Technology Crispr-associated transposase systems and methods of use thereof
US20220127642A1 (en) * 2019-01-30 2022-04-28 Applied Stemcell, Inc. Controllable genome editing system
DE112020001342T5 (de) 2019-03-19 2022-01-13 President and Fellows of Harvard College Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
JP2023525304A (ja) 2020-05-08 2023-06-15 ザ ブロード インスティテュート,インコーポレーテッド 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物
US11661459B2 (en) 2020-12-03 2023-05-30 Century Therapeutics, Inc. Artificial cell death polypeptide for chimeric antigen receptor and uses thereof
US11883432B2 (en) 2020-12-18 2024-01-30 Century Therapeutics, Inc. Chimeric antigen receptor system with adaptable receptor specificity

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140295556A1 (en) * 2013-03-15 2014-10-02 The General Hospital Corporation Using RNA-guided FokI Nucleases (RFNs) to Increase Specificity for RNA-Guided Genome Editing
US20140357530A1 (en) * 2012-12-12 2014-12-04 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9873907B2 (en) * 2013-05-29 2018-01-23 Agilent Technologies, Inc. Method for fragmenting genomic DNA using CAS9
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140357530A1 (en) * 2012-12-12 2014-12-04 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
US20140295556A1 (en) * 2013-03-15 2014-10-02 The General Hospital Corporation Using RNA-guided FokI Nucleases (RFNs) to Increase Specificity for RNA-Guided Genome Editing

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PDB:4CMP_A;NCBI;《NCBI》;20140326;1-4 *
WP_013279315.1;NCBI;《NCBI》;20130518;1 *

Also Published As

Publication number Publication date
US10975392B2 (en) 2021-04-13
US20170362611A1 (en) 2017-12-21
HK1243455A1 (zh) 2018-07-13
CN107208079A (zh) 2017-09-26
WO2016090385A1 (en) 2016-06-09

Similar Documents

Publication Publication Date Title
CN107208079B (zh) 整合转基因的位点定向crispr/重组酶组合物和方法
JP6896786B2 (ja) 配列操作のためのCRISPR−Cas成分系、方法および組成物
US11339408B2 (en) Nuclease with enhanced efficiency of genome editing
JP7463436B2 (ja) 遺伝子産物の発現を変更するためのCRISPR-Cas系および方法
JP7198328B2 (ja) 配列操作のための系、方法および最適化ガイド組成物のエンジニアリング
US11643669B2 (en) CRISPR mediated recording of cellular events
JP6793547B2 (ja) 最適化機能CRISPR−Cas系による配列操作のための系、方法および組成物
RU2701662C2 (ru) Компоненты системы crispr-cas, способы и композиции для манипуляции с последовательностями
US20230279391A1 (en) Systems, methods, and compositions for site-specific genetic engineering using programmable addition via site-specific targeting elements (paste)
US20170058272A1 (en) Directed nucleic acid repair
WO2010093966A2 (en) Generation of a dna nicking enzyme that stimulates site-specific gene conversion from a homing endonuclease
CN114015674A (zh) 新型CRISPR-Cas12i系统
US20210269801A1 (en) Methods of Managing Nucleic Acid Replication, Expression, and Cleavage Using CRISPR Associated Nucleases
CN113474454A (zh) 可控的基因组编辑系统
EP4323384A2 (en) Evolved double-stranded dna deaminase base editors and methods of use

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1243455

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant