CN107922949A - 用于通过同源重组的基于crispr/cas的基因组编辑的化合物和方法 - Google Patents

用于通过同源重组的基于crispr/cas的基因组编辑的化合物和方法 Download PDF

Info

Publication number
CN107922949A
CN107922949A CN201680049767.0A CN201680049767A CN107922949A CN 107922949 A CN107922949 A CN 107922949A CN 201680049767 A CN201680049767 A CN 201680049767A CN 107922949 A CN107922949 A CN 107922949A
Authority
CN
China
Prior art keywords
rna
sequence
certain embodiments
guiding rna
segments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680049767.0A
Other languages
English (en)
Inventor
A·肯尼迪
G·塞纳
S·罗伊
C·W·荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agilent Technologies Inc
Original Assignee
Agilent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agilent Technologies Inc filed Critical Agilent Technologies Inc
Publication of CN107922949A publication Critical patent/CN107922949A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid

Abstract

本发明涉及包含具有一个或多个修饰的衔接子区段的引导RNA,以及它们在通过CRISPR:Cas系统的同源重组中的用途。所述修饰的衔接子区段抵抗RNA酶H的降解。本发明还涉及双引导RNA策略,其中第一引导RNA指导Cas酶在第一靶序列处产生双链断裂,第二引导RNA包含附接于供体多核苷酸的衔接子区段并且结合从第一靶序列偏移的第二靶序列。

Description

用于通过同源重组的基于CRISPR/CAS的基因组编辑的化合物 和方法
相关申请的交叉引用
本申请要求于2015年8月31日提交的美国临时申请No.62/212,456的优先申请日和优先权的利益。
发明领域
本发明涉及分子生物学领域。具体而言,本发明涉及用于同源重组的成簇规律间隔短回文重复序列(CRISPR)技术的用途。
发明背景
天然的原核CRISPR/Cas系统包含一系列短重复序列及恒定长度的可变间插序列(即,成簇规律间隔短回文重复序列序列或“CRISPR”),和CRISPR相关(“Cas”)蛋白质。Cas蛋白的一个亚群将转录后的CRISPR系列的RNA加工成小的引导RNA,这些引导RNA通常具有如下文所述的两个组分。至少存在三种不同的系统:I型、II型和III型。在3种系统中将RNA加工为成熟crRNA的过程所涉及的酶是不同的。在天然原核系统中,引导RNA(“gRNA”)包含两种短的非编码RNA,称为CRISPR RNA(“crRNA”)和反式作用RNA(“tracrRNA”)。在一个示例性系统中,gRNA与Cas核酸酶形成复合物。该gRNA:Cas核酸酶复合物可结合一种具有原型间隔序列毗邻基序(protospacer adjacent motif,“PAM”)和原型间隔序列(protospacer)的靶DNA序列。原型间隔序列与某种靶DNA互补,并且gRNA也与该靶DNA的至少一部分互补。该gRNA:Cas核酸酶复合物识别并结合靶DNA,诱导靶DNA的切割。天然CRISPR-Cas系统在原核生物中发挥适应性免疫系统的功能,因为gRNA:Cas核酸酶复合物可识别并沉默外源遗传元件,由此产生对外源遗传元件(如质粒和噬菌体)的抗性。
已经证明,单引导RNA(“sgRNA”)可以代替由天然存在的crRNA与tracrRNA的形成的复合物。开发gRNA(包括sgRNA)的相关考虑因素包括特异性、稳定性和功能性。特异性是指特定的gRNA:Cas核酸酶复合物结合和/或切割期望的靶标、而与不同于(在序列和/或位置上)期望靶标的多核苷酸很少或不发生结合和/或切割的能力。因此,特异性指向gRNA:Cas核酸酶复合物的脱靶效应的最小化。稳定性是指gRNA抵抗酶(如核酸酶)的降解及细胞内和细胞外环境中存在的其他物质的降解的能力。需要提供具有增加的对核酸降解的抗性、增加的针对DNA的结合亲和力、和/或降低的脱靶效应但仍然具有gRNA功能性的gRNA(包括sgRNA)。
靶向基因编辑具有功能性基因分析和基因治疗应用的潜力。已经通过借助外源供体多核苷酸模板的同源重组(HR)在限定的靶位点引入双链断裂(DSB)的手段提高了基因组编辑的频率。Banga等人,Oligonucleotide-directed site-specific mutagenesis inDrosophila melanogaster.PNAS 89(5),1735–9(1992);Nussbaum等人,Restriction-stimulated homologous recombination of plasmids by the RecE pathway ofEscherichia coli.Genetics,130(1),37–49(1992);Puchta等人,Homologousrecombination in plant cells is enhanced by in vivo induction of double-strand breaks into DNA by a site-specific endonuclease.Nucleic AcidsResearch,21(22),5034–40(1993);Rouet等人,Expression of a site-specificendonuclease stimulates homologous recombination in mammalian cells.PNAS 91(13),6064–81994(1994);Storici等人,Chromosomal site-specific double-strandbreaks are efficiently targeted for repair by oligonucleotides in yeast.PNAS100(25),14994–9(2003)。这些手段包括在限定的基因组靶位点诱导DSB的工程改造的归巢核酸内切酶、锌指核酸酶(Bibikova等人,Enhancing gene targeting with designedzinc finger nucleases.Science 300(5620),764(2003))、转录激活物样效应物核酸酶(TALENS)(Miller等人,A TALE nuclease architecture for efficient genomeediting.Nature Biotechnology,29(2),143–82011(2011))、RNA引导的Cas9核酸酶(Hsu等人,Development and Applications of CRISPR-Cas9for Genome Engineering.Cell,157(6),1262–1278(2014))。就这些核酸酶介导的基因打靶方法而言,主要局限性在于在DSB处的发生HR的频率相对于非同源末端连接(NHEJ)的频率而言较低(Bétermier等人,Is non-homologous end-joining really an inherently error-prone process?PLoSGenetics,10(1),e1004086(2014))。在哺乳动物细胞中,NHEJ是更被偏好的DSB修复方式,其偏好优势达三个数量级,即,每105-107个处理的细胞发生一次成功的HR事件,每102-104个处理的细胞发生一次成功的NHEJ事件(Vasquez等人,Manipulating the mammaliangenome by homologous recombination.PNAS 98(15),8403–10(2001))。
人们期望这样的基因组编辑方法:其可增加诱发DSB之后HR相对于NHEJ的频率,甚至更有利于HR而非NHEJ。为了促进这一点,研究人员已经提出,通过将外源供体多核苷酸模板拴系于被归巢核酸内切酶(I-SceI)结合的DNA适体,来将供体引导至DSB附近。这样,基因组编辑剂携带HR修复模板至遗传修饰的位点,这将增加基因组修复位点处的HR模板的局部浓度。使用这种方法,HR在人和酵母细胞中分别提高了16倍和32倍(Ruff等人,Aptamer-guided gen targeting in years and human cells.Nucleic Acids Res.42(7):e61,2014)。然而,使用归巢核酸内切酶方法时,靶基因组序列的景观(landscape)是受限的,其受到(Ice-I)核酸内切酶的特异性的18个DNA碱基对靶识别位点的限制。虽然可以想象选择新的DNA适体来将这种策略推广应用到不同的归巢核酸内切酶,但是已证明实践中适体选择是一个困难的过程(Gold等人,Aptamer-Based Mutiplexed Proteomic Technology forBiomarker Discovery.PLOS ONE 5(12)e15004 2010)。另外,工程改造归巢核酸内切酶、锌指核酸酶和转录激活物样核酸酶使其靶向新的DNA序列仍然具有挑战性(Gaj等人,ZFN,TALEN,and CRISPR/Cas-based methods for genome engineering.Trends in Biotech31(7):307(2013)。
已经使用同源基因打靶方法来敲除染色体中的内源基因或敲入外源序列。它们也可以用于基因校正,并且在理论上用于校正与单基因疾病相关的突变。然而,由于该过程效率低,这种应用是困难的。例如,Mali等人(Science 339:823-826(2013))尝试了在人K562细胞中使用CRISPR(引导RNA和Cas9核酸内切酶)和同时提供的单链供体DNA进行基因修饰,观察到在AAVS1基因座处HDR介导的基因修饰的频率为2.0%,而在相同基因座处观察到的NHEJ介导的靶向诱变的频率为38%。Li等人,(Nat Biotechnol.(8):688-91(2013))使用CRISPR(引导RNA和Cas9核酸内切酶)和同时提供的双链供体DNA尝试在植物本氏烟草进行基因置换,以观察到HDR介导的基因置换的频率为9.0%,而观察到的NHEJ介导的靶向诱变的频率为14.2%。Li等人还测试了通过经由共表达拟南芥CYCD3(细胞周期蛋白D-3型)——一种主要的细胞周期激活剂——触发异位细胞分裂来增强本氏烟草中HDR的可能性;然而,这几乎没有提高HDR率(从9%到11.1%,减去CYCD3)。Kass等人(Proc Natl Acad SciUSA.110(14):5564-5569(2013))研究了来源于不同谱系的多种类型的原代正常体细胞中的HDR,并且观察到小鼠胚胎和成体成纤维细胞以及来源于乳腺上皮、卵巢和新生儿脑的细胞在I-SceI核酸内切酶诱发的DSB处发生HDR的频率为大约1%(0.65%-1.7%)。Kass和其他人已报道,当细胞处于细胞周期的S期和G2期时,HDR活性更高。提高HDR率的策略还包括了敲除拮抗性NHEJ修复机制。例如,Qi等人(Genome Res 23:547-554(2013))报道,在拟南芥中,针对ku70突变体和lig4突变体的HDR介导的基因打靶分别增加5-16倍和3-4倍。然而,观察到的总比率不超过约5%,大多数不到1%。此外,一旦产生期望的基因打靶事件,必须通过杂交从突变植物中去除ku70或lig4突变。
Mali等人的US20140342458讨论了如下改变真核细胞的方法:用编码与细胞的基因组DNA互补的RNA的核酸转染细胞,用编码与所述RNA相互作用并且以位点特异性方式切割所述基因组DNA的酶的核酸转染该细胞。该细胞表达所述RNA和酶,该RNA与互补的基因组DNA结合,该酶以位点特异性方式切割该基因组DNA。该文献指出,可以灵活地在gRNA的5'和3'端进行序列插入(以保留的HR诱导活性来量度),并且可以通过杂交拴系到gRNA上,从而使基因组靶向切割与修复模板的即时物理定位偶联,由此可以促进同源重组率超过易错非同源末端连接。还参见Church例如US20150031133。
Dutreix等人的US20030003547讨论了基于寡核苷酸指导的三螺旋形成和同源重组的基因交替或修复的方法和组合物。该文献称,已经选择了可形成三螺旋的寡核苷酸(TFO)来将同源供体DNA(DD)引导至基因组DNA上的预期靶位点,并将其定位以便通过同源重组和/或基因转换进行高效的信息传递。在这种方法中,TFO通过接头共价栓系至DD。该文献称,TFO-DD缀合物的有效性可以用下面几点来解释:(i)局部DD浓度的增加;和(ii)三螺旋的形成刺激DNA修复,可引起参与同源配对、链交换和/或重组的蛋白质的募集。US20030003547提供了一种方法,其中使用衔接子寡核苷酸,借助非共价相互作用将归巢装置(TFO)和供体DNA(DD)连接在一起,所述衔接子寡核苷酸与TFO共价连接。该文献称,可以引导寡核苷酸(天然和修饰的寡核苷酸(ODN)或RNA-DNA嵌合寡核苷酸(RDO))或小DNA片段(单链或双链)至靶位点用于同源置换。
附图简述
图1展示了DNA的CRISPR-Cas9介导的序列特异性切割。
图2A展示了包含crRNA区段的引导RNA和单独的tracrRNA区段。图2B展示了包含crRNA区段和tracrRNA区段的单引导RNA。
图3展示了将引导RNA栓系到用于潜在HR的供体DNA上的策略。
图4显示了提出的供体DNA栓系的Cas9介导的基因打靶。
图5展示了化学修饰对衔接子RNA:供体DNA双链体的保护。
图6展示了将供体DNA定位于Cas9断裂位点附近的双引导RNA方法和组合物。
发明详述
本发明涉及用于通过利用Cas蛋白:引导RNA系统的同源重组来修饰靶多核苷酸的化合物和方法。本公开提供了这样的引导RNA,其包含用于附接供体多核苷酸、其他衔接子或夹板区段(splint segment)的衔接子区段。在某些实施方案中,对衔接子区段的修饰增加衔接子:供体多核苷酸复合物的稳定性;并且不会显著损害Cas:gRNA结合、切口和/或切割靶多核苷酸的效力。在某些实施方案中,使用双重Cas:gRNA系统,其中第一引导RNA指导Cas蛋白在第一靶序列处产生双链断裂,并且第二引导RNA包含栓系于供体多核苷酸的衔接子区段。所述第二引导RNA结合从所述第一靶序列偏移(offset from)的第二靶序列。
I.定义
如本文中使用的,术语“引导RNA”通常是指能与Cas蛋白结合并有助于将Cas蛋白靶向到靶多核苷酸(例如DNA)内的特定位置的RNA分子(或一组RNA分子的全体)。引导RNA可包含crRNA区段和tracrRNA区段。如本文中使用的,术语“crRNA”或“crRNA区段”是指RNA分子或其部分,其包括靶向多核苷酸的引导序列、茎序列和任选的5'-突出端序列。如本文中使用的,术语“tracrRNA”或“tracrRNA区段”是指包括蛋白结合区段(例如,能够与诸如Cas9的CRISPR相关蛋白相互作用的蛋白结合区段)的RNA分子或其部分。术语“引导RNA”涵盖单引导RNA(sgRNA),其中crRNA区段和tracrRNA区段位于同一RNA分子中。术语“引导RNA”还涵盖两个或更多RNA分子的集合意义上的组,其中crRNA区段和tracrRNA区段位于各别的RNA分子中。
术语“核酸”、“多核苷酸”或“寡核苷酸”是指DNA分子、RNA分子或其类似物。如本文中使用的,术语“核酸”、“多核苷酸”和“寡核苷酸”包括但不限于DNA分子,如cDNA、基因组DNA或合成DNA,和RNA分子,如引导RNA、信使RNA或合成RNA。此外,如本文中使用的,术语“核酸”和“多核苷酸”包括单链和双链形式。
在寡核苷酸或多核苷酸背景下的术语“修饰”包括但不限于(a)末端修饰,例如5'端修饰或3'端修饰,(b)核碱基(或“碱基”)修饰,包括置换或去除碱基,(c)糖修饰,包括2'、3'和/或4'位置处的修饰,和(d)主链修饰,包括磷酸二酯键的修饰或置换。术语“修饰的核苷酸”通常是指具有对碱基、糖和磷酸二酯键或主链部分中的一者或多者的化学结构的修饰的核苷酸,包括核苷酸磷酸酯。
如本文中更一般地使用的,“修饰”指这样的化学模块或化学结构的部分,其不同于未修饰的核糖核苷酸,即腺苷、鸟苷、胞苷和尿苷核糖核苷酸中所发现的化学模块或化学结构的部分。术语“修饰”可指修饰的类型。例如,“相同的修饰”是指相同类型的修饰,并且“修饰的核苷酸是相同的”是指修饰的核苷酸具有相同类型的修饰,而碱基(A、G、C、U等)可以是不同的。类似地,具有“两个修饰”的衔接子是具有两种类型的修饰的引导RNA,所述修饰可以在或可以不在同一个核苷酸中,并且每种类型可出现在该衔接子中的多个核苷酸中。类似地,具有“三个修饰”的衔接子多核苷酸是具有三个类型的修饰的衔接子,所述修饰可以在或可以不在同一个核苷酸中,并且每个类型可出现在多个核苷酸中。
“供体多核苷酸”是预期要插入在靶多核苷酸处的核苷酸聚合物或寡聚物。供体多核苷酸可以是天然或修饰的多核苷酸、RNA-DNA嵌合体、或单链或双链的DNA片段、或PCR扩增的ssDNA或dsDNA片段。完全双链供体DNA是有利的,因为它可以提供增加的稳定性,因为dsDNA片段通常比ssDNA更抗核酸酶降解。
术语“xA”、“xG”、“xC”、“xT”或“x(A,G,C,T)”和“yA”、“yG”、“yC”、“yT”或“y(A,G,C,T)”是指如Krueger等人,"Synthesis and Properties of Size-Expanded DNAs:TowardDesigned,Functional Genetic Systems",Acc.Chem.Res.2007,40,141-150(2007)所描述的核苷酸、核碱基或核碱基类似物,。
术语“非结构化核酸”或“UNA”是指如US7371580中所述的核苷酸、核碱基或核碱基类似物。
术语“PACE”和“硫代PACE”是指分别含有膦酰基乙酸酯或硫代膦酰基乙酸酯基团的核苷酸间磷酸二酯键类似物。这些修饰属于一大类包含膦酰基羧酸模块、膦酰基羧酸酯模块、硫代膦酰基羧酸模块和硫代膦酰基羧酸酯模块的化合物。这些键可分别通过通式P(CR1R2)nCOOR和(S)-P(CR1R2)nCOOR来描述,其中n是0到6的整数,且R1和R2各自独立地选自H、烷基和取代的烷基。这些修饰中的一些由Yamada等人描述于"Synthesis and BiochemicalEvaluation of Phosphonoformate Oligodeoxyribonucleotides",J.Am.Chem.Soc.128(15),5251-5261(2006)。
如本文中使用的,术语“靶多核苷酸”或“靶”是指含有靶核酸序列的多核苷酸。靶多核苷酸可以是单链或双链的,并且在某些实施方案中是双链DNA。在某些实施方案中,靶多核苷酸是单链RNA。如本文中使用的,“靶核酸序列”或“靶序列”是指人们希望使用CRISPR系统加以结合、切口或切割的特定序列或其互补序列。
术语“杂交(hybridization/hybridizing)”是指完全或部分互补的多核苷酸链在适合的杂交条件下聚到一起以形成双链结构或区域的过程,其中两个组成链通过氢键连接。如本文中使用的,术语“部分杂交”包括其中双链结构或区域含有一个或多个凸起或错配的情况。虽然氢键一般在腺嘌呤和胸腺嘧啶或腺嘌呤和尿嘧啶(A和T或A和U)之间或者在胞嘧啶和鸟嘌呤(C和G)之间形成,但其他的非经典碱基对也可以形成氢键(参见,例如Adams等人,The Biochemistry of the Nucleic Acids,11th ed.,1992)。可以想见,修饰的核苷酸可形成容许或促进杂交的氢键。
术语“切割(cleavage/cleaving)”是指使多核苷酸的核糖基磷酸二酯主链中的共价磷酸二酯键断裂。术语“切割”涵盖单链断裂和双链断裂。双链切割的发生可以是两个不同的单链切割事件的结果。切割可导致平末端或粘性末端(staggered ends)的产生。
术语“CRISPR相关蛋白”或“Cas蛋白”是指野生型Cas蛋白、其片段、或其突变体或变体。术语“Cas突变体”或“Cas变体”是指野生型Cas蛋白的蛋白质或多肽衍生物,例如具有一个或多个点突变、插入、缺失、截短的蛋白质、融合蛋白或其组合。在某些实施方案中,“Cas突变体”或“Cas变体”基本上保留Cas蛋白的核酸酶活性。在某些实施方案中,“Cas突变体”或“Cas变体”被突变,使得一个或两个核酸酶结构域无活性。在某些实施方案中,“Cas突变体”或“Cas变体”具有核酸酶活性。在某些实施方案中,“Cas突变体”或“Cas变体”缺少其对应的野生型的一些或全部核酸酶活性。
具有“gRNA功能性”的合成的引导RNA具有天然存在的引导RNA的一种或多种功能,例如与Cas蛋白缔合,或由与Cas蛋白缔合的引导RNA所执行的某种功能。在某些实施方案中,所述的功能性包括结合靶多核苷酸。在某些实施方案中,所述的功能性包括将Cas蛋白或gRNA:Cas蛋白复合物靶向至靶多核苷酸。在某些实施方案中,所述的功能性包括切口靶多核苷酸。在某些实施方案中,所述的功能性包括在gRNA:Cas系统内起作用以切割靶多核苷酸。在某些实施方案中,所述的功能性包括与Cas蛋白缔合或结合。在某些实施方案中,所述的功能性是具有Cas蛋白的CRISPR/Cas系统(包括具有工程改造的Cas蛋白的人工CRISPR/Cas系统)中的引导RNA的任何其他已知的功能。在某些实施方案中,功能性是天然引导RNA的任何其他功能。合成的引导RNA的gRNA功能性的程度可以比天然存在的引导RNA更大或更小。在某些实施方案中,与相似的天然存在的引导RNA相比,合成的引导RNA可能就某一种特性而言具有更大的功能性,而就另一种特性而言具有更小的功能性。
如本文中使用的,序列的“区段”这一术语是指某一序列的任何小于完整序列的部分(例如,核苷酸子序列或氨基酸子序列)。多核苷酸的区段可以是任何长度,例如长度为至少5、10、15、20、25、30、40、50、75、100、150、200、300或500个或更多个核苷酸。引导序列的一部分可以是引导序列的约50%、40%、30%、20%、10%,例如引导序列的三分之一或更短,例如7、6、5、4、3或2个核苷酸长。
在某一分子的语境中的术语“衍生自”指使用亲本分子或来自该亲本分子的信息分离或制造的分子。例如,Cas9单突变体切口酶和Cas9双突变体无效核酸酶衍生自野生型Cas9蛋白。
在两个或更多个多核苷酸(或两个或更多个多肽)的语境中,术语“基本上相同”指多个序列或子序列,当使用序列比较算法或通过目测对它们进行比较或比对以获得最大的对应性时,它们具有至少约60%、至少约70%、至少约80%、至少约90%-95%、至少约95%、至少约98%、至少约99%或更多核苷酸(或氨基酸)序列同一性。优选地,多核苷酸之间的“基本同一性”存在于多核苷酸的至少约50个核苷酸长、至少约100个核苷酸长、至少约200个核苷酸长度、至少约300个核苷酸长、至少约500个核苷酸长的区域上,或存在于该多核苷酸的全长上。优选地,多肽之间的“基本同一性”存在于多肽的至少约50个氨基酸残基长、至少约100个氨基酸残基长的区域上,或或存在于该多核苷酸的全长上。
如本文中公开的,提供了许多数值范围。应当理解的是,还具体考虑了在该范围的上限和下限之间的距离下限单位的十分之一的每个中间值。还具体考虑了陈述范围所涵盖的每个较小范围或中间值。术语“约”通常指的是指示数值的正或负10%。例如,“约10%”可以指示9%到11%的范围,并且“约20”可以表示18-22。“约”的其他含义可以从上下文显见,例如通过四舍五入,因此,例如,“约1”还可以表示从0.5到1.4。
II.CRISPR介导的序列特异性结合或切割
图1展示了DNA的CRISPR-Cas9介导的序列特异性切割。显示了一个Cas9:引导RNA复合物,其具有工程改造的单引导RNA(sgRNA),该单引导RNA具有:20个核苷酸(nt)的5'端104,其与靶多核苷酸112的原型间隔序列118匹配;随后是Cas9结合柄,其包含发夹108和tracrRNA区段106。sgRNA可以包含超过一个发夹或环。gRNA与Cas9核酸酶116形成复合物。Cas9:gRNA复合物结合靶多核苷酸112,靶多核苷酸112包含3nt的原型间隔序列毗邻基序(PAM)120及其直接上游的原型间隔序列118,所述5'端104与靶序列114杂交。切割发生在靶多核苷酸的两条链上由箭头表示的切割位点112处(Jinek等人,A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.Science 337(6096),816–21(2012))。
III.引导RNA
在至少一个方面,本发明包括合成的引导RNA,其具有引导RNA的功能性,并且包含衔接子区段。在某些实施方案中,衔接子区段包含化学修饰,例如增强稳定性的修饰。包含具有非天然取代基(例如2'-烷氧基或2'-卤素取代基)的天然核苷酸、或除四种典型核糖核苷酸(即A、C、G和U)之外的任何核苷酸(无论是非天然的还是天然的(例如,假尿苷、肌苷或脱氧核苷酸))的引导RNA包含修饰。同样,包含除天然磷酸二酯核苷酸间键以外的任何主链或核苷酸间键的引导RNA具有修饰,并且因此是包含修饰的合成的引导RNA。
在某些实施方案中,保留的引导RNA的功能性包括结合Cas蛋白。在某些实施方案中,保留的功能性包括结合靶多核苷酸。在某些实施方案中,保留的功能性包括将Cas蛋白或gRNA:Cas蛋白复合物靶向至靶多核苷酸。在某些实施方案中,保留的功能性包括通过gRNA:Cas蛋白复合物切口靶多核苷酸。在某些实施方案中,保留的功能性包括通过gRNA:Cas蛋白复合物切割靶多核苷酸。在某些实施方案中,保留的功能性是具有Cas蛋白的CRISPR/Cas系统(包括具有工程改造的Cas蛋白的人工CRISPR/Cas系统)中的引导RNA的任何其他已知的功能。在某些实施方案中,保留的功能性包括天然引导RNA的任何其他功能。
A.包含衔接子区段的引导RNA
在某些实施方案中,引导RNA包含衔接子区段。具有衔接子区段(例如位于tracrRNA区段的3'端或在crRNA区段的5'端的核酸区段)的CRISPR引导RNA可以有助于将引导RNA栓系到可充当用于同源重组的供体的多核苷酸序列(供体多核苷酸)上。当Cas蛋白装载了引导RNA:供体多核苷酸复合物时,Cas蛋白会把供体多核苷酸带到靶切割位点。这可增加Cas切割位点周围的供体多核苷酸的局部浓度,并将发生同源重组(HR)事件的可能性增加到超过其他不需要DNA供体的DNA修复机制。在某些实施方案中,用TC化学(下文讨论)产生延长的sgRNA,当Cas蛋白与sgRNA结合时留下暴露的ssDNA或ssRNA 3'端。提供了新的组合物(即,针对引导RNA的化学修饰)和设计(即,双引导RNA),它们可提高利用‘嵌合’引导RNA:供体DNA方法增加HR的可行性。
在某些实施方案中,衔接子区段与crRNA的5'端或与tracrRNA的3'端附接,尽管可能存在区段和/或功能重叠的某些部分。
在某些实施方案中,引导RNA的衔接子区段的长度为至少10个核苷酸,或者至少11、12、13、14、15、16、17、18、19、20、22、24、26、28或30个核苷酸。在某些实施方案中,引导RNA的衔接子区段的长度为至多18、19、20、22、24、26、28、30、32、34、36、38或40个核苷酸。可以组合任何前述最小值和最大值以形成一定的范围,但最小值应小于最大值。
可利用可编程的Cas9:引导RNA系统的灵活性来在靶细胞基因组中建造特定DSB(参见图1),同时添加栓系的供体多核苷酸作为改善的同源重组的模板(参见图3)。在本发明的组合物和方法中,引导RNA栓系于特定的供体多核苷酸,此栓系位于其5'端、中间或内部、或其3'端,此栓系的目标和效果是增加供体多核苷酸在由Cas9:gRNA复合物产生的双链断裂位点处的局部浓度。图3提供了这种方法的几个实施方案。
引导RNA的3'端不被Cas9蛋白覆盖,并且有证据表明改变该3'延伸部分不会干扰Cas9活性。在某些实施方案中,产生延伸的引导RNA,当Cas9与该引导RNA结合时,留下暴露的ssDNA或ssRNA 3'端(衔接子区段)。可以设计这个衔接子区段以便采取几种构型之一(通过与供体直接附接或通过第二衔接子或夹板附接)来栓系供体多核苷酸。在某些实施方案中,衔接子区段附接在供体多核苷酸的5'端,或附接在供体多核苷酸的中间或内部、或供体多核苷酸的3'端。在某些实施方案中,衔接子区段(以及栓系的供体多核苷酸)位于引导RNA的3'端以外的位置,比如gRNA的5'端或gRNA的5'端的突出端。
引导RNA的衔接子区段包含适合于通过沃森-克里克碱基配对与多核苷酸(例如供体多核苷酸、第二衔接子区段、或夹板)杂交的ssDNA或ssRNA。在与供体DNA直接杂交的ssRNA延伸的情况下,形成衔接子RNA:供体DNA双链体。这样的双链体对于RNA链的核酸酶(如RNA酶H)切割是敏感的。未修饰的衔接子RNA:供体DNA双链体对于RNA酶H切割是敏感的,RNA酶H切割很可能切断引导RNA:Cas9与供体DNA之间的物理连接,从而供体DNA不会与Cas9一起定位到切割位点(图5A)。此外,RNA酶H切割可破坏引导RNA/Cas9功能性,降解引导RNA和/或供体DNA。为了降低RNA酶H切割和破坏衔接子RNA:供体DNA双链体的可能性,将增强稳定性的修饰引入到引导RNA的衔接子区段中的核苷酸(图5B以及下文更详细的描述)。已经证明2'-O-甲基等修饰可保护RNA:DNA杂交体中的RNA不受RNA酶H切割的影响(See Yu等人,A new method for detecting sites of 2'-O-methylation in RNA molecules.RNA 3(3):324–331(1997))。对引导RNA的不同程度和类型的修饰将产生防止RNA酶H切割而不影响Cas活性和期望的重组的最小与最大数量的修饰。其他已知用于稳定引导RNA以对抗磷酸二酯酶并降低核酸的免疫刺激特性的修饰(即2'-O-甲基、3'-硫代磷酸酯、2'-O-甲基、3'硫代PACE)在本发明的组分和方法中也是有益的。
图3A至3E展示了用于栓系引导RNA和供体多核苷酸的一些可能的构型。图3A显示了附加在引导RNA 306之3'端的衔接子RNA序列310,该引导RNA 306与Cas9蛋白316结合。图3B显示了可以通过衔接子区段栓系到引导RNA上的供体DNA寡核苷酸的不同拓扑结构的三个实例。可以设计具有5'突出端333(也称为第二衔接子区段)的双链供体DNA 332使之与衔接子310(图3C中所示)直接杂交。可以使用DNA-RNA连接酶来在*所示的接合部连接DNA-RNA嵌合体。还可以设计具有3'→5'方向性的单链供体DNA 336(图3D中显示)使之与衔接子RNA310杂交,可以通过DNA聚合酶从RNA引物(由**指示的位点)延伸该单链供体DNA以产生双链供体DNA。或者,可以设计单链夹板DNA 338和供体DNA 336,使得供体多核苷酸当与衔接子RNA杂交时(如图3E所示)具有与前述构型相反的方向性(5'→3')。供体DNA 336和衔接子RNA 310同样可以用DNA-RNA连接酶连接(用*指示连接位点)。
根据另一种可能的构型,衔接子区段(直接或间接地)附接于供体多核苷酸的中间部分。在这样的构型中,供体多核苷酸的附接于衔接子区段(或附接于夹板)的部分将通常包括插入到靶多核苷酸中以执行期望的功能的基因、编码序列或其他序列的一部分。因此,衔接子区段或夹板必须特别调整以适用于该部分。例如,衔接子区段或夹板具有与供体多核苷酸的中间部分互补的核苷酸序列,使得它们将通过碱基对杂交彼此连接。在这种构型中,可以提供特异性结合给定供体多核苷酸的衔接子区段。在其他构型中,例如在供体多核苷酸通过其5'端或3'端附接于衔接子区段的情况下,该5'端或3'端可以包含对于期望引入至靶多核苷酸的基因或序列而言不特有的部分,并且可调适衔接子区段使之附接于多个不同的供体多核苷酸,这些供体多核苷具有与该衔接子区段互补的相同部分。
衔接子区段和供体多核苷酸之间的相互作用可以是共价的(通过引物延伸或通过连接),或者可以是非共价的。夹板可以是由核苷酸组成的多核苷酸(包括寡核苷酸),或者可以是包含核酸和其他模块的区段,比如肽-核酸或氨基酸,或者,夹板可以是由肽-核酸组成的聚合物、或者是由天然或非天然氨基酸组成的蛋白质或肽。
图4显示了一种建议的供体DNA栓系的Cas9介导的基因打靶。(左)引导RNA 402具有20个nt的5'端404,其与靶多核苷酸412的原型间隔序列418匹配;随后是包含发夹和tracrRNA区段406的Cas9结合柄。引导RNA 402的3'端包含衔接子RNA 410。衔接子RNA 410通过5'突出端434(其也可以被称为第二衔接子区段)与双链供体DNA 432杂交。引导RNA402与Cas9蛋白416复合。Cas9:gRNA复合物结合靶多核苷酸412,靶多核苷酸412包含3ntPAM 420及其直接上游的原型间隔序列418,所述5'端404与靶序列414杂交。Cas9:引导RNA复合物在由箭头表示的切割位点422处切割靶多核苷酸412的两条链。在靶多核苷酸切割之后,Cas9-引导RNA复合物保留在与靶多核苷酸的局部邻近,由于双链断裂,靶多核苷酸现在是两个区段412a、412b)(右)。这种局部邻近性促进了与供体多核苷酸432发生同源重组以形成经编辑的多核苷酸440的可能性。
B.包含具有至少一个修饰的衔接子区段的引导RNA
在一个方面,本技术提供了一种引导RNA,其包含衔接子区段,衔接子区段具有至少一个修饰,构成修饰的衔接子区段。在某些实施方案中,修饰是改变稳定性的修饰。在某些实施方案中,相对于没有修饰的引导RNA,修饰增加了引导RNA的核酸酶抗性。在某些实施方案中,修饰是增强稳定性的修饰。
图5展示了保护衔接子RNA:供体DNA双链体免受RNA酶H切割的化学修饰。图5A显示衔接子RNA:供体DNA双链体涉及RNA衔接子序列和供体DNA(在该实例中为短的单链DNA序列)之间的杂交。图5B显示由具有2'-O-甲基化学修饰(小旗)的核糖核苷酸组成的引导RNA衔接子序列,该化学修饰防止RNA酶H切割衔接子RNA与供体DNA之间形成的RNA:DNA杂交体。使嵌合的引导RNA:供体DNA稳定化而免受RNA酶H降解,从而使得供体DNA能够与sgRNA:Cas9蛋白一起定位于靶位点。
在某些实施方案中,与gRNA连接的经修饰的衔接子区段包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39个或40个修饰。在某些实施方案中,所有的修饰都是相同的。在某些实施方案中,修饰的衔接子区段的所有修饰的核苷酸具有相同的修饰类型。在某些实施方案中,修饰的衔接子包含不同修饰的核苷酸的组合。在某些实施方案中,修饰的衔接子区段包含两个或更多个修饰的核苷酸。在某些实施方案中,修饰的衔接子区段包含三个或更多个修饰的核苷酸。在某些实施方案中,修饰的核苷酸是连续排列的。在某些实施方案中,修饰的衔接子区段包含至少一段连续的修饰的核苷酸。在某些实施方案中,修饰的衔接子区段包含一段连续的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39个或40个修饰的核苷酸。每个修饰的核苷酸可以独立地包含一种或多种类型的修饰。在某些实施方案中,在修饰的衔接子区段的序列中,修饰的核苷酸都不是连续的,或者有一些但并非全部是连续的。
在某些实施方案中,所述修饰是组入衔接子区段中的核苷酸糖修饰,其选自2'-O-C1-C4烷基如甲基(“2'-OMe”)、2'-脱氧(2'-H)、2'-OC1-C3烷基-OC1-C3烷基如2'-甲氧基乙基(“2'-MOE”)、2'卤代如2'-氟代(“2'-F”)或2'-氯代("2'-C1")、2'-氨基("2'-NH2")、2'-阿拉伯糖基("2'-阿拉伯")核苷酸、2'-F-阿拉伯糖基("2'-F-阿拉伯”)核苷酸、2'-锁核酸(“LNA”)核苷酸,2'-解锁核酸(“ULNA”)核苷酸、L型糖(“L-糖”)和4'-硫代核糖核苷酸。在某些实施方案中,所述修饰是组入到衔接子区段中的核苷酸间键修饰,其选自下组:硫代磷酸酯"P(S)"(P(S))、膦酰基羧酸酯(P(CH2)nCOOR)如膦酰基乙酸酯"PACE"(P(CH2COO-))、硫代膦酰基羧酸酯((S)P(CH2)nCOOR)如硫代膦酰基乙酸酯“硫代PACE”((S)P(CH2COO-))、烷基膦酸酯(P(C1-C3烷基)如甲基膦酸酯-P(CH3)、硼烷膦酸酯(P(BH3))、和二硫代磷酸酯(P(S)2)。
例如,在某些实施方案中,所述糖包含2'-O-C1-4烷基,比如2'-O-甲基(2'-OMe)。在某些实施方案中,所述糖包含2'-O-C1-3烷基-O-C1-3烷基,例如也称为2'-O-(2-甲氧基乙基)或2'-MOE的2'-甲氧基乙氧基(2'-O-CH2CH2OCH3)。在某些实施方案中,所述糖包含2'-卤素,如2'-F、2'-Br、2'-Cl或2'-I。在某些实施方案中,所述糖包含2'-NH2。在某些实施方案中,所述糖包含2'-H(例如脱氧核苷酸)。在某些实施方案中,所述糖包含2'-阿拉伯糖或2'-α-阿拉伯糖。在某些实施方案中,所述糖包含2'-LNA或2'-UNLA。在某些实施方案中,所述糖包含4'-硫代核糖基。在某些实施方案中,修饰的衔接子区段包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39个或40个修饰的糖。
在某些实施方案中,所述修饰包含修饰的主链(即,天然磷酸二酯以外的核苷酸间键)。修饰的核苷酸间键的实例包括但不限于硫代磷酸酯核苷酸间键、手性硫代磷酸酯核苷酸间键、二硫代磷酸酯核苷酸间键、硼烷膦酸酯核苷酸间键、C1-4烷基膦酸酯核苷酸间键如甲基膦酸核苷酸间键、硼烷膦酸酯核苷酸间键、膦酰基羧酸核苷酸间键如膦酰基乙酸核苷酸间键、膦酰基羧酸酯核苷酸间键如膦酰基乙酸酯核苷酸间键、硫代膦酰基羧酸核苷酸间键如硫代膦酰基乙酸核苷酸间键、硫代膦酰基羧酸酯核苷酸间键如硫代膦酰基乙酸酯核苷酸间键。还包括各种盐、混合盐和游离酸形式。在某些实施方案中,修饰的衔接子区段包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39个或40个修饰的核苷酸间键。
在另一方面,本技术提供了一种衔接子区段,其具有两个或更多个修饰的组合。在某些实施方案中,修饰的核苷酸包含2'-O-甲基-3'-硫代磷酸酯。在某些实施方案中,修饰的核苷酸包含2'-O-甲基-3'-膦酰基乙酸酯。在某些实施方案中,修饰的核苷酸包含2'-O-甲基-3'-硫代膦酰基乙酸酯。在某些实施方案中,修饰的核苷酸包含2’-卤代-3’-硫代磷酸酯。在某些实施方案中,修饰的核苷酸包含2’-卤代-3’-膦酰基乙酸酯。在某些实施方案中,修饰的核苷酸包含2’-卤代-3’-硫代膦酰基乙酸酯。在某些实施方案中,修饰的核苷酸包含2’-氟-3’-硫代磷酸酯。在某些实施方案中,修饰的核苷酸包含2’-氟-3’-膦酰基乙酸酯。在某些实施方案中,修饰的核苷酸包含2’-氟-3’-硫代膦酰基乙酸酯。
在某些实施方案中,两个或更多个修饰在同一核苷酸上(例如,一个核苷酸包含2'-O-甲基和3'-硫代膦酰基乙酸酯模块)。在其他实施方案中,两个或更多个修饰在两个不同的核苷酸上(例如,一个核苷酸具有2'-氟基,另一个核苷酸具有2'-O-甲基)。
在某些实施方案中,衔接子区段中的每个修饰都是相同的。在某些实施方案中,衔接子区段中的至少一个修饰不同于衔接子区段中的至少一个其他的修饰。在某些实施方案中,衔接子区段内的单个核苷酸具有两个或更多个修饰。
在某些实施方案中,衔接子区段包含不同类型修饰的组合,并且所述组合中的至少一种类型存在于衔接子多核苷酸的多个位置中。在某些实施方案中,所述组合中的至少一种类型在衔接子区段中出现1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19次或20次。
在某些实施方案中,所述组合中的至少一种类型的修饰出现在两个或更多个修饰的核苷酸中。在某些实施方案中,所述组合中的至少一种类型的修饰出现在三个或更多个修饰的核苷酸中。在某些实施方案中,修饰的核苷酸在序列中不是连续排列的或者至少是不完全连续排列的,因为中间可能间隔有一个或多个未修饰的核苷酸。在某些实施方案中,修饰的核苷酸是连续排列的。在某些实施方案中,衔接子多核苷酸包含一段连续的相同类型的修饰核苷酸。在某些实施方案中,该段具有至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39个或40个修饰的核苷酸。
在某些实施方案中,除了衔接子多核苷酸中的修饰以外,引导RNA的5'部分或3'部分中,特别是在5'部分的前5个或10个核苷酸内或3'部分的最后5个或10个核苷酸内纳入至少一种类型的修饰,用于例如保护RNA免受核酸酶降解或用于其他目的。在某些实施方案中,组合中的至少一种类型的修饰位于引导RNA的5'部分中,并且组合中的至少一种类型的修饰位于引导RNA的3'部分中,特别是在5'部分的前5个或10个核苷酸内和3'部分的最后5个或10个核苷酸内;在某些实施方案中,组合中的至少一种类型的修饰位于引导RNA的的内部区域内(即5’端和3’端之间)。在衔接子区段以外的部分中的修饰可能是期望的,例如,保护RNA免受核酸酶降解或用于其他目的。
在某些实施方案中,所述组合中的至少一个修饰包括2'-O-甲基、2'-氟、2'-氨基、2'-脱氧、2'-阿拉伯糖基、2'-F-阿拉伯糖基、3'-硫代磷酸酯、3'-膦酰基乙酸、3'-膦酰基乙酸酯、3'-硫代膦酰基乙酸、3'-硫代膦酰基乙酸酯、3'-甲基膦酸酯、3'-硼烷膦酸酯、3'-二硫代磷酸酯,或其组合。在某些实施方案中,所述组合中的至少一个修饰包括2'-O-甲基、2'-脱氧、硫代磷酸酯核苷酸间键、膦酰基乙酸核苷酸间键、硫代膦酰基乙酸核苷酸间键或其组合。在某些实施方案中,所述组合中的至少一个修饰包括2'-O-甲基、2'-脱氧、2'-F、硫代磷酸酯核苷酸间键、膦酰基乙酸核苷酸间键、硫代膦酰基乙酸核苷酸间键或其组合。在某些实施方案中,所述组合中的至少两个修饰包括2'-O-甲基核苷酸和硫代磷酸酯核苷酸间键、2'-O-甲基核苷酸和膦酰基乙酸酯核苷酸间键、或2'-O-甲基核苷酸和硫代膦酰基乙酸酯核苷酸间键。在某些实施方案中,所述组合中的至少两个修饰包括2'-O-甲基核苷酸和膦酰基羧酸核苷酸间键、2'-O-甲基核苷酸和膦酰基羧酸酯核苷酸间键、2'-O-甲基核苷酸和硫代膦酰基羧酸核苷酸间键、2'-O-甲基核苷酸和硫代膦酰基羧酸酯核苷酸间键,或其组合。
在某些实施方案中,所述组合中的至少一个修饰包括2'-O-甲基-3'-硫代磷酸酯。在某些实施方案中,所述组合中的至少一个修饰包括2'-O-甲基-3'-膦酰基乙酸酯。在某些实施方案中,所述组合中的至少一个修饰包括2'-O-甲基-3'-硫代膦酰基乙酸酯。在某些实施方案中,所述组合中的至少一个修饰包括2'-卤代-3'-硫代磷酸酯。在某些实施方案中,所述组合中的至少一个修饰包括2'-卤代-3'-膦酰基乙酸酯。在某些实施方案中,所述组合中的至少一个修饰包括2'-卤代-3'-硫代膦酰基乙酸酯。在某些实施方案中,所述组合中的至少一个修饰包括2'-F-3'-硫代磷酸酯。在某些实施方案中,所述组合中的至少一个修饰包括2'-F-3'-膦酰基乙酸酯。在某些实施方案中,所述组合中的至少一个修饰包括2'-F-3'-硫代膦酰基乙酸酯。
在某些实施方案中,所述组合中的至少一个修饰是改变稳定性的修饰。在某些实施方案中,所述组合中的至少一个修饰是增强稳定性的修饰。在某些实施方案中,相对于没有修饰的引导RNA,所述组合中的至少一个修饰增加了引导RNA的核酸酶抗性。
在某些实施方案中,相对于没有修饰的引导RNA,所述组合中的至少一个修饰改变了引导RNA的稳定性和特异性。在某些实施方案中,相对于没有修饰的引导RNA,所述组合中的至少一个修饰改变了引导RNA的稳定性和转染效率。在某些实施方案中,相对于没有修饰的引导RNA,所述组合中的至少一个修饰改变了引导RNA的特异性和转染效率。
在某些实施方案中,所述组合包括增加核酸酶抗性(即稳定性)的至少一个修饰或一组修饰、以及增加特异性(即减少脱靶效应)的至少一个修饰或一组修饰。在某些实施方案中,所述组合包括增加核酸酶抗性(即稳定性)的至少一个修饰或一组修饰、以及提高引导RNA中的一些碱基配对的Tm的至少一个修饰或一组修饰。在某些实施方案中,所述组合包括增加核酸酶抗性(即稳定性)的至少一个修饰或一组修饰、以及降低引导RNA的一些碱基配对的Tm的至少一个修饰或一组修饰。在某些实施方案中,所述组合包括增加核酸酶抗性(即稳定性)的至少一个修饰或一组修饰、增加引导RNA中的一些碱基配对的Tm的至少一个修饰或一组修饰、以及降低引导RNA中别处的一些碱基配对的Tm的至少一个修饰或一组修饰。在某些实施方案中,所述组合包括增加核酸酶抗性(即稳定性)的至少一个修饰或一组修饰、以及增加引导RNA与Cas蛋白结合的至少一个修饰或一组修饰。在某些实施方案中,所述组合包括增加核酸酶抗性(即稳定性)的至少一个修饰或一组修饰、以及增加引导RNA与Cas蛋白结合的至少一个修饰或一组修饰。在某些实施方案中,引导RNA包含不同类型的修饰的组合。
C.引导RNA结构
在某些实施方案中,引导RNA能够与CRISPR相关蛋白形成复合物。在某些实施方案中,CRISPR相关蛋白是CRISPR-Cas II型系统或衍生自该系统,该系统具有RNA引导的核酸结合或核酸酶活性。在某些实施方案中,CRISPR相关蛋白是Cas9、Cas9突变体或Cas9变体。在某些实施方案中,CRISPR相关蛋白是来自酿脓链球菌的Cas9核酸酶。在某些实施方案中,CRISPR相关蛋白是来自嗜热链球菌的Cas9核酸酶。在某些实施方案中,CRISPR相关蛋白是来自金黄色葡萄球菌的Cas9核酸酶。在某些实施方案中,合成的引导RNA或合成的引导RNA:CRISPR相关蛋白复合物维持天然引导RNA或不具有修饰核苷酸的复合物的功能性。在某些实施方案中,功能性包括结合靶多核苷酸。在某些实施方案中,所述功能性包括切口靶多核苷酸。在某些实施方案中,所述功能性包括切割靶多核苷酸。在某些实施方案中,靶多核苷酸在体外的核酸之内。在某些实施方案中,靶多核苷酸在体内或体外的细胞的基因组内(比如在培养的细胞或从生物分离的细胞中)。在某些实施方案中,靶多核苷酸是DNA中的原型间隔序列。
在某些实施方案中,crRNA区段包含25至80个核苷酸。在某些实施方案中,crRNA区段包含能够与靶序列杂交的引导序列。在某些实施方案中,引导序列与靶序列或其部分互补。在某些实施方案中,引导序列包含15至30个核苷酸。在某些实施方案中,crRNA区段包含茎序列。在某些实施方案中,茎序列包含10至50个核苷酸。在某些实施方案中,crRNA区段包含5'-突出端序列。在某些实施方案中,5'-突出端序列附接于衔接子区段。在某些实施方案中,5'-突出端序列包含1至10个核苷酸。在某些实施方案中,crRNA包含(i)能够与靶序列杂交的引导序列和(ii)茎序列。在某些实施方案中,crRNA包含(i)5'-突出端序列、(ii)能够与靶序列杂交的引导序列、和(iii)茎序列。在某些crRNA区段包含茎序列的实施方案中,tracrRNA区段包含与crRNA区段的茎序列部分或完全互补的核苷酸序列。在某些实施方案中,tracrRNA区段包含至少一个另外的双链体结构。
引导RNA包含5'部分(即,5'半部)和3'部分(即,3'半部)。在某些实施方案中,crRNA区段在tracrRNA区段的5'(即,上游)。在某些实施方案中,tracrRNA区段在相对于crRNA区段的5'。
在某些实施方案中,引导RNA包含至少两个分别的RNA链,例如分别的crRNA链和tracrRNA链。参见例如图2A。在某些实施方案中,这些链一起发挥作用而引导靶多核苷酸被Cas蛋白(例如Cas9)结合、切口或切割。在某些实施方案中,crRNA区段和tracrRNA区段在分别的链上,并通过两个互补序列彼此杂交形成茎或双链体。
在某些实施方案中,引导RNA是包含crRNA区段和tracrRNA区段的单引导RNA。参见例如图2B。在某些实施方案中,crRNA区段和tracrRNA区段通过环序列L连接。在某些实施方案中,环L包含1、2、3、4、5、6、7、8、9个或10个核苷酸。在某些实施方案中,环L包含GNRA的核苷酸序列,其中N代表A、C、G或U,并且R代表A或G。在某些实施方案中,环L包含GAAA的核苷酸序列。在某些实施方案中,单引导RNA包含5'部分和3'部分,其中crRNA区段位于tracrRNA区段的上游。
在某些实施方案中,前述两个RNA片段的总长度可以为约60-280(例如,约60-260、60-240、65-280、65-270、65-260、65-250、65-240、70-230、和70-220)个核苷酸,比如长约60、65、70、75、80、90、100、110、120、130、140,150、160、170、180、190、200、220、230、240、250、260、270个或280个核苷酸。类似地,单引导RNA(例如,图2B)可以长约60-280(例如,约60-260、60-240、65-280、65-270、65-260、65-250、65-240、70-230、和70-220)个核苷酸,比如长约60、65、70、75、80、90、100、110、120、130、140,150、160、170、180、190、200、220、230、240、250、260、270个或280个核苷酸。
如图2A和2B中所示,合成的引导RNA包含(i)crRNA区段204,其包含(a)能够与核酸中的靶序列杂交的引导序列224,(b)能够部分或完全与第二茎序列228杂交的第一茎序列226,以及任选的5'-突出端序列,和(ii)包含第二茎序列228的tracrRNA区段206。在某些实施方案中,在图2A和2B中所示的合成的引导RNA中由O、G、X、Y或T表示的任何核苷酸可以是修饰的核苷酸。图2B中所示的引导RNA表示单引导RNA(sgRNA),其中crRNA区段和tracrRNA区段通过具有序列GAAA的环230连接。
在某些实施方案中,引导RNA的crRNA区段的长度为25-70(例如,30-60、35-50或40-45)个核苷酸。在某些实施方案中,引导序列的长度为12-30(例如16-25、17-20或15-18)个核苷酸。在一些实施方案中,crRNA的5'部分不与靶序列杂交或仅与靶序列部分杂交。例如,在crRNA区段上可以存在5'-突出端。
在某些实施方案中,单引导RNA包含中央部分,所述中央部分包含crRNA区段的茎序列、tracrRNA区段的茎序列,以及任选的使crRNA区段与tracrRNA区段共价连接的环。在某些实施方案中,单引导RNA的中央区段的长度为8-60(例如10-55、10-50或20-40)个核苷酸。
在某些实施方案中,引导RNA的tracrRNA区段的长度为10-130(例如10-125、10-100、10-75、10-50或10-25)个核苷酸。在某些实施方案中,除了中央区段中的任何发夹或双链体结构之外,tracrRNA区段还包含一个或多个发夹或双链体结构。
在某些实施方案中,tracrRNA区段与参考tracrRNA(比如天然存在的成熟tracrRNA)相比被截短。已证明一系列长度在分离型(图2A)和sgRNA型(图2B)两者中都起作用。例如,在某些实施方案中,tracrRNA可以从其3'端截短至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35个或40个nt。在某些实施方案中,tracrRNA分子可以从其5'端截短至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75个或80个nt。在某些实施方案中,tracrRNA分子可以从5'端和3'端都被截短,例如从5'端截短至少1、2、3、4、5、6、7、8、9、10、15个或20个nt并且从3'端截短至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35个或40个nt。参见,例如Jinek等人,Science 2012;337:816-821;Mali等人,Science.2013Feb 15;339(6121):823-6;Cong等人,Science.2013Feb 15;339(6121):819-23;以及Hwang和Fu等人,Nat Biotechnol.2013Mar;31(3):227-9;Jinek等人,Elife 2,e00471(2013))。在某些实施方案中,tracrRNA是未截短的。tracrRNA区段具有足够数量的核苷酸,从而保留了tracrRNA的功能性。
E.供体多核苷酸
可以用DNA-RNA连接酶将供体多核苷酸和衔接子RNA连接以形成嵌合RNA-DNA,其中衔接子通过核苷酸间键(图3C和3E中的*处)与供体结合。
使用本发明的组合物和方法,可以将供体多核苷酸插入到靶多核苷酸中,例如插入到细胞的基因组中。在某些实施方案中,供体多核苷酸是具有有义和/或反义链多核苷酸突出端的双链多核苷酸,所述突出端与经切割的靶多核苷酸的相应多核苷酸突出端至少部分地互补,以促进供体多核苷酸插入经切割的靶多核苷酸中。在一些实施方案中,在插入到靶多核苷酸之后,供体多核苷酸可以表达多肽。在某些实施方案中,多肽可以是能够起作用以诱导细胞以特定方式(比如向特定谱系)进行分化或成熟的蛋白质。在某些实施方案中,供体多核苷酸表达多肽可以受到诱导型启动子的控制。在其他实施方案中,供体多核苷酸表达多肽可以受到阻遏型启动子的控制。在其他实施方案中,供体多核苷酸可以编码一个以上的多肽,例如供体多核苷酸可以包括具有多个基因的表达盒。在某些供体多核苷酸编码一个以上多肽的实施方案中,供体多核苷酸可以具有诱导型启动子来调节某些基因的表达,并且具有阻遏型启动子来调节其他基因的表达。
在某些实施方案中,供体多核苷酸是具有有义和/或反义链多核苷酸突出端的单链或双链供体多核苷酸,当基因组DNA在基因组插入位点处被切割时,所述突出端与经切割的基因组DNA的相应多核苷酸突出端互补。互补突出端促进供体多核苷酸与切割的基因组DNA的同源重组,从而将多核苷酸引入到细胞的基因组中。在某些实施方案中,所述突出端具有约15个碱基至约500个碱基。在某些实施方案中,所述突出端的长度为至少15个核苷酸,比如20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900个或1,000个碱基。在某些实施方案中,所述突出端具有至少15个碱基、或者至少20个碱基、或者至少25个碱基、或者至少30个碱基、或者至少35个碱基、或者至少40个碱基、或者至少50个碱基、或者至少55个碱基、或者至少60个碱基、或者至少65个碱基、或者至少70个碱基、或者至少75个碱基、或者至少约100个碱基、或者至少约150个碱基、或者至少约200个碱基、或者至少约300个碱基、或者至少约400个碱基、或者至少约500个碱基、或者至少约800个碱基。互补性不必是100%互补。例如,互补突出端可以与切割的靶多核苷酸的突出端95%、96%、97%、98%或99%互补。
在某些实施方案中,所述方法包括将供体多核苷酸插入到细胞的基因组中。供体多核苷酸可以具有任何长度,比如长约10个至约10,000个核苷酸(或其间的任何整数值),比如长约50个至约2,000个核苷酸、或长约100个至约1,000个核苷酸(或其间的任何整数)、或长约200个至约500个核苷酸。用于确定核酸和氨基酸序列同一性的技术是本领域已知的。
F.双引导RNA方法
图6展示了将供体多核苷酸定位于Cas催化的断裂位点附近的双引导RNA策略。更具体而言,图6显示了两种引导RNA 602和650、Cas9酶616和无催化活性的Cas9突变体(dCas9)的策略。第一单引导RNA 602具有:crRNA结构域604,其包含与靶多核苷酸612中的第一靶序列614互补的引导序列;tracrRNA结构域606,其结合Cas9酶616;以及位于crRNA604和tracrRNA 606之间的发夹或双链体结构608。Cas9:第一引导RNA复合物结合第一靶序列614,第一靶序列614包含PAM位点及其直接上游的原型间隔序列。在靶多核苷酸612中的第一靶序列614中,Cas9在由箭头指示的位点622处进行切割产生双链断裂(DSB)。第二单引导RNA 650在5'端具有crRNA结构域658,该结构域与靶多核苷酸612中的第二靶序列656互补,结合dCas9突变体652的tracrRNA结构域660。第二单引导RNA650还包含第一衔接子区段610,第一衔接子区段610附接于供体单链多核苷酸636。dCas9:第二引导RNA复合物结合、但不切割第二靶序列656。
Cas9:第一引导RNA(sgRNA1)复合物在正确的靶多核苷酸位点622处切割,而第二引导RNA(sgRNA2)650栓系于供体DNA 636(此处为单链)上并与附近的第二靶序列结合,所述第二靶序列以偏移654与第一靶序列614分开。在这种情况下,第二引导RNA被无催化活性的Cas9(dCas9)652装载,因此不切割或切口DNA。sgRNA1:Cas9介导的靶多核苷酸上的DSB启动DNA修复机制,由于附近供体DNA 636的存在,同源重组的可能性较高。
在栓系的供体多核苷酸通过栓系构型与引导RNA和Cas9蛋白复合时,作为HR模板的栓系的供体多核苷酸的功能性可以保留。然而,Cas9介导的HR的机制尚未完全阐明,而且在切割之后从DNA中的双链断裂(DSB)位点去除引导RNA:Cas9复合物的手段尚未得到表征。我们认为,在DSB的HR修复之前,或者在HR修复过程中,涉及引导RNA:Cas9复合物的降解,或者引导RNA:Cas9复合物被与DSB开来。在这种情况下,栓系到引导RNA:Cas9上的供体DNA不会保持定位于DSB处,或者可能被降解。在发现HR事件对引导RNA:Cas9复合物具有破坏性的情况下,双引导RNA方法对于基于Cas的HR而言可能是优选的,双引导RNA方法具有第二引导RNA:dCas9(无催化活性)复合物,其结合在第一引导RNA:Cas9复合物的靶标附近的DNA序列(图6)。第一引导RNA不含衔接子序列,该引导RNA:Cas9复合物发挥在期望的靶位点形成DSB的作用,而第二引导RNA具有衔接子并栓系到供体DNA上。无论第一引导RNA:Cas9复合物在形成DSB后的结局如何,(第二)引导RNA:供体DNA:dCas9复合物将在DNA修复之前和期间都保留在DSB附近,从而提供了局部供体多核苷酸,使得修复倾向于采取HR途径。
在双引导RNA的DNA靶序列之间的偏移654(以碱基对计)的距离或长度应该如此选择,使得靶标分开足够远以致于它们不会干扰彼此的功能性或HR事件,而又足够接近,使得当第一引导RNA:Cas9复合物在靶位点处产生DSB时,位于偏置的靶标处的栓系供体DNA可以有效地用作HR模板。选择适当的偏移距离时参考已经发表的评价成对的切口酶的偏移范围的研究,成对的切口酶也需要在靶DNA序列上紧密靠近的双重sgRNA:Cas9独立地发挥功能(参见,例如Mali等人,CAS9 transcriptional activators for target specificityscreening and paired nickases for cooperative genome engineering.NatureBiotechnology 31,833–838(2013);Ran等人,Double Nicking by RNA-Guided CRISPRCas9 for Enhanced Genome Editing Specificity.Cell,154(6),1380-1389(2013))。
例如,所述偏移可以在至少-8bp至100bp,或者-4bp至20bp,或者0bp至12bp的范围内。在某些实施方案中,所述偏移是至少-8bp,至少-6bp或至少-4bp,或至少2bp,或至少0bp,或至少2bp,或至少4bp。在某些实施方案中,所述偏移是至多100bp,或至多60bp,或至多40bp,或至多30bp,或至多20bp,或至多18bp,或至多16bp,或至多14bp,或至多12bp,或至多10bp,或至多8bp。可以将任何前述的最小值和最大值组合形成一个范围。负的偏移意味着两个引导序列重叠相应的碱基对数;-4的偏移表示第一引导序列与靶多核苷酸的第一链中的4个核苷酸结合,这4个核苷酸与第二引导序列所结合的互补序列中的核苷酸碱基配对。
这种策略要求引导RNA:供体DNA与dCas9复合,而切割靶向的引导RNA与催化活性的Cas9蛋白复合。为了确保这一点,一种可能性是采用正交(orthogonal)Cas9蛋白(Esvelt等人,Orthogonal Cas9 proteins for RNA-guided gene regulation and editing.NatMethods.2013 Nov;10(11):1116-21(2013)),正交Cas9蛋白可以作为质粒、mRNA或蛋白质引入到细胞中,由此特异性地装载期望的引导RNA。或者,可以每个引导RNA与对应的Cas9蛋白在体外预先复合,然后递送到细胞中,这样确保将引导RNA:供体DNA被装载到dCas9中。最后,在一些情况下,如果两个引导RNA靶标都在HR模板所覆盖的序列之内,则任一处切割都可能被通过HR修复,两处切割实际上都可以增加HR,这在干细胞基因编辑中已经观察到(Mandal等人,Efficient ablation of genes in human hematopoietic stem andeffector cells using CRISPR/Cas9.Cell Stem Cell.Nov 6;15(5):643-52(2014)。
用于将供体多核苷酸定位于Cas催化的断裂位点附近的另一种双引导RNA策略包括使用截短的引导序列。更具体而言,所述策略采用靶向靶多核苷酸的第一靶序列并与之杂交的第一引导RNA。所述第一引导RNA适合于与催化活性Cas9蛋白形成复合物,由此形成催化活性复合物。该策略还采用第二引导RNA,第二引导RNA靶向靶多核苷酸的第二靶序列并与之杂交,由此与催化活性Cas9蛋白形成复合物。然而,第二引导RNA具有截短的引导序列,而且该Cas9:第二gRNA复合物不具有催化活性。第二引导RNA的截短的引导序列包含14、15或16个核苷酸。尽管本发明人不受理论束缚,但认为具有14、15或16个核苷酸的截短的引导RNA将保留其与Cas蛋白形成复合物、识别互补靶序列、和结合该靶序列的能力;然而,由Cas蛋白和14nt gRNA、15nt gRNA或16nt gRNA形成的复合物将基本上不切割或切口所述靶序列,因为很少或没有可检测出的切割或切口。在Fu等人,Nat.Biotechnol.,32,279–84(2014)中,通过截短20-nt引导序列5'端的2个或3个核苷酸,生成截短的引导RNA(tru-RGN),实现了CRISPR-Cas9切割的特异性的改善。由于这些tru-RGN具有与靶序列互补的17个或18个核苷酸,减少了脱靶切割活性。然而,5'端的进一步截短通常会降低中靶(on-target)的引导RNA-Cas9活性,当DNA配对序列被截短至15nt或更短时,中靶活性降低至背景水平,当截短至16nt时可检测活性显著降低或消除。可以基于基因靶(包括生物和靶多核苷酸的性质)、基于不同的生物Cas9蛋白、或基于前述两者来选择截短的gRNA的期望长度。
在此双gRNA策略中,第二gRNA具有位于5'端的包含截短的引导序列的crRNA结构域、位于3'端的结合Cas9蛋白的tracrRNA结构域,以及附接于5'端或3'端的第一衔接子区段。第一衔接子区段与(i)供体多核苷酸、(ii)第二衔接子区段、或(iii)夹板区段互补。第一衔接子区段可以直接或间接附接于供体多核苷酸。Cas蛋白:第二引导RNA复合物结合但不切割第二靶序列。如上所述,第一靶序列和第二靶序列之间可以具有偏移,其结果是,第二gRNA将供体多核苷酸带到与Cas9:第一gRNA复合物形成的切割位点期望的接近处,由此增加同源重组的可能性。这种双gRNA策略的优点在于,它不需要正交Cas9蛋白,也不需要dCas9或其他“死的”(dead)Cas蛋白,也不需要超过一种的Cas蛋白。
G.引导RNA的合成
在某些实施方案中,通过使用合成有机化学领域的化学合成来产生引导RNA,包括单引导RNA(sgRNA;参见图1和图2B)。包含除了四种主要核糖核苷酸(即A、C、G和U)以外的任何核苷酸(无论是非天然的还是天然的,比如假尿苷、肌苷或脱氧核苷酸)的引导RNA具有化学修饰或取代,所述修饰或取代位于在化学/结构上不同于RNA中的四种主要核苷酸中任何一种的核苷酸处。
本文所述的合成的引导RNA可以化学合成。例如,合成的引导RNA的合成可以使用TC化学通过Dellinger等人在J.Am.Chem.Soc.2011,133,11540中、在美国专利8,202,983和美国专利申请2010/0076183A1中描述的方法。“TC化学”是指通过硫代氨基甲酸酯保护基团使用2’-羟基模块上保护的RNA单体核苷酸前体的组合物和方法,以合成未修饰的RNA或包含一个或多个修饰的核苷酸的修饰的RNA。使用TC-RNA化学法化学合成相对长的RNA(长达200个核苷酸或更多)的能力使得能够产生具有胜过由四种主要核糖核苷酸(A、C、G和U)所实现的特殊特征的引导RNA。还可以使用本领域已知的方法(包括体外转录和基于细胞的表达)制造本文描述的一些合成的引导RNA。例如,可将2'-氟NTP掺入到通过基于细胞的表达产生的合成的引导RNA中。
引导RNA的合成也可通过RNA序列的化学合成或酶促合成来实现,所述RNA序列随后通过酶连接在一起,或通过化学连接加以化学连接,包括但不限于溴化氰化学法,如R.Kumar等人在Journal of the American Chemical Society,2007,129,6859-6864中发表的“点击”化学,或如K.Hill在名称为“Compositions and methods for conjugatingoligonucleotides.”的WO2013176844中所述的方形酸(squarate)缀合化学。
如下文进一步描述的,本文中公开的引导RNA(包括那些包含具有修饰的核苷酸和/或修饰的核苷酸间键的衔接子区段的引导RNA)可用于在体外或体内(比如在无细胞测定中,在完整细胞中或在整个生物体中)执行各种CRISPR介导的功能(包括但不限于编辑基因、调节基因表达、切割靶序列、和与靶序列结合)。对于体外或体内应用,可以按本领域已知的任何方式将RNA递送到细胞或整个生物体中。
H.引导RNA文库
在一个方面,本发明提供了具有衔接子区段的多个引导RNA的集合或文库。在某些实施方案中,所述文库含有两个或更多个本文中公开的引导RNA。文库可以含有约10个至约107个个体成员,例如约10个至约102个、约102个至约103个、约103个至约105个、约105个至约107个成员。,文库的个体成员至少在引导序列,即gRNA的DNA靶向区段方面不同于文库的其他成员。另一方面,在某些实施方案中,文库的每个个体成员可以包含与文库的所有其他成员相同或基本相同的tracrRNA区段和/或衔接子区段的核苷酸序列。以这种方式,文库可以包含靶向不同的多核苷酸、或者靶向一个或多个多核苷酸中的不同序列的成员。
在某些实施方案中,文库包含至少102个独特的引导序列。在某些实施方案中,文库包含至少103个独特的引导序列。在某些实施方案中,文库包含至少104个独特的引导序列。在某些实施方案中,文库包含至少105个独特的引导序列。在某些实施方案中,文库包含至少106个独特的引导序列。在某些实施方案中,文库包含至少107个独特的引导序列。在某些实施方案中,文库靶向至少10个不同的多核苷酸。在某些实施方案中,文库靶向至少102个不同的多核苷酸。在某些实施方案中,文库靶向至少103个不同的多核苷酸。在某些实施方案中,文库靶向至少104个不同的多核苷酸。在某些实施方案中,文库靶向至少105个不同的多核苷酸。在某些实施方案中,文库靶向至少106个不同的多核苷酸。在某些实施方案中,文库靶向至少107个不同的多核苷酸。
在某些实施方案中,文库允许进行高通量、多靶标基因组操作和分析。在某些实施方案中,仅有引导RNA的DNA靶向区段是变化的,而Cas蛋白结合区段是相同的。在某些实施方案中,文库的第一部分包含具有识别、结合和指导某种特定Cas蛋白的Cas结合区段的引导RNA,而文库的第二部分包含识别、结合和指导另一不同的Cas蛋白(例如来自不同物种的Cas蛋白)的不同的Cas结合区段,由此允许文库与两种或更多种正交Cas蛋白共同起作用。在某些实施方案中,第一正交Cas蛋白的诱导表达利用该文库的与第一正交Cas蛋白相互作用的部分。在某些实施方案中,第一和第二正交Cas蛋白的诱导表达分别利用该文库的与第一和第二正交Cas蛋白相互作用的部分。在某些实施方案中,第一和第二正交Cas蛋白的诱导表达在不同时间发生。因此,可以通过专门操作或修饰文库中指定的多个靶标来进行大规模的基因编辑或基因调控。
IV.Cas蛋白
如上所述,功能性CRISPR-Cas系统还需要提供期望活性(比如靶结合或靶切口/切割)的蛋白质组分(例如,Cas蛋白,其可以是Cas核酸酶)。在某些实施方案中,期望的活性是靶结合。在某些实施方案中,期望的活性是靶切口或靶切割。可以将Cas蛋白作为纯化或非纯化的(i)Cas蛋白或(ii)编码用于表达Cas蛋白的mRNA或(iii)编码用于表达所述蛋白的线性或环状DNA而引入体外或体内系统。提供Cas蛋白的这三种方法中的任一种在本领域中是熟知的,并且在本文中提及Cas蛋白或Cas蛋白的用途时,可以互换地暗示了这三种方法。在某些实施方案中,从mRNA或DNA以组成型方式表达Cas蛋白。在某些实施方案中,从mRNA或DNA表达Cas蛋白是诱导型的或被诱导的。
在某些实施方案中,Cas蛋白是化学合成的(参见例如,Creighton,"Proteins:Structures and Molecular Principles,"W.H.Freeman&Co.,NY,1983),或通过本文所述的重组DNA技术产生。要获得更多的指导,技术人员可以查阅Frederick M.Ausubel等人,Current Protocols in Molecular Biology,John Wiley&Sons,2003;和Sambrook等人,Molecular Cloning,A Laboratory Manual,"Cold Spring Harbor Press,Cold SpringHarbor,NY,2001)。
在某些实施方案中,提供纯化或分离形式的Cas蛋白。在某些实施方案中,提供约80%、约90%、约95%或约99%纯度的Cas蛋白。在某些实施方案中,提供Cas蛋白作为组合物的一部分。在某些实施方案中,提供Cas蛋白在水性组合物中,其适合用作或包含在用于RNA引导的核酸酶反应的组合物中。本领域技术人员很清楚各种可以包含在这样的核酸酶反应组合物中的物质。
在某些实施方案中,提供Cas蛋白作为重组多肽。在某些实例中,将重组多肽制备为融合蛋白。例如,在某些实施方案中,编码Cas蛋白的核酸与编码融合配偶体的另一核酸连接,所述融合配偶体例如谷胱甘肽-S-转移酶(GST)、6x-His表位标签或M13基因3蛋白。可以使用适合的宿主细胞来表达融合蛋白。在某些实施方案中,通过本领域已知的方法分离融合蛋白。在某些实施方案中,可以例如通过酶消化进一步处理融合蛋白,以去除所述融合配偶体并获得Cas蛋白。或者,可使用本领域已知的宿主细胞系统或体外翻译-转录系统以重组技术制备Cas蛋白:引导RNA复合物。这种系统和技术的细节可以在例如WO2014144761、WO2014144592、WO2013176772、US20140273226和US20140273233中找到。
A.野生型Cas蛋白
在某些实施方案中,Cas蛋白包括具有RNA引导的多核苷酸结合活性或核酸酶活性的CRISPR-Cas I型、II型或III型系统的蛋白质、或从所述系统衍生的蛋白质。适合的Cas蛋白的非限制性实例包括Cas3、Cas4、Cas5、Cas5e(或CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(或CasA)、Cse2(或CasB)、Cse3(或CasE)、Cse4(或CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csz1、Csx15、Csf1、Csf2、Csf3、Csf4、和Cu1966。参见例如,WO2014144761、WO2014144592、WO2013176772、US20140273226和US20140273233。
在某些实施方案中,Cas蛋白衍生自II型CRISPR-Cas系统。在某些实施方案中,Cas蛋白是或衍生自Cas9蛋白。在某些实施方案中,Cas蛋白是或衍生自细菌Cas9蛋白,包括WO2014144761中鉴定的那些。在某些实施方案中,Cas蛋白是或衍生自链球菌属物种(Streptococcus sp.)或葡萄球菌属物种(Staphylococcus sp.)Cas9蛋白。在某些实施方案中,Cas蛋白是或衍生自嗜热链球菌(Streptococcus thermophilus)Cas9蛋白。在某些实施方案中,Cas蛋白是或衍生自酿脓链球菌(Streptococcus pyogenes)Cas9蛋白。在某些实施方案中,Cas蛋白是或衍生自金黄色葡萄球菌(Staphylococcus aureus)Cas9蛋白。在某些实施方案中,Cas蛋白是或衍生自嗜热链球菌(Streptococcus thermophilus)Cas9蛋白。
在某些实施方案中,野生型Cas蛋白是Cas9p。在某些实施方案中,野生型Cas9蛋白是来自酿脓链球菌的Cas9蛋白(SEQ ID NO:1)。在某些实施方案中,蛋白质或多肽可以包含SEQ ID NO:1的片段、由SEQ ID NO:1的片段组成、或基本上由SEQ ID NO:1的片段组成。
通常,Cas蛋白包含与引导RNA相互作用的至少一个RNA结合结构域。在某些实施方案中,修饰Cas蛋白以增加核酸结合亲和力和/或特异性、改变酶活性、和/或改变所述蛋白的另一种特性。例如,可将Cas蛋白的核酸酶(即,DNA酶、RNA酶)结构域修饰、突变、缺失或失活。或者,可以截短Cas蛋白以去除对所述蛋白的功能不必需的结构域。在某些实施方案中,将Cas蛋白截短或修饰以优化效应子结构域的活性。在某些实施方案中,Cas蛋白包括核定位序列(NLS),其将带NLS标签的Cas蛋白引入活细胞的核中。在某些实施方案中,Cas蛋白包括两个或更多个修饰。
B.突变体Cas蛋白
在一些实施方案中,CRISPR蛋白可以是野生型CRISPR蛋白(例如Cas9)的突变体或其片段。已知的Cas9突变体的实例包括Cas9切口酶,如Cas9-D10A、切割失活的dCas9、具有改变的PAM特异性的Cas9突变体,如Kleinstiverr等人在"Engineered CRISPR-Cas9nucleases with altered PAM specificities",Nature 523,481–485(2015)中公开的那些(例如D1135E SpCas9),来自金黄色葡萄球菌的Cas9突变体(SaCas9),如Ran等人在"In vivo genome editing using Staphylococcus aureus Cas9",Nature 520,186–191(2015)中公开的那些。在其他实施方案中,CRISPR蛋白可以衍生自突变体CRISPR蛋白。例如,可以修饰Cas9蛋白的氨基酸序列以改变所述蛋白的一种或多种特性(例如,核酸酶活性、亲和力、稳定性等)。或者,可以从Cas9蛋白中去除不参与RNA引导的切割的所述蛋白的结构域,使得修饰的Cas9蛋白小于野生型Cas9蛋白。在一些实施方案中,本系统利用来自酿脓链球菌的Cas9蛋白,其如在细菌中所编码或经密码子优化以便在哺乳动物细胞中表达。以下显示的是野生型酿脓链球菌Cas9蛋白序列(SEQ ID NO:1,其可从www.uniprot.org/uniprot/Q99ZW2获得)的氨基酸序列,有时称为(SpCas9)。MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQ ID NO:1)
Cas9蛋白通常具有至少两个核酸酶(例如DNA酶)结构域。例如,Cas9蛋白可以具有RuvC样核酸酶结构域和HNH样核酸酶结构域。RuvC和HNH结构域一起运作,切断靶位点中的两条链,从而在靶多核苷酸中产生双链断裂。(Jinek等人,Science,337:816-821)。在某些实施方案中,将突变型Cas9蛋白修饰为仅含有一个功能性核酸酶结构域(RuvC样或HNH样核酸酶结构域)。例如,在某些实施方案中,将突变型Cas9蛋白修饰为使得核酸酶结构域之一缺失或突变,以至于它不再起作用(即,核酸酶活性不存在)。在其中一个核酸酶结构域失活的一些实施方案中,突变体能够在双链多核苷酸中引入切口(nick)(这种蛋白称为“切口酶”),但不能切割双链多核苷酸。例如,RuvC样结构域中天冬氨酸到丙氨酸(D10A)的转换可导致Cas9衍生的蛋白转化成切口酶。同样,在HNH结构域中组氨酸到丙氨酸(H840A)的转换可导致Cas9衍生的蛋白转化成切口酶。同样,在HNH结构域中天冬酰胺到丙氨酸(N863A)的转换可导致Cas9衍生的蛋白转化成切口酶。
在某些实施方案中,RuvC样核酸酶结构域和HNH样核酸酶结构域两者都被修饰或消除,使得突变型Cas9蛋白不能切口或切割靶多核苷酸。在某些实施方案中,Cas9衍生的蛋白的所有核酸酶结构域都被修饰或消除,使得Cas9衍生的蛋白缺乏全部核酸酶活性。然而,在某些实施方案中,相对于野生型对应物使一些或全部核酸酶活性缺乏的Cas9蛋白在或大或小的程度上维持靶识别活性。
无催化活性的Cas9蛋白可互换地称为“dCas9”蛋白(对于核酸酶而言“死”的Cas9)。在一些实施方案中,提供了这样的dCas9,其对应于Cas9突变体D10A和H840A,或包含所述突变体的部分或全部,所述突变体导致例如核酸酶失活的Cas9(dCas9)。举例来说,这样的突变包括在D10和H840处的其他氨基酸取代或在Cas9的核酸酶结构域内的其他取代(例如,在HNH核酸酶亚结构域和/或RuvC1亚结构域中的取代)。在一些实施方案中,提供了dCas9的变体或同源物(例如SEQ ID NO:5的变体),其与SEQ ID NO:5至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,提供了dCas9的变体(例如SEQ IDNO:5的变体),其具有比SEQ ID NO:5短或长约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多的氨基酸序列。
本发明的组合物和方法可以与酿脓链球菌Cas9以外的CRISPR蛋白一起使用,包括来自细菌或古细菌的其他Cas蛋白,以及切口DNA单链或不具有核酸酶活性的Cas9变体,比如上述在一个或两个核酸酶结构域中带有切割失活突变的切割失活的Cas9。这种方法可以应用于利用单引导RNA的系统以及使用双RNA(例如,在天然存在的系统中发现的crRNA和tracrRNA活性)的系统。
在任何上述实施方案中,可以使用熟知的方法,比如定点诱变、PCR介导的诱变和总基因合成,以及本领域已知的其他方法,通过一个或多个缺失突变、插入突变和/或取代突变使任何或全部核酸酶结构域失活。
在某些实施方案中,“Cas突变体”或“Cas变体”与SEQ ID NO:1至少50%(例如在50%和100%之间的任何数值,包括例如50%、60%、70%、80%、90%、95%、98%和99%)相同。在某些实施方案中,“Cas突变体”或“Cas变体”与RNA分子(例如sgRNA)结合。在某些实施方案中,“Cas突变体”或“Cas变体”通过所述RNA分子靶向特定的多核苷酸序列。
可使用本领域已知的宿主细胞系统或体外翻译-转录系统以重组技术制备CRISPR/Cas蛋白:引导RNA复合物。这种系统和技术的细节可以在例如WO2014144761、WO2014144592、WO2013176772、US20140273226和US20140273233中找到。所述复合物可以至少在一定程度上分离或纯化自其中产生它们的细胞的细胞材料或体外翻译-转录系统。
V.用途和方法
在一个方面,本发明提供了用Cas蛋白切割靶多核苷酸的方法。所述方法包括使所述靶多核苷酸与(i)本文所述的引导RNA或一组引导RNA分子以及(ii)Cas蛋白接触。在某些实施方案中,所述方法导致靶多核苷酸中的双链断裂。在某些实施方案中,Cas蛋白是具有单链切口活性的Cas蛋白。在某些实施方案中,所述方法导致靶多核苷酸中的单链断裂。在某些实施方案中,包含引导RNA和具有单链切口活性的Cas蛋白的复合物被用于序列靶向的单链DNA切割(sequence-targeted single-stranded DNA cleavage),即切口(nicking)。在一些实施方案中,所述方法包括使靶多核苷酸与两种Cas蛋白接触;在一些这样的实施方案中,两种Cas蛋白都具有单链切口活性。
在一个方面,本发明提供了使两个或更多个靶多核苷酸与Cas蛋白结合的方法。所述方法包括使所述靶多核苷酸与(i)本文所述的一组RNA分子和(ii)Cas蛋白接触,从而导致靶多核苷酸与Cas蛋白的结合。在某些实施方案中,所述方法包括两种Cas蛋白,其中Cas蛋白之一是相对于对应的野生型Cas蛋白缺乏一些或全部核酸酶活性的Cas变体,并且另一种Cas蛋白具有双链切割活性。
在一个方面,本发明提供了将Cas蛋白靶向至靶多核苷酸的方法。所述方法包括使Cas蛋白与本文所述的引导RNA或一组引导RNA分子接触。在某些实施方案中,所述方法导致引导RNA:Cas蛋白复合物的形成。在某些实施方案中,Cas蛋白是野生型Cas9蛋白。在某些实施方案中,Cas蛋白是Cas9蛋白的突变体或变体。在某些实施方案中,Cas蛋白是具有单链切口活性的Cas蛋白。在某些实施方案中,Cas蛋白是缺乏核酸酶活性的Cas蛋白(例如,Cas蛋白的核酸酶缺陷突变体)。在某些实施方案中,Cas蛋白是融合蛋白(例如,包含(i)Cas蛋白和(ii)异源多肽的融合蛋白)的一部分。
在一个方面,本发明提供了用于将Cas蛋白靶向至两个或更多个靶多核苷酸的方法。所述方法包括使Cas蛋白与本文所述的一组引导RNA分子接触。在某些实施方案中,所述方法导致引导RNA:Cas蛋白复合物的形成。在某些实施方案中,Cas蛋白是野生型Cas9蛋白。在某些实施方案中,Cas蛋白是Cas9蛋白的突变体或变体。在某些实施方案中,Cas蛋白是具有单链切口活性的Cas蛋白。在某些实施方案中,Cas蛋白是缺乏核酸酶活性的Cas蛋白(例如,Cas蛋白的核酸酶缺陷突变体)。在某些实施方案中,Cas蛋白是融合蛋白(例如,包含(i)Cas蛋白和(ii)异源多肽的融合蛋白)的一部分。
在某些实施方案中,通过转染将引导RNA引入到细胞中。用于RNA转染的技术在本领域中是已知的,包括电穿孔和脂质转染。RNA转染的有效技术主要取决于细胞类型。参见,例如Lujambio等人(西班牙国家癌症中心)Cancer Res.2007年2月,其描述了HTC-116结肠癌细胞的转染,并且使用用于转染可商业获得的、修饰的miRNA或前体miRNA的Oligofectamine(Invitrogen)。还参见Cho等人(Seoul National Univ.)Nat.Biotechnol.,2013年3月,其描述了K562细胞的转染,并且使用用于转染转录的sgRNA(约60个nt长)的4D NucleofectionTM(Lonza)电穿孔。用于转染RNA的技术也是本领域已知的。例如,治疗性RNA已被递送到用侵袭素(Invasin)蛋白包被的非致病性大肠杆菌中(以促进摄取到表达β-1整联蛋白的细胞中),其中大肠杆菌被编码以表达李斯特菌溶血素(lysteriolysin)O成孔蛋白以允许shRNA从大肠杆菌转入细胞质。还参见Cho等人,(SeoulNational Univ.)Nat.Biotechnol.Mar.2013。
在某些实施方案中,将引导RNA引入或递送到细胞中。可用于递送引导RNA的技术包括利用可生物降解聚合物、脂质体或纳米颗粒进行包封的技术。这样的聚合物、脂质体和纳米颗粒可以经静脉内递送。在某些实施方案中,对于体内递送,可以将引导RNA注射到组织部位中或全身施用。体内递送也可通过β-葡聚糖递送系统来实现,如美国专利No.5,032,401和5,607,677以及美国公开No.2005/0281781中所述的那些。在某些实施方案中,将引导RNA或含有引导RNA的递送载体靶向至特定的组织或身体隔室。例如,在某些实施方案中,为了将外源RNA靶向其他组织,将合成的载体用针对受体摄取的细胞特异性配体或适体进行装饰,所述装饰例如将RNA包裹在环糊精纳米颗粒包被的w/PEG中,并且用人转铁蛋白功能化,以便通过在肿瘤细胞中高度表达的转铁蛋白受体进行摄取。其他方法描述于下文或是本领域已知的。。
在某些实施方案中,上述方法和组合物可用于修饰细胞、胚胎或动物中的染色体序列。所述方法包括使细胞或胚胎接触或向其中引入(a)一种或多种RNA引导的核酸内切酶或编码RNA引导的核酸内切酶的核酸,和(b)一种或多种引导RNA或编码引导RNA的DNA,其中所述引导RNA将核酸内切酶引导至染色体序列中的靶向位点,并且所述RNA引导的核酸内切酶在靶向位点处切割染色体序列的至少一条链。靶位点可以包含或靠近可能引起疾患或与疾患相关的突变,例如点突变、易位或倒位。为了纠正这样的突变,在一些实施方案中,所述方法进一步包括使细胞或胚胎接触或向其中引入至少一种供体多核苷酸,所述供体多核苷酸包含所述突变的野生型对应物和至少一个与染色体序列中的靶向位点一侧上的序列具有实质性序列同一性的序列。
在某些实施方案中,上述方法和组合物可用于修饰哺乳动物细胞,包括但不限于原代细胞、干细胞、永生化细胞和条件永生化细胞。适用于本发明方法的细胞和引导RNA的表型包括软骨细胞、糖尿病细胞、上皮细胞、成纤维细胞、胃肠细胞、造血干/祖细胞和免疫细胞、肝细胞、角质形成细胞、黑素细胞、神经细胞、祖细胞、肾细胞、骨骼肌细胞、平滑肌细胞、塞尔托利细胞等。
A.基因组编辑
在一个方面,本发明提供了用于在体内或体外修饰DNA序列的基因组编辑方法(“体外”包括但不限于无细胞系统、细胞裂解物、细胞的分离组分、和活体外的细胞)。DNA序列可以包含染色体序列、游离型序列、质粒、线粒体DNA序列或功能性基因间序列,如增强子序列或非编码RNA。所述方法包括使所述DNA序列与(i)本文所述的引导RNA或一组引导RNA分子以及(ii)Cas蛋白接触。在某些实施方案中,使DNA序列在细胞之外接触。在某些实施方案中,DNA序列位于细胞内的基因组中,并在体外或体内使之接触。在某些实施方案中,细胞在生物体或组织内。在某些实施方案中,所述细胞是人细胞、非人哺乳动物细胞、干细胞、非哺乳动物脊椎动物细胞、无脊椎动物细胞、植物细胞、单细胞生物或胚胎。在某些实施方案中,引导RNA帮助将Cas蛋白靶向至DNA序列中的靶定位点。在某些实施方案中,Cas蛋白在靶定位点处切割DNA序列的至少一条链。在某些实施方案中,Cas蛋白在靶定位点处切割DNA序列的两条链。
在某些实施方案中,所述方法进一步包括将Cas蛋白引入到细胞或另一个系统中。在某些实施方案中,Cas蛋白作为纯化或非纯化蛋白引入。在某些实施方案中,通过编码Cas蛋白的mRNA引入Cas蛋白。在某些实施方案中,通过编码Cas蛋白的线性或环状DNA引入Cas蛋白。在某些实施方案中,所述细胞或系统包含Cas蛋白或编码Cas蛋白的核酸。
在某些实施方案中,可以通过同源定向修复(HDR)过程来修复双链断裂,使得供体多核苷酸中的供体多核苷酸可以整合到靶向的DNA序列中或与其交换。
在某些实施方案中,所述方法还包括将至少一种供体多核苷酸引入到细胞或系统中。在某些实施方案中,供体多核苷酸包含至少一个与DNA序列中位于靶定位点之任一侧的序列具有实质性序列同一性的同源序列。在某些实施方案中,供体多核苷酸包括这样的供体多核苷酸,其可通过同源定向修复(如同源重组)整合到前述DNA序列中或与其交换。
在某些实施方案中,供体多核苷酸包含上游同源序列和下游同源序列,上游同源序列和下游同源序列分别与位于DNA序列中靶定位点的上游和下游的序列具有实质性序列同一性。这些序列相似性使得,例如,供体多核苷酸与靶向的DNA序列之间的同源重组成为可能,从而令供体多核苷酸可以整合到靶向的DNA序列中(或与其交换)。
在某些实施方案中,DNA序列中的靶位点跨越,或邻近于,可能引起疾患或与疾患相关的突变,例如点突变、易位或倒位。在某些实施方案中,所述方法包括通过将至少一种供体多核苷酸引入细胞或系统中来纠正前述的突变,该供体多核苷酸包含(i)与该突变对应的野生型和(ii)至少一个与DNA序列中位于靶定位点一侧的序列具有实质性序列同一性的同源序列。在某些实施方案中,供体多核苷酸包含与DNA序列中位于靶定位点两侧的序列具有实质性序列同一性的同源序列。
在某些实施方案中,供体多核苷酸包括外源序列,所述外源序列可通过同源定向修复过程(比如同源重组)整合到靶向的DNA序列中或与其交换。在某些实施方案中,外源序列包含蛋白质编码基因,该基因任选地与外源启动子控制序列可操作连接。因此,在某些实施方案中,在整合外源序列后,细胞可以表达由整合的基因编码的蛋白质。在某些实施方案中,将外源序列整合到靶向的DNA序列中,使得其在受体细胞或系统中的表达受到外源启动子控制序列的调控。将外源基因整合到靶向的DNA序列中称为“敲入”。在其他实施方案中,外源序列可以是转录控制序列、另一个表达控制序列、RNA编码序列或另一个功能序列。
在某些实施方案中,供体多核苷酸包含与靶定位点处或其附近的DNA序列的一部分基本相同、但包含至少一个核苷酸改变的序列。例如,在某些实施方案中,供体多核苷酸包含在靶定位点处或其附近的修饰或突变版本的DNA序列,使得在与靶定位点整合或交换后,在靶定位点处产生的序列包含至少一个核苷酸变化。在某些实施方案中,所述至少一个核苷酸变化是一个或多个核苷酸的插入、一个或多个核苷酸的缺失、一个或多个核苷酸的取代或其组合。作为修饰序列的整合的结果,细胞可以自该靶定的DNA序列产生修饰的基因产物。
在某些实施方案中,化合物和方法适用于多重应用(multiplex applications)。在某些实施方案中,向细胞或系统中提供或引入引导RNA的文库。在某些实施方案中,文库包含至少100个独特的引导序列。在某些实施方案中,文库包含至少1,000个独特的引导序列。在某些实施方案中,文库包含至少10,000个独特的引导序列。在某些实施方案中,文库包含至少100,000个独特的引导序列。在某些实施方案中,文库包含至少1,000,000个独特的引导序列。在某些实施方案中,文库靶向至少10个不同的多核苷酸或者一个或多个多核苷酸内的至少10个不同的序列。在某些实施方案中,文库靶向至少100个不同的多核苷酸或者一个或多个多核苷酸内的至少100个不同的序列。在某些实施方案中,文库靶向至少1,000个不同的多核苷酸或者一个或多个多核苷酸内的至少1,000个不同的序列。在某些实施方案中,文库靶向至少10,000个不同的多核苷酸或者一个或多个多核苷酸内的至少10,000个不同的序列。在某些实施方案中,文库靶向至少100,000个不同的多核苷酸或者一个或多个多核苷酸内的至少100,000个不同的序列。在某些实施方案中,文库靶向至少1,000,000个不同的多核苷酸或者一个或多个多核苷酸内的至少1,000,000个不同的序列。
在某些实施方案中,提供了适用于多重应用的化合物和方法,其中使用引导RNA序列上的多个正交衔接子区段来栓系不同的供体多核苷酸。每个正交衔接子区段都是一个具有不同crRNA的引导RNA的一部分。这使得所述多个引导RNA能够与独特的相关供体多核苷酸特异性地结合,从而能够通过细胞中的HR来编辑多个靶多核苷酸。这种多重基因组编辑方法的应用可以是在酶(比如激酶)的官能团中的同时靶向氨基酸取代,或者是将多个剪接供体或受体位点工程改造以改变mRNA同种型的稳态池。
VI.试剂盒
在一个方面,本发明提供了含有用于执行上述方法的试剂的试剂盒,包括用于产生gRNA:Cas蛋白复合物和/或支持其结合或切割靶多核苷酸的活性的试剂。在某些实施方案中,用于本文中公开的方法的一种或多种反应组分,例如一种或多种引导RNA和Cas蛋白,可以采取试剂盒的形式供使用。在某些实施方案中,试剂盒包含Cas蛋白或编码Cas蛋白的核酸、以及本文所述的一种或多种引导RNA、或引导RNA的组或文库。在某些实施方案中,试剂盒包含供体多核苷酸。在某些实施方案中,试剂盒包含一种或多种其他反应组分。在某些实施方案中,将适量的一种或多种反应组分提供在一个或多个容器中或保持在基底上。
试剂盒的附加组分的实例包括但不限于:一种或多种不同的聚合酶、一种或多种宿主细胞、用于将外来核酸引入宿主细胞的一种或多种试剂、用于检测引导RNA和/或CasmRNA或蛋白质的表达或用于验证靶核酸的状态的一种或多种试剂(例如探针或PCR引物)、以及用于反应的缓冲液、转染试剂或培养基(处于1倍或更多倍的浓缩形式)。在某些实施方案中,试剂盒包括一种或多种以下组分:生物化学和物理支持物;终止、修饰和/或消化试剂;渗透剂(osmolyte);和用于反应、转染和/或检测的装置。
可以以多种形式提供所使用的反应组分。例如,可以将组分(例如酶、RNA、探针和/或引物)悬浮在水溶液中或结合到珠子上,或为冷冻干燥粉或冻干粉或沉淀物的形式。在后一种情况下,这些组分在复原时形成完全的组分混合物,以供在测定中使用。本发明试剂盒可以提供在适合的温度下。例如,为了将包含蛋白质组分或其复合物的试剂盒储存在液体中,优选将它们提供并保持在0℃以下,优选为约-20℃,可能在含有甘油或其他适合的防冻剂的抗冻溶液中。
试剂盒或系统可含有足以用于至少一种同源重组的量的本文所述组分的任何组合。在一些应用中,一种或多种反应组分可以预先测量的单次使用量提供在单独的一般为一次性的管或等同的容器中。通过这样的布置,可以通过将靶核酸或含有靶核酸的样品或细胞直接添加到单独的管中来进行RNA引导导的核酸酶反应。提供在试剂盒中的组分的量可以是任何适当的量,且可能取决于产品所针对的市场。其中提供组分的容器(一个或多个)可以是能够容纳所提供形式的任何常规容器,例如微量离心管、微量滴定板、安瓿、瓶子、整体试验装置,如流体装置、药筒、侧流装置、或其他类似装置。
试剂盒还可以包括用于容纳容器或容器组合的包装材料。用于这样的试剂盒和系统的典型包装材料包括处于任何构造的容纳反应组分或检测探针的固体基质(例如,玻璃、塑料、纸、箔材、微粒,等),这些构造有多种(例如,管形瓶、微孔滴定板、微阵列,等)。试剂盒可进一步包括以有形形式记录的用于使用组分的说明。
示例性实施方案
根据当前公开的主题提供的示例性实施方案包括但不限于权利要求和以下实施方案:
A1.一种合成的引导RNA,其包含:
crRNA区段,其包含(i)能够与靶序列杂交的引导序列,(ii)茎序列;
tracrRNA区段,其包含与所述茎序列部分或完全互补的核苷酸序列;和
第一衔接子区段,其包含与(i)供体多核苷酸、(ii)第二衔接子区段、或(iii)夹板区段互补的序列,
其中所述衔接子序列包含一个或多个增强稳定性的修饰;并且
其中所述合成的引导RNA具有gRNA功能性。
A2.实施方案A1的合成的引导RNA,其中至少一个修饰是增加衔接子序列对RNA酶H切割的抗性的修饰。
A3.实施方案A1或A2的合成的引导RNA,其中所述衔接子序列包含一个或多个2'-O-甲基模块。
A4.实施方案A1或A2的合成的引导RNA,其中所述衔接子序列包含一个或多个硫代磷酸酯基团。
A5.实施方案A1或A2的合成的引导RNA,其中所述衔接子序列包含一个或多个膦酰基乙酸酯(PACE)基团。
A6.实施方案A1或A2的合成的引导RNA,其中所述衔接子序列包含一个或多个硫代膦酰基乙酸酯(thioPACE)基团。
A7.实施方案A1或A2的合成的引导RNA,其中衔接子区段中的修饰包含2'-O-甲基模块、2'-氟模块、2'-脱氧模块、硫代磷酸酯核苷酸间键、膦酰基乙酸核苷酸间键、硫代膦酰基乙酸核苷酸间键、或其组合。
A8.实施方案A1或A2的合成的引导RNA,其中所述衔接子区段包含选自下组的一个或多个修饰:具有3'-硫代磷酸酯基团的2'-O-甲基核苷酸、具有3'-膦酰基羧酸基团的2'-O-甲基核苷酸、具有3'-膦酰基乙酸基团的2'-O-甲基核苷酸、具有3'-硫代膦酰基羧酸基团的2'-O-甲基核苷酸、具有3'-硫代膦酰基乙酸基团的2'-O-甲基核苷酸、具有3'-膦酰基乙酸基团的2'-脱氧核苷酸、和具有3'-硫代膦酰基乙酸基团的2'-脱氧核苷酸。
A9.实施方案A1或A2的合成的引导RNA,其中所述增强稳定性的修饰包括2'-O-甲基模块、2'-氟模块或2'-脱氧模块。
A10.实施方案A1或A2的合成的引导RNA,其中所述增强稳定性的修饰包括硫代磷酸酯核苷酸间键、膦酰基乙酸核苷酸间键、硫代膦酰基乙酸核苷酸间键、甲基膦酸核苷酸间键、硼烷膦酸酯核苷酸间键、或二硫代磷酸酯核苷酸间键。
A11.实施方案A1或A2的合成的引导RNA,其中所述增强稳定性的修饰包括2'-O-甲基-3'-硫代磷酸酯核苷酸、2'-O-甲基-3'-膦酰基乙酸核苷酸、或2'-O-甲基-3'-硫代膦酰基乙酸核苷酸。
A12.实施方案A1或A2的合成的引导RNA,其中所述增强稳定性的修饰包括2'-氟-3'-硫代磷酸酯核苷酸、2'-氟-3'-膦酰基乙酸核苷酸或2'-氟-3'-硫代膦酰基乙酸核苷酸。
A13.前述任一个实施方案的合成的引导RNA,其中所述增强稳定性的修饰包括超过一个的所述增强稳定性的修饰。
A14.前述任一个实施方案的合成的引导RNA,其中所述衔接子区段连接至tracrRNA区段,并且所述增强稳定性的修饰之一位于所述衔接子区段的最后五个核苷酸内。
A15.前述任一个实施方案的合成的引导RNA,其中所述第一衔接子区段是RNA序列。
A16.前述任一个实施方案的合成的引导RNA,其中所述第二衔接子区段是DNA序列。
A17.前述任一个实施方案的合成的引导RNA,其中所述衔接子区段通过碱基对杂交附接于供体多核苷酸。
A18.实施方案A1-A16中任一个的合成的引导RNA,其中所述衔接子区段通过核苷酸间键附接于供体多核苷酸。
A19.前述任一个实施方案的合成的引导RNA,其中所述合成的引导RNA是单引导RNA,其中所述crRNA区段与所述tracrRNA区段连接。
A20.前述任一个实施方案的合成的引导RNA,其中所述crRNA区段位于所述引导RNA的5'端,并且所述衔接子区段附接于(i)所述crRNA区段或(ii)附接于所述crRNA区段的5'端的5'突出端。
A21.前述任一个实施方案的合成的引导RNA,其中所述tracrRNA区段位于所述引导RNA的3'端,并且所述衔接子区段附接于(i)所述tracrRNA区段或(ii)附接于所述tracrRNA区段的3'端的3'突出端。
A22.前述任一个实施方案的合成的引导RNA,其中所述crRNA区段包含25至70个核苷酸。
A23.前述任一个实施方案的合成的引导RNA,其中所述引导序列包含15至30个核苷酸。
A24.前述任一个实施方案的合成的引导RNA,其中所述茎序列包含10至50个核苷酸。
A25.前述任一个实施方案的合成的引导RNA,其中所述衔接子区段为10至40个核苷酸。
B1.一种引导RNA:供体多核苷酸复合物,其包含(a)具有gRNA功能性的合成的引导RNA,和(b)供体多核苷酸,
其中所述合成的引导RNA包含:
crRNA区段,所述crRNA区段包含(i)能够与靶序列杂交的引导序列,(ii)茎序列;
tracrRNA区段,所述tracrRNA区段包含与所述茎序列部分或完全互补的核苷酸序列;和
第一衔接子区段,其包含与(i)供体多核苷酸、(ii)第二衔接子区段、或(iii)夹板区段互补的序列,并且所述衔接子序列包含一个或多个增强稳定性的修饰;并且
所述供体多核苷酸附接于所述第一衔接子区段、所述第二衔接子区段或所述夹板区段之一。
B2.实施方案B1的引导RNA:供体多核苷酸复合物,其中所述供体多核苷酸通过碱基配对杂交附接于所述第一衔接子区段。
B3.实施方案B1的引导RNA:供体多核苷酸复合物,其中所述供体多核苷酸通过核苷酸间键附接于所述第一衔接子区段。
B4.实施方案B1的引导RNA:供体多核苷酸复合物,其中所述第一衔接子区段通过碱基配对杂交附接于所述第二衔接子区段,并且所述第二衔接子区段通过核苷酸间键附接于所述供体多核苷酸。
B5.实施方案B4的引导RNA:供体多核苷酸复合物,其中所述第一衔接子区段是RNA序列,并且所述第二衔接子区段是DNA序列。
B6.实施方案B4的引导RNA:供体多核苷酸复合物,其中所述供体多核苷酸是单链DNA。
B7.实施方案B4的引导RNA:供体多核苷酸复合物,其中所述供体多核苷酸是双链DNA。
B8.实施方案B1的引导RNA:供体多核苷酸复合物,其中所述第一衔接子区段通过碱基配对杂交附接于所述夹板区段,并且所述夹板区段通过碱基配对杂交附接于所述供体多核苷酸。
C1.一种编辑靶多核苷酸的方法,所述方法包括:
使所述靶多核苷酸与CRISPR相关蛋白及前述任一个实施方案的合成的引导RNA或引导RNA:供体多核苷酸复合物接触,
切割所述靶多核苷酸,和
将供体多核苷酸接合至所述靶多核苷酸。
C2.实施方案C1的方法,其进一步包括使所述靶多核苷酸与外源CRISPR相关蛋白接触。
C3.实施方案C2的方法,其中所述CRISPR相关蛋白是Cas9。
C4.实施方案C1至C3中任一个的方法,所述方法进一步包括用所述供体多核苷酸通过同源定向修复来修复切割的靶多核苷酸。
C5.实施方案C4的方法,其中所述供体多核苷酸包含至少一个与位于切割位点任一侧的序列具有实质性序列同一性的序列。
C6.实施方案C4至C5中任一个的方法,其中所述接合步骤产生所述靶多核苷酸的一个或多个核苷酸的插入、缺失或取代。
C7.实施方案C6的方法,其中所述插入、缺失或取代导致从包含所述靶多核苷酸的基因表达的蛋白质中的一个或多个氨基酸变化。
C8.实施方案C1至C7中任一个的方法,其中所述靶多核苷酸在体外与所述CRISPR相关蛋白及所述合成的引导RNA或引导RNA:供体多核苷酸复合物接触。
C9.实施方案C1至C8中任一个的方法,其中与所述CRISPR相关蛋白及所述合成的引导RNA或引导RNA:供体多核苷酸复合物接触的靶多核苷酸位于体外或体内细胞的基因组内。
C10.实施方案C9的方法,其中在使所述靶多核苷酸与所述CRISPR相关蛋白及合成的引导RNA接触之前将细胞从多细胞来源分离。
C11.实施方案C10的方法,其中所述来源是植物、动物、多细胞原生生物或真菌。
C12.实施方案C9至C11中任一个的方法,其中在使所述靶多核苷酸与所述CRISPR相关蛋白及所述合成的引导RNA接触后,将所述细胞或由其衍生的细胞返回至所述来源。
D1.一种修饰细胞中的靶多核苷酸的方法,所述方法包括将向所述细胞中引入(a)实施方案A1至A25中任一个的合成的引导RNA;(b)一种或多种供体多核苷酸;和(c)CRISPR相关蛋白或在所述细胞中表达CRISPR相关蛋白的核酸。
D2.一种修饰细胞中的靶多核苷酸的方法,所述方法包括将向所述细胞中引入(a)实施方案B1至B8中任一个的引导RNA:供体多核苷酸复合物和(b)CRISPR相关蛋白或在所述细胞中表达CRISPR相关蛋白的核酸。
D3.实施方案D1或D2的方法,其中所述CRISPR相关蛋白是Cas9。
D4.RNA分子集合或文库,其包含两个或更多个实施方案A1至A25中任一个的合成的引导RNA。
D5.实施方案D4的RNA分子集合或文库,其中所述集合或文库包含位于合成的引导RNA上的多个正交衔接子区段,其中所述衔接子区段适合于栓系不同的供体多核苷酸。
D6.实施方案D4的RNA分子集合或文库,其中所述集合或文库包含多个合成的引导RNA,每个合成的引导RNA具有独特的crRNA和适合于栓系不同的供体多核苷酸的独特衔接子区段,从而能够通过细胞中的HR来编辑多个靶多核苷酸。
E1.一种试剂盒,其包含(a)实施方案A1至A25中任一个的合成的引导RNA,或(b)实施方案B1至B8中任一个的引导RNA:供体多核苷酸复合物;或(c)实施方案D1至D6中任一个的RNA分子集合或文库;或(d)其组合。
E2.实施方案E1或E2的试剂盒,其进一步包含一种或多种供体多核苷酸。
E3.实施方案E1或E2的试剂盒,进一步包含CRISPR相关蛋白或编码CRISPR相关蛋白的核酸。
E4.实施方案E3的试剂盒,其中所述CRISPR相关蛋白是Cas9。
E5.实施方案E1至E4中任一个的试剂盒,进一步包括关于在基因组编辑方法中使用以下各项的说明:(a)实施方案A1至A25中任一个的合成的引导RNA,或(b)实施方案B1至B8中任一个的引导RNA:供体多核苷酸复合物;或(c)实施方案D1至D6中任一个的RNA分子集合或文库。
F1.一种使用同源重组将外源DNA插入细胞基因组的方法,所述方法包括向所述细胞中引入(a)实施方案A1至A25中任一个的合成的引导RNA;或(b)实施方案B1至B8中任一个的引导RNA:供体多核苷酸复合物。
G1.一种用于靶多核苷酸的同源重组的CRISPR-Cas系统,所述系统包含:
Cas蛋白;和
合成的引导RNA,其包含:
crRNA区段,其包含(i)能够与靶序列杂交的引导序列,(ii)茎序列;
tracrRNA区段,其包含与所述茎序列部分或完全互补的核苷酸序列;
第一衔接子区段,其包含与(i)供体多核苷酸、(ii)第二衔接子区段、或(iii)夹板区段互补的序列,
其中所述衔接子序列包含一个或多个增强稳定性的修饰;并且
其中所述合成的引导RNA具有gRNA功能性。
G2.实施方案G1的系统,其中所述Cas蛋白无催化活性。
G3.实施方案G1的系统,其中所述引导序列的长度为17、18、19或20个核苷酸。
G4.实施方案G1的系统,其中所述引导序列的长度为14、15或16个核苷酸。
H1.一种用于靶多核苷酸的同源重组的CRISPR-Cas系统,所述系统包含:
具有催化活性的Cas蛋白;
第一引导RNA,其靶向靶多核苷酸的第一靶序列并与之杂交,其中所述第一引导RNA与所述具有催化活性的Cas蛋白形成复合物;
无催化活性的Ca9蛋白;
第二引导RNA,其靶向靶多核苷酸的第二靶序列并与之杂交,其中所述第二引导RNA与所述无催化活性的Cas蛋白形成复合物,并且其中所述第二引导RNA包含第一衔接子区段。
H2.实施方案H1的系统,其中所述第一靶序列和所述第二靶序列在双链靶多核苷酸的同一条链中或相反链中,并且所述第一靶序列与所述第二靶序列以-8至100个碱基对的偏移分开。
H3.实施方案H1或H2的系统,其中所述第一衔接子区段附接于(i)供体多核苷酸;(ii)第二衔接子区段;或(iii)夹板区段。
H4.实施方案H3的系统,其中所述第一衔接子区段通过碱基配对附接于第二衔接子区段,并且所述第二衔接子区段附接于供体多核苷酸。
H5.实施方案H4的系统,其中所述第二衔接子区段通过核苷酸间键附接于供体多核苷酸。
H6.实施方案H1或H2的系统,其中所述第一衔接子区段通过夹板区段附接于供体多核苷酸,并且所述夹板区段具有第一部分和第二部分,
其中所述第一部分通过互补碱基对杂交附接于所述第一衔接子,并且所述第二部分通过互补碱基对杂交附接于所述供体多核苷酸。
H7.实施方案H1至H6中任一个的系统,其中所述第一衔接子区段具有一个或多个增强稳定性的修饰。
H8.实施方案H1-H7中任一个的系统,其中所述具有催化活性的Cas蛋白是Cas9、Cas9突变体或Cas9变体。
H9.实施方案H1-H8中任一个的系统,其中所述无催化活性的Cas蛋白是dCas9。
I1.一种用于靶多核苷酸的同源重组的CRISPR-Cas系统,所述系统包含:
Cas蛋白;
第一引导RNA,其靶向靶多核苷酸的第一靶序列并与之杂交,其中所述第一引导RNA与所述Cas蛋白形成复合物;
第二引导RNA,其长度为14、15或16个核苷酸并且与所述靶多核苷酸的第二靶序列互补,其中所述第二引导RNA与所述Cas蛋白形成复合物,并且所述第二引导RNA包含第一衔接子区段,
其中所述Cas蛋白:第二引导RNA复合物识别并结合所述第二靶序列,但所述复合物无催化活性。
I2.实施方案I1的系统,其中所述第一靶序列和所述第二靶序列在双链靶多核苷酸的同一条链中或在相反链中,并且所述第一靶序列与所述第二靶序列以-8至100个碱基对的偏移分开。
I3.实施方案I1或I2的系统,其中所述第一衔接子区段附接于(i)供体多核苷酸;(ii)第二衔接子区段;或(iii)夹板区段。
I4.实施方案I3的系统,其中所述第一衔接子区段通过碱基配对附接于第二衔接子区段,并且所述第二衔接子区段附接于供体多核苷酸。
I5.实施方案I4的系统,其中所述第二衔接子区段通过核苷酸间键附接于供体多核苷酸。
I6.实施方案I1或I2的系统,其中所述第一衔接子区段通过夹板区段附接于供体多核苷酸,并且所述夹板区段具有第一部分和第二部分,
其中所述第一部分通过互补碱基对杂交附接于所述第一衔接子,并且所述第二部分通过互补碱基对杂交附接于所述供体多核苷酸。
I7.实施方案I1至I6中任一个的系统,其中所述第一衔接子区段具有一个或多个增强稳定性的修饰。
I8.实施方案H1-H7中任一个的系统,其中所述Cas蛋白是Cas9、Cas9突变体或Cas9变体。
前述示例性或优选实施方案的说明应被认为是展示而不是限制由权利要求书所限定的本发明。正如将理解的,可以利用以上陈述的特征的众多变化形式和组合,而不脱离如权利要求书中所陈述的本发明。这样的变化形式不应被视为脱离本发明的范围,并且所有这样的变化形式预期都被包含在以下权利要求的范围内。
序列表
<110> 安捷伦科技有限公司
<120> 用于通过同源重组的基于CRISPR/CAS的基因组编辑的化合物和方法
<130> 20150037-03 (027644.8154)
<150> US 62/212,456
<151> 2015-08-31
<160> 1
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> 热链球菌(Streptococcus pyogenes)
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365

Claims (19)

1.一种合成的引导RNA,其包含:
crRNA区段,其包含(i)能够与靶序列杂交的引导序列,(ii)茎序列;
tracrRNA区段,其包含与所述茎序列部分或完全互补的核苷酸序列;和
第一衔接子区段,其包含与(i)供体多核苷酸、(ii)第二衔接子区段、或(iii)夹板区段互补的序列,
其中所述衔接子序列包含一个或多个增强稳定性的修饰;并且
其中所述合成的引导RNA具有gRNA功能性。
2.权利要求1的合成的引导RNA,其中至少一个所述的修饰是增加所述衔接子序列对RNA酶H切割的抗性的修饰。
3.权利要求1或权利要求2的合成的引导RNA,其中衔接子区段中的修饰包含2'-O-甲基模块、2'-氟模块、2'-脱氧模块、硫代磷酸酯核苷酸间键、膦酰基乙酸核苷酸间键合、硫代膦酰基乙酸核苷酸间键或其组合。
4.权利要求1或权利要求2的合成的引导RNA,其中所述衔接子区段包含选自下组的一个或多个修饰:具有3'-硫代磷酸酯基团的2'-O-甲基核苷酸、具有3'-膦酰基羧酸基团的2'-O-甲基核苷酸、具有3'-膦酰基乙酸基团的2'-O-甲基核苷酸、具有3'-硫代膦酰基羧酸基团的2'-O-甲基核苷酸、具有3'-硫代膦酰基乙酸基团的2'-O-甲基核苷酸、具有3'-膦酰基乙酸基团的2'-脱氧核苷酸和具有3'-硫代膦酰基乙酸基团的2'-脱氧核苷酸。
5.前述权利要求中任一项的合成的引导RNA,其中所述衔接子区段连接至tracrRNA区段,并且所述增强稳定性的修饰之一位于所述衔接子区段的最后五个核苷酸内。
6.前述权利要求中任一项的合成的引导RNA,其中所述第一衔接子区段是RNA序列。
7.前述权利要求中任一项的合成的引导RNA,其中所述第二衔接子区段是DNA序列。
8.一种引导RNA:供体多核苷酸复合物,其包含(a)具有gRNA功能性的合成的引导RNA和(b)供体多核苷酸,
其中所述合成的引导RNA包含:
crRNA区段,其包含(i)能够与靶序列杂交的引导序列,(ii)茎序列;
tracrRNA区段,其包含与所述茎序列部分或完全互补的核苷酸序列;和
第一衔接子区段,其包含与(i)供体多核苷酸、(ii)第二衔接子区段、或(iii)夹板区段互补的序列,并且所述衔接子序列包含一个或多个增强稳定性的修饰;并且
所述供体多核苷酸附接于所述第一衔接子区段、所述第二衔接子区段或所述夹板区段之一。
9.权利要求8的引导RNA:供体多核苷酸复合物,其中所述供体多核苷酸通过碱基配对杂交附接于所述第一衔接子区段。
10.权利要求8的引导RNA:供体多核苷酸复合物,其中所述供体多核苷酸通过核苷酸间键附接于所述第一衔接子区段。
11.权利要求8的引导RNA:供体多核苷酸复合物,其中所述第一衔接子区段通过碱基配对杂交附接于所述夹板区段,并且所述夹板区段通过碱基配对杂交附接于所述供体多核苷酸。
12.一种编辑靶多核苷酸的方法,所述方法包括:
使所述靶多核苷酸与CRISPR相关蛋白以及前述权利要求中任一项的合成的引导RNA或引导RNA:供体多核苷酸复合物接触,
切割所述靶多核苷酸,和
将供体多核苷酸接合至所述靶多核苷酸。
13.权利要求12的方法,其进一步包括使所述靶多核苷酸与外源CRISPR相关蛋白接触。
14.权利要求13的方法,其中所述CRISPR相关蛋白是Cas9。
15.权利要求12至14中任一项的方法,所述方法进一步包括用所述供体多核苷酸通过同源定向修复来修复经切割的靶多核苷酸。
16.权利要求15的方法,其中所述供体多核苷酸包含至少一个与位于切割位点任一侧的序列具有实质性序列同一性的序列。
17.权利要求12至16中任一项的方法,其中所述靶多核苷酸在体外与所述CRISPR相关蛋白及所述合成的引导RNA或引导RNA:供体多核苷酸复合物接触。
18.一种修饰细胞中的靶多核苷酸的方法,包括将向所述细胞中引入(a)权利要求1至7中任一项的合成的引导RNA;(b)一种或多种供体多核苷酸;和(c)CRISPR相关蛋白或在所述细胞中表达CRISPR相关蛋白的核酸。
19.一种修饰细胞中的靶多核苷酸的方法,包括将向所述细胞中引入(a)权利要求8至11中任一项的引导RNA:供体多核苷酸复合物和(b)CRISPR相关蛋白或在所述细胞中表达CRISPR相关蛋白的核酸。
CN201680049767.0A 2015-08-31 2016-08-30 用于通过同源重组的基于crispr/cas的基因组编辑的化合物和方法 Pending CN107922949A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562212456P 2015-08-31 2015-08-31
US62/212,456 2015-08-31
PCT/US2016/049468 WO2017040511A1 (en) 2015-08-31 2016-08-30 Compounds and methods for crispr/cas-based genome editing by homologous recombination

Publications (1)

Publication Number Publication Date
CN107922949A true CN107922949A (zh) 2018-04-17

Family

ID=58103755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680049767.0A Pending CN107922949A (zh) 2015-08-31 2016-08-30 用于通过同源重组的基于crispr/cas的基因组编辑的化合物和方法

Country Status (5)

Country Link
US (1) US10526590B2 (zh)
EP (1) EP3344771A4 (zh)
KR (1) KR20180037297A (zh)
CN (1) CN107922949A (zh)
WO (1) WO2017040511A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595914A (zh) * 2018-05-16 2018-09-28 湖南农业大学 一种烟草线粒体rna编辑位点高精度预测方法
CN114981445A (zh) * 2019-10-24 2022-08-30 合成Dna技术公司 修饰的双链供体模板

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6261500B2 (ja) 2011-07-22 2018-01-17 プレジデント アンド フェローズ オブ ハーバード カレッジ ヌクレアーゼ切断特異性の評価および改善
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9840699B2 (en) 2013-12-12 2017-12-12 President And Fellows Of Harvard College Methods for nucleic acid editing
US11339437B2 (en) 2014-03-10 2022-05-24 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
US11141493B2 (en) 2014-03-10 2021-10-12 Editas Medicine, Inc. Compositions and methods for treating CEP290-associated disease
EP3553176A1 (en) 2014-03-10 2019-10-16 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10)
US11242525B2 (en) 2014-03-26 2022-02-08 Editas Medicine, Inc. CRISPR/CAS-related methods and compositions for treating sickle cell disease
US9944933B2 (en) * 2014-07-17 2018-04-17 Georgia Tech Research Corporation Aptamer-guided gene targeting
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
CA2963820A1 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
AU2016253150B2 (en) 2015-04-24 2022-04-21 Editas Medicine, Inc. Evaluation of Cas9 molecule/guide RNA molecule complexes
WO2017053879A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
EP3433364A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency
EP3433363A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
EP3443086B1 (en) 2016-04-13 2021-11-24 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
WO2017180711A1 (en) * 2016-04-13 2017-10-19 Editas Medicine, Inc. Grna fusion molecules, gene editing systems, and methods of use thereof
IL289989B (en) * 2016-06-02 2022-09-01 Sigma Aldrich Co Llc Use of programmable DNA-binding proteins to enhance targeted genome modification
US11566263B2 (en) 2016-08-02 2023-01-31 Editas Medicine, Inc. Compositions and methods for treating CEP290 associated disease
KR102547316B1 (ko) 2016-08-03 2023-06-23 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 아데노신 핵염기 편집제 및 그의 용도
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
KR20190089175A (ko) * 2016-11-18 2019-07-30 진에딧 인코포레이티드 표적 핵산 변형을 위한 조성물 및 방법
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
AU2018212624A1 (en) * 2017-01-30 2019-08-22 KWS SAAT SE & Co. KGaA Repair template linkage to endonucleases for genome engineering
US20180258485A1 (en) * 2017-03-07 2018-09-13 The Regents Of The University Of Colorado, A Body Corporate Boranephosphonate Detection Probes and Methods For Producing and Using the Same
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
EP3596217A1 (en) 2017-03-14 2020-01-22 Editas Medicine, Inc. Systems and methods for the treatment of hemoglobinopathies
US11268082B2 (en) 2017-03-23 2022-03-08 President And Fellows Of Harvard College Nucleobase editors comprising nucleic acid programmable DNA binding proteins
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
US20180333505A1 (en) * 2017-05-22 2018-11-22 Matthew J. Lin Selective insertion of suicide genes into cancer cells
CN108977442B (zh) * 2017-06-05 2023-01-06 广州市锐博生物科技有限公司 用于dna编辑的系统及其应用
WO2018231999A1 (en) * 2017-06-13 2018-12-20 Regents Of The University Of Minnesota Materials and methods for increasing gene editing frequency
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
WO2019055878A2 (en) * 2017-09-15 2019-03-21 The Board Of Trustees Of The Leland Stanford Junior University MULTIPLEX PRODUCTION AND BAR CODIFICATION OF GENETICALLY MODIFIED CELLS
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
US20200370070A1 (en) * 2017-11-17 2020-11-26 The Johns Hopkins University Compositions and methods for efficient genome editing
US11268092B2 (en) 2018-01-12 2022-03-08 GenEdit, Inc. Structure-engineered guide RNA
US11339385B2 (en) 2018-03-25 2022-05-24 GeneTether, Inc. Modified nucleic acid editing systems for tethering donor DNA
WO2019204226A1 (en) * 2018-04-16 2019-10-24 University Of Massachusetts Compositions and methods for improved gene editing
JP2021523745A (ja) 2018-05-16 2021-09-09 シンテゴ コーポレイション ガイドrna設計および使用のための方法およびシステム
EP3578658A1 (en) * 2018-06-08 2019-12-11 Johann Wolfgang Goethe-Universität Frankfurt Method for generating a gene editing vector with fixed guide rna pairs
WO2020081438A1 (en) 2018-10-16 2020-04-23 Blueallele, Llc Methods for targeted insertion of dna in genes
CA3130488A1 (en) 2019-03-19 2020-09-24 David R. Liu Methods and compositions for editing nucleotide sequences
US20220348912A1 (en) 2019-06-20 2022-11-03 University Of Massachusetts Compositions and methods for improved gene editing
CN112481309B (zh) * 2019-09-12 2023-10-10 石家庄埃佤基因科技有限公司 Ago蛋白的用途及组合物和基因编辑方法
US20230008217A1 (en) * 2019-12-17 2023-01-12 Agilent Technologies, Inc. Ligation-based gene editing using crispr nickase
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
JP2024506375A (ja) * 2021-02-15 2024-02-13 ノース・カロライナ・ステイト・ユニバーシティ 部位特異的ゲノム修飾技術

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5032401A (en) 1989-06-15 1991-07-16 Alpha Beta Technology Glucan drug delivery system and adjuvant
EP1152058A1 (en) 2000-05-03 2001-11-07 Institut Curie Methods and compositions for effecting homologous recombination
US7371580B2 (en) 2001-08-24 2008-05-13 Agilent Technologies, Inc. Use of unstructured nucleic acids in assaying nucleic acid molecules
US7740861B2 (en) 2004-06-16 2010-06-22 University Of Massachusetts Drug delivery product and methods
EP2476689B1 (en) 2007-05-10 2015-10-21 Agilent Technologies, Inc. Thiocarbon-protecting groups for RNA synthesis
US20100076183A1 (en) 2008-09-22 2010-03-25 Dellinger Douglas J Protected monomer and method of final deprotection for rna synthesis
LT2852602T (lt) 2012-05-21 2020-10-26 Agilent Technologies, Inc. Oligonukleotidų konjugavimo būdas
PE20190844A1 (es) 2012-05-25 2019-06-17 Emmanuelle Charpentier Modulacion de transcripcion con arn de direccion a adn generico
US9102936B2 (en) * 2012-06-11 2015-08-11 Agilent Technologies, Inc. Method of adaptor-dimer subtraction using a CRISPR CAS6 protein
CN113528577A (zh) * 2012-12-12 2021-10-22 布罗德研究所有限公司 用于序列操纵的系统、方法和优化的指导组合物的工程化
KR20150095861A (ko) 2012-12-17 2015-08-21 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 Rna-가이드된 인간 게놈 조작
EP3741868A1 (en) 2013-03-15 2020-11-25 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
US9234213B2 (en) 2013-03-15 2016-01-12 System Biosciences, Llc Compositions and methods directed to CRISPR/Cas genomic engineering systems
US20140273230A1 (en) 2013-03-15 2014-09-18 Sigma-Aldrich Co., Llc Crispr-based genome modification and regulation
CA2913869C (en) * 2013-05-29 2023-01-24 Cellectis New compact scaffold of cas9 in the type ii crispr system
US11306328B2 (en) 2013-07-26 2022-04-19 President And Fellows Of Harvard College Genome engineering
JP6793547B2 (ja) 2013-12-12 2020-12-02 ザ・ブロード・インスティテュート・インコーポレイテッド 最適化機能CRISPR−Cas系による配列操作のための系、方法および組成物
US9580727B1 (en) * 2015-08-07 2017-02-28 Caribou Biosciences, Inc. Compositions and methods of engineered CRISPR-Cas9 systems using split-nexus Cas9-associated polynucleotides

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
AYAL HENDEL ET AL.: "Chemically modified guide RNAs enhance CRISPR-Cas genome editing in human primary cells", 《NATAURE BIOTECHNOLOGY》 *
DONG YU ET AL.: "Hybrid Oligonucleotides: Synthesis, Biophysical Properties, Stability Studies, and Biological Activity", 《BIOORGANIC & MEDICINAL CHEMISTRY》 *
PRASHANT MALI ET AL.: "Cas9 as a versatile tool for engineering biology", 《NATAURE METHODS》 *
YI-TAO YU ET AL.: "A new method for detecting sites of 2"-O-methylation in RNA molecules", 《RNA》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595914A (zh) * 2018-05-16 2018-09-28 湖南农业大学 一种烟草线粒体rna编辑位点高精度预测方法
CN108595914B (zh) * 2018-05-16 2021-06-25 湖南农业大学 一种烟草线粒体rna编辑位点高精度预测方法
CN114981445A (zh) * 2019-10-24 2022-08-30 合成Dna技术公司 修饰的双链供体模板

Also Published As

Publication number Publication date
US10526590B2 (en) 2020-01-07
EP3344771A1 (en) 2018-07-11
EP3344771A4 (en) 2019-03-20
WO2017040511A1 (en) 2017-03-09
US20170058298A1 (en) 2017-03-02
KR20180037297A (ko) 2018-04-11

Similar Documents

Publication Publication Date Title
CN107922949A (zh) 用于通过同源重组的基于crispr/cas的基因组编辑的化合物和方法
JP7431891B2 (ja) 化学的に修飾されたガイドrnaを使用する高特異性ゲノム編集
US20220033858A1 (en) Crispr oligoncleotides and gene editing
US20230026726A1 (en) Crispr/cas-related methods and compositions for treating sickle cell disease
JP7068821B2 (ja) 化学修飾を有するガイドrna
EP3152312B1 (en) Methods and compositions for modifying a targeted locus
EP3004339B1 (en) New compact scaffold of cas9 in the type ii crispr system
JP2022526908A (ja) 編集ヌクレオチド配列を編集するための方法および組成物
EP4269577A2 (en) Nucleobase editors and uses thereof
CN114375334A (zh) 工程化CasX系统
JP7138712B2 (ja) ゲノム編集のためのシステム及び方法
US20190390229A1 (en) Gene editing reagents with reduced toxicity
KR20160089530A (ko) Hbv 및 바이러스 질병 및 질환을 위한 crispr­cas 시스템 및 조성물의 전달,용도 및 치료적 적용
CN111902536A (zh) 用于真核基因组修饰的改造的cas9系统
Wong et al. Gene targeting and genome editing
WO2020168088A1 (en) Compositions and methods for treating glycogen storage disease type 1a
WO2014102688A1 (en) New design matrix for improvement of homology-directed gene targeting
CN114144519A (zh) 单碱基置换蛋白以及包含其的组合物
EP4230737A1 (en) Novel enhanced base editing or revising fusion protein and use thereof
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
KR102151064B1 (ko) 매칭된 5&#39; 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
WO2023137233A2 (en) Compositions and methods for editing genomes
US20230407278A1 (en) Compositions and methods for cas9 molecules with improved gene editing properties
JP2023542962A (ja) 新規の改良された塩基編集または編集用融合タンパク質およびその用途
CN117925730A (zh) 提高基因组序列修饰技术中的突变导入效率的方法、及其使用的分子复合体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination