CN115052986A - 包含核酸酶的组合物及其用途 - Google Patents

包含核酸酶的组合物及其用途 Download PDF

Info

Publication number
CN115052986A
CN115052986A CN202080084107.2A CN202080084107A CN115052986A CN 115052986 A CN115052986 A CN 115052986A CN 202080084107 A CN202080084107 A CN 202080084107A CN 115052986 A CN115052986 A CN 115052986A
Authority
CN
China
Prior art keywords
nuclease
sequence
cell
composition
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080084107.2A
Other languages
English (en)
Inventor
D·A·斯科特
W·X·严
D·R·程
T·M·迪托马索
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Abbott Biotechnology
Original Assignee
Abbott Biotechnology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abbott Biotechnology filed Critical Abbott Biotechnology
Publication of CN115052986A publication Critical patent/CN115052986A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/40Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
    • C07K2319/41Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a Myc-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/40Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
    • C07K2319/43Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a FLAG-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及编码核酸酶的基因、表征这些核酸酶的方法、包含这些核酸酶的细胞以及使用这些核酸酶的方法。

Description

包含核酸酶的组合物及其用途
相关申请的交叉引用
本申请要求于2019年12月4日提交的美国临时申请号62/943680的权益。上述申请的内容通过引用以其全文并入本文。
序列表
本申请包含序列表,该序列表已经以ASCII格式以电子方式提交,并且特此通过引用以其全文并入。所述ASCII副本创建于2020年12月2日,名为A2186-7030WO_SL.txt,并且大小为20,769字节。
背景技术
成簇规律间隔短回文重复序列(CRISPR)和CRISPR相关(Cas)基因(统称为CRISPR-Cas或CRISPR/Cas系统)是古细菌和细菌中针对外来遗传元件而防御特定物种的适应性免疫系统。
发明内容
针对于上述背景,本发明提供了优于现有技术的某些优点和进步。
尽管本文公开的本发明不限于特定的优点或功能,但本发明提供了一种组合物,该组合物包含(a)核酸酶或编码该核酸酶的核酸,其中该核酸酶包含与SEQ ID NO:1具有至少80%同一性的氨基酸序列;和(b)RNA指导物或编码该RNA指导物的核酸,其中该RNA指导物包含正向重复序列和间隔序列,其中该核酸酶结合该RNA指导物,并且其中该间隔序列结合靶核酸。
在组合物的一方面,核酸酶包含SEQ ID NO:1所示的氨基酸序列。
在组合物的另一方面,核酸酶包含RuvC结构域或拆分型RuvC结构域。
在组合物的另一方面,核酸酶包含催化残基(例如,天冬氨酸或谷氨酸)。
在组合物的另一方面,组合物不包含tracrRNA。
在组合物的另一方面,正向重复序列包含与SEQ ID NO:3或SEQ ID NO:4具有至少95%序列同一性的核苷酸序列。
在组合物的另一方面,正向重复序列包含SEQ ID NO:3或SEQ ID NO:4所示的核苷酸序列。
在组合物的另一方面,间隔序列包含15至24个核苷酸的长度。
在组合物的另一方面,靶核酸包含与间隔序列中的核苷酸序列互补的序列。
在组合物的另一方面,核酸酶识别原型间隔子相邻基序(PAM)序列,该PAM序列包含如5’-RTR-3’、5’-RTG-3’、5’-NTG-3’或5’-DHD-3’所示的核苷酸序列,其中“R”是A或G,“D”是A或G或T,并且“N”是任何核碱基。
在组合物的另一方面,PAM序列包含如5’-ATG-3’、5’-GTG-3’、5’-ATA-3’、或5’-GTA-3’所示的核苷酸序列。
在组合物的另一方面,核酸酶切割靶核酸。
在组合物的另一方面,靶核酸是单链DNA或双链DNA。
在组合物的另一方面,组合物包含比参考组合物高至少10%的酶活性,例如比参考组合物的核酸酶活性高至少10%的核酸酶活性。
在组合物的另一方面,核酸酶还包含肽标签、荧光蛋白、碱基编辑结构域、DNA甲基化结构域、组蛋白残基修饰结构域、定位因子、转录修饰因子、光门控因子、化学诱导型因子或染色质可视化因子。
在组合物的另一方面,对编码核酸酶的核酸进行密码子优化以在细胞中表达。
在组合物的另一方面,编码核酸酶的核酸与启动子可操作地连接。
在组合物的另一方面,编码核酸酶的核酸在载体中。
在组合物的另一方面,载体包括逆转录病毒载体、慢病毒载体、噬菌体载体、腺病毒载体、腺相关载体或单纯疱疹载体。
在组合物的另一方面,组合物存在于包含纳米颗粒、脂质体、外来体、微泡或基因枪的递送组合物中。
本发明还提供了包含本文所述组合物的细胞。在一方面,该细胞是真核细胞,例如哺乳动物细胞,例如人细胞。在另一方面,该细胞是原核细胞。
本发明进一步提供了将本文所述的组合物结合至细胞中的靶核酸的方法,该方法包括(a)提供该组合物;以及(b)将该组合物递送至细胞,其中该细胞包含靶核酸,其中核酸酶结合RNA指导物,并且其中间隔序列结合靶核酸。
本发明进一步提供了将插入或缺失引入细胞中的靶核酸的方法,该方法包括(a)提供本文公开的组合物;以及(b)将该组合物递送至该细胞,其中该组合物对该靶核酸的识别导致对该靶核酸的修饰。
在本文公开的一种或多种方法的一个方面,通过转染将组合物递送至细胞。
在一种或多种方法的另一方面,该细胞是真核细胞。在一种或多种方法的另一方面,该细胞是原核细胞。在本文公开的一种或多种方法的另一方面,该细胞是人细胞。
定义
本发明将针对特定实施例并参考某些附图进行描述,但是本发明不限于此,而是仅由权利要求来限定。除非另有说明,否则下文陈述的术语通常应以其常见意义来理解。
如本文所用,术语“催化残基”是指激活催化的氨基酸。催化残基是参与(例如,直接参与)催化的氨基酸。
如本文所用,术语“结构域”和“蛋白质结构域”是指蛋白质的不同功能和/或结构单元。在一些实施例中,结构域可包含保守氨基酸序列。
如本文所用,术语“酶活性”是指酶的催化能力。例如,酶活性可以包括酶将核酸降解成较短的寡核苷酸或单核苷酸的能力。
如本文所用,术语“核酸酶”是指能够切割磷酸二酯键的酶。核酸酶水解核酸骨架中的磷酸二酯键。如本文所用,术语“核酸内切酶”是指能够切割核苷酸之间的磷酸二酯键的酶。
如本文所用,术语“核酸酶变体”和“变体核酸酶”是指具有酶活性并且与其亲本序列相比在一个或多个(或一个或几个)位置处包含改变(例如取代、插入、缺失和/或融合)的核酸酶。
如本文所用,术语“原型间隔子相邻基序”和“PAM序列”是指位于靶序列附近或与靶序列相邻的序列。如本文所用,PAM序列是本文所述核酸酶切割所需的。
如本文所用,术语“亲本”、“核酸酶亲本”和“亲本序列”是指对其进行改变以产生本发明的变体核酸酶的核酸酶。在一些实施例中,亲本是在一个或多个指定位置处具有与变体相同的氨基酸序列的核酸酶。亲本可以是天然存在的(野生型)多肽。在一个特定实施例中,亲本是与SEQ ID NO:1的多肽具有至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少70%、至少72%、至少73%、至少74%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性的核酸酶。
如本文所用,术语“参考组合物”、“参考序列”和“参考”是指对照,例如阴性对照或亲本(例如,亲本序列、亲本蛋白质或野生型蛋白质)。
如本文所用,术语“RNA指导物”或“RNA指导序列”是指识别(例如,结合)靶核酸的分子。RNA指导物可被设计成与特定核酸序列互补。RNA指导物包含间隔序列和正向重复(DR)序列。术语CRISPR RNA(crRNA)、pre-crRNA、成熟crRNA和CRISPR阵列在本文中也用于指RNA指导物。
如本文所用,术语“RuvC结构域”是指具有核酸酶(例如,核酸内切酶)活性的氨基酸的保守结构域或基序。如本文所用,具有拆分型RuvC结构域的蛋白质是指在序列内顺序不同的位点处具有两个或更多个RuvC基序的蛋白质,这些RuvC基序以三级结构相互作用以形成RuvC结构域。
如本文所用,术语“基本上相同”是指与参考序列具有一定程度同一性的序列、多核苷酸或多肽。
如本文所用,术语“靶核酸”和“靶序列”是指被靶向部分特异性结合的核酸。在一些实施例中,RNA指导物的间隔序列结合靶核酸。
如本文所用,术语“反式激活crRNA”和“tracrRNA”是指RNA指导物与靶核酸结合所涉及或所需的RNA分子。
附图说明
图1是显示规范Cas12h的RuvC结构域的示意图,其中指出三个保守序列基序(I、II和III)中的催化残基。
图2A是实例2中描述的阴性选择筛选测定的组分的示意图。CRISPR阵列文库被设计为包括从pACYC184质粒或大肠杆菌必需基因的两条链均匀取样的非代表性间隔子,侧接有两个直接重复序列并由J23119表达。
图2B是实例2中描述的阴性选择筛选工作流程的示意图。将CRISPR阵列文库克隆到效应子质粒(包含本文所述的核酸酶)中。将效应子质粒转化到大肠杆菌中,随后进行生长以便阴性选择对来自pACYC184或大肠杆菌必需基因的转录物赋予干扰的CRISPR阵列。使用效应子质粒的靶向测序来鉴定耗减的CRISPR阵列。可以进一步进行小RNA测序以鉴定成熟的crRNA和潜在的tracrRNA需求。
图3A是通过在pACYC184质粒上的位置示出了Cas12h1的耗减和非耗减CRISPR阵列的密度的图示。顶链和底链上的靶标分别显示并与注释基因的取向有关。条带的幅度表示耗减的程度,其中较轻的条带接近命中阈值3。
图3B是通过在大肠杆菌菌株E.Cloni的DNA上的位置示出了Cas12h1的耗减和非耗减CRISPR阵列的密度的图示。顶链和底链上的靶标分别显示并与注释基因的取向有关。条带的幅度表示耗减的程度,其中较轻的条带接近命中阈值3。
图4示出了侧接E.Cloni中耗减的靶标的序列,作为Cas12h1的PAM序列的预测。
图5示出了Cas12h1指导物的正向重复序列(SEQ ID NO:20)的预测二级结构。
图6是示出了将Cas12h1 RuvC I保守催化残基天冬氨酸(在位置465处)突变为丙氨酸的效果的散点图。每个点代表Cas12h1或Cas12h1 D465A的单独CRISPR阵列,并且从输出文库与输入文库的比较确定任一CRISPR阵列的耗减倍数。更高的值表示更强的耗减(例如,在输出文库中缺乏存在,例如,更少的存活菌落)。
图7A示出了TBE-尿素变性凝胶,其显示Cas12h1切割dsDNA靶标(靶标A和靶标B)。
图7B示出了TBE-尿素变性凝胶,其显示Cas12h1切割dsDNA靶标(靶标D)。
图7C示出了TBE-尿素变性凝胶,其显示Cas12h1切割dsDNA靶标(靶标F)。
图8示出了TBE-尿素变性凝胶,其显示以下反应产物:靶标ssDNA(靶标G)和Cas12h1,靶标ssDNA(靶标G)和与顶链(活性取向)pre-crRNA复合的Cas12h1,以及非靶标ssDNA和与顶链(活性取向)pre-crRNA复合的Cas12h1。
图9A是示出了用于dsDNA靶标切割实验的标记dsDNA底物的产生的示意图。
图9B是示出了用于ssDNA靶标切割实验的标记ssDNA底物的示意图。
具体实施方式
本披露涉及新型核酸酶及其使用方法。在一些方面,本文描述了包含具有一种或多种特征的核酸酶的组合物。在一些方面,描述了产生核酸酶的方法。在一些方面,描述了递送包含核酸酶的组合物的方法。
组合物
在一些方面,本文所述的发明包括含有核酸酶的组合物。在一些实施例中,本发明的组合物包含核酸酶,并且该组合物具有核酸酶或核酸内切酶活性。在一些方面,本文所述的发明包括含有核酸酶和靶向部分的组合物。在一些实施例中,本发明的组合物包括核酸酶和RNA指导序列,并且该RNA指导序列将核酸酶或核酸内切酶活性导向位点特异性靶标。在一些实施例中,核酸酶是重组核酸酶。在从水生-非海生盐水和碱性-超盐水湖沉积物环境中收集的未培养的宏基因组序列中发现了本文所述的核酸酶。
在一些实施例中,本文所述的组合物包含RNA指导的核酸酶(例如,核酸酶包含多个组分)。在一些实施例中,核酸酶包含酶活性(例如,包含RuvC结构域或拆分型RuvC结构域的蛋白质)。在一些实施例中,组合物包含靶向部分(例如,RNA指导物)。在一些实施例中,组合物包含含有酶部分和靶向部分的核糖核蛋白(RNP)。
核酸酶
在一些实施例中,本发明的组合物包含本文所述的核酸酶。
如果编码核酸酶的核酸包含与参考核酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的序列,则编码本文所述核酸酶的核酸序列可与参考核酸序列基本上相同。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数手动确定两个此类核酸之间的同一性百分比。两个核酸序列基本上相同的一个指示是两个核酸分子在严格条件下(例如,在中等至高度严格的范围内)彼此杂交。
在一些实施例中,核酸酶由与参考核酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的核酸序列编码。
如果核酸酶包含与参考多肽的氨基酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的氨基酸序列,则本文所述的核酸酶可与参考多肽基本上相同。可以通过检查两个最佳比对的多肽序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数手动确定两个此类多肽之间的同一性百分比。两个多肽基本上相同的一个指示是第一多肽与第二多肽具有免疫交叉反应性。典型地,因保守氨基酸取代而不同的多肽具有免疫交叉反应性。因此,多肽与第二多肽基本上相同,例如,其中两个肽的区别仅在于保守氨基酸取代或一个或多个保守氨基酸取代。
在一些实施例中,本发明的核酸酶包含与SEQ ID NO:1具有50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。在一些实施例中,本发明的核酸酶包含与SEQ ID NO:1具有大于50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多肽序列。
在一些实施例中,本发明的核酸酶是与一种或多种参考多肽具有特定程度的氨基酸序列同一性的核酸酶,例如与SEQ ID NO:1的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%序列同一性。同源性或同一性可以通过氨基酸序列比对确定,例如使用如本文所述的程序如BLAST、ALIGN或CLUSTAL。
在一些实施例中,核酸酶包含具有与参考氨基酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的氨基酸序列的蛋白质。
还提供了本发明的核酸酶,该核酸酶具有酶活性,例如核酸酶或核酸内切酶活性,并且当使用任何前述比对方法进行比对时,该核酸酶包含与SEQ ID NO:1中的任一个的氨基酸序列相差不超过50个、不超过40个、不超过35个、不超过30个、不超过25个、不超过20个、不超过19个、不超过18个、不超过17个、不超过16个、不超过15个、不超过14个、不超过13个、不超过12个、不超过11个、不超过10个、不超过9个、不超过8个、不超过7个、不超过6个、不超过5个、不超过4个、不超过3个、不超过2个或不超过1个氨基酸残基的氨基酸序列。
在一些实施例中,核酸酶包含RuvC结构域。在一些实施例中,核酸酶包含拆分型RuvC结构域或两个或更多个部分RuvC结构域。例如,核酸酶包含RuvC基序,这些RuvC基序与核酸酶的一级氨基酸序列不相邻,但一旦蛋白质折叠就形成RuvC结构域。在一些实施例中,RuvC基序的催化残基是谷氨酸残基和/或天冬氨酸残基,包括根据SEQ ID NO:1编号的D465。
在一些实施例中,本发明包括包含RuvC结构域的分离的、重组的、基本上纯的或非天然存在的核酸酶,其中该核酸酶具有酶活性,例如核酸酶或核酸内切酶活性,其中该核酸酶包含与SEQ ID NO:1具有至少约60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一些实施例中,本发明包括包含突变RuvC结构域的核酸酶,其中该核酸酶不具有酶活性,例如核酸酶或核酸内切酶活性,其中该核酸酶包含与SEQ ID NO:2具有至少约60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
生物化学特征
在一些实施例中,使用一种或多种测定分析本文所述的核酸酶的生物化学。如实例2所述,可以使用合并筛选。在该测定中,将本发明的核酸酶克隆并与CRISPR阵列文库一起转化到大肠杆菌中;该CRISPR阵列文库包含靶向大肠杆菌必需基因的间隔子或共转化到大肠杆菌中的第二质粒。来自合并筛选的活性CRISPR阵列的分析可用于确定本文所述核酸酶的活性和PAM序列偏好。在其他实施例中,如实例7和8所述,使用与RNA指导物(例如,pre-crRNA)和靶DNA分子一起孵育的经纯化的核酸酶体外分析核酸酶的生物化学。在凝胶上分析切割产物。
本文描述了涉及核酸酶的组合物和方法。组合物和方法部分基于本发明的克隆和表达的核酸酶具有核酸酶或核酸内切酶活性的观察。
在一些实施例中,如本文所述的核酸酶和RNA指导物形成复合物(例如,RNP)。在一些实施例中,复合物包括其他组分。在一些实施例中,复合物在结合与RNA指导物中的间隔序列互补的核酸底物(例如,靶核酸)后被激活。在一些实施例中,靶核酸是双链DNA(dsDNA)。在一些实施例中,靶核酸是单链DNA(ssDNA)。在一些实施例中,靶核酸是单链RNA(ssRNA)。在一些实施例中,靶核酸是双链RNA(dsRNA)。在一些实施例中,序列特异性需要RNA指导物中的间隔序列与靶底物完全匹配。在其他实施例中,序列特异性需要RNA指导物中的间隔序列与靶底物部分(连续或非连续)匹配。
在一些实施例中,复合物在与靶底物结合后被激活。在一些实施例中,激活的复合物表现出“多次转换”活性,从而在作用于(例如切割)靶核酸后,激活的复合物保持激活状态。在一些实施例中,激活的复合物表现出“单转换”活性,从而在作用于靶核酸后,复合物恢复到非活性状态。
在一些实施例中,本文所述的核酸酶在由RNA指导物和靶核酸之间的互补区限定的序列处结合靶核酸。在一些实施例中,本文所述的核酸酶的PAM序列直接位于靶核酸的靶序列的上游(例如,直接位于靶序列的5’)。在一些实施例中,本文所述的核酸酶的PAM序列直接位于靶核酸的非互补链(例如,非靶链)的5’。如本文所用,“互补链”与RNA指导物杂交。如本文所用,“非互补链”不与RNA直接杂交。
在一些实施例中,本文所述的核酸酶的PAM序列是5’-RTR-3’、5’-RTG-3’、5’-NTG-3’、或5’-DHD-3’,其中“R”是A或G,“D”是A或G或T,并且“N”是任何核碱基。在一些实施例中,PAM序列包含如5’-ATG-3’、5’-GTG-3’、5’-ATA-3’、或5’-GTA-3’所示的核苷酸序列。
在一些实施例中,本文所述的核酸酶切割ssDNA。在一些实施例中,本文所述的核酸酶切割dsDNA。在一些实施例中,本文所述的核酸酶是切口酶(例如,核酸酶切割双链靶核酸的一条链)。
在一些实施例中,本发明的核酸酶在宽范围的pH条件下具有酶活性,例如核酸酶或核酸内切酶活性。在一些实施例中,核酸酶在约3.0至约12.0的pH下具有酶活性,例如核酸酶或核酸内切酶活性。在一些实施例中,核酸酶在约4.0至约10.5的pH下具有酶活性。在一些实施例中,核酸酶在约5.5至约8.5的pH下具有酶活性。在一些实施例中,核酸酶在约6.0至约8.0的pH下具有酶活性。在一些实施例中,核酸酶在约7.0的pH下具有酶活性。
在一些实施例中,本发明的核酸酶在约10℃至约100℃的温度范围内具有酶活性,例如核酸酶或核酸内切酶活性。在一些实施例中,本发明的核酸酶在约20℃至约90℃的温度范围内具有酶活性。在一些实施例中,本发明的核酸酶在约20℃至约25℃的温度下或在约37℃的温度下具有酶活性。
变体
在一些实施例中,本发明包括本文所述的核酸酶的变体。在一些实施例中,本文所述的核酸酶可在一个或多个氨基酸残基处突变以修饰一种或多种功能活性。例如,在一些实施例中,核酸酶在一个或多个氨基酸残基处突变以修饰其核酸酶活性(例如,切割活性)。例如,在一些实施例中,核酸酶可包含一个或多个提高核酸酶切割靶核酸的能力的突变。在一些实施例中,核酸酶在一个或多个氨基酸残基处突变以修饰其与RNA指导物功能性缔合的能力。在一些实施例中,核酸酶在一个或多个氨基酸残基处突变以修饰其与靶核酸功能性缔合的能力。在一些实施例中,核酸酶还具有解旋酶活性并且在一个或多个氨基酸残基处突变以修饰其解旋酶活性。
在一些实施例中,变体核酸酶具有保守或非保守氨基酸取代、缺失或添加。在一些实施例中,变体核酸酶具有沉默取代、缺失或添加,或保守取代,它们都不改变本发明的多肽活性。保守取代的典型实例包括其中一个氨基酸交换为另一个氨基酸的取代,例如脂族氨基酸Ala、Val、Leu和Ile之间的交换、羟基残基Ser和Thr之间的交换、酸性残基Asp和Glu之间的交换、酰胺残基Asn和Gln之间的取代、碱性残基Lys和Arg之间的交换、以及芳族残基Phe和Tyr之间的取代。在一些实施例中,本文公开的核酸酶的一个或多个残基突变为Arg残基。在一些实施例中,本文公开的核酸酶的一个或多个残基突变为Gly残基。
本领域已知多种适于产生编码本发明变体核酸酶的修饰多核苷酸的方法,包括但不限于例如位点饱和诱变、扫描诱变、插入诱变、缺失诱变、随机诱变、定点诱变和定向进化、以及各种其他重组方法。用于制备修饰的多核苷酸和蛋白质(例如核酸酶)的方法包括DNA改组方法、基于基因的非同源重组的方法,例如ITCHY(参见Ostermeier等人,7:2139-44[1999])、SCRACHY(参见Lutz等人98:11248-53[2001])、SHIPREC(参见Sieber等人,19:456-60[2001])和NRR(参见Bittker等人,20:1024-9[2001];Bittker等人,101:7011-6[2004])、和依赖于使用寡核苷酸插入随机和靶向突变、缺失和/或插入的方法(参见Ness等人,20:1251-5[2002];Coco等人,20:1246-50[2002];Zha等人,4:34-9[2003];Glaser等人,149:3903-13[1992])。
在一些实施例中,核酸酶包含在核酸酶中的一个或多个(例如,几个)氨基酸处的改变,其中至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、162、164、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、193、194、195、196、197、198、199、200个或更多。
如本文所用,“生物活性部分”是保持核酸酶功能(例如,完全地、部分地、最低限度地)的部分(例如,“最小”或“核心”结构域)。在一些实施例中,核酸酶融合蛋白可用于本文所述的方法。因此,在一些实施例中,本文描述了编码融合核酸酶的核酸。在一些实施例中,核酸酶融合蛋白的一个或多个组分的全部或部分被编码在单个核酸序列中。
尽管本文所述的改变可以是一个或多个氨基酸改变,但核酸酶的改变也可以是实质性的,例如作为氨基和/或羧基末端延伸的多肽融合。例如,核酸酶可包含另外的肽,例如一种或多种肽。另外的肽的实例可以包括用于标记的表位肽,例如多组氨酸标签(His-标签)、Myc和FLAG。在一些实施例中,本文所述的核酸酶可与可检测部分如荧光蛋白(例如绿色荧光蛋白(GFP)或黄色荧光蛋白(YFP))融合。
本文所述的核酸酶可经修饰以具有减弱的核酸酶活性,例如与参考核酸酶相比,核酸酶失活至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少97%或100%。核酸酶活性可以通过本领域已知的几种方法减弱,例如将突变引入RuvC结构域(例如RuvC结构域的一个或多个催化残基)。失活核酸酶(例如RuvC突变体)的非限制性实例在SEQ ID NO:2中示出。
在一些实施例中,本文所述的核酸酶可以是自失活的。参见,Epstein等人,“Engineering a Self-Inactivating CRISPR System for AAV Vectors[工程化用于AAV载体的自失活CRISPR系统],”Mol.Ther.[分子疗法],24(2016):S50,将该文献通过引用以其全文并入。
编码本文所述核酸酶的核酸分子可进一步进行密码子优化。可以对核酸进行密码子优化以用于在特定的宿主细胞中使用。
靶向部分
在一些实施例中,本文所述的组合物包含靶向部分。
如果靶向部分包含与参考核酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的序列,则靶向部分可与参考核酸序列基本上相同。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数手动确定两个此类核酸之间的同一性百分比。两个核酸序列基本上相同的一个指示是两个核酸分子在严格条件下(例如,在中等至高度严格的范围内)彼此杂交。
在一些实施例中,靶向部分与参考核酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少约99.5%序列同一性。
RNA指导序列
在一些实施例中,靶向部分包含RNA指导序列或为RNA指导序列。在一些实施例中,RNA指导序列将本文所述的核酸酶导向特定核酸序列。阅读以下特定种类的RNA指导序列的实例的本领域技术人员将理解,在一些实施例中,RNA指导序列具有位点特异性。即,在一些实施例中,RNA指导序列与一个或多个靶核酸序列(例如,特异性DNA或基因组DNA序列)特异性缔合,而不与非靶向核酸序列(例如,非特异性DNA或随机序列)特异性缔合。
在一些实施例中,本文所述的组合物包含与本文所述的核酸酶缔合并将核酸酶导向靶核酸序列(例如,DNA)的RNA指导序列。RNA指导序列可与核酸序列缔合并改变核酸酶的功能(例如,改变核酸酶与分子的亲和力,例如至少10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更多)。
RNA指导序列可以靶向(例如,缔合、导向、接触或结合)序列(例如,位点特异性序列或位点特异性靶标)的一个或多个核苷酸。在一些实施例中,核酸酶(例如,核酸酶加RNA指导物)在结合与RNA指导物中的间隔序列互补的核酸底物(例如,序列特异性底物或靶核酸)后被激活。
在一些实施例中,RNA指导序列包含间隔序列。在一些实施例中,RNA指导序列的间隔序列通常可以被设计为具有17-24个核苷酸(例如,19、20或21个核苷酸)之间的长度并且与特定核酸序列互补。在一些特定的实施例中,RNA指导序列可以被设计为与例如基因组基因座的特定DNA链互补。在一些实施例中,间隔序列被设计为与例如基因组基因座的特定DNA链互补。
在某些实施例中,RNA指导序列包括与序列或间隔序列连接的正向重复序列、基本上由与序列或间隔序列连接的正向重复序列组成、或包含与序列或间隔序列连接的正向重复序列。在一些实施例中,RNA指导序列包括正向重复序列和间隔序列或正向重复-间隔子-正向重复序列。在一些实施例中,RNA指导序列包括截短的正向重复序列和间隔序列,其是典型的经加工或成熟的crRNA。在一些实施例中,核酸酶与RNA指导序列形成复合物,并且该RNA指导序列引导复合物与位点特异性靶核酸缔合,该位点特异性靶核酸与RNA指导序列的至少一部分互补。在一些实施例中,RNA指导序列不包括tracrRNA。
在一些实施例中,RNA指导序列包含与靶核酸序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列,例如RNA序列。在一些实施例中,RNA指导序列包含与DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导序列包含与靶核酸序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导序列包含与基因组序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导序列包含与基因组序列互补的序列或与基因组序列包含至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补性的序列。
在一些实施例中,本文所述的核酸酶包括一个或多个(例如,两个、三个、四个、五个、六个、七个、八个或更多个)RNA指导序列,例如RNA指导物。
在一些实施例中,RNA指导物具有类似于例如国际公开号WO 2014/093622和WO2015/070083的结构,将每一篇文献的全部内容通过引用并入本文。
在一些实施例中,本发明的RNA指导序列包含与SEQ ID NO:3或SEQ ID NO:4具有80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的正向重复序列。在一些实施例中,本发明的靶向部分包含与SEQ ID NO:3或SEQ ID NO:4具有大于80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的正向重复序列。
在一些实施例中,本发明的RNA指导序列的正向重复包含茎环结构,如图5所示。在一些实施例中,与SEQ ID NO:3或SEQ ID NO:4具有80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的正向重复序列包含茎环结构。
能够被本文所述的核酸酶使用的pre-crRNA序列的非限制性实例可见于SEQ IDNO:6、9、12、15、和18。在一些实施例中,本文所述的核酸酶与SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、和SEQ ID NO:18中任一个的pre-crRNA组合具有核酸酶活性(例如,分别切割SEQ ID NO:5、SEQ ID NO:8、SEQ ID NO:11、SEQ ID NO:14、和SEQ ID NO:17中所示的位点特异性靶核酸)。在一些实施例中,核酸酶与同SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15、和SEQ ID NO:18中任一个具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的pre-crRNA组合具有核酸酶活性(例如,切割位点特异性靶核酸)。
除非另有说明,否则本文提供的所有组合物和核酸酶是参照该组合物或核酸酶的活性水平而制备的,并且不包括杂质,例如可能存在于市售来源中的残留溶剂或副产物。核酸酶组分重量基于总活性蛋白质。除非另外指明,否则所有百分比和比率均按重量进行计算。除非另外指明,否则所有百分比和比率均基于总组合物计算。在示例性组合物中,核酸酶水平以总组合物的重量计按纯酶表示,除非另有说明,否则成分以总组合物的重量表示。
修饰
RNA指导序列或编码核酸酶的任何核酸序列可包括相对于参考序列,特别是亲本多核糖核苷酸的一个或多个共价修饰,其包括在本发明的范围内。
示例性修饰可以包括对糖、核碱基、核苷间键(例如对连接的磷酸酯/对磷酸二酯键/对磷酸二酯主链)及其任何组合的任何修饰。以下详细描述了本文提供的一些示例性修饰。
RNA指导序列或编码核酸酶组分的任何核酸序列可以包括任何有用的修饰,诸如对糖、核碱基或核苷间键(例如,对连接的磷酸酯/对磷酸二酯键/对磷酸二酯主链)有用的修饰。嘧啶核碱基的一个或多个原子可以被任选取代的氨基、任选取代的硫醇、任选取代的烷基(例如甲基或乙基)或卤代(例如氯代或氟代)替代或取代。在某些实施例中,在每个糖和核苷间键中存在修饰(例如,一个或多个修饰)。修饰可以是对脱氧核糖核酸(DNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、锁核酸(LNA)或其杂交体的核糖核酸(RNA)修饰。本文描述了另外的修饰。
在一些实施例中,修饰可以包括化学或细胞诱导的修饰。例如,细胞内RNA修饰的一些非限制性实例由Lewis和Pan,“RNA modifications and structures cooperate toguide RNA-protein interactions[RNA修饰和结构协作指导RNA-蛋白质相互作用]”,NatReviews Mol Cell Biol[自然评论:分子细胞生物学],2017,18:202-210所描述。
不同的糖修饰、核苷酸修饰和/或核苷间键(例如,主链结构)可以存在于序列中的不同位置。本领域普通技术人员将理解,核苷酸类似物或其他一个或多个修饰可以位于序列的任何一个或多个位置,使得序列的功能基本上不降低。序列可以包含约1%至约100%的经修饰核苷酸(相对于总核苷酸含量,或相对于一种或多种类型的核苷酸,即A、G、U或C中的任一种或多种)或任何中间百分比(例如,1%至20%>、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%到80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%和95%至100%)。
在一些实施例中,序列的一个或多个核糖核苷酸的糖修饰(例如在2'位置或4'位置)或糖替代以及主链修饰可以包括磷酸二酯键的修饰或替代。序列的具体实例包括但不限于包括经修饰的主链或非天然核苷间键(诸如核苷间修饰,包括磷酸二酯键的修饰或替代)的序列。具有经修饰的主链的序列尤其包括在主链中不具有磷原子的那些。出于本申请的目的,并且如本领域中有时提及的,在其核苷间主链中不具有磷原子的经修饰的RNA也可以被认为是寡核苷。在特定的实施例中,序列将包括在其核苷间主链中具有磷原子的核糖核苷酸。
经修饰的序列主链可以包括,例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(如3'-亚烷基膦酸酯和手性膦酸酯)、亚膦酸酯、氨基磷酸酯(如3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、硫羰基氨基磷酸酯(thionophosphoramidate)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯、和具有正常3'-5'键的硼烷磷酸酯,这些的2'-5'连接的类似物,以及具有相反极性的那些,其中相邻的核苷单元对3'-5'至5'-3'或2'-5'至5'-2'连接。也包括各种盐、混合盐和游离酸形式。在一些实施例中,序列可以带负电荷或带正电荷。
可掺入序列中的经修饰的核苷酸可在核苷间键(例如磷酸酯主链)上被修饰。在本文中,在多核苷酸主链的上下文中,短语“磷酸酯”和“磷酸二酯”可互换使用。可以通过用不同的取代基替代一个或多个氧原子来修饰主链磷酸酯基团。此外,经修饰的核苷和核苷酸可以包括用如本文所述的另一个核苷间键合进行的对未修饰的磷酸酯部分的整体替代。经修饰的磷酸酯基团的实例包括但不限于硫代磷酸酯、亚磷酸硒酸酯、硼酸磷酸酯、硼酸磷酸酯、氢膦酸酯、氨基磷酸酯、二氨基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的两个非连接氧都被硫替代。也可以通过用氮(桥连的氨基磷酸酯)、硫(桥连的硫代磷酸酯)和碳(桥连的亚甲基膦酸酯)替代连接氧来修饰磷酸酯接头。
提供α-硫代取代的磷酸酯部分以通过非天然硫代磷酸酯主链键赋予RNA和DNA聚合物稳定性。硫代磷酸酯DNA和RNA具有增强的核酸酶抗性,并因此在细胞环境中具有更长的半衰期。
在特定的实施例中,经修饰的核苷包括α-硫代-核苷(例如5'-O-(1-硫代磷酸)-腺苷、5'-O-(1-硫代磷酸)-胞苷(α-硫代胞苷)、5'-O-(1-硫代磷酸)-鸟苷、5'-O-(1-硫代磷酸)-尿苷或5'-O-(1-硫代磷酸)-假尿苷)。
本文描述了可根据本发明使用的其他核苷间键,包括不包含磷原子的核苷间键。
在一些实施例中,序列可以包括一个或多个细胞毒性核苷。例如,细胞毒性核苷可以被掺入序列中,如双功能修饰。细胞毒性核苷可以包括但不限于阿糖腺苷、5-氮杂胞苷、4'-硫代阿糖胞苷、环戊烯基胞嘧啶、克拉屈滨、氯法拉滨、阿糖胞苷、胞嘧啶阿糖胞苷、1-(2-C-氰基-2-脱氧-β-D-阿拉伯-戊呋喃糖基)-胞嘧啶、地西他滨、5-氟尿嘧啶、氟达拉滨、氟尿苷、吉西他滨、替加氟和尿嘧啶的组合、替加氟((RS)-5-氟-1-(四氢呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他滨、替扎西他滨、2'-脱氧-2'-亚甲基胞苷(DMDC)和6-巯基嘌呤。其他实例包括氟达拉滨磷酸酯、N4-山嵛酰基-1-β-D-阿拉伯戊呋喃糖基胞嘧啶、N4-十八烷基-1-β-D-阿拉伯戊呋喃糖基胞嘧啶、N4-棕榈酰基-1-(2-C-氰基-2-脱氧-β-D-阿拉伯-戊呋喃糖基)胞嘧啶和P-4055(阿糖胞苷5'-花生酸酯)。
在一些实施例中,序列包括一个或多个转录后修饰(例如,加帽、裂解、聚腺苷酸化、剪接、聚A序列、甲基化、酰化、磷酸化、赖氨酸和精氨酸残基的甲基化、乙酰化、以及硫醇基团和酪氨酸残基的亚硝基化等)。该一个或多个转录后修饰可以是任何转录后修饰,诸如已经在RNA中鉴定出的多于一百种不同的核苷修饰中的任一种(Rozenski,J,Crain,P和McCloskey,J.(1999).The RNA Modification Database:1999 update.[RNA修饰数据库:1999年更新]Nucl Acids Res[核酸研究]27:196-197)。在一些实施例中,第一分离核酸包含信使RNA(mRNA)。在一些实施例中,mRNA包含选自下组的至少一种核苷,该组由以下组成:吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧基甲基尿苷、1-羧基甲基-假尿苷、5-丙炔基尿苷、1-丙炔基-假尿苷、5-牛磺酸基甲基尿苷、1-牛磺酸基甲基假尿苷、5-牛磺酸基甲基-2-硫代-尿苷、1-牛磺酸基甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫代-1-甲基-1-去氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。在一些实施例中,mRNA包含选自下组的至少一种核苷,该组由以下组成:5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟基甲基胞苷、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-去氮-假异胞苷、1-甲基-1-去氮-假异胞苷、折布拉林(zebularine)、5-氮杂-折布拉林、5-甲基-折布拉林、5-氮杂-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷和4-甲氧基-1-甲基-假异胞苷。在一些实施例中,mRNA包含选自下组的至少一种核苷,该组由以下组成:2-氨基嘌呤、2,6-二氨基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮杂-腺嘌呤、7-去氮-2-氨基嘌呤、7-去氮-8-氮杂-2-氨基嘌呤、7-去氮-2,6-二氨基嘌呤、7-去氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺式-羟基异戊烯基)腺苷、2-甲基硫代-N6-(顺式-羟基异戊烯基)腺苷、N6-甘氨酰氨甲酰基腺苷、N6-苏氨酰氨甲酰基腺苷、2-甲基硫代-N6-苏氨酰氨甲酰基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲基硫代-腺嘌呤和2-甲氧基-腺嘌呤。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:1-甲基-肌苷、怀俄苷、怀丁苷、7-去氮-鸟苷、7-去氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-去氮-鸟苷、6-硫代-7-去氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷、和N2,N2-二甲基-6-硫代-鸟苷。
序列沿着分子的整个长度可以被或者可以不被均一地修饰。例如,一种或多种或所有类型的核苷酸(例如,天然存在的核苷酸、嘌呤或嘧啶,或A、G、U、C、I、pU中的任一种或多种或全部)在序列中,或在其给定的预定序列区域中可以被或可以不被均一地修饰。在一些实施例中,序列包括假尿苷。在一些实施例中,序列包括肌苷,相对于病毒RNA,肌苷可以帮助免疫系统将序列表征为内源性。肌苷的掺入还可以介导改善RNA稳定性/减少降解。参见例如,Yu,Z等人,(2015)RNA editing by ADAR1 marks dsRNA as“self”.[通过ADAR1进行的RNA编辑将dsRNA标记为“自身”]Cell Res.[细胞研究]25,1283-1284,将所述文献通过引用以其全文并入本文。
载体
本发明提供了用于表达本文所述核酸酶的载体,或可将编码本文所述核酸酶的核酸掺入载体中。在一些实施例中,本发明的载体包括编码核酸酶(例如核酸酶的一种或多种组分)的核苷酸序列。在一些实施例中,本发明的载体包括编码核酸酶的核苷酸序列。
本发明还提供了可用于制备如本文所述的核酸酶或包含如本文所述核酸酶的组合物的载体。在一些实施例中,本发明包括在细胞中的本文所述的组合物或载体。在一些实施例中,本发明包括在细胞中表达包含核酸酶的组合物或载体或编码核酸酶的核酸的方法。该方法可包括提供组合物(例如载体或核酸)和将组合物递送至细胞的步骤。天然或合成的多核苷酸的表达典型地通过以下实现:将编码目的基因的多核苷酸可操作地连接至启动子并且将构建体掺入表达载体。表达载体没有特别的限制,只要它包括编码本发明核酸酶的多核苷酸,并且可以适合于在真核细胞中复制和整合。典型的表达载体包括可用于表达所希望多核苷酸的转录和翻译终止子、起始序列和启动子。例如,可使用携带RNA聚合酶识别序列的质粒载体(pSP64、pBluescript等)。包括来源于逆转录病毒如慢病毒的那些载体是实现长期基因转移的合适工具因为它们允许转基因的长期稳定整合及其在子细胞中的繁殖。载体的实例包括表达载体、复制载体、探针产生载体、和测序载体。可以按病毒载体的形式,将表达载体提供给细胞。病毒载体技术是本领域众所周知的,并且描述于多种病理学和分子生物学手册。可用作载体的病毒包括但不限于噬菌体病毒、逆转录病毒、腺病毒、腺相关病毒、疱疹病毒和慢病毒。通常,合适的载体含有在至少一种生物体中有复制功能的起点、启动子序列、方便的限制性内切酶位点、和一种或多种选择性标志物。
载体的种类没有特别限制,可以适当地选择可以在宿主细胞中表达的载体。更特别地,根据宿主细胞的种类,适当地选择启动子序列以确保从多核苷酸表达核酸酶,并将该启动子序列和多核苷酸插入各种质粒等的任一种中,用于制备表达载体。
另外的启动子元件(例如,增强序列)调节转录起始的频率。典型地,这些元件位于起始位点上游30-110bp的区域中,尽管最近已经显示许多启动子也含有起始位点下游的功能元件。取决于启动子,似乎单个元件可以共同地或独立地发挥功能,以激活转录。
此外,本披露不应限于使用组成型启动子。诱导型启动子也被考虑作为本披露的一部分。诱导型启动子的使用提供了分子开关,当希望这种表达时,该分子开关能够开启与该启动子可操作地连接的多核苷酸序列的表达,或当不希望表达时,则能够关闭表达。诱导型启动子的实例包括但不限于金属硫蛋白启动子、糖皮质激素启动子、孕酮启动子、和四环素启动子。
待引入的表达载体还可以含有选择性标志物基因或报告基因或二者,从而便于从寻求通过病毒载体转染或感染的细胞的群体中,鉴定和选择表达性细胞。在其他方面,选择性标志物可以在一段单独的DNA上进行,并且用于共转染程序。选择性标志物和报告基因二者侧翼可以是适当的转录控制序列,以使得能够在宿主细胞中表达。这种标志物的实例包括用于真核细胞培养的二氢叶酸还原酶基因和新霉素抗性基因;以及用于大肠杆菌和其他细菌培养的四环素抗性基因和氨苄青霉素抗性基因。通过使用这样的选择标志物,可以确认编码本发明核酸酶的多核苷酸是否已被转移到宿主细胞中,然后定被成功表达。
重组表达载体的制备方法没有特别限制,其实例包括使用质粒、噬菌体或粘粒的方法。
生产
在一些实施例中,本发明的核酸酶可通过(I)培养产生本发明的核酸酶的细菌,分离核酸酶,和任选地纯化核酸酶来制备。核酸酶还可以通过(II)已知的基因工程技术制备,具体地,通过从细菌分离编码本发明核酸酶的基因,构建重组表达载体,然后将该载体转移到合适的宿主细胞中以表达重组蛋白。或者,核酸酶可通过(III)体外偶联的转录-翻译系统来制备。可用于制备本发明核酸酶的细菌没有特别限制,只要它们能产生本发明的核酸酶即可。细菌的一些非限制性实例包括本文所述的大肠杆菌细胞。
表达方法
本发明包括用于蛋白质表达的方法,该方法包括翻译本文所述的核酸酶。
在一些实施例中,本文所述的宿主细胞用于表达核酸酶。宿主细胞没有特别限制,并且可以优选使用各种已知的细胞。宿主细胞的具体实例包括细菌,例如大肠杆菌、酵母(芽殖酵母、酿酒酵母和裂殖酵母、粟酒裂殖酵母)、线虫(秀丽隐杆线虫)、爪蟾卵母细胞和动物细胞(例如,CHO细胞、COS细胞和HEK293细胞)。用于将上述表达载体转移到宿主细胞中的方法(即转化方法)没有特别限制,并且可以使用已知的方法,例如电穿孔、磷酸钙法、脂质体法和DEAE葡聚糖法。
用表达载体转化宿主后,可以培养、培育或繁殖宿主细胞以产生核酸酶。核酸酶表达后,可根据常规方法(例如,过滤、离心、细胞破碎、凝胶过滤色谱、离子交换层析等)从培养物等收集宿主细胞并纯化核酸酶。
在一些实施例中,用于核酸酶表达的方法包括翻译核酸酶的至少5个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸、至少50个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸、至少250个氨基酸、至少300个氨基酸、至少400个氨基酸、至少500个氨基酸、至少600个氨基酸、至少700个氨基酸、至少800个氨基酸、至少900个氨基酸、或至少1000个氨基酸。在一些实施例中,用于蛋白质表达的方法包括翻译核酸酶的约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约50个氨基酸、约100个氨基酸、约150个氨基酸、约200个氨基酸、约250个氨基酸、约300个氨基酸、约400个氨基酸、约500个氨基酸、约600个氨基酸、约700个氨基酸、约800个氨基酸、约900个氨基酸、约1000个氨基酸或更多个氨基酸。
可以使用多种方法来确定宿主细胞中成熟核酸酶的产生水平。此类方法包括但不限于例如利用对核酸酶具有特异性的多克隆或单克隆抗体的方法。示例性方法包括但不限于酶联免疫吸附测定(ELISA)、放射免疫测定(MA)、荧光免疫测定(FIA)和荧光激活细胞分选术(FACS)。这些和其他测定是本领域熟知的(参见例如Maddox等人,J.Exp.Med.[实验医学杂志]158:1211[1983])。
本披露提供了在细胞中体内表达核酸酶的方法,这些方法包括向宿主细胞提供编码核酸酶的多核糖核苷酸(其中该多核糖核苷酸编码核酸酶),在细胞中表达核酸酶,以及从细胞获得该核酸酶。
递送
本文所述的组合物可以经配制例如包含载体(例如载体和/或聚合物载体,例如脂质体),并通过已知方法递送至细胞(例如,原核、真核、植物、哺乳动物等)。此类方法包括但不限于转染(例如,脂质介导的阳离子聚合物、磷酸钙、树状聚合物);电穿孔或其他破坏膜的方法(例如,核转染)、病毒递送(例如,慢病毒、逆转录病毒、腺病毒、AAV)、显微注射、微粒轰击(“基因枪”)、fugene、直接声波加载、细胞挤压、光转染、原生质体融合、刺穿感染、磁转染、外来体介导的转移、脂质纳米颗粒介导的转移、及其任何组合。
本文引用的所有参考文献和出版物特此通过引用并入。
实例
提供以下实例以进一步说明本发明的一些实施例但并非旨在限制本发明的范围;通过其示例性性质将理解,可以替代性地使用本领域技术人员已知的其他程序、方法或技术。
实例1-Cas12h1核酸酶的序列
在该实例中,分析Cas12h家族成员的氨基酸序列以鉴定潜在的功能性蛋白质结构域。如图1所示,确定氨基酸序列包括推定的C末端RuvC结构域。还确定催化残基存在于RuvC结构域的保守序列基序(I、II和III)中。进一步确定该序列包括桥螺旋(h)结构域。
该实例表明,Cas12h家族成员的氨基酸序列显示出具有保守的C末端结构域RuvC结构域。
实例2-工程化Cas12h1系统的体内分析
在该实例中,将Cas12h1系统工程化并在大肠杆菌系统中测试。
将Cas12h1核酸酶(SEQ ID NO:1)经过大肠杆菌密码子优化,合成(金斯瑞公司(Genscript))并克隆到衍生自pET-28a(+)的定制表达系统(EMD-密理博公司(EMD-Millipore))中。该载体包含在lac启动子和大肠杆菌核糖体结合序列控制下编码Cas12h1的核酸。该载体还包含由J23119启动子驱动的CRISPR阵列文库的受体位点,其位于Cas12h1的开放阅读框之后。参见图2A。
通过计算设计了含有正向重复-间隔子-正向重复序列的寡核苷酸文库合成(OLS)池,其中该正向重复表示在与天然Cas12h1基因座缔合的CRISPR阵列中发现的共有正向重复序列,并且该间隔子表示拼接包含氯霉素和四环素抗性基因的pACYC184质粒、大肠杆菌必需基因、或阴性对照序列(GFP)的序列。特别地,Cas12h1的每个文库中的正向重复序列是SEQ ID NO:3或SEQ ID NO:4的序列。间隔子长度由内源CRISPR阵列中发现的间隔子长度的模式确定。冗余正向重复序列在文库中表示,这些序列拼接pACYC184质粒、大肠杆菌必需基因或阴性对照序列以提供内部对照。在这些实例中,单独的正向重复-间隔子-正向重复序列也被描述为CRISPR阵列。
然后将靶向CRISPR阵列序列的文库克隆到Cas12h1质粒中以创建Cas12h1/CRISPR阵列文库。使用PCR(NEBNext高保真2x PCR主混合物)将侧翼限制位点、唯一分子标识符(条形码)、用于从较大池中特异性扩增靶向文库的唯一PCR引发位点和J23119启动子附加到靶向文库,然后添加优化的限制酶和连接酶(新英格兰生物实验室(New England Biolabs))以产生Cas12h1/CRISPR阵列文库。这代表用于筛选的输入文库。
接下来,用Cas12h1/CRISPR阵列文库转化大肠杆菌。根据制造商的方案,使用带有1.0mm比色皿的电穿孔系统(伯乐公司(Bio-rad)),用输入文库电穿孔细胞。将细胞铺板在具有氯霉素(飞世尔公司(Fisher))和卡那霉素(阿法埃莎公司(Alfa Aesar))的生物测定板上并生长11小时。随后,估计大概的菌落数以确保足够的文库代表,并收获细胞。参见图2B。
使用Cas12h1/CRISPR阵列文库转化的细胞生长、将其收获和分析。使用DNA制备型试剂盒(凯杰公司(Qiagen))从收获的细胞中提取质粒DNA片段以创建输出文库,同时通过用RNA纯化试剂盒(左莫研究公司(Zymo Research))处理收获的细胞、随后使用RNA制备型试剂盒(Zymo Research)提取来收获总RNA。
研究了工程化的Cas12h1/CRISPR阵列文库在大肠杆菌中的活性的代用指标(proxy),其中细菌细胞死亡用作Cas12h1活性的代用指标。与CRISPR阵列序列缔合的活性Cas12h1酶可以选择性地结合并破坏间隔序列靶标(例如,pACYC184质粒或大肠杆菌必需基因)的表达,导致细胞死亡,从而耗减输出文库中这种特异性CRISPR阵列的表示,与输入文库相反。
与输入文库相比,用于检测从输出文库中耗减的那些CRISPR阵列的下一代测序(NGS)文库通过使用位于CRISPR阵列的靶向文库侧翼的独特引物以通过条形码鉴定每个CRISPR阵列序列,对输入和输出文库进行PCR来制备。然后将文库归一化,合并,并加载到高通量序列系统(依诺米那公司(Illumina))上以评价条形码的存在(和不存在)。
使用软件将用于筛选输入和输出文库的NGS数据进行解复用以将基本响应文件转换为FASTQ文件。每个样品的读数包括关于筛选中靶向文库的信息。使用每个靶向CRISPR阵列序列的正向重复序列来确定正向重复-间隔子-正向重复序列取向,并且将间隔序列映射至来源(pACYC184或大肠杆菌必需基因)或阴性对照序列(GFP)以确定相应的靶标。对于每个样品,对给定输出文库中每个CRISPR阵列序列的读段的总数目(ra)进行计数并如下归一化:(ra+1)/所有CRISPR阵列文库元件的总读段。通过将给定CRISPR阵列的归一化输出读段除以归一化输入读段来计算耗减得分。
每个CRISPR阵列的倍数耗减被定义为归一化的输入读段计数除以归一化的输出读段计数(加1以避免被零除)。如果倍数耗减大于3,则认为CRISPR阵列被强烈耗减。当计算跨生物学重复的Cas12h1的CRISPR阵列倍数耗减时,取所有实验中给定CRISPR阵列的最大倍数耗减值(即,强耗减的CRISPR阵列必须在所有生物重复学中强烈耗减)。
图3A和图3B分别描述了CRISPR阵列靶向的pACYC184质粒和大肠杆菌必需基因中的位置。发现质粒或基因靶标的位置分散在各处,对顶链或底链几乎没有偏好。
该实例表明,与Cas12h1缔合的CRISPR阵列靶向并破坏大肠杆菌中的表达。
实例3-Cas12h1的PAM序列的鉴定
在本实例中,进行PAM序列的鉴定。
将图3A和图3B中描绘的耗减的CRISPR阵列序列进行比对以鉴定Cas12h1 CRISPR系统的潜在序列需求。
图4示出了大肠杆菌中靶间隔序列侧翼的PAM序列的偏好。该分析揭示了Cas12h1的5’-TG-3’、5’-RTG-3’、和5’-RTR-3’的可能PAM序列。
该实例表明Cas12h1与靶DNA的相互作用可能是PAM依赖性的。
实例4-Cas12h1 RNA指导物的正向重复序列的预测二级结构
本实例描述了Cas12h1 RNA指导序列的预测二级结构。
在本实例中,分析Cas12h1 RNA指导物的正向重复序列的序列(SEQ ID NO:3)的预测二级结构。如图5所示,正向重复序列的预测折叠表明了茎环结构。RNA自由能计算为-18.7kcal/mol。
该实例表明Cas12h1 RNA指导物正向重复序列的茎环结构在能量上是有利的。
实例5-大肠杆菌中的Cas12h1 RuvC突变系统
在该实例中,设计了Cas12h1 RuvC突变体并在大肠杆菌系统中测试。
通过定点诱变将Cas12h1 RuvC I基序结构域中的保守催化残基(位置465)突变为丙氨酸(D465A)。Cas12h1 D465A序列如SEQ ID NO:2所示。该载体包括在lac启动子和大肠杆菌核糖体结合序列控制下编码Cas12h1 D465A的核酸。该载体还包括由J23119启动子驱动的靶向文库的受体位点,其位于Cas12h1 D465A的开放阅读框之后。然后将CRISPR阵列文库(正向重复-间隔子-正向重复文库)克隆到Cas12h1 D465A质粒中,并且将Cas12h1D465A/CRISPR阵列文库转化到大肠杆菌中,如实例2所述。
如实例2所述,使细胞生长,将其收获并通过NGS分析。
图6是散点图,其中每个点代表与Cas12h1或Cas12h1 D465A缔合的单独CRISPR阵列,并且从输出文库与输入文库的比较确定野生型或突变体Cas12h1的耗减倍数。更高的值表示更强的耗减(例如,在输出文库中缺乏存在,例如,更少的存活菌落)。如图6所示,与使用Cas12h1 D465A突变体(SEQ ID NO:2)的耗减相比,野生型Cas12h1(SEQ ID NO:1)表现出输出文库中耗减的CRISPR阵列的数目更高。
该实例表明,Cas12h1突变体表现出比野生型Cas12h1更少的CRISPR阵列的耗减。
实例6-Cas12h1蛋白质的纯化
在该实例中,纯化Cas12h1用于Cas12h1的生物化学测试。
将来自实例2的包含Cas12h1的质粒转化到大肠杆菌细胞(新英格兰生物实验室)中并在T7启动子下表达。转化的细胞最初在3mL Luria肉汤(西格玛公司(Sigma))+50μg/mL卡那霉素中生长过夜,然后用1mL过夜培养物接种1L培养基(西格玛公司)+50μg/mL卡那霉素。使细胞在37℃生长至OD600为1-1.5,然后用0.2mM IPTG诱导蛋白质表达。然后使培养物在20℃再生长14-18小时。
收获培养物并通过离心沉淀,然后重悬于80mL裂解缓冲液(50mM HEPES pH 7.6,0.5M NaCl,10mM咪唑,14mM 2-巯基乙醇和5%甘油)+蛋白酶抑制剂(西格玛公司)中。通过细胞破裂器(恒定系统有限公司(Constant System Limited))裂解细胞,然后在4℃以28,000x g离心两次20分钟以澄清裂解物。
将裂解物加载到5mL HisTrap FF柱(GE生命科学公司(GE Life Sciences))上,然后通过FPLC(AKTA Pure,GE生命科学公司)经10mM至250mM的咪唑梯度进行纯化。Cas12h1在低盐缓冲液(50mM HEPES-KOH pH 7.8,500mM NaCl,10mM MgCl2,14mM巯基乙醇,和5%甘油)中洗脱。洗脱后,将级分在SDS-PAGE凝胶上运行,合并含有适当大小蛋白质的级分并使用10kD Amicon Ultra-15离心单元浓缩。将Cas12h1进一步透析到不含咪唑的缓冲液(25mMHEPES-KOH pH 7.8,500mM NaCl,10mM MgCl2,1mM DTT,7mM 2-巯基乙醇,和30%甘油)中。通过Qubit蛋白测定法(赛默飞世尔公司(Thermo Fisher))测定蛋白浓度。
实例7-用Cas12h1切割dsDNA
本实例展示了Cas12h1的生物化学测试。
使用从实例2获得的信息,合成Cas12h1的RNA指导序列。产生与用于切割测试的DNA靶标的一条链互补的pre-crRNA的间隔序列。
使用体外转录(IVT)制备Cas12h1的pre-crRNA(或RNA指导物)序列。使用PCR(NEBNEXT高保真2x PCR主混合物,NEB)制备pre-crRNA的含有T7启动子的双链DNA模板。通过以下方式执行IVT:将双链DNA模板与T7 RNA聚合酶(HiScribe T7快速高产率RNA试剂盒新英格兰生物学实验室公司(NEB))一起孵育,然后用DNase(赛默飞世尔科技公司(ThermoFisher Scientific))处理以除去DNA模板。使用RNA制备型试剂盒(左莫研究公司)净化IVT产物。
表1示出了靶标A、B、D、F和G及其相应的pre-crRNA(正向重复-间隔子-正向重复)和间隔序列的序列标识符。靶标A、B、D、F和G对应于GFP内的不同序列。
表1.用于下述测定的SEQ ID NO。
靶标 靶序列 pre-crRNA序列 间隔序列
A SEQ ID NO:5 SEQ ID NO:6 SEQ ID NO:7
B SEQ ID NO:8 SEQ ID NO:9 SEQ ID NO:10
D SEQ ID NO:11 SEQ ID NO:12 SEQ ID NO:13
F SEQ ID NO:14 SEQ ID NO:15 SEQ ID NO:16
G SEQ ID NO:17 SEQ ID NO:18 SEQ ID NO:19
合成ssDNA和dsDNA靶序列用于Cas12h1的生物化学测试。dsDNA靶标的一条链与上述间隔序列互补。
通过标记非间隔子互补(NSC)链,用引物退火,然后用DNA聚合酶I(新英格兰生物实验室)延伸来产生经标记的dsDNA靶底物,如图9A所示。这些底物用DNA制备型试剂盒(左莫研究公司)纯化。测量浓度(赛默飞世尔科技公司)。使用5'标记试剂盒(载体实验室公司(Vector Labs))并按照制造商的方案用近红外荧光染料标记dsDNA靶标的NSC链。含有靶互补区的ssDNA寡核苷酸在商业上合成(IDT),并使用5'标记试剂盒(载体实验室公司)按照制造商的方案用近红外荧光染料标记。
测试Cas12h1在以下4个不同靶标上的特异性活性:靶标A、B、D和F。还测试了不使用Cas12h1和使用非靶向pre-crRNA(例如,使用针对靶标A和靶标B设计的RNA指导物等)的阴性对照。在反应缓冲液(50mM NaCl,10mM Tris,10mM MgCl2,1mM DTT,pH 8.0)中设置dsDNA靶标切割测定。通过使来自实例6的纯化的Cas12h1与来自表1的pre-crRNA或非靶向pre-crRNA以1:2的比率一起孵育来形成复合的RNP(Cas12h1与pre-crRNA)。然后将复合的RNP添加到100nM dsDNA底物中并进行孵育。用RNase混合物处理反应物并进行孵育。接着,用蛋白酶K处理反应物并进行孵育。
为了检测dsDNA切割,在15%TBE-尿素凝胶上分析来自反应的DNA产物。将凝胶在荧光数字成像系统(立卡生物科学公司(LI-COR Biosciences))上成像。
如图7A、图7B和图7C所示,使用其相应的Cas12h1 RNP在每个靶标中观察到靶标特异性切割(例如,图7A的泳道4和12,图7B的泳道6和图7C的泳道6)。如图7A、图7B和图7C所示,切割与Cas12h1浓度正相关(例如,切割条带在图7A的泳道4中比在泳道3中更明显)。在不存在pre-crRNA(RNA指导物)的情况下(例如,图7A的泳道2和8,图7B的泳道2和图7C的泳道2)和/或在不存在Cas12h1的情况下(例如,图7A的泳道1和7,图7B的泳道1和图7C的泳道1)没有观察到可检测的切割活性。此外,对于Cas12h1与非靶向pre-crRNA(RNA指导物)复合物没有观察到可检测的切割活性。例如,当使用针对靶标B设计的pre-crRNA时,在靶标A中未观察到可检测的切割,并且当使用针对靶标A设计的pre-crRNA时,在靶标B中未观察到可检测的切割(例如,图7A的泳道6和10)。同样地,该模式对于靶标D在针对靶标C设计的非靶向pre-crRNA存在下(例如,图7B的泳道4)和对于靶标F在针对靶标E设计的非靶向pre-crRNA存在下(例如,图7C的泳道4)是一致的。
这表明Cas12h1具有靶特异性dsDNA切割活性。
实例8-用Cas12h1切割ssDNA
在本实例中,评估Cas12h1的ssDNA切割活性。
在反应缓冲液(50mM NaCl,10mM Tris,10mM MgCl2,1mM DTT,pH 8.0)中设置ssDNA靶切割测定,类似于实例7中描述的dsDNA测定。还测试了不使用Cas12h1和使用非靶ssDNA的阴性对照。
简言之,通过体外转录-翻译(IVTT)系统产生Cas12h1蛋白。使用PCR从质粒扩增包含启动子的Cas12h1的dsDNA模板。为了产生Cas12h1蛋白,将dsDNA模板与IVTT试剂一起孵育。为了产生Cas12h1+pre-crRNA的RNP复合物,将dsDNA模板与IVTT试剂在200nM pre-crRNA(SEQ ID NO:18)存在下一起孵育。
将RNP复合物与500nM pre-crRNA(SEQ ID NO:18)在测定缓冲液中一起孵育,然后加入近红外荧光染料标记的来自实例7的靶标G的ssDNA(SEQ ID NO:17)(如图9B所示)并进行孵育。以类似的方式将阴性对照非靶ssDNA与Cas12h1 RNP一起孵育。首先用RNase混合物处理反应物并进行孵育。接着,用蛋白酶K处理反应物。
为了检测ssDNA切割产物,在15%TBE-尿素凝胶上分析反应物并在荧光数字成像系统(立卡生物科学公司)上成像。
图8示出了以下反应产物的TBE-尿素变性凝胶的图像:泳道1:靶标G ssDNA和Cas12h1,没有pre-crRNA,泳道2:靶标G ssDNA和与顶链(活性取向)pre-crRNA复合的Cas12h1,以及泳道3:非靶标ssDNA和与顶链(活性取向)pre-crRNA复合的Cas12h1。如泳道2所示,靶标G ssDNA在其相应的pre-crRNA存在下以活性取向显示出被Cas12h1可检测的切割。在泳道1和3中没有观察到可检测的切割产物,其中分别是不包括pre-crRNA或使用非靶标ssDNA。
这表明Cas12h1具有靶特异性ssDNA切割活性。
实例9-Cas12h1靶向哺乳动物基因
本实例描述了通过瞬时转染引入哺乳动物细胞的Cas12h1对哺乳动物靶标的插入缺失评估。
将Cas12h1克隆到pcda3.1骨架(英杰公司(Invitrogen))中。然后将质粒大量制备并稀释至1μg/μL。选择与5’-RTR-3’、5’-RTG-3’、5’-NTG-3’、或5’-DHD-3’PAM序列相邻的哺乳动物靶序列,并如本文所述设计相应的RNA指导物。对于RNA指导物的制备,编码RNA指导物的dsDNA片段由含有靶序列支架的超聚体(ultramer)和U6启动子衍生。将超聚体重悬于pH 7.5的10mM Tris·HCl中至100μM的最终储备液浓度。随后将工作储备液稀释至10μM,再次使用10mM Tris·HCl作为PCR反应的模板。RNA指导物的扩增在50μL反应物中使用以下组分进行:0.02μL前述模板,2.5μL正向引物,2.5μL反向引物,25μL NEB HiFi聚合酶和20μL水。循环条件是:1x(在98℃下30s)、30x(在98℃下10s,在67℃下15s)、1x(在72℃下2min)。用1.8X SPRI处理清除PCR产物并归一化至25ng/μL。
转染前约16小时,将100μL在DMEM/10%FBS+Pen/Strep中的25,000个HEK293T细胞铺板到96孔板的每个孔中。在转染当天,细胞为70%-90%汇合。对于待转染的每个孔,制备0.5μL Lipofectamine 2000和9.5μL Opti-MEM的混合物,然后在室温下孵育5-20分钟(溶液1)。孵育后,将lipofectamine:OptiMEM混合物添加到含有182ng效应子质粒和14ngcrRNA的单独混合物中,并加水至10μL(溶液2)。在阴性对照的情况下,在溶液2中不包含crRNA。通过上下吸移将溶液1和溶液2混合物进行混合,然后在室温下孵育25分钟。孵育后,将20μL溶液1和溶液2混合物逐滴添加到含有细胞的96孔板的每个孔中。转染后72小时,通过向每个孔的中心添加10μL TrypLE对细胞进行胰蛋白酶化并孵育约5分钟。然后向每个孔中添加100μL D10培养基并混合以重悬细胞。然后将细胞以500g旋转沉降10分钟,并且弃去上清液。将QuickExtract缓冲液添加至原始细胞悬浮液体积的量的1/5。将细胞在65℃下孵育15分钟,在68℃下孵育15分钟,并且在98℃下孵育10分钟。
通过两轮PCR制备用于下一代测序的样品。使用第一轮(PCR1)来根据靶标扩增特定的基因组区域。通过柱纯化来纯化PCR1产物。进行第2轮PCR(PCR2)以添加依诺米那(Illumina)衔接子和索引。然后合并反应物并通过柱纯化进行纯化。用150次循环的NextSeq v2.5中等或高输出试剂盒进行测序运行。
在两个生物学平行测定中测量由Cas12h1诱导的平均插入缺失百分比并与来自阴性对照样品的值进行比较。如与阴性对照样品的插入缺失百分比相比,Cas12h1诱导的插入缺失百分比更高指示核酸酶活性。
本实例示出了如何评价Cas12h1在哺乳动物细胞中的活性。
Figure BDA0003676370780000361
Figure BDA0003676370780000371
Figure IDA0003676370820000011
Figure IDA0003676370820000021
Figure IDA0003676370820000031
Figure IDA0003676370820000041
Figure IDA0003676370820000051
Figure IDA0003676370820000061
Figure IDA0003676370820000071
Figure IDA0003676370820000081
Figure IDA0003676370820000091
Figure IDA0003676370820000101
Figure IDA0003676370820000111
Figure IDA0003676370820000121
Figure IDA0003676370820000131
Figure IDA0003676370820000141
Figure IDA0003676370820000151
Figure IDA0003676370820000161
Figure IDA0003676370820000171

Claims (29)

1.一种组合物,该组合物包含:
(a)核酸酶或编码该核酸酶的核酸,其中该核酸酶包含与SEQ ID NO:1具有至少80%同一性的氨基酸序列;以及
(b)RNA指导物或编码该RNA指导物的核酸,其中该RNA指导物包含正向重复序列和间隔序列,
其中该核酸酶结合该RNA指导物,并且其中该间隔序列结合靶核酸。
2.根据任一前述权利要求所述的组合物,其中该核酸酶包含SEQ ID NO:1所示的氨基酸序列。
3.根据任一前述权利要求所述的组合物,其中该核酸酶包含RuvC结构域或拆分型RuvC结构域。
4.根据任一前述权利要求所述的组合物,其中该核酸酶包含催化残基(例如,天冬氨酸或谷氨酸)。
5.根据任一前述权利要求所述的组合物,其中该组合物不包含tracrRNA。
6.根据任一前述权利要求所述的组合物,其中该正向重复序列包含与SEQ ID NO:3或SEQ ID NO:4具有至少95%序列同一性的核苷酸序列。
7.根据任一前述权利要求所述的组合物,其中该正向重复序列包含SEQ ID NO:3或SEQID NO:4所示的核苷酸序列。
8.根据任一前述权利要求所述的组合物,其中该间隔序列包含15至24个核苷酸的长度。
9.根据任一前述权利要求所述的组合物,其中该靶核酸包含与该间隔序列中的核苷酸序列互补的序列。
10.根据任一前述权利要求所述的组合物,其中该核酸酶识别原型间隔子相邻基序(PAM)序列,其中该PAM序列包含如5’-RTR-3’、5’-RTG-3’、5’-NTG-3’或5’-DHD-3’所示的核苷酸序列,其中“R”是A或G,“D”是A或G或T,并且“N”是任何核碱基。
11.根据任一前述权利要求所述的组合物,其中该PAM序列包含如5’-ATG-3’、5’-GTG-3’、5’-ATA-3’、或5’-GTA-3’所示的核苷酸序列。
12.根据任一前述权利要求所述的组合物,其中该核酸酶切割该靶核酸。
13.根据任一前述权利要求所述的组合物,其中该靶核酸是单链DNA或双链DNA。
14.根据任一前述权利要求所述的组合物,其中该组合物包含比参考组合物高至少10%的酶活性,例如比参考组合物的核酸酶活性高至少10%的核酸酶活性。
15.根据任一前述权利要求所述的组合物,其中该核酸酶进一步包含肽标签、荧光蛋白、碱基编辑结构域、DNA甲基化结构域、组蛋白残基修饰结构域、定位因子、转录修饰因子、光门控因子、化学诱导型因子或染色质可视化因子。
16.根据任一前述权利要求所述的组合物,其中对编码该核酸酶的核酸进行密码子优化以在细胞中表达。
17.根据任一前述权利要求所述的组合物,其中编码该核酸酶的核酸与启动子可操作地连接。
18.根据任一前述权利要求所述的组合物,其中编码该核酸酶的核酸在载体中。
19.根据任一前述权利要求所述的组合物,其中该载体包括逆转录病毒载体、慢病毒载体、噬菌体载体、腺病毒载体、腺相关载体或单纯疱疹载体。
20.根据任一前述权利要求所述的组合物,其中该组合物存在于递送组合物中,该递送组合物包含纳米颗粒、脂质体、外来体、微泡或基因枪。
21.一种细胞,该细胞包含根据任一前述权利要求所述的组合物。
22.根据权利要求21所述的细胞,其中该细胞是真核细胞,例如哺乳动物细胞,例如人细胞。
23.根据任一前述权利要求所述的细胞,其中该细胞是原核细胞。
24.一种使根据任一前述权利要求所述的组合物与细胞中的靶核酸结合的方法,该方法包括:
(a)提供该组合物;以及
(b)将该组合物递送至该细胞,
其中该细胞包含该靶核酸,其中该核酸酶结合该RNA指导物,并且其中该间隔序列结合该靶核酸。
25.一种将插入或缺失引入至细胞中的靶核酸的方法,该方法包括:
(a)提供根据任一前述权利要求所述的组合物;以及
(b)将该组合物递送至该细胞,
其中该组合物对该靶核酸的识别导致对该靶核酸的修饰。
26.根据权利要求24或权利要求25所述的方法,其中通过转染将该组合物递送至该细胞。
27.根据任一前述权利要求所述的方法,其中该细胞是真核细胞。
28.根据任一前述权利要求所述的方法,其中该细胞是原核细胞。
29.根据任一前述权利要求所述的方法,其中该细胞是人细胞。
CN202080084107.2A 2019-12-04 2020-12-03 包含核酸酶的组合物及其用途 Pending CN115052986A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962943680P 2019-12-04 2019-12-04
US62/943,680 2019-12-04
PCT/US2020/063125 WO2021113522A1 (en) 2019-12-04 2020-12-03 Compositions comprising a nuclease and uses thereof

Publications (1)

Publication Number Publication Date
CN115052986A true CN115052986A (zh) 2022-09-13

Family

ID=76222288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080084107.2A Pending CN115052986A (zh) 2019-12-04 2020-12-03 包含核酸酶的组合物及其用途

Country Status (7)

Country Link
US (1) US20230045187A1 (zh)
EP (1) EP4069850A4 (zh)
JP (1) JP2023505234A (zh)
CN (1) CN115052986A (zh)
AU (1) AU2020397041A1 (zh)
CA (1) CA3163741A1 (zh)
WO (1) WO2021113522A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112023024985A2 (pt) 2021-06-01 2024-02-20 Arbor Biotechnologies Inc Sistemas de edição de genes compreendendo uma crispr nuclease e usos dos mesmos
US20240301447A1 (en) 2023-02-15 2024-09-12 Arbor Biotechnologies, Inc. Gene editing method for inhibiting aberrant splicing in stathmin 2 (stmn2) transcript

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020098772A1 (zh) * 2018-11-15 2020-05-22 中国农业大学 CRISPR-Cas12j酶和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019214604A1 (zh) * 2018-05-07 2019-11-14 中国农业大学 CRISPR/Cas效应蛋白及系统
AU2020221355A1 (en) * 2019-02-13 2021-08-12 Beam Therapeutics Inc. Compositions and methods for treating glycogen storage disease type 1a

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020098772A1 (zh) * 2018-11-15 2020-05-22 中国农业大学 CRISPR-Cas12j酶和系统

Also Published As

Publication number Publication date
JP2023505234A (ja) 2023-02-08
US20230045187A1 (en) 2023-02-09
WO2021113522A1 (en) 2021-06-10
AU2020397041A1 (en) 2022-06-09
CA3163741A1 (en) 2021-06-10
EP4069850A1 (en) 2022-10-12
EP4069850A4 (en) 2024-03-27

Similar Documents

Publication Publication Date Title
CN115698278A (zh) 包含Cas12i2变体多肽的组合物及其用途
US20240093228A1 (en) Compositions comprising a nuclease and uses thereof
JP2024509928A (ja) 変異体ポリペプチドを含む組成物及びその使用
US20230045187A1 (en) Compositions comprising a nuclease and uses thereof
WO2022150608A1 (en) Compositions comprising a variant crispr nuclease polypeptide and uses thereof
US20240035010A1 (en) Compositions comprising a variant polypeptide and uses thereof
US11866746B2 (en) Compositions comprising a variant Cas12i4 polypeptide and uses thereof
WO2024020557A1 (en) Compositions comprising a variant nuclease and uses thereof
WO2023086938A2 (en) Type v nucleases
US20230235304A1 (en) Compositions comprising a crispr nuclease and uses thereof
US20240141388A1 (en) Compositions comprising a variant polypeptide and uses thereof
US20240011031A1 (en) Compositions comprising a nuclease and uses thereof
US20230193243A1 (en) Compositions comprising a cas12i2 polypeptide and uses thereof
WO2023086973A1 (en) Type ii nucleases
CN118019846A (zh) 包含crispr核酸酶的组合物及其用途
WO2023086965A2 (en) Type vii nucleases
CN117136233A (zh) 包含变体Cas12i4多肽的组合物及其用途
WO2023019243A1 (en) Compositions comprising a variant cas12i3 polypeptide and uses thereof
TW202246497A (zh) Cas12i2融合分子及其用途
CN117043326A (zh) 包含变体多肽的组合物及其用途

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination