CN109642231A - Vi型crispr直向同源物和系统 - Google Patents

Vi型crispr直向同源物和系统 Download PDF

Info

Publication number
CN109642231A
CN109642231A CN201780050351.5A CN201780050351A CN109642231A CN 109642231 A CN109642231 A CN 109642231A CN 201780050351 A CN201780050351 A CN 201780050351A CN 109642231 A CN109642231 A CN 109642231A
Authority
CN
China
Prior art keywords
composition
rna
cell
vitro
vivo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780050351.5A
Other languages
English (en)
Inventor
F·张
O·O·阿布达耶
J·戈滕贝格
E·S·兰德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harvard College
Massachusetts Institute of Technology
Broad Institute Inc
Original Assignee
Harvard College
Massachusetts Institute of Technology
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harvard College, Massachusetts Institute of Technology, Broad Institute Inc filed Critical Harvard College
Publication of CN109642231A publication Critical patent/CN109642231A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Veterinary Medicine (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Saccharide Compounds (AREA)
  • Compounds Of Unknown Constitution (AREA)

Abstract

本发明提供了用于靶向核酸的系统、方法和组合物。具体地说,本发明提供了非天然存在的或工程化的RNA靶向系统,这些靶向系统包含新颖的RNA靶向CRISPR效应蛋白和至少一种靶向核酸组分,像指导RNA。

Description

VI型CRISPR直向同源物和系统
相关申请的交叉引用
本申请要求2016年6月17日提交的美国临时申请62/351,662和62/351,803、2016年8月17日提交的美国临时申请62/376,377、2016年10月19日提交的美国临时申请62/410,366、2016年12月9日提交的美国临时申请62/432,240、2017年3月15日提交的美国临时申请62/471,792和2017年4月12日提交的美国临时申请62/484,786的优先权。
参考2017年3月15日提交的美国临时申请62/471,710(题为“Novel Cas13BOrthologues CRISPR Enzymes and Systems[新颖的Cas13B直向同源物CRISPR酶及系统]”,代理人参考号:BI-10157VP 47627.04.2149)。进一步参考2016年12月9日提交的美国临时申请62/432,553、2017年2月8日提交的美国临时申请62/456,645和2017年3月15日提交的美国临时申请62/471,930(题为“CRISPR Effector System Based Diagnostics[基于CRISPR效应系统的诊断剂]”,代理人参考号BI-10121BROD 0842P)以及2017年4月12日提交的待转让的美国临时申请(题为“CRISPR Effector System Based Diagnostics[基于CRISPR效应系统的诊断剂]”,代理人参考号BI-10121BROD 0843P)。
在本文引用的文献中引用或参考的所有文献连同针对在本文中提及或通过引用并入本文中的任何文献中的任何产品的任何制造商的说明书、说明、产品规格以及产品表特此通过引用并入本文,并且可以在本发明的实践中采用。更具体地说,所有参考的文献均通过引用而并入,其程度如同每个单独的文献被确切地并单独地指明通过引用而并入。
关于联邦资助研究的声明
本发明是根据由美国国立卫生研究院(National Institutes of Health)授予的授权号MH100706和MH110049在美国政府支持下完成的。政府享有本发明的某些权利。
技术领域
本发明总体上涉及用于控制涉及序列靶向(如基因转录物微扰或核酸编辑)的基因表达的系统、方法和组合物,这些系统、方法和组合物可使用与规律间隔成簇短回文重复(CRISPR)及其组分有关的载体系统。
背景技术
基因组测序技术和分析方法的最新进展显著加速了对与范围广泛的生物功能和疾病相关联的遗传因子进行编目和映射的能力。精确的基因组靶向技术是通过允许个体遗传元件的选择性微扰而使得因果性遗传变化的系统性逆向工程化成为可能、以及推进合成生物学、生物技术应用和医学应用所需要的。虽然基因组编辑技术(如设计师锌指、转录活化子样效应因子(TALE)或归巢大范围核酸酶(homing meganuclease))对于产生靶向的基因组微扰是可用的,但是仍然需要采用新颖的策略和分子机制且是负担得起的、易于建立的、可扩展的、便于靶向真核基因组和转录组内的多个位置的新的基因组和转录组工程化技术。这将为基因组工程化和生物技术的新应用提供主要资源。
细菌和古细菌适应性免疫的CRISPR-Cas系统显示出蛋白质组成和基因组基因座结构的极端多样性。CRISPR-Cas系统基因座具有超过50个基因家族,并且不存在严格通用基因,这指示了基因座结构的快速进化和极端多样性。到目前为止,采用多管齐下的方法,对于93种Cas蛋白,存在约395种概况(profile)的全面cas基因鉴定。分类包括标签基因概况加基因座结构的标签。提出了CRISPR-Cas系统的新分类,其中这些系统大致分为两类,1类具有多亚基效应物复合物,并且2类具有由Cas9蛋白例示的单亚基效应物模块。与2类CRISPR-Cas系统相关联的新颖效应蛋白可以被开发为强大的基因组工程化工具,并且假定的新颖效应蛋白的预测及其工程化和优化是重要的。
CRISPR-Cas适应性免疫系统通过DNA或RNA-DNA干扰针对外来遗传元件防御微生物。最近,2类VI型单组分CRISPR-Cas效应物C2c2(Shmakov等人(2015)“Discovery andFunctional Characterization of Diverse Class 2CRISPR-Cas Systems[不同2类CRISPR-Cas系统的发现和功能表征]”;Molecular cell[分子细胞]60:1-13;doi:http://dx.doi.org/10.1016/j.molcel.2015.10.008)被表征为RNA指导的RNA酶(Abudayyeh等人(2016),Science[科学],[电子版先于印刷],6月2日;“C2c2is a single-componentprogrammable RNA-guided RNA-targeting CRISPR effector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物]”;doi:10.1126/science.aaf5573)。已证明C2c2(例如来自沙氏纤毛菌(Leptotrichia shahii))提供针对RNA噬菌体感染的稳健干扰。通过体外生化分析和体内测定,显示C2c2可以被编程成切割携带侧翼为3'H(非G)PAM的原型间隔子的ssRNA靶标。切割由C2c2的两个保守HEPN结构域中的催化残基介导,这些催化残基中的突变产生无催化活性的RNA结合蛋白。C2c2由单一指导物指导,并且可以被重新编程成在体内耗竭特定的mRNA。显示了LshC2c2可以被靶向感兴趣的特定位点,并且一旦用同源靶RNA引发就可以实现非特异性RNA酶活性。这些结果拓宽了我们对CRISPR-Cas系统的理解,并证明了利用C2c2开发广泛的RNA靶向工具的可能性。
C2c2现在称为Cas13a。应理解,本文的术语“C2c2”与“Cas13a”可互换使用。
本申请中引用或标识任何文献并非承认该文献可以作为本发明的现有技术获得。
发明内容
对于具有一系列广泛应用(特别是在真核系统中,更特别是在哺乳动物系统中)的靶向核酸或多核苷酸(例如DNA或RNA或其任何杂合体或衍生物)的替代性且稳健的系统和技术存在着迫切需要。本发明着手解决这种需要并且提供了相关优点。将本申请的新颖的RNA靶向系统添加到基因组学、转录组学和表观基因组学靶向技术的库中可以通过直接检测、分析和操作来转化该研究和特定靶位点的微扰或编辑,特别是在真核系统中,更特别是在哺乳动物系统(包括细胞、器官、组织或生物)和植物系统中。为了有效地利用本申请的RNA靶向系统进行RNA靶向而无有害作用,了解这些RNA靶向工具的工程化和优化的方面是至关重要的。
通过针对CRISPR系统的标签计算挖掘细菌基因组发现了CRISPR-Cas13家族(Shmakov,S.等人Discovery and Functional Characterization of Diverse Class2CRISPR-Cas Systems[不同2类CRISPR-Cas系统的发现和功能表征].Mol Cell[分子细胞]60,385-397,doi:10.1016/j.molcel.2015.10.008(2015)),揭示了单效应RNA指导的RNA酶Cas13a/C2c2(Abudayyeh,O.O.等人C2c2is a single-component programmable RNA-guided RNA-targeting CRISPR effector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物].Science[科学]353,aaf5573,doi:10.1126/science.aaf5573(2016))以及后来的单效应RNA指导的RNA酶Cas13b(Shmakov,S.等人Diversity and evolution ofclass 2CRISPR-Cas systems[2类CRISPR-Cas系统的多样性和进化].Nat Rev Microbiol[自然评论微生物学]15,169-182,doi:10.1038/nrmicro.2016.184(2017);Smargon,A.A.等人Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase DifferentiallyRegulated by Accessory Proteins Csx27and Csx28[Cas13b是由辅助蛋白Csx27和Csx28差异调节的VI-B型CRISPR相关的RNA指导的RNA酶].Mol Cell[分子细胞]65,618-630e617,doi:10.1016/j.molcel.2016.12.023(2017))。2类VI型效应蛋白C2c2(也称为Cas13a)是RNA指导的RNA酶,其可以被有效地编程成降解ssRNA。与CRISPR-Cas系统中发现的其他已知RNA酶的催化机制相反,C2c2(Cas13a)通过其两个HEPN结构域内的保守碱基残基实现RNA切割。在四个预测的HEPN结构域催化残基中的任何一个处,HEPN结构域的突变(如(例如丙氨酸)取代)将C2c2转化为无活性的可编程的RNA结合蛋白(dC2c2,类似于dCas9)。
RNA指导的RNA酶Cas13的可编程性和特异性将使其成为转录组操作的理想平台。申请人开发Cas13a用作哺乳动物转录物敲低和结合工具。来自沙氏纤毛菌的Cas13a(LshCas13a)能够使用可编程的crRNA进行稳健的RNA切割和与无催化活性形式的结合,并且该切割依赖于直接3'相邻基序,称为具有同一性H(不是鸟嘌呤)的原型间隔子侧翼位点(PFS)(Abudayyeh,O.O.等人C2c2is a single-component programmable RNA-guidedRNA-targeting CRISPR effector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物].Science[科学]353,aaf5573,doi:10.1126/science.aaf5573(2016))。在RNA切割后,活化的LshCas13a参与“附带活性(collateral activity)”,其中组成型RNA酶活性切割非靶向RNA(Abudayyeh,O.O.等人C2c2is a single-component programmable RNA-guidedRNA-targeting CRISPR effector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物].Science[科学]353,aaf5573,doi:10.1126/science.aaf5573(2016))。这种crRNA编程的附带活性使得能够实现细菌体内程序性细胞死亡以防止感染扩散(Abudayyeh,O.O.等人C2c2is a single-component programmable RNA-guided RNA-targeting CRISPReffector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物].Science[科学]353,aaf5573,doi:10.1126/science.aaf5573(2016))并且已经体外应用于核酸的特异性检测(Abudayyeh,O.O.等人C2c2is a single-component programmable RNA-guided RNA-targeting CRISPR effector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物].Science[科学]353,aaf5573,doi:10.1126/science.aaf5573(2016);East-Seletsky,A.等人Two distinct RNase activities of CRISPR-C2c2enable guide-RNA processingand RNA detection[CRISPR-C2c2的两种不同的RNA酶活性使得指导RNA加工和RNA检测成为可能].Nature[自然]538,270-273,doi:10.1038/nature19802(2016))。最近利用附带活性用于称为SHERLOCK的高灵敏度和特异性核酸检测平台,其可用于许多临床诊断(Gootenberg,J.S.等人Nucleic acid detection with CRISPR-Cas13a/C2c2[用CRISPR-Cas13a/C2c2进行核酸检测].Science[科学]356,438-442(2017))。
通过在细菌和随后的生物化学表征中筛选Cas13a直向同源物,申请人选择针对RNA内切核酸酶活性优化的直向同源物,即来自韦德纤毛菌(Leptotrichia wadeii)的Cas13a(LwaCas13a)。LwaCas13a可以在哺乳动物细胞中稳定表达,重新靶向以有效地敲低细胞中的报告基因和内源转录物,并且与没有可观察到的附带活性的RNAi相比达到高水平的靶向特异性水平。此外,申请人表明,无催化活性的LwaCas13a(dCas13a)体内可编程地结合RNA转录物,并可用于成像细胞中的转录物。通过工程化基于dCas13a的负反馈成像系统,可以在活细胞中追踪应激颗粒的形成。
dC2c2(dCas13a)与指定序列结合的能力可用于根据本发明的若干方面以:(i)将效应物模块带到特定转录物以调节功能或翻译,其可用于大规模筛选、构建合成调节电路和其他目的;(ii)对特定RNA加荧光标签以可视化其运输和/或定位;(iii)通过对特定亚细胞区室具有亲和力的结构域改变RNA定位;以及(iv)捕获特定转录物(通过直接下拉dC2c2或使用dC2c2将生物素连接酶活性定位至特定转录物)以富集近端分子配偶体,包括RNA和蛋白质。
活性C2c2也应该有很多应用。本发明的一个方面涉及靶向特定转录物以进行破坏,在此处与RFP一样。此外,C2c2一旦被同源靶标引发就可以在体外切割其他(非互补的)RNA分子并且可以抑制体内细胞生长。在生物学上,这种混杂的RNA酶活性可能反映了VI型CRISPR-Cas系统的基于程序性细胞死亡/休眠(PCD/D)的保护机制。因此,在本发明的一个方面,它可以用于触发特定细胞(例如,表达具体转录物的癌细胞、给定类别的神经元、被特定病原体感染的细胞、或其他异常细胞或原本不希望存在的细胞)中的PCD或休眠。
本发明提供了一种修饰与感兴趣的靶基因座相关联或该感兴趣的靶基因座处的核酸序列的方法,特别是在真核细胞、组织、器官或生物中,更特别是在哺乳动物细胞、组织、器官或生物中,该方法包括向所述基因座递送非天然存在的或工程化的组合物,该组合物包含VI型CRISPR-Cas基因座效应蛋白和一种或多种核酸组分,其中该效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与该感兴趣的基因座结合时,该效应蛋白诱导与该感兴趣的靶基因座相关联或该感兴趣的靶基因座处的序列的修饰。在一个优选的实施例中,该修饰是引入链断裂。在一个优选的实施例中,与该感兴趣的靶基因座相关联或在该感兴趣的靶基因座处的序列包含RNA,并且该效应蛋白由VI型CRISPR-Cas基因座编码。该复合物可以在体外或离体形成,并引入细胞中或与RNA接触;或者可以在体内形成。
应当理解的是,术语Cas酶、CRISPR酶、CRISPR蛋白、Cas蛋白和CRISPR Cas通常可互换地使用,并且在本文的所有参考点同样是指本申请中进一步描述的新颖的CRISPR效应蛋白,除非另外显而易见的,如具体参考Cas9。本文描述的CRISPR效应蛋白优选为C2c2效应蛋白。
本发明提供了一种靶向(如修饰)与感兴趣的靶基因座相关联或该感兴趣的靶基因座处的序列的方法,该方法包括向所述与该基因座相关联或该基因座处的序列递送非天然存在的或工程化的组合物,该组合物包含C2c2基因座效应蛋白(其可以是有催化活性的,或者可替代地是无催化活性的)和一种或多种核酸组分,其中该C2c2效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与该感兴趣的基因座结合时,该效应蛋白诱导与该感兴趣的靶基因座相关联或该感兴趣的靶基因座处的序列的修饰。在一个优选的实施例中,该修饰是引入链断裂。在一个优选的实施例中,该C2c2效应蛋白与一种核酸组分形成复合物;该核酸组分有利地是工程化的或非天然存在的核酸组分。该复合物可以在体外或离体形成,并引入细胞中或与RNA接触;或者可以在体内形成。诱导与该感兴趣的靶基因座相关联或在该感兴趣的靶基因座处的序列的修饰可以是C2c2效应蛋白-核酸指导的。在一个优选的实施例中,该种核酸组分是CRISPR RNA(crRNA)。在一个优选的实施例中,该种核酸组分是成熟crRNA或指导RNA,其中该成熟crRNA或指导RNA包含间隔子序列(或指导序列)和同向重复序列或其衍生物。在一个优选的实施例中,该间隔子序列或其衍生物包含种子序列,其中该种子序列对于在该靶基因座处的序列的识别和/或与该序列的杂交是至关重要的。
本发明的方面涉及具有一种或多种非天然存在的或工程化的或经修饰的或经优化的核酸组分的C2c2效应蛋白复合物。在一个优选的实施例中,该复合物的核酸组分可以包含与同向重复序列连接的指导序列,其中该同向重复序列包含一个或多个茎环或经优化的二级结构。在某些实施例中,该同向重复具有16nt(如至少28nt)的最小长度和单个茎环。在另外的实施例中,该同向重复具有长于16nt、优选多于17nt、如至少28nt的长度,并且具有多于一个茎环或经优化的二级结构。在具体的实施例中,该同向重复具有25或更多nt,如26nt、27nt、28nt或更多,以及一个或多个茎环结构。在一个优选的实施例中,可以对该同向重复进行修饰以包含一种或多种蛋白质结合RNA适体。在一个优选的实施例中,可以包括一种或多种适体,如经优化的二级结构的一部分。此类适体可能能够结合噬菌体外壳蛋白。该噬菌体外壳蛋白可以选自包括以下的组:Qβ、F2、GA、fr、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s以及PRR1。在一个优选的实施例中,该噬菌体外壳蛋白是MS2。本发明还提供了该复合物的核酸组分,该核酸组分在长度上为30个或更多个、40个或更多个或50个或更多个核苷酸。
本发明提供了包含VI型效应蛋白和/或指导物和/或其与靶核酸的复合物的细胞。在某些实施例中,该细胞是真核细胞,包括但不限于酵母细胞、植物细胞、哺乳动物细胞、动物细胞或人细胞。
本发明还提供了一种修饰感兴趣的靶基因座的方法,特别是在真核细胞、组织、器官或生物中,更特别是在哺乳动物细胞、组织、器官或生物中,该方法包括向所述基因座递送非天然存在的或工程化的组合物,该组合物包含C2c2基因座效应蛋白和一种或多种核酸组分,其中该C2c2效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与该感兴趣的基因座结合时,该效应蛋白诱导该感兴趣的靶基因座的修饰。在一个优选的实施例中,该修饰是引入链断裂。该复合物可以在体外或离体形成,并引入细胞中或与RNA接触;或者可以在体内形成。
在此类方法中,该感兴趣的靶基因座可以被包含在RNA分子内。而且,该感兴趣的靶基因座可以被包含在DNA分子内,并且在某些实施例中,可以被包含在经转录的DNA分子内。在此类方法中,该感兴趣的靶基因座可以被包含在体外的核苷酸分子中。
在此类方法中,该感兴趣的靶基因座可以被包含在细胞(特别是真核细胞,如哺乳动物细胞或植物细胞)内的核酸分子中。该哺乳动物细胞可以是非人类灵长动物、牛、猪、啮齿动物或小鼠细胞。该细胞可以是非哺乳动物真核细胞,如家禽、鱼或虾细胞。该植物细胞可以属于作物植物(如木薯、玉米、高粱、小麦或水稻)。该植物细胞还可以属于藻类、树木或蔬菜。通过本发明引入到细胞中的修饰可以使得细胞和细胞子代被改变以便改进生物制品(如抗体、淀粉、醇或其他所希望的细胞产出)的生产。通过本发明引入到细胞中的修饰可以使得细胞和细胞子代包括改变所生产的生物制品的变化。
该哺乳动物细胞可以是非人类哺乳动物(例如灵长动物、牛、绵羊、猪、犬、啮齿动物、兔科,如猴、牛、绵羊、猪、狗、兔、大鼠或小鼠)细胞。该细胞可以是非哺乳动物真核细胞,如禽鸟(例如,鸡)、脊椎鱼类(例如,鲑鱼)或贝类(例如,牡蛎、蛤蜊、龙虾、虾)细胞。该细胞还可以是植物细胞。该植物细胞可以属于单子叶植物或双子叶植物或者属于作物或谷物植物,如木薯、玉米、高粱、大豆、小麦、燕麦或水稻。该植物细胞还可以属于藻类、树木或生产植物、水果或蔬菜(例如,树木,如柑橘树,例如橙树、葡萄柚树或柠檬树;桃树或油桃树;苹果树或梨树;坚果树,如杏仁树或胡桃树或阿月浑子树;茄属植物;芸薹属的植物;莴苣属的植物;菠菜属的植物;辣椒属的植物;棉花、烟草、芦笋、胡萝卜、卷心菜、西兰花、花椰菜、番茄、茄子、胡椒、莴苣、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等)。
本发明提供了一种修饰感兴趣的靶基因座的方法,该方法包括向所述基因座递送非天然存在的或工程化的组合物,该组合物包含VI型CRISPR-Cas基因座效应蛋白和一种或多种核酸组分,其中该效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与该感兴趣的基因座结合时,该效应蛋白诱导该感兴趣的靶基因座的修饰。在一个优选的实施例中,该修饰是引入链断裂。
本发明还提供了一种修饰感兴趣的靶基因座的方法,该方法包括向所述基因座递送非天然存在的或工程化的组合物,该组合物包含C2c2基因座效应蛋白和一种或多种核酸组分,其中该C2c2效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与该感兴趣的基因座结合时,该效应蛋白诱导该感兴趣的靶基因座的修饰。在一个优选的实施例中,该修饰是引入链断裂。
在此类方法中,该感兴趣的靶基因座可以被包含在体外的核苷酸分子中。在此类方法中,该感兴趣的靶基因座可以被包含在细胞内的核酸分子中。优选地,在此类方法中,该感兴趣的靶基因座可以被包含在体外的RNA分子中。还优选地,在此类方法中,该感兴趣的靶基因座可以被包含在细胞内的RNA分子中。该细胞可以是原核细胞或真核细胞。该细胞可以是哺乳动物细胞。该细胞可以是啮齿动物细胞。该细胞可以是小鼠细胞。
在所描述的任何方法中,该感兴趣的靶基因座可以是感兴趣的基因组或表观基因组基因座。在所描述的任何方法中,该复合物可以与多种指导物一起递送用于多重(multiplexed)用途。在所描述的任何方法中,可以使用多于一种的蛋白质。
在本发明的另外的方面,这些核酸组分可以包含CRISPR RNA(crRNA)序列。没有限制,申请人假设在此类情况下,前crRNA可以包含足够用于加工以产生成熟crRNA以及使crRNA加载到效应蛋白上的二级结构。通过举例而非限制的方式,这种二级结构可以包含前crRNA内的、更具体地说在同向重复内的茎环,基本上由其组成,或由其组成。
在所描述的任何方法中,该效应蛋白和核酸组分可以经由编码该蛋白质和/或一种或多种核酸组分的一种或多种多核苷酸分子提供,并且其中该一种或多种多核苷酸分子可操作地配置成表达该蛋白质和/或该一种或多种核酸组分。该一种或多种多核苷酸分子可以包含一种或多种可操作地配置成表达该蛋白质和/或该一种或多种核酸组分的调节元件。该一种或多种多核苷酸分子可以被包含在一种或多种载体内。在所描述的任何方法中,该感兴趣的靶基因座可以是感兴趣的基因组或表观基因组基因座。在所描述的任何方法中,该复合物可以与多种指导物一起递送用于多重用途。在所描述的任何方法中,可以使用多于一种的蛋白质。
调节元件可以包含诱导型启动子。多核苷酸和/或载体系统可以包含诱导型系统。
在所描述的任何方法中,该一种或多种多核苷酸分子可以被包含在递送系统中,或者该一种或多种载体可以被包含在递送系统中。
在所描述的任何方法中,该非天然存在的或工程化的组合物可以经由脂质体、粒子(包括纳米粒子)、外泌体、微泡、基因枪或一种或多种病毒载体递送。
本发明还提供了一种非天然存在的或工程化的组合物,该组合物是具有如本文讨论的或本文描述的任何方法中定义的特征的组合物。
因此,在某些实施例中,本发明提供了一种非天然存在的或工程化的组合物,例如特别是能够或被配置成修饰感兴趣的靶基因座的组合物,所述组合物包含VI型CRISPR-Cas基因座效应蛋白和一种或多种核酸组分,其中该效应蛋白与该一种或多种核酸组分形成复合物,并且在所述复合物与该感兴趣的基因座结合时,该效应蛋白诱导该感兴趣的靶基因座的修饰。在某些实施例中,该效应蛋白可以是C2c2基因座效应蛋白。
在又一个方面,本发明还提供了一种非天然存在的或工程化的组合物,例如特别是能够或被配置成修饰感兴趣的靶基因座的组合物,所述组合物包含:(a)指导RNA分子(或指导RNA分子的组合,例如第一指导RNA分子和第二指导RNA分子,如用于多重化)或编码该指导RNA分子的核酸(或编码该指导RNA分子的组合的一种或多种核酸);(b)VI型CRISPR-Cas基因座效应蛋白或编码该VI型CRISPR-Cas基因座效应蛋白的核酸。在某些实施例中,该效应蛋白可以是C2c2基因座效应蛋白。
在又一个方面,本发明还提供了一种非天然存在的或工程化的组合物,该组合物包含:(a)指导RNA分子(或指导RNA分子的组合,例如第一指导RNA分子和第二指导RNA分子)或编码该指导RNA分子的核酸(或编码该指导RNA分子的组合的一种或多种核酸);(b)C2c2基因座效应蛋白。
本发明还提供了包含一种或多种载体的载体系统,该一种或多种载体包含编码非天然存在的或工程化的组合物的组分的一种或多种多核苷酸分子,该组合物是具有如本文描述的任何方法中所定义的特征的组合物。
本发明还提供了包含一种或多种载体或一种或多种多核苷酸分子的递送系统,该一种或多种载体或多核苷酸分子包含编码非天然存在的或工程化的组合物的组分的一种或多种多核苷酸分子,该组合物是具有本文讨论的或如本文描述的任何方法中所定义的特征的组合物。
本发明还提供了用于在治疗性治疗方法中使用的非天然存在的或工程化的组合物、或编码所述组合物的组分的一种或多种多核苷酸、或包含编码所述组合物的组分的一种或多种多核苷酸的载体或递送系统。该治疗性治疗方法可以包括基因或转录组编辑、或基因治疗。
本发明还提供了其中效应蛋白(例如工程化的或非天然存在的效应蛋白或C2c2)的一个或多个氨基酸残基可以被修饰的方法和组合物。在一个实施例中,该修饰可以包含效应蛋白的一个或多个氨基酸残基的突变。该一个或多个突变可以位于效应蛋白的一个或多个催化活性结构域中。与缺乏所述一个或多个突变的效应蛋白相比,该效应蛋白可以具有降低或消除的核酸酶活性。该效应蛋白可以不指导该感兴趣的靶基因座处的RNA链的切割。在一个优选的实施例中,该一个或多个突变可以包含两个突变。在一个优选的实施例中,该一个或多个氨基酸残基在C2c2效应蛋白(例如工程化的或非天然存在的效应蛋白或C2c2)中被修饰。在具体的实施例中,该一个或多个经修饰的或经突变的氨基酸残基是C2c2中对应于如下的那些中的一个或多个:R597、H602、R1278和H1283(参考Lsh C2c2氨基酸),如突变R597A、H602A、R1278A和H1283A,或Lsh C2c2直向同源物中对应的氨基酸残基。
在具体的实施例中,该一个或多个经修饰的或经突变的氨基酸残基是C2c2中对应于如下的那些中的一个或多个:K2、K39、V40、E479、L514、V518、N524、G534、K535、E580、L597、V602、D630、F676、L709、I713、R717(HEPN)、N718、H722(HEPN)、E773、P823、V828、I879、Y880、F884、Y997、L1001、F1009、L1013、Y1093、L1099、L1111、Y1114、L1203、D1222、Y1244、L1250、L1253、K1261、I1334、L1355、L1359、R1362、Y1366、E1371、R1372、D1373、R1509(HEPN)、H1514(HEPN)、Y1543、D1544、K1546、K1548、V1551、I1558,根据C2c2共有编号。在某些实施例中,该一个或多个经修饰的或经突变的氨基酸残基是C2c2中对应于如下的那些中的一个或多个:R717和R1509。在某些实施例中,该一个或多个经修饰的或经突变的氨基酸残基是C2c2中对应于如下的那些中的一个或多个:K2、K39、K535、K1261、R1362、R1372、K1546和K1548。在某些实施例中,所述突变导致蛋白质具有改变或经修饰的活性。在某些实施例中,所述突变导致蛋白质具有增加的活性,如增加的特异性。在某些实施例中,所述突变导致蛋白质具有降低的活性,如降低的特异性。在某些实施例中,所述突变导致蛋白质不具有催化活性(即“失活”C2c2)。在一个实施例中,所述氨基酸残基对应于Lsh C2c2氨基酸残基、或来自不同物种的C2c2蛋白的相应氨基酸残基。
在某些实施例中,该一个或多个经修饰的或经突变的氨基酸残基是C2c2中对应于如下的那些中的一个或多个:M35、K36、T38、K39、I57、E65、G66、L68、N84、T86、E88、I103、N105、E123、R128、R129、K139、L152、L194、N196、K198、N201、Y222、D253、I266、F267、S280、I303、N306、R331、Y338、K389、Y390、K391、I434、K435、L458、D459、E462、L463、I478、E479、K494、R495、N498、S501、E519、N524、Y529、V530、G534、K535、Y539、T549、D551、R577、E580、A581、F582、I587、A593、L597、I601、L602、E611、E613、D630、I631、G633、K641、N646、V669、F676、S678、N695、E703、A707、I709、I713、I716、R717、H722、F740、F742、K768、I774、K778、I783、L787、S789、V792、Y796、D799、F812、N818、P820、F821、V822、P823、S824、F825、Y829、K831、D837、L852、F858、E867、A871、L875、K877、Y880、Y881、F884、F888、F896、N901、V903、N915、K916、R918、Q920、E951、P956、Y959、Q964、I969、N994、F1000、I10001、Q1003、F10005、K1007、G1008、F1009、N1019、L1020、K1021、I1023、N1028、E1070、I1075、K1076、F1092、K1097、L1099、L1104、L1107、K1113、Y1114、E1149、E1151、I1153、L1155、L1158、D1166、L1203、D1222、G1224、I1228、R1236、K1243、Y1244、G1245、D1255、K1261、S1263、L1267、E1269、K1274、I1277、E1278、L1289、H1290、A1294、N1320、K1325、E1327、Y1328、I1334、Y1337、K1341、N1342、K1343、N1350、L1352、L1355、L1356、I1359、L1360、R1362、V1363、G1364、Y1365、I1369、R1371、D1372、F1385、E1391、D1459、K1463、K1466、R1509、N1510、I1512、A1513、H1514、N1516、Y1517、L1529、L1530、E1534、L1536、R1537、Y1543、D1544、R1545、K1546、L1547、K1548、N1549、A1550、K1553、S1554、D1557、I1558、L1559、G1563、F1568、I1612、L1651、E1652、K1655、H1658、L1659、K1663、T1673、S1677、E1678、E1679、C1681、V1684、K1685、E1689,参考如图3所示的共有序列,即基于韦德纤毛菌F0279(“Lew2”或“Lw2”)和纽约李斯特菌(Listeria newyorkensis)FSL M6-0635(也称为李斯特菌科细菌FSL M6-0635(“Lib”或“LbFSL”))的比对。如前所述,在某些实施例中,在上述氨基酸残基列表中,排除了对应于R597、H602、R1278和H1283(参考Lsh C2c2氨基酸)的残基。
在某些实施例中,该一个或多个经修饰的或经突变的氨基酸残基是一个或多个保守的带电荷氨基酸残基。在某些实施例中,所述氨基酸残基可以突变为丙氨酸。
在某些实施例中,该一个或多个经修饰的或经突变的氨基酸残基是C2c2中对应于如下的那些中的一个或多个:K28、K31、R44、E162、E184、K262、E288、K357、E360、K338、R441(HEPN)、H446(HEPN)、E471、K482、K525、K558、D707、R790、K811、R833、E839、R885、E894、R895、D896、K942、R960(HEPN)、H965(HEPN)、D990、K992、K994,参考如图2中所示的共有序列,即基于如图1中所示的C2c2直向同源物的比对。如前所述,在某些实施例中,在上述氨基酸残基列表中,排除了对应于R597、H602、R1278和H1283(参考Lsh C2c2氨基酸)的残基。
本发明还提供了位于效应蛋白的催化活性结构域中的一个或多个突变或者两个或更多个突变。在某些实施例中,该一个或多个突变或者该两个或更多个突变可以位于效应蛋白的催化活性结构域中,该效应蛋白包含HEPN结构域或与HEPN结构域同源的催化活性结构域。该效应蛋白可以包含一个或多个异源功能结构域。该一个或多个异源功能结构域可以包含一个或多个核定位信号(NLS)结构域。该一个或多个异源功能结构域可以包含至少两个或更多个NLS结构域。该一个或多个NLS结构域可以被定位在效应蛋白(例如,C2c2)的末端、或其附近或与其邻近,并且如果是两个或更多个NLS,两个中的每一个可以被定位在效应蛋白(例如,C2c2)的末端、或其附近或与其邻近。该一个或多个异源功能结构域可以包含一个或多个翻译活化结构域。在其他实施例中,该功能结构域可以包含转录活化结构域,例如VP64。该一个或多个异源功能结构域可以包含一个或多个转录阻遏结构域。在某些实施例中,该转录阻遏结构域包含KRAB结构域或SID结构域(例如SID4X)。该一个或多个异源功能结构域可以包含一个或多个核酸酶结构域。在一个优选的实施例中,核酸酶结构域包含Fok1。
本发明还提供了具有一种或多种以下活性的一种或多种异源功能结构域:甲基化酶活性、脱甲基化酶活性、翻译活化活性、翻译阻遏活性、转录活化活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、单链RNA切割活性、双链RNA切割活性、单链DNA切割活性、双链DNA切割活性和核酸结合活性。在本发明的某些实施例中,该一个或多个异源功能结构域可以包含表位标签或报告分子。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感病毒血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报告分子的实例包括但不限于谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、以及包括蓝色荧光蛋白(BFP)的自发荧光蛋白。
至少一个或多个异源功能结构域可以位于效应蛋白的氨基末端处或其附近,和/或其中至少一个或多个异源功能结构域位于效应蛋白的羧基末端处或其附近。该一个或多个异源功能结构域可以与效应蛋白融合。该一个或多个异源功能结构域可以拴系至效应蛋白。该一个或多个异源功能结构域可以通过接头部分连接至效应蛋白。
本发明还提供了以下效应蛋白,包含来自如下属的生物的效应蛋白,该属包括链球菌属(Streptococcus)、弯曲杆菌属(Campylobacter)、Nitratifractor、葡萄球菌属(Staphylococcus)、细小棒菌属(Parvibaculum)、罗氏菌属(Roseburia)、奈瑟菌属(Neisseria)、葡糖醋杆菌属(Gluconacetobacter)、固氮螺菌属(Azospirillum)、Sphaerochaeta、乳杆菌属(Lactobacillus)、真杆菌属(Eubacterium)、棒状杆菌属(Corynebacter)、肉杆菌属(Carnobacterium)、红细菌属(Rhodobacter)、李斯特菌属(Listeria)、沼杆菌属(Paludibacter)、梭菌属(Clostridium)、毛螺菌科(Lachnospiraceae)、Clostridiaridium、纤毛菌属(Leptotrichia)、弗朗西丝菌属(Francisella)、军团菌属(Legionella)、脂环酸芽孢杆菌属(Alicyclobacillus)、Methanomethyophilus、卟啉单胞菌属(Porphyromonas)、普雷沃菌属(Prevotella)、拟杆菌门(Bacteroidetes)、创伤球菌属(Helcococcus)、钩端螺旋体属(Letospira)、脱硫弧菌属(Desulfovibrio)、脱硫弯曲杆菌属(Desulfonatronum)、丰祐菌科(Opitutaceae)、肿块芽孢杆菌属(Tuberibacillus)、芽孢杆菌属(Bacillus)、短芽孢杆菌属(Brevibacilus)、甲基杆菌属(Methylobacterium)或氨基酸球菌属(Acidaminococcus)。该效应蛋白可以包含嵌合效应蛋白,该嵌合效应蛋白包含来自第一效应蛋白直向同源物的第一片段和来自第二效应蛋白直向同源物的第二片段,并且其中该第一和第二效应蛋白直向同源物不同。该第一和第二效应蛋白直向同源物中的至少一种可以包含来自包括以下的生物的效应蛋白:链球菌属、弯曲杆菌属、Nitratifractor、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳杆菌属、真杆菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、沼杆菌属、梭菌属、毛螺菌科、Clostridiaridium、纤毛菌属、弗朗西丝菌属、军团菌属、脂环酸芽孢杆菌属、Methanomethyophilus、卟啉单胞菌属、普雷沃菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫弯曲杆菌属、丰祐菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属。
在某些实施例中,该效应蛋白(特别是VI型基因座效应蛋白,更特别是C2c2p)可以源自、可以分离自或可以衍生自属于分类群α-变形菌纲、芽孢杆菌纲、梭菌纲、梭杆菌纲和拟杆菌纲的细菌物种。在某些实施例中,该效应蛋白(特别是VI型基因座效应蛋白,更特别是C2c2p)可以源自、可以分离自或可以衍生自属于选自下组的属的细菌物种,该组由以下组成:毛螺菌科、梭菌属、肉杆菌属、沼杆菌属、李斯特菌属、纤毛菌属和红细菌属。在某些实施例中,该效应蛋白(特别是VI型基因座效应蛋白,更特别是C2c2p)可以源自、可以分离自或可以衍生自选自下组的细菌物种,该组由以下组成:毛螺菌科细菌MA2020、毛螺菌科细菌NK4A179、嗜氨基梭菌(Clostridium aminophilum)(例如,DSM 10710)、毛螺菌科细菌NK4A144、鸡肉杆菌(Carnobacterium gallinarum)(例如,DSM 4847菌株MT44)、产丙酸沼杆菌(Paludibacter propionicigenes)(例如,WB4)、塞氏李斯特菌(Listeria seeligeri)(例如,血清变型1/2b菌株SLCC3954)、威氏李斯特菌(Listeria weihenstephanensis)(例如,FSL R9-0317c4)、纽约李斯特菌(例如,菌株FSL M6-0635:也即“LbFSL”)、韦德纤毛菌(例如,F0279:也即“Lw”或“Lw2”)、口腔纤毛菌(Leptotrichia buccalis)(例如,DSM1135)、纤毛菌属物种口腔分类群225(例如,菌株F0581)、纤毛菌属物种口腔分类群879(例如,菌株F0557)、沙氏纤毛菌(例如,DSM 19757)、荚膜红细菌(Rhodobacter capsulatus)(例如,SB 1003、R121或DE442)。在某些优选实施例中,该C2c2效应蛋白源自李斯特菌科细菌(例如FSL M6-0635:也即“LbFSL”)、毛螺菌科细菌MA2020、毛螺菌科细菌NK4A179、嗜氨基梭菌(例如,DSM 10710)、鸡肉杆菌(例如,DSM 4847)、产丙酸沼杆菌(例如,WB4),塞氏李斯特菌(例如,血清变型1/2b菌株SLCC3954)、威氏李斯特菌(例如,FSL R9-0317c4)、韦德纤毛菌(例如,F0279:也即“Lw”或“Lw2”)、沙氏纤毛菌(例如,DSM 19757)、荚膜红细菌(例如,SB1003、R121或DE442);优选李斯特菌科细菌FSL M6-0635(即纽约李斯特菌FSL M6-0635:图4-7中的“LbFSL”)或韦德纤毛菌F0279(也即“Lw”或“Lw2”)。
在某些实施例中,如本文所预期的VI型基因座可以编码Cas1、Cas2和C2c2p效应蛋白。
在某些实施例中,该效应蛋白(特别是VI型基因座效应蛋白,更特别是C2c2p,如天然C2c2p)可以是约1000至约1500个氨基酸长,如约1100至约1400个氨基酸长,例如约1000至约1100、约1100至约1200个氨基酸长、或约1200至约1300个氨基酸长、或约1300至约1400个氨基酸长、或约1400至约1500个氨基酸长,例如约1000、约1100、约1200、约1300、约1400或约1500个氨基酸长。
在某些实施例中,该效应蛋白(特别是VI型基因座效应蛋白,更特别是C2c2p)包含至少一个、优选至少两个、如更优选恰好两个保守的RxxxxH基序。催化RxxxxH基序是HEPN(高等真核生物和原核生物核苷酸结合)结构域特有的。因此,在某些实施例中,该效应蛋白(特别是VI型基因座效应蛋白,更特别是C2c2p)包含至少一个、优选至少两个、如更优选恰好两个HEPN结构域。在某些实施例中,这些HEPN结构域可以具有RNA酶活性。在其他实施例中,这些HEPN结构域可以具有DNA酶活性。
在某些实施例中,如本文所预期的VI型基因座可以包含30和40bp之间长、更典型地35和39bp之间长(例如30、31、32、33、34、35、36、37、38、39或40bp长)的CRISPR重复。在具体的实施例中,该同向重复至少25nt长。
在某些实施例中,原型间隔子邻近基序(PAM)或PAM样基序指导如本文公开的效应蛋白复合物与该感兴趣的靶基因座的结合。在一些实施例中,该PAM可以是5'PAM(即,位于原型间隔子的5'末端的上游)。在其他实施例中,该PAM可以是3'PAM(即,位于原型间隔子的5'末端的下游)。术语“PAM”可与术语“PFS”或“原型间隔子侧翼位点”或“原型间隔子侧翼序列”互换使用。
在一个优选的实施例中,该效应蛋白(特别是VI型基因座效应蛋白,更特别是C2c2p)可以识别3'PAM。在某些实施例中,该效应蛋白(特别是VI型基因座效应蛋白,更特别是C2c2p)可以识别3'PAM,其为5'H,其中H是A、C或U。在某些实施例中,该效应蛋白可以是沙氏纤毛菌C2c2p、更优选沙氏纤毛菌DSM 19757 C2c2,并且该5'PAM是5'H。在某些实施例中,该效应蛋白可以是韦德纤毛菌F0279(Lw2)C2c2,并且该5'PAM是H,其中H是C、U或A。
在某些实施例中,该CRISPR酶被工程化并且可以包含一个或多个降低或消除核酸酶活性的突变。也可以在邻近残基处进行突变,例如在如上指示的参与核酸酶活性的那些氨基酸附近进行突变。在一些实施例中,仅一个HEPN结构域失活,而在其他实施例中,第二HEPN结构域失活。
在本发明的某些实施例中,该指导RNA或成熟crRNA包含同向重复序列和指导序列或间隔子序列,基本上由其组成,或由其组成。在某些实施例中,该指导RNA或成熟crRNA包含连接至指导序列或间隔子序列的同向重复序列,基本上由其组成,或由其组成。在某些实施例中,该指导RNA或成熟crRNA包含19nt的部分同向重复,随后是18、19、20、21、22、23、24、25或更多nt的指导序列,如18-25、19-25、20-25、21-25、22-25或23-25nt的指导序列或间隔子序列。在某些实施例中,该效应蛋白是C2c2效应蛋白,并且需要至少16nt的指导序列来实现可检测的DNA切割以及最少17nt的指导序列来实现有效的体外DNA切割。在具体的实施例中,该效应蛋白是C2c2蛋白,并且需要至少19nt的指导序列来实现可检测的RNA切割。在某些实施例中,该同向重复序列位于该指导序列或间隔子序列的上游(即,5')。在一个优选的实施例中,该C2c2指导RNA的种子序列(即,对于识别和/或杂交到靶基因座处的序列而言必需、关键的序列)大约在该指导序列或间隔子序列的5'端上的前5nt内。
在本发明的优选实施例中,该成熟crRNA包含茎环或经优化的茎环结构或经优化的二级结构。在优选实施例中,该成熟crRNA在同向重复序列中包含茎环或经优化的茎环结构,其中该茎环或经优化的茎环结构对于切割活性是重要的。在某些实施例中,该成熟crRNA优选包含单茎环。在某些实施例中,该同向重复序列优选包含单茎环。在某些实施例中,通过引入影响茎环RNA双链体结构的突变来修饰该效应蛋白复合物的切割活性。在优选实施例中,可以引入维持茎环的RNA双链体的突变,由此维持该效应蛋白复合物的切割活性。在其他优选实施例中,可以引入破坏茎环的RNA双链体结构的突变,由此完全消除该效应蛋白复合物的切割活性。
在具体的实施例中,该C2c2蛋白是Lsh C2c2效应蛋白,并且该成熟crRNA包含茎环或经优化的茎环结构。在具体的实施例中,该crRNA的同向重复包含含有茎环的至少25个核苷酸。在具体的实施例中,该茎适合于单个碱基互换,但活性被crRNA的大多数二级结构变化或截短所破坏。破坏突变的实例包括交换多于两个茎核苷酸,在茎中添加非配对核苷酸,缩短茎(通过去除配对核苷酸中的一个)或延伸茎(通过添加一组配对核苷酸)。然而,该crRNA可以适合于5'和/或3'延伸,以包括如针对本文所述的特定应用所设想的非功能性RNA序列。
本发明还提供了编码在本文描述的任何方法或组合物中的效应蛋白的核苷酸序列,该效应蛋白针对在真核生物或真核细胞中表达进行密码子优化。在本发明的一个实施例中,编码该效应蛋白的经密码子优化的核苷酸序列编码本文讨论的任何C2c2,并且针对在真核细胞或生物(例如在本文其他地方提及的细胞或生物,例如但不限于酵母细胞或哺乳动物细胞或生物(包括小鼠细胞、大鼠细胞和人细胞或非人类真核生物(例如植物)))中的可操作性进行密码子优化。
在本发明的某些实施例中,至少一个核定位信号(NLS)附接到编码C2c2效应蛋白的核酸序列。在优选实施例中,至少一个或多个C-末端或N-末端NLS被附接(并且因此编码C2c2效应蛋白的一种或多种核酸分子可以包括对一个或多个NLS的编码,这样使得表达产物的一个或多个NLS被附接或连接)。在本发明的某些实施例中,至少一个核输出信号(NES)附接到编码C2c2效应蛋白的核酸序列。在优选实施例中,至少一个或多个C-末端或N-末端NES被附接(并且因此编码C2c2效应蛋白的一种或多种核酸分子可以包括对一个或多个NES的编码,这样使得表达产物的一个或多个NES被附接或连接)。在一个优选的实施例中,C-末端和/或N-末端NLS或NES被附接,用于在真核细胞(优选人细胞)中进行最佳表达和核靶向。在一个优选的实施例中,经密码子优化的效应蛋白是C2c2,并且该指导RNA的间隔子长度是从15至35nt。在某些实施例中,该指导RNA的间隔子长度为至少16个核苷酸,如至少17个核苷酸,优选至少18nt,如优选至少19nt、至少20nt、至少21nt、或至少22nt。在某些实施例中,间隔子长度是从15至17nt、从17至20nt、从20至24nt(例如20、21、22、23或24nt)、从23至25nt(例如23、24或25nt)、从24至27nt、从27-30nt、从30-35nt、或35nt或更长。在本发明的某些实施例中,经密码子优化的效应蛋白是C2c2,并且该指导RNA的同向重复长度是至少16个核苷酸。在某些实施例中,经密码子优化的效应蛋白是C2c2,并且该指导RNA的同向重复长度是从16至20nt,例如16、17、18、19或20个核苷酸。在某些优选实施例中,该指导RNA的同向重复长度是19个核苷酸。
本发明还涵盖用于递送多种核酸组分的方法,其中每种核酸组分对不同的感兴趣的靶基因座具有特异性,从而修饰多个感兴趣的靶基因座。该复合物的核酸组分可以包含一种或多种蛋白质结合RNA适体。该一种或多种适体可能能够结合噬菌体外壳蛋白。该噬菌体外壳蛋白可以选自包括以下的组:Qβ、F2、GA、fr、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s以及PRR1。在一个优选的实施例中,该噬菌体外壳蛋白是MS2。本发明还提供了该复合物的核酸组分,该核酸组分在长度上为30个或更多个、40个或更多个或50个或更多个核苷酸。
因此,本发明的目的在于,在本发明中不涵盖任何先前已知的产品、制造该产品的过程、或使用该产品的方法,使得申请人保留和特此披露放弃任何先前已知的产品、过程、或方法的权利。进一步指出的是,在本发明的范围之内,本发明并不旨在涵盖任何产品、过程、或该产品的制造或使用该产品的方法,其不符合USPTO(35U.S.C.§112,第一段)或EPO(EPC的第83条)的书面说明和可实施性要求,使得申请人保留和特此公开放弃任何先前描述的产品、制造该产品的过程、或使用该产品的方法的权利。可以有利的是,在本发明的实践中符合条款53(c)EPC以及条例28(b)和(c)EPC。本文没有内容应解读为承诺。
应注意,在本披露并且特别是在权利要求书和/或段落中,术语如“包含(comprises)”、“包含的(comprised)”、“包含了(comprising)”等等可具有在美国专利法中属于它的含义;例如,它们可以表示“包括(includes)”、“包括的(included)”、“包括了(including)”等等;并且术语如“基本上由……组成(consisting essentially of)”和“基本上由……组成(consists essentially of)”具有在美国专利法中归于它们的含义,例如,它们允许未被明确叙述的要素,但是排除在现有技术中发现或者影响本发明的基本或新颖特征的要素。
在又一个方面,本发明提供包含编码本文描述的CRISPR系统的核苷酸序列的真核细胞,该CRISPR系统确保产生经修饰的感兴趣的靶基因座,其中根据本文描述的任何方法修饰该感兴趣的靶基因座。又一个方面提供了所述细胞的细胞系。另一个方面提供了包含一种或多种所述细胞的多细胞生物。
在某些实施例中,该感兴趣的靶基因座的修饰可以导致:该真核细胞包含至少一种基因产物的改变的(蛋白质)表达;该真核细胞包含至少一种基因产物的改变的(蛋白质)表达,其中该至少一种基因产物的(蛋白质)表达增加;该真核细胞包含至少一种基因产物的改变的(蛋白质)表达,其中该至少一种基因产物的(蛋白质)表达降低;或该真核细胞包含经编辑的转录组。
在某些实施例中,该真核细胞可以是哺乳动物细胞或人细胞。
在另外的实施例中,如本说明书中描述的非天然存在的或工程化的组合物、载体系统或递送系统可以用于RNA序列特异性干扰、RNA序列特异性表达调节(包括同种型特异性表达)、稳定性、定位、功能(如核糖体RNA或miRNA)等;或多重化这些过程。
在另外的实施例中,如本说明书中描述的非天然存在的或工程化的组合物、载体系统或递送系统可以用于样品(如生物样品)中的RNA检测和/或定量。在某些实施例中,RNA检测在细胞中进行。在一个实施例中,本发明提供了一种检测样品中靶RNA的方法,该方法包括(a)将该样品与i)能够切割RNA的VI型CRISPR-Cas效应蛋白、ii)能够与该靶RNA杂交的指导RNA和iii)能够被该效应蛋白非特异性且可检测地切割的基于RNA的切割诱导型报告分子一起孵育,(b)基于由切割所述基于RNA的切割诱导型报告分子产生的信号检测所述靶RNA。
在一个实施例中,该VI型CRISPR-Cas效应蛋白是C2c2效应蛋白。在一个实施例中,该基于RNA的切割诱导型报告构建体包含荧光染料和淬灭剂。在某些实施例中,该样品包含无细胞生物样品。在其他实施例中,该样品包含细胞样品或为细胞样品,例如但不限于植物细胞或动物细胞。在本发明的一个实施例中,该靶RNA包含病原体RNA,包括但不限于来自病毒、细菌、真菌或寄生虫的靶RNA。在一个实施例中,该指导RNA被设计为检测靶RNA,其包含单核苷酸多态性或RNA转录物的剪接变体。在一个实施例中,该指导RNA包含与该靶RNA的一个或多个错配核苷酸。在某些实施例中,该指导RNA与aa靶分子杂交,该靶分子诊断疾病状态,如但不限于癌症或免疫疾病。
本发明提供了一种核糖核酸(RNA)检测系统,该系统包含a)能够切割RNA的VI型CRISPR-Cas效应蛋白、b)能够结合靶RNA的指导RNA、和c)能够被该效应蛋白非特异性且可检测地切割的基于RNA的切割诱导型报告分子。此外,本发明提供了一种用于RNA检测的试剂盒,该试剂盒包含a)能够切割RNA的VI型CRISPR-Cas效应蛋白和b)能够被该效应蛋白非特异性且可检测地切割的基于RNA的切割诱导型报告分子。在某些实施例中,该基于RNA的切割诱导型报告构建体包含荧光染料和淬灭剂。
在另外的实施例中,如本说明书中描述的非天然存在的或工程化的组合物、载体系统或递送系统可以用于产生疾病模型和/或筛选系统。
在另外的实施例中,如本说明书中描述的非天然存在的或工程化的组合物、载体系统或递送系统可以用于:位点特异性转录组编辑或微扰;核酸序列特异性干扰;或多重基因组工程化。
还提供了来自如本文描述的细胞、细胞系或生物的基因产物。在某些实施例中,所表达的基因产物的量可以大于或小于来自不具有改变的表达或经编辑的基因组的细胞的基因产物的量。在某些实施例中,与来自不具有改变的表达或经编辑的基因组的细胞的基因产物相比,该基因产物可以改变。
这些和其他实施例披露于以下具体实施方式中,或者据其显而易见并且由其涵盖。
附图说明
本发明的新颖特征在所附权利要求书中具体提出。通过参考对说明性实施例进行叙述的以下具体实施方式,将获得对本发明的特征和优点的更好理解,在这些实施例中利用了本发明的原理,并且在这些附图中:
图1A-1D.C2c2直向同源物的细胞定位。(A)在具有或不具有核定位信号(NLS)或核输出信号(NES)的情况下,用与mCherry融合的不同C2c2直向同源物转染HEK293细胞。(B)韦德纤毛菌F0279C2c2(B1)和毛螺菌科细菌NK4A179C2c2(B2)的NES融合位于细胞质中。(C)韦德纤毛菌F0279C2c2(C1)、毛螺菌科细菌NK4A179C2c2(C2)和沙氏纤毛菌C2c2(C3)的NLS融合位于细胞核中并且在细胞核中可变。(C)未与NLS或NES融合的韦德纤毛菌F0279C2c2(D1)、毛螺菌科细菌NK4A179C2c2(D2)和沙氏纤毛菌C2c2(D3)可变地位于细胞核和细胞质中。(D)评估的四种哺乳动物LwaCas13a构建体的示意图(左)和显示每种设计的定位和表达的成像(右)。
图2A-2C.用于评估哺乳动物细胞中C2c2敲低效率的测定。(A)用于确定C2c2的敲低效率的双荧光素酶报告分子方案的示意图。用不同的质粒转染细胞:编码Gaussia荧光素酶(Gluc)和Cypridina荧光素酶(Cluc)的质粒;编码C2c2(有或没有NLS或NES)的质粒;和编码靶向Gaussia荧光素酶的gRNA的质粒。Gluc的敲低效率基于Gluc和Cluc的比率确定。(B)不同gRNA靶向Gaussia荧光素酶mRNA的位置。(C).用于评估哺乳动物细胞中C2c2敲低效率的测定。用不同的质粒转染细胞:编码EGFP的质粒;编码C2c2(有或没有NLS或NES)的质粒;和编码靶向EGFP的gRNA的质粒。通过流式细胞术确定EGFP的敲低效率。
图3A-3Q.VI型CRISPR Cas13a家族关于RNA切割活性的表征。(A)Cas13a直向同源物上PFS表征筛选的示意图。(B)用于表达Cas13a蛋白和crRNA的构建体的示意图。显示了LwaCas13a的长度和残基数目。(C)Cas13a体内活性的定量。(D)来自(C)的体内活性的比率。(E、F)LshC2c2和LwaC2c2的PFS基序测定,通过对存活大肠杆菌(E.coli)群中富集质粒的下一代测序确定。(G)靶向和非靶向样品中LshCas13a和LwaCas13a的PFS富集的分布。(H)体内PFS筛选显示LwaCas13a具有最小的PFS偏好。(I)显示LshC2c2和LwC2c2的靶向和非靶向生物重复(n=2)的归一化PFS计数的分布的框图。框从第一个四分位数延伸到第三个四分位数,须表示该四分位距的1.5倍。均值由红色水平条指示。(J)使用纯化蛋白质的LshC2c2和LwC2c2RNA切割活性的比较。LwaCas13a比LshCas13a具有更活跃的RNA酶活性。将5'标记的RNA靶标与C2c2和相应的crRVA一起孵育30分钟,并通过凝胶电泳分析产物。(K)LwaCas13a可以加工来自韦德纤毛菌CRISPR基因座的CRISPR阵列转录物。将双间隔子Lwa阵列与LwC2c2一起孵育30分钟,并且然后通过凝胶电泳解析反应。(L)评估的哺乳动物LwaCas13a构建体的示意图和显示每种设计的定位和表达的成像。比例尺,10μm。(M)用于通过荧光素酶蛋白读出评估敲低的哺乳动物报告系统的示意图。(N)使用LwaCas13a的工程化变体的Gaussia荧光素酶(Gluc)的敲低。指导物和shRNA的序列如上所示。(O)与相应的RNAi构建体比较的用LwaCas13a的三种不同内源转录物的敲低。(P)水稻(稻(Oryza sativa))原生质体中转录物的LwaCas13a敲低的示意图。(Q)稻原生质体中的三种转录物的LwaCas13a敲低,每种转录物使用三种靶向指导物和一种非靶向指导物。除非另有说明,否则所有值均为均值±SEM,n=3。
图4A-4B.用针对Gluc.的不同gRNA和与NLS、NES融合的或无标签的C2c2直向同源物进行的荧光素酶的归一化蛋白质表达。(A)C2c2直向同源物是韦德纤毛菌F0279(Lw2)。实验中使用的间隔子序列是(指导物1)ATCAGGGCAAACAGAACTTTGACTCCCA;(指导物2)AGATCCGTGGTCGCGAAGTTGCTGGCCA;(指导物3)TCGCCTTCGTAGGTGTGGCAGCGTCCTG;和(指导物NP)TAGATTGCTGTTCTACCAAGTAATCCAT。(B)C2c2直向同源物是纽约李斯特菌FSL M6-0635(LbFSL)。实验中使用的间隔子序列是(指导物1)TCGCCTTCGTAGGTGTGGCAGCGTCCTG和(指导物NT)tagattgctgttctaccaagtaatccat。
图5A-5B.用针对EGPF的不同gRNA和与NLS、NES融合的或无标签的C2c2直向同源物进行的GFP的归一化蛋白质表达。(A)C2c2直向同源物是韦德纤毛菌F0279(Lw2)。实验中使用的间隔子序列是(指导物1)tgaacagctcctcgcccttgctcaccat;(指导物2)tcagcttgccgtaggtggcatcgccctc;(指导物3)gggtagcggctgaagcactgcacgccgt;(指导物4)ggtcttgtagttgccgtcgtccttgaag;(指导物5)tactccagcttgtgccccaggatgttgc;(指导物6)cacgctgccgtcctcgatgttgtggcgg;(指导物7)tctttgctcagggcggactgggtgctca;(指导物8)gacttgtacagctcgtccatgccgagag;和(指导物NT)tagattgctgttctaccaagtaatccat。(B)C2c2直向同源物是纽约李斯特菌FSL M6-0635(LbFSL)。实验中使用的间隔子序列是(指导物2)tcagcttgccgtaggtggcatcgccctc;(指导物3)gggtagcggctgaagcactgcacgccgt;(指导物4)ggtcttgtagttgccgtcgtccttgaag;(指导物5)tactccagcttgtgccccaggatgttgc;(指导物6)cacgctgccgtcctcgatgttgtggcgg;(指导物7)tctttgctcagggcggactgggtgctca;(指导物8)gacttgtacagctcgtccatgccgagag;和(指导物NT)tagattgctgttctaccaagtaatccat。
图6A-6E.针对哺乳动物敲低的LwaCas13a的工程化和优化。(A)使用在A375细胞中转染的多种指导物,通过LwCas13a进行的Gluc转录物的敲低:(B)使用LwaCas13a的工程化变体的Gaussia荧光素酶(Gluc)的敲低。(C)通过LwaCas13a和不同长度的Gluc crRNA 1间隔子进行的Gaussia荧光素酶(Gluc)的敲低。(D)使用多种指导物,通过LwaCas13a进行的KRAS转录物的敲低。(E)使用多种指导物,通过LwaCas13a进行的PPIB转录物的敲低。
图7.用针对相应靶基因的gRNA和与NES融合的C2c2韦德纤毛菌F0279进行的靶基因的归一化蛋白质表达。各靶基因的gRNA是:ctgctgccacagaccgagaggcttaaaa(CTNNB1);tccttgattacacgatggaatttgctgt(PPIB);tcaaggtggggtcacaggagaagccaaa(mAPK14);atgataatgcaatagcaggacaggatga(CXCR4);gcgtgagccaccgcgcctggccggctgt(TINCR);ccagctgcagatgctgcagtttttggcg(PCAT1);ctggaaatggaagatgccggcatagcca(CAPN1);gatgacacctcacacggaccacccctag(LETMD1);taatactgctccagatatgggtgggcca(MAPK14);catgaagaccgagttatagaatactata(RB1);ggtgaaatattctccatccagtggtttc(TP53);和aatttctcgaactaatgtatagaaggca(KRAS)。
图8.用针对Gluc.的不同gRNA和与NLS、NES融合的或无标签的C2c2直向同源物进行的荧光素酶的归一化蛋白质表达。C2c2直向同源物是沙氏纤毛菌(Lsh)、韦德纤毛菌F0279(Lw2)、嗜氨基梭菌(Ca)、纽约李斯特菌FSL M6-0635(LbFSL)、毛螺菌科细菌NK4A179(LbNk)和毛螺菌科细菌MA2020(LbM)。
图9.Lw2在多个细胞系中起作用。显示了293FT细胞的归一化荧光素酶活性。
图10A-10B.用针对Gluc.的gRNA和无催化活性的C2c2直向同源物进行的荧光素酶的相对蛋白质表达。(A)dC2c2韦德纤毛菌(LwC2c2)与EIF4E、EIF4E和NES融合或无标签。(B)dC2c2纽约李斯特菌FSL M6-0635(LbFSL)与NLS和EIF4E融合或无标签。
图11A-11C.靶向β肌动蛋白的韦德纤毛菌C2c2的细胞定位在用NaAsO2处理细胞后定位至应激颗粒。
图12.哺乳动物细胞中的RNA敲低。C2c2在两个靶位点优于shRNA。
图13.增加crRNA转染量增加敲低。
图14.具有NES的Lw2C2c2(NES-Lw2C2c2)有效切割tRNA的RNA和U6敲低。
图15A-15B.(A)蛋白质转染量使敲低饱和。(B)用Gluc crRNA 1和不同量的经转染的LwaCas13a质粒进行的Gluc转录物的敲低。
图16.U6驱动的DR-间隔子-DR-间隔子靶向构建体。
图17.对于内源基因上的相应靶标,C2c2优于经优化的shRNA。
图18.dLw2C2c2-EIF4E融合可以上调三个基因的翻译;蛋白质水平通过western印迹上的条带强度测量。
图19.各转录物的敲低。Lw2显示较小的可变性和较高的特异性。
图20.哺乳动物细胞中的RNA敲低。
图21.通过GFP的超折叠衍生物(sfGFP)改进成像。在HEK293FT细胞和小鼠胚胎干细胞(mESC)中比较C2c2-mCherry和sfGFP-C2c2融合蛋白。
图22A.msfGFP-C2c2改进敲低。描绘了C2c2与mCherry或msfGFP(其进一步包括NLS或NES)的各种融合蛋白进行的荧光素酶敲低。
图22B-22D说明了用C2c2调节转录的蛋白质标签系统,并显示了转录起始因子连接的scFv与经修饰的C2c2所包含的短肽序列(SunTag)结合的元件。图22C-22D描绘了该系统的转录效应。
图23A-23B.报告蛋白(GFP、Venus、Cre等)的断裂。每个部分与C2c2融合(参见幻灯片,例如使用半胱天冬酶的示意图)。通过设计两种靶向彼此接近的转录物的指导物,在转录物存在下重构断裂蛋白质。
图24A-24C.通过C2c2附带RNA酶活性进行的快速RNA检测。(A)左图:通过与C2c2crRNA的指导序列互补的靶RNA活化C2c2附带非特异性RNA酶活性导致报告分子的切割。右图:在不存在靶RNA的情况下,不诱导附带非特异性RNA酶活性,因此不存在报告分子的切割。(B)用于检测LwaCas13a的附带效应活性的测定的示意图。(C)在存在或不存在靶RNA的情况下与LwaCas13a-crRNA复合物一起孵育后的附带RNA靶标的凝胶电泳。
图25.使用各种浓度的C2c2通过附带效应进行的慢病毒检测。
图26.通过附带效应进行的慢病毒检测的时间过程。
图27.通过C2c2附带RNA酶活性进行的稀有RNA种类的检测。增加靶标浓度和靶标切割伴随着增加的非特异性脱靶RNA酶活性。
图28A-28B.Lw2C2c2和LbuC2c2的比对。
图29A-29C.(A)被靶向用于荧光素酶mRNA敲低的βLwC2c2,间隔子序列中具有单碱基对错配。(B)被靶向用于CXCR4mRNA敲低的LwC2c2,间隔子序列中具有单碱基对错配。(C)被靶向用于荧光素酶mRNA敲低的LwC2c2,间隔子序列中具有单个和连续双碱基对错配。
图29D-A至29D-C.(A)荧光素酶报告分子mRNA的敲低的特异性。对于荧光素酶报告分子mRNA的敲低,C2c2比RNAi更具特异性。左:与shRNA的荧光素酶敲低条件相比,非靶向转染对照(所有图的x轴)的RNA-seq文库中的所有检测基因以log2(每百万转录物(TPM))值计的表达水平。右:与C2c2的荧光素酶敲低条件相比,非靶向转染对照(所有图的x轴)的RNA-seq文库中的所有检测基因以log2(每百万转录物(TPM))值计的表达水平。被靶向用于敲低的靶标荧光素酶转录物用红点表示。显示了来自n=3个生物学重复的平均值。(B)内源KRASmRNA敲低的特异性。对于内源KRAS的敲低,C2c2比RNAi更具特异性。靶标转录物用红点表示。(C)内源PPIB mRNA的敲低的特异性。对于内源PPIB的敲低,C2c2比RNAi更具特异性。靶标转录物用红点表示。
图29E-29G.(E)六个RNA-seq文库(每个具有三个生物学重复)的差异基因表达分析,比较了三个不同基因处的LwaCas13a敲低与shRNA敲低。如果基因与非靶向对照相比具有>2或<0.75的倍数变化均值并且具有<0.10的错误发现率(FDR),则认为这些基因显著差异表达。(F)来自RNA seq文库的靶基因的定量敲低水平均值。(G)左:在测量细胞生长之前,在用和不用抗生素选择的情况下用LwaCas13a转染72小时的细胞的荧光素酶敲低。中间:在用和不用抗生素选择的情况下已用LwaCas13a转染72小时的细胞的细胞活力。右:在用和不用抗生素选择的情况下已用LwaCas13a转染72小时的细胞的GFP荧光。所有值均为均值±SEM,n=3。
图30A-30E.RNA敲低的水平和特异性的比较。C2c2表现出增加的特异性,同时保持与RNAi相似的敲低水平。(A):分析的每个RNA-seq文库中显著差异调节基因的数目。六个RNA-seq文库(每个具有三个生物学重复)的差异基因表达分析,比较了三个不同基因处的LwaCas13a敲低与shRNA敲低。如果基因与非靶向对照相比具有>2或<0.75的倍数变化均值并且具有<0.10的错误发现率(FDR),则认为这些基因显著差异表达。(B):来自RNA seq文库的靶基因的定量敲低水平均值。归一化表达计算为靶向条件下靶基因的TPM除以非靶向条件下靶基因的TPM。这些图代表图28中RNA-seq图的累积数据。将脱靶确定为显著不受调节(>2倍)或下调(<0.75倍)的基因(C)使用不可选择的和杀稻瘟素(blastcidin)可选择的C2c2形式,用LwaCas13a转染72小时的细胞的荧光素酶敲低。(D)在用和不用抗生素选择的情况下已用LwaCas13a转染72小时的细胞的细胞活力。(E)在用和不用抗生素选择的情况下已用LwaCas13a转染72小时的细胞的GFP荧光。
图31C2c2能够进行多重敲低。设计crRNA以靶向PPIB、CXCR4、KRAS、TINCR和PCAT。顶图显示了颜色编码的mRNA并且以与所描绘的多重化crRNA转录物相同的从左到右顺序的归一化表达水平。底图将单剂量指导物与多重化和聚池指导物进行比较。
图32A-32D.沿着gLuc或cLuc dem长度的平铺(tiling)指导物表现出转录物的可重新靶向性和脆弱性区域。(A)LwaCas13a阵列式筛选的示意图。(B)通过LwC2c2进行的gaussia荧光素酶mRNA的敲低效率,186种指导物均匀地平铺在转录物的长度上。(C)通过LwC2c2进行的cypridina荧光素酶的阵列式敲低筛选,指导物均匀地平铺在整个转录物的长度上。(D)使用shRNA比较的来自阵列式敲低筛选的前三种crRNA的验证。
图33A-33B.RNA免疫沉淀(RIP)显示靶标结合的富集。包含HA标签的dC2c2-msfGFP提供蛋白质-RNA复合物的沉淀。通过qPCR定量结合的RNA,并且与输入RNA(没有免疫沉淀的样品)和用阴性对照抗体的免疫沉淀相比较确定富集。图A显示了β-肌动蛋白RNA靶标的富集。图B显示了荧光素酶靶标的富集。
图34.在3T3L1成纤维细胞中β-肌动蛋白的C2c2成像。在靶向条件(顶部框架)下,C2c2复合物结合离开细胞核的肌动蛋白mRNA,揭示细胞质β-肌动蛋白mRNA。在非靶向条件下,在细胞核中观察到加NLS标签的C2c2。左列和右列构成不同的视图。
图35.在HEK293FT细胞中β-肌动蛋白的C2c2成像。在靶向条件(顶部框架)下,C2c2复合物结合离开细胞核的肌动蛋白mRNA,揭示细胞质β-肌动蛋白mRNA。在非靶向条件下,在细胞核中观察到加NLS标签的C2c2。左列和右列构成不同的视图。
图36.Lw2Cas13a的RNA切割动力学的体外表征。使用LwaCas13a-crRNA复合物,在5'末端标记的靶标1的RNA切割0.5小时后的变性凝胶,该复合物以半对数步骤连续稀释。
图37.Lw2Cas13a的RNA切割动力学的体外表征。使用5'末端标记的靶标1,Lw2Cas13a ssRNA切割的时间序列的变性凝胶。
图38.Lw2C2c2和crRNA介导RNA指导的ssRNA切割。变性凝胶证明在孵育1小时后由Lw2C2c2进行的crRNA介导的ssRNA切割。用IRDye 800 5'标记ssRNA靶标。切割需要存在crRNA,并通过添加EDTA而消除。
图39A-39B.Lw2C2c2和crRNA介导RNA指导的ssRNA切割。(A)crRNA靶向的ssRNA底物的示意图。原型间隔子区域以蓝色突出显示,并且PFS由品红色条指示。(B)证明在孵育3小时后需要PFS的变性凝胶。除了PFS(在示意图中由品红色X表示)之外相同的四种ssRNA底物用于体外切割反应。ssRNA切割活性依赖于紧临靶位点3'的核苷酸。
图40.同向重复的长度影响Lw2C2c2的RNA指导的RNA酶活性。变性凝胶显示crRNA指导的ssRNA 1切割随孵育3小时后同向重复的长度变化。
图41.间隔子的长度影响Lw2C2c2的RNA指导的RNA酶活性。变性凝胶显示crRNA指导的ssRNA 1切割随孵育3小时后间隔子的长度变化。
图42A-42C.Lw2C2c2切割位点通过靶RNA的二级结构和序列确定。(A)显示与LwCas13a和crRNA 1一起孵育后的ssRNA4和ssRNA 5的变性凝胶。(B)ssRNA 4(蓝色)和(C)ssRNA 5;(绿色)共享相同的原型间隔子,但侧翼为不同的序列。尽管原型间隔子相同,不同的侧翼序列导致不同的切割模式。
图43A-43C.(A)对于四种可能的核苷酸中的每一种,用突出显示的环(红色)中的均聚物延伸修饰的ssRNA 4的示意图。crRNA间隔子序列以蓝色突出显示。(B).显示孵育3小时后四种可能的均聚物靶标中的每一种的Lw2C2c2-crRNA介导的切割的变性凝胶。Lw2C2c2切割C和U。(C)LwaCas13a可以加工来自韦德纤毛菌CRISPR-Cas基因座的前crRNA。
图44A-44K.无催化活性的LwaCas13a(dCas13a)能够结合哺乳动物细胞中的转录物。(A)用于成像和评估dCas13a结合的dCas13a-GFP构建体的示意图。(B)用于定量dCas13a结合的RNA免疫沉淀的示意图。(C)与非靶向对照相比,靶向gLuc转录物的dCas13a显著富集。通过RIP归一化为对照抗体或输入裂解物,对gaussia荧光素酶mRNA的dC2c2-msfGFP结合的定量。将值归一化为非靶向指导物。(n=3,通过t检验,*,p<0.05;****,p<0.0001)。(D)用于负反馈成像的dCas13a-GFP-KRAB构建体的示意图。在没有靶标和指导物的情况下,报告蛋白抑制其自身的转录。(E)Gluc、Cluc、PPIB和KRAS敲低部分地与如通过预测的转录物折叠测量的靶标可及性相关。(F)用于成像b-肌动蛋白的dCas13-GFP和dCas13a-GFP-KRAB构建体的定位之间的比较。(G)在HEK293细胞中用靶向b-肌动蛋白的多种指导物进行的dCas13a-GFP-KRAB成像的代表性图像。(H)用靶向ACTB的多种指导物进行的dCas13a-GFP-KRAB成像的代表性图像。(I)如通过核与全细胞信号的比率测量的dCas13a-GFP-KRAB的细胞质易位的定量。(J)用400μM亚砷酸钠处理的293FT细胞的代表性固定免疫荧光图像。通过针对标记物G3BP1染色来指示应激颗粒。比例尺,5μm。比例尺,5μm。(K)通过皮尔森相关性对每个细胞定量的G3BP1和dCas13a-GFP-KRAB共定位。所有值均为均值±SEM,n=3。****p<0.0001;***p<0.001;**p<0.01;*p<0.05。ns=不显著。单尾学生t检验用于(a)中的比较,并且双尾学生t检验用于(I)和(K)中的比较。
图45.使用如图43中所示的C2c2-GFP成像蛋白的Β-肌动蛋白的检测。使用dC2c2-eGFP-ZF-KRAB-NLS与靶向指导物(左图)或非靶向指导物(右图)对β-肌动蛋白成像。
图46.使用加GFP标签的G3BP1的应激颗粒的检测。
图47.应激颗粒和应激颗粒子结构(“核心”)中肌动蛋白的检测。使用C2c2-eGFP-ZF-KRAB对肌动蛋白mRNA成像,使用和不使用靶向构建体,并且进行或不进行使用NaAsO2的处理以稳定核心子结构。使用抗G3BP1标记应激颗粒。
图48A-48F:dCas13a可以成像活细胞中的应激颗粒形成。(A)使用负反馈dCas13a-msfGFP-KRAB构建体用于在用亚砷酸钠处理后成像β-肌动蛋白mRNA定位至应激颗粒的示意图。(B)用400uM亚砷酸钠处理的293FT细胞的代表性固定免疫荧光图像。
dCas13a-msfGFP-KRAB与β-肌动蛋白mRNA靶向指导物一起转染,定位至应激颗粒。显示了用针对G3BP1标记物的抗体针对应激颗粒免疫染色的固定HEK293细胞的代表性图像。(C)通过对每种条件约20个细胞的皮尔森相关性分析进行的应激颗粒定位的定量。(D):通过对每种条件约20个细胞的曼德斯共定位分析进行的应激颗粒定位的定量。(E)响应于400uM亚砷酸钠处理的应激颗粒形成的活细胞分析的代表性图像。(F)响应于亚砷酸钠处理的应激颗粒形成的定量。
图49A-49O LwaCas13a可以被重新编程成靶向内源哺乳动物编码和非编码RNA靶标。(A)均匀地平铺在KRAS转录物上的93种指导物的阵列式敲低筛选。(B)均匀地平铺在PPIB转录物上的93种指导物的阵列式敲低筛选。(C)LwaCas13a阵列式筛选的示意图。(D)均匀地平铺在Gluc转录物上的186种指导物的阵列式敲低筛选。(E)均匀地平铺在Cypridinia荧光素酶(Cluc)转录物上的93种指导物的阵列式敲低筛选。(F)均匀地平铺在KRAS转录物上的93种指导物的阵列式敲低筛选。(G)均匀地平铺在PPIB转录物上的93种指导物的阵列式敲低筛选。(H)使用shRNA比较的来自内源阵列式敲低筛选的前三种指导物的验证。所有值均为均值±SEM,n=3。***p<0.001;**p<0.01。双尾学生T检验用于比较。(I)均匀地平铺在MALAT1转录物上的93种指导物的阵列式敲低筛选。(J)使用shRNA比较的来自内源阵列式MALAT1敲低筛选的前三种指导物的验证。(K)在单个启动子的表达下,针对五种不同内源基因的CRISPR阵列中的五种指导物的多重递送能够进行稳健敲低。(L)针对三种不同内源基因的三种指导物的多重递送、或用非靶向序列替换每种指导物的构建体显示靶向基因的特异性敲低。所有值均为均值±SEM,n=3。(M)与相应的RNAi构建体比较的用LwaCas13a的三种不同内源转录物的敲低。(N)LwaCas13a能够敲低核lncRNA转录物MALAT1。(O)针对三种不同内源基因的三种指导物的多重递送、或用非靶向序列替换每种crRNA的构建体显示靶向基因的特异性敲低。
图50.来自21种C2c2直向同源物的HEPN序列基序。
图51.来自33种C2c2直向同源物的HEPN序列基序。
图52.用于连接效应结构域的示例性位置。在C或N末端连接至异源功能结构域(描绘的mCherry和msfGFP)的C2c2蛋白保留了如由荧光素酶敲低所示的功能。
图53A-53L.(A-K)C2c2直向同源物的序列比对。(L)HEPN结构域的序列比对。
图54.C2c2直向同源物的树比对。
图55A-55B.C2c2和Cas13b直向同源物的树比对。
图56A-56F:针对哺乳动物敲低的LwaCas13a的工程化和优化。(A)用Gluc crRNA 1和不同量的经转染的LwaCas13a质粒进行的Gluc转录物的敲低。(B)通过LwaCas13a和不同量的经转染的Gluc crRNA 1和2质粒进行的Gluc转录物的敲低。(C)使用由U6或tRNAVal启动子表达的crRNA进行的Gluc转录物的敲低。(D)使用由U6或tRNAVal启动子表达的crRNA进行的KRAS转录物的敲低。(E)使用由U6或tRNAVal启动子表达的指导物进行的KRAS转录物的敲低。(F)均匀地平铺在XIST转录物上的93种指导物的阵列式敲低筛选。
图57A-57E:LwaCas13a PFS偏好的评估和与LshCas13a的比较。(A)在此研究中评估的十五种Cas13a直向同源物的序列比较树。(B)针对不同耗竭阈值高于耗竭阈值的LshCas13a和LwaCas13a PFS序列的数量。(C)归一化为非靶向样品的靶向样品中LshCas13a和LwaCas13a的PFS富集的分布。(D)在不同富集截止阈值下LshCas13a切割后剩余PFS序列的序列标志和计数。(E)在不同富集截止阈值下LwaCas13a切割后剩余PFS序列的序列标志和计数。
图58A-58D:LwaCas13a的靶向效率受沿转录物的可及性影响。(A)第一行:按沿靶标转录物的位置绘制头等敲低指导物。选择针对Gluc的前20%的指导物,并且选择针对Cluc、KRAS和PPIB的前30%的指导物。第二行:每种转录物的相邻头等指导物之间的成对距离(蓝色)与随机零分布(红色)相比较的直方图。插图显示这些直方图的累积频率曲线。蓝色曲线(实际测量距离)向红色曲线(零距离分布)左侧的移位指示指导物比偶然预期的更接近。(B)Gluc、Cluc、PPIB和KRAS敲低部分地与如通过预测的转录物折叠测量的靶标可及性相关。(C)描绘靶标可及性(碱基配对区域的概率)与LwaCas13a敲低后靶表达之间的相关性的核密度估计图。(D)第一行:在不同窗口大小(W)和不同k聚体长度下测量的靶标表达和靶标可及性(碱基配对区域的概率)之间的相关性。第二行:在不同窗口大小(W)和不同k聚体长度下测量的靶标表达和靶标可及性(碱基配对区域的概率)之间的相关性的P值。设计色标使得p值>0.05是红色阴影,p值<0.05是蓝色阴影。
图59A-59K:在不同间隔子长度下LwaCas13a对crRNA:靶标双链体中错配的敏感性的详细评估。(A)用跨越间隔子序列的不同位置处含有单个错配的crRNA评估的KRAS的敲低。(B)用跨越间隔子序列的不同位置处含有单个错配的crRNA评估的PPIB的敲低。(C)用跨越间隔子序列的不同位置处含有非连续双错配的指导物评估的Gluc的敲低。野生型序列显示在顶部,具有如下所示的错配同一性。(D)对于不同间隔子长度,对ssRNA 1和2的附带切割活性。(n=4个技术重复;条代表均值±s.e.m.)。(E)(D)中测试的crRNA的特异性比率。特异性比率计算为中靶RNA(ssRNA 1)附带切割与脱靶RNA(ssRNA 2)附带切割的比率。(n=4个技术重复;条代表均值±s.e.m.)。(F)针对28nt间隔子crRNA,对ssRNA 1和2的附带切割活性,合成错配沿着间隔子平铺。(n=4个技术重复;条代表均值±s.e.m.)。(G)(F)中测试的crRNA的特异性比率。特异性比率计算为中靶RNA(ssRNA 1)附带切割与脱靶RNA(ssRNA2)附带切割的比率。(n=4个技术重复;条代表均值±s.e.m.)。(H)针对23nt间隔子crRNA,对ssRNA 1和2的附带切割活性,合成错配沿着间隔子平铺。(n=4个技术重复;条代表均值±s.e.m.)。(I)(H)中测试的crRNA的特异性比率。特异性比率计算为中靶RNA(ssRNA 1)附带切割与脱靶RNA(ssRNA 2)附带切割的比率。(n=4个技术重复;条代表均值±s.e.m.)。(J)针对20nt间隔子crRNA,对ssRNA 1和2的附带切割活性,合成错配沿着间隔子平铺。(n=4个技术重复;条代表均值±s.e.m.)。(K)(J)中测试的crRNA的特异性比率。特异性比率计算为中靶RNA(ssRNA 1)附带切割与脱靶RNA(ssRNA 2)附带切割的比率。(n=4个技术重复;条代表均值±s.e.m.)。
图60A-60F:LwaCas13a比内源靶标上的shRNA敲低更具特异性,并且与生物噪声相比几乎没有变化。(A)左:与KRAS靶向shRNA(y轴)相比,在非靶向shRNA转染的对照(x轴)的RNA-seq文库中检测到的所有基因以log2(每百万转录物(TPM))值计的表达水平。显示了三个生物学重复的均值。KRAS转录物数据点着红色。右:与KRAS靶向LwaCas13a-crRNA(y轴)相比,在非靶向LwaCas13a-crRNA转染的对照(x轴)的RNA-seq文库中检测到的所有基因以log2(每百万转录物(TPM))值计的表达水平。显示了三个生物学重复的均值。KRAS转录物数据点着红色。(B)左:与PPIB靶向shRNA(y轴)相比,在非靶向shRNA转染的对照(x轴)的RNA-seq文库中检测到的所有基因以log2(每百万转录物(TPM))值计的表达水平。显示了三个生物学重复的均值。PPIB转录物数据点着红色。右:与PPIB靶向LwaCas13a-crRNA(y轴)相比,在非靶向LwaCas13a-crRNA转染的对照(x轴)的RNA-seq文库中检测到的所有基因以log2(每百万转录物(TPM))值计的表达水平。显示了三个生物学重复的均值。PPIB转录物数据点着红色。(C)非靶向shRNA条件(第一行)和Gluc靶向shRNA条件(第二行)的各个重复的比较。(D)非靶向crRNA条件(第一行)和Gluc靶向crRNA条件(第二行)的各个重复的比较。(E)非靶向shRNA条件与Gluc靶向shRNA条件的各个重复的成对比较。(F)非靶向crRNA条件与Gluc靶向crRNA条件的各个重复的成对比较。
图61A-61C:所有样品的LwaCas13a和RNAi敲低变异性(标准偏差)的详细分析。(A)针对靶向荧光素酶报告分子或内源基因的shRNA或crRNA,在靶向和非靶向重复之间,在RNA-seq文库中检测到的所有基因的log2(每百万转录物(TPM+1))值的相关性(Kendall'stau)的热图。(B)在所有重复和微扰之间,在RNA-seq文库中检测到的所有基因的log2(每百万转录物(TPM+1))值的相关性(Kendall's tau)的热图。(C)针对被shRNA或crRNA靶向的每个基因,在靶向和非靶向重复中,在RNA-seq文库中检测到的所有基因的log2(每百万转录物(TPM+1))值的标准偏差的分布。
图62A-62J:LwaCas13a敲低对靶向转录物具有特异性,对测量的脱靶转录物没有活性。(A)平铺Gluc的前96个间隔子的绝对Gluc信号的热图。(B)平铺Gluc的前96个间隔子的绝对Cluc信号的热图。(C)Gluc平铺指导物的绝对Gluc信号和归一化荧光素酶之间的关系。(D)Gluc平铺指导物的绝对Cluc信号和归一化荧光素酶之间的关系。(E)Cluc平铺指导物的绝对Cluc信号和归一化荧光素酶之间的关系。(F)Cluc平铺指导物的绝对Gluc信号和归一化荧光素酶之间的关系。(G)PPIB平铺指导物的PPIB 2-Ct水平与PPIB敲低之间的关系。(H)PPIB平铺指导物的GAPDH 2-Ct水平与PPIB敲低之间的关系。(I)PPIB KRAS指导物的KRAS 2-Ct水平与KRAS敲低之间的关系。(J)PPIB KRAS指导物的GAPDH 2-Ct水平与KRAS敲低之间的关系。
图63A-63F:dCas13a阻遏报告基因表达并结合内源基因。(A)跨分离Cluc和Gluc的合成的HBG1内含子平铺的dCas13a能够在距离翻译起始位点特定距离处阻遏Gluc翻译。(B)用dCas13a以及两种靶向crRNA和一种非靶向crRNA靶向的β-肌动蛋白mRNA的RNA免疫沉淀富集。(C)用于成像ACTB的dCas13-GFP和dCas13a-GFP-KRAB构建体的定位之间的比较。(D)与非靶向指导物一起递送的dCas13a-NLS-msfGFP负反馈构建体的其他视野。(E)与ACTB指导物一起递送的dCas13a-NLS-msfGFP负反馈构建体的其他视野。(F)与ACTB指导物一起递送的dCas13a-NLS-msfGFP负反馈构建体的其他视野。
图64A-64B dCas13a-NF可以成像活细胞中的应激颗粒形成。(A)在相应的ACTB靶向和非靶向指导物的情况下,来自dCas13a-NF表达细胞中的ACTB转录物的RNA FISH的代表性图像。细胞轮廓用虚线示出。(B)通过曼德斯重叠系数(左)和皮尔森相关性(右)定量的ACTB RNA FISH信号和dCas13a-NF之间的总体信号重叠。基于每个细胞逐像素地计算相关性和信号重叠。所有值均为均值±SEM,n=3。****p<0.0001;***p<0.001;**p<0.01。双尾学生T检验用于比较。
图65A-65C.直接和附带转录物表达敲低。(A)通过活性与失活Cas13a进行的荧光素酶的敲低。(B)内源基因表达的活性与失活Cas13a敲低。通过失活Cas13a敲低可能是由于因结合而阻断翻译或使转录物不稳定。(C)在哺乳动物细胞中失活Cas13a没有附带活性。使用(A)中失活Cas13a以及针对荧光素酶的指导物1和2,与非靶向对照相比,未观察到转录物分布大小的变化。
图66A-66O.图53的不同C2C2直向同源物的序列比对,指示了共有序列。
图67A-67C.韦德纤毛菌F0279C2c2(“Lew2C2c2”)和纽约李斯特菌FSL M6-0635C2c2(“LibC2c2”)的比对。
图68.展示RNA酶活性的C2c2HEPN结构域的比对。顶部比对块包括先前描述的选定HEPN结构域,并且底部块包括来自C2c2效应蛋白的催化基序。在每个结构域结构下面,在相应蛋白家族的选定代表中保守基序的比对。催化残基用黑色背景上的白色字母显示;保守的疏水残基以黄色突出显示;保守的小残基以绿色突出显示;在桥螺旋比对中,带正电荷的残基为红色。二级结构预测显示在比对的序列下面:H表示α-螺旋,并且E表示延伸构象(β链)。比对块之间保守不佳的间隔子用数字显示。
本文的这些图仅仅是出于说明性的目的,并且不一定是按比例绘制的。
具体实施方式
一般而言,CRISPR-Cas或CRISPR系统是如在上述文献(如WO 2014/093622(PCT/US2013/074667))中使用的,并且共同地是指转录物和涉及CRISPR相关(“Cas”)基因的表达或指导其活性的其他元件,包括编码Cas基因的序列、tracr(反式活化CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(涵盖“同向重复”和在内源CRISPR系统背景下的tracrRNA加工的部分同向重复)、指导序列(在内源CRISPR系统背景下也称为“间隔子(spacer)”)或如该术语在本文中使用的“一个或多个RNA”(例如,指导Cas(如Cas9)的一个或多个RNA,例如CRISPR RNA和反式活化(tracr)RNA或单个指导RNA(sgRNA)(嵌合RNA))或来自CRISPR基因座的其他序列和转录物。一般而言,CRISPR系统的特征在于促进在靶序列(在内源CRISPR系统的背景下也称为原型间隔子)的位点处的CRISPR复合物的形成的元件。当CRISPR蛋白是C2c2蛋白时,不需要tracrRNA。
在CRISPR复合物形成的背景下,“靶序列”是指指导序列被设计为与其具有互补性的序列,其中在靶序列与指导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含RNA多核苷酸。在一些实施例中,靶序列位于细胞的细胞核或细胞质中。在一些实施例中,可以通过计算机搜索重复基序来鉴定同向重复,其满足任一条或全部下列标准:1.发现在II型CRISPR基因座侧翼的基因组序列的2Kb窗口;2.跨从20到50bp;以及3.以20到50bp间隔开。在一些实施例中,可以使用这些标准中的2条,例如1和2、2和3、或1和3。在一些实施例中,可以使用所有这3条标准。
一般而言,指导序列是与靶多核苷酸序列具有足够互补性以便与该靶序列杂交并且指导CRISPR复合物与该靶序列的序列特异性结合的任何多核苷酸序列。术语“靶向序列”意指与靶序列具有足够互补性的指导序列的部分。在一些实施例中,当使用适合的比对算法进行最佳比对时,在指导序列与其相应的靶序列之间的互补程度是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对,其非限制性实例包括史密斯-沃特曼(Smith-Waterman)算法、尼德曼-翁施(Needleman-Wunsch)算法、基于伯罗斯-惠勒变换(Burrows-WheelerTransform)的算法(例如伯罗斯-惠勒比对工具(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技术公司;在www.novocraft.com可获得)、ELAND(亿明达公司(Illumina),圣地亚哥,加利福尼亚州)、SOAP(在soap.genomics.org.cn可获得)以及Maq(在maq.sourceforge.net可获得)。在一些实施例中,指导序列在长度上为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多的核苷酸。在一些实施例中,指导序列在长度上为少于约75、50、45、40、35、30、25、20、15、12个或更少的核苷酸。优选地,指导序列是10-30个核苷酸长。可以通过任何适合的测定法来评估指导序列指导CRISPR复合物与靶序列的序列特异性结合的能力。例如,足以形成CRISPR复合物的CRISPR系统的组分(包括有待测试的指导序列)可以例如通过用编码该CRISPR序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后通过如本文描述的Surveyor测定来评估在该靶序列之内的优先切割。类似地,通过提供该靶序列、包括有待测试的指导序列在内的CRISPR复合物的组分、和不同于该测试指导序列的对照指导序列,并且比较在该测试指导序列与该对照指导序列反应之间的靶序列处的结合或切割率,可以在试管中评估靶多核苷酸序列的切割。其他测定法是可能的,并且将由本领域技术人员想到。
在经典CRISPR-Cas系统中,在指导序列与其相应的靶序列之间的互补程度可以是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%;指导物或RNA或sgRNA在长度上可以为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多的核苷酸;或者指导物或RNA或sgRNA在长度上可以为少于约75、50、45、40、35、30、25、20、15、12个或更少的核苷酸。然而,本发明的一个方面在于减少脱靶相互作用,例如减少指导物与具有低互补性的靶序列的相互作用。的确,在这些实例中,显示本发明涉及突变,这些突变产生能够将具有大于80%至约95%互补性(例如,83%-84%或88%-89%或94%-95%互补性)的靶序列与脱靶序列区分开(例如,将具有18个核苷酸的靶标与具有1、2或3个错配的18个核苷酸的脱靶区分开)的CRISPR-Cas系统。因此,在本发明的背景下,在指导序列与其相应的靶序列之间的互补程度大于94.5%或95%或95.5%或96%或96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%,或是100%。脱靶小于100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90%或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%的该序列与该指导物之间的互补性,其中有利的是脱靶是100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%的该序列与该指导物之间的互补性。
在某些实施例中,可以通过引入错配(例如,1个或多个错配,如间隔子序列和靶序列之间的1或2个错配,包括沿着间隔子/靶标的错配位置)来利用切割效率的调节。例如双错配越中心(即不是3'或5'),切割效率受影响越大。因此,通过沿间隔子选择错配位置,可以调节切割效率。通过举例的方式,如果需要小于100%的靶标切割(例如在细胞群中),可以在间隔子序列中引入间隔子和靶序列之间的1个或更多、如优选2个错配。沿间隔子的错配位置越中心,切割百分比越低。
如本文描述的根据本发明的方法包括在真核细胞中(在体外,即在分离的真核细胞中)诱导一个或多个如本文讨论的核苷酸修饰,包括向细胞递送如本文讨论的载体。该一个或多个突变可以包括经由一种或多种指导物、一种或多种RNA或一种或多种sgRNA在一种或多种细胞的每个靶序列处引入、缺失或取代一个或多个核苷酸。这些突变可以包括经由一种或多种指导物、一种或多种RNA在所述一种或多种细胞的每个靶序列处引入、缺失或取代1-75个核苷酸。这些突变可以包括经由一种或多种指导、一种或多种RNA在所述一种或多种细胞的每个靶序列处引入、缺失或取代1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。这些突变可以包括经由一种或多种指导物、一种或多种RNA在所述一种或多种细胞的每个靶序列处引入、缺失或取代5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。这些突变包括经由一种或多种指导物、一种或多种RNA在所述一种或多种细胞的每个靶序列处引入、缺失或取代10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。这些突变可以包括经由一种或多种指导物、一种或多种RNA在所述一种或多种细胞的每个靶序列处引入、缺失或取代20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。这些突变可以包括经由一种或多种指导物、一种或多种RNA在所述一种或多种细胞的每个靶序列处引入、缺失或取代40、45、50、75、100、200、300、400或500个核苷酸。
为了将毒性和脱靶效应最小化,重要的是控制所递送的Cas mRNA或蛋白质和指导RNA的浓度。Cas mRNA或蛋白质和指导RNA的最佳浓度可以通过在细胞或非人类真核生物动物模型中测试不同的浓度并且使用深度测序分析在潜在的脱靶基因组基因座处的修饰程度来确定。
典型地,在内源CRISPR系统的背景下,CRISPR复合物(包含杂交到靶序列上并且与一种或多种Cas蛋白复合的指导序列)的形成导致在该靶序列中或其附近(例如在距该靶序列1、2、3、4、5、6、7、8、9、10、20、50个或更多的碱基对之内)的切割,但可取决于例如二级结构,特别是在RNA靶标的情况下。
编码Cas的核酸分子有利地是经密码子优化的Cas。密码子优化序列的一个实例在这种情形下是针对在真核生物(例如,人类)中表达(即,针对在人类中表达进行优化)或针对如本文讨论的另一种真核生物、动物或哺乳动物进行优化的序列;参见例如,WO2014/093622(PCT/US2013/074667)中的SaCas9人类密码子优化序列。虽然这是优选的,但是应当理解的是,其他实例也是可能的,并且针对除人类之外的宿主物种的密码子优化或针对具体器官的密码子优化是已知的。在一些实施例中,编码Cas的酶编码序列针对在特定细胞(如真核细胞)中表达进行密码子优化。这些真核细胞可以是特定生物的那些或来源于特定生物的那些,如哺乳动物,包括但不限于人、或如本文讨论的非人类真核生物或动物或哺乳动物,例如小鼠、大鼠、兔、狗、牲畜、或非人类哺乳动物或灵长动物。在一些实施例中,对于人类或动物而言很可能使得他们(它们)受苦而没有任何实质性医学益处的用于修饰人类的种系遗传同一性的方法和/或用于修饰动物的遗传同一性的方法以及还有作为这样的方法的结果的动物可以被排除在外。一般而言,密码子优化是指通过用在宿主细胞的基因中更频繁地或者最频繁地使用的密码子代替天然序列的至少一个密码子(例如约或多于约1、2、3、4、5、10、15、20、25、50个或更多的密码子同时维持该天然氨基酸序列而修饰核酸序列以便增强在感兴趣宿主细胞中的表达的方法。不同的物种对于特定氨基酸的某些密码子展示出特定的偏好。密码子偏好性(在生物之间的密码子使用的差异)经常与信使RNA(mRNA)的翻译效率相关,而翻译效率则被认为尤其依赖于被翻译的密码子的性质和特定的转运RNA(tRNA)分子的可用性。细胞内选定的tRNA的优势一般反映了最频繁用于肽合成的密码子。因此,可以将基因定制为基于密码子优化在给定生物中的最佳基因表达。密码子利用率表可以容易地获得,例如在www.kazusa.orjp/codon/可获得的“密码子使用数据库(CodonUsage Database)”,并且这些表可以通过不同的方式调整适用。参见,Nakamura,Y.等人“Codon usage tabulated from the international DNA sequence databases:statusfor the year 2000[从国际DNA序列数据库中制表的密码子使用:2000年的状态]”Nucl.Acids Res.[核酸研究]28:292(2000)。用于密码子优化特定的序列以便在特定的宿主细胞中表达的计算机算法也是可用的,如Gene Forge(Aptagen公司;雅各布斯(Jacobus),宾夕法尼亚州)也是可用的。在一些实施例中,在编码Cas的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50个或更多的、或所有密码子)对应于对于特定氨基酸最频繁使用的密码子。
在某些实施例中,如本文描述的方法可以包括提供Cas转基因细胞,在其中编码一种或多种指导RNA的一种或多种核酸被提供或被引入,在该细胞中与包含一个或多个感兴趣基因的启动子的调节元件可操作地连接。如本文使用的,术语“Cas转基因细胞”是指其中已经基因组整合了Cas基因的细胞,如真核细胞。根据本发明,该细胞的性质、类型或来源不是特别受限的。而且,该Cas转基因被引入该细胞中的方式可以变化并且可以是如本领域中已知的任何方法。在某些实施例中,通过将该Cas转基因引入分离的细胞中来获得该Cas转基因细胞。在某些其他实施例中,通过从Cas转基因生物中分离细胞来获得该Cas转基因细胞。通过举例的方式并且没有限制,如本文提及的Cas转基因细胞可以来源于Cas转基因真核生物(如Cas敲入真核生物)。参考通过引用并入本文的WO 2014/093622(PCT/US13/74667)。可以修改针对靶向Rosa基因座的转让给桑加莫生物科学公司(SangamoBioSciences,Inc.)的美国专利公开号20120017290和20110265198的方法,以便利用本发明的CRISPR Cas系统。也可以修改针对靶向Rosa基因座的转让给Cellectis公司的美国专利公开号20130236946的方法,以便利用本发明的CRISPR Cas系统。通过进一步举例的方式,参考Platt等人(Cell[细胞];159(2):440-455(2014)),描述了Cas9敲入小鼠,将其通过引用并入本文。该Cas转基因可以进一步包含Lox-Stop-polyA-Lox(LSL)盒,由此赋予可通过Cre重组酶诱导的Cas表达。可替代地,可以通过将该Cas转基因引入分离的细胞中来获得该Cas转基因细胞。转基因的递送系统在本领域是熟知的。通过举例的方式,该Cas转基因可以借助载体(例如,AAV、腺病毒、慢病毒)和/或粒子和/或纳米粒子递送而被递送到例如真核细胞中,还如在本文的其他地方所描述的。
本领域技术人员应理解的是,如本文提及的细胞(如Cas转基因细胞)除了具有整合的Cas基因之外还可以包含另外的基因组改变、或当与能够将Cas导向靶基因座的RNA复合时由Cas的序列特异性作用产生的突变,例如像一个或多个致癌突变,例如像但不限于描述于Platt等人(2014)、Chen等人(2014)或Kumar等人(2009)中的。
在一些实施例中,该Cas序列融合至一个或多个核定位序列(NLS)或核输出信号(NES),如约或多于约1、2、3、4、5、6、7、8、9、10个或更多的NLS或NES。在一些实施例中,该Cas包含在氨基-末端处或其附近的约或多于约1、2、3、4、5、6、7、8、9、10个或更多的NLS或NES,在羧基-末端处或其附近的约或多于约1、2、3、4、5、6、7、8、9、10个或更多的NLS或NES,或这些的组合(例如在氨基-末端处的零个或至少一个或多个NLS或NES以及在羧基-末端处的零个或至少一个或多个NLS或NES)。当存在多于一个NLS或NES时,每一个可以被选择为不依赖于其他NLS或NES,使得在多于一个拷贝中可以存在单个NLS或NES和/或与在一个或多个拷贝中存在一个或多个其他NLS或NES相组合。在本发明的一个优选的实施例中,该Cas包含至多6个NLS。在一些实施例中,当NLS或NES的最邻近的氨基酸是在从N-末端或C-末端沿着该多肽链的约1、2、3、4、5、10、15、20、25、30、40、50个或更多的氨基酸之内时,NLS或NES可以被视为在该N-末端或C-末端附近。NLS的非限制性实例包括衍生自以下的NLS序列:SV40病毒大T抗原的NLS,具有氨基酸序列PKKKRKV(SEQ ID NO:X);来自核质蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK的核质蛋白二分NLS)(SEQ ID NO:X);c-myc NLS,具有氨基酸序列PAAKRVKLD(SEQ ID NO:X)或RQRRNELKRSP(SEQ ID NO:X);hRNPA1M9NLS,具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:X);来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:X);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:X)和PPKKARED(SEQ ID NO:X);人p53的序列POPKKKPL(SEQ ID NO:X);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:X);流感病毒NS1的序列DRLRR(SEQ IDNO:X)和PKQKKRK(SEQ ID NO:X);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:X);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:X);人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:X);以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:X)。NES的非限制性实例包括NES序列LYPERLRRILT(ctgtaccctgagcggctgcggcggatcctgacc)。一般而言,该一个或多个NLS或NES具有足够的强度,以便分别在真核细胞的细胞核或细胞质中驱动该Cas以可检测的量积累。一般而言,核定位/输出活性的强度可以由在该Cas中的NLS/NES的数目、所使用的一个或多个特定的NLS/NES或这些因素的组合导出。可以通过任何适合的技术进行细胞核/细胞质中积累的检测。例如,检测标记可以与该Cas融合,使得细胞内的位置可以被可视化,如与检测细胞核(例如,对细胞核具有特异性的染料,如DAPI)或细胞质的位置的手段相结合。还可以将细胞核从细胞中分离出来,然后可以通过任何适合的用于检测蛋白质的方法(如免疫组织化学、Western印迹或酶活性测定)分析其内容物。如通过测定CRISPR复合物形成的作用(例如,测定在靶序列处的DNA切割或突变、或测定由于CRISPR复合物形成和/或Cas酶活性的影响而改变的基因表达活性),与没有暴露于该Cas或复合物、或暴露于缺乏该一个或多个NLS或NES的Cas的对照相比较,还可以间接地确定细胞核中的积累。在某些实施例中,其他定位标签可以与Cas蛋白融合,如但不限于将Cas定位至细胞中的特别位点,如细胞器,如线粒体、质体、叶绿体、囊泡、高尔基体、(核或细胞)膜、核糖体、核仁、ER、细胞骨架、液泡、中心体、核小体、颗粒、中心粒等。
在某些方面,本发明涉及载体,这些载体例如用于将Cas和/或能够将Cas导向靶基因座的RNA(即指导RNA)递送或引入细胞中,而且还用于繁殖这些组分(例如在原核细胞中)。如本文使用的,“载体”是允许或促进实体从一个环境转移到另一个环境中的工具。它是复制子,如质粒、噬菌体或粘粒,另一个DNA区段可以插入其中,从而引起该插入的区段的复制。通常,当与适当的控制元件相关联时,载体能够复制。一般而言,术语“载体”是指如下核酸分子,其能够运送与其连接的另一种核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个自由端、无自由端(例如环状的)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的DNA区段的环状双链DNA环。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒(AAV))的载体中。病毒载体还包括由用于转染到宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被引入的宿主细胞中自主复制。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与宿主基因组一起复制。此外,某些载体能够指导它们操作性地连接的基因的表达。此类载体在本文称为“表达载体”。在重组DNA技术中使用的常见表达载体通常呈质粒形式。
重组表达载体可以包含呈适合于在宿主细胞中表达核酸的形式的本发明的核酸,这意味着这些重组表达载体包括基于待用于表达的宿主细胞而选择的一种或多种调节元件,所述调节元件操作性地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许该核苷酸序列的表达的方式被连接至该一种或多种调节元件(例如,处于体外转录/翻译系统中或当该载体被引入到宿主细胞中时,处于该宿主细胞中)。关于重组和克隆方法,提及2004年9月2日以US 2004-0171156 A1公开的美国专利申请10/815,730,将该专利的内容通过引用以其整体并入本文。
该一种或多种载体可以包括一种或多种调节元件,例如一种或多种启动子。该一种或多种载体可以包含Cas编码序列和/或单一指导RNA编码序列,但是可能地,还可以包含至少3或8或16或32或48或50种指导RNA(例如,sgRNA)编码序列,如1-2、1-3、1-4、1-5、3-6、3-7、3-8、3-9、3-10、3-8、3-16、3-30、3-32、3-48、3-50种RNA(例如,sgRNA)。在单一载体中,有利地当存在高达约16种RNA时,可以存在启动子针对每种RNA(例如,sgRNA);并且,当单一载体提供多于16种RNA时,一种或多种启动子可以驱动该一种或多种RNA中的多于一种的表达,例如当存在32种RNA,每种启动子都可以驱动两种RNA的表达,并且当存在48种RNA时,每种启动子都可以驱动三种RNA的表达。通过简单的算术以及良好建立的克隆方案和本披露的传授,本领域的普通技术人员可以容易地就一种或多种RNA针对适合的示例性载体(如AAV)和适合的启动子(如U6启动子)而言实践本发明。例如,AAV的包装极限是约4.7kb。单个U6-gRNA(加克隆用的限制性位点)的长度是361bp。因此,本领域技术人员可以容易地将约12-16个(例如,13个)U6-gRNA盒装配进单一载体中。这可以通过任何合适的手段进行组装,如用于TALE组装的金门(golden gate)策略(http://www.genome-engineering.org/taleffectors/)。本领域技术人员还可以使用串联指导策略将U6-gRNA的数目增加大约1.5倍,例如从12-16个(例如,13个)增加到大约18-24个(例如,约19个)U6-gRNA。因此,本领域的普通技术人员可以在单一载体(例如,AAV载体)中容易地达到大约18-24个(例如,约19个)启动子-RNA(例如,U6-gRNA)。用于增加载体中的启动子和RNA的数目的另一种手段是使用单个启动子(例如,U6)来表达一系列由可切割的序列隔开的RNA。并且用于增加载体中的启动子-RNA的数目的又另一种手段是在编码序列或基因的内含子中表达一系列由可切割的序列隔开的启动子-RNA;并且,在这种情况下,有利的是使用聚合酶II启动子,它可以具有增加的表达并且按组织特异性方式使得长RNA能够转录。(参见例如,http://nar.oxfordjournals.org/content/34/7/e53.short,http://www.nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在一个有利的实施例中,AAV可以包装靶向高达约50个基因的U6串联gRNA。因此,根据本领域的知识以及本披露的传授,本领域技术人员可以容易地制备和使用一种或多种载体(例如,单一载体),该一种或多种载体在操作性地或功能性地连接的一种或多种启动子的控制下表达多种RNA或指导物—尤其是就本文讨论的RNA或指导物的数目而言,而无需进行任何过度的实验。
该一种或多种指导RNA的编码序列和/或Cas编码序列可以功能性地或操作性地连接至一种或多种调节元件,并且因此该一种或多种调节元件驱动表达。该一种或多种启动子可以是一种或多种组成型启动子和/或一种或多种条件型启动子和/或一种或多种诱导型启动子和/或一种或多种组织特异性启动子。该启动子可以选自下组,该组由以下组成:RNA聚合酶、pol I、pol II、pol III、T7、U6、H1、逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子以及EF1α启动子。一种有利的启动子是启动子U6。
本发明的方面涉及鉴定和工程化与2类CRISPR-Cas系统相关联的新颖效应蛋白。在一个优选的实施例中,效应蛋白包含单亚基效应物模块。在又一个实施例中,效应蛋白在原核或真核细胞中起作用,用于体外、体内或离体应用。本发明的一个方面涵盖用于预测新的2类CRISPR-Cas系统并鉴定其中的组分的计算方法和算法。
在一个实施例中,鉴定新颖的2类CRISPR-Cas基因座的计算方法包括以下步骤:检测编码Cas1蛋白的所有重叠群;鉴定cas1基因20kB内所有预测的蛋白质编码基因,特别是在距离cas1基因起点20kb和距离cas1基因末端20kb的区域内;比较经鉴定的基因与Cas蛋白特异性谱并预测CRISPR阵列;选择含有大于500个氨基酸(>500aa)的蛋白质的部分和/或未分类的候选CRISPR-Cas基因座;使用PSI-BLAST和HHPred分析选择的候选物,从而分离和鉴定新颖的2类CRISPR-Cas基因座。除了上述步骤之外,可以通过在宏基因组数据库中搜索其他同源物来进行候选物的额外分析。
在一个方面,检测编码Cas1蛋白的所有重叠群由GenemarkS进行,GenemarkS是在如下文献中进一步描述的基因预测程序:“GeneMarkS:a self-training method forprediction of gene starts in microbial genomes.Implications for findingsequence motifs in regulatory regions.[GeneMarkS:一种用于预测微生物基因组中基因起始的自身训练方法.在监管区域寻找序列基序的意义].”John Besemer,AlexandreLomsadze和Mark Borodovsky,Nucleic Acids Research[核酸研究](2001)29,第2607-2618页,通过引用并入本文。
在一个方面,通过将经鉴定的基因与Cas蛋白特异性谱进行比较来鉴定所有预测的蛋白质编码基因,并根据NCBI保守结构域数据库(CDD)对其进行注释,NCBI保守域数据库(CDD)是蛋白质注释资源,其由古生结构域和全长蛋白质的注释良好的多重序列比对模型的集合组成。这些可用作位置特异性评分矩阵(PSSM),用于经由RPS-BLAST快速鉴定蛋白质序列中的保守结构域。CDD内容包括NCBI收录的结构域,其使用3D结构信息来明确定义结构域边界,并提供对序列/结构/功能关系的见解,以及来自多个外部源数据库(Pfam、SMART、COG、PRK、TIGRFAM)的结构域模型。在又一个方面,使用PILER-CR程序预测CRISPR阵列,PILER-CR程序是用于发现CRISPR重复的公共领域软件,如描述于“PILER-CR:fast andaccurate identification of CRISPR repeats[PILER-CR:快速且准确地鉴定CRISPR重复]”,Edgar,R.C.,BMC Bioinformatics[BMC生物信息学],1月20日;8:18(2007),通过引用并入本文。
在又一个方面,使用PSI-BLAST(位置特异性迭代基本局部比对搜索工具(Position-Specific Iterative Basic Local Alignment Search Tool))进行逐个情况分析。使用蛋白质-蛋白质BLAST,PSI-BLAST得到位置特异性评分矩阵(PSSM)或来自在给定评分阈值以上检测到的序列的多重序列比对谱。这种PSSM用于进一步搜索数据库中的新匹配,并随后用这些新检测到的序列进行迭代更新。因此,PSI-BLAST提供了检测蛋白质之间远缘关系的手段。
在另一个方面,使用HHpred进行逐个情况分析,HHpred是用于序列数据库搜索和结构预测的方法,该方法与BLAST或PSI-BLAST一样易于使用,并且同时在寻找远程同源物方面更敏感。事实上,HHpred的敏感性与目前可用的结构预测功能最强大的服务器相当。HHpred是第一款基于配置文件隐藏马尔可夫模型(HMM)成对比较的服务器。尽管大多数常规序列搜索方法搜索序列数据库(如UniProt或NR),但HHpred搜索比对数据库(像Pfam或SMART)。这极大地简化了针对多个序列家族而不是混乱的单个序列的命中物的列表。所有主要公开可用的配置文件和比对数据库都可以通过HHpred获得。HHpred接受单个查询序列或多重比对作为输入。在仅仅几分钟内,它就以与PSI-BLAST相似的易读格式返回搜索结果。搜索选项包括局部对比或总体对比和评分二级结构相似性。HHpred可以产生成对的查询-模板序列比对、合并的查询-模板多重比对(例如用于传递式搜索)以及由来自HHpred比对的MODELLER软件计算的3D结构模型。
术语“靶向核酸的系统”(其中核酸是DNA或RNA,并且在一些方面还可以指DNA-RNA杂合体或其衍生物)共同地是指转录物和涉及靶向DNA或RNA的CRISPR相关(“Cas”)基因的表达或指导其活性的其他元件,其可以包括编码靶向DNA或RNA的Cas蛋白的序列、和包含CRISPR RNA(crRNA)序列和(在一些但不是所有系统中)反式活化CRISPR/Cas系统RNA(tracrRNA)序列的靶向DNA或RNA的指导RNA、或来自靶向DNA或RNA的CRISPR基因座的其他序列和转录物。一般来说,靶向RNA的系统的特征在于促进在靶DNA或RNA序列的位点处形成DNA或RNA靶向复合物的元件。在DNA或RNA靶向复合物形成的背景下,“靶序列”是指靶向DNA或RNA的指导RNA被设计为与其具有互补性的DNA或RNA序列,其中在靶序列与靶向RNA的指导RNA之间的杂交促进RNA靶向复合物的形成。在一些实施例中,靶序列位于细胞的细胞核或细胞质中。
在本发明的一个方面,新颖的RNA靶向系统(还称为本申请的RNA或RNA靶向CRISPR/Cas或CRISPR-Cas系统RNA靶向系统)基于不要求产生用以靶向特定RNA序列的定制蛋白质的鉴定出的VI型Cas蛋白,而是单个酶可以通过RNA分子被编程成识别特定RNA靶标,换言之,使用所述RNA分子可以将该酶募集到特定RNA靶标上。
在本发明的一个方面,新颖的DNA靶向系统(还称为本申请的DNA或DNA靶向CRISPR/Cas或CRISPR-Cas系统RNA靶向系统)基于不要求产生用以靶向特定RNA序列的定制蛋白质的鉴定出的VI型Cas蛋白,而是单个酶可以通过RNA分子被编程成识别特定DNA靶标,换言之,使用所述RNA分子可以将该酶募集到特定DNA靶标上。
本文描述的靶向核酸的系统、载体系统、载体和组合物可以用于各种靶向核酸的应用中,从而改变或修饰基因产物(如蛋白质)的合成、核酸切割、核酸编辑、核酸剪接、靶核酸的运输、靶核酸的追踪、靶核酸的分离、靶核酸的可视化等。
如本文使用的,Cas蛋白或CRISPR酶是指CRISPR-Cas系统的新分类中呈现的任何蛋白质。
C2c2核酸酶
2类VI型效应蛋白C2c2是RNA指导的RNA酶,其可以被有效地编程成降解ssRNA。本发明的C2c2效应蛋白包括但不限于以下21种直向同源物种(包括多个CRISPR基因座:沙氏纤毛菌;韦德纤毛菌(Lw2);塞氏李斯特菌;毛螺菌科细菌MA2020;毛螺菌科细菌NK4A179;嗜氨基梭菌DSM 10710;鸡肉杆菌DSM 4847;鸡肉杆菌DSM 4847(第二个CRISPR基因座);产丙酸沼杆菌WB4;威氏李斯特菌FSL R9-0317;李斯特菌科细菌FSL M6-0635;韦德纤毛菌F0279;荚膜红细菌SB 1003;荚膜红细菌R121;荚膜红细菌DE442;口腔纤毛菌C-1013-b;Herbinix hemicellulosilytica;直肠真杆菌([Eubacterium]rectale);真杆菌科细菌CHKCI004;布劳特氏菌属物种马赛(Blautia sp.Marseille)-P2398;和纤毛菌属物种口腔分类群879菌株F0557。十二(12)种另外的非限制性实例是:毛螺菌科细菌NK4A144;聚集绿屈挠菌(Chloroflexus aggregans);桔红色去甲基醌菌(Demequina aurantiaca);海旋菌属(Thalassospira)物种TSL5-1;假丁酸弧菌属(Pseudobutyrivibrio)物种OR37;丁酸弧菌属(Butyrivibrio)物种YAB3001;布劳特氏菌属物种马赛-P2398;纤毛菌属物种马赛(Leptotrichia sp.Marseille)-P3007;爱华拟杆菌(Bacteroides ihuae);紫单胞菌科(Porphyromonadaceae)细菌KH3CP3RA;崖李斯特菌(Listeria riparia);和Insolitispirillum peregrinum。
C2c2通过其两个HEPN结构域内的保守碱基残基实现RNA切割。HEPN结构域的突变(如预测的HEPN结构域催化残基的(例如丙氨酸)取代)可以用于将C2c2转化为无活性的可编程的RNA结合蛋白(dC2c2,类似于dCas9)。
根据本发明,可以从多种C2c2直向同源物产生共有序列,其可以帮助定位保守氨基酸残基和基序,包括但不限于C2c2直向同源物中介导C2c2功能的催化残基和HEPN基序。使用Geneious比对从上述33种直向同源物产生的一个这样的共有序列是:MKISKVXXXVXKKXXXGKLXKXVNERNRXAKRLSNXLBKYIXXI DKIXKKEXXKKFXAXEEITLKLNQXXXBXLXKAXXDLRKDNXYSXJKKILHNEDINXEEXELLINDXLEKLXKIESXKYSYQKXXXNYXMSVQEHSKKSIXRIXESAKRNKEALDKFLKEYAXLDPRMEXLAKLRKLLELYFYFKNDXIXXEEEXNVXXHKXLKENHPDFVEXXXNKENAELNXYAIEXKKJLKYYFPXKXAKNSNDKIFEKQELKKXWIHQJENAVERILLXXGKVXYKLQXGYLAELWKIRINEIFIKYIXVGKAVAXFALRNXXKBENDILGGKIXKKLNGITSFXYEKIKAEEILQREXAVEVAFAANXLYAXDLXXIRXSILQFFGGASNWDXFLFFHFATSXISDKKWNAELIXXKKJGLVIREKLYSNNVAMFYSKDDLEKLLNXLXXFXLRASQVPSFKKVYVRXBFPQNLLKKFNDEKDDEAYSAXYYLLKEIYYNXFLPYFSANNXFFFXVKNLVLKANKDKFXXAFXDIREMNXGSPIEYLXXTQXNXXNEGRKKEEKEXDFIKFLLQIFXKGFDDYLKNNXXFILKFIPEPTEXIEIXXELQAWYIVGKFLNARKXNLLGXFXSYLKLLDDIELRALRNENIKYQSSNXEKEVLEXCLELIGLLSLDLNDYFBDEXDFAXYJGKXLDFEKKXMKDLAELXPYDQNDGENPIVNRNIXLAKKYGTLNLLEKJXDKVSEKEIKEYYELKKEIEEYXXKGEELHEEWXQXKNRVEXRDILEYXEELXGQIINYNXLXNKVLLYFQLGLHYLLLDILGRLVGYTGIWERDAXLYQIAAMYXNGLPEYIXXKKNDKYKDGQIVGXKINXFKXDKKXLYNAGLELFENXNEHKNIXIRNYIAHFNYLSKAESSLLXYSENLRXLFSYDRKLKNAVXKSLINILLRHGMVLKFKFGTDKKSVXIRSXKKIXHLKSIAKKLYYPEVXVSKEYCKLVKXLLKYK。
从上述直向同源物中鉴定的HEPN序列基序提供于图49和图50中,分别基于前21种直向同源物和所有33种直向同源物。基于上述共有序列,可以突变以产生无催化活性的C2c2突变体的氨基酸残基的非限制性实例包括(在HEPN1中或其附近)D372、R377、Q/H382和F383或者直向同源物的相应氨基酸,以及(在HEPN2中或其附近)K893、N894、R898、N899、H903、F904、Y906、Y927、D928、K930、K932或者直向同源物的相应氨基酸。
在另一个非限制性实例中,用于辅助产生共有序列和鉴定保守残基的序列比对工具是MUSCLE比对工具(www.ebi.ac.uk/Tools/msa/muscle/)。例如,使用MUSCLE,可以在韦德纤毛菌C2c2中鉴定出在C2c2直向同源物中保守的下列氨基酸位置:K2;K5;V6;E301;L331;I335;N341;G351;K352;E375;L392;L396;D403;F446;I466;I470;R474(HEPN);H475;H479(HEPN),E508;P556;L561;I595;Y596;F600;Y669;I673;F681;L685;Y761;L676;L779;Y782;L836;D847;Y863;L869;I872;K879;I933;L954;I958;R961;Y965;E970;R971;D972;R1046(HEPN),H1051(HEPN),Y1075;D1076;K1078;K1080;I1083;I1090。
图52A-52K显示了C2c2直向同源物的比对。图52L显示了HEPN结构域的示例性序列比对和高度保守残基。
C2c2HEPN也可以靶向DNA、或潜在的DNA和/或RNA。基于C2c2的HEPN结构域至少能够与其野生型结合并且以其野生型形式切割RNA,则优选C2c2效应蛋白具有RNA酶功能。其也可以或可替代地具有DNase功能。
因此,在一些实施例中,效应蛋白可以是RNA结合蛋白,如失活Cas型效应蛋白,其可以任选地如本文描述的用例如转录活化因子或阻遏因子结构域、NLS或其他功能结构域功能化。在一些实施例中,效应蛋白可以是切割单链RNA的RNA结合蛋白。如果结合的RNA是ssRNA,则ssRNA被完全切割。在一些实施例中,效应蛋白可以是切割RNA双链的RNA结合蛋白,例如如果其包含两个RNA酶结构域的话。如果结合的RNA是dsRNA,则dsRNA被完全切割。
CRISPR系统中的RNA酶功能是已知的,例如已经报道了针对某些III型CRISPR-Cas系统的mRNA靶向(Hale等人,2014,Genes Dev[基因与发育],第28卷,2432-2443;Hale等人,2009,Cell[细胞],第139卷,945-956;Peng等人,2015,Nucleic acids research[核酸研究],第43卷,406-417),并提供显著的优点。在表皮葡萄球菌(Staphylococcus epidermis)III-A型系统中,跨靶标的转录导致靶DNA及其转录物的切割,由Cas10-Csm核糖核蛋白效应复合物内的独立活性位点介导(参见,Samai等人,2015,Cell[细胞],第151卷,第1164-1174页)。因此提供了经由本发明效应蛋白靶向RNA的CRISPR-Cas系统、组合物或方法。
靶RNA(即感兴趣的RNA)是本发明靶向的RNA,其导致靶RNA上感兴趣的靶位点处的效应蛋白的募集和效应蛋白的结合。靶RNA可以是任何合适形式的RNA。在一些实施例中,这可以包括mRNA。在其他实施例中,靶RNA可以包括tRNA或rRNA。在其他实施例中,靶RNA可以包括miRNA。在其他实施例中,靶RNA可以包括siRNA。
干扰RNA(RNAi)和微小RNA(miRNA)
在其他实施例中,靶RNA可以包括干扰RNA,即参与真核生物和原核生物中的RNA干扰途径的RNA,如shRNA、siRNA等。在其他实施例中,靶RNA可以包括微小RNA(miRNA)。对干扰RNA或miRNA的控制可以通过在体内或体外减少干扰RNA或miRNA的寿命来帮助减少用那些方法看到的脱靶效应(OTE)。
在某些实施例中,靶标不是miRNA本身,而是miRNA靶标的miRNA结合位点。
在某些实施例中,可以隔离miRNA(如包括亚细胞重新定位)。在某些实施例中,可以切割miRNA,如但不限于在发夹处。
在某些实施例中,miRNA加工(如包括转换)增加或减少。
如果效应蛋白和合适的指导物被选择性表达(例如在空间或时间上在合适的启动子(例如组织或细胞周期特异性启动子)和/或增强子的控制下),则这可以用于“保护”这些细胞或系统(在体内或体外)免受那些细胞中的RNAi。在其中不需要RNAi的邻近组织或细胞中,或者为了比较其中效应蛋白和合适的指导物被表达和不被表达的细胞或组织(即,分别是其中RNAi未被控制和其中RNAi被控制),这可能是有用的。效应蛋白可以用于控制或结合包含RNA或由RNA组成的分子,如核酶、核糖体或核糖开关。在本发明的实施例中,RNA指导物可以将效应蛋白募集到这些分子,使得效应蛋白能够结合至它们。
本发明的蛋白质系统可以根据本披露无需过多实验而应用于RNAi技术领域(包括治疗、测定和其他应用)(参见例如,Guidi等人,PLoS Negl Trop Dis[公共科学图书馆·被忽视的热带病]9(5):e0003801.doi:10.1371/journal.pntd;Crotty等人,In vivo RNAiscreens:concepts and applications[体内RNAi筛选:概念和应用].ShaneCrotty...2015爱思唯尔有限公司由爱思唯尔公司出版,Pesticide Biochemistry andPhysiology[杀有害生物剂生物化学与生理学](影响因子:2.01).01/2015;120.DOI:10.1016/j.pestbp.2015.01.002和Makkonen等人,Viruses[病毒]2015,7(4),2099-2125;doi:10.3390/v7042099),因为本申请为该系统的有根据的工程化提供了基础。
核糖体RNA(rRNA)
例如,氮杂内酯抗生素(如阿奇毒素)是熟知的。它们靶向并破坏50S核糖体亚基。在一些实施例中,本发明的效应蛋白连同合适的靶向50S核糖体亚基的指导RNA可以被募集并结合至50S核糖体亚基。因此,提供了与针对核糖体(特别是50s核糖体亚基)靶标的合适的指导物配合的本发明的效应蛋白。使用这种与针对核糖体(特别是50s核糖体亚基)靶标的合适指导物配合的效应蛋白的用途可以包括抗生素用途。具体而言,抗生素的用途类似于氮杂内酯抗生素(如阿奇毒素)的作用。在一些实施例中,可以靶向原核生物核糖体亚基,如原核生物中的70S亚基、上述50S亚基、30S亚基以及16S和5S亚基。在其他实施例中,可以靶向真核生物核糖体亚基,如真核生物中的80S亚基、60S亚基、40S亚基以及28S、18S、5.8S和5S亚基。
在一些实施例中,效应蛋白可以是任选功能化的RNA结合蛋白,如本文描述的。在一些实施例中,效应蛋白可以是切割单链RNA的RNA结合蛋白。在任一种情况下,但特别是在RNA结合蛋白切割单链RNA的情况下,核糖体功能可以被调节,特别是被减少或破坏。这可以适用于任何核糖体RNA和任何核糖体亚基,并且rRNA的序列是熟知的。
因此,通过使用与对核糖体靶标的合适指导物配合的本发明的效应蛋白来设想对核糖体活性的控制。这可以是通过切割或结合到核糖体。具体而言,设想降低核糖体活性。这可以用于在体内或体外测定核糖体功能,但也可作为基于核糖体活性的体内或体外控制疗法的手段。此外,设想在体内或体外系统中控制(即减少)蛋白质合成,这种控制包括抗生素和研究和诊断用途。
核糖开关
核糖开关(也称为船蛸属酶(aptozyme))是结合小分子的信使RNA分子的调节区段。这典型地导致由mRNA编码的蛋白质的产生的变化。因此,通过使用与核糖开关靶标的合适指导物配合的本发明的效应蛋白来设想对核糖开关活性的控制。这可以是通过切割或结合到核糖开关。具体而言,设想降低核糖开关活性。这可以用于在体内或体外测定核糖开关功能,但也可作为基于核糖开关活性的体内或体外控制疗法的手段。此外,设想在体内或体外系统中控制(即减少)蛋白质合成。对于rRNA,这种控制可以包括抗生素和研究和诊断用途。
核酶
核酶是具有催化特性的RNA分子,类似于酶(其当然是蛋白质)。因为核酶(天然存在的和工程化的核酶两者)包含RNA或由RNA组成,它们也可以被本发明的RNA结合效应蛋白靶向。在一些实施例中,效应蛋白可以是RNA结合蛋白切割核酶从而使其失活。因此,通过使用与核酶靶标的合适指导物配合的本发明的效应蛋白来设想对核酶活性的控制。这可以是通过切割或结合到核酶。具体而言,设想降低核酶活性。这可以用于在体内或体外测定核酶功能,但也可作为基于核酶活性的体内或体外控制疗法的手段。
基因表达,包括RNA加工
效应蛋白也可以与合适的指导物一起用于靶向基因表达,包括经由对RNA加工的控制。对RNA加工的控制可以包括RNA加工反应,如RNA剪接,包括经由靶向RNApol的可变剪接;病毒复制(特别是卫星病毒、噬菌体和逆转录病毒,如本文列出的HBV、HBC和HIV等),包括植物中的类病毒;和tRNA的生物合成。效应蛋白和合适的指导物也可以用于控制RNA活化(RNAa)。RNAa导致基因表达的促进,因此可以通过破坏或降低RNAa并因此减少基因表达的促进来实现对基因表达的控制。这将在下面更详细地讨论。
RNAi筛选
鉴定其敲低与表型变化相关的基因产物,可以经由RNAi筛选来探询生物学途径并鉴定组成部分。也可以通过使用效应蛋白和合适的指导物在这些筛选中或在这些筛选期间施加控制,以去除或降低筛选中RNAi的活性,从而(通过除去或减少干扰/阻遏)来恢复(先前受干扰的)基因产物的活性。
卫星RNA(satRNA)和卫星病毒也可以被处理。
本文关于RNA酶活性的控制通常意指降低、消极破坏或敲低或敲除。
体内RNA应用
抑制基因表达
本文提供的靶标特异性RNA酶允许非常特异性切割靶RNA。由于基因组未被修饰,RNA水平上的干扰允许在空间和时间两者上以非侵入方式调节。
已经证明许多疾病可通过mRNA靶向治疗。尽管大多数这些研究涉及siRNA的给药,但清楚的是本文提供的RNA靶向效应蛋白能以类似的方式给药。
mRNA靶标(和相应的疾病治疗)的实例是VEGF、VEGF-R1和RTP801(治疗AMD和/或DME)、半胱天冬酶2(治疗Naion)、ADRB2(治疗眼内压)、TRPVI(治疗干眼症)、Syk激酶(用于治疗哮喘)、Apo B(治疗高胆固醇血症或低β脂蛋白血症)、PLK1、KSP和VEGF(治疗实体瘤)、Ber-Abl(治疗CML)(Burnett和Rossi Chem Biol.[生物化学]2012,19(1):60–71)。类似地,已经证明RNA靶向在治疗RNA病毒介导的疾病(如HIV(靶向HIV Tet和Rev)、RSV(靶向RSV核衣壳蛋白)和HCV(靶向miR-122)(Burnett和Rossi Chem Biol.[生物化学]2012,19(1):60–71)中是有效的。
进一步设想本发明的RNA靶向效应蛋白可以用于突变特异性或等位基因特异性敲低。指导RNA可以被设计为特异性靶向转录的mRNA中包含突变的序列或等位基因特异性序列。这种特异性敲低特别适用于涉及与突变或等位基因特异性基因产物有关的障碍的治疗应用。例如,大多数家族性低β脂蛋白血症(FHBL)病例是由ApoB基因突变引起的。此基因编码载脂蛋白B蛋白的两种形式:短形式(ApoB-48)和更长形式(ApoB-100)。导致FHBL的几种ApoB基因突变导致两种形式的ApoB异常短。用本发明的RNA靶向效应蛋白特异性靶向和敲低突变的ApoB mRNA转录物在治疗FHBL中可能是有益的。作为另一个实例,亨廷顿氏病(HD)是由编码亨廷顿蛋白的基因中CAG三联体重复序列的扩增引起的,其导致异常蛋白。用本发明的RNA靶向效应蛋白特异性靶向和敲低编码亨廷顿蛋白的突变或等位基因特异性mRNA转录物在治疗HD中可能是有益的。
应该注意的是,在这种背景下,并且更一般地,对于如本文描述的不同应用,可以设想使用断裂形式的RNA靶向效应蛋白。事实上,这不仅可以允许提高特异性,而且对于递送也可能是有利的。在C2c2酶的两个部分实质上包含功能化C2c2的意义上,该C2c2是断裂型的。理想地,断裂应当始终是这样的,使得该一个或多个催化结构域不受影响。该C2c2可以作为核酸酶发挥作用,或者由于在其催化结构域中典型的一个或多个突变,它可能是失活C2c2(其实质上是具有很少或没有催化活性的RNA结合蛋白)。
断裂型C2c2的每一半可以与二聚化配偶体融合。通过举例的方式并且没有限制,采用雷帕霉素敏感型二聚化结构域允许产生用于在时间上控制C2c2活性的化学诱导断裂型C2c2。因此通过被断裂成两个片段可以使C2c2成为化学诱导型的,并且雷帕霉素敏感型二聚化结构域可以被用于C2c2的受控重组装。断裂型C2c2的两个部分可以被认为是该断裂型C2c2的N’末端部分和C’末端部分。融合典型地是在C2c2的断裂点。换言之,断裂型C2c2的C’末端或N’末端部分与二聚体两个一半之一融合,同时N’末端的C’末端部分与二聚体的另一半融合。
在断裂是新产生的意义上,C2c2不一定是断裂型的。典型地经由计算机模拟设计断裂点并将其克隆到构建体中。总之,断裂型C2c2的两个部分(N’末端和C’末端部分)形成完整的C2c2,优选地包含至少70%或更多的野生型氨基酸(或编码它们的核苷酸),优选至少80%或更多、优选至少90%或更多、优选至少95%或更多并且最优选至少99%或更多的野生型氨基酸(或编码它们的核苷酸)。一些修剪是可能的,并且设想了突变体。可以完全去除非功能结构域。重要的是,这两个部分可以被聚到一起并且所希望的C2c2功能被恢复或重构。二聚体可以是同二聚体或异二聚体。
在某些实施例中,如本文描述的C2c2效应物可以用于突变特异性或等位基因特异性靶向,例如用于突变特异性或等位基因特异性敲低。
此外,RNA靶向效应蛋白可以与另一功能性RNA酶结构域融合,如非特异性RNA酶或Argonaute 2,它们协同作用以增加RNA酶活性或确保信息的进一步降解。
通过调节RNA功能的基因表达的调节
除了通过切割mRNA直接影响基因表达外,RNA靶向也可以用于影响细胞内RNA加工的特定方面,这可能允许对基因表达进行更微妙的调节。通常,调节可以例如通过干扰蛋白质与RNA的结合(例如像阻断蛋白质的结合或募集RNA结合蛋白)来介导。事实上,可以在不同的水平(如mRNA的剪接、运输、定位、翻译和转换)上确保调节。类似地,在治疗的背景下,可以设想通过使用RNA特异性靶向分子来解决在这些水平中的每一个水平上的(致病)错误(malfunctioning)。在这些实施例中,在许多情况下优选的是,RNA靶向蛋白是丧失切割RNA靶标但保持其结合RNA靶标的能力的“失活”C2c2,如本文描述的c2c2的突变形式。
A)可变剪接
许多人类基因由于可变剪接而表达多种mRNA。已经显示不同的疾病与异常剪接相关,导致表达基因的功能丧失或功能获得。虽然这些疾病中的一些是由引起剪接缺陷的突变引起的,但其中一些不是。一种治疗选择是直接针对剪接机制。本文描述的RNA靶向效应蛋白可以例如用于阻断或促进剪接,包括或排除外显子并影响特定同种型的表达和/或刺激可替代蛋白质产物的表达。下面将更详细地描述此类应用。
与靶RNA结合的RNA靶向效应蛋白可以空间阻断剪接因子对RNA序列的接入。被靶向剪接位点的RNA靶向效应蛋白可以在位点处阻断剪接,任选地将剪接重定向至邻近位点。例如,与5'剪接位点结合的RNA靶向效应蛋白可以阻断剪接体的U1组分的募集,有利于外显子跨越。可替代地,被靶向剪接增强子或沉默子的RNA靶向效应蛋白可以防止在靶位点结合反式作用调节剪接因子并有效阻断或促进剪接。如本文描述的,通过RNA靶向效应蛋白将ILF2/3募集到外显子附近的前体mRNA可以进一步实现外显子排除。作为又另一个实例,可以附接富含甘氨酸的结构域用于募集hnRNP A1和外显子排除(Del Gatto-Konczak等人MolCell Biol.[分子与细胞生物学]1999年1月;19(1):251-60)。
在某些实施例中,通过适当选择gRNA,可以靶向特定剪接变体,并且其他剪接变体不会被靶向。
在一些情况下,RNA靶向效应蛋白可以用于促进剪接(例如,在剪接有缺陷的情况下)。例如,RNA靶向效应蛋白可以与能够稳定剪接调节茎环的效应物缔合,以便进一步剪接。RNA靶向效应蛋白可以与特定剪接因子的共有结合位点序列连接,以将蛋白质募集到靶DNA。
与异常剪接相关的疾病的实例包括但不限于由调节在突触中起作用的蛋白质的剪接的Nova蛋白的缺失导致的副肿瘤性斜视性眼阵挛-肌阵挛共济失调症(或POMA)和由囊性纤维化跨膜传导调节蛋白的缺陷型剪接引起的导致产生非功能性的氯通道的囊性纤维化。在其他疾病中,异常RNA剪接导致功能获得。例如在强直性肌营养不良症中就是这种情况,这是由mRNA的3'UTR中的CUG三联体重复扩增(从50至>1500个重复)造成的,其引起剪接缺陷。
RNA靶向效应蛋白可以用于通过向5'剪接位点募集剪接因子(如U1)来包括外显子,以促进所希望的外显子周围的内含子的切除。这种募集可以通过融合富含精氨酸/丝氨酸的结构域进行介导,该结构域起到剪接活化因子的作用(Gravely BR和Maniatis T,MolCell.[分子细胞]1998(5):765-71)。
设想RNA靶向效应蛋白可以用于在所希望的基因座处阻断剪接机器,从而防止外显子识别和不同蛋白质产物的表达。可以治疗的障碍的一个实例是杜兴肌营养不良(DMD),其由编码肌营养不良蛋白的基因突变引起。几乎所有的DMD突变都会导致移码,导致肌营养不良蛋白翻译受损。RNA靶向效应蛋白可以与剪接结点或外显子剪接增强子(ESE)配对,从而防止外显子识别,导致部分功能蛋白的翻译。这将致命的杜兴表型转化为不太严重的贝克尔表型。
B)RNA修饰
RNA编辑是一个自然过程,通过对RNA进行微小修饰来增加给定序列的基因产物的多样性。典型地,修饰涉及腺苷(A)转化为肌苷(I),产生与基因组编码的RNA序列不同的RNA序列。通常通过ADAR酶来确保RNA修饰,由此前RNA靶标通过含有待编辑的腺苷的外显子与内含子非编码元件之间的碱基配对来形成不完美的双链体RNA。A-I编辑的典型实例是谷氨酸受体GluR-B mRNA,由此改变导致了通道的修饰的传导特性(Higuchi M等人Cell.[细胞]1993;75:1361–70)。
根据本发明,酶促方法用于在给定转录物的RNA碱基中诱导转换(A<->G或C<->U变化)或颠换(任何嘌呤到任何嘧啶,反之亦然)。通过使用分别将A转化为I或将C转化为U的腺嘌呤(ADAR1/2,APOBEC)或胞嘧啶脱氨酶(AID)可以直接诱导转换。通过将活性氧物质损害定位到感兴趣的碱基可以间接诱导颠换,这导致化学修饰被添加到受影响的碱基,如鸟嘌呤转化为氧代鸟嘌呤。氧代鸟嘌呤被识别为T并因此与腺嘌呤碱基配对,导致翻译受到影响。可以被募集用于ROS介导的碱基损害的蛋白质包括APEX和mini-SOG。使用这两种方法,这些效应物可以与无催化活性的C2c2融合,并被募集到需要这些类型的突变的转录物上的位点。
在人类中,ADAR1基因中杂合的无功能突变导致皮肤疾病人类色素性遗传性皮肤病(Miyamura Y等人Am J Hum Genet.[美国人类遗传学杂志]2003;73:693–9)。设想本发明的RNA靶向效应蛋白可以用于纠正错误的RNA修饰。
进一步设想RNA腺苷甲基化酶(N(6)-甲基腺苷)可以与本发明的RNA靶向效应蛋白融合并被靶向感兴趣的转录物。此甲基化酶引起可逆的甲基化,具有调节作用,并且可以通过调节多种RNA相关的细胞途径来影响基因表达和细胞命运决定(Fu等人Nat Rev Genet.[遗传学自然评论]2014;15(5):293-306)。
C)多聚腺苷酸化
mRNA的多聚腺苷酸化对于核转运、翻译效率和mRNA的稳定性是重要的,并且所有这些以及多聚腺苷酸化的过程取决于特定的RBP。大多数真核生物mRNA在转录后接受约200个核苷酸的3'聚(A)尾。多聚腺苷酸化涉及刺激聚(A)聚合酶活性的不同RNA结合蛋白复合物(Minvielle-Sebastia L等人Curr Opin Cell Biol.[细胞生物学新观点]1999;11:352–7)。设想本文提供的RNA靶向效应蛋白可以用于干扰或促进RNA结合蛋白与RNA之间的相互作用。
与涉及多聚腺苷酸化的缺陷型蛋白有关的疾病的实例是眼咽肌营养不良(OPMD)(Brais B等人Nat Genet.[自然遗传学]1998;18:164–7)。
D)RNA输出
前mRNA加工后,mRNA从细胞核输出到细胞质中。这通过涉及产生载体复合物的细胞机制来确保,该载体复合物然后通过核孔移位并释放细胞质中的mRNA,随后再循环该载体。
已经发现在RNA输出中起作用的蛋白质(如TAP)的过表达增加在非洲爪蟾属中否则低效输出的转录物的输出(Katahira J等人EMBO J.[欧洲分子生物学学会杂志]1999;18:2593–609)。
E)mRNA定位
mRNA定位确保了空间调节的蛋白质生产。通过定位元件可以确保将转录物定位到细胞的特定区域。在具体的实施例中,设想本文描述的效应蛋白可以用于将定位元件靶向感兴趣的RNA。效应蛋白可以被设计为结合靶转录物并使其穿梭至由其肽信号标签确定的细胞中的位置。更具体地说,例如,可以使用融合至一个或多个核定位信号(NLS)和/或一个或多个核输出信号(NES)的RNA靶向效应蛋白来改变RNA定位。
定位信号的另外的实例包括拉链码(zipcode)结合蛋白(ZBP1)(其确保在若干种不对称细胞类型中将β-肌动蛋白定位至细胞质)、KDEL保留序列(定位至内质网)、核输出信号(定位至细胞质)、线粒体靶向信号(定位至线粒体)、过氧化物酶体靶向信号(定位至过氧化物酶体)和m6A标记/YTHDF2(定位至p小体(p-body))。设想的其他方法是将RNA靶向效应蛋白与已知定位(例如膜、突触)的蛋白质融合。
可替代地,根据本发明的效应蛋白可以例如用于定位依赖性敲低。通过将效应蛋白与适当的定位信号融合,效应物被靶向特定的细胞区室。只有位于此区室中的靶RNA才能被有效靶向,而其他相同的靶标(但位于不同的细胞区室中)则不会被靶向,从而可以建立定位依赖性敲低。
F)翻译
本文描述的RNA靶向效应蛋白可以用于增强或阻遏翻译。设想上调翻译是控制细胞电路的一种非常稳健的方式。此外,对于功能研究,蛋白质翻译筛选可能优于转录上调筛选,其具有转录上调没有翻译而使蛋白质生产增加的缺点。
设想本文描述的RNA靶向效应蛋白可以用于将翻译起始因子(如EIF4G)带入感兴趣的信使RNA的5'非翻译重复序列(5'UTR)附近,以驱动翻译(如描述于De Gregorio等人EMBO J.[欧洲分子生物学学会杂志]1999;18(17):4865-74,针对不可重新编程的RNA结合蛋白)。作为另一个实例,可以通过RNA靶向效应蛋白将细胞质聚(A)聚合酶GLD2募集到靶mRNA。这将允许靶mRNA的定向多聚腺苷酸化,从而刺激翻译。
类似地,本文设想的RNA靶向效应蛋白可以用于阻断mRNA的翻译阻遏因子,如ZBP1(Huttelmaier S等人Nature.[自然]2005;438:512–5)。通过与靶RNA的翻译起始位点结合,翻译可以直接受到影响。
另外,将RNA靶向效应蛋白融合至稳定mRNA的蛋白质(例如,通过防止诸如RNA酶抑制剂等的降解)有可能从感兴趣的转录物增加蛋白质产量。
设想本文描述的RNA靶向效应蛋白可以用于通过在RNA转录物的5'UTR区域中结合并阻止核糖体的翻译形成和开始来阻遏翻译。
此外,RNA靶向效应蛋白可以用于将Caf1(CCR4-NOT去腺苷酶复合物的组分)募集到靶mRNA,导致脱腺苷酸化或靶转录并抑制蛋白质翻译。
例如,本发明的RNA靶向效应蛋白可以用于增加或减少治疗相关蛋白的翻译。其中RNA靶向效应蛋白可以用于下调或上调翻译的治疗应用的实例是肌萎缩侧索硬化(ALS)和心血管障碍。在ALS运动皮层和脊髓中以及ALS脑组织中的多个异常EAAT2mRNA转录物中报道了胶质谷氨酸转运体EAAT2的水平降低。EAAT2蛋白和功能的丧失被认为是ALS中兴奋性毒性的主要原因。EAAT2蛋白水平和功能的恢复可以提供治疗益处。因此,RNA靶向效应蛋白可以有益地用于上调EAAT2蛋白的表达,例如通过如上所述阻断翻译阻遏因子或稳定mRNA。载脂蛋白A1是高密度脂蛋白(HDL)的主要蛋白组分,并且ApoA1和HDL通常被认为是抗动脉粥样硬化的。设想RNA靶向效应蛋白可以有益地用于上调ApoA1的表达,例如通过如上所述阻断翻译阻遏因子或稳定mRNA。
G)mRNA转换
翻译与mRNA转换和调节的mRNA稳定性紧密耦合。已经描述了特定蛋白质参与转录物(如神经元中的ELAV/Hu蛋白,Keene JD,1999,Proc Natl Acad Sci U S A.[美国国家科学院院刊]96:5–7)和tristetraprolin(TTP)的稳定性。这些蛋白质通过保护信息免受细胞质中的降解而稳定靶mRNA(Peng SS等人,1988,EMBO J.[欧洲分子生物学学会杂志]17:3461–70)。
可以设想,本发明的RNA靶向效应蛋白可以用于干扰或促进起稳定mRNA转录物作用的蛋白质的活性,从而影响mRNA转换。例如,使用RNA靶向效应蛋白将人TTP募集到靶RNA将允许富含腺苷酸-尿苷酸的元件(富含AU的元件)介导的翻译阻遏和靶降解。富含AU的元件发现于编码原癌基因、核转录因子和细胞因子并促进RNA稳定性的许多mRNA的3'UTR中。作为另一个实例,RNA靶向效应蛋白可以与HuR(另一种mRNA稳定蛋白(Hinman MN和Lou H,Cell Mol Life Sci[细胞与分子生命科学]2008;65:3168-81))融合,并将其募集到靶转录物以延长其寿命或稳定短命的mRNA。
进一步设想本文描述的RNA靶向效应蛋白可以用于促进靶转录物的降解。例如,可以将m6A甲基转移酶募集到靶转录物以将转录物定位至P小体(P-body),导致靶标降解。
作为又另一个实例,如本文描述的RNA靶向效应蛋白可以与非特异性内切核酸酶结构域PilT N-末端(PIN)融合,以将其募集到靶转录物并允许其降解。
患有副肿瘤性神经紊乱(PND)相关脑脊髓炎和神经病变的患者是在中枢神经系统以外的肿瘤中发展针对Hu蛋白的自身抗体(Szabo A等人1991,Cell.[细胞];67:325–33),然后其穿过血脑屏障的患者。可以设想,本发明的RNA靶向效应蛋白可以用于干扰自身抗体与mRNA转录物的结合。
患有由强直性肌营养不良蛋白激酶(DMPK)基因的3'UTR中(CUG)n扩增引起的营养不良1型(DM1)的患者的特征在于此类转录物在核中的积累。设想与被靶向(CUG)n重复的内切核酸酶融合的本发明的RNA靶向效应蛋白可以抑制异常转录物的这种积累。
H)与多功能蛋白的相互作用
一些RNA结合蛋白结合多个RNA上的多个位点以在不同过程中起作用。例如,已经发现hnRNP A1蛋白结合外显子剪接沉默子序列、拮抗剪接因子、与端粒末端缔合(从而刺激端粒活性)并结合miRNA以促进Drosha介导的加工从而影响成熟。设想本发明的RNA结合效应蛋白可以干扰RNA结合蛋白在一个或多个位置处的结合。
I)RNA折叠
RNA采用确定的结构以执行其生物活性。可替代的三级结构之间的构象转换对大多数RNA介导的过程至关重要。但是,RNA折叠可能与若干个问题相关。例如,RNA可能倾向于折叠成不适当的可替代构象并以其保持,和/或与可替代结构相比,正确的三级结构可能没有足够的热力学优势。本发明的RNA靶向效应蛋白(特别是切割缺陷型或失活RNA靶向蛋白)可以用于指导(m)RNA的折叠和/或捕获其正确的三级结构。
在调节细胞状态中使用RNA靶向效应蛋白
在某些实施例中,具有crRNA的复合物中的C2c2在与靶RNA结合后被活化,随后切割任何附近的ssRNA靶标(即“附带(collateral)”或“旁观(bystander)”效应)。C2c2一旦被同源靶标引发就可以切割其他(非互补)RNA分子。这种混杂的RNA切割可能会引起细胞毒性,或以其他方式影响细胞生理学或细胞状态。
因此,在某些实施例中,如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导细胞休眠或在其中使用。在某些实施例中,如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导细胞周期阻滞或在其中使用。在某些实施例中,如本文描述的非天然存在的或工程化的组合物、载体系统、或递送系统用于减少细胞生长和/或细胞增殖或在其中使用。在某些实施例中,如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导细胞无反应性或在其中使用。在某些实施例中,如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导细胞凋亡或在其中使用。在某些实施例中,如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导细胞坏死或在其中使用。在某些实施例中,如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导细胞死亡或在其中使用。在某些实施例中,如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于诱导程序性细胞死亡或在其中使用。
在某些实施例中,本发明涉及用于诱导细胞休眠的方法,该方法包括引入或诱导如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于诱导细胞周期阻滞的方法,该方法包括引入或诱导如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于减少细胞生长和/或细胞增殖的方法,该方法包括引入或诱导如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于诱导细胞无反应性的方法,该方法包括引入或诱导如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于诱导细胞凋亡的方法,该方法包括引入或诱导如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于诱导细胞坏死的方法,该方法包括引入或诱导如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于诱导细胞死亡的方法,该方法包括引入或诱导如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及用于诱导程序性细胞死亡的方法,该方法包括引入或诱导如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统。
如本文描述的方法和用途可以是治疗性或预防性的并且可以靶向特定细胞、细胞(亚)群体或细胞/组织类型。具体而言,如本文描述的方法和用途可以是治疗性或预防性的,并且可以靶向表达一个或多个靶序列的特定细胞、细胞(亚)群体或细胞/组织类型,如一个或多个特定靶RNA(例如ss RNA)。没有限制,靶细胞可以例如是表达特定转录物的癌细胞,例如给定类别的神经元、导致例如自身免疫的(免疫)细胞或被特定(例如病毒)病原体感染的细胞等。
因此,在某些实施例中,本发明涉及用于治疗特征在于存在不希望的细胞(宿主细胞)的病理学病症的方法,该方法包括引入或诱导如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统。在某些实施例中,本发明涉及如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于治疗特征在于存在不希望的细胞(宿主细胞)的病理学病症的用途。在某些实施例中,本发明涉及如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于在治疗特征在于存在不希望的细胞(宿主细胞)的病理学病症中使用。应该理解的是,CRISPR-Cas系统优选靶向对不希望的细胞具有特异性的靶标。在某些实施例中,本发明涉及如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于治疗、预防或减轻癌症的用途。在某些实施例中,本发明涉及如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于在治疗、预防或减轻癌症中使用。在某些实施例中,本发明涉及用于治疗、预防或减轻癌症的方法,该方法包括引入或诱导如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统。应该理解的是,CRISPR-Cas系统优选靶向对癌细胞具有特异性的靶标。在某些实施例中,本发明涉及如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于治疗、预防或减轻病原体对细胞的感染的用途。在某些实施例中,本发明涉及如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于在治疗、预防或减轻病原体对细胞的感染中使用。在某些实施例中,本发明涉及用于治疗、预防或减轻病原体对细胞的感染的方法,该方法包括引入或诱导如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统。应该理解的是,CRISPR-Cas系统优选靶向对病原体感染的细胞具有特异性的靶标(例如病原体源靶标)。在某些实施例中,本发明涉及如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于治疗、预防或减轻自身免疫障碍的用途。在某些实施例中,本发明涉及如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统用于在治疗、预防或减轻自身免疫障碍中使用。在某些实施例中,本发明涉及用于治疗、预防或减轻自身免疫障碍的方法,该方法包括引入或诱导如本文描述的非天然存在的或工程化的组合物、载体系统或递送系统。应该理解的是,CRISPR-Cas系统优选靶向对负责自身免疫障碍的细胞(例如特定免疫细胞)具有特异性的靶标。
在RNA检测或蛋白质检测中使用RNA靶向效应蛋白
进一步设想RNA靶向效应蛋白可以用于检测生物样品中的核酸或蛋白质。样品可以是细胞的或无细胞的。
在Northern印迹测定中。Northern印迹涉及使用电泳按尺寸分离RNA样品。RNA靶向效应蛋白可以用于特异性结合和检测靶RNA序列。
RNA靶向效应蛋白也可以与荧光蛋白(如GFP)融合并用于追踪活细胞中的RNA定位。更具体地说,RNA靶向效应蛋白可以失活,因为它不再切割RNA。在具体的实施例中,设想可以使用断裂型RNA靶向效应蛋白,其中信号取决于两种亚蛋白的结合,以确保更精确的可视化。可替代地,可以使用断裂荧光蛋白,当多种RNA靶向效应蛋白复合物结合靶转录物时重构该断裂荧光蛋白。进一步设想转录物被靶向沿着mRNA的多个结合位点,因此荧光信号可以放大真实信号并允许焦点识别。作为又另一种选择,荧光蛋白可以从断裂内含肽重构。
RNA靶向效应蛋白例如适合用于确定RNA或特定剪接变体的定位、mRNA转录物的水平、转录物的上调或下调和疾病特异性诊断。RNA靶向效应蛋白可以用于例如使用荧光显微术或流式细胞术(如荧光活化细胞分选法(FACS))(其允许细胞的高通量筛选和细胞分选后活细胞的恢复)使(活)细胞中的RNA可视化。此外,不同转录物的表达水平可以在胁迫(例如,使用分子抑制剂或低氧条件抑制癌细胞生长)下同时评估。另一个应用是使用双光子显微术在神经刺激期间追踪转录物到突触联系的定位。
在某些实施例中,如本文所述的根据本发明的组分或复合物可以用于多重化错误稳健荧光原位杂交(MERFISH;Chen等人Science[科学];2015;348(6233)),例如像与(荧光)标记的C2c2效应物杂交。
体外顶点标记(apex labeling)
细胞过程依赖于蛋白质、RNA和DNA之间的分子相互作用网络。准确检测蛋白质-DNA和蛋白质-RNA的相互作用是理解此类过程的关键。体外邻近标记技术采用结合了例如可光活化探针的亲和标签在体外标记感兴趣的蛋白质或RNA附近的多肽和RNA。紫外光照射后,可光活化基团与蛋白质和其他靠近标记分子的分子发生反应,从而标记它们。随后可以回收并鉴定标记的相互作用分子。本发明的RNA靶向效应蛋白可以例如用于将探针靶向选定RNA序列。
这些应用也可以应用于动物模型中,用于疾病相关应用或难培养细胞类型的体内成像。
本发明提供了用于通过无细胞RNA的无创取样来诊断和监测健康状态的试剂和方法,包括测试风险和指导RNA靶向疗法,并且用于快速给予疗法对治疗结果而言重要的环境下。在一个实施例中,本发明提供了用于循环肿瘤RNA的癌症检测方法和试剂,包括用于监测常见药物抗性突变的复发和/或发展。在另一个实施例中,本发明提供了用于直接从血液或血清中检测和/或鉴定细菌物种的检测方法和试剂,以监测例如疾病进展和败血症。在本发明的一个实施例中,C2c2蛋白和衍生物用于区分和诊断常见疾病(如鼻病毒或上呼吸道感染)与更严重的感染(如支气管炎)。
本发明提供了用于急诊药物基因组学的快速基因分型的方法和试剂,包括基于例如VKORC1、CYP2C9和CYP2C19基因分型在心肌梗塞或中风治疗期间给予抗凝血剂的指导。
本发明提供了用于在沿食品生产和输送链的所有点处监测食物的细菌污染的试剂和方法。在另一个实施例中,本发明提供了质量控制和监测,例如通过鉴定食物来源和确定纯度。在一个非限制性实例中,本发明可以用于鉴定或确认食物来源,如动物肉类和海鲜的种类。
在另一个实施例中,本发明用于法政测定。例如,含有血液或其他体液的犯罪现场样品。在本发明的一个实施例中,本发明用于鉴定来自指纹的核酸样品。
在RNA折纸(origami)/体外组装线中使用RNA靶向效应蛋白-组合式
RNA折纸是指用于使用RNA作为集成模板创建二维或三维结构的纳米级折叠结构。折叠结构在RNA中被编码,因此所得RNA的形状由合成的RNA序列决定(Geary等人2014.Science[科学],345(6198).第799-804页)。RNA折纸可以作为将其他成分(如蛋白质)排列成复合物的支架。本发明的RNA靶向效应蛋白可以例如用于使用合适的指导RNA将感兴趣的蛋白质靶向RNA折纸。
在RNA分离或纯化、富集或耗竭中使用RNA靶向效应蛋白
进一步设想当与RNA复合时RNA靶向效应蛋白可以用于分离和/或纯化RNA。RNA靶向效应蛋白例如可以与可以用于分离和/或纯化RNA-RNA靶向效应蛋白复合物的亲和标签融合。此类应用例如可用于分析细胞中的基因表达谱。在具体的实施例中,可以设想RNA靶向效应蛋白可以用于靶向特定的非编码RNA(ncRNA),从而阻断其活性,提供有用的功能探针。在某些实施例中,如本文描述的效应蛋白可以用于特异性富集特定RNA(包括但不限于提高稳定性等),或可替代地,可以用于特异性耗竭特定RNA(如但不限于例如特定剪接变体、同种型等)。
lincRNA功能和其他核RNA的探询
目前的RNA敲低策略(如siRNA)具有缺点,即它们大多局限于靶向胞质转录物,因为蛋白质机器是胞质转录物。本发明的RNA靶向效应蛋白(一种对细胞功能不重要的外源系统)的优点是它可以用于细胞中的任何区室。通过将NLS信号与RNA靶向效应蛋白融合,可以将其指导至细胞核,允许使核RNA被靶向。例如设想探查lincRNA的功能。长基因间非编码RNA(lincRNA)是一个大大研究不足的研究领域。大多数lincRNA具有迄今未知的功能,这些功能可以使用本发明的RNA靶向效应蛋白进行研究。
RNA结合蛋白的鉴定
鉴定与特定RNA结合的蛋白质对于理解许多RNA的作用可能是有用的。例如,许多lincRNA与转录和表观遗传调节子相关以控制转录。了解什么蛋白质与给定的lincRNA结合可以帮助阐明给定调节途径中的组分。本发明的RNA靶向效应蛋白可以被设计为将生物素连接酶募集到特定转录物以便用生物素标记局部结合的蛋白质。然后可以将蛋白质下拉(pull down)并通过质谱分析来鉴定它们。
在RNA上组装复合物和底物穿梭
本发明的RNA靶向效应蛋白可以进一步用于在RNA上组装复合物。这可以通过用多种相关蛋白质(例如特定合成途径的组分)功能化RNA靶向效应蛋白来实现。可替代地,多种RNA靶向效应蛋白可以用此类不同的相关蛋白质功能化并被靶向相同或相邻的靶RNA。在RNA上组装复合物的有用应用是例如促进蛋白质之间的底物穿梭。
合成生物学
生物系统的开发具有广泛的用途,包括在临床应用中的用途。设想本发明的可编程的RNA靶向效应蛋白可以与用于靶向细胞死亡的毒性结构域的断裂蛋白融合使用,例如使用癌症连接的RNA作为靶转录物。此外,涉及蛋白质-蛋白质相互作用的途径可以在合成生物系统(例如具有适当的效应物(如激酶或其他酶)的融合复合物))中受到影响。
蛋白质剪接:内含肽
蛋白质剪接是一种翻译后过程,其中介入多肽(被称为内含肽)催化从侧翼其的多肽(称为外显子)自切除,以及随后的外显子的连接。如本文描述的在靶转录物上组装两种或更多种RNA靶向效应蛋白可以用于指导断裂内含肽的释放(Topilina和Mills Mob DNA.[移动的DNA]2014年2月4日;5(1):5),由此允许直接计算mRNA转录物的存在并随后释放蛋白质产物,如代谢酶或转录因子(用于转录途径的下游致动)。此应用可能与合成生物学(见上文)或大规模生物生产(仅在特定条件下生产产品)具有显著相关性。
可诱导的、剂量的和自我失活性系统
在一个实施例中,包含本发明的RNA靶向效应蛋白和效应物组分的融合复合物被设计为可诱导的,例如光诱导的或化学诱导的。这种诱导性允许在希望的时刻活化效应物组分。
例如通过设计融合复合物来实现光诱导性,其中将CRY2PHR/CIBN配对用于融合。此系统对活细胞中蛋白质相互作用的光诱导特别有用(Konermann S等人Nature.[自然]2013;500:472–476)。
例如通过设计融合复合物来提供化学诱导性,其中将FKBP/FRB(FK506结合蛋白/FKBP雷帕霉素结合)配对用于融合。结合蛋白质需要使用此系统雷帕霉素(Zetsche等人NatBiotechnol.[自然生物技术]2015;33(2):139-42,描述了此系统用于Cas9的用途)。
此外,当作为DNA引入细胞时,本发明的RNA靶向效应蛋白可以通过诱导型启动子(如四环素或多西环素)控制的转录活化(Tet-On和Tet-Off表达系统)、激素诱导型基因表达系统(例如像蜕皮激素诱导型基因表达系统和阿拉伯糖诱导型基因表达系统)来进行调节。当作为RNA递送时,RNA靶向效应蛋白的表达可以经由核糖开关来调节,该核糖开关可以感应小分子像四环素(如描述于Goldfless等人Nucleic Acids Res.[核酸研究]2012;40(9):e64)。
在一个实施例中,可以调节本发明的RNA靶向效应蛋白的递送以改变细胞中蛋白质或crRNA的量,从而改变所希望的效应的量级或任何不希望的脱靶效应。
在一个实施例中,本文描述的RNA靶向效应蛋白可以被设计为自我失活。当作为RNA(无论作为mRNA抑或复制RNA治疗剂)递送至细胞时(Wrobleska等人Nat Biotechnol.[自然生物技术]2015年8月;33(8):839–841),它们可以通过破坏自身的RNA来自我灭活表达和后续作用,从而减少驻留和潜在的不良影响。
对于如本文描述的RNA靶向效应蛋白的另外的体内应用,参考Mackay JP等人(NatStruct Mol Biol.[自然结构与分子生物学]2011年3月;18(3):256-61)、Nelles等人(Bioessays.[生物学论文集]2015年7月;37(7):732-9)以及Abil Z和Zhao H(MolBiosyst.[分子生物系统]2015年10月;11(10):2658-65),将其通过引用并入本文。特别地,在本发明的某些实施例中设想以下应用,优选在某些实施例中通过使用无催化活性的C2c2:增强翻译(例如C2c2-翻译促进因子融合物(例如eIF4融合物));阻遏翻译(例如靶向核糖体结合位点的gRNA);外显子跨越(例如靶向剪接供体和/或接受位点的gRNA);外显子包含(例如靶向待包含的特定外显子剪接供体和/或接受位点的gRNA或融合至或募集剪接体组分(例如U1snRNA)的C2c2);访问RNA定位(例如C2c2-标记融合物(例如EGFP融合物));改变RNA定位(例如C2c2-定位信号融合物(例如NLS或NES融合物));RNA降解(在这种情况下,如果依赖于C2c2的活性,则不使用无催化活性的C2c2,可替代地,为了提高特异性,可以使用断裂型C2c2);例如通过降解或结合gRNA至功能位点(通过C2c2-信号序列融合物重定位在特异性位点的可能滴定)来抑制非编码RNA功能(例如miRNA)。
如前所述和实例中所证明的,C2c2功能对crRNA的5'或3'延伸以及crRNA环的延伸是稳健的。因此设想可以将MS2环和其他募集结构域添加到crRNA中而不影响复合物形成和与靶转录物的结合。用于募集不同效应物结构域的此类crRNA修饰适用于上述RNA靶向效应蛋白的用途。
如实例中所证明的,C2c2(特别是LshC2c2)能够介导对RNA噬菌体的抗性。因此设想C2c2可以用于例如动物、人类和植物的针对仅RNA病原体(包括但不限于逆转录病毒(例如慢病毒,如HIV)、HCV、埃博拉病毒和寨卡病毒))的免疫。
本发明人已经显示C2c2可以加工(切割)其自身阵列。这适用于野生型C2c2蛋白和含有一个或多个突变的氨基酸残基R597、H602、R1278和H1283(如选自R597A、H602A、R1278A和H1283A的一种或多种修饰)的突变C2c2蛋白。因此设想为不同的靶转录物和/或应用设计的多种crRNA可以作为单个前crRNA或作为由一个启动子驱动的单个转录物递送。这种递送方法具有这样的优点,即它实质上更紧凑、更容易合成并且更易于在病毒系统中递送。优选地,如本文描述的氨基酸编号是指Lsh C2c2蛋白。应当理解,对于Lsh C2c2的直向同源物,确切的氨基酸位置可以变化,这可以通过蛋白质比对充分确定,如本领域已知的,并且如本文其他地方所述。
本发明的方面还涵盖本文描述的组合物和系统在基因组或转录组工程(例如用于改变或操纵一个或多个基因或一种或多种基因产物在原核或真核细胞体内、体外或离体(蛋白质)表达)的方法和用途。
在一个方面,本发明提供了用于调节(例如减少细胞中靶RNA的(蛋白质)表达)的方法和组合物。在主题方法中,提供了干扰RNA的转录、稳定性和/或翻译的本发明的C2c2系统。
在某些实施例中,使用有效量的C2c2系统切割RNA或以其他方式抑制RNA表达。在这方面,该系统具有类似于siRNA和shRNA的用途,因此也可以替代此类方法。该方法包括但不限于使用C2c2系统作为例如干扰性核糖核酸(如siRNA或shRNA)或其转录模板(例如编码shRNA的DNA)的替代物。例如通过给药至包含靶细胞的哺乳动物,将C2c2系统引入靶细胞中。
有利地,本发明的C2c2系统是特异性的。例如,虽然干扰性核糖核酸(如siRNA或shRNA)多核苷酸系统受设计和稳定性问题以及脱靶结合的困扰,但本发明的C2c2系统可以被设计为具有高特异性。
去稳定化的C2c2
在某些实施例中,如本文描述的根据本发明的效应蛋白(CRISPR酶;C2c2)与去稳定化结构域(DD)缔合或融合。在一些实施例中,DD是ER50。在一些实施例中,这个DD的对应稳定化配体是4HT。因此,在一些实施例中,该至少一个DD之一是ER50并且其稳定化配体是4HT或CMP8。在一些实施例中,DD是DHFR50。在一些实施例中,这个DD的对应稳定化配体是TMP。因此,在一些实施例中,该至少一个DD之一是DHFR50并且其稳定化配体是TMP。在一些实施例中,DD是ER50。在一些实施例中,这个DD的对应稳定化配体是CMP8。因此,在ER50系统中,CMP8可以是4HT的替代稳定化配体。虽然也许有可能的是CMP8和4HT可以/应该以竞争性方式使用,但是一些细胞类型可能对这两种配体中的一者或另一者更加敏感,并且根据本披露和本领域的知识,本领域技术人员可以使用CMP8和/或4HT。
在一些实施例中,一个或两个DD可以与CRISPR酶的N-末端融合,并且一个或两个DD与CRISPR酶的C-末端融合。在一些实施例中,该至少两个DD与该CRISPR酶缔合并且这些DD是相同的DD,即这些DD是同源的。因此,这些DD中的两个(或两个或更多个)可以是ER50DD。在一些实施例中这是优选的。可替代地,这些DD中的两个(或两个或更多个)可以是DHFR50DD。在一些实施例中这也是优选的。在一些实施例中,该至少两个DD与该CRISPR酶缔合并且这些DD是不同的DD,即这些DD是异源的。因此,这些DD之一可以是ER50,同时这些DD中的一个或多个或任何其他DD可以是DHFR50。具有两个或更多个异源的DD可以是有利的,因为它将提供更高水平的降解控制。N-末端或C-末端处的多于一个DD的串联融合可以增强降解;并且这样一种串联融合物可以是例如ER50-ER50-C2c2或DHFR-DHFR-C2c2。设想高水平的降解将在不存在任一种稳定化配体的情况下发生,中间水平的降解将在不存在一种稳定化配体并且存在其他(或另一种)稳定化配体的情况下发生,而低水平的降解将在存在两种(或两种或更多种)稳定化配体的情况下发生。还可以通过具有N-末端ER50DD和C-末端DHFR50DD来进行控制。
在一些实施例中,CRISPR酶与DD的融合物包含在DD与CRISPR酶之间的接头。在一些实施例中,接头是GlySer接头。在一些实施例中,DD-CRISPR酶进一步包含至少一个核输出信号(NES)。在一些实施例中,DD-CRISPR酶包含两个或更多个NES。在一些实施例中,DD-CRISPR酶包含至少一个核定位信号(NLS)。这可以是除了NES外还有的。在一些实施例中,CRISPR酶包含作为CRISPR酶与DD之间的接头的、或作为其一部分的定位(核输入或输出)信号或基本上由其组成或由其组成。HA或Flag标签作为接头也落入本发明的范围内。申请人使用NLS和/或NES作为接头并且还使用短至GS到高达(GGGGS)3的甘氨酸丝氨酸接头。
去稳定化结构域具有普遍实用性以便为范围广泛的蛋白质赋予不稳定性;参见例如,Miyazaki,J Am Chem Soc.[美国化学学会杂志]2012年3月7日;134(9):3942–3945,通过引用并入本文。CMP8或4-羟基他莫昔芬可以是去稳定化结构域。更一般地说,发现哺乳动物DHFR的温度敏感型突变体(DHFRts)(遵循N端法则的去稳定化残基)在容许温度下是稳定的,但是在37℃下是不稳定的。向表达DHFRts的细胞中添加甲氨蝶呤(一种哺乳动物DHFR高亲和力配体)部分地抑制该蛋白质的降解。这是重要的证明,即小分子配体可以稳定以其他方式在细胞中被靶向而降解的蛋白质。使用雷帕霉素衍生物来稳定mTOR的FRB结构域的不稳定突变体(FRB*)并且恢复融合的激酶GSK-3β的功能。6,7此系统证明配体依赖性稳定性代表用于调节复杂的生物环境中的特定蛋白质的功能的有吸引力的策略。当通过雷帕霉素诱导的FK506结合蛋白和FKBP12的二聚化而发生泛素补偿时,用于控制蛋白质活性的系统可以涉及变得具有功能性的DD。人类FKBP12或ecDHFR蛋白的突变体可以被工程化为分别在不存在它们的高亲和力配体Shield-1或甲氧苄啶(TMP)的情况下在代谢上是不稳定的。这些突变体是在本发明的实践中有用的可能去稳定化结构域(DD)中的一些并且作为与CRISPR酶的融合物的DD的不稳定性赋予整个融合蛋白被蛋白酶体进行CRISPR蛋白降解。Shield-1和TMP以剂量依赖性方式结合至DD并且稳定DD。雌激素受体配体结合结构域(ERLBD,ERS1的残基305-549)也可以被工程化为去稳定化结构域。由于雌激素受体信号传导途径牵涉在多种疾病(如乳腺癌)中,所以该途径已经得到广泛研究并且已经开发了雌激素受体的许多激动剂和拮抗剂。因此,ERLBD和药物的兼容对是已知的。存在结合至ERLBD的突变体但是不结合其野生型形式的配体。通过使用编码三个突变(L384M、M421G、G521R)12的这些突变型结构域之一,有可能的是使用不扰乱内源雌激素敏感性网络的配体调节ERLBD衍生的DD的稳定性。可以引入另外的突变(Y537S),以进一步使ERLBD去稳定并且将它配置为潜在的DD候选物。这种四突变体是有利的DD发展。突变型ERLBD可以与CRISPR酶融合并且可以使用配体调节或扰乱其稳定性,由此该CRISPR酶具有DD。另一种DD可以是由Shield1配体稳定的、基于突变的FKBP蛋白的12-kDa(107个氨基酸)标签;参见例如,NatureMethods[自然方法]5,(2008)。例如,DD可以是经修饰的FK506结合蛋白12(FKBP12),其结合至合成的、生物惰性小分子Shield-1并且被Shield-1可逆地稳定;参见例如,BanaszynskiLA,Chen LC,Maynard-Smith LA,Ooi AG,Wandless TJ.A rapid,reversible,and tunablemethod to regulate protein function in living cells using synthetic smallmolecules[使用合成小分子调节活细胞中的蛋白质功能的快速、可逆且可调的方法].Cell.[细胞]2006;126:995–1004;Banaszynski LA,Sellmyer MA,Contag CH,WandlessTJ,Thorne SH.Chemical control of protein stability and function in livingmice[活小鼠中的蛋白质稳定性和功能的化学控制].Nat Med.[自然医学]2008;14:1123–1127;Maynard-Smith LA,Chen LC,Banaszynski LA,Ooi AG,Wandless TJ.A directedapproach for engineering conditional protein stability using biologicallysilent small molecules[用于使用生物沉默小分子工程化调节型蛋白稳定性的直接方法].The Journal of biological chemistry.[生物化学杂志]2007;282:24866–24872;和Rodriguez,Chem Biol.[生物化学]2012年3月23日;19(3):391–398—将其全部通过引用并入本文,并且可以用在本发明的实践中,在选择有待与本发明的实践中的CRISPR酶缔合的DD中。如可以看到的,本领域中的知识包括多种DD,并且DD可以与CRISPR酶缔合(例如,融合到其上,有利地通过接头),由此该DD在配体的存在下可以被稳定并且当不存在该配体时该DD可以被去稳定,由此该CRISPR酶被完全去稳定,或者该DD在不存在配体下可以被稳定并且当存在该配体时该DD可以被去稳定;该DD允许调节或控制—打个譬喻说,启动或关闭—该CRISPR酶并且因此调节或控制CRISPR-Cas复合物或系统,以由此提供用于例如在体内或体外环境中调节或控制该系统的手段。例如,当感兴趣的蛋白质作为与DD标签的融合物表达时,它被去稳定并且在细胞中例如被蛋白酶体迅速降解。因此,不存在稳定化配体导致D相关的Cas被降解。当新的DD与感兴趣的蛋白质融合时,其不稳定性被赋予给该感兴趣的蛋白质,从而使得整个融合蛋白被快速降解。Cas的峰活性对于减少脱靶效应而言有时是有益的。因此,短突发的高活性是优选的。本发明能够提供此类峰值。从一些意义上来说,该系统是可诱导的。从一些其他意义上来说,该系统在不存在稳定化配体下被阻遏,并且在存在稳定化配体下被去阻遏。
RNA靶向-CRISPR系统在植物和酵母中的应用
定义:
一般来说,术语“植物”涉及植物界中任何不同的光合、真核、单细胞或多细胞生物,其特征性地通过细胞分裂生长,包含叶绿体,并且具有由纤维素组成的细胞壁。术语植物涵盖单子叶植物和双子叶植物。确切地说,这些植物旨在包括但不限于被子植物和裸子植物,如阿拉伯树胶、苜蓿、苋菜、苹果、杏、朝鲜蓟、白蜡树、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、桦树、山毛榉、黑莓、蓝莓、西兰花、抱子甘蓝、卷心菜、油菜、哈密瓜、胡萝卜、木薯、花椰菜、雪松、谷类、芹菜、栗子、樱桃、大白菜、柑橘、克莱门氏小柑橘、三叶草、咖啡、玉米、棉花、豇豆、黄瓜、柏树、茄子、榆树、菊苣、桉树、茴香、无花果、冷杉、天竺葵、葡萄、葡萄柚、落花生、地樱桃、树胶铁杉、山核桃木、羽衣甘蓝、奇异果、甘蓝、落叶松、莴苣、韭、柠檬、青柠、洋槐、松树、孔雀草、玉米、芒果、枫树、甜瓜、粟、蘑菇、芥菜、坚果、橡树、燕麦、油棕、秋葵、洋葱、橙、观赏植物或花或树木、木瓜、棕榈、荷兰芹、欧洲防风草、豌豆、桃、花生、梨、泥炭(peat)、胡椒、柿子、木豆、松树、菠萝、大蕉、李子、石榴、马铃薯、南瓜、菊苣、萝卜、油菜籽、覆盆子、稻、黑麦、高粱、红花、黄华柳、大豆、菠菜、云杉、南瓜属植物果实(squash)、草莓、糖甜菜、甘蔗、向日葵、甘薯、甜玉米、橘子、茶、烟草、番茄、树类、黑小麦、草坪草、芜菁、藤本植物、胡桃、豆瓣菜、西瓜、小麦、山药、紫杉以及西葫芦。术语植物还涵盖藻类,藻类主要是光能自养生物,它们主要一致缺少根、叶以及其他表征高等植物的器官。
使用如本文描述的RNA靶向系统调节基因表达的方法可以用于赋予基本上任何植物所希望的性状。针对所希望的生理学以及农学特征,可以使用本披露的核酸构建体和以上所述的各种转化方法对多种多样的植物和植物细胞系统进行工程化。在优选实施例中,用于工程化的靶植物和植物细胞包括但不限于那些单子叶植物和双子叶植物,如作物(包括谷类作物(例如,小麦、玉米、稻、粟、大麦)、果实作物(例如,番茄、苹果、梨、草莓、橙)、饲料作物(例如,苜蓿)、根用蔬菜作物(例如,胡萝卜、马铃薯、糖甜菜、山药)、叶类蔬菜作物(例如,莴苣、菠菜));开花植物(例如,矮牵牛、玫瑰、菊花)、松柏植物以及松树(例如,松杉、云杉);植物修复中所使用的植物(例如,重金属累积植物);油料作物(例如,向日葵、油菜籽)和用于实验目的植物(例如,拟南芥属)。因此,这些方法和CRISPR-Cas系统可以用于广泛范围的植物,像例如与属于以下目的双子叶植物:木兰目(Magniolales)、八角茴香目(Illiciales)、樟目(Laurales)、胡椒目(Piperales)、马览铃目(Aristochiales)、睡莲目(Nymphaeales)、毛茛目(Ranunculales)、罂粟目(Papeverales)、瓶子草科(Sarraceniaceae)、昆蓝树目(Trochodendrales)、金缕梅目(Hamamelidales)、杜仲目(Eucomiales)、莱脱纳目(Leitneriales)、杨梅目(Myricales)、壳斗目(Fagales)、木麻黄目(Casuarinales)、石竹目(Caryophyllales)、肉穗果目(Batales)、蓼目(Polygonales)、蓝雪目(Plumbaginales)、五桠果目(Dilleniales)、山茶目(Theales)、锦葵目(Malvales)、荨麻目(Urticales)、玉蕊目(Lecythidales)、紫堇目(Violales)、杨柳目(Salicales)、白花菜目(Capparales)、欧石楠目(Ericales)、岩梅目(Diapensales)、柿树目(Ebenales)、报春花目(Primulales)、蔷薇目(Rosales)、豆目(Fabales)、川苔草目(Podostemales)、小二仙草目(Haloragales)、桃金娘目(Myrtales)、山茱萸目(Cornales)、睡莲目(Proteales)、檀香目(San tales)、大花草目(Rafflesiales)、卫矛目(Celastrales)、大戟目(Euphorbiales)、鼠李目(Rhamnales)、无患子目(Sapindales)、胡桃目(Juglandales)、牻牛儿苗目(Geraniales)、远志目(Polygalales)、伞形目(Umbellales)、龙胆目(Gentianales)、花葱目(Polemoniales)、唇形目(Lamiales)、车前草目(Plantaginales)、玄参目(Scrophulariales)、桔梗目(Campanulales)、茜草目(Rubiales)、川绿断目(Dipsacales)以及菊目(Asterales);这些方法和CRISPR-Cas系统可以与单子叶植物一起使用,如属于以下目的那些植物:泽泻目(Alismatales)、水鳖目(Hydrocharitales)、茨藻目(Najadales)、霉草目(Triuridales)、鸭跖草目(Commelinales)、谷精草目(Eriocaulales)、帚灯草目(Restionales)、禾本目(Poales)、灯芯草目(Juncales)、莎草科(Cyperales)、香蒲目(Typhales)、凤梨目(Bromeliales)、姜目(Zingiberales)、槟榔目(Arecales)、环花目(Cyclanthales)、露兜树目(Pandanales)、天南星目(Arales)、百合目(Lilliales)以及兰目(Orchid ales),或与属于裸子植物的植物一起使用,例如属于以下目的那些植物:松目(Pinales)、银杏目(Ginkgoales)、苏铁目(Cycadales)、南洋杉目(Araucariales)、柏目(Cupressales)以及麻黄目(Gnetales)。
本文描述的RNA靶向CRISPR系统和使用方法可以用于广泛范围的植物物种,这些植物物种包括在以下双子叶植物、单子叶植物或裸子植物属的非限制性列表:颠茄属(Atropa)、油丹属(Alseodaphne)、槚如树属(Anacardium)、落花生属(Arachis)、琼楠属(Beilschmiedia)、芸苔属(Brassica)、红花属(Carthamus)、木防己属(Cocculus)、巴豆属(Croton)、黄瓜属(Cucumis)、柑橘属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、长春花属(Catharanthus)、椰子属(Cocos)、咖啡属(Coffea)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、杜氏木属(Duguetia)、花菱草属(Eschscholzia)、无花果属(Ficus)、草莓属(Fragaria)、海罂粟属(Glaucium)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、橡胶树属(Hevea)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、卷枝藤属(Landolphia)、亚麻属(Linum)、木姜子属(Litsea)、番茄属(Lycopersicon)、羽扇豆属(Lupinus)、木薯属(Manihot)、马郁兰属(Majorana)、苹果属(Malus)、苜蓿属(Medicago)、烟草属(Nicotiana)、齐墩果属(Olea)、银胶菊属(Parthenium)、罂粟属(Papaver)、鳄梨属(Persea)、菜豆属(Phaseolus)、黄连木属(Pistacia)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卜属(Raphanus)、蓖麻属(Ricinus)、千里光属(Senecio)、汉防己属(Sinomenium)、千金藤属(Stephania)、欧白芥属(Sinapis)、茄属(Solanum)、可可属(Theobroma)、三叶草属(Trifolium)、胡芦巴属(Trigonella)、蚕豆属(Vicia)、长春花属(Vinca)、葡萄属(Vilis)以及豇豆属(Vigna);以及以下属:葱属(Allium)、须芒草属(Andropogon)、画眉草属(Aragrostis)、天门冬属(Asparagus)、燕麦属(Avena)、狗牙根属(Cynodon)、油棕属(Elaeis)、羊茅属(Festuca)、黑麦草属(Festulolium)、萱草属(Heterocallis)、大麦属(Hordeum)、浮萍属(Lemna)、黑麦草属(Lolium)、芭蕉属(Musa)、稻属(Oryza)、黍属(Panicum)、Pannesetum、梯牧草属(Phleum)、早熟禾属(Poa)、黑麦属(Secale)、高粱属(Sorghum)、小麦属(Triticum)、玉蜀黍属(Zea)、冷杉属(Abies)、杉木属(Cunninghamia)、麻黄属(Ephedra)、云杉属(Picea)、松属(Pinus)以及黄杉属(Pseudotsuga)。
这些RNA靶向CRISPR系统和使用方法还可以用于广泛范围的“藻类”或“藻类细胞”;包括例如选自若干真核生物门的藻类,其包括红藻植物门(Rhodophyta)(红藻)、绿藻门(Chlorophyta)(绿藻)、褐藻门(Phaeophyta)(褐藻)、硅藻门(Bacillariophyta)(硅藻)、真眼点藻门(Eustigmatophyta)以及沟鞭藻类,连同原核生物门蓝藻门(Cyanobacteria)(蓝绿藻)。术语“藻类”包括例如选自以下的藻类:双眉藻属(Amphora)、鱼腥藻属(Anabaena)、纤维藻属(Anikstrodesmis)、丛粒藻属(Botryococcus)、角毛藻属(Chaetoceros)、衣藻属(Chlamydomonas)、小球藻属(Chlorella)、绿球藻属(Chlorococcum)、小环藻属(Cyclotella)、筒柱藻属(Cylindrotheca)、杜氏藻属(Dunaliella)、Emiliana、裸藻属(Euglena)、血球藻属(Hematococcus)、等边金藻属(Isochrysis)、单鞭金藻属(Monochrysis)、单针藻属(Monoraphidium)、微绿球藻属(Nannochloris)、拟微绿球藻属(Nannnochloropsis)、舟形藻属(Navicula)、肾鞭藻属(Nephrochloris)、肾爿藻属(Nephroselmis)、菱形藻属(Nitzschia)、节球藻属(Nodularia)、念珠藻属(Nostoc)、棕鞭藻属(Oochromonas)、卵囊藻属(Oocystis)、颤藻属(Oscillartoria)、巴夫藻属(Pavlova)、褐指藻属(Phaeodactylum)、扁藻属(Playtmonas)、颗石藻属(Pleurochrysis)、紫菜属(Porhyra)、假鱼腥藻属(Pseudoanabaena)、塔胞藻属(Pyramimonas)、裂丝藻属(Stichococcus)、聚球藻属(Synechococcus)、集胞藻属(Synechocystis)、四爿藻属(Tetraselmis)、海链藻属(Thalassiosira)以及束毛藻属(Trichodesmium)。
可以根据本发明的方法处理植物的一部分(即“植物组织”)以产生改良的植物。植物组织还涵盖植物细胞。如本文使用的术语“植物细胞”是指活的植物的个体单位,不论在完整的全植物中或以离体组织培养物、在培养基或琼脂上、悬浮于生长培养基或缓冲液中生长的分离形式、或作为高等组织化个体的一部分,例如像植物组织、植物器官或全植物。
“原生质体”是指已使用例如机械或酶促手段完全或部分地去除防卫细胞壁的植物细胞,形成可以改造它们的细胞壁、增殖并在适当的生长条件下再生长成全植物的活的植物的完整的生物化学感受态单位。
术语“转化”广义上是指如下过程,通过该过程借助土壤杆菌(Agrobacteria)或多种化学或物理方法之一通过引入DNA对植物宿主进行基因修饰。如本文使用的,术语“植物宿主”是指植物,包括植物的任何细胞、组织、器官或子代。许多适合的植物组织或植物细胞可以被转化并且包括但不限于原生质体、体细胞胚、花粉、叶、幼苗、茎、愈伤组织、匍匐茎、试管块茎以及嫩枝。植物组织还指这种植物、种子、子代、不管有性还是无性生殖的繁殖体以及这些中任一项的子代(如插条或种子)的任何克隆。
如本文使用的,术语“转化的”是指其中已经引入外源DNA分子(如构建体)的细胞、组织、器官或生物。所引入的DNA分子可以被整合到受体细胞、组织、器官或生物的基因组DNA中,这样使得所引入的DNA分子被传递至后续子代。在这些实施例中,“转化的”或“转基因的”细胞或植物还可以包括细胞或植物的子代以及产自采用这种转化的植株作为杂交的亲本的育种计划并且展示出由存在所引入的DNA分子导致的改变的表型的子代。优选地,转基因植物是能育的并且能够将所引入的DNA通过有性生殖传递给子代。
术语“子代”(如转基因植物的子代)是出生自、产生自或衍生自植物或转基因植物的子代。所引入的DNA分子也可以被瞬时引入到受体细胞中,这样使得所引入的DNA分子不被后续子代遗传并且因此不被认为是“转基因的”。因此,如本文使用的,“非转基因的”植物或植物细胞是不含有稳定整合到其基因组中的外源DNA的植物。
如本文使用的术语“植物启动子”是能够启动植物细胞转录的启动子,无论其是否来源自植物细胞。示例性的适合植物启动子包括但不局限于那些获得自植物、植物病毒以及细菌(如包含在植物细胞中表达的基因的土壤杆菌属(Agrobacterium)或根瘤菌属(Rhizobium))的启动子。
如本文使用的,“真菌细胞”是指真菌界内任何类型的真核细胞。真菌界内的门包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、芽枝霉门(Blastocladiomycota)、壶菌门(Chytridiomycota)、球囊菌门(Glomeromycota)、微孢子虫目(Microsporidia)以及新美鞭菌门(Neocallimastigomycota)。真菌细胞可以包括酵母、霉菌和丝状真菌。在一些实施例中,真菌细胞是酵母细胞。
如本文使用的,术语“酵母细胞”是指子囊菌门和担子菌门内的任何真菌细胞。酵母细胞可以包括芽殖酵母细胞、裂殖酵母细胞以及霉菌细胞。不限于这些生物,在实验室和工业环境中使用的许多类型的酵母是子囊菌门的部分。在一些实施例中,酵母细胞是酿酒酵母(S.cerervisiae)、马克思克鲁维酵母(Kluyveromyces marxianus)或东方伊萨酵母(Issatchenkia orientalis)细胞。其他酵母细胞可以包括但不限于假丝酵母属物种(Candida spp.)(例如,白色假丝酵母(Candida albicans))、亚罗酵母属物种(Yarrowiaspp.)(例如,解脂亚罗酵母(Yarrowia lipolytica))、毕赤酵母属物种(Pichia spp.)(例如,巴斯德毕赤酵母(Pichia pastoris))、克鲁维酵母菌属物种(Kluyveromyces spp.)(例如,乳酸克鲁维酵母(Kluyveromyces lactis)和马克思克鲁维酵母)、脉孢菌属物种(Neurospora spp.)(例如,粗糙脉孢菌(Neurospora crassa))、镰刀菌属物种(Fusariumspp.)(例如,尖孢镰刀菌(Fusarium oxysporum))以及伊萨酵母属物种(Issatchenkiaspp.)(例如,东方伊萨酵母,又称为库德里阿兹威毕赤酵母(Pichia kudriavzevii)和酸嗜热假丝酵母(Candida acidothermophilum))。在一些实施例中,真菌细胞是丝状真菌细胞。如本文使用的,术语“丝状真菌细胞”是指以丝状体(即菌丝或菌丝体)生长的任何类型的真菌细胞。丝状真菌细胞的实例可以包括但不限于曲霉属物种(Aspergillus spp.)(例如,黑曲霉(Aspergillus niger))、木霉属物种(Trichoderma spp.)(例如,里氏木霉(Trichoderma reesei))、根霉属物种(Rhizopus spp.)(例如,米根霉(Rhizopus oryzae))以及被孢霉属物种(Mortierella spp.)(例如,深黄被孢霉(Mortierella isabellina))。
在一些实施例中,真菌细胞是工业菌株。如本文使用的,“工业菌株”是指工业工艺(例如,以商业或工业规模生产产品)中使用的或从中分离的任何真菌细胞菌株。工业菌株可以是指典型地在工业工艺中使用的真菌物种,或者它可以是指也可以用于非工业目的(例如,实验室研究)的真菌物种的隔离群。工业工艺的实例可以包括发酵(例如,在食品或饮料产品的生产中)、蒸馏、生物燃料生产、化合物生产以及多肽生产。工业菌株的实例可以包括但不限于JAY270和ATCC4124。
在一些实施例中,真菌细胞是多倍体细胞。如本文使用的,“多倍体”细胞可以是指其基因组存在于多于一个拷贝中的任何细胞。多倍体细胞可以是指天然地发现处于多倍体状态的细胞类型,或者它可以是指已被诱导以多倍体状态存在的细胞(例如,通过减数分裂、胞质分裂或DNA复制的特定调节、改变、失活、活化或修饰)。多倍体细胞可以是指其整个基因组是多倍体的细胞,或者它可以是指感兴趣的具体基因组基因座是多倍体的细胞。不希望被理论所束缚,据认为指导RNA的丰度在多倍体细胞的基因组工程化中比在单倍体细胞中可以更经常地是限速组分,并且因此使用本文描述的C2c2CRISPRS系统的方法可以利用某种真菌细胞类型。
在一些实施例中,真菌细胞是二倍体细胞。如本文使用的,“二倍体”细胞可以是指其基因组存在于两个拷贝中的任何细胞。二倍体细胞可以是指天然地发现处于二倍体状态的细胞类型,或者它可以是指已被诱导以二倍体状态存在的细胞(例如,通过减数分裂、胞质分裂或DNA复制的特定调节、改变、失活、活化或修饰)。例如,酿酒酵母菌株S228C可以维持处于单倍体或二倍体状态。二倍体细胞可以是指其整个基因组是二倍体的细胞,或者它可以是指感兴趣的具体基因组基因座是二倍体的细胞。在一些实施例中,真菌细胞是单倍体细胞。如本文使用的,“单倍体”细胞可以是指其基因组存在于一个拷贝中的任何细胞。单倍体细胞可以是指天然地发现处于单倍体状态的细胞类型,或者它可以是指已被诱导以单倍体状态存在的细胞(例如,通过减数分裂、胞质分裂或DNA复制的特定调节、改变、失活、活化或修饰)。例如,酿酒酵母菌株S228C可以维持处于单倍体或二倍体状态。单倍体细胞可以是指其整个基因组是单倍体的细胞,或者它可以是指感兴趣的具体基因组基因座是单倍体的细胞。
如本文使用的,“酵母表达载体”是指含有编码RNA和/或多肽的一个或多个序列的核酸,并且可以进一步含有控制一种或多种核酸表达的任何所希望的元件连同能够使得表达载体在酵母细胞内部复制和维持的任何元件。许多适合的酵母表达载体及其特征在本领域是已知的;例如,不同载体和技术在Yeast Protocols[酵母实验室手册],第2版,Xiao,W.编辑(胡玛纳出版社(Humana Press),纽约,2007)以及Buckholz,R.G.和Gleeson,M.A.(1991)Biotechnology[生物技术](NY)9(11):1067-72中说明。酵母载体可以含有但不限于着丝粒(CEN)序列、自主复制序列(ARS)、可操作地连接到感兴趣的序列或基因上的启动子(如RNA聚合酶III启动子)、终止子(如RNA聚合酶III终止子)、复制原点以及标记基因(例如,营养缺陷型、抗生素或其他选择性标记)。用于在酵母中使用的表达载体的实例可以包括质粒、酵母人工染色体、2μ质粒、酵母整合型质粒、酵母复制型质粒、穿梭载体和游离型质粒。
RNA靶向CRISP系统组分在植物和植物细胞基因组中的稳定整合
在具体的实施例中,设想引入编码RNA靶向CRISPR系统的组分的多核苷酸以便稳定整合进植物细胞的基因组中。在这些实施例中,可以依据指导RNA和/或一个或多个RNA靶向基因在何时、何处和在何条件下表达,对转化载体或表达系统的设计进行调整。
在具体的实施例中,设想将RNA靶向CRISPR系统的组分稳定地引入到植物细胞的基因组DNA中。另外地或可替代地,设想引入RNA靶向CRISPR系统的组分以便稳定整合到植物细胞器的DNA中,如但不限于质体、线粒体或叶绿体。
用于稳定整合到植物细胞基因组中的表达系统可以含有一种或多种下列元件:可以用于在植物细胞中表达指导RNA和/或RNA靶向酶的启动子元件;增强表达的5’非翻译区;进一步增强在某些细胞(如单子叶植物细胞)中表达的内含子元件;为插入一种或多种指导RNA和/或RNA靶向基因序列以及其他所希望的元件提供方便的限制性位点的多克隆位点;以及为所表达的转录物提供有效终止的3’非翻译区。
表达系统的这些元件可以是圆形(如质粒或转化载体)或非圆形(如线性双链DNA)的一种或多种表达构建体。
在一个具体实施例中,RNA靶向CRISPR表达系统包含至少:
(a)编码与植物靶序列杂交的指导RNA(gRNA)的核苷酸序列,并且其中该指导RNA包含指导序列和同向重复序列;以及(b)编码RNA靶向蛋白的核苷酸序列,
其中组分(a)或(b)位于相同或不同的构建体上,并且由此不同的核苷酸序列可以在植物细胞中可操作的相同或不同调节元件的控制之下。
含有RNA靶向CRISPR系统的组分(并且在适用的情况下,模板序列)的一种或多种DNA构建体可以通过各种各样的常规技术引入到植物、植物部分、或植物细胞的基因组中。该方法通常包括以下步骤:选择适合的宿主细胞或宿主组织,将一种或多种构建体引入到宿主细胞或宿主组织中,并且从中再生植物细胞或植物。
在具体的实施例中,可以使用诸如但不限于电穿孔、微注射、植物细胞原生质体的气溶胶束注入等技术将DNA构建体引入到植物细胞中,或者可以使用诸如DNA粒子轰击等基因枪法直接将这些DNA构建体引入到植物组织中(还参见Fu等人,Transgenic Res.[转基因研究]2000年2月;9(1):11-9)。粒子轰击的基础是使涂覆有感兴趣的基因的粒子加速朝向细胞,由此导致粒子穿透原生质并且典型地稳定整合到基因组中。(参见例如Klein等人,Nature[自然](1987),Klein等人,Bio/Technology[生物/技术](1992),Casas等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊](1993))。
在具体的实施例中,可以通过土壤杆菌介导的转化将含有RNA靶向CRISPR系统的组分的DNA构建体引入到植物中。这些DNA构建体可以与适合的T-DNA侧翼区结合并且被引入到常规根瘤土壤杆菌(Agrobacterium tumefaciens)宿主载体中。通过感染植物或通过用土壤杆菌属细菌(含有一种或多种Ti(根瘤诱导)质粒)培育植物原生质体,可以将外源DNA掺入到植物基因组中。(参见例如Fraley等人,(1985),Rogers等人,(1987)以及美国专利5,563,055)。
植物启动子
为了确保在植物细胞中适当表达,典型地将本文描述的C2c2CRISPR系统的组分置于植物启动子(即在植物细胞中可操作的启动子)的控制之下。设想使用不同类型的启动子。
组成型植物启动子是能够在所有或几乎所有植物组织的所有或几乎所有植物发育阶段表达它所控制的可读框(ORF)的启动子(称为“组成型表达”)。组成型启动子的一个非限制性实例是花椰菜花叶病毒35S启动子。本发明设想了用于修饰RNA序列的方法,并且因此也设想了调节植物生物分子的表达。因此,在本发明的具体实施例中,将RNA靶向CRISPR系统的一种或多种元件置于可以被调节的启动子的控制下是有利的。“调节启动子”是指非组成型地但是以时间和/或空间调节方式指导基因表达的启动子,并且包括组织特异性、组织优选型和诱导型启动子。不同启动子可以指导在不同组织或细胞类型中、或在不同发育阶段、或响应于不同环境条件的基因表达。在具体的实施例中,一种或多种RNA靶向CRISPR组分在组成型启动子(如花椰菜花叶病毒35S启动子)的控制之下表达。组织优选型启动子可以用于靶向具体植物组织中某些细胞类型的增强的表达,例如叶或根的维管细胞或在种子的特定细胞中。用于在RNA靶向CRISPR系统中使用的具体启动子的实例发现于Kawamata等人,(1997)Plant Cell Physiol[植物细胞生理学]38:792-803;Yamamoto等人,(1997)Plant J[植物杂志]12:255-65;Hire等人,(1992)Plant Mol Biol[植物分子生物学]20:207-18;Kuster等人,(1995)Plant Mol Biol[植物分子生物学]29:759-72以及Capana等人,(1994)Plant Mol Biol[植物分子生物学]25:681-91。
可诱导并且允许对基因编辑或基因表达进行时空控制的启动子的实例可以利用一种能量形式。该能量形式可以包括但不限于声能、电磁辐射、化学能和/或热能。可诱导系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交体转录活化系统(FKBP、ABA等)或光可诱导系统(光敏素、LOV结构域或隐花色素),如以序列特异性方式指导转录活性的变化的光诱导的转录效应因子(LITE)。光可诱导系统的组分可以包括RNA靶向CRISPR酶、光响应细胞色素异二聚体(例如,来自拟南芥)以及转录活化/阻遏结构域。诱导型DNA结合蛋白和关于使用它们的方法的其他实例提供在US 61/736465和US 61/721,283中,将其特此通过引用以其整体并入。
在具体的实施例中,瞬时或诱导型表达可以通过使用例如化学调节型启动子(即,由此应用外源化学制品诱导基因表达)来实现。也可以通过化学阻抑型启动子(其中应用化学制品阻抑基因表达)来获得对基因表达的调节。化学诱导型启动子包括但不限于由苯磺酰胺除草剂安全剂活化的玉米ln2-2启动子(De Veylder等人,(1997)Plant Cell Physiol[植物细胞生理学]38:568-77)、由用作萌前除草剂的疏水性亲电子化合物活化的玉米GST启动子(GST-ll-27,WO93/01294)以及由水杨酸活化的烟草PR-1a启动子(Ono等人,(2004)Biosci Biotechnol Biochem[生物科学、生物技术与生物化学]68:803-7)。还可以在本文使用由抗生素调节的启动子(如四环素诱导型和四环素阻抑型启动子(Gatz等人,(1991)Mol Gen Genet[分子遗传学与普通遗传学]227:229-37;美国专利号5,814,618和5,789,156)。
易位至特定植物细胞器和/或在其中表达
该表达系统可以包含用于易位至特定植物细胞器和/或在其中表达的元件。
叶绿体靶向
在具体的实施例中,设想将RNA靶向CRISPR系统用于特异性修饰叶绿体基因的表达和/或翻译或确保叶绿体中的表达。为此目的,使用叶绿体转化方法或将RNA靶向CRISPR组分区室化至叶绿体。例如,向质体基因组中引入遗传修饰可以减少生物安全性问题,如通过花粉的基因流。
叶绿体转化的方法在本领域是已知的并且包括粒子轰击法、PEG处理以及微注射。此外,可以如在WO 2010061186中所描述的来使用涉及将转化盒从核基因组易位至质体的方法。
可替代地,设想将一种或多种RNA靶向CRISPR组分靶向植物叶绿体。这是通过将编码叶绿体转运肽(CTP)或质体转运肽的序列掺入到可操作地连接到编码RNA靶向蛋白的序列的5’区上的表达构建体中实现的。在处理步骤中的易位至叶绿体中的过程中去除CTP。表达蛋白质的叶绿体靶向是本领域技术人员所熟知的(参见例如Protein Transport intoChloroplasts[蛋白质转运到叶绿体中],2010,Annual Review of Plant Biology[植物生物学年度综述],第61卷:157-180)。在此类实施例中,还希望将一种或多种指导RNA靶向植物叶绿体。借助叶绿体定位序列可以用于将指导RNA易位到叶绿体中的方法和构建体描述于例如US 20040142476中,通过引用并入本文。可以将构建体的此类变化掺入到本发明的表达系统中以有效易位一种或多种RNA靶向指导RNA。
在藻类细胞中引入编码CRISPR-RNA靶向系统的多核苷酸。
转基因藻类(或其他植物,如油菜)可以在植物油或生物燃料如醇类(尤其是甲醇和乙醇)或其他产品的生产中特别有用。这些可以被工程化为表达或过表达高水平的油或醇类,以供在油或生物燃料行业中使用。
US 8945839描述了使用Cas9工程化微藻(莱茵衣藻(Chlamydomonas reinhardtiicells)细胞)物种的方法。使用类似工具,本文描述的RNA靶向CRISPR系统的方法可以应用于衣藻属(Chlamydomonas)物种和其他藻类。在具体的实施例中,在藻类中引入RNA靶向蛋白和一种或多种指导RNA,使用在组成型启动子(如Hsp70A-Rbc S2或β2-微管蛋白)的控制下表达RNA靶向蛋白的载体进行表达。任选地,使用含有T7启动子的载体递送指导RNA。可替代地,可以将RNA靶向mRNA和体外转录的指导RNA递送至藻类细胞中。电穿孔方案可由本领域技术人员获得,如来自GeneArt Chlamydomonas Engineering试剂盒的标准推荐方案。
在酵母细胞中引入编码RNA靶向组分的多核苷酸
在具体的实施例中,本发明涉及RNA靶向CRISPR系统用于酵母细胞中RNA编辑的用途。可以用于引入编码RNA靶向CRISPR系统组分的多核苷酸的用于转化酵母细胞的方法是本领域技术人员所熟知的,并且综述于Kawai等人,2010,Bioeng Bugs.[生物工程漏洞]2010年11月-12月;1(6):395–403)。非限制性实例包括通过醋酸锂处理(其可以进一步包括载体DNA和PEG处理)、轰击或通过电穿孔来转化酵母细胞。
在植物和植物细胞中瞬时表达RNA靶向CRISP系统组分
在具体的实施例中,设想在植物细胞中瞬时表达指导RNA和/或RNA靶向基因。在这些实施例中,仅当细胞中存在指导RNA和RNA靶向蛋白两者时,RNA靶向CRISPR系统才可以确保RNA靶分子的修饰,这样使得可以进一步控制基因表达。因为RNA靶向酶的表达是瞬时的,再生自此类植物细胞的植物典型地不含外源DNA。在具体的实施例中,RNA靶向酶由植物细胞稳定表达,并且瞬时表达指导序列。
在具体的优选实施例中,使用植物病毒载体可以将RNA靶向CRISPR系统组分引入到植物细胞中(Scholthof等人1996,Annu Rev Phytopathol.[植物病理学年鉴]1996;34:299-323)。在另外的具体实施例中,所述病毒载体是来自DNA病毒的载体。例如,双生病毒(例如,卷心菜叶曲病毒、豆黄矮病毒、小麦矮小病毒、番茄曲叶病毒、玉米条纹病毒、烟草曲叶病毒或番茄金色花叶病毒)或矮缩病毒(nanovirus)(例如,蚕豆坏死黄化病毒)。在其他具体的实施例中,所述病毒载体是来自RNA病毒的载体。例如,烟草脆裂病毒组(例如,烟草脆裂病毒、烟草镶崁病毒)、马铃薯X病毒组(例如,马铃薯X病毒)或大麦病毒(例如,大麦条纹花叶病毒)。植物病毒的复制基因组是非整合性载体,这在避免转基因植物产生的背景下是有意义的。
在具体的实施例中,用于瞬时表达RNA靶向CRISPR构建体的载体是例如pEAQ载体,其被定制为在原生质体中用于土壤杆菌介导的瞬时表达(Sainsbury F.等人,PlantBiotechnol J.[植物生物技术杂志]2009年9月;7(7):682-93)。使用经修饰的卷心菜叶曲病毒(CaLCuV)载体以在表达CRISPR酶的稳定转基因植物中表达gRNA证明了基因组位置的精确靶向(Scientific Reports[科技报告]5,文章号:14926(2015),doi:10.1038/srep14926)。
在具体的实施例中,可以将编码指导RNA和/或RNA靶向基因的双链DNA片段瞬时引入到植物细胞中。在此类实施例中,以足以修饰细胞中的一个或多个RNA分子但在经过预期的时间段之后或在一次或多次细胞分裂之后不持续的量提供所引入的双链DNA片段。用于在植物中直接DNA转移的方法是本领域技术人员已知的(参见例如Davey等人Plant MolBiol.[植物分子生物学]1989年9月;13(3):273-85)。
在其他实施例中,将编码RNA靶向蛋白的RNA多核苷酸引入到植物细胞中,然后它被以足以修饰一个或多个RNA分子细胞但在经过预期的时间段之后或在一次或多次细胞分裂之后不持续的量产生蛋白质(在至少一种指导RNA的存在下)的宿主细胞翻译并加工。用于将mRNA引入到植物原生质体中以便瞬时表达的方法是本领域技术人员已知的(参见例如在Gallie,Plant Cell Reports[植物细胞报告](1993),13;119-122中)。还设想了上述不同方法的组合。
RNA靶向CRISPR组分向植物细胞的递送
在具体的实施例中,感兴趣的是将RNA靶向CRISPR系统的一种或多种组分直接递送至植物细胞中。对于产生非转基因植物,这是尤其感兴趣的(参见下文)。在具体的实施例中,在植物或植物细胞外部制备一种或多种RNA靶向组分并将其递送到细胞中。例如,在具体的实施例中,在引入到植物细胞中之前,在体外制备RNA靶向蛋白。RNA靶向蛋白可以通过本领域技术人员已知的不同方法进行制备并且包括重组生产。在表达之后,将RNA靶向蛋白分离,如果需要的话再折叠,纯化和任选地处理以除去任何纯化标签(如His标签)。一旦获得未加工、部分纯化或更完全纯化的RNA靶向蛋白,就可以将蛋白质引入到植物细胞中。
在具体的实施例中,将RNA靶向蛋白与靶向感兴趣的RNA的指导RNA混合,以形成预组装的核糖核蛋白。
经由电穿孔、通过用RNA靶向相关的基因产物包衣的粒子轰击、通过化学转染或通过跨细胞膜运输的一些其他手段,可以将这些单独的组分或预组装的核糖核蛋白引入到植物细胞中。例如,用预组装的CRISPR核糖核蛋白对植物原生质体进行转染已经证实能确保植物基因组的定向修饰(如Woo等人,Nature Biotechnology[自然生物技术],2015;DOI:10.1038/nbt.3389所述)。可以修改这些方法以实现植物中RNA分子的定向修饰。
在具体的实施例中,使用纳米粒子将RNA靶向CRISPR系统组分引入到植物细胞中。可以将这些组分(作为蛋白质或核酸或以其组合)上载到或包装在纳米粒子中并将其施用到植物上(例如像描述于WO 2008042156和US 20130185823中)。具体而言,本发明的实施例包括纳米粒子,用编码RNA靶向蛋白的一种或多种DNA分子、编码指导RNA和/或如描述于WO2015089419中的分离的指导RNA的DNA分子上载或填充这些纳米粒子。
用于将RNA靶向CRISPR系统的一种或多种组分引入到植物细胞中的其他手段通过使用细胞穿透肽(CPP)进行。因此,特别地,本发明的实施例包括如下组合物,这些组合物包含连接到RNA靶向蛋白上的细胞穿透肽。在本发明的具体实施例中,RNA靶向蛋白和/或一种或多种指导RNA与一种或多种CPP偶联以有效地将它们运输到植物原生质体内(Ramakrishna(2014,Genome Res.[基因组研究]2014年6月;24(6):1020-7,针对人类细胞中的Cas9)。在其他实施例中,RNA靶向基因和/或一种或多种指导RNA是由一个或多个环状或非环状DNA分子所编码的,其被偶联到一个或多个CPP上以便进行植物原生质体递送。然后,将这些植物原生质体再生成为植物细胞并且进一步成为植物。通常将CPP描述为具有少于35个氨基酸的短肽,这些氨基酸衍生自蛋白质或衍生自嵌合序列,其能够以非受体依赖性方式跨细胞膜运输生物分子。CPP可以是阳离子肽、具有疏水序列的肽、两亲性肽、具有富含脯氨酸及抗微生物序列的肽以及嵌合或二分肽(Pooga和Langel 2005)。CPP能够穿透生物膜,并且因此触发不同生物分子跨细胞膜移动到细胞质中,并能改进它们的细胞内通路,并且因此促进生物分子与靶标的相互作用。CPP的实例尤其包括:Tat(通过HIV 1型进行病毒复制所需的核转录活化蛋白)、穿透素、卡波西(Kaposi)成纤维细胞生长因子(FGF)信号肽序列、整联蛋白β3信号肽序列;聚精氨酸肽Arg序列、富含鸟嘌呤的分子转运体、甜箭头肽(sweet arrow peptide)等。
设想用于植物、藻类或真菌应用的靶RNA
靶RNA(即感兴趣的RNA)是本发明靶向的RNA,其导致靶RNA上感兴趣的靶位点处的RNA靶向蛋白的募集和RNA靶向蛋白的结合。靶RNA可以是任何合适形式的RNA。在一些实施例中,这可以包括mRNA。在其他实施例中,靶RNA可以包括转运RNA(tRNA)或核糖体RNA(rRNA)。在其他实施例中,靶RNA可以包括干扰RNA(RNAi)、微小RNA(miRNA)、微开关,酵母菌(microzyme)、卫星RNA和RNA病毒。靶RNA可以位于植物细胞的细胞质中,或位于细胞核或植物细胞器(如线粒体、叶绿体或质体)中。
在具体的实施例中,RNA靶向CRISPR系统用于切割RNA或以其他方式抑制RNA表达。
使用RNA靶向CRISPR系统经由RNA调节来调节植物基因表达
RNA靶向蛋白也可以经由RNA加工的控制与合适的指导RNA一起用于靶向基因表达。对RNA加工的控制可以包括RNA加工反应,如RNA剪接,包括可变剪接或特异性靶向某些剪接变体或同种型;病毒复制(特别是植物病毒,包括植物中的类病毒)和tRNA生物合成。RNA靶向蛋白与合适的指导RNA组合也可以用于控制RNA活化(RNAa)。RNAa导致基因表达的促进,因此可以通过破坏或降低RNAa并因此减少基因表达的促进来实现对基因表达的控制。
本发明的RNA靶向效应蛋白可以进一步用于植物中的抗病毒活性,特别是抗RNA病毒。效应蛋白可以使用对选择的病毒RNA序列具有选择性的合适的指导RNA来靶向病毒RNA。具体而言,效应蛋白可以是切割RNA(如单链RNA)的活性核酸酶。因此提供了本发明的RNA靶向效应蛋白作为抗病毒剂的用途。能以这种方式抵消的病毒的实例包括但不限于烟草镶崁病毒(TMV)、番茄斑萎病毒(TSWV)、黄瓜花叶病毒(CMV)、马铃薯Y病毒(PVY)、花椰菜花叶病毒(CaMV)(RT病毒)、李痘病毒(PPV)、雀麦草花叶病毒(BMV)和马铃薯X病毒(PVX)。
本文进一步描述了在植物、藻类或真菌中调节RNA表达的实例,作为靶向基因修饰的替代方案。
特别感兴趣的是通过受调节的mRNA切割来调节基因表达。这可以通过将RNA靶向元件置于调节启动子控制下来实现,如本文描述的。
使用RNA靶向CRISPR系统恢复tRNA分子的功能。
Pring等人在plant mitochondria and chloroplasts[植物线粒体和叶绿体]中描述了RNA编辑,其改变mRNA序列以编码与DNA不同的蛋白质。(Plant Mol.Biol.[植物分子生物学](1993)21(6):1163–1170.doi:10.1007/BF00023611)。在本发明的具体实施例中,可以将特异性靶向线粒体和叶绿体mRNA的RNA靶向CRISPR系统的元件引入植物或植物细胞中,以在模拟体内发生的过程的此类植物细胞器中表达不同的蛋白质。
使用RNA靶向CRISPR系统作为RNA干扰的替代方案来抑制RNA表达。
RNA靶向CRISPR系统具有类似于RNA抑制或RNA干扰的用途,因此也可以替代此类方法。在具体的实施例中,本发明的方法包括使用RNA靶向CRISPR作为例如干扰性核糖核酸(如siRNA或shRNA或dsRNA)的替代物。本文进一步描述了在植物、藻类或真菌中抑制RNA表达的实例,作为靶向基因修饰的替代方案。
使用RNA靶向CRISPR系统控制RNA干扰。
对干扰RNA或miRNA的控制可以通过在体内或体外减少干扰RNA或miRNA的寿命来帮助减少用那些方法看到的脱靶效应(OTE)。在具体的实施例中,靶RNA可以包括干扰RNA,即参与RNA干扰途径的RNA,如shRNA,siRNA等。在其他实施例中,靶RNA可以包括微小RNA(miRNA)或双链RNA(dsRNA)。
在其他具体的实施例中,如果RNA靶向蛋白和一种或多种合适的指导RNA被选择性表达(例如在空间或时间上在调节启动子(例如组织或细胞周期特异性启动子)和/或增强子的控制下),这可以用于“保护”这些细胞或系统(在体内或体外)免受那些细胞中的RNAi。在其中不需要RNAi的邻近组织或细胞中,或者为了比较其中效应蛋白和合适的指导物被表达和不被表达的细胞或组织(即,分别是其中RNAi未被控制和其中RNAi被控制),这可能是有用的。RNA靶向蛋白可以用于控制或结合包含RNA或由RNA组成的分子,如核酶、核糖体或核糖开关。在本发明的实施例中,指导RNA可以将RNA靶向蛋白募集到这些分子,使得RNA靶向蛋白能够与它们结合。
本发明的RNA靶向CRISPR系统可以根据本披露无需过度实验而应用于植物内RNAi技术领域(包括昆虫有害生物管理、植物疾病管理和除草剂抗性管理)以及植物测定中,并且用于其他应用(参见例如Kim等人,Pesticide Biochemistry and Physiology[杀有害生物剂生物化学与生理学](影响因子:2.01).01/2015;120.DOI:10.1016/j.pestbp.2015.01.002;Sharma等人,Academic Journals[学术期刊](2015),卷12(18)第2303-2312页);Green J.M,Pest Management Science[有害生物管理科学],卷70(9),第1351-1357页),因为本申请为该系统的知情工程化提供了基础。
使用RNA靶向CRISPR系统修饰核糖开关并控制植物、藻类和真菌中的代谢调节
核糖开关(也称为船蛸属酶)是结合小分子并反过来调节基因表达的信使RNA的调节区段。这种机制允许细胞感知这些小分子的细胞内浓度。特定的核糖开关典型地通过改变此基因的转录、翻译或剪接来调节其邻近基因。因此,在本发明的具体实施例中,设想通过将RNA靶向蛋白与合适的指导RNA组合以靶向核糖开关来控制核糖开关活性。这可以是通过切割或结合到核糖开关。在具体的实施例中,设想降低核糖开关活性。最近,一种结合焦磷酸硫胺(TPP)的核糖开关被表征并发现可调节植物和藻类中的硫胺生物合成。此外,此元件似乎是植物中初级代谢的基本调节剂(Bocobza和Aharoni,Plant J.[植物杂志]2014年8月;79(4):693-703.doi:10.1111/tpj.12540.电子版2014年6月17日)。TPP核糖开关也发现于某些真菌中,如在粗糙脉孢菌中,在其中它控制可变剪接以有条件性地产生上游可读框(uORF),从而影响下游基因的表达(Cheah MT等人,(2007)Nature[自然]447(7143):497–500.doi:10.1038/nature05769)。本文描述的RNA靶向CRISPR系统可以用于操纵植物、藻类或真菌中的内源核糖开关活性,并因此改变由其控制的下游基因的表达。在具体的实施例中,RNA靶向CRISP系统可以用于测定体内或体外的核糖开关功能并研究其与代谢网络的相关性。在具体的实施例中,RNA靶向CRISPR系统可以潜在地用于工程化作为植物和基因控制平台中的代谢物传感器的核糖开关。
在针对植物、藻类或真菌的RNAi筛选中使用RNA靶向CRISPR系统
鉴定其敲低与表型变化相关的基因产物,可以经由RNAi筛选来探询生物学途径并鉴定组成部分。在本发明的具体实施例中,也可以通过使用本文描述的指导物29或指导物30蛋白和合适的指导RNA在这些筛选中或在这些筛选期间施加控制,以去除或降低筛选中RNAi的活性,从而(通过除去或减少干扰/阻遏)来恢复(先前受干扰的)基因产物的活性。
使用RNA靶向蛋白在体内和体外可视化RNA分子
在具体的实施例中,本发明提供了核酸结合系统。RNA与互补探针的原位杂交是一种强有力的技术。典型地,使用荧光DNA寡核苷酸通过杂交来检测核酸。通过诸如锁核酸(LNA)等某些修饰已经获得了增加的效率,但仍然需要高效且通用的替代方案。因此,RNA靶向系统的标记元件可以用作原位杂交的有效和适应性系统的替代方案。
RNA靶向CRISPR系统在植物和酵母中的进一步应用
在生物燃料生产中使用RNA靶向CRISPR系统
如本文使用的术语“生物燃料”是从植物和植物衍生的资源制成的替代燃料。可再生生物燃料可以提取自已经通过固碳过程获得其能量的有机物质,或者是通过生物质的使用或转化来制得。这种生物质可以直接用于生物燃料或可以通过热转化、化学转化和生物化学转化而转化为便利的含能量物质。这种生物质转化可以导致呈固体、液体或气体形式的燃料。有两种类型的生物燃料:生物乙醇和生物柴油。生物乙醇主要是通过大部分衍生自玉米和甘蔗的纤维素(淀粉)的糖发酵工艺产生。在另一方面生物柴油主要产自油料作物,如油菜籽、棕榈和大豆。生物燃料主要用于运输。
增强植物特性以用于生物燃料生产
在具体的实施例中,使用采用了如本文描述的RNA靶向CRISPR系统的方法来改变细胞壁特性,以便促进由关键水解试剂的接近,以用于更有效释放用于发酵的糖。在具体的实施例中,纤维素和/或木质素的生物合成被修饰。纤维素是细胞壁的主要组分。纤维素和木质素的生物合成被共调节。通过降低木质素在植物中的比例,可以增加纤维素的比例。在具体的实施例中,使用本文描述的方法下调植物中的木质素生物合成,从而增加可发酵的碳水化合物。更具体地说,使用本文描述的方法来下调选自下组的至少一个第一木质素生物合成基因,该组由以下组成:4-香豆酸3-羟化酶(C3H)、苯丙氨酸氨裂解酶(PAL)、肉桂酸4-羟化酶(C4H)、羟基肉桂酰转移酶(HCT)、咖啡酸O-甲基转移酶(COMT)、咖啡酰CoA 3-O-甲基转移酶(CCoAOMT)、阿魏酸5-羟化酶(F5H)、肉桂醇脱氢酶(CAD)、肉桂酰CoA-还原酶(CCR)、4-香豆酸-CoA连接酶(4CL)、单木质醇-木质素-特异性糖基转移酶和醛脱氢酶(ALDH),如WO2008064289A2中所披露。
在具体的实施例中,使用本文描述的方法来产生植物物质,该植物物质在发酵过程中产生更低水平的乙酸(还参见WO2010096488)。
修饰酵母以用于生物燃料生产
在具体的实施例中,本文提供的RNA靶向酶用于由重组微生物进行生物乙醇生产。例如,可以使用RNA靶向酶来工程化微生物(如酵母),以从可发酵糖生成生物燃料或生物聚合物,并且以任选地能够降解源自农业废物的植物衍生木质纤维素(作为可发酵糖的来源)。更具体地说,本发明提供了如下方法,使用RNA靶向CRISPR复合物来修饰生物燃料生产所需的内源基因表达和/或修饰可干扰生物燃料合成的内源基因。更具体地说,这些方法涉及刺激编码以下酶的一个或多个核苷酸序列在微生物(如酵母)中的表达,这些酶参与丙酮酸到乙醇或另一种感兴趣产物的转化。在具体的实施例中,这些方法确保刺激允许微生物降解纤维素的一种或多种酶(如纤维素酶)的表达。在又另外的实施例中,使用RNA靶向CRISPR复合物来抑制与生物燃料生产途径竞争的内源代谢途径。
修饰藻类和植物以用于生产植物油或生物燃料
转基因藻类或其他植物(如油菜)可以在植物油或生物燃料如醇类(尤其是甲醇和乙醇)的生产中特别有用。这些可以被工程化为表达或过表达高水平的油或醇类,以供在油或生物燃料行业中使用。
US 8945839描述了使用Cas9工程化微藻(莱茵衣藻细胞)物种的方法。使用类似工具,本文描述的RNA靶向CRISPR系统的方法可以应用于衣藻属物种和其他藻类。在具体的实施例中,在藻类中引入RNA靶向效应蛋白和指导RNA,使用在组成型启动子(如Hsp70A-RbcS2或β2-微管蛋白)的控制下表达RNA靶向效应蛋白的载体进行表达。指导RNA将使用含有T7启动子的载体来递送。可替代地,体外转录的指导RNA可以被递送到藻类细胞中。电穿孔方案遵循来自GeneArt Chlamydomonas Engineering试剂盒的标准推荐方案。
RNA靶向酶在植物中的具体应用
在具体的实施例中,本发明可以用作用于在植物系统中去除病毒的疗法,因为它能够切割病毒RNA。在人类系统中的先前研究已经证明了利用CRISPR在靶向丙型肝炎单链RNA病毒中的成功(A.Price等人,Proc.Natl.Acad.Sci[国家科学院院刊],2015)。这些方法还可以适用于在植物中使用RNA靶向CRISPR系统。
改良的植物
本发明还提供了通过本文提供的方法可获得和获得的植物和酵母细胞。通过本文描述的方法获得的改良的植物可以通过以下基因的修饰的表达用于食品或饲料生产中,这些基因例如确保对植物有害生物、除草剂、干旱、低温或高温、过量水等的耐受性。
通过本文描述的方法获得的改良的植物(尤其是作物和藻类)可以通过表达例如比在野生型中通常所见的更高的蛋白质、碳水化合物、营养素或维生素水平而用于食品或饲料生产中。在这方面,改良的植物(尤其是豆类和块茎)是优选的。
改良的藻类或其他植物(如油菜)可以在植物油或生物燃料如醇类(尤其是甲醇和乙醇)的生产中特别有用。这些可以被工程化为表达或过表达高水平的油或醇类,以供在油或生物燃料行业中使用。
本发明还提供了植物的改良部分。植物部分包括但不限于叶、茎、根、块茎、种子、胚乳、胚珠以及花粉。如本文设想的植物部分可以是可存活的、不可存活的、可再生的和/或不可再生的。
本文还涵盖的是提供了根据本发明的方法生成的植物细胞和植物。通过传统育种方法产生的包含遗传修饰的植物的配子、种子、胚、合子或体细胞、子代或杂合体也包括在本发明的范围内。此类植物可以含有插入在靶序列处或代替靶序列的异源或外源DNA序列。可替代地,此类植物可以仅含有在一个或多个核苷酸中的改变(突变、缺失、插入、取代)。这样,此类植物与它们的祖先植物的不同之处将仅在于具体修饰的存在。
在本发明的一个实施例中,C2c2系统用于例如通过针对细菌、真菌或病毒引起的疾病产生抗性来工程化病原体抗性植物。在某些实施例中,病原体抗性可以通过对农作物进行工程化以产生将被昆虫有害生物摄入从而导致死亡的C2c2系统来实现。在本发明的一个实施例中,使用C2c2系统来工程化非生物胁迫耐受性。在另一个实施例中,使用C2c2系统来工程化干旱胁迫耐受性或盐胁迫耐性或者冷或热胁迫耐受性。Younis等人2014,Int.J.Biol.Sci.[国际生物科学杂志]10;1150综述了植物育种方法的潜在目标,所有这些方法都可以通过使用本文描述的C2c2系统进行修正或改进。一些非限制性靶作物包括拟南芥(Arabidopsis thaliana)、玉蜀黍(Zea mays)、稻(Oryza sativa L)、欧洲李(Prunusdomestica L.)、陆地棉(Gossypium hirsutum)、黄花烟草(Nicotiana rustica)、玉蜀黍(Zea mays)、紫苜蓿(Medicago sativa)、本氏烟(Nicotiana benthamiana)和拟南芥(Arabidopsis thaliana)。
在本发明的一个实施例中,使用C2c2系统来管理作物有害生物。例如,可以在作物有害生物中操作的C2c2系统可以从植物宿主表达或者直接转移到靶标,例如使用病毒载体。
在一个实施例中,本发明提供了从杂合的非人类起始生物有效产生纯合生物的方法。在一个实施例中,本发明用于植物育种。在另一个实施例中,本发明用于动物育种。在此类实施例中,通过干扰参与双链断裂、染色体配对和/或链交换的至少一个靶基因来预防或抑制重组从而制备纯合生物,如植物或动物。
C2C2蛋白在经优化的功能性RNA靶向系统中的应用
在一个方面,本发明提供了用于将功能组分特异性递送至RNA环境的系统。这可以使用包含本发明的RNA靶向效应蛋白的CRISPR系统(其允许将不同组分特异性靶向RNA)来确保。更具体地说,此类组分包括活化因子或阻遏因子,如RNA翻译、降解等的活化因子或阻遏因子。这种系统的应用在本文其他地方进行了描述。
根据一个方面,本发明提供了非天然存在的或工程化的组合物,该组合物包含含有指导序列的指导RNA,该指导序列能够与细胞中感兴趣的基因组基因座中的靶序列杂交,其中该指导RNA通过插入结合衔接蛋白的一个或多个不同的RNA序列来修饰。在具体的实施例中,RNA序列可以结合两种或更多种衔接蛋白(例如适体),并且其中每种衔接蛋白与一个或多个功能结构域缔合。显示本文描述的c2c2酶的指导RNA适合于修饰指导序列。在具体的实施例中,通过将一个或多个不同RNA序列插入同向重复的5’、在同向重复内或指导序列的3’对指导RNA进行修饰。当存在多于一个功能结构域时,这些功能结构域可以是相同或不同的,例如,两个相同或两个不同的活化因子或阻遏因子。在一个方面,本发明提供了本文讨论的组合物,其中该一个或多个功能结构域附接至该RNA靶向酶,这样使得当结合至该靶RNA时,该功能结构域处于允许该功能结构域以其属性功能起作用的空间取向;在一个方面,本发明提供了本文讨论的组合物,其中该组合物包含CRISPR-Cas复合物,该复合物具有至少三个功能结构域,其中至少一个与该RNA靶向酶缔合并且其中至少两个与gRNA缔合。
因此,在一个方面,本发明提供了非天然存在的或工程化的CRISPR-Cas复合物组合物,该组合物包含如本文讨论的指导RNA和CRISPR酶,该酶是一种RNA靶向酶,其中任选地,该RNA靶向酶包含至少一个突变,这样使得该RNA靶向酶具有不超过5%的不具有该至少一个突变的RNA靶向酶的核酸酶活性,以及任选地一种或多种包含至少一个或多个核定位序列。在具体的实施例中,该指导RNA被另外地或可替代地修饰,以便仍确保RNA靶向酶的结合,但防止被RNA靶向酶切割(如在本文其他地方所详述的)。
在具体的实施例中,RNA靶向酶是c2c2酶,与不具有该至少一个突变的c2c2酶相比,其具有降低至少97%或100%的核酸酶活性。在一个方面,本发明提供了本文讨论的组合物,其中该C2c2酶包含两个或更多个突变。这些突变可以选自以下一个或多个氨基酸残基的突变:R597、H602、R1278和H1283,例如像以下突变中的一个或多个:R597A、H602A、R1278A和H1283A,根据沙氏纤毛菌c2c2蛋白或直向同源物中的相应位置。
在具体的实施例中,提供了如上文所述的包含两个或更多个功能结构域的RNA靶向系统。在具体的实施例中,该两个或更多个功能结构域是异源功能结构域。在具体的实施例中,该系统包含衔接蛋白,该衔接蛋白是包含功能结构域的融合蛋白,该融合蛋白在衔接蛋白与功能结构域之间任选地包含接头。在具体的实施例中,该接头包括GlySer接头。另外地或可替代地,一个或多个功能结构域通过接头(任选地GlySer接头)附接至RNA效应蛋白。在具体的实施例中,该一个或多个功能结构域通过HEPN结构域中的一个或两个附接到RNA靶向酶。
在一个方面,本发明提供了本文讨论的组合物,其中与衔接蛋白或RNA靶向酶缔合的该一个或多个功能结构域是能够活化或阻遏RNA翻译的结构域。在一个方面,本发明提供了本文讨论的组合物,其中与衔接蛋白缔合的该一个或多个功能结构域中的至少一个具有一种或多种活性,所述活性包括甲基化酶活性、脱甲基化酶活性、转录活化活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、DNA整合活性、RNA切割活性、DNA切割活性或核酸结合活性、或分子开关活性或化学可诱导性或光可诱导性。
在一个方面,本发明提供了包含适体序列的本文讨论的组合物。在具体的实施例中,该适体序列是对同一衔接蛋白具有特异性的两个或更多个适体序列。在一个方面,本发明提供了本文讨论的组合物,其中该适体序列是对不同衔接蛋白具有特异性的两个或更多个适体序列。在一个方面,本发明提供了本文讨论的组合物,其中该衔接蛋白包含MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、PRR1。因此,在具体的实施例中,该适体选自特异性结合以上列出的任一种衔接蛋白的结合蛋白。在一个方面,本发明提供了本文讨论的组合物,其中该细胞是真核细胞。在一个方面,本发明提供了本文讨论的组合物,其中该真核细胞是哺乳动物细胞、植物细胞或酵母细胞,其中该哺乳动物细胞任选地是小鼠细胞。在一个方面,本发明提供了本文讨论的组合物,其中该哺乳动物细胞是人细胞。
在一个方面,本发明提供了上文讨论的组合物,其中存在多于一种gRNA,并且这些gRNA靶向不同序列,由此当使用该组合物时,存在着多重化。在一个方面,本发明提供了如下组合物,其中存在多于一种通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列而进行修饰的gRNA。
在一个方面,本发明提供了本文讨论的组合物,其中与一个或多个功能结构域缔合的一种或多种衔接蛋白是存在的并且结合到插入到该一种或多种指导RNA中的一个或多个不同的RNA序列上。
在一个方面,本发明提供了本文讨论的组合物,其中该指导RNA被修饰成具有至少一个非编码功能环;例如,其中该至少一个非编码功能环是阻遏性的;例如,其中至少一个非编码功能环包含Alu。
在一个方面,本发明提供了用于修饰基因表达的方法,该方法包括向宿主给药或在宿主中体内表达如本文讨论的一种或多种组合物。
在一个方面,本发明提供了本文讨论的方法,该方法包括递送该组合物或用于编码它的一种或多种核酸分子,其中所述一种或多种核酸分子操作性地连接至一个或多个调节序列并且在体内进行表达。在一个方面,本发明提供了本文讨论的方法,其中经由慢病毒、腺病毒或AAV进行体内表达。
在一个方面,本发明提供了如本文讨论的细胞的哺乳动物细胞系,其中该细胞系任选地是人细胞系或小鼠细胞系。在一个方面,本发明提供了转基因哺乳动物模型,任选地是小鼠,其中该模型已经用本文讨论的组合物进行了转化或是所述转化体的子代。
在一个方面,本发明提供了一种或多种核酸分子,所述核酸分子编码如本文讨论的指导RNA或RNA靶向CRISPR-Cas复合物或组合物。在一个方面,本发明提供了如下载体,该载体包含:编码指导RNA(gRNA)的核酸分子,该指导RNA包含能够与细胞中感兴趣的基因组基因座中的靶序列杂交的指导序列,其中该gRNA的同向重复是通过插入结合至两种或更多种衔接蛋白的一个或多个不同RNA序列而进行修饰的,并且其中每种衔接蛋白与一个或多个功能结构域缔合;或者,其中该gRNA被修饰成具有至少一个非编码功能环。在一个方面,本发明提供了一种或多种载体,所述载体包含编码以下的一种或多种核酸分子:非天然存在的或工程化的CRISPR-Cas复合物组合物,该组合物包含本文所讨论的gRNA和RNA靶向酶,其中任选地,该RNA靶向酶包含至少一个突变,这样使得该RNA靶向酶具有不超过5%的不具有该至少一个突变的RNA靶向酶的核酸酶活性,以及任选地一种或多种包含至少一个或多个核定位序列。在一个方面,载体可以进一步包含可在真核细胞中操作的一种或多种调节元件,所述调节元件可操作地连接到编码指导RNA(gRNA)的核酸分子和/或编码RNA靶向酶和/或任选的一个或多个核定位序列的核酸分子上。
在一个方面,本发明提供了如下试剂盒,该试剂盒包含上文所描述的一种或多种组分。在一些实施例中,该试剂盒包含如以上所描述的载体系统以及用于使用该试剂盒的说明书。
在一个方面,本发明提供了筛选功能获得(GOF)或功能丧失(LOF)或者用于筛选非编码RNA或潜在调节区(例如,增强子、阻遏因子)的方法,该方法包括如本文讨论的或本文讨论的含有或表达RNA靶向酶的模型的细胞的细胞系,以及将如本文讨论的组合物引入该细胞系或模型的细胞中,由此该gRNA包括活化因子或阻遏因子,并且分别监测GOF或LOF,关于gRNA引入其中的那些细胞包括活化因子或关于gRNA引入其中的那些细胞包括阻遏因子。
在一个方面,本发明提供了非天然存在的或工程化的组合物的文库,这些组合物各自包含RNA靶向CRISPR指导RNA(gRNA),该指导RNA包含能够与细胞中感兴趣的靶RNA序列杂交的指导序列;RNA靶向酶,其中该RNA靶向酶包含至少一个突变,这样使得该RNA靶向酶具有不超过5%的不具有该至少一个突变的RNA靶向酶的核酸酶活性,其中该gRNA是通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列而进行修饰的,并且其中该衔接蛋白与一个或多个功能结构域缔合,其中该组合物包含一种或多种或者两种或更多种衔接蛋白,其中每种蛋白与一个或多个功能结构域缔合,并且其中这些gRNA包含基因组广度文库,该文库包含多种RNA靶向指导RNA(gRNA)。在一个方面,本发明提供了如本文讨论的文库,其中该RNA靶向酶与不具有该至少一个突变的RNA靶向酶相比时具有降低至少97%或100%的核酸酶活性。在一个方面,本发明提供了如本文讨论的文库,其中该衔接蛋白是包含该功能结构域的融合蛋白。在一个方面,本发明提供了如本文讨论的文库,其中该gRNA不是通过插入结合至该一种或两种或更多种衔接蛋白的一个或多个不同RNA序列而进行修饰的。在一个方面,本发明提供了如本文讨论的文库,其中该一个或两个或更多个结构域与RNA靶向酶缔合。在一个方面,本发明提供了如本文讨论的文库,其中该细胞群是真核细胞群。在一个方面,本发明提供了如本文讨论的文库,其中该真核细胞是哺乳动物细胞、植物细胞或酵母细胞。在一个方面,本发明提供了如本文讨论的文库,其中该哺乳动物细胞是人细胞。在一个方面,本发明提供了如本文讨论的文库,其中该细胞群是胚胎干(ES)细胞群。
在一个方面,本发明提供了如本文讨论的文库,其中该靶向具有约100个或更多个RNA序列。在一个方面,本发明提供了如本文讨论的文库,其中该靶向具有约1000个或更多个RNA序列。在一个方面,本发明提供了如本文讨论的文库,其中该靶向具有约20,000个或更多个序列。在一个方面,本发明提供了如本文讨论的文库,其中该靶向具有整个转录组。在一个方面,本发明提供了如本文讨论的文库,其中该靶向具有一系列聚焦于相关或令人希望的途径的靶序列。在一个方面,本发明提供了如本文讨论的文库,其中该途径是免疫途径。在一个方面,本发明提供了如本文讨论的文库,其中该途径是细胞分裂途径。
在一个方面,本发明提供了产生包含具有修饰的表达的基因的模式真核细胞的方法。在一些实施例中,疾病基因是与患有或患上疾病的风险的增加相关的任何基因。在一些实施例中,该方法包括(a)向真核细胞中引入编码上文所述的系统组分的一种或多种载体,并且(b)允许CRISPR复合物结合到靶多核苷酸上以便修饰基因的表达,由此产生包含修饰的基因表达的模式真核细胞。
本文提供的结构信息允许探询指导RNA与靶RNA和RNA靶向酶的相互作用,从而允许工程化或改变指导RNA结构,以优化整个RNA靶向CRISPR-Cas系统的功能性。例如,通过插入可以结合至RNA上的衔接蛋白,可以扩展指导RNA,而不与RNA靶向蛋白冲突。这些衔接蛋白可以进一步募集效应蛋白或融合物,这些效应蛋白或融合物包含一个或多个功能结构域。
本发明的一个方面是上述元件被包含在单个组合物中或被包含在单独的组合物中。这些组合物可以有利地被应用于宿主,以在基因组水平上引出功能效应。
本领域技术人员将理解,对指导RNA进行允许结合衔接子+功能结构域但不适当定位该衔接子+功能结构域(例如,由于CRISPR复合物三维结构的位阻)的修饰不是预期的修饰。通过将一个或多个不同RNA序列引入同向重复的5’、在同向重复内或指导序列的3’,可以对一种或多种经修饰的指导RNA进行修饰。
经修饰的指导RNA、经失活的靶向RNA酶(具有或不具有功能结构域)以及具有一个或多个功能结构域的结合蛋白可以各自被单独包含在组合物中并单独地或共同地给药至宿主。可替代地,这些组分可以被提供在用于给药至宿主的单个组合物中。可以经由本领域技术人员已知的或本文描述的用于递送到宿主的病毒载体(例如慢病毒载体、腺病毒载体、AAV载体)进行向宿主的给药。如本文所解释的,使用不同的选择标记(例如用于慢病毒gRNA选择)和gRNA浓度(例如取决于是否使用多种gRNA)对于引出改进的效果而言可以是有利的。
使用所提供的组合物,本领域的普通技术人员可以有利地且特异性地靶向具有相同或不同功能结构域的单个或多个基因座,以引出一个或多个基因组事件。这些组合物可以按多种多样的方法应用,用于在细胞中筛选文库和在体内进行功能建模(例如,lincRNA的基因活化和功能鉴定;功能获得建模;功能丧失建模;使用本发明的组合物建立用于优化和筛选目的细胞系和转基因动物)。
本发明包括本发明的组合物用于建立和利用条件型或诱导型CRISPR RNA靶向事件的用途。(参见例如,Platt等人,Cell[细胞](2014),http://dx.doi.org/10.1016/j.cell.2014.09.014,或本文引用的PCT专利公开,如WO 2014/093622(PCT/US2013/074667),其被认为不是先于本发明或申请)。例如,靶细胞有条件性地或诱导性地包含RNA靶向CRISPR酶(例如,以Cre依赖性构建体的形式)和/或有条件性地或诱导性地包含衔接蛋白并且,在表达被引入到靶细胞中的载体时,该载体表达的是诱导或产生在靶细胞中RNA靶向酶表达和/或衔接体表达的条件。通过应用本发明的传授和组合物与产生CRISPR复合物的已知方法,受功能结构域影响的诱导型基因表达也是本发明的一个方面。可替代地,衔接蛋白可以作为条件型或诱导型元件与条件型或诱导型RNA靶向酶一起提供,以便提供用于筛选目的有效模型,这有利地对于大量应用仅需要最小限度的设计和特定gRNA给药。
根据本发明的包含失活指导序列的指导RNA
在一个方面,本发明提供了按如下方式修饰的指导序列,该方式允许形成CRISPR复合物并且成功地结合至靶标,但同时不允许成功的核酸酶活性(即没有核酸酶活性/没有indel活性)。出于解释的原因,此类经修饰的指导物被称为“失活指导物”或“失活指导序列”。就核酸酶活性而言,这些失活指导物或失活指导序列可以被认为是无催化活性的或无构象活性的。实际上,就促进催化活性的能力或区分中靶和脱靶结合活性的能力而言,失活指导序列并不可以足够地参与富有成效的碱基配对。简言之,该测定涉及合成CRISPR靶RNA和包含与靶RNA的错配的指导RNA,将这些RNA与RNA靶向酶组合,并基于通过切割产物产生的条带的存在而在凝胶上进行分析,并基于相对条带强度定量切割。
因此,在一个相关方面,本发明提供了非天然存在的或工程化的组合物RNA靶向CRISPR-Cas系统,该系统包含如本文描述的功能性RNA靶向和指导RNA(gRNA),其中该gRNA包含失活指导序列,由此该gRNA能够与靶序列杂交,这样使得该RNA靶向CRISPR-Cas系统被引导至细胞中感兴趣的基因组基因座,而没有该系统的非突变型RNA靶向酶的可检测的RNA切割活性。应理解的是,如在本文的其他地方描述的根据本发明的任何gRNA都可以用作失活gRNA/包含如在下文描述的失活指导序列的gRNA。如在本文的其他地方描述的任何方法、产品、组合物和用途都同样地适用于失活gRNA/包含如在下文进一步详述的失活指导序列的gRNA。通过进一步指导的方式,提供了以下具体方面和实施例。
可以通过任何适合的测定法来评估失活指导序列指导CRISPR复合物与RNA靶序列的序列特异性结合的能力。例如,足以形成CRISPR复合物的CRISPR系统的组分(包括有待测试的失活指导序列)可以例如通过用编码该CRISPR序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后评估在该靶序列之内的优先切割。例如,通过提供该靶序列、包括有待测试的失活指导序列在内的CRISPR复合物的组分和不同于该测试失活指导序列的对照指导序列,并且比较在该测试指导序列与对照指导序列反应之间的靶序列处的结合或切割率,可以在试管中评估靶RNA多核苷酸序列的切割。其他测定法是可能的,并且将由本领域技术人员想到。失活指导序列可以被选择为靶向任何靶序列。在一些实施例中,该靶序列是在细胞的基因组内的序列。
如本文进一步解释的,若干结构参数允许适当的框架到达此类失活指导物处。失活指导序列典型地短于对应的指导序列,这导致活跃的RNA切割。在具体的实施例中,失活指导物比针对其的相应指导短5%、10%、20%、30%、40%、50%。
如下文解释的并且本领域已知的,gRNA-RNA靶向特异性的一个方面是同向重复序列,它有待被适当地连接至此类指导物。具体而言,这意味着这些同向重复序列的设计取决于RNA靶向酶的来源。因此,可用于经验证的失活指导序列的结构数据可以用于设计C2c2特异性等效物。例如两种或更多种C2c2效应蛋白的直向同源核酸酶结构域HEPN之间的结构相似性可以用于迁移设计等效失活指导物。因此,可以在长度和序列上对本文的失活指导物进行适当修饰,以反映此类C2c2特异性等效物,从而允许形成CRISPR复合物并且成功地结合至靶RNA,而同时不允许成功的核酸酶活性。
失活指导物在本文以及现有技术背景下的使用为体外、离体和体内应用两者中的网络生物学和/或系统生物学提供了令人惊讶且出乎意料的平台,从而允许多重基因靶向,并且特别是双向多重基因靶向。在失活指导物的使用之前,处理多个靶标一直具有挑战性并且在一些情况下是不可能的。通过使用失活指导物,可以例如在同一细胞中、在同一动物体内或在同一患者体内处理多个靶标,并且因此处理多种活性。这种多重化可以同时发生或交错发生持续希望的时间段。
例如,失活指导物允许使用gRNA作为基因靶向工具,而不是核酸酶活性的结果,并且同时提供活化或阻遏的引导工具。包含失活指导物的指导RNA可以按一定方式被修饰为进一步包括如下元件,这些元件允许活化或阻遏基因活性,特别是如在本文的其他地方描述的允许功能性放置基因效应物(例如基因活性的活化因子或阻遏因子)的蛋白衔接体(例如适体)。一个实例是掺入适体,如在本文和在现有技术中所解释的。通过工程化包含失活指导物的gRNA以掺入蛋白质相互作用适体(Konermann等人,“Genome-scaletranscription activation by an engineered CRISPR-Cas9complex[通过工程化的CRISPR-Cas9复合物进行的基因组范围内的转录活化]”,doi:10.1038/nature14136,通过引用并入本文),可以组装多个不同的效应结构域。在天然过程之后可以将其模式化。
因此,一个方面是本发明的gRNA,该gRNA包含失活指导物,其中该gRNA进一步包含修饰,这些修饰提供基因活化或阻遏,如本文所描述的。该失活gRNA可以包含一种或多种适体。这些适体对于基因效应物、基因活化因子或基因阻遏因子而言可以是特异性的。可替代地,这些适体对于蛋白质而言可以是特异性的,该蛋白质转而对于特定基因效应物、基因活化因子或基因阻遏因子而言是特异性的并且募集/结合特定基因效应物、基因活化因子或基因阻遏因子。如果存在多个活化因子或阻遏因子募集位点,优选的是这些位点对于活化因子或阻遏因子而言是特异性的。如果存在多个活化因子或阻遏因子结合位点,这些位点对于相同的活化因子或相同的阻遏因子而言可以是特异性的。这些位点对于不同活化因子或不同阻遏因子而言也可以是特异性的。这些效应物、活化因子、阻遏因子可以按融合蛋白的形式存在。
在一个方面,本发明提供了选择用于将功能化的CRISPR系统引导至生物内的基因座的失活指导RNA靶向序列的方法,该方法包括:a)在该基因座中定位一个或多个CRISPR基序;b)分析每个CRISPR基序下游的20nt序列,通过:i)确定该序列的GC含量;并且ii)确定在该生物的基因组中是否存在该序列的前15nt的脱靶匹配;c)如果该序列的GC含量是70%或更低并且没有鉴定到脱靶匹配,则选择该序列用于在指导RNA中使用。在一个实施例中,如果GC含量是50%或更低,则选择该序列。在一个实施例中,如果GC含量是40%或更低,则选择该序列。在一个实施例中,如果GC含量是30%或更低,则选择该序列。在一个实施例中,对两个或更多个序列加以分析,并且选择具有最低GC含量的序列。在一个实施例中,在该生物的调节序列中确定脱靶匹配。在一个实施例中,该基因座是调节区。一个方面提供了失活指导RNA,其包含根据上述方法所选择的靶向序列。
在一个方面,本发明提供了用于将功能化的CRISPR系统靶向生物内的基因座的失活指导RNA。在本发明的一个实施例中,该失活指导RNA包含靶向序列,其中该靶序列的CG含量是70%或更低,并且该靶向序列的前15nt与该生物内的另一个基因座的调节序列中的CRISPR基序下游的脱靶序列不匹配。在某些实施例中,该靶向序列的GC含量是60%或更低、55%或更低、50%或更低、45%或更低、40%或更低、35%或更低或者30%或更低。在某些实施例中,该靶向序列的GC含量是从70%至60%或从60%至50%或从50%至40%或从40%至30%。在一个实施例中,该靶向序列在该基因座的潜在靶向序列之中具有最低的CG含量。
在本发明的一个实施例中,该失活指导物的前15nt与该靶序列匹配。在另一个实施例中,该失活指导物的前14nt与该靶序列匹配。在另一个实施例中,该失活指导物的前13nt与该靶序列匹配。在另一个实施例中,该失活指导物的前12nt与该靶序列匹配。在另一个实施例中,该失活指导物的前11nt与该靶序列匹配。在另一个实施例中,该失活指导物的前10nt与该靶序列匹配。在本发明的一个实施例中,该失活指导物的前15nt与另一个基因座的调节区中的CRISPR基序下游的脱靶序列不匹配。在其他实施例中,该失活指导物的前14nt或前13nt、或该指导物的前12nt、或该失活指导物的前11nt、或该失活指导物的前10nt与另一个基因座的调节区中的CRISPR基序下游的脱靶序列不匹配。在其他实施例中,该失活指导物的前15nt、或14nt、或13nt、或12nt、或11nt与该基因组中的CRISPR基序下游的脱靶序列不匹配。
在某些实施例中,该失活指导RNA在3'-端包括与靶序列不匹配的另外的核苷酸。因此,包括CRISPR基序下游的前20-28nt的失活指导RNA在3'端的长度可以延长。
一般规定
在一个方面,本发明提供了核酸结合系统。RNA与互补探针的原位杂交是一种强有力的技术。典型地,使用荧光DNA寡核苷酸通过杂交来检测核酸。通过诸如锁核酸(LNA)等某些修饰已经获得了增加的效率,但仍然需要高效且通用的替代方案。本发明提供了用于原位杂交的有效和适应性系统。
在本发明的实施例中,术语指导序列和指导RNA可互换地使用,如在前述引用文献(如WO 2014/093622(PCT/US2013/074667))中。一般而言,指导序列是与靶多核苷酸序列具有足够互补性以便与该靶序列杂交并且指导CRISPR复合物与该靶序列的序列特异性结合的任何多核苷酸序列。在一些实施例中,当使用适合的比对算法进行最佳比对时,在指导序列与其相应的靶序列之间的互补程度是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对,其非限制性实例包括史密斯-沃特曼(Smith-Waterman)算法、尼德曼-翁施(Needleman-Wunsch)算法、基于伯罗斯-惠勒变换(Burrows-Wheeler Transform)的算法(例如,伯罗斯-惠勒比对工具(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技术公司(Novocraft Technologies);在www.novocraft.com可获得)、ELAND(亿明达公司(Illumina),圣地亚哥,加利福尼亚州)、SOAP(在soap.genomics.org.cn可获得)以及Maq(在maq.sourceforge.net可获得)。在一些实施例中,指导序列在长度上为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多的核苷酸。在一些实施例中,指导序列在长度上为少于约75、50、45、40、35、30、25、20、15、12个或更少的核苷酸。优选地,该指导序列是10-30个核苷酸长。可以通过任何适合的测定法来评估指导序列指导CRISPR复合物与靶序列的序列特异性结合的能力。例如,足以形成CRISPR复合物的CRISPR系统的组分(包括有待测试的指导序列)可以例如通过用编码该CRISPR序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后通过如本文描述的Surveyor测定来评估在该靶序列之内的优先切割。类似地,通过提供该靶序列、包括有待测试的指导序列在内的CRISPR复合物的组分、和不同于该测试指导序列的对照指导序列,并且比较在该测试指导序列与该对照指导序列反应之间的靶序列处的结合或切割率,可以在试管中评估靶多核苷酸序列的切割。其他测定法是可能的,并且将由本领域技术人员想到。指导序列可以被选择为靶向任何靶序列。在一些实施例中,该靶序列是在细胞的基因组内的序列。示例性靶序列包括在靶基因组中独特的那些。
一般而言,并且贯穿本说明书,术语“载体”是指如下核酸分子,它能够运送与其连接的另一种核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个自由端、无自由端(例如,环状的)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的DNA区段的环状双链DNA环。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装进病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)的载体中。病毒载体还包括由用于转染到宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被引入的宿主细胞中自主复制。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与宿主基因组一起复制。此外,某些载体能够指导它们操作性地连接的基因的表达。此类载体在本文称为“表达载体”。用于在真核细胞中表达并且导致在真核细胞中表达的载体在本文可以称为“真核表达载体”。在重组DNA技术中使用的常见表达载体通常呈质粒形式。
重组表达载体可以包含呈适合于在宿主细胞中表达核酸的形式的本发明的核酸,这意味着这些重组表达载体包括基于待用于表达的宿主细胞而选择的一种或多种调节元件,所述调节元件操作性地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许该核苷酸序列的表达的方式被连接至该一种或多种调节元件(例如,处于体外转录/翻译系统中或当该载体被引入宿主细胞中时,处于该宿主细胞中)。
术语“调节元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)以及其他表达控制元件(例如,转录终止信号,如多聚腺苷酸化信号和聚U序列)。此类调节元件描述于例如Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY[基因表达技术:酶学方法]185,Academic Press[学术出版社],圣地亚哥,加利福尼亚州(1990年)中。调节元件包括指导核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异性调节序列)。组织特异性启动子可以主要指导在感兴趣的期望组织中的表达,所述组织是例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如,肝、胰腺)或特殊的细胞类型(例如,淋巴细胞)。调节元件还能以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。在一些实施例中,载体包含一个或多个pol III启动子(例如,1、2、3、4、5个或更多个pol III启动子)、一个或多个pol II启动子(例如,1、2、3、4、5个或更多个pol II启动子)、一个或多个pol I启动子(例如,1、2、3、4、5个或更多个pol I启动子)或其组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见例如,Boshart等人,Cell[细胞],41:521-530(1985)]、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。还被术语“调节元件”涵盖的是增强子元件,如WPRE;CMV增强子;在HTLV-I的LTR中的R-U5’区段(Mol.Cell.Biol.[分子细胞生物学],卷8(1),第466-472页,1988);SV40增强子;以及在兔β-珠蛋白的外显子2与3之间的内含子序列(Proc.Natl.Acad.Sci.USA.[美国国家科学院院刊],卷78(3),第1527-31页,1981)。本领域的普通技术人员应当理解的是,表达载体的设计可以取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。载体可以被引入到宿主细胞中而由此产生转录物、蛋白质或肽,包括由如本文描述的核酸编码的融合蛋白或肽(例如,规律间隔成簇短回文重复(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。
有利的载体包括慢病毒以及腺相关病毒,并且也可以选择此类型的载体以靶向具体类型的细胞。
如本文使用的,术语V型或VI型CRISPR-Cas基因座效应蛋白的“crRNA”或“指导RNA”或“单个指导RNA”或“sgRNA”或“一种或多种核酸组分”包含与靶核酸序列具有足够互补性以与该靶核酸序列杂交并且指导靶向核酸的复合物与该靶核酸序列的序列特异性结合的任何多核苷酸序列。
在某些实施例中,如本文提供的CRISPR系统可以利用包含指导序列的crRNA或类似多核苷酸,其中该多核苷酸是RNA、DNA或RNA和DNA的混合物,和/或其中该多核苷酸包含一个或多个核苷酸类似物。序列可以包含任何结构,包括但不限于天然crRNA的结构,如凸起、发夹或茎环结构。在某些实施例中,包含指导序列的多核苷酸与第二多核苷酸序列形成双链体,该第二多核苷酸序列可以是RNA或DNA序列。
在某些实施例中,本发明的指导物包含非天然存在的核酸和/或非天然存在的核苷酸和/或核苷酸类似物、和/或化学修饰。非天然存在的核酸可以包括例如天然存在的和非天然存在的核苷酸的混合物。可以在核糖、磷酸和/或碱基部分处修饰非天然存在的核苷酸和/或核苷酸类似物。在本发明的一个实施例中,指导核酸包含核糖核苷酸和非核糖核苷酸。在一个这样的实施例中,指导物包含一个或多个核糖核苷酸和一个或多个脱氧核糖核苷酸。在本发明的一个实施例中,该指导物包含一个或多个非天然存在的核苷酸或核苷酸类似物,如具有硫代磷酸酯键、硼烷磷酸酯键的核苷酸,在核糖环的2'和4'碳之间包含亚甲基桥的锁核酸(LNA)核苷酸,或桥接核酸(BNA)。经修饰的核苷酸的其他实例包括2'-O-甲基类似物、2'-脱氧类似物、2-硫尿苷类似物、N6-甲基腺苷类似物或2'-氟代类似物。经修饰的碱基的另外的实例包括但不限于2-氨基嘌呤、5-溴代-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷。
在某些实施例中,使用经化学修饰的指导RNA。指导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处掺入2′-O-甲基(M)、2′-O-甲基3′硫代磷酸酯(MS)、S-限定乙基(constrained ethyl,cEt)或2′-O-甲基3′硫代PACE(MSP)。与未经修饰的指导RNA相比,此类经化学修饰的指导RNA可以包含增加的稳定性和增加的活性,但是中靶与脱靶特异性是不可预测的。(参见,Hendel,2015,Nat Biotechnol.[自然生物技术]33(9):985-9,doi:10.1038/nbt.3290,在线公开于2015年6月29日;Allerson等人,J.Med.Chem.[药物化学杂志]2005,48:901-904;Bramsen等人,Front.Genet.[遗传学前沿],2012,3:154;Deng等人,PNAS[美国国家科学院院刊],2015,112:11870-11875;Sharma等人,MedChemComm.[医药化学通讯],2014,5:1454-1471;Li等人,Nature Biomedical Engineering[自然生物医学工程],2017,1,0066DOI:10.1038/s41551-017-0066)。经化学修饰的指导RNA进一步包括但不限于具有硫代磷酸酯键的RNA和在核糖环的2′和4′碳之间包含亚甲桥的锁核酸(LNA)核苷酸。
在一些实施例中,当使用适合的比对算法进行最佳比对时,互补程度是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对,其非限制性实例包括史密斯-沃特曼算法、尼德曼-翁施算法、基于伯罗斯-惠勒变换的算法(例如,伯罗斯-惠勒比对工具)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技术公司;在www.novocraft.com可获得)、ELAND(亿明达公司,圣地亚哥,加利福尼亚州)、SOAP(在soap.genomics.org.cn可获得)以及Maq(在maq.sourceforge.net可获得)。可以通过任何适合的测定来评估指导序列(在靶向核酸的指导RNA内)指导靶向核酸的复合物与靶核酸序列的序列特异性结合的能力。例如,足以形成靶向核酸的复合物的靶向核酸的CRISPR系统的组分(包括有待测试的指导序列)可以如通过用编码靶向核酸的该复合物的组分的载体进行转染而被提供到具有相应靶核酸序列的宿主细胞中,随后如通过如本文描述的Surveyor测定来评估在该靶核酸序列内的优先靶向(例如,切割)。类似地,通过提供该靶核酸序列、包括有待测试的指导序列在内的靶向核酸的复合物的组分和不同于该测试指导序列的对照指导序列,并且比较在该测试指导序列与对照指导序列反应之间的靶序列处的结合或切割率,可以在试管中评估该靶核酸序列的切割。其他测定法是可能的,并且将由本领域技术人员想到。指导序列可以被选择为靶向任何靶核酸序列,并且因此靶向核酸的指导RNA也可以。该靶序列可以是DNA。该靶序列可以是任何RNA序列。在一些实施例中,该靶序列可以是选自下组的RNA分子内的序列,该组由以下组成:信使RNA(mRNA)、前mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、核小RNA(snRNA)、核仁小RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长链非编码RNA(lncRNA)以及胞质小RNA(scRNA)。在一些优选实施例中,该靶序列可以是选自下组的RNA分子内的序列,该组由以下组成:mRNA、前mRNA和rRNA。在一些优选实施例中,该靶序列可以是选自下组的RNA分子内的序列,该组由以下组成:ncRNA和lncRNA。在一些更优选的实施例中,该靶序列可以是mRNA分子或钱mRNA分子内的序列。
在一些实施例中,靶向核酸的指导RNA被选择为降低在靶向RNA的该指导RNA内的二级结构水平。在一些实施例中,在最佳地折叠时,靶向核酸的该指导RNA的约或少于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或更少的核苷酸参与自我互补碱基配对。可以通过任何适合的多核苷酸折叠算法来确定最佳折叠。一些算法是基于计算最小吉布斯(Gibbs)自由能。一种这样的算法的实例是mFold,如Zuker和Stiegler(NucleicAcids Res.[核酸研究]9(1981),133-148)所描述。折叠算法的另一个实例是使用质心结构预测算法的由维也纳大学(University of Vienna)的理论化学研究所(Institute forTheoretical Chemistry)研发的在线网络服务器RNAfold(参见例如,A.R.Gruber等人,2008,Cell[细胞]106(1):23-24;以及PA Carr和GM Church,2009,Nature Biotechnology[自然生物技术]27(12):1151-62)。
在某些实施例中,指导RNA或crRNA可以包含同向重复(DR)序列和指导序列或间隔子序列、基本上由其组成或由其组成。在某些实施例中,该指导RNA或crRNA可以包含融合至或连接至指导序列或间隔子序列的同向重复序列、基本上由其组成或由其组成。在某些实施例中,该同向重复序列可以位于该指导序列或间隔子序列的上游(即,5')。在其他实施例中,该同向重复序列可以位于该指导序列或间隔子序列的下游(即,3')。
在某些实施例中,该crRNA包含茎环,优选单个茎环。在某些实施例中,该同向重复序列形成茎环,优选单个茎环。
在某些实施例中,该指导RNA的间隔子长度是从15至35nt。在某些实施例中,该指导RNA的间隔子长度是至少15个核苷酸,优选至少18nt,如至少19、20、21、22或更多nt。在某些实施例中,该间隔子长度是从15至17nt(例如,15、16或17nt)、从17至20nt(例如,17、18、19或20nt)、从20至24nt(例如,20、21、22、23或24nt)、从23至25nt(例如,23、24或25nt)、从24至27nt(例如,24、25、26或27nt)、从27-30nt(例如,27、28、29或30nt)、从30-35nt(例如,30、31、32、33、34或35nt、或35nt)或更长。
申请人还进行挑战实验以验证C2c2的RNA靶向和切割能力。这个实验与大肠杆菌中StCas9异源表达的类似工作非常平行(Sapranauskas,R.等人Nucleic Acids Res[核酸研究]39,9275–9282(2011))。申请人将含有PAM和抗性基因的质粒引入异源大肠杆菌中,并且然后在相应的抗生素上铺板。如果存在质粒转录的抗性基因的RNA切割,申请人观察到没有活菌落。
更详细地,对于DNA靶标,测定如下,但是针对RNA靶标可以相应地进行调整。在此测定中使用两种大肠杆菌菌株。一种携带编码来自细菌菌株的内源效应蛋白基因座的质粒。另一菌株携带空质粒(例如pACYC184,对照菌株)。所有可能的7或8bp PAM序列都存在于抗生素抗性质粒(带有氨苄青霉素抗性基因的pUC19)上。PAM位于原型间隔子1序列旁边(内源效应蛋白基因座中第一个间隔子的DNA靶标)。克隆了两个PAM文库。一个具有原型间隔子的8个随机bp 5'(例如,总共65536个不同PAM序列=复杂性)。另一个文库具有原型间隔子的7个随机bp 3'(例如总复杂性是16384个不同的PAM)。克隆这两个文库以使每个可能的PAM具有平均500个质粒。在分开的转化中用5'PAM和3'PAM文库来转化测试菌株和对照菌株,并将转化的细胞分别在氨苄青霉素平板上铺板。识别和随后的切割/干扰质粒使得细胞容易受到氨苄青霉素影响并且阻止生长。转化后大约12小时,收获测试和对照菌株形成的所有菌落并分离质粒DNA。使用质粒DNA作为模板用于PCR扩增和随后的深度测序。所有PAM在未转化的文库中的表征显示了PAM在转化细胞中的预期表征。在对照菌株中发现的所有PAM的表征显示了实际表征。测试菌株中所有PAM的表征显示哪些PAM没有被酶识别出,并且与对照菌株比较允许提取经耗竭的PAM的序列。
为了将毒性和脱靶效应最小化,重要的是控制所递送的靶向核酸的指导RNA的浓度。靶向核酸的指导RNA的最佳浓度可以通过在细胞或非人类真核生物动物模型中测试不同的浓度并且使用深度测序分析在潜在的脱靶基因组基因座处的修饰的范围来确定。对于体内递送,应当选择产生最高的中靶修饰水平同时将脱靶修饰水平最小化的浓度。该核酸靶向系统有利地衍生自VI型CRISPR系统。在一些实施例中,核酸靶向系统的一种或多种元件来源于包含内源RNA靶向CRISPR系统的特殊生物。在具体的实施例中,VI型RNA靶向Cas酶是C2c2。Cas蛋白的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物或其修饰形式。在实施例中,如在本文提及的VI型蛋白(如C2c2)还涵盖VI型蛋白(如C2c2)的同源物或直向同源物。术语“直向同源物(orthologue)”(在本文还称为“直向同源物(ortholog)”)和“同源物(homologue)”(在本文还称为“同源物(homolog)”)在本领域是熟知的。通过进一步指导的方式,如本文使用的蛋白质的“同源物”是相同物种的执行与其同源物的蛋白质相同或相似功能的蛋白质。同源蛋白可以不必是结构相关的,或者仅仅是部分结构相关的。如本文使用的蛋白质的“直向同源物”是不同物种的执行与其直向同源物的蛋白质相同或相似功能的蛋白质。直向同源蛋白可以不必是结构相关的,或者仅仅是部分结构相关的。在具体的实施例中,如在本文提及的VI型蛋白(如C2c2)的同源物或直向同源物与VI型蛋白(如C2c2)具有至少80%、更优选至少85%、甚至更优选至少90%、例如像至少95%的序列同源性或同一性。在另外的实施例中,如在本文提及的VI型蛋白(如C2c2)的同源物或直向同源物与野生型VI型蛋白(如C2c2)具有至少80%、更优选至少85%、甚至更优选至少90%、例如像至少95%的序列同一性。
在一个实施例中,VI型RNA靶向Cas蛋白可以是如下属的生物的C2c2直向同源物,该属包括但不限于纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属(Sutterella)、军团菌属、密螺旋体属(Treponema)、产线菌属(Filifactor)、真杆菌属、链球菌属、乳杆菌属、支原体属(Mycoplasma)、拟杆菌属(Bacteroides)、Flaviivola、黄质菌属(Flavobacterium)、球旋体属(Sphaerochaeta)、固氮螺菌属、葡糖醋杆菌属、奈瑟菌属、罗氏菌属、细小棒菌属、葡萄球菌属、Nitratifractor、支原体属以及弯曲杆菌属。这样一种属的生物的物种可以是如本文另外论述的。
一些鉴定CRISPR-Cas系统酶的直向同源物的方法可以涉及鉴定感兴趣的基因组中的tracr序列。鉴定tracr序列可以涉及以下步骤:在数据库中搜索这些同向重复或tracr配对序列以鉴定包含CRISPR酶的CRISPR区域。在该CRISPR酶侧翼的CRISPR区域中在有义和反义两个方向上搜索同源序列。寻找转录终止子以及二级结构。将不是同向重复或tracr配对序列但与同向重复或tracr配对序列具有超过50%同一性的任何序列鉴定为可能的tracr序列。取该可能的tracr序列并且分析与其相关的转录终止子序列。
应当理解的是,可以将本文描述的任何功能性工程化到来自其他直向同源物的CRISPR酶中,包括包含来自多种直向同源物的片段的嵌合酶。此类直向同源物的实例在本文其他地方进行了描述。因此,嵌合酶可以包含如下生物的CRISPR酶直向同源物的片段,该生物包括但不限于纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、Flaviivola、黄质菌属、球旋体属、固氮螺菌属、葡糖醋杆菌属、奈瑟菌属、罗氏菌属、细小棒菌属、葡萄球菌属、Nitratifractor、支原体属以及弯曲杆菌属。嵌合酶可以包含第一片段和第二片段,并且这些片段可以是本文提到的属的生物的CRISPR酶直向同源物或本文提到的物种的片段;有利的是,这些片段来自不同物种的CRISPR酶直向同源物。
在实施例中,如在本文提及的VI型RNA靶向效应蛋白(特别是C2c2蛋白)还涵盖C2c2的功能变体或其同源物或直向同源物。如本文使用的蛋白质的“功能变体”是指这样的蛋白的至少部分地保留该蛋白质的活性的变体。功能变体可以包括突变体(其可以是插入、缺失或置换突变体),包括多晶型物等。还包括在功能变体内的是这样的蛋白质与另一种通常不相关的核酸、蛋白质、多肽或肽的融合产物。功能变体可以是天然存在的或者可以是人造的。有利的实施例可以涉及工程化的或非天然存在的VI型RNA靶向效应蛋白。
在本发明的一个实施例中,提供了如下效应蛋白,其包含与以下中任一项的野生型序列具有至少80%序列同源性的氨基酸序列:沙氏纤毛菌C2c2、毛螺菌科细菌MA2020C2c2、毛螺菌科细菌NK4A179 C2c2、嗜氨基梭菌(DSM 10710)C2c2、鸡肉杆菌(DSM 4847)C2c2、产丙酸沼杆菌(WB4)C2c2、威氏李斯特菌(FSL R9-0317)C2c2、李斯特菌科细菌(FSLM6-0635)C2c2、纽约李斯特菌(FSL M6-0635)C2c2、韦德纤毛菌(F0279)C2c2、荚膜红细菌(SB 1003)C2c2、荚膜红细菌(R121)C2c2、荚膜红细菌(DE442)C2c2、韦德纤毛菌(Lw2)C2c2或塞氏李斯特菌C2c2。
在本发明的一个实施例中,该效应蛋白包含与VI型效应蛋白共有序列(包括但不限于本文所述的共有序列)具有至少80%序列同源性的氨基酸序列。
在本发明的一个实施例中,该效应蛋白包含至少一个HEPN结构域,包括但不限于本文所述的HEPN结构域、本领域已知的HEPN结构域和通过与共有序列和基序比较而被认为是HEPN结构域的结构域。本文提供了几个这样的结构域。在一个非限制性实例中,共有序列可以衍生自本文提供的C2c2直向同源物的序列。
在本发明的一个实施例中,该效应蛋白包含一个或多个HEPN结构域,其包含RxxxxH基序序列。RxxxxH基序序列可以但不限于来自本文所述的HEPN结构域或本领域已知的HEPN结构域。RxxxxH基序序列进一步包括通过组合两个或更多个HEPN结构域的部分而产生的基序序列。如上所述,共有序列可以衍生自US62/432,240(BI-10035)中评论的15种直向同源物的序列。例如,根据上述序列比对,第一HEPN结构域包含R{N/H}xxxH基序,而第二HEPN结构域包含R{N/K}xxxH基序。
在本发明的一个实施例中,HEPN结构域包含至少一个RxxxxH基序,其包含R{N/H/K}X1X2X3H的序列。在本发明的一个实施例中,HEPN结构域包含RxxxxH基序,其包含R{N/H}X1X2X3H的序列。在本发明的一个实施例中,HEPN结构域包含R{N/K}X1X2X3H的序列。在某些实施例中,X1是R、S、D、E、Q、N、G、Y或H。在某些实施例中,X2是I、S、T、V或L。在某些实施例中,X3是L、F、N、Y、V、I、S、D、E或A。
根据本发明使用的其他效应物可以通过它们与cas1基因的接近来鉴定,例如但不限于在距离cas1基因起点20kb和距离cas1基因末端20kb的区域内。在某些实施例中,该 应蛋白包含至少一个HEPN结构域和至少500个氨基酸,并且其中该C2c2效应蛋白天然存在 于Cas1基因或CRISPR阵列上游或下游20kb内的原核基因组中。
在一个实施例中,编码VI型RNA靶向效应蛋白(特别是C2c2或其直向同源物或同源物)的一种或多种核酸分子可以针对在真核细胞中表达进行密码子优化。真核生物可以如本文所讨论的。一种或多种核酸分子可以是工程化的或非天然存在的。
在一个实施例中,VI型RNA靶向效应蛋白(特别是C2c2或其直向同源物或同源物)可以包含一个或多个突变(并且因此编码其的一种或多种核酸分子可以具有一个或多个突变)。这些突变可以是人工引入的突变并且可包括但不限于催化结构域中的一个或多个突变。关于Cas9酶的催化结构域的实例可以包括但不限于RuvC I、RuvC II、RuvC III以及HNH结构域。
在一个实施例中,VI型蛋白(如C2c2或其直向同源物或同源物)可以包含一个或多个突变。这些突变可以是人工引入的突变并且可包括但不限于催化结构域中的一个或多个突变。关于Cas酶的催化结构域的实例可以包括但不限于HEPN结构域。
在一个实施例中,VI型蛋白(如C2c2或其直向同源物或同源物)可以用作融合至或可操作地连接至功能结构域上的通用核酸结合蛋白。示例性的功能结构域可以包括但不限于翻译起始子、翻译活化因子、翻译阻遏因子、核酸酶(特别是核糖核酸酶)、剪接体、珠粒、光诱导型/可控型结构域或化学诱导型/可控型结构域。
在一些实施例中,未经修饰的核酸靶向效应蛋白可以具有切割活性。在一些实施例中,该RNA靶向效应蛋白可以指导在靶序列位置处或附近(例如在该靶序列之内和/或在该靶序列的互补物之内或在与该靶序列关联的序列处)的一条或两条核酸(DNA或RNA)链的切割。在一些实施例中,核酸靶向Cas蛋白可以指导距离靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个或更多个碱基对之内的一条或两条DNA或RNA链的切割。在一些实施例中,载体编码可以相对于相应的野生型酶被突变的核酸靶向Cas蛋白,使得该突变的核酸靶向Cas蛋白缺乏切割含有靶序列的靶多核苷酸的RNA链的能力。作为又一个实例,Cas的两个或更多个催化结构域(例如HEPN结构域)可以被突变为产生实质上缺乏所有RNA切割活性的突变的Cas。在一些实施例中,当该突变的酶的RNA切割活性不多于该酶的非突变形式的核酸切割活性的约25%、10%、5%、1%、0.1%、0.01%或更少时,则核酸靶向效应蛋白可被考虑为实质上缺乏所有RNA切割活性;一个实例可以是当突变形式的核酸切割活性与非突变形式相比是零或可忽略不计时。可以参考与来自VI型CRISPR系统的具有多个核酸酶结构域的最大核酸酶共享同源性的酶的通用类别来鉴定效应蛋白。最优选地,该效应蛋白是VI型蛋白,如C2c2。关于衍生,申请人意指该衍生的酶在很大程度上是基于与野生型酶具有高度序列同源性的含义,但是如本领域已知或如本文描述的它在某些方面已经被突变(修饰)。
再一次,应当理解的是,术语Cas和CRISPR酶以及CRISPR蛋白和Cas蛋白通常可互换地使用,并且本文参考的各方面同样是指本申请中进一步描述的新颖的CRISPR效应蛋白,除非另外显而易见的,如通过具体参考Cas9。如上提及的,在本文中使用的许多残基编号是指来自VI型CRISPR基因座的效应蛋白。然而,应当理解的是,本发明包括更多的来自其他微生物物种的效应蛋白。在某些实施例中,Cas可以组成性地存在或诱导性地存在或条件性地存在或给予或递送。Cas优化可以用来增强功能或者用来开发新的功能,可以产生嵌合Cas蛋白。并且Cas可以用作通用的核酸结合蛋白。
典型地,在内源核酸靶向系统的背景下,靶向核酸的复合物(包含杂交到靶序列上并且与一种或多种核酸靶向效应蛋白复合的指导RNA)的形成导致在该靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、100、200、500个或更多个碱基对之内)的一条链或两条DNA或RNA链的切割。如本文使用的,术语“一个或多个与感兴趣的靶基因座相关的序列”是指在靶序列附近的序列(例如,离靶序列1、2、3、4、5、6、7、8、9、10、20、50、100、200、500个或更多个碱基对之内,其中该靶序列被包含在感兴趣的靶基因座中)。
密码子优化序列的一个实例在这种情形下是针对在真核生物(例如,人类)中表达(即,针对在人类中表达进行优化)或针对如本文讨论的另一种真核生物、动物或哺乳动物进行优化的序列;参见例如WO 2014/093622(PCT/US2013/074667)中的SaCas9人密码子优化序列作为密码子优化序列的实例(根据本领域知识和本披露,密码子优化一种或多种编码核酸分子(尤其是对于效应蛋白(例如C2c2)而言)在技术人员的范围内)。虽然这是优选的,但是应当理解的是,其他实例也是可能的,并且针对除人类之外的宿主物种的密码子优化或针对具体器官的密码子优化是已知的。在一些实施例中,编码DNA/RNA靶向Cas蛋白的酶编码序列针对在特定的细胞(如真核细胞)中表达进行密码子优化。这些真核细胞可以是特定生物的那些或来源于特定生物的那些,如哺乳动物,包括但不限于人、或如本文讨论的非人类真核生物或动物或哺乳动物,例如小鼠、大鼠、兔、狗、牲畜、或非人类哺乳动物或灵长动物。在一些实施例中,对于人类或动物而言很可能使得他们(它们)受苦而没有任何实质性医学益处的用于修饰人类的种系遗传同一性的方法和/或用于修饰动物的遗传同一性的方法以及还有作为这样的方法的结果的动物可以被排除在外。一般而言,密码子优化是指通过用在宿主细胞的基因中更频繁地或者最频繁地使用的密码子代替天然序列的至少一个密码子(例如约或多于约1、2、3、4、5、10、15、20、25、50个或更多个密码子同时维持该天然氨基酸序列而修饰核酸序列以便增强在感兴趣宿主细胞中的表达的方法。不同的物种对于特定氨基酸的某些密码子展示出特定的偏好。密码子偏好性(在生物之间的密码子使用的差异)经常与信使RNA(mRNA)的翻译效率相关,而翻译效率则被认为尤其依赖于被翻译的密码子的性质和特定的转运RNA(tRNA)分子的可用性。细胞内选定的tRNA的优势一般反映了最频繁用于肽合成的密码子。因此,可以将基因定制为基于密码子优化在给定生物中的最佳基因表达。密码子利用率表可以容易地获得,例如在www.kazusa.orjp/codon/可获得的“密码子使用数据库(Codon Usage Database)”,并且这些表可以通过不同的方式调整适用。参见,Nakamura,Y.等人“Codon usage tabulated from the international DNAsequence databases:status for the year 2000[从国际DNA序列数据库中制表的密码子使用:2000年的状态]”Nucl.Acids Res.[核酸研究]28:292(2000)。用于密码子优化特定的序列以便在特定的宿主细胞中表达的计算机算法也是可用的,如Gene Forge(Aptagen公司;雅各布斯(Jacobus),宾夕法尼亚州)也是可用的。在一些实施例中,在编码DNA/RNA靶向Cas蛋白的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50个或更多个、或所有密码子)对应于对于特定氨基酸最频繁使用的密码子。
在一些实施例中,载体编码核酸靶向效应蛋白(如C2c2)或其直向同源物或同源物,其包含一个或多个核定位序列(NLS)或核输出序列(NES),如约或多于约1、2、3、4、5、6、7、8、9、10个或更多个NLS或NES。在一些实施例中,该RNA靶向效应蛋白包含在氨基-末端处或其附近的约或多于约1、2、3、4、5、6、7、8、9、10个或更多的NLS或NES,在羧基-末端处或其附近的约或多于约1、2、3、4、5、6、7、8、9、10个或更多的NLS或NES,或这些的组合(例如在氨基-末端处的零个或至少一个或多个NLS或NES以及在羧基-末端处的零个或至少一个或多个NLS或NES)。当存在多于一个NLS或NES时,每一个可以被选择为不依赖于其他NLS或NES,使得在多于一个拷贝中可以存在单个NLS或NES和/或与在一个或多个拷贝中存在一个或多个其他NLS或NES相组合。在一些实施例中,当NLS或NES的最邻近的氨基酸是在从N-末端或C-末端沿着该多肽链的约1、2、3、4、5、10、15、20、25、30、40、50个或更多的氨基酸之内时,NLS或NES可以被视为在该N-末端或C-末端附近。NLS的非限制性实例包括衍生自以下的NLS序列:SV40病毒大T抗原的NLS,具有氨基酸序列PKKKRKV;来自核质蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK的核质蛋白二分NLS);c-myc NLS,具有氨基酸序列PAAKRVKLD或RQRRNELKRSP;hRNPA1M9NLS,具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY;来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV;肌瘤T蛋白的序列VSRKRPRP和PPKKARED;人p53的序列POPKKKPL;小鼠c-abl IV的序列SALIKKKKKMAP;流感病毒NS1的序列DRLRR和PKQKKRK;肝炎病毒δ抗原的序列RKLKKKIKKL;小鼠Mx1蛋白的序列REKKKFLKRR;人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK;以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK。一般而言,该一个或多个NLS或NES具有足够的强度,以便分别在真核细胞的细胞核或细胞质中驱动该DNA/RNA靶向Cas蛋白以可检测的量积累。一般而言,核/细胞质定位活性的强度可以由在该核酸靶向效应蛋白中的NLS/NES的数目、所使用的一个或多个特定的NLS或NES、或这些因素的组合导出。可以通过任何适合的技术进行细胞核/细胞质中积累的检测。例如,检测标记可以与该核酸靶向效应蛋白融合,使得细胞内的位置可以被可视化,如与检测细胞核(例如,对细胞核具有特异性的染料,如DAPI)或细胞质的位置的手段相结合。还可以将细胞核从细胞中分离出来,然后可以通过任何适合的用于检测蛋白质的方法(如免疫组织化学、Western印迹或酶活性测定)分析其内容物。如通过测定靶向核酸的复合物形成的作用(例如,测定在靶序列处的RNA切割或突变、或测定由于RNA靶向复合物形成和/或RNA靶向Cas蛋白活性的影响而改变的基因表达活性),与没有暴露于该核酸靶向Cas蛋白或靶向核酸的复合物、或暴露于缺乏该一个或多个NLS或NES的核酸靶向Cas蛋白的对照相比较,还可以间接地确定细胞核/细胞质中的积累。在本文描述的C2c2效应蛋白复合物和系统的优选实施例中,密码子优化的C2c2效应蛋白包含附接到蛋白质C-末端的NLS或NES。
在一些实施例中,将驱动靶向核酸的系统的一种或多种元件的表达的一种或多种载体引入宿主细胞中,使得靶向核酸的该系统的这些元件的表达在一个或多个靶位点指导靶向核酸的复合物的形成。例如,靶向核酸的效应酶和靶向核酸的指导RNA可以各自可操作地连接到分开的载体上的分开的调节元件上。可以将该核酸靶向系统的一种或多种RNA递送到转基因的核酸靶向效应蛋白的动物或哺乳动物,例如组成性地或诱导性地或条件性地表达核酸靶向效应蛋白的动物或哺乳动物;或以其他方式表达核酸靶向效应蛋白或具有含有核酸靶向效应蛋白的细胞的动物或哺乳动物,如通过向其先前给予编码并且在体内表达核酸靶向效应蛋白的一种或多种载体的方式。可替代地,从相同或不同调节元件表达的两种或更多种元件可以结合在单一载体中,其中提供该核酸靶向系统的任何组分的一种或多种另外的载体不包括在该第一载体中。结合在单一载体中的靶向核酸的系统元件可以按照任何适合的方向排列,如一种元件相对于第二元件位于5'(“上游”)或3'(“下游”)。一种元件的编码序列可以位于第二元件的编码序列的同一条链或相对链上,并且方向为相同或相对的方向。在一些实施例中,单个启动子驱动编码核酸靶向效应蛋白的转录物以及嵌入在一个或多个内含子序列之内(例如,各自在不同的内含子中、两个或更多个在至少一个内含子中、或全部在单个内含子中)的靶向核酸的指导RNA的表达。在一些实施例中,该核酸靶向效应蛋白和靶向核酸的该指导RNA可以可操作地连接至同一启动子并且从其中表达。用于表达靶向核酸的系统的一种或多种元件的递送运载体、载体、粒子、纳米粒子、配制品及其组分是如在前述文献(如WO 2014/093622(PCT/US2013/074667))中使用的。在一些实施例中,载体包含一个或多个插入位点,如限制性内切核酸酶识别序列(也称为“克隆位点”)。在一些实施例中,一个或多个插入位点(例如,约或多于约1、2、3、4、5、6、7、8、9、10个或更多个插入位点)位于一种或多种载体的一个或多个序列元件的上游和/或下游。在一些实施例中,载体包含两个或更多个插入位点,从而允许在每个位点插入指导序列。在这样一种安排中,两个或更多个指导序列可以包含单个指导序列的两个或更多个拷贝、两个或更多个不同的指导序列、或这些的组合。当使用多个不同的指导序列时,可以使用单个表达构建体使靶向核酸的活性靶向到细胞内的多个不同的相应靶序列。例如,单一载体可以包含约或多于约1、2、3、4、5、6、7、8、9、10、15、20个或更多个指导序列。在一些实施例中,可以提供约或多于约1、2、3、4、5、6、7、8、9、10种或更多种这样的含有靶序列的载体,并且任选地将其递送到细胞中。在一些实施例中,载体包含可操作地连接到编码核酸靶向效应蛋白的酶编码序列上的调节元件。核酸靶向效应蛋白或靶向核酸的指导RNA或一种或多种RNA可以分开地递送;并且有利地,这些中的至少一者经由粒子或纳米粒子复合物递送。核酸靶向效应蛋白mRNA可以在靶向核酸的指导RNA之前递送,以给核酸靶向效应蛋白的表达留出时间。可以在给药靶向核酸的指导RNA之前1-12小时(优选约2-6小时)给药核酸靶向效应蛋白mRNA。可替代地,可以一起给药核酸靶向效应蛋白mRNA和靶向核酸的指导RNA。有利地,可以在初始给药核酸靶向效应蛋白mRNA+指导RNA之后1-12小时(优选约2-6小时)给药指导RNA的第二加强剂量。为了实现基因组和/或转录组修饰的最有效水平,另外给药核酸靶向效应蛋白mRNA和/或指导RNA可以是有用的。
在一个方面,本发明提供了用于使用靶向核酸的系统的一种或多种元件的方法。本发明的靶向核酸的复合物提供了用于修饰靶RNA的有效手段。本发明的靶向核酸的复合物具有多种多样的实用性,包括修饰(例如,缺失、插入、易位、失活、活化)多种细胞类型中的靶RNA。正因为如此,本发明的靶向核酸的复合物在例如基因治疗、药物筛选、疾病诊断以及预后中具有广阔的应用谱。示例性的靶向核酸的复合物包含与杂交到感兴趣的靶基因座内的靶序列上的指导RNA复合的RNA靶向效应蛋白。
在一个实施例中,本发明提供了切割靶RNA的方法。该方法可以包括使用靶向核酸的复合物修饰靶RNA,该复合物结合到该靶RNA上并且实施所述靶RNA的切割。在一个实施例中,当被引入进细胞中时,本发明的靶向核酸的复合物在RNA序列中可产生断裂(例如,单链或双链断裂)。例如,可以使用该方法切割细胞中的疾病RNA。例如,可以将外源RNA模板引入进细胞中,该外源RNA模板包含有待整合的侧翼为上游序列和下游序列的序列。上游和下游序列与RNA中的整合位点的任一侧都具有序列相似性。在希望的情况下,供体RNA可以是mRNA。该外源RNA模板包含有待整合的序列(例如,突变的RNA)。供整合的序列可以是对细胞而言内源或外源的序列。有待整合的序列的实例包括编码蛋白质的RNA或非编码RNA(例如,微小RNA)。因此,供整合的序列可以可操作地连接到一个或多个适当的控制序列上。可替代地,有待整合的序列可以提供调节功能。选择外源RNA模板中的上游和下游序列,以促进感兴趣的RNA序列与供体RNA之间的重组。该上游序列是与供整合的靶向位点的上游的RNA序列具有序列相似性的RNA序列。类似地,该下游序列是与供整合的靶向位点的RNA序列下游具有序列相似性的RNA序列。外源RNA模板中的上游和下游序列与靶向的RNA序列可以具有75%、80%、85%、90%、95%或100%序列同一性。优选地,外源RNA模板中的上游和下游序列与靶向的RNA序列具有约95%、96%、97%、98%、99%或100%序列同一性。在一些方法中,外源RNA模板中的上游和下游序列与靶向的RNA序列具有约99%或100%序列同一性。上游或下游序列可以包含从约20bp至约2500bp,例如约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性上游或下游序列具有约200bp至约2000bp、约600bp至约1000bp或更具体地约700bp至约1000bp。在一些方法中,该外源RNA模板可以进一步包含标记。这样的一种标记使得容易地筛选靶向的整合。适合的标记的实例包括限制性位点、荧光蛋白或选择性标记。可以使用重组技术构建本发明的外源RNA模板(参见例如,Sambrook等人,2001和Ausubel等人,1996)。在用于通过整合外源RNA模板而修饰靶RNA的方法中,通过靶向核酸的复合物将断裂(例如,双链或单链DNA或RNA中的双链或单链断裂)引入进DNA或RNA序列中,通过用外源RNA模板进行同源重组而修复该断裂,这样使得将该模板整合进RNA靶标中。双链断裂的存在促进模板的整合。在其他实施例中,本发明提供了修饰RNA在真核细胞中的表达的方法。该方法包括通过使用结合到RNA(例如,mRNA或前mRNA)的靶向核酸的复合物增加或降低靶多核苷酸的表达。在一些方法中,可以使靶RNA失活以实施细胞中的表达的修饰。例如,当靶向RNA的复合物结合到细胞中的靶序列上时,该靶RNA失活,这样使得该序列不被翻译,该编码蛋白质不被产生,或者该序列不会像野生型序列一样起作用。例如,可以使蛋白质或微小RNA编码序列失活,这样使得该蛋白质或微小RNA或前微小RNA转录物不被产生。RNA靶向复合物的靶RNA可以是对真核细胞而言内源或外源的任何RNA。例如,该靶RNA可以是驻留在真核细胞的细胞核中的RNA。靶RNA可以是编码基因产物(例如,蛋白质)的序列(例如,mRNA或前mRNA)的序列或非编码序列(例如,ncRNA、lncRNA、tRNA或rRNA)。靶RNA的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关RNA。靶RNA的实例包括疾病相关RNA。“疾病相关”RNA是指与非疾病对照的组织或细胞相比,在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生翻译产物的任何RNA。在改变的表达与疾病的出现和/或进展相关的情况下,它可以是从以异常高的水平被表达的基因转录的RNA;它可以是从以异常低的水平被表达的基因转录的RNA。疾病相关RNA还指从具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变化的基因转录的RNA。翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。RNA靶向复合物的靶RNA可以是对真核细胞而言内源或外源的任何RNA。例如,该靶RNA可以是驻留在真核细胞的细胞核中的RNA。靶RNA可以是编码基因产物(例如,蛋白质)的序列(例如,mRNA或前mRNA)的序列或非编码序列(例如,ncRNA、lncRNA、tRNA或rRNA)。
在一些实施例中,该方法可以包括允许靶向核酸的复合物结合到靶RNA上,以实现所述靶RNA或RNA的切割,由此修饰靶RNA,其中靶向核酸的该复合物包含与杂交到所述靶RNA内的靶序列上的指导RNA复合的核酸靶向效应蛋白。在一个方面,本发明提供了修饰RNA在真核细胞中的表达的方法。在一些实施例中,该方法包括允许靶向核酸的复合物结合到该RNA上,这样使得所述结合导致所述RNA的表达增加或降低;其中靶向核酸的该复合物包含与指导RNA复合的核酸靶向效应蛋白。类似的考虑因素和条件适用如上文针对修饰靶RNA的方法。事实上,这些取样、培养和重新引入选择跨本发明的多个方面而适用。在一个方面,本发明提供了修饰真核细胞中的靶RNA的方法,这些方法可以在体内、离体或在体外。在一些实施例中,该方法包括对来自人或非人动物的细胞或细胞群进行取样,并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。该细胞或这些细胞甚至可以被重新引入该非人动物或植物中。对于重新引入的细胞,特别优选的是这些细胞是干细胞。
的确,在本发明的任何方面,靶向核酸的复合物可以包含与杂交到靶序列上的指导RNA复合的核酸靶向效应蛋白。
本发明涉及用于控制涉及RNA序列靶向的基因表达的系统、方法和组合物的工程化和优化,这些系统、方法和组合物涉及靶向核酸的系统及其组分。在有利的实施例中,该效应蛋白酶是VI型蛋白,如C2c2。本发明方法的一个优点在于,该CRISPR系统最小化或避免了脱靶结合及其所产生的副作用。这是通过使用被安排为具有针对靶RNA的高度序列特异性的系统而实现的。
相对于靶向核酸的复合物或系统,优选地,该tracr序列具有一个或多个发夹结构,并且长度是30个或更多个核苷酸,长度是40个或更多个核苷酸,或长度是50或更多个核苷酸;该crRNA序列的长度在10至30个核苷酸之间,该核酸靶向效应蛋白是VI型效应蛋白。
在某些实施例中,该效应蛋白可以是李斯特菌属物种C2c2p,优选塞氏李斯特菌C2c2p,更优选塞氏李斯特菌血清变型1/2b菌株SLCC3954C2c2p,并且该crRNA序列的长度可以是44至47个核苷酸,具有5'29-nt同向重复(DR)和15-nt至18-nt间隔子。
在某些实施例中,该效应蛋白可以是纤毛菌属物种C2c2p,优选沙氏纤毛菌C2c2p,更优选沙氏纤毛菌DSM 19757C2c2p,并且该crRNA序列的长度可以是42至58个核苷酸,具有至少24nt的5'同向重复如5'24-28-nt同向重复(DR)和至少14nt的间隔子如14-nt至28-nt间隔子、或至少18nt(如19、20、21、22或更多nt,如18-28、19-28、20-28、21-28或22-28nt)的间隔子。
更优选地,该效应蛋白可以是纤毛菌属物种(优选韦德纤毛菌F0279)或李斯特菌属物种(优选纽约李斯特菌FSL M6-0635)。
在某些实施例中,该效应蛋白可以是VI型基因座效应蛋白,更特别是C2c2p,并且该crRNA序列的长度可以是36至63个核苷酸,优选长度为37-nt至62-nt,或长度为38-nt至61-nt,或长度为39-nt至60-nt,更优选长度为40-nt至59-nt,或长度为41-nt至58-nt,最优选长度为42-nt至57-nt。例如,该crRNA可以包含同向重复(DR)(优选5'DR)和间隔子,基本上由其组成或由其组成,同向重复长度为26-nt至31-nt,优选长度为27-nt至30-nt,甚至更优选长度为28-nt或29-nt或长度为至少28或29nt,并且间隔子长度为10-nt至32-nt,优选长度为11-nt至31-nt,更优选长度为12-nt至30-nt,甚至更优选长度为13-nt至29-nt,并且最优选长度为14-nt至28-nt,如18-28nt、19-28nt、20-28nt、21-28nt或22-28nt。
在某些实施例中,该效应蛋白可以是VI型基因座效应蛋白,更特别是C2c2p,并且该tracrRNA序列(如果存在的话)可以是至少60-nt长,如长度为至少65-nt,或长度为至少70-nt,如长度为从60-nt至70-nt,或长度为从60-nt至70-nt,或长度为从70-nt至80-nt,或长度为从80-nt至90-nt,或长度为从90-nt至100-nt,或长度为从100-nt至110-nt,或长度为从110-nt至120-nt,或长度为从120-nt至130-nt,或长度为从130-nt至140-nt,或长度为从140-nt至150-nt,或长度为超过150-nt。
在某些实施例中,该效应蛋白可以是VI型基因座效应蛋白,更特别是C2c2p,并且切割不需要tracrRNA。
两种不同适体(每种与不同的靶向核酸的指导RNA缔合)的使用允许使用活化因子-衔接蛋白融合物和阻遏因子-衔接蛋白融合物与不同核酸靶向RNA,以活化一个DNA或RNA的表达,同时阻遏另一个的表达。可以在多重化方法中一起或基本上一起给药它们连同其不同指导RNA。可以同时使用大量的这样的经修饰的靶向核酸的指导RNA,例如10种或20种或30种等,同时待递送仅一种(或至少最小数目的)效应蛋白分子,因为相对较小数目的效应蛋白分子可以与大量的经修饰的指导物一起使用。衔接蛋白可以与一种或多种活化因子或一种或多种阻遏因子缔合(优选连接至或融合至它们)。例如,衔接蛋白可以与第一活化因子和第二活化因子缔合。该第一和第二活化因子可以是相同的,但是优选地它们是不同的活化因子。可以使用三种或更多种或甚至四种或更多种活化因子(或阻遏因子),但是包装尺寸可以将数目限制高于5个不同的功能结构域。在直接融合至衔接蛋白中优选使用接头,其中两个或更多个功能结构域与该衔接蛋白缔合。适合的接头可以包括GlySer接头。
还设想该核酸靶向效应蛋白指导RNA复合物整体上可以与两个或更多个功能结构域缔合。例如,可以存在两个或更多个与核酸靶向效应蛋白缔合的功能结构域,或者可以存在两个或更多个与指导RNA缔合的功能结构域(经由一种或多种衔接蛋白),或者可以存在一个或多个与该核酸靶向效应蛋白缔合的功能结构域和一个或多个与该指导RNA缔合的功能结构域(经由一种或多种衔接蛋白)。
衔接蛋白与活化因子或阻遏因子之间的融合可以包括接头。例如,可以使用GlySer接头GGGS。根据需要,它们可以按3个((GGGGS)3)或6、9或甚至12个或更多个的重复使用,以提供适合的长度。接头可以用在指导RNA与功能结构域(活化因子或阻遏因子)之间,或核酸靶向效应蛋白与功能结构域(活化因子或阻遏因子)之间。使用这些接头来工程化适当量的“机械柔性”。
本发明包括包含核酸靶向效应蛋白和指导RNA的靶向核酸的复合物,其中该核酸靶向效应蛋白包含至少一个突变,使得核酸靶向Cas蛋白与不具有该至少一个突变的核酸靶向Cas蛋白相比具有其不超过5%的活性,并且任选地具有至少一个或多个核定位序列;该RNA指导包含能够杂交到细胞中的感兴趣的RNA中的靶序列上的指导序列;并且其中:该核酸靶向效应蛋白与两个或更多个功能结构域缔合;或者通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列来修饰该指导RNA的至少一个环,并且其中该衔接蛋白与两个或更多个功能结构域缔合;或者该核酸靶向效应蛋白与一个或多个功能结构域缔合,并且通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列来修饰该指导RNA的至少一个环,并且其中该衔接蛋白与一个或多个功能结构域缔合。
通用递送
C2c2效应蛋白复合物可以递送功能效应物
不像CRISPR-Cas介导的基因敲除,其通过在DNA水平上使基因突变而永久消除表,CRISPR-Cas敲减允许通过使用人工转录或翻译因子暂时降低基因表达。使C2c2蛋白的两个DNA或RNA切割结构域中的关键残基突变导致产生无催化活性C2c2。无催化活性C2c2与指导RNA复合并且定位至由指导RNA的靶向结构域指定的RNA序列,然而,它不切割靶RNA。无活性C2c2蛋白与效应物结构域(例如,转录或翻译阻遏结构域)的融合能使得将效应物募集至由指导RNA指定的任何RNA位点。在某些实施例中,C2c2可以融合至转录阻遏结构域并募集至基因的启动区。尤其针对基因阻遏,本文考虑到的是阻断内源转录因子的结合部位将有助于下调基因表达。在另一个实施例中,无活性C2c2可以融合到染色质修饰蛋白上。改变染色质状态可以导致靶基因的表达降低。在另外的实施例中,C2c2可以与翻译阻遏结构域融合。
在一个实施例中,指导RNA分子可以被靶向至已知的转录应答元件(例如,启动子、增强子等)、已知的上游活化序列、和/或疑似能够控制靶RNA的(蛋白质)表达、具有未知或已知功能的序列。
在一些方法中,可以使靶多核苷酸失活以实施细胞中的表达的修饰。例如,当CRISPR复合物结合到细胞中的靶序列上时,该靶多核苷酸失活,这样使得该序列不被转录,该编码蛋白质不被产生,或者该序列不会像野生型序列一样起作用。例如,可以使蛋白质或微小RNA编码序列失活,这样使得该蛋白质不被产生。在一些方法中,可以使靶多核苷酸失活以实施细胞中的表达的修饰。例如,在CRISPR复合物与细胞中的RNA靶序列结合后,靶多核苷酸失活,使得序列不被翻译,从而影响细胞中蛋白质的表达水平。
在具体的实施例中,该CRISPR酶包含一个或多个选自下组的突变,该组由以下组成:R597A、H602A、R1278A和H1283A,和/或该一个或多个突变在该CRISPR酶的HEPN结构域中或者为如本文另外论述的突变。在一些实施例中,该CRISPR酶具有一个或多个在催化结构域中的突变,其中在转录时,该同向重复序列形成单个茎环,并且该指导序列指导CRISPR复合物与该靶序列的序列特异性结合,并且其中该酶进一步包含功能结构域。在一些实施例中,该功能结构域是...。在一些实施例中,该功能结构域是转录阻遏结构域,优选KRAB。在一些实施例中,该转录阻遏结构域是SID、或SID的多联体(例如SID4X)。在一些实施例中,该功能结构域是表观遗传修饰结构域,从而提供了表观遗传修饰酶。在一些实施例中,该功能结构域是活化结构域,其可以是P65活化结构域。
递送C2c2效应蛋白复合物或其组分
根据本披露和本领域的知识,可以通过在本文一般性地和详细地描述的递送系统来递送TALE、CRISPR-Cas系统或其组分或其核酸分子或编码或提供其组分的核酸分子。
载体递送,例如质粒、病毒递送:该CRISPR酶(例如V型蛋白如C2c2)和/或本发明的任何RNA(例如指导RNA)可以使用任何适合载体(例如,质粒或病毒载体,如腺相关病毒(AAV)、慢病毒、腺病毒或其他病毒载体类型、或其组合)进行递送。效应蛋白以及一种或多种指导RNA可以被包装到一种或多种载体(例如,质粒或病毒载体)中。在一些实施例中,病毒(例如,质粒或病毒载体)可以例如通过肌肉注射递送到感兴趣的组织中,而有时经由静脉内、经皮、鼻内、经口、粘膜或其他递送方法进行递送。这样的递送可以经由单剂量或多剂量来进行。本领域的普通技术人员理解的是,本文有待递送的实际剂量可以在很大程度上取决于多种因素而变化,如载体选择、靶细胞、生物、或组织、有待治疗的受试者的一般状况、所寻求的转化/修饰的程度、给药途径、给药方式、所寻求的转化/修饰的类型等。
这样的剂量可以进一步含有例如载体(水、盐水、乙醇、甘油、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油等)、稀释剂、药学上可接受的载体(例如,磷酸盐缓冲盐水)、药学上可接受的赋形剂和/或本领域已知的其他化合物。该剂量可以进一步含有一种或多种药学上可接受的盐,例如像,无机酸盐如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐等;以及有机酸盐,如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等。另外,也可以存在辅助物质,如润湿剂或乳化剂、pH缓冲物质、凝胶或胶凝材料、调味剂、着色剂、微球体、聚合物、悬浮剂等。另外,也可以存在一种或多种其他常规药用成分,如防腐剂、保湿剂、悬浮剂、表面活性剂、抗氧化剂、抗结剂、填充剂、螯合剂、包衣剂、化学稳定剂等,尤其是该剂型是可复原形式时。适合的示例性成分包括微晶纤维素、羧甲基纤维素钠、聚山梨酯80、苯乙醇、三氯叔丁醇、山梨酸钾、抗坏血酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯酚、明胶、白蛋白及其组合。药学上可接受的赋形剂的彻底论述可获自REMINGTON'SPHARMACEUTICAL SCIENCES[雷明顿药物科学](马克出版公司(Mack Pub.Co.),新泽西州,1991),将其通过引用并入本文。
在本文的一个实施例中,递送是经由腺病毒进行的,其可以是含有至少1x105个腺病毒载体粒子(也称为粒子单位,pu)的单次加强剂量。在本文的一个实施例中,该剂量优选地是该腺病毒载体的至少约1x106个粒子(例如,约1x106-1x1012个粒子),更优选至少约1x107个粒子,更优选至少约1x108个粒子(例如,约1x108-1x1011个粒子或约1x108-1x1012个粒子),并且最优选至少约1x100个粒子(例如,约1x109-1x1010个粒子或约1x109-1x1012个粒子),或者甚至至少约1x1010个粒子(例如,约1x1010-1x1012个粒子)。可替代地,该剂量包含不多于约1x1014个粒子,优选不多于约1x1013个粒子,甚至更优选不多于约1x1012个粒子,甚至更优选不多于约1x1011个粒子,并且最优选不多于约1x1010个粒子(例如,不多于约1x109个粒子)。因此,该剂量可以含有单剂量的腺病毒载体,其具有例如,约1x106粒子单位(pu),约2x106pu、约4x106pu、约1x107pu、约2x107pu、约4x107pu、约1x108pu、约2x108pu、约4x108pu、约1x109pu、约2x109pu、约4x109pu、约1x1010pu、约2x1010pu、约4x1010pu、约1x1011pu、约2x1011pu、约4x1011pu、约1x1012pu、约2x1012pu、或约4x1012pu的腺病毒载体。参见例如,在2013年6月4日授权的授予Nabel等人的美国专利号8,454,972B2中的腺病毒载体(通过引用并入本文)以及在其第29栏第36-58行的剂量。在本文的一个实施例中,该腺病毒是经由多剂量递送的。
在本文的一个实施例中,该递送是经由AAV进行的。用于针对人类的AAV的体内递送的治疗有效剂量被认为处于含有从约1x1010到约1x1010个功能AAV/ml溶液的从约20到约50ml的盐水溶液的范围内。该剂量可以调整以便使治疗益处相对于任何副作用的平衡。在本文的一个实施例中,AAV剂量大致处于从约1x105到1x1050个基因组AAV、从约1x108到1x1020个基因组AAV、从约1x1010到约1x1016个基因组、或约1x1011到约1x1016个基因组AAV的浓度范围内。人类剂量可以是约1x1013个基因组AAV。这样的浓度能以从约0.001ml到约100ml、约0.05到约50ml、或约10到约25ml的载体溶液进行递送。通过建立剂量反应曲线的常规试验,本领域普通技术人员可以容易地确立其他有效剂量。参见例如,2013年3月26日授权的授予Hajjar等人的美国专利号8,404,658B2,在第27栏第45-60行。
在本文的一个实施例中,该递送是经由质粒进行的。在这样的质粒组合物中,该剂量应当是足以引出反应的质粒的量。例如,对于70kg的个体而言,在质粒组合物中的质粒DNA的适当量可以是从约0.1到约2mg,或从约1μg到约10μg。本发明的质粒一般将包含(i)启动子;(ii)编码核酸靶向CRISPR酶的序列,任选连接到所述启动子上;(iii)选择标记;(iv)复制起点;和(v)(ii)的下游的并且可操作连接到其上的转录终止子。该质粒还可以编码CRISPR复合物的RNA组分,但是这些中的一种或多种相反可以被编码到不同载体上。
本文的剂量是基于平均70kg的个体。给药频率在医学或兽医学从业者(例如医师、兽医师)或本领域熟练的科学家的范围之内。还应注意,在实验中所使用的小鼠典型地是约20g,并且从小鼠实验,一只小鼠可以扩展到70kg个体。
在一些实施例中,本发明的RNA分子在脂质体或阳离子脂质体配制品等中进行递送并且可以通过本领域技术人员熟知的方法进行制备。此类方法描述于例如美国专利号5,593,972、5,589,466和5,580,859中,将其通过引用并入本文。已经开发了专门针对增强和改进递送siRNA到哺乳动物细胞中的递送系统,(参见例如,Shen等人FEBS Let.[欧洲生化学会联合会快报]2003,539:111-114;Xia等人,Nat.Biotech.[自然生物技术]2002,20:1006-1010;Reich等人,Mol.Vision.[分子视觉]2003,9:210-216;Sorensen等人,J.Mol.Biol.[分子生物学杂志]2003,327:761-766;Lewis等人,Nat.Gen.[自然遗传学]2002,32:107-108和Simeoni等人,NAR 2003,31,11:2717-2724)并且也可以应用于本发明。最近,siRNA已经成功用于抑制灵长动物中的基因表达(参见例如Tolentino等人,Retina[视网膜]24(4):660,它也可应用于本发明。
实际上,RNA递送是有用的体内递送方法。有可能使用脂质体或粒子将核酸靶向Cas蛋白Cas9和指导RNA gRNA(以及例如,HR修复模板)递送到细胞中。因此,核酸靶向Cas蛋白/CRISPR酶如CasCas9的递送和/或本发明的指导RNA的递送可以处于RNA的形式并且经由微泡、脂质体或粒子来进行。例如,Cas mRNA和指导RNA可以被包装到脂质体粒子中用于体内递送。脂质体转染试剂例如来自生命技术公司(Life Technologies)的lipofectamine以及市售的其他试剂可以有效地将RNA分子递送到肝脏中。
还优选的RNA递送手段包括经由纳米粒子(Cho,S.,Goldberg,M.,Son,S.,Xu,Q.,Yang,F.,Mei,Y.,Bogatyrev,S.,Langer,R.和Anderson,D.,Lipid-like nanoparticlesfor small interfering RNA delivery to endothelial cells[用于将小干扰RNA递送到内皮细胞的脂质样纳米粒子],Advanced Functional Materials[高级功能材料],19:3112-3118,2010)或外泌体(Schroeder,A.,Levins,C.,Cortez,C.,Langer,R.和Anderson,D.,Lipid-based nanotherapeutics for siRNA delivery[用于siRNA递送的基于脂质的纳米治疗剂],Journal of Internal Medicine[内科学杂志],267:9-21,2010,PMID:20059641)递送RNA。事实上,已经表明外泌体在递送siRNA中特别有用,其为与RNA靶向系统有一些相似之处的系统。例如,El-Andaloussi S等人(“Exosome-mediated delivery ofsiRNA in vitro and in vivo[外泌体介导的体外和体内siRNA递送].”Nat Protoc.[自然-实验手册]2012年12月;7(12):2112-26.doi:10.1038/nprot.2012.131.电子版2012年11月15日)描述了外泌体对于跨不同的生物屏障的药物递送是有希望的工具并且可以用于体外和体内递送siRNA。其途径在于通过转染包含与肽配体融合的外泌体蛋白的表达载体产生靶向外泌体。然后将这些外泌体纯化并且从转染的细胞上清液中表征,然后将RNA加载到外泌体中。根据本发明的递送或给药可以用外泌体进行,尤其是但不限于脑。维生素E(α-生育酚)可以与核酸靶向Cas蛋白结合并且连同高密度脂蛋白(HDL)一起递送到脑,例如以与Uno等人(HUMAN GENE THERAPY[人类基因治疗]22:711–719(2011年6月))完成的用于将短干扰RNA(siRNA)递送到脑的类似方式。经由用磷酸盐缓冲盐水(PBS)或游离TocsiBACE或Toc-siBACE/HDL充满的并且与脑灌注试剂盒3(Brain Infusion Kit 3)(Alzet公司)连接的微渗透压泵(型号1007D;Alzet公司,库比蒂诺(Cupertino),加利福尼亚州)灌注小鼠。将一根脑灌注导管置于在正中线的前囱的后方约0.5mm,用于灌注到背侧第三脑室中。Uno等人发现,通过相同的ICV灌注方法,少至3nmol的Toc-siRNA与HDL可诱导相当程度的靶减少。可以考虑结合至α-生育酚的并且与HDL共同给药靶向脑的相似剂量的核酸靶向效应蛋白用于本发明,例如,可以考虑靶向脑的约3nmol到约3μmol的核酸靶向效应蛋白。Zou等人(HUMAN GENE THERAPY[人类基因治疗]22:465-475(2011年4月))描述了靶向PKCγ的短发夹RNA的慢病毒介导的递送方法,其用于在大鼠脊髓中的体内基因沉默。Zou等人通过鞘内导管给药约10μl的具有1x109个转导单位(TU)/ml的滴度的重组慢病毒。在本发明中可以考虑相似剂量的在靶向脑的慢病毒载体中表达的核酸靶向效应蛋白用于人类,例如,可以考虑靶向脑的在具有1x109个转导单位(TU)/ml的滴度的慢病毒中的约10-50ml的核酸靶向效应蛋白。
就局部递送到脑而言,这可以通过不同方式来实现。例如,材料可以例如通过注射递送到纹状体内。注射可以经由穿颅术立体定向地进行。
通用包装和启动子
介导体内基因组修饰的将编码核酸靶向效应物的核酸分子(例如,DNA)包装到载体(例如,病毒载体)中的方式包括:
为了实现NHEJ介导的基因敲除:
单病毒载体:
含有两个或更多个表达盒的载体:
启动子-核酸靶向效应蛋白编码核酸分子-终止子
启动子-指导RNA1-终止子
启动子-gRNA(N)-终止子(一直到载体的尺寸限制)
双病毒载体:
含有一个用于驱动核酸靶向效应蛋白的表达盒的载体1,
启动子-核酸靶向效应蛋白编码核酸分子-终止子
含有一个或多个用于驱动一个或多个指导RNA表达的表达盒的载体2
启动子-指导RNA1-终止子
启动子-指导RNA1(N)-终止子(一直到载体的尺寸限制)
为了介导同源定向修复。
除了上述单和双病毒载体途径之外,另外的载体可以用来递送同源定向修复模板。
用来驱动核酸靶向效应蛋白编码核酸分子表达的启动子可以包括:
AAV ITR可以用作启动子:这对于消除另外的启动子元件(可在载体中占用空间)的需要是有利的。空出来的另外的空间可以用来驱动另外的元件的表达(gRNA等)。同样,ITR活性是较弱的,因此可以用来降低由于核酸靶向效应蛋白的过表达所致的潜在毒性。
对于遍存表达,可以使用启动子:CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链等。
对于脑表达或其他CNS表达,可以使用启动子:用于所有神经元的突触蛋白I、用于兴奋性神经元的CaMKIIα、用于GABA能神经元的GAD67或GAD65或VGAT等。
对于肝脏表达,可以使用白蛋白启动子。
对于肺表达,可以使用SP-B。
对于内皮细胞,可以使用ICAM。
对于造血细胞,可以使用IFNβ或CD45。
对于成骨细胞,可以使用OG-2。
用来驱动指导RNA的启动子可以包括:
Pol III启动子,如U6或H1
使用Pol II启动子和内含子盒来表达指导RNA。
腺相关病毒(AAV)
核酸靶向效应蛋白以及一种或多种指导RNA可以使用腺相关病毒(AAV)、慢病毒、腺病毒或其他质粒或病毒载体类型进行递送,尤其是,使用来自以下文献的配方和剂量:例如,美国专利号8,454,972(针对腺病毒的配方、剂量)、8,404,658(针对AAV的配方、剂量)和5,846,946(针对DNA质粒的配方、剂量)以及来自临床试验和关于涉及慢病毒、AAV和腺病毒的临床试验的出版物。例如,对于AAV,给药途径、配方和剂量可以如美国专利号8,454,972并且如涉及AAV的临床试验。对于腺病毒,给药途径、配方和剂量可以如美国专利号8,404,658并且如涉及腺病毒的临床试验。对于质粒递送,给药途径、配方和剂量可以如美国专利号5,846,946并且如涉及质粒的临床试验。剂量可以基于或推断为平均70kg的个体(例如,男性成人),并且可以针对患者、受试者、不同重量和物种的哺乳动物进行调整。给药频率在医学或兽医学从业者(例如,医师、兽医师)的范围之内,其取决于常规因素,包括患者或受试者的年龄、性别、一般健康状况、其他状况以及着手解决的特殊状况或症状。可以将病毒载体注射到感兴趣的组织中。对于细胞类型特异性基因组/转录组修饰,核酸靶向效应蛋白的表达可以由细胞类型特异性启动子驱动。例如,肝脏特异性表达可以使用白蛋白启动子,而神经元特异性表达(例如,用于靶向CNS障碍)可以使用突触蛋白I启动子。
就体内递送而言,AAV相比于其他病毒载体是有利的,这是由于几个原因:
·低毒性(这可以是由于纯化方法不需要细胞粒子的超速离心所致,而超速离心可能活化免疫反应),并且
·引起插入诱变的低概率,原因在于它未整合到宿主基因组中。
AAV具有4.5或4.75Kb的包装限制。这意味着核酸靶向效应蛋白(如V型蛋白如C2c2)以及启动子和转录终止子必须全部适合相同的病毒载体。因此,本发明的实施例包括利用较短的核酸靶向效应蛋白的同源物。
关于AAV,AAV可以是AAV1、AAV2、AAV5或其任何组合。可以选择相对于有待被靶向的细胞的AAV的AAV;例如,可以选择用于靶向脑或神经元细胞的AAV血清型1、2、5或杂合衣壳AAV1、AAV2、AAV5或其任何组合;并且可以选择用于靶向心脏组织的AAV4。AAV8可用于递送到肝脏。本文的启动子和载体是单独优选的。关于这些细胞的某些AAV血清型的表格(参见Grimm,D.等人,J.Virol.[病毒学杂志]82:5887-5911(2008))如下:
细胞系 AAV-1 AAV-2 AAV-3 AAV-4 AAV-5 AAV-6 AAV-8 AAV-9
Huh-7 13 100 2.5 0.0 0.1 10 0.7 0.0
HEK293 25 100 2.5 0.1 0.1 5 0.7 0.1
HeLa 3 100 2.0 0.1 6.7 1 0.2 0.1
HepG2 3 100 16.7 0.3 1.7 5 0.3 ND
Hep1A 20 100 0.2 1.0 0.1 1 0.2 0.0
911 17 100 11 0.2 0.1 17 0.1 ND
CHO 100 100 14 1.4 333 50 10 1.0
COS 33 100 33 3.3 5.0 14 2.0 0.5
MeWo 10 100 20 0.3 6.7 10 1.0 0.2
NIH3T3 10 100 2.9 2.9 0.3 10 0.3 ND
A549 14 100 20 ND 0.5 10 0.5 0.1
HT1180 20 100 10 0.1 0.3 33 0.5 0.1
单核细胞 1111 100 ND ND 125 1429 ND ND
未成熟DC 2500 100 ND ND 222 2857 ND ND
成熟DC 2222 100 ND ND 333 3333 ND ND
慢病毒
慢病毒是复杂的反转录病毒,其具有在有丝分裂细胞和有丝分裂后细胞两者中感染并表达其基因的能力。最为人熟知的慢病毒是人类免疫缺陷病毒(HIV),其利其他病毒的包膜糖蛋白来靶向广泛范围的细胞类型。
慢病毒可以制备如下。在克隆pCasES10(含有慢病毒转移质粒骨架)之后,将处于低传代数(p=5)的HEK293FT接种在T-75烧瓶中,直到在转染之前的一天在具有10%胎牛血清而没有抗生素的DMEM中50%汇合。在20小时之后,培养基更换为OptiMEM(无血清)培养基,并且在4小时后进行转染。细胞用10μg的慢病毒转移质粒(pCasES10)和下列包装质粒转染:5μg的pMD2.G(VSV-g假型)、和7.5μg的psPAX2(gag/pol/rev/tat)。在具有阳离子脂质递送剂(50μL的Lipofectamine 2000和100μl的Plus试剂)的4mL OptiMEM中进行转染。在6小时之后,培养基更换为具有10%胎牛血清的无抗生素的DMEM。这些方法在细胞培养过程中使用血清,但是不含血清的方法是优选的。
慢病毒可以如下纯化。在48小时后收获病毒上清液。首先清除上清液的碎片并通过0.45μm的低蛋白结合(PVDF)滤膜进行过滤。然后将它们在超速离心机中以24,000rpm旋转2小时。将病毒沉淀重悬于50μl的DMEM中在4℃过夜。然后将它们等分,并且立即在-80℃冷冻。
在另一个实施例中,还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体,尤其是对于眼基因治疗而言(参见例如,Balagaan,J Gene Med[基因医学杂志]2006;8:275–285)。在另一个实施例中,还考虑了一种经由视网膜下注射用于治疗湿型的年龄相关性黄斑变性的、表达血管生成抑制蛋白(内皮抑素和血管抑素)的基于马传染性贫血病毒的慢病毒基因治疗载体(参见例如,Binley等人,HUMAN GENE THERAPY[人类基因治疗]23:980–991(2012年9月)),并且这种载体可以经修饰用于本发明的核酸靶向系统。
在另一个实施例中,自我失活性慢病毒载体可以用于和/或适合于本发明的核酸靶向系统,该自我失活性慢病毒载体具有靶向由HIV tat/rev共享的共有外显子的siRNA、核仁定位TAR诱饵、和抗CCR5特异性锤头状核酶(参见例如,DiGiusto等人(2010)SciTransl Med[科学转化医学]2:36ra43)。可以收集最少2.5×106个CD34+细胞/每千克患者体重,并且以2×106个细胞/ml的密度在X-VIVO 15培养基中(龙沙公司(Lonza))预刺激16到20个小时,该培养基含有2μmol/L-谷氨酰胺、干细胞因子(100ng/ml)、Flt-3配体(Flt-3L)(100ng/ml)和促血小板生成素(10ng/ml)(CellGenix公司)。可以用慢病毒以感染复数5在75-cm2的包被有纤连蛋白(25mg/cm2)(RetroNectin,宝生物工程株式会社(Takara BioInc.))的组织培养瓶中转导预刺激的细胞16到24小时。
慢病毒载体还披露于帕金森病的治疗中,参见例如,美国专利公开号20120295960以及美国专利号7303910和7351585。慢病毒载体还已经披露于眼病的治疗中,参见例如,美国专利公开号20060281180、20090007284、US 20110117189;US 20090017543;US20070054961、US 20100317109。慢病毒载体还已经披露于递送到脑中,参见例如,美国专利公开号US 20110293571;US 20110293571、US 20040013648、US 20070025970、US20090111106以及美国专利号US 7259015。
RNA递送
RNA递送:核酸靶向Cas蛋白(例如V型蛋白,如C2c2)和/或指导RNA也能以RNA的形式递送。使用体外转录可以产生核酸靶向Cas蛋白(如VI型蛋白,如C2c2)mRNA。例如,可以使用含有以下元件的PCR盒合成核酸靶向效应蛋白(如V型蛋白如C2c2)mRNA:T7_启动子-科扎克(kozak)序列(GCCACC)-效应蛋白-来自β珠蛋白的3’UTR-聚A尾(一串120个或更多的腺嘌呤)。该盒可以用于经由T7聚合酶的转录。也可以使用体外转录从含有T7_启动子-GG-指导RNA序列的盒来转录指导RNA。
为了增强表达并且降低可能的毒性,可以例如使用假-U或5-甲基-C修饰该核酸靶向效应蛋白-编码序列和/或指导RNA,以包括一个或多个经修饰的核苷。
mRNA递送方法用于当前的肝脏递送是特别有希望的。
关于RNA递送的很多临床工作已经集中于RNAi或反义上,但是这些系统可以适用于递送RNA用于实现本发明。应当相应地阅读以下关于RNAi等的参考文献。
粒子递送系统和/或配制品:
已知一些类型的粒子递送系统和/或配制品在不同种类的生物医学应用中是有用的。总体上,粒子被定义为小物体,该物体在其运输和特性方面以整体单元表现。根据直径将粒子进一步分类。粗粒子涵盖在2,500与10,000纳米之间的范围。细粒子的尺寸在100与2,500纳米之间。超细粒子、或纳米粒子的大小通常是在1和100纳米之间。100-nm极限的基础是以下事实:使粒子区分于大块材料的新颖特性典型地是在100nm之下的临界长度规模下显现的。
如本文使用的,粒子递送系统/配制品被定义为任何包括根据本发明的粒子的生物学递送系统/配制品。根据本发明的粒子是任何具有小于100微米(μm)的最大尺寸(例如直径)的实体。在一些实施例中,本发明的粒子具有小于10μm的最大尺寸。在一些实施例中,本发明的粒子具有小于2000纳米(nm)的最大尺寸。在一些实施例中,本发明的粒子具有小于1000纳米(nm)的最大尺寸。在一些实施例中,本发明的粒子具有小于900nm、800nm、700nm、600nm、500nm、400nm、300nm、200nm或100nm的最大尺寸。典型地,本发明的粒子具有500nm或更小的最大尺寸(例如,直径)。在一些实施例中,本发明的粒子具有250nm或更小的最大尺寸(例如,直径)。在一些实施例中,本发明的粒子具有200nm或更小的最大尺寸(例如,直径)。在一些实施例中,本发明的粒子具有150nm或更小的最大尺寸(例如,直径)。在一些实施例中,本发明的粒子具有100nm或更小的最大尺寸(例如,直径)。在本发明的一些实施例中使用更小的粒子(例如,具有50nm或更小的最大尺寸)。在一些实施例中,本发明的粒子具有范围在25nm与200nm之间的最大尺寸。
粒子表征(包括,例如表征形态、尺寸、等)是使用各种不同的技术进行的。通用技术是电子显微术(TEM、SEM)、原子力显微镜(AFM)、动态光散射(DLS)、X-射线光电子光谱法(XPS)、粉末X射线衍射(XRD)、傅里叶变换红外光谱法(FTIR)、基质辅助激光解吸/电离飞行时间质谱法(MALDI-TOF)、紫外-可见光谱法、双偏振干涉法以及核磁共振(NMR)。表征(尺寸测量)可以针对天然粒子(即预加载)或在加载负荷物(在此负荷物指代例如CRISPR-Cas系统的一种或多种组分,例如CRISPR酶或mRNA或指导RNA、或其任何组合,并且可以包括另外的载体和/或赋形剂)后进行,以提供具有最适大小的粒子以用于任何本发明的体外、离体和/或体内施用的递送。在某些优选实施例中,粒子尺寸(例如,直径)表征是基于使用动态激光散射(DLS)的测量。可提及的是美国专利号8,709,843;美国专利号6,007,845;美国专利号5,855,913;美国专利号5,985,309;美国专利号5,543,158;以及James E.Dahlman和Carmen Barnes等人Nature Nanotechnology[自然纳米技术](2014)的公开物,在线公开于2014年5月11日,doi:10.1038/nnano.2014.84,以上文献涉及粒子、制造和使用它们的方法及其测量。
在本发明的范围内的粒子递送系统可以按任何形式提供,包括但不限于固体、半固体、乳液或胶体粒子。这样可以将本文描述的任何递送系统(包括但不限于例如基于脂质的系统、脂质体、胶束、微泡、外泌体或基因枪)提供为在本发明的范围内的粒子递送系统。
粒子
可以使用粒子或脂质包膜同时递送CRISPR酶mRNA和指导RNA;例如,可以经由粒子递送本发明的CRISPR酶和RNA(例如,作为复合物),如在Dahlman等人,WO 2015089419 A2和其中引用的文献中的,如7C1(参见例如,James E.Dahlman和Carmen Barnes等人NatureNanotechnology[自然纳米技术](2014),在线公开于2014年5月11日,doi:10.1038/nnano.2014.84),例如,包含脂质或类脂质和亲水聚合物(例如阳离子脂质和亲水聚合物)的递送粒子,例如其中该阳离子脂质包括1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)或1,2-二十四酰基-sn-甘油-3-磷酸胆碱(DMPC)和/或其中该亲水聚合物包括乙二醇或聚乙二醇(PEG);和/或其中该粒子进一步包含胆固醇(例如,来自配制品1的粒子=DOTAP 100,DMPC0,PEG 0,胆固醇0;配制品编号2=DOTAP 90,DMPC 0,PEG10,胆固醇0;配制品编号3=DOTAP90,DMPC 0,PEG 5,胆固醇5),其中使用有效的多步方法形成粒子,其中第一步,将效应蛋白和RNA例如在无菌、不含核酸酶的1X PBS中例如在室温下以例如1:1的摩尔比在一起混合例如30分钟;并且分开地,将如适用于该配制品的DOTAP、DMPC、PEG和胆固醇溶解于醇(例如,100%乙醇)中;并且,将这两种溶液混合在一起以形成含有这些复合物的粒子)。
核酸靶向效应蛋白(如VI型蛋白,如C2c2)mRNA和指导RNA可以使用粒子或脂质包膜同时递送。
例如,Su X,Fricke J,Kavanagh DG,Irvine DJ(“In vitro and in vivo mRNAdelivery using lipid-enveloped pH-responsive polymer nanoparticles[使用脂质包封的pH响应性聚合物纳米粒子的体外和体内mRNA递送]”Mol Pharm.[分子药理学]2011年6月6日;8(3):774-87.doi:10.1021/mp100390w.电子版2011年4月1日)描述了生物可降解的核-壳结构粒子,其具有由磷脂双层壳包封的聚(β-氨基酯)(PBAE)核。这些被开发为用于体内mRNA递送。该pH响应性PBAE被选择为促进内体破裂,而该脂质表面层被选择为将聚阳离子核的毒性最小化。因此,这些对于递送本发明的RNA是优选的。
在一个实施例中,考虑了基于自组装生物粘附聚合物的粒子,其可应用于肽的经口递送、肽的静脉内递送以及肽的鼻递送,均递送到脑。其他实施例,还考虑了例如疏水性药物的经口吸收和眼部递送。分子包膜技术涉及被保护并递送到疾病部位的工程化聚合物包膜(参见例如,Mazza,M.等人ACSNano[ACS纳米],2013.7(2):1016-1026;Siew,A.等人MolPharm[分子药理学],2012.9(1):14-28;Lalatsa,A.等人J Contr Rel[控释杂志],2012.161(2):523-36;Lalatsa,A.等人,Mol Pharm[分子药理学],2012.9(6):1665-80;Lalatsa,A.等人Mol Pharm[分子药理学],2012.9(6):1764-74;Garrett,N.L.等人JBiophotonics[生物光子学杂志],2012.5(5-6):458-68;Garrett,N.L.等人J Raman Spect[拉曼光谱杂志],2012.43(5):681-688;Ahmad,S.等人J Royal Soc Interface[皇家学会界面杂志]2010.7:S423-33;Uchegbu,I.F.Expert Opin Drug Deliv[药物递送专家评论],2006.3(5):629-40;Qu,X.等人Biomacromolecules[生物大分子],2006.7(12):3452-9和Uchegbu,I.F.等人Int J Pharm[国际药学杂志],2001.224:185-199)。考虑了约5mg/kg的剂量,呈单剂量或多剂量形式,这取决于靶组织。
在一个实施例中,可以使用由丹·安德森实验室(Dan Anderson’s lab)在MIT开发的可将RNA递送到癌细胞以便使肿瘤生长停止的粒子/并且或使其适用于本发明的核酸靶向系统。具体地说,安德森实验室开发了用于新生物材料和纳米制剂的合成、纯化、表征、和配制的全自动化组合系统。参见例如,Alabi等人,Proc Natl Acad Sci U S A.[美国国家科学院院刊]2013年8月6日;110(32):12881-6;Zhang等人,Adv Mater.[高等材料]2013年9月6日;25(33):4641-5;Jiang等人,Nano Lett.[纳米通讯]2013年3月13日;13(3):1059-64;Karagiannis等人,ACS Nano.[ACS纳米]2012年10月23日;6(10):8484-7;Whitehead等人,ACS Nano.[ACS纳米]2012年8月28日;6(8):6922-9和Lee等人,NatNanotechnol.[自然纳米技术]2012年6月3日;7(6):389-93。
美国专利申请20110293703涉及类脂质化合物,这些化合物在多核苷酸的给药中也是特别有用的,其可适用于递送本发明的核酸靶向系统。在一个方面,氨基醇类脂质化合物与有待递送到细胞或受试者的药剂结合而形成微粒子、纳米粒子、脂质体、或胶束。有待通过粒子、脂质体、或胶束递送的药剂可以处于气体、液体、或固体的形式,并且该药剂可以是一种多核苷酸、蛋白质、肽、或小分子。这些氨基醇类脂质化合物可以与其他氨基醇类脂质化合物、聚合物(合成的或天然的)、表面活性剂、胆固醇、碳水化合物、蛋白质、脂质等形成粒子。然后这些粒子可以任选地与药用赋形剂结合而形成药物组合物。
美国专利公开号20110293703也提供了制备氨基醇类脂质化合物的方法。使胺的一种或多种等效物与环氧化物封端化合物的一种或多种等效物在适当条件下反应而形成本发明的氨基醇类脂质化合物。在某些实施例中,胺的所有氨基基团与环氧化物封端化合物充分反应而形成叔胺。在其他实施例中,胺的所有氨基基团未与环氧化物封端化合物完全反应形成叔胺,由此生成在氨基醇类脂质化合物中的伯胺或仲胺。这些伯胺或仲胺照原样留下或者可以与另一种亲电体如不同的环氧化物封端化合物反应。正如本领域的普通技术人员应当理解的,胺与未过量的环氧化物封端化合物反应将产生多种不同的具有不同数目的尾部的氨基醇类脂质化合物。某些胺类可以用两个环氧化物衍生的化合物尾部将其完全功能化,而其他分子用环氧化物衍生的化合物尾部将不会被完全功能化。例如,二胺或多胺可包括离开该分子的不同氨基部分的一个、二个、三个、或四个环氧化物衍生的化合物尾部,从而产生伯胺、仲胺、和叔胺。在某些实施例中,并不是所有氨基基团都被完全功能化。在某些实施例中,使用相同类型的环氧化物封端化合物中的两种。在其他实施例中,使用两个或更多个不同的环氧化物封端化合物。氨基醇类脂质化合物的合成是用或不用溶剂进行的,并且该合成可以在范围从30℃-100℃,优选在大致50℃-90℃的较高温度下进行。任选地,可以将制备的氨基醇类脂质化合物纯化。例如,可以纯化氨基醇类脂质化合物的混合物而产生具有特定数目的、环氧化物衍生的化合物尾部的氨基醇类脂质化合物。或者,该混合物可以被纯化而产生特定的立体异构体或区域异构体。也可以使用烷基卤化物(例如,碘甲烷)或其他烷化剂将这些氨基醇类脂质化合物烷化,和/或它们可以被酰化。
美国专利公开号20110293703还提供了通过发明方法制备的氨基醇类脂质化合物的文库。使用涉及液体处理器、机器人、微量滴定板、计算机等的高通量技术,可以制备和/或筛选这些氨基醇类脂质化合物。在某些实施例中,筛选了这些氨基醇类脂质化合物的将多核苷酸或其他药剂(例如,蛋白质、肽、小分子)转染到细胞中的能力。
美国专利公开号20130302401涉及已经使用组合聚合制备的一类聚(β-氨基醇)(PBAA)。这些发明的PBAA可以在生物技术和生物医学应用中用作涂层(如用于医疗装置或植入物的薄膜或多层薄膜的涂层)、添加剂、材料、赋形剂、生物防污剂(non-biofoulingagent)、微图像化剂(micropatterning agent)以及细胞封装剂(cellular encapsulationagent)。当用作表面涂层时,这些PBAA在体外和体内均引出不同水平的炎症,这取决于它们的化学结构。这类材料的巨大化学多样性允许我们鉴定出体外抑制巨噬细胞活化的聚合物涂层。此外,在羧化聚苯乙烯微粒的皮下移植之后,这些涂层减少了炎症细胞的募集,并且减轻了纤维化。这些聚合物可以用来形成用于细胞封装的聚电解质复合物胶囊。本发明还可具有许多其他的生物应用,如抗微生物涂层、DNA或siRNA递送以及干细胞组织工程。美国专利公开号20130302401的传授内容可以适用于本发明的核酸靶向系统。
在另一个实施例中,考虑了脂质纳米粒子(LNP)。抗转甲状腺素蛋白小干扰RNA已经被封装在脂质纳米粒子中并且被递送到人体内(参见例如,Coelho等人,N Engl J Med[新英格兰医学杂志]2013;369:819-29),并且这样一种系统可以适用于并且应用于本发明的核酸靶向系统。考虑到静脉内给药约0.01到约1mg/kg体重的剂量。考虑了降低输注相关反应的风险的用药,如考虑到地塞米松、对乙酰氨基酚(acetampinophen)、苯海拉明或西替利嗪、以及雷尼替丁。考虑了约0.3mg/千克的多剂量,每4周一次,五个剂量。
LNP已经显示在将siRNA递送到肝脏中是高度有效的(参见例如,Tabernero等人,Cancer Discovery[癌症发现],2013年4月,第3卷,第4期,第363-470页),并且因此被考虑用于递送编码核酸RNA靶向效应蛋白到肝脏。考虑了6mg/kg的LNP的约四个剂量的用量,每两周一次。Tabernero等人证明,在以0.7mg/kg给药LNP的前2个周期之后,观察到肿瘤消退,并且在6个周期结束之后,患者已经实现了部分应答,具有淋巴结转移完全消退以及肝脏肿瘤的显著萎缩。在此患者中给药40个剂量之后获得完全应答,在接受经过26个月的剂量之后其保持缓解和完全治疗。具有RCC和在用VEGF途径抑制剂进行的在先治疗之后进展的包括肾脏、肺、以及淋巴结在内的肝外部位疾病的两位患者在所有部位的疾病都保持稳定大约8到12个月,并且一位具有PNET和肝转移的患者继续在18个月(36个剂量)的延伸研究中保持疾病稳定。
然而,必须将LNP的电荷考虑在内。当阳离子脂质与带负电的脂质结合时,诱导促进细胞内递送的非双层结构。由于带电荷的LNP在静脉注射之后迅速从循环中清除,开发了具有低于7的pKa值的可电离阳离子脂质(参见例如,Rosin等人,Molecular Therapy[分子治疗],第19卷,第12期,第1286-2200页,2011年12月)。带负电荷的聚合物如RNA可以低pH值(例如,pH 4)加载到LNP中,在此pH时可电离脂质展示出正电荷。然而,在生理学pH值时,LNP展现出与更长的循环时间相容的低表面电荷。已经关注了四种可电离阳离子脂质,即1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基-酮基-N,N-二甲基-3-氨基丙烷(DLinKDMA)以及1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)。已经表明,含有这些脂质的LNP siRNA系统在体内肝细胞中展现出显著不同的基因沉默特性,具有根据采用因子VII基因沉默模型的DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP系列而变化的潜能(参见例如,Rosin等人,Molecular Therapy[分子治疗],第19卷,第12期,第1286-2200页,2011年12月)。可以考虑LNP或者在LNP中的或与LNP缔合的CRISPR-Cas RNA的1μg/ml的剂量,尤其是对于含有DLinKC2-DMA的配制品而言。
LNP的制备和CRISPR Cas封装可以使用/和或改编自Rosin等人,MolecularTherapy[分子治疗],第19卷,第12期,第1286-2200页,2011年12月)。阳离子脂质1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基酮基-N,N-二甲基-3-氨基丙烷(DLinK-DMA)、1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)、(3-o-[2″-(甲氧基聚乙二醇2000)琥珀酰]-1,2-二肉豆蔻酰基-sn-二醇(PEG-S-DMG)以及R-3-[(ω-甲氧基-聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻酰氧基丙基-3-胺(PEG-C-DOMG)可以由特克米拉制药公司(Tekmira Pharmaceuticals)(温哥华,加拿大)提供或者合成。胆固醇可以购自西格玛公司(Sigma)(圣路易斯,密苏里州)。特异性靶向核酸的复合物(CRISPR-Cas)RNA可以封装在含有DLinDAP、DLinDMA、DLinK-DMA和DLinKC2-DMA的LNP中(阳离子脂质:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG的摩尔比为40:10:40:10)。在需要时,可以掺入0.2%SP-DiOC18(英杰公司(Invitrogen),伯灵顿,加拿大)来评估细胞摄取、细胞内递送和生物分布。通过将由阳离子脂质:DSPC:胆固醇:PEG-c-DOMG(40:10:40:10摩尔比)组成的混合物溶解在乙醇中直到最终脂质浓度为10mmol/l来进行封装。可以将脂质的这种乙醇溶液逐滴加入到pH 4.0的50mmol/l柠檬酸盐中而形成多层囊泡,从而产生30%(vol/vol)乙醇的最终浓度。在使用挤出机(北方脂质公司(Northern Lipids),温哥华,加拿大)通过两个重叠的80nm Nuclepore聚碳酸酯滤膜挤出多层囊泡之后,可以形成大的单层囊泡。可以通过如下方式实现封装:将溶解在含有30%乙醇(vol/vol)的pH4.0的50mmol/l柠檬酸盐中的2mg/ml的RNA逐滴加入到挤出的形成的大单层囊泡中,并且在31℃孵育30分钟,伴随持续混合直到最终的RNA/脂质重量比为0.06/1(wt/wt)。通过使用Spectra/Por 2再生纤维素透析膜在pH为7.4的磷酸盐缓冲盐水(PBS)中透析16小时进行乙醇的去除以及配制缓冲液的中和。使用NICOMP 370型粒度分析仪、囊泡/强度模式以及高斯拟合,通过动态光散射,可以测定粒度分布(Nicomp粒径分析仪公司(Nicomp Particle Sizing),圣巴巴拉市,加利福尼亚州)。对于所有三个LNP系统的粒径可以是约70nm的直径。可以通过使用VivaPureD MiniH柱(赛多利斯斯泰迪生物技术公司(Sartorius Stedim Biotech))从分析前后收集的样品中去除游离RNA来确定RNA封装效率。从洗脱的粒子提取封装的RNA并且将其在260nm定量。通过使用来自美国瓦克化学公司(Wako Chemicals USA)(里士满(Richmond),弗吉尼亚州)的胆固醇E酶法测定法测量囊泡中的胆固醇含量,确定了RNA与脂质的比率。与本文关于LNP和PEG脂质的讨论结合,聚乙二醇化的脂质体或LNP同样适于递送核酸靶向系统或其组分。
大LNP的制备可以使用/和或改编自Rosin等人,Molecular Therapy[分子治疗],第19卷,第12期,第1286-2200页,2011年12月。可以在含有50:10:38.5的摩尔比的DLinKC2-DMA、DSPC和胆固醇的乙醇中制备脂质预混物溶液(20.4mg/ml总脂质浓度)。可以按照0.75:1的摩尔比(乙酸钠:DLinKC2-DMA)将乙酸钠添加到脂质预混物中。随后可以通过将该混合物与1.85倍体积的柠檬酸盐缓冲液(10mmol/l,pH 3.0)在剧烈搅拌下合并而使脂质水合,从而导致在含有35%的在水性缓冲液中的自发脂质体形成。可以在37℃孵育该脂质体溶液以允许粒径的时间依赖性增加。可以通过动态光散射(纳米粒径电位分析仪(ZetasizerNano ZS),马尔文仪器公司(Malvern Instruments),乌斯特郡(Worcestershire),英国)在孵育的不同时间去除等分试样以研究脂质体尺寸的变化。一旦实现所希望的粒径,可以将水性PEG脂质溶液(储备溶液=在35%(vol/vol)乙醇中的10mg/ml PEG-DMG)添加到该脂质体混合物中,以便产生3.5%总脂质的最终PEG摩尔浓度。在添加PEG-脂质之后,这些脂质体应该其尺寸,有效抑制进一步生长。然后以大约1:10(wt:wt)的RNA与总脂质比率将RNA添加到空脂质体,然后在37℃孵育30分钟以形成加载的LNP。随后将该混合物在PBS中透析过夜,并且用0.45-μm的注射器过滤器。
球形核酸(SNATM)构建体和其他粒子(尤其是金粒子)也被考虑为将核酸靶向系统递送到预期靶标的手段。重要数据表明,基于核酸功能化的金粒子的AuraSense治疗性球形核酸(SNATM)构建体是有用的。
可以与本文的传授结合使用的文献包括:Cutler等人,J.Am.Chem.Soc.[美国化学会志]2011 133:9254-9257,Hao等人,Small.2011 7:3158-3162,Zhang等人,ACS Nano.[ACS纳米]20115:6962-6970,Cutler等人,J.Am.Chem.Soc.[美国化学会志]2012134:1376-1391,Young等人,Nano Lett.[纳米通讯]2012 12:3867-71,Zheng等人,Proc.Natl.Acad.Sci.USA.[美国国家科学院院刊]2012109:11975-80,Mirkin,Nanomedicine[纳米医学]2012 7:635-638,Zhang等人,J.Am.Chem.Soc.[美国化学会志]2012 134:16488-1691,Weintraub,Nature[自然]2013 495:S14-S16,Choi等人,Proc.Natl.Acad.Sci.USA.[美国国家科学院院刊]2013 110(19):7625-7630,Jensen等人,Sci.Transl.Med.[科学转化医学]5,209ra152(2013)和Mirkin,等人,Small,10:186-192。
具有RNA的自组装粒子可以用被聚乙二醇化的聚乙烯亚胺(PEI)进行构建,其中Arg-Gly-Asp(RGD)肽配体附接在聚乙二醇(PEG)的远端。例如,这一系统已经被用作靶向表达整合素的肿瘤新血管系统和递送抑制血管内皮生长因子受体2(VEGF R2)表达以及由此实现抑制肿瘤血管发生的siRNA的手段(参见例如,Schiffelers等人,Nucleic AcidsResearch[核酸研究],2004,第32卷,第19期)。通过将等体积的阳离子聚合物水溶液和核酸水溶液混合从而产生在2到6范围上的可电离氮(聚合物)相比磷酸盐(核酸)的净摩尔过量,从而制备纳米束。在阳离子聚合物与核酸之间的静电相互作用导致聚复合物的形成,其具有约100nm的平均粒径分布,此后称为纳米束。设想了核算靶向复合物RNA的约100到200mg的剂量,用于Schiffelers等人的自组装粒子中的递送。
Bartlett等人(PNAS[美国国家科学院院刊],2007年9月25日,第104卷,第39期)的纳米束也可以应用于本发明。通过将等体积的阳离子聚合物水溶液和核酸水溶液混合从而产生在2到6范围上的可电离氮(聚合物)相比磷酸盐(核酸)的净摩尔过量,从而制备Bartlett等人的纳米束。在阳离子聚合物与核酸之间的静电相互作用导致聚复合物的形成,其具有约100nm的平均粒径分布,此后称为纳米束。Bartlett等人的DOTA-siRNA合成如下:1,4,7,10-四氮杂环十二烷-1,4,7,10-四乙酸单(N-羟基琥珀酰亚胺酯)(DOTA-NHS酯)订购自Macrocyclics公司(达拉斯(Dallas),德克萨斯州)。将碳酸盐缓冲液(pH 9)中的具有100倍摩尔过量的DOTA-NHS-酯的胺修饰的RNA有义链加入到微量离心管中。通过在室温搅拌4小时使这些内容物反应。将该DOTA-RNA有义缀合物用乙醇沉淀,重悬于水中,并且退火到未修饰的反义链上而产生DOTA-siRNA。所有液体用Chelex-100(伯乐公司(Bio-Rad),赫库斯(Hercules),加利福尼亚州)预处理,以便去除微量金属污染物。通过使用含有环糊精的聚阳离子可以形成Tf靶向和非靶向的siRNA粒子。典型地,粒子以3(+/-)的进料比和0.5g/升的siRNA浓度在水中形成。用Tf(金刚烷-PEG-Tf)修饰在靶向粒子表面上的百分之一的金刚烷-PEG分子。将粒子悬浮在用于注射的5%(wt/vol)的葡萄糖载体溶液中。
Davis等人(Nature[自然],第464卷,2010年4月15日)使用靶向的粒子递送系统进行了RNA临床试验(临床试验登记号NCT00689065)。在21天周期的第1、3、8和10天通过30分钟的静脉输注对患有标准护理治疗难治的实体癌的患者给药靶向粒子剂量。来自包含合成递送系统,基本上由其组成、或由其组成,该合成递送系统包含:(1)线性的、基于环糊精的聚合物(CDP),(2)展示在纳米粒子的外部上的用于接合癌细胞表面上的TF受体(TFR)的人转铁蛋白(TF)靶向配体,(3)亲水聚合物(用来促进在生物流体中的纳米粒子稳定性的聚乙二醇(PEG)),以及(4)被设计为降低RRM2(在临床中使用的序列,先前表示为siR2B+5)表达的siRNA。TFR已经久为所知在恶性细胞中被下调,并且RRM2是一种确立的抗癌靶标。已经显示这些粒子(临床形式表示为CALAA-01)在非人类灵长动物中的多剂量研究中良好耐受。虽然已经通过脂质体递送向患有慢性粒细胞白血病的单一患者给药了siRNA,但是戴维斯等人的临床试验是初期人类试验,该试验用一个靶向的递送系统全身性地递送siRNA并且治疗患有实体癌的患者。为了确定该靶向的递送系统是否能够将功能性siRNA有效递送到人类肿瘤,Davis等人研究了来自三个不同的剂量组群的三位患者的活组织检查;患者A、B和C均患有转移性黑色素瘤并且分别接受了18、24和30mg m-2siRNA的CALAA-01剂量。还可以针对本发明的核酸靶向系统考虑相似的剂量。用含有线性的基于环糊精的聚合物(CDP)、展示在粒子的外部上的用于接合癌细胞表面上的TF受体(TFR)的人转铁蛋白(TF)靶向配体和/或亲水聚合物(例如,用来促进在生物流体中的粒子稳定性的聚乙二醇(PEG))的粒子,可以实现本发明的递送。
就本发明而言,优选的是使用粒子或脂质包膜递送靶向核酸的复合物的一种或多种组分例如核酸靶向效应蛋白或mRNA或指导RNA。其他递送系统或载体可以结合本发明的粒子方面使用。
通常,“纳米粒子”是指任何具有小于1000nm的直径的粒子。在某些优选实施例中,本发明的纳米粒子具有500nm或更小的最大尺寸(例如,直径)。在其他优选实施例中,本发明的纳米粒子具有范围在25nm与200nm之间的最大尺寸。在其他优选实施例中,本发明的粒子具有100nm或更小的最大尺寸。在其他优选实施例中,本发明的纳米粒子具有范围在35nm与60nm之间的最大尺寸。
包含于本发明中的粒子可以提供为不同形式,例如提供为固体粒子(例如,金属如银、金、铁、钛,非金属,基于脂质的固体,聚合物)、粒子悬浮液、或其组合。可以制备金属粒子、介电粒子和半导体粒子连同混合结构(例如,核-壳粒子)。由半导体材料制成的粒子也可以经量子点标记,如果它们足够小(典型地低于10nm)使得电子能级的量子化发生的话。此类纳米级粒子作为药物载体或成像剂用于生物医学应用中,并且可以被适配为用于本发明中的相似目的。
半-固体和软粒子已经制造出,并且是在本发明的范围内。具有半-固体性质的原型粒子是脂质体。各种类型的脂质体粒子目前在临床上用作用于抗癌药物和疫苗的递送系统。一半亲水并且另一半疏水的粒子称为杰那斯(Janus)粒子,并且对于稳定乳液是特别有效的。它们可以在水/油界面处自组装,并且充当固体表面活性剂。
美国专利号8,709,843(通过引用并入本文)提供了用于将包含治疗剂的粒子靶向递送至组织、细胞和细胞内区室的药物递送系统。本发明提供了包含聚合物的靶向粒子,该聚合物缀合至表面活性剂、亲水聚合物或脂类。
通过引用并入本文的美国专利号6,007,845提供了以下粒子,这些粒子具有多嵌段共聚物的核,该多嵌段共聚物是通过将多官能化合物与一种或多种疏水聚合物和一种或多种亲水聚合物共价连接而形成的,并且这些粒子包含生物活性材料。
通过引用并入本文的美国专利号5,855,913提供了具有空气动力学上轻的粒子的微粒组合物,这些空气动力学上轻的粒子具有小于0.4g/cm3的振实密度,其平均直径在5μm与30μm之间,将一种表面活性剂结合在其表面以用于将药物递送至肺部系统。
通过引用并入本文的美国专利号5,985,309提供了以下粒子,这些粒子结合表面活性剂和/或带正电或负电的治疗剂或诊断剂和相反电荷带电分子的亲水或疏水复合物,以用于递送至肺部系统。
通过引用并入本文的美国专利号5,543,158提供了生物可降解的可注射粒子,这些可注射粒子具有生物可降解的固体核,该固体核在表面上包含生物活性材料和聚(亚烷基二醇)部分。
通过引用并入本文的WO 2012135025(也公开为US20120251560)描述了缀合的聚乙烯亚胺(PEI)聚合物和缀合的氮杂-大环化合物(统称为“缀合的微脂体(lipomer)”或“微脂体”)。在某些实施例中,可设想本文引用的文献的此类方法和材料(例如,缀合的微脂体)可以在核酸靶向系统的背景下使用,以实现体外、离体和体内基因组微扰以修饰基因表达,包括调节蛋白表达。
在一个实施例中,该粒子可以是环氧化物-修饰的脂质-聚合物,有利地为7C1(参见例如,James E.Dahlman和Carmen Barnes等人Nature Nanotechnology[自然纳米技术](2014),在线公开于2014年5月11日,doi:10.1038/nnano.2014.84)。C71是通过使C15环氧化物终止的脂质与PEI600以14:1摩尔比进行反应来合成,并且与C14PEG2000配制以产生在PBS溶液中稳定持续至少40天的粒子(直径在35与60nm之间)。
可以利用环氧化物-修饰的脂质-聚合物将本发明的核酸靶向系统递送至肺部细胞、心血管细胞或肾细胞,然而本领域的技术人员可以调适该系统以递送到其他靶器官。设想了从约0.05至约0.6mg/kg的剂量范围。还设想了经数天或数周的剂量,其中总剂量为约2mg/kg。
外泌体
外泌体是转运RNA和蛋白的并且可以向脑和其他靶器官中递送RNA的内源纳米囊泡。为了降低免疫原性,Alvarez-Erviti等人(2011,Nat Biotechnol[自然生物技术]29:341)使用了用于外泌体产生的自我衍生的树突细胞。通过将树突细胞工程化为表达Lamp2b(一种外泌体膜蛋白,融合到神经元特异性RVG肽上)而实现了靶向脑。通过电穿孔使纯化的外泌体加载外源RNA。静脉注射的RVG靶向的外泌体特异性地将GAPDH siRNA递送到脑中的神经元、小胶质细胞、少突神经胶质细胞,导致特异性的基因敲低。预暴露于RVG外泌体未减弱敲低,并且在其他组织中未观察到非特异性摄取。通过BACE1的强的mRNA(60%)和蛋白质(62%)敲低证明了外泌体介导的siRNA递送的治疗潜能,BACE1是一种阿尔茨海默病中的治疗靶标。
为了获得免疫惰性的外泌体池,Alvarez-Erviti等人收获了来自具有同源主要组织相容性复合物(MHC)单体型的近交C57BL/6小鼠的骨髓。由于未成熟树突细胞产生大量的缺乏T细胞活化因子如MHC-II和CD86的外泌体,Alvarez-Erviti等人选择具有粒细胞/巨噬细胞集落刺激因子(GM-CSF)的树突细胞持续7天。次日,使用良好建立的超速离心方案从培养上清中纯化外泌体。这些产生的外泌体在物理上是同质的,具有直径为80nm的粒度分布峰,正如通过粒子追踪分析(NTA)和电子显微镜检查所测定。Alvarez-Erviti等人获得了6-12μg的外泌体(基于蛋白质浓度测量的)/每106个细胞。
其次,Alvarez-Erviti等人研究了使用适用于纳米级应用的穿孔方案给修饰的外泌体加载外源负荷的可能性。由于电穿孔对于纳米级的膜粒子尚未良好表征,使用非特异性Cy5标记的RNA用于电穿孔方案的经验优化。在外泌体超速离心和溶解之后测定了封装的RNA的量。在400V和125μF的电穿孔导致RNA的最好保留并且用于所有的后续实验。
Alvarez-Erviti等人向正常C57BL/6小鼠给药被包封在150μg的RVG外泌体中的150μg的每种BACE1siRNA并且将敲低效率与四个对照进行比较:未处理的小鼠、仅仅用RVG外泌体注射的小鼠,用与一种体内阳离子脂质体试剂络合的BACE1siRNA注射的小鼠、以及用与RVG-9R络合的BACE1siRNA注射的小鼠,该RVG肽与静电结合到siRNA上的9个D-精氨酸缀合。在给药之后3天,分析皮层组织样品,并且在siRNA-RVG-9R处理的和siRNARVG外泌体处理的小鼠中均观察到显著的蛋白敲低(45%,P<0.05,相对于62%,P<0.01),这是由于显著的BACE1mRNA水平降低(分别为66%[+或-]15%,P<0.001以及61%[+或-]13%,P<0.01)。而且,申请人证明了在RVG-外泌体处理的动物中在总[β]-淀粉样蛋白1-42水平上的显著降低(55%,P<0.05),其中β淀粉样蛋白为一种在阿尔茨海默病理学中的淀粉样斑块的主要成分。所观察到的降低大于在心室内注射BACE1抑制剂之后的正常小鼠中证明的β淀粉样蛋白1-40降低。Alvarez-Erviti在BACE1切割产物上进行了5'-cDNA末端快速扩增(RACE),其提供了经由siRNA的RNAi介导的敲低的证据。
最后,Alvarez-Erviti等人通过评定IL-6、IP-10、TNFα和IFN-α血清浓度研究了RNA-RVG外泌体是否诱导了体内免疫反应。在外泌体处理之后,类似于与有力地刺激IL-6分泌的siRNA-RVG-9R相反的siRNA转染试剂处理,登记了在所有细胞因子上的非显著性变化,证实了该外泌体处理的免疫惰性属性。假定外泌体仅仅封装20%的siRNA,用RVG-外泌体递送比RVG-9R递送显得更有效,因为用少五倍的siRNA实现了相当的mRNA敲低和更好的蛋白质敲低,而没有相应水平的免疫刺激。这个实验证明了RVG-外泌体技术的治疗潜力,其潜在地适合于与神经退行性疾病相关的基因的长期沉默。Alvarez-Erviti等人的外泌体递送系统可以用于将本发明的核酸靶向系统递送至治疗靶标,尤其是神经退行性疾病。对于本发明可以考虑封装在约100到1000mg的RVG外泌体中的约100到1000mg的核酸靶向系统的剂量。
El-Andaloussi等人(Nature Protocols[自然-实验手册]7,2112–2126(2012))披露了可以如何利用来源于培养的细胞的外泌体用于体外和体内递送RNA。这个方案首先描述了通过转染包含与肽配体融合的外泌体蛋白的表达载体的靶向外泌体的产生。其次,El-Andaloussi等人解释了如何纯化和表征来自转染的细胞上清液的外泌体。接着,El-Andaloussi等人详述了将RNA加载到外泌体中的关键步骤。最后,El-Andaloussi等人概述了如何使用外泌体有效体外递送RNA以及体内递送到小鼠脑中。还提供了预期结果的实例,其中外泌体介导的RNA递送通过功能分析和成像而评估。整个方案进行约3周。根据本发明的递送或给药可以使用从自我衍生的树突细胞产生的外泌体来进行。根据本文的教导,这可以在本发明的实践中采用。
在另一个实施例中,考虑了Wahlgren等人(Nucleic Acids Research[核酸研究],2012,第40卷,第17期e130)的血浆外泌体。外泌体是由包括树突细胞(DC)、B细胞、T细胞、肥大细胞、上皮细胞和肿瘤细胞在内的许多细胞类型产生的纳米囊泡(30–90nm尺寸)。这些囊泡通过晚期核内体的向内出芽而形成,并且然后在与质膜融合后释放到细胞外环境中。由于外泌体天然地在细胞之间运送RNA,这种特性在基因治疗中可以是有用的,并且根据本披露可以用于本发明的实践中。
来自血浆的外泌体可以通过如下制备:在900g离心血沉棕黄层持续20分钟以便分离血浆,之后收获细胞上清液,在300g离心10分钟以便去除细胞,并且在16 500g离心30分钟,之后通过0.22mm过滤器进行过滤。通过在120 000g超速离心70分钟使外泌体沉淀。根据在RNAi人/小鼠启动试剂盒(Quiagen公司,希尔顿(Hilden),德国)中的制造商的说明进行siRNA到外泌体中的化学转染。siRNA以终浓度2mmol/ml添加到100ml PBS中。在加入HiPerFect转染试剂之后,将该混合物在室温下孵育10分钟。为了去除过量的胶束,使用醛/硫酸盐乳胶珠再分离外泌体。可以类似于siRNA进行核酸靶向系统到外泌体中的化学转染。外泌体可以与从健康供体的外周血中分离的单核细胞和淋巴细胞共培养。因此,可以考虑的是,可以将含有核酸靶向系统的外泌体引入人单核细胞和淋巴细胞中并且以自体方式再引入。因此,可以使用血浆外泌体进行根据本发明的递送或给药。
脂质体
可以用脂质体进行根据本发明的递送或给药。脂质体是球形囊泡结构,其组成为围绕内部水性区室的单层或多层脂质双层以及相对不可渗透的外部亲脂性磷脂双层。脂质体作为药物递送载体受到了相当的重视,因为它们是生物相容、无毒的,可以递送亲水和亲脂性药物分子,包护它们的负荷物免于被血浆酶降解,并且运送它们的负荷跨过生物膜和血脑屏障(BBB)(对于评述,参见例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文献标识码469679,第12页,2011.doi:10.1155/2011/469679)。
可以从几种不同类型的脂质制造脂质体;然而,磷脂最常用来产生作为药物载体的脂质体。虽然当脂质膜与一种水性溶液混合时脂质体形成是自发的,但也可通过使用一个均质机、超声发生器、或挤出设备以振摇的形式施加力使其加速(对于评述,参见例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文献标识码469679,第12页,2011.doi:10.1155/2011/469679)。
可以将几种其他的添加剂添加到脂质体,以便修饰其结构和特性。例如,可以将胆固醇或鞘磷脂添加到脂质体混合物中,以便帮助稳定脂质体结构并且防止脂质体内部负荷物的泄漏。此外,从氢化卵磷脂酰胆碱或卵磷脂酰胆碱、胆固醇、和磷酸二鲸蜡脂制备脂质体,并且脂质体的平均囊泡大小被调整到约50至100nm。(对于评述,参见例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文献标识码469679,第12页,2011.doi:10.1155/2011/469679)。
脂质体配制品可以主要由天然磷脂和脂质如1,2-二硬脂酰-sn-甘油基-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱和单唾液酸神经节苷酯构成。由于这种配制品仅仅由磷脂组成,脂质体配制品已经遇到了许多挑战,其中之一是在血浆中的不稳定性。已经作出战胜这些挑战的若干尝试,特别是在脂质膜的处理方面。这些尝试之一集中于胆固醇的处理。将胆固醇添加到常规配制品中减缓了封装的生物活性化合物到血浆中的迅速释放,或者添加1,2-二油酰基-sn-甘油基-3-磷酸乙醇胺(DOPE)增加稳定性(对于评述,参见例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文献标识码469679,第12页,2011.doi:10.1155/2011/469679)。
在一个特别有利的实施例中,特洛伊木马(Trojan Horse)脂质体(也称为分子木马)是令人希望的并且方案可见于http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long。这些粒子允许转基因在血管内注射之后递送到整个脑。不受到限制,表面结合有特异性抗体的中性脂质粒子允许经由胞吞作用跨过血脑屏障。申请人假定利用特洛伊木马脂质体将核酸酶的CRISPR家族经由血管内注射递送到脑,这将允许全脑转基因动物,而不需要胚胎操作。对于在脂质体中的体内给药,可以考虑约1-5g的DNA或RNA。
在另一个实施例中,该核酸靶向系统或其组分可以在脂质体中给药,如稳定的核酸-脂质粒子(SNALP)(参见例如,Morrissey等人,Nature Biotechnology[自然生物技术],第23卷,第8期,2005年8月)。考虑了约1、3或5mg/kg/天的靶向SNALP中的特异性核酸靶向系统的每日静脉注射。日治疗可以经过约三天,然后每周治疗持续约五周。在另一个实施例中,还考虑了通过以约1或2.5mg/kg的剂量静脉注射给药的封装有特异性核酸靶向系统的SNALP(参见例如,Zimmerman等人,Nature Letters[自然通讯],第441卷,2006年5月4日)。该SNALP配制品可含有以2:40:10:48的摩尔百分比的脂质3-N-[(w甲氧基聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻氧基-丙胺(PEG-C-DMA)、1,2-二亚油基氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2-二硬脂酰-sn-甘油基-3-磷酸胆碱(DSPC)和胆固醇,(参见例如,Zimmerman等人,Nature Letters[自然通讯],第441卷,2006年5月4日)。
在另一个实施例中,已经证明稳定的核酸-脂质粒子(SNALP)将分子有效递送到高度血管化的HepG2-衍生的肝脏肿瘤,但是不递送到血管化不良的HCT-116衍生的肝脏肿瘤(参见例如,Li,Gene Therapy[基因治疗](2012)19,775–780)。可以通过如下制备这些SNALP脂质体:使用25:1的脂质/siRNA比率和48/40/10/2的胆固醇/D-Lin-DMA/DSPC/PEG-C-DMA的摩尔比,用二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和siRNA配制D-Lin-DMA和PEG-C-DMA。生成的SNALP脂质体在尺寸上为约80-100nm。
在又另一个实施例中,SNALP可以包含合成胆固醇(西格玛-奥德里奇公司(Sigma-Aldrich),圣路易斯,密苏里州,美国)、二棕榈酰磷脂酰胆碱(Avanti Polar Lipids公司,阿拉巴斯特(Alabaster),阿拉巴马州,美国)、3-N-[(w-甲氧基聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻氧基丙基胺和阳离子的1,2-二亚油基氧基-3-N,N二甲基氨基丙烷(参见例如,Geisbert等人,Lancet[柳叶刀]2010;375:1896-905)。例如可以考虑静脉推注给药约2mg/kg总核酸靶向系统的剂量。
在又另一个实施例中,SNALP可以包含合成胆固醇(西格玛-奥德里奇公司)、1,2-二硬脂酰基-sn-甘油基-3-磷酸胆碱(DSPC;Avanti Polar Lipids公司)、PEG-cDMA和1,2-二亚油基氧基-3-(N;N-二甲基)氨基丙烷(DLinDMA)(参见例如,Judge,J.Clin.Invest.[临床研究杂志]119:661-673(2009))。用于体内研究的配制品可包含约9:1的最终脂质/RNA质量比。
已经由阿尔尼拉姆制药公司(Alnylam Pharmaceuticals)的Barros和Gollob评论了RNAi纳米药物的安全性(参见例如,Advanced Drug Delivery Reviews[先进药物递送评论]64(2012)1730–1737)。稳定的核酸脂质粒子(SNALP)由四种不同的脂质构成—在低pH时为阳离子的可电离脂质(DLinDMA)、中性辅助脂质、胆固醇和可扩散的聚乙二醇(PEG)-脂质。该粒子直径大约为80nm并且在生理pH时是电中性的。在配制过程中,该可电离脂质用于在粒子形成过程中使脂质与阴离子RNA缩合。当在渐增的酸性内体条件下带正电荷时,该可电离的脂质还介导了SNALP与内体膜的融合,从而使得能够将RNA释放到细胞质中。该PEG-脂质在配制过程中使该粒子稳定并且减少聚集,随后提供中性的亲水性外部,以改进药代动力学特性。
到目前为止,已经使用具有RNA的SNALP配制品开始两个临床项目。特克米拉制药公司最近完成了SNALP-ApoB在具有增高的LDL胆固醇的成年志愿者中的I期单剂量研究。ApoB主要在肝脏和空肠中表达,并且对于VLDL和LDL的组装和分泌是必需的。十七位受试者接受了SNALP-ApoB的单剂量(跨7个剂量水平的剂量递增)。没有肝脏毒性(预期为基于临床前研究的潜在剂量限制性毒性)的证据。处于最高剂量的(两位中的)一位受试者经历了与免疫系统刺激一致的流感样症状,于是做出结束该试验的决定。
阿尔尼拉姆制药公司已经类似地推出了ALN-TTR01,其采用上述SNALP技术并且靶向突变体和野生型TTR的肝实质细胞产生,从而治疗TTR淀粉样变性(ATTR)。已经描述了三个ATTR综合征:家族性淀粉样多发性神经病变(FAP)和家族性淀粉样心肌病(FAC)—两者均由TTR中的常染色体显性突变引起;以及由野生型TTR引起的老年全身性淀粉样变性(SSA)。最近在具有ATTR的患者中完成了ALN-TTR01的安慰剂对照单剂量递增I期试验。向31位患者(23位用研究药物,8位用安慰剂)在0.01到1.0mg/kg(基于siRNA)的剂量范围内以15分钟静脉内输注给药ALN-TTR01。治疗耐受良好,其中在肝功能试验中没有显著增加。在≥0.4mg/kg时在23位患者的3位中注意到输注相关反应;对所有患者均做出减慢输注速率的反应并且所有患者继续参与研究。在处于1mg/kg的最高剂量(如根据临床前和NHP研究预期的)的两位患者中注意到血清细胞因子IL-6、IP-10和IL-1ra的最小与瞬时升高。在1mg/kg时观察到ALN-TTR01的预期药理效应,即血清TTR的降低。
在又另一个实施例中,可以通过将阳离子脂质、DSPC、胆固醇和PEG-脂质以40:10:40:10的摩尔比分别溶解在例如乙醇中来制备SNALP(参见,Semple等人,NatureNiotechnology[自然生物技术],第28卷第2期2010年2月,第172-177页)。将该脂质混合物添加到水性缓冲液中(50mM柠檬酸盐,pH 4),混合至最终的乙醇和脂质浓度分别为30%(vol/vol)和6.1mg/ml,允许在22℃平衡2分钟,然后挤出。使用Lipex挤出仪(北方脂质公司),在22℃将水合脂质通过两层80nm孔径大小的过滤器(Nuclepore)直到获得70–90nm直径的囊泡时为止,正如通过动态光散射分析测定的。这大致需要1–3次通过。将该siRNA(溶解在50mM柠檬酸盐中,pH为4的含有30%乙醇的水溶液)以约5ml/min的速率在混合下添加到预平衡的(35℃)囊泡中。在达到0.06(wt/wt)的最终靶siRNA/脂质比率之后,将该混合物在35℃另外孵育30分钟,以允许囊泡重组和该siRNA的封装。然后去除乙醇并且通过透析或切向流渗滤用PBS(155mM NaCl,3mM Na2HPO4,1mM KH2PO4,pH 7.5)替换外部缓冲液。使用控制的逐步稀释法工艺将siRNA封装在SNALP中。KC2-SNALP的脂质组分为以57.1:7.1:34.3:1.4的摩尔比使用的DLin-KC2-DMA(阳离子脂质)、二棕榈酰磷脂酰胆碱(DPPC;AvantiPolar Lipids公司)、合成胆固醇(西格玛公司)和PEG-C-DMA。在形成加载的粒子后,将SNALP在PBS中透析并且在使用之前通过0.2μm的滤膜消毒过滤。平均粒径为75–85nm,并且将90%-95%的siRNA封装在脂质粒子内。用于体内测试的在配制品中的最终siRNA/脂质比率是大约0.15(wt/wt)。在使用之前即刻将含有因子VII siRNA的LNP-siRNA系统在无菌PBS中稀释到适当浓度,并且通过侧尾静脉以10ml/kg的总体积静脉内给药。这种方法和这些递送系统可以类推到本发明的核酸靶向系统。
其他脂质
其他阳离子脂质(如氨基脂质2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(DLin-KC2-DMA))可以例如类似于SiRNA地用来封装核酸靶向系统或其组分或对其进行编码的一种或多种核酸分子(参见例如,Jayaraman,Angew.Chem.Int.Ed.[德国应用化学]2012,51,8529–8533),并且因此可以在本发明的实践中采用。可以考虑具有下列脂质组成的预成型囊泡:分别处于摩尔比40/10/40/10的氨基脂质、二硬脂酰卵磷脂(DSPC)、胆固醇和(R)-2,3-双(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基碳酸酯(PEG-脂质)以及大约0.05(w/w)的FVII siRNA/总脂质比率。为了确保在70-90nm范围内的窄粒径分布以及0.11+0.04(n=56)的低多分散性指数,可以在添加指导RNA之前将粒子通过80nm的膜挤出达三次。可以使用含有高度有效的氨基脂质16的粒子,其中四种脂质组分16、DSPC、胆固醇和PEG-脂质的摩尔比(50/10/38.5/1.5)可以被进一步优化,以增强体内活性。
Michael S D Kormann等人(“Expression of therapeutic proteins afterdelivery of chemically modified mRNA in mice[在小鼠中递送化学修饰的mRNA后治疗性蛋白质的表达]:Nature Biotechnology[自然生物技术],卷:29,页码:154-157](2011))描述了使用脂质包膜递送RNA。脂质包膜的用途在本发明中也是优选的。
在另一个实施例中,可以用本发明的核酸靶向系统或其一种或多种组分或编码其的一种或多种核酸分子配制脂质以形成脂质纳米粒子(LNP)。脂质包括但不限于DLin-KC2-DMA4、C12-200和辅助脂质二硬脂酰磷脂酰胆碱、胆固醇和PEG-DMG,可以使用自发囊泡形成程序将其与核酸靶向系统而不是siRNA一起配制(参见例如,Novobrantseva,MolecularTherapy–Nucleic Acids[分子治疗–核酸](2012)1,e4;doi:10.1038/mtna.2011.3)。组分摩尔比可以是约50/10/38.5/1.5(DLin-KC2-DMA或C12-200/二硬脂酰磷脂酰胆碱/胆固醇/PEG-DMG)。在DLin-KC2-DMA和C12-200脂质粒子(LNP)的情况下,最终脂质:siRNA重量比可以分别是约12:1和9:1。配制品可以具有约80nm的平均粒径,具有>90%的包覆效率。可以考虑3mg/kg的剂量。
特克米拉公司在美国和国外具有一组针对LNP和LNP配制品的不同方面的大约95个同族专利(参见例如,美国专利号7,982,027;7,799,565;8,058,069;8,283,333;7,901,708;7,745,651;7,803,397;8,101,741;8,188,263;7,915,399;8,236,943和7,838,658以及欧洲专利号1766035;1519714;1781593和1664316),所有这些专利均可用于和/或适用于本发明。
该核酸靶向系统或其组分或对其进行编码一种或多种核酸分子可以封装在PLGA微球中进行递送,例如进一步描述于美国公开申请20130252281和20130245107以及20130244279(转让给Moderna Therapeutics公司)中,其涉及包含修饰的核酸分子的组合物的配制品方面,所述核酸分子可以编码蛋白质、蛋白质前体、或该蛋白质或蛋白质前体的部分或完全加工形式。该配制品具有50:10:38.5:1.5-3.0(阳离子脂质:融合脂质:胆固醇:PEG脂质)的摩尔比。该PEG脂质可以选自,但不限于PEG-c-DOMG、PEG-DMG。该融合脂质可以是DSPC。还参见,Schrum等人,Delivery and Formulation of Engineered Nucleic Acids[工程化核酸的递送和配制],美国公开申请20120251618。
Nanomerics公司的技术着手解决针对广泛治疗学的生物利用度挑战,包括基于低分子量疏水药物、肽以及核酸(质粒、siRNA、miRNA)的治疗学。该技术已经证明了明显优势的特异性的给药途径包括口服途径、跨血脑屏障的运送、向实体瘤以及眼部的递送。参见例如,Mazza等人,2013,ACS Nano.[ACS纳米]2013年2月26日;7(2):1016-26;Uchegbu和Siew,2013,J Pharm Sci.[药物科学杂志]102(2):305-10和Lalatsa等人,2012,J ControlRelease[控释杂志].2012年7月20日;161(2):523-36。
美国专利公开号20050019923描述了用于向哺乳动物身体递送生物活性分子例如多核苷酸分子、肽和多肽和/或药剂的阳离子树状聚合物。这些树状聚合物适合于将生物活性分子的递送靶向到例如肝、脾、肺、肾或心脏(或甚至脑)。树状聚合物是从简单的支化单体单元以逐步方式制备的合成3维大分子,其性质和功能性可以容易地进行控制和改变。经由向多功能核(发散式合成法)或朝向多功能核(收敛式合成法)重复加成结构单元(building block)而合成树状聚合物,并且结构单元的3维壳的各次加成导致更高级别的树状聚合物的形成。聚丙烯亚胺树状聚合物从二氨基丁烷核开始,通过对伯胺的丙烯腈的双迈克尔加成反应向其上添加两倍数目的氨基基团,继之为腈的氢化。这导致氨基基团的加倍。聚丙烯亚胺树状聚合物含有100%的可质子化氮以及高达64个末端氨基基团(5级,DAB 64)。可质子化基团常常为能够在中性pH时接受质子的胺基。树状聚合物作为基因递送剂的用途在很大程度上集中于聚酰胺-胺和含磷化合物的用途,其中胺/酰胺的混合物或N--P(O2)S分别作为缀合单元,没有报道关于更低级别的聚丙烯亚胺树状聚合物用于基因递送的用途的工作。还研究了作为pH敏感的控制释放系统的聚丙烯亚胺树状聚合物,其用于药物递送以及当被外周氨基酸基团化学修饰时用于它们的客体分子的封装。还研究了聚丙烯亚胺树状聚合物的细胞毒性和与DNA的相互作用以及DAB 64的转染效力。
美国专利公开号20050019923是基于与早期报道相反的观察:阳离子树状聚合物例如聚丙烯亚胺树状聚合物展示出适当的特性,如,特异性靶向和低毒性,其用于在生物活性分子如基因材料的靶向递送中使用。另外,阳离子树状聚合物的衍生物也展示出适当的用于生物活性分子的靶向递送的特性。还参见,生物活性聚合物(Bioactive Polymers)、美国公开申请20080267903,其披露了不同的聚合物,包括阳离子聚胺聚合物和树枝状聚合物,其显示具有抗增殖活性,并且因此可用于治疗其特征为不希望的细胞增殖的障碍,如新生物和肿瘤、炎性障碍(包括自身免疫障碍)、银屑病和动脉粥样硬化。这些聚合物可以作为活性剂单独使用、或者作为其他治疗剂(如药物分子或用于基因治疗的核酸)的递送媒介使用。在这样的情况下,这些聚合物自身固有的抗肿瘤活性可以补足有待递送的药剂的活性。这些专利公开的披露可以与本文针对递送一种或多种核酸靶向系统或其一种或多种组分或对其进行编码的一种或多种核酸分子的传授结合使用。
超电荷蛋白
超电荷蛋白是一类具有非常高的正或负理论净电荷的工程化的或天然存在的蛋白并且可以用于递送一种或多种核酸靶向系统或其一种或多种组分或对其进行编码的一种或多种核酸分子。超负电荷蛋白和超正电荷蛋白两者都展示出显著的抵抗热诱导或化学诱导的聚集的能力。超正电荷蛋白还能够渗透哺乳动物细胞。使负荷物与这些蛋白结合,如质粒DNA、RNA、或其他蛋白,可使得这些大分子到体外和体内的哺乳动物细胞中的功能递送成为可能。刘大卫实验室(David Liu’s lab)在2007年报道了超电荷蛋白的建立和表征(Lawrence等人,2007,Journal of the American Chemical Society[美国化学会志]129,10110–10112)。
RNA和质粒DNA到哺乳动物细胞中的非病毒递送对于研究和治疗应用都是有价值的(Akinc等人,2010,Nat.Biotech.[自然生物技术]26,561–569)。纯化的+36GFP蛋白(或其他超正电荷蛋白)与RNA在适当的无血清培养基中混合并且允许在添加到细胞中之前复合。在这个阶段的血清的包含将会抑制超电荷蛋白-RNA复合物的形成和降低治疗效果。已经发现以下方案对于多种细胞系是有效的(McNaughton等人,2009,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]106,6111–6116)。然而,应当进行改变蛋白和RNA剂量的先导实验来优化用于特异性细胞系的程序。
(1)在治疗前一天,以1x105个细胞/孔铺板于48孔板中。
(2)在治疗当天,在无血清的培养基中稀释纯化的+36GFP蛋白直到终浓度200nM。添加RNA到50nM的终浓度。涡旋混合并且在室温孵育10分钟。
(3)在孵育过程中,抽吸培养基离开细胞并且再次用PBS洗涤。
(4)在孵育+36GFP和RNA之后,向细胞加入蛋白-RNA复合物。
(5)将细胞与复合物在37℃孵育4小时。
(6)在孵育之后,抽出培养基并且用20U/mL的肝素PBS洗涤三次。用含血清培养基另外孵育细胞48小时或更长,这取决于用于活性的试验。
(7)通过免疫印迹、qPCR、表型分析、或其他适当的方法分析细胞。
刘大卫实验室已经进一步发现+36GFP在一系列细胞中是一种有效的质粒递送试剂。由于质粒DNA是一种比siRNA大的负荷物,有效复合质粒需要成比例地更大的+36GFP蛋白。为了有效质粒递送,申请人已经开发了一种带有C末端HA2肽标签的+36GFP变体,这种肽是一种已知的从流感病毒血凝素蛋白衍生的内体破坏肽。下列方案在多种细胞中是有效的,但是如上所述,建议针对特异性细胞系和递送应用优化质粒DNA的超电荷蛋白的剂量。
(1)在治疗前一天,以1x105/孔铺板于48孔板中。
(2)在治疗当天,在无血清的培养基中稀释纯化的GFP蛋白直到终浓度2mM。加入1mg的质粒DNA。涡旋混合并且在室温孵育10分钟。
(3)在孵育过程中,抽吸培养基离开细胞并且再次用PBS洗涤。
(4)在孵育GFP和质粒DNA之后,向细胞轻轻加入蛋白-DNA复合物。
(5)将细胞与复合物在37℃孵育4小时。
(6)在孵育之后,抽出培养基并且用PBS洗涤。在含血清培养基中孵育细胞,并且另外孵育24-48小时。
(7)在适当时分析质粒递送(例如,通过质粒驱动的基因表达)。
还参见例如,McNaughton等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]106,6111-6116(2009);Cronican等人,ACS Chemical Biology[ACS化学生物学]5,747-752(2010);Cronican等人,Chemistry&Biology[化学与生物学]18,833-838(2011);Thompson等人,Methods in Enzymology[酶学方法]503,293-319(2012);Thompson,D.B.等人,Chemistry&Biology[化学与生物学]19(7),831-843(2012)。超电荷蛋白的这些方法可以使用和/或适用于本发明的核酸靶向系统的递送。Lui博士(Dr.Lui)以及与本文教导结合的本文的文献的这些系统可以用于递送一种或多种核酸靶向系统或其一种或多种组分或对其进行编码的一种或多种核酸分子。
细胞穿透肽(CPP)
在又另一个实施例中,考虑了细胞穿透肽(CPP)用于递送CRISPR Cas系统。CPP是短肽,其促进细胞吸收不同分子负荷物(从纳米级粒子到小化学分子和DNA的大片段)。如本文使用的术语“负荷物”包括但不限于下组,该组由以下组成:治疗剂、诊断探针、肽、核酸、反义寡核苷酸、质粒、蛋白质、粒子(包括纳米粒子)、脂质体、发色团、小分子和放射性物质。在本发明的多个方面,该负荷物还可以包含CRISPR Cas系统的任何组分或整个功能性CRISPR Cas系统。本发明的方面进一步提供了用于将希望的负荷物递送到受试者体内的方法,这些方法包括:(a)制备如下复合物,其包含本发明的细胞穿透肽以及希望的负荷物,并且(b)经口服、关节内、腹膜内、鞘内、动脉内(intrarterially)、鼻内、实质内、皮下、肌内、静脉内、真皮、直肠内地或局部给予该复合物至一位受试者。负荷物是通过化学键经由共价键或通过非共价相互作用与这些肽缔合。
CPP的功能是将该负荷物递送进入细胞,这是一种通常通过内吞作用发生的过程,其中该负荷物被递送到活体哺乳动物细胞的内体。细胞穿透肽具有不同的尺寸、氨基酸序列、和电荷,但所有CPP具有一种不同的特征,该特征是易位质膜并协助将各种分子量的负荷物递送到细胞质或细胞器的能力。CPP易位可以分为三个主要的进入机制:直接渗透于膜中、内吞作用介导的进入、和通过形成暂时性结构易位。CPP已经发现在治疗不同疾病中在药物(包括癌症和病毒抑制剂)中作为药物递送剂的许多应用、连同在用于细胞标记的造影剂中的许多应用。后者的实例包括充当用于GFP、MRI造影剂、或量子点的载体。CPP具有很大的作为用于研究和医学的体外和体内递送载体的潜力。CPP典型地具有如下氨基酸组合物,该氨基酸组合物包含高相对丰度的带负电荷的氨基酸,例如赖氨酸或精氨酸,或具有包含交替模式的极性/带电荷的氨基酸和非极性疏水性氨基酸的序列。这两种类型的结构分别称为聚阳离子或两亲性的。第三类CPP是仅含有非极性残基的疏水性肽,具有低净电荷或具有对于细胞摄入关键的疏水氨基酸基团。发现的初始CPP之一是来自人类免疫缺陷病毒1(HIV-1)的反式-活化转录活化因子(Tat),发现其高效地从周围介质被许多培养中的细胞类型摄取。从此以后,已知CPP的数目已经显著扩大,并且已经产生具有更有效蛋白转导特性的小分子合成类似物。CPP包括但不限于穿透素、Tat(48-60)、转运素(Transportan)以及(R-AhX-R4)(Ahx=氨基己酰基)。
美国专利8,372,951提供了来源于嗜酸性粒细胞阳离子蛋白(ECP)的CPP,它展示出高度细胞穿透效率和低毒性。还提供了将CPP与其内负荷物递送进脊椎动物受试者中的多个方面。CPP的其他方面及其递送描述于美国专利8,575,305;8;614,194以及8,044,019中。CPP可以用来递送CRISPR-Cas系统或其组分。可以采用CPP递送CRISPR-Cas系统或其组分,也被提供于原稿“Gene disruption by cell-penetrating peptide-mediateddelivery of Cas9protein and guide RNA[通过细胞穿透肽介导的对Cas9蛋白和指导RNA的递送进行的基因破坏]”,Suresh Ramakrishna,Abu-Bonsrah Kwaku Dad,JagadishBeloor等人Genome Res.[基因组研究],2014年4月2日.[电子版先于印刷版],通过引用以其整体并入,其中证实了用CPP-缀合的重组Cas9蛋白和CPP-复合的指导RNA进行治疗导致在人细胞系中的内源基因破坏。在该论文中,Cas9蛋白经由硫醚键缀合至CPP,而指导RNA与CPP复合,形成缩合的带负电荷的粒子。已经显示,用修饰的Cas9和指导RNA同时和顺序地治疗人细胞,包括胚胎干细胞、真皮成纤维细胞、HEK293T细胞、HeLa细胞和胚胎癌细胞,导致有效的基因破坏,伴随相对于质粒转染而言降低的脱靶突变。
可植入装置
在另一个实施例中,还考虑可植入装置用于递送该核酸靶向系统或其一种或多种组分或对其进行编码的一种或多种核酸分子。例如,美国专利公开20110195123披露了一种可植入医用装置,其局部地并且在延长的时期内洗脱药物,包括几种类型的这种装置、实施的治疗方式和植入方法。该装置包含聚合物基材(例如,用作装置主体的基质)以及药物,并且在一些情况下包含另外的支架材料(如金属或另外的聚合物)以及增强可见度和成像的材料。可植入递送装置在提供局部的并且在延长的时期内的释放方面可以是有利的,其中药物直接释放到患病区域的细胞外基质(ECM),所述患病区域如肿瘤、炎症、退化,或用于针对症状的目的,或者释放到受损的平滑肌细胞,或者用于预防。如在此公开的,一类药物是RNA,并且这个系统可以用于和/或适用于本发明的核酸靶向系统。在一些实施例中,植入方式为用于包括近距离放射疗法和针吸活组织检查在内的其他治疗的、当今开发和使用的现有植入程序。在这样的情况下,在本发明中描述的新植入物的尺寸类似于初始植入物。典型地在相同的治疗程序中植物很少的装置。
美国专利公开20110195123提供了药物递送可植入或可插入系统,包括适用于空腔例如腹腔和/或其中药物递送系统未被锚定或附接的任何其他类型的给药,其包含生物稳定的和/或可降解的和/或生物可吸收的聚合物基材,其可以例如任选地是基质。应当指出的是术语“插入”也包括植入。该药物递送系统优选地被实施为如美国专利公开20110195123中描述的“装填器(Loder)”。
聚合物或多种聚合物是生物相容的,其结合一种药剂和/或多种药剂,使得药剂以控制的速率释放,其中该聚合物基材如基质的总体积,例如在一些实施例中是任选地并且优选地不大于容许达到该药剂的治疗水平的最大体积。作为一个非限制性实例,这样的体积优选在0.1m3至1000mm3的范围内,正如该药剂负荷的体积所要求的。该装填器任选地是更大的,例如当结合有一个其尺寸由功能性决定的装置时,例如而不限于,膝关节、宫内节育环或子宫颈环等。
在一些实施例中,该药物递送系统(用于递送该组合物)被设计为优选地采用可降解聚合物,其中主要释放机制是本体溶蚀(Bulk erosion);或者在一些实施例中,使用了不可降解的、或缓慢降解的聚合物,其中主要释放机制是扩散而不是本体溶蚀,使得外部部分用作膜,而其内部部分用作储药池,该储药池在延长的时期内(例如从约一周到约几个月)实际上不受环境的影响。还可以任选地使用具有不同释放机制的不同聚合物的组合。在总药物释放期的重要时段期间,在表面处的浓度梯度优选地被维持有效地恒定,并且因此扩散速率是有效地恒定的(称为“零模式”扩散)。关于术语“恒定”,它意指优选地维持在治疗效果的低阈值以上的扩散速率,但是可以仍然任选地具有初期突释的特征和/或可以波动,例如增加和降低到一定程度。该扩散速率优选地被如此维持一个延长的时期,并且它被考虑为相对于一定的水平是恒定的,以便优化治疗有效期,例如该有效沉默期。
该药物递送系统任选地并且优选地被设计为保护基于核苷酸的治疗剂免于降解,而不论化学性质或由于受试者体内的酶和其他因素的攻击。
美国专利公开20110195123的药物递送系统任选地与传感和/或活化器具相关,这些器具通过活化和/或加速/减速的无创和/或微创方法在该装置的植入之时和/或之后被操作,例如任选地包括但不限于热力加热和冷却、激光束和超声波,包括聚焦超声和/或RF(射频)方法或装置。
根据美国专利公开20110195123的以下实施例,用于局部递送的部位可以任选地包括其特征为高度异常的细胞增殖、受到抑制的细胞凋亡的靶部位,包括肿瘤、活动性和/或慢性炎症和感染,包括自身免疫性疾病状态、退化组织(包括肌肉和神经组织)、慢性疼痛、退行性部位,以及用于增强组织再生的骨折位置以及其他伤口位置,以及损伤的心肌、平滑肌和横纹肌。
用于植入该组合物的部位或靶部位优选地其特征为用于靶向局部递送的足够小的半径、面积和/或体积。例如,该靶部位任选地具有在从约0.1mm到约5cm范围内的直径。
该靶部位的位置优选地针对最大治疗效力而选择。例如,该药物递送系统的组合物(任选地与如上所述的用于植入的装置一起)任选地并且优选地被植入在肿瘤环境或与之相关的血供之内或者附近。
例如该组合物(任选地与该装置一起)任选地植入在胰脏、前列腺、乳房、肝脏之内或附近,通过乳头,在血管系统之内等。
靶位置任选地选自下组,该组包含以下、基本上由以下组成、或由以下组成(仅仅作为非限制性实例,因为任选地在身体内的任何部位可以适合于植入装填器):1.脑,在退行性部位,像在帕金森病或阿尔茨海默病中的基底神经节、白质和灰质;2.如在肌萎缩性脊髓侧索硬化症(ALS)的情况下的脊柱;3.子宫颈以预防HPV感染;4.活动性或慢性炎性关节;5.在银屑病情况下的真皮;6.交感神经部位和感觉神经部位用于止痛作用;7.骨内植入;8.急性和慢性感染部位;9.阴道内;10.内耳--听觉系统、内耳的迷路、前庭系统;11.气管内;12.心内;冠状动脉、心外膜;13.膀胱;14.胆道系统;15.实质组织,包括且不限于肾脏、肝脏、脾脏;16.淋巴结17.唾液腺18.牙龈;19.关节内(进入关节);20.眼内;21.脑组织;22.脑室;23.空腔,包括腹腔(例如但不限于用于卵巢癌);24.食管内以及25.直肠内。
任选地,该系统(例如含有该组合物的装置)的插入与向在该靶部位和该部位附近的ECM注射材料有关,从而影响该靶部位和这个部位附近的ECM中的局部pH和/或温度和/或影响该药物的扩散和/或药物动力学的其他生物因素。
任选地,根据一些实施例,所述药剂的释放可以与传感和/或活化器具相关,这些器具通过活化和/或加速/减速的无创和/或微创方法和/或别的方法在插入之前和/或之时和/或之后被操作,所述方法包括激光束、放射、热力加热和冷却、和超声波,包括聚焦超声和/或RF(射频)方法或装置、以及化学活化因子。
根据美国专利公开20110195123的其他实施例,该药物优选地包含RNA,例如,对于局限性癌症情况,在乳房、胰脏、脑、肾脏、膀胱、肺以及前列腺中,如下文所述。尽管用RNAi进行示例,但是许多药物可适用于封装在装填器中,并且可以与本发明相关,只要这样的药物可以被封装在装填器基材(例如像基质)中即可,并且这种系统可以使用和/或适配来递送本发明的核酸靶向系统。
作为特殊应用的另一个实例,神经肌肉退行性疾病由于异常基因表达而发生。RNA的局部递送可以具有干扰这样的异常基因表达的治疗特性。包括小分子药物和大分子在内的抗凋亡、抗炎和抗退行性药物的局部递送也可以任选地是治疗性的。在这样的情况下,该装填器用于以恒定速率和/或通过单独植入的专用装置延长释放。这都可以用于和/或适用于本发明的核酸靶向系统。
作为特殊应用的又另一个实例,用基因修饰剂治疗精神和认知障碍。基因敲低是治疗选项。向中枢神经系统部位局部递送药剂的装填器是对于精神和认知障碍的治疗选项,这些精神和认知障碍包括但不限于精神病、双极性疾病、神经性障碍和行为疾病(behavioral maladies)。这些装填器也可以在特定脑部位进行植入时局部递送包括小分子药物和大分子的药物。这都可以用于和/或适用于本发明的核酸靶向系统。
作为特殊应用的另一个实例,在局部部位的先天性和/或适应性免疫介质的沉默使得能够预防器官移植排斥。用植入到移植器官和/或植入部位的装填器局部递送RNA和免疫调节试剂致使经由排斥性免疫细胞(如针对移植器官而被活化的CD8)的局部免疫抑制。这都可以用于和/或适用于本发明的核酸靶向系统。
作为特殊应用的另一个实例,包括VEGF和血管生成素及其他在内的血管生长因子对于新血管形成是必需的。这些因子、肽、肽模拟物的局部递送或抑制它们的阻遏因子是一种重要的治疗模式;使阻遏因子沉默以及用装填器局部递送刺激血管发生的这些因子、肽、大分子和小分子药物对于周围血管疾病、全身性血管疾病和心血管疾病是治疗性的。
插入的方法(如植入)可以任选地已用于其他类型的组织植入和/或用于组织取样,任选地在这种方法中没有修改,或者可替代地任选地仅仅具有非重点修改。这样的方法任选地包括但不限于近距离放射治疗方法、活组织检查、用和/或不用超声的内窥镜检查如ERCP、进入脑组织的立体定向法、腹腔镜检查,包括用腹腔镜进入关节、腹腔器官、膀胱壁和体腔的植入。
在本文讨论的可植入装置技术可以与本文的教导一起使用并且因此根据本披露和本领域的知识,可以经由可植入装置递送CRISPR-Cas系统或其组分或其核酸分子或编码或提供组分的核酸分子。
患者特异性筛选方法
靶向RNA(例如三核苷酸重复)的核酸靶向系统可以用于针对此类重复的存在对患者或患者样品进行筛选。这些重复可以是该核酸靶向系统的RNA的靶标,并且如果被该核酸靶向系统结合至其上,则可以检测到该结合,以由此指示存在这样一个重复。因此,核酸靶向系统可以用于针对该重复的存在对患者或患者样品进行筛选。然后可以向该患者给药一种或多种适合的化合物以解决该病症;或者,可以向该患者给药核酸靶向系统,该系统结合到并且引起插入、缺失或突变并且减轻该病症。
本发明使用核酸来结合靶RNA序列。
CRISPR效应蛋白mRNA和指导RNA
也可以单独递送CRISPR效应蛋白mRNA和指导RNA。可以在该指导RNA在给出时间以待CRISPR效应蛋白表达之前递送CRISPR效应蛋白mRNA。可以在给药指导RNA之前1-12小时(优选约2-6小时)给药CRISPR效应蛋白mRNA。
可替代地,可以一起给药CRISPR效应蛋白mRNA和指导RNA。有利地,可以在初始给药CRISPR效应蛋白mRNA+指导RNA之后1-12小时(优选约2-6小时)给药指导RNA的第二加强剂量。
本发明的CRISPR效应蛋白(即C2c2效应蛋白)有时在本文称为CRISPR酶。应当理解的是,效应蛋白是基于或来源于酶的,因此术语“效应蛋白”在一些实施例中当然包括“酶”。然而,应当理解的是,效应蛋白可以如在一些实施例中所要求的那样具有DNA或RNA结合但不一定具有切割(cutting)或切口(nicking)活性(包括失活Cas效应蛋白功能)。
为了实现基因组修饰的最有效水平,另外给予CRISPR效应蛋白mRNA和/或指导RNA可以是有用的。在一些实施例中,当靶向遗传疾病时,尤其是在治疗方法中,并且优选在提供修复模板以校正或改变表型的情况下,表型改变优选是基因组修饰的结果。
在一些实施例中,可以被靶向的疾病包括与引起疾病的剪接缺陷有关的那些。
在一些实施例中,细胞靶标包括造血干细胞/祖细胞(CD34+);人类T细胞;以及眼(视网膜细胞)–例如光感器前体细胞。
在一些实施例中,基因靶标包括:人类β珠蛋白–HBB(用于治疗镰状细胞贫血,包括通过刺激基因转换(使用密切相关的HBD基因作为内源模板));CD3(T细胞);以及CEP920-视网膜(眼)。
在一些实施例中,疾病靶标还包括:癌症;镰状细胞贫血(基于点突变);HIV;β-地中海贫血;以及眼科或眼部疾病–例如引起莱伯(Leber)先天性黑朦(LCA)的剪接缺陷。
在一些实施例中,递送方法包括:酶-指导复合物(核糖核蛋白)的阳离子脂质介导的“直接”递送和质粒DNA的电穿孔。
本发明方法可以进一步包括递送模板(如修复模板),它们可以是dsODN或ssODN,参见下文。模板的递送可以经由与任何或所有CRISPR效应蛋白或指导物的递送同时的或分开的递送并且经由相同或不同的递送机制。在一些实施例中,优选的是一起递送该模板与该指导,并且优选地还有该CRISPR效应蛋白。一个实例可以是AAV载体。
本发明的方法还可以包括:(a)向该细胞递送双链寡脱氧核苷酸(dsODN),该双链寡脱氧核苷酸包含与通过所述双链断裂产生的突出端互补的突出端,其中所述dsODN被整合进该感兴趣基因座中;或–(b)向该细胞递送单链寡脱氧核苷酸(ssODN),其中所述ssODN充当所述双链断裂的同源定向修复的模板。本发明的方法可以用于预防或治疗个体的疾病,任选地其中所述疾病是由所述感兴趣基因座中的缺陷引起。本发明的方法可以是在该个体的体内进行或针对取自该个体的细胞离体地进行,任选地其中将所述细胞返回到该个体。
为了使毒性和脱靶效应最小化,重要的是控制所递送的CRISPR效应蛋白mRNA和指导RNA的浓度。CRISPR效应蛋白mRNA和指导RNA的最佳浓度可以通过在细胞或动物模型中测试不同的浓度并且使用深度测序分析在潜在的脱靶基因组基因座处的修饰的范围而确定。例如,对于靶向人类基因组的EMX1基因中的5’-GAGTCCGAGCAGAAGAAGAA-3’的指导序列,可以使用深度测序来评定在下列两个脱靶位点处的修饰水平,1:5’-GAGTCCTAGCAGGAGAAGAA-3’和2:5’-GAGTCTAAGCAGAAGAAGAA-3’。对于体内递送,应当选择产生最高的中靶修饰水平同时将脱靶修饰水平最小化的浓度。
可诱导系统
在一些实施例中,CRISPR效应蛋白可以形成可诱导系统的组分。该系统的诱导性质将允许该系统利用一种能量形式对基因编辑或基因表达进行时空控制。该能量形式可以包括但不限于电磁辐射、声能、化学能和热能。可诱导系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交体转录活化系统(FKBP、ABA等)或光可诱导系统(光敏素、LOV结构域或隐花色素)。在一个实施例中,该CRISPR效应蛋白可以是以序列特异性方式指导转录活性的变化的光诱导的转录效应因子(LITE)的一部分。光的组分可以包括CRISPR效应蛋白、光响应细胞色素异二聚体(例如,来自拟南芥)以及转录活化/阻遏结构域。诱导型DNA结合蛋白和关于使用它们的方法的其他实例提供在US 61/736465和US 61/721,283以及WO 2014018423A2中,将其特此通过引用以其整体并入。
使用CRISPR Cas系统的示例性方法
本发明提供了非天然存在的或工程化的组合物、或编码所述组合物的组分的一种或多种多核苷酸、或包含对所述组合物的组分进行编码的一种或多种多核苷酸的载体或递送系统,其用于体内、离体或体外修饰靶细胞,并且是以改变细胞使得一旦被修饰则CRISPR修饰的细胞的子代或细胞系保留改变的表型的方式进行。这些修饰的细胞和子代可以是多细胞生物例如植物或动物的部分,其中在离体或体内向希望的细胞型应用CRISPR系统。CRISPR发明可以是治疗性处理方法。该治疗的疗法可以包括基因或基因组编辑、或基因疗法。
用CRISPR Cas系统或复合物(例如,C2c2-RNA复合物)修饰靶标
在一个方面,本发明提供了修饰真核细胞中的靶多核苷酸的方法,这些方法可以在体内、离体或在体外。在一些实施例中,该方法包括对来自人或非人动物的细胞或细胞群进行取样,并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。该细胞或这些细胞甚至可以被重新引入该非人动物或植物中。对于重新引入的细胞,特别优选的是这些细胞是干细胞。
在一些实施例中,该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割,由此修饰该靶多核苷酸,其中该CRISPR复合物包含与指导序列复合的CRISPR效应蛋白,该指导序列可以与所述靶多核苷酸内的靶序列杂交或可与其杂交。
在一个方面,本发明提供了修饰多核苷酸在真核细胞中的表达的方法。在一些实施例中,该方法包括允许CRISPR复合物结合到该多核苷酸上,这样使得所述结合导致所述多核苷酸的表达增加或降低;其中CRISPR复合物包含与指导序列复合的CRISPR效应蛋白,该指导序列与所述多核苷酸内的靶序列杂交或可与其杂交。类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。事实上,这些取样、培养和重新引入选择跨本发明的多个方面而适用。
的确,在本发明的任何方面,该CRISPR复合物可以包含与指导序列复合的CRISPR效应蛋白,该指导序列与靶序列杂交或可与其杂交。类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。
因此,本文描述的任何非天然存在的CRISPR效应蛋白包含至少一种修饰,并且其中效应蛋白具有某些改进的能力。具体而言,这些效应蛋白中的任一种能够与指导RNA形成CRISPR复合物。当这种复合物形成时,该指导RNA能够结合至靶多核苷酸序列上,并且该效应蛋白能够改变靶基因座。此外,与未修饰的酶/效应蛋白相比,在该CRISPR复合物中的效应蛋白具有降低的修饰一个或多个脱靶基因座的能力。
此外,与未修饰的酶相比,本文描述的修饰的CRISPR酶涵盖这样的酶,由此其在CRISPR复合物中该效应蛋白具有增加的修饰一个或多个靶基因座的能力。这种功能可以单独或与降低的修饰一个或多个脱靶位点的能力的上述功能组合提供。任何此类效应蛋白可以被提供为具有对如本文描述的CRISPR效应蛋白的任一种另外修饰,例如与由一种或多种相关异源功能结构域提供的任何活性、用以降低核酸酶活性的任何另外突变等相组合。
在本发明的有利的实施例中,经修饰的CRISPR效应蛋白被提供为与未修饰的酶/效应蛋白相比具有降低的修饰一个或多个脱靶位点的能力,并且与未修饰的酶/效应蛋白相比具有增加的修饰一个或多个靶基因座的能力。与对效应蛋白的另外修饰相组合,可以实现显著增强特异性。例如,提供了此类有利实施例与一种或多种另外的突变的组合,其中该一种或多种另外的突变是在一个或多个催化活性结构域中。在此类效应蛋白中,可以由于在效应蛋白活性方面改进的特异性实现增强的特异性。
可以被工程化到如本文描述的经修饰的CRISPR效应蛋白中的另外的功能性包括以下这些。1.修饰的CRISPR效应蛋白破坏RNA:蛋白质相互作用而不影响蛋白质三级或二级结构。这包括接触RNA:RNA双链体任何部分的残基。2.经修饰的CRISPR效应蛋白,其弱化蛋白质内相互作用,这些蛋白质内相互作用使C2c2保持响应于RNA结合(靶标或脱靶)的核酸酶切割所必需的构象。例如:轻度抑制但仍然允许HNH结构域(定位在易切断的磷酸酯处)的核酸酶构象的修饰。3.经修饰的CRISPR效应蛋白,其强化蛋白质内相互作用,这些蛋白质内相互作用使C2c2保持对响应于RNA结合(靶标或脱靶)的核酸酶活性进行抑制的构象。例如:将HNH结构域稳定在远离易切断的磷酸酯的构象中的修饰。任何这种功能增强可以提供为与如本文其他地方详细描述的对CRISPR效应蛋白的任何其他修饰相组合。
可以对任何CRISPR效应蛋白(如C2c2效应蛋白)进行任何本文所述的改进的功能性。然而,应当理解的是本文描述的任何功能性可以被工程化到来自其他直向同源物的C2c2效应蛋白中,包括包含来自多种直向同源物的片段的嵌合效应蛋白。
本发明使用核酸来结合靶DNA序列。这是有利的,因为产生核酸比产生蛋白质容易且价廉得多,并且特异性可以根据其中寻求同源性的拉伸长度而变化。例如多指的复杂3-D复杂定位是不需要的。术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换地使用。它们是指具有任何长度的核苷酸的聚合形式,是脱氧核糖核苷酸或核糖核苷酸、或其类似物。多核苷酸可具有任何三维结构,并且可以执行已知或未知的任何功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、根据连接分析定义的多个基因座(一个基因座)、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针以及引物。该术语还涵盖具有合成骨架的核酸-样结构,参见例如,Eckstein,1991;Baserga等人,1992;Milligan,1993;WO 97/03211;WO 96/39154;Mata,1997;Strauss-Soukup,1997;和Samstag,1996。多核苷酸可以包含一个或多个经修饰的核苷酸,如甲基化的核苷酸和核苷酸类似物。如果存在,可以在聚合物组装之前或之后进行核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合后,如通过与标记的组分缀合来进一步修饰。如本文使用的术语“野生型”是本领域技术人员所理解的术语,并且表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征。“野生型”可以是基线。如本文使用的术语“变体”应当被理解为表示具有衍生自在自然界中存在的模式的性质的展示。术语“非天然存在的”或“工程化的”可互换地使用并且表面人工的参与。这些术语,当指核酸分子或多肽时,表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。“互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克碱基配对或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可以与第二核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个之中有5、6、7、8、9、10个即为50%、60%、70%、80%、90%和100%互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。如本文使用的“基本上互补”是指在一个具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少为60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互补程度,或者是指在严格条件下杂交的两个核酸。如本文使用的对于杂交的“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。一般而言,该序列越长,则该序列特异性地杂交到其靶序列上的温度就越高。严格条件的非限制性实例详细描述于Tijssen(1993),Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part I,Second Chapter[生物化学和分子生物学中的实验室技术-核酸探针杂交第I部分第二章]“Overview of principles ofhybridization and the strategy of nucleic acid probe assay[杂交原理概述和核酸探针分析策略]”,爱思唯尔(Elsevier),纽约。在提及一个多核苷酸序列时,那么也设想了互补的或部分互补的序列。能够在高严格条件下杂交到参考序列上的这些序列是优选的。通常,为了使杂交率最大化,选择相对低严格性的杂交条件:比热熔点(Tm)低约20℃至25℃。Tm是50%的特异性靶序列在具有规定的离子强度和pH的溶液中杂交到完全互补的探针上的温度。通常,为了要求杂交序列的至少约85%的核苷酸互补性,高严格洗涤条件被选择为低于Tm约5℃到15℃。为了要求杂交序列的至少约70%的核苷酸互补性,中等严格洗涤条件被选择为低于Tm约15℃到30℃。高容许(极低严格性)洗涤条件可以低至在Tm之下50℃,从而允许在杂交序列之间的高水平错配。本领域技术人员将认识到,在杂交和洗涤阶段中的其他物理和化学参数也可以改变,从而影响来自在靶序列与探针序列之间的特定同源性水平的可检测杂交信号的结果。优选的高严格条件包括在50%甲酰胺、5×SSC、和1%SDS中在42℃孵育,或者在5×SSC和1%SDS中在65℃孵育,在0.2×SSC和0.1%SDS中在65℃洗涤。“杂交”是指其中一个或多个多核苷酸反应形成一种复合物的反应,该复合物经由这些核苷酸残基之间的碱基的氢键键合而稳定化。氢键键合可以借助于沃森-克里克碱基配对、Hoogstein结合或以任何其他序列特异性方式而发生。该复合物可包含形成一个双链体的两条链、形成多链复合物的三条或多条链、单个自我杂交链、或这些的任何组合。杂交反应可以构成更广泛的过程(如PCR的开始、或经由一种酶的多核苷酸的切割)中的步骤。能够与给定序列杂交的序列被称为该给定序列的“互补物”。如本文使用的,术语“基因组基因座(locus)”或“基因座(locus)”(复数是基因座(loci))是在染色体上的基因或DNA序列的特定位置。“基因”是指编码多肽或RNA链的DNA或RNA的段(stretch),其在生物中发挥功能作用并且因此是活生物遗传的分子单元。出于本发明的目的,可以考虑包括调节基因产物的产生的区域的基因,而不论这样的调节序列是否接近编码和/或转录的序列。因此,基因包括而不必限于,启动子序列、终止子、翻译调节序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、隔离子、边界元件、复制起点、核基质附着位点和基因座控制区。如本文使用的“基因组基因座的表达”或“基因表达”是藉此在功能性基因产物的合成中使用来自基因的信息的过程。基因表达的产物常常是蛋白质,但是在非蛋白质编码基因如rRNA基因或tRNA基因中,产物是功能性RNA。基因表达的过程由所有已知的生物利用-产生功能性产物以便存活的真核生物(包括多细胞生物)、原核生物(细菌和古细菌)以及病毒。如本文使用的基因或核酸的“表达”不仅涵盖细胞基因表达,而且涵盖在克隆系统中或在任何其他背景下的一个或多个核酸的转录和翻译。如本文使用的“表达”是指藉此从DNA模板转录成多核苷酸(如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组DNA,表达可以包括真核细胞中mRNA的剪接。术语“多肽”、“肽”和“蛋白质”在本文可互换地使用,是指具有任何长度的氨基酸的聚合物。所述聚合物可为直链型或分支型,其可包含经过修饰的氨基酸,并且其可由非氨基酸中断。这些术语还涵盖已经被修饰的氨基酸聚合物;这些修饰例如二硫键形成、糖基化、脂化(lipidation)、乙酰化、磷酸化或任何其他操纵,如与标记组分的缀合。如本文使用的术语“氨基酸”包括天然的和/或非天然的或者合成的氨基酸,包括甘氨酸以及D和L旋光异构体、以及氨基酸类似物和肽模拟物。如本文使用的,术语“结构域”或“蛋白质结构域”是指可以独立于该蛋白质链的其余部分而存在并且起作用的蛋白质序列的一部分。正如在本发明的多个方面所描述,序列同一性与序列同源性有关。可以通过肉眼、更通常地借助于可得的序列比较程序来进行同源性比较。这些可商购的计算机程序可以计算在两个或更多个序列之间的同源性的百分比(%)并且还可以计算由两个或更多个氨基酸或核酸序列共享的序列同一性。
在本发明的多个方面,术语“指导RNA”是指包含以下中的一种或多种的多核苷酸序列:假定或鉴定的tracr序列和假定或鉴定的crRNA序列或指导序列。在具体的实施例中,“指导RNA”包含假定或鉴别的crRNA序列或指导序列。在另外的实施例中,该指导RNA不包含假定或鉴定的tracr序列。
如本文使用的术语“野生型”是本领域技术人员所理解的术语,并且表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征。“野生型”可以是基线。
如本文使用的术语“变体”应当被理解为表示具有衍生自在自然界中存在的模式的性质的展示。
术语“非天然存在的”或“工程化的”可互换地使用并且表面人工的参与。这些术语,当指核酸分子或多肽时,表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。在所有方面和实施例中,无论它们是否包括这些术语,将理解的是,优选地,可以是任选的并且由此是优选包括的或不是优选不包括的。此外,术语“非天然存在的”和“工程化”可以互换地使用,并且因此可以单独或组合使用,并且一者或另一者可以替代两种一起的提及。具体地,“工程化”优选替代“非天然存在的”或“非天然存在的和/或工程化的”。
可以通过本领域已知的许多计算机程序(例如BLAST或FASTA等)来生成序列同源性。用于进行这样的比对的适合的计算机程序是GCG威斯康星Bestfit软件包(威斯康星大学,美国;Devereux等人,1984,Nucleic Acids Research[核酸研究]12:387)。可以进行序列比较的其他软件的实例包括但不限于BLAST软件包(参见Ausubel等人,1999,出处同上–第18章)、FAST(AAtschul等人,1990,J.Mol.Biol.[分子生物学杂志],403-410)以及GENEWORKS系列比较工具。BLAST和FASTA均可用于离线和在线搜索(参见Ausubel等人,1999,出处同上,第7-58页到7-60页)。然而,优选使用GCG Bestfit程序。可以计算在连续序列上的序列同源性百分比(%),即,将一个序列与另一个序列比对,并且将一个序列中的每个氨基酸或核苷酸与另一个序列中的相应氨基酸或核苷酸直接进行比较,一次比较一个残基。这被称为“无空位”比对。典型地,这样的无空位比对仅仅在较少数目的残基上进行。虽然这是一种非常简单和一致的方法,但是它未能考虑的是,例如,在其他方面完全相同的序列对中,一个插入或缺失可以引起随后的氨基酸残基被排除在比对之外,因此当进行全局比对时可能导致在同源性%上的大幅降低。因此,大多数序列比较方法被设计为产生考虑到可能的插入和缺失的优化比对,而没有过度地使总体同源性或同一性评分不利。这是通过在序列比对中插入“空位”来实现的,以便试图将局部同源性或同一性最大化。然而,这些更复杂的方法向出现在该比对中的每个空位分配“空位罚分”,从而对于相同数目的一致的氨基酸而言,具有尽可能少的空位的序列比对-反映了在这两个比较的序列之间的更高关联性-可以比具有许多空位者实现更高的得分。“亲合空位成本”(“affinity gap cost”)典型地用于对空位的存在要求相对高的成本并对空位中的每个后续残基施加较小的罚分。这是最常用的空位评分系统。高空位罚分当然将产生具有更少空位的最佳比对。大多数比对程序允许修改空位罚分。然而,当使用这种序列比较软件时优选使用默认值。例如当使用GCG威斯康星Bestfit软件包时,氨基酸序列的默认空位罚分为对于每个空位的-12,以及对于每个延伸的-4。因此计算最大同源性%首先要求产生最佳比对,考虑空位罚分。用于进行这样的比对的适合的计算机程序是GCG威斯康星Bestfit软件包(Devereux等人,1984Nuc.Acids Research[核酸研究]12第387页)。可以进行序列比较的其他软件的实例包括但不限于BLAST软件包(参见Ausubel等人,1999Short Protocols in MolecularBiology[精编分子生物学实验指南],第4版–第18章)、FASTA(Altschul等人,1990J.Mol.Biol.[分子生物学杂志]403-410)以及GENEWORKS系列比较工具。BLAST和FASTA均可用于离线和在线搜索(参见Ausubel等人,1999,Short Protocols in MolecularBiology[精编分子生物学实验指南],第7-58页到7-60页)。然而,对于一些应用,优选使用GCG Bestfit程序。一种新的工具(称为BLAST 2序列)也可用于比较蛋白质和核苷酸序列(参见FEMS Microbiol Lett.[欧洲微生物学会联合会微生物学快报]1999 174(2):247-50;FEMS Microbiol Lett.[欧洲微生物学会联合会微生物学快报]1999 177(1):187-8以及在国立卫生研究院的网址的国家生物技术信息中心的网址)。虽然最终同源性%可以按照同一性进行测量,但是比对过程自身典型地不是基于全或无配对比较(all-or-nothingpair comparison)。相反,通常使用尺度相似性评分矩阵(scaled similarity scorematrix),基于化学相似性或进化距离对各个成对比较评分。通常使用的这种矩阵的实例为BLOSUM62矩阵-BLAST系列程序的默认矩阵。GCG威斯康星程序通常使用公开的默认值或自定义符号比较表(更多细节详见用户手册)。对于一些应用,优选使用GCG软件包的公共默认值,或在其他软件情况下的默认矩阵,如BLOSUM62。可替代地,可以基于类似于CLUSTAL(Higgins DG和Sharp PM(1988),Gene[基因]73(1),237-244)的一种算法,使用在DNASISTM(日立软件公司(Hitachi Software))中的多重比对特征来计算同源性百分比。一旦软件已经产生最佳比对,就有可能计算同源性%,优选序列同一性%。软件典型地这样进行,作为序列比较的一部分,并且生成数字结果。这些序列也可以具有氨基酸残基的缺失、插入或取代,其产生沉默变化并生成功能上等同的物质。可以基于氨基酸特性(如残基的极性、电荷、可溶性、疏水性、亲水性、和/或两亲性)的相似性做出有意氨基酸取代,并且因此它在将氨基酸集合成官能团中是有用的。可以仅仅基于氨基酸的侧链特性将它们集合在一起。然而,包括突变数据同样是更有用的。出于结构原因,如此衍生的氨基酸的集合很有可能是保守性的。这些集合可以被描述为文氏图(Venn diagram)形式(Livingstone C.D.和BartonG.J.(1993)“Protein sequence alignments:a strategy for the hierarchicalanalysis of residue conservation[蛋白质序列比对:用于残基保守性的分级分析的策略]”Comput.Appl.Biosci.[计算与应用物科学]9:745-756)(Taylor W.R.(1986)“Theclassification of amino acid conservation[氨基酸保守性的分类]”J.Theor.Biol.[理论生物学杂志]119;205-218)。例如可以根据下表做出保守性取代,该表描述了普遍接受的氨基酸的文氏图分组。
术语“受试者”、“个体”和“患者”在本文中是可互换地使用的,指的是脊椎动物,优选地是哺乳动物,更加优选地是人类。哺乳动物包括但不限于鼠、猴、人、农畜、体育用动物和宠物。也包括体内获得或体外培养的生物实体的组织、细胞及其子代。
术语“治疗剂(therapeutic agent)”、“可用于治疗的试剂(therapeutic capableagent)”或“处理剂(treatment agent)”是可互换地使用的,并且是指在给予受试者时赋予某种有益影响的一种分子或化合物。该有益影响包括诊断确定的实现;改善疾病、症状、障碍、或病理学病况;减少或预防疾病、症状、障碍或病况的发作;以及总体上对抗疾病、症状、障碍或病理学病况。
如本文使用的,“治疗(treatment)”或“进行治疗(treating)”或“减轻”或“改善”是可互换地使用的。这些术语是指如下途径,该途径用于获得有益或希望的结果,包括但不限于治疗益处和/或预防益处。治疗益处意指治疗中的一种或多种疾病、病况、或症状上的任何治疗上相关的改进或对其的影响。对于预防益处,该组合物可给予至处于发展具体的疾病、病况、或症状的风险的受试者,或给予至报告了疾病的一个或多个生理学症状的受试者,尽管该疾病、病况、或症状可能还没有体现出来。
术语“有效量”或“治疗有效量”是指一种药剂的足以实现有益或希望的结果的量。治疗有效量可依赖于正治疗的受试者和疾病病状、受试者的重量和年龄、疾病病况的严重度、给药方式等中一项或多个而改变,并可以由本领域普通技术人员容易地确定。该术语也适用通过此处描述的显像方法中的任一项提供一种检测用图像的一个剂量。具体剂量可依赖于以下中一个或多个而变化:所选择的具体药剂、所遵循的给药方案、是否与其他化合物组合给予、给予时间、待显像的组织、以及携带它的物理递送系统。
除非另有说明,本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术,这些在本领域的技能之内。参见Sambrook,Fritsch和Maniatis,MOLECULAR CLONING:A LABORATORY MANUAL[分子克隆:实验室手册],第2版(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY[当代分子生物学实验手册](F.M.Ausubel等人编辑,(1987));系列丛书METHODS IN ENZYMOLOGY[酶学方法](学术出版公司(Academic Press,Inc.)):PCR 2:A PRACTICAL APPROACH[PCR 2:实用方法](M.J.MacPherson,B.D.Hames和G.R.Taylor编辑(1995));Harlow和Lane编辑(1988)ANTIBODIES,A LABORATORY MANUAL[抗体:实验室手册];以及ANIMAL CELL CULTURE[动物细胞培养](R.I.Freshney编辑(1987))。
本发明的若干方面涉及包含一种或多种载体的载体系统、或载体本身。载体可以被设计为用于在原核或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白质、或酶)。例如,CRISPR转录物可表达于例如大肠杆菌的细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、或哺乳动物细胞中。适合的宿主细胞进一步讨论于Goeddel,GENE EXPRESSIONTECHNOLOGY:METHODS IN ENZYMOLOGY[基因表达技术:酶学方法]185,Academic Press[学术出版社],圣地亚哥,加利福尼亚州(1990)中。可替代地,重组表达载体可在体外例如使用T7启动子调节序列和T7聚合酶来转录和翻译。
本发明的实施例包括可包含同源取代(本文使用取代和置换两者来表示现有氨基酸残基或核苷酸与替代残基和核苷酸之间的互换)的序列(多核苷酸或多肽两者),该同源取代,即,在氨基酸的情况下发生同类取代(like-for-like substitution),如碱性对碱性、酸性对酸性、极性对极性。也可以发生非同源取代,即,从一类残基到另一类残基,或者可替代地涉及包含非天然氨基酸如鸟氨酸(在下文称为Z)、二氨基丁酸鸟氨酸(在下文称为B)、正亮氨酸鸟氨酸(在下文称为O)、吡啶基丙氨酸、噻吩基丙氨酸、萘基丙氨酸和苯基甘氨酸。变体氨基酸序列可以包括适合的可插入在该序列的任何两个氨基酸残基之间的间隔子基团,包括除了氨基酸间隔子(如甘氨酸或β-丙氨酸残基)之外的烷基基团,如甲基、乙基或丙基基团。又一个变化形式,其涉及处于类肽形式的一个或多个氨基酸残基的存在,也是本领域技术人员熟知的。为避免疑义,“该类肽形式”用来指代变体氨基酸残基,其中该α-碳取代基在该残基的氮原子上,而不是在该α-碳上。用于制备处于该类肽形式的肽的方法是本领域已知的,例如Simon RJ等人,PNAS[美国国家科学院院刊](1992)89(20),9367-9371和Horwell DC,Trends Biotechnol.[生物技术趋势](1995)13(4),132-134。
同源性建模:其他C2c2直向同源物中的相应残基可以通过Zhang等人,2012(Nature[自然];490(7421):556-60)和Chen等人,2015(PLoS Comput Biol[公共科学图书馆·计算生物学];11(5):e1004248)的方法进行鉴定—计算蛋白质-蛋白质相互作用(PPI)方法用以预测由结构域-基序界面介导的相互作用。PrePPI(预测PPI),一种基于结构的PPI预测方法,使用贝叶斯统计框架(Bayesian statistical framework)将结构证据与非结构证据相结合。该方法涉及取一对查询蛋白并使用结构比对以便鉴别与它们实验确定的结构或同源性模型相对应的结构代表。结构比对进一步用来通过考虑全局和局部几何关系来鉴定接近的和远程的结构相邻物。每当结构代表物的两个相邻物形成报告于蛋白质数据库中的复合物,这限定了用于对两个查询蛋白质之间的相互作用进行建模的模板。复合物的模型是通过在模板中将代表性结构叠加在其对应的结构相邻物上来创建。这种方法进一步描述于Dey等人,2013(Prot Sci[蛋白质科学];22:359-66)。
出于本发明的目的,扩增意指利用引物和聚合酶的能够以合理的保真度复制靶序列的任何方法。可以通过天然或重组DNA聚合酶,如TaqGoldTM、T7DNA聚合酶、大肠杆菌DNA聚合酶的Klenow片段以及逆转录酶进行扩增。一种优选的扩增方法是PCR。
在某些方面,本发明涉及载体。如本文使用的,“载体”是允许或促进实体从一个环境转移到另一个环境中的工具。它是复制子,如质粒、噬菌体或粘粒,另一个DNA区段可以插入其中,从而引起该插入的区段的复制。通常,当与适当的控制元件相关联时,载体能够复制。一般而言,术语“载体”是指如下核酸分子,其能够运送与其连接的另一种核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个自由端、无自由端(例如,环状的)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的DNA区段的环状双链DNA环。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒(AAV))的载体中。病毒载体还包括由用于转染到宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被引入的宿主细胞中自主复制。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与宿主基因组一起复制。此外,某些载体能够指导它们操作性地连接的基因的表达。此类载体在本文称为“表达载体”。在重组DNA技术中使用的常见表达载体通常呈质粒形式。
重组表达载体可以包含呈适合于在宿主细胞中表达核酸的形式的本发明的核酸,这意味着这些重组表达载体包括基于待用于表达的宿主细胞而选择的一种或多种调节元件,所述调节元件操作性地连接至待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在表示感兴趣的核苷酸序列以允许该核苷酸序列的表达的方式被连接至该一种或多种调节元件(例如,处于体外转录/翻译系统中或当该载体被引入宿主细胞中时,处于该宿主细胞中)。关于重组和克隆方法,提及2004年9月2日以US 2004-0171156 A1公开的美国专利申请10/815,730,将该专利的内容通过引用以其整体并入本文。
本发明的方面涉及用于指导RNA和野生型、修饰的或突变的CRISPR效应蛋白/酶(例如C2c2)的双顺反子载体。优选的是用于指导RNA和野生型、修饰的或突变的CRISPR效应蛋白/酶(例如C2c2)的双顺反子表达载体。通常以及特别是在该实施例中,野生型、修饰的或突变的CRISPR效应蛋白/酶(例如C2c2)优选由CBh启动子驱动。RNA可以优选地由Pol III启动子(如U6启动子)驱动。理想地,将这两者结合。
在一些实施例中,提供了指导RNA中的环。这可以是茎环或四核苷酸环(tetraloop)。该环优选地是GAAA,但是并不限于这个序列或者实际上在长度上仅仅为4bp。实际上,用于在发夹结构中使用的优选环形成序列在长度上为四个核苷酸,并且最优选地具有序列GAAA。然而,可以使用更长或更短的环序列,正如可替代的序列。这些序列优选地包括三联体(例如,AAA)、和另外的核苷酸(例如C或G)。环形成序列的实例包括CAAA和AAAG。
在实践本文披露的任何方法中,可以经由本领域已知的一种或多种方法将适合的载体引入进细胞或胚胎中,这些方法包括但不限于显微注射、电穿孔、声致穿孔、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状聚合物转染、热休克转染、核转染、磁转染、脂转染、刺穿转染(impalefection)、光学转染、专有剂增强的核酸摄取以及经由脂质体、免疫脂质体、病毒颗粒或人工病毒体进行递送。在一些方法中,通过显微注射将该载体引入进胚胎中。可以将这个或这些载体显微注射进胚胎的细胞核或细胞质中。在一些方法中,通过核转染将这个或这些载体引入进细胞中。
术语“调节元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)以及其他表达控制元件(例如,转录终止信号,如多聚腺苷酸化信号和聚U序列)。此类调节元件描述于例如Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY[基因表达技术:酶学方法]185,Academic Press[学术出版社],圣地亚哥,加利福尼亚州(1990年)中。调节元件包括指导核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异性调节序列)。组织特异性启动子可以主要指导在感兴趣的期望组织中的表达,所述组织是例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如,肝、胰腺)或特殊的细胞类型(例如,淋巴细胞)。调节元件还能以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。在一些实施例中,载体包含一个或多个pol III启动子(例如,1、2、3、4、5个或更多个pol III启动子)、一个或多个pol II启动子(例如,1、2、3、4、5个或更多个pol II启动子)、一个或多个pol I启动子(例如,1、2、3、4、5个或更多个pol I启动子)或其组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见例如,Boshart等人,Cell[细胞],41:521-530(1985)]、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。还被术语“调节元件”涵盖的是增强子元件,如WPRE;CMV增强子;在HTLV-I的LTR中的R-U5’区段(Mol.Cell.Biol.[分子细胞生物学],卷8(1),第466-472页,1988);SV40增强子;以及在兔β-珠蛋白的外显子2与3之间的内含子序列(Proc.Natl.Acad.Sci.USA.[美国国家科学院院刊],卷78(3),第1527-31页,1981)。本领域的普通技术人员应当理解的是,表达载体的设计可以取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。载体可以被引入到宿主细胞中而由此产生转录物、蛋白质或肽,包括由如本文描述的核酸编码的融合蛋白或肽(例如,规律间隔成簇短回文重复(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。关于调节序列,提及美国专利申请10/491,026,将其内容通过引用以其整体并入本文。关于启动子,提及PCT公开WO2011/028929和美国申请12/511,940,将其内容通过引用以其整体并入本文。
载体可以被设计为用于在原核或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白质、或酶)。例如,CRISPR转录物可表达于例如大肠杆菌的细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、或哺乳动物细胞中。适合的宿主细胞进一步讨论于Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY[基因表达技术:酶学方法]185,Academic Press[学术出版社],圣地亚哥,加利福尼亚州(1990)中。可替代地,重组表达载体可在体外例如使用T7启动子调节序列和T7聚合酶来转录和翻译。
载体可以被引入原核生物或原核细胞中并且在其中增殖。在一些实施例中,原核生物用来扩增有待引入真核细胞中的载体的多个拷贝,或者作为有待引入真核细胞中的载体的产生中的中间载体(例如,扩增质粒作为病毒载体包装系统的一部分)。在一些实施例中,原核生物用来扩增一个载体的多个拷贝并且表达一种或多种核酸,如提供用于递送到宿主细胞或宿主生物中的一种或多种蛋白质的来源。蛋白质在原核生物中的表达最经常在大肠杆菌中用含有指导融合或非融合蛋白的表达的组成型或诱导型启动子的载体来进行。融合载体将多个氨基酸添加到在其中编码的蛋白质上,如该重组蛋白的氨基端上。这样的融合载体可以用于一个或多个目的,如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解性;以及(iii)通过在亲和纯化中充当配体来辅助重组蛋白的纯化。通常,在融合表达载体中,将蛋白切割位点引入至融合部分与重组蛋白的接合处以使得能够在纯化融合蛋白之后将重组蛋白与融合部分分离。这类酶以及它们的同源识别序列包括因子Xa、凝血酶以及肠激酶。示例性融合表达载体包括pGEX(法玛西亚生物技术有限公司(Pharmacia BiotechInc);Smith和Johnson,1988.Gene[基因]67:31-40)、pMAL(新英格兰生物实验室(NewEngland Biolabs),贝弗利(Beverly),马萨诸塞州)以及pRIT5(法玛西亚公司,皮斯卡塔韦,新泽西州),它们分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A融合至靶重组蛋白。
适合的诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amrann等人,(1988)Gene[基因]69:301-315)以及pET 11d(Studier等人,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY[基因表达技术:酶学方法]185,Academic Press[学术出版社],圣地亚哥,加利福尼亚州(1990)60-89)。
在一些实施例中,载体是酵母表达载体。用于在酵母酿酒酵母(Saccharomycescerivisae)中表达的载体的实例包括pYepSec1(Baldari等人,1987.EMBO J.[欧洲分子生物学学会杂志]6:229-234)、pMFa(Kuijan和Herskowitz,1982.Cell[细胞]30:933-943)、pJRY88(Schultz等人,1987.Gene[基因]54:113-123)、pYES2(英杰公司(InvitrogenCorporation),圣地亚哥,加利福尼亚州)以及picZ(英杰公司,圣地亚哥,加利福尼亚州)。
在一些实施例中,使用杆状病毒载体,载体驱动昆虫细胞中的蛋白质表达。可用于在培养的昆虫细胞(例如,SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(Smith等人,1983.Mol.Cell.Biol.[分子细胞生物学]3:2156-2165)和pVL系列(Lucklow和Summers,1989.Virology[病毒学]170:31-39)。
在一些实施例中,使用哺乳动物表达载体,载体能够驱动一种或多种序列在哺乳动物细胞中表达。哺乳动物表达载体的实例包括pCDM8(Seed,1987.Nature[自然]329:840)和pMT2PC(Kaufman等人,1987.EMBO J.[欧洲分子生物学学会杂志]6:187-195)。当用于哺乳动物细胞中时,表达载体的控制功能典型地由一种或多种调节元件提供。例如,常用的启动子来源于多瘤、腺病毒2、巨细胞病毒、猿猴病毒40、以及本文所述和本领域已知的其他病毒。对于用于原核细胞和真核细胞两者的其他适合的表达系统,参见例如Sambrook等人,MOLECULAR CLONING:A LABORATORY MANUAL.[分子克隆:实验室手册]第2版的第16和第17章,冷泉港实验室(Cold Spring Harbor Laboratory),冷泉港实验室出版社(Cold SpringHarbor Laboratory Press),冷泉港(Cold Spring Harbor),纽约,1989。
在一些实施例中,重组哺乳动物表达载体能够指导核酸优先在特定细胞类型中表达(例如,使用组织特异性调节元件来表达核酸)。组织特异性调节元件在本领域是已知的。适合的组织特异性启动子的非限制性实例包括白蛋白启动子(肝脏特异性的;Pinkert等人,1987.Genes Dev.[基因与发育]1:268-277);淋巴特异性启动子(Calame和Eaton,1988.Adv.Immunol.[免疫学进展]43:235-275),特别是T细胞受体(Winoto和Baltimore,1989.EMBO J.[欧洲分子生物学学会杂志]8:729-733)和免疫球蛋白(Baneiji等人,1983.Cell[细胞]33:729-740;Queen和Baltimore,1983.Cell[细胞]33:741-748)的启动子;神经元特异性启动子(例如,神经丝启动子;Byrne和Ruddle,1989.Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:5473-5477);胰腺特异性启动子(Edlund等人,1985.Science[科学]230:912-916)和乳腺特异性启动子(例如,乳清启动子;美国专利号4,873,316和欧洲申请公开号264,166)。还涵盖发育调节启动子,例如,鼠同源框蛋白(hox)启动子(Kessel和Gruss,1990.Science[科学]249:374-379)和α-甲胎蛋白启动子(Campes和Tilghman,1989.Genes Dev.[基因与发育]3:537-546)。关于这些原核和真核载体,提及美国专利6,750,059,将其内容通过引用以其整体并入本文。本发明的其他实施例可以涉及病毒载体的使用,关于它提及美国专利申请13/092,085,将其内容通过引用以其整体并入本文。组织特异性调节元件在本领域是已知的,并且在这方面提及美国专利7,776,321,将其通过引用以其整体并入本文。
在一些实施例中,调节元件可操作地连接至CRISPR系统的一种或多种元件,从而驱动该CRISPR系统的该一种或多种元件的表达。一般而言,CRISPR(规律间隔成簇短回文重复)(也称为SPIDR(间隔子间隔开的同向重复))构成通常对于特定细菌物种而言特异性的DNA基因座的家族。该CRISPR基因座包含不同类的在大肠杆菌中被识别的间隔开的短序列重复(SSR)(Ishino等人,J.Bacteriol.[细菌学杂志],169:5429-5433[1987];和Nakata等人,J.Bacteriol.[细菌学杂志],171:3553-3556[1989])以及相关基因。类似的间隔开的SSR已经鉴定于地中海富盐菌(Haloferax mediterranei)、化脓链球菌(Streptococcuspyogenes)、鱼腥藻属(Anabaena)和结核分枝杆菌(Mycobacterium tuberculosis)中(参见,Groenen等人,Mol.Microbiol.[分子微生物学],10:1057-1065[1993];Hoe等人,Emerg.Infect.Dis.[新发传染病],5:254-263[1999];Masepohl等人,Biochim.Biophys.Acta[生物化学与生物物理学学报]1307:26-30[1996];以及Mojica等人,Mol.Microbiol.[分子微生物学],17:85-93[1995])。这些CRISPR基因座典型地不同于其他SSR的重复结构,这些重复已被称为规律间隔的短重复(SRSR)(Janssen等人,OMICSJ.Integ.Biol.[OMICS:整合生物学杂志],6:23-33[2002];以及Mojica等人,Mol.Microbiol.[分子微生物学],36:244-246[2000])。一般而言,这些重复是以簇存在的短元件,其被具有基本上恒定长度的独特间插序列规律地间隔开(Mojica等人,[2000],同上)。虽然重复序列在菌株之间是高度保守的,许多间隔开的重复和这些间隔子区的序列一般在菌株与菌株之间不同(van Embden等人,J.Bacteriol.[细菌学杂志],182:2393-2401[2000])。已经在40种以上的原核生物中鉴定出CRISPR基因座(参见例如,Jansen等人,Mol.Microbiol.[分子微生物学],43:1565-1575[2002];以及等人,[2005]),包括但不限于:气火菌属(Aeropyrum)、热棒菌属(Pyrobaculum)、硫化叶菌属(Sulfolobus)、古球菌属(Archaeoglobus)、盐盒菌属(Halocarcula)、甲烷杆菌属(Methanobacterium)、甲烷球菌属(Methanococcus)、甲烷八叠球菌属(Methanosarcina)、甲烷火菌属(Methanopyrus)、焦球菌属(Pyrococcus)、嗜酸菌属(Picrophilus)、热原体属(Thermoplasma)、棒状杆菌属(Corynebacterium)、分枝杆菌属(Mycobacterium)、链霉菌属(Streptomyces)、产水菌属(Aquifex)、卟啉单胞菌属、绿菌属(Chlorobium)、栖热菌属(Thermus)、芽孢杆菌属、李斯特菌属、葡萄球菌属、梭菌属、好热厌氧杆菌属(Thermoanaerobacter)、支原体属、梭杆菌属(Fusobacterium)、固氮弓菌属(Azarcus)、色杆菌属(Chromobacterium)、奈瑟菌属、亚硝化单胞菌属(Nitrosomonas)、脱硫弧菌属、地杆菌属(Geobacter)、粘球菌属(Myxococcus)、弯曲杆菌属、类杆菌属(Wolinella)、不动杆菌属(Acinetobacter)、欧文菌属(Erwinia)、埃希菌属(Escherichia)、军团菌属、甲基球菌属(Methylococcus)、巴斯德菌属(Pasteurella)、发光细菌属(Photobacterium)、沙门菌属(Salmonella)、黄单胞菌属(Xanthomonas)、耶尔森菌属(Yersinia)、密螺旋体属以及栖热袍菌属(Thermotoga)。
一般而言,如在本申请中使用的“核酸靶向系统”共同地指代在表达或指导核酸靶向CRISPR-相关(“Cas”)基因(在本文还称为效应蛋白)的活性中涉及的转录物和其他元件,包括编码核酸靶向Cas(效应物)蛋白和指导RNA(包含crRNA序列和反式活化CRISPR/Cas系统RNA(tracrRNA)序列)的序列、或其他序列以及来自核酸靶向CRISPR基因座的转录物。在一些实施例中,核酸靶向系统的一种或多种元件衍生自V型/VI型核酸靶向CRISPR系统。在一些实施例中,核酸靶向系统的一种或多种元件来源于包含内源核酸靶向CRISPR系统的特殊生物,如化脓链球菌。一般而言,核酸靶向系统表征为促进靶向核酸的复合物在靶序列的位点处形成的元件。在靶向核酸的复合物形成的背景下,“靶序列”是指指导序列被设计为对其具有互补性的序列,其中在靶序列与指导RNA之间的杂交促进DNA或RNA靶向复合物的形成。完全互补性不是必需的,条件是存在足够互补性以引起杂交并且促进靶向核酸的复合物的形成。靶序列可以包含RNA多核苷酸。在一些实施例中,靶序列位于细胞的细胞核或细胞质中。在一些实施例中,该靶序列可以位于真核细胞的细胞器(例如,线粒体或叶绿体)内。可被用于重组到包含该靶序列的靶基因座中的序列或模板被称为“编辑模板”或“编辑RNA”或“编辑序列”。在本发明的方面,外源的模板RNA可称为编辑模板。在本发明的一个方面,该重组是同源重组。
典型地,在内源核酸靶向系统的背景下,靶向核酸的复合物(包含杂交到靶序列上并且与一种或多种核酸靶向效应蛋白复合的指导RNA)的形成导致在该靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50个或更多个碱基对之内)的一条链或两条RNA链的切割。在一些实施例中,将驱动靶向核酸的系统的一种或多种元件的表达的一种或多种载体引入宿主细胞中,使得靶向核酸的该系统的这些元件的表达在一个或多个靶位点指导靶向核酸的复合物的形成。例如,核酸靶向效应蛋白和指导RNA可以各自可操作地连接到在分开的载体上的单独的调节元件。可替代地,从相同或不同调节元件表达的两种或更多种元件可以结合在单一载体中,其中提供该核酸靶向系统的任何组分的一种或多种另外的载体不包括在该第一载体中。结合在单一载体中的靶向核酸的系统元件可以按照任何适合的方向排列,如一种元件相对于第二元件位于5'(“上游”)或3'(“下游”)。一种元件的编码序列可以位于第二元件的编码序列的同一条链或相对链上,并且方向为相同或相对的方向。在一些实施例中,单一启动子驱动编码核酸靶向效应蛋白和指导RNA的转录物的表达,该指导RNA嵌入在一个或多个内含子序列中(例如,各自处于不同内含子中,两个或更多个处于至少一个内含子中,或全部处于单一内含子中)。在一些实施例中,核酸靶向效应蛋白和指导RNA可操作地连接至相同的启动子上并且从其表达。
一般而言,指导序列是与靶多核苷酸序列具有足够互补性以便与该靶序列杂交并且指导靶向核酸的复合物与该靶序列的序列特异性结合的任何多核苷酸序列。在一些实施例中,当使用适合的比对算法进行最佳比对时,在指导序列与其相应的靶序列之间的互补程度是约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对,其非限制性实例包括史密斯-沃特曼算法、尼德曼-翁施算法、基于伯罗斯-惠勒变换的算法(例如伯罗斯-惠勒比对工具)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技术公司)、ELAND(亿明达公司,圣地亚哥,加利福尼亚州)、SOAP(在soap.genomics.org.cn可获得)以及Maq(在maq.sourceforge.net可获得)。在一些实施例中,指导序列在长度上为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多的核苷酸。在一些实施例中,指导序列在长度上为少于约75、50、45、40、35、30、25、20、15、12个或更少的核苷酸。可以通过任何适合的测定法来评估指导序列指导靶向核酸的复合物与靶序列的序列特异性结合的能力。例如,足以形成靶向核酸的复合物的核酸靶向系统的组分,包括有待测试的指导序列在内,可以例如通过用编码该核酸靶CRISPR向序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中,随后通过如本文所述的Surveyor测定来评估在该靶序列之内或附近的优先切割。类似地,通过提供该靶序列、包括有待测试的指导序列在内的靶向核酸的复合物的组分、和不同于该测试指导序列的对照指导序列,并且比较在该测试指导序列与该对照指导序列反应之间的靶序列处或附近的结合或切割率,可以在试管中评估靶多核苷酸序列(或在其附近的序列)的切割。其他测定法是可能的,并且将由本领域技术人员想到。
指导序列可以被选择为靶向任何靶序列。在一些实施例中,该靶序列是在基因转录物或mRNA内的序列。
在一些实施例中,该靶序列是在细胞的基因组内的序列。
在一些实施例中,指导序列被选择为降低在该指导序列内的二级结构程度。可以通过任何适合的多核苷酸折叠算法来确定二级结构。一些算法是基于计算最小吉布斯自由能。一种这样的算法的实例是mFold,如Zuker和Stiegler(Nucleic Acids Res.[核酸研究]9(1981),133-148)所描述。折叠算法的另一个实例是使用质心结构预测算法的由维也纳大学的理论化学研究所(研发的在线网络服务器RNAfold(参见例如,A.R.Gruber等人,2008,Cell[细胞]106(1):23-24;以及PA Carr和GM Church,2009,Nature Biotechnology[自然生物技术]27(12):1151-62)。另外的算法可以发现于通过引用并入本文的美国申请序列号TBA(代理人案号44790.11.2022;博德参考号BI-2013/004A)中。
在一些实施例中,该核酸靶向效应蛋白是包含一个或多个异源蛋白结构域(例如除了该核酸靶向效应蛋白之外的约或多于约1、2、3、4、5、6、7、8、9、10个或更多个结构域)的融合蛋白的一部分。在一些实施例中,该CRISPR效应蛋白/酶是包含一个或多个异源蛋白结构域(例如除了该CRISPR酶之外的约或多于约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个结构域)的融合蛋白的一部分。CRISPR效应蛋白/酶融合蛋白可以包含任何其他蛋白质、以及任选地在任何两个结构域之间的连接序列。可以融合到效应蛋白上的蛋白质结构域的实例包括但不限于表位标签、报告基因序列、以及具有下列活性的一者或多者的蛋白质结构域:甲基化酶活性、脱甲基化酶活性、转录活化活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感病毒血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报告基因的实例包括但不限于谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、以及包括蓝色荧光蛋白(BFP)的自发荧光蛋白。核酸靶向效应蛋白可以融合到编码蛋白质或蛋白质片段的基因序列上,所述蛋白质或蛋白质片段结合DNA分子或结合其他细胞分子,其包括但不限于麦芽糖结合蛋白(MBP)、S-tag、Lex A DNA结合结构域(DBD)融合物、GAL4DNA结合结构域融合物以及单纯疱疹病毒(HSV)BP16蛋白融合物。可以形成包含核酸靶向效应蛋白的融合蛋白的一部分的另外的结构域描述于US 20110059502中,通过引用并入本文。在一些实施例中,使用标记的核酸靶向效应蛋白来鉴定靶序列的位置。
在一些实施例中,CRISPR酶可以形成可诱导系统的组分。该系统的诱导性质将允许该系统利用一种能量形式对基因编辑或基因表达进行时空控制。该能量形式可以包括但不限于电磁辐射、声能、化学能和热能。可诱导系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交体转录活化系统(FKBP、ABA等)或光可诱导系统(光敏素、LOV结构域或隐花色素)。在一个实施例中,该CRISPR酶可以是以序列特异性方式指导转录活性的变化的光诱导的转录效应因子(LITE)。光的组分可以包括CRISPR酶、光响应细胞色素异二聚体(例如,来自拟南芥)以及转录活化/阻遏结构域。可诱导的DNA结合蛋白和它们的使用方法的另外的实例提供于US 61/736465和US 61/721,283和WO 2014/018423和US8889418、US 8895308、US 20140186919、US 20140242700、US 20140273234、US20140335620、WO 2014093635中,将其通过引用以其整体并入本文。
在一些方面,本发明提供了如下方法,这些方法包括向宿主细胞递送一种或多种多核苷酸,如或如本文描述的一种或多种载体、其一种或多种转录物和/或一种或多种自其转录的蛋白。在一些方面,本发明进一步提供了通过这样的方法产生的细胞以及包含这样的细胞或由这样的细胞产生的生物(如动物、植物、或真菌)。在一些实施例中,将与指导RNA组合(并且任选地与其复合)的核酸靶向效应蛋白递送至细胞。可以使用常规的病毒和非病毒基的基因转移方法将核酸引入哺乳动物细胞或靶组织中。可以使用这样的方法向培养物中或宿主生物中的细胞给予编码核酸靶向系统的组分的核酸。非病毒载体递送系统包括DNA质粒、RNA(例如本文描述的载体的转录物)、裸核酸以及与递送媒介(如脂质体)复合的核酸。病毒载体递送系统包括DNA和RNA病毒,在被递送至细胞后它们具有游离型或整合型基因组。关于基因疗法程序的综述,参见Anderson,Science[科学]256:808-813(1992);Nabel和Felgner,TIBTECH 11:211-217(1993);Mitani和Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature[自然]357:455-460(1992);Van Brunt,Biotechnology[生物技术]6(10):1149-1154(1988);Vigne,RestorativeNeurology and Neuroscience[恢复神经学和神经科学]8:35-36(1995);Kremer和Perricaudet,British Medical Bulletin[英国医学公报]51(1):31-44(1995);Haddada等人,Current Topics in Microbiology and Immunology[微生物学和免疫学当前主题],Doerfler和(编辑)(1995);以及Yu等人,Gene Therapy[基因疗法]1:13-26(1994)。
核酸的非病毒递送方法包括脂转染、核转染、显微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质:核酸共轭物、裸DNA、人工病毒体以及DNA的试剂增强性摄取。脂转染描述于例如美国专利号5,049,386、4,946,787;和4,897,355中,并且脂转染试剂是商业销售的(例如TransfectamTM和LipofectinTM)。适于多核苷酸的有效的受体识别脂转染的阳离子和中性脂质包括Felgner,WO 91/17424;WO 91/16024的那些。递送可以针对细胞(例如体外或离体给予)或靶组织(例如体内给予)。
脂质:核酸复合物(包括靶向的脂质体,如免疫脂质复合物)的制备是本领域的技术人员熟知的(参见例如,Crystal,Science[科学]270:404-410(1995);Blaese等人,Cancer Gene Ther.[癌症基因疗法]2:291-297(1995);Behr等人,Bioconjugate Chem.[生物共轭化学]5:382-389(1994);Remy等人,Bioconjugate Chem.[生物共轭化学]5:647-654(1994);Gao等人,Gene Therapy[基因疗法]2:710-722(1995);Ahmad等人,Cancer Res.[癌症研究]52:4817-4820(1992);美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028以及4,946,787)。
使用RNA或DNA病毒基的系统递送核酸利用将病毒靶向体内的特定细胞并将病毒有效负荷(payload)运至细胞核中的高度进化的过程。可以将病毒载体直接给予至患者(体内)或可以使用它们在体外处理细胞,并且任选地,可以将修饰的细胞给予至患者(离体)。常规的病毒基的系统可以包括用于基因转移的逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体以及单纯疱疹病毒载体。用逆转录病毒、慢病毒和腺相关病毒基因转移方法整合进宿主基因组中是可能的,这通常导致插入转基因的长期表达。另外,已经在不同细胞类型和靶组织中观察到高转导效率。
可以通过掺入外源包膜蛋白,扩展靶细胞的潜在靶群而改变逆转录病毒的向性。慢病毒载体是能够转导或感染非分裂细胞并典型地产生较高病毒效价的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将依赖于靶组织。逆转录病毒载体由顺式作用长末端重复组成,这些长末端重复具有包装多达6-10kb的外源序列的能力。最低量的顺式作用LTR对于载体的复制和包装而言是足够的,然后使用这些载体将治疗基因整合进靶细胞中,以提供永久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人类免疫缺陷病毒(HIV)及其组合的那些(参见例如,Buchscher等人,J.Virol.[病毒学杂志]66:2731-2739(1992);Johann等人,J.Virol.[病毒学杂志]66:1635-1640(1992);Sommnerfelt等人,Virol.[病毒学]176:58-59(1990);Wilson等人,J.Virol.[病毒学杂志]63:2374-2378(1989);Miller等人,J.Virol.[病毒学杂志]65:2220-2224(1991);PCT/US 94/05700)。在瞬时表达是优选的应用中,可以使用腺病毒基系统。腺病毒基载体在许多细胞类型中能够具有非常高的转导效并且无需细胞分裂。用这样的载体,已经获得了较高的效价和表达水平。可以在相对简单的系统中大量地产生此载体。还可以使用腺相关病毒(“AAV”)载体转导具有靶核酸的细胞(例如,在体外产生核酸和肽)以及用于体内和离体基因疗法程序(参见例如,West等人,Virology[病毒学]160:38-47(1987);美国专利号4,797,368;WO 93/24641;Kotin,HumanGene Therapy[人类基因治疗]5:793-801(1994);Muzyczka,J.Clin.Invest.[临床研究杂志]94:1351(1994))。重组AAV载体的构建描述于多个出版物中,包括美国专利号5,173,414;Tratschin等人,Mol.Cell.Biol.[分子与细胞生物学]5:3251-3260(1985);Tratschin等人,Mol.Cell.Biol.[分子与细胞生物学]4:2072-2081(1984);Hermonat和Muzyczka,PNAS[美国国家科学院院刊]81:6466-6470(1984);以及Samulski等人,J.Virol.[病毒学杂志]63:03822-3828(1989)。
遗传以及表观遗传状况的模型
本发明的方法可用于产生可用于模拟和/或研究感兴趣的遗传或表观遗传状况的植物、动物或细胞,例如通过感兴趣的突变模型或疾病模型。如本文使用的,“疾病”是指受试者的疾病、障碍或适应症。例如,可以使用本发明的方法产生以下动物或细胞,该动物或细胞在一个或多个与疾病相关的核酸序列中包含修饰,或以下植物、动物或细胞,一个或多个与疾病相关的核酸序列的表达在该植物、动物或细胞中被改变。这样的核酸序列可以编码疾病相关蛋白序列或可以是疾病相关控制序列。因此,应该理解的是在本发明的实施例中,植物、受试者、患者、生物或细胞可以是非人受试者、患者、生物或细胞。因此,本发明提供了由本发明方法产生的植物、动物或细胞或其子代。该子代可以是产生的植物或动物的克隆或可以通过与同一物种的其他个体杂交而由有性繁殖产生,以在其子代中基因渗入另外的令人希望的性状。在多细胞生物(特别是动物或植物)的情况下,该细胞可以是在体内或离体的。在该细胞处于培养中的情况下,如果满足适当的培养条件并且优选地,如果该细胞适合地适于此目的(例如,干细胞),则可以建立细胞系。还设想了通过本发明产生的细菌细胞系。因此,还设想了细胞系。
在一些方法中,可以使用疾病模型研究突变对动物或细胞的影响以及使用在疾病研究中常用的措施对疾病的发展和/或进展的影响。可替代地,这样的一种疾病模型有用于研究药物活性化合物对疾病的影响。
在一些方法中,可以使用疾病模型评估潜在的基因疗法策略的效力。也就是说,可以将疾病相关基因或多核苷酸进行修饰,这样使得疾病发展和/或进展被抑制或减少。具体而言,该方法包括修饰疾病相关基因或多核苷酸,这样使得产生改变的蛋白质,其结果是,该动物或细胞具有改变的反应。因此,在一些方法中,可以将基因修饰动物与易患该疾病的动物进行比较,这样使得可以评估基因疗法事件的效果。
在另一个实施例中,本发明提供了研发生物活性剂的方法,该生物活性剂调节与疾病基因相关的细胞信号传导事件。该方法包括使测试化合物与细胞接触,该细胞包含一种或多种载体,这一种或多种载体驱动下列一者或多者的表达:CRISPR酶、和连接到指导序列的同向重复序列;并且检测读出的变化,该变化指示与例如包含在该细胞中的疾病基因的突变相关的细胞信号传导事件的减少或增加。
可以与用于筛选细胞功能变化的本发明的方法组合构建细胞模型或动物模型。可以使用这样的一种模型研究由本发明的CRISPR复合物修饰的基因组序列对感兴趣的细胞功能的影响。例如,可以使用细胞功能模型研究修饰的基因组序列对细胞内信号传导或细胞外信号传导的影响。可替代地,可以使用细胞功能模型研究修饰的基因组序列对感知觉的影响。在一些这样的模型中,修饰一个或多个与该模型中的信号传导生化学途径相关的基因组序列。
已经具体研究了若干疾病模型。这些疾病模型包括新生(de novo)自闭症风险基因CHD8、KATNAL2和SCN2A;以及综合征性自闭症(安格曼综合征(Angelman Syndrome))基因UBE3A。这些基因以及所得的自闭症模型当然是优选的,但用于显示本发明的跨基因和对应的模型的广阔的适用性。
可以通过当将测试模型细胞和对照细胞与候选试剂接触时,测定它们之间的对应的基因的mRNA水平差异来确定一个或多个与信号传导生化途径相关的基因组序列的改变的表达。可替代地,通过检测编码的多肽或基因产物的水平差异而确定与信号传导生化途径相关的序列的差异表达。
为了在mRNA转录物或对应的多核苷酸水平上测定试剂诱导的变化,首先根据本领域的标准方法提取包含在样品中的核酸。例如,可以根据陈述于Sambrook等人(1989)中的程序使用各种水解酶分离mRNA或遵循由制造商提供的随附说明书通过核酸结合树脂提取mRNA。然后,根据本领域广泛已知的方法或基于本文示例的方法,通过扩增程序或常规的杂交测定(例如Northern印迹分析)检测包含在提取的核酸样品中的mRNA。
出于本发明的目的,扩增意指利用引物和聚合酶的能够以合理的保真度复制靶序列的任何方法。可以通过天然或重组DNA聚合酶,如TaqGoldTM、T7DNA聚合酶、大肠杆菌DNA聚合酶的Klenow片段以及逆转录酶进行扩增。一种优选的扩增方法是PCR。具体而言,可以使分离的RNA经受逆转录测定,该测定与定量聚合酶链式反应(RT-PCR)耦合,以便定量与信号传导生化途径相关的序列的表达水平。
在扩增测定中可以实时地执行基因表达水平的检测。在一个方面,可以用荧光DNA结合剂直接使扩增产物可视化,这些荧光DNA结合剂包括但不限于DNA嵌入剂和DNA沟结合剂。因为掺入进双链DNA分子中的嵌入剂的量典型地与扩增DNA产物的量成比例,可以常规地通过使用本领域的常规光学系统定量嵌入的染料的荧光而确定扩增产物的量。适于本申请的DNA结合染料包括SYBR绿、SYBR蓝、DAPI、碘化丙锭、Hoeste、SYBR金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄、氟香豆素(fluorcoumanin)、玫瑰树碱、道诺霉素、氯喹、偏端霉素D、色霉素、乙菲啶(homidium)、光辉霉素、多吡啶钌、安曲霉素等。
在另一个方面,可以在扩增反应中利用其他荧光标记物(如序列特异的探针),以促进扩增产物的检测和定量。基于探针的定量扩增依赖于希望的扩增产物的序列特异的检测。它利用荧光的靶标特异的探针(例如,探针),从而导致增加的特异性和敏感性。用于进行基于探针的定量扩增的方法本领域是确立的并且教导于美国专利号5,210,015中。
在又另一个方面,可以使用与以下序列具有序列同源性的杂交探针进行常规的杂交测定,这些序列与信号传导生化途径相关。典型地,在杂交反应中,允许探针和与信号传导生化途径相关的序列形成稳定的复合物,这些序列被包含在来源于测试受试者的生物样品内。本领域的技术人员应该意识到的是,在将反义核酸用作探针核酸的情况下,提供于样品中的靶多核苷酸被选择为与该反义核酸的序列互补。相反地,在核苷酸探针是有义核酸的情况下,该靶多核苷酸被选择为与该有义核酸的序列互补。
可以在不同严格度条件下进行杂交。用于实践本发明的适合的杂交条件是这样的,使得探针和与信号传导生化途径相关的序列之间的识别相互作用既是充分特异的又是充分稳定的。增加杂交反应的严格度的条件在本领域是广泛已知且公开的。参见例如,(Sambrook等人,(1989);Nonradioactive In Situ Hybridization Application Manual[非放射性原位杂交应用手册],宝灵曼公司(Boehringer Mannheim),第2版)。可以使用固定在任何固体支持物上的探针进行杂交测定,所述固体支持物包括但不限于硝化纤维、玻璃、硅以及多种基因阵列。如描述于美国专利号5,445,934中,在高密度基因芯片上执行优选的杂交测定。
对于在杂交测定过程中形成的探针-靶标复合物的常规检测,将核苷酸探针络合至可检测标记上。适于在本发明中使用的可检测标记包括通过光化学、生物化学、光谱学、免疫化学、电学、光学或化学手段可检测的任何组合物。多种多样的适当的可检测标记在本领域是已知的,包括荧光或化学发光标记物、放射性同位素标记物、酶或其他配体。在优选实施例中,可能希望的是利用荧光标记物或酶标签,如地高辛、β-半乳糖苷酶、脲酶、碱性磷酸酶或过氧化物酶、亲和素/生物素复合物。
用于检测或定量杂交强度的检测方法将典型地取决于以上选择的标记物。例如,可以使用照相底片或感光成像仪检测放射性标记物。可以使用检测发射光的光检测器检测并定量荧光标记物。典型地通过为酶提供底物并测量由酶对底物的作用而产生的反应产物来检测酶标记物;并且最后,通过简单地使着色的标记物可视化而检测比色标记物。
还可以通过检查对应的基因产物确定与信号传导生化途径相关的序列的试剂诱导的表达变化。确定蛋白质水平典型地涉及a)使包含在生物样品中的蛋白质与特异性结合到与信号传导生化途径相关的蛋白质上的试剂接触;并且(b)鉴定这样形成的任何试剂:蛋白质复合物。在此实施例的一个方面,特异性结合与信号传导生化途径相关的蛋白质的该试剂是一种抗体,优选单克隆抗体。
通过在将允许在该试剂和与信号传导生化途径相关的蛋白质之间形成复合物的条件下,通过使该试剂与来源于测试样品的与信号传导生化途径相关的蛋白质的样品接触而进行该反应。可以根据本领域中的标准程序直接地或间接地检测复合物的形成。在直接检测方法中,这些试剂提供有可检测标记并且未反应的试剂可以从复合物中除去;由此剩余的标记物的量指示形成的复合物的量。对于这样的方法,优选的是选择即使在严格洗涤条件过程中仍附接至这些试剂上的标记物。优选的是,该标记物不干扰结合反应。在替代方案中,间接检测程序可以使用包含用化学方法或酶方法引入的标记物的试剂。令人希望的标记物通常不干扰所得的试剂:多肽复合物的结合或稳定性。然而,标记物典型地被设计成是用于有效结合并且因此生成可检测的信号的抗体可及的。
适于检测蛋白质水平的多种多样的标记物在本领域是已知的。非限制性实例包括放射性同位素、酶、胶体金属、荧光化合物、生物发光化合物以及化学发光化合物。
可以通过标准定量测定定量在结合反应过程中形成的试剂:多肽复合物的量。如上所示,可以通过仍留在结合位点处的标记物的量直接测量试剂:多肽复合物的形成。在一个替代方案中,测试与信号传导生化途径相关的蛋白质与标记的类似物结合特定试剂上的位点的竞争能力。在此竞争测定中,捕获的标记物的量与存在于测试样品中的与信号传导生化途径相关的蛋白质序列的量成反比。
多种用于蛋白质分析的基于以上概括的总则的技术在本领域是可获得的。它们包括但不限于放射免疫测定、ELISA(酶联免疫放射测定)、“夹层”免疫测定、免疫放射测定、原位免疫测定(使用例如,胶体金、酶或放射性同位素标记物)、western印迹分析、免疫沉淀测定、免疫荧光测定以及SDS-PAGE。
特异性识别或结合到与信号传导生化途径相关的蛋白质上的抗体对于执行前述蛋白质分析而言是优选的。在希望的情况下,可以使用识别特定类型的翻译后修饰(例如,信号传导生化途径诱导的修饰)的抗体。翻译后修饰包括但不限于糖基化、脂化、乙酰化以及磷酸化。这些抗体可以购自商业供应商。例如,特异性识别酪氨酸磷酸化蛋白质的抗磷酸酪氨酸抗体可以获得自多个供应商,包括英杰公司和珀金埃尔默公司(Perkin Elmer)。抗磷酸酪氨酸抗体在检测响应于ER应激而在其酪氨酸残基上存在差异磷酸化的蛋白质中是特别有用的。这样的蛋白质包括但不限于真核翻译起始因子2α(eIF-2α)。可替代地,可以通过用展示出希望的翻译后修饰的靶蛋白免疫宿主动物或抗体产生细胞而使用常规的多克隆或单克隆抗体技术产生这些抗体。
在实践主题方法中,可以令人希望的是,在不同身体组织中、在不同细胞类型中和/或在不同亚细胞结构中辨别与信号传导生化途径相关的蛋白质的表达谱。可以通过使用能够结合到优先表达于某些组织、细胞类型或亚细胞结构中的蛋白质标记的组织特异的、细胞特异的或亚细胞结构特异的抗体进行这些研究。
还可以通过检查基因产物相对于对照细胞的活性变化而确定与信号传导生化途径相关的基因的改变的表达。与信号传导生化途径相关的蛋白质的试剂诱导的活性变化的测定将取决于处于研究之下的生物活性和/或信号传导途径。例如,在该蛋白质是一种激酶的情况下,可以通过本领域已知的多种测定确定它磷酸化一种或多种下游底物的能力的变化。代表性测定包括但不限于用抗体进行免疫印迹和免疫沉淀,这些抗体是如识别磷酸化蛋白质的抗磷酸酪氨酸抗体。此外,可以通过高通量化学发光测定检测激酶活性,如AlphaScreenTM(可获得自珀金埃尔默公司)和eTagTM测定(Chan-Hui等人(2003)ClinicalImmunology[临床免疫学]111:162-174)。
在与信号传导生化途径相关的蛋白质是使得细胞内pH条件波动的信号传导级联的一部分的情况下,可以将pH敏感的分子(如荧光pH染料)用作报告分子。在与信号传导生化途径相关的蛋白质是离子通道的另一个实例中,可以监测膜电位和/或细胞内离子浓度的波动。多种商业试剂盒和高通量装置特别适于快速且稳健地筛选离子通道调节剂。代表性仪器包括FLIPRTM(分子设备公司(Molecular Devices,Inc.))和VIPR(奥罗拉生物科学公司(Aurora Biosciences))。这些仪器能够同时检测微板的1000多个样品孔中的反应,并且能够提供一秒内或甚至一毫秒内的实时测量和功能数据。
在实践本文披露的任何方法中,可以经由本领域已知的一种或多种方法将适合的载体引入进细胞或胚胎中,这些方法包括但不限于显微注射、电穿孔、声致穿孔、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状聚合物转染、热休克转染、核转染、磁转染、脂转染、刺穿转染、光学转染、专有剂增强的核酸摄取以及经由脂质体、免疫脂质体、病毒颗粒或人工病毒体进行递送。在一些方法中,通过显微注射将该载体引入进胚胎中。可以将这个或这些载体显微注射进胚胎的细胞核或细胞质中。在一些方法中,通过核转染将这个或这些载体引入进细胞中。
CRISPR复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如,该靶多核苷酸可以是驻留在真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,调节多核苷酸或无用DNA)。
靶多核苷酸的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下,它可以是以异常高的水平被表达的基因;在改变的表达与疾病的出现和/或进展相关的情况下,它可以是以异常低的水平被表达的基因。疾病相关基因还指具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变化的基因。转录的或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。
CRISPR复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如,该靶多核苷酸可以是驻留在真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,调节多核苷酸或无用DNA)。不希望被理论所束缚,据信该靶序列应该与PAM(原型间隔子邻近基序)相关;也就是说,与由CRISPR复合物识别的短序列相关。对PAM的精确序列和长度要求取决于使用的CRISPR酶而不同,但是PAM典型地是邻近原型间隔子(也就是说,靶序列)的2-5个碱基对序列。在以下实例部分中给出PAM序列的实例,并且本领域技术人员将能够鉴定与给定的CRISPR酶一起使用的另外的PAM序列。
CRISPR复合物的靶多核苷酸可以包括多个疾病相关基因和多核苷酸以及信号传导生化途径相关基因和多核苷酸,如分别提交于2012年12月12日和2013年1月2日的标题均为用于序列操纵的系统方法和组合物(SYSTEMS METHODS AND COMPOSITIONS FORSEQUENCE MANIPULATION)的美国临时专利申请61/736,527和61/748,427和于2013年12月12日提交的标题为用于序列操纵和治疗应用的系统、方法和组合物的递送、工程化和优化(DELIVERY,ENGINEERING AND OPTIMIZATION OF SYSTEMS,METHODS AND COMPOSITIONSFOR SEQUENCE MANIPULATION AND THERAPEUTIC APPLICATIONS)的PCT申请中PCT/US2013/074667所列举,将所有这些申请的内容通过引用以其整体并入本文。
靶多核苷酸的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比,在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下,它可以是以异常高的水平被表达的基因;在改变的表达与疾病的出现和/或进展相关的情况下,它可以是以异常低的水平被表达的基因。疾病相关基因还指具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变化的基因。转录的或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。
转录组广度敲低筛选
可以将本文描述的CRISPR效应蛋白复合物用于进行有效并且符合成本效益的功能转录组筛选。此类筛选可以利用基于CRISPR效应蛋白的转录组广度文库。此类筛选和文库可以提供确定基因的功能,涉及的细胞路径基因,以及任何基因表达的改变是如何能够产生一个具体生物过程的。本发明的一个优点在于,该CRISPR系统避免了脱靶结合及其所产生的副作用。这是通过使用被安排为具有针对靶DNA的高度序列特异性的系统而实现的。在本发明的优选实施例中,CRISPR效应蛋白复合物是C2c2效应蛋白复合物。
在本发明的实施例中,转录组广度文库可以包含多种C2c2指导RNA,如本文描述的,其包含能够靶向真核细胞群中多个基因座中多个靶序列的指导序列。这些细胞群可以是胚胎干(ES)细胞群。基因座中的靶序列可以是非编码序列。该非编码序列可以是内含子、调节序列、剪接位点、3’UTR、5’UTR、或多聚腺苷酸化信号。可以通过所述靶向来改变一种或多种基因产物的基因功能。该靶向可导致基因功能的敲除。基因产物的靶向可以包括多于一种指导RNA。基因产物可以被2、3、4、5、6、7、8、9或10种指导RNA靶向,优选地每个基因3至4种。通过利用由C2c2效应蛋白复合物产生的交错双链断裂或通过利用类似于CRISPR-Cas9系统中使用的那些的方法,可以使脱靶修饰最小化(参见例如,DNA targetingspecificity of RNA-guided Cas9nucleases[RNA指导的Cas9核酸酶的DNA靶向特异性].Hsu,P.,Scott,D.,Weinstein,J.,Ran,FA.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.,Wu,X.,Shalem,O.,Cradick,TJ.,Marraffini,LA.,Bao,G.和Zhang,F.Nat Biotechnol[自然生物技术]doi:10.1038/nbt.2647(2013)),通过引用并入本文。该靶向可以具有约100或更多个序列。该靶向可以具有约1000或更多个序列。该靶向可以具有约20,000或更多个序列。该靶向可以具有整个基因组。该靶向可以具有一系列聚焦于相关或令人希望的途径的靶序列。该途径可以是免疫途径。该途径可以是细胞分裂途径。
本发明的一个方面包括转录组广度文库,该基因组广度文库可以包含多种C2c2指导RNA,这些指导RNA可以包含能够靶向多个基因座中多个靶序列的指导序列,其中所述靶向导致基因功能的敲低。该文库可以潜在包含靶向生物基因组中各个和每个基因的指导RNA。
在本发明的一些实施例中,该生物或受试者是真核生物(包括人类在内的哺乳动物)或非人类真核生物或非人类动物或非人类哺乳动物。在一些实施例中,该生物或受试者是非人类动物,并且可以是节肢动物例如昆虫,或者可以是线虫。在本发明的一些方法中,该生物或受试者是植物。在本发明的一些方法中,该生物或受试者是哺乳动物或非人类哺乳动物。非人类哺乳动物可以是例如啮齿动物(优选小鼠或大鼠)、有蹄动物、或灵长动物。在本发明的一些方法中,该生物或受试者是包括微藻在内的藻类,或者是真菌。
基因功能的敲低可以包括:向细胞群中的每个细胞中引入具有一种或多种包含工程化的、非天然存在的C2c2效应蛋白系统的载体的载体系统,该系统包含:I.C2c2效应蛋白,和II.一种或多种指导RNA,其中组分I和II可以是相同或在不同载体系统上,将组分I和II整合到每个细胞中,其中该指导序列靶向每个细胞中的独特基因,其中该C2c2效应蛋白可操作地连接至调节元件上,其中在转录时,包含该指导序列的指导RNA指导C2c2效应蛋白系统与该独特基因的基因组基因座中的靶序列的序列特异性结合,通过该C2c2效应蛋白诱导该基因组基因座的切割,并且证实细胞群的每个细胞中的多个独特基因中的不同敲低事件,由此产生基因敲低细胞文库。本发明包括,该细胞群是真核细胞群,并且在一个优选的实施例中,该细胞群是胚胎干(ES)细胞群。
该一种或多种载体可以是质粒载体。该载体可以是单一载体,其包含C2c2效应蛋白、sgRNA,和任选地,进入靶细胞中的选择性标记。不被理论所束缚,通过单一载体同时递送C2c2效应蛋白和sgRNA的能力使得能够应用于任何感兴趣的细胞类型,而不需要首先产生表达C2c2效应蛋白的细胞系。该调节元件可以是诱导型启动子。该诱导型启动子可以是多西环素诱导型启动子。在本发明的一些方法中,该指导序列的表达是在T7启动子控制下并且是由T7聚合酶的表达驱动的。可以通过全转录组测序证实不同敲低事件。可以在100个或更多个独特基因中实现敲低事件。可以在1000个或更多个独特基因中实现敲低事件。可以在20,000个或更多个独特基因中实现敲低事件。可以在整个转录组中实现敲低事件。可以在多个独特基因中实现基因功能的敲低,这些独特基因在特定生理途径或状态下发挥作用。该途径或状态可以是免疫途径或状态。该途径或状态可以是细胞分裂途径或状态。
本发明还提供了试剂盒,其包含本文提及的转录组广度文库。该试剂盒可以包含单个容器,该容器包含含有本发明的文库的载体或质粒。该试剂盒还可以包含面板,该面板包含含有来自本发明的文库的指导序列的独特C2c2效应蛋白系统指导RNA的选择,其中该选择指示特定的生理条件。本发明包括,该靶向具有约100个或更多个序列、约1000个或更多个序列或约20,000个或更多个序列或整个转录组。此外,一系列靶序列可以聚焦于相关或令人希望的途径,如免疫路径或细胞分裂。
在本发明的一个另外方面,C2c2效应蛋白可以包含一个或多个突变,并且可以用作与或不与功能结构域融合的通用RNA结合蛋白。这些突变可以是人工引入的突变或获得性和丢失性功能突变。已经如本文所述对突变进行了表征。在本发明的一个方面,该功能结构域可以是转录活化结构域,其可以是VP64。在本发明的其他方面,该功能结构域可以是转录阻遏因子结构域,其可以是KRAB或SID4X。本发明的其他方面涉及融合到结构域上的突变的C2c2效应蛋白,这些结构域包括但不限于转录活化因子、阻遏因子、重组酶、转座酶、组蛋白重塑剂(histone remodeler)、脱甲基化酶、DNA甲基转移酶、隐花色素、光可诱导/可控制结构域或化学可诱导/可控制结构域。本发明的一些方法可以包括诱导靶向基因的表达。在一个实施例中,通过利用功能结构域来通过靶向真核细胞群中多个基因组基因座中多个靶序列诱导表达。
在利用C2c2效应蛋白复合物的本发明的实践中有用的是在CRISPR-Cas9系统中使用的方法,并且参考:
Genome-Scale CRISPR-Cas9Knockout Screening in Human Cells[在人细胞中基因组规模CRISPR-Cas9敲除筛选].Shalem,O.,Sanjana,NE.,Hartenian,E.,Shi,X.,Scott,DA.,Mikkelson,T.,Heckl,D.,Ebert,BL.,Root,DE.,Doench,JG.,Zhang,F.Science[科学]12月12日.(2013),[电子版先于印刷版];以最终编辑形式公开为:Science[科学(Science].2014年1月3日;343(6166):84–87。
Shalem等人涉及新的在全基因组范围上探询基因功能的方式。他们的研究显示,递送基因组范围的CRISPR-Cas9敲除(GeCKO)文库利用64,751个独特的指导序列靶向18,080个基因,这些指导序列使得在人细胞中阴性和阳性选择筛选两者成为可能。首先,这些作者显示,使用该GeCKO文库来鉴定癌症和多能干细胞中对于细胞活力至关重要的基因。接着,在黑色素瘤模型中,这些作者针对基因进行筛选,这些基因的损失涉及对维罗非尼(一种抑制突变体蛋白激酶BRAF的治疗剂)的抗性。他们的研究显示,最高级候选物包括先前验证的基因NF1和MED12连同新颖的命中物NF2、CUL3、TADA2B和TADA1。这些作者观察到在靶向相同基因的独立指导RNA之间的高水平的同一性以及高比率的命中确认,并且因此证实了采用Cas9进行基因组范围筛选的前景。
还参考美国专利公开号US 20140357530;以及PCT专利公开WO 2014093701,特此通过引用并入本文。
功能改变和筛选
在另一个方面,本发明提供了功能评估和基因筛选的方法。本发明的CRISPR系统用于精确地递送功能结构域、通过精确地改变感兴趣的特定基因座上的甲基化位点来活化或阻遏基因或改变表观遗传状态的用途可以与一种或多种指导RNA一起应用于单细胞或细胞群体或与文库一起应用于离体或体内细胞池中的基因组,其包括给予或表达包含多种指导RNA(sgRNA)的文库并且其中该筛选还包括使用C2c2效应蛋白的用途,其中包含C2c2效应蛋白的CRISPR复合物被修饰以包含异源功能结构域。在一个方面,本发明提供了用于筛选基因组/转录组的方法,该方法包括向宿主给予文库或在宿主的体内表达文库。在一个方面,本发明提供了如本文讨论的方法,该方法进一步包括给予该宿主的或在该宿主中表达的活化因子。在一个方面,本发明提供了如本文讨论的方法,其中该活化因子附接至C2c2效应蛋白。在一个方面,本发明提供了如本文讨论的方法,其中该活化因子附接至该C2c2效应蛋白的N末端或C末端。在一个方面,本发明提供了如本文讨论的方法,其中该活化因子附接至sgRNA环。在一个方面,本发明提供了如本文讨论的方法,该方法进一步包括给予该宿主的或在该宿主中表达的阻遏因子。在一个方面,本发明提供了如本文讨论的方法,其中该筛选包括在该基因座中影响并检测基因活化、基因抑制或切割。
在一个方面,本发明提供了有效的中靶活性并且最小化了脱靶活性。在一个方面,本发明提供了由C2c2效应蛋白进行的有效的中靶切割并且最小化了由该C2c2效应蛋白进行的脱靶切割。在一个方面,本发明提供了C2c2效应蛋白在基因座处的指导物特异性结合而没有DNA切割。因此,在一个方面,本发明提供了靶标特异性基因调节。在一个方面,本发明提供了C2c2效应蛋白在基因座处的指导物特异性结合而没有DNA切割。因此,在一个方面,本发明使用单一C2c2效应蛋白提供了一个基因座处的切割和不同基因座处的基因调节。在一个方面,本发明使用一种或多种C2c2效应蛋白和/或酶提供了多个靶标的正交活化和/或抑制和/或切割。
在一个方面,本发明提供了如本文讨论的方法,其中该宿主是真核细胞。在一个方面,本发明提供了如本文讨论的方法,其中该宿主是哺乳动物细胞。在一个方面,本发明提供了如本文讨论的方法,其中该宿主是非人类真核生物。在一个方面,本发明提供了如本文讨论的方法,其中该非人类真核生物是非人哺乳动物。在一个方面,本发明提供了如本文讨论的方法,其中该非人哺乳动物是小鼠。在一个方面,本发明提供了如本文讨论的方法,该方法包括递送C2c2效应蛋白复合物或其一种或多种组分或对其进行编码的一种或多种核酸分子,其中所述一种或多种核酸分子操作性地连接至一个或多个调节序列并且在体内进行表达。在一个方面,本发明提供了如本文讨论的方法,其中该体内表达是经由慢病毒、腺病毒或AAV。在一个方面,本发明提供了如本文讨论的方法,其中该递送是经由粒子、纳米粒子、脂质或细胞穿透肽(CPP)。
在一个方面,本发明提供了一对包含C2c2效应蛋白的CRISPR复合物,各自包含指导RNA(sgRNA),该sgRNA包含能够杂交到细胞中的感兴趣的基因组基因座中的靶序列上的指导序列,其中每种sgRNA的至少一个环通过插入一个或多个不同的RNA序列而被修饰,这一个或多个RNA序列结合至一种或多种衔接蛋白,并且其中该衔接蛋白与一个或多个功能结构域缔合,其中每种C2c2效应蛋白复合物的每种sgRNA都包含具有DNA切割活性的功能结构域。
在一个方面,本发明提供了用于切割感兴趣的基因座中的靶序列的方法,该方法包括向细胞递送C2c2效应蛋白复合物或其一种或多种组分或对其进行编码的一种或多种核酸分子,其中所述一种或多种核酸分子操作性地连接至一个或多个调节序列并且在体内进行表达。在一个方面,本发明提供了如本文讨论的方法,其中该递送是经由慢病毒、腺病毒或AAV。
在一个方面,本发明提供了如本文讨论的文库、方法或复合物,其中该sgRNA被修饰成具有至少一个非编码功能环,例如其中这至少一个非编码功能环是阻遏性的;例如,其中这至少一个非编码功能环包含Alu。
在一个方面,本发明提供了用于改变或修饰基因产物表达的方法。所述方法可以包括向含有并表达编码该基因产物的DNA分子的细胞中引入工程化的、非天然存在的CRISPR系统,该系统包含C2c2效应蛋白和靶向该RNA分子的指导RNA,由此该指导RNA靶向编码该基因产物的RNA靶分子,并且该C2c2效应蛋白切割编码该基因产物的RNA分子,由此改变该基因产物的表达;并且,其中该C2c2效应蛋白和该指导RNA并不天然地一起存在。本发明包括包含连接至同向重复序列上的指导序列的指导RNA。本发明进一步包括针对在真核细胞中表达进行密码子优化的C2c2效应蛋白。在一个优选的实施例中,该真核细胞是哺乳动物细胞,并且在一个更优选的实施例中,该哺乳动物细胞是人细胞。在本发明的又一个实施例中,该基因产物的表达被降低。
在一些实施例中,一个或多个功能结构域与C2c2效应蛋白缔合。在一些实施例中,一个或多个功能结构域与衔接蛋白缔合,例如,如与Konnerman等人(Nature[自然]517,583–588,2015年1月29日)的修饰指导物一起使用的衔接蛋白。在一些实施例中,一个或多个功能结构域与失活sgRNA(dRNA)缔合。在一些实施例中,dRNA复合物与活性C2c2效应蛋白通过在一个基因座处的功能结构域指导基因调节,而sgRNA通过在另一个基因座处的活性C2c2效应蛋白指导DNA切割,例如如Dahlman等人,“Orthogonal gene control with acatalytically active Cas9nuclease[用催化活性Cas9核酸酶进行正交基因控制],”Nature Biotechnology[自然生物技术]33,第1159-61页(2015年11月)在CRISPR-Cas9系统中类似地描述的。在一些实施例中,相比于脱靶调节,dRNA被选择为最大化针对感兴趣的基因座的调节的选择性。在一些实施例中,dRNA被选择为最大化靶基因调节和最小化靶切割。
出于以下讨论的目的,参考功能结构域可以是与C2c2效应蛋白缔合的功能结构域或与衔接蛋白缔合的功能结构域。
在一些实施例中,该一个或多个功能结构域是NLS(核定位序列)或NES(核输出信号)。在一些实施例中,该一个或多个功能结构域是转录活化结构域,其包含VP64、p65、MyoD1、HSF1、RTA、SET7/9和组蛋白乙酰转移酶。就与CRISPR酶缔合的那些而言,本文其他对活化(或活化因子)结构域的提及包括任何已知的转录活化结构域,并且确切地为VP64、p65、MyoD1、HSF1、RTA、SET7/9或组蛋白乙酰转移酶。
在一些实施例中,该一个或多个功能结构域是转录阻遏因子结构域。在一些实施例中,该转录阻遏因子结构域是KRAB结构域。在一些实施例中,该转录阻遏因子结构域是NuE结构域,NcoR结构域、SID结构域或SID4X结构域。
在一些实施例中,一个或多个功能结构域具有一种或多种活性,包括翻译活化活性、翻译阻遏活性、甲基化酶活性、脱甲基化酶活性、转录活化活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、DNA整合活性或核酸结合活性。
在一些实施例中,组蛋白修饰结构域也是优选的。下文讨论了示例性组蛋白修饰结构域。转座酶结构域、HR(同源重组)机构结构域、重组酶结构域和/或整合酶结构域作为本发明的功能结构域也是优选的。在一些实施例中,DNA整合活性包括HR机构结构域、整合酶结构域、重组酶结构域和/或转座酶结构域。在一些实施例中,组蛋白乙酰转移酶是优选的。
在一些实施例中,DNA切割活性是由于核酸酶。在一些实施例中,核酸酶包括Fok1核酸酶。参见,“Dimeric CRISPR RNA-guided FokI nucleases for highly specificgenome editing[用于高度特异性基因组编辑的二聚体CRISPR RNA指导的FokI核酸酶]”,Shengdar Q.Tsai,Nicolas Wyvekens,Cyd Khayter,Jennifer A.Foden,Vishal Thapar,Deepak Reyon,Mathew J.Goodwin,Martin J.Aryee,J.Keith Joung NatureBiotechnology[自然生物技术]32(6):569-77(2014),涉及识别延伸的序列并且可以在人细胞中高效编辑内源基因的二聚体RNA指导的FokI核酸酶。
在一些实施例中,该一个或多个功能结构域附接至该C2c2效应蛋白,这样使得当结合至该sgRNA和靶标时,该功能结构域处于空间定向,从而允许该功能结构域在其属性功能中起作用。
在一些实施例中,该一个或多个功能结构域附接至该衔接蛋白,这样使得当该C2c2效应蛋白结合至该sgRNA和靶标时,该功能结构域处于空间定向,从而允许该功能结构域在其属性功能中起作用。
在一个方面,本发明提供了如本文讨论的组合物,其中该一个或多个功能结构域经由接头(如本文讨论的GlySer接头)附接至该C2c2效应蛋白或衔接蛋白。
还优选靶向内源(调节)控制元件,如参与翻译、稳定性等。已知控制元件的靶向可以用于活化或阻遏感兴趣的基因。另一方面,靶向推定的控制元件可以用作验证此类元件的手段(通过测量感兴趣的基因的翻译)或检测新的控制元件。此外,对假定的控制元件的靶向在理解疾病的遗传原因的情况下可以是有用的。与疾病表型关联的许多突变和常见的SNP变体位于编码区之外。用本文描述的活化或阻遏系统对此类区域靶向后可以接着读出a)一组假定的靶标(例如,一组位于非常接近于控制元件处的基因)或b)通过例如RNAseq或微阵列进行全转录组读出的转录。这将允许鉴定疾病表型中所涉及的可能候选基因。此类候选基因可以用作新颖的药物靶标。
本文中提及了组蛋白乙酰转移酶(HAT)抑制剂。然而,在一些实施例中,一种替代方案是,该一个或多个功能结构域包含乙酰转移酶,优选组蛋白乙酰转移酶。这些在表观基因组学领域中是有用的,例如在探询表观基因组的方法中。探询表观基因组的方法可以包括,例如,靶向表观基因组序列。靶向表观基因组序列可以包括该指导物被引导至表观基因组靶序列。表观基因组靶序列可以包括,在一些实施例中,包括启动子、沉默子或增强子序列。
连接到如本文描述的C2c2效应蛋白,优选失活的C2c2效应蛋白,更优选失活的FnC2c2效应蛋白,上的功能结构域靶向表观基因组序列的用途可以用于活化或阻遏启动子、沉默子或增强子。
乙酰转移酶的实例是已知的,但在一些实施例中,可以包括组蛋白乙酰转移酶。在一些实施例中,组蛋白乙酰转移酶可以包含人类乙酰转移酶p300的催化核心(Gerbasch和Reddy,Nature Biotech[自然生物技术]2015年4月6日)。
在一些优选实施例中,该功能结构域连接到失活的C2c2效应蛋白上以靶向并且活化表观基因组序列,如启动子或增强子。还可以提供针对此类启动子或增强子的一种或多种指导物来指导CRISPR酶与此类启动子或增强子的结合。
在某些实施例中,本发明的RNA靶向效应蛋白可以用于干扰DNA/染色质结构的共转录修饰、RNA指导的DNA甲基化、或RNA指导的DNA/染色质的沉默/活化。RNA指导的DNA甲基化(RdDM)是首次在植物中发现的表观遗传过程。在RdDM期间,将双链RNA(dsRNA)加工成21-24个核苷酸的小干扰RNA(siRNA)并指导同源DNA基因座的甲基化。除RNA分子外,种类繁多的蛋白质参与RdDM的建立,像Argonaute、DNA甲基转移酶、染色质重塑复合物和植物特异性PolIV和PolV。所有这些都协同作用,在胞嘧啶的5'位置添加甲基基团。通过将含有Argonaute的复合物指导至互补的新生(非编码)RNA转录物,小RNA可以修饰染色质结构并使转录沉默。随后介导募集染色质修饰复合物,包括组蛋白和DNA甲基转移酶。本发明的RNA靶向效应蛋白可以用于靶向此类小RNA并干扰这些小RNA与新生非编码转录物之间的相互作用。
在此相对于功能结构域与C2c2效应蛋白或衔接蛋白的缔合使用术语“与……缔合”。关于一种分子相对于另一种分子如何“缔合”,例如在衔接蛋白与功能结构域之间、或在C2c2效应蛋白与功能结构域之间进行使用。在这样的蛋白质-蛋白质相互作用的情况下,可以按抗体识别表位的方式就识别而论看待这种缔合。可替代地,一种蛋白质可以经由这两种蛋白质的融合物与另一蛋白质缔合,例如一个亚基融合至另一亚基。融合典型地通过将一种蛋白质的氨基酸序列添加至另一蛋白质的氨基酸序列上而发生,例如经由一起剪接编码每种蛋白质或亚基的核苷酸序列。可替代地,这基本上可以被视为两个分子之间的结合或直接连接,如融合蛋白。在任何情况下,融合蛋白可以在感兴趣的两个亚基之间(即酶与功能结构域之间或衔接蛋白与功能结构域之间)包括接头。因此,在一些实施例中,C2c2效应蛋白或衔接蛋白通过结合至其上而与功能结构域缔合。在其他实施例中,C2c2效应蛋白或衔接蛋白任选地经由接头而与功能结构域缔合,因为这两者被融合到一起。
饱和诱变
可以将本文描述的一种或多种C2c2效应蛋白系统用于进行基因组基因座的饱和或深度扫描诱变结合细胞表型—例如用于确定关键最小特征和基因表达、抗药性以及疾病逆转所需的功能元件的离散脆弱性。通过饱和或深度扫描诱变意指将基因组基因座之内的每个或基本上每个RNA碱基切割。可以将C2c2效应蛋白指导RNA的文库引入细胞群中。可以引入该文库,这样使得每个细胞接收到单种指导RNA(sgRNA)。在通过转导如本文所描述的病毒载体而引入该文库的情况下,使用低的感染复数(MOI)。该文库可以包括靶向基因组基因座(原型间隔子邻近基序)(PAM)序列上游的每个序列的sgRNA。对于该基因组基因座内每1000个碱基对,该文库可以包括PAM序列上游的至少100个不重叠基因组序列。该文库可以包括靶向至少一个不同PAM序列上游序列的sgRNA。C2c2效应蛋白系统可以包括多于一种C2c2蛋白。可以使用如本文所描述的任何C2c2效应蛋白,包括直向同源物或识别不同PAM序列的工程化C2c2效应蛋白。对于sgRNA的脱靶位点的频率可以小于500。可以生成脱靶得分来选择具有最少脱靶位点的sgRNA。可以通过使用在单个实验中靶向相同部位的sgRNA来确认确定为与在sgRNA靶部位处的切割关联的任何表型。还可以通过使用如本文所描述的经修饰的C2c2效应蛋白、以及靶向感兴趣的基因组位点的两种sgRNA进行靶部位的验证。不被理论所束缚,如果在验证实验中观察到表型发生变化,那么靶部位是真正命中。
用于饱和或深度扫描诱变的一种或多种C2c2效应蛋白系统可以用于细胞群中。该一种或多种C2c2效应蛋白系统可以用于真核细胞中,包括但不限于哺乳动物以及植物细胞。该细胞群可以是原核细胞。该真核细胞群可以是胚胎干(ES)细胞、神经元细胞、上皮细胞、免疫细胞、内分泌细胞、肌细胞、红细胞、淋巴细胞、植物细胞、或酵母细胞群。
在一个方面,本发明提供了用于筛选与表型变化关联的功能元件的方法。可以将该文库引入到被适配成含有C2c2效应蛋白的细胞群中。基于表型,可以将这些细胞分选进至少两个组。表型可以是基因的表达、细胞生长、或细胞活力。对存在于每个组中的指导RNA的相对表示进行确定,由此通过存在于每个组中的指导RNA的表示来确定与表型变化关联的基因组位点。表型变化可以是感兴趣的基因表达的变化。可以是上调、下调、或敲除感兴趣的基因。可以将这些细胞分选进高表达组和低表达组。该细胞群可以包括用于确定表型的报告基因构建体。该报告基因构建体可以包括检测标记。可以通过使用检测标记分选细胞。
在另一个方面,本发明提供了用于筛选与对化合物的抗性关联的基因座的方法。该化合物可以是药物或杀有害生物剂。可以将该文库引入到被适配成含有C2c2效应蛋白的细胞群中,其中每个细胞群包含不多于一种指导RNA;用该化合物处理该细胞群;并且相比于早期时间点,在用该化合物处理之后稍后的时间点确定指导RNA的表示,由此通过指导RNA的富集来确定与对该化合物的抗性关联的基因组位点。可以通过深度测序方法来确定sgRNA的表示。
在利用C2c2效应蛋白复合物的本发明的实践中有用的是在CRISPR-Cas9系统中使用的方法,并且参考:标题为BCL11A enhancer dissection by Cas9-mediated in situsaturating mutagenesis[通过Cas9介导的原位饱和诱变的BCL11A增强子分解]的文章,Canver,M.C.,Smith,E.C.,Sher,F.,Pinello,L.,Sanjana,N.E.,Shalem,O.,Chen,D.D.,Schupp,P.G.,Vinjamur,D.S.,Garcia,S.P.,Luc,S.,Kurita,R.,Nakamura,Y.,Fujiwara,Y.,Maeda,T.,Yuan,G.,Zhang,F.,Orkin,S.H.和Bauer,D.E.DOI:10.1038/nature15521,在线公开于2015年9月16日,将该文章通过引用并入本文,并且简要讨论如下:
Canver等人提到了新颖的合并CRISPR-Cas9指导RNA文库以进行人类和小鼠BCL11A红系增强子的原位饱和诱变,这些增强子先前被鉴定为与胎儿血红蛋白(HbF)水平相关的增强子,并且其小鼠直向同源物是红系BCL11A表达所必要的。这种方法揭示了关键最小特征和这些增强子的离散脆弱性。通过原代人类祖细胞和小鼠基因转移的编辑,这些作者验证了BCL11A红系增强子作为针对HbF再诱导的靶标。这些作者生成了告知治疗性基因组编辑的详细增强子图。
使用C2c2系统修饰细胞或生物的方法
在一些实施例中,本发明包括修饰细胞或生物的方法。该细胞可以是原核细胞或真核细胞。该细胞可以是哺乳动物细胞。该哺乳动物细胞可以是非人类灵长动物、牛、猪、啮齿动物或小鼠细胞。该细胞可以是非哺乳动物真核细胞,如家禽、鱼或虾细胞。该细胞还可以是植物细胞。该植物细胞可以属于作物植物(如木薯、玉米、高粱、小麦或水稻)。该植物细胞还可以属于藻类、树木或蔬菜。通过本发明引入到细胞中的修饰可以使得细胞和细胞子代被改变以便改进生物制品(如抗体、淀粉、醇或其他所希望的细胞产出)的生产。通过本发明引入到细胞中的修饰可以使得细胞和细胞子代包括改变所生产的生物制品的变化。
该系统可以包含一种或多种不同的载体。在本发明的一个方面,该效应蛋白针对在所希望的细胞类型(优先真核细胞,优选哺乳动物细胞或人细胞)中表达进行密码子优化。
典型地使用包装细胞形成能够感染宿主细胞的病毒粒子。这样的细胞包括包装腺病毒的293细胞和包含逆转录病毒的ψ2细胞或PA317细胞。在基因疗法中使用的病毒载体通常由产生将核酸载体包装进病毒粒子的细胞系产生。这些载体典型地包含包装并且随后整合进宿主所需的最低量序列,其他病毒序列由用于有待表达的一个或多个多核苷酸的表达盒替换。失去的病毒功能典型地由包装细胞系反式地提供。例如,在基因疗法中使用的AAV载体典型地仅具有来自AAV基因组的ITR序列,这些序列为包装并整合进宿主基因组所需。将病毒DNA包装进以下细胞系中,该细胞系包含编码辅助质粒的其他AAV基因,即rep和cap,但缺少ITR序列。该细胞系还可以被作为辅助者的腺病毒感染。该辅助病毒促进AAV载体的复制和从辅助质粒表达AAV基因。由于缺少ITR序列,未以显著的量包装该辅助质粒。可以通过例如与AAV相比腺病毒更加敏感的热处理减少腺病毒的污染。用于将核酸递送至细胞的另外的方法是本领域的技术人员已知的。参见例如通过引用并入本文的US 20030087817。
在一些实施例中,用一种或多种本文描述的载体瞬时地或非瞬时地转染宿主细胞。在一些实施例中,当细胞天然地出现在受试者体内时将其转染。在一些实施例中,被转染的细胞取自受试者。
在一些实施例中,该细胞来源于取自受试者的细胞,如细胞系。用于组织培养的多种多样的细胞系在本领域是已知的。细胞系的实例包括但不限于C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮细胞、BALB/3T3小鼠胚胎成纤维细胞、3T3Swiss、3T3-L1、132-d5人类胎儿成纤维细胞;10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1细胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CMLT1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、Vero细胞、WM39、WT-49、X63、YAC-1、YAR及其转基因变种。细胞系可获得自本领域的技术人员已知的多种来源(参见例如,美国典型培养物保藏中心(American Type Culture Collection)(ATCC)(马纳萨斯(Manassus),弗吉尼亚州))。在一些实施例中,使用用一种或多种本文描述的载体转染的细胞建立新的细胞系,该新的细胞系包含一个或多个种载体来源的序列。在一些实施例中,使用用如本文描述的核酸靶向系统的组分转染(如通过用一种或多种载体进行瞬时转染或用RNA进行转染)且通过靶向核酸的复合物的活性修饰的细胞建立新的细胞系,该新的细胞系包含以下细胞,这些细胞含有修饰但是缺少任何其他外源序列。在一些实施例中,在评估一种或多种测试化合物中使用用一种或多种本文描述的载体瞬时或非瞬时转染的细胞或来源于这样的细胞的细胞系。
在一些实施例中,使用一种或多种本文描述的载体产生非人转基因动物或转基因植物。在一些实施例中,该转基因动物是一种哺乳动物,如小鼠、大鼠或兔。在某些实施例中,该生物或受试者是植物。在某些实施例中,该生物或受试者或植物是藻类。用于产生转基因植物和动物的方法在本领域是已知的,并且通常以如本文描述的细胞转染方法开始。
在一个方面,本发明提供了用于修饰在一种真核细胞中的靶多核苷酸的方法。在一些实施例中,该方法包括允许靶向核酸的复合物结合到靶多核苷酸上,以实现所述靶多核苷酸的切割,由此修饰靶多核苷酸,其中靶向核酸的该复合物包含与杂交到所述靶多核苷酸内的靶序列上的指导RNA复合的核酸靶向效应蛋白。
在一个方面,本发明提供了修饰多核苷酸在真核细胞中的表达的方法。在一些实施例中,该方法包括允许靶向核酸的复合物结合到该多核苷酸上,这样使得所述结合导致所述多核苷酸的表达增加或降低;其中靶向核酸的该复合物包含与指导RNA复合的核酸靶向效应蛋白,该指导RNA与靶序列在所述多核苷酸中杂交。
C2c2效应蛋白复合物可以用于植物中
一种或多种C2c2效应蛋白系统(例如,单一或多重化的)可以与作物基因组学的最新进展结合使用。本文描述的系统可以用于进行有效且具成本效益的植物基因或基因组探询或编辑或操纵—例如,用于快速研究和/或选择和/或探询和/或比较和/或操纵和/或转化植物基因或基因组;例如,以为一种或多种植物产生、鉴定、开发、优化、或赋予一种或多种性状或一种或多种特征或者以转化植物基因组。因此,可以改进植物、具有性状或特征的新组合的新植物的生产、或具有增强的性状的新植物的生产。关于定点整合(SDI)或基因编辑(GE)或任何近反向育种(Near Reverse Breeding)(NRB)或反向育种(RB)技术中的植物,可以使用一种或多种C2c2效应蛋白系统。利用本文描述的C2c2效应蛋白系统的方面可以类似于CRISPR-Cas(例如CRISPR-Cas9)系统在植物中的使用,并且提及的是亚利桑那大学(University of Arizona)的网址“CRISPR-PLANT”(http://www.genome.arizona.edu/crispr/)(由宾州州立大学(Penn State)和AGI支持)。本发明的实施例可以在基因组编辑中用于植物中或先前已经使用RNAi或类似基因组编辑技术的地方;参见例如,Nekrasov,“Plant genome editing made easy:targeted mutagenesis in model and crop plantsusing the CRISPR-Cas system[植物基因组编辑一点通:使用CRISPR-Cas系统在模式和作物植物中进行靶向诱变],”Plant Methods[植物方法]2013,9:39(doi:10.1186/1746-4811-9-39);Brooks,“Efficient gene editing in tomato in the first generationusing the CRISPR-Cas9system[使用CRISPR-Cas9系统在第一代番茄中进行有效的基因编辑],”Plant Physiology[植物生理学]2014年9月第114.247577页;Shan,“Targetedgenome modification of crop plants using a CRISPR-Cas system[使用CRISPR-Cas系统对作物植物进行靶向基因组修饰],”Nature Biotechnology[自然生物技术]31,686-688(2013);Feng,“Efficient genome editing in plants using a CRISPR/Cas system[使用CRISPR/Cas系统在植物中的有效基因组编辑],”Cell Research[细胞研究](2013)23:1229–1232.doi:10.1038/cr.2013.114;在线公开于2013年8月20日;Xie,“RNA-guidedgenome editing in plants using a CRISPR-Cas system[使用CRISPR-Cas系统的植物中的RNA指导的基因组编辑],”Mol Plant.[分子植物]2013年11月;6(6):1975-83.doi:10.1093/mp/sst119.电子版2013年8月17日;Xu,“Gene targeting using theAgrobacterium tumefaciens-mediated CRISPR-Cas systemin rice[使用根瘤土壤杆菌介导的水稻的CRISPR-Cas系统进行基因靶向],”Rice[水稻]2014,7:5(2014);Zhou等人,“Exploiting SNPs for biallelic CRISPR mutations in the outcrossing woodyperennial Populus reveals 4-coumarate:CoA ligase specificity and Redundancy[开拓用于双等位基因的CRISPR突变的异型杂交的木本多年生杨属植物的SNP揭示了4-香豆酸:辅酶A连接酶特异性和冗余性],”New Phytologist[新植物学家](2015)(论坛)1-4(仅可在线获得,在www.newphytologist.com);Caliando等人,“Targeted DNAdegradation using a CRISPR device stably carried in the host genome[使用CRISPR装置在宿主基因组中稳定进行的靶向DNA降解]”,NATURE COMMUNICATIONS[自然通讯]6:6989,DOI:10.1038/ncomms7989,www.nature.com/naturecommunications DOI:10.1038/ncomms7989;美国专利号6,603,061-土壤杆菌介导的植物转化方法(Agrobacterium-Mediated Plant Transformation Method);美国专利号7,868,149-植物基因组序列及其用途(Plant Genome Sequences and Uses Thereof)以及US 2009/0100536-转具有增强的农艺性状的基因植物(Transgenic Plants with EnhancedAgronomic Traits),将每者的所有内容和披露通过引用以其整体并入本文。在本发明的实践中,Morrell等人“Crop genomics:advances and applications[作物基因组学:进展与应用],”Nat Rev Genet.[遗传学自然评论]2011年12月29日;13(2):85-96;将其各自通过引用并入本文,包括关于本文的实施例如何可以就植物而使用。因此,加上必要的变更,此处对动物细胞的提及也可适用植物细胞,除非另外是显然的。并且,可以将具有降低的脱靶效应的本文所述的酶和采用此类酶的系统在植物应用中使用,包括本文提及的那些。
Sugano等人(Plant Cell Physiol.[植物细胞生理学]2014年3月;55(3):475-81.doi:10.1093/pcp/pcu014.电子版2014年1月18日)报道了将CRISPR-Cas9应用于地钱(Marchantia polymorpha L.)的靶向诱变中,其已经被作为用于研究陆生植物进化的模式物种。对地钱(M.polymorpha)的U6启动子进行鉴定并克隆以表达gRNA。该gRNA的靶序列被设计为破坏编码地钱的植物生长素响应因子1(ARF1)的基因。使用土壤杆菌介导的转化,Sugano等人在地钱的配子体世代中分离了稳定的突变体。使用花椰菜花叶病毒35S或地钱EF1α启动子来实现基于CRISPR-Cas9的体内定点诱变,以表达Cas9。显示出植物生长素抗性表型的分离的突变个体不是嵌合的。此外,通过无性繁殖T1植物来产生稳定的突变体。使用基于CRIPSR/Cas9的靶向诱变,易于建立多个arf1等位基因。本发明的C2c2系统可用于调节相同的以及其他基因,并且像表达控制系统如RNAi和siRNA,本发明的方法可以是诱导型和可逆的。
Kabadi等人(Nucleic Acids Res.[核酸研究]2014年10月29日;42(19):e147.doi:10.1093/nar/gku749.电子版2014年8月13日)开发了单个慢病毒系统以表达Cas9变体,报告基因以及多至四个来自通过方便的金门克隆方法并入到载体中的独立RNA聚合酶III启动子的sgRNA。每种sgRNA充分表达并且可以介导在永生化和原代人细胞中的多重基因编辑和持续转录活化。本发明可用于调节Kabadi的植物基因。
Xing等人(BMC Plant Biology[BMC植物生物学]2014,14:327)开发了基于pGreen或pCAMBIA骨架连同gRNA设定的CRISPR-Cas9二元载体。除了BsaI以外,这种工具箱不需要限制性内切酶以产生具有玉米密码子优化的Cas9以及在少至一个克隆步骤中高效率的一种或多种gRNA的最终构建体。使用玉米原生质体、转基因玉米株系和转基因拟南芥属株系,对该工具箱进行验证并且显示其展示出高效率和特异性。更重要的是,使用这种工具箱,在T1代的转基因幼苗中检测出三个拟南芥基因的定向突变。此外,该多重基因突变可以被下一代遗传。(指导RNA)模块载体作为工具箱设置用于植物的多重基因组编辑。本发明的C2c2系统和蛋白质可以用于靶向Xing靶向的基因。
本发明的C2c2CRISPR系统可用于检测植物病毒。Gambino等人(Phytopathology.[植物病理学]2006年11月;96(11):1223-9.doi:10.1094/PHYTO-96-1223)依靠扩增和多重PCR同时检测9种葡萄藤病毒。本发明的C2c2系统和蛋白质可以类似地用于检测宿主中的多个靶标。此外,本发明的系统可以用于同时敲低有价值的栽培种中的病毒基因表达,并通过靶向表达的病毒RNA来防止活化或进一步感染。
Murray等人(Proc Biol Sci.[生物科学论文集]2013年6月26日;280(1765):20130965.doi:10.1098/rspb.2013.0965;公开于2013年8月22日)对12种植物RNA病毒进行了分析,以研究进化速率,并发现了可能由于不同宿主基因型或物种之间的移码而发生偶发性选择的证据。本发明的C2c2系统和蛋白质可以用于在宿主中靶向或免疫此类病毒。例如,本发明的系统可以用于阻断病毒RNA表达,从而阻断复制。而且,本发明可以用于靶向核酸用于切割,以及靶向表达或活化。而且,本发明的系统可以被多重化以便击中多个靶标或同一病毒的多个隔离群。
Ma等人(Mol Plant.[分子植物]2015年8月3日;8(8):1274-84.doi:10.1016/j.molp.2015.04.007)报道了稳健的CRISPR-Cas9载体系统,其利用植物密码子优化的Cas9基因,以便在单子叶植物和双子叶植物中进行方便且高效的多重基因组编辑。Ma等人设计了基于PCR的程序以迅速产生多个sgRNA表达盒,其可以通过金门连接或吉布森组装在一轮克隆中装配进二元CRISPR-Cas9载体中。使用这种系统,Ma等人编辑了稻的46靶位点,突变率为平均85.4%,主要在双等位基因和纯合状态中。Ma等人提供了通过同时靶向基因家族的多个(多达八个)成员、生物合成途径中的多基因、或单个基因中的多个位点,T0稻和T1拟南芥属植物中功能缺失基因突变的实例。类似地,本发明的C2c2系统可以同时进行多个基因的分别靶向表达。
Lowder等人(Plant Physiol.[植物生理学]2015年8月21日.pii:pp.00636.2015)还开发了使得能够在植物中进行多重基因组编辑和转录调节表达、沉默或非编码基因的CRISPR-Cas9工具箱。该工具箱为研究者提供了方案和试剂以便使用金门和通路(Gatewayg)克隆方法,为单子叶植物和双子叶植物快速并且有效地组装功能性CRISPR-Cas9T-DNA构建体。它伴随一整套能力发生,包括植物内源基因的多重化基因编辑以及转录活化或阻遏。基于T-DNA的转化技术是对现代植物生物技术、遗传学、分子生物学以及生理学很重要。因此,我们开发了用于组装Cas9(WT、切口酶或dCas9)和一种或多种gRNA进入感兴趣的T-DNA目的载体中的方法。该组装方法基于金门组装和多位点通路重组二者。组装需要三种模块。第一模块是Cas9入门载体,其包含无启动子Cas9或其衍生物基因,其侧翼为attL1和attR5位点。第二模块是gRNA入门载体,其包含入门gRNA表达盒,其侧翼为attL5和attL2位点。第三模块包括包含attR1-attR2的目的T-DNA载体,其提供用于Cas9表达的启动子的选择。Lowder等人的工具箱可以应用于本发明的C2c2效应蛋白系统。
生物如酵母和微藻被广泛用于合成生物学。Stovicek等人(Metab.Eng.Comm.[代谢工程通讯],2015;2:13)描述了工业酵母(例如酿酒酵母)的基因组编辑,以有效地产生用于工业生产的稳健菌株。Stovicek使用为酵母密码子优化的CRISPR-Cas9系统同时破坏内源基因的两个等位基因并敲入异源基因。Cas9和gRNA从基于基因组或游离基因2μ的载体位置表达。作者还表明,通过优化Cas9和gRNA表达水平可以改进基因破坏效率。Hlavová等人(Biotechnol.Adv.[生物技术进展]2015)讨论了使用诸如CRISPR等技术开发微藻类物种或菌株以靶向用于插入诱变和筛选的核和叶绿体基因。相同的质粒和载体可以应用于本发明的C2c2系统。
Petersen(“Towards precisely glycol engineered plants[对于精确乙二醇工程化植物],”Plant Biotech Denmark Annual meeting 2015[2015年丹麦植物生物技术年会],哥本哈根,丹麦)开发了一种使用CRISPR/Cas9以工程化拟南芥中的基因组改变,例如,以乙二醇工程化拟南芥以便产生具有所希望的翻译后修饰的蛋白和产品的方法。Hebelstrup等人(Front Plant Sci.[植物科学前沿]2015年4月23日;6:247)概述了在植物中淀粉生物工程,由此提供表达淀粉修饰酶并直接产生通常是通过工业化学和/或物理处理淀粉制成的产品的作物。Petersen和Hebelstrup的方法可以应用于本发明的C2c2效应蛋白系统。
Kurth等人(J Virol.[病毒学杂志]2012年6月;86(11):6002-9.doi:10.1128/JVI.00436-12.电子版2012年3月21日)开发了一种基于RNA病毒的载体,用于将所需性状引入葡萄藤中,而不会对基因组进行可遗传的修饰。载体提供了通过病毒诱导的基因沉默来调节内源基因表达的能力。本发明的C2c2系统和蛋白质可以用于沉默基因和蛋白质,而不会对基因组进行可遗传的修饰。
在一个实施例中,植物可以是豆科植物。本发明可以利用本文披露的CRISP-Cas系统用于探索并修饰,例如但不限于大豆、豌豆和花生。Curtin等人提供了针对豆科植物功能基因组学的工具箱。(参见Curtin等人,“A genome engineering toolbox for legumeFunctional genomics[用于豆科植物功能基因组学的基因组工程工具箱],”International Plant and Animal Genome Conference XXII[第22届国际植物和动物基因组会议]2014)。Curtin使用了CRISPR的遗传转化以敲除/敲低发根与全株系统中的单拷贝和复制豆科植物基因二者。选择这些靶基因中的一些以便探索和优化敲除/敲低系统的特征(例如,八氢番茄红素不饱和酶),而通过大豆与拟南芥切片机样基因的同源性或通过苜蓿属中结瘤的全基因组关联研究来鉴定其他靶基因。本发明的C2c2系统和蛋白质可以用于敲除/敲低系统。
花生过敏症以及豆科植物过敏症通常是真实并且严重的健康问题。本发明的C2c2效应蛋白系统可以用于鉴别并且然后编辑或沉默编码此类豆科植物的变应原性蛋白的基因。对于此类基因和蛋白没有限制,Nicolaou等人鉴别了花生、大豆、扁豆、豌豆、羽扇豆、青豆和绿豆中的变应原性蛋白。参见,Nicolaou等人,Current Opinion in Allergy andClinical Immunology[变态反应学与临床免疫学当前观点]2011;11(3):222)。
在一个有利的实施例中,植物可以是树。本发明还可以利用本文披露的CRISPRCas系统以用于草本系统(参见例如,Belhaj等人,Plant Methods[植物方法]9:39以及Harrison等人,Genes&Development[基因与发育]28:1859–1872)。在一个特别有利的实施例中,本发明的CRISPR Cas系统可以靶向树的单核苷酸多态性(SNP)(参见例如,Zhou等人,New Phytologist[新植物学家],第208卷,第2期,第298–301页,2015年10月)。在Zhou等人的研究中,这些作者使用4-香豆酸:辅酶A连接酶(4CL)基因家族作为案例研究在木本多年生杨属植物中应用CRISPR Cas系统,并且对于两个被靶向的4CL基因实现了100%突变效率,检查了携带双等位基因修饰的每个转化子。在Zhou等人的研究中,CRISPR-Cas9系统对单核苷酸多态性(SNP)高度敏感,因为用于第三4CL基因的切割由于靶序列中的SNP而被消除。这些方法可以应用于本发明的C2c2效应蛋白系统。
Zhou等人(New Phytologist[新植物学家],第208卷,第2期,第298–301页,2015年10月)的这些方法可以适用于如下的本发明。与木质素和类黄酮生物合成关联的两个4CL基因(4CL1和4CL2)分别被靶向用于CRISPR-Cas9编辑。常规地用于转化的欧洲山杨(opulustremula)×阿尔巴(alba)克隆717-1B4与基因组测序的毛果杨(Populus trichocarpa)不同。因此,就由参考基因组设计的4CL1和4CL2gRNA用内部717RNA-Seq数据进行探询,以确保不存在SNP,这可以限制Cas效率。针对4CL5设计的第三gRNA,4CL1的基因组重复,也包括在内。对应的717序列在每个等位基因附近/在PAM之内具有一个SNP,据期两者均通过4CL5-gRNA消除靶向。所有三种gRNA靶位点被定位在第一外显子之内。对于717转化,gRNA从苜蓿属U6.6启动子中表达,连同在二元载体的CaMV 35S启动子的控制下的人类密码子优化的Cas。用仅Cas载体进行的转化可以充当对照。使随机选择的4CL1和4CL2株系均经受扩增子测序。然后,加工数据,并且在所有情况下证实双等位基因突变。这些方法可以应用于本发明的C2c2效应蛋白系统。
在植物中,病原体常常是宿主特异性的。例如,番茄尖镰孢菌番茄专化型(Fusarium oxysporum f.sp.lycopersici)引起番茄枯萎病,而且只攻击番茄,并且香石竹尖镰孢禾柄锈菌小麦专化型(F.oxysporum f.dianthii Puccinia graminisf.sp.tritici)只攻击小麦。植物具有抵抗大多数病原体的现有的和诱导性的防御。跨植物代的突变和重组事件导致产生敏感性的遗传变异性,特别是当病原体以比植物更高的频率繁殖时。在植物中可以存在非宿主抗性,例如,该宿主和病原体是不相容的。还可以存在水平抗性,例如典型地由许多基因控制的针对所有种的病原体的部分抗性,以及垂直抗性,例如典型地由很少的基因控制的针对病原体的某些种而不是其他种的完全抗性。在基因对基因水平中,植物和病原体一起演化,并且在一者中的遗传变化使在另一者中的变化平衡。因此,使用自然变异,育种者针对产率、质量、均匀性、耐性、抗性将最有用的基因进行结合。抗性基因的来源包括天然或外来品种、传家宝品种(Heirloom Varieties)、近缘野生植物、以及诱导的突变,例如用诱变剂处理植物材料。利用本发明,向植物育种者提供了一种新的诱导突变的工具。因此,本领域的普通技术人员可以分析抗性基因的来源的基因组,并且在具有所希望的特征或性状的品种方面,采用本发明来诱导抗性基因的发生,这样具有比先前的诱变剂更好的精确性,并且因此加速并改良植物育种计划。
除了本文和上文另外讨论的植物之外,提供了由效应蛋白和合适的指导物修饰的工程化植物及其子代。这些可能包括抗病或抗旱作物,如小麦、大麦、大米、大豆或玉米;被修饰以去除或降低自体授粉的能力的植物(但是其可以替代地,任选地,以杂交替代);和过敏食物,例如花生和坚果,其中免疫原性蛋白已通过效应蛋白和合适的指导物通过靶向失去能力,被毁灭或破坏。
治疗性处理
所以本发明的系统可以从本公开(包括治疗、测定和其他应用)无需过多实验而应用于以前的RNA切割技术领域,因为本申请为系统的知情工程化提供了基础。本发明提供了由RNA、毒性RNA和/或突变RNA(例如像剪接缺陷或截短)的过表达引起的疾病的治疗性处理。毒性RNA的表达可能与核内含物的形成和脑、心脏或骨骼肌中迟发性退行性改变相关。在研究的最好的实例中,在强直性肌营养不良中似乎毒性RNA的主要致病作用是隔离结合蛋白并危及选择性剪接的调节(Hum.Mol.Genet.[人类分子遗传学](2006)15(增刊2):R162-R169)。强直性肌营养不良[dystrophia myotonica(DM)]是遗传学家特别感兴趣的,因为它产生了极其广泛的临床特征。部分清单将包括肌肉萎缩、白内障、胰岛素抗性、睾丸萎缩、心脏传导减慢、皮肤肿瘤和对认知的影响。DM的经典形式,现在称为DM 1型(DM1),是由于在编码细胞溶质蛋白激酶的基因DMPK的3'非翻译区(UTR)中CTG重复的扩增而引起的。
下表列出了在DM1骨骼肌、心脏或大脑中显示错配的选择性剪接的外显子列表。
本发明的酶可靶向过表达的RNA或毒性RNA,例如像DMPK基因或在例如上表中的DM1骨骼肌、心脏或大脑中的任何错误调节的选择性剪接。
如下表所示,本发明的酶还可以靶向影响导致疾病的RNA依赖性功能的反式作用突变(Cell.[细胞]2009年2月20日;136(4):777–793)。
本发明的酶还可用于治疗各种tau疾病,包括原发性和继发性tau疾病,例如原发性年龄相关性tau疾病(PART)/神经元纤维缠结主导的老年失智(具有与AD相似的NFT但不具有神经斑)、拳击员痴呆(慢性创伤性脑病)、进行性核上性麻痹、皮层基底节变性、额颞痴呆和与第17号染色体相关的帕金森症、lytico-Bodig病(Guam氏帕金森痴呆复征)、神经节神经胶质瘤和神经节细胞瘤、脑膜血管瘤病、脑炎后帕金森症、亚急性硬化性全脑炎以及铅毒性脑病、结节性硬化症、哈勒沃登-施帕茨病和脂褐质沉积、阿尔茨海默病。本发明的酶还可靶向破坏引起剪接缺陷和疾病的顺式作用剪接代码的突变(概述于Cell.[细胞]2009年2月20日;136(4):777–793)。运动神经元退行性疾病SMA由SMN1基因的缺失引起。剩下的SMN2基因在外显子7中具有C→T取代,使外显子剪接增强子(ESE)失活,并产生外显子剪接沉默子(ESS),导致外显子7跳跃和截短的蛋白(SMNΔ7)。肌营养不良蛋白基因的外显子31中的T→A取代同时产生提前终止密码子(STOP)和ESS,导致外显子31跳跃。这种突变导致DMD的轻度形式,因为缺乏外显子31的mRNA产生了部分功能性蛋白质。编码tau蛋白的MAPT基因的外显子10内和下游的突变影响剪接调节元件并破坏包括或排除外显子10的mRNA的正常1:1比例。这导致含有四个或三个微管结合结构域(分别为4R-tau和3R-tau)的tau蛋白之间的平衡打乱,引起神经病理学障碍FTDP-17。示出的实例是N279K突变,其增强促进了外显子10包含和向增加的4R-tau的平衡转换的ESE功能。CFTR基因外显子9的3'剪接位点内的多态性(UG)m(U)n通道影响外显子9包含的程度和全长功能蛋白的水平,改变由CFTR基因他处突变引起的囊性纤维化(CF)的严重性。
先天性免疫系统主要通过识别感染细胞内的病毒核酸(称为DNA或RNA感测)来检测病毒感染。体外RNA感测分析可用于检测特定的RNA底物。靶向RNA的效应蛋白例如可用于活细胞中的基于RNA的感测。应用的实例是通过感测例如疾病特异性RNA的诊断。
本发明的靶向RNA的效应蛋白可以进一步用于抗病毒活性,特别是针对RNA病毒。效应蛋白可以使用对选择的病毒RNA序列具有选择性的合适的指导RNA来靶向病毒RNA。具体而言,效应蛋白可以是切割RNA(如单链RNA)的活性核酸酶。因此提供了本发明的RNA靶向效应蛋白作为抗病毒剂的用途。
本发明的酶系统用于靶向上述提及的RNA中的RNA的治疗剂量预期为约0.1mg/kg至约2mg/kg,该剂量可以与监测的响应相继给予,并且如果需要的话重复剂量直至每位患者约7个至10个剂量。有利地,在治疗方案期间从每个患者收集样品以确定治疗的有效性。例如,可以分离和量化RNA样品以确定表达是否减少或改善。这种诊断是在本领域技术人员的范围内的。
转录物检测方法
本发明的效应蛋白和系统可用于特异性检测细胞或其他样品中的RNA。在感兴趣的RNA靶标的存在下,指导物依赖性的C2c2核酸酶活性可能伴随着针对附带靶标的非特异性RNA酶活性。
为了利用RNA酶活性,所需要的只是可进行检测地切割的报告底物。例如,报告分子可以包含RNA,其一端用荧光报告分子(荧光剂)标记,并且另一端用淬灭剂标记。在没有C2c2RNA酶活性的情况下,淬灭剂的物理邻近性将荧光剂的荧光衰减到低水平。当C2c2靶标特异性切割通过存在感兴趣的RNA靶标和合适的指导RNA而被活化时,含有RNA的报告分子被非特异性切割,并且荧光剂和淬灭剂在空间上分开。这导致荧光剂在被适当波长的光激发时发出可检测信号。
在一个方面,本发明涉及包含以下的(靶)RNA检测系统:RNA靶向效应物;设计用于结合相应RNA靶标的一种或多种指导RNA;和基于RNA的切割诱导型报告构建体。在另一个方面,本发明涉及样品中(靶)RNA检测的方法,该方法包括添加RNA靶向效应物、设计用于结合所述(靶)RNA的一种或多种指导RNA和基于RNA的切割诱导型报告构建体到所述样品。在又一个方面,本发明涉及包含如本文所定义的(靶)RNA检测系统的试剂盒或装置,或包含至少RNA靶向效应物和基于RNA的切割诱导型报告构建体的试剂盒或装置。在又一个方面,本发明涉及如本文所定义的RNA靶向系统或试剂盒或装置用于(靶)RNA检测的用途。在某些实施例中,RNA靶向效应物是RNA指导的RNA酶。在某些实施例中,RNA靶向效应物是CRISPR效应物。在某些实施例中,RNA靶向效应物是2类CRISPR效应物。在某些实施例中,RNA靶向效应物是2类VI型CRISPR效应物。在一个优选的实施例中,RNA靶向效应物是C2c2。在某些实施例中,RNA靶向效应物(优选C2c2)衍生自本文其他地方所述的物种。应当理解,如本文所述设计用于结合所述(靶)RNA的指导RNA能够与RNA靶向效应物形成复合物,并且其中所述复合物中的指导RNA能够结合靶RNA分子并由此也如本文其他地方所述,靶RNA被切割。应当理解,指导RNA典型地包含指导序列和同向重复,如本文其他地方所述。在某些实施例中,该一种或多种指导RNA被设计为结合诊断疾病状态的一种或多种靶分子。在某些实施例中,疾病状态是感染,如病毒、细菌、真菌或寄生虫感染。在某些实施例中,疾病状态的特征在于异常(靶)RNA表达。在某些实施例中,疾病状态是癌症。在某些实施例中,疾病状态是自身免疫疾病。基于RNA的切割诱导型报告构建体包含RNA,并且RNA的切割导致可检测的读出,即在切割RNA时生成的可检测的信号。在某些实施例中,基于RNA的切割诱导型报告构建体包含荧光染料和淬灭剂。本领域技术人员将理解可以使用不同类型的荧光染料和相应的淬灭剂。本领域技术人员将容易地设想其他类型的诱导型报告系统,其可以适用于本发明的RNA切割报告构建体。
在一个示例性测定方法中,将C2c2效应蛋白、感兴趣的靶标特异性指导RNA和报告分子添加到细胞样品中。荧光的增加表明感兴趣的RNA靶标的存在。在另一个示例性方法中,提供了检测阵列。阵列的每个位置都配有C2c2效应蛋白、报告分子和感兴趣的靶标特异性指导RNA。取决于要进行的测定,阵列的每个位置处的感兴趣的靶标特异性指导RNA可以是相同的、不同的或是其组合。例如,当需要测试单一来源样品中的一个或多个靶标时,可能会提供不同的感兴趣的靶标特异性指导RNA。例如,当需要为相同靶标测试多个样品时,可以在每个位置上提供相同的感兴趣的靶标特异性指导RNA。
如本文使用的,“掩蔽构建体”是指可以被本文所述的活化的CRISPR系统效应蛋白切割或以其他方式失活的分子。在某些示例性实施例中,掩蔽构建体是基于RNA的掩蔽构建体。掩蔽构建体防止生成或检测可检测的阳性信号。可检测的阳性信号可以是可使用本领域已知的光学、荧光、化学发光、电化学或其他检测方法检测的任何信号。掩蔽构建体可以防止生成可检测的阳性信号或掩盖可检测的阳性信号的存在,直到去除掩蔽构建体或以其他方式沉默。术语“可检测的阳性信号”用于区分在掩蔽构建体存在下可检测的其他可检测信号。例如,在某些实施例中,可以在存在掩蔽剂时检测到第一信号(即可检测的阴性信号),然后在检测到靶标分子时通过活化的CRISPR效应蛋白切割或失活掩蔽剂将其转化为第二信号(例如可检测的阳性信号)。
在某些示例性实施例中,掩蔽构建体可以抑制基因产物的产生。基因产物可以由添加到样品中的报告构建体编码。掩蔽构建体可以是参与RNA干扰途径的干扰RNA,如shRHN或siRNA。掩蔽构建体还可以包含微小RNA(miRNA)。当存在时,掩蔽构建体抑制基因产物的表达。基因产物可以是荧光蛋白或其他RNA转录物或蛋白质,除非存在掩蔽构建体,否则其可被标记的探针或抗体检测到。在活化效应蛋白后,掩蔽构建体被切割或以其他方式沉默,从而允许基因产物的表达和检测为可检测的阳性信号。
在某些示例性实施例中,掩蔽构建体可以隔离生成可检测的阳性信号所需的一种或多种试剂,使得从掩蔽构建体释放一种或多种试剂导致生成可检测的阳性信号。该一种或多种试剂可以组合以产生比色信号、化学发光信号、荧光信号或任何其他可检测的信号,并且可以包括已知适合于这种目的的任何试剂。在某些示例性实施例中,该一种或多种试剂被结合该一种或多种试剂的RNA适体隔离。当在检测到靶分子后活化效应蛋白时,释放该一种或多种试剂。在某些示例性实施例中,该一种或多种试剂是能够促进生成可检测的信号如比色、化学发光或荧光信号的蛋白质如酶,其被抑制或隔离,使得通过一种或多种RNA适体与该蛋白质结合,该蛋白质不能生成可检测的信号。在活化本文披露的效应蛋白后,RNA适体被切割或降解至它们不再抑制蛋白质生成可检测信号的能力的程度。
在一个实施例中,凝血酶用作具有抑制性适体的信号放大酶,例如具有以下序列:GGGAACAAAGCUGAAGUACUUACCC。当此适体被切割时,凝血酶变得有活性并且将切割肽比色底物(参见例如,www.sigmaaldrich.com/catalog/product/sigma/t3068?lang=en&region=U S)或荧光底物(参见例如,www.sigmaaldrich.com/catalog/product/sigma/b9385?lang=en&region=US)。比色底物对硝基苯胺(pNA)与凝血酶的肽底物共价连接。在被凝血酶切割后,pNA被释放并变成黄色,并且眼睛容易看到。荧光底物通过类似的原理起作用,并且在被凝血酶切割后,释放7-氨基-4-甲基香豆素,一种可以使用荧光检测器检测到的蓝色荧光团。凝血酶的替代物包括辣根过氧化物酶(HRP)、β-半乳糖苷酶和小牛碱性磷酸酶(CAP),它们可以类似地用于生成比色或荧光信号,并且被抑制性适体抑制。
在某些示例性实施例中,掩蔽构建体能以单独离散体积(下面进一步定义)固定在固体基质上并隔离单一试剂。例如,试剂可以是包含染料的珠。当被固定的试剂隔离时,各个珠过于扩散而不能生成可检测的信号,但是从掩蔽构建体释放后能够生成可检测的信号,例如通过聚集或溶液浓度的简单增加。在某些示例性实施例中,固定的掩蔽剂是基于RNA的适体,其可以在检测到靶分子时被活化的效应蛋白切割。
在某些其他示例性实施例中,掩蔽构建体与溶液中的固定的试剂结合,从而阻断试剂与溶液中游离的单独标记的结合配偶体结合的能力。因此,在对样品施加洗涤步骤时,可以在不存在靶分子的情况下将标记的结合配偶体从样品中洗掉。然而,如果效应蛋白被活化,则掩蔽构建体被切割至足以干扰掩蔽构建体结合试剂的能力的程度,从而允许标记的结合配偶体与固定的试剂结合。因此,标记的结合配偶体在洗涤步骤后保留,指示样品中存在靶分子。在某些方面,结合固定的试剂的掩蔽构建体是RNA适体。固定的试剂可以是蛋白质,并且标记的结合配偶体可以是标记的抗体。可替代地,固定的试剂可以是链霉抗生物素蛋白,并且标记的结合配偶体可以是标记的生物素。在上述实施例中使用的结合配偶体上的标记可以是本领域已知的任何可检测标记。另外,可以根据这里描述的总体设计使用其他已知的结合配偶体。
在某些示例性实施例中,掩蔽构建体可以包含核酶。核酶是具有催化特性的RNA分子。由于天然和工程化的核酶包含RNA或由RNA组成,其可以被本文披露的效应蛋白靶向。可以选择或工程化核酶以催化生成可检测阴性信号或防止生成阳性对照信号的反应。在通过活化的效应蛋白分子使核酶失活后,生成阴性对照信号或防止生成可检测的阳性信号的反应被除去,从而允许检测到可检测的阳性信号。在一个示例性实施例中,核酶可以催化比色反应,使溶液呈现为第一颜色。当核酶失活时,溶液然后变成第二颜色,第二颜色是可检测的阳性信号。核酶如何可以用于催化比色反应的实例描述于Zhao等人“Signalamplification of glucosamine-6-phosphate based on ribozyme glmS[基于核酶glmS的葡萄糖胺-6-磷酸酯的信号放大],”Biosens Bioelectron.[生物传感器和生物电子学]2014;16:337-42;并提供了如何修饰这种系统以在本文披露的实施例的上下文中工作的实例。可替代地,当存在时,核酶可以产生例如RNA转录物的切割产物。因此,可检测的阳性信号的检测可以包括检测仅在不存在核酶的情况下产生的未切割的RNA转录物。
在一个示例性实施例中,掩蔽构建体包含检测剂,其根据检测剂是否聚集或分散在溶液中而改变颜色。例如,某些纳米粒子(如胶体金)当它们从聚集体移动成分散粒子时,经历可见的紫色到红色的色移。因此,在某些示例性实施例中,此类检测剂可以由一种或多种桥分子聚集地保持。桥分子的至少一部分包含RNA。在活化本文披露的效应蛋白后,桥分子的RNA部分被切割,使检测剂分散并导致相应的颜色变化。在某些示例性实施例中,桥分子是RNA分子。在某些示例性实施例中,检测剂是胶体金属。胶体金属材料可以包括水不溶性金属粒子或分散在液体、水溶胶或金属溶胶中的金属化合物。胶体金属可以选自周期表中IA、IB、IIB和IIIB族的金属、以及过渡金属,尤其是VIII族的那些。优选的金属包括金、银、铝、钌、锌、铁、镍和钙。其他合适的金属还包括处于其所有各种氧化态下的以下金属:锂、钠、镁、钾、钪、钛、钒、铬、锰、钴、铜、镓、锶、铌、钼、钯、铟、锡、钨、铼、铂和钆。金属优选以离子形式提供,衍生自适当的金属化合物,例如A13+、Ru3+、Zn2+、Fe3+、Ni2+和Ca2+离子。
在某些其他示例性实施例中,掩蔽构建体可以包含RNA寡核苷酸,其上附接有可检测标记和该可检测标记的掩蔽剂。这种可检测标记/掩蔽剂对的实例是荧光团和荧光团的淬灭剂。荧光团的淬灭可以由于该荧光团与另一荧光团或非荧光分子之间形成非荧光复合物而发生。这种机制称为基态复合物形成、静态淬灭或接触淬灭。因此,可以设计RNA寡核苷酸,使得荧光团和淬灭剂足够接近以发生接触淬灭。荧光团及其同源淬灭剂在本领域是已知的,并且可以由本领域普通技术人员为此目的进行选择。特定的荧光团/淬灭剂对在本发明的上下文中并不重要,仅选择荧光团/淬灭剂对确保荧光团的掩蔽。在活化本文披露的效应蛋白后,RNA寡核苷酸被切割,从而切断维持接触淬灭效果所需的荧光团和淬灭剂之间的接近度。因此,荧光团的检测可以用于确定样品中靶分子的存在。
在一个示例实施例中,掩蔽构建体可以包含量子点。量子点可以具有附接于表面的多个接头分子。接头分子的至少一部分包含RNA。接头分子在一端附接到量子点,并沿接头的长度或在末端附接到一种或多种淬灭剂,使得淬灭剂保持足够接近以发生量子点的淬灭。接头可以是分支的。如上所述,量子点/淬灭剂对并不重要,仅选择量子点/淬灭剂对确保荧光团的掩蔽。量子点及其同源淬灭剂在本领域是已知的,并且可以由本领域普通技术人员为此目的进行选择。在活化本文披露的效应蛋白后,接头分子的RNA部分被切割,从而消除了维持淬灭效果所需的量子点与一种或多种淬灭剂之间的接近度。在一个实施例中,量子点是链霉抗生物素蛋白缀合的,如625链霉抗生物素蛋白缀合物(www.thermofisher.com/order/catalog/product/A10196)。RNA通过生物素接头附接并募集淬灭分子,序列为/5Biosg/UCUCGUACGUUC/3IAbRQSp/或/5Biosg/UCUCGUACGUUCUCUCGUACGUUC/3IAbRQSp/,其中/5Biosg/是生物素标签,并且/3IAbRQSp/是Iowa黑淬灭剂。切割后,淬灭剂将被释放,并且量子点将发出看得见的荧光。
以类似的方式,荧光能量转移(FRET)可以用于生成可检测的阳性信号。FRET是非辐射过程,通过该过程,来自能量激发的荧光团(即“供体荧光团”)的光子将另一分子(即“受体”)中的电子的能态提升到激发的单重态的更高振动水平。供体荧光团返回基态而不发出该荧光团特有的荧光。受体可以是另一种荧光团或非荧光分子。如果受体是荧光团,则转移的能量作为该荧光团特有的荧光发出。如果受体是非荧光分子,则吸收的能量会作为热量而损失。因此,在本文披露的实施例的上下文中,荧光团/淬灭剂对被附接到寡核苷酸分子的供体荧光团/受体对替换。当完整时,掩蔽构建体生成第一信号(可检测的阴性信号),如通过受体发射的荧光或热检测到的。在活化本文披露的效应蛋白后,RNA寡核苷酸被切割并且FRET被破坏,使得现在检测到供体荧光团的荧光(可检测的阳性信号)。
用于检测RNA酶的一种比色读出模式基于嵌入染料,其响应于长RNA切割成短核苷酸而改变其吸光度。存在几种具有这些性质的现有染料。根据Wagner(1983),派洛宁(Pyronine)-Y将与RNA复合并形成在572nm处具有吸光度的复合物;RNA的切割导致吸光度的损失和颜色变化。Greiner-Stoeffele(1996)以类似的方式使用亚甲基蓝,在RNA酶活性下在688nm处吸光度发生变化。
比色读出的另一种模式涉及在切割后改变颜色的核酸底物。Witmer(1991)利用合成的核糖核苷酸底物U-3'-BCIP,其在切割后释放报告基团,导致在650nm处产生吸光度。
关于都可用于本发明的实践中的CRISPR-Cas系统、其组分及此类组分的递送(包括方法、材料、递送媒介、载体、粒子、AAV以及其制造和使用(包括关于量和配制品))的一般信息,参考以下:美国专利号8,999,641、8,993,233、8,945,839、8,932,814、8,906,616、8,895,308、8,889,418、8,889,356、8,871,445、8,865,406、8,795,965、8,771,945和8,697,359;美国专利公开案US 2014-0310830(美国申请序列号14/105,031)、US 2014-0287938A1(美国申请序列号14/213,991)、US 2014-0273234A1(美国申请序列号14/293,674)、US2014-0273232A1(美国申请序列号14/290,575)、US 2014-0273231(美国申请序列号14/259,420)、US 2014-0256046A1(美国申请序列号14/226,274)、US 2014-0248702A1(美国申请序列号14/258,458)、US 2014-0242700A1(美国申请序列号14/222,930)、US 2014-0242699 A1(美国申请序列号14/183,512)、US 2014-0242664A1(美国申请序列号14/104,990)、US 2014-0234972A1(美国申请序列号14/183,471)、US 2014-0227787A1(美国申请序列号14/256,912)、US 2014-0189896 A1(美国申请序列号14/105,035)、US 2014-0186958(美国申请序列号14/105,017)、US 2014-0186919A1(美国申请序列号14/104,977)、US2014-0186843A1(美国申请序列号14/104,900)、US 2014-0179770 A1(美国申请序列号14/104,837)和US 2014-0179006 A1(美国申请序列号14/183,486)、US 2014-0170753(美国申请序列号14/183,429);欧洲专利EP 2 784 162 B1和EP 2 771 468 B1;欧洲专利申请EP 2771 468(EP13818570.7)、EP 2 764 103(EP13824232.6)、和EP 2 784 162(EP14170383.5);以及PCT专利公开WO 2014/093661(PCT/US2013/074743)、WO 2014/093694(PCT/US2013/074790)、WO 2014/093595(PCT/US2013/074611)、WO 2014/093718(PCT/US2013/074825)、WO 2014/093709(PCT/US2013/074812)、WO 2014/093622(PCT/US2013/074667)、WO 2014/093635(PCT/US2013/074691)、WO 2014/093655(PCT/US2013/074736)、WO 2014/093712(PCT/US2013/074819)、WO 2014/093701(PCT/US2013/074800)、WO 2014/018423(PCT/US2013/051418)、WO 2014/204723(PCT/US2014/041790)、WO 2014/204724(PCT/US2014/041800)、WO 2014/204725(PCT/US2014/041803)、WO 2014/204726(PCT/US2014/041804)、WO 2014/204727(PCT/US2014/041806)、WO 2014/204728(PCT/US2014/041808)、WO 2014/204729(PCT/US2014/041809)。还参考了美国临时专利申请61/758,468;61/802,174;61/806,375;61/814,263;61/819,803和61/828,130,分别提交于2013年1月30日;2013年3月15日;2013年3月28日;2013年4月20日;2013年5月6日和2013年5月28日。还参考提交于2013年6月17日的美国临时专利申请61/836,123。另外参考各自提交于2013年6月17日的美国临时专利申请61/835,931、61/835,936、61/836,127、61/836,101、61/836,080和61/835,973。进一步参考提交于2013年8月5日的美国临时专利申请61/862,468和61/862,355;提交于2013年8月28日的61/871,301;提交于2013年9月25日的61/960,777和提交于2013年10月28日的61/961,980。还进一步参考:PCT专利申请号:各自提交于2014年6月10日(6/10/14)的PCT/US2014/041803、PCT/US2014/041800、PCT/US2014/041809、PCT/US2014/041804和PCT/US2014/041806;提交于2014年6月11日的PCT/US2014/041808;和提交于2014年10月28日的PCT/US2014/62558,以及以下美国临时专利申请序列号:各自提交于2013年12月12日的61/915,150、61/915,301、61/915,267和61/915,260;提交于2013年1月29日和2013年2月25日的61/757,972和61/768,959;提交于2013年6月17日的61/835,936、61/836,127、61/836,101、61/836,080、61/835,973、和61/835,931;都提交于2014年6月11日的62/010,888和62/010,879;各自提交于2014年6月10日的62/010,329和62/010,441;各自提交于2014年2月12日的61/939,228和61/939,242;提交于2014年4月15日的61/980,012;提交于2014年8月17日的62/038,358;各自提交于2014年9月25日的62/054,490、62/055,484、62/055,460和62/055,487;以及提交于2014年10月27日的62/069,243。还参考了提交于2014年9月25日的美国临时专利申请号62/055,484、62/055,460、和62/055,487;提交于2014年4月15日的美国临时专利申请61/980,012;和提交于2014年2月12日的美国临时专利申请61/939,242。参考提交于2014年6月10日的PCT申请指定(尤其是美国)申请号PCT/US14/41806。参考提交于2014年1月22日的美国临时专利申请61/930,214。参考了各自提交于2013年12月12日的美国临时专利申请61/915,251;61/915,260和61/915,267。参考提交于2014年4月15日的美国临时专利申请USSN 61/980,012。参考提交于2014年6月10日的PCT申请指定(尤其是美国)申请号PCT/US14/41806。参考提交于2014年1月22日的美国临时专利申请61/930,214。参考了各自提交于2013年12月12日的美国临时专利申请61/915,251;61/915,260和61/915,267。
还提及的是:14年12月12日提交的美国申请62/091,455,保护的指导RNA(PGRNA)(PROTECTED GUIDE RNAS(PGRNAS));14年12月24日的美国申请62/096,708,保护的指导RNA(PROTECTED GUIDE RNAS(PGRNAS));14年12月12日的美国申请62/091,462,CRISPR转录因子的失活指导物(DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS);14年12月23日的美国申请62/096,324,CRISPR转录因子的失活指导物(DEAD GUIDES FOR CRISPRTRANSCRIPTION FACTORS);14年12月12日的美国申请62/091,456,用于CRISPR-CAS系统的护送的和功能化的指导物(ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CASSYSTEMS);14年12月12日的美国申请62/091,461,用于关于造血干细胞(HSC)的基因组编辑的CRISPR-CAS系统和组合物的递送、使用以及治疗应用(DELIVERY,USE AND THERAPEUTICAPPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR GENOME EDITING ASTO HEMATOPOETIC STEM CELLS(HSCs));14年12月19日的美国申请62/094,903,通过基因组范围的插入捕获测序对双链断裂和基因组重排的无偏鉴定(UNBIASED IDENTIFICATION OFDOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURESEQUENCING);14年12月24日的美国申请62/096,761,用于序列操纵的工程化系统、方法以及优化的酶及指导物支架(ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZED ENZYMEAND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION);14年12月30日的美国申请62/098,059,RNA靶向系统(RNA-Targeting System);14年12月24日的美国申请62/096,656,具有或缔合于去稳定化结构域的CRISPR(CRISPR HAVING OR ASSOCIATED WITH DESTABILIZATIONDOMAINS);14年12月24日的美国申请62/096,697,具有或缔合于AAV的CRISPR(CRISPRHAVING OR ASSOCIATED WITH AAV);14年12月30日的美国申请62/098,158,工程化CRISPR复合物插入靶向系统(ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS);15年4月22日的美国申请62/151,052,用于胞外核外报告的细胞靶向(CELLULAR TARGETINGFOR EXTRACELLULAR EXOSOMAL REPORTING);14年9月24日的美国申请62/054,490,使用粒子递送组分靶向障碍和疾病的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERYCOMPONENTS);14年9月25日的美国申请62/055,484,用于用优化的功能性CRISPR-CAS系统进行序列操纵的系统、方法和组合物(SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCEMANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);14年12月4日的美国申请62/087,537,用于用优化的功能性CRISPR-CAS系统进行序列操纵的系统、方法和组合物(SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZEDFUNCTIONAL CRISPR-CAS SYSTEMS);14年9月24日的美国申请62/054,651,用于对体内多种癌症突变的竞争建模的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONSFOR MODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO);14年10月23日的美国申请62/067,886,用于对体内多种癌症突变的竞争建模的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THECRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLECANCER MUTATIONS IN VIVO);14年9月24日的美国申请62/054,675,在神经元细胞/组织中CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTICAPPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES);14年9月24日的美国申请62/054,528,在免疫疾病或障碍中的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OFTHE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS);14年9月25日的美国申请62/055,454,用于使用细胞穿透肽(CPP)靶向障碍和疾病的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONSOF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS ANDDISEASES USING CELL PENETRATION PEPTIDES(CPP));14年9月25日的美国申请62/055,460,多功能CRISPR复合物和/或优化的酶连接的功能性CRISPR复合物(MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES);14年12月4日的美国申请62/087,475,用优化的功能性CRISPR-CAS系统进行功能性筛选(FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);14年9月25日的美国申请62/055,487,用优化的功能性CRISPR-CAS系统进行功能性筛选(FUNCTIONALSCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);14年12月4日的美国申请62/087,546,多功能CRISPR复合物和/或优化的酶连接的功能性CRISPR复合物(MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES);以及14年12月30日的美国申请62/098,285,对于肿瘤生长和转移的CRISPR介导的体内建模以及遗传筛选(CRISPR MEDIATED IN VIVO MODELING AND GENETICSCREENING OF TUMOR GROWTH AND METASTASIS)。
这些专利、专利公开和申请的每一者以及在其中或在它们的审查程序期间引用的所有文献(“申请引用文献”)以及在这些申请引用文献中引用或参考的所有文献连同其中提到的或在其中任何文献中提到并通过引用结合在其中的针对任何产品的任何说明书、说明、产品规格和产品表特此通过引用并入本文,并且可以在本发明的实践中采用。所有文献(例如,这些专利、专利公开和申请以及申请引用文献)在如同每个单独文献被确切地且单独地指明为通过引用结合的相同程度上通过引用并入本文。
就关于CRISPR-Cas系统的一般信息而言,还提及的是以下文献(也通过引用而特此并入本文):
Multiplex genome engineering using CRISPR/Cas systems[使用CRISPR/Cas系统进行的多重基因组工程化].Cong,L.,Ran,F.A.,Cox,D.,Lin,S.,Barretto,R.,Habib,N.,Hsu,P.D.,Wu,X.,Jiang,W.,Marraffini,L.A.和Zhang,F.Science[科学]2月15日;339(6121):819-23(2013);
RNA-guided editing of bacterial genomes using CRISPR-Cas systems[使用CRISPR-Cas系统对细菌基因组进行RNA指导的编辑].Jiang W.,Bikard D.,Cox D.,ZhangF,Marraffini LA.Nat Biotechnol[自然生物技术]3月;31(3):233-9(2013);
One-Step Generation of Mice Carrying Mutations in Multiple Genes byCRISPR/Cas-Mediated Genome Engineering[通过CRISPR/Cas介导的基因组工程化在多基因中携带突变的小鼠的一步产生].Wang H.,Yang H.,Shivalila CS.,Dawlaty MM.,ChengAW.,Zhang F.,Jaenisch R.Cell[细胞]5月9日;153(4):910-8(2013);
Optical control of mammalian endogenous transcription and epigeneticstates[哺乳动物内源转录和表观遗传状态的光控制].Konermann S,Brigham MD,TrevinoAE,Hsu PD,Heidenreich M,Cong L,Platt RJ,Scott DA,Church GM,Zhang F.Nature[自然].8月22日;500(7463):472-6.doi:10.1038/Nature12466.电子版2013年8月23日(2013);
Double Nicking by RNA-Guided CRISPR Cas9for Enhanced Genome EditingSpecificity[通过RNA指导的CRISPR Cas9进行的双切以用于增强的基因组编辑特异性].Ran,FA.,Hsu,PD.,Lin,CY.,Gootenberg,JS.,Konermann,S.,Trevino,AE.,Scott,DA.,Inoue,A.,Matoba,S.,Zhang,Y.和Zhang,F.Cell[细胞]8月28日.pii:S0092-8674(13)01015-5(2013-A);
DNA targeting specificity of RNA-guided Cas9nucleases[RNA指导的Cas9核酸酶的DNA靶向特异性].Hsu,P.,Scott,D.,Weinstein,J.,Ran,FA.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.,Wu,X.,Shalem,O.,Cradick,TJ.,Marraffini,LA.,Bao,G.和Zhang,F.Nat Biotechnol[自然生物技术]doi:10.1038/nbt.2647(2013);
Genome engineering using the CRISPR-Cas9system[使用CRISPR-Cas9系统进行的基因组工程化].Ran,FA.,Hsu,PD.,Wright,J.,Agarwala,V.,Scott,DA.,Zhang,F.Nature Protocols[自然-实验手册]11月;8(11):2281-308(2013-B);
Genome-Scale CRISPR-Cas9Knockout Screening in Human Cells[在人类细胞中基因组规模CRISPR-Cas9敲除筛选].Shalem,O.,Sanjana,NE.,Hartenian,E.,Shi,X.,Scott,DA.,Mikkelson,T.,Heckl,D.,Ebert,BL.,Root,DE.,Doench,JG.,Zhang,F.Science[科学]12月12日.(2013).[电子版先于印刷版];
Crystal structure of cas9in complex with guide RNA and target DNA[在与指导RNA和靶DNA复合物中的cas9的晶体结构].Nishimasu,H.,Ran,FA.,Hsu,PD.,Konermann,S.,Shehata,SI.,Dohmae,N.,Ishitani,R.,Zhang,F.,Nureki,O.Cell[细胞]2月27日,156(5):935-49(2014);
Genome-wide binding of the CRISPR endonuclease Cas9in mammalian cells[在哺乳动物细胞中CRISPR内切核酸酶Cas9的全基因组结合].Wu X.,Scott DA.,KrizAJ.,Chiu AC.,Hsu PD.,Dadon DB.,Cheng AW.,Trevino AE.,Konermann S.,Chen S.,Jaenisch R.,Zhang F.,Sharp PA.Nat Biotechnol.[自然生物技术]4月20日.doi:10.1038/nbt.2889(2014);
CRISPR-Cas9Knockin Mice for Genome Editing and Cancer Modeling[用于基因组编辑和癌症建模的CRISPR-Cas9敲入小鼠].Platt RJ,Chen S,Zhou Y,Yim MJ,SwiechL,Kempton HR,Dahlman JE,Parnas O,Eisenhaure TM,Jovanovic M,Graham DB,Jhunjhunwala S,Heidenreich M,Xavier RJ,Langer R,Anderson DG,Hacohen N,RegevA,Feng G,Sharp PA,Zhang F.Cell[细胞]159(2):440-455DOI:10.1016/j.cell.2014.09.014(2014);
Development and Applications of CRISPR-Cas9for Genome Engineering[用于基因组工程化的CRISPR-Cas9的开发与应用],Hsu PD,Lander ES,Zhang F.,Cell.[细胞].6月5日;157(6):1262-78(2014).
Genetic screens in human cells using the CRISPR/Cas9system[使用CRISPR/Cas9系统在人类细胞中进行遗传筛选],Wang T,Wei JJ,Sabatini DM,Lander ES.,Science[科学].1月3日;343(6166):80–84.doi:10.1126/science.1246981(2014);
Rational design of highly active sgRNAs for CRISPR-Cas9-mediated geneinactivation[用于CRISPR-Cas9介导的基因失活的高活性sgRNA的合理设计],Doench JG,Hartenian E,Graham DB,Tothova Z,Hegde M,Smith I,Sullender M,Ebert BL,XavierRJ,Root DE.,(在线公开于2014年9月3日)Nat Biotechnol.[自然生物技术]12月;32(12):1262-7(2014);
In vivo interrogation of gene function in the mammalian brain usingCRISPR-Cas9[使用CRISPR-Cas9在哺乳动物脑中的基因功能的体内探询],Swiech L,Heidenreich M,Banerjee A,Habib N,Li Y,Trombetta J,Sur M,Zhang F.,(在线公开于2014年10月19日)Nat Biotechnol.[自然生物技术]1月;33(1):102-6(2015);
Genome-scale transcriptional activation by an engineered CRISPR-Cas9complex[用工程化的CRISPR-Cas9复合物进行的基因组范围内的转录活化],Konermann S,Brigham MD,Trevino AE,Joung J,Abudayyeh OO,Barcena C,Hsu PD,HabibN,Gootenberg JS,Nishimasu H,Nureki O,Zhang F.,Nature[自然].1月29日;517(7536):583-8(2015).
A split-Cas9architecture for inducible genome editing andtranscription modulation[用于可诱导的基因组编辑和转录调节的分离型Cas9构造],Zetsche B,Volz SE,Zhang F.,(在线公开于2015年2月2日)Nat Biotechnol.[自然生物技术]2月;33(2):139-42(2015);
Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth andMetastasis[在肿瘤生长和转移的小鼠模型中全基因组CRISPR筛选],Chen S,Sanjana NE,Zheng K,Shalem O,Lee K,Shi X,Scott DA,Song J,Pan JQ,Weissleder R,Lee H,ZhangF,Sharp PA.Cell[细胞]160,1246–1260,2015年3月12日(在小鼠中多重筛选),以及
In vivo genome editing using Staphylococcus aureus Cas9[使用金黄色葡萄球菌Cas9进行体内基因组编辑],Ran FA,Cong L,Yan WX,Scott DA,Gootenberg JS,KrizAJ,Zetsche B,Shalem O,Wu X,Makarova KS,Koonin EV,Sharp PA,Zhang F.,(在线公开于2015年4月1日),Nature[自然].4月9日;520(7546):186-91(2015)。
Shalem等人,“High-throughput functional genomics using CRISPR-Cas9[使用CRISPR-Cas9的高通量功能基因组学],”Nature Reviews Genetics[自然综述遗传学]16,299-311(2015年5月)。
Xu等人,“Sequence determinants of improved CRISPR sgRNA design[改进的CRISPR sgRNA设计的序列决定物],”Genome Research[基因组研究]25,1147-1157(2015年8月)。
Parnas等人,“A Genome-wide CRISPR Screen in Primary Immune Cells toDissect Regulatory Networks[在初级免疫细胞中全基因组CRISPR筛选以剖析调节网络],”Cell[细胞]162,675-686(2015年7月30日)。
Ramanan等人,“CRISPR/Cas9cleavage of viral DNA efficiently suppresseshepatitis B virus[病毒DNA的CRISPR/Cas9切割有效地抑制乙型肝炎病毒],”ScientificReports[科学报告]5:10833.doi:10.1038/srep10833(2015年6月2日)
Nishimasu等人,“Crystal Structure of Staphylococcus aureus Cas9[金黄色葡萄球Cas9的晶体结构],”Cell[细胞]162,1113-1126(2015年8月27日)
Zetsche等人(2015),“Cpf1is a single RNA-guided endonuclease of a class2CRISPR-Cas system[Cpf1是2类CRISPR-Cas系统的单一RNA指导的内切核酸酶],”Cell[细胞]163,759-771(2015年10月22日)doi:
10.1016/j.cell.2015.09.038.电子版2015年9月25日
Shmakov等人(2015),“Discovery and Functional Characterization ofDiverse Class 2CRISPR-Cas Systems[不同的2类CRISPR-Cas系统的发现和功能表征],”Molecular Cell[分子细胞]60,385-397(2015年11月5日)doi:10.1016/j.molcel.2015.10.008.电子版2015年10月22日
Dahlman等人,“Orthogonal gene control with a catalytically activeCas9nuclease[使用催化活性Cas9核酸酶的正交基因控制],”Nature Biotechnology[自然生物技术]33,1159-1161(2015年11月)
Gao等人,“Engineered Cpf1Enzymes with Altered PAM Specificities[具有改变的PAM特异性的工程化Cpf1酶],”bioRxiv 091611;doi:http://dx.doi.org/10.1101/091611电子版2016年12月4日
Smargon等人(2017),“Cas13b Is a Type VI-B CRISPR-Associated RNA-GuidedRNase Differentially Regulated by Accessory Proteins Csx27and Csx28[Cas13b是由辅助蛋白Csx27和Csx28差异调节的VI-B型CRISPR相关RNA指导RNA酶],”Molecular Cell[分子细胞]65,618-630(2017年2月16日)doi:10.1016/j.molcel.2016.12.023.电子版2017年1月5日
将它们各自通过引用并入本文,可以在本发明的实践中考虑,并且下文简要讨论:
Cong等人基于嗜热链球菌(Streptococcus thermophilus)Cas9以及还有化脓链球菌Cas9两者工程化了II型CRISPR-Cas系统以用于在真核细胞中使用,并且证实了Cas9分子可以通过短RNA指导以诱导在人类和小鼠细胞中DNA的精确切割。
他们的研究进一步显示Cas9在转化成一种切口酶时可以用来以最低诱变活性促进在真核细胞中的同源定向修复。另外,他们的研究证实多个指导序列可以被编码进单一CRISPR阵列中以使得能够在哺乳动物基因组内的内源基因组基因座位点处同时编辑若干,证实了RNA指导的核酸酶技术的容易可编程性和广泛可应用性。这种使用RNA以编程细胞内序列特异性DNA切割的能力定义了新一类的基因组编辑工具。这些研究进一步显示,其他CRISPR基因座可能是可移植入哺乳动物细胞中的,并且还可以介导哺乳动物基因组切割。重要地,可以设想的是CRISPR-Cas系统的若干方面可以进一步改进以增加其效率和多功能性。
Jiang等人使用与双RNA复合的规律间隔成簇短回文重复(CRISPR)关联的Cas9内切核酸酶,以在肺炎链球菌(Streptococcus pneumoniae)和大肠杆菌的基因组中引入精确的突变。该途径依赖于在靶基因组位点处的双RNA:Cas9-指导的切割,以杀死未突变的细胞,并且回避对选择性标记或反选择系统的需要。该研究报道通过改变短CRISPR RNA(crRNA)的序列以使单一-和多个多核苷酸变化被携带在编辑模板上而重新编程双RNA:Cas9特异性。该研究显示,同时使用两种crRNA使得多重诱变成为可能。另外,当该途径与重组工程组合使用时,在肺炎链球菌中使用描述的途径回收的接近100%的细胞包含希望的突变,并且在大肠杆菌中回收的65%包含突变。
Wang等人(2013)使用CRISPR/Cas系统用于一步生成携带多基因中突变的小鼠,所述小鼠传统上是以多步通过在胚胎干细胞中的连续重组和/或小鼠的与单一突变的耗时性杂交产生的。CRISPR/Cas系统将大大加速功能上丰富的基因和上位基因相互作用的体内研究。
Konermann等人(2013)解决了在本领域中对通用和稳固技术的需要,其使得能够基于CRISPR Cas9酶以及还有转录活化因子样效应物对DNA-结合结构域进行光调节和化学调节。
Ran等人(2013-A)描述了将Cas9切口酶突变体与配对的指导RNA相组合以引入靶向的双链断裂的途径。这解决了以下问题:来自微生物CRISPR-Cas系统的Cas9核酸酶通过指导序列而靶向特异性基因组基因座,其可以耐受与该DNA靶标的某些错配并由此促进不希望的脱靶诱变。因为基因组中的单独切口以高保真性被修复,所以同时经由适当补偿指导RNA而形成切口对于双链断裂是必需的,并且所述切口形成延伸了特异性识别的碱基的数目以用于靶标切割。作者证实了使用配对的切口形成可以降低在细胞系中的脱靶活性50至1,500倍,并且从而促进在小鼠受精卵中的基因敲除而不牺牲中靶切割效率。这个通用策略使得多种多样的要求高特异性的基因组编辑应用成为可能。
Hsu等人(2013)表征了在人细胞中SpCas9靶向特异性以告知靶位点的选择并避免脱靶效应。该研究评价了在293T和293FT细胞中的>100个预测的基因组脱靶基因座处>700个指导RNA变体和SpCas9诱导的indel突变水平。这些作者示出SpCas9以序列依赖性方式耐受指导RNA与靶DNA之间在不同位置处的错配,对错配的数目、位置和分布敏感。这些作者进一步示出SpCas9介导的切割不受DNA甲基化的影响,并且SpCas9和sgRNA的剂量可被滴定为使得脱靶修饰最小化。另外,为了促进哺乳动物基因组工程应用,这些作者报道提供基于网络的软件工具以指导靶序列的选择和验证连同脱靶分析。
Ran等人(2013-B)描述了用于在哺乳动物细胞中Cas9介导的经由非同源末端连接(NHEJ)或同源定向修复(HDR)基因组编辑、连同产生修饰的细胞系(以用于下游功能研究)的一组工具。为了最小化脱靶切割,这些作者进一步描述了一种双切口策略,使用的是Cas9切口酶突变体与配对的指导RNA。由这些作者提供的方案经实验得出用于选择靶位点、评价切割效率和分析脱靶活性的指南。这些研究显示,以靶设计开始,基因修饰可以在少至1–2周内实现,并且修饰的克隆细胞系可以在2-3周内得以衍生。
Shalem等人描述了新的在全基因组范围上探询基因功能的方式。他们的研究显示,递送基因组范围的CRISPR-Cas9敲除(GeCKO)文库利用64,751个独特的指导序列靶向18,080个基因,这些指导序列使得在人类细胞中阴性和阳性选择筛选两者成为可能。首先,这些作者显示,使用该GeCKO文库来鉴定癌症和多能干细胞中对于细胞活力至关重要的基因。接着,在黑色素瘤模型中,这些作者针对基因进行筛选,这些基因的损失涉及对维罗非尼(一种抑制突变体蛋白激酶BRAF的治疗剂)的抗性。他们的研究显示,最高级候选物包括先前验证的基因NF1和MED12连同新颖的命中物NF2、CUL3、TADA2B、和TADA1。这些作者观察到在靶向相同基因的独立指导RNA之间的高水平的同一性以及高比率的命中确认,并且因此证实了采用Cas9进行基因组范围筛选的前景。
Nishimasu等人以2.5A°分辨率报道了与sgRNA复合的化脓链球菌Cas9以及其靶DNA的晶体结构。该结构揭示了一种由靶识别和核酸酶叶片组成的两叶片构造,其将sgRNA:DNA异源双链体容纳在它们的界面处的带正电的凹槽中。然而识别叶片对于结合sgRNA和DNA是至关重要的,核酸酶叶片包含HNH和RuvC核酸酶结构域,这些结构域适合地被定位为分别用于靶DNA的互补和非互补链的切割。核酸酶叶片还包含负责与原型间隔子邻近基序(PAM)相互作用的羧基-末端结构域。这种高分辨率结构和伴随的功能分析已经揭示了RNA-指导的由Cas9进行的DNA靶向的分子机制,由此为合理设计新的通用基因组编辑技术做好准备。
Wu等人标定了在小鼠胚胎干细胞(mESC)中,来自化脓链球菌的无催化活性Cas9(dCas9)(加载有单一指导RNA(sgRNA))的全基因组的结合位点。这些作者显示,测试的四种sgRNA中的每一种将dCas9靶向至数十和数千个之间的基因组位点,这些基因组位点频繁地通过sgRNA中的5-核苷酸种子区和NGG原型间隔子邻近基序(PAM)表征。染色质不可接近性降低了dCas9与具有匹配种子序列的其他位点的结合;因此70%的脱靶位点是与基因相关联的。这些作者显示,在用催化活性的Cas9转染的mESC中295dCas9结合位点的靶向测序鉴定出超过背景水平的仅一个突变位点。这些作者提出了一种针对Cas9结合和切割的两态模型,其中种子匹配触发了结合但是需要与靶DNA的广泛配对用于切割。
Platt等人建立了Cre依赖性Cas9敲入式小鼠。这些作者证明了在神经元、免疫细胞、和内皮细胞中,使用腺相关病毒(AAV)-、慢病毒-、或粒子介导的递送指导RNA进行体内以及离体基因组编辑。
Hsu等人(2014)是综述文章,其总体讨论了CRISPR-Cas9从酸奶到基因组编辑的历史,包括细胞的遗传筛选。
Wang等人(2014)涉及聚池的功能缺失遗传筛选方法,该方法适合用于使用基因组规模的慢病毒单一指导RNA(sgRNA)文库进行的正选择和负选择两者。
Doench等人创建了sgRNA池,覆盖六个内源小鼠基因和三个内源人类基因的一组的全部可能靶位点,并且通过抗体染色和流式细胞术定量地测定了这些sgRNA产生其靶基因的无效等位基因的能力。这些作者显示PAM的优化改进了活性并且还提供了用于设计sgRNA的在线工具。
Swiech等人证明了AAV介导的SpCas9基因组编辑可以使能进行脑中的基因功能的反向遗传学研究。
Konermann等人(2015)讨论了在有和没有接头的情况下,在指导物(例如茎或四核苷酸环)上的适当位置处,附接多种效应物结构域的能力,这些效应物结构域例如转录活化因子、功能和表观基因组调节物。
Zetsche等人证明了Cas9酶可以分离为两个并且因此针对活化而言Cas9的组装可以被控制。
Chen等人涉及通过证明以下进行多重筛选:在小鼠中全基因组的体内CRISPR-Cas9筛选揭示了调节肺转移的基因。
Ran等人(2015)涉及SaCas9以及其编辑基因组的能力,并且证明不能从生物化学测定外推。Shalem等人(2015)描述了催化无活性的Cas9(dCas9)融合用于综合地阻遏(CRISPRi)或活化(CRISPRa)表达的方式,示出使用Cas9用于基因组规模的筛选(包括阵列式和聚池筛选)的进展、使基因组基因座失活的敲除途径、以及调节转录活性的策略。
Shalem等人(2015)描述了催化无活性的Cas9(dCas9)融合用于综合地阻遏(CRISPRi)或活化(CRISPRa)表达的方式,示出使用Cas9用于基因组规模的筛选(包括阵列式和聚池筛选)的进展、使基因组基因座失活的敲除途径、以及调节转录活性的策略。
Xu等人(2015)评估了在基于CRISPR的筛选中促成单一指导RNA(sgRNA)效率的DNA序列特征。这些作者探索了CRISPR/Cas9敲除的效率以及在切割位点处的核苷酸优选性。这些作者还发现对于CRISPRi/a的序列优选性基本上不同于对于CRISPR/Cas9敲除的序列优选性。
Parnas等人(2015)将全基因组聚池的CRISPR-Cas9文库引入树突细胞(DC)中,以鉴定控制由细菌脂多糖(LPS)对肿瘤坏死因子(Tnf)的诱导的基因。对Tlr4信号传导的已知调节物和先前未知的候选物进行鉴定,并根据对于对LPS的典型响应的不同效果分成三个功能模块。
Ramanan等人(2015)证明了在受感染细胞中对病毒附加体DNA(cccDNA)的切割。HBV基因组作为3.2kb双链附加体DNA种类存在于受感染的肝细胞的细胞核中,该种类称为共价闭合环状DNA(ccc DNA),其是HBV生命周期中的关键组分,其复制不受目前疗法的抑制。这些作者显示特异性靶向HBV的高度保守区的sgRNA稳固地抑制病毒复制并耗减cccDNA。
Nishimasu等人(2015)报道了SaCas9的晶体结构,该SaCas9与单一指导RNA(sgRNA)以及其包含5'-TTGAAT-3'PAM和5'-TTGGGT-3'PAM的双链DNA靶标复合。SaCas9与SpCas9的结构比较突出显示出结构保存和差别,解释了它们不同的PAM特异性和直向同源性sgRNA识别。
Zetsche等人(2015)报道了Cpf1,一种假定的2类CRISPR效应蛋白的表征。已证实Cpf1介导具有不同于Cas9特征的稳健的DNA干扰。鉴定这种干扰机制扩大了我们对CRISPR-Cas系统的理解并推进了它们的基因组编辑应用。
Shmakov等人(2015)报道了三种不同的2类CRISPR-Cas系统的表征。两种鉴定的系统C2c1和C2c3的效应蛋白含有与Cpf1远缘相关的RuvC样内切核酸酶结构域。第三个系统C2c2包含具有两个预测的HEPN RNA酶结构域的效应蛋白。
Gao等人(2016)报道了使用结构指导的饱和诱变筛选来增加Cpf1的靶向范围。AsCpf1变体用突变S542R/K607R和S542R/K548V/N552R工程化,这些突变可以分别用TYCV/CCCC和TATV PAM切割靶位点,在体外和人细胞中具有增强的活性。
而且,“Dimeric CRISPR RNA-guided FokI nucleases for highly specificgenome editing[二聚CRISPR RNA指导的FokI核酸酶用于高度特异性基因组编辑]”,Shengdar Q.Tsai,Nicolas Wyvekens,Cyd Khayter,Jennifer A.Foden,Vishal Thapar,Deepak Reyon,Mathew J.Goodwin,Martin J.Aryee,J.Keith Joung NatureBiotechnology[然生物技术]32(6):569-77(2014)涉及二聚RNA指导的FokI核酸酶,其识别延伸序列并且可以高效率地编辑人细胞中的内源基因。
此外,提及的是标题为“用于使用粒子递送组分靶向障碍和疾病的CRISPR-CAS系统和组合物的递送、用途和治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OFTHE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASESUSING PARTICLE DELIVERY COMPONENTS)”的PCT申请PCT/US14/70057,案卷参考号47627.99.2060和BI-2013/107(要求来自以下一个或多个或所有美国临时专利申请的权益:提交于2014年9月24日的62/054,490;提交于2014年6月10日的62/010,441;以及各自提交于2013年12月12日的61/915,118、61/915,215和61/915,148)(“粒子递送PCT(ParticleDelivery PCT)”),通过引用并入本文,关于一种制备含有sgRNA-和-Cas9蛋白的粒子的方法,该方法包括将包含sgRNA和Cas9蛋白(和任选地HDR模板)的混合物与以下混合物混合,该混合物包含表面活性剂、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其组成或由其组成;以及来自这样的工艺的粒子。例如,其中使Cas9蛋白和sgRNA在适合的温度(例如,15℃-30℃,例如,20℃-25℃,例如,室温)下以适合的摩尔比(例如,3:1至1:3或2:1至1:2或1:1)有利地在无菌、无核酸酶缓冲液(例如,1X PBS)中一起混合适合的时间(例如,15-45,如30分钟)。分开地,粒子组分如或包含:表面活性剂(例如,阳离子脂质(例如,1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)));磷脂(例如,二肉豆蔻磷脂酰胆碱(DMPC));可生物降解的聚合物(例如,乙二醇聚合物或PEG)、以及脂蛋白,如低密度脂蛋白,例如,胆固醇溶解于醇中,有利的是C1-6烷基醇,如甲醇、乙醇、异丙醇,例如,100%乙醇。将这两种溶液混合在一起以形成含有Cas9-sgRNA复合物的粒子。因此,在粒子中配制整个复合物之前,可以使sgRNA与该Cas9蛋白预复合。可以用不同摩尔比的不同组分来制备配制品,已知这些不同组分促进核酸递送进细胞中(例如,1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)、1,2-双十四酰-sn-甘油基-3-磷酸胆碱(DMPC)、聚乙二醇(PEG)以及胆固醇)。例如DOTAP:DMPC:PEG:胆固醇摩尔比可以是DOTAP 100、DMPC 0、PEG 0、胆固醇0;或DOTAP 90、DMPC 0、PEG10、胆固醇0;或DOTAP90、DMPC 0、PEG 5、胆固醇5。DOTAP 100、DMPC 0、PEG 0、胆固醇0。因此,该申请包括将sgRNA、Cas9蛋白和形成粒子的组分混合;连同来自这样的混合的粒子。本发明的方面可以涉及粒子;例如,使用类似于粒子递送PCT的工艺的粒子,例如通过将如在本发明中的sgRNA和/或Cas9蛋白的混合物和形成粒子的组分混合,例如如在粒子递送PCT中,以形成粒子;以及来自这样的混合的粒子(或者,当然,涉及如在本发明中的sgRNA和/或Cas9的其他粒子)。
实例
实例1:Cas13a家族的表征
申请人使用氨苄青霉素抗性细菌测定(图3A)综合评估了15种Cas13a直向同源物的PFS偏好和活性(图57A)。简而言之,Cas13a被编程成靶向β-内酰胺酶转录物的5'段序列,其侧翼为随机化的PFS核苷酸。Cas13a切割活性导致细菌在氨苄青霉素选择下死亡,随后通过下一代测序分析PFS消耗。为了允许直向同源物之间的定量比较,申请人在pLac启动子下克隆了每种Cas13a直向同源物以及在pJ23119小RNA启动子的表达下附近的单间隔子CRISPR阵列。将PFS质粒文库在大肠杆菌中与每种Cas13a直向同源质粒共转化后,申请人通过转化体计数测量了细菌存活率,发现来自韦德纤毛菌的Cas13a直向同源物(LwaCas13a)最活跃,其次是沙氏纤毛菌Cas13a(LshCas13a)(图3C、3D)。来自LwaCas13a和LshCas13a筛选的PFS分布的下一代测序分析揭示大多数LwCas13a PFS序列被耗竭(图3G和57B、57C),表明稳健的LwCas13a RNA切割活性。实际上,在不同阈值下耗竭的PFS序列的基序分析揭示了LshCas13a的预期3'H基序,但是对于LwCas13a没有显著的PFS基序(图3H、56D、56E)。在用于核酸检测的LwCas13a的最近开发中,申请人发现LwCas13a比LshCas13a更活跃,并且通过生物化学表征发现了弱的3'H PFS。发现LwCas13a在测试的15种Cas13a直向同源物中最活跃,并且在细菌中没有PFS。
实例2:真核细胞中C2c2的表达
以下C2c2直向同源物针对在哺乳动物细胞中表达进行了密码子优化。
C2c2直向同源物 编码 多字母
沙氏纤毛菌 C2-2 Lsh
韦德纤毛菌F0279(Lw2) C2-3 Lw2
塞氏李斯特菌 C2-4 Lse
毛螺菌科细菌MA2020 C2-5 LbM
毛螺菌科细菌NK4A179 C2-6 LbNK179
嗜氨基梭菌DSM 10710 C2-7 Ca
鸡肉杆菌DSM 4847 C2-8 Cg
鸡肉杆菌DSM 4847 C2-9 Cg2
产丙酸沼杆菌WB4 C2-10 Pp
威氏李斯特菌FSL R9-0317 C2-11 Lwei
李斯特菌科细菌FSL M6-0635 C2-12 LbFSL
韦德纤毛菌F0279 C2-13 Lw
荚膜红细菌SB 1003 C2-14 Rc
荚膜红细菌R121 C2-15 Rc
荚膜红细菌DE442 C2-16 Rc
上述物种的蛋白质序列列于下表中。
制备每种C2c2直向同源物与mCherry和任选地NLS或NES的融合构建体并克隆到哺乳动物表达载体中(图1A)。在HEK293T细胞中转染各种C2c2直向同源物,并基于mCherry表达评估细胞定位。图1B、1C和1D分别显示了当融合至C末端和N末端NES时、当融合至C末端和N末端NLS时或没有NES或NLS融合时,不同C2c2直向同源物的代表性定位。NES融合有效地导致C2c2蛋白的细胞质定位。NLS融合有效地导致C2c2蛋白的核定位。可变地,用NLS融合也可以观察到核仁定位。当C2c2未与NLS或NES融合时,观察到可变的细胞质/核定位。
实例3:真核细胞中C2c2(Cas13a)的活性
如图2所示用针对Gluc的不同gRNA进行荧光素酶靶向测定。C2c2直向同源物韦德纤毛菌F0279(Lw2)和纽约李斯特菌FSL M6-0635(LbFSL)与NLS或NES融合,或可替代地不与定位信号融合。测定荧光素酶的归一化蛋白质表达并与非靶向(NT)gRNA进行比较。结果示于图4中。有效的敲低显而易见。如图4A和4B所描绘的实验中使用的间隔子序列如下:
图4A
指导物1 ATCAGGGCAAACAGAACTTTGACTCCca
指导物2 AGATCCGTGGTCGCGAAGTTGCTGGCCA
指导物3 TCGCCTTCGTAGGTGTGGCAGCGTCCTG
指导物NT tagattgctgttctaccaagtaatccat
图4B
指导物1 TCGCCTTCGTAGGTGTGGCAGCGTCCTG
指导物NT tagattgctgttctaccaagtaatccat
如图2C中所示用针对EGFP的不同gRNA进行基于GFP表达的靶向测定。C2c2直向同源物韦德纤毛菌F0279(Lw2)和纽约李斯特菌FSL M6-0635(LbFSL)与NLS或NES融合,或可替代地不与定位信号融合。测定GFP的归一化表达并与非靶向(NT)gRNA进行比较。结果示于图5中。有效的敲低显而易见。如图5A和5B所描绘的实验中使用的间隔子序列如下:
图5A
指导物1 tgaacagctcctcgcccttgctcaccat
指导物2 tcagcttgccgtaggtggcatcgccctc
指导物3 gggtagcggctgaagcactgcacgccgt
指导物4 ggtcttgtagttgccgtcgtccttgaag
指导物5 tactccagcttgtgccccaggatgttgc
指导物6 cacgctgccgtcctcgatgttgtggcgg
指导物7 tctttgctcagggcggactgggtgctca
指导物8 gacttgtacagctcgtccatgccgagag
指导物NT tagattgctgttctaccaagtaatccat
图5B
指导物2 tcagcttgccgtaggtggcatcgccctc
指导物3 gggtagcggctgaagcactgcacgccgt
指导物4 ggtcttgtagttgccgtcgtccttgaag
指导物5 tactccagcttgtgccccaggatgttgc
指导物6 cacgctgccgtcctcgatgttgtggcgg
指导物7 tctttgctcagggcggactgggtgctca
指导物8 gacttgtacagctcgtccatgccgagag
指导物NT tagattgctgttctaccaagtaatccat
用针对内源靶基因的gRNA对HEK293细胞中的不同内源靶基因进行靶向测定。将C2c2韦德纤毛菌F0279(Lw2)与NES融合。测定各靶基因的归一化蛋白质表达(与非靶向(NT)gRNA比较)。结果示于图7中。有效的敲低显而易见。如图7所描绘的实验中使用的间隔子序列如下:
图7
CTNNB1 ctgctgccacagaccgagaggcttaaaa
PPIB tccttgattacacgatggaatttgctgt
mAPK14 tcaaggtggggtcacaggagaagccaaa
CXCR4 atgataatgcaatagcaggacaggatga
TINCR gcgtgagccaccgcgcctggccggctgt
PCAT1 ccagctgcagatgctgcagtttttggcg
CAPN1 ctggaaatggaagatgccggcatagcca
LETMD1 gatgacacctcacacggaccacccctag
MAPK14 taatactgctccagatatgggtgggcca
RB1 catgaagaccgagttatagaatactata
TP53 ggtgaaatattctccatccagtggtttc
KRAS aatttctcgaactaatgtatagaaggca
实例4:用融合至翻译活化因子/启动子的无催化活性C2c2进行的真核细胞中的翻译上调
产生无催化活性的C2c2直向同源物韦德纤毛菌F0279(Lw)和纽约李斯特菌FSLM6-0635(LbFSL)。
将Lw C2c2融合至NES或无定位信号和任选地EIF4E。
将LbFSL融合至NLS和任选地EIF4E。
靶向Gluc(参见图2)。
基于具有和不具有EIF4E的情况下C2c2靶向之间的比较来评估相对蛋白质表达。
结果示于图10中。
有效的翻译上调显而易见。在如图10所描绘的实验中使用的间隔子序列是tagattgctgttctaccaagtaatccat,并且靶标具有此间隔子的3x结合位点。
实例5:用NaASO2处理后C2c2及其靶标β-肌动蛋白的共定位
研究了在亚砷酸钠(NaAsO2)影响下靶向β-肌动蛋白的C2c2的定位。制备韦德纤毛菌C2c2与mCherry和NES的融合构建体,并将其与靶向β-肌动蛋白的指导物或非靶向指导物一起克隆到哺乳动物表达载体中。基于mCherry表达评估C2c2的细胞定位,用G3BP1-GFP标记应激颗粒。发现靶向β肌动蛋白的Lw C2c2在用NaAsO2处理后定位至应激颗粒(图11A)。这种定位是指导物依赖性的,仅见于β-肌动蛋白靶向指导物而未见于非靶向指导物(图11B、11C)。
实例6:替代的crRNA启动子用于增强敲低活性
为了进一步增加干扰效应,将crRNA置于U6启动子的控制之下。
为了提高C2c2的干扰效率,比较了使用tRNA-crRNA和U6驱动的crRNA和shRNA靶向的基因的表达。观察到可靠的靶基因敲低,其效率与shRNA相当(图12、图14)。进行进一步的实验以确定增加crRNA转染量(图13)、增加蛋白质转染量(图15)的效果和DR-间隔子-DR-间隔子构建体的效果(图16)。发现对于内源基因上的相应靶标而言,C2c2优于经优化的shRNA。
实例7:与C2c2的融合构建体
如图18所证明的,dLw2C2c2-EIF4E融合可以上调三个基因的翻译;蛋白质水平通过western印迹上的条带强度测量。
实例8:靶标诱导的非特异性RNA酶活性
C2c2靶标诱导的非特异性RNA酶活性可用于检测样品中的RNA种类。在感兴趣的RNA靶标的存在下,指导物依赖性的C2c2核酸酶活性伴随着针对附带靶标的非特异性RNA酶活性。例如,包含荧光部分和荧光淬灭剂的报告RNA被活化的C2c2非特异性切割。RNA底物一端用荧光报告分子(荧光剂)标记,并且另一端用淬灭剂标记。在没有C2c2RNA酶活性的情况下,淬灭剂的物理邻近性将荧光剂的荧光衰减到低水平。当C2c2靶标特异性切割被活化时,RNA底物被非特异性切割,并且荧光剂和淬灭剂在空间上分开。这导致荧光剂在被适当波长的光激发时发出信号。这种测定的示意图显示在图24A中。
实例9:Lw2C2c2(LwaCas13a)的生物化学表征
方法基本上如以下文献所描述:Abudayyeh等人(2016)“C2c2is a single-component programmable RNA-guided RNA-targeting CRISPR effector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物]”;Science[科学]353(6299),DOI:10.1126/science.aaf5573;并且通过引用并入本文。
由于LwaCas13a在细菌细胞中的理想切割活性,申请人探索了进一步的生物化学表征,以便在哺乳动物细胞中测试之前更好地理解其切割。LshCas13a和LwaCas13a的体外切割反应证明了用编码28nt间隔子的指导物进行的可编程靶切割和对Mg2+的需要(图3I),并且证实了LwaCas13a相对于LshCas13a的体内效率增加。用LwaCas13a和指导物孵育单链RNA靶标(ssRNA 1)在2分钟内显示出可检测的切割,在孵育30分钟后几乎完全切割,而没有指导物的LwaCas13a没有可观察到的切割(图37),并且切割关于LwaC2c2-指导物复合物水平是剂量依赖性的(图36)。鉴于刻板切割产物的出现,申请人假设LwaCas13a切割模式是靶标依赖性的,类似于LshCas13a(Abudayyeh,O.O.等人C2c2is a single-componentprogrammable RNA-guided RNA-targeting CRISPR effector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物].Science[科学]353,aaf5573,doi:10.1126/science.aaf5573(2016))。用具有各种计算机预测的二级结构的多个RNA靶标孵育(图42)揭示了显著不同的切割模式(图42)。为了确定LwaCas13a切割是否依赖于靶标上暴露的单链区域中的碱基同一性,申请人在靶标(经修饰的ssRNA靶标4)上孵育LwaCas13a,该靶标在环中具有均聚物取代(图43)。申请人发现了具有C或U取代的靶标的更强切割(图43),显示LwaCas13a比LshCas13a具有更多的底物灵活性,LshCas13a优先在U残基处切割(Abudayyeh,O.O.等人C2c2is a single-component programmable RNA-guided RNA-targeting CRISPR effector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物].Science[科学]353,aaf5573,doi:10.1126/science.aaf5573(2016))。除了靶RNA酶活性之外,据报道Cas13家族从韦德纤毛菌加工其自身相应的前crRNA转录物(图43C)(East-Seletsky,A.等人Two district RNase activities of CRISPR-C2c2enable guide-RNAprocessing and RNA detection[CRISPR-C2c2的两种不同的RNA酶活性使得指导RNA加工和RNA检测成为可能],Nature[自然]538,270-273(2016))。申请人还通过截短间隔子或同向重复(DR)序列探索了对LwaCas13a切割的指导物限制。申请人发现LwaCas13a保留了体外切割活性,间隔子长度短至20nt(图41),并且能以DR截短切割到短至27nt(图40),尽管一个DR长度截短(32nt)似乎消除了活性,可能是由于二级结构微扰。虽然小于20nt的指导物长度不再展示催化活性,但LwaCas13-指导物复合物仍然可以保持结合活性,从而允许使用单一催化酶的正交应用(Dahlman,J.E.等人Orthogonal gene knockout and activationwith a catalytically active Cas9nuclease[使用催化活性Cas9核酸酶的直向同源基因敲除和活化].Nat Biotechnol.[自然生物技术]33,1159-1161,doi:10.1038/nbt.3390(2015))。
已经发现Cas13家族具有用于加工全长CRISPR转录物的双RNA酶活性(East-Seletsky,A.等人Two distinct RNase activities of CRISPR-C2c2enable guideprocessing and RNA detection[CRISPR-C2c2的两种不同的RNA酶活性使得指导物加工和RNA检测成为可能].Nature[自然]538,270-273,doi:10.1038/nature19802(2016)),以类似于Cpf1的方式(Fonfara,I.,Richter,H.,Bratovic,M.,Le Rhun,A.和Charpentier,E.The CRISPR-associated DNA-cleaving enzyme Cpf1also processes precursorCRISPR RNA[CRISPR相关的DNA切割酶Cpf1也加工前体CRISPR RNA].Nature[自然]532,517-521,doi:10.1038/nature17945(2016);Zetsche,B.等人Multiplex gene editing byCRISPR-Cpf1using a single guide array[使用单指导物阵列通过CRISPR-Cpf1进行多重基因编辑].Nat Biotechnol.[自然生物技术]35,31-34,doi:10.1038/nbt.3737(2017))。申请人发现LwaCas13a可以从韦德纤毛菌切割相应的CRISPR间隔子转录物(图3J),并且这种切割是浓度依赖性的(图15B)。此外,LwaCas13a在通过凝胶电泳(图24C)分离的RNA产物上显示出附带活性(图24B),证实了先前通过切割淬灭荧光团来表征附带活性(Gootenberg,J.S.等人Nucleic acid detection with CRISPR-Cas13a/C2c2[用CRISPR-Cas13a/C2c2进行核酸检测].Science[科学]印刷中(2017))。
韦德纤毛菌F0279(Lwa2)C2c2用于体外测定以评估切割动力学(图36-37)、切割活性对阳离子存在的依赖性(图38)、PFS偏好(图39)、同向重复长度的影响(图40)、间隔子长度的影响(图41)、靶RNA序列和二级结构的影响(图42)以及核苷酸切割偏好(图43)。
实例10:LwaCas13a可以被重新编程成敲低报告mRNA
鉴于LwaCas13a具有稳健的RNA切割活性和灵活的序列偏好,申请人决定评估其切割哺乳动物细胞中转录物的能力。申请人首先将哺乳动物密码子优化的LwaCas13a克隆到哺乳动物表达载体中,这些表达载体在C-末端或N-末端具有msfGFP融合物以及双侧翼核输出序列(NES)或核定位序列(NLS),并评估表达和定位(图1D)。申请人发现msfGFP融合的LwaCas13a构建体表达良好并且根据定位序列有效地定位至细胞质或细胞核。为了评估LwaCas13a的体内切割活性,申请人开发了双荧光素酶报告系统,其在同一载体上在不同启动子下表达Gaussia荧光素酶(Gluc)和Cypridinia荧光素酶(Cluc),允许一个转录物充当Cas13a靶标并且另一个充当剂量对照(图2A)。申请人然后设计了针对Gluc的指导物并将它们克隆到tRNAVal-启动子-表达指导物载体中。申请人将LwaCas13a表达载体、指导物载体和双荧光素酶构建体转染到HEK293FT中并在转染后48小时测量荧光素酶活性。申请人发现核定位的LwaCas13a-msfGFP导致最高水平的敲低(指导物1为75.7%,指导物2为72.9%),与位置匹配的shRNA对照相当(指导物1为78.3%,指导物2为51.1%)(图6B),其控制靶标区域中的可及性和序列。由于LwaCas13a-msfGFP-NLS构建体的优异切割,申请人将此设计用于所有进一步的敲低实验。核定位的LwaCas13a-msfGFP也比mCherry融合形式更好,可能是由于msfGFP提供的增强的稳定性。通过工程化融合物操纵LwaCas13a活性的能力突出了Cas13a工具的灵活性。LwaCas13a还能够在A375黑色素瘤细胞系中敲低(图6A、图9),证明了Cas13的多功能性。申请人还发现LwaCas13a产生最好的Gluc敲低,间隔子长度为28nt(73.8%)(图6C),并且该敲低对蛋白质和指导物或crRNA转染的载体量均具有剂量响应(图56A、56B)。指导物表达对启动子选择不敏感,并且由tRNAVal或U6启动子表达的指导物或crRNA导致相似水平的Gluc敲低(tRNAval为66.3%,U6为74.5%)(图56C)。
申请人接下来测试了以下三个内源基因上的敲低:KRAS、CXCR4和PPIB,发现不同水平的敲低,并且对于3个基因中的2个,LwaCas13a敲低(PPIB为40.4%,CXCR4为83.9%,KRAS为57.5%)类似于具有位置匹配的shRNA的RNAi(PPIB为63.0%,CXCR4为73.9%,KRAS为44.3%)(图3O)。申请人还发现,内源基因敲低对于指导启动子选择是灵活的,由tRNAVal或U6启动子表达的指导物有相似的敲低水平(tRNAVal为86.7%,U6为77.6%)(图56D)。申请人还发现LwaCas13a能够在A375黑色素瘤细胞系中敲低(图56E)。为了扩展LwaCas13a敲低的多功能性,申请人设计了针对水稻(稻)基因EPSPS、HCT和PDS的转录物的指导物,并将LwaCas13a和指导物载体共转染到稻原生质体中(图3P)。转染后,申请人观察到测试的所有三个基因和9种指导物中的7种的敲低>50%,最大敲低为78.0%(图3Q)。总之,这些结果表明LwaCas13a能够介导与RNAi相似的RNA敲低水平。进一步探索Cas13家族的其他成员可能会揭示能够实现甚至更强效敲低效果的蛋白质。
实例11:报告分子和内源转录物的LwaCas13a敲低筛选
为了全面表征RNA背景对LwaCas13a敲低效率的依赖性,申请人利用LwaCas13a的可编程性沿着Gluc、KRAS、PPIB或Cluc转录物的长度平铺指导物(图32A)。Gluc和Cluc筛选揭示了具有超过60%敲低的指导物(图32),并且大多数Gluc靶向指导物具有超过50%的敲低,最大敲低高达83%。为了将LwaCas13a敲低与RNAi进行比较,申请人选择了针对Gluc和Cluc的前三种执行指导物,并将它们与位置匹配的shRNA进行比较。申请人发现,前六种执行指导物中的五种实现了显著高于其匹配的shRNA的敲低水平(p<0.05)(图32D)。
已经证明了对报告基因的稳健敲低,申请人接下来探索了Cas13a是否可以通过平铺两个基因KRAS和PPIB而被工程化为靶向内源转录物。申请人发现,虽然敲低效率是转录物依赖性的,但申请人仍然可以找到能够在任一靶标上实现50%敲低的指导物,KRAS和PPIB的最大敲低分别为85%和75%(图49A、49B)。申请人还发现,内源基因敲低对于指导物表达设计是灵活的,由tRNAVal或U6启动子表达的crRNA有相似的敲低水平(图56D)。
为了进一步理解LwaCas13敲低与RNAi的效率,申请人将多种指导物和与相同靶区域位置匹配的shRNA构建体进行比较。申请人从每个内源平铺筛选(KRAS和PPIB)中选择前三种指导物,并观察到Cas13a的稳健敲低(53.7%-88.8%),相当于由shRNA敲低所获得的水平(61.8%-95.2%),对6种指导物中的2种shRNA更好(p<0.01),而对于6种指导物中的2种Cas13a更好(p<0.01)(图49H)。
实例12:LwaCas13a敲低在靶转录物中的可及位点处是最佳的
由于申请人发现LshCas13a活性受大肠杆菌中靶标可及性的控制(Abudayyeh,O.O.等人C2c2is a single-component programmable RNA-guided RNA-targetingCRISPR effector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物].Science[科学]353,aaf5573,doi:10.1126/science.aaf5573(2016)),申请人决定研究针对位于沿在我们的指导物平铺筛选中靶向的四种转录物的可及性区域中的指导物,LwaCas13a活性是否增加。申请人首先发现,最有效的指导物似乎聚类到确定的区域(图58A),并通过比较有效指导物与零分布之间的成对距离,申请人观察到的指导物显著比在所有四种转录物上偶然预期的更接近(图58A)。这些初始聚类结果表明,可及性区域可以富集更好的LwaCas13a切割活性。
为了证实转录物可及性影响LwaCas13a活性,申请人计算预测了每种转录物上所有靶区域的可及性,并发现这些计算预测与敲低效率部分相关(图58B-58D)。在四种靶向转录物中,预测的靶标可及性可以解释靶向效率的一些变化(敲低变化4.4%-16%),指示虽然可及性是敲低效率的决定因素,但其他因素(如碱基同一性、序列特性和蛋白质与RNA的结合)也可能在靶向效率中起重要作用。未来更广泛的筛选可能会更清楚地阐明这些机制。
实例13:在内源转录物上LwaCas13a敲低和RNAi的比较
为了进一步理解LwCas13敲低与RNAi的效率,申请人将多种指导物和与相同靶区域匹配的shRNA构建体进行比较。申请人首先从每个内源平铺筛选(KRAS和PPIB)中选择前三种指导物,并观察到Cas13a的稳定敲低,几乎每种指导物都具有相当于shRNA的敲低(图49C)。为了进一步与shRNA比较,申请人还在通过RNAxs算法预测的KRAS、PPIB和CXCR4的可及性区域中设计了Cas13a crRNA,并发现了与shRNA相当的敲低水平(图48D)。
实例14:MALAT1IncRNA的LwaCas13a敲低筛选
因为LwaCas13a可以被工程化用于细胞定位,所以它具有多功能性,因此细胞的区室可以被靶向用于RNA敲低。申请人设计了均匀平铺在整个核定位的lncRNA MALAT1转录物上的93种指导物,并用核定位的LwaCas13a转染这些指导物。申请人发现了不同水平的敲低,在一个实验中敲低多达约40%至50%(图49E)。与位置匹配的shRNA(其显示没有可检测的敲低(p>0.05))相比,Cas13a实现了显著更高的敲低水平(39.0%-66.5%,p<0.05)(图49J)。申请人还平铺了lncRNA XIST转录物,并且在所有指导物中发现平均22.0%和最大83.9%的敲低(图56F)。
实例15:内源转录物的多重化敲低
具有CRISPR阵列加工活性的其他CRISPR效应物(如Cpf1)已经通过在一个启动子下表达许多指导物而被用于多重化基因编辑(Zetsche,B.等人Multiplex gene editingby CRISPR-Cpf1using a single guide array[使用单个指导阵列通过CRISPR-Cpf1进行的多重化基因编辑].Nat Biotechnol.[自然生物技术]35,31-34,doi:10.1038/nbt.3737(2017))。因为LwaCas13a可以加工其自己的阵列,申请人决定测试作为在单个启动子下表达的CRISPR阵列的LwaCas13a指导物的多重化递送。申请人针对内源PPIB、CXCR4、KRAS、TINCR和PCAT转录物设计了五种不同的指导物,并在U6启动子的表达下将靶向系统作为CRISPR阵列递送,该阵列具有28nt指导物,侧翼为36nt同向重复(DR),代表未加工的DR和截短的间隔子。通过这种方法,申请人发现每个基因的敲低水平与单个或聚池指导物对照相当(图49F)。
由于担心脱靶LwaCas13a活性可能导致CRISPR阵列靶向的五种转录物的非特异性敲低,申请人设计了多重化递送针对PPIB、CXCR4和KRAS的三种指导物和三种变体的实验,其中三种指导物中每种被替换为非靶向指导物。申请人发现,在阵列中不存在指导物的每种情况下,缺失指导物靶向的转录物没有显著的敲低,并且仅靶向的转录物被LwaCas13a敲低,证明敲低不是由于转录物的非特异性降解,但实际上是由于LwaCas13a的特异性多重化敲低(图49G)。
实例16:LwaCas13a敲低对错配敏感
特异性是核酸靶向工具的主要关注点,并且RNAi和Cas9DNA靶向系统的特异性(Mali,P.等人CAS9transcriptional activators for target specificity screeningand paired nickases for cooperative genome engineering[用于靶特异性筛选的CAS9转录活化因子和用于协同基因组工程的配对切口酶].Nat Biotechnol.[自然生物技术]31,833-838,doi:10.1038/nbt.2675(2013);Fu,Y.等人High-frequency off-targetmutagenesis induced by CRISPR-Cas nucleases in human cells[人类细胞中CRISPR-Cas核酸酶诱导的高频脱靶诱变].Nat Biotechnol.[自然生物技术]31,822-826,doi:10.1038/nbt.2623(2013);Pattanayak,V.等人High-throughput profiling of off-target DNA cleavage reveals RNA-programmed Cas9nuclease specificity[脱靶DNA切割的高通量剖析揭示RNA编程的Cas9核酸酶特异性].Nat Biotechnol.[自然生物技术]31,839-843,doi:10.1038/nbt.2673(2013);Hsu,P.D.等人DNA targeting specificity ofRNA-guided Cas9nucleases[RNA指导的Cas9核酸酶的DNA靶向特异性].Nat Biotechnol.[自然生物技术]31,827-832,doi:10.1038/nbt.2647(2013);Doench,J.G.等人OptimizedsgRNA design to maximize activity and minimize off-target effects of CRISPR-Cas9[优化sgRNA设计以最大化CRISPR-Cas9的活性并最小化其脱靶效应].NatBiotechnol.[自然生物技术]34,184-191,doi:10.1038/nbt.3437(2016))已被广泛表征。LshCas13a的初始表征显示它在体外对少至两个的错配可能是敏感的(Abudayyeh,O.O.等人C2c2is a single-component programmable RNA-guided RNA-targeting CRISPReffector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物].Science[科学]353,aaf5573,doi:10.1126/science.aaf5573(2016)),并且通过附带效应对LwaCas13a进行的特异性剖析(Gootenberg,J.S.等人Nucleic acid detection with CRISPR-Cas13a/C2c2[使用CRISPR-Cas13a/C2c2进行核酸检测].Science[科学]印刷中(2017))揭示了辨别可以在双核苷酸分辨率下实现,在指导物:靶标双链体的种子区域中为单核苷酸分辨率。为了研究Cas13a的体内特异性,申请人将错配引入靶向Gluc(图29A)或内源基因CXCR4、KRAS和PPIB(图29B、图59A-59B)的指导物中。申请人发现,对于所有转录物,指导物:靶双链体的中心区域对单个错配最敏感,与之前Cas13a特异性的体外表征一致(Abudayyeh,O.O.等人C2c2is a single-component programmable RNA-guided RNA-targeting CRISPReffector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物].Science[科学]353,aaf5573,doi:10.1126/science.aaf5573(2016))。虽然种子区域的敲低减少,但申请人发现单个错配不足以对一些靶标(如Gluc)具有实质水平的特异性。针对Gluc的间隔子的连续双错配的平铺(图29A)揭示双错配导致活性降低高达8倍,显示Cas13a作为特异性体内靶向工具的前景。申请人还研究了非连续双错配的影响,发现除了位于指导物序列的5'或3'末端的双错配外,大多数双错配将敲低从80.4%降低至小于60%(图59C)。
为了在体外跨多个特异性参数进一步表征Cas13a,申请人使用了附带活性的检测(Gootenberg,J.S.等人Nucleic acid detection with CRISPR-Cas13a/C2c2[用CRISPR-Cas13a/C2c2进行核酸检测].Science[科学]印刷中(2017))作为直接Cas13a活性的代用品。鉴于Cas9实验的结果显示通过较短的间隔子长度可以增加特异性(Fu,Y.,Sander,J.D.,Reyon,D.,Cascio,V.M.和Joung,J.K.Improving CRISPR-Cas nucleasespecificity using truncated guide RNAs[使用截短的指导RNA改进CRISPR-Cas核酸酶特异性].Nat Biotechnol[自然生物技术]32,279-284,doi:10.1038/nbt.2808(2014)),申请人想知道间隔子长度是否对针对因单个错配而不同的两个靶标的Cas13a特异性有影响。申请人发现,虽然较短的间隔子活性降低(图59D),正如我们的体内LwaCas13a结果所预期的那样,较短的间隔子也具有改进的单碱基错配区分(图59D、59E)。申请人接下来探索了是否可以通过在间隔子序列中设计另外的合成错配来改进特异性,因为该方法已成功用于LwaCas13a体外的单错配区分(Gootenberg,J.S.等人Nucleic acid detection withCRISPR-Cas13a/C2c2[用CRISPR-Cas13a/C2c2进行核酸检测].Science[科学]印刷中(2017))。申请人发现,与全长间隔子(图59F、59G)相比,截短至23nt(59H、59I)或20nt(图59J、59K)的间隔子具有较低的总活性但具有显著增加的特异性。总之,LwaCas13a的体外和体内工程化显示出其用作特异性敲低工具的前景。工程化指导物以赋予单碱基特异性的能力应促进LwaCas13a的等位基因特异性转录物敲低。
实例17:用LwaCas13a进行的转录物敲低具有高特异性
为了全面理解是否存在LwaCas13a敲低的任何脱靶效应,申请人进行了全转录组mRNA测序。申请人用LwaCas13a或位置匹配的shRNA构建体靶向Gluc转录物,并发现了靶转录物的显著敲低(图29B-A)。两个内源基因KRAS和PPIB的相同比较发现了类似的结果(图29B-B、29B-C)。在靶向和非靶向对照之间,与LwaCas13a条件相比,shRNA条件具有更多的全转录组变化以及更弱的相关性,表明shRNA靶向实验中有更多的脱靶。申请人通过差异表达分析进一步表征了显著脱靶的数目,并且发现了每种shRNA条件中的数百个脱靶,但在LwaCas13a条件下发现了零脱靶(图30A),尽管靶转录物的敲低水平相当(shRNA为30.5%、43.5%和64.7%,Cas13a为62.6%、27.1%和29.2%,分别对于Gluc、KRAS和PPIB而言)(图30B)。申请人对Gluc靶向RNA-seq比较进行了额外分析,并且发现shRNA条件的主要变异来源是由于个体重复中靶向和非靶向条件之间的差异(平均Kendall's tau=0.917)(图60C-60E)。当比较相同条件的个体重复时,存在更高的相关性和更小的变异性(平均Kendall’stau=0.941),指示观察到的变化来自给定shRNA构建体的一致的脱靶效应。当此分析应用于针对三个基因分析的所有RNA-seq文库时,尽管由于转录物分布的窄扩散导致不同的指导序列,但所有LwaCas13a条件彼此具有高度相关性。相反,由于每个不同shRNA序列的脱靶变化量,针对每种shRNA条件,具有三个重复的组具有比shRNA条件之间更高的组内相关性(图61A、61B)。此外,在三种转录物中,当将每种指导物条件的标准偏差的分布与每种shRNA条件进行比较时,在shRNA条件下观察到显著更多的变化(p<10-192,双侧K-S检验)(图61C)。
实例18:LwaCas13a在哺乳动物细胞中没有展示出可观察到的附带活性
Cas13a的附带活性已通过生物化学体外直接观察到,并通过细菌中的生长抑制间接观察到。因为多重化留一法和RNA-seq分析表明缺乏非特异性RNA降解并因此导致哺乳动物细胞中的附带活性,申请人希望看到由于附带活性导致的全局脱靶表达减少是否在敲低实验中发生。申请人分析了荧光素酶和内源敲低实验中的基因对照,以观察是否存在由靶转录物敲低导致的对照中的任何变化。从最初的Gluc平铺实验可以清楚地看出,虽然许多指导物展示出Gluc的显著敲低,但Cluc水平几乎没有变化(图62A、62B)。然后,申请人决定分析中靶敲低与中靶表达或中靶敲低与脱靶表达(内源靶向情况下荧光素酶对照或GAPDH)之间的相关性。申请人发现,对于四个靶标中的每一个,在中靶敲低和中靶表达之间存在显著的正相关性(Gluc:R=0.89,p<0.0001;PPIB:R=0.81,p<0.0001;KRAS:R=0.52,p<0.0001),而在中靶敲低和对照基因表达之间相关性弱得多或没有相关性(Gluc:R=-0.078,p>0.05;PPIB:R=-0.058,p>0.05;KRAS:R=-0.51,p<0.0001)(图61C-61J),指示没有可检测的脱靶敲低。
对照表达和敲低之间缺乏任何显著相关性表明LwaCas13a在哺乳动物细胞中几乎没有或没有附带活性。申请人想通过观察转录物敲低期间细胞的任何生长限制是否如先前在细菌中观察到的那样进一步研究这一点(Abudayyeh,O.O.等人C2c2is a single-component programmable RNA-guided RNA-targeting CRISPR effector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物].Science[科学]353,aaf5573,doi:10.1126/science.aaf5573(2016))。申请人用针对Gluc的多种指导物转染LwaCas13a并且在72小时内进行选择或不进行选择,并且随后在通过GFP荧光测量细胞活力和LwaCas13a表达之前立即测量敲低。申请人观察到所有五种Gluc靶向指导物的显著水平的敲低(图30C),但靶向指导物和非靶向指导物对照之间的细胞生长或GFP荧光没有显著差异(图30D、30E)。
Cas13a的附带活性已通过生物化学体外直接观察到,并通过细菌中的生长抑制间接观察到,但这种活性在哺乳动物细胞中的程度尚不清楚。申请人在我们的RNA测序实验中未发现序列特异性脱靶LwaCas13a活性,并且LwaCas13a介导的靶向转录物敲低不影响表达相似水平的LwaCas13a的哺乳动物细胞的生长(图29G)。此外,没有可检测的基因表达变化,指示LwaCas13a靶向的存在不会导致在转录组水平上可观察到的细胞应激反应(图29A,图60A、60B)(Subramanian,A.等人Gene set enrichment analysis:a knowledge-basedapproach for interpreting genome-wide expression profiles[基因集富集分析:一种基于知识的用于解释全基因组表达谱的方法],Proc.Natl.Acad.Sci USA[美国国家科学院院刊]102,15545-15550(2005))。总之,虽然申请人不能排除可能发生低水平的均匀附带活性切割的可能性,但申请人在以下四个观察结果中看不到可检测的附带活性:1)在我们的所有平铺实验中,申请人观察到靶转录物敲低和系内对照基因敲低之间没有显著相关性(图62);2)申请人在我们的RNA测序分析中看到对转录组的最小干扰并且没有显著的脱靶(图29A);3)在留一多重实验中,申请人没有看到被排除基因的敲低(图49L);和4)由于LwaCas13a靶向,申请人没有看到对细胞生长或应激的表型效应(图29G)。
实例19:dCas13a可编程地结合哺乳动物细胞中的转录物
由于可编程的RNA结合蛋白可以作为广泛应用的基础,申请人探索了LwaCas13a是否可以被工程化为无催化活性的变体(dCas13a)。先前的研究已经证明,通过催化残基的突变使LshCas13a失活消除了RNA酶活性,但保持了RNA结合(Abudayyeh,O.O.等人C2c2is asingle-component programmable RNA-guided RNA-targeting CRISPR effector[C2c2是单组分可编程的RNA指导的RNA靶向CRISPR效应物].Science[科学]353,aaf5573,doi:10.1126/science.aaf5573(2016))。申请人使LwaCas13a中的催化精氨酸残基突变以产生dCas13a(图44A),并发现将dCas13a靶向报告编码序列上游的5'UTR导致翻译和报告基因表达降低(图63A)。为了定量dCas13a的RNA结合,申请人使用含有36nt DR和28nt间隔子的指导物进行RNA免疫沉淀(RIP)(图58B),并发现被靶向荧光素酶转录物(图44A)或ACTB mRNA(图63B)的dCas13a的下拉导致相应靶标相对于非靶向对照显著富集(荧光素酶为7.8-11.2x富集,并且ACTB为2.1-3x富集;p<0.05),验证dCas13a为可重新编程的RNA结合蛋白。
实例20:dCas13a对转录物的负反馈成像
为了工程化dCas13a进行体内成像并降低由未结合蛋白质引起的背景噪音,申请人并入了基于锌指自我靶向和KRAB结构域阻遏的负反馈系统(Gross,G.G.等人Recombinant probes for visualizing endogenous synaptic proteins in livingneurons[用于可视化活神经元中的内源突触蛋白的重组探针].Neuron[神经元]78,971-985,doi:10.1016/j.neuron.2013.04.017(2013))(图44B)。将锌指、KRAB结构域和NLS与dCas13a融合得到负反馈构建体(dCas13a-NF)。当dCas13a-NF不与其靶转录物结合时,它定位至细胞核并阻遏其自身的表达。在转录物结合后,dCas13a-NF被输出到细胞质中,从而增加表达,尽管新翻译的dCas13a-NF也可能保留在细胞质中。与由于转录物结合而显示适度水平的细胞质易位(或保留)的dCas13a相比,当被靶向ACTB mRNA时,dCas13a-NF有效地易位或重新定位(图63E)。为了进一步表征dCas13a-NF的易位程度,申请人用两种指导物靶向ACTB转录物,并且发现与非靶向指导物相比,两种指导物都增加了易位(3.1-3.7x细胞/核信号比;p<0.0001)(图44C、图11C-11E)。易位的定量显示靶向指导物导致细胞质中的荧光分数显著高于非靶向指导物,显示dCas13a-NF作为转录物成像工具的效用。为了进一步验证dCas13a-NF成像,申请人分析了dCas13a-NF信号与ACTB mRNA荧光原位杂交(FISH)信号的相关性(图64A),并发现靶向指导物与非靶向指导物有显著的相关性和信号重叠(指导物1和2分别为R=0.27和0.30,并且非靶向指导物条件为R=0.00;p<0.0001)(图64B)。
实例21:活细胞中应激颗粒的dCas13a成像
氧化应激导致多聚腺苷酸化转录物和蛋白质聚集成细胞质内的应激颗粒(Nelles,D.A.等人,Programmable RNA Tracking in Live Cells with CRISPR/Cas9[使用CRISPR/Cas9的活细胞中的可编程RNA追踪].Cell[细胞]165,488-496,doi:10.1016/j.cell.2016.02.054(2016);Unsworth,H.,Raguz,S.,Edwards,H.J.,Higgins,C.F.和Yague,E.mRNA escape from stress granule sequestration is dictated bylocalization to the endoplasmic reticulum[通过定位至内质网来决定从应激颗粒隔离中逃脱的mRNA].FASEB J[美国实验生物学会联合会会志]24,3370-3380,doi:10.1096/fj.09-151142(2010)),并且应激颗粒的发展与许多病理有关,包括癌症、神经退行性疾病和肌病(Wyss-Coray,T.Ageing,neurodegeneration and brain rejuvenation[衰老、神经变性和脑复壮].Nature[自然]539,180-186,doi:10.1038/nature20411(2016);Protter,D.S.和Parker,R.Principles and Properties of Stress Granules[应激颗粒的原理和性质].Trends Cell Biol[细胞生物学趋势]26,668-679,doi:10.1016/j.tcb.2016.05.004(2016))。申请人通过将转录物的dCas13a-NF成像与众所周知的应激颗粒标记物G3BP1的可视化组合,研究了mRNA在应激颗粒中的积累(Tourriere,H.等人TheRasGAP-associated endoribonuclease G3BP assembles stress granules[RasGAP相关的核糖核酸内切酶G3BP组装应激颗粒].J Cell Biol[细胞生物学杂志]160,823-831,doi:10.1083/jcb.200212128(2003))(图48A)。为了证实固定样品中的mRNA追踪,申请人用dCas13a-NF共转染两种ACTB靶向crRNA或指导物中的任一种,用亚砷酸钠诱导应激颗粒形成,并用免疫荧光可视化G3BP1(图48B)。如预期的那样,针对靶向条件dCas13a-NF在细胞质中易位或重新定位至细胞质中,并且与非靶向对照相比,申请人发现dCas13a-NF信号与G3BP1荧光之间具有显著相关性(指导物1和指导物2分别为R=0.49和0.50,并且非靶向指导物为0.08;p<0.001)(图48C、48D),表明dCas13a-NF追踪应激颗粒形成的能力。鉴于固定样品中的共定位,申请人接下来在活细胞中进行应激颗粒追踪。申请人用dCas13a-NF转染ACTB靶向指导物和非靶向指导物,在转染后24小时用亚砷酸钠诱导应激颗粒形成,并随时间成像活细胞(图48E)。使用G3BP1-RFP融合物作为应激颗粒标记物,申请人发现被靶向ACTB的dCas13a-NF比相应的非靶向对照随时间定位至显著更多的应激颗粒/个细胞(p<0.05)(图48F)。
实例22:讨论
2类VI型CRISPR-Cas效应物Cas13a可以用crRNA或指导物有效地重新编程,以敲低或结合哺乳动物细胞中的转录物。申请人将LwaCas13a鉴定为细菌中15种Cas13a直向同源物中针对RNA切割最活跃的,并且以与RNAi相当的水平将其用于哺乳动物RNA敲低。申请人发现通过细菌筛选没有可检测的PFS,并且指导物活性不受PFS的影响。LwaCas13a对体内间隔子:靶标双链体中的错配敏感,并且与RNAi相比,这种敏感性转化为敲低的高特异性。申请人还显示了LwaCas13a作为RNA敲低工具的独特属性,包括进一步工程化和优化蛋白质的能力、指导物的多重化递送和核lncRNA的敲低。重要的是,申请人没有观察到LwaCas13a的附带活性,即在体外高度活跃并且可用于许多应用(如诊断)的一个特征(Gootenberg,J.S.等人Nucleic acid detection with CRISPR-Cas13a/C2c2[用CRISPR-Cas13a/C2c2进行核酸检测].Science[科学]印刷中(2017))。此外,申请人显示LwaCas13a可以呈现为无催化活性,使得它可以用作可编程的RNA结合平台,并且申请人证明了其用于追踪活细胞中应激颗粒的转录物积累的效用。
重要的是,申请人没有观察到LwaCas13a在哺乳动物细胞中的附带活性,即申请人在体外观察并用于诊断应用的一个特征(Gootenberg,J.S.等人Nucleic acid detectionwith CRISPR-Cas13a/C2c2[用CRISPR-Cas13a/C2c2进行核酸检测],Science[科学],印刷中(2017))。已经假设附带活性是天然细菌细胞中程序性细胞死亡/休眠途径的一部分,其将从群体中移除感染细胞或为感染细胞提供适应和克服感染的时间,补充Cas13a的中靶病毒转录物切割活性。哺乳动物细胞中缺乏附带活性并不排除其在天然细胞环境中存在的可能性。
基于Cas13家族成员的RNA靶向工具有许多改进和多样化的机会。另外的Cas13蛋白如Cas13b(Smargon,A.A.等人Cas13b Is a Type VI-B CRISPR-Associated RNA-GuidedRNase Differentially Regulated by Accessory Proteins Csx27and Csx28[Cas13b是由辅助蛋白Csx27和Csx28差异调节的VI-B型CRISPR相关的RNA指导的RNA酶].Mol Cell.[分子细胞]65,618-630e617,doi:10.1016/j.molcel.2016.12.023(2017))或Cas13c(Shmakov,S.等人Diversity and evolution of class 2CRISPR-Cas systems[2类CRISPR-Cas系统的多样性和进化].Nat Rev Microbiol[自然评论微生物学]15,169-182,doi:10.1038/nrmicro.2016.184(2017))的体内表征可以进一步改进切割或结合能力,并使得需要直向同源RNA结合蛋白的应用(包括多色成像)成为可能。另外,较小的直向同源物将允许尺寸受限的递送选择,如腺相关病毒载体(Ran,F.A.等人In vivo genome editingusing Staphylococcus aureus Cas9[使用金黄色葡萄球菌Cas9的体内基因组编辑].Nature[自然]520,186-191,doi:10.1038/nature14299,nature14299[pii](2015))。最后,探索Cas13成员的多样性以及增加的结构数据(Liu,L.等人Two Distant CatalyticSites Are Responsible for C2c2RNase Activities[两个距离远的催化位点负责C2c2RNA酶活性].Cell[细胞]168,121-134e112,doi:10.1016/j.cell.2016.12.031(2017))可以允许生物信息学(Zinn,E.等人In Silico Reconstruction of the ViralEvolutionary Lineage Yields a Potent Gene Therapy Vector[病毒进化谱系的计算机重建产生了一种强有力的基因治疗载体].Cell Rep[细胞报告]12,1056-1068,doi:10.1016/j.celrep.2015.07.019(2015))或结构(Kleinstiver,B.P.等人High-fidelityCRISPR-Cas9nucleases with no detectable genome-wide off-target effects[无可检测的全基因组脱靶效应的高保真度CRISPR-Cas9核酸酶].Nature[自然]529,490-495,doi:10.1038/nature16526(2016);Slaymaker,I.M.等人Rationally engineeredCas9nucleases with improved specificity[合理工程化的具有改进特异性的Cas9核酸酶].Science[科学]351,84-88,doi:10.1126/science.aad5227(2016))指导的理性设计。改进的RNA结合工具将允许另外的功能化,包括通过重构断裂型荧光团的成像(Ozawa,T.,Natori,Y.,Sato,M.和Umezawa,Y.Imaging dynamics of endogenous mitochondrial RNAin single living cells[在单个活细胞中的内源线粒体RNA的成像动力学].Nat Methods[自然方法]4,413-419,doi:10.1038/nmeth1030(2007))、翻译调节(De Gregorio,E.,Preiss,T.和Hentze,M.W.Translation driven by an eIF4G core domain in vivo[体内由eIF4G核心结构域驱动的翻译].EMBO J[欧洲分子生物学学会杂志]18,4865-4874,doi:10.1093/emboj/18.17.4865(1999);Adamala,K.P.,Martin-Alarcon,D.A.和Boyden,E.S.Programmable RNA-binding protein composed of repeats of a single modularunit[由单个模块单元的重复序列组成的可编程RNA结合蛋白].Proc Natl Acad Sci U SA[美国国家科学院院刊]113,E2579-2588,doi:10.1073/pnas.1519368113(2016);Campbell,Z.T.,Valley,C.T.和Wickens,M.A protein-RNA specificity code enablestargeted activation of an endogenous human transcript[蛋白质-RNA特异性编码能够靶向活化人内源转录物].Nat Struct Mol Biol[自然结构与分子生物学]21,732-738,doi:10.1038/nsmb.2847(2014);Cao,J.等人Light-inducible activation of targetmRNA translation in mammalian cells[哺乳动物细胞中靶mRNA翻译的光诱导活化].Chem Commun(Camb)[化学通讯(剑桥)]49,8338-8340,doi:10.1039/c3cc44866e(2013);Cooke,A.,Prigge,A.,Opperman,L.和Wickens,M.Targeted translational regulationusing the PUF protein family scaffold[使用PUF蛋白家族支架的靶向翻译调节].ProcNatl Acad Sci U S A[美国国家科学院院刊]108,15870-15875,doi:10.1073/pnas.1105151108(2011))、RNA碱基编辑(Nishikura,K.A-to-I editing of coding andnon-coding RNAs by ADARs[ADAR对编码和非编码RNA的A至I编辑].Nat Rev Mol CellBiol[自然综述·分子细胞生物学]17,83-96,doi:10.1038/nrm.2015.4(2016);Wedekind,J.E.,Dance,G.S.,Sowden,M.P.和Smith,H.C.Messenger RNA editing in mammals:newmembers of the APOBEC family seeking roles in the family business[哺乳动物的信使RNA编辑:APOBEC家族的新成员在家族企业中寻找角色].Trends Genet[遗传学趋势]19,207-216,doi:10.1016/S0168-9525(03)00054-4(2003))、表观转录微扰(Harcourt,E.M.,Kietrys,A.M.和Kool,E.T.Chemical and structural effects of basemodifications in messenger RNA[信使RNA中碱基修饰的化学和结构效应].Nature[自然]541,339-346,doi:10.1038/nature21351(2017))、基于RNA表达水平靶向诱导凋亡(Rider,T.H.等人Broad-spectrum antiviral therapeutics[广谱抗病毒治疗剂].PLoSOne[公共科学图书馆·综合]6,e22572,doi:10.1371/journal.pone.0022572(2011))或剪接调节(Wang,Y.,Cheong,C.G.,Hall,T.M.和Wang,Z.Engineering splicing factorswith designed specificities[具有设计的特异性的工程剪接因子].Nat Methods[自然方法]6,825-830,doi:10.1038/nmeth.1379(2009))。
使用Cas13a的RNA敲低可以应用于多种生物背景中的扰乱RNA,包括全基因组聚池敲低筛选、lncRNA和新生转录物功能的探询、等位基因特异性敲低和RNA病毒治疗。此外,dCas13a和衍生物使得实现RNA下拉以研究RNA-蛋白质相互作用、追踪活细胞中的转录物以及基于RNA水平的细胞靶向破坏,这对于研究特定细胞群或杀伤癌细胞是有用的。申请人已经显示Cas13是哺乳动物和植物细胞中RNA的可编程敲低和结合的稳健平台,并且此平台可以扩展到其他真核生物。与创造性工程化方法相结合的CRISPR-Cas13将成为基于核酸的诊断和治疗的强大平台,并可为研究转录组带来革命。
实例23:细胞凋亡的断裂设计
通常需要基于转录标签或特异性基因表达消耗或杀死细胞,用于基础生物学应用以研究特定细胞类型的作用,抑或用于治疗应用如癌症或衰老细胞清除(Baker,D.J.,Childs,B.G.,Durik,M.,Wijers,M.E.,Sieben,C.J.,Zhong,J.,Saltness,R.A.,Jeganathan,K.B.,Verzosa,G.C.,Pezeshki,A.等人(2016).Naturally occurring p16(Ink4a)-positive cells shorten healthy lifespan[天然存在的p16(Ink4a)阳性细胞缩短了健康寿命].Nature[自然]530,184–189.)。这种靶向细胞杀伤可以通过将断裂型凋亡结构域与Cas13蛋白融合来实现,这些Cas13蛋白在与转录物结合后重构,导致特异性表达靶向基因或基因集的细胞死亡。在某些实施例中,凋亡结构域可以是断裂型半胱天冬酶3(Chelur,D.S.和Chalfie,M.(2007).Targeted cell killing by reconstitutedcaspases[通过重构的半胱天冬酶杀伤靶向细胞].Proc.Natl.Acad.Sci.U.S.A.[美国国家科学院院刊]104,2283–2288.)。其他可能性是半胱天冬酶的组装,如使两个半胱天冬酶8(Pajvani,U.B.,Trujillo,M.E.,Combs,T.P.,Iyengar,P.,Jelicks,L.,Roth,K.A.,Kitsis,R.N.和Scherer,P.E.(2005).Fat apoptosis through targeted activation ofcaspase 8:a new mouse model of inducible and reversible lipoatrophy[通过靶向活化半胱天冬酶8进行脂肪细胞凋亡:可诱导且可逆的脂肪萎缩的一种新的小鼠模型].Nat.Med.[自然医学]11,797-803.)或半胱天冬酶9(Straathof,K.C.,Pulè,M.A.,Yotnda,P.,Dotti,G.,Vanin,E.F.,Brenner,M.K.,Heslop,H.E.,Spencer,D.M.和Rooney,C.M.(2005).An inducible caspase 9safety switch for T-cell therapy[用于T细胞疗法的诱导型半胱天冬酶9安全开关].Blood[血液]105,4247–4254.)效应物通过Cas13结合而接近。也可以通过转录物上Cas13结合来重构断裂型TEV(Gray,D.C.,Mahrus,S.和Wells,J.A.(2010).Activation of specific apoptotic caspases with an engineered small-molecule-activated protease[用工程化的小分子活化蛋白酶活化特异性凋亡半胱天冬酶].Cell[细胞]142,637–646.)。这种断裂型TEV可以用于多种读出,包括发光和荧光读出(Wehr,M.C.,Laage,R.,Bolz,U.,Fischer,T.M.,Grünewald,S.,Scheek,S.,Bach,A.,Nave,K.-A.和Rossner,M.J.(2006).Monitoring regulated protein-protein interactionsusing split TEV[使用断裂型TEV监测调节的蛋白质-蛋白质相互作用].Nat.Methods[自然方法]3,985–993.)。一个实施例涉及重构此断裂型TEV以切割经修饰的半胱天冬酶3酶原或半胱天冬酶7酶原(Gray,D.C.,Mahrus,S.和Wells,J.A.(2010).Activation ofspecific apoptotic caspases with an engineered small-molecule-activatedprotease[用工程化的小分子活化蛋白酶活化特异性凋亡半胱天冬酶].Cell[细胞]142,637–646),导致细胞死亡。
实例24:成像的断裂设计
虽然在本申请中提到,但是另外的断裂型荧光团构建体被设计用于通过在2个Cas13蛋白与转录物结合后重构断裂型荧光团而具有降低的背景的成像。这些断裂蛋白包括iSplit(Filonov,G.S.和Verkhusha,V.V.(2013).A near-infrared BiFC reporter forin vivo imaging of protein-protein interactions[用于蛋白质-蛋白质相互作用的体内成像的近红外BiFC报告分子].Chem.Biol.[化学生物学]20,1078–1086.)、断裂型Venus(Wu,B.,Chen,J.和Singer,R.H.(2014).Background free imaging of single mRNAs inlive cells using split fluorescent proteins[使用断裂荧光蛋白对活细胞中单个mRNA进行的无背景成像].Sci.Rep.[科学报告]4,3615.)和断裂型超正GFP(Blakeley,B.D.,Chapman,A.M.和McNaughton,B.R.(2012).Split-superpositive GFP reassemblyis a fast,efficient,and robust method for detecting protein-proteininteractions in vivo[断裂型超正GFP重组是一种用于检测体内蛋白质-蛋白质相互作用的快速有效且稳健的方法].Mol.Biosyst.[分子生物系统]8,2036–2040.)。
实例25:用于另外的转录活性的断裂设计,荧光素酶
可以由Cas13蛋白构成的其他可能的断裂型融合物可以包括用于发光成像的荧光素酶(Kim,S.B.,Ozawa,T.,Watanabe,S.和Umezawa,Y.(2004).High-throughput sensingand noninvasive imaging of protein nuclear transport by using reconstitutionof split Renilla luciferase[通过使用断裂型海肾(Renilla)荧光素酶的重构来进行蛋白质核转运的高通量感测和非侵入性成像].Proc.Natl.Acad.Sci.U.S.A.[美国国家科学院院刊]101,11542–11547.)或用以基于RNA感测的方式驱动遗传电路基因的表达的断裂型转录因子。可能的断裂型转录因子包括基于断裂型泛素的系统,如断裂型泛素-LexA系统(Petschnigg,J.,Groisman,B.,Kotlyar,M.,Taipale,M.,Zheng,Y.,Kurat,C.F.,Sayad,A.,Sierra,J.R.,Mattiazzi Usaj,M.,Snider,J.等人(2014).The mammalian-membranetwo-hybrid assay(MaMTH)for probing membrane-protein interactions in humancells[用于探测人细胞中膜-蛋白质相互作用的哺乳动物膜双杂交测定(MaMTH)].Nat.Methods[自然方法]11,585–592.)。
实例26:C2c2直向同源物的鉴定
以下C2c2直向同源物可以针对在哺乳动物细胞中表达进行密码子优化。
上述物种的蛋白质序列列于下表中。
实例27:C2c2直向同源物的鉴定
某些Cas13b直向同源物与C2c2惊人地相似。图54提供了C2c2和Cas13b蛋白的树比对。以下Cas13b蛋白可以针对在哺乳动物细胞中表达进行密码子优化。
实例28:C2c2直向同源物的鉴定
为了改进或以其他方式改变C2c2酶的性质,实施氨基酸修饰。可变残基被鉴定为保守带电残基的子集。这些残基在图53的比对中具有>80%的保守性。这些可以变为不带电残基(典型地丙氨酸)。一个或多个指定的残基被突变。氨基酸残基编号对应于共有编号,如图66(顶行)所示,并在下面重现:
MWISIKTLIHHLGVLFFCDMGNLFGHMKIXKVXHEKRXAKXKXPXKKVXVKRKYSGGGLLLNYNENPNKNKSXENILIKKKISFXXLKSSSKLBKTINKPDXKKXXXXLQWFLSEIVKKINRRNGLVLSDMLSVDKRXXEKIXEKXXXLKYFXXXXXXLXKLHQEKPSKKLFNLKDLKEXEEXVLFLKXKFKNEJXYXXENDXXKDIEKILXEXLRXGFXPADKKLKXKFLIEXXWGIFSXXXKLEPYXIQEDFXEXYIEDFKKLNKXKXJXKSIENNKIVSQKSSDSQIYEXGKNIIMSXXGXIESIIEXXSKRKXXLDKYATXXLXEKLLLDEXLXIEQXXXNXXEXXDKLASNLKXYXLXKLYFYVKXDKKKSXXEVAKAAVSAAKDXNKDKYQNEVWXXHEXRKEDKRDFIXXXLEIXXIXKXIXKVKXXIXKXAXXEAXEXIKXXNIGKYRXXJDLFELEEDNXLNQFXXFVNIEXXKFFXHYXPNXIKRIXXXKNDAXAXXLKXGELXKKVEKQLKNGALSIYXIXXGKAVYYXXFAMKXLADSDYWTXKDLEXIKISEAFLRKFIGACSFAYXSLXAXNILQPECXXDILGKGDLLXKATVNIXQXXSEHIMYLGKLRHNDIDXLLXFKEDIAKSTXKXGXGXLXKNLIQFFGGESTWDNKIFXAAYXXXLXGXXENEDFLGWALRGAIXSIRNEXFHSFKIKKHXXXXFLNIXNFIXXKLXEFEKXXXXKXKEXXHXXXTSYXXXLIKKLFXNEXXKXXLPXXIKELKLKSSGVXMYYSXDDLKKLLENIYFKFSLLKIXEENXEXAXFVPSFKKVYXRADGVKGFDYQXXXTRXHAYXLKLXPFFDXEEXEXEAFNARYYLLKXIYYNXILEXXXEENEXXXXFLPKFXXXNNXAFREXXNFXADXIEXYYKRLQINKKKGAXKXXKKKXQXKVXNXYNRKXFAYAFENIRXMXFXETPREYMQYIQSEYXIENNGKEXKKSXXENKRNKDXFXHXEKFLLQVFIKGFDXYJDXRXENFXFILXPEPQNGTKEYLYEEXXAILDEXXXXNXLRXXXITXNKXLKLXEFJPEXKSDIKVXPXLVEEIYDYIKKIKINKIKKDXEJAFWQDAALYLFCEKLLDARHLSXXLRXELIKYKQFXKDIKXRAXXNGNXINHSXXXNXXXVXECTDELEIIELXLLLNDRXSNDFKDYFDDEEAXIXXXXLCRIIFYAEYLXKYXKEEDDXXXXAEXXXFXALEPFCQSDTAREAKNDIYXDGGXNPELRVPILNRGIXQXKKIYGTEXXLEKLFDKNXLFBIDGXBIPXFKVSEEXAIIXEXXEKKXEIXEXSQYKXRGELHTEWXQKAREIEEYXXXXXKXKFXKKPQNXXFEKRFIEKHGQEYKKAXXXIXEYXWLKNKVEXNXLNELHELLIXLLGRLIGYSALFERDLQYFXNGFHYXCLNNDXEKLAXYXNJSXVXXKNRXIXKAXLYQIFAMYXXGLPFYSKDXDXXXAXXSGXKXSXXXXSXXTAGXGKKJKKFKKYSXYXLIXXXLXXDXSKKLDXYLAGLELFENXEEHDNXTEXIRNYIAHFNYLXXAGXXADXSLLELYNXLRDRLXSYDRKLKNAVSKSLIDILDRHGMILKFKFKXXXKLIGXNDXXXXAIKHKDXARITIXEPNGVTSEXFTYKLLXXVAALEIXSLEPKKIRHLXXXARLLYYPKXATAQSQPDQKXXXKXKKKNIXKGYIERXTNQVSSNQEEYCELVKKLLETXXLXXLAVXGVAXBIGLHISRLRRIREDAIIVGRRYRFRVEIYVPPKSNTSKLNAADLVRID
使用MUSCLE比对(www.ebi.ac.uk/Tools/msa/muscle/)基于共有序列的突变残基。指示Lsh中的相应位置
任何一个或多个上述氨基酸残基突变(单独地或组合地)的C2c2蛋白展示出改变的特异性和/或活性和/或替代PAM识别。
实例29:
基于Lw2和FSL的比对(图67),鉴定了以下保守残基:
M35 K198 I478 A593 R717 F825
K36 N201 E479 L597 H722 Y829
T38 Y222 K494 I601 F740 K831
K39 D253 R495 L602 F742 D837
I57 I266 N498 E611 K768 L852
E65 F267 S501 E613 I774 F858
G66 S280 E519 D630 K778 E867
L68 I303 N524 I631 I783 A871
N84 N306 Y529 G633 L787 L875
T86 R331 V530 K641 S789 K877
E88 Y338 G534 N646 V792 Y880
I103 K389 K535 V669 Y796 Y881
N105 Y390 Y539 F676 D799 F884
E123 K391 T549 S678 F812 F888
R128 I434 D551 N695 N818 F896
R129 K435 R577 E703 P820 N901
K139 L458 E580 A707 F821 V903
L152 D459 A581 I709 V822 N915
L194 E462 F582 I713 P823 K916
N196 L463 I587 I716 S824 R918
一个或多个指定的残基被突变。氨基酸残基编号对应于如图67中所示的编号(两个直系同源比对序列之间的中间线指示相同的残基)。
图67中所示的在Lew2C2c2和Lib C2c2之间相同的任何一个或多个残基被突变以修饰C2c2蛋白活性、特异性或功能性。任何一个或多个上述氨基酸残基突变(单独地或组合地)的C2c2蛋白展示出改变的特异性和/或活性和/或替代PAM识别。
实例30:方法
用于活性筛选和重组表达的直向同源物的克隆
我们合成了15种Cas13a直向同源物(金斯瑞公司(Genscript),江苏,中国)的人密码子优化形式(附表9),并通过pLac启动子将其克隆到pACYC184中。与Cas13a表达盒相邻,我们克隆了直向同源物的相应同向重复,位于β-内酰胺酶靶向或非靶向间隔子的侧翼。间隔子阵列表达由J23119启动子驱动。
为了纯化LwaCas13a,我们将哺乳动物密码子优化的LwaCas13a序列克隆到细菌表达载体(6x His/Twin Strep SUMO,一种基于pET的表达载体,作为礼物从德克萨斯大学奥斯汀分校的Ilya Finkelstein接受)中用于蛋白质纯化。
此研究中使用的所有质粒列于附表1中。
Cas13a活性和PFS身份的细菌体内测试
筛选功能如下。简而言之,Cas13a被编程成靶向β-内酰胺酶转录物的5'段序列,其侧翼为随机化的PFS核苷酸。Cas13a切割活性导致细菌在氨苄青霉素选择下死亡,随后通过下一代测序分析PFS消耗。为了允许直向同源物之间的定量比较,我们在pLac启动子下克隆了每种Cas13a直向同源物以及在pJ23119小RNA启动子的表达下附近的单间隔子CRISPR阵列。
为了测试Cas13a直向同源物的活性,将90ng具有靶向或非靶向指导物的直向同源物表达质粒与25ng之前描述的β-内酰胺酶靶质粒58共转化到NovaBlue Singles感受态细胞(密理博公司(Millipore))中。转化后,将细胞稀释,在补充有100μg/uL氨苄青霉素和25μg/μL氯霉素的LB琼脂上铺板,并在37℃下孵育过夜。第二天对转化体进行计数。
为了测定LshCas13a和LwaCas13a PFS身份,将40ng具有靶向或非靶向间隔子的直向同源物表达质粒与25ngβ-内酰胺酶靶质粒共转化到NovaBlue GigaSingles(密理博公司)的每个生物学重复的2份等份试样中。进行两次生物学重复。转化后,每个生物学重复在37℃下在500uL SOC(赛默飞世尔科技公司(ThermoFisher Scientific))中回收细胞1小时,在具有补充有100μg/uL氨苄青霉素和25μg/μL氯霉素的LB-琼脂(美国昂飞公司(Affymetrix))的生物测定板(康宁公司(Corning))上铺板,并在37℃下孵育16小时。然后通过刮擦收获菌落,并用NuceloBond Xtra EF(马歇雷-纳格尔公司(Macherey-Nagel))纯化质粒DNA用于随后的测序。
使用NEBNext High Fidelity 2X Master Mix(新英格兰生物科学公司(NewEngland Biosciences)),通过用条形码引物Illumina流动池手柄进行的PCR制备收获的质粒样品用于下一代测序。合并PCR产物并使用Zymoclean凝胶提取试剂盒(酶研究公司(ZymoResearch))进行凝胶提取,并使用MiSeq下一代测序仪(亿明达公司)测序。
PFS的计算分析
从LshCas13a和LwaCas13a PFS筛选文库的下一代测序,我们对随机化PFS区域侧翼的序列进行比对并提取PFS身份。我们将PFS身份瓦解为4个核苷酸以改进序列覆盖率,计数每个独特PFS的频率,并将归一化为每个文库的总读数计数(假计数为1)。如图1E所示,针对pACYC184对照(无蛋白质/指导基因座),将每个分布的富集计算为-log2(f条件/fpACYC184),其中f条件是实验条件下PFS身份的频率,并且fpACYC184是pACYC184对照中PFS身份的频率。为了分析保守的PFS基序,使用每种条件的非靶向对照如下计算最高的耗竭PFS身份:-log2(fi,靶向/fi,非靶向),其中fi,靶向是条件i中具有靶向间隔子的PFS身份的频率,并且fi,非靶向是条件i中具有非靶向间隔子的PFS身份的频率。分析PFS基序的一系列阈值,如扩展数据图1D、1E所示。
LwaCas13a的纯化
如先前所述60进行LwaCas13a的纯化。简而言之,将LwaCas13a细菌表达载体转化到Rosetta 2(DE3)pLysS单一感受态细胞(密理博公司)中,并用起始培养物接种4L极品肉汤(Terrific Broth)4生长培养基(TB)。用IPTG诱导细胞蛋白质表达,并且在过夜生长后,收获细胞沉淀并储存在-80℃。细胞裂解后,使用StrepTactin琼脂糖凝胶树脂(GE集团)结合蛋白质,并通过SUMO蛋白酶消化(赛默飞世尔公司(ThermoFisher))洗脱蛋白质。使用HiTrap SP HP阳离子交换柱(GE医疗保健生命科学公司(GE Healthcare Life Sciences))通过阳离子交换进一步纯化蛋白质,随后使用Superdex 200 Increase 10/300GL柱(GE医疗保健生命科学公司)进行凝胶过滤,两个步骤均通过FPLC(AKTA PURE,GE医疗保健生命科学公司)进行。合并含有LwaCas13a蛋白的最终级分并浓缩到储存缓冲液(600mM NaCl,50mMTris-HCl pH 7.5,5%甘油,2mM DTT)中,并将等分试样在-80℃下冷冻用于长期储存。
哺乳动物表达构建体的克隆
合成人密码子优化的Cas13a基因(金斯瑞公司)并在EF1-ɑ启动子表达下克隆到具有核输出序列(NES)或核定位序列(NLS)的哺乳动物表达载体中。由于单体超折叠GFP(msfGFP)赋予的稳定性,我们将msfGFP融合到LwaCas13a的C-末端。LwaCas13a的全长同向重复用于在U6启动子的表达下克隆指导物骨架质粒。通过在两个HEPN结构域中引入R474A和R1046A突变产生无催化活性的LwaCas13a-msfGFP构建体(失活Cas13a或dCas13a)。通过将蛋白质克隆到骨架中产生药物可选择的LwaCas13a-msfGFP形式,其中杀稻瘟素选择标记通过2A肽序列与C-末端连接。通过克隆dCas13a-msfGFP启动子上游的锌指结合位点并将锌指和KRAB结构域融合至C-末端产生dCas13a-msfGFP构建体的负反馈形式。
在单一载体上,通过在CMV表达下克隆Cypridinia荧光素酶(Cluc)和在EF1-ɑ表达下克隆Gaussia荧光素酶(Gluc)产生报告分子荧光素酶构建体。在单一载体上表达两种荧光素酶允许一种荧光素酶用作用于归一化另一种荧光素酶的敲低的剂量对照,从而控制由于转染条件引起的变化。
对于图1G中的内源敲低实验,使用RNAxs siRNA设计算法87设计指导物和shRNA。使用预测工具来设计shRNA,并且在相同位置设计指导物以允许shRNA和Cas13a敲低之间的比较。
从pANIC6A88PCR扩增水稻肌动蛋白启动子(pOsActin),并从现有的Cas13a构建体PCR扩增每种Cas13a。将这些片段连接到现有的植物表达质粒中,使得每种Cas13a由水稻肌动蛋白启动子驱动,并且转录由HSP终止子终止。由水稻U6启动子(pOsU6)表达Cas13agRNA。每个基因的gRNA靶序列是相同的,而支架序列是Cas13a特异性的。在这些实验中,我们靶向水稻5-烯醇丙酮莽草酸-3-磷酸合酶(OsEPSPS)基因(其是基于草甘膦的除草剂的靶标)以及水稻羟基肉桂酰-CoA莽草酸/奎尼酸羟基肉桂酰转移酶(OsHCT)基因,这是适当的植物生长所必需的。
此研究中使用的所有指导物和shRNA列于附表2和3中。
原生质体制备
绿色水稻原生质体(Oryza sativa L.ssp.japonica var.Nipponbare)如前所述89制备,稍作修改。使幼苗生长14天并将原生质体重悬于含有0.1M CaCl2的MMG缓冲液中。此改良的MMG缓冲液用于制备新鲜的40%PEG缓冲液以及代替WI缓冲液。最后,在转化后将原生质体保持在完全黑暗中48小时。所有其他条件如前所述。
用于体外反应和附带活性的核酸靶标和crRNA制备
为了产生核酸靶标,用KAPA Hifi Hot Start(卡帕生物系统公司(KapaBioSystems))PCR扩增寡核苷酸。使用MinElute凝胶提取试剂盒(凯杰公司(Qiagen))凝胶提取并纯化dsDNA扩增子。通过在30℃下用HiScribe T7Quick High Yield RNA合成试剂盒(新英格兰生物实验室)过夜孵育来转录所得纯化的dsDNA。使用MEGAclear转录清洁试剂盒(赛默飞世尔公司)纯化转录的RNA。此研究中使用的所有RNA靶标列于附表4和6中。
为了产生crRNA,作为DNA订购寡核苷酸(集成DNA技术公司(Integrated DNATechnologies)),其具有另外的5'T7启动子序列。将crRNA模板DNA用T7引物(终浓度10μM)退火,并通过在37℃下用HiScribe T7Quick High Yield RNA合成试剂盒(新英格兰生物实验室)过夜孵育进行转录。用RNAXP清洁珠(贝克曼库尔特公司(Beckman Coulter))纯化得到的转录的crRNA,使用2x比例的珠比反应体积,补充有另外的1.8x比例的异丙醇(西格玛公司)。用于体外实验研究的crRNA构建体列于附表5中,并且用于附带检测的crRNA构建体列于附表6中。
LwaCas13a切割和附带活性检测
对于LwaCas13a的生物化学表征,如先前所述58进行测定。简而言之,除非另有说明,否则用160nM末端标记的ssRNA靶标、200nM纯化的LwaCas13a和100nM crRNA进行核酸酶测定。所有测定均在核酸酶测定缓冲液(40mM Tris-HCl,60mM NaCl,6mM MgCl2,pH 7.3)中进行。对于阵列加工,每个核酸酶测定使用100ng体外转录的阵列。使反应在37℃下进行1小时(除非另有说明),并且然后用蛋白酶缓冲液(蛋白酶K,60mM EDTA和4M尿素)在37℃淬灭15分钟。然后将反应用4.5M尿素变性缓冲液在95℃变性5分钟。通过在45℃下运行的10%PAGE TBE-尿素(英杰公司)上的变性凝胶电泳分析样品。使用Odyssey扫描仪(LI-COR生物科学公司(LI-COR Biosciences))对凝胶成像。
如先前所述90进行附带活性检测测定。简而言之,除非另有说明,否则反应由在核酸酶测定缓冲液(40mM Tris-HCl,60mM NaCl,6mM MgCl2,pH 7.3)中的45nM纯化的LwCas13a、22.5nM crRNA、125nM淬灭的荧光RNA报告分子(RNA酶Alert v2,赛墨科技公司(Thermo Scientific))、2μL鼠RNA酶抑制剂(新英格兰生物实验室)、100ng背景总人RNA(自HEK293FT培养物纯化)和不同量的输入核酸靶标组成。使反应在荧光读板器(伯腾公司(BioTek))上在37℃下进行1-3小时(除非另有说明),每5分钟测量一次荧光动力学。
RNA提取和qRT-PCR
使用Trizol和随附的方案孵育48小时后分离总RNA。使用随附的方案,在SuperScript III Plantinum SYBR Green One-Step qRT-PCR试剂盒(英杰公司)中使用1纳克的总RNA。将所有样品在LightCycler 480仪器(罗氏公司(Roche))上以384孔格式以三个生物学重复的技术一式三份进行。所有PCR引物基于熔解曲线分析被验证为特异性的,并且如下:OsEPSPS(Os06g04280),5’–TTG CCA TGA CCC TTG CCG TTG TTG–3’和5’–TGA TGATGC AGT AGT CAG GAC CTT–3’;OsHCT(Os11g07960),5’–CAA GTT TGT GTA CCC GAG GATTTG–3’和5’–AGC TAG TCC CAA TAA ATA TGC GCT–3’;OsEF1a(Os03g08020),5'–CTG TAGTCG TTG GCT GTG GT–3'和5'–CAG CGT TCC CCA AGA AGA GT–3'。先前描述了OsEF1a的引物91。所有数据均表示为每个样品相对于EF1a表达的均值+/-标准误差。
平铺指导物筛选的克隆
对于平铺指导物筛选,间隔子被设计为以均匀间隔靶向mRNA转录物以完全覆盖转录物的整个长度。间隔子是从IDT订购,退火,并且金门克隆到LwaCas13a指导物表达构建体中,其具有tRNAval启动子(用于Gluc和Cluc筛选)或U6启动子(用于所有内源筛选)。
用于LwaCas13a敲低的哺乳动物细胞培养和转染
除非另有说明,否则所有哺乳动物细胞实验均在HEK293FT系(ATCC)中进行。在补充有10%胎牛血清(VWR Seradigm公司)和1X青霉素-链霉素(赛默飞世尔科技公司)的含有高葡萄糖、丙酮酸钠和GlutaMAX(赛默飞世尔科技公司)的杜尔贝科氏改良伊格培养基中培养HEK293FT细胞。传代细胞以保持汇合率低于70%。对于涉及A375(ATCC)的实验,在补充有9%胎牛血清(VWR Seradigm公司)和1X青霉素-链霉素(赛默飞世尔科技公司)的RPMI培养基1640(赛默飞世尔科技公司)中培养细胞。
为了测试内源基因的敲低,除非另有说明,否则每孔用150ng LwaCas13a质粒和250ng指导质粒进行Lipofectamine 2000(赛默飞世尔科技公司)转染。测试报告质粒的敲低的实验每孔补充有12.5ng报告构建体。转染前16小时,将细胞以大约20,000个细胞/孔在96孔板中铺板,并使其生长至90%汇合率过夜。对于每个孔,将质粒与I还原血清培养基(赛默飞世尔公司)合并至总共25uL,并且将0.5uL Lipofectamine 2000与24.5uL Opti-MEM合并。然后将质粒和lipofectamine溶液合并,孵育5分钟,并缓慢移液到细胞上以防止破坏。
绿色水稻原生质体的转化
对于绿色水稻实验,将表达每种Cas13a和相应的gRNA的质粒以等摩尔比混合,使得总共30mg的DNA用于每次转化总共200,000个原生质体。
荧光素酶活性的测量
除非另有说明,否则我们在转染后48小时收获含有分泌的荧光素酶的培养基。将培养基在PBS中1:5稀释,并且然后使用NEB Cypridinia和Gaussia荧光素酶测量试剂盒在Biotek Synergy 4读板器上用注射方案测量荧光素酶活性。所有重复作为生物学重复进行。
收获总RNA和定量PCR
转染后48小时,使用商业Cells-to-Ct试剂盒(赛默飞世尔科技公司)的先前描述的修改92进行细胞收获和逆转录以产生cDNA。然后使用Fast Advanced Master Mix(赛默飞世尔科技公司)和TaqMan qPCR探针(赛默飞世尔科技公司,附表7和8)与GAPDH对照探针(赛默飞世尔科技公司),用qPCR定量转录物表达。所有qPCR反应均在5uL反应中进行,以384孔格式进行4个技术重复,并使用LightCycler 480Instrument II(罗氏公司)读出。对于多重化靶向反应,在不同的孔中进行不同靶标的读出。
通过从靶Ct值减去管家对照(GAPDH)Ct值来计算表达水平,以对总输入进行归一化,得到ΔCt水平。相对转录物丰度计算为2^(-ΔCt)。所有重复作为生物学重复进行。
靶标可及性的计算分析
为了首先分析靶标可及性,我们分析了平铺筛选中的头等指导物,并确定它们是否比预期的更紧密地组合在一起,假设如果存在可及性区域,则您将期望该区域中的多种指导物高度活跃。我们将头等指导物定义为针对Gluc平铺筛选的前20%执行指导物,以及针对Cluc、KRAS和PPIB平铺筛选的前30%执行指导物。我们通过随机模拟的10,000个指导物位置为指导物之间的成对距离生成零概率分布,并且然后比较实验确定的头等指导物成对距离。
使用Vienna RNA软件套件93中的RNApl折叠算法来预测可及性。使用70nt的默认窗口大小,并且未配对的靶区域的概率计算为跨靶区域的28个单核苷酸未配对概率的平均值。使这些可及性曲线平滑化,并与四种转录物中每一个的平滑敲低曲线进行比较,并使用皮尔森相关系数计算两个因子之间的相关性。通过在两个变量上执行2D核密度估计,也可视化了这两个因子的概率空间。
RNA测序和分析
为了确定LwaCas13a敲低的特异性,我们对涉及LwaCas13a和shRNA构建体的敲低实验的mRNA进行RNA测序。使用Qiagen RNeasy Plus Mini mit在48小时后从转染实验制备总RNA。然后使用Poly(A)mRNA磁性分离模块提取mRNA,并使用UltraTM定向RNA文库制备试剂盒制备RNA-seq文库用于在Illumina NextSeq仪器上对RNA测序文库进行测序,每个文库至少10M个读数。
使用RefSeq GRCh38装配生成指数,并使用Bowtie和RSEM v1.2.31使用默认参数94对读数进行比对和定量。将每百万转录物(TPM)值用于表达计数,并通过取log2(TPM+1)转化至对数-空间。
为了找到差异表达的基因,我们对三个靶向重复与三个非靶向重复进行学生t检验。统计分析仅在6个重复的至少两个中具有大于2.5的log2(TPM+1)值的基因上进行。据报道,只有差异表达大于2或小于0.75且错误发现率<0.10的基因显著差异表达。
使用Kendall’s tau系数进行重复之间的交叉相关和重复平均值。通过考虑6个重复中的基因表达的标准偏差的分布(3个靶向重复和3个非靶向重复)来分析shRNA与Cas13a文库的变化,并绘制为小提琴图。
评估LwaCas13a在哺乳动物细胞中的附带活性
通过测试任何潜在生长限制效应,另外评估LwaCas13a的附带活性。用荧光素酶报告分子靶标、指导质粒和LwaCas13a或药物可选择的LwaCas13a转染哺乳动物细胞。转染后24小时,将细胞以1:5分到新鲜培养基中,并且药物可选择的LwaCas13a样品补充有10ug/mL杀稻瘟素S(赛默飞世尔科技公司)。在另外生长48小时后,测定细胞的荧光素酶敲低,通过在多模式读板器(Biotek Neo2)上GFP荧光测量维持LwaCas13a表达,并通过发光细胞存活力测定(普洛麦格公司(Promega))进行细胞生长的测定。
量化dCas13a与RIP的结合
对于RNA免疫沉淀实验,将HEK293FT细胞在6孔板中铺板,并用1.3μg dCas13a表达质粒和1.7μg指导质粒转染,另外将150ng报告质粒用于涉及报告分子靶向的条件。转染后48小时,用冰冷的PBS(西格玛公司)洗涤细胞两次,并在室温下用PBS中的0.2%多聚甲醛(电子显微镜科学公司(Electron Microscopy Sciences))固定15分钟。固定后,除去多聚甲醛,加入PBS中的125mM甘氨酸以淬灭交联,并将细胞孵育10分钟。将细胞再次用冰冷的PBS洗涤两次,通过刮擦收获,并将细胞悬浮液以800g离心4分钟以沉淀细胞。除去上清液,并且在裂解前用PBS洗涤沉淀。用200uL的补充有无EDTA的cOmpleteTMULTRA片剂(西格玛公司)和核糖核酸酶抑制剂(Sigma R1158)的1X RIPA缓冲液(细胞信号传导公司(CellSignaling))裂解细胞。使细胞在冰上裂解10分钟,并且然后在Bioruptor超声波仪(Diagenode公司)上以低强度以30秒开/30秒关循环超声处理2分钟。通过在4℃以16,000g离心10分钟沉淀不溶性物质,并将含有澄清裂解物的上清液用于磁珠下拉。
为了将抗体与磁珠缀合,通过施加磁体将100μL/样品的免疫沉淀用蛋白A(赛默飞世尔科技公司)沉淀,并除去上清液。将珠重悬于200μL洗涤缓冲液(补充有0.02%Tween-20(西格玛公司)的PBS)中,并加入5μg兔抗小鼠IgG(SigmaM7023)。将样品在室温下在旋转器上孵育10分钟以使抗体与珠缀合。孵育后,通过磁体沉淀珠,除去上清液,并将珠用洗涤缓冲液洗涤两次。将沉淀重悬于100μL洗涤缓冲液中并分成两个50μL体积用于缀合抗HA抗体(Thermo Fisher Scientific 26183)或IgG抗体对照(Sigma I5381)。对于每种抗体,2.5μg抗体加入200μL洗涤缓冲液,并在室温下在旋转器上孵育10分钟。孵育后,通过磁体沉淀珠并用洗涤缓冲液洗涤两次,并重悬于具有核糖核酸酶抑制剂(Sigma R1158)和蛋白酶抑制剂混合物(Sigma P8340)的200μL 1X RIPA中。将100μL样品裂解物加入到珠中并在4℃下旋转过夜。
与样品裂解物一起孵育后,沉淀珠,用1X RIPA、0.02%Tween-20洗涤三次,并且然后用DNA酶缓冲液(350mM Tris-HCl[pH6.5];50mM MgCl2;5mM DTT)洗涤。将珠重悬于DNA酶缓冲液中,并加入TURBO DNA酶(生命技术公司)至终浓度为0.08单位/μl。将DNA酶在37℃下在旋转器上孵育30分钟。然后通过加入蛋白酶K(新英格兰生物科学公司)将蛋白质消化至终浓度为0.1单位/μl,并在37℃下旋转孵育另外30分钟。为了变性和纯化,加入尿素(西格玛公司)至终浓度为2.5M,将样品孵育30分钟,并使用Direct-Zol RNA miniprep(酶研究公司)纯化RNA。使用qScript Flex cDNA(Quantabio公司)将纯化的RNA逆转录成cDNA,并使用Fast Advanced Master Mix和TaqMan qPCR探针(附表7和8)用qPCR定量下拉。所有qPCR反应均在5μL反应中进行,以384孔格式进行4个技术重复,并使用LightCycler480Instrument II读出。与其匹配的IgG抗体对照相比,对样品的富集进行定量。
LwaCas13a和LwaCas13a-NF的易位测量
将HEK293FT细胞铺板在24孔组织培养板中聚-D-赖氨酸盖玻片(康宁公司)上,并用150ng dCas13a-NF载体和300ng指导物转染以成像ACTB。对于易位实验,将细胞用4%PFA固定,并在48小时后用0.2%Triton X-100透化,并使用具有DAPI的抗褪色封固剂(Vectashield公司)封固。使用具有Andor Yokagawa Spinning disk Revolution WD系统的Nikon Eclipse Ti1进行共聚焦显微镜检查。
通过测量平均细胞质和核msfGFP荧光并比较靶向和非靶向条件之间许多细胞间的比率来分析具有靶向ACTB mRNA的指导物的dCas13a-NF-msfGFP的核输出。
ACTB转录物的荧光原位杂交(FISH)
将HEK293FT细胞铺板在24孔组织培养板中聚-D-赖氨酸盖玻片(康宁公司)上,并用75ng dCas13a-NF载体和250ng指导物转染以成像ACTB。48小时后,将细胞用4%PFA固定45分钟。将QuantiGene viewRNA ISH细胞测定试剂盒(美国昂飞公司)用于在细胞样品上进行FISH,并按照制造商的描述遵循方案。在完成FISH程序后,使用抗褪色封固剂(Vectashield公司)封固盖玻片。使用具有Andor Yokagawa Spinning disk RevolutionWD系统的Nikon Eclipse Ti1进行共聚焦显微镜检查。
LwaCas13a到应激颗粒的追踪
将HEK293FT细胞铺板在24孔组织培养板中聚-D-赖氨酸盖玻片(康宁公司)上,并用75ng dCas13a-NF载体和250ng指导物转染以成像ACTB。对于应激颗粒实验,在固定和透化细胞之前,施加200μM亚砷酸钠1小时。对于G3BP1的免疫荧光,用20%山羊血清封闭细胞,并在室温下与抗G3BP1一抗(Abnova H00010146-B01P)一起孵育过夜。然后将细胞与AlexaFluor 594标记的二抗一起孵育,并使用具有DAPI的抗褪色封固剂(Vectashield公司)封固。使用具有Andor Yokagawa Spinning disk Revolution WD系统的Nikon Eclipse Ti1进行共聚焦显微镜检查。
使用皮尔森相关系数,使用每个细胞的平均msfGFP和G3BP1信号计算应激颗粒与dCas13a-NF-msfGFP的共定位。使用Coloc 2插件在图像分析软件FIJI95中进行共定位分析。
对于活体成像实验,将HEK293FT细胞在96孔组织培养板中铺板,并用150ngdCas13a-NF载体、用于成像ACTB的300ng指导物和5ng G3BP1-RFP报告分子转染。48小时后,使细胞经受0μM或400μM亚砷酸钠,并在Opera PhenixTM高含量筛选系统(珀金埃尔默公司)上每2小时每15分钟成像,使用具有20x水物镜的旋转盘共聚焦设置。将细胞在含有50%CO2的加湿室中保持在37℃。使用Opera Phenix Harmony软件(珀金埃尔默公司)测量活细胞dCas13a-NF-msfGFP与应激颗粒中的G3BP1-RFP的共定位。
靶标可及性和敲低的相关性
我们显示LshCas13a靶向确定位置处的MS2ssRNA基因组,高效的指导物比偶然预期的更紧密地分组在一起1。我们假设由于靶标结合的空间位置和可用性,LshCas13a更好地靶向的可及性区域可以产生有效指导物簇。我们试图分析这些结果是否会扩展到用LwCas13a靶向哺乳动物mRNA,因此对我们用指导物平铺的四个基因进行类似的分析:Gluc、Cluc、KRAS和PPIB。我们首先将有效指导物定义为Gluc的前20%指导物和其他三个基因的前30%指导物,如通过敲低效率测量的(注意我们对Cluc、KRAS和PPIB的阈值更为慷慨,因为它们比Gluc平铺少50%的指导物)。在仅分析如使用这些阈值定义的最有效指导物时,我们发现它们确实比偶然预期的更紧密地聚类在一起。
我们接下来试图使用Vienna RNA软件套件中的RNAplfold算法对靶转录物的可及性进行建模。我们计算了大小为70(默认)的窗口可及性以及转录物上给定核苷酸位置未配对的概率。对于给定的指导物,我们然后可以对跨28nt的概率进行平均,以获得给定的指导物靶标未配对并因此可及的平均概率。我们将此计算作为靶标可及性的度量,并比较每种指导物的靶标表达。由于指导物到指导物发生的变化,尤其因为基因没有密集平铺,我们决定使靶标可及性和靶标表达曲线平滑化。通过绘制这些曲线并分析相关性,我们发现靶标可及性与靶标表达显著相关,并且它可以解释靶标表达的4.4%-16%变化。为了抵消平滑的虚假效应,我们还通过使用核密度估计来分析概率空间中的概率与敲低数据。此分析揭示了碱基配对的靶区域的概率与靶标表达之间的类似的正相关关系。最后,为了抵消RNAplfold的任何参数特异性方面而产生碱基配对概率的伪相关,我们计算了参数网格的不成对概率:窗口大小和k聚体大小。我们最初仅计算k聚体的概率为1,即给定位置不配对的概率跨28nt靶区域平均。当k=2时,我们计算未配对核苷酸对的概率,并对28nt区域内的那些进行平均,直至k为28以此类推。此分析揭示了每种转录物的产生正相关性的参数区域,这提供了更多信心,即它不仅仅是给出相关性的特定参数组。正如可以预期的那样,较大的转录物(如KRAS)与较大的窗口大小具有正相关性,而较小的转录物(如PPIB)与小得多的窗口大小具有正相关性。
shRNA和Cas13a之间的靶标敲低特异性的比较
为了在shRNA和Cas13a转录物敲低特异性之间进行严格比较,我们想要评估靶向和非靶向对照之间比较的全转录组微扰效应。脱靶将显示为与同一性系的偏差,并且显然当靶向报告构建体时,shRNA比Cas13a发生更多的脱靶。内源基因发生类似的增加的偏差。虽然可以预期内源转录物的敲低会导致生物功能变化引起的其他基因表达变化,但我们发现用Cas13a敲低PPIB和KRAS不会导致表达变化,可能是因为敲低的水平不足以实现实质下游影响。
接下来,我们通过差异基因表达来量化脱靶的数量:脱靶转录物定义为具有至少100%上调或25%下调的基因。然后通过学生t检验比较靶向和非靶向条件之间的显著脱靶,通过Benjamini-Hochberg程序校正多次比较,FDR为0.1。我们发现,对于测试的所有三种转录物,由于shRNA靶向,存在数百种显著的脱靶转录物,但是由于Cas13a靶向,没有显著的脱靶。
靶向和非靶向条件之间shRNA微扰的巨大变化可能是由于总体基因表达变化增加,这将导致生物学重复之间的类似偏差,或可重复且一致的脱靶,这表现为针对相同的条件重复之间的相关性增加。彼此比较Gluc微扰的非靶向和靶向重复,我们发现重复之间几乎没有变化。然而,当我们比较个体重复的针对shRNA或Cas13a的靶向条件与所有非靶向条件时,我们发现重复之间的比较重现了均值测量所见的脱靶。为了量化重复之间的相关性,我们比较了报告分子和内源基因的靶向和非靶向条件的所有重复。shRNA样品在重复内的相关性高于非靶向和靶向条件之间的相关性,而Cas13a样品之间的相关性在靶向和非靶向微扰之间具有较小的变化。然后我们比较了彼此之间的所有样品,并且发现shRNA样品的样品间和与Cas13a之间的相关性低于Cas13a内的情况,显示Cas13a更一致。最后,我们计算了靶向和非靶向重复间每个基因的标准偏差,并且在转录组间发现Cas13a微扰的标准偏差分布低于shRNA微扰的情况。总体而言,此证据表明Cas13a靶向导致较少的全转录组变化。
哺乳动物细胞中缺乏附带活性的证据
LshCas13a和LwCas13a似乎在体外展示出稳健的附带活性。由于担心细胞健康和由于附带效应引起的LwCas13a敲低的特异性,我们试图研究附带效应是否实际存在于哺乳动物细胞中。在我们的手稿中,我们收集的数据表明LwCas13a缺乏附带活性,并且在这里,我们收集所有证据碎片并详细讨论它们。
1.RNA测序:我们进行了RNA测序以确定LwCas13a敲低的特异性,并发现LwCas13a展示出比RNAi高得多的特异性。在我们的差异表达分析中,尽管靶转录物显著敲低,但对于分析的任何LwCas13a条件,没有显著差异表达的脱靶。假设人类转录组中的每种转录物没有均匀敲低,我们认为这提供了大量证据表明LwCas13a的敲低是特异性的,并且在哺乳动物细胞中没有附带效应。
2.平铺筛选:在我们进行的四个基因平铺筛选中,我们未能看到用于归一化的对照基因的敲低。这是与RNA测序类似的分析,尽管只关注仅一个其他基因而不是转录组。然而,这一结果很重要,因为我们未能在数百种测试的指导物中看到附带活性,这提供了信心,即LwCas13a在体内没有稳健地显示任何附带活性。
3.留一多重化:为了确定在我们的多重化实验中基因敲低的特异性,我们设计了一个实验,其中每个基因靶向指导物被含由针对三个不同基因的指导物的指导物表达阵列中的非靶向指导物替代。我们发现缺失指导物所靶向的基因的基因表达没有显著变化。我们相信这也是一个很好的证据,证明在哺乳动物细胞中缺乏附带活性,因为我们预期所有三个基因总是显示敲低,无论其指导物是存在还是缺失。
4.生长实验:以前,我们显示LshCas13a在基因敲低期间导致细菌生长受限1。我们设计了一个简单的实验来测量哺乳动物细胞中是否存在敲低的生长效应。我们使具有靶向Gluc的LwCas13a的细胞生长72小时,并且然后测量细胞活力,并发现靶向和非靶向指导物条件之间的生长没有差异。我们另外通过观察C-末端msfGFP融合物的荧光来控制LwCas13a表达,并且显示在所有条件下表达是相同的,并且由于潜在有害的表型而未被选出。尽管先前观察到细菌生长抑制,但在哺乳动物细胞中缺乏生长抑制有许多可能的原因,包括RNA细胞质密度、细胞溶胶组成和切割转录物加工机制的差异。
第1-3点共同显示靶向基因敲低不影响靶向的基因之外的其他基因,并且第4点揭示基因敲低没有可观察到的副作用。我们相信这些数据一起是哺乳动物细胞中缺乏LwCas13a附带活性的实质证据,并且Cas13敲低是非常特异性的。
负反馈构建体对dCas13a成像的重要性
对于活细胞成像,重要的是保持高信噪比并减少背景。对背景的关注对于荧光团标记的构建体(如dCas13a)尤其重要,因为未结合的dCas13a不能从细胞中除去或区别于结合的蛋白质。减少背景的一种方法是通过核定位信号(NLS)标签隔离核中的蛋白质;在新生转录物结合后,蛋白质被瞬时输出到细胞质中。虽然这种技术已经在MS2系统中得到应用,但我们发现由于脱靶核泄漏和中靶核逃逸,这种技术并不完美。为了改进单独NLS标签化的信噪比,我们并入了负反馈系统,其中核驻留蛋白将抑制dCas13a的进一步表达。我们发现,与靶向条件相比,在非靶向条件下,负反馈调节减少了细胞质的假移位并导致dCas13a-NF水平的总体水平降低,从而增加了dCas13a作为成像工具的效用。
附表
附表1:此研究中使用的质粒。
附表2:用于此研究中体内实验的指导物。
附表3:此研究中使用的shRNA。
附表4:此研究中使用的ssRNA靶标
附表5:用于此研究中体外实验的指导物。
附表6:用于SHERLOCK实验的ssRNA靶标和crRNA。
附表7:此研究中使用的商用TaqMan探针。
附表8:此研究中使用的定制TaqMan探针。
附表9:此研究中使用的Cas13a直向同源物。
***
虽然已经在本文示出并描述了本发明的优选实施例,但是对本领域的普通技术人员而言应该显而易见是此类实施例仅以举例方式提供。在不偏离本发明的情况下众多变化、改变和取代现在将被本领域的普通技术人员想到。应该理解的是,在实践本发明中可以采用本文描述的本发明的实施例的不同替代方案。预期的是以下权利要求限定本发明的范围,并且在这些权利要求范围内的方法和结构及其等同物也包括在本发明的范围内。

Claims (161)

1.一种修饰感兴趣的哺乳动物靶基因座的方法,该方法包括向所述基因座递送非天然存在的或工程化的组合物,该组合物包含与一个或多个定位信号融合的C2c2效应蛋白和一种或多种核酸组分,其中至少该一种或多种核酸组分被工程化,该一种或多种核酸组分将该复合物引导至该感兴趣的靶标,并且该效应蛋白与该一种或多种核酸组分形成复合物,并且该复合物与该感兴趣的靶基因座结合。
2.一种非天然存在的或工程化的组合物,该组合物包含与一个或多个定位信号融合的C2c2效应蛋白和一种或多种核酸组分,其中至少该一种或多种核酸组分被工程化用于在修饰感兴趣的哺乳动物靶基因座中使用,该一种或多种核酸组分将该复合物引导至该感兴趣的靶标,并且该效应蛋白与该一种或多种核酸组分形成复合物,并且该复合物与该感兴趣的靶基因座结合。
3.一种非天然存在的或工程化的组合物的用途,该组合物包含与一个或多个定位信号融合的C2c2效应蛋白和一种或多种核酸组分,其中至少该一种或多种核酸组分被工程化用于修饰感兴趣的哺乳动物靶基因座,该一种或多种核酸组分将该复合物引导至该感兴趣的靶标,并且该效应蛋白与该一种或多种核酸组分形成复合物,并且该复合物与该感兴趣的靶基因座结合。
4.如权利要求1-3或58-59中任一项所述的方法、组合物或用途,其中该感兴趣的靶基因座包含RNA。
5.如权利要求1-4或58-59中任一项所述的方法、组合物或用途,其中所述定位信号是核定位信号(NLS)或核输出信号(NES),优选NES。
6.如权利要求1-5中任一项所述的方法,其中该感兴趣的靶基因座的修饰包括链断裂。
7.如权利要求1-6或58-59中任一项所述的方法、组合物或用途,其中该C2c2效应蛋白针对在哺乳动物细胞中表达进行密码子优化。
8.如权利要求1-7或58-59中任一项所述的方法、组合物或用途,其中该C2c2效应蛋白与一个或多个功能结构域缔合;并且任选地,该效应蛋白含有任选地在HEPN结构域内的一个或多个突变,如R597A、H602A、R1278A和/或H1283A,由此该复合物可以递送表观遗传修饰因子或者转录或翻译活化或阻遏信号。
9.如权利要求8所述的方法、组合物或用途,其中该功能结构域修饰该靶基因座的转录或翻译。
10.如权利要求1-9或58-59中任一项所述的方法、组合物或用途,其中该感兴趣的靶基因座被包含在细胞内的核酸分子中。
11.如权利要求1-10或58-59中任一项所述的方法、组合物或用途,其中所述修饰是在体内或离体进行的。
12.如前述权利要求中任一项所述的方法、组合物或用途,其中当与该效应蛋白复合时,该一种或多种核酸组分能够实现该复合物与该感兴趣的靶基因座的靶序列的序列特异性结合。
13.如前述权利要求中任一项所述的方法、组合物或用途,其中该一种或多种核酸组分包含双同向重复序列。
14.如前述权利要求中任一项所述的方法、组合物或用途,其中该效应蛋白和一种或多种核酸组分是经由编码这些多肽和/或该一种或多种核酸组分的一种或多种多核苷酸分子提供的,并且其中该一种或多种多核苷酸分子可操作地配置成表达这些多肽和/或该一种或多种核酸组分。
15.如权利要求14所述的方法、组合物或用途,其中该一种或多种多核苷酸分子包含一种或多种调节元件,该一种或多种调节元件可操作地配置成表达这些多肽和/或该一种或多种核酸组分,任选地其中该一种或多种调节元件包括一个或多个启动子或者一个或多个诱导型启动子。
16.如权利要求14或15所述的方法、组合物或用途,其中该一种或多种多核苷酸分子被包含在一种或多种载体中。
17.如权利要求14或15所述的方法、组合物或用途,其中该一种或多种多核苷酸分子被包含在一种载体中。
18.如权利要求16或17所述的方法、组合物或用途,其中该一种或多种载体包括病毒载体。
19.如权利要求18所述的方法、组合物或用途,其中该一种或多种病毒载体包括一种或多种逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体或单纯疱疹病毒载体。
20.如权利要求14至15中任一项所述的方法、组合物或用途,其中该一种或多种多核苷酸分子被包含在递送系统中,或者如权利要求16或17所述的方法、组合物或用途,其中该一种或多种载体被包含在递送系统中,或者如权利要求1-13或58-59中任一项所述的方法、组合物或用途,其中该组装的复合物被包含在递送系统中。
21.如前述权利要求中任一项所述的方法、组合物或用途,其中该非天然存在的或工程化的组合物通过递送媒介递送,该递送媒介包括一种或多种脂质体、一种或多种粒子、一种或多种外泌体、一种或多种微泡、基因枪或者一种或多种病毒载体。
22.一种非天然存在的或工程化的组合物,该组合物是具有如前述权利要求中任一项所定义的特征的组合物。
23.一种非天然存在的或工程化的组合物,该组合物包含与一个或多个NLS或NES融合的C2c2效应蛋白和一种或多种核酸组分,其中至少该一种或多种核酸组分被工程化,该一种或多种核酸组分将该复合物引导至感兴趣的哺乳动物靶标,并且该效应蛋白与该一种或多种核酸组分形成复合物,并且该复合物与该感兴趣的靶基因座结合。
24.如权利要求23所述的组合物,其中该感兴趣的靶基因座包含RNA。
25.如权利要求23或24所述的组合物,其中该感兴趣的靶基因座的修饰包括链断裂。
26.如权利要求23或24所述的组合物,其中该C2c2效应蛋白针对在哺乳动物细胞中表达进行密码子优化。
27.如权利要求23或24所述的组合物,其中该C2c2效应蛋白与一个或多个功能结构域缔合;并且任选地,该效应蛋白含有任选地在HEPN结构域内的一个或多个突变,如R597A、H602A、R1278A和/或H1283A,由此该复合物可以递送表观遗传修饰因子或者转录或翻译活化或阻遏信号。
28.如权利要求27所述的组合物,其中该功能结构域修饰该靶基因座的转录或翻译。
29.如权利要求27-28中任一项所述的组合物,其中该感兴趣的靶基因座被包含在细胞内的核酸分子中。
30.如权利要求27-29中任一项所述的组合物,其中当与该效应蛋白复合时,该一种或多种核酸组分能够实现该复合物与该感兴趣的靶基因座的靶序列的序列特异性结合。
31.如权利要求27-30中任一项所述的组合物,其中该一种或多种核酸组分包含双同向重复序列。
32.如权利要求27-31中任一项所述的组合物,其中该效应蛋白和一种或多种核酸组分是经由编码这些多肽和/或该一种或多种核酸组分的一种或多种多核苷酸分子提供的,并且其中该一种或多种多核苷酸分子可操作地配置成表达这些多肽和/或该一种或多种核酸组分。
33.如权利要求32所述的组合物,其中该一种或多种多核苷酸分子包含一种或多种调节元件,该一种或多种调节元件可操作地配置成表达这些多肽和/或该一种或多种核酸组分,任选地其中该一种或多种调节元件包括一个或多个启动子或者一个或多个诱导型启动子。
34.如权利要求32或33所述的组合物,其中该一种或多种多核苷酸分子被包含在一种或多种载体中。
35.如权利要求32或33所述的组合物,其中该一种或多种多核苷酸分子被包含在一种载体中。
36.如权利要求34或35所述的组合物,其中该一种或多种载体包括病毒载体。
37.如权利要求36所述的组合物,其中该一种或多种病毒载体包括一种或多种逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体或单纯疱疹病毒载体。
38.如权利要求32-33中任一项所述的组合物,其中该一种或多种多核苷酸分子被包含在递送系统中,或者如权利要求34或35所述的组合物,其中该一种或多种载体被包含在递送系统中,或者如权利要求23-31中任一项所述的组合物,其中该组装的复合物被包含在递送系统中。
39.如前述权利要求中任一项所述的组合物,其中该非天然存在的或工程化的组合物通过递送媒介递送,该递送媒介包括一种或多种脂质体、一种或多种粒子、一种或多种外泌体、一种或多种微泡、基因枪或者一种或多种病毒载体。
40.一种载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含编码非天然存在的或工程化的组合物的组分的一种或多种多核苷酸分子,该组合物是具有如前述权利要求中任一项所定义的特征的组合物。
41.一种递送系统,该递送系统配置成递送非天然存在的或工程化的组合物的C2c2效应蛋白和一种或多种核酸组分,该组合物是具有如前述权利要求中任一项所定义的特征的组合物。
42.如权利要求41所述的递送系统,该递送系统包含一种或多种载体或者一种或多种多核苷酸分子,该一种或多种载体或多核苷酸分子包含一种或多种多核苷酸分子,该一种或多种多核苷酸分子编码具有如前述权利要求中任一项所定义的特征的非天然存在的或工程化的组合物的该C2c2效应蛋白和一种或多种核酸组分。
43.如前述或后续权利要求中任一项所述的非天然存在的或工程化的组合物、载体系统或递送系统,其用于在治疗性治疗方法中使用。
44.一种哺乳动物细胞,该哺乳动物细胞根据该方法修饰或工程化以包含或者任选地诱导性地或组成性地表达如前述或后续权利要求中任一项所述的组合物或其组分。
45.如权利要求44所述的哺乳动物细胞,其中该修饰导致:
-该细胞包含至少一种RNA产物的被改变的转录或翻译;
-该细胞包含至少一种RNA产物的被改变的转录或翻译,其中该至少一种产物的表达增加;或
-该细胞包含至少一种RNA产物的被改变的转录或翻译,其中该至少一种产物的表达降低。
46.如任何前述权利要求所述的非天然存在的或工程化的组合物、载体系统或递送系统,其用于在哺乳动物细胞中体内或离体使用:
-RNA序列特异性干扰,
-RNA序列特异性基因调节,
-筛选RNA或RNA产物或lincRNA或非编码RNA、或核RNA、或mRNA,
-诱变,
-荧光原位杂交,
-育种,
-体外或体内诱导细胞休眠,
-体外或体内诱导细胞周期停滞,
-体外或体内减少细胞生长和/或细胞增殖,
-体外或体内诱导细胞无反应性,
-体外或体内诱导细胞凋亡,
-体外或体内诱导细胞坏死,
-体外或体内诱导细胞死亡,或
-体外或体内诱导程序性细胞死亡。
47.一种细胞系,该细胞系属于或包含如权利要求44-45中任一项所述的细胞或其子代。
48.一种哺乳动物,该哺乳动物包含如权利要求44或45所述的一种或多种细胞。
49.一种哺乳动物模型,该哺乳动物模型包含如权利要求44-45中任一项所述的一种或多种细胞;所述一种或多种细胞任选地诱导性地或组成性地表达如前述权利要求中任一项所述的组合物或其组分。
50.一种产物,该产物来自如权利要求44-45中任一项所述的细胞、或如权利要求47-48所述的细胞系或生物、或如权利要求49中任一项所述的哺乳动物模型;所述细胞或者该细胞系或哺乳动物或哺乳动物模型的一种或多种细胞任选地诱导性地或组成性地表达如前述权利要求中任一项所述的组合物或其组分。
51.如权利要求50所述的产物,其中产物的量大于或小于来自未通过如前述权利要求中任一项所述的方法或组合物进行改变或修饰的细胞的产物的量。
52.如权利要求50所述的产物,其中与来自未通过如前述权利要求中任一项所述的方法或组合物进行改变或修饰的细胞的产物相比,该产物被改变。
53.一种测定、筛选方法或诱变方法,其包括如前述或后续权利要求中任一项所述的系统或方法或细胞。
54.一种基于RNA的测定、筛选方法或诱变方法,其中该改进包括不使用RNA,该方法包括使用如前述权利要求中任一项所述的组合物。
55.如权利要求53所述的方法,其中该基于RNA的测定、筛选方法或诱变方法是RNAi或荧光原位杂交方法。
56.如任何前述权利要求所述的非天然存在的或工程化的组合物、载体系统或递送系统用于以下的用途:
-RNA序列特异性干扰,
-RNA序列特异性基因调节,
-筛选RNA或RNA产物或lincRNA或非编码RNA、或核RNA、或mRNA,
-诱变,
-荧光原位杂交,
-育种,
-体外或体内诱导细胞休眠,
-体外或体内诱导细胞周期停滞,
-体外或体内减少细胞生长和/或细胞增殖,
-体外或体内诱导细胞无反应性,
-体外或体内诱导细胞凋亡,
-体外或体内诱导细胞坏死,
-体外或体内诱导细胞死亡,或
-体外或体内诱导程序性细胞死亡;
在哺乳动物细胞中,优选在体内或离体。
57.如权利要求1至21中任一项所述的方法或用途,其中所述方法导致:
-RNA序列特异性干扰,
-RNA序列特异性基因调节,
-筛选RNA或RNA产物或lincRNA或非编码RNA、或核RNA、或mRNA,
-诱变,
-荧光原位杂交,
-育种,
-体外或体内诱导细胞休眠,
-体外或体内诱导细胞周期停滞,
-体外或体内减少细胞生长和/或细胞增殖,
-体外或体内诱导细胞无反应性,
-体外或体内诱导细胞凋亡,
-体外或体内诱导细胞坏死,
-体外或体内诱导细胞死亡,或
-体外或体内诱导程序性细胞死亡。
58.一种方法,该方法用于:
-RNA序列特异性干扰,
-RNA序列特异性基因调节,
-筛选RNA或RNA产物或lincRNA或非编码RNA、或核RNA、或mRNA,
-诱变,
-荧光原位杂交,
-育种,
-体外或体内诱导细胞休眠,
-体外或体内诱导细胞周期停滞,
-体外或体内减少细胞生长和/或细胞增殖,
-体外或体内诱导细胞无反应性,
-体外或体内诱导细胞凋亡,
-体外或体内诱导细胞坏死,
-体外或体内诱导细胞死亡,或
-体外或体内诱导程序性细胞死亡,
在哺乳动物细胞中;
该方法包括在靶细胞中体外、离体或体内引入或诱导如任何前述权利要求所述的非天然存在的或工程化的组合物、载体系统或递送系统。
59.一种用于调节感兴趣的哺乳动物靶基因座的翻译的方法,该方法包括向所述基因座递送非天然存在的或工程化的组合物,该组合物包含与一个或多个定位信号融合的C2c2效应蛋白以及(异源)翻译调节剂,如翻译活化因子或翻译阻遏因子;和一种或多种核酸组分,其中至少该一种或多种核酸组分被工程化,该一种或多种核酸组分将该复合物引导至该感兴趣的靶标,并且该效应蛋白与该一种或多种核酸组分形成复合物,并且该复合物结合该感兴趣的靶基因座,优选其中所述异源结构域是EIF4,如EIF4E。
60.如权利要求59所述的方法,其中所述C2c2效应蛋白是无催化活性的。
61.如前述权利要求中任一项所述的方法、组合物、用途、载体系统、递送系统、细胞、哺乳动物、哺乳动物模型、产物或测定,其中所述C2c2选自包括以下的组:沙氏纤毛菌C2c2、韦德纤毛菌F0279(Lw2)C2c2、塞氏李斯特菌C2c2、毛螺菌科细菌MA2020 C2c2、毛螺菌科细菌NK4A179 C2c2、嗜氨基梭菌DSM 10710 C2c2、鸡肉杆菌DSM 4847C2c2、鸡肉杆菌DSM4847C2c2、产丙酸沼杆菌WB4C2c2、威氏李斯特菌FSL R9-0317 C2c2、李斯特菌科细菌FSLM6-0635 C2c2、韦德纤毛菌F0279 C2c2、荚膜红细菌SB 1003C2c2、荚膜红细菌R121 C2c2、荚膜红细菌DE442 C2c2。
62.如权利要求1-59中任一项所述的方法、组合物、用途、载体系统、递送系统、细胞、哺乳动物、哺乳动物模型、产物或测定,其中所述C2c2是韦德纤毛菌F0279(Lw或Lw2)C2c2或纽约李斯特菌FSL M6-0635(LbFSL)C2c2。
63.一种检测样品中靶RNA的方法,该方法包括
(a)将该样品与以下一起孵育:
i)能够切割RNA的VI型CRISPR-Cas效应蛋白,
ii)能够与该靶RNA杂交的指导RNA,和
iii)能够被该效应蛋白非特异性地且可检测地切割的基于RNA的切割诱导型报告分子,
(b)基于由切割所述基于RNA的切割诱导型报告分子生成的信号检测所述靶RNA。
64.如权利要求63所述的方法,其中该VI型CRISPR-Cas效应蛋白是C2c2效应蛋白。
65.如权利要求63所述的方法,其中该基于RNA的切割诱导型报告构建体包含荧光染料和淬灭剂。
66.如权利要求63所述的方法,其中该样品包括无细胞生物样品。
67.如权利要求63所述的方法,其中该样品包括细胞样品。
68.如权利要求67所述的方法,其中该细胞样品包含植物细胞。
69.如权利要求67所述的方法,其中该细胞样品包含动物细胞。
70.如权利要求67所述的方法,其中该细胞样品包含癌细胞。
71.如权利要求63所述的方法,其中该靶RNA包括病原体RNA。
72.如权利要求71所述的方法,其中该病原体包括病毒、细菌、真菌或寄生虫。
73.如权利要求63所述的方法,该方法包括设计用于检测靶RNA中的单核苷酸多态性或RNA转录物的剪接变体的指导RNA。
74.如权利要求63所述的方法,其中该指导RNA包含与该靶RNA的一个或多个错配核苷酸。
75.如权利要求63所述的方法,其中该指导RNA结合诊断疾病状态的靶分子。
76.如权利要求75所述的方法,其中该疾病状态包括癌症。
77.如权利要求75所述的方法,其中该疾病状态包括自身免疫疾病。
78.如权利要求63所述的方法,其中该C2c2效应蛋白来自选自下组的生物,该组由以下组成:纤毛菌属、李斯特菌属、棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、Flaviivola、黄质菌属、球旋体属、固氮螺菌属、葡糖醋杆菌属、奈瑟菌属、罗氏菌属、细小棒菌属、葡萄球菌属、Nitratifractor、支原体属以及弯曲杆菌属。
79.一种核糖核酸(RNA)检测系统,该检测系统包含
a)能够切割RNA的VI型CRISPR-Cas效应蛋白,
b)能够与靶RNA结合的指导RNA,和
c)能够被该效应蛋白非特异性地且可检测地切割的基于RNA的切割诱导型报告分子。
80.如权利要求79所述的RNA检测系统,其中该VI型CRISPR-Cas效应蛋白是C2c2效应蛋白。
81.如权利要求79所述的RNA检测系统,其中该基于RNA的切割诱导型报告构建体包含荧光染料和淬灭剂。
82.如权利要求63所述的方法或如权利要求79所述的RNA检测系统,其中该VI型CRISPR-Cas效应蛋白包含与以下中任一项的野生型序列具有至少80%序列同源性的氨基酸序列:沙氏纤毛菌C2c2、毛螺菌科细菌MA2020 C2c2、毛螺菌科细菌NK4A179 C2c2、嗜氨基梭菌(DSM 10710)C2c2、鸡肉杆菌(DSM 4847)C2c2、产丙酸沼杆菌(WB4)C2c2、威氏李斯特菌(FSL R9-0317)C2c2、李斯特菌科细菌(FSL M6-0635)C2c2、纽约李斯特菌(FSL M6-0635)C2c2、韦德纤毛菌(F0279)C2c2、荚膜红细菌(SB 1003)C2c2、荚膜红细菌(R121)C2c2、荚膜红细菌(DE442)C2c2、韦德纤毛菌(Lw2)C2c2或塞氏李斯特菌C2c2。
83.如权利要求63所述的方法或如权利要求79所述的RNA检测系统,其中该VI型CRISPR-Cas效应蛋白包含至少一个HEPN结构域。
84.如权利要求63所述的方法或如权利要求79所述的RNA检测系统,其中该VI型CRISPR-Cas效应蛋白包含两个HEPN结构域。
85.如权利要求63所述的方法或如权利要求79所述的RNA检测系统,其中该VI型CRISPR-Cas效应蛋白包含至少一个催化活性HEPN结构域,该至少一个催化活性HEPN结构域包含RxxxxH基序。
86.如权利要求63所述的方法或如权利要求79所述的RNA检测系统,其中该VI型CRISPR-Cas效应蛋白包含两个催化活性HEPN结构域,该两个催化活性HEPN结构域各自包含RxxxxH基序。
87.如权利要求63所述的方法或如权利要求79所述的RNA检测系统,其中该VI型CRISPR-Cas效应蛋白包含至少一个无催化活性的HEPN结构域,该至少一个无催化活性的HEPN结构域通过使野生型RxxxxH基序的R或H中的至少一个突变而获得。
88.如权利要求63所述的方法或如权利要求79所述的RNA检测系统,其中该VI型CRISPR-Cas效应蛋白包含两个无催化活性的HEPN结构域,该两个无催化活性的HEPN结构域各自通过使野生型RxxxxH基序的R或H中的至少一个突变而获得。
89.一种试剂盒,该试剂盒包含
a)能够切割RNA的VI型CRISPR-Cas效应蛋白,和
b)能够被该效应蛋白非特异性地且可检测地切割的基于RNA的切割诱导型报告分子。
90.一种组合物,该组合物包含两种不同的无催化活性的C2c2效应蛋白。
91.如权利要求90所述的组合物,其中这些不同的C2c2效应蛋白中的每种与不同的报告分子连接。
92.如权利要求90或91所述的组合物,其中这些报告分子分别选自不同的表位标签和/或荧光分子。如权利要求90-92中任一项所述的组合物用于研究和诊断使用并且优选多色成像的用途。
93.一种C2c2效应蛋白,该效应蛋白具有一个或多个经修饰的或经突变的氨基酸残基,该一个或多个经修饰的或经突变的氨基酸残基是C2c2中对应于如下的那些中的一个或多个:K2、K39、V40、E479、L514、V518、N524、G534、K535、E580、L597、V602、D630、F676、L709、I713、R717(HEPN)、N718、H722(HEPN)、E773、P823、V828、I879、Y880、F884、Y997、L1001、F1009、L1013、Y1093、L1099、L1111、Y1114、L1203、D1222、Y1244、L1250、L1253、K1261、I1334、L1355、L1359、R1362、Y1366、E1371、R1372、D1373、R1509(HEPN)、H1514(HEPN)、Y1543、D1544、K1546、K1548、V1551、I1558,根据C2c2共有编号;优选选自C2c2中对应于如下的那些中的一个或多个:K2、K39、V40、E479、L514、V518、N524、G534、K535、E580、D630、F676、L709、I713、R717(HEPN)、N718、H722(HEPN)、E773、P823、V828、I879、Y880、F884、Y997、L1001、F1009、L1013、Y1093、L1099、L1111、Y1114、L1203、D1222、Y1244、L1250、L1253、K1261、I1334、L1355、L1359、R1362、Y1366、E1371、R1372、D1373、R1509(HEPN)、H1514(HEPN)、Y1543、D1544、K1546、K1548、V1551、I1558,根据C2c2共有编号;
该一个或多个经修饰的或经突变的氨基酸残基是C2c2中对应于如下的那些中的一个或多个:M35、K36、T38、K39、I57、E65、G66、L68、N84、T86、E88、I103、N105、E123、R128、R129、K139、L152、L194、N196、K198、N201、Y222、D253、I266、F267、S280、I303、N306、R331、Y338、K389、Y390、K391、I434、K435、L458、D459、E462、L463、I478、E479、K494、R495、N498、S501、E519、N524、Y529、V530、G534、K535、Y539、T549、D551、R577、E580、A581、F582、I587、A593、L597、I601、L602、E611、E613、D630、I631、G633、K641、N646、V669、F676、S678、N695、E703、A707、I709、I713、I716、R717、H722、F740、F742、K768、I774、K778、I783、L787、S789、V792、Y796、D799、F812、N818、P820、F821、V822、P823、S824、F825、Y829、K831、D837、L852、F858、E867、A871、L875、K877、Y880、Y881、F884、F888、F896、N901、V903、N915、K916、R918、Q920、E951、P956、Y959、Q964、I969、N994、F1000、I10001、Q1003、F10005、K1007、G1008、F1009、N1019、L1020、K1021、I1023、N1028、E1070、I1075、K1076、F1092、K1097、L1099、L1104、L1107、K1113、Y1114、E1149、E1151、I1153、L1155、L1158、D1166、L1203、D1222、G1224、I1228、R1236、K1243、Y1244、G1245、D1255、K1261、S1263、L1267、E1269、K1274、I1277、E1278、L1289、H1290、A1294、N1320、K1325、E1327、Y1328、I1334、Y1337、K1341、N1342、K1343、N1350、L1352、L1355、L1356、I1359、L1360、R1362、V1363、G1364、Y1365、I1369、R1371、D1372、F1385、E1391、D1459、K1463、K1466、R1509、N1510、I1512、A1513、H1514、N1516、Y1517、L1529、L1530、E1534、L1536、R1537、Y1543、D1544、R1545、K1546、L1547、K1548、N1549、A1550、K1553、S1554、D1557、I1558、L1559、G1563、F1568、I1612、L1651、E1652、K1655、H1658、L1659、K1663、T1673、S1677、E1678、E1679、C1681、V1684、K1685、E1689,根据如图67所示的共有序列;或
该一个或多个经修饰的或经突变的氨基酸残基是C2c2中对应于如下的那些中的一个或多个:K28、K31、R44、E162、E184、K262、E288、K357、E360、K338、R441(HEPN)、H446(HEPN)、E471、K482、K525、K558、D707、R790、K811、R833、E839、R885、E894、R895、D896、K942、R960(HEPN)、H965(HEPN)、D990、K992、K994,根据如图66中所示的共有序列。
94.一种修饰感兴趣的靶基因座的方法,该方法包括向所述基因座递送非天然存在的或工程化的组合物,该组合物包含如权利要求93所述的C2c2效应蛋白和一种或多种核酸组分,其中至少该一种或多种核酸组分被工程化,该一种或多种核酸组分将该复合物引导至该感兴趣的靶标,并且该效应蛋白与该一种或多种核酸组分形成复合物,并且该复合物与该感兴趣的靶基因座结合。
95.一种非天然存在的或工程化的组合物,该组合物包含如权利要求1所述的C2c2效应蛋白和一种或多种核酸组分,其中至少该一种或多种核酸组分被工程化用于在修饰感兴趣的靶基因座中使用,该一种或多种核酸组分将该复合物引导至该感兴趣的靶标,并且该效应蛋白与该一种或多种核酸组分形成复合物,并且该复合物与该感兴趣的靶基因座结合。
96.一种非天然存在的或工程化的组合物的用途,该组合物包含如权利要求93所述的C2c2效应蛋白和一种或多种核酸组分,其中至少该一种或多种核酸组分被工程化用于修饰感兴趣的靶基因座,该一种或多种核酸组分将该复合物引导至该感兴趣的靶标,并且该效应蛋白与该一种或多种核酸组分形成复合物,并且该复合物与该感兴趣的靶基因座结合。
97.如权利要求93-96中任一项所述的方法、组合物或用途,其中该感兴趣的靶基因座包含RNA。
98.如权利要求93-97中任一项所述的方法,其中该感兴趣的靶基因座的修饰包括链断裂。
99.如权利要求93-98中任一项所述的方法、组合物或用途,其中该C2c2效应蛋白针对在真核细胞中表达进行密码子优化。
100.如权利要求93-99中任一项所述的方法、组合物或用途,其中该C2c2效应蛋白与一个或多个功能结构域缔合;并且任选地,该效应蛋白含有任选地在HEPN结构域内的一个或多个突变,如R597A、H602A、R1278A和/或H1283A,由此该复合物可以递送表观遗传修饰因子或者转录或翻译活化或阻遏信号。
101.如权利要求100所述的方法、组合物或用途,其中该功能结构域修饰该靶基因座的转录或翻译。
102.如权利要求93至101中任一项所述的方法、组合物或用途,其中该C2c2效应蛋白包含至少一个或多个核定位信号或核输出信号。
103.如权利要求93-102中任一项所述的方法、组合物或用途,其中该感兴趣的靶基因座被包含在体外的核酸分子中。
104.如权利要求93-10中任一项所述的方法、组合物或用途,其中该感兴趣的靶基因座被包含在细胞内的核酸分子中。
105.如权利要求104所述的方法、组合物或用途,其中该细胞包括原核细胞。
106.如权利要求12所述的方法,其中该细胞包括真核细胞。
107.如权利要求93-106中任一项所述的方法、组合物或用途,其中所述修饰是在体外、体内或离体进行的。
108.如权利要求93-107中任一项所述的方法、组合物或用途,其中当与该效应蛋白复合时,该一种或多种核酸组分能够实现该复合物与该感兴趣的靶基因座的靶序列的序列特异性结合。
109.如权利要求93-108中任一项所述的方法、组合物或用途,其中该一种或多种核酸组分包含双同向重复序列。
110.如权利要求93-109中任一项所述的方法、组合物或用途,其中该效应蛋白和一种或多种核酸组分是经由编码这些多肽和/或该一种或多种核酸组分的一种或多种多核苷酸分子提供的,并且其中该一种或多种多核苷酸分子可操作地配置成表达这些多肽和/或该一种或多种核酸组分。
111.如权利要求110所述的方法、组合物或用途,其中该一种或多种多核苷酸分子包含一种或多种调节元件,该一种或多种调节元件可操作地配置成表达这些多肽和/或该一种或多种核酸组分,任选地其中该一种或多种调节元件包括一个或多个启动子或者一个或多个诱导型启动子。
112.如权利要求110或111所述的方法、组合物或用途,其中该一种或多种多核苷酸分子被包含在一种或多种载体中。
113.如权利要求110或111所述的方法、组合物或用途,其中该一种或多种多核苷酸分子被包含在一种载体中。
114.如权利要求112或113所述的方法、组合物或用途,其中该一种或多种载体包括病毒载体。
115.如权利要求114所述的方法、组合物或用途,其中该一种或多种病毒载体包括一种或多种逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体或单纯疱疹病毒载体。
116.如权利要求110至111中任一项所述的方法、组合物或用途,其中该一种或多种多核苷酸分子被包含在递送系统中,或者如权利要求112或113所述的方法、组合物或用途,其中该一种或多种载体被包含在递送系统中,或者如权利要求93-109中任一项所述的方法、组合物或用途,其中该组装的复合物被包含在递送系统中。
117.如权利要求93-116中任一项所述的方法、组合物或用途,其中该非天然存在的或工程化的组合物通过递送媒介递送,该递送媒介包括一种或多种脂质体、一种或多种粒子、一种或多种外泌体、一种或多种微泡、基因枪或者一种或多种病毒载体。
118.一种非天然存在的或工程化的组合物,该组合物是具有如权利要求93-117中任一项所定义的特征的组合物。
119.一种非天然存在的或工程化的组合物,该组合物包含C2c2效应蛋白和一种或多种核酸组分,其中至少该一种或多种核酸组分被工程化,该一种或多种核酸组分将该复合物引导至该感兴趣的靶标,并且该效应蛋白与该一种或多种核酸组分形成复合物,并且该复合物与该感兴趣的靶基因座结合。
120.如权利要求119所述的组合物,其中该感兴趣的靶基因座包含RNA。
121.如权利要求119或120所述的组合物,其中该感兴趣的靶基因座的修饰包括链断裂。
122.如权利要求119或120所述的组合物,其中该C2c2效应蛋白针对在真核细胞中表达进行密码子优化。
123.如权利要求119或120所述的组合物,其中该C2c2效应蛋白与一个或多个功能结构域缔合;并且任选地,该效应蛋白含有任选地在HEPN结构域内的一个或多个突变,如R597A、H602A、R1278A和/或H1283A,由此该复合物可以递送表观遗传修饰因子或者转录或翻译活化或阻遏信号。
124.如权利要求123所述的组合物,其中该功能结构域修饰该靶基因座的转录或翻译。
125.如权利要求119至124中任一项所述的组合物,其中该C2c2效应蛋白包含至少一个或多个核定位信号。
126.如权利要求119所述的组合物,其中该感兴趣的靶基因座被包含在体外的核酸分子中。
127.如权利要求119所述的组合物,其中该感兴趣的靶基因座被包含在细胞内的核酸分子中。
128.如权利要求127所述的组合物,其中该细胞包括原核细胞。
129.如权利要求127所述的组合物,其中该细胞包括真核细胞。
130.如权利要求119-129中任一项所述的组合物,其中当与该效应蛋白复合时,该一种或多种核酸组分能够实现该复合物与该感兴趣的靶基因座的靶序列的序列特异性结合。
131.如权利要求119-130中任一项所述的组合物,其中该一种或多种核酸组分包含双同向重复序列。
132.如权利要求119-127中任一项所述的组合物,其中该效应蛋白和一种或多种核酸组分是经由编码这些多肽和/或该一种或多种核酸组分的一种或多种多核苷酸分子提供的,并且其中该一种或多种多核苷酸分子可操作地配置成表达这些多肽和/或该一种或多种核酸组分。
133.如权利要求128所述的组合物,其中该一种或多种多核苷酸分子包含一种或多种调节元件,该一种或多种调节元件可操作地配置成表达这些多肽和/或该一种或多种核酸组分,任选地其中该一种或多种调节元件包括一个或多个启动子或者一个或多个诱导型启动子。
134.如权利要求132或133所述的组合物,其中该一种或多种多核苷酸分子被包含在一种或多种载体中。
135.如权利要求132或133所述的组合物,其中该一种或多种多核苷酸分子被包含在一种载体中。
136.如权利要求134或135所述的组合物,其中该一种或多种载体包括病毒载体。
137.如权利要求136所述的组合物,其中该一种或多种病毒载体包括一种或多种逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体或单纯疱疹病毒载体。
138.如权利要求132-133中任一项所述的组合物,其中该一种或多种多核苷酸分子被包含在递送系统中,或者如权利要求134或135所述的组合物,其中该一种或多种载体被包含在递送系统中,或者如权利要求119-127中任一项所述的组合物,其中该组装的复合物被包含在递送系统中。
139.如前述权利要求中任一项所述的组合物,其中该非天然存在的或工程化的组合物通过递送媒介递送,该递送媒介包括一种或多种脂质体、一种或多种粒子、一种或多种外泌体、一种或多种微泡、基因枪或者一种或多种病毒载体。
140.一种载体系统,该载体系统包含一种或多种载体,该一种或多种载体包含编码非天然存在的或工程化的组合物的组分的一种或多种多核苷酸分子,该组合物是具有如前述权利要求中任一项所定义的特征的组合物。
141.一种递送系统,该递送系统配置成递送非天然存在的或工程化的组合物的C2c2效应蛋白和一种或多种核酸组分,该组合物是具有如前述权利要求中任一项所定义的特征的组合物。
142.如权利要求141所述的递送系统,该递送系统包含一种或多种载体或者一种或多种多核苷酸分子,该一种或多种载体或多核苷酸分子包含一种或多种多核苷酸分子,该一种或多种多核苷酸分子编码具有如前述权利要求中任一项所定义的特征的非天然存在的或工程化的组合物的该C2c2效应蛋白和一种或多种核酸组分。
143.如前述或后续权利要求中任一项所述的非天然存在的或工程化的组合物、载体系统或递送系统,其用于在治疗性治疗方法中使用。
144.一种细胞,该细胞根据该方法修饰或工程化以包含或者任选地诱导性地或组成性地表达如前述或后续权利要求中任一项所述的组合物或其组分。
145.如权利要求144所述的细胞,其中该修饰导致:
-该细胞包含至少一种RNA产物的被改变的转录或翻译;
-该细胞包含至少一种RNA产物的被改变的转录或翻译,其中该至少一种产物的表达增加;或
-该细胞包含至少一种RNA产物的被改变的转录或翻译,其中该至少一种产物的表达降低。
146.如权利要求145所述的细胞,其中该细胞包括真核细胞。
147.如权利要求144或145中任一项所述的细胞,其中该细胞包括哺乳动物细胞。
148.如权利要求144所述的细胞,其中该细胞包括原核细胞。
149.如任何前述权利要求所述的非天然存在的或工程化的组合物、载体系统或递送系统,其用于在以下中使用:
-RNA序列特异性干扰,
-RNA序列特异性基因调节,
-筛选RNA或RNA产物或lincRNA或非编码RNA、或核RNA、或mRNA,
-诱变,
-荧光原位杂交,
-育种,
-体外或体内诱导细胞休眠,
-体外或体内诱导细胞周期停滞,
-体外或体内减少细胞生长和/或细胞增殖,
-体外或体内诱导细胞无反应性,
-体外或体内诱导细胞凋亡,
-体外或体内诱导细胞坏死,
-体外或体内诱导细胞死亡,或
-体外或体内诱导程序性细胞死亡。
150.一种细胞系,该细胞系属于或包含如权利要求144-148中任一项所述的细胞或其子代。
151.一种多细胞生物,该多细胞生物包含如权利要求146或147所述的一种或多种细胞。
152.一种植物或动物模型,该模型包含如权利要求144-147中任一项所述的一种或多种细胞;所述一种或多种细胞任选地诱导性地或组成性地表达如前述权利要求中任一项所述的组合物或其组分。
153.一种产物,该产物来自如权利要求中任一项所述的细胞、或如权利要求所述的细胞系或生物、或如权利要求144-148、150-152中任一项所述的植物或动物模型;所述细胞或者该细胞系或者生物或者植物或动物模型的一种或多种细胞任选地诱导性地或组成性地表达如前述权利要求中任一项所述的组合物或其组分。
154.如权利要求153所述的产物,其中产物的量大于或小于来自未通过如前述权利要求中任一项所述的方法或组合物进行改变或修饰的细胞的产物的量。
155.如权利要求153所述的产物,其中与来自未通过如前述权利要求中任一项所述的方法或组合物进行改变或修饰的细胞的产物相比,该产物被改变。
156.一种测定、筛选方法或诱变方法,其包括如前述或后续权利要求中任一项所述的系统或方法或细胞。
157.一种基于RNA的测定、筛选方法或诱变方法,其中该改进包括不使用RNA,该方法包括使用如前述权利要求中任一项所述的组合物。
158.如权利要求157所述的方法,其中该基于RNA的测定、筛选方法或诱变方法是RNAi或荧光原位杂交方法。
159.如任何前述权利要求所述的非天然存在的或工程化的组合物、载体系统或递送系统用于以下的用途:
-RNA序列特异性干扰,
-RNA序列特异性基因调节,
-筛选RNA或RNA产物或lincRNA或非编码RNA、或核RNA、或mRNA,
-诱变,
-荧光原位杂交,
-育种,
-体外或体内诱导细胞休眠,
-体外或体内诱导细胞周期停滞,
-体外或体内减少细胞生长和/或细胞增殖,
-体外或体内诱导细胞无反应性,
-体外或体内诱导细胞凋亡,
-体外或体内诱导细胞坏死,
-体外或体内诱导细胞死亡,或
-体外或体内诱导程序性细胞死亡。
160.如权利要求93至117中任一项所述的方法或用途,其中所述方法导致:
-RNA序列特异性干扰,
-RNA序列特异性基因调节,
-筛选RNA或RNA产物或lincRNA或非编码RNA、或核RNA、或mRNA,
-诱变,
-荧光原位杂交,
-育种,
-体外或体内诱导细胞休眠,
-体外或体内诱导细胞周期停滞,
-体外或体内减少细胞生长和/或细胞增殖,
-体外或体内诱导细胞无反应性,
-体外或体内诱导细胞凋亡,
-体外或体内诱导细胞坏死,
-体外或体内诱导细胞死亡,或
-体外或体内诱导程序性细胞死亡。
161.一种方法,该方法用于:
-RNA序列特异性干扰,
-RNA序列特异性基因调节,
-筛选RNA或RNA产物或lincRNA或非编码RNA、或核RNA、或mRNA,
-诱变,
-荧光原位杂交,
-育种,
-体外或体内诱导细胞休眠,
-体外或体内诱导细胞周期停滞,
-体外或体内减少细胞生长和/或细胞增殖,
-体外或体内诱导细胞无反应性,
-体外或体内诱导细胞凋亡,
-体外或体内诱导细胞坏死,
-体外或体内诱导细胞死亡,或
-体外或体内诱导程序性细胞死亡,
该方法包括在靶细胞中体外、离体或体内引入或诱导如任何前述权利要求所述的非天然存在的或工程化的组合物、载体系统或递送系统。
CN201780050351.5A 2016-06-17 2017-06-19 Vi型crispr直向同源物和系统 Pending CN109642231A (zh)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US201662351662P 2016-06-17 2016-06-17
US201662351803P 2016-06-17 2016-06-17
US62/351,662 2016-06-17
US62/351,803 2016-06-17
US201662376377P 2016-08-17 2016-08-17
US62/376,377 2016-08-17
US201662410366P 2016-10-19 2016-10-19
US62/410,366 2016-10-19
US201662432240P 2016-12-09 2016-12-09
US62/432,240 2016-12-09
US201762471792P 2017-03-15 2017-03-15
US62/471,792 2017-03-15
US201762484786P 2017-04-12 2017-04-12
US62/484,786 2017-04-12
PCT/US2017/038154 WO2017219027A1 (en) 2016-06-17 2017-06-19 Type vi crispr orthologs and systems

Publications (1)

Publication Number Publication Date
CN109642231A true CN109642231A (zh) 2019-04-16

Family

ID=59295312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780050351.5A Pending CN109642231A (zh) 2016-06-17 2017-06-19 Vi型crispr直向同源物和系统

Country Status (9)

Country Link
US (3) US11788083B2 (zh)
EP (1) EP3455357A1 (zh)
JP (3) JP7267013B2 (zh)
KR (2) KR20230156150A (zh)
CN (1) CN109642231A (zh)
AU (4) AU2017283713B2 (zh)
BR (1) BR112018076190A2 (zh)
CA (1) CA3028158A1 (zh)
WO (1) WO2017219027A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110819652A (zh) * 2019-08-21 2020-02-21 山东金城生物药业有限公司 一种谷氨酸棒杆菌同时基因敲除及基因表达抑制的双功能系统及应用
CN112430586A (zh) * 2020-11-16 2021-03-02 珠海舒桐医疗科技有限公司 一种VI-B型CRISPR/Cas13基因编辑系统及其应用
CN114364704A (zh) * 2020-06-10 2022-04-15 株式会社东芝 修饰的piggybac转座酶多肽、编码它们的多核苷酸、引入载体、试剂盒、将靶序列整合到细胞基因组中的方法以及生产细胞的方法
CN115175996A (zh) * 2019-09-20 2022-10-11 博德研究所 新颖vi型crispr酶和系统
CN116096875A (zh) * 2020-09-30 2023-05-09 辉大(上海)生物科技有限公司 工程化的CRISPR/Cas13系统及其用途
CN116590257A (zh) * 2020-02-28 2023-08-15 辉大(上海)生物科技有限公司 VI-E型和VI-F型CRISPR-Cas系统及其用途

Families Citing this family (109)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11435358B2 (en) 2011-06-23 2022-09-06 Board Of Regents, The University Of Texas System Single molecule peptide sequencing
CA2839702C (en) 2011-06-23 2021-04-20 Board Of Regents, The University Of Texas System Identifying peptides at the single molecule level
WO2013066438A2 (en) 2011-07-22 2013-05-10 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US20150165054A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting caspase-9 point mutations
CA2956224A1 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
EP3543703A1 (en) 2014-09-15 2019-09-25 Board of Regents, The University of Texas System Improved single molecule peptide sequencing
WO2016073990A2 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
JP7030522B2 (ja) 2015-05-11 2022-03-07 エディタス・メディシン、インコーポレイテッド 幹細胞における遺伝子編集のための最適化crispr/cas9システムおよび方法
CN108026526B (zh) 2015-06-09 2023-05-12 爱迪塔斯医药公司 用于改善移植的crispr/cas相关方法和组合物
EP3786294A1 (en) 2015-09-24 2021-03-03 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
EP4269577A3 (en) 2015-10-23 2024-01-17 President and Fellows of Harvard College Nucleobase editors and uses thereof
JP2019500899A (ja) 2015-11-23 2019-01-17 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア CRISPR/Cas9の核送達を通じた細胞RNAの追跡と操作
WO2017165826A1 (en) 2016-03-25 2017-09-28 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
EP4047092A1 (en) 2016-04-13 2022-08-24 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
US10337051B2 (en) * 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
IL264565B1 (en) 2016-08-03 2024-03-01 Harvard College Adenosine nuclear base editors and their uses
EP3497214B1 (en) 2016-08-09 2023-06-28 President and Fellows of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CN110023494A (zh) 2016-09-30 2019-07-16 加利福尼亚大学董事会 Rna指导的核酸修饰酶及其使用方法
JP7306696B2 (ja) 2016-09-30 2023-07-11 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア Rna誘導型核酸修飾酵素及びその使用方法
SG11201903089RA (en) 2016-10-14 2019-05-30 Harvard College Aav delivery of nucleobase editors
HUE059759T2 (hu) * 2016-12-09 2022-12-28 Broad Inst Inc CRISPR effektor rendszer alapú diagnosztika
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
WO2018165504A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Suppression of pain by gene editing
US11542496B2 (en) 2017-03-10 2023-01-03 President And Fellows Of Harvard College Cytosine to guanine base editor
KR102454284B1 (ko) * 2017-03-15 2022-10-12 더 브로드 인스티튜트, 인코퍼레이티드 신규 cas13b 오르소로그 crispr 효소 및 시스템
US11104937B2 (en) * 2017-03-15 2021-08-31 The Broad Institute, Inc. CRISPR effector system based diagnostics
US11174515B2 (en) 2017-03-15 2021-11-16 The Broad Institute, Inc. CRISPR effector system based diagnostics
US11021740B2 (en) 2017-03-15 2021-06-01 The Broad Institute, Inc. Devices for CRISPR effector system based diagnostics
EP3601562A1 (en) 2017-03-23 2020-02-05 President and Fellows of Harvard College Nucleobase editors comprising nucleic acid programmable dna binding proteins
US11963966B2 (en) 2017-03-31 2024-04-23 Dana-Farber Cancer Institute, Inc. Compositions and methods for treating ovarian tumors
US11618928B2 (en) 2017-04-12 2023-04-04 The Broad Institute, Inc. CRISPR effector system based diagnostics for malaria detection
BR112019021378A2 (pt) 2017-04-12 2020-05-05 Massachusetts Inst Technology ortólogos de crispr tipo vi inovadores e sistemas
BR112019021719A2 (pt) 2017-04-21 2020-06-16 The General Hospital Corporation Variantes de cpf1 (cas12a) com especificidade para pam alterada
EP3615672A1 (en) 2017-04-28 2020-03-04 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
WO2018208998A1 (en) 2017-05-10 2018-11-15 The Regents Of The University Of California Directed editing of cellular rna via nuclear delivery of crispr/cas9
US11560566B2 (en) 2017-05-12 2023-01-24 President And Fellows Of Harvard College Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation
JP2020524497A (ja) 2017-06-09 2020-08-20 エディタス・メディシン,インコーポレイテッド 操作されたcas9ヌクレアーゼ
EP3638218A4 (en) 2017-06-14 2021-06-09 The Broad Institute, Inc. COMPOSITIONS AND METHOD OF TARGETING COMPLEMENTING COMPONENT 3 FOR INHIBITION OF TUMOR GROWTH
WO2019005886A1 (en) * 2017-06-26 2019-01-03 The Broad Institute, Inc. CRISPR / CAS-CYTIDINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED EDITING OF NUCLEIC ACIDS
US11168322B2 (en) 2017-06-30 2021-11-09 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
EP3658573A1 (en) 2017-07-28 2020-06-03 President and Fellows of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
US20210009972A1 (en) * 2017-10-04 2021-01-14 The Broad Institute, Inc. Systems methods, and compositions for targeted nucleic acid editing
KR102628577B1 (ko) * 2017-10-04 2024-01-23 더 브로드 인스티튜트, 인코퍼레이티드 Crispr 이펙터 시스템 기반 진단법
WO2019079347A1 (en) 2017-10-16 2019-04-25 The Broad Institute, Inc. USES OF BASIC EDITORS ADENOSINE
WO2019089808A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Class 2 crispr/cas compositions and methods of use
MX2020004578A (es) 2017-11-01 2020-12-03 Univ California Composiciones de casz y metodos de uso.
WO2019113506A1 (en) 2017-12-07 2019-06-13 The Broad Institute, Inc. Methods and compositions for multiplexing single cell and single nuclei sequencing
US20210071163A1 (en) * 2017-12-22 2021-03-11 The Broad Institute, Inc. Cas12b systems, methods, and compositions for targeted rna base editing
WO2019126577A2 (en) * 2017-12-22 2019-06-27 The Broad Institute, Inc. Crispr effector system based multiplex diagnostics
KR20200127168A (ko) * 2018-01-29 2020-11-10 더 브로드 인스티튜트, 인코퍼레이티드 Crispr 이펙터 시스템 기반 진단
CN108559738A (zh) * 2018-02-12 2018-09-21 南昌大学 一种植物rna修饰和编辑的系统及方法
HRP20230828T1 (hr) 2018-03-14 2023-11-10 Arbor Biotechnologies, Inc. Novi sustavi i enzimi koji ciljaju na crispr dna
US20230242891A1 (en) 2018-03-14 2023-08-03 Arbor Biotechnologies, Inc. Novel crispr dna and rna targeting enzymes and systems
US20210189386A1 (en) * 2018-03-30 2021-06-24 POiRT Systems Co., Ltd. Nucleic acid construct, medicinal composition, anticancer agent, antiviral agent and antibacterial agent
CN108796036B (zh) * 2018-04-03 2021-11-19 交弘生物科技(上海)有限公司 基于原核Argonaute蛋白的核酸检测方法及其应用
WO2019204210A1 (en) 2018-04-16 2019-10-24 Georgia Tech Research Corporation Mrna driven expression of rna editors for treatment of pathologies
CA3097857A1 (en) * 2018-04-20 2019-10-24 The Regents Of The University Of California Fusion proteins and fusion ribonucleic acids for tracking and manipulating cellular rna
US11957695B2 (en) 2018-04-26 2024-04-16 The Broad Institute, Inc. Methods and compositions targeting glucocorticoid signaling for modulating immune responses
WO2019222555A1 (en) 2018-05-16 2019-11-21 Arbor Biotechnologies, Inc. Novel crispr-associated systems and components
CN108546718B (zh) * 2018-05-16 2021-07-09 康春生 crRNA介导的CRISPR/Cas13a基因编辑系统在肿瘤细胞中的应用
CN110527697B (zh) * 2018-05-23 2023-07-07 中国科学院分子植物科学卓越创新中心 基于CRISPR-Cas13a的RNA定点编辑技术
US20190390193A1 (en) * 2018-06-23 2019-12-26 John Lawrence Mee Reversible method for sustainable human cognitive enhancement
BR112020026246A2 (pt) 2018-06-26 2021-04-20 The Broad Institute Inc. composições, sistemas e métodos de amplificação com base em nickase dupla crispr
MX2020013836A (es) 2018-06-26 2021-05-27 Massachusetts Inst Technology Métodos, sistemas y diagnósticos de amplificación basados en el sistema efector crispr.
WO2020000454A1 (zh) * 2018-06-29 2020-01-02 深圳市博奥康生物科技有限公司 一种表达LwCas13a基因的质粒、构建方法及其应用
JP2021530549A (ja) * 2018-07-23 2021-11-11 ボード オブ リージェンツ, ザ ユニバーシティ オブ テキサス システムBoard Of Regents, The University Of Texas System タンパク質における翻訳後修飾の、単一分子配列決定による同定
CN112639096A (zh) * 2018-07-25 2021-04-09 国立研究开发法人产业技术综合研究所 抑制植物中的靶dna的甲基化的方法
CA3111432A1 (en) * 2018-07-31 2020-02-06 The Broad Institute, Inc. Novel crispr enzymes and systems
WO2020028729A1 (en) 2018-08-01 2020-02-06 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
GB2590880A (en) * 2018-09-06 2021-07-07 Univ California RNA and DNA base editing via engineered ADAR recruitment
EP3650553B1 (en) * 2018-11-07 2023-07-12 Siemens Healthcare GmbH Method for detection of specific nucleic acids
CN113302312A (zh) 2018-11-14 2021-08-24 博德研究所 使用sherlock检测方法对高度进化的病毒变体进行多重化
AU2019379160A1 (en) 2018-11-14 2021-06-24 Massachusetts Institute Of Technology CRISPR system based droplet diagnostic systems and methods
US20220282275A1 (en) * 2018-11-15 2022-09-08 The Broad Institute, Inc. G-to-t base editors and uses thereof
EP3882345A4 (en) * 2018-11-15 2023-02-22 China Agricultural University CRISPR-CAS12J ENZYME AND SYSTEM
WO2020124050A1 (en) 2018-12-13 2020-06-18 The Broad Institute, Inc. Tiled assays using crispr-cas based detection
EP3931313A2 (en) 2019-01-04 2022-01-05 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
US11739156B2 (en) 2019-01-06 2023-08-29 The Broad Institute, Inc. Massachusetts Institute of Technology Methods and compositions for overcoming immunosuppression
WO2020186231A2 (en) 2019-03-14 2020-09-17 The Broad Institute, Inc. Crispr effector system based multiplex diagnostics
WO2020191102A1 (en) 2019-03-18 2020-09-24 The Broad Institute, Inc. Type vii crispr proteins and systems
WO2020191246A1 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
KR20220004980A (ko) * 2019-03-26 2022-01-12 페킹 유니버시티 기능 요소의 식별 방법
CN109913502A (zh) * 2019-04-16 2019-06-21 和元生物技术(上海)股份有限公司 一种Cas9-gRNA表达系统及其应用
EP3959320A1 (en) 2019-04-24 2022-03-02 Novartis AG Compositions and methods for selective protein degradation
US20220403356A1 (en) * 2019-07-12 2022-12-22 Duke University 3' utr crispr-dcas 13 engineering system and methods of using same
WO2021046257A1 (en) 2019-09-03 2021-03-11 The Broad Institute, Inc. Crispr effector system based multiplex cancer diagnostics
JP2022546592A (ja) 2019-09-03 2022-11-04 マイエロイド・セラピューティクス,インコーポレーテッド ゲノム組込みのための方法および組成物
US11844800B2 (en) 2019-10-30 2023-12-19 Massachusetts Institute Of Technology Methods and compositions for predicting and preventing relapse of acute lymphoblastic leukemia
WO2021113270A1 (en) 2019-12-02 2021-06-10 Shape Therapeutics Inc. Therapeutic editing
JP2023513211A (ja) * 2020-02-07 2023-03-30 ユニバーシティ オブ ロチェスター タンパク質合成を増強するためのCRISPR-Cas13による標的RNA翻訳
CN111337666B (zh) * 2020-02-12 2021-04-02 山东大学 I-motif重组介导的FRET探针及其原位成像癌细胞表面蛋白质同源二聚化的应用
US11851702B2 (en) 2020-03-23 2023-12-26 The Broad Institute, Inc. Rapid diagnostics
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
WO2022188039A1 (en) 2021-03-09 2022-09-15 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
WO2022068912A1 (en) 2020-09-30 2022-04-07 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
CA3203046A1 (en) * 2020-12-22 2022-06-30 Helmholtz Zentrum Muenchen - Deutsches Forschungszentrum Fur Gesundheit Und Umwelt (Gmbh) Application of crispr/cas13 for therapy of rna virus and/or bacterium induced diseases
CN116802287A (zh) * 2021-01-05 2023-09-22 学校法人川崎学园 包括人类在内的生物体细胞中的转录产物、转染rna及其纯化复合物的工具
AU2022284804A1 (en) 2021-06-01 2023-12-07 Arbor Biotechnologies, Inc. Gene editing systems comprising a crispr nuclease and uses thereof
EP4141112A4 (en) * 2021-07-08 2024-01-17 Korea Advanced Inst Sci & Tech METHOD FOR MODULATING OR EDITING RNA EXPRESSION BY REGULATING THE CAS13 PROTEIN
US11814689B2 (en) 2021-07-21 2023-11-14 Montana State University Nucleic acid detection using type III CRISPR complex
EP4215612A1 (en) * 2022-01-20 2023-07-26 Sartorius Stedim Cellca GmbH Genome editing with crispr/cas nucleases comprising collateral activity

Family Cites Families (130)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
DE3751873T2 (de) 1986-04-09 1997-02-13 Genzyme Corp Genetisch transformierte Tiere, die ein gewünschtes Protein in Milch absondern
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
US5703055A (en) 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
AU7979491A (en) 1990-05-03 1991-11-27 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
GB9114259D0 (en) 1991-07-02 1991-08-21 Ici Plc Plant derived enzyme and dna sequences
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
EP0652965A1 (en) 1992-07-27 1995-05-17 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
US5593972A (en) 1993-01-26 1997-01-14 The Wistar Institute Genetic immunization
CN1127527A (zh) 1993-05-17 1996-07-24 加利福尼亚大学董事会 人免疫缺陷型病毒感染和艾滋病的核酶基因治疗方法
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5543158A (en) 1993-07-23 1996-08-06 Massachusetts Institute Of Technology Biodegradable injectable nanoparticles
US6007845A (en) 1994-07-22 1999-12-28 Massachusetts Institute Of Technology Nanoparticles and microparticles of non-linear hydrophilic-hydrophobic multiblock copolymers
JPH10510433A (ja) 1995-06-06 1998-10-13 アイシス・ファーマシューティカルス・インコーポレーテッド 高いキラル純度のホスホロチオエート結合を有するオリゴヌクレオチド
US5985662A (en) 1995-07-13 1999-11-16 Isis Pharmaceuticals Inc. Antisense inhibition of hepatitis B virus replication
US5985309A (en) 1996-05-24 1999-11-16 Massachusetts Institute Of Technology Preparation of particles for inhalation
US5855913A (en) 1997-01-16 1999-01-05 Massachusetts Instite Of Technology Particles incorporating surfactants for pulmonary drug delivery
US5846946A (en) 1996-06-14 1998-12-08 Pasteur Merieux Serums Et Vaccins Compositions and methods for administering Borrelia DNA
GB9907461D0 (en) 1999-03-31 1999-05-26 King S College London Neurite regeneration
GB9720465D0 (en) 1997-09-25 1997-11-26 Oxford Biomedica Ltd Dual-virus vectors
CA2307016A1 (en) 1997-10-24 1999-05-06 Life Technologies, Inc. Recombinational cloning using nucleic acids having recombination sites
US6750059B1 (en) 1998-07-16 2004-06-15 Whatman, Inc. Archiving of vectors
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US7868149B2 (en) 1999-07-20 2011-01-11 Monsanto Technology Llc Plant genome sequence and uses thereof
US6603061B1 (en) 1999-07-29 2003-08-05 Monsanto Company Agrobacterium-mediated plant transformation method
GB0024550D0 (zh) 2000-10-06 2000-11-22 Oxford Biomedica Ltd
WO2003045304A2 (en) 2001-09-26 2003-06-05 Mayo Foundation For Medical Education And Research Mutable vaccines
GB0125216D0 (en) 2001-10-19 2001-12-12 Univ Strathclyde Dendrimers for use in targeted delivery
US20090100536A1 (en) 2001-12-04 2009-04-16 Monsanto Company Transgenic plants with enhanced agronomic traits
JP2005512598A (ja) 2001-12-21 2005-05-12 オックスフォード バイオメディカ (ユーケー) リミテッド Eiavなどのレンチウイルス発現ベクターを使用するトランスジェニック生物の作製方法
WO2004002453A1 (en) 2002-06-28 2004-01-08 Protiva Biotherapeutics Ltd. Method and apparatus for producing liposomes
GB0220467D0 (en) 2002-09-03 2002-10-09 Oxford Biomedica Ltd Composition
EP1558724A4 (en) 2002-11-01 2006-08-02 New England Biolabs Inc ORGANIC RNA SCREENING AND ITS USE IN INTERRUPTING GENE TRANSMISSION IN THE ENVIRONMENT
EP1648519B1 (en) 2003-07-16 2014-10-08 Protiva Biotherapeutics Inc. Lipid encapsulated interfering rna
NZ592917A (en) 2003-09-15 2012-12-21 Protiva Biotherapeutics Inc Stable polyethyleneglycol (PEG) dialkyloxypropyl (DAA) lipid conjugates
GB0325379D0 (en) 2003-10-30 2003-12-03 Oxford Biomedica Ltd Vectors
WO2005121348A1 (en) 2004-06-07 2005-12-22 Protiva Biotherapeutics, Inc. Lipid encapsulated interfering rna
US7745651B2 (en) 2004-06-07 2010-06-29 Protiva Biotherapeutics, Inc. Cationic lipids and methods of use
WO2006020071A2 (en) 2004-07-16 2006-02-23 The Government Of The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Vaccines against aids comprising cmv/r-nucleic acid constructs
GB0422877D0 (en) 2004-10-14 2004-11-17 Univ Glasgow Bioactive polymers
US7838658B2 (en) 2005-10-20 2010-11-23 Ian Maclachlan siRNA silencing of filovirus gene expression
US8044019B2 (en) 2005-10-28 2011-10-25 Mitsubishi Tanabe Pharma Corporation Cell penetrating peptide
CA2628300C (en) 2005-11-02 2018-04-17 Protiva Biotherapeutics, Inc. Modified sirna molecules and uses thereof
GB0526211D0 (en) 2005-12-22 2006-02-01 Oxford Biomedica Ltd Viral vectors
US7915399B2 (en) 2006-06-09 2011-03-29 Protiva Biotherapeutics, Inc. Modified siRNA molecules and uses thereof
JP2008078613A (ja) 2006-08-24 2008-04-03 Rohm Co Ltd 窒化物半導体の製造方法及び窒化物半導体素子
US20100099858A1 (en) 2006-09-28 2010-04-22 Mirkin Chad A Maximizing Oligonucleotide Loading on Gold Nanoparticle
WO2008064289A2 (en) 2006-11-21 2008-05-29 The Samuel Roberts Noble Foundation, Inc. Biofuel production methods and compositions
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
EP2225002A4 (en) 2007-12-31 2011-06-22 Nanocor Therapeutics Inc RNA INTERFERENCE FOR THE TREATMENT OF CARDIAC SUFFICIENCIES
PL2279254T3 (pl) 2008-04-15 2017-11-30 Protiva Biotherapeutics Inc. Nowe preparaty lipidowe do dostarczania kwasów nukleinowych
EP2283029A1 (en) 2008-06-04 2011-02-16 Medical Research Council Peptides
EP2323630B1 (en) 2008-06-30 2014-11-19 Silenseed Ltd Methods, compositions and systems for local delivery of drugs
EP2309980A1 (en) 2008-07-08 2011-04-20 S.I.F.I. Societa' Industria Farmaceutica Italiana Ophthalmic compositions for treating pathologies of the posterior segment of the eye
AU2009311667B2 (en) 2008-11-07 2016-04-14 Massachusetts Institute Of Technology Aminoalcohol lipidoids and uses thereof
GB2465749B (en) 2008-11-25 2013-05-08 Algentech Sas Plant cell transformation method
WO2010096488A1 (en) 2009-02-17 2010-08-26 The Regents Of The University Of California Method of reducing acetylation in plants to improve biofuel production
IL292615B2 (en) 2009-07-01 2023-11-01 Protiva Biotherapeutics Inc Nucleic acid-lipid particles, preparations containing them and their uses
WO2011000108A1 (en) 2009-07-01 2011-01-06 Protiva Biotherapeutics, Inc. Compositions and methods for silencing apolipoprotein b
US20110027239A1 (en) 2009-07-29 2011-02-03 Tissue Genesis, Inc. Adipose-derived stromal cells (asc) as delivery tool for treatment of cancer
WO2011028929A2 (en) 2009-09-03 2011-03-10 The Regents Of The University Of California Nitrate-responsive promoter
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
US20120003201A1 (en) 2010-04-21 2012-01-05 Nicholas Susanne B Vault agents for chronic kidney disease
WO2011139336A1 (en) 2010-04-26 2011-11-10 Sangamo Biosciences, Inc. Genome editing of a rosa locus using nucleases
US8372951B2 (en) 2010-05-14 2013-02-12 National Tsing Hua University Cell penetrating peptides for intracellular delivery
ES2536791T3 (es) 2010-05-28 2015-05-28 Oxford Biomedica (Uk) Ltd Administración de vectores lentivirales al cerebro
EP2609135A4 (en) 2010-08-26 2015-05-20 Massachusetts Inst Technology POLY (BETA-AMINO ALCOHOLS), THEIR PREPARATION AND USES THEREOF
US9405700B2 (en) 2010-11-04 2016-08-02 Sonics, Inc. Methods and apparatus for virtualization in an integrated circuit
WO2012135025A2 (en) 2011-03-28 2012-10-04 Massachusetts Institute Of Technology Conjugated lipomers and uses thereof
WO2012135805A2 (en) 2011-03-31 2012-10-04 modeRNA Therapeutics Delivery and formulation of engineered nucleic acids
US20120295960A1 (en) 2011-05-20 2012-11-22 Oxford Biomedica (Uk) Ltd. Treatment regimen for parkinson's disease
EP2751567B1 (en) 2011-09-01 2019-05-08 University of Iowa Research Foundation Oligonucleotide-based probes for detection of bacterial nucleases
CN104114572A (zh) 2011-12-16 2014-10-22 现代治疗公司 经修饰的核苷、核苷酸和核酸组合物
US20130185823A1 (en) 2012-01-16 2013-07-18 Academia Sinica Mesoporous silica nanoparticle-mediated delivery of dna into arabidopsis root
PE20190843A1 (es) * 2012-05-25 2019-06-17 Emmanuelle Charpentier Arn de direccion a adn generico
US8614194B1 (en) 2012-07-25 2013-12-24 Kaohsiung Medical University Anionic cell penetrating peptide and its use for intracellular delivery
EP2877213B1 (en) 2012-07-25 2020-12-02 The Broad Institute, Inc. Inducible dna binding proteins and genome perturbation tools and applications thereof
CN110066775B (zh) 2012-10-23 2024-03-19 基因工具股份有限公司 用于切割靶dna的组合物及其用途
ES2883590T3 (es) 2012-12-12 2021-12-09 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas
ES2701749T3 (es) 2012-12-12 2019-02-25 Broad Inst Inc Métodos, modelos, sistemas y aparatos para identificar secuencias diana para enzimas Cas o sistemas CRISPR-Cas para secuencias diana y transmitir resultados de los mismos
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
WO2014093701A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
DK2898075T3 (en) 2012-12-12 2016-06-27 Broad Inst Inc CONSTRUCTION AND OPTIMIZATION OF IMPROVED SYSTEMS, PROCEDURES AND ENZYME COMPOSITIONS FOR SEQUENCE MANIPULATION
CN113528577A (zh) 2012-12-12 2021-10-22 布罗德研究所有限公司 用于序列操纵的系统、方法和优化的指导组合物的工程化
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
PL2784162T3 (pl) 2012-12-12 2016-01-29 Broad Inst Inc Opracowanie systemów, metod oraz zoptymalizowanych kompozycji przewodnikowych do manipulacji sekwencyjnej
PT2931898E (pt) 2012-12-12 2016-06-16 Harvard College Manipulação e otimização de sistemas, métodos e composições para manipulação de sequências com domínios funcionais
CN114634950A (zh) 2012-12-12 2022-06-17 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
DK3011031T3 (da) 2013-06-17 2020-12-21 Broad Inst Inc Fremføring og anvendelse af crispr-cas-systemerne, vektorer og sammensætninger til levermålretning og -terapi
JP6665088B2 (ja) 2013-06-17 2020-03-13 ザ・ブロード・インスティテュート・インコーポレイテッド 配列操作のための最適化されたCRISPR−Cas二重ニッカーゼ系、方法および組成物
CN105793425B (zh) 2013-06-17 2021-10-26 布罗德研究所有限公司 使用病毒组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用
ES2767318T3 (es) 2013-06-17 2020-06-17 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para generar modelos y actuar sobre enfermedades y trastornos de células posmitóticas
ES2777217T3 (es) 2013-06-17 2020-08-04 Broad Inst Inc Suministro, modificación y optimización de sistemas de guía en tándem, métodos y composiciones para la manipulación de secuencias
WO2014204723A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions
EP3011033B1 (en) 2013-06-17 2020-02-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
JP2017501149A (ja) 2013-12-12 2017-01-12 ザ・ブロード・インスティテュート・インコーポレイテッド 粒子送達構成成分を用いた障害及び疾患の標的化のためのcrispr−cas系及び組成物の送達、使用及び治療適用
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
EP4159856A1 (en) * 2015-06-18 2023-04-05 The Broad Institute, Inc. Novel crispr enzymes and systems
AU2016342038B2 (en) * 2015-10-22 2022-09-08 Massachusetts Institute Of Technology Type VI-B CRISPR enzymes and systems
EP3390624A4 (en) * 2015-12-18 2019-07-10 The Regents of The University of California MODIFIED POLYPEPTIDES AND METHOD OF USE THEREOF
MX2018008416A (es) * 2016-01-08 2019-11-11 Univ California Polipéptidos heterodímericos condicionalmente activos y métodos para su uso.
US11427837B2 (en) * 2016-01-12 2022-08-30 The Regents Of The University Of California Compositions and methods for enhanced genome editing
WO2017136335A1 (en) * 2016-02-01 2017-08-10 The Regents Of The University Of California Self-inactivating endonuclease-encoding nucleic acids and methods of using the same
WO2017139505A2 (en) * 2016-02-11 2017-08-17 The Regents Of The University Of California Methods and compositions for modifying a mutant dystrophin gene in a cell's genome
WO2017160752A1 (en) * 2016-03-14 2017-09-21 Intellia Therapeutics, Inc. Methods and compositions for gene editing
CA3018978A1 (en) * 2016-03-30 2017-10-05 Intellia Therapeutics, Inc. Lipid nanoparticle formulations for crispr/cas components
US20190093128A1 (en) * 2016-03-31 2019-03-28 The Regents Of The University Of California Methods for genome editing in zygotes
WO2017189336A1 (en) * 2016-04-25 2017-11-02 The Regents Of The University Of California Methods and compositions for genomic editing
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
HUE059759T2 (hu) * 2016-12-09 2022-12-28 Broad Inst Inc CRISPR effektor rendszer alapú diagnosztika
US11174515B2 (en) * 2017-03-15 2021-11-16 The Broad Institute, Inc. CRISPR effector system based diagnostics
US11021740B2 (en) * 2017-03-15 2021-06-01 The Broad Institute, Inc. Devices for CRISPR effector system based diagnostics

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
OMAR O ABUDAYYEH 等: "C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector", 《SCIENCE》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110819652A (zh) * 2019-08-21 2020-02-21 山东金城生物药业有限公司 一种谷氨酸棒杆菌同时基因敲除及基因表达抑制的双功能系统及应用
CN115175996A (zh) * 2019-09-20 2022-10-11 博德研究所 新颖vi型crispr酶和系统
CN116590257A (zh) * 2020-02-28 2023-08-15 辉大(上海)生物科技有限公司 VI-E型和VI-F型CRISPR-Cas系统及其用途
CN116590257B (zh) * 2020-02-28 2024-04-30 辉大(上海)生物科技有限公司 VI-E型和VI-F型CRISPR-Cas系统及其用途
CN114364704A (zh) * 2020-06-10 2022-04-15 株式会社东芝 修饰的piggybac转座酶多肽、编码它们的多核苷酸、引入载体、试剂盒、将靶序列整合到细胞基因组中的方法以及生产细胞的方法
CN116096875A (zh) * 2020-09-30 2023-05-09 辉大(上海)生物科技有限公司 工程化的CRISPR/Cas13系统及其用途
CN116096875B (zh) * 2020-09-30 2023-12-01 辉大(上海)生物科技有限公司 工程化的CRISPR/Cas13系统及其用途
CN112430586A (zh) * 2020-11-16 2021-03-02 珠海舒桐医疗科技有限公司 一种VI-B型CRISPR/Cas13基因编辑系统及其应用

Also Published As

Publication number Publication date
US20240191223A1 (en) 2024-06-13
AU2018271372A1 (en) 2019-01-17
EP3455357A1 (en) 2019-03-20
BR112018076190A2 (pt) 2019-06-18
CA3028158A1 (en) 2017-12-21
US20230383282A1 (en) 2023-11-30
AU2021203747B2 (en) 2023-11-09
AU2023204078A1 (en) 2023-07-13
JP2019524072A (ja) 2019-09-05
JP2023134453A (ja) 2023-09-27
US20190359971A1 (en) 2019-11-28
KR20190019168A (ko) 2019-02-26
AU2021203747A1 (en) 2021-07-01
JP7267013B2 (ja) 2023-05-01
US11788083B2 (en) 2023-10-17
AU2017283713A1 (en) 2018-12-20
WO2017219027A1 (en) 2017-12-21
JP2023052051A (ja) 2023-04-11
AU2017283713B2 (en) 2021-04-08
KR20230156150A (ko) 2023-11-13

Similar Documents

Publication Publication Date Title
CN109642231A (zh) Vi型crispr直向同源物和系统
US11773412B2 (en) Crispr enzymes and systems
US20240110165A1 (en) Novel type vi crispr orthologs and systems
CN109153980A (zh) Vi-b型crispr酶和系统
US20200231975A1 (en) Novel type vi crispr orthologs and systems
CN108513582A (zh) 新型crispr酶以及系统
EP3645728A1 (en) Novel type vi crispr orthologs and systems
US20200308560A1 (en) Novel type vi crispr orthologs and systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40007305

Country of ref document: HK