CN115175996A - 新颖vi型crispr酶和系统 - Google Patents

新颖vi型crispr酶和系统 Download PDF

Info

Publication number
CN115175996A
CN115175996A CN202080080680.6A CN202080080680A CN115175996A CN 115175996 A CN115175996 A CN 115175996A CN 202080080680 A CN202080080680 A CN 202080080680A CN 115175996 A CN115175996 A CN 115175996A
Authority
CN
China
Prior art keywords
target
protein
sequence
composition
cas13
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080080680.6A
Other languages
English (en)
Inventor
F·张
H·阿尔泰-特兰
S·坎南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Massachusetts Institute of Technology
Broad Institute Inc
Original Assignee
Massachusetts Institute of Technology
Broad Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Massachusetts Institute of Technology, Broad Institute Inc filed Critical Massachusetts Institute of Technology
Publication of CN115175996A publication Critical patent/CN115175996A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本公开提供了用于靶向核酸的系统、方法和组合物。具体来说,本发明提供了Cas蛋白及其在修饰靶序列中的用途。

Description

新颖VI型CRISPR酶和系统
相关申请的交叉引用
本申请要求2019年9月20日提交的美国临时申请号62/903,604、2019年9月25日提交的美国临时申请号62/905,645、2020年1月29日提交的美国临时申请号62/967,408和2020 年6月25日提交的美国临时申请号63/044,190的权益。上述申请的全部内容在此通过引用 完全并入本文。
关于联邦资助研究的声明
本发明是根据由美国国立卫生研究院授予的授权号HG009761、MH110049和HL141201 在政府支持下进行。政府享有本发明的某些权利。
电子序列表的引用
电子序列表(“BROD-4860_ST25.txt”;大小为46,147,870字节,创建于2020年9月18 日)的内容通过引用整体并入本文。
技术领域
本发明总体上涉及用于控制涉及序列靶向,诸如基因转录物扰动或核酸编辑的基因表达 的系统、方法和组合物,所述系统、方法和组合物可以使用与成簇规律间隔短回文重复序列 (CRISPR)相关的载体系统及其组分。
发明背景
细菌和古细菌适应性免疫的CRISPR-CRISPR相关(Cas)系统是这样的一些系统,它们显 示出了蛋白质组成和基因组基因座结构的极端多样性。迫切需要用于靶向核酸或多核苷酸的 替代稳健系统和技术。
发明概要
在一个方面,本公开提供了一种非天然存在或工程改造的组合物,所述组合物包含:包 含至少一个HEPN结构域并且在大小方面小于900个氨基酸的Cas蛋白;和能够与所述Cas 蛋白形成复合物并引导所述复合物与靶序列结合的向导序列。在一些实施方案中,所述Cas 蛋白是VI型Cas蛋白。在一些实施方案中,所述Cas蛋白是Cas13。在一些实施方案中,所述Cas蛋白选自(a)SEQ ID NO.4102-4298;(b)SEQ ID NO.4299-4654;(c)SEQ ID NO.2771-2772、4655-4768或5260-5265;(d)SEQ ID NO.4769-4797;或(e)SEQ ID NO.4798-5203。
在另一方面,本公开提供了一种非天然存在或工程改造的系统,所述系统包含:(a)选 自以下的Cas蛋白:(i)SEQ ID NO.1-1323,(ii)SEQ ID NO.1324-2770,(iii)SEQ IDNO. 2773-2797或(iv)SEQ ID NO.2798-4092;(b)能够与Cas蛋白形成复合物并引导所述复合物 与靶序列结合的向导序列。
在一些实施方案中,所述Cas蛋白表现出旁系核酸酶活性并切割非靶序列。在一些实施 方案中,所述组合物包含两个或更多个能够与两个不同的靶序列或一个靶序列的不同区域杂 交的向导序列。在一些实施方案中,所述向导序列能够与原核细胞中的一个或多个靶序列杂 交。在一些实施方案中,所述向导序列能够与真核细胞中的一个或多个靶序列杂交。在一些 实施方案中,所述Cas蛋白包含一个或多个核定位信号。在一些实施方案中,所述Cas蛋白 包含一个或多个核输出信号。在一些实施方案中,所述Cas蛋白是无催化活性的。在一些实 施方案中,所述Cas蛋白是切口酶。在一些实施方案中,所述Cas蛋白与一个或多个功能域 相关。在一些实施方案中,所述一个或多个功能域是异源功能域。在一些实施方案中,所述 一个或多个功能域切割所述一个或多个靶序列。在一些实施方案中,所述一个或多个功能域 修饰所述靶序列的转录或翻译。在一些实施方案中,所述Cas蛋白与腺苷脱氨酶或胞嘧啶脱 氨酶相关。在一些实施方案中,所述组合物还包含重组模板。在一些实施方案中,所述重组 模板是通过同源定向修复(HDR)插入。在一些实施方案中,所述组合物还包含tracr RNA。 在一些实施方案中,所述Cas蛋白包含两个HEPN结构域。
在另一方面,本公开提供了一种非天然存在或工程改造的组合物,所述组合物包含:编 码本文的Cas蛋白的mRNA,以及能够与所述Cas蛋白形成复合物并引导所述复合物与靶 序列结合的向导序列。
在另一方面,本公开提供了一种用于修饰靶核酸中的核苷酸的非天然存在或工程改造的 组合物,所述组合物包含:本文的组合物;以及与所述Cas蛋白缔合的核苷酸脱氨酶。
在一些实施方案中,所述Cas蛋白是死Cas蛋白。在一些实施方案中,所述Cas蛋白是 切口酶。在一些实施方案中,所述核苷酸脱氨酶与所述Cas蛋白或所述序列序列共价或非共 价连接,或适合于在递送后与其连接。在一些实施方案中,所述核苷酸脱氨酶是腺苷脱氨酶。 在一些实施方案中,所述核苷酸脱氨酶是胞嘧啶脱氨酶。在一些实施方案中,所述核苷酸脱 氨酶是人ADAR2或其脱氨酶结构域。在一些实施方案中,所述腺苷脱氨酶包含一个或多个 突变。在一些实施方案中,所述一个或多个突变包括基于人ADAR2的氨基酸序列位置的 E620G或Q696L,以及同源ADAR蛋白中的相应突变。在一些实施方案中,所述腺苷脱氨 酶包含基于人ADAR2的氨基酸序列位置的(i)E488Q和E620G,(ii)E488Q和Q696L,或(iii) E488Q和V505I,或者同源ADAR蛋白中的相应突变。在一些实施方案中,所述腺苷脱氨酶具有胞嘧啶脱氨酶活性。在一些实施方案中,已经修饰所述核苷酸脱氨酶蛋白或其催化结 构域以增加对DNA-RNA异源双链体的活性。在一些实施方案中,已经修饰所述核苷酸脱氨酶蛋白或其催化结构域以减少脱靶效应。在一些实施方案中,对所述靶核酸中的核苷酸的 修饰能医冶由G→A或C→T点突变或致病性SNP引起的疾病。在一些实施方案中,所述疾病包括癌症、血友病、β-地中海贫血、马凡综合征(Marfan syndrome)和维-奥二氏综合征(Wiskott-Aldrich syndrome)。在一些实施方案中,对所述靶核酸中的核苷酸的修饰能医冶由 T→C或A→G点突变或致病性SNP引起的疾病。在一些实施方案中,对目标靶基因座处的 核苷酸的修饰使所述靶基因座处的靶基因失活。在一些实施方案中,对核苷酸的修饰修饰了 所述靶基因座处编码的基因产物或基因产物的表达。
在另一方面,本公开提供了一种工程改造的腺苷脱氨酶,其包含一个或多个突变:基于 人ADAR2的氨基酸序列位置的E488Q、E620G、Q696L或V505I,或同源ADAR蛋白中的 相应突变。在一些实施方案中,所述腺苷脱氨酶包含基于人ADAR2的氨基酸序列位置的(i)E488Q和E620G,(ii)E488Q和Q696L,或(iii)E488Q和V505I,或者同源ADAR蛋白中的 相应突变。
在另一方面,本公开提供了一种用于在一个或多个体外样品中检测一个或多个靶多肽的 存在的系统,所述系统包含:本文的Cas蛋白;
一个或多个检测适体,各自经设计而与所述一个或多个靶多肽之一结合,各个检测适体 包含掩蔽的启动子结合位点或掩蔽的引物结合位点和触发序列模板;以及包含非靶序列的基 于寡核苷酸的掩蔽构建体。在一些实施方案中,所述系统还包含用于扩增所述靶序列或所述 触发序列的核酸扩增试剂。在一些实施方案中,所述核酸扩增试剂是等温扩增试剂。
在另一方面,本公开提供了一种用于在一个或多个体外样品中检测一个或多个靶序列的 存在的系统,所述系统包括:本文的Cas蛋白;至少一个向导多核苷酸,其包含经设计而与 所述一个或多个靶序列具有一定程度的互补性并且经设计而与所述Cas蛋白形成复合物的 向导序列;以及包含非靶序列的基于寡核苷酸的掩蔽构建体,其中所述Cas蛋白表现出旁系 核酸酶活性,并且一旦被所述一个或多个靶序列激活就切割所述基于寡核苷酸的掩蔽构建体 的所述非靶序列。
在另一方面,本公开提供了一种非天然存在或工程改造的组合物,所述组合物包含本文 的Cas蛋白,所述Cas蛋白与酶或报告部分的无活性第一部分连接,其中所述酶或报告部分 在与所述酶或报告部分的互补部分接触时得以复原。在一些实施方案中,所述酶或报告部分 包括蛋白水解酶。在一些实施方案中,所述Cas蛋白包括与所述酶或报告部分的互补部分连 接的第一Cas蛋白和第二Cas蛋白。在一些实施方案中,所述组合物还包含:i)能够与所述 第一Cas蛋白形成复合物并与靶核酸的第一靶序列杂交的第一向导;和ii)能够与所述第二 Cas蛋白形成复合物并与所述靶核酸的第二靶序列杂交的第二向导。
在另一方面,本公开提供了一种非天然存在或工程改造的组合物,所述组合物包含一个 或多个编码本文的Cas蛋白和向导序列的多核苷酸。
在另一方面,本公开提供了一种载体系统,所述载体系统包含一个或多个载体,所述载 体包含:与编码本文的Cas蛋白的核苷酸序列可操作地连接的第一调控元件,和与编码所述 向导序列的核苷酸序列可操作地连接的第二调控元件。在一些实施方案中,所述编码Cas 蛋白的核苷酸序列经密码子优化以便在真核细胞中表达。在一些实施方案中,所述载体系统 包含在单个载体中。在一些实施方案中,所述一个或多个载体包括病毒载体。在一些实施方 案中,所述一个或多个载体包括一个或多个逆转录病毒、慢病毒、腺病毒、腺相关病毒或单 纯疱疹病毒载体。
在另一方面,本公开提供了一种递送系统,所述递送系统包括本文的组合物或本文的系 统,以及递送载体。在一些实施方案中,所述递送系统包含一个或多个载体或者一个或多个 多核苷酸分子,所述一个或多个载体或多核苷酸分子包括一个或多个编码所述Cas蛋白的多 核苷酸分子以及所述非天然存在或工程改造的组合物的一种或多种核酸组分。在一些实施方 案中,所述递送载体包含核糖核蛋白复合物、一个或多个颗粒、一个或多个囊泡、或者一个 或多个病毒载体、脂质体、纳米颗粒、外来体、微囊泡、核酸纳米组装体、基因枪、可植入 装置,或载体系统。在一些实施方案中,所述一个或多个颗粒包含脂质、糖、金属或蛋白质。 在一些实施方案中,所述一个或多个颗粒包括脂质纳米颗粒。在一些实施方案中,所述一个 或多个囊泡包括外来体或脂质体。在一些实施方案中,所述一个或多个病毒载体包括一个或 多个腺病毒载体、一个或多个慢病毒载体、或者一个或多个腺相关病毒载体。
在另一方面,本公开提供了一种包含本文的组合物或系统的细胞。在一些实施方案中, 所述细胞或其后代是真核细胞,优选地为人或非人动物细胞,任选地为治疗T细胞或产抗 体B细胞,或者其中其是真核细胞,所述细胞是植物细胞。
在另一个方面,本公开提供了一种包含本文的细胞或其后代的非人动物或植物。在一些 实施方案中,本公开提供了本文的组合物或本文的系统或本文的细胞,以供用于治疗性治疗 方法中。
在另一个方面,本公开提供了一种修饰一个或多个靶序列的方法,所述方法包括使所述 一个或多个靶序列与本文的组合物接触。在一些实施方案中,修饰所述一个或多个靶序列包 括增加或降低所述一个或多个靶序列的表达。在一些实施方案中,所述系统还包含重组模板, 并且其中修饰所述一个或多个靶序列包括插入所述重组模板或其一部分。在一些实施方案 中,所述一个或多个靶序列在原核细胞中。在一些实施方案中,所述一个或多个靶序列在真 核细胞中。
在另一个方面,本公开提供了一种修饰靶序列中的一个或多个核苷酸的方法,所述方法 包括使所述靶序列与本文的组合物接触。在一些实施方案中,所述靶序列是RNA。
在另一个方面,本公开提供了一种在样品中检测靶核酸的方法,所述方法包括:使样品 与以下接触:本文的组合物;和包含非靶序列的基于RNA的掩蔽构建体;其中所述Cas蛋 白表现出旁系RNA酶活性并切割所述检测构建体的非靶序列;以及检测由切割所述非靶序 列而来的信号,从而检测所述样品中的靶核酸。
在一些实施方案中,所述方法还包括使所述样品与用于扩增所述靶核酸的试剂接触。在 一些实施方案中,所述用于扩增的试剂包括等温扩增反应试剂。在一些实施方案中,所述等 温扩增试剂包括基于核酸序列的扩增、重组酶聚合酶扩增、环介导型等温扩增、链置换扩增、 解旋酶依赖性扩增或切口酶扩增试剂。在一些实施方案中,所述靶核酸是DNA分子,并且 所述方法还包括使所述靶DNA分子与包含RNA聚合酶位点的引物和RNA聚合酶接触。
在一些实施方案中,所述掩蔽构建体:抑制可检测正信号的产生直至所述掩蔽构建体被 切割或失活,或者掩蔽可检测正信号或产生可检测负信号直至所述掩蔽构建体被切割或失 活。
在一些实施方案中,所述掩蔽构建体包含:a.抑制由报告构建体编码的基因产物的产 生的沉默RNA,其中所述基因产物在表达时产生可检测正信号;b.产生可检测负信号的核 糖酶,并且其中当所述核糖酶失活时产生了可检测正信号;c.将底物转化为第一颜色的核 糖酶,并且其中当所述核糖酶失活时,所述底物转化为第二颜色;d.适体和/或包含多核苷 酸栓系型抑制剂;e.可检测配体和掩蔽组分连接的多核苷酸;f.通过桥分子保持呈聚集体 形式的纳米颗粒,其中所述桥分子的至少一部分包含多核苷酸,并且其中当所述纳米颗粒分 散在溶液中时所述溶液发生了颜色变化;g.通过连接分子与一个或多个淬灭剂分子连接的 量子点或荧光团,其中所述连接分子的至少一部分包含多核苷酸;h.与嵌入剂复合的多核 苷酸,其中所述嵌入剂在切割所述多核苷酸后改变了吸光度;或l.通过多核苷酸拴系的两 个荧光团,当从所述多核苷酸释放时会发生荧光变化。
在一些实施方案中,所述适体:a.包含能隔绝酶的多核苷酸拴系型抑制剂,其中所述 酶在从所述适体或多核苷酸拴系型抑制剂释放时通过作用于底物而产生可检测信号;b.是 能抑制酶并防止所述酶催化由底物产生可检测信号的抑制性适体,或其中所述多核苷酸拴系 型抑制剂抑制了酶并防止所述酶催化由底物产生可检测信号;或c.隔绝了一对剂,所述剂 在从所述适体释放时组合以产生可检测信号。在一些实施方案中,所述纳米颗粒是胶态金属。 在一些实施方案中,所述至少一个向导多核苷酸包含错配。在一些实施方案中,所述错配在 一个或多个向导序列上的单核苷酸变异的上游或下游。
在另一个方面,本公开提供了一种治疗或预防受试者的疾病的方法,所述方法包括向所 述受试者施用本文的组合物或系统或细胞。
在考虑对所示的示例性实施方案的以下详细描述后,所述示例性实施方案的这些和其他 方面、目标、特征和优点对于本领域普通技术人员将变得显而易见。
附图简述
将通过参考阐述了可以利用本发明原理的说明性实施方案的以下详细描述和附图来理 解本发明的特征和优点,其中:
图1A示出了五个具有可能的热稳定性的Cas13a序列,基因座QNRW01000010.1、OWPA01000389.1、0153798_10014618、0153978_10005171和0153798_10004687(SEQ ID NO:6026-6031)的蛋白质比对;图1B示出了Cas13系统发育树,其中鉴定的Cas13a序列源自于维持在55℃的生物反应器,从而在Cas13a树中形成了一个独特的分支。
图2A QNRW01000010.1顺向重复序列比对(SEQ ID NO:6032-6048);图2BOWPA01000389.1顺向重复序列比对(SEQ ID NO:6049-6054);图2C 0153798_10014618顺向重复序列比对(SEQ ID NO:6055-6058);图2D 0153978_10005171顺向重复序列比对(SEQID NO:6059-6062);图2E 0153798_10004687顺向重复序列比对(SEQ ID NO:6063-6066)。
图3A 0153798_10004687嗜热性Cas13分支;图3B 0153978_10005171嗜热性Cas13分 支;图3C 0153798_10014618嗜热性Cas13分支;图3D OWPA01000389.1嗜热性Cas13分支;图3E QNRW01000010.1嗜热性Cas13分支;图3F与嗜热性Cas13分支相关的 0J26742_10014101基因座;和图3G从在高温下进行的研究鉴定可能的热稳定性Cas13a的 0123519_10037894基因座。
图4示出了用于鉴定新颖Cas蛋白的示例性方法。
图5示出了迭代多标准HMM搜索的示例性方法。
图6示出了鉴定对页面/细菌基因组的间隔子命中的示例性方法。
图7示出了确定估计特征共现率的示例性方法。
图8示出了各种CRISPR系统的假设进化。
图9示出了Cas13家族中的蛋白质的大小分布。
图10示出了VI-B1型Cas蛋白亚群的系统发育树。
图11示出了Cas13b-t的6个示例。
图12Cas13b-t基因座的CRISPR阵列的分析结果。
图13示出了大肠杆菌必需基因筛检的结果。
图14示出了大肠杆菌必需基因PFS筛检的结果。
图15示出了示例性活性Cas13b-t直系同源物的5'D PFS偏好。
图16示出了示例性Cas13b-t对含有PFS的序列的消耗。
图17示出了由示例性Cas13b-t介导的基因敲低。
图18示出了示例性Cas13-bts对内源转录物的敲低。
图19示出了由示例性Cas13-bts介导的A-to-I RNA编辑。
图20A至图20B:图20A示出了表达靶向性向导RNA的载体的图谱。图20B示出了 表达非靶向导RNA的载体的图谱。
图21示出了当与进化的CDAR融合时对哺乳动物细胞中报告转录物的Cas13b-t1、t3 介导的C-to-U编辑。
图22A至图22H.Cas13b-t是超小Cas核酸酶的功能家族。图22A.Cas13亚型和变体的 UPGMA树状图和蛋白质大小分布。将以前未知的亚家族突出显示。图22B.独特Cas13b-t蛋白的系统发育树。诸点表示实验研究的蛋白质。图22C.Cas13b-t基因座组织。图22D.从对含有Cas13b-t2基因座的大肠杆菌的小RNA测序鉴定的CRISPR RNA。图22E.相对于靶 序列的PFS布置的示意图。图22F.大肠杆菌必需基因筛检证明了Cas13b-t1、3和5介导对 弱5'D(A/G/T)PFS的干扰。Weblogo图:前1%消耗的间隔子周围的核苷酸。直方图:靶 向和非靶向间隔子的消耗倍数的分布。线图:在靶向跨越靶转录物的正规化位置的区域的间 隔子的最终文库中的相对丰度。图22G至图22G对Cas13b-t1、3和5敲低HEK293FT细 胞中的(图22G)荧光素酶和(图22H)内源转录物的评估。所有值都相对于包含相应gRNA而 无Cas13b-t表达的转染对照物进行正规化,并且是平均值+/-标准偏差,n=4。T:靶向gRNA, NT:非靶向gRNA。
图23A至图23I.利用Cas13b-t的RNA编辑。图23A.介导RNA编辑的gRNA的示意 图。示出了错配气泡。错配距离是指错配碱基和DR的5'端之间的核苷酸数。图23B.对用 于恢复HEK293FT细胞中的W85X海萤荧光素酶报告基因的RNA编辑的评估,如通过荧光 素酶活性的恢复所测量。所有值都是平均值+/-标准偏差,对于Cas13b-t1-REPAIR,n=4,而 对于Cas13b-t3-REPAIR,n=3。图23C至图23F.通过对所选靶标的下一代测序(图23C)和 蛋白质活性测定(图230D至图23F)对Cas13b-t1-REPAIR和RESCUE在指定靶标处的RNA 编辑进行量化。T:靶向gRNA,NT:非靶向gRNA。所有值都是平均值+/-标准偏差,n=4。 图23G.用于工程改造具体ADAR2dd变体的定向进化方法的示意图。通过同时进行对编辑 ADE2转录物中的过早终止密码子的正选择和对编辑URA3转录物中的过早终止密码子的负 选择来进行活性和特异性的选择。图23H.对特异性增强ADAR2dd突变体应用于靶向W85X (TAG终止密码子)海萤荧光素酶报告基因的Cas13b-t1-REPAIR的评估,如通过荧光素酶活 性所测量。使用此具有非靶向gRNA的报告基因恢复荧光素酶活性被用作评估特异性的指 标。图23I.Cas13b-t1-REPAIR变体之间脱靶编辑的定量比较。金色的点标志着中靶编辑。 REPAIR-S是指在ADAR2dd中加入E620G和Q696L特异性增强突变体。G:长腹水蚤(Gaussia) 荧光素酶转录物,C:海萤荧光素酶转录物。
图24A至图24B.对Cas13b-t直系同源物的PFS偏好。图24A.用于测定Cas13b-t直系同源物的干扰活性和PFS偏好的大肠杆菌必需基因筛检的工作流程。图24B.对5'和3'PFS的检查共同表明,Cas13b-t1、3和5不仅偏好5'A/T/G,而且偏好3'侧上+2或+3位置的A。 5'PFS是指直接在靶序列5'的单个碱基,而3'PFS是指在靶序列3'侧的+2和+3碱基,因为 +1碱基对任何测试直系同源物都不显示任何偏好。
图25.HEPN突变消除了切割活性。使野生型序列和RanCas13b、Cas13b-t1和Cas13b-t3 的两个HEPN结构域中精氨酸和组氨酸残基都突变为丙氨酸的序列(灰色)靶向具有两个不同 靶向间隔子的长腹水蚤荧光素酶转录物。如通过荧光素酶活性降低所测量,对于HEPN突 变蛋白,敲低被消除,其中RanCas13b当作阳性对照物。所有的值都相对于非靶向间隔子 条件进行正规化,具有标准误差传播(n=3)。
图26A至图26H.RNA编辑gRNA间隔子的最佳错配距离的确定。通过下一代测序对靶向指定位点的(图26A至图26D)RanCas13b-REPAIR、Cas13b-t1-REPAIR、 Cas13b-t3-REPAIR和(图26E至图26H)RanCas13b-RESCUE、Cas13b-t1-RESCUE、 Cas13b-t3-RESCUE的最佳错配距离的定量评估。在所有的图中,所有值都代表平均值+/-标 准偏差(n=4)。条形代表了针对用于所有进一步实验的各个靶标/直系同源物选择的最佳错配 距离。含有靶腺苷或胞嘧啶的核苷酸三联体示于括号中。
图27A至图27L.RanCas13b、Cas13b-t1和Cas13b-t3在所选位点处的RNA编辑的比较。 在所有的图中,所有值都代表平均值+/-标准偏差(n=4)。靶向gRNA在REPAIR/RESCUE蛋 白表达条件下的值示于相应条形的上方。图27A至图27I.通过下一代测序测量指定靶位点 处的编辑率。图27J.通过W85X海萤荧光素酶报告基因的A-to-I RNA编辑恢复荧光素酶活 性。图27K.通过CTNNB1 T41密码子的A-to-I RNA编辑对β-连环蛋白的激活倍数,如通过正规化荧光素酶活性所测量。图27L.通过C82R长腹水蚤荧光素酶报告基因的C-to-U RNA编辑恢复荧光素酶活性。
图28A至图28F.第1轮进化之后对ADAR2dd突变体的评估。在所有的图中,所有值都代表平均值+/-标准偏差(n=4)。Wt是指RanCas13b-ADAR2dd(E488Q)。所有氨基酸变化都是指在ADAR2dd中的位置。含有靶腺苷的核苷酸三联体示于括号中。对于(图28A至图28B),条形或点表示被选择用于进一步分析的突变。对于(图28C至图28F),条形或点表示从这一轮进化选择的最终突变。图28A.对靶向W113X海萤荧光素酶报告基因的候选突变 体的评估,如通过荧光素酶活性的恢复所测量。图28B.对靶向W85X海萤荧光素酶报告基 因的候选突变体的评估,如通过荧光素酶活性的恢复所测量。非靶向RLU是指在非靶向间 隔子条件下恢复荧光素酶活性,并用作脱靶编辑的指标。图28C至图28E.对靶向指定位点 的所选突变体的评估,如通过下一代测序所测量。图28F.对靶向W85X海萤荧光素酶报告 基因的候选突变体的评估,如通过荧光素酶活性的恢复所测量。非靶向RLU是指在非靶向 间隔子条件下恢复荧光素酶活性,并用作脱靶编辑的指标。
图29A至图29J.第2轮进化之后对ADAR2dd突变体的评估。在所有的图中,诸值代表平均值+/-标准偏差(n=4)。Wt是指RanCas13b-ADAR2dd(E488Q),而wt+E620G是指RanCas13b-ADAR2dd(E488Q/E620G)。所有氨基酸变化都是指在ADAR2dd中的位置,而且 所有突变都在ADAR2dd(E488Q/E620G)背景的顶部。含有靶腺苷的核苷酸三联体示于括号 中。对于(图29A至图29C),条形或点表示被选择用于进一步分析的突变。对于图29D至 图29J,条形或点表示从这一轮进化选择的最终突变。图29A.对靶向R93H长腹水蚤荧光 素酶报告基因的候选突变体的评估,如通过荧光素酶活性的恢复所测量。图29B.对靶向 W85X(TGA终止密码子)海萤荧光素酶报告基因的候选突变体的评估,如通过荧光素酶活性 的恢复所测量。图29C.对靶向W85X(TAG终止密码子)海萤荧光素酶报告基因的候选突变 体的评估,如通过荧光素酶活性的恢复所测量。非靶向RLU是指在非靶向间隔子条件下恢 复荧光素酶活性,并用作脱靶编辑的指标。图29D至图29I.对靶向指定位点的所选候选突 变体的评估,如通过下一代测序所测量。图29J.对靶向W85X(TAG终止密码子)海萤荧光 素酶报告基因的候选突变体的评估,如通过荧光素酶活性的恢复所测量。非靶向RLU是指 在非靶向间隔子条件下恢复荧光素酶活性,并用作脱靶编辑的指标。
图30A至图30B.REPAIR变体之间脱靶编辑的比较。REPAIR变体在靶向(图30A)和非靶向(图30B)gRNA条件下脱靶编辑的定量比较。金色的点标志着中靶编辑。REPAIR-S是 指在ADAR2dd中加入E620G和Q696L特异性增强突变体。G:长腹水蚤荧光素酶转录物, C:海萤荧光素酶转录物。Cas13b-t1-REPAIR和REPAIR-S如图23I中所示。
图31A至图31H.Cas13b-t是超小Cas核酸酶的功能家族。(图31A)Cas13亚型和变体的UPGMA树状图和蛋白质大小分布。将以前未知的亚家族突出显示。(图31B)独特Cas13b-t蛋白的系统发育树。诸点表示实验研究的蛋白质。(图31C)Cas13b-t基因座组织。(图31D)从对含有Cas13b-t2基因座的大肠杆菌的小RNA测序鉴定的CRISPR RNA。(图31E)相对于 靶序列的PFS布置的示意图。(图31F)大肠杆菌必需基因筛检证明了Cas13b-t1、3和5介 导对弱5'D(A/G/T)PFS的干扰。Weblogo图:前1%消耗的间隔子周围的核苷酸。直方图: 靶向和非靶向间隔子的消耗倍数的分布。线图:在靶向跨越靶转录物的正规化位置的区域的 间隔子的最终文库中的相对丰度。(图31G至图31H)对Cas13b-t1、3和5敲低HEK293FT 细胞中的(图31G)荧光素酶和(图31H)内源转录物的评估。所有值都相对于包含相应gRNA 而无Cas13b-t表达的转染对照物进行正规化,并且是平均值+/-标准偏差,n=4。T:靶向gRNA, NT:非靶向gRNA。
图32A至图32I.利用Cas13b-t的RNA编辑。(图32A)介导RNA编辑的gRNA的示 意图。错配距离是指错配碱基和DR的5'端之间的核苷酸数。(图32B)对用于恢复HEK293FT 细胞中的W85X海萤荧光素酶报告基因的RNA编辑的评估,如通过荧光素酶活性的恢复所 测量。所有值都是平均值+/-标准偏差,对于Cas13b-t1-REPAIR,n=4,而对于 Cas13b-t3-REPAIR,n=3。(图32C至图32F)通过对所选靶标的下一代测序(图32C)和蛋白 质活性测定(图32D至图32F)对Cas13b-t1-REPAIR和RESCUE在指定靶标处的RNA编辑 进行量化。T:靶向gRNA,NT:非靶向gRNA。所有值都是平均值+/-标准偏差,n=4。(图 32G)用于工程改造具体ADAR2dd变体的定向进化方法的示意图。通过同时进行对编辑 ADE2转录物中的过早终止密码子的正选择和对编辑URA3转录物中的过早终止密码子的负 选择来进行活性和特异性的选择。(图32H)对特异性增强ADAR2dd突变体应用于靶向 W85X(TAG终止密码子)海萤荧光素酶报告基因的Cas13b-t1-REPAIR的评估,如通过荧光 素酶活性所测量。使用此具有非靶向gRNA的报告基因恢复荧光素酶活性被用作评估特异 性的指标。(图32I)Cas13b-t1-REPAIR变体之间脱靶编辑的定量比较。金色的点标志着中靶 编辑。REPAIR-S是指在ADAR2dd中加入E620G和Q696L特异性增强突变体。G:长腹水 蚤荧光素酶转录物,C:海萤荧光素酶转录物。
图33A至图33B.对Cas13b-t直系同源物的PFS偏好。(图33A)用于测定Cas13b-t直系同源物的干扰活性和PFS偏好的大肠杆菌必需基因筛检的工作流程。(图33B)对5'和3'PFS的检查共同表明,Cas13b-t1、3和5不仅偏好5'A/T/G,而且偏好3'侧上+2或+3位置 的A。5'PFS是指直接在靶序列5'的单个碱基,而3'PFS是指在靶序列3'侧的+2和+3碱基, 因为+1碱基对任何测试直系同源物都不显示任何偏好。
图34.HEPN突变消除了切割活性。使野生型序列和RanCas13b、Cas13b-t1和Cas13b-t3 的两个HEPN结构域中精氨酸和组氨酸残基都突变为丙氨酸的序列靶向具有两个不同靶向 间隔子的长腹水蚤荧光素酶转录物。如通过荧光素酶活性降低所测量,对于HEPN突变蛋 白,敲低被消除,其中RanCas13b当作阳性对照物。所有的值都相对于非靶向间隔子条件 进行正规化,具有标准误差传播(n=3)。
图35A至图35H.RNA编辑gRNA间隔子的最佳错配距离的确定。通过下一代测序对靶向指定位点的(图35A至图35D)RanCas13b-REPAIR、Cas13b-t1-REPAIR、 Cas13b-t3-REPAIR和(图35E至图35H)RanCas13b-RESCUE、Cas13b-t1-RESCUE、 Cas13b-t3-RESCUE的最佳错配距离的定量评估。在所有的图中,所有值都代表平均值+/-标 准偏差(n=4)。条形代表了针对用于所有进一步实验的各个靶标/直系同源物选择的最佳错配 距离。含有靶腺苷或胞嘧啶的核苷酸三联体示于括号中。
图36A至图36L.RanCas13b、Cas13b-t1和Cas13b-t3在所选位点处的RNA编辑的比较。 在所有的图中,所有值都代表平均值+/-标准偏差(n=4)。靶向gRNA在REPAIR/RESCUE蛋 白表达条件下的值示于相应条形的上方。(图36A至图36I)通过下一代测序测量指定靶位点 处的编辑率。(图36J)通过W85X海萤荧光素酶报告基因的A-to-I RNA编辑恢复荧光素酶 活性。(图36K)通过CTNNB1 T41密码子的A-to-I RNA编辑对β-连环蛋白的激活倍数,如通过正规化荧光素酶活性所测量。(图36L)通过C82R长腹水蚤荧光素酶报告基因的C-to-URNA编辑恢复荧光素酶活性。
图37A至图37F.第1轮进化之后对ADAR2dd突变体的评估。在所有的图中,所有值都代表平均值+/-标准偏差(n=4)。Wt是指RanCas13b-ADAR2dd(E488Q)。所有氨基酸变化都是指在ADAR2dd中的位置。含有靶腺苷的核苷酸三联体示于括号中。对于(图37A至图37B),条形或点表示被选择用于进一步分析的突变。对于(图37C至图37F),条形或点表示从这一轮进化选择的最终突变。(图37A).对靶向W113X海萤荧光素酶报告基因的候选突变体的评估,如通过荧光素酶活性的恢复所测量。(图37B).对靶向W85X海萤荧光素酶报告 基因的候选突变体的评估,如通过荧光素酶活性的恢复所测量。非靶向RLU是指在非靶向 间隔子条件下恢复荧光素酶活性,并用作脱靶编辑的指标。(图37C至图37E).对靶向指定 位点的所选突变体的评估,如通过下一代测序所测量。(图37F).对靶向W85X海萤荧光素 酶报告基因的候选突变体的评估,如通过荧光素酶活性的恢复所测量。非靶向RLU是指在 非靶向间隔子条件下恢复荧光素酶活性,并用作脱靶编辑的指标。
图38A至图38J.第2轮进化之后对ADAR2dd突变体的评估。在所有的图中,诸值代表平均值+/-标准偏差(n=4)。Wt是指RanCas13b-ADAR2dd(E488Q),而wt+E620G是指RanCas13b-ADAR2dd(E488Q/E620G)。所有氨基酸变化都是指在ADAR2dd中的位置,而且 所有突变都在ADAR2dd(E488Q/E620G)背景的顶部。含有靶腺苷的核苷酸三联体示于括号 中。对于(图38A至图38C),条形或点表示被选择用于进一步分析的突变。对于(图38D至 图38J),条形或点表示从这一轮进化选择的最终突变。(图38A).对靶向R93H长腹水蚤荧 光素酶报告基因的候选突变体的评估,如通过荧光素酶活性的恢复所测量。(图38B).对靶 向W85X(TGA终止密码子)海萤荧光素酶报告基因的候选突变体的评估,如通过荧光素酶 活性的恢复所测量。(图38C).对靶向W85X(TAG终止密码子)海萤荧光素酶报告基因的候 选突变体的评估,如通过荧光素酶活性的恢复所测量。非靶向RLU是指在非靶向间隔子条 件下恢复荧光素酶活性,并用作脱靶编辑的指标。(图38D至图38I).对靶向指定位点的所 选候选突变体的评估,如通过下一代测序所测量。(图38J).对靶向W85X(TAG终止密码子) 海萤荧光素酶报告基因的候选突变体的评估,如通过荧光素酶活性的恢复所测量。非靶向 RLU是指在非靶向间隔子条件下恢复荧光素酶活性,并用作脱靶编辑的指标。
图39A至图39B.REPAIR变体之间脱靶编辑的比较。REPAIR变体在靶向(图39A)和非靶向(图39B)gRNA条件下脱靶编辑的定量比较。金色的点标志着中靶编辑。REPAIR-S是 指在ADAR2dd中加入E620G和Q696L特异性增强突变体。G:长腹水蚤荧光素酶转录物, C:海萤荧光素酶转录物。Cas13b-t1-REPAIR和REPAIR-S如图32I中所示。
图40-Cas13b-t具有旁系活性。
图41示出了Cas13b-t-REPAIR通过AAV递送单个AAV载体介导RNA编辑。(T:靶 向性向导RNA;NT:非靶向性向导RNA;GFP:递送的GFP蛋白而非REPAIR蛋白;PBS: 无病毒对照物)。
本文的图仅用于说明目的,而且未必按比例绘制。
例示性实施方案详述
定义
除非另外定义,否则本文使用的技术和科学术语具有与本公开所属领域的普通技术人员 通常理解的含义相同的含义。分子生物学中的常用术语和技术的定义可见于Molecular Cloning:A Laboratory Manual,第2版(1989)(Sambrook,Fritsch和Maniatis);Molecular Cloning:A Laboratory Manual,第4版(2012)(Green和Sambrook);Current Protocols in Molecular Biology(1987)(F.M.Ausubel等编);丛书Methods inEnzymology(Academic Press, Inc.):PCR 2:A Practical Approach(1995)(M.J.MacPherson,B.D.Hames和G.R.Taylor编): Antibodies,A Laboratory Manual(1988)(Harlow和Lane编):Antibodies A Laboratory Manual, 第2版,2013(E.A.Greenfield编);Animal Cell Culture(1987)(R.I.Freshney编);Benjamin Lewin,Genes IX,由Jones and Bartlet出版,2008(ISBN 0763752223);Kendrew等(编),TheEncyclopedia of Molecular Biology,由Blackwell Science Ltd.出版,1994(ISBN0632021829); Robert A.Meyers(编),Molecular Biology and Biotechnology:aComprehensive Desk Reference, 由VCH Publishers,Inc.出版,1995(ISBN9780471185710);Singleton等,Dictionary of Microbiology and Molecular Biology第2版,J.Wiley&Sons(New York,N.Y.1994),March, Advanced Organic ChemistryReactions,Mechanisms and Structure第4版,John Wiley&Sons (New York,N.Y.1992);以及Marten H.Hofker和Jan van Deursen,Transgenic Mouse Methods and Protocols,第2版(2011)。
除非上下文另有明确规定,否则如本文所用,单数形式“一个”、“一种”和“该”包括单数 和复数指代物。
术语“可选”或“任选地”是指随后描述的事件、情形或取代基可能发生或可能不发生,并 且该描述包括事件或情形发生的情况和不发生的情况。
通过端点引用的数值范围包括归入相应范围内的所有数字和分数,以及所述端点。
如本文所用,与参考数值及其语法等价物有关的术语“约”可以包括数值本身和从该数值 加或减10%的值范围。举例来说,量“约10”包括10和从9到11的任何量。举例来说,与 参考数值有关的术语“约”还可以包括从该值加或减10%、9%、8%、7%、6%、5%、4%、3%、 2%或1%的值范围。
如本文所用,“生物样品”可以含有完整细胞和/或活细胞和/或细胞碎片。生物样品可能 含有(或衍生自)“体液”。本发明涵盖了体液选自羊水、房水、玻璃体液、胆汁、血清、母乳、 脑脊液、耵聍(耳垢)、乳糜、食糜、内淋巴、外淋巴、渗出液、粪便、女性射液、胃酸、胃液、淋巴液、粘液(包括鼻腔引流液和痰液)、心包液、腹膜液、胸膜液、脓液、稀粘液、唾 液、皮脂(皮肤油)、精液、痰液、滑液、汗液、泪液、尿液、阴道分泌物、呕吐物及其中一 种或多种的混合物的实施方案。生物样品包括细胞培养物、体液、体液的细胞培养物。体液 可以从哺乳动物机体获得,例如通过穿刺或者其他收集或取样程序。
术语“受试者”、“个体”和“患者”在本文中可互换使用以指代脊椎动物,优选为哺乳动物, 更优选为人类。哺乳动物包括但不限于鼠类、猿猴、人类、农场动物、竞技动物和宠物。还 涵盖了在体内获得或在体外培养的生物实体的组织、细胞及其后代。
本文使用术语“示例性”意在用作示例、实例或说明。本文描述为“示例性”的任何方面或 设计未必被视为相对于其他方面或设计为优选的或有利的。相反,使用词语示例性旨在以具 体的方式呈现概念。
来源于衍生自一个物种的蛋白质或核酸意指所述蛋白质或核酸具有与所述物种中的内 源蛋白质或核酸或其一部分同一的序列。衍生自所述物种的蛋白质或核酸可能直接获自所述 物种的生物体(例如,通过分离),或可能例如通过重组产生或化学合成来产生。
下文描述了各个实施方案。应当注意,具体实施方案不希望作为详尽的描述或作为对本 文讨论的更广泛方面的限制。结合具体实施方案描述的一个方面未必受限于该实施方案,而 且可以与任何其他实施方案一起实施。贯穿本说明书对“一个实施方案”、“一实施方案”、“一 个示例性实施方案”的引用意指结合所述实施方案描述的具体特征、结构或特性被包括在本 发明的至少一个实施方案中。因此,贯穿本说明书各处出现的短语“在一个实施方案中”、“在 一实施方案中”或“一个示例性实施方案”未必都是指相同实施方案,而是可能。此外,如本 领域技术人员将会从本公开显而易见,在一个或多个实施方案中,具体的特征、结构或特性 可以按任何合适的方式组合。此外,虽然本文描述的一些实施方案包括其他实施方案中所包 括的一些特征但不包括其他特征,但不同实施方案的特征的组合意在处于本发明的范围内。 举例来说,在所附权利要求书中,要求保护的实施方案中的任一个都能以任何组合使用。
本文引用的所有出版物、已公开专利文件和专利申请都通过引用并入在此,达到与具体 地和单独地指出各单独出版物、已公开专利文件或专利申请通过引用并入相同的程度。
概述
在一个方面,本公开提供了用于核酸修饰的系统和方法。在一些实施方案中,本文公开 的实施方案涉及包含一个或多个Cas蛋白和一个或多个向导序列的非天然存在或工程改造 的系统。所述Cas蛋白可以经工程改造以包括一个或多个突变。在某些实施方案中,与相应 的野生型Cas蛋白相比,所述工程改造的Cas蛋白增强或减弱了原间隔子侧翼位点(PFS)识 别/特异性、gRNA结合、蛋白酶活性、多核苷酸结合能力、稳定性、特异性、靶标结合、 脱靶结合和/或催化活性中的一种或多种。
在一些实施方案中,新鉴定的Cas蛋白的子集在大小方面小于之前发现的Cas蛋白,包 括对它们的进一步修饰及其用途。在一些实施方案中,所述系统包含一个或多个在大小方面 小于900个氨基酸的Cas蛋白和一个或多个向导序列。这些Cas蛋白相对较小的大小可以更 容易地进行工程改造、多路复用、包装和递送,以及用作融合构建体的组分,例如与核苷酸 脱氨酶融合。
在另一个方面,本公开提供了一种碱基编辑系统。在一些实施例中,所述碱基编辑系统 包含工程改造的腺苷脱氨酶,所述工程改造的腺苷脱氨酶包含基于人ADAR2的氨基酸序列 位置的(i)E488Q和E620G,(ii)E488Q和Q696L,或(iii)E488Q和V505I,以及同源ADAR蛋白中的相应突变。所述碱基编辑系统还可以包含本文Cas13蛋白与所述工程改造的腺苷脱 氨酶缔合(例如融合)的死或切口酶形式。
在另一方面,本文公开的实施方案包括用于此类Cas蛋白的系统和用途,包括诊断、碱 基编辑治疗和检测方法。包含Cas蛋白的融合蛋白,包括本文公开的那些,以及核苷酸脱氨 酶也可以用于碱基编辑。还提供了所公开的蛋白质和系统的递送,包括递送至多种细胞以及 通过多种颗粒、囊泡和载体。
一般系统和组合物概述
在一个方面,本公开提供了用于核酸修饰的系统和组合物。总体来说,所述系统或组合 物可以包含一个或多个Cas蛋白和一个或多个向导序列。在一些实施方案中,所述Cas蛋白 可以是VI型Cas蛋白。所述VI型Cas蛋白可以是Cas13蛋白。在一些实施例中,所述Cas13 蛋白可以是Cas13a,例如,SEQ ID NO.1-1323。在一些实施例中,所述Cas13蛋白可以是 Cas13b,例如,SEQ ID NO.1324-2770。在一些实施例中,所述Cas13蛋白可以是Cas13c,例如,SEQ ID NO.2773-2797。在一些实施例中,所述Cas13蛋白可以是Cas13d,例如,SEQ IDNO.2798-4092。在一些实施例中,所述Cas13蛋白可以是小Cas13a,例如,SEQ ID NO. 4102-4298。在一些实施例中,所述Cas13蛋白可以是小Cas13b,例如,SEQ ID NO.4299-4654。 在一些实施例中,所述Cas13蛋白可以是小Cas13b-t,例如,SEQ ID NO.2771-2772、4655-4768或5260-5265。在一些实施例中,所述Cas13蛋白可以是小Cas13c,例如,SEQ ID NO. 4769-4797。在一些实施例中,所述Cas13蛋白可以是小Cas13d,例如,SEQ ID NO.4798-5203。
本文的Cas13蛋白还包括SEQ ID NO 1-4092、4102-5203和5260-5265中的蛋白质的变 体、同源物和直系同源物。
在一些实施例中,所述Cas13蛋白是小蛋白质,例如,在大小方面小于900个氨基酸。 在一些实施例中,所述小Cas13蛋白包括Cas13b-t蛋白,包括与来自另枝菌属ZOR00009的Cas13b直系同源物密切相关并且不与任何辅助蛋白相关的Cas13b亚家族Cas蛋白。
一般CRISPR-CAS系统概述
总体来说,Cas蛋白和/或向导序列是CRISPR-Cas系统的组分。CRISPR-Cas系统或CRISPR系统总体上是指参与CRISPR相关(“Cas”)基因的表达或指导其活性的转录物和其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr-mate序列(在内源CRISPR系统的情况下涵盖“顺向重复序列”和tracrRNA处理的部分顺向重复序列)、向导序列(在内源CRISPR系统的情况下也称为“间隔子”)或如本 文使用该术语的“RNA”(例如,用以引导诸如Cas9等Cas的RNA,例如CRISPR RNA和反 式激活(tracr)RNA或单向导RNA(sgRNA)(嵌合RNA))或者来自CRISPR基因座的其他序列 和转录物。总体来说,CRISPR系统以促进靶序列位点处形成CRISPR复合物的元件(在内源CRISPR系统的情况下也称为原间隔子)为特征。当所述CRISPR蛋白是2类VI型效应子时, 不需要tracrRNA。在本发明的工程改造的系统中,所述顺向重复序列可以涵盖天然存在的 序列或非天然存在的序列。本发明的顺向重复序列不限于天然存在的长度和序列。顺向重复序列的长度可以是36nt,但较长或较短的顺向重复序列可能会有所变化。举例来说,顺向重复序列可以是30nt或更长,诸如30至100nt或更长。举例来说,顺向重复序列的长度可 以是30nt、40nt、50nt、60nt、70nt、70nt、80nt、90nt、100nt或更长。在一些实施方 案中,本发明的顺向重复序列可以包括插入在天然存在的顺向重复序列的5'和3'端之间的合 成核苷酸序列。在某些实施方案中,插入的序列可以是自身互补的,例如,20%、30%、40%、 50%、60%、70%、80%、90%或100%自身互补。此外,本发明的顺向重复序列可以包括核 苷酸插入物,诸如适体或结合衔接子蛋白的序列(用于与功能域缔合)。在某些实施方案中, 包含这种插入物的顺向重复序列的一端大致是短DR的前半部分,而末端大致是短DR的后 半部分。
CRISPR-Cas蛋白(在本文中与“Cas蛋白”、“Cas效应子”、“效应子”、“效应蛋白”可互换 使用)可以包括Cas9、Cas 12(例如,Cas12a、Cas12b、Cas12c、Cas12d等)、Cas13(例如,Cas13a、Cas13b、Cas13b-t、Cas13c、Cas13d等)、Cas14、CasX和CasY。在一些实施方案 中,所述CRISPR-Cas蛋白可以是VI型CRISPR-Cas蛋白。举例来说,所述VI型CRISPR-Cas 蛋白可以是Cas13蛋白。所述Cas13蛋白可以是Cas13a、Cas13b、Cas13b-t、Cas13c或Cas13d。 在一些实施例中,所述CRISPR-Cas蛋白是Cas13a。在一些实施例中,所述CRISPR-Cas蛋 白是Cas13b。在一些实施例中,所述CRISPR-Cas蛋白是Cas13b-t。在一些实施例中,所述CRISPR-Cas蛋白是Cas13c。在一些实施例中,所述CRISPR-Cas蛋白是Cas13d。
在形成CRISPR复合物的情况下,“靶序列”是指向导序列被设计成具有互补性的序列, 其中靶序列和向导序列之间的杂交促进了CRISPR复合物的形成。靶序列可以包含任何多核 苷酸,诸如DNA或RNA多核苷酸。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中。在一些实施方案中,可以通过搜索满足任何或全部以下标准的重复基序在计算机中鉴 定顺向重复序列:1.在II型CRISPR基因座侧翼的基因组序列的2Kb窗口中发现;2.跨度为20至50bp;3.间隔20至50bp。在一些实施方案中,可以使用这些标准中的2项,例如 1和2、2和3或1和3。在一些实施方案中,可以使用全部3项标准。
在本发明的实施方案中,术语向导序列和向导RNA(例如能够将CRISPR-Cas效应蛋白 引导至靶基因座的RNA)可互换使用,如在本文引用的文件,诸如国际专利公开号WO2014/093622(PCT/US2013/074667)中。在一些实施方案中,向导序列(或间隔子序列)的长度 为约或超过约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、 26、27、28、29、30、35、40、45、50、75个或更多个核苷酸。在一些实施方案中,向导 序列的长度少于约75、50、45、40、35、30、25、20、15、12个或更少核苷酸。优选地, 所述向导序列为10至40个核苷酸长,诸如20至30或20至40个核苷酸长或更长,诸如 30个核苷酸长或约30个核苷酸长。在某些实施方案中,对于CRISPR-Cas效应子,所述向 导序列为10至30个核苷酸长,诸如20至30或20至40个核苷酸长或更长,诸如30个核 苷酸长或约30个核苷酸长。在某些实施方案中,所述向导序列为10至30个核苷酸长,诸 如20至30个核苷酸长,诸如30个核苷酸长。向导序列指导CRISPR复合物与靶序列的序 列特异性结合的能力可以通过任何合适的测定法来评价。举例来说,可以将CRISPR系统中 足以形成CRISPR复合物的组分,包括欲测试的向导序列,提供给具有相应靶序列的宿主细 胞,诸如通过用编码所述CRISPR序列的组分的载体进行转染,然后评价所述靶序列内的优 先切割,诸如通过本文所述的Surveyor测定法。类似地,可以在试管中通过以下方式评估 对靶多核苷酸序列的切割:提供所述靶序列、CRISPR复合物的组分(包括欲测试的向导序列) 和与所述测试向导序列不同的对照向导序列,以及比较测试向导序列反应与对照向导序列反 应之间在所述靶序列处的结合或切割速率。其他测定法是有可能的,而且会被本领域技术人 员想到。
在一些CRISPR-Cas系统中,向导序列与其相应靶序列之间的互补性程度可以是约或超 过约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%;向导或RNA或crRNA 的长度可以是约或超过约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、 24、25、26、27、28、29、30、35、40、45、50、75个或更多个核苷酸;或者向导或RNA 或crRNA的长度可以是少于约75、50、45、40、35、30、25、20、15、12个或更少核苷酸; 而且有利的是,tracrRNA的长度是30或50个核苷酸。然而,本发明的一方面是减少脱靶 相互作用,例如,减少所述向导与具有低互补性的靶序列相互作用。实际上,在所述实施例 中,证明了本发明涉及使得CRISPR-Cas系统能够区分具有大于80%至约95%互补性,例如 83%至84%或88%至89%或94%至95%互补性的靶标与脱靶序列(例如,区分具有18个核 苷酸的靶标与具有18个核苷酸且具有1、2或3个错配的脱靶)的突变。因此,在本发明的 上下文中,向导序列与其相应靶序列之间的互补性程度大于94.5%或95%或95.5%或96%或 96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%或100%。脱靶是所述序列和 所述向导之间为低于100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97% 或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90%或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%互补性,其中有利的是脱靶是所述序列和所述向导之间为100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97% 或96.5%或96%或95.5%或95%或94.5%互补性。
在某些实施方案中,对切割效率的调节可以通过引入错配来利用,例如1个或更多个错 配,诸如间隔子序列和靶序列之间的1或2个错配,包括沿间隔子/靶标的错配位置。举例 来说,双错配越靠近中心(例如,不在3'或5'),切割效率就越受影响。因此,通过选择沿间 隔子的错配位置,可以调节切割效率。举例来说,如果需要小于100%的靶标切割(例如,在 细胞群中),则可以在间隔子序列中在间隔子与靶序列之间引入1个或更多个,诸如优选2 个错配。沿着错配位置的间隔子越靠近中心,切割百分比越低。
如本文所述的根据本发明的方法包括在如本文讨论的真核细胞(体外,即在分离的真核 细胞中)中诱导一个或多个核苷酸修饰,包括将如本文讨论的载体递送至细胞。突变可以包 括通过向导RNA或sgRNA在细胞的各个靶序列处引入、缺失或取代一个或多个核苷酸。 所述突变可以包括通过向导RNA或sgRNA在所述细胞的各个靶序列处引入、缺失或取代1 至75个核苷酸。所述突变可以包括通过向导RNA在所述细胞的各个靶序列处引入、缺失或取代1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29、30、35、40、45、50或75个核苷酸。所述突变可以包括通过向导RNA在所 述细胞的各个靶序列处引入、缺失或取代5、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。所述突 变包括通过向导RNA在所述细胞的各个靶序列处引入、缺失或取代10、11、12、13、14、 15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50 或75个核苷酸。所述突变可以包括通过向导RNA在所述细胞的各个靶序列处引入、缺失 或取代20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。 所述突变可以包括通过向导RNA在所述细胞的各个靶序列处引入、缺失或取代40、45、50、 75、100、200、300、400或500个核苷酸。
为了将毒性和脱靶效应减至最少,控制所递送的Cas mRNA或蛋白和向导RNA的浓度 将非常重要。通过在细胞或非人真核动物模型中测试不同浓度并使用深度测序分析潜在脱靶 基因组基因座的修饰程度,可以确定Cas mRNA或蛋白和向导RNA的最佳浓度。
通常,在内源CRISPR系统的情况下,形成CRISPR复合物(包含与靶序列杂交并与一个或多个Cas蛋白复合的向导序列)引起对靶序列中或附近(例如在1、2、3、4、5、6、7、8、 9、10、20、50个或更多个碱基对内)的切割,但可能取决于例如二级结构,特别是在RNA 靶标的情况下。在一些情况下,在内源CRISPR系统的情况下,形成CRISPR复合物(包含 与靶序列杂交并与一个或多个Cas蛋白复合的向导序列)引起对靶序列中或附近(例如在1、2、 3、4、5、6、7、8、9、10、20、50个或更多个碱基对内)一或两个链(如适用)的切割。
在根据本发明的特别优选的实施方案中,所述向导RNA(能够将Cas引导至靶基因座) 可以包含(1)能够与真核细胞中的靶基因座(多核苷酸靶基因座,诸如RNA靶基因座)杂交的 向导序列;(2)顺向重复序列(DR)序列),其位于单RNA,即sgRNA(按5'至3'方向排列)或 crRNA中。
关于可用于实践本发明的所有CRISPR-Cas系统、其组分和此类组分的递送的一般信息, 包括方法、材料、递送载体、载体、颗粒、AAV及其制造和使用,包括关于数量和配方的一般信息,参考:美国专利号8,999,641、8,993,233、8,945,839、8,932,814、8,906,616、8,895,308、 8,889,418、8,889,356、8,871,445、8,865,406、8,795,965、8,771,945和8,697,359;美国专利 公开US 2014-0310830(美国申请系列号14/105,031)、US 2014-0287938 A1(美国申请系列号 14/213,991)、US 2014-0273234 A1(美国申请系列号14/293,674)、US2014-0273232A1(美国 申请系列号14/290,575)、US 2014-0273231(美国申请系列号14/259,420)、US 2014-0256046 A1(美国申请系列号14/226,274)、US 2014-0248702 A1(美国申请系列号14/258,458)、US 2014-0242700A1(美国申请系列号14/222,930)、US 2014-0242699 A1(美国申请系列号 14/183,512)、US 2014-0242664 A1(美国申请系列号14/104,990)、US 2014-0234972 A1(美国 申请系列号14/183,471)、US 2014-0227787 A1(美国申请系列号14/256,912)、US 2014-0189896A1(美国申请系列号14/105,035)、US 2014-0186958A1(美国申请系列号 14/105,017)、US 2014-0186919 A1(美国申请系列号14/104,977)、US 2014-0186843 A1(美国 申请系列号14/104,900)、US 2014-0179770 A1(美国申请系列号14/104,837)和US 2014-0179006 A1(美国申请系列号14/183,486)、US 2014-0170753 A1(美国申请系列号 14/183,429);欧洲专利EP 2 784 162B1和EP 2 771 468B1;欧洲专利申请EP 2 771 468 (EP13818570.7)、EP 2 764 103(EP13824232.6)和EP 2 784162(EP14170383.5);以及PCT专 利公开PCT专利公开WO 2014/093661(PCT/US2013/074743)、WO 2014/093694 (PCT/US2013/074790)、WO 2014/093595(PCT/US2013/074611)、WO 2014/093718 (PCT/US2013/074825)、WO 2014/093709(PCT/US2013/074812)、WO 2014/093622 (PCT/US2013/074667)、WO 2014/093635(PCT/US2013/074691)、WO 2014/093655(PCT/US2013/074736)、WO 2014/093712(PCT/US2013/074819)、WO 2014/093701 (PCT/US2013/074800)、WO 2014/018423(PCT/US2013/051418)、WO 2014/204723 (PCT/US2014/041790)、WO 2014/204724(PCT/US2014/041800)、WO 2014/204725 (PCT/US2014/041803)、WO 2014/204726(PCT/US2014/041804)、WO 2014/204727 (PCT/US2014/041806)、WO 2014/204728(PCT/US2014/041808)、WO 2014/204729 (PCT/US2014/041809)。
还参考了分别在2013年1月30日;2013年3月15日;2013年3月28日;2013年4 月20日;2013年5月6日和2013年5月28日提交的美国临时申请号61/758,468;61/802,174; 61/806,375;61/814,263;61/819,803和61/828,130。还参考了2013年6月17日提交的美国 临时专利申请号61/836,123。另外参考了美国临时申请号61/835,931、61/835,936、61/836,127、 61/836,101、61/836,080和61/835,973,各自在2013年6月17日提交。还参考了2013年8 月5日提交的美国临时申请号61/862,468和61/862,355;2013年8月28日提交的61/871,301; 2013年9月25日提交的61/960,777;和2013年10月28日提交的61/961,980。还参考了:PCT专利申请号:PCT/US2014/041803、PCT/US2014/041800、PCT/US2014/041809、 PCT/US2014/041804和PCT/US2014/041806,各自在2014年6月10日6/10/14提交;2014 年6月11日提交的PCT/US2014/041808;和2014年10月28日提交的PCT/US2014/62558, 以及美国临时申请号:61/915,150、61/915,301、61/915,267和61/915,260,各自在2013年 12月12日提交;2013年1月29日和2013年2月25日提交的61/757,972和61/768,959; 2013年6月17日提交的61/835,936、61/836,127、61/836,101、61/836,080、61/835,973和 61/835,931;62/010,888和62/010,879,两者都在2014年6月11日提交;62/010,329和 62/010,441,各自在2014年6月10日提交;61/939,228和61/939,242,各自在2014年2月 12日提交;2014年4月15日提交的61/980,012;2014年8月17日提交的62/038,358; 62/054,490、62/055,484、62/055,460和62/055,487,各自在2014年9月25日提交;和2014 年10月27日提交的62/069,243。还参考了2014年9月25日提交的美国临时申请号 62/055,484、62/055,460和62/055,487;2014年4月15日提交的美国临时申请号61/980,012; 以及2014年2月12日提交的美国临时申请号61/939,242。参考了2014年6月10日提交的 尤其以美国为指定国的PCT申请,申请号PCT/US14/41806。参考了2014年1月22日提交 的美国临时申请号61/930,214。参考了美国临时申请号61/915,251;61/915,260和61/915,267, 各自在2013年12月12日提交。参考了2014年4月15日提交的美国临时申请号61/980,012。 参考了2014年6月10日提交的尤其以美国为指定国的PCT申请,申请号PCT/US14/41806。 参考了2014年1月22日提交的美国临时申请号61/930,214号。参考了美国临时申请号 61/915,251;61/915,260和61/915,267,各自在2013年12月12日提交。
还提到了2014年12月12日提交的美国临时申请号62/091,455,PROTECTED GUIDERNAS(PGRNAS);2014年12月24日提交的美国临时申请号62/096,708,PROTECTED GUIDERNAS(PGRNAS);2014年12月12日提交的美国临时申请号62/091,462,DEAD GUIDES FORCRISPR TRANSCRIPTION FACTORS;2014年12月23日提交的美国临时申 请号62/096,324,DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS;14年12月 12日提交的美国临时申请号62/091,456,ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CAS SYSTEMS;2014年12月12日提交的美国临时申请号62/091,461, DELIVERY,USE AND THERAPEUTICAPPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR GENOME EDITING ASTO HEMATOPOETIC STEM CELLS (HSCs);2014年12月19日提交的美国临时申请号62/094,903,UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENTBY GENOME-WISE INSERT CAPTURE SEQUENCING;2014年12月24日提交的美国临 时申请号62/096,761,ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZED ENZYME AND GUIDESCAFFOLDS FOR SEQUENCE MANIPULATION;14年12月30日 提交的美国申请62/098,059,RNA-TARGETING SYSTEM;2014年12月24日提交的美国 临时申请号62/096,656,CRISPRHAVING OR ASSOCIATED WITH DESTABILIZATION DOMAINS;2014年12月24日提交的美国临时申请号62/096,697,CRISPR HAVING OR ASSOCIATED WITH AAV;2014年12月30日提交的美国临时申请号62/098,158, ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETINGSYSTEMS;2015年4月 22日提交的美国临时申请号62/151,052,CELLULAR TARGETING FOREXTRACELLULAR EXOSOMAL REPORTING;2014年9月24日提交的美国临时申请号62/054,490,DELIVERY, USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERYCOMPONENTS;2014年9月25日提交的美国临时申请号62/055,484,SYSTEMS, METHODS ANDCOMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CASSYSTEMS;2014年12月4日提交的美国临时申请号 62/087,537,SYSTEMS,METHODS ANDCOMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CASSYSTEMS;2014年9月 24日提交的美国临时申请号62/054,651,DELIVERY,USE ANDTHERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORMODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO;2014年10月23日提交的美国临时申请号62/067,886,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THECRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLECANCER MUTATIONS IN VIVO;2014年9月24日提交的美国临时申请号 62/054,675,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOMPOSITIONS IN NEURONAL CELLS/TISSUES;2014年9月24日提交 的美国临时申请号62/054,528,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMSAND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS;2014年9月25日提交的美国临时申请号62/055,454,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CASSYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELLPENETRATION PEPTIDES (CPP);2014年9月25日提交的美国临时申请号62/055,460,MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES;2014年12月4日提交的美国临时申请号62/087,475,FUNCTIONALSCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS;2014年9月25 日提交的美国临时申请号62/055,487,FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS;2014年12月4日提交的美国临时申请号 62/087,546,MULTIFUNCTIONALCRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES;及14年12月30日提交的美国临时申请号 62/098,285,CRISPR MEDIATED IN VIVOMODELING AND GENETIC SCREENING OF TUMOR GROWTH AND METASTASIS。
关于CRISPR-Cas系统的一般信息,还提到了以下参考文献(也通过引用并入在此):
Figure BDA0003651481360000191
Multiplex genome engineering using CRISPR/Cas systems.Cong,L.,Ran,F.A.,Cox,D., Lin,S.,Barretto,R.,Habib,N.,Hsu,P.D.,Wu,X.,Jiang,W.,Marraffini,L.A.,和Zhang,F. Science 2月15日;339(6121):819-23(2013);
Figure BDA0003651481360000192
RNA-guided editing of bacterial genomes using CRISPR-Cassystems.Jiang W.,Bikard D.,Cox D.,Zhang F,Marraffini LA.Nat Biotechnol 3月;31(3):233-9(2013);
Figure BDA0003651481360000193
One-Step Generation of Mice Carrying Mutations in Multiple Genes byCRISPR/Cas-Mediated Genome Engineering.Wang H.,Yang H.,Shivalila CS.,DawlatyMM., Cheng AW.,Zhang F.,Jaenisch R.Cell 5月9日;153(4):910-8(2013);
Figure BDA0003651481360000194
Optical control of mammalian endogenous transcription andepigenetic states. Konermann S,Brigham MD,Trevino AE,Hsu PD,Heidenreich M,Cong L,Platt RJ,Scott DA, Church GM,Zhang F.Nature.8月22日;500(7463):472-6.doi:10.1038/Nature12466.2013年8 月23日电子发表(2013);
Figure BDA0003651481360000195
Double Nicking by RNA-Guided CRISPR Cas9for Enhanced Genome EditingSpecificity.Ran,FA.,Hsu,PD.,Lin,CY.,Gootenberg,JS.,Konermann,S.,Trevino,AE.,Scott, DA.,Inoue,A.,Matoba,S.,Zhang,Y.,&Zhang,F.Cell 8月28日.pii:S0092-8674(13)01015-5 (2013-A);
Figure BDA0003651481360000196
DNA targeting specificity of RNA-guided Cas9nucleases.Hsu,P.,Scott,D.,Weinstein, J.,Ran,FA.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.,Wu,X.,Shalem,O.,Cradick,TJ., Marraffini,LA.,Bao,G.,和Zhang,F.Nat Biotechnol doi:10.1038/nbt.2647(2013);
Figure BDA0003651481360000197
Genome engineering using the CRISPR-Cas9system.Ran,FA.,Hsu,PD.,Wright,J., Agarwala,V.,Scott,DA.,Zhang,F.Nature Protocols 11月;8(11):2281-308(2013-B);
Figure BDA0003651481360000198
Genome-Scale CRISPR-Cas9Knockout Screening in Human Cells.Shalem,O.,Sanjana, NE.,Hartenian,E.,Shi,X.,Scott,DA.,Mikkelson,T.,Heckl,D.,Ebert,BL.,Root,DE.,Doench, JG.,Zhang,F.Science 12月12日.(2013).[印刷前电子发表];
Figure BDA0003651481360000201
Crystal structure of cas9in complex with guide RNA and targetDNA.Nishimasu,H., Ran,FA.,Hsu,PD.,Konermann,S.,Shehata,SI.,Dohmae,N.,Ishitani,R.,Zhang,F.,Nureki,O. Cell 2月27日,156(5):935-49(2014);
Figure BDA0003651481360000202
Genome-wide binding of the CRISPR endonuclease Cas9in mammaliancells.Wu X., Scott DA.,Kriz AJ.,Chiu AC.,Hsu PD.,Dadon DB.,Cheng AW.,TrevinoAE.,Konermann S., Chen S.,Jaenisch R.,Zhang F.,Sharp PA.Nat Biotechnol.4月20日.doi:10.1038/nbt.2889 (2014);
Figure BDA0003651481360000203
CRISPR-Cas9Knockin Mice for Genome Editing and CancerModeling.Platt RJ,Chen S,Zhou Y,Yim MJ,Swiech L,Kempton HR,Dahlman JE,ParnasO,Eisenhaure TM,Jovanovic M,Graham DB,Jhunjhunwala S,Heidenreich M,Xavier RJ,Langer R,Anderson DG,Hacohen N, Regev A,Feng G,Sharp PA,Zhang F.Cell 159(2):440-455DOI: 10.1016/j.cell.2014.09.014(2014);
Figure BDA0003651481360000204
Development and Applications of CRISPR-Cas9for Genome Engineering,Hsu PD, Lander ES,Zhang F.,Cell.6月5日;157(6):1262-78(2014)。
Figure BDA0003651481360000205
Genetic screens in human cells using the CRISPR/Cas9system,Wang T,Wei JJ, Sabatini DM,Lander ES.,Science.1月3日;343(6166):80-84.doi:10.1126/science.1246981 (2014);
Figure BDA0003651481360000206
Rational design of highly active sgRNAs for CRISPR-Cas9-mediatedgene inactivation, Doench JG,Hartenian E,Graham DB,Tothova Z,Hegde M,Smith I,Sullender M,Ebert BL, Xavier RJ,Root DE.,(2014年9月3日在线发表)NatBiotechnol.12月;32(12):1262-7(2014);
Figure BDA0003651481360000207
In vivo interrogation of gene function in the mammalian brain usingCRISPR-Cas9, Swiech L,Heidenreich M,Banerjee A,Habib N,Li Y,Trombetta J,SurM,Zhang F.,(2014年10 月19日在线发表)Nat Biotechnol.1月;33(1):102-6(2015);
Figure BDA0003651481360000208
Genome-scale transcriptional activation by an engineered CRISPR-Cas9complex, Konermann S,Brigham MD,Trevino AE,Joung J,Abudayyeh OO,BarcenaC,Hsu PD,Habib N, Gootenberg JS,Nishimasu H,Nureki O,Zhang F.,Nature.1月29日;517(7536):583-8(2015)。
Figure BDA0003651481360000209
A split-Cas9architecture for inducible genome editing andtranscription modulation, Zetsche B,Volz SE,Zhang F.,(2015年2月2日在线发表)Nat Biotechnol.2月;33(2):139-42 (2015);
Figure BDA00036514813600002010
Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth andMetastasis, Chen S,Sanjana NE,Zheng K,Shalem O,Lee K,Shi X,Scott DA,Song J,Pan JQ,Weissleder R, Lee H,Zhang F,Sharp PA.Cell 160,1246-1260,2015年3月12日(在小鼠中进行多路筛检), 和
Figure BDA00036514813600002011
In vivo genome editing using Staphylococcus aureus Cas9,Ran FA,CongL,Yan WX, Scott DA,Gootenberg JS,Kriz AJ,Zetsche B,Shalem O,Wu X,Makarova KS,Koonin EV, Sharp PA,Zhang F.,(2015年4月1日在线发表),Nature.4月9日;520(7546):186-91(2015)。
Figure BDA0003651481360000211
Shalem等,“High-throughput functional genomics using CRISPR-Cas9,”Nature Reviews Genetics 16,299-311(2015年5月)。
Figure BDA0003651481360000212
Xu等,“Sequence determinants of improved CRISPR sgRNA design,”GenomeResearch 25,1147-1157(2015年8月)。
Figure BDA0003651481360000213
Parnas等,“A Genome-wide CRISPR Screen in Primary Immune Cells toDissect Regulatory Networks,”Cell 162,675-686(2015年7月30日)。
Figure BDA0003651481360000214
Ramanan等,CRISPR/Cas9cleavage of viral DNA efficiently suppresseshepatitis B virus,”Scientific Reports 5:10833.doi:10.1038/srep10833(2015年6月2日)
Figure BDA0003651481360000215
Nishimasu等,Crystal Structure of Staphylococcus aureus Cas9,”Cell162,1113-1126 (2015年8月27日)
Figure BDA0003651481360000216
Zetsche等,(2015),“Cpf1is a single RNA-guided endonuclease of aclass 2 CRISPR-Cas system,”Cell 163,759-771(2015年10月22日)doi:10.1016/j.cell.2015.09.038. 2015年9月25日电子发表
Figure BDA0003651481360000217
Shmakov等,(2015),“Discovery and Functional Characterization ofDiverse Class 2 CRISPR-Cas Systems,”Molecular Cell 60,385-397(2015年11月5日)doi: 10.1016/j.molcel.2015.10.008.2015年10月22日电子发表
Figure BDA0003651481360000218
Dahlman等,“Orthogonal gene control with a catalytically activeCas9nuclease,”Nature Biotechnology 33,1159-1161(2015年11月)
Figure BDA0003651481360000219
Gao等,“Engineered Cpf1Enzymes with Altered PAM Specificities,”bioRxiv 091611; doi:dx.doi.org/10.1101/091611.2016年12月4日电子发表
Figure BDA00036514813600002110
Smargon等,(2017),“Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessory Proteins Csx27 and Csx28,”Molecular Cell 65,618-630 (2017年2月16日)doi:10.1016/j.molcel.2016.12.023.2017年1月5日电子发表
各参考文献通过引用并入本文,可以考虑用于实践本发明,并且在下面简要讨论:
Figure BDA00036514813600002111
Cong等工程改造了II型CRISPR-Cas系统以用于基于嗜热链球菌Cas9和酿脓链球 菌Cas9的真核细胞,并且证明了Cas9核酸酶可以通过短RNA引导以便在人和小鼠细胞中诱导精确DNA切割。他们的研究还表明,转化为切口酶的Cas9可用于在最小的诱变活性 下促进真核细胞中的同源性定向修复。此外,他们的研究表明,可以将多个向导序列编码至单个CRISPR阵列中,以便能够同时编辑哺乳动物基因组内的内源基因组基因座处的若干个,从而证明RNA引导型核酸酶技术的简单可编程性和广泛适用性。这种使用RNA对细 胞中的序列特异性DNA切割进行编程的能力定义了一类新的基因组工程改造工具。这些研 究还表明,其他CRISPR基因座很可能可移植至哺乳动物细胞中,并且还可以介导哺乳动物 基因组切割。重要的是,可以设想CRISPR-Cas系统的若干个方面可以进一步改善,以提高 其效率和多功能性。
Figure BDA0003651481360000221
Jiang等使用与双RNA复合的成簇的规则间隔的短回文重复序列(CRISPR)相关的 Cas9内切核酸酶在肺炎链球菌(Streptococcus pneumoniae)和大肠杆菌(Escherichiacoli)的基 因组中引入精确突变。该方法依赖于所靶向的基因组位点处的双RNA:Cas9定向切割来杀死 未突变的细胞,并且避免了对选择性标记物或反选择系统的需求。该研究报告了通过改变短 CRISPR RNA(crRNA)的序列对双RNA:Cas9特异性进行重新编程,从而在编辑模板上进行 单核苷酸和多核苷酸改变。该研究表明,同时使用两个crRNA能够实现多路诱变。此外, 当该方法与重组工程改造组合使用时,在肺炎链球菌中,使用所述方法回收的细胞中有接近 100%含有所期望的突变,而在大肠杆菌中,回收细胞中有65%含有所述突变。
Figure BDA0003651481360000222
Wang等(2013年)使用了CRISPR/Cas系统一步产生了携带多个基因突变的小鼠,这 些突变传统上通过在胚胎干细胞中连续重组和/或具有单个突变的小鼠的耗时杂交用多个步 骤产生。所述CRISPR/Cas系统将大大加速功能冗余基因和上位基因相互作用的体内研究。
Figure BDA0003651481360000223
Konermann等(2013)解决了本领域对能够对基于DNA结合域的CRISPR Cas9酶以及转录激活子样效应子进行光学和化学调节的多功能稳健技术的需求
Figure BDA0003651481360000224
Ran等(2013-A)描述了一种将Cas9切口酶突变体与配对向导RNA组合以引入靶向 性双链断裂的方法。这解决了通过向导序列使来自微生物CRISPR-Cas系统的Cas9核酸酶 靶向特定基因组基因座的问题,这会容忍与DNA靶标的某些错配,从而促进了不希望的脱 靶诱变。因为基因组中的单个切口被以高保真度修复,所以需要通过适当偏移的向导RNA 进行同时切口以进行双链断裂,并增加了用于靶切割的特异性识别碱基的数目。作者们证明 了使用配对切口可以将细胞系中的脱靶活性降低50至1,500倍,并且在不牺牲中靶切割效 率的情况下促进小鼠受精卵中的基因敲除。这种多功能策略能够进行多种需要高特异性的基 因组编辑应用。
Figure BDA0003651481360000225
Hsu等(2013)表征了人细胞中的SpCas9靶向特异性,以获悉靶位点的选择并避免脱 靶效应。该研究评估了293T和293FT细胞中超过700个向导RNA变体和超过100个预测基因组脱靶基因座处SpCas9诱导的插入缺失突变水平。作者们认为,SpCas9以序列依赖性方式容忍不同位置的向导RNA和靶DNA之间的错配,对错配的数量、位置和分布敏感。 作者们还证明,SpCas9介导的切割不受DNA甲基化影响,而且可以滴定SpCas9和sgRNA 的剂量以便将脱靶修饰减至最少。此外,为了有助于哺乳动物基因组工程改造应用,作者们 报告了提供一个基于网络的软件工具来指导靶序列的选择和验证以及脱靶分析。
Figure BDA0003651481360000226
Ran等(2013-B)描述了一套工具,用于在哺乳动物细胞中通过非同源端连接(NHEJ) 或同源性定向修复(HDR)进行Cas9介导的基因组编辑,以及产生供下游功能研究用的修饰 细胞系。为了将脱靶切割减至最少,作者们还描述了一种使用Cas9切口酶突变体与配对向 导RNA的双切口策略。作者们提供的方案通过实验得出了关于选择标靶位点、评估切割效 率和分析脱靶活性的指南。所述研究表明,从靶设计开始,可以在短短1至2周内实现基因 修饰,并且可以在2至3周内得到修饰的克隆细胞系。
Figure BDA0003651481360000231
Shalem等描述了一种在全基因组范围内查询基因功能的新方法。他们的研究表明, 基因组范围的CRISPR-Cas9敲除(GeCKO)文库的递送靶向了18,080个基因,其中64,751个 独特向导序列能够在人细胞中进行阴性和正选择筛检。首先,作者们证明使用GeCKO文库 鉴定了癌症和多能干细胞中对细胞活力必需的基因。接下来,在黑色素瘤模型中,作者们筛 检了诸多基因,所述基因的丧失涉及威罗菲尼耐药性,威罗菲尼是一种抑制突变蛋白激酶 BRAF的治疗剂。他们的研究表明,排名最高的候选物包括之前验证的基因NF1和MED12, 以及新颖命中NF2、CUL3、TADA2B和TADA1。作者们观察到靶向同一基因的单独向导RNA之间的高一致性水平和高命中确认率,从而证明了用Cas9进行基因组范围筛检的前景。
Figure BDA0003651481360000232
Nishimasu等报告了酿脓链球菌Cas9与sgRNA及其靶DNA的复合物在2.5A°分辨率下的晶体结构。该结构揭示了由靶标识别叶和核酸酶叶组成的双叶结构,在其界面处的带 正电凹槽中容纳有sgRNA:DNA异源双链体。尽管识别叶对于结合sgRNA和DNA为必需 的,但核酸酶叶含有HNH和RuvC核酸酶结构域,它们分别被适当定位以便切割靶DNA 的互补链和非互补链。核酸酶叶还含有羧基末端结构域,负责与原间隔子相邻基序(PAM) 的相互作用。这种高分辨率结构和伴随的功能分析揭示了通过Cas9进行RNA引导型DNA 靶向的分子机制,从而为合理设计新的多功能基因组编辑技术铺平了道路。
Figure BDA0003651481360000233
Wu等绘出了小鼠胚胎干细胞(mESCs)中负载有单向导RNA(sgRNA)的酿脓链球菌的无催化活性Cas9(dCas9)的全基因组结合位点。作者们表明,四个测试sgRNA中的每一 个都使dCas9靶向数十至数千个基因组位点,通常以sgRNA中的5-核苷酸种子区和NGG 原间隔子相邻基序(PAM)为特征。染色质不可达性减少了dCas9与具有匹配种子序列的其他 位点的结合;因此,70%脱靶位点与基因相关。作者们表明,对转染有催化活性Cas9的mESC 中295个dCas9结合位点的靶向测序仅鉴定了一个以高于背景的水平突变的位点。作者们提出了Cas9结合和切割的两态模型,其中种子匹配触发了结合,但切割需要与靶DNA广泛 配对。
Figure BDA0003651481360000234
Platt等建立了一种Cre依赖性Cas9敲入小鼠。作者们证明了在神经元、免疫细胞 和内皮细胞中使用腺相关病毒(AAV)、慢病毒或颗粒介导的向导RNA递送的体内以及离体 基因组编辑。
Figure BDA0003651481360000235
Hsu等(2014)是一篇综述性文章,总体上讨论了从酸奶到基因组编辑的CRISPR-Cas9 历史,包括细胞的基因筛选。
Figure BDA0003651481360000236
Wang等(2014)涉及一种适用于阳性和负选择的汇合功能丧失基因筛检方法,该方法 使用基因组范围慢病毒单向导RNA(sgRNA)文库。
Figure BDA0003651481360000237
Doench等产生了一个sgRNA池,平铺越过一组六个内源小鼠基因和三个内源人类 基因的所有可能靶位点,并通过抗体染色和流式细胞术来定量评价它们产生靶基因的无效等 位基因的能力。作者们证明,PAM的优化提高了活性,而且还为设计sgRNA提供了在线工 具。
Figure BDA0003651481360000238
Swiech等证明了AAV介导的SpCas9基因组编辑能够对脑中的基因功能进行反向遗传学研究。
Figure BDA0003651481360000241
Konermann等(2015)讨论了用和不用接头连接向导上的适当位置(诸如茎或四环)上 的多个效应结构域(例如转录激活子、功能和表观基因组调控子)的能力。
Figure BDA0003651481360000242
Zetsche等证明了Cas9酶可以一分为二,并且因此可以控制Cas9组装以便激活。
Figure BDA0003651481360000243
Chen等涉及多路筛检,通过证明小鼠的全基因组体内CRISPR-Cas9筛检揭示了调 控肺转移的基因。
Figure BDA0003651481360000244
Ran等(2015)涉及SaCas9及其编辑基因组的能力,并证明了无法从生化测定推断。 Shalem等(2015)描述了使用无催化活性的Cas9(dCas9)融合来合成抑制(CRISPRi)或激活 (CRISPRa)表达的方法,显示了使用Cas9进行基因组规模筛检的进展,包括阵列和汇集筛检、 使基因组基因座失活的敲除方法和调节转录活性的策略。
Figure BDA0003651481360000245
Shalem等(2015)描述了使用无催化活性的Cas9(dCas9)融合来合成抑制(CRISPRi)或 激活(CRISPRa)表达的方法,显示了使用Cas9进行基因组规模筛检的进展,包括阵列和汇集 筛检、使基因组基因座失活的敲除方法和调节转录活性的策略。
Figure BDA0003651481360000246
Xu等(2015)评价了基于CRISPR的筛检中有助于单向导RNA(sgRNA)效率的DNA序列特征。作者们探索了CRISPR/Cas9敲除的效率和切割位点处的核苷酸偏好。作者们还发现,CRISPRi/a的序列偏好与CRISPR/Cas9敲除的序列偏好基本上不同。
Figure BDA0003651481360000247
Parnas等(2015)将全基因组汇集的CRISPR-Cas9文库引入树突状细胞(DC)中,以鉴 定控制细菌脂多糖(LPS)诱导肿瘤坏死因子(Tnf)的基因。鉴定了已知的Tlr4信号传导调控子 和以前未知的候选物并分类为对针对LPS的经典应答具有不同影响的三个功能模块。
Figure BDA0003651481360000248
Ramanan等(2015)证明了切割受感染细胞中的病毒附加型DNA(cccDNA)。HBV基因组作为3.2kb双链附加型DNA(称为共价闭合环状DNA(cccDNA))存在于受感染肝细胞 的细胞核中,它是HBV生命周期中的关键组分,当前疗法不能抑制它的复制。作者们表明, 特异性靶向HBV高度保守区域的sgRNA强力抑制病毒复制并消耗cccDNA。
Figure BDA0003651481360000249
Nishimasu等(2015)报告了SaCas9与单向导RNA(sgRNA)及其双链DNA靶标的复合物的晶体结构,含有5'-TTGAAT-3'PAM和5'-TTGGGT-3'PAM。SaCas9与SpCas9的结 构比较突出了结构保守性和差异性,解释了它们独特的PAM特异性和直系同源sgRNA识 别。
此外,“Dimeric CRISPR RNA-guided FokI nucleases for highly specificgenome editing”, Shengdar Q.Tsai,Nicolas Wyvekens,Cyd Khayter,JenniferA.Foden,Vishal Thapar,Deepak Reyon,Mathew J.Goodwin,Martin J.Aryee,J.KeithJoung Nature Biotechnology 32(6):569-77 (2014)涉及在人类细胞中识别延伸序列并且能高效编辑内源基因的二聚RNA引导FokI核酸 酶。此外,提到了标题为“DELIVERY,USEAND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORTARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS”的PCT申请PCT/US14/70057 (代理人参考号47627.99.2060和BI-2013/107)(要求以下美国临时专利申请中一项或多项或 全部的优先权:2014年9月24日提交的62/054,490;2014年6月10日提交的62/010,441; 以及61/915,118、61/915,215和61/915,148,各自于2013年12月12日提交)(“颗粒递送PCT”), 通过引用并入本文,关于制备含有sgRNA和Cas9蛋白的颗粒的方法,包括混合包含sgRNA 和Cas9蛋白(和可选HDR模板)的混合物与包含表面活性剂、磷脂、生物可降解聚合物、脂 蛋白和醇或基本上由其组成或由其组成的混合物;以及和来自这种方法的颗粒。举例来说, 其中Cas9蛋白和sgRNA在合适的温度,例如15℃至30℃,例如20℃至25℃,例如室温下 以合适的(例如3:1至1:3或2:1至1:2或1:1)摩尔比混合在一起,持续合适的时间,例如15 至45分钟,诸如30分钟,有利地在无菌无核酸酶缓冲液(例如1X PBS)中进行。将颗粒组 分诸如或包含:表面活性剂,例如阳离子脂质,例如1,2-二油酰基-3-三甲基铵-丙烷(DOTAP); 磷脂,例如二肉豆蔻酰磷脂酰胆碱(DMPC);生物可降解聚合物,诸如乙二醇聚合物或PEG; 和脂蛋白,诸如低密度脂蛋白,例如胆固醇,分别溶解在醇中,最好是C1-6烷基醇,诸如甲 醇、乙醇、异丙醇,例如100%乙醇。将两种溶液混合在一起形成含有Cas9-sgRNA复合物 的颗粒。因此,可以使sgRNA与Cas9蛋白预复合,然后将整个复合物制成颗粒。可以用不 同摩尔比的已知促进核酸递送至细胞中的不同组分(例如1,2-二油酰基-3-三甲基铵-丙烷 (DOTAP)、1,2-二十四烷酰基-sn-甘油基-3-磷酸胆碱(DMPC)、聚乙二醇(PEG)和胆固醇)进行 配制。举例来说,DOTAP:DMPC:PEG:胆固醇摩尔比可以是DOTAP 100、DMPC 0、PEG 0、 胆固醇0;或DOTAP 90、DMPC 0、PEG 10、胆固醇0;或DOTAP 90、DMPC 0、PEG 5、 胆固醇5。DOTAP 100、DMPC 0、PEG 0、胆固醇0。因此,该应用包括混合sgRNA、Cas9 蛋白和形成颗粒的组分;以及来自这种混合的颗粒。本发明的诸多方面可能涉及颗粒;例如, 使用类似于颗粒递送PCT的方法的颗粒,例如通过混合包含如本发明中的crRNA和/或 CRISPR-Cas的混合物和形成颗粒的组分(例如,如在颗粒递送PCT中),以便由这种混合形 成一个和多个颗粒(或者,当然,本发明中涉及crRNA和/或CRISPR-Cas的其他颗粒)。
多路靶向方法
本文的Cas蛋白可以采用超过一个向导分子而不丧失活性。这可以使本文定义的Cas 蛋白、CRISPR-Cas系统或复合物能够使用本文定义的单个酶、系统或复合物靶向多个靶标 (例如,DNA靶标)、基因或基因座。向导分子可以串联排列,任选地通过核苷酸序列,诸如本文定义的顺向重复序列隔开。不同的向导分子串联的位置不影响活性。
在所述方法中的任一种中,所述复合物可以与多个向导一起递送用于多路复用。在所述 方法中的任一种中,可以使用超过一种蛋白质。在一些实施例中,一个Cas蛋白可以与多个 向导一起递送,例如至少2个、至少5个、至少10个、至少15个、至少20个、至少30 个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100 个、至少120个、至少140个、至少160个、至少180个、至少200个、至少220个、至少 240个、至少260个、至少280个、至少300个、至少350个、至少400个或至少500个向 导。在一些实施例中,本文的系统可以包含Cas蛋白和多个向导,例如至少2个、至少5 个、至少10个、至少15个、至少20个、至少30个、至少40个、至少50个、至少60个、 至少70个、至少80个、至少90个、至少100个、至少120个、至少140个、至少160个、 至少180个、至少200个、至少220个、至少240个、至少260个、至少280个、至少300 个、至少350个、至少400个或至少500个向导。
所述Cas蛋白可以形成CRISPR系统或复合物的一部分,后者还包含串联排列的向导 RNA(gRNA),其包含一连串2、3、4、5、6、7、8、9、10、15、25、25、30或超过30个 向导序列,每一个都能够与细胞中的目标基因组基因座中的靶序列特异性杂交。在一些实施 方案中,所述功能Cas CRISPR系统或复合物结合多个靶序列。在一些实施方案中,所述功 能CRISPR系统或复合物可以编辑多个靶序列,例如,靶序列可以包含基因组基因座,并且 在一些实施方案中,可能存在基因表达改变。在一些实施方案中,所述功能CRISPR系统或 复合物可以包含其他功能域。在一些实施方案中,所述组合物包含两个或更多个能够与两个 不同的靶序列或靶序列的不同区域杂交的向导序列。
在一些实施方案中,本发明提供了一种用于改变或修饰多种基因产物的表达的方法。所 述方法可以包括引入到含有所述靶核酸(例如DNA分子)或含有并表达靶核酸(例如DNA分 子)的细胞中;例如,所述靶核酸可以编码基因产物或提供基因产物(例如调控序列)的表达。 在一些一般实施方案中,用于多路靶向的Cas酶与一个或多个功能域缔合。在一些更具体的 实施方案中,用于多路靶向的CRISPR酶是如本文在别处定义的死Cas。在一些实施方案中, 每一个向导序列的长度为至少16、17、18、19、20、25个核苷酸,或者在16至30个或16 至25个或16至20个核苷酸之间。Cong等(Science 2月15日;339(6121):819-23(2013)和本 文引用的其他出版物中提供了使用CRISPR效应蛋白进行多路基因组工程改造的示例。
在所述方法中的任一种中,所述链断裂可以是单链断裂或双链断裂。在优选实施方案中, 所述双链断裂可以指RNA的两个部分的断裂,诸如当单链RNA分子折叠到自身上时形成 的RNA的两个部分或者与含有允许部分RNA折叠并与自身配对的自身互补序列的RNA分 子形成的推定双螺旋体。
本文提供了工程改造的多核苷酸序列,其可以使用单个crRNA将CRISPR蛋白的活性 引导至多个靶标。所述工程改造的多核苷酸序列,也称为多路多核苷酸,可以包括散布有两 个或更多个向导序列的两个或更多个顺向重复序列。更具体来说,所述工程改造的多核苷酸 序列可以包括相对于相应的野生型顺向重复序列具有一个或多个突变的顺向重复序列。所述 工程改造的多核苷酸可以配置为例如:5'DR1-G1-DR2-G2 3'。在一些实施方案中,所述工 程改造的多核苷酸可以经过配置以包括三个、四个、五个或更多个额外的顺向重复序列和向 导序列,例如:5'DR1-G1-DR2-G2-DR3-G3 3'、5"DR1-G1-DR2-G2-DR3-G3-DR4-G4 3'、或 5'DR1-G1-DR2-G2-DR3-G3-DR4-G4-DR5-G5 3'。
不管顺向重复序列的数量如何,顺向重复序列彼此不同。因此,根据本文提供的关于 Cas直系同源物的顺向重复序列的公开内容,DR1可以是野生型序列并且DR2可以相对于野生型序列包括一个或多个突变。向导序列也可以相同或不同。在一些实施方案中,所述向导序列可以结合不同的核酸靶标,例如编码不同多肽的核酸。所述多路多核苷酸可以如例如 2018年12月17日提交且标题为“CRISPR Cpf1 Direct Repeat Variants”并且通过引用整体并 入本文的美国申请62/780,748中的[0039]-[0072]中所述。
设想了向导分子的多路设计用于检测样品中的冠状病毒和/或其他呼吸道病毒以鉴定呼 吸道感染原因,并且可以根据本文公开的方法进行设计。简而言之,向导分子的设计可以涵 盖利用本文描述的使用多种输入特征的培养模型,其可以包括用于靶向目标序列的特定Cas 蛋白。参见美国临时申请62/818,702图4A,该案明确地通过引用并入。可以如本文在别处 详述来设计向导分子。关于冠状病毒的检测,可以根据Tian等,“Potentbinding of 2019novel coronavirus spike protein by a SARS coronavirus-specifichuman monoclonal antibody”;doi: 10.1101/2020.01.28.923011中公开的基因组序列进行向导设计;该文献通过引用并入,其中 详述了人单克隆抗体,2019-nCoV RBD的CR3022结合(KD 6.3nM)或2019-nCoV的序列可 在GISAID登录号EPI_ISL_402124和EPI_ISL_402127-402130下获得,并描述于 doi:10.1101/2020.01.22.914952或EP_ISL_402119-402121和EP_ISL 402123-402124中;另见 GenBank登录号MN908947.3。向导设计可以靶向2019-nCoV的独特病毒基因组区域或冠状 病毒家族的一种或多种病毒的保守基因组区域。
VI型CAS蛋白
在一些实施方案中,本文的Cas蛋白是2类VI型Cas蛋白。VI型Cas蛋白包括含有一个或多个(例如两个)高等真核生物和原核生物核苷酸结合(HEPN)结构域的Cas蛋白。HEPN结构域常见于不同的防御系统中,其实验特征,诸如许多原核生物毒素-抗毒素系统的毒素或真核生物RNA酶L,都具有RNA酶活性。HEPN的示例包括Anantharaman V,Makarova KS,Burroughs AM,Koonin EV,Aravind L.Comprehensive analysis of the HEPNsuperfamily: identification of novel roles in intra-genomic conflicts中所述的那些。VI型Cas蛋白的示例包 括以下文献中所述的那些:Shmakov S等,Discovery andfunctional characterization of diverse class 2CRISPR-Cassystems.Mol.Cell.2015;60:385-397;Shmakov S等,Nat Rev Microbiol. 2017年3月;15(3):169-182;以及Makarova,K.S.,Wolf,Y.I.,Iranzo,J.等,Evolutionaryclassification of CRISPR-Cas systems:a burst of class 2and derivedvariants.Nat Rev Microbiol 18,67-83(2020),所述文献通过引用整体并入本文。
在一个实施方案中,HEPN结构域包括至少一个包含R{N/H/K}X1X2X3H序列的RxxxxH基序。在本发明的一个实施方案中,HEPN结构域包括一个包含R{N/H}X1X2X3H序列的 RxxxxH基元。在本发明的一个实施方案中,HEPN结构域包含R{N/K}X1X2X3H序列。在 某些实施方案中,X1为R、S、D、E、Q、N、G、Y或H。在某些实施方案中,X2为I、S、 T、V或L。在某些实施方案中,X3为L、F、N、Y、V、I、S、D、E或A。
在一些实施方案中,所述系统或组合物包含包括一个或多个HEPN结构域并且长度小 于1000个氨基酸的蛋白质。举例来说,所述蛋白质在大小方面可以少于950、少于900、少于850、少于800、少于750、少于700、少于650、少于600、少于550、或少于500个氨 基酸。
CAS13概述
在一些实施例中,所述VI型Cas蛋白是Cas13蛋白。Cas 13蛋白的示例包括Cas13a、Cas13b、Cas13c、Cas13d和Cas13b-t。本发明提供了特定的Cas13效应子、核酸、系统、载 体和使用方法。Cas13的特征和功能还可以是本文所述的其他CRISPR-Cas蛋白的特征和功能。在一些实施例中,所述CRISPR-Cas蛋白是Cas13a。在一些实施例中,所述CRISPR-Cas 蛋白是Cas13b。在一些实施例中,所述CRISPR-Cas蛋白是Cas13b-t。在一些实施例中,所 述CRISPR-Cas蛋白是Cas13c。在一些实施例中,所述CRISPR-Cas蛋白是Cas13d。
Cas13蛋白可以具有RNA结合和切割功能。在具体实施方案中,所述Cas13蛋白可以具有RNA和/或DNA切割功能,例如RNA切割功能。本文的系统和方法可用于在核酸中 引入一个或多个突变。所述突变可以包括通过向导RNA或sgRNA或crRNA在细胞的各个 靶序列处引入、缺失或取代一个或多个核苷酸。所述突变可以包括通过向导RNA或sgRNA 或crRNA在所述细胞的各个靶序列处引入、缺失或取代1至75个核苷酸。所述突变可以包 括通过向导RNA或sgRNA或crRNA在所述细胞的各个靶序列处引入、缺失或取代1、5、 10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、 30、35、40、45、50或75个核苷酸。所述突变可以包括通过向导RNA或sgRNA或crRNA 在所述细胞的各个靶序列处引入、缺失或取代5、10、11、12、13、14、15、16、17、18、 19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。所 述突变可以包括通过向导RNA或sgRNA或crRNA在所述细胞的各个靶序列处引入、缺失 或取代10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、 28、29、30、35、40、45、50或75个核苷酸。所述突变可以包括通过向导RNA或sgRNA 或crRNA在所述细胞的各个靶序列处引入、缺失或取代20、21、22、23、24、25、26、27、 28、29、30、35、40、45、50或75个核苷酸。所述突变可以包括通过向导RNA或sgRNA 或crRNA在所述细胞的各个靶序列处引入、缺失或取代40、45、50、75、100、200、300、 400或500个核苷酸。
为了减少毒性和脱靶效应,控制所递送的Cas13 mRNA和向导RNA的浓度将非常重要。 通过在细胞或非人真核动物模型中测试不同浓度并使用深度测序分析潜在脱靶基因组基因 座的修饰程度,可以确定Cas13 mRNA和向导RNA的最佳浓度。向导序列和用以将毒性和 脱靶效应减至最少的策略可以如WO 2014/093622(PCT/US2013/074667);或者,通过本文的 突变。
在一些实施方案中,所述Cas蛋白可以具有切割活性。在一些实施方案中,Cas13可以 指导靶序列处或附近,诸如靶序列内和/或靶序列的补体内或与靶序列相关的序列处,例如 距靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、 100、200、500个或更多个碱基对内的一个或两个核酸链的切割。在一些实施方案中,所述 Cas13蛋白可以指导靶序列内和/或靶序列的补体内或与靶序列相关的序列处和/或距靶序列 的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、 200、500个或更多个碱基对内的超过一个切割(诸如一、二、三、四、五个或更多个切割)。 在一些实施方案中,所述切割可能钝性的,即,产生钝端。在一些实施方案中,所述切割可 能是交错的,即,产生粘性端。在一些实施方案中,载体编码核酸靶向性Cas13蛋白,后者 相对于相应野生型酶可能突变,使得突变的核酸靶向性Cas13蛋白缺乏切割含有靶序列的靶 多核苷酸的一个或两个链的能力,例如在HEPN结构域中发生改变或突变以产生基本上缺 乏所有RNA切割活性的突变Cas13,例如,突变酶的RNA切割活性为约不超过所述酶的非 突变形式的核酸切割活性的25%、10%、5%,1%、0.1%、0.01%或更少;一个示例可以是 与非突变形式相比,突变形式的核酸切割活性为零或可忽略不计。对于衍生,诸位申请人意 指衍生的酶在很大程度上基于与野生型酶具有高度序列同源性的意义,但是它已经以本领域 已知或本文所述的某种方式突变(修饰)。
通常,在内源RNA靶向系统的情况下,RNA靶向复合物(包含与靶序列杂交并且与一个或多个RNA靶向性效应蛋白复合的向导RNA或crRNA)的形成引起切割靶序列中或附近(例如,相距1、2、3、4、5、6、7、8、9、10、20、50个或更多个碱基对内)的RNA链。 如本文所用,术语“与目标靶基因座相关的序列”是指在靶序列附近(例如,在距靶序列1、2、 3、4、5、6、7、8、9、10、20、50个或更多个碱基对以内,其中所述靶序列包含在目标靶 基因座内)的序列。
(i)Cas13或编码它的核酸分子或者(ii)crRNA可以分开递送;并且有利地,(i)和(ii)中至 少一者或二者(例如,组装的复合物)通过颗粒或纳米颗粒复合物递送。RNA靶向性效应蛋白 mRNA可以在RNA靶向性向导RNA或crRNA之前递送,以便给核酸靶向性效应蛋白时间 来表达。RNA靶向性效应蛋白(Cas13)mRNA可以在施用RNA靶向性向导RNA或crRNA 之前1至12小时(优选2至6小时左右)施用。替代地,RNA靶向性效应蛋白mRNA和RNA 靶向性向导RNA或crRNA可以一起施用。有利地,向导RNA或crRNA的第二次加强剂量 可以在初始施用RNA靶向性效应子(Cas13)蛋白mRNA+向导RNA之后1至12小时(优选2 至6小时左右)施用。额外施用RNA靶向性效应蛋白mRNA和/或向导RNA或crRNA可能 可用于实现最有效的基因组修饰水平。
在一个实施方案中,本文的系统和方法可用于切割靶RNA。所述方法可能包括使用与 结合靶RNA并实现切割所述靶RNA的RNA靶向性复合物来修饰靶RNA。在一个实施方 案中,本文的系统或组合物在引入细胞时可以在RNA序列中产生断裂(例如,单链或双链断裂)。举例来说,所述系统和方法可用于切割细胞中的疾病RNA。举例来说,可以将包含侧 接上游序列和下游序列的欲整合序列的外源RNA模板引入细胞中。所述上游序列和下游序 列与RNA整合位点的任一侧具有序列相似性。在需要时,供体RNA可以是mRNA。所述 外源RNA模板包含欲整合序列(例如,突变RNA)。用于整合的序列可以是细胞内源或外源 序列。欲整合序列的示例包括编码蛋白质的RNA或非编码RNA(例如,微小RNA)。因此, 用于整合的序列可以可操作地连接到一个或多个适当的控制序列。替代地,欲整合序列可以 提供调控功能。选择所述外源RNA模板中的上游序列和下游序列以促进目标RNA序列和 供体RNA之间的重组。所述上游序列可以是与靶整合位点上游的RNA序列具有序列相似 性的RNA序列。类似地,所述下游序列可以是与靶整合位点下游的RNA序列具有序列相 似性的RNA序列。所述外源RNA模板中的上游序列和下游序列可以与靶RNA序列具有 75%、80%、85%、90%、95%或100%序列同一性。优选地,所述外源RNA模板中的上游 序列和下游序列与靶RNA序列具有约95%、96%、97%、98%、99%或100%序列同一性。 在一些情况下,所述外源RNA模板中的上游序列和下游序列与靶RNA序列具有约99%或 100%序列同一性。上游序列或下游序列可以包含约20bp至约2500bp,例如约50、100、 200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、 1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性上 游序列或下游序列具有约200bp至约2000bp、约600bp至约1000bp、或具体来说约700bp 至约1000bp。在一些方法中,所述外源RNA模板还可能包含标记物。此类标记物可能使 得容易对靶向整合进行筛检。合适的标记物的示例包括限制性位点、荧光蛋白或可选择标记 物。本发明的外源RNA模板可以使用重组技术构建(参见例如Sambrook等,2001和Ausubel 等,1996)。在通过整合外源RNA模板修饰靶RNA的方法中,通过核酸靶向性复合物将断裂 (例如,双链或单链RNA中的双链或单链断裂)引入RNA序列中,通过与外源RNA模板的 同源重组来修复断裂,以便将所述模板整合到RNA靶标中。双链断裂的存在促进了模板的 整合。在其他实施方案中,本发明提供了一种修饰真核细胞中的RNA表达的方法。所述方 法包括通过使用与DNA或RNA(例如,mRNA或前mRNA)结合的核酸靶向性复合物来增 加或减少靶多核苷酸的表达。在一些方法中,可以使靶RNA失活以实现对细胞中的表达的 修饰。举例来说,在RNA靶向性复合物与细胞中的靶序列结合后,使所述靶RNA失活, 使得不翻译所述序列,不产生编码蛋白质,或所述序列不像野生型序列那样发挥功能。举例 来说,可以使蛋白质或微小RNA编码序列失活,使得不产生所述蛋白质或微小RNA或前微小RNA转录物。RNA靶向性复合物的靶RNA可以是真核细胞内源或外源的任何RNA。 举例来说,所述靶RNA可以是存在于真核细胞的细胞核中的多核苷酸。所述靶RNA可以 是编码基因产物(例如蛋白质)的序列(例如mRNA或前mRNA)或非编码序列(例如ncRNA、 lncRNA、tRNA或rRNA)。靶RNA的示例包括与信号传导生化途径相关的序列,例如信号 传导生化途径相关RNA。靶RNA的示例包括疾病相关RNA。“疾病相关”RNA是指与非疾 病对照组的组织或细胞相比,在衍生自受疾病影响的组织的细胞中产生异常水平或异常形式 的翻译产物的任何RNA。它可能是从以异常高水平表达的基因转录而来的RNA;它可能是 从以异常低水平表达的基因转录而来的RNA,其中改变的表达与疾病的发生和/或进展相关。 疾病相关RNA还指从具有直接负责疾病病因或与负责疾病病因的基因呈连锁不平衡的突变 或遗传变异的基因转录而来的RNA。翻译产物可能是已知或未知的,而且可能处于正常或 异常水平。RNA靶向性复合物的靶RNA可以是真核细胞内源或外源的任何RNA。举例来 说,所述靶RNA可以是存在于真核细胞的细胞核中的多核苷酸。所述靶RNA可以是编码 基因产物(例如蛋白质)的序列(例如mRNA或前mRNA)或非编码序列(例如ncRNA、lncRNA、 tRNA或rRNA)。
在一些实施方案中,所述系统和方法可以包括允许RNA靶向性复合物与靶RNA结合以实现所述靶RNA的切割,从而修饰所述靶RNA,其中所述RNA靶向性复合物包含核酸 靶向性效应子(Cas13)蛋白与跟所述靶RNA内的靶序列杂交的向导RNA或crRNA复合。在 一个方面,本发明提供了一种修饰真核细胞中的RNA表达的方法。在一些实施方案中,所 述方法包括允许RNA靶向复合物与RNA结合,使得所述结合引起所述RNA的表达增加或 减少;其中所述RNA靶向复合物包含核酸靶向效应子(Cas13)蛋白与向导RNA复合。修饰 靶RNA的方法可以在体内、离体或体外的真核细胞中进行。在一些实施方案中,所述方法 包括对来自人类或非人动物的细胞或细胞群进行取样,以及修饰所述一个或多个细胞。培养 可以在任何阶段离体进行。所述一个或多个细胞甚至可以再引入到所述非人动物或植物中。 对于再引入的细胞,尤其优选所述细胞是干细胞。
使用两个不同的适体(各自与独特的RNA靶向性向导RNA相关)允许与不同的RNA靶向性向导RNA或crRNA一起使用的激活子-衔接子蛋白融合物和阻遏子-衔接子蛋白融合物激活RNA表达,同时抑制另一者。它们可以与它们的不同向导RNA或crRNA一起以多路 方式一起或基本上一起施用。大量的此类经修饰的RNA靶向性向导RNA或crRNA可以全 部同时使用,例如10个或20个或30个等等,而仅需要递送一个(或至少为最小数量)效应 蛋白(Cas13)分子,因为相对较少数量的效应蛋白分子可以与大量的经修饰的向导一起使用。所述衔接蛋白可以与一个或多个激活子或者一个或多个阻遏子缔合(优选连接或融合)。举例 来说,所述衔接蛋白可以与第一激活子和第二激活子缔合。所述第一激活子和第二激活子可 以相同,但它们优选为不同的激活子。可以使用三个或更多个乃至四个或更多个激活子(或 阻遏子),但包装大小可能会限制超过5个不同功能域的数量。优选使用接头,而不是与衔 接蛋白直接融合,其中两个或更多个功能域与衔接蛋白缔合。合适的接头可能包括GlySer 接头。
CRISPR效应子(Cas13)蛋白或其mRNA(或更一般来说,其核酸分子)和向导RNA或crRNA还可以单独递送,例如,前者在施用向导RNA或crRNA前1至12小时(优选2至6 小时左右)或一起施用。向导RNA或crRNA的第二次加强剂量可以在初始施用后1至12小 时(优选2至6小时左右)施用。
所述Cas13效应蛋白在本文有时称为CRISPR酶。应当了解,所述效应蛋白是基于或衍 生自酶,因此在一些实施方案中,术语‘效应蛋白’当然包括‘酶’。然而,还应当了解,根据 一些实施方案中的需要,所述效应蛋白可以具有DNA或RNA结合活性,但未必具有切割或切口活性,包括死Cas效应蛋白功能。
细胞靶标包括造血干细胞/祖细胞(CD34+);人类T细胞;和眼睛(视网膜细胞),例如感 光前体细胞。
所述系统可能包含模板。模板的递送可以通过与任何或所有CRISPR效应蛋白(Cas13) 或向导或crRNA的递送同时或分开,并且通过相同的递送机制或不同的递送机制。
在某些实施方案中,如本文所述的方法可以包括提供Cas13转基因细胞,其中编码一个 或多个向导RNA的一个或多个核酸提供或引入、与包含一个或多个目标基因的启动子的调 控元件可操作地连接在所述细胞中。如本文所用,术语“Cas13转基因细胞”是指其中已经基 因组整合了Cas13基因的细胞,诸如真核细胞。根据本发明,不具体限制细胞的性质、类型 或来源。此外,如何将Cas13转基因引入所述细胞中的方式可能变化,并且可以是本领域已 知的任何方法。在某些实施方案中,所述Cas13转基因细胞是通过将Cas13转基因引入分离 的细胞中而获得。在某些其他实施方案中,所述Cas13转基因细胞是通过从Cas13转基因生 物分离细胞而获得。通过示例而非限制的方式,如本文所指的Cas13转基因细胞可以衍生自 Cas13转基因真核生物,诸如Cas13敲入真核生物。参考WO 2014/093622(PCT/US13/74667), 通过引用并入本文。可以修改转让给Sangamo BioSciences,Inc.的美国专利公开号 20120017290和20110265198中涉及靶向Rosa基因座的方法以利用本发明的CRISPR Cas 系统。还可以修改转让给Cellectis的美国专利公开号20130236946中涉及靶向Rosa基因座 的方法以利用本发明的CRISPR Cas系统。通过进一步示例,参考Platt等(Cell;159(2):440-455 (2014)),该文献描述了Cas9敲入小鼠,并且通过引用并入本文。所述Cas13转基因还可以 包含Lox-Stop-polyA-Lox(LSL)盒,从而使Cre重组酶可诱导Cas13表达。替代地,所述Cas13 转基因细胞可以通过将Cas13转基因引入分离的细胞中来获得。用于转基因的递送系统在本 领域中是众所周知的。通过示例,所述Cas13转基因可以通过载体(例如,AAV、腺病毒、 慢病毒)和/或颗粒和/或颗粒递送在例如真核细胞中递送,也如本文在别处所述。
本领域技术人员应当理解,如本文所指的细胞,诸如Cas13转基因细胞,除了具有整合 的Cas13基因或在与能够将Cas13引导至靶基因座的RNA复合时由Cas13的序列特异性作 用引起的突变,例如一个或多个致癌突变之外,还可能包含其他基因组改变,如例如但不限 于Platt等(2014)、Chen等,(2014)或Kumar等(2009)所述。
向导RNA,例如sgRNA或crRNA编码序列和/或Cas13编码序列,可以功能或可操作地连接到调控元件,因此,调控元件驱动表达。所述启动子可以是组成型启动子和/或条件启动子和/或诱导型启动子和/或组织特异性启动子。所述启动子可以选自RNA聚合酶、polI、 pol II、pol III、T7、U6、H1、逆转录病毒劳氏肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV) 启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK) 启动子和EF1α启动子。有利的启动子是启动子U6。
在一些实施方案中,Cas蛋白(例如,Cas13蛋白)可以形成诱导型系统的组分。所述系 统的可诱导性质将允许使用某种能量形式对基因编辑或基因表达进行时空控制。所述能量形 式可以包括但不限于电磁辐射、声能、化学能和热能。诱导型系统的示例包括四环素诱导型 启动子(Tet-On或Tet-Off)、小分子双杂交转录激活系统(FKBP、ABA等)或光诱导型系统(光 敏色素、LOV结构域或隐花色素)。在一个实施方案中,所述CRISPR效应蛋白可以是光诱 导转录效应子(LITE)的一部分,从而以序列特异性方式指导转录活性变化。光组分可以包括 CRISPR效应蛋白、光响应性细胞色素异二聚体(例如来自拟南芥)和转录激活/抑制结构域。 US 61/736465和US 61/721,283以及WO 2014018423 A2中提供了诱导型DNA结合蛋白及 其使用方法的其他示例,其通过引用整体并入本文。
在一个方面,本发明提供了一种如本文所述的突变Cas13,其具有一个或多个减少脱靶 效应(即,改善CRISPR酶以用于实现对靶基因座的修饰)但降低或消除脱靶活性(诸如当与向 导RNA复合时)以及改善CRISPR酶以增加CRISPR酶活性(诸如当与向导RNA复合时)的 突变。应当理解,如下文所述的突变酶可以用于如本文在别处所述的根据本发明的任一种方 法。如本文在别处所述的任何方法、产品、组合物和用途同样适用于突变CRISPR酶,如下 文进一步详述。
Slaymaker等最近描述了一种生成具有增强特异性的Cas9直系同源物的方法(Slaymaker 等,2015“Rationally engineered Cas9 nucleases with improvedspecificity”)。这种策略可用于增 强Cas13蛋白的特异性。用于诱变的主要残基优选为HEPN结构域内的所有正电荷残基。 其他残基为在不同的直系同源物之间保守的带正电残基。
在一个方面,本发明还提供了用于调节Cas13结合活性和/或结合特异性的方法和突变。 在某些实施方案中,使用缺乏核酸酶活性的Cas13蛋白。在某些实施方案中,采用了经修饰 的向导RNA,它们促进结合但不促进Cas13核酸酶的核酸酶活性。在此类实施方案中,可 以增加或减少中靶结合。此外,在此类实施方案中,可以增加或减少脱靶结合。此外,关于 中靶结合对比脱靶结合,可能增加或减少特异性。
可用于各种组合中以增加或降低中靶与脱靶活性的活性和/或特异性,或者增加或降低 中靶与脱靶结合的结合和/或特异性的方法和突变可以用于补偿或增强为促进其他作用而进 行的突变或修饰。为促进其他作用而进行的此类突变或修饰包括对Cas13的突变或修饰和或 对向导RNA进行的突变或修饰。本发明的方法和突变用于调节Cas13核酸酶活性和/或与经 化学修饰的向导RNA的结合。
在一个方面,本发明提供了用于调节如本文所定义的根据本发明的包含诸如核酸酶、转 录激活子、转录阻遏子等功能域的Cas13蛋白的结合和/或结合特异性的方法和突变。举例 来说,通过引入突变,例如本文在别处所述的Cas13突变,可以使Cas13蛋白成为核酸酶无 效的,或者具有改变或降低的核酸酶活性。核酸酶缺乏型Cas13蛋白可用于功能域的RNA 引导型靶序列依赖性递送。本发明提供了用于调节Cas13蛋白结合的方法和突变。在一个实 施方案中,所述功能域包含VP64,从而提供RNA引导型转录因子。在另一个实施方案中, 所述功能域包含Fok I,从而提供RNA引导型核酸酶活性。提及美国专利公开2014/0356959、 美国专利公开2014/0342456、美国专利公开2015/0031132和Mali,P.等,2013,Science 339(6121):823-6,doi:10.1126/science.1232033,2013年1月3日在线发表,并且通过本文的教 导,本发明包括连同本文的教导一起应用的这些文件的方法和材料。在某些实施方案中,中 靶结合有所增加。在某些实施方案中,脱靶结合有所降低。在某些实施方案中,中靶结合有 所降低。在某些实施方案中,脱靶结合有所增加。因此,本发明还提供了增加或降低功能化 Cas13结合蛋白的中靶结合对比脱靶结合的特异性。
Cas13作为RNA引导型结合蛋白的用途不限于核酸酶无效的Ca13。当与某些向导RNA 一起使用时,包含核酸酶活性的Cas13酶也可以起RNA引导型结合蛋白的作用。举例来说, 包含与靶标错配的核苷酸的短向导RNA和向导RNA能促进RNA指导的Cas13与靶序列结合而几乎没有或没有靶切割。(参见例如Dahlman,2015,Nat Biotechnol.33(11):1159-1161,doi: 10.1038/nbt.3390,2015年10月05日在线发表)。在一个方面,本发明还提供了用于调节包 含核酸酶活性的Cas13蛋白的结合的方法和突变。在某些实施方案中,中靶结合有所增加。 在某些实施方案中,脱靶结合有所降低。在某些实施方案中,中靶结合有所降低。在某些实 施方案中,脱靶结合有所增加。在某些实施方案中,中靶结合对比脱靶结合的特异性有所增 加或降低。在某些实施方案中,还调节了向导RNA-Cas13酶的核酸酶活性。
RNA-RNA双链体形成对于整个靶标区的切割活性和特异性非常重要,而不仅仅是最接 近PFS的种子区序列。因此,截短的向导RNA示出了降低的切割活性和特异性。在一个方 面,本发明提供了使用改变的向导RNA增加切割活性和特异性的方法和突变。
在某些实施方案中,本发明的Cas蛋白(例如Cas13)的催化活性有所改变或修饰。应当 理解,如果催化活性不同于相应野生型CRISPR-Cas蛋白(例如,未突变的CRISPR-Cas蛋白) 的催化活性,则突变的Cas13具有改变或修饰的催化活性。可以通过本领域已知的手段测定 催化活性。通过示例而非限制的方式,可以通过测定插入缺失百分比(例如在指定时间之后 或在指定剂量下)而在体外或体内测定催化活性。在某些实施方案中,催化活性有所增加。 在某些实施方案中,催化活性增加了至少5%,优选至少10%,更优选至少20%,诸如至少 30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。在 某些实施方案中,催化活性有所降低。在某些实施方案中,催化活性降低了至少5%,优选 至少10%,更优选至少20%,诸如至少30%、至少40%、至少50%、至少60%、至少70%、 至少80%、至少90%或(基本上)100%。本文的一个或多个突变可以使催化活性失活,这可 以基本上所有催化活性、低于可检测水平或没有可测量的催化活性。
工程改造的CRISPR-Cas蛋白的一个或多个特征可能不同于相应野生型CRISPR-Cas蛋 白。此类特征的示例包括催化活性、gRNA结合、CRISPR-Cas蛋白的特异性(例如,编辑限 定靶标的特异性)、CRISPR-Cas蛋白的稳定性、脱靶结合、靶标结合、蛋白酶活性、切口酶活性、PFS识别。在一些实施例中,工程改造的CRISPR-Cas蛋白可以包含相应野生型CRISPR-Cas蛋白的一个或多个突变。在一些实施方案中,与相应野生型CRISPR-Cas蛋白 相比,所述工程改造的CRISPR-Cas蛋白的催化活性有所增加。在一些实施方案中,与相应 野生型CRISPR-Cas蛋白相比,所述工程改造的CRISPR-Cas蛋白的催化活性有所降低。在 一些实施方案中,与相应野生型CRISPR-Cas蛋白相比,所述工程改造的CRISPR-Cas蛋白 的gRNA结合有所增加。在一些实施方案中,与相应野生型CRISPR-Cas蛋白相比,所述工 程改造的CRISPR-Cas蛋白的gRNA结合有所降低。在一些实施方案中,与相应野生型 CRISPR-Cas蛋白相比,所述工程改造的CRISPR-Cas蛋白的特异性有所增加。在一些实施 方案中,与相应野生型CRISPR-Cas蛋白相比,所述工程改造的CRISPR-Cas蛋白的特异性 有所降低。在一些实施方案中,与相应野生型CRISPR-Cas蛋白相比,所述工程改造的 CRISPR-Cas蛋白的稳定性有所增加。在一些实施方案中,与相应野生型CRISPR-Cas蛋白 相比,所述工程改造的CRISPR-Cas蛋白的稳定性有所降低。在一些实施方案中,所述工程 改造的CRISPR-Cas蛋白还包含一个或多个使催化活性失活的突变。在一些实施方案中,与 相应野生型CRISPR-Cas蛋白相比,所述CRISPR-Cas蛋白的脱靶结合有所增加。在一些实 施方案中,与相应野生型CRISPR-Cas蛋白相比,所述CRISPR-Cas蛋白的脱靶结合有所降 低。在一些实施方案中,与相应野生型CRISPR-Cas蛋白相比,所述CRISPR-Cas蛋白的靶 标结合有所增加。在一些实施方案中,与相应野生型CRISPR-Cas蛋白相比,所述CRISPR-Cas 蛋白的靶标结合有所降低。在一些实施方案中,与相应野生型CRISPR-Cas蛋白相比,所述 工程改造的CRISPR-Cas蛋白具有较高蛋白酶活性或多核苷酸结合能力。在一些实施方案中, 与相应野生型CRISPR-Cas蛋白相比,改变了PFS识别。
在某些实施方案中,改变或修饰了本发明的Cas13蛋白的gRNA(crRNA)结合。应当理 解,如果gRNA结合不同于相应野生型Cas13(即,未突变的Cas13)的gRNA结合,则突变 的Cas13具有改变或修饰的gRNA结合。可以通过本领域已知的手段测定gRNA结合。通 过示例而非限制的方式,可以通过计算结合强度或亲和力(诸如基于平衡常数Ka、Kd等)来 测定gRNA结合。在某些实施方案中,gRNA结合有所增加。在某些实施方案中,gRNA结 合增加了至少5%,优选至少10%,更优选至少20%,诸如至少30%、至少40%、至少50%、 至少60%、至少70%、至少80%、至少90%或至少100%。在某些实施方案中,gRNA结合 有所降低。在某些实施方案中,gRNA结合降低了至少5%,优选至少10%,更优选至少20%, 诸如至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或(基本 上)100%。
在某些实施方案中,改变或修饰了本发明的Cas13蛋白的特异性。应当理解,如果特异 性不同于相应野生型Cas13(即,未突变的Cas13)的特异性,则突变的Cas13具有改变或修 饰的特异性。可以通过本领域已知的手段测定特异性。通过举例而非限制的方式,可以通过 比较中靶活性和脱靶活性来测定特异性。在某些实施方案中,特异性有所增加。在某些实施 方案中,特异性增加了至少5%,优选至少10%,更优选至少20%,诸如至少30%、至少 40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。在某些实施方 案中,特异性有所降低。在某些实施方案中,特异性降低了至少5%,优选至少10%,更优选至少20%,诸如至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至 少90%或(基本上)100%。
在某些实施方案中,改变或修饰了本发明的Cas13蛋白的稳定性。应当理解,如果稳定 性不同于相应野生型Cas13(即,未突变的Cas13)的稳定性,则突变的Cas13具有改变或修 饰的稳定性。可以通过本领域已知的手段测定稳定性。通过示例而非限制的方式,可以通过 测定Cas13蛋白的半衰期来测定稳定性。在某些实施方案中,稳定性有所增加。在某些实施 方案中,稳定性增加了至少5%,优选至少10%,更优选至少20%,诸如至少30%、至少 40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少100%。在某些实施方案中,稳定性有所降低。在某些实施方案中,稳定性降低了至少5%,优选至少10%,更优 选至少20%,诸如至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至 少90%或(基本上)100%。
在某些实施方案中,本发明的Cas13蛋白的靶标结合有所改变或修饰。应当理解,如果 靶标结合不同于相应野生型Cas13(即,未突变的Cas13)的靶标结合,则突变的Cas13具有 改变或修饰的靶标结合。可以通过本领域已知的手段测定靶标结合。通过示例而非限制的方 式,可以通过计算结合强度或亲和力(诸如基于平衡常数Ka、Kd等)来测定靶标结合。在某 些实施方案中,靶标结合有所增加。在某些实施方案中,靶标结合增加了至少5%,优选至 少10%,更优选至少20%,诸如至少30%、至少40%、至少50%、至少60%、至少70%、 至少80%、至少90%或至少100%。在某些实施方案中,靶标结合有所降低。在某些实施方 案中,靶标结合降低了至少5%,优选至少10%,更优选至少20%,诸如至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或(基本上)100%。
在某些实施方案中,改变或修饰了本发明的Cas13蛋白的脱靶结合。应当理解,如果脱 靶结合不同于相应野生型Cas13(即,未突变的Cas13)的脱靶结合,则突变的Cas13具有改 变或修饰的脱靶结合。可以通过本领域已知的手段测定脱靶结合。通过示例而非限制的方式, 可以通过计算结合强度或亲和力(诸如基于平衡常数Ka、Kd等)来测定脱靶结合。在某些实 施方案中,脱靶结合有所增加。在某些实施方案中,脱靶结合增加了至少5%,优选至少10%, 更优选至少20%,诸如至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、 至少90%或至少100%。在某些实施方案中,脱靶结合有所降低。在某些实施方案中,脱靶 结合降低了至少5%,优选至少10%,更优选至少20%,诸如至少30%、至少40%、至少 50%、至少60%、至少70%、至少80%、至少90%或(基本上)100%。
在某些实施方案中,本发明的Cas13蛋白的PFS识别或特异性有所改变或修饰。应当 理解,如果PFS识别或特异性不同于相应野生型Cas13(即,未突变的Cas13)的PFS识别或特异性,则突变的Cas13具有改变或修饰的PFS识别或特异性。可以通过本领域中已知的 手段测定PFS识别或特异性。通过示例而非限制的方式,可以通过PFS筛检来测定PFS识 别或特异性。在某些实施方案中,通过Cas13识别至少一个不同的PFS。在某些实施方案中, 通过突变的Cas13来识别相应野生型Cas13不识别的至少一个PFS。在某些实施方案中,通 过突变的Cas13来识别相应野生型Cas13不识别的至少一个PFS以及野生型PFS。在某些 实施方案中,通过突变的Cas13来识别相应野生型Cas13不识别的至少一个PFS,并且不再 识别野生型PFS。在某些实施方案中,突变的Cas13识别的PFS比野生型Cas13识别的PFS 长,诸如长1、2或3个核苷酸。在某些实施方案中,突变的Cas13识别的PFS比野生型 Cas13识别的PFS短,诸如短1、2或3个核苷酸。
在一些实施方案中,本发明提供了一种非天然存在或工程改造的组合物,其包含i)突变 的Cas13效应蛋白,和ii)crRNA,其中所述crRNA包含a)能够与靶RNA序列杂交的向导 序列,和b)顺向重复序列,由此形成了包含所述Cas13效应蛋白与跟所述靶RNA序列杂交的所述向导序列复合的CRISPR复合物。所述复合物可以在体外或离体形成并且引入细胞中或与RNA接触;或者可以在体内形成。
在一些实施方案中,诸如对于Cas13,本发明的非天然存在或工程改造的组合物可以包 含增强VI型Cas蛋白活性的辅助蛋白。在此类实施方案中,所述VI型Cas蛋白和VI型CRISPR-Cas辅助蛋白可以来自相同来源或来自不同来源。在一些实施方案中,本发明的非天然存在或工程改造的组合物包含抑制Cas13蛋白活性的辅助蛋白。在一些实施方案中,本发明的非天然存在或工程改造的组合物包含两个或更多个crRNA。在一些实施方案中,本发明的非天然存在或工程改造的组合物包含与原核细胞中的靶RNA序列杂交的向导序列。在一些实施方案中,本发明的非天然存在或工程改造的组合物包含与真核细胞中的靶RNA序列杂交的向导序列。在一些实施方案中,所述Cas13蛋白包含一个或多个核定位信号(NLS)。
在本发明的非天然存在或工程改造的组合物的一些实施方案中,所述Cas13蛋白和辅助 蛋白来自相同生物体。
在本发明的非天然存在或工程改造的组合物的一些实施方案中,所述Cas13蛋白和辅助 蛋白来自不同生物体。
本发明还提供了一种VI型CRISPR-Cas载体系统,所述载体系统包含一个或多个载体, 所述一个或多个载体包含:与编码所述Cas13效应蛋白的核苷酸序列可操作地连接的第一调 控元件,和与编码所述crRNA的核苷酸序列可操作地连接的第二调控元件。
在某些实施方案中,本发明的载体系统还包含与VI型CRISPR-Cas辅助蛋白的核苷酸 序列可操作地连接的调控元件。
适当时,对编码所述VI型CRISPR-Cas效应蛋白的核苷酸序列(和/或任选地对编码所述 VI型CRISPR-Cas辅助蛋白的核苷酸序列)进行密码子优化以便在真核细胞中表达。
在本发明的载体系统的一些实施方案中,对编码所述Cas13效应蛋白(和任选地)所述辅 助蛋白的核苷酸序列进行密码子优化以便在真核细胞中表达。
在一些实施方案中,本发明的载体系统包含在单个载体中。在本发明的载体系统的一些 实施方案中,所述一个或多个载体包括病毒载体。在本发明的载体系统的一些实施方案中, 所述一个或多个载体包括一个或多个逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹 病毒载体。
在一些实施方案中,本发明提供了一种递送系统,所述递送系统经配置以递送非天然存 在或工程改造的组合物的Cas13效应蛋白和一种或多种核酸组分,所述组合物包含i)如本文 所述的根据本发明的突变的Cas13效应蛋白,和ii)crRNA,其中所述crRNA包含a)与细胞 中的靶RNA序列杂交的向导序列,和b)顺向重复序列,其中所述Cas13效应蛋白与所述 crRNA形成复合物,其中所述向导序列指导与所述靶RNA序列的序列特异性结合,由此形成包含所述Cas13效应蛋白与同所述靶RNA序列杂交的所述向导序列复合的CRISPR复合物。所述复合物可以在体外或离体形成并且引入细胞中或与RNA接触;或者可以在体内形成。
在本发明的递送系统的一些实施方案中,所述系统包括一个或多个载体或者一个或多个 多核苷酸分子,所述一个或多个载体或多核苷酸分子包括编码所述Cas13效应蛋白的一个或 多个多核苷酸分子和所述非天然存在或工程改造的组合物一个或多个核酸组分。
在一些实施方案中,本发明的递送系统包括递送载体,所述递送载体包括脂质体、颗粒、 外来体、微泡、基因枪或者一个或多个病毒载体。在一些实施方案中,本发明的非天然存在 或工程改造的组合物用于治疗性治疗方法或研究计划中。在一些实施方案中,本发明的非天 然存在或工程改造的载体系统用于治疗性治疗方法或研究计划中。在一些实施方案中,本发 明的非天然存在或工程改造的递送系统用于治疗性治疗方法或研究计划中。
在本发明的一些实施方案中,提供了一种修饰目标靶基因表达的方法,所述方法包括使 靶RNA与一种或多种非天然存在或工程改造的组合物接触,所述组合物包含i)如本文所述 的根据本发明的突变Cas13效应蛋白,和ii)crRNA,其中所述crRNA包含a)与细胞中的靶RNA序列杂交的向导序列,和b)顺向重复序列,其中所述Cas13效应蛋白与所述crRNA形成复合物,其中所述向导序列指导在细胞中与所述靶RNA序列的序列特异性结合,由此形成包含所述Cas13效应蛋白与跟所述靶RNA序列杂交的所述向导序列复合的CRISPR复合物,由此修饰了目标靶基因座的表达。所述复合物可以在体外或离体形成并且引入细胞中或 与RNA接触;或者可以在体内形成。
在一些实施方案中,修饰目标靶基因表达的方法还包括使所述靶RNA与增强Cas13效 应蛋白活性的辅助蛋白接触。
在修饰目标靶基因表达的方法的一些实施方案中,所述增强Cas13效应蛋白活性的辅助 蛋白是csx28蛋白。
在一些实施方案中,修饰目标靶基因表达的方法还包括使所述靶RNA与抑制Cas13蛋 白活性的辅助蛋白接触。
在修饰目标靶基因表达的方法的一些实施方案中,所述抑制Cas13效应蛋白活性的辅助 蛋白是csx27蛋白。
在一些实施方案中,所述修饰目标靶基因表达的方法包括切割所述靶RNA。
在一些实施方案中,所述修饰目标靶基因表达的方法包括增加或降低所述靶RNA的表 达。
在修饰目标靶基因表达的方法的一些实施方案中,所述靶基因在原核细胞中。
在修饰目标靶基因表达的方法的一些实施方案中,所述靶基因在真核细胞中。
在本发明的一些实施方案中,提供了包含修饰的目标靶标的细胞,其中所述目标靶标已 经根据本文公开的任何方法进行了修饰。
在本发明的一些实施方案中,所述细胞是原核细胞。
在本发明的一些实施方案中,所述细胞是真核细胞。
在一些实施方案中,修饰细胞中的目标靶标导致:包含改变的至少一种基因产物表达的 细胞;包含改变的至少一种基因产物的表达的细胞,其中所述至少一种基因产物的表达有所 增加;或包含改变的至少一种基因产物表达的细胞,其中所述至少一种基因产物的表达有所 降低。
在一些实施方案中,所述细胞是哺乳动物细胞或人类细胞。
在本发明的一些实施方案中,提供了一种细胞系,其包括本文公开的细胞或通过本文公 开的任何方法修饰的细胞或其后代。
在本发明的一些实施方案中,提供了一种多细胞生物体,其包含本文公开的一种或多种 细胞或者根据本文公开的任何方法修饰的一种或多种细胞。
在本发明的一些实施方案中,提供了一种植物或动物模型,其包含本文公开的一种或多 种细胞或根据本文公开的任何方法修饰的一种或多种细胞。
在本发明的一些实施方案中,提供了一种基因产物,其来自本文公开的细胞或细胞系或 生物体或者植物或动物模型。
在一些实施方案中,表达的基因产物的量大于或小于来自未改变表达的细胞的基因产物 的量。
在某些实施方案中,所述Cas13蛋白来源于另枝菌属(Alistipes)、厌氧嗜盐杆菌属 (Anaerosalibacter)、拟杆菌属(Bacteroides)、拟杆菌门(Bacteroidetes)、伯格氏菌属(Bergeyella)、 布劳特氏菌属(Blautia)、丁酸弧菌属(Butyrivibrio)、嗜二氧化碳嗜纤维菌属(Capnocytophaga)、 肉杆菌属(Carnobacterium)、绿曲菌属(Chloroflexus)、金黄杆菌属(Chryseobacterium)、梭菌 属(Clostridium)、去甲醌菌属(Demequina)、真杆菌科(Eubacteriaceae)、真杆菌属(Eubacterium)、 黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、赫氏菌属(Herbinix)、非适应螺旋菌属 (Insolitispirillum)、毛螺旋菌科(Lachnospiraceae)、纤毛菌属(Leptotrichia)、李斯特氏菌属 (Listeria)、香味菌属(Myroides)、泥沼杆菌(Paludibacter)、褐指藻杆菌属(Phaeodactylibacter)、 紫单胞菌科(Porphyromonadaceae)、卟啉单胞菌属(Porphyromonas)、普雷沃氏菌属 (Prevotella)、假丁酸弧菌属(Pseudobutyrivibrio)、冷弯菌属(Psychroflexus)、赖兴巴赫氏菌属(Reichenbachiella)、红杆菌属(Rhodobacter)、里默氏杆菌属(Riemerella)、中华微杆菌属 (Sinomicrobium)、深海螺旋菌属(Thalassospira)、瘤胃球菌属(Ruminococcus)的物种。如本文 所用,当Cas13蛋白来源于一个物种时,它可能是该物种中的野生型Cas13蛋白,或该物种 中的野生型Cas13蛋白的同源物。作为该物种中野生型Cas13蛋白同源物的Cas13蛋白可以 包括野生型Cas13蛋白的一种或多种变异(例如,突变、截短等)。
在某些实施方案中,所述Cas13蛋白来源于沙氏纤毛菌(Leptotrichia shahii)、斯氏李斯 特氏菌(Listeria seeligeri)、毛螺旋菌科细菌(诸如Lb MA2020、Lb NK4A179、Lb NK4A144)、 嗜胺梭菌(Clostridium aminophilum)(诸如Ca DSM 10710)、鸡肉杆菌(Carnobacterium gallinarum)(诸如Cg DSM 4847)、丙酸泥沼杆菌(Paludibacterpropionicigenes)(诸如Pp WB4)、威氏李斯特氏菌(Listeria weihenstephanensis)(诸如Lw FSL R9-0317)、李斯特氏菌科 细菌(诸如Lb FSL M6-0635)、韦德纤毛菌(Leptotrichiawadei)(诸如Lw F0279)、荚膜红杆菌 (Rhodobacter capsulatus)(诸如Rc SB 1003、RcR121、Rc DE442)、口腔纤毛菌(Leptotrichia buccalis)(诸如Lb C-1013-b)、解半纤维素赫氏菌(Herbinix hemicellulosilytica)、真杆菌科细菌 (诸如Eb CHKCI004)、布劳特氏菌属(Blautia.sp)马塞尔-P2398、纤毛菌属口腔分类群879str. F0557、聚集绿曲菌(Chloroflexus aggregans)、橙红去甲醌菌(Demequina aurantiaca)、深海螺 旋菌属TSL5-1、假丁酸弧菌属OR37、丁酸弧菌属YAB3001、纤毛菌属马塞尔-P3007、爱 华拟杆菌(Bacteroides ihuae)、紫单孢菌科细菌(诸如Pb KH3CP3RA)、沙燕李斯特菌(Listeriariparia)、陌生非适应螺旋菌(Insolitispirillum peregrinum)、另枝菌属ZOR0009、酿脓拟杆菌 (Bacteroides pyogenes)(诸如Bp F0041)、拟杆菌门细菌(诸如Bb GWA2_31_9)、动物溃疡伯 格氏菌(Bergeyella zoohelcum)(诸如Bz ATCC 43767)、犬嗜二氧化碳嗜纤维菌(Capnocytophaga canimorsus)、犬咬嗜二氧化碳嗜纤维菌(Capnocytophaga cynodegmi)、犬金 黄杆菌(Chryseobacterium carnipullorum)、济州岛金黄杆菌(Chryseobacteriumjejuense)、嗜鳃 黄杆菌(Chryseobacterium ureilyticum)、嗜分支黄杆菌(Flavobacterium branchiophilum)、柱状 黄杆菌(Flavobacterium columnare)、黄杆菌属316、香味类香味菌(Myroides odoratimimus)(诸 如Mo CCUG 10230、Mo CCUG 12901、MoCCUG 3837)、丙酸泥沼杆菌、橙黄褐指藻杆菌(Phaeodactylibacter xiamenensis)、牙龈卟啉单胞菌(Porphyromonas gingivalis)(诸如Pg F0185、 Pg F0568、Pg JCVI SC001、PgW4087、咽喉卟啉单胞菌(Porphyromonas gulae)、卟啉单胞 菌属COT-052OH4946、橙红普雷沃氏菌(Prevotella aurantiaca)、口腔普雷沃氏菌(Prevotella buccae)(诸如Pb ATCC33574)、斐氏普雷沃氏菌(Prevotella falsenii)、中间普雷沃氏菌 (Prevotellaintermedia)(诸如Pi 17、Pi ZT)、苍白普雷沃菌(Prevotella pallens)(诸如Pp ATCC700821)、胸膜炎普雷沃菌(Prevotella pleuritidis)、解糖普雷沃氏菌(诸如Ps F0055)、普雷沃 氏菌属MA2016、普雷沃氏菌属MSX73、普雷沃氏菌属P4-76、普雷沃氏菌属P5-119、普雷 沃氏菌属P5-125、普雷沃氏菌属P5-60、青蓝色冷弯菌(Psychroflexus torquis)、噬琼脂赖兴 巴赫氏菌(cReichenbachiella agariperforans)、鸭疫里默氏杆菌(Riemerellaanatipestifer)、海洋 中华微杆菌(Sinomicrobium oceani)、坏死梭杆菌(Fusobacteriumnecrophorum)(诸如Fn基形 亚种ATCC 51357、Fn DJ-2、Fn BFTR-1、Fn基形亚种)、产气梭杆菌(Fusobacterium perfoetens) (诸如Fp ATCC 29250)、溃疡梭杆菌(Fusobacteriumulcerans)(诸如Fu ATCC 49185)、厌氧嗜 盐杆菌属ND1、惰性真杆菌(Eubacteriumsiraeum)、黄色瘤胃球菌(Ruminococcus flavefaciens) (诸如Rfx XPD3002)或白色瘤胃球菌(Ruminococcus albus)。
在某些实施方案中,所述Cas13是Cas13a,并且来源于拟杆菌属、布劳特氏菌属、丁酸弧菌属、肉杆菌属、绿曲菌属、梭菌属、去甲醌菌属、真杆菌属、赫氏菌属、非适应螺旋 菌属、毛螺旋菌科、细毛菌属、李斯特氏菌属、泥沼杆菌属、紫单胞菌科、假丁酸弧菌属、 红杆菌属或深海螺旋菌属的物种。
在某些实施方案中,所述Cas13是Cas13a,并且来源于沙氏纤毛菌、斯氏李斯特氏菌、 毛螺旋菌科细菌(诸如Lb MA2020、Lb NK4A179、Lb NK4A144)、嗜胺梭菌(诸如Ca DSM10710)、鸡肉杆菌(诸如Cg DSM 4847)、丙酸泥沼杆菌(诸如Pp WB4)、威氏李斯特氏菌(诸如Lw FSL R9-0317)、李斯特氏菌科细菌(诸如Lb FSL M6-0635)、韦德纤毛菌(诸如LwF0279)、荚膜红杆菌(诸如Rc SB 1003、Rc R121、Rc DE442)、口腔纤毛菌(诸如Lb C-1013-b)、 解半纤维素赫氏菌、真杆菌科细菌(诸如Eb CHKCI004)、布劳特氏菌属马塞尔-P2398、纤毛 菌属口腔分类群879str.F0557、聚集绿曲菌、橙红去甲醌菌、深海螺旋菌属TSL5-1、假丁 酸弧菌属OR37、丁酸弧菌属YAB3001、纤毛菌属马塞尔-P3007、爱华拟杆菌、紫单孢菌科细菌(诸如Pb KH3CP3RA)、沙燕李斯特菌或陌生非适应螺旋菌。
在某些实施方案中,所述Cas13是Cas13b,并且来源于另枝菌属、拟杆菌属、拟杆菌门、伯格氏菌属、嗜二氧化碳嗜纤维菌属、金黄杆菌属、黄杆菌属、香味菌属、泥沼杆菌属、褐指藻杆菌属、卟啉单胞菌属、普雷沃氏菌属、冷弯菌属、赖兴巴赫氏菌属、里默氏杆菌属或中华微杆菌属。
在某些实施方案中,所述Cas13是Cas13b,并且来源于另枝菌属ZOR0009、酿脓拟杆菌(诸如Bp F0041)、拟杆菌门细菌(诸如Bb GWA2_31_9)、动物溃疡伯格氏菌(诸如Bz ATCC43767)、犬嗜二氧化碳嗜纤维菌、犬咬嗜二氧化碳嗜纤维菌、犬金黄杆菌、济州岛金黄杆菌、嗜鳃黄杆菌、嗜分支黄杆菌、柱状黄杆菌、黄杆菌属316、香味类香味菌(诸如Mo CCUG10230、Mo CCUG 12901、Mo CCUG 3837)、丙酸泥沼杆菌、橙黄褐指藻杆菌、牙龈卟啉单 胞菌(诸如Pg F0185、Pg F0568、Pg JCVI SC001、Pg W4087、咽喉卟啉单胞菌、卟啉单胞菌 属COT-052OH4946、橙红普雷沃氏菌、口腔普雷沃氏菌(诸如Pb ATCC 33574)、斐氏普雷 沃氏菌、中间普雷沃氏菌(诸如Pi 17、Pi ZT)、苍白普雷沃菌(诸如Pp ATCC 700821)、胸膜 炎普雷沃菌、解糖普雷沃氏菌(诸如Ps F0055)、普雷沃氏菌属MA2016、普雷沃氏菌属MSX73、 普雷沃氏菌属P4-76、普雷沃氏菌属P5-119、普雷沃氏菌属P5-125、普雷沃氏菌属P5-60、 青蓝色冷弯菌、噬琼脂赖兴巴赫氏菌、鸭疫里默氏杆菌、或海洋中华微杆菌。在一些实施例 中,所述Cas13是鸭疫里默氏杆菌Cas13b。在一些实施例中,所述Cas13是死鸭疫里默氏 杆菌Cas13。在一些实施例中,所述Cas13是普雷沃氏菌属P5-125。在一些实施例中,所述 Cas13是死普雷沃氏菌属P5-125。
在某些实施方案中,所述Cas13是Cas13c,并且来源于梭杆菌属或厌氧嗜盐杆菌属的 物种。
在某些实施方案中,所述Cas13是Cas13c,并且来源于坏死梭杆菌(诸如Fn基形亚种 ATCC 51357、Fn DJ-2、Fn BFTR-1、Fn基形亚种)、产气梭杆菌(诸如Fp ATCC 29250)、溃疡梭杆菌(诸如Fu ATCC 49185)或厌氧嗜盐杆菌属ND1。
在某些实施方案中,所述Cas13是Cas13d,并且来源于真杆菌属或瘤胃球菌属的物种。
在某些实施方案中,所述Cas13是Cas13d,并且来源于惰性真杆菌、黄色瘤胃球菌(诸 如Rfx XPD3002)或白色瘤胃球菌。
在某些示例性实施方案中,所选直系同源物在较高温度下可能更热稳定。举例来说,所 述直系同源物在32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、 57℃、58℃、59℃、60℃、61℃、62℃、63℃、64℃、65℃、66℃、67℃、68℃、69℃、70℃、 71℃、72℃或以上可能是热稳定的。在某些示例性实施方案中,所述直系同源物在55℃或 以上是热稳定的。在某些示例性实施方案中,所述直系同源物是Cas13a、Cas13b、Cas13c 或Cas13d。在某些示例性实施方案中,所述直系同源物是Cas13直系同源物。在某些示例 性实施方案中,所述Cas13a直系同源物来源于解半纤维素赫氏菌。在某些示例性实施方案 中,所述Cas13a直系同源物来源于解半纤维素赫氏菌DSM 29228。在某些示例性实施方案 中,所述Cas 13直系同源物由国际公开号WO 2017/219027的SEQ ID NO:1或SEQ ID NO: 75定义。在某些示例性实施方案中,所述Cas 13直系同源物由图1A的序列(基因座 QNRW01000010.1、OWPA01000389.1、0153798_10014618、0153978_10005171和 0153798_10004687)定义。在某些示例性实施方案中,所述Cas 13a直系同源物由核酸序列 0123519_10037894或0J26742_10014101编码。在某些其他示例性实施方案中,所述Cas13 直系同源物与国际公开号WO2017/219027的SEQ ID NO:1或SEQ ID NO:75具有至少80% 序列同一性。在某些其他示例性实施方案中,所述Cas13直系同源物与图1A的序列(基因座 QNRW01000010.1、OWPA01000389.1、0153798_10014618、0153978_10005171和 0153798_10004687)具有至少80%序列同一性。在某些其他示例性实施方案中,所述Cas13 直系同源物与由核酸序列0123519_10037894或0J26742_10014101编码的多肽具有至少80% 序列同一性。在某些示例性实施方案中,所述Cas13直系同源物具有至少一个HEPN结构 域并且与国际公开号WO2017/219027的SEQ ID NO:1或SEQ ID NO:75具有至少80%同 一性。在某些示例性实施方案中,所述Cas13直系同源物具有至少一个HEPN结构域并且 与图1A的序列(基因座QNRW01000010.1、OWPA01000389.1、0153798_10014618、 0153978_10005171和0153798_10004687)具有至少80%同一性。在某些示例性实施方案中, 所述Cas13直系同源物具有至少一个HEPN结构域并且与由SEQ ID NO 1-4092、4102-5203 和5260-5265中任一个的核酸序列编码的多肽具有至少80%同一性。在另一个示例性实施方 案中,所述Cas13直系同源物具有至少两个HEPN结构域并且与国际公开号WO 2017/219027 的SEQ ID NO:1或SEQ IDNO:75具有至少80%同一性。在另一个示例性实施方案中,所 述Cas13直系同源物具有至少两个HEPN结构域并且与图1A的序列(基因座 QNRW01000010.1、OWPA01000389.1、0153798_10014618、0153978_10005171和 0153798_10004687)具有至少80%同一性。图1A的Cas13a热稳定蛋白是从稳定的厌氧嗜热 产甲烷微生物组发酵柳枝稷鉴定,从而支持它们的热稳定性。参见Liang等,Biotechnol Biofuels 2018;11:243doi:10.1186/s13068-018-1238-1。类似地,所述0J26742_10014101与图 1A中详述的已验证嗜热来源的Cas13a序列聚簇。在基因座123519_10037894鉴定的核酸是 从一项针对70℃生物体的研究鉴定。在某些示例性实施方案中,所述Cas13直系同源物具 有至少两个HEPN结构域并且与由核酸序列0123519_10037894或0J26742_10014101编码的 多肽具有至少80%同一性。因此,本领域普通技术人员可以使用以上鉴定的直系同源物的 特性从本文公开的那些中选择其他合适的热稳定直系同源物。
在一些实施方案中,本发明提供了编码所述Cas13效应蛋白的分离的核酸。在本发明的 一些实施方案中,所述分离的核酸包含DNA序列,而且还包含编码crRNA的序列。本发明 提供了一种包含编码所述Cas13效应蛋白的核酸的分离的真核细胞。因此,在本文中,“Cas13 效应蛋白”或“效应蛋白”或“Cas”或“Cas蛋白”或“RNA靶向性效应蛋白”或“RNA靶向蛋白” 或类似表述应当理解为包括Cas13a、Cas13b、Cas13c或Cas13d;诸如“RNA靶向CRISPR系统”等表述应当理解为包括Cas13a、Cas13b、Cas13c或Cas13d CRISPR系统;并且对向导RNA或sgRNA的引用应当结合本文对Cas13系统crRNA的讨论来理解,例如,在其他系 统中是sgRNA的可以被视为或近乎于本发明中的crRNA。
在一些实施方案中,本发明提供了一种鉴定对本发明的Cas13效应蛋白合适的向导序列 的要求的方法,所述方法包括:(a)选择生物体内的一组必需基因,(b)设计能够与这些基因 的编码区以及这些基因的5'和3'UTR区域杂交的靶向性向导序列文库,(c)产生不与所述生 物体基因组内的任何区域杂交的随机向导序列作为对照向导,(d)制备包含RNA靶向蛋白和 第一抗性基因的质粒以及包含所述靶向性向导文库和所述对照向导和第二抗性基因的向导 质粒文库,(e)将所述质粒共引入宿主细胞中,(f)将所述宿主细胞引入所述第一抗性基因和 所述第二抗性基因的选择培养基上,(g)对生长宿主细胞的必需基因进行测序,(h)通过比较 具有对照向导的细胞的消耗来确定用靶向性向导转化的细胞消耗的显著性;以及(i)基于消耗 的向导序列确定合适的向导序列的要求。
在一个方面,确定RNA靶向性蛋白的合适的向导序列的PFS序列是通过比较消耗细胞 中的向导靶向的序列来进行。在这种方法的一个方面,所述方法还包括比较不同重复实验中 不同条件的向导丰度。在这种方法的一个方面,选择对照向导是因为据测定它们在重复实验 中在向导消耗方面示出了有限的偏差。在这种方法的一个方面,消耗的显著性确定为(a)消 耗超过了最大消耗的对照向导;或(b)消耗超过了平均消耗加上对照向导标准偏差的两倍。 在这种方法的一个方面,所述宿主细胞是细菌宿主细胞。在这种方法的一个方面,所述共引 入质粒的步骤是通过电穿孔并且所述宿主细胞是电感受态宿主细胞。
在一些实施方案中,本发明提供了一种修饰与目标靶基因座相关或目标靶基因座处的序 列的方法,所述方法包括向所述基因座递送包含Cas13效应蛋白和一种或多种核酸组分的非 天然存在或工程改造的组合物,其中所述效应蛋白与所述一种或多种核酸组分形成了复合 物,并且在所述复合物与所述目标基因座结合后,所述效应蛋白诱导了对与所述目标靶基因 座相关或在所述目标靶基因座处的序列的修饰。在一个优选实施方案中,所述修饰是引入链 断裂。在一个优选实施方案中,与目标靶基因座相关或在目标靶基因座处的序列包含RNA 或由RNA组成。
在一些实施方案中,本发明提供了一种修饰与目标靶基因座相关或目标靶基因座处的序 列的方法,所述方法包括向所述基因座递送包含Cas13效应蛋白、可选小辅助蛋白和一种或 多种核酸组分的非天然存在或工程改造的组合物,其中所述效应蛋白与所述一种或多种核酸 组分形成了复合物,并且在所述复合物与所述目标基因座结合后,所述效应蛋白诱导了对与 所述目标靶基因座相关或在所述目标靶基因座处的序列的修饰。在一个优选实施方案中,所 述修饰是引入链断裂。在一个优选实施方案中,与目标靶基因座相关或在目标靶基因座处的 序列包含RNA或由RNA组成。
在一些实施方案中,本发明提供了一种修饰与目标靶基因座相关或在目标靶基因座处的 序列的方法,所述方法包括向与所述基因座相关或在所述基因座处的所述序列递送包含 Cas13基因座效应蛋白和一种或多种核酸组分的非天然存在或工程改造的组合物,其中所述 Cas13效应蛋白与所述一种或多种核酸组分形成了复合物,并且在所述复合物与所述目标基 因座结合后,所述效应蛋白诱导了对与所述目标靶基因座相关或在所述目标靶基因座处的序 列的修饰。在一个优选实施方案中,所述修饰是引入链断裂。在一个优选实施方案中,所述 Cas13效应蛋白与一种核酸组分形成复合物;有利地为工程改造的或非天然存在的核酸组 分。诱导对与目标靶基因座相关或在目标靶基因座处的序列的修饰可以是Cas13效应蛋白- 核酸引导的。在一个优选实施方案中,所述一种核酸组分是CRISPRRNA(crRNA)。在一个 优选实施方案中,所述一种核酸组分是成熟crRNA或向导RNA,其中所述成熟crRNA或 向导RNA包含间隔子序列(或向导序列)和顺向重复(DR)序列或其衍生物。在一个优选实施 方案中,所述间隔子序列或其衍生物包含种子序列,其中所述种子序列对于对所述靶基因座 处的序列的识别和/或杂交是关键的。在本发明的一个优选实施方案中,所述crRNA是可以 与短DR序列相关的短crRNA。在本发明的另一个实施方案中,所述crRNA是可以与长DR 序列(或双DR)相关的长crRNA。本发明的多个方面涉及具有一种或多种非天然存在或工程 改造的或修饰的或优化的核酸组分的Cas13效应蛋白复合物。在一个优选实施方案中,所述 核酸组分包括RNA。在一个优选实施方案中,所述复合物的核酸组分可以包含与顺向重复 序列连接的向导序列,其中所述顺向重复序列包含一个或多个茎环或优化二级结构。在本发 明的优选实施方案中,所述顺向重复序列可以是短DR或长DR(双DR)。在一个优选实施方 案中,可以修饰所述顺向重复序列以包含一个或多个蛋白质结合RNA适体。在一个优选实 施方案中,可以包括一个或多个适体,诸如优化二级结构的一部分。此类适体可能能够结合 噬菌体外壳蛋白。所述噬菌体外壳蛋白可以选自包括Qβ、F2、GA、fr、JP501、MS2、M12、 R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、 AP205、
Figure BDA0003651481360000441
7s和PRR1的组。在一个优选实施方案中,所述噬菌体外壳蛋白是MS2。本发明还提供了长度为30个或更多个、40个或更多个或者50个 或更多个核苷酸的复合物的核酸组分。
在一些实施方案中,本发明提供了对与目标靶基因座相关或在目标靶基因座处的序列进 行基因组编辑或修饰的方法,其中所述方法包括将Cas13复合物引入任何所需的细胞类型、 原核或真核细胞中,由此,所述Cas13效应蛋白复合物有效地起作用以干扰所述真核或原核 细胞中的RNA。在优选的实施方案中,所述细胞是真核细胞并且所述RNA是从哺乳动物基 因组转录或存在于哺乳动物细胞中。在人类细胞中进行RNA编辑或基因组编辑的优选方法 中,所述Cas13效应蛋白可以包括但不限于本文公开的特定物种的Cas13效应蛋白。
在一些实施方案中,本发明还提供了一种修饰目标靶基因座的方法,所述方法包括向所 述基因座递送包含Cas13效应蛋白和一种或多种核酸组分的非天然存在或工程改造的组合 物,其中所述Cas13效应蛋白与所述一种或多种核酸组分形成了复合物,并且在所述复合物 与所述目标基因座结合后,所述效应蛋白诱导了对所述目标靶基因座的修饰。在一个优选实 施方案中,所述修饰是引入链断裂。
在这样的方法中,所述目标靶基因座可以包含在RNA分子内。在这样的方法中,所述 目标靶基因座可以包含在体外RNA分子中。
在这样的方法中,所述目标靶基因座可以包含在细胞内的RNA分子中。所述细胞可以 是原核细胞或真核细胞。所述细胞可以是哺乳动物细胞。通过本发明引入所述细胞的修饰可 以改变所述细胞和所述细胞的后代以提高生物产品如抗体、淀粉、醇或其它所需细胞产出物 的产量。通过本发明引入所述细胞的修饰可以使得所述细胞和所述细胞的后代包括改变所产 生的生物产物的变化。
哺乳动物细胞可以是非人类哺乳动物,例如灵长类动物、牛科动物、羊科动物、猪科动 物、犬科动物、啮齿动物、兔科动物,诸如猴、奶牛、绵羊、猪、狗、兔、大鼠或小鼠细胞。所述细胞可以是非哺乳动物真核细胞,诸如家禽类(例如鸡)、脊椎鱼类(例如鲑鱼)或贝虾类 (例如牡蛎、蛤蜊、龙虾、虾)细胞。所述细胞还可以是植物细胞。所述植物细胞可以属于单 子叶植物或双子叶植物或作物或谷类植物,诸如木薯、玉米、高粱、大豆、小麦、燕麦或水稻。所述植物细胞还可以属于藻类、树木或生产植物、果实或蔬菜(例如,树木,诸如柑橘 属果树,例如柑橘、葡萄柚或柠檬树;桃或油桃树;苹果或梨树;坚果树,诸如巴旦杏或胡 桃或阿月浑子树;茄科植物;芸苔属植物;莴苣属植物;菠菜属植物;辣椒属植物;棉花、 烟草、芦笋、胡萝卜、甘蓝、茎椰菜、花椰菜、番茄、茄子、辣椒、莴苣、菠菜、草莓、蓝 莓、覆盆子、黑莓、葡萄、咖啡、可可)。
在一些实施方案中,本发明提供了一种修饰目标靶基因座的方法,所述方法包括向所述 基因座递送包含Cas13效应蛋白和一种或多种核酸组分的非天然存在或工程改造的组合物, 其中所述效应蛋白与所述一种或多种核酸组分形成了复合物,并且在所述复合物与所述目标 基因座结合后,所述效应蛋白诱导了对所述目标靶基因座的修饰。在一个优选实施方案中, 所述修饰是引入链断裂。
在这样的方法中,所述目标靶基因座可以包含在RNA分子内。在一个优选实施方案中, 所述目标靶基因座包含RNA或由RNA组成。
在一些实施方案中,本发明还提供了一种修饰目标靶基因座的方法,所述方法包括向所 述基因座递送包含Cas13效应蛋白和一种或多种核酸组分的非天然存在或工程改造的组合 物,其中所述Cas13效应蛋白与所述一种或多种核酸组分形成了复合物,并且在所述复合物 与所述目标基因座结合后,所述效应蛋白诱导了对所述目标靶基因座的修饰。在一个优选实 施方案中,所述修饰是引入链断裂。
在这样的方法中,所述目标靶基因座可以包含在体外RNA分子中。在这样的方法中, 所述目标靶基因座可以包含在细胞内的RNA分子中。所述细胞可以是原核细胞或真核细胞。 所述细胞可以是哺乳动物细胞。所述细胞可以是啮齿动物细胞。所述细胞可以是小鼠细胞。
在任一种所述方法中,所述目标靶基因座可以是目标基因组或表观基因组基因座。在所 述方法中的任一种中,所述复合物可以与多个向导一起递送用于多路复用。在所述方法中的 任一种中,可以使用超过一种蛋白质。
在本发明的其他方面,所述核酸组分可以包含CRISPR RNA(crRNA)序列。由于所述效 应蛋白是Cas13效应蛋白,所述核酸组分可以包含CRISPR RNA(crRNA)序列并且通常可以 不包含任何反式激活crRNA(tracr RNA)序列。
在任一种所述方法中,所述效应蛋白和核酸组分可以通过编码所述蛋白和/或核酸组分 的一个或多个多核苷酸分子提供,并且其中所述一个或多个多核苷酸分子经可操作地配置以 表达所述蛋白和/或所述核酸组分。所述一个或多个多核苷酸分子可以包含一个或多个调控 元件,所述一个或多个调控元件经可操作地配置以表达所述蛋白和/或所述核酸组分。所述 一个或多个多核苷酸分子可以包含在一个或多个载体内。在任一种所述方法中,所述目标靶 基因座可以是目标基因组、表观基因组或转录组基因座。在所述方法中的任一种中,所述复 合物可以与多个向导一起递送用于多路复用。在所述方法中的任一种中,可以使用超过一种 蛋白质。
在所述方法中的任一种中,所述链断裂可以是单链断裂或双链断裂。在优选实施方案中, 所述双链断裂可以指RNA的两个部分的断裂,诸如当单链RNA分子折叠到自身上时形成 的RNA的两个部分或者与含有允许部分RNA折叠并与自身配对的自身互补序列的RNA分 子形成的推定双螺旋体。
调控元件可以包含诱导型启动子。多核苷酸和/或载体系统可以包括诱导型系统。
在任一种所述方法中,所述一个或多个多核苷酸分子可以包含在递送系统中,或者所述 一个或多个载体可以包含在递送系统中。
在任一种所述方法中,所述非天然存在或工程改造的组合物可以通过脂质体、颗粒(包 括纳米颗粒)、外来体、微泡、基因枪或者一个或多个病毒载体来递送。
在一些实施方案中,本发明还提供了一种非天然存在或工程改造的组合物,所述组合物 是具有如本文讨论的或任一种本文所述方法中定义的特征的组合物。
在某些实施方案中,本发明因此提供了一种非天然存在或工程改造的组合物,诸如特别 是能够或经配置以修饰目标靶基因座的组合物,所述组合物包含Cas13效应蛋白和一种或多 种核酸组分,其中所述效应蛋白与所述一种或多种核酸组分形成复合物,并且在所述复合物 与所述目标基因座结合后,所述效应蛋白诱导了对所述目标靶基因座的修饰。在某些实施方 案中,所述效应蛋白可以是Cas13a、Cas13b、Cas13c或Cas13d效应蛋白、Cas13b效应蛋 白。
在某些实施方案中,本发明还在另一方面提供了一种非天然存在或工程改造的组合物, 诸如特别是能够或经配置以修饰目标靶基因座的组合物,所述组合物包含:(a)向导RNA分 子(或向导RNA分子的组合,例如第一向导RNA分子和第二向导RNA分子)或编码所述向 导RNA分子的核酸(或编码向导RNA分子组合的一种或多种核酸);(b)Cas13蛋白。在某些实施方案中,所述效应蛋白可以是Cas13b蛋白。
在一些实施方案中,本发明还在另一方面提供了一种非天然存在或工程改造的组合物, 所述组合物包含:(I.)一个或多个CRISPR-Cas系统多核苷酸序列,其包含(a)能够与多核苷 酸基因座中的靶序列杂交的向导序列,(b)tracr配偶(即顺向重复)序列,和(II.)编码Cas13效 应蛋白的第二多核苷酸序列,其中当转录时,所述向导序列指导CRISPR复合物与靶序列的 序列特异性结合,并且其中所述CRISPR复合物包含所述Cas13效应蛋白与跟所述靶序列杂 交的所述向导序列的复合物。在某些实施方案中,所述效应蛋白可以是Cas13蛋白。
在某些实施方案中,可能不需要tracrRNA。因此,本发明还在某些实施方案中提供了 一种非天然存在或工程改造的组合物,所述组合物包含:(I.)一个或多个CRISPR-Cas系统多 核苷酸序列,其包含(a)能够与多核苷酸基因座中的靶序列杂交的向导序列,和(b)顺向重复 序列,和(II.)编码Cas13效应蛋白的第二多核苷酸序列,其中当转录时,所述向导序列指导 CRISPR复合物与所述靶序列的序列特异性结合,并且其中所述CRISPR复合物包含所述 Cas13效应蛋白与(1)跟所述靶序列杂交的所述向导序列和(2)所述顺向重复序列的复合物。 优选地,所述效应蛋白可以是Cas13效应蛋白。非限制性地,诸位申请人假设在这种情况下, 所述顺向重复序列可以包含足以将crRNA负载到所述效应蛋白上的二级结构。通过示例而 非限制的方式,此类二级结构可以包含所述顺向重复序列内的茎环(诸如一个或多个茎环)、 基本上由其组成或由其组成。
在一些实施方案中,本发明还提供了一种载体系统,所述载体系统包含一个或多个载体, 所述一个或多个载体包含一个或多个多核苷酸分子,所述一个或多个多核苷酸分子编码非天 然存在或工程改造的组合物的组分,所述组合物是具有如任一种本文所述方法中定义的特征 的组合物。
在一些实施方案中,本发明还提供了一种递送系统,所述递送系统包含一个或多个载体 或者一个或多个多核苷酸分子,所述一个或多个载体或多核苷酸分子包含编码非天然存在或 工程改造的组合物的组分的一个或多个多核苷酸分子,所述组合物是具有本文讨论的或如任 一种本文所述方法中定义的特征的组合物。
在一些实施方案中,本发明还提供了一种非天然存在或工程改造的组合物,或者编码所 述组合物的组分的一种或多种多核苷酸,或者包含编码所述组合物的组分的一种或多种多核 苷酸的载体或递送系统,以用于治疗性治疗方法。所述治疗性治疗方法可以包括基因或基因 组编辑,或基因疗法。
在一些实施方案中,本发明还提供了诸多方法和组合物,其中所述效应蛋白的一个或多 个氨基酸残基可能经过修饰,例如工程改造的或非天然存在的Cas13效应蛋白,或者包含 SEQ ID NO 1-4092、4102-5203和5260-5265的蛋白质或由其组成或基本上由其组成。在一 个实施方案中,所述修饰可以包括效应蛋白的一个或多个氨基酸残基的突变。所述一个或多 个突变可以在所述效应蛋白的一个或多个催化活性结构域中。与缺乏所述一个或多个突变的 效应蛋白相比,所述效应蛋白可能具有降低或消除的核酸酶活性。所述效应蛋白可能不指导 对所述目标靶基因座处的一个RNA链的切割。在一个优选实施方案中,所述一个或多个突 变可以包括两个突变。在一个优选实施方案中,所述Cas13效应蛋白,例如工程改造的或非 天然存在的Cas13效应蛋白中的一个或多个氨基酸残基经过修饰。在本发明的某些实施方案 中,所述效应蛋白包含一个或多个HEPN结构域。在一个优选实施方案中,所述效应蛋白 包含两个HEPN结构域。在另一个优选实施方案中,所述效应蛋白包含处于所述蛋白C末 端的一个HEPN结构域和处于其N末端的另一个HEPN结构域。在某些实施方案中,所述 一个或多个突变或者所述两个或更多个突变可以在包含HEPN结构域的效应蛋白的催化活 性结构域或与HEPN结构域同源的催化活性结构域中。在某些实施方案中,所述效应蛋白 包含以下突变中的一个或多个:R116A、H121A、R1177A、H1182A(其中氨基酸位置对应 于来源于动物溃疡伯格氏菌ATCC 43767的第29组蛋白的氨基酸位置)。技术人员应当理解, 不同Cas13蛋白中的相应氨基酸位置可以突变以实现相同效果。在某些实施方案中,一个或 多个突变完全或部分消除了蛋白质的催化活性(例如改变切割速率、改变特异性等)。在某些 实施方案中,本文所述的效应蛋白是“死”效应蛋白,诸如死Cas13效应蛋白(dCas13)。在某 些实施方案中,所述效应蛋白在HEPN结构域1中具有一个或多个突变。在某些实施方案 中,所述效应蛋白在HEPN结构域2中具有一个或多个突变。在某些实施方案中,所述效 应蛋白在HEPN结构域1和HEPN结构域2中具有一个或多个突变。
在一些实施方案中,在某些实施方案中,本文的Cas13效应蛋白可以与包含30至40bp 长、更通常34至38bp长、甚至更通常36至37bp长,例如30、31、32、33、34、35、36、 37、38、39或40bp长的短CRISPR重复序列的基因座相关。在某些实施方案中,所述CRISPR 重复序列是80至350bp长,诸如80至200bp长,甚至更通常86至88bp长,例如80、81、82、83、84、85、86、87、88、89或90bp长的长或双重复序列。
在某些实施方案中,原间隔子侧翼位点(PFS)或原间隔物相邻基序(PAM)或PAM样基序 指导如本文公开的所述效应蛋白(例如Cas13效应蛋白)复合物与所述目标靶基因座结合。在 一些实施方案中,所述PFS可以是5'PFS(即,位于所述原间隔子5'端上游)。在其他实施方 案中,所述PFS可以是3'PFS(即,位于所述原间隔子5'端下游)。在其他实施方案中,需要 5'PFS和3'PFS二者。在本发明的某些实施方案中,可能不需要PFS或PFS样基序来指导所 述效应蛋白(例如Cas13效应蛋白)的结合。在某些实施方案中,5'PFS是D(例如A、G或U)。在某些实施方案中,Cas13效应子的5'v是D。在本发明的某些实施方案中,在重复序 列处切割可以产生含有通过5'端的短核苷酸(例如在它是双重复序列时,5、6、7、8、9或 10nt或更长)重复序列(这可以称为crRNA“标签”)和3'端的其余重复序列侧接的完全间隔子 序列的crRNA(例如短或长crRNA)。在某些实施方案中,通过本文所述的效应蛋白靶向可 能需要crRNA标签和靶5'侧翼序列之间缺乏同源性。此要求可能类似于Samai等, “Co-transcriptional DNA and RNA Cleavage during Type III CRISPR-Cas Immunity”Cell161, 1164-1174,2015年5月21日中进一步描述的要求,其中认为所述要求区分了入侵核酸与 CRISPR阵列本身的真正靶标,并且其中存在重复序列将会导致与crRNA标签完全同源并防止自身免疫。
在某些实施方案中,Cas13效应蛋白经过工程改造并且可以包含降低或消除核酸酶活性 的一个或多个突变,从而降低或消除RNA干扰活性。突变还可以在相邻残基处,例如在参 与核酸酶活性的那些氨基酸附近的氨基酸处进行。在一些实施方案中,一个或多个推定催化 性核酸酶结构域失活,并且所述效应蛋白复合物缺乏切割活性并且作为RNA结合复合物起 作用。在一个优选实施方案中,所得RNA结合复合物可以与如本文所述的一个或多个功能 域连接。
在本发明的某些实施方案中,所述向导RNA或成熟crRNA包含顺向重复序列和向导序 列或间隔子序列,基本上由其组成或由其组成。在某些实施方案中,所述向导RNA或成熟crRNA包含与向导序列或间隔子序列连接的顺向重复序列,基本上由其组成或由其组成。在本发明的优选实施方案中,所述成熟crRNA包含茎环或优化的茎环结构或优化的二级结构。在本发明的优选实施方案中,所述成熟crRNA在所述正向重复序列中包含茎环或优化的茎环结构,其中所述茎环或优化的茎环结构对切割活性来说是重要的。在某些实施方案中, 所述成熟crRNA优选地包含单个茎环。在某些实施方案中,所述顺向重复序列优选地包含 单个茎环。在某些实施方案中,通过引入影响茎环RNA双链体结构的突变来修饰所述效应 蛋白复合物的切割活性。在优选的实施方案中,可以引入维持所述茎环的RNA双链体的突 变,由此维持效应蛋白复合物的切割活性。在其他优选实施方案中,可以引入破坏所述茎环 的RNA双链体结构的突变,由此完全消除效应蛋白复合物的切割活性。
如本文提供的CRISPR系统可以利用crRNA或包含向导序列的类似多核苷酸,其中所 述多核苷酸是RNA、DNA或RNA和DNA的混合物,和/或其中所述多核苷酸包含一种或 多种核苷酸类似物。所述序列可以包含任何结构,包括但不限于天然crRNA的结构,例如 凸起、发夹或茎环结构。在某些实施方案中,包含向导序列的多核苷酸与可以是RNA或 DNA序列的第二多核苷酸序列形成了双链体。
本公开还提供了包含工程改造的CRISPR-Cas蛋白、CRISPR-Cas系统、编码所述CRISPR-Cas系统的一种或多种组分的多核苷酸和/或包含所述多核苷酸的载体的细胞、组织、生物体。本发明还提供了编码效应蛋白的核苷酸序列,所述核苷酸序列经密码子优化以便在任一种本文所述的方法或组合物中在真核生物或真核细胞中表达。在本发明的一个实施 方案中,所述密码子优化的效应蛋白是本文讨论的任何Cas13效应蛋白,并且针对在真核细 胞或生物体,例如,如本文在别处提到的此类细胞或生物体,例如但不限于酵母细胞或哺乳 动物细胞或生物体,包括小鼠细胞、大鼠细胞和人类细胞或非人类真核生物体,例如植物中 的可操作性进行了密码子优化。
在另一方面,本发明提供了一种真核细胞,其包含修饰的目标靶基因座,其中所述目标 靶基因座已经根据任一种本文所述的方法进行了修饰。另一方面提供了所述细胞的细胞系。 另一方面提供了一种包含一个或多个所述细胞的多细胞生物体。
在某些实施方案中,修饰所述目标靶基因座可以导致:所述真核细胞包含至少一种基因 产物的改变的表达;所述真核细胞包含至少一种基因产物的改变的表达,其中所述至少一种 基因产物的表达有所增加;所述真核细胞包含至少一种基因产物的改变的表达,其中所述至 少一种基因产物的表达有所降低;或所述真核细胞包含编辑的基因组。
在某些实施方案中,所述真核细胞可以是哺乳动物细胞或人类细胞。
在其他实施方案中,本说明书所述的非天然存在或工程改造的组合物、载体系统或递送 系统可用于:位点特异性基因敲除;位点特异性基因组编辑;RNA序列特异性干扰;或多 路基因组工程改造。
还提供了来自如本文所述的细胞、细胞系或生物体的基因产物。在某些实施方案中,表 达的基因产物的量可以大于或小于来自不存在改变的表达或编辑的基因组的细胞的基因产 物的量。在某些实施方案中,所述基因产物与来自不存在改变的表达或编辑的基因组的细胞 的基因产物相比可能有所改变。
在另一方面,本发明提供了一种鉴定新颖核酸修饰效应子的方法,所述方法包括:从编 码推定核酸修饰酶基因座的一组核酸序列中鉴定出推定核酸修饰基因座,所述推定核酸修饰 酶基因座在所述基因座的保守基因组元件的限定范围内,包含至少一种超过限定大小限制的 蛋白质,或两者兼有;将鉴定的推定核酸修饰基因座分组为包含同源蛋白质的亚组;基于以 下一项或多项,通过从一个或多个亚组选择核酸修饰基因座来鉴定最终的一组候选核酸修饰 基因座:包含相对于其他亚组中的基因座具有与已知蛋白质结构域存在低结构域同源性匹配 的推定效应蛋白的基因座的亚组;包含相对于其他亚组中的基因座与保守基因组元件具有最 小距离的推定蛋白质的亚组;具有包含相对于其他亚组中的大效应蛋白与推定相邻辅助蛋白 具有相同取向的大效应蛋白的基因座的亚组;包含相对于其他基因座具有较低现有核酸修饰 分类的推定效应蛋白的亚组;包含相对于其他基因座与已知核酸修饰基因座具有较低接近度 的基因座的亚组;以及各个亚组中的候选基因座的总数。
在一个实施方案中,该组核酸序列获自基因组或宏基因组数据库,诸如包含原核基因组 或宏基因组序列的基因组或宏基因组数据库。
在一个实施方案中,距保守基因组元件的限定距离在1kb和25kb之间。
在一个实施方案中,所述保守基因组元件包含重复元件,诸如CRISPR阵列。在一个具 体实施方案中,距所述保守基因组元件的限定距离在CRISPR阵列的10kb以内。
在一个实施方案中,所述推定核酸修饰(效应子)基因座内包含的蛋白质的限定大小限制 大于200个氨基酸,或更具体来说,所述限定大小限制大于700个氨基酸。在一个实施方案 中,所述推定核酸修饰基因座在900至1800个氨基酸之间。
在一个实施方案中,使用一组核酸的重复或模式发现分析来鉴定保守基因组元件,诸如 PILER-CR。
在一个实施方案中,本文所述的方法的分组步骤至少部分基于结构域同源性搜索或 HHpred蛋白质结构域同源性搜索的结果。
在一个实施方案中,限定阈值是BLAST最近邻截止值0至1e-7。
在一个实施方案中,本文所述的方法还包括过滤步骤,该步骤仅包括具有900至1800 个氨基酸的推定蛋白质的基因座。
在一个实施方案中,本文所述的方法还包括对候选核酸修饰效应子的核酸修饰功能进行 实验验证,包括产生编码所述核酸修饰效应子的一组核酸构建体并进行一种或多种生化验证 测定,诸如通过使用细菌菌落中PFS验证、体外切割测定、Surveyor方法、哺乳动物细胞 实验、PFS验证或其组合。
在一个实施方案中,本文所述的方法还包括制备非天然存在或工程改造的组合物,所述 组合物包含来自所鉴定的核酸修饰基因座的一种或多种蛋白质。
在一个实施方案中,所鉴定的基因座包含2类CRISPR效应子,或所鉴定的基因座缺乏 Cas1或Cas2,或所鉴定的基因座包含单个效应子。
在一个实施方案中,所述单个大效应蛋白长度大于900或大于1100个氨基酸,或包含 至少一个HEPN结构域。
在一个实施方案中,所述至少一个HEPN结构域靠近所述效应蛋白的N或C末端,或位于效应蛋白的内部位置。
在一个实施方案中,所述单个大效应蛋白包含在所述蛋白质N末端和C末端的一个HEPN结构域和在其内部的两个HEPN结构域。
在一个实施方案中,所鉴定的基因座还包含在CRISPR阵列2kb至10kb内的一种或两 种小推定辅助蛋白。
在一个实施方案中,小辅助蛋白小于700个氨基酸。在一个实施方案中,所述小辅助蛋 白长度为50至300个氨基酸。
在一个实施方案中,所述小辅助蛋白包含多个预测跨膜域,或包含四个预测跨膜域,或 包含至少一个HEPN结构域。
在一个实施方案中,所述小辅助蛋白包含至少一个HEPN结构域和至少一个跨膜域。
在一个实施方案中,所述基因座不包含距CRISPR阵列25kb以外的额外蛋白质。
在一个实施方案中,所述CRISPR阵列包含长度为约36个核苷酸的顺向重复序列。在 一个具体实施方案中,所述顺向重复序列在5'端包含与3'端的CAAC反向互补的 GTTG/GUUG。
在一个实施方案中,所述CRISPR阵列包含长度为约30个核苷酸的间隔子序列。
在一个实施方案中,所鉴定的基因座缺乏小辅助蛋白。
本发明提供了一种鉴定新颖CRISPR效应子的方法,包括:a)鉴定编码CRISPR阵列的 基因组或宏基因组数据库中的序列;b)在CRISPR阵列10kb内的所述选定序列中鉴定一个 或多个开放阅读框(ORF);c)基于大小在900至1800个氨基酸之间的推定CRISPR效应蛋白 的存在选择基因座,d)选择编码50至300个氨基酸的推定辅助蛋白的基因座;和e)鉴定编 码推定CRISPR效应子和CRISPR辅助蛋白的基因座,并任选地基于结构分析对它们进行分 类。
在一个实施方案中,所述CRISPR效应子是VI型CRISPR效应子。在一个实施方案中,步骤(a)包括i)将基因组和/或宏基因组数据库中的序列与至少一个预先鉴定的编码CRISPR 阵列的种子序列进行比较,并选择包含所述种子序列的序列;或ii)基于CRISPR算法鉴定 CRISPR阵列。
在一个实施方案中,步骤(d)包括鉴定核酸酶结构域。在一个实施方案中,步骤(d)包括 鉴定RuvC、HPN和/或HEPN结构域。
在一个实施方案中,在CRISPR阵列的10kb内不存在编码Cas1和Cas2的ORF。
在一个实施方案中,步骤(b)中的ORF编码50至300个氨基酸的推定辅助蛋白。
在一个实施方案中,如权利要求1的步骤a)至步骤d)中所述,使用步骤(d)中获得的推 定新颖CRISPR效应子作为种子序列,以进一步比较基因组和/或宏基因组序列,以及随后 选择目标基因座。在一个实施方案中,通过以下方法获得所述预先鉴定的种子序列:(a)鉴 定基因组或宏基因组数据库中的CRISPR基序,(b)提取所述鉴定的CRISPR基序中的多个特 征,(c)使用非监督式学习对CRISPR基因座进行分类,(d)基于所述分类鉴定保守基因座元 件,和(e)从中选择适合作为种子序列的推定CRISPR效应子。
在一个实施方案中,所述特征包括蛋白质元件、重复结构、重复序列、间隔子序列和间 隔子图谱。在一个实施方案中,所述基因组和宏基因组数据库是细菌和/或古细菌基因组。 在一个实施方案中,所述基因组和宏基因组序列是从Ensembl和/或NCBI基因组数据库获 得。在一个实施方案中,步骤(d)中的结构分析基于二级结构预测和/或序列比对。在一个实 施方案中,步骤(d)是通过基于它们编码的蛋白质对其余基因座进行聚簇和对所获得的簇进 行人工管理来实现。在另一方面,本公开提供了一种突变Cas13蛋白,其包含一个或多个氨 基酸突变,其中所述氨基酸:与跟突变Cas 13蛋白形成复合物的向导RNA相互作用;或者 在HEPN活性位点、呈用两个β发夹覆盖crRNA 3'端的结构域形式的盖状结构域、选自螺 旋1或螺旋2结构域的螺旋结构域、结构域间接头(IDL)结构域或工程改造的Cas 13蛋白的 桥螺旋结构域中。在某些实施方案中,所述螺旋结构域1是螺旋结构域1-1、1-2或1-3。在 诸多实施方案中,螺旋结构域2是螺旋结构域2-1或2-2。在一个方面,所述工程改造的Cas13 蛋白与天然存在的对应Cas13蛋白相比具有较高蛋白酶活性或多核苷酸结合能力。
在另一方面,本公开提供了一种改变Cas13蛋白活性的方法,包括:基于所述Cas13 蛋白的至少一部分的三维结构鉴定了所述Cas13蛋白中的一个或多个候选氨基酸,其中所述 一个或多个候选氨基酸与跟所述Cas13蛋白形成复合物的向导RNA相互作用,或者在所述 Cas13蛋白的HEPN活性位点、结构域间接头结构域或桥螺旋结构域中;以及使所述一个或 多个候选氨基酸突变,从而产生突变Cas13蛋白,其中所述突变Cas13蛋白的活性不同于所 述Cas13蛋白。
示例CAS13蛋白和直系同源物
在一些实施例中,Cas13蛋白是Cas13a,例如具有SEQ ID NO 1-1321的那些。在一些 实施例中,Cas13蛋白是Cas13b,例如具有SEQ ID NO 1324-2770的那些。在一些实施例中, Cas13蛋白是Cas13c,例如具有SEQ ID NO 2773-2797的那些。在一些实施例中,Cas13蛋 白是Cas13d,例如具有SEQ ID NO 2798-4092的那些。
在一些实施方案中,所述Cas13蛋白包括本文的示例Cas13的直系同源物和同源物。所 述系统和组合物可以包含小Cas蛋白的直系同源物和同源物。术语“直系同源物”和“同源物” 在本领域中是众所周知的。借助于进一步指导,如本文所用的蛋白质的“同源物”是与作为其 同源物的蛋白质执行相同或类似功能的相同种类的蛋白质。同源蛋白质可能但不必在结构上 相关,或者仅部分在结构上相关。如本文所用的蛋白质的“直系同源物”是与作为其直系同源 物的蛋白质执行相同或类似功能的不同种类的蛋白质。直系同源蛋白质可能但不必在结构上 相关,或者仅部分在结构上相关。在具体实施方案中,如本文所指的Cas13蛋白的同源物或 直系同源物与本文的SEQ ID NO 1-4092、4102-5203和5260-5265中所示的Cas13效应蛋白 具有至少60%、优选至少70%、优选至少80%、更优选至少85%、甚至更优选至少90%, 例如至少95%的序列同源性或同一性。
已经发现许多Cas13直系同源物以共同的基序为特征。因此,在具体实施方案中,所述 Cas13蛋白是包含与由DKHXFGAFLNLARHN(SEQ ID NO:4093)、GLLFFVSLFLDK(SEQ IDNO:4094)、SKIXGFK(SEQ ID NO:4095)、DMLNELXRCP(SEQ ID NO:4096)、 RXZDRFPYFALRYXD(SEQ ID NO:4097)和LRFQVBLGXY(SEQ ID NO:4098)组成的序列 中的一个或多个具有至少70%序列同一性的序列的蛋白质。在其他具体实施方案中,所述 Cas13蛋白包含与这些序列中的至少2个、3个、4个、5个或全部6个具有至少70%序列 同一性的序列。在其他具体实施方案中,与这些序列的序列同一性为至少75%、80%、85%、 90%、95%或100%。在其他具体实施方案中,所述Cas13蛋白是包含与GLLFFVSLFL(SEQ ID NO:4099)和RHQXRFPYF(SEQID NO:4100)具有100%序列同一性的序列的蛋白质。在 其他具体实施方案中,所述Cas13是Cas13b效应蛋白,其包含与RHQDRFPY(SEQ ID NO: 4101)具有100%序列同一性的序列。
在具体实施方案中,所述Cas13蛋白是与来自口腔普雷沃氏菌、牙龈卟啉单胞菌(Porphyromonas gingivales)、解糖普雷沃氏菌(Prevotella saccharolytica)或鸭疫里默氏杆菌(Riemerella antipestifer)的Cas13b蛋白具有至少65%、优选至少70%、75%、80%、85%、90%、 95%或更高序列同一性的Cas13蛋白。在其他具体实施方案中,所述Cas13b效应子选自酿 脓拟杆菌、普雷沃氏菌属MA2016、鸭疫里默氏杆菌、咽喉卟啉单胞菌、牙龈卟啉单胞菌和 卟啉单胞菌属COT-052OH4946的Cas13b蛋白。
应当了解,能在本发明内的Cas13蛋白可以包括嵌合酶,所述嵌合酶包含多个直系同源 物的Cas13酶的片段。此类直系同源物的示例描述于本文其他部分。嵌合酶可以包含Cas13 蛋白的片段和来自另一种CRISPR酶的片段,诸如包括但不限于伯格氏菌属、普雷沃氏菌属、 卟啉单胞菌属、拟杆菌属、另枝菌属、里默氏杆菌属、香味菌属、黄杆菌属、嗜二氧化碳嗜 纤维菌属、金黄杆菌属、褐指藻杆菌属、泥沼杆菌属或冷弯菌属的生物体的Cas13酶的直系 同源物。
在一些实施方案中,本文的系统还涵盖效应蛋白的功能变体或其同源物或直系同源物。 如本文所用的蛋白质的“功能变体”是指这种蛋白质的变体,其至少部分保留该蛋白质的活 性。功能变体可能包括突变体(可能是插入、缺失或置换突变体),包括多形体等。功能变体 内还包括此类蛋白质与另一种通常无关的核酸、蛋白质、多肽或肽的融合产物。功能变体可 能是天然存在的,或者可能是人造的。在一个实施方案中,编码Cas13 RNA靶向性效应蛋 白或者其直系同源物或同源物的核酸分子可以经密码子优化以便在真核细胞中表达。真核生 物可以如本文所讨论。核酸分子可以是经过工程改造或非天然存在的。
在一个实施方案中,所述Cas13蛋白或其直系同源物或同源物可以包含一个或多个突 变。所述突变可以是人工引入的突变并且可以包括但不限于催化结构域中的一个或多个突 变,例如,一个或多个突变被引入一个或多个HEPN结构域中。
在某些示例性实施方案中,所述Cas13效应蛋白来自生物体。在某些示例性实施方案中, 所述Cas13效应蛋白来自于选自以下的生物体:动物溃疡伯格氏菌(Bergeyellazoohelcum)、 中间普雷沃氏菌、口腔普雷沃氏菌、牙龈卟啉单胞菌、酿脓拟杆菌、另枝菌属ZOR0009、 普雷沃氏菌属MA2016、鸭疫里默氏杆菌、橙红普雷沃氏菌(Prevotellaaurantiaca)、解糖普 雷沃氏菌、香味类香味菌CCUG 10230、犬嗜二氧化碳嗜纤维菌、咽喉卟啉单胞菌、普雷沃 氏菌属P5-125、嗜分支黄杆菌、香味类香味菌、柱状黄杆菌或卟啉单胞菌属COT-052 OH4946。在另一个实施方案中,所述一个或多个向导RNA被设计为结合一个或多个可诊断 疾病状态的靶RNA序列。
小Cas蛋白和直系同源物
本文的系统和组合物包含相对较小的Cas蛋白。所述Cas蛋白在大小方面可以具有少于 1000、少于950、少于900、少于850、少于800、少于750、少于700、少于650、少于600、 少于550、少于500、少于450、少于400、少于350或少于300个氨基酸。在一些实施例中, 所述Cas蛋白在大小方面具有少于900个氨基酸。在一些实施例中,所述Cas蛋白在大小方 面具有少于850个氨基酸。在一些实施例中,所述Cas蛋白在大小方面具有少于800个氨基 酸。在一些实施例中,所述Cas蛋白在大小方面具有少于750个氨基酸。在一些实施例中, 所述Cas蛋白在大小方面具有少于700个氨基酸。
在一些实施方案中,所述Cas蛋白是不具有辅助蛋白的VI-B1型Cas蛋白的亚组。在一 些实施例中,所述Cas蛋白基因座中的CRISPR阵列经过处理并且不存在其他非编码RNA(ncRNA)。在一些实施例中,所述Cas蛋白是Cas13b-t。
在一些实施方案中,所述小Cas蛋白是小Cas13a。小Cas13a的示例示于下面的表1中。
表1
Figure BDA0003651481360000541
Figure BDA0003651481360000551
Figure BDA0003651481360000561
Figure BDA0003651481360000571
Figure BDA0003651481360000581
Figure BDA0003651481360000591
Figure BDA0003651481360000601
Figure BDA0003651481360000611
Figure BDA0003651481360000621
Figure BDA0003651481360000631
Figure BDA0003651481360000641
Figure BDA0003651481360000651
Figure BDA0003651481360000661
Figure BDA0003651481360000671
Figure BDA0003651481360000681
Figure BDA0003651481360000691
Figure BDA0003651481360000701
Figure BDA0003651481360000711
Figure BDA0003651481360000721
Figure BDA0003651481360000731
Figure BDA0003651481360000741
Figure BDA0003651481360000751
Figure BDA0003651481360000761
Figure BDA0003651481360000771
Figure BDA0003651481360000781
Figure BDA0003651481360000791
Figure BDA0003651481360000801
Figure BDA0003651481360000811
Figure BDA0003651481360000821
Figure BDA0003651481360000831
Figure BDA0003651481360000841
Figure BDA0003651481360000851
Figure BDA0003651481360000861
Figure BDA0003651481360000871
Figure BDA0003651481360000881
Figure BDA0003651481360000891
Figure BDA0003651481360000901
Figure BDA0003651481360000911
Figure BDA0003651481360000921
Figure BDA0003651481360000931
Figure BDA0003651481360000941
Figure BDA0003651481360000951
Figure BDA0003651481360000961
Figure BDA0003651481360000971
Figure BDA0003651481360000981
Figure BDA0003651481360000991
在一些实施方案中,所述小Cas蛋白是小Cas13b。小Cas13b的示例示于下面的表2中。
表2
Figure BDA0003651481360000992
Figure BDA0003651481360001001
Figure BDA0003651481360001011
Figure BDA0003651481360001021
Figure BDA0003651481360001031
Figure BDA0003651481360001041
Figure BDA0003651481360001051
Figure BDA0003651481360001061
Figure BDA0003651481360001071
Figure BDA0003651481360001081
Figure BDA0003651481360001091
Figure BDA0003651481360001101
Figure BDA0003651481360001111
Figure BDA0003651481360001121
Figure BDA0003651481360001131
Figure BDA0003651481360001141
Figure BDA0003651481360001151
Figure BDA0003651481360001161
Figure BDA0003651481360001171
Figure BDA0003651481360001181
Figure BDA0003651481360001191
Figure BDA0003651481360001201
Figure BDA0003651481360001211
Figure BDA0003651481360001221
Figure BDA0003651481360001231
Figure BDA0003651481360001241
Figure BDA0003651481360001251
Figure BDA0003651481360001261
Figure BDA0003651481360001271
Figure BDA0003651481360001281
Figure BDA0003651481360001291
Figure BDA0003651481360001301
Figure BDA0003651481360001311
Figure BDA0003651481360001321
Figure BDA0003651481360001331
Figure BDA0003651481360001341
Figure BDA0003651481360001351
Figure BDA0003651481360001361
Figure BDA0003651481360001371
Figure BDA0003651481360001381
Figure BDA0003651481360001391
Figure BDA0003651481360001401
Figure BDA0003651481360001411
Figure BDA0003651481360001421
Figure BDA0003651481360001431
Figure BDA0003651481360001441
Figure BDA0003651481360001451
Figure BDA0003651481360001461
Figure BDA0003651481360001471
Figure BDA0003651481360001481
Figure BDA0003651481360001491
Figure BDA0003651481360001501
Figure BDA0003651481360001511
Figure BDA0003651481360001521
Figure BDA0003651481360001531
Figure BDA0003651481360001541
Figure BDA0003651481360001551
Figure BDA0003651481360001561
Figure BDA0003651481360001571
Figure BDA0003651481360001581
Figure BDA0003651481360001591
Figure BDA0003651481360001601
Figure BDA0003651481360001611
Figure BDA0003651481360001621
Figure BDA0003651481360001631
Figure BDA0003651481360001641
Figure BDA0003651481360001651
Figure BDA0003651481360001661
Figure BDA0003651481360001671
Figure BDA0003651481360001681
Figure BDA0003651481360001691
Figure BDA0003651481360001701
Figure BDA0003651481360001711
Figure BDA0003651481360001721
Figure BDA0003651481360001731
Figure BDA0003651481360001741
Figure BDA0003651481360001751
Figure BDA0003651481360001761
Figure BDA0003651481360001771
在一些实施方案中,所述小Cas蛋白是小Cas13b-t。在一些实施方案中,所述Cas13b-t 是Cas13b-t1、Cas13b-t1a、Cas13b-t2或Cas13b-t3。小Cas13b-t的示例示于下面的表3中。
表3
Figure BDA0003651481360001772
Figure BDA0003651481360001781
Figure BDA0003651481360001791
Figure BDA0003651481360001801
Figure BDA0003651481360001811
Figure BDA0003651481360001821
Figure BDA0003651481360001831
Figure BDA0003651481360001841
Figure BDA0003651481360001851
Figure BDA0003651481360001861
Figure BDA0003651481360001871
Figure BDA0003651481360001881
Figure BDA0003651481360001891
Figure BDA0003651481360001901
Figure BDA0003651481360001911
Figure BDA0003651481360001921
Figure BDA0003651481360001931
Figure BDA0003651481360001941
Figure BDA0003651481360001951
Figure BDA0003651481360001961
Figure BDA0003651481360001971
Figure BDA0003651481360001981
Figure BDA0003651481360001991
Figure BDA0003651481360002001
Figure BDA0003651481360002011
Figure BDA0003651481360002021
Figure BDA0003651481360002031
Figure BDA0003651481360002041
Figure BDA0003651481360002051
Figure BDA0003651481360002061
Figure BDA0003651481360002071
Figure BDA0003651481360002081
Figure BDA0003651481360002091
在一些实施方案中,所述小Cas蛋白是小Cas13c。小Cas13c的示例示于下面的表4中。
表4
Figure BDA0003651481360002092
Figure BDA0003651481360002101
Figure BDA0003651481360002111
Figure BDA0003651481360002121
Figure BDA0003651481360002131
Figure BDA0003651481360002141
Figure BDA0003651481360002151
Figure BDA0003651481360002161
Figure BDA0003651481360002171
在一些实施方案中,所述小Cas蛋白是小Cas13d。小Cas13d的示例示于下面的表5中。
表5
Figure BDA0003651481360002172
Figure BDA0003651481360002181
Figure BDA0003651481360002191
Figure BDA0003651481360002201
Figure BDA0003651481360002211
Figure BDA0003651481360002221
Figure BDA0003651481360002231
Figure BDA0003651481360002241
Figure BDA0003651481360002251
Figure BDA0003651481360002261
Figure BDA0003651481360002271
Figure BDA0003651481360002281
Figure BDA0003651481360002291
Figure BDA0003651481360002301
Figure BDA0003651481360002311
Figure BDA0003651481360002321
Figure BDA0003651481360002331
Figure BDA0003651481360002341
Figure BDA0003651481360002351
Figure BDA0003651481360002361
Figure BDA0003651481360002371
Figure BDA0003651481360002381
Figure BDA0003651481360002391
Figure BDA0003651481360002401
Figure BDA0003651481360002411
Figure BDA0003651481360002421
Figure BDA0003651481360002431
Figure BDA0003651481360002441
Figure BDA0003651481360002451
Figure BDA0003651481360002461
Figure BDA0003651481360002471
Figure BDA0003651481360002481
Figure BDA0003651481360002491
Figure BDA0003651481360002501
Figure BDA0003651481360002511
Figure BDA0003651481360002521
Figure BDA0003651481360002531
Figure BDA0003651481360002541
Figure BDA0003651481360002551
Figure BDA0003651481360002561
Figure BDA0003651481360002571
Figure BDA0003651481360002581
Figure BDA0003651481360002591
Figure BDA0003651481360002601
Figure BDA0003651481360002611
Figure BDA0003651481360002621
Figure BDA0003651481360002631
Figure BDA0003651481360002641
Figure BDA0003651481360002651
Figure BDA0003651481360002661
Figure BDA0003651481360002671
Figure BDA0003651481360002681
Figure BDA0003651481360002691
Figure BDA0003651481360002701
Figure BDA0003651481360002711
Figure BDA0003651481360002721
Figure BDA0003651481360002731
Figure BDA0003651481360002741
Figure BDA0003651481360002751
Figure BDA0003651481360002761
Figure BDA0003651481360002771
Figure BDA0003651481360002781
Figure BDA0003651481360002791
Figure BDA0003651481360002801
Figure BDA0003651481360002811
Figure BDA0003651481360002821
Figure BDA0003651481360002831
Figure BDA0003651481360002841
Figure BDA0003651481360002851
Figure BDA0003651481360002861
Figure BDA0003651481360002871
Figure BDA0003651481360002881
Figure BDA0003651481360002891
Figure BDA0003651481360002901
Figure BDA0003651481360002911
Figure BDA0003651481360002921
Figure BDA0003651481360002931
Figure BDA0003651481360002941
Figure BDA0003651481360002951
Figure BDA0003651481360002961
Figure BDA0003651481360002971
Figure BDA0003651481360002981
Figure BDA0003651481360002991
Figure BDA0003651481360003001
Figure BDA0003651481360003011
Figure BDA0003651481360003021
Figure BDA0003651481360003031
Figure BDA0003651481360003041
Figure BDA0003651481360003051
Figure BDA0003651481360003061
Figure BDA0003651481360003071
Figure BDA0003651481360003081
Figure BDA0003651481360003091
Figure BDA0003651481360003101
Figure BDA0003651481360003111
Figure BDA0003651481360003121
Figure BDA0003651481360003131
Figure BDA0003651481360003141
Figure BDA0003651481360003151
Figure BDA0003651481360003161
Figure BDA0003651481360003171
Cas 13变体
本文的Cas蛋白包括Cas蛋白的变体和突变形式(与野生型或天然存在的Cas蛋白相比)。 在一些实施例中,本公开包括Cas蛋白的变体和突变形式。Cas蛋白的变体或突变形式可以 是无催化活性的,例如,与相应野生型相比,没有核酸酶活性或核酸酶活性降低。在某些实 施例中,Cas蛋白的变体或突变形式具有切口酶活性。
在一些情况下,本公开提供了突变的Cas13蛋白,其包含一个或多个修饰的氨基酸,其 中所述氨基酸:(a)与跟所述突变的Cas 13蛋白形成复合物的向导RNA相互作用;(b)处在 突变的Cas 13蛋白的HEPN活性位点、结构域间接头结构域或桥螺旋结构域中;或其组合。
术语“相应氨基酸”或“对应残基”是指Cas13同源物或直系同源物中与参考Cas蛋白中的 氨基酸相同或功能等效的特定氨基酸或其类似物。因此,如本文所用,提及规定Cas13蛋 白中“对应于氨基酸位置[X]的氨基酸位置”表示提及其他公认Cas 13和结构同源物和家族中 的等效位置的集合。本文所述的突变适用于所有Cas13蛋白,即所提及的Cas蛋白的直系同 源物或同源物(例如,PbCas13b)。举例来说,所述突变适用于Cas13a、Cas13b、Cas13c、Cas13d, 例如SEQ ID NO 1-4092、4102-5203和5260-5265。
在一个方面,本发明涉及一种突变Cas13蛋白,其包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的以下氨基酸的一个或多个氨基酸突变:T405、H407、K457、H500、K570、K590、 N634、R638、N652、N653、K655、S658、K741、K744、N756、S757、R762、R791、K846、 K857、K870、R877、K183、K193、R600、K607、K612、R614、K617、K826、K828、K829、 R824、R830、Q831、K835、K836、R838、R618、D434、K431、R53、K943、R1041、Y164、 R285、R287、K292、E296、N297、Q646、N647、R402、K393、N653、N652、R482、N480、 D396、E397、D398、E399、K294、E400、R56、N157、H161、H452、N455、K484、N486、 G566、H567、A656、V795、A796、W842、K871、E873、R874、R1068、N1069或H1073。
如本文所用的PbCas13b优选地具有NCBI参考序列WP_004343973.1的序列。应当理解WP_004343973.1是指野生型(即,未突变的)PbCas13b。如本文所用的LshCas13a(沙氏纤毛菌Cas13a)优选地具有NCBI参考序列WP_018451595.1的序列。应当理解WP_018451595.1是指野生型(即,未突变的)LshCas13b。如本文所用的Pgu Cas13b(咽喉卟啉单胞菌Cas13b)优选具有NCBI参考序列WP_039434803.1的序列。应当理解WP_039434803.1是指野生型(即,未突变的)Pgu Cas13b。如本文所用的Psp Cas13b(普雷沃氏菌属P5-125 Cas13b)优选具 有NCBI参考序列WP_044065294.1的序列。应当理解WP_044065294.1是指野生型(即,未突变的)Psp Cas13b。
在本发明的实施方案中,VI型系统包含如本文所述的根据本发明的突变Cas13效应蛋 白(和任选地Cas13蛋白上游或下游编码的小辅助蛋白)。在某些实施方案中,所述小辅助蛋 白增强了所述Cas13靶向RNA的能力。
洞悉Cas13结构有助于进一步合理工程改造以提高RNA靶向特异性、碱基编辑和核酸 检测的功能性。基于本文所述的Cas13效应子及其crRNA的阐明晶体结构,可以假定合理工程改造和诱变的功能意义,其中非限制性突变在下面的表6中举例说明(参考PbCas13b;WP_004343973.1)。
表6
Figure BDA0003651481360003181
Figure BDA0003651481360003191
Figure BDA0003651481360003201
本文的Cas13蛋白可以包含一个或多个突变。在一些情况下,所述Cas13蛋白包含对应 于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:T405、H407、 K457、H500、K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、 S757、R762、R791、K846、K857、K870、R877、K183、K193、R600、K607、K612、R614、 K617、K826、K828、K829、R824、R830、Q831、K835、K836、R838、R618、D434、K431、 R53、K943、R1041、Y164、R285、R287、K292、E296、N297、Q646、N647、R402、K393、 N653、N652、R482、N480、D396、E397、D398、E399、K294、E400、R56、N157、H161、 H452、N455、K484、N486、G566、H567、A656、V795、A796、W842、K871、E873、R874、 R1068、N1069或H1073。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:H407、K457、H500、K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、S757、R762、R791、K846、K857、K870、R877、 K183、K193、R600、K607、K612、R614、K617、K826、K828、K829、R824、R830、Q831、 K835、K836、R838、R618、D434、K431、R53、K943、R1041、Y164、R285、R287、K292、 E296、N297、Q646、N647、R402、K393、N653、N652、R482、N480、D396、E397、D398、 E399、K294、E400、R56、N157、H161、H452、N455、K484、N486、G566、H567、W842、 K871、E873、R874、R1068、N1069或H1073。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:T405、H407、K457、H500、K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、S757、R762、R791、K846、K857、K870、 R877、K183、K193、R600、K607、K612、R614、K617、K826、K828、K829、R824、R830、 Q831、K835、K836、R838、R618、D434、K431、R53、K943、R1041、Y164、R285、R287、 K292、E296、N297、Q646、N647、R402、K393、N653、N652、R482、N480、D396、E397、 D398、E399、K294或E400。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:K393、R402、N482、T405、H407、S658、N653、A656、K655、N652、H567、N455、H500、K871、K857、K870、W842、E873、R877、K846、R874、 R762、V795、A796、R791、G566、K590、R638、H452、S757、N756、N486、K484、N480、 K457、K741、R56、N157、H161、R1068、N1069或H1073。在一些情况下,所述Cas13 蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突变:K393、R402、N482、 H407、S658、N653、K655、N652、H567、N455、H500、K871、K857、K870、W842、E873、 R877、K846、R874、R762、R791、G566、K590、R638、H452、S757、N756、N486、K484、 N480、K457、K741、R56、N157、H161、R1068、N1069或H1073。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:W842、K846、K870、E873或R877。在一些情况下,所述Cas13蛋白在螺旋结构 域1中包含对应于PbCas13b的螺旋结构域1中的以下氨基酸的一个或多个氨基酸突变: W842、K846、K870、E873或R877。在一些情况下,所述Cas13蛋白在螺旋结构域1-3中 包含对应于PbCas13b的螺旋结构域1-3中的以下氨基酸的一个或多个氨基酸突变:W842、 K846、K870、E873或R877。在一些情况下,所述Cas13蛋白在螺旋桥结构域中包含对应 于PbCas13b的螺旋桥结构域中的以下氨基酸的一个或多个氨基酸突变:W842、K846、K870、 E873或R877。在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个 或多个氨基酸突变:K393、R402、N480、N482、N652或N653。在一些情况下,所述Cas13 蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突变:K393、R402、N480或 N482。在一些情况下,所述Cas13蛋白在LID结构域中包含对应于PbCas13b的LID结构 域中的以下氨基酸的一个或多个氨基酸突变:K393、R402、N480或N482。在一些情况下, 所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突变:N652或 N653。在一些情况下,所述Cas13蛋白在螺旋结构域2中包含对应于PbCas13b的螺旋结构 域2中的以下氨基酸的一个或多个氨基酸突变:N652或N653。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:T405、H407、S658、N653、A656、K655、N652、H567、N455、H500、K871、 K857、K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、 R638、H452、S757、N756、N486、K484、N480、K457或K741。在一些情况下,所述Cas13 蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突变:H407、S658、N653、 K655、N652、H567、N455、H500、K871、K857、K870、W842、E873、R877、K846、R874、 R762、R791、G566、K590、R638、H452、S757、N756、N486、K484、N480、K457或K741。 在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突 变:S658、N653、A656、K655、N652、H567、H500、K871、K857、K870、W842、E873、 R877、K846、R874、R762、V795、A796、R791、G566、K590、R638、S757、N756或K741。 在一些情况下,所述Cas13蛋白在螺旋结构域中包含对应于PbCas13b的螺旋结构域中的以 下氨基酸的一个或多个氨基酸突变:S658、N653、A656、K655、N652、H567、H500、K871、 K857、K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、R638、S757、N756或K741。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:H567、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、 V795、A796、R791、G566、S757或N756。在一些情况下,所述Cas13蛋白在螺旋结构域 1中包含对应于PbCas13b的螺旋结构域1中的以下氨基酸的一个或多个氨基酸突变:H567、 H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、 G566、S757或N756。在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸 的一个或多个氨基酸突变:H567、H500、R762、V795、A796、R791、G566、S757或N756。 在一些情况下,所述Cas13蛋白在螺旋结构域1中包含对应于PbCas13b的螺旋结构域1中 的以下氨基酸的一个或多个氨基酸突变:H567、H500、R762、V795、A796、R791、G566、 S757或N756。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:K871、K857、K870、W842、E873、R877、K846或R874。在一些情况下,所述 Cas13蛋白在螺旋桥结构域中包含对应于PbCas13b的螺旋桥结构域中的以下氨基酸的一个 或多个氨基酸突变:K871、K857、K870、W842、E873、R877、K846或R874。在一些情 况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突变:H567、 H500或G566。在一些情况下,所述Cas13蛋白在螺旋结构域1-2中包含对应于PbCas13b 的螺旋结构域1-2中的以下氨基酸的一个或多个氨基酸突变:H567、H500或G566。在一些 情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突变: K871、K857、K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、S757 或N756。在一些情况下,所述Cas13蛋白在螺旋结构域1-3中包含对应于PbCas13b的螺旋 结构域1-3中的以下氨基酸的一个或多个氨基酸突变:K871、K857、K870、W842、E873、 R877、K846、R874、R762、V795、A796、R791、S757或N756。在一些情况下,所述Cas13 蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突变:R762、V795、A796、 R791、S757或N756。在一些情况下,所述Cas13蛋白在螺旋结构域1-3中包含对应于 PbCas13b的螺旋结构域1-3中的以下氨基酸的一个或多个氨基酸突变:R762、V795、A796、 R791、S757或N756。在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸 的一个或多个氨基酸突变:S658、N653、A656、K655、N652、K590、R638或K741。在一 些情况下,所述Cas13蛋白在螺旋结构域2中包含对应于PbCas13b的螺旋结构域2中的以 下氨基酸的一个或多个氨基酸突变:S658、N653、A656、K655、N652、K590、R638或K741。 在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突 变:T405、H407、N486、K484、N480、H452、N455或K457。在一些情况下,所述Cas13 蛋白在LID结构域中包含对应于PbCas13b的LID结构域中的以下氨基酸的一个或多个氨基 酸突变:T405、H407、N486、K484、N480、H452、N455或K457。在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突变:S658、N653、K655、N652、H567、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、R791、 G566、K590、R638、S757、N756或K741。
在一些情况下,所述Cas13蛋白在螺旋结构域中包含对应于PbCas13b的螺旋结构域中 的以下氨基酸的一个或多个氨基酸突变:S658、N653、K655、N652、H567、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、R791、G566、K590、R638、S757、 N756或K741。在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个 或多个氨基酸突变:H567、H500、K871、K857、K870、W842、E873、R877、K846、R874、 R762、R791、G566、S757或N756。在一些情况下,所述Cas13蛋白在螺旋结构域1中包 含对应于PbCas13b的螺旋结构域1中的以下氨基酸的一个或多个氨基酸突变:H567、H500、 K871、K857、K870、W842、E873、R877、K846、R874、R762、R791、G566、S757或 N756。在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨 基酸突变:H567、H500、R762、R791、G566、S757或N756。在一些情况下,所述Cas13 蛋白在螺旋结构域1中包含对应于PbCas13b的螺旋结构域1中的以下氨基酸的一个或多个 氨基酸突变:H567、H500、R762、R791、G566、S757或N756。在一些情况下,所述Cas13 蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突变:K871、K857、K870、 W842、E873、R877、K846、R874、R762、R791、S757或N756。在一些情况下,所述Cas13 蛋白在螺旋结构域1-3中包含对应于PbCas13b的螺旋结构域1-3中的以下氨基酸的一个或 多个氨基酸突变:K871、K857、K870、W842、E873、R877、K846、R874、R762、R791、 S757或N756。在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个 或多个氨基酸突变:R762、R791、S757或N756。在一些情况下,所述Cas13蛋白在螺旋 结构域1-3中包含对应于PbCas13b的螺旋结构域1-3中的以下氨基酸的一个或多个氨基酸 突变:R762、R791、S757或N756。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:S658、N653、K655、N652、K590、R638或K741。在一些情况下,所述Cas13蛋 白在螺旋结构域2中包含对应于PbCas13b的螺旋结构域2中的以下氨基酸的一个或多个氨 基酸突变:S658、N653、K655、N652、K590、R638或K741。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:H407、N486、K484、N480、H452、N455或K457。在一些情况下,所述Cas13 蛋白在LID结构域中包含对应于PbCas13b的LID结构域中的以下氨基酸的一个或多个氨基 酸突变:H407、N486、K484、N480、H452、N455或K457。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:R56、N157、H161、R1068、N1069或H1073。在一些情况下,所述Cas13蛋白在HEPN结构域中包含对应于PbCas13b的HEPN结构域中的以下氨基酸的一个或多个氨基酸 突变:R56、N157、H161、R1068、N1069或H1073。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:R56、N157或H161。在一些情况下,所述Cas13蛋白在HEPN结构域1中包含对 应于PbCas13b的HEPN结构域1中的以下氨基酸的一个或多个氨基酸突变:R56、N157或 H161。在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨 基酸突变:R1068、N1069或H1073。在一些情况下,所述Cas13蛋白在HEPN结构域2中 包含对应于PbCas13b的HEPN结构域2中的以下氨基酸的一个或多个氨基酸突变:R1068、 N1069或H1073。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:K393、R402、N482、T405、H407、N486、K484、N480、H452、N455或K457。 在一些情况下,所述Cas13蛋白在LID结构域中包含对应于PbCas13b的LID结构域中的以 下氨基酸的一个或多个氨基酸突变:K393、R402、N482、T405、H407、N486、K484、N480、 H452、N455或K457。在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸 的一个或多个氨基酸突变:K393、R402、N482、H407、N486、K484、N480、H452、N455 或K457。在一些情况下,所述Cas13蛋白在LID结构域中包含对应于PbCas13b的LID结 构域中的以下氨基酸的一个或多个氨基酸突变:K393、R402、N482、H407、N486、K484、 N480、H452、N455或K457。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:T405、H407、S658、N653、A656、K655、N652、H567、N455、H500、K871、 K857、K870、W842、E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、 R638、H452、S757、N756、N486、K484、N480、K457、K741、K393、R402或N482。在 一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突变: H407、S658、N653、K655、N652、H567、N455、H500、K871、K857、K870、W842、E873、 R877、K846、R874、R762、R791、G566、K590、R638、H452、S757、N756、N486、K484、N480、K457、K741、K393、R402或N482。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:S658、N653、A656、K655、N652、H567、N455、H500、K871、K857、K870、 W842、E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、R638、H452、 S757、N756、N486、K484、N480、K457或K741。在一些情况下,所述Cas13蛋白包含对 应于PbCas13b的以下氨基酸的一个或多个氨基酸突变:S658、N653、K655、N652、H567、 N455、H500、K871、K857、K870、W842、E873、R877、K846、R874、R762、R791、G566、 K590、R638、H452、S757、N756、N486、K484、N480、K457或K741。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:N486、K484、N480、H452、N455或K457。在一些情况下,所述Cas13蛋白在 LID结构域中包含对应于PbCas13b的LID结构域中的以下氨基酸的一个或多个氨基酸突变:N486、K484、N480、H452、N455或K457。在一些情况下,所述Cas13蛋白包含对应于 PbCas13b的以下氨基酸的一个或多个氨基酸突变:K393、R402、N482、N486、K484、N480、 H452、N455或K457。在一些情况下,所述Cas13蛋白在LID结构域中包含对应于PbCas13b 的LID结构域中的以下氨基酸的一个或多个氨基酸突变:K393、R402、N482、N486、K484、 N480、H452、N455或K457。
在一些情况下,所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基 酸突变:S658、N653、A656、K655、N652、H567、N455、H500、K871、K857、K870、 W842、E873、R877、K846、R874、R762、V795、A796、R791、G566、K590、R638、H452、 S757、N756、N486、K484、N480、K457、K741、K393、R402或N482。在一些情况下, 所述Cas13蛋白包含对应于PbCas13b的以下氨基酸的一个或多个氨基酸突变:S658、N653、 K655、N652、H567、N455、H500、K871、K857、K870、W842、E873、R877、K846、R874、 R762、R791、G566、K590、R638、H452、S757、N756、N486、K484、N480、K457、K741、 K393、R402或N482。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:R53、Y164、K943或R1041。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:R53或Y164。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:K943或R1041。在一些情况下,所述Cas13蛋白在HEPN 结构域中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的HEPN结构域中的以下氨基酸的 一个或多个氨基酸突变:R53、Y164、K943或R1041。在一些情况下,所述Cas13蛋白在HEPN结构域1中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的HEPN结构域1中的以 下氨基酸的一个或多个氨基酸突变:R53或Y164。在一些情况下,所述Cas13蛋白在HEPN 结构域2中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的HEPN结构域2中的以下氨基 酸的一个或多个氨基酸突变:K943或R1041。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:R53、Y164、K943、R1041、R56、N157、H161、R1068、N1069或H1073。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:R53、Y164、R56、N157或H161。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:K943、R1041、R1068、N1069或H1073。在一些情况下,所述Cas13蛋白在HEPN 结构域中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的HEPN结构域中的以下氨基酸的 一个或多个氨基酸突变:R53、Y164、K943、R1041、R56、N157、H161、R1068、N1069 或H1073。在一些情况下,所述Cas13蛋白在HEPN结构域1中包含对应于口腔普雷沃氏 菌Cas13b(PbCas13b)的HEPN结构域1中的以下氨基酸的一个或多个氨基酸突变:R53、 Y164、R56、N157或H161。在一些情况下,所述Cas13蛋白在HEPN结构域2中包含对应 于口腔普雷沃氏菌Cas13b(PbCas13b)的HEPN结构域2中的以下氨基酸的一个或多个氨基 酸突变:K943、R1041、R1068、N1069或H1073。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:R53、Y164、K183、K193、K943或R1041。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:R53、Y164、K183或K193。在一些情况下,所述Cas13蛋白包含对应于 口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:K943或R1041。 在一些情况下,所述Cas13蛋白在HEPN结构域中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的HEPN结构域中的以下氨基酸的一个或多个氨基酸突变:R53、Y164、K183、K193、K943或R1041。
在一些情况下,所述Cas13蛋白在HEPN结构域1中包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的HEPN结构域1中的以下氨基酸的一个或多个氨基酸突变:R53、Y164、K183 或K193。在一些情况下,所述Cas13蛋白在HEPN结构域2中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的HEPN结构域2中的以下氨基酸的一个或多个氨基酸突变:K943或R1041。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:R53、Y164、K183、K193、K943、R1041、R56、N157、 H161、R1068、N1069或H1073。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏 菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:R53、Y164、K183、K193、 R56、N157或H161。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的以下氨基酸的一个或多个氨基酸突变:K943、R1041、R1068、N1069或H1073。 在一些情况下,所述Cas13蛋白在HEPN结构域中包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的HEPN结构域中的以下氨基酸的一个或多个氨基酸突变:R53、Y164、K183、 K193、K943、R1041、R56、N157、H161、R1068、N1069或H1073。在一些情况下,所述 Cas13蛋白在HEPN结构域1中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的HEPN结 构域1中的以下氨基酸的一个或多个氨基酸突变:R53、Y164、K183、K193、R56、N157 或H161。
在一些情况下,所述Cas13蛋白在HEPN结构域2中包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的HEPN结构域2中的以下氨基酸的一个或多个氨基酸突变:K943、R1041、 R1068、N1069或H1073。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的以下氨基酸的一个或多个氨基酸突变:K183或K193。在一些情况下,所述 Cas13蛋白在HEPN结构域1中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的HEPN结构域1中的以下氨基酸的一个或多个氨基酸突变:K183或K193。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:R53、Y164、K943或R1041。在一些情况下,所述Cas13蛋白在HEPN结构域中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的HEPN结构域中的 以下氨基酸的一个或多个氨基酸突变:R53、Y164、K943或R1041。在一些情况下,所述 Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基 酸突变:R53、K943或R1041;优选R53A、R53K、R53D或R53E;K943A、K943R、K943D 或K943E;或者R1041A、R1041K、R1041D或R1041E。
在一些情况下,所述Cas13蛋白在HEPN结构域中包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的HEPN结构域中的以下氨基酸的一个或多个氨基酸突变:R53、K943或R1041; 优选R53A、R53K、R53D或R53E;K943A、K943R、K943D或K943E;或者R1041A、 R1041K、R1041D或R1041E。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基 酸Y164的氨基酸突变,优选Y164A、Y164F或Y164W。在一些情况下,所述Cas13蛋白 包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸Y164 HEPN结构域1的HEPN结构 域1氨基酸突变,优选Y164A、Y164F或Y164W。在一些情况下,所述Cas13蛋白包含对 应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:T405、 H407、K457、D434、K431、R402、K393、R482、N480、D396、E397、D398或E399。
在一些情况下,所述Cas13蛋白在LID结构域中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的LID结构域中的以下氨基酸的一个或多个氨基酸突变:T405、H407、K457、D434、K431、R402、K393、R482、N480、D396、E397、D398或E399。在一些情况下, 所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸H407的氨基酸突 变,优选H407Y、H407W或H407F。在一些情况下,所述Cas13蛋白包含对应于口腔普雷 沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:R402、K393、R482、N480、 D396、E397、D398或E399。在一些情况下,所述Cas13蛋白在LID结构域中包含对应于 口腔普雷沃氏菌Cas13b(PbCas13b)的LID结构域中的以下氨基酸的一个或多个氨基酸突变: R402、K393、R482、N480、D396、E397、D398或E399。在一些情况下,所述Cas13蛋白 包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变: K457、D434或K431。在一些情况下,所述Cas13蛋白在LID结构域中包含对应于口腔普 雷沃氏菌Cas13b(PbCas13b)的LID结构域中的以下氨基酸的一个或多个氨基酸突变:K457、 D434或K431。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:H500、K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、S757、R762、R791、K846、K857、K870、R877、R600、K607、 K612、R614、K617、K826、K828、K829、R824、R830、Q831、K835、K836、R838、R618、 Q646、N647、N653或N652。在一些情况下,所述Cas13蛋白在螺旋结构域中包含对应于 口腔普雷沃氏菌Cas13b(PbCas13b)的螺旋结构域中的以下氨基酸的一个或多个氨基酸突 变:H500、K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、 S757、R762、R791、K846、K857、K870、R877、R600、K607、K612、R614、K617、K826、 K828、K829、R824、R830、Q831、K835、K836、R838、R618、Q646、N647、N653或 N652。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以 下氨基酸的一个或多个氨基酸突变:H500、K570、N756、S757、R762、R791、K846、K857、 K870、R877、K826、K828、K829、R824、R830、Q831、K835、K836或R838。在一些情 况下,所述Cas13蛋白在螺旋结构域1中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的 螺旋结构域1中的以下氨基酸的一个或多个氨基酸突变:H500、K570、N756、S757、R762、 R791、K846、K857、K870、R877、K826、K828、K829、R824、R830、Q831、K835、K836或R838。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:H500、K570、N756、S757、R762或R791。在一些情况下,所述Cas13蛋白在螺旋结构域1中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的螺旋结构域1中的以下氨基酸的一个或多个氨基酸突变:H500、K570、N756、S757、R762 或R791。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的 以下氨基酸的一个或多个氨基酸突变:K846、K857、K870、R877、K826、K828、K829、 R824、R830、Q831、K835、K836或R838。在一些情况下,所述Cas13蛋白在螺旋桥结构 域中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的螺旋桥结构域中的以下氨基酸的一个 或多个氨基酸突变:K846、K857、K870、R877、K826、K828、K829、R824、R830、Q831、 K835、K836或R838。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的以下氨基酸的一个或多个氨基酸突变:H500或K570。在一些情况下,所述 Cas13蛋白在螺旋结构域1-2中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的螺旋结构域 1-2中的以下氨基酸的一个或多个氨基酸突变:H500或K570。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:N756、S757、R762、R791、K846、K857、K870、R877、K826、K828、K829、R824、R830、Q831、K835、K836或R838。在一些情况下,所述Cas13 蛋白在螺旋结构域1-3中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的螺旋结构域1-3中 的以下氨基酸的一个或多个氨基酸突变:N756、S757、R762、R791、K846、K857、K870、R877、K826、K828、K829、R824、R830、Q831、K835、K836或R838。在一些情况下, 所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个 氨基酸突变:N756、S757、R762或R791。在一些情况下,所述Cas13蛋白在螺旋结构域 1-3中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的螺旋结构域1-3中的以下氨基酸的一 个或多个氨基酸突变:N756、S757、R762或R791。在一些情况下,所述Cas13蛋白包含 对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:N756、 S757、R762、R791、K846、K857、K870或R877。在一些情况下,所述Cas13蛋白在螺旋 结构域1-3中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的螺旋结构域1-3中的以下氨基 酸的一个或多个氨基酸突变:N756、S757、R762、R791、K846、K857、K870或R877。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:K826、K828、K829、R824、R830、Q831、K835、K836 或R838。在一些情况下,所述Cas13蛋白在螺旋结构域1-3中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的螺旋结构域1-3中的以下氨基酸的一个或多个氨基酸突变:K826、K828、 K829、R824、R830、Q831、K835、K836或R838。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:K590、N634、R638、N652、N653、K655、S658、K741、K744、R600、K607、K612、R614、K617、R618、Q646、N647、N653或N652。在一些情 况下,所述Cas13蛋白在螺旋结构域2中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的 螺旋结构域2中的以下氨基酸的一个或多个氨基酸突变:K590、N634、R638、N652、N653、 K655、S658、K741、K744、R600、K607、K612、R614、K617、R618、Q646、N647、N653 或N652。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的 以下氨基酸的一个或多个氨基酸突变:Q646或N647。在一些情况下,所述Cas13蛋白在螺 旋结构域2中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的螺旋结构域2中的以下氨基 酸的一个或多个氨基酸突变:Q646或N647。在一些情况下,所述Cas13蛋白包含对应于口 腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:N653或N652。 在一些情况下,所述Cas13蛋白在螺旋结构域2中包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的螺旋结构域2中的以下氨基酸的一个或多个氨基酸突变:N653或N652。在一 些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的 一个或多个氨基酸突变:K590、N634、R638、N652、N653、K655、S658、K741或K744。 在一些情况下,所述Cas13蛋白在螺旋结构域2中包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的螺旋结构域2中的以下氨基酸的一个或多个氨基酸突变:K590、N634、R638、 N652、N653、K655、S658、K741或K744。在一些情况下,所述Cas13蛋白包含对应于口 腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:R600、K607、 K612、R614、K617或R618。在一些情况下,所述Cas13蛋白在螺旋结构域2中包含对应 于口腔普雷沃氏菌Cas13b(PbCas13b)的螺旋结构域2中的以下氨基酸的一个或多个氨基酸 突变:R600、K607、K612、R614、K617或R618。在一些情况下,所述Cas13蛋白包含对 应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:R285、 R287、K292、E296、N297或K294。在一些情况下,所述Cas13蛋白在IDL结构域中包含 对应于口腔普雷沃氏菌Cas13b(PbCas13b)的IDL结构域中的以下氨基酸的一个或多个氨基 酸突变:R285、R287、K292、E296、N297或K294。在一些情况下,所述Cas13蛋白包含 对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:R285、 K292、E296或N297。在一些情况下,所述Cas13蛋白在IDL结构域中包含对应于口腔普 雷沃氏菌Cas13b(PbCas13b)的IDL结构域中的以下氨基酸的一个或多个氨基酸突变:R285、 K292、E296或N297。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:T405、H500、K570、K590、N634、R638、N652、N653、K655、S658、K741、K744、N756、S757、R762、R791、K846、K857、K870、R877、K183、 K193、R600、K607、K612、R614、K617、K826、K828、K829、R824、R830、Q831、K835、 K836、R838、R618、D434、K431、R285、R287、K292、E296、N297、Q646、N647或K294。 在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基 酸的一个或多个氨基酸突变:R402、K393、N653、N652、R482、N480、D396、E397、D398 或E399。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的 以下氨基酸的一个或多个氨基酸突变:R53、K655、R762或R1041;优选R53A或R53D; K655A;R762A;或者R1041E或R1041D。在一些情况下,所述Cas13蛋白包含对应于口 腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:N297、E296、K292 或R285;优选N297A、E296A、K292A或R285A。在一些情况下,所述Cas13蛋白在IDL 结构域(例如中央通道)中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的IDL结构域(例如 中央通道)中的以下氨基酸的一个或多个氨基酸突变:N297、E296、K292或R285;优选 N297A、E296A、K292A或R285A。在一些情况下,所述Cas13蛋白包含对应于口腔普雷 沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:Q831、K836、R838、N652、 N653、R830、K655或R762;优选Q831A、K836A、R838A、N652A、N653A、R830A、 K655A或R762A。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下 氨基酸的一个或多个氨基酸突变:N652、N653、R830、K655或R762;优选N652A、N653A、R830A、K655A或R762A。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:K655或R762;优选K655A或R762A。 在一些情况下,所述Cas13蛋白在螺旋结构域中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的螺旋结构域中的以下氨基酸的一个或多个氨基酸突变:Q831、K836、R838、N652、N653、R830、K655或R762;优选Q831A、K836A、R838A、N652A、N653A、R830A、 K655A或R762A。在一些情况下,所述Cas13蛋白在螺旋结构域中包含对应于口腔普雷沃 氏菌Cas13b(PbCas13b)的螺旋结构域中的以下氨基酸的一个或多个氨基酸突变:N652、 N653、R830、K655或R762;优选N652A、N653A、R830A、K655A或R762A。
在一些情况下,所述Cas13蛋白在螺旋结构域2中包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的螺旋结构域2中的以下氨基酸的一个或多个氨基酸突变:K655或R762;优选 K655A或R762A。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的以下氨基酸的一个或多个氨基酸突变:R614、K607、K193、K183或R600; 优选R614A、K607A、K193A、K183A或R600A。在一些情况下,所述Cas13蛋白在螺旋 结构域2的反式亚基环中包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)螺旋结构域2的反 式亚基环中的以下氨基酸的一个或多个氨基酸突变:Q646或N647;优选Q646A或N647A。 在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的以下氨基 酸的一个或多个氨基酸突变:R53或R1041;优选R53A或R53D,或者R1041E或R1041D。 在一些情况下,所述Cas13蛋白在HEPN结构域中包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的HEPN结构域中的以下氨基酸的一个或多个氨基酸突变:R53或R1041;优选 R53A或R53D,或者R1041E或R1041D。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的以下氨基酸的一个或多个氨基酸突变:K457、D397、E398、 D399、E400、T405、H407或D434;优选D397A、E398A、D399A、E400A、T405A、H407A、 H407W、H407Y、H407F或D434A。在一些情况下,所述Cas13蛋白在LID结构域中包含 对应于口腔普雷沃氏菌Cas13b(PbCas13b)的LID结构域中的以下氨基酸的一个或多个氨基 酸突变:K457、D397、E398、D399、E400、T405、H407或D434;优选D397A、E398A、 D399A、E400A、T405A、H407A、H407W、H407Y、H407F或D434A。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基 酸T405的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸H407的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸K457的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸H500的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸K570的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸K590的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸N634的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸R638的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸N652的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸N653的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸K655的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸S658的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸K741的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸K744的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸N756的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸S757的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸R762的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸R791的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸K846的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸K857的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸K870的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸R877的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸K183的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸K193的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸R600的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸K607的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸K612的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸R614的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸K617的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸K826的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸K828的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸K829的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸R824的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸R830的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸Q831的氨基酸 突变。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基 酸K835的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸K836的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸R838的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸R618的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸D434的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸K431的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸R53的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普 雷沃氏菌Cas13b(PbCas13b)的氨基酸K943的氨基酸突变。在一些情况下,所述Cas13蛋白 包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸R1041的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸Y164的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸R285的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸R287的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸K292的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸E296的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸N297的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸Q646的氨基酸突变。
在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基 酸N647的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸R402的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸K393的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸N653的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸N652的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸R482的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸N480的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸D396的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸E397的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸D398的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸E399的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸K294的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸E400的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸R56的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸N157的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸H161的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸H452的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸N455的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸K484的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸N486的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸G566的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸H567的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸A656的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸V795的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸A796的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨 基酸W842的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b (PbCas13b)的氨基酸K871的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔 普雷沃氏菌Cas13b(PbCas13b)的氨基酸E873的氨基酸突变。在一些情况下,所述Cas13蛋 白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸R874的氨基酸突变。在一些情况 下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的氨基酸R1068的氨基 酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌Cas13b(PbCas13b)的 氨基酸N1069的氨基酸突变。在一些情况下,所述Cas13蛋白包含对应于口腔普雷沃氏菌 Cas13b(PbCas13b)的氨基酸H1073的氨基酸突变。
在一些情况下,所述Cas13蛋白包含对应于沙氏纤毛菌Cas13a(LshCas13a)的以下氨基 酸的一个或多个氨基酸突变:R597、N598、H602、R1278、N1279或H1283。本公开还包 括一种突变Cas13蛋白,其包含对应于沙氏纤毛菌Cas13a(LshCas13a)的以下氨基酸的一个或多个氨基酸突变:R597、N598、H602、R1278、N1279或H1283。在一些情况下,所述 Cas13蛋白在HEPN结构域中包含对应于沙氏纤毛菌Cas13a(LshCas13a)的HEPN结构域中 的以下氨基酸的一个或多个氨基酸突变:R597、N598、H602、R1278、N1279或H1283。 在一些情况下,所述Cas13蛋白包含对应于沙氏纤毛菌Cas13a(LshCas13a)的以下氨基酸的 一个或多个氨基酸突变:R597、N598或H602。在一些情况下,所述Cas13蛋白在HEPN 结构域1中包含对应于沙氏纤毛菌Cas13a(LshCas13a)的HEPN结构域1中的以下氨基酸的 一个或多个氨基酸突变:R597、N598或H602。在一些情况下,所述Cas13蛋白包含对应 于沙氏纤毛菌Cas13a(LshCas13a)的以下氨基酸的一个或多个氨基酸突变:R1278、N1279 或H1283。在一些情况下,所述Cas13蛋白在HEPN结构域2中包含对应于沙氏纤毛菌Cas13a (LshCas13a)的HEPN结构域2中的以下氨基酸的一个或多个氨基酸突变:R1278、N1279或 H1283。在一些情况下,所述Cas13蛋白包含对应于咽喉卟啉单胞菌Cas13b(PguCas13b)的 以下氨基酸的一个或多个氨基酸突变:R146、H151、R1116或H1121。在一些情况下,所 述Cas13蛋白包含对应于咽喉卟啉单胞菌Cas13b(PguCas13b)的以下氨基酸的一个或多个氨 基酸突变:R146、H151、R1116或H1121。在一些情况下,所述Cas13蛋白在HEPN结构 域中包含对应于咽喉卟啉单胞菌Cas13b(PguCas13b)的HEPN结构域中的以下氨基酸的一个 或多个氨基酸突变:R146、H151、R1116或H1121。
在一些情况下,所述Cas13蛋白包含对应于咽喉卟啉单胞菌Cas13b(PguCas13b)的以下 氨基酸的一个或多个氨基酸突变:R146或H151。在一些情况下,所述Cas13蛋白在HEPN结构域1中包含对应于咽喉卟啉单胞菌Cas13b(PguCas13b)的HEPN结构域1中的以下氨基酸的一个或多个氨基酸突变:R146或H151。在一些情况下,所述Cas13蛋白包含对应于咽 喉卟啉单胞菌Cas13b(PguCas13b)的以下氨基酸的一个或多个氨基酸突变:R1116或H1121。在一些情况下,所述Cas13蛋白在HEPN结构域2中包含对应于咽喉卟啉单胞菌Cas13b(PguCas13b)的HEPN结构域2中的以下氨基酸的一个或多个氨基酸突变:R1116或H1121。 在一些情况下,所述Cas13蛋白包含对应于普雷沃氏菌属P5-125 Cas13b(PspCas13b)的以下氨基酸的一个或多个氨基酸突变:H133或H1058。本公开还提供了一种突变Cas13蛋白, 其包含对应于普雷沃氏菌属P5-125 Cas13b(PspCas13b)的以下氨基酸的一个或多个氨基酸突变:H133或H1058。在一些情况下,所述Cas13蛋白在HEPN结构域中包含对应于普雷 沃氏菌属P5-125 Cas13b(PspCas13b)的HEPN结构域中的以下氨基酸的一个或多个氨基酸突变:H133或H1058。
在一些情况下,所述Cas13蛋白包含对应于普雷沃氏菌属P5-125 Cas13b(PspCas13b) 的氨基酸H133的氨基酸突变。在一些情况下,所述Cas13蛋白在HEPN结构域1中包含对 应于普雷沃氏菌属P5-125 Cas13b(PspCas13b)的HEPN结构域1中的氨基酸H133的氨基酸 突变。在一些情况下,所述Cas13蛋白包含对应于普雷沃氏菌属P5-125 Cas13b(PspCas13b) 的氨基酸H1058的氨基酸突变。在一些情况下,所述Cas13蛋白在HEPN结构域2中包含 对应于普雷沃氏菌属P5-125 Cas13b(PspCas13b)的HEPN结构域2中的氨基酸H1058的氨 基酸突变。
本文的Cas蛋白可以包含一个或多个突变氨基酸。在一些实施方案中,所述氨基酸突变 为A、P或V,优选为A。在一些实施方案中,所述氨基酸突变为疏水性氨基酸。在一些实施方案中,所述氨基酸突变为芳香族氨基酸。在一些实施方案中,所述氨基酸突变为带电氨基酸。在一些实施方案中,所述氨基酸突变为带正电氨基酸。在一些实施方案中,所述氨基酸突变为带负电氨基酸。在一些实施方案中,所述氨基酸突变为极性氨基酸。在一些实施方案中,所述氨基酸突变为脂肪族氨基酸。
结构(亚)结构域
在另一方面,本公开提供了一种突变Cas13蛋白,其包含一个或多个氨基酸突变,其中 所述氨基酸:与跟工程改造的Cas 13蛋白形成复合物的向导RNA相互作用;或位于所述突 变Cas 13蛋白的HEPN活性位点、盖子结构域、选自螺旋1结构域或螺旋2结构域的螺旋结构域、结构域间接头(IDL)结构域或桥螺旋结构域中;或其组合。
基于Cas蛋白的晶体结构,可以鉴定不同的结构域。除了序列比对以外,晶体结构和结 构域结构的信息还允许鉴定不同直系同源物(例如Cas13b直系同源物)和同源物(其他Cas13 蛋白,诸如Cas13a、Cas13c或Cas13d)的相应氨基酸。通过示例而非限制的方式,如本文报 告的PbCas13b与crRNA的复合物的晶体结构鉴定了以下结构域:HEPN1和HEPN2(分别 跨越氨基酸1至285和930至1127的催化结构域);IDL(跨越氨基酸286至301的结构域 间接头);螺旋结构域1和螺旋结构域2,由此螺旋结构域分为螺旋结构域1-1、1-2和1-3(分 别跨越氨基酸302至374、499至581和747至929);和跨越氨基酸582至746的螺旋结构 域2;LID(跨越氨基酸375至498)。螺旋结构域1,特别是螺旋结构域1-3涵盖作为可辨别 亚结构域的桥螺旋。因此,如本文所述的根据本发明的特定突变,除了具有Cas13多肽中的 规定氨基酸位置以外,还可以连接到所述Cas13蛋白的特定结构域。因此,Cas13直系同源 物或同源物中的相应氨基酸可以具有所述Cas13多肽中的规定氨基酸位置,并且属于相应结 构域。可以通过结构(亚)结构域中的位置、通过对应于特定Cas13蛋白(例如PbCas13b)的氨 基酸的位置、通过与向导RNA的相互作用或其组合来鉴定突变。
突变类型可以是保守突变或非保守突变。在某些优选实施方案中,突变的氨基酸突变为 丙氨酸(A)。在某些优选实施方案中,如果欲突变的氨基酸是芳香族氨基酸,则使它突变为 丙氨酸或另一个芳香族氨基酸(例如H、Y、W或F)。在某些优选实施方案中,如果欲突变 的氨基酸是带电氨基酸,则使它突变为丙氨酸或另一个带电氨基酸(例如H、K、R、D或E)。在某些优选实施方案中,如果欲突变的氨基酸是带电氨基酸,则使它突变为丙氨酸或带有相 同电荷的另一个带电氨基酸。在某些优选实施方案中,如果欲突变的氨基酸是带电氨基酸, 则使它突变为丙氨酸或带有相反电荷的另一个带电氨基酸。
在一些实施方案中,本发明还提供了诸多方法和组合物,其中可以修饰所述效应蛋白的 一个或多个氨基酸残基,例如,工程改造的或非天然存在的效应蛋白或Cas13。在一个实施 方案中,所述修饰可以包括效应蛋白的一个或多个氨基酸残基的突变。所述一个或多个突变 可以在所述效应蛋白的一个或多个催化活性结构域或者与所述crRNA相互作用的结构域(诸 如所述向导序列或顺向重复序列)中。与缺乏所述一个或多个突变的效应蛋白相比,所述效 应蛋白可能具有降低或消除的核酸酶活性,或者增加的核酸酶活性。所述效应蛋白可能不指 导切割所述目标靶基因座处的RNA链。在一个优选实施方案中,所述一个或多个突变可以 包括两个突变。在一个优选实施方案中,Cas13效应蛋白,例如工程改造的或非天然存在的 效应蛋白或Cas13中的一个或多个氨基酸残基经过修饰。在一些情况下,所述CRISPR-Cas 蛋白在螺旋结构域中包含一个或多个突变。
本公开还提供了改变CRISPR-Cas蛋白活性的方法。在一些实施例中,此类方法包括: 基于所述Cas 13蛋白的至少一部分的三维结构鉴定所述Cas13蛋白中的一个或多个候选氨 基酸,其中所述一个或多个候选氨基酸与跟所述Cas13蛋白形成复合物的向导RNA相互作 用,或者在所述Cas13蛋白的HEPN活性位点、结构域间接头结构域或桥螺旋结构域中;以及使所述一个或多个候选氨基酸突变,从而产生突变Cas13蛋白,其中所述突变Cas13 蛋白的活性不同于所述Cas13蛋白。
去稳定CAS13和融合蛋白
在某些实施方案中,使如本文所述的根据本发明的Cas蛋白与去稳定结构域(DD)缔合 或融合。在一些实施方案中,所述DD是ER50。在一些实施方案中,此DD的相应稳定配体是4HT。因此,在一些实施方案中,所述至少一个DD之一是ER50,并且其稳定配体是 4HT或CMP8。在一些实施方案中,所述DD是DHFR50。在一些实施方案中,此DD的相 应稳定配体是TMP。因此,在一些实施方案中,所述至少一个DD之一是DHFR50,并且 其稳定配体是TMP。在一些实施方案中,所述DD是ER50。在一些实施方案中,此DD的 相应稳定配体是CMP8。因此,CMP8可能是ER50系统中4HT的替代稳定配体。尽管有可 能CMP8和4HT会/应当作为竞争性物质使用,但一些细胞类型可能对这两种配体中的一种 或另一种更敏感,并且根据本公开和本领域的知识,技术人员可以使用CMP8和/或4HT。
在一些实施方案中,可以使一个或两个DD融合到Cas的N末端,同时使一个或两个DD融合到Cas的C末端。在一些实施方案中,所述至少两个DD与Cas13缔合并且所述 DD是相同的DD,即所述DD是同源的。因此,两个(或者两个或更多个)所述DD都可以是 ER50 DD。这在一些实施方案中是优选的。替代地,两个(或者两个或更多个)所述DD都可 以是DHFR50DD。这在一些实施方案中也是优选的。在一些实施方案中,所述至少两个 DD与Cas缔合并且所述DD是不同的DD,即所述DD是异源的。因此,所述DD中一个 可以是ER50,而所述DD或任何其他DD中一个或多个可以是DHFR50。具有两个或更多 个异源DD可能是有利的,因为它将提供更高水平的降解控制。在N或C末端串联融合超 过一个DD可能会增强降解;并且此类串联融合可以是例如ER50-ER50-Cas或 DHFR-DHFR-Cas。设想不存在任一稳定配体时会发生高水平的降解,不存在一种稳定配体 而存在另一种(或另一种)稳定配体时会发生中等水平的降解,而存在两种(或多种中的两种) 稳定配体时会发生低水平的降解。还可以通过具有N末端ER50 DD和C末端DHFR50 DD 予以控制。
在一些实施方案中,所述Cas与DD融合包括DD和Cas13之间的接头。在一些实施方案中,所述接头是GlySer接头。在一些实施方案中,所述DD-Cas13还包含至少一个核输 出信号(NES)。在一些实施方案中,所述DD-Cas13包含两个或更多个NES。在一些实施方 案中,所述DD-Cas包含至少一个核定位信号(NLS)。这可以作为对NES的补充。在一些实 施方案中,所述Cas13包含作为所述Cas13和所述DD之间的接头或作为其一部分的定位(核 输入或输出)信号,或者基本上由所述信号组成或由所述信号组成。HA或Flag标签也在本 发明的范围内作为接头。诸位申请人使用NLS和/或NES作为接头,而且还使用像GS直至 (GGGGS)3(SEQ ID NO:5204)一样短的甘氨酸丝氨酸接头。
去稳定结构域具有赋予多种蛋白质以不稳定性的一般效用;参见例如Miyazaki,JAm Chem Soc.2012年3月7日;134(9):3942-3945,通过引用并入本文。CMP8或4-羟基他莫昔芬可以作为去稳定结构域。更一般来说,发现哺乳动物DHFR的温度敏感型突变体(DHFRt),即N端规则的去稳定残基,在允许温度下稳定但在37℃下不稳定。向表达DHFRt的细胞加 入哺乳动物DHFR的高亲和力配体甲氨蝶呤部分抑制了所述蛋白质的降解。这是小分子配 体可以稳定蛋白质,否则会被靶向从而在细胞中降解的一个重要证明。使用雷帕霉素衍生物稳定mTOR FRB结构域的不稳定突变体(FRB*),并恢复融合激酶GSK-3β的功能。6,7此系 统证明,配体依赖性稳定性代表了一种用以在复杂生物环境中调控特定蛋白质的功能的有吸引力的策略。当通过雷帕霉素诱导的FK506结合蛋白和FKBP12二聚进行泛素补充时,用 以控制蛋白质活性的系统可能涉及DD变为功能性的。人FKBP12或ecDHFR蛋白突变体可 以经过工程改造以便在不存在其高亲和力配体(分别为Shield-1或曲美普林(trimethoprim,TMP))时在代谢方面不稳定。这些突变体是可用于实践本发明的一些可能的去稳定结构域(DD),并且与Cas13融合的DD的不稳定性赋予了通过蛋白酶体对整个融合蛋白进行Cas13降解。Shield-1和TMP以剂量依赖性方式结合并稳定所述DD。雌激素受体配体结合结构域(ERLBD,ERS1的残基305-549)也可以工程改造为去稳定结构域。由于雌激素受体信号传 导途径涉及多种疾病,诸如乳腺癌,因此所述途径已经被广泛研究,并且已经开发了多种雌激素受体激动剂和拮抗剂。因此,相容的ERLBD和药物配对是已知的。有诸多配体与突变 而非野生型形式的ERLBD结合。通过使用编码三个突变(L384M、M421G、G521R)的这些 突变结构域之一12,有可能使用不干扰内源雌激素敏感性网络的配体来调控ERLBD衍生的 DD的稳定性。可以引入额外的突变(Y537S)以使ERLBD进一步去稳定并将它配置为潜在 DD候选物。这种四突变体是一种有利的DD开发。所述突变ERLBD可以与Cas13融合, 并且可以使用配体调控或干扰其稳定性,由此,所述Cas13具有DD。另一个DD可以是基 于突变FKBP蛋白的12-kDa(107个氨基酸)标签,通过Shield1配体加以稳定;参见例如Nature Methods 5,(2008)。举例来说,DD可以是修饰的FK506结合蛋白12(FKBP12),它结合合成 生物惰性小分子Shield-1并通过其可逆地稳定;参见例如Banaszynski LA,Chen LC, Maynard-Smith LA,Ooi AG,Wandless TJ.A rapid,reversible,and tunable method to regulate proteinfunction in living cells using synthetic small molecules.Cell.2006;126:995-1004; Banaszynski LA,Sellmyer MA,Contag CH,Wandless TJ,Thorne SH.Chemicalcontrol of protein stability and function in living mice.Nat Med.2008;14:1123-1127;Maynard-Smith LA, Chen LC,Banaszynski LA,Ooi AG,Wandless TJ.Adirected approach for engineering conditional protein stability usingbiologically silent small molecules.The Journal of biological chemistry.2007;282:24866-24872;及Rodriguez,Chem Biol.2012年3月23日;19(3):391-398, 所有参考文献都通过引用并入本文,并且可以在本发明的实践中用于在本发明的实践中选择 DD与Cas13缔合。可以看出,本领域的知识包括许多DD,并且所述DD可以与Cas13缔 合,例如有利地利用接头融合,由此所述DD可以在存在配体时稳定化并且在不存在所述配 体时所述DD可以去稳定,由此所述Cas13完全去稳定,或者所述DD可以在不存在配体时 稳定化并且当存在所述配体时,所述DD会去稳定;所述DD允许所述Cas13且因此允许所 述CRISPR-Cas13复合物或系统被调控或控制—好比打开或关闭,从而提供用于例如在体内 或体外环境中调控或控制所述系统的手段。举例来说,当目标蛋白质表达为与所述DD标签 的融合物时,它在细胞中去稳定并迅速降解,例如通过蛋白酶体。因此,不存在稳定配体导 致D缔合的Cas被降解。当新的DD与目标蛋白质融合时,其不稳定性被赋予目标蛋白质, 从而引起整个融合蛋白质快速降解。Cas的峰值活性有时有益于减少脱靶效应。因此,优选 高活性的短期爆发。本发明能够提供此类峰值。在某种意义上,所述系统是可诱导的。在某 些其他意义上,所述系统在不存在稳定配体时被抑制,而在存在稳定配体时得以解除抑制。
死Cas蛋白
在某些实施方案中,本文的Cas蛋白是无催化活性或死Cas蛋白。在一些情况下,本文 的Cas蛋白是无催化活性或死Cas13效应蛋白(dCas13)。在一些情况下,死Cas蛋白,例如死Cas13蛋白具有切口酶活性。在一些实施方案中,所述dCas13蛋白在核酸酶结构域中包含突变。在一些实施方案中,所述dCas13效应蛋白已经被截短。在一些情况下,所述死Cas蛋白可以与本文的脱氨酶,例如腺苷脱氨酶融合。
为了减小所述Cas13蛋白和所述一个或多个功能域的融合蛋白的大小,可以在仍保持所 述Cas13蛋白的RNA结合功能的同时截短其C末端。举例来说,可以在所述Cas13效应子 的C末端截短至少20个氨基酸、至少40个氨基酸、至少50个氨基酸、至少60个氨基酸、 至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨基酸、至少150 个氨基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、 至少240个氨基酸、至少250个氨基酸、至少260个氨基酸、或至少300个氨基酸、或至少 350个氨基酸、或至多120个氨基酸、或至多140个氨基酸、或至多160个氨基酸、或至多 180个氨基酸、或至多200个氨基酸、或至多250个氨基酸、或至多300个氨基酸、或至多 350个氨基酸、或至多400个氨基酸。Cas13截短的具体示例包括C末端Δ984-1090、C末 端Δ1026-1090和C末端Δ1053-1090、C末端Δ934-1090、C末端Δ884-1090、C末端Δ834-1090、 C末端Δ784-1090和C末端Δ734-1090,其中氨基酸位置对应于普雷沃氏菌属P5-125 Cas13b 蛋白的氨基酸位置。技术人员应当理解,可以针对其他Cas13b直系同源物或其他Cas13类 型或亚型,诸如Cas13a、Cas13c或Cas13d设计类似的截短。在一些情况下,所述截短Cas13b 由普雷沃氏菌属P5-125 Cas13b的nt 1-984或者Cas13b直系同源物或同源物的相应nt编码。 Cas13截短的示例还包括C末端Δ795-1095,其中氨基酸位置对应于鸭疫里默氏杆菌Cas13b 蛋白的氨基酸位置。Cas13截短的示例还包括C末端Δ875-1175、C末端Δ895-1175、C末 端Δ915-1175、C末端Δ935-1175、C末端Δ955-1175、C末端Δ975-1175、C末端Δ995-1175、 C末端Δ1015-1175、C末端Δ1035-1175、C末端Δ1055-1175、C末端Δ1075-1175、C末端 Δ1095-1175、C末端Δ1115-1175、C末端Δ1135-1175、C末端Δ1155-1175,其中氨基酸位 置对应于咽喉卟啉单胞菌Cas13b蛋白的氨基酸位置。
在一些实施方案中,所述Cas13蛋白的N末端可以被截短。举例来说,可以在所述Cas13 蛋白的N末端截短至少20个氨基酸、至少40个氨基酸、至少50个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨基酸、至 少150个氨基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220 个氨基酸、至少240个氨基酸、至少250个氨基酸、至少260个氨基酸、或至少300个氨基 酸、或至少350个氨基酸、或至多120个氨基酸、或至多140个氨基酸、或至多160个氨基 酸、或至多180个氨基酸、或至多200个氨基酸、或至多250个氨基酸、或至多300个氨基 酸、或至多350个氨基酸、或至多400个氨基酸。Cas13截短的示例包括N末端Δ1-125、N 末端Δ1-88或N末端Δ1-72,其中所述截短的氨基酸位置对应于普雷沃氏菌属P5-125 Cas13b 蛋白的氨基酸位置。
在一些实施方案中,所述Cas13蛋白的N末端和C末端都可能被截短。举例来说,所述Cas13效应子的C末端可以截短至少20个氨基酸,并且所述Cas13蛋白的N末端可以截 短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸、或至少350个氨基酸。举例来说,所述Cas13蛋白的C末端可以截短至少40个 氨基酸,并且所述Cas13蛋白的N末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸、或至少350个氨基酸。举例来说, 所述Cas13蛋白的C末端可以截短至少60个氨基酸,并且所述Cas13蛋白的N末端可以截 短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸、或至少350个氨基酸。举例来说,所述Cas13蛋白的C末端可以截短至少80个 氨基酸,并且所述Cas13蛋白的N末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说, 所述Cas13蛋白的C末端可以截短至少100个氨基酸,并且所述Cas13蛋白的N末端可以 截短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的C末端可以截短至少120个 氨基酸,并且所述Cas13蛋白的N末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说, 所述Cas13蛋白的C末端可以截短至少140个氨基酸,并且所述Cas13蛋白的N末端可以 截短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的C末端可以截短至少160个 氨基酸,并且所述Cas13蛋白的N末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说, 所述Cas13蛋白的C末端可以截短至少180个氨基酸,并且所述Cas13蛋白的N末端可以 截短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的C末端可以截短至少200个氨基酸,并且所述Cas13蛋白的N末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说, 所述Cas13蛋白的C末端可以截短至少220个氨基酸,并且所述Cas13蛋白的N末端可以 截短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的C末端可以截短至少240个 氨基酸,并且所述Cas13蛋白的N末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说, 所述Cas13蛋白的C末端可以截短至少260个氨基酸,并且所述Cas13蛋白的N末端可以 截短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的C末端可以截短至少280个 氨基酸,并且所述Cas13蛋白的N末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说, 所述Cas13蛋白的C末端可以截短至少300个氨基酸,并且所述Cas13蛋白的N末端可以 截短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的C末端可以截短至少350个 氨基酸,并且所述Cas13蛋白的N末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说, 所述Cas13蛋白的N末端可以截短至少20个氨基酸,并且所述Cas13蛋白的C末端可以截 短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的N末端可以截短至少40个氨 基酸,并且所述Cas13蛋白的C末端可以截短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨基 酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说,所 述Cas13蛋白的N末端可以截短至少60个氨基酸,并且所述Cas13蛋白的C末端可以截短 至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100个氨 基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、至 少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的N末端可以截短至少80个氨 基酸,并且所述Cas13蛋白的C末端可以截短至少20个氨基酸、至少40个氨基酸、至少 60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨基 酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至少 240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说,所 述Cas13蛋白的N末端可以截短至少100个氨基酸,并且所述Cas13蛋白的C末端可以截 短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的N末端可以截短至少120个 氨基酸,并且所述Cas13蛋白的C末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说, 所述Cas13蛋白的N末端可以截短至少140个氨基酸,并且所述Cas13蛋白的C末端可以截短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的N末端可以截短至少160个 氨基酸,并且所述Cas13蛋白的C末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说, 所述Cas13蛋白的N末端可以截短至少180个氨基酸,并且所述Cas13蛋白的C末端可以 截短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的N末端可以截短至少200个 氨基酸,并且所述Cas13蛋白的C末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说, 所述Cas13蛋白的N末端可以截短至少220个氨基酸,并且所述Cas13蛋白的C末端可以 截短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的N末端可以截短至少240个 氨基酸,并且所述Cas13蛋白的C末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说, 所述Cas13蛋白的N末端可以截短至少260个氨基酸,并且所述Cas13蛋白的C末端可以 截短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的N末端可以截短至少280个 氨基酸,并且所述Cas13蛋白的C末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。举例来说, 所述Cas13蛋白的N末端可以截短至少300个氨基酸,并且所述Cas13蛋白的C末端可以 截短至少20个氨基酸、至少40个氨基酸、至少60个氨基酸、至少80个氨基酸、至少100 个氨基酸、至少120个氨基酸、至少140个氨基酸、至少160个氨基酸、至少180个氨基酸、 至少200个氨基酸、至少220个氨基酸、至少240个氨基酸、至少260个氨基酸、至少300 个氨基酸或至少350个氨基酸。举例来说,所述Cas13蛋白的N末端可以截短至少350个氨基酸,并且所述Cas13蛋白的C末端可以截短至少20个氨基酸、至少40个氨基酸、至 少60个氨基酸、至少80个氨基酸、至少100个氨基酸、至少120个氨基酸、至少140个氨 基酸、至少160个氨基酸、至少180个氨基酸、至少200个氨基酸、至少220个氨基酸、至 少240个氨基酸、至少260个氨基酸、至少300个氨基酸或至少350个氨基酸。
断裂型蛋白质
注意到在这种情况下,并且更一般来说,对于如本文所述的各种应用,可以设想使用断 裂形式的Cas蛋白。实际上,这可能不仅允许提高特异性,而且还可能有利于递送。在所述 Cas13酶的两个部分基本上包含功能Cas13的意义上,使所述Cas13断裂。所述断裂可以使 得催化结构域不受影响。该Cas13可能起核酸酶的作用,或者它可能是死Cas13,它本质上 是一种RNA结合蛋白,由于其催化结构域中的典型突变而具有极低或没有催化活性。
所述断裂型Cas13的每一半可以与二聚伴侣融合。通过示例而非限制的方式,采用雷帕 霉素敏感性二聚结构域允许产生化学可诱导的断裂型Cas13,以用于暂时控制Cas13活性。 因此,Cas13可以通过断裂成两个片段而被化学诱导,并且雷帕霉素敏感性二聚结构域可以 用于Cas13的受控再组装。可以认为断裂型Cas13的两个部分是断裂型Cas13的N'末端部 分和C'末端部分。融合通常在Cas13的断裂点处。换言之,断裂型Cas13的N'末端部分的 C'末端与二聚体的两半之一融合,而C'末端部分的N'末端与另一半二聚体融合。
Cas13不必是断裂型的,因为所述断裂是新产生的。通常在计算机上设计断裂点并克隆 到构建体中。断裂型Cas13的两个部分,N'末端和C'末端部分一起形成完全Cas13,优选包 含至少70%或更多的野生型氨基酸(或编码它们的核苷酸),优选至少80%或更多,优选至少 90%或更多,优选至少95%或更多,最优选至少99%或更多的野生型氨基酸(或编码它们的 核苷酸)。有可能进行一些调整,并且设想了突变体。可以完全去除非功能域。重要的是可 以使所述两个部分在一起,并且恢复或复原所需的Cas13功能。所述二聚体可以是同二聚体 或异二聚体。
在某些实施方案中,如本文所述的Cas13效应子可用于突变特异性或等位基因特异性靶 向,诸如用于突变特异性或等位基因特异性敲低。
此外,所述RNA靶向性效应蛋白可以与另一个功能性RNA酶结构域,诸如非特异性RNA酶或阿格核酸酶2融合,由此协同作用以增加RNA酶活性或确保信息的进一步降解。
功能域
所述Cas蛋白或其变体(例如催化失活形式)可以与一个或多个功能域缔合(例如,通过融 合蛋白或合适的接头)。在一个实施方案中,所述Cas蛋白或其直系同源物或同源物可以用 作与一个或多个功能域融合或可操作地连接的通用核酸结合蛋白。在一个实施例中,所述功 能域是脱氨酶。在另一个实施例中,所述功能域是转座酶。在另一个实施例中,所述功能域 是逆转录酶。
还设想RNA靶向性效应蛋白-向导RNA复合物作为一个整体可以与两个或更多个功能 域相关。举例来说,可能存在与RNA靶向性效应蛋白缔合的两个或更多个功能域,或者可能存在与向导RNA或crRNA缔合(通过一个或多个衔接蛋白)的两个或更多个功能域,或者可能有与RNA靶向性效应蛋白缔合的一个或多个功能域以及与向导RNA或crRNA缔合(通 过一个或多个衔接蛋白)的一个或多个功能域。
在本发明的非天然存在或工程改造的组合物的一些实施方案中,所述Cas13效应蛋白与 一个或多个功能域缔合。所述缔合可以通过效应蛋白与功能域的直接键连,或通过与所述 crRNA缔合。在一个非限制性示例中,所述crRNA包含加入或插入的序列,所述序列可以 与目标功能域缔合,包括例如与核酸结合衔接蛋白结合的适体或核苷酸。所述功能域可以是 功能异源结构域。
在一些实施方案中,本发明还提供了一种或多种异源功能域以具有以下活性中的一种或 多种:甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、 组蛋白修饰活性、核酸酶活性、单链RNA切割活性、双链RNA切割活性、单链DNA脱氧核糖核酸切割活性、双链DNA切割活性和核酸结合活性。至少一个或多个异源功能域可以在或接近效应蛋白的氨基末端,和/或其中至少一个或多个异源功能域在或接近效应蛋白的 羧基末端。所述一个或多个异源功能域可以与效应蛋白融合。所述一个或多个异源功能域可 以拴系至所述效应蛋白。所述一个或多个异源功能域可以通过接头部分连接至所述效应蛋 白。
在一个实施方案中,所述Cas13蛋白或其直系同源物或同源物可以用作与功能域融合或 可操作地连接的通用核酸结合蛋白。示例性功能域可以包括但不限于翻译起始子、翻译激活 子、翻译阻遏子、核酸酶,特别是核糖核酸酶、剪接体、珠粒、光诱导/可控制结构域或化 学诱导/可控制结构域。在某些实施方案中,所述一个或多个功能域是可控的,例如,可诱 导的。
在一些实施方案中,一个或多个功能域通过衔接蛋白与Cas蛋白缔合,例如与Konnerman等(Nature 517,583-588,2015年1月29日)的修饰的向导一起使用。在一些实施方案中,所述一个或多个功能域附接于所述衔接蛋白,使得所述Cas效应蛋白结合至所述gRNA和靶标后,所述功能域呈允许所述功能域发挥其属性功能的空间取向。
在一些实施方案中,一个或多个功能域与死gRNA(dRNA)缔合。在一些实施方案中,具有活性Cas蛋白的dRNA复合物通过基因座上的功能域指导基因调控,而gRNA通过另 一个基因座上的活性Cas蛋白指导DNA切割,例如,如Dahlman等,‘Orthogonal gene controlwith a catalytically active Cas9 nuclease’的CRISPR-Cas系统中的类似描述。在一些实施方案 中,与脱靶调控相比,选择dRNA以最大化对目标基因座的调控选择性。在一些实施方案 中,选择dRNA以最大化靶基因调控和最小化靶切割。
出于以下讨论的目的,提及功能域可能是与Cas蛋白相关的功能域或与衔接蛋白相关的 功能域。在一些实施方案中,所述一个或多个功能域附接于所述衔接蛋白,使得所述Cas 效应蛋白结合至所述gRNA和靶标后,所述功能域呈允许所述功能域发挥其属性功能的空 间取向。
在实践本发明时,gRNA的环可以延伸,从而不会因插入不同的RNA环或不同的序列使得可能征募会结合所述不同的RNA环或不同的序列的衔接蛋白而与Cas蛋白碰撞。所述衔接蛋白可以包括但不限于多种噬菌体外壳蛋白内存在的直系RNA结合蛋白/适体组合。此类外壳蛋白的列表包括但不限于:Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、 KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、
Figure BDA0003651481360003451
Figure BDA0003651481360003452
7s和PRR1。这些衔接蛋白或直系RNA结合蛋白可以进一步征募效应蛋白或者包 含一个或多个功能域的融合蛋白。
功能域的示例包括脱氨酶结构域、转座酶结构域、逆转录酶结构域、整合酶结构域、重 组酶结构域、拆分酶结构域、转化酶结构域、蛋白酶结构域、DNA甲基转移酶结构域、DNA 羟甲基化酶结构域、DNA脱甲基酶结构域、组蛋白乙酰化酶结构域、组蛋白脱乙酰酶结构 域、核酸酶结构域、阻遏子结构域、激活子结构域、核定位信号结构域、转录调控蛋白(或转录复合物征募)结构域、细胞摄取活性相关结构域、核酸结合结合域、抗体呈递结构域、组蛋白修饰酶、组蛋白修饰酶征募因子;组蛋白修饰酶、组蛋白甲基转移酶、组蛋白脱甲基酶、组蛋白激酶、组蛋白磷酸酶、组蛋白核糖基化酶、组蛋白脱核糖基酶、组蛋白泛素化酶、组蛋白去泛素化酶、组蛋白生物素化酶和组蛋白尾部蛋白酶的抑制剂。在一些优选实施方案 中,所述功能域是转录激活结构域,诸如但不限于VP64、p65、MyoD1、HSF1、RTA、SET7/9或组蛋白乙酰转移酶。在一些实施方案中,所述功能域是转录阻遏结构域,优选KRAB。在 一些实施方案中,所述转录阻遏结构域是SID或SID串联体(例如SID4X)。在一些实施方案 中,所述功能域是表观基因修饰结构域,以便提供表观基因修饰酶。在一些实施方案中,所 述功能域是激活结构域,所述激活结构域可以是P65激活结构域。
在一些实施例中,所述Cas蛋白与连接酶或其功能片段缔合。所述连接酶可以连接由所 述Cas蛋白产生的单链断裂(切口)。在某些情况下,所述连接酶可以连接由所述Cas蛋白产 生的双链断裂。在某些实施例中,所述Cas蛋白与逆转录酶或其功能片段相关。
在一些实施方案中,所述一个或多个功能域是核定位序列(NLS)或核输出信号(NES)。 在一些实施方案中,所述一个或多个功能域是转录激活结构域,包含VP64、p65、MyoD1、 HSF1、RTA、SET7/9和组蛋白乙酰转移酶。本文中别处关于与CRISPR酶相关的激活(或激 活子)结构域提及的那些包括任何已知的转录激活结构域,并且具体来说,有VP64、p65、 MyoD1、HSF1、RTA、SET7/9或组蛋白乙酰转移酶。
在一些实施方案中,所述一个或多个功能域是转录阻遏结构域。在一些实施方案中,所 述转录阻遏结构域是KRAB结构域。在一些实施方案中,所述转录阻遏结构域是NuE结构 域、NcoR结构域、SID结构域或SID4X结构域。
在一些实施方案中,所述一个或多个功能域具有一种或多种活性,包括甲基化酶活性、 脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA 切割活性、DNA切割活性、DNA整合活性或核酸结合活性。
在一些实施方案中,组蛋白修饰结构域也是优选的。下面讨论示例性组蛋白修饰结构域。 转座酶结构域、HR(同源重组)机制结构域、重组酶结构域和/或整合酶结构域也优选作为本 发明的功能域。在一些实施方案中,DNA整合活性包括HR机制结构域、整合酶结构域、 重组酶结构域和/或转座酶结构域。
在一些实施方案中,所述DNA切割活性归因于核酸酶。在一些实施方案中,所述核酸 酶包括Fok1核酸酶。参见“Dimeric CRISPR RNA-guided FokI nucleases for highlyspecific genome editing”,Shengdar Q.Tsai,Nicolas Wyvekens,Cyd Khayter,Jennifer A.Foden,Vishal Thapar,Deepak Reyon,Mathew J.Goodwin,Martin J.Aryee,J.Keith Joung Nature Biotechnology 32(6):569-77(2014),涉及二聚RNA引导型FokI核酸酶,其识别延伸序列并 且可以在人类细胞中高效编辑内源基因。
在一些实施方案中,所述一个或多个功能域附接于所述Cas蛋白,使得在结合至所述 gRNA和靶标后,所述功能域呈允许所述功能域发挥其属性功能的空间取向。
在具体实施方案中,所述Cas蛋白包含一个或多个异源功能域。如本文所用,异源功能 域是来源于与所述Cas蛋白不相同的物种的多肽。举例来说,来源于物种A的Cas蛋白的 异源功能域是来源于与物种A不同的物种的多肽或人工多肽。所述一个或多个异源功能域 可以包括一个或多个核定位信号(NLS)结构域。所述一个或多个异源功能域可以包括至少两 个或更多个NLS。所述一个或多个异源功能域可以包括含一个或多个转录激活结构域。转 录激活结构域可以包括VP64。所述一个或多个异源功能域可以包括一个或多个转录阻遏结 构域。转录阻遏结构域可以包括KRAB结构域或SID结构域。所述一个或多个异源功能域 可以包括一个或多个核酸酶结构域。所述一个或多个核酸酶结构域可以包括Fok1。
功能域可以用于调控转录,例如转录阻遏。转录阻遏通常由染色质修饰酶,诸如组蛋白 甲基转移酶(HMT)和脱乙酰酶(HDAC)介导。阻遏性组蛋白效应结构域是已知的,并且在下 面提供了示例性列表。在示例性表格中,优选小尺寸的蛋白质和功能截短,以促进有效病毒 包装(例如通过AAV)。然而,一般来说,这些结构域可能包括HDAC、组蛋白甲基转移酶(HMT) 和组蛋白乙酰转移酶(HAT)抑制剂,以及HDAC和HMT征募蛋白。在一些实施方案中,所 述功能域可以是或包括HDAC效应结构域、HDAC征募效应结构域、组蛋白甲基转移酶(HMT)效应结构域、组蛋白甲基转移酶(HMT)征募效应结构域或组蛋白乙酰转移酶抑制效应结构域。
在一些实施方案中,所述功能域可以是甲基转移酶(HMT)效应结构域。优选示例包括 NUE、vSET、EHMT2/G9A、SUV39H1、dim-5、KYP、SUVR4、SET4、SET1、SETD8和 TgSET8。本实施例中举例说明了NUE,尽管是优选的,但设想该类别中的其他实施例也将 有用。
在一些实施方案中,所述功能域可以是组蛋白甲基转移酶(HMT)征募效应结构域。优选 示例包括Hp1a、PHF19和NIPP1。
在一些实施方案中,所述功能域可以是组蛋白乙酰转移酶抑制效应结构域。优选示例包 括SET/TAF-1β。
在一些情况下,靶向内源(调控)控制元件(诸如增强子和沉默子)以及启动子或启动子近 端元件。因此,本发明还可以用于靶向内源控制元件(包括增强子和沉默子)以及靶向启动子。 这些控制元件可以位于转录起始位点(TSS)上游和下游,从与TSS相距200bp开始到相距 100kb。靶向已知控制元件可以用于激活或阻遏目标基因。在一些情况下,单个控制元件可 以影响多个靶基因的转录。因此,靶向单个控制元件可以用于同时控制多个基因的转录。
另一方面,靶向推定控制元件(例如,通过平铺所述推定控制元件的区域以及所述元件 周围200bp至100kB)可以用作验证此类元件的手段(通过测量目标基因的转录)或检测新颖 控制元件(例如,通过在目标基因的TSS的上游和下游平铺100kb)。此外,在了解疾病的遗 传病因的背景下,靶向推定控制元件可能有用。与疾病表型相关的许多突变和常见SNP变 体位于编码区外。用本文所述的激活或阻遏系统靶向此类区域后可以读出以下任一者的转 录:a)一组推定靶标(例如,位于最接近控制元件处的一组基因)或b)通过例如RNAseq或微 阵列的全转录组读出。这将允许鉴定疾病表型所涉及的可能候选基因。此类候选基因可用作 新颖药物靶标。
在一些实施方案中,一个或多个功能域包含乙酰转移酶,优选组蛋白乙酰转移酶。这些 可用于表观基因组学领域,例如查询表观基因组的方法中。查询表观基因组的方法可以包括 例如靶向表观基因组序列。靶向表观基因组序列可以包括针对表观基因组靶序列的向导。在 一些实施方案中,表观基因组靶序列可以包括启动子、沉默子或增强子序列。
功能域可以是乙酰转移酶结构域。乙酰转移酶的示例是已知的,但在一些实施方案中可 以包括组蛋白乙酰转移酶。在一些实施方案中,所述组蛋白乙酰转移酶可以包含人乙酰转移 酶p300的催化核心(Gerbasch和Reddy,Nature Biotech 2015年4月6日)。
核定位序列
在一些实施方案中,所述Cas蛋白与一个或多个核定位序列(NLS),诸如约或超过约1、 2、3、4、5、6、7、8、9、10个或更多个NLS融合。在一些实施方案中,所述Cas包含处 于氨基末端或附近的约或超过约1、2、3、4、5、6、7、8、9、10个或更多个NLS,处于 羧基末端或附近的约或超过约1、2、3、4、5、6、7、8、9、10个或更多个NLS,或这些 的组合(例如,处于氨基末端的零个或者至少一个或多个NLS,以及处于羧基末端的零个或 者一个或多个NLS)。当存在超过一个NLS时,每一个都可以独立于其他来选择,使得单个 NLS可以存在于超过一个拷贝中和/或与存在于一个或多个拷贝中的一个或多个其他NLS组 合。在本发明的一个优选实施方案中,所述Cas蛋白包含最多6个NLS。在一些实施方案 中,当NLS中最近的氨基酸沿多肽链与N或C末端相距约1、2、3、4、5、10、15、20、 25、30、40、50个或更多个氨基酸内时,所述NLS被视为接近N或C末端。NLS的非限 制性示例包括来源于以下的NLS序列:具有氨基酸序列PKKKRKV(SEQ ID NO:5205)的 SV40病毒大T抗原NLS;来自核质蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK (SEQ ID NO:5206)的核质蛋白二分NLS;具有氨基酸序列PAAKRVKLD(SEQ ID NO:5207) 或RQRRNELKRSP(SEQ ID NO:5208)的c-myc NLS;具有序列 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:5209)的hRNPA1 M9 NLS;来自输入蛋白-α的IBB结构域的序列 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:5210);肌瘤T 蛋白的序列VSRKRPRP(SEQ ID NO:5211)和PPKKARED(SEQ ID NO:5212);人p53的序 列PQPKKKPL(SEQ ID NO:5213);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO: 5214);流感病毒NS1的序列DRLRR(SEQ ID NO:5215)和PKQKKRK(SEQ ID NO:5216); 肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:5217);小鼠Mx1蛋白的序列 REKKKFLKRR(SEQ ID NO:5218);人聚(ADP-核糖)聚合酶的序列 KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:5219);以及类固醇激素受体(人)糖皮质激素的 序列RKCLQAGMNLEARKTKK(SEQ ID NO:5220)。一般来说,所述一个或多个NLS具有 足以驱动可检测量的Cas在真核细胞的细胞核中积累的强度。一般来说,核定位活性的强度 可能来源于Cas中NLS的数量、所用的特定NLS或这些因素的组合。可以通过任何合适的 技术对细胞核中的积聚进行检测。举例来说,可以使可检测标记物与Cas融合,使得可以观 察细胞内的位置,诸如与用于检测细胞核位置的手段(例如,对细胞核特异的染色剂,诸如 DAPI)组合。还可以从细胞分离细胞核,然后可以通过任何合适的检测蛋白质的方法来分析 其内容物,诸如免疫组织化学、蛋白质印迹或酶活性测定。还可以间接测定细胞核中的积累, 诸如通过对CRISPR复合物形成的影响的测定(例如对靶序列处的DNA切割或突变的测定, 或者对受CRISPR复合物形成和/或Cas酶活性影响的改变的基因表达活性的测定),与未暴 露于Cas或复合物或者暴露于缺乏一个或多个NLS的Cas的对照组相比较。在本文所述的 Cas效应蛋白复合物和系统的某些实施方案中,密码子优化的Cas效应蛋白包含附接于蛋白 质C末端的NLS。在某些实施方案中,可以使其他定位标签与Cas蛋白融合,诸如但不限 于用于使Cas定位到细胞中的特定位点,诸如细胞器,诸如线粒体、质粒、叶绿体、囊泡、 高尔基体、(核或细胞)膜、核糖体、核仁、ER、细胞骨架、液泡、中心体、核小体、颗粒、 中心粒等。
在本发明的某些实施方案中,至少一个核定位信号(NLS)附接于编码Cas蛋白的核酸序 列。在优选实施方案中,附接至少一个或多个C末端或N末端NLS(且因此,编码Cas蛋白的核酸分子可以包括编码NLS,使得表达的产物附接或连接有NLS)。在一个优选实施方案中,附接C末端NLS以便在真核细胞,优选人类细胞中实现最佳表达和核靶向。本发明 还涵盖用于递送多种核酸组分的方法,其中每一种核酸组分对不同的目标靶基因座特异,从而修饰多个目标靶基因座。复合物的核酸组分可以包含一个或多个蛋白质结合RNA适体。所述一个或多个适体可能能够结合噬菌体外壳蛋白。
接头
在一些优选实施方案中,功能域与死Cas连接以靶向和激活表观基因组序列,诸如启动 子或增强子。还可以提供针对此类启动子或增强子的一个或多个向导,以指导CRISPR酶与 此类启动子或增强子结合。
此处使用的术语“缔合”有关于功能域与Cas效应蛋白或衔接蛋白的缔合。它用于说明一 个分子如何与另一个分子‘缔合’,例如衔接蛋白和功能域之间,或Cas效应蛋白和功能域之 间。在这种蛋白质-蛋白质相互作用的情况下,这种缔合可以按照抗体识别表位的方式来看 待。替代地,一个蛋白质与另一个蛋白质缔合可以通过两者的融合来进行,例如一个亚基与 另一个亚基融合。融合通常通过将一个氨基酸序列加入另一个氨基酸序列,例如通过将编码 各个蛋白质或亚基的核苷酸序列剪接在一起来进行。替代地,这基本上可以被视为两个分子 之间的结合或直接键连,诸如融合蛋白。在任何情况下,融合蛋白可以包括两个目标亚基之 间(即,酶和功能域之间或衔接蛋白和功能域之间)的接头。因此,在一些实施方案中,Cas 效应蛋白或衔接蛋白通过与功能域结合而与其缔合。在其他实施方案中,Cas效应蛋白或衔 接蛋白与功能域缔合,因为两者任选地通过中间接头融合在一起。
提及融合蛋白时所用的术语“接头”是指连接蛋白质以形成融合蛋白的分子。通常,这些 分子除了连接或保持蛋白质之间的某个最小距离或其他空间关系外没有特定的生物活性。然 而,在某些实施方案中,可以选择接头以影响接头和/或融合蛋白的一些特性,诸如接头的 折叠、净电荷或疏水性。
用于本发明方法的合适的接头对本领域技术人员是众所周知的,包括但不限于直链或支 链碳接头、杂环碳接头或肽接头。然而,如本文所用,接头还可以是共价键(碳-碳键或碳- 杂原子键)。在特定实施方案中,使用接头将Cas蛋白和核苷酸脱氨酶隔开足以确保每一个 蛋白质都保留其所需功能特性的距离。优选肽接头序列采用柔性延伸构象并且不表现出发展 有序二级结构的倾向。在某些实施方案中,接头可以是化学部分,它可以是单体、二聚体、 多聚体或聚合体。优选地,接头包括氨基酸。柔性接头中的典型氨基酸包括Gly、Asn和Ser。 因此,在特定实施方案中,接头包括Gly、Asn和Ser氨基酸中一个或多个的组合。其他近 中性氨基酸,诸如Thr和Ala,也可以用于接头序列。示例性接头在以下文献中公开:Maratea 等,(1985),Gene 40:39-46;Murphy等,(1986)Proc.Nat'l.Acad.Sci.USA83:8258-62;美国专 利号4,935,233;和美国专利号4,751,180。举例来说,可以使用GlySer接头GGS、GGGS(SEQ ID NO:5221)或GSG。GGS、GSG、GGGS(SEQ ID NO:5221)或GGGGS(SEQ IDNO:5222) 接头可以用于3个(诸如(GGS)3(SEQ ID NO:5223)、(GGGGS)3(SEQ ID NO:5204))或者5、6、 7、9个乃至12个或更多个的重复序列中,以提供合适的长度。在一些情况下,接头可以是 (GGGGS)3-15,举例来说,在一些情况下,接头可以是(GGGGS)3-11,例如GGGGS(SEQ IDNO: 5222)、(GGGGS)2(SEQ ID NO:5224、(GGGGS)3(SEQ ID NO:5204)、(GGGGS)4(SEQ ID NO:5225)、(GGGGS)5(SEQ ID NO:5226)、(GGGGS)6(SEQ ID NO:5227)、(GGGGS)7(SEQ ID NO:5228)、(GGGGS)8(SEQ ID NO:5229)、(GGGGS)9(SEQ ID NO:5230)、(GGGGS)10(SEQ ID NO:5231)或(GGGGS)11(SEQ ID NO:5232)。
在特定实施方案中,本文优选使用诸如(GGGGS)3(SEQ ID NO:5204)等接头。(GGGGS)6 (SEQ ID NO:5227)、(GGGGS)9(SEQ ID NO:5230)或(GGGGS)12(SEQ ID NO:5233)可以优选 地用作替代物。其他优选替代物有(GGGGS)1(SEQ ID NO:5222)、(GGGGS)2(SEQ IDNO:5224)、(GGGGS)4(SEQ ID NO:5225)、(GGGGS)5(SEQ ID NO:5226)、(GGGGS)7(SEQ ID NO:5228)、(GGGGS)8(SEQ ID NO:5229)、(GGGGS)10(SEQ ID NO:5231)或(GGGGS)11(SEQ ID NO:5232)。在又一个实施方案中,LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(SEQ ID NO:5234)用作接头。在又一个实施方案中,接头是XTEN接头。在特定实施方案中,Cas 蛋白通过LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(SEQ ID NO:5234)接头连接至脱 氨酶蛋白或其催化结构域。在另一个具体实施方案中,Cas蛋白通过 LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(SEQ IDNO:5234)接头在C末端连接至脱 氨酶蛋白或其催化结构域的N末端。此外,N末端和C末端NLS还可以用作接头(例如, PKKKRKVEASSPKKRKVEAS(SEQ ID NO:5235))。
接头的示例示于下面的表7中。
表7
Figure BDA0003651481360003501
Figure BDA0003651481360003511
接头可以用在向导RNA和功能域(激活子或阻遏子)之间或Cas蛋白和功能域之间。接 头可以用于工程改造适量的“机械柔性”。
在某些实施方案中,所述一个或多个功能域是可控的,例如,可诱导的。
Cas13蛋白的调节
本发明提供了调节CRISPR蛋白功能的辅助蛋白。在某些实施方案中,所述辅助蛋白调 节CRISPR蛋白的催化活性。在本发明的一个实施方案中,辅助蛋白调节靶向性或序列特异 性核酸酶活性。在本发明的一个实施方案中,辅助蛋白调节旁系核酸酶活性。在本发明的一 个实施方案中,辅助蛋白调节与靶核酸的结合。
根据本发明,欲调节的核酸酶活性可以针对包含RNA或由RNA组成的核酸,包括但不限于mRNA、miRNA、siRNA和包含可切割RNA键连的核酸以及核苷酸类似物。在本发 明的一个实施方案中,欲调节的核酸酶活性可以针对包含DNA或由DNA组成的核酸,包 括但不限于包含可切割DNA键连的核酸和核酸类似物。
在本发明的一个实施方案中,辅助蛋白增强了CRISPR蛋白的活性。在某些此类实施方 案中,所述辅助蛋白包含HEPN结构域并增强了RNA切割。在某些实施方案中,所述辅助蛋白抑制了CRISPR蛋白的活性。在某些此类实施方案中,所述辅助蛋白包含失活的HEPN 结构域或完全缺乏HEPN结构域。
根据本发明,VI型CRISPR系统的天然存在的辅助蛋白包含在CRISPR基因座处或附近编码的小蛋白,其功能在于修饰CRISPR蛋白的活性。一般来说,CRISPR基因座可以鉴 定为包含推定CRISPR阵列和/或编码推定CRISPR效应蛋白。在一个实施方案中,效应蛋 白可以是800至2000个氨基酸,或900至1800个氨基酸,或950至1300个氨基酸。在一 个实施方案中,可以在与推定CRISPR效应蛋白或阵列相距25kb内、或20kb内或15kb 内、或10kb内,或者与推定CRISPR效应蛋白或阵列相距2kb至10kb内编码辅助蛋白。
在本发明的一个实施方案中,辅助蛋白是50至300个氨基酸,或100至300个氨基酸或150至250个氨基酸或约200个氨基酸。辅助蛋白的非限制性示例包括本文鉴定的csx27和csx28蛋白。
本发明的CRISPR辅助蛋白的鉴定和使用不依赖于CRISPR效应蛋白分类。可以发现本 发明的辅助蛋白与多种CRISPR效应蛋白缔合或经工程改造以便与其一起发挥功能。本文鉴 定和使用的辅助蛋白的示例通常代表CRISPR效应蛋白。应当理解,CRISPR效应蛋白分类 可能涉及同源性、特征位置(例如,REC结构域、NUC结构域、HEPN序列的位置)、核酸 靶标(例如DNA或RNA)、不存在或存在tracr RNA、顺向重复序列5'或3'的向导/间隔子序 列的位置或其他标准。在本发明的实施方案中,辅助蛋白鉴定和使用超越了这样的分类。
在靶向RNA的VI型CRISPR-Cas系统中,所述Cas蛋白通常包含参与RNA切割的两 个保守HEPN结构域。在某些实施方案中,所述Cas蛋白加工crRNA以产生成熟crRNA。crRNA的向导序列识别具有互补序列的靶RNA,而Cas蛋白使靶链降解。更具体来说,在 某些实施方案中,在靶标结合后,所述Cas蛋白进行结构重排,由此使两个HEPN结构域 一起形成活性HEPN催化位点,然后切割靶RNA。Cas蛋白表面附近的催化位点的位置允 许非特异性旁系ssRNA切割。
在某些实施方案中,辅助蛋白有助于增加或减少靶标和/或旁系RNA切割。不受理论束 缚,激活CRISPR活性的辅助蛋白(例如,包含HEPN结构域的csx28蛋白或直系同源物或变体)可以设想为能够与Cas蛋白相互作用并且将其HEPN结构域与所述Cas蛋白的HEPN 结构域组合形成了活性HEPN催化位点,而抑制性辅助蛋白(例如缺乏HEPN结构域的csx27) 可以设想为能够与Cas蛋白相互作用并且减少或阻断Cas蛋白的构象,由此使两个HEPN 结构域在一起。
根据本发明,在某些实施方案中,增强VI型Cas蛋白或其复合物的活性包括使VI型Cas蛋白或其复合物与来自相同生物体的激活所述Cas蛋白的辅助蛋白接触。在其他实施方案中,增强VI型Cas蛋白或其复合物的活性包括使VI型Cas蛋白或其复合物与来自相同 亚类(例如VI-b型)内不同生物体的激活子辅助蛋白接触。在其他实施方案中,增强VI型Cas蛋白或其复合物的活性包括使VI型Cas蛋白或其复合物与不在所述亚类内的辅助蛋白(例如,除VI-b型以外的VI型Cas蛋白与VI-b型辅助蛋白,反之亦然)接触。
根据本发明,在某些实施方案中,阻遏VI型Cas蛋白或其复合物的活性包括使VI型Cas蛋白或其复合物与来自相同生物体的阻遏所述Cas蛋白的辅助蛋白接触。在其他实施方案中,阻遏VI型Cas蛋白或其复合物的活性包括使VI型Cas蛋白或其复合物与来自相同 亚类(例如VI-b型)内不同生物的阻遏辅助蛋白接触。在其他实施方案中,阻遏VI型Cas蛋 白或其复合物的活性包括使VI型Cas蛋白或其复合物与不在所述亚类内的阻遏辅助蛋白(例如,除VI-b型以外的VI型Cas蛋白与VI-b型阻遏辅助蛋白,反之亦然)接触。
在VI型Cas蛋白和VI型辅助蛋白来自相同生物体的某些实施方案中,所述两种蛋白 将共同在工程改造的CRISPR系统中发挥功能。在某些实施方案中,需要改变工程改造的CRISPR系统的功能,例如通过修饰蛋白质或其表达中的任一者或两者。在VI型Cas蛋白 和VI型辅助蛋白来自可能属于相同类别或不同类别内的不同生物体的实施方案中,所述蛋白质可以在工程改造的CRISPR系统中共同发挥功能,但通常需要或有必要对所述蛋白质中的任一者或两者进行修饰以便共同发挥功能。
因此,在本发明的某些实施方案中,可以修饰Cas蛋白和辅助蛋白中任一者或两者以调 节Cas蛋白和辅助蛋白之间的蛋白质-蛋白质相互作用的诸多方面。在某些实施方案中,可 以修饰Cas蛋白和辅助蛋白中任一者或两者以调节蛋白质-核酸相互作用的诸多方面。调节 蛋白质-蛋白质相互作用和蛋白质-核酸相互作用的方法包括但不限于拟合分子表面、极性相 互作用、氢键和调节范德华相互作用。在某些实施方案中,调节蛋白质-蛋白质相互作用或 蛋白质-核酸结合包括增加或减少结合相互作用。在某些实施方案中,调节蛋白质-蛋白质相 互作用或蛋白质-核酸结合包括有利于或不利于蛋白质或核酸构象的修饰。
“拟合”意指确定(包括通过自动或半自动手段)Cas13蛋白的一个或多个原子(和任选地Cas13辅助蛋白的至少一个原子)之间或者Cas13蛋白的一个或多个原子和核酸的一个或多 个原子之间(或任选地Cas13辅助蛋白的一个或多个原子和核酸之间)的相互作用,并计算这 种相互作用稳定的程度。相互作用包括由电荷、空间因素等引起的吸引和排斥。
VI型CRISPR蛋白或其复合物(和/或在Cas13b的背景下的VI型CRISPR辅助蛋白或其 复合物)的三维结构在本发明的背景下提供了用于鉴定Cas13直系同源物中的额外突变的额 外工具。晶体结构还可以作为设计新的具体的Cas13(以及可选的Cas13辅助蛋白)的基础。 还描述了各种基于计算机的拟合方法。Cas13(和可选的辅助蛋白)和核酸的结合相互作用可 以通过使用对接程序的计算机建模进行检查。对接程序是已知的;例如GRAM、DOCK或 AUTODOCK(参见Walters等,Drug Discovery Today,第3卷,第4期(1998),160-178;和 Dunbrack等,Folding and Design 2(1997),27-42)。该程序可以包括计算机拟合以确定结合伴 侣的形状和化学结构的良好程度。可以对VI型系统的活性位点或结合位点进行计算机辅助 手动检查。还可以使用诸多程序,诸如GRID(P.Goodford,J.Med.Chem,1985,28,849-57)— 一种确定具有不同官能团的分子之间的可能相互作用位点的程序—分析活性位点或结合位 点,以预测结合化合物的部分结构。可以采用计算机程序来估计两个结合伴侣,例如VI型 CRISPR系统的组分或核酸分子和VI型CRISPR系统的组分的吸引、排斥或空间位阻。
氨基酸取代可以基于氨基酸性质(诸如残基的极性、电荷、溶解性、疏水性、亲水性和/ 或两亲性)的差异或相似性来进行,因此将氨基酸一起分组在官能团中是有用的。氨基酸可 以单独基于其侧链的性质一起分组。在比较直系同源物时,有可能存在由于结构或催化原因 而保守的残基。这些组可以以文氏图的形式描述(Livingstone C.D.和BartonG.J.(1993) “Protein sequence alignments:a strategy for the hierarchicalanalysis of residue conservation” Comput.Appl.Biosci.9:745-756)(Taylor W.R.(1986)“The classification of amino acid conservation”J.Theor.Biol.119;205-218)。可以进行保守取代,例如根据下表,该表描述了 普遍接受的文氏图氨基酸分组(参见下表8)。
表8
Figure BDA0003651481360003531
在一些实施方案中,Cas13中的修饰可以包括对Cas13蛋白的一个或多个氨基酸残基的 修饰(和/或可以包括对Cas13辅助蛋白的一个或多个氨基酸残基的修饰)。在一些实施方案 中,Cas13中的修饰可以包括对位于包含未修饰Cas13蛋白(和/或Cas13辅助蛋白)中的带正 电残基的区域中的一个或多个氨基酸残基的修饰。在一些实施方案中,Cas13中的修饰可以 包括对未修饰Cas13蛋白(和/或Cas13辅助蛋白)中的一个或多个带正电氨基酸残基的修饰。 在一些实施方案中,Cas13中的修饰可以包括对未修饰Cas13蛋白(和/或Cas13辅助蛋白)中 的一个或多个不带正电氨基酸残基的修饰。所述修饰可以包括对未修饰Cas13蛋白(和/或 Cas13辅助蛋白)中的一个或多个不带电氨基酸残基的修饰。所述修饰可以包括对未修饰 Cas13蛋白(和/或Cas13辅助蛋白)中的一个或多个带负电氨基酸残基的修饰。所述修饰可以 包括对未修饰Cas13蛋白(和/或Cas13辅助蛋白)中的一个或多个疏水性氨基酸残基的修饰。 所述修饰可以包括对未修饰Cas13蛋白(和/或Cas13辅助蛋白)中的一个或多个极性氨基酸残 基的修饰。所述修饰可以包括用带电氨基酸取代疏水性氨基酸或极性氨基酸,所述带电氨基 酸可以是带负电或带正电的氨基酸。所述修饰可以包括用带正电或极性或疏水性的氨基酸取 代带负电的氨基酸。所述修饰可以包括用带负电或极性或疏水性的氨基酸取代带正电的氨基 酸。
本文的实施方案还包括诸多序列(多核苷酸或多肽两者),所述序列可以包含可能发生的 同源取代(取代和置换在本文都用于意指现有氨基酸残基或核苷酸与替代残基或核苷酸互 换),即,在氨基酸的情况下,相似取代,诸如碱性对碱性、酸性对酸性、极性对极性等。 还可能发生非同源取代,即从一类残基到另一类残基,或替代地涉及包括非天然氨基酸,诸 如鸟氨酸(下文称为Z)、二氨基丁酸鸟氨酸(下文称为B)、正亮氨酸鸟氨酸(以下简称O)、吡 啶丙氨酸、噻吩丙氨酸、萘基丙氨酸和苯基甘氨酸。变体氨基酸序列可以包括可以插入所述 序列的任两个氨基酸残基之间的合适的间隔基团,所述间隔基团除了诸如甘氨酸或β-丙氨 酸残基等氨基酸间隔子以外,还包括烷基,诸如甲基、乙基或丙基。本领域技术人员可以很 好地理解另一种形式的变异,其涉及存在一个或多个拟肽形式的氨基酸残基。为了免生疑问, “拟肽形式”用于指变体氨基酸残基,其中α-碳取代基位于残基的氮原子而非α-碳上。用于 制备呈拟肽形式的肽的方法在本领域中是已知的,例如Simon RJ等,PNAS(1992)89(20), 9367-9371及Horwell DC,Trends Biotechnol.(1995)13(4),132-134。
同源性建模:其他Cas13直系同源物中的相应残基可以通过Zhang等,2012(Nature; 490(7421):556-60)和Chen等,2015(PLoS Comput Biol;11(5):e1004248)(用于预测结构域-基 序界面介导的相互作用的计算蛋白质-蛋白质相互作用(PPI)方法)的方法来鉴定。PrePPI(预 测PPI)是一种基于结构的PPI预测方法,使用贝叶斯(Bayesian)统计框架将结构证据与非结 构证据相结合。所述方法涉及获取一对查询蛋白质并使用结构比对来鉴定与对应于其实验确 定的结构或同源性模型的结构代表。通过考虑全局和局部几何关系,结构比对进一步用于鉴 定邻近和远端结构邻居。每当结构代表的两个邻居形成蛋白质数据库中报告的络合物时,这 就定义了一个用于对两个查询蛋白质之间的相互作用进行建模的模板。复合物的模型是通过 将代表性结构叠加在模板中的相应结构邻居上来创建。这种方法见于Dey等,2013(Prot Sci; 22:359-66)。
向导序列
本文的系统和组合物还可以包含一个或多个向导序列。所述向导序列可能与靶序列杂交 或可能能够与靶序列杂交。在本发明的诸多实施方案中,术语向导序列和向导RNA和crRNA 可互换使用,如在前述引用文件诸如WO 2014/093622(PCT/US2013/074667)中。一般来说, 向导序列是与靶多核苷酸序列具有足够互补性从而与靶序列杂交并指导CRISPR复合物与 靶序列的序列特异性结合的任何多核苷酸序列。在一些实施方案中,当使用合适的比对算法 进行最佳比对时,向导序列与其相应靶序列之间的互补程度为约或大于约50%、60%、75%、 80%、85%、90%、95%、97.5%、99%或更大。可使用用于比对序列的任何合适的算法来确 定最佳比对,其非限制性示例包括史密斯-沃特曼(Smith-Waterman)算法、尼德曼-翁施 (Needleman-Wunsch)算法、基于巴罗斯-维勒(Burrows-Wheeler)变换的算法(例如巴罗斯-维勒 比对仪)、ClustalW、Clustal X、BLAT、Novoalign(NovocraftTechnologies;可在 www.novocraft.com获得)、ELAND(Illumina,San Diego,CA)、SOAP(可在 soap.genomics.org.cn获得)和Maq(可在maq.sourceforge.net获得)。在一些实施方案中,向导 序列的长度为约或超过约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多个核苷酸。在一些实施方案 中,向导序列的长度少于约75、50、45、40、35、30、25、20、15、12个或更少核苷酸。 优选地,所述向导RNA序列是10至30个核苷酸长,诸如30个核苷酸长。向导RNA序列 指导CRISPR复合物与靶序列的序列特异性结合的能力可以通过任何合适的测定法来评价。 举例来说,可以将CRISPR系统中足以形成CRISPR复合物的组分,包括欲测试的向导序列, 提供给具有相应靶序列的宿主细胞,诸如通过用编码所述CRISPR序列的组分的载体进行转 染,然后评价所述靶序列内的优先切割,诸如通过本文所述的Surveyor测定法。类似地, 可以在试管中通过以下方式评估对靶多核苷酸序列的切割:提供所述靶序列、CRISPR复合 物的组分(包括欲测试的向导序列)和与所述测试向导序列不同的对照向导序列,以及比较测 试向导序列反应与对照向导序列反应之间在所述靶序列处的结合或切割速率。其他测定法是 有可能的,而且会被本领域技术人员想到。可以选择向导序列以靶向任何靶序列。在一些实 施方案中,所述靶序列是细胞基因组内的序列。示例性靶序列包括靶基因组中独特的那些。
如本文所用,术语VI型CRISPR-Cas基因座效应蛋白的“crRNA”或“向导RNA”或“单向 导RNA”或“sgRNA”或“一种或多种核酸组分”包含与靶核酸序列具有足以与靶核酸序列杂交 并指导RNA靶向复合物与靶RNA序列的序列特异性结合的互补性的任何多核苷酸序列。
在一些实施例中,所述组合物可以包含Cas蛋白和异源向导序列,例如向导序列和Cas 蛋白在自然界中不存在于相同细胞或相同物种中。
在某些实施方案中,本文提供的CRISPR系统可以利用包含向导序列的crRNA或类似 多核苷酸,其中所述多核苷酸是RNA、DNA或RNA和DNA的混合物,和/或其中所述多 核苷酸包含一个或多个核苷酸类似物。所述序列可以包含任何结构,包括但不限于天然 crRNA的结构,例如凸起、发夹或茎环结构。在某些实施方案中,包含向导序列的多核苷 酸与可以是RNA或DNA序列的第二多核苷酸序列形成了双链体。
在某些实施方案中,本发明的向导包括非天然存在的核酸和/或非天然存在的核苷酸和/ 或核苷酸类似物和/或化学修饰。非天然存在的核酸可以包括例如天然和非天然存在的核苷 酸的混合物。非天然存在的核苷酸和/或核苷酸类似物可以在核糖、磷酸和/或碱基部分进行 修饰。在本发明的一个实施方案中,向导核酸包括核糖核苷酸和非核糖核苷酸。在一个这样 的实施方案中,向导包含一个或多个核糖核苷酸和一个或多个脱氧核糖核苷酸。在本发明的 一个实施方案中,所述向导包含一个或多个非天然存在的核苷酸或核苷酸类似物,诸如具有 硫代磷酸酯键连、硼代磷酸酯键连的核苷酸、在核糖环的2'和4'碳之间包含亚甲基桥的锁核 酸(LNA)核苷酸或桥接核酸(BNA)。修饰核苷酸的其他示例包括2'-O-甲基类似物、2'-脱氧类 似物、2-硫尿苷类似物、N6-甲基腺苷类似物或2'-氟代类似物。修饰碱基的其他示例包括但 不限于2-氨基嘌呤、5-溴代-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)、 肌苷、7-甲基鸟苷。向导RNA化学修饰的示例包括但不限于在一个或多个末端核苷酸处并 入2'-O-甲基(M)、2'-O-甲基3'硫代磷酸酯(MS)、S-约束乙基(cEt)或2'-O-甲基3'硫代PACE (MSP)。这种化学修饰的向导RNA可以包括与未修饰的向导RNA相比增加的稳定性和增加 的活性,但不可预测中靶与脱靶特异性。(参见Hendel,2015,Nat Biotechnol.33(9):985-9,doi: 10.1038/nbt.3290,2015年6月29日在线发表;Allerson等,J.Med.Chem.2005,48:901-904; Bramsen等,Front.Genet.,2012,3:154;Deng等,PNAS,2015,112:11870-11875;Sharma等, MedChemComm.,2014,5:1454-1471;Li等,Nature Biomedical Engineering,2017,1,0066 DOI:10.1038/s41551-017-0066)。
在一些实施方案中,向导RNA的5'和/或3'端被多种功能部分修饰,包括荧光染料、聚 乙二醇、胆固醇、蛋白质或检测标签。(参见Kelly等,2016,J.Biotech.233:74-83)。在某些实 施方案中,向导包含与靶DNA结合的区域中的核糖核苷酸和与Cas9、Cpf1或C2c1结合的 区域中的一个或多个脱氧核糖核苷酸和/或核苷酸类似物。在本发明的一个实施方案中,脱 氧核糖核苷酸和/或核苷酸类似物被并入工程改造的向导结构中,诸如但不限于5'和/或3'端、 茎环区和种子区。在某些实施方案中,所述修饰不在茎环区的5'柄中。向导茎环区的5'柄中 的化学修饰可能会消除其功能(参见Li等,Nature BiomedicalEngineering,2017,1:0066)。在某 些实施方案中,对向导的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核 苷酸进行化学修饰。在一些实施方案中,对向导3'或5'端的3至5个核苷酸进行化学修饰。 在一些实施方案中,仅在种子区中引入微小修饰,诸如2'-F修饰。在一些实施方案中,在向 导的3'端引入2'-F修饰。在某些实施方案中,向导5'和/或3'端的三至五个核苷酸用2'-O-甲 基(M)、2'-O-甲基-3'-硫代磷酸酯(MS)、S-约束乙基(cEt)或2'-O-甲基-3'-硫代PACE(MSP)进 行了化学修饰。这种修饰可以增强基因组编辑效率(参见Hendel等,Nat.Biotechnol.(2015) 33(9):985-989)。在某些实施方案中,向导的所有磷酸二酯键都被硫代磷酸酯(PS)取代以提 高基因破坏的水平。在某些实施方案中,向导5'和/或3'端的超过五个核苷酸用2'-O-Me、2'-F 或S-约束乙基(cEt)进行了化学修饰。这种化学修饰的向导可以介导增强的基因破坏水平(参 见Ragdarm等,0215,PNAS,E7110-E7111)。在本发明的一个实施方案中,向导被修饰以在 其3'和/或5'端包含化学部分。此类部分包括但不限于胺、叠氮化物、炔烃、硫代、二苯并 环辛炔(DBCO)或罗丹明。在某些实施方案中,所述化学部分通过诸如烷基链等接头与向导 缀合。在某些实施方案中,修饰的向导的化学部分可以用于将所述向导连接至另一分子,诸 如DNA、RNA、蛋白质或纳米颗粒。这种化学修饰的向导可用于鉴定或富集一般由CRISPR 系统编辑的细胞(参见Lee等,eLife,2017,6:e25312,DOI:10.7554)。
在一些实施方案中,对向导的修饰是化学修饰、插入、缺失或断裂。在一些实施方案中, 化学修饰包括但不限于并入2'-O-甲基(M)类似物、2'-脱氧类似物、2-硫尿苷类似物、N6-甲 基腺苷类似物、2'-氟代类似物、2-氨基嘌呤、5-溴代-尿苷、假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、 5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷、2'-O-甲基-3'-硫代磷酸酯(MS)、S-约束乙基(cEt)、 硫代磷酸酯(PS)或2'-O-甲基-3'-硫代PACE(MSP)。在一些实施方案中,所述向导包含一个 或多个硫代磷酸酯修饰。在某些实施方案中,所述向导的至少1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20或25个核苷酸被化学修饰。在某些实施方 案中,所述种子区中的一个或多个核苷酸被化学修饰。在某些实施方案中,3'末端的一个或 多个核苷酸被化学修饰。在某些实施方案中,5'-柄中的核苷酸无一被化学修饰。在一些实施 方案中,种子区中的化学修饰是微小修饰,诸如并入2'-氟代类似物。在一个具体实施方案 中,种子区的一个核苷酸被替换为2'-氟代类似物。在一些实施方案中,3'-末端的5或10个 核苷酸被化学修饰。Cpf1 CrRNA 3'末端的这种化学修饰提高了基因切割效率(参见Li等, Nature Biomedical Engineering,2017,1:0066)。在一个具体实施方案中,3'-末端的5个核苷酸 被替换为2'-氟代类似物。在一个具体实施方案中,3'-末端的10个核苷酸被替换为2'-氟代类 似物。在一个具体实施方案中,3'-末端的5个核苷酸被替换为2'-O-甲基(M)类似物。
在一些实施方案中,向导的5'-柄的环被修饰。在一些实施方案中,向导的5'-柄的环经 过修饰而具有缺失、插入、断裂或化学修饰。在某些实施方案中,所述环包含3、4或5个核苷酸。在某些实施方案中,所述环包含序列UCUU、UUUU、UAUU或UGUU。
在一个方面,所述向导包括通过非磷酸二酯键化学连接或缀合的部分。在一个方面,在 非限制性示例中,所述向导包括顺向重复序列部分和靶向序列部分,它们通过非核苷酸环化 学连接或缀合。在一些实施方案中,所述部分通过非磷酸二酯共价接头连接。共价接头的示 例包括但不限于选自由以下组成的组的化学部分:氨基甲酸酯、醚、酯、酰胺、亚胺、脒、 氨基三嗪、腙、二硫化物、硫醚、硫酯、硫代磷酸酯、二硫代磷酸酯、磺酰胺、磺酸酯、砜、 亚砜、脲、硫脲、酰肼、肟、三唑、光不稳定键连、C-C键形成基团,诸如狄尔斯-阿德耳环加成对或闭环复分解对和迈克尔反应对。
在一些实施方案中,首先使用标准亚磷酰胺合成方案合成向导的部分(Herdewijn,P.编, Methods in Molecular Biology Col 288,OligonucleotideSynthesis:Methods and Applications, Humana Press,New Jersey(2012))。在一些实施方案中,可以使用本领域已知的标准方案 (Hermanson,G.T.,Bioconjugate Techniques,Academic Press(2013))将非靶向性向导部分官能 化以含有用于连接的适当官能团。官能团的示例包括但不限于羟基、胺、羧酸、羧酸卤化物、 羧酸活性酯、醛、羰基、氯代羰基、咪唑基羰基、酰肼、氨基脲、硫代氨基脲、硫醇、马来 酰亚胺、卤代烷基、磺酰基、烯丙基、炔丙基、二烯、炔烃和叠氮化物。一旦向导的非靶向 部分被官能化,就可以在两个寡核苷酸之间形成共价化学键或键连。化学键的示例包括但不 限于基于以下的那些:氨基甲酸酯、醚、酯、酰胺、亚胺、脒、氨基三嗪、腙、二硫化物、 硫醚、硫酯、硫代磷酸酯、二硫代磷酸酯、磺酰胺、磺酸酯、砜、亚砜、脲、硫脲、酰肼、 肟、三唑、光不稳定键连、C-C键形成基团,诸如狄尔斯-阿德耳环加成对或闭环复分解对 和迈克尔反应对。
在一些实施方案中,可以化学合成向导的一个或多个部分。在一些实施方案中,化学合 成使用了自动化固相寡核苷酸合成机器与2'-乙酰氧基乙基原酸酯(2'-ACE)(Scaringe等,J. Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)或2'- 硫代氨基甲酸酯(2'-TC)化学反应(Dellinger等,J.Am.Chem.Soc.(2011)133:11540-11546; Hendel等,Nat.Biotechnol.(2015)33:985-989)。
在一些实施方案中,向导部分可以使用各种生物缀合反应、环、桥和非核苷酸连接,通 过修饰糖、核苷酸间磷酸二酯键、嘌呤和嘧啶残基而共价连接。Sletten等,Angew.Chem.Int. Ed.(2009)48:6974-6998;Manoharan,M.Curr.Opin.Chem.Biol.(2004)8:570-9;Behlke等, Oligonucleotides(2008)18:305-19;Watts等,Drug.Discov.Today(2008)13:842-55;Shukla 等,ChemMedChem(2010)5:328-49。
在一些实施方案中,向导部分可以使用点击化学反应共价连接。在一些实施方案中,向 导部分可以使用三唑接头共价连接。在一些实施方案中,向导部分可以使用涉及炔烃和叠氮 化物的胡伊斯根(huisgen)1,3-偶极环加成反应共价连接以产生高度稳定的三唑接头(He等, ChemBioChem(2015)17:1809-1812;WO 2016/186745)。在一些实施方案中,向导部分通过 连接5'-己炔部分和3'-叠氮化物部分共价连接。在一些实施方案中,5'-己炔向导部分和3'- 叠氮化物向导部分中任一者或两者都可以用2'-乙酰氧基乙基原酸酯(2'-ACE)基团加以保护, 随后可以使用达尔马科恩(Dharmacon)方案去除(Scaringe等,J.Am.Chem.Soc.(1998)120: 11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)。
在一些实施方案中,向导部分可以通过包含诸如间隔子、连接物、生物缀合物、发色团、 报告基团、染料标记的RNA和非天然存在的核苷酸类似物部分等部分的接头(例如,非核苷 酸环)共价连接。更具体来说,用于本发明目的的合适的间隔子包括但不限于聚醚(例如聚乙 二醇、多元醇、聚丙二醇或乙二醇和丙二醇的混合物)、多胺基团(例如精胺、亚精胺及其聚 合衍生物)、聚酯(例如,聚(丙烯酸乙酯))、聚磷酸二酯、亚烷基及其组合。合适的连接物包 括可以添加到接头以便给所述接头添加额外特性的任何部分,诸如但不限于荧光标记物。合 适的生物缀合物包括但不限于肽、糖苷、脂质、胆固醇、磷脂、二酰基甘油和二烷基甘油、 脂肪酸、烃、酶底物、类固醇、生物素、洋地黄毒苷、碳水化合物、多糖。合适的发色团、 报告基团和染料标记的RNA包括但不限于荧光染料(诸如荧光素和罗丹明)、化学发光、电 化学发光和生物发光标记化合物。缀合两种RNA组分的示例接头的设计也描述于WO 2004/015075中。
接头(例如,非核苷酸环)可以是任何长度。在一些实施方案中,接头的长度相当于约0 至16个核苷酸。在一些实施方案中,接头的长度相当于约0至8个核苷酸。在一些实施方案中,接头的长度相当于约0至4个核苷酸。在一些实施方案中,接头的长度相当于约2 个核苷酸。示例接头设计也描述于WO2011/008730中。
在一些实施方案中,当使用合适的比对算法进行最佳比对时,互补程度为约或大于约 50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。可使用用于比对序列的 任何合适的算法来确定最佳比对,其非限制性示例包括史密斯-沃特曼算法、尼德曼-翁施算 法、基于巴罗斯-维勒变换的算法(例如巴罗斯-维勒比对仪)、ClustalW、Clustal X、BLAT、 Novoalign(Novocraft Technologies;可在www.novocraft.com获得)、ELAND(Illumina,San Diego,CA)、SOAP(可在soap.genomics.org.cn获得)和Maq(可在maq.sourceforge.net获得)。 可以通过任何合适的测定法来评价向导序列(在RNA靶向性向导RNA或crRNA内)指导核 酸靶向复合物与靶核酸序列的序列特异性结合的能力。举例来说,可以将RNA靶向性 CRISPR-Cas系统中足以形成核酸靶向性复合物的组分,包括欲测试的向导序列,提供给具 有相应靶核酸序列的宿主细胞,诸如通过用编码所述核酸靶向性复合物的组分的载体转染, 然后评价所述靶核酸序列内的优先靶向(例如,切割),诸如通过如本文所述的Surveyor测定 法。类似地,可以在试管中通过以下方式评估对靶核酸序列的切割:提供所述靶核酸序列、 核酸靶向性复合物的组分(包括欲测试的向导序列)和与所述测试向导序列不同的对照向导 序列,以及比较所述测试向导序列反应与所述对照向导序列反应之间在所述靶序列处的结合 或切割速率。其他测定法是有可能的,而且会被本领域技术人员想到。可以选择向导序列和 因此RNA靶向性向导RNA或crRNA来靶向任何靶核酸序列。所述靶序列可以是DNA。所 述靶序列可以是任何RNA序列。在一些实施方案中,所述靶序列可以是RNA分子内的序 列,所述RNA分子选自由以下组成的组:信使RNA(mRNA)、前mRNA、核糖体RNA(rRNA)、 转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小核RNA(snRNA)、小核 仁RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长非编码RNA(lncRNA) 和小胞质RNA(scRNA)。在一些优选实施方案中,所述靶序列可以是选自由mRNA、前 mRNA和rRNA组成的组的RNA分子内的序列。在一些优选实施方案中,所述靶序列可以 是选自由ncRNA和lncRNA组成的组的RNA分子内的序列。在一些更优选实施方案中,所 述靶序列可以是mRNA分子或前mRNA分子内的序列。
在一些实施方案中,选择RNA靶向性向导RNA或crRNA以降低所述RNA靶向性向 导RNA或crRNA内的二级结构程度。在一些实施方案中,所述RNA靶向性向导RNA的 核苷酸中约或少于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或更少在 最佳折叠时参与了自身互补碱基配对。最佳折叠可以通过任何合适的多核苷酸折叠算法来确 定。一些程序基于计算最小吉布斯自由能。一种此类算法的示例是mFold,如Zuker和Stiegler(Nucleic Acids Res.9(1981),133-148)所述。另一种示例折叠算法是在线网络服务器RNAfold,由维也纳大学理论化学研究所开发,使用了质心结构预测算法(参见例如A.R.Gruber等,2008,Cell 106(1):23-24;以及PA Carr和GM Church,2009,NatureBiotechnology 27(12):1151-62)。
在一些实施方案中,设计或选择核酸靶向性向导以调节向导分子之间,诸如不同向导分 子的茎环区之间的分子间相互作用。应当理解,一个向导内碱基配对形成茎环的核苷酸还能 够碱基配对与第二向导形成分子间双链体,并且这种分子间双链体不会具有与CRISPR复合 物形成相容的二级结构。因此可用于选择或设计DR序列以调节茎环形成和CRISPR复合物 形成。在一些实施方案中,约或少于约75%、50%、40%、30%、25%、20%、15%、10%、 5%、1%或更少的核酸靶向性向导在分子间双链体中。应当理解,茎环变异通常会在 DR-CRISPR效应子相互作用所施加的限制内。用以调节茎环形成或改变茎环与分子间双链 体之间的平衡的一种方式是改变DR的茎环的茎中的核苷酸对。举例来说,在一个实施方案 中,G-C对被替换为A-U或U-A对。在另一个实施方案中,A-U对被取代为G-C或C-G对。在另一个实施方案中,天然存在的核苷酸被替换为核苷酸类似物。用以调节茎环形成或改变 茎环与分子间双链体之间的平衡的另一种方式是修饰DR的茎环的环。不受理论束缚,所述 环可以被视为侧接两个彼此互补的序列的插入序列。当该插入序列不自身互补时,其作用将 是使分子间双链体形成去稳定化。当向导被多路化时,相同原理适用:虽然靶向序列可能不 同,但修饰不同向导的DR中的茎环区可能是有利的。此外,当向导被多路化时,可以通过 平衡各个单独向导的活性来调节不同向导的相对活性。在某些实施方案中,确定了分子间茎 环与分子间双链体之间的平衡。该确定可以通过物理或生化手段进行,并且可以在存在或不 存在CRISPR效应子的情况下进行。
在某些实施方案中,向导RNA或crRNA可以包含顺向重复(DR)序列和向导序列或间隔 子序列、基本上由其组成或由其组成。在某些实施方案中,所述指导RNA或crRNA可以包含与向导序列或间隔子序列融合或连接的顺向重复序列、基本上由其组成或由其组成。在某 些实施方案中,所述顺向重复序列可以位于向导序列或间隔子序列的上游(即,5')。在其他 实施方案中,所述顺向重复序列可以位于向导序列或间隔子序列的下游(即,3')。在其他实 施方案中,可能存在多个DR(诸如双DR)。
在某些实施方案中,所述crRNA包含茎环,优选单茎环。在某些实施方案中,所述顺向重复序列形成茎环,优选单茎环。
在某些实施方案中,向导RNA的间隔子长度为15至35nt。在某些实施方案中,向导RNA的间隔子长度为至少15个核苷酸。在某些实施方案中,间隔子长度为15至17nt,例 如15、16或17nt,17至20nt,例如17、18、19或20nt,20至24nt,例如20、21、22、 23或24nt,23至25nt,例如23、24或25nt,24至27nt,例如24、25、26或27nt,27 至30nt,例如27、28、29或30nt,30至35nt,例如30、31、32、33、34或35nt,或35 nt或更长。
术语“tracrRNA”或类似术语包括与crRNA序列具有足以杂交的互补性的任何多核苷酸 序列。一般来说,互补程度是指sca序列和tracr序列沿两个序列中较短者的长度的最佳比 对。最佳比对可以通过任何合适的比对算法确定,并且可以进一步考虑二级结构,诸如sca 序列或tracr序列内的自身互补性。在一些实施方案中,当最佳比对时,tracr序列和sca序 列之间沿两者中较短者的长度的互补程度为约或大于约25%、30%、40%、50%、60%、70%、 80%、90%、95%、97.5%、99%或更高。在某些实施方案中,可能不需要tracrRNA。实际 上,来自动物溃疡伯格氏菌的CRISPR-Cas效应蛋白及其直系同源物不需要tracrRNA来确 保对RNA靶标的切割。
更详细地,假如需要PFS序列来指导识别,则针对RNA靶标的测定如下。在该测定中使用两种大肠杆菌菌株。一种携带编码细菌菌株的内源效应蛋白基因座的质粒。另一种菌株 携带空质粒(例如pACYC184,对照菌株)。所有可能的7或8bp PFS序列都呈递在抗生素抗性质粒(具有氨苄青霉素抗性基因的pUC19)上。PFS位于原间隔子1的序列附近(RNA靶向 内源效应蛋白基因座中的第一个间隔子)。克隆了两个PFS或PAM文库。一个具有在原间 隔子5'的8个随机bp(例如,总计65536个不同的PFS或PAM序列=复杂度)。另一个文库 具有在原间隔子3'的7个随机bp(例如,总复杂度是16384个不同的PFS)。将两个文库都克 隆至每个可能的PFS具有平均500个质粒。测试菌株和对照菌株在单独的转化中用5'PFS 和3'PFS文库进行转化,并将转化过的细胞分别接种在氨苄青霉素板上。对质粒的识别和 随后的切割/干扰致使细胞易受氨苄青霉素影响并阻止生长。转化之后大约12小时,收集由 测试菌株和对照菌株形成的所有菌落并分离质粒RNA。使用质粒RNA作为PCR扩增和后 续深度测序的模板。未转化文库中所有PFS的表示都显示了转化细胞中PFS的预期表示。 在对照菌株中发现的所有PFS或PAM的表示都显示了实际表示。测试菌株中所有PFS的表 示都显示了哪些PFS不被酶识别,并且与对照菌株的比较允许提取消耗的PFS的序列。在 具体实施方案中,诸如RNA切割等切割不依赖于PFS或PAM。实际上,对于动物溃疡伯 格氏菌Cas13b效应蛋白及其直系同源物,RNA靶标切割似乎不依赖PFS,因此本发明的 Cas13能以非PFS或PAM依赖性方式起作用。
为了最小化毒性和脱靶效应,控制所递送的RNA靶向性向导RNA的浓度将非常重要。 核酸靶向性向导RNA的最佳浓度可以通过在细胞或非人真核动物模型中测试不同的浓度并 使用深度测序分析潜在脱靶基因组基因座的修饰程度来确定。体内递送时应当选择提供最高 水平的中靶修饰同时最小化脱靶修饰水平的浓度。RNA靶向系统有利地衍生自CRISPR-Cas 系统。在一些实施方案中,RNA靶向系统的一个或多个元件来源于包含如本文讨论的Cas13 蛋白的内源RNA靶向系统的特定生物体。
死向导序列
在一个方面,本发明提供了向导序列,所述向导序列以允许形成CRISPR Cas复合物并 成功结合至靶标的方式加以修饰,同时不允许抑或不允许成功的核酸酶活性(即,没有核酸 酶活性/没有插入缺失活性)。为了便于解释,这种修饰的向导序列称为“死向导”或“死向导序 列”。就核酸酶活性而言,可以认为这些死向导或死向导序列是催化失活或构象失活的。实 际上,就促进催化活性或区分中靶和脱靶结合活性的能力而言,死向导序列可能不足以参与 生产性碱基配对。简而言之,该测定包括合成CRISPR靶RNA和包含与靶RNA的错配的 向导RNA,将这些与RNA靶向酶组合,并基于凝胶基于存在由切割产物产生的条带来分析 切割,以及基于相对条带强度对切割进行定量。
因此,在一个相关方面,本发明提供了一种非天然存在或工程改造的组合物RNA靶向 性CRISPR-Cas系统,其包含如本文所述的功能RNA靶向酶和向导RNA(gRNA)或crRNA, 其中所述gRNA或crRNA包含死向导序列,由此所述gRNA能够与靶序列杂交,使得所述 RNA靶向性CRISPR-Cas系统在不存在所述系统的非突变RNA靶向酶的可检测RNA切割 活性的情况下针对细胞中的目标基因组基因座。应当理解,如本文在别处所述的根据本发明 的任何gRNA或crRNA都可以用作包含死向导序列的死gRNA/crRNA。
死向导序列指导CRISPR复合物与RNA靶序列的序列特异性结合的能力可以通过任何 合适的测定法来评价。举例来说,可以将CRISPR-Cas系统中足以形成CRISPR-Cas复合物的组分,包括欲测试的死向导序列,提供给具有相应靶序列的宿主细胞,诸如通过用编码所述系统的组分的载体进行转染,然后评价所述靶序列内的优先切割。
如本文进一步解释,若干结构参数允许适当的框架到达这种死向导。死向导序列通常可 以比引起活性RNA切割的相应向导序列短。在具体实施方案中,死向导比针对其的相应向 导短5%、10%、20%、30%、40%、50%。
如下文所解释和本领域已知,gRNA或crRNA-RNA靶向特异性的一个方面是顺向重复 序列,其被适当地连接至此类向导。具体来说,这意味着顺向重复序列的设计取决于RNA靶向酶的起点。可用于经过验证的死向导序列的结构数据可用于设计CRISPR-Cas特异性等效物。例如,两个或更多个CRISPR-Cas效应蛋白的直系同源核酸酶结构域HEPN之间的结 构相似性可用于转移设计等效死向导。因此,本文的死向导可以在长度和序列方面经过适当修饰以反映这种CRISPR-Cas特异性等效物,从而允许形成CRISPR-Cas复合物并成功结合至靶RNA,同时不允许成功的核酸酶活性。
死向导允许使用gRNA或crRNA作为基因靶向的手段,而没有核酸酶活性的后果,同时提供了用于激活或阻遏的定向手段。向导RNA或包含死向导的crRNA可以经过修饰,从 而以允许激活或阻遏基因活性的方式进一步包括诸多元件,特别是如本文在别处描述的允许功能性放置基因效应子(例如基因活性激活子或阻遏子)的蛋白质衔接子(例如适体)。一个示 例是如本文和现有技术所解释并入适体。通过工程改造包含死向导的gRNA或crRNA以并入蛋白质相互作用适体(Konermann等,“Genome-scale transcription activation by anengineered CRISPR-Cas9 complex,”doi:10.1038/nature14136,通过引用并入本文),人们可以组装多个不 同的效应结构域。这可以效仿自然过程。
先导编辑
所述组合物和系统可用于先导编辑。在一些实施方案中,所述组合物和系统可以包含 Cas蛋白和与Cas缔合的RNA聚合酶(例如,RNA依赖性RNA聚合酶),以及向导分子。
在一些实施方案中,本文的Cas蛋白可用于先导编辑。在一些情况下,所述Cas蛋白可 以是切口酶,例如RNA切口酶。所述Cas蛋白可以是dCas。在一些情况下,所述Cas具有 一个或多个突变。在一些情况下,所述向导分子可以是先导编辑向导分子。
所述Cas蛋白可以与RNA聚合酶缔合。所述RNA聚合酶可以融合到Cas蛋白的C末端。替代地或另外地,所述RNA聚合酶可以融合到Cas蛋白的N末端。所述融合可以通过 接头和/或衔接蛋白。在一些实施例中,所述RNA聚合酶可以是RNA依赖性RNA聚合酶, 其促进RNA从RNA模板复制,例如,合成与指定RNA模板互补的RNA链。
用于先导编辑的向导分子可以是先导编辑向导分子(也称为先导编辑向导分子)(pegRNA)。在一些实施例中,pegRNA是包含引物结合序列(PBS)和含有所需RNA序列(例 如,添加在3'端)的模板的sgRNA。
在一些实施方案中,本文的Cas蛋白可以使用含有与DNA上的靶序列杂交的结合序列 的向导RNA来靶向DNA。所述向导RNA还可以包含编辑序列,所述编辑序列含有替换靶DNA核苷酸的新遗传信息。本文的Cas蛋白的小尺寸可以更容易包装和递送先导编辑系统,例如用病毒载体,例如AAV或慢病毒载体。
所述Cas蛋白可以在靶核酸(例如RNA)上在靶位点处产生单链断裂(切口)以暴露3'-羟 基,因此引发RNA聚合酶在所述向导上直接编辑编码延伸至靶位点中。这些步骤可能产生 具有两个冗余单链核酸瓣的分支中间物:5'瓣含有未编辑的核酸序列,而3'瓣含有从所述向 导RNA拷贝的编辑序列。所述5'瓣可以通过能切除在滞后链核酸合成和长补丁碱基切除修 复过程中产生的5'瓣的结构特异性内切核酸酶(例如FEN122)去除。可以对未编辑的核酸链 进行切口以诱导核酸修复偏向优先替换未编辑的链。先导编辑系统和方法的示例包括以下文 献中所述的那些:Anzalone AV等,Search-and-replace genome editingwithout double-strand breaks or donor DNA,Nature.2019年10月21日.doi:10.1038/s41586-019-1711-4,该文献通 过引用整体并入本文。实施例中的逆转录酶可以替换为RNA聚合酶(例如RNA依赖性RNA 聚合酶)。
所述Cas蛋白可用于对靶核酸(例如,RNA)上的单个核苷酸进行先导编辑。替代地或另 外地,所述Cas蛋白可用于先导编辑靶核酸上的至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少10个、至少11个、至少12个、至少13个、 至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至 少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少 28个、至少29个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80 个、至少90个、至少100个、至少200个、至少300个、至少400个、至少500个、至少 600个、至少700个、至少800个、至少900个或至少10000个核苷酸。
诊断和检测系统
本文所述的VI型CRISPR蛋白可效力于基于CRISPR的诊断(CRISPR-Dx)。CRISPR-Cas 可以用向导分子重新编程,以便为特异性RNA和DNA检测提供平台。在识别其RNA或 DNA靶标后,激活的CRISPR-Cas参与“旁系”切割附近的非靶向核酸(例如RNA和/或 ssDNA)。参见Abudayyeh等,“C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector.”Science.2016年8月5日;353(6299);Gootenberg等,“Nucleic acid detection with CRISPR-Cas13a/C2c2”Science.2017年4月28日;356,438-442。
旁系活性
在一些实施方案中,所述Cas蛋白具有旁系活性,即在某些环境中,活化的Cas蛋白在 结合靶序列后保持活性并继续非特异性地切割非靶寡核苷酸。这种向导分子程序化的旁系切 割活性提供了使用Cas13系统检测特定靶寡核苷酸的存在以触发可用作读数的体内程序性 细胞死亡或体外非特异性RNA降解的能力。(Abudayyeh等,2016;East-Seletsky等,2016)。
RNA引导型Cas13的可编程性、特异性和旁系活性也使其成为用于非特异性切割核酸 的理想可切换核酸酶。在一个实施方案中,Cas13系统经过工程改造以提供和利用诸如ssDNA等核酸的旁系非特异性切割。在另一个实施方案中,Cas13系统经过工程改造以提供和利用ssDNA的旁系非特异性切割。因此,工程改造的Cas13系统可以为核酸检测和转录 组操作以及诱导细胞死亡提供平台。可以开发Cas13以供用作哺乳动物转录物敲低和结合工具。当通过序列特异性靶向性DNA结合激活时,Cas13可能能够对RNA和ssDNA进行强 有力的旁系切割。
在某些实施方案中,在体外系统或细胞中瞬时或稳定地提供或表达Cas13,并加以靶向 或触发以便非特异性地切割细胞核酸。在一个实施方案中,工程改造了Cas13以敲低ssDNA, 例如病毒ssDNA。在另一个实施方案中,工程改造了Cas13以敲低RNA。可以设计所述系 统,使得敲低取决于细胞或体外系统中存在的靶DNA,或通过向所述系统或细胞加入靶核 酸来触发。
在一个实施方案中,工程改造了所述Cas13系统以非特异性地切割可通过存在异常DNA 序列加以区分的细胞亚组中的RNA,例如其中对所述异常DNA的切割可能不完全或不成 功。在一个非限制性示例中,靶向存在于癌细胞中并驱动细胞转化的DNA易位。尽管经历染色体DNA和修复的细胞亚组可能存活,但非特异性旁系核糖核酸酶活性有利地导致潜在幸存者的细胞死亡。
旁系活性最近被用于称为SHERLOCK的高灵敏度特异性核酸检测平台,该平台可用于 许多临床诊断(Gootenberg,J.S.等,Nucleic acid detection with CRISPR-Cas13a/C2c2.Science 356,438-442(2017))。
根据本发明,工程改造的Cas13系统针对DNA或RNA内切核酸酶活性进行了优化,并且可以在哺乳动物细胞中表达以及被靶向以便有效地敲低细胞中的报告分子或转录物。
工程改造的Cas13在等温扩增下的旁系效应提供了基于CRISPR的诊断,从而提供了具 有高灵敏度和单碱基错配特异性的快速DNA或RNA检测。使用Cas13的分子检测平台检测特定病毒株、区分致病菌、对人类DNA进行基因分型和鉴定无细胞肿瘤DNA突变。此 外,反应试剂可以冻干以实现冷链独立和长期储存,并且容易在纸上复原以供现场应用。
在便携式平台上以高灵敏度和单碱基特异性快速检测核酸的能力可能有助于疾病诊断 和监测、流行病学和一般实验室任务。尽管存在检测核酸的方法,但它们在灵敏度、特异性、 简单性、成本和速度之间有所取舍。
这种旁系活性允许本文公开的VI型CRISPR-Cas系统通过触发程序性细胞死亡或通过 标记的RNA或ssDNA的非特异性降解来检测体内特定RNA或DNA的存在。因此,本文 公开的实施方案包括基于核酸扩增和CRISPR-Cas介导旁系切割经过标记的检测寡核苷酸,从而允许实时检测靶标的高灵敏度核酸检测系统。非特异性单链DNA和RNA定向蛋白的 保守性将不可避免地引起进一步而且有可能改善显示旁系切割并且可用于检测的CRISPR 蛋白,并且为多路检测扩增和高灵敏度(尤其是SHERLOCK)的诊断系统中的核酸靶标提供 了更大的广度。
在某些示例性实施方案中,检测系统包含本文公开的VI型Cas蛋白和包含经配置以指 导所述CRISPR-Cas复合物与靶分子结合的向导序列的向导分子以及标记的检测分子(“基于 RNA的掩蔽构建体”)。已知VI型和V型Cas蛋白具有不同的切割基序偏好。参见Gootenberg 等,“Multiplexed and portable nucleic acid detection platform withCas13b,Cas12a,and Csm6.” Science.2018年4月27日,360:439-444;国际公开WO 2019/051318。因此,本文公开的实 施方案还可以包括包含两种或更多种具有不同切割偏好的VI型Cas蛋白或者一种或多种VI 型Cas蛋白和一种或多种V型Cas蛋白的多路实施方案。因此,在此类实施方案中,检测 分子经配置以便仅根据VI型或V型Cas蛋白之一的切割偏好切割各个类别的检测分子,并 且因此仅在被相应直系同源物切割时产生可检测信号。各个直系同源物与针对不同靶RNA 的向导相匹配,因此该直系同源物的旁系活性仅在它结合其同源靶RNA时才得以激活,并 且相应的同源检测分子仅在所述靶标被结合时才被切割。通过这种方式,可以检测多个靶 RNA分子。
为便于参考,以下部分描述了可以使用的不同的基于RNA的掩蔽构建体。然而,还考 虑了与VI型Cas蛋白一起使用的单链DNA等效物。在某些示例性实施方案中,检测构建体抑制可检测正信号的产生,或所述基于RNA的掩蔽构建体通过掩蔽所述可检测正信号或替代地产生可检测负信号来抑制可检测正信号的产生,或者所述基于RNA的掩蔽构建体包含抑制由报告构建体编码的基因产物的产生的沉默RNA,其中所述基因产物在表达时产生可检测正信号。
在另一个示例性实施方案中,检测构建体是产生负可检测信号的核糖酶,并且其中当所 述核糖酶失活时产生了正可检测信号。在一个示例性实施方案中,所述核糖酶将底物转化为 第一颜色,并且其中当所述核糖酶失活时,所述底物转化为第二颜色。在另一个示例性实施 方案中,所述基于RNA的掩蔽剂是隔绝酶的适体,其中所述酶在从所述适体释放时通过作 用于底物而产生可检测信号,或者所述适体隔绝了一对剂,所述剂在从所述适体释放时组合 而产生了可检测信号。
在另一个示例性实施方案中,所述基于RNA的掩蔽构建体包含与可检测配体寡核苷酸 和掩蔽组分连接的RNA寡核苷酸。在某些示例性实施方案中,所述可检测配体是荧光团并 且所述掩蔽组分是淬灭剂分子。
在另一个方面,本发明提供了一种用于检测样品中的靶核酸(例如)RNA的方法,包括: 将样品或一组样品分配到一个或多个单独的离散体积中,所述单独的离散体积包含含有效应 蛋白的CRISPR系统、一个或多个向导RNA、基于RNA的掩蔽构建体;在足以允许所述一 个或多个向导RNA与一个或多个靶分子结合的条件下孵育所述样品或样品组;通过所述一 个或多个向导RNA与所述一个或多个靶分子结合激活了所述CRISPR效应蛋白,其中激活所述CRISPR效应蛋白引起对所述基于RNA的掩蔽构建体的修饰,从而产生了可检测正信号;以及检测所述可检测正信号,其中检测到所述可检测正信号表明样品中存在一个或多个 靶分子。
在一些实施方案中,所述在样品中检测靶核酸的方法包括:使样品与以下接触:工程改 造的CRISPR-Cas蛋白;包含能够与所述靶核酸结合并经设计以便与所述工程改造的CRISPR-Cas形成复合物的向导序列的至少一个向导多核苷酸;以及包含非靶序列的基于RNA的掩蔽构建体;其中所述工程改造的CRISPR-Cas蛋白表现出旁系RNA酶活性并切割 所述检测构建体的非靶序列;以及检测来自切割所述非靶序列的信号,从而检测所述样品中的靶核酸。在一些实施方案中,所述方法还包括使所述样品与用于扩增所述靶核酸的试剂接 触。在一些实施方案中,所述用于扩增的试剂包括等温扩增反应试剂。在一些实施方案中, 所述等温扩增试剂包括基于核酸序列的扩增、重组酶聚合酶扩增、环介导型等温扩增、链置 换扩增、解旋酶依赖性扩增或切口酶扩增试剂。
在一些实施方案中,所述靶核酸是DNA分子,并且所述方法还包括使所述靶DNA分子与包含RNA聚合酶位点的引物和RNA聚合酶接触。
在一些实施方案中,所述掩蔽构建体包含:a.抑制由报告构建体编码的基因产物的产 生的沉默RNA,其中所述基因产物在表达时产生可检测正信号;b.产生可检测负信号的核 糖酶,并且其中当所述核糖酶失活时产生了可检测正信号;或c.将底物转化为第一颜色的 核糖酶,并且其中当所述核糖酶失活时,所述底物转化为第二颜色;d.适体和/或包含多核 苷酸栓系型抑制剂;e.可检测配体和掩蔽组分连接的多核苷酸;f.通过桥分子保持呈聚集 体形式的纳米颗粒,其中所述桥分子的至少一部分包含多核苷酸,并且其中当所述纳米颗粒 分散在溶液中时所述溶液发生了颜色变化;g.通过连接分子与一个或多个淬灭剂分子连接 的量子点或荧光团,其中所述连接分子的至少一部分包含多核苷酸;h.与嵌入剂复合的多 核苷酸,其中所述嵌入剂在切割所述多核苷酸后改变了吸光度;或1.通过多核苷酸拴系的 两个荧光团,当从所述多核苷酸释放时会发生荧光变化。
在一些实施方案中,所述适体a.包含能隔绝酶的多核苷酸拴系型抑制剂,其中所述酶 在从所述适体或多核苷酸拴系型抑制剂释放时通过作用于底物而产生可检测信号;或b.是 能抑制酶并防止所述酶催化由底物产生可检测信号的抑制性适体,或其中所述多核苷酸拴系 型抑制剂抑制了酶并防止所述酶催化由底物产生可检测信号;或c.隔绝了一对剂,所述剂 在从所述适体释放时组合以产生可检测信号。
在另一方面,本发明提供了用于检测样品(例如,一个或多个体外样品)中的多肽或多核 苷酸的系统、组合物和方法。此类系统或组合物可以包含本文的Cas蛋白;一个或多个检测 适体,各自经设计而与所述一个或多个靶多肽之一结合,各个检测适体包含掩蔽的启动子结 合位点或掩蔽的引物结合位点和触发序列模板;以及包含非靶序列的基于寡核苷酸的掩蔽构 建体。所述触发序列模板可用于合成触发RNA。所述触发序列可以与向导分子结合以激活 CRISPR系统。在某些实施例中,所述系统或组合物包含本文的Cas蛋白;至少一个向导多 核苷酸,其包含经设计而与一个或多个靶序列具有一定程度的互补性(例如,至少60%、至 少70%、至少80%、至少90%、至少95%、至少99%、或100%)并经设计而与所述Cas蛋 白形成复合物的向导序列;和包含非靶序列的基于寡核苷酸的掩蔽构建体,其中所述Cas 蛋白表现出旁系核酸酶活性,并且一旦被所述一个或多个靶序列激活就切割所述基于寡核苷 酸的掩蔽构建体的所述非靶序列。
所述方法可以包括:将样品或一组样品分配到一组单独的离散体积中,所述单独的离散 体积包含肽检测适体、包含效应蛋白的CRISPR系统、一个或多个向导RNA、基于RNA的 掩蔽构建体,其中所述肽检测适体包含掩蔽的RNA聚合酶位点并经配置以结合一个或多个 靶分子;在足以允许所述肽检测适体与所述一个或多个靶分子结合的条件下孵育所述样品或 样品组,其中所述适体与相应靶分子结合暴露了所述RNA聚合酶结合位点,导致触发RNA 的RNA合成;通过所述一个或多个向导RNA与所述触发RNA结合激活了所述CRISPR效应蛋白,其中激活所述CRISPR效应蛋白引起对所述基于RNA的掩蔽构建体的修饰,从而 产生了可检测正信号;以及检测所述可检测正信号,其中检测到所述可检测正信号表明样品中存在一个或多个靶分子。
在某些示例性实施方案中,所述一个或多个向导RNA经设计以结合至可诊断疾病状态 的一个或多个靶RNA序列。在某些其他示例性实施方案中,所述疾病状态是感染、器官疾 病、血液疾病、免疫系统疾病、癌症、脑和神经系统疾病、内分泌疾病、妊娠或分娩相关疾病、遗传疾病或环境获得性疾病、癌症或真菌感染、细菌感染、寄生虫感染或病毒感染。
在某些示例性实施方案中,所述基于RNA的掩蔽构建体抑制可检测正信号的产生,或 所述基于RNA的掩蔽构建体通过掩蔽可检测正信号或替代地产生可检测负信号来抑制所述 可检测正信号的产生,或者所述基于RNA的掩蔽构建体包含抑制由报告构建体编码的基因 产物的产生的沉默RNA,其中所述基因产物在表达时产生了可检测正信号,或者所述基于 RNA的掩蔽构建体是产生负可检测信号的核糖酶,并且其中当所述核糖酶失活时产生了所 述正可检测信号。在其他示例性实施方案中,所述核糖酶将底物转化为第一状态,并且其中 当所述核糖酶失活时,所述底物转化为第二状态,或者所述基于RNA的掩蔽剂是适体,或 者所述适体隔绝了酶,其中所述酶在从所述适体释放时通过作用于底物而产生可检测信号, 或者所述适体隔绝了一对剂,所述剂在从所述适体释放时组合以产生可检测信号。在更进一 步的实施方案中,所述基于RNA的掩蔽构建体包含具有在RNA寡核苷酸的第一端的可检 测配体以及在RNA寡核苷酸的第二端的掩蔽组分的RNA寡核苷酸,或者所述可检测配体 是荧光团并且所述掩蔽组分是淬灭剂分子。
这种系统还可以与用于扩增所述靶DNA或RNA的扩增试剂(包括等温扩增试剂)组合, 当与旁系效应组合时,提供了增加的灵敏度的测定。参见Gootenberg,J.S.等,Nucleicacid detection with CRISPR-Cas13a/C2c2.Science 356,438-442(2017)。等温扩增试剂可以包括基 于解旋酶等温的扩增试剂(参见国际申请WO 2020/006036)、基于转座酶等温的扩增试剂(国 际申请WO 2020/006049)或基于切口酶等温的扩增试剂(参见国际公开WO2020/006067)。在 一个方面,所述等温扩增试剂可以与热稳定CRISPR-Cas蛋白一起使用。热稳定蛋白质和等 温扩增试剂的组合可用于进一步改善检测和诊断的反应时间。
因此,本文公开的VI型蛋白质(包括下面提供的具体示例)和CRISPR-Cas复合物还可以 与检测构建体组合,对其进行切割产生了可检测信号,表明CRISPR-Cas复合物检测到靶 RNA。
在便携式平台上以高灵敏度和单碱基特异性快速检测核酸的能力可能有助于疾病诊断 和监测、流行病学和一般实验室任务。尽管存在检测核酸的方法,但它们在灵敏度、特异性、 简单性、成本和速度之间有所取舍。下面提供了其他具体示例。
在另一个方面,本公开提供了一种非天然存在或工程改造的组合物,其包含与酶或报告 部分的无活性第一部分连接的Cas蛋白。所述酶或报告部分在与所述酶或报告部分的互补部 分接触时得以复原。所述酶或报告部分包含蛋白水解酶。在一些实施例中,所述Cas蛋白包 含与所述酶或报告部分的互补部分连接的第一Cas蛋白和第二Cas蛋白。此类组合物还可以 包含i)能够与所述第一Cas蛋白形成复合物并与靶核酸的第一靶序列杂交的第一向导;和ii) 能够与所述第二Cas蛋白形成复合物并与所述靶核酸的第二靶序列杂交的第二向导。
多核苷酸和载体
本文的系统可以包含一个或多个多核苷酸。所述多核苷酸可以包含Cas蛋白的编码序 列、向导序列或其任何组合。本公开还提供了包含本文的一种或多种多核苷酸的载体或载体 系统。所述载体或载体系统包括本文递送部分中所述的那些。
术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换使用。它们是 指任何长度的核苷酸聚合形式,即脱氧核糖核苷酸或核糖核苷酸,或其类似物。多核苷酸可 以具有任何三维结构,并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性示 例:基因或基因片段的编码或非编码区、由连锁分析定义的一个或多个基因座、外显子、内 含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核糖酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载 体、任何序列的分离DNA、任何序列的分离RNA、核酸探针和引物。该术语还涵盖具有合 成骨架的核酸样结构,参见例如Eckstein,1991;Baserga等,1992;Milligan,1993;WO 97/03211;WO96/39154;Mata,1997;Strauss-Soukup,1997;以及Samstag,1996。多核苷酸 可以包含一个或多个修饰的核苷酸,诸如甲基化核苷酸和核苷酸类似物。如果存在,则可以 在组装聚合物前后对核苷酸结构予以修饰。核苷酸序列可以间杂非核苷酸组分。多核苷酸可 以在聚合后进行进一步修饰,诸如通过与标记组分缀合。如本文所用,术语“野生型”是本领 域技术人员所理解的术语并且意指生物体、菌株、基因或特征在自然界中存在的典型形式, 与突变形式或变体形式不同。“野生型”可以是基线。如本文所用,术语“变体”应当理解为意 指模式偏离了自然界中存在的模式的品质的表现。术语“非天然存在”或“工程改造”可互换使用,并且表示人手动参与。所述术语在参考核酸分子或多肽时意指所述核酸分子或所述多肽 至少基本上不含至少一种在自然界中和在自然界中被发现时天然地与它们关联的其他组分。 “互补性”是指核酸通过传统的沃森-克里克碱基配对或其他非传统类型与另一个核酸序列形 成氢键的能力。互补性百分比表示核酸分子中可以与第二核酸序列形成氢键(例如沃森-克里 克碱基配对)的残基的百分比(例如,10个中的5、6、7、8、9、10个是50%、60%、70%、 80%、90%和100%互补)。“完全互补”意指核酸序列的所有连续残基将与第二核酸序列中相 同数目的连续残基形成氢键。如本文所用,“基本上互补”是指在8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核 苷酸的区域内至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、 或100%的互补程度,或者是指在严格条件下杂交的两个核酸。如本文所用,用于杂交的“严 格条件”是指与靶序列具有互补性的核酸主要与所述靶序列杂交并且基本上不与非靶序列杂 交的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。一般来说,序列越 长,序列与其靶序列特异性杂交的温度越高。严格条件的非限制性示例详细描述于Tijssen (1993),Laboratory Techniques In Biochemistry And Molecular Biology-HybridizationWith Nucleic Acid Probes第I部分,第二章“Overview of principles ofhybridization and the strategy of nucleic acid probe assay”,Elsevier,N.Y.中。在提及多核苷酸序列时,则还设想了互补或部 分互补的序列。这些优选能够在高度严格条件下与参考序列杂交。一般来说,为了使杂交率 最大化,选择相对较低严格度杂交条件:比热熔点(Tm)低约20至25℃。Tm是50%的特定 靶序列在限定的离子强度和pH下与溶液中的完全互补探针杂交的温度。通常,为了要求杂 交序列的至少约85%核苷酸互补性,选择比Tm低约5至15℃的高度严格洗涤条件。能够 与指定序列杂交的序列称为指定序列的“补体”。
如本文所用,术语“基因组基因座”或“基因座”(复数基因座)是基因或DNA序列在染色 体上的特定位置。“基因”是指编码在生物体中发挥作用并因此是活生物体中遗传特性的分子 单位的多肽或RNA链的DNA或RNA片段。出于本发明的目的,认为基因包括调控基因产 物产生的区域,无论这种调控序列是否与编码和/或转录序列相邻。相应地,基因包括但未 必限于启动子序列、终止子、翻译调控序列(诸如核糖体结合位点及内部核糖体进入位点)、 增强子、沉默子、绝缘子、边界元件、复制起点、基质附接位点和基因座控制区。如本文所 用,“基因组基因座的表达”或“基因表达”是来自基因的信息用于合成功能性基因产物的过 程。基因表达产物通常是蛋白质,但在诸如rRNA基因或tRNA基因等非蛋白质编码基因中, 产物是功能性RNA。所有已知的生命—真核生物(包括多细胞生物体)、原核生物(细菌和古 生菌)和病毒都使用基因表达过程来产生功能性产物以生存。如本文所用,基因或核酸的“表 达”不仅涵盖细胞基因表达,而且还包括核酸在克隆系统和任何其他背景中的转录和翻译。 如本文所用,“表达”还指多核苷酸从DNA模板转录(诸如转录为mRNA或其他RNA转录物) 的过程和/或转录的mRNA随后翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以 统称为“基因产物”。如果多核苷酸来源于基因组DNA,则表达可以包括对真核细胞中mRNA 的剪接。术语“多肽”、“肽”和“蛋白质”在本文中可互换用于指代任何长度的氨基酸聚合物。 所述聚合物可以是线性或分支的,它可以包含修饰的氨基酸,并且它可能间杂非氨基酸。该 术语还涵盖已进行过修饰例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他 操作,诸如与标记组分缀合的氨基酸聚合物。如本文所用,术语“氨基酸”包括天然和/或非 天然或合成氨基酸,包括甘氨酸和D或L光学异构体,以及氨基酸类似物和肽模拟物。如 本文所用,术语“结构域”或“蛋白质结构域”是指蛋白质序列中可以独立于蛋白质链的其余部 分而存在和发挥功能的部分。如本发明的一些方面所述,序列同一性与序列同源性有关。同 源性比较可以通过肉眼进行,或者更通常借助容易获得的序列比较程序进行。这些可商购的 计算机程序可以计算两个或更多个序列之间的同源性百分比(%),而且还可以计算两个或更 多个氨基酸或核酸序列共有的序列同一性。
在某些实施方案中,所述多核苷酸序列是重组DNA。在其他实施方案中,所述多核苷 酸序列还包含如本文在别处所述的其他序列。在某些实施方案中,所述核酸序列是在体外合 成。
本发明的诸多方面涉及编码如本文的任何实施方案中提到的CRISPR-Cas系统或Cas蛋 白的一种或多种组分的多核苷酸分子。在某些实施方案中,所述多核苷酸分子可以包含其他 调控序列。通过指导而非限制的方式,所述多核苷酸序列可以是表达质粒、小环、慢病毒载 体、逆转录病毒载体、腺病毒或腺相关病毒载体、背驮式载体或tol2载体的一部分。在某些 实施方案中,所述多核苷酸序列可以是双顺反子表达构建体。在其他实施方案中,分离的多 核苷酸序列可以并入细胞基因组中。在其他实施方案中,分离的多核苷酸序列可以是细胞基 因组的一部分。在其他实施方案中,分离的多核苷酸序列可以包含在人工染色体中。在某些 实施方案中,可以对分离的多核苷酸序列的5'和/或3'端进行修饰以提高序列的稳定性,从 而主动避免降解。在某些实施方案中,分离的多核苷酸序列可以包含在噬菌体中。在其他实 施方案中,分离的多核苷酸序列可以包含在土壤杆菌属物种中。在某些实施方案中,分离的 多核苷酸序列被冻干。
密码子优化
本发明的诸多方面涉及编码如本文的任何实施方案中所述的一个或多个CRISPR-Cas系 统的一种或多种组分的多核苷酸分子,其中所述多核苷酸分子的至少一个或多个区域可以被 密码子优化以便在真核细胞中表达。在某些实施方案中,编码如本文的任何实施方案中所述 的一个或多个CRISPR-Cas系统的一种或多种组分的多核苷酸分子被优化以便在哺乳动物细 胞或植物细胞中表达。
在这种情况下,密码子优化序列的一个示例是为了在真核生物,例如人类(即,为了在 人类中表达而优化)或如本文讨论的另一种真核生物、动物或哺乳动物中表达而优化的序列; 参见例如国际专利公开号WO 2014/093622(PCT/US2013/074667)中的SaCas9人密码子优化 序列作为密码子优化序列的示例(根据本领域和本公开的知识,密码子优化编码核酸分子, 尤其关于效应蛋白,在本领域技术人员的范围内)。尽管这是优选的,但应当理解其他示例 是有可能的,而且针对除人类以外的宿主物种的密码子优化或针对特定器官的密码子优化是 已知的。在一些实施方案中,编码DNA/RNA靶向性Cas蛋白的酶编码序列被密码子优化以 便在特定细胞,诸如真核细胞中表达。所述真核细胞可以是属于或衍生自特定生物体的那些, 所述生物体为诸如植物或哺乳动物,包括但不限于如本文讨论的人类或非人类真核生物或动 物或哺乳动物,例如小鼠、大鼠、兔、狗、牲畜或非人类哺乳动物或灵长类动物。在一些实 施方案中,可以排除有可能导致动物遭受痛苦而对人或动物没有任何实质性医学益处的用于 修饰人类种系遗传特性的方法和/或用于修饰动物遗传特性的方法以及由这些方法产生的动 物。一般来说,密码子优化是指通过在维持天然氨基酸序列的同时用更频繁或最频繁用于宿 主细胞基因中的密码子替换天然序列的至少一个密码子(例如,约或多于约1、2、3、4、5、 10、15、20、25、50个或更多个密码子)来修饰核酸序列以增强在目标宿主细胞中的表达的 方法。
各个物种对特定氨基酸的某些密码子表现出特定的偏好。密码子偏倚(生物体之间的密 码子使用差异)通常与信使RNA(mRNA)的翻译效率相关,而信使RNA(mRNA)的翻译效率 又被认为尤其取决于被翻译的密码子的性质和特定转移RNA(tRNA)分子的可用性。所选tRNA在细胞中的优势通常反映了肽合成中最常使用的密码子。因此,可以基于密码子优化来定制基因以在指定生物体中实现最佳基因表达。密码子使用表很容易获得,例如,在www.kazusa.orjp/codon/上可获得的“密码子使用数据库”,并且可以用多种方式调整这些表。 参见Nakamura,Y.等,“Codon usage tabulated from the international DNAsequence databases: status for the year 2000”Nucl.Acids Res.28:292(2000)。还可利用密码子优化特定序列以在特 定宿主细胞中表达的计算机算法,诸如Gene Forge(Aptagen;Jacobus,PA)。在一些实施方 案中,编码DNA/RNA靶向性Cas蛋白的序列中的一个或多个密码子(例如,1、2、3、4、5、 10、15、20、25、50个或更多个或所有密码子)对应于特定氨基酸最常用的密码子。
碱基编辑
本公开还提供了一种碱基编辑系统。总体来说,这样的系统可以包含与Cas蛋白融合的 脱氨酶(例如,腺苷脱氨酶或胞嘧啶脱氨酶)。所述脱氨酶可以是全长蛋白质或全长蛋白质中 具有脱氨酶活性的部分。在一些实施例中,所述Cas蛋白可以是SEQ ID NO 1-4092、4102-5203和5260-5265的蛋白质或其编码核酸的突变形式。所述Cas蛋白可以是死Cas蛋白或Cas切口酶蛋白。在某些实施例中,所述系统包含与死CRISPR-Cas或CRISPR-Cas切 口酶融合的腺苷脱氨酶的突变形式。腺苷脱氨酶的突变形式可能兼具腺苷脱氨酶和胞嘧啶脱氨酶活性。
在一个方面,本公开提供了一种工程改造的腺苷脱氨酶。工程改造的腺苷脱氨酶可以包 含本文的一个或多个突变。在一些实施方案中,所述工程改造的腺苷脱氨酶具有胞嘧啶脱氨 酶活性。在某些实施例中,工程改造的腺苷脱氨酶兼具胞嘧啶脱氨酶活性和腺苷脱氨酶。在 一些情况下,通过本文的碱基编辑器进行的修饰可用于靶向翻译后信号传导或催化作用。
本公开还提供了碱基编辑系统。总体来说,这样的系统可以包含与核酸引导型核酸酶, 例如Cas蛋白融合的脱氨酶(例如,腺苷脱氨酶或胞嘧啶脱氨酶)。所述Cas蛋白可以是死 Cas蛋白或Cas切口酶蛋白。在某些实施例中,所述系统包含与死CRISPR-Cas或CRISPR-Cas 切口酶融合的腺苷脱氨酶的突变形式。腺苷脱氨酶的突变形式可能兼具腺苷脱氨酶和胞嘧啶 脱氨酶活性。
所述碱基编辑系统可能能够修饰靶多核苷酸中的单个核苷酸。所述修饰可以修复或修正 G→A或C→T点突变、T→C或A→G点突变或者致病性SNP。因此,所述组合物和系统可以医冶由G→A或C→T点突变、T→C或A→G点突变或者致病性SNP引起的疾病。
在一个方面,本公开提供了一种工程改造的腺苷脱氨酶。工程改造的腺苷脱氨酶可以包 含本文的一个或多个突变。在一些实施方案中,所述工程改造的腺苷脱氨酶具有胞嘧啶脱氨 酶活性。在某些实施例中,工程改造的腺苷脱氨酶兼具胞嘧啶脱氨酶活性和腺苷脱氨酶。在 一些情况下,通过本文的碱基编辑器进行的修饰可用于靶向翻译后信号传导或催化作用。在 一些实施方案中,本文的组合物包含包括碱基编辑系统的一种或多种组分的编码序列的核苷 酸序列。碱基编辑系统可以包含与Cas蛋白或其变体融合的脱氨酶(例如,腺苷脱氨酶或胞 嘧啶脱氨酶)。
在另一方面,所述组合物和系统的大小允许被包装在递送颗粒,例如病毒,诸如AAV 病毒中。在一些实施例中,本公开在单个颗粒(例如AAV)中提供了编码Cas蛋白的一种或 多种多核苷酸、向导序列和一种或多种脱氨酶(例如腺苷脱氨酶及其变体)。在一个具体实施 例中,本公开提供了一种AAV颗粒,所述AAV颗粒包含单个载体,所述单个载体包含以下的编码序列:(i)小Cas13蛋白(例如,死小Cas13b),(ii)一个或多个向导序列,(iii)腺苷脱 氨酶。
在一些情况下,所述腺苷脱氨酶是双链RNA特异性腺苷脱氨酶(ADAR)。ADAR的示例包括Yiannis A Savva等,The ADAR protein family,Genome Biol.2012;13(12):252中所述 的那些,该文献通过引用整体并入。在一些实施例中,所述ADAR可以是hADAR1。在某些实施例中,所述ADAR可以是hADAR2。hADAR2的序列可以是登录号AF525422.1下所 述的那个序列。
在一些情况下,脱氨酶可以是脱氨酶结构域,例如ADAR的脱氨酶结构域(“ADAR-D”)。 在一个实施例中,脱氨酶可以是hADAR2的脱氨酶结构域(“hADAR2-D),例如,如PhelpsKJ 等,Recognition of duplex RNA by the deaminase domain of the RNA editingenzyme ADAR2. Nucleic Acids Res.2015年1月;43(2):1123-32中所述,该文献通过引用整体并入本文。在一 个具体实施例中,hADAR2-D具有包含hADAR2的氨基酸299-701,例如登录号AF525422.1 下的序列的氨基酸299-701的序列。
在某些实施例中,所述系统包含与死CRISPR-Cas或CRISPR-Cas切口酶融合的腺苷脱 氨酶的突变形式。腺苷脱氨酶的突变形式可能兼具腺苷脱氨酶和胞嘧啶脱氨酶活性。在一些 实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于hADAR2的氨基酸序列位置的E488Q,以及同源ADAR蛋白中对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以 包含一个或多个突变:基于hADAR2的氨基酸序列位置的E488Q、V351G,以及同源ADAR 蛋白中对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于 hADAR2的氨基酸序列位置的E488Q、V351G、S486A,以及同源ADAR蛋白中对应于上 述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于hADAR2的氨 基酸序列位置的E488Q、V351G、S486A、T375S,以及同源ADAR蛋白中对应于上述的突 变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于hADAR2的氨基酸序 列位置的E488Q、V351G、S486A、T375S、S370C,以及同源ADAR蛋白中对应于上述的 突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于hADAR2的氨基酸 序列位置的E488Q、V351G、S486A、T375S、S370C、P462A,以及同源ADAR蛋白中对 应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于hADAR2 的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I,以及同源 ADAR蛋白中对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突 变:基于hADAR2的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、 N597I、L332I,以及同源ADAR蛋白中对应于上述的突变。在一些实施方案中,腺苷脱氨 酶可以包含一个或多个突变:基于hADAR2-D的氨基酸序列位置的E488Q、V351G、S486A、 T375S、S370C、P462A、N597I、L332I、I398V,以及同源ADAR蛋白中对应于上述的突变。 在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于hADAR2的氨基酸序列位 置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I,以及同源ADAR蛋白中对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个 或多个突变:基于hADAR2的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、 P462A、N597I、L332I、I398V、K350I、M383L,以及同源ADAR蛋白中对应于上述的突 变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于hADAR2的氨基酸序 列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、 M383L、D619G,以及同源ADAR蛋白中对应于上述的突变。在一些实施方案中,腺苷脱 氨酶可以包含一个或多个突变:基于hADAR2的氨基酸序列位置的E488Q、V351G、S486A、 T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T,以及同 源ADAR蛋白中对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个 突变:基于hADAR2的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、 N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I,以及同源ADAR蛋白中 对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于hADAR2 的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、 K350I、M383L、D619G、S582T、V440I、S495N,以及同源ADAR蛋白中对应于上述的突 变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于hADAR2的氨基酸序 列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、 M383L、D619G、S582T、V440I、S495N、K418E,以及同源ADAR蛋白中对应于上述的 突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于hADAR2的氨基酸 序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E、S661T,以及同源ADAR蛋白中对应于 上述的突变。在一些实施方案中,本文提供的包括突变的腺苷脱氨酶,例如包含基于hADAR2 的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、 K350I、M383L、D619G、S582T、V440I、S495N、K418E、S661T中的一个或多个突变以 及同源ADAR蛋白中对应于上述的突变,且与死CRISPR-Cas蛋白或CRISPR-Cas切口酶融 合的腺苷脱氨酶。在一些实施例中,本文提供的包括突变的腺苷脱氨酶,例如包含基于 hADAR2的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、 L332I、I398V、K350I、M383L、D619G、S582T、V440I、S495N、K418E和S661T以及同 源ADAR蛋白中对应于上述的突变,且与死CRISPR-Cas蛋白或CRISPR-Cas切口酶融合的 腺苷脱氨酶。在一些实施例中,本文提供的包括突变的腺苷脱氨酶,例如包含基于hADAR2 的氨基酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、 K350I、M383L、D619G、S582T、V440I、S495N、K418E、S661T和S375N以及同源ADAR 蛋白中对应于上述的突变,且与死CRISPR-Cas蛋白或CRISPR-Cas切口酶融合的腺苷脱氨 酶。在一些实施例中,本文提供的包括突变的腺苷脱氨酶,例如包含基于hADAR2的氨基 酸序列位置的E488Q、V351G、S486A、T375S、S370C、P462A、N597I、L332I、I398V、 K350I、M383L、D619G、S582T、V440I、S495N、K418E、S661T和S375A以及同源ADAR 蛋白中对应于上述的突变,且与死CRISPR-Cas蛋白或CRISPR-Cas切口酶融合的腺苷脱氨 酶。
本文提供的一些实施例包括突变的腺苷脱氨酶,例如包含基于hADAR2的氨基酸序列 位置的E488Q和E620G以及同源ADAR蛋白中对应于上述位置的突变,且与死CRISPR-Cas蛋白或CRISPR-Cas切口酶融合的腺苷脱氨酶。
本文提供的一些实施例包括突变的腺苷脱氨酶,例如包含基于hADAR2的氨基酸序列 位置的E488Q和Q696L以及同源ADAR蛋白中对应于上述的突变,且与死CRISPR-Cas蛋 白或CRISPR-Cas切口酶融合的腺苷脱氨酶。
本文提供的一些实施例包括突变的腺苷脱氨酶,例如包含基于hADAR2的氨基酸序列 位置的E488Q、E620G和Q696L以及同源ADAR蛋白中对应于上述的突变,且与死 CRISPR-Cas蛋白或CRISPR-Cas切口酶融合的腺苷脱氨酶。
本文提供的一些实施例包括突变的腺苷脱氨酶,例如包含基于hADAR2的氨基酸序列 位置的E488Q和V505I以及同源ADAR蛋白中对应于上述的突变,且与死CRISPR-Cas蛋 白或CRISPR-Cas切口酶融合的腺苷脱氨酶。
在一些实施方案中,腺苷脱氨酶可以是tRNA特异性腺苷脱氨酶或其变体。在一些实施 方案中,腺苷脱氨酶可以包含一个或多个突变:基于大肠杆菌TadA的氨基酸序列位置的 W23L、W23R、R26G、H36L、N37S、P48S、P48T、P48A、I49V、R51L、N72D、L84F、 S97C、A106V、D108N、H123Y、G125A、A142N、S146C、D147Y、R152H、R152P、E155V、 I156F、K157N、K161T,以及同源脱氨酶蛋白中对应于上述的突变。在一些实施方案中, 腺苷脱氨酶可以包含一个或多个突变:基于大肠杆菌TadA的氨基酸序列位置的D108N,以 及同源脱氨酶蛋白中对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多 个突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N,以及同源脱氨酶蛋白中 对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于大肠杆 菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V,以及同源脱氨酶蛋白中对 应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于大肠杆菌 TadA的氨基酸序列位置的A106V、D108N,以及同源脱氨酶蛋白中对应于上述的突变。在 一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于大肠杆菌TadA的氨基酸序列 位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F,以及同源脱氨酶蛋白中 对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于大肠杆 菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、 A142N,以及同源脱氨酶蛋白中对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包 含一个或多个突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N、D147Y、 E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N,以及同源脱氨酶蛋白中对 应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于大肠杆菌 TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、 R51L、S146C、K157N、P48S,以及同源脱氨酶蛋白中对应于上述的突变。在一些实施方案 中,腺苷脱氨酶可以包含一个或多个突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、 D108N、D147Y、E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、A142N,以及同源脱氨酶蛋白中对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N、D147Y、 E155V、L84F、H123Y、I156F、H36L、R51L、S146C、K157N、P48S、W23R、P48A,以 及同源脱氨酶蛋白中对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多 个突变:基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、 H123Y、I156F、H36L、R51L、S146C、K157N、P48S、W23R、P48A、A142N,以及同源 脱氨酶蛋白中对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变: 基于大肠杆菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、 I156F、H36L、R51L、S146C、K157N、P48S、W23R、P48A、R152P,以及同源脱氨酶蛋 白中对应于上述的突变。在一些实施方案中,腺苷脱氨酶可以包含一个或多个突变:基于大 肠杆菌TadA的氨基酸序列位置的A106V、D108N、D147Y、E155V、L84F、H123Y、I156F、 H36L、R51L、S146C、K157N、P48S、W23R、P48A、R152P、A142N,以及同源脱氨酶蛋 白中对应于上述的突变。
在一些实施例中,碱基编辑系统可以包括内含肽介导的反式剪接系统,其能够体内递送 碱基编辑器,例如经工程改造以反式剪接的断裂型内含肽胞嘧啶碱基编辑器(CBE)或腺嘌呤 碱基编辑器(ABE)。此类碱基编辑系统的示例包括以下文献中所述的那些:ColinK.W.Lim 等,Treatment of a Mouse Model of ALS by In Vivo Base Editing,MolTher.2020年1月14日. pii:S1525-0016(20)30011-3.doi:10.1016/j.ymthe.2020.01.005;和Jonathan M.Levy等, Cytosine and adenine base editing ofthe brain,liver,retina,heart and skeletal muscle of mice via adeno-associatedviruses,Nature Biomedical Engineering第4卷,第97-110页(2020),所述文 献通过引用整体并入本文。
在一些实施方案中,碱基编辑可以引入C至G编辑。在一些实施例中,碱基编辑系统可以包含Cas蛋白和胞嘧啶脱氨酶。此类系统还可以包含尿苷DNA N-糖基化酶。在一些情况下,所述Cas蛋白是死Cas蛋白,例如切口酶。在某些情况下,胞嘧啶脱氨酶是APOBEC1 胞嘧啶脱氨酶变体,例如具有R33A突变的大鼠APOBEC1胞嘧啶脱氨酶。在某些情况下, 尿苷DNA N-糖基化酶来源于大肠杆菌。此类碱基编辑系统可用于诱导C至G修饰,例如 在哺乳动物细胞(例如,人类细胞)中富AT序列的背景下。
碱基编辑系统的示例包括以下文献中所述的那些:国际专利公开号WO 2019/071048(例 如,第[0933]-[0938]段)、WO 2019/084063(例如,第[0173]-[0186]段、第[0323]-[0475]段、 第[0893]-[1094]段)、WO 2019/126716(例如,第[0290]-[0425]段、第[1077]-[1084]段)、WO 2019/126709(例如,第[0294]-[0453]段)、WO 2019/126762(例如,第[0309]-[0438]段)、WO 2019/126774(例如,第[0511]-[0670]段);Cox DBT等,RNAediting with CRISPR-Cas13, Science.2017年11月24日;358(6366):1019-1027;Abudayyeh OO等,A cytosine deaminase for programmable single-base RNA editing,Science 2019年7月26日:第365卷,第6451期,第 382-386页;Gaudelli NM等,Programmable base editing of A·T to G·C in genomic DNA without DNAcleavage,Nature第551卷,第464-471页(2017年11月23日);Komor AC等, Programmableediting of a target base in genomic DNA without double-stranded DNA cleavage.Nature.2016年5月19日;533(7603):420-4;Jordan L.Doman等,Evaluation andminimization of Cas9-independent off-target DNA editing by cytosine baseeditors,Nat Biotechnol(2020). doi.org/10.1038/s41587-020-0414-6;以及RichterMF等,Phage-assisted evolution of an adenine base editor with improved Casdomain compatibility and activity,Nat Biotechnol(2020). doi.org/10.1038/s41587-020-0453-z;Kurt,I.C.,Zhou,R.,Iyer,S.等,CRISPR C-to-G base editors forinducing targeted DNA transversions in human cells.Nat Biotechnol(2020).https://doi.org/10.1038/s41587-020-0609-x,所述文献通过引用整体并入本文。
调控基因产物的翻译后修饰
在一些情况下,碱基编辑可用于调控基因产物的翻译后修饰。在一些情况下,作为翻译 后修饰位点的氨基酸残基可以通过碱基编辑突变为不能修饰的氨基残基。此类翻译后修饰的 示例包括二硫键形成、糖基化、脂质化、乙酰化、磷酸化、甲基化、泛素化、类泛素化或其 任何组合。
在一些实施方案中,本文的碱基编辑器可以调控Stat3/IRF-5途径,例如,用于减轻炎 症。举例来说,IRF-5的Stat3、Thr10、Ser158、Ser309、Ser317、Ser451和/或Ser462的Tyr705 上的磷酸化可能参与白介素信号传导。本文的碱基编辑器可用于使这些生殖位点中的一个或 多个突变以调控免疫力、自身免疫力和/或炎症。
在一些实施方案中,本文的碱基编辑器可以调控胰岛素受体底物(IRS)途径。举例来说, Ser265、Ser302、Ser325、Ser336、Ser358、Ser407和/或Ser408上的磷酸化可能参与调控(例 如,抑制)ISR途径。替代地或另外地,小鼠丝氨酸307(或人丝氨酸312)可发生突变,因此 可以调控磷酸化。举例来说,丝氨酸307磷酸化可能导致IRS-1降解并减少MAPK信号传 导。可以在胰岛素不敏感条件,诸如胰岛素过度刺激和/或TNFα治疗下诱导丝氨酸307磷 酸化。在一些实施例中,可以产生S307F突变以稳定IRS-1与所述途径中其他组分之间的相 互作用。本文的碱基编辑器可用于使这些生殖位点中的一个或多个突变以调控IRS途径。
调控基因产物的稳定性
在一些实施方案中,碱基编辑可用于调控基因产物的稳定性。举例来说,可以通过本文 的碱基编辑器使调控蛋白质降解速率的一个或多个氨基酸残基突变。在一些情况下,这样的 氨基酸残基可以在降解决定子中。降解决定子可能是指蛋白质中参与调控蛋白质降解速率的 部分。降解决定子可能包括短氨基酸序列、结构基序和暴露的氨基酸(例如,赖氨酸或精氨 酸)。一些蛋白质可能包含多个降解决定子。降解决定子是泛素依赖性的(例如,基于蛋白质 的泛素化调控蛋白质降解)或非泛素依赖性的。
在一些情况下,碱基编辑可以用于使信号肽中的一个或多个氨基酸残基突变以用于蛋白 质降解。在一些实施例中,信号肽可以是PEST序列,即富含脯氨酸(P)、谷氨酸(E)、丝氨 酸(S)和苏氨酸(T)的肽序列。举例来说,可以增加包含PEST序列的NANOG的稳定性,例如以促进胚胎干细胞多能性。
在一些实施例中,碱基编辑器可用于使SMN2(例如,以产生S270A突变)突变以增加涉及脊髓性肌萎缩的SMN2蛋白的稳定性。SMN2中可能由碱基编辑器产生的其他突变包 括Cho S.等,Genes Dev.2010年3月1日;24(5):438-442中所述的那些。在某些实施例中, 碱基编辑器可用于在IκBα上产生突变,如Fortmann KT等,J Mol Biol.2015年8月28日; 427(17):2748-2756中所述。降解决定子中的靶位点可以通过计算工具来鉴定,例如slim.ucd.ie/apc/index.php上提供的在线工具。其他靶标包括Cdc25A磷酸酶。
可以通过碱基编辑器靶向的基因的示例
在一些实施例中,碱基编辑器可用于修饰PCSK9。碱基编辑器可以引入终止密码子和/ 或降低PCSK9活性的疾病相关突变。碱基编辑可能在PCSK9中引入一个或多个以下突变: R46L、R46A、A53V、A53A、E57K、Y142X、L253F、R237W、H391N、N425S、A443T、 I474V、I474A、Q554E、Q619P、E670G、E670A、C679X、H417Q、R469W、E482G、F515L 和/或H553R。
在一些实施例中,碱基编辑器可用于修饰ApoE。碱基编辑器可以靶向合成模型和/或患 者衍生神经元(例如,源自于iPSC的那些)中的ApoE。可以通过测序来测试靶向。
在一些实施例中,碱基编辑器可用于修饰Stat1/3。碱基编辑器可以靶向Y705和/或S727 以减少Stat1/3激活。碱基编辑可以通过基于荧光素酶的启动子进行测试。通过碱基编辑靶 向Stat1/3可以阻断单核细胞向巨噬细胞分化,以及响应于ox-LDL刺激巨噬细胞的炎症。
在一些实施例中,碱基编辑器可用于修饰TFEB(EB的转录因子)。碱基编辑器可以靶 向调控TFEB易位的一个或多个氨基酸残基。在一些情况下,碱基编辑器可以靶向一个或多 个调控自噬的氨基酸残基。
在一些实施例中,碱基编辑器可用于修饰鸟氨酸氨基甲酰转移酶(OTC)。此类修饰可用 于修正鸟氨酸氨基甲酰转移酶缺乏症。举例来说,碱基编辑可以通过将核苷酸134C转化为 U来修正Leu45Pro突变。
在一些实施例中,碱基编辑器可用于修饰Lipin1。碱基编辑器可以靶向一个或多个可以 通过mTOR磷酸化的丝氨酸。Lipin1的碱基编辑可以调控脂质积聚。碱基编辑可以靶向 3T3L1前脂肪细胞模型中的Lipin1。可以通过测量脂质积累的减少(例如,通过油红)来测试 碱基编辑的效果。
核苷酸脱氨酶或其他RNA修饰酶可以通过一个或多个氨基酸与CRISPR-Cas或死CRISPR-Cas连接。在一些情况下,核苷酸脱氨酶可以通过一个或多个氨基酸411-429、 114-124、197-241和607-624与CRISPR-Cas或死CRISPR-Cas连接。氨基酸位置可以对应 于本文公开的CRISPR-Cas直系同源物。在某些实施例中,核苷酸脱氨酶可以通过对应于口 腔普雷沃氏菌CRISPR-Cas的氨基411-429、114-124、197-241和607-624的一个或多个氨 基酸与死CRISPR-Cas连接。
递送
本公开还提供了用于将本文的系统和组合物的组分引入细胞、组织、器官或生物体的递 送系统。递送系统可以包括一个或多个递送载体和/或负荷。示例性递送系统和方法包括以 下文献中所述的那些:Feng Zhang等(WO2016106236A1)的第[00117]至[00278]段和Lino CA 等,Delivering CRISPR:a review of the challenges and approaches,DRUG DELIVERY,2018, 第25卷,第1期,1234-1257的第1241-1251页和表1,所述文献通过引用整体并入本文。
在一些实施方案中,递送系统可用于将系统和组合物的组分引入植物细胞。举例来说, 可以使用电穿孔、显微注射、气溶胶束注射植物细胞原生质体、基因枪法、DNA粒子轰击 和/或土壤杆菌介导的转化将组分递送至植物。用于植物的方法和递送系统的示例包括以下 文献中所述的那些:Fu等,Transgenic Res.2000年2月;9(1):11-9;Klein RM等,Biotechnology. 1992;24:384-6;Casas AM等,Proc Natl Acad Sci U S A.1993年12月1日;90(23): 11212-11216;和美国专利第5,563,055号;Davey MR等,Plant Mol Biol.1989年9 月;13(3):273-85,所述文献通过引用整体并入本文。
负荷
递送系统可以包括一个或多个负荷。负荷可以包含本文的系统和组合物的一种或多种组 分。负荷可以包含以下一种或多种:i)编码一种或多种Cas蛋白的质粒;ii)编码一个或多个 向导RNA的质粒,iii)一种或多种Cas蛋白的mRNA;iv)一个或多个向导RNA;v)一种或 多种Cas蛋白;vi)其任何组合。在一些实施例中,负荷可以包含编码一种或多种Cas蛋白 和一个或多个(例如,多个)向导RNA的质粒。在一些情况下,质粒还可以编码重组模板(例 如,用于HDR)。在一些实施方案中,负荷可以包含编码一种或多种Cas蛋白的mRNA和 一个或多个向导RNA。
在一些实施例中,负荷可以包含一种或多种Cas蛋白和一个或多个向导RNA,例如,呈核糖核蛋白复合物(RNP)形式。核糖核蛋白复合物可以通过本文的方法和系统递送。在一些情况下,核糖核蛋白可以通过基于多肽的穿梭剂递送。在一个实施例中,核糖核蛋白可以使用合成肽递送,所述合成肽包含可操作地连接至细胞穿透结构域(CPD)、富组氨酸结构域和CPD的核内体渗漏结构域(ELD),例如,如WO2016161516中所述。RNP还可以用于将 组合物和系统递送至植物细胞,例如,如Wu JW等,Nat Biotechnol.2015年11 月;33(11):1162-4中所述。
物理递送
在一些实施方案中,负荷可以通过物理递送方法引入细胞。物理方法的示例包括显微注 射、电穿孔和流体动力学递送。核酸和蛋白质都可以使用这样的方法递送。举例来说,Cas 蛋白可以在体外制备、分离、(需要时重新折叠、纯化)并引入细胞。
显微注射
将负荷直接显微注射至细胞可以实现高效率,例如,高于90%或约100%。在一些实施 方案中,可以使用显微镜和针(例如,直径为0.5-5.0μm)进行显微注射以刺穿细胞膜并将负 荷直接递送至细胞内的靶位点。显微注射可用于体外和离体递送。
可以显微注射包含Cas蛋白和/或向导RNA的编码序列、mRNA和/或向导RNA的质粒。在一些情况下,显微注射可用于i)将DNA直接递送至细胞核,和/或ii)将mRNA(例如,体 外转录的)递送至细胞核或细胞质。在某些实施例中,显微注射可用于将sgRNA直接递送至 细胞核并将Cas编码mRNA递送至细胞质,从而例如促进Cas翻译和穿梭至细胞核。
显微注射可用于产生基因修饰的动物。举例来说,可以将基因编辑负荷注入受精卵中, 以允许有效的种系修饰。这种方法可以产生携带所需修饰的正常胚胎和足月小鼠幼崽。显微 注射还可以用于提供瞬时上调或下调细胞基因组内的特定基因,例如,使用CRISPRa和 CRISPRi。
电穿孔
在一些实施方案中,负荷和/或递送载体可以通过电穿孔递送。电穿孔可以使用脉冲高 压电流在悬浮在缓冲液中的细胞的细胞膜内瞬时打开纳米大小的孔隙,从而允许流体动力学 直径为数十纳米的组分流入细胞中。在一些情况下,电穿孔可以用于各种细胞类型并有效地 将负荷转移至细胞中。电穿孔可以用于体外和离体递送。
电穿孔还可以用于通过施加特定电压和试剂(例如通过核转染)将负荷递送至哺乳动物 细胞的细胞核中。此类方法包括以下文献中所述的那些:Wu Y等,(2015).Cell Res25:67-79; Ye L等,(2014).Proc Natl Acad Sci USA 111:9591-6;Choi PS,Meyerson M.(2014).Nat Commun 5:3728;Wang J,Quake SR.(2014).Proc Natl Acad Sci 111:13157-62。电穿孔还可以 用于体内递送负荷,例如,用Zuckermann M等,(2015).Nat Commun 6:7391所述的方法。
流体动力学递送
流体动力学递送还可用于递送负荷,例如用于体内递送。在一些实施例中,流体动力学 递送可以通过将含有基因编辑负荷的大体积(8-10%体重)溶液快速推入受试者(例如,动物或 人)的血流中来进行,例如,对于小鼠而言,经由尾静脉。由于血液不可压缩,大团液体可 能导致流体动压力增加,从而暂时增强对内皮细胞和实质细胞的渗透,从而使正常情况下不 能越过细胞膜的负荷进入细胞。这种方法可用于递送裸DNA质粒和蛋白质。递送的负荷可 能富集在肝脏、肾脏、肺、肌肉和/或心脏中。
转染
可以通过用于将核酸引入细胞中的转染方法将负荷(例如核酸)引入细胞。转染方法的示 例包括磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状大分子转染、热休克转染、磁 转染、脂质转染、穿刺转染、光学转染、专有剂增强核酸摄取。
递送载体
递送系统可以包括一种或多种递送载体。递送载体可以将负荷递送到细胞、组织、器官 或生物体(例如,动物或植物)中。负荷可以用递送载体包装、携带或以其他方式相关联。可 以基于欲递送的负荷的类型来选择递送载体,和/或在体外和/或体内进行递送。递送载体的 示例包括载体、病毒、非病毒载体和本文所述的其他递送试剂。
根据本发明的递送载体的最大尺寸(例如直径)可以是小于100微米(μm)。在一些实施方 案中,递送载体的最大尺寸是小于10μm。在一些实施方案中,递送载体的最大尺寸可以是 小于2000纳米(nm)。在一些实施方案中,递送载体的最大尺寸可以是小于1000纳米(nm)。 在一些实施方案中,递送载体的最大尺寸(例如直径)可以是小于900nm、小于800nm、小 于700nm、小于600nm、小于500nm、小于400nm、小于300nm、小于200nm、小于150 nm或小于100nm、小于50nm。在一些实施方案中,递送载体的最大尺寸可以在25nm和 200nm之间的范围内。
在一些实施方案中,递送载体可以是或包含颗粒。举例来说,递送载体可以是或包含纳 米颗粒(例如,最大尺寸(例如,直径)不超过1000nm的颗粒。颗粒可以呈不同的形式提供, 例如,作为固体颗粒(例如金属,诸如银、金、铁、钛)、非金属、基于脂质的固体、聚合物)、 颗粒悬浮液或其组合。可以制备金属、电介质和半导体颗粒,以及混合结构(例如,核-壳颗 粒)。纳米颗粒还可以用于将组合物和系统递送至植物细胞,例如,如国际专利公开号WO 2008042156、美国公开申请号US 20130185823和国际专利公开号WO 2015/089419中所述。
载体
所述系统、组合物和/或递送系统可以包括一个或多个载体。本公开还包括载体系统。 载体系统可以包括一个或多个载体。在一些实施方案中,载体是指能够转运与它连接的另一 个核酸的核酸分子。载体包括单链、双链或部分双链的核酸分子;包含一个或多个自由端、 无自由端(例如环形)的核酸分子;包含DNA、RNA或二者的核酸分子;以及本领域中已知 的其他种类的多核苷酸。载体可以是质粒,例如环状双链DNA环,其中可以插入其他DNA 区段,诸如通过标准分子克隆技术。某些载体可能能够在引入它们的宿主细胞中自主复制(例 如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)。一些载体(例如,非附加型哺乳 动物载体)在引入宿主细胞中后被整合至宿主细胞基因组中,从而与宿主基因组一起复制。 在某些实施例中,载体可以是表达载体,例如,能够指导与它们可操作地连接的基因的表达。 在一些情况下,表达载体可以用于在真核细胞中表达。用于重组DNA技术的常用表达载体 通常呈质粒形式。
载体的示例包括pGEX、pMAL、pRIT5、大肠杆菌表达载体(例如pTrc、pET 11d、酵母表达载体(例如pYepSec1、pMFa、pJRY88、pYES2和picZ、杆状病毒载体(例如用于在诸如 SF9细胞等昆虫细胞中表达)(例如pAc系列和pVL系列)、哺乳动物表达载体(例如pCDM8 和pMT2PC。
载体可以包含i)Cas编码序列,和/或ii)单个或至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少12个、至少14个、至 少16个、至少32个、至少48个、至少50个向导RNA编码序列。在单个载体中,可以存 在针对每一个RNA编码序列的启动子。替代地或另外地,在单个载体中,可能存在控制(例 如,驱动转录和/或表达)多个RNA编码序列的启动子。
此外,该组合物或系统可以通过载体递送,例如单独的载体或编码CRISPR复合物的相 同载体。当由单独的载体提供时,可以顺序或同时施用靶向Cas表达的CRISPR RNA。当顺 序施用时,将在意在用于例如基因编辑或基因工程改造的CRISPR RNA之后递送靶向Cas表达的CRISPR RNA。这个时间段可以是数分钟(例如,5分钟、10分钟、20分钟、30分钟、 45分钟、60分钟)的时间段。这个时间段可以是数小时(例如,2小时、4小时、6小时、8 小时、12小时、24小时)的时间段。这个时间段可以是数天(例如,2天、3天、4天、7天) 的时间段。这个时间段可以是数周(例如,2周、3周、4周)的时间段。这个时间段可以是数 月(例如,2个月、4个月、8个月、12个月)的时间段。这个时间段可以是数年(2年、3年、 4年)的时间段。以这种方式,Cas酶与能够跟第一靶标(诸如一个或多个目标基因组基因座) 杂交的第一gRNA缔合,并承担CRISPR-Cas系统所需的功能(例如基因工程改造);随后, Cas酶可以与能够跟包含Cas或CRISPR盒的至少一部分的序列杂交的第二gRNA缔合。在 向导RNA靶向编码Cas蛋白表达的序列时,所述酶会受到阻碍,并且所述系统会自身失活。 以相同的方式,通过例如本文阐明的脂质体、脂质转染、颗粒、微泡施用的靶向Cas表达的 CRISPR RNA可以顺序或同时施用。类似地,可以使用自身失活使用于靶向一个或多个靶标 的一个或多个向导RNA失活。
调控元件
载体可以包含一个或多个调控元件。调控元件可以与Cas蛋白、辅助蛋白、向导RNA(例 如,单向导RNA、crRNA和/或tracrRNA)或其组合的编码序列可操作地连接。术语“可操作 地连接”希望意指目标核苷酸序列以允许核苷酸序列表达(例如当载体被引入宿主细胞时,在 体外转录/翻译系统中或在宿主中)的方式连接至调控元件。在某些实施例中,载体可以包含: 与编码Cas蛋白的核苷酸序列可操作地连接的第一调控元件,和与编码向导RNA的核苷酸 序列可操作地连接的第二调控元件。
调控元件的示例包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件 (例如,转录终止信号,诸如多聚腺苷酸化信号和多U序列)。此类调控元件描述于例如 Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185, AcademicPress,San Diego,Calif.(1990)中。调控元件包括指导许多种类型宿主细胞中的核苷 酸序列的组成性表达的那些调控元件和仅仅指导某些宿主细胞中的核苷酸序列的表达的那些调控元件(例如,组织特异性调控序列)。组织特异性启动子可以主要指导所需目标组织,诸如肌肉、神经元、骨骼、皮肤、血液、特定器官(例如肝脏、胰腺)或特定细胞类型(例如淋巴细胞)中的表达。调控元件还可以用时间依赖性方式,诸如用细胞周期依赖性或发育阶段依赖性方式指导表达,所述方式可能或未必还具有组织或细胞类型特异性。
启动子的示例包括一个或多个pol III启动子(例如,1、2、3、4、5个或更多个polIII 启动子)、一个或多个pol II启动子(例如,1、2、3、4、5个或多个pol II启动子)、一个或多个pol I启动子(例如1、2、3、4、5个或多个pol I启动子)或其组合。pol III启动子的示例包括但不限于U6和H1启动子。pol II启动子的示例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV 增强子)、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK) 启动子和EF1α启动子。
病毒载体
可以通过病毒递送负荷。在一些实施方案中,使用病毒载体。病毒载体可以包含病毒衍 生的DNA或RNA序列以便包装成病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)。病毒载体还包括由病毒携带以便转染至宿主细胞中的多核苷酸。病毒和病毒载体可以用于体外、离体和/或体内递送。
腺相关病毒(AAV)
本文的系统和组合物可以通过腺相关病毒(AAV)递送。AAV载体可以用于此类递送。 依赖病毒属和细小病毒科的AAV是单链DNA病毒。在一些实施方案中,AAV可以提供所提供DNA的持久来源,因为AAV递送的基因组材料可以无限期地存在于细胞中,例如, 作为外源DNA抑或通过一些修饰直接整合到宿主DNA中。在一些实施方案中,AAV不会 引起或涉及人类的任何疾病。病毒本身能够有效地感染细胞,同时几乎没有或没有激起先天 性或适应性免疫应答或相关毒性。
本文可以使用的AAV的示例包括AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、 AAV-8和AAV-9。AAV的类型可以根据欲靶向的细胞加以选择;例如,可以选择AAV血 清型1、2、5或混合衣壳AAV1、AAV2、AAV5或其任何组合以用于靶向脑或神经元细胞; 并且可以选择AAV4以靶向心脏组织。AAV8可用于递送至肝脏。最初提议基于AAV-2的 载体用于将CFTR递送至CF气道,其他血清型诸如AAV-1、AAV-5、AAV-6和AAV-9在 各种肺上皮模型中表现出了提高的基因转移效率。通过AAV靶向的细胞类型的示例描述于 Grimm,D.等,J.Virol.82:5887-5911(2008))中,并且如下所示:
表9
细胞系 AAV-1 AAV-2 AAV-3 AAV-4 AAV-5 AAV-6 AAV-8 AAV-9
Huh-7 13 100 2.5 0.0 0.1 10 0.7 0.0
HEK293 25 100 2.5 0.1 0.1 5 0.7 0.1
HeLa 3 100 2.0 0.1 6.7 1 0.2 0.1
HepG2 3 100 16.7 0.3 1.7 5 0.3 ND
Hep1A 20 100 0.2 1.0 0.1 1 0.2 0.0
911 17 100 11 0.2 0.1 17 0.1 ND
CHO 100 100 14 1.4 333 50 10 1.0
COS 33 100 33 3.3 5.0 14 2.0 0.5
MeWo 10 100 20 0.3 6.7 10 1.0 0.2
NIH3T3 10 100 2.9 2.9 0.3 10 0.3 ND
A549 14 100 20 ND 0.5 10 0.5 0.1
HT1180 20 100 10 0.1 0.3 33 0.5 0.1
单核细胞 1111 100 ND ND 125 1429 ND ND
不成熟DC 2500 100 ND ND 222 2857 ND ND
成熟DC 2222 100 ND ND 333 3333 ND ND
可以在HEK 293T细胞中产生CRISPR-Cas AAV颗粒。一旦产生了具有特定嗜性的颗粒,就将它们用来感染靶细胞系,就像天然病毒颗粒那样。这可能允许CRISPR-Cas组分持续存在于受感染的细胞类型中,并且使这种型式的递送特别适合需要长期表达的情况。可以 使用的AAV剂量和配方的示例包括美国专利号8,454,972和8,404,658中所述的那些。
多种策略可用于用AAV递送本文的系统和组合物。在一些实施例中,Cas和gRNA的编码序列可以直接包装到一个DNA质粒载体上并通过一个AAV颗粒递送。在一些实施例 中,AAV可用于将gRNA递送到之前已工程改造以表达Cas的细胞中。在一些实施例中, Cas和gRNA的编码序列可以制成两个单独的AAV颗粒,用于共转染靶细胞。在一些实施 例中,标记物、标签和其他序列可以与Cas和/或gRNA的编码序列包装在相同AAV颗粒中。
慢病毒
本文的系统和组合物可以通过慢病毒递送。慢病毒载体可以用于此类递送。慢病毒是能 够感染有丝分裂细胞和有丝分裂后细胞并且在两者中都表达其基因的复杂逆转录病毒。
慢病毒的示例包括:人类免疫缺陷病毒(HIV),其可以利用其他病毒的包膜糖蛋白来靶 向多种细胞类型;基于马感染性贫血病毒(EIAV)的最小非灵长类慢病毒载体,其可用于眼部 治疗。在某些实施方案中,具有靶向由HIV tat/rev共用的共同外显子的siRNA、核仁定位 TAR诱饵和抗CCR5特异性锤头状核糖酶的自身失活慢病毒载体(参见例如DiGiusto等(2010) Sci Transl Med 2:36ra43)可以用于/和或适合于本文的核酸靶向系统。
慢病毒可以用其他病毒蛋白,诸如水疱性口炎病毒的G蛋白进行假型化。在这样做时, 慢病毒的细胞嗜性可以根据需要而变宽或变窄。在一些情况下,为了提高安全性,第二代和 第三代慢病毒系统可能使必需基因分裂到三个质粒,这可能降低细胞内活病毒颗粒意外重组 的可能性。
在一些实施例中,利用整合能力,慢病毒可用于创建包含各种基因修饰的细胞文库,例 如,以用于筛检和/或研究基因和信号传导途径。
腺病毒
本文的系统和组合物可以通过腺病毒递送。腺病毒载体可以用于此类递送。腺病毒包括 具有含双链DNA基因组的二十面体核衣壳的无包膜病毒。腺病毒可以感染分裂和非分裂细 胞。在一些实施方案中,腺病毒没有整合到宿主细胞的基因组中,这可用于限制基因编辑应 用中CRISPR-Cas系统的脱靶效应。
用于递送至植物的病毒载体
所述系统和组合物可以使用病毒载体递送至植物细胞。在特定实施方案中,所述组合物 和系统可以使用植物病毒载体引入植物细胞中(例如,如Scholthof等所述,1996,Annu Rev Phytopathol.1996;34:299-323)。此类病毒载体可以是来自DNA病毒,例如双生病毒(例如卷 心菜卷叶病毒、豆黄矮病毒、小麦矮缩病毒、番茄卷叶病毒、玉米条纹病毒、烟草卷叶病毒 或番茄金色花叶病毒)或纳米病毒(例如,蚕豆坏死黄病毒)的载体。所述病毒载体可以是来自 RNA病毒,例如烟草病毒(例如烟草脆裂病毒、烟草花叶病毒)、马铃薯病毒(例如马铃薯病 毒X)或大麦病毒(例如大麦条纹花叶病毒)的载体。植物病毒的复制基因组可以是非整合载 体。
非病毒载体
递送载体可以包含非病毒载体。一般来说,能够递送核酸和/或蛋白质的方法和载体可 以用于递送本文的系统组合物。非病毒载体的示例包括脂质纳米颗粒、细胞穿透肽(CPP)、DNA纳米线团、金纳米颗粒、链球菌溶血素O、多功能包膜型纳米器件(MEND)、脂质包覆 型中孔二氧化硅颗粒和其他无机纳米颗粒。
脂质颗粒
递送载体可以包含脂质颗粒,例如脂质纳米颗粒(LNP)和脂质体。
脂质纳米颗粒(LNP)
LNP可以将核酸包封在阳离子脂质颗粒(例如脂质体)内,并且可以相对容易地递送至细 胞。在一些实施例中,脂质纳米颗粒不含任何病毒组分,这有助于最小化安全性和免疫原性 问题。脂质颗粒可以用于体外、离体和/或体内递送。脂质颗粒可以用于各种规模的细胞群。
在一些实施例中,LNP可以用于递送DNA分子(例如,包含Cas和/或gRNA的编码序列的那些)和/或RNA分子(例如,Cas的mRNA、gRNA)。在某些情况下,LNP可以用于递 送Cas/gRNA的RNP复合物。
LNP中的组分可以包含阳离子脂质1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2- 二亚油基氧基-3-N,N-二甲氨基丙烷(DLinDMA)、1,2-二亚油基氧基酮基-N,N-二甲基-3-氨基 丙烷(DLinK-DMA)、1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)、 (3-o-[2”-(甲氧基聚乙二醇2000)丁二酰基]-1,2-二肉豆蔻酰基-sn-二醇(PEG-S-DMG)、R-3-[(ro- 甲氧基-聚(乙二醇)2000)氨甲酰基]-1,2-二肉豆蔻基氧基丙基-3-胺(PEG-C-DOMG,及其任何 组合。LNP制备和封装可以改编自Rosin等,MolecularTherapy,第19卷,第12期,第 1286-2200页,2011年12月)。
脂质体
在一些实施方案中,脂质颗粒可以是脂质体。脂质体是由围绕内部水性隔室的单层或多 层脂质双层和相对非渗透性外部亲脂性磷脂双层构成的球形囊泡结构。在一些实施方案中, 脂质体是生物相容性的、无毒的,可以递送亲水性和亲脂性药物分子,保护它们的负荷免于 被血浆酶降解,并且转运它们的负载越过生物膜和血脑屏障(BBB)。
脂质体可以由若干种不同类型的脂质,例如磷脂制成。脂质体可以包含天然磷脂和脂质, 诸如1,2-二硬脂酰基-sn-甘油-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱、单唾液酸神经 节苷脂或其任何组合。
可以将若干种其他添加剂添加至脂质体中以修饰它们的结构和性质。举例来说,脂质体 还可以包含胆固醇、鞘磷脂和/或1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE),例如以增加 稳定性和/或防止脂质体内部负荷泄漏。
稳定核酸-脂质颗粒(SNALP)
在一些实施方案中,脂质颗粒可以是稳定核酸脂质颗粒(SNALP)。SNALP可以包含可 离子化脂质(DLinDMA)(例如在低pH下为阳离子性的)、中性辅助脂质、胆固醇、可扩散聚乙二醇(PEG)-脂质或其任何组合。在一些实施例中,SNALP可以包含合成胆固醇、二棕榈 酰磷脂酰胆碱、3-N-[(w-甲氧基聚乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻基氧基丙胺和阳离 子1,2-二亚油基氧基-3-N,N二甲基氨基丙烷。在一些实施例中,SNALP可以包含合成胆固 醇、1,2-二硬脂酰基-sn-甘油-3-胆碱磷酸、PEG-cDMA和1,2-二亚油基氧基-3-(N;N-二甲基) 氨基丙烷(DLinDMA)。
其他脂质
脂质颗粒还可以包含一种或多种其他类型的脂质,例如阳离子脂质,诸如氨基脂质2,2- 二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(DLin-KC2-DMA)、DLin-KC2-DMA4、C12-200 以及共脂质二硬脂酰磷脂酰胆碱、胆固醇和PEG-DMG。
脂质复合物/聚合复合物
在一些实施方案中,递送载体包括脂质复合物和/或聚合复合物。脂质复合物可以与带 负电细胞膜结合并诱导内吞至细胞中。脂质复合物的示例可以是包含脂质和非脂质组分的复 合物。脂质复合物和聚合复合物的示例包括含有脂质和其他组分的非脂质体溶液FuGENE-6 试剂、两性离子氨基脂质(ZAL)、
Figure BDA0003651481360003851
(例如,形成DNA/Ca2+微复合物)、聚乙烯亚胺(PEI)(例 如分支PEI)和聚(L-赖氨酸)(PLL)。
细胞穿透肽
在一些实施方案中,递送载体包含细胞穿透肽(CPP)。CPP是促进细胞摄取各种分子负 荷的短肽(例如,从纳米级颗粒到小化学分子和DNA大片段)。
CPP可能具有不同的大小、氨基酸序列和电荷。在一些实施例中,CPP可以使质膜易位 并促进各种分子负荷递送至细胞质或细胞器。CPP可以通过不同的机制引入细胞中,例如直 接穿透细胞膜、内吞介导的进入和通过形成暂时结构的易位。
CPP可能具有含高相对丰度的带正电氨基酸,诸如赖氨酸或精氨酸抑或具有含极性/带 电氨基酸和非极性疏水性氨基酸的交替模式的序列的氨基酸组成。这两种类型的结构分别称 为聚阳离子或两亲性结构。第三类CPP是仅含有非极性残基、具有低净电荷或具有对细胞 摄取至关重要的疏水性氨基酸基团的疏水性肽。另一种类型的CPP是来自人类免疫缺陷病 毒1(HIV-1)的反式激活转录激活因子(Tat)。CPP的示例包括渗透肽、Tat(48-60)、转运子和 (R-AhX-R4)(Ahx是指氨基己酰基)、卡波西成纤维细胞生长因子(FGF)信号肽序列、整合素 β3信号肽序列、聚精氨酸肽Arg序列、富鸟嘌呤分子转运蛋白和甜箭肽。CPP和相关应用 的示例还包括美国专利号8,372,951中所述的那些。
CPP可以相当容易地用于体外和离体工作,并且通常需要对各个负荷和细胞类型进行深 入优化。在一些实施例中,CPP可以直接与Cas蛋白共价连接,然后与gRNA复合并递送 至细胞。在一些实施例中,CPP-Cas和CPP-gRNA可以分别递送至多个细胞。CPP还可以 用于递送RNP。
CPP可以用于将组合物和系统递送至植物。在一些实施例中,CPP可以用于将组分递送 至植物原生质体,然后再生为植物细胞并进一步再生为植物。
DNA纳米线团
在一些实施方案中,递送载体包括DNA纳米线团。DNA纳米线团是指DNA的球样结构(例如,具有纱线球形状)。纳米线团可以通过用有助于结构自组装的回文序列进行滚环扩 增来合成。然后可以对球体加载有效负载。DNA纳米线团的一个示例描述于以下文献中:Sun W等,J Am Chem Soc.2014年10月22日;136(42):14722-5;以及Sun W等,Angew ChemInt Ed Engl.2015年10月5日;54(41):12029-33。DNA纳米线团可能具有与Cas:gRNA核糖核蛋白复合物内的gRNA部分互补的回文序列。可以包覆DNA纳米线团,例如用PEI包覆 以诱导内体逃逸。
金纳米颗粒
在一些实施方案中,递送载体包含金纳米颗粒(也称为AuNP或胶态金)。金纳米颗粒可 以与负荷形成复合物,例如Cas:gRNA RNP。可以包覆金纳米颗粒,例如包覆在硅酸盐和内 体破坏性聚合物PAsp(DET)中。金纳米颗粒的示例包括AuraSense Therapeutics的球形核酸 (SNATM)构建体,以及Mout R等(2017).ACS Nano 11:2452-8;Lee K等,(2017).NatBiomed Eng 1:889-901所述的那些。
iTOP
在一些实施方案中,递送载体包括iTOP。iTOP是指小分子组合驱动天然蛋白质的高效 细胞内递送,不依赖任何转导肽。iTOP可以用于通过渗透和丙烷甜菜碱,使用NaCl介导的 高渗性与转导化合物(丙烷甜菜碱)一起触发胞外大分子的巨细胞摄取至细胞中来诱导转导。 iTOP方法和试剂的示例包括D'Astolfo DS,Pagliero RJ,Pras A等,(2015).Cell161:674-690所 述的那些。
基于聚合物的颗粒
在一些实施方案中,递送载体可以包括基于聚合物的颗粒(例如,纳米颗粒)。在一些实 施方案中,基于聚合物的颗粒可以模拟膜融合的病毒机制。基于聚合物的颗粒可能是流感病 毒机制的合成拷贝,并与细胞通过内吞途径摄取的各种类型的核酸((siRNA、miRNA、质粒 DNA或shRNA、mRNA)形成转染复合物,这个过程涉及形成酸性隔室。晚期内体中的低 pH充当化学开关,致使颗粒表面为疏水性的并促进膜穿过。一旦在胞质液中,所述颗粒就 释放其有效负载以进行细胞作用。这种主动内体逃逸技术是安全的,并且由于它是使用天然 摄取途径,因此可以最大化转染效率。在一些实施方案中,基于聚合物的颗粒可以包含烷基 化和羧基烷基化支链聚乙烯亚胺。在一些实施例中,基于聚合物的颗粒是VIROMER,例如 VIROMER RNAi、VIROMER RED、VIROMER mRNA、VIROMER CRISPR。递送本文的系统和组合物的示例性方法包括以下文献所述的那些方法:Bawage SS等,Synthetic mRNAexpressed Cas13a mitigates RNA virus infections, www.biorxiv.org/content/10.1101/370460v1.full doi:doi.org/10.1101/370460;
Figure BDA0003651481360003861
RED,a powerful toolfor transfection of keratinocytes.doi:10.13140/RG.2.2.16993.61281;
Figure BDA0003651481360003862
Transfection-Factbook 2018:technology,product overview,users'data., doi:10.13140/RG.2.2.23912.16642。
链球菌溶血素O(SLO)
递送载体可以是链球菌溶血素O(SLO)。SLO是由A组链球菌产生的毒素,通过在哺乳动物细胞膜上产生孔隙而起作用。SLO能以可逆方式发挥作用,允许蛋白质(例如,高达100kDa)递送至细胞的胞质液而不牺牲总体活力。SLO的示例包括Sierig G等(2003).Infect Immun 71:446-55;Walev I等(2001).Proc Natl Acad Sci U S A 98:3185-90;Teng KW等(2017). Elife 6:e25460所述的那些。
多功能信封型纳米器件(MEND)
递送载体可以包括多功能信封型纳米器件(MEND)。MEND可以包含浓缩的质粒DNA、PLL核心和脂质膜壳。MEND还可以包含细胞穿透肽(例如,硬脂基八精氨酸)。细胞穿透肽 可以在脂质壳中。脂质包膜可以用一种或多种功能性组分加以修饰,例如以下中的一种或多种:聚乙二醇(例如,以增加血管循环时间)、用于靶向特定组织/细胞的配体、其他细胞穿透肽(例如,用于较大细胞递送)、用以增强内体逃逸的脂质和核递送标签。在一些实施例中,MEND可以是四层MEND(T-MEND),其可以靶向细胞核和线粒体。在某些实施例中,MEND 可以是PEG-肽-DOPE-缀合型MEND(PPD-MEND),其可以靶向膀胱癌细胞。MEND的示 例包括KogureK等(2004).J Control Release 98:317-23;Nakamura T等(2012).Acc Chem Res 45:1113-21所述的那些。
脂质包覆型中孔二氧化硅颗粒
递送载体可以包含脂质包覆的中孔二氧化硅颗粒。脂质包覆型中孔二氧化硅颗粒可以包 含中孔二氧化硅纳米颗粒核和脂质膜壳。二氧化硅核心可能具有较大内表面积,从而产生较 高负荷装载能力。在一些实施方案中,可以修饰孔径、孔隙化学性质和总体粒度以装载不同 类型的负荷。还可以修饰颗粒的脂质涂层以最大化负荷装载、增加循环时间并提供精确靶向 和负荷释放。脂质包覆型中孔二氧化硅颗粒的示例包括Du X等(2014).Biomaterials 35:5580-90;Durfee PN等(2016).ACS Nano 10:8325-45所述的那些。
无机纳米颗粒
递送载体可以包括无机纳米颗粒。无机纳米颗粒的示例包括碳纳米管(CNT)(例如,如 Bates K和Kostarelos K.(2013).Adv Drug Deliv Rev 65:2023-33.所述)、裸中孔二氧化硅纳米 颗粒(MSNP)(例如,如Luo GF等,(2014).Sci Rep 4:6064所述)和致密二氧化硅纳米颗粒 (SiNP)(如Luo D和Saltzman WM.(2000).Nat Biotechnol 18:893-5所述)。
外来体
递送载体可以包括外来体。外来体包括膜结合细胞外囊泡,其可用于容纳和递送各种类 型的生物分子,诸如蛋白质、碳水化合物、脂质和核酸及其复合物(例如,RNP)。外来体的 示例包括以下文献所述的那些:Schroeder A等,J Intern Med.2010年1月;267(1):9-21; El-Andaloussi S等,Nat Protoc.2012年12月;7(12):2112-26;Uno Y等,Hum GeneTher.2011 年6月;22(6):711-9;Zou W等,Hum Gene Ther.2011年4月;22(4):465-75。
在一些实施例中,外来体可以与负荷的一种或多种组分形成复合物(例如,通过直接或 间接结合)。在某些实施例中,外来体分子可以与第一衔接蛋白融合,并且负荷的组分可以 与第二衔接蛋白融合。第一衔接蛋白和第二衔接蛋白可以彼此特异性结合,从而负荷与外来 体缔合。此类外来体的示例包括Ye Y等,Biomater Sci.2020年4月28日.doi:10.1039/d0bm00427h所述的那些。
优化的功能性RNA靶向系统
因此,在一个方面,本发明提供了一种用于特异性递送功能性组分至RNA环境的系统。 这可以使用包含本发明的RNA靶向性效应蛋白的CRISPR系统来确保,其允许不同的组分 特异性靶向RNA。更具体来说,此类组分包括激活子或阻遏子,诸如RNA翻译、降解等的激活子或阻遏子。CRISPR-Cas13敲低允许通过使用人工转录因子暂时降低基因表达,例如通过使Cas13蛋白切割结构域中的残基突变产生了无催化活性的Cas13蛋白。无催化活性的Cas13与向导RNA或crRNA复合并且定位至由该向导RNA或crRNA的靶向结构域指定的 RNA序列,然而,它不会切割所述靶标。无活性Cas13蛋白与效应结构域融合(例如转录阻 遏结构域)能够将效应子征募至向导RNA指定的任何位点。
根据一个方面,本发明提供了非天然存在或工程改造的组合物,其包含向导RNA或crRNA,该向导RNA或crRNA包含能够与细胞中的目标靶序列杂交的向导序列,其中所述 向导RNA或crRNA通过插入一个或多个与衔接蛋白结合的不同RNA序列进行修饰。在特 定实施方案中,RNA序列可以结合两个或更多个衔接蛋白(例如适体),并且其中各个衔接蛋 白与一个或多个功能域缔合。当存在超过一个功能域时,所述功能域可以相同或不同,例如, 两个相同或两个不同的激活子或阻遏子。在一个方面,本发明提供了一种本文讨论的组合物,其中所述一个或多个功能域连接至RNA靶向酶,使得与靶RNA结合后,所述功能域呈允 许所述功能域发挥其属性功能的空间取向;在一个方面,本发明提供了一种本文讨论的组合物,其中所述组合物包含具有至少三个功能域的CRISPR-Cas13复合物,其中至少一个与RNA靶向酶缔合并且其中至少两个与gRNA或crRNA缔合。
基因修饰的细胞和生物体
本公开还提供了包含本文的系统的一种或多种组分,例如Cas蛋白和/或向导分子的细 胞。还提供了包括由本文的系统和方法修饰的细胞,以及包含此类细胞或其后代的细胞培养 物、组织、器官、生物体。在一些实施方案中,本发明包括一种修饰细胞或生物体的方法。 所述细胞可以是原核细胞或真核细胞。所述细胞可以是哺乳动物细胞。所述哺乳动物细胞许 多是非人灵长类、牛、猪、啮齿动物或小鼠细胞。所述细胞可以是非哺乳动物真核细胞,诸 如家禽、鱼或虾。所述细胞可以是治疗性T细胞或产抗体B细胞。所述细胞还可以是植物 细胞。植物细胞可以属于农作物,诸如木薯、玉米、高粱、小麦或水稻。所述植物细胞还可 以属于藻类、树木或蔬菜。通过本发明引入所述细胞的修饰可以改变所述细胞和所述细胞的 后代以提高生物产品如抗体、淀粉、醇或其它所需细胞产出物的产量。通过本发明引入所述 细胞的修饰可以使得所述细胞和所述细胞的后代包括改变所产生的生物产物的变化。
在一些实施方案中,将驱动核酸靶向系统的一个或多个元件表达的一个或多个多核苷酸 分子、载体或载体系统或者包含核酸靶向系统的一个或多个元件的递送系统引入宿主细胞 中,使得核酸靶向系统的元件的表达指导一个或多个靶位点处核酸靶向复合物的形成。在本 发明的某些实施方案中,宿主细胞可以是真核细胞、原核细胞或植物细胞。
在特定实施方案中,宿主细胞是细胞系的细胞。细胞系可获自本领域技术人员已知的多 种来源(参见例如美国典型培养物保藏中心(ATCC)(Manassas,Va.))。在一些实施方案中,使 用经本文所述的一个或多个载体转染的细胞来建立包含一个或多个载体衍生序列的新细胞 系。在一些实施方案中,使用经如本文所述的CRISPR系统的组分瞬时转染(诸如通过用一 个或多个载体瞬时转染或者用RNA转染)并且通过CRISPR复合物的活性加以修饰的细胞来 建立新细胞系,所述新细胞系包括含有所述修饰但缺乏任何其它外源序列的细胞。在一些实 施方案中,使用经本文所述的一个或多个载体瞬时或非瞬时转染的细胞或者衍生自此类细胞 的细胞系来评价一种或多种测试化合物。
还意图是分离的人细胞或组织、植物或非人动物,它们包含本文实施方案中任一个所述 的一个或多个多核苷酸分子、载体、载体系统或细胞。在一个方面,提供了通过或包含本发 明组合物、系统或经修饰的酶加以修饰的宿主细胞和细胞系,包括(分离的)干细胞及其后代。
在某些实施方案中,所述植物或非人动物在所述植物或非人动物的至少一个组织类型中 包含本文实施方案中任一个所述的CRISPR系统组分、多核苷酸分子、载体、载体系统或细 胞中的至少一者。在某些实施方案中,非人动物在至少一个组织类型中包含本文实施方案中 任一个所述的CRISPR系统组分、多核苷酸分子、载体、载体系统或细胞中的至少一者。在 某些实施方案中,所述CRISPR系统组分的存在是暂时性的,因为它们会随时间降解。在某 些实施方案中,多核苷酸分子、载体、载体系统或细胞包含的如所述实施方案中任一个所述 的CRISPR-Cas系统或Cas蛋白的表达仅限于所述植物或非人动物中的某些组织类型或区 域。在某些实施方案中,多核苷酸分子、载体、载体系统或细胞中包含的如所述实施方案中 任一个所述的CRISPR-Cas系统或Cas蛋白的表达依赖于生理学信号。在某些实施方案中, 多核苷酸分子、载体、载体系统或细胞中包含的如所述实施方案中任一个所述的CRISPR-Cas 系统或Cas蛋白的表达可以通过外源分子来触发。在某些实施方案中,多核苷酸分子、载体、 载体系统或细胞中包含的如所述实施方案中任一个所述的CRISPR-Cas系统或Cas蛋白的表 达取决于所述植物或非人动物中的非cas分子的表达。
使用方法概述
在另一方面,本公开公开了使用本文的组合物和系统的方法。一般来说,所述方法包括 通过在包含靶核酸的细胞或生物体中引入工程改造的Cas蛋白、编码工程改造的Cas蛋白的 多核苷酸、包含所述多核苷酸的CRISPR-Cas系统或载体或载体系统来修饰靶核酸,使得所 述工程改造的CRISPR-Cas蛋白修饰所述细胞或生物体中的靶核酸。工程改造的CRISPR-Cas 蛋白或系统可以经由通过脂质体、纳米颗粒、外来体、微泡、核酸纳米组装体、基因枪、可 植入装置或本文的载体系统递送来引入。所述细胞或生物体可以是真核细胞或生物体。所述 细胞或生物体是动物细胞或生物体。所述细胞或生物体是植物细胞或生物体。核酸纳米组装 体的示例包括DNA折纸和RNA折纸,例如US8554489、US20160103951、WO2017189914 和WO2017189870所述的那些,诸案通过引用整体并入。基因枪可以包括基因枪颗粒递送 系统,这是用于将外源DNA(转基因)递送至细胞的装置。有效载荷可以是包覆有DNA(通 常是质粒DNA)的重金属元素颗粒。CRISPR-Cas系统中递送组分的一个示例描述于Svitashev 等,Nat Commun.2016;7:13274中。
在一些实施方案中,所述靶核酸包含基因组基因座,并且所述工程改造的CRISPR-Cas 蛋白修饰了所述基因组基因座处编码的基因产物或基因产物的表达。所述靶核酸是DNA或 RNA,并且其中可以对所述靶核酸中的一个或多个核苷酸进行碱基编辑。所述靶核酸可以 是DNA或RNA,并且其中所述靶核酸被切割。所述工程改造的CRISPR-Cas蛋白还可以切割非靶核酸。
非同源末端连接
在某些实施方案中,核酸酶诱导的非同源末端连接(NHEJ)可以用于靶基因特异性敲除。 核酸酶诱导的NHEJ还可以用于去除(例如缺失)目标基因中的序列。一般来说,NHEJ通过 将两端连接在一起来修复DNA中的双链断裂;然而,一般来说,只有在两个相容的末端完 全连接时原始序列才能恢复得跟它们由双链断裂形成完全一样。双链断裂的DNA末端往往 是酶促加工的对象,从而在一个或两个链添加或去除核苷酸,随后再连接所述末端。这导致 DNA序列中的NHEJ修复位点处存在插入和/或缺失(插入缺失)突变。这些突变中有三分之 二通常改变了阅读框,并且因此产生了无功能蛋白质。另外,维持阅读框但插入或缺失大量 序列的突变可能破坏蛋白质的功能性。这是基因座依赖性的,因为与蛋白质的非重要区域中 的突变相比,重要功能域中的突变可能不太耐受。由NHEJ产生的插入缺失突变本质上是不 可预测的;然而,在指定断裂位点,某些插入缺失序列受益并且在群体中过度呈现,很可能 由于微组织学的小区域之故。缺失的长度可以广泛变化;最普遍在1至50bp范围内,但它 们可能轻易超过50bp,例如,它们可以轻易达到超过约100至200bp。插入倾向于较短并 且通常包括紧靠断裂位点周围的序列的短复制。然而,有可能获得大插入,而且在这些情况 下,插入序列往往上溯至基因组的其他区域或细胞中存在的质粒DNA。
因为NHEJ是诱变过程,所以它还可以用来缺失小序列基序,只要不要求产生特定最终 序列即可。如果双股断裂靶向短靶序列附近,则由NHEJ修复引起的缺失突变通常跨越并且 因此去除不需要的核苷酸。对于较大DNA区段的缺失,引入两个双链断裂(序列每一侧上一 个)可以引起末端之间的NHEJ,并去除整个插入序列。这两种方法都可以用于缺失特定DNA 序列;然而,NHEJ的易出错特性可能仍在修复位点产生插入缺失突变。
双链切割Cas蛋白或其直系同源物或同源物和单链或切口酶Cas蛋白或其直系同源物或 同源物分子都可以用于本文所述的方法和组合物中以产生NHEJ介导的插入缺失。靶向基 因,例如目标基因的编码区,例如早期编码区的NHEJ介导的插入缺失可以用于敲除(即, 消除表达)目标基因。举例来说,目标基因的早期编码区包括紧接在转录起始位点之后、在 编码序列的第一外显子内或在距转录起始位点500bp内(例如,少于500、450、400、350、 300、250、200、150、100或50bp)的序列。
在一个实施方案中,其中向导RNA和Cas蛋白或其直系同源物或同源物产生双链断裂 以便诱导NHEJ介导的插入缺失,向导RNA可以经过配置以便将一个双链断裂定位在紧邻靶位置的核苷酸处。在一个实施方案中,所述切割位点可以在距靶位置0至500bp之间(例如,距靶位置不到500、400、300、200、100、50、40、30、25、20、15、10、9、8、7、6、 5、4、3、2或1bp)。
在一个实施方案中,其中与Cas蛋白或其直系同源物或同源物(优选Cas切口酶)复合的 两个向导RNA诱导两个单链断裂以便诱导NHEJ介导的插入缺失,两个向导RNA可以经配置以定位两个单链断裂,从而给靶位置的核苷酸提供NHEJ修复。
在一些实施例中,本文的系统可以通过NHEJ途径引入一个或多个插入缺失并通过HDR 插入来自组合模板的序列。
诊断用途
在一些实施方案中,所述方法还可以包括观察活性并任选地使用可检测标记物。所述方 法还可以包括检测CRISPR-Cas系统的一种或多种组分与靶核酸的结合。
在另一方面,所述使用方法包括检测样品中的靶核酸。在一些实施方案中,所述方法包 括:使样品与以下接触:工程改造的CRISPR-Cas蛋白;包含能够与所述靶核酸结合并经设 计以便与所述工程改造的CRISPR-Cas形成复合物的向导序列的至少一个向导多核苷酸;以 及包含非靶序列的基于RNA的掩蔽构建体;其中所述工程改造的CRISPR-Cas蛋白表现出 旁系RNA酶活性并切割所述检测构建体的非靶序列;以及检测来自切割所述非靶序列的信 号,从而检测所述样品中的靶核酸。所述方法还可以包括使所述样品与用于扩增所述靶核酸 的试剂接触。所述用于扩增的试剂可以包含等温扩增反应试剂。所述等温扩增试剂可以包括 基于核酸序列的扩增、重组酶聚合酶扩增、环介导型等温扩增、链置换扩增、解旋酶依赖性 扩增或切口酶扩增试剂。所述靶核酸是DNA分子,并且所述方法还可以包括使所述靶DNA 分子与包含RNA聚合酶位点的引物和RNA聚合酶接触。
检测可以包括两个或更多个利用RNA靶向性Cas效应蛋白的检测系统、DNA靶向性Cas效应蛋白或其组合。所述RNA靶向性效应蛋白可以是Cas13蛋白,诸如Cas13a、Cas13b 或Cas13c。所述DNA靶向性效应蛋白可以是VI型蛋白,例如Cas12蛋白,诸如Cpf1和 C2c1。可以设计多路系统,以便可以使用具有不同序列特异性或其他基序切割偏好的不同 Cas蛋白。参见国际公开WO 2019/126577。多路方法和Cas效应蛋白选择可以如国际公开 WO 2019/126577在[0415]至[0416]和实施例1至10中所述,该案通过引用并入本文。
所述遮蔽构建体:抑制可检测正信号的产生直至所述遮蔽构建体被切割或失活,或者遮 蔽可检测正信号或产生可检测负信号直至所述遮蔽构建体被切割或失活。所述遮蔽构建体可 能包含:抑制由报告构建体编码的基因产物的产生的沉默RNA,其中所述基因产物在表达 时产生可检测正信号;产生可检测负信号的核糖酶,并且其中当所述核糖酶失活时产生了可 检测正信号;或将底物转化为第一颜色的核糖酶,并且其中当所述核糖酶失活时,所述底物 转化为第二颜色;适体和/或包含多核苷酸栓系型抑制剂;可检测配体和掩蔽组分连接的多 核苷酸;通过桥分子保持呈聚集体形式的纳米颗粒,其中所述桥分子的至少一部分包含多核 苷酸,并且其中当所述纳米颗粒分散在溶液中时所述溶液发生了颜色变化;通过连接分子与 一个或多个淬灭剂分子连接的量子点或荧光团,其中所述连接分子的至少一部分包含多核苷 酸;与嵌入剂复合的多核苷酸,其中所述嵌入剂在切割所述多核苷酸后改变了吸光度;或通 过多核苷酸拴系的两个荧光团,当从所述多核苷酸释放时会发生荧光变化。
适体可以包含多核苷酸拴系型抑制剂,所述多核苷酸拴系型抑制剂隔绝了酶,其中所述 酶在从所述适体或多核苷酸拴系型抑制剂释放时通过作用于底物而产生可检测信号;或者可 以是抑制了酶并防止所述酶催化从底物产生可检测信号的抑制性适体,或其中所述多核苷酸 拴系型抑制剂抑制了酶并防止所述酶催化从底物产生可检测信号;或者隔绝了一对剂,当所 述剂从适体释放时组合产生可检测信号。
所述纳米颗粒可以是胶态金属。胶态金属材料可以包括分散在液体、水溶胶或金属溶胶 中的水不溶性金属颗粒或金属化合物。胶态金属可以选自周期表IA、IB、IIB和IIIB族中的 金属,以及过渡金属,尤其是VIII族的那些金属。优选的金属包括金、银、铝、钌、锌、铁、镍和钙。其他合适的金属还包括以下金属的所有不同的氧化态:锂、钠、镁、钾、钪、 钛、钒、铬、锰、钴、铜、镓、锶、铌、钼、钯、铟、锡、钨、铼、铂和钆。金属优选以衍 生自适当金属化合物的离子形式,例如Al3+、Ru3+、Zn2+、Fe3+、Ni2+和Ca2+离子提供。
当RNA桥被激活的CRISPR效应子切割时,观测到了前文提到的色移。在某些示例性实施方案中,颗粒是胶态金属。在某些其他示例性实施方案中,所述胶态金属是胶态金。在某些示例性实施方案中,胶态纳米颗粒是15nm金纳米颗粒(AuNP)。由于胶态金纳米颗粒 的独特表面特性,当完全分散在溶液中时在520nm下观测到最大吸光度,并且在肉眼看来 呈现红色。在AuNP聚集后,它们表现出了最大吸光度的红移并且颜色变深,最终从溶液中 沉淀为深紫色聚集体。
在一些实施方案中,至少一个向导多核苷酸包含错配。所述错配可以在一个或多个向导 序列上的单核苷酸变异的上游或下游。在某些实施方案中,对切割效率的调节可以通过引入 错配来利用,例如1个或更多个错配,诸如间隔子序列和靶序列之间的1或2个错配,包括 沿间隔子/靶标的错配位置。举例来说,双错配越靠近中心(即,不在3'或5'),切割效率就越 受影响。因此,通过选择沿间隔子的错配位置,可以调节切割效率。举例来说,如果需要小 于100%的靶标切割(例如,在细胞群中),则可以在间隔子序列中在间隔子与靶序列之间引 入1个或更多个,诸如优选2个错配。沿着错配位置的间隔子越靠近中心,切割百分比越低。 在某些示例性实施方案中,可以利用切割效率来设计能区分两个或更多个因单个核苷酸而变 化的靶标的单个向导,诸如单核苷酸多态性(SNP)、变异或(点)突变。CRISPR效应子可能对 SNP(或其他单核苷酸变异)具有降低的敏感性,并继续以一定水平的效率切割SNP靶标。 因此,对于两个靶标或一组靶标,向导RNA可以设计为具有与所述靶标之一互补的核苷酸 序列,即中靶SNP。进一步设计向导RNA以具有合成错配。如本文所用,“合成错配”是指 引入在天然存在的SNP上游或下游,诸如在上游或下游最多5个核苷酸,例如在上游或下 游4、3、2或1个核苷酸,优选在上游或下游至多3个核苷酸,更优选在上游或下游至多2 个核苷酸,最优选在上游或下游1个核苷酸(即,与SNP相邻)的非天然存在的错配。当CRISPR 效应子与中靶SNP结合时,只会与合成错配形成单个错配,并且将继续激活CRISPR效应 子并产生可检测信号。当向导RNA与脱靶SNP杂交时,将形成两个错配,即来自SNP的 错配和合成错配,并且不产生可检测信号。因此,可以设计本文公开的系统以区分群体内的 SNP。举例来说,所述系统可用于区分因SNP而不同的致病菌株或检测某些疾病特异性SNP, 诸如但不限于疾病相关SNP,诸如但不限于癌症相关SNP。
在某些实施方案中,设计向导RNA使得SNP位于间隔子序列第1、2、3、4、5、6、7、 8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、 29或30位(从5'端开始)。在某些实施方案中,设计向导RNA使得SNP位于间隔子序列第1、2、3、4、5、6、7、8或9位(从5'端开始)。在某些实施方案中,设计向导RNA使得SNP 位于间隔子序列第2、3、4、5、6、或7位(从5'端开始)。在某些实施方案中,设计向导RNA 使得SNP位于间隔子序列第3、4、5或6位(从5'端开始)。在某些实施方案中,设计向导 RNA使得SNP位于间隔子序列第3位(从5'端开始)。
在某些实施方案中,设计向导RNA使得错配(例如合成错配,即除SNP以外的额外突变)位于间隔子序列第1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29或30位(从5'端开始)。在某些实施方 案中,设计向导RNA使得错配位于间隔子序列第1、2、3、4、5、6、7、8或9位(从5'端 开始)。在某些实施方案中,设计向导RNA使得错配位于间隔子序列第4、5、6或7位(从 5'端开始。在某些实施方案中,设计向导RNA使得错配位于间隔子序列第5位(从5'端开始)。
在某些实施方案中,设计向导RNA使得错配位于SNP上游2个核苷酸(即,一个插入核苷酸)。在某些实施方案中,设计向导RNA使得错配位于SNP下游2个核苷酸(即,一个 插入核苷酸)。在某些实施方案中,设计向导RNA使得错配位于间隔子序列的第5位(从5' 端开始)并且SNP位于间隔子序列的第3位(从5'端开始)。
微生物检测和诊断
在一个方面,诊断和/或检测方法包括检测一种或多种病毒或病毒感染的存在。还提供 了用于诊断和检测方法的药盒和系统的设计。病毒可以是DNA病毒、RNA病毒或逆转录病 毒或其组合。病毒检测方法如国际专利公开号WO 2018/170340所述。特定病毒应用包括如 国际公开WO 2018/170340的[0347]-[0354]以及表8和表9中所述的病毒,该案通过引用并 入本文。病毒诊断平台可以利用如Myrhvold等,“Field Deployable viraldiagnostics using CRISPR-Cas13”Science 360,444-448(2018)所述的方法来开发。诸如尿液、血浆、唾液、全 血或血清等临床样品可以用于灵敏地检测病毒感染。如本文在别处所述,此类方法还可以单 独或连同Cas13蛋白一起使用。
可以设计系统和方法以用于检测和诊断微生物,包括细菌、真菌和病毒微生物。在一个 方面,所述系统可以包括对多种病毒感染变体的多路检测,包括冠状病毒、可能是相关冠状 病毒或呼吸道病毒的不同病毒或其组合。在诸多实施方案中,可以使用本文详述的公开内容 对多种病毒和病毒感染,包括急性呼吸道感染进行测定。所述系统可以包含两个或更多个 CRISPR Cas系统以便如本文在别处所述多路检测多种呼吸道感染或病毒感染,包括冠状病 毒。冠状病毒是一种感染多种动物和人类的有义单链RNA病毒家族。在一个方面,所述检 测系统用于鉴定感染了冠状病毒的患者,例如2019-nCoV或相关冠状病毒,例如包含与 2019-nCoV、GISAID保藏登录号EPI_ISL_402124和EPI_ISL_402127-402130的至少80%、 85%、90%、95%、96%、97%、98%或99%同一性的冠状病毒,并描述于DOI:10.1101/2020.01.22.914952或EP_ISL_402119-402121和EP_ISL 402123-402124中;另见GenBank登录号MN908947.3。
可以用本文的组合物、系统和方法检测和/或诊断的微生物(及其感染)的例子包括Zhang 等,WO2019148206A1的第[00288]-[00298]段中所述的那些,通过引用整体并入本文。
转录物追踪
在另一方面,本公开提供了用于转录物追踪的组合物和方法。在一些实施方案中,转录 物追踪允许研究人员观察细胞、组织、器官或动物中的转录物,从而提供关于RNA动力学 和功能的重要时空信息。
在一些实施方案中,所述组合物可以是本文中具有一个或多个标记物的CRISPR-Cas蛋 白,或包含此类标记的CRISPR-Cas蛋白的CRISPR-Cas系统。所述CRISPR-Cas蛋白或系 统可以与一种或多种转录物结合,从而可以使用CRISPR-Cas蛋白上的标记物来检测(例如, 观察)转录物。
在一些实施方案中,本公开包括一种用于表达具有一种或多种多肽或多核苷酸标记物的 CRISPR-Cas蛋白的系统。所述系统可以包含编码CRISPR-Cas蛋白的多核苷酸和/或标记物。 所述系统还可以包括包含这种多核苷酸的载体系统。举例来说,CRISPR-Cas蛋白可以与荧 光蛋白或其片段融合。荧光蛋白的示例包括GFP蛋白、EGFP、Azami-Green、Kaede、ZsGreen1 和CopGFP;CFP蛋白,诸如Cerulean、mCFP、AmCyan1、MiCy和CyPet;BFP蛋白,诸 如EBFP;YFP蛋白,诸如EYFP、YPet、Venus、ZsYellow和mCitrine;OFP蛋白,诸如 cOFP、mKO和mOrange;红色荧光蛋白或RFP;来自任何其他物种的红色或远红色荧光蛋 白,诸如Heteractis reef coral和Actinia或Entacmaea海葵,以及其变体。RFP包括例如Discosoma变体,诸如mRFP1、mCherry、tdTomato、mStrawberry、mTangerine、DsRed2 和DsRed-T1、Anthomedusa J-Red和Anemonia AsRed2。远红色荧光蛋白包括例如ActiniaAQ143、海葵eqFP611、Discosoma变体诸如mPlum和mRasberry以及Heteractis HcRed1和 t-HcRed。
在一些情况下,用于表达标记的CRISPR-Cas蛋白的系统可能是诱导型的。举例来说, 所述系统可以包含编码CRISPR-Cas蛋白的多核苷酸和/或受本文调控元件(例如,诱导型启 动子)控制的标记物。这样的系统可以允许对标记物的表达进行空间和/或时间控制,从而能 够对转录物追踪进行空间和/或时间控制。
在某些情况下,可以用可检测标签标记CRISPR-Cas。可以在细胞中进行标记。替代地 或另外地,可以首先进行标记,然后将标记的CRISPR-Cas蛋白递送到细胞、组织、器官或器官中。
可以检测(例如,通过成像、超声或MRI观察)可检测标签。此类可检测标签的示例包括 可检测寡核苷酸标签,可以是但不限于包含独特核苷酸序列的寡核苷酸、包含可检测部分的 寡核苷酸和包含独特核苷酸序列与可检测部分两者的寡核苷酸。在一些情况下,所述可检测 标签包括通过光谱、光化学、生物化学、免疫化学、电学、光学或化学手段可检测的标记物 质。此类标签包括用于以标记的链霉亲和素缀合物染色的生物素、磁性珠粒(例如,
Figure BDA0003651481360003941
)、荧光染料(例如,荧光素、德克萨斯红、罗丹明、绿色荧光蛋白等等)、放射性标记物(例如,3H、125I、35S、14C或32P)、酶(例如辣根过氧化物酶、碱性磷酸酶和其他ELISA常用酶)和量热标记物,诸如胶态金或有色玻璃或塑料(例如聚苯乙烯、聚丙烯、乳胶等)珠粒。 可以通过多种方法检测可检测标签。举例来说,放射性标记物可以使用照相胶片或闪烁计数 器检测,荧光标记物可以使用光检测器检测发射光来检测。通常通过向酶提供底物并检测由 酶对底物的作用产生的反应产物来检测酶标记物,并且通过简单地观察有色标记物来检测比 色标记物。可以采用的标记物质的示例包括本领域技术人员已知的标记物质,诸如荧光染料、 酶、辅酶、化学发光物质和放射性物质。具体示例包括放射性同位素(例如,32P、14C、125I、 3H和131I)、荧光素、罗丹明、丹磺酰氯、伞形酮、荧光素酶、过氧化物酶、碱性磷酸酶、β- 半乳糖苷酶、β-葡糖苷酶、辣根过氧化物酶、葡糖淀粉酶、溶菌酶、糖氧化酶、微过氧化 物酶、生物素和钌。在使用生物素作为标记物质的情况下,优选在加入生物素标记的抗体之 后,进一步加入与酶(例如过氧化物酶)结合的链霉亲和素。有利地,所述标记物是荧光标记 物。荧光标记物的示例包括但不限于Atto染料、4-乙酰氨基-4'-异硫氰酸根合芪-2,2'二磺酸; 吖啶和衍生物:吖啶、吖啶异硫氰酸盐;5-(2'-氨基乙基)氨基萘-1-磺酸(EDANS);4-氨基-N-[3- 乙烯基磺酰基)苯基]萘酰亚胺-3,5二磺酸盐;N-(4-苯胺基-1-萘基)马来酰亚胺;邻氨基苯甲 酰胺;BODIPY;亮黄;香豆素和衍生物;香豆素、7-氨基-4-甲基香豆素(AMC、香豆素120)、 7-氨基-4-三氟甲基香豆素(香豆满151);花青染料;氰苷;4',6-二氨基-2-苯基吲哚(DAPI); 5'5”-二溴邻苯三酚-磺酞(溴邻苯三酚红);7-二乙氨基-3-(4'-异硫氰酸根合苯基)-4-甲基香豆 素;二乙烯三胺五乙酸酯;4,4'-二异硫氰酸根合二氢-芪-2,2'-二磺酸;4,4'-二异硫氰酸根合芪 -2,2'-二磺酸;5-[二甲氨基]萘-1-磺酰氯(DNS,丹磺酰氯);4-二甲基氨基苯基偶氮苯基-4'-异 硫氰酸酯(DABITC);曙红和衍生物;曙红、曙红异硫氰酸酯、赤藓红和衍生物;赤藓红B、 赤藓红、异硫氰酸酯;乙锭;荧光素和衍生物;5-羧基荧光素(FAM)、5-(4,6-二氯三嗪-2-基) 氨基荧光素(DTAF)、2',7'-二甲氧基-4'5'-二氯-6-羧基荧光素、荧光素、荧光素异硫氰酸酯、 QFITC、(XRITC);荧光胺;IR144;IR1446;孔雀绿异硫氰酸酯;4-甲基伞形酮邻甲酚酞; 硝基酪氨酸;副玫瑰苯胺;酚红;B-藻红蛋白;邻苯二甲醛;芘和衍生物:芘、丁酸芘、琥 珀酰亚胺基1-芘;丁酸量子点;活性红4(Cibacron.TM.亮红3B-A)罗丹明和衍生物:6-羧基 -X-罗丹明(ROX)、6-羧基罗丹明(R6G)、丽丝胺罗丹明B磺酰氯罗丹明(Rhod)、罗丹明B、 罗丹明123、罗丹明X异硫氰酸酯、磺基罗丹明B、磺基罗丹明101、磺基罗丹明101的磺 酰氯衍生物(德州红);N,N,N',N'四甲基-6-羧基罗丹明(TAMRA);四甲基罗丹明;四甲基罗 丹明异硫氰酸酯(TRITC);核黄素;玫红酸;铽螯合物;Cy3;Cy5;Cy5.5;Cy7;IRD 700; IRD 800;拉约塔蓝;酞菁;和萘酞菁。荧光标记物可以是荧光蛋白,诸如蓝色荧光蛋白、 青色荧光蛋白、绿色荧光蛋白、红色荧光蛋白、黄色荧光蛋白或任何可光转变蛋白。比色标 记、生物发光标记和/或化学发光标记可以进一步实现标记。标记还可以包括通过扰动分析 在杂交复合物中的分子之间进行能量转移、淬灭或者供体与受体分子之间的电子传输,后者 可以通过双链匹配杂交复合物加以促进。荧光标记物可以是苝或涤纶。在替代方案中,荧光 标记物可以是荧光条形码。有利地,所述标记物可以是光敏感的,其中所述标记物是光激活 的,和/或光切割一个或多个接头以释放分子负荷。光激活分子负荷可能是主要光收集复合 物(LHCII)。在另一个实施方案中,荧光标记物可以诱导自由基形成。在一些实施方案中, 可检测部分可以是量子点。
在一些实施方案中,本公开提供了一种用于递送标记的CRISPR-Cas蛋白或标记的CRISPR-Cas系统的系统。所述递送系统可以包含任何递送载体,例如本文所述的那些,诸如RNP、脂质体、纳米颗粒、外来体、微泡、核酸纳米组装体、基因枪、可植入装置或本 文中的载体系统。
核酸靶向
在某些实施方案中,本发明的CRISPR-Cas效应蛋白是来自本文或如本文所述的这种蛋 白质、或在来自本文或如本文所述的这种蛋白质中、或包含来自本文或如本文所述的这种蛋 白质、或基本上由来自本文或如本文所述的这种蛋白质组成、或由来自本文或如本文所述的 这种蛋白质组成、或者包括或涉及来自本文或如本文所述的这种蛋白质,其中一个或多个氨 基酸突变,如本文在别处所述。因此,在一些实施方案中,所述效应蛋白可以是RNA结合 蛋白,诸如死Cas型效应蛋白,其可以如本文所述任选地功能化,例如用转录激活或阻遏结 构域、NLS或其他功能域。在一些实施方案中,所述效应蛋白可以是切割RNA单链的RNA 结合蛋白。如果结合的RNA是ssRNA,则所述ssRNA被完全切割。在一些实施方案中,所述效应蛋白可以是切割RNA双链的RNA结合蛋白,例如在它包含两个RNA酶结构域时。 如果结合的RNA是dsRNA,则所述dsRNA被完全切割。在一些实施方案中,所述效应蛋 白可以是具有切口酶活性的RNA结合蛋白,即,它结合dsRNA,但仅切割RNA链之一。
CRISPR系统中的RNA酶功能是已知的,例如,已报告对某些III型CRISPR-Cas系统的mRNA靶向(Hale等,2014,Genes Dev,第28卷,2432-2443;Hale等,2009,Cell,第139卷,945-956;Peng等,2015,Nucleic acids research,第43卷,406-417)并提供了显著优势。因此提 供了通过本发明的效应蛋白靶向RNA的CRISPR-Cas系统、组合物或方法。
靶RNA,即目标RNA,是本发明靶向的RNA,从而导致效应蛋白征募至并结合靶RNA上的目标靶位点。靶RNA可以是任何合适形式的RNA。在一些实施方案中,这可以包括 mRNA。在其他实施方案中,所述靶RNA可以包括tRNA或rRNA。
自失活系统
一旦细胞中所有RNA拷贝都已被编辑过,就不再需要在该细胞中继续CRISPR-Cas效 应蛋白表达或活性。依赖于就CRISPR-Cas或crRNA而言使用RNA作为向导靶序列的自失活系统可以通过阻止CRISPR-Cas表达或复合物形成来关闭所述系统。
靶RNA的示例
本文的组合物和系统可用于修饰各种类型的靶RNA。在一些实施方案中,所述组合物 和系统可用于以序列特异性方式修饰靶RNA。举例来说,靶RNA包含向导序列的靶序列。替代地或另外地,在一些实施方案中,所述组合物和系统可用于以非序列特异性方式修饰靶 RNA。举例来说,可以通过所述组合物和系统中Cas蛋白的旁系活性来修饰或切割靶RNA。靶RNA的示例包括以下所述的那些。
干扰RNA(RNAi)和微小RNA(miRNA)
在其他实施方案中,靶RNA可以包括干扰RNA,即参与RNA干扰途径的RNA,例如shRNA、siRNA等等。在其他实施方案中,靶RNA可以包括微小RNA(miRNA)。通过减 少干扰RNA或miRNA在体内或体外的寿命,控制干扰RNA或miRNA可能有助于减少这 些方法所见的脱靶效应(OTE)。
如果选择性地表达效应蛋白和合适的向导(例如在空间或时间上受合适的启动子,例如 组织或细胞周期特异性启动子和/或增强子控制),则这可以用于‘保护’细胞或系统(体内或体 外)免受那些细胞中的RNAi影响。这可能可用于不需要RNAi的邻近组织或细胞中,或者 用于比较其中效应蛋白和合适的向导表达和不表达(即,RNAi分别不受控制和受控制)的细 胞或组织的目的。效应蛋白可用于控制或结合至包含RNA或由RNA组成的分子,诸如核 糖酶、核糖体或核糖开关。在本发明的实施方案中,RNA向导可以将效应蛋白征募至这些 分子,使得所述效应蛋白能够与它们结合。
核糖体RNA(rRNA)
举例来说,氮杂内酯类抗生素,诸如阿奇霉素是众所周知的。它们靶向并破坏50S核糖 体亚基。在一些实施方案中,可以将本发明的效应蛋白连同靶向50S核糖体亚基的合适的向 导RNA征募至并结合至50S核糖体亚基。因此,提供了本发明的效应蛋白与针对核糖体(尤 其是50s核糖体亚基)靶标的合适的向导合作。这种使用效应蛋白与针对核糖体(尤其是50s 核糖体亚基)靶标的合适的向导合作使用可能包括抗生素使用。具体来说,抗生素使用类似 于诸如阿奇霉素等氮杂内酯类抗生素的作用。在一些实施方案中,可以靶向原核生物核糖体 亚基,诸如原核生物中的70S亚基、上述50S亚基、30S亚基以及16S和5S亚基。在其他 实施方案中,可以靶向真核生物核糖体亚基,诸如真核生物中的80S亚基、60S亚基、40S 亚基,以及28S、18S.5.8S和5S亚基。
效应蛋白可以是如本文所述任选地官能化的RNA结合蛋白。在一些实施方案中,所述 效应蛋白可以是切割RNA单链的RNA结合蛋白。在任一种情况下,但尤其在RNA结合蛋 白切割RNA单链的情况下,则可能调节,具体来说减少或破坏核糖体功能。这可能适用于 任何核糖体RNA和任何核糖体亚基,并且rRNA的序列是众所周知的。
因此设想通过使用本发明的效应蛋白与针对核糖体靶标的合适的向导合作控制核糖体 活性。这可以通过切割或结合至核糖体。具体来说,设想了降低核糖体活性。这可能可用于 在体内或体外测定核糖体功能,而且还可用作在体内或体外控制基于核糖体活性的疗法的手 段。此外,设想在体内或体外系统中控制(即,减少)蛋白质合成,这种控制包括抗生素以及 研究和诊断用途。
核糖开关
核糖开关(也称为适体酶)是信使RNA分子中结合小分子的调控片段。这通常引起由 mRNA编码的蛋白质的产量的变化。因此,设想了通过使用本发明的效应蛋白与针对核糖开关靶标的合适的向导合作来控制核糖开关活性。这可以通过切割或结合至核糖开关。具体 来说,设想了降低核糖开关活性。这可能可用于在体内或体外测定核糖开关功能,而且还可 用作在体内或体外控制基于核糖开关活性的疗法的手段。此外,设想了在体内或体外系统中 控制(即,减少)蛋白质合成。对于rRNA,这种控制可能包括抗生素以及研究和诊断用途。
核糖酶
核糖酶是具有催化特性的RNA分子,类似于酶(当然是蛋白质)。作为核糖酶(天然存在 的和工程改造的)都包含RNA或由其组成,它们还可以通过本发明的RNA结合效应蛋白加 以靶向。在一些实施方案中,效应蛋白可以是RNA结合蛋白,其切割核糖酶从而使其失效。 因此设想通过使用本发明的效应蛋白与针对核糖酶靶标的合适的向导来控制核糖酶活性。这 可以通过切割或结合至核糖酶。具体来说,设想了降低核糖酶活性。这可能可用于在体内或 体外测定核糖酶功能,而且还可用作在体内或体外控制基于核糖酶活性的疗法的手段。
RNA靶向应用
基因表达,包括RNA加工
效应蛋白还可以与合适的向导一起用于以靶向基因表达,包括通过控制RNA加工。控 制RNA加工可能包括RNA加工反应,诸如RNA剪接,包括替代性剪接,通过靶向RNApol; 病毒复制(特别是卫星病毒、噬菌体和逆转录病毒,诸如HBV、HBC和HIV以及本文列出 的其他病毒),包括植物中的类病毒;以及tRNA生物合成。效应蛋白和合适的向导还可用 于控制RNA激活(RNAa)。RNAa促进了基因表达,因此可以通过破坏或减少RNAa的方式 来实现控制基因表达,从而减少对基因表达的促进。
RNAi筛检
鉴定敲低与表型变化相关的基因产物,可以查询生物学途径并通过RNAi筛检鉴定组成 部分。还可以通过使用效应蛋白和合适的向导在这些筛检期间或过程中行使控制,以便在筛 检中去除或降低RNAi活性,从而恢复(之前受干扰的)基因产物的活性(通过去除或减少干扰 /阻遏)。
还可以处理卫星RNA(satRNA)和卫星病毒。
本文关于RNA酶活性的控制通常意指减少、负面破坏或敲低或敲除。
体内RNA应用
抑制基因表达
本文提供的靶特异性RNA酶允许非常特异性地切割靶RNA。干扰RNA水平允许在空间和时间上以及以非侵入性方式进行调节,因为基因组没有被修饰。
许多疾病已被证明可以通过mRNA靶向来治疗。尽管这些研究大部分涉及siRNA施用, 但显然本文提供的RNA靶向性效应蛋白可以按类似方式应用。
mRNA靶标(和相应疾病治疗)的示例是VEGF、VEGF-R1和RTP801(用于治疗AMD和 /或DME)、凋亡蛋白酶2(用于治疗Naion)ADRB2(用于治疗眼内压)、TRPVI(用于治疗干 眼综合征、Syk激酶(用于治疗哮喘)、Apo B(用于治疗高胆固醇血症)、PLK1、KSP和VEGF (用于治疗实体瘤)、Ber-Abl(用于治疗CML)(Burnett和Rossi Chem Biol.2012,19(1):60-71))。同样,已证明RNA靶向在治疗RNA病毒介导的疾病,诸如HIV(靶向HIV Tet和Rev)、RSV (靶向RSV核衣壳)和HCV(靶向miR-122)(Burnett和Rossi Chem Biol.2012,19(1):60-71)方 面有效。
还设想了本发明的RNA靶向性效应蛋白可用于突变特异性或等位基因特异性敲低。可 以设计向导RNA以特异性靶向转录mRNA中包含突变或等位基因特异性序列的序列。这种 特异性敲低特别适用于涉及与突变或等位基因特异性基因产物相关的病症的治疗应用。举例 来说,大部分家族性低β脂蛋白血症(FHBL)病例是由ApoB基因中的突变引起。该基因编 码两个版本的载脂蛋白B蛋白质:一个短版本(ApoB-48)和一个长版本(ApoB-100)。导致 FHBL的若干个ApoB基因突变致使两种版本的ApoB异常短。用本发明的RNA靶向性效 应蛋白特异性地靶向和敲低突变的ApoB mRNA转录物可能有益于治疗FHBL。作为另一个 示例,亨廷顿氏病(HD)是由编码亨廷顿蛋白的基因中CAG三联体重复序列的扩增,由此产 生异常蛋白质而引起。用本发明的RNA靶向性效应蛋白特异性地靶向和敲低编码亨廷顿蛋 白的突变或等位基因特异性mRNA转录物可能有益于治疗HD。
通过调节RNA功能调节基因表达
除了通过切割mRNA对基因表达的直接影响外,RNA靶向还可以用于影响细胞内RNA加工的特定方面,这可能允许对基因表达进行更微妙的调节。通常,调节可以例如通过干扰蛋白质与RNA的结合来介导,诸如阻断蛋白质的结合,或征募RNA结合蛋白。实际上, 可以在不同水平上确保调节,诸如mRNA的剪接、转运、定位、翻译和周转。类似地,在 治疗的背景下,可以设想通过使用RNA特异性靶向分子来解决这些水平中每一个下的(致病 性)故障。在这些实施方案中,在许多情况下优选RNA靶向蛋白是“死”CRISPR-Cas,其已 丧失切割RNA靶标的能力但保持与其结合的能力,诸如本文所述的CRISPR-Cas的突变形 式。
a)交替剪接
由于选择性剪接,许多人类基因表达多种mRNA。已证明不同的疾病与导致表达基因 功能丧失或功能获得的异常剪接有关。尽管这些疾病中有一些是由导致剪接缺陷的突变引 起,但其中有许多不是。一种治疗选择是直接靶向剪接机制。本文所述的RNA靶向性效应 蛋白可以例如用于阻断或促进剪接、包括或排除外显子并影响特定同种型的表达和/或刺激 替代蛋白质产物的表达。以下更详细地描述此类应用。
与靶RNA结合的RNA靶向性效应蛋白可以在空间上阻断剪接因子接近RNA序列。靶向剪接位点的RNA靶向性效应蛋白可以阻断所述位点的剪接,任选地将剪接重定向至相邻位点。举例来说,与5'剪接位点结合的RNA靶向性效应蛋白可以阻断剪接体U1组分的征 募,从而有利于跳过该外显子。替代地,靶向剪接增强子或沉默子的RNA靶向性效应蛋白 可以防止反式调控剪接因子在靶位点的结合,并有效地阻断或促进剪接。外显子排除还可以 通过如本文所述的RNA靶向性效应蛋白将ILF2/3征募至外显子附近的前体mRNA来实现。 作为又一个示例,可以连接富甘氨酸结构域以征募hnRNP A1和外显子排除(Del Gatto-Konczak等,Mol Cell Biol.1999年1月;19(1):251-60)。
在某些实施方案中,通过适当的gRNA选择,可以靶向特定的剪接变体,而不会靶向其他剪接变体。
在一些情况下,RNA靶向性效应蛋白可用于促进剪接(例如,在剪接有缺陷的情况下)。 举例来说,RNA靶向性效应蛋白可以与能够稳定剪接调控茎环的效应子缔合,以便进一步 剪接。RNA靶向性效应蛋白可以与特定剪接因子的共有结合位点序列连接,以便将蛋白质 征募至靶DNA。
与异常剪接相关的疾病的示例包括但不限于由能调控在突触中发挥功能的蛋白质的剪 接的Nova蛋白丧失而引起的副肿瘤性斜视性眼肌阵挛共济失调(或POMA),以及由囊性纤 维化跨膜传导调控子的缺陷性剪接导致产生无功能氯离子通道引起的囊性纤维化。在其他疾 病中,异常RNA剪接引起功能获得。举例来说,由mRNA的3'UTR中的CUG三联体重复 序列扩增(从50到>1500个重复序列)导致剪接缺陷而引起的强直性肌营养不良就是这样的 情况。
RNA靶向性效应蛋白可用于通过将剪接因子(诸如U1)征募至5'剪接位点以促进切除所 需外显子周围的内含子而包括外显子。这种征募可以通过与富精氨酸/丝氨酸结构域融合来 介导,该结构域起着剪接激活子的作用(Gravely BR和Maniatis T,Mol Cell.1998(5):765-71)。
设想RNA靶向性效应蛋白可用于阻断所需位点的剪接机制,从而阻止外显子识别和不 同蛋白质产物的表达。可以治疗的病症的一个示例是杜氏肌营养不良症(Duchennemuscular dystrophy,DMD),它是由编码肌营养不良蛋白的基因中的突变引起。几乎所有DMD突变 都会导致移码,从而损害肌营养不良蛋白翻译。RNA靶向性效应蛋白可以与剪接接点或外 显子剪接增强子(ESE)配对,从而阻止外显子识别,导致部分功能性蛋白质的翻译。这将致 命性杜氏表型转化为不太严重的贝氏表型。
b)RNA修饰
RNA编辑是通过RNA中的微小修饰增加指定序列的基因产物的多样性的一个自然过 程。通常,所述修饰涉及将腺苷(A)转化为肌苷(I),从而产生与基因组编码的RNA序列不同 的RNA序列。RNA修饰通常由ADAR酶确保,由此前RNA靶标通过含有欲编辑的腺苷的 外显子和内含子非编码元件之间的碱基配对形成不完美双链RNA。A-I编辑的一个典型示例 是谷氨酸受体GluR-B mRNA,由此所述改变导致通道的传导特性改变(Higuchi M等,Cell.1993;75:1361-70)。
在人类中,ADAR1基因中的杂合功能无效突变导致皮肤病,即人类色素性遗传性皮肤 病(Miyamura Y等,Am J Hum Genet.2003;73:693-9)。设想本发明的RNA靶向性效应蛋白可 以用于修正故障性RNA修饰。
c)多聚腺苷酸化
mRNA的多聚腺苷酸化对于核转运、翻译效率和mRNA稳定性很重要,而且所有这些以及多聚腺苷酸化过程都取决于特定的RBP。大部分真核生物mRNA在转录之后收到约200个核苷酸的3'多聚(A)尾。多聚腺苷酸化涉及刺激多聚(A)聚合酶活性的不同RNA结合蛋白复合物(Minvielle-Sebastia L等,Curr Opin Cell Biol.1999;11:352-7)。设想本文提供的RNA靶 向性效应蛋白可用于干扰或促进RNA结合蛋白和RNA之间的相互作用。
与多聚腺苷酸化所涉及的缺陷蛋白相关的疾病的示例是眼咽肌营养不良症(OPMD) (Brais B等,Nat Genet.1998;18:164-7)。
d)RNA输出
在前mRNA加工之后,mRNA从细胞核输出到细胞质。这通过细胞机制来确保,所述细胞机制涉及产生载体复合物,然后易位通过核孔并在细胞质中释放mRNA,随后再循环 所述载体。
已发现在RNA输出中起作用的蛋白质(诸如TAP)的过度表达增加了转录物的输出,而 在非洲爪蟾中输出效率低下(Katahira J等,EMBO J.1999;18:2593-609)。
e)mRNA定位
mRNA定位确保了空间调控的蛋白质生产。可以通过定位元件确保将转录物定位至细 胞的特定区域。在特定实施方案中,设想本文所述的效应蛋白可以用于使定位元件靶向目标 RNA。可以设计效应蛋白以结合靶转录物并使它们穿梭至细胞中由其肽信号标签确定的位 置。更具体来说,例如,与核定位信号(NLS)融合的RNA靶向性效应蛋白可以用于改变RNA 定位。
定位信号的其他示例包括在若干种不对称细胞类型中确保β-肌动蛋白定位到细胞质的 邮政编码结合蛋白(ZBP1)、KDEL保留序列(定位到内质网)、核输出信号(定位到细胞质)、 线粒体靶向信号(定位到线粒体)、过氧化物酶体靶向信号(定位到过氧化物酶体)和m6A标记 /YTHDF2(定位到p体)。设想的其他方法是使RNA靶向性效应蛋白与已知定位(例如膜、突 触)的蛋白质融合。
替代地,根据本发明的效应蛋白可以例如用于定位依赖性敲低。通过使效应蛋白与适当 的定位信号融合,使效应子靶向特定的细胞隔室。只有位于此隔室中的靶RNA才会被有效 地靶向,而在其他方面相同但位于不同的细胞隔室中的靶标不会被靶向,从而可以建立定位 依赖性敲低。
f)翻译
本文所述的RNA靶向性效应蛋白可以用于增强或抑制翻译。设想上调翻译是一种非常 稳健的控制细胞回路的方式。此外,对于功能研究,蛋白质翻译筛检可能优于转录上调筛检, 后者的缺点是转录物上调不会转化为蛋白质产量增加。
设想本文所述的RNA靶向性效应蛋白可以用于将诸如EIF4G等翻译起始因子带到目标 信使RNA的5'非翻译重复序列(5'UTR)附近以驱动翻译(关于不可重编程的RNA结合蛋白, 如De Gregorio等,EMBO J.1999;18(17):4865-74所述)。作为另一示例性GLD2,细胞质多聚 (A)聚合酶可以通过RNA靶向性效应蛋白而被征募至靶mRNA。这将允许靶mRNA的定向多聚腺苷酸化,从而刺激翻译。
类似地,本文设想的RNA靶向性效应蛋白可以用于阻断mRNA的翻译阻遏子,诸如ZBP1(Huttelmaier S等,Nature.2005;438:512-5)。通过与靶RNA的翻译起始位点结合,可以 直接影响翻译。
此外,RNA靶向性效应蛋白与稳定mRNA的蛋白质融合,例如通过防止其降解,诸如RNA酶抑制剂,有可能增加目标转录物的蛋白质产量。
设想本文所述的RNA靶向性效应蛋白可以用于通过结合在RNA转录物的5'UTR区中并阻止核糖体形成和开始翻译来抑制翻译。
此外,RNA靶向性效应蛋白可以用于将CCR4-NOT去腺苷酶复合物的组分Caf1征募至靶mRNA,导致去腺苷酸化或靶转录物和抑制蛋白质翻译。
举例来说,本发明的RNA靶向性效应蛋白可用于增加或减少治疗相关蛋白的翻译。其 中RNA靶向性效应蛋白可用于下调或上调翻译的治疗应用的示例是用于肌萎缩侧索硬化症 (ALS)和心血管病症。已报告ALS运动皮层和脊髓中降低的胶质谷氨酸转运蛋白EAAT2水 平,以及ALS脑组织中的多个异常EAAT2 mRNA转录物。认为EAAT2蛋白和功能丧失是 ALS兴奋性毒性的主要原因。恢复EAAT2蛋白水平和功能可能提供治疗益处。因此,RNA 靶向性效应蛋白可以有益地用于上调EAAT2蛋白表达,例如通过如上所述阻断翻译阻遏子 或稳定mRNA。载脂蛋白A1是高密度脂蛋白(HDL)的主要蛋白质组分,而ApoA1和HDL 通常被视为抗动脉粥样硬化。设想RNA靶向性效应蛋白可以有益地用于上调ApoA1表达, 例如通过如上所述阻断翻译阻遏子或稳定mRNA。
g)mRNA转换
翻译与mRNA转换密切相关并调控mRNA稳定性。已经描述了涉及转录物稳定性的特定蛋白质(诸如神经元中的ELAV/Hu蛋白,Keene JD,1999,Proc Natl Acad Sci U S A.96:5-7) 和三重四脯氨酸(TTP)。这些蛋白质通过保护信息免于在细胞质中降解来稳定靶mRNA(Peng SS等,1988,EMBO J.17:3461-70)。
可以设想,本发明的RNA靶向性效应蛋白可以用于干扰或促进用于稳定mRNA转录物 的蛋白质的活性,从而影响mRNA转换。举例来说,使用RNA靶向性效应蛋白将人TTP 征募至靶RNA将允许富腺苷酸-尿苷酸元件(富AU元件)介导的翻译抑制和靶标降解。在编 码原癌基因、核转录因子和细胞因子并促进RNA稳定性的许多mRNA的3'UTR中发现了 富AU元件。作为另一个实施例,所述RNA靶向性效应蛋白可以与另一种mRNA稳定蛋白 HuR融合(HinmanMN和Lou H,Cell Mol Life Sci 2008;65:3168-81),并将它征募至靶转录物 以延长其寿命或稳定短寿命mRNA。
还设想了本文所述的RNA靶向性效应蛋白可以用于促进靶转录物降解。举例来说,可 以将m6A甲基转移酶征募至靶转录物以便将所述转录物定位至P体,从而导致靶标降解。
作为又一个示例,如本文所述的RNA靶向性效应蛋白可以融合至非特异性内切核酸酶 结构域PilT N末端(PIN),以便将它征募至靶转录物并允许其降解。
患有副肿瘤性神经系统病症(PND)相关脑脊髓炎和神经病变的患者是在中枢神经系统 外的肿瘤中产生针对Hu蛋白的自身抗体(Szabo A等,1991,Cell.;67:325-33,所述自身抗体然 后越过血脑屏障的患者。可以设想本发明的RNA靶向性效应蛋白可以用于干扰自身抗体与 mRNA转录物结合。
由肌强直性肌营养不良蛋白激酶(DMPK)基因的3'UTR中的(CUG)n扩增引起的1型营 养不良(DM1)患者的特征是此类转录物在细胞核中积累。设想与靶向(CUG)n重复序列的内 切核酸酶融合的本发明的RNA靶向性效应蛋白可以抑制这种异常转录物积累。
h)与多功能蛋白质的相互作用
一些RNA结合蛋白与众多RNA上的多个位点结合,以在不同的过程中发挥功能。举例来说,已经发现hnRNP A1蛋白结合外显子剪接沉默序列,拮抗剪接因子,与端粒末端缔合(从而刺激端粒活性)并结合miRNA以促进Drosha介导的加工,从而影响成熟。设想本发明的RNA结合效应蛋白可以干扰RNA结合蛋白在一个或多个位置的结合。
i)RNA折叠
RNA采用确定的结构来执行其生物活性。替代三级结构间的构象转变对大部分RNA介 导的过程至关重要。然而,RNA折叠可能与若干个问题相关。举例来说,RNA可能倾向于折叠成并保持呈不正确替代构象中,和/或正确三级结构在热力学上可能不足以胜过替代结 构。本发明的RNA靶向性效应蛋白,特别是切割缺陷型或死RNA靶向蛋白,可以用于指 导(m)RNA的折叠和/或捕获其正确三级结构。
调节细胞状态
在某些实施方案中,CRISPR-Cas与crRNA的复合物在与靶RNA结合时被激活并随后切割任何附近ssRNA靶标(即,“旁系”或“旁观者”效应)。CRISPR-Cas一旦被同源靶标引发便可以切割其他(非互补)RNA分子。这种混杂RNA切割可能会导致细胞毒性,或以其他方 式影响细胞生理学或细胞状态。
因此,在某些实施方案中,如本文所述的非天然存在或工程改造的组合物、载体系统或 递送系统用于或为了用于诱导细胞休眠。在某些实施方案中,如本文所述的非天然存在或工 程改造的组合物、载体系统或递送系统用于或为了用于诱导细胞周期停滞。在某些实施方案 中,如本文所述的非天然存在或工程改造的组合物、载体系统或递送系统用于或为了用于降 低细胞生长和/或细胞增殖。在某些实施方案中,如本文所述的非天然存在或工程改造的组 合物、载体系统或递送系统用于或为了用于诱导无反应性。在某些实施方案中,如本文所述 的非天然存在或工程改造的组合物、载体系统或递送系统用于或为了用于诱导细胞凋亡。在 某些实施方案中,如本文所述的非天然存在或工程改造的组合物、载体系统或递送系统用于 或为了用于诱导细胞坏死。在某些实施方案中,如本文所述的非天然存在或工程改造的组合 物、载体系统或递送系统用于或为了用于诱导细胞死亡。在某些实施方案中,如本文所述的 非天然存在或工程改造的组合物、载体系统或递送系统用于或为了用于诱导程序性细胞死 亡。
在某些实施方案中,本发明涉及一种用于诱导细胞休眠的方法,包括引入或诱导如本文 所述的非天然存在或工程改造的组合物、载体系统或递送系统。在某些实施方案中,本发明 涉及一种用于诱导细胞周期停滞的方法,包括引入或诱导如本文所述的非天然存在或工程改 造的组合物、载体系统或递送系统。在某些实施方案中,本发明涉及一种用于降低细胞生长 和/或细胞增殖的方法,包括引入或诱导如本文所述的非天然存在或工程改造的组合物、载 体系统或递送系统。在某些实施方案中,本发明涉及一种用于诱导细胞无反应性的方法,包 括引入或诱导如本文所述的非天然存在或工程改造的组合物、载体系统或递送系统。在某些 实施方案中,本发明涉及一种用于诱导细胞凋亡的方法,包括引入或诱导如本文所述的非天 然存在或工程改造的组合物、载体系统或递送系统。在某些实施方案中,本发明涉及一种用 于诱导细胞坏死的方法,包括引入或诱导如本文所述的非天然存在或工程改造的组合物、载 体系统或递送系统。在某些实施方案中,本发明涉及一种用于诱导细胞死亡的方法,包括引 入或诱导如本文所述的非天然存在或工程改造的组合物、载体系统或递送系统。在某些实施 方案中,本发明涉及一种用于诱导程序性细胞死亡的方法,包括引入或诱导如本文所述的非 天然存在或工程改造的组合物、载体系统或递送系统。
如本文所述的方法和用途可以是治疗性或预防性的,并且可以靶向特定细胞、细胞(亚) 群或细胞/组织类型。具体来说,如本文所述的方法和用途可以是治疗性或预防性的,并且 可以靶向表达一个或多个靶序列,诸如一个或多个特定靶RNA(例如ss RNA)的特定细胞、 细胞(亚)群或细胞/组织类型。非限制性地,靶细胞可以例如是表达特定转录物的癌细胞,例 如指定类别的神经元、导致例如自身免疫的(免疫)细胞、或被特定(例如病毒)病原体感染的 细胞等。
因此,在某些实施方案中,本发明涉及一种治疗以存在不合需要的细胞(宿主细胞)为特 征的病理学疾患的方法,包括引入或诱导如本文所述的非天然存在或工程改造的组合物、载 体系统或递送系统。在某些实施方案中,本发明涉及如本文所述的非天然存在或工程改造的 组合物、载体系统或递送系统用于治疗以存在不合需要的细胞(宿主细胞)为特征的病理学疾 患的用途。在某些实施方案中,本发明涉及用于治疗以存在不合需要的细胞(宿主细胞)为特 征的病理学疾患的如本文所述的非天然存在或工程改造的组合物、载体系统或递送系统。应 当理解,优选地,所述CRISPR-Cas系统靶向对不合需要的细胞特异的靶标。在某些实施方 案中,本发明涉及如本文所述的非天然存在或工程改造的组合物、载体系统或递送系统用于 治疗、预防或减轻癌症的用途。在某些实施方案中,本发明涉及用于治疗、预防或减轻癌症 的如本文所述的非天然存在或工程改造的组合物、载体系统或递送系统。在某些实施方案中, 本发明涉及一种治疗、预防或减轻癌症的方法,包括引入或诱导如本文所述的非天然存在或 工程改造的组合物、载体系统或递送系统。应当理解,优选地,所述CRISPR-Cas系统靶向 对癌细胞特异的靶标。在某些实施方案中,本发明涉及如本文所述的非天然存在或工程改造 的组合物、载体系统或递送系统用于治疗、预防或减轻病原体对细胞的感染的用途。在某些 实施方案中,本发明涉及用于治疗、预防或减轻病原体对细胞的感染的如本文所述的非天然 存在或工程改造的组合物、载体系统或递送系统。在某些实施方案中,本发明涉及一种治疗、 预防或减轻病原体对细胞的感染的方法,包括引入或诱导如本文所述的非天然存在或工程改 造的组合物、载体系统或递送系统。应当理解,优选地,CRISPR-Cas系统靶向对病原体感 染的细胞特异的靶标(例如,病原体衍生的靶标)。在某些实施方案中,本发明涉及如本文所 述的非天然存在或工程改造的组合物、载体系统或递送系统用于治疗、预防或减轻自体免疫 病症的用途。在某些实施方案中,本发明涉及用于治疗、预防或减轻自体免疫病症的如本文 所述的非天然存在或工程改造的组合物、载体系统或递送系统。在某些实施方案中,本发明 涉及一种治疗、预防或减轻自体免疫病症的方法,包括引入或诱导如本文所述的非天然存在 或工程改造的组合物、载体系统或递送系统。应当理解,优选地,所述CRISPR-Cas系统靶 向对负责自身免疫病症的细胞(例如特定的免疫细胞)特异的靶标。
RNA检测
还设想了RNA靶向性效应蛋白可用于北方印迹测定(Northern blot assay)。北方印迹涉 及使用电泳按大小分离RNA样品。RNA靶向性效应蛋白可用于特异性结合和检测靶RNA 序列。
RNA靶向性效应蛋白可以与荧光蛋白(诸如GFP)融合,并用于跟踪活细胞中的RNA定 位。更具体来说,RNA靶向性效应蛋白可能失活,因为它不再切割RNA。在特定实施方案中,设想可以使用分裂型RNA靶向性效应蛋白,由此,信号依赖于两种亚蛋白的结合,以 便确保更精确的观察。替代地,可以使用在多个RNA靶向性效应蛋白复合物与靶转录物结 合时得以复原的分裂型荧光蛋白。还设想了沿着mRNA在多个结合位点靶向转录物,因此 荧光信号可以放大真实信号并允许病灶鉴定。作为另一个替代方案,荧光蛋白可以复原形成 分裂型内含肽。
RNA靶向性效应蛋白例如适用于确定RNA或特定剪接变体的定位、mRNA转录物的水平、转录物的上调或下调以及疾病特异性诊断。RNA靶向性效应蛋白可用于观察(活)细胞中的RNA,使用例如荧光显微镜或流式细胞术,诸如荧光激活细胞分选术(FACS),它允许 对细胞进行高通量筛检以及在细胞分选后回收活细胞。此外,可以在应激下同时评价不同转录物的表达水平,例如对细胞使用分子抑制剂或缺氧条件抑制癌症生长。另一个应用将是在 神经刺激期间使用两个光子显微镜跟踪转录物到突触连接的定位。
在某些实施方案中,如本文所述的根据本发明的组分或复合物可用于多路抗错荧光原位 杂交(MERFISH;Chen等,Science;2015;348(6233)),诸如用(荧光)标记的CRISPR-Cas效应 子。
体外顶点标记
细胞过程依赖于蛋白质、RNA和DNA间的分子相互作用网络。精确检测蛋白质-DNA和蛋白质-RNA相互作用是理解这些过程的关键。体外接近标记技术采用亲和标签与例如可光激活探针组合在体外标记目标蛋白质或RNA附近的多肽和RNA。在紫外线照射之后,可 光激活基团与非常接近标签化分子的蛋白质和其他分子反应,从而标记它们。随后可以回收并鉴定标记的相互作用分子。本发明的RNA靶向性效应蛋白可以例如用于使探针靶向所选RNA序列。
这些应用还可以应用于动物模型中,以用于疾病相关应用或难培养细胞类型的体内成 像。
RNA折纸/体外组装线—组合学
RNA折纸是指使用RNA作为整合模板来创建二维或三维结构的纳米规模折叠结构。在 RNA中编码折叠结构,因此所得RNA的形状由合成的RNA序列决定(Geary等,2014.Science, 345(6198).第799-804页)。RNA折纸可以作为将其他组分(诸如蛋白质)排列成复合物的支 架。本发明的RNA靶向性效应蛋白可以例如用于使用合适的向导RNA使目标蛋白质靶向 RNA折纸。
这些应用还可以应用于动物模型中,以用于疾病相关应用或难培养细胞类型的体内成 像。
RNA分离或纯化、增浓或消耗
还设想当与RNA复合时,RNA靶向性效应蛋白可用于分离和/或纯化RNA。RNA靶向性效应蛋白可以例如与可用于分离和/或纯化RNA-RNA靶向性效应蛋白复合物的亲和标签融合。此类应用例如可用于分析细胞中的基因表达谱。
在特定实施方案中,可以设想RNA靶向性效应蛋白可以用于靶向特定的非编码RNA(ncRNA),从而阻断其活性,提供有用的功能性探针。在某些实施方案中,如本文所述的效应蛋白可用于特异性富集特定RNA(包括但不限于增加稳定性等),或替代地用于特异性消耗特定RNA(诸如但不限于例如特定剪接变体、同种型等)。
查询lincRNA功能和其他核RNA
当前的RNA敲低策略(诸如siRNA)的缺点是它们大多受限于靶向细胞溶质转录物,因 为蛋白质机制是细胞溶质的。本发明的RNA靶向性效应蛋白作为对细胞功能不必需的外源 系统的优点在于它可以用于细胞中的任何隔室。通过使NLS信号与RNA靶向性效应蛋白融 合,可以将它引导到细胞核,从而允许靶向核RNA。例如,设想探测lincRNA的功能。长 基因间非编码RNA(lincRNA)是尚未充分探索的研究领域。大部分lincRNA具有迄今未知的 功能,可以使用本发明的RNA靶向性效应蛋白加以研究。
鉴定RNA结合蛋白
鉴定与特定RNA结合的蛋白质可用于理解许多RNA的作用。举例来说,许多lincRNA与转录和表观基因调控子缔合以控制转录。了解哪些蛋白质与指定lincRNA结合可能有助于阐明指定调控途径中的组分。可以设计本发明的RNA靶向性效应蛋白以便将生物素连接酶征募至特定转录物,以便用生物素标记局部结合的蛋白质。然后可以将蛋白质拉下并通过 质谱分析以鉴定它们。
复合物组装在RNA上和底物穿梭
本发明的RNA靶向性效应蛋白还可以用于将复合物组装在RNA上。这可以通过用多种相关蛋白(例如特定合成途径的组分)对RNA靶向性效应蛋白进行功能化来实现。替代地,多个RNA靶向性效应蛋白可以用此类不同的相关蛋白功能化并靶向相同或相邻的靶RNA。复合物组装在RNA上的有用应用是例如促进蛋白质之间的底物穿梭。
合成生物学
生物系统的开发具有广泛的用途,包括在临床应用中。设想可以使用本发明的可程序化 RNA靶向性效应蛋白融合以分裂具有毒性结构域的蛋白质以便靶向细胞死亡,例如使用癌 相关RNA作为靶转录物。此外,在合成生物系统中可以用例如融合复合物与适当的效应子, 诸如激酶或其他酶影响涉及蛋白质-蛋白质相互作用的途径。
蛋白质剪接:内含肽
蛋白质剪接是翻译后过程,其中被称为内含肽的插入多肽催化其自身从侧接它的被称为 外显肽的多肽切除,以及随后连接外显肽。如本文所述的两个或更多个RNA靶向性效应子 组装在靶转录物上可用于指导分裂型内含肽释放(Topilina和Mills MobDNA.2014年2月4 日;5(1):5),从而允许直接计算mRNA转录物的存在和蛋白质产物的后续释放,诸如代谢酶 或转录因子(用于转录途径的下游启动)。此应用可能与合成生物学(见上文)或大规模生物生 产(仅在某些条件下产生产物)具有显著相关性。
诱导型、定剂量和自身失活系统
在一个实施方案中,将包含本发明的RNA靶向性效应蛋白和效应组分的融合复合物设 计为诱导型的,例如光诱导型或化学诱导型。这种诱导性允许在所需时刻及时激活效应组分。
光诱导性例如通过设计融合复合物来实现,其中CRY2PHR/CIBN配对用于融合。此系 统对于光诱导活细胞中的蛋白质相互作用特别有用(Konermann S等,Nature. 2013;500:472-476)。
化学诱导性例如通过设计融合复合物来提供,其中FKBP/FRB(FK506结合蛋白/FKBP 雷帕霉素结合)配对用于融合。使用此系统时,需要雷帕霉素来结合蛋白质(Zetsche等,Nat Biotechnol.2015;33(2):139-42描述了此系统用于Cas9的用途)。
此外,当作为DNA引入细胞时,本发明的RNA靶向性效应蛋白可以通过诱导型启动子加以调节,诸如四环素或强力霉素控制的转录激活(Tet-On和Tet-Off表达系统),激素诱导型基因表达系统,诸如蜕皮激素诱导型基因表达系统和阿拉伯糖诱导型基因表达系统。当 作为RNA递送时,RNA靶向性效应蛋白的表达可以通过能感知如四环素等小分子的核糖开 关加以调节(如Goldfless等,Nucleic Acids Res.2012;40(9):e64所述)。
在一个实施方案中,可以调节本发明的RNA靶向性效应蛋白的递送以改变细胞中蛋白 质或crRNA的量,从而改变期望的效应或任何不期望的脱靶效应的幅度。
在一个实施方案中,可以将本文所述的RNA靶向性效应蛋白设计为自身失活的。当作 为RNA,即mRNA抑或作为复制RNA治疗剂递送至细胞(Wrobleska等,NatBiotechnol.2015 年8月;33(8):839-841)时,它们可以通过破坏自身的RNA来自我失活表达和后续效应,从 而减少驻留和潜在不需要的作用。
对于如本文所述的RNA靶向性效应蛋白的其他体内应用,参考Mackay JP等(NatStruct Mol Biol.2011年3月;18(3):256-61);Nelles等(Bioessays.2015年7月;37(7):732-9);以及Abil Z和Zhao H(Mol Biosyst.2015年10月;11(10):2658-65),所述文献通过引用并入本文。具体 来说,在本发明的某些实施方案中,优选在某些实施方案中通过使用催化失活的CRISPR-Cas 设想了以下应用:增强翻译(例如CRISPR-Cas翻译促进因子融合(例如eIF4融合));抑制翻 译(例如,靶向核糖体结合位点的gRNA);外显子跳跃(例如靶向剪接供体和/或受体位点的 gRNA);外显子包括(例如,靶向欲包括的特定外显子剪接供体和/或受体位点的gRNA或融 合或征募CRISPR-Cas的剪接体组分(例如U1 snRNA));接近RNA定位(例如CRISPR-Cas 标记物融合(例如EGFP融合));改变RNA定位(例如CRISPR-Cas定位信号融合(例如NLS 或NES融合));RNA降解(在这种情况下,如果依赖于CRISPR-Cas的活性,则不使用无催 化活性的CRISPR-Cas,替代地且为了提高特异性,可以使用分裂型CRISPR-Cas);抑制非 编码RNA功能(例如miRNA),诸如通过gRNA降解或gRNA与功能位点结合(有可能通过 CRISPR-Cas信号序列融合通过重新定位在特定位点滴定出来)。
如前文所述和实施例中所示,CRISPR-Cas功能对crRNA的5'或3'延伸和crRNA环的延伸是稳健的。因此,设想可以在不影响复合物形成和与靶转录物结合的情况下将MS2环和其他征募结构域加入crRNA。为了征募各种效应结构域而对crRNA进行的这种修饰适用于上述RNA靶向性效应蛋白的用途。
CRISPR-Cas能够介导对RNA噬菌体的抗性。因此设想了CRISPR-Cas可以用于使例如 动物、人类和植物对纯RNA病原体,包括但不限于埃博拉病毒和寨卡病毒免疫。
在某些实施方案中,CRISPR-Cas可以处理(切割)其自身的阵列。这适用于野生型CRISPR-Cas蛋白和如本文讨论的含有一个或多个突变氨基酸残基的突变CRISPR-Cas蛋白。因此设想针对不同的靶转录物和/或应用设计的多个crRNA可以作为单个前crRNA或作为由一个启动子驱动的单个转录物递送。这种递送方法的优点在于它实质上更紧凑、更容易合成 并且更容易在病毒系统中递送。应当理解,如本领域已知且如本文在别处所述,对于本文 CRISPR-Cas的直系同源物,确切的氨基酸位置可能变化,可以通过蛋白质比对充分确定。 本发明的诸多方面还涵盖本文所述的组合物和系统在基因组工程改造中的方法和用途,例如 用于在体外、体内或离体改变或操纵一个或多个基因或者一种或多种基因产物在原核或真核 细胞中的表达。
在一个方面,本发明提供了用于调节,例如降低靶RNA在细胞中的表达的方法和组合 物。在受试方法中,提供了干扰RNA的转录、稳定性和/或翻译的本发明CRISPR-Cas系统。
在某些实施方案中,有效量的CRISPR-Cas系统用于切割RNA或以其他方式抑制RNA表达。在这方面,所述系统具有类似于siRNA和shRNA的用途,因此也可以替代此类方法。 所述方法包括但不限于使用CRISPR-Cas系统作为例如干扰核糖核酸(诸如siRNA或shRNA) 或其转录模板,例如编码shRNA的DNA的代替物。将CRISPR-Cas系统引入靶细胞,例如 通过施用于包括靶细胞的哺乳动物。
有利地,本发明的CRISPR-Cas系统是特异的。举例来说,尽管干扰核糖核酸(诸如siRNA 或shRNA)多核苷酸系统受到设计和稳定性问题以及脱靶结合困扰,但可以将本发明的 CRISPR-Cas系统设计为具有高特异性。
在本发明的一个方面,本申请的新颖RNA靶向系统,也称为RNA或RNA靶向性CRISPR系统是基于本文鉴定的CRISPR-Cas蛋白,其不需要产生定制蛋白质以靶向特定 RNA序列,而是可以通过RNA分子将单个酶程序化以识别特定RNA靶标,换言之,可以 使用所述RNA分子将所述酶征募至特定RNA靶标。
在一些实施方案中,所述核酸靶向系统的一个或多个元件来源于包含内源CRISPRRNA 靶向系统的特定生物体。在某些实施方案中,所述CRISPR RNA靶向系统见于真杆菌和瘤 胃球菌中。在某些实施方案中,所述效应蛋白包含靶向和旁系ssRNA切割活性。在某些实施方案中,所述效应蛋白包含双HEPN结构域。在某些实施方案中,所述效应蛋白缺乏Cas13a的Helical-1结构域的对应物。在某些实施方案中,所述效应蛋白小于之前表征的2类CRISPR 效应子,中值大小为928aa。此中值大小比Cas13c的中值大小少190aa(17%),比Cas13b 的中值大小少超过200aa(18%),而且比Cas13a的中值大小少超过300aa(26%)。在某些实 施方案中,所述效应蛋白不需要侧翼序列(例如,PFS、PAM)。
在某些实施方案中,所述效应蛋白基因座结构包括含WYL结构域的辅助蛋白(在最初 鉴定的这些结构域组中保守的三个氨基酸之后如此表示;参见例如WYL结构域IPR026881)。 在某些实施方案中,所述WYL结构域辅助蛋白包含至少一个螺旋-转角-螺旋(HTH)或带状- 螺旋-螺旋(RHH)DNA结合结构域。在某些实施方案中,含WYL结构域的辅助蛋白增加了 RNA靶向性效应蛋白的靶向和旁系ssRNA切割活性。在某些实施方案中,含WYL结构域 的辅助蛋白包含N末端RHH结构域,以及主要疏水性保守残基的模式,包括对应于原始WYL基序的不变酪氨酸-亮氨酸双联体。在某些实施方案中,含WYL结构域的辅助蛋白是WYL1。WYL1是主要与瘤胃球菌相关的单WYL结构域蛋白。
在其他示例性实施方案中,VI型RNA靶向性Cas酶是Cas 13d。在某些实施方案中,Cas13d是惰性真杆菌DSM 15702(EsCas13d)或瘤胃球菌属N15.MGS-57(RspCas13d)(参见例如Yan等,Cas13d Is a Compact RNA-Targeting Type VI CRISPR EffectorPositively Modulated by a WYL-Domain-Containing Accessory Protein,MolecularCell(2018), doi.org/10.1016/j.molcel.2018.02.028)。RspCas13d和EsCas13d没有侧翼序列要求(例如PFS、 PAM)。
Cas蛋白在优化功能性RNA靶向系统中的应用
在一个方面,本发明提供了一种用于特异性递送功能性组分至RNA环境的系统。这可 以使用包含本发明的RNA靶向性效应蛋白的CRISPR系统来确保,其允许不同的组分特异性靶向RNA。更具体来说,此类组分包括激活子或阻遏子,诸如RNA翻译、降解等的激活 子或阻遏子。本文在别处描述了此系统的应用。
根据一个方面,本发明提供了包含向导RNA的非天然存在或工程改造的组合物,所述 向导RNA包含能够与细胞中目标基因组基因座中的靶序列杂交的向导序列,其中所述向导 RNA通过插入一个或多个与衔接蛋白结合的不同RNA序列加以修饰。在特定实施方案中,RNA序列可以结合两个或更多个衔接蛋白(例如适体),并且其中各个衔接蛋白与一个或多个 功能域缔合。证明了本文所述的CRISPR-Cas酶的向导RNA顺应于对向导序列的修饰。在特定实施方案中,通过在顺向重复序列的5'、顺向重复序列内或向导序列的3'插入不同的RNA序列来修饰向导RNA。当存在超过一个功能域时,所述功能域可以相同或不同,例如, 两个相同或两个不同的激活子或阻遏子。在一个方面,本发明提供了一种本文讨论的组合物,其中所述一个或多个功能域连接至RNA靶向酶,使得与靶RNA结合后,所述功能域呈允 许所述功能域发挥其属性功能的空间取向;在一个方面,本发明提供了一种本文讨论的组合物,其中所述组合物包含具有至少三个功能域的CRISPR-Cas复合物,其中至少一个与RNA靶向酶缔合并且其中至少两个与gRNA缔合。
因此,在一个方面,本发明提供了非天然存在或工程改造的CRISPR-Cas复合物组合物, 其包含如本文讨论的向导RNA和作为RNA靶向酶的CRISPR-Cas,其中任选地,所述RNA靶向酶包含至少一个突变,使得所述RNA靶向酶具有与不具有所述至少一个突变的酶相比不超过5%的核酸酶活性,并且任选地一个或多个包含至少一个或多个核定位序列。在特定实施方案中,另外地或替代地修饰所述向导RNA,以便仍然确保RNA靶向酶的结合但防止 被RNA靶向酶切割(如本文在别处详述)。
在特定实施方案中,所述RNA靶向酶是与不具有至少一个突变的CRISPR-Cas酶相比, 核酸酶活性降低了至少97%或100%的CRISPR-Cas蛋白。在一个方面,本发明提供了一种 本文讨论的组合物,其中所述CRISPR-Cas酶包含如本文另外讨论的两个或更多个突变。
在特定实施方案中,如上文所述提供了包含两个或更多个功能域的RNA靶向系统。在 特定实施方案中,所述两个或更多个功能域是异源功能域。在特定实施方案中,所述系统包 含衔接蛋白,所述衔接蛋白是包含功能域的融合蛋白,所述融合蛋白任选地包含在所述衔接 蛋白和所述功能域之间的接头。在特定实施方案中,所述接头包括GlySer接头。另外地或 替代地,一个或多个功能域通过接头,任选地GlySer接头连接至RNA效应蛋白。在特定实 施方案中,一个或多个功能域通过一个或两个HEPN结构域连接至RNA靶向酶。
在一个方面,本发明提供了一种本文讨论的组合物,其中与衔接蛋白或RNA靶向酶相 关的一个或多个功能域是能够激活或抑制RNA翻译的结构域。在一个方面,本发明提供了 一种本文讨论的组合物,其中与衔接蛋白相关的一个或多个功能域中的至少一个具有一种或 多种活性,包括甲基化酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因 子活性、组蛋白修饰活性、DNA整合活性RNA切割活性、DNA切割活性或核酸结合活性、 或分子开关活性或化学诱导性或光诱导性。
在一个方面,本发明提供了一种本文讨论的组合物,所述组合物包含适体序列。在特定 实施方案中,所述适体序列是对相同衔接蛋白特异的两个或更多个适体序列。在一个方面, 本发明提供了一种本文讨论的组合物,其中所述适体序列是对不同衔接蛋白特异的两个或更 多个适体序列。在一个方面,本发明提供了一种本文讨论的组合物,其中所述衔接蛋白包含 MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、
Figure BDA0003651481360004101
7s、 PRR1。因此,在特定实施方案中,所述适体选自特异性结合以上列出的任一种衔接蛋白的 结合蛋白。在一个方面,本发明提供了一种本文讨论的组合物,其中所述细胞是真核细胞。 在一个方面,本发明提供了一种本文讨论的组合物,其中所述真核细胞是哺乳动物细胞、植 物细胞或酵母细胞,其中所述哺乳动物细胞任选地是小鼠细胞。在一个方面,本发明提供了 一种本文讨论的组合物,其中所述哺乳动物细胞是人细胞。
在一个方面,本发明提供了一种上文讨论的组合物,其中存在超过一个向导RNA或gRNA或crRNA,并且这些靶向不同的序列,由此当采用所述组合物时,存在多路。在一个 方面,本发明提供了一种组合物,其中有超过一个向导RNA或gRNA或crRNA通过插入 结合一个或多个衔接蛋白的不同RNA序列而被修饰。
在一个方面,本发明提供了一种本文讨论的组合物,其中存在与一个或多个功能域缔合 并且与插入向导RNA中的不同RNA序列结合的一个或多个衔接蛋白。
在一个方面,本发明提供了一种本文讨论的组合物,其中所述向导RNA经修饰以具有 至少一个非编码功能环;例如,其中所述至少一个非编码功能环是抑制性的;例如,其中至 少一个非编码功能环包括Alu。
在一个方面,本发明提供了一种用于修饰基因表达的方法,包括向宿主施用或在宿主体 内表达一种或多种本文讨论的组合物。
在一个方面,本发明提供了一种本文讨论的方法,包括递送所述组合物或编码其的核酸 分子,其中所述核酸分子可操作地连接至调控序列并且在体内表达。在一个方面,本发明提 供了一种本文讨论的方法,其中所述体内表达是通过慢病毒、腺病毒或AAV。
在一个方面,本发明提供了一种如本文讨论的哺乳动物细胞系,其中所述细胞系任选地 是人细胞系或小鼠细胞系。在一个方面,本发明提供了一种转基因哺乳动物模型,任选地为 小鼠,其中所述模型已经用本文讨论的组合物转化或者是所述转化体的后代。
在一个方面,本发明提供了一种编码如本文讨论的向导RNA或RNA靶向性 CRISPR-Cas复合物或组合物的核酸分子。在一个方面,本发明提供了一种载体,其包含: 编码包含能够与细胞中的RNA靶序列杂交的向导序列的向导RNA(gRNA)或crRNA的核酸 分子,其中所述gRNA或crRNA的顺向重复序列通过插入与两个或更多个衔接蛋白结合的 不同RNA序列而被修饰,并且其中各个衔接蛋白与一个或多个功能域缔合;或者,其中所 述gRNA经修饰而具有至少一个非编码功能环。在一个方面,本发明提供了包含核酸分子 的载体,所述核酸分子编码:非天然存在或工程改造的CRISPR-Cas复合物组合物,其包含 本文讨论的gRNA或crRNA,以及RNA靶向酶,其中任选地所述RNA靶向酶包含至少一 个突变,使得所述RNA靶向酶具有与不具有所述至少一个突变的RNA靶向酶相比不超过 5%的核酸酶活性,并且任选地一个或多个包含至少一个或多个核定位序列。在一个方面, 载体还可以包含真核细胞中可操作的调控元件,所述调控元件可操作地连接至编码所述向导 RNA(gRNA)或crRNA的核酸分子和/或编码所述RNA靶向酶的核酸分子和/或所述可选核 定位序列。
在一个方面,本发明提供了一种药盒,其包含一种或多种本文所述的组分。在一些实施 方案中,所述药盒包含如本文所述的载体系统和使用所述药盒的说明书。
在一个方面,本发明提供了一种筛检功能获得(GOF)或功能丧失(LOF)或者筛检非编码 RNA或潜在调控区(例如增强子、阻遏子)的方法,包括如本文讨论的细胞系或本文讨论的模 型的细胞含有或表达RNA靶向酶并将如本文讨论的组合物引入所述细胞系或模型的细胞 中,其中所述gRNA或crRNA包括激活子或阻遏子,以及对于引入的gRNA或crRNA包括激活子的那些细胞或者对于引入的gRNA或crRNA包括阻遏子的那些细胞,分别监测GOF 或LOF。
在一个方面,本发明提供了一种非天然存在或工程改造的组合物的文库,每一种组合物 包含包括能够与细胞中目标靶RNA序列杂交的向导序列的RNA靶向性CRISPR向导RNA (gRNA)或crRNA、RNA靶向酶,其中所述RNA靶向酶包含至少一个突变,使得所述RNA 靶向酶具有与不具有所述至少一个突变的RNA靶向酶相比不超过5%的核酸酶活性,其中 所述gRNA或crRNA通过插入与一个或多个衔接蛋白结合的不同RNA序列而被修饰,并 且其中所述衔接蛋白与一个或多个功能域缔合,其中所述组合物包含一个或多个或者两个或 更多个衔接蛋白,其中每一个蛋白与一个或多个功能域缔合,并且其中所述gRNA或crRNA 包含全基因组文库,所述全基因组文库包含多个RNA靶向性向导RNA(gRNA)或crRNA。 在一个方面,本发明提供了一种如本文讨论的文库,其中所述RNA靶向性RNA靶向酶与 不具有所述至少一个突变的RNA靶向酶相比具有降低至少97%或100%的核酸酶活性。在 一个方面,本发明提供了一种本文讨论的文库,其中所述衔接蛋白是包含功能域的融合蛋白。 在一个方面,本发明提供了一种如本文讨论的文库,其中所述gRNA或crRNA不通过插入 结合一个或两个或更多个衔接蛋白的不同RNA序列而被修饰。在一个方面,本发明提供了 一种如本文讨论的文库,其中所述一个或两个或更多个功能域与所述RNA靶向酶缔合。在 一个方面,本发明提供了一种如本文讨论的文库,其中细胞的细胞群是真核细胞群。在一个 方面,本发明提供了一种如本文讨论的文库,其中所述真核细胞是哺乳动物细胞、植物细胞 或酵母细胞。在一个方面,本发明提供了一种本文讨论的文库,其中所述哺乳动物细胞是人 细胞。在一个方面,本发明提供了一种如本文讨论的文库,其中所述细胞群是胚胎干(ES) 细胞群。
在一个方面,本发明提供了一种如本文讨论的文库,其中所述靶向属于约100个或更多 个RNA序列。在一个方面,本发明提供了一种如本文讨论的文库,其中所述靶向属于约1000 个或更多个RNA序列。在一个方面,本发明提供了一种如本文讨论的文库,其中所述靶向 属于约20,000个或更多个RNA序列。在一个方面,本发明提供了一种如本文讨论的文库,其中所述靶向属于整个转录组。在一个方面,本发明提供了一种如本文讨论的文库,其中所述靶向属于聚焦于相关或期望途径的一组靶序列。在一个方面,本发明提供了一种如本文讨 论的文库,其中所述途径是免疫途径。在一个方面,本发明提供了一种如本文讨论的文库, 其中所述途径是细胞分裂途径。
在一个方面,本发明提供了一种产生模型真核细胞的方法,所述模型真核细胞包含具有 修饰表达的基因。在一些实施方案中,疾病基因是与患有或发展疾病的风险增加相关的任何 基因。在一些实施方案中,所述方法包括(a)将一个或多个编码上文所述系统的组分的载体 引入真核细胞中,和(b)允许CRISPR复合物结合靶多核苷酸以修饰基因的表达,从而产生 包含修饰基因表达的模型真核细胞。
本文提供的结构信息允许查询向导RNA或crRNA与靶RNA和RNA靶向酶的相互作用,从而允许工程改造或改变向导RNA结构以优化整个RNA靶向性CRISPR-Cas系统的功 能。举例来说,所述向导RNA或crRNA可以延伸,而不会因插入可以与RNA结合的衔接 蛋白而与RNA靶向蛋白碰撞。这些衔接蛋白还可以征募包含一个或多个功能域的效应蛋白 或融合物。
本发明的一个方面是上述元素包含在单一组合物中或包含在个别组合物中。这些组合物 可以有利地应用于宿主以在基因组水平上引发功能影响。
技术人员应当了解允许衔接子+功能域结合而不允许衔接子+功能域正确定位(例如,由 于CRISPR-Cas复合物的三维结构内的空间位阻)的向导RNA或crRNA修饰是非预期的修 饰。一个或多个修饰的向导RNA或crRNA可以通过在顺向重复序列的5'、顺向重复序列内或向导序列的3'引入不同的RNA序列加以修饰。
修饰的向导RNA或crRNA、失活的RNA靶向酶(有或没有功能域)和具有一个或多个功 能域的结合蛋白可以各自单独地包含在组合物中并且单独地或共同地施用于宿主。替代地, 这些组分可以提供在单个组合物中以便施用于宿主。可以通过技术人员已知的或本文所述的 用于向宿主递送的病毒载体(例如慢病毒载体、腺病毒载体、AAV载体)向宿主进行施用。 如本文所解释,使用不同的选择标记物(例如用于慢病毒gRNA或crRNA选择)和gRNA或 crRNA浓度(例如取决于是否使用多个gRNA或crRNA)可能有利于引发改善的效果。
使用所提供的组合物,本领域技术人员可以有利地且特异性地靶向具有相同或不同功能 域的单个或多个基因座以引发一个或多个基因组事件。所述组合物可以应用于在细胞文库中 筛检和在体内功能建模的多种方法中(例如lincRNA的基因激活和功能鉴定;功能获得建模; 功能丧失建模;使用本发明组合物建立细胞系和转基因动物以用于优化和筛检目的)。
本发明包括使用本发明的组合物建立和利用条件性或诱导型CRISPR-Cas RNA靶向事 件。(参见例如Platt等,Cell(2014),dx.doi.org/10.1016/j.cell.2014.09.014,或本文引用的PCT 专利公开,诸如WO 2014/093622(PCT/US2013/074667),不认为它们在本发明或本申请之 前)。
在植物和真菌中的应用
本文所述的组合物、系统和方法可以用于在植物和真菌中进行基因或基因组查询或编辑 或操作。举例来说,所述应用包括植物基因或基因组的调查和/或选择和/或查询和/或比较和 /或操作和/或转化;例如,创建、鉴定、开发、优化或赋予植物性状或特征,或者转化植物 或真菌基因组。因此可以提高植物、具有新性状或特征组合的新植物或具有增强的性状的新 植物的产量。就植物而言,所述组合物、系统和方法可以用于定点整合(SDI)或基因编辑(GE) 或任何近反向育种(NRB)或反向育种(RB)技术。
本文的组合物、系统和方法可以用于对基本上任何植物和真菌以及它们的细胞和组织赋 予所需特质(例如,增强营养品质、增强疾病抗性以及对生物和非生物应激的抗性,以及增 加具有商业价值的植物产品或异源化合物的产量)。所述组合物、系统和方法可用于修饰内 源基因或修饰它们的表达,而无需将任何外来基因永久引入基因组。
在一些实施方案中,组合物、系统和方法可用于植物中的基因组编辑或以前已经使用过 RNAi或类似基因组编辑技术的情形;参见例如Nekrasov,“Plant genome editingmade easy: targeted mutagenesis in model and crop plants using the CRISPR-Cassystem,”Plant Methods 2013,9:39(doi:10.1186/1746-4811-9-39);Brooks,“Efficientgene editing in tomato in the first generation using the CRISPR-Cas9 system,”Plant Physiology 2014年9月第114页.247577; Shan,“Targeted genome modificationof crop plants using a CRISPR-Cas system,”Nature Biotechnology 31,686-688(2013);Feng,“Efficient genome editing in plants using a CRISPR/Cas system,”Cell Research(2013)23:1229-1232.doi:10.1038/cr.2013.114;2013年8月20日在线发表;Xie,“RNA-guided genome editing in plants using a CRISPR-Cas system,”MolPlant.2013 年11月;6(6):1975-83.doi:10.1093/mp/sst119.2013年8月17日电子发表;Xu,“Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cassystem in rice,”Rice 2014,7:5 (2014);Zhou等,“Exploiting SNPs for biallelicCRISPR mutations in the outcrossing woody perennial Populus reveals 4-coumarate:CoA ligase specificity and Redundancy,”New Phytologist (2015)(Forum)1-4(可在www.newphytologist.com在线获取);Caliando等,“Targeted DNAdegradation using a CRISPR device stably carried in the host genome,NATURECOMMUNICATIONS 6:6989,DOI:10.1038/ncomms7989, www.nature.com/naturecommunications DOI:10.1038/ncomms7989;美国专利号6,603,061-Agrobacterium-Mediated Plant Transformation Method;美国专利号7,868,149-PlantGenome Sequences and Uses Thereof和US 2009/0100536-Transgenic Plants withEnhanced Agronomic Traits;Morrell等,“Crop genomics:advances andapplications,”Nat Rev Genet.2011年12月29 日;13(2):85-96,各文献的所有内容和公开内容都通过引用整体并入本文。利用所述组合物、 系统和方法的诸多方面可以类似于在植物中使用CRISPR-Cas系统,并且提到了亚利桑那大 学网站“CRISPR-PLANT”(www.genome.arizona.edu/crispr/)(由宾夕法尼亚州和AGI支持)。
所述组合物、系统和方法还可以用于原生质体。“原生质体”是指已经使用例如机械或酶 促手段完全或部分去除其保护性细胞壁,从而产生活植物的完整生物化学胜任单元的植物细 胞,所述完整生物化学胜任单元可以重新形成其细胞壁、繁殖并再生,在适当的生长条件下 生长成完整植物的。
所述组合物、系统和方法可用于筛检目标基因(例如,内源、突变)。在一些实施例中, 目标基因包括编码参与产生具有附加营养价值的组分的酶的那些,或通常影响跨越物种、门 和植物界的目标农艺性状的基因。通过选择性地靶向例如编码代谢途径的酶的基因,可以鉴 定负责植物的某些营养方面的基因。类似地,通过选择性地靶向可能影响所需农艺性状的基 因,可以鉴定相关基因。因此,本发明涵盖针对编码具有特定营养价值和/或农艺性状的化 合物的生产所涉及的酶的基因的筛检方法。
还应当理解,除非另外显而易知,否则本文提到的动物细胞还可能原则上适用于植物或 真菌细胞;并且,本文中具有降低的脱靶效应的酶和采用此类酶的系统可以用于植物应用, 包括本文提到的那些。
在一些情况下,引入植物和真菌的核酸可以针对在植物和真菌中的表达进行密码子优 化。密码子优化的方法包括Kwon KC等,Codon Optimization to EnhanceExpression Yields Insights into Chloroplast Translation,Plant Physiol.2016年9月;172(1):62-77所述的方法。
所述组合物和系统中的组分(例如Cas蛋白)还可以包含本文所述的一个或多个功能域。 在一些实施例中,功能域可以是外切核酸酶。此类核酸外切酶可以增加Cas蛋白功能的效率, 例如诱变效率。功能域的一个示例是Trex2,如Weiss T等, www.biorxiv.org/content/10.1101/2020.04.11.037572v1,doi:doi.org/10.1101/2020.04.11.037572 所述。
植物的示例
本文的组合物、系统和方法可以用于对基本上任何植物赋予所需的性状。可以针对所需 生理和农艺特性对多种植物和植物细胞系统进行工程改造。一般来说,术语“植物”涉及植物 界的任何不同的光合、真核、单细胞或多细胞生物体,其特征在于通过细胞分裂生长,含有 叶绿体,以及具有由纤维素构成的细胞壁。术语植物涵盖单子叶植物和双子叶植物。
所述组合物、系统和方法可以用于多种植物,诸如属于以下各目的双子叶植物:木兰目 (Magniolales)、八角目(Illiciales)、月桂目(Laurales)、胡椒目(Piperales)、马兜铃目 (Aristochiales)、睡莲目(Nymphaeales)、毛茛目(Ranunculales)、罂粟目(Papeverales)、瓶子草 目(Sarraceniaceae)、昆栏树目(Trochodendrales)、金缕梅目(Hamamelidales)、杜仲目 (Eucomiales)、塞子木目(Leitneriales)、杨梅目(Myricales)、山毛榉目(Fagales)、木麻黄目 (Casuarinales)、石竹目(Caryophyllales)、肉穗果目(Batales)、蓼目(Polygonales)、蓝雪目 (Plumbaginales)、第伦桃目(Dilleniales)、山茶目(Theales)、锦葵目(Malvales)、荨麻目 (Urticales)、玉蕊目(Lecythidales)、紫堇目(Violales)、杨柳目(Salicales)、白花菜目(Capparales)、 杜鹃花目(Ericales)、岩梅目(Diapensales)、柿目(Ebenales)、报春花目(Primulales)、蔷薇目 (Rosales)、豆目(Fabales)、川草目(Podostemales)、小二仙草目(Haloragales)、桃金娘目 (Myrtales)、山茱萸目(Cornales)、山龙眼目(Proteales)、檀香目(Santales)、大花草目(Rafflesiales)、卫矛目(Celastrales)、大戟目(Euphorbiales)、鼠李目(Rhamnales)、无患子目 (Sapindales)、胡桃目(Juglandales)、牦牛儿苗目(Geraniales)、远志目(Polygalales)、伞形目 (Umbellales)、龙胆目(Gentianales)、花葱目(Polemoniales)、唇形目(Lamiales)、车前草目 (Plantaginales)、玄参目(Scrophulariales)、桔梗目(Campanulales)、茜草目(Rubiales)、川绿断 目(Dipsacales)和菊目(Asterales);单子叶植物,诸如属于以下各目的那些:泽泻目 (Alismatales)、水鳖目(Hydrocharitales)、茨藻目(Najadales)、霉草目(Triuridales)、鸭跖草目 (Commelinales)、谷精草目(Eriocaulales)、帚灯草目(Restionales)、颖花目(Poales)、灯心草目 (Juncales)、莎草目(Cyperales)、香蒲目(Typhales)、凤梨目(Bromeliales)、姜目(Zingiberales)、 槟榔目(Arecales)、环花目(Cyclanthales)、露兜树目(Pandanales)、天南星目(Arales)、百合目(Lilliales)和兰目(Orchidales),或属于裸子植物纲的植物,例如属于松目(Pinales)、银杏目 (Ginkgoales)、苏铁目(Cycadales)、南洋杉目(Araucariales)、柏目(Cupressales)和麻黄目 (Gnetales)的那些。
本文的组合物、系统和方法可以用于下文的双子叶植物、单子叶植物或裸子植物属的非 限制性列表中包括的众多植物物种:颠茄属(Atropa)、油丹属(Alseodaphne)、腰果属 (Anacardium)、花生属(Arachis)、琼南属(Beilschmiedia)、芸苔属(Brassica)、红花属(Carthamus)、 木防己属(Cocculus)、巴豆属(Croton)、黄瓜属(Cucumis)、柑橘属(Citrus)、西瓜属(Citrullus)、 辣椒属(Capsicum)、长春花属(Catharanthus)、椰子属(Cocos)、咖啡属(Coffea)、南瓜属 (Cucurbita)、胡萝卜属(Daucus)、半聚果属(Duguetia)、花菱草属(Eschscholzia)、榕属(Ficus)、 草莓属(Fragaria)、海罂粟属(Glaucium)、紫藤属(Glycine)、棉属(Gossypium)、向日葵属 (Helianthus)、橡胶树属(Hevea)、莨菪属(Hyoscyamus)、莴苣属(Lactuca)、非洲胶藤属 (Landolphia)、亚麻属(Linum)、木姜子属(Litsea)、番茄属(Lycopersicon)、羽扇豆属(Lupinus)、 木薯属(Manihot)、牛至属(Majorana)、苹果属(Malus)、苜蓿属(Medicago)、烟草属(Nicotiana)、木樨榄属(Olea)、银胶菊属(Parthenium)、罂粟属(Papaver)、鳄梨属(Persea)、菜豆属(Phaseolus)、黄连木属(Pistacia)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卜属(Raphanus)、蓖麻属(Ricinus)、千里光属(Senecio)、青藤属(Sinomenium)、千金藤属(Stephania)、 芥子属(Sinapis)、茄属(Solanum)、可可属(Theobroma)、三叶草属(Trifolium)、胡芦巴属 (Trigonella)、蚕豆属(Vicia)、长春花属(Vinca)、葡萄属(Vilis)和豇豆属(Vigna);以及葱属 (Allium)、印须芒草属(Andropogon)、剪股颖属(Aragrostis)、天门冬属(Asparagus)、燕麦属 (Avena)、狗牙根属(Cynodon)、油棕属(Elaeis)、羊茅属(Festuca)、黑麦草属(Festulolium)、萱 草属(Heterocallis)、大麦属(Hordeum)、浮萍属(Lemna)、黑麦草属(Lolium)、芭蕉属(Musa)、 稻属(Oryza)、黍属(Panicum)、狼尾草属(Pannesetum)、梯牧草属(Phleum)、早熟禾属(Poa)、 黑麦属(Secale)、高粱属(Sorghum)、小麦属(Triticum)、玉蜀黍属(Zea)、冷杉属(Abies)、杉木 属(Cunninghamia)、麻黄属(Ephedra)、云杉属(Picea)、松属(Pinus)和黄杉属(Pseudotsuga)。
在一些实施方案中,用于工程改造的靶植物和植物细胞包括那些单子叶和双子叶植物, 诸如作物,包括谷类作物(例如小麦、玉米、水稻、小米、大麦)、水果作物(例如番茄、苹果、 梨、草莓、橙子)、饲料作物(例如苜蓿)、块根蔬菜作物(例如胡萝卜、马铃薯、甜菜、山药)、 叶菜作物(例如生菜、菠菜);开花植物(例如矮牵牛、玫瑰、菊花)、针叶树和松树(例如松树 冷杉、云杉);用于植物修复的植物(例如重金属积累植物);油料作物(例如向日葵、油菜籽) 和用于实验目的的植物(例如拟南芥)。具体来说,希望植物包括但不限于被子植物和裸子植 物,诸如金合欢、紫花苜蓿、苋菜、苹果、杏、朝鲜蓟、白蜡树、芦笋、鳄梨、香蕉、大麦、 豆类、甜菜、桦树、山毛榉、黑莓、蓝莓、西兰花、球芽甘蓝、卷心菜、油菜、哈密瓜、胡 萝卜、木薯、花椰菜、雪松、谷物、芹菜、栗子、樱桃、大白菜、柑橘、柑桔、三叶草、咖 啡、玉米、棉花、豇豆、黄瓜、柏树、茄子、榆树、菊苣、桉树、茴香、无花果、冷杉、天 竺葵、葡萄、葡萄柚、花生、地樱桃、树胶铁杉、山核桃、羽衣甘蓝、奇异果、大头菜、落 叶松、生菜、韭菜、柠檬、青柠、刺槐、松树、铁线蕨、玉米、芒果、枫树、甜瓜、小米、 蘑菇、芥末、坚果、橡树、燕麦、油棕、秋葵、洋葱、橙子、观赏植物或花或树、木瓜、棕 榈、欧芹、欧洲防风草、豌豆、桃子、花生、梨、泥炭、胡椒、柿子、木豆、松树、菠萝、 车前草、李子、石榴、马铃薯、南瓜、菊苣、萝卜、油菜籽、覆盆子、水稻、黑麦、高粱、 红花、黄华柳、大豆、菠菜、云杉、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、甜玉米、红 桔、茶树、烟草、番茄、树木、黑小麦、草坪草、萝卜、藤蔓、胡桃、豆瓣菜、西瓜、小麦、 山药、红豆杉和西葫芦。
术语植物还涵盖藻类,它们主要是光合自养生物,主要由于它们缺乏根、叶和高等植物 特有的其他器官而被划为一类。所述组合物、系统和方法可以用于多种“藻类”或“藻类细胞”。 藻类的示例包括真核生物门,包括红藻门(红藻)、绿藻门(绿藻)、褐藻门(褐藻)、硅藻门(硅 藻)、黄藻门和甲藻,以及原核生物门蓝藻门(蓝绿藻)。藻类物种的示例包括月形藻属 (Amphora)、项圈藻属(Anabaena)、纤维藻属(Anikstrodesmis)、葡萄藻属(Botryococcus)、角毛 藻属(Chaetoceros)、衣藻属(Chlamydomonas)、小球藻属(Chlorella)、绿球藻属(Chlorococcum)、 小环藻属(Cyclotella)、细柱藻属(Cylindrotheca)、杜氏藻属(Dunaliella)、球石藻属(Emiliana)、 眼虫藻属(Euglena)、红球藻属(Hematococcus)、等鞭金藻属(Isochrysis)、单鞭金藻属 (Monochrysis)、单针藻属(Monoraphidium)、微绿球藻属(Nannochloris)、拟微绿球藻属 (Nannnochloropsis)、舟形藻属(Navicula)、肾鞭藻属(Nephrochloris)、肾藻属(Nephroselmis)、 菱形藻属(Nitzschia)、节球藻属(Nodularia)、念珠藻属(Nostoc)、棕鞭藻属(Oochromonas)、卵 胞藻属(Oocystis)、颤藻属(Oscillartoria)、巴夫藻属(Pavlova)、褐指藻属(Phaeodactylum)、扁 藻属(Playtmonas)、颗石藻属(Pleurochrysis)、紫菜属(Porhyra)、假鱼腥藻属(Pseudoanabaena)、 塔胞藻属(Pyramimonas)、裂丝藻属(Stichococcus)、聚球藻属(Synechococcus)、集胞藻属 (Synechocystis)、四鞭藻属(Tetraselmis)、海链藻属(Thalassiosira)和束毛藻属(Trichodesmium)。
植物启动子
为了确保在植物细胞中适当表达,本文的组分和系统的组分可以置于植物启动子控制之 下。植物启动子是植物细胞中可操作的启动子。植物启动子能够在植物细胞中启动转录,无 论其来源是否为植物细胞。设想使用不同类型的启动子。
在一些实施例中,所述植物启动子是组成型植物启动子,即能够在植物的所有或几乎所 有发育阶段过程中在所有或几乎所有植物组织中表达(称为“组成型表达”)它控制的开放阅读 框(ORF)的启动子。组成型启动子的一个示例是花椰菜花叶病毒35S启动子。在一些实施例 中,所述植物启动子是受调控的启动子,它并非组成性地而是以时间和/或空间调控方式指 导基因表达,并且包括组织特异性、组织优选型和诱导型启动子。不同的启动子可以指导基 因在不同的组织或细胞类型中、或在不同的发育阶段、或响应于不同的环境条件表达。在一 些实施例中,所述植物启动子是组织优选型启动子,它可用于靶向特定植物组织内某些细胞 类型中增强的表达,例如叶或根中或者种子的特定细胞中的维管细胞。
示例性植物启动子包括从植物、植物病毒和细菌诸如土壤杆菌或根瘤菌获得的那些,它 们包含植物细胞中表达的基因。启动子的其他示例包括以下所述的那些:Kawamata等,(1997) Plant Cell Physiol 38:792-803;Yamamoto等,(1997)Plant J 12:255-65;Hire等,(1992)Plant Mol Biol 20:207-18;Kuster等,(1995)Plant Mol Biol 29:759-72;和Capana等,(1994)Plant Mol Biol 25:681-91。
在一些实施例中,植物启动子可以是诱导型启动子,所述诱导型启动子是可诱导的并且 允许基因编辑或基因表达的时空控制可以使用某种能量形式。所述能量形式可以包括声能、 电磁辐射、化学能和/或热能。诱导型系统的示例包括四环素诱导型启动子(Tet-On或 Tet-Off)、小分子双杂交转录激活系统(FKBP、ABA等)或光诱导型系统(植物色素、LOV结 构域或隐花色素),诸如以序列特异性方式指导转录活性变化的光诱导型转录效应子(LITE)。 在一个具体实施例中,光诱导型系统的组分包括Cas蛋白、光响应性细胞色素异二聚体(例 如来自拟南芥)和转录激活/阻遏结构域。
在一些实施例中,启动子可以是化学调控型启动子(其中应用外源化学物质诱导基因表 达)或化学抑制型启动子(其中应用化学物质抑制基因表达)。化学诱导型启动子的示例包括玉 米ln2-2启动子(通过苯磺酰胺除草剂安全剂激活)、玉米GST启动子(通过用作芽前除草剂的 疏水性亲电子化合物激活)、烟草PR-1a启动子(通过水杨酸激活)、通过抗生素调控的启动子 (诸如四环素诱导型和四环素抑制型启动子)。
稳定整合在植物基因组中
在一些实施方案中,可以引入编码所述组合物和系统的组分的多核苷酸以稳定整合到植 物细胞的基因组中。在一些情况下,载体或表达系统可以用于这种整合。可以取决于何时、 何处和在何种条件下表达向导RNA和/或Cas基因来调节载体或表达系统的设计。在一些情 况下,多核苷酸可以整合到诸如质粒、线粒体或叶绿体等植物细胞器中。表达系统的元件可 以在一个或多个表达构建体上,所述表达构建体要么是环状的,诸如质粒或转化载体,要么 是非环状的,诸如线性双链DNA。
在一些实施方案中,所述整合方法通常包括以下步骤:选择合适的宿主细胞或宿主组织, 将所述构建体引入宿主细胞或宿主组织中,以及从其再生植物细胞或植物。在一些实施例中, 用于稳定整合到植物细胞基因组中的表达系统可以含有一个或多个以下元件:可用于在植物 细胞中表达RNA和/或Cas酶的启动子元件;用以增强表达的5'非翻译区;用以进一步增强 某些细胞(诸如单子叶植物细胞)中的表达的内含子元件;用以提供便于插入向导RNA和/或 Cas基因序列和其他所需元件的限制性位点的多克隆位点;以及用以有效终止表达的转录物 的3'非翻译区。
在植物中瞬时表达
在一些实施方案中,所述组合物和系统的组分可以在植物细胞中瞬时表达。在一些实施 例中,所述组合物和系统可以仅当向导RNA和Cas蛋白都存在于细胞中时修饰靶核酸,从 而可以进一步控制基因组修饰。因为Cas蛋白的表达是瞬时的,所以从此类植物细胞再生的 植物典型地不含外来DNA。在某些实施例中,Cas蛋白被稳定表达,而向导序列被瞬时表 达。
可以将DNA和/或RNA(例如mRNA)引入植物细胞以用于瞬时表达。在这种情况下,可以提供足量的引入核酸以修饰细胞,但在预期时间段已经过去之后或在一次或多次细胞分 裂之后不会持续存在。
可以使用合适的载体来实现瞬时表达。可用于瞬时表达的示例性载体包括pEAQ载体 (可以针对土壤杆菌介导的瞬时表达进行定制)和卷心菜叶卷曲病毒(CaLCuV),以及以下所述 的载体:Sainsbury F.等,Plant Biotechnol J.2009年9月;7(7):682-93;和Yin K等,Scientific Reports第5卷,论文编号:14926(2015)。
还设想了上述不同方法的组合。
易位至和/或表达于特定植物细胞器中
本文的组合物和系统可以包含用于易位至和/或表达于特定植物细胞器中的元件。
叶绿体靶向
在一些实施方案中,设想所述组合物和系统用于特异性修饰叶绿体基因或确保在叶绿体 中表达。所述组合物和系统(例如,Cas蛋白、向导分子或它们的编码多核苷酸)可以转化至、 隔室化至和/或靶向叶绿体。在一个实施例中,在质粒基因组中引入基因修饰可以减少生物 安全问题,诸如通过花粉的基因流动。
叶绿体转化方法的示例包括粒子轰击、PEG处理和显微注射,以及转化盒从核基因组 易位至质粒。在一些实施例中,靶向叶绿体可以通过在叶绿体定位序列和/或表达构建体中 并入编码叶绿体转运肽(CTP)或质粒转运肽的序列来实现,所述序列可操作地连接到编码所 述组合物和系统的组分的序列的5'区。叶绿体转化、靶向和定位的其他示例包括以下所述的 那些:WO2010061186;Protein Transport into Chloroplasts,2010,AnnualReview of Plant Biology,第61卷:157-180;和US 20040142476,它们通过引用整体并入本文。
在植物中的示例性应用
所述组合物、系统和方法可以用于在目标植物(例如作物)中产生遗传变异。可以提供靶 向基因组中一个或多个位置的一个或多个向导分子(例如文库),并与Cas效应蛋白一起引入 植物细胞中。举例来说,可以产生一组基因组规模的点突变和基因敲除。在一些实施例中, 所述组合物、系统和方法可以用于从如此获得的细胞产生植物部分或植物并针对目标性状筛 检所述细胞。所述靶基因可以包括编码区和非编码区。在一些情况下,所述性状是应激耐受 性,并且所述方法是产生应激耐受性作物品种的方法。
在一些实施方案中,所述组合物、系统和方法用于修饰内源基因或修饰它们的表达。表 达所述组分可以诱导基因组的靶向修饰,或通过Cas核酸酶的直接活性和任选地引入重组模 板DNA,或通过修饰所靶向的基因。上文所述的不同策略允许Cas介导的靶向性基因组编 辑,而不需要将组分引入植物基因组中。
在一些情况下,可以在不将任何外来基因(包括编码CRISPR组分的那些)永久引入植物 基因组中的情况下进行修饰,以避免植物基因组中存在外来DNA。这可能令人感兴趣,因 为对非转基因植物的监管要求不太严格。瞬时引入植物细胞中的组分通常在杂交时被去除。
举例来说,可以通过瞬时表达所述组合物和系统的组分来进行修饰。瞬时表达可以通过 用病毒载体递送所述组合物和系统的组分、递送到原生质体中、借助颗粒分子诸如纳米颗粒 或CPP来进行。
产生具有所需性状的植物
本文的组合物、系统和方法可用于将所需性状引入植物。所述方法包括引入一个或多个 外来基因以赋予目标性状,从而编辑或调节内源基因以赋予目标性状。
农艺性状
在一些实施方案中,可以通过影响特定植物性状来改良作物植物。性状的示例包括改良 的农艺性状,诸如除草剂抗性、疾病抗性、非生物应激耐受性、高产和优质、杀虫剂抗性、 疾病抗性、昆虫和线虫抗性、寄生杂草抗性、干旱抗性、营养价值、应激耐受性、自花授粉 空隙率、草料消化率生物量和谷物产量。
在一些实施方案中,可以将赋予害虫或疾病抗性的基因引入植物。在植物中存在赋予这 种抗性的内源基因的情况下,可以增强它们的表达和功能(例如,通过引入额外的拷贝、增 强表达和/或活性的修饰)。
赋予抗性的基因的示例包括植物疾病抗性基因(例如,Cf-9、Pto、RSP2、SlDMR6-1)、 赋予害虫抗性的基因(例如,WO96/30517中所述的那些)、苏云金杆菌(Bacillusthuringiensis) 蛋白、凝集素、维生素结合蛋白(例如,亲和素)、酶抑制因子(例如,蛋白酶或蛋白酶抑制因 子或淀粉酶抑制因子)、昆虫特异性激素或信息素(例如,蜕皮激素或保幼激素、其变体、基 于其的模拟物,或其拮抗剂或激动剂)或参与此类激素和信息素、昆虫特异性肽或神经肽、 昆虫特异性毒液的产生和调控的基因(例如,由蛇、黄蜂等产生,或其类似物)、负责单萜、 倍半萜、类固醇、异羟肟酸、苯丙烷衍生物或具有杀昆虫活性的另一非蛋白质分子过度积累 的酶、参与修饰生物活性分子的酶(例如,糖解酶、蛋白水解酶、脂肪分解酶、核酸酶、环 化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几丁质酶 和葡聚糖酶,无论是天然的还是合成的)、刺激信号转导的分子、病毒侵入性蛋白质或由其 衍生的复合毒素、自然界中由病原体或寄生虫产生的发育阻滞蛋白、自然界中由植物产生的 发育阻滞蛋白,或其任何组合。
所述组合物、系统和方法可以用于鉴定、筛检、引入或去除导致对某些病原体(例如宿 主特异性病原体)产生易感性的遗传变异性的突变或序列。这种方法可能产生非宿主抗性植 物,例如,所述宿主和病原体不相容,或者可能对病原体的所有种族有部分抗性,通常由许 多基因控制和/或还对病原体的某些种族有完全抗性但对其他种族则不然。
在一些实施方案中,所述组合物、系统和方法可以用于修饰涉及植物疾病的基因。可以 去除、失活或以其他方式调控或修饰此类基因。植物疾病的示例包括US20140213619A1的 [0045]-[0080]中所述的那些,该案通过引用整体并入本文。
在一些实施方案中,可以将赋予除草剂抗性的基因引入植物。赋予除草剂抗性的基因的 示例包括赋予对抑制生长点或分生组织的除草剂(诸如咪唑啉酮或磺酰脲)的抗性的基因;赋 予草甘膦耐受性(例如,分别由例如突变5-烯醇丙酮酰莽草酸-3-磷酸合成酶基因、aroA基因 和草甘膦乙酰转移酶(GAT)基因赋予的抗性)、或对其他膦酰基化合物的抗性,诸如通过草铵 膦(来自链霉菌属物种,包括吸水链霉菌和绿色链霉菌的草丁膦乙酰转移酶(PAT)基因),以 及由ACC酶抑制因子编码基因赋予的对吡啶氧基或苯氧基丙酸和环己酮的抗性)的基因;赋 予对抑制光合作用的除草剂(诸如三嗪(psbA和gs+基因)或苯甲腈(腈水解酶基因)和谷胱甘肽 S-转移酶)的抗性的基因;编码使除草剂解毒的酶或对抑制有抗性的突变谷氨酰胺合成酶的 基因;编码解毒酶的基因是编码草丁膦乙酰转移酶(诸如来自链霉菌属物种的bar或pat蛋白) 的酶;编码羟苯基丙酮酸二加氧酶(HPPD)抑制因子,例如天然存在的HPPD抗性酶的基因; 和编码突变或嵌合HPPD酶的基因。
在一些实施方案中,可以将涉及非生物应激耐受性的基因引入植物。基因的示例包括能 够降低聚(ADP-核糖)聚合酶(PARP)基因的表达和/或活性的那些基因;能够降低PARG编码 基因的表达和/或活性的转基因;编码烟酰胺腺嘌呤二核苷酸补救合成途径的植物功能酶的 基因,所述植物功能酶包括烟酰胺酶、烟酸磷酸核糖基转移酶、烟酸单核苷酸腺苷转移酶、 烟酰胺腺嘌呤二核苷酸合成酶或烟酰胺磷酸糖基转移酶、参与碳水化合物生物合成的酶、参 与聚果糖(例如菊粉和果聚糖型)生产、α-1,6支链α-1,4-葡聚糖生产、交替糖生产、透明质酸 生产的酶。
在一些实施方案中,可以将提高干旱抗性的基因引入植物。泛素蛋白连接酶蛋白(UPL) 蛋白(UPL3)、DR02、DR03、ABC转运蛋白和DREB1A基因的示例。
营养改良的植物
在一些实施方案中,所述组合物、系统和方法可以用于产生营养改良的植物。在一些示 例中,此类植物可以提供功能食品,例如,可以提供超出其所含传统营养物的健康益处的改 良食品或食品成分。在某些实施例中,此类植物可以提供营养食品,例如可以被视为食物或 食物的一部分并提供健康益处(包括预防和治疗疾病)的物质。营养食品可以用于预防和/或治 疗动物和人类的疾病,例如癌症、糖尿病、心血管疾病和高血压。
改良的植物可以自然产生一种或多种所需化合物,并且所述修饰可以提高化合物的水平 或活性或质量。在一些情况下,所述改良的植物可能不会自然产生所述化合物,而所述修饰 使所述植物能够产生这种化合物。在一些情况下,所述组合物、系统和方法用于间接修饰这 些化合物的内源合成,例如,通过修饰控制此化合物的代谢的一种或多种转录因子。
营养改良的植物的示例包括包含改良的蛋白质质量、含量和/或氨基酸组成、必需氨基 酸含量、油和脂肪酸、碳水化合物、维生素和类胡萝卜素、功能性次生代谢物和矿物质的植 物。在一些实施例中,所述改良的植物可以包含或产生具有健康益处的化合物。营养改良的 植物的示例包括Newell-McGloughlin,Plant Physiology,2008年7月,第147卷,第939-953 页所述的那些。
可以产生的化合物的示例包括类胡萝卜素(例如,α-胡萝卜素或β-胡萝卜素)、叶黄素、 番茄红素、玉米黄质、膳食纤维(例如,不溶性纤维、β-葡聚糖、可溶性纤维、脂肪酸(例如, ω-3脂肪酸、共轭亚油酸、GLA)、类黄酮(例如羟基肉桂酸酯、黄酮醇、儿茶素和单宁)、硫 代葡萄糖苷、吲哚、异硫氰酸酯(例如萝卜硫素)、酚类(例如芪、咖啡酸和阿魏酸、表儿茶素)、 植物甾烷醇/甾醇、果聚糖、菊粉、低聚果糖、皂苷、大豆蛋白、植物雌激素(例如异黄酮、 木脂素)、硫化物和硫醇,诸如二烯丙基硫醚、烯丙基甲基三硫化物、二硫硫酮、单宁,诸 如原花青素,或其任何组合。
所述组合物、系统和方法还可以用于改良蛋白质/淀粉功能性、保质期、味道/美观性、 纤维质量和过敏原、抗营养物质和毒素减少性状。
可以修饰以引入所述性状的基因和核酸的示例包括硬脂基-ACP去饱和酶、与可能负责 以低水平植酸为特征的玉米突变体的单个等位基因相关的DNA、Tf RAP2.2及其相互作用伴 侣SINAT2、Tf Dof1和DOF Tf AtDof1.1(OBP2)。
多倍体植物的修饰
所述组合物、系统和方法可以用于修饰多倍体植物。多倍体植物携带其基因组的重复拷 贝(例如,多达六个,诸如在小麦中)。在一些情况下,所述组合物、系统和方法可以多路化 以影响基因的所有拷贝,或一次靶向数十个基因。举例来说,所述组合物、系统和方法可以 用于同时确保负责抑制疾病防御的不同基因中的功能丧失突变。所述修饰可以同时抑制 TaMLO-A1、TaMLO-B1和TaMLO-D1核酸序列在小麦植物细胞中表达和由其再生出小麦 植物,以确保小麦植物对白粉病有抗性(例如,如WO2015109752中所述)。
果实成熟的调控
所述组合物、系统和方法可以用于调控果实的成熟。成熟是水果和蔬菜成熟过程中的一 个正常阶段。仅在开始后几天,它就能使水果或蔬菜不适于食用,这会给农民和消费者带来 重大损失。
在一些实施方案中,所述组合物、系统和方法用于减少乙烯产生。在一些实施例中,所 述组合物、系统和方法可以用于抑制ACC合成酶的表达和/或活性、插入ACC脱氨酶基因 或其功能片段、插入SAM水解酶基因或其功能片段、抑制ACC氧化酶基因表达。
替代地或另外地,所述组合物、系统和方法可以用于修饰乙烯受体(例如,抑制ETR1) 和/或聚半乳糖醛酸酶(PG)。基因抑制可以通过将突变、反义序列和/或基因截短拷贝引入基 因组来实现。
增加植物的储存寿命
在一些实施方案中,所述组合物、系统和方法用于修饰产生影响植物或植物部分储存寿 命的化合物所涉及的基因。所述修饰可能在阻止还原糖在马铃薯块茎中积累的基因中。在高 温处理后,这些还原糖与游离氨基酸反应,产生褐色苦味产物和升高水平的丙烯酰胺,这是 一种潜在致癌物。在特定实施方案中,本文提供的方法用于降低或抑制液泡转化酶基因(VInv) 的表达,该基因编码将蔗糖分解成葡萄糖和果糖的蛋白质。
减少植物中的过敏原
在一些实施方案中,所述组合物、系统和方法用于产生具有降低水平的过敏原的植物, 使它们对消费者更安全。为此,所述组合物、系统和方法可用于鉴定和修饰(例如抑制)一个 或多个负责产生植物过敏原的基因。此类基因的示例包括Lol p5,以及花生、大豆、扁豆、 豌豆、羽扇豆、青豆、绿豆中的那些,诸如Nicolaou等,Current Opinion inAllergy and Clinical Immunology 2011;11(3):222)所述的那些;该文献通过引用整体并入本文。
产生雄性不育植物
所述组合物、系统和方法可以用于产生雄性不育植物。与近交植物相比,杂交植物通常 具有有利的农艺性状。然而,对于自花授粉植物,产生杂交种可能具有挑战性。在不同的植 物类型(例如玉米和水稻)中,已经鉴定了对植物生育力,更具体来说是雄性生育力很重要的 基因。照这样基因改造的植物可以用于杂交育种计划。
所述组合物、系统和方法可以用于修饰雄性生育力涉及的基因,例如,使雄性生育力所 需的基因失活(诸如通过引入突变)。雄性生育力涉及的基因的示例包括细胞色素P450样基 因(MS26)或大范围核酸酶基因(MS45),以及Wan X等,Mol Plant.2019年3月4日;12(3):321-342;和Kim YJ等,Trends Plant Sci.2018年1月;23(1):53-65所述的那些。
增加植物的生育期
在一些实施方案中,所述组合物、系统和方法可以用于延长诸如水稻等植物的生育期。 举例来说,可以靶向诸如Ehd3等水稻生育期基因以便在所述基因中产生突变,并且可以针 对延长的再生植物生育期选择幼苗。
产生产品的早期产量
在一些实施方案中,所述组合物、系统和方法可以用于产生产品的早期产量。举例来说, 可以调节开花过程,例如,通过使诸如SP5G等开花阻遏基因突变。此类方法的示例包括 Soyk S等,Nat Genet.2017年1月;49(1):162-168所述的那些。
油和生物燃料生产
所述组合物、系统和方法可以用于产生用于油和生物燃料生产的植物。生物燃料包括由 植物和植物衍生资源制成的燃料。生物燃料可以从通过碳固定过程获得能量的有机物质提 取,或者通过使用或转化生物质而制成。这种生物质可以直接用于生物燃料,或可以通过热 转化、化学转化和生化转化而转化为方便的含能物质。这种生物质转化可以产生呈固体、液 体或气体形式的燃料。生物燃料包括生物乙醇和生物柴油。生物乙醇可以通过可能来源于玉 米和甘蔗的纤维素(淀粉)的糖发酵过程产生。生物柴油可以从诸如油菜籽、棕榈和大豆等油 料作物生产。生物燃料可用于运输。
产生用于生产植物油和生物燃料的植物
所述组合物、系统和方法可以用于产生表达或过度表达高水平油或生物燃料的藻类(例 如硅藻)和其他植物(例如葡萄)。
在一些情况下,所述组合物、系统和方法可以用于修饰参与修饰脂质数量和/或脂质质 量的基因。此类基因的示例包括参与脂肪酸合成途径的那些,例如乙酰CoA羧化酶、脂肪 酸合成酶、3-酮酰基-酰基-载体蛋白合成酶III、甘油-3-磷酸脱氢酶(G3PDH)、烯酰基-酰基 载体蛋白还原酶(烯酰基-ACP-还原酶)、甘油-3-磷酸酰基转移酶、溶血磷脂酰基转移酶或二 酰基甘油酰基转移酶、磷脂:二酰基甘油酰基转移酶、磷脂酸磷酸酶、脂肪酸硫酯酶诸如棕 榈酰蛋白硫酯酶或苹果酸酶活性。
在其他实施方案中,设想产生具有增加的脂质积累的硅藻。这可以通过靶向减少脂质分 解代谢的基因来实现。基因的示例包括参与三酰基甘油和游离脂肪酸活化、脂肪酸β-氧化 的那些,诸如酰基-CoA合成酶、3-酮酰基-CoA硫解酶、酰基-CoA氧化酶活性和磷酸葡萄 糖突变酶的基因。
在一些实施例中,藻类可以经过修饰以用于生产油和生物燃料,包括脂肪酸(例如,脂 肪酯,诸如酸甲酯(FAME)和脂肪酸乙酯(FAEE))。修饰微藻类的方法的示例包括Stovicek等, Metab.Eng.Comm.,2015;2:1;美国专利号8,945,839;和国际专利公开号WO2015/086795 所述的那些。
在一些实施例中,可以将一个或多个基因引入(例如过度表达)植物(例如藻类)以便从碳 源(例如醇)生产油和生物燃料(例如脂肪酸)。基因的示例包括编码酰基CoA合成酶、酯合成 酶、硫酯酶(例如tesA、'tesA、tesB、fatB、fatB2、fatB3、fatAl或fatA)、酰基CoA合成酶(例 如fadD、JadK、BH3103、pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、 faa39)、酯合成酶(例如来自霍霍巴(Simmondsia chinensis)、不动杆菌属(Acinetobacter sp.) ADP、泊库岛食烷菌(Alcanivorax borkumensis)、铜绿假单胞菌(Pseudomonas aeruginosa)、亚 德海床杆菌(Fundibacter jadensis)、拟南芥(Arabidopsis thaliana)或富养产碱杆菌(Alkaligenes eutrophus)的合成酶/酰基CoA:二酰基甘油酰基转移酶或其变体)的基因。
另外地或替代地,可以使植物(例如藻类)中的一个或多个基因失活(例如,降低基因表 达)。举例来说,可以将一个或多个突变引入基因。此类基因的示例包括编码酰基CoA脱氢 酶(例如fade)、外膜蛋白受体和脂肪酸生物合成转录调控子(例如阻遏子)(例如fabR)、丙酮 酸甲酸溶解酶(例如pflB)、乳酸脱氢酶(例如IdhA)的基因。
有机酸产生
在一些实施方案中,植物可以经修饰以产生有机酸,诸如乳酸。所述植物可以使用糖、 戊糖或己糖生产有机酸。为此,可以将一个或多个基因引入(例如,并且过度表达)于植物中。 此类基因的示例包括LDH基因。
在一些实施例中,可以使一个或多个基因失活(例如,降低基因表达)。举例来说,可以 将一个或多个突变引入基因。所述基因可以包括编码涉及内源代谢途径的蛋白质的那些,所 述内源代谢途径产生除目标有机酸以外的代谢物和/或其中所述内源代谢途径消耗有机酸。
可以修饰或引入的基因的示例包括编码丙酮酸脱羧酶(pdc)、富马酸还原酶、醇脱氢酶 (adh)、乙醛脱氢酶、磷酸烯醇丙酮酸羧化酶(ppc)、D-乳酸脱氢酶(d-ldh)、L-乳酸脱氢酶(l-ldh)、 乳酸2-单加氧酶、乳酸脱氢酶、细胞色素依赖性乳酸脱氢酶(例如细胞色素B2依赖性L-乳 酸脱氢酶)的那些。
增强植物特性以用于生物燃料生产
在一些实施方案中,所述组合物、系统和方法用于改变植物细胞壁的性质以促进关键水 解剂进入,从而更有效地释放糖以用于发酵。通过降低植物中木质素的比例,可以增加纤维 素的比例。在特定实施方案中,可以下调植物中的木质素生物合成以增加可发酵碳水化合物。
在一些实施例中,可以下调一个或多个木质素生物合成基因。此类基因的示例包括4- 香豆酸3-羟化酶(C3H)、苯丙氨酸解氨酶(PAL)、肉桂酸4-羟化酶(C4H)、羟基肉桂酰转移酶 (HCT)、咖啡酸O-甲基转移酶(COMT)、咖啡酰CoA 3-O-甲基转移酶(CCoAOMT)、阿魏酸5-羟化酶(F5H)、肉桂醇脱氢酶(CAD)、肉桂酰CoA还原酶(CCR)、4-香豆酸CoA连接酶(4CL)、单体木素醇-木质素特异性糖基转移酶和醛脱氢酶(ALDH),以及WO 2008064289中所述的那些。
在一些实施例中,可以减少发酵过程中产生较低水平乙酸的植物质量。为此,可以使参 与多糖乙酰化的基因(例如,Cas1L和WO 2010096488所述的那些)失活。
用于油和生物燃料生产的其他微生物
在一些实施方案中,使用本文的组合物、系统和方法时,可以使用除植物以外的微生物 生产油和生物燃料。微生物的示例包括大肠杆菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳 杆菌属(Lactobacillus)、红球菌属(Rhodococcus)、聚球藻属、集胞藻属(Synechoystis)、假单胞 菌属(Pseudomonas)、曲霉属(Aspergillus)、木霉属(Trichoderma)、脉孢菌属(Neurospora)、镰 刀菌属(Fusarium)、腐殖菌属(Humicola)、根毛霉属(Rhizomucor)、克鲁维酵母属 (Kluyveromyces)、毕赤氏酵母属(Pichia)、毛霉属(Mucor)、毁丝霉属(Myceliophtora)、青霉属 (Penicillium)、长毛菌属(Phanerochaete)、平菇属(Pleurotus)、栓菌属(Trametes)、金孢属 (Chrysosporium)、酵母属(Saccharomyces)、寡养单胞菌属(Stenotrophamonas)、裂殖酵母属(Schizosaccharomyces)、耶氏酵母属(Yarrowia)或链霉菌属(Streptomyces)的那些。
植物培养和再生
在一些实施方案中,可以培养修饰的植物或植物细胞以再生具有转化或修饰的基因型并 因此具有所需表型的完整植物。再生技术的示例包括依赖于在组织培养生长培养基中操纵某 些植物激素、依赖于已经与从培养的原生质体、植物愈伤组织、外植体、器官、花粉、胚芽 或其部分获得的所需核苷酸序列一起引入的杀生物剂和/或除草剂标记物的那些。
检测植物基因组选择标记物中的修饰
当所述组合物、系统和方法用于修饰植物时,可以使用合适的方法来确认和检测在植物 中进行的修饰。在一些实施例中,当进行多种修饰时,可以选择和检测一种或多种所需修饰 或由所述修饰产生的性状。可以通过生化和分子生物学技术进行所述检测和确认,诸如南方 分析、PCR、北方印迹、S1 RNA酶保护、引物延伸或逆转录酶PCR、酶测定、核糖酶活性、 凝胶电泳、蛋白质印迹、免疫沉淀、酶联免疫测定、原位杂交、酶染色和免疫染色。
在一些情况下,可以将一种或多种标记物,诸如可选择和可检测标记物引入植物中。此 类标记物可用于选择、监测、分离具有所需修饰和性状的细胞和植物。可选择标记物可以赋 予阳性或负选择,并且在存在外部底物时是有条件的或无条件的。此类标记物的示例包括赋 予对诸如潮霉素(hpt)和卡那霉素(nptII)等抗生素的抗性的基因和蛋白质,以及赋予对诸如草 丁膦(bar)和氯磺隆(als)等除草剂的抗性的基因、能够产生或加工有色物质的酶(例如,β-葡萄 糖醛酸酶、荧光素酶、B或C1基因)。
在真菌中的应用
本文所述的组合物、系统和方法可用于在真菌或真菌细胞(诸如酵母)中进行有效且成本 有效的基因或基因组查询或编辑或操作。植物中的方法和应用也可以应用于真菌。
真菌细胞可以是真菌界内的任何类型的真核细胞,诸如子囊菌门(Ascomycota)、担子菌 门(Basidiomycota)、芽枝菌门(Blastocladiomycota)、壶菌门(Chytridiomycota)、球囊菌门 (Glomeromycota)、微孢子菌门(Microsporidia)和新美鞭毛菌门(Neocallimastigomycota)。真菌 或真菌细胞的示例包括酵母、霉菌和丝状真菌。
在一些实施方案中,所述真菌细胞是酵母细胞。酵母细胞是指子囊菌门和担子菌门内的 任何真菌细胞。酵母的示例包括出芽酵母、裂殖酵母和霉菌、酿酒酵母(S.cerervisiae)、马 克斯克鲁维酵母(Kluyveromyces marxianus)、东方伊萨肯菌(Issatchenkia orientalis)、念珠菌属 (例如白色念珠菌(Candida albicans))、耶氏酵母属(例如,解脂耶氏酵母(Yarrowia lipolytica))、 毕赤氏酵母属(例如,巴斯德毕赤氏酵母(Pichia pastoris))、克鲁维酵母属(例如,乳酸克鲁维 酵母(Kluyveromyceslactis)和马克斯克鲁维酵母)、链孢霉属(例如,粗糙链孢霉(Neurospora crassa))、镰刀菌属(例如,尖孢镰刀菌(Fusarium oxysporum)和伊萨酵母属(例如,东方伊萨 酵母(Issatchenkia orientalis)、库德里阿兹氏毕赤酵母(Pichia kudriavzevii)和嗜酸嗜热假丝酵 母(Candida acidothermophilum)。
在一些实施方案中,所述真菌细胞是丝状真菌细胞,其以纤丝(例如菌丝或菌丝体)形式 生长。丝状真菌细胞的示例包括曲霉属(例如,黑曲霉(Aspergillus niger))、木霉属(例如,里 氏木霉(Trichoderma reesei))、根霉属(例如,米根霉(Rhizopus oryzae))和被孢霉属(例如,黄 褐色被孢霉(Mortierella isabellina))。
在一些实施方案中,所述真菌细胞是工业菌株。工业菌株包括在工业过程中使用或分离 的任何真菌细胞菌株,例如以商业或工业规模生产产品。工业菌株可以指通常用于工业过程 的真菌物种,或者它可以指还可以用于非工业目的(例如,实验室研究)的真菌物种的分离物。 工业过程的示例包括发酵(例如,在食品或饮料产品生产中)、蒸馏、生物燃料生产、化合物 生产和多肽生产。工业菌株的示例包括但不限于JAY270和ATCC4124。
在一些实施方案中,所述真菌细胞是多倍体细胞,其基因组存在于超过一个拷贝中。多 倍体细胞包括天然情况下呈多倍体状态存在的细胞,以及被诱导而呈多倍体状态存在的细胞 (例如,通过特异性调控、改变、失活、激活或修饰减数分裂、胞质分裂或DNA复制)。多 倍体细胞可以是其整个基因组为多倍体的细胞,或者在特定目标基因组基因座中是多倍体的 细胞。在一些实施例中,与单倍体细胞相比,向导RNA的丰度在多倍体细胞的基因组工程 改造中可能更经常是限速组分,并且因此使用本文所述的CRISPR系统的方法可以利用使用 某些真菌细胞类型的优势。
在一些实施方案中,所述真菌细胞是二倍体细胞,其基因组存在于两个拷贝中。二倍体 细胞包括天然情况下呈二倍体状态存在的细胞,以及被诱导而呈二倍体状态存在的细胞(例 如,通过特异性调控、改变、失活、激活或修饰减数分裂、胞质分裂或DNA复制)。二倍体 细胞可以指其整个基因组是二倍体的细胞,或者它可以指在特定目标基因组基因座中是二倍 体的细胞。
在一些实施方案中,所述真菌细胞是单倍体细胞,其基因组存在于一个拷贝中。单倍体 细胞包括天然情况下呈单倍体状态存在的细胞,以及被诱导而呈单倍体状态存在的细胞(例 如,通过特异性调控、改变、失活、激活或修饰减数分裂、胞质分裂或DNA复制)。单倍体 细胞可以指其整个基因组是单倍体的细胞,或者它可以指在特定目标基因组基因座中是单倍 体的细胞。
可以使用本文的递送系统和方法将所述组合物和系统以及编码其的核酸引入真菌细胞。 递送系统的示例包括醋酸锂处理、轰击、电穿孔,以及Kawai等,2010,BioengBugs.2010 年11月至12月;1(6):395-403所述的那些。
在一些实施例中,可以使用酵母表达载体(例如,具有一个或多个调控元件的那些)。此 类载体的示例包括着丝粒(CEN)序列、自主复制序列(ARS)、启动子(诸如可操作地连接到目 标序列或基因的RNA聚合酶III启动子)、终止子(诸如RNA聚合酶III终止子)、复制起点 和标记基因(例如营养缺陷型、抗生素或其他可选择标记物)。用于酵母的表达载体的示例可 以包括质粒、酵母人工染色体、2μ质粒、酵母整合质粒、酵母复制质粒、穿梭载体和附加 型质粒。
真菌的生物燃料和材料生产
在一些实施方案中,所述组合物、系统和方法可用于产生用于生物燃料和材料生产的改 性真菌。举例来说,用于从可发酵糖生产生物燃料或生物聚合物并且任选地能够降解来源于 农业废物的植物衍生木质纤维素作为可发酵糖来源的改性真菌。生物燃料生产和合成所需的 外源基因可以引入真菌。在一些实施例中,所述基因可以编码参与将丙酮酸转化为乙醇或另 一目标产物、降解纤维素(例如纤维素酶)、与生物燃料生产途径竞争的内源代谢途径的酶。
在一些实施例中,所述组合物、系统和方法可用于产生和/或选择具有改善的木糖或纤 维二糖利用、类异戊二烯生物合成和/或乳酸产生的酵母菌株。可以对参与这些化合物的代 谢和合成的一个或多个基因进行修饰和/或引入酵母细胞。所述方法和基因的示例包括乳酸 脱氢酶、PDC1和PDC5,以及以下文献所述的那些:Ha,S.J.等,(2011)Proc.Natl.Acad.Sci. USA 108(2):504-9和Galazka,J.M.等,(2010)Science 330(6000):84-6;
Figure BDA0003651481360004271
T等,Metab Eng.2015年3月;28:213-222;Stovicek V等,FEMS YeastRes.2017年8月1日;17(5)。
改良的植物和酵母细胞
本公开还提供了改良的植物和真菌。改良的植物和真菌可以包含一个或多个引入的基 因,和/或一个或多个通过本文的组合物、系统和方法修饰的基因。改良的植物和真菌可能 具有增加的食物或饲料产量(例如,更高的蛋白质、碳水化合物、营养物或维生素水平)、油 和生物燃料产量(例如,甲醇、乙醇)、对害虫、除草剂、干旱、低温或高温、过量水等的耐 受性。
所述植物或真菌可以具有一个或多个改良的部分,例如叶、茎、根、块茎、种子、胚乳、 胚珠和花粉。所述部分可以是有活力的、无活力的、可再生的和/或不可再生的。
改良的植物和真菌可以包括改良植物和真菌的配子、种子、胚芽、合子或体细胞、后代 和/或杂种。后代可能是所产生的植物或真菌的克隆,或者可能由通过与同一物种的其他个 体杂交以将其他理想性状渗入其后代的有性繁殖产生。在多细胞生物体,特别是植物的情况 下,细胞可以在体内或离体。
CRISPR-Cas系统在植物中的其他应用
所述组合物、系统和方法对植物和真菌的其他应用包括观察基因元件动力学(例如,如 Chen B等,Cell.2013年12月19日;155(7):1479-91所述);体外和体内靶向性基因破坏正选 择(如Malina A等,Genes Dev.2013年12月1日;27(23):2602-14所述);表观基因修饰,诸如 使用Cas和组蛋白修饰酶融合物(例如,如Rusk N,Nat Methods.2014年1月;11(1):28所述); 鉴定转录调控子(例如,如Waldrip ZJ,Epigenetics.2014年9月;9(9):1207-11所述);针对RNA 和DNA病毒的抗病毒处理(例如,如Price AA等,Proc Natl AcadSci U S A.2015年5月12 日;112(19):6164-9;Ramanan V等,Sci Rep.2015年1月2日;5:10833所述);改变基因组复杂 性,诸如染色体数目(例如,如Karimi-Ashtiyani R等,ProcNatl Acad Sci U S A.2015年9月 8日;112(36):11211-6;Anton T等,Nucleus.2014年3月至4月;5(2):163-72所述);自切割 CRISPR系统用于受控失活/激活(例如,如Sugano SS等,Plant Cell Physiol.2014年3 月;55(3):475-81所述);多路基因编辑(如Kabadi AM等,Nucleic Acids Res.2014年10月29 日;42(19):e147所述);开发药盒用于多路基因组编辑(如Xing HL等,BMC Plant Biol.2014年 11月29日;14:327所述);淀粉生产(如HebelstrupKH等,Front Plant Sci.2015年4月23 日;6:247所述);靶向某一家族或途径中的多个基因(例如,如Ma X等,Mol Plant.2015年8 月;8(8):1274-84所述);调控非编码基因和序列(例如,如Lowder LG等,Plant Physiol.2015 年10月;169(2):971-85所述);编辑树中的基因(例如,如Belhaj K等,Plant Methods.2013年 10月11日;9(1):39;Harrison MM等,GenesDev.2014年9月1日;28(17):1859-72;Zhou X 等,New Phytol.2015年10月;208(2):298-301所述);引入突变以抵抗宿主特异性病原体和害 虫。
可以使用所述组合物、系统和方法进行的植物和真菌修饰的其他示例包括国际专利公开 号WO2016/099887、WO2016/025131、WO2016/073433、WO2017/066175、WO2017/100158、 WO 2017/105991、WO2017/106414、WO2016/100272、WO2016/100571、WO 2016/100568、 WO 2016/100562和WO 2017/019867所述的那些。
在非人类动物中的应用
所述组合物、系统和方法可用于研究和修饰非人类动物,例如,引入所需的性状和疾病 恢复力、治疗疾病、促进生育等。在一些实施方案中,所述组合物、系统和方法可以用于改 进生育和引入所需的性状,例如,增加性状相关等位基因的频率、渗入来自其他品种/物种 的等位基因而没有连锁阻力,以及从头产生有利的等位基因。可以筛检和鉴定可以靶向的基 因和其他基因元件。应用和方法的示例包括以下所述的那些:Tait-Burkard C等,Livestock 2.0 -genome editing for fitter,healthier,and more productive farmedanimals.Genome Biol.2018年 11月26日;19(1):204;Lillico S,Agriculturalapplications of genome editing in farmed animals. Transgenic Res.2019年8月;28(增刊2):57-60;Houston RD等,Harnessing genomics to fast-track geneticimprovement in aquaculture.Nat Rev Genet.2020年4月16日.doi: 10.1038/s41576-020-0227-y,所述文献通过引用整体并入本文。其他部分所述的应用,诸如 治疗、诊断等,也可以用于本文的动物。
所述组合物、系统和方法可以用于诸如鱼、两栖动物、爬行动物、哺乳动物和鸟类等动 物。所述动物可以是农场和农业动物,或宠物。农场和农业动物的示例包括马、山羊、绵羊、 猪、牛、美洲驼、羊驼和鸟类,例如鸡、火鸡、鸭和鹅。所述动物可以是非人类灵长类动物, 例如狒狒、卷尾猴、黑猩猩、狐猴、猕猴、狨猴、绢毛猴、蜘蛛猴、松鼠猴和黑长尾猴。宠物的示例包括狗、猫、马、狼、兔子、雪貂、沙鼠、仓鼠、龙猫、花枝鼠、豚鼠、金丝雀、 长尾鹦鹉和鹦鹉。
在一些实施方案中,可以将一个或多个基因引入(例如,过度表达)于动物中以获得或增 强一种或多种所需性状。可以引入生长激素、胰岛素样生长因子(IGF-1)以增加动物,例如 猪或鲑鱼的生长(诸如Pursel VG等,J Reprod Fertil Suppl.1990;40:235-45;Waltz E,Nature. 2017;548:148所述)。可以引入Fat-1基因(例如,来自秀丽隐杆线虫),以便可以诱导产生更 大比率的n-3:n-6脂肪酸,例如在猪中(诸如Li M等,Genetics.2018;8:1747-54所述)。可以引 入植酸酶(例如,来自大肠杆菌)、木聚糖酶(例如,来自黑曲霉)、β-葡聚糖酶(例如,来自地 衣芽孢杆菌)以通过磷和氮释放减少来减小环境影响,例如在猪中(诸如Golovan SP等,Nat Biotechnol.2001;19:741-5;Zhang X等,elife.2018所述)。可以引入shRNA诱饵以诱导禽流 感恢复力,例如在鸡中(诸如Lyall等,Science.2011;331:223-6所述)。可以引入溶菌酶或溶葡 萄球菌素以诱导乳腺炎恢复力,例如在山羊和奶牛中(诸如Maga EA等,Foodborne Pathog Dis. 2006;3:384-92;Wall RJ等,NatBiotechnol.2005;23:445-51所述)。可以引入诸如HDAC6等 组蛋白脱乙酰酶以诱导PRRSV恢复力,例如在猪中(诸如Lu T.等,PLoS One. 2017;12:e0169317所述)。可以修饰(例如,失活或去除)CD163以便在猪中引入PRRSV恢复 力(诸如Prather RS等,Sci Rep.2017年10月17日;7(1):13371所述)。类似的方法可以用于抑 制或去除可能从动物感染给人类的病毒和细菌(例如,猪流感病毒(SIV)毒株,包括丙型流感 以及称为H1N1、H1N2、H2N1、H3N1、H3N2和H2N3的甲型流感亚型,以及肺炎、脑膜 炎和水肿)。
在一些实施方案中,可以针对疾病抗性和生产性状对一个或多个基因进行修饰或编辑。 可以修饰肌肉抑制素(例如,GDF8)以增加肌肉生长,例如,在奶牛、绵羊、山羊、鲶鱼和 猪中(如以下文献所述:Crispo M等,PLoS One.2015;10:e0136690;Wang X等,AnimGenet. 2018;49:43-51;Khalil K等,Sci Rep.2017;7:7301;Kang J-D等,RSC Adv.2017;7:12541-9)。 可以修饰Pc POLLED以诱导无角性,例如在奶牛中(诸如Carlson DF等,NatBiotechnol. 2016;34:479-81所述)。可以修饰KISS1R以诱导厌食(性成熟期间的激素释放导致不需要的 肉味),例如在猪中。可以修饰死端蛋白(dnd)以诱导不育,例如在鲑鱼中(诸如Wargelius A 等,Sci Rep.2016;6:21284所述)。可以修饰Nano2和DDX以诱导不育(例如,在替代宿主中), 例如在猪和鸡中(诸如Park K-E等,Sci Rep.2017;7:40176;Taylor L等,Development. 2017;144:928-34所述)。可以修饰CD163以诱导PRRSV抗性,例如在猪中(诸如Whitworth KM 等,Nat Biotechnol.2015;34:20-2所述)。可以修饰RELA以诱导ASFV恢复力,例如在猪中(诸 如Lillico SG等,Sci Rep.2016;6:21645所述)。可以修饰CD18以诱导曼海姆氏菌属(巴斯德 氏菌属)溶血恢复力,例如在奶牛中(诸如Shanthalingam S等,rocNatl Acad Sci U S A. 2016;113:13186-90所述)。可以修饰NRAMP1以诱导结核病恢复力,例如在奶牛中(诸如Gao Y等,Genome Biol.2017;18:13所述)。可以修饰或去除内源逆转录病毒基因以进行异种移植, 诸如Yang L等,Science.2015;350:1101-4;Niu D等,Science.2017;357:1303-7所述)。可以修 饰(例如失活)肌肉量负调控子(例如肌肉抑制素)以增加肌肉量,例如在狗中(如Zou Q等,J Mol Cell Biol.2015年12月;7(6):580-3所述)。
可以产生(例如,通过修饰RAG2)具有严重联合免疫缺陷(SCID)的动物,诸如猪,以提 供用于再生医学、异种移植(还在本文在别处讨论)和肿瘤发展的有用模型。方法和途径的示 例包括以下文献所述的那些:Lee K等,Proc Natl Acad Sci U S A.2014年5月20日;111(20):7260-5;和Schomberg等,FASEB Journal,2016年4月;30(1):Suppl 571.1。
可以修饰动物中的SNP。方法和途径的示例包括以下文献所述的那些:Tan W.等,Proc Natl Acad Sci U S A.2013年10月8日;110(41):16526-31;Mali P等,Science.2013年2月15 日;339(6121):823-6。
干细胞(例如诱导型多能干细胞)可以被修饰并分化成所需的后代细胞,例如,如Heo YT 等,Stem Cells Dev.2015年2月1日;24(3):393-402所述。
可以对动物进行概况分析(诸如Igenity),以筛检和鉴定与经济性状相关的遗传变异。可 以修饰遗传变异以引入或改善性状,诸如胴体组成、胴体质量、母体和生殖性状以及平均日 增益。
治疗用途和治疗方法
本文还提供了诊断、预后、治疗和/或预防受试者体内或受试者的疾病、状态或疾患的 方法。总体来说,所述诊断、预后、治疗和/或预防受试者中或受试者的疾病、状态或疾患 的方法可以包括使用本文所述的组合物、系统或其组分修饰受试者或其细胞中的多核苷酸, 和/或包括使用本文所述的组合物、系统或其组分检测受试者或其细胞中的疾病或健康多核 苷酸。在一些实施方案中,所述治疗或预防方法可以包括使用组合物、系统或其组分来修饰 受试者或其细胞内的感染性生物体(例如细菌或病毒)的多核苷酸。在一些实施方案中,所述 治疗或预防方法可以包括使用组合物、系统或其组分来修饰受试者内的感染性生物体或共生 生物体的多核苷酸。所述组合物、系统及其组分可用于开发疾病、状态或疾患模型。所述组 合物、系统及其组分可用于检测疾病状态或其修正,诸如通过本文所述的治疗或预防方法。 所述组合物、系统及其组分可用于筛检和选择可用作例如本文所述的治疗或预防的细胞。所 述组合物、系统及其组分可用于开发可用于修饰受试者或其细胞中的一种或多种生物功能或 活性的生物活性剂。
总体来说,所述方法可以包括通过合适的递送技术和/或组合物将组合物、系统和/或其 组分递送至受试者或其细胞,或者递送至感染性或共生生物体。一旦施用,所述组分就可以 如本文在别处所述那样操作以引发核酸修饰事件。在一些方面,所述核酸修饰事件可以在基 因组、表观基因组和/或转录组水平发生。可能发生DNA和/或RNA切割、基因激活和/或 基因失活。下文更详细地描述了其他特征、用途和优点。在这个概念的基础上,有若干种变 化适合引发基因组基因座事件,包括DNA切割、基因激活或基因失活。使用所提供的组合 物,本领域技术人员可以有利地且特异性地靶向具有相同或不同功能域的单个或多个基因座 以引发一个或多个基因组基因座事件。除了治疗和/或预防受试者的疾病以外,所述组合物 还可以用于在细胞文库中筛检和在体内功能建模的多种方法中(例如lincRNA的基因激活和 功能鉴定;功能获得建模;功能丧失建模;使用本发明组合物建立细胞系和转基因动物以用 于优化和筛检目的)。
本文在别处描述的组合物、系统及其组分可用于治疗和/或预防受试者的疾病,诸如遗 传和/或表观遗传疾病。本文在别处描述的组合物、系统及其组分可用于治疗和/或预防受试 者的遗传感染性疾病,诸如细菌感染、病毒感染、真菌感染、寄生虫感染及其组合。本文在 别处描述的组合物、系统及其组分可用于修饰受试者中微生物组的组成或概况,进而可以修 饰受试者的健康状况。本文所述的组合物、系统可以用于离体修饰细胞,然后可以将其施用 于受试者,由此修饰的细胞可以治疗或预防疾病或其症状。在某些情况下,这也称为过继疗 法。本文所述的组合物、系统可以用于治疗线粒体疾病,其中所述线粒体疾病病因涉及线粒 体DNA中的突变。
还提供了一种治疗受试者,例如有需要的受试者的方法,所述方法包括通过用编码所述 组合物、系统或复合物的一种或多种组分的多核苷酸或者本文所述的任何多核苷酸或载体转 化所述受试者并将它们施用于所述受试者来诱导基因编辑。还可以提供合适的修复模板,例 如通过包含所述修复模板的载体递送。本文中,所述修复模板可以是重组模板。还提供了一 种治疗受试者,例如有需要的受试者的方法,所述方法包括通过用本文所述的多核苷酸或载 体转化所述受试者来诱导多个靶基因座的转录激活或阻遏,其中所述多核苷酸或载体编码或 包含含有多个Cas效应子的组合物、系统、复合物或其组分的一种或多种组分。在离体,例 如在细胞培养物中进行任何治疗时,则应当理解术语‘受试者’可以替换为短语“细胞或细胞 培养物”。
还提供了一种治疗受试者,例如有需要的受试者的方法,所述方法包括通过用Cas效应 子转化所述受试者来诱导基因编辑,从而有利地在体内编码和表达所述组合物、系统的其余 部分(例如RNA、向导)。还可以提供合适的修复模板,例如通过包含所述修复模板的载体递 送。还提供了一种治疗受试者,例如有需要的受试者的方法,所述方法包括通过用Cas效应 子转化所述受试者,从而有利地在体内编码和表达所述组合物、系统的其余部分(例如RNA、 向导)来诱导转录激活或阻遏;有利地,在一些实施方案中,所述CRISPR酶是无催化活性 的Cas效应子并且包括一个或多个相关功能域。在离体,例如在细胞培养物中进行任何治疗 时,则应当理解术语‘受试者’可以替换为短语“细胞或细胞培养物”。
本文所述的组合物和系统的一种或多种组分可以包括在诸如药物组合物等组合物中,并 单独或共同施用于宿主。替代地,这些组分可以提供在单个组合物中以便施用于宿主。可以 通过技术人员已知的或本文所述的用于向宿主递送的病毒载体(例如慢病毒载体、腺病毒载 体、AAV载体)向宿主进行施用。如本文所解释,使用不同的选择标记物(例如用于慢病毒 gRNA选择)和gRNA浓度(例如取决于是否使用多个gRNA)可能有利于引发改善的效果。
因此,本文还描述了在受试者的真核或原核细胞或其组分(例如线粒体)、所述受试者的 感染性生物体和/或微生物组生物体中诱导一个或多个多核苷酸修饰的方法。所述修饰可以 包括在一个或多个细胞的多核苷酸的靶序列处引入、缺失或取代一个或多个核苷酸。所述修 饰可以在体外、离体或体内进行。
在一些实施方案中,所述治疗或抑制由真核生物体或非人类生物体中的基因组基因座中 的一个或多个突变引起的疾患或疾病的方法可以包括操纵有需要的受试者或非人类受试者 中的靶序列中的所述基因组基因座的编码、非编码或调控元件内的靶序列,包括通过操纵靶 序列来修饰受试者或非人类受试者,并且其中所述疾患或疾病对通过操纵靶序列进行的治疗 或抑制敏感,所述治疗或抑制包括提供治疗,包括递送包含上述实施方案中任一个的颗粒递 送系统或递送系统或病毒颗粒或上述实施方案中任一个的细胞的组合物。
本文还提供了上述实施方案中任一个的颗粒递送系统或递送系统或病毒颗粒或上述实 施方案中任一个的细胞在离体或体内基因或基因组编辑中或用于体外、离体或体内基因治疗 的用途。本文还提供了上述实施方案中任一个的颗粒递送系统、非病毒递送系统和/或病毒 颗粒或者上述实施方案中任一个的细胞,它们用于制造药物以用于体外、离体或体内基因或 基因组编辑,或者用于体外、离体或体内基因疗法,或者用于通过操纵与疾病相关的基因组 基因座中的靶序列来修饰生物体或非人类生物体的方法,或者用于治疗或抑制由真核生物体 或非人类生物体的基因组基因座中的一个或多个突变引起的疾患或疾病的方法。
在一些实施方案中,多核苷酸修饰可以包括在所述细胞的所述多核苷酸的每一个靶序列 处引入、缺失或取代1-75个核苷酸。所述修饰可以包括在每一个靶序列处引入、缺失或取 代至少1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。所述修饰可以包括在所述细胞的每一个 靶序列处引入、缺失或取代至少5、10、11、12、13、14、15、16、17、18、19、20、21、 22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。所述修饰可以包 括在所述细胞的每一个靶序列处引入、缺失或取代至少10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。 所述修饰可以包括在所述细胞的每一个靶序列处引入、缺失或取代至少20、21、22、23、 24、25、26、27、28、29、30、35、40、45、50或75个核苷酸。所述修饰可以包括在所述 细胞的每一个靶序列处引入、缺失或取代至少40、45、50、75、100、200、300、400或500 个核苷酸。所述修饰可以包括在所述细胞的每一个靶序列处引入、缺失或取代至少500、600、 700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、 2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、 4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、 6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、 7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、 9100、9200、9300、9400、9500、9600、9700、9800或9900至10000个核苷酸。
在一些实施方案中,所述修饰可以包括通过核酸组分(例如,向导RNA或sgRNA)在所 述细胞的每一个靶序列处引入、缺失或取代核苷酸,诸如由本文在别处所述的组合物、系统 或其组分介导的那些。在一些实施方案中,所述修饰可以包括通过组合物、系统或技术在所 述细胞的靶或随机序列处引入、缺失或取代核苷酸。
在一些实施方案中,所述组合物、系统或其组分可以促进非同源末端连接(NHEJ)。在 一些实施方案中,通过组合物、系统或其组分(诸如疾病多核苷酸)修饰多核苷酸可以包括 NHEJ。在一些实施方案中,通过所述组合物、系统或其组分促进此修复途径可用于靶向基 因或多核苷酸特异性敲除和/或敲入。在一些实施方案中,通过所述组合物、系统或其组分 促进此修复途径可用于产生NHEJ介导的插入缺失。核酸酶诱导的NHEJ还可以用于去除(例 如缺失)目标基因中的序列。一般来说,NHEJ通过将两端连接在一起来修复DNA中的双链 断裂;然而,一般来说,只有在两个相容的末端完全连接时原始序列才能恢复得跟它们由双 链断裂形成一样。双链断裂的DNA末端往往是酶促加工的对象,从而在一个或两个链添加 或去除核苷酸,随后再连接所述末端。这导致DNA序列中的NHEJ修复位点处存在插入和 /或缺失(插入缺失)突变。所述插入缺失的大小可以在1至50个或更多个碱基对的范围内。 在一些实施方案中,所述插入缺失可以是1、2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、 34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、 54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、 74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、 94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、 127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、 143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、 159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、 175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、 191、192、193、194、195、196、197、198、199、200、201、202、203、204、205、206、207、208、209、210、211、212、213、214、215、216、217、218、219、220、221、222、 223、224、225、226、227、228、229、230、231、232、233、234、235、236、237、238、 239、240、241、242、243、244、245、246、247、248、249、250、251、252、253、254、 255、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、 271、272、273、274、275、276、277、278、279、280、281、282、283、284、285、286、 287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、 303、304、305、306、307、308、309、310、311、312、313、314、315、316、317、318、 319、320、321、322、323、324、325、326、327、328、329、330、331、332、333、334、 335、336、337、338、339、340、341、342、343、344、345、346、347、348、349、350、 351、352、353、354、355、356、357、358、359、360、361、362、363、364、365、366、 367、368、369、370、371、372、373、374、375、376、377、378、379、380、381、382、 383、384、385、386、387、388、389、390、391、392、393、394、395、396、397、398、 399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、421、422、423、424、425、426、427、428、429、430、 431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、 447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、 463、464、465、466、467、468、469、470、471、472、473、474、475、476、477、478、 479、480、481、482、483、484、485、486、487、488、489、490、491、492、493、494、 495、496、497、498、499或500个碱基对或更多个。如果双股断裂靶向短靶序列附近,则 由NHEJ修复引起的缺失突变通常跨越并且因此去除不需要的核苷酸。对于较大DNA区段 的缺失,引入两个双链断裂(序列每一侧上一个)可以引起末端之间的NHEJ,并去除整个插 入序列。这两种方法都可以用来缺失特定DNA序列。
在一些实施方案中,组合物、系统介导的NHEJ可用于缺失小序列基序的方法中。在一 些实施方案中,组合物、系统介导的NHEJ可用于所述方法中以产生可以靶向所述基因的NHEJ介导的插入缺失,例如目标基因的编码区,例如早期编码区可用于敲除(即,消除表达)目标基因。举例来说,目标基因的早期编码区包括紧接在转录起始位点之后、在编码序列的第一外显子内或在距转录起始位点500bp内(例如,少于500、450、400、350、300、250、 200、150、100或50bp)的序列。在一个实施方案中,其中向导RNA和Cas效应子产生双 链断裂以诱导NHEJ介导的插入缺失,向导RNA可以经配置以便将一个双链断裂定位在紧 邻靶位置的核苷酸处。在一个实施方案中,所述切割位点可以在距靶位置0至500bp之间(例 如,距靶位置不到500、400、300、200、100、50、40、30、25、20、15、10、9、8、7、6、 5、4、3、2或1bp)。在一个实施方案中,其中与一个或多个Cas切口酶复合的两个向导RNA 诱导两个单链断裂以便诱导NHEJ介导的插入缺失,两个向导RNA可以经配置以定位两个 单链断裂,从而给靶位置的核苷酸提供NHEJ修复。
为了最小化毒性和脱靶效应,控制所递送的Cas mRNA和向导RNA的浓度可能非常重 要。通过在细胞或非人真核动物模型中测试不同的浓度并使用深度测序分析潜在脱靶基因组 基因座的修饰程度,可以确定Cas mRNA和向导RNA的最佳浓度。替代地,为了最小化毒 性和脱靶效应水平,Cas切口酶mRNA(例如具有D10A突变的酿脓链球菌Cas9)可以与靶向目标位点的一对向导RNA一起递送。用以最小化毒性和脱靶效应的向导序列和策略可以如国际专利公开号WO 2014/093622(PCT/US2013/074667);或者,通过突变。其他如本文在别处所述。
通常,在内源CRISPR或系统的情况下,CRISPR或复合物(包含与靶序列杂交并与一个 或多个Cas蛋白复合的向导序列)的形成引起对靶序列中或附近(例如相距1、2、3、4、5、6、 7、8、9、10、20、50个或更多个碱基对内)的一个或两个链的切割、切口和/或另一种修饰。在一些实施方案中,该tracr序列可以包含野生型tracr序列的全部或一部分(例如野生型tracr 序列的约或多于约20、26、32、45、48、54、63、67、85个或更多个核苷酸)或由其组成,还可以形成CRISPR复合物的一部分,诸如通过沿所述tracr序列的至少一部分与可操作地连接至向导序列的tracr配偶序列的全部或一部分杂交。
在一些实施方案中,修饰细胞中的靶多核苷酸以治疗或预防疾病的方法可以包括允许组 合物、系统或其组分结合所述靶多核苷酸,例如,以便所述组合物、系统能够对所述靶多核 苷酸实现切割、切口或其他修饰,从而修饰所述靶多核苷酸,其中所述组合物、系统或其组 分与向导序列复合,并且使所述向导序列与靶多核苷酸内的靶序列杂交,其中所述向导序列 任选地连接到tracr配偶序列,进而可以与tracr序列杂交。在这些实施方案中的一些实施方 案中,所述组合物、系统或其组分可以是或包括与向导序列复合的CRISPR-Cas效应子。在 一些实施方案中,修饰可以包括通过所述组合物、系统或其组分的一种或多种组分在所述靶 序列的所述位置对一个或两个链进行切割或切口。
能够通过所述组合物、系统进行的切割、切口或其他修饰可以修饰靶多核苷酸的转录。 在一些实施方案中,转录修饰可以包括减少靶多核苷酸的转录。在一些实施方案中,修饰可 以包括增加靶多核苷酸的转录。在一些实施方案中,所述方法包括通过与重组模板多核苷酸 同源重组来修复所述切割的靶多核苷酸,其中所述修复引起修饰,诸如但不限于所述靶多核 苷酸的一个或多个核苷酸的插入、缺失或取代。在一些实施方案中,所述修饰引起由包含靶 序列的基因表达的蛋白质中的一个或多个氨基酸变化。在一些实施方案中,由所述组合物、 系统或其组分赋予的修饰提供了可以修正疾病或其症状的转录物和/或蛋白质,包括但不限 于本文在别处更详细描述的那些中的任一者。
在一些实施方案中,所述治疗或预防疾病的方法可以包括将一种或多种载体或载体系统 递送至细胞,诸如真核或原核细胞,其中一种或多种载体或载体系统包括组合物、系统或其 组分。在一些实施方案中,所述载体或载体系统可以是病毒载体或载体系统,诸如AAV或 慢病毒载体系统,在本文在别处更详细地加以描述。在一些实施方案中,所述治疗或预防疾 病的方法可以包括递送一种或多种含有所述组合物、系统或其组分的病毒颗粒,诸如AAV 或慢病毒颗粒。在一些实施方案中,所述病毒颗粒具有组织特异性嗜性。在一些实施方案中, 所述病毒颗粒具有肝脏、肌肉、眼睛、心脏、胰腺、肾脏、神经元、上皮细胞、内皮细胞、 星形胶质细胞、神经胶质细胞、免疫细胞或红细胞特异性嗜性。
应当理解,如本文所述的根据本发明的组合物和系统,诸如用于如本文所述的根据本发 明的方法的组合物和系统,可以适当地用于组合物、系统的任何类型的已知应用,优选在真 核生物中。在某些方面,所述应用是治疗性的,优选在真核生物体,诸如包括但不限于动物 (包括人)、植物、藻类、真菌(包括酵母)等中为治疗性的。替代地或另外地,在某些方面, 所述应用可能涉及实现或诱导一种或多种特定性状或特性,诸如基因型和/或表型性状或特 性,同样如本文在别处所述。
治疗循环系统疾病
在一些实施方案中,本文所述的组合物、系统和/或其组分可用于治疗和/或预防循环系 统疾病。举例来说,提供了示例性疾病。在一些实施方案中,Wahlgren等(NucleicAcids Research,2012,第40卷,第17期e130)的血浆外来体可用于将本文所述的组合物、系统和/ 或其组分递送至血液。在一些实施方案中,所述循环系统疾病可以通过使用慢病毒递送本文 所述的组合物、系统以在体内或离体修饰造血干细胞(HSC)加以治疗(参见例如Drakopoulou, “Review Article,The Ongoing Challenge of Hematopoietic StemCell-Based Gene Therapy for β-Thalassemia,”Stem Cells International,第2011卷,论文编号987980,10页, doi:10.4061/2011/987980,鉴于本文的描述,其可以经调整以用于本文的组合物、系统)。在 一些实施方案中,所述循环系统病症可以通过使用本文的组合物、系统或其组分修正所述疾 病的HSC加以治疗,其中所述组合物、系统任选地包括合适的HDR修复模板(参见例如 Cavazzana,“Outcomes of Gene Therapy forβ-ThalassemiaMajor via Transplantation of Autologous Hematopoietic Stem Cells TransducedEx Vivo with a LentiviralβA-T87Q-Globin Vector.”;Cavazzana-Calvo,“Transfusionindependence and HMGA2 activation after gene therapy of humanβ-thalassaemia”,Nature 467,318-322(2010年9月16日) doi:10.1038/nature09328;Nienhuis,“Development of Gene Therapy for Thalassemia,Cold Spring Harbor Perspectivesin Medicine,doi:10.1101/cshperspect.a011833(2012),LentiGlobin BB305, alentiviral vector containing an engineeredβ-globin gene(βA-T87Q);以及Xie等,“Seamless gene correction ofβ-thalassaemia mutations in patient-specificiPSCs using CRISPR/Cas9 and piggyback”Genome Research gr.173427.114(2014)www.genome.org/cgi/doi/10.1101/gr.173427.114(Cold Spring Harbor LaboratoryPress;Watts, “Hematopoietic Stem Cell Expansion and Gene Therapy”Cytotherapy13(10):1164-1171. doi:10.3109/14653249.2011.620748(2011),鉴于本文的描述,其可以经调整以用于本文的组 合物、系统)。在一些实施方案中,可以使用本文所述的组合物、系统来修饰iPSC,以修正 与循环系统疾病相关的疾病多核苷酸。关于这一点,鉴于本文的描述,Xu等人(Sci Rep.2015 年7月9日;5:12065.doi:10.1038/srep12065)和Song等人(Stem Cells Dev.2015年5月1 日;24(9):1053-65.doi:10.1089/scd.2014.0347.2015年2月5日电子发表)关于修饰iPSC的教 导可以经调整以用于本文所述的组合物、系统。
术语“造血干细胞”或“HSC”泛指被视为HSC的那些细胞,例如产生所有其他血细胞并 来源于中胚层的血细胞;位于大部分骨骼核心中所含有的红色骨髓中。本发明的HSC包括 具有造血干细胞表型的细胞,通过小尺寸、缺乏谱系(lin)标记物和属于分化系列簇如:CD34、 CD38、CD90、CD133、CD105、CD45以及干细胞因子受体c-kit的标记物来鉴定。造血干细胞对用于检测谱系定型的标记物呈阴性,并且因此称为Lin-;而且,在它们通过FACS进行纯化期间,多达14种不同的成熟血系标记物,例如,对于人类,就骨髓而言CD13和CD33、就红细胞而言CD71、就B细胞而言CD19、就巨核细胞而言CD61等;以及就B细胞而言 B220(鼠CD45)、就单核细胞而言Mac-1(CD11b/CD18)、就粒细胞而言Gr-1、就红细胞而 言Ter119、就T细胞而言Il7Ra、CD3、CD4、CD5、CD8等。小鼠HSC标记物:CD34lo/-、 SCA-1+、Thy1.1+/lo、CD38+、C-kit+、lin-,以及人HSC标记物:CD34+、CD59+、Thy1/CD90+、 CD38lo/-、C-kit/CD117+和lin-。通过标记物鉴定HSC。因此,在本文讨论的实施方案中, HSC可以是CD34+细胞。HSC还可以是CD34-/CD38-造血干细胞。细胞表面上可能缺乏c-kit 且在本领域中被视为HSC的干细胞在本发明的范围内,以及CD133+细胞在本领域中同样 被视为HSC。
在一些实施方案中,用于治疗循环系统或血液疾病的治疗或预防可以包括用本文所述的 任何修饰来修饰人脐带血细胞。在一些实施方案中,用于治疗循环系统或血液疾病的治疗或 预防可以包括用本文所述的任何修饰来修饰粒细胞集落刺激因子动员的外周血细胞(mPB)。 在一些实施方案中,所述人脐带血细胞或mPB可以是CD34+。在一些实施方案中,所述修 饰的脐带血细胞或mPB细胞可以是自体的。在一些实施方案中,所述脐带血细胞或mPB细 胞可以是同种异体的。除了对疾病基因进行修饰以外,同种异体细胞还可以使用本文所述的 组合物、系统进一步修饰以降低细胞在递送至受体时的免疫原性。此类技术描述于本文其他 部分以及例如Cartier,“MINI-SYMPOSIUM:X-LinkedAdrenoleukodystrophypa, Hematopoietic Stem Cell Transplantation andHematopoietic Stem Cell Gene Therapy in X-Linked Adrenoleukodystrophy,”BrainPathology 20(2010)857-862,其可以经调整以用于本 文的组合物、系统。所述修饰的脐带血细胞或mPB细胞可以任选地在体外扩增。可以使用 任何合适的递送技术将修饰的脐带血细胞或mPB细胞递送至有需要的受试者。
所述CRISPR-Cas系统可以经过工程改造以靶向HSC中的一个或多个基因座。在一些 实施方案中,所述Cas效应子可以针对真核细胞,尤其是哺乳动物细胞,例如人类细胞,例 如HSC或iPSC进行密码子优化,并且可以制备靶向HSC,诸如循环系统疾病中的一个或多个基因座的sgRNA。这些可以通过颗粒递送。所述颗粒可以通过Cas效应蛋白和混合的gRNA形成。所述gRNA和Cas效应蛋白混合物可以例如与包含表面活性剂、磷脂、生物可 降解聚合物、脂蛋白和醇或者基本上由其组成或由其组成的混合物混合,由此可以形成含有gRNA和Cas效应蛋白的颗粒。本发明包括这样制造颗粒和由这种方法制成的颗粒及其用途。本文在别处更详细地描述了在血液或循环系统或HSC递送至血液或循环系统的情况下适合递送CRISRP-Cas系统的颗粒。
在一些实施方案中,在离体修饰后,所述HSC或iPCS可以在施用于受试者之前进行扩 增。HSC扩增可以通过任何合适的方法进行,诸如通过以下文献所述的方法:Lee,“Improved ex vivo expansion of adult hematopoietic stem cells by overcomingCUL4-mediated degradation of HOXB4.”Blood.2013年5月16日;121(20):4082-9.doi:10.1182/blood-2012-09-455204. 2013年3月21日电子发表。
在一些实施方案中,所述修饰的HSC或iPSC可以是自体的。在一些实施方案中,所述 HSC或iPSC可以是同种异体的。除了对疾病基因进行修饰以外,同种异体细胞还可以使用 本文所述的组合物、系统进一步修饰以降低细胞在递送至受体时的免疫原性。此类技术描述 于本文其他部分以及例如Cartier,“MINI-SYMPOSIUM:X-LinkedAdrenoleukodystrophypa, Hematopoietic Stem Cell Transplantation andHematopoietic Stem Cell Gene Therapy in X-Linked Adrenoleukodystrophy,”BrainPathology 20(2010)857-862,其可以经调整以用于本 文的组合物、系统。
治疗神经学疾病
在一些实施方案中,本文所述的组合物、系统可用于治疗脑和CNS疾病。针对针对脑 的递送选项包括将CRISPR酶和向导RNA以DNA或RNA形式封装到脂质体中并与分子特 洛伊木马缀合以进行跨血脑屏障(BBB)递送。分子特洛伊木马已被证明可有效地将B-gal表达载体递送到非人灵长类动物的脑中。相同的方法可用于递送含有CRISPR酶和向导RNA 的载体。举例来说,Xia CF和Boado RJ,Pardridge WM(“Antibody-mediated targeting ofsiRNA via the human insulin receptor using avidin-biotin technology.”MolPharm.2009年5月至6 月;6(3):747-51.doi:10.1021/mp800194)描述了在组合使用受体特异性单克隆抗体(mAb)和亲 和素-生物素技术的情况下可能如何将短干扰RNA(siRNA)递送至培养物中和体内的细胞。 作者们还报告了由于在靶向mAb和siRNA之间的键在亲和素-生物素技术下是稳定的,而 且在静脉内施用靶向性siRNA后在体内观测到诸如脑等远端位点处的RNAi效应,所以其 教导可以经调整以用于本文的组合物、系统。在其他实施方案中,可以产生用于CNS和/ 或脑递送的人工病毒。参见例如Zhang等(Mol Ther.2003年1月;7(1):11-8.)),其教导可以经 调整以用于本文的组合物、系统。
治疗听力疾病
在一些实施方案中,本文所述的组合物和系统可用于治疗一只耳朵或两只耳朵的听力疾 病或听力损失。耳聋通常由丧失或受损的毛细胞无法将信号中继至听觉神经元而引起。在这 种情况下,可以使用耳蜗植入物来响应声音并将电信号传输至神经细胞。但这些神经元经常 退化并且从耳蜗缩回,因为受损的毛细胞释放较少的生长因子。
在一些实施方案中,可以通过任何合适的方法或技术将组合物、系统或修饰的细胞递送 至一只耳朵或两只耳朵以治疗或预防听力疾病或听力丧失。合适的方法和技术包括但不限于 美国专利公开号20120328580中所述的那些,描述了例如使用注射器,例如单剂量注射器将 药物组合物注入耳朵中(例如经耳施用),例如注入耳蜗腔(例如,中阶、前庭阶和鼓阶)。举 例来说,本文所述的一种或多种化合物可以通过鼓室内注射(例如,注入中耳)和/或注入外耳、 中耳和/或内耳来施用;通过导管或泵原位施用(参见例如McKenna等,(美国专利公开号 2006/0030837)和Jacobsen等,(美国专利号7,206,639);与机械装置组合施用,诸如作为耳蜗 植入物或佩戴在外耳中的助听器(参见例如美国专利公开号2007/0093878,其提供了适用于 将本文所述的组合物、系统递送至耳朵的示例性耳蜗植入物)。此类方法在本领域中常规用 于例如将类固醇和抗生素施用到人耳中。举例来说,可以通过耳朵的圆窗或通过耳蜗囊进行 注射。其他内耳施用方法在本领域是已知的(参见例如Salt和Plontke,Drug Discovery Today, 10:1299-1306,2005)。在一些实施方案中,可以在外科手术过程中将导管或泵定位在例如患 者的耳朵(例如,外耳、中耳和/或内耳)中。在一些实施方案中,可以在无需外科手术的情况 下将导管或泵定位在例如患者的耳朵(例如,外耳、中耳和/或内耳)中。
一般来说,美国专利公开号20120328580中所述的细胞治疗方法可用于在体外促进细胞 完全或部分分化为或朝向内耳成熟细胞类型(例如,毛细胞)。然后可以将由此类方法产生的 细胞移植或植入需要这种治疗的患者体内。实施这些方法所需的细胞培养方法,包括鉴定和 选择合适的细胞类型的方法、促进所选细胞完全或部分分化的方法、鉴定完全或部分分化的 细胞类型的方法、以及植入完全或部分分化的细胞的方法如下所述。
适用于本发明的细胞包括但不限于例如当在体外与本文所述的一种或多种化合物接触 时能够完全或部分分化成内耳成熟细胞,例如毛细胞(例如,内毛细胞和/或外毛细胞)的细胞。 能够分化成毛细胞的示例性细胞包括但不限于干细胞(例如,内耳干细胞、成体干细胞、骨 髓衍生干细胞、胚胎干细胞、间充质干细胞、皮肤干细胞、iPS细胞和脂肪衍生干细胞)、祖 细胞(例如,内耳祖细胞)、支持细胞(例如,代特氏细胞、柱状细胞、内指细胞、顶盖细胞和 汉森细胞)和/或生殖细胞。Li等(美国专利公开号2005/0287127)和Li等人(美国专利申请号 11/953,797)中描述了使用干细胞替代内耳感觉细胞。使用骨髓衍生干细胞替代内耳感觉细胞 描述于Edge等,PCT/US2007/084654中。iPS细胞描述于以下文献中:Takahashi等,Cell,第 131卷,第5期,第861-872页(2007);Takahashi和Yamanaka,Cell126,663-76(2006);Okita 等,Nature 448,260-262(2007);Yu,J.等,Science 318(5858):1917-1920(2007);Nakagawa等, Nat.Biotechnol.26:101-106(2008);以及Zaehres和Scholer,Cell 131(5):834-835(2007)。可以 通过分析(例如,定性或定量)一个或多个组织特异性基因的存在来鉴定此类合适的细胞。举 例来说,可以通过检测一个或多个组织特异性基因的蛋白质产物来检测基因表达。蛋白质检 测技术涉及使用针对适当抗原的抗体对蛋白质进行染色(例如,使用细胞提取物或完整细 胞)。在这种情况下,适当的抗原是组织特异性基因表达的蛋白质产物。尽管原则上可以标 记一抗(即,结合抗原的抗体),但更常见(并改善可视化)使用针对一抗的二抗(例如抗IgG)。 该二抗与荧光染料或用于比色反应的适当酶、或金珠(用于电子显微镜检)或与生物素-亲和素 系统缀合,以便识别一抗的位置,从而识别抗原。
所述组合物和系统可以通过将药物组合物直接施用于外耳而递送至耳朵,其中组合物根 据美国专利公开号20110142917加以修饰。在一些实施方案中,所述药物组合物施用于耳道。 递送到耳朵也可以称为听觉或经耳递送。
在一些实施方案中,所述组合物、系统或其组分和/或载体或载体系统可以通过可应用 于本发明的核酸靶向系统的新颖蛋白质递送技术(参见例如Qi等,Gene Therapy(2013),1-9) 通过经完整圆窗转染至内耳而递送至耳朵。可以考虑约40μl 10mM RNA作为用于耳部施 用的剂量。
根据Rejali等(Hear Res.2007年6月;228(1-2):180-7),耳蜗植入物功能可以通过良好保 存螺旋神经节神经元加以改善,所述螺旋神经节神经元是通过所述植入物和脑源性神经营养 因子(BDNF)进行电刺激的靶标,之前已证明可以提高实验性致聋耳朵的螺旋神经节存活率。 Rejali等测试了耳蜗植入物电极的改进设计,所述耳蜗植入物电极包括由具有BDNF基因插 入物的病毒载体转导的成纤维细胞涂层。为了实现这类型的离体基因转移,Rejali等用具有 BDNF基因盒插入物的腺病毒转导豚鼠成纤维细胞,并确定这些细胞分泌BDNF,然后通过 琼脂糖凝胶将BDNF分泌细胞连接至耳蜗植入物电极,并将电极植入鼓阶中。Rejali等确定 了与对照电极相比,在植入48天之后,BDNF表达电极能够在耳蜗基底匝中保留显著更多 的螺旋神经节神经元,并证明了耳蜗植入物疗法与离体基因转移组合用于增强螺旋神经节神 经元存活率的可行性。这样的系统可以应用于本发明的核酸靶向系统以递送到耳朵。
在一些实施方案中,Mukherjea等(Antioxidants&Redox Signaling,第13卷,第5期,2010) 所述的系统可以经调整以用于将组合物、系统或其组分经鼓室施用至耳朵。在一些实施方案 中,约2mg至约4mg CRISPR Cas的剂量用于施用于人类。
在一些实施方案中,[Jung等(Molecular Therapy,第21卷,第4期,834-841,2013年4 月)中所述的系统可以经调整以用于经前庭上皮递送所述组合物、系统或其组分至耳朵。在 一些实施方案中,约1至约30mg CRISPR Cas的剂量用于施用于人类。
治疗非分裂细胞中的疾病
在一些实施方案中,欲修正的基因或转录物在非分裂细胞中。示例性非分裂细胞是肌肉 细胞或神经元。非分裂(尤其是非分裂、完全分化)细胞类型存在基因靶向或基因组工程改造 问题,例如因为同源重组(HR)在G1细胞周期阶段往往受抑制。然而,在研究细胞控制正常 DNA修复系统的机制时,Durocher发现了一个以前未知的开关,它使非分裂细胞中的HR“关 闭”,并设计了一种策略来重新打开这个开关。Orthwein等(加拿大渥太华西奈山医院的Daniel Durocher实验室)最近报告(Nature 16142,2015年12月9日在线发表)已经证明了可以解除 HR抑制并且在肾脏(293T)和骨肉瘤(U2OS)细胞中成功进行了基因靶向。已知肿瘤抑制因子 BRCA1、PALB2和BRAC2通过HR促进DNA DSB修复。他们发现BRCA1与PALB2-BRAC2 复合物的形成受PALB2上的泛素位点控制,因此通过E3泛素连接酶作用于所述位点。这 种E3泛素连接酶由KEAP1(PALB2相互作用蛋白)与清选蛋白3(CUL3)-RBX1的复合物组 成。PALB2泛素化抑制其与BRCA1的相互作用,并且被去泛素化酶USP11抵消,后者本身在细胞周期控制之下。恢复BRCA1-PALB2相互作用与激活DNA末端切除足以诱导G1 期同源重组,如通过多种方法所测量,包括针对USP11或KEAP1的基于CRISPR-Cas的基 因靶向测定法(由pX459载体表达)。然而,当使用KEAP1消耗或PALB2-KR突变体表达在 可切除G1细胞中恢复BRCA1-PALB2相互作用时,检测到基因靶向事件的强劲增加。这些 教导可以经调整以用于和/或应用于本文所述的Cas组合物、系统。
因此,在一些实施方案中,再激活细胞中的HR,尤其优选非分裂完全分化的细胞类型。 在一些实施方案中,在一些实施方案中优选促进BRCA1-PALB2相互作用。在一些实施方案中,所述靶细胞是非分裂细胞。在一些实施方案中,所述靶细胞是神经元或肌肉细胞。在一些实施方案中,在体内靶向所述靶细胞。在一些实施方案中,所述细胞处于G1期并且 HR受到抑制。在一些实施方案中,优选使用KEAP1消耗,例如抑制KEAP1活性的表达。 KEAP1消耗可以通过siRNA来实现,例如Orthwein等所示。替代地,优选表达PALB2-KR 突变体(在BRCA1相互作用结构域中缺乏所有八个Lys残基,与KEAP1消耗组合或单独。 PALB2-KR与BRCA1相互作用,与细胞周期位置无关。因此,在一些实施方案中优选促进 或恢复BRCA1-PALB2相互作用,尤其在G1细胞中,尤其在靶细胞为非分裂的或在取出和 送回(离体基因靶向)有问题的情况下,例如神经元或肌肉细胞。KEAP1 siRNA可得自 ThermoFischer。在一些实施方案中,可以将BRCA1-PALB2复合物递送至G1细胞。在一些 实施方案中,可以例如通过增加去泛素化酶USP11的表达来促进PALB2去泛素化,因此设 想可以提供构建体来促进或上调去泛素化酶USP11的表达或活性。
治疗眼部疾病
在一些实施方案中,欲治疗的疾病是影响眼睛的疾病。因此,在一些实施方案中,将本 文所述的组合物、系统或其组分递送至一只眼睛或两只眼睛。
所述组合物、系统可用于修正由若干个基因突变引起的眼部缺陷,所述眼部缺陷进一步 描述于Genetic Diseases of the Eye,第二版,Elias I.Traboulsi编,OxfordUniversity Press,2012 中。
在一些实施方案中,欲治疗或靶向的疾患是眼部病症。在一些实施方案中,所述眼部病 症可以包括青光眼。在一些实施方案中,所述眼部疾病包括视网膜变性疾病。在一些实施方 案中,所述视网膜变性疾病选自斯特格氏病(Stargardt disease)、巴-比二氏综合征(Bardet-Biedl Syndrome)、贝斯特病(Best disease)、蓝锥单色性、脉络膜症、锥杆营养不良、先天性静止性 夜盲症、增强S锥体综合征、青少年X连锁视网膜劈裂症、莱伯氏先天性黑蒙(Leber Congenital Amaurosis)、家族性显性玻璃膜疣、诺里病(Norrie Disease)或X连锁家族性渗出 性玻璃体视网膜病变、模式营养不良、索斯比营养不良(SorsbyDystrophy)、尤塞氏综合征 (Usher Syndrome)、色素性视网膜炎、色盲或黄斑营养不良或变性、色素性视网膜炎、色盲 以及年龄相关性黄斑变性。在一些实施方案中,所述视网膜变性疾病是莱伯氏先天性黑蒙 (LCA)或色素性视网膜炎。本文在别处更详细描述了其他示例性眼病。
在一些实施方案中,将所述组合物、系统递送至眼睛,任选地通过玻璃体内注射或视网 膜下注射。可以借助手术显微镜进行眼内注射。对于视网膜下和玻璃体内注射,可以通过轻 柔指压使眼睛脱垂,并使用由用玻璃显微镜载玻片盖玻片上覆盖的角膜上的一滴耦合介质溶 液组成的接触式透镜系统观察眼底。对于视网膜下注射,安装在5μl Hamilton注射器上的10mm 34号针头的尖端可以在直接观察下通过上赤道巩膜切线朝后极推进,直到视网膜下 空间可见针的孔口。然后,可以注射2μl载体悬浮液以产生上层大疱性视网膜脱离,从而确 认视网膜下载体施用。这种方法创造了自密封巩膜切开术,允许载体悬浮液保留在视网膜下 空间中,直到它被RPE吸收,通常在手术48小时内。可以在下半球中重复这个手术以产生 下视网膜脱离。这种技术导致大约70%神经感觉视网膜和RPE暴露于载体悬浮液。对于玻 璃体内注射,针尖可以通过巩膜推进到角膜巩膜缘后1mm处,并将2μl载体悬浮液注入玻 璃体腔中。对于前房内注射,针尖可以通过角膜巩膜缘穿刺术推进,指向中央角膜,并且可 以注射2μl载体悬浮液。对于前房内注射,针尖可以通过角膜巩膜缘穿刺术推进,指向中央 角膜,并且可以注射2μl载体悬浮液。这些载体可以以1.0-1.4×1010或1.0-1.4×109个转导单 位(TU)/ml的滴度注射。
在一些实施方案中,慢病毒载体用于向眼睛施用。在一些实施方案中,所述慢病毒载体 是马感染性贫血病毒(EIAV)载体。用于眼部递送的示例性EIAV载体描述于以下文献中: Balagaan,J Gene Med 2006;8:275-285,2005年11月21日在线发表于WileyInterScience (www.interscience.wiley.com).DOI:10.1002/jgm.845;Binley等,HUMANGENE THERAPY 23:980-991(2012年9月),其可以经调整以用于本文所述的组合物、系统。在一些实施方案 中,剂量可以是1.1×105个转导单位/眼睛(TU/眼睛),总体积为100μl。
其他病毒载体也可用于向眼睛递送,诸如AAV载体,诸如以下文献中所述的那些:Campochiaro等,Human Gene Therapy 17:167-176(2006年2月);Millington-Ward等(Molecular Therapy,第19卷,第4期,642-649 2011年4月;Dalkara等(Sci Transl Med 5,189ra76(2013)), 其可以经调整以用于本文所述的组合物、系统。在一些实施方案中,所述剂量可以在约106至109.5个颗粒单位的范围内。在Millington-Ward AAV载体的情况下,可以施用约2×1011至约6×1013个病毒颗粒的剂量。在Dalkara载体的情况下,向人施用约1×1015至约1×1016 vg/ml的剂量。
在一些实施方案中,RXi Pharmaceuticals的sd-
Figure BDA0003651481360004411
系统可以用于/和或经调整以用 于向眼睛递送组合物、系统。在此系统中,单次玻璃体内施用3μg sd-rxRNA引起PPIB mRNA 水平序列特异性降低14天。考虑向人施用约3至20mg CRISPR的剂量,sd-
Figure BDA0003651481360004412
系统 可以应用于本发明的核酸靶向系统。
在其他实施方案中,美国专利公开号20130183282的方法也可以修改为本发明的核酸靶 向系统,所述方法涉及从人视紫红质基因切割靶序列的方法。
在其他实施方案中,可以使用或修改美国专利公开号20130202678的治疗视网膜病和威 胁视力的眼科病症的方法,所述方法涉及向眼中的视网膜下或玻璃体内空间递送Puf-A基因 (其表达于视网膜神经节和眼组织的色素细胞中并显示独特的抗凋亡活性)。具体来说,期望 的靶标是zgc:193933、prdm1a、spata2、tex10、rbb4、ddx3、zp2.2、Blimp-1和HtrA2,全 部都可以通过本发明的组合物、系统加以靶向。
Wu(Cell Stem Cell,13:659-62,2013)设计了一种向导RNA,该向导RNA导致Cas9发生 单碱基对突变,由此导致小鼠白内障,其中它诱导DNA切割。然后使用给予受精卵修复机 制的其他野生型等位基因或寡核苷酸修正了断裂等位基因的序列并修正了突变小鼠中引起 白内障的遗传缺陷。这种方法可能适合于和/或应用于本文所述的组合物、系统。
美国专利公开号20120159653描述了使用锌指核酸酶对与黄斑变性(MD)相关的细胞、 动物和蛋白质进行遗传修饰,其教导可应用于和/或经调整以用于本文所述的组合物、系统。
美国专利公开号20120159653的一个方面涉及对编码与MD相关的蛋白质的任何染色 体序列的编辑,其可应用于本发明的核酸靶向系统。
治疗肌肉疾病和心血管疾病
在一些实施方案中,本文所述的组合物、系统可以用于治疗和/或预防肌肉疾病和相关 循环或心血管疾病或病症。本发明还设想向心脏递送本文所述的组合物、系统,例如Cas 效应蛋白系统。就心脏而言,优选嗜心肌腺相关病毒(AAVM),特别是在心脏中表现出优先 基因转移的AAVM41(参见例如Lin-Yanga等,PNAS,2009年3月10日,第106卷,第10 期)。施用可以是全身或局部的。设想约1-10×1014个载体基因组的剂量用于全身施用。另见 例如Eulalio等,(2012)Nature 492:376和Somasuntharam等,(2013)Biomaterials 34:7790,所 述文献的教导可以经调整以用于和/或应用于本文所述的组合物、系统。
举例来说,美国专利公开号20110023139(其教导可以经调整以用于和/或应用于本文所 述的组合物、系统)描述了使用锌指核酸酶对与心血管疾病相关的细胞、动物和蛋白质进行 基因修饰。心血管疾病通常包括高血压、心脏病发作、心力衰竭、中风和TIA。心血管疾病 涉及的任何染色体序列或由心血管疾病涉及的任何染色体序列编码的蛋白质都可以用于本 公开所述的方法。通常基于心血管相关蛋白与心血管疾病发展的实验关联来选择心血管相关 蛋白。举例来说,相对于没有心血管病症的人群,在患有心血管病症的人群中,心血管相关 蛋白的生产率或循环浓度可能升高或降低。可以使用蛋白质组学技术评价蛋白质水平的差 异,包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)和质谱。替 代地,心血管相关蛋白可以通过使用基因组技术获得编码蛋白质的基因的基因表达谱来鉴 定,所述基因组技术包括但不限于DNA微阵列分析、基因表达序列分析(SAGE)和定量实时 聚合酶链式反应(Q-PCR)。
本文的组合物、系统可用于治疗肌肉系统疾病。本发明还设想向肌肉递送本文所述的组 合物、系统、效应蛋白系统。
在一些实施方案中,欲治疗的肌肉疾病是肌肉营养不良,诸如DMD。在一些实施方案 中,本文所述的组合物、系统(诸如能够进行RNA修饰的系统)可以用于实现外显子跳跃以 实现患病基因的修正。如本文所用,术语“外显子跳跃”是指通过用一个或多个互补反义寡核 苷酸(AON)靶向前mRNA内的剪接供体和/或受体位点来修饰前mRNA剪接。通过阻止剪接 体接近一个或多个剪接供体或受体位点,AON可以阻止剪接反应,从而导致一个或多个外 显子从完全加工的mRNA中缺失。在前mRNA的成熟过程中,可以在细胞核中实现外显子跳跃。在一些实施例中,外显子跳跃可以包括通过使用本文所述的能够进行RNA修饰的组合物、系统来掩蔽参与所靶向的外显子的剪接的关键序列。在一些实施方案中,可以在肌营养不良蛋白mRNA中实现外显子跳跃。在一些实施方案中,所述组合物、系统可以在肌营 养不良蛋白mRNA的外显子1、2、3、4、5、6、7、8、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、45、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、 58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、 78、79或其任何组合处诱导外显子跳跃。在一些实施方案中,所述组合物、系统可以在肌 营养不良蛋白mRNA的外显子43、44、50、51、52、55或其任何组合处诱导外显子跳跃。 这些外显子中的突变还可以使用非外显子跳跃多核苷酸修饰方法进行修正。
在一些实施方案中,为了治疗肌肉疾病,可以将Bortolanza等,MolecularTherapy第19 卷,第11期,2055-2064,2011年11月)的方法应用于表达CRISPR Cas的AAV并以约2×1015或2×1016vg载体的剂量注射到人体中。Bortolanza等的教导可以经调整以用于和/或应用于 本文所述的组合物、系统。
在一些实施方案中,可以将Dumonceaux等(Molecular Therapy第18卷,第5期,881-887, 2010年5月)的方法应用于表达CRISPR Cas的AAV并注射到人体中,例如,以约1014至约 1015vg载体的剂量。本文所述的Dumonceaux的教导可以经调整以用于和/或应用于本文所 述的组合物、系统。
在一些实施方案中,可以将Kinouchi等(Gene Therapy(2008)15,1126-1130)的方法应用 于本文所述的CRISPR Cas系统并注射到人体中,例如,以约500至1000ml的剂量将40μM 溶液注射到肌肉中。
在一些实施方案中,Hagstrom等(Molecular Therapy第10卷,第2期,2004年8月)的方 法可以经调整以用于和/或应用于本文的组合物、系统,并以约15至约50mg的剂量注射到 人的大隐静脉中。
在一些实施方案中,所述方法包括治疗镰状细胞相关疾病,例如镰状细胞性状、镰状细 胞疾病诸如镰状细胞性贫血、β-地中海贫血。举例来说,所述方法和系统可用于修饰镰状细 胞的基因组,例如,通过修正β-球蛋白基因的一个或多个突变。在β-地中海贫血的情况下, 镰状细胞性贫血可以通过用所述系统修饰HSC来修正。所述系统允许通过切割其DNA然 后让它自我修复对细胞基因组进行特定编辑。插入Cas蛋白并通过RNA向导引导至突变点, 然后它在该点切割DNA。同时,插入健康型式的序列。细胞自身的修复系统使用此序列来 修复诱导的切割。通过这种方式,所述CRISPR-Cas允许修正之前获得的干细胞中的突变。 所述方法和系统可以用于使用靶向和修正突变的系统(例如,用合适的HDR模板,该模板递 送β-球蛋白,有利地非镰状β-球蛋白的编码序列)来修正镰状细胞性贫血的HSC;具体来说, 向导RNA可以靶向引起镰状细胞性贫血的突变,而所述HDR可以提供编码以便正确表达β- 球蛋白。靶向含有突变和Cas蛋白的颗粒的向导RNA与携带突变的HSC接触。所述颗粒还 可以含有合适的HDR模板来修正突变以便正确表达β-球蛋白;或者所述HSC可以与含有或递送HDR模板的第二颗粒或载体接触。可以施用如此接触过的细胞;并任选地处理/扩增;参见Cartier。所述HDR模板可以使所述HSC表达工程改造的β-球蛋白基因(例如,βA-T87Q)或β-球蛋白。
治疗肝脏和肾脏疾病
在一些实施方案中,本文所述的组合物、系统和/或其组分可以用于治疗肾脏或肝脏疾 病。因此,在一些实施方案中,本文所述的CRISRP-Cas系统或其组分递送至肝脏或肾脏。
诱导细胞摄取治疗性核酸的递送策略包括物理力或载体系统,诸如基于病毒、脂质或复 合物的递送,或纳米载体。根据不太可能临床相关的初步应用,当核酸通过全身流体动力学 高压注射定址到肾细胞时,已经应用了多种基因治疗病毒和非病毒载体来靶向不同的体内动 物肾脏疾病模型中的转录后事件(Csaba Révész和Péter Hamar(2011).Delivery Methods to Target RNAs in the Kidney,Gene Therapy Applications,Prof.Chunsheng Kang(编),ISBN: 978-953-307-541-9,InTech,可得自:www.intechopen.com/books/gene-therapy-applications/delivery-methods-to-target-rnas-inthe-kidn ey)。肾脏的递送方法可能包括Yuan等(Am J Physiol RenalPhysiol 295:F605-F617,2008)的那 些。Yuang等的方法可以应用于本发明的CRISPR Cas系统,设想将1-2g与胆固醇缀合的 CRISPR Cas皮下注射给人类以递送至肾脏。在一些实施方案中,Molitoris等(J Am Soc Nephrol 20:1754-1764,2009)的方法可能适合于本发明的CRISRP-Cas系统,并且可以使用 12-20mg/kg人类累积剂量递送至肾脏的近端小管细胞。在一些实施方案中,Thompson等 (Nucleic Acid Therapeutics,第22卷,第4期,2012)的方法可能适合于本发明的CRISRP-Cas 系统,并且可以通过静脉内施用递送高达25mg/kg的剂量。在一些实施方案中,Shimizu等 (J Am Soc Nephrol 21:622-633,2010)的方法可能适合于本发明的CRISRP-Cas系统,并且可 以使用约10-20μmol与纳米载体复合的CRISPR Cas在约1-2升生理流体中的剂量进行腹膜 内施用。
其他各种递送载体可以用于将组合物、系统递送至肾脏,诸如病毒、流体动力学、脂质、 聚合物纳米颗粒、适体及其各种组合(参见例如Larson等,Surgery,(2007年8月),第142卷, 第2期,第(262-269)页;Hamar等,Proc Natl Acad Sci,(2004年10月),第101卷,第41期,第 (14883-14888)页;Zheng等,Am J Pathol,(2008年10月),第173卷,第4期,第(973-980)页; Feng等,Transplantation,(2009年5月),第87卷,第9期,第(1283-1289)页;Q.Zhang等,PloS ONE,(2010年7月),第5卷,第7期,e11709,第(1-13)页;Kushibikia等,JControlled Release, (2005年7月),第105卷,第3期,第(318-331)页;Wang等,GeneTherapy,(2006年7月),第 13卷,第14期,第(1097-1103)页;Kobayashi等,Journal ofPharmacology and Experimental Therapeutics,(2004年2月),第308卷,第2期,第(688-693)页;Wolfrum等,Nature Biotechnology,(2007年9月),第25卷,第10期,第(1149-1157)页;Molitoris等,J Am Soc Nephrol,(2009年8月),第20卷,第8期,第(1754-1764)页;Mikhaylova等,Cancer Gene Therapy,(2011年3月),第16卷,第3期,第(217-226)页;Y.Zhang等,J Am Soc Nephrol, (2006年4月),第17卷,第4期,第(1090-1101)页;Singhal等,Cancer Res,(2009年5月),第 69卷,第10期,第(4244-4251)页;Malek等,Toxicologyand Applied Pharmacology,(2009年 4月),第236卷,第1期,第(97-108)页;Shimizu等,JAm Soc Nephrology,(2010年4月),第 21卷,第4期,第(622-633)页;Jiang等,MolecularPharmaceutics,(2009年5月至6月),第6 卷,第3期,第(727-737)页;Cao等,J ControlledRelease,(2010年6月),第144卷,第2期,第 (203-212)页;Ninichuk等,Am J Pathol,(2008年3月),第172卷,第3期,第(628-637)页; Purschke等,Proc Natl Acad Sci,(2006年3月),第103卷,第13期,第(5173-5178)页。
在一些实施方案中,递送至肝脏细胞。在一些实施方案中,所述肝脏细胞是肝细胞。本 文的组合物和系统的递送可以通过病毒载体,尤其是AAV(并且具体来说是AAV2/6)载体。 这些可以通过静脉内注射施用。无论在体外还是在体内,肝脏的优选靶标是白蛋白基因。这 是一个所谓的‘安全港’,因为白蛋白以非常高的水平表达,并且因此容许白蛋白产生在成功 的基因编辑后有一定程度的减少。这也是优选的,因为从白蛋白启动子/增强子看到的高水 平表达允许实现有用水平的正确或转基因生产(来自插入的重组模板),即使只编辑一小部分 肝细胞。参见Wechsler等(在美国血液学会第57届年会和博览会上报告—摘要可在 ash.confex.com/ash/2015/webprogram/Paper86495.html在线获取,并且在2015年12月6日提 供)鉴定的位点,所述文献可以经调整以用于本文的组合物、系统。
本文在别处描述了可以治疗和/或预防的示例性肝脏和肾脏疾病。
治疗上皮和肺部疾病
在一些实施方案中,通过本文所述的组合物和系统治疗或预防的疾病可以是肺部或上皮 疾病。本文所述的组合物和系统可以用于治疗上皮和/或肺部疾病。本发明还设想将本文所 述的组合物、系统递送至一个或两个肺。
在一些实施方案中,病毒载体可以用于将所述组合物、系统或其组分递送至肺。在一些 实施方案中,所述AAV是用于递送至肺的AAV-1、AAV-2、AAV-5、AAV-6和/或AAV-9。 (参见例如Li等,Molecular Therapy,第17卷,第12期,2067-2077 2009年12月)。在一些实 施方案中,MOI可以从1×103到4×105个载体基因组/细胞变化。在一些实施方案中,递送 载体可以是如Zamora等(Am J Respir Crit Care Med第183卷.第531-538页,2011中的RSV 载体。Zamora等的方法可以应用于本发明的核酸靶向系统,并且可以设想雾化CRISPR Cas 例如以0.6mg/kg剂量用于本发明。
治疗肺病的受试者可以例如在自主呼吸时接受经支气管内递送至每个肺的药学有效量 的雾化AAV载体系统。因此,一般来说,优选雾化递送用于AAV递送。腺病毒或AAV颗粒可用于递送。可以将合适的基因构建体(各自可操作地连接至一个或多个调控序列)克隆到 递送载体中。在这种情况下,提供以下构建体作为示例:用于Cas的Cbh或EF1a启动子、用于向导RNA的U6或H1启动子)。优选的安排是使用CFTRΔ508靶向性向导、针对ΔF508 突变的修复模板和密码子优化型Cas酶,任选地具有一个或多个核定位信号或序列(NLS), 例如两(2)个NLS。
治疗皮肤疾病
本文所述的组合物和系统可以用于治疗皮肤疾病。本发明还设想将本文所述的组合物和 系统递送至皮肤。
在一些实施方案中,可以通过一个或多个微针或含微针装置将所述组合物、系统或其组 分递送至皮肤(皮内递送)。举例来说,在一些实施方案中,Hickerson等(MolecularTherapy—Nucleic Acids(2013)2,e129)的装置和方法可以用于和/或适合于将本文所述的组 合物、系统例如以高达300μl 0.1mg/ml CRISPR-Cas系统的剂量递送至皮肤。
在一些实施方案中,Leachman等(Molecular Therapy,第18卷,第2期,442-446,2010 年2月)的方法和技术可以用于和/或经调整以用于将本文所述的CIRPSR-Cas系统递送至皮 肤。
在一些实施方案中,Zheng等(PNAS,2012年7月24日,第109卷,第30期,11975-11980) 的方法和技术可以用于和/或经调整以用于将本文所述的CIRPSR-Cas系统的纳米颗粒递送 至皮肤。在一些实施方案中,单次应用约25nM剂量可以在皮肤中实现基因敲低。
治疗癌症
本文所述的组合物、系统可以用于治疗癌症。本发明还设想将本文所述的组合物、系统 递送至癌细胞。此外,如本文在别处所述,所述组合物、系统可以用于修饰免疫细胞,诸如 CAR或CAR T细胞,然后又可以用于治疗和/或预防癌症。这还描述于国际专利公开号WO 2015/161276中,该案的公开内容通过引用并入并描述于下文。
适用于治疗或预防癌症的靶基因可以包括表10和表11所示的那些。在一些实施方案中, 用于癌症治疗和预防的靶基因还可以包括国际专利公开号WO 2015/048577所述的那些,该 案的公开内容通过引用并入在此,并且可以经调整以用于和/或应用于本文所述的组合物、 系统。
过继细胞疗法
本文所述的组合物、系统及其组分可以用于修饰细胞以用于过继细胞疗法。在本发明的 一个方面,通过调整本发明的组合物、系统包括了涉及编辑靶核酸序列或调节靶核酸序列表 达的方法和组合物,以及其结合癌症免疫疗法的应用。在一些实施例中,所述组合物、系统 和方法可以用于修饰干细胞(例如,诱导型多能细胞)以衍生修饰的自然杀伤细胞、γδT细胞 和αβT细胞,所述细胞可以用于过继细胞疗法。在某些实施例中,所述组合物、系统和方 法可以用于修饰经过修饰的自然杀伤细胞、γδT细胞和αβT细胞。
如本文所用,“ACT”、“过继细胞疗法”和“过继细胞转移”可以互换使用。在某些实施方 案中,过继细胞疗法(ACT)可以指将细胞转移至患者,目标是通过移植细胞将功能和特征转 移至新宿主中(参见例如Mettananda等,Editing anα-globin enhancer inprimary human hematopoietic stem cells as a treatment forβ-thalassemia,NatCommun.2017年9月4 日;8(1):424)。如本文所用,术语“移植”或“植入”是指在体内通过与组织的现有细胞接触而将 细胞并入目标组织中的过程。过继细胞疗法(ACT)可以指将细胞(最常见的是免疫衍生细胞) 转移回同一患者或新受体宿主中,目标是将免疫功能和特征转移到新宿主中。如果可能,则 使用自体细胞通过最小化GVHD问题来帮助受体。自体肿瘤浸润淋巴细胞(TIL)的过继转移 (Zacharakis等,(2018)Nat Med.2018年6月;24(6):724-730;Besser等,(2010)Clin.Cancer Res 16(9)2646-55;Dudley等,(2002)Science 298(5594):850-4;以及Dudley等,(2005)Journal of Clinical Oncology 23(10):2346-57.)或基因再定向外周血单核细胞(Johnson等,(2009)Blood 114(3):535-46;以及Morgan等,(2006)Science 314(5796)126-9)已用于成功治疗患有晚期实 体瘤(包括黑色素瘤、转移性乳腺癌和结直肠癌)的患者,以及患有表达CD19的血液系统恶 性肿瘤的患者(Kalos等,(2011)Science Translational Medicine 3(95):95ra73)。在某些实施方 案中,转移了同种异体细胞免疫细胞(参见例如Ren等,(2017)Clin Cancer Res 23(9) 2255-2266)。如本文进一步描述,可以编辑同种异体细胞以降低同种异体反应性并预防移植 物抗宿主病。因此,使用同种异体细胞允许从健康供体获得细胞并准备用于患者,而不是从 诊断之后的患者制备自体细胞。
本发明的诸多方面涉及过继转移对诸如肿瘤相关抗原或肿瘤特异性新抗原等所选抗原 特异的免疫系统细胞,诸如T细胞(参见例如Maus等,2014,AdoptiveImmunotherapy for Cancer or Viruses,Annual Review of Immunology,第32卷:189-225;Rosenberg和Restifo, 2015,Adoptive cell transfer as personalizedimmunotherapy for human cancer,Science第348卷, 第6230期,第62-68页;Restifo等,2015,Adoptive immunotherapy for cancer:harnessing the T cellresponse.Nat.Rev.Immunol.12(4):269-281;以及Jenson和Riddell,2014,Design andimplementation of adoptive therapy with chimeric antigen receptor-modified Tcells.Immunol Rev.257(1):127-144;以及Rajasagi等,2014,Systematicidentification of personal tumor-specific neoantigens in chronic lymphocyticleukemia.Blood.2014年7月17 日;124(3):453-62)。
在某些实施方案中,疾病(诸如特别是肿瘤或癌症)的过继细胞疗法(诸如特别是CAR或 TCR T细胞疗法)中靶向的抗原(诸如肿瘤抗原)可以选自由以下组成的组:MR1(参见例如 Crowther等,2020,Genome-wide CRISPR-Cas9 screening reveals ubiquitous Tcell cancer targeting via the monomorphic MHC class I-related protein MR1,Nature Immunology第21卷, 第178-185页)、B细胞成熟抗原(BCMA)(参见例如Friedman等,Effective Targeting of Multiple BCMA-Expressing Hematological Malignancies byAnti-BCMA CAR T Cells,Hum Gene Ther. 2018年3月8日;Berdeja JG等,Durableclinical responses in heavily pretreated patients with relapsed/refractorymultiple myeloma:updated results from a multicenter study of bb2121 anti-BcmaCAR T cell therapy.Blood.2017;130:740;以及Mouhieddine和Ghobrial,Immunotherapy in Multiple Myeloma:The Era of CAR T Cell Therapy,Hematologist,2018年5 月至6月,第15卷,第3期);PSA(前列腺特异性抗原);前列腺特异性膜抗原(PSMA);PSCA (前列腺干细胞抗原);酪氨酸蛋白激酶跨膜受体ROR1;成纤维细胞激活蛋白(FAP);肿瘤相 关糖蛋白72(TAG72);癌胚抗原(CEA);上皮细胞粘附分子(EPCAM);间皮素;人表皮生长 因子受体2(ERBB2(Her2/neu));前列腺酶;前列腺酸性磷酸酶(PAP);延伸因子2突变体(ELF2M);胰岛素样生长因子1受体(IGF-1R);gplOO;BCR-ABL(断裂点簇集区-Abelson); 酪氨酸酶;纽约食管鳞状细胞癌1(NY-ESO-1);κ-轻链LAGE(L抗原);MAGE(黑色素瘤 抗原);黑色素瘤相关抗原1(MAGE-A1);MAGE A3;MAGE A6;豆荚蛋白;人乳头状瘤 病毒(HPV)E6;HPVE7;前列腺素;存活素;PCTA1(半乳糖凝集素8);Melan-A/MART-1; Ras突变体;TRP-1(酪氨酸酶相关蛋白1或gp75);酪氨酸酶相关蛋白2(TRP2);TRP-2/INT2 (TRP-2/内含子2);RAGE(肾抗原);晚期糖基化终产物受体1(RAGE1);肾遍在蛋白1、2 (RU1、RU2);肠羧基酯酶(iCE);热休克蛋白70-2(HSP70-2)突变体;促甲状腺激素受体 (TSHR);CD123;CD171;CD19;CD20;CD22;CD26;CD30;CD33;CD44v7/8(分化 簇44外显子7/8);CD53;CD92;CD100;CD148;CD150;CD200;CD261;CD262;CD362; CS-1(CD2子集1、CRACC、SLAMF7、CD319和19A24);C型凝集素样分子-1(CLL-1); 神经节苷脂GD3(aNeu5Ac(2-8)aNeu5Ac(2-3)bDGalp(1-4)bDGlcp(1-1)Cer);Tn抗原(Tn Ag); Fms样酪氨酸激酶3(FLT3);CD38;CD138;CD44v6;B7H3(CD276);KIT(CD117);白 介素13受体亚基α-2(IL-13Ra2);白介素11受体α(IL-11Ra);前列腺干细胞抗原(PSCA); 蛋白酶丝氨酸21(PRSS21);血管内皮生长因子受体2(VEGFR2);路易斯(Y)抗原;CD24; 血小板衍生生长因子受体β(PDGFR-β);阶段特异性胚胎抗原-4(SSEA-4);细胞表面相关粘 蛋白1(MUC1);粘蛋白16(MUC16);表皮生长因子受体(EGFR);表皮生长因子受体变体 III(EGFRvIII);神经细胞粘附分子(NCAM);碳酸酐酶IX(CAIX);蛋白酶体(蛋白酶体、巨 蛋白因子)β型亚基9(LMP2);肝配蛋白A型受体2(EphA2);肝配蛋白B2;岩藻糖基GM1; 唾液酸路易斯粘附分子(sLe);神经节苷脂GM3(aNeu5Ac(2-3)bDGalp(1-4)bDGlcp(1-1)Cer); TGS5;高分子量黑色素瘤相关抗原(HMWMAA);o-乙酰基-GD2神经节苷脂(OAcGD2);叶 酸受体α;叶酸受体β;肿瘤内皮标记物1(TEM1/CD248);肿瘤内皮标记物7相关(TEM7R); 密接蛋白6(CLDN6);G蛋白偶联受体C类第5组成员D(GPRC5D);X染色体开放阅读框 61(CXORF61);CD97;CD179a;间变性淋巴瘤激酶(ALK);聚唾液酸;胎盘特异性1(PLAC1);globoH糖基神经酰胺的六糖部分(GloboH);乳腺分化抗原(NY-BR-1);尿路斑块蛋白2(UPK2);甲型肝炎病毒细胞受体1(HAVCR1);肾上腺素受体3(ADRB3);泛连接蛋白3(PANX3);G蛋白偶联受体20(GPR20);淋巴细胞抗原6复合物基因座K9(LY6K);嗅觉受 体51E2(OR51E2);TCRγ替代阅读框蛋白(TARP);威尔姆斯肿瘤蛋白(WT1);位于染色体 12p上的ETS易位变异基因6(ETV6-AML);精子蛋白17(SPA17);X抗原家族成员1A (XAGE1);血管生成素结合细胞表面受体2(Tie 2);CT(癌症/睾丸(抗原));黑色素瘤癌睾丸 抗原-1(MAD-CT-1);黑色素瘤癌睾丸抗原-2(MAD-CT-2);Fos相关抗原1;p53;p53突变 体;人端粒酶逆转录酶(hTERT);肉瘤易位断裂点;黑色素瘤细胞凋亡抑制因子(ML-IAP); ERG(跨膜蛋白酶丝氨酸2(TMPRSS2)ETS融合基因);N-乙酰基氨基葡萄糖转移酶V (NA17);配对盒蛋白Pax-3(PAX3);雄激素受体;细胞周期蛋白B1;细胞周期蛋白D1;v-myc 禽骨髓细胞瘤病毒癌基因成神经细胞瘤衍生同源物(MYCN);Ras同源家族成员C(RhoC); 细胞色素P450 1B1(CYP1B1);CCCTC结合因子(锌指蛋白)样(BORIS);T细胞1或3识别 的鳞状细胞癌抗原(SART1、SART3);配对盒蛋白Pax-5(PAX5);前顶体蛋白结合蛋白sp32 (OY-TES1);淋巴细胞特异性蛋白酪氨酸激酶(LCK);A激酶锚定蛋白4(AKAP-4);滑膜肉 瘤X断裂点1、2、3或4(SSX1、SSX2、SSX3、SSX4);CD79a;CD79b;CD72;白细胞 相关免疫球蛋白样受体1(LAIR1);IgA受体的Fc片段(FCAR);白细胞免疫球蛋白样受体 亚家族A成员2(LILRA2);CD300分子样家族成员f(CD300LF);C型凝集素结构域家族 12成员A(CLEC12A);骨髓基质细胞抗原2(BST2);含EGF样模块粘蛋白样激素受体2 (EMR2);淋巴细胞抗原75(LY75);磷脂酰肌醇蛋白聚糖-3(GPC3);Fc受体样5(FCRL5); 小鼠双微体2同源物(MDM2);存活蛋白;甲胎蛋白(AFP);跨膜激活子和CAML相互作用 因子(TACI);B细胞激活因子受体(BAFF-R);V-Ki-ras2克尔斯滕大鼠肉瘤病毒癌基因同源 物(KRAS);免疫球蛋白λ样多肽1(IGLL1);707-AP(707丙氨酸脯氨酸);ART-4(T4细胞 识别的腺癌抗原);BAGE(B抗原;b-连环蛋白/m,b-连环蛋白/突变型);CAMEL(黑色素瘤 上CTL识别的抗原);CAP1(癌胚抗原肽1);CASP-8(凋亡蛋白酶-8);CDC27m(细胞分裂 周期27突变型);CDK4/m(细胞周期蛋白依赖性激酶4突变型);Cyp-B(亲环蛋白B);DAM (分化抗原黑色素瘤);EGP-2(上皮糖蛋白2);EGP-40(上皮糖蛋白40);Erbb2、Erbb3、Erbb4 (成红细胞性白血病病毒癌基因同源物2、3、4);FBP(叶酸结合蛋白);fAchR(胎儿乙酰胆 碱受体);G250(糖蛋白250);GAGE(G抗原);GnT-V(N-乙酰氨基葡萄糖转移酶V);HAGE (螺旋糖抗原);ULA-A(人白细胞抗原A);HST2(人类印戒肿瘤2);KIAA0205;KDR(激酶 插入域受体);LDLR/FUT(低密度脂质受体/GDP L-岩藻糖:b-D-半乳糖苷酶2-a-L岩藻糖基转 移酶);L1CAM(L1细胞粘附分子);MC1R(黑皮质素1受体);肌球蛋白/m(肌球蛋白突变 型);MUM-1、MUM-2、MUM-3(黑色素瘤遍在蛋白突变型1、2、3);NA88-A(患者M88 的NA cDNA克隆);KG2D(自然杀伤组2成员D)配体;癌胚抗原(h5T4);p190次要bcr-abl(190KD bcr-abl蛋白);Pml/RARa(早幼粒细胞性白血病/视黄酸受体a);PRAME(黑色素瘤的优先表达抗原);SAGE(肉瘤抗原);TEL/AML1(易位Ets家族性白血病/急性髓性白血病1);TPI/m(磷酸丙糖异构酶突变型);CD70;及其任何组合。
在某些实施方案中,疾病(诸如特别是肿瘤或癌症)的过继细胞疗法(诸如特别是CAR或 TCR T细胞疗法)中靶向的抗原是肿瘤特异性抗原(TSA)。
在某些实施方案中,疾病(诸如特别是肿瘤或癌症)的过继细胞疗法(诸如特别是CAR或 TCR T细胞疗法)中靶向的抗原是新抗原。
在某些实施方案中,疾病(诸如特别是肿瘤或癌症)的过继细胞疗法(诸如特别是CAR或 TCR T细胞疗法)中靶向的抗原是肿瘤相关抗原(TAA)。
在某些实施方案中,疾病(诸如特别是肿瘤或癌症)的过继细胞疗法(诸如特别是CAR或 TCR T细胞疗法)中靶向的抗原是通用肿瘤抗原。在某些优选实施方案中,所述通用肿瘤抗 原选自由以下组成的组:人端粒酶逆转录酶(hTERT)、存活素、小鼠双微体2同源物(MDM2)、 细胞色素P450 1B 1(CYP1B)、HER2/neu、威尔姆斯氏肿瘤基因1(WT1)、存活蛋白、甲胎 蛋白(AFP)、癌胚抗原(CEA)、粘蛋白16(MUC16)、MUC1、前列腺特异性膜抗原(PSMA)、p53、细胞周期蛋白(Dl)及其任何组合。
在某些实施方案中,疾病(诸如特别是肿瘤或癌症)的过继细胞疗法(诸如特别是CAR或 TCR T细胞疗法)中靶向的抗原(诸如肿瘤抗原)可以选自由以下组成的组:CD19、BCMA、 CD70、CLL-1、MAGE A3、MAGE A6、HPV E6、HPV E7、WT1、CD22、CD171、ROR1、 MUC16和SSX2。在某些优选实施方案中,所述抗原可以是CD19。举例来说,在血液系统 恶性肿瘤中可以靶向CD19,诸如在淋巴瘤中,更具体来说在B细胞淋巴瘤中,诸如但不限 于在弥漫性大B细胞淋巴瘤、原发性纵隔b细胞淋巴瘤、转化型滤泡性淋巴瘤、边缘区淋 巴瘤、套细胞淋巴瘤、急性成淋巴细胞性白血病(包括成人和儿童ALL)、非霍奇金淋巴瘤、 惰性非霍奇金淋巴瘤或慢性淋巴细胞性白血病中。举例来说,在多发性骨髓瘤或浆细胞性白 血病中可以靶向BCMA(参见例如2018美国癌症研究协会(AACR)年会海报:靶向B细胞成 熟抗原的同种异体嵌合抗原受体T细胞)。举例来说,在急性髓性白血病中可以靶向CLL1。 举例来说,在实体瘤中可以靶向MAGE A3、MAGE A6、SSX2和/或KRAS。举例来说,在 宫颈癌或头颈癌中可以靶向HPV E6和/或HPV E7。举例来说,在急性髓性白血病(AML)、 骨髓增生异常综合征(MDS)、慢性髓性白血病(CML)、非小细胞肺癌、乳腺癌、胰腺癌、卵 巢癌或结肠直肠癌或间皮瘤中可以靶向WT1。举例来说,在B细胞恶性肿瘤,包括非霍奇 金淋巴瘤、弥漫性大B细胞淋巴瘤或急性成淋巴细胞性白血病中可以靶向CD22。举例来说, 在成神经细胞瘤、成胶质细胞瘤或肺癌、胰腺癌或卵巢癌中可以靶向CD171。举例来说, 在ROR1+恶性肿瘤,包括非小细胞肺癌、三阴性乳腺癌、胰腺癌、前列腺癌、ALL、慢性 淋巴细胞性白血病或套细胞淋巴瘤中可以靶向ROR1。举例来说,在MUC16ecto+上皮性卵 巢癌、输卵管癌或原发性腹膜癌中可以靶向MUC16。举例来说,在血液系统恶性肿瘤以及 实体癌,诸如肾细胞癌(RCC)、神经胶质瘤(例如GBM)和头颈癌(HNSCC)中可以靶向CD70。 CD70表达于血液系统恶性肿瘤以及实体癌中,而其在正常组织中的表达局限于淋巴细胞类 型的一个子集(参见例如2018美国癌症研究协会(AACR)年会海报:同种异体CRISPR工程 改造型抗CD70 CAR-T细胞证明了对实体癌细胞和血液癌细胞的有效临床前活性)。
可以例如采用各种策略通过改变T细胞受体(TCR)的特异性来基因修饰T细胞,例如通 过引入具有所选肽特异性的新TCRα和β链(参见美国专利号8,697,854;PCT专利公开:WO2003020763、WO2004033685、WO2004044004、WO2005114215、WO2006000830、WO2008038002、WO2008039818、WO2004074322、WO2005113595、WO2006125962、WO2013166321、WO2013039889、WO2014018863、WO2014083173;美国专利号8,088,379)。
作为TCR修饰的替代或补充,可以使用嵌合抗原受体(CAR)产生对所选靶标(诸如恶性 细胞)特异的免疫应答细胞,其中已经描述了多种受体嵌合体构建体(参见美国专利号 5,843,728;5,851,828;5,912,170;6,004,811;6,284,240;6,392,013;6,410,014;6,753,162; 8,211,422;和PCT公开WO 9215322)。
一般来说,CAR由细胞外域、跨膜域和细胞内域组成,其中所述细胞外域包含对预定 靶标特异的抗原结合域。尽管CAR的抗原结合域通常是抗体或抗体片段(例如单链可变片 段,scFv),但所述结合域不受具体限制,只要它引起对靶标的特异性识别即可。举例来说, 在一些实施方案中,所述抗原结合域可以包含受体,使得所述CAR能够结合所述受体的配 体。替代地,所述抗原结合域可以包含配体,使得所述CAR能够结合该配体的内源受体。
CAR的抗原结合域通常通过铰链或间隔子与跨膜域分开。对间隔子也没有具体限制, 并且设计它是为了给CAR提供柔性。举例来说,间隔结构域可以包含人Fc结构域的一部分, 包括CH3结构域的一部分,或任何免疫球蛋白的铰链区,诸如IgA、IgD、IgE、IgG或IgM,或其变体。此外,可以修饰铰链区以防止FcR或其他潜在干扰物的脱靶结合。举例来说, 铰链可以包含具有或没有S228P、L235E和/或N297Q突变(根据Kabat编号)的IgG4 Fc结构 域以降低与FcR的结合。其他间隔子/铰链包括但不限于CD4、CD8和CD28铰链区。
CAR的跨膜域可以衍生自天然来源或合成来源。在来源是天然的时,所述结构域可以 衍生自任何膜结合或跨膜蛋白。本公开中特别使用的跨膜区可以来源于CD8、CD28、CD3、CD45、CD4、CD5、CDS、CD9、CD16、CD22、CD33、CD37、CD64、CD80、CD86、CD134、 CD137、CD154、TCR。替代地,跨膜域可以是合成的,在这种情况下,它将主要包含疏水 性残基,诸如亮氨酸和缬氨酸。优选地,苯丙氨酸、色氨酸和缬氨酸三联体将出现在合成跨 膜域的每一端。任选地,优选长度在2与10个氨基酸之间的短寡肽或多肽接头可以形成跨 膜域与CAR的细胞质信号传导域之间的键连。甘氨酸-丝氨酸二联体提供了特别合适的接 头。
替代CAR构建体可以表征为属于连续世代。第一代CAR通常由对抗原特异的抗体的单链可变片段组成,例如包含与特定抗体的VH连接的VL,通过柔性接头,例如通过CD8α 铰链域和CD8α跨膜域连接至CD3ζ或FcRγ的跨膜域和细胞内信号传导域(scFv-CD3ζ或 scFv-FcRγ;参见美国专利号7,741,465;美国专利号5,912,172;美国专利号5,906,936)。第 二代CAR将一个或多个共刺激分子的胞内域,诸如CD28、OX40(CD134)或4-1BB(CD137) 并入胞内域内(例如scFv-CD28/OX40/4-1BB-CD3ζ;参见美国专利号8,911,993;8,916,381; 8,975,071;9,101,584;9,102,760;9,102,761)。第三代CAR包括共刺激胞内域的组合,诸如CD3ζ-链、CD97、GDI la-CD18、CD2、ICOS、CD27、CD154、CDS、OX40、4-1BB、CD2、 CD7、LIGHT、LFA-1、NKG2C、B7-H3、CD30、CD40、PD-1或CD28信号传导域(例如 scFv-CD28-4-1BB-CD3ζ或scFv-CD28-OX40-CD3ζ;参见美国专利号8,906,682;美国专利号 8,399,645;美国专利号5,686,281;PCT公开号WO 2014/134165;PCT公开号WO 2012/079000)。在某些实施方案中,主要信号传导域包含蛋白质的功能信号传导域,所述功 能信号传导域选自由以下组成的组:CD3ζ、CD3γ、CD3δ、CD3ε、普通FcRγ(FCERIG)、 FcRβ(FcεR1b)、CD79a、CD79b、FcγRIIa、DAP10和DAP12。在某些优选实施方案中, 所述主要信号传导域包含CD3ζ或FcRγ的功能信号传导域。在某些实施方案中,一个或多 个共刺激信号传导域包含蛋白质的功能信号传导域,所述功能信号传导域各自独立地选自由 以下组成的组:CD27、CD28、4-1BB(CD137)、OX40、CD30、CD40、PD-1、ICOS、淋巴 细胞功能相关抗原-1(LFA-1)、CD2、CD7、LIGHT、NKG2C、B7-H3、与CD83特异性结 合的配体、CDS、ICAM-1、GITR、BAFFR、HVEM(LIGHTR)、SLAMF7、NKp80(KLRF1)、 CD160、CD19、CD4、CD8α、CD8β、IL2Rβ、IL2Rγ、IL7Rα、ITGA4、VLA1、CD49a、ITGA4、IA4、CD49D、ITGA6、VLA-6、CD49f、ITGAD、CD11d、ITGAE、CD103、ITGAL、CD11a、 LFA-1、ITGAM、CD11b、ITGAX、CD11c、ITGB1、CD29、ITGB2、CD18、ITGB7、TNFR2、 TRANCE/RANKL、DNAM1(CD226)、SLAMF4(CD244、2B4)、CD84、CD96(Tactile)、 CEACAM1、CRTAM、Ly9(CD229)、CD160(BY55)、PSGL1、CD100(SEMA4D)、CD69、 SLAMF6(NTB-A、Lyl08)、SLAM(SLAMF1、CD150、IPO-3)、BLAME(SLAMF8)、SELPLG (CD162)、LTBR、LAT、GADS、SLP-76、PAG/Cbp、NKp44、NKp30、NKp46和NKG2D。 在某些实施方案中,所述一个或多个共刺激信号传导域包含蛋白质的功能信号传导域,所述 功能信号传导域各自独立地选自由以下组成的组:4-1BB、CD27和CD28。在某些实施方案 中,嵌合抗原受体可以具有如美国专利号7,446,190所述的设计,包括CD3ζ链的细胞内域(诸 如人CD3ζ链的氨基酸残基52-163,如US 7,446,190的SEQ ID NO:14所示)、来自CD28 的信号传导区和抗原结合元件(或部分或结构域;诸如scFv)。所述CD28部分当在ζ链部分 和抗原结合元件之间时可以适当地包括CD28的跨膜域和信号传导域(诸如SEQ ID NO:10 的氨基酸残基114-220,完整序列示于US 7,446,190的SEQ ID NO:6中;这些可以包括如 Genbank标识符NM_006139中所示的以下CD28部分。替代地,当ζ序列位于CD28序列 与抗原结合元件之间时,可以单独使用CD28的胞内域(诸如US 7,446,190的SEQ IDNO:9 中所示的氨基序列)。因此,某些实施方案采用包含以下的CAR:(a)包含人CD3ζ链的胞内 域的ζ链部分;(b)共刺激信号传导区;和(c)抗原结合元件(或部分或结构域),其中所述共刺 激信号传导区包含由US 7,446,190的SEQ ID NO:6编码的氨基酸序列。
替代地,可以通过在抗原特异性T细胞中表达为了在例如通过专业抗原呈递细胞上的 抗原接合它们的天然αβTCR与伴随共刺激后激活和扩增而选择的CAR来协调共刺激。此外, 可以在免疫应答细胞上提供额外的工程改造的受体,例如以提高T细胞攻击的靶向性和/或 最小化副作用。
通过示例而非限制的方式,Kochenderfer等,(2009)J Immunother.32(7):689-702描述了 抗CD19嵌合抗原受体(CAR)。FMC63-28Z CAR含有识别来源于FMC63小鼠杂交瘤的CD19 的单链可变区部分(scFv)(描述于Nicholson等,(1997)Molecular Immunology34:1157-1165 中)、人CD28分子的一部分,以及人TCR-ζ分子的细胞内组分。FMC63-CD828BBZ CAR 含有FMC63 scFv、CD8分子的铰链区和跨膜区、CD28和4-1BB的细胞质部分以及TCR-ζ 分子的细胞质组分。FMC63-28Z CAR中包含的CD28分子的确切序列对应于Genbank标识 符NM_006139;该序列包括从氨基酸序列IEVMYPPPY(SEQ ID NO:5246)开始并一直持续 到蛋白质的羧基末端的所有氨基酸。为了编码载体的抗CD19 scFv组分,作者们设计了一个 DNA序列,该序列基于之前公开的CAR的一部分(Cooper等,(2003)Blood 101:1637-1644)。 该序列编码框架中的以下组分,从5'端到3'端:XhoI位点、人粒细胞-巨噬细胞集落刺激因 子(GM-CSF)受体α链信号序列、FMC63轻链可变区(如Nicholson等,同上)、接头肽(如Cooper 等,同上)、FMC63重链可变区(如Nicholson等,同上)和NotI位点。用XhoI和NotI消化编 码此序列的质粒。为了形成MSGV-FMC63-28Z逆转录病毒载体,将编码FMC63 scFv的XhoI 和NotI消化片段连接到编码MSGV逆转录病毒骨架的第二XhoI和NotI消化片段中(如Hughes等,(2005)Human Gene Therapy 16:457-472)以及人CD28细胞外部分的一部分、人CD28的整个跨膜和细胞质部分以及人TCR-ζ分子的细胞质部分(如Maher等,2002)NatureBiotechnology 20:70-75)。将FMC63-28Z CAR包括在Kite Pharma公司正在开发的KTE-C19(axicabtagene ciloleucel)抗CD19 CAR-T治疗产品中,用于治疗尤其患有复发性/难治性侵袭 性B细胞非霍奇金淋巴瘤(NHL)的患者。因此,在某些实施方案中,旨在用于过继细胞疗法 的细胞,更具体来说是免疫应答细胞,诸如T细胞,可以表达Kochenderfer等(同上)所述的 FMC63-28Z CAR。因此,在某些实施方案中,旨在用于过继细胞疗法的细胞,更具体来说 是免疫应答细胞,诸如T细胞,可以包含CAR,所述CAR包括特异性结合抗原的细胞外抗原结合元件(或部分或结构域;诸如scFv)、包括CD3ζ链的细胞内域的细胞内信号传导域和包括CD28的信号传导域的共刺激信号传导区。优选地,CD28氨基酸序列如Genbank标识 符NM_006139(序列版本1、2或3)中所示,从氨基酸序列IEVMYPPPY(SEQ ID NO:5246) 开始并一直持续到蛋白质的羧基末端。优选地,所述抗原是CD19,更优选地,所述抗原结 合元件是抗CD19 scFv,甚至更优选地是如Kochenderfer等(同上)所述的抗CD19 scFv。
国际专利公开号WO 2015/187528还描述了其他抗CD19 CAR。更具体来说,通过引用 并入本文的WO2015187528的实施例1和表1示出了基于完全人抗CD19单克隆抗体(47G4,如US20100104509所述)和鼠抗CD19单克隆抗体(如Nicholson等所述和上文所阐明)的抗CD19 CAR的产生。公开了信号序列(人CD8-α或GM-CSF受体)、细胞外和跨膜区(人CD8-α) 和细胞内T细胞信号传导域(CD28-CD3ζ;4-1BB-CD3ζ;CD27-CD3ζ;CD28-CD27-CD3ζ、 4-1BB-CD27-CD3ζ;CD27-4-1BB-CD3ζ;CD28-CD27-FcεRIγ链;或CD28-FcεRIγ链)的不 同组合。因此,在某些实施方案中,旨在用于过继细胞疗法的细胞,更具体来说是免疫应答 细胞,诸如T细胞,可以包含CAR,所述CAR包含特异性结合抗原的细胞外抗原结合元件、 如WO2015187528的表1所示的细胞外和跨膜区和如WO 2015/187528的表1所示的细胞内 T细胞信号传导域。优选地,所述抗原是CD19,更优选地,所述抗原结合元件是抗CD19 scFv, 甚至更优选地是如WO 2015/187528的实施例1所述的小鼠或人抗CD19 scFv。在某些实施 方案中,所述CAR包含以下氨基酸序列、基本上由以下氨基酸序列组成或由以下氨基酸序 列组成:WO2015187528的表1所示的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、 SEQ ID NO:10、SEQID NO:11、SEQ ID NO:12或SEQ ID NO:13。
通过示例而非限制的方式,识别CD70抗原的嵌合抗原受体描述于WO2012058460A2中(另见Park等,CD70 as a target for chimeric antigen receptor T cells in headand neck squamous cell carcinoma,Oral Oncol.2018年3月;78:145-150;以及Jin等,CD70,a novel target of CAR T-cell therapy for gliomas,Neuro Oncol.2018年1月10日;20(1):55-65)。CD70由弥漫 性大B细胞性和滤泡性淋巴瘤以及霍奇金淋巴瘤、华氏巨球蛋白血症和多发性骨髓瘤的恶 性细胞以及HTLV-1和EBV相关恶性肿瘤表达。(Agathanggelou等,Am.J.Pathol.1995;147: 1152-1160;Hunter等,Blood 2004;104:4881.26;Lens等,J Immunol.2005;174:6212-6219; Baba等,J Virol.2008;82:3843-3852。)此外,CD70在诸如肾细胞癌和成胶质细胞瘤等非血液 系统恶性肿瘤中表达。(Junker等,J Urol.2005;173:2150-2153;Chahlavi等,Cancer Res 2005;65:5428-5438)在生理学上,CD70表达是短暂的,并且局限于高度激活的T、B和树突 状细胞的子集。
通过示例而非限制的方式,已经描述了识别BCMA的嵌合抗原受体(例如参见US20160046724A1;WO2016014789A2;WO2017211900A1;WO2015158671A1;US20180085444A1;WO2018028647A1;US20170283504A1;和WO2013154760A1)。
在某些实施方案中,除了如本文所述的CAR或外源TCR以外,免疫细胞还可以包含特 异性结合第二靶抗原并能够在识别所述第二靶抗原后向细胞诱导抑制性或免疫抑制性或阻 遏性信号的嵌合抑制受体(抑制性CAR)。在某些实施方案中,所述嵌合抑制受体包含经配置 以特异性结合靶抗原的细胞外抗原结合元件(或部分或结构域)、跨膜域和细胞内免疫抑制性 或阻遏性信号传导域。在某些实施方案中,所述第二靶抗原是不表达于癌细胞或受感染细胞 的表面上或者在癌细胞或受感染细胞上的表达被下调的抗原。在某些实施方案中,所述第二 靶抗原是MHC I类分子。在某些实施方案中,所述细胞内信号传导域包含诸如PD-1或 CTLA4等免疫检查点分子的功能性信号传导部分。有利地,包括这种抑制性CAR减少了工 程改造的免疫细胞攻击非靶(例如,非癌症)组织的机会。
替代地,可以进一步修饰表达CAR的T细胞以减少或消除内源TCR的表达,从而减少脱靶效应。减少或消除内源TCR可以减少脱靶效应并增加T细胞的有效性(U.S. 9,181,527)。可以使用多种方法产生稳定缺乏功能性TCR表达的T细胞。T细胞内化、分选 和降解呈复合物形式的整个T细胞受体,半衰期在静息T细胞中为约10小时而在受刺激T 细胞中为3小时(von Essen,M.等,2004.J.Immunol.173:384-393)。TCR复合物正常发挥功能 需要适当化学计量比的蛋白质构成所述TCR复合物。TCR功能还需要两个具有ITAM基序 的功能TCRζ蛋白。TCR在与其MHC肽配体接合后的激活需要在同一个T细胞上接合若干 个TCR,它们全都必须正确地进行信号传导。因此,如果TCR复合物在不能正确缔合或不 能以最佳方式进行信号传导的蛋白质下去稳定化,则T细胞将不会被激活到足以开始细胞 应答。
因此,在一些实施方案中,可以使用RNA干扰(例如,shRNA、siRNA、miRNA等)、CRISPR或靶向原代T细胞中编码特定TCR(例如TCR-α和TCR-β)的核酸和/或CD3链的其 他方法消除TCR表达。通过阻断这些蛋白质中一种或多种的表达,T细胞将不再产生TCR 复合物的一种或多种关键组分,从而使TCR复合物去稳定化并阻止功能性TCR的细胞表面 表达。
在一些情况下,CAR还可以包括用于控制CAR表达和/或激活的开关机制。举例来说, CAR可以包含细胞外域、跨膜域和细胞内域,其中所述细胞外域包含靶特异性结合元件, 该元件包含对不同于靶细胞上或由靶细胞表达的靶抗原的分子特异的标记物、结合域或标 签。在此类实施方案中,CAR的特异性由第二构建体提供,所述第二构建体包含靶抗原结 合域(例如,对靶抗原和CAR上的标记物或标签都特异的scFv或双特异性抗体)和能被CAR 上的标记物、结合域或标签识别或结合的结构域。参见例如WO 2013/044225、WO 2016/000304、WO 2015/057834、WO 2015/057852、WO 2016/070061、US 9,233,125、US 2016/0129109。以这种方式,表达CAR的T细胞可以施用于受试者,但所述CAR不能结合 其靶抗原,直到施用包含抗原特异性结合域的第二组合物。
替代开关机制包括需要多聚化以激活它们的信号传导功能的CAR(参见例如美国专利 公开号US 2015/0368342、US 2016/0175359、US 2015/0368360)和/或外源信号,诸如小分子 药物(US 2016/0166613;Yung等,Science,2015),以便引发T细胞应答。一些CAR还可能 包含“自杀开关”以便在治疗后诱导CAR T细胞死亡(Buddee等,PLoS One,2013)或在与靶抗 原结合后下调CAR表达(国际专利公开号WO 2016/011210)。
替代技术可用于转化靶免疫应答细胞,诸如原生质体融合、脂质转染、转染或电穿孔。 可以使用多种载体,诸如逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、质 粒或转座子,诸如睡美人转座子(参见美国专利号6,489,458;7,148,203;7,160,682;7,985,739; 以及8,227,432)可以用于引入CAR,例如使用第2代抗原特异性CAR信号传导通过CD3ζ 和CD28或CD137。病毒载体可以例如包括基于HIV、SV40、EBV、HSV或BPV的载体。
为了转化而靶向的细胞可以例如包括T细胞、自然杀伤(NK)细胞、细胞毒性T淋巴细 胞(CTL)、调控T细胞、人胚胎干细胞、肿瘤浸润淋巴细胞(TIL)或可以从中分化出淋巴样细 胞的多能干细胞。表达所需CAR的T细胞可以例如通过与共表达癌症抗原和共刺激分子的γ辐照激活与增殖细胞(AaPC)共培养来选择。可以扩增工程改造的CAR T细胞,例如通过在诸如IL-2和IL-21等可溶性因子的存在下在AaPC上共培养。可以例如进行这种扩增以提供记忆CAR+T细胞(其可以例如通过非酶数字阵列和/或多面板流式细胞术进行测定)。以这种方式,可以提供对带有抗原的肿瘤具有特异性细胞毒活性的CAR T细胞(任选地与诸如干扰素-γ等所需趋化因子的产生相结合)。这种CAR T细胞可以例如用于动物模型,例如以治疗肿瘤异种移植物。
在某些实施方案中,ACT包括共转移CD4+Th1细胞和CD8+CTL以诱导协同抗肿瘤 应答(参见例如Li等,Adoptive cell therapy with CD4+T helper 1cells and CD8+cytotoxic T cells enhances complete rejection of an established tumor,leadingto generation of endogenous memory responses to non-targeted tumorepitopes.Clin Transl Immunology.2017年10月;6(10): e160)。
在某些实施方案中,将Th17细胞转移至有需要的受试者。已报告Th17细胞比Th1细胞更大程度地直接消除小鼠体内的黑色素瘤(Muranski P等,Tumor-specific Th17-polarized cells eradicate large established melanoma.Blood.2008年7月15日;112(2):362-73;及 Martin-Orozco N等,T helper 17cells promote cytotoxic T cellactivation in tumor immunity. Immunity.2009年11月20日;31(5):787-98)。这些研究涉及过继T细胞转移(ACT)治疗方法, 所述治疗方法利用了表达TCR识别酪氨酸酶肿瘤抗原的CD4+T细胞。TCR开发导致Th17 群体离体迅速大量扩增以便再输注到带有自体肿瘤的宿主中。
在某些实施方案中,ACT可以包括基于自体iPSC的疫苗,诸如自体抗肿瘤疫苗中的辐 照iPSC(参见例如Kooreman,Nigel G.等,Autologous iPSC-Based Vaccines ElicitAnti-tumor Responses In Vivo,Cell Stem Cell 22,1-13,2018,doi.org/10.1016/j.stem.2018.01.016)。
不同于MHC局限性T细胞受体(TCR),CAR可以潜在地结合任何细胞表面表达的抗原, 并且因此可以更普遍地用于治疗患者(参见Irving等,Engineering ChimericAntigen Receptor T-Cells for Racing in Solid Tumors:Don’t Forget the Fuel,Front.Immunol.,2017年4月3日, doi.org/10.3389/fimmu.2017.00267)。在某些实施方案中,在不存在内源T细胞浸润(例如, 由于异常抗原加工和呈递)的情况下,这排除了使用TIL疗法和免疫检查点阻断,CAR T细 胞转移可以用于治疗患者(参见例如Hinrichs CS,Rosenberg SA.Exploiting the curative potential of adoptive T-cell therapy forcancer.Immunol Rev(2014)257(1):56-71.doi:10.1111/ imr.12132)。
诸如前述的方法可能适合于提供对患有诸如瘤形成等疾病的受试者进行治疗和/或增加 存活率的方法,例如通过施用有效量的包含结合所选抗原的抗原识别受体的免疫应答细胞, 其中所述结合激活了所述免疫应答细胞,从而治疗或预防疾病(诸如瘤形成、病原体感染、 自身免疫病症或同种异体移植反应)。
在某些实施方案中,所述治疗可以在淋巴耗竭预处理后以化学疗法(通常是环磷酰胺和 氟达拉滨的组合)或放射疗法的形式施用。ACT的初步研究具有短期应答,而且转移的细胞 不会在体内持续很长时间(Houot等,T-cell-based immunotherapy:adoptivecell transfer and checkpoint inhibition.Cancer Immunol Res(2015)3(10):1115-22;以及Kamta等,Advancing Cancer Therapy with Present and Emerging Immuno-Oncology Approaches.Front.Oncol.(2017) 7:64)。免疫抑制细胞(如Treg和MDSC)可以通过与转移的细胞竞争必需的细胞因子来减弱 它们的活性。不受理论束缚,淋巴耗竭预处理可能会消除抑制细胞,从而使TIL持续存在。
在一个实施方案中,所述治疗可以施用于进行免疫抑制治疗(例如,糖皮质激素治疗)的 患者。由于编码这种免疫抑制剂受体的基因失活,可能使细胞或细胞群对至少一种免疫抑制 剂具有抗性。在某些实施方案中,所述免疫抑制治疗提供了患者体内免疫应答T细胞的选 择和扩增。
在某些实施方案中,可以在初步治疗(例如,手术或放射疗法)之前施用所述治疗以在初 步治疗之前使肿瘤缩小。在另一个实施方案中,所述治疗可以在初步治疗之后施用以去除任 何剩余的癌细胞。
在某些实施方案中,可以在ACT之前和/或期间治疗性靶向免疫代谢屏障,以增强对 ACT或CAR T细胞疗法的应答并支持内源免疫力(参见例如Irving等,EngineeringChimeric Antigen Receptor T-Cells for Racing in Solid Tumors:Don’t Forget theFuel,Front.Immunol., 2017年4月3日,doi.org/10.3389/fimmu.2017.00267)。
如本文公开的细胞或细胞群,诸如免疫系统细胞或细胞群,诸如更具体来说是免疫应答 细胞或细胞群的施用可以以任何方便的方式进行,包括通过气雾剂吸入、注射、摄入、输血、 植入或移植。细胞或细胞群可以经皮下、皮内、瘤内、结内、髓内、肌肉内、鞘内、通过静 脉内或淋巴内注射或腹膜内施用于患者。在一些实施方案中,所公开的CAR可以递送或施 用到通过切除肿瘤组织形成的腔中(即,腔内递送)或在切除之前直接施用于肿瘤中(即,瘤内 递送)。在一个实施方案中,本发明的细胞组合物优选通过静脉注射施用。
细胞或细胞群的施用可以由施用104-109个细胞/kg体重,优选105-106个细胞/kg体重, 包括那些范围内的细胞数的所有整数值组成。CAR T细胞疗法中的给药可以例如包括施用 106至109个细胞/kg,有或没有例如利用环磷酰胺的淋巴耗竭过程。可以施用一个或多个剂 量的细胞或细胞群。在另一个实施方案中,细胞的有效量作为单剂量施用。在另一个实施方 案中,细胞的有效量在一段时间内作为多于一个剂量施用。施用时间在主治医师的判断范围 内,并取决于患者的临床状况。细胞或细胞群可以从任何来源,诸如血库或供体获得。尽管 个体需求不同,但确定指定细胞类型用于特定疾病或疾患的有效量的最佳范围在本领域技术 人员的技能范围内。有效量意指提供治疗或预防益处的量。施用的剂量将取决于受体的年龄、 健康和体重、同时治疗的种类(如果有的话)、治疗频率和所需效果的性质。
在另一个实施方案中,细胞或包含那些细胞的组合物的有效量是经肠胃外施用。施用可 以是静脉内施用。可以通过在肿瘤内注射直接进行施用。
为了防止可能的不良反应,工程改造的免疫应答细胞可以配备呈转基因形式的转基因安 全开关,由此致使所述细胞易受暴露于特定信号影响。举例来说,单纯疱疹病毒胸苷激酶(TK) 基因可以以这种方式使用,例如通过在干细胞移植后引入用作供体淋巴细胞输注物的同种异 体T淋巴细胞中(Greco等,Improving the safety of cell therapywith the TK-suicide gene.Front. Pharmacol.2015;6:95)。在此类细胞中,施用诸如更昔洛韦(ganciclovir)或阿昔洛韦(acyclovir) 等核苷前药导致细胞死亡。替代的安全开关构建体包括诱导型凋亡蛋白酶9,例如通过施用 使两个非功能性icasp9分子共同形成活性酶的小分子二聚体来触发。已经描述了实施细胞增 殖控制的多种替代方法(参见美国专利公开号20130071414;国际专利公开WO 2011/146862;国际专利公开WO 2014/011987;国际专利公开WO 2013/040371;Zhou等, BLOOD,2014,123/25:3895-3905;Di Stasi等,TheNew England Journal of Medicine 2011; 365:1673-1683;Sadelain M,The NewEngland Journal of Medicine 2011;365:1735-173;Ramos 等,Stem Cells 28(6):1107-15(2010))。
在进一步细化过继疗法时,可以使用基因组编辑来定制免疫应答细胞以用于替代实施, 例如提供编辑的CAR T细胞(参见Poirot等,2015,Multiplex genome edited T-cell manufacturing platform for“off-the-shelf”adoptive T-cellimmunotherapies,Cancer Res 75(18): 3853;Ren等,2017,Multiplex genome editingto generate universal CAR T cells resistant to PD1 inhibition,Clin CancerRes.2017年5月1日;23(9):2255-2266.doi: 10.1158/1078-0432.CCR-16-1300.2016年11月4日电子发表;Qasim等,2017,Molecular remission of infant B-ALL after infusionof universal TALEN gene-edited CAR T cells,Sci Transl Med.2017年1月25日;9(374);Legut等,2018,CRISPR-mediated TCR replacement generates superioranticancer transgenic T cells.Blood,131(3),311-322;以及Georgiadis等, LongTerminal Repeat CRISPR-CAR-Coupled“Universal”T Cells Mediate Potent Anti-leukemic Effects,Molecular Therapy,正在刊印,校稿完毕,2018年3月6日线上提供)。可以使用如本 文所述的任何CRISPR系统及其使用方法来编辑细胞。可以通过本文所述的任何方法将所述 组合物和系统递送至免疫细胞。在优选实施方案中,离体编辑细胞并转移至有需要的受试者。 可以编辑免疫应答细胞、CAR T细胞或用于过继细胞转移的任何细胞。举例来说,可以进 行编辑以在细胞中的预选基因座(例如TRAC基因座)处插入或敲入外源基因,诸如编码CAR 或TCR的外源基因;消除潜在同种异体反应性T细胞受体(TCR)或防止内源和外源TCR链 之间的不当配对,例如敲除或敲低细胞中内源TCR的表达;破坏细胞中的化疗剂靶标;阻 断免疫检查点,诸如敲除或敲低细胞中免疫检查点蛋白或受体的表达;敲除或敲低细胞中其 他一个或多个基因的表达,其中减少表达或缺乏表达可以增强使用所述细胞的过继疗法的功 效;敲除或敲低细胞中内源基因的表达,所述内源基因编码外源CAR或TCR靶向的抗原; 敲除或敲低细胞中一种或多种MHC组成蛋白的表达;激活T细胞;调节细胞以使所述细胞 抵抗耗竭或功能障碍;和/或增加功能耗竭或功能障碍CD8+T细胞的分化和/或增殖(参见国 际专利公开号WO 2013/176915、WO 2014/059173、WO 2014/172606、WO2014/184744和 WO 2014/191128)。
在某些实施方案中,编辑可以导致基因失活。通过使基因失活,意图使目标基因不以功 能蛋白质形式表达。在一个具体实施方案中,所述系统特异性地催化对一个靶基因的切割, 从而使所述靶基因失活。引起的核酸链断裂通常通过同源重组或非同源末端连接(NHEJ)的 不同机制进行修复。然而,NHEJ是不完全修复过程,往往导致切割位点的DNA序列发生 变化。通过非同源末端连接(NHEJ)进行修复通常导致小插入或缺失(Indel),并可以用于产生 特定基因敲除。可以通过本领域众所周知的方法鉴定和/或选择其中已经发生切割诱导型诱 变事件的细胞。在某些实施方案中,使用同源性定向修复(HDR)同时使基因(例如,TRAC) 失活和将内源TCR或CAR插入失活的基因座中。
因此,在某些实施方案中,可以对细胞,具体来说是意图用于过继细胞疗法的细胞,更 具体来说是免疫应答细胞,诸如T细胞进行编辑,以便在细胞中的预选基因座插入或敲入 外源基因,诸如编码CAR或TCR的外源基因。通常,使用随机整合的载体将编码CAR或TCR的核酸分子转染或转导至细胞,取决于整合位点,这可能导致克隆扩增、致癌转化、 多样化转基因表达和/或转基因转录沉默。将转基因定向至细胞中的特定基因座可以最小化或避免此类风险,并有利地提供转基因被通过细胞均匀表达。不具限制性,用于定向转基因整合的合适‘安全港’基因座包括CCR5或AAVS1。同源性定向修复(HDR)策略是已知的并在本说明书中别处加以描述,其允许将转基因插入所需基因座(例如,TRAC基因座)。
用于插入转基因,具体来说是CAR或外源TCR转基因的其他合适的基因座包括但不限 于包含编码内源T细胞受体成分的基因的基因座,诸如T细胞受体α基因座(TRA)或T细胞受体β基因座(TRB),例如T细胞受体α恒定(TRAC)基因座、T细胞受体β恒定1(TRBC1) 基因座或T细胞受体β恒定2(TRBC1)基因座。有利地,转基因插入此类基因座可以同时实 现可能受内源启动子控制的转基因表达,以及敲除内源TCR表达。这种方法已例示于 Eyquem等,(2017)Nature 543:113-117中,其中作者们使用CRISPR/Cas9基因编辑将编码 CD19特异性CAR的DNA分子敲入内源启动子下游的TRAC基因座中;通过CRISPR获得 的CAR-T细胞显然在减少tonic CAR信号传导和耗竭方面非常优越。
T细胞受体(TCR)是参与响应于抗原呈递激活T细胞的细胞表面受体。TCR通常由两个 链,即α和β组成,它们组装形成异二聚体并与CD3转导亚基缔合形成存在于细胞表面上的T细胞受体复合物。TCR的α和β链各自由免疫球蛋白样N末端可变区(V)和恒定区(C)、 疏水性跨膜域和短细胞质区组成。至于免疫球蛋白分子,通过V(D)J重组产生α和β链可变 区,从而在T细胞群内产生多种多样的抗原特异性。然而,与识别完整抗原的免疫球蛋白 对比,通过加工过的肽片段与MHC分子缔合激活了T细胞,从而为T细胞的抗原识别引入 了一个额外维度,称为MHC限制。通过T细胞受体识别供体和受体之间的MHC差异导致 T细胞增殖和可能患上移植物抗宿主病(GVHD)。TCRα或TCRβ失活可以导致TCR从T细 胞表面消除,从而阻止识别同种异体抗原并因此阻止GVHD。然而,TCR破坏通常导致消 除了CD3信号传导组分并改变了进一步T细胞扩增的手段。
因此,在某些实施方案中,可以对细胞,具体来说是意图用于过继细胞疗法的细胞,更 具体来说是免疫应答细胞,诸如T细胞进行编辑,以敲除或敲低细胞中的内源TCR表达。 举例来说,可以采用基于NHEJ或基于HDR的基因编辑方法来破坏内源TCRα和/或β链基因。举例来说,可以设计一个或多个基因编辑系统,诸如一个或多个CRISPR/Cas系统,以 靶向在β1和β2恒定区基因(TRBC1和TRBC2)之间保守的TCRβ链内发现的序列和/或靶向 TCRα链(TRAC)基因的恒定区。
宿主免疫系统迅速排斥同种异体细胞。已经证明,未辐照血液制品中存在的同种异体白 细胞将持续不超过5至6天(Boni,Muranski等,2008Blood 1;112(12):4746-54)。因此,为了 防止同种异体细胞排斥,通常必须在一定程度上抑制宿主免疫系统。然而,在过继细胞转移 的情况下,使用免疫抑制药物也会对引入的治疗T细胞产生不利影响。因此,为了在这些 条件下有效地使用过继免疫治疗方法,引入的细胞将需要对免疫抑制治疗具有抗性。因此, 在一个具体实施方案中,本发明还包括修饰T细胞以使其对免疫抑制剂具有抗性的步骤, 优选通过使编码免疫抑制剂靶标的至少一个基因失活。免疫抑制剂是通过若干种作用机制之 一抑制免疫功能的剂。免疫抑制剂可以是但不限于钙调磷酸酶抑制剂、雷帕霉素靶标、白介 素-2受体α-链阻断剂、肌苷单磷酸脱氢酶抑制剂、二氢叶酸还原酶抑制剂、皮质类固醇或 免疫抑制抗代谢物。本发明允许通过使T细胞中免疫抑制剂的靶标失活对T细胞赋予免疫 抑制抗性以用于免疫治疗。作为非限制性实例,免疫抑制剂的靶标可以是免疫抑制剂的受体, 诸如:CD52、糖皮质激素受体(GR)、FKBP家族基因成员和亲环蛋白家族基因成员。
在某些实施方案中,可以对细胞,具体来说是意图用于过继细胞疗法的细胞,更具体来 说是免疫应答细胞,诸如T细胞进行编辑,以阻断免疫检查点,诸如敲除或敲低细胞中的 免疫检查点蛋白或受体表达。免疫检查点是减缓或终止免疫反应并防止免疫细胞的不受控活 性造成过度组织损伤的抑制途径。在某些实施方案中,靶向的免疫检查点是程序性死亡-1 (PD-1或CD279)基因(PDCD1)。在其他实施方案中,靶向的免疫检查点是细胞毒性T淋巴 细胞相关抗原(CTLA-4)。在其他实施方案中,靶向的免疫检查点是CD28和CTLA4 Ig超家 族的另一个成员,诸如BTLA、LAG3、ICOS、PDL1或KIR。在其他额外实施方案中,靶 向的免疫检查点是TNFR超家族的成员,诸如CD40、OX40、CD137、GITR、CD27或TIM-3。
其他免疫检查点包括含Src同源性2结构域的蛋白酪氨酸磷酸酶1(SHP-1)(WatsonHA 等,SHP-1:the next checkpoint target for cancer immunotherapy?Biochem SocTrans.2016年4 月15日;44(2):356-62)。SHP-1是一种广泛表达的抑制性蛋白酪氨酸磷酸酶(PTP)。在T细胞 中,它是抗原依赖性激活和增殖的负调控剂。它是一种细胞溶质蛋白,因此不顺应于抗体介 导的疗法,但它在激活和增殖中的作用使它成为了过继转移策略中有吸引力的基因操作靶 标,诸如嵌合抗原受体(CAR)T细胞。免疫检查点还可能包括具有Ig和ITIM结构域的T细 胞免疫受体(TIGIT/Vstm3/WUCAM/VSIG9)和VISTA(Le Mercier I等,(2015)Beyond CTLA-4and PD-1,the generation Z of negative checkpointregulators.Front.Immunol.6:418)。
国际专利公开号WO 2014/172606涉及使用MT1和/或MT2抑制剂来增加被耗竭的CD8+T细胞的增殖和/或活性并减少CD8+T细胞耗竭(例如,减少功能耗竭或无应答的 CD8+免疫细胞)。在某些实施方案中,通过在过继转移的T细胞中进行基因编辑来靶向金属 硫蛋白。
在某些实施方案中,基因编辑的靶标可以是参与免疫检查点蛋白表达的至少一个靶基因 座。此类靶标可能包括但不限于CTLA4、PPP2CA、PPP2CB、PTPN6、PTPN22、PDCD1、ICOS(CD278)、PDL1、KIR、LAG3、HAVCR2、BTLA、CD160、TIGIT、CD96、CRTAM、 LAIR1、SIGLEC7、SIGLEC9、CD244(2B4)、TNFRSF10B、TNFRSF10A、CASP8、CASP10、 CASP3、CASP6、CASP7、FADD、FAS、TGFBRII、TGFRBRI、SMAD2、SMAD3、SMAD4、 SMAD10、SKI、SKIL、TGIF1、IL10RA、IL10RB、HMOX2、IL6R、IL6ST、EIF2AK4、 CSK、PAG1、SIT1、FOXP3、PRDM1、BATF、VISTA、GUCY1A2、GUCY1A3、GUCY1B2、 GUCY1B3、MT1、MT2、CD40、OX40、CD137、GITR、CD27、SHP-1、TIM-3、CEACAM-1、 CEACAM-3或CEACAM-5。在优选实施方案中,靶向参与PD-1或CTLA-4基因表达的基 因座。在其他优选实施方案中,靶向基因的组合,诸如但不限于PD-1和TIGIT。
通过示例而非限制的方式,国际专利公开号WO 2016/196388涉及一种工程改造的T细 胞,其包含(a)特异性结合抗原的经基因工程改造的抗原受体,该受体可以是CAR;以及(b) 编码PD-L1的被破坏基因、用于破坏编码PD-L1的基因和/或破坏编码PD-L1的基因的剂, 其中所述破坏基因可以通过基因编辑核酸酶、锌指核酸酶(ZFN)、CRISPR/Cas9和/或TALEN 介导。WO2015142675涉及免疫效应细胞,其包含CAR与增加免疫效应细胞在治疗癌症方 面的功效的剂(诸如本文的组合物或系统)的组合,其中所述剂可以抑制免疫抑制分子,诸如 PD1、PD-L1、CTLA-4、TIM-3、LAG-3、VISTA、BTLA、TIGIT、LAIR1、CD160、2B4、 TGFRβ、CEACAM-1、CEACAM-3或CEACAM-5。Ren等,(2017)Clin Cancer Res 23(9) 2255-2266同时进行CAR的慢病毒递送和靶向内源TCR、β-2微球蛋白(B2M)和PD1的Cas9 mRNA和gRNA的电转移,以产生缺乏TCR、HLA I类分子和PD1的基因破坏的同种异体 CAR T细胞。
在某些实施方案中,可以工程改造细胞以表达CAR,其中所述细胞中的甲基胞嘧啶双 加氧酶基因(TET1、TET2和/或TET3)的表达和/或功能已经被降低或消除,(例如本文的组合 物或系统)(例如,如WO201704916所述)。
在某些实施方案中,可以对细胞,具体来说是意图用于过继细胞疗法的细胞,更具体来 说是免疫应答细胞,诸如T细胞进行编辑,以敲除或敲低细胞中的内源基因表达,所述内 源基因编码外源CAR或TCR靶向的抗原,从而降低靶向工程改造的细胞的可能性。在某些实施方案中,靶向的抗原可以是选自由以下组成的组的一个或多个抗原:CD38、CD138、 CS-1、CD33、CD26、CD30、CD53、CD92、CD100、CD148、CD150、CD200、CD261、 CD262、CD362、人端粒酶逆转录酶(hTERT)、存活素、小鼠双微体2同源物(MDM2)、细 胞色素P450 1B1(CYP1B)、HER2/neu、威尔姆斯氏肿瘤基因1(WT1)、存活蛋白、甲胎蛋 白(AFP)、癌胚抗原(CEA)、粘蛋白16(MUC16)、MUC1、前列腺特异性膜抗原(PSMA)、p53、 细胞周期蛋白(D1)、B细胞成熟抗原(BCMA)、跨膜激活子和CAML相互作用因子(TACI) 和B细胞激活因子受体(BAFF-R)(例如,如国际专利公开号WO 2016/011210和WO 2017/011804所述)。
在某些实施方案中,可以对细胞,具体来说是意图用于过继细胞疗法的细胞,更具体来 说是免疫应答细胞,诸如T细胞进行编辑,以敲除或敲低细胞中的一种或多种MHC组成蛋 白,诸如一种或多种HLA蛋白和/或β-2微球蛋白(B2M)的表达,从而可以减少或避免受体免疫系统对非自体(例如同种异体)细胞的排斥。在优选实施方案中,可以敲除或敲低一种或 多种HLA I类蛋白,诸如HLA-A、HLA-B和/或HLA-C,和/或B2M。优选地,可以敲除或 敲低B2M。举例来说,Ren等,(2017)Clin Cancer Res 23(9)2255-2266同时进行了CAR的 慢病毒递送和靶向内源TCR、β-2微球蛋白(B2M)和PD1的Cas mRNA和gRNA的电转移, 以产生缺乏TCR、HLA I类分子和PD1的基因破坏的同种异体CAR T细胞。
在其他实施方案中,编辑了至少两个基因。基因对可以包括但不限于PD1和TCRα、PD1 和TCRβ、CTLA-4和TCRα、CTLA-4和TCRβ、LAG3和TCRα、LAG3和TCRβ、Tim3 和TCRα、Tim3和TCRβ、BTLA和TCRα、BTLA和TCRβ、BY55和TCRα、BY55和TCRβ、 TIGIT和TCRα、TIGIT和TCRβ、B7H5和TCRα、B7H5和TCRβ、LAIR1和TCRα、LAIR1 和TCRβ、SIGLEC10和TCRα、SIGLEC10和TCRβ、2B4和TCRα、2B4和TCRβ、B2M 和TCRα、B2M和TCRβ。
在某些实施方案中,可以如本文所教导对细胞进行多重编辑(多路基因组编辑)以(1)敲除 或敲低内源TCR(例如,TRBC1、TRBC2和/或TRAC)的表达,(2)敲除或敲低免疫检查点蛋 白或受体(例如PD1、PD-L1和/或CTLA4)的表达;以及(3)敲除或敲低一种或多种MHC组成蛋白(例如,HLA-A、HLA-B和/或HLA-C,和/或B2M,优选B2M)的表达。
无论是在对T细胞进行基因修饰之前还是之后,都可以激活并扩增T细胞,一般使用 例如美国专利号6,352,694、6,534,055、6,905,680、5,858,358、6,887,466、6,905,681、7,144,575、 7,232,566、7,175,843、5,883,223、6,905,874、6,797,514、6,867,041和7,572,631所述的方法。 可以在体外或体内扩增T细胞。
可以使用本领域已知的任何方法获得免疫细胞。在一个实施方案中,同种异体T细胞 可以从健康受试者获得。在一个实施方案中,分离了已经浸润肿瘤的T细胞。可以在手术过程中去除T细胞。可以在通过活检取出肿瘤组织之后分离T细胞。可以通过本领域已知 的任何手段分离T细胞。在一个实施方案中,通过单采术获得T细胞。在一个实施方案中, 所述方法可以包括通过本领域已知的任何合适的方法从肿瘤样品获得大量T细胞。举例来 说,可以通过将肿瘤样品离解成可以从中选择特定细胞群的细胞悬液而从肿瘤样品获得大量T细胞群。获得大量T细胞群的合适的方法可以包括但不限于机械解离(例如切碎)肿瘤、酶促解离(例如消化)肿瘤和吸出(例如,利用针头)。
从肿瘤样品获得的大量T细胞可以包括任何合适类型的T细胞。优选地,从肿瘤样品 获得的大量T细胞群包含肿瘤浸润淋巴细胞(TIL)。
肿瘤样品可以获自任何哺乳动物。除非另外说明,否则如本文所用,术语“哺乳动物” 是指任何哺乳动物,包括但不限于以下哺乳动物:自形目,诸如兔子;食肉目,包括猫科动 物(猫)和犬科动物(狗);偶蹄目,包括牛科动物(牛)和猪科动物(猪);或奇蹄目,包括马科动 物(马)。哺乳动物可以是非人灵长类动物,例如灵长目、猿目或猴目(猴子)或类人猿目(人和 猿)。在一些实施方案中,哺乳动物可以是啮齿目哺乳动物,诸如小鼠和仓鼠。优选地,哺 乳动物是非人灵长类动物或人。尤其优选的哺乳动物是人。
T细胞可以从众多来源获得,包括外周血单核细胞(PBMC)、骨髓、淋巴结组织、脾组织和肿瘤。在本发明的某些实施方案中,T细胞可以使用本领域技术人员已知的众多技术,诸如Ficoll分离,从由受试者收集的单位血液获得。在一个优选实施方案中,来自个体循环血液的细胞通过单采术或白细胞单采术获得。单采术产物通常含有淋巴细胞,包括T细胞、单核细胞、粒细胞、B细胞、其他有核白细胞、红细胞和血小板。在一个实施方案中,可以 洗涤通过单采术收集的细胞以去除血浆级分并将所述细胞置于适当的缓冲液或培养基中以用于后续处理步骤。在本发明的一个实施方案中,用磷酸盐缓冲盐水(PBS)洗涤细胞。在一个替代实施方案中,洗涤溶液缺乏钙并且可能缺乏镁或可能缺乏许多(如果不是全部的话)二 价阳离子。在没有钙的情况下进行的初始激活步骤导致放大的激活。作为本领域普通技术人 员应当容易理解,可以通过本领域技术人员已知的方法来实现洗涤步骤,诸如通过根据制造 商的说明使用半自动化“流过”离心机(例如,Cobe 2991细胞处理器)。洗涤之后,可以将细 胞重悬于多种生物相容性缓冲液中,诸如不含Ca、不含Mg的PBS。替代地,可以去除单 采术样品中不需要的组分,并将细胞直接重悬于培养基中。
在另一个实施方案中,通过溶解红细胞并消耗单核细胞从外周血淋巴细胞分离T细胞, 例如通过PERCOLLTM梯度离心。可以通过阳性或负选择技术进一步分离特定T细胞亚群, 诸如CD28+、CD4+、CDC、CD45RA+和CD45RO+T细胞。举例来说,在一个优选实施方 案中,通过与抗CD3/抗CD28(即,3×28)缀合珠粒,诸如
Figure BDA0003651481360004621
M-450CD3/CD28 T或XCYTEDYNABEADSTM一起孵育足以正选择所需T细胞的时间段来分离T细胞。在一 个实施方案中,该时间段为约30分钟。在另一个实施方案中,所述时间段的范围是从30 分钟到36小时或更久,以及在它们之间的所有整数值。在另一个实施方案中,所述时间段 是至少1、2、3、4、5或6小时。在又一个优选实施方案中,所述时间段是10至24小时。 在一个优选实施方案中,所述孵育时间段是24小时。为了从白血病患者分离T细胞,使用 较长孵育时间(诸如24小时)可以增加细胞产量。在与其他细胞类型相比存在较少T细胞的 任何情况下,例如在从肿瘤组织或免疫受损个体分离肿瘤浸润淋巴细胞(TIL)时,可以使用 更长孵育时间来分离T细胞。此外,使用较长孵育时间可以增加捕获CD8+T细胞的效率。
通过负选择富集T细胞群可以用针对负选择细胞特有的表面标记物的抗体的组合来实 现。优选的方法是使用针对负选择的细胞上存在的细胞表面标记物的单克隆抗体混合物通过 负磁性免疫粘附或流式细胞术进行细胞分选和/或选择。举例来说,为了通过负选择富集 CD4+细胞,单克隆抗体混合物通常包括针对CD14、CD20、CD11b、CD16、HLA-DR和CD8的抗体。
此外,可以通过多种方法从血液制品消耗单核细胞群(例如,CD14+细胞),包括抗CD14 包覆的珠粒或柱,或者利用这些细胞的吞噬活性来促进去除。因此,在一个实施方案中,本 发明使用大小足以被吞噬单核细胞吞噬的顺磁性颗粒。在某些实施方案中,顺磁性颗粒是可 商购的珠粒,例如由Life Technologies以商标名DynabeadsTM生产的那些。在一个实施方案 中,通过用“不相关”蛋白质(例如血清蛋白或抗体)包覆顺磁性颗粒来去除其他非特异性细胞。 不相关蛋白质和抗体包括不特异性靶向欲分离的T细胞的那些蛋白质和抗体或其片段。在 某些实施方案中,无关珠粒包括包覆绵羊抗小鼠抗体、山羊抗小鼠抗体和人血清白蛋白的珠 粒。
简而言之,单核细胞的这种消耗是通过将从全血、单采外周血或肿瘤分离的T细胞与 一种或多种无关或非抗体偶联顺磁性颗粒一起以允许去除单核细胞的任何量(大约20:1珠粒: 细胞比)在22℃至37℃下预孵育约30分钟至2小时,然后磁性去除已附着至或吞没所述顺 磁性颗粒的细胞来进行。这种分离可以使用本领域可用的标准方法进行。举例来说,可以使 用任何磁分离方法,包括多种可商购的方法(例如,
Figure BDA0003651481360004631
磁颗粒浓缩器(DYNAL
Figure BDA0003651481360004632
))。可以通过本领域普通技术人员已知的多种方法监测确保必需的消耗,包括在消耗 前后对CD14阳性细胞进行流式细胞术分析。
为了通过阳性或负选择分离所需的细胞群,可以改变细胞和表面(例如颗粒,诸如珠粒) 的浓度。在某些实施方案中,可能需要显著降低珠粒和细胞混合在一起的体积(即,增加细 胞浓度),以确保细胞和珠粒的最大接触。举例来说,在一个实施方案中,使用20亿个细胞 /ml的浓度。在一个实施方案中,使用10亿个细胞/ml的浓度。在另一个实施方案中,使用 超过1亿个细胞/ml。在另一个实施方案中,使用1000万、1500万、2000万、2500万、3000万、3500万、4000万、4500万或5000万个细胞/ml的细胞浓度。在又一个实施方案中,使 用7500万、8000万、8500万、9000万、9500万或1亿个细胞/ml的细胞浓度。在其他实 施方案中,可以使用1.25亿或1.5亿个细胞/ml的浓度。使用高浓度可以增加细胞产量、细 胞激活和细胞扩增。此外,使用高细胞浓度允许更有效地捕获可能弱表达目标靶抗原(例如 CD28阴性T细胞)或来自存在许多肿瘤细胞的样品(即,白血病血液、肿瘤组织等)的细胞。 此类细胞群可能具有治疗价值并且将期望获得。举例来说,使用高细胞浓度允许更有效地选 择通常具有较弱CD28表达的CD8+T细胞。
在一个相关实施方案中,可能需要使用较低细胞浓度。通过显著稀释T细胞和表面(例 如颗粒,诸如珠粒)的混合物,最小化了颗粒和细胞之间的相互作用。这选择了表达大量所 需抗原的细胞与颗粒结合。举例来说,CD4+T细胞表达较高水平的CD28,并且与稀释浓度中的CD8+T细胞相比更有效地被捕获。在一个实施方案中,所用的细胞浓度是5×106个 /ml。在其他实施方案中,所用的浓度可以是约1×105/mL至1×106/mL,以及介于其之间的任何整数值。
还可以将T细胞冷冻。不希望受理论束缚,冷冻和随后的解冻步骤通过去除细胞群中 的粒细胞和在一定程度上去除单核细胞而提供更均匀的产品。在用以去除血浆和血小板的洗 涤步骤之后,可以将细胞悬浮在冷冻溶液中。尽管许多冷冻溶液和参数在本领域中是已知的 并且在这方面有用,但一种方法涉及使用含有20%DMSO和8%人血清白蛋白的PBS,或 其他合适的细胞冷冻介质,然后将细胞以1℃/分钟的速率冷冻至-80℃,并储存在液氮储槽 的气相中。可以使用其他受控冷冻方法以及立即在-20℃或在液氮中进行不受控冷冻。
用于本发明的T细胞还可以是抗原特异性T细胞。举例来说,可以使用肿瘤特异性T细胞。在某些实施方案中,可以从目标患者,诸如患有癌症或感染性疾病的患者分离抗原特异性T细胞。在一个实施方案中,确定受试者的新表位并分离对这些抗原特异的T细胞。 用于扩增的抗原特异性细胞还可以使用本领域已知的众多方法体外产生,例如,如题为Generation and Isolation of Antigen-Specific T Cells的美国专利公开号US20040224402或美 国专利号6,040,177所述。用于本发明的抗原特异性细胞还可以使用本领域已知的众多方法 产生,例如,如由John Wiley&Sons公司(Boston,Mass.)出版的Current Protocols in Immunology或Current Protocols in Cell Biology所述。
在一个相关实施方案中,可能需要在一轮或两轮扩增前后分选或以其他方式正选择(例 如通过磁性选择)抗原特异性细胞。可以使用肽-MHC四聚体进行分选或正选择抗原特异性 细胞(Altman等,Science.1996年10月4日;274(5284):94-6)。在另一个实施方案中,使用了 适应性四聚体技术方法(Andersen等,2012Nat Protoc.7:891-902)。四聚体受限于需要利用基 于之前假设的预测结合肽,以及对特定HLA的限制。肽-MHC四聚体可以使用本领域已知 的技术产生并且可以用如本文所述的任何目标MHC分子和任何目标抗原来制备。可以使用 本领域已知的众多测定法来鉴定在此情况下使用的特定表位。举例来说,可以通过监测促进 125I标记的β2-微球蛋白(β2m)并入MHC I类/β2m/肽异源三聚复合物中的能力来间接评估多 肽与I类MHC结合的能力(参见Parker等,J.Immunol.152:163,1994)。
在一个实施方案中,用表位特异性试剂直接标记细胞,以便通过流式细胞术分离,然后 表征表型和TCR。在一个实施方案中,通过与T细胞特异性抗体接触来分离T细胞。分选抗原特异性T细胞或通常本发明的任何细胞可以使用多种市售细胞分选机中的任一种来进行,包括但不限于MoFlo分选机(DakoCytomation,Fort Collins,Colo.)、FACSAriaTM、FACSArrayTM、FACSVantageTM、BDTM LSR II和FACSCaliburTM(BD Biosciences,San Jose,CA)。
在一个优选实施方案中,所述方法包括选择还表达CD3的细胞。所述方法可以包括以 任何合适的方式特异性地选择细胞。优选地,使用流式细胞术进行选择。可以使用本领域已 知的任何合适的方法进行流式细胞术。流式细胞术可以采用任何合适的抗体和染色剂。优选 地,选择所述抗体以使它特异性地识别并结合至所选特定生物标记物。举例来说,CD3、CD8、 TIM-3、LAG-3、4-1BB或PD-1的特异性选择分别可以使用抗CD3、抗CD8、抗TIM-3、抗LAG-3、抗4-1BB或抗PD-1抗体进行。一种或多种抗体可以与珠粒(例如,磁珠)或荧光 染料缀合。优选地,所述流式细胞术是荧光激活细胞分选(FACS)。可以根据对自体肿瘤的 反应性来选择在T细胞上表达的TCR。此外,可以使用专利公开号WO2014133567和WO2014133568中所述的方法基于标记物选择对肿瘤有反应的T细胞,所述专利公开通过引用整体并入本文。此外,可以根据CD107a的表面表达选择激活的T细胞。
在本发明的一个实施方案中,所述方法还包括扩增富集细胞群中的T细胞数目。美国 专利号8,637,307描述了此类方法并通过引用整体并入本文。T细胞的数目可以增加至少约 3倍(或4倍、5倍、6倍、7倍、8倍或9倍),更优选至少约10倍(或20倍、30倍、40倍、 50倍、60倍、70倍、80倍或90倍),更优选至少约100倍,更优选至少约1,000倍,或最 优选至少约100,000倍。可以使用本领域已知的任何合适的方法来扩增T细胞的数目。专利 公开号WO2003/057171、美国专利号8,034,334和美国专利公开号2012/0244133描述了扩 增细胞数目的示例性方法,并且各自通过引用并入本文。
在一个实施方案中,可以通过分离T细胞和随后的刺激或激活然后进一步扩增来进行 离体T细胞扩增。在本发明的一个实施方案中,可以通过单一试剂刺激或激活T细胞。在 另一个实施方案中,用两种剂刺激或激活T细胞,一种剂诱导主要信号,而第二种剂诱导共刺激信号。可用于刺激单个信号或刺激主要信号的配体以及刺激第二信号的辅助分子可以 呈可溶性形式使用。配体可以附着至细胞表面、工程改造的多价信号传导平台(EMSP)或固 定在表面上。在一个优选实施方案中,主要剂和次要剂都共固定在表面上,例如珠粒或细胞。 在一个实施方案中,提供主要激活信号的分子可以是CD3配体,而共刺激分子可以是CD28 配体或4-1BB配体。
在某些实施方案中,包含CAR或外源TCR的T细胞可以如国际专利公开号WO 2015/120096所述通过以下方法制造,所述方法包括富集从供体受试者获得的淋巴细胞群; 用一种或多种T细胞刺激剂刺激所述淋巴细胞群以产生激活的T细胞群,其中所述刺激是 在使用无血清培养基的封闭系统中进行;用包含编码所述CAR或TCR的核酸分子的病毒载 体转导所述激活的T细胞群,使用单循环转导以产生转导的T细胞群,其中所述转导是在 使用无血清培养基的封闭系统中进行;将所述转导的T细胞群扩增预定时间以产生工程改 造的T细胞群,其中所述扩增是在使用无血清培养基的封闭系统中进行。在某些实施方案 中,包含CAR或外源TCR的T细胞可以如WO 2015/120096所述通过以下方法制造,所述 方法包括:获得淋巴细胞群;用一种或多种刺激剂刺激所述淋巴细胞群以产生激活的T细 胞群,其中所述刺激是在使用无血清培养基的封闭系统中进行;用包含编码所述CAR或TCR 的核酸分子的病毒载体转导所述激活的T细胞群,使用至少一个循环转导以产生转导的T 细胞群,其中所述转导是在使用无血清培养基的封闭系统中进行;扩增所述转导的T细胞 群以产生工程改造的T细胞群,其中所述扩增是在使用无血清培养基的封闭系统中进行。 扩增所述转导的T细胞群的预定时间可以是3天。从富集所述淋巴细胞群到产生所述工程 改造的T细胞的时间可以是6天。所述封闭系统可以是封闭袋系统。还提供了通过所述方 法可获得或获得的包含CAR或外源TCR的T细胞群,以及包含此类细胞的药物组合物。
在某些实施方案中,可以通过如国际专利公开号WO 2017/070395所述的方法延迟或抑 制体外T细胞成熟或分化,所述方法包括使来自需要T细胞疗法的受试者的一个或多个T 细胞与AKT抑制剂(诸如WO2017070395的权利要求8公开的AKT抑制剂之一或者其中两种或更多种的组合)以及外源白介素-7(IL-7)和外源白介素-15(IL-15)中的至少一种接触,其 中所得T细胞表现出延迟的成熟或分化,和/或其中相对于不存在AKT抑制剂时培养的T 细胞的T细胞功能,所得T细胞表现出改善的T细胞功能(诸如增加的T细胞增殖;增加的细胞因子产生;和/或增加的溶细胞活性)。
在某些实施方案中,需要T细胞疗法的患者可以通过如国际专利公开号WO 2016/191756中所述的方法进行调理,所述方法包括向患者施用200mg/m2/天与2000mg/m2/ 天之间的环磷酰胺剂量和20mg/m2/天与900mg/m2/天之间的氟达拉滨剂量。
疾病
遗传疾病和具有遗传和/或表观遗传方面的疾病
所述组合物、系统或其组分可以用于治疗和/或预防遗传疾病或具有遗传和/或表观遗传 方面的疾病。本文例示的基因和疾患并非详尽无遗。在一些实施方案中,治疗和/或预防遗 传疾病的方法可以包括向受试者施用组合物、系统和/或其一种或多种组分,其中所述组合 物、系统和/或其一种或多种组分能够修饰受试者的一个或多个细胞中与遗传疾病或具有遗 传和/或表观遗传方面的疾病相关的一个或多个基因的一个或多个拷贝。在一些实施方案中, 修饰受试者中与遗传疾病或具有遗传和/或表观遗传方面的疾病相关的一个或多个基因的一 个或多个拷贝可以消除受试者的遗传疾病或其症状。在一些实施方案中,修饰受试者中与遗 传疾病或具有遗传和/或表观遗传方面的疾病相关的一个或多个基因的一个或多个拷贝可以 降低受试者中遗传疾病或其症状的严重性。在一些实施方案中,所述组合物、系统或其组分 可以修饰与一种或多种疾病(包括遗传疾病和/或具有遗传方面和/或表观遗传方面的那些,包 括但不限于表10所示的任一种或多种)相关的一个或多个基因或多核苷酸。应当理解,本文 列出的那些疾病和相关基因并非详尽无遗而且不具限制性。此外,一些基因在多种疾病的发 展中起作用。
表10
Figure BDA0003651481360004661
Figure BDA0003651481360004671
Figure BDA0003651481360004681
Figure BDA0003651481360004691
Figure BDA0003651481360004701
Figure BDA0003651481360004711
Figure BDA0003651481360004721
Figure BDA0003651481360004731
Figure BDA0003651481360004741
Figure BDA0003651481360004751
Figure BDA0003651481360004761
Figure BDA0003651481360004771
Figure BDA0003651481360004781
Figure BDA0003651481360004791
Figure BDA0003651481360004801
Figure BDA0003651481360004811
Figure BDA0003651481360004821
Figure BDA0003651481360004831
Figure BDA0003651481360004841
Figure BDA0003651481360004851
Figure BDA0003651481360004861
在一些实施方案中,所述组合物、系统或其组分可以用于通过修饰与一种或多种细胞功 能相关的一个或多个基因,诸如表11那些中的任一个或多个基因来治疗或预防受试者的疾 病。在一些实施方案中,所述疾病是遗传疾病或病症。在一些实施方案中,所述组合物、系 统或其组分可以修饰与一种或多种遗传疾病(诸如表11所示的任一种)相关的一个或多个基 因或多核苷酸。
Figure BDA0003651481360004862
Figure BDA0003651481360004871
Figure BDA0003651481360004881
Figure BDA0003651481360004891
Figure BDA0003651481360004901
Figure BDA0003651481360004911
Figure BDA0003651481360004921
Figure BDA0003651481360004931
Figure BDA0003651481360004941
Figure BDA0003651481360004951
在一个方面,本发明提供了一种个体化或个体化治疗有需要的受试者的遗传疾病的方 法,包括:(a)在组织、器官或细胞系中离体或在转基因非人哺乳动物体内引入一个或多个 突变,包括向所述组织、器官、细胞或哺乳动物的细胞递送包含如上述实施方案中任一个所 述的颗粒递送系统或递送系统或病毒颗粒或者如上述实施方案中任一个所述的细胞的组合 物,其中特定突变或确切序列取代与或已经与所述遗传疾病相关;(b)在已向其递送载体的 细胞上测试对所述遗传疾病的治疗,所述细胞具有与所述遗传疾病相关的特定突变或确切序 列取代;(c)基于来自步骤(b)的治疗测试的结果来治疗所述受试者。
感染性疾病
在一些实施方案中,所述组合物、系统或其组分可以用于诊断、预后、治疗和/或预防 由诸如细菌、病毒、真菌、寄生虫或其组合等微生物引起的感染性疾病。
在一些实施方案中,所述系统或其组分能够靶向混合群内的特定微生物。此类技术的示 例性方法描述于例如以下文献中:Gomaa AA,Klumpe HE,Luo ML,Selle K,Barrangou R, Beisel CL.2014.Programmable removal of bacterial strains by useof genome-targeting composition,systems,mBio 5:e00928-13;Citorik RJ,Mimee M,Lu TK.2014.Sequence-specific antimicrobials using efficiently delivered RNA-guided nucleases.Nat Biotechnol 32:1141-1145, 其教导可以经调整以用于本文所述的组合物、系统及其组分。
在一些实施方案中,所述组合物、系统和/或其组分能够靶向致病性和/或耐药性微生物, 诸如细菌、病毒、寄生虫和真菌。在一些实施方案中,所述组合物、系统和/或其组分能够 靶向和修饰致病性微生物中的一个或多个多核苷酸,从而使所述微生物被降低毒性、杀死、 抑制或以其他方式使其不能在宿主细胞中引起疾病和/或感染和/或复制。
在一些实施方案中,可以通过本文所述的组合物、系统和/或其组分靶向和/或修饰的病 原细菌包括但不限于以下菌属的那些:放线菌属(例如伊氏放线菌(A.israelii))、芽孢杆菌属 (例如炭疽芽孢杆菌(B.anthracis)、蜡样芽孢杆菌(B.cereus))、拟杆菌属(例如脆弱拟杆菌(B. fragilis))、巴尔通体属(汉氏巴尔通体(B.henselae)、五日热巴尔通体(B.quintana))、博德特 氏菌属(百日咳博德特氏菌(B.pertussis))、疏螺旋体属(例如伯氏疏螺旋体(B.burgdorferi)、 伽氏疏螺旋体(B.garinii)、阿氏疏螺旋体(B.afzelii)和回归热疏螺旋体(B.recurreentis))、布 鲁氏菌属(例如流产布鲁氏菌(B.abortus)、犬布鲁氏菌(B.canis)、马尔他布鲁氏菌(B. melitensis)和猪布鲁氏菌(B.suis))、弯曲杆菌属(例如空肠弯曲杆菌(C.jejuni))、衣原体属(例 如肺炎衣原体(C.pneumoniae)和沙眼衣原体(C.trachomatis))、嗜衣原体属(例如鹦鹉热嗜衣 原体(C.psittaci))、梭菌属(例如肉毒梭菌(C.botulinum)、艰难梭菌(C.difficile)、产气荚膜梭 菌(C.perfringens)、破伤风梭菌(C.tetani))、棒状杆菌属(例如白喉棒状杆菌(C.diptheriae))、 肠球菌属(例如粪肠球菌(E.Faecalis)、屎肠球菌(E.faecium))、埃里希体属(犬埃里希体(E. canis)和查菲埃里希体(E.chaffensis))、大肠杆菌属(例如大肠杆菌(E.coli))、弗朗西斯菌属 (例如土拉弗朗西斯菌(F.tularensis))、嗜血杆菌属(例如流感嗜血杆菌(H.influenzae))、螺杆 菌属(幽门螺杆菌(H.pylori))、克雷伯氏菌属(例如肺炎克雷伯氏菌(K.pneumoniae))、军团菌 属(例如嗜肺军团菌(L.pneumophila))、钩端螺旋体属(例如问号钩端螺旋体(L.interrogans)、 圣地罗斯钩端螺旋体(L.santarosai)、韦氏钩端螺旋体(L.weili)、野口氏钩端螺旋体(L. noguchii))、李斯特菌属(例如单核细胞增多性李斯特菌(L.monocytogenes))、分枝杆菌属(例 如麻风分支杆菌(M.leprae)、结核分枝杆菌(M.tuberculosis)、溃疡分枝杆菌(M.ulcerans))、 支原体属(肺炎支原体(M.pneumoniae))、奈瑟菌属(淋病奈瑟菌(N.gonorrhoeae)和脑膜炎奈 瑟菌(N.menigitidis))、诺卡氏菌属(例如星状诺卡氏菌(N.asteeroides))、假单胞菌属(铜绿假 单胞菌(P.aeruginosa))、立克次氏体属(立克次氏体)、沙门氏菌属(伤寒沙门氏菌(S.typhi)和 鼠伤寒沙门氏菌(S.typhimurium))、志贺氏菌属(宋内氏志贺氏菌(S.sonnei)和痢疾志贺氏菌(S. dysenteriae))、葡萄球菌属(金黄色葡萄球菌(S.aureus)、表皮葡萄球菌(S.epidermidis)和腐生 葡萄球菌(S.saprophyticus))、链球菌属(无乳链球菌(S.agalactiaee)、肺炎链球菌(S. pneumoniae)、酿脓链球菌(S.pyogenes))、密螺旋体属(苍白密螺旋体(T.pallidum))、脲原体 属(例如解脲脲原体(U.urealyticum))、弧菌属(例如霍乱弧菌(V.cholerae))、耶尔森氏菌属 (例如鼠疫耶尔森氏菌(Y.pestis)、小肠结肠炎耶尔森氏菌(Y.enteerocolitica)和假结核病耶尔 森氏菌(Y.pseudotuberculosis))。
在一些实施方案中,可以通过本文所述的组合物、系统和/或其组分靶向和/或修饰的致 病性病毒包括但不限于双链DNA病毒、部分双链DNA病毒、单链DNA病毒、阳性单链RNA病毒、阴性单链RNA病毒或双链RNA病毒。在一些实施方案中,所述致病性病毒可 以来自腺病毒科(例如腺病毒)、疱疹病毒科(例如单纯疱疹病毒1型、单纯疱疹病毒2型、水 痘-带状疱疹病毒、爱泼斯坦-巴尔病毒、人巨细胞病毒、人疱疹病毒8型)、乳头瘤病毒科(例 如人乳头瘤病毒)、多瘤病毒科(例如BK病毒、JC病毒)、痘病毒科(例如天花)、嗜肝DNA 病毒科(例如乙型肝炎)、细小病毒科(例如细小病毒B19)、星状病毒科(例如人星状病毒)、杯 状病毒科(例如诺沃克病毒)、小核糖核酸病毒科(例如柯萨奇病毒、甲型肝炎病毒、脊髓灰质 炎病毒、鼻病毒)、冠状病毒科(例如严重急性呼吸综合征相关冠状病毒,菌株:严重急性呼 吸综合征病毒、严重急性呼吸综合征冠状病毒2(COVID-19))、黄病毒科(例如丙型肝炎病毒、黄热病毒、登革热病毒、西尼罗河病毒、TBE病毒)、披膜病毒科(例如风疹病毒)、肝炎病 毒科(例如戊型肝炎病毒)、逆转录病毒科(人免疫缺陷病毒(HIV))、正粘病毒科(例如流感病毒)、沙粒病毒科(例如拉沙病毒)、布尼亚病毒科(例如克里米亚-刚果出血热病毒、汉坦病毒)、 丝状病毒科(例如埃博拉病毒和马尔堡病毒)、副粘病毒科(例如麻疹病毒、腮腺炎病毒、副流 感病毒、呼吸道合胞病毒))、弹状病毒科(狂犬病病毒)、丁型肝炎病毒、呼肠孤病毒科(例如 轮状病毒、环状病毒、结肠病毒、版纳病毒)。
在一些实施方案中,可以通过本文所述的组合物、系统和/或其组分靶向和/或修饰的致 病性真菌包括但不限于以下各属的那些:念珠菌属(例如白色念珠菌)、曲霉属(例如烟曲霉(A. fumigatus)、黄曲霉(A.flavus)、棒状曲霉(A.clavatus))、隐球菌属(例如新型隐球菌(C. neoformans)、加特隐球菌(C.gattii))、组织胞浆菌属(例如荚膜组织胞浆菌(H.capsulatum)、 肺孢子虫属(例如耶氏肺孢子虫(P.jiroveecii)、葡萄状穗霉属(例如黑葡萄穗霉(S.chartarum))。
在一些实施方案中,可以通过本文所述的组合物、系统和/或其组分靶向和/或修饰的致 病性寄生虫包括但不限于原生动物、蠕虫和外寄生虫。在一些实施方案中,可以通过本文所 述的组合物、系统和/或其组分靶向和/或修饰的致病性原生动物包括但不限于来自肉足纲(例 如阿米巴属,诸如内阿米巴属)、鞭毛纲(例如鞭毛虫属,诸如贾第鞭毛虫属和利什曼虫属)、 纤毛虫纲(例如纤毛虫属,诸如小袋虫属)和孢子虫纲(如疟原虫属和隐孢子虫属)的那些。在 一些实施方案中,可以通过本文所述的组合物、系统和/或其组分靶向和/或修饰的致病性蠕 虫包括但不限于扁虫(扁虫门)、刺头虫(棘头门)和蛔虫(线虫门)。在一些实施方案中,可以通 过本文所述的组合物、系统和/或其组分靶向和/或修饰的致病性外寄生虫包括但不限于蜱、 跳蚤、虱和螨。
在一些实施方案中,可以通过本文所述的组合物、系统和/或其组分靶向和/或修饰的致 病性寄生虫包括但不限于棘阿米巴属(Acanthamoeba spp.)、狒狒巴拉姆希阿米巴(Balamuthia mandrillaris)、巴贝虫属(例如巴贝虫属分歧巴贝虫(B.divergens)、二联巴贝虫(B. bigemina)、马巴贝西虫(B.equi)、微小巴贝西虫(B.microfti)、邓肯巴贝西虫(B.duncani))、 小袋虫属(例如结肠小袋虫(Balantidium coli))、芽囊原虫属(Blastocystis spp.)、隐孢子虫属 (Cryptosporidium spp.)、环孢子虫属(Cyclosporiasis spp.)(例如圆孢子虫(Cyclospora cayetanensis))、双核阿米巴属(Dientamoebiasis spp.)(例如脆弱双核阿米巴(Dientamoeba fragilis))、阿米巴属(例如溶组织内阿米巴(Entamoeba histolytica))、贾第鞭毛虫属(例如兰氏 贾第鞭毛虫(Giardia lamblia))、等孢子球虫属(例如贝氏等孢子球虫(Isospora belli))、利什曼 虫属、耐格里虫属(例如福氏耐格里虫(Naegleria fowleri))、疟原虫属(例如恶性疟原虫(Plasmodium falciparum)、间日疟原虫(Plasmodium vivax)、卵形疟原虫柯氏亚种(Plasmodium ovale curtisi)、卵形疟原虫华氏亚种(Plasmodium ovale wallikeri)、三日疟原虫 (Plasmodium malariae)、诺氏疟原虫(Plasmodium knowlesi))、鼻孢子虫属(例如西伯氏鼻孢 子虫(Rhinosporidium seeberi))、肉孢子虫属(例如牛人肉孢子虫(Sarcocystis bovihominis)、猪 人肉孢子虫(Sarcocystis suihominis))、弓形虫属(例如刚地弓形虫(Toxoplasma gondii))、毛滴 虫属(例如阴道毛滴虫(Trichomonasvaginalis))、锥虫属(例如布氏锥虫(Trypanosoma brucei))、锥虫属(例如克氏锥虫(Trypanosoma cruzi))、绦虫属(例如多节绦虫纲(Cestoda)、多 头带绦虫(Taeniamulticeps)、牛肉绦虫(Taenia saginata)、猪肉绦虫(Taenia solium))、阔节裂 头绦虫、棘球属(例如细粒棘球绦虫(Echinococcus granulosus)、多房棘球绦虫(Echinococcusmultilocularis)、沃格尔棘球绦虫(E.vogeli)、少头棘球绦虫(E.oligarthrus)、膜壳绦虫属(例 如短膜壳绦虫(Hymenolepis nana)、长膜壳绦虫(Hymenolepis diminuta))、伯特绦虫属(例如古 巴伯特绦虫(Bertiella mucronata)、司氏伯特绦虫(Bertiella studeri))、叠宫绦虫属(例如欧猥 叠宫绦虫(Spirometra erinaceieuropaei))、支睾吸虫属(例如华支睾吸虫(Clonorchis sinensis); 麝猫支睾吸虫(Clorchis viverrini))、双腔吸虫属(例如枪状双腔吸虫(Dicrocoelium dendriticum))、片吸虫属(例如肝片吸虫(Fasciolahepatica)、大片吸虫(Fasciola gigantica)、 姜片虫属(例如布氏姜片虫(Fasciolopsisbuski))、后殖吸虫属(例如横川后殖吸虫 (Metagonimus yokogawai))、次睾吸虫属(例如结合次睾吸虫(Metorchis conjunctus))、后睾吸 虫属(例如麝猫后睾吸虫(Opisthorchisviverrini)、猫后睾吸虫(Opisthorchis felineus))、支睾吸 虫属(例如华支睾吸虫)、并殖吸虫属(例如卫氏并殖吸虫(Paragonimus westermani);非洲并 殖吸虫(ParagonimusAfricanus);卡里并殖吸虫(Paragonimus caliensis);猫肺并殖吸虫 (Paragonimuskellicotti);斯氏并殖吸虫(Paragonimus skrjabini);双侧宫并殖吸虫 (Paragonimusuterobilateralis))、血吸虫属、血吸虫属(例如曼森氏血吸虫(Schistosoma mansoni)、埃及血吸虫(Schistosoma haematobium)、日本血吸虫(Schistosoma japonicum)、湄 公血吸虫(Schistosoma mekongi)和刚果裂体吸虫(Schistosoma intercalatum))、棘口吸虫属(例 如多刺棘口吸虫(E.echinatum))、毛毕吸虫属(例如瑞氏毛毕吸虫(Trichobilharziaregent))、 钩虫属(例如十二指肠钩虫(Ancylostoma duodenale))、线虫属(例如美洲线虫(Necator americanus))、管圆线虫属、异尖线虫属、蛔虫属(例如蛔虫(Ascarislumbricoides))、贝蛔属 (例如浣熊贝蛔虫(Baylisascaris procyonis))、布鲁丝虫属(例如马来布鲁丝虫(Brugia malayi)、帝纹布鲁丝虫(Brugia timori))、膨结线虫属(例如肾膨结线虫(Dioctophyme renene))、龙线虫属(例如麦地那龙线虫(Dracunculusmedinensis))、蛲虫属(例如蠕形住肠蛲 虫(Enterobius vermicularis)、格氏蛲虫(Enterobius gregorii))、颚口线虫属(例如棘颚口线虫 (Gnathostoma spinigerum)、刚刺颚口线虫(Gnathostoma hispidum))、哈利头叶线虫属(例如牙 龈哈利头叶线虫(Halicephalobus gingivalis))、罗阿丝虫属(例如罗阿丝虫(Loa loa filaria))、 曼森线虫属(例如链尾曼森线虫(Mansonella streptocerca))、盘尾丝虫属(例如旋盘尾丝虫(Onchocerca volvulus))、类圆线虫属(例如粪类圆线虫(Strongyloides stercoralis))、吸吮线虫 属(例如加利福尼亚吸吮线虫(Thelazia californiensis)、结膜吸吮线虫(Thelazia callipaeda))、 弓蛔虫属(例如犬弓蛔虫(Toxocara canis)、猫弓蛔虫(Toxocara cati)、狮弓蛔虫(Toxascaris leonine))、旋毛虫属(例如旋毛线虫(Trichinella spiralis)、布氏旋毛虫(Trichinella britovi)、纳 氏旋毛虫(Trichinella nelsoni)、乡土旋毛虫(Trichinella nativa))、鞭虫属(例如毛首鞭虫(Trichuris trichiura)、狐鞭虫(Trichuris vulpis))、吴策线虫属(例如班氏吴策线虫(Wuchereria bancrofti))、皮蝇属(例如人肤皮蝇(Dermatobia hominis))、潜蚤属(例如穿皮潜蚤(Tunga penetrans))、锥蝇属(例如嗜人锥蝇(Cochliomyia hominivorax))、舌形虫属(例如鼻腔舌形虫 (Linguatula serrata))、原棘头虫属、念珠棘虫属(例如念珠棘虫(Moniliformis moniliformis))、 虱属(例如头虱(Pediculus humanus capitis)、体虱(Pediculus humanus humanus))、阴虱属(例 如阴虱(Pthirus pubis))、蛛形纲(例如,恙螨科、硬蜱科、软蜱科)、蚤科(例如蚤科 (Siphonaptera):蚤亚科(Pulicinae))、臭虫科(例如温带臭虫(Cimex lectularius)和热带臭虫 (Cimex hemipterus)、双翅目、蠕形螨属(例如毛囊蠕形螨(Demodex folliculorum)/短蠕形螨 (Demodex brevis)/犬(Demodexcanis))、疥螨属(例如疥螨(Sarcoptes scabiei))、皮刺螨属(例如 鸡皮刺螨(Dermanyssus gallinae))、禽刺螨属(例如林禽刺螨(Ornithonyssus sylviarum)、囊禽刺螨(Ornithonyssus bursa)、拔氏禽刺螨(Ornithonyssus bacoti))、厉螨属(例如毒厉螨(Laelaps echidnina))、异脂刺螨属(例如血红异脂刺螨(Liponyssoides sanguineus))。
在一些实施方案中,基因靶标可以是Strich和Chertow.2019.J.Clin.Microbio.57:4 e01307-18的表1所示的那些中的任一个。所述文献并入本文,就如同本文表述于本文一样。
在一些实施方案中,所述方法可以包括将组合物、系统和/或其组分递送至本文所述的 致病性生物体,允许所述组合物、系统和/或其组分特异性结合并修饰所述致病性生物体中 的一个或多个靶标,借此所述修饰杀死、抑制、降低所述致病性生物体的致病性,或以其他 方式致使所述致病性生物体无致病性。在一些实施方案中,所述组合物、系统的递送发生在 体内(即,在被治疗的受试者中)。在一些实施方案中,通过对受试者无致病性但能够转移多 核苷酸和/或感染所述致病性微生物的媒介物,诸如微生物或噬菌体发生。在一些实施方案 中,所述媒介微生物可以是含有所述组合物、系统和/或其组分和/或CRISPR-Cas载体和/或 载体系统的经工程改造的细菌、病毒或噬菌体。所述方法可以包括向欲治疗的受试者施用含 有所述组合物、系统和/或其组分和/或CRISPR-Cas载体和/或载体系统的媒介微生物。然后 所述媒介微生物可以产生所述CRISPR系统和/或其组分或将组合物、系统、多核苷酸转移 至致病性生物体。在诸多实施方案中,在将所述CRISPR系统和/或其组分、载体或载体系 统转移至所述致病性微生物时,随后在所述致病性微生物中产生所述组合物、系统或其组分 并修饰所述致病性微生物,以使其被降低毒性、杀死、抑制或以其他方式使其不能在宿主或 其细胞中引起疾病和/或感染和/或复制。
在一些实施方案中,当所述致病性微生物将其遗传物质插入到所述宿主细胞的基因组 (例如病毒)中时,可以设计所述组合物、系统以使它修饰所述宿主细胞的基因组,使得病毒 DNA或cDNA不能被宿主细胞的机制复制成功能性病毒。在一些实施方案中,当所述致病 性微生物将其遗传物质插入到所述宿主细胞的基因组(例如病毒)中时,可以设计所述组合 物、系统以使它修饰所述宿主细胞的基因组,以便从所述宿主细胞的基因组缺失所述病毒 DNA或cDNA。
应当理解,抑制或杀死病原微生物可以治疗或预防受试者因被它感染而导致的疾病和/ 或疾患。因此,本文还提供了治疗和/或预防由任一种或多种病原微生物(诸如本文所述的那 些微生物中的任一种)引起的一种或多种疾病或其症状的方法。
线粒体疾病
一些最具挑战性的线粒体病症起因于线粒体DNA(mtDNA),即母体遗传的高拷贝数基 因组中的突变。在一些实施方案中,可以使用本文所述的组合物、系统来修饰mtDNA突变。 在一些实施方案中,可以诊断、预后、治疗和/或预防的线粒体疾病可以是MELAS(线粒体 肌病脑病和乳酸性酸中毒和中风样发作)、CPEO/PEO(慢性进行性外眼肌麻痹综合征/进行性 外眼肌麻痹)、KSS(卡恩斯-塞尔综合征(Kearns-Sayre syndrome))、MIDD(母系遗传性糖尿病 和耳聋)、MERRF(肌阵挛性癫痫合并破碎红纤维症)、NIDDM(非胰岛素依赖性糖尿病)、 LHON(莱伯遗传性视神经病变)、LS(利氏综合征(Leigh Syndrome))氨基糖苷类诱导的听力 障碍、NARP(神经病变、共济失调和色素性视网膜病)、锥体外系病症伴运动不能性强直、 精神病和SNHL、非综合征性听力损失、心肌病、脑肌病、皮尔森综合征(Pearson'ssyndrome) 或其组合。
在一些实施方案中,可以在体内或离体修饰受试者的mtDNA。在一些实施方案中,在 离体修饰mtDNA时,修饰之后可以将含有修饰的线粒体的细胞施用回受试者。在一些实施 方案中,所述组合物、系统或其组分能够修正mtDNA突变或其组合。
在一些实施方案中,所述一个或多个mtDNA突变中的至少一个选自由以下组成的组: A3243G、C3256T、T3271C、G1019A、A1304T、A15533G、C1494T、C4467A、T1658C、 G12315A、A3421G、A8344G、T8356C、G8363A、A13042T、T3200C、G3242A、A3252G、 T3264C、G3316A、T3394C、T14577C、A4833G、G3460A、G9804A、G11778A、G14459A、 A14484G、G15257A、T8993C、T8993G、G10197A、G13513A、T1095C、C1494T、A1555G、 G1541A、C1634T、A3260G、A4269G、T7587C、A8296G、A8348G、G8363A、T9957C、 T9997C、G12192A、C12297T、A14484G、G15059A、位置305-314和/或956-965处的 CCCCCTCCCC串联重复序列复制、位置8,469-13,447、4,308-14,874和/或4,398-14,822处 的缺失、961ins/delC、线粒体常见缺失(例如mtDNA 4,977bp缺失)及其组合。
在一些实施方案中,线粒体突变可以是如mitomap.org可获得的Mitomap可获得的一个 或多个生物信息学工具中所示或通过使用所述一个或多个生物信息学工具鉴定的任何突变。 此类工具包括但不限于“Variant Search,又名Market Finder”、Find Sequencesfor Any Haplogroup,又名“Sequence Finder”、“Variant Info”、“POLG PathogenicityPrediction Server”、 “MITOMASTER”、“Allele Search”、“Sequence and VariantDownloads”、“Data Downloads”。 MitoMap含有可能与疾病相关的mtDNA突变的报告,并维护报告的线粒体DNA碱基取代 疾病数据库:rRNA/tRNA突变。
在一些实施方案中,所述方法包括将组合物、系统和/或其组分递送至细胞,并且更具 体来说递送至细胞中的一个或多个线粒体,从而允许所述组合物、系统和/或其组分修饰所 述细胞中的一个或多个靶多核苷酸,并且更具体来说修饰所述细胞中的一个或多个线粒体。 所述靶多核苷酸可以对应于mtDNA中的突变,诸如本文所述的那些中的任一个或多个。在 一些实施方案中,所述修饰可以改变线粒体的功能,使得与未修饰的线粒体相比,线粒体功 能正常或至少不太有功能障碍。修饰可以在体内或离体发生。在离体进行修饰时,可以以自 体或同种异体的方式将含有修饰线粒体的细胞施用于有需要的受试者。
微生物组修饰
微生物组在健康和疾病中发挥重要作用。举例来说,肠道微生物组可以通过控制消化、 防止致病性微生物生长而在健康方面发挥作用,并且已提出其影响情绪和情感。失衡的微生 物组可以促进疾病,并且提出它们促成体重增加、血糖失控、高胆固醇、癌症和其他病症。 健康微生物组具有一系列可以与非健康个体区分开来的关节特征,因此疾病相关微生物组的 检测和鉴定可以用于诊断和检测个体的疾病。所述组合物、系统及其组分可以用于筛检微生 物组细胞群并用于鉴定疾病相关微生物组。本文在别处描述了利用组合物、系统及其组分的 细胞筛检方法,并且可以将其应用于筛检受试者的微生物组,诸如肠道、皮肤、阴道和/或 口腔微生物组。
在一些实施方案中,可以使用本文所述的组合物、系统和/或其组分来修饰受试者中的 微生物组的微生物群。在一些实施方案中,所述组合物、系统和/或其组分可以用于鉴定和 选择微生物组中的一个或多个细胞类型并将它们从微生物组群中去除。本文在别处描述了使 用组合物、系统和/或其组分选择细胞的示例性方法。通过这种方式,可以改变微生物组的 组成或微生物特征。在一些实施方案中,所述改变致使从患病微生物组组合物变成健康微生 物组组合物。以这种方式,可以改变一个微生物类型或种类与另一个的比率,例如从患病比 率变为健康比率。在一些实施方案中,所选细胞是致病性微生物。
在一些实施方案中,本文所述的组合物和系统可以用于修饰受试者微生物组的微生物中 的多核苷酸。在一些实施方案中,所述微生物是致病性微生物。在一些实施方案中,所述微 生物是共生的非致病性微生物。本文在别处描述了修饰受试者细胞中的多核苷酸的方法,并 且可以将其应用于这些实施方案。
疾病和疾患的模型
在一个方面,本发明提供了一种对与真核生物体或非人生物体中的基因组基因座相关的 疾病进行建模的方法,包括操作所述基因组基因座的编码、非编码或调控元件内的靶序列, 包括递送包含病毒载体系统的非天然存在或工程改造的组合物,所述病毒载体系统包含一个 或多个病毒载体,所述一个或多个病毒载体可操作地编码供其表达的组合物,其中所述组合 物包含如上述实施方案中任一个所述的颗粒递送系统或递送系统或病毒颗粒,或如上述实施 方案中任一个所述的细胞。
在一个方面,本发明提供了一种产生模型真核细胞的方法,所述模型真核细胞可以包括 一个或多个突变疾病基因和/或感染性微生物。在一些实施方案中,疾病基因是与患有或发 展疾病的风险增加相关的任何基因。在一些实施方案中,所述方法包括(a)将一个或多个载 体引入真核细胞中,其中所述一个或多个载体包含组合物、系统和/或其组分和/或能够驱动 组合物、系统和/或其组分表达的载体或载体系统,包括但不限于:任选地连接到tracr配偶 序列、tracr序列、一个或多个Cas效应子及其组合的向导序列;和(b)允许组合物、系统或 复合物结合一个或多个靶多核苷酸,例如以实现对所述疾病基因内的靶多核苷酸的切割、切 口或其他修饰,其中所述组合物、系统或复合物由一个或多个CRISPR-Cas效应子与(1)与所 述靶多核苷酸内的靶序列杂交的一个或多个向导序列,和任选地(2)与一个或多个tracr序列 杂交的一个或多个tracr配偶序列的复合物组成,从而产生包含一个或多个突变疾病基因的 模型真核细胞。因此,在一些实施方案中,所述组合物和系统含有用于并驱动表达以下一项 或多项的核酸分子:Cas效应子、与tracr配偶序列连接的向导序列、以及tracr序列和/或同 源重组模板,和/或稳定配体(如果Cas效应子具有去稳定结构域)。在一些实施方案中,所述 切割包括通过Cas效应子在靶序列的位置对一个或两个链进行切割。在一些实施方案中,切 口包括通过Cas效应子在靶序列的位置对一个或两个链进行切口。在一些实施方案中,所述 切割或切口修饰了靶多核苷酸的转录。在一些实施方案中,修饰减少了靶多核苷酸的转录。 在一些实施方案中,所述方法还包括通过与重组模板多核苷酸同源重组来修复所述切割或切 口的靶多核苷酸,其中所述修复导致突变,包括插入、缺失或取代所述靶多核苷酸的一个或 多个核苷酸。在一些实施方案中,所述突变在包含靶序列的基因的蛋白质表达中引起一个或 多个氨基酸变化。
建模的疾病可以是具有遗传或表观遗传成分的任何疾病。在一些实施方案中,建模的疾 病可以是如本文在别处讨论的任何疾病,包括但不限于如本文表10和表11所示的任何疾病。
原位疾病检测
所述组合物、系统和/或其组分可以用于诊断性检测方法,诸如CASFISH(参见例如Deng 等,2015.PNAS USA 112(38):11870-11875)、CRISPR-Live FISH(参见例如Wang等,2020. Science;365(6459):1301-1305)、sm-FISH(Lee和Jefcoate.2017.Front.Endocrinol. doi.org/10.3389/fendo.2017.00289)、顺序FISHCRISPRainbow(Ma等,Nat Biotechnol,34 (2016),第528-530页)、CRISPR-Sirius(NatMethods,15(2018),第928-931页)、Casilio (Cheng等,Cell Res,26(2016),第254-257页)、基于Halo-Tag的基因组基因座观察技术(例 如Deng等,2015.PNAS USA 112(38):11870-11875;Knight等,Science,350(2015),第 823-826页)、基于RNA-适体的方法(例如Ma等,J Cell Biol,214(2016),第529-537页)、基 于分子信标的方法(例如Zhao等,Biomaterials,100(2016),第172-183页;Wu等,Nucleic Acids Res(2018))、基于量子点的系统(例如Ma等,Anal Chem,89(2017),第12896-12901 页)、多路方法(例如Ma等,ProcNatl Acad Sci U S A,112(2015),第3002-3007页;Fu等,Nat Commun,7(2016),第11707页;Ma等,Nat Biotechnol,34(2016),第528-530页;Shao等, Nucleic Acids Res,44(2016),论文e86);Wang等,Sci Rep,6(2016),第26857页)、
Figure BDA0003651481360005021
和其他 基于原位CRISPR杂交的方法(例如Chen等,Cell,155(2013),第1479-1491页;Gu等, Science,359(2018),第1050-1055页;Tanebaum等,Cell,159(2014),第635-646页;Ye等, Protein Cell,8(2017),第853-855页;Chen等,Nat Commun,9(2018),第5065页;Shao等, ACS Synth Biol(2017);Fu等,Nat Commun,7(2016),第11707页;Shao等,Nucleic Acids Res,44(2016),论文e86;Wang等,Sci Rep,6(2016),第26857页),所有这些都通过引用并 入本文,就好像对它们整体进行表述一样,并且鉴于本文的描述,它们的教导可能适合于本 文所述的组合物、系统及其组分。
在一些实施方案中,所述组合物、系统或其组分可以用于检测方法,诸如本文所述的原 位检测方法。在一些实施方案中,所述组合物、系统或其组分可以包括本文所述的催化失活 Cas效应子,并将此系统用于检测方法,诸如荧光原位杂交(FISH)或本文所述的任何其他方 法。在一些实施方案中,缺乏产生DNA双链断裂的能力的失活Cas效应子可以与标记物融 合,诸如荧光蛋白,诸如增强型绿色荧光蛋白(eEGFP),并与小向导RNA共表达以在体内 靶向中心周围、中心和端粒重复序列。dCas效应子或其系统可以用于观察人类基因组中的 重复序列和个别基因。经标记的dCas效应子及其组合物、系统的此类新应用在细胞成像和 研究功能核结构方面可能很重要,尤其是在具有小核体积或复杂3D结构的情况下。
细胞选择
在一些实施方案中,本文所述的组合物、系统和/或其组分可以用于筛检和/或选择细胞 的方法。在一些实施方案中,基于组合物、系统的筛检/选择方法可以用于鉴定细胞群中的 患病细胞。在一些实施方案中,选择细胞导致了所述细胞中的修饰,使得所选细胞死亡。通 过这种方式,可以鉴定患病细胞,并将其从健康细胞群中去除。在一些实施方案中,所述患 病细胞可以是癌细胞、癌前细胞、病毒或其他致病性生物体感染的细胞,或其他异常细胞。 在一些实施方案中,所述修饰可以在欲选择的细胞中赋予另一个可检测变化(例如,功能变 化和/或基因组条形码),这有助于选择所需细胞。在一些实施方案中,可以使用负选择方案 来获得所需的细胞群。在这些实施方案中,对欲选择的细胞进行修饰,因此可以基于它们的 死亡而将它们从细胞群中去除或者基于赋予细胞的可检测变化进行鉴定或分选。因此,在这 些实施方案中,选择之后的其余细胞是所需的细胞群。
在一些实施方案中,选择含有多核苷酸修饰的一个或多个细胞的方法可以包括:将一种 或多种组合物、系统和/或其组分,和/或载体或载体系统引入所述细胞中,其中所述组合物、 系统和/或其组分,和/或载体或载体系统含有和/或能够表达以下一项或多项:Cas效应子、 任选地与tracr配偶序列连接的向导序列、tracr序列和重组模板;其中,举例来说,所述组 合物、系统、载体或载体系统和/或所述重组模板内所表达的和通过其在体内表达的包含能 消除Cas效应子切割的一个或多个突变;允许所述重组模板与所述靶多核苷酸在欲选择的细 胞中同源重组;允许组合物、系统或复合物与靶多核苷酸结合以实现对所述基因内的靶多核 苷酸的切割,其中AAV-复合物包含与以下复合的Cas效应子:(1)与所述靶多核苷酸内的靶 序列杂交的向导序列,和(2)与tracr序列杂交的tracr配偶序列,其中所述复合物与所述靶多 核苷酸的结合诱导了细胞死亡或赋予了细胞一些其他可检测的变化,从而允许选择其中已经 引入了一个或多个突变的一个或多个细胞。在一些实施方案中,欲选择的细胞可以是真核细 胞。在一些实施方案中,欲选择的细胞可以是原核细胞。通过本文的方法选择特定细胞可以 在不需要选择标记物或可能包括反选系统的两步法的情况下进行。
治疗剂开发
本文所述的组合物、系统及其组分可以用于开发基于CRISPR-Cas和基于非CRISPR-Cas 的生物活性剂,诸如小分子治疗剂。因此,本文描述了用于开发调节与疾病和/或疾病基因 相关的细胞功能和/或信号传导事件的生物活性剂的方法。在一些实施方案中,所述方法包 括(a)使测试化合物与患病细胞和/或含有疾病基因细胞的细胞接触;(b)检测表明细胞信号传 导事件或与所述疾病或疾病基因相关的其他细胞功能减少或增加的读数变化,从而开发调节 所述细胞信号传导事件或与所述疾病基因相关的其他功能的所述生物活性剂。在一些实施方 案中,所述患病细胞是本文在别处描述的模型细胞。在一些实施方案中,所述患病细胞是从 需要治疗的受试者分离的患病细胞。在一些实施方案中,所述测试化合物是小分子剂。在一 些实施方案中,测试化合物是小分子剂。在一些实施方案中,所述测试化合物是生物分子剂。
在一些实施方案中,所述方法包括开发基于本文所述的组合物、系统的治疗剂。在特定 实施方案中,所述治疗剂包含能够与目标靶序列杂交的Cas效应子和/或向导RNA。在特定 实施方案中,所述治疗剂是载体或载体系统,其可以包含:a)可操作地连接至编码Cas效应 蛋白的核苷酸序列的第一调控元件;b)可操作地连接至编码一个或多个核酸分子的一个或多 个核苷酸序列的第二调控元件,所述一个或多个核酸分子包含向导RNA,所述向导RNA包 含向导序列、顺向重复序列;其中组分(a)和(b)位于相同或不同的载体上。在特定实施方案 中,所述生物活性剂是一种组合物,所述组合物包含被可操作地配置以便将组合物、系统或 其组分和/或含有或编码所述组分的一个或多个多核苷酸序列、载体或载体系统递送到细胞 中的递送系统,并且能够与本文的组合物和系统的组分形成复合物,并且其中所述复合物在 所述细胞中是可操作的。在一些实施方案中,所述复合物可以包括如本文所述的Cas效应蛋 白、包含向导序列的向导RNA和顺向重复序列。在任何此类组合物中,所述递送系统可以 是酵母系统、脂质转染系统、显微注射系统、基因枪系统、病毒体、脂质体、免疫脂质体、 聚阳离子、脂质:核酸缀合物或人造病毒体,或如本文所述的任何其他系统。在特定实施方 案中,所述递送是通过颗粒、纳米颗粒、脂质或细胞穿透肽(CPP)。
本文还描述了用于开发或设计组合物、系统、任选地基于组合物、系统的疗法或治疗剂 的方法,包括(a)选择目标(治疗)基因座gRNA靶位点,其中所述靶位点在群体中具有最小序 列变异,并从所述选择的靶位点中子选择靶位点,其中针对所述靶位点的gRNA识别所述 群体中最少数目的脱靶位点,或(b)选择目标(治疗)基因座gRNA靶位点,其中所述靶位点在 群体中具有最小序列变异,或选择目标(治疗)基因座gRNA靶位点,其中针对所述靶位点的 gRNA识别所述群体中最少数目的脱靶位点,并任选地估计治疗或以其他方式调节或操作群 体所需的(子)选择靶位点的数目,并任选地验证个别受试者的一个或多个(子)选择靶位点, 任选地设计识别一个或多个所述(子)选择靶位点的一个或多个gRNA。
在一些实施方案中,用于开发或设计用于组合物、系统、任选地基于组合物、系统的疗 法或治疗剂的gRNA的方法可以包括(a)选择目标(治疗)基因座gRNA靶位点,其中所述靶位 点在群体中具有最小序列变异,并且从所述选择的靶位点中子选择靶位点,其中针对所述靶 位点的gRNA识别所述群体中最少数目的脱靶位点,或(b)选择目标(治疗)基因座gRNA靶位 点,其中所述靶位点在群体中具有最小序列变异,或选择目标(治疗)基因座gRNA靶位点, 其中针对所述靶位点的gRNA识别所述群体中最少数目的脱靶位点,并任选地估计治疗或 以其他方式调节或操作群体所需的(子)选择靶位点的数目,任选地验证个别受试者的一个或 多个(子)选择靶位点,任选地设计识别一个或多个所述(子)选择靶位点的一个或多个gRNA。
在一些实施方案中,用于在群体中开发或设计组合物、系统、任选地基于组合物、系统 的疗法或治疗剂的方法可以包括(a)选择目标(治疗)基因座gRNA靶位点,其中所述靶位点在 群体中具有最小序列变异,并且从所述选择的靶位点中子选择靶位点,其中针对所述靶位点 的gRNA识别所述群体中最少数目的脱靶位点,或(b)选择目标(治疗)基因座gRNA靶位点, 其中所述靶位点在群体中具有最小序列变异,或选择目标(治疗)基因座gRNA靶位点,其中 针对所述靶位点的gRNA识别所述群体中最少数目的脱靶位点,并任选地估计治疗或以其 他方式调节或操作群体所需的(子)选择靶位点的数目,任选地验证个别受试者的一个或多个 (子)选择靶位点,任选地设计识别一个或多个所述(子)选择靶位点的一个或多个gRNA。
在一些实施方案中,用于在群体中开发或设计用于组合物、系统、任选地基于组合物、 系统的疗法或治疗剂的gRNA的方法可以包括(a)选择目标(治疗)基因座gRNA靶位点,其中 所述靶位点在群体中具有最小序列变异,并且从所述选择的靶位点中子选择靶位点,其中针 对所述靶位点的gRNA识别所述群体中最少数目的脱靶位点,或(b)选择目标(治疗)基因座 gRNA靶位点,其中所述靶位点在群体中具有最小序列变异,或选择目标(治疗)基因座gRNA 靶位点,其中针对所述靶位点的gRNA识别所述群体中最少数目的脱靶位点,并任选地估 计治疗或以其他方式调节或操作群体所需的(子)选择靶位点的数目,任选地验证个别受试者 的一个或多个(子)选择靶位点,任选地设计识别一个或多个所述(子)选择靶位点的一个或多 个gRNA。
在一些实施方案中,用于任选地在群体中开发或设计组合物、系统,诸如基于组合物、 系统的疗法或治疗剂;或者用于任选地在群体中开发或设计用于组合物、系统、任选地基于 组合物、系统的疗法或治疗剂的gRNA的方法可以包括针对靶群体中的一个或多个基因座 选择一组靶序列,其中所述靶序列不含以高于阈值等位基因频率出现于所述靶群体中的变体 (即,铂靶序列);从所述选择的(铂)靶序列中去除具有高频脱靶候选物(相对于该组中的其他 (铂)靶标)的任何靶序列以定义最终靶序列组;基于最终靶序列组制备一个或多个,诸如一组 组合物、系统,任选地其中所制备的众多CRISP-Cas系统(至少部分地)基于靶群体的大小。
在某些实施方案中,使用基于测序的双链断裂(DSB)检测测定(诸如本文在别处所述)来 鉴定或确定脱靶候选物/脱靶、PFS、PAM限制性、靶标切割效率或效应蛋白特异性。在某 些实施方案中,使用基于测序的双链断裂(DSB)检测测定(诸如本文在别处所述)来鉴定或确 定脱靶候选物/脱靶。在某些实施方案中,脱靶或脱靶候选物具有至少1个、优选1至3个 错配或(远端)PFS或PAM错配,诸如1个或多个,诸如1个、2个、3个或更多个(远端)PFS 或PAM错配。在某些实施方案中,基于测序的DSB检测测定包括用包含引物结合位点的 衔接子标记DSB的位点,用条形码或唯一分子标识符标记DSB的位点,或其组合,如本文 在别处所述。
应当理解,gRNA的向导序列与靶位点100%互补,即不包含与靶位点的任何错配。还 应理解,gRNA“识别”(脱)靶位点以组合物、系统、功能为前提,即,gRNA仅在gRNA与(脱)靶位点结合时才识别(脱)靶位点,导致组合物、系统、活性(诸如诱导单链或双链DNA切割、转录调节等)。
在某些实施方案中,在群体中具有最小序列变异的靶位点以在至少99%、优选至少 99.9%、更优选至少99.99%的群体中不存在序列变异为特征。在某些实施方案中,优化目标 位置包括选择在至少99%、优选至少99.9%、更优选至少99.99%的群体中不存在序列变异 的靶序列或基因座。这些靶标在本文别处也称为“铂靶标”。在某些实施方案中,所述群体包 括至少1000名个体,诸如至少5000名个体,诸如至少10000名个体,诸如至少50000名个 体。
在某些实施方案中,脱靶位点以脱靶位点和gRNA之间的至少一个错配为特征。在某 些实施方案中,脱靶位点以脱靶位点和gRNA之间的至多五个、优选至多四个、更优选至多三个错配为特征。在某些实施方案中,脱靶位点以脱靶位点和gRNA之间的至少一个错 配以及脱靶位点和gRNA之间的至多五个、优选至多四个、更优选至多三个错配为特征。
在某些实施方案中,针对所述群体中的高频单倍型确定所述群体中的脱靶位点的所述最 少数目。在某些实施方案中,针对所述群体中脱靶位点基因座的高频单倍型确定所述群体中 的脱靶位点的所述最少数目。在某些实施方案中,针对所述群体中靶位点基因座的高频单倍 型确定所述群体中的脱靶位点的所述最少数目。在某些实施方案中,所述高频单倍型以存在 于至少0.1%的群体中为特征。
在某些实施方案中,基于低频序列变异,诸如在大规模测序数据集中捕获的低频序列变 异来估计治疗群体需要的(子)选择靶位点的数目。在某些实施方案中,估计治疗指定大小的 群体所需的(子)选择靶位点的数目。
在某些实施方案中,所述方法还包括获得欲治疗的受试者的基因组测序数据;以及用选 自组合物、系统组的组合物、系统治疗所述受试者,其中所选择的组合物、系统(至少部分 地)基于所述个体的基因组测序数据。在某些实施方案中,通过基因组测序,优选全基因组 测序来验证((子)选择的)靶标。
在某些实施方案中,基于对一个或多个参数的优化来(进一步)选择如本文所述的靶序列 或基因座,所述一个或多个参数为诸如PFS或PAM类型(天然的或修饰的)、PFS或PAM核 苷酸含量、PFS或PAM长度、靶序列长度、PFS或PAM限制性、靶标切割效率以及基因、 基因座或其他基因组区域内的靶序列位置。本文在别处更详细地讨论了优化方法。
在某些实施方案中,基于对靶基因座位置、靶标长度、靶标特异性和PFS或PAM特征中的一项或多项的优化来(进一步)选择如本文所述的靶序列或基因座。如本文所用,PFS或PAM特征可以包括例如PFS或PAM序列、PFS或PAM长度、和/或PFS或PAM GC含量。 在某些实施方案中,优化PFS或PAM特征包括优化PFS或PAM的核苷酸含量。在某些实 施方案中,优化PFS或PAM的核苷酸含量是选择具有最大化在一个或多个靶基因座中的丰 度、最小化突变频率或兼而有之的基序的PFS或PAM。举例来说,可以通过选择缺乏或具 有低或最低CpG的PFS或PAM序列来实现最小化突变频率。
在某些实施方案中,基于对选自由以下组成的组中的一个或多个参数的优化来选择用于 一组组合物、系统中的每一种组合物和系统的效应蛋白:效应蛋白大小、效应蛋白进入高染 色质可及性区域的能力、基因组靶标的酶活性均匀程度、表观遗传耐受性、错配/微移耐受 性、效应蛋白特异性、效应蛋白稳定性或半衰期、效应蛋白免疫原性或毒性。本文在别处更 详细地讨论了优化方法。
系统优化
本发明的方法可以包括优化与所述组合物、系统和/或其功能相关的所选参数或变量, 如本文在别处进一步描述。如本文所述的方法中的组合物、系统的优化可以取决于靶标(诸 如一个或多个治疗靶标)、组合物、系统的模式或类型、组合物、系统、组分的调节(诸如基 于组合物、系统的一个或多个治疗靶标调节)、修饰或操作以及递送。取决于基因型和/或表 型结果,可以选择一个或多个靶标。举例来说,取决于(遗传)疾病病因或期望的治疗结果, 可以选择一个或多个治疗靶标。(治疗)靶标可以是单个基因、基因座或其他基因组位点,或 者可以是多个基因、基因座或其他基因组位点。如本领域已知,可以不止一次靶向单个基因、 基因座或其他基因组位点,诸如通过使用多个gRNA。
所述组合物和/或系统,诸如基于CRISPR-Cas系统的疗法或治疗剂的活性可能涉及靶标 破坏,诸如靶标突变,诸如导致基因敲除。所述组合物和/或系统,诸如基于CRISPR-Cas 系统的疗法或治疗剂的活性可能涉及替换特定靶位点,诸如导致靶标修正。基于CRISPR-Cas 系统的疗法或治疗剂可能涉及去除特定靶位点,诸如导致靶标缺失。所述组合物和/或系统, 诸如基于CRISPR-Cas系统的疗法或治疗剂的活性可能涉及调节靶位点功能,诸如靶位点活 性或可及性,从而导致例如(转录和/或表观遗传)基因或基因组区域激活或者基因或基因组区 域沉默。技术人员应理解靶位点功能的调节可能涉及CRISPR效应子突变(诸如产生催化失 活的CRISPR效应子)和/或功能化(诸如CRISPR效应子与异源功能域融合,诸如转录激活子 或阻遏子),如本文在别处所述。
因此,在一个方面,本发明涉及一种如本文所述的方法,包括选择一个或多个(治疗)靶 标,选择所述组合物和/或系统的一个或多个功能,以及优化与所述CRISPR-Cas系统和/或 其功能相关的所选参数或变量。在一个相关方面,本发明涉及一种如本文所述的方法,包括 (a)选择一个或多个(治疗)靶基因座,(b)选择一个或多个CRISPR-Cas系统功能,(c)任选地选 择一个或多个递送模式,并制备、开发或设计基于步骤(a)至(c)选择的CRISPR-Cas系统。
在某些实施方案中,所述组合物和/或系统的功能包括基因组突变。在某些实施方案中, 所述组合物和/或系统的功能包括单个基因组突变。在某些实施方案中,所述组合物和/或系 统的功能包括多个基因组突变。在某些实施方案中,所述组合物和/或系统的功能包括基因 敲除。在某些实施方案中,所述组合物和/或系统的功能包括单个基因敲除。在某些实施方 案中,所述组合物和/或系统的功能包括多个基因敲除。在某些实施方案中,所述组合物和/ 或系统的功能包括基因修正。在某些实施方案中,所述组合物和/或系统的功能包括单个基 因修正。在某些实施方案中,所述组合物和/或系统的功能包括多个基因修正。在某些实施 方案中,所述组合物和/或系统的功能包括基因组区域修正。在某些实施方案中,所述组合 物和/或系统的功能包括单个基因组区域修正。在某些实施方案中,所述组合物和/或系统的 功能包括多个基因组区域修正。在某些实施方案中,所述组合物和/或系统的功能包括基因 缺失。在某些实施方案中,所述组合物和/或系统的功能包括单个基因缺失。在某些实施方 案中,所述组合物和/或系统的功能包括多个基因缺失。在某些实施方案中,所述组合物和/ 或系统的功能包括基因组区域缺失。在某些实施方案中,所述组合物和/或系统的功能包括 单个基因组区域缺失。在某些实施方案中,所述组合物和/或系统的功能包括多个基因组区 域缺失。在某些实施方案中,所述组合物和/或系统的功能包括调节基因或基因组区域功能。 在某些实施方案中,所述组合物和/或系统的功能包括调节单个基因或基因组区域功能。在 某些实施方案中,所述组合物和/或系统的功能包括调节多个基因或基因组区域功能。在某 些实施方案中,所述组合物和/或系统的功能包括基因或基因组区域功能,诸如基因或基因 组区域活性。在某些实施方案中,所述组合物和/或系统的功能包括单个基因或基因组区域 功能,诸如基因或基因组区域活性。在某些实施方案中,所述组合物和/或系统的功能包括 多个基因或基因组区域功能,诸如基因或基因组区域活性。在某些实施方案中,所述组合物 和/或系统的功能包括调节基因活性或可及性,任选地导致转录和/或表观遗传基因或基因组 区域激活或者基因或基因组区域沉默。在某些实施方案中,所述组合物和/或系统的功能包 括调节单个基因活性或可及性,任选地导致转录和/或表观遗传基因或基因组区域激活或者 基因或基因组区域沉默。在某些实施方案中,所述组合物和/或系统的功能包括调节多个基 因活性或可及性,任选地导致转录和/或表观遗传基因或基因组区域激活或者基因或基因组 区域沉默。
如本文所述的方法中的所选参数或变量的优化可能优化或改进所述系统(诸如基于 CRISPR-Cas系统的疗法或治疗剂)、特异性、功效和/或安全性。在某些实施方案中,如本文所述的本发明方法中考虑、选择或优化了以下参数或变量中的一个或多个:Cas蛋白变构相互作用、Cas蛋白功能域和功能域相互作用、CRISPR效应子特异性、gRNA特异性、 CRISPR-Cas复合物特异性、PFS或PAM限制性、PFS或PAM类型(天然的或修饰的)、PFS 或PAM核苷酸含量、PFS或PAM长度、CRISPR效应子活性、gRNA活性、CRISPR-Cas 复合物活性、靶标切割效率、靶位点选择、靶序列长度、效应蛋白进入高染色质可及性区域 的能力、基因组靶标间的酶活性均匀程度、表观遗传耐受性、错配/微移耐受性、CRISPR效 应子稳定性、CRISPR效应子mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、 CRISPR效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物 免疫原性或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas 复合物剂量或滴度、CRISPR效应蛋白大小、CRISPR效应子表达水平、gRNA表达水平、 CRISPR-Cas复合物表达水平、CRISPR效应子时空表达、gRNA时空表达、CRISPR-Cas复 合物时空表达。
通过示例而非限制的方式,可以如下实现参数或变量优化。可以通过选择最特异的 CRISPR效应子来优化CRISPR效应子特异性。这可以例如通过选择最特异的CRISPR效应子直系同源物或通过增加特异性的特定CRISPR效应子突变来实现。可以通过选择最特异的gRNA来优化gRNA特异性。这可以例如通过选择与脱靶位点具有低同源性,即至少一个或 优选多个,诸如至少2个或优选至少3个错配的gRNA来实现。CRISPR-Cas复合物特异性 可以通过如上增加CRISPR效应子特异性和/或gRNA特异性来优化。PFS或PAM限制性可 以通过选择具有最严格PFS或PAM识别的CRISPR效应子来优化。这可以例如通过选择具 有更限制性PFS或PAM识别的CRISPR效应子直系同源物或者通过增加或改变PFS或PAM 限制性的特定CRISPR效应子突变来实现。PFS或PAM类型可以例如通过选择适当的 CRISPR效应子,诸如识别所需PFS或PAM类型的适当CRISPR效应子来优化。所述CRISPR 效应子或PFS或PAM类型可以是天然存在的,或者可以例如基于具有改变的PFS或PAM 识别或者PFS或PAM识别谱的CRISPR效应突变体加以优化。PFS或PAM核苷酸含量可 以例如通过选择适当的CRISPR效应子,诸如识别所需PFS或PAM核苷酸含量的适当 CRISPR效应子来优化。所述CRISPR效应子或PFS或PAM类型可以是天然存在的,或者 可以例如基于具有改变的PFS或PAM识别或者PAM识别谱的CRISPR效应突变体加以优 化。PFS或PAM长度可以例如通过选择适当的CRISPR效应子,诸如识别所需PFS或PAM 核苷酸长度的适当CRISPR效应子来优化。所述CRISPR效应子或PFS或PAM类型可以是 天然存在的,或者可以例如基于具有改变的PFS或PAM识别或者PFS或PAM识别谱的 CRISPR效应突变体加以优化。
靶标长度或靶序列长度可以例如通过选择适当的CRISPR效应子,诸如识别期望的靶标 或靶序列核苷酸长度的适当的CRISPR效应子来优化。替代地或另外地,可以通过提供长度 偏离了通常与CRISPR效应子(诸如天然存在的CRISPR效应子)相关的靶(序列)长度的靶标 来优化靶(序列)长度。CRISPR效应子或靶(序列)长度可以是天然存在的,或者可以例如基于 具有改变的靶(序列)长度识别或靶(序列)长度识别谱的CRISPR效应子突变体进行优化。举 例来说,增加或减少靶(序列)长度可能影响靶标识别和/或脱靶识别。可以通过选择最具活性 的CRISPR效应子来优化CRISPR效应子活性。这可以例如通过选择最具活性的CRISPR效 应子直系同源物或者通过增加活性的特定CRISPR效应子突变来实现。CRISPR效应蛋白进 入高染色质可及性区域的能力可以通过选择适当的CRISPR效应子或其突变体加以优化,并 且可以考虑CRISPR效应子的大小、电荷或其他尺寸变量等。CRISPR效应子活性均匀程度 可以通过选择适当的CRISPR效应子或其突变体加以优化,并且可以考虑CRISPR效应子特 异性和/或活性、PFS或PAM特异性、靶标长度、错配耐受性、表观遗传耐受性、CRISPR 效应子和/或gRNA稳定性和/或半衰期、CRISPR效应子和/或gRNA免疫原性和/或毒性等。 可以通过选择最具活性的gRNA来优化gRNA活性。在一些实施方案中,这可以通过以RNA 修饰增加gRNA稳定性来实现。CRISPR-Cas复合物活性可以通过如上增加CRISPR效应子活性和/或gRNA活性来优化。
靶位点选择可以通过选择靶位点在基因、基因座或其他基因组区域内的最佳位置来优 化。靶位点选择可以通过优化靶位置,包括选择具有低变异性的基因、基因座或其他基因组 区域的靶序列来优化。这可以例如通过选择早期和/或保守外显子或结构域中的靶位点(即, 在群体内具有低变异性,诸如多态性)来实现。
在某些实施方案中,优化靶(序列)长度包括选择一个或多个靶基因座内在5至25个核 苷酸之间的靶序列。在某些实施方案中,靶序列是20个核苷酸。
在某些实施方案中,优化靶标特异性包括选择最小化脱靶候选物的靶基因座。
在一些实施方案中,可以通过最小化脱靶效应(例如,因与靶标相比具有1-5个、1-4个 或优选1-3个错配和/或具有一个或多个PFS或PAM错配,诸如远端PFS或PAM错配而合格的脱靶),优选地还考虑群体内的变异性来选择靶位点。可以通过选择具有适当半衰期,诸如优选短半衰期同时仍能够保持足够活性的CRISPR效应子来优化CRISPR效应子稳定性。在一些实施方案中,这可以通过选择具有特定半衰期的适当CRISPR效应子直系同源物或通过影响半衰期或稳定性的特定CRISPR效应子突变或修饰,诸如包含(例如融合)稳定化或去稳定化结构域或序列来实现。CRISPR效应子mRNA稳定性可以通过增加或降低 CRISPR效应子mRNA稳定性来优化。在一些实施方案中,这可以通过以mRNA修饰增加 或降低CRISPR效应子mRNA稳定性来实现。gRNA稳定性可以通过增加或降低gRNA稳 定性来优化。在一些实施方案中,这可以通过以RNA修饰增加或降低gRNA稳定性来实现。 CRISPR-Cas复合物稳定性可以通过如上增加或降低CRISPR效应子稳定性和/或gRNA稳定 性来优化。CRISPR效应蛋白或mRNA免疫原性或毒性可以通过降低CRISPR效应蛋白或 mRNA免疫原性或毒性来优化。在一些实施方案中,这可以通过mRNA或蛋白质修饰来实 现。类似地,在基于DNA的表达系统的情况下,可以降低DNA免疫原性或毒性。gRNA 免疫原性或毒性可以通过降低gRNA免疫原性或毒性来优化。在一些实施方案中,这可以 通过gRNA修饰来实现。类似地,在基于DNA的表达系统的情况下,可以降低DNA免疫 原性或毒性。CRISPR-Cas复合物免疫原性或毒性可以通过如上降低CRISPR效应子免疫原 性或毒性和/或gRNA免疫原性或毒性,或通过选择免疫原性或毒性最小的CRISPR效应子 /gRNA组合来优化。类似地,在基于DNA的表达系统的情况下,可以降低DNA免疫原性 或毒性。CRISPR效应蛋白或mRNA剂量或滴度可以通过选择剂量或滴度以最小化毒性和/ 或最大化特异性和/或功效来优化。gRNA剂量或滴度可以通过选择剂量或滴度以最小化毒 性和/或最大化特异性和/或功效来优化。CRISPR-Cas复合物剂量或滴度可以通过选择剂量 或滴度以最小化毒性和/或最大化特异性和/或功效来优化。CRISPR效应蛋白大小可以通过 选择最小的蛋白质大小以提高递送效率(特别是对于病毒介导的递送)来优化。CRISPR效应 子、gRNA或CRISPR-Cas复合物表达水平可以通过限制(或延长)表达持续时间和/或限制(或 增加)表达水平来优化。这可以例如通过使用自失活组合物、系统(诸如包括自靶向(例如 CRISPR效应子靶向)gRNA)、通过使用具有有限表达持续时间的病毒载体、通过使用针对 低(或高)表达水平的适当启动子、通过组合针对个别CRISP-Cas系统组分的不同递送方法(诸 如病毒介导的CRISPR效应子编码核酸递送与非病毒介导的gRNA递送组合,或病毒介导的 gRNA递送与非病毒介导的CRISPR效应蛋白或mRNA递送组合)来实现。CRISPR效应子、 gRNA或CRISPR-Cas复合物时空表达可以通过适当地选择条件性和/或诱导型表达系统,包 括可控CRISPR效应子活性,任选地去稳定型CRISPR效应子和/或分裂型CRISPR效应子, 和/或细胞或组织特异性表达系统来优化。
在一个方面,本发明涉及一种如本文所述的方法,包括选择一个或多个(治疗)靶标、选 择组合物和/或系统的功能、选择CRISPR-Cas系统递送模式、选择CRISPR-Cas系统递送载 体或表达系统,以及优化与CRISPR-Cas系统和/或其功能相关的所选参数或变量,任选地其 中所述参数或变量是选自以下的一项或多项:CRISPR效应子特异性、gRNA特异性、CRISPR-Cas复合物特异性、PFS或PAM限制性、PFS或PAM类型(天然的或修饰的)、PFS 或PAM核苷酸含量、PFS或PAM长度、CRISPR效应子活性、gRNA活性、CRISPR-Cas 复合物活性、靶标切割效率、靶位点选择、靶序列长度、效应蛋白进入高染色质可及性区域 的能力、基因组靶标的酶活性均匀程度、表观遗传耐受性、错配/微移耐受性、CRISPR效应 子稳定性、CRISPR效应子mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR 效应蛋白或mRNA免疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性 或毒性、CRISPR效应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物 剂量或滴度、CRISPR效应蛋白大小、CRISPR效应子表达水平、gRNA表达水平、CRISPR-Cas 复合物表达水平、CRISPR效应子时空表达、gRNA时空表达、CRISPR-Cas复合物时空表 达。
在一个方面,本发明涉及一种如本文所述的方法,包括选择一个或多个(治疗)靶标、选 择所述组合物和/或系统的一种或多种功能、选择一种或多种CRISPR-Cas系统递送模式、选 择一种或多种递送载体或表达系统,以及优化与CRISPR-Cas系统和/或其功能相关的所选参 数或变量,其中优化了特异性、功效和/或安全性,并且任选地其中优化特异性包括优化选 自以下的一个或多个参数或变量:CRISPR效应子特异性、gRNA特异性、CRISPR-Cas复 合物特异性、PFS或PAM限制性、PFS或PAM类型(天然的或修饰的)、PFS或PAM核苷 酸含量、PFS或PAM长度,其中优化功效包括优化选自以下的一个或多个参数或变量: CRISPR效应子活性、gRNA活性、CRISPR-Cas复合物活性、靶标切割效率、靶位点选择、 靶序列长度、CRISPR效应蛋白大小、效应蛋白进入高染色质可及性区域的能力、基因组靶 标的酶活性均匀程度、表观遗传耐受性、错配/微移耐受性,并且其中优化安全性包括优化 选自以下的一个或多个参数或变量:CRISPR效应子稳定性、CRISPR效应子mRNA稳定性、 gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应子蛋白或mRNA免疫原性或毒性、 gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效应蛋白或mRNA 剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应子表达水 平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应子时空表达、gRNA时空 表达、CRISPR-Cas复合物时空表达。
在一个方面,本发明涉及一种如本文所述的方法,包括任选地选择一个或多个(治疗)靶 标、任选地选择所述组合物和/或系统的一种或多种功能、任选地选择一种或多种递送方式、 任选地选择一种或多种递送载体或表达系统,以及优化与所述系统和/或其功能相关的所选 参数或变量,其中优化了特异性、功效和/或安全性,并且任选地其中优化特异性包括优化 选自以下的一个或多个参数或变量:CRISPR效应子特异性、gRNA特异性、CRISPR-Cas 复合物特异性、PFS或PAM限制性、PFS或PAM类型(天然的或修饰的)、PFS或PAM核 苷酸含量、PFS或PAM长度,其中优化功效包括优化选自以下的一个或多个参数或变量:CRISPR效应子活性、gRNA活性、CRISPR-Cas复合物活性、靶标切割效率、靶位点选择、 靶序列长度、CRISPR效应蛋白大小、效应蛋白进入高染色质可及性区域的能力、基因组靶 标的酶活性均匀程度、表观遗传耐受性、错配/微移耐受性,并且其中优化安全性包括优化 选自以下的一个或多个参数或变量:CRISPR效应子稳定性、CRISPR效应子mRNA稳定性、 gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应物蛋白或mRNA免疫原性或毒性、 gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效应蛋白或mRNA 剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR效应子表达水 平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应子时空表达、gRNA时空 表达、CRISPR-Cas复合物时空表达。
在一个方面,本发明涉及一种如本文所述的方法,包括优化与所述系统和/或其功能相 关的所选参数或变量,其中优化了特异性、功效和/或安全性,并且任选地其中优化特异性 包括优化选自以下的一个或多个参数或变量:CRISPR效应子特异性、gRNA特异性、CRISPR-Cas复合物特异性、PFS或PAM限制性、PFS或PAM类型(天然的或修饰的)、PFS 或PAM核苷酸含量、PFS或PAM长度,其中优化功效包括优化选自以下的一个或多个参 数或变量:CRISPR效应子活性、gRNA活性、CRISPR-Cas复合物活性、靶标切割效率、 靶位点选择、靶序列长度、CRISPR效应蛋白大小、效应蛋白进入高染色质可及性区域的能 力、基因组靶标的酶活性均匀程度、表观遗传耐受性、错配/微移耐受性,并且其中优化安 全性包括优化选自以下的一个或多个参数或变量:CRISPR效应子稳定性、CRISPR效应子 mRNA稳定性、gRNA稳定性、CRISPR-Cas复合物稳定性、CRISPR效应蛋白或mRNA免 疫原性或毒性、gRNA免疫原性或毒性、CRISPR-Cas复合物免疫原性或毒性、CRISPR效 应蛋白或mRNA剂量或滴度、gRNA剂量或滴度、CRISPR-Cas复合物剂量或滴度、CRISPR 效应子表达水平、gRNA表达水平、CRISPR-Cas复合物表达水平、CRISPR效应子时空表 达、gRNA时空表达、CRISPR-Cas复合物时空表达。
应当理解,欲优化的参数或变量以及优化性质可能取决于(治疗)靶标、组合物和/或系统 的功能、系统递送模式和/或CRISPR-Cas系统递送载体或表达系统。
在一个方面,本发明涉及一种如本文所述的方法,包括在群体水平上优化gRNA特异 性。优选地,所述优化gRNA特异性包括最小化群体的gRNA靶位点序列变异和/或最小化群体的gRNA脱靶发生率。
在一些实施方案中,优化可以选择天然存在或修饰的CRISPR-Cas效应子。在一些实施 方案中,优化可以选择具有核酸酶、切口酶、脱氨酶、转座酶和/或失活或消除了一种或多 种效应功能的CRISPR-Cas效应子。在一些实施方案中,优化PFS或PAM特异性可以包括选择具有修饰的PFS或PAM特异性的CRISPR-Cas效应子。在一些实施方案中,优化可以 包括选择具有最小尺寸的CRISPR-Cas效应子。在某些实施方案中,优化效应蛋白稳定性包 括选择具有短半衰期同时保持足够活性的效应蛋白,诸如通过选择具有特定半衰期或稳定性的适当CRISPR效应直系同源物。在某些实施方案中,优化免疫原性或毒性包括通过蛋白质修饰来最小化效应蛋白免疫原性或毒性。在某些实施方案中,优化功能特异性包括选择对向 导RNA和一个或多个靶基因座之间的错配和/或微移的耐受性降低的蛋白质效应子。
在某些实施方案中,优化功效包括优化整体效率、表观遗传耐受性或两者。在某些实施 方案中,最大化总体效率包括选择在具有不同染色质复杂性的靶基因座处具有均一酶活性的 效应蛋白,选择酶活性受开放染色质可及性区域限制的效应蛋白。在某些实施方案中,使用 一种或多种ATAC-seq或DNA邻近连接测定来测量染色质可及性。在某些实施方案中,优 化表观遗传耐受性包括优化甲基化耐受性、表观遗传标记物竞争或两者。在某些实施方案中, 优化甲基化耐受性包括选择修饰甲基化DNA的效应蛋白。在某些实施方案中,优化表观遗 传耐受性包括选择不能修饰染色体沉默区的效应蛋白,选择能够修饰染色体沉默区的效应蛋 白,或选择未富集表观遗传标记物的靶基因座。
在某些实施方案中,选择优化的向导RNA包括优化gRNA稳定性、gRNA免疫原性或两者,或如本文在别处所述的其他gRNA相关参数或变量。
在某些实施方案中,优化gRNA稳定性和/或gRNA免疫原性包括RNA修饰,或如本 文在别处所述的其他gRNA相关参数或变量。在某些实施方案中,所述修饰包括从gRNA 的靶互补区的3'端去除1-3个核苷酸。在某些实施方案中,修饰包括在gRNA中产生在脱靶 基因座的靶标处与gRNA碱基配对竞争的稳定结构的延伸gRNA和/或反式RNA/DNA元件, 或在gRNA和靶序列之间的延伸互补核苷酸,或两者。
在某些实施方案中,所述递送模式包括递送gRNA和/或CRISPR效应蛋白、递送gRNA和/或CRISPR效应mRNA、或递送gRNA和/或CRISPR效应子作为基于DNA的表达系统。 在某些实施方案中,递送模式还包括从由脂质体、脂质颗粒、纳米颗粒、基因枪或基于病毒 的表达/递送系统组成的组中选择递送载体和/或表达系统。在某些实施方案中,表达是时空 表达,通过选择条件性和/或诱导型表达系统加以优化,包括可控CRISPR效应子活性,任 选地去稳定型CRISPR效应子和/或分裂型CRISPR效应子,和/或细胞或组织特异性表达系 统。
如本文所述的方法还可以包括选择递送模式。在某些实施方案中,递送或将递送gRNA (和tracr,如果需要,而且在需要时,任选地作为sgRNA提供)和/或CRISPR效应蛋白。在 某些实施方案中,递送或将递送gRNA(和tracr,如果需要,而且在需要时,任选地作为sgRNA 提供)和/或CRISPR效应mRNA。在某些实施方案中,递送或将递送设在基于DNA的表达系统中的gRNA(和tracr,如果需要,而且在需要时,任选地作为sgRNA提供)和/或CRISPR 效应子。在某些实施方案中,递送个别系统组分包括上述递送模式的组合。在某些实施方案中,递送包括递送gRNA和/或CRISPR效应蛋白、递送gRNA和/或CRISPR效应mRNA、 或递送gRNA和/或CRISPR效应子作为基于DNA的表达系统。
如本文所述的方法还可以包括选择CRISPR-Cas系统递送载体和/或表达系统。本文在别 处描述了递送载体和表达系统。举例来说,核酸和/或蛋白质的递送载体包括纳米颗粒、脂 质体等。用于DNA的递送载体,诸如基于DNA的表达系统包括例如基因枪、基于病毒的 载体系统(例如腺病毒、AAV、慢病毒)等,本领域技术人员应理解递送模式以及递送载体或 表达系统的选择可能取决于例如欲靶向的细胞或组织。在某些实施方案中,用于递送所述组 合物、系统或其组分的递送载体和/或表达系统包括脂质体、脂质颗粒、纳米颗粒、基因枪 或基于病毒的表达/递送系统。
对于治疗应用的考虑事项
基因组编辑疗法中的一个考虑事项是选择序列特异性核酸酶,诸如Cas核酸酶变体。各 个核酸酶变体都可以具有它自己独特的优势和劣势,必须在治疗的背景下进行多方权衡,以 最大化治疗效益。为了使特定编辑疗法有效,必须在靶细胞群中实现足够高水平的修饰以逆 转疾病症状。这种治疗修饰“阈值”由治疗后被编辑的细胞的适应性和逆转症状所需的基因产 物的量决定。关于适应性,相对于未编辑的细胞,对于处理过的细胞,编辑产生了三种可能 结果:适应性增加、中性或降低。在适应性增加的情况下,修正的细胞可能能够并相对于其 患病对应物进行扩展以介导治疗。在这种情况下,在编辑的细胞具有选择性优势时,即使少 量编辑的细胞也可以通过增殖进行扩增,从而为患者提供治疗益处。在编辑的细胞在适应性 方面没有变化的情况下,可以保证增加治疗修饰阈值。因此,可能需要显著较高水平的编辑 来治疗疾病,其中相对于编辑增加了靶细胞的适应性的疾病,编辑创造了中性适应性优势。 如果编辑造成了适应性劣势,如在恢复癌细胞中肿瘤抑制基因的功能的情况下,则经修饰的 细胞将被其患病对应物击败,从而导致治疗益处相对于编辑率而言较低。这可以通过补充疗 法来克服,以增加经编辑的细胞相对于患病对应物的效力和/或适应性。
除了细胞适应性以外,治疗疾病所需的基因产物的量还会影响能治疗或预防疾病或其症 状的治疗性基因组编辑的最低水平。在基因产物水平的微小变化可能导致临床结果显著变化 的情况下,相对于需要较大基因产物水平变化以获得临床相关应答的情况,治疗性基因组编 辑的最低水平较低。在一些实施方案中,治疗性基因组编辑的最低水平可以在0.1%至1%、 1%至5%、5%至10%、10%至15%、15%至20%、20%至25%、25%至30%、30%至35%、 35%至40%、40%至45%、45%至50%或50%至55%的范围内。因此,其中基因产物水平的 微小变化可能影响临床结果而且对经编辑的细胞存在适应性优势的疾病是基因组编辑疗法 的理想靶标,因为治疗修饰阈值低到足以允许较高成功机会。
NHEJ和HDR DSB修复的活性可以因细胞类型和细胞状态而异。NHEJ并未被细胞周期高度调控而且在诸多细胞类型中有效,从而允许可接近的靶细胞群中的高水平基因破坏。 相比之下,HDR主要在S/G2期过程中作用,并且因此局限于活跃分裂的细胞,从而限制了 需要对有丝分裂细胞进行精确基因组修饰的治疗[Ciccia,A.和Elledge,S.J.Molecular cell 40, 179-204(2010);Chapman,J.R.等,Molecular cell 47,497-510(2012)]。
通过HDR进行修正的效率可以通过靶基因座的表观遗传状态或序列或所用的特定修复 模板配置(单链对比双链、长对比短同源臂)加以控制[Hacein-Bey-Abina,S.等,TheNew England journal of medicine 346,1185-1193(2002);Gaspar,H.B.等,Lancet 364,2181-2187 (2004);Beumer,K.J.等,G3(2013)]。靶细胞中NHEJ和HDR机制的相对活性也可能影响基 因修正效率,因为这些途径可能竞争从而消除DSB[Beumer,K.J.等,Proceedingsof the National Academy of Sciences of the United States of America 105,19821-19826(2008)]。HDR 还带来了NHEJ策略下未见的递送挑战,因为它使用了同时递送核酸酶和修复模板。因此, 当如本文在别处更详细描述来设计、优化和/或选择基于CRISPR-Cas的治疗剂时,可以牢记 这些差异。
基于CRISPR-Cas的多核苷酸修饰应用可以包括蛋白质、小RNA分子和/或修复模板的 组合,并且在一些实施方案中可能使这多个部分的递送实质上比例如传统小分子治疗剂更具 挑战性。已经开发了两种用于递送组合物、系统及其组分的主要策略:离体和体内。在离体 治疗的一些实施方案中,从受试者取出患病细胞,加以编辑,然后移植回患者体内。在其他 实施方案中,从健康同种异体供体收集细胞,使用CRISPR-Cas系统或其组分加以修饰,以 赋予不同的功能和/或降低免疫原性,并施用于需要治疗的同种异体受体。离体编辑的优点 是可以很好地定义靶细胞群,并且允许规定递送至细胞的治疗分子的具体剂量。当顾虑脱靶 修饰时,后一种考虑可能特别重要,因为滴定核酸酶的量可能减少此类突变(Hsu等,2013)。 离体方法的另一个优点是可以实现典型的高编辑率,这是由于开发了蛋白质和核酸递送到培 养细胞中的有效递送系统以供用于研究和基因疗法应用。
通过组合物、系统和/或其组分的体内多核苷酸修饰涉及将组合物、系统和/或其组分直 接递送至其天然组织中的细胞类型。通过组合物、系统和/或其组分的体内多核苷酸修饰允 许治疗其中受影响的细胞群不顺应离体操作的疾病。此外,将组合物、系统和/或其组分原 位递送至细胞允许治疗多种组织和细胞类型。
在一些实施方案中,诸如其中使用病毒载体系统产生病毒颗粒以便将CRISPR-Cas系统 和/或其组分递送至细胞的那些实施方案,应当考虑CRISPR-Cas系统和/或其组分的总负荷 大小,因为载体系统可能对可以由其表达和/或被包装到病毒颗粒内部的负荷中的多核苷酸 的大小具有限制。在一些实施方案中,应当考虑载体系统,诸如病毒载体系统的嗜性,因为 它可能会影响可以高效地和/或有效地向其递送CRISPR-Cas系统或其组分的细胞类型。
当通过基于病毒的系统递送系统或其组分时,考虑实现治疗效果所需的病毒颗粒的量, 以便解决病毒颗粒在递送至受试者或细胞时可能引发的潜在免疫应答可能很重要。当通过基 于病毒的系统递送系统或其组分时,考虑控制体内系统分布和/或剂量的机制可能很重要。 一般来说,为了降低脱靶效应的可能性,系统的量最好但没有必要接近最小或最少有效剂量。 在实践中,这样做可能具有挑战性。
在一些实施方案中,考虑系统或其组分的免疫原性可能很重要。在关注系统或其组分的 免疫原性的实施方案中,可以降低系统或其组分的免疫原性。仅举例来说,可以使用Tangri 等所述的方法降低系统或其组分的免疫原性。因此,可以使用定向进化或合理设计来降低 CRISPR酶在宿主物种(人或其他物种)中的免疫原性。
异种移植
本发明还设想使用本文所述的CRISPR-Cas系统,例如Cas效应蛋白系统,来提供适合 用于为移植提供经修饰的组织的RNA引导型DNA核酸酶。举例来说,RNA引导型DNA 核酸酶可以用于敲除、敲低或破坏诸如转基因猪(诸如人血红素加氧酶-1转基因猪系)等动物中的所选基因,例如通过破坏编码人类免疫系统识别的表位的基因,即异种抗原基因的表达。 供破坏的候选猪基因可以例如包括α(1,3)-半乳糖基转移酶和胞嘧啶单磷酸-N-乙酰神经氨酸 羟化酶基因(参见PCT专利公开WO 2014/066505)。此外,可以破坏编码内源逆转录病毒的 基因,例如编码所有猪内源逆转录病毒的基因(参见Yang等,2015,Genome-wideinactivation of porcine endogenous retroviruses(PERVs),Science 2015年11月27日:第350卷,第6264 期,第1101-1104页)。此外,可以使用RNA引导型DNA核酸酶来靶向用于整合异种移植 供体动物中的其他基因,诸如人CD55基因以改善对超急性排斥作用的保护的位点。
本发明的实施方案还涉及与敲除基因、扩增基因和修复与DNA重复序列不稳定性和神 经障碍相关的特定突变有关的方法和组合物(Robert D.Wells,Tetsuo Ashizawa,Genetic Instabilities and Neurological Diseases,第二版,Academic Press,2011年10月13日- Medical)。已发现串联重复序列的特定方面负责二十多种人类疾病(Newinsights into repeat instability:role of RNA·DNA hybrids.McIvor EI,Polak U,Napierala M.RNA Biol.2010年9月 至10月;7(5):551-8)。可以利用本发明的效应蛋白系统来修正这些基因组不稳定性缺陷。
本发明的若干个其他方面涉及修正与多种遗传疾病相关的缺陷,这些缺陷进一步描述于 美国国立卫生研究院网站上的遗传病症专题细类下(网址是 health.nih.gov/topic/GeneticDisorders)。遗传性脑病可以包括但不限于肾上腺脑白质营养不 良、胼胝体发育不全、艾卡迪综合征(Aicardi Syndrome)、阿尔珀斯病(Alpers'Disease)、阿尔 茨海默氏病(Alzheimer's Disease)、巴特综合征(Barth Syndrome)、巴顿病(BattenDisease)、CADASIL、小脑变性、法布里病(Fabry's Disease)、格斯特曼-施特劳斯勒-先克病 (Gerstmann-Straussler-Scheinker Disease)、亨廷顿氏病(Huntington's Disease)和其他三联体重 复序列疾病、利氏病(Leigh's Disease)、莱纳二氏综合症(Lesch-NyhanSyndrome)、门克斯病 (Menkes Disease)、线粒体肌病和NINDS空洞脑病。美国国立卫生研究院网站上的遗传性脑 病细类下进一步描述了这些疾病。
免疫正交直系同源物
在一些实施方案中,当需要在受试者中表达或施用Cas时,可以通过向受试者顺序表达 或施用Cas的免疫正交直系同源物来降低Cas的免疫原性。如本文所用,术语“免疫正交直 系同源物”是指具有相似或基本相同的功能或活性但与彼此产生的免疫应答没有交叉反应性 或具有低交叉反应性的直系同源蛋白质。在一些实施方案中,此类直系同源物的顺序表达或 施用引发了低继发性免疫应答或不引发继发性免疫应答。免疫正交直系同源物可以避免被抗 体(例如,表达或施用所述直系同源物之前宿主中的现有抗体)中和。表达直系同源物的细胞 可以避免被宿主的免疫系统(例如,被激活的CTL)清除。在一些实施例中,来自不同物种的 CRISPR酶直系同源物可以是免疫正交直系同源物。
可以通过分析一组候选直系同源物的序列、结构和/或免疫原性来鉴定免疫正交直系同 源物。在一种示例性方法中,可以通过以下方式鉴定一组免疫正交直系同源物:a)比较一组 候选直系同源物(例如,来自不同物种的直系同源物)的序列,以鉴定具有低序列相似性或没 有序列相似性的候选物子集;b)评价候选物子集成员间的免疫重叠,以鉴定没有免疫重叠或 具有低免疫重叠的候选物。在一些情况下,候选物间的免疫重叠可以通过确定候选直系同源 物和宿主MHC(例如,MHC I型和/或MHC II型)之间的结合(例如,亲和力)来评价。替代 地或另外地,候选物间的免疫重叠可以通过确定候选直系同源物的B细胞表位来评价。在 一个实施例中,可以使用Moreno AM等,BioRxiv,2018年1月10日在线发表,doi: doi.org/10.1101/245985所述的方法来鉴定免疫正交直系同源物。
患者特异性筛检方法
靶向RNA或单链DNA的核酸靶向系统可以用于筛检患者或患者样品中特定RNA或单链DNA的存在。诸多方法可以包括在来自患者的样品中检测一个或多个病毒。有利地,使 用一个或多个CRISPR Cas系统的快速检测可以鉴定患有特定病毒感染的那些患者。
转录物检测方法
本发明的效应蛋白和系统可用于特异性检测细胞或其他样品中的RNA。在存在目标 RNA靶标的情况下,向导依赖性CRISPR-Cas核酸酶活性可能伴有针对旁系靶标的非特异性RNA酶活性。为了利用RNA酶活性,只需要可以检测切割的报告底物。举例来说,报 告分子可以包含RNA,其一端用荧光报告分子(fluor)标签化,而另一端用淬灭剂标签化。在 不存在CRISPR-Cas RNA酶活性的情况下,淬灭剂的物理接近将来自fluor的荧光抑制到低 水平。当目标RNA靶标和合适的向导RNA的存在激活了CRISPR-Cas靶标特异性切割时, 非特异性地切割含RNA的报告分子并且在空间上隔开fluor和淬灭剂。这导致fluor在被适 当波长的光激发时发出了可检测信号。在一种示例性测定方法中,将CRISPR-Cas效应子、 目标靶标特异性向导RNA和报告分子加入细胞样品。荧光增加表明存在目标RNA靶标。 在另一种示例性方法中,提供了检测阵列。所述阵列的每一个位置都提供有CRISPR-Cas效 应子、报告分子和目标靶标特异性向导RNA。取决于要进行的测定,所述阵列的每一个位 置的目标靶标特异性向导RNA可以相同、不同或其组合。可能提供不同的目标靶标特异性 向导RNA,例如当需要在单个来源样品中测试一个或多个靶标时。可以在每一个位置提供 相同的目标靶标特异性向导RNA,例如当需要针对同一靶标测试多个样品时。
在某些实施方案中,在体外系统或细胞中瞬时或稳定地提供或表达CRISPR-Cas,并靶 向或触发以非特异性地切割细胞核酸。在一个实施方案中,工程改造CRISPR-Cas以敲低 ssDNA,例如病毒ssDNA。在另一个实施方案中,工程改造了CRISPR-Cas以敲低RNA。 可以设计所述系统,使得敲低取决于细胞或体外系统中存在的靶DNA,或通过向所述系统 或细胞加入靶核酸来触发。
在一个实施方案中,工程改造了CRISPR-Cas系统以非特异性地切割细胞亚组中可通过 存在异常DNA序列来区分的RNA,例如其中对异常DNA的切割可能不完全或不成功。在一个非限制性示例中,靶向存在于癌细胞中并驱动细胞转化的DNA易位。尽管经历染色体DNA和修复的细胞亚组可能存活,但非特异性旁系核糖核酸酶活性有利地导致潜在幸存者的细胞死亡。
药盒
在一个方面,本发明提供了含有上述方法和组合物中公开的任何一个或多个要素的药 盒。在一些实施方案中,所述药盒包含如本文教导的载体系统或如本文教导的CRISPR/Cas 系统或复合物的一个或多个组分,诸如crRNA和/或CRISPR-Cas效应蛋白或CRISPR-Cas 效应蛋白编码mRNA,以及使用所述药盒的说明书。诸多要素可以单独或组合提供,并且 可以提供在任何合适的容器中,诸如小瓶、瓶子或管子。在一些实施方案中,所述药盒包括 一种或多种语言,例如一种以上语言的说明书。所述说明书可以特定用于本文所述的应用和 方法。在一些实施方案中,药盒包含一种或多种试剂以供用于利用本文所述的一个或多个要 素的方法中。诸多试剂可以提供在任何合适的容器中。举例来说,药盒可以提供一种或多种 反应或储存缓冲液。试剂可以呈可用于特定测定的形式提供,或呈需要在使用前加入一种或 多种其他组分的形式(例如,呈浓缩或冻干形式)提供。缓冲液可以是任何缓冲液,包括但不 限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES 缓冲液及其组合。在一些实施方案中,所述缓冲液是碱性的。在一些实施方案中,所述缓冲 液具有约7至约10的pH。在一些实施方案中,所述药盒包含对应于向导序列的一种或多种 寡核苷酸,用于插入载体中以便可操作地连接向导或crRNA序列和调控元件。在一些实施 方案中,所述药盒包含同源重组模板多核苷酸。在一些实施方案中,所述药盒包含本文所述 的一个或多个载体和/或一个或多个多核苷酸。所述药盒可以有利地允许提供本发明的系统 的所有要素。
本申请还提供了如以下编号的陈述中所示的方面和实施方案:
陈述1.一种非天然存在或工程改造的组合物,所述组合物包含:
(a)包含至少一个HEPN结构域并且在大小方面小于900个氨基酸的Cas蛋白;和(b)能 够与所述Cas蛋白形成复合物并引导所述复合物与靶序列结合的向导序列。
陈述2.如陈述1所述的组合物,其中所述Cas蛋白是VI型Cas蛋白。
陈述3.如陈述1所述的组合物,其中所述Cas蛋白是Cas13。
陈述4.如陈述1所述的组合物,其中所述Cas蛋白选自(a)SEQ ID NO.4102-4298;(b) SEQ ID NO.4299-4654;(c)SEQ ID NO.2771-2772、4655-4768或5260-5265;(d)SEQ IDNO.4769-4797;或(e)SEQ ID NO.4798-5203。
陈述5.一种非天然存在或工程改造的系统,包含:(a)Cas蛋白,选自:(i)SEQ IDNO. 1-1323,(ii)SEQ ID NO.1324-2770,(iii)SEQ ID NO.2773-2797,或(iv)SEQ ID NO.2798-4092;(b)能够与所述Cas蛋白形成复合物并引导所述复合物与靶序列结合的向导序列。
陈述6.如前述陈述中任一项所述的组合物,其中所述Cas蛋白表现出旁系核酸酶活性 并切割非靶序列。
陈述7.如前述陈述中任一项所述的组合物,所述组合物包含两个或更多个能够与两个 不同的靶序列或一个靶序列的不同区域杂交的向导序列。
陈述8.如前述陈述中任一项所述的组合物,其中所述向导序列能够与原核细胞中的一 个或多个靶序列杂交。
陈述9.如前述陈述中任一项所述的组合物,其中所述向导序列能够与真核细胞中的一 个或多个靶序列杂交。
陈述10.如前述陈述中任一项所述的组合物,其中所述Cas蛋白包含一个或多个核定位 信号。
陈述11.如前述陈述中任一项所述的组合物,其中所述Cas蛋白包含一个或多个核输出 信号。
陈述12.如前述陈述中任一项所述的组合物,其中所述Cas蛋白无催化活性。
陈述13.如前述陈述中任一项所述的组合物,其中所述Cas蛋白是切口酶。
陈述14.如前述陈述中任一项所述的组合物,其中所述Cas蛋白与一个或多个功能域缔 合。
陈述15.如陈述14所述的组合物,其中所述一个或多个功能域是异源功能域。
陈述16.如陈述14所述的组合物,其中所述一个或多个功能域切割所述一个或多个靶 序列。
陈述17.如陈述16所述的组合物,其中所述一个或多个功能域修饰所述靶序列的转录 或翻译。
陈述18.如前述陈述中任一项所述的组合物,其中所述Cas蛋白与腺苷脱氨酶或胞嘧啶 脱氨酶相关。
陈述19.如前述陈述中任一项所述的组合物,所述组合物还包含重组模板。
陈述20.如陈述19所述的组合物,其中所述重组模板是通过同源定向修复(HDR)插入。
陈述21.如前述陈述中任一项所述的组合物,所述组合物还包含tracr RNA。
陈述22.如前述陈述中任一项所述的组合物,其中所述Cas蛋白包含两个HEPN结构域。
陈述23.一种非天然存在或工程改造的组合物,所述组合物包含:(a)编码如前述陈述 中任一项所述的Cas蛋白的mRNA,和(b)能够与所述Cas蛋白形成复合物并引导所述复合 物与靶序列结合的向导序列。
陈述24.一种用于修饰靶核酸中的核苷酸的非天然存在或工程改造的组合物,所述组合 物包含:(a)如陈述1至22中任一项所述的组合物;和(b)与所述Cas蛋白缔合的核苷酸脱氨 酶。
陈述25.如陈述24所述的组合物,其中所述Cas蛋白是死Cas蛋白。
陈述26.如陈述24至25中任一项所述的组合物,其中所述Cas蛋白是切口酶。
陈述27.如陈述24至26中任一项所述的组合物,其中所述核苷酸脱氨酶与所述Cas蛋白或所述向导序列共价或非共价连接,或者适合于在递送之后与其连接。
陈述28.如陈述24至27中任一项所述的组合物,其中所述核苷酸脱氨酶是腺苷脱氨酶。
陈述29.如陈述24至28中任一项所述的组合物,其中所述核苷酸脱氨酶是胞嘧啶脱氨 酶。
陈述30.如陈述24至29中任一项所述的组合物,其中所述核苷酸脱氨酶是人ADAR2或其脱氨酶结构域。
陈述31.如陈述28所述的组合物,其中所述腺苷脱氨酶包含一个或多个突变。
陈述32.如陈述31所述的组合物,其中所述一个或多个突变包括基于人ADAR2的氨基酸序列位置的E620G或Q696L,以及同源ADAR蛋白中的相应突变。
陈述33.如陈述32所述的组合物,其中所述腺苷脱氨酶包含基于人ADAR2的氨基酸序列位置的(i)E488Q和E620G,(ii)E488Q和Q696L,或(iii)E488Q和V505I,或者同源 ADAR蛋白中的相应突变。
陈述34.如陈述31所述的组合物,其中所述腺苷脱氨酶具有胞嘧啶脱氨酶活性。
陈述35.如陈述24至34中任一项所述的组合物,其中已经修饰所述核苷酸脱氨酶蛋白 或其催化结构域以增加对DNA-RNA异源双链体的活性。
陈述36.如陈述24至35中任一项所述的组合物,其中已经修饰所述核苷酸脱氨酶蛋白 或其催化结构域以减少脱靶效应。
陈述37.如陈述24至36中任一项所述的组合物,其中对所述靶核酸中的所述核苷酸的 修饰能医冶由G→A或C→T点突变或致病性SNP引起的疾病。
陈述38.如陈述37所述的组合物,其中所述疾病包括癌症、血友病、β-地中海贫血、马凡综合征和维-奥二氏综合征。
陈述39.如陈述24至38中任一项所述的组合物,其中对所述靶核酸中的所述核苷酸的 修饰能医冶由T→C或A→G点突变或致病性SNP引起的疾病。
陈述40.如陈述24至39中任一项所述的组合物,其中对所述目标靶基因座处的所述核 苷酸的修饰使所述靶基因座处的靶基因失活。
陈述41.如陈述24至40中任一项所述的组合物,其中对所述核苷酸的修饰修饰了所述 靶基因座处编码的基因产物或所述基因产物的表达。
陈述42.一种工程改造的腺苷脱氨酶,其包含一个或多个突变:基于人ADAR2的氨基 酸序列位置的E488Q、E620G、Q696L或V505I,或同源ADAR蛋白中的相应突变。
陈述43.如陈述42所述的工程改造的腺苷脱氨酶,其中所述腺苷脱氨酶包含基于人 ADAR2的氨基酸序列位置的(i)E488Q和E620G,(ii)E488Q和Q696L,或(iii)E488Q和V505I,或者同源ADAR蛋白中的相应突变。
陈述44.一种用于在一个或多个体外样品中检测一个或多个靶多肽的存在的系统,所述 系统包含:如陈述1至41中任一项所述的Cas蛋白;一个或多个检测适体,各自经设计而 与所述一个或多个靶多肽之一结合,各个检测适体包含掩蔽的启动子结合位点或掩蔽的引物 结合位点和触发序列模板;以及包含非靶序列的基于寡核苷酸的掩蔽构建体。
陈述45.如陈述44所述的系统,所述系统还包含用于扩增所述靶序列或所述触发序列 的核酸扩增试剂。
陈述46.如陈述45所述的系统,其中所述核酸扩增试剂是等温扩增试剂。
陈述47.一种用于在一个或多个体外样品中检测一个或多个靶序列的存在的系统,所述 系统包括:(a)如陈述1至41中任一项所述的Cas蛋白;(b)至少一个向导多核苷酸,其包含 经设计而与所述一个或多个靶序列具有一定程度的互补性并且经设计而与所述Cas蛋白形 成复合物的向导序列;以及(c)包含非靶序列的基于寡核苷酸的掩蔽构建体,其中所述Cas 蛋白表现出旁系核酸酶活性,并且一旦被所述一个或多个靶序列激活就切割所述基于寡核苷 酸的掩蔽构建体的所述非靶序列。
陈述48.一种非天然存在或工程改造的组合物,所述组合物包含如陈述1至41中任一 项所述的Cas蛋白,所述Cas蛋白与酶或报告部分的无活性第一部分连接,其中所述酶或报 告部分在与所述酶或报告部分的互补部分接触时得以复原。
陈述49.如陈述48所述的组合物,其中所述酶或报告部分包括蛋白水解酶。
陈述50.如陈述48或49所述的组合物,其中所述Cas蛋白包括与所述酶或报告部分的 所述互补部分连接的第一Cas蛋白和第二Cas蛋白。
陈述51.如陈述48、49或50所述的组合物,所述组合物还包含:i)能够与所述第一Cas 蛋白形成复合物并与靶核酸的第一靶序列杂交的第一向导;和ii)能够与所述第二Cas蛋白 形成复合物并与所述靶核酸的第二靶序列杂交的第二向导。
陈述52.一种非天然存在或工程改造的组合物,所述组合物包含一个或多个编码如陈述 1至41中任一项所述的Cas蛋白和向导序列的多核苷酸。
陈述53.一种载体系统,其包含一个或多个载体,所述一个或多个载体包含:
与编码如陈述1至41中任一项所述的Cas蛋白的核苷酸序列可操作地连接的第一调控 元件,和与编码所述向导序列的核苷酸序列可操作地连接的第二调控元件。
陈述54.如陈述53所述的载体系统,其中编码所述Cas蛋白的所述核苷酸序列经密码 子优化以便在真核细胞中表达。
陈述55.如陈述53或54所述的载体系统,所述载体系统包含在单个载体中。
陈述56.如陈述53至55中任一项所述的载体系统,其中所述一个或多个载体包括病毒 载体。
陈述57.如陈述53至56中任一项所述的载体系统,其中所述一个或多个载体包括一个 或多个逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。
陈述58.一种递送系统,所述递送系统包含如陈述1至52中任一项所述的组合物,或 如陈述53至57中任一项所述的系统以及递送载体。
陈述59.如陈述58所述的递送系统,所述递送系统包含一个或多个载体或者一个或多 个多核苷酸分子,所述一个或多个载体或多核苷酸分子包含一个或多个编码所述Cas蛋白的 多核苷酸分子和所述非天然存在或工程改造的组合物的一种或多种核酸组分。
陈述60.如陈述58所述的递送系统,其中所述递送载体包含核糖核蛋白复合物、一个 或多个颗粒、一个或多个囊泡、或者一个或多个病毒载体、脂质体、纳米颗粒、外来体、微囊泡、核酸纳米组装体、基因枪、可植入装置或载体系统。
陈述61.如陈述58所述的递送系统,其中所述一个或多个颗粒包含脂质、糖、金属或 蛋白质。
陈述62.如陈述58所述的递送系统,其中所述一个或多个颗粒包括脂质纳米颗粒。
陈述63.如陈述58所述的递送系统,其中所述一个或多个囊泡包含外来体或脂质体。
陈述64.如陈述58所述的递送系统,其中所述一个或多个病毒载体包括一个或多个腺 病毒载体、一个或多个慢病毒载体、或者一个或多个腺相关病毒载体。
陈述65.一种细胞,所述细胞包含如陈述1至52中任一项所述的组合物,或如陈述53 至64中任一项所述的系统。
陈述66.如陈述65所述的细胞,所述细胞或其后代是真核细胞,优选地为人或非人动 物细胞,任选地为治疗T细胞或产抗体B细胞,或其中所述细胞是植物细胞。
陈述67.一种非人动物或植物,其包含如陈述65或66所述的细胞或其后代。
陈述68.如陈述1至52中任一项所述的组合物,或如陈述53至64中任一项所述的系统,或如陈述65或66所述的细胞,其用于治疗性治疗方法中。
陈述69.一种修饰一个或多个靶序列的方法,所述方法包括使所述一个或多个靶序列与 如陈述1至52中任一项所述的组合物接触。
陈述70.如陈述69所述的方法,其中修饰所述一个或多个靶序列包括增加或降低所述 一个或多个靶序列的表达。
陈述71.如陈述69或70所述的方法,其中所述系统还包括重组模板,并且其中修饰所 述一个或多个靶序列包括插入所述重组模板或其部分。
陈述72.如陈述69至71中任一项所述的方法,其中所述一个或多个靶序列在原核细胞 中。
陈述73.如陈述69至72中任一项所述的方法,其中所述一个或多个靶序列在真核细胞 中。
陈述74.一种修饰靶序列中的一个或多个核苷酸的方法,所述方法包括使所述靶序列与 如陈述1至52中任一项所述的组合物接触。
陈述75.如陈述69至74中任一项所述的方法,其中所述靶序列是RNA。
陈述76.一种在样品中检测靶核酸的方法,所述方法包括:(a)使样品与以下接触:(i) 如陈述1至52中任一项所述的组合物;和(ii)包含非靶序列的基于RNA的掩蔽构建体;其 中所述Cas蛋白表现出旁系RNA酶活性并切割所述检测构建体的所述非靶序列;和(b)检测 来自切割所述非靶序列的信号,从而检测所述样品中的所述靶核酸。
陈述77.如陈述76所述的方法,所述方法还包括使所述样品与用于扩增所述靶核酸的 试剂接触。
陈述78.如陈述76或77所述的方法,其中所述用于扩增的试剂包括等温扩增反应试剂。
陈述79.如陈述76至78中任一项所述的方法,其中所述等温扩增试剂包括基于核酸序 列的扩增、重组酶聚合酶扩增、环介导型等温扩增、链置换扩增、解旋酶依赖性扩增或切口 酶扩增试剂。
陈述80.如陈述76至79中任一项所述的方法,其中所述靶核酸是DNA分子,并且所述方法还包括使所述靶DNA分子与包含RNA聚合酶位点的引物和RNA聚合酶接触。
陈述81.如陈述76至80中任一项所述的方法,其中所述掩蔽构建体:抑制可检测正信 号的产生,直到所述掩蔽构建体被切割或失活,或者掩蔽可检测正信号或产生可检测负信号, 直到所述掩蔽构建体被切割或失活。
陈述82.如陈述76至81中任一项所述的方法,其中所述掩蔽构建体包括:a.抑制由报告构建体编码的基因产物的产生的沉默RNA,其中所述基因产物在表达时产生可检测正信号;b.产生可检测负信号的核糖酶,并且其中当所述核糖酶失活时产生了可检测正信号;c.将底物转化为第一颜色的核糖酶,并且其中当所述核糖酶失活时,所述底物转化为第二颜色;d.适体和/或包含多核苷酸栓系型抑制剂;e.可检测配体和掩蔽组分连接的多核苷酸; f.通过桥分子保持呈聚集体形式的纳米颗粒,其中所述桥分子的至少一部分包含多核苷酸, 并且其中当所述纳米颗粒分散在溶液中时所述溶液发生了颜色变化;g.通过连接分子与一 个或多个淬灭剂分子连接的量子点或荧光团,其中所述连接分子的至少一部分包含多核苷 酸;h.与嵌入剂复合的多核苷酸,其中所述嵌入剂在切割所述多核苷酸后改变了吸光度; 或l.通过多核苷酸拴系的两个荧光团,当从所述多核苷酸释放时会发生荧光变化。
陈述83.如陈述82所述的方法,其中所述适体:a.包含能隔绝酶的多核苷酸拴系型抑 制剂,其中所述酶在从所述适体或多核苷酸拴系型抑制剂释放时通过作用于底物而产生可检 测信号;b.是能抑制酶并防止所述酶催化由底物产生可检测信号的抑制性适体,或其中所 述多核苷酸拴系型抑制剂抑制了酶并防止所述酶催化由底物产生可检测信号;或c.隔绝了 一对剂,所述剂在从所述适体释放时组合以产生可检测信号。
陈述84.如陈述82或83所述的方法,其中所述纳米颗粒是胶态金属。
陈述85.如陈述76至84中任一项所述的方法,其中所述至少一个向导多核苷酸包含错 配。
陈述86.如陈述85所述的方法,其中所述错配在所述一个或多个向导序列上的单核苷 酸变异的上游或下游。
陈述87.一种治疗或预防受试者疾病的方法,包括向所述受试者施用如陈述1至52中 任一项所述的组合物,或如陈述53至64中任一项所述的系统,或如陈述65或66所述的细胞。
实施例
实施例1
可以使用本文详述的公开内容来设计系统、组合物和方法,以便检测和诊断病毒和病毒 感染,包括急性呼吸道感染。所述系统可以包含两个或更多个CRISPR Cas系统以便如本文 在别处所述多路检测多种呼吸道感染或病毒感染,包括冠状病毒。冠状病毒是一种感染多种 动物和人类的有义单链RNA病毒家族。SARS-CoV是一种冠状病毒感染,以及设想了对一 种或多种冠状病毒的MERS-CoV检测,包括武汉市检测到的2019-nCoV。2019-nCoV的序 列可在GISAID登录号EPI_ISL_402124和EPI_ISL_402127-402130下获得,并描述于DOI:10.1101/2020.01.22.914952。GISAID平台存放的冠状病毒的进一步存放包括 EP_ISL_402119-402121和EP_ISL 402123-402124;另见GenBank登录号MN908947.3。
多路检测
设想了用于检测样品中的冠状病毒和/或其他呼吸道病毒以鉴定呼吸道感染原因的向导 分子的多路设计,其中设计可以根据2019年3月14日提交的题为“CRISPR EffectorSystem Based Multiplex Diagnostics”的美国临时申请62/818,702以及2019年8月22日提交的题为 “CRISPR Effector System Based Multiplex Diagnostics”的美国临时申请62/890,5556的公开内 容,它们整体并入本文。简而言之,向导分子的设计可以涵盖利用如美国临时申请62/818,702 和美国临时申请62/890,5556所述的培养模型使用各种输入特征,所述输入特征可以包括用 于靶向目标序列的特定Cas蛋白。参见美国临时申请62/818,702图4A,该案明确地通过引 用并入。可以如本文在别处详述来设计向导分子。关于冠状病毒的检测,可以根据Tian等, “Potent binding of 2019novel coronavirus spikeprotein by a SARS coronavirus-specific human monoclonal antibody”;doi:10.1101/2020.01.28.923011中公开的基因组序列进行向导设计;该 文献通过引用并入,其中详述了人单克隆抗体,2019-nCoV RBD的CR3022结合(KD 6.3nM) 或2019-nCoV的序列可在GISAID登录号EPI_ISL_402124和EPI_ISL_402127-402130下获 得,并描述于doi:10.1101/2020.01.22.914952或EP_ISL_402119-402121和EP_ISL 402123-402124中;另见GenBank登录号MN908947.3。向导设计可以靶向2019-nCoV的独 特病毒基因组区域或冠状病毒家族的一种或多种病毒的保守基因组区域。
诸如冠状病毒等呼吸道病毒的检测可以包括如本文所述的热稳定性CRISPR-Cas蛋白, 它可能是Cas13a直系同源物。如本文在别处所述,一种或多种Cas13a直系同源物可以用于 多路设计,包括本文所述的热稳定Cas13a直系同源物,包括以下那些Cas13a直系同源物: 衍生自解半纤维素赫氏菌,由国际公开号WO 2017/219027的SEQ ID NO:1或SEQ IDNO: 75定义,由图1A的序列(基因座QNRW01000010.1、OWPA01000389.1、0153798_10014618、0153978_10005171和0153798_10004687)定义,或由核酸序列0123519_10037894或0J26742_10014101编码,或与国际公开号WO 2017/219027的SEQ ID NO:1或SEQ ID NO: 75具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 99.5%序列同一性,由图1A的序列(基因座QNRW01000010.1、OWPA01000389.1、 0153798_10014618、0153978_10005171和0153798_10004687)定义,或由核酸序列 0123519_10037894(图3G)或0J26742_10014101(图3F)编码,并且可能包含至少一个HEPN 结构域或至少两个HEPN结构域。此外,在某些示例性实施方案中,此类热稳定性赋予本 文公开的诊断和检测平台和方法更快速性。
冠状病毒检测可以包括两个或更多个利用RNA靶向性Cas效应蛋白的检测系统、DNA 靶向性Cas效应蛋白或其组合。RNA靶向性效应蛋白可以是Cas13蛋白,诸如Cas13a、Cas13b 或Cas13c,包括本文所述的热稳定性Cas13a蛋白之一。可以设计多路系统,从而可以使用 具有不同序列特异性或其他基序切割偏好的不同Cas蛋白,在某些实施方案中,包括本文所 述的至少一种Cas13a热稳定蛋白。参见国际公开WO 2019/126577。已知VI型和V型Cas 蛋白具有不同的切割基序偏好。参见Gootenberg等,“Multiplexed and portablenucleic acid detection platform with Cas13b,Cas12a,and Csm6.”Science.2018年4月27日,360:439-444; 国际公开WO 2019/051318。因此,本文公开的实施方案还可以包括包含两种或更多种具有 不同切割偏好的VI型Cas蛋白或者一种或多种VI型Cas蛋白和一种或多种V型cas蛋白 的多路实施方案。
多路方法和Cas效应蛋白选择可以如国际公开WO 2019/126577在[0415]至[0416]和实施 例1至10中所述,该案通过引用并入本文。在某些示例性实施方案中,冠状病毒测定包含 本文公开的VI型Cas蛋白和包含经配置以指导CRISPR-Cas复合物与靶分子结合的向导序 列的向导分子和经标记的检测分子(“基于RNA的掩蔽构建体”)。可以设计多路实施方案以 跟踪冠状病毒的一种或多种变体或冠状病毒的一种或多种变体(包括2019-nCoV)与其他病 毒,例如人呼吸道合胞病毒、中东呼吸综合征(MERS)冠状病毒、严重急性呼吸综合征相关 (SARS)冠状病毒和流感的组合。
在某些实施方案中,可以在侧向流动装置上提供检测测定,如国际公布WO 2019/071051 所述,该案通过引用并入本文。侧向流动装置可能适合于检测一种或多种冠状病毒和/或其 他病毒与冠状病毒的组合。侧向流动装置可以包括柔性基板,诸如纸基板或柔性聚合物类基 板,所述装置可以包括用于检测测定的冻干试剂,并直观读出测定结果。参见WO 2019/071051[0145]-[0151]和实施例2,明确地通过引用并入本文。在某些实施方案中,所述 冠状病毒测定可以与等温扩增试剂一起使用,从而允许在不利于本领域可能无法利用的复杂 仪器的情况下进行扩增,如WO 2019/071051所述。因此,所述测定可能适合于现场诊断, 包括使用侧向流动装置上的直观读数快速灵敏地检测,并且可以针对早期和直接检测进行部 署。
实施例2-新颖CRISPR-CAS系统的鉴定和表征
为了鉴定新颖Cas蛋白,使用了经Cas1/Cas2调理的蛋白质、CRISPR附近的大蛋白质 以及与已知Cas基因共同进化的蛋白质(图4)。进行了迭代多标准HMM搜索(图5)。鉴定了对噬菌体/细菌基因组的间隔子命中(图6)。确定了估计特征共现率(图7)。图8示出了各种CRISPR系统的假设进化。
图9示出了Cas13家族中蛋白质的大小分布。
在示例性Cas13b-t中,大肠杆菌基因座的小RNA测序表明唯一相关小RNA是CRISPRRNA。在必需基因敲低筛检中发现3个示例性Cas13b-t在大肠杆菌中具有活性。该筛检还 允许确定诸多活性直系同源物的原间隔子侧翼基序(PFS),据发现它对于所有活性直系同源物都是弱5'非C偏好。在哺乳动物细胞中,还发现三种活性直系同源物在介导荧光素酶报告基因和内源转录物的敲低方面具有活性。与ADAR融合后,Cas13b-t1和Cas13b-t3能够 介导多个细胞类型中报告基因和内源转录物的A-to-I RNA编辑。此外,与定向进化的CDAR 融合介导了报告转录物的C-to-U RNA编辑。可以介导核酸修饰的小蛋白质可用于通过腺相关病毒(AAV)递送基因治疗剂。目前的计划包括通过AAV递送Cas13b-t1-ADAR融合物以 及靶向小鼠β连环蛋白转录物的向导RNA表达盒,以便在体内环境中证明通过AAV递送 进行的有效Cas13介导型RNA编辑。
从所述分析鉴定了Cas13b-t蛋白。Cas13b-t蛋白是没有辅助蛋白的VI-B1型亚组(图10)。 图11示出了Cas13b-t的6个示例。分析表明,Cas13b-t基因座中的CRISPR阵列被处理, 而且不存在其他ncRNA(图12)。
进行了大肠杆菌必需基因筛检以确定原间隔子侧翼位点(PFS),如图10所示。大肠杆菌 必需基因PFS筛检示出了由Cas13b-t1、Cas13b-t3和Cas13-bt5所致的消耗(图14)。所测试 的活性直系同源物具有5'D PFS偏好(图15)。Cas13b-t5强力消耗了大肠杆菌中含PFS的序 列(图16)。来自PFS筛检的活性直系同源物还介导哺乳动物细胞中的基因敲低(图17)。 Cas13b-t介导了哺乳动物细胞中内源转录物的敲低(图18)。发现Cas13b-t1和Cas13-t3介导 了人类细胞中A-to-I RNA编辑(图19)。
给注射过的C57BL/6雄性小鼠注射含有由EFS启动子和靶向小鼠β连环蛋白基因的向 导RNA或非靶向性向导RNA驱动的Cas13bt1-huADAR2dd(E488Q)融合的单个载体AAV。 图20A示出了表达靶向性向导RNA的载体的图谱,而图20B示出了表达非靶向性向导RNA 的载体。下面的表12示出了载体的序列。
表12
Figure BDA0003651481360005251
Figure BDA0003651481360005261
Figure BDA0003651481360005271
Figure BDA0003651481360005281
Figure BDA0003651481360005291
当与进化的CDAR融合时,Cas13b-t1和Cas13b-t3介导了哺乳动物细胞中报告基因转 录物的C-to-U编辑(图21)。
下面的表13示出了Cas13b-t1、Cas13b-t2、Cas13b-t3、Cas13b-t4、Cas13b-t5和Cas13b-t6的基因座核酸序列和相关序列。
表13
Figure BDA0003651481360005301
Figure BDA0003651481360005311
Figure BDA0003651481360005321
Figure BDA0003651481360005331
Figure BDA0003651481360005341
Figure BDA0003651481360005351
Figure BDA0003651481360005361
Figure BDA0003651481360005371
Figure BDA0003651481360005381
Figure BDA0003651481360005391
Figure BDA0003651481360005401
Figure BDA0003651481360005411
Figure BDA0003651481360005421
Figure BDA0003651481360005431
Figure BDA0003651481360005441
Figure BDA0003651481360005451
Figure BDA0003651481360005461
Figure BDA0003651481360005471
Figure BDA0003651481360005481
Figure BDA0003651481360005491
Figure BDA0003651481360005501
下面的表14示出了本实施例测试的Cas13b-t1、Cas13b-t2、Cas13b-t3、Cas13b-t4、 Cas13b-t5和Cas13b-t6蛋白的氨基酸序列。
表14
Figure BDA0003651481360005502
Figure BDA0003651481360005511
Figure BDA0003651481360005521
实施例3-示例性小CAS13蛋白的鉴定和表征
可以使用CRISPR-Cas13系统进行精确的RNA编辑,当需要瞬时更改或无法进行DNA编辑时,这是一种有吸引力的治疗策略。在本实施例中,诸位申请人鉴定并表征了一个超小Cas13b家族,即Cas13b-t,并证明它介导了哺乳动物转录物敲低。通过用腺苷和胞嘧啶脱氨酶结构域使Cas13b-t功能化,诸位申请人工程改造了REPAIR和RESCUE RNA编辑器的 紧凑变体,这可能更适合体内使用。
RNA靶向性CRISPR-Cas13系统可以用于多种应用(1),包括精确碱基编辑(2,3)。RNA 碱基编辑是一种允许安装瞬时性非遗传性编辑的治疗策略。需要具有更小尺寸的基于Cas-13 的RNA编辑系统,因为它们与诸如广泛用于基因递送的病毒载体腺相关病毒(4,5)等递送系 统的包装容量更兼容。
为了克服这个限制,诸位申请人对小Cas13直系同源物的原核基因组和病毒基因组和宏 基因组进行了计算搜索,鉴定了4726个候选物。系统发育分析揭示了在Cas13b和Cas13c 亚型内形成不同分支的两组新颖超小Cas13蛋白。(图22A)。不同于其他VI-B型CRISPR-Cas 基因座(6),编码Cas13b-t的基因组基因座缺乏任何辅助基因。在本实施例中,诸位申请人 专注于新型微小Cas13b(Cas13b-t)亚家族(图22B)。
为了实验表征Cas13b-t,诸位申请人首先鉴定了CRISPR RNA(crRNA)组分。诸位申请 人用含有Cas13b-t2基因座(图22B至图229C)的质粒转化了大肠杆菌,其中CRISPR阵列被 截短至两个顺向重复序列(DR),并进行了小RNA测序。诸位申请人发现Cas13b-t2的crRNA 具有3'DR(图22D)。为了确定Cas13b-t是否能够介导核酸干扰,诸位申请人使用由间隔子 继之以DR和大肠杆菌靶必需基因转录物6组成的crRNA文库进行了负选择筛检(图24A)。Cas13b-t亚家族的五个测试成员中有三个,即Cas13b-t1、Cas13b-t3和Cas13b-t5,介导了大 肠杆菌中靶向性间隔子的消耗(图22F)。将消耗的间隔子映射到大肠杆菌转录组并分析侧翼 序列揭示了所有三个活性直系同源物都具有允许的5'D(A/G/T)原间隔子侧翼序列(PFS)偏 好(图22F和图24B)。此外,沿靶转录物对消耗的间隔子的标准化位置的评价表明在编码区 内没有位置偏好,并且在靶向5'UTR时增强了消耗(图22F)。
为了评估Cas13b-t介导的敲低和PFS对人类细胞中RNA靶向的重要性,诸位申请人使 用一组20个向导RNA(gRNA)测试了三个活性Cas13b-t,其中间隔子序列靶向长腹水蚤荧光素酶报告基因中具有不同的相邻5'碱基的区域。诸位申请人发现,所有三种蛋白质都促进 HEK293FT细胞敲低,其中就最有效的测试gRNA而言,效率从50%到75%变化(图22G)。Cas13b-t1和Cas13b-t3(dCas13b-t1和dCas13b-t3)中HEPN结构域的突变消除了敲低活性(图 25)。此外,诸位申请人发现在大肠杆菌中检测到的PFS偏好在HEK293FT细胞中没有表现 出来,表明PFS在哺乳动物细胞中几乎没有影响,类似于之前研究的Cas13的影响2(图22G)。 诸位申请人接下来用测试Cas13b-t中活性最小和最大的成员,即Cas13b-t1和Cas13b-t3靶 向了哺乳动物细胞中的内源转录物。对于所有测试gRNA,两种蛋白质都介导了五个靶标转 录物的敲低(与Cas13b-t1和Cas13b-t3的非靶向性gRNA相比,分别敲低了12-68%和27-64%) (图22H)。
为了测试Cas13b-t的RNA编辑能力,诸位申请人使dCas13b-t1和dCas13b-t3与作用于 RNA的人腺苷脱氨酶的高活性突变体2(ADAR2dd(E488Q))融合以产生Cas13b-t1-REPAIR 和Cas13b-t3 REPAIR。诸位申请人通过尝试使海萤荧光素酶报告基因中的色氨酸(W)85恢 复为STOP(X)突变来评估这些融合蛋白质指导HEK293FT细胞中A-to-I RNA编辑的能力。 通过在靶腺苷对面的gRNA间隔子序列中引入胞嘧啶错配(2,7)来实现位点特异性RNA编辑 (图23A)。设计间隔子序列以改变这种错配与DR之间的距离,因为已观测到不同Cas13b-ADAR融合蛋白质和靶位点的可选错配位置的可变性(2,3)。诸位申请人发现,Cas13b-t1-REPAIR和Cas13b-t3-REPAIR都显示出最佳编辑,其中30-bp间隔子序列中错配距离为18-22个碱基对(bp)。对于Cas13b-t1-REPAIR和Cas13b-t3-REPAIR,编辑效率与之前描述的REPAIRv1和REPAIRv2系统2相当,并且分别比RanCas13b-REPAIR的编辑效 率3更有效大约50%和13%(图23B)。
诸位申请人另外使dCas13b-t1和dCas13b-t3与之前描述的能够进行胞嘧啶向尿苷脱氨 基化3的进化ADAR2dd融合(Cas13b-t1-RESCUE和Cas13b-t3-RESCUE),并将两个编辑器 引导至HEK293FT细胞中的报告基因和内源转录物(图26A至图26H)。诸位申请人发现这 些融合蛋白质能够以与RanCas13b-REPAIR/RESCUE相当或更好的水平介导所有测试靶标 的A-to-I或C-to-U编辑(图23C至图23F和图27A至图27L)。
为了证明Cas13b-t-REPAIR编辑功能相关靶标的能力,诸位申请人靶向了之前表征的磷 酸化位点。具体来说,诸位申请人试图通过编辑已知在磷酸化时促进β-连环蛋白降解的位 点(8),即CTNNB1的苏氨酸(T)41密码子来改变Wnt/β-连环蛋白途径的激活。诸位申请人 发现Cas13b-t1-REPAIR能够介导该位点处的40%编辑,将密码子转化为丙氨酸(A)并导致β 连环蛋白活性增加51倍,这可能与促进急性肝衰竭后再生有关(9,10)(图20E)。Cas13b-t1-REPAIR还能够有效地编辑对应于STAT1、STAT3和LATS1转录物中的磷酸化 残基的位点(图23C)。
最后,诸位申请人评估了Cas13b-t1-REPAIR的全转录组特异性,并发现由该系统引起 的脱靶编辑数目与REPAIRv1相当(图30A至图30B),这可能是由于ADAR脱氨酶结构域的混杂活性(2,3)。为了进一步加速REPAIR翻译以用于治疗用途,诸位申请人试图提高Cas13b-t1-REPAIR的特异性(图23G)。通过同时努力直接进化在与dRanCas13b融合的情况下既高度特异又有效的ADAR突变体,诸位申请人鉴定了ADAR2dd中的两个有希望的突 变(E620G和Q696L)(图28A至图28F、图29A至图29J)。诸位申请人将这两个突变并入 Cas13b-t1-REPAIR中,并发现在保持与原始Cas13b-t1-REPAIR相当的中靶活性的同时减少 了脱靶编辑的数目(图23H至图23I)。
Cas13b-t-REPAIR和RESCUE构建体的小尺寸和高功效使它们与病毒递送兼容,从而 解决了部署这种新颖治疗策略的一个重大挑战。
方法
数据管护和搜索管道
从NCBI、WGS和JGI下载了来自宏基因组和基因组的组装原核和噬菌体基因组DNA重叠群,总计3.16万亿bp。注释了所有大于80aa的开放阅读框,产生了100亿个推定蛋 白质以供进一步分析。使用之前开发的Cas13配置文件(11),用HMMER3.212使用最小位 分阈值25来鉴定Cas13家族蛋白。鉴定了一组小(约800aa)但不同的Cas13b并用于以相同 设置开始第二次HMMER搜索,以检索该亚家族的其他成员。总共鉴定了4726个Cas13蛋 白。
系统发育分析
对于系统发育分析和分类,使用MMseqs2对4726个候选基因进行聚类,其中最小序列 同一性为50%,而最小覆盖率为70%(13,14)。各集群内的蛋白质以90%同一性和80%最小 覆盖率聚类,以减少冗余。使用MAFFT15以默认参数比对各冗余减少集群。从分析中去除 被鉴定为截短或部分和/或完全由它们组成的集群的蛋白质。
使用所有列以小于50%空位将比对的冗余减少集群转化为HHsuite配置文件,并对这些 配置文件中的每一个都使用HHsearch以配置文件-配置文件比对来彼此搜索。使用集群之间 的所得成对比特分值sij来构建分类树状图,其中i、j分别表示集群i和j。首先,通过设置 sij=(sij+sji)/2使不对称的比特分值对称。然后,通过设置dij=-(log sij-logmin(sii,sjj))/2来 计算伪距离以生成距离矩阵(16)。使用这些距离构建UGPMA树状图。树状图的树枝和子树 在不修改其拓扑结构的情况下进行压缩,以突出显示已知子类型和每一个子类型内的子组。 来自每一个子树的冗余减少蛋白质的氨基酸(aa)长度用于生成蛋白质大小分布。
细菌表达质粒构建体的设计和克隆
除非另外指明,否则本研究中的所有克隆都使用化学感受态Stbl3大肠杆菌(NEB)进行。 除非另外指明,否则用于克隆的所有PCR都使用2X Phusion Flash High-FidelityMaster Mix (Thermo Fisher)进行。
通过GenScript合成了Cas13b-t2全基因座并克隆到pACYC184的BamHI位点。
为了克隆用于PFS筛检的细菌表达质粒,使用GeneArt GeneOptimizer(ThermoFisher) 对Cas13b-t蛋白编码序列进行人类密码子优化,并由GenScript合成到pcDNA3.1(+)主链 中。通过PCR扩增基因以加入pLac启动子,并通过吉布森组装克隆到用EcoRV(Thermo Fisher)消化过的pBR322主链(NEB)中。
通过IDT合成对应于各目标Cas13b-t的各DR的crRNA表达盒,通过PCR加以扩增,并通过吉布森组装克隆到用EcoRV和BamHI(Thermo Fisher)消化过的pACYC184主链中。 表18列出了所有引物,而表31列出了最终构建体。
哺乳动物表达质粒构建体的设计和克隆
从pC0048(Addgene,质粒编号103854)扩增哺乳动物gRNA表达盒(2),使用引物为各 个目标Cas13b-t直系同源物加入DR,并使用吉布森组装克隆到用LguI和KpnI(ThermoFisher)消化过的pC0048中。
通过利用PCR扩增之前提到的合成Cas13b-t基因并克隆到用单独或添加了对于REPAIR构建体从pC0053且对于RESCUE构建体从pC0078(Addgene,质粒编号130661) 扩增的包括ADAR2dd(E488Q)的片段(3)的HindIII和NotI(Thermo Fisher)消化过的pC0053(Addgene,质粒编号103869)中(2)来克隆哺乳动物蛋白质表达盒。使用定点诱变产生催化失 活的Cas13b-t。表21的最终构建体中列出了所有引物。
通过经由表21中列出的PCR引物引入突变来克隆衍生自定向进化筛检的ADAR2突变 体。
如之前所述17,通过金门组装(Golden Gate assembly)将gRNA间隔子克隆到表达主链 中。表23、表24、表26和表27列出了间隔子序列。
细菌RNA测序
如之前所述(18)进行细菌RNA测序。简而言之,将用含有目标基因座的质粒转化过的 Stbl3大肠杆菌菌落的5mL过夜培养物离心并重悬于1mL TRI试剂(Zymo Research)中。在 5分钟室温孵育之后,加入250uL 0.5mm氧化锆珠粒,并将Trizol再悬液剧烈涡旋30秒至1分钟。加入200uL氯仿,轻轻倒置样品,在室温下孵育3分钟,然后在4℃下以12000xg 离心5分钟。离心后,根据制造商的说明书,将水性级分用作Qiagen miRNeasy试剂盒的输 入。
纯化的RNA用DNA酶I(NEB)处理,使用RNA Clean&Concentrate-25(ZymoResearch) 再次纯化,并用T4多核苷酸激酶(PNK)(NEB)处理。使用RNA Clean&Concentrate-25(Zymo Research)再次纯化PNK处理的RNA,并使用核糖体转录组分离试剂盒(酵母和细菌) (Thermo Fisher Scientific)去除核糖体RNA。随后用RNA 5'多磷酸酶(Epicentre)处理样品,并 使用RNA Clean&Concentrate-5试剂盒(Zymo Research)再次纯化。纯化的RNA用作 NEBNext多路小RNA文库制备试剂盒(Illumina)(NEB)的输入。根据制造商的说明书进行文 库制备,但最终PCR为20个循环。使用KAPA文库定量试剂盒(Illumina)(Roche)在StepOnePlus实时PCR系统(Thermo Fisher Scientific)上通过qPCR对文库进行定量,并在 Illumina NextSeq上进行测序。使用BWA映射读取,并根据要求提供自定义Python脚本。
大肠杆菌必需基因PFS筛检
如之前所述(6)设计文库。使用金门组装将间隔子文库克隆到各个含有氯霉素抗性基因 的Cas13b-t pJ23119-间隔子-DR主链中,其中间隔子文库与预消化主链的比率为5:1,有210 个循环。通过电穿孔将文库转化至Endura电感受态细胞(Lucigen)中,并平铺在五个22.7 cm×22.7cm氯霉素LB琼脂板上。铺板之后12小时,从平板上刮下文库,并使用Macherey-Nagel Nucleobond Xtra Maxiprep试剂盒(Macherey-Nagel)提取DNA。根据制造商的 方案,通过电穿孔将200ng文库质粒和200ng含氨苄青霉素抗性基因的Cas13b-t基因质粒 转化到100uL Endura电感受态细胞(Lucigen)中,并每个生物学重复实验平铺在四个22.7 cmx22.7 cm氨苄青霉素/氯霉素LB琼脂上,其中每个条件进行三次生物学重复实验。转化 后10至12小时,从平板上刮下转化体文库,并使用Macherey-Nagel Nucleobond XtraMaxiprep试剂盒(Macherey-Nagel)提取DNA。使用表22中的引物和NEBNext High-Fidelity2X PCR Master Mix(NEB)由提取的DNA制备文库以用于下一代测序,并在IlluminaNextSeq 上测序。使用自定义Python脚本(可根据要求提供)分析相对于空载体的间隔子丰度。拟合混 合高斯分布与阴性对照间隔子分布,并将均值较高的分布用作零分布。选择消耗的间隔子作 为与所选零分布均值相差超过5倍标准偏差的间隔子。使用 https://weblogo.berkeley.edu/logo.cgi,使用前1%消耗的间隔子生成Weblogos。
哺乳动物细胞培养和转染
哺乳动物细胞培养实验在含高葡萄糖、丙酮酸钠和GlutaMAX(Thermo FisherScientific)、另外补充有1×青霉素-链霉素(Thermo Fisher Scientific)、10mM HEPES(Thermo Fisher Scientific)和10%胎牛血清(VWR Seradigm)的杜尔贝科改良伊格尔培养基中生长的 HEK293FT细胞系(美国典型培养物保藏中心(ATCC))中进行。所有细胞都保持在低于80% 的汇合度下。
所有转染都用脂质转染胺2000(Thermo Fisher Scientific)在96孔板中进行。在转染前16 至20小时以大约20,000个细胞/孔将细胞铺板,以确保在转染时达到90%汇合度。对于平 板上的各个孔,将转染质粒与OptiMEM I还原血清培养基(Thermo FisherScientific)组合至总 共25μl。单独将24.5μl OptiMEM与0.5μl脂质转染胺2000组合。然后将质粒和脂质转染 胺溶液合并,并吸移到细胞上。
哺乳动物RNA敲低测定
如所述用75ng编码来自CMV启动子的Cas13b-t直系同源物或GFP表达的质粒、150ng 编码来自人U6启动子的gRNA表达的质粒以及在有关时45ng报告质粒转染HEK293FT细 胞。48小时之后,如之前所述17用2倍推荐量的DNA酶和20分钟溶解步骤收集RNA。 使用市售TaqMan探针(Thermo Fisher Scientific)(表29)在LightCycler 480II(Roche)上在5uL 多路反应(17)中以GAPDH作为内源内部对照通过qPCR测量RNA表达。通常选择探针和引物组在Cas13靶位点进行扩增,以便最小化对切割转录物的检测。数据是4次生物学重复实验的平均值,其中倍数变化是相对于阴性对照条件计算,其中相应的gRNA表达质粒与GFP表达质粒而非Cas13b-t表达质粒一起使用ddCt方法(19)共转染。误差条在GraphPadPrism 7中计算并代表标准偏差,n=4。
对于荧光素酶报告基因测定,从细胞中吸出培养基,并使用长腹水蚤和海萤荧光素酶测 定试剂盒(Targeting Systems)在Biotek Synergy Neo 2(Agilent)上以注射方案测量培养基中的 海萤和长腹水蚤荧光素酶活性。将各个实验荧光素酶测量值相对于适当的对照荧光素酶测量 值正规化(即,如果靶向海萤荧光素酶,则使用长腹水蚤荧光素酶测量值作为对照值,反之 亦然)。对于敲低测定,正规化荧光素酶值然后相对于阴性对照条件的4次生物学重复实验 的平均正规化荧光素酶测量值再次正规化,所述阴性对照条件由与GFP表达质粒而非Cas13 表达质粒一起共转染的相应gRNA表达质粒组成。误差条在GraphPad Prism 7中计算,并代 表相对于阴性对照转染正规化的荧光素酶值的标准偏差,n=4。
哺乳动物RNA编辑测定
如所述用150ng编码来自CMV启动子的dCas13b直系同源物-ADAR2dd(E488Q)融合物表达的质粒、300ng编码来自人U6启动子的gRNA表达的质粒以及在有关时45ng报告 质粒转染HEK293FT细胞。48小时之后,如之前所述收集RNA并如所述(17)使用相关靶转 录物的基因特异性引物进行逆转录(表32)。使用NEBNext High-Fidelity 2X PCR Master Mix(NEB),使用cDNA作为输入以用于下一代测序文库(表33)的文库制备,并在Illumina MiSeq上对扩增子进行测序。通过使用自定义Python脚本(可根据要求提供)计算扩增子中被称为G (对于A-to-I编辑)或T(对于C-to-U编辑)的预期编辑位置的读取数并除以样品中的总读取数 对编辑进行定量。除非另外指明,否则所有报告数据都是4次生物学重复实验的平均值。
如上所述对RNA编辑进行荧光素酶报告基因分析,修改为正规化的荧光素酶值不再相 对于GFP对照条件正规化。对于CTNNB1靶向,诸位申请人通过用衍生自M50 Super 8XTOPFlash(TOP)或M51 Super 8X FOPFlash(FOP)报告基因的启动子替换双荧光素酶报告质粒中驱动长腹水蚤荧光素酶表达的EF1α启动子来工程改造荧光素酶报告基因。M50 Super8x TOPFlash(Addgene,质粒编号12456)和M51 Super 8x FOPFlash(TOPFlash突变体)(Addgene,质粒编号12457)是来自Randall Moon的礼物3,20。针对各蛋白质/gRNA条件测量这些自定义双荧光素酶报告基因的荧光素酶活性,并且如针对双荧光素酶报告基因所述进 行正规化。通过获取平均TOP测量值比率并除以平均FOP测量值来计算激活倍数,并通过标准误差传播公式计算误差。
通过将间隔子平铺在目标位点上来确定所有测试靶位点的最佳间隔子,错配距DR的距 离以2bp间隔从14bp变到28bp。
RNA编辑特异性
如针对哺乳动物RNA编辑测定所述转染HEK293FT细胞。48小时之后,使用QIAGENRNeasy Plus 96试剂盒,按照制造商的方案收集RNA。使用NEBNext多聚(A)磁隔离模块(NEB)富集mRNA级分。使用NEBNExt Ultra II定向RNA文库制备试剂盒(NEB),根据制 造商的方案制备文库,并在Illumina NextSeq上测序。以800万次读取/样品的平均读取深度 对各样品进行测序,并随机降采样到500万次读取/样品。使用之前所述的FireCloud计算框架上的自定义管道来分析数据,并使用自定义Python脚本2,3进行下游分析。在eGFP转染条件下发现的任何重要编辑都被视为SNP或转染伪影并且被过滤掉。使用Kaviar21方法对已知SNP位置进行再一层过滤以鉴定SNP。
参考文献
1.Terns,M.P.Mol.Cell 72,404-412(2018).
2.Cox,D.B.T.et al.Science 358,1019-1027(2017).
3.Abudayyeh,O.O.et al.Science 365,382-386(2019).
4.Dong,J.Y.,Fan,P.D.&Frizzell,R.A.Hum.Gene Ther.7,2101-2112(1996).
5.Wu,Z.,Yang,H.&Colosi,P.Mol.Ther.18,80-86(2010).
6.Smargon,A.A.et al.Mol.Cell 65,618-630.e7(2017).
7.Matthews,M.M.et al.Nat.Struct.Mol.Biol.23,426-433(2016).
8.MacDonald,B.T.,Tamai,K.&He,X.Developmental Cell vol.17 9-26(2009).
9.Apte,U.et al.Am.J.Pathol.175,1056-1065(2009).
10.Bhushan,B.et al.Am.J.Pathol.184,3013-3025(2014).
11.Shmakov,S.A.,Makarova,K.S.,Wolf,Y.I.,Severinov,K.V.&Koonin,E.V.Proc. Natl.Acad.Sci.U.S.A.115,E5307-E5316(2018).
12.Eddy,S.R.PLoS Comput.Biol.7,e1002195(2011).
13.Steinegger,M.&
Figure BDA0003651481360005581
J.Nat.Biotechnol.35,1026-1028(2017).
14.Steinegger,M.&
Figure BDA0003651481360005582
J.Nat.Commun.9,2542(2018).
15.Katoh,K.&Standley,D.M.Mol.Biol.Evol.30,772-780(2013).
16.Makarova,K.S.et al.Nature Reviews Microbiology vol.18 67-83(2020).
17.Joung,J.et al.Nat.Protoc.12,828-863(2017).
18.Zetsche,B.et al.Cell 163,759-771(2015).
19.Schmittgen,T.D.&Livak,K.J.Nature Protocols vol.3 1101-1108(2008).
20.Veeman,M.T.,Slusarski,D.C.,Kaykas,A.,Louie,S.H.&Moon,R.T.Curr.Biol.13, 680-685(2003).
21.Glusman,G.,Caballero,J.,Mauldin,D.E.,Hood,L.&Roach,J.C.Bioinformatics 27, 3216-3217(2011).
补充方法
酵母表达质粒构建体的设计和克隆
将酵母报告基因构建体克隆至pYES3/CT骨架(Thermo Fisher)中。用HindIII和MluI (Thermo Fisher)消化之前所述的在pADH1终止子(1)下含有crRNA表达盒的报告基因。通过 PCR,使用来自pRSII426主链(2)的选择标记物扩增URA3基因,其中通过定点诱变添加引 入的终止密码子(表24)并通过吉布森组装进行克隆。此主链用BcuI(ThermoFisher)和由 M3499 ura3::ADE2 Disruptor Converter(Addgene,质粒编号51674)(3)扩增的ADE2基因消 化,其中通过定点诱变添加引入的终止密码子(表24)并通过吉布森组装进行克隆。使用金门 组装(4)将gRNA间隔子克隆至此主链中。表31中列出了最终构建体。
酵母REPAIR表达质粒衍生自之前描述的pRSII426主链(2),其中pGAL启动子驱动REPAIR融合蛋白质(2)的表达。通过用Eco105I和KpnI(Thermo Fisher)消化此主链并通过吉 布森组装插入由合成基因(IDT)扩增的LEU2基因将URA3选择标记物替换为LEU2选择标记 物。通过扩增来自前一轮进化的类似序列并通过定点诱变(表24)加入新的突变来插入ADAR2突变体,以便产生可用作易错PCR的基础的序列以供用于每一轮后续进化。表31 中列出了最终构建体。
用于ADAR进化的诱变文库的克隆
使用具有滴定模板浓度的GeneMorph II随机诱变试剂盒(Agilent)通过执行8次易错PCR 反应持续20个周期来产生ADAR2dd突变体库。对于每一轮进化,诸位申请人使用了含有 来自所有之前诸轮的所选突变体的酵母密码子优化ADAR2dd基因。汇集所得PCR反应,加以凝胶纯化,进行DpnI(Thermo Fisher)处理并通过吉布森组装克隆至用KflI和Eco72I(Thermo Fisher)消化的酵母RanCas13b-REPAIR表达主链(表35)中。通过电穿孔将文库转化 至Endura电感受态细胞(Lucigen)中,并平铺在一个22.7cm×22.7cm氨苄青霉素LB琼脂板 上。生长12至16小时之后,从平板上刮下文库,并使用Macherey-Nagel NucleobondXtra Maxiprep试剂盒(Macherey-Nagel)提取DNA。表20列出了引物。
高特异性ADAR突变体的定向进化
诸位申请人进行了如下两轮进化:为了选择高度特异且有效的ADAR变体,诸位申请 人基于同时恢复ADE2中的TGA终止密码子和负选择URA3中TAG终止密码子的恢复对酵母报告基因进行了工程改造。诸位申请人用此质粒转化了酿酒酵母Meyen ex E.C.Hansen(ATCC 204681),其中还包括表达crRNA靶向性ADE2。使用醋酸锂/单链载体DNA/PEG方 法(5)对酵母进行转化。
如之前所述(1,6)对诱变文库进行大规模转化。简而言之,诸位申请人从报告基因质粒 的初始转化挑选一个菌落,接种300mL 2%葡萄糖最低限度培养基-色氨酸(Trp)用于选择, 并且在30℃下在带挡板烧瓶中生长过夜。生长12至16小时之后,诸位申请人测量了培养 物的光密度(OD),并使用此测量值将2.5E9个细胞接种至无挡板烧瓶中的500mL预热2xYPAD培养基中。一旦此培养物达到OD 2(大约4小时),就通过以3000×g离心5分钟来 收集细胞,然后用水洗涤两次。然后将所得细胞团块重悬在36mL由24mL PEG 3350(50% w/v)、3.6mL 1.0M醋酸锂、5mL 2.0mg/mL变性单链载体鲑鱼精子DNA(Thermo Fisher)、 2.9mL水和500μL 1μg/μL质粒文库组成的转化混合物中。将所述混合物在42℃随搅拌孵 育60分钟,然后再次使细胞形成团块并重悬在750mL 2%葡萄糖最低限度培养基-Trp/-亮氨 酸(Leu)中并且在带挡板烧瓶中在30℃生长过夜,直至OD达到在6和8之间。然后将6.25mL 培养物接种至250mL 2%棉子糖-Trp/-Leu选择培养基中并生长,直到OD达到在0.5和1之 间。然后通过加入27mL 30%半乳糖来诱导培养物,并且在30℃下孵育过夜,持续12至15 小时。
过夜生长之后,将培养物平铺在20个22.7×22.7cm选择板上含5mg/L腺嘌呤(Ade)和 0.1%5-氟代乳清酸(5-FOA)的2%棉子糖/3%半乳糖-Trp/-Leu中。进行2至3天选择之后,我 们挑选与ADE2的中靶编辑和恢复相对应的白色菌落,并且将送至有相同培养基基底的小选 择板上的这些菌落划线,以确保准确菌落挑选。然后允许诸板再次生长,持续多达3天。在 这第二次选择之后,再次挑选白色条纹。
为了寻找富集的单个突变,将挑选的所有条纹汇集,并使用NEBNext High-Fidelity 2X PCR Master Mix(NEB)扩增所含有的RanCas13b-REPAIR基因,以用于制备下一代测序文库。 在Illumina NextSeq上对文库进行测序。用于文库扩增的引物见表30。使用自定义Python 脚本(可根据要求提供)分析所选文库中突变的相对富集。通过定点诱变将所鉴定的富集的单 个突变体引入哺乳动物表达载体中的RanCas13b-REPAIR以进行验证(表21)。
为了测试候选突变,如前所述,在HEK293FT细胞中使用荧光素酶报告基因进行RNA编辑测定。具体来说,在第一轮选择之后,使RanCas13b-ADAR2dd突变体靶向2个海萤荧 光素酶报告基因中的任一个,所述两个海萤荧光素酶报告基因一个具有W85X突变(TAG终 止密码子),一个具有W113X突变(TGA终止密码子),以评估进化的ADAR2dd在具有优选 和非优选5'碱基的位点进行有效编辑的能力(7,8)(图25A至图25B)。在第二轮进化之后, 使用相同的海萤荧光素酶W85X报告基因以及第二海萤荧光素酶W85X(TGA终止密码子) 报告基因和长腹水蚤荧光素酶R93H报告基因进行初步筛检,其中CAT密码子恢复为CGT 会恢复催化失活突变(图2A至图26C)。如前所述(9),在非靶向crRNA条件下海萤荧光素酶 W85X TAG报告基因的荧光素酶活性还被用作测量特异性的指标。
基于此初步筛检通过,通过在第一轮选择之后对初步筛检位点再次进行测试以及另外靶 向内源CTNNB1转录物中的K19和H36密码子(图28C至图28F),以及另外对具有G92R、R93K和R93Q催化突变的长腹水蚤荧光素酶报告基因进行测试以及靶向CTNNB1中的T41 密码子(图29D至29J)而进一步验证了顶部候选物的广泛活性。基于如通过下一代测序和荧光素酶测定法测量的所有测试位点的活性,以及如所述测量的特异性,鉴定了单个顶部候选 物并将其克隆至衍生自前一轮进化的RanCas13b-REPAIR酵母表达构建体中,以用作下一轮 诱变的基础。
在第1轮之后,诸位申请人鉴定了E620G突变,而在第2轮之后,我们鉴定了Q696L突变。诸位申请人另外将V505I鉴定为能够增强具有5'G的靶位点处的编辑的突变(图29A至图29J)。
表15含有Cas13b-t直系同源物的重叠群的登记号
JGI:联合基因组研究所
NCBI WGS:美国国家生物技术信息中心(National Center for BiotechnologyInformation) 全基因组鸟枪(Whole Genome Shotgun)
Figure BDA0003651481360005601
Figure BDA0003651481360005611
表16本研究所用的Cas13直系同源物的顺向重复序列
Figure BDA0003651481360005612
表17本研究所用的Cas13直系同源物
Figure BDA0003651481360005621
Figure BDA0003651481360005631
Figure BDA0003651481360005641
表18用于克隆PFS筛检所用质粒的引物
Figure BDA0003651481360005642
Figure BDA0003651481360005651
表19用于克隆哺乳动物表达质粒的引物。通过PCR引入的突变以小写字母表示。
Figure BDA0003651481360005652
Figure BDA0003651481360005661
表20用于克隆本研究所用的酵母构建体的引物
Figure BDA0003651481360005662
Figure BDA0003651481360005671
表21用于将REPAIR第1轮、第2轮筛检突变体克隆到哺乳动物中的引物
表21-A
Figure BDA0003651481360005672
Figure BDA0003651481360005681
Figure BDA0003651481360005691
Figure BDA0003651481360005701
Figure BDA0003651481360005711
表21-B
Figure BDA0003651481360005712
Figure BDA0003651481360005721
Figure BDA0003651481360005731
Figure BDA0003651481360005741
表21-C
Figure BDA0003651481360005742
Figure BDA0003651481360005751
Figure BDA0003651481360005761
Figure BDA0003651481360005771
表21-D
Figure BDA0003651481360005772
Figure BDA0003651481360005781
Figure BDA0003651481360005791
Figure BDA0003651481360005801
Figure BDA0003651481360005811
表22用于PFS筛检的下一代测序文库制备第一轮PCR引物
Figure BDA0003651481360005812
表23|用于在HEK293FT细胞中进行长腹水蚤荧光素酶敲低的gRNA间隔子序列。相对表达是通过与GFP对照物相比对荧光素酶活性的消耗来测量。
Figure BDA0003651481360005821
Figure BDA0003651481360005831
表24用于在HEK293FT细胞中进行内源转录物敲低的gRNA间隔子序列。通过qPCR测量与GFP对照物相比的相对表达。
Figure BDA0003651481360005832
Figure BDA0003651481360005841
表25|用于qPCR的TaqMan探针
基因 TaqMan测定ID
CXCR4 Hs00607978_s1
STAT1 Hs01013996_m1
STAT3 Hs00374280_m1
HRAS Hs00978050_g1
PPIB Hs00168719_m1
GAPDH Hs99999905_m1
表26|用于海萤荧光素酶W85X报告基因RNA编辑的gRNA间隔子序列。错配以小 写字母表示。
Figure BDA0003651481360005842
Figure BDA0003651481360005851
表27|用于对内源转录物进行RNA编辑的最佳gRNA间隔子序列。错配以小写字母表示。
Figure BDA0003651481360005852
表28|基因特异性逆转录引物
Figure BDA0003651481360005853
Figure BDA0003651481360005861
表29|用于对RNA编辑靶位点进行位点特异性扩增的启动序列
Figure BDA0003651481360005862
表30|用于对所选ADAR2dd突变体进行测序的下一代文库制备引物
Figure BDA0003651481360005863
Figure BDA0003651481360005871
Figure BDA0003651481360005881
Figure BDA0003651481360005891
Figure BDA0003651481360005901
表31本研究所用的质粒
Figure BDA0003651481360005902
Figure BDA0003651481360005911
参考文献
1.Abudayyeh,O.O.et al.Science 365,382-386(2019).
2.Chee,M.K.&Haase,S.B.G3 2,515-526(2012).
3.Voth,W.P.,Jiang,Y.W.&Stillman,D.J.Yeast 20,985-993(2003).
4.Joung,J.et al.Nat.Protoc.12,828-863(2017).
5.Gietz,R.D.&Schiestl,R.H.Nat.Protoc.2,31-34(2007).
6.Gietz,R.D.&Schiestl,R.H.Nat.Protoc.2,38-41(2007).
7.Matthews,M.M.et al.Nat.Struct.Mol.Biol.23,426-433(2016).
8.Eggington,J.M.,Greene,T.&Bass,B.L.Nat.Commun.2,319(2011).
9.Cox,D.B.T.et al.Science 358,1019-1027(2017).
实施例4-小Cas13蛋白能够实现紧凑RNA碱基编辑器
诸位申请人鉴定并表征了一个超小Cas13b家族,即Cas13b-t,并证明它介导了哺乳动 物转录物敲低。通过用腺苷和胞嘧啶脱氨酶结构域使Cas13b-t功能化,诸位申请人工程改 造了REPAIR和RESCUE RNA编辑器的紧凑变体,这可能更适合体内使用。这里的系统可以作为一种有吸引力的治疗策略用于精确RNA编辑,例如当需要瞬时更改或无法进行DNA编辑时。
RNA靶向性CRISPR-Cas13系统已经被用于多种应用(1),包括精确碱基编辑(2,3)。RNA 碱基编辑是一种有望允许安装瞬时非遗传性编辑的治疗策略。然而,在一些情况下,基于 Cas13的RNA编辑系统的治疗递送仍然具有挑战性,部分是因为迄今为止鉴定的cas13基因的大小超过了腺相关病毒(AAV)的包装容量,腺相关病毒对于基因递送来说是最广泛使用 的病毒载体(4,5)。
为了克服这个限制,诸位申请人对小Cas13直系同源物的原核基因组和病毒基因组和宏 基因组进行了计算搜索,鉴定了4726个候选物。系统发育分析揭示了在Cas13b和Cas13c 亚型内形成不同分支的两组新颖超小Cas13蛋白。(图31A)。不同于其他VI-B型CRISPR-Cas 基因座6,编码Cas13b-t的基因组基因座缺乏任何辅助基因。在本实施例中,诸位申请人专 注于新型微小Cas13b(Cas13b-t)亚家族(图31B)。
为了实验表征Cas13b-t,诸位申请人首先鉴定了所需的CRISPR RNA(crRNA)组分。诸 位申请人用含有Cas13b-t2基因座(图31B至图31C)的质粒转化了大肠杆菌,其中CRISPR阵列被截短至两个顺向重复序列(DR),并进行了小RNA测序。诸位申请人发现Cas13b-t2 的crRNA具有3'DR(图31D)。为了确定Cas13b-t是否能够介导核酸干扰,诸位申请人使用 由间隔子继之以DR和大肠杆菌靶必需基因转录物组成的crRNA文库(6)进行了负选择筛检 (图33A)。Cas13b-t亚家族的五个测试成员中有三个,即Cas13b-t1、Cas13b-t3和Cas13b-t5,介导了大肠杆菌中靶向性间隔子的消耗(图31F)。将消耗的间隔子映射到大肠杆菌转录组并 分析侧翼序列揭示了所有三个活性直系同源物都具有允许的5'D(A/G/T)原间隔子侧翼序列 (PFS)偏好(图31F和图33B)。此外,沿靶转录物对消耗的间隔子的标准化位置的评价表明在 编码区内没有位置偏好,并且在靶向5'UTR时增强了消耗(图31F)。
为了评估Cas13b-t介导的敲低和PFS对人类细胞中RNA靶向的重要性,诸位申请人使 用一组20个向导RNA(gRNA)测试了三个活性Cas13b-t,其中间隔子序列靶向长腹水蚤荧光素酶报告基因中具有不同的相邻5'碱基的区域。诸位申请人发现,所有三种蛋白质都促进 HEK293FT细胞敲低,其中就最有效的测试gRNA而言,效率从50%到75%变化(图31G)。Cas13b-t1和Cas13b-t3(dCas13b-t1和dCas13b-t3)中HEPN结构域的突变消除了敲低活性(34)。此外,诸位申请人发现在大肠杆菌中检测到的PFS偏好在HEK293FT细胞中没有表现出来,表明PFS在哺乳动物细胞中几乎没有影响,类似于之前研究的Cas13的影响(2)(图31G)。诸位申请人接下来用测试Cas13b-t中活性最小和最大的成员,即Cas13b-t1和Cas13b-t3 靶向了哺乳动物细胞中的内源转录物。对于所有测试gRNA,两种蛋白质都介导了五个靶标 转录物的敲低(与Cas13b-t1和Cas13b-t3的非靶向性gRNA相比,分别敲低了12-68%和 27-64%)(图31H)。
为了测试Cas13b-t的RNA编辑能力,诸位申请人使dCas13b-t1和dCas13b-t3与作用于 RNA的人腺苷脱氨酶的高活性突变体2(ADAR2dd(E488Q))融合以产生Cas13b-t1-REPAIR 和Cas13b-t3 REPAIR。诸位申请人通过尝试使海萤荧光素酶报告基因中的色氨酸(W)85恢 复为STOP(X)突变来评估这些融合蛋白质指导HEK293FT细胞中A-to-I RNA编辑的能力。 通过在靶腺苷对面的gRNA间隔子序列中引入胞嘧啶错配2,7来实现位点特异性RNA编辑 (图32A)。设计间隔子序列以改变这种错配与DR之间的距离,因为已观测到不同Cas13b-ADAR融合蛋白质和靶位点的可选错配位置的可变性(2,3)。诸位申请人发现,Cas13b-t1-REPAIR和Cas13b-t3-REPAIR都显示出最佳编辑,其中30-bp间隔子序列中错配距离为18-22个碱基对(bp)。对于Cas13b-t1-REPAIR和Cas13b-t3-REPAIR,编辑效率与之前描述的REPAIRv1和REPAIRv2系统(2)相当,并且分别比RanCas13b-REPAIR的编辑效 率(3)更有效大约50%和13%(图32B)。
诸位申请人另外使dCas13b-t1和dCas13b-t3与之前描述的能够进行胞嘧啶向尿苷脱氨 基化3的进化ADAR2dd融合(Cas13b-t1-RESCUE和Cas13b-t3-RESCUE),并将两个编辑器 引导至HEK293FT细胞中的报告基因和内源转录物(图35A至图35H)。诸位申请人发现这 些融合蛋白质能够以与RanCas13b-REPAIR/RESCUE相当或更好的水平介导所有测试靶标 的A-to-I或C-to-U编辑(图32C至图32F和图36A至图36L)。
为了证明Cas13b-t-REPAIR编辑功能相关靶标的能力,诸位申请人靶向了之前表征的磷 酸化位点。具体来说,诸位申请人试图通过编辑已知在磷酸化时促进β-连环蛋白降解的位 点(8),即CTNNB1的苏氨酸(T)41密码子来改变Wnt/β-连环蛋白途径的激活。诸位申请人 发现Cas13b-t1-REPAIR能够介导该位点处的40%编辑,将密码子转化为丙氨酸(A)并导致β 连环蛋白活性增加51倍,这可能与促进急性肝衰竭后再生有关(9,10)(图32E)。Cas13b-t1-REPAIR还能够有效地编辑对应于STAT1、STAT3和LATS1转录物中的磷酸化 残基的位点(图32C)。
最后,诸位申请人评估了Cas13b-t1-REPAIR的全转录组特异性,并发现由该系统引起 的脱靶编辑数目与REPAIRv1相当(图39A至图39B),这可能是由于ADAR脱氨酶结构域的混杂活性(2,3)。为了进一步加速REPAIR翻译以用于治疗用途,诸位申请人试图提高Cas13b-t1-REPAIR的特异性(图32G)。尽管已经工程改造了更高特异性ADAR2dd变体,但 它们大大降低了编辑效率(2)。通过同时努力直接进化在与dRanCas13b融合的情况下既高度特异又有效的ADAR突变体,诸位申请人鉴定了ADAR2dd中的两个有希望的突变(E620G 和Q696L)(图37A至图37F、图38A至图38J)。诸位申请人将这两个突变并入 Cas13b-t1-REPAIR中,并发现在保持与原始Cas13b-t1-REPAIR相当的中靶活性的同时减少 了脱靶编辑的数目(图32H至图32I)。
Cas13b-t-REPAIR和RESCUE构建体的小尺寸和高功效使它们与病毒递送兼容,从而 解决了部署这种新颖治疗策略的一个重大挑战。
方法
数据管护和搜索管道
从NCBI、WGS和JGI下载了来自宏基因组和基因组的组装原核和噬菌体基因组DNA重叠群,总计3.16万亿bp。注释了所有大于80aa的开放阅读框,产生了100亿个推定蛋 白质以供进一步分析。使用之前开发的Cas13配置文件11,用HMMER3.212使用最小位分 阈值25来鉴定Cas13家族蛋白。鉴定了一组小(约800aa)但不同的Cas13b并用于以相同设 置开始第二次HMMER搜索,以检索该亚家族的其他成员。总共鉴定了4726个Cas13蛋白。
系统发育分析
对于系统发育分析和分类,使用MMseqs2对4726个候选基因进行聚类,其中最小序列 同一性为50%,而最小覆盖率为70%(13,14)。各集群内的蛋白质以90%同一性和80%最小 覆盖率聚类,以减少冗余。使用MAFFT(15)以默认参数比对各冗余减少集群。从分析中去 除被鉴定为截短或部分和/或完全由它们组成的集群的蛋白质。
使用所有列以小于50%空位将比对的冗余减少集群转化为HHsuite配置文件,并对这些 配置文件中的每一个都使用HHsearch以配置文件-配置文件比对来彼此搜索。使用集群之间 的所得成对比特分值sij来构建分类树状图,其中i、j分别表示集群i和j。首先,通过设置 sij=(sij+sji)/2使不对称的比特分值对称。然后,通过设置dij=-(log sij-logmin(sii,sjj))/2来 计算伪距离以生成距离矩阵(16)。使用这些距离构建UGPMA树状图。树状图的树枝和子树 在不修改其拓扑结构的情况下进行压缩,以突出显示已知子类型和每一个子类型内的子组。 来自每一个子树的冗余减少蛋白质的氨基酸(aa)长度用于生成蛋白质大小分布。
细菌表达质粒构建体的设计和克隆
除非另外指明,否则本研究中的所有克隆都使用化学感受态Stbl3大肠杆菌(NEB)进行。 除非另外指明,否则用于克隆的所有PCR都使用2X Phusion Flash High-FidelityMaster Mix (Thermo Fisher)进行。
通过GenScript合成了Cas13b-t2全基因座并克隆到pACYC184的BamHI位点。
为了克隆用于PFS筛检的细菌表达质粒,使用GeneArt GeneOptimizer(ThermoFisher) 对Cas13b-t蛋白编码序列进行人类密码子优化,并由GenScript合成到pcDNA3.1(+)主链 中。通过PCR扩增基因以加入pLac启动子,并通过吉布森组装克隆到用EcoRV(Thermo Fisher)消化过的pBR322主链(NEB)中。
通过IDT合成对应于各目标Cas13b-t的各DR的crRNA表达盒,通过PCR加以扩增,并通过吉布森组装克隆到用EcoRV和BamHI(Thermo Fisher)消化过的pACYC184主链中。 表35列出了所有引物,而表46列出了最终构建体。
哺乳动物表达质粒构建体的设计和克隆
从pC0048(Addgene,质粒编号103854;n2t.net/addgene:103854; RRID:Addgene_103854)扩增哺乳动物gRNA表达盒2,使用引物为各个目标Cas13b-t直系 同源物加入DR,并使用吉布森组装克隆到用LguI和KpnI(Thermo Fisher)消化过的pC0048 中。
通过利用PCR扩增之前提到的合成Cas13b-t基因并克隆到用单独或添加了对于RESCUE构建体从pC0053且对于RESCUE构建体从pC0078(Addgene,质粒编号130661;http://n2t.net/addgene:130661;RRID:Addgene_130661)扩增的包括ADAR2dd(E488Q)的片段 3的HindIII和NotI(Thermo Fisher)消化过的pC0053(Addgene,质粒编号103869;n2t.net/addgene:103869;RRID:Addgene_103869)中2来克隆哺乳动物蛋白质表达盒。使用定 点诱变产生催化失活的Cas13b-t。表36列出了所有引物,而表46列出了最终构建体。
通过经由PCR引物引入突变,克隆了衍生自定向进化筛检的ADAR2突变体。
如之前所述17,通过金门组装将gRNA间隔子克隆到表达主链中。表40、表41、表 43和表44列出了间隔子序列。
细菌RNA测序
如之前所述(18)进行细菌RNA测序。简而言之,将用含有目标基因座的质粒转化过的 Stbl3大肠杆菌菌落的5mL过夜培养物离心并重悬于1mL TRI试剂(Zymo Research)中。在 5分钟室温孵育之后,加入250uL 0.5mm氧化锆珠粒,并将Trizol再悬液剧烈涡旋30秒至1分钟。加入200uL氯仿,轻轻倒置样品,在室温下孵育3分钟,然后在4℃下以12000xg 离心5分钟。离心后,根据制造商的说明书,将水性级分用作Qiagen miRNeasy试剂盒的输 入。
纯化的RNA用DNA酶I(NEB)处理,使用RNA Clean&Concentrate-25(ZymoResearch) 再次纯化,并用T4多核苷酸激酶(PNK)(NEB)处理。使用RNA Clean&Concentrate-25(Zymo Research)再次纯化PNK处理的RNA,并使用核糖体转录组分离试剂盒(酵母和细菌) (Thermo Fisher Scientific)去除核糖体RNA。随后用RNA 5'多磷酸酶(Epicentre)处理样品,并 使用RNA Clean&Concentrate-5试剂盒(Zymo Research)再次纯化。纯化的RNA用作 NEBNext多路小RNA文库制备试剂盒(Illumina)(NEB)的输入。根据制造商的说明书进行文 库制备,但最终PCR为20个循环。使用KAPA文库定量试剂盒(Illumina)(Roche)在 StepOnePlus实时PCR系统(Thermo Fisher Scientific)上通过qPCR对文库进行定量,并在 Illumina NextSeq上进行测序。使用BWA映射读取,并根据要求提供自定义Python脚本。
大肠杆菌必需基因PFS筛检
如之前所述6设计文库。使用金门组装将间隔子文库克隆到各个含有氯霉素抗性基因的 Cas13b-t pJ23119-间隔子-DR主链中,其中间隔子文库与预消化主链的比率为5:1,有210 个循环。通过电穿孔将文库转化至Endura电感受态细胞(Lucigen)中,并平铺在五个22.7 cm×22.7cm氯霉素LB琼脂板上。铺板之后12小时,从平板上刮下文库,并使用Macherey-Nagel Nucleobond Xtra Maxiprep试剂盒(Macherey-Nagel)提取DNA。根据制造商的 方案,通过电穿孔将200ng文库质粒和200ng含氨苄青霉素抗性基因的Cas13b-t基因质粒 转化到100uL Endura电感受态细胞(Lucigen)中,并每个生物学重复实验平铺在四个22.7 cmx22.7 cm氨苄青霉素/氯霉素LB琼脂上,其中每个条件进行三次生物学重复实验。转化 后10至12小时,从平板上刮下转化体文库,并使用Macherey-Nagel Nucleobond XtraMaxiprep试剂盒(Macherey-Nagel)提取DNA。使用补充表38中的引物和NEBNext High-Fidelity 2X PCR Master Mix(NEB)由提取的DNA制备文库以用于下一代测序,并在Illumina NextSeq上测序。使用自定义Python脚本(可根据要求提供)分析相对于空载体的间 隔子丰度。拟合混合高斯分布与阴性对照间隔子分布,并将均值较高的分布用作零分布。选 择消耗的间隔子作为与所选零分布均值相差超过5倍标准偏差的间隔子。使用weblogo.berkeley.edu/logo.cgi,使用前1%消耗的间隔子生成Weblogos。
哺乳动物细胞培养和转染
哺乳动物细胞培养实验在含高葡萄糖、丙酮酸钠和GlutaMAX(Thermo FisherScientific)、另外补充有1×青霉素-链霉素(Thermo Fisher Scientific)、10mM HEPES(Thermo Fisher Scientific)和10%胎牛血清(VWR Serradigm)的杜尔贝科改良伊格尔培养基中生长的 HEK293FT细胞系(美国典型培养物保藏中心(ATCC))中进行。所有细胞都保持在低于80% 的汇合度下。
所有转染都用脂质转染胺2000(Thermo Fisher Scientific)在96孔板中进行。在转染前16 至20小时以大约20,000个细胞/孔将细胞铺板,以确保在转染时达到90%汇合度。对于平 板上的各个孔,将转染质粒与OptiMEM I还原血清培养基(Thermo FisherScientific)组合至总 共25μl。单独将24.5μl OptiMEM与0.5μl脂质转染胺2000组合。然后将质粒和脂质转染 胺溶液合并,并吸移到细胞上。
哺乳动物RNA敲低测定
如所述用75ng编码来自CMV启动子的Cas13b-t直系同源物或GFP表达的质粒、150ng 编码来自人U6启动子的gRNA表达的质粒以及在有关时45ng报告质粒转染HEK293FT细 胞。48小时之后,如之前所述17用2倍推荐量的DNA酶和20分钟溶解步骤收集RNA。 使用市售TaqMan探针(Thermo Fisher Scientific)在LightCycler 480II(Roche)上在5uL多路反应17中以GAPDH作为内源内部对照通过qPCR测量RNA表达。通常选择探针和引物组 在Cas13靶位点进行扩增,以便最小化对切割转录物的检测。数据是4次生物学重复实验的 平均值,其中倍数变化是相对于阴性对照条件计算,其中相应的gRNA表达质粒与GFP表 达质粒而非Cas13b-t表达质粒一起使用ddCt方法19共转染。误差条在GraphPad Prism 7中 计算并代表标准偏差,n=4。
对于荧光素酶报告基因测定,从细胞中吸出培养基,并使用长腹水蚤和海萤荧光素酶测 定试剂盒(Targeting Systems)在Biotek Synergy Neo 2(Agilent)上以注射方案测量培养基中的 海萤和长腹水蚤荧光素酶活性。将各个实验荧光素酶测量值相对于适当的对照荧光素酶测量 值正规化(即,如果靶向海萤荧光素酶,则使用长腹水蚤荧光素酶测量值作为对照值,反之 亦然)。对于敲低测定,正规化荧光素酶值然后相对于阴性对照条件的4次生物学重复实验 的平均正规化荧光素酶测量值再次正规化,所述阴性对照条件由与GFP表达质粒而非Cas13 表达质粒一起共转染的相应gRNA表达质粒组成。误差条在GraphPad Prism 7中计算,并代 表相对于阴性对照转染正规化的荧光素酶值的标准偏差,n=4。
哺乳动物RNA编辑测定
如所述用150ng编码来自CMV启动子的dCas13b直系同源物-ADAR2dd(E488Q)融合物表达的质粒、300ng编码来自人U6启动子的gRNA表达的质粒以及在有关时45ng报告 质粒转染HEK293FT细胞。48小时之后,如之前所述收集RNA并如所述17使用相关靶转 录物的基因特异性引物进行逆转录(表19)。使用NEBNext High-Fidelity 2X PCR Master Mix(NEB),使用cDNA作为输入以用于下一代测序文库(表20)的文库制备,并在Illumina MiSeq上对扩增子进行测序。通过使用自定义Python脚本(可根据要求提供)计算扩增子中被称为G (对于A-to-I编辑)或T(对于C-to-U编辑)的预期编辑位置的读取数并除以样品中的总读取数 对编辑进行定量。除非另外指明,否则所有报告数据都是4次生物学重复实验的平均值。
如上所述对RNA编辑进行荧光素酶报告基因分析,修改为正规化的荧光素酶值不再相 对于GFP对照条件正规化。对于CTNNB1靶向,诸位申请人通过用衍生自M50 Super 8XTOPFlash(TOP)或M51 Super 8X FOPFlash(FOP)报告基因的启动子替换双荧光素酶报告质粒中驱动长腹水蚤荧光素酶表达的EF1α启动子来工程改造荧光素酶报告基因。M50 Super8x TOPFlash(Addgene,质粒编号12456;n2t.net/addgene:12456;RRID:Addgene_12456)和M51 Super 8x FOPFlash(TOPFlash突变体)(Addgene,质粒编号12457;n2t.net/addgene:12457; RRID:Addgene_12457)是来自Randall Moon的礼物3,20。针对各蛋白质/gRNA条件测量这些 自定义双荧光素酶报告基因的荧光素酶活性,并且如针对双荧光素酶报告基因所述进行正规 化。通过获取平均TOP测量值比率并除以平均FOP测量值来计算激活倍数,并通过标准误 差传播公式计算误差。
通过将间隔子平铺在目标位点上来确定所有测试靶位点的最佳间隔子,错配距DR的距 离以2bp间隔从14bp变到28bp。
RNA编辑特异性
如针对哺乳动物RNA编辑测定所述转染HEK293FT细胞。48小时之后,使用QIAGENRNeasy Plus 96试剂盒,按照制造商的方案收集RNA。使用NEBNext多聚(A)磁隔离模块(NEB)富集mRNA级分。使用NEBNExt Ultra II定向RNA文库制备试剂盒(NEB),根据制 造商的方案制备文库,并在Illumina NextSeq上测序。以800万次读取/样品的平均读取深度 对各样品进行测序,并随机降采样到500万次读取/样品。使用之前所述的FireCloud计算框架上的自定义管道来分析数据,并使用自定义Python脚本2,3进行下游分析。在eGFP转染条件下发现的任何重要编辑都被视为SNP或转染伪影并且被过滤掉。使用Kaviar21方法对已知SNP位置进行再一层过滤以鉴定SNP。
参考文献
1.Terns,M.P.Mol.Cell 72,404-412(2018).
2.Cox,D.B.T.et al.Science 358,1019-1027(2017).
3.Abudayyeh,O.O.et al.Science 365,382-386(2019).
4.Dong,J.Y.,Fan,P.D.&Frizzell,R.A.Hum.Gene Ther.7,2101-2112(1996).
5.Wu,Z.,Yang,H.&Colosi,P.Mol.Ther.18,80-86(2010).
6.Smargon,A.A.et al.Mol.Cell 65,618-630.e7(2017).
7.Matthews,M.M.et al.Nat.Struct.Mol.Biol.23,426-433(2016).
8.MacDonald,B.T.,Tamai,K.&He,X.Developmental Cell vol.17 9-26(2009).
9.Apte,U.et al.Am.J.Pathol.175,1056-1065(2009).
10.Bhushan,B.et al.Am.J.Pathol.184,3013-3025(2014).
11.Shmakov,S.A.,Makarova,K.S.,Wolf,Y.I.,Severinov,K.V.&Koonin,E.V.Proc. Natl.Acad.Sci.U.S.A.115,E5307-E5316(2018).
12.Eddy,S.R.PLoS Comput.Biol.7,e1002195(2011).
13.Steinegger,M.&
Figure BDA0003651481360005981
J.Nat.Biotechnol.35,1026-1028(2017).
14.Steinegger,M.&
Figure BDA0003651481360005982
J.Nat.Commun.9,2542(2018).
15.Katoh,K.&Standley,D.M.Mol.Biol.Evol.30,772-780(2013).
16.Makarova,K.S.et al.Nature Reviews Microbiology vol.18 67-83(2020).
17.Joung,J.et al.Nat.Protoc.12,828-863(2017).
18.Zetsche,B.et al.Cell 163,759-771(2015).
19.Schmittgen,T.D.&Livak,K.J.Nature Protocols vol.3 1101-1108(2008).
20.Veeman,M.T.,Slusarski,D.C.,Kaykas,A.,Louie,S.H.&Moon,R.T.Curr.Biol.13, 680-685(2003).
21.Glusman,G.,Caballero,J.,Mauldin,D.E.,Hood,L.&Roach,J.C.Bioinformatics 27, 3216-3217(2011).
其他方法
Cas13b-t3的蛋白质表达和纯化
野生型和HEPN突变体由转化至化学感受态Rosetta感受态细胞(Novagen/EMDMillipore)中的具有N末端TwinStrep-SUMO标签的基于pET28的载体表达。使经过表达质粒转化的细胞在1L极品肉汤(Terrific Broth)中在37℃生长,直至OD 0.6。将温度转变至18℃,并且用0.2mM IPTG诱导培养物。使培养物生长16至18小时,然后通过在4℃以 5000×g离心来收集细胞。将团块重新悬浮在150mL溶解缓冲液(150mM NaCl、20mM Tris-HCl pH7.5、1mM DTT、5%甘油)中,并且通过在磁板上在4℃下混合30分钟进行均 质化。通过在18,000psi下通过微流化器两次使细胞溶解,并且通过在4℃以9,000RPM离 心30分钟来分离可溶性级分与细胞碎片。使可溶性级分通过Strep-Tactin树脂(Qiagen)。用 8倍柱体积的溶解缓冲液洗涤树脂,并且在补充有5mM脱硫生物素(Sigma)的溶解缓冲液中 从柱洗脱。在4℃下,通过加入SUMO蛋白酶而切割标签过夜。切割之后,使所述蛋白质 通过肝素柱(GEHealthcare)并浓缩至约500uL。然后使浓缩的蛋白质通过在储存缓冲液(500 mM NaCl、20mM Tris-HCl pH 7.5、1mM DTT、5%甘油)中平衡的Superdex 200增加柱(GEHealthcare)。汇集峰级分并浓缩。
荧光旁系RNA切割测定
在含10U鼠RNA酶抑制剂(New England Biolabs)和500nM RNA酶Alert v2检测剂(Thermo Fisher)的切割测定缓冲液(50mM NaCl、20mM Tris-HCl pH 7.5、5mM MgCl2)中,利用等摩尔比的Cas13b-t3野生型或HEPN突变蛋白、crRNA和RNA靶标进行检测,其中 进行了4次技术重复实验。在37℃下在配备有FAM滤光片组的荧光读板器上将样品孵育3 小时。以5分钟间隔进行测量,并且将数据相对于第一个时间点进行正规化。
酵母表达质粒构建体的设计和克隆
将酵母报告基因构建体克隆至pYES3/CT骨架(Thermo Fisher)中。用HindIII和MluI (Thermo Fisher)消化之前所述的在pADH1终止子下含有crRNA表达盒的报告基因1。通过 PCR,使用来自pRSII426主链的选择标记物2扩增URA3基因,其中通过定点诱变添加引入的终止密码子(表37)并通过吉布森组装进行克隆。此主链用BcuI(Thermo Fisher)和由来 自David Stillman的礼物M3499 ura3::ADE2 Disruptor Converter(Addgene,质粒编号 51674;n2t.net/addgene:51674;RRID:Addgene_51674)3扩增的ADE2基因消化,其中通过 定点诱变添加引入的终止密码子(表37)并通过吉布森组装进行克隆。使用金门组装4将gRNA间隔子克隆至此主链中。
酵母REPAIR表达质粒衍生自之前描述的pRSII426主链2,其中pGAL启动子驱动REPAIR融合蛋白质的表达1。通过用Eco105I和KpnI(Thermo Fisher)消化此主链并通过吉布森组装插入由合成基因(IDT)扩增的LEU2基因将URA3选择标记物替换为LEU2选择标 记物。通过扩增来自前一轮进化的类似序列并通过定点诱变(表37)加入新的突变来插入ADAR2突变体,以便产生可用作易错PCR的基础的序列以供用于每一轮后续进化。
用于ADAR进化的诱变文库的克隆
使用具有滴定模板浓度的GeneMorph II随机诱变试剂盒(Agilent)通过执行8次易错PCR 反应持续20个周期来产生ADAR2dd突变体文库。对于每一轮进化,我们使用了含有来自 所有之前诸轮的所选突变体的酵母密码子优化ADAR2dd基因。汇集所得PCR反应,加以凝胶纯化,进行DpnI(Thermo Fisher)处理并通过吉布森组装克隆至用KflI和Eco72I(Thermo Fisher)消化的酵母RanCas13b-REPAIR表达主链(补充表17)中。通过电穿孔将文库转化至 Endura电感受态细胞(Lucigen)中,并平铺在一个22.7cm×22.7cm氨苄青霉素LB琼脂板上。 生长12至16小时之后,从平板上刮下文库,并使用Macherey-Nagel NucleobondXtra Maxiprep试剂盒(Macherey-Nagel)提取DNA。表37列出了引物。
高特异性ADAR突变体的定向进化
诸位申请人进行了如下两轮进化:
为了选择高度特异且有效的ADAR变体,诸位申请人基于同时恢复ADE2中的TGA终止密码子和负选择URA3中TAG终止密码子的恢复对酵母报告基因进行了工程改造。我们 用此质粒转化了酿酒酵母Meyen ex E.C.Hansen(
Figure BDA0003651481360005991
204681TM),其中还包括表达crRNA靶向性ADE2。使用醋酸锂/单链载体DNA/PEG方法5对酵母进行转化。
如之前所述(1,6)对诱变文库进行大规模转化。简而言之,诸位申请人从报告基因质粒 的初始转化挑选一个菌落,接种300mL 2%葡萄糖最低限度培养基-色氨酸(Trp)用于选择, 并且在30℃下在带挡板烧瓶中生长过夜。生长12至16小时之后,诸位申请人测量了培养 物的光密度(OD),并使用此测量值将2.5E9个细胞接种至无挡板烧瓶中的500mL预热2xYPAD培养基中。一旦此培养物达到OD 2(大约4小时),就通过以3000×g离心5分钟来 收集细胞,然后用水洗涤两次。然后将所得细胞团块重悬在36mL由24mL PEG 3350(50% w/v)、3.6mL 1.0M醋酸锂、5mL 2.0mg/mL变性单链载体鲑鱼精子DNA(Thermo Fisher)、 2.9mL水和500μL 1μg/μL质粒文库组成的转化混合物中。将所述混合物在42℃随搅拌孵 育60分钟,然后再次使细胞形成团块并重悬在750mL 2%葡萄糖最低限度培养基-Trp/-亮氨 酸(Leu)中并且在带挡板烧瓶中在30℃生长过夜,直至OD达到在6和8之间。然后将6.25mL 培养物接种至250mL 2%棉子糖-Trp/-Leu选择培养基中并生长,直到OD达到在0.5和1之 间。然后通过加入27mL 30%半乳糖来诱导培养物,并且在30℃下孵育过夜,持续12至15 小时。
过夜生长之后,将培养物平铺在20个22.7×22.7cm选择板上含5mg/L腺嘌呤(Ade)和 0.1%5-氟代乳清酸(5-FOA)的2%棉子糖/3%半乳糖-Trp/-Leu中。进行2至3天选择之后,诸 位申请人挑选与ADE2的中靶编辑和恢复相对应的白色菌落,并且将送至有相同培养基基底 的小选择板上的这些菌落划线,以确保准确菌落挑选。然后允许诸板再次生长,持续多达3 天。在这第二次选择之后,再次挑选白色条纹。
为了寻找富集的单个突变,将挑选的所有条纹汇集,并使用NEBNext High-Fidelity 2X PCR Master Mix(NEB)扩增所含有的RanCas13b-REPAIR基因,以用于制备下一代测序文库。 在Illumina NextSeq上对文库进行测序。使用自定义Python脚本(可根据要求提供)分析所选 文库中突变的相对富集。通过定点诱变将所鉴定的富集的单个突变体引入哺乳动物表达载体 中的RanCas13b-REPAIR以进行验证(表38)。
为了测试候选突变,如前所述,在HEK293FT细胞中使用荧光素酶报告基因进行RNA编辑测定。具体来说,在第一轮选择之后,使RanCas13b-ADAR2dd突变体靶向2个海萤荧 光素酶报告基因中的任一个,所述两个海萤荧光素酶报告基因一个具有W85X突变(TAG终 止密码子),一个具有W113X突变(TGA终止密码子),以评估进化的ADAR2dd在具有优选 和非优选5'碱基的位点进行有效编辑的能力7,8(图37A至图37B)。在第二轮进化之后,使 用相同的海萤荧光素酶W85X报告基因以及第二海萤荧光素酶W85X(TGA终止密码子)报 告基因和长腹水蚤荧光素酶R93H报告基因进行初步筛检,其中CAT密码子恢复为CGT会 恢复催化失活突变(图38A至图38C)。如前所述(9),在非靶向crRNA条件下海萤荧光素酶 W85X TAG报告基因的荧光素酶活性还被用作测量特异性的指标。
基于此初步筛检通过,通过在第一轮选择之后对初步筛检位点再次进行测试以及另外靶 向内源CTNNB1转录物中的K19和H36密码子(图37C至图37F),以及另外对具有G92R、R93K和R93Q催化突变的长腹水蚤荧光素酶报告基因进行测试以及靶向CTNNB1中的T41 密码子(图38D至38J)而进一步验证了顶部候选物的广泛活性。基于如通过下一代测序和荧光素酶测定法测量的所有测试位点的活性,以及如所述测量的特异性,鉴定了单个顶部候选 物并将其克隆至衍生自前一轮进化的RanCas13b-REPAIR酵母表达构建体中,以用作下一轮 诱变的基础。
在第1轮之后,诸位申请人鉴定了E620G突变,而在第2轮之后,诸位申请人鉴定了Q696L突变。我们另外将V505I鉴定为能够增强具有5'G的靶位点处的编辑的突变(图38A 至图38J)。
表32|含有Cas13b-t直系同源物的重叠群的登记号
JGI:联合基因组研究院(Joint Genome Institute)
NCBI WGS:美国国家生物技术信息中心全基因组鸟枪
Figure BDA0003651481360006011
表33|本实施例中使用的Cas13直系同源物的顺向重复序列
Figure BDA0003651481360006012
Figure BDA0003651481360006021
表34|本实施例中使用的Cas13直系同源物
Figure BDA0003651481360006022
Figure BDA0003651481360006031
Figure BDA0003651481360006041
表35|用于克隆PFS筛检所用质粒的引物
Figure BDA0003651481360006042
Figure BDA0003651481360006051
表11|用于克隆哺乳动物表达质粒的引物。通过PCR引入的突变以小写字母表示。
Figure BDA0003651481360006052
Figure BDA0003651481360006061
表37|用于克隆本实施例所用的酵母构建体的引物
Figure BDA0003651481360006062
Figure BDA0003651481360006071
表38|用于PFS筛检的下一代测序文库制备第一轮PCR引物
Figure BDA0003651481360006072
表39|用于在HEK293FT细胞中进行长腹水蚤荧光素酶敲低的gRNA间隔子序列。相对表达是通过与GFP对照物相比对荧光素酶活性的消耗来测量。
Figure BDA0003651481360006081
Figure BDA0003651481360006091
表40|用于在HEK293FT细胞中进行内源转录物敲低的gRNA间隔子序列。通过qPCR测量与GFP对照物相比的相对表达。
Figure BDA0003651481360006092
Figure BDA0003651481360006101
表41|用于qPCR的TaqMan探针
基因 TaqMan测定ID
CXCR4 Hs00607978_s1
STAT1 Hs01013996_m1
STAT3 Hs00374280_m1
HRAS Hs00978050_g1
PPIB Hs00168719_m1
GAPDH Hs99999905_m1
表42|用于海萤荧光素酶W85X报告基因RNA编辑的gRNA间隔子序列。错配以小 写字母表示。
Figure BDA0003651481360006102
Figure BDA0003651481360006111
表43|用于对内源转录物进行RNA编辑的最佳gRNA间隔子序列。错配以小写字母表示。
Figure BDA0003651481360006121
表44|基因特异性逆转录引物
Figure BDA0003651481360006122
表45|用于对RNA编辑靶位点进行位点特异性扩增的启动序列
Figure BDA0003651481360006123
Figure BDA0003651481360006131
表46|本实施例中使用的质粒
Figure BDA0003651481360006132
Figure BDA0003651481360006141
Figure BDA0003651481360006151
Figure BDA0003651481360006161
其他参考文献
1.Abudayyeh,O.O.et al.Science 365,382-386(2019).
2.Chee,M.K.&Haase,S.B.G3 2,515-526(2012).
3.Voth,W.P.,Jiang,Y.W.&Stillman,D.J.Yeast 20,985-993(2003).
4.Joung,J.et al.Nat.Protoc.12,828-863(2017).
5.Gietz,R.D.&Schiestl,R.H.Nat.Protoc.2,31-34(2007).
6.Gietz,R.D.&Schiestl,R.H.Nat.Protoc.2,38-41(2007).
7.Matthews,M.M.et al.Nat.Struct.Mol.Biol.23,426-433(2016).
8.Eggington,J.M.,Greene,T.&Bass,B.L.Nat.Commun.2,319(2011).
9.Cox,D.B.T.et al.Science 358,1019-1027(2017).
图40示出了Cas13b-t具有旁系活性。诸位申请人评估了旁系RNA酶切割报告基因在 存在靶或非靶RNA物质的情况下在活性(WT)和催化失活的(HEPN突变体)Cas13b-t3下和没 有蛋白质阴性对照物时的荧光,并且发现与其他Cas13b一样,Cas13b-t在存在靶RNA物质 的情况下旁系特异性地切割RNA,并且这种旁系活性是由HEPN残基介导的。因此,它可以用于以Cas13旁系活性为基础的应用,诸如基于SHERLOCK的诊断。
图41显示了Cas13b-t-REPAIR通过AAV递送含有包装在一起的REPAIR蛋白和guideRNA的单个AAV载体介导RNA编辑。申请人将示意图中所示的构建体包装在AAV2 中,并将此递送至HEK293FT细胞。2天之后,申请人评估了靶向位点,即CTNNB1转录 物的T41A密码子处的RNA编辑效率,并且发现通过AAV递送的Cas13b-t-REPAIR介导 了RNA碱基编辑。
***
在不背离本发明的范围和精神的情况下,本发明的所述方法、药物组合物和药盒的各种 修改和变化对本领域技术人员来说将显而易见。尽管已经结合具体实施方案描述了本发明, 但应当理解,能够进行进一步修改而且所要求保护的本发明不应当过度受限于此类具体实施 方案。实际上,希望对本领域技术人员来说显而易见的用于实施本发明的所述模式的各种修 改在本发明的范围内。本申请希望涵盖本发明的任何变化、使用或修改,一般来说,遵循本 发明的原理和包括与本公开的此类偏离属于本发明所属领域内的已知惯例,并且可以应用于 本文之前阐述的基本特征。

Claims (87)

1.一种非天然存在或工程改造的组合物,所述组合物包含:
(a)包含至少一个HEPN结构域并且在大小方面小于900个氨基酸的Cas蛋白;和
(b)能够与所述Cas蛋白形成复合物并引导所述复合物与靶序列结合的向导序列。
2.如权利要求1所述的组合物,其中所述Cas蛋白是VI型Cas蛋白。
3.如权利要求1所述的组合物,其中所述Cas蛋白是Cas13。
4.如权利要求1所述的组合物,其中所述Cas蛋白选自
(a)SEQ ID NO.4102-4298;
(b)SEQ ID NO.4299-4654;
(c)SEQ ID NO.2771-2772、4655-4768或5260-5265;
(d)SEQ ID NO.4769-4797;或
(e)SEQ ID NO.4798-5203。
5.一种非天然存在或工程改造的系统,所述系统包含:
(a)选自以下的Cas蛋白:
(i)SEQ ID NO.1-1323,
(ii)SEQ ID NO.1324-2770,
(iii)SEQ ID NO.2773-2797,或
(iv)SEQ ID NO.2798-4092;
(b)能够与所述Cas蛋白形成复合物并引导所述复合物与靶序列结合的向导序列。
6.如前述权利要求中任一项所述的组合物,其中所述Cas蛋白表现出旁系核酸酶活性并切割非靶序列。
7.如前述权利要求中任一项所述的组合物,所述组合物包含两个或更多个能够与两个不同的靶序列或一个靶序列的不同区域杂交的向导序列。
8.如前述权利要求中任一项所述的组合物,其中所述向导序列能够与原核细胞中的一个或多个靶序列杂交。
9.如前述权利要求中任一项所述的组合物,其中所述向导序列能够与真核细胞中的一个或多个靶序列杂交。
10.如前述权利要求中任一项所述的组合物,其中所述Cas蛋白包含一个或多个核定位信号。
11.如前述权利要求中任一项所述的组合物,其中所述Cas蛋白包含一个或多个核输出信号。
12.如前述权利要求中任一项所述的组合物,其中所述Cas蛋白无催化活性。
13.如前述权利要求中任一项所述的组合物,其中所述Cas蛋白是切口酶。
14.如前述权利要求中任一项所述的组合物,其中所述Cas蛋白与一个或多个功能域缔合。
15.如权利要求14所述的组合物,其中所述一个或多个功能域是异源功能域。
16.如权利要求14所述的组合物,其中所述一个或多个功能域切割所述一个或多个靶序列。
17.如权利要求16所述的组合物,其中所述一个或多个功能域修饰所述靶序列的转录或翻译。
18.如前述权利要求中任一项所述的组合物,其中所述Cas蛋白与腺苷脱氨酶或胞嘧啶脱氨酶相关。
19.如前述权利要求中任一项所述的组合物,所述组合物还包含重组模板。
20.如权利要求19所述的组合物,其中所述重组模板是通过同源定向修复(HDR)插入。
21.如前述权利要求中任一项所述的组合物,所述组合物还包含tracr RNA。
22.如前述权利要求中任一项所述的组合物,其中所述Cas蛋白包含两个HEPN结构域。
23.一种非天然存在或工程改造的组合物,所述组合物包含:
(a)编码如前述权利要求中任一项所述的Cas蛋白的mRNA,和
(b)能够与所述Cas蛋白形成复合物并引导所述复合物与靶序列结合的向导序列。
24.一种用于修饰靶核酸中的核苷酸的非天然存在或工程改造的组合物,所述组合物包含:
(a)如权利要求1至22中任一项所述的组合物;和
(b)与所述Cas蛋白缔合的核苷酸脱氨酶。
25.如权利要求24所述的组合物,其中所述Cas蛋白是死Cas蛋白。
26.如权利要求24至25中任一项所述的组合物,其中所述Cas蛋白是切口酶。
27.如权利要求24至26中任一项所述的组合物,其中所述核苷酸脱氨酶与所述Cas蛋白或所述向导序列共价或非共价连接,或者适合于在递送之后与其连接。
28.如权利要求24至27中任一项所述的组合物,其中所述核苷酸脱氨酶是腺苷脱氨酶。
29.如权利要求24至28中任一项所述的组合物,其中所述核苷酸脱氨酶是胞嘧啶脱氨酶。
30.如权利要求24至29中任一项所述的组合物,其中所述核苷酸脱氨酶是人ADAR2或其脱氨酶结构域。
31.如权利要求28所述的组合物,其中所述腺苷脱氨酶包含一个或多个突变。
32.如权利要求31所述的组合物,其中所述一个或多个突变包括基于人ADAR2的氨基酸序列位置的E620G或Q696L,以及同源ADAR蛋白中的相应突变。
33.如权利要求32所述的组合物,其中所述腺苷脱氨酶包含基于人ADAR2的氨基酸序列位置的(i)E488Q和E620G,(ii)E488Q和Q696L,或(iii)E488Q和V505I,或者同源ADAR蛋白中的相应突变。
34.如权利要求31所述的组合物,其中所述腺苷脱氨酶具有胞嘧啶脱氨酶活性。
35.如权利要求24至34中任一项所述的组合物,其中已经修饰所述核苷酸脱氨酶蛋白或其催化结构域以增加对DNA-RNA异源双链体的活性。
36.如权利要求24至35中任一项所述的组合物,其中已经修饰所述核苷酸脱氨酶蛋白或其催化结构域以减少脱靶效应。
37.如权利要求24至36中任一项所述的组合物,其中对所述靶核酸中的所述核苷酸的修饰能医冶由G→A或C→T点突变或致病性SNP引起的疾病。
38.如权利要求37所述的组合物,其中所述疾病包括癌症、血友病、β-地中海贫血、马凡综合征和维-奥二氏综合征。
39.如权利要求24至38中任一项所述的组合物,其中对所述靶核酸中的所述核苷酸的修饰能医冶由T→C或A→G点突变或致病性SNP引起的疾病。
40.如权利要求24至39中任一项所述的组合物,其中对所述目标靶基因座处的所述核苷酸的修饰使所述靶基因座处的靶基因失活。
41.如权利要求24至40中任一项所述的组合物,其中对所述核苷酸的修饰修饰了所述靶基因座处编码的基因产物或所述基因产物的表达。
42.一种工程改造的腺苷脱氨酶,其包含一个或多个突变:基于人ADAR2的氨基酸序列位置的E488Q、E620G、Q696L或V505I,或同源ADAR蛋白中的相应突变。
43.如权利要求42所述的工程改造的腺苷脱氨酶,其中所述腺苷脱氨酶包含基于人ADAR2的氨基酸序列位置的(i)E488Q和E620G,(ii)E488Q和Q696L,或(iii)E488Q和V505I,或者同源ADAR蛋白中的相应突变。
44.一种用于在一个或多个体外样品中检测一个或多个靶多肽的存在的系统,所述系统包含:
如权利要求1至41中任一项所述的Cas蛋白;
一个或多个检测适体,各自经设计而与所述一个或多个靶多肽之一结合,各个检测适体包含掩蔽的启动子结合位点或掩蔽的引物结合位点和触发序列模板;以及
包含非靶序列的基于寡核苷酸的掩蔽构建体。
45.如权利要求44所述的系统,所述系统还包含用于扩增所述靶序列或所述触发序列的核酸扩增试剂。
46.如权利要求45所述的系统,其中所述核酸扩增试剂是等温扩增试剂。
47.一种用于在一个或多个体外样品中检测一个或多个靶序列的存在的系统,所述系统包含:
如权利要求1至41中任一项所述的Cas蛋白;
至少一个向导多核苷酸,其包含经设计而与所述一个或多个靶序列具有一定程度的互补性并且经设计而与所述Cas蛋白形成复合物的向导序列;以及
包含非靶序列的基于寡核苷酸的掩蔽构建体,
其中所述Cas蛋白表现出旁系核酸酶活性,并且一旦被所述一个或多个靶序列激活就切割所述基于寡核苷酸的掩蔽构建体的所述非靶序列。
48.一种非天然存在或工程改造的组合物,所述组合物包含如权利要求1至41中任一项所述的Cas蛋白,所述Cas蛋白与酶或报告部分的无活性第一部分连接,其中所述酶或报告部分在与所述酶或报告部分的互补部分接触时得以复原。
49.如权利要求48所述的组合物,其中所述酶或报告部分包括蛋白水解酶。
50.如权利要求48所述的组合物,其中所述Cas蛋白包括与所述酶或报告部分的所述互补部分连接的第一Cas蛋白和第二Cas蛋白。
51.如权利要求48所述的组合物,所述组合物还包含
i)能够与所述第一Cas蛋白形成复合物并与靶核酸的第一靶序列杂交的第一向导;和
ii)能够与所述第二Cas蛋白形成复合物并与所述靶核酸的第二靶序列杂交的第二向导。
52.一种非天然存在或工程改造的组合物,所述组合物包含一个或多个编码如权利要求1至41中任一项所述的Cas蛋白和向导序列的多核苷酸。
53.一种载体系统,所述载体系统包含一个或多个载体,所述一个或多个载体包含:
与编码如权利要求1至41中任一项所述的Cas蛋白的核苷酸序列可操作地连接的第一调控元件,和
与编码所述向导序列的核苷酸序列可操作地连接的第二调控元件。
54.如权利要求53所述的载体系统,其中编码所述Cas蛋白的所述核苷酸序列经密码子优化以便在真核细胞中表达。
55.如权利要求53所述的载体系统,所述载体系统包含在单个载体中。
56.如权利要求53所述的载体系统,其中所述一个或多个载体包括病毒载体。
57.如权利要求53所述的载体系统,其中所述一个或多个载体包括一个或多个逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。
58.一种递送系统,所述递送系统包含如权利要求1至52中任一项所述的组合物,或如权利要求53至57中任一项所述的系统以及递送载体。
59.如权利要求58所述的递送系统,所述递送系统包含一个或多个载体或者一个或多个多核苷酸分子,所述一个或多个载体或多核苷酸分子包含编码所述Cas蛋白的一个或多个多核苷酸分子和所述非天然存在或工程改造的组合物的一种或多种核酸组分。
60.如权利要求58所述的递送系统,其中所述递送载体包含核糖核蛋白复合物、一个或多个颗粒、一个或多个囊泡、或者一个或多个病毒载体、脂质体、纳米颗粒、外来体、微囊泡、核酸纳米组装体、基因枪、可植入装置或载体系统。
61.如权利要求58所述的递送系统,其中所述一个或多个颗粒包含脂质、糖、金属或蛋白质。
62.如权利要求58所述的递送系统,其中所述一个或多个颗粒包括脂质纳米颗粒。
63.如权利要求58所述的递送系统,其中所述一个或多个囊泡包含外来体或脂质体。
64.如权利要求58所述的递送系统,其中所述一个或多个病毒载体包括一个或多个腺病毒载体、一个或多个慢病毒载体、或者一个或多个腺相关病毒载体。
65.一种细胞,所述细胞包含如权利要求1至52中任一项所述的组合物,或如权利要求53至64中任一项所述的系统。
66.如权利要求65所述的细胞,所述细胞或其后代是真核细胞,优选地为人或非人动物细胞,任选地为治疗T细胞或产抗体B细胞,或其中所述细胞是植物细胞。
67.一种非人动物或植物,所述非人动物或植物包含如权利要求65或66所述的细胞或其后代。
68.如权利要求1至52中任一项所述的组合物,或如权利要求53至64中任一项所述的系统,或如权利要求65或66所述的细胞,用于治疗性治疗方法中。
69.一种修饰一个或多个靶序列的方法,所述方法包括使所述一个或多个靶序列与如权利要求1至52中任一项所述的组合物接触。
70.如权利要求69所述的方法,其中修饰所述一个或多个靶序列包括增加或降低所述一个或多个靶序列的表达。
71.如权利要求69所述的方法,其中所述系统还包括重组模板,并且其中修饰所述一个或多个靶序列包括插入所述重组模板或其部分。
72.如权利要求69所述的方法,其中所述一个或多个靶序列在原核细胞中。
73.如权利要求69所述的方法,其中所述一个或多个靶序列在真核细胞中。
74.一种修饰靶序列中的一个或多个核苷酸的方法,所述方法包括使所述靶序列与如权利要求1至52中任一项所述的组合物接触。
75.如权利要求69至74中任一项所述的方法,其中所述靶序列是RNA。
76.一种在样品中检测靶核酸的方法,所述方法包括:
使样品与以下接触:
如权利要求1至52中任一项所述的组合物;和
包含非靶序列的基于RNA的掩蔽构建体;
其中所述Cas蛋白表现出旁系RNA酶活性并切割所述检测构建体的所述非靶序列;以及
检测来自切割所述非靶序列的信号,从而检测所述样品中的所述靶核酸。
77.如权利要求76所述的方法,所述方法还包括使所述样品与用于扩增所述靶核酸的试剂接触。
78.如权利要求76所述的方法,其中所述用于增强的试剂包括等温扩增反应试剂。
79.如权利要求76所述的方法,其中所述等温扩增试剂包括基于核酸序列的扩增、重组酶聚合酶扩增、环介导型等温扩增、链置换扩增、解旋酶依赖性扩增或切口酶扩增试剂。
80.如权利要求76所述的方法,其中所述靶核酸是DNA分子,并且所述方法还包括使所述靶DNA分子与包含RNA聚合酶位点的引物和RNA聚合酶接触。
81.如权利要求76所述的方法,其中所述掩蔽构建体:
抑制可检测正信号的产生,直到所述掩蔽构建体被切割或失活,或者
掩蔽可检测正信号或产生可检测负信号,直到所述掩蔽构建体被切割或失活。
82.如权利要求76所述的方法,其中所述掩蔽构建体包含:
a.抑制由报告构建体编码的基因产物的产生的沉默RNA,其中所述基因产物在表达时产生可检测正信号;
b.产生可检测负信号的核糖酶,并且其中当所述核糖酶失活时产生了可检测正信号;
c.将底物转化为第一颜色的核糖酶,并且其中当所述核糖酶失活时,所述底物转化为第二颜色;
d.适体和/或包含多核苷酸栓系型抑制剂;
e.可检测配体和掩蔽组分连接的多核苷酸;
f.通过桥分子保持呈聚集体形式的纳米颗粒,其中所述桥分子的至少一部分包含多核苷酸,并且其中当所述纳米颗粒分散在溶液中时所述溶液发生了颜色变化;
g.通过连接分子与一个或多个淬灭剂分子连接的量子点或荧光团,其中所述连接分子的至少一部分包含多核苷酸;
h.与嵌入剂复合的多核苷酸,其中所述嵌入剂在切割所述多核苷酸后改变了吸光度;或
l.通过多核苷酸拴系的两个荧光团,当从所述多核苷酸释放时会发生荧光变化。
83.如权利要求82所述的方法,其中所述适体:
a.包含能隔绝酶的多核苷酸拴系型抑制剂,其中所述酶在从所述适体或多核苷酸拴系型抑制剂释放时通过作用于底物而产生可检测信号;
b.是能抑制酶并防止所述酶催化由底物产生可检测信号的抑制性适体,或其中所述多核苷酸拴系型抑制剂抑制了酶并防止所述酶催化由底物产生可检测信号;或
c.隔绝了一对剂,所述剂在从所述适体释放时组合以产生可检测信号。
84.如权利要求82所述的方法,其中所述纳米颗粒是胶态金属。
85.如权利要求76所述的方法,其中所述至少一个向导多核苷酸包含错配。
86.如权利要求85所述的方法,其中所述错配在所述一个或多个向导序列上的单核苷酸变异的上游或下游。
87.一种在受试者中治疗或预防疾病的方法,所述方法包括向所述受试者施用如权利要求1至52中任一项所述的组合物,或如权利要求53至64中任一项所述的系统,或如权利要求65或66所述的细胞。
CN202080080680.6A 2019-09-20 2020-09-18 新颖vi型crispr酶和系统 Pending CN115175996A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201962903604P 2019-09-20 2019-09-20
US62/903,604 2019-09-20
US201962905645P 2019-09-25 2019-09-25
US62/905,645 2019-09-25
US202062967408P 2020-01-29 2020-01-29
US62/967,408 2020-01-29
US202063044190P 2020-06-25 2020-06-25
US63/044,190 2020-06-25
PCT/US2020/051660 WO2021055874A1 (en) 2019-09-20 2020-09-18 Novel type vi crispr enzymes and systems

Publications (1)

Publication Number Publication Date
CN115175996A true CN115175996A (zh) 2022-10-11

Family

ID=72752508

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080080680.6A Pending CN115175996A (zh) 2019-09-20 2020-09-18 新颖vi型crispr酶和系统

Country Status (7)

Country Link
US (1) US20230025039A1 (zh)
EP (1) EP4031660A1 (zh)
CN (1) CN115175996A (zh)
AU (1) AU2020348879A1 (zh)
CA (1) CA3151563A1 (zh)
IL (1) IL291478A (zh)
WO (1) WO2021055874A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116676407A (zh) * 2023-06-25 2023-09-01 新乡医学院 一种阴道毛滴虫的检测试剂及其试剂盒和检测方法
CN117720672A (zh) * 2024-02-07 2024-03-19 深锐(天津)生物医学有限公司 先导编辑系统及其应用
WO2024120488A1 (zh) * 2022-12-08 2024-06-13 广州瑞风生物科技有限公司 Cas蛋白截短体、构建其的方法及其应用

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4442836A2 (en) 2018-08-01 2024-10-09 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
CN115315519A (zh) * 2020-02-28 2022-11-08 辉大(上海)生物科技有限公司 VI-E型和VI-F型CRISPR-Cas系统及其用途
EP4291643A1 (en) * 2021-02-09 2023-12-20 Mammoth Biosciences, Inc. Programmable nucleases and methods of use
WO2022188797A1 (en) * 2021-03-09 2022-09-15 Huigene Therapeutics Co., Ltd. Engineered crispr/cas13 system and uses thereof
JP2024520528A (ja) 2021-06-01 2024-05-24 アーバー バイオテクノロジーズ, インコーポレイテッド Crisprヌクレアーゼを含む遺伝子編集システム及びそれらの使用
EP4373963A2 (en) 2021-07-21 2024-05-29 Montana State University Nucleic acid detection using type iii crispr complex
WO2023059606A1 (en) * 2021-10-06 2023-04-13 Cancervax, Inc. Methods and compositions for cancer treatment
AU2022395939A1 (en) * 2021-11-25 2024-05-02 Casbio (S) Pte Ltd Novel crispr/cas13 systems and uses thereof
CN114350854B (zh) * 2022-01-10 2023-08-01 中国人民解放军军事科学院军事医学研究院 一种基于RAA-CRISPR检测SARS-CoV-2 69-70del位点的方法
WO2023201203A2 (en) * 2022-04-11 2023-10-19 The Regents Of The University Of California Crispr-cas effector polypeptides and methods of use thereof
GB202214015D0 (en) * 2022-09-26 2022-11-09 Univ Oxford Innovation Ltd RNA editing vector
WO2024124237A2 (en) * 2022-12-09 2024-06-13 Amber Bio Inc. Gene-modifying endonucleases
WO2024173645A1 (en) 2023-02-15 2024-08-22 Arbor Biotechnologies, Inc. Gene editing method for inhibiting aberrant splicing in stathmin 2 (stmn2) transcript
CN116376874A (zh) * 2023-03-24 2023-07-04 尧唐(上海)生物科技有限公司 一种Cas蛋白、其基因编辑系统及应用
CN117965634B (zh) * 2024-04-01 2024-07-12 北京唯源立康生物科技股份有限公司 一种hsv-1病毒载体及其应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018170333A1 (en) * 2017-03-15 2018-09-20 The Broad Institute, Inc. Novel cas13b orthologues crispr enzymes and systems
WO2019051318A1 (en) * 2017-09-09 2019-03-14 The Broad Institute, Inc. DIAGNOSTIC SYSTEMS BASED ON MULTI-EFFECT CRISPRASE
WO2019071048A1 (en) * 2017-10-04 2019-04-11 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION
CN109642231A (zh) * 2016-06-17 2019-04-16 博德研究所 Vi型crispr直向同源物和系统
WO2019126577A2 (en) * 2017-12-22 2019-06-27 The Broad Institute, Inc. Crispr effector system based multiplex diagnostics

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US61836A (en) 1867-02-05 Thomas jose
US4751180A (en) 1985-03-28 1988-06-14 Chiron Corporation Expression using fused genes providing for protein product
US4935233A (en) 1985-12-02 1990-06-19 G. D. Searle And Company Covalently linked polypeptide cell modulators
US20040058886A1 (en) 2002-08-08 2004-03-25 Dharmacon, Inc. Short interfering RNAs having a hairpin structure containing a non-nucleotide loop
WO2008149176A1 (en) 2007-06-06 2008-12-11 Cellectis Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof
EP2454371B1 (en) 2009-07-13 2021-01-20 Somagenics, Inc. Chemical modification of small hairpin rnas for inhibition of gene expression
US8771985B2 (en) 2010-04-26 2014-07-08 Sangamo Biosciences, Inc. Genome editing of a Rosa locus using zinc-finger nucleases
JP2015527889A (ja) 2012-07-25 2015-09-24 ザ ブロード インスティテュート, インコーポレイテッド 誘導可能なdna結合タンパク質およびゲノム撹乱ツール、ならびにそれらの適用
SG11201504523UA (en) 2012-12-12 2015-07-30 Broad Inst Inc Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
EP3031921A1 (en) 2012-12-12 2016-06-15 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
WO2014093655A2 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
KR20150105633A (ko) 2012-12-12 2015-09-17 더 브로드 인스티튜트, 인코퍼레이티드 서열 조작을 위한 시스템, 방법 및 최적화된 가이드 조성물의 조작
DK3064585T3 (da) 2012-12-12 2020-04-27 Broad Inst Inc Konstruering og optimering af forbedrede systemer, fremgangsmåder og enzymsammensætninger til sekvensmanipulation
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP4286402A3 (en) 2012-12-12 2024-02-14 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
WO2014093709A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
CN105121641A (zh) 2012-12-17 2015-12-02 哈佛大学校长及研究员协会 Rna-引导的人类基因组工程化
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
US20140356956A1 (en) 2013-06-04 2014-12-04 President And Fellows Of Harvard College RNA-Guided Transcriptional Regulation
CN106062197A (zh) 2013-06-17 2016-10-26 布罗德研究所有限公司 用于序列操纵的串联指导系统、方法和组合物的递送、工程化和优化
CA2915845A1 (en) 2013-06-17 2014-12-24 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
WO2014204723A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions
KR20160056869A (ko) 2013-06-17 2016-05-20 더 브로드 인스티튜트, 인코퍼레이티드 바이러스 구성성분을 사용하여 장애 및 질환을 표적화하기 위한 crispr-cas 시스템 및 조성물의 전달, 용도 및 치료 적용
WO2014204727A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
EP4245853A3 (en) 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
CA2915842C (en) 2013-06-17 2022-11-29 The Broad Institute, Inc. Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy
US10563225B2 (en) 2013-07-26 2020-02-18 President And Fellows Of Harvard College Genome engineering
EP3294880A4 (en) 2015-05-15 2018-12-26 Dharmacon, Inc. Synthetic single guide rna for cas9-mediated gene editing
WO2016205749A1 (en) * 2015-06-18 2016-12-22 The Broad Institute Inc. Novel crispr enzymes and systems

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109642231A (zh) * 2016-06-17 2019-04-16 博德研究所 Vi型crispr直向同源物和系统
WO2018170333A1 (en) * 2017-03-15 2018-09-20 The Broad Institute, Inc. Novel cas13b orthologues crispr enzymes and systems
WO2019051318A1 (en) * 2017-09-09 2019-03-14 The Broad Institute, Inc. DIAGNOSTIC SYSTEMS BASED ON MULTI-EFFECT CRISPRASE
WO2019071048A1 (en) * 2017-10-04 2019-04-11 The Broad Institute, Inc. SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION
WO2019126577A2 (en) * 2017-12-22 2019-06-27 The Broad Institute, Inc. Crispr effector system based multiplex diagnostics

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
IAN M. SLAYMAKER等: "High-resolution structure of Cas13b and biochemical characterization of RNA targeting and cleavage", 《CELL REPORTS》, vol. 26, no. 13, pages 3741 - 3751, XP055754078, DOI: 10.1016/j.celrep.2019.02.094 *
张启超等: "新型CRISPR/Cas基因编辑系统的研究与应用进展", 《蚕业科学》, pages 128 - 134 *
彭利君等: "核酸检测和基因编辑的新工具:CRISPR/Cas13系统", 《临床检验杂志》, pages 65 - 67 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024120488A1 (zh) * 2022-12-08 2024-06-13 广州瑞风生物科技有限公司 Cas蛋白截短体、构建其的方法及其应用
CN116676407A (zh) * 2023-06-25 2023-09-01 新乡医学院 一种阴道毛滴虫的检测试剂及其试剂盒和检测方法
CN117720672A (zh) * 2024-02-07 2024-03-19 深锐(天津)生物医学有限公司 先导编辑系统及其应用
CN117720672B (zh) * 2024-02-07 2024-04-30 深锐(天津)生物医学有限公司 先导编辑系统及其应用

Also Published As

Publication number Publication date
IL291478A (en) 2022-05-01
US20230025039A1 (en) 2023-01-26
WO2021055874A1 (en) 2021-03-25
CA3151563A1 (en) 2021-03-25
AU2020348879A1 (en) 2022-04-14
EP4031660A1 (en) 2022-07-27

Similar Documents

Publication Publication Date Title
CN115175996A (zh) 新颖vi型crispr酶和系统
WO2022159892A1 (en) Reprogrammable tnpb polypeptides and use thereof
AU2021364399A1 (en) Reprogrammable iscb nucleases and uses thereof
EP4291202A1 (en) Nuclease-guided non-ltr retrotransposons and uses thereof
EP4061941A1 (en) Retrotransposons and use thereof
WO2021097118A1 (en) Small type ii cas proteins and methods of use thereof
EP4034659A2 (en) Programmable polynucleotide editors for enhanced homologous recombination
WO2022147321A1 (en) Type i-b crispr-associated transposase systems
WO2020236967A1 (en) Random crispr-cas deletion mutant
EP4051789A1 (en) Type i-b crispr-associated transposase systems
WO2021041922A1 (en) Crispr-associated mu transposase systems
EP4274603A1 (en) Dna nuclease guided transposase compositions and methods of use thereof
WO2023170535A2 (en) Novel nucleic acid-guided nucleases and use thereof
EP4437094A1 (en) Reprogrammable iscb nucleases and uses thereof
CN116583599A (zh) 可重编程IscB核酸酶及其用途
EP4204562A1 (en) Type i crispr-associated transposase systems
CN117616126A (zh) 可重新编程的tnpb多肽及其用途
EP4436592A1 (en) Reprogrammable isrb nucleases and uses thereof
EP4204559A1 (en) Nucleic acid-guided nucleases and use thereof
WO2023230483A2 (en) Engineered chimeric iscb polypeptides and uses thereof
WO2024197008A2 (en) Nuclease-guided non-ltr retrotransposons and uses thereof
WO2024015920A1 (en) Hybrid crispr-cas systems and methods of use thereof
EP4448744A2 (en) Reprogrammable fanzor polynucleotides and uses thereof
WO2024081728A2 (en) Reprogrammable tnpb polypeptides with maze domains and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination